CN113286619A - 用于调节适应性免疫的组合物和方法 - Google Patents
用于调节适应性免疫的组合物和方法 Download PDFInfo
- Publication number
- CN113286619A CN113286619A CN201980051039.7A CN201980051039A CN113286619A CN 113286619 A CN113286619 A CN 113286619A CN 201980051039 A CN201980051039 A CN 201980051039A CN 113286619 A CN113286619 A CN 113286619A
- Authority
- CN
- China
- Prior art keywords
- sequence
- rna
- present disclosure
- protein
- grna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000203 mixture Substances 0.000 title claims abstract description 529
- 238000000034 method Methods 0.000 title abstract description 110
- 230000004721 adaptive immunity Effects 0.000 title description 2
- 230000033289 adaptive immune response Effects 0.000 claims abstract description 103
- 230000000694 effects Effects 0.000 claims abstract description 71
- 230000014509 gene expression Effects 0.000 claims abstract description 64
- 108020005004 Guide RNA Proteins 0.000 claims description 795
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 310
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 302
- 229920001184 polypeptide Polymers 0.000 claims description 297
- 108090000623 proteins and genes Proteins 0.000 claims description 280
- 102000004169 proteins and genes Human genes 0.000 claims description 260
- 235000018102 proteins Nutrition 0.000 claims description 259
- 125000006850 spacer group Chemical group 0.000 claims description 145
- 210000004027 cell Anatomy 0.000 claims description 130
- 239000013598 vector Substances 0.000 claims description 118
- 230000004570 RNA-binding Effects 0.000 claims description 109
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 82
- 108091033409 CRISPR Proteins 0.000 claims description 78
- 125000003729 nucleotide group Chemical group 0.000 claims description 74
- 239000002773 nucleotide Substances 0.000 claims description 73
- 108020001507 fusion proteins Proteins 0.000 claims description 70
- 102000037865 fusion proteins Human genes 0.000 claims description 70
- 150000007523 nucleic acids Chemical group 0.000 claims description 59
- 108020004414 DNA Proteins 0.000 claims description 51
- 101710093458 ICOS ligand Proteins 0.000 claims description 24
- 102100034980 ICOS ligand Human genes 0.000 claims description 24
- 230000004069 differentiation Effects 0.000 claims description 24
- 235000004252 protein component Nutrition 0.000 claims description 20
- 102000013462 Interleukin-12 Human genes 0.000 claims description 19
- 108010065805 Interleukin-12 Proteins 0.000 claims description 19
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 19
- 230000000295 complement effect Effects 0.000 claims description 18
- 102100028972 HLA class I histocompatibility antigen, A alpha chain Human genes 0.000 claims description 16
- 102100028976 HLA class I histocompatibility antigen, B alpha chain Human genes 0.000 claims description 16
- 102100028971 HLA class I histocompatibility antigen, C alpha chain Human genes 0.000 claims description 16
- 101000986086 Homo sapiens HLA class I histocompatibility antigen, A alpha chain Proteins 0.000 claims description 16
- 101000986087 Homo sapiens HLA class I histocompatibility antigen, B alpha chain Proteins 0.000 claims description 16
- 101000986084 Homo sapiens HLA class I histocompatibility antigen, C alpha chain Proteins 0.000 claims description 16
- 101000914484 Homo sapiens T-lymphocyte activation antigen CD80 Proteins 0.000 claims description 15
- 102100027222 T-lymphocyte activation antigen CD80 Human genes 0.000 claims description 15
- 230000001939 inductive effect Effects 0.000 claims description 15
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 claims description 14
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 claims description 14
- -1 CD86 Proteins 0.000 claims description 13
- 102100037696 Endonuclease V Human genes 0.000 claims description 13
- 102100022987 Angiogenin Human genes 0.000 claims description 12
- 238000010453 CRISPR/Cas method Methods 0.000 claims description 12
- 241000702421 Dependoparvovirus Species 0.000 claims description 12
- 102000004473 OX40 Ligand Human genes 0.000 claims description 12
- 108010042215 OX40 Ligand Proteins 0.000 claims description 12
- 108091008874 T cell receptors Proteins 0.000 claims description 11
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 claims description 11
- 102000015736 beta 2-Microglobulin Human genes 0.000 claims description 11
- 108010081355 beta 2-Microglobulin Proteins 0.000 claims description 11
- 101000880860 Homo sapiens Endonuclease V Proteins 0.000 claims description 10
- 230000000139 costimulatory effect Effects 0.000 claims description 9
- 102100021008 Endonuclease G, mitochondrial Human genes 0.000 claims description 8
- 108700018351 Major Histocompatibility Complex Proteins 0.000 claims description 8
- 102100032519 Mitochondrial ribonuclease P catalytic subunit Human genes 0.000 claims description 8
- 230000002829 reductive effect Effects 0.000 claims description 8
- 230000020382 suppression by virus of host antigen processing and presentation of peptide antigen via MHC class I Effects 0.000 claims description 8
- 108010017158 CCR7 Receptors Proteins 0.000 claims description 7
- 208000037595 EN1-related dorsoventral syndrome Diseases 0.000 claims description 7
- 229940117681 interleukin-12 Drugs 0.000 claims description 7
- 239000002502 liposome Substances 0.000 claims description 7
- 101001014546 Homo sapiens Mitochondrial ribonuclease P catalytic subunit Proteins 0.000 claims description 6
- 101001137538 Homo sapiens Endonuclease G, mitochondrial Proteins 0.000 claims description 5
- 241000713666 Lentivirus Species 0.000 claims description 5
- 108040004564 crotonyl-CoA reductase activity proteins Proteins 0.000 claims description 5
- 239000000693 micelle Substances 0.000 claims description 4
- 239000002105 nanoparticle Substances 0.000 claims description 4
- 229920000575 polymersome Polymers 0.000 claims description 4
- 241000701161 unidentified adenovirus Species 0.000 claims description 4
- 241001430294 unidentified retrovirus Species 0.000 claims description 4
- 101000813497 Homo sapiens Nuclease EXOG, mitochondrial Proteins 0.000 claims description 3
- 102100039557 Nuclease EXOG, mitochondrial Human genes 0.000 claims description 3
- 125000002091 cationic group Chemical group 0.000 claims description 3
- 239000000412 dendrimer Substances 0.000 claims description 3
- 229920000736 dendritic polymer Polymers 0.000 claims description 3
- 229920000642 polymer Polymers 0.000 claims description 3
- 102100030953 Cleavage and polyadenylation specificity factor subunit 4 Human genes 0.000 claims description 2
- 101000727105 Homo sapiens Cleavage and polyadenylation specificity factor subunit 4 Proteins 0.000 claims description 2
- 230000002441 reversible effect Effects 0.000 claims description 2
- 102000004428 CCR7 Receptors Human genes 0.000 claims 3
- 102100023148 Endoribonuclease YbeY Human genes 0.000 claims 1
- 101000833314 Homo sapiens Arf-GAP domain and FG repeat-containing protein 1 Proteins 0.000 claims 1
- 101000623216 Homo sapiens Endoribonuclease YbeY Proteins 0.000 claims 1
- 101000987488 Homo sapiens Protein pelota homolog Proteins 0.000 claims 1
- 101100501730 Medicago truncatula ERN1 gene Proteins 0.000 claims 1
- 102100028485 Protein pelota homolog Human genes 0.000 claims 1
- 101000746496 Schizosaccharomyces pombe (strain 972 / ATCC 24843) GTP-binding protein ypt3 Proteins 0.000 claims 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 103
- 201000010099 disease Diseases 0.000 abstract description 57
- 208000035475 disorder Diseases 0.000 abstract description 46
- 238000001415 gene therapy Methods 0.000 abstract description 13
- 210000000987 immune system Anatomy 0.000 abstract description 8
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 284
- 101710159080 Aconitate hydratase A Proteins 0.000 description 282
- 101710159078 Aconitate hydratase B Proteins 0.000 description 282
- 101710105008 RNA-binding protein Proteins 0.000 description 282
- 101710163270 Nuclease Proteins 0.000 description 84
- 108020004566 Transfer RNA Proteins 0.000 description 76
- 125000003275 alpha amino acid group Chemical group 0.000 description 50
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 45
- 230000035772 mutation Effects 0.000 description 39
- 239000013603 viral vector Substances 0.000 description 30
- 230000027455 binding Effects 0.000 description 26
- 102000053602 DNA Human genes 0.000 description 21
- 208000026350 Inborn Genetic disease Diseases 0.000 description 20
- 101150084101 RNA2 gene Proteins 0.000 description 20
- 101100353432 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PRP2 gene Proteins 0.000 description 20
- 210000001035 gastrointestinal tract Anatomy 0.000 description 20
- 208000016361 genetic disease Diseases 0.000 description 20
- 102000039446 nucleic acids Human genes 0.000 description 20
- 108020004707 nucleic acids Proteins 0.000 description 20
- 230000008685 targeting Effects 0.000 description 19
- 208000011580 syndromic disease Diseases 0.000 description 18
- 238000010354 CRISPR gene editing Methods 0.000 description 17
- 210000003527 eukaryotic cell Anatomy 0.000 description 16
- 101710144121 Non-structural protein 5 Proteins 0.000 description 15
- 235000001014 amino acid Nutrition 0.000 description 15
- 229940024606 amino acid Drugs 0.000 description 15
- 102220190724 rs528096976 Human genes 0.000 description 15
- 241000186216 Corynebacterium Species 0.000 description 14
- 102000004533 Endonucleases Human genes 0.000 description 14
- 108010042407 Endonucleases Proteins 0.000 description 14
- 150000001413 amino acids Chemical class 0.000 description 14
- 102000040430 polynucleotide Human genes 0.000 description 14
- 108091033319 polynucleotide Proteins 0.000 description 14
- 239000002157 polynucleotide Substances 0.000 description 14
- 241000894007 species Species 0.000 description 14
- 102220470111 Aldo-keto reductase family 1 member C2_R39D_mutation Human genes 0.000 description 13
- 102220598064 Cell division cycle and apoptosis regulator protein 1_N88A_mutation Human genes 0.000 description 13
- 238000012217 deletion Methods 0.000 description 13
- 230000037430 deletion Effects 0.000 description 13
- 230000004927 fusion Effects 0.000 description 13
- 108020004999 messenger RNA Proteins 0.000 description 13
- 102200005595 rs137852380 Human genes 0.000 description 13
- 102220192067 rs886057201 Human genes 0.000 description 13
- 208000020329 Zika virus infectious disease Diseases 0.000 description 12
- 210000005260 human cell Anatomy 0.000 description 12
- 210000002569 neuron Anatomy 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 11
- 108020004705 Codon Proteins 0.000 description 11
- 210000002865 immune cell Anatomy 0.000 description 11
- 230000000968 intestinal effect Effects 0.000 description 11
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 10
- 208000024556 Mendelian disease Diseases 0.000 description 10
- 206010039491 Sarcoma Diseases 0.000 description 10
- 241000193996 Streptococcus pyogenes Species 0.000 description 10
- 108091027544 Subgenomic mRNA Proteins 0.000 description 10
- 206010046851 Uveitis Diseases 0.000 description 10
- 201000010536 head and neck cancer Diseases 0.000 description 10
- 208000014829 head and neck neoplasm Diseases 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- 210000001082 somatic cell Anatomy 0.000 description 10
- 208000021712 Soft tissue sarcoma Diseases 0.000 description 9
- 210000004102 animal cell Anatomy 0.000 description 9
- 241000725303 Human immunodeficiency virus Species 0.000 description 8
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 8
- 206010028980 Neoplasm Diseases 0.000 description 8
- 241000713311 Simian immunodeficiency virus Species 0.000 description 8
- 208000006011 Stroke Diseases 0.000 description 8
- 238000010459 TALEN Methods 0.000 description 8
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 8
- 201000000053 blastoma Diseases 0.000 description 8
- 201000008184 embryoma Diseases 0.000 description 8
- 102000055860 human FEN1 Human genes 0.000 description 8
- 210000004962 mammalian cell Anatomy 0.000 description 8
- 239000004474 valine Substances 0.000 description 8
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 7
- 101000913035 Homo sapiens Flap endonuclease 1 Proteins 0.000 description 7
- 108050000876 Ribonuclease T2-like Proteins 0.000 description 7
- 108010072788 angiogenin Proteins 0.000 description 7
- 239000000090 biomarker Substances 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 238000001727 in vivo Methods 0.000 description 7
- 238000003780 insertion Methods 0.000 description 7
- 230000037431 insertion Effects 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- 230000017105 transposition Effects 0.000 description 7
- 201000009030 Carcinoma Diseases 0.000 description 6
- 206010008342 Cervix carcinoma Diseases 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 6
- 102100029094 DNA repair endonuclease XPF Human genes 0.000 description 6
- 102100033072 DNA replication ATP-dependent helicase DNA2 Human genes 0.000 description 6
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 6
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- 101000927313 Homo sapiens DNA replication ATP-dependent helicase DNA2 Proteins 0.000 description 6
- 101001109419 Homo sapiens RNA-binding protein NOB1 Proteins 0.000 description 6
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 6
- 241000186781 Listeria Species 0.000 description 6
- 206010025323 Lymphomas Diseases 0.000 description 6
- 102100022491 RNA-binding protein NOB1 Human genes 0.000 description 6
- 241000192031 Ruminococcus Species 0.000 description 6
- 244000057717 Streptococcus lactis Species 0.000 description 6
- 235000014897 Streptococcus lactis Nutrition 0.000 description 6
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 6
- 235000004279 alanine Nutrition 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 201000011510 cancer Diseases 0.000 description 6
- 210000003169 central nervous system Anatomy 0.000 description 6
- 201000010881 cervical cancer Diseases 0.000 description 6
- 210000000981 epithelium Anatomy 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 230000028993 immune response Effects 0.000 description 6
- 208000026278 immune system disease Diseases 0.000 description 6
- 238000011065 in-situ storage Methods 0.000 description 6
- 210000004498 neuroglial cell Anatomy 0.000 description 6
- 230000001225 therapeutic effect Effects 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 5
- 241000193464 Clostridium sp. Species 0.000 description 5
- 108700010070 Codon Usage Proteins 0.000 description 5
- 102100021957 Endonuclease domain-containing 1 protein Human genes 0.000 description 5
- 101000897352 Homo sapiens Endonuclease domain-containing 1 protein Proteins 0.000 description 5
- 101001010787 Homo sapiens Endoribonuclease Proteins 0.000 description 5
- 101000780643 Homo sapiens Protein argonaute-2 Proteins 0.000 description 5
- 101000800639 Homo sapiens Teneurin-1 Proteins 0.000 description 5
- 101000800633 Homo sapiens Teneurin-2 Proteins 0.000 description 5
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 5
- 208000032818 Microsatellite Instability Diseases 0.000 description 5
- 241001494479 Pecora Species 0.000 description 5
- 102100034207 Protein argonaute-2 Human genes 0.000 description 5
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 5
- 241000191023 Rhodobacter capsulatus Species 0.000 description 5
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 5
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 5
- 102100033213 Teneurin-1 Human genes 0.000 description 5
- 102100033227 Teneurin-2 Human genes 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 5
- 235000003704 aspartic acid Nutrition 0.000 description 5
- 230000001363 autoimmune Effects 0.000 description 5
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 210000002919 epithelial cell Anatomy 0.000 description 5
- 239000003797 essential amino acid Substances 0.000 description 5
- 235000020776 essential amino acid Nutrition 0.000 description 5
- 230000037433 frameshift Effects 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 210000004907 gland Anatomy 0.000 description 5
- 238000011534 incubation Methods 0.000 description 5
- 208000012987 lip and oral cavity carcinoma Diseases 0.000 description 5
- 230000000873 masking effect Effects 0.000 description 5
- 210000000663 muscle cell Anatomy 0.000 description 5
- 210000002784 stomach Anatomy 0.000 description 5
- 229910052725 zinc Inorganic materials 0.000 description 5
- 239000011701 zinc Substances 0.000 description 5
- 102100022313 2-iminobutanoate/2-iminopropanoate deaminase Human genes 0.000 description 4
- 239000013607 AAV vector Substances 0.000 description 4
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 4
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 4
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 4
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 4
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 4
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 4
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 4
- 241000203069 Archaea Species 0.000 description 4
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 4
- 206010005949 Bone cancer Diseases 0.000 description 4
- 208000018084 Bone neoplasm Diseases 0.000 description 4
- 241000713704 Bovine immunodeficiency virus Species 0.000 description 4
- 102000011400 CC chemokine receptor 7 Human genes 0.000 description 4
- 241000589876 Campylobacter Species 0.000 description 4
- 241000589875 Campylobacter jejuni Species 0.000 description 4
- 241000713756 Caprine arthritis encephalitis virus Species 0.000 description 4
- 102100035186 DNA excision repair protein ERCC-1 Human genes 0.000 description 4
- 102100037373 DNA-(apurinic or apyrimidinic site) endonuclease Human genes 0.000 description 4
- 241000713730 Equine infectious anemia virus Species 0.000 description 4
- 208000006168 Ewing Sarcoma Diseases 0.000 description 4
- 241000713800 Feline immunodeficiency virus Species 0.000 description 4
- 206010051066 Gastrointestinal stromal tumour Diseases 0.000 description 4
- 208000007465 Giant cell arteritis Diseases 0.000 description 4
- 101000681020 Homo sapiens 2-iminobutanoate/2-iminopropanoate deaminase Proteins 0.000 description 4
- 101000757236 Homo sapiens Angiogenin Proteins 0.000 description 4
- 101000876529 Homo sapiens DNA excision repair protein ERCC-1 Proteins 0.000 description 4
- 101000806846 Homo sapiens DNA-(apurinic or apyrimidinic site) endonuclease Proteins 0.000 description 4
- 101000782294 Homo sapiens Zinc finger protein 638 Proteins 0.000 description 4
- 208000007766 Kaposi sarcoma Diseases 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 4
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 4
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 4
- 208000003445 Mouth Neoplasms Diseases 0.000 description 4
- 241000588650 Neisseria meningitidis Species 0.000 description 4
- 206010034277 Pemphigoid Diseases 0.000 description 4
- 102100039832 Ribonuclease pancreatic Human genes 0.000 description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 4
- 241000194020 Streptococcus thermophilus Species 0.000 description 4
- 206010047115 Vasculitis Diseases 0.000 description 4
- 102100035806 Zinc finger protein 638 Human genes 0.000 description 4
- 210000000612 antigen-presenting cell Anatomy 0.000 description 4
- 235000009582 asparagine Nutrition 0.000 description 4
- 229960001230 asparagine Drugs 0.000 description 4
- 208000006990 cholangiocarcinoma Diseases 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 235000018417 cysteine Nutrition 0.000 description 4
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 101150022035 exog gene Proteins 0.000 description 4
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 description 4
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 4
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 4
- 208000027866 inflammatory disease Diseases 0.000 description 4
- 238000001802 infusion Methods 0.000 description 4
- 238000002347 injection Methods 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 4
- 229960000310 isoleucine Drugs 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 239000008194 pharmaceutical composition Substances 0.000 description 4
- 108010054067 rab1 GTP-Binding Proteins Proteins 0.000 description 4
- 108010062302 rac1 GTP Binding Protein Proteins 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 206010043207 temporal arteritis Diseases 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 4
- 230000003612 virological effect Effects 0.000 description 4
- 108010073629 xeroderma pigmentosum group F protein Proteins 0.000 description 4
- 208000030507 AIDS Diseases 0.000 description 3
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 108091032955 Bacterial small RNA Proteins 0.000 description 3
- 208000009299 Benign Mucous Membrane Pemphigoid Diseases 0.000 description 3
- 102100036301 C-C chemokine receptor type 7 Human genes 0.000 description 3
- 101001024441 Candida albicans (strain SC5314 / ATCC MYA-2876) Major facilitator superfamily multidrug transporter NAG3 Proteins 0.000 description 3
- 241000193403 Clostridium Species 0.000 description 3
- 206010009900 Colitis ulcerative Diseases 0.000 description 3
- 108010082610 Deoxyribonuclease (Pyrimidine Dimer) Proteins 0.000 description 3
- 102100030011 Endoribonuclease Human genes 0.000 description 3
- 241000589602 Francisella tularensis Species 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 101000716065 Homo sapiens C-C chemokine receptor type 7 Proteins 0.000 description 3
- 101000662690 Homo sapiens Trafficking protein particle complex subunit 10 Proteins 0.000 description 3
- 208000029462 Immunodeficiency disease Diseases 0.000 description 3
- 208000005615 Interstitial Cystitis Diseases 0.000 description 3
- 206010061252 Intraocular melanoma Diseases 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 3
- 241001112693 Lachnospiraceae Species 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- 206010025557 Malignant fibrous histiocytoma of bone Diseases 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 101100389355 Mus musculus Endov gene Proteins 0.000 description 3
- 201000002481 Myositis Diseases 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 241000606856 Pasteurella multocida Species 0.000 description 3
- 241000208317 Petroselinum Species 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- 208000006265 Renal cell carcinoma Diseases 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- 102100037456 Trafficking protein particle complex subunit 10 Human genes 0.000 description 3
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 3
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 description 3
- 201000006704 Ulcerative Colitis Diseases 0.000 description 3
- 201000005969 Uveal melanoma Diseases 0.000 description 3
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 3
- 230000000735 allogeneic effect Effects 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 230000001684 chronic effect Effects 0.000 description 3
- 201000001981 dermatomyositis Diseases 0.000 description 3
- 108010047964 endonuclease G Proteins 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 229940118764 francisella tularensis Drugs 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- 210000002443 helper t lymphocyte Anatomy 0.000 description 3
- 238000001990 intravenous administration Methods 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 206010025135 lupus erythematosus Diseases 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 108091070501 miRNA Proteins 0.000 description 3
- 208000012268 mitochondrial disease Diseases 0.000 description 3
- 206010065579 multifocal motor neuropathy Diseases 0.000 description 3
- 201000005962 mycosis fungoides Diseases 0.000 description 3
- 201000002575 ocular melanoma Diseases 0.000 description 3
- 201000008968 osteosarcoma Diseases 0.000 description 3
- 229940051027 pasteurella multocida Drugs 0.000 description 3
- 235000011197 perejil Nutrition 0.000 description 3
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 230000035935 pregnancy Effects 0.000 description 3
- 210000003289 regulatory T cell Anatomy 0.000 description 3
- 206010039073 rheumatoid arthritis Diseases 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 208000018417 undifferentiated high grade pleomorphic sarcoma of bone Diseases 0.000 description 3
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 2
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 2
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 102100024643 ATP-binding cassette sub-family D member 1 Human genes 0.000 description 2
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 2
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 2
- 241000649045 Adeno-associated virus 10 Species 0.000 description 2
- 241000649046 Adeno-associated virus 11 Species 0.000 description 2
- 201000011452 Adrenoleukodystrophy Diseases 0.000 description 2
- 208000008190 Agammaglobulinemia Diseases 0.000 description 2
- 241000702462 Akkermansia muciniphila Species 0.000 description 2
- 208000024827 Alzheimer disease Diseases 0.000 description 2
- 206010069002 Autoimmune pancreatitis Diseases 0.000 description 2
- 241001608472 Bifidobacterium longum Species 0.000 description 2
- 108030001720 Bontoxilysin Proteins 0.000 description 2
- 208000003174 Brain Neoplasms Diseases 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 208000011691 Burkitt lymphomas Diseases 0.000 description 2
- 108091079001 CRISPR RNA Proteins 0.000 description 2
- 206010007279 Carcinoid tumour of the gastrointestinal tract Diseases 0.000 description 2
- 208000024172 Cardiovascular disease Diseases 0.000 description 2
- 208000005024 Castleman disease Diseases 0.000 description 2
- 108010059892 Cellulase Proteins 0.000 description 2
- 206010007953 Central nervous system lymphoma Diseases 0.000 description 2
- 241000282552 Chlorocebus aethiops Species 0.000 description 2
- 208000030939 Chronic inflammatory demyelinating polyneuropathy Diseases 0.000 description 2
- 201000001432 Coffin-Siris syndrome Diseases 0.000 description 2
- 208000011231 Crohn disease Diseases 0.000 description 2
- 101710155004 DNA repair endonuclease XPF Proteins 0.000 description 2
- 201000004624 Dermatitis Diseases 0.000 description 2
- 102100036912 Desmin Human genes 0.000 description 2
- 108010044052 Desmin Proteins 0.000 description 2
- 208000012239 Developmental disease Diseases 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 102100021710 Endonuclease III-like protein 1 Human genes 0.000 description 2
- 101710183290 Endonuclease III-like protein 1 Proteins 0.000 description 2
- 208000018428 Eosinophilic granulomatosis with polyangiitis Diseases 0.000 description 2
- 206010064212 Eosinophilic oesophagitis Diseases 0.000 description 2
- 101001065501 Escherichia phage MS2 Lysis protein Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 208000001640 Fibromyalgia Diseases 0.000 description 2
- 241000589601 Francisella Species 0.000 description 2
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 2
- 206010072579 Granulomatosis with polyangiitis Diseases 0.000 description 2
- 208000035895 Guillain-Barré syndrome Diseases 0.000 description 2
- 101150035071 HLA-C gene Proteins 0.000 description 2
- 208000031220 Hemophilia Diseases 0.000 description 2
- 208000009292 Hemophilia A Diseases 0.000 description 2
- 201000004331 Henoch-Schoenlein purpura Diseases 0.000 description 2
- 206010019617 Henoch-Schonlein purpura Diseases 0.000 description 2
- 208000017604 Hodgkin disease Diseases 0.000 description 2
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 2
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 2
- 101001051467 Homo sapiens Endoribonuclease LACTB2 Proteins 0.000 description 2
- 101001001848 Homo sapiens Mitochondrial cardiolipin hydrolase Proteins 0.000 description 2
- 208000023105 Huntington disease Diseases 0.000 description 2
- 206010020983 Hypogammaglobulinaemia Diseases 0.000 description 2
- 208000031814 IgA Vasculitis Diseases 0.000 description 2
- 208000028622 Immune thrombocytopenia Diseases 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 208000009164 Islet Cell Adenoma Diseases 0.000 description 2
- 206010059176 Juvenile idiopathic arthritis Diseases 0.000 description 2
- 208000011200 Kawasaki disease Diseases 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- 241001468157 Lactobacillus johnsonii Species 0.000 description 2
- 241000589242 Legionella pneumophila Species 0.000 description 2
- 208000012309 Linear IgA disease Diseases 0.000 description 2
- 241000186807 Listeria seeligeri Species 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 208000001826 Marfan syndrome Diseases 0.000 description 2
- 108010049137 Member 1 Subfamily D ATP Binding Cassette Transporter Proteins 0.000 description 2
- 108010006035 Metalloproteases Proteins 0.000 description 2
- 102000005741 Metalloproteases Human genes 0.000 description 2
- 206010049567 Miller Fisher syndrome Diseases 0.000 description 2
- 102100036314 Mitochondrial cardiolipin hydrolase Human genes 0.000 description 2
- 101710204192 Mitochondrial nuclease Proteins 0.000 description 2
- 101710158975 Mitochondrial ribonuclease P catalytic subunit Proteins 0.000 description 2
- 208000003250 Mixed connective tissue disease Diseases 0.000 description 2
- 208000034578 Multiple myelomas Diseases 0.000 description 2
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 2
- 241000204031 Mycoplasma Species 0.000 description 2
- 201000007224 Myeloproliferative neoplasm Diseases 0.000 description 2
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 2
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 2
- 241000588653 Neisseria Species 0.000 description 2
- 108010066154 Nuclear Export Signals Proteins 0.000 description 2
- 206010031096 Oropharyngeal cancer Diseases 0.000 description 2
- 206010057444 Oropharyngeal neoplasm Diseases 0.000 description 2
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 2
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 2
- 206010048705 Paraneoplastic cerebellar degeneration Diseases 0.000 description 2
- 208000000733 Paroxysmal Hemoglobinuria Diseases 0.000 description 2
- 208000031845 Pernicious anaemia Diseases 0.000 description 2
- 102100036050 Phosphatidylinositol N-acetylglucosaminyltransferase subunit A Human genes 0.000 description 2
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 2
- 206010035226 Plasma cell myeloma Diseases 0.000 description 2
- 208000007452 Plasmacytoma Diseases 0.000 description 2
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 201000001263 Psoriatic Arthritis Diseases 0.000 description 2
- 208000036824 Psoriatic arthropathy Diseases 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 2
- 238000011529 RT qPCR Methods 0.000 description 2
- 208000012322 Raynaud phenomenon Diseases 0.000 description 2
- 208000005793 Restless legs syndrome Diseases 0.000 description 2
- 201000000582 Retinoblastoma Diseases 0.000 description 2
- 102100026411 Ribonuclease 4 Human genes 0.000 description 2
- 102100027776 Ribonuclease kappa Human genes 0.000 description 2
- 101710123428 Ribonuclease pancreatic Proteins 0.000 description 2
- 201000001718 Roberts syndrome Diseases 0.000 description 2
- 206010039710 Scleroderma Diseases 0.000 description 2
- 208000000453 Skin Neoplasms Diseases 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 241000191940 Staphylococcus Species 0.000 description 2
- 206010072148 Stiff-Person syndrome Diseases 0.000 description 2
- 241001501869 Streptococcus pasteurianus Species 0.000 description 2
- 206010042276 Subacute endocarditis Diseases 0.000 description 2
- 206010042742 Sympathetic ophthalmia Diseases 0.000 description 2
- 108050009621 Synapsin Proteins 0.000 description 2
- 102000001435 Synapsin Human genes 0.000 description 2
- 208000024313 Testicular Neoplasms Diseases 0.000 description 2
- 206010057644 Testis cancer Diseases 0.000 description 2
- 208000031981 Thrombocytopenic Idiopathic Purpura Diseases 0.000 description 2
- 206010043561 Thrombocytopenic purpura Diseases 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- 241000589892 Treponema denticola Species 0.000 description 2
- 208000017379 Undifferentiated connective tissue syndrome Diseases 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 208000010094 Visna Diseases 0.000 description 2
- 208000008383 Wilms tumor Diseases 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 241000193458 [Clostridium] aminophilum Species 0.000 description 2
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 230000030741 antigen processing and presentation Effects 0.000 description 2
- 230000000890 antigenic effect Effects 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 208000006673 asthma Diseases 0.000 description 2
- 208000027625 autoimmune inner ear disease Diseases 0.000 description 2
- 206010071578 autoimmune retinopathy Diseases 0.000 description 2
- 208000025261 autosomal dominant disease Diseases 0.000 description 2
- 208000025341 autosomal recessive disease Diseases 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 201000008873 bone osteosarcoma Diseases 0.000 description 2
- 229940053031 botulinum toxin Drugs 0.000 description 2
- 208000000594 bullous pemphigoid Diseases 0.000 description 2
- 201000005795 chronic inflammatory demyelinating polyneuritis Diseases 0.000 description 2
- 210000002777 columnar cell Anatomy 0.000 description 2
- 230000003412 degenerative effect Effects 0.000 description 2
- 210000005045 desmin Anatomy 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 210000003162 effector t lymphocyte Anatomy 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 2
- 201000000708 eosinophilic esophagitis Diseases 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 230000006846 excision repair Effects 0.000 description 2
- 210000001808 exosome Anatomy 0.000 description 2
- 238000002073 fluorescence micrograph Methods 0.000 description 2
- 210000004475 gamma-delta t lymphocyte Anatomy 0.000 description 2
- 230000000762 glandular Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 201000011066 hemangioma Diseases 0.000 description 2
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 2
- 208000006454 hepatitis Diseases 0.000 description 2
- 231100000283 hepatitis Toxicity 0.000 description 2
- 208000002557 hidradenitis Diseases 0.000 description 2
- 201000007162 hidradenitis suppurativa Diseases 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 150000002466 imines Chemical class 0.000 description 2
- 208000015446 immunoglobulin a vasculitis Diseases 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 208000002551 irritable bowel syndrome Diseases 0.000 description 2
- 201000002529 islet cell tumor Diseases 0.000 description 2
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 229940115932 legionella pneumophila Drugs 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 210000003071 memory t lymphocyte Anatomy 0.000 description 2
- 208000030159 metabolic disease Diseases 0.000 description 2
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 206010063344 microscopic polyangiitis Diseases 0.000 description 2
- DNIAPMSPPWPWGF-UHFFFAOYSA-N monopropylene glycol Natural products CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 2
- 208000001725 mucocutaneous lymph node syndrome Diseases 0.000 description 2
- 201000008383 nephritis Diseases 0.000 description 2
- 201000008026 nephroblastoma Diseases 0.000 description 2
- 208000015122 neurodegenerative disease Diseases 0.000 description 2
- 208000008795 neuromyelitis optica Diseases 0.000 description 2
- 208000004235 neutropenia Diseases 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 201000005737 orchitis Diseases 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 201000006958 oropharynx cancer Diseases 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 208000022102 pancreatic neuroendocrine neoplasm Diseases 0.000 description 2
- 201000003045 paroxysmal nocturnal hemoglobinuria Diseases 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 210000001428 peripheral nervous system Anatomy 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 208000030683 polygenic disease Diseases 0.000 description 2
- 229920001451 polypropylene glycol Polymers 0.000 description 2
- 230000001124 posttranscriptional effect Effects 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 208000016800 primary central nervous system lymphoma Diseases 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 208000037821 progressive disease Diseases 0.000 description 2
- 230000002062 proliferating effect Effects 0.000 description 2
- 239000012048 reactive intermediate Substances 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 2
- 108010066530 ribonuclease K Proteins 0.000 description 2
- 108091092562 ribozyme Proteins 0.000 description 2
- 108091006024 signal transducing proteins Proteins 0.000 description 2
- 102000034285 signal transducing proteins Human genes 0.000 description 2
- 201000000849 skin cancer Diseases 0.000 description 2
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 208000023516 stroke disease Diseases 0.000 description 2
- 208000008467 subacute bacterial endocarditis Diseases 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 201000000596 systemic lupus erythematosus Diseases 0.000 description 2
- 201000003120 testicular cancer Diseases 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 208000037965 uterine sarcoma Diseases 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- KIUKXJAPPMFGSW-DNGZLQJQSA-N (2S,3S,4S,5R,6R)-6-[(2S,3R,4R,5S,6R)-3-Acetamido-2-[(2S,3S,4R,5R,6R)-6-[(2R,3R,4R,5S,6R)-3-acetamido-2,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-2-carboxy-4,5-dihydroxyoxan-3-yl]oxy-5-hydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-3,4,5-trihydroxyoxane-2-carboxylic acid Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@H](O3)C(O)=O)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](C(O)=O)O1 KIUKXJAPPMFGSW-DNGZLQJQSA-N 0.000 description 1
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 1
- VFNUTEMVQGLDAG-NKVSQWTQSA-N 2-methoxy-4-[(Z)-(5,6,7,8-tetrahydro-[1]benzothiolo[2,3-d]pyrimidin-4-ylhydrazinylidene)methyl]phenol Chemical compound COC1=CC(\C=N/NC2=NC=NC3=C2C2=C(CCCC2)S3)=CC=C1O VFNUTEMVQGLDAG-NKVSQWTQSA-N 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 1
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 1
- 208000002008 AIDS-Related Lymphoma Diseases 0.000 description 1
- 208000002874 Acne Vulgaris Diseases 0.000 description 1
- 208000005452 Acute intermittent porphyria Diseases 0.000 description 1
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 1
- 208000026872 Addison Disease Diseases 0.000 description 1
- 206010001557 Albinism Diseases 0.000 description 1
- 208000032671 Allergic granulomatous angiitis Diseases 0.000 description 1
- 206010001935 American trypanosomiasis Diseases 0.000 description 1
- 206010061424 Anal cancer Diseases 0.000 description 1
- 208000028185 Angioedema Diseases 0.000 description 1
- 206010002556 Ankylosing Spondylitis Diseases 0.000 description 1
- 208000003343 Antiphospholipid Syndrome Diseases 0.000 description 1
- 208000007860 Anus Neoplasms Diseases 0.000 description 1
- 206010003011 Appendicitis Diseases 0.000 description 1
- 102000008682 Argonaute Proteins Human genes 0.000 description 1
- 108010088141 Argonaute Proteins Proteins 0.000 description 1
- 206010003267 Arthritis reactive Diseases 0.000 description 1
- 206010003571 Astrocytoma Diseases 0.000 description 1
- 201000001320 Atherosclerosis Diseases 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 206010064539 Autoimmune myocarditis Diseases 0.000 description 1
- 208000031212 Autoimmune polyendocrinopathy Diseases 0.000 description 1
- 208000022106 Autoimmune polyendocrinopathy type 2 Diseases 0.000 description 1
- 206010003840 Autonomic nervous system imbalance Diseases 0.000 description 1
- 201000008162 B cell deficiency Diseases 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000545821 Bacteroides coprophilus Species 0.000 description 1
- 206010004146 Basal cell carcinoma Diseases 0.000 description 1
- 208000023328 Basedow disease Diseases 0.000 description 1
- 208000009137 Behcet syndrome Diseases 0.000 description 1
- 102100027314 Beta-2-microglobulin Human genes 0.000 description 1
- 102100026031 Beta-glucuronidase Human genes 0.000 description 1
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 1
- 208000008439 Biliary Liver Cirrhosis Diseases 0.000 description 1
- 208000033222 Biliary cirrhosis primary Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241001453380 Burkholderia Species 0.000 description 1
- 201000002829 CREST Syndrome Diseases 0.000 description 1
- 101100299659 Caenorhabditis elegans puf-7 gene Proteins 0.000 description 1
- 101100139845 Caenorhabditis elegans rac-2 gene Proteins 0.000 description 1
- 102000004657 Calcium-Calmodulin-Dependent Protein Kinase Type 2 Human genes 0.000 description 1
- 108010003721 Calcium-Calmodulin-Dependent Protein Kinase Type 2 Proteins 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 208000017897 Carcinoma of esophagus Diseases 0.000 description 1
- 241000206592 Carnobacterium gallinarum Species 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 102100037677 Cell surface hyaluronidase Human genes 0.000 description 1
- 101710125063 Cell surface hyaluronidase Proteins 0.000 description 1
- 208000024699 Chagas disease Diseases 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 206010008609 Cholangitis sclerosing Diseases 0.000 description 1
- 201000009047 Chordoma Diseases 0.000 description 1
- 208000006344 Churg-Strauss Syndrome Diseases 0.000 description 1
- 208000015943 Coeliac disease Diseases 0.000 description 1
- 208000010007 Cogan syndrome Diseases 0.000 description 1
- 208000011038 Cold agglutinin disease Diseases 0.000 description 1
- 206010009868 Cold type haemolytic anaemia Diseases 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 208000013586 Complex regional pain syndrome type 1 Diseases 0.000 description 1
- 206010010741 Conjunctivitis Diseases 0.000 description 1
- 241001546092 Coprophilus Species 0.000 description 1
- 241000186227 Corynebacterium diphtheriae Species 0.000 description 1
- 208000009798 Craniopharyngioma Diseases 0.000 description 1
- 208000019707 Cryoglobulinemic vasculitis Diseases 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 208000037845 Cutaneous squamous cell carcinoma Diseases 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 206010012468 Dermatitis herpetiformis Diseases 0.000 description 1
- 208000021866 Dressler syndrome Diseases 0.000 description 1
- 241001454374 Drosophila <fruit fly, subgenus> Species 0.000 description 1
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 208000001976 Endocrine Gland Neoplasms Diseases 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 201000009273 Endometriosis Diseases 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 206010014954 Eosinophilic fasciitis Diseases 0.000 description 1
- 206010014967 Ependymoma Diseases 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 206010015226 Erythema nodosum Diseases 0.000 description 1
- 208000000289 Esophageal Achalasia Diseases 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 208000004332 Evans syndrome Diseases 0.000 description 1
- 102100031562 Excitatory amino acid transporter 2 Human genes 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 201000001342 Fallopian tube cancer Diseases 0.000 description 1
- 208000013452 Fallopian tube neoplasm Diseases 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 241000589565 Flavobacterium Species 0.000 description 1
- 241000604777 Flavobacterium columnare Species 0.000 description 1
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241001123946 Gaga Species 0.000 description 1
- 208000022072 Gallbladder Neoplasms Diseases 0.000 description 1
- 241000012732 Gallibacterium Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 102100039289 Glial fibrillary acidic protein Human genes 0.000 description 1
- 101710193519 Glial fibrillary acidic protein Proteins 0.000 description 1
- 206010018364 Glomerulonephritis Diseases 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 208000024869 Goodpasture syndrome Diseases 0.000 description 1
- 201000005569 Gout Diseases 0.000 description 1
- 208000015023 Graves' disease Diseases 0.000 description 1
- 102100027377 HBS1-like protein Human genes 0.000 description 1
- 108010075704 HLA-A Antigens Proteins 0.000 description 1
- 101150000578 HLA-B gene Proteins 0.000 description 1
- 108091007417 HOX transcript antisense RNA Proteins 0.000 description 1
- 208000035186 Hemolytic Autoimmune Anemia Diseases 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 208000028523 Hereditary Complement Deficiency disease Diseases 0.000 description 1
- 208000032087 Hereditary Leber Optic Atrophy Diseases 0.000 description 1
- 208000008051 Hereditary Nonpolyposis Colorectal Neoplasms Diseases 0.000 description 1
- 208000017095 Hereditary nonpolyposis colon cancer Diseases 0.000 description 1
- 206010019939 Herpes gestationis Diseases 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000933465 Homo sapiens Beta-glucuronidase Proteins 0.000 description 1
- 101000970385 Homo sapiens Endonuclease III-like protein 1 Proteins 0.000 description 1
- 101000866287 Homo sapiens Excitatory amino acid transporter 2 Proteins 0.000 description 1
- 101001009070 Homo sapiens HBS1-like protein Proteins 0.000 description 1
- 101001111338 Homo sapiens Neurofilament heavy polypeptide Proteins 0.000 description 1
- 101000979333 Homo sapiens Neurofilament light polypeptide Proteins 0.000 description 1
- 101000662049 Homo sapiens Polyubiquitin-C Proteins 0.000 description 1
- 101000616974 Homo sapiens Pumilio homolog 1 Proteins 0.000 description 1
- 101001082131 Homo sapiens Pumilio homolog 3 Proteins 0.000 description 1
- 101001063514 Homo sapiens Telomerase-binding protein EST1A Proteins 0.000 description 1
- 101001046426 Homo sapiens cGMP-dependent protein kinase 1 Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 201000009794 Idiopathic Pulmonary Fibrosis Diseases 0.000 description 1
- 208000010159 IgA glomerulonephritis Diseases 0.000 description 1
- 206010021263 IgA nephropathy Diseases 0.000 description 1
- 208000014919 IgG4-related retroperitoneal fibrosis Diseases 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 206010062016 Immunosuppression Diseases 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 208000037396 Intraductal Noninfiltrating Carcinoma Diseases 0.000 description 1
- 206010073094 Intraductal proliferative breast lesion Diseases 0.000 description 1
- 208000003456 Juvenile Arthritis Diseases 0.000 description 1
- 101710172804 K protein Proteins 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- UBORTCNDUKBEOP-UHFFFAOYSA-N L-xanthosine Natural products OC1C(O)C(CO)OC1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UHFFFAOYSA-N 0.000 description 1
- 240000001046 Lactobacillus acidophilus Species 0.000 description 1
- 235000013956 Lactobacillus acidophilus Nutrition 0.000 description 1
- 241000186679 Lactobacillus buchneri Species 0.000 description 1
- 201000010743 Lambert-Eaton myasthenic syndrome Diseases 0.000 description 1
- 201000005099 Langerhans cell histiocytosis Diseases 0.000 description 1
- 241000272168 Laridae Species 0.000 description 1
- 206010023825 Laryngeal cancer Diseases 0.000 description 1
- 201000000639 Leber hereditary optic neuropathy Diseases 0.000 description 1
- 241000589248 Legionella Species 0.000 description 1
- 208000007764 Legionnaires' Disease Diseases 0.000 description 1
- 241000029590 Leptotrichia wadei Species 0.000 description 1
- 206010061523 Lip and/or oral cavity cancer Diseases 0.000 description 1
- 241000186805 Listeria innocua Species 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- 208000016604 Lyme disease Diseases 0.000 description 1
- 206010025312 Lymphoma AIDS related Diseases 0.000 description 1
- 201000005027 Lynch syndrome Diseases 0.000 description 1
- 208000004059 Male Breast Neoplasms Diseases 0.000 description 1
- 208000006644 Malignant Fibrous Histiocytoma Diseases 0.000 description 1
- 208000032271 Malignant tumor of penis Diseases 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 108700000232 Medium chain acyl CoA dehydrogenase deficiency Proteins 0.000 description 1
- 208000027530 Meniere disease Diseases 0.000 description 1
- 201000009906 Meningitis Diseases 0.000 description 1
- 208000002030 Merkel cell carcinoma Diseases 0.000 description 1
- 101100136101 Mesocricetus auratus PENK gene Proteins 0.000 description 1
- 206010027406 Mesothelioma Diseases 0.000 description 1
- 102100036837 Metabotropic glutamate receptor 2 Human genes 0.000 description 1
- 206010063569 Metastatic squamous cell carcinoma Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 208000012192 Mucous membrane pemphigoid Diseases 0.000 description 1
- 208000003452 Multiple Hereditary Exostoses Diseases 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241001465821 Mycoplasma gallisepticum str. F Species 0.000 description 1
- 201000003793 Myelodysplastic syndrome Diseases 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- 229910002651 NO3 Inorganic materials 0.000 description 1
- 241000588649 Neisseria lactamica Species 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 206010029266 Neuroendocrine carcinoma of the skin Diseases 0.000 description 1
- 208000033383 Neuroendocrine tumor of pancreas Diseases 0.000 description 1
- 206010052399 Neuroendocrine tumour Diseases 0.000 description 1
- 208000003019 Neurofibromatosis 1 Diseases 0.000 description 1
- 208000024834 Neurofibromatosis type 1 Diseases 0.000 description 1
- 108010085839 Neurofibromin 2 Proteins 0.000 description 1
- 102000007517 Neurofibromin 2 Human genes 0.000 description 1
- 102100024007 Neurofilament heavy polypeptide Human genes 0.000 description 1
- 102100023057 Neurofilament light polypeptide Human genes 0.000 description 1
- 206010071579 Neuronal neuropathy Diseases 0.000 description 1
- 208000010359 Newcastle Disease Diseases 0.000 description 1
- 208000014060 Niemann-Pick disease Diseases 0.000 description 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 1
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 1
- 102000007999 Nuclear Proteins Human genes 0.000 description 1
- 108010089610 Nuclear Proteins Proteins 0.000 description 1
- 241000801628 Odoribacter laneus Species 0.000 description 1
- 206010030136 Oesophageal achalasia Diseases 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 208000003435 Optic Neuritis Diseases 0.000 description 1
- 206010031252 Osteomyelitis Diseases 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 208000025174 PANDAS Diseases 0.000 description 1
- 102000000309 PIN domains Human genes 0.000 description 1
- 108050008752 PIN domains Proteins 0.000 description 1
- 206010053869 POEMS syndrome Diseases 0.000 description 1
- 101150070699 PUF3 gene Proteins 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 241000573657 Paludibacterium Species 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 206010067517 Pancreatic neuroendocrine tumour Diseases 0.000 description 1
- 206010061332 Paraganglion neoplasm Diseases 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 208000008223 Pemphigoid Gestationis Diseases 0.000 description 1
- 241000721454 Pemphigus Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 208000002471 Penile Neoplasms Diseases 0.000 description 1
- 206010034299 Penile cancer Diseases 0.000 description 1
- 208000008469 Peptic Ulcer Diseases 0.000 description 1
- 208000009565 Pharyngeal Neoplasms Diseases 0.000 description 1
- 206010034811 Pharyngeal cancer Diseases 0.000 description 1
- 206010065159 Polychondritis Diseases 0.000 description 1
- 208000007048 Polymyalgia Rheumatica Diseases 0.000 description 1
- 102100037935 Polyubiquitin-C Human genes 0.000 description 1
- 239000004372 Polyvinyl alcohol Substances 0.000 description 1
- 206010036182 Porphyria acute Diseases 0.000 description 1
- 208000031732 Post-Lyme Disease Syndrome Diseases 0.000 description 1
- 208000004347 Postpericardiotomy Syndrome Diseases 0.000 description 1
- 208000012654 Primary biliary cholangitis Diseases 0.000 description 1
- 208000026149 Primary peritoneal carcinoma Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 241000186429 Propionibacterium Species 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 101800001494 Protease 2A Proteins 0.000 description 1
- 101800001066 Protein 2A Proteins 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 201000004681 Psoriasis Diseases 0.000 description 1
- 102100027358 Pumilio homolog 3 Human genes 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 108020004412 RNA 3' Polyadenylation Signals Proteins 0.000 description 1
- 108020005067 RNA Splice Sites Proteins 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 230000026279 RNA modification Effects 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 206010038111 Recurrent cancer Diseases 0.000 description 1
- 201000001947 Reflex Sympathetic Dystrophy Diseases 0.000 description 1
- 206010038802 Reticuloendothelial system stimulated Diseases 0.000 description 1
- 206010038979 Retroperitoneal fibrosis Diseases 0.000 description 1
- 208000006289 Rett Syndrome Diseases 0.000 description 1
- 208000008938 Rhabdoid tumor Diseases 0.000 description 1
- 206010073334 Rhabdoid tumour Diseases 0.000 description 1
- 241000191043 Rhodobacter sphaeroides Species 0.000 description 1
- 102100040329 Ribonuclease 8 Human genes 0.000 description 1
- 101710192190 Ribonuclease 8 Proteins 0.000 description 1
- 108060007030 Ribulose-phosphate 3-epimerase Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 241000192026 Ruminococcus flavefaciens Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101100453289 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) JSN1 gene Proteins 0.000 description 1
- 101100024116 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MPT5 gene Proteins 0.000 description 1
- 101100138728 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PUF4 gene Proteins 0.000 description 1
- 206010061934 Salivary gland cancer Diseases 0.000 description 1
- 241000124033 Salix Species 0.000 description 1
- 241000195474 Sargassum Species 0.000 description 1
- 101001000154 Schistosoma mansoni Phosphoglycerate kinase Proteins 0.000 description 1
- 101100382629 Schizosaccharomyces pombe (strain 972 / ATCC 24843) cbh1 gene Proteins 0.000 description 1
- 206010039705 Scleritis Diseases 0.000 description 1
- 208000034189 Sclerosis Diseases 0.000 description 1
- 208000009359 Sezary Syndrome Diseases 0.000 description 1
- 208000021388 Sezary disease Diseases 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 208000021386 Sjogren Syndrome Diseases 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 206010041067 Small cell lung cancer Diseases 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 241000579741 Sphaerotheca <fungi> Species 0.000 description 1
- 206010041660 Splenomegaly Diseases 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 1
- 241000379946 Streptococcus gallinaceus Species 0.000 description 1
- 241001134658 Streptococcus mitis Species 0.000 description 1
- 241000194019 Streptococcus mutans Species 0.000 description 1
- 241001267418 Streptococcus pasteuri Species 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 208000002286 Susac Syndrome Diseases 0.000 description 1
- 201000001322 T cell deficiency Diseases 0.000 description 1
- 208000031673 T-Cell Cutaneous Lymphoma Diseases 0.000 description 1
- 206010042971 T-cell lymphoma Diseases 0.000 description 1
- 208000027585 T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 208000001106 Takayasu Arteritis Diseases 0.000 description 1
- 208000022292 Tay-Sachs disease Diseases 0.000 description 1
- 102100031022 Telomerase-binding protein EST1A Human genes 0.000 description 1
- 101710150687 Telomerase-binding protein EST1A Proteins 0.000 description 1
- 206010043276 Teratoma Diseases 0.000 description 1
- 206010043515 Throat cancer Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 108091028113 Trans-activating crRNA Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 241001506047 Tremella Species 0.000 description 1
- 241000589886 Treponema Species 0.000 description 1
- 241000223109 Trypanosoma cruzi Species 0.000 description 1
- 206010064996 Ulcerative keratitis Diseases 0.000 description 1
- 208000025851 Undifferentiated connective tissue disease Diseases 0.000 description 1
- 208000015778 Undifferentiated pleomorphic sarcoma Diseases 0.000 description 1
- 102000039634 Untranslated RNA Human genes 0.000 description 1
- 108020004417 Untranslated RNA Proteins 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000006593 Urologic Neoplasms Diseases 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 208000001445 Uveomeningoencephalitic Syndrome Diseases 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000607598 Vibrio Species 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 206010047642 Vitiligo Diseases 0.000 description 1
- 208000025749 Vogt-Koyanagi-Harada disease Diseases 0.000 description 1
- 208000027276 Von Willebrand disease Diseases 0.000 description 1
- 206010047741 Vulval cancer Diseases 0.000 description 1
- 208000004354 Vulvar Neoplasms Diseases 0.000 description 1
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 description 1
- 108091007416 X-inactive specific transcript Proteins 0.000 description 1
- 208000019291 X-linked disease Diseases 0.000 description 1
- 208000016174 X-linked dominant disease Diseases 0.000 description 1
- 208000024967 X-linked recessive disease Diseases 0.000 description 1
- 108091035715 XIST (gene) Proteins 0.000 description 1
- UBORTCNDUKBEOP-HAVMAKPUSA-N Xanthosine Natural products O[C@@H]1[C@H](O)[C@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-HAVMAKPUSA-N 0.000 description 1
- 208000019289 Y-linked disease Diseases 0.000 description 1
- 201000000621 achalasia Diseases 0.000 description 1
- 206010000496 acne Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 108091006088 activator proteins Proteins 0.000 description 1
- 208000002552 acute disseminated encephalomyelitis Diseases 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 208000020990 adrenal cortex carcinoma Diseases 0.000 description 1
- 210000004100 adrenal gland Anatomy 0.000 description 1
- 208000007128 adrenocortical carcinoma Diseases 0.000 description 1
- 210000004504 adult stem cell Anatomy 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 208000004631 alopecia areata Diseases 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 206010002022 amyloidosis Diseases 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 230000003078 antioxidant effect Effects 0.000 description 1
- 201000011165 anus cancer Diseases 0.000 description 1
- 210000000040 apocrine gland Anatomy 0.000 description 1
- 208000021780 appendiceal neoplasm Diseases 0.000 description 1
- 206010003246 arthritis Diseases 0.000 description 1
- 210000001130 astrocyte Anatomy 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 208000006424 autoimmune oophoritis Diseases 0.000 description 1
- 201000009780 autoimmune polyendocrine syndrome type 2 Diseases 0.000 description 1
- 208000029407 autoimmune urticaria Diseases 0.000 description 1
- 230000005784 autoimmunity Effects 0.000 description 1
- 230000003376 axonal effect Effects 0.000 description 1
- 206010003882 axonal neuropathy Diseases 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 229940009291 bifidobacterium longum Drugs 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 206010006451 bronchitis Diseases 0.000 description 1
- 239000007975 buffered saline Substances 0.000 description 1
- 102100022422 cGMP-dependent protein kinase 1 Human genes 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 208000002458 carcinoid tumor Diseases 0.000 description 1
- 230000011128 cardiac conduction Effects 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 210000004413 cardiac myocyte Anatomy 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 101150048033 cbh gene Proteins 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 208000025302 chronic primary adrenal insufficiency Diseases 0.000 description 1
- 208000024376 chronic urticaria Diseases 0.000 description 1
- 201000010002 cicatricial pemphigoid Diseases 0.000 description 1
- 239000007979 citrate buffer Substances 0.000 description 1
- 206010009887 colitis Diseases 0.000 description 1
- 201000002388 complement deficiency Diseases 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 201000007717 corneal ulcer Diseases 0.000 description 1
- 210000003792 cranial nerve Anatomy 0.000 description 1
- 201000003278 cryoglobulinemia Diseases 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 201000007241 cutaneous T cell lymphoma Diseases 0.000 description 1
- 208000017763 cutaneous neuroendocrine carcinoma Diseases 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 210000004443 dendritic cell Anatomy 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 208000016097 disease of metabolism Diseases 0.000 description 1
- 208000007784 diverticulitis Diseases 0.000 description 1
- 230000019975 dosage compensation by inactivation of X chromosome Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 208000028715 ductal breast carcinoma in situ Diseases 0.000 description 1
- 201000007273 ductal carcinoma in situ Diseases 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 208000014616 embryonal neoplasm Diseases 0.000 description 1
- 201000002491 encephalomyelitis Diseases 0.000 description 1
- 201000011523 endocrine gland cancer Diseases 0.000 description 1
- 201000003914 endometrial carcinoma Diseases 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000002327 eosinophilic effect Effects 0.000 description 1
- 201000005619 esophageal carcinoma Diseases 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 210000001723 extracellular space Anatomy 0.000 description 1
- 208000024519 eye neoplasm Diseases 0.000 description 1
- 101150014310 fem-3 gene Proteins 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 1
- 210000000232 gallbladder Anatomy 0.000 description 1
- 201000010175 gallbladder cancer Diseases 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 208000018090 giant cell myocarditis Diseases 0.000 description 1
- 210000005046 glial fibrillary acidic protein Anatomy 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 201000009277 hairy cell leukemia Diseases 0.000 description 1
- 201000010235 heart cancer Diseases 0.000 description 1
- 208000024348 heart neoplasm Diseases 0.000 description 1
- 244000000013 helminth Species 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 201000010928 hereditary multiple exostoses Diseases 0.000 description 1
- 208000020198 hereditary von Willebrand disease Diseases 0.000 description 1
- 201000008298 histiocytosis Diseases 0.000 description 1
- 102000043353 human PUM1 Human genes 0.000 description 1
- 229920002674 hyaluronan Polymers 0.000 description 1
- 229960003160 hyaluronic acid Drugs 0.000 description 1
- 208000013010 hypopharyngeal carcinoma Diseases 0.000 description 1
- 201000006866 hypopharynx cancer Diseases 0.000 description 1
- 230000007813 immunodeficiency Effects 0.000 description 1
- 238000010820 immunofluorescence microscopy Methods 0.000 description 1
- 230000001506 immunosuppresive effect Effects 0.000 description 1
- 208000013256 infectious meningitis Diseases 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000002743 insertional mutagenesis Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 210000003093 intracellular space Anatomy 0.000 description 1
- FZWBNHMXJMCXLU-BLAUPYHCSA-N isomaltotriose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OC[C@@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@@H](OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O)O1 FZWBNHMXJMCXLU-BLAUPYHCSA-N 0.000 description 1
- 201000002215 juvenile rheumatoid arthritis Diseases 0.000 description 1
- 208000022013 kidney Wilms tumor Diseases 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 229940039695 lactobacillus acidophilus Drugs 0.000 description 1
- 201000005264 laryngeal carcinoma Diseases 0.000 description 1
- 206010023841 laryngeal neoplasm Diseases 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 201000011486 lichen planus Diseases 0.000 description 1
- 239000002479 lipoplex Substances 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 231100000053 low toxicity Toxicity 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 201000003175 male breast cancer Diseases 0.000 description 1
- 208000010907 male breast carcinoma Diseases 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 208000026045 malignant tumor of parathyroid gland Diseases 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000013160 medical therapy Methods 0.000 description 1
- 208000005548 medium chain acyl-CoA dehydrogenase deficiency Diseases 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 210000000716 merkel cell Anatomy 0.000 description 1
- 108010038421 metabotropic glutamate receptor 2 Proteins 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 210000000274 microglia Anatomy 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 210000000214 mouth Anatomy 0.000 description 1
- 201000002273 mucopolysaccharidosis II Diseases 0.000 description 1
- 208000022018 mucopolysaccharidosis type 2 Diseases 0.000 description 1
- 210000004877 mucosa Anatomy 0.000 description 1
- 210000002894 multi-fate stem cell Anatomy 0.000 description 1
- 201000006417 multiple sclerosis Diseases 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 206010028417 myasthenia gravis Diseases 0.000 description 1
- 210000003098 myoblast Anatomy 0.000 description 1
- 201000003631 narcolepsy Diseases 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 208000017929 nasal glial heterotopia Diseases 0.000 description 1
- 210000000581 natural killer T-cell Anatomy 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 208000016065 neuroendocrine neoplasm Diseases 0.000 description 1
- 201000011519 neuroendocrine tumor Diseases 0.000 description 1
- 208000002761 neurofibromatosis 2 Diseases 0.000 description 1
- 208000022032 neurofibromatosis type 2 Diseases 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 201000008106 ocular cancer Diseases 0.000 description 1
- 208000015200 ocular cicatricial pemphigoid Diseases 0.000 description 1
- 210000004248 oligodendroglia Anatomy 0.000 description 1
- 210000001328 optic nerve Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 201000008482 osteoarthritis Diseases 0.000 description 1
- 230000002611 ovarian Effects 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 208000021010 pancreatic neuroendocrine tumor Diseases 0.000 description 1
- 208000003154 papilloma Diseases 0.000 description 1
- 208000029211 papillomatosis Diseases 0.000 description 1
- 230000002023 papillomaviral effect Effects 0.000 description 1
- 208000007312 paraganglioma Diseases 0.000 description 1
- 210000003695 paranasal sinus Anatomy 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 201000003913 parathyroid carcinoma Diseases 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 201000001245 periodontitis Diseases 0.000 description 1
- 208000033808 peripheral neuropathy Diseases 0.000 description 1
- 201000002524 peritoneal carcinoma Diseases 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 210000003800 pharynx Anatomy 0.000 description 1
- 208000028591 pheochromocytoma Diseases 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 210000004560 pineal gland Anatomy 0.000 description 1
- 230000001817 pituitary effect Effects 0.000 description 1
- 235000021118 plant-derived protein Nutrition 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 229920002627 poly(phosphazenes) Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920000058 polyacrylate Polymers 0.000 description 1
- 201000006292 polyarteritis nodosa Diseases 0.000 description 1
- 229920002721 polycyanoacrylate Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 208000005987 polymyositis Diseases 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920002635 polyurethane Polymers 0.000 description 1
- 239000004814 polyurethane Substances 0.000 description 1
- 229920002451 polyvinyl alcohol Polymers 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002335 preservative effect Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 208000025638 primary cutaneous T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 201000000742 primary sclerosing cholangitis Diseases 0.000 description 1
- 229960003387 progesterone Drugs 0.000 description 1
- 239000000186 progesterone Substances 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 208000005069 pulmonary fibrosis Diseases 0.000 description 1
- 208000009954 pyoderma gangrenosum Diseases 0.000 description 1
- 208000002574 reactive arthritis Diseases 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 201000003068 rheumatic fever Diseases 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 201000003804 salivary gland carcinoma Diseases 0.000 description 1
- 201000000306 sarcoidosis Diseases 0.000 description 1
- 210000004116 schwann cell Anatomy 0.000 description 1
- 208000010157 sclerosing cholangitis Diseases 0.000 description 1
- 210000001732 sebaceous gland Anatomy 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 208000007056 sickle cell anemia Diseases 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 201000009890 sinusitis Diseases 0.000 description 1
- 210000002363 skeletal muscle cell Anatomy 0.000 description 1
- 201000010106 skin squamous cell carcinoma Diseases 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 208000000587 small cell lung carcinoma Diseases 0.000 description 1
- 201000002314 small intestine cancer Diseases 0.000 description 1
- 210000001057 smooth muscle myoblast Anatomy 0.000 description 1
- 210000000329 smooth muscle myocyte Anatomy 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 208000002320 spinal muscular atrophy Diseases 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 208000037969 squamous neck cancer Diseases 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 210000002948 striated muscle cell Anatomy 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 208000008732 thymoma Diseases 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 206010043778 thyroiditis Diseases 0.000 description 1
- 206010044008 tonsillitis Diseases 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 102000035160 transmembrane proteins Human genes 0.000 description 1
- 108091005703 transmembrane proteins Proteins 0.000 description 1
- 208000009174 transverse myelitis Diseases 0.000 description 1
- 210000000251 trophoblastic cell Anatomy 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 201000000334 ureter transitional cell carcinoma Diseases 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 206010046885 vaginal cancer Diseases 0.000 description 1
- 208000013139 vaginal neoplasm Diseases 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
- 206010047470 viral myocarditis Diseases 0.000 description 1
- 201000005102 vulva cancer Diseases 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- UBORTCNDUKBEOP-UUOKFMHZSA-N xanthosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UUOKFMHZSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1136—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against growth factors, growth regulators, cytokines, lymphokines or hormones
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1138—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Mycology (AREA)
- Endocrinology (AREA)
- Pharmacology & Pharmacy (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
公开了用于同时提供基因疗法并且防止受试者的免疫系统对通过所述基因疗法修饰的细胞的适应性免疫应答的组合物和方法。在一些实施方案中,本公开文本的组合物修饰与疾病或障碍相关的RNA分子的表达水平,以及抑制适应性免疫应答的组分的表达或活性,以从受试者的免疫系统中掩蔽所述修饰的细胞。
Description
技术领域
本公开文本涉及分子生物学,并且更具体而言涉及用于修饰涉及适应性免疫应答的RNA分子的表达和活性的组合物和方法。
相关申请的交叉引用
本申请要求2018年6月8日提交的美国专利申请号62/682,276的优先权,将其内容通过引用以其整体并入本文。将2019年6月7日提交的国际申请号PCT/US2019/036021、2019年6月7日提交的美国专利申请号16/434,689和2018年6月8日提交的美国专利申请号62/682,271的内容通过引用以其整体并入本文。
序列表的并入
将2019年6月6日创建的大小为2.93MB的名为“LOCN_003_001WO_SeqList_ST25”的文本文件的内容通过引用以其整体特此并入。
背景技术
对于同时提供基因疗法并且抑制当例如通过病毒载体递送所述基因疗法时可能出现的适应性免疫应答,在本领域中存在长期但未得到满足的需要。本公开文本提供了用于以序列特异性方式特异性靶向RNA分子的组合物和方法,其在体内提供基因疗法,同时从受试者的免疫系统中掩蔽修饰的细胞,从而防止对所述修饰的细胞的适应性免疫应答。
发明内容
本公开文本提供了一种组合物,其包含含有特异性结合靶RNA序列的指导RNA(gRNA)序列的核酸序列,其中所述靶RNA序列编码适应性免疫应答的蛋白质组分,并且其中所述gRNA序列包含含有编码所述蛋白质组分的核酸序列的一部分的间隔子序列,并且其中所述蛋白质组分选自β-2-微球蛋白(β2M)、人白细胞抗原A(HLA-A)、人白细胞抗原B(HLA-B)、人白细胞抗原C(HLA-C)、分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)、ICOS配体(ICOSLG)、OX40L、白细胞介素12(IL12)和CC趋化因子受体7(CCR7)。
本公开文本还提供了一种组合物,其包含(a)包含特异性结合RNA分子内的靶序列的指导RNA(gRNA)的第一序列,其中所述靶序列包含编码适应性免疫应答的组分的序列;以及(b)编码融合蛋白的序列,所述序列包含编码第一RNA结合多肽的序列和编码第二RNA结合多肽的序列,其中所述第一RNA结合多肽和所述第二RNA结合多肽都不包含显著DNA-核酸酶活性,其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且其中所述第二RNA结合多肽包含RNA-核酸酶活性。
本公开文本提供了一种组合物,其包含:(a)包含特异性结合第一RNA分子内的第一靶序列的指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;和(b)包含特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列;以及(c)编码融合蛋白的序列,所述序列包含编码第一RNA结合多肽的序列和编码第二RNA结合多肽的序列,其中所述第一RNA结合多肽和所述第二RNA结合多肽都不包含显著DNA-核酸酶活性,其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且其中所述第二RNA结合多肽包含RNA-核酸酶活性。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一靶序列或所述第二靶序列包含至少一个重复的序列。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一序列包含能够在真核细胞中表达所述gRNA的第一启动子和/或所述第二序列包含能够在真核细胞中表达所述gRNA的第二启动子。在一些实施方案中,所述第一启动子和所述第二启动子是相同的。在一些实施方案中,所述第一启动子和所述第二启动子是不同的。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一序列和所述第二序列包含能够在真核细胞中表达所述第一gRNA和所述第二gRNA的启动子。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中gRNA序列包含能够在真核细胞中表达所述gRNA的启动子,所述真核细胞是动物细胞。在一些实施方案中,所述动物细胞是哺乳动物细胞。在一些实施方案中,所述动物细胞是人细胞。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中gRNA序列包含能够在真核细胞中表达所述gRNA的启动子,所述启动子是组成型活性启动子。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中gRNA序列包含能够在真核细胞中表达所述gRNA的启动子,所述gRNA序列包含从能够驱动RNA聚合酶的表达的启动子分离或衍生的序列。在一些实施方案中,所述启动子序列是从U6启动子分离或衍生的。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中gRNA序列包含能够在真核细胞中表达所述gRNA的启动子,所述启动子包含从能够驱动转移RNA(tRNA)的表达的启动子分离或衍生的序列。在一些实施方案中,所述启动子序列是从以下启动子分离或衍生的:丙氨酸tRNA启动子、精氨酸tRNA启动子、天冬酰胺tRNA启动子、天冬氨酸tRNA启动子、半胱氨酸tRNA启动子、谷氨酰胺tRNA启动子、谷氨酸tRNA启动子、甘氨酸tRNA启动子、组氨酸tRNA启动子、异亮氨酸tRNA启动子、亮氨酸tRNA启动子、赖氨酸tRNA启动子、甲硫氨酸tRNA启动子、苯丙氨酸tRNA启动子、脯氨酸tRNA启动子、丝氨酸tRNA启动子、苏氨酸tRNA启动子、色氨酸tRNA启动子、酪氨酸tRNA启动子或缬氨酸tRNA启动子。在一些实施方案中,所述启动子序列是从缬氨酸tRNA启动子分离或衍生的。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,包含所述第一gRNA的序列还包含与所述第一靶RNA序列特异性结合的第一间隔子序列。在一些实施方案中,所述第一间隔子序列与所述靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。在一些实施方案中,所述第一间隔子序列与所述靶RNA序列具有100%互补性。在一些实施方案中,所述第一间隔子序列包含20个核苷酸或由其组成。在一些实施方案中,所述第一间隔子序列包含21个核苷酸或由其组成。在一些实施方案中,所述第一间隔子序列包含编码β-2-微球蛋白(β2M)蛋白的氨基酸序列的20个核苷酸或由其组成。在一些实施方案中,所述第一间隔子序列包含以下的氨基酸序列的20个核苷酸或由其组成:
MSRSVALAVL ALLSLSGLEA IQRTPKIQVY SRHPADIEVD LLKNGERIEK VEHSDLSFSKDWSFYLLYYT EFTPTEKDEY ACRVNHVTLS QPKIVKWDRD M(SEQ ID NO:88)。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,包含所述第一gRNA的序列还包含与所述第一RNA结合蛋白特异性结合的第一支架序列。在一些实施方案中,所述第一支架序列包含茎环结构。在一些实施方案中,所述支架序列包含90个核苷酸或由其组成。在一些实施方案中,所述支架序列包含93个核苷酸或由其组成。在一些实施方案中,所述支架序列包含以下序列:GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:12)或GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:13)。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,包含所述第二gRNA的序列还包含与所述第二靶RNA序列特异性结合的第二间隔子序列。在一些实施方案中,所述第二间隔子序列与所述第一靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。在一些实施方案中,所述第二间隔子序列与所述靶RNA序列具有100%互补性。在一些实施方案中,所述第二间隔子序列包含20个核苷酸或由其组成。在一些实施方案中,所述第二间隔子序列包含21个核苷酸或由其组成。在一些实施方案中,所述第二间隔子序列包含或还包含含有以下序列的至少1、2、3、4、5、6或7个重复的序列:CUG(SEQ ID NO:18)、CCUG(SEQ ID NO:19)、CAG(SEQ ID NO:80)、GGGGCC(SEQ ID NO:81)或其任何组合。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,包含所述第二gRNA的序列还包含与所述第一RNA结合蛋白特异性结合的第二支架序列。在一些实施方案中,所述第二支架序列包含茎环结构。在一些实施方案中,所述支架序列包含85个核苷酸或由其组成。在一些实施方案中,所述支架序列包含以下序列:GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:12)或GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:13)。
在本公开文本的组合物的一些实施方案中,所述gRNA不结合或不选择性结合所述RNA分子内的第二序列。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一gRNA不结合或不选择性结合所述第一RNA分子内的第二序列。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二gRNA不结合或不选择性结合所述第二RNA分子内的第二序列。
在本公开文本的组合物的一些实施方案中,RNA基因组或RNA转录组包含所述RNA分子。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,RNA基因组或RNA转录组包含所述第一RNA分子或所述第二RNA分子。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一RNA结合蛋白包含CRISPR-Cas蛋白。在一些实施方案中,所述CRISPR-Cas蛋白是II型CRISPR-Cas蛋白。在一些实施方案中,所述第一RNA结合蛋白包含Cas9多肽或其RNA结合部分。在一些实施方案中,所述CRISPR-Cas蛋白是V型CRISPR-Cas蛋白。在一些实施方案中,所述第一RNA结合蛋白包含Cpf1多肽或其RNA结合部分。在一些实施方案中,所述CRISPR-Cas蛋白是VI型CRISPR-Cas蛋白。在一些实施方案中,所述第一RNA结合蛋白包含Cas13多肽或其RNA结合部分。在一些实施方案中,所述CRISPR-Cas蛋白包含天然RNA核酸酶活性。在一些实施方案中,所述天然RNA核酸酶活性被降低或抑制。在一些实施方案中,所述天然RNA核酸酶活性被增加或诱导。在一些实施方案中,所述CRISPR-Cas蛋白包含天然DNA核酸酶活性并且其中所述天然DNA核酸酶活性被抑制。在一些实施方案中,所述CRISPR-Cas蛋白包含突变。在一些实施方案中,所述CRISPR-Cas蛋白的核酸酶结构域包含所述突变。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的核酸中。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的氨基酸中。在一些实施方案中,所述突变包含取代、插入、缺失、移码、倒位或转座。在一些实施方案中,所述突变包含核酸酶结构域、所述核酸酶结构域内的结合位点、所述核酸酶结构域内的活性位点或所述核酸酶结构域内的至少一个必需氨基酸残基的缺失。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一RNA结合蛋白包含Pumilio和FBF(PUF)蛋白或其RNA结合部分。在一些实施方案中,所述第一RNA结合蛋白包含基于Pumilio的联合体(Pumilio-based assembly,PUMBY)蛋白或其RNA结合部分。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一RNA结合蛋白不需要多聚化以用于RNA结合活性。在一些实施方案中,所述第一RNA结合蛋白不是多聚体复合物的单体。在一些实施方案中,多聚体蛋白复合物不包含所述第一RNA结合蛋白。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一RNA结合蛋白与所述RNA分子内的靶序列选择性结合。在一些实施方案中,所述第一RNA结合蛋白不包含对所述RNA分子内的第二序列的亲和力。在一些实施方案中,所述第一RNA结合蛋白不包含对所述RNA分子内的第二序列的高亲和力或不选择性结合所述第二序列。在一些实施方案中,RNA基因组或RNA转录组包含所述RNA分子。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第一RNA结合蛋白包含在2个与1300个之间的氨基酸,包括端点。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,编码所述第一RNA结合蛋白的序列还包含编码核定位信号(NLS)的序列。在一些实施方案中,编码核定位信号(NLS)的所述序列定位于编码所述第一RNA结合蛋白的序列的3'。在一些实施方案中,所述第一RNA结合蛋白包含在所述蛋白质的C末端的NLS。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,编码所述第一RNA结合蛋白的序列还包含编码第一NLS的第一序列和编码第二NLS的第二序列。在一些实施方案中,编码所述第一NLS或所述第二NLS的序列定位于编码所述第一RNA结合蛋白的序列的3'。在一些实施方案中,所述第一RNA结合蛋白包含在所述蛋白质的C末端的所述第一NLS或所述第二NLS。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含核酸酶结构域或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶1或由其组成。在一些实施方案中,所述RNA酶1蛋白包含SEQ ID NO:20或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶4或由其组成。在一些实施方案中,所述RNA酶4蛋白包含SEQ ID NO:21或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶6或由其组成。在一些实施方案中,所述RNA酶6蛋白包含SEQ ID NO:22或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶7或由其组成。在一些实施方案中,所述RNA酶7蛋白包含SEQ ID NO:23或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶8或由其组成。在一些实施方案中,所述RNA酶8蛋白包含SEQ ID NO:24或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶2或由其组成。在一些实施方案中,所述RNA酶2包含SEQ ID NO:25或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶6PL或由其组成。在一些实施方案中,所述RNA酶6PL蛋白包含SEQ ID NO:26或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶L或由其组成。在一些实施方案中,所述RNA酶L蛋白包含SEQ ID NO:27或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶T2或由其组成。在一些实施方案中,所述RNA酶T2蛋白包含SEQ ID NO:28或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶11或由其组成。在一些实施方案中,所述RNA酶11蛋白包含SEQ ID NO:29或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶T2样蛋白或由其组成。在一些实施方案中,所述RNA酶T2样蛋白包含SEQ ID NO:30或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含NOB1多肽或由其组成。在一些实施方案中,所述NOB1多肽包含SEQ ID NO:31或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含内切核酸酶或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含内切核酸酶V(ENDOV)或由其组成。在一些实施方案中,所述ENDOV包含SEQ ID NO:32或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含内切核酸酶G(ENDOG)或由其组成。在一些实施方案中,所述ENDOG包含SEQ ID NO:33或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含内切核酸酶D1(ENDOD1)或由其组成。在一些实施方案中,所述ENDOD1包含SEQ ID NO:34或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含人瓣状内切核酸酶-1(hFEN1)或由其组成。在一些实施方案中,所述hFEN1包含SEQ ID NO:35或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含人斯库拉芬蛋白(Schlafen)14(hSLFN14)多肽或由其组成。在一些实施方案中,所述hSLFN14包含SEQ ID NO:36或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含人β-内酰胺酶样蛋白2(hLACTB2)多肽或由其组成。在一些实施方案中,所述hLACTB2包含SEQID NO:37或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含无嘌呤/无嘧啶(AP)内切脱氧核糖核酸酶(APEX2)多肽或由其组成。在一些实施方案中,所述APEX2包含SEQ ID NO:38或由其组成。在一些实施方案中,所述APEX2包含SEQ ID NO:39或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含血管生成素(ANG)多肽或由其组成。在一些实施方案中,所述ANG包含SEQ ID NO:40或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含热反应蛋白12(HRSP12)多肽或由其组成。在一些实施方案中,所述HRSP12包含SEQ ID NO:41或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含含锌指CCCH型12A(Zinc Finger CCCH-Type Containing 12A,ZC3H12A)或由其组成。在一些实施方案中,所述ZC3H12A包含SEQ ID NO:42或由其组成。在一些实施方案中,所述ZC3H12A包含SEQ ID NO:43或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含反应性中间亚胺脱氨酶A(Reactive Intermediate Imine Deaminase A,RIDA)多肽或由其组成。在一些实施方案中,所述RIDA多肽包含SEQ ID NO:44或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含磷脂酶D家族成员6(PDL6)多肽或由其组成。在一些实施方案中,所述PDL6多肽包含SEQ IDNO:126或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含内切核酸酶III样蛋白1(NTHL)多肽或由其组成。在一些实施方案中,所述NTHL多肽包含SEQID NO:123或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含线粒体核糖核酸酶P催化亚基(KIAA0391)多肽或由其组成。在一些实施方案中,所述KIAA0391多肽包含SEQ ID NO:127或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含无嘌呤或无嘧啶位点裂解酶(APEX1)多肽或由其组成。在一些实施方案中,所述APEX1多肽包含SEQ ID NO:125或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含阿尔古蛋白(argonaute)2(AGO2)多肽或由其组成。在一些实施方案中,编码所述AGO2多肽包含SEQ ID NO:128或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含线粒体核酸酶EXOG(EXOG)多肽或由其组成。在一些实施方案中,所述EXOG多肽包含SEQ IDNO:129或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含含锌指CCCH型12D(ZC3H12D)多肽或由其组成。在一些实施方案中,所述ZC3H12D多肽包含SEQID NO:130或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含内质网核信号转导蛋白2(ERN2)多肽或由其组成。在一些实施方案中,所述ERN2多肽包含SEQID NO:131或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含回力球mRNA监督和核糖体挽救因子(pelota mRNA surveillance and ribosome rescuefactor,PELO)多肽或由其组成。在一些实施方案中,所述PELO多肽包含SEQ ID NO:132或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含YBEY金属肽酶(YBEY)多肽或由其组成。在一些实施方案中,所述YBEY多肽包含SEQ ID NO:133或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含剪切和多聚腺苷酸化特异性因子4样蛋白(CPSF4L)多肽或由其组成。在一些实施方案中,所述CPSF4L多肽包含SEQ ID NO:134或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含hCG_2002731多肽或由其组成。在一些实施方案中,所述hCG_2002731多肽包含SEQ ID NO:135或由其组成。在一些实施方案中,编码所述hCG_2002731多肽的序列包含SEQ ID NO:136或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含切除修复交叉互补组1(ERCC1)多肽或由其组成。在一些实施方案中,所述ERCC1多肽包含SEQID NO:137或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含ras相关C3肉毒杆菌毒素底物1亚型(RAC1)多肽或由其组成。在一些实施方案中,所述RAC1多肽包含SEQ ID NO:138或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含核糖核酸酶A A1(RAA1)多肽或由其组成。在一些实施方案中,所述RAA1多肽包含SEQ ID NO:139或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含Ras相关蛋白(RAB1)多肽或由其组成。在一些实施方案中,所述RAB1多肽包含SEQ ID NO:140或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含DNA复制解旋酶/核酸酶2(DNA2)多肽或由其组成。在一些实施方案中,所述DNA2多肽包含SEQID NO:141或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含FLJ35220多肽或由其组成。在一些实施方案中,所述FLJ35220多肽包含SEQ ID NO:142或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含FLJ13173多肽或由其组成。在一些实施方案中,所述FLJ13173多肽包含SEQ ID NO:143或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含DNA修复内切核酸酶XPF(ERCC4)多肽或由其组成。在一些实施方案中,所述ERCC4多肽包含SEQID NO:124或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R))多肽或由其组成。在一些实施方案中,所述RNA酶1(K41R)多肽包含SEQ ID NO:116或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R、D121E))多肽或由其组成。在一些实施方案中,所述RNA酶1(RNA酶1(K41R、D121E))多肽包含SEQ ID NO:117或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R、D121E、H119N))多肽或由其组成。在一些实施方案中,所述RNA酶1(RNA酶1(K41R、D121E、H119N))多肽包含SEQ ID NO:118或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(H119N))多肽或由其组成。在一些实施方案中,RNA酶1(RNA酶1(H119N))多肽包含SEQ ID NO:119或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。在一些实施方案中,所述RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽包含SEQ ID NO:120或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。在一些实施方案中,所述RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N、K41R、D121E))多肽包含SEQID NO:121或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。在一些实施方案中,所述RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D))多肽包含SEQ ID NO:122或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含特诺伊林(Teneurin)跨膜蛋白1(TENM1)多肽或由其组成。在一些实施方案中,所述TENM1多肽包含SEQ ID NO:144或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含特诺伊林跨膜蛋白1(TENM2)多肽或由其组成。在一些实施方案中,所述TENM2多肽包含SEQ IDNO:145或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含核糖核酸酶κ(RNA酶K)多肽或由其组成。在一些实施方案中,所述RNA酶K蛋白包含SEQ ID NO:204或由其组成。
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含转录激活因子样效应物核酸酶(TALEN)多肽或所述多肽的核酸酶结构域或由其组成。在一些实施方案中,所述TALEN多肽包含以下序列或由其组成:
在一些实施方案中,所述TALEN多肽包含以下序列或由其组成:
在本公开文本的组合物的一些实施方案中,包括以下那些实施方案:其中所述组合物包含含有特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;以及含有特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列,所述第二RNA结合蛋白包含锌指核酸酶多肽或所述多肽的核酸酶结构域或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含ZNF638多肽或所述多肽的核酸酶结构域或由其组成。在一些实施方案中,所述ZNF638多肽多肽包含以下序列或由其组成:
在本公开文本的组合物的一些实施方案中,所述组合物还包含(a)包含特异性结合于RNA分子内的gRNA的序列;以及(b)编码核酸酶的序列。在一些实施方案中,编码核酸酶的所述序列包含从CRISPR/Cas蛋白分离或衍生的序列。在一些实施方案中,所述CRISPR/Cas蛋白是从以下中的任一种分离或衍生的:I型、IA型、IB型、IC型、ID型、IE型、IF型、IU型、III型、IIIA型、IIIB型、IIIC型、IIID型、IV型、IVA型、IVB型、II型、IIA型、IIB型、IIC型、V型或VI型CRISPR/Cas蛋白。在一些实施方案中,编码核酸酶的所述序列包含从TALEN或其核酸酶结构域分离或衍生的序列。在一些实施方案中,编码核酸酶的所述序列包含从锌指核酸酶或其核酸酶结构域分离或衍生的序列。在一些实施方案中,所述靶序列包含编码适应性免疫应答的组分的序列。
本公开文本提供了一种包含本公开文本的组合物的载体。在一些实施方案中,所述载体是病毒载体。在一些实施方案中,所述载体包含从慢病毒、腺病毒、腺相关病毒(AAV)载体或逆转录病毒分离或衍生的序列。在一些实施方案中,所述载体无复制能力。
本公开文本提供了一种包含本公开文本的组合物的载体。在一些实施方案中,所述载体是病毒载体。在一些实施方案中,所述载体包含从腺相关载体(AAV)分离或衍生的序列。在一些实施方案中,所述腺相关病毒(AAV)是分离的AAV。在一些实施方案中,所述腺相关病毒(AAV)是自身互补的腺相关病毒(scAAV)。在一些实施方案中,所述腺相关病毒(AAV)是重组腺相关病毒(rAAV)。在一些实施方案中,所述腺相关病毒(AAV)包含从血清型AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11或AAV12的AAV分离或衍生的序列。在一些实施方案中,所述腺相关病毒(AAV)包含从血清型AAV9的AAV分离或衍生的序列。在一些实施方案中,所述腺相关病毒(AAV)包含从Anc80分离或衍生的序列。
本公开文本提供了一种包含本公开文本的组合物的载体。在一些实施方案中,所述载体是病毒载体。在一些实施方案中,所述载体是逆转录病毒。
本公开文本提供了一种包含本公开文本的组合物的载体。在一些实施方案中,所述载体是病毒载体。在一些实施方案中,所述载体是慢病毒。
本公开文本提供了一种包含本公开文本的组合物的载体。在一些实施方案中,所述载体是非病毒载体。在一些实施方案中,所述非病毒载体包含纳米颗粒、胶束、脂质体或阳离子脂质体/DNA复合物(lipoplex)、聚合物囊泡(polymersome)、聚合物/DNA复合物(polyplex)或树枝状聚合物。
本公开文本提供了一种包含本公开文本的载体的组合物。
本公开文本提供了一种包含本公开文本的载体的细胞。
本公开文本提供了一种包含本公开文本的细胞的细胞。
在本公开文本的细胞的一些实施方案中,所述细胞是哺乳动物细胞。在一些实施方案中,所述细胞是人细胞。
在本公开文本的细胞的一些实施方案中,所述细胞是免疫细胞。在一些实施方案中,所述免疫细胞是T淋巴细胞(T细胞)。在一些实施方案中,所述T细胞是效应T细胞、辅助T细胞、记忆T细胞、调节性T细胞、自然杀伤T细胞、粘膜相关恒定T细胞或γδT细胞。
在本公开文本的细胞的一些实施方案中,所述细胞是免疫细胞。在一些实施方案中,所述免疫细胞是抗原呈递细胞。在一些实施方案中,所述抗原呈递细胞是树突细胞、巨噬细胞或B细胞。在一些实施方案中,所述抗原呈递细胞是体细胞。
在本公开文本的细胞的一些实施方案中,所述细胞是免疫细胞。在一些实施方案中,所述细胞是健康细胞。在一些实施方案中,所述细胞不是健康细胞。在一些实施方案中,所述细胞是从患有疾病或障碍的受试者分离或衍生的。
本公开文本提供了一种包含本公开文本的细胞的组合物。
本公开文本提供了一种包含本公开文本的多个细胞的组合物。
本公开文本提供了一种从适应性免疫应答中掩蔽细胞的方法,其包括使本公开文本的组合物与所述细胞接触以产生修饰的细胞,其中所述组合物修饰所述修饰的细胞的RNA分子的表达水平,并且其中所述RNA分子编码适应性免疫应答的组分。在一些实施方案中,所述细胞是体内的、体外的、离体的或原位的。在一些实施方案中,所述细胞是体外的或离体的。在一些实施方案中,多个细胞包含所述细胞。在一些实施方案中,使所述多个细胞中的每个细胞与所述组合物接触,从而产生多个修饰的细胞。在一些实施方案中,所述方法还包括向受试者施用所述修饰的细胞。在一些实施方案中,所述方法还包括向受试者施用所述多个修饰的细胞。在一些实施方案中,所述细胞是自体的。在一些实施方案中,所述细胞是同种异体的。在一些实施方案中,所述多个修饰的细胞是自体的。在一些实施方案中,所述多个修饰的细胞是同种异体的。在一些实施方案中,适应性免疫应答的所述组分包含以下的组分或由其组成:I型主要组织相容性复合物(MHC I)、II型主要组织相容性复合物(MHC II)、T细胞受体(TCR)、共刺激分子或其组合。在一些实施方案中,所述MHC I组分包含α1链、α2链、α3链或β2M蛋白。在一些实施方案中,适应性免疫应答的所述组分包含MHC Iβ2M蛋白或由其组成。在一些实施方案中,所述MHC II组分包含α1链、α2链、β1链或β2链。在一些实施方案中,所述TCR组分包含α链和β链。在一些实施方案中,所述共刺激分子包含分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)或ICOS配体(ICOSLG)蛋白。在一些实施方案中,适应性免疫应答的蛋白质组分是但不限于β-2-微球蛋白(β2M)、人白细胞抗原A(HLA-A)、人白细胞抗原B(HLA-B)、人白细胞抗原C(HLA-C)、分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)、ICOS配体(ICOSLG)、OX40L、白细胞介素12(IL12)或CC趋化因子受体7(CCR7)。
本公开文本提供了一种防止或减少受试者的适应性免疫应答的方法,其包括向所述受试者施用治疗有效量的本公开文本的组合物,其中使所述组合物与所述受试者的至少一个细胞接触,产生修饰的细胞,其中所述组合物修饰所述修饰的细胞的RNA分子的表达水平,并且其中所述RNA分子编码适应性免疫应答的组分。
本公开文本提供了一种治疗受试者的疾病或障碍的方法,其包括向所述受试者施用治疗有效量的本公开文本的组合物,其中使所述组合物与所述受试者的至少一个细胞接触,产生修饰的细胞,其中所述组合物修饰所述修饰的细胞的RNA分子的表达水平,并且其中所述组合物防止或减少对所述修饰的细胞的适应性免疫应答。
在本公开文本的方法的一些实施方案中,适应性免疫应答的所述组分包含以下的组分或由其组成:I型主要组织相容性复合物(MHC I)、II型主要组织相容性复合物(MHCII)、T细胞受体(TCR)、共刺激分子或其组合。在一些实施方案中,所述MHC I组分包含α1链、α2链、α3链或β2M蛋白。在一些实施方案中,适应性免疫应答的所述组分包含MHC Iβ2M蛋白或由其组成。在一些实施方案中,所述MHC II组分包含α1链、α2链、β1链或β2链。在一些实施方案中,所述TCR组分包含α链和β链。在一些实施方案中,所述共刺激分子包含分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)或ICOS配体(ICOSLG)蛋白。
在本公开文本的治疗疾病或障碍的方法的一些实施方案中,所述疾病或障碍是遗传疾病或障碍。在一些实施方案中,所述疾病或障碍是单基因遗传疾病或障碍。在一些实施方案中,所述疾病或障碍是由微卫星不稳定性引起的。在一些实施方案中,所述微卫星不稳定性发生在DNA序列的至少1、2、3、4、5或6个重复的基序处。在一些实施方案中,RNA分子包含所述DNA序列的转录物,并且其中所述组合物与所述RNA分子的靶序列结合,所述靶序列包含至少1、2、3、4、5或6个重复的基序。
在本公开文本的方法的一些实施方案中,全身性施用所述组合物。在一些实施方案中,静脉内施用所述组合物。在一些实施方案中,通过注射或输注施用所述组合物。
在本公开文本的方法的一些实施方案中,局部施用所述组合物。在一些实施方案中,通过骨内、眼内、脑内或脊柱内途径施用所述组合物。在一些实施方案中,通过注射或输注施用所述组合物。
在本公开文本的方法的一些实施方案中,所述组合物的治疗有效量是单剂量。
在本公开文本的方法的一些实施方案中,所述组合物是非基因组整合的。
附图说明
所述专利或申请文件含有至少一张彩色附图。在请求并支付必要的费用后,官方将会提供带有一张或多张彩色附图的本专利或专利申请公开案的副本。
图1A是描绘了示例性RNA内切核酸酶-空肠弯曲杆菌(C.jejuni)Cas9融合蛋白的示意图。
图1B是描绘了在E43和E67 CjeCas9-内切核酸酶融合物二者的存在下Zika NS5的表达水平的变化的图,所述融合物具有含有如表8中指示的各种靶向NS5的间隔子序列的sgRNA。将Zika NS5表达展示为相对于加载有含有对照(λ)间隔子序列的sgRNA的内切核酸酶的变化倍数。
图2A是用加载有含有靶向Zika NS5的间隔子序列的sgRNA的CjeCas9-内切核酸酶融合物转染的细胞的荧光显微镜检查图像。
图2B是描绘了如与加载有不靶向Zika NS5的sgRNA的CjeCas9-内切核酸酶融合物相比在加载有靶向Zika NS5的适当sgRNA的CjeCas9-内切核酸酶融合物的存在下Zika NS5的表达的变化的图。
图3是用于本公开文本的组合物中的示例性内切核酸酶的列表。
图4是描绘了编码示例性RNA内切核酸酶-空肠弯曲杆菌Cas9融合蛋白和用于在基因疗法的背景下调节免疫应答的两种gRNA分子的构建体的示意图。本发明描述了使用基于CRISPR的基因疗法或在AAV中编码的其他非自身蛋白同时改变宿主基因表达以防止对非自身蛋白的适应性免疫应答来解决人类疾病的方式。在一个实施方案中,所述AAV颗粒(左)携带一对指导RNA和CRISPR相关(Cas)蛋白。所述指导物分别靶向与适应性免疫应答相关的基因和促进治疗效果的基因(或基因产物)。递送至靶组织后,所述靶向免疫应答的指导物减少与抗原呈递(β-2-微球蛋白,B2M)或T细胞的共刺激(ICOSLG、CD80、CD86、OX40L、IL12、CCR7)相关的基因的表达。抗原呈递抑制防止对治疗性转基因(如Cas蛋白)具有特异性的T辅助(Th)细胞的形成,同时共刺激抑制防止对转基因具有特异性的Th细胞的激活。
具体实施方式
本公开文本提供了用于通过靶向修饰的细胞的RNA分子同时治疗疾病并且同时从适应性免疫应答中掩蔽所述修饰的细胞的组合物和方法。通过抑制或减少在所述修饰的细胞中适应性免疫应答的组分的表达,所述修饰的细胞对于宿主免疫系统不可见。例如,本公开文本的组合物可以同时靶向与遗传疾病或障碍相关的RNA分子和编码MHC I的β2M亚基的RNA分子。通过选择性靶向编码MHC I的β2M亚基的RNA分子,所述组合物防止所述修饰的细胞在所述修饰的细胞表面上展示一种或多种衍生自RNA靶向构建体、载体或其组合的抗原肽。因此,受试者的免疫系统不会将所述修饰的细胞鉴定为含有外源序列,并且不会尝试针对所述修饰的细胞产生免疫应答。此方法提高了治疗所述遗传疾病或障碍的治疗功效,同时避免了基因疗法的常见副作用。
靶向RNA的融合蛋白组合物
本公开文本提供了一种组合物,其包含(a)包含特异性结合RNA分子内的靶序列的指导RNA(gRNA)的序列;以及(b)编码融合蛋白的序列,所述序列包含编码第一RNA结合多肽的序列和编码第二RNA结合多肽的序列,其中所述第一RNA结合多肽和所述第二RNA结合多肽都不包含显著DNA-核酸酶活性,其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且其中所述第二RNA结合多肽包含RNA-核酸酶活性,其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且其中所述第二RNA结合多肽包含RNA-核酸酶活性。
在本公开文本的组合物的一些实施方案中,所述靶序列包含至少一个重复的序列。
在本公开文本的组合物的一些实施方案中,所述gRNA序列包含能够在真核细胞中表达所述gRNA的启动子。
在本公开文本的组合物的一些实施方案中,所述真核细胞是动物细胞。在一些实施方案中,所述动物细胞是哺乳动物细胞。在一些实施方案中,所述动物细胞是人细胞。
在本公开文本的组合物的一些实施方案中,所述启动子是组成型活性启动子。在一些实施方案中,所述启动子序列是从能够驱动RNA聚合酶的表达的启动子分离或衍生的。在一些实施方案中,所述启动子序列是从U6启动子分离或衍生的。在一些实施方案中,所述启动子序列是从能够驱动转移RNA(tRNA)的表达的启动子分离或衍生的。在一些实施方案中,所述启动子序列是从以下启动子分离或衍生的:丙氨酸tRNA启动子、精氨酸tRNA启动子、天冬酰胺tRNA启动子、天冬氨酸tRNA启动子、半胱氨酸tRNA启动子、谷氨酰胺tRNA启动子、谷氨酸tRNA启动子、甘氨酸tRNA启动子、组氨酸tRNA启动子、异亮氨酸tRNA启动子、亮氨酸tRNA启动子、赖氨酸tRNA启动子、甲硫氨酸tRNA启动子、苯丙氨酸tRNA启动子、脯氨酸tRNA启动子、丝氨酸tRNA启动子、苏氨酸tRNA启动子、色氨酸tRNA启动子、酪氨酸tRNA启动子或缬氨酸tRNA启动子。在一些实施方案中,所述启动子序列是从缬氨酸tRNA启动子分离或衍生的。
在本公开文本的组合物的一些实施方案中,包含所述gRNA的序列还包含与所述靶RNA序列特异性结合的间隔子序列。在一些实施方案中,所述间隔子序列与所述靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。在一些实施方案中,所述间隔子序列与所述靶RNA序列具有100%互补性。在一些实施方案中,所述间隔子序列包含20个核苷酸或由其组成。在一些实施方案中,所述间隔子序列包含21个核苷酸或由其组成。在一些实施方案中,所述间隔子序列包含以下序列或由其组成:
UGGAGCGAGCAUCCCCCAAA(SEQ ID NO:1)、GUUUGGGGGAUGCUCGCUCCA(SEQ ID NO:2)、CCCUCACUGCUGGGGAGUCC(SEQ ID NO:3)、GGACUCCCCAGCAGUGAGGG(SEQ ID NO:4)、GCAACUGGAUCAAUUUGCUG(SEQ ID NO:5)、GCAGCAAAUUGAUCCAGUUGC(SEQ ID NO:6)、GCAUUCUUAUCUGGUCAGUGC(SEQ ID NO:7)、GCACUGACCAGAUAAGAAUG(SEQ ID NO:8)、GAGCAGCAGCAGCAGCAGCAG(EQ ID NO:9)、GCAGGCAGGCAGGCAGGCAGG(SEQ ID NO:10)、GCCCCGGCCCCGGCCCCGGC(SEQ ID NO:11)或GCTGCTGCTGCTGCTGCTGC(SEQ ID NO:84)、GGGGCCGGGGCCGGGGCCGG(SEQ ID NO:74)、GGGCCGGGGCCGGGGCCGGG(SEQ ID NO:75)、GGCCGGGGCCGGGGCCGGGG(SEQ ID NO:76)、GCCGGGGCCGGGGCCGGGGC(SEQ ID NO:77)、CCGGGGCCGGGGCCGGGGCC(SEQ ID NO:78)或CGGGGCCGGGGCCGGGGCCG(SEQ ID NO:79)。
在本公开文本的组合物的一些实施方案中,包含所述gRNA的序列还包含与所述靶RNA序列特异性结合的间隔子序列。在一些实施方案中,所述间隔子序列与所述靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。在一些实施方案中,所述间隔子序列与所述靶RNA序列具有100%互补性。在一些实施方案中,所述间隔子序列包含20个核苷酸或由其组成。在一些实施方案中,所述间隔子序列包含21个核苷酸或由其组成。在一些实施方案中,所述间隔子序列包含以下序列或由其组成:
GUGAUAAGUGGAAUGCCAUG(SEQ ID NO:14)、CUGGUGAACUUCCGAUAGUG(SEQ ID NO:15)或GAGATATAGCCTGGTGGTTC(SEQ ID NO:16)。
在本公开文本的组合物的一些实施方案中,包含所述gRNA的序列还包含与所述靶RNA序列特异性结合的间隔子序列。在一些实施方案中,所述间隔子序列与所述靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。在一些实施方案中,所述间隔子序列与所述靶RNA序列具有100%互补性。在一些实施方案中,所述间隔子序列包含20个核苷酸或由其组成。在一些实施方案中,所述间隔子序列包含21个核苷酸或由其组成。在一些实施方案中,所述间隔子序列包含以下序列或由以下序列组成,所述序列包含序列CUG(SEQ ID NO:18)、CCUG(SEQ ID NO:19)、CAG(SEQ ID NO:80)、GGGGCC(SEQ ID NO:81)或其任何组合的至少1、2、3、4、5、6或7个重复。
在本公开文本的组合物的一些实施方案中,包含所述gRNA的序列还包含与所述第一RNA结合蛋白特异性结合的支架序列。在一些实施方案中,所述支架序列包含茎环结构。在一些实施方案中,所述支架序列包含90个核苷酸或由其组成。在一些实施方案中,所述支架序列包含93个核苷酸或由其组成。在一些实施方案中,所述支架序列包含以下序列或由其组成:GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:83)。在一些实施方案中,所述支架序列包含以下序列或由其组成:
GGACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUU(SEQ ID NO:17)。在一些实施方案中,所述支架序列包含以下序列或由其组成:
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:82)或GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:13)。
在本公开文本的组合物的一些实施方案中,所述gRNA不结合或不选择性结合所述RNA分子内的第二序列。
在本公开文本的组合物的一些实施方案中,RNA基因组或RNA转录组包含所述RNA分子。
在本公开文本的组合物的一些实施方案中,所述第一RNA结合蛋白包含CRISPR-Cas蛋白。在一些实施方案中,所述CRISPR-Cas蛋白是II型CRISPR-Cas蛋白。在一些实施方案中,所述第一RNA结合蛋白包含Cas9多肽或其RNA结合部分。在一些实施方案中,所述CRISPR-Cas蛋白包含天然RNA核酸酶活性。在一些实施方案中,所述天然RNA核酸酶活性被降低或抑制。在一些实施方案中,所述天然RNA核酸酶活性被增加或诱导。在一些实施方案中,所述CRISPR-Cas蛋白包含天然DNA核酸酶活性并且所述天然DNA核酸酶活性被抑制。在一些实施方案中,所述CRISPR-Cas蛋白包含突变。在一些实施方案中,所述CRISPR-Cas蛋白的核酸酶结构域包含所述突变。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的核酸中。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的氨基酸中。在一些实施方案中,所述突变包含取代、插入、缺失、移码、倒位或转座。在一些实施方案中,所述突变包含核酸酶结构域、所述核酸酶结构域内的结合位点、所述核酸酶结构域内的活性位点或所述核酸酶结构域内的至少一个必需氨基酸残基的缺失。
在本公开文本的组合物的一些实施方案中,所述第一RNA结合蛋白包含CRISPR-Cas蛋白。在一些实施方案中,所述CRISPR-Cas蛋白是V型CRISPR-Cas蛋白。在一些实施方案中,所述第一RNA结合蛋白包含Cpf1多肽或其RNA结合部分。在一些实施方案中,所述CRISPR-Cas蛋白包含天然RNA核酸酶活性。在一些实施方案中,所述天然RNA核酸酶活性被降低或抑制。在一些实施方案中,所述天然RNA核酸酶活性被增加或诱导。在一些实施方案中,所述CRISPR-Cas蛋白包含天然DNA核酸酶活性并且所述天然DNA核酸酶活性被抑制。在一些实施方案中,所述CRISPR-Cas蛋白包含突变。在一些实施方案中,所述CRISPR-Cas蛋白的核酸酶结构域包含所述突变。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的核酸中。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的氨基酸中。在一些实施方案中,所述突变包含取代、插入、缺失、移码、倒位或转座。在一些实施方案中,所述突变包含核酸酶结构域、所述核酸酶结构域内的结合位点、所述核酸酶结构域内的活性位点或所述核酸酶结构域内的至少一个必需氨基酸残基的缺失。
在本公开文本的组合物的一些实施方案中,所述第一RNA结合蛋白包含CRISPR-Cas蛋白。在一些实施方案中,所述CRISPR-Cas蛋白是VI型CRISPR-Cas蛋白。在一些实施方案中,所述第一RNA结合蛋白包含Cas13多肽或其RNA结合部分。在一些实施方案中,所述第一RNA结合蛋白包含Cas13d多肽或其RNA结合部分。在一些实施方案中,所述CRISPR-Cas蛋白包含天然RNA核酸酶活性。在一些实施方案中,所述天然RNA核酸酶活性被降低或抑制。在一些实施方案中,所述天然RNA核酸酶活性被增加或诱导。在一些实施方案中,所述CRISPR-Cas蛋白包含天然DNA核酸酶活性并且所述天然DNA核酸酶活性被抑制。在一些实施方案中,所述CRISPR-Cas蛋白包含突变。在一些实施方案中,所述CRISPR-Cas蛋白的核酸酶结构域包含所述突变。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的核酸中。在一些实施方案中,所述突变发生在编码所述CRISPR-Cas蛋白的氨基酸中。在一些实施方案中,所述突变包含取代、插入、缺失、移码、倒位或转座。在一些实施方案中,所述突变包含核酸酶结构域、所述核酸酶结构域内的结合位点、所述核酸酶结构域内的活性位点或所述核酸酶结构域内的至少一个必需氨基酸残基的缺失。
在本公开文本的组合物的一些实施方案中,所述第一RNA结合蛋白包含Pumilio和FBF(PUF)蛋白。在一些实施方案中,所述第一RNA结合蛋白包含基于Pumilio的联合体(PUMBY)蛋白。在一些实施方案中,本公开文本的PUF1蛋白包含以下的氨基酸序列或由其组成:
在一些实施方案中,本公开文本的PUF3蛋白包含以下的氨基酸序列或由其组成:
在一些实施方案中,本公开文本的PUF5蛋白包含以下的氨基酸序列或由其组成:
在本公开文本的组合物的一些实施方案中,所述第一RNA结合蛋白不需要多聚化以用于RNA结合活性。在一些实施方案中,所述第一RNA结合蛋白不是多聚体复合物的单体。在一些实施方案中,多聚体蛋白复合物不包含所述第一RNA结合蛋白。
在本公开文本的组合物的一些实施方案中,所述第一RNA结合蛋白与所述RNA分子内的靶序列选择性结合。在一些实施方案中,所述第一RNA结合蛋白不包含对所述RNA分子内的第二序列的亲和力。在一些实施方案中,所述第一RNA结合蛋白不包含对所述RNA分子内的第二序列的高亲和力或不选择性结合所述第二序列。
在本公开文本的组合物的一些实施方案中,RNA基因组或RNA转录组包含所述RNA分子。
在本公开文本的组合物的一些实施方案中,所述第一RNA结合蛋白包含在2个与1300个之间的氨基酸,包括端点。
在本公开文本的组合物的一些实施方案中,编码所述第一RNA结合蛋白的序列还包含核定位信号(NLS)。在一些实施方案中,编码核定位信号(NLS)的所述序列定位于编码所述第一RNA结合蛋白的序列的3'。在一些实施方案中,所述第一RNA结合蛋白包含在所述蛋白质的C末端的NLS。
在本公开文本的组合物的一些实施方案中,编码所述第一RNA结合蛋白的序列还包含编码第一NLS的第一序列和编码第二NLS的第二序列。在一些实施方案中,编码所述第一NLS或所述第二NLS的序列定位于编码所述第一RNA结合蛋白的序列的3'。在一些实施方案中,所述第一RNA结合蛋白包含在所述蛋白质的C末端的所述第一NLS或所述第二NLS。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含核酸酶结构域或由其组成。在一些实施方案中,所述第二RNA结合蛋白以与RNA缔合的方式结合RNA。在一些实施方案中,所述第二RNA结合蛋白以切割RNA的方式与RNA缔合。
在本公开文本的组合物的一些实施方案中,编码所述第二RNA结合蛋白的序列包含RNA酶或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶1多肽或由其组成。在一些实施方案中,RNA酶1多肽包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGLCKPVNTFVHEPLVDVQNVCFQEKVTCKNGQGNCYKSNSSMHITDCRLTNGSRYPNCAYRTSPKERHIIVACEGSPYVPVHFDASVEDST(SEQ ID NO:20)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶4多肽或由其组成。在一些实施方案中,RNA酶4多肽包含以下序列或由其组成:
QDGMYQRFLRQHVHPEETGGSDRYCDLMMQRRKMTLYHCKRFNTFIHEDIWNIRSICSTTNIQCKNGKMNCHEGVVKVTDCRDTGSSRAPNCRYRAIASTRRVVIACEGNPQVPVHFDG(SEQ ID NO:21)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶6多肽或由其组成。在一些实施方案中,RNA酶6多肽包含以下序列或由其组成:
WPKRLTKAHWFEIQHIQPSPLQCNRAMSGINNYTQHCKHQNTFLHDSFQ
NVAAVCDLLSIVCKNRRHNCHQSSKPVNMTDCRLTSGKYPQCRYSAAAQYKFFIVACDPPQKSDPPYKLVPVHLDSIL(SEQ ID NO:22)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶7多肽或由其组成。在一些实施方案中,RNA酶7多肽包含以下序列或由其组成:
APARAGFCPLLLLLLLGLWVAEIPVSAKPKGMTSSQWFKIQHMQPSPQACNSAMKNINKHTKRCKDLNTFLHEPFSSVAATCQTPKIACKNGDKNCHQSHGPVSLTMCKLTSGKYPNCRYKEKRQNKSYVVACKPPQKKDSQQFHLVPVHLDRVL(SEQ ID NO:23)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶8多肽或由其组成。在一些实施方案中,RNA酶8多肽包含以下序列或由其组成:
TSSQWFKTQHVQPSPQACNSAMSIINKYTERCKDLNTFLHEPFSSVAITCQTPNIACKNSCKNCHQSHGPMSLTMGELTSGKYPNCRYKEKHLNTPYIVACDPPQQGDPGYPLVPVHLDKVV(SEQ ID NO:24)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶2多肽或由其组成。在一些实施方案中,RNA酶2多肽包含以下序列或由其组成:
KPPQFTWAQWFETQHINMTSQQCTNAMQVINNYQRRCKNQNTFLLTTFANVVNVCGNPNMTCPSNKTRKNCHHSGSQVPLIHCNLTTPSPQNISNCRYAQTPANMFYIVACDNRDQRRDPPQYPVVPVHLDRII(SEQ ID NO:25)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶6PL多肽或由其组成。在一些实施方案中,RNA酶6PL多肽包含以下序列或由其组成:
DKRLRDNHEWKKLIMVQHWPETVCEKIQNDCRDPPDYWTIHGLWPDKSEGCNRSWPFNLEEIKKNWMEITDSSLPSPSMGPAPPRWMRSTPRRSTLAEAWNSTGSWTSTGGCALPPAALPSGDLCCRPSLTAGSRGVGVDLTALHQLLHVHYSATGIIPEECSEPTKPFQIILHHDHTEWVQSIGMPIWGTISSSESAIGKNEESQPACAVLSHDS(SEQID NO:26)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶L多肽或由其组成。在一些实施方案中,RNA酶L多肽包含以下序列或由其组成:
AAVEDNHLLIKAVQNEDVDLVQQLLEGGANVNFQEEEGGWTPLHNAVQMSREDIVELLLRHGADPVLRKKNGATPFILAAIAGSVKdLLKLFLSKGADVNECDFYGFTAFMEAAVYGKVKALKFLYKRGANVNLRRKTKEDQERLRKGGATALMDAAEKGHVEVLKILLDEMGADVNACDNMGRNALIHALLSSDDSDVEAITHLLLDHGADVNVRGERGKTPLILAVEKKHLGLVQRLLEQEHIEINDTDSDGKTALLLAVELKLKKIAELLCKRGASTDCGDLVMTARRNYDHSLVKVLLSHGAKEDFHPPAEDWKPQSSHWGAALKDLHRIYRPMIGKLKFFIDEKYKIADTSEGGIYLGFYEKQEVAVKTFCEGSPRAQREVSCLQSSRENSHLVTFYGSESHRGHLFVCVTLCEQTLEACLDVHRGEDVENEEDEFARNVLSSIFKAVQELHLSCGYTHQDLQPQNILIDSKKAAHLADFDKSIKWAGDPQEVKRDLEDLGRLVLYVVKKGSISFEDLKAQSNEEVVQLSPDEETKDLIHRLFHPGEHVRDCLSDLLGHPFFWTWESRYRTLRNVGNESDIKTRKSESEILRLLQPGPSEHSKSFDKWTTKINECVMKKMNKFYEKRGNFYQNTVGDLLKFIRNLGEHIDEEKHKKMKLKIGDPSLYFQKTFPDLVIYVYTKLQNTEYRKHFPQTHSPNKPQCDGAGGASGLASPGC(SEQ ID NO:27)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶T2多肽或由其组成。在一些实施方案中,RNA酶T2多肽包含以下序列或由其组成:
VQHWPETVCEKIQNDCRDPPDYWTIHGLWPDKSEGCNRSWPFNLEEIKDLLPEMRAYWPDVIHSFPNRSRFWKHEWEKHGTCAAQVDALNSQKKYFGRSLELYRELDLNSVLLKLGIKPSINYYQVADFKDALARVYGVIPKIQCLPPSQDEEVQTIGQIELCLTKQDQQLQNCTEPGEQPSPKQEVWLANGAAESRGLRVCEDGPVFYPPPKKTKH(SEQID NO:28)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶11多肽或由其组成。在一些实施方案中,RNA酶11多肽包含以下序列或由其组成:
EASESTMKIIKEEFTDEEMQYDMAKSGQEKQTIEILMNPILLVKNTSLSMSKDDMSSTLLTFRSLHYNDPKGNSSGNDKECCNDMTVWRKVSEANGSCKWSNNFIRSSTEVMRRVHRAPSCKFVQNPGISCCESLELENTVCQFTTGKQFPRCQYHSVTSLEKILTVLTGHSLMSWLVCGSKL(SEQ ID NO:29)。在一些实施方案中,所述第二RNA结合蛋白包含RNA酶T2样多肽或由其组成。在一些实施方案中,RNA酶T2样多肽包含以下序列或由其组成:
XLGGADKRLRDNHEWKKLIMVQHWPETVCEKIQNDCRDPPDYWTIHGLWPDKSEGCNRSWPFNLEEIKDLLPEMRAYWPDVIHSFPNRSRFWKHEWEKHGTCAAQVDALNSQKKYFGRSLELYRELDLNSVLLKLGIKPSINYYQTTEEDLNLDVEPTTEDTAEEVTIHVLLHSALFGEIGPRRW(SEQ ID NO:30)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R))多肽或由其组成。在一些实施方案中,RNA酶1(K41R)多肽包含以下序列或由其组成:KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGRCRPVNTFVHEPLVDVQNVCFQEKVTCKNGQGNCYKSNSSMHITDCRLTNGSRYPNCAYRTSPKERHIIVACEGSPYVPVHFDASVEDST(SEQ ID NO:116)。在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R、D121E))多肽或由其组成。在一些实施方案中,RNA酶1(RNA酶1(K41R、D121E))包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGRCRPVNTFVHEPLVDVQNVCFQEKVTCKNGQGNCYKSNSSMHITDCRLTNGSRYPNCAYRTSPKERHIIVACEGSPYVPVHFEASVEDST(SEQ ID NO:117)。在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R、D121E、H119N))多肽或由其组成。在一些实施方案中,RNA酶1(RNA酶1(K41R、D121E、H119N))多肽包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGRCRPVNTFVHEPLVDVQNVCFQEKVTCKNGQGNCYKSNSSMHITDCRLTNGSRYPNCAYRTSPKERHIIVACEGSPYVPVNFEASVEDST(SEQ ID NO:118)。在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(H119N))多肽或由其组成。在一些实施方案中,RNA酶1(RNA酶1(H119N))多肽包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGRCKPVNTFVHEPLVDVQNVCFQEKVTCKNGQGNCYKSNSSMHITDCRLTNGSRYPNCAYRTSPKERHIIVACEGSPYVPVNFDASVEDST(SEQ ID NO:119)。在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。在一些实施方案中,RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGDCKPVNTFVHEPLVDVQNVCFQEKVTCKDGQGNCYKSNSSMHITDCRLTADSDYPNCAYRTSPKERHIIVACEGSPYVPVNFDASVEDST(SEQ ID NO:120)。在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。在一些实施方案中,RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N、K41R、D121E))多肽包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGDCRPVNTFVHEPLVDVQNVCFQEKVTCKDGQGNCYKSNSSMHITDCRLTADSDYPNCAYRTSPKERHIIVACEGSPYVPVNFEASVEDST(SEQ ID NO:121)。在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。在一些实施方案中,RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D))多肽包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGDCKPVNTFVHEPLVDVQNVCFQEKVTCKDGQGNCYKSNSSMHITDCRLTADSDYPNCAYRTSPKERHIIVACEGSPYVPVHFDASVEDST(SEQ ID NO:122)。
在一些实施方案中,所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N、K41R、D121E))多肽或由其组成,所述多肽包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGDCRPVNTFVHEPLVDVQNVCFQEKVTCKDGQGNCYKSNSSMHITDCRLTADSDYPNCAYRTSPKERHIIVACEGSPYVPVNFEASVEDST(SEQ ID NO:225)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含NOB1多肽或由其组成。在一些实施方案中,NOB1多肽包含以下序列或由其组成:
APVEHVVADAGAFLRHAALQDIGKNIYTIREVVTEIRDKATRRRLAVLPYELRFKEPLPEYVRLVTEFSKKTGDYPSLSATDIQVLALTYQLEAEFVGVSHLKQEPQKVKVSSSIQHPETPLHISGFHLPYKPKPPQETEKGHSACEPENLEFSSFMFWRNPLPNIDHELQELLIDRGEDVPSEEEEEEENGFEDRKDDSDDDGGGWITPSNIKQIQQELEQCDVPEDVRVGCLTTDFAMQNVLLQMGLHVLAVNGMLIREARSYILRCHGCFKTTSDMSRVFCSHCGNKTLKKVSVTV(SEQ ID NO:31)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含内切核酸酶或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含内切核酸酶V(ENDOV)或由其组成。在一些实施方案中,ENDOV多肽包含以下序列或由其组成:
AFSGLQRVGGVDVSFVKGDSVRACASLVVLSFPELEVVYEESRMVSLTAPYVSGFLAFREVPFLLELVQQLREKEPGLMPQVLLVDGNGVLHHRGFGVACHLGVLTDLPCVGVAKKLLQVDGLENNALHKEKIRLLQTRGDSFPLLGDSGTVLGMALRSHDRSTRPLYISVGHRMSLEAAVRLTCCCCRFRIPEPVRQADICSREHIRKS(SEQ ID NO:32)。在一些实施方案中,所述第二RNA结合蛋白包含内切核酸酶G(ENDOG)多肽或由其组成。在一些实施方案中,ENDOG多肽包含以下序列或由其组成:
AELPPVPGGPRGPGELAKYGLPGLAQLKSRESYVLCYDPRTRGALWVVEQLRPERLRGDGDRRECDFREDDSVHAYHRATNADYRGSGFDRGHLAAAANHRWSQKAMDDTFYLSNVAPQVPHLNQNAWNNLEKYSRSLTRSYQNVYVCTGPLFLPRTEADGKSYVKYQVIGKNHVAVPTHFFKVLILEAAGGQIELRTYVMPNAPVDEAIPLERFLVPIESIERASGLLFVPNILARAGSLKAITAGSK(SEQ ID NO:33)。在一些实施方案中,所述第二RNA结合蛋白包含内切核酸酶D1(ENDOD1)多肽或由其组成。在一些实施方案中,ENDOD1多肽包含以下序列或由其组成:
RLVGEEEAGFGECDKFFYAGTPPAGLAADSHVKICQRAEGAERFATLYSTRDRIPVYSAFRAPRPAPGGAEQRWLVEPQIDDPNSNLEEAINEAEAITSVNSLGSKQALNTDYLDSDYQRGQLYPFSLSSDVQVATFTLTNSAPMTQSFQERWYVNLHSLMDRALTPQCGSGEDLYILTGTVPSDYRVKDKVAVPEFVWLAACCAVPGGGWAMGFVKHTRDSDIIEDVMVKDLQKLLPFNPQLFQNNCGETEQDTEKMKKILEVVNQIQDEERMVQSQKSSSPLSSTRSKRSTLLPPEASEGSSSFLGKLMGFIATPFIKLFQLIYYLVVAILKNIVYFLWCVTKQVINGIESCLYRLGSATISYFMAIGEELVSIPWKVLKVVAKVIRALLRILCCLLKAICRVLSIPVRVLVDVATFPVYTMGAIPIVCKDIALGLGGTVSLLFDTAFGTLGGLFQVVFSVCKRIGYKVTFDNSGEL(SEQ ID NO:34)。在一些实施方案中,所述第二RNA结合蛋白包含人瓣状内切核酸酶-1(hFEN1)多肽或由其组成。在一些实施方案中,hFEN1多肽包含以下序列或由其组成:
MGIQGLAKLIADVAPSAIRENDIKSYFGRKVAIDASMSIYQFLIAVRQGGDVLQNEEGETTSHLMGMFYRTIRMMENGIKPVYVFDGKPPQLKSGELAKRSERRAEAEKQLQQAQAAGAEQEVEKFTKRLVKVTKQHNDECKHLLSLMGIPYLDAPSEAEASCAALVKAGKVYAAATEDMDCLTFGSPVLMRHLTASEAKKLPIQEFHLSRILQELGLNQEQFVDLCILLGSDYCESIRGIGPKRAVDLIQKHKSIEEIVRRLDPNKYPVPENWLHKEAHQLFLEPEVLDPESVELKWSEPNEEELIKFMCGEKQFSEERIRSGVKRLSKSRQGSTQGRLDDFFKVTGSLSSAKRKEPEPKGSTKKKAKTGAAGKFKRGK(SEQ ID NO:35)。在一些实施方案中,所述第二RNA结合蛋白包含DNA修复内切核酸酶XPF(ERCC4)多肽或由其组成。在一些实施方案中,ERCC4多肽包含以下序列或由其组成:
MESGQPARRIAMAPLLEYERQLVLELLDTDGLVVCARGLGADRLLYHFLQLHCHPACLVLVLNTQPAEEEYFINQLKIEGVEHLPRRVTNEITSNSRYEVYTQGGVIFATSRILVVDFLTDRIPSDLITGILVYRAHRIIESCQEAFILRLFRQKNKRGFIKAFTDNAVAFDTGFCHVERVMRNLFVRKLYLWPRFHVAVNSFLEQHKPEVVEIHVSMTPTMLAIQTAILDILNACLKELKCHNPSLEVEDLSLENAIGKPFDKTIRHYLDPLWHQLGAKTKSLVQDLKILRTLLQYLSQYDCVTFLNLLESLRATEKAFGQNSGWLFLDSSTSMFINARARVYHLPDAKMSKKEKISEKMEIKEGEGILWG(SEQ ID NO:124)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含内切核酸酶III样蛋白1(NTHL)多肽或由其组成。在一些实施方案中,NTHL多肽包含以下序列或由其组成:
CSPQESGMTALSARMLTRSRSLGPGAGPRGCREEPGPLRRREAAAEARKSHSPVKRPRKAQRLRVAYEGSDSEKGEGAEPLKVPVWEPQDWQQQLVNIRAMRNKKDAPVDHLGTEHCYDSSAPPKVRRYQVLLSLMLSSQTKDQVTAGAMQRLRARGLTVDSILQTDDATLGKLIYPVGFWRSKVKYIKQTSAILQQHYGGDIPASVAELVALPGVGPKMAHLAMAVAWGTVSGIAVDTHVHRIANRLRWTKKATKSPEETRAALEEWLPRELWHEINGLLVGFGQQTCLPVHPRCHACLNQALCPAAQGL(SEQ ID NO:123)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含人斯库拉芬蛋白14(hSLFN14)多肽或由其组成。在一些实施方案中,hSLFN14多肽包含以下序列或由其组成:
ESTHVEFKRFTTKKVIPRIKEMLPHYVSAFANTQGGYVLIGVDDKSKEVVGCKWEKVNPDLLKKEIENCIEKLPTFHFCCEKPKVNFTTKILNVYQKDVLDGYVCVIQVEPFCCVVFAEAPDSWIMKDNSVTRLTAEQWVVMMLDTQSAPPSLVTDYNSCLISSASSARKSPGYPIKVHKFKEALQ(SEQ ID NO:36)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含人β-内酰胺酶样蛋白2(hLACTB2)多肽或由其组成。在一些实施方案中,hLACTB2多肽包含以下序列或由其组成:
TLQGTNTYLVGTGPRRILIDTGEPAIPEYISCLKQALTEFNTAIQEIVVTHWHRDHSGGIGDICKSINNDTTYCIKKLPRNPQREEIIGNGEQQYVYLKDGDVIKTEGATLRVLYTPGHTDDHMALLLEEENAIFSGDCILGEGTTVFEDLYDYMNSLKELLKIKADIIYPGHGPVIHNAEAKIQQYISHRNIREQQILTLFRENFEKSFTVMELVKIIYKNTPENLHEMAKHNLLLHLKKLEKEGKIFSNTDPDKKWKAHL(SEQ ID NO:37)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含无嘌呤/无嘧啶(AP)内切脱氧核糖核酸酶(APEX)多肽或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含无嘌呤/无嘧啶(AP)内切脱氧核糖核酸酶(APEX2)多肽或由其组成。在一些实施方案中,APEX2多肽包含以下序列或由其组成:
MLRVVSWNINGIRRPLQGVANQEPSNCAAVAVGRILDELDADIVCLQETKVTRDALTEPLAIVEGYNSYFSFSRNRSGYSGVATFCKDNATPVAAEEGLSGLFATQNGDVGCYGNMDEFTQEELRALDSEGRALLTQHKIRTWEGKEKTLTLINVYCPHADPGRPERLVFKMRFYRLLQIRAEALLAAGSHVIILGDLNTAHRPIDHWDAVNLECFEEDPGRKWMDSLLSNLGCQSASHVGPFIDSYRCFQPKQEGAFTCWSAVTGARHLNYGSRLDYVLGDRTLVIDTFQASFLLPEVMGSDHCPVGAVLSVSSVPAKQCPPLCTRFLPEFAGTQLKILRFLVPLEQSPVLEQSTLQHNNQTRVQTCQNKAQVRSTRPQPSQVGSSRGQKNLKSYFQPSPSCPQASPDIELPSLPLMSALMTPKTPEEKAVAKVVKGQAKTSEAKDEKELRTSFWKSVLAGPLRTPLCGGHREPCVMRTVKKPGPNLGRRFYMCARPRGPPTDPSSRCNFFLWSRPS(SEQ IDNO:38)。在一些实施方案中,APEX2多肽包含以下序列或由其组成:
MLRVVSWNINGIRRPLQGVANQEPSNCAAVAVGRILDELDADIVCLQETKVTRDALTEPLAIVEGYNSYFSFSRNRSGYSGVATFCKDNATPVAAEEGLSGLFATQNGDVGCYGNMDEFTQEELRALDSEGRALLTQHKIRTWEGKEKTLTLINVYCPHADPGRPERLVFKMRFYRLLQIRAEALLAAGSHVIILGDLNTAHRPIDHWDAVNLECFEEDPGRKWMDSLLSNLGCQSASHVGPFIDSYRCFQPKQEGAFTCWSAVTGARHLNYGSRLDYVLGDRTLVIDTFQASFLLPEVMGSDHCPVGAVLSVSSVPAKQCPPLCTRFLPEFAGTQLKILRFLVPLEQSP(SEQ ID NO:39)。在一些实施方案中,所述第二RNA结合蛋白包含无嘌呤或无嘧啶位点裂解酶(APEX1)多肽或由其组成。在一些实施方案中,APEX1多肽包含以下序列或由其组成:
PKRGKKGAVAEDGDELRTEPEAKKSKTAAKKNDKEAAGEGPALYEDPPDQKTSPSGKPATLKICSWNVDGLRAWIKKKGLDWVKEEAPDILCLQETKCSENKLPAELQELPGLSHQYWSAPSDKEGYSGVGLLSRQCPLKVSYGIGDEEHDQEGRVIVAEFDSFVLVTAYVPNAGRGLVRLEYRQRWDEAFRKFLKGLASRKPLVLCGDLNVAHEEIDLRNPKGNKKNAGFTPQERQGFGELLQAVPLADSFRHLYPNTPYAYTFWTYMMNARSKNVGWRLDYFLLS(SEQ IDNO:125)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含血管生成素(ANG)多肽或由其组成。在一些实施方案中,ANG多肽包含以下序列或由其组成:
QDNSRYTHFLTQHYDAKPQGRDDRYCESIMRRRGLTSPCKDINTFIHGNKRSIKAICENKNGNPHRENLRISKSSFQVTTCKLHGGSPWPPCQYRATAGFRNVVVACENGLPVHLDQSIFRRP(SEQ ID NO:40)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含热反应蛋白12(HRSP12)多肽或由其组成。在一些实施方案中,HRSP12多肽包含以下序列或由其组成:
SSLIRRVISTAKAPGAIGPYSQAVLVDRTIYISGQIGMDPSSGQLVSGGVAEEAKQALKNMGEILKAAGCDFTNVVKTTVLLADINDFNTVNEIYKQYFKSNFPARAAYQVAALPKGSRIEIEAVAIQGPLTTASL(SEQ IDNO:41)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含含锌指CCCH型12A(ZC3H12A)多肽或由其组成。在一些实施方案中,ZC3H12A多肽包含以下序列或由其组成:
GGGTPKAPNLEPPLPEEEKEGSDLRPVVIDGSNVAMSHGNKEVFSCRGILLAVNWFLERGHTDITVFVPSWRKEQPRPDVPITDQHILRELEKKKILVFTPSRRVGGKRVVCYDDRFIVKLAYESDGIVVSNDTYRDLQGERQEWKRFIEERLLMYSFVNDKFMPPDDPLGRHGPSLDNFLRKKPLTLE(SEQ ID NO:42)。
在一些实施方案中,ZC3H12A多肽包含以下序列或由其组成:
SGPCGEKPVLEASPTMSLWEFEDSHSRQGTPRPGQELAAEEASALELQMKVDFFRKLGYSSTEIHSVLQKLGVQADTNTVLGELVKHGTATERERQTSPDPCPQLPLVPRGGGTPKAPNLEPPLPEEEKEGSDLRPVVIDGSNVAMSHGNKEVFSCRGILLAVNWFLERGHTDITVFVPSWRKEQPRPDVPITDQHILRELEKKKILVFTPSRRVGGKRVVCYDDRFIVKLAYESDGIVVSNDTYRDLQGERQEWKRFIEERLLMYSFVNDKFMPPDDPLGRHGPSLDNFLRKKPLTLEHRKQPCPYGRKCTYGIKCRFFHPERPSCPQRSVADELRANALLSPPRAPSKDKNGRRPSPSSQSSSLLTESEQCSLDGKKLGAQASPGSRQEGLTQTYAPSGRSLAPSGGSGSSFGPTDWLPQTLDSLPYVSQDCLDSGIGSLESQMSELWGVRGGGPGEPGPPRAPYTGYSPYGSELPATAAFSAFGRAMGAGHFSVPADYPPAPPAFPPREYWSEPYPLPPPTSVLQEPPVQSPGAGRSPWGRAGSLAKEQASVYTKLCGVFPPHLVEAVMGRFPQLLDPQQLAAEILSYKSQHPSE(SEQ ID NO:43)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含反应性中间亚胺脱氨酶A(RIDA)多肽或由其组成。在一些实施方案中,RIDA多肽包含以下序列或由其组成:
SSLIRRVISTAKAPGAIGPYSQAVLVDRTIYISGQIGMDPSSGQLVSGGVAEEAKQALKNMGEILKAAGCDFTNVVKTTVLLADINDFNTVNEIYKQYFKSNFPARAAYQVAALPKGSRIEIEAVAIQGPLTTASL(SEQ IDNO:44)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含磷脂酶D家族成员6(PDL6)多肽或由其组成。在一些实施方案中,PDL6多肽包含以下序列或由其组成:
EALFFPSQVTCTEALLRAPGAELAELPEGCPCGLPHGESALSRLLRALLAARASLDLCLFAFSSPQLGRAVQLLHQRGVRVRVVTDCDYMALNGSQIGLLRKAGIQVRHDQDPGYMHHKFAIVDKRVLITGSLNWTTQAIQNNRENVLITEDDEYVRLFLEEFERIWEQFNPTKYTFFPPKKSHGSCAPPVSRAGGRLLSWHRTCGTSSESQT(SEQ IDNO:126)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含线粒体核糖核酸酶P催化亚基(KIAA0391)多肽或由其组成。在一些实施方案中,KIAA0391多肽包含以下序列或由其组成:
KARYKTLEPRGYSLLIRGLIHSDRWREALLLLEDIKKVITPSKKNYNDCIQGALLHQDVNTAWNLYQELLGHDIVPMLETLKAFFDFGKDIKDDNYSNKLLDILSYLRNNQLYPGESFAHSIKTWFESVPGKQWKGQFTTVRKSGQCSGCGKTIESIQLSPEEYECLKGKIMRDVIDGGDQYRKTTPQELKRFENFIKSRPPFDVVIDGLNVAKMFPKVRESQLLLNVVSQLAKRNLRLLVLGRKHMLRRSSQWSRDEMEEVQKQASCFFADDISEDDPFLLYATLHSGNHCRFITRDLMRDHKACLPDAKTQRLFFKWQQGHQLAIVNRFPGSKLTFQRILSYDTVVQTTGDSWHIPYDEDLVERCSCEVPTKWLCLHQKT(SEQ ID NO:127)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含阿尔古蛋白2(AGO2)多肽或由其组成。
在本公开文本的组合物的一些实施方案中,AGO2多肽包含以下序列或由其组成:
SVEPMFRHLKNTYAGLQLVVVILPGKTPVYAEVKRVGDTVLGMATQCVQMKNVQRTTPQTLSNLCLKINVKLGGVNNILLPQGRPPVFQQPVIFLGADVTHPPAGDGKKPSIAAVVGSMDAHPNRYCATVRVQQHRQEIIQDLAAMVRELLIQFYKSTRFKPTRIIFYRDGVSEGQFQQVLHHELLAIREACIKLEKDYQPGITFIVVQKRHHTRLFCTDKNERVGKSGNIPAGTTVDTKITHPTEFDFYLCSHAGIQGTSRPSHYHVLWDDNRFSSDELQILTYQLCHTYVRCTRSVSIPAPAYYAHLVAFRARYHLVDKEHDSAEGSHTSGQSNGRDHQALAKAVQVHQDTLRTMYFA(SEQ ID NO:128)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含线粒体核酸酶EXOG(EXOG)多肽或由其组成。在一些实施方案中,EXOG多肽包含以下序列或由其组成:
QGAEGALTGKQPDGSAEKAVLEQFGFPLTGTEARCYTNHALSYDQAKRVPRWVLEHISKSKIMGDADRKHCKFKPDPNIPPTFSAFNEDYVGSGWSRGHMAPAGNNKFSSKAMAETFYLSNIVPQDFDNNSGYWNRIEMYCRELTERFEDVWVVSGPLTLPQTRGDGKKIVSYQVIGEDNVAVPSHLYKVILARRSSVSTEPLALGAFVVPNEAIGFQPQLTEFQVSLQDLEKLSGLVFFPHLDRTSDIRNICSVDTCKLLDFQEFTLYLSTRKIEGARSVLRLEKIMENLKNAEIEPDDYFMSRYEKKLEELKAKEQSGTQIRKPS(SEQ ID NO:129)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含含锌指CCCH型12D(ZC3H12D)多肽或由其组成。在一些实施方案中,ZC3H12D多肽包含以下序列或由其组成:
EHPSKMEFFQKLGYDREDVLRVLGKLGEGALVNDVLQELIRTGSRPGALEHPAAPRLVPRGSCGVPDSAQRGPGTALEEDFRTLASSLRPIVIDGSNVAMSHGNKETFSCRGIKLAVDWFRDRGHTYIKVFVPSWRKDPPRADTPIREQHVLAELERQAVLVYTPSRKVHGKRLVCYDDRYIVKVAYEQDGVIVSNDNYRDLQSENPEWKWFIEQRLLMFSFVNDRFMPPDDPLGRHGPSLSNFLSRKPKPPEPSWQHCPYGKKCTYGIKCKFYHPERPHHAQLAVADELRAKTGARPGAGAEEQRPPRAPGGSAGARAAPREPFAHSLPPARGSPDLAALRGSFSRLAFSDDLGPLGPPLPVPACSLTPRLGGPDWVSAGGRVPGPLSLPSPESQFSPGDLPPPPGLQLQPRGEHRPRDLHGDLLSPRRPPDDPWARPPRSDRFPGRSVWAEPAWGDGATGGLSVYATEDDEGDARARARIALYSVFPRDQVDRVMAAFPELSDLARLILLVQRCQSAGAPLGKP(SEQ ID NO:130)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含内质网核信号转导蛋白2(ERN2)多肽或由其组成。在一些实施方案中,ERN2多肽包含以下序列或由其组成:
RQQQPQVVEKQQETPLAPADFAHISQDAQSLHSGASRRSQKRLQSPSKQAQPLDDPEAEQLTVVGKISFNPKDVLGRGAGGTFVFRGQFEGRAVAVKRLLRECFGLVRREVQLLQESDRHPNVLRYFCTERGPQFHYIALELCRASLQEYVENPDLDRGGLEPEVVLQQLMSGLAHLHSLHIVHRDLKPGNILITGPDSQGLGRVVLSDFGLCKKLPAGRCSFSLHSGIPGTEGWMAPELLQLLPPDSPTSAVDIFSAGCVFYYVLSGGSHPFGDSLYRQANILTGAPCLAHLEEEVHDKVVARDLVGAMLSPLPQPRPSAPQVLAHPFFWSRAKQLQFFQDVSDWLEKESEQEPLVRALEAGGCAVVRDNWHEHISMPLQTDLRKFRSYKGTSVRDLLRAVRNKKHHYRELPVEVRQALGQVPDGFVQYFTNRFPRLLLHTHRAMRSCASESLFLPYYPPDSEARRPCPGATGR(SEQ ID NO:131)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含回力球mRNA监督和核糖体挽救因子(PELO)多肽或由其组成。在一些实施方案中,PELO多肽包含以下序列或由其组成:
KLVRKNIEKDNAGQVTLVPEEPEDMWHTYNLVQVGDSLRASTIRKVQTESSTGSVGSNRVRTTLTLCVEAIDFDSQACQLRVKGTNIQENEYVKMGAYHTIELEPNRQFTLAKKQWDSVVLERIEQACDPAWSADVAAVVMQEGLAHICLVTPSMTLTRAKVEVNIPRKRKGNCSQHDRALERFYEQVVQAIQRHIHFDVVKCILVASPGFVREQFCDYLFQQAVKTDNKLLLENRSKFLQVHASSGHKYSLKEALCDPTVASRLSDTKAAGEVKALDDFYKMLQHEPDRAFYGLKQVEKANEAMAIDTLLISDELFRHQDVATRSRYVRLVDSVKENAGTVRIFSSLHVSGEQLSQLTGVAAILRFPVPELSDQEGDSSSEED(SEQ ID NO:132)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含YBEY金属肽酶(YBEY)多肽或由其组成。在一些实施方案中,YBEY多肽包含以下序列或由其组成:
SLVIRNLQRVIPIRRAPLRSKIEIVRRILGVQKFDLGIICVDNKNIQHINRIYRDRNVPTDVLSFPFHEHLKAGEFPQPDFPDDYNLGDIFLGVEYIFHQCKENEDYNDVLTVTATHGLCHLLGFTHGTEAEWQQMFQKEKAVLDELGRRTGTRLQPLTRGLFGGS(SEQ ID NO:133)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含剪切和多聚腺苷酸化特异性因子4样蛋白(CPSF4L)多肽或由其组成。在一些实施方案中,CPSF4L包含以下序列或由其组成:
QEVIAGLERFTFAFEKDVEMQKGTGLLPFQGMDKSASAVCNFFTKGLCEKGKLCPFRHDRGEKMVVCKHWLRGLCKKGDHCKFLHQYDLTRMPECYFYSKFGDCSNKECSFLHVKPAFKSQDCPWYDQGFCKDGPLCKYRHVPRIMCLNYLVGFCPEGPKCQFAQKIREFKLLPGSKI(SEQ ID NO:134)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含hCG_2002731多肽或由其组成。在一些实施方案中,hCG_2002731多肽包含以下序列或由其组成:
KLVRKNIEKDNAGQVTLVPEEPEDMWHTYNLVQVGDSLRASTIRKVQTESSTGSVGSNRVRTTLTLCVEAIDFDSQACQLRVKGTNIQENEYVKMGAYHTIELEPNRQFTLAKKQWDSVVLERIEQACDPAWSADVAAVVMQEGLAHICLVTPSMTLTRAKVEVNIPRKRKGNCSQHDRALERFYEQVVQAIQRHIHFDVVKCILVASPGFVREQFCDYMFQQAVKTDNKLLLENRSKFLQVHASSGHKYSLKEALCDPTVASRLSDTKAAGEVKALDDFYKMLQHEPDRAFYGLKQVEKANEAMAIDTLLISDELFRHQDVATRSRYVRLVDSVKENAGTVRIFSSLHVSGEQLSQLTGVAAILRFPVPELSDQEGDSSSEED(SEQ ID NO:135)。在一些实施方案中,hCG_2002731多肽包含以下序列或由其组成:
DPAWSADVAAVVMQEGLAHICLVTPSMTLTRAKVEVNIPRKRKGNCSQHDRALERFYEQVVQAIQRHIHFDVVKCILVASPGFVREQFCDYMFQQAVKTDNKLLLENRSKFLQVHASSGHKYSLKEALCDPTVASRLSDTKAAGEVKALDDFYKMLQHEPDRAFYGLKQVEKANEAMAIDTLLISDELFRHQDVATRSRYVRLVDSVKENAGTVRIFSSLHVSGEQLSQLTGVAAILRFPVPELSDQEGDSSSEED(SEQ ID NO:136)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含切除修复交叉互补组1(ERCC1)多肽或由其组成。在一些实施方案中,ERCC1多肽包含以下序列或由其组成:
MDPGKDKEGVPQPSGPPARKKFVIPLDEDEVPPGVRGNPVLKFVRNVPWEFGDVIPDYVLGQSTCALFLSLRYHNLHPDYIHGRLQSLGKNFALRVLLVQVDVKDPQQALKELAKMCILADCTLILAWSPEEAGRYLETYKAYEQKPADLLMEKLEQDFVSRVTECLTTVKSVNKTDSQTLLTTFGSLEQLIAASREDLALCPGLGPQK(SEQ ID NO:137)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含ras相关C3肉毒杆菌毒素底物1亚型(RAC1)多肽或由其组成。在一些实施方案中,RAC1多肽包含以下序列或由其组成:
KESRAKKFQRQHMDSDSSPSSSSTYCNQMMRRRNMTQGRCKPVNTFVHEPLVDVQNVCFQEKVTCKNGQGNCYKSNSSMHITDCRLTNGSRYPNCAYRTSPKERHIIVACEGSPYVPVHFDASVEDST(SEQ ID NO:138)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含核糖核酸酶A A1(RAA1)多肽或由其组成。在一些实施方案中,RAA1多肽包含以下序列或由其组成:
QDNSRYTHFLTQHYDAKPQGRDDRYCESIMRRRGLTSPCKDINTFIHGNKRSIKAICENKNGNPHRENLRISKSSFQVTTCKLHGGSPWPPCQYRATAGFRNVVVACENGLPVHLDQSIFRRP(SEQ ID NO:139)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含Ras相关蛋白(RAB1)多肽或由其组成。在一些实施方案中,RAB1多肽包含以下序列或由其组成:
GLGLVQPSYGQDGMYQRFLRQHVHPEETGGSDRYCNLMMQRRKMTLYHCKRFNTFIHEDIWNIRSICSTTNIQCKNGKMNCHEGVVKVTDCRDTGSSRAPNCRYRAIASTRRVVIACEGNPQVPVHFDG(SEQ ID NO:140)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含DNA复制解旋酶/核酸酶2(DNA2)多肽或由其组成。在一些实施方案中,DNA2多肽包含以下序列或由其组成:
XSAVDNILLKLAKFKIGFLRLGQIQKVHPAIQQFTEQEICRSKSIKSLALLEELYNSQLIVATTCMGINHPIFSRKIFDFCIVDEASQISQPICLGPLFFSRRFVLVGDHQQLPPLVLNREARALGMSESLFKRLEQNKSAVVQLTVQYRMNSKIMSLSNKLTYEGKLECGSDKVANAVINLRHFKDVKLELEFYADYSDNPWLMGVFEPNNPVCFLNTDKVPAPEQVEKGGVSNVTEAKLIVFLTSIFVKAGCSPSDIGIIAPYRQQLKIINDLLARSIGMVEVNTVDKYQGRDKSIVLVSFVRSNKDGTVGELLKDWRRLNVAITRAKHKLILLGCVPSLNCYPPLEKLLNHLNSEKLISFFFCIWSHLIALL(SEQ ID NO:141)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含FLJ35220多肽或由其组成。在一些实施方案中,FLJ35220多肽包含以下序列或由其组成:
MALRSHDRSTRPLYISVGHRMSLEAAVRLTCCCCRFRIPEPVRQADICSREHIRKSLGLPGPPTPRSPKAQRPVACPKGDSGESSALC(SEQ ID NO:142)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含FLJ13173多肽或由其组成。在一些实施方案中,FLJ13173多肽包含以下序列或由其组成:
CYTNHALSYDQAKRVPRWVLEHISKSKIMGDADRKHCKFKPDPNIPPTFSAFNEDYVGSGWSRGHMAPAGNNKFSSKAMAETFYLSNIVPQDFDNNSGYWNRIEMYCRELTERFEDVWVVSGPLTLPQTRGDGKKIVSYQVIGEDNVAVPSHLYKVILARRSSVSTEPLALGAFVVPNEAIGFQPQLTEFQVSLQDLEKLSGLVFFPHLDRT(SEQ IDNO:143)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含特诺伊林跨膜蛋白(TENM)多肽或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含特诺伊林跨膜蛋白1(TENM1)多肽或由其组成。在一些实施方案中,TENM1多肽包含以下序列或由其组成:
VTVSQMTSVLNGKTRRFADIQLQHGALCFNIRYGTTVEEEKNHVLEIARQRAVAQAWTKEQRRLQEGEEGIRAWTEGEKQQLLSTGRVQGYDGYFVLSVEQYLELSDSANNIHFMRQSEIGRR(SEQ ID NO:144)。在一些实施方案中,所述第二RNA结合蛋白包含特诺伊林跨膜蛋白2(TENM2)多肽或由其组成。
在一些实施方案中,TENM2多肽包含以下序列或由其组成:
TVSQPTLLVNGKTRRFTNIEFQYSTLLLSIRYGLTPDTLDEEKARVLDQARQRALGTAWAKEQQKARDGREGSRLWTEGEKQQLLSTGRVQGYEGYYVLPVEQYPELADSSSNIQFLRQNEMGKR(SEQ ID NO:145)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含核糖核酸酶κ(RNA酶K)多肽或由其组成。在一些实施方案中,RNA酶K多肽包含以下序列或由其组成:
MGWLRPGPRPLCPPARASWAFSHRFPSPLAPRRSPTPFFMASLLCCGPKLAACGIVLSAWGVIMLIMLGIFFNVHSAVLIEDVPFTEKDFENGPQNIYNLYEQVSYNCFIAAGLYLLLGGFSFCQVRLNKRKEYMVR(SEQ IDNO:204)。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含转录激活因子样效应物核酸酶(TALEN)多肽或所述多肽的核酸酶结构域或由其组成。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含锌指核酸酶多肽或所述多肽的核酸酶结构域或由其组成。在一些实施方案中,所述第二RNA结合蛋白包含ZNF638多肽或所述多肽的核酸酶结构域或由其组成。
在本公开文本的组合物的一些实施方案中,所述第二RNA结合蛋白包含从人SMG6蛋白衍生的PIN结构域或由其组成,所述人SMG6蛋白通常也称为端粒酶结合蛋白EST1A亚型3,NCBI参考序列:NP_001243756.1。在一些实施方案中,来自hSMG6的PIN以Cas融合蛋白的形式在本文中使用并且作为内部对照。
指导RNA
术语指导RNA(gRNA)与单一指导RNA(sgRNA)在整个本公开文本中可互换使用。
本公开文本的指导RNA(gRNA)可以包含间隔子序列和支架序列。在一些实施方案中,指导RNA是单一指导RNA(sgRNA),其包含连续间隔子序列和支架序列。在一些实施方案中,间隔子序列和支架序列是连续的。在一些实施方案中,支架序列包含“同向重复”(DR)序列。DR序列是指CRISPR基因座(天然存在于细菌基因组或质粒中)中的重复性序列,其中散布有间隔子序列。众所周知,如果相关CRISPR基因座的序列是已知的,则将能够推断相应Cas蛋白的DR序列。在一些实施方案中,间隔子序列和支架序列是不连续的。在一些实施方案中,编码本公开文本的指导RNA的序列包含由接头序列隔开的间隔子序列和支架序列或由其组成。在一些实施方案中,接头序列可以包含1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50个或之间的任何数量的核苷酸或由其组成。在一些实施方案中,接头序列可以包含至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50个或之间的任何数量的核苷酸。
本公开文本的指导RNA(gRNA)可以包含非天然存在的核苷酸。在一些实施方案中,本公开文本的指导RNA或编码所述指导RNA的序列包含修饰的或合成的RNA核苷酸或由其组成。示例性的修饰的RNA核苷酸包括但不限于假尿苷(Ψ)、二氢尿苷(D)、肌苷(I)、和7-甲基鸟苷(m7G)、次黄嘌呤、黄嘌呤、黄苷、7-甲基鸟嘌呤、5,6-二氢尿嘧啶、5-甲基胞嘧啶、5-甲基胞苷、5-羟甲基胞嘧啶、异鸟嘌呤和异胞嘧啶。
本公开文本的指导RNA(gRNA)可以结合靶序列内的修饰的RNA。在靶序列内,本公开文本的指导RNA(gRNA)可以结合修饰的RNA。示例性的表观遗传或转录后修饰的RNA包括但不限于2'-O-甲基化(2'-OMe)(2'-O-甲基化发生在核糖部分的游离2'-OH的氧上)、N6-甲基腺苷(m6A)和5-甲基胞嘧啶(m5C)。
在本公开文本的组合物的一些实施方案中,本公开文本的指导RNA包含编码非编码C/D盒核仁小RNA(snoRNA)序列的至少一个序列。在一些实施方案中,snoRNA序列包含与靶RNA互补的至少一个序列,其中所述RNA分子的靶序列包含至少一个2'-OMe。在一些实施方案中,snoRNA序列包含与靶RNA互补的至少一个序列,其中与靶RNA互补的所述至少一个序列包含盒C基序(RUGAUGA)和盒D基序(CUGA)。
本公开文本的间隔子序列与RNA分子的靶序列结合。本公开文本的间隔子序列可以包含CRISPR RNA(crRNA)。本公开文本的间隔子序列包含与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列或由其组成。在与RNA分子的靶序列结合后,间隔子序列可以将支架序列和融合蛋白中的一种或多种指导至所述RNA分子。在一些实施方案中,与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列与所述靶序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96、97%、98%、99%或之间的任何百分比的同一性。在一些实施方案中,与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列与所述靶序列具有100%同一性。
本公开文本的支架序列结合本公开文本的第一RNA结合多肽。本公开文本的支架序列可以包含反式作用RNA(tracrRNA)。本公开文本的支架序列包含与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列或由其组成。在与RNA分子的靶序列结合后,支架序列可以将融合蛋白指导至所述RNA分子。在一些实施方案中,与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列与所述靶序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96、97%、98%、99%或之间的任何百分比的同一性。在一些实施方案中,与RNA分子的靶序列具有足够互补性以与所述靶序列选择性结合的序列与所述靶序列具有100%同一性。可替代地,或另外地,在一些实施方案中,本公开文本的支架序列包含与本公开文本的融合蛋白的第一RNA结合蛋白或第二RNA结合蛋白结合的序列或由其组成。在一些实施方案中,本公开文本的支架序列包含二级结构或三级结构。示例性二级结构包括但不限于螺旋、茎环、凸起、四环和假结。示例性三级结构包括但不限于螺旋的A形式、螺旋的B形式和螺旋的Z形式。示例性三级结构包括但不限于扭曲的或螺旋化的茎环。示例性三级结构包括但不限于扭曲的或螺旋化的假结。在一些实施方案中,本公开文本的支架序列包含至少一种二级结构或至少一种三级结构。在一些实施方案中,本公开文本的支架序列包含一种或多种二级结构或者一种或多种三级结构。
在本公开文本的组合物的一些实施方案中,指导RNA或其部分与本公开文本的RNA分子中的四环基序选择性结合。在一些实施方案中,RNA分子的靶序列包含四环基序。在一些实施方案中,四环基序是“GRNA”基序,所述基序包含GAAA、GUGA、GCAA或GAGA的序列中的一种或多种或由其组成。
在本公开文本的组合物的一些实施方案中,与RNA分子的靶序列结合的指导RNA或其部分与所述RNA分子的靶序列杂交。在一些实施方案中,与第一RNA结合蛋白或与第二RNA结合蛋白结合的指导RNA或其部分与第一RNA结合蛋白或与第二RNA结合蛋白共价结合。在一些实施方案中,与第一RNA结合蛋白或与第二RNA结合蛋白结合的指导RNA或其部分与第一RNA结合蛋白或与第二RNA结合蛋白非共价结合。
在本公开文本的组合物的一些实施方案中,指导RNA或其部分包含在10个与100个之间的核苷酸(包括端点)或由所述核苷酸组成。在一些实施方案中,本公开文本的间隔子序列包含在10个与30个之间的核苷酸(包括端点)或由其组成。在一些实施方案中,本公开文本的支架序列包含15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸或由其组成。在一些实施方案中,本公开文本的间隔子序列包含20个核苷酸或由其组成。在一些实施方案中,本公开文本的间隔子序列包含21个核苷酸或由其组成。在一些实施方案中,本公开文本的支架序列包含在10个与100个之间的核苷酸(包括端点)或由其组成。在一些实施方案中,本公开文本的支架序列包含30、35、40、45、50、55、60、65、70、76、80、87、90、95、100个或之间的任何数量的核苷酸或由其组成。在一些实施方案中,本公开文本的支架序列包含在85个与95个之间的核苷酸(包括端点)或由其组成。在一些实施方案中,本公开文本的支架序列包含85个核苷酸或由其组成。在一些实施方案中,本公开文本的支架序列包含90个核苷酸或由其组成。在一些实施方案中,本公开文本的支架序列包含93个核苷酸或由其组成。
在本公开文本的组合物的一些实施方案中,指导RNA或其部分不包含核定位序列(NLS)。
在本公开文本的组合物的一些实施方案中,指导RNA或其部分不包含与原间隔子相邻基序(PAM)互补的序列。
本公开文本的治疗或药物组合物不包含PAMmer寡核苷酸。在其他实施方案中,任选地,非治疗或非药物组合物可以包含PAMmer寡核苷酸。术语“PAMmer”是指以下寡核苷酸,其包含能够与指导核苷酸序列可编程的RNA结合蛋白相互作用的PAM序列。PAMmer的非限制性例子描述于通过引用并入本文的O'Connell等人Nature 516,第263-266页(2014)中。PAM序列是指包含约2至约10个核苷酸的原间隔子相邻基序。PAM序列对与其相互作用的指导核苷酸序列可编程的RNA结合蛋白具有特异性,并且是本领域中已知的。例如,酿脓链球菌(Streptococcus pyogenes)PAM具有序列5'-NGG-3',其中“N”是任何核碱基,之后有两个鸟嘌呤(“G”)核碱基。新凶手弗朗西丝菌(Francisella novicida)的Cas9识别规范PAM序列5'-NGG-3',但是已经被工程化以识别PAM 5'-YG-3'(其中“Y”是嘧啶),从而添加至可能的Cas9靶标的范围内。新凶手弗朗西丝菌的Cpf1核酸酶识别PAM 5'-TTTN-3'或5'-YTN-3'。
在本公开文本的组合物的一些实施方案中,指导RNA或其部分包含与原间隔子侧翼序列(PFS)互补的序列。在一些实施方案中,包括以下那些实施方案:其中指导RNA或其部分包含与PFS互补的序列,第一RNA结合蛋白可以包含从Cas13蛋白分离或衍生的序列。在一些实施方案中,包括以下那些实施方案:其中指导RNA或其部分包含与PFS互补的序列,第一RNA结合蛋白可以包含编码Cas13蛋白或其RNA结合部分的序列。在一些实施方案中,所述指导RNA或其部分不包含与PFS互补的序列。
在本公开文本的组合物的一些实施方案中,本公开文本的指导RNA序列包含用于驱动指导RNA的表达的启动子。在一些实施方案中,包含本公开文本的指导RNA序列的载体包含用于驱动指导RNA的表达的启动子。在一些实施方案中,所述启动子是组成型启动子。在一些实施方案中,启动子是组织特异性和/或细胞类型特异性启动子。在一些实施方案中,启动子诱导型启动子。在一些实施方案中,启动子是杂合启动子或重组启动子。在一些实施方案中,启动子是能够在哺乳动物中驱动表达的启动子。在一些实施方案中,启动子是能够在人细胞中表达的启动子。在一些实施方案中,启动子是能够表达指导RNA序列并且将表达限制于细胞核的启动子。在一些实施方案中,启动子是人RNA聚合酶启动子或从人RNA聚合酶启动子分离或衍生的启动子序列。在一些实施方案中,启动子是U6启动子或从编码U6启动子的序列分离或衍生的序列。在一些实施方案中,启动子是人tRNA启动子或从人tRNA启动子的序列分离或衍生的启动子序列。在一些实施方案中,启动子是人缬氨酸tRNA启动子或从人缬氨酸tRNA启动子分离或衍生的启动子序列。
在本公开文本的组合物的一些实施方案中,启动子还包含调节元件。在一些实施方案中,包含启动子的载体还包含调节元件。在一些实施方案中,调节元件增强指导RNA的表达。示例性调节元件包括但不限于增强子元件、内含子、外显子或其组合。
在本公开文本的组合物的一些实施方案中,本公开文本的载体包含指导RNA序列、用于驱动指导RNA的表达的启动子和用于增强指导RNA的表达的调节元件中的一种或多种。在本公开文本的组合物的一些实施方案中,所述载体还包含编码本公开文本的融合蛋白的核酸序列。
融合蛋白
本公开文本的融合蛋白包含第一RNA结合蛋白和第二RNA结合蛋白。在一些实施方案中,沿着编码融合蛋白的序列,编码第一RNA结合蛋白的序列定位于编码第二RNA结合蛋白的序列的5'。在一些实施方案中,沿着编码融合蛋白的序列,编码第一RNA结合蛋白的序列定位于编码第二RNA结合蛋白的序列的3'。
在本公开文本的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从蛋白质分离或衍生的序列,所述蛋白质能够结合RNA分子。在一些实施方案中,编码第一RNA结合蛋白的序列包含从蛋白质分离或衍生的序列,所述蛋白质能够选择性结合RNA分子,并且不结合DNA分子、哺乳动物DNA分子或任何DNA分子。在一些实施方案中,编码第一RNA结合蛋白的序列包含从蛋白质分离或衍生的序列,所述蛋白质能够结合RNA分子,并且诱导所述RNA分子中的断裂。在一些实施方案中,编码第一RNA结合蛋白的序列包含从蛋白质分离或衍生的序列,所述蛋白质能够结合RNA分子,诱导所述RNA分子中的断裂,并且不结合DNA分子、哺乳动物DNA分子或任何DNA分子。在一些实施方案中,编码第一RNA结合蛋白的序列包含从蛋白质分离或衍生的序列,所述蛋白质能够结合RNA分子,诱导所述RNA分子中的断裂,并且既不结合DNA分子、哺乳动物DNA分子或任何DNA分子,也不诱导所述DNA分子中的断裂。
在本公开文本的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从没有DNA核酸酶活性的蛋白质分离或衍生的序列。
在本公开文本的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从具有DNA核酸酶活性的蛋白质分离或衍生的序列,其中在将本公开文本的组合物与RNA分子接触或引入本公开文本的细胞中或受试者体内时,所述DNA核酸酶活性不诱导DNA分子、哺乳动物DNA分子或任何DNA分子中的断裂。
在本公开文本的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从具有DNA核酸酶活性的蛋白质分离或衍生的序列,其中所述DNA核酸酶活性是失活的,并且其中在将本公开文本的组合物与RNA分子接触或引入本公开文本的细胞中或受试者体内时,所述DNA核酸酶活性不诱导DNA分子、哺乳动物DNA分子或任何DNA分子中的断裂。在一些实施方案中,编码第一RNA结合蛋白的序列包含使DNA核酸酶活性失活或降低至以下水平的突变,在所述水平下,在将本公开文本的组合物与RNA分子接触或引入本公开文本的细胞中或受试者体内时,所述DNA核酸酶活性不诱导DNA分子、哺乳动物DNA分子或任何DNA分子中的断裂。在一些实施方案中,编码第一RNA结合蛋白的序列包含使DNA核酸酶活性失活或降低的突变,并且所述突变包含对编码第一RNA结合蛋白或其核酸酶结构域的核酸序列或氨基酸序列的取代、倒位、转座、插入、缺失或其任何组合中的一种或多种。
在本公开文本的组合物的一些实施方案中,编码本文公开的RNA指导的融合蛋白的第一RNA结合蛋白的序列包含从CRISPR Cas蛋白分离或衍生的序列。在一些实施方案中,所述CRISPR Cas蛋白包含II型CRISPR Cas蛋白。在一些实施方案中,所述II型CRISPR Cas蛋白包含Cas9蛋白。本公开文本的示例性Cas9蛋白可以从任何物种分离或衍生,所述物种包括但不限于细菌或古菌。本公开文本的示例性Cas9蛋白可以从任何物种分离或衍生,所述物种包括但不限于酿脓链球菌、地中海富盐菌(Haloferax mediteranii)、结核分枝杆菌(Mycobacterium tuberculosis)、土拉热弗朗西丝菌新凶手亚种(Francisellatularensis subsp.novicida)、多杀巴斯德菌(Pasteurella multocida)、脑膜炎奈瑟球菌(Neisseria meningitidis)、空肠弯曲杆菌(Campylobacter jejune)、嗜热链球菌(Streptococcus thermophilus)、红嘴鸥弯曲杆菌CF89-12(Campylobacter lari CF89-12)、鸡毒支原体F株(Mycoplasma gallisepticum str.F)、卤水硝酸盐裂解菌DSM 16511株(Nitratifractor salsuginis str.DSM 16511)、食清洁剂细小棒菌(Parvibaculumlavamentivorans)、肠道罗斯拜瑞氏菌(Roseburia intestinalis)、灰色奈瑟球菌(Neisseria cinerea)、重氮营养葡糖酸醋杆菌(Gluconacetobacter diazotrophicus)、固氮螺菌(Azospirillum)B510、球状螺旋菌巴迪株(Sphaerochaeta globus str.Buddy)、柱状黄杆菌(Flavobacterium columnare)、塔夫河栖河菌(Fluviicola taffensis)、嗜粪拟杆菌(Bacteroides coprophilus)、运动支原体(Mycoplasma mobile)、香肠乳杆菌(Lactobacillus farciminis)、巴氏链球菌(Streptococcus pasteurianus)、约氏乳杆菌(Lactobacillus johnsonii)、伪中间型葡萄球菌(Staphylococcus pseudintermedius)、龈沟产线菌(Filifactor alocis)、齿垢密螺旋体(Treponema denticola)、嗜肺军团菌巴黎株(Legionella pneumophila str.Paris)、华德萨特氏菌(Sutterellawadsworthensis)、白喉棒状杆菌(Corynebacter diphtherias)、金黄色葡萄球菌(Streptococcus aureus)和新凶手弗朗西丝菌。
本公开文本的示例性的野生型酿脓链球菌Cas9蛋白可以包含以下氨基酸序列或由其组成:
核酸酶失活的酿脓链球菌Cas9蛋白可以包含丙氨酸(A)取代位置10的天冬氨酸(D)以及丙氨酸(A)取代位置840的组氨酸(H)。本公开文本的示例性的核酸酶失活的酿脓链球菌Cas9蛋白可以包含以下氨基酸序列或由其组成(D10A和H840A加粗并加下划线):
核酸酶失活的酿脓链球菌Cas9蛋白可以包含RuvC核酸酶结构域或其部分、HNH结构域、DNA酶活性位点、包含DNA酶活性位点的ββα-金属折叠或其部分或者其任何组合的缺失。
其他示例性Cas9蛋白或其部分可以包含以下氨基酸序列或由所述氨基酸序列组成。
在一些实施方案中,所述Cas9蛋白可以是酿脓链球菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(SEQ ID NO:149)
在一些实施方案中,所述Cas9蛋白可以是金黄色葡萄球菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG(SEQID NO:150)
在一些实施方案中,所述Cas9蛋白可以是嗜热链球菌CRISPR1Cas9,并且可以包含以下氨基酸序列或由其组成:
MSDLVLGLDIGIGSVGVGILNKVTGEIIHKNSRIFPAAQAENNLVRRTNRQGRRLARRKKHRRVRLNRLFEESGLITDFTKISINLNPYQLRVKGLTDELSNEELFIALKNMVKHRGISYLDDASDDGNSSVGDYAQIVKENSKQLETKTPGQIQLERYQTYGQLRGDFTVEKDGKKHRLINVFPTSAYRSEALRILQTQQEFNPQITDEFINRYLEILTGKRKYYHGPGNEKSRTDYGRYRTSGETLDNIFGILIGKCTFYPDEFRAAKASYTAQEFNLLNDLNNLTVPTETKKLSKEQKNQIINYVKNEKAMGPAKLFKYIAKLLSCDVADIKGYRIDKSGKAEIHTFEAYRKMKTLETLDIEQMDRETLDKLAYVLTLNTEREGIQEALEHEFADGSFSQKQVDELVQFRKANSSIFGKGWHNFSVKLMMELIPELYETSEEQMTILTRLGKQKTTSSSNKTKYIDEKLLTEEIYNPVVAKSVRQAIKIVNAAIKEYGDFDNIVIEMARETNEDDEKKAIQKIQKANKDEKDAAMLKAANQYNGKAELPHSVFHGHKQLATKIRLWHQQGERCLYTGKTISIHDLINNSNQFEVDHILPLSITFDDSLANKVLVYATANQEKGQRTPYQALDSMDDAWSFRELKAFVRESKTLSNKKKEYLLTEEDISKFDVRKKFIERNLVDTRYASRVVLNALQEHFRAHKIDTKVSVVRGQFTSQLRRHWGIEKTRDTYHHHAVDALIIAASSQLNLWKKQKNTLVSYSEDQLLDIETGELISDDEYKESVFKAPYQHFVDTLKSKEFEDSILFSYQVDSKFNRKISDATIYATRQAKVGKDKADETYVLGKIKDIYTQDGYDAFMKIYKKDKSKFLMYRHDPQTFEKVIEPILENYPNKQINDKGKEVPCNPFLKYKEEHGYIRKYSKKGNGPEIKSLKYYDSKLGNHIDITPKDSNNKVVLQSVSPWRADVYFNKTTGKYEILGLKYADLQFDKGTGTYKISQEKYNDIKKKEGVDSDSEFKFTLYKNDLLLVKDTETKEQQLFRFLSRTMPKQKHYVELKPYDKQKFEGGEALIKVLGNVANSGQCKKGLGKSNISIYKVRTDVLGNQHIIKNEGDKPKLDF(SEQ ID NO:151)。
在一些实施方案中,所述Cas9蛋白可以是脑膜炎奈瑟球菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MAAFKPNPINYILGLDIGIASVGWAMVEIDEDENPICLIDLGVRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAHRLLRARRLLKREGVLQAADFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVADNAHALQTGDFRTPAELALNKFEKESGHIRNQRGDYSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIETLLMTQRPALSGDAVQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSPELQDEIGTAFSLFKTDEDITGRLKDRIQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYGDHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLGRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGFKERNLNDTRYVNRFLCQFVADRMRLTGKGKKRVFASNGQITNLLRGFWGLRKVRAENDRHHALDAVVVACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGEVLHQKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGQGHMETVKSAKRLDEGVSVLRVPLTQLKLKDLEKMVNREREPKLYEALKARLEAHKDDPAKAFAEPFYKYDKAGNRTQQVKAVRVEQVQKTGVWVRNHNGIADNATMVRVDVFEKGDKYYLVPIYSWQVAKGILPDRAVVQGKDEEDWQLIDDSFNFKFSLHPNDLVEVITKKARMFGYFASCHRGTGNINIRIHDLDHKIGKNGILEGIGVKTALSFQKYQIDELGKEIRPCRLKKRPPVR(SEQ ID NO:152)。
在一些实施方案中,所述Cas9蛋白可以是食清洁剂细小棒菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MERIFGFDIGTTSIGFSVIDYSSTQSAGNIQRLGVRIFPEARDPDGTPLNQQRRQKRMMRRQLRRRRIRRKALNETLHEAGFLPAYGSADWPVVMADEPYELRRRGLEEGLSAYEFGRAIYHLAQHRHFKGRELEESDTPDPDVDDEKEAANERAATLKALKNEQTTLGAWLARRPPSDRKRGIHAHRNVVAEEFERLWEVQSKFHPALKSEEMRARISDTIFAQRPVFWRKNTLGECRFMPGEPLCPKGSWLSQQRRMLEKLNNLAIAGGNARPLDAEERDAILSKLQQQASMSWPGVRSALKALYKQRGEPGAEKSLKFNLELGGESKLLGNALEAKLADMFGPDWPAHPRKQEIRHAVHERLWAADYGETPDKKRVIILSEKDRKAHREAAANSFVADFGITGEQAAQLQALKLPTGWEPYSIPALNLFLAELEKGERFGALVNGPDWEGWRRTNFPHRNQPTGEILDKLPSPASKEERERISQLRNPTVVRTQNELRKVVNNLIGLYGKPDRIRIEVGRDVGKSKREREEIQSGIRRNEKQRKKATEDLIKNGIANPSRDDVEKWILWKEGQERCPYTGDQIGFNALFREGRYEVEHIWPRSRSFDNSPRNKTLCRKDVNIEKGNRMPFEAFGHDEDRWSAIQIRLQGMVSAKGGTGMSPGKVKRFLAKTMPEDFAARQLNDTRYAAKQILAQLKRLWPDMGPEAPVKVEAVTGQVTAQLRKLWTLNNILADDGEKTRADHRHHAIDALTVACTHPGMTNKLSRYWQLRDDPRAEKPALTPPWDTIRADAEKAVSEIVVSHRVRKKVSGPLHKETTYGDTGTDIKTKSGTYRQFVTRKKIESLSKGELDEIRDPRIKEIVAAHVAGRGGDPKKAFPPYPCVSPGGPEIRKVRLTSKQQLNLMAQTGNGYADLGSNHHIAIYRLPDGKADFEIVSLFDASRRLAQRNPIVQRTRADGASFVMSLAAGEAIMIPEGSKKGIWIVQGVWASGQVVLERDTDADHSTTTRPMPNPILKDDAKKVSIDPIGRVRPSND(SEQ ID NO:153)。
在一些实施方案中,所述Cas9蛋白可以是白喉棒状杆菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MKYHVGIDVGTFSVGLAAIEVDDAGMPIKTLSLVSHIHDSGLDPDEIKSAVTRLASSGIARRTRRLYRRKRRRLQQLDKFIQRQGWPVIELEDYSDPLYPWKVRAELAASYIADEKERGEKLSVALRHIARHRGWRNPYAKVSSLYLPDGPSDAFKAIREEIKRASGQPVPETATVGQMVTLCELGTLKLRGEGGVLSARLQQSDYAREIQEICRMQEIGQELYRKIIDVVFAAESPKGSASSRVGKDPLQPGKNRALKASDAFQRYRIAALIGNLRVRVDGEKRILSVEEKNLVFDHLVNLTPKKEPEWVTIAEILGIDRGQLIGTATMTDDGERAGARPPTHDTNRSIVNSRIAPLVDWWKTASALEQHAMVKALSNAEVDDFDSPEGAKVQAFFADLDDDVHAKLDSLHLPVGRAAYSEDTLVRLTRRMLSDGVDLYTARLQEFGIEPSWTPPTPRIGEPVGNPAVDRVLKTVSRWLESATKTWGAPERVIIEHVREGFVTEKRAREMDGDMRRRAARNAKLFQEMQEKLNVQGKPSRADLWRYQSVQRQNCQCAYCGSPITFSNSEMDHIVPRAGQGSTNTRENLVAVCHRCNQSKGNTPFAIWAKNTSIEGVSVKEAVERTRHWVTDTGMRSTDFKKFTKAVVERFQRATMDEEIDARSMESVAWMANELRSRVAQHFASHGTTVRVYRGSLTAEARRASGISGKLKFFDGVGKSRLDRRHHAIDAAVIAFTSDYVAETLAVRSNLKQSQAHRQEAPQWREFTGKDAEHRAAWRVWCQKMEKLSALLTEDLRDDRVVVMSNVRLRLGNGSAHKETIGKLSKVKLSSQLSVSDIDKASSEALWCALTREPGFDPKEGLPANPERHIRVNGTHVYAGDNIGLFPVSAGSIALRGGYAELGSSFHHARVYKITSGKKPAFAMLRVYTIDLLPYRNQDLFSVELKPQTMSMRQAEKKLRDALATGNAEYLGWLVVDDELVVDTSKIATDQVKAVEAELGTIRRWRVDGFFSPSKLRLRPLQMSKEGIKKESAPELSKIIDRPGWLPAVNKLFSDGNVTVVRRDSLGRVRLESTAHLPVTWKVQ(SEQ ID NO:154)。
在一些实施方案中,所述Cas9蛋白可以是巴氏链球菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MTNGKILGLDIGIASVGVGIIEAKTGKVVHANSRLFSAANAENNAERRGFRGSRRLNRRKKHRVKRVRDLFEKYGIVTDFRNLNLNPYELRVKGLTEQLKNEELFAALRTISKRRGISYLDDAEDDSTGSTDYAKSIDENRRLLKNKTPGQIQLERLEKYGQLRGNFTVYDENGEAHRLINVFSTSDYEKEARKILETQADYNKKITAEFIDDYVEILTQKRKYYHGPGNEKSRTDYGRFRTDGTTLENIFGILIGKCNFYPDEYRASKASYTAQEYNFLNDLNNLKVSTETGKLSTEQKESLVEFAKNTATLGPAKLLKEIAKILDCKVDEIKGYREDDKGKPDLHTFEPYRKLKFNLESINIDDLSREVIDKLADILTLNTEREGIEDAIKRNLPNQFTEEQISEIIKVRKSQSTAFNKGWHSFSAKLMNELIPELYATSDEQMTILTRLEKFKVNKKSSKNTKTIDEKEVTDEIYNPVVAKSVRQTIKIINAAVKKYGDFDKIVIEMPRDKNADDEKKFIDKRNKENKKEKDDALKRAAYLYNSSDKLPDEVFHGNKQLETKIRLWYQQGERCLYSGKPISIQELVHNSNNFEIDHILPLSLSFDDSLANKVLVYAWTNQEKGQKTPYQVIDSMDAAWSFREMKDYVLKQKGLGKKKRDYLLTTENIDKIEVKKKFIERNLVDTRYASRVVLNSLQSALRELGKDTKVSVVRGQFTSQLRRKWKIDKSRETYHHHAVDALIIAASSQLKLWEKQDNPMFVDYGKNQVVDKQTGEILSVSDDEYKELVFQPPYQGFVNTISSKGFEDEILFSYQVDSKYNRKVSDATIYSTRKAKIGKDKKEETYVLGKIKDIYSQNGFDTFIKKYNKDKTQFLMYQKDSLTWENVIEVILRDYPTTKKSEDGKNDVKCNPFEEYRRENGLICKYSKKGKGTPIKSLKYYDKKLGNCIDITPEESRNKVILQSINPWRADVYFNPETLKYELMGLKYSDLSFEKGTGNYHISQEKYDAIKEKEGIGKKSEFKFTLYRNDLILIKDIASGEQEIYRFLSRTMPNVNHYVELKPYDKEKFDNVQELVEALGEADKVGRCIKGLNKPNISIYKVRTDVLGNKYFVKKKGDKPKLDFKNNKK(SEQ ID NO:155)。
在一些实施方案中,所述Cas9蛋白可以是灰色奈瑟球菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MAAFKPNPMNYILGLDIGIASVGWAIVEIDEEENPIRLIDLGVRVFERAEVPKTGDSLAAARRLARSVRRLTRRRAHRLLRARRLLKREGVLQAADFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVADNTHALQTGDFRTPAELALNKFEKESGHIRNQRGDYSHTFNRKDLQAELNLLFEKQKEFGNPHVSDGLKEGIETLLMTQRPALSGDAVQKMLGHCTFEPTEPKAAKNTYTAERFVWLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARKLLDLDDTAFFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSPELQDEIGTAFSLFKTDEDITGRLKDRVQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGNRYDEACTEIYGDHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKSAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLGRLNEKGYVEIDHALPFSRTWDDSFNNKVLALGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGFKERNLNDTRYINRFLCQFVADHMLLTGKGKRRVFASNGQITNLLRGFWGLRKVRAENDRHHALDAVVVACSTIAMQQKITRFVRYKEMNAFDGKTIDKETGEVLHQKAHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHKYVTPLFISRAPNRKMSGQGHMETVKSAKRLDEGISVLRVPLTQLKLKDLEKMVNREREPKLYEALKARLEAHKDDPAKAFAEPFYKYDKAGNRTQQVKAVRVEQVQKTGVWVHNHNGIADNATIVRVDVFEKGGKYYLVPIYSWQVAKGILPDRAVVQGKDEEDWTVMDDSFEFKFVLYANDLIKLTAKKNEFLGYFVSLNRATGAIDIRTHDTDSTKGKNGIFQSVGVKTALSFQKYQIDELGKEIRPCRLKKRPPVR(SEQ ID NO:156)。
在一些实施方案中,所述Cas9蛋白可以是红嘴鸥弯曲杆菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MRILGFDIGINSIGWAFVENDELKDCGVRIFTKAENPKNKESLALPRRNARSSRRRLKRRKARLIAIKRILAKELKLNYKDYVAADGELPKAYEGSLASVYELRYKALTQNLETKDLARVILHIAKHRGYMNKNEKKSNDAKKGKILSALKNNALKLENYQSVGEYFYKEFFQKYKKNTKNFIKIRNTKDNYNNCVLSSDLEKELKLILEKQKEFGYNYSEDFINEILKVAFFQRPLKDFSHLVGACTFFEEEKRACKNSYSAWEFVALTKIINEIKSLEKISGEIVPTQTINEVLNLILDKGSITYKKFRSCINLHESISFKSLKYDKENAENAKLIDFRKLVEFKKALGVHSLSRQELDQISTHITLIKDNVKLKTVLEKYNLSNEQINNLLEIEFNDYINLSFKALGMILPLMREGKRYDEACEIANLKPKTVDEKKDFLPAFCDSIFAHELSNPVVNRAISEYRKVLNALLKKYGKVHKIHLELARDVGLSKKAREKIEKEQKENQAVNAWALKECENIGLKASAKNILKLKLWKEQKEICIYSGNKISIEHLKDEKALEVDHIYPYSRSFDDSFINKVLVFTKENQEKLNKTPFEAFGKNIEKWSKIQTLAQNLPYKKKNKILDENFKDKQQEDFISRNLNDTRYIATLIAKYTKEYLNFLLLSENENANLKSGEKGSKIHVQTISGMLTSVLRHTWGFDKKDRNNHLHHALDAIIVAYSTNSIIKAFSDFRKNQELLKARFYAKELTSDNYKHQVKFFEPFKSFREKILSKIDEIFVSKPPRKRARRALHKDTFHSENKIIDKCSYNSKEGLQIALSCGRVRKIGTKYVENDTIVRVDIFKKQNKFYAIPIYAMDFALGILPNKIVITGKDKNNNPKQWQTIDESYEFCFSLYKNDLILLQKKNMQEPEFAYYNDFSISTSSICVEKHDNKFENLTSNQKLLFSNAKEGSVKVESLGIQNLKVFEKYIITPLGDKIKADFQPRENISLKTSKKYGLR(SEQ ID NO:157)。
在一些实施方案中,所述Cas9蛋白可以是齿垢密螺旋体Cas9,并且可以包含以下氨基酸序列或由其组成:
MKKEIKDYFLGLDVGTGSVGWAVTDTDYKLLKANRKDLWGMRCFETAETAEVRRLHRGARRRIERRKKRIKLLQELFSQEIAKTDEGFFQRMKESPFYAEDKTILQENTLFNDKDFADKTYHKAYPTINHLIKAWIENKVKPDPRLLYLACHNIIKKRGHFLFEGDFDSENQFDTSIQALFEYLREDMEVDIDADSQKVKEILKDSSLKNSEKQSRLNKILGLKPSDKQKKAITNLISGNKINFADLYDNPDLKDAEKNSISFSKDDFDALSDDLASILGDSFELLLKAKAVYNCSVLSKVIGDEQYLSFAKVKIYEKHKTDLTKLKNVIKKHFPKDYKKVFGYNKNEKNNNNYSGYVGVCKTKSKKLIINNSVNQEDFYKFLKTILSAKSEIKEVNDILTEIETGTFLPKQISKSNAEIPYQLRKMELEKILSNAEKHFSFLKQKDEKGLSHSEKIIMLLTFKIPYYIGPINDNHKKFFPDRCWVVKKEKSPSGKTTPWNFFDHIDKEKTAEAFITSRTNFCTYLVGESVLPKSSLLYSEYTVLNEINNLQIIIDGKNICDIKLKQKIYEDLFKKYKKITQKQISTFIKHEGICNKTDEVIILGIDKECTSSLKSYIELKNIFGKQVDEISTKNMLEEIIRWATIYDEGEGKTILKTKIKAEYGKYCSDEQIKKILNLKFSGWGRLSRKFLETVTSEMPGFSEPVNIITAMRETQNNLMELLSSEFTFTENIKKINSGFEDAEKQFSYDGLVKPLFLSPSVKKMLWQTLKLVKEISHITQAPPKKIFIEMAKGAELEPARTKTRLKILQDLYNNCKNDADAFSSEIKDLSGKIENEDNLRLRSDKLYLYYTQLGKCMYCGKPIEIGHVFDTSNYDIDHIYPQSKIKDDSISNRVLVCSSCNKNKEDKYPLKSEIQSKQRGFWNFLQRNNFISLEKLNRLTRATPISDDETAKFIARQLVETRQATKVAAKVLEKMFPETKIVYSKAETVSMFRNKFDIVKCREINDFHHAHDAYLNIVVGNVYNTKFTNNPWNFIKEKRDNPKIADTYNYYKVFDYDVKRNNITAWEKGKTIITVKDMLKRNTPIYTRQAACKKGELFNQTIMKKGLGQHPLKKEGPFSNISKYGGYNKVSAAYYTLIEYEEKGNKIRSLETIPLYLVKDIQKDQDVLKSYLTDLLGKKEFKILVPKIKINSLLKINGFPCHITGKTNDSFLLRPAVQFCCSNNEVLYFKKIIRFSEIRSQREKIGKTISPYEDLSFRSYIKENLWKKTKNDEIGEKEFYDLLQKKNLEIYDMLLTKHKDTIYKKRPNSATIDILVKGKEKFKSLIIENQFEVILEILKLFSATRNVSDLQHIGGSKYSGVAKIGNKISSLDNCILIYQSITGIFEKRIDLLKV(SEQ ID NO:158)。
在一些实施方案中,所述Cas9蛋白可以是变形链球菌(S.mutans)Cas9,并且可以包含以下氨基酸序列或由其组成:
MKKPYSIGLDIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKSHIEKNLLGALLFDSGNTAEDRRLKRTARRRYTRRRNRILYLQEIFSEEMGKVDDSFFHRLEDSFLVTEDKRGERHPIFGNLEEEVKYHENFPTIYHLRQYLADNPEKVDLRLVYLALAHIIKFRGHFLIEGKFDTRNNDVQRLFQEFLAVYDNTFENSSLQEQNVQVEEILTDKISKSAKKDRVLKLFPNEKSNGRFAEFLKLIVGNQADFKKHFELEEKAPLQFSKDTYEEELEVLLAQIGDNYAELFLSAKKLYDSILLSGILTVTDVGTKAPLSASMIQRYNEHQMDLAQLKQFIRQKLSDKYNEVFSDVSKDGYAGYIDGKTNQEAFYKYLKGLLNKIEGSGYFLDKIEREDFLRKQRTFDNGSIPHQIHLQEMRAIIRRQAEFYPFLADNQDRIEKLLTFRIPYYVGPLARGKSDFAWLSRKSADKITPWNFDEIVDKESSAEAFINRMTNYDLYLPNQKVLPKHSLLYEKFTVYNELTKVKYKTEQGKTAFFDANMKQEIFDGVFKVYRKVTKDKLMDFLEKEFDEFRIVDLTGLDKENKVFNASYGTYHDLCKILDKDFLDNSKNEKILEDIVLTLTLFEDREMIRKRLENYSDLLTKEQVKKLERRHYTGWGRLSAELIHGIRNKESRKTILDYLIDDGNSNRNFMQLINDDALSFKEEIAKAQVIGETDNLNQVVSDIAGSPAIKKGILQSLKIVDELVKIMGHQPENIVVEMARENQFTNQGRRNSQQRLKGLTDSIKEFGSQILKEHPVENSQLQNDRLFLYYLQNGRDMYTGEELDIDYLSQYDIDHIIPQAFIKDNSIDNRVLTSSKENRGKSDDVPSKDVVRKMKSYWSKLLSAKLITQRKFDNLTKAERGGLTDDDKAGFIKRQLVETRQITKHVARILDERFNTETDENNKKIRQVKIVTLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVIGKALLGVYPQLEPEFVYGDYPHFHGHKENKATAKKFFYSNIMNFFKKDDVRTDKNGEIIWKKDEHISNIKKVLSYPQVNIVKKVEEQTGGFSKESILPKGNSDKLIPRKTKKFYWDTKKYGGFDSPIVAYSILVIADIEKGKSKKLKTVKALVGVTIMEKMTFERDPVAFLERKGYRNVQEENIIKLPKYSLFKLENGRKRLLASARELQKGNEIVLPNHLGTLLYHAKNIHKVDEPKHLDYVDKHKDEFKELLDVVSNFSKKYTLAEGNLEKIKELYAQNNGEDLKELASSFINLLTFTAIGAPATFKFFDKNIDRKRYTSTTEILNATLIHQSITGLYETRIDLNKLGGD(SEQ ID NO:159)
在一些实施方案中,所述Cas9蛋白可以是嗜热链球菌CRISPR 3Cas9,并且可以包含以下氨基酸序列或由其组成:
MTKPYSIGLDIGTNSVGWAVTTDNYKVPSKKMKVLGNTSKKYIKKNLLGVLLFDSGITAEGRRLKRTARRRYTRRRNRILYLQEIFSTEMATLDDAFFQRLDDSFLVPDDKRDSKYPIFGNLVEEKAYHDEFPTIYHLRKYLADSTKKADLRLVYLALAHMIKYRGHFLIEGEFNSKNNDIQKNFQDFLDTYNAIFESDLSLENSKQLEEIVKDKISKLEKKDRILKLFPGEKNSGIFSEFLKLIVGNQADFRKCFNLDEKASLHFSKESYDEDLETLLGYIGDDYSDVFLKAKKLYDAILLSGFLTVTDNETEAPLSSAMIKRYNEHKEDLALLKEYIRNISLKTYNEVFKDDTKNGYAGYIDGKTNQEDFYVYLKKLLAEFEGADYFLEKIDREDFLRKQRTFDNGSIPYQIHLQEMRAILDKQAKFYPFLAKNKERIEKILTFRIPYYVGPLARGNSDFAWSIRKRNEKITPWNFEDVIDKESSAEAFINRMTSFDLYLPEEKVLPKHSLLYETFNVYNELTKVRFIAESMRDYQFLDSKQKKDIVRLYFKDKRKVTDKDIIEYLHAIYGYDGIELKGIEKQFNSSLSTYHDLLNIINDKEFLDDSSNEAIIEEIIHTLTIFEDREMIKQRLSKFENIFDKSVLKKLSRRHYTGWGKLSAKLINGIRDEKSGNTILDYLIDDGISNRNFMQLIHDDALSFKKKIQKAQIIGDEDKGNIKEVVKSLPGSPAIKKGILQSIKIVDELVKVMGGRKPESIVVEMARENQYTNQGKSNSQQRLKRLEKSLKELGSKILKENIPAKLSKIDNNALQNDRLYLYYLQNGKDMYTGDDLDIDRLSNYDIDHIIPQAFLKDNSIDNKVLVSSASNRGKSDDVPSLEVVKKRKTFWYQLLKSKLISQRKFDNLTKAERGGLSPEDKAGFIQRQLVETRQITKHVARLLDEKFNNKKDENNRAVRTVKIITLKSTLVSQFRKDFELYKVREINDFHHAHDAYLNAVVASALLKKYPKLEPEFVYGDYPKYNSFRERKSATEKVYFYSNIMNIFKKSISLADGRVIERPLIEVNEETGESVWNKESDLATVRRVLSYPQVNVVKKVEEQNHGLDRGKPKGLFNANLSSKPKPNSNENLVGAKEYLDPKKYGGYAGISNSFTVLVKGTIEKGAKKKITNVLEFQGISILDRINYRKDKLNFLLEKGYKDIELIIELPKYSLFELSDGSRRMLASILSTNNKRGEIHKGNQIFLSQKFVKLLYHAKRISNTINENHRKYVENHKKEFEELFYYILEFNENYVGAKKNGKLLNSAFQSWQNHSIDELCSSFIGPTGSERKGLFELTSRGSAADFEFLGVKIPRYRDYTPSSLLKDATLIHQSVTGLYETRIDLAKLGEG(SEQ ID NO:160)
在一些实施方案中,所述Cas9蛋白可以是空肠弯曲杆菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MARILAFDIGISSIGWAFSENDELKDCGVRIFTKVENPKTGESLALPRRLARSARKRLARRKARLNHLKHLIANEFKLNYEDYQSFDESLAKAYKGSLISPYELRFRALNELLSKQDFARVILHIAKRRGYDDIKNSDDKEKGAILKAIKQNEEKLANYQSVGEYLYKEYFQKFKENSKEFTNVRNKKESYERCIAQSFLKDELKLIFKKQREFGFSFSKKFEEEVLSVAFYKRALKDFSHLVGNCSFFTDEKRAPKNSPLAFMFVALTRIINLLNNLKNTEGILYTKDDLNALLNEVLKNGTLTYKQTKKLLGLSDDYEFKGEKGTYFIEFKKYKEFIKALGEHNLSQDDLNEIAKDITLIKDEIKLKKALAKYDLNQNQIDSLSKLEFKDHLNISFKALKLVTPLMLEGKKYDEACNELNLKVAINEDKKDFLPAFNETYYKDEVTNPVVLRAIKEYRKVLNALLKKYGKVHKINIELAREVGKNHSQRAKIEKEQNENYKAKKDAELECEKLGLKINSKNILKLRLFKEQKEFCAYSGEKIKISDLQDEKMLEIDHIYPYSRSFDDSYMNKVLVFTKQNQEKLNQTPFEAFGNDSAKWQKIEVLAKNLPTKKQKRILDKNYKDKEQKNFKDRNLNDTRYIARLVLNYTKDYLDFLPLSDDENTKLNDTQKGSKVHVEAKSGMLTSALRHTWGFSAKDRNNHLHHAIDAVIIAYANNSIVKAFSDFKKEQESNSAELYAKKISELDYKNKRKFFEPFSGFRQKVLDKIDEIFVSKPERKKPSGALHEETFRKEEEFYQSYGGKEGVLKALELGKIRKVNGKIVKNGDMFRVDIFKHKKTNKFYAVPIYTMDFALKVLPNKAVARSKKGEIKDWILMDENYEFCFSLYKDSLILIQTKDMQEPEFVYYNAFTSSTVSLIVSKHDNKFETLSKNQKILFKNANEKEVIAKSIGIQNLKVFEKYIVSALGEVTKAEFRQREDFKK(SEQ ID NO:161)
在一些实施方案中,所述Cas9蛋白可以是多杀巴斯德菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MQTTNLSYILGLDLGIASVGWAVVEINENEDPIGLIDVGVRIFERAEVPKTGESLALSRRLARSTRRLIRRRAHRLLLAKRFLKREGILSTIDLEKGLPNQAWELRVAGLERRLSAIEWGAVLLHLIKHRGYLSKRKNESQTNNKELGALLSGVAQNHQLLQSDDYRTPAELALKKFAKEEGHIRNQRGAYTHTFNRLDLLAELNLLFAQQHQFGNPHCKEHIQQYMTELLMWQKPALSGEAILKMLGKCTHEKNEFKAAKHTYSAERFVWLTKLNNLRILEDGAERALNEEERQLLINHPYEKSKLTYAQVRKLLGLSEQAIFKHLRYSKENAESATFMELKAWHAIRKALENQGLKDTWQDLAKKPDLLDEIGTAFSLYKTDEDIQQYLTNKVPNSVINALLVSLNFDKFIELSLKSLRKILPLMEQGKRYDQACREIYGHHYGEANQKTSQLLPAIPAQEIRNPVVLRTLSQARKVINAIIRQYGSPARVHIETGRELGKSFKERREIQKQQEDNRTKRESAVQKFKELFSDFSSEPKSKDILKFRLYEQQHGKCLYSGKEINIHRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLASENQNKGNQTPYEWLQGKINSERWKNFVALVLGSQCSAAKKQRLLTQVIDDNKFIDRNLNDTRYIARFLSNYIQENLLLVGKNKKNVFTPNGQITALLRSRWGLIKARENNNRHHALDAIVVACATPSMQQKITRFIRFKEVHPYKIENRYEMVDQESGEIISPHFPEPWAYFRQEVNIRVFDNHPDTVLKEMLPDRPQANHQFVQPLFVSRAPTRKMSGQGHMETIKSAKRLAEGISVLRIPLTQLKPNLLENMVNKEREPALYAGLKARLAEFNQDPAKAFATPFYKQGGQQVKAIRVEQVQKSGVLVRENNGVADNASIVRTDVFIKNNKFFLVPIYTWQVAKGILPNKAIVAHKNEDEWEEMDEGAKFKFSLFPNDLVELKTKKEYFFGYYIGLDRATGNISLKEHDGEISKGKDGVYRVGVKLALSFEKYQVDELGKNRQICRPQQRQPVR(SEQ ID NO:162)
在一些实施方案中,所述Cas9蛋白可以是新凶手弗朗西丝菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MNFKILPIAIDLGVKNTGVFSAFYQKGTSLERLDNKNGKVYELSKDSYTLLMNNRTARRHQRRGIDRKQLVKRLFKLIWTEQLNLEWDKDTQQAISFLFNRRGFSFITDGYSPEYLNIVPEQVKAILMDIFDDYNGEDDLDSYLKLATEQESKISEIYNKLMQKILEFKLMKLCTDIKDDKVSTKTLKEITSYEFELLADYLANYSESLKTQKFSYTDKQGNLKELSYYHHDKYNIQEFLKRHATINDRILDTLLTDDLDIWNFNFEKFDFDKNEEKLQNQEDKDHIQAHLHHFVFAVNKIKSEMASGGRHRSQYFQEITNVLDENNHQEGYLKNFCENLHNKKYSNLSVKNLVNLIGNLSNLELKPLRKYFNDKIHAKADHWDEQKFTETYCHWILGEWRVGVKDQDKKDGAKYSYKDLCNELKQKVTKAGLVDFLLELDPCRTIPPYLDNNNRKPPKCQSLILNPKFLDNQYPNWQQYLQELKKLQSIQNYLDSFETDLKVLKSSKDQPYFVEYKSSNQQIASGQRDYKDLDARILQFIFDRVKASDELLLNEIYFQAKKLKQKASSELEKLESSKKLDEVIANSQLSQILKSQHTNGIFEQGTFLHLVCKYYKQRQRARDSRLYIMPEYRYDKKLHKYNNTGRFDDDNQLLTYCNHKPRQKRYQLLNDLAGVLQVSPNFLKDKIGSDDDLFISKWLVEHIRGFKKACEDSLKIQKDNRGLLNHKINIARNTKGKCEKEIFNLICKIEGSEDKKGNYKHGLAYELGVLLFGEPNEASKPEFDRKIKKFNSIYSFAQIQQIAFAERKGNANTCAVCSADNAHRMQQIKITEPVEDNKDKIILSAKAQRLPAIPTRIVDGAVKKMATILAKNIVDDNWQNIKQVLSAKHQLHIPIITESNAFEFEPALADVKGKSLKDRRKKALERISPENIFKDKNNRIKEFAKGISAYSGANLTDGDFDGAKEELDHIIPRSHKKYGTLNDEANLICVTRGDNKNKGNRIFCLRDLADNYKLKQFETTDDLEIEKKIADTIWDANKKDFKFGNYRSFINLTPQEQKAFRHALFLADENPIKQAVIRAINNRNRTFVNGTQRYFAEVLANNIYLRAKKENLNTDKISFDYFGIPTIGNGRGIAEIRQLYEKVDSDIQAYAKGDKPQASYSHLIDAMLAFCIAADEHRNDGSIGLEIDKNYSLYPLDKNTGEVFTKDIFSQIKITDNEFSDKKLVRKKAIEGFNTHRQMTRDGIYAENYLPILIHKELNEVRKGYTWKNSEEIKIFKGKKYDIQQLNNLVYCLKFVDKPISIDIQISTLEELRNILTTNNIAATAEYYYINLKTQKLHEYYIENYNTALGYKKYSKEMEFLRSLAYRSERVKIKSIDDVKQVLDKDSNFIIGKITLPFKKEWQRLYREWQNTTIKDDYEFLKSFFNVKSITKLHKKVRKDFSLPISTNEGKFLVKRKTWDNNFIYQILNDSDSRADGTKPFIPAFDISKNEIVEAIIDSFTSKNIFWLPKNIELQKVDNKNIFAIDTSKWFEVETPSDLRDIGIATIQYKIDNNSRPKVRVKLDYVIDDDSKINYFMNHSLLKSRYPDKVLEILKQSTIIEFESSGFNKTIKEMLGMKLAGIYNETSNN(SEQ ID NO:163)
在一些实施方案中,所述Cas9蛋白可以是布氏乳杆菌(Lactobacillus buchneri)Cas9,并且可以包含以下氨基酸序列或由其组成:MKVNNYHIGLDIGTSSIGWVAIGKDGKPLRVKGKTAIGARLFQEGNPAADRRMFRTTRRRLSRRKWRLKLLEEIFDPYITPVDSTFFARLKQSNLSPKDSRKEFKGSMLFPDLTDMQYHKNYPTIYHLRHALMTQDKKFDIRMVYLAIHHIVKYRGNFLNSTPVDSFKASKVDFVDQFKKLNELYAAINPEESFKINLANSEDIGHQFLDPSIRKFDKKKQIPKIVPVMMNDKVTDRLNGKIASEIIHAILGYKAKLDVVLQCTPVDSKPWALKFDDEDIDAKLEKILPEMDENQQSIVAILQNLYSQVTLNQIVPNGMSLSESMIEKYNDHHDHLKLYKKLIDQLADPKKKAVLKKAYSQYVGDDGKVIEQAEFWSSVKKNLDDSELSKQIMDLIDAEKFMPKQRTSQNGVIPHQLHQRELDEIIEHQSKYYPWLVEINPNKHDLHLAKYKIEQLVAFRVPYYVGPMITPKDQAESAETVFSWMERKGTETGQITPWNFDEKVDRKASANRFIKRMTTKDTYLIGEDVLPDESLLYEKFKVLNELNMVRVNGKLLKVADKQAIFQDLFENYKHVSVKKLQNYIKAKTGLPSDPEISGLSDPEHFNNSLGTYNDFKKLFGSKVDEPDLQDDFEKIVEWSTVFEDKKILREKLNEITWLSDQQKDVLESSRYQGWGRLSKKLLTGIVNDQGERIIDKLWNTNKNFMQIQSDDDFAKRIHEANADQMQAVDVEDVLADAYTSPQNKKAIRQVVKVVDDIQKAMGGVAPKYISIEFTRSEDRNPRRTISRQRQLENTLKDTAKSLAKSINPELLSELDNAAKSKKGLTDRLYLYFTQLGKDIYTGEPINIDELNKYDIDHILPQAFIKDNSLDNRVLVLTAVNNGKSDNVPLRMFGAKMGHFWKQLAEAGLISKRKLKNLQTDPDTISKYAMHGFIRRQLVETSQVIKLVANILGDKYRNDDTKIIEITARMNHQMRDEFGFIKNREINDYHHAFDAYLTAFLGRYLYHRYIKLRPYFVYGDFKKFREDKVTMRNFNFLHDLTDDTQEKIADAETGEVIWDRENSIQQLKDVYHYKFMLISHEVYTLRGAMFNQTVYPASDAGKRKLIPVKADRPVNVYGGYSGSADAYMAIVRIHNKKGDKYRVVGVPMRALDRLDAAKNVSDADFDRALKDVLAPQLTKTKKSRKTGEITQVIEDFEIVLGKVMYRQLMIDGDKKFMLGSSTYQYNAKQLVLSDQSVKTLASKGRLDPLQESMDYNNVYTEILDKVNQYFSLYDMNKFRHKLNLGFSKFISFPNHNVLDGNTKVSSGKREILQEILNGLHANPTFGNLKDVGITTPFGQLQQPNGILLSDETKIRYQSPTGLFERTVSLKDL(SEQ ID NO:164)
在一些实施方案中,所述Cas9蛋白可以是无害李斯特菌(Listeria innocua)Cas9,并且可以包含以下氨基酸序列或由其组成:
MKKPYTIGLDIGTNSVGWAVLTDQYDLVKRKMKIAGDSEKKQIKKNFWGVRLFDEGQTAADRRMARTARRRIERRRNRISYLQGIFAEEMSKTDANFFCRLSDSFYVDNEKRNSRHPFFATIEEEVEYHKNYPTIYHLREELVNSSEKADLRLVYLALAHIIKYRGNFLIEGALDTQNTSVDGIYKQFIQTYNQVFASGIEDGSLKKLEDNKDVAKILVEKVTRKEKLERILKLYPGEKSAGMFAQFISLIVGSKGNFQKPFDLIEKSDIECAKDSYEEDLESLLALIGDEYAELFVAAKNAYSAVVLSSIITVAETETNAKLSASMIERFDTHEEDLGELKAFIKLHLPKHYEEIFSNTEKHGYAGYIDGKTKQADFYKYMKMTLENIEGADYFIAKIEKENFLRKQRTFDNGAIPHQLHLEELEAILHQQAKYYPFLKENYDKIKSLVTFRIPYFVGPLANGQSEFAWLTRKADGEIRPWNIEEKVDFGKSAVDFIEKMTNKDTYLPKENVLPKHSLCYQKYLVYNELTKVRYINDQGKTSYFSGQEKEQIFNDLFKQKRKVKKKDLELFLRNMSHVESPTIEGLEDSFNSSYSTYHDLLKVGIKQEILDNPVNTEMLENIVKILTVFEDKRMIKEQLQQFSDVLDGVVLKKLERRHYTGWGRLSAKLLMGIRDKQSHLTILDYLMNDDGLNRNLMQLINDSNLSFKSIIEKEQVTTADKDIQSIVADLAGSPAIKKGILQSLKIVDELVSVMGYPPQTIVVEMARENQTTGKGKNNSRPRYKSLEKAIKEFGSQILKEHPTDNQELRNNRLYLYYLQNGKDMYTGQDLDIHNLSNYDIDHIVPQSFITDNSIDNLVLTSSAGNREKGDDVPPLEIVRKRKVFWEKLYQGNLMSKRKFDYLTKAERGGLTEADKARFIHRQLVETRQITKNVANILHQRFNYEKDDHGNTMKQVRIVTLKSALVSQFRKQFQLYKVRDVNDYHHAHDAYLNGVVANTLLKVYPQLEPEFVYGDYHQFDWFKANKATAKKQFYTNIMLFFAQKDRIIDENGEILWDKKYLDTVKKVMSYRQMNIVKKTEIQKGEFSKATIKPKGNSSKLIPRKTNWDPMKYGGLDSPNMAYAVVIEYAKGKNKLVFEKKIIRVTIMERKAFEKDEKAFLEEQGYRQPKVLAKLPKYTLYECEEGRRRMLASANEAQKGNQQVLPNHLVTLLHHAANCEVSDGKSLDYIESNREMFAELLAHVSEFAKRYTLAEANLNKINQLFEQNKEGDIKAIAQSFVDLMAFNAMGAPASFKFFETTIERKRYNNLKELLNSTIIYQSITGLYESRKRLDD(SEQ ID NO:165)
在一些实施方案中,所述Cas9蛋白可以是嗜肺军团菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MESSQILSPIGIDLGGKFTGVCLSHLEAFAELPNHANTKYSVILIDHNNFQLSQAQRRATRHRVRNKKRNQFVKRVALQLFQHILSRDLNAKEETALCHYLNNRGYTYVDTDLDEYIKDETTINLLKELLPSESEHNFIDWFLQKMQSSEFRKILVSKVEEKKDDKELKNAVKNIKNFITGFEKNSVEGHRHRKVYFENIKSDITKDNQLDSIKKKIPSVCLSNLLGHLSNLQWKNLHRYLAKNPKQFDEQTFGNEFLRMLKNFRHLKGSQESLAVRNLIQQLEQSQDYISILEKTPPEITIPPYEARTNTGMEKDQSLLLNPEKLNNLYPNWRNLIPGIIDAHPFLEKDLEHTKLRDRKRIISPSKQDEKRDSYILQRYLDLNKKIDKFKIKKQLSFLGQGKQLPANLIETQKEMETHFNSSLVSVLIQIASAYNKEREDAAQGIWFDNAFSLCELSNINPPRKQKILPLLVGAILSEDFINNKDKWAKFKIFWNTHKIGRTSLKSKCKEIEEARKNSGNAFKIDYEEALNHPEHSNNKALIKIIQTIPDIIQAIQSHLGHNDSQALIYHNPFSLSQLYTILETKRDGFHKNCVAVTCENYWRSQKTEIDPEISYASRLPADSVRPFDGVLARMMQRLAYEIAMAKWEQIKHIPDNSSLLIPIYLEQNRFEFEESFKKIKGSSSDKTLEQAIEKQNIQWEEKFQRIINASMNICPYKGASIGGQGEIDHIYPRSLSKKHFGVIFNSEVNLIYCSSQGNREKKEEHYLLEHLSPLYLKHQFGTDNVSDIKNFISQNVANIKKYISFHLLTPEQQKAARHALFLDYDDEAFKTITKFLMSQQKARVNGTQKFLGKQIMEFLSTLADSKQLQLEFSIKQITAEEVHDHRELLSKQEPKLVKSRQQSFPSHAIDATLTMSIGLKEFPQFSQELDNSWFINHLMPDEVHLNPVRSKEKYNKPNISSTPLFKDSLYAERFIPVWVKGETFAIGFSEKDLFEIKPSNKEKLFTLLKTYSTKNPGESLQELQAKSKAKWLYFPINKTLALEFLHHYFHKEIVTPDDTTVCHFINSLRYYTKKESITVKILKEPMPVLSVKFESSKKNVLGSFKHTIALPATKDWERLFNHPNFLALKANPAPNPKEFNEFIRKYFLSDNNPNSDIPNNGHNIKPQKHKAVRKVFSLPVIPGNAGTMMRIRRKDNKGQPLYQLQTIDDTPSMGIQINEDRLVKQEVLMDAYKTRNLSTIDGINNSEGQAYATFDNWLTLPVSTFKPEIIKLEMKPHSKTRRYIRITQSLADFIKTIDEALMIKPSDSIDDPLNMPNEIVCKNKLFGNELKPRDGKMKIVSTGKIVTYEFESDSTPQWIQTLYVTQLKKQP(SEQ ID NO:166)
在一些实施方案中,所述Cas9蛋白可以是嗜乳糖奈瑟球菌(N.lactamica)Cas9,并且可以包含以下氨基酸序列或由其组成:
MAAFKPNPMNYILGLDIGIASVGWAMVEVDEEENPIRLIDLGVRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAHRLLRARRLLKREGVLQDADFDENGLVKSLPNTPWQLRAAALDRKLTCLEWSAVLLHLVKHRGYLSQRKNEGETADKELGALLKGVADNAHALQTGDFRTPAELALNKFEKESGHIRNQRGDYSHTFSRKDLQAELNLLFEKQKEFGNPHVSDGLKEDIETLLMAQRPALSGDAVQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSTELQDEIGTAFSLFKTDKDITGRLKDRVQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYGDHYCKKNAEEKIYLPPIPADEIRNPVVLRALSQARKVINCVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLVRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQRILLQKFDEEGFKERNLNDTRYVNRFLCQFVADHILLTGKGKRRVFASNGQITNLLRGFWGLRKVRTENDRHHALDAVVVACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGEVLHQKAHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGQGHMETVKSAKRLDEGISVLRVPLTQLKLKGLEKMVNREREPKLYDALKAQLETHKDDPAKAFAEPFYKYDKAGSRTQQVKAVRIEQVQKTGVWVRNHNGIADNATMVRVDVFEKGGKYYLVPIYSWQVAKGILPDRAVVAFKDEEDWTVMDDSFEFRFVLYANDLIKLTAKKNEFLGYFVSLNRATGAIDIRTHDTDSTKGKNGIFQSVGVKTALSFQKNQIDELGKEIRPCRLKKRPPVR(SEQ ID NO:167)
在一些实施方案中,所述Cas9蛋白可以是脑膜炎奈瑟球菌Cas9,并且可以包含以下氨基酸序列或由其组成:
MAAFKPNPINYILGLDIGIASVGWAMVEIDEDENPICLIDLGVRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAHRLLRARRLLKREGVLQAADFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVADNAHALQTGDFRTPAELALNKFEKESGHIRNQRGDYSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIETLLMTQRPALSGDAVQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSPELQDEIGTAFSLFKTDEDITGRLKDRIQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYGDHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLGRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGFKERNLNDTRYVNRFLCQFVADRMRLTGKGKKRVFASNGQITNLLRGFWGLRKVRAENDRHHALDAVVVACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGEVLHQKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGQGHMETVKSAKRLDEGVSVLRVPLTQLKLKDLEKMVNREREPKLYEALKARLEAHKDDPAKAFAEPFYKYDKAGNRTQQVKAVRVEQVQKTGVWVRNHNGIADNATMVRVDVFEKGDKYYLVPIYSWQVAKGILPDRAVVQGKDEEDWQLIDDSFNFKFSLHPNDLVEVITKKARMFGYFASCHRGTGNINIRIHDLDHKIGKNGILEGIGVKTALSFQKYQIDELGKEIRPCRLKKRPPVR(SEQ ID NO:168)
在一些实施方案中,所述Cas9蛋白可以是长双歧杆菌(B.longum)Cas9,并且可以包含以下氨基酸序列或由其组成:
MLSRQLLGASHLARPVSYSYNVQDNDVHCSYGERCFMRGKRYRIGIDVGLNSVGLAAVEVSDENSPVRLLNAQSVIHDGGVDPQKNKEAITRKNMSGVARRTRRMRRRKRERLHKLDMLLGKFGYPVIEPESLDKPFEEWHVRAELATRYIEDDELRRESISIALRHMARHRGWRNPYRQVDSLISDNPYSKQYGELKEKAKAYNDDATAAEEESTPAQLVVAMLDAGYAEAPRLRWRTGSKKPDAEGYLPVRLMQEDNANELKQIFRVQRVPADEWKPLFRSVFYAVSPKGSAEQRVGQDPLAPEQARALKASLAFQEYRIANVITNLRIKDASAELRKLTVDEKQSIYDQLVSPSSEDITWSDLCDFLGFKRSQLKGVGSLTEDGEERISSRPPRLTSVQRIYESDNKIRKPLVAWWKSASDNEHEAMIRLLSNTVDIDKVREDVAYASAIEFIDGLDDDALTKLDSVDLPSGRAAYSVETLQKLTRQMLTTDDDLHEARKTLFNVTDSWRPPADPIGEPLGNPSVDRVLKNVNRYLMNCQQRWGNPVSVNIEHVRSSFSSVAFARKDKREYEKNNEKRSIFRSSLSEQLRADEQMEKVRESDLRRLEAIQRQNGQCLYCGRTITFRTCEMDHIVPRKGVGSTNTRTNFAAVCAECNRMKSNTPFAIWARSEDAQTRGVSLAEAKKRVTMFTFNPKSYAPREVKAFKQAVIARLQQTEDDAAIDNRSIESVAWMADELHRRIDWYFNAKQYVNSASIDDAEAETMKTTVSVFQGRVTASARRAAGIEGKIHFIGQQSKTRLDRRHHAVDASVIAMMNTAAAQTLMERESLRESQRLIGLMPGERSWKEYPYEGTSRYESFHLWLDNMDVLLELLNDALDNDRIAVMQSQRYVLGNSIAHDATIHPLEKVPLGSAMSADLIRRASTPALWCALTRLPDYDEKEGLPEDSHREIRVHDTRYSADDEMGFFASQAAQIAVQEGSADIGSAIHHARVYRCWKTNAKGVRKYFYGMIRVFQTDLLRACHDDLFTVPLPPQSISMRYGEPRVVQALQSGNAQYLGSLVVGDEIEMDFSSLDVDGQIGEYLQFFSQFSGGNLAWKHWVVDGFFNQTQLRIRPRYLAAEGLAKAFSDDVVPDGVQKIVTKQGWLPPVNTASKTAVRIVRRNAFGEPRLSSAHHMPCSWQWRHE(SEQ ID NO:169)
在一些实施方案中,所述Cas9蛋白可以是嗜粘蛋白艾克曼菌(A.muciniphila)Cas9,并且可以包含以下氨基酸序列或由其组成:
MSRSLTFSFDIGYASIGWAVIASASHDDADPSVCGCGTVLFPKDDCQAFKRREYRRLRRNIRSRRVRIERIGRLLVQAQIITPEMKETSGHPAPFYLASEALKGHRTLAPIELWHVLRWYAHNRGYDNNASWSNSLSEDGGNGEDTERVKHAQDLMDKHGTATMAETICRELKLEEGKADAPMEVSTPAYKNLNTAFPRLIVEKEVRRILELSAPLIPGLTAEIIELIAQHHPLTTEQRGVLLQHGIKLARRYRGSLLFGQLIPRFDNRIISRCPVTWAQVYEAELKKGNSEQSARERAEKLSKVPTANCPEFYEYRMARILCNIRADGEPLSAEIRRELMNQARQEGKLTKASLEKAISSRLGKETETNVSNYFTLHPDSEEALYLNPAVEVLQRSGIGQILSPSVYRIAANRLRRGKSVTPNYLLNLLKSRGESGEALEKKIEKESKKKEADYADTPLKPKYATGRAPYARTVLKKVVEEILDGEDPTRPARGEAHPDGELKAHDGCLYCLLDTDSSVNQHQKERRLDTMTNNHLVRHRMLILDRLLKDLIQDFADGQKDRISRVCVEVGKELTTFSAMDSKKIQRELTLRQKSHTDAVNRLKRKLPGKALSANLIRKCRIAMDMNWTCPFTGATYGDHELENLELEHIVPHSFRQSNALSSLVLTWPGVNRMKGQRTGYDFVEQEQENPVPDKPNLHICSLNNYRELVEKLDDKKGHEDDRRRKKKRKALLMVRGLSHKHQSQNHEAMKEIGMTEGMMTQSSHLMKLACKSIKTSLPDAHIDMIPGAVTAEVRKAWDVFGVFKELCPEAADPDSGKILKENLRSLTHLHHALDACVLGLIPYIIPAHHNGLLRRVLAMRRIPEKLIPQVRPVANQRHYVLNDDGRMMLRDLSASLKENIREQLMEQRVIQHVPADMGGALLKETMQRVLSVDGSGEDAMVSLSKKKDGKKEKNQVKASKLVGVFPEGPSKLKALKAAIEIDGNYGVALDPKPVVIRHIKVFKRIMALKEQNGGKPVRILKKGMLIHLTSSKDPKHAGVWRIESIQDSKGGVKLDLQRAHCAVPKNKTHECNWREVDLISLLKKYQMKRYPTSYTGTPR(SEQ ID NO:170)
在一些实施方案中,所述Cas9蛋白可以是兰氏臭杆菌(O.laneus)Cas9,并且可以包含以下氨基酸序列或由其组成:
METTLGIDLGTNSIGLALVDQEEHQILYSGVRIFPEGINKDTIGLGEKEESRNATRRAKRQMRRQYFRKKLRKAKLLELLIAYDMCPLKPEDVRRWKNWDKQQKSTVRQFPDTPAFREWLKQNPYELRKQAVTEDVTRPELGRILYQMIQRRGFLSSRKGKEEGKIFTGKDRMVGIDETRKNLQKQTLGAYLYDIAPKNGEKYRFRTERVRARYTLRDMYIREFEIIWQRQAGHLGLAHEQATRKKNIFLEGSATNVRNSKLITHLQAKYGRGHVLIEDTRITVTFQLPLKEVLGGKIEIEEEQLKFKSNESVLFWQRPLRSQKSLLSKCVFEGRNFYDPVHQKWIIAGPTPAPLSHPEFEEFRAYQFINNIIYGKNEHLTAIQREAVFELMCTESKDFNFEKIPKHLKLFEKFNFDDTTKVPACTTISQLRKLFPHPVWEEKREEIWHCFYFYDDNTLLFEKLQKDYALQTNDLEKIKKIRLSESYGNVSLKAIRRINPYLKKGYAYSTAVLLGGIRNSFGKRFEYFKEYEPEIEKAVCRILKEKNAEGEVIRKIKDYLVHNRFGFAKNDRAFQKLYHHSQAITTQAQKERLPETGNLRNPIVQQGLNELRRTVNKLLATCREKYGPSFKFDHIHVEMGRELRSSKTEREKQSRQIRENEKKNEAAKVKLAEYGLKAYRDNIQKYLLYKEIEEKGGTVCCPYTGKTLNISHTLGSDNSVQIEHIIPYSISLDDSLANKTLCDATFNREKGELTPYDFYQKDPSPEKWGASSWEEIEDRAFRLLPYAKAQRFIRRKPQESNEFISRQLNDTRYISKKAVEYLSAICSDVKAFPGQLTAELRHLWGLNNILQSAPDITFPLPVSATENHREYYVITNEQNEVIRLFPKQGETPRTEKGELLLTGEVERKVFRCKGMQEFQTDVSDGKYWRRIKLSSSVTWSPLFAPKPISADGQIVLKGRIEKGVFVCNQLKQKLKTGLPDGSYWISLPVISQTFKEGESVNNSKLTSQQVQLFGRVREGIFRCHNYQCPASGADGNFWCTLDTDTAQPAFTPIKNAPPGVGGGQIILTGDVDDKGIFHADDDLHYELPASLPKGKYYGIFTVESCDPTLIPIELSAPKTSKGENLIEGNIWVDEHTGEVRFDPKKNREDQRHHAIDAIVIALSSQSLFQRLSTYNARRENKKRGLDSTEHFPSPWPGFAQDVRQSVVPLLVSYKQNPKTLCKISKTLYKDGKKIHSCGNAVRGQLHKETVYGQRTAPGATEKSYHIRKDIRELKTSKHIGKVVDITIRQMLLKHLQENYHIDITQEFNIPSNAFFKEGVYRIFLPNKHGEPVPIKKIRMKEELGNAERLKDNINQYVNPRNNHHVMIYQDADGNLKEEIVSFWSVIERQNQGQPIYQLPREGRNIVSILQINDTFLIGLKEEEPEVYRNDLSTLSKHLYRVQKLSGMYYTFRHHLASTLNNEREEFRIQSLEAWKRANPVKVQIDEIGRITFLNGPLC(SEQ ID NO:171)。
在本公开文本的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从CRISPR Cas蛋白分离或衍生的序列。在一些实施方案中,所述CRISPR Cas蛋白包含V型CRISPR Cas蛋白。在一些实施方案中,所述V型CRISPR Cas蛋白包含Cpf1蛋白。本公开文本的示例性Cpf1蛋白可以从任何物种分离或衍生,所述物种包括但不限于细菌或古菌。本公开文本的示例性Cpf1蛋白可以从任何物种分离或衍生,所述物种包括但不限于土拉热弗朗西丝菌新凶手亚种、氨基酸球菌属物种(Acidaminococcus sp.)BV3L6和毛螺科细菌物种(Lachnospiraceae bacterium sp.)ND2006。本公开文本的示例性Cpf1蛋白可以是核酸酶失活的。
本公开文本的示例性野生型土拉热弗朗西丝菌新凶手亚种Cpf1(FnCpf1)蛋白可以包含以下氨基酸序列或由其组成:
本公开文本的示例性野生型毛螺科细菌物种ND2006 Cpf1(LbCpf1)蛋白可以包含以下氨基酸序列或由其组成:
本公开文本的示例性野生型氨基酸球菌属物种BV3L6 Cpf1(AsCpf1)蛋白可以包含以下氨基酸序列或由其组成:
在本公开文本的组合物的一些实施方案中,编码第一RNA结合蛋白的序列包含从CRISPR Cas蛋白分离或衍生的序列。在一些实施方案中,所述CRISPR Cas蛋白包含VI型CRISPR Cas蛋白或其部分。在一些实施方案中,所述VI型CRISPR Cas蛋白包含Cas13蛋白或其部分。本公开文本的示例性Cas13蛋白可以从任何物种分离或衍生,所述物种包括但不限于细菌或古菌。本公开文本的示例性Cas13蛋白可以从任何物种分离或衍生,所述物种包括但不限于韦德纤毛菌(Leptotrichia wadei)、西尔李斯特菌血清变型(Listeriaseeligeri serovar)1/2b(菌株ATCC 35967/DSM 20751/CIP 100100/SLCC 3954)、毛螺科细菌、嗜氨基梭菌(Clostridium aminophilum)DSM10710、鸡肉杆菌(Carnobacteriumgallinarum)DSM 4847、产丙酸沼杆菌(Paludibacter propionicigenes)WB4、韦氏李斯特菌(Listeria weihenstephanensis)FSL R9-0317、韦氏李斯特菌FSL R9-0317、细菌FSLM6-0635(纽约李斯特菌(Listeria newyorkensis))、韦德纤毛菌F0279、荚膜红细菌(Rhodobacter capsulatus)SB 1003、荚膜红细菌R121、荚膜红细菌DE442和溃疡棒状杆菌(Corynebacterium ulcerans)。本公开文本的示例性Cas13蛋白可以是DNA核酸酶失活的。本公开文本的示例性Cas13蛋白包括但不限于Cas13a、Cas13b、Cas13c、Cas13d及其直系同源物。本公开文本的示例性Cas13b蛋白包括但不限于亚型1和2,在本文中分别称为Csx27和Csx28。
示例性Cas13a蛋白包括但不限于:
本公开文本的示例性野生型Cas13a蛋白可以包含以下氨基酸序列或由其组成:
示例性Cas13b蛋白包括但不限于:
本公开文本的示例性野生型动物溃疡伯格菌ATCC 43767Cas13b(BzCas13b)蛋白可以包含以下氨基酸序列或由其组成:
在本公开文本的组合物的一些实施方案中,编码所述第一RNA结合蛋白或RNA指导的靶RNA结合蛋白的序列包含从CasRX/Cas13d蛋白分离或衍生的序列。CasRX/Cas13d是VI-D型CRISPR-Cas系统的效应子。在一些实施方案中,所述CasRX/Cas13d蛋白是可以切割或结合RNA的RNA指导的RNA内切核酸酶。在一些实施方案中,所述CasRX/Cas13d蛋白可以包括一个或多个高等真核生物和原核生物核苷酸结合(HEPN)结构域。在一些实施方案中,所述CasRX/Cas13d蛋白可以包括野生型或突变的HEPN结构域。在一些实施方案中,所述CasRX/Cas13d蛋白包括无法切割RNA但可以加工指导RNA的突变的HEPN结构域。在一些实施方案中,所述CasRX/Cas13d蛋白不需要原间隔子侧翼序列。
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群6049000251(CasRX/Cas13d Gut_metagenome_contig6049000251):
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群546000275:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群4114000374:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群721000619:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群2002000411:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群13552000311:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群10037000527:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群238000329:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群2643000492:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群874000057:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群4781000489:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群12144000352:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群5590000448:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群525000349:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群7229000302:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群3227000343:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_重叠群7030000469:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d肠道_宏基因组_P17E0k2120140920,_c87000043:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群emb|OBVH01003037.1,人肠宏基因组序列(也发现于WGS重叠群emb|OBXZ01000094.1|和emb|OBJF01000033.1|):
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群tpg|DJXD01000002.1|(未培育的瘤胃球菌属(Ruminococcus)联合体,UBA7013,来自绵羊肠道宏基因组):
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群tpg|D JXD01000002.1|(未培育的瘤胃球菌属联合体,UBA7013,来自绵羊肠道宏基因组)(SEQ ID NO:95)的示例性同向重复序列包含以下核酸序列或由其组成:
CasRX/Cas13d DR:
caactacaac cccgtaaaaa tacggggttc tgaaac 36
(SEQ ID NO:96)。
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群OGZC01000639.1(人肠道宏基因组联合体):
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群emb|OHBM01000764.1(人肠道宏基因组联合体):
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群emb|OHCP01000044.1(人肠道宏基因组联合体):
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群emb|OGDF01008514.1|(人肠道宏基因组联合体):
(SEQ ID NO:100)。
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群emb|OGPN01002610.1(人肠道宏基因组联合体):
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):来自重叠群emb|OBLI01020244和emb|OBLI01038679(来自猪肠道宏基因组):
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群OIZX01000427.1:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群OCTW011587266.1:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群emb|OGNF01009141.1:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群emb|OIEN01002196.1:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群e-k87_11092736:
CasRX/Cas13d宏基因组命中(无蛋白质登录号):重叠群e-k87_11092736(SEQ IDNO:107)的示例性同向重复序列包含以下核酸序列或由其组成:
CasRX/Cas13d同向重复1:gtgagaagtc tccttatggg gagatgctac 30
(SEQ ID NO:108)。
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d Ga0129306_1000735:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d Ga0129317_1008067:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d Ga0224415_10048792:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d 160582958_基因49834:
CasRX/Cas13d蛋白的示例性同向重复序列可以包含以下序列或由其组成:
CasRX/Cas13d 160582958_基因49834(SEQ ID NO:112)包含以下核酸序列或由其组成:
CasRX/Cas13d DR:
gaactacacc cctctgttct tgtaggggtc taacac 36
(SEQ ID NO:113)。
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d 250twins_35838_GL0110300:
示例性CasRX/Cas13d蛋白可以包含以下序列或由其组成:
CasRX/Cas13d 250twins_36050_GL0158985:
Yan等人(2018)Mol Cell.70(2):327-339(doi:10.1016/j.molcel.2018.02.2018)和Konermann等人(2018)Cell 173(3):665-676(doi:10.1016/j.c ell/2018.02.033)已经描述了CasRX/Cas13d蛋白,将所述两篇参考文献都通过引用以其整体并入本文。还参见WO公开号WO 2018/183703(CasM)和WO2019/006471(Cas13d),将其通过引用以其整体并入本文。
本公开文本的示例性野生型Cas13d蛋白可以包含以下氨基酸序列或由其组成:
Cas13d(生黄瘤胃球菌(Ruminococcus flavefaciens)XPD3002)序列:
本公开文本的示例性野生型Cas13d蛋白可以包含以下氨基酸序列或由其组成:
Cas13d(重叠群e-k87_11092736):
MKRQKTFAKRIGIKSTVAYGQGKYAITTFGKGSKAEIAVRSADPPEETLPTESDATLSIHAKFAKAGRDGREFKCGDVDETRIHTSRSEYESLISNPAESPREDYLGLKGTLERKFFGDEYPKDNLRIQIIYSILDIQKILGLYVEDILHFVDGLQDEPEDLVGLGLGDEKMQKLLSKALPYMGFFGSTDVFKVTKKREERAAADEHNAKVFRALGAIRQKLAHFKWKESLAIFGANANMPIRFFQGATGGRQLWNDVIAPLWKKRIERVRKSFLSNSAKNLWVLYQVFKDDTDEKKKARARQYYHFSVLKEGKNLGFNLTKTREYFLDKFFPIFHSSAPDVKRKVDTFRSKFYAILDFIIYEASVSVANSGQMGKVAPWKGAIDNALVKLREAPDEEAKEKIYNVLAASIRNDSLFLRLKSACDKFGAEQNRPVFPNELRNNRDIRNVRSEWLEATQDVDAAAFVQLIAFLCNFLEGKEINELVTALIKKFEGIQALIDLLRNLEGVDSIRFENEFALFNDDKGNMAGRIARQLRLLASVGKMKPDMTDAKRVLYKSALEILGAPPDEVSDEWLAENILLDKSNNDYQKAKKTVNPFRNYIAKNVITSRSFYYLVRYAKPTAVRKLMSNPKIVRYVLKRLPEKQVASYYSAIWTQSESNSNEMVKLIEMIDRLTTEIAGFSFAVLKDKKDSIVSASRESRAVNLEVERLKKLTTLYMSIAYIAVKSLVKVNARYFIAYSALERDLYFFNEKYGEEFRLHFIPYELNGKTCQFEYLAILKYYLARDEETLKRKCEICEEIKVGCEKHKKNANPPYEYDQEWIDKKKALNSERKACERRLHFSTHWAQYATKRDENMAKHPQKWYDILASHYDELLALQATGWLATQARNDAEHLNPVNEFDVYIEDLRRYPEGTPKNKDYHIGSYFEIYHYIRQRAYLEEVLAKRKEYRDSGSFTDEQLDKLQKILDDIRARGSYDKNLLKLEYLPFAYNLPRYKNLTTEALFDDDSVSGKKRVAEWREREKTREAEREQRRQR(SEQ ID NO:46)。
Cas13d(重叠群e-k87_11092736)(SEQ ID NO:46)的示例性同向重复序列包含以下核酸序列或由其组成:
Cas13d(重叠群e-k87_11092736)同向重复序列:
GTGAGAAGTCTCCTTATGGGGAGATGCTAC(SEQ ID NO:47)。
本公开文本的示例性野生型Cas13d蛋白可以包含以下氨基酸序列或由其组成:
Cas13d(160582958_基因49834):
MKNSVTFKLIQAQENKEAARKKAKDIAEQARIAKRNGVVKKEENRINRIQIEIQTQKKSNTQNAYHLKSLAKAAGVKSVFAIGNDLLMTGFGPGNDATIEKRVFQNRAIETLSSPEQYSAEFQNKQFKIKGNIKVLNHSTQKMEEIQTELQDNYNRPHFDLLGCKNVLEQKYFGRTFSDNIHVQIAYNIMDIEKLLTPYINNIIYTLNELMRDNSKDDFFGCDSHFSVAYLYDELKAGYSDRLKTKPNLSKNIDRIWNNFCNYMNSDSGNTEARLAYFGELFYKPKETGDAKSDYKTHLSNNQKEEWELKSDKEVYNIFAILCDLRHFCTHGESITPSGKPFPYNLEKNLFPEAKQVLNSLFEEKAESLGAEAFGKTAGKTDVSILLKVFEKEQASQKEQQALLKEYYDFKVQKTYKNMGFSIKKLREAIMEIPDAAKFKDDLYSSLRHKLYGLFDFILVKHFLDTSDSENLQNNDIFRQLRACRCEEEKDQVYRSIAVKVWEKVKKKELNMFKQVVVIPSLSKDELKQMEMTKNTELLSSIETISTQASLFSEMIFMMTYLLDGKEINLLCTSLIEKFENIASFNEVLKSPQIGYETKYTEGYAFFKNADKTAKELRQVNNMARMTKPLGGVNTKCVMYNEAAKILGAKPMSKAELESVFNLDNHDYTYSPSGKKIPNKNFRNFIINNVITSRRFLYLIRYGNPEKIRKIAINPSIISFVLKQIPDEQIKRYYPPCIGKRTDDVTLMRDELGKMLQSVNFEQFSRVNNKQNAKQNPNGEKARLQACVRLYLTVPYLFIKNMVNINARYVLAFHCLERDHALCFNSRKLNDDSYNEMANKFQMVRKAKKEQYEKEYKCKKQETGTAHTKKIEKLNQQIAYIDKDIKNMHSYTCRNYRNLVAHLNVVSKLQNYVSELPNDYQITSYFSFYHYCMQLGLMEKVSSKNIPLVESLKNEANDAQSYSAKKTLEYFDLIEKNRTYCKDFLKALNAPFSYNLPRFKNLSIEALFDKNIVYEQADLKKE(SEQ ID NO:48)。
Cas13d(160582958_基因49834)(SEQ ID NO:48)的示例性同向重复序列包含以下核酸序列或由其组成:
Cas13d(160582958_基因49834)同向重复序列:
GAACTACACCCCTCTGTTCTTGTAGGGGTCTAACAC(SEQ ID NO:49)。
本公开文本的示例性野生型Cas13d蛋白可以包含以下氨基酸序列或由其组成:
Cas13d(重叠群tpg|DJXD01000002.1|;未培育的瘤胃球菌属联合体,UBA7013,来自绵羊肠道宏基因组):
MKKQKSKKTVSKTSGLKEALSVQGTVIMTSFGKGNMANLSYKIPSSQKPQNLNSSAGLKNVEVSGKKIKFQGRHPKIATTDNPLFKPQPGMDLLCLKDKLEMHYFGKTFDDNIHIQLIYQILDIEKILAVHVNNIVFTLDNVLHPQKEELTEDFIGAGGWRINLDYQTLRGQTNKYDRFKNYIKRKELLYFGEAFYHENERRYEEDIFAILTLLSALRQFCFHSDLSSDESDHVNSFWLYQLEDQLSDEFKETLSILWEEVTERIDSEFLKTNTVNLHILCHVFPKESKETIVRAYYEFLIKKSFKNMGFSIKKLREIMLEQSDLKSFKEDKYNSVRAKLYKLFDFIITYYYDHHAFEKEALVSSLRSSLTEENKEEIYIKTARTLASALGADFKKAAADVNAKNIRDYQKKANDYRISFEDIKIGNTGIGYFSELIYMLTLLLDGKEINDLLTTLINKFDNIISFIDILKKLNLEFKFKPEYADFFNMTNCRYTLEELRVINSIARMQKPSADARKIMYRDALRILGMDNRPDEEIDRELERTMPVGADGKFIKGKQGFRNFIASNVIESSRFHYLVRYNNPHKTRTLVKNPNVVKFVLEGIPETQIKRYFDVCKGQEIPPTSDKSAQIDVLARIISSVDYKIFEDVPQSAKINKDDPSRNFSDALKKQRYQAIVSLYLTVMYLITKNLVYVNSRYVIAFHCLERDAFLHGVTLPKMNKKIVYSQLTTHLLTDKNYTTYGHLKNQKGHRKWYVLVKNNLQNSDITAVSSFRNIVAHISVVRNSNEYISGIGELHSYFELYHYLVQSMIAKNNWYDTSHQPKTAEYLNNLKKHHTYCKDFVKAYCIPFGYVVPRYKNLTINELFDRNNPNPEPKEEV(SEQ ID NO:50)。
Cas13d(重叠群tpg|DJXD01000002.1|;未培育的瘤胃球菌属联合体,UBA7013,来自绵羊肠道宏基因组)(SEQ ID NO:50)的示例性同向重复序列包含以下核酸序列或由其组成:
Cas13d(重叠群tpg|DJXD01000002.1|;未培育的瘤胃球菌属联合体,UBA7013,来自绵羊肠道宏基因组):CAACTACAACCCCGTAAAAATACGGGGTTCTGAAAC(SEQ ID NO:51)。
在本公开文本的一些实施方案中,CjeCas9-内切核酸酶融合物和gRNA分子可以包含以下的核酸序列或由其组成:
E43-CjeCas9和sgRNA质粒(U6:N=sgRNA间隔子,E43,CjeCas9)gtttattacagggac agcagagatccagtttggttaattaaggtaccgagggcctatttcccatgattccttcatatttgcatatacgata caaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtaga aagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaactt gaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNGTTTTAGTCCCTGAAGGGACTAAAATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGCTTTTTTTCCTGCAGCCCGGGGGATCCACTAGTTCTAGAGCGGCCGCCACCGCGGTGGAGCTCCAGCTTTTGTTCCCTTTAGTGAGGGTTAATTGCGCGAATTCGCTAGCTAGGTCTTGAAAGGAGTGGGAATTGGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGATCCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGACCGGTTCTAGAGCGCTATTTAGAACCatgTGTTCTCCCCAAGAATCTGGCATGACCGCTCTTTCAGCGAGGATGTTGACGCGAAGCAGATCCCTGGGACCTGGGGCCGGGCCACGAGGGTGTCGGGAAGAACCAGGACCGTTGCGACGGAGGGAAGCAGCAGCGGAAGCTCGGAAATCCCATTCTCCGGTTAAACGACCCCGCAAGGCACAACGGCTCAGGGTTGCTTACGAGGGGAGCGATTCCGAAAAGGGTGAAGGAGCAGAGCCCTTGAAGGTTCCAGTATGGGAACCCCAGGATTGGCAGCAGCAGCTTGTAAACATCCGAGCAATGAGGAACAAAAAAGATGCACCTGTTGATCACCTCGGAACCGAACATTGTTATGATTCTAGTGCGCCGCCAAAAGTCCGCCGGTATCAGGTTCTGTTGAGTTTGATGCTGAGTAGTCAGACTAAGGACCAGGTTACGGCCGGAGCAATGCAACGGCTTCGGGCACGGGGACTCACGGTCGATAGCATTTTGCAGACCGATGACGCAACATTGGGTAAACTCATATATCCAGTTGGCTTCTGGCGGAGCAAAGTGAAGTACATCAAGCAGACCTCAGCCATTCTCCAACAACATTACGGAGGTGATATACCCGCAAGCGTAGCTGAACTGGTAGCACTGCCGGGCGTCGGTCCCAAAATGGCACATCTGGCTATGGCGGTTGCTTGGGGAACGGTGTCTGGTATCGCAGTTGATACGCATGTCCACCGCATCGCCAATCGGCTGAGGTGGACTAAAAAAGCCACTAAGTCTCCTGAAGAAACACGGGCTGCTCTGGAAGAGTGGCTTCCACGAGAGCTGTGGCATGAAATCAATGGATTGCTGGTTGGTTTCGGGCAGCAGACATGCTTGCCCGTGCACCCCCGGTGTCATGCTTGCTTGAACCAGGCTTTGTGCCCAGCTGCCCAGGGCCTGAGTGGAAGTGAGACACCGGGAACATCTGAGTCTGCGACCCCGGAGAGCacaaacGCGCGAATCCTGGCCTTCGcgATTGGCATTAGCAGCATCGGCTGGGCATTCTCTGAAAACGACGAACTGAA GGATTGCGGCGTGCGAATTTTCACTAAGGTCGAAAATCCCAAAACTGGTGAATCACTCGCTCTCCCTAGACGACTG GCACGCTCCGCACGAAAGAGGCTTGCCCGCCGCAAGGCACGCTTGAACCATCTTAAACACCTTATTGCAAATGAGT TTAAACTGAATTATGAGGACTACCAATCCTTTGACGAGTCTCTTGCTAAAGCCTACAAAGGGAGCCTTATATCCCC GTATGAGCTCCGGTTCAGAGCACTCAACGAACTGCTGTCCAAACAGGATTTTGCTCGCGTGATTCTCCACATAGCG AAGAGGCGAGGATACGATGACATTAAAAACAGTGATGATAAGGAAAAAGGGGCCATACTCAAAGCGATTAAGCAAA ATGAAGAGAAGCTCGCTAACTATCAATCAGTAGGGGAGTATCTCTATAAAGAGTACTTCCAGAAGTTCAAAGAAAA TAGCAAGGAATTTACTAATGTCCGGAATAAAAAGGAGTCTTACGAAAGATGTATTGCGCAATCTTTCCTCAAGGAC GAGCTCAAATTGATTTTCAAGAAACAAAGGGAATTTGGGTTCAGCTTCTCAAAAAAATTTGAGGAAGAGGTTCTGA GCGTTGCCTTTTACAAACGCGCCCTTAAGGACTTCTCACATCTCGTAGGGAATTGTAGTTTCTTCACCGATGAAAA ACGGGCGCCAAAAAATAGCCCTTTGGCTTTTATGTTTGTCGCTCTGACTCGCATCATTAATCTGCTCAACAACCTT AAAAACACGGAAGGGATTCTGTACACAAAGGATGATCTGAACGCTCTGCTTAACGAAGTTTTGAAGAACGGGACTT TGACCTACAAACAAACCAAAAAGCTTCTTGGTCTCAGTGATGACTACGAATTCAAGGGAGAAAAAGGGACATATTT CATCGAATTCAAGAAGTATAAGGAGTTCATCAAAGCCTTGGGCGAGCACAACTTGTCTCAAGATGATCTCAACGAA ATTGCTAAGGATATCACTCTGATTAAAGACGAGATCAAGCTCAAAAAGGCGTTGGCGAAGTATGACCTTAACCAAA ACCAAATAGATAGCCTCAGCAAGTTGGAATTTAAAGATCACTTGAATATAAGTTTCAAGGCCCTTAAGTTGGTCAC CCCCTTGATGCTTGAAGGAAAGAAATATGATGAGGCATGTAATGAGCTGAATCTCAAGGTTGCTATTAACGAAGAC AAAAAAGATTTCCTCCCAGCTTTCAATGAGACTTACTATAAGGACGAGGTTACCAATCCTGTGGTGCTCCGAGCCA TCAAAGAGTATCGAAAGGTCCTGAATGCTTTGCTCAAAAAATACGGTAAGGTACACAAAATAAATATTGAGCTCGC AAGGGAGGTCGGTAAGAACCACTCCCAGCGCGCCAAAATAGAAAAGGAACAGAATGAAAATTACAAAGCGAAAAAG GACGCCGAGCTCGAGTGCGAAAAGCTGGGCCTGAAAATAAACAGCAAGAACATTCTCAAACTCCGCCTCTTCAAAG AACAAAAAGAATTTTGTGCTTATAGTGGTGAGAAAATAAAAATCTCCGATCTTCAAGACGAGAAGATGCTCGAAAT AGACgcgATATATCCATATAGCAGGTCTTTTGACGATTCTTACATGAATAAAGTGCTTGTTTTCACTAAGCAGAAT CAGGAAAAGTTGAATCAGACCCCCTTTGAGGCCTTTGGCAACGACTCAGCAAAGTGGCAGAAGATCGAGGTCTTGG CTAAGAATCTTCCTACTAAGAAACAGAAAAGGATATTGGATAAGAACTATAAAGACAAAGAACAAAAGAACTTTAA AGACCGCAACCTCAATGACACCAGATACATAGCAAGATTGGTTCTGAACTACACAAAAGATTATTTGGACTTCTTG CCGCTGTCTGATGATGAGAACACGAAACTCAACGACACGCAAAAGGGGTCTAAAGTCCACGTCGAAGCTAAATCTG GGATGCTCACCTCAGCATTGAGGCATACGTGGGGATTCTCAGCAAAGGACCGAAACAATCACCTGCACCATGCCAT TGACGCAGTTATCATAGCGTATGCCAATAATTCAATAGTAAAAGCGTTTAGCGACTTCAAGAAGGAACAAGAGTCC AACAGCGCCGAGCTCTACGCAAAAAAGATTAGTGAACTCGACTACAAAAACAAAAGAAAATTCTTTGAGCCGTTCA GCGGATTTCGACAGAAGGTATTGGATAAAATAGATGAAATTTTCGTGAGCAAACCCGAAAGGAAAAAGCCCTCAGG CGCCTTGCACGAAGAGACTTTCAGGAAGGAAGAGGAATTCTACCAAAGCTACGGCGGAAAAGAGGGAGTTTTGAAG GCTCTCGAACTTGGAAAGATTAGGAAGGTGAACGGCAAGATAGTGAAAAACGGCGATATGTTCCGGGTTGATATCT TCAAACATAAAAAAACGAATAAATTTTATGCTGTGCCTATATACACTATGGACTTCGCACTTAAGGTCCTGCCGAA TAAGGCGGTAGCCCGATCTAAAAAAGGCGAAATTAAGGACTGGATTTTGATGGATGAAAATTACGAGTTCTGCTTT TCTCTCTACAAGGATTCCCTTATATTGATACAGACGAAAGATATGCAGGAACCGGAATTCGTGTATTACAACGCTT TTACTTCCTCTACGGTATCTTTGATTGTCTCCAAACATGACAACAAATTCGAAACACTCAGTAAAAACCAAAAGAT TCTCTTTAAAAATGCGAACGAGAAAGAAGTAATTGCAAAATCAATTGGCATCCAAAATTTGAAAGTTTTTGAAAAA TATATAGTATCTGCCCTCGGAGAGGTTACTAAAGCGGAATTTAGACAGCGAGAGGACTTCAAAAAATCAGGTCCACCCAAGAAAAAACGCAAGGTGGAAGATCCGAAGAAAAAGCGAAAAGTGGATGTGtaaCGTTTTCCGGGACGCCGGCTGGATGATCCTCCAGCGCGGGGATCTCATGCTGGAGTTCTTCGCCCACCCCAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTATACCG(SEQ ID NO:202)。
在本公开文本的一些实施方案中,CjeCas9-内切核酸酶融合物和gRNA分子可以包含以下的核酸序列或由其组成:
E67-CjeCas9和sgRNA质粒(U6:N=sgRNA间隔子,E67,CjeCas9)gtttattacagggac agcagagatccagtttggttaattaaggtaccgagggcctatttcccatgattccttcatatttgcatatacgata caaggctgttagagagataattagaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtaga aagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaactt gaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNGTTTTAGTCCCTGAAGGGACTAAAATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGCTTTTTTTCCTGCAGCCCGGGGGATCCACTAGTTCTAGAGCGGCCGCCACCGCGGTGGAGCTCCAGCTTTTGTTCCCTTTAGTGAGGGTTAATTGCGCGAATTCGCTAGCTAGGTCTTGAAAGGAGTGGGAATTGGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGATCCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGACCGGTTCTAGAGCGCTATTTAGAACCatgCAGGAGGTAATAGCGGGGCTTGAGCGATTTACCTTTGCCTTCGAAAAAGACGTAGAGATGCAGAAGGGAACCGGCCTGCTCCCATTTCAAGGTATGGACAAATCAGCATCTGCCGTGTGCAATTTTTTCACCAAGGGTCTGTGTGAAAAGGGGAAGCTCTGTCCATTTCGCCATGATCGCGGAGAGAAGATGGTGGTGTGTAAGCACTGGCTGAGAGGGCTTTGCAAAAAAGGCGACCACTGCAAATTTCTTCACCAATATGACCTGACTCGAATGCCTGAGTGTTATTTTTACAGTAAGTTCGGTGACTGTAGCAACAAAGAATGCAGCTTCTTGCATGTCAAACCAGCATTCAAGTCACAGGATTGCCCGTGGTACGATCAGGGTTTTTGCAAGGACGGTCCCCTCTGCAAATATCGACACGTACCCAGAATTATGTGCCTTAATTACCTGGTCGGCTTCTGTCCTGAAGGGCCAAAATGTCAGTTTGCTCAAAAAATTCGCGAGTTCAAATTGCTCCCTGGGTCTAAAATTTGGGAACCCCAGGATTGGCAGCAGCAGCTTGTAAACATCCGAGCAATGAGGAACAAAAAAGATGCACCTGTTGATCACCTCGGAACCGAACATTGTTATGATTCTAGTGCGCCGCCAAAAGTCCGCCGGTATCAGGTTCTGTTGAGTTTGATGCTGAGTAGTCAGACTAAGGACCAGGTTACGGCCGGAGCAATGCAACGGCTTCGGGCACGGGGACTCACGGTCGATAGCATTTTGCAGACCGATGACGCAACATTGGGTAAACTCATATATCCAGTTGGCTTCTGGCGGAGCAAAGTGAAGTACATCAAGCAGACCTCAGCCATTCTCCAACAACATTACGGAGGTGATATACCCGCAAGCGTAGCTGAACTGGTAGCACTGCCGGGCGTCGGTCCCAAAATGGCACATCTGGCTATGGCGGTTGCTTGGGGAACGGTGTCTGGTATCGCAGTTGATACGCATGTCCACCGCATCGCCAATCGGCTGAGGTGGACTAAAAAAGCCACTAAGTCTCCTGAAGAAACACGGGCTGCTCTGGAAGAGTGGCTTCCACGAGAGCTGTGGCATGAAATCAATGGATTGCTGGTTGGTTTCGGGCAGCAGACATGCTTGCCCGTGCACCCCCGGTGTCATGCTTGCTTGAACCAGGCTTTGTGCCCAGCTGCCCAGGGCCTGAGTGGAAGTGAGACACCGGGAACATCTGAGTCTGCGACCCCGGAGAGCacaaacGCGCGAATCCTGGCCTTCGc gATTGGCATTAGCAGCATCGGCTGGGCATTCTCTGAAAACGACGAACTGAAGGATTGCGGCGTGCGAATTTTCACT AAGGTCGAAAATCCCAAAACTGGTGAATCACTCGCTCTCCCTAGACGACTGGCACGCTCCGCACGAAAGAGGCTTG CCCGCCGCAAGGCACGCTTGAACCATCTTAAACACCTTATTGCAAATGAGTTTAAACTGAATTATGAGGACTACCA ATCCTTTGACGAGTCTCTTGCTAAAGCCTACAAAGGGAGCCTTATATCCCCGTATGAGCTCCGGTTCAGAGCACTC AACGAACTGCTGTCCAAACAGGATTTTGCTCGCGTGATTCTCCACATAGCGAAGAGGCGAGGATACGATGACATTA AAAACAGTGATGATAAGGAAAAAGGGGCCATACTCAAAGCGATTAAGCAAAATGAAGAGAAGCTCGCTAACTATCA ATCAGTAGGGGAGTATCTCTATAAAGAGTACTTCCAGAAGTTCAAAGAAAATAGCAAGGAATTTACTAATGTCCGG AATAAAAAGGAGTCTTACGAAAGATGTATTGCGCAATCTTTCCTCAAGGACGAGCTCAAATTGATTTTCAAGAAAC AAAGGGAATTTGGGTTCAGCTTCTCAAAAAAATTTGAGGAAGAGGTTCTGAGCGTTGCCTTTTACAAACGCGCCCT TAAGGACTTCTCACATCTCGTAGGGAATTGTAGTTTCTTCACCGATGAAAAACGGGCGCCAAAAAATAGCCCTTTG GCTTTTATGTTTGTCGCTCTGACTCGCATCATTAATCTGCTCAACAACCTTAAAAACACGGAAGGGATTCTGTACA CAAAGGATGATCTGAACGCTCTGCTTAACGAAGTTTTGAAGAACGGGACTTTGACCTACAAACAAACCAAAAAGCT TCTTGGTCTCAGTGATGACTACGAATTCAAGGGAGAAAAAGGGACATATTTCATCGAATTCAAGAAGTATAAGGAG TTCATCAAAGCCTTGGGCGAGCACAACTTGTCTCAAGATGATCTCAACGAAATTGCTAAGGATATCACTCTGATTA AAGACGAGATCAAGCTCAAAAAGGCGTTGGCGAAGTATGACCTTAACCAAAACCAAATAGATAGCCTCAGCAAGTT GGAATTTAAAGATCACTTGAATATAAGTTTCAAGGCCCTTAAGTTGGTCACCCCCTTGATGCTTGAAGGAAAGAAA TATGATGAGGCATGTAATGAGCTGAATCTCAAGGTTGCTATTAACGAAGACAAAAAAGATTTCCTCCCAGCTTTCA ATGAGACTTACTATAAGGACGAGGTTACCAATCCTGTGGTGCTCCGAGCCATCAAAGAGTATCGAAAGGTCCTGAA TGCTTTGCTCAAAAAATACGGTAAGGTACACAAAATAAATATTGAGCTCGCAAGGGAGGTCGGTAAGAACCACTCC CAGCGCGCCAAAATAGAAAAGGAACAGAATGAAAATTACAAAGCGAAAAAGGACGCCGAGCTCGAGTGCGAAAAGC TGGGCCTGAAAATAAACAGCAAGAACATTCTCAAACTCCGCCTCTTCAAAGAACAAAAAGAATTTTGTGCTTATAG TGGTGAGAAAATAAAAATCTCCGATCTTCAAGACGAGAAGATGCTCGAAATAGACgcgATATATCCATATAGCAGG TCTTTTGACGATTCTTACATGAATAAAGTGCTTGTTTTCACTAAGCAGAATCAGGAAAAGTTGAATCAGACCCCCT TTGAGGCCTTTGGCAACGACTCAGCAAAGTGGCAGAAGATCGAGGTCTTGGCTAAGAATCTTCCTACTAAGAAACA GAAAAGGATATTGGATAAGAACTATAAAGACAAAGAACAAAAGAACTTTAAAGACCGCAACCTCAATGACACCAGA TACATAGCAAGATTGGTTCTGAACTACACAAAAGATTATTTGGACTTCTTGCCGCTGTCTGATGATGAGAACACGA AACTCAACGACACGCAAAAGGGGTCTAAAGTCCACGTCGAAGCTAAATCTGGGATGCTCACCTCAGCATTGAGGCA TACGTGGGGATTCTCAGCAAAGGACCGAAACAATCACCTGCACCATGCCATTGACGCAGTTATCATAGCGTATGCC AATAATTCAATAGTAAAAGCGTTTAGCGACTTCAAGAAGGAACAAGAGTCCAACAGCGCCGAGCTCTACGCAAAAA AGATTAGTGAACTCGACTACAAAAACAAAAGAAAATTCTTTGAGCCGTTCAGCGGATTTCGACAGAAGGTATTGGA TAAAATAGATGAAATTTTCGTGAGCAAACCCGAAAGGAAAAAGCCCTCAGGCGCCTTGCACGAAGAGACTTTCAGG AAGGAAGAGGAATTCTACCAAAGCTACGGCGGAAAAGAGGGAGTTTTGAAGGCTCTCGAACTTGGAAAGATTAGGA AGGTGAACGGCAAGATAGTGAAAAACGGCGATATGTTCCGGGTTGATATCTTCAAACATAAAAAAACGAATAAATT TTATGCTGTGCCTATATACACTATGGACTTCGCACTTAAGGTCCTGCCGAATAAGGCGGTAGCCCGATCTAAAAAA GGCGAAATTAAGGACTGGATTTTGATGGATGAAAATTACGAGTTCTGCTTTTCTCTCTACAAGGATTCCCTTATAT TGATACAGACGAAAGATATGCAGGAACCGGAATTCGTGTATTACAACGCTTTTACTTCCTCTACGGTATCTTTGAT TGTCTCCAAACATGACAACAAATTCGAAACACTCAGTAAAAACCAAAAGATTCTCTTTAAAAATGCGAACGAGAAA GAAGTAATTGCAAAATCAATTGGCATCCAAAATTTGAAAGTTTTTGAAAAATATATAGTATCTGCCCTCGGAGAGG TTACTAAAGCGGAATTTAGACAGCGAGAGGACTTCAAAAAATCAGGTCCACCCAAGAAAAAACGCAAGGTGGAAGATCCGAAGAAAAAGCGAAAAGTGGATGTGtaaCGTTTTCCGGGACGCCGGCTGGATGATCCTCCAGCGCGGGGATCTCATGCTGGAGTTCTTCGCCCACCCCAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTATACCG(SEQ ID NO:203)。
gRNA靶序列
在本公开文本的组合物的一些实施方案中,RNA分子的靶序列包含对应于第一RNA结合蛋白和/或第二RNA结合蛋白的序列基序。
在本公开文本的组合物和方法的一些实施方案中,所述序列基序是疾病或障碍的标志。
本公开文本的序列基序可以从基因组序列中发现的外来或外源序列的序列分离或衍生,并且因此翻译为本公开文本的mRNA分子或在本公开文本的RNA序列中发现的外来或外源序列的序列。
本公开文本的序列基序可以包含内源序列中引起疾病或障碍的突变或由其组成。所述突变可以包含序列取代、倒位、缺失、插入、转座或其任何组合,或者由其组成。
本公开文本的序列基序可以包含重复的序列或由其组成。在一些实施方案中,所述重复的序列可能与微卫星不稳定性(MSI)相关。一个或多个基因座处的MSI是由于本公开文本的细胞的DNA错配修复机制受损所致。可以将DNA的超变序列转录为本公开文本的包含靶序列的mRNA,所述靶序列包含所述超变序列或由其组成。
本公开文本的序列基序可以包含生物标记或由其组成。所述生物标记可以指示患上疾病或障碍的风险。所述生物标记可以指示健康基因(低或无可确定的患上疾病或障碍的风险)。所述生物标记可以指示编辑的基因。示例性生物标记包括但不限于单核苷酸多态性(SNP)、序列变异或突变、表观遗传标记、剪接受体位点、外源序列、异源序列及其任何组合。
本公开文本的序列基序可以包含二级、三级或四级结构或由其组成。所述二级、三级或四级结构可以是内源的或天然存在的。所述二级、三级或四级结构可以是诱导的或非天然存在的。所述二级、三级或四级结构可以由内源、外源或异源序列编码。
在本公开文本的组合物和方法的一些实施方案中,RNA分子的靶序列包含在2个与100个之间的核苷酸或核酸碱基(包括端点)或由其组成。在一些实施方案中,RNA分子的所述靶序列包含在2个与50个之间的核苷酸或核酸碱基(包括端点)或由其组成。在一些实施方案中,RNA分子的所述靶序列包含在2个与20个之间的核苷酸或核酸碱基(包括端点)或由其组成。
在本公开文本的组合物和方法的一些实施方案中,RNA分子的靶序列是连续的。在一些实施方案中,RNA分子的所述靶序列是不连续的。例如,RNA分子的所述靶序列可以包含不连续的一个或多个核苷酸或核酸碱基或由其组成,因为一个或多个间断的核苷酸定位于所述靶序列的核苷酸之间。
在本公开文本的组合物和方法的一些实施方案中,RNA分子的靶序列是天然存在的。在一些实施方案中,RNA分子的所述靶序列是非天然存在的。示例性的非天然存在的靶序列可以包含序列变异或突变、嵌合序列、外源序列、异源序列、嵌合序列、重组序列、包含修饰的或合成的核苷酸的序列或其任何组合,或者由其组成。
在本公开文本的组合物和方法的一些实施方案中,RNA分子的靶序列与本公开文本的指导RNA结合。
在本公开文本的组合物和方法的一些实施方案中,RNA分子的靶序列与本公开文本的第一RNA结合蛋白结合。
在本公开文本的组合物和方法的一些实施方案中,RNA分子的靶序列与本公开文本的第二RNA结合蛋白结合。
RNA分子
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子包含靶序列。在一些实施方案中,本公开文本的RNA分子包含至少一个靶序列。在一些实施方案中,本公开文本的RNA分子包含一个或多个靶序列。在一些实施方案中,本公开文本的RNA分子包含两个或更多个靶序列。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子是天然存在的RNA分子。在一些实施方案中,本公开文本的RNA分子是非天然存在的分子。示例性的非天然存在的RNA分子可以包含序列变异或突变、嵌合序列、外源序列、异源序列、嵌合序列、重组序列、包含修饰的或合成的核苷酸的序列或其任何组合,或者由其组成。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子包含从病毒分离或衍生的序列或由其组成。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子包含从原核生物分离或衍生的序列或由其组成。在一些实施方案中,本公开文本的RNA分子包含从古菌的物种或菌株或者细菌的物种或菌株分离或衍生的序列或由其组成。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子包含从真核生物分离或衍生的序列或由其组成。在一些实施方案中,本公开文本的RNA分子包含从以下的物种分离或衍生的序列或由其组成:原生动物、寄生虫、原生生物、藻类、真菌、酵母、变形虫、蠕虫、微生物、无脊椎动物、脊椎动物、昆虫、啮齿类动物、小鼠、大鼠、哺乳动物或灵长类动物。在一些实施方案中,本公开文本的RNA分子包含从人分离或衍生的序列或由其组成。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子包含从生物或病毒的基因组的编码序列衍生的序列或由其组成。在一些实施方案中,本公开文本的RNA分子包含初级RNA转录物、前体信使RNA(前体mRNA)或信使RNA(mRNA)或由其组成。在一些实施方案中,本公开文本的RNA分子包含尚未加工的基因产物(例如转录物)或由其组成。在一些实施方案中,本公开文本的RNA分子包含已经进行转录后加工的基因产物(例如包含5'帽和3'多聚腺苷酸化信号的转录物)或由其组成。在一些实施方案中,本公开文本的RNA分子包含已经进行选择性剪接的基因产物(例如剪接变体)或由其组成。在一些实施方案中,本公开文本的RNA分子包含已经进行非编码序列和/或内含子序列的去除的基因产物(例如信使RNA(mRNA))或由其组成。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子包含从非编码序列衍生的序列(例如非编码RNA(ncRNA))或由其组成。在一些实施方案中,本公开文本的RNA分子包含核糖体RNA或由其组成。在一些实施方案中,本公开文本的RNA分子包含小ncRNA分子或由其组成。本公开文本的示例性小RNA分子包括但不限于微小RNA(miRNA)、小干扰(siRNA)、piwi相互作用RNA(piRNA)、核仁小RNA(snoRNA)、小核RNA(snRNA)、细胞外或外泌体RNA(exRNA)和小卡哈尔体特异性RNA(scaRNA)。在一些实施方案中,本公开文本的RNA分子包含长ncRNA分子或由其组成。本公开文本的示例性长RNA分子包括但不限于X染色体失活特异性转录物(Xist)和HOX转录物反义RNA(HOTAIR)。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在细胞内间隙中接触。在一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在胞质溶胶面中接触。在一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在核中接触。在一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在囊泡、细胞的膜结合区室或细胞器中接触。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在细胞外间隙中接触。在一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在外泌体中接触。在一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在脂质体、聚合物囊泡、胶束或纳米颗粒中接触。在一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在细胞外基质中接触。在一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在液滴中接触。在一些实施方案中,本公开文本的RNA分子与本公开文本的组合物在微流体液滴中接触。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的RNA分子包含单链序列或由其组成。在一些实施方案中,本公开文本的RNA分子包含双链序列或由其组成。在一些实施方案中,所述双链序列包含两个RNA分子。在一些实施方案中,所述双链序列包含一个RNA分子和一个DNA分子。在一些实施方案中,包括以下那些实施方案:其中所述双链序列包含一个RNA分子和一个DNA分子,本公开文本的组合物选择性结合并任选地选择性切割所述RNA分子。
融合蛋白
在本公开文本的组合物和方法的一些实施方案中,所述组合物包含编码靶RNA结合融合蛋白的序列,所述序列包含(a)编码第一RNA结合多肽或其部分的序列;以及(b)编码第二RNA结合多肽的序列,其中所述第一RNA结合多肽结合靶RNA,并且其中所述第二RNA结合多肽包含RNA-核酸酶活性。
在一些实施方案中,靶RNA结合融合蛋白是RNA指导的靶RNA结合融合蛋白。RNA指导的靶RNA结合融合蛋白包含至少一种RNA结合多肽,其对应于将所述RNA结合多肽指导至靶RNA的gRNA。RNA指导的靶RNA结合融合蛋白包括但不限于RNA结合多肽,其是基于CRISPR/Cas的RNA结合多肽或其部分。
在一些实施方案中,靶RNA结合融合蛋白不是RNA指导的靶RNA结合融合蛋白,并且因此包含至少一种RNA结合多肽,其能够在没有相应gRNA序列的情况下结合靶RNA。此类非指导的RNA结合多肽包括但不限于作为PUF(Pumilio和FBF同源家族)的至少一种RNA结合蛋白或其RNA结合部分。这种类型的RNA结合多肽可以用于代替gRNA指导的RNA结合蛋白如CRISPR/Cas。参与介导mRNA稳定性和翻译的PUF蛋白(以果蝇(Drosophila)Pumilio和秀丽隐杆线虫(C.elegans)fem-3结合因子命名)的独特RNA识别模式是本领域中熟知的。也是本领域中已知的人Pumilio1的PUF结构域与同源RNA序列紧密结合,并且可以修饰其特异性。其含有八个PUF重复,它们识别八个保守RNA碱基,且每个重复识别单个碱基。由于每个重复中的两条氨基酸侧链识别相应碱基的Watson-Crick边缘并决定该重复的特异性,PUF结构域可以被设计为特异性结合大多数8-nt RNA。Wang等人,Nat Methods.2009;6(11):825-830。还参见WO 2012/068627,将其通过引用以其整体并入本文。
在本公开文本的非指导的RNA结合融合蛋白的一些实施方案中,所述融合蛋白包含作为PUMBY(基于Pumilio的联合体)蛋白的至少一种RNA结合蛋白或其RNA结合部分。已经以天然和修饰形式广泛用于靶向RNA的RNA结合蛋白PumHD(Pumilio同源结构域,PUF家族的成员)已经被工程化以产生一组四个规范蛋白质模块,其中的每个靶向一个RNA碱基。这些模块(即,Pumby,代表基于Pumilio的联合体)可以以不同组成和长度的链进行链状结合,以结合所需靶RNA。此类Pumby-RNA相互作用的特异性高,且Pumby链与携带相对于靶序列的三个或更多个错配的RNA序列的结合不可检测。Katarzyna等人,PNAS,2016;113(19):E2579-E2588。还参见US2016/0238593,将其通过引用以其整体并入本文。
在本公开文本的组合物的一些实施方案中,至少一种RNA结合蛋白或其RNA结合部分是PPR蛋白。PPR蛋白(从植物衍生的具有三角状五肽重复(PPR)基序的蛋白质)是核编码的并且仅在RNA水平上受控制细胞器(叶绿体和线粒体),切割,翻译,剪接,RNA编辑,特异性作用于RNA稳定性的基因。PPR蛋白通常是35个氨基酸的基序,并且具有以下结构,其中PPR基序是约10个连续氨基酸。PPR基序的组合可以用于与RNA的序列选择性结合。PPR蛋白通常由约10个重复结构域的PPR基序构成。PPR结构域或RNA结合结构域可以被配置为无催化活性的。将WO 2013/058404通过引用以其整体并入本文。
在一些实施方案中,本文公开的融合蛋白在所述至少两种RNA结合多肽之间包含接头。在一些实施方案中,所述接头是肽接头。在一些实施方案中,所述肽接头包含三肽GGS的一个或多个重复。在其他实施方案中,所述接头是非肽接头。在一些实施方案中,所述非肽接头包含聚乙二醇(PEG)、聚丙二醇(PPG)、共-聚(乙二醇/丙二醇)、聚氧乙烯(POE)、聚氨基甲酸酯、聚膦腈、多糖、葡聚糖、聚乙烯醇、聚乙烯吡咯烷酮、聚乙烯基乙醚、聚丙烯酰胺、聚丙烯酸酯、聚氰基丙烯酸酯、脂质聚合物、甲壳素、透明质酸、肝素或烷基接头。
在一些实施方案中,所述至少一种RNA结合蛋白不需要多聚化以用于RNA结合活性。在一些实施方案中,所述至少一种RNA结合蛋白不是多聚体复合物的单体。在一些实施方案中,多聚体蛋白复合物不包含所述RNA结合蛋白。在一些实施方案中,所述至少一种RNA结合蛋白与所述RNA分子内的靶序列选择性结合。在一些实施方案中,所述至少一种RNA结合蛋白不包含对所述RNA分子内的第二序列的亲和力。在一些实施方案中,所述至少一种RNA结合蛋白不包含对所述RNA分子内的第二序列的高亲和力或不选择性结合所述第二序列。在一些实施方案中,所述至少一种RNA结合蛋白包含在2个与1300个之间的氨基酸,包括端点。
在一些实施方案中,本文公开的编码融合蛋白的所述至少一种RNA结合蛋白的序列还包含编码核定位信号(NLS)的序列。在一些实施方案中,编码核定位信号(NLS)的所述序列定位于编码所述RNA结合蛋白的序列的3'。在一些实施方案中,所述至少一种RNA结合蛋白包含在所述蛋白质的C末端的NLS。在一些实施方案中,编码所述至少一种RNA结合蛋白的序列还包含编码第一NLS的第一序列和编码第二NLS的第二序列。在一些实施方案中,编码所述第一NLS或所述第二NLS的序列定位于编码所述RNA结合蛋白的序列的3'。在一些实施方案中,所述至少一种RNA结合蛋白包含在所述蛋白质的C末端的第一NLS或第二NLS。在一些实施方案中,所述至少一种RNA结合蛋白还包含NES(核输出信号)或其他肽标签或分泌信号。
在一些实施方案中,本文公开的融合蛋白包含所述至少一种RNA结合蛋白作为第一RNA结合蛋白以及包含核酸酶结构域或由其组成的第二RNA结合蛋白。在一些实施方案中,所述第二RNA结合蛋白以与RNA缔合的方式结合RNA。在一些实施方案中,所述第二RNA结合蛋白以切割RNA的方式与RNA缔合。
在一些实施方案中,所述第二RNA结合多肽被可操作地配置到在所述第一RNA结合多肽的C末端的第一RNA结合多肽。在一些实施方案中,所述第二RNA结合多肽被可操作地配置到在所述第一RNA结合多肽的N末端的第一RNA结合多肽。
载体
在本公开文本的组合物和方法的一些实施方案中,载体包含本公开文本的指导RNA。在一些实施方案中,所述载体包含本公开文本的至少一种指导RNA。在一些实施方案中,所述载体包含本公开文本的一种或多种指导RNA。在一些实施方案中,所述载体包含本公开文本的两种或更多种指导RNA。在一些实施方案中,所述载体还包含本公开文本的融合蛋白。在一些实施方案中,所述融合蛋白包含第一RNA结合蛋白和第二RNA结合蛋白。
在本公开文本的组合物和方法的一些实施方案中,第一载体包含本公开文本的指导RNA,并且第二载体包含本公开文本的融合蛋白。在一些实施方案中,所述第一载体包含本公开文本的至少一种指导RNA。在一些实施方案中,所述第一载体包含本公开文本的一种或多种指导RNA。在一些实施方案中,所述第一载体包含本公开文本的两种或更多种指导RNA。在一些实施方案中,所述融合蛋白包含第一RNA结合蛋白和第二RNA结合蛋白。在一些实施方案中,所述第一载体和所述第二载体是相同的。在一些实施方案中,所述第一载体和所述第二载体是不同的。
在本公开文本的组合物和方法的一些实施方案中,所述载体是或包含“双组分RNA靶向系统”的组分,所述双组分RNA靶向系统包含(a)编码本公开文本的靶向RNA的融合蛋白的核酸序列;以及(b)单一指导RNA(sgRNA)序列,其包含:在其5'端,与靶RNA序列杂交或特异性结合的RNA序列(例如,间隔子序列);和在其3'端,能够与所述融合蛋白的CRISPR/Cas蛋白特异性结合或缔合的RNA序列(例如,支架序列);并且其中所述双组分RNA靶向系统在PAMmer不存在的情况下识别并改变细胞中的所述靶RNA。在一些实施方案中,所述双组分系统的序列包含在单一(例如,一元)载体内。在一些实施方案中,所述双组分系统的间隔子序列靶向选自以下的重复序列:CUG、CCUG、CAG和GGGGCC。在一些实施方案中,所述双组分系统的间隔子序列靶向涉及适应性免疫应答的RNA序列。在一些实施方案中,所述双组分系统的间隔子序列包含编码适应性免疫应答的蛋白质组分的核酸序列的一部分,并且其中所述蛋白质组分选自β-2-微球蛋白(β2M)、人白细胞抗原A(HLA-A)、人白细胞抗原B(HLA-B)、人白细胞抗原C(HLA-C)、分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)、ICOS配体(ICOSLG)、OX40L、白细胞介素12(IL12)和CC趋化因子受体7(CCR7)。在一些实施方案中,所述双组分系统包含间隔子,其是编码适应性免疫应答的蛋白质组分的核酸序列的一部分,并且其长度是约20或21个核苷酸。在一些实施方案中,所述双组分系统包含第一和第二间隔子,其包含在单一的(singular)gRNA内。在一些实施方案中,所述双组分系统包含第一和第二间隔子序列,其包含在第一和第二gRNA序列内。在一些实施方案中,所述第一间隔子靶向重复序列,并且所述第二间隔子靶向涉及适应性免疫应答的RNA。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的载体是病毒载体。在一些实施方案中,所述病毒载体包含从逆转录病毒分离或衍生的序列。在一些实施方案中,所述病毒载体包含从慢病毒分离或衍生的序列。在一些实施方案中,所述病毒载体包含从腺病毒分离或衍生的序列。在一些实施方案中,所述病毒载体包含从腺相关病毒(AAV)分离或衍生的序列。在一些实施方案中,所述病毒载体无复制能力。在一些实施方案中,所述病毒载体是分离的或重组的。在一些实施方案中,所述病毒载体是自身互补的。
在本公开文本的组合物和方法的一些实施方案中,所述病毒载体包含从腺相关病毒(AAV)分离或衍生的序列。在一些实施方案中,所述病毒载体包含从血清型AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11或AAV12的AAV分离或衍生的反向末端重复序列或衣壳序列。在一些实施方案中,所述病毒载体无复制能力。在一些实施方案中,所述病毒载体是分离的或重组的(rAAV)。在一些实施方案中,所述病毒载体是自身互补的(scAAV)。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的载体是非病毒载体。在一些实施方案中,所述载体包含以下项或由其组成:纳米颗粒、胶束、脂质体或阳离子脂质体/DNA复合物、聚合物囊泡、聚合物/DNA复合物或树枝状聚合物。在一些实施方案中,所述载体是表达载体或重组表达系统。如本文所用,术语“重组表达系统”是指用于表达通过重组形成的某些遗传物质的遗传构建体。
在本公开文本的组合物和方法的一些实施方案中,本文提供的表达载体、病毒载体或非病毒载体包括但不限于表达控制元件。如本文所用的“表达控制元件”是指调节编码序列如基因的表达的任何序列。示例性表达控制元件包括但不限于启动子、增强子、微小RNA、转录后调节元件、多聚腺苷酸化信号序列和内含子。例如,表达控制元件可以是组成型的、诱导型的、阻抑型的或组织特异性的。“启动子”是以下控制序列,其是多核苷酸序列中控制转录起始和速率的区域。它可以含有调节蛋白和分子可以结合的遗传元件,如RNA聚合酶和其他转录因子。在一些实施方案中,启动子对表达的控制是组织特异性的。非限制性的示例性启动子包括CMV、CBA、CAG、Cbh、EF-1a、PGK、UBC、GUSB、UCOE、hAAT、TBG、结蛋白(Desmin)、MCK、C5-12、NSE、突触蛋白(Synapsin)、PDGF、MecP2、CaMKII、mGluR2、NFL、NFH、nβ2、PPE、ENK、EAAT2、GFAP、MBP和U6启动子。“增强子”是DNA中可以由激活蛋白结合以增加转录的可能性或频率的区域。非限制性的示例性增强子和转录后调节元件包括CMV增强子和WPRE。
在本公开文本的组合物和方法的一些实施方案中,本文提供的表达载体、病毒载体或非病毒载体包括但不限于用于建构“多顺反子(multicistronic)”或“多顺反子(polycistronic)”或“双顺反子”或“三顺反子”构建体(即,具有双重或三重或多重编码区或外显子)的载体元件,如IRES或2A肽位点,并且因此将具有从mRNA表达来自单一构建体的两种或更多种蛋白质的能力。多顺反子载体从同一mRNA同时表达两种或更多种单独蛋白质。最广泛用于构建多顺反子构型的两种策略是通过使用IRES或2A自切割位点。“IRES”是指用于多顺反子载体构建体内的病毒、原核或真核来源的内部核糖体进入位点或其部分。在一些实施方案中,IRES是允许以非帽依赖性方式进行翻译起始的RNA元件。术语“自切割肽”或“编码自切割肽的序列”或“2A自切割位点”是指在载体构建体内用于并入位点以促进核糖体跳跃且因此从单一启动子产生两种多肽的连接序列,此类自切割肽包括但不限于T2A和P2A肽或编码自切割肽的序列。
在一些实施方案中,所述载体是病毒载体。在一些实施方案中,所述载体是腺病毒载体、腺相关病毒(AAV)载体或慢病毒载体。在一些实施方案中,所述载体是逆转录病毒载体、腺病毒/逆转录病毒嵌合体载体、单纯疱疹病毒I或II载体、细小病毒载体、网状内皮组织增殖病病毒载体、脊髓灰质炎病毒载体、乳头状瘤病毒载体、痘苗病毒载体或者并入两种或更多种病毒载体的有利方面的任何杂合或嵌合载体。在一些实施方案中,所述载体还包含与多核苷酸可操作地连接的一种或多种表达控制元件。在一些实施方案中,所述载体还包含一种或多种选择标记。在一些实施方案中,所述AAV载体具有低毒性。在一些实施方案中,所述AAV载体不并入宿主基因组中,从而具有低的引起插入诱变的概率。在一些实施方案中,所述AAV载体可以编码4.5kb至4.75kb的一系列总多核苷酸。在一些实施方案中,可以用于任何本文所述的组合物、系统、方法和试剂盒中的示例性AAV载体可以包括AAV1载体、修饰的AAV1载体、AAV2载体、修饰的AAV2载体、AAV3载体、修饰的AAV3载体、AAV4载体、修饰的AAV4载体、AAV5载体、修饰的AAV5载体、AAV6载体、修饰的AAV6载体、AAV7载体、修饰的AAV7载体、AAV8载体、AAV9载体、AAV.rh10载体、修饰的AAV.rh10载体、AAV.rh32/33载体、修饰的AAV.rh32/33载体、AAV.rh43载体、修饰的AAV.rh43载体、AAV.rh64R1载体和修饰的AAV.rh64R1载体及其任何组合或等效物。在一些实施方案中,所述慢病毒载体是有整合酶能力的慢病毒载体(integrase-competent lentiviral vector,ICLV)。在一些实施方案中,所述慢病毒载体可以是指转基因质粒载体,以及与相关质粒(例如,包装质粒、rev表达质粒、包膜质粒)结合的转基因质粒载体,以及能够通过病毒或病毒样进入机制将外源核酸引入细胞中的基于慢病毒的颗粒。慢病毒载体是本领域中熟知的(参见例如,Trono D.(2002)Lentiviral vectors,New York:Spring-Verlag Berlin Heidelberg和Durand等人(2011)Viruses 3(2):132-159doi:10.3390/v3020132)。在一些实施方案中,可以用于任何本文所述的组合物、系统、方法和试剂盒中的示例性慢病毒载体可以包括人免疫缺陷病毒(HIV)1载体、修饰的人免疫缺陷病毒(HIV)1载体、人免疫缺陷病毒(HIV)2载体、修饰的人免疫缺陷病毒(HIV)2载体、白领白眉猴(sooty mangabey)猿猴免疫缺陷病毒(SIVSM)载体、修饰的白领白眉猴猿猴免疫缺陷病毒(SIVSM)载体、非洲绿猴猿猴免疫缺陷病毒(SIVAGM)载体、修饰的非洲绿猴猿猴免疫缺陷病毒(SIVAGM)载体、马传染性贫血病毒(EIAV)载体、修饰的马传染性贫血病毒(EIAV)载体、猫免疫缺陷病毒(FIV)载体、修饰的猫免疫缺陷病毒(FIV)载体、维斯纳/梅迪病毒(Visna/maedi virus)(VNV/VMV)载体、修饰的维斯纳/梅迪病毒(VNV/VMV)载体、羊关节炎-脑炎病毒(CAEV)载体、修饰的羊关节炎-脑炎病毒(CAEV)载体、牛免疫缺陷病毒(BIV)或修饰的牛免疫缺陷病毒(BIV)。
核酸
本文提供了编码用于本文所述的基因转移和表达技术中的本文公开的融合蛋白的核酸序列。虽然没有总是明确陈述,但是应当理解,本文提供的序列可以用于提供表达产物以及产生具有相同生物特性的蛋白质的基本上相同的序列。这些“生物等效的”或“生物活性的”或“等效的”多肽是由如本文所述的等效多核苷酸编码的。当使用在默认条件下运行的序列同一性方法比较时,它们可以具有与参考多肽至少60%、或可替代地至少65%、或可替代地至少70%、或可替代地至少75%、或可替代地至少80%、或可替代地至少85%、或可替代地至少90%、或可替代地至少95%、或可替代地至少98%相同的初级氨基酸序列。提供了特定多肽序列作为具体实施方案的例子。用具有类似电荷的可替代氨基酸对序列中的氨基酸进行修饰。另外,等效多核苷酸是在严格条件下与参考多核苷酸或其互补体杂交的多核苷酸,或者就多肽而言,是由在严格条件下与参考编码多核苷酸或其互补链杂交的多核苷酸编码的多肽。可替代地,等效多肽或蛋白质是从等效多核苷酸表达的多肽或蛋白质。
本文公开的核酸序列(例如,多核苷酸序列)可以是密码子优化的,密码子优化是本领域熟知的技术。在本文公开的一些实施方案中,示例性Cas序列(如例如,SEQ ID NO:46(Cas13d))被密码子优化以用于在人细胞中表达。密码子优化涉及以下事实,即不同细胞在对特定密码子的使用方面有所不同。该密码子偏倚对应于特定tRNA在细胞类型中的相对丰度的偏倚。通过改变序列中的密码子以与相应tRNA的相对丰度匹配,可能增加表达。还可能通过故意选择已知相应tRNA在特定细胞类型中罕见的密码子来减少表达。哺乳动物细胞以及多种其他生物的密码子使用表是本领域中已知的。基于遗传密码,可以产生编码例如Cas蛋白的核酸序列。在一些实施方案中,这样的序列被优化以用于在宿主细胞或靶细胞中表达,所述宿主细胞或靶细胞是如用于表达Cas蛋白的宿主细胞或在其中实践所公开方法的细胞(如在哺乳动物细胞例如人细胞中)。特定物种的密码子偏好和密码子使用表可以用于工程化编码Cas蛋白的分离的核酸分子(如编码与其相应野生型蛋白具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的蛋白质的核酸分子),其利用该特定物种的密码子使用偏好。例如,本文公开的Cas蛋白可以被设计为具有特定目标生物优先使用的密码子。在一个例子中,Cas核酸序列被优化以用于在人细胞中表达,如与其相应野生型或起源核酸序列具有至少70%、至少80%、至少85%、至少90%、至少92%、至少95%、至少98%或至少99%序列同一性的Cas核酸序列。在一些实施方案中,编码至少一种Cas蛋白(其可能是载体的一部分)的分离的核酸分子包括被密码子优化以用于在真核细胞中表达的至少一个Cas蛋白编码序列或被密码子优化以用于在人细胞中表达的至少一个Cas蛋白编码序列。在一个实施方案中,这样的密码子优化的Cas编码序列与其相应野生型或起源序列具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在另一个实施方案中,真核细胞密码子优化的核酸序列编码与其相应野生型或起源蛋白具有至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的Cas蛋白。在另一个实施方案中,可以常规地产生含有功能等效核酸的多个克隆,所述功能等效核酸是如序列不同但编码相同Cas蛋白序列的核酸。编码序列中的沉默突变是由于遗传密码的简并性(即,冗余)所致,借此多于一种密码子可以编码相同氨基酸残基。因此,例如,亮氨酸可以由CTT、CTC、CTA、CTG、TTA或TTG编码;丝氨酸可以由TCT、TCC、TCA、TCG、AGT或AGC编码;天冬酰胺可以由AAT或AAC编码;天冬氨酸可以由GAT或GAC编码;半胱氨酸可以由TGT或TGC编码;丙氨酸可以由GCT、GCC、GCA或GCG编码;谷氨酰胺可以由CAA或CAG编码;酪氨酸可以由TAT或TAC编码;并且异亮氨酸可以由ATT、ATC或ATA编码。显示标准遗传密码的表格可以在多个来源发现(参见例如,Stryer,1988,Biochemistry,第3版,W.H.5Freeman and Co.,NY)。
“杂交”是指一种或多种多核苷酸反应形成通过核苷酸残基的碱基之间的氢键合稳定化的复合物的反应。氢键合可以通过Watson-Crick碱基配对、Hoogstein结合或以任何其他序列特异性方式来进行。所述复合物可以包含形成双链体结构的两条链、形成多链复合物的三条或更多条链、单条自杂交链或这些的任何组合。杂交反应可以构成更广泛过程(如PC反应的起始或核酶对多核苷酸的酶促切割)中的步骤。
严格杂交条件的例子包括:约25℃至约37℃的孵育温度;约6x SSC至约10x SSC的杂交缓冲液浓度;约0%至约25%的甲酰胺浓度;以及约4x SSC至约8x SSC的洗涤溶液。中等杂交条件的例子包括:约40℃至约50℃的孵育温度;约9x SSC至约2x SSC的缓冲液浓度;约30%至约50%的甲酰胺浓度;以及约5x SSC至约2x SSC的洗涤溶液。高严格性条件的例子包括:约55℃至约68℃的孵育温度;约lx SSC至约0.1x SSC的缓冲液浓度;约55%至约75%的甲酰胺浓度;以及约lx SSC、0.1x SSC或去离子水的洗涤溶液。通常,杂交孵育时间为5分钟至24小时,有1个、2个或更多个洗涤步骤,并且洗涤孵育时间为约1、2或15分钟。SSC是0.15M NaCl和15mM柠檬酸盐缓冲液。应理解,可以采用使用其他缓冲液系统的SSC的等效物。
“同源性”或“同一性”或“相似度”是指两个肽之间或两个核酸分子之间的序列相似度。同源性可以通过比较每个序列中的位置来确定,所述序列可以出于比较目的进行比对。在所比较序列中的位置由相同的碱基或氨基酸占据时,则所述分子在该位置是同源的。序列之间的同源性程度随着序列共有的匹配或同源位置的数量而变。“无关的”或“非同源的”序列与本发明的一个序列共有小于40%同一性、或可替代地小于25%同一性。
细胞
在本公开文本的组合物和方法的一些实施方案中,本公开文本的细胞是原核细胞。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的细胞是真核细胞。在一些实施方案中,所述细胞是哺乳动物细胞。在一些实施方案中,所述细胞是牛、鼠、猫、马、猪、犬、猿猴或人细胞。在一些实施方案中,所述细胞是非人哺乳动物细胞,如非人灵长类动物细胞。
在一些实施方案中,本公开文本的细胞是体细胞。在一些实施方案中,本公开文本的细胞是性细胞。在一些实施方案中,本公开文本的性细胞不是人细胞。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的细胞是干细胞。在一些实施方案中,本公开文本的细胞是胚胎干细胞。在一些实施方案中,本公开文本的胚胎干细胞不是人细胞。在一些实施方案中,本公开文本的细胞是多潜能干细胞或多能干细胞。在一些实施方案中,本公开文本的细胞是成体干细胞。在一些实施方案中,本公开文本的细胞是诱导多能干细胞(iPSC)。在一些实施方案中,本公开文本的细胞是造血干细胞(HSC)。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的体细胞是免疫细胞。在一些实施方案中,本公开文本的免疫细胞是淋巴细胞。在一些实施方案中,本公开文本的免疫细胞是T淋巴细胞(本文也称为T细胞)。本公开文本的示例性T细胞包括但不限于幼稚T细胞、效应T细胞、辅助T细胞、记忆T细胞、调节T细胞(Treg)和γδT细胞。在一些实施方案中,本公开文本的免疫细胞是B淋巴细胞。在一些实施方案中,本公开文本的免疫细胞是自然杀伤细胞。在一些实施方案中,本公开文本的免疫细胞是抗原呈递细胞。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的体细胞是肌肉细胞。在一些实施方案中,本公开文本的肌肉细胞是成肌细胞或肌细胞。在一些实施方案中,本公开文本的肌肉细胞是心肌细胞、骨骼肌细胞或平滑肌细胞。在一些实施方案中,本公开文本的肌肉细胞是横纹肌细胞。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的体细胞是上皮细胞。在一些实施方案中,本公开文本的上皮细胞形成鳞状细胞上皮、立方细胞上皮、柱状细胞上皮、层状细胞上皮、假复层柱状细胞上皮或移行细胞上皮。在一些实施方案中,本公开文本的上皮细胞形成腺体,包括但不限于松果腺、胸腺、垂体、甲状腺、肾上腺、顶质分泌腺、全质分泌腺、局质分泌腺、浆液腺、粘液腺和皮脂腺。在一些实施方案中,本公开文本的上皮细胞接触器官的外表面,所述器官包括但不限于肺、脾、胃、胰腺、膀胱、肠、肾、胆囊、肝、喉或咽。在一些实施方案中,本公开文本的上皮细胞接触血管或静脉的外表面。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的体细胞是神经元细胞。在一些实施方案中,本公开文本的神经元细胞是中枢神经系统的神经元。在一些实施方案中,本公开文本的神经元细胞是脑或脊髓的神经元。在一些实施方案中,本公开文本的神经元细胞是视网膜的神经元。在一些实施方案中,本公开文本的神经元细胞是脑神经或视神经的神经元。在一些实施方案中,本公开文本的神经元细胞是周围神经系统的神经元。在一些实施方案中,本公开文本的神经元细胞是神经胶质细胞或胶质细胞。在一些实施方案中,本公开文本的胶质细胞是中枢神经系统的胶质细胞,包括但不限于少突胶质细胞、星形胶质细胞、室管膜细胞和小胶质细胞。在一些实施方案中,本公开文本的胶质细胞是周围神经系统的胶质细胞,包括但不限于施万细胞和卫星细胞。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的体细胞是原代细胞。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的体细胞是培养的细胞。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的体细胞是体内的、体外的、离体的或原位的。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的体细胞是自体的或同种异体的。
掩蔽本公开文本的修饰的细胞
本公开文本的组合物同时递送基因疗法并且防止从基因疗法构建体或相关递送载体衍生的抗原的表达,防止所述抗原在本公开文本的修饰的细胞的表面上展示。
通过抑制或减少在所述修饰的细胞中适应性免疫应答的组分的表达,所述修饰的细胞对于宿主免疫系统不可见。例如,本公开文本的组合物可以同时靶向与遗传疾病或障碍相关的RNA分子和编码MHC I的β2M亚基的RNA分子。通过选择性靶向编码MHC I的β2M亚基的RNA分子,所述组合物防止所述修饰的细胞在所述修饰的细胞表面上展示一种或多种衍生自RNA靶向构建体、载体或其组合的抗原肽。因此,受试者的免疫系统不会将所述修饰的细胞鉴定为含有外源序列,并且不会尝试针对所述修饰的细胞产生免疫应答。此方法提高了治疗所述遗传疾病或障碍的治疗功效,同时避免了基因疗法的常见副作用。
在本公开文本的组合物和方法的一些实施方案中,适应性免疫应答的所述组分包含以下的组分或由其组成:I型主要组织相容性复合物(MHC I)、II型主要组织相容性复合物(MHC II)、T细胞受体(TCR)、共刺激分子或其组合。在一些实施方案中,所述MHC I组分包含α1链、α2链、α3链或β2M蛋白。在一些实施方案中,适应性免疫应答的所述组分包含MHC Iβ2M蛋白或由其组成。在一些实施方案中,所述MHC II组分包含α1链、α2链、β1链或β2链。在一些实施方案中,所述TCR组分包含α链和β链。在一些实施方案中,所述共刺激分子包含分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)或ICOS配体(ICOSLG)蛋白。
MHC I的α链可以由HLA基因(包括但不限于HLA-A、HLA-B和HLA-C)编码。
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码从HLA-A基因衍生的α链,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码从HLA-B基因衍生的α链,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码从HLA-C基因衍生的α链,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码从HLA-C基因衍生的α链,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码β2M蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD28蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD28蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD28蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD80蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的与本公开文本的编码CD80蛋白的RNA分子的靶序列特异性结合的示例性gRNA间隔子序列可以包含具有选自包含SEQ ID NO:330至SEQ ID NO:3067中任一个的序列的核酸或由其组成。
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD86蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的与本公开文本的编码CD86蛋白的RNA分子的靶序列特异性结合的示例性gRNA间隔子序列可以包含具有选自SEQ ID NO:3068至SEQ ID NO:5783中任一个的序列的核酸或由其组成。
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD86蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD86蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD86蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CD86蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码ICOSLG蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的与本公开文本的编码IOSLG蛋白的RNA分子的靶序列特异性结合的示例性gRNA间隔子序列可以包含具有选自SEQ ID NO:5784至SEQ ID NO:7789中任一个的序列的核酸或由其组成。
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码OX40L蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的与本公开文本的编码OX40L蛋白的RNA分子的靶序列特异性结合的示例性gRNA间隔子序列可以包含具有选自SEQ ID NO:7790至SEQ ID NO:11254中任一个的序列的核酸或由其组成。
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码IL12蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的与本公开文本的编码IL12蛋白的RNA分子的靶序列特异性结合的示例性gRNA间隔子序列可以包含具有选自SEQ ID NO:11255至SEQ ID NO:12685中任一个的序列的核酸或由其组成。
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,所述RNA分子编码CCR7蛋白,所述间隔子序列包含以下的序列的20个核苷酸或由其组成:
本公开文本的与本公开文本的编码CCR7蛋白的RNA分子的靶序列特异性结合的示例性gRNA间隔子序列可以包含具有选自SEQ ID NO:12686至SEQ ID NO:14872中任一个的序列的核酸或由其组成。
本公开文本的组合物可以包含含有与RNA分子的靶序列特异性结合的间隔子序列的gRNA,其中所述间隔子序列和所述靶序列是彼此的反向互补体。在一些实施方案中,本公开文本的组合物可以包含单一(即,单一的)gRNA,其包含a)与第一靶RNA序列特异性结合的第一间隔子序列以及b)与第二靶RNA序列特异性结合的第二间隔子序列,其中所述第一和第二间隔子序列各自结合不同的靶RNA序列。在一些实施方案中,结合不同的靶RNA序列的第一和第二间隔子序列不包含在单一(即,单一的)gRNA内,而是第一间隔子序列包含在第一gRNA内,并且第二间隔子序列包含在第二gRNA序列内。在一些实施方案中,本文公开的间隔子序列包含编码适应性免疫应答的蛋白质组分的核酸序列的一部分,其中所述蛋白质组分选自β-2-微球蛋白(β2M)、人白细胞抗原A(HLA-A)、人白细胞抗原B(HLA-B)、人白细胞抗原C(HLA-C)、分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)、ICOS配体(ICOSLG)、OX40L、白细胞介素12(IL12)和CC趋化因子受体7(CCR7)。在一些实施方案中,作为编码适应性免疫应答的蛋白质组分的核酸序列的一部分的间隔子的长度是约20或21个核苷酸。
本公开文本的所有核苷酸序列可以互换地包括尿嘧啶(U)或胸腺嘧啶(T)。
sgRNA的示例性的非限制性的靶向Zika NS5的间隔子序列包括但不限于:gcaatgatcttcatgttgggagc(SEQ ID NO:196)、gaaccttgttgatgaactcttc(SEQ ID NO:197)、gttggtgattagagcttcattc(SEQ ID NO:198)和gagtgatcctcgttcaagaatcc(SEQ ID NO:199)。
sgRNA的示例性的非限制性的靶向λNS5的间隔子序列包括但不限于:GTGATAAGTGGAATGCCATG(SEQ ID NO:200)和GNNNNNNNNNNNNNNNNNNNNGUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:201)。
同时治疗疾病并且防止免疫应答的方法
本公开文本提供了用于通过将基因疗法递送至细胞同时治疗受试者的疾病或障碍并且防止对接受所述基因疗法的细胞的免疫应答的组合物和方法。例如,可以将图4中所示的组合物施用至受试者,其中gRNA 1与编码适应性免疫应答的组分的RNA分子内的靶序列结合,并且gRNA2与和疾病或障碍相关的RNA分子内的靶序列结合。通过靶向编码适应性免疫应答的组分的RNA分子,gRNA1防止与所述组合物或包含所述组合物的载体相关的抗原在所述细胞的表面上展示,从而从所述受试者的免疫系统中掩蔽所述细胞。gRNA2同时靶向第二RNA分子以治疗本公开文本的疾病或障碍。
在可替代的实施方案中,图4中所示的组合物的gRNA1和gRNA2例如可以各自靶向编码适应性免疫应答的组分的不同的RNA分子。例如,在gRNA1靶向编码β2M多肽的RNA分子的时候,gRNA2靶向共刺激分子(ICOSLG、CD80、CD86、OX40L、IL12或CCR7)。
在一些实施方案中,本公开文本的组合物可以包含至少1、2、3、4、5、6、7、8、9或10种gRNA或由其组成。
在一些实施方案中,本公开文本的组合物可以包含以下或由其组成:至少1、2、3、4、5、6、7、8、9或10种gRNA,所述gRNA的表达是在组成型启动子(例如U6)的控制下;以及包含第一RNA结合蛋白和第二RNA结合蛋白的融合蛋白,所述融合物的表达是在病毒启动子(其可以任选地是组成型的(例如EFS))的控制下。
在一些实施方案中,本公开文本的组合物可以包含以下或由其组成:至少1、2、3、4、5、6、7、8、9或10种gRNA,所述gRNA的表达是在第一启动子的控制下;以及包含第一RNA结合蛋白和第二RNA结合蛋白的融合蛋白,所述融合物的表达是在第二启动子的控制下,其中所述第一启动子驱动至少1、2、3、4、5、6、7、8、9或10种gRNA的更强的表达,并且所述第二启动子驱动所述融合蛋白的表达。在一些实施方案中,本公开文本的组合物可以包含以下或由其组成:至少1、2、3、4、5、6、7、8、9或10种gRNA,所述gRNA的表达是在第一启动子的控制下;以及包含第一RNA结合蛋白和第二RNA结合蛋白的融合蛋白,所述融合物的表达是在第二启动子的控制下,其中所述第一启动子驱动至少1、2、3、4、5、6、7、8、9或10种gRNA的更弱的表达,并且所述第二启动子驱动所述融合蛋白的表达。通过改变驱动本公开文本的组合物的gRNA相比于融合蛋白组分的表达的启动子的相关强度,所述组合物可以以按比率计的剂量提供,同时从同一载体表达所述gRNA和所述融合蛋白。因此,本公开文本的组合物可以包含以下gRNA,其结合与两种或更多种疾病以及适应性免疫应答的两种或更多种组分相关的RNA分子。在一些实施方案中,所述本公开文本的组合物可以包含本文公开的融合蛋白,其中至少一种融合配偶体蛋白是内切核酸酶,如但不限于RNA酶1、RNA酶4、RNA酶6、RNA酶7、RNA酶8、RNA酶2、RNA酶6PL、RNA酶L、RNA酶T2、RNA酶11、RNA酶T2样蛋白、NOB1、ENDOV、ENDOG、ENDOD1、hFEN1、hSLFN14、hLACTB2、APEX2、ANG、HRSP12、ZC3H12A、RIDA、PDL6、NTHL、KIAA0391、APEX1、AGO2、EXOG、ZC3H12D、ERN2、PELO、YBEY、CPSF4L、hCG_2002731、ERCC1、RAC1、RAA1、RAB1、DNA2、FLJ35220、FLJ13173、ERCC4、RNA酶1(K41R)、RNA酶1(K41R、D121E)、RNA酶1(K41R、D121E、H119N)、RNA酶1(H119N)、RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N)、RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N、K41R、D121E)、RNA酶1(R39D、N67D、N88A、G89D、R91D)、TENM1、TENM2、RNA酶K、TALEN、ZNF638、或hSMG6的PIN。
使用方法
本公开文本提供了修饰本公开文本的RNA分子或由所述RNA分子编码的蛋白质的表达水平的方法,所述方法包括在适合于所述指导RNA或所述融合蛋白(或其部分)中的一种或多种与所述RNA分子结合的条件下使所述组合物与所述RNA分子接触。
本公开文本提供了修饰由RNA分子编码的蛋白质的活性的方法,所述方法包括在适合于所述指导RNA或所述融合蛋白(或其部分)中的一种或多种与所述RNA分子结合的条件下使所述组合物与所述RNA分子接触。
本公开文本提供了修饰本公开文本的RNA分子或由所述RNA分子编码的蛋白质的表达水平的方法,所述方法包括在适合于所述指导RNA或所述融合蛋白(或其部分)中的一种或多种与所述RNA分子结合的条件下使所述组合物与包含所述RNA分子的细胞接触。在一些实施方案中,所述细胞是体内的、体外的、离体的或原位的。在一些实施方案中,所述组合物包含载体,其包含含有本公开文本的指导RNA和本公开文本的融合蛋白的组合物。在一些实施方案中,所述载体是AAV。
本公开文本提供了修饰由RNA分子编码的蛋白质的活性的方法,所述方法包括在适合于所述指导RNA或所述融合蛋白(或其部分)中的一种或多种与所述RNA分子结合的条件下使所述组合物与包含所述RNA分子的细胞接触。在一些实施方案中,所述细胞是体内的、体外的、离体的或原位的。在一些实施方案中,所述组合物包含载体,其包含含有本公开文本的指导RNA和本公开文本的融合蛋白的组合物。在一些实施方案中,所述载体是AAV。
本公开文本提供了修饰本公开文本的RNA分子或由所述RNA分子编码的蛋白质的表达水平的方法,所述方法包括在适合于RNA核酸酶活性的条件下使所述组合物与所述RNA分子接触,其中所述融合蛋白诱导所述RNA分子中的断裂。
本公开文本提供了修饰由RNA分子编码的蛋白质的活性的方法,所述方法包括在适合于RNA核酸酶活性的条件下使所述组合物与所述RNA分子接触,其中所述融合蛋白诱导所述RNA分子中的断裂。
本公开文本提供了修饰本公开文本的RNA分子或由所述RNA分子编码的蛋白质的表达水平的方法,所述方法包括在适合于RNA核酸酶活性的条件下使所述组合物与包含所述RNA分子的细胞接触,其中所述融合蛋白诱导所述RNA分子中的断裂。在一些实施方案中,所述细胞是体内的、体外的、离体的或原位的。在一些实施方案中,所述组合物包含载体,其包含含有本公开文本的指导RNA和本公开文本的融合蛋白的组合物。在一些实施方案中,所述载体是AAV。
本公开文本提供了修饰由RNA分子编码的蛋白质的活性的方法,所述方法包括在适合于RNA核酸酶活性的条件下使所述组合物与包含所述RNA分子的细胞接触,其中所述融合蛋白诱导所述RNA分子中的断裂。在一些实施方案中,所述细胞是体内的、体外的、离体的或原位的。在一些实施方案中,所述组合物包含载体,其包含含有本公开文本的指导RNA和本公开文本的融合蛋白的组合物。在一些实施方案中,所述载体是AAV。
本公开文本提供了治疗疾病或障碍的方法,所述方法包括向受试者施用治疗有效量的本公开文本的组合物。
本公开文本提供了治疗疾病或障碍的方法,所述方法包括向受试者施用治疗有效量的本公开文本的组合物,其中所述组合物包含载体,所述载体包含含有本公开文本的指导RNA和本公开文本的融合蛋白的组合物,并且其中所述组合物修饰本公开文本的RNA分子或由所述RNA分子编码的蛋白质的表达水平。
本公开文本提供了治疗疾病或障碍的方法,所述方法包括向受试者施用治疗有效量的本公开文本的组合物,其中所述组合物包含载体,所述载体包含含有本公开文本的指导RNA和本公开文本的融合蛋白的组合物,并且其中所述组合物修饰由RNA分子编码的蛋白质的活性。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于遗传疾病或障碍。在一些实施方案中,所述遗传疾病或障碍是单基因疾病或障碍。在一些实施方案中,所述单基因疾病或障碍是常染色体显性疾病或障碍、常染色体隐性疾病或障碍、X染色体连锁(X连锁)疾病或障碍、X连锁显性疾病或障碍、X连锁隐性疾病或障碍、Y连锁疾病或障碍或线粒体疾病或障碍。在一些实施方案中,所述遗传疾病或障碍是多基因疾病或障碍。在一些实施方案中,所述遗传疾病或障碍是多基因疾病或障碍。在一些实施方案中,所述单基因疾病或障碍是常染色体显性疾病或障碍,包括但不限于亨廷顿病(Huntington's disease)、神经纤维瘤病1型、神经纤维瘤病2型、马凡综合征(Marfansyndrome)、遗传性非息肉病性结直肠癌、遗传性多发性外生骨疣、血管性血友病(VonWillebrand disease)和急性间歇性卟啉病。在一些实施方案中,所述单基因疾病或障碍是常染色体隐性疾病或障碍,包括但不限于白化病、中链酰基辅酶A脱氢酶缺乏症、囊性纤维化、镰状细胞病、泰-萨克斯病(Tay-Sachs disease)、尼曼-皮克病(Niemann-Pickdisease)、脊髓性肌萎缩和罗伯茨综合征(Roberts syndrome)。在一些实施方案中,所述单基因疾病或障碍是X连锁疾病或障碍,包括但不限于肌营养不良、杜氏肌营养不良(Duchenne muscular dystrophy)、血友病、肾上腺脑白质营养不良(ALD)、雷特综合征(Rett syndrome)和血友病A。在一些实施方案中,所述单基因疾病或障碍是线粒体障碍,包括但不限于利伯氏遗传性视神经病变(Leber's hereditary optic neuropathy)。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于免疫疾病或障碍。在一些实施方案中,所述免疫疾病或障碍是免疫缺陷疾病或障碍,包括但不限于B细胞缺乏症、T细胞缺乏症、嗜中性粒细胞减少症、无脾、补体缺乏症、获得性免疫缺陷综合征(AIDS)和由于医学干预所致的免疫缺陷(免疫抑制是医学疗法的预期或不利影响)。在一些实施方案中,所述免疫疾病或障碍是自身免疫性疾病或障碍,包括但不限于失弛缓症、艾迪生病(Addison’s disease)、成人斯蒂尔病(Adult Still'sdisease)、无丙种球蛋白血症、斑秃、淀粉样变性、抗GBM/抗TBM肾炎、抗磷脂综合征、自身免疫性血管性水肿、自身免疫性自主神经机能异常、自身免疫性脑脊髓炎、自身免疫性肝炎、自身免疫性内耳病(AIED)、自身免疫性心肌炎、自身免疫性卵巢炎、自身免疫性睾丸炎、自身免疫性胰腺炎、自身免疫性视网膜病变、自身免疫性荨麻疹、轴突和神经元神经病(AMAN)、巴洛病(Balódisease)、白塞病(Behcet's disease)、良性粘膜类天疱疮、大疱性类天疱疮、卡斯尔曼病(Castleman disease,CD)、乳糜泻、美洲锥虫病(Chagas disease)、慢性炎症性脱髓鞘性多发性神经病(CIDP)、慢性复发性多病灶性骨髓炎(CRMO)、变应性肉芽肿性血管炎(Churg-Strauss Syndrome,CSS)或嗜伊红细胞性肉芽肿病(EGPA)、瘢痕性类天疱疮、寇甘综合征(Cogan's syndrome)、冷凝集素病、先天性心脏传导阻滞、柯萨奇病毒性心肌炎、CREST综合征、克罗恩病(Crohn’s disease)、疱疹样皮炎、皮肌炎、德维克病(Devic's disease)(视神经脊髓炎)、盘状狼疮、德雷斯勒综合征(Dressler’s syndrome)、子宫内膜异位症、嗜酸性食道炎(EoE)、嗜酸性筋膜炎、结节性红斑、特发性混合性冷球蛋白血症(Essential mixed cryoglobulinemia)、伊文思综合征(Evans syndrome)、纤维肌痛、纤维化肺泡炎、巨细胞动脉炎(颞动脉炎)、巨细胞性心肌炎、肾小球肾炎、肺出血-肾炎综合征(Goodpasture’s syndrome)、肉芽肿性多血管炎、格雷夫斯病(Graves’disease)、格林-巴利综合征(Guillain-Barre syndrome)、桥本甲状腺炎(Hashimoto’s thyroiditis)、溶血性贫血、过敏性紫癜(Henoch-Schonlein purpura,HSP)、妊娠疱疹或妊娠性类天疱疮(PG)、化脓性汗腺炎(HS)(反常性痤疮)、低丙球蛋白血症、IgA肾病、IgG4相关性硬化性疾病、免疫性血小板减少性紫癜(ITP)、包涵体肌炎(IBM)、间质性膀胱炎(IC)、幼年型关节炎、幼年型糖尿病(1型糖尿病)、幼年型肌炎(JM)、川崎病(Kawasaki disease)、兰伯特-伊顿综合征(Lambert-Eaton syndrome)、白细胞破碎性血管炎、扁平苔癣、硬化性苔癣、木样结膜炎、线性IgA疾病(LAD)、狼疮、慢性莱姆病(Lyme disease chronic)、梅尼埃病(Meniere’sdisease)、显微镜下多血管炎(MPA)、混合性结缔组织病(MCTD)、蚕蚀性角膜溃疡(Mooren’sulcer)、穆-哈二氏病(Mucha-Habermann disease)、多灶性运动神经病(MMN)或MMNCB、多发性硬化症、重症肌无力、肌炎、发作性睡病、新生儿狼疮、视神经脊髓炎、嗜中性粒细胞减少症、眼部瘢痕性类天庖疮、视神经炎、复发性风湿病(PR)、PANDAS、副肿瘤性小脑变性(PCD)、阵发性睡眠性血红蛋白尿(PNH)、帕里-龙贝格综合征(Parry Romberg syndrome)、睫状体扁平部炎(周边葡萄膜炎)、帕-特二氏综合征(Parsonnage-Turner syndrome)、天疱疮、周围神经病变、静脉周围性脑脊髓炎(Perivenous encephalomyelitis)、恶性贫血(PA)、POEMS综合征、结节性多动脉炎、多腺体综合征I型、II型、III型、风湿性多肌痛、多发性肌炎、心肌梗死后综合征、心包切开术后综合征、原发性胆汁性肝硬化、原发性硬化性胆管炎、孕酮性皮炎、银屑病、银屑病关节炎、纯红细胞再生障碍(PRCA)、坏疽性脓皮病、雷诺现象(Raynaud’s phenomenon)、反应性关节炎、反射性交感神经营养不良、复发性多软骨炎、不宁腿综合征(RLS)、腹膜后纤维化、风湿热、类风湿性关节炎、结节病、施密特综合征(Schmidt syndrome)、巩膜炎、硬皮病、干燥综合征(syndrome)、精子和睾丸自身免疫、僵人综合征(SPS)、亚急性细菌性心内膜炎(SBE)、苏萨克综合征(Susac'ssyndrome)、交感性眼炎(SO)、大动脉炎(Takayasu's arteritis)、颞动脉炎/巨细胞动脉炎、血小板减少性紫癜(TTP)、托洛萨-亨特综合征(Tolosa-Hunt syndrome,THS)、横贯性脊髓炎、1型糖尿病、溃疡性结肠炎(UC)、未分化结缔组织病(UCTD)、葡萄膜炎、血管炎、白癜风、小柳原田病(Vogt-Koyanagi-Harada Disease)或韦氏肉芽肿病(Wegener’sgranulomatosis)。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于炎性疾病或障碍。在一些实施方案中,所述炎性疾病或障碍包括但不限于阿尔茨海默病(Alzheimer's disease)、强直性脊柱炎、关节炎、骨关节炎、类风湿性关节炎、银屑病性关节炎、哮喘、动脉粥样硬化、克罗恩病、结肠炎、皮炎、憩室炎、纤维肌痛、肝炎、肠易激综合征(IBS)、系统性红斑狼疮(SLE)、肾炎、帕金森病(Parkinson's disease)、溃疡性结肠炎、急性支气管炎、急性阑尾炎、扁桃体炎、感染性脑膜炎、鼻窦炎、哮喘、慢性消化性溃疡、结核病、类风湿性关节炎、牙周炎、痛风、硬皮病、血管炎和肌炎。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于代谢性疾病或障碍。在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于退行性或进行性疾病或障碍。在一些实施方案中,所述退行性或进行性疾病或障碍包括但不限于肌萎缩侧索硬化(ALS)、亨廷顿病、阿尔茨海默病和衰老。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于感染性疾病或障碍。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于儿科或发育性疾病或障碍。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于心血管疾病或障碍。
在本公开文本的组合物和方法的一些实施方案中,本公开文本的疾病或障碍包括但不限于增生性疾病或障碍。在一些实施方案中,所述增生性疾病或障碍是癌症。在一些实施方案中,所述癌症包括但不限于急性淋巴细胞性白血病(ALL)、急性髓性白血病(AML)、肾上腺皮质癌、AIDS相关性癌症、卡波西肉瘤(Kaposi Sarcoma)(软组织肉瘤)、AIDS相关性淋巴瘤(淋巴瘤)、原发性CNS淋巴瘤(淋巴瘤)、肛门癌、阑尾癌、胃肠道类癌瘤、星形细胞瘤、非典型畸胎瘤/横纹肌样瘤、中枢神经系统(脑癌)、基底细胞癌、胆管癌、膀胱癌、骨癌、尤因肉瘤(Ewing Sarcoma)、骨肉瘤、恶化纤维组织细胞瘤、脑瘤、乳腺癌、伯基特淋巴瘤(BurkittLymphoma)、类癌瘤、癌、心脏(Cardiac/Heart)肿瘤、胚胎瘤、胚细胞瘤、原发性CNS淋巴瘤、宫颈癌、胆管细胞癌(Cholangiocarcinoma)、脊索瘤、慢性淋巴细胞白血病(CLL)、慢性髓细胞性白血病(CML)、慢性骨髓增殖性肿瘤、结直肠癌、颅咽管瘤、皮肤T细胞淋巴瘤、原位导管癌、胚胎瘤、子宫内膜癌(子宫癌)、室管膜瘤、食管癌、鼻腔神经胶质瘤(头颈癌)、尤因肉瘤(骨癌)、颅外胚细胞瘤、性腺外胚细胞瘤、眼癌、儿童眼内黑色素瘤、眼内黑色素瘤、视网膜母细胞瘤、输卵管癌、骨恶性纤维组织细胞瘤和骨肉瘤、胆囊癌、胃(Gastric/Stomach)癌、胃肠道类癌瘤、胃肠道间质瘤(GIST)(软组织肉瘤)、儿童胃肠道间质瘤、胚细胞瘤、儿童颅外胚细胞瘤、性腺外胚细胞瘤、卵巢胚细胞瘤、睾丸癌、妊娠滋养细胞疾病、毛细胞白血病、头颈癌、心脏肿瘤、肝细胞(肝)癌、组织细胞增多症、霍奇金淋巴瘤(Hodgkin Lymphoma)、下咽癌(头颈癌)、眼内黑色素瘤、胰岛细胞瘤、胰腺神经内分泌肿瘤、卡波西肉瘤(软组织肉瘤)、肾(肾细胞)癌、朗格汉斯细胞组织细胞增生症(Langerhans Cell Histiocytosis)、喉癌(Laryngeal Cancer)(头颈癌)、白血病、唇和口腔癌(Lip and Oral Cavity Cancer)(头颈癌)、肝癌、肺癌(非小细胞和小细胞)、儿童肺癌、淋巴瘤、男性乳腺癌、骨恶性纤维组织细胞瘤和骨肉瘤、黑色素瘤、梅克尔细胞癌(Merkel Cell Carcinoma)(皮肤癌)、间皮瘤、隐匿性原发性转移性鳞状颈癌(头颈癌)、具有NUT基因变化的中线道癌、口腔癌(Mouth Cancer)(头颈癌)、多发性内分泌肿瘤综合征、多发性骨髓瘤/浆细胞瘤、蕈样真菌病(淋巴瘤)、骨髓增生异常综合征、骨髓增生异常性/骨髓增生性肿瘤、鼻腔和鼻旁窦癌(头颈癌)、鼻咽癌(头颈癌)、神经母细胞瘤、非霍奇金淋巴瘤、非小细胞肺癌、口腔癌(Oral Cancer)、唇和口腔癌和口咽癌、骨肉瘤和骨恶性纤维组织细胞瘤、卵巢癌、胰腺癌、胰腺神经内分泌肿瘤(胰岛细胞瘤)、乳头状瘤病、副神经节瘤、甲状旁腺癌、阴茎癌、咽癌(头颈癌)、嗜铬细胞瘤、浆细胞瘤/多发性骨髓瘤、胸膜肺母细胞瘤、妊娠期乳腺癌、原发性中枢神经系统(CNS)淋巴瘤、原发性腹膜癌、前列腺癌、直肠癌、复发性癌症、肾细胞(肾)癌、视网膜母细胞瘤、横纹肌肉瘤、儿童(软组织肉瘤)、涎腺癌(头颈癌)、肉瘤、儿童横纹肌肉瘤(软组织肉瘤)、儿童血管瘤(软组织肉瘤)、尤因肉瘤(骨癌)、卡波西肉瘤(软组织肉瘤)、骨肉瘤(骨癌)、子宫肉瘤、塞扎里综合征(Sézary Syndrome)、淋巴瘤、皮肤癌、小细胞肺癌、小肠癌、软组织肉瘤、皮肤鳞状细胞癌、鳞状颈癌、胃(Stomach/Gastric)癌、T细胞淋巴瘤、睾丸癌、喉癌(Throat Cancer)(头颈癌)、鼻咽癌、口咽癌、下咽癌、胸腺瘤和胸腺癌、甲状腺癌、肾盂和输尿管移行细胞癌、肾细胞癌、尿道癌、子宫肉瘤、阴道癌、血管瘤(软组织肉瘤)、外阴癌、肾母细胞瘤(WilmsTumor)和其他儿童肾脏肿瘤。
在本公开文本的方法的一些实施方案中,本公开文本的受试者已经被诊断患有所述疾病或障碍。在一些实施方案中,本公开文本的受试者呈现所述疾病或障碍的至少一种体征或症状。在一些实施方案中,所述受试者具有预示患上所述疾病或障碍的风险的生物标记。在一些实施方案中,所述生物标记是基因突变。
在本公开文本的方法的一些实施方案中,本公开文本的受试者是雌性。在本公开文本的方法的一些实施方案中,本公开文本的受试者是雄性。在一些实施方案中,本公开文本的受试者具有两个XX或XY染色体。在一些实施方案中,本公开文本的受试者具有两个XX或XY染色体和第三染色体(X或Y)。
在本公开文本的方法的一些实施方案中,本公开文本的受试者是新生儿、婴儿、儿童、成人、年长成人或老年人。在本公开文本的方法的一些实施方案中,本公开文本的受试者为至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或31日龄。在本公开文本的方法的一些实施方案中,本公开文本的受试者为至少1、2、3、4、5、6、7、8、9、10、11或12月龄。在本公开文本的方法的一些实施方案中,本公开文本的受试者为至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100岁或之间的任何岁数或非整岁数。
在本公开文本的方法的一些实施方案中,本公开文本的受试者是哺乳动物。在一些实施方案中,本公开文本的受试者是非人哺乳动物。
在本公开文本的方法的一些实施方案中,本公开文本的受试者是人。
在本公开文本的方法的一些实施方案中,治疗有效量包含本公开文本的组合物的单个剂量。在一些实施方案中,治疗有效量包含治疗有效量包含本公开文本的组合物的至少一个剂量。在一些实施方案中,治疗有效量包含治疗有效量包含本公开文本的组合物的一个或多个剂量。
在本公开文本的方法的一些实施方案中,治疗有效量消除所述疾病或障碍的体征或症状。在一些实施方案中,治疗有效量降低所述疾病或障碍的体征或症状的严重程度。
在本公开文本的方法的一些实施方案中,治疗有效量消除所述疾病或障碍。
在本公开文本的方法的一些实施方案中,治疗有效量防止疾病或障碍的发作。在一些实施方案中,治疗有效量延迟疾病或障碍的发作。在一些实施方案中,治疗有效量降低所述疾病或障碍的体征或症状的严重程度。在一些实施方案中,治疗有效量改善所述受试者的预后。
在本公开文本的方法的一些实施方案中,将本公开文本的组合物全身施用至所述受试者。在一些实施方案中,将本公开文本的组合物通过静脉内途径施用至所述受试者。在一些实施方案中,将本公开文本的组合物通过注射或输注施用至所述受试者。
在本公开文本的方法的一些实施方案中,将本公开文本的组合物局部施用至所述受试者。在一些实施方案中,将本公开文本的组合物通过骨内、眼内、脑脊髓内或脊柱内途径施用至所述受试者。在一些实施方案中,将本公开文本的组合物直接施用至中枢神经系统的脑脊液。在一些实施方案中,将本公开文本的组合物直接施用至眼组织或流体,并且在眼结构外不具有生物利用性。在一些实施方案中,将本公开文本的组合物通过注射或输注施用至所述受试者。
在一些实施方案中,将包含本文公开的RNA结合融合蛋白的组合物配制为药物组合物。简言之,如本文所公开使用的药物组合物可以包含与一种或多种药学上或生理上可接受的载体、稀释剂或赋形剂组合的一种或多种融合蛋白或编码所述一种或多种融合蛋白的多核苷酸,所述融合蛋白或多核苷酸任选地包含于AAV中,所述AAV任选地也是免疫正交的。此类组合物可以包含缓冲液,如中性缓冲盐水、磷酸盐缓冲盐水等;碳水化合物,如葡萄糖、甘露糖、蔗糖或葡聚糖、甘露醇;蛋白质;多肽或氨基酸,如甘氨酸;抗氧化剂;螯合剂,如EDTA或谷胱甘肽;佐剂(例如,氢氧化铝);和防腐剂。可以将本公开文本的组合物配制用于口服、静脉内、局部、肠内、眼内和/或肠胃外施用。在某些实施方案中,将本公开文本的组合物配制用于静脉内施用。
实施例
实施例1:病毒RNA分子的RNA指导的切割
将A549细胞在含有10%FBS和1%青霉素/链霉素的DMEM(GIBCO)中培养,并以90%-100%汇合度进行传代。将细胞以1x10^5个细胞/孔接种于24孔板中用于RNA分离,或以.5x10^5个细胞/孔接种。将细胞用与基因NTHL1(残基31-312,E43)或CPSF4L(全长,E67)融合的编码空肠弯曲杆菌Cas9(CjeCas9)的质粒与编码Zika NS5 RNA中的四个位点之一的质粒转染。CjeCas9是由EFS启动子驱动的,而指导RNA是由U6启动子驱动的。sgRNA的序列呈现于表8中。下文呈现了在此项研究中使用的构建体的序列(SEQ ID NO:13656和SEQ IDNO:13657)。
RNA分离是用RNAeasy柱(Qiagen)根据制造商的方案来进行。使用Nanodrop分光光度计来估计RNA质量和浓度。使用Superscript III(Thermo)以随机引物根据制造商的方案进行cDNA制备。用如表7中所列的以下引物进行qPCR。
图1显示了在具有含有如表8中指示的各种靶向NS5的间隔子序列的sgRNA的E43和E67内切核酸酶二者的存在下评估的Zika NS5的表达水平。将Zika NS5表达展示为相对于加载有含有对照(λ)间隔子序列的sgRNA的内切核酸酶的变化倍数。
使用免疫荧光显微镜检查将在与CjeCas9融合的E43或E67内切核酸酶的存在下的Zika NS5表达可视化。图2A显示了用加载有含有靶向Zika NS5的间隔子序列的sgRNA的CjeCas9-内切核酸酶融合物转染的细胞的荧光显微镜检查图像。如与加载有不靶向ZikaNS5的sgRNA的CjeCas9-内切核酸酶融合物相比,在加载有靶向Zika NS5的适当sgRNA的CjeCas9-内切核酸酶融合物的存在下,Zika NS5的表达显著降低(图2A和图2B)。图3是用于本公开文本的组合物中的示例性内切核酸酶的列表。
表7:qPCR引物
GAPDH_F | CAGCCTCAAGATCATCAGCAA(SEQ ID NO:192) |
GAPDH_R | TGTGGTCATGAGTCCTTCCA(SEQ ID NO:193) |
NS5_F | GAGGAGAGTGCCAGAGTTGT(SEQ ID NO:194) |
NS5_R | TCTCTCTCCCCATCCAGTGA(SEQ ID NO:195) |
表8:sgRNA序列
E43-CjeCas9和sgRNA质粒可以包含以下序列或由其组成(U6:N=sgRNA间隔子,E43,CjeCas9):
gtttattacagggacagcagagatccagtttggttaattaaggtaccgagggcctatttcccatgatt ccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatat tagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatgga ctatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNGTTTTAGTCCCTGAAGGGACTAAAATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGCTTTTTTTCCTGCAGCCCGGGGGATCCACTAGTTCTAGAGCGGCCGCCACCGCGGTGGAGCTCCAGCTTTTGTTCCCTTTAGTGAGGGTTAATTGCGCGAATTCGCTAGCTAGGTCTTGAAAGGAGTGGGAATTGGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGATCCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGACCGGTTCTAGAGCGCTATTTAGAACCatgTGTTCTCCCCAAGAATCTGGCATGACCGCTCTTTCAGCGAGGATGTTGACGCGAAGCAGATCCCTGGGACCTGGGGCCGGGCCACGAGGGTGTCGGGAAGAACCAGGACCGTTGCGACGGAGGGAAGCAGCAGCGGAAGCTCGGAAATCCCATTCTCCGGTTAAACGACCCCGCAAGGCACAACGGCTCAGGGTTGCTTACGAGGGGAGCGATTCCGAAAAGGGTGAAGGAGCAGAGCCCTTGAAGGTTCCAGTATGGGAACCCCAGGATTGGCAGCAGCAGCTTGTAAACATCCGAGCAATGAGGAACAAAAAAGATGCACCTGTTGATCACCTCGGAACCGAACATTGTTATGATTCTAGTGCGCCGCCAAAAGTCCGCCGGTATCAGGTTCTGTTGAGTTTGATGCTGAGTAGTCAGACTAAGGACCAGGTTACGGCCGGAGCAATGCAACGGCTTCGGGCACGGGGACTCACGGTCGATAGCATTTTGCAGACCGATGACGCAACATTGGGTAAACTCATATATCCAGTTGGCTTCTGGCGGAGCAAAGTGAAGTACATCAAGCAGACCTCAGCCATTCTCCAACAACATTACGGAGGTGATATACCCGCAAGCGTAGCTGAACTGGTAGCACTGCCGGGCGTCGGTCCCAAAATGGCACATCTGGCTATGGCGGTTGCTTGGGGAACGGTGTCTGGTATCGCAGTTGATACGCATGTCCACCGCATCGCCAATCGGCTGAGGTGGACTAAAAAAGCCACTAAGTCTCCTGAAGAAACACGGGCTGCTCTGGAAGAGTGGCTTCCACGAGAGCTGTGGCATGAAATCAATGGATTGCTGGTTGGTTTCGGGCAGCAGACATGCTTGCCCGTGCACCCCCGGTGTCATGCTTGCTTGAACCAGGCTTTGTGCCCAGCTGCCCAGGGCCTGAGTGGAAGTGAGACACCGGGAACATCTGAGTCTGCGACCCCGGAGAGCacaaacGCGCGAATCCTGGCCTTCGcgATTGGCATTAGCAGCATCGGCTGGGCA TTCTCTGAAAACGACGAACTGAAGGATTGCGGCGTGCGAATTTTCACTAAGGTCGAAAATCCCAAAACTGGTGAAT CACTCGCTCTCCCTAGACGACTGGCACGCTCCGCACGAAAGAGGCTTGCCCGCCGCAAGGCACGCTTGAACCATCT TAAACACCTTATTGCAAATGAGTTTAAACTGAATTATGAGGACTACCAATCCTTTGACGAGTCTCTTGCTAAAGCC TACAAAGGGAGCCTTATATCCCCGTATGAGCTCCGGTTCAGAGCACTCAACGAACTGCTGTCCAAACAGGATTTTG CTCGCGTGATTCTCCACATAGCGAAGAGGCGAGGATACGATGACATTAAAAACAGTGATGATAAGGAAAAAGGGGC CATACTCAAAGCGATTAAGCAAAATGAAGAGAAGCTCGCTAACTATCAATCAGTAGGGGAGTATCTCTATAAAGAG TACTTCCAGAAGTTCAAAGAAAATAGCAAGGAATTTACTAATGTCCGGAATAAAAAGGAGTCTTACGAAAGATGTA TTGCGCAATCTTTCCTCAAGGACGAGCTCAAATTGATTTTCAAGAAACAAAGGGAATTTGGGTTCAGCTTCTCAAA AAAATTTGAGGAAGAGGTTCTGAGCGTTGCCTTTTACAAACGCGCCCTTAAGGACTTCTCACATCTCGTAGGGAAT TGTAGTTTCTTCACCGATGAAAAACGGGCGCCAAAAAATAGCCCTTTGGCTTTTATGTTTGTCGCTCTGACTCGCA TCATTAATCTGCTCAACAACCTTAAAAACACGGAAGGGATTCTGTACACAAAGGATGATCTGAACGCTCTGCTTAA CGAAGTTTTGAAGAACGGGACTTTGACCTACAAACAAACCAAAAAGCTTCTTGGTCTCAGTGATGACTACGAATTC AAGGGAGAAAAAGGGACATATTTCATCGAATTCAAGAAGTATAAGGAGTTCATCAAAGCCTTGGGCGAGCACAACT TGTCTCAAGATGATCTCAACGAAATTGCTAAGGATATCACTCTGATTAAAGACGAGATCAAGCTCAAAAAGGCGTT GGCGAAGTATGACCTTAACCAAAACCAAATAGATAGCCTCAGCAAGTTGGAATTTAAAGATCACTTGAATATAAGT TTCAAGGCCCTTAAGTTGGTCACCCCCTTGATGCTTGAAGGAAAGAAATATGATGAGGCATGTAATGAGCTGAATC TCAAGGTTGCTATTAACGAAGACAAAAAAGATTTCCTCCCAGCTTTCAATGAGACTTACTATAAGGACGAGGTTAC CAATCCTGTGGTGCTCCGAGCCATCAAAGAGTATCGAAAGGTCCTGAATGCTTTGCTCAAAAAATACGGTAAGGTA CACAAAATAAATATTGAGCTCGCAAGGGAGGTCGGTAAGAACCACTCCCAGCGCGCCAAAATAGAAAAGGAACAGA ATGAAAATTACAAAGCGAAAAAGGACGCCGAGCTCGAGTGCGAAAAGCTGGGCCTGAAAATAAACAGCAAGAACAT TCTCAAACTCCGCCTCTTCAAAGAACAAAAAGAATTTTGTGCTTATAGTGGTGAGAAAATAAAAATCTCCGATCTT CAAGACGAGAAGATGCTCGAAATAGACgcgATATATCCATATAGCAGGTCTTTTGACGATTCTTACATGAATAAAG TGCTTGTTTTCACTAAGCAGAATCAGGAAAAGTTGAATCAGACCCCCTTTGAGGCCTTTGGCAACGACTCAGCAAA GTGGCAGAAGATCGAGGTCTTGGCTAAGAATCTTCCTACTAAGAAACAGAAAAGGATATTGGATAAGAACTATAAA GACAAAGAACAAAAGAACTTTAAAGACCGCAACCTCAATGACACCAGATACATAGCAAGATTGGTTCTGAACTACA CAAAAGATTATTTGGACTTCTTGCCGCTGTCTGATGATGAGAACACGAAACTCAACGACACGCAAAAGGGGTCTAA AGTCCACGTCGAAGCTAAATCTGGGATGCTCACCTCAGCATTGAGGCATACGTGGGGATTCTCAGCAAAGGACCGA AACAATCACCTGCACCATGCCATTGACGCAGTTATCATAGCGTATGCCAATAATTCAATAGTAAAAGCGTTTAGCG ACTTCAAGAAGGAACAAGAGTCCAACAGCGCCGAGCTCTACGCAAAAAAGATTAGTGAACTCGACTACAAAAACAA AAGAAAATTCTTTGAGCCGTTCAGCGGATTTCGACAGAAGGTATTGGATAAAATAGATGAAATTTTCGTGAGCAAA CCCGAAAGGAAAAAGCCCTCAGGCGCCTTGCACGAAGAGACTTTCAGGAAGGAAGAGGAATTCTACCAAAGCTACG GCGGAAAAGAGGGAGTTTTGAAGGCTCTCGAACTTGGAAAGATTAGGAAGGTGAACGGCAAGATAGTGAAAAACGG CGATATGTTCCGGGTTGATATCTTCAAACATAAAAAAACGAATAAATTTTATGCTGTGCCTATATACACTATGGAC TTCGCACTTAAGGTCCTGCCGAATAAGGCGGTAGCCCGATCTAAAAAAGGCGAAATTAAGGACTGGATTTTGATGG ATGAAAATTACGAGTTCTGCTTTTCTCTCTACAAGGATTCCCTTATATTGATACAGACGAAAGATATGCAGGAACC GGAATTCGTGTATTACAACGCTTTTACTTCCTCTACGGTATCTTTGATTGTCTCCAAACATGACAACAAATTCGAA ACACTCAGTAAAAACCAAAAGATTCTCTTTAAAAATGCGAACGAGAAAGAAGTAATTGCAAAATCAATTGGCATCC AAAATTTGAAAGTTTTTGAAAAATATATAGTATCTGCCCTCGGAGAGGTTACTAAAGCGGAATTTAGACAGCGAGA GGACTTCAAAAAATCAGGTCCACCCAAGAAAAAACGCAAGGTGGAAGATCCGAAGAAAAAGCGAAAAGTGGATGTGtaaCGTTTTCCGGGACGCCGGCTGGATGATCCTCCAGCGCGGGGATCTCATGCTGGAGTTCTTCGCCCACCCCAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTATACCG(SEQ ID NO:202)。
E67-CjeCas9和sgRNA质粒可以包含以下序列或由其组成(U6:N=sgRNA间隔子,E67,CjeCas9):
gtttattacagggacagcagagatccagtttggttaattaaggtaccgagggcctatttcccatgatt ccttcatatttgcatatacgatacaaggctgttagagagataattagaattaatttgactgtaaacacaaagatat tagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatgga ctatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttGTGGAAAGGACGAAACACCNNNNNNNNNNNNNNNNNNNGTTTTAGTCCCTGAAGGGACTAAAATAAAGAGTTTGCGGGACTCTGCGGGGTTACAATCCCCTAAAACCGCTTTTTTTCCTGCAGCCCGGGGGATCCACTAGTTCTAGAGCGGCCGCCACCGCGGTGGAGCTCCAGCTTTTGTTCCCTTTAGTGAGGGTTAATTGCGCGAATTCGCTAGCTAGGTCTTGAAAGGAGTGGGAATTGGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGATCCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGACCGGTTCTAGAGCGCTATTTAGAACCatgCAGGAGGTAATAGCGGGGCTTGAGCGATTTACCTTTGCCTTCGAAAAAGACGTAGAGATGCAGAAGGGAACCGGCCTGCTCCCATTTCAAGGTATGGACAAATCAGCATCTGCCGTGTGCAATTTTTTCACCAAGGGTCTGTGTGAAAAGGGGAAGCTCTGTCCATTTCGCCATGATCGCGGAGAGAAGATGGTGGTGTGTAAGCACTGGCTGAGAGGGCTTTGCAAAAAAGGCGACCACTGCAAATTTCTTCACCAATATGACCTGACTCGAATGCCTGAGTGTTATTTTTACAGTAAGTTCGGTGACTGTAGCAACAAAGAATGCAGCTTCTTGCATGTCAAACCAGCATTCAAGTCACAGGATTGCCCGTGGTACGATCAGGGTTTTTGCAAGGACGGTCCCCTCTGCAAATATCGACACGTACCCAGAATTATGTGCCTTAATTACCTGGTCGGCTTCTGTCCTGAAGGGCCAAAATGTCAGTTTGCTCAAAAAATTCGCGAGTTCAAATTGCTCCCTGGGTCTAAAATTTGGGAACCCCAGGATTGGCAGCAGCAGCTTGTAAACATCCGAGCAATGAGGAACAAAAAAGATGCACCTGTTGATCACCTCGGAACCGAACATTGTTATGATTCTAGTGCGCCGCCAAAAGTCCGCCGGTATCAGGTTCTGTTGAGTTTGATGCTGAGTAGTCAGACTAAGGACCAGGTTACGGCCGGAGCAATGCAACGGCTTCGGGCACGGGGACTCACGGTCGATAGCATTTTGCAGACCGATGACGCAACATTGGGTAAACTCATATATCCAGTTGGCTTCTGGCGGAGCAAAGTGAAGTACATCAAGCAGACCTCAGCCATTCTCCAACAACATTACGGAGGTGATATACCCGCAAGCGTAGCTGAACTGGTAGCACTGCCGGGCGTCGGTCCCAAAATGGCACATCTGGCTATGGCGGTTGCTTGGGGAACGGTGTCTGGTATCGCAGTTGATACGCATGTCCACCGCATCGCCAATCGGCTGAGGTGGACTAAAAAAGCCACTAAGTCTCCTGAAGAAACACGGGCTGCTCTGGAAGAGTGGCTTCCACGAGAGCTGTGGCATGAAATCAATGGATTGCTGGTTGGTTTCGGGCAGCAGACATGCTTGCCCGTGCACCCCCGGTGTCATGCTTGCTTGAACCAGGCTTTGTGCCCAGCTGCCCAGGGCCTGAGTGGAAGTGAGACACCGGGAACATCTGAGTCTGCGACCCCGGAGAGCacaaacGCGCGAATCCTGGCCTTCGcgATTGGCATTAGCAGCATCGGCTGGGCATTCTCTGAAAACGACGAACTGAAGG ATTGCGGCGTGCGAATTTTCACTAAGGTCGAAAATCCCAAAACTGGTGAATCACTCGCTCTCCCTAGACGACTGGC ACGCTCCGCACGAAAGAGGCTTGCCCGCCGCAAGGCACGCTTGAACCATCTTAAACACCTTATTGCAAATGAGTTT AAACTGAATTATGAGGACTACCAATCCTTTGACGAGTCTCTTGCTAAAGCCTACAAAGGGAGCCTTATATCCCCGT ATGAGCTCCGGTTCAGAGCACTCAACGAACTGCTGTCCAAACAGGATTTTGCTCGCGTGATTCTCCACATAGCGAA GAGGCGAGGATACGATGACATTAAAAACAGTGATGATAAGGAAAAAGGGGCCATACTCAAAGCGATTAAGCAAAAT GAAGAGAAGCTCGCTAACTATCAATCAGTAGGGGAGTATCTCTATAAAGAGTACTTCCAGAAGTTCAAAGAAAATA GCAAGGAATTTACTAATGTCCGGAATAAAAAGGAGTCTTACGAAAGATGTATTGCGCAATCTTTCCTCAAGGACGA GCTCAAATTGATTTTCAAGAAACAAAGGGAATTTGGGTTCAGCTTCTCAAAAAAATTTGAGGAAGAGGTTCTGAGC GTTGCCTTTTACAAACGCGCCCTTAAGGACTTCTCACATCTCGTAGGGAATTGTAGTTTCTTCACCGATGAAAAAC GGGCGCCAAAAAATAGCCCTTTGGCTTTTATGTTTGTCGCTCTGACTCGCATCATTAATCTGCTCAACAACCTTAA AAACACGGAAGGGATTCTGTACACAAAGGATGATCTGAACGCTCTGCTTAACGAAGTTTTGAAGAACGGGACTTTG ACCTACAAACAAACCAAAAAGCTTCTTGGTCTCAGTGATGACTACGAATTCAAGGGAGAAAAAGGGACATATTTCA TCGAATTCAAGAAGTATAAGGAGTTCATCAAAGCCTTGGGCGAGCACAACTTGTCTCAAGATGATCTCAACGAAAT TGCTAAGGATATCACTCTGATTAAAGACGAGATCAAGCTCAAAAAGGCGTTGGCGAAGTATGACCTTAACCAAAAC CAAATAGATAGCCTCAGCAAGTTGGAATTTAAAGATCACTTGAATATAAGTTTCAAGGCCCTTAAGTTGGTCACCC CCTTGATGCTTGAAGGAAAGAAATATGATGAGGCATGTAATGAGCTGAATCTCAAGGTTGCTATTAACGAAGACAA AAAAGATTTCCTCCCAGCTTTCAATGAGACTTACTATAAGGACGAGGTTACCAATCCTGTGGTGCTCCGAGCCATC AAAGAGTATCGAAAGGTCCTGAATGCTTTGCTCAAAAAATACGGTAAGGTACACAAAATAAATATTGAGCTCGCAA GGGAGGTCGGTAAGAACCACTCCCAGCGCGCCAAAATAGAAAAGGAACAGAATGAAAATTACAAAGCGAAAAAGGA CGCCGAGCTCGAGTGCGAAAAGCTGGGCCTGAAAATAAACAGCAAGAACATTCTCAAACTCCGCCTCTTCAAAGAA CAAAAAGAATTTTGTGCTTATAGTGGTGAGAAAATAAAAATCTCCGATCTTCAAGACGAGAAGATGCTCGAAATAG ACgcgATATATCCATATAGCAGGTCTTTTGACGATTCTTACATGAATAAAGTGCTTGTTTTCACTAAGCAGAATCA GGAAAAGTTGAATCAGACCCCCTTTGAGGCCTTTGGCAACGACTCAGCAAAGTGGCAGAAGATCGAGGTCTTGGCT AAGAATCTTCCTACTAAGAAACAGAAAAGGATATTGGATAAGAACTATAAAGACAAAGAACAAAAGAACTTTAAAG ACCGCAACCTCAATGACACCAGATACATAGCAAGATTGGTTCTGAACTACACAAAAGATTATTTGGACTTCTTGCC GCTGTCTGATGATGAGAACACGAAACTCAACGACACGCAAAAGGGGTCTAAAGTCCACGTCGAAGCTAAATCTGGG ATGCTCACCTCAGCATTGAGGCATACGTGGGGATTCTCAGCAAAGGACCGAAACAATCACCTGCACCATGCCATTG ACGCAGTTATCATAGCGTATGCCAATAATTCAATAGTAAAAGCGTTTAGCGACTTCAAGAAGGAACAAGAGTCCAA CAGCGCCGAGCTCTACGCAAAAAAGATTAGTGAACTCGACTACAAAAACAAAAGAAAATTCTTTGAGCCGTTCAGC GGATTTCGACAGAAGGTATTGGATAAAATAGATGAAATTTTCGTGAGCAAACCCGAAAGGAAAAAGCCCTCAGGCG CCTTGCACGAAGAGACTTTCAGGAAGGAAGAGGAATTCTACCAAAGCTACGGCGGAAAAGAGGGAGTTTTGAAGGC TCTCGAACTTGGAAAGATTAGGAAGGTGAACGGCAAGATAGTGAAAAACGGCGATATGTTCCGGGTTGATATCTTC AAACATAAAAAAACGAATAAATTTTATGCTGTGCCTATATACACTATGGACTTCGCACTTAAGGTCCTGCCGAATA AGGCGGTAGCCCGATCTAAAAAAGGCGAAATTAAGGACTGGATTTTGATGGATGAAAATTACGAGTTCTGCTTTTC TCTCTACAAGGATTCCCTTATATTGATACAGACGAAAGATATGCAGGAACCGGAATTCGTGTATTACAACGCTTTT ACTTCCTCTACGGTATCTTTGATTGTCTCCAAACATGACAACAAATTCGAAACACTCAGTAAAAACCAAAAGATTC TCTTTAAAAATGCGAACGAGAAAGAAGTAATTGCAAAATCAATTGGCATCCAAAATTTGAAAGTTTTTGAAAAATA TATAGTATCTGCCCTCGGAGAGGTTACTAAAGCGGAATTTAGACAGCGAGAGGACTTCAAAAAATCAGGTCCACCCAAGAAAAAACGCAAGGTGGAAGATCCGAAGAAAAAGCGAAAAGTGGATGTGtaaCGTTTTCCGGGACGCCGGCTGGATGATCCTCCAGCGCGGGGATCTCATGCTGGAGTTCTTCGCCCACCCCAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTATACCG(SEQ ID NO:203)。
示例实施方案
实施方案1.一种组合物,其包含:
(a)包含特异性结合RNA分子内的靶序列的第一指导RNA(gRNA)的第一序列,其中所述靶序列包含编码适应性免疫应答的组分的序列;以及
(b)编码融合蛋白的序列,所述序列包含编码第一RNA结合多肽的序列和编码第二RNA结合多肽的序列,
其中所述第一RNA结合多肽和所述第二RNA结合多肽都不包含显著DNA-核酸酶活性,
其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且
其中所述第二RNA结合多肽包含RNA-核酸酶活性。
实施方案2.一种组合物,其包含:(a)包含特异性结合第一RNA分子内的第一靶序列的第一指导RNA(gRNA)的第一序列,其中所述第一靶序列包含编码适应性免疫应答的组分的序列;和
(b)包含特异性结合第二RNA分子内的第二靶序列的第二指导RNA(gRNA)的第二序列;以及
(c)编码融合蛋白的序列,所述序列包含编码第一RNA结合多肽的序列和编码第二RNA结合多肽的序列,
其中所述第一RNA结合多肽和所述第二RNA结合多肽都不包含显著DNA-核酸酶活性,
其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且
其中所述第二RNA结合多肽包含RNA-核酸酶活性。
实施方案3.根据实施方案2所述的组合物,其中所述第一靶序列或所述第二靶序列包含至少一个重复的序列。
实施方案4.根据实施方案2所述的组合物,其中包含所述第一gRNA的第一序列还包含能够在真核细胞中表达所述gRNA的第一启动子,和/或包含所述第二gRNA的第二序列还包含能够在真核细胞中表达所述gRNA的第二启动子。
实施方案5.根据实施方案2所述的组合物,其中包含含有所述第一gRNA的第一序列和含有所述第二gRNA的第二序列的序列包含能够在真核细胞中表达所述第一gRNA和所述第二gRNA的启动子。
实施方案6.根据实施方案4所述的组合物,其中所述第一启动子和所述第二启动子是相同的。
实施方案7.根据实施方案4所述的组合物,其中所述第一启动子和所述第二启动子是不同的。
实施方案8.根据实施方案4-7中任一项所述的组合物,其中所述真核细胞是动物细胞。
实施方案9.根据实施方案8所述的组合物,其中所述动物细胞是哺乳动物细胞。
实施方案10.根据实施方案9所述的组合物,其中所述动物细胞是人细胞。
实施方案11.根据实施方案5-10中任一项所述的组合物,其中所述启动子是组成型活性启动子。
实施方案12.根据实施方案5-11中任一项所述的组合物,其中所述启动子包含从能够驱动RNA聚合酶的表达的启动子分离或衍生的序列。
实施方案13.根据实施方案12所述的组合物,其中所述启动子包含从U6启动子分离或衍生的序列。
实施方案14.根据实施方案5-12中任一项所述的组合物,其中所述启动子包含从能够驱动转移RNA(tRNA)的表达的启动子分离或衍生的序列。
实施方案15.根据实施方案14所述的组合物,其中所述启动子包含从以下启动子分离或衍生的序列:丙氨酸tRNA启动子、精氨酸tRNA启动子、天冬酰胺tRNA启动子、天冬氨酸tRNA启动子、半胱氨酸tRNA启动子、谷氨酰胺tRNA启动子、谷氨酸tRNA启动子、甘氨酸tRNA启动子、组氨酸tRNA启动子、异亮氨酸tRNA启动子、亮氨酸tRNA启动子、赖氨酸tRNA启动子、甲硫氨酸tRNA启动子、苯丙氨酸tRNA启动子、脯氨酸tRNA启动子、丝氨酸tRNA启动子、苏氨酸tRNA启动子、色氨酸tRNA启动子、酪氨酸tRNA启动子或缬氨酸tRNA启动子。
实施方案16.根据实施方案14所述的组合物,其中所述启动子包含从缬氨酸tRNA启动子分离或衍生的序列。
实施方案17.根据实施方案2-16中任一项所述的组合物,其中包含所述第一gRNA的序列还包含与所述第一靶RNA序列特异性结合的第一间隔子序列。
实施方案18.根据实施方案17所述的组合物,其中所述第一间隔子序列与所述第一靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。
实施方案19.根据实施方案17所述的组合物,其中所述第一间隔子序列与所述靶RNA序列具有100%互补性。
实施方案20.根据实施方案17-19中任一项所述的组合物,其中所述第一间隔子序列包含20个核苷酸或由其组成。
实施方案21.根据实施方案17-19中任一项所述的组合物,其中所述第一间隔子序列包含21个核苷酸或由其组成。
实施方案22.根据实施方案21所述的组合物,其中所述第一间隔子序列包含编码β-2-微球蛋白(β2M)蛋白的氨基酸序列的20个核苷酸或由其组成。
实施方案23.根据实施方案22所述的组合物,其中所述第一间隔子序列包含以下的氨基酸序列的20个核苷酸或由其组成:
实施方案24.根据实施方案2-23中任一项所述的组合物,其中包含所述第一gRNA的序列还包含与所述第一RNA结合蛋白特异性结合的第一支架序列。
实施方案25.根据实施方案24所述的组合物,其中所述第一支架序列包含茎环结构。
实施方案26.根据实施方案24或25所述的组合物,其中所述支架序列包含90个核苷酸或由其组成。
实施方案27.根据实施方案24或25所述的组合物,其中所述支架序列包含93个核苷酸或由其组成。
实施方案28.根据实施方案27所述的组合物,其中所述支架序列包含以下序列:
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:12)或GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:13)。
实施方案29.根据实施方案1-28中任一项所述的组合物,其中包含所述第二gRNA的序列还包含与所述第二靶RNA序列特异性结合的第二间隔子序列。
实施方案30.根据实施方案29所述的组合物,其中所述第二间隔子序列与所述第一靶RNA序列具有至少50%、55%、60%、65%、70%、75%、80%、87%、90%、95%、97%、99%或之间的任何百分比的互补性。
实施方案31.根据实施方案29所述的组合物,其中所述第二间隔子序列与所述靶RNA序列具有100%互补性。
实施方案32.根据实施方案29-31中任一项所述的组合物,其中所述第二间隔子序列包含20个核苷酸或由其组成。
实施方案33.根据实施方案29-31中任一项所述的组合物,其中所述第二间隔子序列包含21个核苷酸或由其组成。
实施方案34.根据实施方案2-34中任一项所述的组合物,其中所述第二间隔子序列包含或还包含含有以下序列的至少1、2、3、4、5、6或7个重复的序列:CUG(SEQ ID NO:18)、CCUG(SEQ ID NO:19)、CAG(SEQ ID NO:80)、GGGGCC(SEQ ID NO:81)或其任何组合。
实施方案35.根据实施方案2-34中任一项所述的组合物,其中包含所述第二gRNA的序列还包含与所述第一RNA结合蛋白特异性结合的第二支架序列。
实施方案36.根据实施方案35所述的组合物,其中所述第二支架序列包含茎环结构。
实施方案37.根据实施方案35或36所述的组合物,其中所述第二支架序列包含85个核苷酸或由其组成。
实施方案38.根据实施方案37所述的组合物,其中所述第二支架序列包含以下序列:
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:12)或GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:13)。
实施方案39.根据实施方案1所述的组合物,其中所述gRNA不结合或不选择性结合所述RNA分子内的第二序列。
实施方案40.根据实施方案2-38中任一项所述的组合物,其中所述第一gRNA不结合或不选择性结合所述第一RNA分子内的第二序列。
实施方案41.根据实施方案2-38中任一项所述的组合物,其中所述第二gRNA不结合或不选择性结合所述第二RNA分子内的第二序列。
实施方案42.根据实施方案39所述的组合物,其中RNA基因组或RNA转录组包含所述RNA分子。
实施方案43.根据实施方案40或41所述的组合物,其中RNA基因组或RNA转录组包含所述第一RNA分子或所述第二RNA分子。
实施方案44.根据实施方案1-43中任一项所述的组合物,其中所述第一RNA结合蛋白包含CRISPR-Cas蛋白。
实施方案45.根据实施方案44所述的组合物,其中所述CRISPR-Cas蛋白是II型CRISPR-Cas蛋白。
实施方案46.根据实施方案45所述的组合物,其中所述第一RNA结合蛋白包含Cas9多肽或其RNA结合部分。
实施方案47.根据实施方案44所述的组合物,其中所述CRISPR-Cas蛋白是V型CRISPR-Cas蛋白。
实施方案48.根据实施方案47所述的组合物,其中所述第一RNA结合蛋白包含Cpf1多肽或其RNA结合部分。
实施方案49.根据实施方案44所述的组合物,其中所述CRISPR-Cas蛋白是VI型CRISPR-Cas蛋白。
实施方案50.根据实施方案49所述的组合物,其中所述第一RNA结合蛋白包含Cas13多肽或其RNA结合部分。
实施方案51.根据实施方案44-50中任一项所述的组合物,其中所述CRISPR-Cas蛋白包含天然RNA核酸酶活性。
实施方案52.根据实施方案51所述的组合物,其中所述天然RNA核酸酶活性被降低或抑制。
实施方案53.根据实施方案52所述的组合物,其中所述天然RNA核酸酶活性被增加或诱导。
实施方案54.根据实施方案44-53中任一项所述的组合物,其中所述CRISPR-Cas蛋白包含天然DNA核酸酶活性,并且其中所述天然DNA核酸酶活性被抑制。
实施方案55.根据实施方案54所述的组合物,其中所述CRISPR-Cas蛋白包含突变。
实施方案56.根据实施方案54或55所述的组合物,其中所述CRISPR-Cas蛋白的核酸酶结构域包含所述突变。
实施方案57.根据实施方案54-56中任一项所述的组合物,其中所述突变发生在编码所述CRISPR-Cas蛋白的核酸中。
实施方案58.根据实施方案54-56中任一项所述的组合物,其中所述突变发生在编码所述CRISPR-Cas蛋白的氨基酸中。
实施方案59.根据实施方案54-58中任一项所述的组合物,其中所述突变包含取代、插入、缺失、移码、倒位或转座。
实施方案60.根据实施方案59所述的组合物,其中所述突变包含核酸酶结构域、所述核酸酶结构域内的结合位点、所述核酸酶结构域内的活性位点或所述核酸酶结构域内的至少一个必需氨基酸残基的缺失。
实施方案61.根据实施方案1-43中任一项所述的组合物,其中所述第一RNA结合蛋白包含Pumilio和FBF(PUF)蛋白。
实施方案62.根据实施方案61所述的组合物,其中所述第一RNA结合蛋白包含基于Pumilio的联合体(PUMBY)蛋白。
实施方案63.根据实施方案1-56中任一项所述的组合物,其中所述第一RNA结合蛋白不需要多聚化以用于RNA结合活性。
实施方案64.根据实施方案63所述的组合物,其中所述第一RNA结合蛋白不是多聚体复合物的单体。
实施方案65.根据实施方案63所述的组合物,其中多聚体蛋白复合物不包含所述第一RNA结合蛋白。
实施方案66.根据实施方案1-65中任一项所述的组合物,其中所述第一RNA结合蛋白与所述RNA分子内的靶序列选择性结合。
实施方案67.根据实施方案66所述的组合物,其中所述第一RNA结合蛋白不包含对所述RNA分子内的第二序列的亲和力。
实施方案68.根据实施方案66或67所述的组合物,其中所述第一RNA结合蛋白不包含对所述RNA分子内的第二序列的高亲和力或不选择性结合所述第二序列。
实施方案69.根据实施方案68所述的组合物,其中RNA基因组或RNA转录组包含所述RNA分子。
实施方案70.根据实施方案1-69中任一项所述的组合物,其中所述第一RNA结合蛋白包含在2个与1300个之间的氨基酸,包括端点。
实施方案71.根据实施方案1-70中任一项所述的组合物,其中编码所述第一RNA结合蛋白的序列还包含核定位信号(NLS)。
实施方案72.根据实施方案71所述的组合物,其中编码核定位信号(NLS)的所述序列定位于编码所述第一RNA结合蛋白的序列的3'。
实施方案73.根据实施方案72所述的组合物,其中所述第一RNA结合蛋白包含在所述蛋白质的C末端的NLS。
实施方案74.根据实施方案1-70中任一项所述的组合物,其中编码所述第一RNA结合蛋白的序列还包含编码第一NLS的第一序列和编码第二NLS的第二序列。
实施方案75.根据实施方案74所述的组合物,其中编码所述第一NLS或所述第二NLS的序列定位于编码所述第一RNA结合蛋白的序列的3'。
实施方案76.根据实施方案75所述的组合物,其中所述第一RNA结合蛋白包含在所述蛋白质的C末端的所述第一NLS或所述第二NLS。
实施方案77.根据实施方案1-76中任一项所述的组合物,其中所述第二RNA结合蛋白包含核酸酶结构域或由其组成。
实施方案78.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含RNA酶或由其组成。
实施方案79.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶1或由其组成。
实施方案80.根据实施方案79所述的组合物,其中所述RNA酶1蛋白包含SEQ IDNO:20或由其组成。
实施方案81.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶4或由其组成。
实施方案82.根据实施方案81所述的组合物,其中所述RNA酶4蛋白包含SEQ IDNO:21或由其组成。
实施方案83.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶6或由其组成。
实施方案84.根据实施方案83所述的组合物,其中所述RNA酶6蛋白包含SEQ IDNO:22或由其组成。
实施方案85.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶7或由其组成。
实施方案86.根据实施方案85所述的组合物,其中所述RNA酶7蛋白包含SEQ IDNO:23或由其组成。
实施方案87.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶8或由其组成。
实施方案88.根据实施方案87所述的组合物,其中所述RNA酶8蛋白包含SEQ IDNO:24或由其组成。
实施方案89.根据实施方案88所述的组合物,其中所述第二RNA结合蛋白包含RNA酶2或由其组成。
实施方案90.根据实施方案89所述的组合物,其中所述RNA酶2蛋白包含SEQ IDNO:25或由其组成。
实施方案91.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶6PL或由其组成。
实施方案92.根据实施方案91所述的组合物,其中所述RNA酶6PL蛋白包含SEQ IDNO:26或由其组成。
实施方案93.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶L或由其组成。
实施方案94.根据实施方案93所述的组合物,其中所述RNA酶L蛋白包含SEQ IDNO:27或由其组成。
实施方案95.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶T2或由其组成。
实施方案96.根据实施方案95所述的组合物,其中所述RNA酶T2蛋白包含SEQ IDNO:28或由其组成。
实施方案97.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶11或由其组成。
实施方案98.根据实施方案97所述的组合物,其中所述RNA酶11蛋白包含SEQ IDNO:29或由其组成。
实施方案99.根据实施方案78所述的组合物,其中所述第二RNA结合蛋白包含RNA酶T2样蛋白或由其组成。
实施方案100.根据实施方案99所述的组合物,其中所述RNA酶T2样蛋白包含SEQID NO:30或由其组成。
实施方案101.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含NOB1多肽或由其组成。
实施方案102.根据实施方案101所述的组合物,其中所述NOB1多肽包含SEQ IDNO:31或由其组成。
实施方案103.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含内切核酸酶或由其组成。
实施方案104.根据实施方案103所述的组合物,其中所述第二RNA结合蛋白包含内切核酸酶V(ENDOV)多肽或由其组成。
实施方案105.根据实施方案104所述的组合物,其中所述ENDOV蛋白包含SEQ IDNO:32或由其组成。
实施方案106.根据实施方案103所述的组合物,其中所述第二RNA结合蛋白包含内切核酸酶G(ENDOG)或由其组成。
实施方案107.根据实施方案106所述的组合物,其中所述ENDOG蛋白包含SEQ IDNO:33或由其组成。
实施方案108.根据实施方案103所述的组合物,其中所述第二RNA结合蛋白包含内切核酸酶D1(ENDOD1)多肽或由其组成。
实施方案109.根据实施方案108所述的组合物,其中所述ENDOD1包含SEQ ID NO:34或由其组成。
实施方案110.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含人瓣状内切核酸酶-1(hFEN1)多肽或由其组成。
实施方案111.根据实施方案110所述的组合物,其中所述hFEN1蛋白包含SEQ IDNO:35或由其组成。
实施方案112.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含人斯库拉芬蛋白14(hSLFN14)多肽或由其组成。
实施方案113.根据实施方案112所述的组合物,其中所述hSLFN14多肽包含SEQ IDNO:36或由其组成。
实施方案114.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含人β-内酰胺酶样蛋白2(hLACTB2)多肽或由其组成。
实施方案115.根据实施方案114所述的组合物,其中所述hLACTB2多肽包含SEQ IDNO:37或由其组成。
实施方案116.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含无嘌呤/无嘧啶(AP)内切脱氧核糖核酸酶(APEX2)多肽或由其组成。
实施方案117.根据实施方案116所述的组合物,其中所述APEX2多肽包含SEQ IDNO:38或由其组成。
实施方案118.根据实施方案116所述的组合物,其中所述APEX2多肽包含SEQ IDNO:39或由其组成。
实施方案119.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含血管生成素(ANG)多肽或由其组成。
实施方案120.根据实施方案119所述的组合物,其中所述ANG多肽包含SEQ ID NO:40或由其组成。
实施方案121.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含热反应蛋白12(HRSP12)多肽或由其组成。
实施方案122.根据实施方案121所述的组合物,其中所述HRSP12多肽包含SEQ IDNO:41或由其组成。
实施方案123.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含含锌指CCCH型12A(ZC3H12A)多肽或由其组成。
实施方案124.根据实施方案123所述的组合物,其中所述ZC3H12A多肽包含SEQ IDNO:42或由其组成。
实施方案125.根据实施方案124所述的组合物,其中所述ZC3H12A多肽包含SEQ IDNO:43或由其组成。
实施方案126.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含反应性中间亚胺脱氨酶A(RIDA)多肽或由其组成。
实施方案127.根据实施方案126所述的组合物,其中所述RIDA多肽包含SEQ IDNO:44或由其组成。
实施方案128.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含磷脂酶D家族成员6(PDL6)多肽或由其组成。
实施方案129.根据实施方案128所述的组合物,其中所述PDL6多肽包含SEQ IDNO:126或由其组成。
实施方案130.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含内切核酸酶III样蛋白1(NTHL)多肽或由其组成。
实施方案131.根据实施方案130所述的组合物,其中所述NTHL多肽包含SEQ IDNO:123或由其组成。
实施方案132.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含线粒体核糖核酸酶P催化亚基(KIAA0391)多肽或由其组成。
实施方案133.根据实施方案132所述的组合物,其中所述KIAA0391多肽包含SEQID NO:127或由其组成。
实施方案134.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含无嘌呤或无嘧啶位点裂解酶(APEX1)多肽或由其组成。
实施方案135.根据实施方案134所述的组合物,其中所述APEX1多肽包含SEQ IDNO:125或由其组成。
实施方案136.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含阿尔古蛋白2(AGO2)多肽或由其组成。
实施方案137.根据实施方案136所述的组合物,其中所述AGO2多肽包含SEQ IDNO:128或由其组成。
实施方案138.根据实施方案67所述的组合物,其中所述第二RNA结合蛋白包含线粒体核酸酶EXOG(EXOG)多肽或由其组成。
实施方案139.根据实施方案138所述的组合物,其中所述EXOG多肽包含SEQ IDNO:129或由其组成。
实施方案140.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含含锌指CCCH型12D(ZC3H12D)多肽或由其组成。
实施方案141.根据实施方案140所述的组合物,其中所述ZC3H12D多肽包含SEQ IDNO:130或由其组成。
实施方案142.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含内质网核信号转导蛋白2(ERN2)多肽或由其组成。
实施方案143.根据实施方案142所述的组合物,其中所述ERN2多肽包含SEQ IDNO:131或由其组成。
实施方案144.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含回力球mRNA监督和核糖体挽救因子(PELO)多肽或由其组成。
实施方案145.根据实施方案144所述的组合物,其中所述PELO多肽包含SEQ IDNO:132或由其组成。
实施方案146.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含YBEY金属肽酶(YBEY)多肽或由其组成。
实施方案147.根据实施方案146所述的组合物,其中所述YBEY多肽包含SEQ IDNO:133或由其组成。
实施方案148.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含剪切和多聚腺苷酸化特异性因子4样蛋白(CPSF4L)多肽或由其组成。
实施方案149.根据实施方案148所述的组合物,其中所述CPSF4L多肽包含SEQ IDNO:134或由其组成。
实施方案150.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含hCG_2002731多肽或由其组成。
实施方案151.根据实施方案150所述的组合物,其中所述hCG_2002731多肽包含SEQ ID NO:135或由其组成。
实施方案152.根据实施方案150所述的组合物,其中所述hCG_2002731多肽包含SEQ ID NO:136或由其组成。
实施方案153.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含切除修复交叉互补组1(ERCC1)多肽或由其组成。
实施方案154.根据实施方案153所述的组合物,其中所述ERCC1多肽包含SEQ IDNO:137或由其组成。
实施方案155.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含ras相关C3肉毒杆菌毒素底物1亚型(RAC1)多肽或由其组成。
实施方案156.根据实施方案155所述的组合物,其中所述RAC1多肽包含SEQ IDNO:138或由其组成。
实施方案157.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含核糖核酸酶A A1(RAA1)多肽或由其组成。
实施方案158.根据实施方案157所述的组合物,其中所述RAA1多肽包含SEQ IDNO:139或由其组成。
实施方案159.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含Ras相关蛋白(RAB1)多肽或由其组成。
实施方案160.根据实施方案159所述的组合物,其中所述RAB1多肽包含SEQ IDNO:140或由其组成。
实施方案161.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含DNA复制解旋酶/核酸酶2(DNA2)多肽或由其组成。
实施方案162.根据实施方案161所述的组合物,其中所述DNA2多肽包含SEQ IDNO:141或由其组成。
实施方案163.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含FLJ35220多肽或由其组成。
实施方案164.根据实施方案163所述的组合物,其中所述FLJ35220多肽包含SEQID NO:142或由其组成。
实施方案165.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含FLJ13173多肽或由其组成。
实施方案166.根据实施方案165所述的组合物,其中所述FLJ13173多肽包含SEQID NO:143或由其组成。
实施方案167.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含DNA修复内切核酸酶XPF(ERCC4)多肽或由其组成。
实施方案168.根据实施方案167所述的组合物,其中所述ERCC4多肽包含SEQ IDNO:124或由其组成。
实施方案169.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R))多肽或由其组成。
实施方案170.根据实施方案169所述的组合物,其中所述RNA酶1(K41R)多肽包含SEQ ID NO:116或由其组成。
实施方案171.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R、D121E))多肽或由其组成。
实施方案172.根据实施方案171所述的组合物,其中所述RNA酶1(RNA酶1(K41R、D121E))多肽包含SEQ ID NO:117或由其组成。
实施方案173.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(K41R、D121E、H119N))多肽或由其组成。
实施方案174.根据实施方案173所述的组合物,其中所述RNA酶1(RNA酶1(K41R、D121E、H119N))多肽包含SEQ ID NO:118或由其组成。
实施方案175.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(H119N))多肽或由其组成。
实施方案166.根据实施方案175所述的组合物,其中所述RNA酶1(RNA酶1(H119N))多肽包含SEQ ID NO:119或由其组成。
实施方案177.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。
实施方案178.根据实施方案177所述的组合物,其中所述RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽包含SEQ ID NO:120或由其组成。
实施方案179.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。
实施方案180.根据实施方案179所述的组合物,其中所述RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N、K41R、D121E))多肽包含SEQ ID NO:121或由其组成。
实施方案181.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含突变的RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N))多肽或由其组成。
实施方案182.根据实施方案181所述的组合物,其中所述RNA酶1(RNA酶1(R39D、N67D、N88A、G89D、R91D))多肽包含SEQ ID NO:122或由其组成。
实施方案183.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含特诺伊林跨膜蛋白1(TENM1)多肽或由其组成。
实施方案184.根据实施方案173所述的组合物,其中所述TENM1多肽包含SEQ IDNO:144或由其组成。
实施方案185.根据实施方案77所述的组合物,其中所述第二RNA结合蛋白包含特诺伊林跨膜蛋白2(TENM2)多肽或由其组成。
实施方案186.根据实施方案185所述的组合物,其中所述TENM2多肽包含SEQ IDNO:145或由其组成。
实施方案187.根据实施方案1-77中任一项所述的组合物,其中所述第二RNA结合蛋白包含转录激活因子样效应物核酸酶(TALEN)多肽或所述多肽的核酸酶结构域或由其组成。
实施方案188.根据实施方案187所述的组合物,其中所述TALEN多肽包含以下序列或由其组成:
实施方案189.根据实施方案187所述的组合物,其中所述TALEN多肽包含以下序列或由其组成:
实施方案190.根据实施方案1-77中任一项所述的组合物,其中所述第二RNA结合蛋白包含锌指核酸酶多肽或所述多肽的核酸酶结构域或由其组成。
实施方案191.根据实施方案190所述的组合物,其中所述锌指核酸酶多肽包含以下序列或由其组成:
实施方案192.根据实施方案1-191中任一项所述的组合物,其中所述组合物还包含(a)包含特异性结合于RNA分子内的gRNA的序列;以及
(b)编码核酸酶的序列。
实施方案193.根据实施方案192所述的组合物,其中所述核酸酶包含从CRISPR/Cas蛋白分离或衍生的序列。
实施方案194.根据实施方案193所述的组合物,其中所述CRISPR/Cas蛋白是从以下中的任一种分离或衍生的:I型、IA型、IB型、IC型、ID型、IE型、IF型、IU型、III型、IIIA型、IIIB型、IIIC型、IIID型、IV型、IVA型、IVB型、II型、IIA型、IIB型、IIC型、V型或VI型CRISPR/Cas蛋白。
实施方案195.根据实施方案192所述的组合物,其中所述核酸酶包含从TALEN或其核酸酶结构域分离或衍生的序列。
实施方案196.根据实施方案192所述的组合物,其中所述核酸酶包含从锌指核酸酶或其核酸酶结构域分离或衍生的序列。
实施方案197.根据实施方案191-196中任一项所述的组合物,其中所述靶序列包含编码适应性免疫应答的组分的序列。
实施方案198.一种载体,其包含根据实施方案1-197中任一项所述的组合物。
实施方案199.根据实施方案198所述的载体,其中所述载体是病毒载体。
实施方案200.根据实施方案199所述的载体,其中所述载体包含从慢病毒、腺病毒、腺相关病毒(AAV)载体或逆转录病毒分离或衍生的序列。
实施方案201.根据实施方案199或200所述的载体,其中所述载体无复制能力。
实施方案202.根据实施方案100-201中任一项的实施方案所述的载体,其中所述载体包含从腺相关载体(AAV)分离或衍生的序列。
实施方案203.根据实施方案202所述的载体,其中所述腺相关病毒(AAV)是分离的AAV。
实施方案204.根据实施方案202或203所述的载体,其中所述腺相关病毒(AAV)是自身互补的腺相关病毒(scAAV)。
实施方案205.根据实施方案202-204中任一项所述的载体,其中所述腺相关病毒(AAV)是重组腺相关病毒(rAAV)。
实施方案206.根据实施方案202-205中任一项所述的载体,其中所述腺相关病毒(AAV)包含从血清型AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11或AAV12的AAV分离或衍生的序列。
实施方案207.根据实施方案202-206中任一项所述的载体,其中所述腺相关病毒(AAV)包含从血清型AAV9的AAV分离或衍生的序列。
实施方案208.根据实施方案202-206中任一项所述的载体,其中所述腺相关病毒(AAV)包含从Anc80分离或衍生的序列。
实施方案209.根据实施方案100-201中任一项所述的载体,其中所述载体是逆转录病毒。
实施方案210.根据权利要求100-201中任一项的实施方案所述的载体,其中所述逆转录病毒是慢病毒。
实施方案211.根据实施方案198所述的载体,其中所述载体是非病毒载体。
实施方案212.根据实施方案211所述的载体,其中所述非病毒载体包含纳米颗粒、胶束、脂质体或阳离子脂质体/DNA复合物、聚合物囊泡、聚合物/DNA复合物或树枝状聚合物。
实施方案213.一种组合物,其包含根据实施方案198-212中任一项所述的载体。
实施方案214.一种细胞,其包含根据实施方案198-212中任一项所述的载体。
实施方案215.一种细胞,其包含根据实施方案214所述的组合物。
实施方案216.根据实施方案214或215所述的细胞,其中所述细胞是哺乳动物细胞。
实施方案217.根据实施方案216所述的细胞,其中所述细胞是人细胞。
实施方案218.根据实施方案215-217中任一项所述的细胞,其中所述细胞是免疫细胞。
实施方案219.根据实施方案218所述的细胞,其中所述免疫细胞是T淋巴细胞(T细胞)。
实施方案220.根据实施方案219所述的细胞,其中所述T细胞是效应T细胞、辅助T细胞、记忆T细胞、调节性T细胞、自然杀伤T细胞、粘膜相关恒定T细胞或γδT细胞。
实施方案221.根据实施方案215-217中任一项所述的细胞,其中所述免疫细胞是抗原呈递细胞。
实施方案222.根据实施方案221所述的细胞,其中所述抗原呈递细胞是树突细胞、巨噬细胞或B细胞。
实施方案223.根据实施方案221所述的细胞,其中所述抗原呈递细胞是体细胞。
实施方案224.根据实施方案215-223中任一项所述的细胞,其中所述细胞是健康细胞。
实施方案225.根据实施方案215-223中任一项所述的细胞,其中所述细胞不是健康细胞。
实施方案226.根据实施方案225所述的细胞,其中所述细胞是从患有疾病或障碍的受试者分离或衍生的。
实施方案227.一种组合物,其包含根据实施方案215-226中任一项所述的细胞。
实施方案228.一种从适应性免疫应答中掩蔽细胞的方法,其包括使根据实施方案1-197、213或227中任一项所述的组合物与所述细胞接触以产生修饰的细胞,其中所述组合物修饰所述修饰的细胞的RNA分子的表达水平,并且其中所述RNA分子编码适应性免疫应答的组分。
实施方案229.根据实施方案228所述的方法,其中所述细胞是体内的、体外的、离体的或原位的。
实施方案230.根据实施方案228所述的方法,其中所述细胞是体外的或离体的。
实施方案231.根据实施方案228-230中任一项所述的方法,其中多个细胞包含所述细胞。
实施方案232.根据实施方案231所述的方法,其中使所述多个细胞中的每个细胞与所述组合物接触,从而产生多个修饰的细胞。
实施方案233.根据实施方案228-230中任一项所述的方法,其中所述方法还包括向受试者施用所述修饰的细胞。
实施方案234.根据实施方案231-232中任一项所述的方法,其中所述方法还包括向受试者施用所述多个修饰的细胞。
实施方案235.根据实施方案233所述的方法,其中所述细胞是自体的。
实施方案236.根据实施方案233所述的方法,其中所述是同种异体的。
实施方案237.根据实施方案233所述的方法,其中所述多个修饰的细胞是自体的。
实施方案238.根据实施方案233所述的方法,其中所述多个修饰的细胞是同种异体的。
实施方案239.根据实施方案228-238中任一项所述的方法,其中适应性免疫应答的所述组分包含以下的组分或由其组成:I型主要组织相容性复合物(MHC I)、II型主要组织相容性复合物(MHC II)、T细胞受体(TCR)、共刺激分子或其组合。
实施方案240.根据实施方案239所述的方法,其中所述MHC I组分包含α1链、α2链、α3链或β2M蛋白。
实施方案241.根据实施方案228-238中任一项所述的方法,其中适应性免疫应答的所述组分包含MHC Iβ2M蛋白或由其组成。
实施方案242.根据实施方案239所述的方法,其中所述MHC II组分包含α1链、α2链、β1链或β2链。
实施方案243.根据实施方案239所述的方法,其中所述TCR组分包含α链和β链。
实施方案244.根据实施方案239所述的方法,其中所述共刺激分子包含分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)或ICOS配体(ICOSLG)蛋白。
实施方案245.一种防止或减少受试者的适应性免疫应答的方法,其包括向所述受试者施用治疗有效量的根据实施方案1-197、213或227中任一项所述的组合物,其中使所述组合物与所述受试者的至少一个细胞接触,产生修饰的细胞,其中所述组合物修饰所述修饰的细胞的RNA分子的表达水平,并且其中所述RNA分子编码适应性免疫应答的组分。
实施方案246.一种治疗受试者的疾病或障碍的方法,其包括向所述受试者施用治疗有效量的根据实施方案1-197、213或227中任一项所述的组合物,其中使所述组合物与所述受试者的至少一个细胞接触,产生修饰的细胞,其中所述组合物修饰所述修饰的细胞的RNA分子的表达水平,并且其中所述组合物防止或减少对所述修饰的细胞的适应性免疫应答。
实施方案247.根据实施方案246所述的方法,其中适应性免疫应答的所述组分包含以下的组分或由其组成:I型主要组织相容性复合物(MHC I)、II型主要组织相容性复合物(MHC II)、T细胞受体(TCR)、共刺激分子或其组合。
实施方案248.根据实施方案247所述的方法,其中所述MHC I组分包含α1链、α2链、α3链或β2M蛋白。
实施方案249.根据实施方案247或248所述的方法,其中适应性免疫应答的所述组分包含MHC Iβ2M蛋白或由其组成。
实施方案250.根据实施方案249所述的方法,其中所述MHC II组分包含α1链、α2链、β1链或β2链。
实施方案251.根据实施方案247所述的方法,其中所述TCR组分包含α链和β链。
实施方案252.根据实施方案247所述的方法,其中所述共刺激分子包含分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)或ICOS配体(ICOSLG)蛋白。
实施方案253.根据实施方案246-252中任一项所述的方法,其中所述疾病或障碍是遗传疾病或障碍。
实施方案254.根据实施方案253所述的方法,其中所述疾病或障碍是单基因遗传疾病或障碍。
实施方案255.根据实施方案254所述的方法,其中所述疾病或障碍是由微卫星不稳定性引起的。
实施方案256.根据实施方案255所述的方法,其中所述微卫星不稳定性发生在DNA序列的至少1、2、3、4、5或6个重复的基序处。
实施方案257.根据实施方案256所述的方法,其中RNA分子包含所述DNA序列的转录物,并且其中所述组合物与所述RNA分子的靶序列结合,所述靶序列包含至少1、2、3、4、5或6个重复的基序。
实施方案258.根据实施方案246-257中任一项所述的方法,其中全身性施用所述组合物。
实施方案259.根据实施方案259所述的方法,其中静脉内施用所述组合物。
实施方案260.根据实施方案258或259所述的方法,其中通过注射或输注施用所述组合物。
实施方案261.根据实施方案246-257中任一项所述的方法,其中局部施用所述组合物。
实施方案262.根据实施方案261所述的方法,其中通过骨内、眼内、脑内或脊柱内途径施用所述组合物。
实施方案263.根据实施方案261或262所述的方法,其中通过注射或输注施用所述组合物。
实施方案264.根据实施方案265-263中任一项所述的方法,其中所述治疗有效量是单剂量。
实施方案265.根据实施方案265-264中任一项所述的方法,其中所述组合物是非基因组整合的。
通过引用并入
将在本文中引用的每个文件(包括任何交叉参考或相关的专利或申请)通过引用以其整体特此并入本文,除非明确排除或另有限制。引用任何文件并非承认,它是关于本文公开或要求保护的任何发明的现有技术,或者它单独地或与任何其他一个或多个参考文献的任何组合传授、表明或公开任何这种发明。此外,在本文件中术语的任何含义或定义与通过引用并入的文件中相同术语的任何含义或定义矛盾的方面来说,应当以分配给本文件中该术语的含义或定义为准。
其他实施方案
虽然已经说明并描述了本公开文本的特定实施方案,但是可以在不背离本公开文本的精神和范围的情况下做出各种其他变化和修改。所附权利要求的范围包括在本公开文本的范围内的所有此类变化和修改。
Claims (30)
1.一种组合物,其包含含有特异性结合靶RNA序列的指导RNA(gRNA)序列的核酸序列,其中所述靶RNA序列编码适应性免疫应答的蛋白质组分,并且其中所述gRNA序列包含含有编码所述蛋白质组分的核酸序列的一部分的间隔子序列,并且其中所述蛋白质组分选自β-2-微球蛋白(β2M)、人白细胞抗原A(HLA-A)、人白细胞抗原B(HLA-B)、人白细胞抗原C(HLA-C)、分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)、ICOS配体(ICOSLG)、OX40L、白细胞介素12(IL12)和CC趋化因子受体7(CCR7)。
2.根据权利要求1所述的组合物,其中所述适应性免疫应答选自I型主要组织相容性复合物(MHC I)、II型主要组织相容性复合物(MHC II)、T细胞受体(TCR)、共刺激分子及其组合。
3.根据权利要求1所述的组合物,其中所述间隔子序列的长度是约20或21个核苷酸。
4.根据权利要求1所述的组合物,其中所述间隔子序列和所述靶RNA序列是彼此的反向互补体。
5.根据权利要求1所述的组合物,其中所述gRNA序列包含与CRISPR/Cas多肽或其部分特异性结合的支架序列。
6.根据权利要求5所述的组合物,其中所述CRISPR/Cas多肽或其部分选自Cas9、Cpf1、Cas13a、Cas13b、Cas13c和CasRX/Cas13d,其中所述CRISPR/Cas多肽具有天然的、降低的或无效的活性。
7.根据权利要求1所述的组合物,其中所述核酸序列包含驱动所述gRNA序列的表达的启动子。
8.根据权利要求7所述的组合物,其中所述启动子选自聚合酶III启动子和tRNA启动子。
9.根据权利要求8所述的组合物,其中所述聚合酶III启动子是U6启动子。
10.根据权利要求1所述的组合物,其中所述间隔子序列是特异性结合第一靶RNA序列的第一间隔子序列,并且其中所述组合物还包含特异性结合第二靶RNA序列的第二间隔子序列,其中所述第一间隔子序列与第二间隔子序列结合不同的靶RNA序列。
11.根据权利要求10所述的组合物,其中所述gRNA序列是第一gRNA序列,并且其中所述第二间隔子序列包含在第二gRNA序列内。
12.根据权利要求10所述的组合物,其中所述第二靶RNA序列编码适应性免疫应答的蛋白质组分。
13.根据权利要求10所述的组合物,其中所述第二间隔子序列包含编码选自以下的蛋白质组分的核酸序列的一部分:β-2-微球蛋白(β2M)、人白细胞抗原A(HLA-A)、人白细胞抗原B(HLA-B)、人白细胞抗原C(HLA-C)、分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)、ICOS配体(ICOSLG)、OX40L、白细胞介素12(IL12)和CC趋化因子受体7(CCR7)。
14.根据权利要求10所述的组合物,其中所述第二间隔子序列包含选自以下的核酸序列的至少1、2、3、4、5、6或7个重复:CUG(SEQ ID NO:18)、CCUG(SEQ ID NO:19)、CAG(SEQ IDNO:80)、GGGGCC(SEQ ID NO:81)及其组合。
15.一种组合物,其包含含有以下的核酸序列:(a)特异性结合第一靶RNA序列的第一指导RNA(gRNA)序列;以及(b)特异性结合第二靶RNA序列的第二gRNA,其中所述第一靶RNA序列编码适应性免疫应答的蛋白质组分,并且其中所述第一gRNA序列包含含有编码所述蛋白质组分的核酸序列的一部分的间隔子序列,并且其中所述蛋白质组分选自β-2-微球蛋白(β2M)、人白细胞抗原A(HLA-A)、人白细胞抗原B(HLA-B)、人白细胞抗原C(HLA-C)、分化群28(CD28)、分化群80(CD80)、分化群86(CD86)、可诱导T细胞共刺激分子(ICOS)、ICOS配体(ICOSLG)、OX40L、白细胞介素12(IL12)和CC趋化因子受体7(CCR7)。
16.一种组合物,其包含含有以下的核酸序列:(a)根据权利要求1所述的指导RNA(gRNA)序列;以及(b)编码融合蛋白的核酸序列,其中所述融合蛋白包含第一RNA结合多肽和第二RNA结合多肽,其中所述第一RNA结合多肽和所述第二RNA结合多肽都不包含显著DNA-核酸酶活性,其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且其中所述第二RNA结合多肽包含RNA-核酸酶活性。
17.一种组合物,其包含含有以下的核酸序列:(a)根据权利要求11所述的第一和第二指导RNA(gRNA)序列;以及(b)编码融合蛋白的核酸序列,其中所述融合蛋白包含第一RNA结合多肽和第二RNA结合多肽,其中所述第一RNA结合多肽和所述第二RNA结合多肽都不包含显著DNA-核酸酶活性,其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且其中所述第二RNA结合多肽包含RNA-核酸酶活性。
18.一种组合物,其包含含有以下的核酸序列:(a)特异性结合第一RNA分子内的第一靶RNA序列的第一指导RNA(gRNA),其中所述第一靶RNA序列编码适应性免疫应答的蛋白质组分;(b)特异性结合第二RNA分子内的第二靶RNA序列的第二指导RNA(gRNA);以及(c)编码融合蛋白的核酸序列,其中所述融合蛋白包含第一RNA结合多肽、第二RNA结合多肽,其中所述第一RNA结合多肽和所述第二RNA结合多肽都不包含显著DNA-核酸酶活性,其中所述第一RNA结合多肽与所述第二RNA结合多肽不相同,并且其中所述第二RNA结合多肽包含RNA-核酸酶活性。
19.根据权利要求18所述的组合物,其中所述第一gRNA序列包含含有编码选自以下的蛋白质的核酸序列的一部分的间隔子序列:β-2-微球蛋白(β2M)、HLA-A、HLA-B、HLA-C、CD28、CD80、CD86、ICOSLG、OX40L、IL12和CCR7。
20.根据权利要求18所述的组合物,其中所述第一RNA结合多肽或其部分是CRISPR/Cas多肽或其部分。
21.根据权利要求20所述的组合物,其中所述CRISPR/Cas多肽或其部分选自Cas9、Cpf1、Cas13a、Cas13b、Cas13c和CasRX/Cas13d,其中所述CRISPR/Cas多肽具有天然的、降低的或无效的活性。
22.根据权利要求18所述的组合物,其中所述第二RNA结合多肽以与RNA缔合的方式结合RNA。
23.根据权利要求22所述的组合物,其中所述第二RNA结合多肽以切割RNA的方式与RNA缔合。
24.根据权利要求18所述的组合物,其中所述核酸序列包含启动子。
25.根据权利要求18所述的组合物,其中所述第二gRNA包含含有选自以下的序列的至少1、2、3、4、5、6或7个重复的间隔子序列:CUG(SEQ ID NO:18)、CCUG(SEQ ID NO:19)、CAG(SEQ ID NO:80)、GGGGCC(SEQ ID NO:81)及其组合。
26.根据权利要求18所述的组合物,其中所述融合蛋白包含NLS、NES或标签。
27.一种载体,其包含根据权利要求18所述的组合物。
28.根据权利要求27所述的载体,其中所述载体选自:腺相关病毒、逆转录病毒、慢病毒、腺病毒、纳米颗粒、胶束、脂质体、阳离子脂质体/DNA复合物、聚合物囊泡、聚合物/DNA复合物和树枝状聚合物。
29.一种细胞,其包含根据权利要求28所述的载体。
30.根据权利要求18所述的组合物,其中所述第二RNA结合多肽选自:RNA酶1、RNA酶4、RNA酶6、RNA酶7、RNA酶8、RNA酶2、RNA酶6PL、RNA酶L、RNA酶T2、RNA酶11、RNA酶T2样蛋白、NOB1、ENDOV、ENDOG、ENDOD1、hFEN1、hSLFN14、hLACTB2、APEX2、ANG、HRSP12、ZC3H12A、RIDA、PDL6、NTHL、KIAA0391、APEX1、AGO2、EXOG、ZC3H12D、ERN2、PELO、YBEY、CPSF4L、hCG_2002731、ERCC1、RAC1、RAA1、RAB1、DNA2、FLJ35220、FLJ13173、ERCC4、RNA酶1(K41R)、RNA酶1(K41R、D121E)、RNA酶1(K41R、D121E、H119N)、RNA酶1(H119N)、RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N)、RNA酶1(R39D、N67D、N88A、G89D、R91D、H119N、K41R、D121E)、RNA酶1(R39D、N67D、N88A、G89D、R91D)、TENM1、TENM2、RNA酶K、TALEN、ZNF638和hSMG6 PIN。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862682276P | 2018-06-08 | 2018-06-08 | |
US62/682,276 | 2018-06-08 | ||
PCT/US2019/036050 WO2019236998A1 (en) | 2018-06-08 | 2019-06-07 | Compositions and methods for the modulation of adaptive immunity |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113286619A true CN113286619A (zh) | 2021-08-20 |
Family
ID=68769461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980051039.7A Pending CN113286619A (zh) | 2018-06-08 | 2019-06-07 | 用于调节适应性免疫的组合物和方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20190382759A1 (zh) |
EP (1) | EP3801641A4 (zh) |
JP (1) | JP2021526860A (zh) |
KR (1) | KR20210060429A (zh) |
CN (1) | CN113286619A (zh) |
AU (1) | AU2019281006A1 (zh) |
CA (1) | CA3102783A1 (zh) |
SG (1) | SG11202012015YA (zh) |
WO (1) | WO2019236998A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023208256A1 (zh) * | 2022-04-26 | 2023-11-02 | 北京干细胞与再生医学研究院 | 经分离的Cas13蛋白、基于它的基因编辑系统及其用途 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3765094A4 (en) | 2018-03-15 | 2021-12-22 | KSQ Therapeutics, Inc. | GENE REGULATION COMPOSITIONS AND METHODS FOR IMPROVING IMMUNOTHERAPY |
SG11202012004SA (en) | 2018-06-08 | 2021-01-28 | Locanabio Inc | Rna-targeting fusion protein compositions and methods for use |
EP3911741A1 (en) * | 2019-01-14 | 2021-11-24 | University of Rochester | Targeted nuclear rna cleavage and polyadenylation with crispr-cas |
US11661459B2 (en) | 2020-12-03 | 2023-05-30 | Century Therapeutics, Inc. | Artificial cell death polypeptide for chimeric antigen receptor and uses thereof |
WO2023150131A1 (en) * | 2022-02-01 | 2023-08-10 | The Regents Of The University Of California | Method of regulating alternative polyadenylation in rna |
CN114848808B (zh) * | 2022-03-24 | 2023-04-25 | 四川大学 | 基于阳离子脂多肽及细胞因子的免疫增强剂及制法、应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170145394A1 (en) * | 2015-11-23 | 2017-05-25 | The Regents Of The University Of California | Tracking and manipulating cellular rna via nuclear delivery of crispr/cas9 |
WO2017093969A1 (en) * | 2015-12-04 | 2017-06-08 | Novartis Ag | Compositions and methods for immunooncology |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018081806A2 (en) * | 2016-10-31 | 2018-05-03 | University Of Florida Research Foundation, Inc. | Compositions and methods for impeding transcription of expanded microsatellite repeats |
CN110959039A (zh) * | 2017-03-15 | 2020-04-03 | 博德研究所 | 新型cas13b直向同源物crispr酶和系统 |
US11168322B2 (en) * | 2017-06-30 | 2021-11-09 | Arbor Biotechnologies, Inc. | CRISPR RNA targeting enzymes and systems and uses thereof |
-
2019
- 2019-06-07 SG SG11202012015YA patent/SG11202012015YA/en unknown
- 2019-06-07 CA CA3102783A patent/CA3102783A1/en active Pending
- 2019-06-07 KR KR1020217000507A patent/KR20210060429A/ko unknown
- 2019-06-07 AU AU2019281006A patent/AU2019281006A1/en active Pending
- 2019-06-07 WO PCT/US2019/036050 patent/WO2019236998A1/en unknown
- 2019-06-07 EP EP19814000.6A patent/EP3801641A4/en active Pending
- 2019-06-07 US US16/434,787 patent/US20190382759A1/en not_active Abandoned
- 2019-06-07 CN CN201980051039.7A patent/CN113286619A/zh active Pending
- 2019-06-07 JP JP2021518054A patent/JP2021526860A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170145394A1 (en) * | 2015-11-23 | 2017-05-25 | The Regents Of The University Of California | Tracking and manipulating cellular rna via nuclear delivery of crispr/cas9 |
WO2017091630A1 (en) * | 2015-11-23 | 2017-06-01 | The Regents Of The University Of California | Tracking and manipulating cellular rna via nuclear delivery of crispr/cas9 |
WO2017093969A1 (en) * | 2015-12-04 | 2017-06-08 | Novartis Ag | Compositions and methods for immunooncology |
Non-Patent Citations (1)
Title |
---|
DAVID B.T. CO: "RNA Editing with CRISPR-Cas13", SCIENCE, vol. 258, no. 6366, pages 1019 - 1027, XP055491658, DOI: 10.1126/science.aaq0180 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023208256A1 (zh) * | 2022-04-26 | 2023-11-02 | 北京干细胞与再生医学研究院 | 经分离的Cas13蛋白、基于它的基因编辑系统及其用途 |
Also Published As
Publication number | Publication date |
---|---|
EP3801641A4 (en) | 2022-09-28 |
EP3801641A1 (en) | 2021-04-14 |
KR20210060429A (ko) | 2021-05-26 |
JP2021526860A (ja) | 2021-10-11 |
US20190382759A1 (en) | 2019-12-19 |
SG11202012015YA (en) | 2021-01-28 |
WO2019236998A1 (en) | 2019-12-12 |
AU2019281006A1 (en) | 2021-01-28 |
CA3102783A1 (en) | 2019-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10822617B2 (en) | RNA-targeting fusion protein compositions and methods for use | |
CN113286619A (zh) | 用于调节适应性免疫的组合物和方法 | |
US20220127621A1 (en) | Fusion proteins and fusion ribonucleic acids for tracking and manipulating cellular rna | |
CN108463211B (zh) | 用于治疗肌联蛋白类肌病和其它肌联蛋白病变的材料和方法 | |
JP7379447B2 (ja) | ゲノム編集分子の細胞内送達のためのペプチドおよびナノ粒子 | |
AU2022271376A1 (en) | CRISPR/CAS-related methods and compositions for treating herpes simplex virus | |
CN114450031A (zh) | 靶向rna的敲低和替代组合物及使用方法 | |
JP2020519269A (ja) | Crispr/cas9核送達による細胞rnaの狙いを定めた編集 | |
CA3009727A1 (en) | Compositions and methods for the treatment of hemoglobinopathies | |
AU2019326617A1 (en) | FASL immunomodulatory gene therapy compositions and methods for use | |
CN111218447A (zh) | 使用统治型gRNA的CRISPR相关方法和组合物 | |
CN113423831A (zh) | 核酸酶介导的重复扩增 | |
US20220220473A1 (en) | Protein translational control | |
CN112041436A (zh) | 雷帕霉素抗性细胞 | |
JP2023551873A (ja) | Cagリピート病を処置するためのrna標的化組成物および方法 | |
JP2024502036A (ja) | 操作されたt細胞 | |
CN118159650A (zh) | 一种CRISPR-Cas13系统及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |