CN116234918A - I型crispr相关转座酶系统 - Google Patents
I型crispr相关转座酶系统 Download PDFInfo
- Publication number
- CN116234918A CN116234918A CN202180072877.XA CN202180072877A CN116234918A CN 116234918 A CN116234918 A CN 116234918A CN 202180072877 A CN202180072877 A CN 202180072877A CN 116234918 A CN116234918 A CN 116234918A
- Authority
- CN
- China
- Prior art keywords
- cell
- cas
- sequence
- composition
- polynucleotide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108010020764 Transposases Proteins 0.000 title claims abstract description 114
- 102000008579 Transposases Human genes 0.000 title claims abstract description 114
- 108091033409 CRISPR Proteins 0.000 title claims description 13
- 238000010354 CRISPR gene editing Methods 0.000 title claims description 9
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 355
- 238000000034 method Methods 0.000 claims abstract description 157
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 120
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 88
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 88
- 230000008685 targeting Effects 0.000 claims abstract description 56
- 238000003780 insertion Methods 0.000 claims abstract description 29
- 230000037431 insertion Effects 0.000 claims abstract description 29
- 102000040430 polynucleotide Human genes 0.000 claims description 276
- 108091033319 polynucleotide Proteins 0.000 claims description 276
- 239000002157 polynucleotide Substances 0.000 claims description 276
- 210000004027 cell Anatomy 0.000 claims description 256
- 102000004169 proteins and genes Human genes 0.000 claims description 218
- 239000000203 mixture Substances 0.000 claims description 134
- 230000014509 gene expression Effects 0.000 claims description 95
- 230000027455 binding Effects 0.000 claims description 82
- 238000009739 binding Methods 0.000 claims description 79
- 239000013598 vector Substances 0.000 claims description 76
- 230000000694 effects Effects 0.000 claims description 62
- 239000002245 particle Substances 0.000 claims description 56
- 239000012634 fragment Substances 0.000 claims description 53
- 230000001105 regulatory effect Effects 0.000 claims description 41
- 230000035772 mutation Effects 0.000 claims description 39
- 101710163270 Nuclease Proteins 0.000 claims description 37
- 150000001875 compounds Chemical class 0.000 claims description 20
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 20
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 20
- 241000282414 Homo sapiens Species 0.000 claims description 18
- 101100387128 Myxococcus xanthus (strain DK1622) devR gene Proteins 0.000 claims description 18
- 101150044165 cas7 gene Proteins 0.000 claims description 18
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 17
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 17
- 241001465754 Metazoa Species 0.000 claims description 16
- 230000002950 deficient Effects 0.000 claims description 16
- 238000013518 transcription Methods 0.000 claims description 16
- 101100273269 Thermus thermophilus (strain ATCC 27634 / DSM 579 / HB8) cse3 gene Proteins 0.000 claims description 15
- 101150106467 cas6 gene Proteins 0.000 claims description 15
- 201000010099 disease Diseases 0.000 claims description 15
- 230000035897 transcription Effects 0.000 claims description 15
- 101100260928 Escherichia coli tnsB gene Proteins 0.000 claims description 13
- 101100260929 Escherichia coli tnsC gene Proteins 0.000 claims description 13
- 108700026244 Open Reading Frames Proteins 0.000 claims description 13
- 238000011282 treatment Methods 0.000 claims description 13
- 230000000536 complexating effect Effects 0.000 claims description 12
- 230000001965 increasing effect Effects 0.000 claims description 11
- 238000012217 deletion Methods 0.000 claims description 10
- 230000037430 deletion Effects 0.000 claims description 10
- 239000003814 drug Substances 0.000 claims description 10
- 230000002829 reductive effect Effects 0.000 claims description 10
- 238000006467 substitution reaction Methods 0.000 claims description 10
- 230000010354 integration Effects 0.000 claims description 9
- 230000001976 improved effect Effects 0.000 claims description 8
- 108020004485 Nonsense Codon Proteins 0.000 claims description 7
- 210000005260 human cell Anatomy 0.000 claims description 6
- 210000004962 mammalian cell Anatomy 0.000 claims description 6
- 208000035475 disorder Diseases 0.000 claims description 5
- 239000008194 pharmaceutical composition Substances 0.000 claims description 5
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 5
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 claims description 4
- 229940124597 therapeutic agent Drugs 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims 2
- 230000004077 genetic alteration Effects 0.000 claims 1
- 231100000118 genetic alteration Toxicity 0.000 claims 1
- 238000012239 gene modification Methods 0.000 abstract description 4
- 235000018102 proteins Nutrition 0.000 description 192
- 241000196324 Embryophyta Species 0.000 description 173
- 125000003729 nucleotide group Chemical group 0.000 description 142
- 239000002773 nucleotide Substances 0.000 description 132
- 108090000765 processed proteins & peptides Proteins 0.000 description 113
- 102000004196 processed proteins & peptides Human genes 0.000 description 106
- 229920001184 polypeptide Polymers 0.000 description 100
- 108020004414 DNA Proteins 0.000 description 63
- 108020005004 Guide RNA Proteins 0.000 description 50
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 47
- 235000001014 amino acid Nutrition 0.000 description 43
- 102000004190 Enzymes Human genes 0.000 description 40
- 108090000790 Enzymes Proteins 0.000 description 40
- 229940088598 enzyme Drugs 0.000 description 40
- 238000002604 ultrasonography Methods 0.000 description 40
- 150000001413 amino acids Chemical class 0.000 description 39
- 150000002632 lipids Chemical group 0.000 description 39
- 239000012636 effector Substances 0.000 description 36
- 239000003981 vehicle Substances 0.000 description 36
- 239000000178 monomer Substances 0.000 description 34
- 108091028043 Nucleic acid sequence Proteins 0.000 description 33
- 230000004048 modification Effects 0.000 description 32
- 238000012986 modification Methods 0.000 description 32
- 108020004705 Codon Proteins 0.000 description 31
- 125000005647 linker group Chemical group 0.000 description 31
- -1 tniQ Proteins 0.000 description 28
- 210000004899 c-terminal region Anatomy 0.000 description 26
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 26
- 238000010362 genome editing Methods 0.000 description 26
- 230000006870 function Effects 0.000 description 25
- 238000004519 manufacturing process Methods 0.000 description 25
- 239000000047 product Substances 0.000 description 25
- 210000001519 tissue Anatomy 0.000 description 25
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 24
- 239000002105 nanoparticle Substances 0.000 description 23
- 230000000295 complement effect Effects 0.000 description 22
- 230000005684 electric field Effects 0.000 description 22
- 230000001939 inductive effect Effects 0.000 description 19
- 230000032965 negative regulation of cell volume Effects 0.000 description 19
- 239000000126 substance Substances 0.000 description 19
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 18
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 18
- 241000700605 Viruses Species 0.000 description 18
- 238000000338 in vitro Methods 0.000 description 18
- 239000013612 plasmid Substances 0.000 description 18
- 229920001223 polyethylene glycol Polymers 0.000 description 18
- 235000021251 pulses Nutrition 0.000 description 18
- 230000001225 therapeutic effect Effects 0.000 description 18
- 108091023037 Aptamer Proteins 0.000 description 17
- 230000004568 DNA-binding Effects 0.000 description 17
- 238000001727 in vivo Methods 0.000 description 17
- 108020004999 messenger RNA Proteins 0.000 description 17
- 239000002202 Polyethylene glycol Substances 0.000 description 15
- 238000004520 electroporation Methods 0.000 description 15
- 239000002502 liposome Substances 0.000 description 15
- 230000015572 biosynthetic process Effects 0.000 description 14
- 229920000642 polymer Polymers 0.000 description 14
- 238000001890 transfection Methods 0.000 description 14
- 210000003763 chloroplast Anatomy 0.000 description 13
- 235000012000 cholesterol Nutrition 0.000 description 13
- 210000004940 nucleus Anatomy 0.000 description 13
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 12
- 230000001404 mediated effect Effects 0.000 description 12
- 238000005457 optimization Methods 0.000 description 12
- 241000894007 species Species 0.000 description 12
- 230000017105 transposition Effects 0.000 description 12
- 239000013603 viral vector Substances 0.000 description 12
- 108091026890 Coding region Proteins 0.000 description 11
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 11
- 230000002068 genetic effect Effects 0.000 description 11
- 238000000520 microinjection Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 230000009261 transgenic effect Effects 0.000 description 11
- 238000013519 translation Methods 0.000 description 11
- 240000008042 Zea mays Species 0.000 description 10
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 10
- 125000003275 alpha amino acid group Chemical group 0.000 description 10
- 239000013604 expression vector Substances 0.000 description 10
- 241000701161 unidentified adenovirus Species 0.000 description 10
- 241000209094 Oryza Species 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 9
- 238000009396 hybridization Methods 0.000 description 9
- 239000003446 ligand Substances 0.000 description 9
- CITHEXJVPOWHKC-UUWRZZSWSA-N 1,2-di-O-myristoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCC CITHEXJVPOWHKC-UUWRZZSWSA-N 0.000 description 8
- 241000195493 Cryptophyta Species 0.000 description 8
- 241000282412 Homo Species 0.000 description 8
- 241000713666 Lentivirus Species 0.000 description 8
- 238000010459 TALEN Methods 0.000 description 8
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 8
- 230000009418 agronomic effect Effects 0.000 description 8
- 239000002551 biofuel Substances 0.000 description 8
- 210000000170 cell membrane Anatomy 0.000 description 8
- 238000013461 design Methods 0.000 description 8
- 229960003724 dimyristoylphosphatidylcholine Drugs 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 210000001808 exosome Anatomy 0.000 description 8
- 229910052737 gold Inorganic materials 0.000 description 8
- 239000010931 gold Substances 0.000 description 8
- 239000004009 herbicide Substances 0.000 description 8
- 239000012528 membrane Substances 0.000 description 8
- 102000005962 receptors Human genes 0.000 description 8
- 108020003175 receptors Proteins 0.000 description 8
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 8
- 108700010070 Codon Usage Proteins 0.000 description 7
- 102000053602 DNA Human genes 0.000 description 7
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 7
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 7
- 241000124008 Mammalia Species 0.000 description 7
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 7
- 235000007164 Oryza sativa Nutrition 0.000 description 7
- 108020004459 Small interfering RNA Proteins 0.000 description 7
- 108700019146 Transgenes Proteins 0.000 description 7
- 101150066299 cas6f gene Proteins 0.000 description 7
- 230000001413 cellular effect Effects 0.000 description 7
- 238000007385 chemical modification Methods 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 210000000056 organ Anatomy 0.000 description 7
- 235000009566 rice Nutrition 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 125000006850 spacer group Chemical group 0.000 description 7
- 108010075210 streptolysin O Proteins 0.000 description 7
- 230000010474 transient expression Effects 0.000 description 7
- 108091079001 CRISPR RNA Proteins 0.000 description 6
- 241000701022 Cytomegalovirus Species 0.000 description 6
- 241000702421 Dependoparvovirus Species 0.000 description 6
- 241000206602 Eukaryota Species 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 241000209219 Hordeum Species 0.000 description 6
- 241000208125 Nicotiana Species 0.000 description 6
- 241000218657 Picea Species 0.000 description 6
- 241000209140 Triticum Species 0.000 description 6
- 230000004913 activation Effects 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 244000105624 Arachis hypogaea Species 0.000 description 5
- 241000195649 Chlorella <Chlorellales> Species 0.000 description 5
- 241000134884 Ericales Species 0.000 description 5
- 241000238631 Hexapoda Species 0.000 description 5
- 108010061833 Integrases Proteins 0.000 description 5
- 241000227653 Lycopersicon Species 0.000 description 5
- 241000699666 Mus <mouse, genus> Species 0.000 description 5
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 5
- 229920002873 Polyethylenimine Polymers 0.000 description 5
- 108091028664 Ribonucleotide Proteins 0.000 description 5
- 241000714474 Rous sarcoma virus Species 0.000 description 5
- 108091027544 Subgenomic mRNA Proteins 0.000 description 5
- 108020004566 Transfer RNA Proteins 0.000 description 5
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 5
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 5
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 210000001124 body fluid Anatomy 0.000 description 5
- 239000010839 body fluid Substances 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 101150055191 cas3 gene Proteins 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 5
- 125000002091 cationic group Chemical group 0.000 description 5
- 235000005822 corn Nutrition 0.000 description 5
- 238000006731 degradation reaction Methods 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 102000015694 estrogen receptors Human genes 0.000 description 5
- 108010038795 estrogen receptors Proteins 0.000 description 5
- 230000035558 fertility Effects 0.000 description 5
- 230000009368 gene silencing by RNA Effects 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 230000002209 hydrophobic effect Effects 0.000 description 5
- 235000009973 maize Nutrition 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 239000002070 nanowire Substances 0.000 description 5
- 230000030648 nucleus localization Effects 0.000 description 5
- 235000016709 nutrition Nutrition 0.000 description 5
- 239000003921 oil Substances 0.000 description 5
- 235000019198 oils Nutrition 0.000 description 5
- 210000003463 organelle Anatomy 0.000 description 5
- 244000052769 pathogen Species 0.000 description 5
- 230000001681 protective effect Effects 0.000 description 5
- 210000001938 protoplast Anatomy 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 239000002336 ribonucleotide Substances 0.000 description 5
- 125000002652 ribonucleotide group Chemical group 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 230000009870 specific binding Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 230000005945 translocation Effects 0.000 description 5
- 230000003612 virological effect Effects 0.000 description 5
- 229910052725 zinc Inorganic materials 0.000 description 5
- 239000011701 zinc Substances 0.000 description 5
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 241000589158 Agrobacterium Species 0.000 description 4
- 241000234282 Allium Species 0.000 description 4
- 241000192542 Anabaena Species 0.000 description 4
- 239000002028 Biomass Substances 0.000 description 4
- 240000002791 Brassica napus Species 0.000 description 4
- 244000025254 Cannabis sativa Species 0.000 description 4
- 241000218631 Coniferophyta Species 0.000 description 4
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 4
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 4
- 208000035240 Disease Resistance Diseases 0.000 description 4
- 101100382541 Escherichia coli (strain K12) casD gene Proteins 0.000 description 4
- 101100005249 Escherichia coli (strain K12) ygcB gene Proteins 0.000 description 4
- 101100260930 Escherichia coli tnsD gene Proteins 0.000 description 4
- 108060002716 Exonuclease Proteins 0.000 description 4
- 241000233866 Fungi Species 0.000 description 4
- 235000010469 Glycine max Nutrition 0.000 description 4
- 244000068988 Glycine max Species 0.000 description 4
- 235000007340 Hordeum vulgare Nutrition 0.000 description 4
- 102100034349 Integrase Human genes 0.000 description 4
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 4
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 4
- 241000220225 Malus Species 0.000 description 4
- 241000219823 Medicago Species 0.000 description 4
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 4
- 241000234295 Musa Species 0.000 description 4
- 101100387131 Myxococcus xanthus (strain DK1622) devS gene Proteins 0.000 description 4
- 240000001090 Papaver somniferum Species 0.000 description 4
- 102000035195 Peptidases Human genes 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- 244000046052 Phaseolus vulgaris Species 0.000 description 4
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 4
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 4
- 241001536628 Poales Species 0.000 description 4
- ATUOYWHBWRKTHZ-UHFFFAOYSA-N Propane Chemical compound CCC ATUOYWHBWRKTHZ-UHFFFAOYSA-N 0.000 description 4
- 241000220324 Pyrus Species 0.000 description 4
- 108091030071 RNAI Proteins 0.000 description 4
- 108091027967 Small hairpin RNA Proteins 0.000 description 4
- 244000062793 Sorghum vulgare Species 0.000 description 4
- 241000187747 Streptomyces Species 0.000 description 4
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 4
- 108091028113 Trans-activating crRNA Proteins 0.000 description 4
- 102000040945 Transcription factor Human genes 0.000 description 4
- 108091023040 Transcription factor Proteins 0.000 description 4
- 230000035508 accumulation Effects 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 4
- 102000035181 adaptor proteins Human genes 0.000 description 4
- 108091005764 adaptor proteins Proteins 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 239000013566 allergen Substances 0.000 description 4
- 238000003491 array Methods 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 239000000969 carrier Substances 0.000 description 4
- 101150049463 cas5 gene Proteins 0.000 description 4
- 101150055766 cat gene Proteins 0.000 description 4
- 230000009918 complex formation Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 210000000805 cytoplasm Anatomy 0.000 description 4
- 239000005547 deoxyribonucleotide Substances 0.000 description 4
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 230000005670 electromagnetic radiation Effects 0.000 description 4
- 102000013165 exonuclease Human genes 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 230000003834 intracellular effect Effects 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 210000004185 liver Anatomy 0.000 description 4
- 108091070501 miRNA Proteins 0.000 description 4
- 230000009437 off-target effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000035515 penetration Effects 0.000 description 4
- 150000003904 phospholipids Chemical class 0.000 description 4
- 210000002706 plastid Anatomy 0.000 description 4
- 239000011148 porous material Substances 0.000 description 4
- 230000002028 premature Effects 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 230000005070 ripening Effects 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 230000000638 stimulation Effects 0.000 description 4
- 229940113082 thymine Drugs 0.000 description 4
- 108091006106 transcriptional activators Proteins 0.000 description 4
- 108091006107 transcriptional repressors Proteins 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 241001430294 unidentified retrovirus Species 0.000 description 4
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 3
- KIUKXJAPPMFGSW-DNGZLQJQSA-N (2S,3S,4S,5R,6R)-6-[(2S,3R,4R,5S,6R)-3-Acetamido-2-[(2S,3S,4R,5R,6R)-6-[(2R,3R,4R,5S,6R)-3-acetamido-2,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-2-carboxy-4,5-dihydroxyoxan-3-yl]oxy-5-hydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-3,4,5-trihydroxyoxane-2-carboxylic acid Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@H](O3)C(O)=O)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](C(O)=O)O1 KIUKXJAPPMFGSW-DNGZLQJQSA-N 0.000 description 3
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 3
- 241000756998 Alismatales Species 0.000 description 3
- 108700028369 Alleles Proteins 0.000 description 3
- 235000005340 Asparagus officinalis Nutrition 0.000 description 3
- 244000075850 Avena orientalis Species 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 241000219198 Brassica Species 0.000 description 3
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 3
- 241000499511 Cabbage leaf curl virus Species 0.000 description 3
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 3
- 235000002566 Capsicum Nutrition 0.000 description 3
- 241000195628 Chlorophyta Species 0.000 description 3
- 241000207199 Citrus Species 0.000 description 3
- 241000723377 Coffea Species 0.000 description 3
- 101100326871 Escherichia coli (strain K12) ygbF gene Proteins 0.000 description 3
- 241000218218 Ficus <angiosperm> Species 0.000 description 3
- 241000219146 Gossypium Species 0.000 description 3
- 244000020551 Helianthus annuus Species 0.000 description 3
- 235000003222 Helianthus annuus Nutrition 0.000 description 3
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 description 3
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- 235000003228 Lactuca sativa Nutrition 0.000 description 3
- 240000008415 Lactuca sativa Species 0.000 description 3
- 241000207832 Lamiales Species 0.000 description 3
- 241000209510 Liliopsida Species 0.000 description 3
- 241000219745 Lupinus Species 0.000 description 3
- 240000003183 Manihot esculenta Species 0.000 description 3
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- 241000224474 Nannochloropsis Species 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- DFPAKSUCGFBDDF-UHFFFAOYSA-N Nicotinamide Chemical compound NC(=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-UHFFFAOYSA-N 0.000 description 3
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 241000199919 Phaeophyceae Species 0.000 description 3
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 3
- 241000018646 Pinus brutia Species 0.000 description 3
- 235000011613 Pinus brutia Nutrition 0.000 description 3
- 241000219843 Pisum Species 0.000 description 3
- 235000010582 Pisum sativum Nutrition 0.000 description 3
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 3
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 3
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 3
- 208000020584 Polyploidy Diseases 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 3
- 235000014443 Pyrus communis Nutrition 0.000 description 3
- 108091008103 RNA aptamers Proteins 0.000 description 3
- 241000220259 Raphanus Species 0.000 description 3
- 241000863430 Shewanella Species 0.000 description 3
- 244000061456 Solanum tuberosum Species 0.000 description 3
- 235000002595 Solanum tuberosum Nutrition 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical group OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 3
- 241000219793 Trifolium Species 0.000 description 3
- 235000021307 Triticum Nutrition 0.000 description 3
- 241000219977 Vigna Species 0.000 description 3
- 230000036579 abiotic stress Effects 0.000 description 3
- JFDZBHWFFUWGJE-UHFFFAOYSA-N benzonitrile Chemical compound N#CC1=CC=CC=C1 JFDZBHWFFUWGJE-UHFFFAOYSA-N 0.000 description 3
- 239000012472 biological sample Substances 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 150000001720 carbohydrates Chemical class 0.000 description 3
- 235000014633 carbohydrates Nutrition 0.000 description 3
- 101150117416 cas2 gene Proteins 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 150000001768 cations Chemical class 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 210000002421 cell wall Anatomy 0.000 description 3
- 230000004700 cellular uptake Effects 0.000 description 3
- 235000013339 cereals Nutrition 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 235000020971 citrus fruits Nutrition 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 244000038559 crop plants Species 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 3
- 210000001508 eye Anatomy 0.000 description 3
- 239000000835 fiber Substances 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 230000005017 genetic modification Effects 0.000 description 3
- 230000007614 genetic variation Effects 0.000 description 3
- 235000013617 genetically modified food Nutrition 0.000 description 3
- 230000007407 health benefit Effects 0.000 description 3
- 230000002363 herbicidal effect Effects 0.000 description 3
- 229920002674 hyaluronan Polymers 0.000 description 3
- 229960003160 hyaluronic acid Drugs 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 230000005847 immunogenicity Effects 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 238000001638 lipofection Methods 0.000 description 3
- 238000011068 loading method Methods 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 210000003205 muscle Anatomy 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 239000002853 nucleic acid probe Substances 0.000 description 3
- 230000001717 pathogenic effect Effects 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 3
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 3
- 230000000541 pulsatile effect Effects 0.000 description 3
- 230000007115 recruitment Effects 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 239000000377 silicon dioxide Substances 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000035882 stress Effects 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- NRJAVPSFFCBXDT-HUESYALOSA-N 1,2-distearoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCCCC NRJAVPSFFCBXDT-HUESYALOSA-N 0.000 description 2
- KWVJHCQQUFDPLU-YEUCEMRASA-N 2,3-bis[[(z)-octadec-9-enoyl]oxy]propyl-trimethylazanium Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(C[N+](C)(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC KWVJHCQQUFDPLU-YEUCEMRASA-N 0.000 description 2
- ZLHLYESIHSHXGM-UHFFFAOYSA-N 4,6-dimethyl-1h-imidazo[1,2-a]purin-9-one Chemical compound N=1C(C)=CN(C2=O)C=1N(C)C1=C2NC=N1 ZLHLYESIHSHXGM-UHFFFAOYSA-N 0.000 description 2
- DODQJNMQWMSYGS-QPLCGJKRSA-N 4-[(z)-1-[4-[2-(dimethylamino)ethoxy]phenyl]-1-phenylbut-1-en-2-yl]phenol Chemical compound C=1C=C(O)C=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 DODQJNMQWMSYGS-QPLCGJKRSA-N 0.000 description 2
- 241000218642 Abies Species 0.000 description 2
- 241001133760 Acoelorraphe Species 0.000 description 2
- 235000009434 Actinidia chinensis Nutrition 0.000 description 2
- 244000298697 Actinidia deliciosa Species 0.000 description 2
- 235000009436 Actinidia deliciosa Nutrition 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 102100033647 Activity-regulated cytoskeleton-associated protein Human genes 0.000 description 2
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 2
- 235000001271 Anacardium Nutrition 0.000 description 2
- 241000693997 Anacardium Species 0.000 description 2
- 244000099147 Ananas comosus Species 0.000 description 2
- 235000007119 Ananas comosus Nutrition 0.000 description 2
- 241000208173 Apiaceae Species 0.000 description 2
- 241000219195 Arabidopsis thaliana Species 0.000 description 2
- 235000003911 Arachis Nutrition 0.000 description 2
- 235000010777 Arachis hypogaea Nutrition 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- 244000003416 Asparagus officinalis Species 0.000 description 2
- 241001106067 Atropa Species 0.000 description 2
- 235000005781 Avena Nutrition 0.000 description 2
- 241000193388 Bacillus thuringiensis Species 0.000 description 2
- 235000016068 Berberis vulgaris Nutrition 0.000 description 2
- 241000335053 Beta vulgaris Species 0.000 description 2
- KWIUHFFTVRNATP-UHFFFAOYSA-N Betaine Natural products C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 2
- 241000339490 Brachyachne Species 0.000 description 2
- 235000011331 Brassica Nutrition 0.000 description 2
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 2
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 2
- ZUHQCDZJPTXVCU-UHFFFAOYSA-N C1#CCCC2=CC=CC=C2C2=CC=CC=C21 Chemical compound C1#CCCC2=CC=CC=C2C2=CC=CC=C21 ZUHQCDZJPTXVCU-UHFFFAOYSA-N 0.000 description 2
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 2
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 2
- 240000008574 Capsicum frutescens Species 0.000 description 2
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 2
- 244000020518 Carthamus tinctorius Species 0.000 description 2
- 241000219504 Caryophyllales Species 0.000 description 2
- 108090000994 Catalytic RNA Proteins 0.000 description 2
- 102000053642 Catalytic RNA Human genes 0.000 description 2
- 241000208328 Catharanthus Species 0.000 description 2
- 241000227752 Chaetoceros Species 0.000 description 2
- 241000195585 Chlamydomonas Species 0.000 description 2
- 235000007542 Cichorium intybus Nutrition 0.000 description 2
- 244000298479 Cichorium intybus Species 0.000 description 2
- 240000004270 Colocasia esculenta var. antiquorum Species 0.000 description 2
- 241000233838 Commelina Species 0.000 description 2
- 241000134970 Cornales Species 0.000 description 2
- 229920000742 Cotton Polymers 0.000 description 2
- 244000168525 Croton tiglium Species 0.000 description 2
- 241000219112 Cucumis Species 0.000 description 2
- 241001116468 Cunninghamia Species 0.000 description 2
- 241000192700 Cyanobacteria Species 0.000 description 2
- 108010052832 Cytochromes Proteins 0.000 description 2
- 102000018832 Cytochromes Human genes 0.000 description 2
- 241000208175 Daucus Species 0.000 description 2
- 235000002767 Daucus carota Nutrition 0.000 description 2
- 244000000626 Daucus carota Species 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- UBJVUCKUDDKUJF-UHFFFAOYSA-N Diallyl sulfide Chemical compound C=CCSCC=C UBJVUCKUDDKUJF-UHFFFAOYSA-N 0.000 description 2
- 241000199914 Dinophyceae Species 0.000 description 2
- 235000002723 Dioscorea alata Nutrition 0.000 description 2
- 235000007056 Dioscorea composita Nutrition 0.000 description 2
- 235000009723 Dioscorea convolvulacea Nutrition 0.000 description 2
- 235000005362 Dioscorea floribunda Nutrition 0.000 description 2
- 235000004868 Dioscorea macrostachya Nutrition 0.000 description 2
- 235000005361 Dioscorea nummularia Nutrition 0.000 description 2
- 235000005360 Dioscorea spiculiflora Nutrition 0.000 description 2
- 235000011511 Diospyros Nutrition 0.000 description 2
- 244000236655 Diospyros kaki Species 0.000 description 2
- 241000195634 Dunaliella Species 0.000 description 2
- 235000001950 Elaeis guineensis Nutrition 0.000 description 2
- 244000127993 Elaeis melanococca Species 0.000 description 2
- 241000713730 Equine infectious anemia virus Species 0.000 description 2
- 241001112020 Eriocaulon Species 0.000 description 2
- 101100007792 Escherichia coli (strain K12) casB gene Proteins 0.000 description 2
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 2
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 2
- 241000220223 Fragaria Species 0.000 description 2
- 235000016623 Fragaria vesca Nutrition 0.000 description 2
- 240000009088 Fragaria x ananassa Species 0.000 description 2
- 235000011363 Fragaria x ananassa Nutrition 0.000 description 2
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical class OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 2
- 241000134874 Geraniales Species 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 239000005562 Glyphosate Substances 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 108090000353 Histone deacetylase Proteins 0.000 description 2
- 102000003964 Histone deacetylase Human genes 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 2
- 241000208278 Hyoscyamus Species 0.000 description 2
- 102000012330 Integrases Human genes 0.000 description 2
- 102000004310 Ion Channels Human genes 0.000 description 2
- 108090000862 Ion Channels Proteins 0.000 description 2
- 235000006350 Ipomoea batatas var. batatas Nutrition 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- 241000209499 Lemna Species 0.000 description 2
- 108090001030 Lipoproteins Proteins 0.000 description 2
- 102000004895 Lipoproteins Human genes 0.000 description 2
- 101100385364 Listeria seeligeri serovar 1/2b (strain ATCC 35967 / DSM 20751 / CCM 3970 / CIP 100100 / NCTC 11856 / SLCC 3954 / 1120) cas13 gene Proteins 0.000 description 2
- 240000002262 Litsea cubeba Species 0.000 description 2
- 235000012854 Litsea cubeba Nutrition 0.000 description 2
- 241000209082 Lolium Species 0.000 description 2
- 241000218922 Magnoliophyta Species 0.000 description 2
- 241000219171 Malpighiales Species 0.000 description 2
- 235000011430 Malus pumila Nutrition 0.000 description 2
- 235000015103 Malus silvestris Nutrition 0.000 description 2
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- 108060004795 Methyltransferase Proteins 0.000 description 2
- 241000134886 Myrtales Species 0.000 description 2
- KWIUHFFTVRNATP-UHFFFAOYSA-O N,N,N-trimethylglycinium Chemical compound C[N+](C)(C)CC(O)=O KWIUHFFTVRNATP-UHFFFAOYSA-O 0.000 description 2
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 2
- 101100386053 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-3 gene Proteins 0.000 description 2
- 241000192656 Nostoc Species 0.000 description 2
- 108091005461 Nucleic proteins Proteins 0.000 description 2
- 102000002488 Nucleoplasmin Human genes 0.000 description 2
- 241000795633 Olea <sea slug> Species 0.000 description 2
- 235000011203 Origanum Nutrition 0.000 description 2
- 240000000783 Origanum majorana Species 0.000 description 2
- 108091081548 Palindromic sequence Proteins 0.000 description 2
- 235000005308 Pandanus Nutrition 0.000 description 2
- 241000209117 Panicum Species 0.000 description 2
- 235000006443 Panicum miliaceum subsp. miliaceum Nutrition 0.000 description 2
- 235000009037 Panicum miliaceum subsp. ruderale Nutrition 0.000 description 2
- 235000011096 Papaver Nutrition 0.000 description 2
- 235000008753 Papaver somniferum Nutrition 0.000 description 2
- 241000701945 Parvoviridae Species 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 244000025272 Persea americana Species 0.000 description 2
- 235000008673 Persea americana Nutrition 0.000 description 2
- 241000206731 Phaeodactylum Species 0.000 description 2
- 241000219833 Phaseolus Species 0.000 description 2
- 241000218633 Pinidae Species 0.000 description 2
- 108010059820 Polygalacturonase Proteins 0.000 description 2
- 241000710007 Potexvirus Species 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 206010036790 Productive cough Diseases 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 101710149951 Protein Tat Proteins 0.000 description 2
- 241001290151 Prunus avium subsp. avium Species 0.000 description 2
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 241000206572 Rhodophyta Species 0.000 description 2
- 241000220221 Rosales Species 0.000 description 2
- 240000000111 Saccharum officinarum Species 0.000 description 2
- 235000007201 Saccharum officinarum Nutrition 0.000 description 2
- 241000220156 Saxifraga Species 0.000 description 2
- 241000209056 Secale Species 0.000 description 2
- 241000220261 Sinapis Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 235000002634 Solanum Nutrition 0.000 description 2
- 241000207763 Solanum Species 0.000 description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 2
- 108091061980 Spherical nucleic acid Proteins 0.000 description 2
- 235000009337 Spinacia oleracea Nutrition 0.000 description 2
- 244000300264 Spinacia oleracea Species 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 241001330502 Stephania Species 0.000 description 2
- 241000194020 Streptococcus thermophilus Species 0.000 description 2
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 2
- 241000192707 Synechococcus Species 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- 241001312519 Trigonella Species 0.000 description 2
- 229910052770 Uranium Inorganic materials 0.000 description 2
- 244000078534 Vaccinium myrtillus Species 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 241000219873 Vicia Species 0.000 description 2
- 241000863480 Vinca Species 0.000 description 2
- 235000009392 Vitis Nutrition 0.000 description 2
- 241000219095 Vitis Species 0.000 description 2
- 241000607479 Yersinia pestis Species 0.000 description 2
- 241000209149 Zea Species 0.000 description 2
- 241000234675 Zingiberales Species 0.000 description 2
- 102000005421 acetyltransferase Human genes 0.000 description 2
- 108020002494 acetyltransferase Proteins 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 150000001345 alkine derivatives Chemical group 0.000 description 2
- 125000000217 alkyl group Chemical group 0.000 description 2
- ANVAOWXLWRTKGA-XHGAXZNDSA-N all-trans-alpha-carotene Chemical compound CC=1CCCC(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1C(C)=CCCC1(C)C ANVAOWXLWRTKGA-XHGAXZNDSA-N 0.000 description 2
- 150000001412 amines Chemical group 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 230000003698 anagen phase Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 150000001540 azides Chemical group 0.000 description 2
- 229940097012 bacillus thuringiensis Drugs 0.000 description 2
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 2
- 229960003237 betaine Drugs 0.000 description 2
- 229920002988 biodegradable polymer Polymers 0.000 description 2
- 239000004621 biodegradable polymer Substances 0.000 description 2
- 239000003225 biodiesel Substances 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 230000008499 blood brain barrier function Effects 0.000 description 2
- 210000001218 blood-brain barrier Anatomy 0.000 description 2
- 238000009395 breeding Methods 0.000 description 2
- 230000001488 breeding effect Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 239000001390 capsicum minimum Substances 0.000 description 2
- 125000003917 carbamoyl group Chemical group [H]N([H])C(*)=O 0.000 description 2
- 235000021466 carotenoid Nutrition 0.000 description 2
- 150000001747 carotenoids Chemical class 0.000 description 2
- 230000032823 cell division Effects 0.000 description 2
- 210000003855 cell nucleus Anatomy 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 210000003793 centrosome Anatomy 0.000 description 2
- 210000002939 cerumen Anatomy 0.000 description 2
- 235000019693 cherries Nutrition 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 230000009260 cross reactivity Effects 0.000 description 2
- 101150085344 csa5 gene Proteins 0.000 description 2
- JHIVVAPYMSGYDF-UHFFFAOYSA-N cyclohexanone Chemical compound O=C1CCCCC1 JHIVVAPYMSGYDF-UHFFFAOYSA-N 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 210000000172 cytosol Anatomy 0.000 description 2
- 230000009615 deamination Effects 0.000 description 2
- 238000006481 deamination reaction Methods 0.000 description 2
- 230000001687 destabilization Effects 0.000 description 2
- 235000014113 dietary fatty acids Nutrition 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- 235000004879 dioscorea Nutrition 0.000 description 2
- 238000012377 drug delivery Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000012202 endocytosis Effects 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 229930195729 fatty acid Natural products 0.000 description 2
- 239000000194 fatty acid Substances 0.000 description 2
- 150000004665 fatty acids Chemical class 0.000 description 2
- 229940126864 fibroblast growth factor Drugs 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 229930182830 galactose Natural products 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 210000004602 germ cell Anatomy 0.000 description 2
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 2
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 2
- 229940097068 glyphosate Drugs 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 235000013402 health food Nutrition 0.000 description 2
- 210000003494 hepatocyte Anatomy 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 2
- 208000026278 immune system disease Diseases 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 235000011073 invertase Nutrition 0.000 description 2
- 229910052742 iron Inorganic materials 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 230000005291 magnetic effect Effects 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 235000019713 millet Nutrition 0.000 description 2
- 230000003278 mimic effect Effects 0.000 description 2
- 210000003470 mitochondria Anatomy 0.000 description 2
- 230000002438 mitochondrial effect Effects 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 229960003966 nicotinamide Drugs 0.000 description 2
- 235000005152 nicotinamide Nutrition 0.000 description 2
- 239000011570 nicotinamide Substances 0.000 description 2
- 102000044158 nucleic acid binding protein Human genes 0.000 description 2
- 108700020942 nucleic acid binding protein Proteins 0.000 description 2
- 108060005597 nucleoplasmin Proteins 0.000 description 2
- 102000026415 nucleotide binding proteins Human genes 0.000 description 2
- 108091014756 nucleotide binding proteins Proteins 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 235000020232 peanut Nutrition 0.000 description 2
- 239000003016 pheromone Substances 0.000 description 2
- 230000037039 plant physiology Effects 0.000 description 2
- 239000004417 polycarbonate Substances 0.000 description 2
- 239000001294 propane Substances 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 108091092562 ribozyme Proteins 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 102000023888 sequence-specific DNA binding proteins Human genes 0.000 description 2
- 108091008420 sequence-specific DNA binding proteins Proteins 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 230000007781 signaling event Effects 0.000 description 2
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 2
- 229960002930 sirolimus Drugs 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 210000003802 sputum Anatomy 0.000 description 2
- 208000024794 sputum Diseases 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 150000004763 sulfides Chemical class 0.000 description 2
- 239000004094 surface-active agent Substances 0.000 description 2
- 108010066762 sweet arrow peptide Proteins 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 239000001648 tannin Substances 0.000 description 2
- 229920001864 tannin Polymers 0.000 description 2
- 235000018553 tannin Nutrition 0.000 description 2
- UWHCKJMYHZGTIT-UHFFFAOYSA-N tetraethylene glycol Chemical compound OCCOCCOCCOCCO UWHCKJMYHZGTIT-UHFFFAOYSA-N 0.000 description 2
- 150000003573 thiols Chemical class 0.000 description 2
- 230000036962 time dependent Effects 0.000 description 2
- 239000003053 toxin Substances 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- 108700012359 toxins Proteins 0.000 description 2
- QAIPRVGONGVQAS-DUXPYHPUSA-N trans-caffeic acid Chemical compound OC(=O)\C=C\C1=CC=C(O)C(O)=C1 QAIPRVGONGVQAS-DUXPYHPUSA-N 0.000 description 2
- KBPHJBAIARWVSC-XQIHNALSSA-N trans-lutein Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2C(=CC(O)CC2(C)C)C KBPHJBAIARWVSC-XQIHNALSSA-N 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 230000010415 tropism Effects 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 2
- PFTAWBLQPZVEMU-ZFWWWQNUSA-N (+)-epicatechin Natural products C1([C@@H]2OC3=CC(O)=CC(O)=C3C[C@@H]2O)=CC=C(O)C(O)=C1 PFTAWBLQPZVEMU-ZFWWWQNUSA-N 0.000 description 1
- PFTAWBLQPZVEMU-UKRRQHHQSA-N (-)-epicatechin Chemical compound C1([C@H]2OC3=CC(O)=CC(O)=C3C[C@H]2O)=CC=C(O)C(O)=C1 PFTAWBLQPZVEMU-UKRRQHHQSA-N 0.000 description 1
- YDNYEJZZJXFADP-SNVBAGLBSA-N (2r)-5-amino-2-[(4-methylphenyl)sulfonylamino]-5-oxopentanoic acid Chemical compound CC1=CC=C(S(=O)(=O)N[C@H](CCC(N)=O)C(O)=O)C=C1 YDNYEJZZJXFADP-SNVBAGLBSA-N 0.000 description 1
- FYGDTMLNYKFZSV-URKRLVJHSA-N (2s,3r,4s,5s,6r)-2-[(2r,4r,5r,6s)-4,5-dihydroxy-2-(hydroxymethyl)-6-[(2r,4r,5r,6s)-4,5,6-trihydroxy-2-(hydroxymethyl)oxan-3-yl]oxyoxan-3-yl]oxy-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1[C@@H](CO)O[C@@H](OC2[C@H](O[C@H](O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-URKRLVJHSA-N 0.000 description 1
- JKQXZKUSFCKOGQ-JLGXGRJMSA-N (3R,3'R)-beta,beta-carotene-3,3'-diol Chemical compound C([C@H](O)CC=1C)C(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)C[C@@H](O)CC1(C)C JKQXZKUSFCKOGQ-JLGXGRJMSA-N 0.000 description 1
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 description 1
- ACEAELOMUCBPJP-UHFFFAOYSA-N (E)-3,4,5-trihydroxycinnamic acid Natural products OC(=O)C=CC1=CC(O)=C(O)C(O)=C1 ACEAELOMUCBPJP-UHFFFAOYSA-N 0.000 description 1
- KSEBMYQBYZTDHS-HWKANZROSA-M (E)-Ferulic acid Natural products COC1=CC(\C=C\C([O-])=O)=CC=C1O KSEBMYQBYZTDHS-HWKANZROSA-M 0.000 description 1
- DSSYKIVIOFKYAU-XCBNKYQSSA-N (R)-camphor Chemical compound C1C[C@@]2(C)C(=O)C[C@@H]1C2(C)C DSSYKIVIOFKYAU-XCBNKYQSSA-N 0.000 description 1
- NSMXQKNUPPXBRG-SECBINFHSA-N (R)-lisofylline Chemical compound O=C1N(CCCC[C@H](O)C)C(=O)N(C)C2=C1N(C)C=N2 NSMXQKNUPPXBRG-SECBINFHSA-N 0.000 description 1
- KILNVBDSWZSGLL-KXQOOQHDSA-N 1,2-dihexadecanoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCC KILNVBDSWZSGLL-KXQOOQHDSA-N 0.000 description 1
- MWRBNPKJOOWZPW-NYVOMTAGSA-N 1,2-dioleoyl-sn-glycero-3-phosphoethanolamine zwitterion Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC[C@H](COP(O)(=O)OCCN)OC(=O)CCCCCCC\C=C/CCCCCCCC MWRBNPKJOOWZPW-NYVOMTAGSA-N 0.000 description 1
- 108091000130 1-aminocyclopropane-1-carboxylate deaminase Proteins 0.000 description 1
- 101710194665 1-aminocyclopropane-1-carboxylate synthase Proteins 0.000 description 1
- 108010010888 1-aminocyclopropane-1-carboxylic acid oxidase Proteins 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- LOVYCUYJRWLTSU-UHFFFAOYSA-N 2-(3,4-dichlorophenoxy)-n,n-diethylethanamine Chemical compound CCN(CC)CCOC1=CC=C(Cl)C(Cl)=C1 LOVYCUYJRWLTSU-UHFFFAOYSA-N 0.000 description 1
- SXERGJJQSKIUIC-UHFFFAOYSA-N 2-Phenoxypropionic acid Chemical compound OC(=O)C(C)OC1=CC=CC=C1 SXERGJJQSKIUIC-UHFFFAOYSA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- 125000001494 2-propynyl group Chemical group [H]C#CC([H])([H])* 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- 125000004080 3-carboxypropanoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C(O[H])=O 0.000 description 1
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 description 1
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 1
- JBYXPOFIGCOSSB-GOJKSUSPSA-N 9-cis,11-trans-octadecadienoic acid Chemical compound CCCCCC\C=C\C=C/CCCCCCCC(O)=O JBYXPOFIGCOSSB-GOJKSUSPSA-N 0.000 description 1
- 239000013607 AAV vector Substances 0.000 description 1
- 102000005416 ATP-Binding Cassette Transporters Human genes 0.000 description 1
- 108010006533 ATP-Binding Cassette Transporters Proteins 0.000 description 1
- 240000004507 Abelmoschus esculentus Species 0.000 description 1
- RSWGJHLUYNHPMX-UHFFFAOYSA-N Abietic-Saeure Natural products C12CCC(C(C)C)=CC2=CCC2C1(C)CCCC2(C)C(O)=O RSWGJHLUYNHPMX-UHFFFAOYSA-N 0.000 description 1
- 241000208140 Acer Species 0.000 description 1
- 108010013043 Acetylesterase Proteins 0.000 description 1
- 101710145411 Acid beta-fructofuranosidase Proteins 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 1
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 1
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 1
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 1
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 101100385358 Alicyclobacillus acidoterrestris (strain ATCC 49025 / DSM 3922 / CIP 106132 / NCIMB 13137 / GD3B) cas12b gene Proteins 0.000 description 1
- 241000049624 Alisma plantago-aquatica subsp. orientale Species 0.000 description 1
- 235000005254 Allium ampeloprasum Nutrition 0.000 description 1
- 240000006108 Allium ampeloprasum Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 241000605623 Alseodaphne Species 0.000 description 1
- 235000009328 Amaranthus caudatus Nutrition 0.000 description 1
- 240000001592 Amaranthus caudatus Species 0.000 description 1
- 241000611184 Amphora Species 0.000 description 1
- 235000003840 Amygdalus nana Nutrition 0.000 description 1
- 244000144730 Amygdalus persica Species 0.000 description 1
- 206010073478 Anaplastic large-cell lymphoma Diseases 0.000 description 1
- 241000024188 Andala Species 0.000 description 1
- 241000746375 Andrographis Species 0.000 description 1
- 108020004491 Antisense DNA Proteins 0.000 description 1
- 235000003276 Apios tuberosa Nutrition 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 1
- 235000010591 Appio Nutrition 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 101100042633 Arabidopsis thaliana SINAT2 gene Proteins 0.000 description 1
- 235000017060 Arachis glabrata Nutrition 0.000 description 1
- 235000018262 Arachis monticola Nutrition 0.000 description 1
- 235000010744 Arachis villosulicarpa Nutrition 0.000 description 1
- 241000186692 Araucariales Species 0.000 description 1
- 241000123640 Arecales Species 0.000 description 1
- 241000726094 Aristolochia Species 0.000 description 1
- BHELIUBJHYAEDK-OAIUPTLZSA-N Aspoxicillin Chemical compound C1([C@H](C(=O)N[C@@H]2C(N3[C@H](C(C)(C)S[C@@H]32)C(O)=O)=O)NC(=O)[C@H](N)CC(=O)NC)=CC=C(O)C=C1 BHELIUBJHYAEDK-OAIUPTLZSA-N 0.000 description 1
- 241000208837 Asterales Species 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 235000007558 Avena sp Nutrition 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 241000003910 Baronia <angiosperm> Species 0.000 description 1
- 206010061692 Benign muscle neoplasm Diseases 0.000 description 1
- 235000011274 Benincasa cerifera Nutrition 0.000 description 1
- 244000036905 Benincasa cerifera Species 0.000 description 1
- KHBQMWCZKVMBLN-UHFFFAOYSA-N Benzenesulfonamide Chemical compound NS(=O)(=O)C1=CC=CC=C1 KHBQMWCZKVMBLN-UHFFFAOYSA-N 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 229920002498 Beta-glucan Polymers 0.000 description 1
- 235000018185 Betula X alpestris Nutrition 0.000 description 1
- 235000018212 Betula X uliginosa Nutrition 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 241001536324 Botryococcus Species 0.000 description 1
- 235000003351 Brassica cretica Nutrition 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 1
- 235000004221 Brassica oleracea var gemmifera Nutrition 0.000 description 1
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 235000012905 Brassica oleracea var viridis Nutrition 0.000 description 1
- 244000064816 Brassica oleracea var. acephala Species 0.000 description 1
- 244000308368 Brassica oleracea var. gemmifera Species 0.000 description 1
- 235000010149 Brassica rapa subsp chinensis Nutrition 0.000 description 1
- 235000000536 Brassica rapa subsp pekinensis Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 241000499436 Brassica rapa subsp. pekinensis Species 0.000 description 1
- 235000003343 Brassica rupestris Nutrition 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- NNGCJBLNKIXELR-WJOKGBTCSA-N CCCCCCCCCCCCCCCCCCCCCCCC(O[C@H](CO)COP([O-])(OCC[N+](C)(C)C)=O)=O Chemical compound CCCCCCCCCCCCCCCCCCCCCCCC(O[C@H](CO)COP([O-])(OCC[N+](C)(C)C)=O)=O NNGCJBLNKIXELR-WJOKGBTCSA-N 0.000 description 1
- 102100032912 CD44 antigen Human genes 0.000 description 1
- 238000010446 CRISPR interference Methods 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 101150017047 CSM3 gene Proteins 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- 101150078885 CSY3 gene Proteins 0.000 description 1
- 101100408682 Caenorhabditis elegans pmt-2 gene Proteins 0.000 description 1
- 235000010773 Cajanus indicus Nutrition 0.000 description 1
- 244000105627 Cajanus indicus Species 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 240000001548 Camellia japonica Species 0.000 description 1
- 241000208671 Campanulaceae Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 235000009467 Carica papaya Nutrition 0.000 description 1
- 240000006432 Carica papaya Species 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- WLYGSPLCNKYESI-RSUQVHIMSA-N Carthamin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1[C@@]1(O)C(O)=C(C(=O)\C=C\C=2C=CC(O)=CC=2)C(=O)C(\C=C\2C([C@](O)([C@H]3[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O)C(O)=C(C(=O)\C=C\C=3C=CC(O)=CC=3)C/2=O)=O)=C1O WLYGSPLCNKYESI-RSUQVHIMSA-N 0.000 description 1
- 241000208809 Carthamus Species 0.000 description 1
- 235000005747 Carum carvi Nutrition 0.000 description 1
- 240000000467 Carum carvi Species 0.000 description 1
- 241000723418 Carya Species 0.000 description 1
- 235000014036 Castanea Nutrition 0.000 description 1
- 241001070941 Castanea Species 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- 241000218645 Cedrus Species 0.000 description 1
- 241000208365 Celastraceae Species 0.000 description 1
- 108091092236 Chimeric RNA Proteins 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 101100148125 Chlamydomonas reinhardtii RSP2 gene Proteins 0.000 description 1
- 108700031407 Chloroplast Genes Proteins 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 244000189548 Chrysanthemum x morifolium Species 0.000 description 1
- 241000723346 Cinnamomum camphora Species 0.000 description 1
- 244000241235 Citrullus lanatus Species 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 235000008733 Citrus aurantifolia Nutrition 0.000 description 1
- 235000005979 Citrus limon Nutrition 0.000 description 1
- 244000175448 Citrus madurensis Species 0.000 description 1
- 244000131522 Citrus pyriformis Species 0.000 description 1
- 240000000560 Citrus x paradisi Species 0.000 description 1
- 235000008738 Clausena lansium Nutrition 0.000 description 1
- 244000089795 Clausena lansium Species 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 241000723370 Cocculus Species 0.000 description 1
- 241000357209 Cordia subcordata Species 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- 244000241257 Cucumis melo Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 235000009847 Cucumis melo var cantalupensis Nutrition 0.000 description 1
- 235000015001 Cucumis melo var inodorus Nutrition 0.000 description 1
- 235000010071 Cucumis prophetarum Nutrition 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 240000001980 Cucurbita pepo Species 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- 241000219130 Cucurbita pepo subsp. pepo Species 0.000 description 1
- 235000003954 Cucurbita pepo var melopepo Nutrition 0.000 description 1
- 241000218691 Cupressaceae Species 0.000 description 1
- 241000186690 Cupressales Species 0.000 description 1
- 241000196114 Cycadales Species 0.000 description 1
- 101710095468 Cyclase Proteins 0.000 description 1
- 241000587240 Cynanchum Species 0.000 description 1
- 244000019459 Cynara cardunculus Species 0.000 description 1
- 235000019106 Cynara scolymus Nutrition 0.000 description 1
- 241000234653 Cyperus Species 0.000 description 1
- 102100026846 Cytidine deaminase Human genes 0.000 description 1
- 108010031325 Cytidine deaminase Proteins 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 101150092880 DREB1A gene Proteins 0.000 description 1
- 101100285402 Danio rerio eng1a gene Proteins 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 235000009355 Dianthus caryophyllus Nutrition 0.000 description 1
- 240000006497 Dianthus caryophyllus Species 0.000 description 1
- 238000006117 Diels-Alder cycloaddition reaction Methods 0.000 description 1
- 240000001008 Dimocarpus longan Species 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 241000207977 Dipsacales Species 0.000 description 1
- 241000123589 Dipsacus Species 0.000 description 1
- AOJJSUZBOXZQNB-TZSSRYMLSA-N Doxorubicin Chemical compound O([C@H]1C[C@@](O)(CC=2C(O)=C3C(=O)C=4C=CC=C(C=4C(=O)C3=C(O)C=21)OC)C(=O)CO)[C@H]1C[C@H](N)[C@H](O)[C@H](C)O1 AOJJSUZBOXZQNB-TZSSRYMLSA-N 0.000 description 1
- 241001162696 Duguetia Species 0.000 description 1
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 1
- 101150068103 Ehd3 gene Proteins 0.000 description 1
- 241000512897 Elaeis Species 0.000 description 1
- 235000001942 Elaeis Nutrition 0.000 description 1
- 101100275895 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) csnB gene Proteins 0.000 description 1
- 101710121417 Envelope glycoprotein Proteins 0.000 description 1
- 241000218671 Ephedra Species 0.000 description 1
- 241000221785 Erysiphales Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101000999829 Escherichia coli (strain K12) NH(3)-dependent NAD(+) synthetase Proteins 0.000 description 1
- 101100007788 Escherichia coli (strain K12) casA gene Proteins 0.000 description 1
- 101100219622 Escherichia coli (strain K12) casC gene Proteins 0.000 description 1
- 101100537561 Escherichia coli tnsA gene Proteins 0.000 description 1
- 241000701533 Escherichia virus T4 Species 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 239000005977 Ethylene Substances 0.000 description 1
- 244000004281 Eucalyptus maculata Species 0.000 description 1
- 241000208688 Eucommia Species 0.000 description 1
- 241000195620 Euglena Species 0.000 description 1
- 241000208367 Euonymus Species 0.000 description 1
- 235000000235 Euphoria longan Nutrition 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241001247262 Fabales Species 0.000 description 1
- 241000219427 Fagales Species 0.000 description 1
- 235000010099 Fagus sylvatica Nutrition 0.000 description 1
- 240000000731 Fagus sylvatica Species 0.000 description 1
- 241000234642 Festuca Species 0.000 description 1
- 240000006927 Foeniculum vulgare Species 0.000 description 1
- 235000004204 Foeniculum vulgare Nutrition 0.000 description 1
- 235000017317 Fortunella Nutrition 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- 108091006027 G proteins Proteins 0.000 description 1
- 102000030782 GTP binding Human genes 0.000 description 1
- 108091000058 GTP-Binding Proteins 0.000 description 1
- 241000702463 Geminiviridae Species 0.000 description 1
- 241000208326 Gentianales Species 0.000 description 1
- 241000208152 Geranium Species 0.000 description 1
- 241000218790 Ginkgoales Species 0.000 description 1
- 229920001503 Glucan Polymers 0.000 description 1
- 102000003676 Glucocorticoid Receptors Human genes 0.000 description 1
- 108090000079 Glucocorticoid Receptors Proteins 0.000 description 1
- RUQCCAGSFPUGSZ-OBWQKADXSA-N Glucoraphanin Natural products C[S@](=O)CCCCC(=NS(=O)(=O)O)S[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RUQCCAGSFPUGSZ-OBWQKADXSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 239000005561 Glufosinate Substances 0.000 description 1
- 102000005720 Glutathione transferase Human genes 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- 241000218664 Gnetales Species 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 235000009438 Gossypium Nutrition 0.000 description 1
- 241000208690 Hamamelis Species 0.000 description 1
- 241000208680 Hamamelis mollis Species 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- 241000756137 Hemerocallis Species 0.000 description 1
- 208000037262 Hepatitis delta Diseases 0.000 description 1
- 241000724709 Hepatitis delta virus Species 0.000 description 1
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 1
- 244000043261 Hevea brasiliensis Species 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 101001054921 Homo sapiens Lymphatic vessel endothelial hyaluronic acid receptor 1 Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000589450 Homo sapiens Poly(ADP-ribose) glycohydrolase Proteins 0.000 description 1
- 108010070875 Human Immunodeficiency Virus tat Gene Products Proteins 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 206010020852 Hypertonia Diseases 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- IMQLKJBTEOYOSI-GPIVLXJGSA-N Inositol-hexakisphosphate Chemical compound OP(O)(=O)O[C@H]1[C@H](OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@@H]1OP(O)(O)=O IMQLKJBTEOYOSI-GPIVLXJGSA-N 0.000 description 1
- 102000008607 Integrin beta3 Human genes 0.000 description 1
- 108010020950 Integrin beta3 Proteins 0.000 description 1
- 229920001202 Inulin Polymers 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 241001501885 Isochrysis Species 0.000 description 1
- 241000483925 Jappa Species 0.000 description 1
- 241000758791 Juglandaceae Species 0.000 description 1
- 240000007049 Juglans regia Species 0.000 description 1
- 235000009496 Juglans regia Nutrition 0.000 description 1
- 241000721662 Juniperus Species 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- 102000007330 LDL Lipoproteins Human genes 0.000 description 1
- 108010007622 LDL Lipoproteins Proteins 0.000 description 1
- 241000208822 Lactuca Species 0.000 description 1
- 241001247355 Landolphia Species 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- 208000032004 Large-Cell Anaplastic Lymphoma Diseases 0.000 description 1
- 241000218652 Larix Species 0.000 description 1
- 235000005590 Larix decidua Nutrition 0.000 description 1
- 241000218194 Laurales Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 241001649245 Leitneria Species 0.000 description 1
- 240000004322 Lens culinaris Species 0.000 description 1
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 1
- 241000255777 Lepidoptera Species 0.000 description 1
- 240000007472 Leucaena leucocephala Species 0.000 description 1
- 235000010643 Leucaena leucocephala Nutrition 0.000 description 1
- 241000511731 Leymus Species 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 241000208202 Linaceae Species 0.000 description 1
- 241000208204 Linum Species 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- 239000000232 Lipid Bilayer Substances 0.000 description 1
- 241001490312 Lithops pseudotruncatella Species 0.000 description 1
- 241001071917 Lithospermum Species 0.000 description 1
- UPYKUZBSLRQECL-UKMVMLAPSA-N Lycopene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1C(=C)CCCC1(C)C)C=CC=C(/C)C=CC2C(=C)CCCC2(C)C UPYKUZBSLRQECL-UKMVMLAPSA-N 0.000 description 1
- 235000002262 Lycopersicon Nutrition 0.000 description 1
- JEVVKJMRZMXFBT-XWDZUXABSA-N Lycophyll Natural products OC/C(=C/CC/C(=C\C=C\C(=C/C=C/C(=C\C=C\C=C(/C=C/C=C(\C=C\C=C(/CC/C=C(/CO)\C)\C)/C)\C)/C)\C)/C)/C JEVVKJMRZMXFBT-XWDZUXABSA-N 0.000 description 1
- 102100026849 Lymphatic vessel endothelial hyaluronic acid receptor 1 Human genes 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102000043129 MHC class I family Human genes 0.000 description 1
- 108091054437 MHC class I family Proteins 0.000 description 1
- 241000218378 Magnolia Species 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 1
- 235000013939 Malva Nutrition 0.000 description 1
- 235000000060 Malva neglecta Nutrition 0.000 description 1
- 240000000982 Malva neglecta Species 0.000 description 1
- 241000134966 Malvales Species 0.000 description 1
- 235000014826 Mangifera indica Nutrition 0.000 description 1
- 240000007228 Mangifera indica Species 0.000 description 1
- 244000304222 Melaleuca cajuputi Species 0.000 description 1
- 235000001167 Melaleuca cajuputi Nutrition 0.000 description 1
- 235000017710 Melaleuca viridiflora Nutrition 0.000 description 1
- 235000014435 Mentha Nutrition 0.000 description 1
- 241001072983 Mentha Species 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108700027649 Mitogen-Activated Protein Kinase 3 Proteins 0.000 description 1
- 102100024192 Mitogen-activated protein kinase 3 Human genes 0.000 description 1
- 101100001347 Mus musculus Akt1s1 gene Proteins 0.000 description 1
- 101100078999 Mus musculus Mx1 gene Proteins 0.000 description 1
- 235000003805 Musa ABB Group Nutrition 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 201000004458 Myoma Diseases 0.000 description 1
- 235000009134 Myrica cerifera Nutrition 0.000 description 1
- 240000009023 Myrrhis odorata Species 0.000 description 1
- 235000007265 Myrrhis odorata Nutrition 0.000 description 1
- 101100387132 Myxococcus xanthus (strain DK1622) devT gene Proteins 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 241001494793 Nanovirus Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 108090000189 Neuropeptides Proteins 0.000 description 1
- 241001028048 Nicola Species 0.000 description 1
- 108010033272 Nitrilase Proteins 0.000 description 1
- 241000180701 Nitzschia <flatworm> Species 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 108010047956 Nucleosomes Proteins 0.000 description 1
- 241000209490 Nymphaea Species 0.000 description 1
- 235000016791 Nymphaea odorata subsp odorata Nutrition 0.000 description 1
- 241000514008 Oocystis Species 0.000 description 1
- 241000233855 Orchidaceae Species 0.000 description 1
- 241001529744 Origanum Species 0.000 description 1
- BPQQTUXANYXVAA-UHFFFAOYSA-N Orthosilicate Chemical compound [O-][Si]([O-])([O-])[O-] BPQQTUXANYXVAA-UHFFFAOYSA-N 0.000 description 1
- 241001184198 Orthosiphon Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001479578 Packera contermina Species 0.000 description 1
- 241000845082 Panama Species 0.000 description 1
- 240000004371 Panax ginseng Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 102000016387 Pancreatic elastase Human genes 0.000 description 1
- 108010067372 Pancreatic elastase Proteins 0.000 description 1
- 244000237247 Pandanus dubius Species 0.000 description 1
- 241001495454 Parthenium Species 0.000 description 1
- AVFIYMSJDDGDBQ-UHFFFAOYSA-N Parthenium Chemical compound C1C=C(CCC(C)=O)C(C)CC2OC(=O)C(=C)C21 AVFIYMSJDDGDBQ-UHFFFAOYSA-N 0.000 description 1
- 241001495453 Parthenium argentatum Species 0.000 description 1
- 241000206766 Pavlova Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000209046 Pennisetum Species 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 208000005228 Pericardial Effusion Diseases 0.000 description 1
- 102000001406 Perilipin Human genes 0.000 description 1
- 108060006002 Perilipin Proteins 0.000 description 1
- 241000218196 Persea Species 0.000 description 1
- 241000042032 Petrocephalus catostoma Species 0.000 description 1
- 244000062780 Petroselinum sativum Species 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 241000222395 Phlebia Species 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 102000009097 Phosphorylases Human genes 0.000 description 1
- 108010073135 Phosphorylases Proteins 0.000 description 1
- 206010034972 Photosensitivity reaction Diseases 0.000 description 1
- 241001130943 Phyllanthus <Aves> Species 0.000 description 1
- IMQLKJBTEOYOSI-UHFFFAOYSA-N Phytic acid Natural products OP(O)(=O)OC1C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C1OP(O)(O)=O IMQLKJBTEOYOSI-UHFFFAOYSA-N 0.000 description 1
- 235000012550 Pimpinella anisum Nutrition 0.000 description 1
- 241000722363 Piper Species 0.000 description 1
- 235000016761 Piper aduncum Nutrition 0.000 description 1
- 240000003889 Piper guineense Species 0.000 description 1
- 235000017804 Piper guineense Nutrition 0.000 description 1
- 235000008184 Piper nigrum Nutrition 0.000 description 1
- 241000758713 Piperales Species 0.000 description 1
- 235000003445 Pistacia Nutrition 0.000 description 1
- 241000543704 Pistacia Species 0.000 description 1
- 240000006711 Pistacia vera Species 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 108700001094 Plant Genes Proteins 0.000 description 1
- 108010064851 Plant Proteins Proteins 0.000 description 1
- 235000015266 Plantago major Nutrition 0.000 description 1
- 241000139306 Platt Species 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 241000500034 Podostemaceae Species 0.000 description 1
- 102100032347 Poly(ADP-ribose) glycohydrolase Human genes 0.000 description 1
- 241000219000 Populus Species 0.000 description 1
- 241000206609 Porphyra Species 0.000 description 1
- 241000206607 Porphyra umbilicalis Species 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- CWEZAWNPTYBADX-UHFFFAOYSA-N Procyanidin Natural products OC1C(OC2C(O)C(Oc3c2c(O)cc(O)c3C4C(O)C(Oc5cc(O)cc(O)c45)c6ccc(O)c(O)c6)c7ccc(O)c(O)c7)c8c(O)cc(O)cc8OC1c9ccc(O)c(O)c9 CWEZAWNPTYBADX-UHFFFAOYSA-N 0.000 description 1
- 241000617410 Proteales Species 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 102000002067 Protein Subunits Human genes 0.000 description 1
- 241000588769 Proteus <enterobacteria> Species 0.000 description 1
- 235000011432 Prunus Nutrition 0.000 description 1
- 241000220299 Prunus Species 0.000 description 1
- 235000009827 Prunus armeniaca Nutrition 0.000 description 1
- 244000018633 Prunus armeniaca Species 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 241000192511 Pseudanabaena Species 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 244000294611 Punica granatum Species 0.000 description 1
- 235000014360 Punica granatum Nutrition 0.000 description 1
- 241000219492 Quercus Species 0.000 description 1
- 235000016976 Quercus macrolepis Nutrition 0.000 description 1
- 208000009341 RNA Virus Infections Diseases 0.000 description 1
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 241000218206 Ranunculus Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 241000242739 Renilla Species 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 1
- 241000245165 Rhododendron ponticum Species 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 235000003846 Ricinus Nutrition 0.000 description 1
- 241000322381 Ricinus <louse> Species 0.000 description 1
- 235000004443 Ricinus communis Nutrition 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- KHPCPRHQVVSZAH-HUOMCSJISA-N Rosin Natural products O(C/C=C/c1ccccc1)[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 KHPCPRHQVVSZAH-HUOMCSJISA-N 0.000 description 1
- 235000017848 Rubus fruticosus Nutrition 0.000 description 1
- 240000007651 Rubus glaucus Species 0.000 description 1
- 235000011034 Rubus glaucus Nutrition 0.000 description 1
- 235000009122 Rubus idaeus Nutrition 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 1
- 241000124033 Salix Species 0.000 description 1
- 241001180876 Saposhnikovia Species 0.000 description 1
- 241000233667 Saprolegnia Species 0.000 description 1
- 241000208437 Sarraceniaceae Species 0.000 description 1
- 241000233671 Schizochytrium Species 0.000 description 1
- 101100222745 Schizosaccharomyces pombe (strain 972 / ATCC 24843) met17 gene Proteins 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 241000780602 Senecio Species 0.000 description 1
- 241000270295 Serpentes Species 0.000 description 1
- 241000863432 Shewanella putrefaciens Species 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241001643412 Sinomenium Species 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 244000061457 Solanum nigrum Species 0.000 description 1
- 108010073771 Soybean Proteins Proteins 0.000 description 1
- 241000251131 Sphyrna Species 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 229930182558 Sterol Natural products 0.000 description 1
- 241001505901 Streptococcus sp. 'group A' Species 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 229940100389 Sulfonylurea Drugs 0.000 description 1
- 241000192584 Synechocystis Species 0.000 description 1
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 1
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 1
- 241001116500 Taxus Species 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 241000270666 Testudines Species 0.000 description 1
- 241001122767 Theaceae Species 0.000 description 1
- 240000006474 Theobroma bicolor Species 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 101100059152 Thermococcus onnurineus (strain NA1) csm1 gene Proteins 0.000 description 1
- 101100168692 Thermoproteus tenax (strain ATCC 35583 / DSM 2078 / JCM 9277 / NBRC 100435 / Kra 1) cas3' gene Proteins 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 240000006909 Tilia x europaea Species 0.000 description 1
- 235000011941 Tilia x europaea Nutrition 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 241000948318 Tobacco leaf curl virus Species 0.000 description 1
- 241000723873 Tobacco mosaic virus Species 0.000 description 1
- 241000702295 Tomato golden mosaic virus Species 0.000 description 1
- 241001135990 Tomato leaf curl virus Species 0.000 description 1
- 241000283907 Tragelaphus oryx Species 0.000 description 1
- 108090000340 Transaminases Proteins 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- 102100035100 Transcription factor p65 Human genes 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 241001506047 Tremella Species 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 244000042182 Trichotosia fusca Species 0.000 description 1
- 235000019714 Triticale Nutrition 0.000 description 1
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 description 1
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 description 1
- 241001106462 Ulmus Species 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 244000274883 Urtica dioica Species 0.000 description 1
- 235000009108 Urtica dioica Nutrition 0.000 description 1
- 235000003095 Vaccinium corymbosum Nutrition 0.000 description 1
- 235000017537 Vaccinium myrtillus Nutrition 0.000 description 1
- 241000711975 Vesicular stomatitis virus Species 0.000 description 1
- 241000256856 Vespidae Species 0.000 description 1
- 235000010749 Vicia faba Nutrition 0.000 description 1
- 240000006677 Vicia faba Species 0.000 description 1
- 235000002098 Vicia faba var. major Nutrition 0.000 description 1
- 240000004922 Vigna radiata Species 0.000 description 1
- 235000010721 Vigna radiata var radiata Nutrition 0.000 description 1
- 235000011469 Vigna radiata var sublobata Nutrition 0.000 description 1
- 235000010726 Vigna sinensis Nutrition 0.000 description 1
- 241000405217 Viola <butterfly> Species 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 241000702302 Wheat dwarf virus Species 0.000 description 1
- 101100166799 Xenopus laevis tnrc4-a gene Proteins 0.000 description 1
- JKQXZKUSFCKOGQ-LQFQNGICSA-N Z-zeaxanthin Natural products C([C@H](O)CC=1C)C(C)(C)C=1C=CC(C)=CC=CC(C)=CC=CC=C(C)C=CC=C(C)C=CC1=C(C)C[C@@H](O)CC1(C)C JKQXZKUSFCKOGQ-LQFQNGICSA-N 0.000 description 1
- 241000482268 Zea mays subsp. mays Species 0.000 description 1
- QOPRSMDTRDMBNK-RNUUUQFGSA-N Zeaxanthin Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCC(O)C1(C)C)C=CC=C(/C)C=CC2=C(C)CC(O)CC2(C)C QOPRSMDTRDMBNK-RNUUUQFGSA-N 0.000 description 1
- 241000934915 Zygophyllum Species 0.000 description 1
- GMMLNKINDDUDCF-JRWRFYLSSA-N [(2s,3r,4s,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl] (1e)-5-[(r)-methylsulfinyl]-n-sulfooxypentanimidothioate Chemical compound C[S@@](=O)CCCC\C(=N/OS(O)(=O)=O)S[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O GMMLNKINDDUDCF-JRWRFYLSSA-N 0.000 description 1
- WFSDDWRJSJUWTI-WRBBJXAJSA-N [(Z)-octadec-9-enyl] 3-(dimethylamino)-2-[(Z)-octadec-9-enoxy]propanoate Chemical compound C(CCCCCCC\C=C/CCCCCCCC)OC(C(CN(C)C)OCCCCCCCC\C=C/CCCCCCCC)=O WFSDDWRJSJUWTI-WRBBJXAJSA-N 0.000 description 1
- HCAJCMUKLZSPFT-KWXKLSQISA-N [3-(dimethylamino)-2-[(9z,12z)-octadeca-9,12-dienoyl]oxypropyl] (9z,12z)-octadeca-9,12-dienoate Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(=O)OCC(CN(C)C)OC(=O)CCCCCCC\C=C/C\C=C/CCCCC HCAJCMUKLZSPFT-KWXKLSQISA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000033289 adaptive immune response Effects 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 244000193174 agave Species 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- OENHQHLEOONYIE-UKMVMLAPSA-N all-trans beta-carotene Natural products CC=1CCCC(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C OENHQHLEOONYIE-UKMVMLAPSA-N 0.000 description 1
- JKQXZKUSFCKOGQ-LOFNIBRQSA-N all-trans-Zeaxanthin Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2=C(C)CC(O)CC2(C)C JKQXZKUSFCKOGQ-LOFNIBRQSA-N 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- JGMPRNFEEAJLAJ-UHFFFAOYSA-N allyl methyl trisulphide Natural products CSSSCC=C JGMPRNFEEAJLAJ-UHFFFAOYSA-N 0.000 description 1
- 102000009899 alpha Karyopherins Human genes 0.000 description 1
- 108010077099 alpha Karyopherins Proteins 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 1
- 239000011795 alpha-carotene Substances 0.000 description 1
- 235000003903 alpha-carotene Nutrition 0.000 description 1
- ANVAOWXLWRTKGA-HLLMEWEMSA-N alpha-carotene Natural products C(=C\C=C\C=C(/C=C/C=C(\C=C\C=1C(C)(C)CCCC=1C)/C)\C)(\C=C\C=C(/C=C/[C@H]1C(C)=CCCC1(C)C)\C)/C ANVAOWXLWRTKGA-HLLMEWEMSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 239000004178 amaranth Substances 0.000 description 1
- 235000012735 amaranth Nutrition 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 150000001409 amidines Chemical class 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000003392 amylase inhibitor Substances 0.000 description 1
- 102000001307 androgen receptors Human genes 0.000 description 1
- 108010080146 androgen receptors Proteins 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 235000004458 antinutrient Nutrition 0.000 description 1
- 239000003816 antisense DNA Substances 0.000 description 1
- 210000001742 aqueous humor Anatomy 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- BBFQZRXNYIEMAW-UHFFFAOYSA-N aristolochic acid I Chemical compound C1=C([N+]([O-])=O)C2=C(C(O)=O)C=C3OCOC3=C2C2=C1C(OC)=CC=C2 BBFQZRXNYIEMAW-UHFFFAOYSA-N 0.000 description 1
- 101150037081 aroA gene Proteins 0.000 description 1
- 235000016520 artichoke thistle Nutrition 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 210000003567 ascitic fluid Anatomy 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 244000237250 bengkuang Species 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 239000011648 beta-carotene Substances 0.000 description 1
- 235000013734 beta-carotene Nutrition 0.000 description 1
- TUPZEYHYWIEDIH-WAIFQNFQSA-N beta-carotene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCCC1(C)C)C=CC=C(/C)C=CC2=CCCCC2(C)C TUPZEYHYWIEDIH-WAIFQNFQSA-N 0.000 description 1
- WHGYBXFWUBPSRW-FOUAGVGXSA-N beta-cyclodextrin Chemical compound OC[C@H]([C@H]([C@@H]([C@H]1O)O)O[C@H]2O[C@@H]([C@@H](O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O[C@H]3O[C@H](CO)[C@H]([C@@H]([C@H]3O)O)O3)[C@H](O)[C@H]2O)CO)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H]3O[C@@H]1CO WHGYBXFWUBPSRW-FOUAGVGXSA-N 0.000 description 1
- 229960002747 betacarotene Drugs 0.000 description 1
- 210000000941 bile Anatomy 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000004790 biotic stress Effects 0.000 description 1
- QKSKPIVNLNLAAV-UHFFFAOYSA-N bis(2-chloroethyl) sulfide Chemical compound ClCCSCCCl QKSKPIVNLNLAAV-UHFFFAOYSA-N 0.000 description 1
- 235000021029 blackberry Nutrition 0.000 description 1
- 235000021014 blueberries Nutrition 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 235000004883 caffeic acid Nutrition 0.000 description 1
- 229940074360 caffeic acid Drugs 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 229960000846 camphor Drugs 0.000 description 1
- 229930008380 camphor Natural products 0.000 description 1
- 230000000711 cancerogenic effect Effects 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 235000013877 carbamide Nutrition 0.000 description 1
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 1
- 239000002041 carbon nanotube Substances 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 231100000357 carcinogen Toxicity 0.000 description 1
- 239000003183 carcinogenic agent Substances 0.000 description 1
- 101150090505 cas10 gene Proteins 0.000 description 1
- 101150059443 cas12a gene Proteins 0.000 description 1
- 101150098304 cas13a gene Proteins 0.000 description 1
- 101150111685 cas4 gene Proteins 0.000 description 1
- 101150058420 cas6a gene Proteins 0.000 description 1
- 101150103318 cas8a2 gene Proteins 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 150000001765 catechin Chemical class 0.000 description 1
- ADRVNXBAWSRFAJ-UHFFFAOYSA-N catechin Natural products OC1Cc2cc(O)cc(O)c2OC1c3ccc(O)c(O)c3 ADRVNXBAWSRFAJ-UHFFFAOYSA-N 0.000 description 1
- 235000005487 catechin Nutrition 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 210000003756 cervix mucus Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 230000011088 chloroplast localization Effects 0.000 description 1
- 108010031100 chloroplast transit peptides Proteins 0.000 description 1
- 210000001268 chyle Anatomy 0.000 description 1
- 229920003211 cis-1,4-polyisoprene Polymers 0.000 description 1
- QAIPRVGONGVQAS-UHFFFAOYSA-N cis-caffeic acid Natural products OC(=O)C=CC1=CC=C(O)C(O)=C1 QAIPRVGONGVQAS-UHFFFAOYSA-N 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 101150100788 cmr3 gene Proteins 0.000 description 1
- 101150040342 cmr4 gene Proteins 0.000 description 1
- 101150095330 cmr5 gene Proteins 0.000 description 1
- 101150034961 cmr6 gene Proteins 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- VJKUPQSHOVKBCO-RYVYVXLVSA-N cocculus solid Chemical compound O([C@@H]1C[C@]2(O)[C@@]34C)C14C(=O)O[C@@H]3[C@@H]1[C@H](C(=C)C)[C@H]2C(=O)O1.O([C@@H]1C[C@]2(O)[C@@]34C)C14C(=O)O[C@@H]3[C@@H]1[C@H](C(C)(O)C)[C@H]2C(=O)O1 VJKUPQSHOVKBCO-RYVYVXLVSA-N 0.000 description 1
- 235000018597 common camellia Nutrition 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 229940108924 conjugated linoleic acid Drugs 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 239000011258 core-shell material Substances 0.000 description 1
- 238000009402 cross-breeding Methods 0.000 description 1
- 101150089829 csc-1 gene Proteins 0.000 description 1
- 101150088639 csm4 gene Proteins 0.000 description 1
- 101150022488 csm5 gene Proteins 0.000 description 1
- 101150064365 csm6 gene Proteins 0.000 description 1
- 101150056210 csx1 gene Proteins 0.000 description 1
- 101150088252 csy1 gene Proteins 0.000 description 1
- 101150016576 csy2 gene Proteins 0.000 description 1
- UHDGCWIWMRVCDJ-XVFCMESISA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-XVFCMESISA-N 0.000 description 1
- 210000004292 cytoskeleton Anatomy 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 229940124447 delivery agent Drugs 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 229940119679 deoxyribonucleases Drugs 0.000 description 1
- FCRACOPGPMPSHN-UHFFFAOYSA-N desoxyabscisic acid Natural products OC(=O)C=C(C)C=CC1C(C)=CC(=O)CC1(C)C FCRACOPGPMPSHN-UHFFFAOYSA-N 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000001784 detoxification Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 150000001993 dienes Chemical class 0.000 description 1
- 235000013325 dietary fiber Nutrition 0.000 description 1
- 235000019621 digestibility Nutrition 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 150000002019 disulfides Chemical class 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 229960004679 doxorubicin Drugs 0.000 description 1
- 230000024346 drought recovery Effects 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 244000013123 dwarf bean Species 0.000 description 1
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 229920001971 elastomer Polymers 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000002121 endocytic effect Effects 0.000 description 1
- 210000003060 endolymph Anatomy 0.000 description 1
- 210000001163 endosome Anatomy 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- DEDGUGJNLNLJSR-UHFFFAOYSA-N enol-phenylpyruvic acid Chemical class OC(=O)C(O)=CC1=CC=CC=C1 DEDGUGJNLNLJSR-UHFFFAOYSA-N 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 239000002532 enzyme inhibitor Substances 0.000 description 1
- LPTRNLNOHUVQMS-UHFFFAOYSA-N epicatechin Natural products Cc1cc(O)cc2OC(C(O)Cc12)c1ccc(O)c(O)c1 LPTRNLNOHUVQMS-UHFFFAOYSA-N 0.000 description 1
- 235000012734 epicatechin Nutrition 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 108020004067 estrogen-related receptors Proteins 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- 108091054761 ethylene receptor family Proteins 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 210000000416 exudates and transudate Anatomy 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- KSEBMYQBYZTDHS-HWKANZROSA-N ferulic acid Chemical compound COC1=CC(\C=C\C(O)=O)=CC=C1O KSEBMYQBYZTDHS-HWKANZROSA-N 0.000 description 1
- 235000001785 ferulic acid Nutrition 0.000 description 1
- 229940114124 ferulic acid Drugs 0.000 description 1
- KSEBMYQBYZTDHS-UHFFFAOYSA-N ferulic acid Natural products COC1=CC(C=CC(O)=O)=CC=C1O KSEBMYQBYZTDHS-UHFFFAOYSA-N 0.000 description 1
- 229930003935 flavonoid Natural products 0.000 description 1
- 235000017173 flavonoids Nutrition 0.000 description 1
- 150000002215 flavonoids Chemical class 0.000 description 1
- HVQAJTFOCKOKIN-UHFFFAOYSA-N flavonol Natural products O1C2=CC=CC=C2C(=O)C(O)=C1C1=CC=CC=C1 HVQAJTFOCKOKIN-UHFFFAOYSA-N 0.000 description 1
- 150000002216 flavonol derivatives Chemical class 0.000 description 1
- 235000011957 flavonols Nutrition 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 235000012041 food component Nutrition 0.000 description 1
- 239000005417 food ingredient Substances 0.000 description 1
- 239000004459 forage Substances 0.000 description 1
- 230000004345 fruit ripening Effects 0.000 description 1
- 235000012055 fruits and vegetables Nutrition 0.000 description 1
- 235000013376 functional food Nutrition 0.000 description 1
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 1
- VZCCETWTMQHEPK-QNEBEIHSSA-N gamma-linolenic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/CCCCC(O)=O VZCCETWTMQHEPK-QNEBEIHSSA-N 0.000 description 1
- 210000004211 gastric acid Anatomy 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 238000010448 genetic screening Methods 0.000 description 1
- 230000037442 genomic alteration Effects 0.000 description 1
- IXORZMNAPKEEDV-OBDJNFEBSA-N gibberellin A3 Chemical compound C([C@@]1(O)C(=C)C[C@@]2(C1)[C@H]1C(O)=O)C[C@H]2[C@]2(C=C[C@@H]3O)[C@H]1[C@]3(C)C(=O)O2 IXORZMNAPKEEDV-OBDJNFEBSA-N 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000002414 glycolytic effect Effects 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 235000021331 green beans Nutrition 0.000 description 1
- 235000021384 green leafy vegetables Nutrition 0.000 description 1
- 125000001188 haloalkyl group Chemical group 0.000 description 1
- 210000005003 heart tissue Anatomy 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 210000005161 hepatic lobe Anatomy 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 244000000020 host-specific pathogen Species 0.000 description 1
- 235000020256 human milk Nutrition 0.000 description 1
- 210000004251 human milk Anatomy 0.000 description 1
- 229940042795 hydrazides for tuberculosis treatment Drugs 0.000 description 1
- BRWIZMBXBAOCCF-UHFFFAOYSA-N hydrazinecarbothioamide Chemical compound NNC(N)=S BRWIZMBXBAOCCF-UHFFFAOYSA-N 0.000 description 1
- 150000007857 hydrazones Chemical class 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 150000002466 imines Chemical class 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000008105 immune reaction Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000000530 impalefection Methods 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 150000002475 indoles Chemical class 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 108700032552 influenza virus INS1 Proteins 0.000 description 1
- 230000004941 influx Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000009878 intermolecular interaction Effects 0.000 description 1
- JYJIGFIDKWBXDU-MNNPPOADSA-N inulin Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)OC[C@]1(OC[C@]2(OC[C@]3(OC[C@]4(OC[C@]5(OC[C@]6(OC[C@]7(OC[C@]8(OC[C@]9(OC[C@]%10(OC[C@]%11(OC[C@]%12(OC[C@]%13(OC[C@]%14(OC[C@]%15(OC[C@]%16(OC[C@]%17(OC[C@]%18(OC[C@]%19(OC[C@]%20(OC[C@]%21(OC[C@]%22(OC[C@]%23(OC[C@]%24(OC[C@]%25(OC[C@]%26(OC[C@]%27(OC[C@]%28(OC[C@]%29(OC[C@]%30(OC[C@]%31(OC[C@]%32(OC[C@]%33(OC[C@]%34(OC[C@]%35(OC[C@]%36(O[C@@H]%37[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O%37)O)[C@H]([C@H](O)[C@@H](CO)O%36)O)[C@H]([C@H](O)[C@@H](CO)O%35)O)[C@H]([C@H](O)[C@@H](CO)O%34)O)[C@H]([C@H](O)[C@@H](CO)O%33)O)[C@H]([C@H](O)[C@@H](CO)O%32)O)[C@H]([C@H](O)[C@@H](CO)O%31)O)[C@H]([C@H](O)[C@@H](CO)O%30)O)[C@H]([C@H](O)[C@@H](CO)O%29)O)[C@H]([C@H](O)[C@@H](CO)O%28)O)[C@H]([C@H](O)[C@@H](CO)O%27)O)[C@H]([C@H](O)[C@@H](CO)O%26)O)[C@H]([C@H](O)[C@@H](CO)O%25)O)[C@H]([C@H](O)[C@@H](CO)O%24)O)[C@H]([C@H](O)[C@@H](CO)O%23)O)[C@H]([C@H](O)[C@@H](CO)O%22)O)[C@H]([C@H](O)[C@@H](CO)O%21)O)[C@H]([C@H](O)[C@@H](CO)O%20)O)[C@H]([C@H](O)[C@@H](CO)O%19)O)[C@H]([C@H](O)[C@@H](CO)O%18)O)[C@H]([C@H](O)[C@@H](CO)O%17)O)[C@H]([C@H](O)[C@@H](CO)O%16)O)[C@H]([C@H](O)[C@@H](CO)O%15)O)[C@H]([C@H](O)[C@@H](CO)O%14)O)[C@H]([C@H](O)[C@@H](CO)O%13)O)[C@H]([C@H](O)[C@@H](CO)O%12)O)[C@H]([C@H](O)[C@@H](CO)O%11)O)[C@H]([C@H](O)[C@@H](CO)O%10)O)[C@H]([C@H](O)[C@@H](CO)O9)O)[C@H]([C@H](O)[C@@H](CO)O8)O)[C@H]([C@H](O)[C@@H](CO)O7)O)[C@H]([C@H](O)[C@@H](CO)O6)O)[C@H]([C@H](O)[C@@H](CO)O5)O)[C@H]([C@H](O)[C@@H](CO)O4)O)[C@H]([C@H](O)[C@@H](CO)O3)O)[C@H]([C@H](O)[C@@H](CO)O2)O)[C@@H](O)[C@H](O)[C@@H](CO)O1 JYJIGFIDKWBXDU-MNNPPOADSA-N 0.000 description 1
- 229940029339 inulin Drugs 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- CJWQYWQDLBZGPD-UHFFFAOYSA-N isoflavone Natural products C1=C(OC)C(OC)=CC(OC)=C1C1=COC2=C(C=CC(C)(C)O3)C3=C(OC)C=C2C1=O CJWQYWQDLBZGPD-UHFFFAOYSA-N 0.000 description 1
- 150000002515 isoflavone derivatives Chemical class 0.000 description 1
- 235000008696 isoflavones Nutrition 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 150000002540 isothiocyanates Chemical class 0.000 description 1
- 229930014550 juvenile hormone Natural products 0.000 description 1
- 239000002949 juvenile hormone Substances 0.000 description 1
- 150000003633 juvenile hormone derivatives Chemical class 0.000 description 1
- 210000002510 keratinocyte Anatomy 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- WABPQHHGFIMREM-UHFFFAOYSA-N lead(0) Chemical compound [Pb] WABPQHHGFIMREM-UHFFFAOYSA-N 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- AIHDCSAXVMAMJH-GFBKWZILSA-N levan Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)OC[C@@H]1[C@@H](O)[C@H](O)[C@](CO)(CO[C@@H]2[C@H]([C@H](O)[C@@](O)(CO)O2)O)O1 AIHDCSAXVMAMJH-GFBKWZILSA-N 0.000 description 1
- 108020001756 ligand binding domains Proteins 0.000 description 1
- 229930013686 lignan Natural products 0.000 description 1
- 235000009408 lignans Nutrition 0.000 description 1
- 150000005692 lignans Chemical class 0.000 description 1
- 239000004571 lime Substances 0.000 description 1
- OYHQOLUKZRVURQ-IXWMQOLASA-N linoleic acid Natural products CCCCC\C=C/C\C=C\CCCCCCCC(O)=O OYHQOLUKZRVURQ-IXWMQOLASA-N 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 230000002366 lipolytic effect Effects 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000004777 loss-of-function mutation Effects 0.000 description 1
- 235000012680 lutein Nutrition 0.000 description 1
- 239000001656 lutein Substances 0.000 description 1
- 229960005375 lutein Drugs 0.000 description 1
- KBPHJBAIARWVSC-RGZFRNHPSA-N lutein Chemical compound C([C@H](O)CC=1C)C(C)(C)C=1\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\[C@H]1C(C)=C[C@H](O)CC1(C)C KBPHJBAIARWVSC-RGZFRNHPSA-N 0.000 description 1
- ORAKUVXRZWMARG-WZLJTJAWSA-N lutein Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCCC1(C)C)C=CC=C(/C)C=CC2C(=CC(O)CC2(C)C)C ORAKUVXRZWMARG-WZLJTJAWSA-N 0.000 description 1
- 235000012661 lycopene Nutrition 0.000 description 1
- 239000001751 lycopene Substances 0.000 description 1
- 229960004999 lycopene Drugs 0.000 description 1
- OAIJSZIZWZSQBC-GYZMGTAESA-N lycopene Chemical compound CC(C)=CCC\C(C)=C\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C=C(/C)CCC=C(C)C OAIJSZIZWZSQBC-GYZMGTAESA-N 0.000 description 1
- 210000004880 lymph fluid Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 235000018977 lysine Nutrition 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 210000005171 mammalian brain Anatomy 0.000 description 1
- 235000005739 manihot Nutrition 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000008384 membrane barrier Effects 0.000 description 1
- 210000004779 membrane envelope Anatomy 0.000 description 1
- 230000034217 membrane fusion Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 230000000394 mitotic effect Effects 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 235000010460 mustard Nutrition 0.000 description 1
- 229950006238 nadide Drugs 0.000 description 1
- 229940042880 natural phospholipid Drugs 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 1
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 229960003512 nicotinic acid Drugs 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- PVNIIMVLHYAWGP-UHFFFAOYSA-N nicotinic acid Natural products OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 1
- OGCWVIVNTBZPBW-BHRXDNSCSA-N nicotinic acid mononucleotide Chemical compound O1[C@H](COP(O)([O-])=O)[C@@H](O)[C@@H](O)[C@@H]1[N+]1=CC=CC(C(O)=O)C1 OGCWVIVNTBZPBW-BHRXDNSCSA-N 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 244000309711 non-enveloped viruses Species 0.000 description 1
- 229910052755 nonmetal Inorganic materials 0.000 description 1
- 150000002843 nonmetals Chemical class 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 102000006255 nuclear receptors Human genes 0.000 description 1
- 108020004017 nuclear receptors Proteins 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 108091008104 nucleic acid aptamers Proteins 0.000 description 1
- 210000001623 nucleosome Anatomy 0.000 description 1
- 235000014571 nuts Nutrition 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 235000020660 omega-3 fatty acid Nutrition 0.000 description 1
- 229940012843 omega-3 fatty acid Drugs 0.000 description 1
- 239000006014 omega-3 oil Substances 0.000 description 1
- 210000003250 oocyst Anatomy 0.000 description 1
- 239000005416 organic matter Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 150000002905 orthoesters Chemical class 0.000 description 1
- 230000000399 orthopedic effect Effects 0.000 description 1
- 238000009401 outcrossing Methods 0.000 description 1
- 150000002923 oximes Chemical class 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 210000004738 parenchymal cell Anatomy 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000004963 pathophysiological condition Effects 0.000 description 1
- 235000012162 pavlova Nutrition 0.000 description 1
- 239000003415 peat Substances 0.000 description 1
- 230000037368 penetrate the skin Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 235000011197 perejil Nutrition 0.000 description 1
- 210000004912 pericardial fluid Anatomy 0.000 description 1
- 210000004049 perilymph Anatomy 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 150000002989 phenols Chemical class 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 229950004354 phosphorylcholine Drugs 0.000 description 1
- 230000002186 photoactivation Effects 0.000 description 1
- 244000059219 photoautotrophic organism Species 0.000 description 1
- 230000029553 photosynthesis Effects 0.000 description 1
- 238000010672 photosynthesis Methods 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 208000007578 phototoxic dermatitis Diseases 0.000 description 1
- 231100000018 phototoxicity Toxicity 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 238000000554 physical therapy Methods 0.000 description 1
- 229940068041 phytic acid Drugs 0.000 description 1
- 235000002949 phytic acid Nutrition 0.000 description 1
- 239000000467 phytic acid Substances 0.000 description 1
- 239000003075 phytoestrogen Substances 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 230000008884 pinocytosis Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 108010011110 polyarginine Proteins 0.000 description 1
- 229920000157 polyfructose Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 229920002414 procyanidin Polymers 0.000 description 1
- 102000003998 progesterone receptors Human genes 0.000 description 1
- 108090000468 progesterone receptors Proteins 0.000 description 1
- WGYKZJWCGVVSQN-UHFFFAOYSA-N propylamine Chemical compound CCCN WGYKZJWCGVVSQN-UHFFFAOYSA-N 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 1
- 235000014774 prunus Nutrition 0.000 description 1
- 101150075980 psbA gene Proteins 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 210000004915 pus Anatomy 0.000 description 1
- 108700022487 rRNA Genes Proteins 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 108090000064 retinoic acid receptors Proteins 0.000 description 1
- 102000003702 retinoic acid receptors Human genes 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical group [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 238000006798 ring closing metathesis reaction Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 229930182490 saponin Natural products 0.000 description 1
- 235000017709 saponins Nutrition 0.000 description 1
- 150000007949 saponins Chemical class 0.000 description 1
- 210000002374 sebum Anatomy 0.000 description 1
- 229930000044 secondary metabolite Natural products 0.000 description 1
- 238000001338 self-assembly Methods 0.000 description 1
- 230000010153 self-pollination Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- DUIOPKIIICUYRZ-UHFFFAOYSA-N semicarbazide Chemical compound NNC(N)=O DUIOPKIIICUYRZ-UHFFFAOYSA-N 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 229940001941 soy protein Drugs 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 125000004079 stearyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 150000003432 sterols Chemical class 0.000 description 1
- 235000003702 sterols Nutrition 0.000 description 1
- 235000021286 stilbenes Nutrition 0.000 description 1
- 150000001629 stilbenes Chemical class 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 1
- 229940124530 sulfonamide Drugs 0.000 description 1
- 150000003456 sulfonamides Chemical class 0.000 description 1
- 150000003871 sulfonates Chemical class 0.000 description 1
- 150000003457 sulfones Chemical class 0.000 description 1
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 description 1
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 1
- 150000003462 sulfoxides Chemical class 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000007474 system interaction Effects 0.000 description 1
- 238000010809 targeting technique Methods 0.000 description 1
- 235000013616 tea Nutrition 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 150000007970 thio esters Chemical class 0.000 description 1
- 150000003585 thioureas Chemical class 0.000 description 1
- 102000004217 thyroid hormone receptors Human genes 0.000 description 1
- 108090000721 thyroid hormone receptors Proteins 0.000 description 1
- 229910052719 titanium Inorganic materials 0.000 description 1
- 239000010936 titanium Substances 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- KHPCPRHQVVSZAH-UHFFFAOYSA-N trans-cinnamyl beta-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OCC=CC1=CC=CC=C1 KHPCPRHQVVSZAH-UHFFFAOYSA-N 0.000 description 1
- QURCVMIEKCOAJU-UHFFFAOYSA-N trans-isoferulic acid Natural products COC1=CC=C(C=CC(O)=O)C=C1O QURCVMIEKCOAJU-UHFFFAOYSA-N 0.000 description 1
- ZCIHMQAPACOQHT-ZGMPDRQDSA-N trans-isorenieratene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/c1c(C)ccc(C)c1C)C=CC=C(/C)C=Cc2c(C)ccc(C)c2C ZCIHMQAPACOQHT-ZGMPDRQDSA-N 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 238000011830 transgenic mouse model Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- PBKWZFANFUTEPS-CWUSWOHSSA-N transportan Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(N)=O)[C@@H](C)CC)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)CN)[C@@H](C)O)C1=CC=C(O)C=C1 PBKWZFANFUTEPS-CWUSWOHSSA-N 0.000 description 1
- 108010062760 transportan Proteins 0.000 description 1
- QQOWHRYOXYEMTL-UHFFFAOYSA-N triazin-4-amine Chemical class N=C1C=CN=NN1 QQOWHRYOXYEMTL-UHFFFAOYSA-N 0.000 description 1
- 150000003918 triazines Chemical class 0.000 description 1
- 150000003852 triazoles Chemical class 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- ZIBGPFATKBEMQZ-UHFFFAOYSA-N triethylene glycol Chemical compound OCCOCCOCCO ZIBGPFATKBEMQZ-UHFFFAOYSA-N 0.000 description 1
- 238000010396 two-hybrid screening Methods 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 150000003672 ureas Chemical class 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 210000003934 vacuole Anatomy 0.000 description 1
- 210000005167 vascular cell Anatomy 0.000 description 1
- 230000004855 vascular circulation Effects 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 210000001048 venom Anatomy 0.000 description 1
- 239000002435 venom Substances 0.000 description 1
- 231100000611 venom Toxicity 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 230000008299 viral mechanism Effects 0.000 description 1
- 210000000605 viral structure Anatomy 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 108091009357 vitamin binding proteins Proteins 0.000 description 1
- 102000028728 vitamin binding proteins Human genes 0.000 description 1
- 210000004127 vitreous body Anatomy 0.000 description 1
- 210000004916 vomit Anatomy 0.000 description 1
- 230000008673 vomiting Effects 0.000 description 1
- 235000020234 walnut Nutrition 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 229940045860 white wax Drugs 0.000 description 1
- 229940118846 witch hazel Drugs 0.000 description 1
- 241000228158 x Triticosecale Species 0.000 description 1
- FJHBOVDFOQMZRV-XQIHNALSSA-N xanthophyll Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2C=C(C)C(O)CC2(C)C FJHBOVDFOQMZRV-XQIHNALSSA-N 0.000 description 1
- 235000010930 zeaxanthin Nutrition 0.000 description 1
- 239000001775 zeaxanthin Substances 0.000 description 1
- 229940043269 zeaxanthin Drugs 0.000 description 1
- OENHQHLEOONYIE-JLTXGRSLSA-N β-Carotene Chemical compound CC=1CCCC(C)(C)C=1\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C OENHQHLEOONYIE-JLTXGRSLSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/90—Vectors containing a transposable element
Abstract
用于靶向基因修饰、靶向插入、基因转录物的扰动和核酸编辑的系统和方法。新型核酸靶向系统可包含一种或多种转座酶的组分、CRISPR‑Cas系统的一种或多种组分和转座元件。
Description
相关申请的交叉引用
本申请要求于2020年10月8日提交的美国临时申请号63/089,220的权益。上述参考申请的全部内容特此以引用的方式全部并入本文。
序列表
本申请含有标题为BROD-5185WP_ST25.txt,创建于2021年10月8日,并且大小为523,122字节(磁盘上为524KB)的ASCII.txt文件形式的以电子形式提交的序列表。序列表的内容整体并入本文。
技术领域
本文公开的主题通常涉及用于靶向基因修饰、靶向插入、基因转录物的扰动和核酸编辑的组合物和方法。新型核酸靶向系统包含成簇规则间隔短回文重复序列(CRISPR)系统的组分和转座元件。
背景技术
基因组测序技术和分析方法的最新进展显著加速了对与各种各样的生物功能和疾病相关联的遗传因子进行编目和定位的能力。需要精确的基因组靶向技术,以通过允许对个别遗传元件进行选择性扰动来实现因果遗传变异的系统性逆向工程,以及推进合成生物学、生物技术和医学应用。尽管基因组编辑技术诸如设计者锌指、转录激活子样效应物(TALE)或归巢大范围核酸酶可用于产生靶向基因组扰动,但仍需要采用新型策略和分子机制并且价格可承受、易于建立、可扩展且适于靶向真核基因组内的多个位置的新的基因组工程技术。这将为基因组工程和生物技术的新应用提供主要资源。
细菌和古细菌适应性免疫的CRISPR-Cas系统显示出蛋白质组成、基因组基因座构造和系统功能的极端多样性,并且包含CRISPR样组分的系统很普遍,并不断被发现。新型多亚基效应复合物和单亚基效应模块可被开发作为强大的基因组工程工具。
在本申请中对任何文件的引用或标识均不承认所述文件可用作本发明的现有技术。
发明内容
在一个实施方案中,本公开提供了一种工程化组合物,所述组合物包含:一种或多种CRISPR相关Tn7转座酶或其功能片段;一种或多种I-F型Cas蛋白;和指导分子,所述指导分子能够与一种或多种I-F型Cas蛋白复合并引导指导物-Cas蛋白复合物与靶多核苷酸的结合。
在实施方案中,一种或多种CRISPR相关Tn7转座酶包含TnsA、TnsB、TnsC和TnsD中的一种或多种。在实施方案中,一种或多种Tn7转座酶包含TnsA、TnsB、TnsC和TnsD。在实施方案中,一种或多种I-F型Cas蛋白包含Cas5、Cas6、Cas7和Cas 8中的一种或多种。在实施方案中,一种或多种I-F型Cas蛋白包含Cas5、Cas6和Cas7。在实施方案中,一种或多种I-F型Cas蛋白包含Cas6、Cas7和Cas8。在实施方案中,所述系统的组分由表7至表45中的多核苷酸编码。
在实施方案中,一种或多种I-F型Cas蛋白缺乏核酸酶活性。在实施方案中,所述组合物还包含供体多核苷酸。在实施方案中,供体多核苷酸是异源供体多核苷酸。在实施方案中,供体多核苷酸包含多核苷酸插入物、左侧元件序列和右侧元件序列。
在实施方案中,供体多核苷酸向靶多核苷酸引入一个或多个突变,在靶多核苷酸中校正提前终止密码子,破坏剪接位点,恢复剪接位点,或其组合。在实施方案中,由供体多核苷酸引入的一个或多个突变包括取代、缺失、插入或其组合。在实施方案中,一个或多个突变导致靶多核苷酸上的开放阅读框的移位。在实施方案中,供体多核苷酸的长度在100个碱基与30kb之间。在实施方案中,所述组合物还包含靶向部分。在实施方案中,所述组合物包含能够引导指导物-Cas蛋白复合物与一种或多种靶多核苷酸的结合的多种指导分子。在实施方案中,靶多核苷酸在真核细胞中。
在实施方案中,本公开提供了一种组合物,所述组合物包含一种或多种编码以下的多核苷酸:一种或多种CRISPR相关Tn7转座酶或其功能片段;一种或多种I-F型Cas蛋白;和指导分子,所述指导分子能够与一种或多种I-F型Cas蛋白复合并引导指导物-Cas蛋白复合物与靶多核苷酸的结合。在实施方案中,所述组合物还包含供体多核苷酸。在实施方案中,供体多核苷酸包含多核苷酸插入物、左侧元件序列和右侧元件序列。在实施方案中,一种或多种多核苷酸编码本文的组分(a)–(d)。在实施方案中,一种或多种I-F型Cas蛋白包含Cas5、Cas6、Cas7和/或Cas 8。在实施方案中,一种或多种I-F型Cas蛋白包含Cas5、Cas6和Cas7。在实施方案中,一种或多种I-F型Cas蛋白包含Cas6、Cas7和Cas8。在实施方案中,一种或多种多核苷酸选自表7至表45。
在一个实施方案中,本公开提供了一种载体,其包含本文的一种或多种多核苷酸。在一个实施方案中,本公开提供了一种工程化细胞,其包含本文的系统或本文的载体。在实施方案中,细胞产生和/或分泌内源性或非内源性生物产物或化学化合物。在实施方案中,生物产物是蛋白质或RNA。
在实施方案中,本公开提供了一种细胞系,其包含本文的工程化细胞及其子代。在实施方案中,本公开提供了一种植物或动物,其包含本文的工程化细胞及其子代。在另一个方面,本公开提供了一种组合物,其包含本文的工程化细胞。在实施方案中,组合物被配制用作治疗剂。
在一个实施方案中,本公开提供了一种由本文的工程化细胞产生的生物产物或化学化合物。在实施方案中,本公开提供了一种工程化细胞或其子代,所述细胞是使用本文的组合物进行工程化的。在实施方案中,细胞或其子代是分离的。在实施方案中,细胞或其子代进一步用作治疗剂。在实施方案中,细胞或其子代是从其中分离出产物的那些。
在实施方案中,本公开提供了一种由本文的细胞或其子代产生的产物。在实施方案中,产物是蛋白质或RNA。在实施方案中,蛋白质包含突变。
在另一个方面,本公开提供了一种用于治疗疾病或病症的药物组合物,其包含本文的细胞或其子代。在实施方案中,治疗导致一种或多种细胞的遗传变化。在实施方案中,治疗导致一种或多种缺陷基因型的校正。在实施方案中,治疗导致改善的表型。在实施方案中,细胞包含由包含靶序列的基因表达的蛋白质中的突变。在实施方案中,细胞包括包含靶序列的基因组区域的缺失。在实施方案中,细胞包含通过同源定向修复对外源性序列的整合。在实施方案中,细胞包含与靶序列相关联的基因的转录减少。在实施方案中,细胞包含与靶序列相关联的基因的转录增加。在实施方案中,产物是突变的蛋白质或由模板提供的产物。
在一个实施方案中,本公开提供了一种将供体多核苷酸插入细胞中的靶多核苷酸中的方法,所述方法包括向细胞中引入:一种或多种CRISPR相关Tn7转座酶或其功能片段;一种或多种I-F型Cas蛋白;指导分子,所述指导分子能够与I-F型Cas蛋白复合并引导指导物-Cas蛋白复合物与靶多核苷酸的结合;和供体多核苷酸。
在实施方案中,供体多核苷酸:向靶多核苷酸引入一个或多个突变,在靶多核苷酸中校正提前终止密码子,破坏剪接位点,恢复剪接位点,或其组合。在实施方案中,由供体多核苷酸引入的一个或多个突变包括取代、缺失、插入或其组合。在实施方案中,一个或多个突变导致靶多核苷酸上的开放阅读框的移位。在实施方案中,供体多核苷酸的长度在100个碱基与30kb之间。在实施方案中,组分(a)、(b)、(c)和(d)中的一种或多种由与调控序列可操作地连接的核酸表达。在实施方案中,将组分(a)、(b)、(c)和(d)中的一种或多种引入粒子中。
在实施方案中,粒子包含核糖核蛋白(RNP)。在实施方案中,细胞是原核细胞。在实施方案中,细胞是真核细胞。在实施方案中,细胞是哺乳动物细胞、非人灵长类动物的细胞或人细胞。在实施方案中,细胞是植物细胞。在实施方案中,将供体多核苷酸插入细胞中的靶多核苷酸中导致:包含改变的表达水平的一种或多种基因产物的细胞或细胞群;产生和/或分泌内源性或非内源性生物产物或化学化合物的细胞或细胞群。
在考虑所示的示例性实施方案的以下详细描述时,示例性实施方案的这些和其他方面、目的、特征和优点对于本领域中具有普通技术的那些人员来说将变得显而易见。
附图说明
将参考阐明可利用本发明原则的例示性实施方案的以下详细描述和附图来获得对本发明的特征和优点的理解,并且其中的附图:
图1示出了使用用核定位信号(NLS)标记的1-F型基因以及转染到HEK293细胞中的供体和靶质粒的转座实验。
本文中的附图仅用于说明目的,并且不一定按比例绘制。
具体实施方式
一般定义
除非另有定义,否则本文中使用的技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同含义。分子生物学中常用术语和技术的定义可见于MolecularCloning:A Laboratory Manual,第2版(1989)(Sambrook、Fritsch和Maniatis);MolecularCloning:A Laboratory Manual,第4版(2012)(Green和Sambrook);Current Protocols inMolecular Biology(1987)(F.M.Ausubel等人编);the series Methods in Enzymology(Academic Press,Inc.):PCR 2:A Practical Approach(1995)(M.J.MacPherson、B.D.Hames和G.R.Taylor编):Antibodies,A Laboratory Manual(1988)(Harlow和Lane编):Antibodies A Laboratory Manual,第2版2013(E.A.Greenfield编);Animal CellCulture(1987)(R.I.Freshney编);enjamin Lewin,Genes IX,由Jones and Bartlet出版,2008(ISBN 0763752223);Kendrew等人(编),The Encyclopedia of Molecular Biology,由Blackwell Science Ltd.出版,1994(ISBN 0632021829);Robert A.Meyers(编),Molecular Biology and Biotechnology:a Comprehensive Desk Reference,由VCHPublishers,Inc.出版,1995(ISBN 9780471185710);Singleton等人,Dictionary ofMicrobiology and Molecular Biology第2版,J.Wiley&Sons(New York,N.Y.1994),March,Advanced Organic Chemistry Reactions,Mechanisms and Structure第4版,JohnWiley&Sons(New York,N.Y.1992);以及Marten H.Hofker and Jan van Deursen,Transgenic Mouse Methods and Protocols,第2版(2011)。
如本文所用,单数形式“一个(a)”、“一种(an)”和“所述(the)”包括单数和复数个指示物,除非上下文中另外明确指示。
术语“任选的”或“任选地”意指随后描述的事件、情况或替代物可能发生或可能不发生,并且所述描述包括其中事件或情况发生的情况和其中事件或情况不发生的情况。
由端点叙述的数值范围包括在相应范围内包含的所有数字和分数,以及所述端点。
如本文所用,与参考数值及其语法等效物相关的术语“约”可包括数值本身和所述数值加或减10%的值范围。例如,“约10”的量包括10和9至11的任何量。例如,关于参考数值的术语“约”还可包括所述值加或减10%、9%、8%、7%、6%、5%、4%、3%、2%或1%的值范围。
如本文所用,“生物样品”可含有全细胞和/或活细胞和/或细胞碎片。生物样品可含有(或源自)“体液”。本发明涵盖其中体液选自以下各项的实施方案:羊水、房水、玻璃体液、胆汁、血清、母乳、脑脊液、耵聍(耳垢)、乳糜、食糜、内淋巴、外淋巴、渗出液、粪便、女性射出物、胃酸、胃液、淋巴液、粘液(包括鼻腔引流液和痰)、心包液、腹膜液、胸膜液、脓液、炎性分泌物、唾液、皮脂(皮肤油)、精液、痰液、滑液、汗液、泪液、尿液、阴道分泌物、呕吐物及其一种或多种的混合物。生物样品包括细胞培养物、体液、来自体液的细胞培养物。体液可例如通过穿刺或其他收集或取样程序从哺乳动物生物体中获得。
术语“受试者”、“个体”和“患者”在本文中可互换使用以指代脊椎动物,优选哺乳动物,更优选人。哺乳动物包括但不限于鼠、猿、人、农场动物、运动动物和宠物。还涵盖在体内获得或在体外培养的生物实体的组织、细胞及其子代。
术语“示例性”在本文中用于意指用作实例、例子或说明。本文描述为“示例性”的任何方面或设计不一定被解释为比其他方面或设计更优选或更有利。相反,使用词语示例性旨在以具体的方式呈现概念。
源自物种的蛋白质或核酸意指所述蛋白质或核酸具有与物种中的内源性蛋白质或核酸或其部分相同的序列。源自物种的蛋白质或核酸可直接从物种的生物体获得(例如,通过分离),或可例如通过重组生产或化学合成而产生。
下文描述各种实施方案。应注意,具体实施方案不旨在作为详尽的描述或作为对本文讨论的更广泛方面的限制。结合特定实施方案描述的一个方面不一定限于所述实施方案,并且可与任何其他实施方案一起实践。在整个说明书中提及“一个实施方案”、“实施方案”、“示例性实施方案”意指结合实施方案描述的特定特征、结构或特性包括在本发明的至少一个实施方案中。因此,在整个说明书中的不同位置出现的短语“在一个实施方案中”、“在实施方案中”或“示例性实施方案”未必都是指同一个实施方案,但可以是指同一个实施方案。此外,在一个或多个实施方案中,特定的特征、结构或特性可以任何合适的方式组合,这对于本公开的领域的技术人员来说将是显而易见的。此外,尽管本文所述的一些实施方案包括一些特征但不是其他实施方案中包括的其他特征,但不同实施方案的特征组合意图涵盖在本发明的范围内。例如,在所附权利要求中,要求保护的实施方案中的任一个可以任何组合使用。
本文中所引用的所有出版物、公布的专利文件和专利申请在此以引用的方式并入,其程度如同每个单独出版物、公布的专利文件或专利申请被具体地和单独地指出是以引用的方式并入那样。
综述
本公开提供了用于将多核苷酸插入靶多核苷酸中的所需位置的工程化核酸编辑系统和方法。所述系统和方法可用于将一种或多种供体多核苷酸插入真核细胞(例如人细胞)的基因组中。
一般来讲,所述系统包含一种或多种转座酶或其功能片段,以及序列特异性核苷酸结合系统的一种或多种组分,例如Cas蛋白和指导分子。在实施方案中,所述系统还包含一种或多种Cas相关转座酶,例如Cas相关Tn7转座酶。在实施方案中,所述系统包含一种或多种Tn7转座酶或其功能片段;和一种或多种I型(例如I-F型)Cas蛋白;以及指导分子,所述指导分子能够与Cas蛋白复合并引导指导物-Cas蛋白复合物与靶多核苷酸的结合。在实施方案中,所述系统还包含一种或多种供体多核苷酸,所述一种或多种供体多核苷酸将被插入到靶多核苷酸(例如,真核细胞的基因组)中的一个或多个位置。在实施方案中,供体多核苷酸可以是异源供体多核苷酸。
在实施方案中,本公开提供了编码此类核酸靶向系统的多核苷酸、包含一种或多种包含所述多核苷酸的载体的载体系统、和用所述载体系统生成的一个或多个细胞,以及使用所述系统和方法的方法。
系统和组合物
在一个实施方案中,本公开提供了包含一种或多种转座酶和核苷酸结合分子(例如,核苷酸结合蛋白)的系统。核苷酸结合蛋白可以是序列特异性的。所述系统还可包含一种或多种转座子组分。在实施方案中,所述系统包含一种或多种与序列特异性核苷酸结合系统相关联(例如,连接、结合或能够以其他方式形成复合物)的转座酶。在实施方案中,一种或多种转座酶和序列特异性核苷酸结合系统通过共调控或表达相关联。在其他示例性实施方案中,转座酶和序列特异性核苷酸结合系统通过序列特异性核苷酸结合结构域将转座酶引导或募集至插入位点的能力相关联,在所述插入位点处,转座酶将供体多核苷酸直接插入靶多核苷酸序列中。
序列特异性核苷酸结合系统可以是序列特异性DNA结合蛋白或其功能片段,和/或序列特异性RNA结合蛋白或其功能片段。在实施方案中,序列特异性核苷酸结合组分可以是CRISPR-Cas系统、转录激活子样效应物核酸酶、锌指核酸酶、大范围核酸酶、功能片段、其变体、或它们的任何组合。因此,所述系统也可被认为包含核苷酸结合组分和转座酶。为了便于参考,将在示例性Cas相关转座酶系统的上下文中讨论其他示例性实施方案。
在实施方案中,所述系统可以是工程化系统,所述系统包含一种或多种CRISPR相关Tn7转座酶或其功能片段;一种或多种Cas蛋白;和指导分子,所述指导分子能够与Cas蛋白复合并引导指导物-Cas蛋白复合物与靶多核苷酸的结合。
转座酶或转座酶复合物可与本文的Cas蛋白相互作用。在实施方案中,转座酶或转座酶复合物与Cas蛋白的N末端相互作用。在示例性实施方案中,转座酶或转座酶复合物与Cas蛋白的C末端相互作用。在示例性实施方案中,转座酶或转座酶复合物与Cas蛋白的N末端和C末端之间的片段相互作用。
异源组分
在实施方案中,所述系统中的组分可以是异源的,即它们不会一起天然存在于同一细胞或生物体中。
在实施方案中,所述系统包含一种或多种异源指导分子。异源指导分子可能不会与系统中的Cas蛋白、转座酶或供体多核苷酸天然存在于同一细胞或生物体中。此种指导分子可包含不会与指导分子的其余部分天然存在于同一分子中的异源指导序列。在实施方案中,指导分子可能不存在于自然界中。
在实施方案中,所述系统可包含一种或多种异源供体多核苷酸。异源供体多核苷酸可能不会与系统中的Cas蛋白、转座酶或指导分子天然存在于同一细胞或生物体中。此类供体多核苷酸可包含不会与指导分子的其余部分天然存在于同一分子中的异源插入序列。在实施方案中,异源供体多核苷酸可能不存在于自然界中。
可替代地或另外地,所述系统包含异源Cas蛋白和/或转座酶。
转座子和转座酶
本文公开的系统可包含转座子的一种或多种组分和/或一种或多种转座酶。本文的系统中的转座酶可以是CRISPR相关转座酶(在本文中也可与Cas相关转座酶、CRISPR相关转座酶蛋白互换使用,也称为CAST)或其功能片段。CRISPR相关转座酶可包括任何转座酶,其可通过CRISPR-Cas复合物的序列特异性结合而被引导或募集至靶多核苷酸的区域。CRISPR相关转座酶可包括与CRISPR-Cas系统中的一种或多种组分(例如,Cas蛋白、指导分子等)缔合(例如形成复合物)的任何转座酶。在实施方案中,CRISPR相关转座酶可与CRISPR-Cas系统中的一种或多种组分(例如,Cas蛋白、指导分子等)融合或拴系(例如通过接头)。
如本文所用,是指可被转座酶或整合酶识别并且是能够转座的功能性核酸-蛋白质复合物(例如,转座体(transpososome)或转座子复合物)的组分的多核苷酸(或核酸区段)。如本文所用,术语“转座酶”是指一种酶,其是能够转座的功能性核酸-蛋白质复合物的组分并介导转座。转座酶可包含单一蛋白质或包含多个蛋白质亚单位。转座酶可以是能够与转座子端或转座子端序列形成功能性复合物的酶。在实施方案中,术语“转座酶”还可以指整合酶。本文所使用的表述“转座反应”是指其中转座酶将供体多核苷酸序列插入靶多核苷酸上的插入位点中或插入位点的相邻处的反应。插入位点可含有由转座酶识别的序列或二级结构和/或插入基序序列,其中转座酶在供体多核苷酸序列可插入的靶多核苷酸中切割或产生交错断裂。术语“转座酶”可指全长转座酶蛋白或全长转座酶的具有转座酶活性的片段。转座反应中的示例性组分包括包含待插入的供体多核苷酸序列的转座子以及转座酶或整合酶。如本文所用,术语“转座子端序列”是指转座子远端的核苷酸序列。转座子端序列可负责鉴定用于转座的供体多核苷酸。转座子端序列可以是转座酶,其用来形成转座体复合物并进行转座反应的DNA序列。
转座子采用多种调控机制来维持低频率的转座,并且有时协调转座与各种细胞过程。一些原核转座子还可调动有益于宿主或以其他方式帮助维持元件的功能。
在实施方案中,所述系统包含一种或多种Tn7转座酶。在实施方案中,三种转座子编码的蛋白质形成Tn7的核心转座机制:异聚转座酶(TnsA和TnsB)和调控蛋白(TnsC)。除了核心TnsABC转座蛋白外,Tn7元件还编码专用的靶位点选择蛋白TnsD和TnsE。与TnsABC结合,序列特异性DNA结合蛋白TnsD将转座引导至称为“Tn7附接位点”attTn7的保守位点中。TnsD是蛋白质大家族的成员,所述家族还包括在其他类型的细菌转座子中发现的蛋白质TniQ。已证明TniQ靶向到质粒的解析位点中的转座。如本文所用,TniQ转座酶可以是TnsD转座酶。
Tn7转座酶的实例包括TnsA、TnsB、TnsC、TniQ、TnsD和TnsE。在实施方案中,所述系统包含TnsA、TnsB、TnsC和/或TniQ。在实施方案中,所述系统包含TnsA、TnsB、TnsC和/或TnsD(例如TnsD2)。在实施方案中,所述系统包含TnsA、TnsB、TnsC和TniQ(例如TniQ2)。在实施方案中,所述系统包含TnsA、TnsB、TnsC和TnsD(例如TnsD2)。在实施方案中,所述系统包含两个或更多个TnsA。在实施方案中,所述系统包含两个或更多个TnsA(例如2个TnsA)。在实施方案中,所述系统包含两个或更多个TnsB(例如2个TnsB)。在实施方案中,所述系统包含两个或更多个TnsC(例如2个TnsC)。在实施方案中,所述系统包含两个或更多个TnsD(例如2个TnsD)。在实施方案中,所述系统包含两个或更多个TniQ(例如2个TniQ)。TniQ或TnsD可包含DNA结合结构域。DNA结合结构域可位于TniQ或TnsD的C末端。在实施方案中,DNA结合结构域可位于TniQ或TnsD的N末端或N末端与C末端之间。在实施方案中,所述系统包含TnsA、TnsB、TnsC和仅一种TniQ或TnsD,例如,此类TniQ或TnsD可包含DNA结合结构域。在特定的实例中,所述系统包含TnsA、TnsB、TnsC和TnsD1。在另一个实例中,所述系统包含TnsA、TnsB、TnsC和TnsD2。在另一个实例中,所述系统包含TnsA、TnsB、TnsC、TnsD1和TnsD2。所述系统中的两种或更多种组分可包含在单一蛋白质(例如,融合蛋白)中。例如,TnsA和TnsB可包含在单一蛋白质中。Tn7转座酶的实例还包括描述于Peters JE和Craig NL,Tn7:smarterthan we thought,Nat Rev Mol Cell Biol.2001年11月;2(11):806-14中的那些,所述文献以引用的方式整体并入本文。
本文的术语“Tn7转座子”或“Tn7转座酶”也涵盖“Tn7样转座子”或“Tn7样转座酶”。
在实施方案中,所述系统包含一种或多种编码Tn7转座酶中的一种或多种的多核苷酸。在实施方案中,所述系统包含一种或多种编码TnsA的多核苷酸。在实施方案中,所述系统包含一种或多种编码TnsB的多核苷酸。在实施方案中,所述系统包含一种或多种编码TnsC的多核苷酸。在实施方案中,所述系统包含一种或多种编码TnsD的多核苷酸。在实施方案中,所述系统包含一种或多种编码TnsE的多核苷酸。在实施方案中,所述系统包含一种或多种编码TniQ的多核苷酸。所述系统可包含两种或更多种编码相同类型的转座酶的多核苷酸。在一个实例中,所述系统可包含两种或更多种编码TnsA(相同或不同TnsA)的多核苷酸。在一个实例中,所述系统可包含两种或更多种编码TnsB(相同或不同TnsB)的多核苷酸。在一个实例中,所述系统可包含两种或更多种编码TnsC(相同或不同TnsC)的多核苷酸。在一个实例中,所述系统可包含两种或更多种编码TnsD(相同或不同TnsD)的多核苷酸。在一个实例中,所述系统可包含两种或更多种编码TnsE(相同或不同TnsE)的多核苷酸。在一个实例中,所述系统可包含两种或更多种编码TniQ(相同或不同TniQ)的多核苷酸。
如本文所用,右端序列元件或左端序列元件参考示例性Tn7转座子制成。建立了规范Tn7的左端(LE)和右端(RE)序列元件的一般结构。Tn7端包含一系列22-bp TnsB结合位点。最远端TnsB结合位点的侧翼是以5′-TGT-3′/3′-ACA-5′结束的8-bp末端序列。Tn7的右端在约90-bp右端元件中含有四个重叠的TnsB结合位点。左端含有分散在元件的约150-bp左端的三个TnsB结合位点。TnsB结合位点的数量和分布在Tn7元件之间可能有所不同。可通过鉴定正向重复的5-bp靶位点重复、末端8-bp序列和22-bp TnsB结合位点来确定Tn7相关元件的端序列(Peters JE等人,2017)。示例性Tn7元件(包括右端序列元件和左端序列元件)包括描述于Parks AR,Plasmid,2009年1月;61(1):1-14中的那些。
本文的转座酶(例如,Tn7)包括野生型转座酶、其变体、其功能片段及其任何组合。
供体多核苷酸
本文公开的系统可包含一种或多种供体多核苷酸(例如,用于插入靶多核苷酸中)。供体多核苷酸可以是可插入或整合至靶位点中的转座元件的等效物。例如,供体多核苷酸可包含待插入的多核苷酸、左侧元件序列和右侧元件序列。供体多核苷酸可以是或包含转座子的一种或多种组分。供体多核苷酸可以是任何类型的多核苷酸,包括但不限于基因、基因片段、非编码多核苷酸、调控多核苷酸、合成多核苷酸等。
靶多核苷酸可包含PAM序列。供体多核苷酸可插入到靶多核苷酸的PAM序列的上游或下游。对于CRISPR相关转座酶,供体多核苷酸可插入在靶多核苷酸上距PAM序列10个碱基至200个碱基,例如20个碱基至150个碱基、30个碱基至100个碱基、45个碱基至70个碱基、45个碱基至60个碱基、55个碱基至70个碱基、49个碱基至56个碱基或60个碱基至66个碱基的位置处。在实施方案中,插入位于PAM序列上游的位置处。在实施方案中,插入位于PAM序列下游的位置处。在实施方案中,插入位于PAM序列下游49至56个碱基或碱基对的位置处。在实施方案中,插入位于PAM序列下游60至66个碱基或碱基对的位置处。
供体多核苷酸可用于编辑靶多核苷酸。在实施方案中,供体多核苷酸包含一个或多个要引入到靶多核苷酸中的突变。此类突变的实例包括取代、缺失、插入或其组合。突变可能导致靶多核苷酸上的开放阅读框的移位。在实施方案中,供体多核苷酸改变靶多核苷酸中的终止密码子。例如,供体多核苷酸可以校正提前终止密码子。校正可通过缺失终止密码子或向终止密码子引入一个或多个突变来实现。在其他示例性实施方案中,供体多核苷酸通过插入或恢复基因的功能拷贝或其功能片段、或功能调控序列或调控序列的功能片段来解决例如在某些疾病背景下可能发生的功能丧失性突变、缺失或易位。功能片段是指通过提供足够的核苷酸序列来恢复野生型基因或非编码调控序列(例如,编码长非编码RNA的序列)的功能的基因的不完整拷贝。在实施方案中,本文公开的系统可用于替换缺陷基因或其缺陷片段的单个等位基因。在另一个示例性实施方案中,本文公开的系统可用于替换缺陷基因或缺陷基因片段的两个等位基因。“缺陷基因”或“缺陷基因片段”是在表达时不能产生具有对应野生型基因的功能的功能性蛋白质或非编码RNA的基因或基因部分。在实施方案中,这些缺陷基因可能与一种或多种疾病表型相关联。在实施方案中,缺陷基因或基因片段未被替换,但本文所述的系统用于插入编码补偿或覆盖缺陷基因表达的基因或基因片段的供体多核苷酸,使得消除与缺陷基因表达相关联的细胞表型或将其改变为不同的或所需的细胞表型。因此,当插入细胞或细胞群中的靶多核苷酸中时,供体多核苷酸的插入可改变一种或多种基因产物水平的表达,或者可允许内源性或非内源性生物产物或化学化合物的产生和或分泌。
在本发明的实施方案中,供体可包括但不限于基因或基因片段、编码蛋白或待表达的RNA转录物、调控元件、修复模板等。根据本发明,供体多核苷酸可包含与介导插入的转座组分一起发挥作用的左端和右端序列元件。
在实施方案中,供体多核苷酸操纵靶多核苷酸上的剪接位点。在实施方案中,供体多核苷酸破坏剪接位点。破坏可通过将多核苷酸插入剪接位点和/或将一个或多个突变引入剪接位点来实现。在示例性实施方案中,供体多核苷酸可恢复剪接位点。例如,多核苷酸可包含剪接位点序列。
待插入的供体多核苷酸可具有长度为10个碱基至50kb的大小,例如长度为50至40kb、100至30kb、100个碱基至300个碱基、约200个碱基至400个碱基、约300个碱基至500个碱基、约400个碱基至600个碱基、约500个碱基至700个碱基、约600个碱基至800个碱基、约700个碱基至900个碱基、约800个碱基至1000个碱基、约900个碱基至1100个碱基、约1000个碱基至1200个碱基、约1100个碱基至1300个碱基、约1200个碱基至1400个碱基、约1300个碱基至1500个碱基、约1400个碱基至1600个碱基、约1500个碱基至1700个碱基、约600个碱基至1800个碱基、约1700个碱基至1900个碱基、约1800个碱基至2000个碱基、约1900个碱基至2100个碱基、约2000个碱基至2200个碱基、约2100个碱基至2300个碱基、约2200个碱基至2400个碱基、约2300个碱基至2500个碱基、约2400个碱基至2600个碱基、约2500个碱基至2700个碱基、约2600个碱基至2800个碱基、约2700个碱基至2900个碱基或约2800个碱基至3000个碱基。
本文公开的系统中的组分可包括一个或多个改变其(例如转座酶)与供体多核苷酸的结合亲和力的突变。在实施方案中,突变增加了转座酶与供体多核苷酸之间的结合亲和力。在示例性实施方案中,突变降低了转座酶与供体多核苷酸之间的结合亲和力。突变可改变Cas和/或转座酶的活性。
插入可发生在核酸分子上距Cas结合位点一定距离的位置处。在实施方案中,插入可发生在Cas结合位点的3’侧,例如Cas结合位点的3’侧至少1bp、至少5bp、至少10bp、至少15bp、至少20bp、至少35bp、至少40bp、至少45bp、至少50bp、至少55bp、至少60bp、至少65bp、至少70bp、至少75bp、至少80bp、至少85bp、至少90bp、至少95bp或至少100bp的位置处。在实施方案中,插入可发生在Cas结合位点的5’侧,例如Cas结合位点的5’侧至少1bp、至少5bp、至少10bp、至少15bp、至少20bp、至少35bp、至少40bp、至少45bp、至少50bp、至少55bp、至少60bp、至少65bp、至少70bp、至少75bp、至少80bp、至少85bp、至少90bp、至少95bp或至少100bp的位置处。在特定的实例中,插入可发生在Cas结合位点的3’侧65bp处。
在实施方案中,供体多核苷酸通过共整合机制插入靶多核苷酸。例如,供体多核苷酸和靶多核苷酸可被切口并融合。融合供体多核苷酸和靶多核苷酸的重复物可通过聚合酶生成。在某些情况下,供体多核苷酸通过切割再粘贴(cut-and-paste)机制插入靶多核苷酸中。例如,供体多核苷酸可包含在核酸分子中,并且可被切割并插入核酸分子中的另一个位置。
靶多核苷酸可以是真核细胞中的多核苷酸。例如,靶多核苷酸可以是真核细胞基因组中的多核苷酸。基因组可以是核基因组、线粒体基因组或叶绿体基因组。
CRISPR-Cas系统
本文的系统可包含CRISPR-Cas系统的一种或多种组分。CRISPR-Cas系统的一种或多种组分可用作系统中的核苷酸结合组分。核苷酸结合分子可以是Cas蛋白(可与CRISPR蛋白、CRISPR酶、Cas效应物、CRISPR-Cas蛋白、CRISPR-Cas酶互换使用)、其片段或其突变形式。Cas蛋白可能具有降低的核酸酶活性或不具有核酸酶活性。例如,Cas蛋白可以是无活性或死亡的Cas蛋白(dCas)。死亡的Cas蛋白可包含一个或多个突变或截短物。在实施方案中,DNA结合结构域包含一种或多种I类(例如,I型、III型、VI型)或2类(例如,II型、V型或VI型)CRISPR-Cas蛋白。在实施方案中,序列特异性核苷酸结合结构域将转座子引导至包含靶序列的靶位点,并且转座酶引导供体多核苷酸序列在靶位点处的插入。在实施方案中,转座子组分包括CRISPR-Cas复合物、与所述复合物缔合或形成所述复合物。在一个示例性实施方案中,CRISPR-Cas组分将转座子组分和/或转座酶引导至靶插入位点,其中转座子组分引导供体多核苷酸插入靶核酸序列中。
一般来讲,如本文和在诸如国际专利公布号WO 2014/093622(PCT/US2013/074667)的文件中使用的CRISPR-Cas或CRISPR系统统指转录物和涉及CRISPR相关(“Cas”)基因的表达或引导所述基因的活性的其他元件,包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配对序列(涵盖“正向重复序列”和在内源性CRISPR系统的上下文中tracrRNA加工的部分正向重复序列)、指导序列(在内源性CRISPR系统的上下文中也称为“间隔子”)或如本文所用术语“RNA”(例如,指导Cas诸如Cas9的RNA,例如CRISPR RNA和反式激活(tracr)RNA或单指导RNA(sgRNA)(嵌合RNA))或来自CRISPR基因座的其他序列和转录物。一般来讲,CRISPR系统的特征在于促进在靶序列位点处形成CRISPR复合物的元件(在内源性CRISPR系统的上下文中也称为原间隔子)。参见例如,Shmakov等人(2015)“Discovery and Functional Characterization of DiverseClass 2CRISPR-Cas Systems,”Molecular Cell,DOI:dx.doi.org/10.1016/j.molcel.2015.10.008。
在实施方案中,原间隔子相邻基序(PAM)或PAM样基序引导如本文公开的效应蛋白复合物与目标靶基因座的结合。在实施方案中,PAM可以是5’PAM(即,位于原间隔子5’端的上游)。在其他实施方案中,PAM可以是3’PAM(即,位于原间隔子5’端的下游)。术语“PAM”可与术语“PFS”或“原间隔子侧翼位点”或“原间隔子侧翼序列”互换使用。
在一个优选的实施方案中,CRISPR效应蛋白可识别3’PAM。在实施方案中,CRISPR效应蛋白可识别作为5’H的3’PAM,其中H是A、C或U。
在CRISPR复合物形成的上下文中,“靶序列”是指指导序列被设计成与其具有互补性的序列,其中靶序列与指导序列之间的杂交促进了CRISPR复合物的形成。靶序列可包含RNA多核苷酸。术语“靶RNA”是指作为或包含靶序列的RNA多核苷酸。换句话讲,靶RNA可以是RNA多核苷酸或RNA多核苷酸的一部分,gRNA的一部分(即指导序列)被设计成与所述靶RNA具有互补性,并且由包含CRISPR效应蛋白和gRNA的复合物介导的效应子功能将被引导至所述靶RNA。在实施方案中,靶序列位于细胞的核或细胞质中。
本文的CRISPR-Cas系统可包含Cas蛋白和指导分子。在实施方案中,所述系统包含一种或多种Cas蛋白。Cas蛋白可以是1型Cas蛋白,例如I型CRISPR-Cas系统的Cas蛋白。
可与本文公开的系统一起使用的Cas蛋白的实例包括1类和2类CRISPR-Cas系统的Cas蛋白质。
在实施方案中,CRISPR-Cas系统是1类CRISPR-Cas系统,例如,1类I型CRISPR-Cas系统。在实施方案中,I类CRISPR-Cas系统包含Cascade(由三种至五种蛋白质组成的多聚体复合物,其对crRNA阵列进行加工)、Cas3(具有核酸酶、解旋酶和核酸外切酶活性的蛋白质,其负责靶DNA的降解)和crRNA(稳定Cascade复合物并将Cascade和Cas3引导至DNA靶标)。1类CRISPR-Cas系统可以属于以下亚型,例如I-A型、I-B型、I-C型、I-D型、I-E型、I-F型、I-U型、III-A型、III-B型、III-C型、III-D型或IV型CRISPR-Cas系统。
1类I型CRISPR Cas系统可用于催化将RNA指导的移动遗传元件整合到靶核酸(例如,基因组DNA)中。例如,本文的系统可包含Cascade与转座子蛋白之间的复合物。在靶核酸下游的给定距离处,可插入供体核酸(例如,DNA)。插入可以是两个可能的方向之一。所述系统可用于整合所需长度的核酸序列。在实施方案中,I型CRISPR-Cas系统是核酸酶缺陷型的。在实施方案中,I型CRISPR-Cas系统是I-F型CRISPR-Cas系统。
1类I-A型CRISPR-Cas系统可包含Cas7(Csa2)、Cas8a1(Csx13)、Cas8a2(Csx9)、Cas5、Csa5、Cas6a、Cas3′和/或Cas3。I-B型CRISPR-Cas系统可包含Cas6b、Cas8b(Csh1)、Cas7(Csh2)和/或Cas5。I-C型CRISPR-Cas系统可包含Cas5d、Cas8c(Csd1)和/或Cas7(Csd2)。I-D型CRISPR-Cas系统可包含Cas10d(Csc3)、Csc2、Csc1和/或Cas6d。I-E型CRISPR-Cas系统可包含Cse1(CasA)、Cse2(CasB)、Cas7(CasC)、Cas5(CasD)和/或Cas6e(CasE)。I-F型CRISPR-Cas系统可包含Cys1、Cys2、Cas7(Cys3)和/或Cas6f(Csy4)。示例性I-F型CRISPR-Cas系统可包含由以下三个基因编码的DNA靶向复合物Cascade(也称为Csy复合物):cas6、cas7和天然cas8-cas5融合物(下文简称为cas8)。I-F型CRISPR-Cas系统还可包含天然CRISPR阵列,其包含四个重复序列和三个间隔子序列,编码不同的成熟CRISPR RNA(crRNA),我们也将其称为指导RNA。
另一个示例性1-F型CRISPR-Cas系统可包括包含Cas1、Cas2、Cas3、Cas8f、Cas5f、Cas7f和Cas6f的典型1-F亚型系统,其中cas5f和cas8f基因各自包含在它们各自的开放阅读框中(Peters,J.等人(2017),PNAS,E7358-E7366;doi/10.1073/pnas.1709035114)。已鉴定出1-F型CRISPR-Cas系统变体。例如,在希瓦氏菌属(Shewanella)菌株ANA 3(Shewan3_3852_Shewan3_3854)中,cas8f基因融合至cas5f1基因,随后在下游融合至cas7f1和cas6f基因(Makarova,K.等人(2018),CRISPR J 1(5),325-336)。在腐败希瓦氏菌(Shewanellaputrefaciens)CN-32(Sputcn32_1819_Sputcn32_1823)中,1-F型CRISPR-Cas由Cas1、Cas2、Cas3、Cas7f2、Cas5f2和cas6f组成(Makarova,K.等人(2018),CRISPR J 1(5),325-336)。如本文公开的Cas5/Cas8融合序列提供于表7至表45中。
在实施方案中,I型CRISPR-Cas系统可包含一个或多个:(a)编码Cas7(Csa2)多肽的核苷酸序列、编码Cas8a1(Csx13)多肽或Cas8a2(Csx9)多肽的核苷酸序列、编码Cas5多肽的核苷酸序列、编码Csa5多肽的核苷酸序列、编码Cas6a多肽的核苷酸序列、编码Cas3’多肽的核苷酸序列和编码Cas3”多肽的核苷酸序列(I-A型);(b)编码Cas6b多肽的核苷酸序列、编码Cas8b(Csh1)多肽的核苷酸序列、编码Cas7(Csh2)多肽的核苷酸序列、编码Cas5多肽的核苷酸序列、编码Cas3’多肽的核苷酸序列和编码Cas3”多肽的核苷酸序列(I-B型);(c)编码Cas5d多肽的核苷酸序列、编码Cas8c(Csd1)多肽的核苷酸序列、编码Cas7(Csd2)多肽的核苷酸序列和编码Cas3多肽的核苷酸序列(I-C型);(d)编码Cas10d(Csc3)多肽的核苷酸序列、编码Csc2多肽的核苷酸序列、编码Csc1多肽的核苷酸序列、编码Cas6d多肽的核苷酸序列和编码Cas3多肽的核苷酸序列(I-D型);(e)编码Cse1(CasA)多肽的核苷酸序列、编码Cse2(CasB)多肽的核苷酸序列、编码Cas7(CasC)多肽的核苷酸序列、编码Cas5(CasD)多肽的核苷酸序列、编码Cas6e(CasE)多肽的核苷酸序列和编码Cas3多肽的核苷酸序列(I-E型);和/或(f)编码Cys1多肽的核苷酸序列、编码Cys2多肽的核苷酸序列、编码Cas7(Cys3)多肽的核苷酸序列和编码Cas6f多肽的核苷酸序列和编码Cas3多肽的核苷酸序列(I-F型)。因此,I型Cas蛋白可以是本文所述的Cas蛋白中的一种或多种。
在实施方案中,1型Cas蛋白可以是Cas5、Cas6、Cas7和Cas8中的一种或多种。在实施方案中,所述系统包含Cas5。在实施方案中,所述系统包含Cas6。在实施方案中,所述系统包含Cas。在实施方案中,所述系统包含Cas5和Cas6。在实施方案中,所述系统包含Cas5和Cas7。在实施方案中,所述系统包含Cas5和Cas8。在实施方案中,所述系统包含Cas6和Cas7。在实施方案中,所述系统包含Cas6和Cas8。在实施方案中,所述系统包含Cas7和Cas 8。在实施方案中,所述系统包含Cas5、Cas6和Cas7。在实施方案中,所述系统包含Cas5、Cas6和Cas8。在实施方案中,所述系统包含Cas5、Cas7和Cas8。在实施方案中,所述系统包含Cas 6、Cas7和Cas8。在实施方案中,所述系统包含Cas5、Cas6、Cas7和Cas8。在实施方案中,所述系统包含编码Cas5的多核苷酸。在实施方案中,所述系统包含编码Cas6的多核苷酸。在实施方案中,所述系统包含编码Cas7的多核苷酸。在实施方案中,所述系统包含编码Cas5的多核苷酸和编码Cas6的多核苷酸。在实施方案中,所述系统包含编码Cas5的多核苷酸和编码Cas7的多核苷酸。在实施方案中,所述系统包含编码Cas5的多核苷酸和编码Cas8的多核苷酸。在实施方案中,所述系统包含编码Cas6的多核苷酸和编码Cas7的多核苷酸。在实施方案中,所述系统包含编码Cas6的多核苷酸和编码Cas8的多核苷酸。在实施方案中,所述系统包含编码Cas7的多核苷酸和编码Cas8的多核苷酸。在实施方案中,所述系统包含编码Cas5的多核苷酸、编码Cas6的多核苷酸和编码Cas7的多核苷酸。在实施方案中,所述系统包含编码Cas5的多核苷酸、编码Cas6的多核苷酸和编码Cas8的多核苷酸。在实施方案中,所述系统包含编码Cas5的多核苷酸、编码Cas7的多核苷酸和编码Cas8的多核苷酸。在实施方案中,所述系统包含编码Cas6的多核苷酸、编码Cas7的多核苷酸和编码Cas8的多核苷酸。在实施方案中,所述系统包含编码Cas5的多核苷酸、编码Cas6的多核苷酸、编码Cas7的多核苷酸和编码Cas8的多核苷酸。本文的Cas蛋白(例如,Cas5、Cas6、Cas7、Cas8)包括野生型转座酶、其变体及其功能片段。
I型CRISPR组分的实例包括描述于Makarova等人,Annotation andClassification of CRISPR-Cas Systems,Methods Mol Biol.2015;1311:47–75中的那些。
相关1类I型CRISPR系统可包含cas5f、cas6f、cas7f、cas8f以及CRISPR阵列。在实施方案中,I型CRISPR-Cas系统包含cas5f、cas6f、cas7f和cas8f中的一种或多种。例如,I型CRISPR-Cas系统包含cas5f、cas6f、cas7f和cas8f。在某些情况下,I型CRISPR-Cas系统包含cas8f-cas5f、cas6f和cas7f中的一种或多种。例如,I型CRISPR-Cas系统包含cas8f-cas5f、cas6f和cas7f。如本文所用,术语Cas5678f是指包含cas5f、cas6f、cas7f和cas8f的复合物。
在实施方案中,CRISPR-Cas系统可以是2类CRISPR-Cas系统。2类CRISPR-Cas系统可以属于以下亚型,例如II-A型、II-B型、II-C型、V-A型、V-B型、V-C型、V-U型、VI-A型、VI-B型或VI-C型CRISPR-Cas系统。CRISPR-Cas系统的定义和示例性成员包括描述于KiraS.Makarova和Eugene V.Koonin,Annotation and Classification of CRISPR-CasSystems,Methods Mol Biol.2015;1311:47–75;和Sergey Shmakov等人,Diversity andevolution of class 2CRISPR–Cas systems,Nat Rev Microbiol.2017年3月;15(3):169–182中的那些。
Cas蛋白的非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、Cas9、Cas 12(例如Cas12a、Cas12b、Cas12c、Cas12d、Cas12k等)、Cas13(例如Cas13a、Cas13b(诸如Cas13b-t1、Cas13b-t2、Cas13b-t3)、Cas13c、Cas13d等)、Cas14、CasX、CasY或Cas蛋白的工程化形式(例如,失活的死形式、切口酶形式)。
在实施方案中,Cas蛋白可能是核酸酶缺陷型的。核酸酶缺陷型核酸酶可能不具有核酸酶活性。核酸酶缺陷型核酸酶可能具有切口酶活性。
在实施方案中,Cas蛋白可以是上述Cas蛋白的直系同源物或同系物。术语“直系同源物”和“同源物”在本领域中是众所周知的。通过进一步的指导,如本文所用的蛋白质的“同源物”是与作为其同源物的蛋白质执行相同或相似功能的相同物种的蛋白质。同源蛋白质可以但不必在结构上相关,或仅在结构上部分相关。如本文所用,蛋白质的“直系同源物”是与作为其直系同源物的蛋白质执行相同或相似的功能的不同物种的蛋白质。直系同源蛋白质可以但不必在结构上相关,或仅在结构上部分相关。
在实施方案中,Cas蛋白缺乏核酸酶活性。此种Cas蛋白可以是不具有核酸酶活性的天然存在的Cas蛋白,或者Cas蛋白可以是具有降低或消除核酸酶活性的突变或截短的工程化Cas蛋白。
在实施方案中,CRISPR效应蛋白可使用编码CRISPR蛋白的核酸分子来递送。编码CRISPR蛋白的核酸分子可有利地是密码子优化的CRISPR蛋白。密码子优化的序列的实例在这种情况下是被优化用于在真核生物例如人中表达(即,被优化用于在人中表达)的序列,或被优化用于在如本文所讨论的另一种真核生物、动物或哺乳动物中表达的序列;参见例如,国际专利公布号WO 2014/093622(PCT/US2013/074667)中的SaCas9人密码子优化的序列。
在实施方案中,本公开包括转基因细胞,向所述转基因细胞中提供或引入一种或多种编码一种或多种指导RNA的核酸,其在细胞中与包括一种或多种目标基因的启动子在内的调控元件可操作地连接。如本文所用,术语“Cas转基因细胞”是指Cas基因已基因组整合到其中的细胞,诸如真核细胞。根据本发明,细胞的性质、类型或来源没有特别限制。Cas转基因被引入细胞中的方式也可以变化,并且可以是本领域已知的任何方法。在实施方案中,Cas转基因细胞通过在分离的细胞中引入Cas转基因来获得。在某些其他实施方案中,Cas转基因细胞是通过从Cas转基因生物体分离细胞而获得的。例如但不限于,如本文所提及的Cas转基因细胞可源自Cas转基因真核生物,诸如Cas敲入真核生物。参考WO 2014/093622(PCT/US13/74667),其以引用的方式并入本文。转让给Sangamo BioSciences,Inc.的美国专利公布号20120017290和20110265198的涉及靶向Rosa基因座的方法可被修改以利用本发明的CRISPR Cas系统。转让给Cellectis的美国专利公布号20130236946的涉及靶向Rosa基因座的方法也可被修改以利用本发明的CRISPR Cas系统。还例如,参考Platt等人(Cell;159(2):440-455(2014)),其描述了Cas9敲入小鼠,所述文献以引用的方式并入本文。Cas转基因还可包含Lox-Stop-polyA-Lox(LSL)盒,从而使Cas表达可被Cre重组酶诱导。可替代地,Cas转基因细胞可通过在分离的细胞中引入Cas转基因来获得。用于转基因的递送系统在本领域中是众所周知的。例如,Cas转基因可通过载体(例如,AAV、腺病毒、慢病毒)和/或粒子和/或纳米粒子递送在例如真核细胞中递送,如本文别处也描述的。
本领域技术人员将理解,如本文所提及的细胞,诸如Cas转基因细胞,除了具有整合的Cas基因或当与能够将Cas指导到靶基因座的RNA复合时由Cas的序列特异性作用产生的突变之外,还可包含其他基因组改变。
指导RNA编码序列和/或Cas编码序列可以与调控元件功能性地或可操作地连接,并且因此调控元件驱动表达。启动子可以是组成型启动子和/或条件启动子和/或诱导型启动子和/或组织特异性启动子。启动子可选自由以下组成的组:RNA聚合酶、pol I、pol II、pol III、T7、U6、H1、逆转录病毒劳斯肉瘤病毒(RSV)LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子。有利的启动子是U6。
指导分子
本文的系统可包含一种或多种指导分子。指导分子可以是本文的CRISPR-Cas系统的组分。如本文所用,在CRISPR-Cas系统的上下文中,术语“指导序列”和“指导分子”包括与靶核酸序列具有足够互补性以与靶核酸序列杂交并引导核酸靶向复合物与靶核酸序列的序列特异性结合的任何多核苷酸序列。使用本文公开的方法制备的指导序列可以是全长指导序列、截短的指导序列、全长sgRNA序列、截短的sgRNA序列或E+F sgRNA序列。在实施方案中,当使用合适的比对算法进行最佳比对时,指导序列与给定靶序列的互补性程度为约或大于50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更多。在实施方案中,指导分子包含可被设计成与靶序列具有至少一个错配从而在指导序列与靶序列之间形成RNA双链体的指导序列。因此,互补性程度优选小于99%。例如,在指导序列由24个核苷酸组成的情况下,互补性程度更特别地为约96%或更少。在特定的实施方案中,指导序列被设计成具有两个或更多个相邻错配核苷酸段,从而进一步降低整个指导序列上的互补性程度。例如,在指导序列由24个核苷酸组成的情况下,互补性程度更特别地为约96%或更少,更特别地为约92%或更少,更特别地为约88%或更少,更特别地为约84%或更少,更特别地为约80%或更少,更特别地为约76%或更少,更特别地为约72%或更少,取决于两个或更多个错配核苷酸段是否涵盖2、3、4、5、6或7个核苷酸等。在实施方案中,除了一个或多个错配核苷酸段之外,当使用合适的比对算法进行最佳比对时,互补性程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更多。最佳比对可使用用于比对序列的任何合适的算法来确定,其非限制性实例包括Smith-Waterman算法、Needleman-Wunsch算法、基于Burrows-Wheeler变换的算法(例如,Burrows Wheeler Aligner)、Clustal W、Clustal X、BLAT、Novoalign(Novocraft Technologies;可在www.novocraft.com获得)、ELAND(Illumina,San Diego,CA)、SOAP(可在soap.genomics.org.cn获得)和Maq(可在maq.sourceforge.net获得)。指导序列(在核酸靶向指导RNA内)引导核酸靶向复合物与靶核酸序列的序列特异性结合的能力可通过任何合适的测定法来评估。例如,可将足以形成核酸靶向复合物的核酸靶向CRISPR系统的组分(包括待测试的指导序列)提供至具有对应靶核酸序列的宿主细胞,诸如通过用编码核酸靶向复合物的组分的载体转染,之后评估靶核酸序列内的优先靶向(例如,切割),诸如通过如本文所述的Surveyor测定法。类似地,可通过提供靶核酸序列、核酸靶向复合物的组分(包括待测试的指导序列和与测试指导序列不同的对照指导序列),并且比较测试指导序列和对照指导序列反应之间在靶序列处或附近的结合或切割率,而在试管中评估靶核酸序列(或其附近的序列)的切割。其他测定是可能的,并且将发生在本领域技术人员中。可选择指导序列并因此选择核酸靶向指导RNA以靶向任何靶核酸序列。
在实施方案中,指导分子的指导序列或间隔子长度为15至50nt。在实施方案中,指导RNA的间隔子长度为至少15个核苷酸。在实施方案中,间隔子长度为15至17nt,例如15、16或17nt,17至20nt,例如17、18、19或20nt,20至24nt,例如20、21、22、23或24nt,23至25nt,例如23、24或25nt,24至27nt,例如24、25、26或27nt,27至30nt,例如27、28、29或30nt,30-35nt,例如30、31、32、33、34或35nt,或35nt或更长。在某些示例性实施方案中,指导序列为15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100nt。
在实施方案中,指导序列是长度在10至50nt之间的RNA序列,但更特别地为约20-30nt,有利地为约20nt、23-25nt或24nt。可以选择指导序列以确保其与靶序列杂交。选择可涵盖增加功效和特异性的其他步骤。
在实施方案中,具有规范长度(例如,约15-30nt)的指导序列用于与靶RNA或DNA杂交。在实施方案中,长于规范长度(例如,>30nt)的指导分子用于与靶RNA或DNA杂交,使得指导序列的区域与Cas-指导物靶复合物之外的RNA或DNA链的区域杂交。这在关注另外的修饰(诸如核苷酸的脱氨基作用)的情况下可能是令人感兴趣的。在替代实施方案中,保持规范指导序列长度的限制是令人感兴趣的。
在实施方案中,选择指导分子的序列(正向重复序列和/或间隔子)以降低指导分子内二级结构的程度。在实施方案中,核酸靶向指导RNA的约或少于约75%、50%、40%、30%、25%、20%、15%、10%、5%、1%或更少的核苷酸在最佳折叠时参与自互补碱基配对。最佳折叠可通过任何合适的多核苷酸折叠算法来确定。一些程序基于计算最小吉布斯自由能。一个此种算法的实例是mFold,如Zuker和Stiegler(Nucleic Acids Res.9(1981),133-148)所述。另一个示例性折叠算法是使用质心结构预测算法在维也纳大学理论化学研究所开发的在线网络服务器RNAfold(参见例如,A.R.Gruber等人,2008,Cell 106(1):23-24;以及PA Carr和GM Church,2009,Nature Biotechnology 27(12):1151-62)。
在实施方案中,设计或选择指导分子以调节指导分子之间的分子间相互作用,诸如不同指导分子的茎环区之间的相互作用。应当理解,碱基配对以形成茎环的指导物内的核苷酸也能够与第二指导物碱基配对以形成分子间双链体,并且此种分子间双链体不具有与CRISPR复合物形成相容的二级结构。因此,选择或设计DR序列以调节茎环形成和CRISPR复合物形成可以是有用的。在实施方案中,约或少于约75%、50%、40%、30%、25%、20%、15%、10%、5%、1%或更少的核酸靶向指导物在分子间双链体中。应当理解,茎环变异通常会在DR-CRISPR效应物相互作用所施加的限制内。调节茎环形成或改变茎环与分子间双链体之间平衡的一种方法是改变DR的茎环的茎中的核苷酸对。例如,在一个实施方案中,G-C对被A-U或U-A对替换。在另一个实施方案中,A-U对被G-C或C-G对取代。在另一个实施方案中,天然存在的核苷酸被核苷酸类似物替换。调节茎环形成或改变茎环与分子间双链体之间平衡的另一种方法是修饰DR的茎环的环。不受理论的束缚,环可被视为间插序列,其侧翼是彼此互补的两个序列。当所述间插序列不是自互补的时,其作用将是使分子间双链体的形成失稳。同样的原则适用于当指导物多重化时:虽然靶向序列可能不同,但修饰不同指导物的DR中的茎环区可能是有利的。此外,当指导物多重化时,可通过平衡每个个别指导物的活性来调节不同指导物的相对活性。在实施方案中,确定分子间茎环与分子间双链体之间的平衡。所述确定可通过物理或生物化学方式进行,并且可在存在或不存在CRISPR效应物的情况下进行。
在实施方案中,降低指导分子对RNA切割(诸如通过切割RNA的CRISPR系统的切割)的敏感性是令人感兴趣的。因此,在特定的实施方案中,调整指导分子以避免被CRISPR系统或其他RNA切割酶切割。
在实施方案中,指导分子包含非天然存在的核酸和/或非天然存在的核苷酸和/或核苷酸类似物,和/或化学修饰。优选地,这些非天然存在的核酸和非天然存在的核苷酸位于指导序列之外。非天然存在的核酸可包括例如天然和非天然存在的核苷酸的混合物。非天然存在的核苷酸和/或核苷酸类似物可在核糖、磷酸酯和/或碱基部分进行修饰。在本发明的实施方案中,指导核酸包含核糖核苷酸和非核糖核苷酸。在一个此种实施方案中,指导物包含一个或多个核糖核苷酸和一个或多个脱氧核糖核苷酸。在实施方案中,指导物包含一个或多个非天然存在的核苷酸或核苷酸类似物,诸如具有硫代磷酸酯键联的核苷酸,包含核糖环的2’与4’碳之间的亚甲基桥的锁核酸(LNA)核苷酸,或桥接的核酸(BNA)。修饰的核苷酸的其他实例包括2’-O-甲基类似物、2’-脱氧类似物或2’-氟类似物。修饰的碱基的其他实例包括但不限于2-氨基嘌呤、5-溴-尿苷、假尿苷、肌苷、7-甲基鸟苷。指导RNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处并入2’-O-甲基(M)、2’-O-甲基3’硫代磷酸酯(MS)、S-约束的乙基(cEt)或2’-O-甲基3’硫代PACE(MSP)。与未修饰的指导物相比,此类化学修饰的指导物可包括增加的稳定性和增加的活性,但在靶与脱靶特异性是不可预测的。(参见Hendel,2015,Nat Biotechnol.33(9):985-9,doi:10.1038/nbt.3290,在线出版于2015年6月29日Ragdarm等人,0215,PNAS,E7110-E7111;Allerson等人,J.Med.Chem.2005,48:901-904;Bramsen等人,Front.Genet.,2012,3:154;Deng等人,PNAS,2015,112:11870-11875;Sharma等人,MedChemComm.,2014,5:1454-1471;Hendel等人,Nat.Biotechnol.(2015)33(9):985-989;Li等人,Nature Biomedical Engineering,2017,1,0066DOI:10.1038/s41551-017-0066)。在实施方案中,指导RNA的5’和/或3’端被包括荧光染料、聚乙二醇、胆固醇、蛋白质或检测标签的多种功能性部分修饰。(参见Kelly等人,2016,J.Biotech.233:74-83)。在实施方案中,指导物在与靶RNA结合的区域中包含核糖核苷酸,并且在与Cas效应物结合的区域中包含一个或多个脱氧核糖核苷酸和/或核苷酸类似物。在实施方案中,将脱氧核糖核苷酸和/或核苷酸类似物并入工程化指导物结构中,诸如但不限于茎环区和种子区。在实施方案中,指导物的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸被化学修饰。在实施方案中,指导物的3’或5’端的3-5个核苷酸被化学修饰。在实施方案中,种子区中仅引入较小的修饰,诸如2’-F修饰。在实施方案中,在指导物的3’端引入2’-F修饰。在实施方案中,指导物的5’和/或3’端的三至五个核苷酸用2’-O-甲基(M)、2’-O-甲基3’硫代磷酸酯(MS)、S-约束的乙基(cEt)或2’-O-甲基3’硫代PACE(MSP)进行化学修饰。此种修饰可增强基因组编辑效率(参见Hendel等人,Nat.Biotechnol.(2015)33(9):985-989)。在实施方案中,指导物的所有磷酸二酯键被硫代磷酸酯(PS)取代以增强基因破坏的水平。在实施方案中,指导物的5’和/或3’端的多于五个核苷酸用2’-O-Me、2’-F或S-约束的乙基(cEt)进行化学修饰。此种化学修饰的指导物可介导增强水平的基因破坏(参见Ragdarm等人,0215,PNAS,E7110-E7111)。在实施方案中,指导物被修饰以在其3’和/或5’端包含化学部分。此类部分包括但不限于胺、叠氮化物、炔烃、硫代基、二苯并环辛炔(DBCO)、或罗丹明、肽、核定位序列(NLS)、肽核酸(PNA)、聚乙二醇(PEG)、三甘醇或四甘醇(TEG)。在某些实施方案中,化学部分通过接头诸如烷基链缀合至指导物。在某些实施方案中,化学部分通过接头诸如烷基链缀合至指导物。在实施方案中,修饰的指导物的化学部分可用于将指导物附接至另一个分子,诸如DNA、RNA、蛋白质或纳米粒子。此种化学修饰的指导物可用于鉴定或富集由CRISPR系统一般性编辑的细胞(参见Lee等人,eLife,2017,6:e25312,DOI:10.7554)。
在实施方案中,3’端和5’端各自的3个核苷酸被化学修饰。在一个具体的实施方案中,修饰包括2’-O-甲基或硫代磷酸酯类似物。在一个具体的实施方案中,四环中的12个核苷酸和茎环区中的16个核苷酸被2’-O-甲基类似物替换。此类化学修饰改善了体内编辑和稳定性(参见Finn等人,Cell Reports(2018),22:2227-2235)。在实施方案中,指导物的多于60或70个核苷酸被化学修饰。在实施方案中,这种修饰包括用2’-O-甲基或2’-氟核苷酸类似物替换核苷酸或者磷酸二酯键的硫代磷酸酯(PS)修饰。在实施方案中,化学修饰包括当形成CRISPR复合物时延伸至核酸酶蛋白外部的指导核苷酸的2’-O-甲基或2’-氟修饰,或指导物的3’末端的20至30个或更多个核苷酸的PS修饰。在一个特定的实施方案中,化学修饰还包括在指导物的5’端的2’-O-甲基类似物或在种子和尾部区域的2’-氟类似物。此类化学修饰提高了对核酸酶降解的稳定性,并维持或增强了基因组编辑活性或效率,但所有核苷酸的修饰可能消除指导物的功能(参见Yin等人,Nat.Biotech.(2018),35(12):1179-1187)。可通过对CRISPR复合物的结构的了解,包括对有限数量的核酸酶和RNA 2’-OH相互作用的了解,来指导此类化学修饰(参见Yin等人,Nat.Biotech.(2018),35(12):1179-1187)。在实施方案中,一个或多个指导RNA核苷酸可被DNA核苷酸替换。在实施方案中,5’端尾部/种子指导区的至多2、4、6、8、10或12个RNA核苷酸被DNA核苷酸替换。在实施方案中,3’端的大多数指导RNA核苷酸被DNA核苷酸替换。在特定的实施方案中,3’端的16个指导RNA核苷酸被DNA核苷酸替换。在特定的实施方案中,5’端尾部/种子区的8个指导RNA核苷酸和3’端的16个指导RNA核苷酸被DNA核苷酸替换。在特定的实施方案中,当形成CRISPR复合物时,延伸到核酸酶蛋白外部的指导RNA核苷酸被DNA核苷酸替换。与未修饰的指导物相比,此种用DNA核苷酸替换多个RNA核苷酸导致脱靶活性降低,但在靶活性相似;然而,3’端所有RNA核苷酸的替换可能消除指导物的功能(参见Yin等人,Nat.Chem.Biol.(2018)14,311-316)。可通过对CRISPR复合物的结构的了解,包括对有限数量的核酸酶和RNA 2’-OH相互作用的了解,来指导此类修饰(参见Yin等人,Nat.Chem.Biol.(2018)14,311-316)。
在实施方案中,指导分子形成具有单独的非共价连接序列的茎环,所述序列可以是DNA或RNA。在特定的实施方案中,首先使用标准亚磷酰胺合成方案来合成形成指导物的序列(Herdewijn,P.,编,Methods in Molecular Biology Col 288,OligonucleotideSynthesis:Methods and Applications,Humana Press,New Jersey(2012))。在实施方案中,可使用本领域已知的标准方案将这些序列官能化以含有用于连接的适当官能团(Hermanson,G.T.,Bioconjugate Techniques,Academic Press(2013))。官能团的实例包括但不限于羟基、胺、羧酸、羧酸卤化物、羧酸活性酯、醛、羰基、氯羰基、咪唑基羰基、酰肼、氨基脲、硫代氨基脲、硫醇、马来酰亚胺、卤代烷基、磺酰基、烯丙基(ally)、炔丙基、二烯、炔烃和叠氮化物。一旦此序列被官能化,就可在此序列与正向重复序列之间形成共价化学键或键联。化学键的实例包括但不限于基于以下的那些:氨基甲酸酯、醚、酯、酰胺、亚胺、脒、氨基三嗪、腙、二硫化物、硫醚、硫酯、硫代磷酸酯、二硫代磷酸酯、磺酰胺、磺酸酯、砜、亚砜、脲、硫脲、酰肼、肟、三唑、光不稳定键联、C-C键形成基团诸如Diels-Alder环加成对或闭环复分解对和迈克尔(Michael)反应对。
在实施方案中,这些茎环形成序列可以是化学合成的。在实施方案中,化学合成使用利用2’-乙酰氧基乙基原酸酯(2’-ACE)(Scaringe等人,J.Am.Chem.Soc.(1998)120:11820-11821;Scaringe,Methods Enzymol.(2000)317:3-18)或2’-硫羰基氨基甲酸酯(2’-TC)化学(Dellinger等人,J.Am.Chem.Soc.(2011)133:11540-11546;Hendel等人,Nat.Biotechnol.(2015)33:985-989)的自动化固相寡核苷酸合成机。
在实施方案中,指导分子包含(1)能够与靶基因座杂交的指导序列和(2)tracr配对序列或正向重复序列,由此所述正向重复序列位于指导序列的上游(即,5’)或下游(即3’)。在一个特定的实施方案中,指导序列的种子序列(即对于识别靶基因座处的序列和/或与靶基因座处的序列杂交至关重要的序列)大致位于指导序列的前10个核苷酸内。
在一个特定的实施方案中,指导分子包含与正向重复序列连接的指导序列,其中正向重复序列包含一个或多个茎环或优化的二级结构。在特定的实施方案中,正向重复序列具有16nt的最小长度和单个茎环。在其他实施方案中,正向重复序列的长度大于16nt,优选大于17nt,并且具有多于一个茎环或优化的二级结构。在特定的实施方案中,指导分子包含与全部或部分的天然正向重复序列连接的指导序列或由所述指导序列组成。CRISPR-cas指导分子包含(在3’至5’方向上或在5’至3’方向上):指导序列、第一互补段(“重复序列”)、环(其通常为4或5个核苷酸长)、第二互补段(与重复序列互补的“反重复序列”)和poly A(在RNA中通常为poly U)尾部(终止子)。在实施方案中,正向重复序列保留其天然构造并形成单个茎环。在特定的实施方案中,指导物构造的某些方面可例如通过特征的添加、减去或取代来修饰,而指导物构造的某些其他方面得以保持。工程化指导分子修饰(包括但不限于插入、缺失和取代)的优选位置,包括指导物末端以及指导分子在与CRISPR-Cas蛋白和/或靶标复合时暴露的区域,例如正向重复序列的茎环。
在特定的实施方案中,茎包含至少约4bp,其包含互补的X和Y序列,但是也考虑具有更多个(例如5、6、7、8、9、10、11或12个)或更少个(例如3、2个)碱基对的茎。因此,可考虑例如X2-10和Y2-10(其中X和Y代表核苷酸的任何互补集合)。在一个方面,由X和Y核苷酸构成的茎与环一起将在整体二级结构中形成完整发夹;并且,这可能是有利的而且碱基对的量可以是任何形成完整发夹的量。在一个方面,任何互补的X:Y碱基配对序列(例如,关于长度)都是容许的,只要整个指导分子的二级结构得以保留即可。在一个方面,连接由X:Y碱基对构成的茎的环可以是相同长度(例如,4或5个核苷酸)或更长的任何序列,其不妨碍指导分子的整体二级结构。在一个方面,茎环还可包含例如MS2适体。在一个方面,茎包含约5-7bp,其包含互补的X和Y序列,但是也考虑具有更多个或更少个碱基对的茎。在一个方面,考虑了非沃森克里克碱基配对,其中此种配对原本通常保留茎环在所述位置处的构造。
在特定的实施方案中,指导分子的天然发夹或茎环结构被延伸或被延伸的茎环替换。已经证明,茎的延伸可增强指导分子与CRISPR-Cas蛋白的组装(Chen等人Cell.(2013);155(7):1479–1491)。在特定的实施方案中,茎环的茎延伸至少1、2、3、4、5或更多个互补碱基对(即对应于在指导分子中添加2、4、6、8、10或更多个核苷酸)。在特定的实施方案中,这些碱基对位于茎的端部,与茎环的环相邻。
在特定的实施方案中,可通过稍微修饰指导分子的序列而不影响其功能来降低指导分子对RNA酶的敏感性或对降低的表达的敏感性。例如,在特定的实施方案中,可通过修饰指导分子序列中推定的Pol-III终止子(4个连续的U)来去除转录的提前终止,诸如U6Pol-III的提前转录。在指导分子的茎环中需要此种序列修饰的情况下,优选通过碱基对翻转来确保。
在一个特定的实施方案中,正向重复序列可被修饰以包含一个或多个蛋白结合RNA适体。在一个特定的实施方案中,可包括一个或多个适体,诸如优化的二级结构的一部分。此类适体可能能够结合如本文进一步详述的噬菌体外壳蛋白。
在实施方案中,指导分子与包含至少一个待编辑的靶胞嘧啶残基的靶RNA形成双链体。在指导RNA分子与靶RNA杂交后,胞苷脱氨酶与双链体中的可由于指导序列中的错配而接近的单链RNA结合,并催化包含在错配核苷酸段内的一个或多个靶胞嘧啶残基的脱氨基作用。
可选择指导序列并因此选择核酸靶向指导RNA以靶向任何靶核酸序列。靶序列可以是mRNA。
在实施方案中,靶序列应与以下缔合:PAM(原间隔子相邻基序),即由CRISPR复合物识别的短序列。根据CRISPR-Cas蛋白的性质,应当选择所述靶序列,使得其在DNA双链体中的互补序列(本文中也称为非靶序列)在PAM的上游或下游。在实施方案中,靶序列的互补序列在PAM的下游或3’或PAM的上游或5’处。PAM的精确序列和长度要求因所使用的Cas蛋白而异,但PAM通常是与原间隔子(即靶序列)相邻的2-5个碱基对序列。
此外,对PAM相互作用(PI)结构域的工程化可允许对PAM特异性进行编程,改善靶位点识别保真度,并增加CRISPR-Cas蛋白的多功能性,例如如Kleinstiver BP等人Engineered CRISPR-Cas9 nucleases with altered PAM specificities.Nature.2015年7月23日;523(7561):481-5.doi:10.1038/nature14592中关于Cas9所述。如本文进一步详述的,本领域技术人员将理解Cas蛋白可类似地修饰。
在特定的实施方案中,指导物是护送的指导物。“护送的”意指将CRISPR-Cas系统或复合物或指导物递送至细胞内的选定时间或位置,从而在空间上或时间上控制CRISPR-Cas系统或复合物或指导物的活性。例如,CRISPR-Cas系统或复合物或指导物的活性和目的可由对适体配体(诸如细胞表面蛋白或其他局部细胞组分)具有结合亲和力的护送RNA适体序列控制。可替代地,护送适体可例如响应于细胞上或细胞中的适体效应物,诸如瞬时效应物,诸如在特定时间施加到细胞的外部能量源。
护送的CRISPR-Cas系统或复合物具有指导分子,所述指导分子的功能结构被设计成改善指导分子结构、构造、稳定性、遗传表达或其任何组合。此种结构可包括适体。
适体是可被设计或选择成与其他配体紧密结合的生物分子,例如使用称为通过指数富集的配体系统进化的技术(SELEX;Tuerk C,Gold L:“Systematic evolution ofligands by exponential enrichment:RNA ligands to bacteriophage T4 DNApolymerase.”Science 1990,249:505-510)。核酸适体可例如选自随机序列寡核苷酸池,其对范围广泛的生物医学相关靶标具有高结合亲和力和特异性,表明了对适体的范围广泛的治疗效用(Keefe,Anthony D.,Supriya Pai和Andrew Ellington."Aptamers astherapeutics."Nature Reviews Drug Discovery 9.7(2010):537-550)。这些特征还表明适体作为药物递送媒介物的范围广泛的用途(Levy-Nissenbaum,Etgar等人"Nanotechnology and aptamers:applications in drug delivery."Trends inbiotechnology 26.8(2008):442-449;以及Hicke BJ,Stephens AW.“Escort aptamers:adelivery service for diagnosis and therapy.”J Clin Invest 2000,106:923-928.)。还可构建用作分子开关的适体,其通过改变特性来作出响应,诸如结合荧光团以模拟绿色荧光蛋白活性的RNA适体(Paige,Jeremy S.,Karen Y.Wu和Samie R.Jaffrey."RNA mimicsof green fluorescent protein."Science 333.6042(2011):642-646)。还已经提出,适体可用作靶向siRNA治疗性递送系统的组分,例如靶向细胞表面蛋白(Zhou,Jiehua和JohnJ.Rossi."Aptamer-targeted cell-specific RNA interference."Silence 1.1(2010):4)。
因此,在特定的实施方案中,例如通过一个或多个适体来修饰指导分子,所述一个或多个适体被设计成改善指导分子递送,包括跨细胞膜的递送、递送至细胞内区室或递送至核中。除了一个或多个适体之外或在不含此类一个或多个适体的情况下,此种结构还可包括一个或多个部分,以使得指导分子可递送、可诱导或响应于选定的效应物。所述系统包括响应于正常或病理生理条件(包括但不限于pH、缺氧、O2浓度、温度、蛋白质浓度、酶浓度、脂质结构、光暴露、机械破坏(例如超声波)、磁场、电场或电磁辐射)的指导分子。
可通过隐花色素-2和CIB1的激活和结合来实现诱导型系统的光响应性。蓝光刺激诱导隐花色素-2的激活构象变化,从而导致其结合配偶体CIB1的募集。这种结合可以是快速且可逆的,在脉冲刺激后<15秒内达到饱和,并且在刺激结束后<15min恢复到基线。这些快速结合动力学导致系统在时间上仅受转录/翻译和转录/蛋白质降解速度的约束,而不受诱导剂的摄取和清除的约束。隐花色素-2激活也是高度敏感的,从而允许使用低光强度刺激并降低光毒性的风险。此外,在诸如完整的哺乳动物脑的上下文中,可变光强度可用于控制受刺激区域的大小,从而允许比单独的载体递送可提供的精确度更高的精确度。
能量源可以是电磁辐射、声能或热能以诱导指导物。有利地,电磁辐射可以是可见光的组分。在实施方案中,光是波长为约450至约495nm的蓝光。在实施方案中,波长为约488nm。在另一个优选的实施方案中,光刺激是通过脉冲进行的。光功率可在约0-9mW/cm2的范围内。在一个优选的实施方案中,每15秒低至0.25秒的刺激范式应导致最大激活。
化学或能量敏感性指导物可在诱导时通过与化学源的结合或通过能量而发生构象变化,从而允许其充当指导物并具有CRISPR-Cas系统或复合物功能。本公开可涉及应用化学源或能量以具有指导功能和CRISPR-Cas系统或复合物功能;并且任选地进一步确定基因组基因座的表达被改变。
这种化学可诱导系统存在若干种不同的设计:1.可由脱落酸(AB A)诱导的基于ABI-PYL的系统(参见例如,stke.sciencemag.org/cgi/co ntent/abstract/sigtrans;4/164/rs2),2.可由雷帕霉素(或基于雷帕霉素的相关化学物质)诱导的基于FKBP-FRB的系统(参见例如,www.nature.com/nmeth/journal/v2/n6/full/nmeth763.html),3.可由赤霉素(GA)诱导的基于GID1-GAI的系统(参见例如,www.nature.com/nchembio/journ al/v8/n5/full/nchembio.922.html)。
化学诱导型系统可以是可由4-羟基他莫昔芬(4OHT)诱导的基于雌激素受体(ER)的系统(参见例如,www.pnas.org/content/104/3/1027.abstract)。称为ERT2的雌激素受体的突变的配体结合结构域在与4-羟基他莫昔芬结合后易位到细胞核中。在其他实施方案中,任何核受体、甲状腺激素受体、视黄酸受体、雌激素受体、雌激素相关受体、糖皮质激素受体、孕酮受体、雄激素受体的任何天然存在的或工程化的衍生物可用于与基于ER的诱导型系统类似的诱导型系统中。
另一种诱导型系统可基于使用可由能量、热或无线电波诱导的基于瞬态受体电位(TRP)离子通道的系统的设计(参见例如,www.sciencemag.org/content/336/6081/604)。这些TRP家族蛋白响应于不同的刺激(包括光和热)。当这种蛋白质被光或热激活时,离子通道将打开并允许诸如钙的离子进入质膜中。离子的这种流入将结合到与多肽连接的细胞内离子相互作用配偶体,所述多肽包括指导物和CRISPR-Cas复合物或系统的其他组分,并且所述结合将诱导所述多肽的亚细胞定位的变化,从而导致整个多肽进入细胞核。一旦进入细胞核,指导蛋白和CRISPR-Cas复合物的其他组分将具活性并调节细胞中的靶基因表达。
虽然光激活可以是有利的实施方案,但有时它可能是不利的,尤其是对于光不能穿透皮肤或其他器官的体内应用。在这种情况下,考虑了其他能量激活方法,特别是具有类似作用的电场能量和/或超声。
优选地,在体内条件下使用一个或多个约1伏特/cm至约10千伏特/cm的电脉冲,基本上如本领域中所述施用电场能量。代替脉冲或除了脉冲之外,可以连续的方式递送电场。电脉冲可施加持续1μs与500毫秒之间,优选1μs与100毫秒之间。可连续地或以脉冲方式施加电场持续约5分钟。
如本文所用,‘电场能量’是细胞暴露于其中的电能。优选地,在体内条件下,电场的强度为约1伏特/cm至约10千伏特/cm或更高(参见国际专利公布号WO 97/49450)。
如本文所用,术语“电场”包括一个或多个脉冲,其处于可变电容和电压下并且包括指数波和/或方波和/或调制波和/或调制方波形式。对电场和电的提及应被认为包括对电池环境中存在电势差的提及。如本领域中已知的,可通过静电、交流电(AC)、直流电(DC)等来建立此种环境。电场可以是均匀的、不均匀的或其他方式,并且可以时间依赖性方式改变强度和/或方向。
电场的单次或多次施加以及超声的单次或多次施加也是可能的,可呈任何顺序和任何组合。超声和/或电场可作为单次或多次连续施加或作为脉冲(脉动递送)来递送。
电穿孔已用于体外和体内程序中,以将外来物质引入活细胞中。在体外应用中,首先将活细胞样品与目标剂混合并放置在电极诸如平行板之间。然后,电极向细胞/植入物混合物施加电场。进行体外电穿孔的系统的实例包括Electro Cell Manipulator ECM600产品和Electro Square Porator T820,两者均由Genetronics,Inc的BTX部门制造(参见美国专利号5,869,326)。
已知的电穿孔技术(体外和体内)通过向位于治疗区域周围的电极施加短暂的高压脉冲而起作用。电极之间产生的电场使细胞膜暂时变为多孔的,于是目标剂的分子进入细胞。在已知的电穿孔应用中,这种电场包括大约1000V/cm的单个方波脉冲,持续时间为约100μs。例如,在Electro Square Porator T820的已知应用中可产生此种脉冲。
优选地,在体外条件下,电场的强度为约1V/cm至约10kV/cm。因此,电场的强度可为1V/cm、2V/cm、3V/cm、4V/cm、5V/cm、6V/cm、7V/cm、8V/cm、9V/cm、10V/cm、20V/cm、50V/cm、100V/cm、200V/cm、300V/cm、400V/cm、500V/cm、600V/cm、700V/cm、800V/cm、900V/cm、1kV/cm、2kV/cm、5kV/cm、10kV/cm、20kV/cm、50kV/cm或更高。在体外条件下,更优选约0.5kV/cm至约4.0kV/cm。优选地,在体内条件下,电场的强度为约1V/cm至约10kV/cm。然而,在递送到靶位点的脉冲数量增加的情况下,电场强度可能会降低。因此,设想在较低场强度下电场的脉动递送。
优选地,电场的施加形式呈多个脉冲的形式,诸如具有相同强度和电容的双脉冲或具有不同强度和/或电容的连续脉冲。如本文所用,术语“脉冲”包括一个或多个电脉冲,其处于可变电容和电压下并且包括指数波和/或方波和/或调制波/方波形式。
优选地,电脉冲作为选自指数波形式、方波形式、调制波形式和调制方波形式的波形来递送。
一个优选的实施方案采用低压直流电。因此,申请人公开了电场的使用,所述电场以1V/cm与20V/cm之间的场强度施加到细胞、组织或组织块,持续100毫秒或更长,优选15分钟或更长的时间段。
超声有利地以约0.05W/cm2至约100W/cm2的功率水平施用。可使用诊断或治疗超声或其组合。
如本文所用,术语“超声”是指由机械振动组成的能量形式,所述机械振动的频率高到超出人类听力的范围。超声频谱的频率下限通常可取为约20kHz。超声的大多数诊断应用采用在1和15MHz'范围内的频率(来自Ultrasonics in Clinical Diagnosis,P.N.T.Wells编,第2版,Publ.Churchill Livingstone[Edinburgh,London&NY,1977])。
超声已用于诊断和治疗应用。当用作诊断工具(“诊断超声”)时,超声通常在至多约100mW/cm2(FDA推荐)的能量密度范围内使用,尽管已使用了高达750mW/cm2的能量密度。在物理疗法中,超声通常用作高达约3至4W/cm2范围内的能量源(WHO推荐)。在其他治疗应用中,可采用更高强度的超声,例如,100W/cm至1kW/cm2(或甚至更高)的HIFU,持续短时间段。如本说明书中使用的术语“超声”旨在涵盖诊断、治疗和聚焦超声。
聚焦超声(FUS)允许在不使用侵入性探针的情况下递送热能(参见Morocz等人1998Journal of Magnetic Resonance Imaging第8卷,第1期,第136-142页)。聚焦超声的另一种形式是高强度聚焦超声(HIFU),其由Moussatov等人在Ultrasonics(1998)第36卷,第8期,第893-900页和TranHuuHue等人在Acustica(1997)第83卷,第6期,第1103-1106页中进行了综述。
优选地,采用诊断超声和治疗超声的组合。然而,这种组合并非旨在进行限制,并且本领域读者将理解,可使用超声的任何多种组合。另外,可改变能量密度、超声频率和暴露时间段。
优选地,暴露于超声能量源的功率密度为约0.05至约100Wcm-2。甚至更优选地,暴露于超声能量源的功率密度为约1至约15Wcm-2。
优选地,暴露于超声能量源的频率为约0.015至约10.0MHz。更优选地,暴露于超声能量源的频率为约0.02至约5.0MHz或约6.0MHz。最优选地,以3MHz的频率施加超声。
优选地,暴露持续约10毫秒至约60分钟的时间段。优选地,暴露持续约1秒至约5分钟的时间段。更优选地,施加超声持续约2分钟。然而,根据待破坏的特定靶细胞,暴露可持续更长的持续时间,例如持续15分钟。
有利地,靶组织暴露于声功率密度为约0.05Wcm-2至约10Wcm-2且频率范围为约0.015至约10MHz的超声能量源(参见WO 98/52609)。然而,替代方案也是可能的,例如,暴露于声功率密度高于100Wcm-2的超声能量源,但是对于缩短的时间段,例如对于毫秒范围或更短的时间段,暴露于声功率密度高于1000Wcm-2的超声能量源。
优选地,超声的施加呈多个脉冲的形式;因此,可以采用任何组合的连续波和脉冲波(超声的脉动递送)。例如,可施加连续波超声,之后施加脉冲波超声,或反之亦然。可以任何顺序和组合将其重复任何次数。可在连续波超声的背景下施加脉冲波超声,并且可以任何数量的组使用任何数量的脉冲。
优选地,超声可包括脉冲波超声。在一个高度优选的实施方案中,以0.7Wcm-2或1.25Wcm-2的功率密度作为连续波施加超声。如果使用脉冲波超声,则可采用更高的功率密度。
使用超声是有利的,因为像光一样,超声可精确地聚焦在靶标上。此外,超声是有利的,因为与光不同,它可以更深地聚焦到组织中。因此它更适合于全组织穿透(诸如但不限于肝叶)或整个器官(诸如但不限于整个肝脏或整个肌肉,诸如心脏)治疗。另一个重要的优点是超声是一种非侵入性刺激,其可用于各种诊断和治疗应用。例如,超声在医学成像技术中以及另外在骨科治疗中是众所周知的。此外,适用于将超声施加到受试脊椎动物的仪器是广泛可获得的,并且它们的使用在本领域中是众所周知的。
在特定的实施方案中,指导分子被二级结构修饰以增加CRISPR-Cas系统的特异性,并且所述二级结构可保护指导序列免受核酸外切酶活性并允许指导序列的5’添加,所述指导序列在本文中也称为受保护的指导分子。
在一个方面,本公开提供了将“保护RNA”与指导分子的序列杂交,其中“保护RNA”是与指导分子的3’端互补的RNA链,从而产生部分双链指导RNA。在实施方案中,用完全互补的保护序列保护错配的碱基(即指导分子的不形成指导序列的一部分的碱基)降低了靶RNA与3’端错配碱基对结合的可能性。在特定的实施方案中,在指导分子内还可存在包含延长长度的另外的序列,使得所述指导物在指导分子内包含保护序列。此“保护序列”确保指导分子除了“暴露的序列”(包含指导序列的与靶序列杂交的部分)之外还包含“受保护的序列”。在特定的实施方案中,通过保护指导物的存在修饰指导分子以包含二级结构,诸如发夹。有利地,存在三个或四个至三十个或更多个,例如约10个或更多个具有与受保护的序列、指导序列或两者互补性的连续碱基对。有利的是,受保护的部分不会妨碍CRISPR-Cas系统与其靶标相互作用的热力学。通过提供此种包括部分双链的指导分子的延伸,所述指导分子被认为是受保护的并且导致CRISPR-Cas复合物的特异性结合得到改善,同时保持特异性活性。
在特定的实施方案中,使用截短的指导物(tru-指导物),即包含的指导序列的长度相对于规范指导序列的长度被截短的指导分子。如Nowak等人(Nucleic Acids Res(2016)44(20):9555-9564)所述,此类指导物可允许具有催化活性的CRISPR-Cas酶结合其靶标而不切割靶RNA。在特定的实施方案中,使用截短的指导物,其允许与靶标的结合,但仅保留CRISPR-Cas酶的切口酶活性。
本文提供的方法和工具以某些Cas效应物为例。可使用本领域中描述的方法鉴定具有相似特性的其他核酸酶(Shmakov等人2015,60:385–397;Abudayeh等人2016,Science,5;353(6299))。在特定的实施方案中,用于鉴定新型CRISPR效应蛋白的此类方法可包括以下步骤:从数据库中选择编码鉴定CRISPR Cas基因座的存在的种子的序列,鉴定选定序列中位于包含开放阅读框(ORF)的种子的10kb内的基因座,从中选择包含ORF的基因座,其中只有单个ORF编码具有超过700个氨基酸且与已知CRISPR效应物具有不超过90%同源性的新型CRISPR效应物。在特定的实施方案中,种子是CRISPR-Cas系统共有的蛋白质,诸如Cas1。在其他实施方案中,CRISPR阵列用作种子以鉴定新的效应蛋白。
此外,“Dimeric CRISPR RNA-guided FokI nucleases for highly specificgenome editing”,Shengdar Q.Tsai,Nicolas Wyvekens,Cyd Khayter,JenniferA.Foden,Vishal Thapar,Deepak Reyon,Mathew J.Goodwin,Martin J.Aryee,J.KeithJoung Nature Biotechnology 32(6):569-77(2014),涉及二聚体RNA指导的FokI核酸酶,所述核酸酶识别延伸序列并可在人细胞中高效编辑内源性基因。
关于CRISPR-Cas系统、其组分和此类组分的递送的一般信息,包括方法、材料、递送媒介物、载体、粒子、AAV及其制造和使用,包括关于数量和配方、在本发明的实践中所有有用者,参考:美国专利号8,697,359、8,771,945、8,795,965、8,865,406、8,871,445、8,889,356、8,889,418、8,895,308、8,906,616、8,932,814、8,945,839、8,993,233和8,999,641;美国专利申请US 2014-0310830 A1(美国申请序列号14/105,031)、US 2014-0287938A1(美国申请序列号14/213,991)、US 2014-0273234 A1(美国申请序列号14/293,674)、US2014-0273232 A1(美国申请序列号14/290,575)、US 2014-027323 A1(美国申请序列号14/259,420)、US 2014-0256046 A1(美国申请序列号14/226,274)、US 2014-0248702 A1(美国申请序列号14/258,458)、US 2014-0242700 A1(美国申请序列号14/222,930)、US2014-0242699A1(美国申请序列号14/183,512)、US 2014-0242664 A1(美国申请序列号14/104,990)、US 2014-0234972 A1(美国申请序列号14/183,471)、US 2014-0227787 A1(美国申请序列号14/256,912)、US 2014-0189896 A1(美国申请序列号14/105,035)、US 2014-0186958 A1(美国申请序列号14/105,017)、US 2014-0186919 A1(美国申请序列号14/104,977)、US 2014-0186843 A1(美国申请序列号14/104,900)、US 2014-0179770 A1(美国申请序列号14/104,837)和US 2014-0179006A1(美国申请序列号14/183,486)、US 2014-0170753 A1(美国申请序列号14/183,429);US 2015-0184139(美国申请序列号14/324,960);14/054,414欧洲专利申请EP 2771468(EP13818570.7)、EP 27 64103(EP13824232.6)和EP 2784162(EP14170383.5);以及PCT专利公布WO 2014/093661(PCT/US2013/074743)、WO 2014/093694(PCT/US2013/074790)、WO 2014/093595(PCT/US2013/074611)、WO 2014/093718(PCT/US2013/074825)、WO 2014/093709(PCT/US2013/074812)、WO 2014/093622(PCT/US2013/074667)、WO 2014/093635(PCT/US2013/074691)、WO 2014/093655(PCT/US2013/074736)、WO 2014/093712(PCT/US2013/074819)、WO 2014/093701(PC T/US2013/074800)、WO 2014/018423(PCT/US2013/051418)、WO 2014/204723(PCT/US2014/041790)、WO 2014/204724(PCT/US2014/041800)、WO 2014/204725(PCT/US2014/041803)、WO 2014/204726(PCT/US2014/041804)、WO 2014/204727(PCT/US2014/041806)、WO 2014/204728(PCT/US2014/041808)、WO 2014/204729(PCT/US 2014/041809)、WO 2015/089351(PCT/US2014/069897)、WO 2015/089354(PCT/US2014/069902)、WO 2015/089364(PCT/US2014/069925)、WO 2015/089427(PCT/US2014/070068)、WO 2015/089462(PCT/US2014/070127)、WO 2015/089419(PCT/US2014/070057)、WO 2015/089465(PCT/US2014/070135)、WO 2015/089486(PCT/US2014/070175)、PCT/US2015/051691、PCT/US2015/051830。
还参考了分别于2013年1月30日;2013年3月15日;2013年3月28日;2013年4月20日;2013年5月6日和2013年5月28日提交的美国临时申请号61/758,468;61/802,174;61/806,375;61/814,263;61/819,803和61/828,130。还参考了2013年6月17日提交的美国临时申请号61/836,123。另外参考了各自于2013年6月17日提交的美国临时申请号61/835,931、61/835,936、61/835,973、61/836,080、61/836,101和61/836,127。进一步参考了2013年8月5日提交的美国临时申请号61/862,468和61/862,355;2013年8月28日提交的美国临时申请号61/871,301;2013年9月25日提交的美国临时申请号61/960,777和2013年10月28日提交的美国临时申请号61/961,980。此外又进一步参考了2014年10月28日提交的国际专利申请号PCT/US2014/62558和美国临时专利申请号61/915,148、61/915,150、61/915,153、61/915,203、61/915,251、61/915,301、61/915,267、61/915,260和61/915,397,各自于2013年12月12日提交;61/757,972和61/768,959,于2013年1月29日和2013年2月25日提交;62/010,888和62/010,879,均于2014年6月11日提交;62/010,329、62/010,439和62/010,441,各自于2014年6月10日提交;61/939,228和61/939,242,各自于2014年2月12日提交;61/980,012,于2014年4月15日提交;62/038,358,于2014年8月17日提交;62/055,484、62/055,460和62/055,487,各自于2014年9月25日提交;以及62/069,243,于2014年10月27日提交。参考了2014年6月10日提交的PCT申请,尤其指定美国申请号PCT/US14/41806。参考了2014年1月22日提交的美国临时申请号61/930,214。参考了2014年6月10日提交的PCT申请,尤其指定美国申请号PCT/US14/41806。
还提及了2015年6月17日提交的美国临时申请号62/180,709,PROTECTED GUIDERNAS(PGRNAS);2014年12月12日提交的美国临时申请号62/091,455,PROTECTED GUIDERNAS(PGRNA S);2014年12月24日提交的美国临时申请号62/096,708,PROTEC TED GUIDERNAS(PGRNAS);2014年12月12日提交的美国临时申请号62/091,462、2014年12月23日提交的美国临时申请号62/096,324、2015年6月17日提交的美国临时申请号62/180,681和2015年10月5日提交的美国临时申请号62/237,496,DEAD GUIDES FOR CRISPR TRANSCRIPTIONFACTORS;2014年12月12日提交的美国临时申请号62/091,456和2015年6月17日提交的美国临时申请号62/180,692,ESCORTED AND FUNCTIONALIZED GUIDES FOR CRISPR-CASSYSTEMS;2014年12月12日提交的美国临时申请号62/091,461,DELIVERY,USE ANDTHERAPEUTIC APPLI CATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIO NS FORGENOME EDITING AS TO HEMATOPOETIC STEM C ELLS(HSCs);2014年12月19日提交的美国临时申请号62/094,903,UNBIASED IDENTIFICATION OF DOUBLE-STRAND BREAKS ANDGENOMIC REARRANGEMENT BY GENOME-WISE INSER T CAPTURE SEQUENCING;2014年12月24日提交的美国临时申请号62/096,761,ENGINEERING OF SYSTEMS,METHODS AND OPTIMIZEDENZYME AND GUIDE SCAFFOLDS FOR SEQUEN CE MANIPULATION;2014年12月30日提交的美国临时申请号62/098,059、2015年6月18日提交的美国临时申请号62/181,641和2015年6月18日提交的美国临时申请号62/181,667,RNA-TARGETI NG SYSTEM;2014年12月24日提交的美国临时申请号62/096,656和2015年6月17日提交的美国临时申请号62/181,151,CRISPRHAVING OR ASSOCIATED WITH DESTABILIZATION DOMAIN S;2014年12月24日提交的美国临时申请号62/096,697,CRISPR HAVING OR ASSOCIATED WITH AAV;2014年12月30日提交的美国临时申请号62/098,158,ENGINEERED CRISPR COMPLEX INSERTIONAL TARGETINGSYSTEMS;2015年4月22日提交的美国临时申请号62/151,052,CELLULAR TARGETING FOREXTR ACELLULAR EXOSOMAL REPORTING;2014年9月24日提交的美国临时申请号62/054,490,DELIVERY,USE AND THERAPEUTI C APPLICATIONS OF THE CRISPR-CAS SYSTEMS ANDCOM POSITIONS FOR TARGETING DISORDERS AND DISEASES US ING PARTICLE DELIVERYCOMPONENTS;2014年2月12日提交的美国临时申请号61/939,154,SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMI ZED FUNCTIONAL CRISPR-CASSYSTEMS;2014年9月25日提交的美国临时申请号62/055,484,SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMI ZED FUNCTIONAL CRISPR-CASSYSTEMS;2014年12月4日提交的美国临时申请号62/087,537,SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMI ZED FUNCTIONAL CRISPR-CASSYSTEMS;2014年9月24日提交的美国临时申请号62/054,651,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELINGCOMPETITION OF MULTIPL E CANCER MUTATIONS IN VIVO;2014年10月23日提交的美国临时申请号62/067,886,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSI TIONS FOR MODELING COMPETITION OF MULTIPLE CANCE RMUTATIONS IN VIVO;2014年9月24日提交的美国临时申请号62/054,675和2015年6月17日提交的美国临时申请号62/181,002,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OFTHE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN NEURONAL CELLS/TISSUES;2014年9月24日提交的美国临时申请62/054,528,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OFTHE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN IMMUNE DISEASES OR DISORDERS;2014年9月25日提交的美国临时申请号62/055,454,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS ANDDISEASES USING CELL PENETRATION PEPTIDES(CPP);2014年9月25日提交的美国临时申请号62/055,460,MULTIFUNCTIONAL-CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKEDFUNCTIONAL-CRISPR COMPLEXES;2014年12月4日提交的美国临时申请号62/087,475和2015年6月18日提交的美国临时申请号62/181,690,FUNCTI ONAL SCREENING WITH OPTIMIZEDFUNCTIONAL CRISPR-CAS SYSTEMS;2014年9月25日提交的美国临时申请62/055,487,FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL C RISPR-CAS SYSTEMS;2014年12月4日提交的美国临时申请号62/087,546和2015年6月18日提交的美国临时申请号62/181,687,MULTIFUNCTIONAL CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKEDFUNCTIONAL-CRISPR COMPLEXES;以及2014年12月30日提交的美国临时申请62/098,285,CRISPR MEDIA TED IN VIVO MODELING AND GENETIC SCREENING OF TU MOR GROWTH ANDMETASTASIS。
提及了2015年6月18日提交的美国临时申请号62/181,659和2015年8月19日提交的美国临时申请号62/207,318,ENGINEERING AND OPTIMIZATION OF SYSTEMS,METHODS,ENZYME AND GUIDE SCAFFOLDS OF CAS9 ORTHOLOGS AND VARIANTS FOR SEQUENCEMANIPULATION。提及了2015年6月18日提交的美国临时申请号62/181,663和2015年10月22日提交的美国临时申请号62/245,264,NOVEL CRISPR ENZYMES AND SYSTEMS,2015年6月18日提交的美国临时申请号62/181,675、2015年10月22日提交的美国临时申请号62/285,349、2016年2月17日提交的美国临时申请号62/296,522和2016年4月8日提交的美国临时申请号62/320,231,NOVEL CRISPR ENZYMES AND SYSTEMS,2015年9月24日提交的美国临时申请号62/232,067、2015年12月18日提交的美国申请号14/975,085、欧洲申请号16150428.7、2015年8月16日提交的美国临时申请62/205,733、2015年8月5日提交的美国临时申请62/201,542、2015年7月16日提交的美国临时申请号62/193,507和2015年6月18日提交的美国临时申请号62/181,739,各自的标题为NOVEL CRISPR ENZYMES AND SYSTEMS,以及2015年10月22日提交的美国临时申请号62/245,270,NOVEL CRISPR ENZYMES AND SYSTEMS。还提及了2014年2月12日提交的美国临时申请号61/939,256和2014年12月12日提交的WO 2015/089473(PCT/US2014/070152),各自的标题为ENGINEERING OF SYSTEMS,METHODS ANDOPTIMIZED GUIDE COMPOSITIONS WITH NEW ARCHITECTURES FOR SEQUENCEMANIPULATION。还提及了2015年8月15日提交的国际申请号PCT/US2015/045504、2015年6月17日提交的美国临时申请号62/180,699和2014年8月17日提交的美国临时申请号62/038,358,各自的标题为GENOME EDITING USING CAS9 NICKASES。
另外,提及了PCT申请PCT/US14/70057,代理人参考47627.99.2060和BI-2013/107,标题为“DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CASSYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLEDELIVERY COMPONENTS(要求以下美国临时申请号中的一者或多者或全部的优先权:2014年9月24日提交的62/054,490;2014年6月10日提交的62/010,441;以及各自于2013年12月12日提交的61/915,118、61/915,215和61/915,148)(“the Particle Delivery PCT”),以引用的方式并入本文,以及PCT申请PCT/US14/70127、代理人参考47627.99.2091和BI-2013/101,标题为“DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CASSYSTEMS AND COMPOSITIONS FOR GENOME EDITING“(要求以下美国临时申请号中的一者或多者或全部的优先权:各自于2013年12月12日提交的61/915,176;61/915,192;61/915,215;61/915,107、61/915,145;61/915,148;和61/915,153)(“the Eye PCT”),以引用的方式并入本文,这些参考是关于制备含有sgRNA和Cas蛋白的粒子的方法,所述方法包括将包含sgRNA和Cas效应蛋白(和任选的HDR模板)的混合物与包含以下或基本上由以下组成或由以下组成的混合物混合:表面活性剂、磷脂、可生物降解的聚合物、脂蛋白和醇;以及来自此种方法的粒子。例如,其中Cas蛋白和sgRNA在合适的温度(例如15C-30C,例如20C-25C,例如室温)下以合适的摩尔比(例如3:1至1:3或2:1至1:2或1:1)混合在一起,有利地在无菌的无核酸酶的缓冲液例如1X PBS中持续合适的时间,例如15-45分钟,诸如30分钟。单独地,粒子组分诸如或包含:表面活性剂,例如阳离子脂质,例如1,2-二油酰基-3-三甲基铵-丙烷(DOTAP);磷脂,例如二肉豆蔻酰基磷脂酰胆碱(DMPC);可生物降解的聚合物,诸如乙二醇聚合物或PEG,和脂蛋白,诸如低密度脂蛋白,例如胆固醇,将所述粒子组分溶解在醇中,有利地是C1-6烷基醇,诸如甲醇、乙醇、异丙醇,例如100%乙醇。将两种溶液混合在一起以形成含有Cas9-sgRNA复合物的粒子。因此,可将sgRNA与Cas蛋白预复合,然后将整个复合物配制成粒子。可使用不同摩尔比的已知促进核酸递送到细胞中的不同组分(例如,1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)、1,2-二十四烷酰基-sn-甘油-3-磷酸胆碱(DMPC)、聚乙二醇(PEG)和胆固醇)来制备制剂。例如DOTAP:DMPC:PEG:胆固醇摩尔比可为DOTAP 100、DMPC 0、PEG 0、胆固醇0;或DOTAP 90、DMPC 0、PEG 10、胆固醇0;或DOTAP 90、DMPC 0、PEG 5、胆固醇5。DOTAP 100、DMPC 0、PEG 0、胆固醇0。其他示例性核苷酸结合系统和蛋白质
其他示例性核苷酸结合分子和系统
在实施方案中,核苷酸结合分子可以是不是CRISPR-Cas系统的系统的一个或多个组分。其他核苷酸结合分子的实例可以是转录激活子样效应物核酸酶(TALEN)、锌指核酸酶、大范围核酸酶、其功能片段、其变体或其任何组合的组分。
TALE系统
在一些实施方案中,所述系统中的核苷酸结合分子可以是转录激活子样效应物核酸酶、其功能片段或其变体。本公开还包括作为或编码TALE系统的一种或多种组分的核苷酸序列。如本文所公开的,可通过转录激活子样效应物核酸酶(TALEN)系统进行编辑。转录激活子样效应物(TALE)可被工程化成几乎结合任何所需的DNA序列。使用TALEN系统进行基因组编辑的示例性方法可见于例如Cermak T.Doyle EL.Christian M.Wang L.ZhangY.Schmidt C等人Efficient design and assembly of custom TALEN and other TALeffector-based constructs for DNA targeting.Nucleic Acids Res.2011;39:e82;Zhang F.Cong L.Lodato S.Kosuri S.Church GM.Arlotta P Efficient constructionof sequence-specific TAL effectors for modulating mammalian transcription.NatBiotechnol.2011;29:149–153以及美国专利号8,450,471、8,440,431和8,440,432,所有这些均具体地以引用的方式并入。
在实施方案中,本文提供的包括分离的、非天然存在的、重组的或工程化的DNA结合蛋白,其包含TALE单体作为其组织结构的一部分,所述DNA结合蛋白能够以提高的效率和扩展的特异性靶向核酸序列。
天然存在的TALE或“野生型TALE”是由多个变形菌物种分泌的核酸结合蛋白。TALE多肽含有由高度保守的单体多肽的串联重复序列构成的核酸结合结构域,所述单体多肽的长度主要为33、34或35个氨基酸,并且主要在氨基酸位置12和13上彼此不同。在实施方案中,核酸是DNA。如本文所用,术语“多肽单体”或“TALE单体”将用于指TALE核酸结合结构域内的高度保守的重复多肽序列,并且术语“重复可变二残基”或“RVD”将用于指多肽单体的位置12和13处的高度可变的氨基酸。如整个公开所提供的,RVD的氨基酸残基使用氨基酸的IUPAC单字母代码来描述。包含在DNA结合结构域中的TALE单体的一般表示是X1-11-(X12X13)-X14-33或34或35,其中下标指示氨基酸位置,并且X表示任何氨基酸。X12X13指示RVD。在一些多肽单体中,位置13处的可变氨基酸缺失或不存在,并且在此类多肽单体中,RVD由单个氨基酸组成。在此类情况下,RVD可以可替代地表示为X*,其中X表示X12,并且(*)指示X13不存在。DNA结合结构域包含TALE单体的若干个重复序列,并且这可表示为(X1-11-(X12X13)-X14-33或34或35)z,其中在一个有利的实施方案中,z为至少5至40。在另一有利的实施方案中,z为至少10至26。
TALE单体具有由在其RVD中的氨基酸身份决定的核苷酸结合亲和力。例如,RVD为NI的多肽单体优先结合腺嘌呤(A),RVD为NG的多肽单体优先结合胸腺嘧啶(T),RVD为HD的多肽单体优先结合胞嘧啶(C),并且RVD为NN的多肽单体优先结合腺嘌呤(A)和鸟嘌呤(G)两者。在本发明的又一实施方案中,RVD为IG的多肽单体优先结合T。因此,TALE的核酸结合结构域中多肽单体重复序列的数量和顺序决定了其核酸靶标特异性。在本发明的再其他实施方案中,RVD为NS的多肽单体识别所有四个碱基对并且可结合A、T、G或C。TALE的结构和功能进一步描述于例如Moscou等人,Science326:1501(2009);Boch等人,Science 326:1509-1512(2009);以及Zhang等人,Nature Biotechnology 29:149-153(2011),所述文献各自以引用的方式整体并入。
方法中使用的TALE多肽是分离的、非天然存在的、重组的或工程化的核酸结合蛋白,其具有含有被设计成靶向具体核酸序列的多肽单体重复序列的核酸或DNA结合区。
如本文所述,RVD为HN或NH的多肽单体优先结合鸟嘌呤,并由此允许产生对含有鸟嘌呤的靶核酸序列具有高结合特异性的TALE多肽。在一个优选的实施方案中,具有RVD RN、NN、NK、SN、NH、KN、HN、NQ、HH、RG、KH、RH和SS的多肽单体优先结合鸟嘌呤。在一个更有利的实施方案中,具有RVD RN、NK、NQ、HH、KH、RH、SS和SN的多肽单体优先结合鸟嘌呤,并由此允许产生对含有鸟嘌呤的靶核酸序列具有高结合特异性的TALE多肽。在一个甚至更有利的实施方案中,具有RVD HH、KH、NH、NK、NQ、RH、RN和SS的多肽单体优先结合鸟嘌呤,并由此允许产生对含有鸟嘌呤的靶核酸序列具有高结合特异性的TALE多肽酸。在另一有利的实施方案中,对鸟嘌呤具有高结合特异性的RVD是RN、NH RH和KH。此外,RVD为NV的多肽单体优先结合腺嘌呤和鸟嘌呤。在更优选的实施方案中,RVD为H*、HA、KA、N*、NA、NC、NS、RA和S*的多肽单体以相当的亲和力结合腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶。
核酸或DNA结合结构域的一个或多个多肽单体的预定N末端至C末端顺序决定了TALE多肽将结合的对应预定靶核酸序列。如本文所用,多肽单体和至少一个或多个半多肽单体被“特异性排序成靶向”目标基因组基因座或基因。在植物基因组中,天然的TALE结合位点总是以胸腺嘧啶(T)开头,这可以由TALE多肽的非重复N末端内的隐蔽(cryptic)信号指定;在实施方案中,此区域可称为重复序列0。在动物基因组中,TALE结合位点不一定必须以胸腺嘧啶(T)开头,并且TALE多肽可靶向以T、A、G或C开头的DNA序列。TALE单体的串联重复序列总是以半长重复序列或可能与重复的全长TALE单体的仅前20个氨基酸共享同一性的序列段结束,并且此半重复序列可称为半单体,其包括在术语“TALE单体”中。因此断定,被靶向的核酸或DNA的长度等于全长多肽单体的数量加二。
如Zhang等人,Nature Biotechnology 29:149-153(2011)所述,TALE多肽结合效率可通过在工程化的TALE DNA结合区的N末端或C末端位置处在工程化TALE中包括来自直接位于天然存在的TALE的DNA结合区的N末端或C末端的“加帽区”的氨基酸序列来提高。因此,在实施方案中,本文所述的TALE多肽还包含N末端加帽区和/或C末端加帽区。
N末端加帽区的示例性氨基酸序列是:
C末端加帽区的示例性氨基酸序列是:
如本文所用,N末端加帽区、包含重复TALE单体的DNA结合结构域和C末端加帽区的预定“N末端”至“C末端”方向为d-TALE或多肽中的不同结构域的组织提供结构基础。
整个N末端和/或C末端加帽区并非增强DNA结合区的结合活性所必需的。因此,在实施方案中,N末端和/或C末端加帽区的片段包括在本文所述的TALE多肽中。
在实施方案中,本文所述的TALE多肽含有N末端加帽区片段,其包括N末端加帽区的至少10、20、30、40、50、54、60、70、80、87、90、94、100、102、110、117、120、130、140、147、150、160、170、180、190、200、210、220、230、240、250、260或270个氨基酸。在实施方案中,N末端加帽区片段氨基酸位于N末端加帽区的C末端(DNA结合区近端)。如Zhang等人,NatureBiotechnology29:149-153(2011)所述,包括C末端240个氨基酸的N末端加帽区片段增强了与全长加帽区相等的结合活性,而包括C末端147个氨基酸的片段保留了全长加帽区80%以上的功效,并且包括C末端117个氨基酸的片段保留了全长加帽区50%以上的活性。
在实施方案中,本文所述的TALE多肽含有C末端加帽区片段,其包括C末端加帽区的至少6、10、20、30、37、40、50、60、68、70、80、90、100、110、120、127、130、140、150、155、160、170、180个氨基酸。在实施方案中,C末端加帽区片段氨基酸位于C末端加帽区的N末端(DNA结合区近端)。如Zhang等人,Nature Biotechnology 29:149-153(2011)所述,包括C末端68个氨基酸的C末端加帽区片段增强了与全长加帽区相等的结合活性,而包括C末端20个氨基酸的片段保留了全长加帽区50%以上的功效。
在实施方案中,本文所述的TALE多肽的加帽区不需要具有与本文提供的加帽区序列相同的序列。因此,在实施方案中,本文所述的TALE多肽的加帽区具有与本文提供的加帽区氨基酸序列至少50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同或共享同一性的序列。序列同一性与序列同源性相关。同源性比较可通过肉眼进行,或者更通常的是借助容易获得的序列比较程序进行。这些可商购获得的计算机程序可计算两个或更多个序列之间的同源性百分比(%),并且还可计算两个或更多个氨基酸或核酸序列共享的序列同一性。在一些优选的实施方案中,本文所述的TALE多肽的加帽区具有与本文提供的加帽区氨基酸序列至少95%相同或共享同一性的序列。
序列同源性可由本领域已知的多种计算机程序中的任一种产生,所述计算机程序包括但不限于BLAST或FASTA。也可使用用于进行比对的合适的计算机程序,如GCGWisconsin Bestfit软件包。一旦软件产生了最佳比对,就可以计算%同源性,优选%序列同一性。软件通常将此作为序列比较的一部分并生成数值结果。
在本文所述的实施方案中,TALE多肽包括与一个或多个效应结构域连接的核酸结合结构域。术语“效应结构域”或“调控和功能结构域”是指具有不同于与核酸结合结构域识别的核酸序列结合的活性的多肽序列。通过将核酸结合结构域与一个或多个效应结构域组合,多肽可用于将由效应结构域介导的一种或多种功能或活性靶向核酸结合结构域特异性结合的特定靶DNA序列。
在本文所述的TALE多肽的实施方案中,由效应结构域介导的活性是生物活性。例如,在实施方案中,效应结构域是转录抑制子(即阻遏结构域),诸如mSin相互作用结构域(SID)。SID4X结构域或Krüppel相关框(KRAB)或KRAB结构域的片段。在实施方案中,效应结构域是转录增强子(即激活结构域),诸如VP16、VP64或p65激活结构域。在实施方案中,核酸结合例如与效应结构域连接,所述效应结构域包括但不限于转座酶、整合酶、重组酶、解离酶、转化酶、蛋白酶、DNA甲基转移酶、DNA脱甲基酶、组蛋白乙酰化酶、组蛋白脱乙酰基酶、核酸酶、转录阻遏子、转录激活子、转录因子募集、蛋白质核定位信号或细胞摄取信号。
在实施方案中,效应结构域是表现出活性的蛋白质结构域,所述活性包括但不限于转座酶活性、整合酶活性、重组酶活性、解离酶活性、转化酶活性、蛋白酶活性、DNA甲基转移酶活性、DNA脱甲基酶活性、组蛋白乙酰化酶活性、组蛋白脱乙酰基酶活性、核酸酶活性、核定位信号传导活性、转录阻遏子活性、转录激活子活性、转录因子募集活性或细胞摄取信号传导活性。其他优选的实施方案可包括本文所述的活性的任何组合。
锌指核酸酶
在一些实施方案中,所述系统的核苷酸结合分子可以是锌指核酸酶、其功能片段或其变体。组合物可包含一种或多种锌指核酸酶或编码其的核酸。在实施方案中,核苷酸序列可包含锌指核酸酶的编码序列。用于在本文中使用的其他优选的基因组编辑工具包括锌指系统和TALE系统。人工锌指(ZF)技术提供了一种可编程的DNA结合结构域类型,所述技术涉及ZF模块阵列以靶向基因组中的新DNA结合位点。ZF阵列中的每个指模块靶向三个DNA碱基。将定制的个别锌指结构域的阵列组装成ZF蛋白(ZFP)。
ZFP可包含功能结构域。第一合成锌指核酸酶(ZFN)是通过将ZF蛋白与IIS型限制酶FokI的催化结构域融合而开发的。(Kim,Y.G.等人,1994,Chimeric restrictionendonuclease,Proc.Natl.Acad.Sci.U.S.A.91,883-887;Kim,Y.G.等人,1996,Hybridrestriction enzymes:zinc finger fusions to Fok I cleavage domain.Proc.Natl.Acad.Sci.U.S.A.93,1156-1160)。通过使用配对的ZFN异二聚体,可通过降低脱靶活性来获得增加的切割特异性,每个异二聚体靶向由短间隔子分隔的不同核苷酸序列。(Doyon,Y.等人,2011,Enhancing zinc-finger-nuclease activity with improved obligateheterodimeric architectures.Nat.Methods 8,74-79)。ZFP也可被设计为转录激活子和阻遏子,并且已用于靶向多种生物体中的许多基因。使用ZFN进行基因组编辑的示例性方法可见于例如美国专利号6,534,261、6,607,882、6,746,838、6,794,136、6,824,978、6,866,997、6,933,113、6,979,539、7,013,219、7,030,215、7,220,719、7,241,573、7,241,574、7,585,849、7,595,376、6,903,185和6,479,626,所有专利均具体地以引用的方式并入。
大范围核酸酶
在实施方案中,核苷酸结合结构域可以是大范围核酸酶、其功能片段或其变体。组合物可包含一种或多种大范围核酸酶或编码其的核酸。如本文所公开的,可通过大范围核酸酶进行编辑,所述大范围核酸酶是特征在于大识别位点(12至40个碱基对的双链DNA序列)的脱氧核糖核酸内切酶。在实施方案中,核苷酸序列可包含大范围核酸酶的编码序列。用于使用大范围核酸酶的示例性方法可见于美国专利号:8,163,514;8,133,697;8,021,867;8,119,361;8,119,381;8,124,369;和8,129,134,所述专利具体地以引用的方式并入。
在实施方案中,可在所述方法、组合物和试剂盒中使用核酸酶中的任一种,包括如本文所述的修饰的核酸酶。在特定的实施方案中,可将未修饰的核酸酶的核酸酶活性与如本文所述的修饰的核酸酶中的任一种的核酸酶活性进行比较,以例如比较例如脱靶或在靶效应。可替代地,可比较不同的修饰的核酸酶的核酸酶活性(或如本文所述的修饰的活性),以例如比较例如脱靶或在靶效应。
接头
转座酶和Cas蛋白可通过接头缔合。术语“接头”是指连接蛋白质以形成融合蛋白的分子。通常,此类分子除了连接或保持蛋白质之间的某一最小距离或其他空间关系外,没有特定的生物活性。然而,在实施方案中,可选择接头以影响接头和/或融合蛋白的一些特性,诸如接头的折叠、净电荷或疏水性。
用于本文方法的合适接头包括直链或支链碳接头、杂环碳接头或肽接头。然而,如本文所用,接头也可以是共价键(碳-碳键或碳-杂原子键)。在特定的实施方案中,接头用于将Cas蛋白与转座酶分隔开足以确保每个蛋白质保留其所需功能特性的距离。肽接头序列可采用柔性延伸构象并且不表现出形成有序二级结构的倾向。在实施方案中,接头可以是化学部分,其可以是单体、二聚体、多聚体或聚合体。优选地,接头包含氨基酸。柔性接头中的典型氨基酸包括Gly、Asn和Ser。因此,在特定的实施方案中,接头包含Gly、Asn和Ser氨基酸中的一种或多种的组合。其他近中性氨基酸,诸如Thr和Ala,也可用于接头序列。示例性接头公开于Maratea等人(1985),Gene 40:39-46;Murphy等人(1986)Proc.Nat'l.Acad.Sci.USA 83:8258-62;美国专利号4,935,233;和美国专利号4,751,180中。
例如,可使用GlySer接头GGS、GGGS(SEQ ID NO:3)或GSG。GGS、GSG、GGGS(SEQ IDNO:3)或GGGGS(SEQ ID NO:4)接头可以3个重复(诸如(GGS)3(SEQ ID NO:5)、(GGGGS)3(SEQID NO:6))或5、6、7、9或甚至12或更多个重复使用,以提供合适的长度。在实施方案中,接头可以是(GGGGS)3-15(SEQ ID NO:6-18),例如,在实施方案中,接头可以是(GGGGS)3-11(SEQ IDNO:6-14),例如GGGGS(SEQ ID NO:4)、(GGGGS)2(SEQ ID NO:19)、(GGGGS)3(SEQ ID NO:6)、(GGGGS)4(SEQ ID NO:7)、(GGGGS)5(SEQ ID NO:8)、(GGGGS)6(SEQ ID NO:9)、(GGGGS)7(SEQID NO:10)、(GGGGS)8(SEQ ID NO:11)、(GGGGS)9(SEQ ID NO:12)、(GGGGS)10(SEQ ID NO:13)或(GGGGS)11(SEQ ID NO:14)。
在特定的实施方案中,本文优选使用接头诸如(GGGGS)3(SEQ ID NO:6)。(GGGGS)6(SEQ ID NO:9)、(GGGGS)9(SEQ ID NO:12)或(GGGGS)12(SEQ ID NO:15)可用作替代物。其他替代物包括(GGGGS)1(SEQ ID NO:4)、(GGGGS)2(SEQ ID NO:19)、(GGGG S)4(SEQ ID NO:7)、(GGGGS)5(SEQ ID NO:8)、(GGGGS)7(SEQID NO:10)、(GGGGS)8(SEQ ID NO:11)、(GGGGS)10(SEQ ID NO:13)或(GGGGS)11(SEQ ID NO:14)。在又一实施方案中,LEPGEKPYKCPECGKSFSQSGALTRHQRTHTR(SEQ ID NO:20)用作接头。在又一实施方案中,接头是XTEN接头。在特定的实施方案中,Cas蛋白通过LEPGEKPYKCPECGKSFSQSGALTRHQRTHTR(SEQID NO:20)接头连接到脱氨酶蛋白或其催化结构域。在其他特定的实施方案中,Cas蛋白的C末端通过LEPGEKPYKCPECGKSFSQSG ALTRHQRTHTR(SEQ ID NO:20)接头连接到脱氨酶蛋白或其催化结构域的N末端。另外,N末端和C末端NLS也可用作接头(例如,PKKKRKVEASSPKKRKVEAS(SEQ ID NO:21))。表1列出了本公开中感兴趣的可能的接头。
表1.接头的实例
接头可用于指导RNA与功能结构域(激活子或阻遏子)之间,或Cas蛋白与转座酶之间。接头可用于设计适当量的“机械柔性”。
在实施方案中,一个或多个功能结构域是可控的,例如可诱导的。
核定位信号
在实施方案中,本文的系统和组合物还包含一个或多个核定位信号(NLS),所述一个或多个NLS能够驱动组分例如Cas和/或转座酶在细胞核中积聚至所需的量。
在实施方案中,至少一个核定位信号(NLS)附接至Cas和/或转座酶或编码蛋白质的多核苷酸。在实施方案中,附接了一个或多个C末端或N末端NLS(并因此核酸分子编码Cas和/或转座酶可包括编码NLS,使得表达的产物已附接或连接NLS)。在实施方案中,附接C末端NLS用于在真核细胞例如人细胞中实现表达和核靶向。在实施方案中,NLS可位于不在C末端或N末端的位置处。例如,NLS可在两种多肽之间(例如,在Cas蛋白与转座酶之间)。
NLS的非限制性实例包括源自以下的NLS序列:SV40病毒大T-抗原的NLS;来自核质蛋白的NLS(例如核质蛋白双分型NLS);c-myc NLS;hRNPA1 M9 NLS;来自输入蛋白-α(importin-alpha)的IBB结构域的NLS;肌瘤T蛋白的NLS;人p53的NLS;小鼠c-abl IV的NLS;流感病毒NS1的NLS;丁型肝炎病毒抗原的NLS;小鼠Mx1蛋白的NLS;人聚(ADP-核糖)聚合酶的NLS;以及类固醇激素受体(人)糖皮质激素的NLS。示例性NLS序列包括Feng Zhang等人(WO2016106236A1)的[00106]段中描述的那些。
在实施方案中,NLS是异源NLS。例如,NLS并非天然存在于它所附接的分子(例如,Cas和/或转座酶)中。
一般来讲,核定位活性的强度可源自核酸靶向效应蛋白中NLS的数量、使用的特定NLS或这些因素的组合。可通过任何合适的技术来检测核中的积聚。例如,可检测的标志物可与核酸靶向蛋白融合,使得细胞内的位置可视化,诸如与用于检测细胞核位置的手段(例如,对细胞核具有特异性的染色剂诸如DAPI)组合。
在实施方案中,本文所述的载体(例如,包含编码Cas和/或转座酶的多核苷酸的那些)包含一个或多个核定位序列(NLS),诸如约或多于约1、2、3、4、5、6、7、8、9、10或更多个NLS。更特别地,载体包含一个或多个并非天然存在于Cas和/或转座酶中的NLS。最特别地,NLS存在于Cas和/或转座酶序列的载体5’和/或3’中。在实施方案中,Cas和/或转座酶在氨基末端处或附近包含约或多于约1、2、3、4、5、6、7、8、9、10或更多个NLS,在羧基末端处或附近包含约或多于约1、2、3、4、5、6、7、8、9、10或更多个NLS,或这些的组合(例如,在氨基末端处零个或至少一个或多个NLS和在羧基末端处零个或至少一个或多个NLS)。当存在多于一个NLS时,每个NLS可独立于其他NLS进行选择,使得单个NLS可以多于一个拷贝存在和/或与以一个或多个拷贝存在的一个或多个其他NLS组合。在实施方案中,当NLS的最近氨基酸从N末端或C末端沿着多肽链在约1、2、3、4、5、10、15、20、25、30、40、50或更多个氨基酸内时,NLS被认为在N末端或C末端附近。
在实施方案中,其他定位标签可融合至Cas和/或转座酶,诸如但不限于用于定位到细胞中的特定位点,诸如定位到细胞器,诸如线粒体、质体、叶绿体、囊泡、高尔基体、(核或细胞)膜、核糖体、核仁、ER、细胞骨架、液泡、中心体、核小体、颗粒、中心粒等。
靶向部分
所述系统还可包含一个或多个靶向部分。靶向部分可例如通过结合到表面受体蛋白而结合到具体的细胞或组织。同样,表2提供了可用于实践的示例性靶向部分,关于每个方面都提供了包含这样的靶向部分的系统。
表2.靶向部分、靶分子和靶细胞或组织。
因此,在系统的实施方案中,靶向部分包含受体配体,例如像针对CD44受体的透明质酸、针对肝细胞的半乳糖;或抗体或其片段,诸如针对所需表面受体的结合抗体片段,并且对于每个包含受体配体、或抗体或其片段(诸如其诸如针对所需表面受体的结合片段)的靶向部分,一个方面是其中系统包含靶向部分,所述靶向部分包含受体配体、或抗体或其片段,诸如其诸如针对所需表面受体结合片段、或针对CD44受体的透明质酸、针对肝细胞的半乳糖(参见例如,Surace等人,“Lipoplexes targeting the CD44 hyaluronic acidreceptor for efficient transfection of breast cancer cells,”J.Mol Pharm 6(4):1062-73;doi:10.1021/mp800215d(2009);Sonoke等人,“Galactose-modified cationicliposomes as a liver-targeting delivery system for small interfering RNA,”Biol Pharm Bull.34(8):1338-42(2011);Torchilin,“Antibody-modified liposomesfor cancer chemotherapy,”Expert Opin.Drug Deliv.5(9),1003-1025(2008);Manjappa等人,“Antibody derivatization and conjugation strategies:application inpreparation of stealth immunoliposome to target chemotherapeutics to tumor,”J.Control.Release 150(1),2-22(2011);Sofou S“Antibody-targeted liposomes incancer therapy and imaging,”Expert Opin.Drug Deliv.5(2):189-204(2008);Gao J等人,“Antibody-targeted immunoliposomes for cancer treatment,”Mini.Rev.Med.Chem.13(14):2026-2035(2013);Molavi等人,“Anti-CD30 antibodyconjugated liposomal doxorubicin with significantly improved therapeuticefficacy against anaplastic large cell lymphoma,”Biomaterials 34(34):8718-25(2013),所述文献和其中引用的文件各自在此以引用的方式并入本文)。
此外,鉴于本文的教义,本领域技术人员可容易地选择所需的靶向部分并将其应用到脂质实体。在实施方案中,所述系统包含具有靶向部分的脂质实体。
多核苷酸和载体
本文的系统可包含一种或多种多核苷酸。多核苷酸可包含Cas蛋白、转座酶、指导分子、供体多核苷酸或其任何组合的编码序列。本公开还提供了包含本文的一种或多种多核苷酸的载体或载体系统。载体或载体系统包括本文的递送部分中描述的那些。
术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换使用。它们是指任何长度的核苷酸的聚合形式,脱氧核糖核苷酸或核糖核苷酸或其类似物。多核苷酸可具有任何三维结构,并且可执行任何已知或未知的功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码或非编码区、连锁分析定义的基因座、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离DNA、任何序列的分离RNA、核酸探针和引物。所述术语还涵盖具有合成骨架的核酸样结构,参见例如,Eckstein,1991;Baserga等人,1992;Milligan,1993;WO 97/03211;WO 96/39154;Mata,1997;Strauss-Soukup,1997;和Samstag,1996。多核苷酸可包含一种或多种修饰的核苷酸,诸如甲基化的核苷酸和核苷酸类似物。如果存在,可在聚合物组装之前或之后赋予对核苷酸结构的修饰。核苷酸序列可能间杂有非核苷酸组分。多核苷酸可在聚合后进一步修饰,诸如通过与标记组分缀合。如本文所用,术语“野生型”是本领域技术人员所理解的术语,并且意指与突变体或变体形式不同的存在于自然界中的生物体、菌株、基因或特征的典型形式。“野生型”可以是基线。如本文所用,术语“变体”应理解为具有偏离存在于自然界中的模式的品质的表现。术语“非天然存在的”或“工程化的”可互换使用,并且指示人工的参与。当提及核酸分子或多肽时,所述术语意指核酸分子或多肽至少基本上不含至少一种在自然界中与它们天然相关联且如在自然界中发现的其他组分。“互补性”是指核酸通过传统的沃森-克里克碱基配对或其他非传统类型与另一个核酸序列形成氢键的能力。互补性百分比指示核酸分子中可与第二个核酸序列形成氢键(例如,沃森-克里克碱基配对)的残基的百分比(例如,10个中的5、6、7、8、9、10个为50%、60%、70%、80%、90%和100%互补)。“完全互补”意指核酸序列的所有连续残基将与第二个核酸序列中相同数量的连续残基氢键合。如本文所用,“基本上互补”是指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50或更多个核苷酸的区域内至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%的互补性程度,或是指在严格条件下杂交的两种核酸。如本文所用,用于杂交的“严格条件”是指与靶序列具有互补性的核酸主要与靶序列杂交并且基本上不与非靶序列杂交的条件。严格条件通常是序列依赖性的,并且根据多种因素变化。一般来讲,序列越长,序列与其靶序列特异性杂交的温度越高。严格条件的非限制性实例详细描述于Tijssen(1993),Laboratory Techniques In Biochemistry And MolecularBiology-Hybridization With Nucleic Acid Probes Part I,Second Chapter“Overviewof principles of hybridization and the strategy of nucleic acid probe assay”,Elsevier,N.Y.中。在参考多核苷酸序列的情况下,还设想了互补或部分互补的序列。这些优选能够在高度严格的条件下与参考序列杂交。通常,为了使杂交率最大化,选择严格性相对较低的杂交条件:比热熔点(Tm)低约20℃至25℃。Tm是在限定的离子强度和pH下,50%的具体靶序列与溶液中完全互补的探针杂交时的温度。通常,为了要求杂交序列至少约85%的核苷酸互补性,选择高度严格的洗涤条件,以使其比Tm低约5℃至15℃。能够与给定序列杂交的序列被称为给定序列的“补体”。
如本文所用,术语“基因组基因座”或“基因座”是基因或DNA序列在染色体上的具体位置。“基因”是指编码多肽或RNA链的DNA或RNA段,所述多肽或RNA链在生物体中发挥功能性作用,并且因此是活生物体遗传的分子单位。可以认为基因包括调控基因产物产生的区域,无论此类调控序列是否与编码序列和/或转录的序列相邻。因此,基因包括但不一定限于,启动子序列、终止子、翻译调控序列诸如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点以及基因座控制区。如本文所用,“基因组基因座的表达”或“基因表达”是使用来自基因的信息合成功能性基因产物的过程。基因表达的产物往往是蛋白质,但在非蛋白质编码基因诸如rRNA基因或tRNA基因中,产物是功能性RNA。所有已知的生命-真核生物(包括多细胞生物体)、原核生物(细菌和古生菌)和病毒都使用基因表达的过程来产生功能性产物以生存。如本文所用,基因或核酸的“表达”不仅涵盖细胞基因表达,还涵盖核酸在克隆系统和任何其他环境中的转录和翻译。如本文所用,“表达”还指多核苷酸从DNA模板转录(诸如转录成mRNA或其他RNA转录物)的过程和/或转录的mRNA随后被翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可统称为“基因产物”。如果多核苷酸源自基因组DNA,则表达可包括真核细胞中mRNA的剪接。术语“多肽”、“肽”和“蛋白质”可在本文中互换使用,以指代任何长度的氨基酸聚合物。聚合物可以是直链或支链的,其可包含修饰的氨基酸,并且其可间杂有非氨基酸。所述术语还涵盖已被修饰的氨基酸聚合物;所述修饰例如,二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操纵(诸如与标记组分缀合)。如本文所用,术语“氨基酸”包括天然和/或非天然或合成的氨基酸,包括甘氨酸以及D或L光学异构体,以及氨基酸类似物和肽模拟物。如本文所用,术语“结构域”或“蛋白质结构域”是指蛋白质序列的一部分,其可以独立于蛋白质链的其余部分而存在并发挥作用。如各方面所述,序列同一性与序列同源性相关。同源性比较可通过肉眼进行,或者更通常的是借助容易获得的序列比较程序进行。这些可商购获得的计算机程序可计算两个或更多个序列之间的同源性百分比(%),并且还可计算两个或更多个氨基酸或核酸序列共享的序列同一性。
在实施方案中,多核苷酸序列是重组DNA。在其他实施方案中,多核苷酸序列还包含如本文别处所述的另外的序列。在实施方案中,核酸序列是在体外合成的。
本公开的方面涉及编码本文任何实施方案中提及的系统的一种或多种组分的多核苷酸分子。在实施方案中,多核苷酸分子还可包含调控序列。通过指导而非限制,多核苷酸序列可以是表达质粒、小环、慢病毒载体、逆转录病毒载体、腺病毒或腺相关病毒载体、piggyback载体或tol2载体的一部分。在实施方案中,多核苷酸序列可以是双顺反子表达构建体。在其他实施方案中,分离的多核苷酸序列可以并入细胞基因组中。在又其他实施方案中,分离的多核苷酸序列可以是细胞基因组的一部分。在其他实施方案中,分离的多核苷酸序列可包含在人工染色体中。在实施方案中,分离的多核苷酸序列的5’端和/或3’端可被修饰成提高序列的稳定性,从而主动避免降解。在实施方案中,分离的多核苷酸序列可包含在噬菌体中。在其他实施方案中,分离的多核苷酸序列可包含在土壤杆菌物种中。在实施方案中,分离的多核苷酸序列是冻干的。
密码子优化
本公开的方面涉及编码如本文实施方案中任一项所述的系统的一种或多种组分的多核苷酸分子,其中多核苷酸分子的至少一个或多个区域可被密码子优化用于在真核细胞中表达。在实施方案中,编码如本文实施方案中任一项所述的系统的一种或多种组分的多核苷酸分子被优化用于在哺乳动物细胞或植物细胞中的表达。
密码子优化的序列的实例在这种情况下是被优化用于在真核生物例如人中表达(即,被优化用于在人中表达)的序列,或被优化用于在如本文所讨论的另一种真核生物、动物或哺乳动物中表达的序列;参见例如,国际专利公布号WO 2014/093622(PCT/US2013/074667)中的SaCas9人密码子优化的序列,作为密码子优化的序列的实例(根据本领域和本公开的知识,密码子优化编码核酸分子,特别是关于效应蛋白,在本领域技术人员的范围内)。尽管这是优选的,但应理解其他实例也是可能的,并且对于除人以外的宿主物种的密码子优化或对于具体器官的密码子优化是已知的。在实施方案中,编码Cas蛋白和/或转座酶的酶编码序列被密码子优化用于在特定细胞诸如真核细胞中表达。真核细胞可以是特定生物体的或衍生自特定生物体的那些细胞,所述生物体诸如植物或哺乳动物,包括但不限于本文讨论的人或非人真核生物或动物或哺乳动物,例如小鼠、大鼠、兔、狗、牲畜,或非人哺乳动物或灵长类动物。在实施方案中,可排除用于修饰人类的种系遗传特性的方法和/或用于修饰动物的遗传特性的方法,所述方法可能导致他们遭受痛苦而对人或动物以及由此类方法获得的动物没有任何实质性医学益处。一般来讲,密码子优化是指通过将天然序列的至少一个密码子(例如,约或超过约1、2、3、4、5、10、15、20、25、50或更多个密码子)替换为在宿主细胞的基因中更频繁或最频繁使用的密码子,同时保持天然氨基酸序列,以增强在目标宿主细胞中的表达的修饰核酸序列的过程。
不同物种对特定氨基酸的某些密码子表现出特定的偏好。密码子偏好(生物体之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,除其他事项之外,据信所述翻译效率继而依赖于被翻译的密码子的特性和特定转运RNA(tRNA)分子的可用性。所选择的tRNA在细胞中的优势通常是肽合成中最频繁使用的密码子的反映。因此,可基于密码子优化来定制基因用于在给定生物体中最佳基因表达。密码子使用表容易获得,例如,可在www.kazusa.orjp/codon/获得的“密码子使用数据库(Codon Usage Database)”,并且这些表可以多种方式改编。参见Nakamura,Y.,等人“Codon usage tabulated from theinternational DNA sequence databases:status for the year 2000”Nucl.AcidsRes.28:292(2000)。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可获得的,诸如Gene Forge(Aptagen;Jacobus,PA)也是可获得的。在实施方案中,在编码DNA/RNA靶向Cas蛋白的序列中的一个或多个密码子(例如,1、2、3、4、5、10、15、20、25、50或更多个或所有密码子)对应于特定氨基酸的最频繁使用的密码子。
插入多核苷酸的方法
本公开还提供了将多核苷酸插入细胞中的靶核酸中的方法,所述方法包括向细胞中引入:(a)一种或多种转座酶(例如,CRISPR相关转座酶)或其功能片段,(b)核苷酸结合系统,例如Cas蛋白和指导,(c)一个或多个供体多核苷酸。
组分(a)、(b)和(c)中的一种或多种可由与在细胞中表达的调控序列可操作地连接的核酸表达。在实施方案中,可将组分(a)、(b)和(c)中的一种或多种引入粒子中。粒子可包含核糖核蛋白(RNP)。细胞可以是原核细胞。细胞可以是真核细胞。例如,细胞可以是哺乳动物细胞、非人灵长类动物的细胞或人细胞。细胞可以是植物细胞。
在实施方案中,提供了将供体多核苷酸插入靶多核苷酸中的方法。将供体多核苷酸插入靶多核苷酸中的方法在体外或在体内,例如在细胞中进行。引入靶多核苷酸的系统的组分包括一种或多种CRISPR相关转座酶(或其功能片段)、一种或多种如本文详述的I-F型Cas蛋白,以及能够与I-F型Cas蛋白复合的指导分子和供体多核苷酸被引入靶多核苷酸。在一个实施方案中,靶多核苷酸包含在细胞中,例如原核或真核细胞中。在示例性实施方案中,供体多核苷酸向靶多核苷酸引入一个或多个突变,在靶多核苷酸中校正提前终止密码子,破坏剪接位点,恢复剪接位点,或其组合。例如,突变可如本文别处所述,并且可包括相对于靶多核苷酸的取代、缺失和/或插入。开放阅读框中相对于靶多核苷酸的移位是插入供体多核苷酸的方法的示例性实施方案。在一个优选的实施方案中,引入靶多核苷酸的一种或多种组分由可操作地连接到调节序列的核酸表达,如本文别处进一步描述的。在所述方法中引入的一种或多种组分可引入粒子中,所述粒子可包括核糖核蛋白(RNP)。
在实施方案中,将供体多核苷酸插入细胞中的靶多核苷酸中的方法,所述方法包括向细胞中引入:一种或多种转座酶(例如,CRISPR相关转座酶);Cas蛋白;和指导分子,所述指导分子能够与Cas蛋白复合并引导指导物-Cas蛋白复合物与靶核酸的靶序列的序列特异性结合。一种或多种CRISPR相关转座子可包含一种或多种转座酶和待插入的供体多核苷酸。
免疫正交直系同源物
在实施方案中,当需要在受试者中表达或施用本文的系统的一种或多种组分(例如,转座酶、核苷酸结合分子)时,可通过顺序表达或向受试者施用转座子复合物的组分的免疫正交直系同源物来降低所述组分的免疫原性。如本文所用,术语“免疫正交直系同源物”是指具有相似或基本相同的功能或活性但与彼此产生的免疫反应不具有交叉反应性或具有低交叉反应性的直系同源蛋白质。在实施方案中,此类直系同源物的顺序表达或施用引发低的二次免疫反应或不引发二次免疫反应。免疫正交直系同源物可避免被抗体(例如,在表达或施用直系同源物之前宿主中存在的抗体)中和。表达直系同源物的细胞可避免被宿主的免疫系统(例如,被激活的CTL)清除。在实施方案中,来自不同物种的CRISPR酶和/或转座酶直系同源物可以是免疫正交直系同源物。
可通过分析一组候选直系同源物的序列、结构和/或免疫原性来鉴定免疫正交直系同源物。在示例性方法中,一组免疫正交直系同源物可通过以下来鉴定:a)比较一组候选直系同源物(例如,来自不同物种的直系同源物)的序列,以鉴定具有低序列相似性或不具有序列相似性的候选物亚组;b)评估候选物亚组成员之间的免疫重叠,以鉴定不具有免疫重叠或具有低免疫重叠的候选物。在实施方案中,候选物之间的免疫重叠可通过确定候选直系同源物与宿主的MHC(例如,MHC I型和/或MHC II)之间的结合(例如,亲和力)来评估。可替代地或另外地,候选物之间的免疫重叠可通过确定候选直系同源物的B细胞表位来评估。在一个实例中,可使用描述于Moreno AM等人,BioRxiv,在线发布于2018年1月10日,doi:doi.org/10.1101/245985中的方法来鉴定免疫正交直系同源物。
递送和施用的方法
本公开还提供了用于将本文的系统和组合物的组分引入细胞、组织、器官或生物体中的递送系统。递送系统可包含一种或多种递送媒介物和/或货物。示例性递送系统和方法包括描述于Feng Zhang等人,(WO2016106236A1)的段落[00117]至[00278]以及Lino CA等人,Delivering CRISPR:a review of the challenges and approaches,DRUGDELIVERY,2018,第25卷,第1期,1234–1257的第1241-1251页和表1中的那些,所述文献以引用的方式整体并入本文。
在实施方案中,递送系统可用于将系统和组合物的组分引入植物细胞中。例如,可使用电穿孔、显微注射、植物细胞原生质体的气溶胶束注射、基因枪(biolistic)法、DNA粒子轰击和/或土壤杆菌介导的转化将组分递送至植物。植物的方法和递送系统的实例包括描述于Fu等人,Transgenic Res.2000年2月;9(1):11-9;Klein RM等人,Biotechnology.1992;24:384-6;Casas AM等人,Proc Natl Acad Sci U SA.1993年12月1日;90(23):11212–11216;和美国专利号5,563,055,Davey MR等人,Plant Mol Biol.1989年9月;13(3):273-85中的那些,所述文献和专利以引用的方式整体并入本文。
货物
递送系统可包含一种或多种货物。货物可包含本文的系统和组合物的一种或多种组分。货物可包含以下中的一种或多种:i)编码一种或多种Cas蛋白的质粒;ii)编码一种或多种指导RNA的质粒,iii)一种或多种Cas蛋白的mRNA;iv)一种或多种指导RNA;v)一种或多种Cas蛋白;vi)其任何组合。在实施方案中,货物可包含编码一种或多种Cas蛋白和一种或多种(例如,多种)指导RNA的质粒。在实施方案中,质粒还可编码重组模板(例如,对于HDR)。在实施方案中,货物可包含编码一种或多种Cas蛋白的mRNA和一种或多种指导RNA。
在实施方案中,货物可包含一种或多种Cas蛋白和一种或多种指导RNA,例如,以核糖核蛋白复合物(RNP)的形式。核糖核蛋白复合物可通过本文的方法和系统递送。在实施方案中,核糖核蛋白可通过基于多肽的穿梭剂递送。在一个实例中,核糖核蛋白可使用合成肽递送,所述合成肽包含与细胞穿透结构域(CPD)可操作地连接的内体泄漏结构域(ELD)、与富含组氨酸的结构域和CPD可操作地连接的ELD,例如,如WO2016161516中所述。RNP也可用于将组合物和系统递送至植物细胞,例如,如Wu JW等人,Nat Biotechnol.2015年11月;33(11):1162-4中所述。
物理递送
在实施方案中,可通过物理递送方法将货物引入细胞。物理方法的实例包括显微注射、电穿孔和流体动力学递送。核酸和蛋白质都可使用此类方法来递送。例如,Cas蛋白可在体外制备、分离、(如果需要的话,再折叠、纯化),并引入细胞。
显微注射
将货物直接显微注射到细胞可实现高效率,例如,高于90%或约100%。在实施方案中,可使用显微镜和针头(例如,直径为0.5–5.0μm)进行显微注射以刺穿细胞膜并将货物直接递送至细胞内的靶位点。显微注射可用于体外和离体递送。
可显微注射包含Cas蛋白和/或指导RNA的编码序列的质粒、mRNA和/或指导RNA。在实施方案中,显微注射可用于i)将DNA直接递送至细胞核,和/或ii)将mRNA(例如,体外转录的)递送至细胞核或细胞质。在示例性实施方案中,显微注射可用于将sgRNA直接递送至细胞核并将Cas编码mRNA递送至细胞质,从而例如促进Cas的翻译和向细胞核的穿梭。
显微注射可用于生成遗传修饰的动物。例如,可将基因编辑货物注射到受精卵中,以允许进行高效的种系修饰。此种方法可产生带有所需修饰的正常胚胎和足月小鼠幼崽。显微注射还可用于例如使用CRISPRa和CRISPRi来提供瞬时上调或下调细胞基因组内的特定基因。
电穿孔
在实施方案中,货物和/或递送媒介物可通过电穿孔递送。电穿孔可使用脉冲高压电流在悬浮于缓冲液中细胞的细胞膜中瞬时打开纳米大小的孔,从而使流体动力学直径为数十纳米的组分流入细胞中。在实施方案中,电穿孔可用于各种细胞类型并高效地将货物转移到细胞中。电穿孔可用于体外和离体递送。
电穿孔也可用于通过施加特定电压和试剂,例如通过核转染将货物递送到哺乳动物的细胞核中。此类方法包括描述于Wu Y等人(2015).Cell Res 25:67–79;Ye L等人(2014).Proc Natl Acad Sci USA 111:9591–6;Choi PS,Meyerson M.(2014).Nat Commun5:3728;Wang J,Quake SR.(2014).Proc Natl Acad Sci 111:13157–62中的那些。电穿孔也可用于体内递送货物,例如,通过使用描述于Zuckermann M等人(2015).Nat Commun 6:7391中的方法。
流体动力学递送
流体动力学递送也可用于递送货物,例如用于体内递送。在实施方案中,流体动力学递送可通过将含有基因编辑货物的大体积(8%–10%体重)溶液快速推入受试者(例如,动物或人)的血流中来进行,例如,对于小鼠,通过尾静脉推入血流中。由于血液是不可压缩的,大剂量的液体可能导致流体动力学压力增加,从而暂时增强对内皮细胞和实质细胞的渗透性,从而使通常不能穿过细胞膜的货物进入细胞中。这种方法可用于递送裸DNA质粒和蛋白质。递送的货物可富集于肝脏、肾脏、肺、肌肉和/或心脏。
转染
可通过用于将核酸引入细胞中的转染方法将货物例如核酸引入细胞。转染方法的实例包括磷酸钙介导的转染、阳离子转染、脂质体转染、树状聚合物转染、热休克转染、磁转染、脂质体转染、刺穿转染(impalefection)、光学转染、专利剂(proprietary agent)增强的核酸摄取。
递送媒介物
递送系统可包含一种或多种递送媒介物。递送媒介物可将货物递送到细胞、组织、器官或生物体(例如,动物或植物)中。货物可被包装、运送或以其他方式与递送媒介物缔合。递送媒介物可基于待递送的货物的类型来选择,并且/或者递送是体外和/或体内的。递送媒介物的实例包括载体、病毒、非病毒载体和本文所述的其他递送试剂。
如本文别处所述,递送可包括单独递送一个或多个亚基或CRISPR相关蛋白,作为一种或多种融合蛋白,或作为编码所述蛋白的多核苷酸。如上所述,包括I型系统的多聚体I类复合物的递送是本领域已知的,例如Pickar-Oliver等人,Nat Biotechnol.2019年12月;37(12):1493–1501;doi:10.1038/s41587-019-0235-7。Pickar-Oliver利用CMV启动子用于系统的每个亚基,并且还包括N-末端Flag表位标签和核定位系统。而Pickar-Olivier在单独的载体上递送复合物的每个亚基,在同一构建体上递送多于一个亚基。Dolan等人利用Cas3上的C末端NLS,通过RNP电穿孔将禾草腥黑粉菌(T.fusca)I-E型递送到hESC中用于基因组编辑,并递送到通过电穿孔递送的六个Cas7亚基中的每一个的C末端。Dolan等人,MolCell,(2019);74(5):936–950.e5;doi:10.1016/j.molcel.2019.03.014;还参见Morisaka等人Nat.Commun.10,5302(2019);Cameron等人,Nat Biotechnol.2019年12月;37(12):1471-147;doi:10.1038/s41587-019-0310-0(多亚基级联到Fok1核酸酶结构域的融合,用于通过多顺反子载体递送,并在用于真核应用的分离质粒上递送指导RNA);以及Young等人,Commun Biol.(2019年10月18日);2:383.doi:10.1038/s42003-019-0637-6(通过将植物转录激活结构域拴系至Cascade复合物的3个不同亚基,在玉米中递送1类1-E型嗜热链球菌(S.thermophilus)系统)。可进行基于人密码子使用的密码子优化和/或通过优化工具诸如ATUM/DNA2.0进行的进一步密码子优化,以进一步优化表达。
在实施方案中,本文公开的工程化载体和组合物的递送可包括将一种或多种工程化组合物递送至细胞中,所述一种或多种工程化组合物包含一种或多种CRISPR相关Tn7转座酶或其功能片段;一种或多种1-F型Cas蛋白;指导分子,所述指导分子能够与所述一种或多种1-F型Cas蛋白复合并引导指导物-Cas蛋白复合物与靶多核苷酸的结合;和供体多核苷酸。在示例性实施方案中,供体多核苷酸的递送向靶多核苷酸引入一个或多个突变,在靶多核苷酸中校正提前终止密码子,破坏剪接位点,恢复剪接位点,或其组合。
根据本公开的递送媒介物的最大尺寸(例如直径)可小于100微米(μm)。在实施方案中,递送媒介物的最大尺寸小于10μm。在实施方案中,递送媒介物的最大尺寸可小于2000纳米(nm)。在实施方案中,递送媒介物的最大尺寸可小于1000纳米(nm)。在实施方案中,递送媒介物的最大尺寸(例如直径)可小于900nm、小于800nm、小于700nm、小于600nm、小于500nm、小于400nm、小于300nm、小于200nm、小于150nm或小于100nm、小于50nm。在实施方案中,递送媒介物的最大尺寸可在25nm与200nm之间。
在实施方案中,递送媒介物可以是或包含粒子。例如,递送媒介物可以是或包含纳米粒子(例如,最大尺寸(例如,直径)不大于1000nm的粒子)。粒子可以不同的形式提供,例如,作为固体粒子(例如,金属(诸如银、金、铁、钛)、非金属、基于脂质的固体、聚合物)、粒子的悬浮液或其组合。可制备金属、电介质和半导体粒子,以及混合结构(例如,核壳粒子)。纳米粒子也可用于将组合物和系统递送至植物细胞,例如,如国际专利公布号WO2008042156、美国公布申请号US 20130185823和国际专利公布号WO 2015/089419中所述。
载体
本公开提供了包含一种或多种载体的载体系统。载体可包含一种或多种编码本文的Cas相关转座酶系统中的组分的多核苷酸,或其组合。在特定的实例中,本公开提供了一种包含Cas相关转座酶系统的所有组分或编码所述组分的多核苷酸的单一载体。载体可包含单个启动子。在其他实施方案中,所述系统可包含多个载体,每个载体包含Cas相关转座酶系统的一个或一些组分或编码所述组分的多核苷酸。
载体系统中的一种或多种多核苷酸可包含一种或更多种可操作地配置为表达多肽和/或核酸组分的调控元件,任选地,其中所述一种或更多种调控元件包括诱导型启动子。编码Cas多肽的多核苷酸分子是被优化用于在真核细胞中表达的密码子。
编码Cas和/或转座酶的多核苷酸可突变以减少或防止翻译的早期或提前终止。在实施方案中,多核苷酸编码具有poly-U段的RNA(例如,在5'端)。此类多核苷酸可突变,例如在编码poly-U段的序列中,以减少或防止早期或提前终止。
载体可具有一个或多个限制性内切核酸酶识别位点(例如,I型、II型或III型),在所述位点上可以可确定的方式切割序列而不丧失载体的基本生物功能,并且可将核酸片段剪接或插入其中以实现其复制和克隆。载体还可包含一个或多个重组位点,其允许两个核酸分子之间的核酸序列交换。载体还可提供引物位点,例如用于PCR、转录和/或翻译起始和/或调控位点、重组信号、复制子、选择性标志物等。载体还可含有一种或多种适用于鉴定用载体转化的细胞的选择性标志物。
如前所述,能够在适当的宿主细胞(例如原核细胞、真核细胞或哺乳动物细胞)中引导与其可操作地连接的基因和/或核酸序列表达的载体在本文中称为“表达载体”。如果需要所需核酸序列的翻译,则载体通常还可包含核苷酸序列的正确翻译所需的序列。如本文中关于表达载体使用的术语“表达”是指核酸序列产物的生物合成,即核苷酸序列的转录和/或翻译。表达还指微小RNA或RNAi分子的生物合成,其指不需要翻译成多肽序列的RNAi剂诸如siRNA、shRNA和反义DNA的表达和转录。
一般来讲,在生成方法中有用的表达载体和可包含本文所述的多肽的组合物通常是“质粒”的形式,所述质粒是指环状双链DNA环,其在载体形式中不与染色体结合。在本文所述的方面的实施方案中,给定多肽的所有组分可编码在单个载体中。例如,在实施方案中,可构建含有或可包含如本文所述的功能多肽所需的所有组分的载体。在实施方案中,单独的组分(例如,一个或多个单体单元和一个或更多个效应结构域)可在不同的载体中单独编码并单独引入一个或多个细胞中。此外,本文所述的任何载体本身可在任何位置或位置组合,诸如外源性核酸分子的5′、3′或5′和3′两者处,包含编码组分序列的预定Cas和/或逆转录转座子多肽,诸如效应结构域和/或其他多肽,所述外源性核酸分子可包含一个或多个组分Cas和/或编码待克隆的序列的反转录转座子多肽。本文将此类表达载体称为可包含“骨架序列”。
系统、组合物和/或递送系统可包含一种或多种载体。本公开还包括载体系统。载体系统可包含一种或多种载体。在实施方案中,载体是指一种核酸分子,其能够转运已与其连接的另一种核酸。载体包括单链、双链或部分双链的核酸分子;包含一个或多个游离端、不含游离端(例如,环状)的核酸分子;包含DNA、RNA或两者的核酸分子;和本领域已知的其他种类的多核苷酸。载体可以是质粒,例如环状双链DNA环,可诸如通过标准分子克隆技术向其中插入另外的DNA区段。某些载体可能能够在其所引入的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和游离型哺乳动物载体)。一些载体(例如非游离型哺乳动物载体)在引入宿主细胞后整合到宿主细胞的基因组中,并由此随宿主基因组一起复制。在示例性实施方案中,载体可以是例如能够引导与它们可操作地连接的基因的表达的表达载体。在实施方案中,表达载体可用于在真核细胞中表达。在重组DNA技术中有用的常见表达载体通常呈质粒形式。
载体的实例包括pGEX、pMAL、pRIT5、大肠杆菌表达载体(例如,pTrc、pET 11d)、酵母表达载体(例如,pYepSec1、pMFa、pJRY88、pYES2和picZ)、杆状病毒载体(例如,用于在昆虫细胞诸如SF9细胞中表达)(例如,pAc系列和pVL系列)、哺乳动物表达载体(例如,pCDM8和pMT2PC)。
载体可包含i)Cas编码序列,和/或ii)单个或至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少12个、至少14个、至少16个、至少32个、至少48个、至少50个指导RNA编码序列。在单个载体中,每个RNA编码序列都可以有启动子。可替代地或另外地,在单个载体中,可能存在控制(例如,驱动转录和/或表达)多个RNA编码序列的启动子。
此外,所述组合物或系统可通过载体递送,例如,单独的载体或编码本文的组合物和系统的组分的相同载体。当由单独的载体提供时,靶向Cas表达的CRISPR RNA可以顺序或同时施用。当顺序施用时,靶向Cas表达的CRISPR RNA将在用于例如基因编辑或基因工程的CRISPR RNA之后递送。此时间段可以是几分钟的时间段(例如5分钟、10分钟、20分钟、30分钟、45分钟、60分钟)。此时间段可以是数小时的时间段(例如2小时、4小时、6小时、8小时、12小时、24小时)。此时间段可以是数天的时间段(例如2天、3天、4天、7天)。此时间段可以是数周的时间段(例如,2周、3周、4周)。此时间段可以是几个月的时间段(例如2个月、4个月、8个月、12个月)。此时间段可以是几年的时间段(2年、3年、4年)。以此方式,Cas酶与能够与第一靶标(诸如一个或多个感兴趣的基因组基因座)杂交的第一gRNA结合,并承担组合物或系统所需的功能(例如,基因工程);并且随后所述Cas酶可与能够与包含Cas或CRISPR盒的至少一部分的序列杂交的第二gRNA结合。当指导RNA靶向编码Cas蛋白表达的序列时,酶会受到阻碍,并且系统会自失活。以相同的方式,靶向Cas表达的通过例如本文所述的脂质体、脂质转染、粒子、微泡来应用的CRISPR RNA可以顺序或同时施用。类似地,自失活可用于失活用于靶向一个或多个靶标的一个或多个指导RNA。
调控元件
载体可包含一种或多种调控元件。调控元件可与Cas蛋白、辅助蛋白、指导RNA(例如,单指导RNA、crRNA和/或tracrRNA)或其组合的编码序列可操作地连接。术语“可操作地连接”旨在表示目标核苷酸序列以允许所述核苷酸序列表达(例如,在体外转录/翻译系统中或当载体被引入宿主细胞中时在宿主细胞中表达)的方式与调控元件连接。在示例性实施方案中,载体可包含:与编码Cas蛋白的核苷酸序列可操作地连接的第一调控元件,和与编码指导RNA的核苷酸序列可操作地连接的第二调控元件。在实施方案中,载体还可包含可操作地连接到编码转座酶的核苷酸序列的第三调控元件。在示例性实施方案中,载体还可包含可操作地连接到作为或编码供体多核苷酸的核苷酸序列的第三调控元件。
调控元件的实例包括启动子、增强子、内部核糖体进入位点(IRES)和其他表达控制元件(例如,转录终止信号,诸如多腺苷酸化信号和poly-U序列)。此类调控元件描述于例如Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,AcademicPress,San Diego,Calif.(1990)中。调控元件包括引导核苷酸序列在许多类型的宿主细胞中组成型表达的那些和引导核苷酸序列仅在某些宿主细胞中表达的那些(例如,组织特异性调控序列)。组织特异性启动子可主要引导在所需的目标组织中的表达,所述组织诸如肌肉、神经元、骨、皮肤、血液、具体的器官(例如肝脏、胰腺)或具体的细胞类型(例如淋巴细胞)。调控元件还可以时间依赖性方式(诸如以细胞周期依赖性或发育阶段依赖性方式)引导表达,所述表达可能是或也可能不是组织或细胞类型特异性的。
启动子的实例包括一个或多个pol III启动子(例如,1、2、3、4、5或更多个pol III启动子)、一个或多个pol II启动子(例如,1、2、3、4、5或更多个pol II启动子)、一个或多个pol I启动子(例如,1、2、3、4、5或更多个pol I启动子),或其组合。pol III启动子的实例包括但不限于U6和H1启动子。pol II启动子的实例包括但不限于逆转录病毒劳斯肉瘤病毒(RSV)LTR启动子(任选地带有RSV增强子)、巨细胞病毒(CMV)启动子(任选地带有CMV增强子)、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子。
病毒载体
货物可通过病毒递送。在实施方案中,使用病毒载体。病毒载体可包含用于包装成病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒)的病毒衍生的DNA或RNA序列。病毒载体还包括由病毒携带的用于转染到宿主细胞中的多核苷酸。病毒和病毒载体可用于体外、离体和/或体内递送。
腺相关病毒(AAV)
本文的系统和组合物可通过腺相关病毒(AAV)递送。AAV载体可用于此种递送。AAV属于依赖病毒属(Dependovirus)和细小病毒科(Parvoviridae),是一种单链DNA病毒。在实施方案中,AAV可提供所提供DNA的持久性来源,因为AAV递送的基因组材料可例如作为外源性DNA无限期地存在于细胞中或者具有一些修饰直接整合到宿主DNA中。在实施方案中,AAV不会引起人的任何疾病或与人的任何疾病有关。病毒本身能够高效地感染细胞,同时几乎不会引起先天性或适应性免疫反应或相关毒性。
可在本文中使用的AAV的实例包括AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-8和AAV-9。AAV的类型可根据待靶向的细胞来选择;例如,可选择AAV血清型1、2、5或混合衣壳AAV1、AAV2、AAV5或其任何组合用于靶向脑或神经元细胞;并且可选择AAV4用于靶向心脏组织。AAV8可用于递送至肝脏。基于AAV-2的载体最初被提议用于CFTR向CF气道的递送,其他血清型诸如AAV-1、AAV-5、AAV-6和AAV-9在肺上皮的多种模型中表现出改善的基因转移效率。AAV靶向的细胞类型的实例描述于Grimm,D.等人,J.Virol.82:5887-5911(2008)),并且如下表3所示:
表3.腺相关病毒和细胞系。
AAV粒子可在HEK 293T细胞中产生。一旦产生了具有特定嗜性的粒子,它们就被用来感染靶细胞系,就像天然病毒粒子一样。这可能会使感染细胞类型中的组分持续存在,并且这使得这种递送方式特别适合需要长期表达的情况。可以使用的AAV的剂量和配方的实例包括描述于美国专利号8,454,972和8,404,658中的那些。
多种策略可用于使用AAV递送本文的系统和组合物。在实施方案中,Cas和gRNA的编码序列可直接包装到一个DNA质粒载体上并通过一个AAV粒子递送。在实施方案中,AAV可用于将gRNA递送到先前已被工程化以表达Cas的细胞中。在实施方案中,Cas和gRNA的编码序列可制成用于共转染靶细胞的两个单独的AAV粒子。在实施方案中,标志物、标签和其他序列可包装在与Cas和/或gRNA的编码序列相同的AAV粒子中。
慢病毒
本文的系统和组合物可通过慢病毒递送。慢病毒载体可用于此种递送。慢病毒是复杂的逆转录病毒,其具有在有丝分裂和有丝分裂后细胞中感染和表达其基因的能力。
慢病毒的实例包括人免疫缺陷病毒(HIV),其可利用其他病毒的包膜糖蛋白来靶向广泛的细胞类型;基于马传染性贫血病毒(EIAV)的最小非灵长类慢病毒载体,其可用于眼部治疗。在实施方案中,具有靶向由HIV tat/rev共享的共同外显子的siRNA、核仁定位TAR诱饵和抗CCR5特异性锤头状核酶的自灭活慢病毒载体(参见例如,DiGiusto等人(2010)Sci Transl Med 2:36ra43)可用于/和或适用于本文的核酸靶向系统。
慢病毒可以用其他病毒蛋白(诸如水疱性口炎病毒的G蛋白)进行假分型。这样一来,慢病毒的细胞趋向性可根据需要改变得广泛或狭窄。在实施方案中,为了提高安全性,第二代和第三代慢病毒系统可能会将必需基因拆分到三个质粒中,这可能会降低细胞内活病毒粒子意外重构的可能性。
在实施方案中,利用整合能力,慢病毒可用于创建包含各种遗传修饰的细胞文库,例如用于筛选和/或研究基因和信号传导途径。
腺病毒
本文的系统和组合物可通过腺病毒进行递送。腺病毒载体可用于此种递送。腺病毒包括具有含有双链DNA基因组的二十面体核衣壳的非包膜病毒。腺病毒可感染分裂和非分裂细胞。在实施方案中,腺病毒不整合到宿主细胞的基因组中,这可用于限制基因编辑应用中组合物和系统的脱靶效应。
用于递送至植物的病毒媒介物
可使用病毒媒介物将系统和组合物递送至植物细胞。在特定的实施方案中,可使用植物病毒载体将组合物和系统引入植物细胞中(例如,如SScholthof等人1996,Annu RevPhytopathol.1996;34:299-323中所述)。此种病毒载体可以是来自DNA病毒的载体,例如双生病毒(例如,卷心菜卷叶病毒、豆黄矮病毒、小麦矮病毒、番茄卷叶病毒、玉米条纹病毒、烟草卷叶病毒或番茄金色花叶病毒)或纳米病毒(例如,蚕豆坏死黄病毒)。病毒载体可以是来自RNA病毒的载体,例如,烟草病毒(例如,烟草脆裂病毒、烟草花叶病毒)、马铃薯X病毒属(例如,马铃薯病毒X)或大麦病毒(例如,大麦条纹花叶病毒)。植物病毒的复制基因组可能是非整合性载体。
非病毒媒介物
递送媒介物可包含非病毒媒介物。一般来讲,能够递送核酸和/或蛋白质的方法和媒介物可用于递送本文的系统组合物。非病毒媒介物的实例包括脂质纳米粒子、细胞穿透肽(CPP)、DNA纳米线团(nanoclew)、金纳米粒子、链球菌溶血素O、多功能包膜型纳米装置(MEND)、脂质包被的介孔二氧化硅粒子和其他无机纳米粒子。
脂质粒子
递送媒介物可包括脂质粒子,例如脂质纳米粒子(LNP)和脂质体。
脂质纳米粒子(LNP)
LNP可将核酸封装在阳离子脂质粒子(例如脂质体)中,并且可以相对容易地递送至细胞。在实施方案中,脂质纳米粒子不含任何病毒组分,这有助于最小化安全性和免疫原性问题。脂质粒子可用于体外、离体和体内递送。脂质粒子可用于各种规模的细胞群。
在实施方案中。LNP可用于递送DNA分子(例如,包含Cas和/或gRNA的编码序列的那些)和/或RNA分子(例如,Cas的mRNA、gRNA)。在某些情况下,LNP可用于递送Cas/gRNA的RNP复合物。
LNP中的组分可包括阳离子脂质1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲氨基丙烷(DLinDMA)、1,2-二亚油基氧基酮基-N,N-二甲基-3-氨基丙烷(DLinK-DMA)、1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧杂环戊烷(DLinKC2-DMA)、(3-o-[2"-(甲氧基聚乙二醇2000)琥珀酰]-1,2-二肉豆蔻酰基-sn-甘油(PEG-S-DMG)、R-3-[(ρ-甲氧基-聚(乙二醇)2000)氨基甲酰基]-1,2-二肉豆蔻基氧丙基-3-胺(PEG-C-DOMG及其任何组合。LNP的制备和封装可改编自Rosin等人,Molecular Therapy,第19卷,第12期,第1286-2200页,2011年12月)。
脂质体
在实施方案中,脂质粒子可以是脂质体。脂质体是球形囊泡结构,其由围绕内部水性区室的单层或多层脂质双层和相对不可渗透的外部亲脂性磷脂双层构成。在实施方案中,脂质体是生物相容的、无毒的,可递送亲水性和亲脂性药物分子,保护它们的货物免于被血浆酶降解,以及将它们的负载物转运穿过生物膜和血脑屏障(BBB)。
脂质体可由几种不同类型的脂质(例如磷脂)制成。脂质体可包含天然磷脂和脂质,诸如1,2-二硬脂酰基-sn-甘油-3-磷脂酰胆碱(DSPC)、鞘磷脂、卵磷脂酰胆碱、单唾液酸神经节苷脂或其任何组合。
可将几种其他添加剂添加到脂质体中以便改变它们的结构和特性。例如,脂质体还可包含胆固醇、鞘磷脂和/或1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE),以例如增加稳定性和/或防止脂质体内部货物的泄漏。
稳定的核酸-脂质粒子(SNALP)
在实施方案中,脂质粒子可以是稳定的核酸脂质粒子(SNALP)。SNALP可包含可电离脂质(DLinDMA)(例如,在低pH下的阳离子)、中性辅助脂质、胆固醇、可扩散的聚乙二醇(PEG)-脂质或其任何组合。在实施方案中,SNALP可包含合成胆固醇、二棕榈酰基磷脂酰胆碱、3-N-[(w-甲氧基聚乙二醇)2000)氨基甲酰基]-1,2-二肉豆蔻基氧基丙胺和阳离子1,2-二亚油基氧基-3-N,N二甲基氨基丙烷。在实施方案中,SNALP可包含合成胆固醇、1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱、PEG-cDMA和1,2-二亚油基氧基-3-(N;N-二甲基)氨基丙烷(DLinDMA)
其他脂质
脂质粒子还可包含一种或多种其他类型的脂质,例如阳离子脂质,诸如氨基脂质2,2-二亚油基-4-二甲基氨基乙基-[1,3]-二氧杂环戊烷(DLin-KC2-DMA)、DLin-KC2-DMA4、C12-200和辅脂质(colipid)二硬脂酰基磷脂酰胆碱、胆固醇和PEG-DMG。
脂质复合物/多复合物
在实施方案中,递送媒介物包括脂质复合物和/或多复合物。脂质复合物可与带负电荷的细胞膜结合并诱导进入细胞中的内吞作用。脂质复合物的实例可以是包含脂质和非脂质组分的复合物。脂质复合物和多复合物的实例包括FuGENE-6试剂、含有脂质和其他组分的非脂质体溶液、两性离子氨基脂质(ZAL)、(例如,形成DNA/Ca2+微复合物)、聚乙烯亚胺(PEI)(例如,支链PEI)和聚(L-赖氨酸)(PLL)。
细胞穿透肽
在实施方案中,递送媒介物包括细胞穿透肽(CPP)。CPP是促进细胞摄取各种分子货物(例如,从纳米大小的粒子到小的化学分子和大的DNA片段)的短肽。
CPP可具有不同的大小、氨基酸序列和电荷。在实施方案中,CPP可将质膜易位并促进各种分子货物向细胞质或细胞器的递送。CPP可通过不同的机制引入细胞中,例如通过直接穿透膜、内吞作用介导的进入和通过形成暂时性结构的易位。
CPP的氨基酸组成可含有高相对丰度的带正电荷的氨基酸(诸如赖氨酸或精氨酸),或具有含有极性/带电荷的氨基酸和非极性疏水氨基酸的交替模式的序列。这两种类型的结构分别称为聚阳离子或两亲结构。第三类CPP是疏水肽,其仅含有非极性残基,具有低净电荷或具有对细胞摄取至关重要的疏水氨基酸基团。另一种类型的CPP是来自人免疫缺陷病毒1(HIV-1)的反式激活转录激活子(Tat)。CPP的实例包括穿膜肽(Penetratin)、Tat(48-60)、转运肽(Transportan)和(R-AhX-R4)(Ahx是指氨基己酰基)、卡波西成纤维细胞生长因子(FGF)信号肽序列、整合素β3信号肽序列、聚精氨酸肽Args序列、富含鸟嘌呤的分子转运蛋白和甜箭肽(sweet arrow peptide)。CPP和相关应用的实例还包括描述于美国专利号8,372,951中的那些。
CPP可以很容易地用于体外和离体作用,并且可能需要针对每种货物和细胞类型进行广泛优化。在实施方案中,CPP可直接共价附接至Cas蛋白,然后所述Cas蛋白与gRNA复合并递送至细胞。在实施方案中,可将CPP-Cas和CPP-gRNA单独递送至多个细胞。CPP也可用于递送RNP。
CPP可用于将组合物和系统递送至植物。在实施方案中,CPP可用于将组分递送至植物原生质体,然后将所述植物原生质体再生为植物细胞并进一步再生为植物。
DNA纳米线团
在实施方案中,递送媒介物包括DNA纳米线团。DNA纳米线团是指DNA的球形结构(例如,具有纱线球的形状)。纳米线团可通过滚环扩增合成,其中回文序列有助于结构的自组装。然后可向球体加载有效载荷。DNA纳米线团的实例描述于Sun W等人,J Am ChemSoc.2014年10月22日;136(42):14722-5;和Sun W等人,Angew Chem Int Ed Engl.2015年10月5日;54(41):12029-33中。DNA纳米线团可能具有与Cas:gRNA核糖核蛋白复合物中的gRNA部分互补的回文序列。DNA纳米线团可被包被,例如,被PEI包被以诱导内体逃逸。
金纳米粒子
在实施方案中,递送媒介物包括金纳米粒子(也称为AuNP或胶体金)。金纳米粒子可与货物例如Cas:gRNA RNP形成复合物。金纳米粒子可被包被,例如,包被在硅酸盐和内体破坏性聚合物PAsp(DET)中。金纳米粒子的实例包括AuraSense治疗性球形核酸(Therapeutics'Spherical Nucleic Acid)(SNATM)构建体,以及描述于Mout R,等人(2017).ACS Nano 11:2452–8;Lee K等人(2017).Nat Biomed Eng 1:889–901中的那些。
iTOP
在实施方案中,递送媒介物包括iTOP。iTOP是指小分子的组合驱动天然蛋白质的高效细胞内递送,不依赖于任何转导肽。iTOP可用于通过渗透细胞作用和丙烷甜菜碱,使用NaCl介导的高渗性与转导化合物(丙烷甜菜碱)一起触发细胞外大分子到细胞中的巨胞饮摄取来诱导转导。iTOP方法和试剂的实例包括描述于D'Astolfo DS,Pagliero RJ,Pras A等人(2015).Cell 161:674–690中的那些。
基于聚合物的粒子
在实施方案中,递送媒介物可包括基于聚合物的粒子(例如,纳米粒子)。在实施方案中,基于聚合物的粒子可模拟膜融合的病毒机制。基于聚合物的粒子可以是流感病毒机器的合成副本,并与细胞通过内吞途径(一种涉及形成酸性区室的过程)摄取的各种类型的核酸(siRNA、miRNA、质粒DNA或shRNA、mRNA)形成转染复合物。晚期内体中的低pH充当使粒子表面疏水并促进膜穿过的化学开关。一旦进入胞质溶胶,粒子就会释放其有效载荷用于细胞作用。这种活性内体逃逸技术是安全的并且使转染效率最大化,因为它使用的是自然摄取途径。在实施方案中,基于聚合物的粒子可包含烷基化和羧烷基化支链聚乙烯亚胺。在实施方案中,基于聚合物的粒子是VIROMER,例如VIROMER RNAi、VIROMER RED、VIROMERmRNA、VIROMER CRISPR。递送本文的系统和组合物的示例性方法包括描述于以下中的那些:Bawage SS等人,Synthetic mRNA expressed Cas13a mitigates RNA virus infections,www.biorxiv.org/content/10.1101/370460v1.full doi:doi.org/10.1101/370460,RED,a powerful tool for transfection of keratinocytes.doi:10.13140/RG.2.2.16993.61281,/>Transfection-Factbook 2018:technology,productoverview,users'data.,doi:10.13140/RG.2.2.23912.16642。
链球菌溶血素O(SLO)
递送媒介物可以是链球菌溶血素O(SLO)。SLO是由A组链球菌产生的毒素,其通过在哺乳动物细胞膜中产生孔而发挥作用。SLO可以可逆方式发挥作用,这允许将蛋白质(例如,高达100kDa)递送至细胞的胞质溶胶,而不会损害整体活力。SLO的实例包括描述于以下中的那些:Sierig G等人(2003).Infect Immun 71:446–55;Walev I等人(2001).ProcNatl Acad Sci U S A 98:3185–90;Teng KW等人(2017).Elife 6:e25460。
多功能包膜型纳米装置(MEND)
递送媒介物可包含多功能包膜型纳米装置(MEND)。MEND可包含浓缩质粒DNA、PLL核心和脂质膜壳。MEND还可包含细胞穿透肽(例如,硬脂基八聚精氨酸)。细胞穿透肽可在脂质壳中。脂质包膜可用一种或多种功能组分修饰,例如以下中的一种或多种:聚乙二醇(例如,以增加血管循环时间)、用于靶向具体组织/细胞的配体、另外的细胞穿透肽(例如,用于更大的细胞递送)、增强内体逃逸的脂质以及细胞核递送标签。在实施方案中,MEND可以是四层MEND(T-MEND),其可靶向细胞核和线粒体。在示例性实施方案中,MEND可以是PEG-肽-DOPE-缀合的MEND(PPD-MEND),其可靶向膀胱癌细胞。MEND的实例包括描述于Kogure K等人(2004).J Control Release 98:317–23;Nakamura T等人(2012).Acc Chem Res 45:1113–21中的那些。
脂质包被的介孔二氧化硅粒子
递送媒介物可包括脂质包被的介孔二氧化硅粒子。脂质包被的介孔二氧化硅粒子可包含介孔二氧化硅纳米粒子核心和脂质膜壳。二氧化硅核可具有较大的内表面积,从而导致较高的货物装载能力。在实施方案中,可修改孔径、孔化学和整体粒度用于装载不同类型的货物。粒子的脂质涂层也可被修改以最大化货物装载、增加循环时间并提供精确的靶向和货物释放。脂质包被的介孔二氧化硅粒子的实例包括描述于Du X等人(2014).Biomaterials 35:5580–90;Durfee PN等人(2016).ACS Nano 10:8325–45中的那些。
无机纳米粒子
递送媒介物可包括无机纳米粒子。无机纳米粒子的实例包括碳纳米管(CNT)(例如,如Bates K和Kostarelos K.(2013).Adv Drug Deliv Rev 65:2023–33.中所述)、裸介孔二氧化硅纳米粒子(MSNP)(例如,如Luo GF等人(2014).Sci Rep 4:6064中所述)和致密二氧化硅纳米粒子(SiNP)(如Luo D和Saltzman WM.(2000).Nat Biotechnol 18:893–5中所述)。
外泌体
递送媒介物可包括外泌体。外泌体包括膜结合的细胞外囊泡,其可用于容纳和递送各种类型的生物分子,诸如蛋白质、碳水化合物、脂质和核酸及其复合物(例如,RNP)。外泌体的实例包括描述于Schroeder A等人,J Intern Med.2010年1月;267(1):9-21;El-Andaloussi S等人,Nat Protoc.2012年12月;7(12):2112-26;Uno Y等人,Hum GeneTher.2011年6月;22(6):711-9;Zou W等人,Hum Gene Ther.2011年4月;22(4):465-75中的那些。
在实施方案中,外泌体可与货物的一种或多种组分形成复合物(例如,通过直接或间接结合)。在示例性实施方案中,外泌体的分子可与第一衔接蛋白融合,并且货物的组分可与第二衔接蛋白融合。第一衔接蛋白与第二衔接蛋白可彼此特异性结合,从而将货物与外泌体缔合。此类外泌体的实例包括描述于Ye Y等人,Biomater Sci.2020年4月28日.doi:10.1039/d0bm00427h中的那些。
非动物生物体中的应用
本文所述的组合物、系统和方法可用于在植物和真菌中进行基因或基因组询问或编辑或操纵。例如,应用包括植物基因或基因组的调查和/或选择和/或询问和/或比较和/或操纵和/或转化;例如,以创建、鉴定、开发、优化或赋予植物性状或特征,或转化植物或真菌基因组。因此,可提高植物、具有新的性状或特征的组合的新植物或具有增强的性状的新植物的产量。所述组合物、系统和方法可用于定点整合(SDI)或基因编辑(GE)或任何近反向育种(NRB)或反向育种(RB)技术中的植物。
本文的组合物、系统和方法可用于赋予基本上任何植物和真菌以及它们的细胞和组织所需的性状(例如,增强的营养品质、增强的疾病抗性和对生物和非生物胁迫的抗性,以及增加的具有商业价值的植物产物或异源化合物的产量)。所述组合物、系统和方法可用于在不将任何外来基因永久引入基因组的情况下修饰内源性基因或修饰它们的表达。
在实施方案中,所述组合物、系统和方法可用于植物中的或先前已使用RNAi或类似基因组编辑技术的情况下的基因组编辑;参见例如,Nekrasov,“Plant genome editingmade easy:targeted mutagenesis in model and crop plants using the CRISPR-Cassystem,”Plant Methods2013,9:39(doi:10.1186/1746-4811-9-39);Brooks,“Efficientgene editing in tomato in the first generation using the CRISPR-Cas9 system,”Plant Physiology 2014年9月pp 114.247577;Shan,“Targeted genome modification ofcrop plants using a CRISPR-Cas system,”Nature Biotechnology 31,686-688(2013);Feng,“Efficient genome editing in plants using a CRISPR/Cas system,”CellResearch(2013)23:1229–1232.doi:10.1038/cr.2013.114;在线发布于2013年8月20日;Xie,“RNA-guided genome editing in plants using a CRISPR-Cas system,”MolPlant.2013年11月;6(6):1975-83.doi:10.1093/mp/sst119。Epub 2013年8月17日;Xu,“Gene targeting using the Agrobacterium tumefaciens-mediated CRISPR-Cassystem in rice,”Rice 2014,7:5(2014),Zhou等人,“Exploiting SNPs for biallelicCRISPR mutations in the outcrossing woody perennial Populus reveals 4-coumarate:CoA ligase specificity and Redundancy,”New Phytologist(2015)(Forum)1-4(仅在www.newphytologist.com在线提供);Caliando等人,“Targeted DNAdegradation using a CRISPR device stably carried in the host genome,NATURECOMMUNICATIONS 6:6989,DOI:10.1038/ncomms7989,www.nature.com/naturecommunications DOI:10.1038/ncomms7989;美国专利号6,603,061-Agrobacterium-Mediated Plant Transformation Method;美国专利号7,868,149-PlantGenome Sequences and Uses Thereof以及US 2009/0100536-Transgenic Plants withEnhanced Agronomic Traits,Morrell等人“Crop genomics:advances andapplications,”Nat Rev Genet.2011年12月29日;13(2):85-96,其各自的所有内容和公开内容均以引用的方式整体并入本文。利用所述组合物、系统和方法的方面可类似于在植物中使用所述组合物和系统,并且提及了亚利桑那大学(University of Arizona)网站“CRISPR-PLANT”(www.genome.arizona.edu/crispr/)(由宾夕法尼亚州立大学(PennState)和AGI支持)。
所述组合物、系统和方法也可用于原生质体。“原生质体”是指已使用例如机械或酶手段完全或部分去除其保护性细胞壁,从而产生活植物的完整生化能力单位的植物细胞,所述完整生化能力单位可在适当的生长条件下重新形成其细胞壁、增殖并再生生长成完整植物。
所述组合物、系统和方法可用于筛选目标基因(例如,内源性、突变)。在实施方案中,目标基因包括编码涉及产生具有附加营养价值的组分的酶的那些基因,或通常影响跨物种、门和植物界的目标农艺性状的基因。通过选择性地靶向例如编码代谢途径的酶的基因,可鉴定负责植物的某些营养方面的基因。类似地,通过选择性地靶向可能影响所需的农艺性状的基因,可鉴定相关基因。因此,本公开涵盖用于编码涉及产生具有特定营养价值的化合物的酶的基因和/或农艺性状的筛选方法。
还应理解,除非另有明显说明,否则本文提及的动物细胞也可加以必要的变通适用于植物或真菌细胞;并且,本文中具有降低的脱靶效应的酶和使用此类酶的系统可用于植物应用,包括本文提及的那些。
在实施方案中,引入植物和真菌的核酸可被密码子优化用于在植物和真菌中表达。密码子优化的方法包括描述于Kwon KC等人,Codon Optimization to EnhanceExpression Yields Insights into Chloroplast Translation,Plant Physiol.2016年9月;172(1):62-77中的那些。
所述组合物和系统中的组分(例如,Cas蛋白)还可包含本文所述的一个或多个功能结构域。在实施方案中,功能结构域可以是核酸外切酶。此种核酸外切酶可提高Cas蛋白功能的效率,例如诱变效率。功能结构域的实例是Trex2,如Weiss T等人,www.biorxiv.org/conte nt/10.1101/2020.04.11.037572v1,doi:doi.org/10.1101/2020.04.11.037572中所述。
植物的实例
本文的组合物、系统和方法可用于赋予基本上任何植物所需的性状。可对多种植物和植物细胞系统进行工程化以获得所需的生理和农艺特征。一般来讲,术语“植物”涉及植物界的任何各种光合、真核、单细胞或多细胞生物体,其特征在于通过细胞分裂生长,含有叶绿体,并且具有由纤维素组成的细胞壁。术语植物涵盖单子叶植物和双子叶植物。
所述组合物、系统和方法可用于广泛的植物,例如像属于以下目的双子叶植物:木兰目(Magniolales)、八角目(Illiciales)、樟目(Laurales)、胡椒目(Piperales)、马兜铃目(Aristochiales)、睡莲目(Nymphaeales)、毛茛目(Ranunculales)、罂粟目(Papeverales)、瓶子草科(Sarraceniaceae)、昆栏树目(Trochodendrales)、金缕梅目(Hamamelidales)、杜仲目(Eucomiales)、塞子木目(Leitneriales)、杨梅目(Myricales)、壳斗目(Fagales)、木麻黄目(Casuarinales)、石竹目(Caryophyllales)、肉穗果目(Batales)、寥目(Polygonales)、白花丹目(Plumbaginales)、五桠果目(Dilleniales)、山茶目(Theales)、锦葵目(Malvales)、荨麻目(Urticales)、玉蕊目(Lecythidales)、堇菜目(Violales)、杨柳目(Salicales)、白花菜目(Capparales)、杜鹃花目(Ericales)、岩梅目(Diapensales)、柿目(Ebenales)、报春花目(Primulales)、薔薇目(Rosales)、豆目(Fabales)、川草目(Podostemales)、小二仙草目(Haloragales)、桃金娘目(Myrtales)、山茱萸目(Cornales)、山龙眼目(Proteales)、檀香目(San tales)、大花草目(Rafflesiales)、卫矛目(Celastrales)、大戟目(Euphorbiales)、鼠李目(Rhamnales)、无患子目(Sapindales)、胡桃目(Juglandales)、牻牛儿苗目(Geraniales)、远志目(Polygalales)、伞形目(Umbellales)、龙胆目(Gentianales)、花葱目(Polemoniales)、唇形目(Lamiales)、车前目(Plantaginales)、玄参目(Scrophulariales)、桔梗目(Campanulales)、茜草目(Rubiales)、川续断目(Dipsacales)和菊目(Asterales);诸如属于以下目的单子叶植物:泽泻目(Alismatales)、水鳖目(Hydrocharitales)、茨藻目(Najadales)、霉草目(Triuridales)、鸭跖草目(Commelinales)、谷精草目(Eriocaulales)、帚灯草目(Restionales)、禾本目(Poales)、灯芯草目(Juncales)、莎草目(Cyperales)、香蒲目(Typhales)、凤梨目(Bromeliales)、姜目(Zingiberales)、棕榈目(Arecales)、巴拿马草目(Cyclanthales)、露兜树目(Pandanales)、天南星目(Arales)、百合目(Lilliales)和兰目(Orchid ales),或属于裸子植物(Gymnospermae)的那些植物,例如属于以下目的那些植物:松目(Pinales)、银杏目(Ginkgoales)、苏铁目(Cycadales)、南洋杉目(Araucariales)、柏目(Cupressales)和买麻藤目(Gnetales)。
本文的组合物、系统和方法可用于广泛的植物物种,包括在以下双子叶植物、单子叶植物或裸子植物属的非限制性列表中:颠茄属(Atropa)、油丹属(Alseodaphne)、腰果属(Anacardium)、落花生属(Arachis)、琼楠属(Beilschmiedia)、芸薹属(Brassica)、红花属(Carthamus)、木防己属(Cocculus)、巴豆属(Croton)、黄瓜属(Cucumis)、柑橘属(Citrus)、西瓜属(Citrullus)、辣椒属(Capsicum)、长春花属(Catharanthus)、椰子属(Cocos)、咖啡属(Coffea)、南瓜属(Cucurbita)、胡萝卜属(Daucus)、半聚果属(Duguetia)、花菱草属(Eschscholzia)、榕属(Ficus)、草莓属(Fragaria)、海罂粟属(Glaucium)、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、橡胶树属(Hevea)、天仙子属(Hyoscyamus)、莴苣属(Lactuca)、卷枝藤属(Landolphia)、亚麻属(Linum)、木姜子属(Litsea)、番茄属(Lycopersicon)、羽扇豆属(Lupinus)、木薯属(Manihot)、马郁兰属(Majorana)、苹果属(Malus)、苜蓿属(Medicago)、烟草属(Nicotiana)、木犀榄属(Olea)、银胶菊属(Parthenium)、罂粟属(Papaver)、鳄梨属(Persea)、菜豆属(Phaseolus)、黄连木属(Pistacia)、豌豆属(Pisum)、梨属(Pyrus)、李属(Prunus)、萝卜属(Raphanus)、蓖麻属(Ricinus)、千里光属(Senecio)、风龙属(Sinomenium)、千金藤属(Stephania)、白芥属(Sinapis)、茄属(Solanum)、可可属(Theobroma)、车轴草属(Trifolium)、胡卢巴属(Trigonella)、蚕豆属(Vicia)、蔓长春花属(Vinca)、葡萄属(Vilis)和豇豆属(Vigna);以及以下属:葱属(Allium)、须芒草属(Andropogon)、画眉草属(Aragrostis)、天门冬属(Asparagus)、燕麦属(Avena)、狗牙根属(Cynodon)、油棕属(Elaeis)、羊茅属(Festuca)、羊茅黑麦草属(Festulolium)、萱草属(Heterocallis)、大麦属(Hordeum)、浮萍属(Lemna)、黑麦草属(Lolium)、芭蕉属(Musa)、稻属(Oryza)、黍属(Panicum)、狼尾草属(Pannesetum)、梯牧草属(Phleum)、早熟禾属(Poa)、黑麦属(Secale)、高粱属(Sorghum)、小麦属(Triticum)、玉蜀黍属(Zea)、冷杉属(Abies)、杉木属(Cunninghamia)、麻黄属(Ephedra)、云杉属(Picea)、松属(Pinus)和黄杉属(Pseudotsuga)。
在实施方案中,用于工程化的靶植物和植物细胞包括那些单子叶植物和双子叶植物,诸如包括以下的作物:谷类作物(例如,小麦、玉米、水稻、小米、大麦)、水果作物(例如,番茄、苹果、梨、草莓、橙)、饲料作物(例如,苜蓿)、块根蔬菜作物(例如,胡萝卜、马铃薯、甜菜、山药)、叶菜作物(例如,生菜、菠菜);开花植物(例如,矮牵牛、玫瑰、菊花)、针叶树和松树(例如,松冷杉、云杉);用于植物修复的植物(例如,重金属积聚植物);油料作物(例如,向日葵、油菜籽)和用于实验目的的植物(例如,拟南芥)。具体地,植物旨在包括但不限于被子植物和裸子植物,诸如金合欢、苜蓿、苋菜、苹果、杏、洋蓟、白蜡树、芦笋、鳄梨、香蕉、大麦、豆类、甜菜、桦树、山毛榉、黑莓、蓝莓、西兰花、球芽甘蓝、卷心菜、油菜、哈密瓜、胡萝卜、木薯、花椰菜、雪松、谷物、芹菜、栗子、樱桃、大白菜、柑橘、小柑橘、三叶草、咖啡、玉米、棉花、豇豆、黄瓜、柏树、茄子、榆树、菊苣、桉树、茴香、无花果、冷杉、天竺葵、葡萄、葡萄柚、落花生、地樱桃、树胶铁杉、山核桃、羽衣甘蓝、奇异果、大头菜、落叶松、生菜、韭菜、柠檬、青柠、刺槐、松树、铁线蕨、玉米、芒果、枫、甜瓜、小米、蘑菇、芥末、坚果、橡木、燕麦、油棕、秋葵、洋葱、橙子、观赏植物或花或树、木瓜、棕榈、欧芹、防风草、豌豆、桃、花生、梨、泥炭、胡椒、柿子、木豆、松树、菠萝、车前草、李子、石榴、马铃薯、南瓜、菊苣、萝卜、油菜籽、覆盆子、水稻、黑麦、高粱、红花、黄华柳、大豆、菠菜、云杉、笋瓜、草莓、甜菜、甘蔗、向日葵、甘薯、甜玉米、橘子、茶、烟草、番茄、树木、黑小麦、草坪草、芜菁、藤蔓、核桃、豆瓣菜、西瓜、小麦、山药、红豆杉和西葫芦。
术语植物还涵盖藻类,它们主要是光合自养生物,主要是由于缺乏根、叶和其他高等植物特有的器官而形成的。所述组合物、系统和方法可用于广泛的“藻类”或“藻类细胞”。藻类的实例包括真核生物门,包括红藻门(Rhodophyta)(红藻)、绿藻门(Chlorophyta)(绿藻)、褐藻门(Phaeophyta)(褐藻)、硅藻门(Bacillariophyta)(硅藻)、真眼点藻门(Eustigmatophyta)和甲藻门(dinoflagellates)以及原核生物蓝藻门(Cyanobacteria)(蓝绿藻)。藻类物种的实例包括以下中的那些:双眉藻属(Amphora)、鱼腥藻属(Anabaena)、纤维藻属(Anikstrodesmis)、葡萄藻属(Botryococcus)、角毛藻属(Chaetoceros)、衣藻属(Chlamydomonas)、小球藻属(Chlorella)、绿球藻属(Chlorococcum)、小环藻属(Cyclotella)、筒柱藻属(Cylindrotheca)、杜氏藻属(Dunaliella)、球石藻属(Emiliana)、眼虫藻属(Euglena)、红球藻属(Hematococcus)、等鞭金藻属(Isochrysis)、单鞭金藻属(Monochrysis)、单针藻属(Monoraphidium)、微拟球藻属(Nannochloris)、拟微绿球藻属(Nannnochloropsis)、舟形藻属(Navicula)、肾鞭藻属(Nephrochloris)、肾爿藻属(Nephroselmis)、菱形藻属(Nitzschia)、节球藻属(Nodularia)、念珠藻属(Nostoc)、棕鞭藻属(Oochromonas)、卵囊藻属(Oocystis)、颤藻属(Oscillartoria)、巴夫藻属(Pavlova)、褐指藻属(Phaeodactylum)、扁藻属(Playtmonas)、颗石藻属(Pleurochrysis)、紫菜属(Porhyra)、伪鱼腥藻属(Pseudoanabaena)、塔胞藻属(Pyramimonas)、裂丝藻属(Stichococcus)、聚球藻菌属(Synechococcus)、集胞藻属(Synechocystis)、扁藻属(Tetraselmis)、海链藻属(Thalassiosira)和束毛藻属(Trichodesmium)。
植物启动子
为了确保在植物细胞中的适当表达,本文的组分和系统的组分可置于植物启动子的控制下。植物启动子是可在植物细胞中操作的启动子。植物启动子能够在植物细胞中启动转录,无论其来源是否是植物细胞。设想使用不同类型的启动子。
在实施方案中,植物启动子是组成型植物启动子,其是能够在植物的所有或几乎所有发育阶段期间在所有或几乎所有植物组织中表达其控制的开放阅读框(ORF)(称为“组成型表达”)的启动子。组成型启动子的一个实例是花椰菜花叶病毒35S启动子。在实施方案中,植物启动子是受调控的启动子,其不是组成性地而是以时间和/或空间调控的方式引导基因表达,并且包括组织特异性、组织优选的和诱导型启动子。不同的启动子可引导基因在不同的组织或细胞类型中,或在不同的发育阶段,或响应不同的环境条件的表达。在实施方案中,植物启动子是组织优选的启动子,其可用于靶向特定植物组织内的某些细胞类型中的增强表达,例如叶或根中的维管细胞或种子的特定细胞中的增强表达。
示例性植物启动子包括从植物、植物病毒和细菌诸如土壤杆菌或根瘤菌中获得的那些,它们包含在植物细胞中表达的基因。启动子的另外的实例包括描述于Kawamata等人,(1997)Plant Cell Physiol38:792-803;Yamamoto等人,(1997)Plant J 12:255-65;Hire等人,(1992)Plant Mol Biol 20:207-18,Kuster等人,(1995)Plant Mol Biol29:759-72,和Capana等人,(1994)Plant Mol Biol 25:681 -91中的那些。
在实施方案中,植物启动子可以是诱导型启动子,其是可诱导的并且允许对基因编辑的时空控制,或者基因表达可使用某种形式的能量。能量的形式可包括声能、电磁辐射、化学能和/或热能。诱导型系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off)、小分子双杂交转录激活系统(FKBP、ABA等)或光诱导型系统(光敏色素、LOV结构域或隐花色素),诸如以序列特异性方式引导转录活性变化的光诱导型转录效应物(LITE)。在特定的实例中,光诱导型系统的组分包括Cas蛋白、光响应性细胞色素异二聚体(例如来自拟南芥(Arabidopsis thaliana))和转录激活/抑制结构域。
在实施方案中,启动子可以是化学调控的启动子(其中外源性化学物质的应用诱导基因表达)或化学抑制型启动子(其中化学物质的应用抑制基因表达)。化学诱导型启动子的实例包括玉米ln2-2启动子(由苯磺酰胺类除草剂安全剂激活)、玉米GST启动子(由用作芽前除草剂的疏水亲电化合物激活)、烟草PR-1a启动子(由水杨酸激活)、由抗生素调控的启动子(诸如四环素诱导型和四环素抑制型启动子)。
植物基因组中的稳定整合
在实施方案中,可引入编码组合物和系统的组分的多核苷酸以稳定整合到植物细胞的基因组中。在实施方案中,载体或表达系统可用于此种整合。载体或表达系统的设计可根据指导RNA和/或Cas基因表达的时间、地点和条件进行调整。在实施方案中,多核苷酸可整合到植物的细胞器中,诸如质体、线粒体或叶绿体。表达系统的元件可位于一个或多个表达构建体上,所述表达构建体是环状的,诸如质粒或转化载体,或是非环状的,诸如线性双链DNA。
在实施方案中,整合方法通常包括以下步骤:选择合适的宿主细胞或宿主组织,将构建体引入宿主细胞或宿主组织,以及从其中再生植物细胞或植物。在实施方案中,用于稳定整合到植物细胞基因组中的表达系统可含有以下元件中的一个或多个:启动子元件,其可用于在植物细胞中表达RNA和/或Cas酶;5'非翻译区,用于增强表达;内含子元件,用于进一步增强某些细胞(诸如单子叶细胞)中的表达;多克隆位点,用于为插入指导RNA和/或Cas基因序列和其他所需元件提供方便的限制性位点;和3'非翻译区,用于提供表达的转录物的高效终止。
植物中的瞬时表达
在实施方案中,组合物和系统的组分可在植物细胞中瞬时表达。在实施方案中,组合物和系统可仅当指导RNA和Cas蛋白都存在于细胞中时修饰靶核酸,使得可以进一步控制基因组修饰。由于Cas蛋白的表达是瞬时的,因此从此类植物细胞再生的植物通常不含外来DNA。在示例性实施方案中,Cas蛋白被稳定表达并且指导序列被瞬时表达。
可将DNA和/或RNA(例如,mRNA)引入植物细胞中用于瞬时表达。在此类情况下,可提供足够量的引入的核酸以修饰细胞,但所引入的核酸在经过预期的一段时间后或在一次或多次细胞分裂后不会持续存在。
可使用合适的载体实现瞬时表达。可用于瞬时表达的示例性载体包括pEAQ载体(可针对土壤杆菌介导的瞬时表达进行定制)和卷心菜叶卷曲病毒(CaLCuV),以及描述于Sainsbury F.等人,Plant Biotechnol J.2009Sep;7(7):682-93;和Yin K等人,Scientific Reports第5卷,文章编号:14926(2015)中的载体。
还设想了上述不同方法的组合。
易位至特定植物细胞器和/或在特定植物细胞器中表达
本文的组合物和系统可包含用于易位至特定植物细胞器和/或在特定植物细胞器中表达的元件。
叶绿体靶向
在实施方案中,设想所述组合物和系统用于特异性修饰叶绿体基因或确保在叶绿体中的表达。所述组合物和系统(例如,Cas蛋白、指导分子或它们的编码多核苷酸)可被转化、分隔和/或靶向至叶绿体。在一个实例中,在质体基因组中引入遗传修饰可减少生物安全问题,诸如通过花粉的基因流动。
叶绿体转化方法的实例包括粒子轰击、PEG处理和显微注射,以及将转化盒从核基因组易位至质体。在实施方案中,叶绿体的靶向可通过在叶绿体定位序列和/或表达构建体中并入编码叶绿体转运肽(CTP)或质体转运肽的序列来实现,所述序列与编码组合物和系统的组分的序列的5’区可操作地连接。叶绿体的转化、靶向和定位的另外的实例包括描述于WO2010061186、Protein Transport into Chloroplasts,2010,Annual Review ofPlant Biology,第61卷:157-180和US 20040142476中的那些,所述文献以引用的方式整体并入本文。
植物中的示例性应用
所述组合物、系统和方法可用于在目标植物(例如,作物)中生成遗传变异。可提供靶向基因组中一个或多个位置的一种或多种指导分子,例如指导分子的文库,并将其与Cas效应蛋白一起引入植物细胞中。例如,可生成一组基因组规模的点突变和基因敲除。在实施方案中,所述组合物、系统和方法可用于从如此获得的细胞生成植物部分或植物,并针对目标性状筛选细胞。靶基因可同时包括编码区和非编码区。在实施方案中,性状是耐逆性,并且所述方法是用于生成耐逆性作物品种的方法。
在实施方案中,所述组合物、系统和方法用于修饰内源性基因或修饰它们的表达。组分的表达可通过Cas核酸酶的直接活性和任选地引入重组模板DNA,或者通过修饰被靶向的基因来诱导基因组的靶向修饰。上文所述的不同策略允许Cas介导的靶向基因组编辑,而不要求将组分引入植物基因组中。
在实施方案中,修饰可在不将任何外来基因(包括编码组分的那些)永久引入植物基因组中的情况下进行,以避免植物基因组中存在外来DNA。这可能会引起人们的兴趣,因为对非转基因植物的调控要求不那么严格。瞬时引入植物细胞中的组分通常在杂交时被去除。
例如,可通过所述组合物和系统的组分的瞬时表达来进行修饰。瞬时表达可通过用病毒载体递送组合物和系统的组分,借助颗粒分子诸如纳米粒子或CPP递送到原生质体中来进行。
具有所需性状的植物的生成
本文的组合物、系统和方法可用于将所需性状引入植物。所述方法包括引入一种或多种外来基因以赋予目标性状,编辑或调节内源性基因以赋予目标性状。
农艺性状
在实施方案中,可通过影响具体植物性状来改良作物植物。性状的实例包括改良的农艺性状,诸如除草剂抗性、抗病性、非生物耐逆性、高产、和优越品质、杀有害生物剂抗性、抗病性、昆虫和线虫抗性、针对寄生杂草的抗性、耐旱性、营养价值、耐逆性、自花授粉无效、饲料消化率生物量和谷物产量。
在实施方案中,可将赋予对有害生物或疾病的抗性的基因引入植物。在植物中存在赋予此种抗性的内源性基因的情况下,可增强它们的表达和功能(例如,通过引入额外的拷贝、增强表达和/或活性的修饰)。
赋予抗性的基因的实例包括植物抗病性基因(例如,Cf-9、Pto、RSP2、SlDMR6-1);赋予对以下各项的抗性的基因:有害生物(例如,描述于国际专利公布号WO96/30517中的那些),苏云金芽孢杆菌(Bacillus thuringiensis)蛋白,凝集素,维生素结合蛋白(例如,抗生物素蛋白),酶抑制剂(例如,蛋白酶或蛋白酶抑制剂或淀粉酶抑制剂),昆虫特异性激素或信息素(例如,蜕皮激素或保幼激素、其变体、基于其的模拟物、或其拮抗剂或激动剂);或涉及产生和调控以下各项的基因:此类激素和信息素,昆虫特异性肽或神经肽,昆虫特异性毒液(例如,由蛇、黄蜂等产生,或其类似物),负责单萜、倍半萜、类固醇、异羟肟酸、苯丙烷衍生物或另一种具有杀昆虫活性的非蛋白质分子的过度积聚的酶,涉及生物活性分子修饰的酶(例如,糖酵解酶、蛋白水解酶、脂肪分解酶、核酸酶、环化酶、转氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹性蛋白酶、几丁质酶和葡聚糖酶,无论是天然的还是合成的),刺激信号转导的分子,病毒侵入性蛋白质或由其衍生的复合毒素,由病原体或寄生虫在自然界中产生的发育阻滞蛋白,由植物在自然界中产生的发育阻滞蛋白,或其任何组合。
所述组合物、系统和方法可用于鉴定、筛选、引入或去除突变或导致对某些病原体(例如宿主特异性病原体)产生易感性的遗传变异的序列。此种方法可生成具有非宿主抗性的植物,例如,宿主和病原体不相容,或者可对病原体的所有种族有部分抗性,通常由许多基因控制,和/或还对病原体的某些种族有完全抗性但对其他种族没有完全抗性。
在实施方案中,所述组合物、系统和方法可用于修饰涉及植物疾病的基因。此类基因可被去除、灭活或以其他方式调控或修饰。植物疾病的实例包括描述于US20140213619A1的-中的那些,所述专利以引用的方式整体并入本文。
在实施方案中,可将赋予对除草剂的抗性的基因引入植物。赋予对除草剂的抗性的基因的实例包括赋予对抑制生长点或分生组织的除草剂(诸如咪唑啉酮或磺酰脲)的抗性的基因,赋予草甘膦耐受性的基因(例如,分别由例如突变体5-烯醇丙酮酰莽草酸-3-磷酸合酶基因、aroA基因和草甘膦乙酰转移酶(GAT)基因赋予的抗性),或赋予对其他膦酰基化合物诸如草铵膦的抗性的基因(来自链霉菌属物种(包括吸水链霉菌(Streptomyceshygroscopicus)和绿色链霉菌(Streptomyces viridichromogenes))的膦丝菌素(phosphinothricin)乙酰转移酶(PAT)基因),以及通过ACCase抑制剂编码基因赋予对吡啶氧基或苯氧基丙酸和环己酮的抗性的基因,赋予对抑制光合作用的除草剂的抗性的基因(诸如三嗪(psbA和gs+基因)或苯甲腈(腈水解酶基因)和谷胱甘肽S-转移酶)),编码使除草剂解毒的酶或具有抑制抗性的突变谷氨酰胺合酶的基因,编码解毒酶的基因是编码膦丝菌素乙酰转移酶(诸如来自链霉菌属物种的bar或pat蛋白)的酶,编码羟苯基丙酮酸双加氧酶(HPPD)抑制剂(例如天然存在的HPPD抗性酶)的基因,以及编码突变或嵌合HPPD酶的基因。
在实施方案中,可将涉及非生物耐逆性的基因引入植物。基因的实例包括能够降低聚(ADP-核糖)聚合酶(PARP)基因的表达和/或活性的基因、能够降低PARG编码基因的表达和/或活性的转基因、编码烟酰胺腺嘌呤二核苷酸补救合成途径的植物功能性酶的基因,所述酶包括烟酰胺酶,烟酸磷酸核糖基转移酶,烟酸单核苷酸腺苷转移酶,烟酰胺腺嘌呤二核苷酸合成酶,或烟酰胺磷酸核糖基转移酶,涉及碳水化合物生物合成的酶,涉及聚果糖(例如菊粉型和levan型)产生、α-1,6支链α-1,4-葡聚糖产生、交替糖(alternan)产生、透明质酸产生的酶。
在实施方案中,可将改良抗旱性的基因引入植物。基因的实例是泛素蛋白连接酶蛋白(UPL)、蛋白(UPL3)、DR02、DR03、ABC转运蛋白和DREB1A。
营养改良植物
在实施方案中,所述组合物、系统和方法可用于产生营养改良植物。在实施方案中,此类植物可提供功能性食物,例如可提供超出其所含传统营养素的健康益处的改变的食物或食物成分。在示例性实施方案中,此类植物可提供保健食物,例如可被视为食物或食物的一部分并提供健康益处(包括预防和治疗疾病)的物质。保健食物可用于预防和/或治疗动物和人的疾病,例如癌症、糖尿病、心血管疾病和高血压。
改良植物可自然产生一种或多种所需化合物,并且修饰可提高化合物的水平或活性或质量。在实施方案中,改良植物可能不会自然产生化合物,而修饰使得植物能够产生此类化合物。在实施方案中,所述组合物、系统和方法用于间接修饰这些化合物的内源性合成,例如通过修饰控制这种化合物代谢的一个或多个转录因子。
营养改良植物的实例包括包含改变的蛋白质质量、含量和/或氨基酸组成、必需氨基酸含量、油和脂肪酸、碳水化合物、维生素和类胡萝卜素、功能性次生代谢物和矿物质的植物。在实施方案中,改良植物可包含或产生具有健康益处的化合物。营养改良植物的实例包括描述于Newell-McGloughlin,Plant Physiology,2008年7月,第147卷,第939–953页中的那些。
可产生的化合物的实例包括类胡萝卜素(例如,α-胡萝卜素或β-胡萝卜素)、叶黄素、番茄红素、玉米黄质、膳食纤维(例如,不溶性纤维、β-葡聚糖、可溶性纤维)、脂肪酸(例如,ω-3脂肪酸、共轭亚油酸、GLA)、类黄酮(例如,羟基肉桂酸酯、黄酮醇、儿茶素和单宁)、硫代葡萄糖苷、吲哚、异硫氰酸酯(例如,萝卜硫素)、酚类(例如,二苯乙烯、咖啡酸和阿魏酸、表儿茶素)、植物甾烷醇/甾醇、果聚糖、菊粉、低聚果糖、皂苷、大豆蛋白、植物雌激素(例如,异黄酮、木脂素)、硫化物和硫醇,诸如二烯丙基硫化物、烯丙基甲基三硫化物、二硫代硫酮、单宁(诸如原花青素)、或其任何组合。
所述组合物、系统和方法也可用于改变蛋白质/淀粉功能、保质期、味道/美学、纤维质量和过敏原、抗营养素和毒素减少性状。
可被修饰以引入性状的基因和核酸的实例包括硬脂基-ACP去饱和酶、与可能导致特征在于低植酸水平的玉米突变体的单个等位基因相关连的DNA、Tf RAP2.2及其相互作用的配偶体SINAT2、Tf Dof1和DOF Tf AtDof1.1(OBP2)。
多倍体植物的修饰
所述组合物、系统和方法可用于修饰多倍体植物。多倍体植物携带其基因组的重复拷贝(例如多达六个,诸如在小麦中)。在实施方案中,所述组合物、系统和方法可被多路复用以一次性影响基因的所有拷贝,或靶向数十个基因。例如,所述组合物、系统和方法可用于同时确保负责抑制对疾病的防御的不同基因中的功能突变丧失。所述修饰可以是同时抑制TaMLO-Al、TaMLO-Bl和TaMLO-Dl核酸序列在小麦植物细胞中的表达并由此再生小麦植物,以确保小麦植物对白粉病具有抗性(例如,如国际专利公布号WO 2015109752中所述)。
果实成熟调控
所述组合物、系统和方法可用于调控果实的成熟。成熟是水果和蔬菜成熟过程中的一个正常阶段。仅在开始几天后,所述成熟就可能使水果或蔬菜无法食用,这可能会给农民和消费者带来重大损失。
在实施方案中,所述组合物、系统和方法用于减少乙烯产生。在实施方案中,所述组合物、系统和方法可用于抑制ACC合酶的表达和/或活性,插入ACC脱氨酶基因或其功能片段,插入SAM水解酶基因或其功能片段,抑制ACC氧化酶基因表达
可替代地或另外地,所述组合物、系统和方法可用于修饰乙烯受体(例如,抑制ETR1)和/或聚半乳糖醛酸酶(PG)。基因的抑制可通过将突变、反义序列和/或基因的截短拷贝引入基因组来实现。
增加植物的储存寿命
在实施方案中,所述组合物、系统和方法用于修饰涉及产生影响植物或植物部分的储存寿命的化合物的基因。所述修饰可能在阻止马铃薯块茎中还原糖的积聚的基因中。在高温处理后,这些还原糖与游离氨基酸反应,从而产生棕色的苦味产物和升高水平的丙烯酰胺,丙烯酰胺是一种潜在的致癌物。在特定的实施方案中,本文提供的方法用于降低或抑制液泡转化酶基因(VInv)的表达,所述基因编码将蔗糖分解成葡萄糖和果糖的蛋白质。
减少植物中的过敏原
在实施方案中,所述组合物、系统和方法用于生成过敏原水平降低的植物,使它们对消费者更安全。为此,所述组合物、系统和方法可用于鉴定和修饰(例如,抑制)负责产生植物过敏原的一种或多种基因。此类基因的实例包括Lol p5,以及花生、大豆、扁豆、豌豆、羽扇豆、青豆、绿豆中的那些基因,诸如描述于Nicolaou等人,Current Opinion inAllergy and Clinical Immunology 2011;11(3):222)中的那些,所述文献以引用的方式整体并入本文。
雄性不育植物的生成
所述组合物、系统和方法可用于生成雄性不育植物。与近交植物相比,杂交植物通常具有有利的农艺性状。然而,对于自花授粉植物,杂交种的生成可能具有挑战性。在不同的植物类型(例如,玉米和水稻)中,已鉴定出对植物可育性,更特别地是雄性可育性重要的基因。被如此遗传改变的植物可用于杂交育种计划。
所述组合物、系统和方法可用于修饰涉及雄性可育性的基因,例如使雄性可育性所需的基因失活(诸如通过引入突变)。涉及雄性可育性的基因的实例包括细胞色素P450样基因(MS26)或大范围核酸酶基因(MS45),以及描述于Wan X等人,Mol Plant.2019年3月4日;12(3):321-342;和Kim YJ等人,Trends Plant Sci.2018Jan;23(1):53-65中的那些。
增加植物的生育期
在实施方案中,所述组合物、系统和方法可用于延长植物诸如水稻的生育期。例如,可靶向水稻生育期基因诸如Ehd3以在所述基因中产生突变,并且可选择用于延长再生植物生育期的幼苗。
产物的早期产量的产生
在实施方案中,所述组合物、系统和方法可用于产生产物的早期产量。例如,可调节开花过程,例如,通过使开花阻遏基因诸如SP5G突变。此类方法的实例包括描述于Soyk S等人,Nat Genet.2017年1月;49(1):162-168中的那些。
石油和生物燃料生产
所述组合物、系统和方法可用于生成用于油和生物燃料生产的植物。生物燃料包括由植物和植物衍生资源制成的燃料。生物燃料可从有机物质中提取,其能量是通过碳固定过程获得的,或者是通过使用或转化生物质而制成的。这种生物质可直接用于生物燃料,或可通过热转化、化学转化和生化转化来转化为方便的含能物质。这种生物质转化可产生固体、液体或气体形式的燃料。生物燃料包括生物乙醇和生物柴油。生物乙醇可通过纤维素(淀粉)的糖发酵过程产生,所述纤维素可源自玉米和甘蔗。生物柴油可从油料作物(诸如油菜籽、棕榈和大豆)中产生。生物燃料可用于运输。
用于产生植物油和生物燃料的植物的生成
所述组合物、系统和方法可用于生成表达或过表达高水平的油或生物燃料的藻类(例如硅藻)和其他植物(例如葡萄)。
在实施方案中,所述组合物、系统和方法可用于修饰涉及改变脂质的量和/或脂质的质量的基因。此类基因的实例包括涉及脂肪酸合成途径的那些,例如,乙酰辅酶A羧化酶、脂肪酸合酶、3-酮酰基-酰基-载剂蛋白合酶III、甘油-3-磷酸脱氢酶(G3PDH)、烯酰基-酰基载剂蛋白还原酶(烯酰基-ACP-还原酶)、甘油-3-磷酸酰基转移酶、溶血磷脂酰基转移酶或二酰基甘油酰基转移酶、磷脂:二酰基甘油酰基转移酶、磷脂酸磷酸酶、脂肪酸硫酯酶诸如棕榈酰蛋白硫酯酶或苹果酸酶活性。
在其他实施方案中,设想产生具有增加的脂质积聚的硅藻。这可以通过靶向降低脂质分解代谢的基因来实现。基因的实例包括涉及三酰基甘油和游离脂肪酸的激活、脂肪酸的β-氧化的那些基因,诸如酰基-辅酶A合成酶、3-酮酰基-辅酶A硫解酶、酰基-辅酶A氧化酶活性和磷酸葡萄糖变位酶的基因。
在实施方案中,藻类可被修饰用于产生油和生物燃料,包括脂肪酸(例如,脂肪酯,诸如酸甲酯(FAME)和脂肪酸乙酯(FAEE))。修饰微藻的方法的实例包括描述于Stovicek等人Metab.Eng.Comm.,2015;2:1;美国专利号8,945,839;和国际专利公布号WO 2015/086795中的那些。
在实施方案中,可在植物(例如,藻类)中引入(例如,过表达)一种或多种基因,以从碳源(例如,醇)产生油和生物燃料(例如,脂肪酸)。基因的实例包括编码以下的基因:酰基-辅酶A合酶、酯合酶、硫酯酶(例如,tesA、'tesA、tesB、fatB、fatB2、fatB3、fatAl或fatA)、酰基-辅酶A合酶(例如,fadD、JadK、BH3103、pfl-4354、EAV15023、fadDl、fadD2、RPC_4074、fadDD35、fadDD22、faa39)、酯合酶(例如,来自希蒙得木(Simmondsia chinensis)、不动杆菌(Acinetobacter)属ADP、泊库岛食烷菌(Alcanivorax borkumensis)、铜绿假单胞菌(Pseudomonas aeruginosa)、亚德海床杆菌(Fundibacter jadensis)、拟南芥或真养产碱杆菌(Alkaligenes eutrophus)的合酶/酰基-辅酶A:二酰基甘油酰基转移酶、或其变体)。
另外地或可替代地,植物(例如,藻类)中的一种或多种基因可被灭活(例如,基因的表达降低)。例如,可将一种或多种突变引入基因。此类基因的实例包括编码酰基-辅酶A脱氢酶(例如,fade)、外膜蛋白受体和脂肪酸生物合成的转录调控因子(例如,阻遏子)(例如,fabR)、丙酮酸甲酸裂解酶(例如,pflB)、乳酸脱氢酶(例如,IdhA)的基因。
有机酸生产
在实施方案中,植物可被修饰以产生有机酸,诸如乳酸。植物可使用糖、戊糖或己糖产生有机酸。为此,可在植物中引入(例如,并过表达)一种或多种基因。此类基因的实例包括LDH基因。
在实施方案中,一种或多种基因可被灭活(例如,基因的表达降低)。例如,可将一种或多种突变引入基因。基因可包括编码涉及内源性代谢途径的蛋白质的那些基因,所述内源性代谢途径产生除目标有机酸以外的代谢物和/或其中内源性代谢途径消耗所述有机酸。
可被修饰或引入的基因的实例包括编码以下酶的那些基因:丙酮酸脱羧酶(pdc)、延胡索酸还原酶、醇脱氢酶(adh)、乙醛脱氢酶、磷酸烯醇丙酮酸羧化酶(ppc)、D-乳酸脱氢酶(d-ldh)、L-乳酸脱氢酶(l-ldh)、乳酸2-单加氧酶、乳酸脱氢酶、细胞色素依赖性乳酸脱氢酶(例如,细胞色素B2依赖性L-乳酸脱氢酶)。
增强植物特性用于生物燃料生产
在实施方案中,所述组合物、系统和方法用于改变植物细胞壁的特性以促进关键水解剂的进入,从而更高效地释放糖用于发酵。通过降低植物中木质素的比例,可增加纤维素的比例。在特定的实施方案中,植物中的木质素生物合成可被下调以增加可发酵碳水化合物。
在实施方案中,一种或多种木质素生物合成基因可被下调。此类基因的实例包括4-香豆酸3-羟化酶(C3H)、苯丙氨酸解氨酶(PAL)、肉桂酸4-羟化酶(C4H)、羟基肉桂酰转移酶(HCT)、咖啡酸O-甲基转移酶(COMT)、咖啡酰辅酶A 3-O-甲基转移酶(CCoAOMT)、阿魏酸5-羟化酶(F5H)、肉桂醇脱氢酶(CAD)、肉桂酰辅酶A还原酶(CCR)、4-香豆酸-辅酶A连接酶(4CL)、单木质醇-木质素特异性糖基转移酶和醛脱氢酶(ALDH),以及描述于WO 2008064289中的那些。
在实施方案中,可减少在发酵期间产生较低水平乙酸的植物质量。为此,涉及多糖乙酰化的基因(例如,Cas1L和描述于国际专利公布号WO 2010096488中的那些)可被灭活。
用于油和生物燃料生产的其他微生物
在实施方案中,使用本文的组合物、系统和方法,可使用植物以外的微生物产生油和生物燃料。微生物的实例包括以下属的那些:埃希氏菌属(Escherichia)、芽孢杆菌属(Bacillus)、乳杆菌属(Lactobacillus)、红球菌属(Rhodococcus)、聚球藻菌属(Synechococcus)、集胞藻属(Synechoystis)、假单胞菌属(Pseudomonas)、曲霉属(Aspergillus)、木霉属(Trichoderma)、链孢霉属(Neurospora)、镰刀菌属(Fusarium)、腐殖霉属(Humicola)、根毛霉属(Rhizomucor)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、毛霉属(Mucor)、毁丝霉属(Myceliophtora)、青霉属(Penicillium)、原毛平革菌属(Phanerochaete)、侧耳属(Pleurotus)、栓菌属(Trametes)、金孢属(Chrysosporium)、酵母属(Saccharomyces)、寡养单胞菌属(Stenotrophamonas)、裂殖酵母属(Schizosaccharomyces)、亚罗酵母属(Yarrowia)或链霉菌属(Streptomyces)。
植物培养和再生
在实施方案中,可培养修饰的植物或植物细胞以再生具有转化或修饰的基因型并因此具有所需表型的完整植物。再生技术的实例包括依赖于在组织培养生长培养基中操纵某些植物激素,依赖于与所需核苷酸序列一起引入的杀生物剂和/或除草剂标志物,从培养的原生质体、植物愈伤组织、外植体、器官、花粉、胚胎或其部分获得的那些技术。
检测植物基因组选择性标志物中的修饰
当所述组合物、系统和方法用于修饰植物时,可使用合适的方法来确认和检测在植物中进行的修饰。在实施方案中,当进行多种修饰时,可选择和检测一种或多种所需修饰或由所述修饰产生的性状。可通过生化和分子生物学技术进行检测和确认,所述技术诸如Southern分析、PCR、Northern印迹、S1 RNA酶保护、引物延伸或逆转录酶-PCR、酶测定、核酶活性、凝胶电泳、Western印迹、免疫沉淀、酶联免疫测定、原位杂交、酶染色和免疫染色。
在实施方案中,可将一种或多种标志物,诸如选择性的且可检测的标志物,引入植物中。此类标志物可用于选择、监测、分离具有所需修饰和性状的细胞和植物。选择性标志物可赋予阳性或阴性选择,并且是有条件的或无条件,这取决于外部底物的存在。此类标志物的实例包括赋予对抗生素(诸如潮霉素(hpt)和卡那霉素(nptII))的抗性的基因和蛋白质,以及赋予对除草剂(诸如膦丝菌素(bar)和氯磺隆(als))的抗性的基因,能够产生或加工有色物质的酶(例如,β-葡萄糖醛酸酶、萤光素酶、B或C1基因)。
在真菌中的应用
本文所述的组合物、系统和方法可用于在真菌或真菌细胞(诸如酵母)中进行高效且具有成本效益的基因或基因组询问或编辑或操纵。植物中的方法和应用也可应用于真菌。
真菌细胞可以是真菌界内的任何类型的真核细胞,诸如子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、芽枝菌门(Blastocladiomycota)、壶菌门(Chytridiomycota)、球囊菌门(Glomeromycota)、微孢子门(Microsporidia)和新丽鞭毛菌门(Neocallimastigomycota)。真菌或真菌细胞的实例包括酵母、霉菌和丝状真菌。
在实施方案中,真菌细胞是酵母细胞。酵母细胞是指子囊菌门和担子菌门内的任何真菌细胞。酵母的实例包括出芽酵母(budding yeast)、裂殖酵母(fission yeas)和霉菌、酿酒酵母(S.cerervisiae)、马克斯克鲁维酵母(Kluyveromyces marxianus)、东方伊萨酵母(Issatchenkia orientalis)、念珠菌属(Candida spp.)(例如,白色念珠菌(Candidaalbicans))、耶氏酵母属(Yarrowia spp.)(例如,解脂耶氏酵母(Yarrowia lipolytica))、毕赤酵母属(例如,毕赤酵母(Pichia pastoris))、克鲁维酵母属(例如,乳克鲁维酵母(Kluyveromyces lactis)和马克斯克鲁维酵母(Kluyveromyces marxianus))、链孢霉属(例如,粗糙链孢霉(Neurospora crassa))、镰刀菌属(例如,尖孢镰刀菌(Fusariumoxysporum))和伊萨酵母属(Issatchenkia spp.)(例如,东方伊萨酵母(Issatchenkiaorientalis)、库德毕赤酵母(Pichia kudriavzevii)和酸嗜热假丝酵母(Candidaacidothermophilum))。
在实施方案中,真菌细胞是丝状真菌细胞,其以丝状体(例如,菌丝或菌丝体)生长。丝状真菌细胞的实例包括曲霉属(例如,黑曲霉(Aspergillus niger))、木霉属(例如,里氏木霉(Trichoderma reesei))、根毛霉属(例如,米根毛霉(Rhizopus oryzae))和被孢霉属(Mortierella spp.)(例如,黄褐色被孢霉(Mortierella isabellina))。
在实施方案中,真菌细胞属于工业菌株。工业菌株包括在工业过程(例如以商业或工业规模生产产品)中使用或分离出来的任何真菌细胞的菌株。工业菌株可以指通常用于工业过程的真菌物种,或者它可以指也可用于非工业目的(例如,实验室研究)的真菌物种的分离物。工业过程的实例包括发酵(例如,在食物或饮料产品的生产中)、蒸馏、生物燃料产生、化合物产生和多肽产生。工业菌株的实例包括但不限于JAY270和ATCC4124。
在实施方案中,真菌细胞是多倍体细胞,其基因组以多于一个拷贝存在。多倍体细胞包括以多倍体状态天然存在的细胞,以及已被诱导以多倍体状态存在的细胞(例如,通过对减数分裂、胞质分裂或DNA复制的具体调控、改变、失活、激活或修饰)。多倍体细胞可以是整个基因组是多倍体的细胞,或者是在特定的目标基因组基因座中是多倍体的细胞。在实施方案中,与单倍体细胞相比,指导RNA的丰度在多倍体细胞的基因组工程中可能更经常是限速组分,并且因此使用本文所述的组合物和系统的方法可利用使用某些真菌细胞类型。
在实施方案中,真菌细胞是二倍体细胞,其基因组以两个拷贝存在。二倍体细胞包括以二倍体状态天然存在的细胞,以及已被诱导以二倍体状态存在的细胞(例如,通过对减数分裂、胞质分裂或DNA复制的特具体调控、改变、失活、激活或修饰)。二倍体细胞可以指整个基因组是二倍体的细胞,或者可以指在特定的目标基因组基因座中是二倍体的细胞。
在实施方案中,真菌细胞是单倍体细胞,其基因组以一个拷贝存在。单倍体细胞包括以单倍体状态天然存在的细胞,或已被诱导以单倍体状态存在的细胞(例如,通过对减数分裂、胞质分裂或DNA复制的具体调控、改变、失活、激活或修饰)。单倍体细胞可以指整个基因组是单倍体的细胞,或者可以指在特定的目标基因组基因座中是单倍体的细胞。
可使用本文的递送系统和方法将所述组合物和系统以及编码所述组合物和系统的核酸引入真菌细胞。递送系统的实例包括乙酸锂处理、轰击、电穿孔,以及描述于Kawai等人,2010,Bioeng Bugs.2010年11月至12月;1(6):395–403中的那些。
在实施方案中,可使用酵母表达载体(例如,具有一种或多种调控元件的那些)。此类载体的实例包括着丝粒(CEN)序列、自主复制序列(ARS)、启动子(诸如与目标序列或基因可操作地连接的RNA聚合酶III启动子)、终止子(诸如RNA聚合酶III终止子)、复制起点和标志物基因(例如,营养缺陷型、抗生素或其他选择性标志物)。用于酵母的表达载体的实例可包括质粒、酵母人工染色体、2μ质粒、酵母整合性质粒、酵母复制性质粒、穿梭载体和游离型质粒。
通过真菌进行的生物燃料和材料生产
在实施方案中,所述组合物、系统和方法可用于生成用于生物燃料和材料生产的修饰的真菌。例如,用于从可发酵糖产生生物燃料或生物聚合物并且任选地能够降解源自农业废物的植物衍生的木质纤维素作为可发酵糖的来源的修饰的真菌。可将生物燃料生产和合成所需的外来基因引入真菌中。在实施方案中,所述基因可编码涉及将丙酮酸转化为乙醇或另一种目标产物、降解纤维素(例如纤维素酶)、与生物燃料生产途径竞争的内源性代谢途径的酶。
在实施方案中,所述组合物、系统和方法可用于生成和/或选择具有改变的木糖或纤维二糖利用、类异戊二烯生物合成和/或乳酸生产的酵母菌株。涉及这些化合物的代谢和合成的一种或多种基因可被修饰和/或引入酵母细胞。方法和基因的实例包括乳酸脱氢酶、PDC1和PDC5,以及描述于Ha,S.J.等人(2011)Proc.Natl.Acad.Sci.USA 108(2):504-9和Galazka,J.M.等人(2010)Science 330(6000):84-6;T等人,Metab Eng.2015年3月;28:213-222;Stovicek V等人,FEMS Yeast Res.2017年8月1日;17(5)中的那些。
改良植物和酵母细胞
本公开还提供了改良植物和真菌。改良和真菌可包含由本文的组合物、系统和方法引入的一种或多种基因,和/或由本文的组合物、系统和方法修饰的一种或多种基因。改良植物和真菌可具有增加的食物或饲料产量(例如,更高的蛋白质、碳水化合物、营养素或维生素水平),油和生物燃料产量(例如,甲醇、乙醇),对有害生物、除草剂、干旱、低温或高温、过量水等的耐受性。
植物或真菌可具有改良的一个或多个部分,例如,叶、茎、根、块茎、种子、胚乳、胚珠和花粉。所述部分可以是有活力的、无活力的、可再生的和/或不可再生的。
改良植物和真菌可包括配子、种子、胚胎(合子或体细胞的)、改良植物和真菌的子代和/或杂种。子代可以是所产生的植物或真菌的克隆,或者可以是通过与同一物种的其他个体杂交以将其他所需性状渗入其后代的有性繁殖而产生的。在多细胞生物体,特别是植物的情况下,细胞可以在体内或离体。
植物中的进一步应用
所述组合物、系统和方法在植物和真菌上的其他应用包括遗传元件动力学的可视化(例如,如Chen B等人,Cell.2013年12月19日;155(7):1479-91中所述)、体外和体内靶向基因破坏阳性选择(如Malina A等人,Genes Dev.2013年12月1日;27(23):2602-14中所述)、诸如使用Cas和组蛋白修饰酶的融合体的表观遗传修饰(例如,如Rusk N,NatMethods.2014年1月;11(1):28中所述)、鉴定转录调控因子(例如,如Waldrip ZJ,Epigenetics.2014年9月;9(9):1207-11中所述、RNA和DNA病毒的抗病毒治疗(例如,如Price AA等人,Proc Natl Acad Sci U S A.2015年5月12日;112(19):6164-9;Ramanan V等人,Sci Rep.2015年6月2日;5:10833中所述)、基因组复杂性诸如染色体数目的改变(例如,如Karimi-Ashtiyani R等人,Proc Natl Acad Sci U S A.2015年9月8日;112(36):11211-6;Anton T等人,Nucleus.2014年3月至4月;5(2):163-72中所述)、受控失活/激活的CRISPR系统的自切割(例如,如Sugano SS等人,Plant Cell Physiol.2014年3月;55(3):475-81中所述)、多重基因编辑(如Kabadi AM等人,Nucleic Acids Res2014年10月29日;42(19):e147中所述)、多重基因组编辑试剂盒的开发(如Xing HL等人,BMC Plant Biol.2014年11月29日;14:327中所述)、淀粉生产(如Hebelstrup KH等人,Front Plant Sci.2015年4月23日;6:247中所述)、靶向家族或途径中的多个基因(例如,如Ma X等人,Mol Plant2015年8月;8(8):1274-84中所述)、非编码基因和序列的调控(例如,如Lowder LG等人,PlantPhysiol2015年10月;169(2):971-85中所述)、编辑树中的基因(例如,如Belhaj K等人,Plant Methods 2013年10月11日;9(1):39;Harrison MM等人,Genes Dev.2014年9月1日;28(17):1859-72;Zhou X等人,New Phytol.2015年10月;208(2):298-301中所述)、引入对宿主特定病原体和有害生物具有抗性的突变。
可使用所述组合物、系统和方法进行的植物和真菌修饰的另外的实例包括描述于国际专利公布号WO2016/099887、WO2016/025131、WO2016/073433、WO2017/066175、WO2017/100158、WO 2017/105991、WO2017/106414、WO2016/100272、WO2016/100571、WO 2016/100568、WO 2016/100562和WO 2017/019867中的那些。
在非人动物中的应用
所述组合物、系统和方法可用于研究和修饰非人动物,例如,引入所需性状和疾病恢复力(resilience)、治疗疾病、促进繁殖等。在实施方案中,可使用所述组合物、系统和方法改善繁殖和引入所需性状,例如,增加性状相关等位基因的频率、其他品种/物种的等位基因渗入而没有连锁累赘,以及从头产生有利的等位基因。可以筛选和鉴定可被靶向的基因和其他遗传元件。应用和方法的实例包括描述于以下中的那些:Tait-Burkard C等人,Livestock 2.0-genome editing for fitter,healthier,and more productive farmedanimals.Genome Biol.2018年11月26日;19(1):204;Lillico S,Agriculturalapplications of genome editing in farmed animals.Transgenic Res.2019年8月;28(增刊2):57-60;Houston RD等人,Harnessing genomics to fast-track geneticimprovement in aquaculture.Nat Rev Genet.2020年4月16日.doi:10.1038/s41576-020-0227-y,其以引用的方式整体并入本文。其他章节中描述的应用,诸如治疗、诊断等,也可用于本文的动物。
所述组合物、系统和方法可用于动物,诸如鱼、两栖动物、爬行动物、哺乳动物和鸟类。动物可以是农场和农业动物、或宠物。农场和农业动物的实例包括马、山羊、绵羊、猪、牛、美洲驼、羊驼和鸟类,例如鸡、火鸡、鸭和鹅。动物可以是非人灵长类动物,例如狒狒、卷尾猴、黑猩猩、狐猴、猕猴、狨猴、绢毛猴、蜘蛛猴、松鼠猴和长尾猴。宠物的实例包括狗、猫、马、狼、兔子、雪貂、沙鼠、仓鼠、毛丝鼠、花枝鼠、豚鼠、金丝雀、长尾鹦鹉和鹦鹉。
在实施方案中,可在动物中引入(例如,过表达)一种或多种基因以获得或增强一种或多种所需性状。可引入生长激素、胰岛素样生长因子(IGF-1)以增加动物(例如,猪或鲑鱼)的生长(诸如Pursel VG等人,J Reprod Fertil增刊1990;40:235-45;Waltz E,Nature.2017;548:148中所述)。可例如在猪中引入Fat-1基因(例如,来自秀丽隐杆线虫(Celegans)),可诱导产生更大比例的n-3至n-6脂肪酸(诸如Li M等人,Genetics.2018;8:1747–54中所述)。可例如在猪中引入植酸酶(例如,来自大肠杆菌)、木聚糖酶(例如,来自黑曲霉)、β-葡聚糖酶(例如,来自地衣芽孢杆菌(bacillus lichenformis))以通过减少磷和氮释放来减少环境影响(诸如Golovan SP等人,Nat Biotechnol.2001;19:741–5;Zhang X等人,elife.2018中所述)。可例如在鸡中引入shRNA诱饵以诱导禽流感恢复力(诸如Lyall等人,Science.2011;331:223–6中所述)。可例如在山羊和奶牛中引入溶菌酶或溶葡球菌酶以诱导乳腺炎恢复力(诸如Maga EA等人,Foodborne Pathog Dis.2006;3:384–92;Wall RJ等人,Nat Biotechnol.2005;23:445–51中所述)。可例如在猪中引入组蛋白脱乙酰基酶诸如HDAC6以诱导PRRSV恢复力(诸如Lu T.等人,PLoS One.2017;12:e0169317中所述)。CD163可被修饰(例如,灭活或去除)以在猪中引入PRRSV恢复力(诸如Prather RS等人,SciRep.2017年10月17日;7(1):13371中所述)。类似的方法可用于抑制或去除可能从动物传播给人的病毒和细菌(例如,猪流感病毒(SIV)毒株,包括丙型流感和甲型流感的亚型,称为H1N1、H1N2、H2N1、H3N1、H3N2和H2N3,以及肺炎、脑膜炎和水肿)。
在实施方案中,可针对疾病抗性和生产性状对一种或多种基因进行修饰或编辑。肌肉生长抑制素(例如,GDF8)可被修饰以增加例如牛、绵羊、山羊、鲶鱼和猪中的肌肉生长(诸如Crispo M等人,PLoS One.2015;10:e0136690;Wang X等人,Anim Genet.2018;49:43–51;Khalil K等人,Sci Rep.2017;7:7301;Kang J-D等人,RSC Adv.2017;7:12541–9中所述)。Pc POLLED可被修饰以例如在奶牛中诱导无角(horlessness)(诸如Carlson DF等人,Nat Biotechnol.2016;34:479–81中所述)。KISS1R可被修饰以例如在猪中诱导公猪异味(boretaint)(性成熟期间的激素释放导致不需要的肉味)。死端蛋白(Dead end protein,dnd)可被修饰以例如在鲑鱼中诱导不育(诸如Wargelius A等人,Sci Rep.2016;6:21284中所述)。Nano2和DDX可被修饰以例如在猪和鸡中诱导不育(例如,在替代宿主中)(诸如ParkK-E等人,Sci Rep.2017;7:40176;Taylor L等人,Development.2017;144:928–34中所述)。CD163可被修饰以例如在猪中诱导PRRSV抗性(诸如Whitworth KM等人,NatBiotechnol.2015;34:20–2中所述)。RELA可被修饰以例如在猪中诱导ASFV恢复力(诸如Lillico SG等人,Sci Rep.2016;6:21645中所述)。CD18可被修饰以例如在奶牛中诱导溶血性曼氏杆菌(巴氏杆菌)(Mannheimia(Pasteurella)haemolytica)恢复力(诸如Shanthalingam S等人,roc Natl Acad Sci U S A.2016;113:13186–90中所述)。NRAMP1可被修饰以例如在奶牛中诱导肺结核恢复力(诸如Gao Y等人,Genome Biol.2017;18:13中所述)。内源性逆转录病毒基因可被修饰或去除用于异种移植诸如Yang L等人Science.2015;350:1101–4;Niu D等人,Science.2017;357:1303–7中所述)。肌肉量的负调控因子(例如,肌肉生长抑制素)可被修饰(例如,灭活)以例如在狗中增加肌肉量(如Zou Q等人,J MolCell Biol.2015年12月;7(6):580-3中所述)。
可生成(例如,通过修饰RAG2)患有严重联合免疫缺陷(SCID)的动物诸如猪,以为再生医学、异种移植(也在本文别处讨论)和肿瘤发生提供有用的模型。方法和途径的实例包括描述于Lee K等人,Proc Natl Acad Sci U S A.2014年5月20日;111(20):7260-5;和Schomberg等人FASEB Journal,2016年4月;30(1):增刊571.1中的那些。
动物中的SNP可被修饰。方法和途径的实例包括描述于Tan W.等人,Proc NatlAcad Sci U S A.2013年10月8日;110(41):16526-31;Mali P等人,Science.2013年2月15日;339(6121):823-6中的那些。
干细胞(例如,诱导的多能干细胞)可以被修饰并分化成所需的子代细胞,例如,如HeoYT等人,Stem Cells Dev.2015年2月1日;24(3):393-402。
可对动物进行特征分析(诸如Igenity),以筛选和鉴定与经济性状相关的遗传变异。遗传变异可被修饰以引入或改善性状,诸如胴体组成、胴体质量、母体和生殖性状以及平均日增重。
遗传和表观遗传条件的模型
本文公开的方法可用于产生可用于对目标遗传或表观遗传条件进行建模和/或研究(诸如通过目标突变模型或疾病模型)的植物、动物或细胞。如本文所用,“疾病”是指受试者中的疾病、病症或适应症。例如,方法可用于产生在与疾病相关联的一个或多个核酸序列中包含修饰的动物或细胞,或者其中与疾病相关联的一个或多个核酸序列的表达被改变的植物、动物或细胞。此种核酸序列可以编码疾病相关蛋白序列或者可以是疾病相关控制序列。因此,应当理解,在实施方案中,植物、受试者、患者、生物体或细胞可以是非人受试者、患者、生物体或细胞。因此,本公开提供了通过本发明方法产生的植物、动物或细胞,或其子代。子代可以是所产生的植物或动物的克隆,或者可以是通过与同一物种的其他个体杂交以将其他所需性状渗入其后代的有性繁殖而产生的。在多细胞生物体,特别是动物或植物的情况下,细胞可以在体内或离体。在培养细胞的情况下,如果满足适当的培养条件并且优选地如果细胞适合于此目的(例如干细胞),则可建立细胞系。还设想了产生的细菌细胞系。因此,还设想了细胞系。
在一些方法中,疾病模型可用于使用疾病研究中常用的测量方法来研究突变对动物或细胞的影响以及疾病的发展和/或进展。可替代地,此种疾病模型可用于研究药物活性化合物对疾病的影响。
在一些方法中,疾病模型可用于评估潜在基因疗法策略的功效。也就是说,可修饰疾病相关基因或多核苷酸,使得疾病发展和/或进展得以抑制或减少。特别地,所述方法包括修饰疾病相关基因或多核苷酸,使得产生改变的蛋白质,并且因此,动物或细胞具有改变的反应。因此,在一些方法中,可将遗传修饰的动物与易于发展疾病的动物进行比较,使得可评估基因疗法事件的影响。
在另一个实施方案中,本公开提供了一种开发调节与疾病基因相关联的细胞信号传导事件的生物活性剂的方法。所述方法包括使测试化合物与包含一种或多种载体的细胞接触,所述一种或多种载体驱动系统的一种或多种组分的表达;以及检测读数的变化,所述变化指示与例如细胞中所含疾病基因的突变相关联的细胞信号传导事件的减少或增加。
可结合本公开的方法构建细胞模型或动物模型用于筛选细胞功能变化。此种模型可用于研究通过本文的系统和方法修饰的基因组序列对目标细胞功能的影响。例如,细胞功能模型可用于研究修饰的基因组序列对细胞内信号传导或细胞外信号传导的影响。可替代地,细胞功能模型可用于研究修饰的基因组序列对感官知觉的影响。在一些此类模型中,模型中的一个或多个信号传导生化途径相关基因组序列被修饰。
已经专门研究了几种疾病模型。这些包括新发自闭症风险基因CHD8、KATNAL2和SCN2A;以及综合征型自闭症(天使综合征)基因UBE3A。这些基因和所得的自闭症模型当然是优选的,但用于显示本公开在基因和对应模型中的广泛适用性。一个或多个信号传导生化途径相关基因组序列的改变的表达可通过测定测试模型细胞与对照细胞(在与候选剂接触时)之间的对应基因的mRNA水平差异来确定。可替代地,通过检测编码的多肽或基因产物水平差异来确定信号传导生化途径相关序列的差异表达。
为了测定剂诱导的mRNA转录物或对应多核苷酸的水平改变,首先根据本领域的标准方法提取样品中所含的核酸。例如,可根据Sambrook等人(1989)阐述的程序,使用各种裂解酶或化学溶液分离mRNA,或按照制造商提供的随附说明通过核酸结合树脂提取mRNA。然后根据本领域众所周知的方法或基于本文例示的方法,通过扩增程序或常规杂交测定(例如,Northern印迹分析)检测提取的核酸样品中所含的mRNA。
扩增意指采用能够以合理保真度复制靶序列的引物和聚合酶的任何方法。扩增可通过天然或重组DNA聚合酶进行,所述聚合酶诸如TaqGoldTM、T7 DNA聚合酶、大肠杆菌DNA聚合酶的Klenow片段和逆转录酶。优选的扩增方法是PCR。特别地,可对分离的RNA进行逆转录测定,所述测定与定量聚合酶链式反应(RT-PCR)相结合,以量化信号传导生化途径相关序列的表达水平。
基因表达水平的检测可在扩增测定中实时进行。在一个方面,可用荧光DNA结合剂(包括但不限于DNA嵌入剂和DNA沟槽结合剂)使扩增产物直接可视化。由于并入双链DNA分子中的嵌入剂的量通常与扩增的DNA产物的量成比例,因此可通过使用本领域的常规光学系统量化嵌入染料的荧光来方便地确定扩增产物的量。适用于这种应用的DNA结合染料包括SYBR绿、SYBR蓝、DAPI、碘化丙啶、Hoeste、SYBR金、溴化乙锭、吖啶、原黄素、吖啶橙、吖啶黄、氟香豆素(fluorcoumanin)、玫瑰树碱、道诺霉素、氯喹、偏端霉素D、色霉素、乙菲啶(homidium)、光神霉素、多吡啶钌、蒽霉素等。
在另一个方面,可在扩增反应中使用其他荧光标记,诸如序列特异性探针,以有利于扩增产物的检测和定量。基于探针的定量扩增依赖于对所需扩增产物的序列特异性检测。所述检测利用荧光、靶特异性探针(例如,探针),从而增加特异性和灵敏度。用于进行基于探针的定量扩增的方法在本领域中已充分确立并且在美国专利号5,210,015中进行了教导。
在又一方面,可使用与信号传导生化途径相关序列共享序列同源性的杂交探针进行常规杂交测定。通常,允许探针在杂交反应中与源自测试受试者的生物样品中所含的信号传导生化途径相关序列形成稳定的复合物。本领域技术人员将理解,在使用反义核酸作为探针核酸的情况下,样品中提供的靶多核苷酸被选择成与反义核酸的序列互补。相反,在核苷酸探针是有义核酸的情况下,靶多核苷酸被选择成与有义核酸的序列互补。
杂交可在各种严格的条件下进行。用于实践本公开的合适杂交条件使得探针和与信号传导生化途径相关序列之间的识别相互作用既具有足够的特异性又具有足够的稳定性。提高杂交反应严格性的条件在本领域中是众所周知并发表的。参见,例如(Sambrook等人,(1989);Nonradioactive In Situ Hybridization Application Manual,BoehringerMannheim,第二版)。可使用固定在任何固体支持物上的探针形成杂交测定,所述固体支持物包括但不限于硝酸纤维素、玻璃、硅和各种基因阵列。优选的杂交测定在高密度基因芯片上进行,如美国专利号5,445,934中所述。
为了方便检测在杂交测定期间形成的探针-靶标复合物,将核苷酸探针与可检测标记缀合。适用于本公开的可检测标记包括可通过光化学、生化、光谱、免疫化学、电学、光学或化学手段检测的任何组合物。本领域已知多种合适的可检测标记,包括荧光或化学发光标记、放射性同位素标记、酶或其他配体。在优选的实施方案中,人们可能需要采用荧光标记或酶标签,诸如地高辛、β-半乳糖苷酶、脲酶、碱性磷酸酶或过氧化物酶、抗生物素蛋白/生物素复合物。
用于检测或量化杂交强度的检测方法通常取决于上面选择的标记。例如,可使用照相胶片或磷光成像仪检测放射性标记。可使用检测发射光的光电检测器检测并量化荧光标志物。通常通过为酶提供底物并测量酶对底物的作用产生的反应产物来检测酶标记;并且最后通过简单地可视化彩色标记来检测比色标记。
也可通过检查对应的基因产物来确定剂诱导的信号传导生化途径相关序列的表达变化。确定蛋白质水平通常涉及a)使生物样品中所含的蛋白质与特异性结合与信号传导生化途径相关蛋白质的剂接触;以及(b)鉴定如此形成的任何剂:蛋白质复合物。在此实施方案的一个方面,特异性结合信号传导生化途径相关蛋白质的剂是抗体,优选单克隆抗体。
所述反应通过在允许剂与信号传导生化途径相关蛋白质之间形成复合物的条件下,使剂与源自测试样品的信号传导生化途径相关蛋白质的样品接触来进行。可根据本领域的标准程序直接或间接检测复合物的形成。在直接检测方法中,剂提供有可检测标记,并且未反应的剂可从复合物中去除;剩余标记的量由此指示形成的复合物的量。对于此种方法,优选选择即使在严格的洗涤条件期间仍保持附着在剂上的标记。优选标记不干扰结合反应。在替代方案中,间接检测程序可使用含有化学或酶促引入的标记的剂。所需的标记通常不会干扰所得剂:多肽复合物的结合或稳定性。然而,标记通常被设计成可被抗体接近以进行有效结合并因此生成可检测信号。
适用于检测蛋白质水平的多种标记是本领域已知的。非限制性实例包括放射性同位素、酶、胶体金属、荧光化合物、生物发光化合物和化学发光化合物。
在结合反应期间形成的剂:多肽复合物的量可通过标准定量测定来量化。如上所示,剂:多肽复合物的形成可通过保留在结合位点的标记量来直接测量。在替代方案中,测试信号传导生化途径相关蛋白质与标记的类似物竞争具体剂上的结合位点的能力。在此竞争性测定中,捕获的标记的量与测试样品中存在的信号传导生化途径相关蛋白质序列的量成反比。
基于上述一般原理的许多蛋白质分析技术在本领域中是可用的。它们包括但不限于放射免疫测定、ELISA(酶联免疫放射测定)、“夹心”免疫测定、免疫放射测定、原位免疫测定(使用例如胶体金、酶或放射性同位素标记)、western印迹分析、免疫沉淀测定、免疫荧光测定和SDS-PAGE。
特异性识别或结合信号传导生化途径相关蛋白质的抗体对于进行上述蛋白质分析是优选的。如果需要,可使用识别具体类型的翻译后修饰(例如,信号传导生化途径可诱导的修饰)的抗体。翻译后修饰包括但不限于糖基化、脂化、乙酰化和磷酸化。这些抗体可从商业供应商处购买。例如,可从包括Invitrogen和Perkin Elmer的许多供应商处获得特异性识别酪氨酸磷酸化蛋白的抗磷酸酪氨酸抗体。抗磷酸酪氨酸抗体在检测响应于ER应激而在其酪氨酸残基上差异磷酸化的蛋白质方面特别有用。此类蛋白质包括但不限于真核翻译起始因子2α(eIF-2α)。可替代地,可使用常规的多克隆或单克隆抗体技术,通过用表现出所需翻译后修饰的靶蛋白免疫宿主动物或抗体产生细胞来产生这些抗体。
在实践本发明方法时,可能需要辨别信号传导生化途径相关蛋白质在不同身体组织、不同细胞类型和/或不同亚细胞结构中的表达模式。这些研究可使用能够与优先在某些组织、细胞类型或亚细胞结构中表达的蛋白质标志物结合的组织特异性、细胞特异性或亚细胞结构特异性抗体来进行。
信号传导生化途径相关基的因表达改变也可通过检查基因产物相对于对照细胞的活性变化来确定。剂诱导的信号传导生化途径相关蛋白质活性变化的测定将取决于正在研究的生物活性和/或信号转导途径。例如,在蛋白质是激酶的情况下,其磷酸化下游底物的能力的变化可通过本领域已知的多种测定来确定。代表性测定包括但不限于使用抗体(诸如识别磷酸化蛋白质的抗磷酸酪氨酸抗体)的免疫印迹和免疫沉淀。另外,激酶活性可通过高通量化学发光测定诸如AlphaScreenTM(可购自Perkin Elmer)和eTagTM测定(Chan-Hui等人(2003)Clinical Immunology 111:162-174)来检测。
在信号传导生化途径相关蛋白质是导致细胞内pH条件波动的信号传导级联的一部分的情况下,可使用pH敏感分子诸如荧光pH染料作为报告分子。在信号传导生化途径相关蛋白质是离子通道的另一个实例中,可监测膜电位和/或细胞内离子浓度的波动。许多商业试剂盒和高通量装置特别适用于快速且稳健地筛选离子通道的调节剂。代表性仪器包括FLIPRTM(Molecular Devices,Inc.)和VIPR(Aurora Biosciences)。这些仪器能够同时检测微孔板的1000多个样品孔中的反应,并在一秒甚至一毫秒内提供实时测量和功能数据。
在实践本文公开的任一方法时,可通过本领域已知的一种或多种方法将合适的载体引入细胞或胚胎,所述方法包括但不限于显微注射、电穿孔、声穿孔、基因枪、磷酸钙介导的转染、阳离子转染、脂质体转染、树状聚合物转染、热休克转染、核转染、磁转染、脂质转染、刺穿转染、光学转染、专利剂增强的核酸摄取、以及通过脂质体、免疫脂质体、病毒体或人工病毒粒子进行的递送。在一些方法中,通过显微注射将载体引入胚胎中。可将一种或多种载体显微注射到胚胎的细胞核或细胞质中。在一些方法中,可通过核转染将一种或多种载体引入细胞中。
所述组合物和系统的靶多核苷酸可以是对真核细胞而言内源性或外源性的任何多核苷酸。例如,靶多核苷酸可以是驻留在真核细胞的细胞核中的多核苷酸。靶多核苷酸可以是编码基因产物(例如,蛋白质)的序列或非编码序列(例如,调控多核苷酸或无用DNA)。
靶多核苷酸的实例包括信号传导生化途径相关序列,例如信号传导生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在源自疾病影响的组织的细胞中以异常水平或以异常形式产生转录或翻译产物的任何基因或多核苷酸。在改变的表达与疾病的出现和/或进展相关的情况下,疾病相关基因或多核苷酸可以是以异常高的水平表达的基因;可以是以异常低的水平表达的基因。因此,改变的表达水平(例如增加或减少)的测量可相对于特定受试者或细胞中的时间点,例如,在施用调节剂或治疗之前或之后,在一段时间点上,或者相对于受试者和细胞中的基线测量。在实施方案中,改变的表达水平是相对于对照、正常范围或标准集或测量的。疾病相关基因还指具有突变或遗传变异的基因,所述突变或遗传变异直接负责疾病的病因学或与负责疾病的病因学的基因连锁不平衡。转录或翻译的产物可以是已知的或未知的,并且可以处于正常或异常水平。
本文系统的靶多核苷酸可以是对真核细胞而言内源性或外源性的任何多核苷酸。例如,靶多核苷酸可以是驻留在真核细胞的细胞核中的多核苷酸。靶多核苷酸可以是编码基因产物(例如,蛋白质)的序列或非编码序列(例如,调控多核苷酸或无用DNA)。不希望受理论的束缚,据信靶序列应与以下缔合:PAM(原间隔子相邻基序);即由复合物识别的短序列。对PAM的精确序列和长度要求根据使用的CRISPR酶而不同,但PAM通常是与原间隔子(也就是说,靶序列)相邻的2-5个碱基对序列,PAM序列的实例在下面的实施例部分中给出,并且技术人员将能够鉴定用于与给定的CRISPR酶一起使用的其他PAM序列。此外,PAM相互作用(PI)结构域的工程化可允许对PAM特异性进行编程,提高靶位点识别的保真度,并增加Cas(例如Cas9)基因组工程平台的多功能性。Cas蛋白,诸如Cas9蛋白可被工程化成改变它们的PAM特异性,例如如Kleinstiver BP等人Engineered CRISPR-Cas9 nucleases withaltered PAM specificities.Nature.2015年7月23日;523(7561):481-5.doi:10.1038/nature14592中所述。
所述系统的靶多核苷酸可包括许多疾病相关基因和多核苷酸以及信号传导生化途径相关基因和多核苷酸,如在以下中列出:US临时专利申请61/736,527和61/748,427,其分别具有广泛参考BI-2011/008/WSGR案卷号44063-701.101和BI-2011/008/WSGR案卷号44063-701.102,两者标题均为SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCEMANIPULATION,分别提交于2012年12月12日和2013年1月2日;以及PCT申请PCT/US2013/074667,标题为DELIVERY,ENGINEERING AND OPTIMIZATION OF SYSTEMS,METHODS ANDCOMPOSITIONS FOR SEQUENCE MANIPULATION AND THERAPEUTIC APPLICATIONS,提交于2013年12月12日;所有申请的内容以引用的方式整体并入本文。
靶多核苷酸的实例包括信号传导生化途径相关序列,例如信号传导生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在源自疾病影响的组织的细胞中以异常水平或以异常形式产生转录或翻译产物的任何基因或多核苷酸。在改变的表达与疾病的出现和/或进展相关的情况下,疾病相关基因或多核苷酸可以是以异常高的水平表达的基因;可以是以异常低的水平表达的基因。疾病相关基因还指具有突变或遗传变异的基因,所述突变或遗传变异直接负责疾病的病因学或与负责疾病的病因学的基因连锁不平衡。转录或翻译的产物可以是已知的或未知的,并且可以处于正常或异常水平。
治疗应用
本文还提供了诊断、预测、治疗和/或预防受试者的疾病、病症、状态或病状的方法。通常,诊断、预测、治疗和/或预防受试者的疾病、状态或病状的方法可包括使用本文所述的组合物、系统或其组分修饰受试者或其细胞中的多核苷酸,且/或包括使用本文所述的组合物、系统或其组分检测受试者或其细胞中的患病或健康多核苷酸。在实施方案中,治疗或预防方法可包括使用组合物、系统或其组分来修饰受试者或其细胞内的感染性生物体(例如,细菌或病毒)的多核苷酸。在实施方案中,治疗或预防方法可包括使用组合物、系统或其组分来修饰受试者体内的感染性生物体或共生生物体的多核苷酸。所述组合物、系统及其组分可用于开发疾病、状态或病状的模型。所述组合物、系统及其组分可用于检测疾病状态或其校正,诸如通过本文所述的治疗或预防方法。所述组合物、系统及其组分可用于筛选和选择可用作例如本文所述的治疗或预防的细胞。所述组合物、系统及其组分可用于开发可用于修改受试者或其细胞中的一种或多种生物功能或活性的生物活性剂。
一般来讲,所述方法可包括通过合适的递送技术和/或组合物将所述组合物、系统和/或其组分递送至受试者或其细胞,或递送至感染性或共生生物体。一旦施用,所述组分可如本文别处所述操作以引发核酸修饰事件。在一些方面,核酸修饰事件可以基因组、表观基因组和/或转录组水平发生。可能发生DNA和/或RNA切割、基因激活和/或基因失活。下文更详细地描述了另外的特征、用途和优点。基于这一概念,有几种变异适合引发基因组基因座事件,包括DNA切割、基因激活或基因失活。使用所提供的组合物,本领域技术人员可有利地且特异性地靶向具有相同或不同功能结构域的单个或多个基因座以引发一个或多个基因组基因座事件。除了治疗和/或预防受试者的疾病之外,所述组合物还可用于在细胞文库中进行筛选和在体内进行功能性建模的多种方法(例如,lincRNA的基因激活和功能鉴定;功能获得建模;功能丧失建模;使用所述组合物建立细胞系和转基因动物以用于优化和筛选目的)。
本文别处所述的组合物、系统及其组分可用于治疗和/或预防受试者的疾病,诸如遗传和/或表观遗传疾病。本文别处所述的组合物、系统及其组分可用于治疗和/或预防受试者的遗传感染性疾病,诸如细菌感染、病毒感染、真菌感染、寄生虫感染及其组合。本文别处所述的组合物、系统及其组件可用于修改受试者的微生物组的组成或特征,这继而可改变受试者的健康状态。本文所述的组合物、系统可用于离体修饰细胞,然后可将所述细胞施用于受试者,由此修饰的细胞可治疗或预防疾病或其症状。在一些情况下,这也被称为过继性疗法。本文所述的组合物、系统可用于治疗线粒体疾病,其中线粒体疾病病因学涉及线粒体DNA中的突变。
还提供了一种治疗受试者(例如,有需要的受试者)的方法,所述方法包括通过用编码组合物、系统或复合物的一种或多种组分的多核苷酸或本文所述的任一多核苷酸或载体转化受试者来诱导基因编辑,以及将它们施用于受试者。还可提供合适的修复模板,例如由包含所述修复模板的载体递送。修复模板可以是本文中的重组模板。还提供了一种治疗受试者(例如,有需要的受试者)的方法,所述方法包括通过用本文所述的多核苷酸或载体转化受试者来诱导多个靶基因基因座的转录激活或抑制,其中所述多核苷酸或载体编码或包含组合物、系统、复合物或其组分的包含多个Cas效应物的一种或多种组分。在离体(例如在细胞培养物中)进行任何治疗的情况下,则应理解术语“受试者”可被短语“细胞或细胞培养物”替换。
还提供了一种治疗受试者(例如,有需要的受试者)的方法,所述方法包括通过用Cas效应物转化受试者来诱导基因编辑,所述Cas效应物有利地在体内编码和表达组合物、系统的剩余部分(例如,RNA、指导物)。还可提供合适的修复模板,例如由包含所述修复模板的载体递送。还提供了一种治疗受试者(例如,有需要的受试者)的方法,所述方法包括通过用有利地在体内编码和表达组合物、系统的剩余部分(例如,RNA、指导物)的Cas效应物转化受试者来诱导转录激活或抑制;有利地,在实施方案中,CRISPR酶是催化失活的Cas效应物,并且包括一个或多个相关功能结构域。在离体(例如在细胞培养物中)进行任何治疗的情况下,则应理解术语“受试者”可被短语“细胞或细胞培养物”替换。
本文所述的组合物和系统的一种或多种组分可包括在组合物诸如药物组合物中,并单独或共同施用于宿主。可替代地,这些组分可以单一组合物的形式提供用于施用于宿主。可通过技术人员已知的或本文所述的用于递送至宿主的病毒载体(例如,慢病毒载体、腺病毒载体、AAV载体)施用于宿主。如本文所解释的,使用不同的选择标志物(例如,针对慢病毒gRNA选择)和gRNA浓度(例如,取决于是否使用多种gRNA)可能有利于引发改善的效果。
因此,本文还描述了在受试者、感染性生物体和/或受试者微生物组的生物体的真核或原核细胞或其组分(例如线粒体)中诱导一种或多种多核苷酸修饰的方法。修饰可包括在一个或多个细胞的多核苷酸的靶序列处的一个或多个核苷酸的引入、缺失或取代。修饰可在体外、离体、原位或体内发生。
在实施方案中,治疗或抑制由真核生物体或非人生物体的基因组基因座中的一个或多个突变引起的病状或疾病的方法可包括操纵有需要的受试者或非人受试者的靶序列中所述基因组基因座的编码、非编码或调控元件中的靶序列,包括通过操纵靶序列来修饰受试者或非人受试者,并且其中所述病状或疾病易于通过操纵靶序列来治疗或抑制,包括提供包括递送组合物的治疗,所述组合物包含如上述实施方案中任一项所述的粒子递送系统或递送系统或病毒粒子或如上述实施方案中任一项所述的细胞。
本文还提供了如上述实施方案中任一项所述的粒子递送系统或递送系统或病毒粒子或如上述实施方案中任一项所述的细胞在离体或体内基因或基因组编辑中的用途;或用于在体外、离体或体内基因疗法中使用。本文还提供了如上述实施方案中任一项所述的粒子递送系统、非病毒递送系统和/或病毒粒子或如上述实施方案中任一项所述的细胞,其用于制造用于体外、离体或体内基因或基因组编辑的药物,或用于在体外、离体或体内基因疗法中使用,或用于在通过操纵与疾病相关联的基因组基因座中的靶序列来修饰生物体或非人生物体的方法或者治疗或抑制由真核生物体或非人生物体的基因组基因座中的一个或多个突变引起的病状或疾病的方法中使用。
在实施方案中,多核苷酸修饰可包括在所述细胞的所述多核苷酸的每个靶序列处的1-75个核苷酸的引入、缺失或取代。修饰可包括在每个靶序列处的至少1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的引入、缺失或取代。修饰可包括在所述细胞的每个靶序列处的至少5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的引入、缺失或取代。修饰可包括在所述细胞的每个靶序列处的至少10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的引入、缺失或取代。修饰可包括在所述细胞的每个靶序列处的至少20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的引入、缺失或取代。修饰可包括在所述细胞的每个靶序列处的至少40、45、50、75、100、200、300、400或500个核苷酸的引入、缺失或取代。修饰可包括在所述细胞的每个靶序列处的至少500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5100、5200、5300、5400、5500、5600、5700、5800、5900、6000、6100、6200、6300、6400、6500、6600、6700、6800、6900、7000、7100、7200、7300、7400、7500、7600、7700、7800、7900、8000、8100、8200、8300、8400、8500、8600、8700、8800、8900、9000、9100、9200、9300、9400、9500、9600、9700、9800或9900至10000个核苷酸的引入、缺失或取代。
在实施方案中,修饰可包括通过核酸组分(例如,指导RNA或sgRNA)在所述细胞的每个靶序列处的核苷酸的引入、缺失或取代,诸如由本文别处所述的组合物、系统或其组分介导的那些的引入、缺失或取代。在实施方案中,修饰可包括通过组合物、系统或技术在所述细胞的靶序列或随机序列处的核苷酸的引入、缺失或取代。
在实施方案中,组合物、系统或其组分可促进非同源末端连接(NHEJ)。因此,通过组合物、系统或其组分对多核苷酸(诸如患病多核苷酸)的修饰可包括NHEJ。通过组合物、系统或其组分促进这种修复途径可用于靶基因或多核苷酸特异性敲除和/或敲入。通过组合物、系统或其组分促进这种修复途径可用于生成NHEJ介导的插入缺失。核酸酶诱导的NHEJ也可用于去除(例如,缺失)目标基因中的序列。通常,NHEJ通过将DNA中双链断裂的两端连接在一起来修复所述双链断裂;然而,通常,只有两个相容端恰好如它们通过双键断裂形成一样被完美连接,原始序列才能恢复。双键断裂的DNA端常常是酶加工的受试者,从而在一条或两条链处产生核苷酸的添加或去除,之后端部重新连接。这导致NHEJ修复位点处的DNA序列中存在插入和/或缺失(插入缺失)突变。插入缺失的大小范围可为1-50或更多个碱基对。在实施方案中,插入缺失可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499或500个碱基对或更多。如果双链断裂被靶向靠近短的靶序列,则由NHEJ修复导致的缺失突变常常跨越并因此去除不需要的核苷酸。对于较大的DNA区段的缺失,引入两个双链断裂(序列的每侧上一个双链断裂)可在端部之间产生NHEJ,同时去除了整个中间序列。这两种方法都可用于缺失具体的DNA序列。
在实施方案中,介导NHEJ的组合物、系统或其组分可用于所述方法中以缺失小序列基序。组合物、系统或其组分介导的NHEJ可用于所述方法以生成NHEJ介导的插入缺失,其可被靶向至-例如编码区,例如目标基因的早期编码区,可用于敲除目标基因(即消除所述目标基因的表达)。例如,目标基因的早期编码区包括紧接在转录起始位点之后、在编码序列的第一外显子内或在转录起始位点的500bp内(例如,小于500、450、400、350、300、250、200、150、100或50bp)的序列。在实施方案中,其中指导RNA和Cas效应物生成了双链断裂,目的是为了诱导NHEJ介导的插入缺失,指导RNA可被构造成将一个双链断裂定位成紧密接近靶位置的核苷酸。在实施方案中,切割位点可以距靶位置0-500bp之间(例如,距靶位置少于500、400、300、200、100、50、40、30、25、20、15、10、9、8、7、6、5、4、3、2或1bp)。在示例性实施方案中,其中与一个或多个Cas切口酶复合的两个指导RNA诱导了两个单链断裂,目的是为了诱导NHEJ介导的插入缺失,两个指导RNA可被构造成将两个单链断裂定位成向靶位置的核苷酸提供NHEJ修复。
为了最小化毒性和脱靶效应,重要的是控制所递送的Cas mRNA和指导RNA的浓度。Cas mRNA和指导RNA的最佳浓度可通过在细胞模型或非人真核动物模型中测试不同的浓度,并使用深度测序分析潜在的脱靶基因组基因座处的修饰程度来确定。可替代地,为了最小化毒性水平和脱靶效应,可将Cas切口酶mRNA(例如带有D10A突变的化脓性链球菌Cas9)与一对靶向目标位点的指导RNA一起递送。将毒性和脱靶效应最小化的指导序列和策略可以如国际专利公布号WO 2014/093622(PCT/US2013/074667)中一样;或者,通过突变。其他指导序列和策略如本文别处所述。
通常,在内源性CRISPR或系统的情况下,CRISPR或复合物(包含杂交至靶序列并且与一种或多种Cas蛋白复合的指导序列)的形成导致靶序列中或附近(例如,距靶序列1、2、3、4、5、6、7、8、9、10、20、50或更多个碱基对内)的一条或两条链的切割、切口和/或另一种修饰。在实施方案中,tracr序列可包含野生型tracr序列的全部或一部分(例如,野生型tracr序列的约或大于约20、26、32、45、48、54、63、67、85或更多个核苷酸)或由其组成,还可形成CRISPR复合物的一部分,诸如通过沿着tracr序列的至少一部分与可操作地连接到指导序列的tracr配对序列的全部或一部分杂交。
修饰细胞中的靶多核苷酸以治疗或预防疾病的方法可包括允许组合物、系统或其组分结合靶多核苷酸,例如,以实现切割、切口或其他修饰,如组合物、系统能够对所述靶多核苷酸进行的,从而修饰所述靶多核苷酸,其中所述组合物、系统或其组分与指导序列复合,并使所述指导序列与靶多核苷酸内的靶序列杂交,其中所述指导序列任选地连接至tracr配对序列,所述tracr配对序列继而可与tracr序列杂交。在这些实施方案中的一些实施方案中,组合物、系统或其组分可以是或包括与指导序列复合的CRISPR-Cas效应物。修饰可包括通过组合物、系统或其组分的一种或多种组分在靶序列的位置对一条或两条链进行切割或切口。
能够由组合物、系统进行的切割、切口或其他修饰可修饰靶多核苷酸的转录。在实施方案中,转录的修饰可包括减少靶多核苷酸的转录。在实施方案中,修饰可包括增加靶多核苷酸的转录。所述方法可通过与重组模板多核苷酸同源重组来修复所述切割的靶多核苷酸,其中所述修复产生修饰,诸如但不限于所述靶多核苷酸的一个或多个核苷酸的插入、缺失或取代。在实施方案中,所述修饰产生由包含靶序列的基因表达的蛋白质中的一个或多个氨基酸变化。在实施方案中,由组合物、系统或其组分赋予的修饰提供可校正疾病或其症状的转录物和/或蛋白质,包括但不限于本文别处更详细描述的那些转录物和/或蛋白质中的任一种。
治疗或预防疾病的方法可包括将一种或多种载体或载体系统递送至细胞,诸如真核或原核细胞,其中一种或多种载体或载体系统包括组合物、系统或其组分。在实施方案中,载体或载体系统可以是病毒载体或载体系统,诸如AAV或慢病毒载体系统,其在本文别处更详细地描述。在实施方案中,治疗或预防疾病的方法可包括递送一种或多种病毒粒子,诸如AAV或慢病毒粒子,其含有组合物、系统、或其组分。在实施方案中,病毒粒子具有组织特异性趋向性。在实施方案中,病毒粒子具有肝脏、肌肉、眼睛、心脏、胰腺、肾脏、神经元、上皮细胞、内皮细胞、星形胶质细胞、神经胶质细胞、免疫细胞或红细胞特异性趋向性。
应当理解,所述组合物和系统,诸如用于如本文所述的方法的组合物和系统,可适合用于针对组合物、系统已知的任何类型的应用,优选在真核生物中。在某些方面,所述应用是治疗性的,优选在真核生物体中是治疗性的,所述真核生物体诸如包括但不限于动物(包括人)、植物、藻类、真菌(包括酵母)等。可替代地或另外地,在某些方面,所述应用可涉及实现或诱导一种或多种特定性状或特征,诸如基因型和/或表型性状或特征,也如本文别处所述。
治疗循环系统的疾病
在实施方案中,本文所述的组合物、系统和/或其组分可用于治疗和/或预防循环系统疾病。在实施方案中,Wahlgren等人(Nucleic Acids Research,2012,第40卷,第17e130期)的血浆外泌体可用于将本文所述的组合物、系统和/或其组分递送至血液。在实施方案中,循环系统疾病可通过使用慢病毒递送本文所述的组合物、系统以在体内或离体修饰造血干细胞(HSC)来治疗(参见例如Drakopoulou,“Review Article,The OngoingChallenge of Hematopoietic Stem Cell-Based Gene Therapy forβ-Thalassemia,”Stem Cells International,第2011卷,文章编号987980,10页,doi:10.4061/2011/987980,鉴于本文的描述,其可适于与本文的组合物、系统一起使用)。在实施方案中,循环系统疾病可通过使用本文中的组合物、系统或其组分校正关于疾病的HSC来治疗,其中所述组合物、系统任选地包括合适的HDR修复模板(参见例如Cavazzana,“Outcomes of GeneTherapy for β-Thalassemia Major via Transplantation of AutologousHematopoietic Stem Cells Transduced Ex Vivo with a LentiviralβA-T87Q-GlobinVector.”;Cavazzana-Calvo,“Transfusion independence and HMGA2 activation aftergene therapy of humanβ-thalassaemia”,Nature 467,318–322(2010年9月16日)doi:10.1038/nature09328;Nienhuis,“Development of Gene Therapy for Thalassemia,Cold Spring Harbor Perspectives in Medicine,doi:10.1101/cshperspect.a011833(2012),LentiGlobin BB305,a lentiviral vector containing an engineeredβ-globingene(βA-T87Q);和Xie等人,“Seamless gene correction of β-thalassaemia mutationsin patient-specific iPSCs using CRISPR/Cas9 and piggyback”Genome Researchgr.173427.114(2014)www.genome.org/cgi/doi/10.1101/gr.173427.114(Cold SpringHarbor Laboratory Press;Watts,“Hematopoietic Stem Cell Expansion and GeneTherapy”Cytotherapy 13(10):1164–1171.doi:10.3109/14653249.2011.620748(2011),鉴于本文的描述,其可适于与本文的组合物、系统一起使用)。在实施方案中,可使用本文所述的组合物、系统来修饰iPSC,以校正与循环系统疾病相关联的疾病多核苷酸。在这方面,Xu等人(Sci Rep.2015年7月9日;5:12065.doi:10.1038/srep12065)和Song等人(StemCells Dev.2015年5月1日;24(9):1053-65.doi:10.1089/scd.2014.0347.电子出版于2015年2月5日)关于修饰iPSC的教义鉴于本文的描述可适于与本文所述的组合物、系统一起使用。
术语“造血干细胞”或“HSC”泛指被认为是HSC的那些细胞,例如,产生所有其他血细胞并源自中胚层的血细胞;位于红骨髓中的细胞,所述红骨髓包含在大多数骨骼的核心中。本文的HSC可包括具有造血干细胞表型的细胞,通过小尺寸、缺乏谱系(lin)标志物和属于分化系列簇的标志物来鉴定,所述标志物如:CD34、CD38、CD90、CD133、CD105、CD45,以及干细胞因子的受体c-kit。造血干细胞对用于检测谱系确定的标志物呈阴性,并因此称为Lin-;并且,在通过FACS纯化它们的过程中,多达14种不同的成熟血谱系标志物,例如,对于人,针对骨髓的CD13和CD33,针对红细胞的CD71、针对B细胞的CD19,针对巨核细胞的CD61等;以及针对B细胞的B220(鼠CD45),针对单核细胞的Mac-1(CD11b/CD18),针对粒细胞的Gr-1、针对红细胞的Ter119,针对T细胞的Il7Ra、CD3、CD4、CD5、CD8等。小鼠HSC标志物:CD34lo/-、SCA-1+、Thy1.1+/lo、CD38+、C-kit+、lin-,以及人HSC标志物:CD34+、CD59+、Thy1/CD90+、CD38lo/-、C-kit/CD117+和lin-。HSC通过标志物来鉴定。因此,在本文讨论的实施方案中,HSC可以是CD34+细胞。HSC也可以是呈CD34-/CD38-的造血干细胞。在本领域中被认为是HSC的细胞表面上可能缺乏c-kit的干细胞,以及在本领域中同样被认为是HSC的CD133+细胞。
在实施方案中,用于治疗循环系统或血液疾病的治疗或预防可包括用本文所述的任何修饰来修饰人脐带血细胞。在实施方案中,用于治疗循环系统或血液疾病的治疗或预防可包括用本文所述的任何修饰来修饰粒细胞集落刺激因子动员的外周血细胞(mPB)。在实施方案中,人脐带血细胞或mPB可以是CD34+。在实施方案中,修饰的脐带血细胞或mPB细胞可以是自体的。在实施方案中,脐带血细胞或mPB细胞可以是同种异体的。除了修饰疾病基因之外,还可使用本文所述的组合物、系统进一步修饰同种异体细胞以降低细胞在递送至受体时的免疫原性。此类技术描述于本文别处和例如Cartier,“MINI-SYMPOSIUM:X-Linked Adrenoleukodystrophypa,Hematopoietic Stem Cell Transplantation andHematopoietic Stem Cell Gene Therapy in X-Linked Adrenoleukodystrophy,”BrainPathology 20(2010)857–862,其可适于与本文的组合物、系统一起使用。修饰的脐带血细胞或mPB细胞可任选地在体外扩增。可使用任何合适的递送技术将修饰的脐带血细胞或mPB细胞衍生给有需要的受试者。
组合物和系统可被设计成靶向HSC中的一个或多个遗传基因座。在实施方案中,Cas效应物可针对真核细胞并且尤其是哺乳动物细胞(例如人细胞,例如HSC或iPSC)进行密码子优化,并且可制备靶向HSC诸如循环疾病中的一个或多个基因座的sgRNA。这些可通过粒子递送。粒子可由Cas效应物蛋白和混合的gRNA形成。gRNA和Cas效应物蛋白混合物可例如与包含表面活性剂、磷脂、生物可降解聚合物、脂蛋白和醇或基本上由其组成或由其组成的混合物混合,由此可形成含有gRNA和Cas效应物蛋白的粒子。本公开包括这样制造粒子和由此种方法制成的粒子及其用途。在血液或循环系统或HSC递送至血液或循环系统的情况下,适合递送CRISRP-Cas系统的粒子在本文别处更详细地描述。
在实施方案中,在离体修饰后,可对HSC或iPCS进行扩增,之后将其施用于受试者。HSC的扩增可通过任何合适的方法进行,所述方法诸如由Lee,“Improved ex vivoexpansion of adult hematopoietic stem cells by overcoming CUL4-mediateddegradation of HOXB4.”Blood.2013年5月16日;121(20):4082-9.doi:10.1182/blood-2012-09-455204.电子出版于2013年3月21日描述的那些。
在实施方案中,修饰的HSC或iPSC可以是自体的。在实施方案中,HSC或iPSC可以是同种异体的。除了修饰疾病基因之外,还可使用本文所述的组合物、系统进一步修饰同种异体细胞以降低细胞在递送至受体时的免疫原性。此类技术描述于本文别处和例如Cartier,“MINI-SYMPOSIUM:X-Linked Adrenoleukodystrophypa,Hematopoietic Stem CellTransplantation and Hematopoietic Stem Cell Gene Therapy in X-LinkedAdrenoleukodystrophy,”Brain Pathology 20(2010)857–862,其可适于与本文的组合物、系统一起使用。
治疗神经系统疾病
在实施方案中,本文所述的组合物、系统可用于治疗脑和CNS的疾病。对于脑的递送选项包括将CRISPR酶、转座酶和/或指导RNA以DNA或RNA的形式封装到脂质体中,并与分子特洛伊木马(Trojan horses)缀合以进行跨血脑屏障(BBB)递送。分子特洛伊木马已被证明可有效地将B-gal表达载体递送到非人灵长类动物的脑中。同一方法可用于递送含有CRISPR酶、转座酶和/或指导RNA的载体。例如,Xia CF和Boado RJ,Pardridge WM(“Antibody-mediated targeting of siRNA via the human insulin receptor usingavidin-biotin technology.”Mol Pharm.2009年5月至6月;6(3):747-51.doi:10.1021/mp800194)描述了如何通过结合使用受体特异性单克隆抗体(mAb)和抗生物素蛋白-生物素技术,将短干扰RNA(siRNA)在培养物中和在体内递送至细胞。作者还报告说,由于靶向mAb和siRNA之间的键在抗生物素蛋白-生物素技术下是稳定的,并且在静脉内给予靶向siRNA后在体内观察到远处部位(如脑)的RNAi效应,其教导可以适用于与本文的组合物、系统一起使用。在其他实施方案中,可生成人工病毒以进行CNS和/或脑递送。参见例如,Zhang等人(Mol Ther.2003年1月;7(1):11-8.)),其教义可适于与本文的组合物、系统一起使用。
治疗听力疾病
在实施方案中,本文所述的组合物和系统可用于治疗一只或两只耳朵的听力疾病或听力损失。耳聋通常是由毛细胞丢失或受损使得无法将信号传递给听觉神经元而引起的。在此类情况下,耳蜗植入物可用于对声音作出反应,并将电信号传输到神经细胞。但由于受损的毛细胞释放的生长因子较少,这些神经元经常退化并从耳蜗缩回。
在实施方案中,可通过任何合适的方法或技术将组合物、系统或修饰的细胞递送至一只或两只耳朵,用于治疗或预防听力疾病或听力损失。合适的方法和技术包括但不限于美国专利公布号20120328580中阐述的那些,所述申请描述了例如使用注射器(例如,单剂量注射器)将药物组合物注射到耳中(例如,耳部施用),诸如注射到耳蜗的腔(例如,中阶(Scala media)、前庭阶(Sc vestibulae)和鼓阶(Sc tympani))中。例如,本文所述化合物中的一种或多种可通过鼓室内注射(例如,到中耳中)和/或注射到外耳、中耳和/或内耳中来施用;通过导管或泵原位施用(参见例如McKenna等人,(美国专利公布号2006/0030837)和Jacobsen等人,(美国专利号7,206,639);与佩戴在外耳中的机械装置(诸如耳蜗植入物或助听器)组合施用(参见例如美国专利公布号2007/0093878,其提供了适用于将本文所述的组合物、系统递送至耳的示例性耳蜗植入物)。此类方法在本领域中常规使用,例如,用于将类固醇和抗生素施用到人耳中。例如,可通过耳朵的圆窗或通过耳蜗囊进行注射。其他内耳施用方法是本领域已知的(参见例如,Salt和Plontke,Drug Discovery Today,10:1299-1306,2005)。在实施方案中,可在外科手术过程中将导管或泵定位在例如患者的耳(例如,外耳、中耳和/或内耳)中。在实施方案中,可将导管或泵定位在例如患者的耳(例如,外耳、中耳和/或内耳)中,而无需外科手术。
一般来讲,美国专利公布号20120328580中描述的细胞治疗方法可用于在体外促进细胞向或朝向内耳的成熟细胞类型(例如,毛细胞)的完全或部分分化。然后可将由此类方法产生的细胞移植或植入到需要此种治疗的患者中。下面描述了实践这些方法所需的细胞培养方法,包括用于鉴定和选择合适细胞类型的方法、用于促进选定细胞的完全或部分分化的方法、用于鉴定完全或部分分化的细胞类型的方法、以及用于植入完全或部分分化的细胞的方法。
适用于本公开的细胞包括但不限于,当与本文所述化合物中的一种或多种例如体外接触时能够完全或部分分化成内耳的成熟细胞(例如毛细胞(例如,内耳和/或外耳毛细胞))的细胞。能够分化成毛细胞的示例性细胞包括但不限于干细胞(例如,内耳干细胞、成体干细胞、骨髓源性干细胞、胚胎干细胞、间充质干细胞、皮肤干细胞、iPS细胞和脂肪来源的干细胞)、祖细胞(例如,内耳祖细胞)、支持细胞(例如,戴特斯细胞(Deiters'细胞)、柱细胞、内指状细胞、顶盖细胞和汉森细胞(Hensen's cell))和/或生殖细胞。干细胞用于替换内耳感觉细胞的用途描述于Li等人,(美国公布号2005/0287127)和Li等人,(美国专利公布号11/953,797)中。骨髓源性干细胞用于替换内耳感觉细胞的用途描述于Edge等人,PCT/US2007/084654中。iPS细胞描述于例如,Takahashi等人,Cell,第131卷,第5期,第861-872页(2007);Takahashi和Yamanaka,Cell 126,663-76(2006);Okita等人,Nature 448,260-262(2007);Yu,J.等人,Science 318(5858):1917-1920(2007);Nakagawa等人,Nat.Biotechnol.26:101-106(2008);以及Zaehres和Scholer,Cell 131(5):834-835(2007)中。可通过分析(例如,定性或定量)一种或多种组织特异性基因的存在来鉴定此类合适的细胞。例如,可通过检测一种或多种组织特异性基因的蛋白质产物来检测基因表达。蛋白质检测技术涉及使用针对适当抗原的抗体对蛋白质进行染色(例如,使用细胞提取物或全细胞)。在这种情况下,所述适当抗原是组织特异性基因表达的蛋白质产物。虽然在原则上可标记第一抗体(即,结合抗原的抗体),但更常见(并改善可视化)的是使用针对第一抗体的第二抗体(例如,抗IgG)。这种第二抗体与荧光染料或用于比色反应的适当酶、或金珠(用于电子显微镜)或与生物素-抗生物素蛋白系统缀合,使得可识别一级抗体的位置,并因此可识别抗原的位置。
可通过将药物组合物直接应用于外耳来将组合物和系统递送到耳,其中组合物从美国专利公布号20110142917修改而来。在实施方案中,药物组合物应用于耳道。递送到耳也可以称为听觉或耳递送。
在实施方案中,可通过可应用于核酸靶向系统的新型蛋白质递送技术通过完整圆窗转染至内耳来将组合物、系统或其组分和/或载体或载体系统递送至耳(参见例如Qi等人,Gene Therapy(2013),1-9)。可考虑约40μl的10mM RNA作为施用至耳的剂量。
根据Rejali等人(Hear Res.2007年6月;228(1-2):180-7),耳蜗植入物的功能通过良好保留螺旋神经节神经元而得以改善,所述神经元是由植入物电刺激的靶标,并且先前已经表明脑源性神经营养因子(BDNF)在实验性变聋的耳中增强了螺旋神经节的存活。Rejali等人测试了耳蜗植入物电极的修改设计,所述电极包括由具有BDNF基因插入物的病毒载体转导的成纤维细胞的涂层。为了完成这种类型的离体基因转移,Rejali等人用具有BDNF基因盒插入物的腺病毒转导豚鼠成纤维细胞,并且确定这些细胞分泌BDNF,然后将BDNF分泌细胞通过琼脂糖凝胶附着在耳蜗植入物电极上,并将电极植入鼓阶中。Rejali等人确定,BDNF表达电极与对照电极相比在植入48天之后能够在耳蜗底回中保留显著更多螺旋神经节神经元,并且证明了耳蜗植入物疗法与用于增强螺旋神经节神经元存活的离体基因转移相结合的可行性。此种系统可应用于递送到耳的核酸靶向系统。
在实施方案中,Mukherjea等人(Antioxidants&Redox Signaling,第13卷,第5期,2010)中阐述的系统可适于将组合物、系统或其组分经鼓室施用于耳。在实施方案中,用于施用于人的CRISPR Cas的剂量为约2mg至约4mg。
在实施方案中,[Jung等人(Molecular Therapy,第21卷第4期,834–841 2013年4月)中阐述的系统可适于将组合物、系统或其组分经前庭上皮递送至耳。在实施方案中,用于施用于人的CRISPR Cas的剂量为约1mg至约30mg。
治疗非分裂细胞中的疾病
在实施方案中,待校正的基因或转录物位于非分裂细胞中。示例性非分裂细胞是肌肉细胞或神经元。非分裂(尤其是非分裂、完全分化)细胞类型提出了关于基因靶向或基因组工程的问题,例如因为同源重组(HR)一般在G1细胞周期阶段受抑制。然而,尽管研究了细胞控制正常DNA修复系统的机制,Durocher发现了使非分裂细胞中的HR保持“关闭”的先前未知的开关,并且设计了拨动此开关重新开启的策略。Orthwein等人(加拿大渥太华西奈山医院(Mount Sinai)的丹尼尔迪罗谢(Daniel Durocher)实验室)最近报道(Nature16142,在线发布于2015年12月9日)已经表面,对HR的抑制可被解除并且在肾(293T)和骨肉瘤(U2OS)细胞两者中成功完成基因靶向。已知肿瘤抑制因子BRCA1、PALB2和BRAC2通过HR促进DNA DSB修复。他们发现BRCA1与PALB2-BRAC2的复合物的形成受PALB2上的泛素位点支配,使得通过E3泛素连接酶对所述位点起作用。这种E3泛素连接酶由与cullin-3(CUL3)-RBX1复合的KEAP1(PALB2相互作用蛋白)构成。PALB2泛素化抑制它与BRCA1的相互作用并被去泛素化酶USP11抵消,所述去泛素化酶USP11本身处于细胞周期控制之下。与DNA端切除的激活结合的BRCA1-PALB2相互作用的恢复足以诱导G1中的同源重组,如通过多种方法所测量的,所述方法包括针对USP11或KEAP1(由pX459载体表达)的基于CRISPR-Cas的基因靶向测定。然而,当使用KEAP1消耗或PALB2-KR突变体的表达使BRCA1-PALB2相互作用在切除感受态G1细胞中恢复时,检测到基因靶向事件的稳健增加。这些教义可适于和/或应用于本文所述的Cas组合物、系统。
因此,在实施方案中,细胞(尤其是非分裂、完全分化的细胞类型)中的HR再激活是优选的。在实施方案中,促进BRCA1-PALB2相互作用在实施方案中是优选的。在实施方案中,靶细胞是非分裂细胞。在实施方案中,靶细胞是神经元或肌细胞。在实施方案中,在体内靶向靶细胞。在实施方案中,细胞处于G1并且HR受抑制。在实施方案中,使用KEAP1消耗,例如抑制KEAP1活性的表达是优选的。KEAP1消耗可通过siRNA实现,例如,如Orthwein等人中所示。可替代地,与KEAP1消耗相结合的或单独的PALB2-KR突变体(在BRCA1相互作用结构域中缺乏所有八个Lys残基)的表达是优选的,。不管细胞周期定位,PALB2-KR与BRCA1相互作用。因此,在实施方案中,促进或恢复BRCA1-PALB2相互作用(尤其是在G1细胞中)是优选的,尤其是在靶细胞是非分裂的情况下,或在去除和返回(离体基因靶向)有问题的情况下,例如神经元或肌细胞。KEAP1 siRNA可购自ThermoFischer。在实施方案中,可将BRCA1-PALB2复合物递送至G1细胞。在实施方案中,可例如通过增加去泛素化酶USP11的表达来促进PALB2去泛素化,因此设想可提供构建体以促进或上调去泛素化酶USP11的表达或活性。
治疗眼睛疾病
在实施方案中,待治疗的疾病是影响眼睛的疾病。因此,在实施方案中,将本文所述的组合物、系统或其组分递送至一只或两只眼睛。
所述组合物、系统可用于校正几种遗传突变引起的眼部缺陷,其进一步描述于Genetic Diseases of the Eye,第二版,由Elias I.Traboulsi编辑,Oxford UniversityPress,2012中。
在实施方案中,待治疗或待靶向的病状是眼部病症。在实施方案中,眼部病症可包括青光眼。在实施方案中,眼部病症包括视网膜退行性疾病。在实施方案中,所述视网膜退行性疾病选自Stargardt病、巴德-毕德氏综合征(Bardet-Biedl syndrome)、Best病、蓝锥全色盲、脉络膜症、锥杆营养不良、先天性静止性夜盲症、增强的S锥综合征、青少年X连锁视网膜劈裂症、Leber先天性黑蒙、Malattia Leventinesse、诺里病(Norrie Disease)或X连锁家族性渗出性玻璃体视网膜病变、模式营养不良、Sorsby营养不良、Usher综合征、色素性视网膜炎、色盲或黄斑营养不良或变性、色素性视网膜炎、色盲和年龄相关性黄斑变性。在实施方案中,视网膜退行性疾病是莱伯先天性黑蒙(LCA)或色素性视网膜炎。其他示例性眼部疾病在本文别处更详细地描述。
在实施方案中,任选地通过玻璃体内注射或视网膜下注射将组合物、系统递送至眼睛。可借助手术显微镜进行眼内注射。对于视网膜下和玻璃体内注射,可通过轻轻指压使眼睛突出,并且使用接触镜系统使眼底可视化,所述接触镜系统由用玻璃显微镜载玻片盖玻片覆盖的角膜上的一滴耦合介质溶液组成。对于视网膜下注射,安装在5-μl汉密尔顿(Hamilton)注射器上的10-mm 34号针的尖端可在直接可视化下穿过巩膜赤道部上部朝向后极切向行进,直到针的孔径在视网膜下空间中可见为止。然后,可注射2μl载体悬浮液以产生上部泡状视网膜脱离,从而证实视网膜下载体施用。这种方法创建了自我愈合的巩膜切开术,从而允许载体悬浮液保留在视网膜下空间,直到它在规程的48小时内被RPE吸收为止。可以在脑半球下方重复此规程以产生下部视网膜脱离。这种技术导致大约70%的感觉神经性视网膜和RPE暴露于载体悬浮液。对于玻璃体内注射,针尖端可在角巩膜缘后方1mm穿过巩膜行进并将2μl载体悬浮液注射到玻璃体腔中。对于前房内注射,针尖端可通过角巩膜缘穿刺朝向中央角膜行进,并且可注射2μl载体悬浮液。对于前房内注射,针尖端可通过角巩膜缘穿刺朝向中央角膜行进,并且可注射2μl载体悬浮液。可以1.0-1.4×1010或1.0-1.4×109个转导单位(TU)/ml的滴度注射这些载体。
在实施方案中,为了向眼睛施用,可使用慢病毒载体。在实施方案中,慢病毒载体是马传染性贫血病毒(EIAV)载体。用于眼部递送的示例性EIAV载体描述于Balagaan,JGene Med 2006;8:275–285,2005年11月21日在线发布于Wiley InterScience(www.interscience.wiley.com).DOI:10.1002/jgm.845;Binley等人,HUMAN GENETHERAPY 23:980–991(2012年9月)中,其可适于与本文所述的组合物、系统一起使用。在实施方案中,剂量可以是每只眼睛1.1x105个转导单位(TU/眼),总体积为100μl。
其他病毒载体也可用于递送至眼睛,所述病毒载体诸如AAV载体,诸如描述于以下中的那些:Campochiaro等人,Human Gene Therapy 17:167-176(2006年2月),Millington-Ward等人(Molecular Therapy,第19卷第4期,642–649 2011年4月;Dalkara等人(SciTransl Med 5,189ra76(2013)),其可适于与本文所述的组合物、系统一起使用。在实施方案中,剂量可在约106至109.5个粒子单位的范围内。在Millington-Ward AAV载体的情况下,可施用的剂量为约2x1011至约6x1013个病毒粒子。在Dalkara载体的情况下,施用于人的剂量为约1x1015至约1x1016 vg/ml。
在实施方案中,RXi Pharmaceuticals的系统可用于和/或适于将组合物、系统递送至眼睛。在此系统中,3μg sd-rxRNA的单次玻璃体内施用导致PPIB mRNA水平的序列特异性降低,持续14天。/>系统可应用于核酸靶向系统,考虑施用于人的剂量为约3至20mg的CRISPR。
在其他实施方案中,涉及从人视紫红质基因切割靶序列的方法的美国专利公布号20130183282的方法也可修改用于核酸靶向系统。
在其他实施方案中,可使用或调整用于治疗视网膜病变和视力威胁性眼科病症的美国专利公布号20130202678的方法,所述方法涉及向眼睛的视网膜下或玻璃体内空间中递送Puf-A基因(其在眼组织的视网膜神经节和色素细胞中表达并且展示出独特的抗凋亡活性)。特别地,理想的靶标是zgc:193933、prdm1a、spata2、tex10、rbb4、ddx3、zp2.2、Blimp-1和HtrA2,所有这些均可由所述组合物、系统靶向。
Wu(Cell Stem Cell,13:659-62,2013)设计了一种指导RNA,其将Cas9导向到在小鼠中引起白内障的单一碱基对突变,其中所述突变诱导DNA切割。然后,在突变小鼠中,使用针对接合子修复机制给予的另一种野生型等位基因或寡核苷酸来校正断裂的等位基因的序列并且校正引起白内障的基因缺陷。这种方法可适于和/或应用于本文所述的组合物、系统。
美国专利公布号20120159653描述了使用锌指核酸酶对与黄斑变性(MD)相关联的细胞、动物和蛋白质进行遗传修饰,其教义可应用于和/或适于本文所述的组合物、系统。
美国专利公布号20120159653的一个方面涉及对编码与MD相关联的蛋白质的任何染色体序列进行编辑,所述染色体序列可应用于核酸靶向系统。
治疗肌肉疾病和心血管疾病
在实施方案中,组合物、系统可用于治疗和/或预防肌肉疾病和相关的循环或心血管疾病或病症。本公开还考虑将本文所述的组合物、系统,例如Cas效应蛋白系统,递送至心脏。对于心脏,心肌热带腺相关病毒(AAVM)是优选的,特别是在心脏中表现出优先基因转移的AAVM41(参见例如,Lin-Yanga等人,PNAS,3月10日,2009年,第106卷,第10期)。施用可以是全身的或局部的。对于全身施用考虑约1-10x1014个载体基因组的剂量。另参见,例如,Eulalio等人(2012)Nature 492:376和Somasuntharam等人(2013)Biomaterials 34:7790,其教义可适于和/或应用于本文所述的组合物、系统。
例如,美国专利公布号20110023139,其教义可适于和/或应用于本文所述的组合物、系统,描述了使用锌指核酸酶对与心血管疾病相关联的细胞、动物和蛋白质进行遗传修饰。心血管疾病通常包括高血压、心脏病发作、心力衰竭、以及中风和TIA。涉及心血管疾病的任何染色体序列或由涉及心血管疾病的任何染色体序列编码的蛋白质都可用于本公开所述的方法。通常基于心血管相关蛋白与心血管疾病发展的实验性关联来选择心血管相关蛋白。例如,相对于缺乏心血管病症的群体,在患有心血管病症的群体中,心血管相关蛋白的产生率或循环浓度在患有心血管疾病的人群中可升高或降低。可使用蛋白质组学技术评估蛋白质水平的差异,所述技术包括但不限于Western印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)和质谱法。可替代地,可通过使用基因组技术获得编码蛋白质的基因的基因表达谱来鉴定心血管相关蛋白,所述技术包括但不限于DNA微阵列分析、基因表达系列分析(SAGE)和定量实时聚合酶链式反应(Q-PCR)。示例性染色体序列可见于表2。
本文的组合物、系统可用于治疗肌肉系统的疾病。本公开还考虑将本文所述的组合物、系统、效应蛋白系统递送至肌肉。
在实施方案中,待治疗的肌肉疾病是肌营养不良,诸如DMD。在实施方案中,本文所述的组合物、系统(诸如能够进行RNA修饰的系统)可用于实现外显子跳跃以实现患病基因的校正。如本文所用,术语“外显子跳跃”是指通过用一种或多种互补反义寡核苷酸(AON)靶向前体mRNA内的剪接供体和/或受体位点来修饰前体mRNA剪接。通过阻止剪接体接近一个或多个剪接供体或受体位点,AON可阻止剪接反应,从而导致一个或多个外显子从完全加工的mRNA中缺失。在前体mRNA的成熟过程中,可在细胞核中实现外显子跳跃。在实施方案中,外显子跳跃可包括通过使用本文所述的能够进行RNA修饰的组合物、系统来掩蔽参与靶向外显子的剪接的关键序列。在实施方案中,可在肌营养不良蛋白mRNA中实现外显子跳跃。在实施方案中,所述组合物、系统可在肌营养不良蛋白mRNA的外显子1、2、3、4、5、6、7、8、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、45、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79或其任何组合处诱导外显子跳跃。在实施方案中,所述组合物、系统可在肌营养不良蛋白mRNA的外显子43、44、50、51、52、55或其任何组合处诱导外显子跳跃。这些外显子中的突变也可使用非外显子跳跃多核苷酸修饰方法进行校正。
在实施方案中,对于肌肉疾病的治疗,Bortolanza等人Molecular Therapy第19卷第11期,2055–2064 2011年11月)的方法可应用于表达CRISPR Cas的AAV,并且将其以约2×1015或2×1016vg载体的剂量注射到人体内。Bortolanza等人的教义可适于和/或应用于本文所述的组合物、系统。
在实施方案中,Dumonceaux等人(Molecular Therapy第18卷第5期,881–887 2010年5月)的方法可应用于表达CRISPR Cas的AAV,并且将其例如以约1014至约1015vg载体的剂量注射到人体内。本文所述的Dumonceaux的教义可适于和/或应用于本文所述的组合物、系统。
在实施方案中,Kinouchi等人(Gene Therapy(2008)15,1126–1130)的方法可应用于本文所述的CRISPR Cas系统,并且将其例如以40μM溶液的约500至1000ml的剂量注射到人肌肉内。
在实施方案中,Hagstrom等人(Molecular Therapy第10卷,第2期,2004年8月)的方法可适于和/或应用于本文的组合物、系统,并且将其以约15至约50mg的剂量注射到人的大隐静脉中。
在实施方案中,所述方法包括治疗镰状细胞相关疾病,例如镰状细胞特性、镰状细胞疾病,诸如镰刀状细胞贫血、β-地中海贫血。例如,所述方法和系统可用于修饰镰状细胞的基因组,例如通过校正β-珠蛋白基因的一个或多个突变。在β-地中海贫血的情况下,镰状细胞性贫血可通过用所述系统修饰HSC来纠正。所述系统通过切割细胞的DNA,然后让它自我修复,从而实现对细胞基因组的特定编辑。Cas蛋白被插入并由RNA指导物引导到突变点,然后在所述点切割DNA。同时,插入序列的健康版本。此序列被细胞自身的修复系统用来修复诱导的切割。以此方式,CRISPR-Cas允许纠正先前获得的干细胞中的突变。所述方法和系统可用于使用靶向并校正突变的系统(例如,使用合适的HDR模板,其递送β-珠蛋白,有利的是非镰状β-珠蛋白的编码序列)来校正HSC作为镰状细胞性贫血;具体来说,指导RNA可靶向导致镰状细胞性贫血的突变,并且HDR可为β-珠蛋白的正确表达提供编码。靶向含有突变和Cas蛋白的粒子的指导RNA与携带突变的HSC接触。所述粒子还可含有合适的HDR模板,以校正突变,从而使β-珠蛋白正确表达;或者HSC可与含有或递送HDR模板的第二粒子或载体接触。可施用如此接触的细胞;并任选地进行处理/扩增;参见Cartier。HDR模板可使HSC表达工程化β-珠蛋白基因(例如,βA-T87Q)或β-珠蛋白。
治疗肝脏和肾脏的疾病
在实施方案中,本文所述的组合物、系统或其组分可用于治疗肾脏或肝脏的疾病。因此,在实施方案中,本文所述的CRISRP-Cas系统或其组分递送到肝脏或肾脏。
诱导治疗性核酸的细胞摄取的递送策略包括物理力或载体系统,诸如基于病毒、脂质或复合体的递送,或纳米载剂。根据具有较低可能的临床相关性的最初应用,当以全身性流体动力高压注射将核酸投递(addressed)于肾细胞时,各种基因治疗性病毒和非病毒载剂已经被应用于体内靶向不同的动物肾脏疾病模型中的转录后事件(Csaba Révész和Péter Hamar(2011).Delivery Methods to Target RNAs in the Kidney,Gene TherapyApplications,Prof.Chunsheng Kang(编),ISBN:978-953-307-541-9,InTech,可获自:www.intechopen.com/books/gene-therapy-applications/delivery-methods-to-target-rnas-inthe-kidney)。递送至肾脏的方法可包括描述于Yuan等人(Am J PhysiolRenal Physiol 295:F605–F617,2008)中的那些。Yuang等人的方法可应用于CRISPR Cas系统,其考虑将1-2g与胆固醇缀合的CRISPR Cas皮下注射至人,用于递送至肾脏。在实施方案中,Molitoris等人(J Am Soc Nephrol 20:1754–1764,2009)的方法可适于RISRP-Cas系统,并且对于人的12-20mg/kg的累积剂量可用于递送至肾脏的近端小管细胞。在实施方案中,Thompson等人(Nucleic Acid Therapeutics,第22卷,第4期,2012)的方法可适于CRISRP-Cas系统,并且可通过静脉内(i.v.)施用递送高达25mg/kg的剂量。在实施方案中,Shimizu等人(J Am Soc Nephrol 21:622–633,2010)的方法可适于CRISRP-Cas系统,并且可使用用于腹膜内(i.p.)施用的在约1-2升生理盐水中与纳米载剂复合的约10-20μmolCRISPR Cas的剂量。
其他各种递送媒介物可用于将组合物、系统递送至肾脏,所述媒介物诸如病毒、流体动力、脂质、聚合物纳米粒子、适体及其各种组合(参见例如,Larson等人,Surgery,(2007年8月),第142卷,第2期,第(262-269)页;Hamar等人,Proc Natl Acad Sci,(2004年10月),第101卷,第41期,第(14883-14888)页;Zheng等人,Am J Pathol,(2008年10月),第173卷,第4期,第(973–980)页;Feng等人,Transplantation,(2009年5月),第87卷,第9期,第(1283–1289)页;Q.Zhang等人,PloS ONE,(2010年7月),第5卷,第7期,e11709,第(1-13)页;Kushibikia等人,J Controlled Release,(2005年7月),第105卷,第3期,第(318-331)页;Wang等人,Gene Therapy,(2006年7月),第13卷,第14期,第(1097-1103)页;Kobayashi等人,Journal of Pharmacology and Experimental Therapeutics,(2004年2月),第308卷,第2期,第(688-693)页;Wolfrum等人,Nature Biotechnology,(2007年9月),第25卷,第10期,第(1149-1157)页;Molitoris等人,J Am Soc Nephrol,(2009年8月),第20卷,第8期第(1754-1764)页;Mikhaylova等人,Cancer Gene Therapy,(2011年3月),第16卷,第3期,第(217-226)页;Y.Zhang等人,J Am Soc Nephrol,(2006年4月),第17卷,第4期,第(1090–1101)页;Singhal等人,Cancer Res,(May 2009),第69卷,第10期,第(4244-4251)页;Malek等人,Toxicology and Applied Pharmacology,(2009年4月),第236卷,第1期,第(97-108)页;Shimizu等人,J Am Soc Nephrology,(2010年4月),第21卷,第4期,第(622-633)页;Jiang等人,Molecular Pharmaceutics,(2009年5月至6月),第6卷,第3期,第(727-737)页;Cao等人,J Controlled Release,(2010年6月),第144卷,第2期,第(203-212)页;Ninichuk等人,Am J Pathol,(Mar 2008),第172卷,第3期,第(628-637)页;Purschke等人,ProcNatl Acad Sci,(2006年3月),第103卷,第13期,第(5173-5178)页。
在实施方案中,递送至肝脏细胞。在实施方案中,肝脏细胞是肝细胞。本文的组合物和系统的递送可通过病毒载体进行,尤其是AAV(并且特别是AAV2/6)载体。这些可通过静脉内注射施用。无论是在体外还是在体内,针对肝脏的优选靶标都是白蛋白基因。这就是所谓的“安全港”,因为白蛋白以非常高的水平表达,并且因此在成功基因编辑后白蛋白产量的稍微降低是耐受的。这也是优选的,因为即使仅一小部分肝细胞被编辑,从白蛋白启动子/增强子所见的高水平表达允许实现有用水平的校正或转基因产生(由插入的重组模板产生)。参见Wechsler等人(在美国血液学会第57届年度会议上报道的,摘要可在线获得于ash.confex.com/ash/2015/webprogram/Paper86495.html,并且呈现于2015年12月6日)鉴定的位点,其可适于与本文的组合物、系统一起使用。
可治疗和/或预防的示例性肝脏和肾脏疾病在本文别处描述。
治疗上皮和肺部疾病
在实施方案中,由本文所述的组合物和系统治疗或预防的疾病可以是肺部或上皮疾病。本文所述的组合物和系统可用于治疗上皮和/或肺部疾病。本公开还考虑将本文所述的组合物、系统递送至一个或两个肺。
在实施方案中,病毒载体可用于将组合物、系统或其组分递送至肺。在实施方案中,AAV是用于递送至肺的AAV-1、AAV-2、AAV-5、AAV-6和/或AAV-9。(参见例如,Li等人,Molecular Therapy,第17卷第12期,2067-2077 2009年12月)。在实施方案中,MOI可以从1×103至4×105个载体基因组/细胞变化。在实施方案中,递送载体可以是如在Zamora等人(Am J Respir Crit Care Med第183卷.第531–538页,2011中的RSV载体。Zamora等人的方法可应用于核酸靶向系统,并且可考虑雾化的CRISPR Cas,例如以0.6mg/kg的剂量。
针对肺部疾病进行治疗的受试者的每一个肺可以例如接受支气管内递送的药学上有效量的雾化AAV载体系统,同时自然地呼吸。因此,通常对于AAV递送而言,雾化递送是优选的。腺病毒或AAV粒子可用于递送。其中每个都与一个或多个调控序列可操作地连接的合适的基因构建体可被克隆到递送载体中。在这种情况下,提供下列构建体作为实例:用于Cas的Cbh或EF1a启动子、用于指导RNA的U6或H1启动子:优选的安排是使用靶向指导物的CFTRδ508、用于δF508突变的修复模板以及密码子优化的Cas酶,所述酶具有任选地一个或多个核定位信号或序列(NLS),例如,两(2)个NLS。
治疗皮肤疾病
本文所述的组合物和系统可用于治疗皮肤疾病。本公开还考虑将本文所述的组合物和系统递送至皮肤。
在实施方案中,可通过一种或多种微针或含有微针的装置将组合物、系统或其组分递送至皮肤(皮内递送)。例如,在实施方案中,所述装置和Hickerson等人(MolecularTherapy—Nucleic Acids(2013)2,e129)的方法可用于和/或适于例如以高达300μl的0.1mg/ml CRISPR-Cas系统的剂量将本文所述的组合物、系统递送至皮肤。
在实施方案中,Leachman等人(Molecular Therapy,第18卷第2期,442–446 2010年2月)的方法和技术可用于和/或适于将本文所述的CIRPSR-Cas系统递送至皮肤。
在实施方案中,Zheng等人(PNAS,7月24日,2012年,第109卷,第30期,11975–11980)的方法和技术可用于和/或适于将本文所述的CIRPSR-Cas系统纳米粒子递送至皮肤。在实施方案中,在单次应用中应用的约25nM的剂量可实现皮肤中的基因敲低。
治疗癌症
本文所述的组合物、系统可用于治疗癌症。本公开还考虑将本文所述的组合物、系统递送至癌细胞。此外,如本文别处所述,组合物、系统可用于修饰免疫细胞,诸如CAR或CART细胞,然后所述免疫细胞继而可用于治疗和/或预防癌症。这也描述于国际专利公布号WO2015/161276中,其公开内容以引用的方式特此并入并在下文描述。
适用于治疗或预防癌症的靶基因可包括表2和表3中列出的那些。在实施方案中,用于癌症治疗和预防的靶基因还可包括描述于国际专利公布号WO 2015/048577中的那些,其公开内容以引用的方式特此并入,并且可适于和/或应用于本文所述的组合物、系统。
过继性细胞疗法
本文所述的组合物、系统及其组分可用于修饰用于过继性细胞疗法的细胞。在一个方面,涉及编辑靶核酸序列或调节靶核酸序列的表达的方法和组合物及其结合癌症免疫疗法的应用通过适配所述组合物、系统来理解。在实施方案中,所述组合物、系统和方法可用于修饰干细胞(例如,诱导多能干细胞)以衍生可用于过继性细胞疗法的修饰的自然杀伤细胞、γδT细胞和αβT细胞。在示例实施方案中,所述组合物、系统和方法可用于修饰修饰的自然杀伤细胞、γδT细胞和αβT细胞。
如本文所用,“ACT”、“过继性细胞疗法”和“过继性细胞转移”可互换使用。在实施方案中,过继性细胞疗法(ACT)可以指将细胞转移到患者,目的是通过细胞的植入将功能和特征转移到新宿主中(参见例如,Mettananda等人,Editing anα-globin enhancer inprimary human hematopoietic stem cells as a treatment forβ-thalassemia,NatCommun.2017年9月4日;8(1):424)。如本文所用,术语“植入(engraft)”或“植入(engraftment)”是指通过与组织的现有细胞接触而将细胞在体内并入目标组织中的过程。过继性细胞疗法(ACT)可以指将细胞(最常见的是免疫源性细胞)转移回同一患者或新的受体宿主中,目的是将免疫功能和特征转移到新宿主中。如果可能的话,使用自体细胞通过最小化GVHD问题来帮助受体。自体肿瘤浸润淋巴细胞(TIL)(Zacharakis等人,(2018)NatMed.2018年6月;24(6):724-730;Besser等人,(2010)Clin.Cancer Res 16(9)2646–55;Dudley等人,(2002)Science 298(5594):850–4;和Dudley等人,(2005)Journal ofClinical Oncology 23(10):2346–57.)或基因重定向的外周血单核细胞(Johnson等人,(2009)Blood 114(3):535–46;和Morgan等人,(2006)Science314(5796)126-9)的过继性转移已被用于成功治疗患有晚期实体瘤(包括黑色素瘤、转移性乳腺癌和结直肠癌)的患者以及患有CD19表达血液系统恶性肿瘤的患者(Kalos等人,(2011)Science TranslationalMedicine 3(95):95ra73)。在实施方案中,转移同种异体细胞和免疫细胞(参见例如,Ren等人,(2017)Clin Cancer Res 23(9)2255-2266)。如本文进一步描述的,可编辑同种异体细胞以降低同种异体反应性并预防移植物抗宿主病。因此,同种异体细胞的使用允许从健康供体获得细胞并将其制备用于患者,而不是从诊断后的患者制备自体细胞。
方面涉及免疫系统细胞诸如T细胞的过继转移,所述细胞对选定的抗原诸如肿瘤相关抗原或肿瘤特异性新抗原具有特异性(参见例如,Maus等人,2014,AdoptiveImmunotherapy for Cancer or Viruses,Annual Review of Immunology,第32卷:189-225;Rosenberg和Restifo,2015,Adoptive cell transfer as personalizedimmunotherapy for human cancer,Science第348卷第6230期第62-68页;Restifo等人,2015,Adoptive immunotherapy for cancer:harnessing the T cellresponse.Nat.Rev.Immunol.12(4):269-281;以及Jenson和Riddell,2014,Design andimplementation of adoptive therapy with chimeric antigen receptor-modified Tcells.ImmunolRev.257(1):127-144;和Rajasagi等人,2014年,慢性淋巴细胞白血病中个人肿瘤特异性新抗原的系统性鉴定。Blood.2014年7月17日;124(3):453-62)。
在实施方案中,在疾病(诸如特别是肿瘤或癌症)的过继性细胞疗法(诸如特别是CAR或TCR T细胞疗法)中被靶向的抗原(诸如肿瘤抗原)可选自由以下组成的组:MR1(参见例如,Crowther等人,2020,Genome-wide CRISPR–Cas9 screening reveals ubiquitous Tcell cancer targeting via the monomorphic MHC class I-related protein MR1,Nature Immunology第21卷,第178–185页);B细胞成熟抗原(BCMA)(参见例如,Friedman等人,Effective Targeting of Multiple BCMA-Expressing Hematological Malignanciesby Anti-BCMA CAR T Cells,Hum Gene Ther.2018年3月8日;Berdeja JG等人Durableclinical responses in heavily pretreated patients with relapsed/refractorymultiple myeloma:updated results from a multicenter study of bb2121 anti-BcmaCAR T cell therapy.Blood.2017;130:740;以及Mouhieddine和Ghobrial,Immunotherapyin Multiple Myeloma:The Era of CAR T Cell Therapy,Hematologist,2018年5月至6月,第15卷,第3期);PSA(前列腺特异性抗原);前列腺特异性膜抗原(PSMA);PSCA(前列腺干细胞抗原);酪氨酸蛋白激酶跨膜受体ROR1;成纤维细胞激活蛋白(FAP);肿瘤相关糖蛋白72(TAG72);癌胚抗原(CEA);上皮细胞粘附分子(EPCAM);间皮素;人表皮生长因子受体2(ERBB2(Her2/neu));前列腺酶;前列腺酸性磷酸酶(PAP);延伸因子2突变体(ELF2M);胰岛素样生长因子1受体(IGF-1R);gplOO;BCR-ABL(断裂点簇集区-Abelson);酪氨酸酶;纽约食管鳞状细胞癌1(NY-ESO-1);κ-轻链、LAGE(L抗原);MAGE(黑色素瘤抗原);黑色素瘤相关抗原1(MAGE-A1);MAGE A3;MAGE A6;豆荚蛋白;人乳头瘤病毒(HPV)E6;HPV E7;prostein;生存素(survivin);PCTA1(半乳糖凝集素8);Melan-A/MART-1;Ras突变体;TRP-1(酪氨酸酶相关蛋白1或gp75);酪氨酸酶相关蛋白2(TRP2);TRP-2/INT2(TRP-2/内含子2);RAGE(肾抗原);晚期糖基化终产物受体1(RAGE1);肾泛素1、肾泛素2(RU1、RU2);肠道羧酸酯酶(iCE);热休克蛋白70-2(HSP70-2)突变体;促甲状腺激素受体(TSHR);CD123;CD171;CD19;CD20;CD22;CD26;CD30;CD33;CD44v7/8(分化簇44,内含子7/8);CD53;CD92;CD100;CD148;CD150;CD200;CD261;CD262;CD362;CS-1(CD2亚群1、CRACC、SLAMF7、CD319和19A24);C型凝集素样分子-1(CLL-1);神经节苷脂GD3(aNeu5Ac(2-8)aNeu5Ac(2-3)bDGalp(1-4)bDGlcp(1-1)Cer);Tn抗原(Tn Ag);Fms样酪氨酸激酶3(FLT3);CD38;CD138;CD44v6;B7H3(CD276);KIT(CD117);白细胞介素-13受体亚基α-2(IL-13Ra2);白细胞介素11受体α(IL-11Ra);前列腺干细胞抗原(PSCA);丝氨酸蛋白酶21(PRSS21);血管内皮生长因子受体2(VEGFR2);路易斯(Y)抗原(Lewis(Y)antigen);CD24;血小板源性生长因子受体β(PDGFR-β);阶段特异性胚胎抗原-4(SSEA-4);细胞表面相关粘蛋白1(MUC1);粘蛋白16(MUC16);表皮生长因子受体(EGFR);表皮生长因子受体变体III(EGFRvIII);神经细胞粘附分子(NCAM);碳酸酐酶IX(CAIX);蛋白酶体(Prosome,Macropain)β亚基9型(LMP2);肾上腺素A型受体2(EphA2);Ephrin B2;岩藻糖基GM1;唾液酸路易斯粘附分子(sLe);神经节苷脂GM3(aNeu5Ac(2-3)bDGalp(1-4)bDGlcp(1-1)Cer);TGS5;高分子量黑色素瘤相关抗原(HMWMAA);o-乙酰基-GD2神经节苷脂(OAcGD2);叶酸受体α;叶酸受体β;肿瘤内皮标志物1(TEM1/CD248);肿瘤内皮标志物7相关(TEM7R);claudin 6(CLDN6);G蛋白偶联受体C类第5组成员D(GPRC5D);染色体X开放阅读框61(CXORF61);CD97;CD179a;间变性淋巴瘤激酶(ALK);聚唾液酸;胎盘特异性1(PLAC1);globoH神经酰胺的六糖部分(GloboH);乳腺分化抗原(NY-BR-1);尿溶蛋白(uroplakin)2(UPK2);甲型肝炎病毒细胞受体1(HAVCR1);肾上腺素受体β3(ADRB3);泛连接蛋白3(PANX3);G蛋白偶联受体20(GPR20);淋巴细胞抗原6复合物基因座K 9(LY6K);嗅觉受体51E2(OR51E2);TCRγ交替阅读框蛋白(TARP);威尔姆斯肿瘤蛋白(WT1);ETS易位变异基因6,位于染色体12p上(ETV6-AML);精子蛋白17(SPA17);X抗原家族成员1A(XAGE1);血管生成素结合细胞表面受体2(Tie 2);CT(癌症/睾丸(抗原));黑色素瘤癌睾丸抗原-1(MAD-CT-1);黑色素瘤癌睾丸抗原-2(MAD-CT-2);Fos相关抗原1;p53;p53突变体;人端粒酶逆转录酶(hTERT);肉瘤易位断裂点;细胞凋亡的黑色素瘤抑制剂(ML-IAP);ERG(跨膜蛋白酶丝氨酸2(TMPRSS2)ETS融合基因);N-乙酰葡糖胺基转移酶V(NA17);配对盒蛋白Pax-3(PAX3);雄激素受体;细胞周期蛋白B1;细胞周期蛋白D1;v-myc禽骨髓细胞瘤病毒癌基因神经母细胞瘤衍生同源物(MYCN);Ras同源物家族成员C(RhoC);细胞色素P450 1B1(CYP1B1);CCCTC结合因子(锌指蛋白)样(BORIS);T细胞识别的鳞状细胞癌抗原1或3(SART1、SART3);配对盒蛋白Pax-5(PAX5);前顶体结合蛋白sp32(OY-TES1);淋巴细胞特异性蛋白酪氨酸激酶(LCK);A激酶锚定蛋白4(AKAP-4);滑膜肉瘤X断裂点1、2、3或4(SSX1、SSX2、SSX3、SSX4);CD79a;CD79b;CD72;白细胞相关免疫球蛋白样受体1(LAIR1);IgA受体的Fc片段(FCAR);白细胞免疫球蛋白样受体亚家族A成员2(LILRA2);CD300分子样家族成员f(CD300LF);C型凝集素结构域家族12成员A(CLEC12A);骨髓基质细胞抗原2(BST2);含有EGF样模块粘蛋白样激素受体样2(EMR2);淋巴细胞抗原75(LY75);磷脂酰肌醇蛋白聚糖-3(GPC3);Fc受体样5(FCRL5);小鼠双分钟2同源物(MDM2);活素(livin);甲胎蛋白(AFP);跨膜激活剂和CAML相互作用子(TACI);B细胞激活因子受体(BAFF-R);V-Ki-ras2 Kirsten大鼠肉瘤病毒癌基因同源物(KRAS);免疫球蛋白λ样多肽1(IGLL1);707-AP(707丙氨酸脯氨酸);ART-4(T4细胞识别的腺癌抗原);BAGE(B抗原;b-连环蛋白/m,b-连环蛋白/突变型);CAMEL(CTL识别的黑色素瘤抗原);CAP1(癌胚抗原肽1);CASP-8(半胱天冬酶-8);CDC27m(突变细胞分裂周期27);CDK4/m(突变细胞周期蛋白依赖性激酶4);Cyp-B(亲环素B);DAM(分化抗原黑色素瘤);EGP-2(上皮糖蛋白2);EGP-40(上皮糖蛋白40);Erbb2、3、4(红细胞白血病病毒癌基因同源物2、3、4);FBP(叶酸结合蛋白);fAchR(胎儿乙酰胆碱受体);G250(糖蛋白250);GAGE(G抗原);GnT-V(N-乙酰氨基葡萄糖转移酶V);HAGE(解旋酶抗原);ULA-A(人白细胞抗原A);HST2(人印戒瘤2);KIAA0205;KDR(激酶插入结构域受体);LDLR/FUT(低密度脂受体/GDP L-岩藻糖:b-D-半乳糖苷酶2-a-L岩藻糖基转移酶);L1CAM(L1细胞粘附分子);MC1R(黑素皮质素1受体);Myosin/m(突变肌球蛋白);MUM-1、2、3(黑色素瘤遍在突变蛋白1、2、3);NA88-A(患者M88的NA cDNA克隆);KG2D(自然杀伤组2成员D)配体;癌胚抗原(h5T4);p190小bcr-abl(190KDbcr-abl蛋白);Pml/RARa(早幼粒细胞白血病/维甲酸受体a);PRAME(黑色素瘤优先表达的抗原);SAGE(肉瘤抗原);TEL/AML1(易位Ets家族白血病/急性髓样白血病1);TPI/m(突变磷酸丙糖异构酶);CD70;及其任何组合。
在实施方案中,要在疾病(诸如特别是肿瘤或癌症)的过继性细胞疗法(诸如特别是CAR或TCR T细胞疗法)中被靶向的抗原是肿瘤特异性抗原(TSA)。
在实施方案中,要在疾病(诸如特别是肿瘤或癌症)的过继性细胞疗法(诸如特别是CAR或TCR T细胞疗法)中被靶向的抗原是新抗原。
在实施方案中,要在疾病(诸如特别是肿瘤或癌症)的过继性细胞疗法(诸如特别是CAR或TCR T细胞疗法)中被靶向的抗原是肿瘤相关抗原(TAA)。
在实施方案中,要在疾病(诸如特别是肿瘤或癌症)的过继性细胞疗法(诸如特别是CAR或TCR T细胞疗法)中被靶向的抗原是通用肿瘤抗原。在某些优选的实施方案中,通用肿瘤抗原选自由以下组成的组:人端粒酶逆转录酶(hTERT)、生存素、小鼠双分钟2同源物(MDM2)、细胞色素P450 1B 1(CYP1B)、HER2/neu、威尔姆斯肿瘤基因1(WT1)、活素、甲胎蛋白(AFP)、癌胚抗原(CEA)、粘蛋白16(MUC16)、MUC1、前列腺特异性膜抗原(PSMA)、p53、细胞周期蛋白(Dl)及其任何组合。
在实施方案中,要在疾病(诸如特别是肿瘤或癌症)的过继性细胞疗法(诸如特别是CAR或TCR T细胞疗法)中被靶向的抗原(诸如肿瘤抗原)可选自由以下组成的组:CD19、BCMA、CD70、CLL-1、MAGE A3、MAGE A6、HPV E6、HPV E7、WT1、CD22、CD171、ROR1、MUC16和SSX2。在某些优选的实施方案中,抗原可以是CD19。例如,可在血液系统恶性肿瘤中靶向CD19,所述肿瘤诸如淋巴瘤,更特别地B细胞淋巴瘤,诸如但不限于弥漫性大B细胞淋巴瘤、原发性纵隔b细胞淋巴瘤、转化滤泡性淋巴瘤、边缘区淋巴瘤、套细胞淋巴瘤、急性淋巴细胞白血病(包括成人和儿童ALL)、非霍奇金淋巴瘤、惰性非霍奇金淋巴瘤或慢性淋巴细胞白血病。例如,可在多发性骨髓瘤或浆细胞白血病中靶向BCMA(参见例如,2018AmericanAssociation for Cancer Research(AACR)Annual meeting Poster:AllogeneicChimeric Antigen Receptor T Cells Targeting B Cell Maturation Antigen)。例如,可在急性髓样白血病中靶向CLL1。例如,可在实体瘤中靶向MAGE A3、MAGE A6、SSX2和/或KRAS。例如,可在宫颈癌或头颈癌中靶向HPV E6和/或HPV E7。例如,可在急性髓样白血病(AML)、骨髓增生异常综合征(MDS)、慢性髓样白血病(CML)、非小细胞肺癌、乳腺癌、胰腺癌、卵巢癌或结直肠癌或间皮瘤中靶向WT1。例如,可在B细胞恶性肿瘤,包括非霍奇金淋巴瘤、弥漫性大B细胞淋巴瘤或急性淋巴细胞白血病中靶向CD22。例如,可在神经母细胞瘤、胶质母细胞瘤或肺癌、胰腺癌或卵巢癌中靶向CD171。例如,可在ROR1+恶性肿瘤,包括非小细胞肺癌、三阴性乳腺癌、胰腺癌、前列腺癌、ALL、慢性淋巴细胞白血病或套细胞淋巴瘤中靶向ROR1。例如,可在MUC16ecto+上皮性卵巢癌、输卵管癌或原发性腹膜癌中靶向MUC16。例如,可在血液系统恶性肿瘤以及实体癌,诸如肾细胞癌(RCC)、神经胶质瘤(例如,GBM)和头颈癌(HNSCC)中靶向CD70。CD70在血液系统恶性肿瘤以及实体癌中均表达,而在正常组织中的表达仅限于淋巴细胞类型的子集(参见例如,2018American Association for CancerResearch(AACR)Annual meeting Poster:Allogeneic CRISPR Engineered Anti-CD70CAR-T Cells Demonstrate Potent Preclinical Activity Against Both Solid andHematological Cancer Cells)。
例如,可采用各种策略通过改变T细胞受体(TCR)的特异性(例如通过引入具有选定肽特异性的新TCRα和β链)来对T细胞进行遗传修饰(参见美国专利号8,697,854;PCT专利公布:WO2003020763、WO2004033685、WO2004044004、WO2005114215、WO2006000830、WO2008038002、WO2008039818、WO2004074322、WO2005113595、WO2006125962、WO2013166321、WO2013039889、WO2014018863、WO2014083173;美国专利号8,088,379)。
作为TCR修饰的替代或补充,嵌合抗原受体(CAR)可用于生成免疫反应细胞,诸如T细胞,其对选定的靶标诸如恶性细胞具有特异性,其中已描述了多种受体嵌合体构建体(参见美国专利号5,843,728;5,851,828;5,912,170;6,004,811;6,284,240;6,392,013;6,410,014;6,753,162;8,211,422;和PCT公布WO 9215322)。
通常,CAR由细胞外结构域、跨膜结构域和细胞内结构域组成,其中细胞外结构域包含对预定靶标具有特异性的抗原结合结构域。虽然CAR的抗原结合结构域通常是抗体或抗体片段(例如,单链可变片段,scFv),但结合结构域不受特别限制,只要其导致对靶标的特异性识别即可。例如,在实施方案中,抗原结合结构域可包含受体,使得CAR能够结合受体的配体。可替代地,抗原结合结构域可包含配体,使得CAR能够结合该配体的内源受体。
CAR的抗原结合结构域通常通过铰链或间隔子与跨膜结构域隔开。间隔子也不受特别限制,并且它被设计成为CAR提供柔性。例如,间隔子结构域可包含人Fc结构域的一部分,包括CH3结构域的一部分;或任何免疫球蛋白(诸如IgA、IgD、IgE、IgG或IgM或其变体)的铰链区。此外,可修饰铰链区以防止FcR或其他潜在干扰物的脱靶结合。例如,铰链可包含具有或不具有S228P、L235E和/或N297Q突变(根据Kabat编号)的IgG4 Fc结构域,以降低与FcR的结合。另外的间隔子/铰链包括但不限于CD4、CD8和CD28铰链区。
CAR的跨膜结构域可源自天然来源或合成来源。在来源是天然来源的情况下,所述结构域可源自任何膜结合蛋白或跨膜蛋白。在本公开中特别使用的跨膜区可源自CD8、CD28、CD3、CD45、CD4、CD5、CDS、CD9、CD 16、CD22、CD33、CD37、CD64、CD80、CD86、CD 134、CD137、CD 154、TCR。可替代地,跨膜结构域可以是合成的,在这种情况下,它将主要包含疏水残基,诸如亮氨酸和缬氨酸。优选地,苯丙氨酸、色氨酸和缬氨酸的三联体将出现在合成跨膜结构域的每一端。任选地,优选长度在2与10个氨基酸之间的短寡核苷酸或多肽接头可在CAR的跨膜结构域与细胞质信号传导结构域之间形成连接。甘氨酸-丝氨酸双联体提供了特别合适的接头。
替代的CAR构建体可被表征为属于连续的世代。第一代CAR通常由对抗原具有特异性的抗体的单链可变片段组成,所述单链可变片段例如包含与特定抗体的VH连接的VL,通过柔性接头(例如通过CD8α铰链结构域和CD8α跨膜结构域)连接到CD3ζ或FcRγ的跨膜和细胞内信号传导结构域(scFv-CD3ζ或scFv-FcRγ;参见美国专利号7,741,465;美国专利号5,912,172;美国专利号5,906,936)。第二代CAR将一种或多种共刺激分子(诸如CD28、OX40(CD134)或4-1BB(CD137))的细胞内结构域整合在内部结构域(endodomain)内(例如scFv-CD28/OX40/4-1BB-CD3ζ;参见美国专利号8,911,993;8,916,381;8,975,071;9,101,584;9,102,760;9,102,761)。第三代CAR包括共刺激内部结构域,诸如CD3ζ-链、CD97、GDI la-CD18、CD2、ICOS、CD27、CD154、CDS、OX40、4-1BB、CD2、CD7、LIGHT、LFA-1、NKG2C、B7-H3、CD30、CD40、PD-1或CD28信号传导结构域的组合(例如scFv-CD28-4-1BB-CD3ζ或scFv-CD28-OX40-CD3ζ;参见美国专利号8,906,682;美国专利号8,399,645;美国专利号5,686,281;PCT公布号WO 2014/134165;PCT公布号WO 2012/079000)。在实施方案中,一级信号传导结构域包含选自由以下组成的组的蛋白质的功能性信号传导结构域:CD3ζ、CD3γ、CD3δ、CD3ε、共同FcRγ(FCERIG)、FcRβ(FcεR1b)、CD79a、CD79b、FcγRIIa、DAP10和DAP12。在某些优选的实施方案中,一级信号传导结构域包含CD3ζ或FcRγ的功能性信号传导结构域。在实施方案中,所述一个或多个共刺激信号传导结构域包含各自独立地选自由以下组成的组的蛋白质的功能性信号传导结构域:CD27、CD28、4-1BB(CD137)、OX40、CD30、CD40、PD-1、ICOS、淋巴细胞功能相关抗原-1(LFA-1)、CD2、CD7、LIGHT、NKG2C、B7-H3、与CD83特异性结合的配体、CDS、ICAM-1、GITR、BAFFR、HVEM(LIGHTR)、SLAMF7、NKp80(KLRF1)、CD160、CD19、CD4、CD8α、CD8β、IL2Rβ、IL2Rγ、IL7Rα、ITGA4、VLA1、CD49a、ITGA4、IA4、CD49D、ITGA6、VLA-6、CD49f、ITGAD、CD11d、ITGAE、CD103、ITGAL、CD11a、LFA-1、ITGAM、CD11b、ITGAX、CD11c、ITGB1、CD29、ITGB2、CD18、ITGB7、TNFR2、TRANCE/RANKL、DNAM1(CD226)、SLAMF4(CD244、2B4)、CD84、CD96(Tactile)、CEACAM1、CRTAM、Ly9(CD229)、CD160(BY55)、PSGL1、CD100(SEMA4D)、CD69、SLAMF6(NTB-A、Lyl08)、SLAM(SLAMF1、CD150、IPO-3)、BLAME(SLAMF8)、SELPLG(CD162)、LTBR、LAT、GADS、SLP-76、PAG/Cbp、NKp44、NKp30、NKp46和NKG2D。在实施方案中,所述一个或多个共刺激信号传导结构域包含各自独立地选自由以下组成的组的蛋白质的功能性信号传导结构域:4-1BB、CD27和CD28。在实施方案中,嵌合抗原受体可具有如美国专利号7,446,190中所述的设计,其包含CD3ζ链的细胞内结构域(诸如人CD3ζ链的氨基酸残基52-163,如US 7,446,190的SEQ ID NO:14所示)、来自CD28的信号传导区以及抗原结合元件(或部分或结构域;诸如scFv)。当CD28部分在ζ链部分与抗原结合元件之间时,可适当地包括CD28的跨膜和信号传导结构域(诸如SEQ ID NO:10的氨基酸残基114-220,US 7,446,190的SEQ IDNO:6中示出的完整序列;这些可包括如Genbank标识符NM_006139中列出的CD28的以下部分。可替代地,当ζ序列位于CD28序列与抗原结合元件之间时,可单独使用CD28的细胞内结构域(诸如US 7,446,190的SEQ ID NO:9中列出的氨基序列)。因此,某些实施方案使用包含以下的CAR:(a)包含人CD3ζ链的胞内结构域的ζ链部分、(b)共刺激信号传导区和(c)抗原结合元件(或部分或结构域),其中共刺激信号传导区包含由US 7,446,190的SEQ ID NO:6编码的氨基酸序列。
可替代地,可通过以下来协调共刺激:在所选择的抗原特异性T细胞中表达CAR以便在它们的天然αβTCR接合(例如通过专职抗原呈递细胞上的抗原)后被激活和扩增,并伴随共刺激。另外,可在免疫反应细胞上提供另外的工程化受体,以例如提高T细胞攻击的靶向和/或最小化副作用
举例来讲,但不限于Kochenderfer等人,(2009)J Immunother.32(7):689-702描述了抗CD19嵌合抗原受体(CAR)。FMC63-28Z CAR含有识别源自FMC63小鼠杂交瘤的CD19的单链可变区部分(scFv)(描述于Nicholson等人,(1997)Molecular Immunology 34:1157–1165中)、人CD28分子的一部分以及人TCR-ζ分子的细胞内成分。FMC63-CD828BBZ CAR含有FMC63 scFv、CD8分子的铰链区和跨膜区、CD28和4-1BB的细胞质部分以及TCR-ζ分子的细胞质组分。FMC63-28Z CAR中包括的CD28分子的确切序列对应于Genbank标识符NM_006139;所述序列包括从氨基酸序列IEVMYPPPY(SEQ.I.D.No.2)开始并一直延续到蛋白质羧基末端的所有氨基酸。为了编码载体的抗CD19 scFv组分,作者设计了DNA序列,所述DNA序列基于先前发布的CAR的一部分(Cooper等人,(2003)Blood 101:1637–1644)。此序列在框架内从5’端到3’端编码以下组分:XhoI位点、人粒细胞-巨噬细胞集落刺激因子(GM-CSF)受体α链信号序列、FMC63轻链可变区(如在Nicholson等人,同上中)、接头肽(如在Cooper等人,同上中)、FMC63重链可变区(如在Nicholson等人,同上中)和NotI位点。用XhoI和NotI消化编码此序列的质粒。为了形成MSGV-FMC63-28Z逆转录病毒载体,将编码FMC63 scFv的XhoI和NotI消化片段连接到编码MSGV逆转录病毒骨架的第二个XhoI和NotI消化片段(如在Hughes等人,(2005)Human Gene Therapy 16:457–472中)以及人CD28的细胞外部分、人CD28的整个跨膜和细胞质部分以及人TCR-ζ分子的细胞质部分中(如在Maher等人,2002)NatureBiotechnology 20:70–75中)。FMC63-28Z CAR包括在Kite Pharma,Inc.正在开发的KTE-C19(axicabtagene ciloleucel)抗CD19CAR-T治疗产品中,用于治疗患有复发/难治性侵袭性B细胞非霍奇金淋巴瘤(NHL)的患者。因此,在实施方案中,旨在用于过继性细胞疗法的细胞(更特别地免疫反应细胞诸如T细胞)可表达如Kochenderfer等人(同上)描述的FMC63-28Z CAR。因此,在实施方案中,旨在用于过继性细胞疗法的细胞(更特别地免疫反应细胞诸如T细胞)可包含CAR,其包含特异性结合抗原的细胞外抗原结合元件(或部分或结构域;诸如scFv)、包含CD3ζ链的细胞内结构域的细胞内信号传导结构域和包含CD28的信号传导结构域的共刺激信号传导区。优选地,CD28氨基酸序列如Genbank标识符NM_006139(序列版本1、2或3)中所列出的,从氨基酸序列IEVMYPPPY开始并一直延续到蛋白质的羧基末端。优选地,抗原是CD19,更优选地,抗原结合元件是抗CD19 scFv,甚至更优选地是如Kochenderfer等人(同上)描述的抗CD19 scFv。
国际专利公布号WO 2015/187528中进一步描述了另外的抗CD19 CAR。更特别地,以引用的方式并入本文的WO2015187528的实施例1和表1,证明了基于全人抗CD19单克隆抗体(47G4,如US20100104509中所述)和鼠抗CD19单克隆抗体(如Nicholson等人中所述并在上面进行了解释)的抗CD19 CAR的生成。公开了信号序列(人CD8-α或GM-CSF受体)、细胞外和跨膜区(人CD8-α)和细胞内T细胞信号传导结构域(CD28-CD3ζ;4-1BB-CD3ζ;CD27-CD3ζ;CD28-CD27-CD3ζ;4-1BB-CD27-CD3ζ;CD27-4-1BB-CD3ζ;CD28-CD27-FcεRIγ链;或CD28-FcεRIγ链)的各种组合。因此,在实施方案中,旨在用于过继性细胞疗法的细胞(更特别地免疫反应细胞诸如T细胞)可包含CAR,其包含特异性结合抗原的细胞外抗原结合元件、如WO2015187528的表1中列出的细胞外和跨膜区以及如第WO 2015/187528号的表1中列出的细胞内T细胞信号传导结构域。优选地,抗原是CD19,更优选地,抗原结合元件是抗CD19scFv,甚至更优选地是如WO 2015/187528的实施例1中描述的小鼠或人抗CD19 scFv。在实施方案中,CAR包含如WO2015187528的表1中列出的SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQID NO:10、SEQ ID NO:11、SEQ ID NO:12或SEQ ID NO:13的氨基酸序列,或基本上由所述氨基酸序列组成或由所述氨基酸序列组成。
举例来讲,但不限于,识别CD70抗原的嵌合抗原受体描述于WO2012058460A2中(另参见,Park等人,CD70 as a target for chimeric antigen receptor T cells in headand neck squamous cell carcinoma,Oral Oncol.2018年3月;78:145-150;和Jin等人,CD70,a novel target of CAR T-cell therapy for gliomas,Neuro Oncol.2018年1月10日;20(1):55-65)。CD70由弥漫性大B细胞和滤泡性淋巴瘤表达并且也由霍奇金淋巴瘤、华氏巨球蛋白血症(Waldenstrom's macroglobulinemia)和多发性骨髓瘤的恶性细胞以及HTLV-1和EBV相关恶性肿瘤表达。(Agathanggelou等人Am.J.Pathol.1995;147:1152-1160;Hunter等人,Blood 2004;104:4881.26;Lens等人,J Immunol.2005;174:6212-6219;Baba等人,J Virol.2008;82:3843-3852)。另外,CD70由非血液恶性肿瘤诸如肾细胞癌和胶质母细胞瘤表达。(Junker等人,J Urol.2005;173:2150-2153;Chahlavi等人,Cancer Res2005;65:5428-5438)在生理学上,CD70表达是瞬时的,并且限于高度激活的T细胞、B细胞和树突状细胞的子集。
举例来讲,但不限于,已经描述了识别BCMA的嵌合抗原受体(参见例如,US20160046724A1;WO2016014789A2;WO2017211900A1;WO2015158671A1;US20180085444A1;WO2018028647A1;US20170283504A1;和WO2013154760A1)。
在实施方案中,除了如本文所述的CAR或外源性TCR之外,免疫细胞还可包含嵌合抑制性受体(抑制性CAR),其特异性结合第二靶抗原并且能够在识别第二靶抗原时诱导对细胞的抑制性或免疫抑制性或阻遏性信号。在实施方案中,嵌合抑制性受体包含被构造成特异性结合靶抗原的细胞外抗原结合元件(或部分或结构域)、跨膜结构域和细胞内免疫抑制或阻遏信号传导结构域。在实施方案中,第二靶抗原是不在癌细胞或感染细胞表面上表达或者在癌细胞或感染细胞上表达下调的抗原。在实施方案中,第二靶抗原是MHC I类分子。在实施方案中,细胞内信号传导结构域包含免疫检查点分子的功能性信号传导部分,例如像PD-1或CTLA4。有利地,包含此种抑制性CAR降低了工程化免疫细胞攻击非靶(例如,非癌)组织的机会。
可替代地,可进一步修饰表达CAR的T细胞以减少或消除内源性TCR的表达,以便减少脱靶效应。减少或消除内源性TCR可减少脱靶效应并增加T细胞的有效性(U.S.9,181,527)。可使用多种方法产生稳定缺乏功能性TCR表达的T细胞。T细胞将整个T细胞受体作为复合物内化、分类和降解,其中静息T细胞的半衰期为约10小时,而经刺激的T细胞的半衰期为3小时(von Essen,M.等人2004.J.Immunol.173:384-393)。TCR复合物的正常功能需要构成TCR复合物的蛋白质的适当化学计量比。TCR功能还需要两种具有ITAM基序的功能性TCRζ蛋白。TCR在与其MHC肽配体接合后的激活需要在同一T细胞上接合几个TCR,所有TCR必须正确发出信号。因此,如果不能正确缔合或不能最佳地发出信号的蛋白质使TCR复合物失稳,则T细胞将不会被充分激活以开始细胞反应。
因此,在实施方案中,在原代T细胞中可使用RNA干扰(例如,shRNA、siRNA、miRNA等)、CRISPR或靶向编码具体TCR(例如,TCR-α和TCR-β)和/或CD3链的核酸的其他方法来消除TCR表达。通过阻断这些蛋白质中的一种或多种的表达,T细胞将不再产生TCR复合物的关键组分中的一种或多种,从而使TCR复合物失稳并阻止功能性TCR的细胞表面表达。
在实施方案中,CAR还可包含用于控制CAR的表达和/或激活的开关机制。例如,CAR可包含细胞外结构域、跨膜结构域和细胞内结构域,其中细胞外结构域包含靶特异性结合元件,所述靶特异性结合元件包含对靶细胞上的或由靶细胞表达的分子而非靶抗原具有特异性的标记、结合结构域或标签。在此类实施方案中,CAR的特异性由第二构建体提供,所述第二构建体包含靶抗原结合结构域(例如,scFv或对靶抗原以及CAR上的标记或标签都具有特异性的双特异性抗体)以及由CAR上的标记、结合结构域或标签识别或结合的结构域。参见例如,国际专利公布号WO 2013/044225、WO 2016/000304、WO 2015/057834、WO 2015/057852和WO 2016/070061、US 9,233,125和US 2016/0129109。以此方式,可将表达CAR的T细胞施用于受试者,但CAR不能结合其靶抗原,直到施用包含抗原特异性结合结构域的第二组合物。
替代的开关机制包括CAR,其需要多聚化以激活它们的信号传导功能(参见例如,美国专利公布号US 2015/0368342、US 2016/0175359、US 2015/0368360)和/或外源性信号,诸如小分子药物(US 2016/0166613,Yung等人,Science,2015)以引发T细胞反应。一些CAR还可包含“自杀开关”,以在治疗后诱导CAR T细胞的细胞死亡(Buddee等人,PLoS One,2013)或在与靶抗原结合后下调CAR的表达(国际专利公布号WO 2016/011210)。
替代技术可用于转化靶免疫反应细胞,诸如原生质体融合、脂质转染、转染或电穿孔。可使用多种载体,诸如逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体、质粒或转座子,诸如睡美人转座子(参见美国专利号6,489,458;7,148,203;7,160,682;7,985,739;8,227,432),可用于引入CAR,例如使用通过CD3ζ和CD28或CD137进行信号传导的第2代抗原特异性CAR。病毒载体可包括例如基于HIV、SV40、EBV、HSV或BPV的载体。
被靶向用于转化的细胞可包括例如T细胞、自然杀伤(NK)细胞、细胞毒性T淋巴细胞(CTL)、调控性T细胞、人胚胎干细胞、肿瘤浸润性淋巴细胞(TIL)或可从中分化出淋巴样细胞的多能干细胞。表达所需CAR的T细胞可例如通过与γ辐照的激活和增殖细胞(AaPC)共培养来选择,所述AaPC共表达癌症抗原和共刺激分子。工程化CAR T细胞可例如通过在AaPC上在可溶性因子(诸如IL-2和IL-21)的存在下共培养来扩增。例如,可进行这种扩增以提供记忆CAR+T细胞(其可例如通过非酶数字阵列和/或多面板流式细胞术来测定)。以此方式,可提供对抗原携带肿瘤具有特异性细胞毒性活性(任选地与所需趋化因子诸如干扰素-γ的产生相结合)的CAR T细胞。这种CAR T细胞可例如用于动物模型,例如治疗肿瘤异种移植物。
在实施方案中,ACT包括共转移CD4+Th1细胞和CD8+CTL以诱导协同抗肿瘤反应(参见例如,Li等人,Adoptive cell therapy with CD4+T helper 1cells and CD8+cytotoxic T cells enhances complete rejection of an established tumor,leadingto generation of endogenous memory responses to non-targeted tumorepitopes.Clin Transl Immunology.2017年10月;6(10):e160)。
在实施方案中,将Th17细胞转移至有需要的受试者。据报道,Th17细胞比Th1细胞更能直接根除小鼠体内的黑色素瘤(Muranski P等人,Tumor-specific Th17-polarizedcells eradicate large established melanoma.Blood.2008年7月15日;112(2):362-73;和Martin-Orozco N等人,T helper 17cells promote cytotoxic T cell activation intumor immunity.Immunity.2009年11月20日;31(5):787-98)。这些研究涉及过继性T细胞转移(ACT)治疗方法,所述方法利用表达TCR识别酪氨酸酶肿瘤抗原的CD4+T细胞。TCR的开发导致Th17群体离体快速扩增到大量以回输到自体荷瘤宿主中。
在实施方案中,ACT可包括基于自体iPSC的疫苗,诸如自体抗肿瘤疫苗中的辐照iPSC(参见例如,Kooreman,Nigel G.等人,Autologous iPSC-Based Vaccines ElicitAnti-tumor Responses In Vivo,Cell Stem Cell 22,1–13,2018,doi.org/10.1016/j.stem.2018.01.016)。
与受MHC限制的T细胞受体(TCR)不同,CAR可以潜在地结合任何细胞表面表达的抗原,并且因此可以更普遍地用于治疗患者(参见Irving等人,Engineering ChimericAntigen Receptor T-Cells for Racing in Solid Tumors:Don’t Forget the Fuel,Front.Immunol.,2017年4月3日,doi.org/10.3389/fimmu.2017.00267)。在实施方案中,在不存在内源性T细胞浸润(例如,由于异常的抗原加工和呈递)(这排除了TIL疗法和免疫检查点阻断的使用)的情况下,CAR T细胞的转移可用于治疗患者(参见例如,Hinrichs CS,Rosenberg SA.Exploiting the curative potential of adoptive T-cell therapy forcancer.Immunol Rev(2014)257(1):56–71.doi:10.1111/imr.12132)。
诸如前述的方法可适于提供治疗患有疾病诸如瘤形成的受试者和/或增加所述受试者存活的方法,例如通过施用有效量的包含结合选定抗原的抗原识别受体的免疫反应细胞,其中所述结合激活免疫反应细胞,从而治疗或预防疾病(诸如瘤形成、病原体感染、自身免疫病症或同种异体移植反应)。
在实施方案中,所述治疗可在以化学疗法(通常是环磷酰胺和氟达拉滨的组合)或辐射疗法形式的淋巴消耗预处理之后施用。ACT的初步研究具有短暂的反应,并且转移的细胞在体内不会持续存在很长时间(Houot等人,T-cell-based immunotherapy:adoptivecell transfer and checkpoint inhibition.Cancer Immunol Res(2015)3(10):1115–22;和Kamta等人,Advancing Cancer Therapy with Present and Emerging Immuno-Oncology Approaches.Front.Oncol.(2017)7:64)。免疫抑制细胞(如Treg和MDSC)可通过与转移细胞竞争必要的细胞因子来减弱转移细胞的活性。不受理论的束缚,淋巴消耗预处理可消除抑制细胞,从而使TIL持续存在。
在一个实施方案中,可将所述治疗施用于正在进行免疫抑制治疗(例如,糖皮质激素治疗)的患者。由于编码此种免疫抑制剂受体的基因失活,可使细胞或细胞群对至少一种免疫抑制剂产生抗性。在实施方案中,免疫抑制治疗提供了患者体内免疫反应T细胞的选择和扩增。
在实施方案中,可在初级治疗(例如,手术或辐射疗法)之前施用所述治疗以在初级治疗之前缩小肿瘤。在另一个实施方案中,可在初级治疗之后施用所述治疗以去除任何剩余的癌细胞。
在实施方案中,可在ACT之前和/或期间治疗性地靶向免疫代谢屏障,以增强对ACT或CAR T细胞疗法的反应并支持内源性免疫(参见例如,Irving等人,EngineeringChimeric Antigen Receptor T-Cells for Racing in Solid Tumors:Don’t Forget theFuel,Front.Immunol.,2017年4月3日,doi.org/10.3389/fimmu.2017.00267)。
如本文所公开的细胞或细胞群,诸如免疫系统细胞或细胞群,诸如更特别地免疫反应细胞或细胞群,可以任何方便的方式进行施用,包括通过气溶胶吸入、注射、摄取、输血、植入或移植。可将所述细胞或细胞群皮下、皮内、瘤内、淋巴结内(intranodally)、髓内、肌肉内、鞘内、通过静脉内或淋巴管内注射或腹膜内施用于患者。在实施方案中,所公开的CAR可被递送或施用到通过切除肿瘤组织形成的腔中(即腔内递送)或在切除之前直接被递送或施用到肿瘤中(即瘤内递送)。在一个实施方案中,细胞组合物通过静脉内注射施用。
所述细胞或细胞群的施用可包括施用104-109个细胞/kg体重,优选105至106个细胞/kg体重,包括所述范围内的所有整数值的细胞数。CAR T细胞疗法中的给药可例如涉及在有或没有淋巴消耗过程(例如使用环磷酰胺)的情况下施用106至109个细胞/kg。可以一个或多个剂量施用所述细胞或细胞群。在另一个实施方案中,有效量的细胞以单剂量施用。在另一个实施方案中,有效量的细胞在一段时间内以多于一个剂量施用。施用时间在主治医师的判断范围内,并取决于患者的临床病状。所述细胞或细胞群可从任何来源(诸如血库或供体)获得。虽然个体需求不同,但对于特定疾病或病状的给定细胞类型的有效量的最佳范围的确定在本领域技术范围内。有效量意指提供治疗或预防益处的量。施用的剂量将取决于受体的年龄、健康和体重、同时治疗的种类(如果有的话)、治疗频率和所需效果的性质。
在另一个实施方案中,肠胃外施用有效量的细胞或包含那些细胞的组合物。所述施用可以是静脉内施用。所述施用可通过在肿瘤内注射直接进行。
为了防止可能的不良反应,工程化免疫反应细胞可配备有转基因形式的转基因安全开关,其使得细胞容易暴露于具体信号。例如,单纯疱疹病毒胸苷激酶(TK)基因可以这种方式使用,例如通过在干细胞移植后引入用作供体淋巴细胞输注的同种异体T淋巴细胞中(Greco等人,Improving the safety of cell therapy with the TK-suicidegene.Front.Pharmacol.2015;6:95)。在此类细胞中,施用核苷前药诸如更昔洛韦(ganciclovir)或阿昔洛韦(acyclovir)会导致细胞死亡。替代的安全开关构建体包括例如通过施用小分子二聚体来触发的诱导型半胱天冬酶9,所述二聚体将两个非功能性icasp9分子结合在一起形成活性酶。已经描述了实施细胞增殖控制的多种替代方法(参见美国专利公布号20130071414;国际专利公布WO 2011/146862;国际专利公布WO 2014/011987;国际专利公布WO 2013/040371;Zhou等人BLOOD,2014,123/25:3895–3905;Di Stasi等人,TheNew England Journal of Medicine 2011;365:1673-1683;Sadelain M,The New EnglandJournal of Medicine 2011;365:1735-173;Ramos等人,Stem Cells 28(6):1107-15(2010))。
在过继性疗法的进一步优化中,基因组编辑可用于定制针对替代实现方式的免疫反应细胞,例如提供编辑的CAR T细胞(参见Poirot等人,2015,Multiplex genome editedT-cell manufacturing platform for"off-the-shelf"adoptive T-cellimmunotherapies,Cancer Res 75(18):3853;Ren等人,2017,Multiplex genome editingto generate universal CAR T cells resistant to PD1 inhibition,Clin CancerRes.2017年5月1日;23(9):2255-2266.doi:10.1158/1078-0432.CCR-16-1300.电子出版于2016年11月4日;Qasim等人,2017,Molecular remission of infant B-ALL afterinfusion of universal TALEN gene-edited CAR T cells,Sci Transl Med.2017年1月25日;9(374);Legut等人,2018,CRISPR-mediated TCR replacement generates superioranticancer transgenic T cells.Blood,131(3),311-322;和Georgiadis等人,LongTerminal Repeat CRISPR-CAR-Coupled“Universal”T Cells Mediate Potent Anti-leukemic Effects,Molecular Therapy,In Press,Corrected Proof,可在线访问,2018年3月6日)。可使用如本文所述的任何CRISPR系统及其使用方法来编辑细胞。可通过本文所述的任何方法将组合物和系统递送至免疫细胞。在优选的实施方案中,离体编辑细胞并将其转移至有需要的受试者。可编辑免疫反应细胞、CAR T细胞或任何用于过继性细胞转移的细胞。例如可进行编辑以在细胞中的预选基因座(例如,TRAC基因座)处插入或敲入外源性基因,诸如编码CAR或TCR的外源性基因;消除潜在的同种异体反应性T细胞受体(TCR)或防止内源性TCR链与外源性TCR链之间的不适当配对,诸如敲除或敲低细胞中内源性TCR的表达;破坏细胞中化学治疗剂的靶标;阻断免疫检查点,诸如敲除或敲低细胞中免疫检查点蛋白或受体的表达;敲除或敲低细胞中其他一个或多个基因的表达,其表达减少或缺乏表达可增强使用所述细胞的过继性疗法的功效;敲除或敲低细胞中内源性基因的表达,所述内源性基因编码由外源性CAR或TCR靶向的抗原;敲除或敲低细胞中一种或多种MHC组成蛋白的表达;激活T细胞;调节细胞,使得细胞抵抗耗竭或功能障碍;和/或增加功能耗竭或功能障碍的CD8+T细胞的分化和/或增殖(参见国际专利公布号WO 2013/176915、WO 2014/059173、WO 2014/172606、WO 2014/184744和WO 2014/191128)。
在实施方案中,编辑可导致基因失活。通过使基因失活,旨在使目标基因不以功能性蛋白形式表达。在一个特定的实施方案中,所述系统特异性地催化一种靶向基因的切割,从而使所述靶向基因失活。引起的核酸链断裂通常通过同源重组或非同源末端连接(NHEJ)的不同机制进行修复。然而,NHEJ是不完善的修复过程,其通常会导致切割位点处的DNA序列发生变化。通过非同源末端连接(NHEJ)进行修复通常会导致小的插入或缺失(插入缺失),并且可用于创建具体的基因敲除。可通过本领域众所周知的方法鉴定和/或选择其中已经发生切割诱导的诱变事件的细胞。在实施方案中,同源定向修复(HDR)用于同时使基因(例如,TRAC)失活,并且将内源性TCR或CAR插入灭活基因座中。
因此,在实施方案中,可编辑细胞,特别是旨在用于过继性细胞疗法的细胞,更特别是免疫反应细胞诸如T细胞,以在细胞中的预选基因座处插入或敲入外源性基因,诸如编码CAR或TCR的外源性基因。传统上,使用随机整合的载体将编码CAR或TCR的核酸分子转染或转导至细胞,根据整合的位点这可能导致克隆扩增、致癌转化、多样化的转基因表达和/或转基因的转录沉默。将转基因引导至细胞中的特定基因座可最小化或避免此类风险,并有利地提供细胞对转基因的均匀表达。非限制地,用于定向转基因整合的合适“安全港”基因座包括CCR5或AAVS1。同源定向修复(HDR)策略是已知的并在本说明书别处进行了描述,从而允许将转基因插入所需的基因座(例如,TRAC基因座)。
用于插入转基因(特别是CAR或外源性TCR转基因)的其他合适的基因座包括但不限于包含编码内源性T细胞受体成分的基因的基因座,诸如T细胞受体α基因座(TRA)或T细胞受体β基因座(TRB),例如T细胞受体α恒定(TRAC)基因座、T细胞受体β恒定区1(TRBC1)基因座或T细胞受体β恒定区2(TRBC1)基因座。有利地,将转基因插入此类基因座可同时实现转基因的表达(可能由内源性启动子控制)和内源性TCR的敲除表达。Eyquem等人,(2017)Nature 543:113-117中例示了这种方法,其中作者使用CRISPR/Cas9基因编辑将编码CD19特异性CAR的DNA分子敲入内源性启动子下游的TRAC基因座中;通过CRISPR获得的CAR-T细胞在减少强直CAR信号传导和耗竭方面具有显著优势。
T细胞受体(TCR)是细胞表面受体,其参与T细胞激活以对抗原呈递作出反应。TCR通常由两条链α和β组成,它们组装形成异二聚体并与CD3转导亚基缔合形成存在于细胞表面上的T细胞受体复合物。TCR的每条α和β链由免疫球蛋白样N末端可变区(V)和恒定区(C)、疏水跨膜结构域和短细胞质区组成。至于免疫球蛋白分子,α和β链的可变区通过V(D)J重组产生,从而在T细胞群体中产生多种抗原特异性。然而,与识别完整抗原的免疫球蛋白不同,T细胞被与MHC分子缔合的加工肽片段激活,从而为T细胞的抗原识别引入额外的维度,称为MHC限制。通过T细胞受体识别供体与受体之间的MHC差异导致T细胞增殖和移植物抗宿主病(GVHD)的潜在发生。TCRα或TCRβ的失活可导致TCR从T细胞表面消除,从而防止同种异体抗原的识别并因此防止GVHD。然而,TCR破坏通常会导致CD3信号传导组分的消除,并改变T细胞进一步扩增的方式。
因此,在实施方案中,可编辑细胞,特别是旨在用于过继性细胞疗法的细胞,更特别是免疫反应细胞诸如T细胞,以敲除或敲低细胞中内源性TCR的表达。例如,可采用基于NHEJ或基于HDR的基因编辑方法来破坏内源性TCRα和/或β链基因。例如,一个或多个基因编辑系统,诸如一个或多个CRISPR/Cas系统,可被设计成靶向在β1与β2恒定区基因(TRBC1和TRBC2)之间保守的TCRβ链中发现的序列和/或靶向TCRα链的恒定区(TRAC)基因。
同种异体细胞被宿主免疫系统迅速排斥。已经证明,存在于未经辐照的血液产品中的同种异体白细胞将持续不超过5至6天(Boni,Muranski等人2008Blood 1;112(12):4746-54)。因此,为了防止同种异体细胞的排斥,通常必须在一定程度上抑制宿主的免疫系统。然而,在过继性细胞转移的情况下,使用免疫抑制药物也会对引入的治疗性T细胞产生不利影响。因此,为了在这些情况下有效地使用过继性免疫治疗方法,引入的细胞需要对免疫抑制治疗具有抗性。因此,在一个特定的实施方案中,本公开还包括修饰T细胞以使其对免疫抑制剂具有抗性的步骤,优选通过使编码免疫抑制剂的靶标的至少一种基因失活。免疫抑制剂是通过几种作用机制之一抑制免疫功能的剂。免疫抑制剂可以是但不限于钙调磷酸酶抑制剂、雷帕霉素的靶标、白细胞介素-2受体α链阻断剂、肌苷一磷酸脱氢酶的抑制剂、二氢叶酸还原酶的抑制剂、皮质类固醇或免疫抑制抗代谢物。本公开允许通过使T细胞中的免疫抑制剂的靶标失活来赋予T细胞对免疫疗法的免疫抑制抗性。作为非限制性实例,免疫抑制剂的靶标可以是免疫抑制剂的受体,诸如:CD52、糖皮质激素受体(GR)、FKBP家族基因成员和亲环素家族基因成员。
在实施方案中,可编辑细胞,特别是旨在用于过继性细胞疗法的细胞,更特别是免疫反应细胞诸如T细胞,以阻断免疫检查点,诸如以敲除或敲低细胞中免疫检查点蛋白或受体的表达。免疫检查点是减缓或停止免疫反应并防止免疫细胞不受控制的活动造成过度组织损伤的抑制性途径。在实施方案中,被靶向的免疫检查点是程序性死亡-1(PD-1或CD279)基因(PDCD1)。在其他实施方案中,被靶向的免疫检查点是细胞毒性T淋巴细胞相关抗原(CTLA-4)。在另外的实施方案中,被靶向的免疫检查点是CD28和CTLA4 Ig超家族的另一个成员,诸如BTLA、LAG3、ICOS、PDL1或KIR。在其他另外的实施方案中,被靶向的免疫检查点是TNFR超家族的成员,诸如CD40、OX40、CD137、GITR、CD27或TIM-3。
另外的免疫检查点包括含有Src同源2结构域的蛋白酪氨酸磷酸酶1(SHP-1)(Watson HA等人,SHP-1:the next checkpoint target for cancer immunotherapy?Biochem Soc Trans.2016年4月15日;44(2):356-62)。SHP-1是广泛表达的抑制性蛋白酪氨酸磷酸酶(PTP)。在T细胞中,它是抗原依赖性激活和增殖的负调控因子。它是一种细胞质蛋白,并且因此不适合抗体介导的疗法,但它在激活和增殖中的作用使其成为过继性转移策略(诸如嵌合抗原受体(CAR)T细胞)中遗传操纵的有吸引力的靶标。免疫检查点还可包括具有Ig和ITIM结构域(TIGIT/Vstm3/WUCAM/VSIG9)和VISTA的T细胞免疫受体(LeMercierI等人,(2015)Beyond CTLA-4and PD-1,the generation Z of negative checkpointregulators.Front.Immunol.6:418)。
国际专利公布号表WO 2014/172606涉及使用MT1和/或MT2抑制剂来增加耗竭的CD8+T细胞的增殖和/或活性并减少CD8+T细胞耗竭(例如,减少功能耗竭或无反应的CD8+免疫细胞)。在实施方案中,金属硫蛋白通过在过继性转移的T细胞中的基因编辑被靶向。
在实施方案中,基因编辑的靶标可以是涉及免疫检查点蛋白表达的至少一个所靶向的基因座。此类靶标可包括但不限于CTLA4、PPP2CA、PPP2CB、PTPN6、PTPN22、PDCD1、ICOS(CD278)、PDL1、KIR、LAG3、HAVCR2、BTLA、CD160、TIGIT、CD96、CRTAM、LAIR1、SIGLEC7、SIGLEC9、CD244(2B4)、TNFRSF10B、TNFRSF10A、CASP8、CASP10、CASP3、CASP6、CASP7、FADD、FAS、TGFBRII、TGFRBRI、SMAD2、SMAD3、SMAD4、SMAD10、SKI、SKIL、TGIF1、IL10RA、IL10RB、HMOX2、IL6R、IL6ST、EIF2AK4、CSK、PAG1、SIT1、FOXP3、PRDM1、BATF、VISTA、GUCY1A2、GUCY1A3、GUCY1B2、GUCY1B3、MT1、MT2、CD40、OX40、CD137、GITR、CD27、SHP-1、TIM-3、CEACAM-1、CEACAM-3或CEACAM-5。在优选的实施方案中,靶向参涉及PD-1或CTLA-4基因表达的基因座。在其他优选的实施方案中,靶向基因的组合,诸如但不限于PD-1和TIGIT。
举例来讲,但不限于,国际专利公布号WO 2016/196388涉及工程化T细胞,其包含(a)特异性结合抗原的遗传工程化抗原受体,所述受体可以是CAR;和(b)被破坏的编码PD-L1的基因;用于破坏编码PD-L1的基因的剂;和/或破坏编码PD-L1的基因,其中所述基因的破坏可由基因编辑核酸酶、锌指核酸酶(ZFN)、CRISPR/Cas9和/或TALEN介导。WO2015142675涉及包含CAR的免疫效应细胞与增加免疫效应细胞在癌症治疗中的功效的剂(诸如本文的组合物或系统)的组合,其中所述剂可抑制免疫抑制分子,诸如PD1、PD-L1、CTLA-4、TIM-3、LAG-3、VISTA、BTLA、TIGIT、LAIR1、CD160、2B4、TGFRβ、CEACAM-1、CEACAM-3或CEACAM-5。Ren等人,(2017)Clin Cancer Res 23(9)2255-2266进行了CAR的慢病毒递送和同时靶向内源性TCR、β-2微球蛋白(B2M)和PD1的Cas9 mRNA和gRNA的电转移,以生成缺乏TCR、HLA I类分子和PD1的基因破坏的同种异体CAR T细胞。
在实施方案中,细胞可被工程化以表达CAR,其中细胞中甲基胞嘧啶双加氧酶基因(TET1、TET2和/或TET3)的表达和/或功能已经降低或消除,(诸如本文的组合物或系统)(例如,如WO201704916中所述)。
在实施方案中,可编辑细胞,特别是旨在用于过继性细胞疗法的细胞,更特别是免疫反应细胞诸如T细胞,以敲除或敲低细胞中内源性基因的表达,所述内源性基因编码外源性CAR或TCR靶向的抗原,从而降低靶向工程化细胞的可能性。在实施方案中,所靶向的抗原可以是一种或多种选自由以下组成的组的抗原:CD38、CD138、CS-1、CD33、CD26、CD30、CD53、CD92、CD100、CD148、CD150、CD200、CD261、CD262、CD362、人端粒酶逆转录酶(hTERT)、生存素、小鼠双分钟2同源物(MDM2)、细胞色素P450 1B1(CYP1B)、HER2/neu、威尔姆斯肿瘤基因1(WT1)、活素、甲胎蛋白(AFP)、癌胚抗原(CEA)、粘蛋白16(MUC16)、MUC1、前列腺特异性膜抗原(PSMA)、p53、细胞周期蛋白(D1)、B细胞成熟抗原(BCMA)、跨膜激活剂和CAML相互作用子(TACI)和B细胞激活因子受体(BAFF-R)(例如,如国际专利公布号WO 2016/011210和WO2017/011804中所述)。
在实施方案中,可编辑细胞,特别是旨在用于过继性细胞疗法的细胞,更特别是免疫反应细胞诸如T细胞,以敲除或敲低细胞中一种或多种MHC组成蛋白(诸如一种或多种HLA蛋白和/或β-2微球蛋白(B2M))的表达,由此可减少或避免受体免疫系统对非自体(例如同种异体)细胞的排斥。在优选的实施方案中,一种或多种HLA I类蛋白,诸如HLA-A、HLA-B和/或HLA-C和/或B2M可被敲除或敲低。优选地,B2M可被敲除或敲低。举例来讲,Ren等人,(2017)Clin Cancer Res 23(9)2255-2266进行了CAR的慢病毒递送和同时靶向内源性TCR、β-2微球蛋白(B2M)和PD1的Cas mRNA和gRNA的电转移,以生成缺乏TCR、HLA I类分子和PD1的基因破坏的同种异体CAR T细胞。
在其他实施方案中,编辑至少两个基因。基因对可包括但不限于PD1和TCRα、PD1和TCRβ、CTLA-4和TCRα、CTLA-4和TCRβ、LAG3和TCRα、LAG3和TCRβ、Tim3和TCRα、Tim3和TCRβ、BTLA和TCRα、BTLA和TCRβ、BY55和TCRα、BY55和TCRβ、TIGIT和TCRα、TIGIT和TCRβ、B7H5和TCRα、B7H5和TCRβ、LAIR1和TCRα、LAIR1和TCRβ、SIGLEC10和TCRα、SIGLEC10和TCRβ、2B4和TCRα、2B4和TCRβ、B2M和TCRα、B2M和TCRβ。
在实施方案中,可如本文教导的那样对细胞进行多重编辑(多重基因组编辑)以(1)敲除或敲低内源性TCR(例如,TRBC1、TRBC2和/或TRAC)的表达,(2)敲除或敲低免疫检查点蛋白或受体(例如,PD1、PD-L1和/或CTLA4)的表达;以及(3)敲除或敲低一种或多种MHC组成蛋白(例如,HLA-A、HLA-B和/或HLA-C和/或B2M,优选B2M)的表达。
无论是在对T细胞进行遗传修饰之前还是之后,T细胞通常都可使用如描述于例如以下中的方法来激活和扩增:美国专利号6,352,694;6,534,055;6,905,680;5,858,358;6,887,466;6,905,681;7,144,575;7,232,566;7,175,843;5,883,223;6,905,874;6,797,514;6,867,041;和7,572,631。T细胞可在体外或体内扩增。
可使用本领域已知的任何方法获得免疫细胞。在实施方案中,同种异体T细胞可从健康受试者中获得。在一个实施方案中,分离出已浸润肿瘤的T细胞。手术期间可去除T细胞。在通过活检去除肿瘤组织后可分离T细胞。T细胞可通过本领域已知的任何方式分离。在一个实施方案中,通过单采术获得T细胞。在一个实施方案中,所述方法可包括通过本领域已知的任何合适的方法从肿瘤样品中获得大的T细胞群。例如,可通过将肿瘤样品解离成可从中选择具体的细胞群的细胞悬浮液而从肿瘤样品中获得大的T细胞群。获得大的T细胞群的合适方法可包括但不限于以下中的任一种或多种:将肿瘤机械解离(例如,切碎)、将肿瘤酶促解离(例如,消化)和抽吸(例如,用针)。
从肿瘤样品中获得的大的T细胞群可包含任何合适的T细胞类型。优选地,从肿瘤样品中获得的大的T细胞群包含肿瘤浸润淋巴细胞(TIL)。
可从任何哺乳动物中获得肿瘤样品。除非另有说明,否则如本文所用,术语“哺乳动物”是指任何哺乳动物,包括但不限于以下目的哺乳动物:兔形目(Logomorpha),诸如兔子;食肉目(Carnivora),包括猫科动物(猫)和犬科动物(狗);偶蹄目(Artiodactyla),包括牛科动物(奶牛)和猪科动物(猪);或奇蹄目(Perssodactyla),包括马科动物(马)。哺乳动物可以是非人灵长类动物,例如灵长目(Primates)、猿目(Ceboids)或猴目(Simoids)(猴)、或类人猿亚目(Anthropoids)(人和类人猿)。哺乳动物可以是啮齿目(Rodentia)的哺乳动物,诸如小鼠和仓鼠。优选地,哺乳动物是非人灵长类动物或人。特别优选的哺乳动物是人。
可从多种来源,包括外周血单核细胞(PBMC)、骨髓、淋巴结组织、脾组织和肿瘤中获得T细胞。在本公开的实施方案中,可使用本领域技术人员已知的任何数量的技术(诸如Ficoll分离)从采集自受试者的单位血液中获得T细胞。在一个优选的实施方案中,通过单采术或白细胞单采术从个体的循环血液中获得细胞。单采术产物通常含有淋巴细胞,包括T细胞、单核细胞、粒细胞、B细胞、其他有核白细胞、红细胞和血小板。在一个实施方案中,可洗涤通过单采术采集的细胞以去除血浆部分,并且将细胞置于适当的缓冲液或培养基中以用于后续处理步骤。在一个实施方案中,用磷酸盐缓冲盐水(PBS)洗涤细胞。在一个替代的实施方案中,洗涤溶液缺乏钙并且可能缺乏镁或可能缺乏许多(如果不是全部的话)二价阳离子。在不存在钙的情况下,初始激活步骤导致激活放大。如本领域普通技术人员将容易理解的,可通过本领域技术人员已知的方法来完成洗涤步骤,诸如通过根据制造商的说明使用半自动“流通式”离心机(例如,Cobe 2991细胞处理器)。在洗涤之后,可将细胞重悬于多种生物相容性缓冲液中,例如像无Ca、无Mg的PBS。可替代地,可去除单采术样品的不需要的成分,并且将细胞直接重悬于培养基中。
在另一个实施方案中,通过裂解红细胞并消耗单核细胞(例如通过PERCOLLTM梯度离心)从外周血淋巴细胞中分离T细胞。可通过阳性或阴性选择技术进一步分离T细胞的具体亚群,诸如CD28+、CD4+、CDC、CD45RA+和CD45RO+T细胞。例如,在一个优选的实施方案中,通过与抗CD3/抗CD28(即3×28)缀合的珠(诸如M-450CD3/CD28T或XCYTEDYNABEADSTM)一起孵育足以用于所需T细胞的阳性选择的时间段来分离T细胞。在一个实施方案中,时间段为约30分钟。在另一实施方案中,时间段的范围为30分钟到36小时或更长,以及其间的所有整数值。在另一实施方案中,时间段为至少1、2、3、4、5或6小时。在又一优选的实施方案中,时间段为10至24小时。在一个优选的实施方案中,孵育时间段为24小时。为了从白血病患者中分离T细胞,使用较长的孵育时间(诸如24小时)可提高细胞产量。在与其他细胞类型相比T细胞很少的任何情况下,诸如在从肿瘤组织或免疫功能低下的个体中分离肿瘤浸润淋巴细胞(TIL)的情况下,可使用更长的孵育时间来分离T细胞。此外,使用更长的孵育时间可提高捕获CD8+T细胞的效率。
可通过针对阴性选择细胞特有的表面标志物的抗体的组合来完成通过阴性选择富集T细胞群。优选的方法是经阴性磁性免疫粘附或流式细胞术进行细胞分选和/或选择,所述方法使用针对阴性选择的细胞上存在的细胞表面标志物的单克隆抗体的混合物。例如,为了通过阴性选择富集CD4+细胞,单克隆抗体混合物通常包括针对CD14、CD20、CD11b、CD16、HLA-DR和CD8的抗体。
此外,可通过多种方法从血液制剂中去除单核细胞群体(例如,CD14+细胞),所述方法包括抗CD14包被的珠或柱,或利用这些细胞的吞噬活性来促进去除。因此,在一个实施方案中,使用大小足以被吞噬性单核细胞吞噬的顺磁性粒子。在实施方案中,顺磁性粒子是可商购获得的珠,例如由Life Technologies以商品名DynabeadsTM生产的那些。在一个实施方案中,通过用“无关”蛋白质(例如,血清蛋白或抗体)包被顺磁性粒子来去除其他非特异性细胞。无关蛋白质和抗体包括那些不特异性靶向待分离的T细胞的蛋白质和抗体或其片段。在实施方案中,无关珠包括包被有绵羊抗小鼠抗体、山羊抗小鼠抗体和人血清白蛋白的珠。
简而言之,这种单核细胞的消耗是通过以下进行的:将从全血、外周血或肿瘤中分离的T细胞与一种或多种无关的或非抗体偶联的顺磁性粒子以允许去除单核细胞的任何量(大约20:1的珠:细胞比率)一起在22至37摄氏度下预先孵育约30分钟至2小时,之后磁性去除附着至顺磁性粒子或吞噬了顺磁性粒子的细胞。可使用本领域可用的标准方法进行此种分离。例如,可使用任何磁性分离方法,包括多种可商购获得的磁性分离方法(例如,磁性粒子浓缩器(DYNAL/>))。可通过本领域普通技术人员已知的多种方法(包括流式细胞术分析CD14阳性细胞)在消耗前后进行监测,以保证必要的消耗。
为了通过阳性或阴性选择分离所需的细胞群,可改变细胞和表面(例如,粒子诸如珠)的浓度。在实施方案中,可能需要显著降低珠和细胞混合在一起的体积(即,增加细胞浓度),以确保细胞和珠的最大接触。例如,在一个实施方案中,使用20亿个细胞/ml的浓度。在一个实施方案中,使用10亿个细胞/ml的浓度。在另一实施方案中,使用大于1亿个细胞/ml。在另一实施方案中,使用1000万、1500万、2000万、2500万、3000万、3500万、4000万、4500万或5000万个细胞/ml的细胞浓度。在又一实施方案中,使用7500万、8000万、8500万、9000万、9500万或1亿个细胞/ml的细胞浓度。在其他实施方案中,可使用1.25亿或1.5亿个细胞/ml的浓度。使用高浓度可导致提高的细胞产量、细胞激活和细胞扩增。此外,使用高细胞浓度允许更有效地捕获可能弱表达目标靶抗原的细胞,诸如CD28阴性T细胞,或捕获来自存在许多肿瘤细胞的样品(即白血病血液、肿瘤组织等)的细胞。此类细胞群可具有治疗价值并且将是希望获得的。例如,使用高浓度的细胞允许更有效地选择通常具有较弱CD28表达的CD8+T细胞。
在一个相关的实施方案中,可能希望使用较低的细胞浓度。通过显著稀释T细胞和表面(例如,粒子诸如珠)的混合物,粒子与细胞之间的相互作用被最小化。这选择了表达大量所需抗原以与粒子结合的细胞。例如,CD4+T细胞表达更高水平的CD28,并且在稀释浓度下比CD8+T细胞更有效地被捕获。在一个实施方案中,使用的细胞浓度是5×106/ml。在其他实施方案中,使用的浓度可以是约1×105/ml至1×106/ml,以及两者之间的任何整数值。
T细胞也可被冷冻。不希望受理论的束缚,冷冻和随后的解冻步骤通过去除细胞群中的粒细胞和一定程度上的单核细胞而提供更均匀的产物。经洗涤步骤去除血浆和血小板之后,可将细胞悬浮在冷冻溶液中。许多冷冻溶液和参数在本领域中是已知的并且将在这种情况下有用,一种方法包括使用含有20% DMSO和8%人血清白蛋白的PBS或其他合适的细胞冷冻培养基,然后以每分钟1℃的速率将细胞冷冻至-80℃并储存在液氮储罐的气相中。可使用其他受控冷冻的方法以及立即在-20℃或在液氮中的不受控冷冻。
T细胞也可以是抗原特异性T细胞。例如,可使用肿瘤特异性T细胞。抗原特异性T细胞可从目标患者,诸如患有癌症或感染性疾病的患者中分离。在一个实施方案中,确定受试者的新表位并分离对这些抗原具有特异性的T细胞。用于扩增的抗原特异性细胞也可使用本领域已知的任何数量的方法在体外生成,例如,如标题为Generation and Isolation ofAntigen-Specific T Cells的美国专利公布号US 20040224402、或美国专利号6,040,177中所述。用于本文的抗原特异性细胞也可使用本领域已知的任何数量的方法生成,例如,如均由John Wiley&Sons,Inc.,Boston,Mass发布的Current Protocols in Immunology或Current Protocols in Cell Biology中所述。
在一个相关实施方案中,可能需要在一轮或两轮扩增之前或之后对抗原特异性细胞进行分选或以其他方式进行阳性选择(例如通过磁性选择)。可使用肽-MHC四聚体进行分选或阳性选择抗原特异性细胞(Altman等人,Science.1996年10月4日;274(5284):94-6)。在另一个实施方案中,使用了适应性四聚体技术方法(Andersen等人,2012 Nat Protoc.7:891-902)。四聚体受限于对利用基于先前假设的预测结合肽的需要,以及对具体HLA的限制。肽-MHC四聚体可使用本领域已知的技术生成并且可以用本文所述的任何目标MHC分子和任何目标抗原来制备。可使用本领域已知的多种测定法来鉴定在上下文中使用的具体表位。例如,可通过监测促进125I标记的β2-微球蛋白(β2m)并入MHC I类/β2m/肽异源三聚体复合物的能力来间接评估多肽与MHC I类结合的能力(参见Parker等人,J.Immunol.152:163,1994)。
在一个实施方案中,直接用表位特异性试剂标记细胞,以用于通过流式细胞术分离,之后表征表型和TCR。在一个实施方案中,通过与T细胞特异性抗体接触来分离T细胞。可使用多种可商购获得的细胞分选仪中的任一种对抗原特异性T细胞或通常任何细胞进行分选,所述细胞分选仪包括但不限于MoFlo分选仪(DakoCytomation,Fort Collins,Colo.)、FACSAriaTM、FACSArrayTM、FACSVantageTM、BDTM LSR II和FACSCaliburTM(BD Biosciences,San Jose,Calif.)。
在一个优选的实施方案中,所述方法包括选择也表达CD3的细胞。所述方法可包括以任何合适的方式具体选择细胞。优选地,使用流式细胞术进行选择。可使用本领域已知的任何合适的方法进行流式细胞术。流式细胞术可采用任何合适的抗体和染色剂。优选地,选择抗体以使其特异性识别并结合所选择的特定生物标志物。例如,可分别使用抗CD3、抗CD8、抗TIM-3、抗LAG-3、抗4-lBB或抗PD-1抗体对CD3、CD8、TIM-3、LAG-3、4-1BB或PD-1进行特异性选择。一种或多种抗体可与珠(例如,磁珠)或荧光染料缀合。优选地,流式细胞术是荧光激活的细胞分选(FACS)。可基于对自体肿瘤的反应性来选择在T细胞上表达的TCR。另外,可使用专利公布号WO2014133567和WO2014133568中描述的方法基于标志物选择对肿瘤有反应性的T细胞,所述专利以引用的方式整体并入本文。另外,可基于CD107a的表面表达选择激活的T细胞。
在一个实施方案中,所述方法还包括扩大富集的细胞群中T细胞的数量。此类方法描述于美国专利号8,637,307中,并且以引用的方式整体并入本文。T细胞的数量可增加至少约3倍(或4、5、6、7、8或9倍),更优选至少约10倍(或20、30、40、50、60、70、80或90倍),更优选至少约100倍,更优选至少约1,000倍,或最优选至少约100,000倍。可使用本领域已知的任何合适的方法来扩大T细胞的数量。扩大细胞数量的示例性方法描述于专利公布号WO2003/057171、美国专利号8,034,334和美国专利公布号2012/0244133中,其各自以引用的方式并入本文。
在一个实施方案中,可通过分离T细胞并随后刺激或激活,之后进一步扩增来进行离体T细胞扩增。在一个实施方案中,T细胞可被单一剂刺激或激活。在另一个实施方案中,用两种剂刺激或激活T细胞,一种诱导主要信号,并且另一种诱导共刺激信号。可用于刺激单一信号或刺激主要信号的配体和刺激第二信号的辅助分子可以可溶形式使用。配体可附着在细胞表面、附着在工程化多价信号传导平台(EMSP)上或固定在表面上。在一个优选的实施方案中,将第一剂和第二剂共同固定在表面上,例如珠或细胞上。在一个实施方案中,提供主要激活信号的分子可以是CD3配体,并且共刺激分子可以是CD28配体或4-1BB配体。
在实施方案中,可如国际专利公布号WO 2015/120096中所述通过包括以下步骤的方法制造包含CAR或外源性TCR的T细胞:富集从供体受试者获得的淋巴细胞群;用一种或多种T细胞刺激剂刺激淋巴细胞群以产生激活的T细胞群,其中所述刺激是在使用无血清培养基的封闭系统中进行的;使用单周期转导用包含编码CAR或TCR的核酸分子的病毒载体转导激活的T细胞群以产生转导的T细胞群,其中所述转导是在使用无血清培养基的封闭系统中进行的;以及将转导的T细胞群扩增预定时间以产生工程化T细胞群,其中所述扩增是在使用无血清培养基的封闭系统中进行的。在实施方案中,可如WO 2015/120096中所述通过包括以下步骤的方法制造包含CAR或外源性TCR的T细胞:获得淋巴细胞群;用一种或多种刺激剂刺激淋巴细胞群以产生激活的T细胞群,其中所述刺激是在使用无血清培养基的封闭系统中进行的;使用至少一个周期转导用包含编码CAR或TCR的核酸分子的病毒载体转导激活的T细胞群以产生转导的T细胞群,其中所述转导是在使用无血清培养基的封闭系统中进行的;以及将转导的T细胞群扩增以产生工程化T细胞群,其中所述扩增是在使用无血清培养基的封闭系统中进行的。扩增转导的T细胞群的预定时间可以是3天。从富集淋巴细胞群到产生工程化T细胞的时间可以是6天。封闭系统可以是封闭袋系统。还提供了包含可通过所述方法获得或通过所述方法获得的CAR或外源性TCR的T细胞群,以及包含此类细胞的药物组合物。
在实施方案中,T细胞体外成熟或分化可通过如国际专利公布号WO 2017/070395中描述的方法延迟或抑制,所述方法包括将来自需要T细胞疗法的受试者的一个或多个T细胞与AKT抑制剂(例如像WO2017070395的权利要求8中公开的一种AKT抑制剂或者两种或更多种AKT抑制剂的组合)以及外源性白细胞介素7(IL-7)和外源性白细胞介素15(IL-15)中的至少一种接触,相对于在不存在AKT抑制剂的情况下培养的T细胞的T细胞功能而言,其中所得T细胞表现出延迟的成熟或分化,且/或其中所得T细胞表现出改善的T细胞功能(例如像增加的T细胞增殖;增加的细胞因子产生;和/或增加的溶细胞活性)。
需要T细胞疗法的患者可通过如国际专利公布号WO 2016/191756中所述的方法进行调理,所述方法包括向患者施用200mg/m2/天与2000mg/m2/天之间剂量的环磷酰胺和20mg/m2/天与900mg/m2/天之间剂量的氟达拉滨。
疾病
遗传疾病和具有遗传和/或表观遗传方面的疾病
组合物、系统或其组分可用于治疗和/或预防遗传疾病或具有遗传和/或表观遗传方面的疾病。本文例示的基因和病状并不是详尽的。在实施方案中,治疗和/或预防遗传疾病的方法可包括向受试者施用组合物、系统和/或其一种或多种组分,其中所述组合物、系统和/或其一种或多种组分是能够修饰受试者的一个或多个细胞中与遗传疾病或具有遗传和/或表观遗传方面的疾病相关联的一种或多种基因的一个或多个拷贝。在实施方案中,修饰受试者中与遗传疾病或具有遗传和/或表观遗传方面的疾病相关联的一种或多种基因的一个或多个拷贝可消除受试者的遗传疾病或其症状。在实施方案中,修饰受试者中与遗传疾病或具有遗传和/或表观遗传方面的疾病相关联的一种或多种基因的一个或多个拷贝可降低受试者的遗传疾病或其症状的严重性。在实施方案中,组合物、系统或其组分可修饰与一种或多种疾病相关联的一种或多种基因或多核苷酸,所述一种或多种疾病包括遗传疾病和/或具有遗传方面和/或表观遗传方面的疾病,包括但不限于表4中列出的任一种或多种。应当理解,本文列出的那些疾病和相关基因是非详尽的且非限制性的。此外,一些基因在多种疾病的发生中发挥作用。
表4.示例性遗传性疾病和其他疾病及相关基因。
在实施方案中,组合物、系统或其组分可用于通过修饰与一种或多种细胞功能相关联的一种或多种基因(诸如表5中的基因的任一种或多种)来治疗或预防受试者的疾病。在实施方案中,所述疾病是遗传疾病或病症。在一些实施方案中,组合物、系统或其组分可修饰与一种或多种遗传疾病相关联的一种或多种基因或多核苷酸,诸如表5中列出的任何基因或多核苷酸。
在实施方案中,本公开提供了对需要这种治疗的受试者的遗传疾病进行个体化或个体化治疗的方法,包括:(a)在组织、器官或细胞系中离体引入一个或多个突变,或在在转基因非人哺乳动物体内,包括向组织、器官、细胞或哺乳动物的细胞递送组合物,所述组合物包含粒子递送系统或递送系统或上述实施方案中任一项的递送系统或病毒粒子或细胞上述实施方案中任一项的,其中特定突变或精确序列替换与遗传疾病相关或已经相关;(b)在已递送载体的细胞上测试遗传疾病的治疗,这些细胞具有与遗传疾病相关的特定突变或精确序列替换;(c)根据步骤(b)的治疗测试结果治疗受试者。
感染性疾病
在实施方案中,组合物、系统或其组分可用于诊断、预测、治疗和/或预防由微生物诸如细菌、病毒、真菌、寄生虫、或其组合引起的感染性疾病。
在实施方案中,所述系统或其组分能够靶向混合群体中的具体微生物。此类技术的示例性方法描述于例如Gomaa AA,Klumpe HE,Luo ML,Selle K,Barrangou R,BeiselCL.2014.Programmable removal of bacterial strains by use of genome-targetingcomposition,systems,mBio 5:e00928-13;Citorik RJ,Mimee M,Lu TK.2014.Sequence-specific antimicrobials using efficiently delivered RNA-guided nucleases.NatBiotechnol 32:1141–1145中,其教义可适于与本文所述的组合物、系统及其组分一起使用。
在实施方案中,组合物、系统和/或其组分能够靶向致病和/或抗药微生物,诸如细菌、病毒、寄生虫和真菌。在实施方案中,组合物、系统和/或其组分能够靶向和修饰致病微生物中的一种或多种多核苷酸,从而使微生物毒性降低、被杀伤、受抑制或以其他方式使其不能在宿主细胞中引起疾病和/或感染和/或复制。
在实施方案中,可被本文所述的组合物、系统和/或其组分靶向和/或修饰的致病菌包括但不限于以下属的那些:放线菌属(Actinomyces)(例如,衣氏放线菌(A.israelii))、芽孢杆菌属(例如,炭疽芽孢杆菌(B.anthracis)、蜡样芽孢杆菌(B.cereus))、拟杆菌属(Bactereoides)(例如,脆弱拟杆菌(B.fragilis))、巴通体属(Bartonella)(汉赛巴通体(B.henselae)、五日热巴通体(B.quintana))、博德特氏菌属(Bordetella)(百日咳博德特氏菌(B.pertussis))、疏螺旋体属(Borrelia)(例如,伯氏疏螺旋体(B.burgdorferi)、伽氏疏螺旋体(B.garinii)、阿氏疏螺旋体(B.afzelii))、布鲁氏菌属(Brucella)(例如,牛布鲁氏菌(B.abortus)、犬布鲁氏菌(B.canis)、羊布鲁氏菌(B.melitensis)和猪布鲁氏菌(B.suis))、弯曲杆菌属(Campylobacter)(例如,空肠弯曲杆菌(C.Jejuni))、衣原体属(Chlamydia)(例如,肺炎衣原体(C.pneumoniae)和沙眼衣原体(C.trachomatis))、嗜衣原体属(Chlamydophila)(例如,鹦鹉热嗜衣原体(C.psittaci))、梭菌属(Clostridium)(例如,肉毒梭菌(C.botulinum)、艰难梭菌(C.difficile)、产气荚膜梭菌(C.perfringens)、破伤风梭菌(C.tetani))、棒状杆菌属(Corynebacterium)(例如,白喉棒状杆菌(C.diptheriae))、肠球菌属(Enterococcus)(例如,粪肠球菌(E.Faecalis)、屎肠球菌(E.faecium))、埃立克体属(Ehrlichia)(例如,犬埃立克体(E.canis)和查菲埃立克体(E.chaffensis))、埃希氏菌属(例如,大肠杆菌)、弗朗西斯氏菌属(Francisella)(例如,土拉弗朗西斯氏菌(F.tularensis))、嗜血杆菌属(Haemophilus)(例如,流感嗜血杆菌(H.influenzae))、螺杆菌属(Helicobacter)(幽门螺杆菌(H.pylori))、克雷伯氏菌属(Klebsiella)(例如,肺炎克雷伯氏菌(K.pneumoniae))、军团菌属(Legionella)(例如,嗜肺军团菌(L.pneumophila))、钩端螺旋体属(Leptospira)(例如,问号钩端螺旋体(L.interrogans)、圣地罗西钩端螺旋体(L.santarosai)、韦氏钩端螺旋体(L.weilii)、野口钩端螺旋体(L.noguchii))、李斯特氏菌属(Listereia)(例如,单核细胞增多性李斯特菌(L.monocytogeenes))、分枝杆菌属(Mycobacterium)(例如,麻风分枝杆菌(M.leprae)、结核分枝杆菌(M.tuberculosis)、溃疡分枝杆菌(M.ulcerans))、支原体属(Mycoplasma)(肺炎支原体(M.pneumoniae))、奈瑟菌属(Neisseria)(淋病奈瑟菌(N.gonorrhoeae)和脑膜炎奈瑟菌(N.menigitidis))、诺卡菌属(Nocardia)(例如,星形诺卡菌(N.asteeroides))、假单胞菌属(铜绿假单胞菌)、立克次体属(Rickettsia)(立氏立克次体(R.rickettsia))、沙门氏菌属(Salmonella)(伤寒沙门氏菌(S.typhi)和鼠伤寒沙门氏菌(S.typhimurium))、志贺氏菌属(Shigella)(索氏志贺氏菌(S.sonnei)和痢疾志贺氏菌(S.dysenteriae))、葡萄球菌属(Staphylococcus)(金黄色葡萄球菌(S.aureus)、表皮葡萄球菌(S.epidermidis)和腐生葡萄球菌(S.saprophyticus))、链球菌属(无乳链球菌(S.agalactiaee)、肺炎链球菌(S.pneumoniae)、化脓性链球菌)、密螺旋体属(Treponema)(梅毒密螺旋体(T.pallidum))、脲原体属(Ureeaplasma)(例如,解脲脲原体(U.urealyticum))、弧菌属(Vibrio)(例如,霍乱弧菌(V.cholerae))、耶尔森氏菌属(Yersinia)(例如,鼠疫耶尔森氏菌(Y.pestis)、小肠结肠炎耶尔森氏菌(Y.enteerocolitica)和假结核耶尔森氏菌(Y.pseudotuberculosis))。
在实施方案中,可被本文所述的组合物、系统和/或其组分靶向和/或修饰的致病性病毒包括但不限于双链DNA病毒、部分双链DNA病毒、单链DNA病毒、阳性单链RNA病毒、阴性单链RNA病毒或双链RNA病毒。在实施方案中,致病性病毒可来自腺病毒科(Adenoviridae)(例如,腺病毒)、疱疹病毒科(Herpeesviridae)(例如,单纯疱疹1型、单纯疱疹2型、水痘-带状疱疹病毒、爱泼斯坦-巴尔病毒(Epstein-Barr virus)、人巨细胞病毒、人疱疹病毒8型)、乳头瘤病毒科(Papillomaviridae)(例如,人乳头瘤病毒)、多瘤病毒科(Polyomaviridae)(例如,BK病毒、JC病毒)、痘病毒科(Poxviridae)(例如,天花)、肝炎病毒科(Hepadnaviridae)(例如,乙型肝炎)、细小病毒科(Parvoviridae)(例如,细小病毒B19)、星状病毒科(Astroviridae)(例如,人星状病毒)、杯状病毒科(Caliciviridae)(例如,诺沃克病毒(Norwalk virus))、小核糖核酸病毒科(Picornaviridae)(例如,柯萨奇病毒(coxsackievirus)、甲型肝炎病毒、脊髓灰质炎病毒、鼻病毒)、冠状病毒科(Coronaviridae)(例如,严重急性呼吸综合征相关冠状病毒,毒株:严重急性呼吸综合征病毒、严重急性呼吸综合征冠状病毒2(COVID-19))、黄病毒科(Flaviviridae)(例如,丙型肝炎病毒、黄热病病毒、登革热病毒、西尼罗河病毒(West Nile virus)、TBE病毒)、披膜病毒科(Togaviridae)(例如,风疹病毒)、肝炎病毒科(Hepeviridae)(例如,戊型肝炎病毒)、逆转录病毒科(Retroviridae)(人免疫缺陷病毒(HIV))、正粘病毒科(Orthomyxoviridae)(例如,流感病毒)、沙粒病毒科(Arenaviridae)(例如,拉沙病毒(Lassa virus))、布尼亚病毒科(Bunyaviridae)(例如,克里米亚-刚果出血热病毒(Crimean-Congo hemorrhagic fevervirus)、汉坦病毒(Hantaan virus))、丝状病毒科(Filoviridae)(例如,埃博拉病毒(Ebolavirus)和马尔堡病毒(Marburg virus))、副粘病毒科(Paramyxoviridae)(例如,麻疹病毒、腮腺炎病毒、副流感病毒、呼吸道合胞病毒)、弹状病毒科(Rhabdoviridae)(狂犬病病毒)、丁型肝炎病毒、呼肠孤病毒科(Reoviridae)(例如,轮状病毒、环状病毒、结肠病毒、版纳病毒)。
在实施方案中,可被本文所述的组合物、系统和/或其组分靶向和/或修饰的致病真菌包括但不限于以下属的那些:念珠菌属(例如,白色念珠菌)、曲霉属(例如,烟曲霉(A.fumigatus)、黄曲霉(A.flavus)、棒曲霉(A.clavatus))、隐球菌属(Cryptococcus)(例如,新生隐球菌属(C.neoformans)、格特隐球菌(C.gattii))、组织胞浆菌属(Histoplasma)(例如,荚膜组织胞浆菌(H.capsulatum))、肺孢子菌属(Pneumocystis)(例如,耶氏肺孢子菌(P.jiroveecii))、葡萄穗霉属(Stachybotrys)(例如,纸葡萄穗霉(S.chartarum))。
在实施方案中,可被本文所述的组合物、系统和/或其组分靶向和/或修饰的致病性寄生虫包括但不限于原生动物、蠕虫和体外寄生虫。在实施方案中,可被本文所述的组合物、系统和/或其组分靶向和/或修饰的致病性原生动物包括但不限于来自以下组的那些:肉足亚门(Sarcodina)(例如,阿米巴,诸如内阿米巴属(Entamoeba))、鞭毛虫纲(例如,鞭毛虫,诸如贾第鞭毛虫属(Giardia)和利什曼原虫属(Leishmania))、纤毛门(Cilophora)(例如,纤毛虫,诸如巴拉坦丁属(Balantidum))和孢子虫纲(sporozoa)(例如,疟原虫属(plasmodium)和隐孢子虫属(cryptosporidium))。在实施方案中,可被本文所述的组合物、系统和/或其组分靶向和/或修饰的致病性蠕虫包括但不限于扁形虫(扁形动物门(platyhelminths))、棘头虫(棘头动物门(acanthoceephalins))和蛔虫(线虫动物门(nematodes))。在实施方案中,可被本文所述的组合物、系统和/或其组分靶向和/或修饰的致病性体外寄生虫包括但不限于蜱、蚤、虱和螨。
在实施方案中,可被本文所述的组合物、系统和/或其组分靶向和/或修饰的致病性寄生虫包括但不限于棘阿米巴属(Acanthamoeba)物种、狒狒巴拉姆希阿米巴(Balamuthia mandrillaris)、巴贝虫属(Babesiosis)物种(例如,分歧巴贝虫(BabesiaB.divergens)、双芽巴贝虫(B.bigemina)、马巴贝虫(B.equi)、田鼠巴贝虫(B.microfti)、杜氏巴贝虫(B.duncani))、小袋纤毛虫属物种(例如,结肠小袋纤毛虫(Balantidiumcoli))、芽囊原虫属(Blastocystis)物种、隐孢子虫属物种、圆孢子虫属(Cyclosporiasis)物种(例如,卡耶潭圆孢子虫(Cyclospora cayetanensis))、双核阿米巴属(Dientamoebiasis)物种(例如,脆弱双核阿米巴(Dientamoeba fragilis))、变形虫属(Amoebiasis)物种(例如,痢疾内变形虫(Entamoeba histolytica))、贾第鞭毛虫属(Giardiasis)物种(例如,蓝氏贾第鞭毛虫(Giardia lamblia))、等孢子虫属(Isosporiasis)物种(例如,贝氏等孢子虫(Isospora belli))、利什曼原虫属(Leishmania)物种、耐格里属(Naegleria)物种(例如,福氏耐格里(Naegleria fowleri))、疟原虫属(Plasmodium)物种(例如,恶性疟原虫(Plasmodium falciparum)、间日疟原虫(Plasmodium vivax)、卵形疟原虫柯氏亚种(Plasmodium ovale curtisi)、卵形疟原虫沃氏亚种(Plasmodium ovale wallikeri)、三日疟原虫(Plasmodium malariae)、诺氏疟原虫(Plasmodium knowlesi))、鼻孢子虫属(Rhinosporidiosis)物种(例如,西伯氏鼻孢子虫(Rhinosporidium seeberi))、肉孢子虫属(Sarcocystosis)物种(例如,牛人肉孢子虫(Sarcocystis bovihominis)、猪人肉孢子虫(Sarcocystis suihominis))、弓形虫属(Toxoplasma)物种(例如,刚地弓形虫(Sarcocystis suihominis))、毛滴虫属(Trichomonas)物种(例如,阴道毛滴虫(Trichomonas vaginalis))、锥虫属(Trypanosoma)物种(例如,布氏锥虫(Trichomonas vaginalis))、锥虫属物种(例如,克氏锥虫(Trypanosoma cruzi))、绦虫(例如,绦虫纲(Cestoda)、多头绦虫(Taenia multiceps)、牛带绦虫(Taenia saginata)、猪带绦虫(Taenia solium))、阔节裂头绦虫属(Diphyllobothrium latum)物种、棘球绦虫属(Echinococcus)物种(例如,细粒棘球绦虫(Echinococcus granulosus)、多房棘球绦虫(Echinococcus multilocularis)、福氏棘球绦虫(E.vogeli)、少节棘球绦虫(E.oligarthrus))、膜壳绦虫属(Hymenolepis)物种(例如,短膜壳绦虫(Hymenolepis nana)、缩小膜壳绦虫(Hymenolepis diminuta))、伯特绦虫属(Bertiella)物种(例如,古巴伯特绦虫(Bertiella mucronata)、司氏伯特绦虫(Bertiellastuderi))、迭宫绦虫属(Spirometra)(例如,欧猬迭宫绦虫(Spirometraerinaceieuropaei))、支睾吸虫属(Clonorchis)物种(例如,华支睾吸虫(Clonorchissinensis);麝猫支睾吸虫(Clonorchis viverrini))、双腔吸虫属(Dicrocoelium)物种(例如,枝双腔吸虫(Dicrocoelium dendriticum))、片形吸虫属(Fasciola)物种(例如,肝片形吸虫(Fasciola hepatica)、巨片形吸虫(Fasciola gigantica))、姜片吸虫属(Fasciolopsis)物种(例如,布氏姜片吸虫(Fasciolopsis buski))、后殖吸虫属(Metagonimus)物种(例如,横川后殖吸虫(Metagonimus yokogawai))、次睾吸虫属(Metorchis)物种(例如,结合次睾吸虫(Metorchis conjunctus))、后睾吸虫属(Opisthorchis)物种(例如,麝猫后睾吸虫(Opisthorchis viverrini)、猫后睾吸虫(Opisthorchis felineus))、支睾吸虫属(例如,华支睾吸虫)、并殖吸虫属(Paragonimus)物种(例如,卫氏并殖吸虫(Paragonimus westermani);非洲并殖吸虫(Paragonimusafricanus);卡里并殖吸虫(Paragonimus caliensis);克氏并殖吸虫(Paragonimuskellicotti);斯氏并殖吸虫(Paragonimus skrjabini);子宫双侧并殖吸虫(Paragonimusuterobilateralis))、血吸虫属(Schistosoma)物种、血吸虫属物种(例如,曼氏血吸虫(Schistosoma mansoni)、埃及血吸虫(Schistosoma haematobium)、日本血吸虫(Schistosoma japonicum)、湄公血吸虫(Schistosoma mekongi)和间插血吸虫(Schistosoma intercalatum))、棘口吸虫属(Echinostoma)物种(例如,多刺棘口吸虫(E.echinatum))、毛毕吸虫属(Trichobilharzia)物种(例如,毛毕吸虫尾蚴(Trichobilharzia regent))、钩口线虫属(Ancylostoma)物种(例如,十二指肠钩口线虫(Ancylostoma duodenale))、钩虫属(Necator)物种(例如,美洲钩虫(Necatoramericanus))、管圆线虫属(Angiostrongylus)物种、异尖线虫属(Anisakis)物种、蛔线虫属(Ascaris)物种(例如,似蚓蛔线虫(Ascaris lumbricoides))、贝利蛔线虫属(Baylisascaris)物种(例如,浣熊贝利蛔线虫属(Baylisascaris procyonis))、布鲁丝虫属(Brugia)物种(例如,马来布鲁丝虫(Brugia malayi)、帝汶布鲁丝虫(Brugia timori))、膨结线虫属(Dioctophyme)物种(例如,肾膨结线虫(Dioctophyme renale))、龙线虫属(Dracunculus)物种(例如,麦地那龙线虫(Dracunculus medinensis))、蛲虫属(Enterobius)物种(例如,人蛲虫(Enterobius vermicularis)、格氏蛲虫(Enterobiusgregorii))、颚口线虫属(Gnathostoma)物种(例如,有棘颚口线虫(Gnathostomaspinigerum)、刚棘颚口线虫(Gnathostoma hispidum))、魔鬼线虫属(Halicephalobus)物种(例如,破坏魔鬼线虫(Halicephalobus gingivalis))、罗阿丝虫属(Loa loa)物种(例如,罗阿丝虫(Loa loa filaria))、曼森线虫属(Mansonella)物种(例如,链尾曼森线虫(Mansonella streptocerca))、盘尾丝虫属(Onchocerca)物种(例如,旋盘尾丝虫(Onchocerca volvulus))、类圆线虫属(Strongyloides)物种(例如,粪类圆线虫(Strongyloides stercoralis))、吸吮线虫属(Thelazia)物种(例如,加利福尼亚吸吮线虫(Thelazia californiensis)、结膜吸吮线虫(Thelazia callipaeda))、弓首蛔虫属(Toxocara)物种(例如,犬弓首蛔虫(Toxocara canis)、猫弓首蛔虫(Toxocara cati)、狮弓首蛔虫(Toxascaris leonine))、旋毛虫属(Trichinella)物种(例如,螺旋毛虫(Trichinella spiralis)、布氏旋毛虫(Trichinella britovi)、纳氏旋毛虫(Trichinellanelsoni)、乡土旋毛虫(Trichinella nativa))、毛首线虫属(Trichuris)物种(例如,鞭形毛首线虫(Trichuris trichiura)、狐毛首线虫(Trichuris vulpis))、吴策线虫属(Wuchereria)物种(例如,班氏吴策线虫(Wuchereria bancrofti))、人皮蝇属(Dermatobia)物种(例如,人皮蝇(Dermatobia hominis))、潜蚤属(Tunga)物种(例如,穿皮潜蚤(Tunga penetrans))、锥蝇属(Cochliomyia)物种(例如,嗜人锥蝇(Cochliomyiahominivorax))、舌形虫属(Linguatula)物种(例如,锯齿舌形虫(Linguatula serrata))、原棘头虫纲(Archiacanthocephala)物种、念珠棘虫属(Moniliformis)物种(例如,念珠棘头虫(Moniliformis moniliformis))、虱属(Pediculus)物种(例如,头虱(Pediculushumanus capitis)、体虱(Pediculus humanus humanus))、阴虱属(Pthirus)物种(例如,阴虱(Pthirus pubis))、蛛形纲(Arachnida)物种(例如,恙螨科(Trombiculidae)、硬蜱科(Ixodidae)、软蜱科(Argaside))、蚤目(Siphonaptera)物种(例如,蚤目:潜蚤亚科(Pulicinae))、臭虫科(Cimicidae)物种(例如,温带臭虫(Cimex lectularius)和热带臭虫(Cimex hemipterus))、双翅目(Diptera)物种、蠕形螨属(Demodex)物种(例如,毛囊蠕形螨(Demodex folliculorum)/皮脂蠕形螨(Demodex brevis)/犬蠕形螨(Demodex canis))、疥螨属(Sarcoptes)物种(例如,人疥螨(Sarcoptes scabiei))、皮刺螨属(Dermanyssus)物种(例如,鸡皮刺螨(Dermanyssus gallinae))、禽刺螨属(Ornithonyssus)物种(例如,林禽刺螨(Ornithonyssus sylviarum)、囊禽刺螨(Ornithonyssus bursa)、柏氏禽刺螨(Ornithonyssus bacoti))、厉螨属(Laelaps)物种(例如,毒厉螨(Laelaps echidnina))、刺脂螨属(Liponyssoides)物种(例如,吸血异脂刺螨(Liponyssoides sanguineus))。
在实施方案中,基因靶标可以是Strich和Chertow.2019.J.Clin.Microbio.57:4e01307-18的表1中列出的那些,将所述文献并入本文,如同在本文中整体表达一样。
在实施方案中,所述方法可包括将组合物、系统和/或其组分递送至本文所述的致病生物体,从而允许所述组合物、系统和/或其组分特异性结合并修饰致病生物体中的一个或多个靶标,由此所述修饰杀伤、抑制、降低致病生物体的致病性,或以其他方式使致病生物体无致病性。在实施方案中,组合物、系统的递送发生在体内(即在所治疗的受试者中)。在实施方案中,递送由对受试者无致病性但能够转移多核苷酸和/或感染致病微生物的中间体(诸如微生物或噬菌体)发生。在实施方案中,中间体微生物可以是工程化细菌、病毒或噬菌体,其含有组合物、系统和/或其组分和/或载体和/或载体系统。所述方法可包括向待治疗的受试者施用含有组合物、系统和/或其组分和/或载体和/或载体系统的中间体微生物。然后中间体微生物可产生系统和/或其组分或将组合物、系统、多核苷酸转移至致病生物体。在实施方案中,在将系统和/或其组分、载体或载体系统转移至致病微生物的情况下,就会在致病微生物中产生组合物、系统或其组分并修饰致病微生物,使得其毒性降低、被杀伤、受抑制或以其他方式不能在宿主或其细胞中引起疾病和/或感染和/或复制。
在实施方案中,在致病微生物将其遗传物质插入宿主细胞的基因组中的情况下(例如,病毒),组合物、系统可被设计成使得其修饰宿主细胞的基因组,使得病毒DNA或cDNA不能被宿主细胞的机构复制成功能性病毒。在实施方案中,在致病微生物将其遗传物质插入宿主细胞的基因组中的情况下(例如,病毒),组合物、系统可被设计成使得其修饰宿主细胞的基因组,使得病毒DNA或cDNA从宿主细胞的基因组中缺失。
应当理解,通过抑制或杀伤致病微生物,可治疗或预防感染在受试者中引起的疾病和/或病状。因此,本文还提供了治疗和/或预防由任何一种或多种致病微生物(诸如本文所述致病微生物中的任一种)引起的一种或多种疾病或其症状的方法。
线粒体疾病
最具挑战性的线粒体病症中的一些是由线粒体DNA(mtDNA)突变引起的,所述线粒体DNA是母系遗传的高拷贝数基因组。在实施方案中,可使用本文所述的组合物、系统来修饰mtDNA突变。在实施方案中,可诊断、预测、治疗和/或预防的线粒体疾病可以是MELAS(线粒体肌病脑病和乳酸酸中毒和中风样发作)、CPEO/PEO(慢性进行性外眼肌麻痹综合征/进行性外眼眼肌麻痹)、KSS(卡恩斯-塞尔综合征)、MIDD(母系遗传性糖尿病和耳聋)、MERRF(肌阵挛性癫痫伴红色纤维参差不齐)、NIDDM(非胰岛素依赖型糖尿病)、LHON(Leber遗传性视神经病变)、LS(Leigh综合征)、氨基糖苷类诱发的听力障碍、NARP(神经病、共济失调和色素性视网膜病)、锥体外系障碍伴运动不能-僵硬、精神病和SNHL、非综合征性听力损失、心肌病、脑肌病、皮尔逊综合征(Pearson’s syndrome)或其组合。
在实施方案中,受试者的mtDNA可在体内或离体进行修饰。在实施方案中,在离体修饰mtDNA的情况下,在修饰后,可将含有修饰的线粒体的细胞施用回受试者。在实施方案中,组合物、系统或其组分能够校正mtDNA突变或其组合。
在实施方案中,一种或多种mtDNA突变中的至少一种选自由以下组成的组:A3243G、C3256T、T3271C、G1019A、A1304T、A15533G、C1494T、C4467A、T1658C、G12315A、A3421G、A8344G、T8356C、G8363A、A13042T、T3200C、G3242A、A3252G、T3264C、G3316A、T3394C、T14577C、A4833G、G3460A、G9804A、G11778A、G14459A、A14484G、G15257A、T8993C、T8993G、G10197A、G13513A、T1095C、C1494T、A1555G、G1541A、C1634T、A3260G、A4269G、T7587C、A8296G、A8348G、G8363A、T9957C、T9997C、G12192A、C12297T、A14484G、G15059A,位置305-314和/或956-965处CCCCCTCCCC串联重复序列的重复、位置8,469-13,447、4,308-14,874和/或4,398-14,822处的缺失、961ins/delC、线粒体常见缺失(例如,mtDNA 4,977bp缺失)及其组合。
在实施方案中,线粒体突变可以是如在mitomap.org.上可查看的Mitomap中所列出的或通过使用Mitomap中可用的一种或多种生物信息学工具鉴定的任何突变。此类工具包括但不限于“Variant Search,又称为Market Finder”、Find Sequences for AnyHaplogroup,又称为“Sequence Finder”、“Variant Info”、“POLG PathogenicityPrediction Server”、“MITOMASTER”、“Allele Search”、“Sequence and VariantDownloads”、“Data Downloads”。MitoMap含有可与疾病相关联的mtDNA的突变报告,并维护报告的线粒体DNA碱基取代疾病:rRNA/tRNA突变的数据库。
在实施方案中,所述方法包括将组合物、系统和/或其组分递送至细胞,并且更具体地递送至细胞中的一个或多个线粒体,从而允许组合物、系统和/或其组分修饰细胞中的一个或多个靶多核苷酸,并且更具体地修饰细胞中的一个或多个线粒体。靶多核苷酸可对应于mtDNA中的突变,诸如本文所述突变中的任一种或多种。在实施方案中,修饰可改变线粒体的功能,使得与未修饰的线粒体相比,线粒体功能正常或至少不太有功能障碍。修饰可发生在体内或离体。在离体进行修饰的情况下,可以自体或同种异体的方式将含有修饰的线粒体的细胞施用于有需要的受试者。
微生物组修饰
微生物组在健康和疾病方面起重要作用。例如,肠道微生物组可通过控制消化、防止致病微生物的生长而在健康方面发挥作用,并被认为会影响心境和情绪。不平衡的微生物组可促发疾病,并被认为会导致体重增加、血糖失控、高胆固醇、癌症和其他病症。健康的微生物组具有一系列可与非健康个体区分开来的联合特征,因此疾病相关微生物组的检测和鉴定可用于诊断和检测个体的疾病。组合物、系统及其组分可用于筛选微生物组细胞群并用于鉴定疾病相关微生物组。利用组合物、系统及其组分的细胞筛选方法在本文别处描述并且可应用于筛选受试者的微生物组,诸如肠道、皮肤、阴道和/或口腔微生物组。
在实施方案中,可使用本文所述的组合物、系统和/或其组分来修饰受试者的微生物组的微生物群体。在实施方案中,组合物、系统和/或其组分可用于鉴定和选择微生物组中的一种或多种细胞类型并将它们从微生物组群体中去除。使用组合物、系统和/或其组分选择细胞的示例性方法在本文别处描述。以此方式,可改变微生物组的组成或微生物特征。在实施方案中,所述改变致使从患病微生物组组合物变化成健康微生物组组合物的。以此方式,可修改一种微生物类型或物种与另一种的比例,诸如从患病比例变为健康比例。在实施方案中,所选择的细胞是致病微生物。
在实施方案中,本文所述的组合物和系统可用于修饰受试者的微生物组的微生物中的多核苷酸。在实施方案中,微生物是致病微生物。在实施方案中,微生物是共生和非致病微生物。修饰受试者的细胞中的多核苷酸的方法在本文别处描述并且可应用于这些实施方案。
疾病和病状的模型
在一个方面,本公开提供了一种对与真核生物体或非人生物体中的基因组基因座相关联的疾病进行建模的方法,所述方法包括操纵所述基因组基因座的编码、非编码或调控元件内的靶序列,包括递送包含病毒载体系统的非天然存在或工程化的组合物,所述病毒载体系统包括一种或多种可操作地编码用于其表达的组合物的病毒载体,其中所述组合物包含粒子递送系统或如上述实施方案中任一项所述的递送系统或病毒粒子或如上述实施方案中任一项所述的细胞。
在一个方面,本公开提供了一种生成模型真核细胞的方法,所述模型真核细胞可包括一个或多个突变的疾病基因和/或感染性微生物。在实施方案中,疾病基因是与患有或发生疾病的风险增加相关联的任何基因。在实施方案中,所述方法包括(a)将一种或多种载体引入真核细胞,其中所述一种或多种载体包含组合物、系统和/或其组分和/或能够驱动组合物、系统和/或其组分的表达的载体或载体系统,其包括但不限于:任选地连接到tracr配对序列的指导序列、tracr序列、一种或多种Cas效应物及其组合以及(b)允许组合物、系统或复合物结合一种或多种靶多核苷酸,例如以实现所述疾病基因内靶多核苷酸的切割、切口或其他修饰,其中组合物、系统或复合物由与以下序列复合的一种或多种CRISPR-Cas效应物构成:(1)一种或多种与靶多核苷酸内的靶序列杂交的指导序列,和任选的(2)与tracr序列杂交的tracr配对序列,从而产生包含一个或多个突变疾病基因的模型真核细胞。因此,在实施方案中,组合物和系统含有用于并驱动以下中的一种或多种的表达的核酸分子:Cas效应物、与tracr配对序列连接的指导序列、以及tracr序列和/或同源重组模板和/或稳定化配体(如果Cas效应物具有失稳结构域)。在实施方案中,所述切割包括通过Cas效应物在靶序列的位置处切割一条或两条链。在实施方案中,切口包括通过Cas效应物在靶序列的位置处对一条或两条链进行切口。在实施方案中,所述切割或切口导致靶多核苷酸的修饰的转录。在实施方案中,修饰导致靶多核苷酸的转录减少。在实施方案中,所述方法还包括通过与重组模板多核苷酸同源重组来修复所述切割或切口的靶多核苷酸,其中所述修复导致突变,包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失或取代。在实施方案中,所述突变产生由包含靶序列的基因表达的蛋白质中的一个或多个氨基酸变化。
建模的疾病可以是具有遗传或表观遗传组分的任何疾病。在实施方案中,建模的疾病可以是如本文别处讨论的任何疾病,包括但不限于本文的表4和表5中列出的任何疾病。
原位疾病检测
组合物、系统和/或其组分可用于检测的诊断方法,诸如CASFISH(参见例如,Deng等人2015.PNAS USA 112(38):11870-11875),CRISPR-Live FISH(参见例如,Wang等人2020.Science;365(6459):1301-1305)、sm-FISH(Lee和Jefcoate.2017.Front.Endocrinol.doi.org/10.3389/fendo.2017.00289)、序列FISH CRISPRainbow(Ma等人NatBiotechnol,34(2016),第528-530页)、CRISPR-Sirius(Nat Methods,15(2018),第928-931页)、Casilio(Cheng等人Cell Res,26(2016),第254-257页)、基于Halo标签的基因组基因座可视化技术(例如,Deng等人2015.PNAS USA 112(38):11870-11875;Knight等人,Science,350(2015),第823-826页)、基于RNA适体的方法(例如,Ma等人,J Cell Biol,214(2016),第529-537页)、基于分子信标的方法(例如,Zhao等人Biomaterials,100(2016),第172-183页;Wu等人Nucleic Acids Res(2018))、基于量子点的系统(例如,Ma等人AnalChem,89(2017),第12896-12901页)、多重方法(例如,Ma等人,Proc Natl Acad Sci U S A,112(2015),第3002-3007页;Fu等人Nat Commun,7(2016),第11707页;Ma等人NatBiotechnol,34(2016),第528-530页;Shao等人Nucleic Acids Res,44(2016),文章e86);Wang等人Sci Rep,6(2016),第26857页)、和其他基于原位CRISPR杂交的方法(例如,Chen等人Cell,155(2013),第1479-1491页;Gu等人Science,359(2018),第1050-1055页;Tanebaum等人Cell,159(2014),第635-646页;Ye等人Protein Cell,8(2017),第853-855页;Chen等人Nat Commun,9(2018),第5065页;Shao等人ACS Synth Biol(2017);Fu等人NatCommun,7(2016),第11707页;Shao等人Nucleic Acids Res,44(2016),文章e86;Wang等人,Sci Rep,6(2016),第26857页),所有文献均以引用的方式并入本文,就如同它们整体表达一样,并且其教义鉴于本文的描述可适于本文所述的组合物、系统及其组分。
在实施方案中,组合物、系统或其组分可用于检测方法,诸如本文所述的原位检测方法。在实施方案中,组合物、系统或其组分可包括本文所述的催化失活的Cas效应物,并且在检测方法,诸如荧光原位杂交(FISH)或本文所述的任何其他检测方法中使用此系统。在实施方案中,缺乏产生DNA双链断裂能力的失活Cas效应物可与标志物(诸如荧光蛋白,诸如增强型绿色荧光蛋白(eEGFP))融合,并与小指导RNA共表达以在体内靶向臂间(pericentric)、中心和端粒重复序列。dCas效应物或其系统可用于可视化人基因组中的重复序列和个别基因。标记的dCas效应物及其组合物、系统的此类新应用在使细胞成像和研究功能性核结构方面可能很重要尤其是在核体积小或3-D结构复杂的情况下。
细胞选择
在实施方案中,本文所述的组合物、系统和/或其组分可用于筛选和/或选择细胞的方法中。在实施方案中,基于组合物、系统的筛选/选择方法可用于鉴定细胞群中的患病细胞。在实施方案中,细胞的选择导致细胞中的修饰,使得所选择的细胞死亡。以此方式,可鉴定出患病细胞,并将其从健康细胞群中去除。在实施方案中,患病细胞可以是癌细胞、癌前细胞、病毒或其他致病生物体感染的细胞,或其他异常细胞。在实施方案中,修饰可在待选择的细胞中赋予另一种可检测的变化(例如,功能变化和/或基因组条形码),这有助于选择所需细胞。在实施方案中,可使用阴性选择方案来获得所需的细胞群。在这些实施方案中,对待选择的细胞进行修饰,因此可基于它们的死亡或基于赋予细胞的可检测变化的鉴定或分选而将其从细胞群中去除。因此,在这些实施方案中,选择后的剩余细胞是所需的细胞群。
在实施方案中,选择含有多核苷酸修饰的一种或多种细胞的方法可包括:将一种或多种组合物、系统和/或其组分和/或载体或载体系统引入细胞中,其中所述组合物、系统和/或其组分和/或载体或载体系统含有和/或能够表达以下中的一种或多种:Cas效应物、任选地连接到tracr配对序列的指导序列、tracr序列和重组模板;其中,例如,所表达的物质是在组合物、系统、载体或载体系统内的并通过组合物、系统、载体或载体系统在体内表达的,且/或重组模板包含消除Cas效应物切割的一个或多个突变;允许重组模板与待选择的细胞中的靶多核苷酸同源重组;允许组合物、系统或复合物结合靶多核苷酸以实现所述基因内的靶多核苷酸的切割,其中AAV-复合物包含与以下序列复合的Cas效应物:(1)与靶多核苷酸内的靶序列杂交的指导序列,和(2)与tracr序列杂交的tracr配对序列,其中复合物与靶多核苷酸的结合诱导细胞死亡或赋予细胞一些其他可检测的变化,从而允许选择已引入一个或多个突变的一个或多个细胞。在实施方案中,待选择的细胞可以是真核细胞。在实施方案中,待选择的细胞可以是原核细胞。通过本文的方法选择具体细胞可在不需要选择标志物或可包括反选择系统的两步法的情况下进行。
治疗剂的开发
本文所述的组合物、系统及其组分可用于开发基于CRISPR-Cas和基于非CRISPR-Cas的生物活性剂,诸如小分子治疗剂。因此,本文描述了用于开发调节与疾病和/或疾病基因相关联的细胞功能和/或信号传导事件的生物活性剂的方法。在实施方案中,所述方法包括(a)使测试化合物与患病细胞和/或含有疾病基因细胞的细胞接触;以及(b)检测读数的变化,所述变化指示细胞信号传导事件或与所述疾病或疾病基因相关联的其他细胞功能的减少或增加,从而开发调节所述细胞信号传导事件或与所述疾病基因相关联的其他功能的所述生物活性剂。在实施方案中,患病细胞是本文别处所述的模型细胞。在实施方案中,患病细胞是从需要治疗的受试者中分离的患病细胞。在实施方案中,测试化合物是小分子剂。在实施方案中,测试化合物是小分子剂。在实施方案中,测试化合物是生物分子剂。
在实施方案中,所述方法涉及开发基于本文所述的组合物、系统的治疗剂。在特定的实施方案中,治疗剂包含能够与目标靶序列杂交的Cas效应物和/或指导RNA。在特定的实施方案中,治疗剂是载体或载体系统,其可含有a)第一调控元件,其与编码Cas效应蛋白的核苷酸序列可操作地连接;和b)第二调控元件,其与编码一种或多种核酸分子的一个或多个核苷酸序列可操作地连接,所述核酸分子包括包含指导序列、正向重复序列的指导RNA;其中组分(a)和(b)位于相同或不同的载体上。在特定的实施方案中,生物活性剂是包含递送系统的组合物,所述递送系统被可操作地构造成将组合物、系统或其组分和/或含有或编码所述组分的一种或多种多核苷酸序列、载体或载体系统递送到细胞中,并且能够与本文的组合物和系统的组分形成复合物,并且其中所述复合物在细胞中是可操作的。在实施方案中,复合物可包括如本文所述的Cas效应蛋白、包含指导序列的指导RNA和正向重复序列。在任何此类组合物中,递送系统可以是酵母系统、脂质转染系统、显微注射系统、基因枪系统、病毒体、脂质体、免疫脂质体、聚阳离子、脂质:核酸缀合物或人工病毒粒子、或如本文所述的任何其他系统。在特定的实施方案中,递送是通过粒子、纳米粒子、脂质或细胞穿透肽(CPP)进行的。
本文还描述了用于开发或设计组合物,系统,任选地基于组合物、系统的疗法或治疗剂的方法,所述方法包括(a)选择目标(治疗性)基因座gRNA靶位点,其中所述靶位点在群体中具有最小的序列变异,并且从所述选择的靶位点中子选择靶位点,其中针对所述靶位点的gRNA识别所述群体中最小数量的脱靶位点,或(b)选择目标(治疗性)基因座gRNA靶位点,其中所述靶位点在群体中具有最小的序列变异,或选择目标(治疗性)基因座gRNA靶位点,其中针对所述靶位点的gRNA识别所述群体中最小数量的脱靶位点,并且任选地估计治疗或以其他方式调节或操纵群体所需的(子)选择的靶位点的数量,并且任选地验证个体受试者的一个或多个(子)选择的靶位点,任选地设计识别所述(子)选择的靶位点中的一个或多个的一个或多个gRNA。
在实施方案中,用于开发或设计用于在组合物,系统,任选地基于组合物、系统的疗法或治疗剂中使用的gRNA的方法可包括(a)选择目标(治疗性)基因座gRNA靶位点,其中所述靶位点在群体中具有最小的序列变异,并且从所述选择的靶位点中子选择靶位点,其中针对所述靶位点的gRNA识别所述群体中最小数量的脱靶位点,或(b)选择目标(治疗性)基因座gRNA靶位点,其中所述靶位点在群体中具有最小的序列变异,或选择目标(治疗性)基因座gRNA靶位点,其中针对所述靶位点的gRNA识别所述群体中最小数量的脱靶位点,并且任选地估计治疗或以其他方式调节或操纵群体所需的(子)选择的靶位点的数量,任选地验证个体受试者的一个或多个(子)选择的靶位点,任选地设计识别所述(子)选择的靶位点中的一个或多个的一个或多个gRNA。
在实施方案中,用于开发或设计群体中的组合物,系统,任选地基于组合物、系统的疗法或治疗剂的方法可包括(a)选择目标(治疗性)基因座gRNA靶位点,其中所述靶位点在群体中具有最小的序列变异,并且从所述选择的靶位点中子选择靶位点,其中针对所述靶位点的gRNA识别所述群体中最小数量的脱靶位点,或(b)选择目标(治疗性)基因座gRNA靶位点,其中所述靶位点在群体中具有最小的序列变异,或选择目标(治疗性)基因座gRNA靶位点,其中针对所述靶位点的gRNA识别所述群体中最小数量的脱靶位点,并且任选地估计治疗或以其他方式调节或操纵群体所需的(子)选择的靶位点的数量,任选地验证个体受试者的一个或多个(子)选择的靶位点,任选地设计识别所述(子)选择的靶位点中的一个或多个的一个或多个gRNA。
在实施方案中,用于开发或设计用于在群体中的组合物,系统,任选地基于组合物、系统的疗法或治疗剂中使用的gRNA的方法可包括(a)选择目标(治疗性)基因座gRNA靶位点,其中所述靶位点在群体中具有最小的序列变异,并且从所述选择的靶位点中子选择靶位点,其中针对所述靶位点的gRNA识别所述群体中最小数量的脱靶位点,或(b)选择目标(治疗性)基因座gRNA靶位点,其中所述靶位点在群体中具有最小的序列变异,或选择目标(治疗性)基因座gRNA靶位点,其中针对所述靶位点的gRNA识别所述群体中最小数量的脱靶位点,并且任选地估计治疗或以其他方式调节或操纵群体所需的(子)选择的靶位点的数量,任选地验证个体受试者的一个或多个(子)选择的靶位点,任选地设计识别所述(子)选择的靶位点中的一个或多个的一个或多个gRNA。
在实施方案中,用于开发或设计任选地在群体中的组合物,系统,诸如基于组合物、系统的疗法或治疗剂;或用于开发或设计用于在任选地在群体中的组合物,系统,任选地基于组合物、系统的疗法或治疗剂中使用的gRNA的方法可包括为靶群体中的一个或多个基因座选择一组靶序列,其中靶序列不含在靶群体中出现高于阈值等位基因频率的变体(即铂靶序列);从所述选择的(铂)靶序列中去除具有高频脱靶候选物(相对于组中的其他(铂)靶标)的任何靶序列,以定义最终靶序列组;基于最终靶序列组制备一种或多种(诸如一组)组合物、系统,任选地其中制备的CRISP-Cas系统的数量(至少部分地)基于靶群体的大小。
在实施方案中,脱靶候选物/脱靶、PAM限制性、靶切割效率或效应蛋白特异性使用基于测序的双链断裂(DSB)检测测定来鉴定或确定,诸如本文别处所述。在实施方案中,脱靶候选物/脱靶使用基于测序的双链断裂(DSB)检测测定来鉴定或确定,诸如本文别处所述。在实施方案中,脱靶或脱靶候选物具有至少1个、优选1至3个错配或(远端)PAM错配,诸如1个或多个,诸如1、2、3或更多个(远端)PAM错配。在实施方案中,基于测序的DSB检测测定包括用包含引物结合位点的衔接子标记DSB的位点,用条形码或唯一分子标识符或其组合标记DSB的位点,如本文别处所述。
应当理解,gRNA的指导序列与靶位点100%互补,即不包含与靶位点的任何错配。将进一步理解的是,gRNA对(脱)靶位点的“识别”以组合物、系统、功能为前提,即只有当gRNA与(脱)靶位点的结合导致组合物、系统、活性(诸如诱导单链或双链DNA切割、转录调节等)时,gRNA才能识别(脱)靶位点。
在实施方案中,在群体中具有最小序列变异的靶位点的特征在于在至少99%、%、优选至少99.9%、更优选至少99.99%的群体中不存在序列变异。在实施方案中,优化靶位置包括选择在至少99%、优选至少99.9%、更优选至少99.99%的群体中不存在序列变异的靶序列或基因座。这些靶标在本文别处也称为“铂靶标”。在实施方案中,所述群体包括至少1000个个体,诸如至少5000个个体,诸如至少10000个个体,诸如至少50000个个体。
在实施方案中,脱靶位点的特征在于脱靶位点与gRNA之间的至少一个错配。在实施方案中,脱靶位点的特征在于脱靶位点与gRNA之间的至多五个、优选至多四个、更优选至多三个错配。在实施方案中,脱靶位点的特征在于脱靶位点与gRNA之间的至少一个错配以及脱靶位点与gRNA之间的至多五个、优选至多四个、更优选至多三个错配。
在实施方案中,针对所述群体中的高频单倍型确定所述群体中的所述脱靶位点的最小数量。在实施方案中,针对所述群体中的脱靶位点基因座的高频单倍型确定所述群体中的所述脱靶位点的最小数量。在实施方案中,针对所述群体中的靶位点基因座的高频单倍型确定所述群体中所述脱靶位点的最小数量。在实施方案中,高频单倍型的特征在于在至少0.1%的群体中出现。
在实施方案中,基于低频序列变异,诸如在大规模测序数据集中捕获的低频序列变异,估计治疗群体所需的(子)选择的靶位点的数量。在实施方案中,估计治疗给定大小的群体所需的(子)选择的靶位点的数量。
在实施方案中,所述方法还包括获得待治疗受试者的基因组测序数据;以及用选自一组组合物、系统的组合物、系统治疗受试者,其中选择的组合物、系统(至少部分地)是基于个体的基因组测序数据的。在实施方案中,((子)选择的)靶标通过基因组测序,优选全基因组测序来验证。
在实施方案中,如本文所述的靶序列或基因座基于一个或多个参数的优化来(进一步)选择,所述参数诸如PAM类型(天然的或修饰的)、PAM核苷酸含量、PAM长度、靶序列长度、PAM限制性、靶切割效率以及靶序列在基因、基因座或其他基因组区域内的位置。优化方法在本文别处更详细地讨论。
在实施方案中,如本文所述的靶序列或基因座基于靶基因座位置、靶长度、靶特异性和PAM特征中的一个或多个的优化来(进一步)选择。如本文所用,PAM特征可包括例如PAM序列、PAM长度和/或PAM GC含量。在实施方案中,优化PAM特征包括优化PAM的核苷酸含量。在实施方案中,优化PAM的核苷酸含量是选择具有最大化一个或多个靶基因座中的丰度、最小化突变频率或两者的基序的PAM。例如,可通过选择没有CpG或具有低或最少CpG的PAM序列来实现最小化突变频率。
在实施方案中,组合物、系统组中的每个组合物和系统的效应蛋白基于选自由以下组成的组的一个或多个参数的优化来选择:效应蛋白大小、效应蛋白进入高染色质可及性区域的能力、跨基因组靶标的均匀酶活性程度、表观遗传耐受性、错配/凸起(budge)耐受性、效应蛋白特异性、效应蛋白稳定性或半衰期、效应蛋白免疫原性或毒性。优化方法在本文别处更详细地讨论。
系统的优化
本公开的方法可包括优化与组合物、系统和/或其功能相关联的选定参数或变量,如本文别处进一步描述的。如本文所述的方法中的组合物、系统的优化可取决于靶标(诸如一个或多个治疗靶标),组合物、系统的模式或类型,组合物、系统、组分的调节(诸如基于组合物、系统的治疗靶标调节)、修饰或操纵以及递送。根据基因型和/或表型结果,可选择一个或多个靶标。例如,可根据(遗传)疾病病因学或所需治疗结果来选择一个或多个治疗靶标。(治疗)靶标可以是单个基因、基因座或其他基因组位点,或者可以是多个基因、基因座或其他基因组位点。如本领域已知的,单个基因、基因座或其他基因组位点可被靶向多于一次,诸如通过使用多个gRNA。
组合物和/或系统,诸如疗法或治疗剂的活性可涉及靶标破坏,诸如靶标突变,诸如导致基因敲除。剪接位点的破坏或恢复是可用于设计供系统使用的供体多核苷酸的示例性方法。组合物和/或系统,诸如疗法或治疗剂的活性可涉及特定靶位点的替换,诸如导致靶标校正。疗法或治疗剂可涉及去除特定靶位点,诸如导致靶标缺失。组合物和/或系统,诸如疗法或治疗剂的活性可涉及靶位点功能的调节,诸如靶位点活性或可及性,导致例如(转录和/或表观遗传)基因或基因组区域激活或者基因或基因组区域沉默。技术人员将理解,靶位点功能的调节可涉及CRISPR效应物突变(例如像产生催化失活的CRISPR效应物)和/或功能化(例如像CRISPR效应物与异源功能性结构域(诸如转录激活子或阻遏子)的融合),如本文别处所述。
因此,在一个方面,本公开涉及一种如本文所述的方法,其包括选择一个或多个(治疗)靶标,选择组合物和/或系统的一个或多个功能,以及优化与CRISPR-Cas系统和/或其功能相关联的选定参数或变量。在一个相关方面,本公开涉及一种如本文所述的方法,其包括(a)选择一个或多个(治疗)靶基因座,(b)选择一种或多种CRISPR-Cas系统功能,(c)任选地选择一种或多种递送模式,以及制备、开发或设计基于步骤(a)至(c)选择的CRISPR-Cas系统。
在实施方案中,组合物和/或系统的功能包括基因组突变。在实施方案中,组合物和/或系统的功能包括单个基因组突变。在实施方案中,组合物和/或系统功能的功能包括多个基因组突变。在实施方案中,组合物和/或系统的功能包括基因敲除。在实施方案中,组合物和/或系统的功能包括单个基因敲除。在实施方案中,组合物和/或系统的功能包括多个基因敲除。在实施方案中,组合物和/或系统的功能包括基因校正。在实施方案中,组合物和/或系统的功能包括单个基因校正。在实施方案中,组合物和/或系统的功能包括多个基因校正。在实施方案中,组合物和/或系统的功能包括基因组区域校正。在实施方案中,组合物和/或系统的功能包括单个基因组区域校正。在实施方案中,组合物和/或系统的功能包括多个基因组区域校正。在实施方案中,组合物和/或系统的功能包括基因缺失。在实施方案中,组合物和/或系统的功能包括单个基因缺失。在实施方案中,组合物和/或系统的功能包括多个基因缺失。在实施方案中,组合物和/或系统的功能包括基因组区域缺失。在实施方案中,组合物和/或系统的功能包括单个基因组区域缺失。在实施方案中,组合物和/或系统的功能包括多个基因组区域缺失。在实施方案中,组合物和/或系统的功能包括调节基因或基因组区域功能。在实施方案中,组合物和/或系统的功能包括调节单个基因或基因组区域功能。在实施方案中,组合物和/或系统的功能包括调节多个基因或基因组区域功能。在实施方案中,组合物和/或系统的功能包括基因或基因组区域功能,诸如基因或基因组区域活性。在实施方案中,组合物和/或系统的功能包括单个基因或基因组区域功能,诸如基因或基因组区域活性。在实施方案中,组合物和/或系统的功能包括多个基因或基因组区域功能,诸如基因或基因组区域活性。在实施方案中,组合物和/或系统的功能包括调节基因活性或可及性,任选地导致转录和/或表观遗传基因或基因组区域激活或者基因或基因组区域沉默。在实施方案中,组合物和/或系统的功能包括调节单个基因活性或可及性,任选地导致转录和/或表观遗传基因或基因组区域激活或者基因或基因组区域沉默。在实施方案中,组合物和/或系统的功能包括调节多个基因活性或可及性,任选地导致转录和/或表观遗传基因或基因组区域激活或者基因或基因组区域沉默。
如本文所述的方法中的选定参数或变量的优化可导致优化或改进系统,诸如基于CRISPR-Cas系统的疗法或治疗剂、特异性、功效和/或安全性。在实施方案中,在如本文所述的本公开方法中考虑、选择或优化以下参数或变量中的一个或多个:Cas蛋白变构相互作用、Cas蛋白功能性结构域和功能性结构域相互作用、CRISPR效应物特异性、gRNA特异性、CRISPR-Cas复合物特异性、PAM限制性、PAM类型(天然的或修饰的)、PAM核苷酸含量、PAM长度、CRISPR效应物活性、gRNA活性、CRISPR-Cas复合物活性、靶切割效率、靶位点选择、靶序列长度、效应蛋白进入高染色质可及性区域的能力、基因组靶标间均匀酶活性的程度、表观遗传耐受性、错配/凸起耐受性、CRISPR效应物稳定性、CRISPR效应mRNA稳定性、gRNA稳定性、CRISPR-Cas复合物稳定性、CRISPR效应蛋白或mRNA免疫原性或毒性、gRNA免疫原性或毒性、CRISPR-Cas复合物免疫原性或毒性、CRISPR效应蛋白或mRNA剂量或滴度、gRNA剂量或滴度、CRISPR-Cas复合物剂量或滴度、CRISPR效应蛋白大小、CRISPR效应物表达水平、gRNA表达水平、CRISPR-Cas复合物表达水平、CRISPR效应物时空表达、gRNA时空表达、CRISPR-Cas复合物时空表达。
举例来讲,但不限于,参数或变量优化可如下实现。CRISPR效应物特异性可通过选择最具特异性的CRISPR效应物来优化。这可例如通过选择最具特异性的CRISPR效应物直系同源物或通过增加特异性的特定CRISPR效应物突变来实现。gRNA特异性可通过选择最具特异性的gRNA来优化。这可例如通过选择具有低同源性的gRNA(即与脱靶位点具有至少一个或优选多个,诸如至少2个、或优选至少3个错配)来实现。可通过增加如上所述的CRISPR效应物特异性和/或gRNA特异性来优化CRISPR-Cas复合物特异性。PAM限制性可通过选择具有最具限制性的PAM识别的CRISPR效应物来优化。这可例如通过选择具有更具限制性的PAM识别的CRISPR效应物直系同源物或通过增加或改变PAM限制性的具体CRISPR效应物突变来实现。可例如通过选择适当的CRISPR效应物,诸如识别所需PAM类型的适当CRISPR效应物来优化PAM类型。CRISPR效应物或PAM类型可以是天然存在的,或者可例如基于具有改变的PAM识别或PAM识别库的CRISPR效应物突变体对其进行优化。可例如通过选择适当的CRISPR效应物,诸如识别所需PAM核苷酸含量的适当CRISPR效应物来优化PAM核苷酸含量。CRISPR效应物或PAM类型可以是天然存在的,或者可例如基于具有改变的PAM识别或PAM识别库的CRISPR效应物突变体对其进行优化。可例如通过选择适当的CRISPR效应物,诸如识别所需PAM核苷酸长度的适当CRISPR效应物来优化PAM长度。CRISPR效应物或PAM类型可以是天然存在的,或者可例如基于具有改变的PAM识别或PAM识别库的CRISPR效应物突变体对其进行优化。
可例如通过选择适当的CRISPR效应物,诸如识别所需靶标或靶序列核苷酸长度的适当CRISPR效应物来优化靶标长度或靶序列长度。可替代地或另外地,可通过提供长度偏离通常与CRISPR效应物(诸如天然存在的CRISPR效应物)相关联的靶(序列)长度的靶标来优化靶(序列)长度。CRISPR效应物或靶(序列)长度可以是天然存在的,或者可例如基于具有改变的靶(序列)长度识别或靶(序列)长度识别库的CRISPR效应物突变体对其进行优化。例如,增加或减少靶(序列)长度可能影响靶标识别和/或脱靶识别。CRISPR效应物活性可通过选择最具活性的CRISPR效应物来优化。这可例如通过选择最具活性的CRISPR效应物直系同源物或通过增加活性的具体CRISPR效应物突变来实现。CRISPR效应蛋白进入高染色质可及性区域的能力可通过选择适当的CRISPR效应物或其突变体来优化,并且可考虑CRISPR效应物的大小、电荷或其他维度变量等。均匀CRISPR效应物活性的程度可通过选择适当的CRISPR效应物或其突变体来优化,并且可考虑CRISPR效应物特异性和/或活性、PAM特异性、靶标长度、错配耐受性、表观遗传耐受性、CRISPR效应物和/或gRNA稳定性和/或半衰期、CRISPR效应物和/或gRNA免疫原性和/或毒性等。gRNA活性可通过选择最具活性的gRNA来优化。在实施方案中,这可通过RNA修饰增加gRNA稳定性来实现。可通过增加如上所述的CRISPR效应物活性和/或gRNA活性来优化CRISPR-Cas复合物活性。
靶位点选择可通过选择靶位点在基因、基因座或其他基因组区域内的最佳位置来优化。靶位点选择可通过优化靶标位置来优化,包括选择具有变异性低的基因、基因座或其他基因组区域的靶序列。这可例如通过选择早期和/或保守外显子或结构域(即在群体中具有低变异性,诸如多态性)中的靶位点来实现。
在实施方案中,优化靶(序列)长度包括选择5与25个核苷酸之间的一个或多个靶基因座中的靶序列。在实施方案中,靶序列是20个核苷酸。
在实施方案中,优化靶特异性包括选择最小化脱靶候选物的靶基因座。
在实施方案中,可通过脱靶效应的最小化(例如,与靶标相比具有1至5、1至4或优选1至3个错配和/或具有一个或多个PAM错配诸如远端PAM错配的脱靶)优选还考虑群体中的变异性,来选择靶位点,。可通过选择具有适当半衰期(诸如优选地短半衰期同时仍然能够保持足够的活性)的CRISPR效应物来优化CRISPR效应物稳定性。在实施方案中,这可通过选择具有具体半衰期的适当CRISPR效应物直系同源物或通过影响半衰期或稳定性的具体CRISPR效应物突变或修饰(诸如包含(例如融合)稳定化或去稳定化结构域或序列)来实现。CRISPR效应mRNA稳定性可通过增加或降低CRISPR效应mRNA稳定性来优化。在实施方案中,这可通过mRNA修饰增加或降低CRISPR效应mRNA稳定性来实现。gRNA稳定性可通过增加或降低gRNA稳定性来优化。在实施方案中,这可通过RNA修饰增加或降低gRNA稳定性来实现。CRISPR-Cas复合物稳定性可通过如上所述增加或降低CRISPR效应物稳定性和/或gRNA稳定性来优化。CRISPR效应蛋白或mRNA免疫原性或毒性可通过降低CRISPR效应蛋白或mRNA免疫原性或毒性来优化。在实施方案中,这可通过mRNA或蛋白质修饰来实现。类似地,在基于DNA的表达系统的情况下,DNA免疫原性或毒性可能会降低。gRNA免疫原性或毒性可通过降低gRNA免疫原性或毒性来优化。在实施方案中,这可通过gRNA修饰来实现。类似地,在基于DNA的表达系统的情况下,DNA免疫原性或毒性可能会降低。CRISPR-Cas复合物免疫原性或毒性可通过如上所述降低CRISPR效应物免疫原性或毒性和/或gRNA免疫原性或毒性,或通过选择免疫原性或毒性最小的CRISPR效应物/gRNA组合来优化。类似地,在基于DNA的表达系统的情况下,DNA免疫原性或毒性可能会降低。CRISPR效应蛋白或mRNA剂量或滴度可通过选择剂量或滴度以最小化毒性和/或最大化特异性和/或功效来优化。gRNA剂量或滴度可通过选择剂量或滴度以最小化毒性和/或最大化特异性和/或功效来优化。CRISPR-Cas复合物剂量或滴度可通过选择剂量或滴度以最小化毒性和/或最大化特异性和/或功效来优化。CRISPR效应蛋白大小可通过选择最小的蛋白质大小以提高递送效率(特别是对于病毒介导的递送)来优化。CRISPR效应物、gRNA或CRISPR-Cas复合物表达水平可通过限制(或延长)表达持续时间和/或限制(或增加)表达水平来优化。这可例如通过以下方式来实现:使用自失活组合物、系统(诸如包括自靶向(例如,CRISPR效应物靶向)gRNA)、通过使用具有有限表达持续时间的病毒载体、通过使用用于低(或高)表达水平的适当启动子、通过将针对个别CRISP-Cas系统组分的不同递送方法(诸如病毒介导的CRISPR效应物编码核酸的递送)与非病毒介导的gRNA的递送结合,或病毒介导的gRNA的递送与非病毒介导的CRISPR效应蛋白或mRNA的递送结合。CRISPR效应物、gRNA或CRISPR-Cas复合物时空表达可通过适当选择条件和/或诱导表达系统(包括可控CRISPR效应物活性,任选地失稳的CRISPR效应物和/或分裂CRISPR效应物和/或细胞或组织特异性表达系统)来优化。
在一个方面,本公开涉及一种如本文所述的方法,其包括选择一个或多个(治疗性)靶标、选择组合物和/或系统的功能、选择递送模式、选择递送媒介物或表达系统,以及优化与系统和/或其功能相关联的选定参数或变量,任选地其中所述参数或变量是选自以下中的一个或多个:CRISPR效应物特异性、gRNA特异性、CRISPR-Cas复合物特异性、PAM限制性、PAM类型(天然的或修饰的)、PAM核苷酸含量、PAM长度、CRISPR效应物活性、gRNA活性、CRISPR-Cas复合物活性、靶切割效率、靶位点选择、靶序列长度、效应蛋白进入高染色质可及性区域的能力、基因组靶标间均匀酶活性的程度、表观遗传耐受性、错配/凸起耐受性、CRISPR效应物稳定性、CRISPR效应物mRNA稳定性、gRNA稳定性、CRISPR-Cas复合物稳定性、CRISPR效应蛋白或mRNA免疫原性或毒性、gRNA免疫原性或毒性、CRISPR-Cas复合物免疫原性或毒性、CRISPR效应蛋白或mRNA剂量或滴度、gRNA剂量或滴度、CRISPR-Cas复合物剂量或滴度、CRISPR效应蛋白大小、CRISPR效应物表达水平、gRNA表达水平、CRISPR-Cas复合物表达水平、CRISPR效应物时空表达、gRNA时空表达、CRISPR-Cas复合物时空表达。
应当理解,待优化的参数或变量以及优化的性质可取决于(治疗性)靶标、组合物和/或系统的功能、系统递送模式和/或递送媒介物或表达系统。
在一个方面,本公开涉及一种如本文所述的方法,其包括以群体水平优化gRNA特异性。优选地,所述优化gRNA特异性包括最小化群体中的gRNA靶位点序列变异和/或最小化群体中的gRNA脱靶发生率。
在实施方案中,优化可导致选择天然存在的或修饰的CRISPR-Cas效应物。在实施方案中,优化可导致选择具有核酸酶、切口酶、脱氨酶、转座酶和/或具有失活或消除的一种或多种效应物功能的CRISPR-Cas效应物。在实施方案中,优化PAM特异性可包括选择具有修饰的PAM特异性的CRISPR-Cas效应物。在实施方案中,优化可包括选择具有最小尺寸的CRISPR-Cas效应物。在实施方案中,优化效应物蛋白稳定性包括选择具有短半衰期同时保持足够活性的效应蛋白,诸如通过选择具有具体半衰期或稳定性的适当CRISPR效应物直系同源物。在实施方案中,优化免疫原性或毒性包括通过蛋白质修饰最小化效应蛋白免疫原性或毒性。在实施方案中,优化功能特异性包括选择对指导RNA与一个或多个靶基因座之间的错配和/或凸起的耐受性降低的蛋白质效应物。
在实施方案中,优化功效包括优化整体效率、表观遗传耐受性或两者。在实施方案中,使整体效率最大化包括选择在具有不同染色质复杂性的靶基因座上具有均匀酶活性的效应蛋白,选择酶活性限于开放染色质可及性区域的效应蛋白。在实施方案中,染色质可及性使用ATAC-seq或DNA邻近连接测定中的一种或多种来测量。在实施方案中,优化表观遗传耐受性包括优化甲基化耐受性、表观遗传标记竞争或两者。在实施方案中,优化甲基化耐受性包括选择修饰甲基化的DNA的效应蛋白。在实施方案中,优化表观遗传耐受性包括选择不能修饰染色体沉默区域的效应蛋白,选择能够修饰染色体沉默区域的效应蛋白,或选择未富集表观遗传标志物的靶基因座
在实施方案中,选择优化的指导RNA包括优化gRNA稳定性、gRNA免疫原性或两者,或如本文别处所述的其他gRNA相关参数或变量。
在实施方案中,优化gRNA稳定性和/或gRNA免疫原性包括RNA修饰,或如本文别处所述的其他gRNA相关参数或变量。在实施方案中,修饰包括从gRNA的靶互补区的3’端去除1-3个核苷酸。在实施方案中,修饰包括延伸的gRNA和/或反式RNA/DNA元件,其在gRNA中创建稳定的结构,所述结构在脱靶基因座的靶标处与gRNA碱基配对竞争;或延伸的gRNA与靶序列之间的互补核苷酸,或两者。
在实施方案中,递送模式包括递送gRNA和/或CRISPR效应蛋白、递送gRNA和/或CRISPR效应mRNA、或递送gRNA和/或CRISPR效应物作为基于DNA的表达系统。在实施方案中,递送模式还包括从由以下组成的组中选择递送媒介物和/或表达系统:脂质体、脂质粒子、纳米粒子、基因枪或基于病毒的表达/递送系统。在实施方案中,表达是时空表达,其通过选择条件和/或诱导表达系统(包括可控CRISPR效应物活性,任选地失稳的CRISPR效应物和/或分裂CRISPR效应物和/或细胞或组织特异性表达系统)来优化。
如本文所述的方法还可涉及选择递送模式。在实施方案中,gRNA(和tracr,如果需要并且在需要时,任选地作为sgRNA提供)和/或CRISPR效应蛋白被递送或将被递送。在实施方案中,gRNA(和tracr,如果需要并且在需要时,任选地作为sgRNA提供)和/或CRISPR效应mRNA被递送或将被递送。在实施方案中,在基于DNA的表达系统中提供的gRNA(和tracr,如果需要并且在需要时,任选地作为sgRNA提供)、CRISPR效应物和/或转座酶被递送或将被递送。在实施方案中,个别系统组分的递送包括上述递送模式的组合。在实施方案中,递送包括递送gRNA、CRISPR效应蛋白和/或转座酶、递送gRNA和/或CRISPR效应mRNA、或递送gRNA和/或CRISPR效应物和/或转座酶作为基于DNA的表达系统。
如本文所述的方法还可涉及选择组合物、系统递送媒介物和/或表达系统。递送媒介物和表达系统在本文别处描述。举例来讲,核酸和/或蛋白质的递送媒介物包括纳米粒子、脂质体等。对于DNA的递送媒介物,诸如基于DNA的表达系统,包括例如基因枪、基于病毒的载体系统(例如,腺病毒、AAV、慢病毒)等。技术人员将理解,递送模式以及递送媒介物或表达系统的选择可取决于例如待靶向的细胞或组织。在实施方案中,用于递送组合物、系统或其组分的递送媒介物和/或表达系统包括脂质体、脂质粒子、纳米粒子、基因枪或基于病毒的表达/递送系统。
治疗性应用的考虑因素
基因组编辑疗法中的一个考虑因素是选择序列特异性核酸酶,诸如Cas核酸酶的变体。每种核酸酶变体都可具有自己独特的优势和劣势,其中许多必须在治疗的背景下加以平衡,以最大化治疗益处。为了使具体的编辑疗法有效,必须在靶细胞群中实现足够高水平的修饰以逆转疾病症状。这种治疗性修饰“阈值”由治疗后经编辑的细胞的适应度和逆转症状必需的基因产物的量决定。关于适应度,相对于未经编辑的细胞,编辑为经处理的细胞创造了三种潜在结果:适应度增加、不变或降低。在适应度增加的情况下,校正的细胞可能能够相对于其患病的对应物进行扩增以介导治疗。在这种情况下,在经编辑的细胞具有选择性优势的情况下,即使是少量经编辑的细胞也可通过扩增进行扩增,从而为患者提供治疗益处。在经编辑的细胞的适应度没有变化的情况下,可以保证增加治疗性修饰阈值。因此,治疗疾病可能需要显著更高水平的编辑,其中相对于其中编辑增加了靶细胞的适应度的疾病而言,编辑创造了不变的适应度优势。如果编辑会造成适应度劣势,就如同恢复癌细胞中肿瘤抑制基因的功能一样,那么经修饰的细胞将与其患病的对应物竞争,从而导致治疗的益处相对于编辑率而言较低。这可通过补充疗法来克服,以增加经编辑的细胞相对于患病的对应物的效力和/或适应度。
除了细胞适应度之外,治疗疾病必需的基因产物的量也可以影响可治疗或预防疾病或其症状的治疗性基因组编辑的最低水平。在基因产物水平的微小变化可导致临床结果显著变化的情况下,治疗性基因组编辑的最低水平相对于需要基因产物水平的较大变化以获得临床相关反应的情况而言较低。在实施方案中,治疗性基因组编辑的最低水平可以在0.1%至1%、1%-5%、5%-10%、10%-15%、15%-20%、20%-25%、25%-30%、30%-35%、35%-40%、40%-45%、45%-50%或50%-55%的范围内。因此,在基因产物水平的微小变化可影响临床结果的情况下,则对于经编辑的细胞具有适应度优势的疾病,是基因组编辑疗法的理想靶标,因为治疗性修饰阈值低到足以允许很高的成功机会。
NHEJ和HDR DSB修复的活性可能因细胞类型和细胞状态而变化。NHEJ不受细胞周期的高度调控,并且跨细胞类型有效,从而允许在可接近的靶细胞群中发生高水平的基因破坏。相比之下,HDR主要在S/G2期期间发挥作用,并且因此仅限于活跃分裂的细胞,从而限制了需要对有丝分裂细胞进行精确基因组修饰的治疗[Ciccia,A.和Elledge,S.J.Molecular cell 40,179-204(2010);Chapman,J.R.等人Molecular cell 47,497-510(2012)]。
通过HDR进行校正的效率可由所靶向的基因座的表观遗传状态或序列,或使用的具体修复模板配置(单链与双链的长与短同源臂)来控制[Hacein-Bey-Abina,S.等人TheNew England journal of medicine346,1185-1193(2002);Gaspar,H.B.等人Lancet 364,2181-2187(2004);Beumer,K.J.等人G3(2013)]。NHEJ和HDR机制在靶细胞中的相对活性也可影响基因校正效率,因为这些途径可能竞争解决DSB[Beumer,K.J.等人Proceedings ofthe National Academy of Sciences of the United States of America 105,19821-19826(2008)]。HDR还带来了NHEJ策略所没有的递送挑战,因为它使用核酸酶和修复模板的同时递送。因此,在设计、优化和/或选择治疗剂时,可记住这些差异,如本文别处更详细描述的。
多核苷酸修饰应用可包括蛋白质、小RNA分子和/或修复模板的组合,并且在实施方案中,可使这些多个部分的递送比例如传统小分子治疗剂显著更具挑战性。已经开发了用于递送组合物、系统及其组分的两种主要策略:离体和体内。在离体治疗的实施方案中,从受试者中取出患病细胞,对其进行编辑,然后移植回患者体内。在其他实施方案中,采集来自健康同种异体供体的细胞,使用组合物、系统或其组分对其进行修饰,以赋予各种功能和/或降低免疫原性,并将其施用于需要治疗的同种异体受体。离体编辑的优点是允许很好地定义靶细胞群,并指定递送到细胞的治疗分子的具体剂量。当脱靶修饰是一个问题时,后一种考虑可能特别重要,因为滴定核酸酶的量可能会减少此类突变(Hsu等人,2013)。离体方法的另一个优点是可以实现典型的高编辑率,这是由于开发了将蛋白质和核酸递送到培养细胞中的有效递送系统以用于研究和基因疗法应用。
通过组合物、系统和/或其组分的体内多核苷酸修饰涉及将组合物、系统和/或其组分直接递送至其天然组织中的细胞类型。通过组合物、系统和/或其组分的体内多核苷酸修饰允许治疗其中受影响的细胞群不适合离体操纵的疾病。此外,将组合物、系统和/或其组分原位递送至细胞允许治疗多种组织和细胞类型。
在实施方案中,诸如其中病毒载体系统用于生成病毒粒子以将组合物、系统和/或其组分递送至细胞的实施方案,组合物、系统和/或其组分的总货物大小应被认为载体系统可对可从其中表达的和/或包装到病毒粒子内部的货物中的多核苷酸的大小有限制。在实施方案中,应考虑载体系统诸如病毒载体系统的趋向性,因为它可影响组合物、系统或其组分可高效和/或有效递送至其中的细胞类型。
当通过基于病毒的系统递送系统或其组分时,重要的是考虑实现治疗效果所需的病毒粒子的量,以便说明病毒粒子在递送至受试者或细胞时可能引发的潜在免疫反应。当通过基于病毒的系统递送系统或其组分时,重要的是考虑控制所述系统在体内的分布和/或剂量的机制。通常,为了减少脱靶效应的可能性,系统的量最好但不是必须要接近最小或最低有效剂量。
在实施方案中,重要的是考虑系统或其组分的免疫原性。在系统或其组分的免疫原性是一个问题的实施方案中,可降低免疫原性系统或其组分。仅举例来讲,系统或其组分的免疫原性可使用Tangri等人阐述的方法来降低。因此,定向进化或合理设计可用于降低宿主物种(人或其他物种)中CRISPR酶和/或转座酶的免疫原性。
异种移植
本公开还考虑使用本文所述的组合物和系统,例如Cas效应蛋白系统,以提供适于用于提供用于移植的修饰组织的RNA指导的DNA核酸酶。例如,RNA指导的DNA核酸酶可用于敲除、敲低或破坏动物(诸如转基因猪(诸如人血红素加氧酶-1转基因猪系))中的选定基因,例如通过破坏编码人免疫系统识别的表位的基因(即异抗原基因)的表达。例如,用于破坏的候选猪基因可包括α(l,3)-半乳糖基转移酶和胞苷单磷酸-N-乙酰神经氨酸羟化酶基因(参见国际专利公布WO 2014/066505)。另外,编码内源性逆转录病毒的基因可能被破坏,例如编码所有猪内源性逆转录病毒的基因(参见Yang等人,2015,Genome-wideinactivation of porcine endogenous retroviruses(PERVs),Science 27November2015:第350卷第6264期第1101-1104页)。另外,RNA指导的DNA核酸酶可用于靶向异种移植供体动物中额外基因(诸如人CD55基因)的整合位点,以提高对超急性排斥反应的保护作用。
本文的实施方案还涉及与敲除基因、扩增基因和修复与DNA重复不稳定性和神经病症相关的特定突变有关的方法和组合物(Robert D.Wells,Tetsuo Ashizawa,GeneticInstabilities and Neurological Diseases,Second Edition,Academic Press,2011年10月13日–Medical)。已经发现串联重复序列的特定方面导致了二十多种人类疾病(Newinsights into repeat instability:role of RNA·DNA hybrids.McIvor EI,Polak U,Napierala M.RNA Biol.2010年9月至10月;7(5):551-8)。本发明的效应蛋白系统可用来纠正基因组不稳定性的这些缺陷。
本文的几个进一步的方面涉及纠正与广泛的遗传疾病相关的缺陷,所述遗传疾病在美国国立卫生研究院的网站上的主题小节Genetic Disorders(网址在health.nih.gov/topic/GeneticDisorders)下进一步描述。遗传性脑疾病可包括但不限于肾上腺脑白质营养不良、胼胝体发育不全、艾卡尔迪综合征(Aicardi Syndrome)、阿尔佩斯病(Alpers'Disease)、阿尔茨海默氏病、巴特综合征(Barth Syndrome)、巴滕病(Batten Disease)、CADASIL、小脑变性、法布瑞氏病(Fabry'sDisease)、Gerstmann-Straussler-Scheinker病、亨廷顿氏病和其他三联体重复障碍、莱氏病(Leigh's Disease)、莱施-奈恩综合征(Lesch-Nyhan Syndrome)、门克斯病(MenkesDisease)、线粒体肌病以及NINDS空洞脑(Colpocephaly)。美国国立卫生研究院网站上的小节Genetic Brain Disorders对这些疾病进行了进一步描述。
在实施方案中,所述系统或复合物可靶向核酸分子,可靶向并切割或切口或简单地位于靶DNA分子上(具体取决于效应物是否具有使其成为缺口酶或“死”的突变)。此类系统或复合物适于实现候选疾病基因的组织特异性和时间控制的靶向缺失。实例包括但不限于参与胆固醇和脂肪酸代谢、淀粉样蛋白疾病、显性阴性疾病、潜在病毒感染等疾病的基因。因此,此类系统或复合物的靶序列可在候选疾病基因中,例如,如表6所示。
表6–疾病和靶标。
试剂盒
在另一个方面,本公开涉及试剂盒(kit)和成套试剂盒(kit of parts)。本说明书通篇使用的术语“成套试剂盒”和“试剂盒”是指含有进行具体方法(例如,如本文教导的用于检测、量化或分离免疫细胞的方法)所必需的组分将其包装以允许它们的运输和储存的产品。适用于包装试剂盒中所含组分的材料包括水晶、塑料(例如,聚乙烯、聚丙烯、聚碳酸酯)、瓶子、烧瓶、小瓶、安瓿、纸、信封或其他类型的容器、载剂或支持物。在试剂盒包含多种组分的情况下,组分的至少一个子集(例如,多种组分中的两种或更多种)或所有组分可以是物理分离的,例如包含在单独的容器、载剂或支持物中或之上。包含在试剂盒中的组分可能足以或可能不足以进行具体的方法,因此外部试剂或物质对于进行所述方法分别可能不是必需的或可能是必需的。通常,试剂盒与标准实验室设备(诸如液体处理设备、环境(例如,温度)控制设备、分析仪器等)结合使用。除了任选地提供在阵列或微阵列上的如本文教导的所述结合剂例如像抗体、杂交探针、扩增和/或测序引物之外,本发明的试剂盒还可包括可用于具体方法的一些或全部溶剂、缓冲液(例如像但不限于组氨酸缓冲液、柠檬酸盐缓冲液、琥珀酸盐缓冲液、乙酸盐缓冲液、磷酸盐缓冲液、甲酸盐缓冲液、苯甲酸盐缓冲液、TRIS(三(羟甲基)-氨基甲烷)缓冲液或马来酸盐缓冲液或其混合物)、酶(例如像但不限于热稳定性DNA聚合酶)、可检测标记、检测试剂和对照制剂(阳性和/或阴性)。通常,试剂盒还可包括其使用说明,诸如在印刷插页上或在计算机可读介质上。当在本发明的上下文中使用时,所述术语可与术语“制品”互换使用,制品广泛涵盖任何人造有形结构产品。
实施例
实施例1-示例性I-F型Cas相关转座酶系统和基因座
I-F型Cas相关转座酶系统的实例显示在下面的表7至表45中。
23319|4|ArcOceMetagenome_4_$F_3300009432|0115005_10000005|200650|Ga0115005_10000005(ID:97)
表7
24897|692|CrToilmet3SPAdes_$F_3300027742|0209121_10000693|35625|Ga0209121_10000693(ID:98)
表8
26705|1051|GOMGTlmesoSPAdes_2_$F_3300025731|a0209396_1001052|31432|Ga0209396_1001052(ID:99)
表9
27754|44|IMG_3300003980_$F_3300003980|Ga0064232_10045|134414|Ga0064232_10045(ID:100)
表10
32450|4802|Marsedof8samples_$F_3300010430|118733_100004803|40162|Ga0118733_100004803(ID:101)
表11
1697|37|MTLE01.1|MTLE01000038.1|100866|生物膜(ID:102)
表12
6215|1|OJBC01.1|OJBC01000002.1|299655|海水(ID:103)
表13
39683|0|GCA_000014885.1_ASM1488v1_genomic|CP000472.1|5396476|希瓦氏菌属(ID:104)
表14
40633|4|GCA_000153265.1_ASM15326v1_genomic|CH902601.1|492617|弧菌属(ID:105)
表15
43668|7|GCA_000238275.3_PTnd_2.0_genomic|AHCF02000042.1|218104|假交替单孢菌属(ID:106)
表16
43667|0|GCA_000238255.4_ASM23825v4_genomic|CP011039.1|3154175|假交替单孢菌属(ID:107)
表17
43674|0|GCA_000238395.4_ASM23839v4_genomic|CP011025.1|3840834|假交替单孢菌属(ID:108)
表18
45463|26|GCA_000279285.1_ASM27928v1_genomic|ALED01000027.1|1023576|弧菌属(ID:109)
表19
64545|3|GCA_000695255.1_Phalotolerans2753_genomic|JMIB01000004.1|339038|发光杆菌属(ID:110)
表20
75502|1|GCA_001048675.1_VDIABv1_PRJEB5898_genomic|CCK K01000002.1|1038212|弧菌属(ID:111)
表21
87347|8|GCA_001293805.1_ASM129380v1_genomic|BCAI01000009.1|190431|假交替单孢菌属(ID:112)
表22
98326|0|GCA_001543505.1_ASM154350v1_genomic|JNTX01000001.1|444259|弧菌属(ID:113)
表23
98597|16|GCA_001550135.1_ASM155013v1_genomic|LRTE01000024.1|519275|假交替单孢菌属(ID:114)
表24
98901|0|GCA_001558415.2_ASM155841v2_genomic|CP014034.2|1671895|弧菌属(ID:115)
表25
100329|0|GCA_001593245.1_ASM159324v1_genomic|CP012504.1|4923009|气单孢菌属(ID:116)
表26
102222|43|GCA_001639725.1_ASM163972v1_genomic|LTAW01000005.1|421676|海单胞菌属(ID:117)
表27
103676|46|GCA_001675935.1_ASM167593v1_genomic|LZFV01000047.1|194540|希瓦氏菌属(ID:118)
表28
115518|23|GCA_001957135.1_ASM195713v1_genomic|MPHK01000004.1|258247|希瓦氏菌属(ID:119)
表29
123787|44|GCA_002156475.1_ASM215647v1_genomic|MVJE01000005.1|142159|弧菌属(ID:120)
表30
151543|0|GCA_002892885.1_ASM289288v1_genomic|POSI01000001.1|744368|弧菌属(ID:121)
表31
154441|0|GCA_002966495.1_ASM296649v1_genomic|CP016490.1|3650492|盐单胞菌属(ID:122)
表32
156623|17|GCA_003025425.1_ASM302542v1_genomic|PYLX01000025.1|52401|发光杆菌属(ID:123)
表33
162445|18|GCA_003201885.1_ASM320188v1_genomic|QJJG01000019.1|128067|克雷伯氏菌属(ID:124)
表34
168540|5|GCA_003350295.1_ASM335029v1_genomic|QLYY01000006.1|327447|弧菌属(ID:125)
表35
175302|73|GCA_003585365.1_ASM358536v1_genomic|NOJI01000009.1|149461|弧菌属(ID:126)
表36
183477|22|GCA_900099955.1_IMG-taxon_2619618960_annotated_assembly_genomic|FNEF01000006.1|191976|盐单胞菌属(ID:127)
表37
186156|32|GCA_900129155.1_IMG-taxon_2582581270_annotated_assembly_genomic|FQVF01000009.1|196850|海单胞菌属(ID:128)
表38
201025|11|GCA_003675895.1_ASM367589v1_genomic|ML014764.1|87048|希瓦氏菌属(ID:129)
表39
201736|1|GCA_003691505.1_ASM369150v1_genomic|CP033138.1|2507977|弧菌属(ID:130)
表40
209559|12|GCA_003947355.1_ASM394735v1_genomic|PSZI01000003.1|412992|气单孢菌属(ID:131)
表41
212597|1|GCA_004022545.1_ASM402254v1_genomic|CP034971.1|1985753|弧菌属(ID:132)
表42
255403|0|GCA_004358445.1_ASM435844v1_genomic|CP037951.1|4222191|副希瓦氏菌属(ID:133)
表43
256296|40|GCA_004378355.1_ASM437835v1_genomic|SNTB01000030.1|42089|冷单胞菌属(ID:134)
表44
264788|117|GCA_005146805.1_ASM514680v1_genomic|SYVQ01000076.1|75705|弧菌属(ID:135)
表45
实施例2-HEK293细胞中的质粒靶向
为了确定用表达核定位信号标记的(NLS)1-F型CRISPR-Cas基因的质粒转染的细胞的转座,克隆了NLS-TnsA、NLS-TnsB、NLS-TnsC、NLS-TsnsD、NLS-Cas5/8、NLS-Cas6、NLS-Cas7、U6-crRNA,并与pDonor和pTarget质粒一起表达。72小时后收获转染的HEK 293细胞,并通过PCR,之后进行下一代测序(Illumina)来检测插入位点。以碱基对(bp)为单位的插入位点与PAM位点的距离在图1中示出。网络徽标表示插入位点中及其周围核苷酸的序列保守性(图1,插图)。
***
在不偏离本发明的范围和精神的情况下,本发明的所述方法、药物组合物和试剂盒的各种修改和更改对于本领域技术人员而言将是明显的。尽管已结合具体实施方案对本发明进行了描述,但是应当理解,能够进一步修改本发明,并且所要求保护的本发明不应当不适当地限于此类具体实施方案。实际上,用于进行本发明的所述方式的各种修改对于本领域技术人员而言是明显的,并且旨在包含在本发明的范围内。本申请旨在涵盖大体上符合本发明原理的、并且包括虽然不属于本发明所公开内容范围但属于本发明所属领域的已知的常用技术手段并可以应用于上文中阐述的必要特征中的任何变型、用途或者变更。
Claims (65)
1.一种工程化组合物,所述组合物包含:
a.一种或多种CRISPR相关Tn7转座酶;
b.一种或多种I-F型Cas蛋白;和
c.指导分子,所述指导分子能够与所述一种或多种I-F型Cas蛋白复合并引导指导物-Cas蛋白复合物与靶多核苷酸的结合。
2.如权利要求1所述的组合物,其中所述一种或多种CRISPR相关Tn7转座酶包含TnsA、TnsB、TnsC和TnsD中的一种或多种。
3.如权利要求2所述的组合物,其中所述一种或多种Tn7转座酶包含TnsA、TnsB、TnsC和TnsD。
4.如权利要求1所述的组合物,其中所述一种或多种I-F型Cas蛋白包含Cas5、Cas6、Cas7和Cas 8中的一种或多种。
5.如权利要求4所述的组合物,其中所述一种或多种I-F型Cas蛋白包含Cas5、Cas6和Cas7。
6.如权利要求4所述的组合物,其中所述一种或多种I-F型Cas蛋白包含Cas6、Cas7和Cas8。
7.如权利要求1所述的组合物,其中(a)、(b)和(c)由表7至表45中的多核苷酸编码。
8.如权利要求1所述的组合物,其中所述一种或多种I-F型Cas蛋白缺乏核酸酶活性。
9.如权利要求1所述的组合物,其还包含供体多核苷酸。
10.如权利要求9所述的组合物,其中所述供体多核苷酸是异源供体多核苷酸。
11.如权利要求9所述的组合物,其中所述供体多核苷酸包含多核苷酸插入物、左侧元件序列和右侧元件序列。
12.如权利要求9所述的组合物,其中所述供体多核苷酸:
a.向所述靶多核苷酸引入一个或多个突变,
b.在所述靶多核苷酸中校正提前终止密码子,
c.破坏剪接位点,
d.恢复剪接位点,或
e.其组合。
13.如权利要求12所述的组合物,其中由所述供体多核苷酸引入的所述一个或多个突变包括取代、缺失、插入或其组合。
14.如权利要求12所述的组合物,其中所述一个或多个突变导致所述靶多核苷酸上的开放阅读框的移位。
15.如权利要求9所述的组合物,其中所述供体多核苷酸的长度在100个碱基对与30kb之间。
16.如权利要求1所述的组合物,其还包含靶向部分。
17.如权利要求1所述的组合物,其包含能够引导所述指导物-Cas蛋白复合物与一种或多种靶多核苷酸的结合的多种指导分子。
18.如权利要求1所述的组合物,其中所述靶多核苷酸在真核细胞中。
19.一种组合物,其包含一种或多种编码以下的多核苷酸:
a.一种或多种CRISPR相关Tn7转座酶;
b.一种或多种I-F型Cas蛋白;和
c.指导分子,所述指导分子能够与所述一种或多种I-F型Cas蛋白复合并引导指导物-Cas蛋白复合物与靶多核苷酸的结合。
20.如权利要求19所述的组合物,其还包含供体多核苷酸。
21.如权利要求20所述的组合物,其中所述供体多核苷酸包含多核苷酸插入物、左侧元件序列和右侧元件序列。
22.如权利要求19所述的组合物,其中所述一种或多种多核苷酸编码如权利要求1至17中任一项所述的组分(a)至(c)。
23.如权利要求19所述的组合物,其中所述一种或多种I-F型Cas蛋白包含Cas5、Cas6、Cas7和/或Cas 8。
24.如权利要求23所述的组合物,其中所述一种或多种I-F型Cas蛋白包含Cas5、Cas6和Cas7。
25.如权利要求23所述的组合物,其中所述一种或多种I-F型Cas蛋白包含Cas6、Cas7和Cas8。
26.如权利要求23所述的组合物,其中所述一种或多种多核苷酸选自表7至表45。
27.一种载体,其包含如权利要求19至25中任一项所述的一种或多种多核苷酸。
28.一种工程化细胞,其包含如权利要求1至25中任一项所述的系统或如权利要求27所述的载体。
29.如权利要求28所述的工程化细胞,其中所述细胞产生和/或分泌内源性或非内源性生物产物或化学化合物。
30.如权利要求29所述的工程化细胞,其中所述生物产物是蛋白质或RNA。
31.一种细胞系,其包含如权利要求28所述的工程化细胞及其子代。
32.一种植物或动物,其包含如权利要求28所述的工程化细胞及其子代。
33.一种组合物,其包含如权利要求28所述的工程化细胞。
34.如权利要求33所述的组合物,其被配制用作治疗剂。
35.一种生物产物或化学化合物,其由如权利要求28所述的工程化细胞产生。
36.一种工程化细胞或其子代,所述细胞是使用如权利要求1至25中任一项所述的组合物进行工程化的。
37.如权利要求36所述的细胞或其子代,其中所述细胞包括由包含所述靶序列的基因表达的蛋白质中的突变。
38.如权利要求37所述的细胞或其子代,其中所述细胞包括包含所述靶序列的基因组区域的缺失。
39.如权利要求37所述的细胞或其子代,其中所述细胞包括通过同源定向修复对外源性序列的整合。
40.如权利要求37所述的细胞或其子代,其中所述细胞包括与所述靶序列相关联的基因的转录减少。
41.如权利要求37所述的细胞或其子代,其中所述细胞包括与所述靶序列相关联的基因的转录增加。
42.如权利要求36所述的细胞或其子代,其是分离的。
43.如权利要求36所述的细胞或其子代,其进一步用作治疗剂。
44.如权利要求36所述的细胞或其子代,从其中分离出产物。
45.一种产物,其由如权利要求36所述的细胞或其子代产生。
46.如权利要求45所述的产物,其中所述产物是蛋白质或RNA。
47.如权利要求35所述的产物,其中所述产物是突变的蛋白质或由模板提供的产物。
48.如权利要求46所述的产物,其中所述蛋白质包含突变。
49.一种用于治疗疾病或病症的药物组合物,其包含如权利要求36所述的细胞或其子代。
50.如权利要求49所述的药物组合物,其中所述治疗导致一种或多种细胞的遗传变化。
51.如权利要求49所述的药物组合物,其中所述治疗导致一种或多种缺陷基因型的校正。
52.如权利要求49所述的药物组合物,其中所述治疗导致改善的表型。
53.一种将供体多核苷酸插入细胞中的靶多核苷酸中的方法,所述方法包括向所述细胞中引入:
a.一种或多种CRISPR相关Tn7转座酶或其功能片段;
b.一种或多种I-F型Cas蛋白;
c.指导分子,所述指导分子能够与所述I-F型Cas蛋白复合并引导指导物-Cas蛋白复合物与靶多核苷酸的结合;和
d.所述供体多核苷酸。
54.如权利要求53所述的方法,其中所述供体多核苷酸:
向所述靶多核苷酸引入一个或多个突变,
在所述靶多核苷酸中校正提前终止密码子,
破坏剪接位点,
恢复剪接位点,或
其组合。
55.如权利要求54所述的方法,其中由所述供体多核苷酸引入的所述一个或多个突变包括取代、缺失、插入或其组合。
56.如权利要求54所述的方法,其中所述一个或多个突变导致所述靶多核苷酸上的开放阅读框的移位。
57.如权利要求53所述的方法,其中所述供体多核苷酸的长度在100个碱基与30kb之间。
58.如权利要求53所述的方法,其中组分(a)、(b)、(c)和(d)中的一种或多种由与调控序列可操作地连接的核酸表达。
59.如权利要求53所述的方法,其中将组分(a)、(b)、(c)和(d)中的一种或多种引入粒子中。
60.如权利要求53所述的方法,其中所述粒子包含核糖核蛋白(RNP)。
61.如权利要求53所述的方法,其中所述细胞是原核细胞。
62.如权利要求53所述的方法,其中所述细胞是真核细胞。
63.如权利要求53所述的方法,其中所述细胞是哺乳动物细胞、非人灵长类动物的细胞或人细胞。
64.如权利要求53所述的方法,其中所述细胞是植物细胞。
65.如权利要求53所述的方法,其中将所述供体多核苷酸插入所述细胞中的所述靶多核苷酸中导致:
包含改变的表达水平的一种或多种基因产物的细胞或细胞群;
产生和/或分泌内源性或非内源性生物产物或化学化合物的细胞或细胞群。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063089220P | 2020-10-08 | 2020-10-08 | |
US63/089,220 | 2020-10-08 | ||
PCT/US2021/054190 WO2022076830A1 (en) | 2020-10-08 | 2021-10-08 | Type i crispr-associated transposase systems |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116234918A true CN116234918A (zh) | 2023-06-06 |
Family
ID=81126112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180072877.XA Pending CN116234918A (zh) | 2020-10-08 | 2021-10-08 | I型crispr相关转座酶系统 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20230383315A1 (zh) |
EP (1) | EP4204562A1 (zh) |
JP (1) | JP2023544822A (zh) |
CN (1) | CN116234918A (zh) |
AU (1) | AU2021356560A1 (zh) |
CA (1) | CA3194645A1 (zh) |
WO (1) | WO2022076830A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117363554B (zh) * | 2023-12-08 | 2024-04-09 | 清华大学 | 一种工程改造的嗜盐微生物及其构建方法和应用 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113544266A (zh) * | 2018-12-17 | 2021-10-22 | 博德研究所 | Crispr相关转座酶系统和其使用方法 |
CA3132197A1 (en) * | 2019-03-07 | 2020-09-10 | The Trustees Of Columbia University In The City Of New York | Rna-guided dna integration using tn7-like transposons |
-
2021
- 2021-10-08 CN CN202180072877.XA patent/CN116234918A/zh active Pending
- 2021-10-08 EP EP21878622.6A patent/EP4204562A1/en active Pending
- 2021-10-08 JP JP2023521484A patent/JP2023544822A/ja active Pending
- 2021-10-08 US US18/248,252 patent/US20230383315A1/en active Pending
- 2021-10-08 CA CA3194645A patent/CA3194645A1/en active Pending
- 2021-10-08 WO PCT/US2021/054190 patent/WO2022076830A1/en active Application Filing
- 2021-10-08 AU AU2021356560A patent/AU2021356560A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230383315A1 (en) | 2023-11-30 |
WO2022076830A1 (en) | 2022-04-14 |
JP2023544822A (ja) | 2023-10-25 |
EP4204562A1 (en) | 2023-07-05 |
AU2021356560A1 (en) | 2023-06-08 |
CA3194645A1 (en) | 2022-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115175996A (zh) | 新颖vi型crispr酶和系统 | |
WO2019126716A1 (en) | Cas12b systems, methods, and compositions for targeted rna base editing | |
KR20200031618A (ko) | 표적화된 핵산 편집을 위한 crispr/cas-아데닌 데아미나아제 기반 조성물, 시스템 및 방법 | |
WO2021102042A1 (en) | Retrotransposons and use thereof | |
WO2020236972A2 (en) | Non-class i multi-component nucleic acid targeting systems | |
WO2021062410A2 (en) | Programmable polynucleotide editors for enhanced homologous recombination | |
WO2022087494A1 (en) | Reprogrammable iscb nucleases and uses thereof | |
WO2021097118A1 (en) | Small type ii cas proteins and methods of use thereof | |
WO2022173830A1 (en) | Nuclease-guided non-ltr retrotransposons and uses thereof | |
WO2020236967A1 (en) | Random crispr-cas deletion mutant | |
WO2023097228A1 (en) | Reprogrammable iscb nucleases and uses thereof | |
WO2022147321A1 (en) | Type i-b crispr-associated transposase systems | |
AU2022206308A1 (en) | Dna nuclease guided transposase compositions and methods of use thereof | |
CN116583599A (zh) | 可重编程IscB核酸酶及其用途 | |
AU2020373064A1 (en) | Type I-B CRISPR-associated transposase systems | |
WO2021173734A1 (en) | Novel type iv and type i crispr-cas systems and methods of use thereof | |
CN116234918A (zh) | I型crispr相关转座酶系统 | |
WO2021041922A1 (en) | Crispr-associated mu transposase systems | |
EP4214224A1 (en) | T-dna mediated genetic modification | |
WO2022087451A1 (en) | Nucleic acid-guided nucleases and use thereof | |
WO2023170535A2 (en) | Novel nucleic acid-guided nucleases and use thereof | |
WO2024015920A1 (en) | Hybrid crispr-cas systems and methods of use thereof | |
WO2023097224A1 (en) | Reprogrammable isrb nucleases and uses thereof | |
WO2023230483A2 (en) | Engineered chimeric iscb polypeptides and uses thereof | |
WO2024030961A2 (en) | Type lb crispr-associated transposase systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |