CN117280024A - 用于涉及脱氨作用的基因组编辑的多核苷酸、组合物和方法 - Google Patents
用于涉及脱氨作用的基因组编辑的多核苷酸、组合物和方法 Download PDFInfo
- Publication number
- CN117280024A CN117280024A CN202180093243.2A CN202180093243A CN117280024A CN 117280024 A CN117280024 A CN 117280024A CN 202180093243 A CN202180093243 A CN 202180093243A CN 117280024 A CN117280024 A CN 117280024A
- Authority
- CN
- China
- Prior art keywords
- sequence
- chr7
- mrna
- cell
- composition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000203 mixture Substances 0.000 title claims abstract description 173
- 238000000034 method Methods 0.000 title claims abstract description 170
- 238000010362 genome editing Methods 0.000 title claims abstract description 8
- 102000040430 polynucleotide Human genes 0.000 title abstract description 13
- 108091033319 polynucleotide Proteins 0.000 title abstract description 13
- 239000002157 polynucleotide Substances 0.000 title abstract description 13
- 230000009615 deamination Effects 0.000 title abstract description 5
- 238000006481 deamination reaction Methods 0.000 title abstract description 5
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 351
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 329
- 229920001184 polypeptide Polymers 0.000 claims abstract description 326
- 102000004190 Enzymes Human genes 0.000 claims abstract description 277
- 108090000790 Enzymes Proteins 0.000 claims abstract description 277
- 108020004999 messenger RNA Proteins 0.000 claims abstract description 252
- 108010031325 Cytidine deaminase Proteins 0.000 claims abstract description 120
- 102100026846 Cytidine deaminase Human genes 0.000 claims abstract description 120
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims abstract description 103
- 108700026244 Open Reading Frames Proteins 0.000 claims abstract description 100
- 229940035893 uracil Drugs 0.000 claims abstract description 51
- 239000003316 glycosidase inhibitor Substances 0.000 claims abstract description 42
- 229940122069 Glycosidase inhibitor Drugs 0.000 claims abstract description 39
- 125000003729 nucleotide group Chemical group 0.000 claims description 286
- 239000002773 nucleotide Substances 0.000 claims description 268
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 256
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 256
- 108020005004 Guide RNA Proteins 0.000 claims description 225
- 210000004027 cell Anatomy 0.000 claims description 217
- 230000004048 modification Effects 0.000 claims description 170
- 238000012986 modification Methods 0.000 claims description 170
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 claims description 143
- 108090000623 proteins and genes Proteins 0.000 claims description 136
- 102000039446 nucleic acids Human genes 0.000 claims description 130
- 108020004707 nucleic acids Proteins 0.000 claims description 130
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 110
- 150000007523 nucleic acids Chemical class 0.000 claims description 97
- -1 lipid nucleic acid Chemical class 0.000 claims description 94
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 claims description 88
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 claims description 88
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 82
- 108020004705 Codon Proteins 0.000 claims description 81
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 claims description 79
- 102220605872 Cytosolic arginine sensor for mTORC1 subunit 2_D16A_mutation Human genes 0.000 claims description 72
- 150000002632 lipids Chemical class 0.000 claims description 70
- 108091033409 CRISPR Proteins 0.000 claims description 66
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 63
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 claims description 56
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 claims description 56
- 229940045145 uridine Drugs 0.000 claims description 56
- 241000282414 Homo sapiens Species 0.000 claims description 51
- 230000008685 targeting Effects 0.000 claims description 45
- 229930024421 Adenine Natural products 0.000 claims description 37
- 229960000643 adenine Drugs 0.000 claims description 37
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 35
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 31
- 229940024606 amino acid Drugs 0.000 claims description 30
- 150000001413 amino acids Chemical class 0.000 claims description 29
- 230000014509 gene expression Effects 0.000 claims description 29
- 238000006243 chemical reaction Methods 0.000 claims description 28
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 21
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 20
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 claims description 19
- 102100029452 T cell receptor alpha chain constant Human genes 0.000 claims description 19
- 108010075704 HLA-A Antigens Proteins 0.000 claims description 15
- 102100026371 MHC class II transactivator Human genes 0.000 claims description 15
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 claims description 15
- 230000002829 reductive effect Effects 0.000 claims description 14
- 102100028972 HLA class I histocompatibility antigen, A alpha chain Human genes 0.000 claims description 13
- 101100382122 Homo sapiens CIITA gene Proteins 0.000 claims description 13
- 108700002010 MHC class II transactivator Proteins 0.000 claims description 13
- 241000193996 Streptococcus pyogenes Species 0.000 claims description 13
- 230000035772 mutation Effects 0.000 claims description 13
- 241000124008 Mammalia Species 0.000 claims description 12
- 102100037272 T cell receptor beta constant 1 Human genes 0.000 claims description 11
- 238000012217 deletion Methods 0.000 claims description 11
- 230000037430 deletion Effects 0.000 claims description 11
- 238000003780 insertion Methods 0.000 claims description 11
- 230000037431 insertion Effects 0.000 claims description 11
- 239000002105 nanoparticle Substances 0.000 claims description 11
- 108091054438 MHC class II family Proteins 0.000 claims description 10
- 238000013519 translation Methods 0.000 claims description 10
- 108091026898 Leader sequence (mRNA) Proteins 0.000 claims description 9
- 241000588650 Neisseria meningitidis Species 0.000 claims description 9
- 239000003795 chemical substances by application Substances 0.000 claims description 9
- 239000000126 substance Substances 0.000 claims description 9
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 claims description 8
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 claims description 8
- 101000662909 Homo sapiens T cell receptor beta constant 1 Proteins 0.000 claims description 8
- 102000043131 MHC class II family Human genes 0.000 claims description 8
- 108091036066 Three prime untranslated region Proteins 0.000 claims description 8
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 claims description 8
- 229940104302 cytosine Drugs 0.000 claims description 8
- 238000001727 in vivo Methods 0.000 claims description 8
- 102100027314 Beta-2-microglobulin Human genes 0.000 claims description 7
- 102000043129 MHC class I family Human genes 0.000 claims description 7
- 108091054437 MHC class I family Proteins 0.000 claims description 7
- 229940113082 thymine Drugs 0.000 claims description 7
- 101150077194 CAP1 gene Proteins 0.000 claims description 6
- 101150014715 CAP2 gene Proteins 0.000 claims description 6
- 239000013612 plasmid Substances 0.000 claims description 6
- 229920000642 polymer Polymers 0.000 claims description 6
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 claims description 5
- ZXIATBNUWJBBGT-JXOAFFINSA-N 5-methoxyuridine Chemical compound O=C1NC(=O)C(OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXIATBNUWJBBGT-JXOAFFINSA-N 0.000 claims description 5
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 5
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 5
- 108091027544 Subgenomic mRNA Proteins 0.000 claims description 5
- 230000007935 neutral effect Effects 0.000 claims description 5
- 239000008194 pharmaceutical composition Substances 0.000 claims description 4
- 230000002441 reversible effect Effects 0.000 claims description 4
- RKSLVDIXBGWPIS-UAKXSSHOSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 RKSLVDIXBGWPIS-UAKXSSHOSA-N 0.000 claims description 3
- 239000003814 drug Substances 0.000 claims description 3
- 101100438378 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) fac-1 gene Proteins 0.000 claims description 2
- AGWRKMKSPDCRHI-UHFFFAOYSA-K [[5-(2-amino-7-methyl-6-oxo-1H-purin-9-ium-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-oxidophosphoryl] [[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-oxidophosphoryl]oxy-5-(6-aminopurin-9-yl)-4-methoxyoxolan-2-yl]methoxy-oxidophosphoryl] phosphate Chemical compound COC1C(OP([O-])(=O)OCC2OC(C(O)C2O)N2C=NC3=C2N=C(N)NC3=O)C(COP([O-])(=O)OP([O-])(=O)OP([O-])(=O)OCC2OC(C(O)C2O)N2C=[N+](C)C3=C2N=C(N)NC3=O)OC1N1C=NC2=C1N=CN=C2N AGWRKMKSPDCRHI-UHFFFAOYSA-K 0.000 claims description 2
- 230000002255 enzymatic effect Effects 0.000 claims description 2
- 230000008488 polyadenylation Effects 0.000 claims description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 claims 6
- 101000937544 Homo sapiens Beta-2-microglobulin Proteins 0.000 claims 5
- 238000012239 gene modification Methods 0.000 claims 5
- 230000005017 genetic modification Effects 0.000 claims 5
- 235000013617 genetically modified food Nutrition 0.000 claims 5
- NRJAVPSFFCBXDT-HUESYALOSA-N 1,2-distearoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCCCC NRJAVPSFFCBXDT-HUESYALOSA-N 0.000 claims 3
- 101150053558 TRBC1 gene Proteins 0.000 claims 3
- 235000012000 cholesterol Nutrition 0.000 claims 3
- 101150117561 TRBC2 gene Proteins 0.000 claims 2
- 238000009169 immunotherapy Methods 0.000 claims 2
- 210000004698 lymphocyte Anatomy 0.000 claims 2
- 101150028074 2 gene Proteins 0.000 claims 1
- 101000582254 Homo sapiens Nuclear receptor corepressor 2 Proteins 0.000 claims 1
- 101100326803 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) fac-2 gene Proteins 0.000 claims 1
- 239000003937 drug carrier Substances 0.000 claims 1
- 210000002865 immune cell Anatomy 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 claims 1
- 229940088598 enzyme Drugs 0.000 description 230
- 125000005647 linker group Chemical group 0.000 description 149
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 description 82
- 102000004169 proteins and genes Human genes 0.000 description 62
- 235000018102 proteins Nutrition 0.000 description 60
- 235000001014 amino acid Nutrition 0.000 description 38
- 101710163270 Nuclease Proteins 0.000 description 36
- 235000000346 sugar Nutrition 0.000 description 30
- 238000006467 substitution reaction Methods 0.000 description 26
- 108020004414 DNA Proteins 0.000 description 23
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 22
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 22
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 21
- 230000004927 fusion Effects 0.000 description 19
- 230000000875 corresponding effect Effects 0.000 description 14
- 230000000694 effects Effects 0.000 description 14
- 238000011282 treatment Methods 0.000 description 14
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 13
- 230000000295 complement effect Effects 0.000 description 12
- 241000906059 Bacillus pseudomycoides Species 0.000 description 11
- 241000894006 Bacteria Species 0.000 description 11
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 11
- 210000004899 c-terminal region Anatomy 0.000 description 11
- 229940104230 thymidine Drugs 0.000 description 11
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 10
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 10
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 10
- DHKHKXVYLBGOIT-UHFFFAOYSA-N acetaldehyde Diethyl Acetal Natural products CCOC(C)OCC DHKHKXVYLBGOIT-UHFFFAOYSA-N 0.000 description 10
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 10
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 10
- 125000003835 nucleoside group Chemical group 0.000 description 10
- 230000030648 nucleus localization Effects 0.000 description 10
- 238000011191 terminal modification Methods 0.000 description 10
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 9
- 229930185560 Pseudouridine Natural products 0.000 description 9
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 9
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 9
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 9
- 230000000712 assembly Effects 0.000 description 9
- 238000000429 assembly Methods 0.000 description 9
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 9
- 210000000056 organ Anatomy 0.000 description 9
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 9
- 210000001519 tissue Anatomy 0.000 description 9
- 238000012384 transportation and delivery Methods 0.000 description 9
- 241000699670 Mus sp. Species 0.000 description 8
- 108020004566 Transfer RNA Proteins 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 239000002777 nucleoside Substances 0.000 description 8
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 8
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 7
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 7
- 108090000848 Ubiquitin Proteins 0.000 description 7
- 102000044159 Ubiquitin Human genes 0.000 description 7
- 150000001241 acetals Chemical class 0.000 description 7
- 125000004429 atom Chemical group 0.000 description 7
- 229910052799 carbon Inorganic materials 0.000 description 7
- 230000003197 catalytic effect Effects 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- 108020001507 fusion proteins Proteins 0.000 description 7
- 102000037865 fusion proteins Human genes 0.000 description 7
- 210000004185 liver Anatomy 0.000 description 7
- 102000005962 receptors Human genes 0.000 description 7
- 108020003175 receptors Proteins 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 208000035657 Abasia Diseases 0.000 description 6
- 241000620196 Arthrospira maxima Species 0.000 description 6
- 238000010354 CRISPR gene editing Methods 0.000 description 6
- 238000010453 CRISPR/Cas method Methods 0.000 description 6
- 101000662902 Homo sapiens T cell receptor beta constant 2 Proteins 0.000 description 6
- 102100037298 T cell receptor beta constant 2 Human genes 0.000 description 6
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 238000003197 gene knockdown Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 108700028369 Alleles Proteins 0.000 description 5
- 101100260872 Mus musculus Tmprss4 gene Proteins 0.000 description 5
- FZWGECJQACGGTI-UHFFFAOYSA-N N7-methylguanine Natural products NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 5
- 108091093037 Peptide nucleic acid Proteins 0.000 description 5
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 5
- 125000000217 alkyl group Chemical group 0.000 description 5
- 230000027455 binding Effects 0.000 description 5
- 108091006047 fluorescent proteins Proteins 0.000 description 5
- 102000034287 fluorescent proteins Human genes 0.000 description 5
- 230000002401 inhibitory effect Effects 0.000 description 5
- 150000004713 phosphodiesters Chemical class 0.000 description 5
- 125000001424 substituent group Chemical group 0.000 description 5
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- 241001478240 Coccus Species 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 108010070675 Glutathione transferase Proteins 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 101150118346 HLA-A gene Proteins 0.000 description 4
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 4
- 241000282412 Homo Species 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- 101100245221 Mus musculus Prss8 gene Proteins 0.000 description 4
- 239000002202 Polyethylene glycol Substances 0.000 description 4
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 description 4
- 241000191967 Staphylococcus aureus Species 0.000 description 4
- 108091081024 Start codon Proteins 0.000 description 4
- 230000005782 double-strand break Effects 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 210000005228 liver tissue Anatomy 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 210000004940 nucleus Anatomy 0.000 description 4
- 229920001223 polyethylene glycol Polymers 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 150000008163 sugars Chemical class 0.000 description 4
- 101150060590 ANAPC5 gene Proteins 0.000 description 3
- 102000052588 Anaphase-Promoting Complex-Cyclosome Apc5 Subunit Human genes 0.000 description 3
- 108700004604 Anaphase-Promoting Complex-Cyclosome Apc5 Subunit Proteins 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 241000270722 Crocodylidae Species 0.000 description 3
- 241000701022 Cytomegalovirus Species 0.000 description 3
- 238000010442 DNA editing Methods 0.000 description 3
- 230000004568 DNA-binding Effects 0.000 description 3
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 3
- 102100028976 HLA class I histocompatibility antigen, B alpha chain Human genes 0.000 description 3
- 102100028971 HLA class I histocompatibility antigen, C alpha chain Human genes 0.000 description 3
- 108010058607 HLA-B Antigens Proteins 0.000 description 3
- 108010052199 HLA-C Antigens Proteins 0.000 description 3
- 102100039855 Histone H1.2 Human genes 0.000 description 3
- 102100027368 Histone H1.3 Human genes 0.000 description 3
- 101001035375 Homo sapiens Histone H1.2 Proteins 0.000 description 3
- 101001009450 Homo sapiens Histone H1.3 Proteins 0.000 description 3
- 101000897979 Homo sapiens Putative spermatid-specific linker histone H1-like protein Proteins 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 101150065592 NME2 gene Proteins 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 102100021861 Putative spermatid-specific linker histone H1-like protein Human genes 0.000 description 3
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 3
- 241000700159 Rattus Species 0.000 description 3
- 108091028664 Ribonucleotide Proteins 0.000 description 3
- 241000194017 Streptococcus Species 0.000 description 3
- 241000187747 Streptomyces Species 0.000 description 3
- 108091028113 Trans-activating crRNA Proteins 0.000 description 3
- 101710172430 Uracil-DNA glycosylase inhibitor Proteins 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 239000007864 aqueous solution Substances 0.000 description 3
- 101150010487 are gene Proteins 0.000 description 3
- 125000003118 aryl group Chemical group 0.000 description 3
- 235000009582 asparagine Nutrition 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- 230000033590 base-excision repair Effects 0.000 description 3
- 239000011230 binding agent Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 101150090505 cas10 gene Proteins 0.000 description 3
- 101150038500 cas9 gene Proteins 0.000 description 3
- 108020001778 catalytic domains Proteins 0.000 description 3
- 238000012054 celltiter-glo Methods 0.000 description 3
- 125000000753 cycloalkyl group Chemical group 0.000 description 3
- LNNWVNGFPYWNQE-GMIGKAJZSA-N desomorphine Chemical compound C1C2=CC=C(O)C3=C2[C@]24CCN(C)[C@H]1[C@@H]2CCC[C@@H]4O3 LNNWVNGFPYWNQE-GMIGKAJZSA-N 0.000 description 3
- 230000009274 differential gene expression Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 239000012636 effector Substances 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 238000000684 flow cytometry Methods 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000011987 methylation Effects 0.000 description 3
- 238000007069 methylation reaction Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 235000021317 phosphate Nutrition 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 150000003212 purines Chemical class 0.000 description 3
- 150000003230 pyrimidines Chemical class 0.000 description 3
- 239000002336 ribonucleotide Substances 0.000 description 3
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 3
- 125000006850 spacer group Chemical group 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 2
- 125000004200 2-methoxyethyl group Chemical group [H]C([H])([H])OC([H])([H])C([H])([H])* 0.000 description 2
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 2
- 102100031585 ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Human genes 0.000 description 2
- 108010029988 AICDA (activation-induced cytidine deaminase) Proteins 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 102000007592 Apolipoproteins Human genes 0.000 description 2
- 108010071619 Apolipoproteins Proteins 0.000 description 2
- 101710201279 Biotin carboxyl carrier protein Proteins 0.000 description 2
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 2
- 241000589875 Campylobacter jejuni Species 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 241000193163 Clostridioides difficile Species 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 101100329224 Coprinopsis cinerea (strain Okayama-7 / 130 / ATCC MYA-4618 / FGSC 9003) cpf1 gene Proteins 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 2
- 102000001301 EGF receptor Human genes 0.000 description 2
- 108060006698 EGF receptor Proteins 0.000 description 2
- 101900341982 Escherichia coli Uracil-DNA glycosylase Proteins 0.000 description 2
- 241000589601 Francisella Species 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 108010058597 HLA-DR Antigens Proteins 0.000 description 2
- 102000006354 HLA-DR Antigens Human genes 0.000 description 2
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 2
- 101000777636 Homo sapiens ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Proteins 0.000 description 2
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 description 2
- 101001082063 Homo sapiens Interferon-induced protein with tetratricopeptide repeats 5 Proteins 0.000 description 2
- 101000634835 Homo sapiens M1-specific T cell receptor alpha chain Proteins 0.000 description 2
- 101000983747 Homo sapiens MHC class II transactivator Proteins 0.000 description 2
- 101000844027 Homo sapiens Probable non-functional T cell receptor beta variable 7-3 Proteins 0.000 description 2
- 101000634836 Homo sapiens T cell receptor alpha chain MC.7.G5 Proteins 0.000 description 2
- 101000844037 Homo sapiens T cell receptor beta variable 10-1 Proteins 0.000 description 2
- 101000844038 Homo sapiens T cell receptor beta variable 10-2 Proteins 0.000 description 2
- 101000844035 Homo sapiens T cell receptor beta variable 10-3 Proteins 0.000 description 2
- 101000844036 Homo sapiens T cell receptor beta variable 11-1 Proteins 0.000 description 2
- 101000844034 Homo sapiens T cell receptor beta variable 11-2 Proteins 0.000 description 2
- 101000939856 Homo sapiens T cell receptor beta variable 11-3 Proteins 0.000 description 2
- 101000939858 Homo sapiens T cell receptor beta variable 12-4 Proteins 0.000 description 2
- 101000939743 Homo sapiens T cell receptor beta variable 12-5 Proteins 0.000 description 2
- 101000658388 Homo sapiens T cell receptor beta variable 13 Proteins 0.000 description 2
- 101000939742 Homo sapiens T cell receptor beta variable 20-1 Proteins 0.000 description 2
- 101000939745 Homo sapiens T cell receptor beta variable 24-1 Proteins 0.000 description 2
- 101000939744 Homo sapiens T cell receptor beta variable 25-1 Proteins 0.000 description 2
- 101000658404 Homo sapiens T cell receptor beta variable 29-1 Proteins 0.000 description 2
- 101000658429 Homo sapiens T cell receptor beta variable 3-1 Proteins 0.000 description 2
- 101000606201 Homo sapiens T cell receptor beta variable 4-1 Proteins 0.000 description 2
- 101000606207 Homo sapiens T cell receptor beta variable 4-2 Proteins 0.000 description 2
- 101000606206 Homo sapiens T cell receptor beta variable 4-3 Proteins 0.000 description 2
- 101000606209 Homo sapiens T cell receptor beta variable 5-4 Proteins 0.000 description 2
- 101000606208 Homo sapiens T cell receptor beta variable 5-5 Proteins 0.000 description 2
- 101000606214 Homo sapiens T cell receptor beta variable 5-6 Proteins 0.000 description 2
- 101000606212 Homo sapiens T cell receptor beta variable 5-8 Proteins 0.000 description 2
- 101000606218 Homo sapiens T cell receptor beta variable 6-1 Proteins 0.000 description 2
- 101000606217 Homo sapiens T cell receptor beta variable 6-2 Proteins 0.000 description 2
- 101000606216 Homo sapiens T cell receptor beta variable 6-3 Proteins 0.000 description 2
- 101000606215 Homo sapiens T cell receptor beta variable 6-4 Proteins 0.000 description 2
- 101000606220 Homo sapiens T cell receptor beta variable 6-5 Proteins 0.000 description 2
- 101000606219 Homo sapiens T cell receptor beta variable 6-6 Proteins 0.000 description 2
- 101000844026 Homo sapiens T cell receptor beta variable 7-2 Proteins 0.000 description 2
- 101000844024 Homo sapiens T cell receptor beta variable 7-4 Proteins 0.000 description 2
- 101000844025 Homo sapiens T cell receptor beta variable 7-6 Proteins 0.000 description 2
- 101000844023 Homo sapiens T cell receptor beta variable 7-7 Proteins 0.000 description 2
- 101000844021 Homo sapiens T cell receptor beta variable 7-8 Proteins 0.000 description 2
- 101000844022 Homo sapiens T cell receptor beta variable 7-9 Proteins 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 102100027355 Interferon-induced protein with tetratricopeptide repeats 1 Human genes 0.000 description 2
- 101710166699 Interferon-induced protein with tetratricopeptide repeats 1 Proteins 0.000 description 2
- 102100027356 Interferon-induced protein with tetratricopeptide repeats 5 Human genes 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 241000186606 Lactobacillus gasseri Species 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 108060001084 Luciferase Proteins 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 102100026964 M1-specific T cell receptor beta chain Human genes 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 241000192041 Micrococcus Species 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 241001495402 Nitrococcus Species 0.000 description 2
- 108091005461 Nucleic proteins Chemical group 0.000 description 2
- WSDRAZIPGVLSNP-UHFFFAOYSA-N O.P(=O)(O)(O)O.O.O.P(=O)(O)(O)O Chemical compound O.P(=O)(O)(O)O.O.O.P(=O)(O)(O)O WSDRAZIPGVLSNP-UHFFFAOYSA-N 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 108010029485 Protein Isoforms Proteins 0.000 description 2
- 102000001708 Protein Isoforms Human genes 0.000 description 2
- 241000588769 Proteus <enterobacteria> Species 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 108020005067 RNA Splice Sites Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 241000190984 Rhodospirillum rubrum Species 0.000 description 2
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 description 2
- 108010043401 Small Ubiquitin-Related Modifier Proteins Proteins 0.000 description 2
- 102000002669 Small Ubiquitin-Related Modifier Proteins Human genes 0.000 description 2
- 241000194020 Streptococcus thermophilus Species 0.000 description 2
- 102100029656 T cell receptor beta variable 24-1 Human genes 0.000 description 2
- 108091008874 T cell receptors Proteins 0.000 description 2
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 2
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 2
- 241000186339 Thermoanaerobacter Species 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- 102100027266 Ubiquitin-like protein ISG15 Human genes 0.000 description 2
- 206010046865 Vaccinia virus infection Diseases 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 125000003545 alkoxy group Chemical group 0.000 description 2
- 108010087408 alpha-beta T-Cell Antigen Receptors Proteins 0.000 description 2
- 125000003710 aryl alkyl group Chemical group 0.000 description 2
- 108010081355 beta 2-Microglobulin Proteins 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 101150059443 cas12a gene Proteins 0.000 description 2
- 239000006143 cell culture medium Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 238000011260 co-administration Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- 125000005843 halogen group Chemical group 0.000 description 2
- 210000003494 hepatocyte Anatomy 0.000 description 2
- 125000001072 heteroaryl group Chemical group 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 210000005007 innate immune system Anatomy 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 238000012913 prioritisation Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000004850 protein–protein interaction Effects 0.000 description 2
- 230000017854 proteolysis Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000010381 tandem affinity purification Methods 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 229940094937 thioredoxin Drugs 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 208000007089 vaccinia Diseases 0.000 description 2
- BSDCIRGNJKZPFV-GWOFURMSSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-(2,5,6-trichlorobenzimidazol-1-yl)oxolane-3,4-diol Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=CC(Cl)=C(Cl)C=C2N=C1Cl BSDCIRGNJKZPFV-GWOFURMSSA-N 0.000 description 1
- OJHZNMVJJKMFGX-RNWHKREASA-N (4r,4ar,7ar,12bs)-9-methoxy-3-methyl-1,2,4,4a,5,6,7a,13-octahydro-4,12-methanobenzofuro[3,2-e]isoquinoline-7-one;2,3-dihydroxybutanedioic acid Chemical compound OC(=O)C(O)C(O)C(O)=O.O=C([C@@H]1O2)CC[C@H]3[C@]4([H])N(C)CC[C@]13C1=C2C(OC)=CC=C1C4 OJHZNMVJJKMFGX-RNWHKREASA-N 0.000 description 1
- 125000006273 (C1-C3) alkyl group Chemical group 0.000 description 1
- 125000006274 (C1-C3)alkoxy group Chemical group 0.000 description 1
- 125000003161 (C1-C6) alkylene group Chemical group 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- MGAXHFMCFLLMNG-UHFFFAOYSA-N 1h-pyrimidine-6-thione Chemical compound SC1=CC=NC=N1 MGAXHFMCFLLMNG-UHFFFAOYSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- 102100038837 2-Hydroxyacid oxidase 1 Human genes 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- ROGPOEHBDKFHIE-WGDKSQQYSA-N 2-amino-9-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]-3h-purin-6-one Chemical compound C1=NC(C(NC(N)=N2)=O)=C2N1[C@@]1(C)C[C@H](O)[C@@H](CO)O1 ROGPOEHBDKFHIE-WGDKSQQYSA-N 0.000 description 1
- KQPKMEYBZUPZGK-UHFFFAOYSA-N 4-[(4-azido-2-nitroanilino)methyl]-5-(hydroxymethyl)-2-methylpyridin-3-ol Chemical compound CC1=NC=C(CO)C(CNC=2C(=CC(=CC=2)N=[N+]=[N-])[N+]([O-])=O)=C1O KQPKMEYBZUPZGK-UHFFFAOYSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- XZLIYCQRASOFQM-UHFFFAOYSA-N 5h-imidazo[4,5-d]triazine Chemical compound N1=NC=C2NC=NC2=N1 XZLIYCQRASOFQM-UHFFFAOYSA-N 0.000 description 1
- BXJHWYVXLGLDMZ-UHFFFAOYSA-N 6-O-methylguanine Chemical compound COC1=NC(N)=NC2=C1NC=N2 BXJHWYVXLGLDMZ-UHFFFAOYSA-N 0.000 description 1
- ZAOGIVYOCDXEAK-UHFFFAOYSA-N 6-n-methyl-7h-purine-2,6-diamine Chemical compound CNC1=NC(N)=NC2=C1NC=N2 ZAOGIVYOCDXEAK-UHFFFAOYSA-N 0.000 description 1
- 102000012758 APOBEC-1 Deaminase Human genes 0.000 description 1
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 1
- 101001082110 Acanthamoeba polyphaga mimivirus Eukaryotic translation initiation factor 4E homolog Proteins 0.000 description 1
- 241000007910 Acaryochloris marina Species 0.000 description 1
- 241000589220 Acetobacter Species 0.000 description 1
- 241001135192 Acetohalobium arabaticum Species 0.000 description 1
- 241001290773 Acidiphilium acidophilum Species 0.000 description 1
- 241001464929 Acidithiobacillus caldus Species 0.000 description 1
- 102100022900 Actin, cytoplasmic 1 Human genes 0.000 description 1
- 235000009434 Actinidia chinensis Nutrition 0.000 description 1
- 244000298697 Actinidia deliciosa Species 0.000 description 1
- 235000009436 Actinidia deliciosa Nutrition 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 241000640374 Alicyclobacillus acidocaldarius Species 0.000 description 1
- 241000190857 Allochromatium vinosum Species 0.000 description 1
- 102100022712 Alpha-1-antitrypsin Human genes 0.000 description 1
- 241000147155 Ammonifex degensii Species 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241001495180 Arthrospira Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000702199 Bacillus phage PBS2 Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241001453380 Burkholderia Species 0.000 description 1
- 241000168061 Butyrivibrio proteoclasticus Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 238000011740 C57BL/6 mouse Methods 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 101100217502 Caenorhabditis elegans lgg-3 gene Proteins 0.000 description 1
- 101100155198 Caenorhabditis elegans ubl-5 gene Proteins 0.000 description 1
- 101100372243 Caenorhabditis elegans urm-1 gene Proteins 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 102000007590 Calpain Human genes 0.000 description 1
- 108010032088 Calpain Proteins 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 241001496650 Candidatus Desulforudis Species 0.000 description 1
- 241001040999 Candidatus Methanoplasma termitum Species 0.000 description 1
- 241000243205 Candidatus Parcubacteria Species 0.000 description 1
- 241000223282 Candidatus Peregrinibacteria Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000687983 Cerobasis alpha Species 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 1
- 241000193155 Clostridium botulinum Species 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241000186227 Corynebacterium diphtheriae Species 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- XDTMQSROBMDMFD-UHFFFAOYSA-N Cyclohexane Chemical compound C1CCCCC1 XDTMQSROBMDMFD-UHFFFAOYSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- CKLJMWTZIZZHCS-UWTATZPHSA-N D-aspartic acid Chemical compound OC(=O)[C@H](N)CC(O)=O CKLJMWTZIZZHCS-UWTATZPHSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 101710150423 DNA nickase Proteins 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 101001082109 Danio rerio Eukaryotic translation initiation factor 4E-1B Proteins 0.000 description 1
- 108091027757 Deoxyribozyme Proteins 0.000 description 1
- 108091005941 EBFP Proteins 0.000 description 1
- 108091005942 ECFP Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000010911 Enzyme Precursors Human genes 0.000 description 1
- 108010062466 Enzyme Precursors Proteins 0.000 description 1
- 101100005249 Escherichia coli (strain K12) ygcB gene Proteins 0.000 description 1
- 101100176848 Escherichia phage N15 gene 15 gene Proteins 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000605896 Fibrobacter succinogenes Species 0.000 description 1
- 241001376287 Fictibacillus arsenicus Species 0.000 description 1
- KRHYYFGTRYWZRS-UHFFFAOYSA-M Fluoride anion Chemical compound [F-] KRHYYFGTRYWZRS-UHFFFAOYSA-M 0.000 description 1
- 241000589602 Francisella tularensis Species 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102100028966 HLA class I histocompatibility antigen, alpha chain F Human genes 0.000 description 1
- 102100029966 HLA class II histocompatibility antigen, DP alpha 1 chain Human genes 0.000 description 1
- 108010086377 HLA-A3 Antigen Proteins 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 101710113864 Heat shock protein 90 Proteins 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 102000018713 Histocompatibility Antigens Class II Human genes 0.000 description 1
- 102100039856 Histone H1.1 Human genes 0.000 description 1
- 102100022653 Histone H1.5 Human genes 0.000 description 1
- 102100033558 Histone H1.8 Human genes 0.000 description 1
- 101000823116 Homo sapiens Alpha-1-antitrypsin Proteins 0.000 description 1
- 101000986080 Homo sapiens HLA class I histocompatibility antigen, alpha chain F Proteins 0.000 description 1
- 101000864089 Homo sapiens HLA class II histocompatibility antigen, DP alpha 1 chain Proteins 0.000 description 1
- 101000930802 Homo sapiens HLA class II histocompatibility antigen, DQ alpha 1 chain Proteins 0.000 description 1
- 101000968032 Homo sapiens HLA class II histocompatibility antigen, DR beta 3 chain Proteins 0.000 description 1
- 101001009007 Homo sapiens Hemoglobin subunit alpha Proteins 0.000 description 1
- 101001035402 Homo sapiens Histone H1.1 Proteins 0.000 description 1
- 101000899879 Homo sapiens Histone H1.5 Proteins 0.000 description 1
- 101000872218 Homo sapiens Histone H1.8 Proteins 0.000 description 1
- 101000763322 Homo sapiens M1-specific T cell receptor beta chain Proteins 0.000 description 1
- 101001111984 Homo sapiens N-acylneuraminate-9-phosphatase Proteins 0.000 description 1
- 101001045218 Homo sapiens Peroxisomal multifunctional enzyme type 2 Proteins 0.000 description 1
- 101000863978 Homo sapiens Protein downstream neighbor of Son Proteins 0.000 description 1
- 101000634853 Homo sapiens T cell receptor alpha chain constant Proteins 0.000 description 1
- 101000763321 Homo sapiens T cell receptor beta chain MC.7.G5 Proteins 0.000 description 1
- 101001057508 Homo sapiens Ubiquitin-like protein ISG15 Proteins 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 102000002227 Interferon Type I Human genes 0.000 description 1
- 108010014726 Interferon Type I Proteins 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 241001430080 Ktedonobacter racemifer Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000904817 Lachnospiraceae bacterium Species 0.000 description 1
- 241000186679 Lactobacillus buchneri Species 0.000 description 1
- 241000186869 Lactobacillus salivarius Species 0.000 description 1
- 241000589902 Leptospira Species 0.000 description 1
- 241001148627 Leptospira inadai Species 0.000 description 1
- 241000186805 Listeria innocua Species 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 102100029450 M1-specific T cell receptor alpha chain Human genes 0.000 description 1
- 101000986081 Macaca mulatta Mamu class I histocompatibility antigen, alpha chain F Proteins 0.000 description 1
- 108700018351 Major Histocompatibility Complex Proteins 0.000 description 1
- 241000501784 Marinobacter sp. Species 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 241000204637 Methanohalobium evestigatum Species 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 241001467578 Microbacterium Species 0.000 description 1
- 241000192710 Microcystis aeruginosa Species 0.000 description 1
- 241000588622 Moraxella bovis Species 0.000 description 1
- 241000542065 Moraxella bovoculi Species 0.000 description 1
- 102100023906 N-acylneuraminate-9-phosphatase Human genes 0.000 description 1
- 108700004934 NEDD8 Proteins 0.000 description 1
- 102000053987 NEDD8 Human genes 0.000 description 1
- 241000167284 Natranaerobius Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 241000919925 Nitrosococcus halophilus Species 0.000 description 1
- 241001515112 Nitrosococcus watsonii Species 0.000 description 1
- 101150001372 Nme1 gene Proteins 0.000 description 1
- 241000203619 Nocardiopsis dassonvillei Species 0.000 description 1
- 241001223105 Nodularia spumigena Species 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 102000002488 Nucleoplasmin Human genes 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000606860 Pasteurella Species 0.000 description 1
- 241000606856 Pasteurella multocida Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000208181 Pelargonium Species 0.000 description 1
- 241000142651 Pelotomaculum thermopropionicum Species 0.000 description 1
- 102100022587 Peroxisomal multifunctional enzyme type 2 Human genes 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 1
- 241001472610 Polaromonas sp. Species 0.000 description 1
- 101710124239 Poly(A) polymerase Proteins 0.000 description 1
- 108010068086 Polyubiquitin Proteins 0.000 description 1
- 102100037935 Polyubiquitin-C Human genes 0.000 description 1
- 241000605894 Porphyromonas Species 0.000 description 1
- 241001545536 Porphyromonas canis Species 0.000 description 1
- 241000878522 Porphyromonas crevioricanis Species 0.000 description 1
- 241001135241 Porphyromonas macacae Species 0.000 description 1
- 108010071690 Prealbumin Proteins 0.000 description 1
- 241001135219 Prevotella disiens Species 0.000 description 1
- 241001116196 Prevotella saccharolytica Species 0.000 description 1
- QOSMNYMQXIVWKY-UHFFFAOYSA-N Propyl levulinate Chemical compound CCCOC(=O)CCC(C)=O QOSMNYMQXIVWKY-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 description 1
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000590028 Pseudoalteromonas haloplanktis Species 0.000 description 1
- 108010012974 RNA triphosphatase Proteins 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 1
- 241001518258 Streptomyces pristinaespiralis Species 0.000 description 1
- 241000187191 Streptomyces viridochromogenes Species 0.000 description 1
- 241000203587 Streptosporangium roseum Species 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 241000192707 Synechococcus Species 0.000 description 1
- 241000192560 Synechococcus sp. Species 0.000 description 1
- 241000192584 Synechocystis Species 0.000 description 1
- 208000015560 TCR-alpha-beta-positive T-cell deficiency Diseases 0.000 description 1
- 241000228341 Talaromyces Species 0.000 description 1
- 101100059152 Thermococcus onnurineus (strain NA1) csm1 gene Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000009523 Transcription Factor 4 Human genes 0.000 description 1
- 108010048992 Transcription Factor 4 Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 102000009190 Transthyretin Human genes 0.000 description 1
- 241000589892 Treponema denticola Species 0.000 description 1
- 241000078013 Trichormus variabilis Species 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- 101150014930 UFM1 gene Proteins 0.000 description 1
- 102100021012 Ubiquitin-fold modifier 1 Human genes 0.000 description 1
- 101710082264 Ubiquitin-fold modifier 1 Proteins 0.000 description 1
- 101710082247 Ubiquitin-like protein 5 Proteins 0.000 description 1
- 102100030580 Ubiquitin-like protein 5 Human genes 0.000 description 1
- 101710087750 Ubiquitin-like protein ISG15 Proteins 0.000 description 1
- 102100031319 Ubiquitin-related modifier 1 Human genes 0.000 description 1
- 101710144315 Ubiquitin-related modifier 1 Proteins 0.000 description 1
- 241000607598 Vibrio Species 0.000 description 1
- 241000605939 Wolinella succinogenes Species 0.000 description 1
- 238000002441 X-ray diffraction Methods 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 241001531273 [Eubacterium] eligens Species 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960001570 ademetionine Drugs 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- PPQRONHOSHZGFQ-LMVFSUKVSA-N aldehydo-D-ribose 5-phosphate Chemical group OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PPQRONHOSHZGFQ-LMVFSUKVSA-N 0.000 description 1
- 125000003342 alkenyl group Chemical group 0.000 description 1
- 125000003282 alkyl amino group Chemical group 0.000 description 1
- 125000006350 alkyl thio alkyl group Chemical group 0.000 description 1
- 125000000304 alkynyl group Chemical group 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 102000006707 alpha-beta T-Cell Antigen Receptors Human genes 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 229940045686 antimetabolites antineoplastic purine analogs Drugs 0.000 description 1
- 229940045688 antineoplastic antimetabolites pyrimidine analogues Drugs 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 125000001769 aryl amino group Chemical group 0.000 description 1
- 125000004104 aryloxy group Chemical group 0.000 description 1
- 150000001507 asparagine derivatives Chemical class 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 108010006025 bovine growth hormone Proteins 0.000 description 1
- 125000001246 bromo group Chemical group Br* 0.000 description 1
- 230000000981 bystander Effects 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 101150055191 cas3 gene Proteins 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 239000000460 chlorine Substances 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 125000001309 chloro group Chemical group Cl* 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000007979 citrate buffer Substances 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 125000004093 cyano group Chemical group *C#N 0.000 description 1
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 230000030609 dephosphorylation Effects 0.000 description 1
- 238000006209 dephosphorylation reaction Methods 0.000 description 1
- 239000002274 desiccant Substances 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 125000004663 dialkyl amino group Chemical group 0.000 description 1
- 125000004986 diarylamino group Chemical group 0.000 description 1
- 125000005240 diheteroarylamino group Chemical group 0.000 description 1
- 206010013023 diphtheria Diseases 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 239000003527 fibrinolytic agent Substances 0.000 description 1
- 230000003480 fibrinolytic effect Effects 0.000 description 1
- 235000019688 fish Nutrition 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 229940118764 francisella tularensis Drugs 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 108060003196 globin Proteins 0.000 description 1
- 102000018146 globin Human genes 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010062584 glycollate oxidase Proteins 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 150000002367 halogens Chemical class 0.000 description 1
- 125000005241 heteroarylamino group Chemical group 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 208000018099 immunodeficiency 7 Diseases 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000009319 interchromosomal translocation Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 125000002346 iodo group Chemical group I* 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- GZQKNULLWNGMCW-PWQABINMSA-N lipid A (E. coli) Chemical compound O1[C@H](CO)[C@@H](OP(O)(O)=O)[C@H](OC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCCCC)[C@@H](NC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCC)[C@@H]1OC[C@@H]1[C@@H](O)[C@H](OC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](NC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](OP(O)(O)=O)O1 GZQKNULLWNGMCW-PWQABINMSA-N 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 231100000053 low toxicity Toxicity 0.000 description 1
- 230000002132 lysosomal effect Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 102000044158 nucleic acid binding protein Human genes 0.000 description 1
- 108700020942 nucleic acid binding protein Proteins 0.000 description 1
- 238000011330 nucleic acid test Methods 0.000 description 1
- 108060005597 nucleoplasmin Proteins 0.000 description 1
- 229940127073 nucleoside analogue Drugs 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 229940051027 pasteurella multocida Drugs 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- DJRAFFGQRHFHHN-UHFFFAOYSA-N phosphonooxyboronic acid Chemical class OB(O)OP(O)(O)=O DJRAFFGQRHFHHN-UHFFFAOYSA-N 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 239000002504 physiological saline solution Substances 0.000 description 1
- 102000028499 poly(A) binding Human genes 0.000 description 1
- 108091023021 poly(A) binding Proteins 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 1
- OYRRZWATULMEPF-UHFFFAOYSA-N pyrimidin-4-amine Chemical compound NC1=CC=NC=N1 OYRRZWATULMEPF-UHFFFAOYSA-N 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 210000004767 rumen Anatomy 0.000 description 1
- 101150071322 ruvC gene Proteins 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 238000012453 sprague-dawley rat model Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 125000000547 substituted alkyl group Chemical group 0.000 description 1
- 230000020382 suppression by virus of host antigen processing and presentation of peptide antigen via MHC class I Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012385 systemic delivery Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 125000005309 thioalkoxy group Chemical group 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 1
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
提供了用于利用脱氨作用的基因组编辑的多核苷酸、多肽、组合物和方法。本文提供了一种含有编码多肽的开放阅读框(ORF)的mRNA。所述多肽包括胞苷脱氨酶和RNA引导的切口酶,并且不包括尿嘧啶糖苷酶抑制剂(UGI)。本文所提供的组合物可包括两种不同的mRNA。第一mRNA包括编码胞苷脱氨酶和RNA引导的切口酶的ORF,并且第二mRNA包括编码尿嘧啶糖苷酶抑制剂(UGI)的ORF。
Description
本申请根据35U.S.C.119(e)要求2020年12月11日提交的美国临时申请第63/124,060号、2020年12月23日提交的美国临时申请第63/130,104号、2021年3月24日提交的美国临时申请第63/165,636号和2021年11月3日提交的美国临时申请第63/275,424号的权益,所述临时申请中的每一者都通过引用整体并入本文。
本申请与电子格式的序列表一起提交。所述序列表以命名为“2021-12-08_01155-0016-00PCT_ST25.txt”的文件提供,所述文件创建于2021年12月8日,大小为1,557,107字节。所述序列表的电子格式的信息通过引用整体并入本文。
引言和发明内容
本公开涉及用于涉及脱氨作用的基因组编辑的多核苷酸、组合物和方法。
碱基编辑为一种基因组编辑方法,其直接在基因组DNA的特定区内产生点突变而不引起双链断裂(DSB)。DNA碱基编辑器(BE)包含催化受损Cas核酸酶与碱基修饰酶之间的融合物。当前,胞苷至胸苷(C-T)编辑的效应子将胞苷脱氨酶与切口酶和尿嘧啶糖苷酶抑制剂(UGI)融合。例如,碱基编辑器3(BE3)由带有突变的Cas9核酸酶组成,所述突变将其转化为与APOBEC1(载脂蛋白mRNA编辑酶、催化多肽1)脱氨酶和UGI融合的切口酶(nCas9)(例如,Wang等人,Cell Research 27:1289-1292(2017)),并且据报道,“nCas9融合UGI域对于实现碱基编辑的高保真度仍十分重要,即使在存在高水平的游离UGI的情况下”。作为另一实例,已探究工程化的人类APOBEC3A(A3A或载脂蛋白mRNA编辑酶、催化多肽3A)脱氨酶替换原始BE3中的大鼠APOBEC1脱氨酶(RAPO1)(Gehrke等人,Nature Biotechnology,36:977-982(2018)),但应注意,碱基编辑器“编辑其编辑窗口内的所有C的能力可潜在地具有有害作用”,并且“在碱基编辑器的情形下,人类A3A脱氨酶中N57残基的突变对于恢复其原生目标序列精确度并且也对降低其脱靶编辑活性极为关键”。实际上,APOBEC3A-2类Cas切口酶(D10A)碱基编辑器已报道为:具有“较高程度的致突变性”,并且显示Cas9独立的脱靶碱基编辑(Doman等人,Nature Biotechnology 38:620-628(2020))。因此,需要用于使用胞苷脱氨酶(例如,APOBEC3A脱氨酶)和RNA引导的切口酶进行靶向C-T碱基编辑的改进的组合物和方法。
因此,本公开提供了用于基因组编辑的多核苷酸、组合物和方法,所述基因组编辑涉及在目标核苷酸处以较高保真度诱导C-T转化并且可最小化旁观者突变的胞苷脱氨酶(例如,APOBEC3A脱氨酶)和RNA引导的切口酶。本公开部分地基于以下发现:通过将胞苷脱氨酶(例如,APOBEC脱氨酶)和RNA引导的切口酶系统与UGI以反式配对(例如,作为单独mRNA),有可能降低其他碱基编辑(C-A/G转化、插入或缺失)的量并提高C-T编辑的纯度。
因此,提供了以下实施方案。
在一些实施方案中,提供了一种组合物,所述组合物包含:第一mRNA,其包含编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的第一开放阅读框,和第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框,其中所述第二mRNA不同于所述第一mRNA。在一些实施方案中,所述第一开放阅读框不包含编码UGI的序列。在一些实施方案中,所述组合物包含第一组合物和第二组合物,其中所述第一组合物包含含有编码包含胞苷脱氨酶和RNA引导的切口酶并且不包含尿嘧啶糖苷酶抑制剂(UGI)的多肽的第一开放阅读框的第一mRNA,并且所述第二组合物包含含有编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框的第二mRNA,其中所述第二mRNA不同于所述第一mRNA。在一些实施方案中,所述组合物包含脂质纳米粒子。
在一些实施方案中,提供了一种修饰目标基因的方法,所述方法包括向细胞递送:第一mRNA,其包含编码包含胞苷脱氨酶和RNA引导的切口酶的第一多肽的第一开放阅读框;第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框,其中所述第二mRNA不同于所述第一mRNA;和至少一种引导RNA(gRNA)。
在一些实施方案中,提供了一种修饰细胞中的目标基因内的至少一个胞苷的方法,所述方法包括在所述细胞中表达以下各物或使所述细胞与以下各物接触:(i)包含胞苷脱氨酶和RNA引导的切口酶的第一多肽,其中所述第一多肽不包含尿嘧啶糖苷酶抑制剂(UGI);(ii)UGI多肽;和(iii)至少一种引导RNA(gRNA),其中所述第一多肽和gRNA与目标基因形成复合物并修饰目标基因中的至少一个胞苷。在一些实施方案中,UGI多肽与第一多肽的比率为10∶1至50∶1。
在一些实施方案中,提供了一种含有编码多肽的开放阅读框(open readingframe;ORF)的mRNA,所述多肽包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶,其中所述多肽不包含尿嘧啶糖苷酶抑制剂(UGI)。还提供了由mRNA编码的多肽。在一些实施方案中,提供了一种修饰目标基因的方法,所述方法包括向细胞递送本文中所描述的mRNA或多肽。
在一些实施方案中,组合物包含两种不同mRNA,其中第一mRNA包含编码胞苷脱氨酶(例如A3A)和RNA引导的切口酶的ORF,并且第二mRNA包含编码尿嘧啶糖苷酶抑制剂(UGI)的ORF。在一些实施方案中,组合物中的第一mRNA不包含编码UGI的ORF。在一些实施方案中,第二mRNA与第一mRNA的摩尔比为1∶1至30∶1、2∶1至30∶1、7∶1至22∶1。在一些实施方案中,第二mRNA与第一mRNA的摩尔比为22∶1、7∶1、2∶1或1∶1、1∶4、1∶11或1∶33。
通篇在权利要求书和附图中提供并描述其他实施方案。
附图说明
图1A至图1E分别显示针对5个不同引导靶向序列剖析的C-T转化活性脱氨酶编辑器。
图2A显示使用sg000296剖析的具有转化为脱氨酶编辑器的胸苷的4种目标胞嘧啶的经编辑读段的百分比。
图2B显示使用sg0001373剖析的具有转化为脱氨酶编辑器的胸苷的5种目标胞嘧啶的经编辑读段的百分比。
图2C显示使用sg001400剖析的具有转化为脱氨酶编辑器的胸苷的4种目标胞嘧啶的经编辑读段的百分比。
图2D显示使用sg003018剖析的具有转化为脱氨酶编辑器的胸苷的6种目标胞嘧啶的经编辑读段的百分比。
图2E显示使用sg005883剖析的具有转化为脱氨酶编辑器的胸苷的8种目标胞嘧啶中的至少6种的经编辑读段的百分比。
图3A至图3E分别针对5种不同引导靶向序列显示碱基位置的C-T转化百分比。
图4A至图4B显示编辑型态为U-2OS细胞(图4A)和HuH-7细胞(图4B)中总读段的百分比。
图5A至图5B显示编辑型态为U-2OS细胞(图5A)和HuH-7细胞(图5B)中的经编辑读段的百分比。
图6A至图6B表示编辑型态为滴定UGI mRNA(SEQ ID NO:25和34)后总读段的百分比。
图7显示用与mRNA构建体和sgRNA的不同LNP组合治疗的CD-1小鼠中的TTR编辑水平。图7显示从CD-1小鼠采集的肝脏组织样本提取的DNA序列(NGS测序)的C-T转化、C-A/G转化和插入/缺失的编辑%。
图8显示当将UGI序列以反式(单独的mRNA)递送时,从用与mRNA构建体和sgRNA的不同LNP组合治疗的CD-1小鼠采集的肝脏组织中的TTR编辑水平。
图9A至图9C显示在表示不存在反式UGI mRNA的情况下用sgRNA G000282和BC22nmRNA(图9A)、在存在反式UGI mRNA的情况下用sgRNA G000282和BC22n mRNA(图9B)或在反式UGI mRNA存在的情况下用Cas9 mRNA(图9C)治疗的小鼠肝脏样本中统计学上显著的(p.adj.<0.05)差异基因表达事件(黑色点)的散布图。
图10显示用不同mRNA构建体和CIITA靶向sgRNA治疗后T细胞中的编辑型态。
图11显示通过用不同mRNA构建体和CIITA引导RNA治疗的T细胞的流式细胞术分析评定的MHC II类阴性细胞。
图12A至图12B显示展示在用sgRNA G018076、UGI mRNA和Cas9 mRNA(图12A)或BC22n mRNA(图12B)治疗的T细胞中统计学上显著的(*=p.adj.<0.05)差异基因表达事件(黑色点)的散布图。
图13A至图13B显示展示在用sgRNA G018117、UGI mRNA和Cas9 mRNA(图13A)或BC22n mRNA(图13B)治疗的T细胞中统计学上显著的(*=p.adj.<0.05)差异基因表达事件(黑色点)的散布图。
图14A至图14B显示在用sgRNA G018076、UGI mRNA和Cas9 mRNA(图14A)或BC22nmRNA(图14B)治疗的T细胞中差异表达基因的列表当中富集的蛋白质-蛋白质相互作用网络。
图15A至图15B显示在用sgRNA G018117、UGI mRNA和Cas9 mRNA(图15A)或BC22mRNA(图15B)治疗的T细胞中差异表达基因的列表当中富集的蛋白质-蛋白质相互作用网络。
图16A至图16C显示T细胞的编辑型态。在靶TRAC基因座(图16A)以及先前已描述为APOBEC阳性肿瘤中的突变热点的10个基因座(图16B至图16C)中的编辑型态。
图17A至图17E显示当用不同水平的BC22n mRNA和Cas9 mRNA治疗时T细胞的编辑型态。使用sgRNA G015995(图17A)、G016017(图17B)、G016206(图17C)、G018117(图17D)或G016086(图17E)编辑细胞。
图18A至图18D显示同时使用不同水平的BC22n mRNA或Cas9 mRNA用四种引导物编辑的T细胞的编辑型态。每个经编辑基因座处的编辑型态分别表示:G015995(图18A)、G016017(图18B)、G016206(图18C)、G018117(图18D)。
图19A至图19I将表型分型结果显示为对于抗体结合呈阴性的细胞的百分比,其中BC22n和Cas9样本的总RNA增加。图19A显示当B2M引导物G015995用于编辑时,B2M阴性细胞的百分比。图19B显示当多种引导物用于编辑时,B2M阴性细胞的百分比。图19C显示当TRAC引导物G016017用于编辑时,CD3阴性细胞的百分比。图19D显示当TRBC引导物G016206用于编辑时,CD3阴性细胞的百分比。图19E显示当多种引导物用于编辑时,CD3阴性细胞的百分比。图19F显示当CIITA引导物G018117用于编辑时,MHC II类阴性细胞的百分比。图19G显示当多种引导物用于编辑时,MHC II类阴性细胞的百分比。图19H显示当多种引导物用于编辑时,三重(B2M、CD3、MHC II)阴性细胞的百分比。图19I显示当CIITA引导物G016086用于编辑时,MHC II类阴性T细胞的百分比。
图20A至图20C显示在使用不同水平的反式UGI mRNA和各种编辑器mRNA时,T细胞的编辑型态。图20A显示BC22n mRNA在27.3nM处的编辑百分比。图20B显示BC22-2xUGI mRNA在24.7nM处的编辑百分比。图20C显示BE4Max mRNA在24.0nM处的编辑百分比。
图21显示在使用不同水平的反式UGI mRNA与各种编辑器mRNA时,C-T转化作为经编辑读段的百分比(BC22n处于27.3nM,BC22-2xUGI处于24.7nM,BE4Max处于24.0nM)。
图22显示使用Cas9或BC22的若干引导物的对于MHC II的细胞表面表达呈阴性的T细胞的平均百分比(“MHC II阴性%”)与显示为碱基对(“bp”)的切割位点边界核苷酸之间的距离的关系。正数值指示切割位点的剪接位点边界核苷酸3′,而负数值指示切割位点的剪接位点边界核苷酸5′。
图23A显示在可能二级结构中的示例性sgRNA(SEQ ID NO:141,甲基化未示出),其中标记标识sgRNA的保守区的个别核苷酸,包括下茎、隆突、上茎、联结区(其核苷酸依5′至3′方向分别可称为N1至N18)和发夹区,所述发夹区包括发夹1和发夹2区。发夹1与发夹2之间的核苷酸标记为n。引导区可存在于sgRNA上并且在此图中指示为sgRNA的保守区之前的“(N)x”。
图23B在示例性sgRNA序列(SEQ ID NO:141,甲基化未示出)中以1至10标记10个保守区YA位点。编号25、45、50、56、64、67和83指示YA位点1、5、6、7、8、9和10的嘧啶在sgRNA中的位置,其中引导区表示为(N)x,例如其中x任选地为20。
图24A至图24B显示三种CIITA引导物(G016086、G016092和G016067)在使用BC22编辑T细胞时的效率结果。图24A显示C-T转化百分比。图24B显示MHC II类阴性T细胞的百分比。
图25显示在用不同mRNA组合编辑之后B2M阴性T细胞的百分比。EP指示电穿孔。
图26显示单核苷酸变体(SNV)的百分比,其为在B2M处用不同mRNA组合编辑的T细胞的转录组中的C-U转化(n.s.=不显著)。
图27显示在用不同mRNA组合治疗之后B2M阴性T细胞的百分比。
图28显示在用不同mRNA组合治疗之后T细胞中的B2M基因座处的编辑型态。
图29显示来自在B2M处用不同mRNA组合编辑的单个T细胞的扩增基因组DNA中作为C-T转化的SNV的百分比(n.s.=不显著)。
图30显示在用不同mRNA组合编辑之后B2M阴性eHap1细胞的百分比。
图31显示在用不同mRNA组合治疗之后eHapl细胞中的B2M基因座的编辑型态。
图32显示在B2M处用不同mRNA组合编辑的克隆扩增的eHap1细胞中作为C-T转化的SNV的百分比(n.s.=统计学上不显著)。
图33显示在电穿孔或LNP递送BC22n或Cas9编辑器和单个或多种引导物之后,相对于未治疗细胞的细胞活力。
图34显示在电穿孔或LNP递送BC22n或Cas9编辑器和单个或多种引导物之后,每个细胞核的总γH2AX光点强度。
图35显示在LNP递送BC22n或Cas9编辑器和单个或多种引导物之后,所关注的基因座处的编辑百分比。
图36显示在LNP递送BC22n或Cas9编辑器和单个或多种引导物之后,所述表面蛋白质的阴性细胞的百分比。
图37显示在LNP递送BC22n或Cas9编辑器和多种引导物之后,总独特分子当中的染色体间易位的百分比。
图38显示用各种碱基编辑器治疗之后的小鼠肝脏中的平均编辑百分比。
图39显示针对经设计有各种脱氨酶域的碱基编辑器构建体的平均C-T转化活性百分比。
图40A至图40K显示针对设计有各种接头的碱基编辑构建体含有至少1个C-T转化的总读段的百分比。
图41显示在用使用各种接头设计的碱基编辑器构建体治疗之后,Huh-7中SERPINA1处的平均编辑百分比。
图42显示经设计有各种接头的碱基编辑mRNA的EC90。还显示了每个EC90值的95%置信区间(CI)。
图43显示使用设计有各种接头的碱基编辑构建体在PHH中的ANAPC5基因座处的平均编辑百分比。
图44显示设计有各种接头的碱基编辑mRNA的EC95。还显示了每个EC95值的95%置信区间(CI)。
图45显示使用设计有各种接头的碱基编辑构建体在PHH中的TRAC基因座处的平均编辑百分比。
图46显示设计有引起CD3的90%的最大(EC90)敲低的各种接头的碱基编辑器mRNA的质量。还显示了每个EC50值的95%置信区间。
图47显示设计有引起CD3的90%的最大(EC90)敲低、HLA-A3和HLA-DR、DP、DQ(EC50)的各种接头的BC22n mRNA的质量。还显示了每个EC50值的95%置信区间(CI)。
图48显示在用100聚体或91聚体格式中的sgRNA治疗的T细胞中TRAC基因座处的平均编辑百分比。
图49A显示在用100聚体或91聚体格式中的sgRNA治疗的T细胞中TRBC1基因座处的平均编辑百分比。
图49B显示在用100聚体或91聚体格式中的sgRNA治疗的T细胞中TRBC2基因座处的平均编辑百分比。
图50显示在用100聚体或91聚体格式中的sgRNA治疗的T细胞中CIITA基因座处的平均编辑百分比。
图51显示在用100聚体或91聚体格式中的sgRNA治疗的T细胞中B2M基因座处的平均编辑百分比。
图52显示在用100聚体或91聚体格式中的sgRNA治疗的T细胞中CD38基因座处的平均编辑百分比。
图53A显示在用靶向TRAC的100聚体或91聚体格式中的sgRNA治疗之后对于CD3表面受体呈阴性的CD8+T细胞的平均百分比。
图53B显示在用靶向TRBC的100聚体或91聚体格式中的sgRNA治疗之后对于CD3表面受体呈阴性的CD8+T细胞的平均百分比。
图54A显示在用靶向CIITA的100聚体或91聚体格式中的sgRNA治疗之后对于HLA-DR、DP、DQ表面受体呈阴性的CD8+T细胞的平均百分比。
图54B显示在用靶向HLA-A的100聚体或91聚体格式中的sgRNA治疗之后对于HLA-A表面受体呈阴性的CD8+T细胞的平均百分比。
图55A显示在用靶向B2M的100聚体或91聚体格式中的sgRNA治疗之后对于B2M表面受体呈阴性的CD8+T细胞的平均百分比。
图55B显示在用靶向CD38的100聚体或91聚体格式中的sgRNA治疗之后对于CD38表面受体呈阴性的CD8+T细胞的平均百分比。
图56显示随着UGI mRNA的量增加,小鼠肝脏中的ANAPC5基因座处的平均编辑百分比。
图57显示随着UGI mRNA的量增加,编辑后小鼠肝脏中的ANAPC5基因座处的C-T编辑纯度百分比。
图58A显示在PHH细胞中的B2M处在不同BC22n-HiBiT mRNA浓度下的总编辑。
图58B显示在PHH细胞中的B2M处在不同UGI-HiBiT mRNA浓度下的C-T纯度。
图58C显示在PHH细胞中的B2M处在不同BC22-2xUGI-HiBiT mRNA浓度下的总编辑。
图58D显示在PHH细胞中的B2M处在不同BC22-2xUGI-HiBiT mRNA浓度下的C-T纯度。
图59A显示在T细胞中在不同BC22n-HiBiT mRNA浓度下的总编辑。
图59B显示在T细胞中在不同UGI-HiBiT mRNA浓度下的C-T纯度。
图59C显示在T细胞中在不同BC22-2xUGI-HiBiT mRNA浓度下的总编辑。
图59D显示在T细胞中在不同BC22-2xUGI-HiBiT mRNA浓度下的C-T纯度。
图60显示用固定剂量的sgRNA和碱基编辑器mRNA和不同剂量的UGI mRNA的LNP治疗的CD-1小鼠采集的肝脏组织中的编辑。
图61显示用固定剂量的sgRNA和碱基编辑器mRNA和不同剂量的UGI mRNA的LNP治疗的CD-1小鼠采集的肝脏组织中的C-T纯度。
图62显示由以不同效应子:靶标(E:T)比率用sgRNA和碱基编辑器和UGI mRNA治疗的NK细胞靶向的T细胞的溶解百分比。
图63显示用Spy碱基编辑器编辑的高活性引导物在每个引导物核苷酸位置处的转化率。
图64显示用Nme2碱基编辑器编辑的高活性引导物在每个引导核苷酸位置处的转化率。
所公开序列的简要说明
/>
/>
/>
/>
/>
/>
/>
/>
对于序列本身,参见下文序列表。转录本序列通常可包括GGG作为供与ARCA一起使用的前三个核苷酸,或包括AGG作为供与CleanCapTM一起使用的前三个核苷酸。因此,可对前三个核苷酸进行修饰以供与其他加帽方法,例如牛痘(Vaccinia)加帽酶一起使用。启动子和poly-A序列不包括在转录本序列中。例如U6启动子(SEQ ID NO:67)的启动子或CMV启动子(SEQ ID NO:68)和例如SEQ ID NO:109的poly-A序列可分别在5′端和3′端处附接至所公开的转录本序列。大多数核苷酸序列以DNA形式提供,但可通过将T变成U而容易转化成RNA。
具体实施方式
现将详细参考本发明的某些实施方案,其实施例在附图中加以说明。尽管本发明将结合所说明的实施方案描述,但应理解它们并不旨在将本发明限于那些实施方案。相反,本发明旨在涵盖所有替代方案、修改和等同物,其可如所附权利要求所限定包括在本发明内。
在详细描述本公开教导内容之前,应理解,本公开不限于特定组合物或方法步骤,因此可加以改变。应注意,除非上下文另外明确规定,否则如本说明书和所附权利要求中所用,单数形式“一(a/an)”和“所述(the)”包括多个提及物。因此,例如,提及“缀合物(aconiugate)”包括多个缀合物并且提及“细胞(a cell)”包括多个细胞等。
数值范围包括限定所述范围的数字。考虑到有效数字和与测量相关的误差,实测值和可测量值应理解为近似值。此外,“包含(comprise/comprises/comprising)”、“含有(contain/contains/containing)”和“包括(include/includes/including)”的使用并不旨在为限制性的。应了解,前文一般描述与详细说明仅具有示例性和解释性并且不限制教导内容。
术语“约”或“大约”意指如由本领域普通技术人员所测定的特定值的可接受的误差,其部分地取决于如何测量或确定所述值、或变化程度不会实质性影响所述主题的特性,或在本领域中所接受的容限内,例如在10%、5%、2%或1%内。因此,除非有相反指示,否则以下说明书和所附权利要求中所阐述的数值参数为可根据设法获得的所需特性而变化的近似值。最低限度地,并且不试图限制等同物的原则对权利要求的范围的应用,每个数值参数至少应根据所报告的有效数字的数目并且通过应用一般舍入技术来解释。
除非以上说明书中具体指出,否则本说明书中叙述“包含”各种组分的实施方案也设想为“由所述组分组成”或“基本上由所述组分组成”;本说明书中叙述“由各种组分组成”的实施方案也设想为“包含”所述组分或“基本上由所述组分组成”;并且本说明书中叙述“基本上由各种组分组成”的实施方案也设想为“由所述组分组成”或“包含”所述组分(这种互换性并不适用于这些术语在权利要求书中的使用)。
本文所用的章节标题仅出于组织目的而不应解释为以任何方式限制所需主题。在通过引用并入的任何文献与本说明书的表述内容(包括但不限于定义)相矛盾的情况下,以本说明书的表述内容为准。尽管本发明教导内容是与各种实施方案结合描述,但并不旨在使本发明教导内容限制于此类实施方案。相反,如本领域技术人员将了解,本发明教导内容涵盖各种替代方案、修改和等同物。
I.定义
除非另外说明,否则如本文所用的以下术语和短语旨在具有以下含义:
如本文所用,术语“或其组合”是指在所述术语前面所列项的所有排列和组合。例如,“A、B、C或其组合”旨在包括以下中的至少一者:A、B、C、AB、AC、BC或ABC,并且如果在特定情况下顺序为重要的,则还包括BA、CA、CB、ACB、CBA、BCA、BAC或CAB。继续此实例,明确地包括含有一个或多个项或术语的重复的组合,例如BB、AAA、AAB、BBC、CBBA、CABA等等。本领域技术人员应理解,除非另外从上下文显而易知,否则通常不存在对任何组合中的项或术语的数目的限制。
如本文所用,术语“试剂盒”是指相关组分,例如一种或多种多核苷酸或组合物和一种或多种相关材料如递送装置(例如注射器)、溶剂、溶液、缓冲液、说明书或干燥剂的包装组。
除非上下文另有规定,否则“或”是依包括性意义使用,即,等同于“和/或”。
“多核苷酸”和“核酸”在本文中用于指代包含核苷或具有沿主链连接在一起的含氮杂环碱基或碱基类似物的核苷类似物的多聚化合物,其包括常规RNA、DNA、混合RNA-DNA和为其类似物的聚合物。核酸“主链”可由多个键联构成,其包括糖-磷酸二酯键联、肽-核酸键(“肽核酸”或PNA;PCT第WO 95/32305号)、硫代磷酸酯键联、甲基膦酸酯键联或其组合中的一者或多者。核酸的糖部分可为核糖、脱氧核糖或具有取代例如2′甲氧基或2′卤基取代的类似化合物。含氮碱基可为常规碱基(A、G、C、T、U)、其类似物(例如经修饰的尿苷,例如5-甲氧基尿苷、假尿苷或N1-甲基假尿苷或其他);肌苷;嘌呤或嘧啶的衍生物(例如N4-甲基脱氧鸟苷,脱氮嘌呤或氮杂嘌呤,脱氮嘧啶或氮杂嘧啶,在5位或6位处具有取代基的嘧啶碱基(例如5-甲基胞嘧啶),在2位、6位或8位处具有取代基的嘌呤碱基,2-氨基-6-甲氨基嘌呤,O6-甲基鸟嘌呤,4-硫基-嘧啶,4-氨基-嘧啶,4-二甲基肼-嘧啶,和O4-烷基-嘧啶;美国专利第5,378,825号和PCT第WO 93/13121号)。对于一般论述,参见The Biochemistry of theNucleic Acids 5-36,Adams等人编,第11版,1992)。核酸可包括一个或多个“无碱基”残基,其中主链不包括针对聚合物位置的含氮碱基(美国专利第5,585,481号)。核酸可仅包含常规RNA或DNA糖、碱基和键联,或者可包括常规组分与取代(例如具有2′甲氧基键联的常规碱基,或含有常规碱基与一个或多个碱基类似物的聚合物)。核酸包括“锁核酸”(LNA),含有一个或多个LNA核苷酸单体的类似物,其中双环呋喃糖单元锁定于模拟糖构象的RNA中,由此增强针对互补RNA和DNA序列的杂交亲和力(Vester和Wengel,2004,Biochemistry 43(42):13233-41)。RNA和DNA具有不同糖部分并且不同之处可为RNA中存在尿嘧啶或其类似物和DNA中存在胸腺嘧啶或其类似物。
如本文所用,“多肽”是指包含可采用三维构象的氨基酸残基的多聚化合物。多肽包括但不限于酶、酶前体蛋白、调节蛋白、结构蛋白、受体、核酸结合蛋白、抗体等。多肽可未必包含翻译后修饰、非天然氨基酸、辅基等。
如本文所用,“胞苷脱氨酶”意指能够具有胞苷脱氨酶活性的多肽或多肽复合物,其催化胞苷或脱氧胞苷的水解脱氨作用,通常产生尿苷或脱氧尿苷。胞苷脱氨酶涵盖胞苷脱氨酶超家族中的酶,并且特定是APOBEC家族的酶(酶的APOBEC1、APOBEC2、APOBEC4和APOBEC3亚群)、活化诱导的胞苷脱氨酶(AID或AICDA)和CMP脱氨酶(参见例如Conticello等人,Mol.Biol.Evol.22:367-77,2005;Conticello,Genome Biol.9:229,2008;Muramatsu等人,J.Biol.Chem.274:18470-6,1999;Carrington等人,Cells 9:1690(2020))。在一些实施方案中,涵盖任何已知胞苷脱氨酶或APOBEC蛋白的变体。变体包括具有与野生型蛋白质相差一个或若干个突变(即,取代、缺失、插入)的序列的蛋白质,所述一个或若干个突变例如一个或若干个单点取代。例如,缩短序列可例如通过使N末端、C末端或内部氨基酸缺失,优选缺失序列C末端处的一个至四个氨基酸来使用。如本文所用,术语“变体”是指与参考序列同源的等位基因变体、剪接变体和天然或人工突变体。变体为“功能性的”,因为其显示DNA编辑的催化活性。
如本文所用,术语“APOBEC3A”是指胞苷脱氨酶,例如由人类A3A基因表达的蛋白质。APOBEC3A可具有催化DNA编辑活性。已描述APOBEC3A的氨基酸序列(UniPROT登录ID:p31941)并且作为SEQ ID NO:40包括在本文中。在一些实施方案中,APOBEC3蛋白质为人类APOBEC3蛋白质和/或野生型蛋白质。变体包括具有与野生型APOBEC3A蛋白质相差一个或若干个突变(即,取代、缺失、插入)的序列的蛋白质,所述一个或若干个突变例如一个或若干个单点取代。例如,可使用缩短的APOBEC3A序列,例如通过使N末端、C末端或内部氨基酸缺失,优选地使序列的C末端处的一个至四个氨基酸缺失。如本文所用,术语“变体”是指与APOBEC3A参考序列同源的等位基因变体、剪接变体和天然或人工突变。变体为“功能性的”,因为其显示DNA编辑的催化活性。在一些实施方案中,APOBEC3A(例如人类APOBEC3A)具有野生型氨基酸位置57(如野生型序列中所编号)。在一些实施方案中,APOBEC3A(例如人类APOBEC3A)在氨基酸位置57(如野生型序列中所编号)处具有天冬酰胺。
如本文所用,“切口酶”为在双链DNA中产生单链断裂(也称为“切刻”)的酶,即切割DNA双螺旋的一条链但不切割另一条链。如本文所用,“RNA引导的切口酶”意指具有DNA切口酶活性的多肽或多肽复合物,其中DNA切口酶活性为序列特异性的并且取决于RNA的序列。示例性RNA引导的切口酶包括Cas切口酶。Cas切口酶包括但不限于:III型CRISPR系统的Csm或Cmr复合物的切口酶形式,其Cas10、Csm1或Cmr2亚基,I型CRISPR系统的级联复合物,其Cas3亚基和2类Cas核酸酶。2类Cas切口酶包括2类Cas核酸酶变体,其中两个催化域中的仅一者失活,其具有RNA引导的DNA切口酶活性。2类Cas切口酶包括例如Cas9(例如,SpyCas9的H840A、D10A或N863A变体)、Cpf1、C2c1、C2c2、C2c3、HF Cas9(例如N497A、R661A、Q695A、Q926A变体)、HypaCas9(例如N692A、M694A、Q695A、H698A变体)、eSPCas9(1.0)(例如K810A、K1003A、R1060A变体)和eSPCas9(1.1)(例如K848A、K1003A、R1060A变体)蛋白质和其修饰。Cpfl蛋白质,Zetsche等人,Cell,163:1-13(2015),与Cas9同源并且含有RuvC样蛋白质域。Zetsche的Cpf1序列通过引用整体并入。参见例如Zetsche,表S1和表S3。“Cas9”涵盖化脓性链球菌(S.pyogenes)(Spy)Cas9,本文中所列出的Cas9的变体和其等同物。参见例如Makarova等人,Nat Rev Microbiol,13(11):722-36(2015);Shmakov等人,MolecularCell,60:385-397(2015)。
若干Cas9异种同源物已从以下获得:脑膜炎奈瑟菌(N.meningitidis)(Esvelt等人,NAT.METHODS,第10卷,2013,1116-1121;Hou等人,PNAS,第110卷,2013,第15644-15649页;Edraki等人,Mol.Cell 73:714-726,2019)(Nme1Cas9、Nme2Cas9和Nme3Cas9)。Nme2Cas9直系同源物在哺乳动物细胞中有效地起作用,识别N4CC PAM,并且可用于体内编辑(Ran等人,NATURE,第520卷,2015,第186至191页;Kim等人,NAT.COMMUN.,第8卷,2017,第14500页)。Nme2Cas9已显示为对脱靶编辑具有天然抗性(Lee等人,MOL.THER.,第24卷,2016,第645至654页;Kim等人,2017)。也参见例如WO/2020081568(例如,第28页和42页),其描绘Nme2Cas9 D16A切口酶,所述文献的内容特此通过引用整体并入。在全文中,“NmeCas9”为通用的并且涵盖任何类型的NmeCas9,包括Nme1Cas9、Nme2Cas9和Nme3Cas9。
如本文所用,术语“融合蛋白”是指包含来自至少两种不同蛋白质或来源的多肽的混合多肽。一个多肽可位于融合蛋白的氨基末端(N末端)部分处或羧基末端(C末端)蛋白处,因此分别形成“氨基末端融合蛋白”或“羧基末端融合蛋白”。本文所提供的任何蛋白质可通过本领域中已知的任何方法产生。例如,本文所提供的蛋白质可经由重组蛋白表达和纯化来产生,其尤其适合于包含肽接头的融合蛋白。重组蛋白表达和纯化的方法是众所周知的,并且包括由Green和Sambrook,Molecular Cloning:A Laboratory Manual(第4版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2012))描述的那些方法,其全部内容通过引用并入本文。
如本文所用的术语“接头”是指连接两个相邻分子或部分的化学基团或分子。通常,接头安置于两个基团、分子或其他部分之间或由两个基团、分子或其他部分侧接,并且经由共价键彼此连接。在一些实施方案中,接头为一个氨基酸或多个氨基酸(例如肽或蛋白质),例如16-氨基酸残基“XTEN”接头或其变体(参见例如实施例;和Schellenberger等人,Arecombinant polypeptide extends the in vivo half-life of peptides andproteins in a tunable manner.Nat.Biotechnol.27,1186-1190(2009))。在一些实施方案中,XTEN接头包含序列SGSETPGTSESATPES(SEQ ID NO:46)、SGSETPGTSESA(SEQ ID NO:47)或SGSETPGTSESATPEGGSGGS(SEQ ID NO:48)。在一些实施方案中,接头包含选自SEQ IDNO:46-59、61和211-272的一个或多个序列。
如本文所用,术语“尿嘧啶糖苷酶抑制剂”、“尿嘧啶-DNA糖苷酶抑制剂”或“UGI”是指能够抑制尿嘧啶-DNA糖苷酶(UDG)碱基切除修复酶(例如,UniPROT ID:P14739;SEQ IDNO:27;SEQ ID NO:43)的蛋白质。
如本文所用,基因的“开放阅读框”或“ORF”是指由一系列密码子组成的序列,所述密码子指定所述基因编码的蛋白质的氨基酸序列。ORF通常开始于起始密码子(例如DNA中的ATG或RNA中的AUG)并且以终止密码子结束,例如DNA中的TAA、TAG或TGA或RNA中的UAA、UAG或UGA。
“引导RNA”、“gRNA”和“引导物”在本文中互换使用以指crRNA(也称为CRISPRRNA),或crRNA与trRNA(也称为tracrRNA)的组合。crRNA和trRNA可以单个RNA分子(单引导RNA,sgRNA)或以两个独立RNA分子(双引导RNA,dgRNA)形式缔合。“引导RNA”或“gRNA”是指每个类型。trRNA可为天然存在的序列或与天然存在的序列相比具有修饰或变异的trRNA序列。
如本文所用,“引导序列”或“引导区”或“间隔子”或“间隔子序列”等是指gRNA内与目标序列互补并且用于通过RNA引导的切口酶将gRNA导引至目标序列以用于结合或修饰(例如,切割)的序列。引导序列的长度可为20个核苷酸,例如,在化脓性链球菌(即,SpyCas9(也称为SpCas9))和相关Cas9同源物/异种同源物的情况下。较短或较长序列也可用作例如长度为15、16、17、18、19、21、22、23、24或25个核苷酸的引导物。引导序列的长度可为20至25个核苷酸,例如,在Nme Cas9的情况下,例如,长度为20、21、22、23、24或25个核苷酸。例如,长度为24个核苷酸的引导序列可与Nme Cas9一起使用,例如,Nme2 Cas9。
在一些实施方案中,目标序列处于例如基因中或染色体上,并且与引导序列互补。在一些实施方案中,引导序列与其相应目标序列之间的互补性或同一性程度可为约75%、80%、85%、90%、95%或100%。在一些实施方案中,引导序列与目标区域可为100%互补或同一的。在其他实施方案中,引导序列与目标区域可含有至少一个错配。例如,引导序列和目标序列可含有1、2、3或4个错配,其中目标序列的总长度为至少17、18、19、20个或更多个碱基对。在一些实施方案中,引导序列和目标区域可含有1至4个错配,其中引导序列包含至少17、18、19、20个或更多个核苷酸。在一些实施方案中,引导序列与目标区域可含有1、2、3或4个错配,其中引导序列包含20个核苷酸。
如本文所用,“目标序列”或“基因组目标序列”是指目标基因中与gRNA的引导序列具有互补性的核酸序列。目标序列与引导序列的相互作用导引经RNA引导的DNA结合剂结合,并且在目标序列内潜在地切刻或切割(取决于试剂活性)。针对Cas蛋白质的目标序列包括基因组DNA的正链和负链两者(即给定序列和所述序列的反向互补序列),因为Cas蛋白质的核酸底物为双链核酸。因此,在引导序列据称“与目标序列互补”的情况下,应理解,引导序列可导引经RNA引导的DNA结合剂(例如dCas9或受损Cas9)以结合至目标序列的反向互补序列。因此,在一些实施方案中,在引导序列结合目标序列的反向互补序列的情况下,引导序列与目标序列(例如不包括PAM的目标序列)的某些核苷酸同一,不同之处在于引导序列中U取代T。
如本文所用,如果第一序列与第二序列的比对显示整个第二序列的X%或更多位置与第一序列匹配,则第一序列被视为“包含与第二序列具有至少X%同一性的序列”。例如,序列AAGA包含与序列AAG具有100%同一性的序列,这是因为第二序列的全部三个位置均存在匹配,因此比对将得到100%同一性。RNA与DNA之间的差异(一般来说,尿苷更换为胸苷或反之亦然)和核苷类似物(例如经修饰的尿苷)的存在不会造成多核苷酸之间同一性或互补性的差异,只要相关核苷酸(例如胸苷、尿苷或经修饰的尿苷)具有相同互补序列(例如针对胸苷、尿苷或经修饰的尿苷均为腺苷;另一实例为胞嘧啶和5-甲基胞嘧啶,这两者都以鸟苷作为互补序列)即可。因此,例如,序列5′-AXG(其中X为任何经修饰的尿苷,例如假尿苷、N1-甲基假尿苷或5-甲氧基尿苷)被视为与AUG具有100%同一性,因为两者与同一序列(5′-CAU)完全互补。示例性比对算法是本领域中众所周知的Smith-Waterman和Needleman-Wunsch算法。本领域技术人员应理解选择何种算法和参数设置才适合于待比对的一对给定序列;对于具有一般类似长度和预期氨基酸有>50%同一性或核苷酸有>75%同一性的序列而言,由EBI在www.ebi.ac.uk网站服务器提供的Needleman-Wunsch算法接口的具有默认设置的Needleman-Wunsch算法通常是适当的。
“mRNA”在本文中用于指一种多核苷酸,其不为DNA并且包含可翻译成多肽(即,可充当供核糖体和氨基酰化tRNA翻译的底物)的开放阅读框。mRNA可包含包括核糖残基或其类似物,例如2′-甲氧基核糖残基的磷酸酯-糖主链。在一些实施方案中,mRNA磷酸酯-糖主链中的糖类基本上由核糖残基、2′-甲氧基核糖残基或其组合组成。一般来说,mRNA不含显著量的胸苷残基(例如0个残基或小于30、20、10、5、4、3或2个胸苷残基;或小于10%、9%、8%、7%、6%、5%、4%、4%、3%、2%、1%、0.5%、0.2%或0.1%的胸苷含量)。mRNA可在其一些或全部尿苷位置处含有经修饰的尿苷。
“经修饰的尿苷”在本文中用于指代除胸苷外的与尿苷具有相同氢键受体并且与尿苷存在一种或多种结构差异的核苷。在一些实施方案中,经修饰的尿苷为经取代的尿苷,即其中一个或多个非质子取代基(例如烷氧基,例如甲氧基)代替质子的尿苷。在一些实施方案中,经修饰的尿苷为假尿苷。在一些实施方案中,经修饰的尿苷为经取代的假尿苷,即其中一个或多个非质子取代(例如烷基,例如甲基)代替质子的假尿苷。在一些实施方案中,经修饰的尿苷为经取代的尿苷、假尿苷或经取代的假尿苷中的任一者。
如本文所用,“尿苷位置”是指多核苷酸中由尿苷或经修饰的尿苷占据的位置。因此,例如,其中“100%的尿苷位置为经修饰的尿苷”的多核苷酸在相同序列的常规RNA(其中所有碱基都为标准A、U、C或G碱基)中应为尿苷的每一位置处均含有经修饰的尿苷。除非另外指明,否则本公开中或所附本公开的序列表(sequence table/sequence listing)的多核苷酸序列中的U可为尿苷或经修饰的尿苷。
如本文所用,给定氨基酸的“最小尿苷密码子”为具有最少尿苷的密码子(通常0个或1个,除了苯丙氨酸的密码子以外,其中最小尿苷密码子具有2个尿苷)。出于评估尿苷含量的目的,经修饰的尿苷残基被视为等同于尿苷。
如本文所用,ORF的“尿苷二核苷酸(UU)含量”可以绝对术语表示为ORF中的UU二核苷酸的计数或基于比率,表示为尿苷二核苷酸的尿苷所占据的位置的百分比(例如,AUUAU的尿苷二核苷酸含量将为40%,因为尿苷二核苷酸的尿苷占据了5个位置中的2个)。出于评估尿苷二核苷酸含量的目的,经修饰的尿苷残基被视为等同于尿苷。
如本文所用,给定氨基酸的“最小腺嘌呤密码子”为具有最少腺嘌呤的密码子(通常为0个或1个,除了赖氨酸和天冬酰胺的密码子以外,其中最小腺嘌呤密码子具有2个腺嘌呤)。出于评估腺嘌呤含量的目的,经修饰的腺嘌呤残基被视为等同于腺嘌呤。
如本文所用,ORF的“腺嘌呤二核苷酸含量”可以绝对术语表示为ORF中的AA二核苷酸计数或基于比率,表示为腺嘌呤二核苷酸的腺嘌呤所占据的位置的百分比(例如,UAAUA的腺嘌呤二核苷酸含量将为40%,因为腺嘌呤二核苷酸的腺嘌呤占据5个位置中的2个)。出于评估腺嘌呤二核苷酸含量的目的,经修饰的腺嘌呤残基视为等同于腺嘌呤。
如本文所用,“插入/缺失”是指由多种核苷酸组成的插入/缺失突变,所述核苷酸例如在目标核酸中的双链断裂(DSB)位点处进行插入或缺失。
如本文所用,“敲低(knockdown)”是指特定基因产物(例如蛋白质、mRNA或两者)的表达降低。可通过检测由组织或细胞群(例如在血清或细胞培养基中)分泌的蛋白质或通过检测来自所关注组织或细胞群的蛋白质的总细胞量来测量蛋白质的敲低。用于测量将mRNA敲低的方法是已知的,并且包括对从所关注的组织或细胞群分离的mRNA进行测序。在一些实施方案中,“敲低”可指特定基因产物的一些表达损失,例如经转录的mRNA的量下降或由细胞群(包括体内细胞群,例如组织中存在的那些)表达或分泌的蛋白质的量下降。
如本文所用,“敲除(knockout)”是指细胞中的特定蛋白质的表达损失。敲除可通过检测由组织或细胞群(例如血清或细胞培养基中)分泌的蛋白质的量或通过检测来自组织或细胞群的蛋白质的总细胞量来测量。在一些实施方案中,本公开的方法在一种或多种细胞(例如在细胞群,包括体内细胞群,例如组织中存在的那些)“敲除”目标蛋白。在一些实施方案中,敲除并非例如由插入/缺失产生的目标蛋白的突变体的形成,而是目标蛋白在细胞中的表达的完全损失,即,表达下降至所用测定的检测水平之下。
如本文所用,术语“核定位信号”(NLS)或“核定位序列”是指诱导包含此类序列或连接到此类序列的分子输送至真核细胞的细胞核的氨基酸序列。核定位信号可形成待输送的分子的一部分。在一些实施方案中,NLS可通过共价键、氢键或离子相互作用与分子融合。在一些实施方案中,NLS可经由接头与分子融合。
如本文所用,“β2M”或“B2M”是指“β-2微球蛋白”的核酸序列或蛋白质序列;人类基因具有登录编号NC_000015(范围44711492..44718877),参考GRCh38.p13。B2M蛋白与MHC I类分子缔合为成核细胞表面上的异二聚体并且为MHC I类蛋白质表达所需。
如本文所用,“CIITA”或“CIITA”或“C2TA”是指“II类主要组织相容性复合物反式激活因子”的核酸序列或蛋白质序列;人类基因具有登录编号NC_000016.10(范围10866208..10941562),参考GRCh38.p13。细胞核中的CIITA蛋白充当MHC II类基因转录的正调控剂并且为MHC II类蛋白质表达所需。
如本文所用,“MHC”或“MHC分子”或“MHC蛋白质”或“MHC复合物”是指一个主要组织相容性复合物分子(或多个),并且包括例如MHC I类和MHC II类分子。在人类中,MHC分子称为“人类白细胞抗原”复合物或“HLA分子”或“HLA蛋白质”。术语“MHC”和“HLA”的使用不旨在为限制性的;如本文所用,术语“MHC”可用于指人类MHC分子,即HLA分子。因此,术语“MHC”和“HLA”在本文中可互换使用。
如本文所用,HLA-A蛋白的上下文中的术语“HLA-A”是指MHC I类蛋白质分子,其为由重链(由HLA-A基因编码)和轻链(即β-2微球蛋白)组成的异二聚体。如本文所用,在核酸的上下文中的术语“HLA-A”或“HLA-A基因”是指编码HLA-A蛋白分子的重链的基因。HLA-A基因也称为“HLA I类组织相容性,Aα链”;人类基因具有登录编号NC_000006.12(29942532..29945870)。已知HLA-A基因跨群体具有数千种不同型式(也称为“等位基因”)(并且个体可接受HLA-A基因的两种不同等位基因)。HLA-A等位基因的公共数据库(包括序列信息)可访问IPD-IMGT/HLA:https://www.ebi.ac.uk/ipd/imgt/hla/。HLA-A的所有等位基因都由术语“HLA-A”和“HLA-A基因”涵盖。
如本文在核酸的上下文中所用的“HLA-B”是指编码HLA-B蛋白分子的重链的基因。HLA-B也称为“HLA I类组织相容性,Bα链”;人类基因具有登录编号NC_000006.12(31353875..31357179)。
如本文在核酸的上下文中所用的术语“HLA-C”是指编码HLA-C蛋白分子的重链的基因。HLA-C也称为“HLA I类组织相容性,Cα链”;人类基因具有登录编号NC_000006.12(31268749..31272092)。
如本文在核酸的上下文中所用的“TRBC1”和“TRBC2”是指编码T细胞受体β-链的两个同源基因。“TRBC”或“TRBC1/2”在本文中用以指代TRBC1和TRBC2。人类野生型TRBC1序列可以NCBI基因ID:28639;Ensembl:ENSG00000211751获得。T细胞受体β恒定区、V_区段翻译产物、BV05S1J2.2、TCRBC1和TCRB为TRBC1的基因同义词。人类野生型TRBC2序列可以NCBI基因ID:28638;Ensembl:ENSG00000211772获得。T细胞受体β恒定区、V_区段翻译产物和TCRBC2为TRBC2的基因同义词。
如本文在核酸的上下文中所用的“TRAC”是指编码T细胞受体α链的基因。人类野生型TRAC序列可以NCBI基因ID:28755;Ensembl:ENSG00000277734获得。T细胞受体α恒定区、TCRA、IMD7、TRCA和TRA是TRAC的基因同义词。
如本文所用,术语“同型接合”是指具有特定基因的两个相同等位基因。
如本文所用,“治疗(treatment)”是指施用或施加用于受试者的疾病或病症的治疗剂,并且包括抑制疾病、遏制其发展、减轻疾病的一种或多种症状、治愈疾病或预防疾病的一种或多种症状,包括症状复发。
如本文所用,“递送”和“施用”可互换地使用,并且包括离体和体内应用。
如本文所用,共同施用意指多种物质在时间上足够接近地一起施用,以使得与药剂一起作用。共同施用涵盖在单个制剂中一起施用物质和在单独制剂中在时间上足够接近地施用物质以使得药剂一起作用。
如本文所用,短语“药学上可接受”意指在制备药物组合物时有用的,所述药物组合物通常无毒并且在生物学上并非不合需要并且在其他方面对于医药用途并非不可接受的。药学上可接受通常是指非热解物质。药学上可接受可指无菌物质,尤其是对于注射或输注用的医药物质。
如本文所用,“受试者”是指动物界的任何成员。在一些实施方案中,“受试者”是指人类。在一些实施方案中,“受试者”是指非人类动物。在一些实施方案中,“受试者”是指灵长类动物。在一些实施方案中,受试者包括但不限于哺乳动物、鸟类、爬行动物、两栖动物、鱼类、昆虫和/或蠕虫。在某些实施方案中,非人类受试者为哺乳动物(例如啮齿动物、小鼠、大鼠、兔、猴、犬、猫、绵羊、牛、灵长类动物和/或猪)。在一些实施方案中,受试者可为转基因动物、基因工程化动物和/或克隆。在本发明的某些实施方案中,受试者为成年人、青年或婴儿。在一些实施方案中,使用术语“个体”或“患者”并且希望可与“受试者”互换。
如本文所用,细胞上蛋白质的表达“降低或消除”是指相对于未经修饰的细胞而言,蛋白质的表达部分或完全损失。在一些实施方案中,通过流式细胞术测量细胞上蛋白质的表面表达,并且相对于未经修饰的细胞具有“降低或消除的”表面表达,如通过用针对蛋白质的相同抗体染色后荧光信号的减少所证明。通过流式细胞术相对于未经修饰的细胞具有“降低或消除的”蛋白质表面表达的细胞可称为对于所述蛋白质的表达为“阴性的”,如通过类似于用同型对照抗体染色的细胞的荧光信号所证明。“降低或消除的”蛋白质表达可利用本领域技术人员已知的适当对照,通过本领域中的其他已知技术来测量。
II.示例性组合物和方法
在一些实施方案中,提供了一种核酸,所述核酸包含编码包含胞苷脱氨酶(例如A3A)和RNA引导的切口酶的多肽的开放阅读框,其中所述多肽不包含尿嘧啶糖苷酶抑制剂(UGI)。在一些实施方案中,所述核酸为DNA或RNA。在一些实施方案中,所述核酸为mRNA。在一些实施方案中,提供了一种由mRNA编码的多肽。
在一些实施方案中,提供了一种多肽或编码所述多肽的mRNA,所述多肽包含胞苷脱氨酶和RNA引导的切口酶,其中所述多肽不包含UGI。在一些实施方案中,所述胞苷脱氨酶为A3A。在一些实施方案中,所述RNA引导的切口酶不包含尿嘧啶糖苷酶抑制剂(UGI)。在一些实施方案中,提供了一种组合物,所述组合物包含:第一多肽或编码第一多肽的mRNA,所述第一多肽包含胞苷脱氨酶(例如A3A)和RNA引导的切口酶;和第二多肽或编码第二多肽的mRNA,所述第二多肽包含尿嘧啶糖苷酶抑制剂(UGI),其中所述第二多肽不同于所述第一多肽。
在一些实施方案中,提供了一种组合物,所述组合物包含:第一核酸,其包含编码包含胞苷脱氨酶(例如A3A)和RNA引导的切口酶的多肽的第一开放阅读框;和第二核酸,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框,其中所述第二核酸不同于所述第一核酸。在一些实施方案中,所述第一核酸编码不包含UGI的多肽。
在一些实施方案中,提供了一种修饰目标基因的方法,所述方法包括施用本文所描述的组合物。在一些实施方案中,所述方法包括向细胞递送:第一核酸,其包含编码包含胞苷脱氨酶(例如A3A)和RNA引导的切口酶的第一多肽的第一开放阅读框;和第二核酸,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框,其中所述第二核酸不同于所述第一核酸。
在一些实施方案中,所述方法包括向细胞递送包含胞苷脱氨酶(例如A3A)和RNA引导的切口酶的多肽或编码所述多肽的核酸,并且单独地(例如,不经由同一核酸构建体)向细胞递送尿嘧啶糖苷酶抑制剂(UGI)或编码所述UGI的核酸。
在一些实施方案中,编码UGI的mRNA与编码胞苷脱氨酶(例如A3A)和RNA引导的切口酶的mRNA的摩尔比为约1∶35至约30∶1。在一些实施方案中,所述摩尔比为约1∶25至约25∶1。在一些实施方案中,所述摩尔比为约1∶20至约25∶1。在一些实施方案中,所述摩尔比为约1∶10至约22∶1。在一些实施方案中,所述摩尔比为约1∶5至约25∶1。在一些实施方案中,所述摩尔比为约1∶1至约30∶1。在一些实施方案中,所述摩尔比为约2∶1至约10∶1。在一些实施方案中,所述摩尔比为约5∶1至约20∶1。在一些实施方案中,所述摩尔比为约1∶1至约25∶1。在一些实施方案中,所述摩尔比可为约1∶35、1∶34、1∶33、1∶32、1∶31、1∶30、1∶32、1∶31、1∶30、1∶29、1∶28、1∶27、1∶26、1∶25、1∶24、1∶23、1∶22、1∶21、1∶20、1∶19、1∶18、1∶17、1∶16、1∶15、1∶14、1∶13、1∶12、1∶11、1∶10、1∶9、1∶8、1∶7、1∶6、1∶5、1∶4、1∶3、1∶2、1∶1、2∶1、3∶1、4∶1、5∶1、6∶1、7∶1、8∶1、9∶1、10∶1、11∶1、12∶1、13∶1、14∶1、15∶1、16∶1、17∶1、18∶1、19∶1、20∶1、21∶1、22∶1、23∶1、24∶1、25∶1、26∶1、27∶1、28∶1、29∶1或30∶1。在一些实施方案中,所述摩尔比等于或大于约1∶1。在一些实施方案中,所述摩尔比为约1∶1。在一些实施方案中,所述摩尔比为约2∶1。在一些实施方案中,所述摩尔比为约3∶1。在一些实施方案中,所述摩尔比为约4∶1。在一些实施方案中,所述摩尔比为约5∶1。在一些实施方案中,所述摩尔比为约6∶1。在一些实施方案中,所述摩尔比为约7∶1。在一些实施方案中,所述摩尔比为约8∶1。在一些实施方案中,所述摩尔比为约9∶1。在一些实施方案中,所述摩尔比为约10∶1。在一些实施方案中,所述摩尔比为约11∶1。在一些实施方案中,所述摩尔比为约12∶1。在一些实施方案中,所述摩尔比为约13∶1。在一些实施方案中,所述摩尔比为约14∶1。在一些实施方案中,所述摩尔比为约15∶1。在一些实施方案中,所述摩尔比为约16∶1。在一些实施方案中,所述摩尔比为约17∶1。在一些实施方案中,所述摩尔比为约18∶1。在一些实施方案中,所述摩尔比为约19∶1。在一些实施方案中,所述摩尔比为约20∶1。在一些实施方案中,所述摩尔比为约21∶1。在一些实施方案中,所述摩尔比为约22∶1。在一些实施方案中,所述摩尔比为约23∶1。在一些实施方案中,所述摩尔比为约24∶1。在一些实施方案中,所述摩尔比为约25∶1。
类似地,在一些实施方案中,如果递送蛋白质,则上文关于编码UGI蛋白质的mRNA与编码胞苷脱氨酶(例如A3A)和RNA引导的切口酶的mRNA所论述的摩尔比类似。
例如,在一些实施方案中,待递送的UGI蛋白质与待递送的胞苷脱氨酶(例如A3A)和RNA引导的切口酶的摩尔比为约1∶35至约30∶1。在一些实施方案中,所述摩尔比为约1∶1至约30∶1。
在一些实施方案中,UGI肽与胞苷脱氨酶(例如A3A)和RNA引导的切口酶的摩尔比为约10∶1至约50∶1。在一些实施方案中,所述摩尔比可为约10∶1、11∶1、12∶1、13∶1、14∶1、15∶1、16∶1、17∶1、18∶1、19∶1、20∶1、21∶1、22∶1、23∶1、24∶1、25∶1、26∶1、27∶1、28∶1、29∶1、30∶1、31∶1、32∶1、33∶1、34∶1、35∶1、36∶1、37∶1、38∶1、39∶1、40∶1、41∶1、42∶1、43∶1、44∶1、45∶1、46∶1、47∶1、48∶1、49∶1或50∶1。在一些实施方案中,所述摩尔比为约10∶1至约40∶1。在一些实施方案中,所述摩尔比为约10∶1至约30∶1。在一些实施方案中,所述摩尔比为约2∶1。在一些实施方案中,所述摩尔比为约10∶1至约20∶1。在一些实施方案中,所述摩尔比为约10∶1至约15∶1。在一些实施方案中,所述摩尔比为约15∶1至约50∶1。在一些实施方案中,所述摩尔比为约6∶1。在一些实施方案中,所述摩尔比为约20∶1至约50∶1。在一些实施方案中,所述摩尔比为约8∶1。在一些实施方案中,所述摩尔比为约30∶1至约50∶1。在一些实施方案中,所述摩尔比为约30∶1至约40∶1。在一些实施方案中,所述摩尔比为约11∶1。在一些实施方案中,所述摩尔比为约20∶1至约30∶1。
在一些实施方案中,本文中所描述的组合物还包含至少一种gRNA。在一些实施方案中,提供了一种组合物,所述组合物包含本文所述的mRNA和至少一种gRNA。在一些实施方案中,所述gRNA为单引导RNA(sgRNA)。在一些实施方案中,所述gRNA为双引导gRNA(dgRNA)。
在一些实施方案中,组合物在施用于受试者之后能够实现基因组编辑。
A.UGI
在不受任何理论束缚的情况下,提供UGI以及包含脱氨酶的多肽可通过抑制细胞DNA修复机制(例如UDG和下游修复效应子)而有助于本文所描述的方法,所述机制将识别DNA中的尿嘧啶作为DNA损伤形式或以其他方式将切除或修饰尿嘧啶和/或周围核苷酸。应理解,UGI的用途可提高能够对C残基进行脱氨的酶的编辑效率。
本文中提供合适的UGI蛋白质和核苷酸序列,并且其他合适的UGI序列是本领域技术人员已知的,并且包括例如以下文献中所公开的那些:Wang等人,Uracil-DNAglycosylase inhibitor gene of bacteriophage PBS2 encodes a binding proteinspecific for uracil-DNA glycosylase.J.Biol.Chem.264:1 163-1 171(1989);Lundquist等人,Site-directed mutagenesis and characterization of uracil-DNAglycosylase inhibitor protein.Role of specific carboxylic amino acids incomplex formation with Escherichia coli uracil-DNAglycosylase.J.Biol.Chem.272:21408-21419(1997);Ravishankar等人,X-ray analysisof a complex of Escherichia coli uracil DNA glycosylase(EcUDG)with aproteinaceous inhibitor.The structure elucidation of a prokaryoticUDG.Nucleic Acids Res.26:4880-4887(1998);和Putnam等人,Protein mimicry of DNAfrom crystal structures of the uracil-DNA glycosylase inhibitor protein andits complex with Escherichia coli uracil-DNA glycosylase.J.Mol.Biol.287:331-346(1999),每一者的全部内容通过引用并入本文。应了解,能够抑制尿嘧啶-DNA糖苷酶碱基切除修复酶的任何蛋白质都在本公开的范围内。另外,阻断或抑制碱基切除修复的任何蛋白质也在本公开的范围内。在一些实施方案中,尿嘧啶糖苷酶抑制剂为结合尿嘧啶的蛋白质。在一些实施方案中,尿嘧啶糖苷酶抑制剂为结合DNA中的尿嘧啶的蛋白质。在一些实施方案中,尿嘧啶糖苷酶抑制剂为单链结合蛋白。在一些实施方案中,尿嘧啶糖苷酶抑制剂为无催化活性尿嘧啶DNA-糖苷酶蛋白质。在一些实施方案中,尿嘧啶糖苷酶抑制剂为不从DNA切除尿嘧啶的无催化活性尿嘧啶DNA-糖苷酶蛋白质。在一些实施方案中,尿嘧啶糖苷酶抑制剂为无催化活性UDG。
在一些实施方案中,本文中所公开的尿嘧啶糖苷酶抑制剂(UGI)包含与SEQ IDNO:27或43具有至少80%同一性的氨基酸序列。在一些实施方案中,前述同一性水平中的任一者为至少90%、至少95%、至少98%、至少99%或100%。在一些实施方案中,UGI包含与SEQ ID NO:27或43具有至少90%同一性的氨基酸序列。在一些实施方案中,UGI包含与SEQID NO:27或43具有至少95%同一性的氨基酸序列。在一些实施方案中,UGI包含与SEQ IDNO:27或43具有至少98%同一性的氨基酸序列。在一些实施方案中,UGI包含与SEQ ID NO:27或43具有至少99%同一性的氨基酸序列。在一些实施方案中,UGI包含SEQ ID NO:27或43的氨基酸序列。
B.胞苷脱氨酶
胞苷脱氨酶涵盖胞苷脱氨酶超家族中的酶,并且特别是APOBEC家族的酶(酶的APOBEC1、APOBEC2、APOBEC4和APOBEC3亚群)、活化诱导的胞苷脱氨酶(AID或AICDA)和CMP脱氨酶(参见例如Conticello等人,Mol.Biol.Evol.22:367-77,2005;Conticello,GenomeBiol.9:229,2008;Muramatsu等人,J.Biol.Chem.274:18470-6,1999;和Carrington等人,Cells 9:1690(2020))。
在一些实施方案中,本文公开的胞苷脱氨酶是APOBEC家族的酶。在一些实施方案中,本文所公开的胞苷脱氨酶为APOBEC1、APOBEC2、APOBEC4和APOBEC3亚群的酶。在一些实施方案中,本文公开的胞苷脱氨酶为APOBEC3亚群的酶。在一些实施方案中,本文公开的胞苷脱氨酶为APOBEC3A脱氨酶(A3A)。
在一些实施方案中,胞苷脱氨酶为:
(i)APOBEC家族的酶,任选地为APOBEC3亚群的酶;
(ii)包含与SEQ ID NO:40、41和960-1023中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;
(iii)包含与SEQ ID NO:40、41和960-1013中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;
(iv)包含与SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;或
(v)包含与SEQ ID NO:40、976、981、984、986和1014-1023中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶。
在一些实施方案中,胞苷脱氨酶为包含与SEQ ID NO:40、41和960-1023具有至少80%、85%、87%、90%、95%、98%、99%或100%同一性的氨基酸序列的胞苷脱氨酶。在一些实施方案中,胞苷脱氨酶为包含与SEQ ID NO:40、41和960-1013中的任一者至少80%、85%、87%、90%、95%、98%、99%或100%同一的氨基酸序列的胞苷脱氨酶。在一些实施方案中,胞苷脱氨酶为包含与SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者至少80%、85%、87%、90%、95%、98%、99%或100%同一的氨基酸序列的胞苷脱氨酶。在一些实施方案中,胞苷脱氨酶为包含与SEQ ID NO:40、976、981、984、986和1014-1023中的任一者至少80%、85%、87%、90%、95%、98%、99%或100%同一的氨基酸序列的胞苷脱氨酶。在一些实施方案中,胞苷脱氨酶为包含与SEQ ID NO:976、977、993-1006和1009至少80%、85%、87%、90%、95%、98%、99%或100%同一的氨基酸序列的胞苷脱氨酶。
1.APOBEC3A脱氨酶
在一些实施方案中,本文中所公开的APOBEC3A脱氨酶(A3A)为人类A3A。在一些实施方案中,A3A为野生型A3A。
在一些实施方案中,A3A为A3A变体。A3A变体与野生型A3A或其片段共享同源性。在一些实施方案中,A3A变体与野生型A3A具有至少约80%同一性、至少约85%同一性、至少约90%同一性、至少约95%同一性、至少约96%同一性、至少约97%同一性、至少约98%同一性、至少约99%同一性、至少约99.5%同一性或至少约99.9%同一性。在一些实施方案中,与野生型A3A相比较,A3A变体可具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个氨基酸改变。在一些实施方案中,A3A变体包含A3A的片段,使得所述片段与野生型A3A的对应片段具有至少约80%同一性、至少约90%同一性、至少约95%同一性、至少约96%同一性、至少约97%同一性、至少约98%同一性、至少约99%同一性、至少约99.5%同一性或至少约99.9%同一性。
在一些实施方案中,A3A变体为具有与野生型A3A蛋白质相差一个或若干个突变的序列的蛋白质,所述一个或若干个突变例如取代、缺失、插入、一个或若干个单点取代。在一些实施方案中,缩短的A3A序列可例如通过使N末端、C末端或内部氨基酸缺失来使用。在一些实施方案中,使用缩短的A3A序列,其中序列的C末端处的一至四个氨基酸缺失。在一些实施方案中,APOBEC3A(例如人类APOBEC3A)具有野生型氨基酸位置57(如野生型序列中所编号)。在一些实施方案中,APOBEC3A(例如人类APOBEC3A)在氨基酸位置57(如野生型序列中所编号)处具有天冬酰胺。
在一些实施方案中,野生型A3A为人类A3A(UniPROT登录ID:p319411,SEQ ID NO:40)。
在一些实施方案中,本文中所公开的A3A包含与SEQ ID NO:40具有至少80%同一性的氨基酸序列。在一些实施方案中,同一性水平为至少85%、至少87%、至少90%、至少95%、至少98%、至少99%或100%。在一些实施方案中,A3A包含与SEQ ID NO:40具有至少87%同一性的氨基酸序列。在一些实施方案中,A3A包含与SEQ ID NO:40具有至少90%同一性的氨基酸序列。在一些实施方案中,A3A包含与SEQ ID NO:40具有至少95%同一性的氨基酸序列。在一些实施方案中,A3A包含与SEQ ID NO:40具有至少98%同一性的氨基酸序列。在一些实施方案中,A3A包含与A3A ID NO:40具有至少99%同一性的氨基酸序列。在一些实施方案中,A3A包含SEQ ID NO:40的氨基酸序列。
C.接头
在一些实施方案中,包含本文中所描述的A3A和RNA引导的切口酶的多肽还包含连接A3A与RNA引导的切口酶的接头。在一些实施方案中,接头为有机分子、聚合物或化学部分。在一些实施方案中,接头为肽接头。在一些实施方案中,编码包含A3A和RNA引导的切口酶的多肽的核酸还包含编码肽接头的序列。提供了编码A3A-接头-RNA-引导的切口酶融合蛋白的mRNA。
在一些实施方案中,肽接头为具有至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个或更多个氨基酸的任一段氨基酸。
在一些实施方案中,肽接头为16个残基“XTEN”接头或其变体(参见例如实施例;和Schellenberger等人,A recombinant polypeptide extends the in vivo half-life ofpeptides and proteins in a tunable manner.Nat.Biotechnol.27,1186-1190(2009))。在一些实施方案中,XTEN接头包含为SGSETPGTSESATPES(SEQ ID NO:46)、SGSETPGTSESA(SEQ ID NO:47)或SGSETPGTSESATPEGGSGGS(SEQ ID NO:48)中的任一者的序列。在一些实施方案中,XTEN接头由序列SGSETPGTSESATPES(SEQ ID NO:46)、SGSETPGTSESA(SEQ ID NO:47)或SGSETPGTSESATPEGGSGGS(SEQ ID NO:48)组成。
在一些实施方案中,肽接头包含(GGGGS)n(例如,SEQ ID NO:212、216、221、240)、(G)n、(EAAAK)n((例如,SEQ ID NO:213、219、267)、(GGS)n、SGSETPGTSESATPES(SEQ ID NO:46)基序(参见例如Guilinger J P,Thompson D B,Liu D R.Fusion of catalyticallyinactive Cas9 to FokI nuclease improves the specificity of genome modification.Nat.Biotechnol.2014;32(6):577-82;其全部内容通过引用并入本文),或(XP)n基序,或这些中的任一者的组合,其中n独立地为1与30之间的整数。参见WO2015089406,例如段落[0012],其全部内容通过引用并入本文。
在一些实施方案中,肽接头包含选自SEQ ID NO:46-59、61和211-272的一个或多个序列。在一些实施方案中,肽接头包含选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:268、SEQ ID NO:269、SEQ ID NO:270、SEQ ID NO:271和SEQ ID NO:272的一个或多个序列。在一些实施方案中,肽接头包含序列SEQ ID NO:268。
D.RNA引导的切口酶
在一些实施方案中,本文中所公开的RNA引导的切口酶为Cas切口酶。在一些实施方案中,RNA引导的切口酶来自特异性Cas核酸酶,其中其催化域未活化。在一些实施方案中,RNA引导的切口酶为2类Cas切口酶,例如Cas9切口酶或Cpf1切口酶。在一些实施方案中,RNA引导的切口酶为化脓性链球菌Cas9切口酶。在一些实施方案中,RNA引导的切口酶为脑膜炎奈瑟菌(Neisseria meningitidis)Cas9切口酶。
在一些实施方案中,RNA引导的切口酶为经修饰的2类Cas蛋白质或衍生自2类Cas蛋白质。在一些实施方案中,RNA引导的切口酶经修饰或衍生自Cas蛋白质,例如2类Cas核酸酶(其可例如为II型、V型或VI型Cas核酸酶)。2类Cas核酸酶包括例如Cas9、Cpf1、C2c1、C2c2和C2c3蛋白质和其修饰。Cas9核酸酶的实例包括化脓性链球菌、金黄色葡萄球菌(S.aureus)和其他原核生物(参见例如下一段落中的列表)的II型CRISPR系统的那些和其经修饰(例如,工程化或突变)的型式。参见例如US2016/0312198 A1;US 2016/0312199 A1,其通过引用整体并入本文。Cas核酸酶的其他实例包括III型CRISPR系统的Csm或Cmr复合物或其Cas10、Csm1或Cmr2亚基;和I型CRISPR系统的级联复合物或其Cas3亚基。在一些实施方案中,Cas核酸酶可来自第IIA型、第IIB型或第IIC型系统。关于各种CRISPR系统和Cas核酸酶的论述,参见例如Makarova等人,NAT.REV.MICROBIOL.9:467-477(2011);Makarova等人,NAT.REV.MICROBIOL,13:722-36(2015);Shmakov等人,MOLECULAR CELL,60:385-397(2015)。
本文中所描述的Cas切口酶可为来自包括但不限于以下物种的Cas核酸酶的切口酶形式:酿脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcusthermophiles)、链球菌属、金黄色葡萄球菌(Staphylococcus aureus)、无害李斯特氏菌(Listeria innocua)、加氏乳杆菌(Lactobacillus gasseri)、新凶手弗朗西斯氏菌(Francisella novicida)、产琥珀酸沃廉菌(Wolinella succinogenes)、华德萨特菌(Sutterellawadsworthensis)、伽马变形菌(Gammaproteobacterium)、脑膜炎奈瑟菌、空肠弯曲杆菌(Campylobacter jejuni)、多杀巴斯德菌(Pasteurella multocida)、产琥珀酸纤维杆菌(Fibrobacter succinogene)、深红红螺菌(Rhodospirillum rubrum)、达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomycespristinaespiralis)、产绿色链霉菌(Streptomyces viridochromogenes)、粉红链孢囊菌(Streptosporangium roseum)、嗜酸热脂环杆菌(Alicyclobacillus acidocaldarius)、假蕈状芽孢杆菌(Bacillus pseudomycoides)、砷还原芽孢杆菌(Bacillusselenitireducens)、西伯利亚微小杆菌(Exiguobacterium sibiricum)、戴白氏乳杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillus salivarius)、布氏乳杆菌(Lactobacillus buchneri)、齿垢密螺旋体(Treponema denticola)、海洋微颤菌(Microscilla marina)、伯克霍尔德氏细菌(Burkholderiales bacterium)、食萘极地单胞菌(Polaromonas naphthalenivorans)、单胞菌属(Polaromonas sp.)、瓦氏鳄球藻(Crocosphaera watsonii)、鳄球藻属、铜绿微囊藻(Microcystis aeruginosa)、聚球藻属(Synechococcus sp.)、阿拉伯糖醋杆菌(Acetohalobium arabaticum)、根制氨菌(Ammonifex degensii)、热解纤维素菌(Caldicelulosiruptor becscii)、辐射合成细菌(Candidatus Desulforudis)、肉毒梭菌(Clostridium botulinum)、艰难梭菌(Clostridium difficile)、大芬戈尔德菌(Finegoldia magna)、嗜热盐碱厌氧菌(Natranaerobius thermophiles)、嗜热丙酸厌氧肠状菌(Pelotomaculumthermopropionicum)、嗜酸性喜温硫杆菌(Acidithiobacillus caldus)、嗜酸氧化亚铁硫杆菌(Acidithiobacillus ferrooxidans)、酒色异着色菌(Allochromatium vinosum)、海杆菌属(Marinobacter sp.)、嗜盐亚硝化球菌(Nitrosococcus halophilus)、瓦氏亚硝化球菌(Nitrosococcus watsoni)、游海假交替单胞菌(Pseudoalteromonas haloplanktis)、Ktedonobacter racemifer、发现甲烷耐盐菌(Methanohalobium evestigatum)、变异念珠藻(Anabaena variabilis)、泡沫节球藻(Nodularia spumigena)、念珠藻属(Nostoc sp.)、极大节旋藻(Arthrospira maxima)、钝顶节旋藻(Arthrospira platensis)、节旋藻属(Arthrospira sp.)、螺旋藻属(Lyngbya sp.)、原型微鞘藻(Microcoleuschthonoplastes)、颤藻属(Oscillatoria sp.)、运动石袍菌(Petrotoga mobilis)、非洲高热杆菌(Thermosipho afficanus)、巴氏链球菌(Streptococcus pasteurianus)、灰色奈瑟球菌(Neisseria cinerea)、红嘴鸥弯曲杆菌(Campylobacter lari)、食清洁剂细小棒菌(Parvibaculum lavamentivorans)、白喉棒状杆菌(Corynebacterium diphtheria)、氨基酸球菌属(Acidaminococcus sp.)、毛螺科菌(Lachnospiraceae bacterium)ND2006或海洋无核氯菌(Acaryochloris marina)。
在一些实施方案中,Cas切口酶为来自酿脓链球菌的Cas9核酸酶的切口酶形式。在一些实施方案中,Cas切口酶为来自嗜热链球菌的Cas9核酸酶的切口酶形式。在一些实施方案中,Cas切口酶为来自脑膜炎奈瑟菌的Cas9核酸酶的切口酶形式。参见例如WO/2020081568,描绘Nme2Cas9 D16A切口酶。在一些实施方案中,Cas切口酶为来自金黄色葡萄球菌的Cas9核酸酶的切口酶形式。在一些实施方案中,Cas切口酶为来自新凶手弗朗西斯氏菌的Cpfl核酸酶的切口酶形式。在一些实施方案中,Cas切口酶为来自氨基酸球菌属的Cpfl核酸酶的切口酶形式。在一些实施方案中,Cas切口酶为来自毛螺科菌ND2006的Cpf1核酸酶的切口酶形式。在其他实施方案中,Cas切口酶为来自以下的Cpf1核酸酶的切口酶形式:土拉文氏杆菌(Francisella tularensis)、毛螺科菌、瘤胃溶纤维丁酸弧菌(Butyrivibrioproteoclasticus)、佩氏细菌(Peregrinibacteria bacterium)、帕库氏菌(Parcubacteriabacterium)、史密斯氏菌(Smithella)、氨基酸球菌属、白蚁甲烷支原体菌候选种(Candidatus Methanoplasma termitum)、挑剔真杆菌(Eubacterium eligens)、牛眼莫拉菌(Moraxella bovoculi)、稻田钩端螺旋体(Leptospira inadai)、狗口腔卟啉单胞菌(Porphyromonas crevioricanis)、解糖胨普雷沃菌(Prevotella disiens)或猕猴卟啉单胞菌(Porphyromonas macacae)。在某些实施方案中,Cas切口酶为来自氨基酸球菌属或毛螺菌科的Cpfl核酸酶的切口酶形式。如别处所论述,切口酶可衍生自(即相关于)特异性Cas核酸酶,因为切口酶为核酸酶的一种形式,其中其两个催化域中的一者例如通过使核溶解必不可少的活性位点残基如Spy Cas9中的D10、H840或N863突变而失活。本领域技术人员将熟悉容易地鉴定其他Cas蛋白质中的对应残基的技术,例如序列比对和结构比对,其将在下文详细论述。
在其他实施方案中,Cas切口酶可涉及I型CRISPR/Cas系统。在一些实施方案中,Cas切口酶可为I型CRISPR/Cas系统的级联复合物的组分。在一些实施方案中,Cas切口酶可为Cas3蛋白质。在一些实施方案中,Cas切口酶可来自III型CRISPR/Cas系统。
在一些实施方案中,Cas切口酶为其中例如通过催化域中的一个或多个变化(例如,点突变)使核酸内切酶活性位点失活的Cas核酸酶或经修饰的Cas核酸酶的切口酶形式。关于Cas切口酶和示例性催化域改变的论述,参见例如美国专利第8,889,356号。
野生型化脓性链球菌Cas9具有两个催化域:RuvC和HNH。RuvC域切割非目标DNA链,并且HNH域切割DNA的目标链。在一些实施方案中,Cas核酸酶可在RuvC或RuvC样核酸酶域中包含氨基酸取代。RuvC或RuvC样核酸酶域中的示例性氨基酸取代包括D10A(基于化脓性链球菌Cas9蛋白质)。参见例如Zetsche等人(2015)Cell 10月22:163(3):759-771。在一些实施方案中,Cas核酸酶可包含HNH或HNH样核酸酶域中的氨基酸取代。HNH或HNH样核酸酶域中的示例性氨基酸取代包括E762A、H840A、N863A、H983A和D986A(基于化脓性链球菌Cas9蛋白质)。参见例如Zetsche等人(2015)。其他示例性氨基酸取代包括D917A、E1006A和D1255A(基于新凶手弗朗西斯氏菌U112Cpf1(FnCpf1)序列(UniProtKB-A0Q7Q2(CPF1_FRATN))。
在一些实施方案中,Cas切口酶如Cas9切口酶具有失活的RuvC或HNH域。在一些实施方案中,使用具有活性降低的RuvC域的切口酶。在一些实施方案中,使用具有非活性RuvC域的切口酶。在一些实施方案中,使用具有活性降低的HNH域的切口酶。在一些实施方案中,使用具有非活性HNH域的切口酶。
在一些实施方案中,Cas9切口酶具有活性HNH核酸酶域并且能够切割DNA的非靶向链,即与gRNA结合的链,并且具有非活性RuvC核酸酶域并且不能切割DNA的靶向链,即需要脱氨酶进行碱基编辑的链。
示例性Cas9切口酶氨基酸序列提供为SEQ ID NO:70。包括起始和终止密码子的示例性Cas9切口酶mRNA ORF序列提供为SEQ ID NO:71。适合于包括在融合蛋白中的示例性Cas9切口酶mRNA编码序列提供为SEQ ID NO:72。
在一些实施方案中,RNA引导的切口酶为本文中所描述的2类Cas切口酶。在一些实施方案中,RNA引导的切口酶为本文中所描述的Cas9切口酶。
在一些实施方案中,RNA引导的切口酶为本文中所描述的化脓性链球菌Cas9切口酶。
在一些实施方案中,RNA引导的切口酶为本文中所描述的D10A SpyCas9切口酶。在一些实施方案中,RNA引导的切口酶包含与SEQ ID NO:70、73或76具有至少80%、90%、95%、98%或99%同一性的氨基酸序列。在一些实施方案中,RNA引导的切口酶包含SEQ IDNO:70的氨基酸序列。
在一些实施方案中,mRNA ORF序列包含编码RNA引导的切口酶,其包括起始和终止密码子,包含与SEQ ID NO:71、74或77中的任一者的核苷酸序列具有至少80%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,编码RNA引导的切口酶的mRNA序列包含与SEQ ID NO:72、75或78中的任一者的核苷酸序列具有至少80%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,同一性水平为至少90%。在一些实施方案中,同一性水平为至少95%。在一些实施方案中,同一性水平为至少98%。在一些实施方案中,同一性水平为至少99%。在一些实施方案中,同一性水平为至少100%。在一些实施方案中,编码RNA引导的切口酶的序列包含SEQ ID NO:71、72、74、75、77或78中的任一者的核苷酸序列。
在一些实施方案中,RNA引导的切口酶为本文中所描述的脑膜炎奈瑟菌(Nme)Cas9切口酶。
在一些实施方案中,RNA引导的切口酶为本文中所描述的D16A NmeCas9切口酶。在一些实施方案中,D16A NmeCas9切口酶为D16A Nme2Cas9切口酶。在一些实施方案中,D16ANme2Cas9切口酶包含与SEQ ID NO:387至少80%、90%、95%、98%、99%或100%同一的氨基酸序列。在一些实施方案中,编码D16A Nme2Cas9的序列包含与SEQ ID NO:388-393中的任一者至少80%、90%、95%、98%、99%或100%同一的核苷酸序列。
E.包含胞苷脱氨酶和RNA引导的切口酶的组合物
在一些实施方案中,提供了一种编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的mRNA,其中所述多肽不包含尿嘧啶糖苷酶抑制剂(UGI)。
1.示例性组合物
如本文所描述,提供了包含mRNA的组合物、方法和用途,所述mRNA包含编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的开放阅读框,其中所述多肽不包含尿嘧啶糖苷酶抑制剂(UGI)。对于下文描述的每个示例性组合物,mRNA不包含UGI。
在一些实施方案中,提供了一种编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的mRNA。在一些实施方案中,提供了APOBEC家族的酶和RNA引导的切口酶。在一些实施方案中,多肽包含APOBEC1亚群的酶和RNA引导的切口酶。在一些实施方案中,多肽包含APOBEC2亚群的酶和RNA引导的切口酶。在一些实施方案中,多肽包含APOBEC4亚群的酶和RNA引导的切口酶。在一些实施方案中,多肽包含APOBEC3亚群的酶和RNA引导的切口酶。
在一些实施方案中,提供了一种编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的mRNA。在一些实施方案中,提供了APOBEC家族的酶和D10A SpyCas9切口酶。在一些实施方案中,多肽包含APOBEC1亚群的酶和D10A SpyCas9切口酶。在一些实施方案中,多肽包含APOBEC2亚群的酶和D10A SpyCas9切口酶。在一些实施方案中,多肽包含APOBEC4亚群的酶和D10A SpyCas9切口酶。在一些实施方案中,多肽包含APOBEC3亚群的酶和D10A SpyCas9切口酶。
在一些实施方案中,提供了一种编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的mRNA。在一些实施方案中,提供了APOBEC家族的酶和D16A NmeCas9切口酶。在一些实施方案中,提供了APOBEC家族的酶和D16A Nme2Cas9切口酶。在一些实施方案中,多肽包含APOBEC1亚群的酶和D16A Nme2Cas9切口酶。在一些实施方案中,多肽包含APOBEC2亚群的酶和D16A Nme2Cas9切口酶。在一些实施方案中,多肽包含APOBEC4亚群的酶和D16A Nme2Cas9切口酶。在一些实施方案中,多肽包含APOBEC3亚群的酶和D16A Nme2Cas9切口酶。
在一些实施方案中,多肽缺少UGI。
在一些实施方案中,胞苷脱氨酶和RNA引导的切口酶经由接头连接。在一些实施方案中,胞苷脱氨酶和RNA引导的切口酶经由肽接头连接。在一些实施方案中,肽接头包含选自SEQ ID NO:46-59、61和211-272的一个或多个序列。
在一些实施方案中,多肽还包含一个或多个额外的异源功能域。在一些实施方案中,多肽在多肽的C末端或多肽的N末端还包含一个或多个核定位序列(NLS)(本文中所描述)。
在一些实施方案中,提供了一种编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的mRNA。在一些实施方案中,提供了APOBEC家族的酶和RNA引导的切口酶。在一些实施方案中,多肽包含APOBEC1亚群的酶和RNA引导的切口酶。在一些实施方案中,多肽包含APOBEC2亚群的酶和RNA引导的切口酶。在一些实施方案中,多肽包含APOBEC4亚群的酶和RNA引导的切口酶。在一些实施方案中,多肽包含APOBEC3亚群的酶和RNA引导的切口酶。
在一些实施方案中,提供了一种编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的mRNA。在一些实施方案中,APOBEC家族的酶和D10A SpyCas9切口酶,其中APOBEC家族的酶和D10A SpyCas9切口酶经由接头融合。在一些实施方案中,多肽包含APOBEC家族的酶和D10A SpyCas9切口酶以及位于融合多肽的C末端处的核定位序列(NLS)。在一些实施方案中,多肽包含APOBEC家族的酶和D10A SpyCas9切口酶以及位于融合多肽的N末端处的NLS。在一些实施方案中,多肽包含APOBEC家族的酶和D10A SpyCas9切口酶,其中APOBEC家族的酶和D10A SpyCas9切口酶经由接头融合,并且NLS任选地经由接头与D10A SpyCas9切口酶的C末端融合。在一些实施方案中,多肽包含APOBEC家族的酶和D10A SpyCas9切口酶,其中APOBEC家族的酶和D10A SpyCas9切口酶经由接头融合,并且NLS任选地经由接头与D10ASpyCas9切口酶的C末端融合。
在一些实施方案中,多肽包含APOBEC家族的酶和D16A NmeCas9切口酶,其中APOBEC家族的酶和D16A NmeCas9切口酶经由接头融合。在一些实施方案中,多肽包含APOBEC家族的酶和D16ANme2Cas9切口酶,其中APOBEC家族的酶和D16ANme2Cas9切口酶经由接头融合。在一些实施方案中,多肽包含APOBEC家族的酶和D16A Nme2Cas9切口酶以及位于融合多肽的C末端处的核定位序列(NLS)。在一些实施方案中,多肽包含APOBEC家族的酶和D16A Nme2Cas9切口酶以及位于融合多肽的N末端处的NLS。在一些实施方案中,多肽包含APOBEC家族的酶和D16A Nme2Cas9切口酶,其中APOBEC家族的酶和D16A Nme2Cas9切口酶经由接头融合,并且NLS任选地经由接头与D16A Nme2Cas9切口酶的C末端融合。在一些实施方案中,多肽包含APOBEC家族的酶和D16A Nme2Cas9切口酶,其中APOBEC家族的酶和D16ANme2Cas9切口酶经由接头融合,并且NLS任选地经由接头与D16A Nme2Cas9切口酶的C末端融合。
在一些实施方案中,多肽包含APOBEC1亚群的酶和D10A SpyCas9切口酶,其中APOBECl亚群的酶和D10A SpyCas9切口酶经由接头融合。在一些实施方案中,多肽包含APOBEC1亚群的酶和D10A SpyCas9切口酶以及位于融合多肽的C末端处的核定位序列(NLS)。在一些实施方案中,多肽包含APOBEC1亚群的酶和D10A SpyCas9切口酶以及位于融合多肽的N末端处的NLS。在一些实施方案中,多肽包含APOBEC1亚群的酶和D10A SpyCas9切口酶,其中APOBEC1亚群的酶和D10A SpyCas9切口酶经由接头融合,并且NLS任选地经由接头与D10A SpyCas9切口酶的C末端融合。在一些实施方案中,多肽包含APOBEC1亚群的酶和D10A SpyCas9切口酶,其中APOBEC1亚群的酶和D10A SpyCas9切口酶经由接头融合,并且NLS任选地经由接头与D10A SpyCas9切口酶的C末端融合。
在一些实施方案中,多肽包含APOBEC1亚群的酶和D16A Nme2Cas9切口酶,其中APOBEC1亚群的酶和D16A Nme2Cas9切口酶经由接头融合。在一些实施方案中,多肽包含APOBEC1亚群的酶和D16A Nme2Cas9切口酶,其中APOBEC1亚群的酶和D16A Nme2Cas9切口酶经由接头融合。在一些实施方案中,多肽包含APOBECl亚群的酶和D16A Nme2Cas9切口酶以及位于融合多肽的C末端处的核定位序列(NLS)。在一些实施方案中,多肽包含APOBEC1亚群的酶和D16A Nme2Cas9切口酶以及位于融合多肽的N末端处的NLS。在一些实施方案中,多肽包含APOBEC1亚群的酶和D16A Nme2Cas9切口酶,其中APOBEC1亚群的酶和D16A Nme2Cas9切口酶经由接头融合,并且NLS任选地经由接头与D16A Nme2Cas9切口酶的C末端融合。在一些实施方案中,多肽包含APOBEC1亚群的酶和D16A Nme2Cas9切口酶,其中APOBEC1亚群的酶和D16A Nme2Cas9切口酶经由接头融合,并且NLS任选地经由接头与D16A Nme2Cas9切口酶的C末端融合。
在一些实施方案中,多肽包含APOBEC3亚群的酶和D10A SpyCas9切口酶,其中APOBEC3亚群的酶和D10A SpyCas9切口酶经由接头融合。在一些实施方案中,多肽包含APOBEC3亚群的酶和D10A SpyCas9切口酶以及位于融合多肽的C末端处的核定位序列(NLS)。在一些实施方案中,多肽包含APOBEC3亚群的酶和D10A SpyCas9切口酶以及位于融合多肽的N末端处的NLS。在一些实施方案中,多肽包含APOBEC3亚群的酶和D10A SpyCas9切口酶,其中APOBEC3亚群的酶和D10A SpyCas9切口酶经由接头融合,并且NLS任选地经由接头与D10A SpyCas9切口酶的C末端融合。在一些实施方案中,多肽包含APOBEC3亚群的酶和D10A SpyCas9切口酶,其中APOBEC3亚群的酶和D10A SpyCas9切口酶经由接头融合,并且NLS任选地经由接头与D10A SpyCas9切口酶的C末端融合。
在一些实施方案中,多肽包含APOBEC3亚群的酶和D16A Nme2Cas9切口酶,其中APOBEC3亚群的酶和D16A Nme2Cas9切口酶经由接头融合。在一些实施方案中,多肽包含APOBEC3亚群的酶和D16A Nme2Cas9切口酶,其中APOBEC3亚群的酶和D16A Nme2Cas9切口酶经由接头融合。在一些实施方案中,多肽包含APOBEC3亚群的酶和D16A Nme2Cas9切口酶以及位于融合多肽的C末端处的核定位序列(NLS)。在一些实施方案中,多肽包含APOBEC3亚群的酶和D16A Nme2Cas9切口酶以及位于融合多肽的N末端处的NLS。在一些实施方案中,多肽包含APOBEC3亚群的酶和D16A Nme2Cas9切口酶,其中APOBEC3亚群的酶和D16A Nme2Cas9切口酶经由接头融合,并且NLS任选地经由接头与D16A Nme2Cas9切口酶的C末端融合。在一些实施方案中,多肽包含APOBEC3亚群的酶和D16A Nme2Cas9切口酶,其中APOBEC3亚群的酶和D16A Nme2Cas9切口酶经由接头融合,并且NLS任选地经由接头与D16A Nme2Cas9切口酶的C末端融合。
在一些实施方案中,多肽包含D10A SpyCas9切口酶、包含氨基酸序列SEQ ID NO:268的接头和包含与SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者至少85%同一的氨基酸序列的胞苷脱氨酶。在一些实施方案中,多肽包含D10ASpyCas9切口酶、包含氨基酸序列SEQ ID NO:269的接头和包含与SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者至少85%同一的氨基酸序列的胞苷脱氨酶。在一些实施方案中,多肽包含D10A SpyCas9切口酶、包含氨基酸序列SEQ ID NO:270的接头和包含与SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者至少85%同一的氨基酸序列的胞苷脱氨酶。在一些实施方案中,多肽包含D10A SpyCas9切口酶、包含氨基酸序列SEQ ID NO:271的接头和包含与SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者至少85%同一的氨基酸序列的胞苷脱氨酶。在一些实施方案中,多肽包含D10A SpyCas9切口酶、包含氨基酸序列SEQ ID NO:272的接头和包含与SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者至少85%同一的氨基酸序列的胞苷脱氨酶。在前述实施方案中的任一者中,D10A SpyCas9切口酶可包含与SEQ ID NO:70、73或76中的任一者至少85%、至少90%、至少95%、至少98%、至少99%或100%同一的氨基酸序列。
在一些实施方案中,多肽包含D16A Nme2Cas9切口酶、包含氨基酸序列SEQ ID NO:268的接头和包含与SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者至少85%同一的氨基酸序列的胞苷脱氨酶。在一些实施方案中,多肽包含D16ANme2Cas9切口酶、包含氨基酸序列SEQ ID NO:269的接头和包含与SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者至少85%同一的氨基酸序列的胞苷脱氨酶。在一些实施方案中,多肽包含D16A Nme2Cas9切口酶、包含氨基酸序列SEQ ID NO:270的接头和包含与SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者至少85%同一的氨基酸序列的胞苷脱氨酶。在一些实施方案中,多肽包含D16A Nme2Cas9切口酶、包含氨基酸序列SEQ ID NO:271的接头和包含与SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者至少85%同一的氨基酸序列的胞苷脱氨酶。在一些实施方案中,多肽包含D16A Nme2Cas9切口酶、包含氨基酸序列SEQ ID NO:272的接头和包含与SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者至少85%同一的氨基酸序列的胞苷脱氨酶。在前述实施方案中的任一者中,D16A Nme2Cas9切口酶可包含与SEQ ID NO:387至少85%、至少90%、至少95%、至少98%、至少99%或100%同一的氨基酸序列。
在一些实施方案中,多肽包含D10A SpyCas9切口酶、包含氨基酸序列SEQ ID NO:268的接头和包含选自SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者的氨基酸序列的胞苷脱氨酶。在一些实施方案中,多肽包含D10A SpyCas9切口酶、包含氨基酸序列SEQ ID NO:269的接头和包含选自SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者的氨基酸序列的胞苷脱氨酶。在一些实施方案中,多肽包含D10A SpyCas9切口酶、包含氨基酸序列SEQ ID NO:270的接头和包含选自SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者的氨基酸序列的胞苷脱氨酶。在一些实施方案中,多肽包含D10A SpyCas9切口酶、包含氨基酸序列SEQ ID NO:271的接头和包含选自SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者的氨基酸序列的胞苷脱氨酶。在一些实施方案中,多肽包含D10A SpyCas9切口酶、包含氨基酸序列SEQ ID NO:272的接头和包含选自SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者的氨基酸序列的胞苷脱氨酶。在前述实施方案中的任一者中,D10ASpyCas9包含与SEQ ID NO:70、73或76中的任一者至少85%、至少90%、至少95%、至少98%、至少99%或100%同一的氨基酸序列。
在一些实施方案中,多肽包含D16A Nme2Cas9切口酶、包含氨基酸序列SEQ ID NO:268的接头和包含选自SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者的氨基酸序列的胞苷脱氨酶。在一些实施方案中,多肽包含D16A Nme2Cas9切口酶、包含氨基酸序列SEQ ID NO:269的接头和包含选自SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者的氨基酸序列的胞苷脱氨酶。在一些实施方案中,多肽包含D16A Nme2Cas9切口酶、包含氨基酸序列SEQ ID NO:270的接头和包含选自SEQ IDNO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者的氨基酸序列的胞苷脱氨酶。在一些实施方案中,多肽包含D16A Nme2Cas9切口酶、包含氨基酸序列SEQ ID NO:271的接头和包含选自SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者的氨基酸序列的胞苷脱氨酶。在一些实施方案中,多肽包含D16A Nme2Cas9切口酶、包含氨基酸序列SEQ ID NO:272的接头和包含选自SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者的氨基酸序列的胞苷脱氨酶。在前述实施方案中的任一者中,D16A Nme2Cas9切口酶包含与SEQ ID NO:387至少85%、至少90%、至少95%、至少98%、至少99%或100%同一的氨基酸序列。
多肽可以多种方式组织以形成单链。NLS可为N末端或C末端,或同时为N末端和C末端,并且与RNA引导的切口酶相比,胞苷脱氨酶可为N末端或C末端。在一些实施方案中,多肽从N末端至C末端包含胞苷脱氨酶、任选的接头、RNA引导的切口酶和任选的NLS。在一些实施方案中,多肽从N末端至C末端包含RNA引导的切口酶、任选的接头、胞苷脱氨酶和任选的NLS。在一些实施方案中,多肽从N末端至C末端包含任选的NLS、RNA引导的切口酶、任选的接头和胞苷脱氨酶。在一些实施方案中,多肽从N末端至C末端包含任选的NLS、RNA引导的切口酶、任选的接头和胞苷脱氨酶和任选的NLS。
在一些实施方案中,多肽从N末端至C末端包含任选的NLS、APOBEC家族的酶、任选的接头、RNA引导的切口酶和任选的NLS。在一些实施方案中,多肽从N末端至C末端包含任选的NLS、RNA引导的切口酶、任选的接头、APOBEC家族的酶和任选的NLS。在一些实施方案中,多肽从N末端至C末端包含任选的NLS、RNA引导的切口酶、任选的接头、APOBEC家族的酶和任选的NLS。在一些实施方案中,多肽从N末端至C末端包含任选的NLS、RNA引导的切口酶、任选的接头、APOBEC家族的酶和任选的NLS。
在一些实施方案中,多肽从N末端至C末端包含任选的NLS、APOBEC3亚群的酶、任选的接头、RNA引导的切口酶和任选的NLS。在一些实施方案中,多肽从N末端至C末端包含任选的NLS、RNA引导的切口酶、任选的接头、APOBEC3亚群的酶和任选的NLS。在一些实施方案中,多肽从N末端至C末端包含任选的NLS、RNA引导的切口酶、任选的接头、APOBEC3亚群的酶和任选的NLS。在一些实施方案中,多肽从N末端至C末端包含任选的NLS、RNA引导的切口酶、任选的接头、APOBEC3亚群的酶和任选的NLS。
在一些实施方案中,多肽从N末端至C末端包含任选的NLS、APOBEC家族的酶、任选的接头、D10A SpyCas9切口酶或D16A Nme2Cas9切口酶和任选的NLS。在一些实施方案中,多肽从N末端至C末端包含任选的NLS、D10A SpyCas9切口酶或D16ANme2Cas9切口酶、任选的接头、APOBEC家族的酶和任选的NLS。在一些实施方案中,多肽从N末端至C末端包含任选的NLS、D10A SpyCas9切口酶或D16ANme2Cas9切口酶、任选的接头、APOBEC家族的酶和任选的NLS。在一些实施方案中,多肽从N末端至C末端包含任选的NLS、D10A SpyCas9切口酶或D16ANme2Cas9切口酶、任选的接头和APOBEC家族的酶和任选的NLS。
在一些实施方案中,多肽从N末端至C末端包含任选的NLS、APOBEC3亚群的酶、任选的接头、D10A SpyCas9切口酶或D16A Nme2Cas9切口酶和任选的NLS。在一些实施方案中,多肽从N末端至C末端包含任选的NLS、D10A SpyCas9切口酶或D16A Nme2Cas9切口酶、任选的接头、APOBEC3亚群的酶和任选的NLS。在一些实施方案中,多肽从N末端至C末端包含任选的NLS、D10A SpyCas9切口酶或D16A Nme2Cas9切口酶、任选的接头、APOBEC3亚群的酶和任选的NLS。在一些实施方案中,多肽从N末端至C末端包含任选的NLS、D10A SpyCas9切口酶或D16ANme2Cas9切口酶、任选的接头和APOBEC3亚群的酶和任选的NLS。
在一些实施方案中,多肽从N末端至C末端包含任选的NLS、APOBEC3亚群的酶、任选的接头、D16ANme2Cas9切口酶。
在一些实施方案中,多肽从N末端至C末端包含:(i)任选的NLS;(ii)包含与SEQ IDNO:40、41和960-1023中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;(iii)包含选自SEQ ID NO:46-59、61和211-272的一个或多个序列的接头;(iv)D10A SpyCas9切口酶或D16A Nme2Cas9切口酶;以及(v)任选的NLS。
在一些实施方案中,多肽从N末端至C末端包含:(i)任选的NLS;(ii)D10A SpyCas9切口酶或D16A Nme2Cas9切口酶;(iii)包含选自SEQ ID NO:46-59、61和211-272的一个或多个序列的接头;(iv)包含与SEQ ID NO:40、41和960-1023中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;以及(v)任选的NLS。
在一些实施方案中,多肽从N末端至C末端包含:(i)任选的NLS;(ii)D10A SpyCas9切口酶或D16A Nme2Cas9切口酶;(iii)包含选自SEQ ID NO:46-59、61和211-272的一个或多个序列的接头;(iv)包含与SEQ ID NO:40、41和960-1023中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;以及(v)任选的NLS。
在一些实施方案中,多肽从N末端至C末端包含:(i)任选的NLS;(ii)D10A SpyCas9切口酶或D16A Nme2Cas9切口酶;(iii)包含选自SEQ ID NO:46-59、61和211-272的一个或多个序列的接头;(iv)包含与SEQ ID NO:40、41和960-1023中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;以及(v)任选的NLS。
在一些实施方案中,多肽从N末端至C末端包含:(i)任选的NLS;(ii)包含与SEQ IDNO:40、41和960-1023中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;(iii)包含选自SEQ ID NO:46-59、61和211-272的一个或多个序列的接头;(iv)D10A SpyCas9切口酶或D16A Nme2Cas9切口酶;以及(v)任选的NLS。
在一些实施方案中,多肽从N末端至C末端包含:(i)任选的NLS;(ii)D10A SpyCas9切口酶或D16A Nme2Cas9切口酶;(iii)包含选自SEQ ID NO:46-59、61和211-272的一个或多个序列的接头;(iv)包含与SEQ ID NO:40、41和960-1023中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;以及(v)任选的NLS。
在一些实施方案中,多肽从N末端至C末端包含:(i)任选的NLS;(ii)D10A SpyCas9切口酶或D16A Nme2Cas9切口酶;(iii)包含选自SEQ ID NO:46-59、61和211-272的一个或多个序列的接头;(iv)包含与SEQ ID NO:40、41和960-1023中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;以及(v)任选的NLS。
在一些实施方案中,多肽从N末端至C末端包含:(i)任选的NLS;(ii)D10A SpyCas9切口酶或D16A Nme2Cas9切口酶;(iii)包含选自SEQ ID NO:46-59、61和211-272的一个或多个序列的接头;和(iv)包含与SEQ ID NO:40、41和960-1023中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;以及(v)任选的NLS。
2.包含APOBEC3A脱氨酶和RNA引导的切口酶的组合物
在一些实施方案中,提供了一种编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽的mRNA。在一些实施方案中,多肽包含人类A3A和RNA引导的切口酶。在一些实施方案中,多肽包含野生型A3A和RNA引导的切口酶。在一些实施方案中,多肽包含A3A变体和RNA引导的切口酶。在一些实施方案中,多肽包含A3A和Cas9切口酶。在一些实施方案中,多肽包含A3A和D10A SpyCas9切口酶。在一些实施方案中,多肽包含人类A3A和D10A SpyCas9切口酶。在一些实施方案中,多肽包含A3A变体和D10A SpyCas9切口酶。在一些实施方案中,多肽缺少UGI。在一些实施方案中,A3A和RNA引导的切口酶经由接头连接。在一些实施方案中,多肽还包含一个或多个额外的异源功能域。在一些实施方案中,多肽在多肽的C末端或多肽的N末端处还包含核定位序列(NLS)(本文中所描述)。
在一些实施方案中,多肽包含人类A3A和D10A SpyCas9切口酶,其中人类A3A和D10A SpyCas9切口酶经由接头融合。在一些实施方案中,多肽包含人类A3A和D10A SpyCas9切口酶以及位于融合多肽的C末端处的核定位序列(NLS)。在一些实施方案中,多肽包含人类A3A和D10A SpyCas9切口酶以及位于融合多肽的N末端处的NLS。在一些实施方案中,多肽包含人类A3A和D10A SpyCas9切口酶,其中人类A3A和D10A SpyCas9切口酶经由接头融合,并且NLS任选地经由接头与D10A SpyCas9切口酶的C末端融合。在一些实施方案中,多肽包含人类A3A和D10A SpyCas9切口酶,其中人类A3A和D10A SpyCas9切口酶经由接头融合,并且NLS任选地经由接头与D10A SpyCas9切口酶的C末端融合。
多肽可以多种方式组织以形成单链。NLS可为N末端或C末端,或者同时为N末端和C末端,并且与RNA引导的切口酶相比,A3A可为N末端或C末端。在一些实施方案中,多肽从N末端至C末端包含A3A、任选的接头、RNA引导的切口酶和任选的NLS。在一些实施方案中,多肽从N末端至C末端包含RNA引导的切口酶、任选的接头、A3A和任选的NLS。在一些实施方案中,多肽从N末端至C末端包含任选的NLS、RNA引导的切口酶、任选的接头和A3A。在一些实施方案中,多肽从N末端至C末端包含任选的NLS、RNA引导的切口酶、任选的接头和A3A和任选的NLS。
在前述实施方案中的任一者中,多肽可包含与SEQ ID NO:3或6具有至少80%同一性的氨基酸序列。在一些实施方案中,前述同一性水平中的任一者为至少85%、至少90%、至少95%、至少98%、至少99%或100%。在一些实施方案中,本文公开的多肽可包含与SEQID NO:3或6具有至少90%同一性的氨基酸序列。在一些实施方案中,本文公开的多肽可包含与SEQ ID NO:3或6具有至少95%同一性的氨基酸序列。在一些实施方案中,本文公开的多肽可包含与SEQ ID NO:3或6具有至少98%同一性的氨基酸序列。在一些实施方案中,本文公开的多肽可包含与SEQ ID NO:3或6具有至少99%同一性的氨基酸序列。在一些实施方案中,本文公开的多肽可包含SEQ ID NO:3或6的氨基酸序列。
在前述实施方案中的任一者中,包含编码本文公开的多肽的开放阅读框的核酸序列可包含与SEQ ID NO:2或5具有至少80%同一性的核酸序列。在一些实施方案中,前述同一性水平中的任一者为至少85%、至少90%、至少95%、至少98%、至少99%或100%。
在前述实施方案中的任一者中,编码本文公开的多肽的mRNA序列可包含与SEQ IDNO:1或4具有至少80%同一性的核酸序列。在一些实施方案中,前述同一性水平中的任一者为至少85%、至少90%、至少95%、至少98%、至少99%或100%。
在前述实施方案中的任一者中,多肽可包含与SEQ ID NO:303、306、309或312具有至少80%、至少90%、至少95%、至少98%、至少99%或100%同一性的氨基酸序列。在一些实施方案中,本文公开的多肽可包含SEQ ID NO:303、306、309或312的氨基酸序列。在前述实施方案中的任一者中,包含编码本文公开的多肽的开放阅读框的核酸序列可包含与SEQID NO:302、305、308或311具有至少80%、至少90%、至少95%、至少98%、至少99%或100%同一性的核酸序列。在一些实施方案中,包含编码本文公开的多肽的开放阅读框的核酸序列包含SEQ ID NO:302、305、308或311的核酸序列。在前述实施方案中的任一者中,编码本文公开的多肽的mRNA序列可包含与SEQ ID NO:301、304、307或310具有至少80%、至少90%、至少95%、至少98%、至少99%或100%同一性的核酸序列。在前述实施方案中的任一者中,编码本文公开的多肽的mRNA序列可包含SEQ ID NO:301、304、307或310的核酸序列。
在前述实施方案中的任一者中,A3A可包含与SEQ ID NO:40具有至少80%同一性的氨基酸序列。在一些实施方案中,同一性水平为至少85%、至少87%、至少90%、至少95%、至少98%、至少99%或100%。在一些实施方案中,A3A包含SEQ ID NO:40的氨基酸序列。
在前述实施方案中的任一者中,RNA引导的切口酶可包含与SEQ ID NO:70、73或76中的任一者具有至少80%、90%、95%、98%或99%同一性的氨基酸序列。在一些实施方案中,同一性水平为至少85%、至少87%、至少90%、至少95%、至少98%、至少99%或100%。在一些实施方案中,RNA引导的切口酶包含SEQ ID NO:70的氨基酸序列。在一些实施方案中,RNA引导的切口酶包含SEQ ID NO:73的氨基酸序列。在一些实施方案中,RNA引导的切口酶包含SEQ ID NO:76的氨基酸序列。
在前述实施方案中的任一者中,A3A可包含与SEQ ID NO:40具有至少80%同一性的氨基酸序列,并且RNA引导的切口酶可包含与SEQ ID NO:70、73或76中的任一者具有至少80%、90%、95%、98%或99%同一性的氨基酸序列。在一些实施方案中,A3A包含SEQ IDNO:40的氨基酸序列,并且RNA引导的切口酶包含SEQ ID NO:70的氨基酸序列。
F.额外特征
1.密码子优化
在一些实施方案中,包含胞苷脱氨酶(例如,APOBEC3A脱氨酶)和RNA引导的切口酶的UGI或多肽由包含经密码子优化的核酸序列的开放阅读框(ORF)编码。在一些实施方案中,经密码子优化的核酸序列包含最小腺嘌呤密码子和/或最小尿苷密码子。
可例如通过在ORF的足够多的一部分中使用最小尿苷密码子来降低给定ORF的尿苷含量或尿苷二核苷酸含量。例如,可通过将氨基酸转化成密码子而将本文中所描述的多肽的氨基酸序列翻译回ORF序列,其中ORF中的一些或全部使用以下所示的示例性最小尿苷密码子。在一些实施方案中,ORF中至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%的密码子为表1中所列出的密码子。
表1.示例性最小尿苷密码子
氨基酸 | 最小尿苷密码子 | |
A | 丙氨酸 | GCA或GCC或GCG |
G | 甘氨酸 | GGA或GGC或GGG |
V | 缬氨酸 | GUC或GUA或GUG |
D | 天冬氨酸 | GAC |
E | 谷氨酸 | GAA或GAG |
I | 异亮氨酸 | AUC或AUA |
T | 苏氨酸 | ACA或ACC或ACG |
N | 天冬酰胺 | AAC |
K | 赖氨酸 | AAG或AAA |
S | 丝氨酸 | AGC |
R | 精氨酸 | AGA或AGG |
L | 亮氨酸 | CUG或CUA或CUC |
P | 脯氨酸 | CCG或CCA或CCC |
H | 组氨酸 | CAC |
Q | 谷氨酰胺 | CAG或CAA |
F | 苯丙氨酸 | UUC |
Y | 酪氨酸 | UAC |
C | 半胱氨酸 | UGC |
W | 色氨酸 | UGG |
M | 甲硫氨酸 | AUG |
在一些实施方案中,ORF可由一组密码子组成,其中至少约75%、80%、85%、90%、95%、98%、99%或100%的密码子为表1中所列出的密码子。
可例如通过在ORF的足够多的一部分中使用最小腺嘌呤密码子来降低给定ORF的腺嘌呤含量或腺嘌呤二核苷酸含量。例如,可通过将氨基酸转化成密码子而将本文中所描述的多肽的氨基酸序列翻译回ORF序列,其中ORF中的一些或全部使用以下所示的示例性最小腺嘌呤密码子。在一些实施方案中,ORF中至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%的密码子为表2中所列出的密码子。
表2.示例性最小腺嘌呤密码子
在一些实施方案中,ORF可由一组密码子组成,其中至少约75%、80%、85%、90%、95%、98%、99%或100%的密码子为表2中所列出的密码子。
就可行性而言,上文关于低腺嘌呤含量所描述的特征中的任一者可与上文关于低尿苷含量所描述的特征中的任一者组合。尿苷和腺嘌呤二核苷酸也是如此。类似地,ORF中的尿苷核苷酸和腺嘌呤二核苷酸的含量可如上文所阐述。类似地,ORF中的尿苷二核苷酸和腺嘌呤核苷酸的含量可如上文所阐述。
可例如通过在ORF的足够多的一部分中使用最小尿苷和腺嘌呤密码子来降低给定ORF的尿苷和腺嘌呤核苷酸和/或二核苷酸含量。例如,可通过将氨基酸转化成密码子而将本文所描述的多肽的氨基酸序列翻译回ORF序列,其中ORF中的一些或全部使用以下所示的示例性最小尿苷和腺嘌呤密码子。在一些实施方案中,ORF中至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%的密码子为表3中所列出的密码子。
表3.示例性最小尿苷和腺嘌呤密码子
在一些实施方案中,ORF可由一组密码子组成,其中至少约75%、80%、85%、90%、95%、98%、99%或100%的密码子为表3中所列出的密码子。如表3中可见,三个所列出的丝氨酸密码子中的每一者含有一个A或一个U。在一些实施方案中,对于丝氨酸,通过使用AGC密码子来优先化进行尿苷最小化。在一些实施方案中,对于丝氨酸,通过使用UCC和/或UCG密码子优先化进行腺嘌呤最小化。
在一些实施方案中,ORF可具有增加哺乳动物(例如人类)中的翻译的密码子。在其他实施方案中,mRNA包含具有增加哺乳动物(例如人类)的器官如肝脏中的翻译的密码子的ORF。在其他实施方案中,ORF可具有增加哺乳动物(例如人类)的细胞型如肝细胞中的翻译的密码子。哺乳动物、细胞型、哺乳动物的器官、人类、人类的器官等中的翻译的增加可相对于ORF的翻译野生型序列的程度或相对于具有匹配衍生ORF的生物体或含有处于氨基酸水平的最相似ORF的生物体的密码子分布的密码子分布的ORF来测定。或者,在一些实施方案中,哺乳动物、细胞型、哺乳动物的器官、人类、人类的器官等中的Cas9序列的翻译的增加是相对于具有SEQ ID NO:2或5的序列的ORF的翻译进行测定,其中所有其他方面相同,包括任何适用的点突变、异源域等。在一些实施方案中,ORF中至少约75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的密码子为对应于哺乳动物(例如人类)中的高度表达的tRNA(例如,针对每个氨基酸的表达最高的tRNA)的密码子。在一些实施方案中,ORF中至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的密码子为对应于哺乳动物器官(例如人类器官)中的高度表达的tRNA(例如,针对每个氨基酸的表达最高的tRNA)的密码子。
或者,通常可使用对应于生物体(例如人类)中的高度表达的tRNA的密码子。
前述密码子选择方法中的任一者与上文所示的最小尿苷和/或腺嘌呤密码子可例如通过以下进行组合:以表1、表2或表3的密码子开始,并且然后在可利用多于一种选择的情况下,使用对应于一般生物体(例如人类)中,或所关注的器官或细胞型(例如,人类肝脏或人类肝细胞)中的较高度表达的tRNA的密码子。
在一些实施方案中,ORF中至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的密码子为来自表4中所示的密码子组(例如,低U1、低A或低A/U密码子组)的密码子。低U1、低G、低A和低A/U组中的密码子使用将所指定的核苷酸减至最小的密码子,同时在可利用多于一种选择的情况下,也使用对应于高度表达的tRNA的密码子。在一些实施方案中,ORF中至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的密码子为来自表4中所示的低U 1密码子组的密码子。在一些实施方案中,ORF中至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的密码子为来自表4中所示的低A密码子组的密码子。在一些实施方案中,ORF中至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的密码子为来自表4中所示的低A/U密码子组的密码子。
表4.示例性密码子组.
氨基酸 | 低U1 | 低U2 | 低A | 低A/U |
Gly | GGC | GGG | GGC | GGC |
Glu | GAG | GAA | GAG | GAG |
Asp | GAC | GAC | GAC | GAC |
Val | GTG | GTA | GTG | GTG |
Ala | GCC | GCG | GCC | GCC |
Arg | AGA | CGA | CGG | CGG |
Ser | AGC | AGC | TCC | AGC |
Lys | AAG | AAA | AAG | AAG |
Asn | AAC | AAC | AAC | AAC |
Met | ATG | ATG | ATG | ATG |
Ile | ATC | ATA | ATC | ATC |
Thr | ACC | ACG | ACC | ACC |
Trp | TGG | TGG | TGG | TGG |
Cys | TGC | TGC | TGC | TGC |
Tyr | TAC | TAC | TAC | TAC |
Leu | CTG | CTA | CTG | CTG |
Phe | TTC | TTC | TTC | TTC |
Gln | CAG | CAA | CAG | CAG |
His | CAC | CAC | CAC | CAC |
2.异源功能域;核定位信号(NLS)
在一些实施方案中,包含胞苷脱氨酶(例如A3A)和RNA引导的切口酶的多肽还包含一个或多个额外的异源功能域(例如,为或包含三元或更高阶融合多肽)。
在一些实施方案中,异源功能域可促进多肽转运至细胞核中。例如,异源功能域可为核定位信号(NLS)。在一些实施方案中,多肽可与1-10个NLS融合。在一些实施方案中,多肽可与1-5个NLS融合。在一些实施方案中,多肽可与一个NLS融合。在使用一个NLS的情况下,NLS可在多肽序列的N末端或C末端处融合。在一些实施方案中,多肽可与至少一个NLS进行C末端融合。NLS也可插入多肽序列内。在其他实施方案中,多肽可与超过一个NLS融合。在一些实施方案中,多肽可与2、3、4或5个NLS融合。在一些实施方案中,多肽可与两个NLS融合。在某些情况下,两个NLS可相同(例如,两个SV40 NLS)或不同。在一些实施方案中,多肽在羧基末端处与两个SV40 NLS序列融合。在一些实施方案中,多肽可与两个NLS融合,一个NLS位于N末端处并且一个位于C末端处。在一些实施方案中,多肽可与3个NLS融合。在一些实施方案中,多肽可不与NLS融合。在一些实施方案中,NLS可为单联(monopartite)序列,例如SV40 NLS、PKKKRKV(SEQ ID NO:63)或PKKKRRV(SEQ ID NO:121)。在一些买施方案中,NLS可为双联序列,例如核质蛋白的NLS、KRPAATKKAGQAKKKK(SEQ ID NO:122)。在一个特定实施方案中,单一PKKKRKV(SEQ ID NO:63)NLS可在多肽的C末端处融合。一个或多个接头任选地包括在融合位点处(例如,在多肽与NLS之间)。在一些实施方案中,根据前述实施方案中的任一者的一个或多个NLS与一个或多个额外的异源功能域(例如下文所描述的异源功能域中的任一者)组合存在于多肽中。
在本文所公开的mRNA的一些实施方案中,胞苷脱氨酶(例如A3A)位于多肽中的RNA引导的切口酶的N末端。在本文所公开的mRNA的一些实施方案中,经编码的RNA引导的切口酶包含核定位信号(NLS)。在一些实施方案中,NLS与RNA引导的切口酶的C末端融合。在一些实施方案中,NLS经由接头与RNA引导的切口酶的C末端融合。在一些实施方案中,NLS与RNA引导的切口酶的N末端融合。在一些实施方案中,NLS经由接头(例如,SEQ ID NO:61)与RNA引导的切口酶的N末端融合。在一些实施方案中,NLS包含与SEQ ID NO:63和110-122中的任一者具有至少80%、85%、90%或95%同一性的序列。在一些实施方案中,NLS包含SEQ IDNO:63和110-122中的任一者的序列。在一些实施方案中,NLs由与SEQ ID NO:63和110-122中的任一者的序列具有至少80%、85%、90%、95%、98%或100%同一性的序列编码。
在一些实施方案中,异源功能域可能能够修饰多肽中的A3A和/或RNA引导的切口酶的胞内半衰期。在一些实施方案中,可增加多肽中的A3A和/或RNA引导的切口酶的半衰期。在一些实施方案中,可减少多肽中的A3A和/或RNA引导的切口酶的半衰期。在一些实施方案中,异源功能域可能能够增加多肽中的A3A和/或RNA引导的切口酶的稳定性。在一些实施方案中,异源功能域可能能够降低多肽中的A3A和/或RNA引导的切口酶的稳定性。在一些实施方案中,异源功能域可充当蛋白质降解的信号肽。在一些实施方案中,蛋白质降解可由蛋白水解酶,例如蛋白酶体、溶酶体蛋白酶或钙蛋白酶蛋白酶介导。在一些实施方案中,异源功能域可包含PEST序列。在一些实施方案中,多肽可通过添加泛素或多聚泛素链来修饰。在一些实施方案中,泛素可为泛素样蛋白质(UBL)。泛素样蛋白质的非限制性实例包括小泛素样修饰因子(SUMO)、泛素交叉反应蛋白(UCRP,也称为干扰素刺激基因-15(ISG15))、泛素相关修饰因子-1(URM1)、神经元-前体-细胞表达的发育下调蛋白-8(NEDD8,在酿酒酵母(S.cerevisiae)中也称为Rub1)、人类白细胞抗原F相关(FAT10)、自噬-8(ATG8)和自噬-12(ATG12)、Fau泛素样蛋白(FUB1)、膜锚定UBL(MUB)、泛素折叠修饰因子-1(UFM1)和泛素样蛋白-5(UBL5)。
在一些实施方案中,异源功能域可为标记域。标记域的非限制性实例包括荧光蛋白、纯化标签、表位标签和报告基因序列。在一些实施方案中,标记域可为荧光蛋白。任何已知的荧光蛋白都可用作标记域,例如GFP、YFP、EBFP、ECFP、DsRed或任何其他合适的荧光蛋白。在一些实施方案中,标记域可为纯化标签和/或表位标签。非限制性示例性标签包括谷胱甘肽-S-转移酶(GST)、壳质结合蛋白(CBP)、麦芽糖结合蛋白(MBP)、硫氧还蛋白(TRX)、聚(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、8xHis、生物素羧基载体蛋白(BCCP)、聚His和调钙蛋白。在一些实施方案中,标记域可为报告基因。非限制性示例性报告基因包括谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰基转移酶(CAT)、β-半乳糖苷酶、β-葡糖醛酸酶、荧光素酶或荧光蛋白。
在额外实施方案中,异源功能域可使多肽靶向至特定细胞器、细胞型、组织或器官。在一些实施方案中,异源功能域可将多肽靶向至线粒体。
3.UTR;Kozak序列
在一些实施方案中,本文公开的核酸(例如,mRNA)包含来自羟基类固醇17-β脱氢酶4(HSD17B4或HSD)或珠蛋白如人类α珠蛋白(HBA)、人类β珠蛋白(HBB)、非洲爪蟾(Xenopuslaevis)β珠蛋白(XBG)、牛生长激素、巨细胞病毒(CMV)、小鼠Hba-al、热休克蛋白90(Hsp90)、甘油醛3-磷酸酯脱氢酶(GAPDH)、β肌动蛋白、α微管蛋白、肿瘤蛋白(p53)或表皮成长因子受体(EGFR)的5′UTR、3′UTR或5′和3′UTR。
在一些实施方案中,本文公开的核酸包含来自HSD的5′UTR和来自人类白蛋白基因的3′UTR。在一些实施方案中,本文公开的mRNA包含与SEQ ID NO:93中的任一者具有至少90%同一性的5′UTR和与SEQ ID NO:69中的任一者具有至少90%同一性的3′UTR。
在一些实施方案中,本文公开的核酸包含5′UTR,其与SEQ ID NO:91-98中的任一者具有至少90%同一性。在一些实施方案中,本文公开的mRNA包含与SEQ ID NO:69、99-106中的任一者具有至少90%同一性的3′UTR。在一些实施方案中,前述同一性水平中的任一者为至少95%、至少98%、至少99%或100%。在一些实施方案中,本文公开的mRNA包含具有SEQ ID NO:91-98中的任一者的序列的5′UTR。在一些实施方案中,本文公开的mRNA包含具有SEQ ID NO:69、99-106中的任一者的序列的3′UTR。在一些实施方案中,mRNA包含来自同一来源的5′UTR和3′UTR。
在一些实施方案中,本文中所描述的核酸不包含5′UTR,例如5′帽与起始密码子之间不存在额外核苷酸。在一些实施方案中,mRNA在5′帽与起始密码子之间包含Kozak序列(下文所描述),但不具有任何额外5′UTR。在一些实施方案中,mRNA不包含3′UTR,例如在终止密码子与poly-A尾之间不存在额外核苷酸。
在一些实施方案中,本文的核酸包含Kozak序列。Kozak序列可影响翻译起始和由mRNA翻译的多肽的总产率。Kozak序列包括可充当起始密码子的甲硫氨酸密码子。最小Kozak序列为NNNRUGN,其中以下中的至少一者成立:第一个N为A或G并且第二个N为G。在核苷酸序列的情形下,R意指嘌呤(A或G)。在一些实施方案中,Kozak序列为RNNRUGN、NNNRUGG、RNNRUGG、RNNAUGN、NNNAUGG、RNNAUGG或GCCACCAUG。在一些实施方案中,Kozak序列为rccRUGg、rccAUGg、gccAccAUG、gccRccAUGG(SEQ ID NO:107)或gccgccRccAUGG(SEQ ID NO:108),具有零错配或与小写字母的位置具有多达一个或两个错配。
4.Poly-A尾
在一些实施方案中,本文公开的核酸还包含聚腺苷酸化(poly-A)尾。poly-A尾可包含至少8个连续腺嘌呤核苷酸,但也包含一个或多个非腺嘌呤核苷酸。如本文所用,“非腺嘌呤核苷酸”是指不包含腺嘌呤的任何天然或非天然核苷酸。鸟嘌呤、胸腺嘧啶和胞嘧啶核苷酸为示例性非腺嘌呤核苷酸。因此,本文中所描述的核酸上的poly-A尾可包含位于编码所关注多肽的核苷酸3′处的连续腺嘌呤核苷酸。在一些情况下,mRNA上的poly-A尾包含非连续腺嘌呤核苷酸,其位于编码包含胞苷脱氨酶(例如A3A)和RNA引导的切口酶或所关注序列的多肽的核苷酸的3′,其中非腺嘌呤核苷酸以规则或不规则隔开的间隔中断腺嘌呤核苷酸。
在一些实施方案中,poly-A尾编码于用于体外转录mRNA的质粒中并且变成转录本的一部分。编码于质粒中的poly-A序列,即poly-A序列中的连续腺嘌呤核苷酸的数目可能并不精确,例如质粒中的100poly-A序列可能不会在经转录的mRNA中产生恰好100poly-A序列。在一些实施方案中,poly-A尾未编码于质粒中,并且通过PCR加尾或酶促加尾,例如使用大肠杆菌(E.coli)poly(A)聚合酶来添加。
在一些实施方案中,一个或多个非腺嘌呤核苷酸定位成中断连续腺嘌呤核苷酸,以使得poly(A)结合蛋白可结合至一段连续腺嘌呤核苷酸。在一些实施方案中,一个或多个非腺嘌呤核苷酸位于至少8、9、10、11或12个连续腺嘌呤核苷酸之后。在一些实施方案中,一个或多个非腺嘌呤核苷酸位于8-50个连续腺嘌呤核苷酸之后。在一些实施方案中,一个或多个非腺嘌呤核苷酸位于8-100个连续腺嘌呤核苷酸之后。
在一些实施方案中,poly-A尾包含或含有一个非腺嘌呤核苷酸或2-10个非腺嘌呤核苷酸的一个连续段。
在一些实施方案中,非腺嘌呤核苷酸为鸟嘌呤、胞嘧啶或胸腺嘧啶。在其中存在超过一个非腺嘌呤核苷酸的一些情况下,所述非腺嘌呤核苷酸可选自:a)鸟嘌呤和胸腺嘧啶核苷酸;b)鸟嘌呤和胞嘧啶核苷酸;c)胸腺嘧啶和胞嘧啶核苷酸;或d)鸟嘌呤、胸腺嘧啶和胞嘧啶核苷酸。包含非腺嘌呤核苷酸的示例性poly-A尾提供为SEQ ID NO:109。
5.经修饰的核苷酸
在一些实施方案中,本文公开的核酸在一些或所有尿苷位置处包含经修饰的尿苷。在一些实施方案中,经修饰的尿苷为在5位处,例如用卤素或C1-C3烷氧基修饰的尿苷。在一些实施方案中,经修饰的尿苷为在1位处,例如用C1-C3烷基修饰的假尿苷。经修饰的尿苷可为例如假尿苷、N1-甲基-假尿苷、5-甲氧基尿苷、5-碘尿苷或其组合。
在一些实施方案中,本文所公开的核酸中至少10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%的尿苷位置为经修饰的尿苷。在一些实施方案中,本文公开的mRNA中10%-25%、15%-25%、25%-35%、35%-45%、45%-55%、55%-65%、65%-75%、75%-85%、85%-95%或90%-100%的尿苷位置为经修饰的尿苷,例如5-甲氧基尿苷、5-碘尿苷、N1-甲基假尿苷、假尿苷或其组合。
在一些实施方案中,至少10%的尿苷由经修饰的尿苷取代。在一些实施方案中,15%至45%的尿苷由经修饰的尿苷取代。在一些实施方案中,至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100%的尿苷由经修饰的尿苷取代。
6.5′帽
在一些实施方案中,本文公开的核酸包含5′帽,例如Cap0、Cap1或Cap2。5′帽通常为经由5′-三磷酸连接到核酸的5′至3′链的第一核苷酸的5′位的7-甲基鸟嘌呤核糖核苷酸(其可进一步修饰,如下文例如相对于ARCA所论述),即第一帽近端核苷酸。在Cap0中,mRNA的第一与第二帽近端核苷酸的核糖都包含2′-羟基。在Capl中,mRNA的第一和第二转录核苷酸的核糖分别包含2′-甲氧基和2′-羟基。在Cap2中,mRNA的第一和第二帽近端核苷酸的核糖都包含2′-甲氧基。参见例如Katibah等人(2014)Proc Natl Acad Sci USA 111(33):12025-30;Abbas等人(2017)Proc Natl Acad Sci USA 114(11):E2106-E2115。包括哺乳动物核酸(例如人类核酸)的大多数内源性高等真核核酸包含Cap1或Cap2。归因于通过先天免疫系统的组分如IFIT-1和IFIT-5识别为“非自体(non-self)”,Cap0和与Cap1和Cap2不同的其他帽结构在哺乳动物如人类中可呈免疫原性,其可导致包括I型干扰素的细胞因子水平升高。先天免疫系统的组分如IFIT-1和IFIT-5也可与eIF4E竞争结合具有除Cap1或Cap2外的帽的核酸,从而潜在地抑制核酸翻译。
帽可以共转录方式包括。例如,ARCA(抗反向帽类似物;Thermo FisherScientific目录号AM8045)为包含连接到鸟嘌呤核糖核苷酸的5′位的7-甲基鸟嘌呤3′-甲氧基-5′-三磷酸的帽类似物,其可在开始时体外并入转录本中。ARCA产生Cap0帽或Cap0样帽,其中第一个帽近端核苷酸的2′位为羟基。参见例如Stepinski等人,(2001)“Synthesisand properties of mRNAs containing the novel‘ami-reverse’cap analogs 7-methyl(3′-O-methyl)GpppG and 7-methy1(3′deoxy)GpppG”,RNA 7:1486-1495。ARCA结构显示如下。
CleanCapTM AG(m7G(5′)ppp(5′)(2′OMeA)pG;TriLink Biotechnologies目录号N-7113)或CleanCapTM GG(m7G(5′)ppp(5′)(2′OMeG)pG;TriLink Biotechnologies目录号N-7133)可用于以共转录方式提供Cap1结构。CleanCapTM AG和CleanCapTM GG的3′-O-甲基化形式也可分别以目录号N-7413和N-7433获自TriLink Biotechnologies。CleanCapTM AG结构显示如下。CleanCapTM结构在本文中有时会使用上文所列出的目录号的最后三个数字来指代(例如,对于TriLink Biotechnologies目录号N-7113,使用“CleanCapTM 113”指代)。
或者,可以转录后方式将帽添加至RNA。例如,牛痘加帽酶可在市面上购得(NewEngland Biolabs目录号M2080S),并且具有由其D1亚基提供的RNA三磷酸酶和鸟苷酸转移酶活性和由其D12亚基提供的鸟嘌呤甲基转移酶。因此,在S-腺苷甲硫氨酸和GTP存在下,可将7-甲基鸟嘌呤添加至RNA,以产生Cap0。参见例如Guo,P.和Moss,B.(1990)Proc.Natl.Acad.Sci.USA 87,4023-4027;Mao,X.和Shuman,S.(1994)J.Biol.Chem.269,24472-24479。关于帽和加帽方法的额外论述,参见例如WO2017/053297和Ishikawa等人,Nucl.Acids.Symp.Ser.(2009)No.53,129-130。
G.引导RNA(gRNA)
在一些实施方案中,组合物包含至少一种引导RNA(gRNA),并且方法包括递送至少一种gRNA,其中所述gRNA将编辑器导引至所需基因位置。在一些实施方案中,组合物包含本文所描述的mRNA和至少一种gRNA。在一些实施方案中,组合物包含本文所描述的多肽和至少一种gRNA。在一些实施方案中,gRNA为单引导RNA(sgRNA)。在一些实施方案中,gRNA为双引导gRNA(dgRNA)。
本文公开的gRNA可包含引导序列,其将包含胞苷脱氨酶(例如,APOBEC3A脱氨酶)和RNA引导的切口酶的多肽导引至位于用于胞嘧啶(C)至胸腺嘧啶(T)转化(“C-T转化”)的基因的任何区中(例如,在基因的编码区内)的胞嘧啶(C)。
在一些实施方案中,C-T转化改变DNA序列,例如人类基因序列。在一些实施方案中,C-T转化改变基因的编码序列。在一些实施方案中,C-T转化产生终止密码子,例如基因编码区内的过早终止密码子。在一些实施方案中,C-T转化消除终止密码子。在一些实施方案中,C-T转化改变基因(例如,基因启动子或基因抑制因子)的调控序列。在一些实施方案中,C-T转化改变基因的剪接。在一些实施方案中,C-T转化校正与疾病或病症相关的遗传缺陷。
在一些实施方案中,引导RNA(gRNA)包含引导序列,所述引导序列将包含胞苷脱氨酶(例如,APOBEC3A脱氨酶)和RNA引导的切口酶的多肽导引至基因中的剪接供体或受体位点。在一些实施方案中,剪接供体或受体为剪接供体位点。在一些实施方案中,剪接供体或受体位点为剪接受体位点。
在一些实施方案中,引导RNA(gRNA)包含引导序列,所述引导序列将包含胞苷脱氨酶(例如,APOBEC3A脱氨酶)和RNA引导的切口酶的多肽导引至受体剪接位点边界。在一些实施方案中,引导RNA(gRNA)包含引导序列,所述引导序列将包含胞苷脱氨酶(例如A3A)和RNA引导的切口酶的多肽导引至供体剪接位点边界。
在一些实施方案中,引导RNA(gRNA)包含引导序列,所述引导序列导引包含胞苷脱氨酶(例如,APOBEC3A脱氨酶)和RNA引导的切口酶的多肽,以在受体剪接位点边界的切割位点3′或受体剪接位点边界的5′处对基因进行单链切割。在此论述和以下论述中,3′和5′指示在所切割的链的意义上的方向。
在一些实施方案中,本文公开的引导RNA(gRNA)包含引导序列,所述引导序列导引包含胞苷脱氨酶(例如,APOBEC3A脱氨酶)和RNA引导的切口酶的多肽,以在作为供体剪接位点边界的3′或供体剪接位点边界的5′的切割位点处对基因进行单链切割。
如本文所用,“剪接位点”是指构成受体剪接位点或供体剪接位点(下文所定义)或本领域中已知为剪接位点的一部分的任何其他核苷酸的三个核苷酸。参见例如Burset等人,Nucleic Acids Research 28(21):4364-4375(2000)(描述哺乳基因组中的典型和非典型剪接位点)。构成“受体剪接位点”的三个核苷酸为内含子的3′处的两个保守残基(例如,人类中的AG)和边界核苷酸(即,AG的外显子3′的第一个核苷酸)。构成“供体剪接位点”的三个核苷酸为内含子的5′端处的两个保守残基(例如,人类中的GT(基因)或GU(在RNA中,例如前mRNA))和边界核苷酸(即,GT的外显子5′的第一个核苷酸)。
在一些实施方案中,包含至少一种gRNA的组合物与本文公开的核酸(例如,mRNA)组合提供。在一些实施方案中,一种或多种gRNA提供为与本文公开的核酸(例如,mRNA)分离的分子。在一些实施方案中,gRNA提供为本文公开的核酸的一部分,例如UTR的一部分。
在一些实施方案中,提供了一种包含多肽和gRNA的组合物,所述多肽包含胞苷脱氨酶和RNA引导的切口酶。在一些实施方案中,提供了一种核糖核蛋白复合物(RNP),所述RNP包含含有胞苷脱氨酶和RNA引导的切口酶的多肽以及gRNA。在一些实施方案中,多肽不包含UGI。
gRNA包含靶向特定基因或基因序列的引导序列。在一些实施方案中,gRNA为Cas切口酶引导物。在一些实施方案中,gRNA为2类切口酶引导物。在其他实施方案中,gRNA为Cpf1或Cas9引导物。在一些实施方案中,gRNA为Nme切口酶引导物。在一些实施方案中,Nme切口酶为Nme1、Nme2或Nme3切口酶。在一些实施方案中,gRNA包含RNA的引导序列5′,其形成两个或更多个发夹或茎环结构。CRISPR/Cas gRNA结构是本领域中已知的并且随其同源Cas核酸酶而变化。一般而言,与本文所描述的任何特定Cas9或Nme切口酶一起使用的gRNA必须与所述切口酶一起起作用。例如,当本文公开的多肽包含SpyCas9切口酶时,所提供的gRNA为SpyCas9引导RNA(如本文所描述)。当本文公开的多肽包含NmeCas9切口酶时,引导RNA为NmeCas9引导RNA(如本文所描述)。
在一些实施方案中,gRNA包含将RNA引导的切口酶(例如,Cas9切口酶)导引至目标基因座(例如目标基因)中的目标DNA序列的引导序列。靶向每个基因的目标和示例性目标序列在本文中示例并且包括但不限于以下中所公开的目标和引导序列:WO2017185054(针对转录因子四中的三核苷酸重复序列(TCF4));WO 2018119182 A1(靶向SERPINA1);WO2019/067872(靶向转甲状腺素蛋白(TTR));WO 2020/028327 A1(靶向羟酸氧化酶1(HAO1)),所述文献中的每一者的内容特此通过引用整体并入。本领域技术人员将熟悉用于靶向所关注的其他基因或基因座的合适的引导序列。
gRNA可包含含有引导序列的17、18、19、20、21、22、23、24或25个连续核苷酸的crRNA。gRNA还可包含trRNA。在本文所描述的每个组合物和方法实施方案中,crRNA和trRNA可缔合为单一RNA(sgRNA)或可处于单独的RNA(dgRNA)上。在sgRNA的情形下,crRNA与trRNA组分可例如经由磷酸二酯键或其他共价键共价连接。
在本文所描述的组合物、用途和方法实施方案中的每一者中,gRNA可包含呈“双引导RNA”或“dgRNA”形式的两种RNA分子。dgRNA包含含有crRNA的第一RNA分子和包含trRNA的第二RNA分子,所述第一RNA分子包含引导序列。第一RNA分子和第二RNA分子可不共价连接,但可经由crRNA与trRNA的部分之间的碱基配对形成RNA双链体。
在本文所描述的组合物、用途和方法实施方案中的每一者中,gRNA可包含呈“单引导RNA”或“sgRNA”形式的单个RNA分子。sgRNA可包含crRNA(或其部分),其包含共价连接到例如trRNA的引导序列。sgRNA可包含引导序列的17、18、19、20、21、22、23、24或25个连续核苷酸。在一些实施方案中,crRNA和trRNA经由接头共价连接。在一些实施方案中,sgRNA经由crRNA与trRNA的部分之间的碱基配对形成茎-环结构。在一些实施方案中,crRNA和trRNA经由不为磷酸二酯键的一个或多个键共价连接。
在一些实施方案中,trRNA可包含来源于天然存在的CRISPR/Cas系统的trRNA序列的全部或一部分。在一些实施方案中,trRNA包含经截短或经修饰的野生型trRNA。trRNA的长度取决于所使用的CRISPR/Cas系统。在一些实施方案中,trRNA包含以下或由以下组成:5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、60、70、80、90、100或大于100个核苷酸。在一些实施方案中,trRNA可包含某些二级结构,例如一种或多种发夹结构或茎环结构或一种或多种隆突结构。
本文提供的gRNA可适用于识别(例如,杂交至)基因中的目标序列。在一些实施方案中,一种或多种gRNA的选择基于基因内的目标序列而确定。在一些实施方案中,与目标基因座内的目标序列互补或具有互补性的gRNA用于将包含胞苷脱氨酶(例如A3A)和RNA引导的切口酶的多肽导引至基因座中的特定位置。目标基因座可通过包含gRNA的Cas切口酶识别和切刻。
在一些实施方案中,引导序列与目标序列至少99%、98%、97%、96%、95%、94%、93%、92%、91%或90%同一。在一些实施方案中,目标序列可与gRNA的引导序列互补。在一些实施方案中,gRNA的引导序列与其对应目标序列之间的互补性或同一性可为约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%。在一些实施方案中,gRNA的目标序列与引导序列可具有100%互补性或同一性。在其他实施方案中,gRNA的目标序列和引导序列可含有至少一个错配。例如,gRNA的目标序列和引导序列可含有1、2、3、4、5、6、7、8、9或10个错配,其中目标序列的总长度为至少约17、18、19、20或更多个碱基对。在一些实施方案中,gRNA的目标序列和引导序列可含有1、2、3、4、5或6个错配,其中引导序列为20个核苷酸。
gRNA可包含连接到额外核苷酸以形成crRNA的引导序列,例如其3′端处的引导序列之后具有以下示例性核苷酸序列:GUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:139)。
在sgRNA的情况下,引导序列可连接到额外核苷酸以形成sgRNA,例如在引导序列的3′端之后具有以下示例性核苷酸序列:5′至3′方向的GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:140)。
在一些实施方案中,sgRNA包含以下在SEQ ID NO:141中所示的修饰模式,其中N为天然或非天然核苷酸,并且其中N′的总体包含如本文所描述的引导序列,并且经修饰sgRNA包含以下序列:mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAmGmCmUmAmGmAmAmAmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGmAmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmCmU*mU*mU*mU(SEQ ID NO:141),其中“N”可为任何天然或非天然核苷酸。例如,SEQ IDNO:141涵盖在本文中,其中N′经本文所公开的引导序列中的任一者置换。尽管引导物的核苷酸用N′取代,但所述修饰保持如SEQ ID NO:141中所示。也就是说,尽管引导物的核苷酸置换“N”’,但前三个核苷酸仍为经2′OMe修饰的,并且在第一核苷酸与第二核苷酸、第二核苷酸与第三核苷酸和第三核苷酸与第四核苷酸之间存在硫代磷酸酯键联。
图23A显示在可能二级结构中的示例性sgRNA(SEQ ID NO:141,甲基化未示出),其中标记标识sgRNA的保守区的个别核苷酸,包括下茎、隆突、上茎、联结区(其核苷酸依5′至3′方向分别可称为N1至N18)和发夹区,所述发夹区包括发夹1和发夹2区。发夹1与发夹2之间的核苷酸标记为n。引导区可存在于sgRNA上并且在此图中指示为sgRNA的保守区之前的“(N)x”。在一些实施方案中,sgRNA还可包含下茎与隆突区之间、隆突与上茎区之间、上茎与联结之间或联结与发夹1区之间或发夹1与发夹2区之间的一个或多个核苷酸。
在一些实施方案中,sgRNA的保守部分为spyCas9或spyCas9等同物的保守区。在一些实施方案中,sgRNA的保守部分不来自化脓性链球菌Cas9,例如金黄色葡萄球菌Cas9(“saCas9”)。示例性sgRNA的区的进一步描述提供于2019年12月12日公开的WO2019/237069中,其全部内容通过引用并入本文。
SpyCas9 gRNA可包含内部接头。在一些实施方案中,内部接头可具有约3-30个、任选地12-21个原子的桥接长度,并且接头取代gRNA的至少2个核苷酸。在一些实施方案中,内部接头具有约6-18个原子,任选地约6-12个原子的桥接长度,并且接头取代gRNA的至少2个核苷酸。在一些实施方案中,内部接头包含至少两个彼此共价连接的乙二醇亚基。在一些实施方案中,内部接头包含PEG-接头。
在一些实施方案中,内部接头包含具有1至10个乙二醇单元的PEG-接头。在一些实施方案中,内部接头包含具有3至6个乙二醇单元的PEG-接头。在一些实施方案中,内部接头包含具有3个乙二醇单元的PEG-接头。在一些实施方案中,内部接头包含具有6个乙二醇单元的PEG-接头。
在一些实施方案中,spyCas9引导RNA的保守部分包含重复抗重复区、发夹1区和发夹2区,并且还包含以下中的至少一者:
1)第一内部接头,其取代sgRNA的重复抗重复区的上茎区的至少2个核苷酸;
2)第二内部接头,其取代sgRNA的发夹1的1或2个核苷酸;或
3)第三内部接头,其取代sgRNA的发夹2的至少2个核苷酸。
spyCas9引导RNA中的接头的示例性位置如以下中所示:NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUA(L1)UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUU(L1)AAGUGGCACCGAGUCGGUGCUUUUU(SEQ ID NO:524),其中N为编码引导序列的核苷酸。
如本文所用,“接头1”或“L1”是指具有约15-21个原子的桥连长度的内部接头。如本文所用,“接头2”或“L2”是指具有约6-12个原子的桥连长度的内部接头。
在一些实施方案中,包含内部接头的spyCas9引导RNA可经化学修饰。示例性修饰包括以下序列的修饰模式:mA*mC*mG*CAAAUAUCAGUCCAGCGGUUUUAGAmGmCmUmA(L1)mUmAmGmCAAGUUAAAAUAAGGC(L2)GUCCGUUAUCAC(L1)GGGCACCGAGUCGG*mU*mG*mC(SEQ ID NO:523)。
在一些实施方案中,gRNA包含3′尾。在一些实施方案中,3′尾由包含尿嘧啶或经修饰的尿嘧啶的核苷酸组成。在一些实施方案中,3′末端核苷酸为经修饰的核苷酸。在一些实施方案中,其中3′尾包含存在于3′尾中的核苷酸中的任何一者或多者的修饰。在其他实施方案中,其中3′尾的修饰为经2′-O-甲基(2′-OMe)修饰的核苷酸和核苷酸之间的硫代磷酸酯(PS)键联中的一者或多者。倒数第二位核苷酸。
1.短单引导RNA(短sgRNA)
在一些实施方案中,本文所提供的sgRNA为短单引导RNA(短sgRNA),例如包含含有发夹区的sgRNA的保守部分,其中所述发夹区缺少至少5-10个核苷酸或6-10个核苷酸。在一些实施方案中,5-10个核苷酸或6-10个核苷酸为邻接的。
在一些实施方案中,短sgRNA缺少spyCas9 sgRNA的保守部分的至少核苷酸54-58(AAAAA)。在一些实施方案中,短sgRNA为缺少与spyCas9保守部分的核苷酸54-58(AAAAA)对应的核苷酸的非spyCas9 sgRNA,如通过例如成对或结构比对所测定。
结构比对在分子共享类似结构(尽管存在相当大的序列变化)时是有用的。结构比对涉及通过以下鉴定两个(或更多个)序列上的对应残基:(i)使用第二序列的已知结构,对第一序列的结构建模或(ii)比较两者都已知的第一序列与第二序列的结构;以及鉴定第一序列中与第二序列中的所关注残基最相似地定位的残基。在一些算法中,基于重叠结构中的给定位置(例如,多核苷酸的戊糖环的核碱基位置1或1′碳,或多肽的α碳)的距离最小化,鉴定出对应残基(例如,哪一组成对位置为比对提供最小化均方根差)。当鉴定非spyCas9gRNA中的与关于spyCas9 gRNA所描述的位置对应的位置时,spyCas9 gRNA可为“第二”序列。在所关注的非spyCas9 gRNA不具有可获得的已知结构、但与具有已知结构的另一种非spyCas9 gRNA更密切相关的情况下,最有效的可以是使用紧密相关的非spyCas9 gRNA的已知结构将所关注的非spyCas9 gRNA建模,并且接着比较所述模型与spyCas9 gRNA结构以鉴定出所关注的非spyCas9 gRNA中的所需对应残基。关于蛋白质的结构建模和比对,存在大量的文献;代表性公开内容包括US 6859736;US 8738343;和Aslam等人,ElectronicJournal of Biotechnology 20(2016)9-13中所引述的那些文献。关于基于一种或多种已知相关结构将结构建模的论述,参见例如Bordoli等人,Nature Protocols 4(2009)1-13,和其中引述的参考文献。关于核酸比对,也参见Nishimasu等人,Cell 162(5):1113-1126(2015)的图2(F)。
在一些实施方案中,本文所描述的短sgRNA包含含有发夹区的保守部分,其中所述发夹区缺少5、6、7、8、9、10、11或12个核苷酸。在一些实施方案中,缺少核苷酸为5-10个缺少核苷酸或6-10个缺少核苷酸。在一些实施方案中,缺少核苷酸为邻接的。在一些实施方案中,缺少核苷酸跨越发夹1的至少一部分和发夹2的一部分。在一些实施方案中,5-10个缺少核苷酸包含SEQ ID NO:140的核苷酸54-58、54-61或53-60或由其组成。
在一些实施方案中,本文中所描述的短sgRNA还包含联结区,其中所述联结区缺少至少一个核苷酸(例如,联结区中的1、2、3、4、5、6、7、8、9或10个核苷酸)。在一些实施方案中,短sgRNA缺少联结区中的每个核苷酸。
在一些实施方案中,本文中所描述的SpyCas9短sgRNA包含NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCACGAAAGGGCACCGAGUCGGUGCU(SEQID NO:521)的序列。在一些实施方案中,本文中所描述的短sgRNA包含SEQ ID NO:520中所示的修饰模式:mN*mN*mN*GUUUUAGAmGmCmUmAmGmAmAmAmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCACGAAAGGGCACCGAGUCGGmUmGmC*mU(SEQ ID NO:520),其中除非另外规定,否则A、C、G、U和N分别为腺嘌呤、胞嘧啶、鸟嘌呤、尿嘧啶和任何核糖核苷酸。m指示2′O-甲基修饰,并且*指示核苷酸之间的硫代磷酸酯键联。
在一些实施方案中,本文中所描述的gRNA为脑膜炎奈瑟菌Cas9(NmeCas9)gRNA,其包含含有重复/抗重复区、发夹1区和发夹2区的保守部分,其中所述重复/抗重复区、发夹1区和发夹2区中的一者或多者经缩短。示例性野生型NmeCas9引导RNA包含(N)20-25GUUGUAGCUCCCUUUCUCAUUUCGGAAACGAAAUGAGAACCGUUGCUACAAUAAGGCCGUCUGAAAAGAUGUGCCGCAACGCUCUGCCCCUUAAAGCUUCUGCUUUAAGGGGCAUCGUUUA(SEQ ID NO:512)的序列。如本文所用的(N)20-25表示20-25,即20、2l、22、23、24或25邻接N。A、C、G和U分别表示具有腺嘌呤、胞嘧啶、鸟嘌呤和尿嘧啶碱基的核苷酸。在一些实施方案中,(N)20-25长度为24个核苷酸。N为任何天然或非天然核苷酸,并且其中N′的总体包含引导序列。
在一些实施方案中,NmeCas9短gRNA的保守部分包含:
(a)经缩短的重复/抗重复区,其中经缩短的重复/抗重复区缺少2-24个核苷酸,其中
(i)核苷酸37-48和53-64中的一者或多者缺失,并且任选地核苷酸37-64中的一者或多者相对于SEQ ID NO:512经取代;并且
(ii)核苷酸36通过至少2个核苷酸连接到核苷酸65;或
b)经缩短的发夹1区,其中所述经缩短的发夹1缺少2-10个、任选地2-8个核苷酸,其中
(i)核苷酸82-86和91-95中的一者或多者缺失,并且任选地位置82-96中的一者或多者相对于SEQ ID NO:512经取代,并且
(ii)核苷酸81通过至少4个核苷酸连接到核苷酸96;或
(c)经缩短的发夹2区,其中所述经缩短的发夹2缺少2-18个、任选地2-16个核苷酸,其中
(i)核苷酸113-121和126-134中的一者或多者缺失,并且任选地核苷酸113-134中的一者或多者相对于SEQ ID NO:512经取代;并且
(ii)核苷酸112通过至少4个核苷酸连接到核苷酸135;
其中相对于SEQ ID NO:512一个或两个核苷酸144-145任选地缺失;并且其中至少10个核苷酸为经修饰的核苷酸。
在一些实施方案中,NmeCas9短gRNA包含5′至3′方向的以下序列中的一者:
(N)20-25
GUUGUAGCUCCCUGAAACCGUUGCUACAAUAAGGCCGUCGAAAGAUGUGCCGCAACGCUCUGCCUUCUGGCAUCGUU(SEQ ID NO:513);
(N)20-25
GUUGUAGCUCCCUGAAACCGUUGCUACAAUAAGGCCGUCGAAAGAUGUGCCGCAACGCUCUGCCUUCUGGCAUCGUUUAUU(SEQ ID NO:514);
(N)20-25
GUUGUAGCUCCCUGGAAACCCGUUGCUACAAUAAGGCCGUCGAAAGAUGUGCCGCAACGCUCUGCCUUCUGGCAUCGUUUAUU(SEQ ID NO:51 5)。
在一些实施方案中,NmeCas9短sgRNA的保守部分的至少10个核苷酸为经修饰的核苷酸。
在一些实施方案中,NmeCas9短sgRNA包含含有5′至3′方向的以下序列中的一者的保守区:
GUUGmUmAmGmCUCCCmUmGmAmAmAmCmCGUUmGmCUAmCAAU*AAGmGmCCmGmUmCmGmAmAmAmGmAmUGUGCmCGCmAmAmCmGCUCUmGmCCmUmUmCmUGmGCmAmUC*mG*mU*mU(SEQ ID NO:516);或
GUUGmUmAmGmCUCCCmUmGmAmAmAmCmCGUUmGmCUAmCAAU*AAGmGmCCmGmUmCmGmAmAmAmGmAmUGUGCmCGmCAAmCGCUCUmGmCCmUmUmCmUGGCAUCG*mU*mU(SEQ ID NO:517)。
经缩短的NmeCas9 gRNA可包含本文公开的内部接头。
如本文所用的“内部接头”描述接合引导RNA内的两个核苷酸的非核苷酸区段。如果gRNA含有间隔区,则内部接头位于间隔区外部(例如,gRNA的骨架或保守区中)。对于V型引导物,应理解,最后一个发夹为结构中的唯一发夹,即重复抗重复区。在一些实施方案中,内部接头包含本文公开的PEG-接头。
接头的示例性位置如以下所示:
(N)20-25GUUGUAGCUCCCUUC(L1)GACCGUUGCUACAAUAAGGCCGUC(L1)GAUGUGCCGCAACGCUCUGCC(L1)GGCAUCGUU(SEQ ID NO:518)。如本文所用,(L1)是指具有约15-21个原子的桥连长度的内部接头。
在一些实施方案中,包含内部接头的经缩短的NmeCas9引导RNA可经化学修饰。示例性修饰包括以下序列的修饰模式:mN*mN*mN*mNmNNNmNmNNmNNmNNNNNmNNNNmNNNmGUUGmUmAmGmCUCCCmUmUmC(L1)mGmAmCmCGUUmGmCUAmCAAU*AAGmGmCCmGmUmC(L1)mGmAmUGUGCmCGmCAAmCGCUCUmGmCC(L1)GGCAUCG*mU*mU(SEQ ID NO:519)。
2.修饰
在一些实施方案中,gRNA(例如,sgRNA、短sgRNA、dgRNA或crRNA)经修饰。在本文所描述的gRNA的上下文中,术语“经修饰”或“修饰”包括上文所描述的修饰,包括例如(a)端修饰,例如5′端修饰或3′端修饰,包括5′或3′保护端修饰;(b)核碱基(或“碱基”)修饰,包括碱基置换或去除;(c)糖修饰,包括2′、3′和/或4′位置处的修饰;(d)核苷间键联修饰;和(e)主链修饰,其可包括磷酸二酯键联和/或核糖的修饰或置换。核苷酸在给定位置处的修饰包括紧接着核苷酸的糖的3′的磷酸二酯键联的修饰或置换。因此,例如,包含5′端的第一糖与第二糖之间的硫代磷酸酯的核酸被视为包含位置1处的修饰。术语“经修饰的gRNA”通常是指对碱基、糖和磷酸二酯键联或主链部分中的一者或多者的化学结构进行修饰的gRNA,包括核苷酸磷酸酯,全部如本文详述和示例(参见例如SEQ ID NO:142-145、181-185和191-203中所示的修饰模式)。
其他描述和示例性修饰模式提供于2019年12月12日公开的WO2019/237069的表1中,其全部内容通过引用并入本文。
在一些实施方案中,gRNA包含在1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或更多个YA位点处的修饰。在一些实施方案中,YA位点的嘧啶包含修饰(其包括改变紧接嘧啶的糖的3′的核苷间键联的修饰)。在一些实施方案中,YA位点的腺嘌呤包含修饰(其包括改变紧接腺嘌呤的糖的3′的核苷间键联的修饰)。在一些实施方案中,YA位点的嘧啶和腺嘌呤包含修饰,例如糖、碱基或核苷间键联修饰。YA修饰可为本文所阐述的任何类型的修饰。在一些实施方案中,YA修饰包含硫代磷酸酯、2′-OMe或2′-氟中的一者或多者。在一些实施方案中,YA修饰包含嘧啶修饰,包含硫代磷酸酯、2′-OMe、2′-H、肌苷或2′-氟中的一者或多者。在一些实施方案中,YA修饰在含有一个或多个YA位点的RNA双链体区内包含双环核糖类似物(例如,LNA、BNA或ENA)。在一些实施方案中,YA修饰在含有YA位点的RNA双链体区内包含双环核糖类似物(例如,LNA、BNA或ENA),其中YA修饰位于YA位点远端。
在一些实施方案中,gRNA的引导序列(或引导区)包含1、2、3、4、5或更多个可包含YA修饰的YA位点(“引导区YA位点”)。在一些实施方案中,位于相对于5′末端的5′端的5端、6端、7端、8端、9端或10端处的一个或多个YA位点(其中“5端”等是指相对于引导区的3′端的位置5,即,引导区中的最3′核苷酸)包含YA修饰。经修饰的引导区YA位点包含YA修饰。
在一些实施方案中,经修饰的引导区YA位点位于引导区的3′末端核苷酸的20、19、18、17、16、15、14、13、12、11、10或9个核苷酸内。例如,如果经修饰的引导区YA位点位于引导区的3′末端核苷酸的10个核苷酸内并且引导区具有20个核苷酸长度,则经修饰的引导区YA位点中的经修饰核苷酸位于位置11-20中的任一位置处。在一些实施方案中,经修饰的引导区YA位点位于相对于5′末端的5′端的核苷酸4、5、6、7、8、9、10或11处或其之后。
在一些实施方案中,经修饰的引导区YA位点不同于5′端修饰。例如,sgRNA可包含如本文所描述的5′端修饰并且还包含经修饰的引导区YA位点。或者,sgRNA可包含未经修饰的5′端和经修饰的引导区YA位点。或者,短sgRNA可包含经修饰的5′端和未经修饰的引导区YA位点。
在一些实施方案中,经修饰的引导区YA位点包含位于引导区YA位点的5′的至少一个核苷酸不包含的修饰。例如,如果核苷酸1-3包含硫代磷酸酯,核苷酸4仅包含2′-OMe修饰,并且核苷酸5为YA位点的嘧啶并且包含硫代磷酸酯,则经修饰的引导区YA位点包含位于引导区YA位点的5′的至少一个核苷酸(核苷酸4)不包含的修饰(硫代磷酸酯)。在另一个实例中,如果核苷酸1-3包含硫代磷酸酯,并且核苷酸4为YA位点的嘧啶并且包含2′-OMe,则经修饰的引导区YA位点包含位于引导区YA位点的5′的至少一个核苷酸(核苷酸1-3中的任一者)不包含的修饰(2′-OMe)。如果未经修饰的核苷酸位于经修饰的引导区YA位点的5′,则也始终满足此条件。
在一些实施方案中,经修饰的引导区YA位点包含如上文针对YA位点所描述的修饰。gRNA的引导区可根据任何实施方案修饰,其包含本文所阐述的经修饰引导区。
保守区YA位点1-10说明于图23B中。在一些实施方案中,1、2、3、4、5、6、7、8、9或10个保守区YA位点包含修饰。在一些实施方案中,保守区YA位点1、8或1和8包含YA修饰。在一些实施方案中,保守区YA位点1、2、3、4和10包含YA修饰。在一些实施方案中,YA位点2、3、4、8和10包含YA修饰。在一些实施方案中,保守区YA位点1、2、3和10包含YA修饰。在一些实施方案中,YA位点2、3、8和10包含YA修饰。在一些实施方案中,YA位点1、2、3、4、8和10包含YA修饰。在一些实施方案中,1、2、3、4、5、6、7或8个额外保守区YA位点包含YA修饰。
在一些实施方案中,经修饰的保守区YA位点包含如上文针对YA位点所描述的修饰。在可行的情况下,本公开在别处阐述的任何实施方案可与前述实施方案中的任一者组合。
在一些实施方案中,gRNA的5′和/或3′末端区经修饰。
在一些实施方案中,3′末端区中的末端(即,最后)1、2、3、4、5、6或7个核苷酸经修饰。在全篇中,此修饰可称为“3′端修饰”。在一些实施方案中,3′末端区中的末端(即,最后)1、2、3、4、5、6或7个核苷酸包含超过一个修饰。在一些实施方案中,3′端修饰包含或还包含以下中的任何一者或多者:选自2′-O-甲基(2′-O-Me)修饰的核苷酸、2′-O-(2-甲氧基乙基)(2′-O-moe)修饰的核苷酸、2′-氟(2′-F)修饰的核苷酸、核苷酸之间的硫代磷酸酯(PS)键联、倒转无碱基修饰的核苷酸或其组合的经修饰的核苷酸。在一些实施方案中,3′端修饰包含或还包含gRNA的3′端的1、2、3、4、5、6或7个核苷酸的修饰。在一些实施方案中,3′端修饰包含或还包含一个PS键联,其中所述键联介于最后一个核苷酸与倒数第二个核苷酸之间。在一些实施方案中,3′端修饰包含或还包含最后三个核苷酸之间的两个PS键联。在一些实施方案中,3′端修饰包含或还包含最后四个核苷酸之间的四个PS键联。在一些实施方案中,3′端修饰包含或还包含最后2、3、4、5、6或7个核苷酸中的任何一者或多者之间的PS键联。在一些实施方案中,包含3′端修饰的gRNA包含或还包含3′尾,其中所述3′尾包含存在于3′尾中的核苷酸中的任何一者或多者的修饰。在一些实施方案中,3′尾完全被修饰。在一些实施方案中,3′尾包含1、2、3、4、5、6、7、8、9、10、1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9或1-10个核苷酸,任选地其中这些核苷酸中的任何一者或多者经修饰。在一些实施方案中,提供包含3′端修饰的gRNA,其中所述3′端修饰包含如SEQ ID NO:141-145中的任一者中所示的3′端修饰。在一些实施方案中,提供包含3′保护端修饰的gRNA。在一些实施方案中,3′尾包含1至约20个核苷酸、1至约15个核苷酸、1至约10个核苷酸、1至约5个核苷酸、1至约4个核苷酸、1至约3个核苷酸和1至约2个核苷酸。在一些实施方案中,gRNA不包含3′尾。
在一些实施方案中,5′末端区经修饰,例如gRNA中的前1、2、3、4、5、6或7个核苷酸经修饰。在全篇中,此修饰可称为“5′端修饰”。在一些实施方案中,5′末端区中的前1、2、3、4、5、6或7个核苷酸包含超过一个修饰。在一些实施方案中,5′端的末端(即,前)1、2、3、4、5、6或7个核苷酸中的至少一者经修饰。在一些实施方案中,gRNA的5′和3′端区(例如,端)两者都经修饰。在一些实施方案中,仅gRNA的5′端区经修饰。在一些实施方案中,仅gRNA保守部分中的3′末端区(加或减3′尾)经修饰。在一些实施方案中,gRNA包含在gRNA的5′末端区处的前7个核苷酸中的1、2、3、4、5、6或7者处的修饰。在一些实施方案中,gRNA包含在3′末端区处的7个末端核苷酸中的1、2、3、4、5、6或7者处的修饰。在一些实施方案中,5′末端区处的前4个核苷酸中的2、3或4者,和/或3′末端区处的末端4个核苷酸中的2、3或4者经修饰。在一些实施方案中,5′末端区处的前4个核苷酸中的2、3或4者经由硫代磷酸酯(PS)键连接。在一些实施方案中,对5′末端和/或3′末端的修饰包含2′-O-甲基(2′-O-Me)或2′-0-(2-甲氧基乙基)(2′-O-moe)修饰。在一些实施方案中,修饰包含对核苷酸的2′-氟(2′-F)修饰。在一些实施方案中,修饰包含核苷酸之间的硫代磷酸酯(PS)键联。在一些实施方案中,修饰包含倒转无碱基核苷酸。在一些实施方案中,修饰包含保护端修饰。在一些实施方案中,修饰包含超过一个修饰,其选自保护端修饰、2′-O-Me、2′-O-moe、2′-氟(2′-F)、核苷酸之间的硫代磷酸酯(PS)键联和倒转无碱基核苷酸。在一些实施方案中,涵盖等效修饰。在一些实施方案中,提供包含5′端修饰的gRNA,其中5′端修饰包含如SEQ ID NO:141-145中的任一者中所示的5′端修饰。
在一些实施方案中,提供包含5′端修饰和3′端修饰的gRNA。在一些实施方案中,gRNA包含不处于5′或3′端处的经修饰的核苷酸。
在一些实施方案中,提供包含上茎修饰的sgRNA,其中上茎修饰包含对上茎区中的US1-US12中的任何一者或多者的修饰。在一些实施方案中,提供包含上茎修饰的sgRNA,其中所述上茎修饰包含对上茎区中的至少1、2、3、4、5、6、7、8、9、10、11或所有12个核苷酸的修饰。在一些实施方案中,提供包含上茎修饰的sgRNA,其中所述上茎修饰包含YA位点中的1、2、3、4或5个YA修饰。在一些实施方案中,上茎修饰包含2′-OMe修饰的核苷酸、2′-O-moe修饰的核苷酸、2′-F修饰的核苷酸和/或其组合。本文中所描述的其他修饰,例如5′端修饰和/或3′端修饰可与上茎修饰组合。
在一些实施方案中,sgRNA包含发夹区中的修饰。在一些实施方案中,发夹区修饰包含至少一个经修饰的核苷酸,其选自2′-O-甲基(2′-OMe)修饰的核苷酸、2′-氟(2′-F)修饰的核苷酸和/或其组合。在一些实施方案中,发夹区修饰处于发夹1区中。在一些实施方案中,发夹区修饰处于发夹2区中。在一些实施方案中,发夹修饰包含YA位点中的1、2或3个YA修饰。在一些实施方案中,发夹修饰包含至少1、2、3、4、5或6个YA修饰。本文中所描述的其他修饰,例如上茎修饰、5′端修饰和/或3′端修饰可与发夹区中的修饰组合。
在一些实施方案中,gRNA包含经取代并且任选地经缩短的发夹1区,其中以下核苷酸对中的至少一者在经取代和任选地经缩短的发夹1中经沃森-克里克配对核苷酸(Watson-Crick pairing nucleotide)取代:H1-1和H1-12、H1-2和H1-11、H1-3和H1-10和/或H1-4和H1-9。“沃森-克里克配对核苷酸”包括能够形成沃森-克里克碱基对的任何对,包括A-T、A-U、T-A、U-A、C-G和G-C对,和包括具有相同碱基配对偏好的前述核苷酸中的任一者的经修饰型式的对。在一些实施方案中,发夹1区缺少H1-5至H1-8中的任一者或两者。在一些实施方案中,发夹1区缺少以下核苷酸对中的一者、两者或三者:H1-1和H1-12、H1-2和H1-11、H1-3和H1-10和/或H1-4和H1-9。在一些实施方案中,发夹1区缺少发夹1区的1-8个核苷酸。在前述实施方案中的任一者中,缺少核苷酸可使得经沃森-克里克配对核苷酸(H1-1和H1-12、H1-2和H1-11、H1-3和H1-10和/或H1-4和H1-9)取代的一个或多个核苷酸对在gRNA中形成碱基对。
在一些实施方案中,gRNA还包含缺少至少1个核苷酸的上茎区,例如美国申请第62/946,905号的表7中指示的经缩短的上茎区中的任一者,其内容通过引用整体并入本文或描述于本文中的其他地方,所述上茎区可与本文所描述的经缩短或经取代的发夹1区中的任一者组合。
在一些实施方案中,本文所描述的gRNA还包含联结区,其中所述联结区缺少至少一个核苷酸。
3.gRNA的化学修饰
在一些实施方案中,gRNA经化学修饰。包含一个或多个经修饰的核苷或核苷酸的gRNA称为“经修饰的”gRNA或“经化学修饰的”gRNA,用于描述替代或外加典型A、G、C和U残基使用的一种或多种非天然和/或天然存在的组分或构型的存在。经修饰的核苷和核苷酸可包括以下中的一者或多者:(i)磷酸二酯主链键中的一个或两个非连接磷酸酯氧和/或一个或多个连接磷酸酯氧的变化,例如置换(示例性主链修饰);(ii)核糖组分(例如,核糖上的2′羟基)的变化,例如置换(示例性糖修饰);(iii)用“去磷酸化”接头成批置换磷酸酯部分(示例性主链修饰);(iv)天然存在的核碱基的修饰或置换,包括用非典型核碱基修饰或置换(示例性碱基修饰);(v)核糖-磷酸酯主链的置换或修饰(示例性主链修饰);(vi)寡核苷酸的3′端或5′端的修饰,例如末端磷酸酯基的去除、修饰或置换,或部分、帽或接头的缀合(此类3′或5′帽修饰可包含糖和/或主链修饰);和(vii)糖的修饰或置换(示例性糖修饰)。
化学修饰(例如以上列出的那些)可经组合以得到经修饰的gRNA,其包含可具有两个、三个、四个或更多个修饰的核苷和核苷酸(统称为“残基”)。例如,经修饰的残基可具有经修饰的糖和经修饰的核碱基。在一些实施方案中,gRNA的每一碱基经修饰,例如所有碱基都具有例如硫代磷酸酯基的经修饰的磷酸酯基。在某些实施方案中,gRNA分子的所有或基本上所有磷酸酯基经硫代磷酸酯基置换。在一些实施方案中,经修饰的gRNA在RNA的5′端处或其附近包含至少一个经修饰的残基。在一些实施方案中,经修饰的gRNA在RNA的3′端处或附近包含至少一个经修饰的残基。
在一些实施方案中,gRNA包含一个、二个、三个或更多个经修饰的残基。在一些实施方案中,经修饰的gRNA中至少5%(例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或100%)的位置为经修饰的核苷或核苷酸。
在主链修饰的一些实施方案中,经修饰的残基中的磷酸酯基可通过用不同取代基置换一个或多个氧而经修饰。此外,经修饰的残基,例如存在于经修饰的核酸中的经修饰的残基可包括用如本文所描述的经修饰的磷酸酯基批量置换未经修饰的磷酸酯部分。在一些实施方案中,磷酸酯主链的主链修饰可包括产生不带电接头或具有不对称电荷分布的带电接头的变化。
经修饰的磷酸酯基的实例包括硫代磷酸酯、硒代磷酸酯、硼烷磷酸酯(boranophosphate)、硼烷磷酸酯(borano phosphate ester)、氢膦酸酯、氨基磷酸酯、烷基或芳基膦酸酯和磷酸三酯。
还可构建可模拟核酸的骨架,其中磷酸酯接头和核糖被耐核酸酶性核苷或核苷酸替代物置换。此类修饰可包含主链和糖修饰。在一些实施方案中,核碱基可通过替代主链栓系。实例可包括(但不限于)N-吗啉基、环丁基、吡咯烷和肽核酸(PNA)核苷替代物。
经修饰的核苷和经修饰的核苷酸可包括对糖基的一个或多个修饰,即糖修饰。例如,2′羟基(OH)可经修饰,例如经多个不同“氧基”或“脱氧”取代基置换。在一些实施方案中,对2′羟基的修饰可增强核酸的稳定性,因为羟基可不再经去质子化以形成2′-烷氧离子。2′羟基修饰的实例可包括烷氧基或芳氧基(OR,其中“R”可为例如烷基、环烷基、芳基、芳烷基、杂芳基或糖);聚乙二醇(PEG)、O(CH2CH2O)nCH2CH2OR,其中R可为例如H或任选地被取代的烷基,并且n可为0至20的整数。在一些实施方案中,2′羟基修饰可为2′-O-Me。在一些实施方案中,2′羟基修饰可为2′-氟修饰,其用氟化物置换2′羟基。在一些实施方案中,2′羟基修饰可包括“锁”核酸(LNA),其中2′羟基可例如通过C1-6亚烷基或C1-6亚杂烷基桥连接到同一核糖的4′碳,其中示例性桥可包括亚甲基、丙烯、乙醚或氨基桥。在一些实施方案中,2′羟基修饰可包括“解锁”核酸(UNA),其中核糖环缺少C2′-C3′键。在一些实施方案中,2′羟基修饰可包括甲氧基乙基(MOE)(OCH2CH2OCH3,例如PEG衍生物)。
“脱氧”2修饰可包括氢(即,脱氧核糖,例如在部分dsRNA的突出部分处);卤基(例如溴基、氯基、氟基或碘基);氨基(其中氨基可为例如NH2;烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳氨基、二杂芳氨基或氨基酸);NH(CH2CH2NH)nCH2CH2-氨基(其中氨基可例如如本文所描述)、-NHC(O)R(其中R可为例如烷基、环烷基、芳基、芳烷基、杂芳基或糖)、氰基;巯基;烷基-硫基-烷基;硫代烷氧基;以及可任选地经例如如本文所描述的氨基取代的烷基、环烷基、芳基、烯基和炔基。
糖修饰可包含还可含有一个或多个碳的糖基,其具有与核糖中的对应碳相反的立体化学构型。因此,经修饰的核酸可包括含有例如阿拉伯糖作为糖的核苷酸。经修饰的核酸也可包括无碱基糖。这些无碱基糖也可进一步在成分糖原子中的一者或多者处经修饰。经修饰的核酸也可包括一种或多种呈L形式的糖,例如L-核苷。
可并入至经修饰的核酸中的本文所描述的经修饰的核苷和经修饰的核苷酸可包括经修饰的碱基,也称为核碱基。核碱基的实例包括但不限于腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和尿嘧啶(U)。这些核碱基可经修饰或全部被置换以提供可并入经修饰的核酸中的经修饰的残基。核苷酸的核碱基可独立地选自嘌呤、嘧啶、嘌呤类似物或嘧啶类似物。在一些实施方案中,核碱基可包括例如天然存在的碱基衍生物和合成碱基衍生物。
在使用双重引导RNA的实施方案中,crRNA和tracr RNA中的每一者可含有修饰。此类修饰可处于crRNA和/或tracr RNA的一端或两端处。在包含sgRNA的实施方案中,sgRNA的一端或两端处的一个或多个残基可经化学修饰,或整个sgRNA可经化学修饰。某些实施方案包含5′端修饰。某些实施方案包含3′端修饰。在某些实施方案中,gRNA分子的单链突出中的一个或多个或所有核苷酸为脱氧核苷酸。
在一些实施方案中,本文所公开的gRNA包含2018年6月14日公开的WO2018/107028A1中所公开的修饰模式中的一者,所述文件的内容特此通过引用整体并入。
术语“mA”、“mC”、“mU”或“mG”可用于表示经2′-O-Me修饰的核苷酸。术语“fA”、“fC”、“fU”或“fG”可用于表示经2′-F取代的核苷酸。“*”可用于描述PS修饰。术语A*、C*、U*或G*可用于表示经PS键连接到下一个(例如3′)核苷酸的核苷酸。术语“mA*”、“mC*”、“mU*”或“mG*”可用于表示已经2′-O-Me取代并且经PS键连接到下一个(例如3′)核苷酸的核苷酸。
H.脂质;制剂;递送
本文公开了使用包含本文中所描述的核酸或组合物的脂质核酸组装组合物的各种实施方案。在一些实施方案中,脂质核酸组装组合物包含核酸(例如,mRNA),所述核酸包含编码包含胞苷脱氨酶(例如A3A)和RNA引导的切口酶的第一多肽的开放阅读框。在一些实施方案中,脂质核酸组装组合物包含第一核酸和编码UGI的第二核酸,所述第一核酸包含编码包含胞苷脱氨酶(例如A3A)和RNA引导的切口酶的第一多肽的开放阅读框。
如本文所用,“脂质核酸组装组合物”是指基于脂质的递送组合物,包括脂质纳米粒子(LNP)和脂质复合物。LNP是指<100nM的脂质纳米粒子。LNP是通过将脂质组分(例如于乙醇中)与水性核酸组分精确混合而形成,并且LNP的大小均一。脂质复合物是通过使脂质与核酸组分大量混合而形成的粒子并且大小在约100nm与1微米之间。在某些实施方案中,脂质核酸组装体为LNP。如本文所用,“脂质核酸组装体”包含多个(即,超过一个)通过分子间力以物理方式彼此缔合的脂质分子。脂质核酸组装体可包含pKa值为<7.5或<7的生物可用脂质。脂质核酸组装体是通过混合含水性核酸溶液与基于有机溶剂的脂质溶液(例如,100%乙醇)形成。合适的溶液或溶剂包括或可含有:水、PBS、Tris缓冲液、NaCl、柠檬酸盐缓冲液、乙醇、氯仿、二乙醚、环己烷、四氢呋喃、甲醇、异丙醇。药学上可接受的缓冲液可任选地包含在包含脂质核酸组装体的药物制剂中,例如用于离体疗法。在一些实施方案中,水溶液包含RNA,例如mRNA或gRNA。在一些实施方案中,水溶液包含编码经RNA引导的DNA结合剂(例如Cas9)的mRNA。
如本文所用,脂质纳米粒子(LNP)是指包含多个(即,超过一个)通过分子间力以物理方式彼此缔合的脂质分子的粒子。LNP可例如为微球体(包括单层和多层囊泡,例如“脂质体”-在一些实施方案中为基本上球形的层状相脂质双层-并且在更特定实施方案中可包含水性核心,例如包含大部分RNA分子)、乳液中的分散相、微胞或悬浮液中的内相。乳液、微胞和悬浮液可为用于局部和/或表面递送的合适组合物。也参见例如WO2017173054A1,其内容特此通过引用整体并入。本领域技术人员已知能够将核苷酸递送至受试者的任何LNP可与引导RNA和编码RNA引导的切口酶的核酸和编码本文所描述的胞苷脱氨酶的核酸一起使用。
在一些实施方案中,水溶液包含编码包含A3A和RNA引导的切口酶的多肽的核酸。包含脂质核酸组装组合物的药物制剂可任选地包含药学上可接受的缓冲液。
在一些实施方案中,脂质核酸组装组合物包括“胺脂质”(在本文中或其他地方有时描述为“可离子化脂质”或“可生物降解脂质”),以及任选的“辅助脂质”、“中性脂质”和隐形脂质,例如PEG脂质。在一些实施方案中,取决于pH,胺脂质或可离子化脂质为阳离子型的。
1.胺脂质
在一些实施方案中,脂质核酸组装组合物包含“胺脂质”,其为例如可离子化脂质,例如脂质A或其等同物,包括脂质A的缩醛类似物。
在一些实施方案中,胺脂质为脂质A,其为十八-9,12-二烯酸(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙酯,也称为(9Z,12Z)-十八-9,12--二烯酸3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙酯。脂质A可描绘为:
可根据WO2015/095340(例如第84-86页)合成脂质A。在一些实施方案中,胺脂质为脂质A的等同物。
在一些实施方案中,胺脂质为脂质A的类似物。在一些实施方案中,脂质A类似物为脂质A的缩醛类似物。在特定脂质核酸组装组合物中,缩醛类似物为C4-C12缩醛类似物。在一些实施方案中,缩醛类似物为C5-C12缩醛类似物。在额外实施方案中,缩醛类似物为C5-C10缩醛类似物。在其他实施方案中,缩醛类似物选自C4、C5、C6、C7、C9、C10、C11和C12缩醛类似物。
适用于本文所描述的脂质核酸组装体的胺脂质和其他“可生物降解脂质”是体内或离体可生物降解的。胺脂质具有低毒性(例如,以大于或等于10mg/kg的量在动物模型中得到耐受而不具有不良作用)。在一些实施方案中,包含胺脂质的脂质核酸组装体包括其中在8、10、12、24或48小时或3、4、5、6、7或10天内从血浆或工程化细胞清除至少75%胺脂质的脂质核酸组装体。在一些实施方案中,包含胺脂质的脂质核酸组装体包括其中在8、10、12、24或48小时或3、4、5、6、7或10天内从血浆清除至少50%核酸,例如mRNA或gRNA的脂质核酸组装体。在一些实施方案中,包含胺脂质的脂质核酸组装体包括其中在8、10、12、24或48小时或3、4、5、6、7或10天内从血浆清除至少50%脂质核酸组装体的脂质核酸组装体,例如通过测量脂质(例如,胺脂质)、核酸(例如,RNA/mRNA)或其他组分。在一些实施方案中,测量脂质核酸组装体的经脂质囊封相对于游离的脂质、RNA或核酸组分。
可生物降解脂质包括例如WO/2020/219876、WO/2020/118041、WO/2020/072605、WO/2019/067992、WO/2017/173054、WO2015/095340和WO2014/136086的可生物降解脂质,并且LNP包括其中所描述的LNP组合物,其脂质和组合物特此通过引用并入。
脂质清除率可如文献中所描述来测量。参见Maier,M.A.等人,BiodegradableLipids Enabling Rapidly Eliminated Lipid Nanoparticles for Systemic Deliveryof RNAi Therapeutics.Mol.Ther.2013,21(8),1570-78(“Maier”)。例如,在Maier中,以0.3mg/kg通过静脉内推注经由外侧尾部静脉向六至八周龄雄性C57BL/6小鼠施用含有靶向荧光素酶的siRNA的LNP-siRNA系统。在给药后0.083、0.25、0.5、1、2、4、8、24、48、96和168小时收集血液、肝脏和脾脏样本。在收集组织之前向小鼠灌注生理盐水并且处理血液样本以获得血浆。处理并通过LC-MS分析所有样本。此外,Maier描述了一种用于评定施用LNP-siRNA制剂之后的毒性的程序。例如,以0、1、3、5和10mg/kg(5只动物/组)经由单一静脉内推注以5mL/kg的剂量体积向雄性史泊格-多利大鼠(Sprague-Dawley rat)施用靶向荧光素酶的siRNA。24小时后,从清醒动物的颈静脉获得约1mL血液并且分离血清。在给药后72小时,将所有动物安乐死以用于尸体剖检。进行临床征象、体重、血清化学、器官重量和组织病理学的评定。尽管Maier描述了用于评定siRNA-LNP制剂的方法,但这些方法可适用于评定本公开的脂质核酸组装组合物的施用的清除率、药物动力学和毒性。
本领域中已知用于核酸的LNP递送的可离子化和生物可用脂质是合适的。脂质可取决于其所存在的介质的pH而离子化。例如,在弱酸性介质中,脂质如胺脂质可经质子化并且因此带有正电荷。相反地,在弱碱性介质,例如其中pH为大约7.35的血液中,脂质如胺脂质可不经质子化并且因此不带电荷。
脂质携带电荷的能力与其固有pKa有关。在一些实施方案中,本公开的胺脂质可各自独立地具有在约5.1至约7.4范围内的pKa。在一些实施方案中,本公开的生物可用脂质可各自独立地具有在约5.1至约7.4,例如约5.5至约6.6、约5.6至约6.4、约5.8至约6.2或约5.8至约6.5范围内的pKa。例如,本公开的胺脂质可各自独立地具有在约5.8至约6.5范围内的pKa。pKa在约5.1至约7.4范围内的脂质可有效用于体内递送货物(cargo),例如递送至肝脏。此外,已发现,pKa在约5.3至约6.4范围内的脂质对体内递送至例如肿瘤是有效的。参见例如WO2014/136086。
2.额外脂质
适用于本公开的脂质核酸组装组合物中的“中性脂质”包括例如多种中性、不带电荷或两性离子型脂质。适用于本公开的中性磷脂的实例包括但不限于:5-十七基苯-1,3-二醇(间苯二酚)、二棕榈酰基磷脂酰胆碱(DPPC)、二硬脂酰基磷脂酰胆碱(DSPC)、磷酸胆碱(DOPC)、二肉豆蔻酰基磷脂酰胆碱(DMPC)、磷脂酰胆碱(PLPC)、1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱(DAPC)、磷脂酰乙醇胺(PE)、卵磷脂酰胆碱(EPC)、二月桂酰基磷脂酰胆碱(DLPC)、二肉豆蔻酰基磷脂酰胆碱(DMPC)、1-肉豆蔻酰基-2-棕榈酰基磷脂酰胆碱(MPPC)、1-棕榈酰基-2-肉豆蔻酰基磷脂酰胆碱(PMPC)、1-棕榈酰基-2-硬脂酰基磷脂酰胆碱(PsPC)、1,2-二花生酰基-sn-甘油-3-磷酸胆碱(DBPC)、1-硬脂酰基-2-棕榈酰基磷脂酰胆碱(SPPC)、1,2-二十碳烯酰基-sn-甘油-3-磷酸胆碱(DEPC)、棕榈酰油酰基磷脂酰胆碱(POPC)、溶血磷脂酰基胆碱、二油酰基磷脂酰乙醇胺(DOPE)、二亚油酰基磷脂酰胆碱二硬脂酰基磷脂酰乙醇胺(DSPE)、二肉豆蔻酰基磷脂酰乙醇胺(DMPE)、二棕榈酰基磷脂酰乙醇胺(DPPE)、棕榈酰油酰基磷脂酰乙醇胺(POPE)、溶血磷脂酰乙醇胺和其组合。在一个实施方案中,中性磷脂可选自由以下组成的组:二硬脂酰基磷脂酰胆碱(DSPC)和二肉豆蔻酰基磷脂酰乙醇胺(DMPE)。在另一个实施方案中,中性磷脂可为二硬脂酰基磷脂酰胆碱(DSPC)。
“辅助脂质”包括类固醇、固醇和烷基间苯二酚。适用于本公开中的辅助脂质包括但不限于胆固醇、5-十七基间苯二酚和胆固醇半丁二酸酯。在一个实施方案中,辅助脂质可为胆固醇。在一个实施方案中,辅助脂质可为胆固醇半丁二酸酯。
“隐形脂质”是改变纳米粒子可在体内(例如血液中)存在的时长的脂质。隐形脂质可通过例如减少粒子聚集并控制粒度来辅助配制过程。本文所用的隐形脂质可调节脂质核酸组装体的药物动力学特性或有助于纳米粒子离体稳定性。适用于本公开的脂质核酸组装组合物的隐形脂质包括但不限于具有连接到脂质部分的亲水性头基的隐形脂质。适用于本公开的脂质核酸组装组合物的隐形脂质和关于此类脂质的生物化学的信息可见于Romberg等人,Pharmaceutical Research,第25卷,第1期,2008,第55-71页和Hoekstra等人,Biochimica et Biophysica Acta 1660(2004)41-52。额外合适PEG脂质公开于例如WO2006/007712中。
在一个实施方案中,隐形脂质的亲水性头基包含选自基于PEG的聚合物的聚合物部分。隐形脂质可包含脂质部分。在一些实施方案中,隐形脂质为PEG脂质。
在一个实施方案中,隐形脂质包含选自基于以下的聚合物的聚合物部分:PEG(有时称为聚(环氧乙烷))、聚(噁唑啉)、聚(乙烯醇)、聚(甘油)、聚(N-乙烯基吡咯烷酮)、聚氨基酸和聚[N-(2-羟丙基)甲基丙烯酰胺]。
在一个实施方案中,PEG脂质包含基于PEG(有时称为聚(环氧乙烷))的聚合物部分。
PEG脂质还包含脂质部分。在一些实施方案中,脂质部分可源自二酰基甘油或二酰基甘油酰胺、包括包含具有独立地包含约C4至约C40饱和或不饱和碳原子的烷基链长度的二烷基甘油或二烷基甘油酰胺基的那些,其中所述链可包含一个或多个官能团,例如酰胺或酯。在一些实施方案中,烷基链长度包含约C10至C20。二烷基甘油或二烷基甘油酰胺基还可包含一个或多个被取代的烷基。链长可为对称或不对称的。
除非另外指示,否则如本文所用的术语“PEG”意指任何聚乙二醇或其他聚亚烷醚聚合物。在一个实施方案中,PEG为乙二醇或环氧乙烷的任选地被取代的直链或支链聚合物。在一个实施方案中,PEG是未被取代的。在一个实施方案中,PEG被例如一个或多个烷基、烷氧基、酰基、羟基或芳基取代。在一个实施方案中,所述术语包括PEG共聚物,例如PEG-聚氨基甲酸酯或PEG-聚丙烯(参见例如J.Milton Harris,Poly(ethylene glycol)chemistry:biotechnical and biomedical applications(1992));在另一个实施方案中,所述术语不包括PEG共聚物。在一个实施方案中,PEG的分子量为约130至约50,000,在一个子实施方案中,约150至约30,000,在一个子实施方案中,约150至约20,000,在一个子实施方案中,约150至约15,000,在一个子实施方案中,约150至约10,000,在一个子实施方案中,约150至约6,000,在一个子实施方案中,约150至约5,000,在一个子实施方案中,约150至约4,000,在一个子实施方案中,约150至约3,000,在一个子实施方案中,约300至约3,000,在一个子实施方案中,约1,000至约3,000,和在一个子实施方案中,约1,500至约2,500。
在一些实施方案中,PEG(例如,与脂质部分或脂质如隐形脂质缀合)为“PEG-2K”,也称为“PEG 2000”,其平均分子量为约2,000道尔顿。PEG-2K在本文中由下式(I)表示,其中n为45,意指数均聚合度包含约45个亚基:然而,可使用本领域中已知的其他PEG实施方案,包括例如其中数均聚合度包含约23个亚基(n=23)和/或68个亚基(n=68)的那些。在一些实施方案中,n可在约30至约60范围内。在一些实施方案中,n可在约35至约55范围内。在一些实施方案中,n可在约40至约50范围内。在一些实施方案中,n可在约42至约48范围内。在一些实施方案中,n可为45。在一些实施方案中,R可选自H、被取代的烷基和未被取代的烷基。在一些实施方案中,R可为未被取代的烷基。在一些实施方案中,R可为甲基。
在本文所描述的实施方案中的任一者中,PEG脂质可选自:PEG-二月桂酰甘油、PEG-二肉豆蔻酰甘油(PEG-DMG)(目录号GM-020,获自NOF,Tokyo,Japan)、PEG-二棕榈酰甘油、PEG-二硬脂酰甘油(PEG-DSPE)(目录号DSPE-020CN,NOF,Tokyo,Japan)、PEG-二月桂基甘油酰胺、PEG-二肉豆蔻基甘油酰胺、PEG-二软酯酰甘油酰胺和PEG-二硬脂酰甘油酰胺、PEG-胆固醇(1-[8′-(胆甾-5-烯-3[β]-氧基)甲酰胺基-3′,6′-二氧杂辛基]氨甲酰基-[ω]-甲基-聚(乙二醇)、PEG-DMB(3,4-二-十四氧基苯甲基-[ω]-甲基-聚(乙二醇)醚)、1,2-二肉豆蔻酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DMG)(目录号880150P,获自Avanti Polar Lipids,Alabaster,Alabama,USA)、1,2-二硬脂酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSPE)(目录号880120C,获自Avanti Polar Lipids,Alabaster,Alabama,USA)、1,2-二硬脂酰基-sn-甘油,甲氧基聚乙二醇(PEG2k-DSG;GS-020,NOF Tokyo,Japan)、聚(乙二醇)-2000--二甲基丙烯酸酯(PEG2k-DMA)和1,2-二硬脂酰氧基丙基-3-胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSA)。在一个实施方案中,PEG脂质可为PEG2k-DMG。在一些实施方案中,PEG脂质可为PEG2k-DSG。在一个实施方案中,PEG脂质可为PEG2k-DSPE。在一个实施方案中,PEG脂质可为PEG2k-DMA。在一个实施方案中,PEG脂质可为PEG2k-C-DMA。在一个实施方案中,PEG脂质可为化合物S027,其公开于WO2016/010840(第[00240]至[00244]段)中。在一个实施方案中,PEG脂质可为PEG2k-DSA。在一个实施方案中,PEG脂质可为PEG2k-C11。在一些实施方案中,PEG脂质可为PEG2k-C14。在一些实施方案中,PEG脂质可为PEG2k-C16。在一些实施方案中,PEG脂质可为PEG2k-C18。
3.制剂
脂质核酸组装体可含有(i)可生物降解脂质,(ii)任选的中性脂质,(iii)辅助脂质,和(iv)隐形脂质,例如PEG脂质。脂质核酸组装体可含有可生物降解的脂质以及中性脂质、辅助脂质和隐形脂质(例如PEG脂质)中的一者或多者。
脂质核酸组装体可含有(i)用于囊封和用于核内体逃逸(endosomal escape)的胺脂质,(ii)用于稳定化的中性脂质、(iii)也用于稳定化的辅助脂质和(iv)隐形脂质,例如PEG脂质。脂质核酸组装体可含有胺脂质以及中性脂质、也用于稳定化的辅助脂质和隐形脂质(例如PEG脂质)中的一者或多者。
实现本文所描述的所描述功能效应所需的mRNA可以一种或多种脂质核酸组装组合物递送至细胞。例如,一种脂质核酸组装组合物可经配制以用于递送,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的mRNA以及编码例如一种或多种UGI和一种或多种gRNA的额外mRNA。或者,编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的mRNA、编码一个或多个UGI的mRNA和编码一种或多种gRNA的mRNA可配制于单独的脂质核酸组装组合物中。因此,一种或多种脂质核酸组装组合物可体外或体内递送至细胞。
在一些实施方案中,提供了一种修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,所述一种或多种脂质核酸组装组合物包含:
(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;
(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和
(c)一种或多种引导RNA。
在一些实施方案中,部分(a)和(b)在单独的脂质核酸组装组合物中。在一些实施方案中,部分(a)和(b)在同一脂质核酸组装组合物中。在一些实施方案中,部分(a)和(c)在单独的脂质核酸组装组合物中。在一些实施方案中,部分(a)和(c)在同一脂质核酸组装组合物中。在一些实施方案中,部分(b)和(c)在单独的脂质核酸组装组合物中。在一些实施方案中,部分(a)和(c)在同一脂质核酸组装组合物中,并且部分(b)在单独的脂质核酸组装组合物中。在一些实施方案中,部分(a)、(b)和(c)各自在单独的脂质核酸组装组合物中。在一些实施方案中,部分(a)、(b)和(c)在同一脂质核酸组装组合物中。在一些实施方案中,一种或多种引导RNA各自在单独的脂质核酸组装组合物中。
在一些实施方案中,所述方法还包括递送一种或多种脂质核酸组装组合物中的一种或多种引导RNA,所述一种或多种脂质核酸组装组合物与包含A3A和UGI的脂质核酸组装组合物分离。
在一些实施方案中,向细胞递送至少2种、3种、4种、5种、6种、7种、8种、9种或10种脂质核酸组装组合物。在一些实施方案中,至少一种脂质核酸组装组合物包含脂质纳米粒子(LNP)。在一些实施方案中,所有脂质核酸组装组合物都包含LNP。在一些实施方案中,至少一种脂质核酸组装组合物是脂质复合物组合物。
在一些实施方案中,脂质核酸组装组合物,例如LNP组合物包含编码多肽的mRNA,所述多肽包含如本文所描述的胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶。在一些实施方案中,脂质核酸组装组合物(例如LNP组合物)包含:编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽的mRNA;和gRNA。
在一些实施方案中,脂质核酸组装组合物包含含有mRNA的第一脂质核酸组装组合物,所述mRNA编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的第一多肽。在一些实施方案中,脂质核酸组装组合物还包含含有gRNA的第二脂质核酸组装组合物。
在一些实施方案中,脂质核酸组装组合物包含:第一组合物,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的第一多肽的mRNA;和编码尿嘧啶糖苷酶抑制剂(UGI)的一个或多个第二mRNA。在一些实施方案中,脂质核酸组装组合物还包含一种或多种gRNA。
在一些实施方案中,脂质核酸组装组合物还包含含有gRNA的第二脂质核酸组装组合物。在一些实施方案中,脂质核酸组装组合物包含第一和第二脂质核酸组装组合物,其中第一组合物包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的mRNA;并且第二组合物包含编码尿嘧啶糖苷酶抑制剂(UGI)的一个或多个mRNA。在一些实施方案中,第一脂质核酸组装组合物或第二脂质核酸组装组合物还包含一种或多种gRNA。在一些实施方案中,脂质核酸组装组合物还包含含有一种或多种gRNA的第三脂质核酸组装组合物。
在一些实施方案中,脂质核酸组装组合物包含:包含mRNA的第一脂质核酸组装组合物,所述mRNA包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的第一多肽的开放阅读框;和包含一种或多种引导RNA(gRNA)的第二脂质核酸组装组合物。
在一些实施方案中,脂质核酸组装组合物包含:包含第一mRNA的第一组合物,所述第一mRNA包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的第一多肽的第一开放阅读框;和第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的一个或多个第二开放阅读框。在一些实施方案中,脂质核酸组装组合物还包含一种或多种gRNA。在一些实施方案中,脂质核酸组装组合物还包含含有一种或多种gRNA的第二脂质核酸组装组合物。
在一些实施方案中,脂质核酸组装组合物包含第一和第二脂质核酸组装组合物,其中第一组合物包含含有编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的第一多肽的第一开放阅读框的第一mRNA;第二组合物包含含有编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框的第二mRNA。在一些实施方案中,第一脂质核酸组装组合物或第二脂质核酸组装组合物还包含gRNA。在一些实施方案中,脂质核酸组装组合物还包含含有gRNA的第三脂质核酸组装组合物。
在一些实施方案中,脂质核酸组装组合物包含:包含第一mRNA的第一组合物,所述第一mRNA包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的第一多肽的第一开放阅读框;和包含尿嘧啶糖苷酶抑制剂(UGI)的第二组合物。在一些实施方案中,第一脂质核酸组装组合物或第二脂质核酸组装组合物还包含gRNA。在一些实施方案中,脂质核酸组装组合物还包含含有gRNA的第三脂质核酸组装组合物。
在一些实施方案中,脂质核酸组装组合物包含第一和第二脂质核酸组装组合物,其中第一组合物包含含有胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽;并且第二组合物包含含有编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框的第二mRNA。在一些实施方案中,第一脂质核酸组装组合物或第二脂质核酸组装组合物还包含gRNA。在一些实施方案中,脂质核酸组装组合物还包含含有gRNA的第三脂质核酸组装组合物。
在某些实施方案中,脂质核酸组装组合物可包含胺mRNA、任选地gRNA、胺脂质、辅助脂质、中性脂质和隐形脂质。在某些脂质核酸组装组合物中,辅助脂质为胆固醇。在其他脂质核酸组装组合物中,中性脂质为DSPC。在其他实施方案中,隐形脂质为PEG2k-DMG或PEG2k-C11。在某些实施方案中,脂质核酸组装组合物包含脂质A或脂质A的等同物;辅助脂质;中性脂质;隐形脂质。在某些组合物中,胺脂质为脂质A。在某些组合物中,胺脂质为脂质A或其缩醛类似物;辅助脂质为胆固醇;中性脂质为DSPC;并且隐形脂质为PEG2k-DMG。
本公开的实施方案也提供根据胺脂质(N)的带正电胺基与待囊封的核酸的带负电磷酸酯基(P)之间的摩尔比描述的核酸组装组合物。这可由方程式N/P数学表示。在一些实施方案中,脂质核酸组装组合物可包含脂质组分,其包含胺脂质、辅助脂质、中性脂质和PEG脂质;和核酸组分,其中N/P比为约3至10。在一些实施方案中,脂质核酸组装组合物可包含脂质组分,其包含胺脂质、辅助脂质和PEG脂质;和核酸组分,其中N/P比为约3至10。在一些实施方案中,脂质核酸组装组合物可包含脂质组分,其包含胺脂质、辅助脂质、中性脂质和辅助脂质;和RNA组分,其中N/P比为约3至10。在一些实施方案中,脂质核酸组装组合物可包含脂质组分,其包含胺脂质、辅助脂质和PEG脂质;和RNA组分,例如mRNA或gRNA,其中N/P比为约3至10。在一个实施方案中,N/P比可为约5至7。在一个实施方案中,N/P比可为约3至7。在一个实施方案中,N/P比可为约4.5至8。在一个实施方案中,N/P比可为约6。在一个实施方案中,N/P比可为6±1。在一个实施方案中,N/P比可为6±0.5。在一些实施方案中,N/P比将为目标N/P比的±30%、±25%、±20%、±15%、±10%、±5%或±2.5%。在某些实施方案中,LNP批次间变化将低于15%、低于10%或小于5%。
在一些实施方案中,脂质核酸组装组合物通过混合水性RNA溶液与基于有机溶剂的脂质溶液(例如,100%乙醇)形成。合适的溶液或溶剂包括或可含有:水、PBS、Tris缓冲液、NaCl、柠檬酸盐缓冲液、乙醇、氯仿、二乙醚、环己烷、四氢呋喃、甲醇、异丙醇。可使用药学上可接受的缓冲液,例如用于体内施用脂质核酸组装组合物。在某些实施方案中,缓冲液用于将包含脂质核酸组装组合物的组合物的pH维持处于或高于pH 6.5。在某些实施方案中,缓冲液用于将包含LNP的组合物的pH维持处于或高于pH 7.0。在某些实施方案中,组合物的pH在约7.2至约7.7范围内。在额外实施方案中,组合物的pH在约7.3至约7.7范围内或约7.4至约7.6范围内。在其他实施方案中,组合物的pH为约7.2、7.3、7.4、7.5、7.6或7.7。组合物的pH可用微型pH探针进行测量。在某些实施方案中,组合物中包括低温保护剂。低温保护剂的非限制性实例包括蔗糖、海藻糖、甘油、DMSO和乙二醇。示例性组合物可包括至多10%低温保护剂,例如蔗糖。在某些实施方案中,脂质核酸组装组合物可包括约1%、2%、3%、4%、5%、6%、7%、8%、9%或10%低温保护剂。在某些实施方案中,脂质核酸组装组合物可包括约1%、2%、3%、4%、5%、6%、7%、8%、9%或10%蔗糖。在一些实施方案中,脂质核酸组装组合物可包括缓冲液。在一些实施方案中,缓冲液可包含磷酸盐缓冲液(PBS)、Tris缓冲液、柠檬酸盐缓冲液和其混合物。在某些示例性实施方案中,缓冲液包含NaCl。在某些实施方案中,省略NaCl。NaCl的示例性量可在约20mM至约45mM范围内。NaCl的示例性量可在约40mM至约50mM范围内。在一些实施方案中,NaC1的量为约45mM。在一些实施方案中,缓冲液为Tris缓冲液。Tris的示例性量可在约20mM至约60mM范围内。Tris的示例性量可在约40mM至约60mM范围内。在一些实施方案中,Tris的量为约50mM。在一些实施方案中,缓冲液包含NaCl和Tris。脂质核酸组装组合物的某些示例性实施方案含有5%蔗糖和含45mMNaCl的Tris缓冲液。在其他示例性实施方案中,组合物含有呈约5%w/v的量的蔗糖、约45mM NaCI和约50mM Tris(pH 7.5)。盐、缓冲液和低温保护剂量可有所变化以使得总制剂的重量渗透摩尔浓度得以维持。例如,最终重量渗透摩尔浓度可维持低于450mOsm/L。在其他实施方案中,重量渗透摩尔浓度在350与250mOsm/L之间。某些实施方案的最终重量渗透摩尔浓度为300+/-20mOsm/L。
在一些实施方案中,使用微流混合、T型混合或交叉混合。在某些方面,流动速率、接头大小、接头几何结构、接头形状、管径、溶液和/或核酸和脂质浓度可有所变化。脂质核酸组装组合物可例如经由渗析、切向流过滤或色谱法得到浓缩或纯化。脂质核酸组装组合物可以例如悬浮液、乳液或冻干粉末形式储存。在一些实施方案中,脂质核酸组装组合物储存在2-8℃下,在某些方面,LNP组合物储存在室温下。在额外实施方案中,脂质核酸组装组合物冷冻储存,例如在-20℃或-80℃下。在其他实施方案中,脂质核酸组装组合物储存在约0℃至约-80℃范围内的温度下。冷冻的脂质核酸组装组合物可在使用之前例如在冰上、在室温下或在25℃下解冻。
脂质核酸组装组合物可为例如微球体、于乳液中的分散相、微胞或悬浮液中的内相。
此外,在一些实施方案中,脂质核酸组装组合物是可生物降解的,这是因为其不会在治疗有效剂量下体内积聚至细胞毒性水平。在一些实施方案中,脂质核酸组装组合物不在治疗剂量水平下引起导致重大副作用的先天性免疫反应。在一些实施方案中,本文提供的脂质核酸组装组合物不会在治疗剂量水平下引起毒性。
本文公开的LNP的大小(例如,Z平均直径)为约1至约150nm。在一些实施方案中,LNP的大小为约10至约200nm。在一些实施方案中,LNP的大小为约50至约100nm。在一些实施方案中,LNP的大小为约60至约100nm。在一些实施方案中,LNP的大小为约75至约100nm。在一些实施方案中,LNP组合物包含平均直径为约20-100nm的LNP群体。在一些实施方案中,LNP组合物包含平均直径为约50-100nm的LNP群体。在一些实施方案中,LNP组合物包含平均直径为约60-100nm的LNP群体。在一些实施方案中,LNP组合物包含平均直径为或约75-100nm的LNP群体。除非另外指明,否则本文所提及的所有大小为完全成形纳米粒子的平均大小(直径),如通过Malvern Zetasizer上的动态光散射所测量。纳米粒子样本稀释于磷酸盐缓冲盐水(PBS)中,以使得计数率为大约200-400kcps。数据呈现为强度量度的加权平均值(Z平均直径)。
在一些实施方案中,LNP经形成而具有在约50%至约100%范围内的平均囊封效率。在一些实施方案中,LNP经形成而具有在约50%至约70%范围内的平均囊封效率。在一些实施方案中,LNP经形成而具有在约70%至约90%范围内的平均囊封效率。在一些实施方案中,LNP经形成而具有在约90%至约100%范围内的平均囊封效率。在一些实施方案中,LNP经形成而具有在约75%至约95%范围内的平均囊封效率。
在一些实施方案中,LNP经形成而具有在约1.00E+05g/mol至约1.00E+10g/mol范围内的平均分子量。在一些实施方案中,LNP经形成而具有在约5.00E+05g/mol至约7.00E+07g/mol范围内的平均分子量。在一些实施方案中,LNP经形成而具有在约1.00E+06g/mol至约1.00E+10g/mol范围内的平均分子量。在一些实施方案中,LNP经形成而具有在约1.00E+07g/mol至约1.00E+09g/mol范围内的平均分子量。在一些实施方案中,LNP经形成而具有在约5.00E+06g/mol至约5.00E+09g/mol范围内的平均分子量。
在一些实施方案中,多分散性(Mw/Mn;重均摩尔质量(Mw)与数均摩尔质量(Mn)的比率)可在约1.000至约2.000范围内。在一些实施方案中,Mw/Mn可在约1.00至约1.500范围内。在一些实施方案中,Mw/Mn可在约1.020至约1.400范围内。在一些实施方案中,Mw/Mn可在约1.010至约1.100范围内。在一些实施方案中,Mw/Mn可在约1.100至约1.350范围内。
可使用动态光散射(“DLS”)来表征本公开的LNP的多分散性指数(“pdi”)和大小。DLS测量由将样本置于光源下而产生的光的散射。如根据DLS测量所测定,PDI表示群体中粒度的分布(平均粒度周围),其中完全均一群体的PDI为零。在一些实施方案中,pdi可在0.005至0.75范围内。在一些实施方案中,pdi可在0.01至0.5范围内。在一些实施方案中,pdi可在0.02至0.4范围内。在一些实施方案中,pdi可在0.03至0.35范围内。在一些实施方案中,pdi可在0.1至0.35范围内。在一些实施方案中,pdi可在约零至约0.4范围内,例如约零至约0.35。在一些实施方案中,pdi可在约零至约0.35、约零至约0.3、约零至约0.25或约零至约0.2范围内。在一些实施方案中,pdi小于约0.08、0.1、0.15、0.2或0.4。
在一些实施方案中,本文公开的LNP的大小为1至250nm。在一些实施方案中,LNP的大小为10至200nm。在其他实施方案中,LNP的大小为20至150nm。在一些实施方案中,LNP的大小为50至150nm。在一些实施方案中,LNP的大小为50至100nm。在一些实施方案中,LNP的大小为50至120nm。在一些实施方案中,LNP的大小为75至150nm。在一些实施方案中,LNP的大小为30至200nm。除非另外指明,否则本文所提及的所有大小为完全成形纳米粒子的平均大小(直径),如通过Malvern Zetasizer上的动态光散射所测量。将纳米粒子样本稀释在磷酸盐缓冲盐水(PBS)中,以使得计数率为大约200-400kcts。数据呈现为强度量度的加权平均值。在一些实施方案中,LNP经形成而具有在50%至100%范围内的平均囊封效率。在一些实施方案中,LNP经形成而具有在50%至70%范围内的平均囊封效率。在一些实施方案中,LNP经形成而具有在70%至90%范围内的平均囊封效率。在一些实施方案中,LNP经形成而具有在90%至100%范围内的平均囊封效率。在一些实施方案中,LNP经形成而具有在75%至95%范围内的平均囊封效率。
电穿孔也是递送货物的众所周知的手段,并且任何电穿孔方法都可用于递送本文公开的RNA中的任一者。
在一些实施方案中,方法包括将包含本文公开的mRNA的组合物递送至离体细胞的方法,其中mRNA囊封于LNP中。在一些实施方案中,组合物包含囊封于LNP中的mRNA和一种或多种本文公开的额外RNA。
在一些实施方案中,脂质核酸组装组合物包含脂质组分,其中脂质组分包含胺脂质、中性脂质、辅助脂质和隐形脂质;并且其中N/P比为约1-10。
在一些情况下,脂质组分包含脂质A或其缩醛类似物、胆固醇、DSPC和PEG-DMG;并且其中N/P比为约1-10。在一些实施方案中,脂质组分包含:约40-60mol%胺脂质;约5-15mol%中性脂质;和约1.5-10mol%PEG脂质,其中脂质组分的其余部分为辅助脂质,并且其中脂质核酸组装组合物的N/P比为约3-10。在一些实施方案中,脂质组分包含:约50-60mol%胺脂质;约8-10mol%中性脂质;和约2.5-4mol%PEG脂质,其中脂质组分的其余部分为辅助脂质,并且其中脂质核酸组装组合物的N/P比为约3-8。在一些情况下,脂质组分包含:约50-60mol%胺脂质;约5-15mol%DSPC;和约2.5-4mol%PEG脂质,其中脂质组分的其余部分为胆固醇,并且其中脂质核酸组装组合物的N/P比为约3-8。在一些情况下,脂质组分包含:48-53mol%脂质A;约8-10mol%DSPC;和1.5-10mol%PEG脂质,其中脂质组分的其余部分为胆固醇,并且其中脂质核酸组装组合物的N/P比为3-8±0.2。
在一些实施方案中,脂质组分包含:约50-60mol%胺脂质,例如脂质A;约8-10mol%中性脂质;和约2.5-4mol%隐形脂质(例如,PEG脂质),其中脂质组分的其余部分为辅助脂质,并且其中脂质核酸组装组合物的N/P比为约6。在一些实施方案中,脂质组分包含:约50-60mol%胺脂质,例如脂质A;约27-39.5mol%辅助脂质;约8-10mol%中性脂质;和约2.5-4mol%隐形脂质(例如,PEG脂质),其中脂质核酸组装组合物的N/P比为约5-7(例如,约6)。在一些实施方案中,脂质组分包含:约50-60mol%胺脂质,例如脂质A;约5-15mol%中性脂质;和约2.5-4mol%隐形脂质(例如,PEG脂质),其中脂质组分的其余部分为辅助脂质,并且其中脂质核酸组装组合物的N/P比为约3-10。在一些实施方案中,脂质组分包含:约40-60mol%胺脂质,例如脂质A;约5-15mol%中性脂质;和约2.5-4mol%隐形脂质(例如,PEG脂质),其中脂质组分的其余部分为辅助脂质,并且其中脂质核酸组装组合物的N/P比为约6。在一些实施方案中,脂质组分包含:约50-60mol%胺脂质,例如脂质A;约5-15mol%中性脂质;和约1.5-10mol%隐形脂质(例如,PEG脂质),其中脂质组分的其余部分为辅助脂质,并且其中脂质核酸组装组合物的N/P比为约6。在一些实施方案中,脂质组分包含:约40-60mol%胺脂质,例如脂质A;约0-10mol%中性脂质;和约1.5-10mol%隐形脂质(例如,PEG脂质),其中脂质组分的其余部分为辅助脂质,并且其中脂质核酸组装组合物的N/P比为约3-10。在一些实施方案中,脂质组分包含:约40-60mol%胺脂质,例如脂质A;小于约1mol%中性脂质;和约1.5-10mol%隐形脂质(例如,PEG脂质),其中脂质组分的其余部分为辅助脂质,并且其中脂质核酸组装组合物的N/P比为约3-10。在一些实施方案中,脂质组分包含约40-60mol%胺脂质,例如脂质A;和约1.5-10mol%隐形脂质(例如,PEG脂质),其中脂质组分的其余部分为辅助脂质,其中脂质核酸组装组合物的N/P比为约3-10,并且其中脂质核酸组装组合物基本上不含或不含中性磷脂。在一些实施方案中,脂质组分包含:约50-60mol%胺脂质,例如脂质A;约8-10mol%中性脂质;和约2.5-4mol%隐形脂质(例如,PEG脂质),其中脂质组分的其余部分为辅助脂质,并且其中脂质核酸组装组合物的N/P比为约3-7。
在一些实施方案中,胺脂质以约50mol%存在。在一些实施方案中,中性脂质以约9mol%存在。在一些实施方案中,隐形脂质以约3mol%存在。在一些实施方案中,辅助脂质以约38mol%存在。
在一些实施方案中,脂质组分包含以下、基本上由以下组成或由以下组成:约50mol%胺脂质,例如脂质A;约9mol%中性脂质,例如DSPC;约3mol%隐形脂质,例如PEG脂质,例如PEG2k-DMG,并且脂质组分的其余部分为辅助脂质,例如胆固醇,其中脂质核酸组装组合物的N/P比为约6。在一些实施方案中,胺脂质为脂质A。在一些实施方案中,中性脂质为DSPC。在一些实施方案中,隐形脂质为PEG脂质。在一些实施方案中,隐形脂质为PEG2k-DMG脂质。在一些实施方案中,辅助脂质为胆固醇。在一些实施方案中,脂质包含脂质组分并且脂质组分包含:约50mol%脂质A;约9mol%DSPC;约3mol%PEG2k-DMG,并且脂质组分的其余部分为胆固醇,其中脂质核酸组装组合物的N/P比为约6。
在一些实施方案中,脂质组分包含以下、基本上由以下组成或由以下组成:约25至45mol%胺脂质,例如脂质A;约10至30mol%中性脂质,例如DSPC;约1.5至3.5mol%隐形脂质,例如PEG脂质,例如PEG2k-DMG;和约25至65mol%辅助脂质,例如胆固醇,其中脂质核酸组装组合物的N/P比为约6。在一些实施方案中,脂质组分包含以下、基本上由以下组成或由以下组成:约35mol%胺脂质,例如脂质A;约15mol%中性脂质,例如DSPC;约2.5mol%隐形脂质,例如PEG脂质,例如PEG2k-DMG,并且脂质组分的其余部分为辅助脂质,例如胆固醇,其中脂质核酸组装组合物的N/P比为约6。在一些实施方案中,胺脂质为脂质A。在一些实施方案中,中性脂质为DSPC。在一些实施方案中,隐形脂质为PEG脂质。在一些实施方案中,隐形脂质为PEG2k-DMG脂质。在一些实施方案中,辅助脂质为胆固醇。在一些实施方案中,脂质包含脂质组分并且脂质组分包含:约35mol%脂质A;约15mol%DSPC;约2.5mol%PEG2k-DMG,并且脂质组分的其余部分为胆固醇,其中脂质核酸组装组合物的N/P比为约6。
I.示例性用途、方法和治疗
在一些实施方案中,本文公开的核酸(例如,mRNA)、多肽、组合物或脂质核酸组装组合物用于基因组编辑,例如编辑目标基因,或修饰目标基因。在一些实施方案中,本文公开的核酸(例如,mRNA)、多肽、组合物或脂质核酸组装组合物用于修饰目标基因,例如改变其序列或表观遗传状态。在一些实施方案中,本文公开的核酸(例如,mRNA)、多肽、组合物或脂质核酸组装组合物用于制造用于基因组编辑或修饰目标基因的药剂。
在一些实施方案中,提供了本文公开的核酸(例如,mRNA)、多肽、组合物或脂质核酸组装组合物的用途,其用于制备用于基因组编辑,例如编辑目标基因的药剂。在一些实施方案中,提供了核酸(例如,mRNA)、多肽、组合物或脂质核酸组装组合物的用途,其用于制备用于修饰目标基因,例如改变其序列或表观遗传状态的药剂。在一些实施方案中,提供了本文公开的核酸(例如,mRNA)、多肽、组合物或脂质核酸组装组合物的用途,其用于制备用于引起目标基因内的C-T转化的药剂。
在一些实施方案中,提供了一种基因组编辑或修饰目标基因的方法,所述方法包括向细胞递送本文所描述的mRNA、组合物或脂质纳米粒子。
在一些实施方案中,所述方法产生目标基因内的胞嘧啶(C)至胸腺嘧啶(T)转化。
在一些实施方案中,相对于目标序列中的总编辑,所述方法引起至少50%的C-T转化。如本文所用,“目标序列中的总编辑”为具有插入/缺失或至少一个转化的每个读段的总和,其中插入/缺失可包含超过一个核苷酸。插入/缺失经计算为在20bp评分区内插入或缺失一个或多个碱基的测序读段的总数除以测序读段(包括野生型)的总数。在包括20bpsgRNA目标序列的上游10bp和下游10bp的40bp区中对C-T转化或C-A/G转化进行评分。可使用允许读取从野生型比对发散的序列的任何测序方法(例如,NGS)。在一些实施方案中,相对于目标序列中的总编辑,所述方法引起至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的C-T转化。
在一些实施方案中,C-T转化与非预期编辑的比率大于1∶1。如本文所用,“非预期编辑”是目标区中的不为C-T转化的任何编辑。在一些实施方案中,C-T转化与非预期编辑的比率大于2∶1、大于3∶1、大于4∶1、大于5∶1、大于6∶1、大于7∶1或大于8∶1。在一些实施方案中,C-T转化与非预期编辑的比率为2∶1至99∶1。在一些实施方案中,C-T转化与非预期编辑的比率为2∶1、3∶1、4∶1、5∶1、6∶1、7∶1或8∶1。
在一些实施方案中,所述方法使A3A进行对应于相对于引导序列的5′端的位置-l至位置10中的任何一者的碱基编辑。
在一些实施方案中,所述方法使A3A在距引导序列的5′端的1、2、3、4、5、6、7、8、9或10个核苷酸的位置处进行碱基编辑。
在一些实施方案中,切口酶为SpyCas9切口酶,并且所述方法使胞苷脱氨酶在距引导序列的5′端的1、2、3、4、5、6、7、8、9、10或11个核苷酸的位置处存在的胞苷处进行碱基编辑。
在一些实施方案中,切口酶为NmeCas9切口酶,并且所述方法使胞苷脱氨酶在距引导序列的5′端的4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸的位置处存在的胞苷处进行碱基编辑。
在一些实施方案中,组合物包含:第一mRNA,其包含编码包含A3A和RNA引导的切口酶的多肽的第一开放阅读框;和第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和gRNA;并且第一mRNA、第二mRNA和gRNA(如果存在)以约6:2:3(w∶w∶w)的比率递送。在一些实施方案中,目标基因处于受试者,例如哺乳动物,例如人类中。
在一些实施方案中,提供了用于修饰目标基因的方法,所述方法包括向细胞递送:第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的第一多肽的第一开放阅读框;第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框,其中第二mRNA不同于第一mRNA;和至少一种引导RNA(gRNA)。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA。在一些实施方案中,一种或多种引导RNA各自在单独的脂质核酸组装组合物中。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括靶向降低或消除细胞表面上的MHC I类表达的基因的一种gRNA,和/或靶向降低或消除细胞表面上的MHC II类表达的基因的一种gRNA,和/或靶向降低或消除内源性TCR表达的基因的一种gRNA。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括选自以下的至少两种gRNA:靶向降低或消除细胞表面上的MHC I类表达的基因的一种gRNA,靶向降低或消除细胞表面上的MHC II类表达的基因的一种gRNA和靶向降低或消除内源性TCR表达的基因的一种gRNA。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括靶向降低或消除细胞表面上的MHC I类表达的基因的一种gRNA,靶向降低或消除细胞表面上的MHC II类表达的基因的一种gRNA和靶向降低或消除内源性TCR表达的基因的一种gRNA。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括靶向降低或消除细胞表面上的HLA-A表达的基因的一种gRNA,和/或靶向降低或消除细胞表面上的MHC II类表达的基因的一种gRNA,和/或靶向降低或消除内源性TCR表达的基因的一种gRNA。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括选自以下的至少两种gRNA:靶向降低或消除细胞表面上的HLA-A表达的基因的一种gRNA,靶向降低或消除细胞表面上的MHC II类表达的基因的一种gRNA和靶向降低或消除内源性TCR表达的基因的一种gRNA。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括靶向降低或消除细胞表面上的HLA-A表达的基因的一种gRNA,靶向降低或消除细胞表面上的MHC II类表达的基因的一种gRNA和靶向降低或消除内源性TCR表达的基因的一种gRNA。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括选自靶向TRAC、TRBC、B2M、HLA-A或CIITA的gRNA的一种gRNA。在一些实施方案中,一种gRNA靶向TRAC。在一些实施方案中,一种gRNA靶向TRBC。在一些实施方案中,一种gRNA靶向B2M。在一些实施方案中,一种gRNA靶向HLA-A。在一些实施方案中,一种gRNA靶向CIITA。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括选自靶向TRAC、TRBC或B2M的gRNA的至少两种gRNA,其中两种引导RNA不靶向相同基因。在一些实施方案中,gRNA各自在单独的脂质核酸组装组合物中。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括选自靶向TRAC、TRBC或HLA-A的gRNA的至少两种gRNA,其中两种引导RNA不靶向相同基因。在一些实施方案中,gRNA各自在单独的脂质核酸组装组合物中。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括选自靶向TRAC、TRBC、HLA-A的gRNA的至少两种gRNA,其中两种引导RNA不靶向相同基因。在一些实施方案中,gRNA各自在单独的脂质核酸组装组合物中。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA。在一些实施方案中,gRNA各自在单独的脂质核酸组装组合物中。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括靶向B2M的一种引导RNA和靶向CIITA的一种gRNA。在一些实施方案中,gRNA各自在单独的脂质核酸组装组合物中。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括靶向HLA-A的一种引导RNA和靶向CIITA的一种gRNA。在一些实施方案中,gRNA各自在单独的脂质核酸组装组合物中。在一些实施方案中,细胞对HLA-B为同型接合的并且对HLA-C为同型接合的。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA和靶向B2M的一种gRNA。在一些实施方案中,gRNA各自在单独的脂质核酸组装组合物中。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA和靶向HLA-A的一种gRNA。在一些实施方案中,gRNA各自在单独的脂质核酸组装组合物中。在一些实施方案中,细胞对HLA-B为同型接合的并且对HLA-C为同型接合的。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA,靶向B2M的一种gRNA和靶向CIITA的一种gRNA。在一些实施方案中,gRNA各自在单独的脂质核酸组装组合物中。
在一些实施方案中,提供了用于修饰细胞中的目标基因的方法,所述方法包括向细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,其包含:(a)第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和(c)一种或多种引导RNA,其中所述方法包括靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA、靶向HLA-A的一种gRNA和靶向CIITA的一种gRNA。在一些实施方案中,gRNA各自在单独的脂质核酸组装组合物中。在一些实施方案中,细胞对HLA-B为同型接合的并且对HLA-C为同型接合的。
在一些实施方案中,提供了一种包含组合物的细胞,所述组合物包含:第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;和第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框,其中第二mRNA不同于第一mRNA。
在一些实施方案中,提供了一种包含至少一种碱基编辑和/或插入/缺失的工程化细胞,其中所述碱基编辑和/或插入/缺失通过使细胞与组合物接触而进行,所述组合物包含:第一mRNA,其包含编码包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和RNA引导的切口酶的多肽的第一开放阅读框;和第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框,其中第二mRNA不同于第一mRNA。
在一些实施方案中,细胞为人类细胞。在一些实施方案中,经基因修饰的细胞被称为工程化细胞。工程化细胞是指包含工程化基因修饰的细胞(或细胞后代),例如已与基因编辑系统接触并且经基因编辑系统进行基因修饰。术语“工程化细胞”和“经基因修饰的细胞”通篇可互换使用。工程化细胞可为本文公开的示例性细胞类型中的任一者。在一些实施方案中,细胞为同种异体细胞。
在一些实施方案中,细胞为免疫细胞。如本文所用,“免疫细胞”是指免疫系统的细胞,包括例如淋巴细胞(例如,T细胞、B细胞、自然杀手细胞(“NK细胞”和NKT细胞或iNKT细胞))、单核细胞、巨噬细胞、肥大细胞、树突状细胞或颗粒细胞(例如,嗜中性粒细胞、嗜酸性粒细胞和嗜碱性粒细胞)。在一些实施方案中,细胞为原代免疫细胞。在一些实施方案中,免疫系统细胞可选自CD3+、CD4+和CD8+T细胞、调节T细胞(Treg)、B细胞、NK细胞和树突状细胞(DC)。在一些实施方案中,免疫细胞为同种异体的。在一些实施方案中,所述细胞为淋巴细胞。在一些实施方案中,所述细胞为适应性免疫细胞。在一些实施方案中,所述细胞为T细胞。在一些实施方案中,所述细胞为B细胞。在一些实施方案中,所述细胞为NK细胞。在一些实施方案中,淋巴细胞为同种异体的。
在一些实施方案中,目标基因的基因组编辑或修饰是在体内进行。在一些实施方案中,目标基因的基因组编辑或修饰是在经分离或经培养的细胞中进行。
在一些实施方案中,目标基因处于器官,例如肝脏,例如哺乳动物肝脏,例如人类肝脏中。在一些实施方案中,目标基因处于肝脏细胞,例如哺乳动物肝脏细胞,例如人类肝脏细胞中。在一些实施方案中,目标基因处于肝细胞,例如哺乳动物肝细胞,例如人类肝细胞中。在一些实施方案中,肝脏细胞或肝细胞处于原位。在一些实施方案中,肝脏细胞或肝细胞在例如培养物中,例如原代培养物中分离。
在一些实施方案中,目标基因的基因组编辑或修饰使剪接供体或剪接受体位点失活。
还提供了对应于本文公开的用途的方法,所述方法包括向受试者施用本文公开的核酸(例如,mRNA)、多肽、组合物或脂质核酸组装组合物,或使细胞(例如上文所描述的细胞)与本文公开的核酸(例如,mRNA)、多肽、组合物或脂质核酸组装组合物接触。
在一些实施方案中,本文公开的核酸(例如,mRNA)、多肽、组合物或脂质核酸组装组合物经静脉内施用,以用于上文关于原位生物体、器官或细胞论述的用途中的任一者。
在涉及受试者的前述实施方案中的任一者中,受试者可为哺乳动物。在涉及受试者的前述实施方案中的任一者中,受试者可为人类。在涉及受试者的前述实施方案中的任一者中,受试者可为牛、猪、猴、绵羊、狗、猫、鱼或家禽。
在一些实施方案中,本文公开的核酸(例如,mRNA)、多肽、组合物或脂质核酸组装组合物经静脉内施用或用于静脉内施用。
在一些实施方案中,目标基因的基因组编辑或修饰敲低目标基因的表达。在一些实施方案中,目标基因的基因组编辑或修饰将目标基因的表达敲低至少50%、55%、60%、65%、70%、75%或80%。在一些实施方案中,目标基因的基因组编辑或修饰在基因中产生错义突变。
在一些实施方案中,单次施用本文公开的核酸(例如,mRNA)、多肽、组合物或脂质核酸组装组合物足以敲低目标基因产物的表达。在一些实施方案中,单次施用本文公开的核酸(例如,mRNA)、多肽、组合物或脂质核酸组装组合物足以敲除目标基因产物的表达。在其他实施方案中,超过一次施用本文公开的核酸(例如,mRNA)、多肽、组合物或脂质核酸组装组合物可有益于经由累积效应使编辑最大化。
在一些实施方案中,本文公开的核酸(例如,mRNA)、多肽、组合物或脂质核酸组装组合物的治疗功效可见于递送后1年、2年、3年、4年、5年或10年。
在一些实施方案中,治疗会减缓或中断疾病进展。
在一些实施方案中,治疗会引起器官功能或器官疾病的症状得到改善、稳定化或减缓其变化。
在一些实施方案中,治疗功效通过受试者的存活时间增加来测量。
1.用于TRAC和TRBC编辑的示例性引导RNA、组合物、方法和工程化细胞
本公开提供了靶向TRAC的引导RNA。靶向TRAC基因的引导序列以SEQ ID NO:706-721显示于表5A中。
本公开提供了靶向TRBC的引导RNA。靶向TRBC基因的引导序列以SEQ ID NO:618-669显示于表5B中。
在一些实施方案中,引导RNA序列与根据来自人类参考基因组hg38坐标的下表中所示的对应基因组区互补。其他实施方案的引导序列可与表5A和表5B中的任何一者所列出的基因组坐标附近的序列互补。例如,其他实施方案的引导序列可与包含表5A和表5B中的任一者中所列出的基因组坐标的15个连续核苷酸±10个核苷酸的序列互补。
如前述部分中所描述,表5A和表5B中所示的引导序列中的每一者还可包含额外核苷酸以形成crRNA,例如在其3′端处的引导序列之后具有以下示例性核苷酸序列:5′至3′方向的GUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:139)。在sgRNA的情况下,引导序列还可包含额外核苷酸以形成sgRNA,例如在引导序列的3′端后具有以下示例性核苷酸序列:5′至3′方向的GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:140)。引导序列还可包含额外的核苷酸以形成sgRNA,例如,
在一些实施方案中,sgRNA包含以下在SEQ ID NO:141中所示的修饰模式,其中N为天然或非天然核苷酸,并且其中N′的总体包含如本文所描述的引导序列,并且经修饰sgRNA包含以下序列:mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAmGmCmUmAmGmAmAmAmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGmAmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmCmU*mU*mU*mU(SEQ ID NO:141),其中“N”可为任何天然或非天然核苷酸。例如,SEQ IDNO:141涵盖在本文中,其中N′经本文所公开的引导序列中的任一者置换。尽管引导物的核苷酸用N′取代,但所述修饰保持如SEQ ID NO:14l中所示。也就是说,尽管引导物的核苷酸置换“N”’,但前三个核苷酸仍为经2′OMe修饰的,并且在第一核苷酸与第二核苷酸、第二核苷酸与第三核苷酸和第三核苷酸与第四核苷酸之间存在硫代磷酸酯键联。
在一些实施方案中,靶向TRAC的gRNA包含选自以下的引导序列:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列。
表5A TRAC引导序列、引导RNA序列和染色体坐标
/>
/>
在一些实施方案中,引导序列包含SEQ ID NO:706。在一些实施方案中,引导序列包含SEQ ID NO:707。在一些实施方案中,引导序列包含SEQ ID NO:708。在一些实施方案中,引导序列包含SEQ ID NO:709。在一些实施方案中,引导序列包含SEQ ID NO:710。在一些实施方案中,引导序列包含SEQ ID NO:711。在一些实施方案中,引导序列包含SEQ IDNO:712。在一些实施方案中,引导序列包含SEQ ID NO:713。在一些实施方案中,引导序列包含SEQ ID NO:714。在一些实施方案中,引导序列包含SEQ ID NO:715。在一些实施方案中,引导序列包含SEQ ID NO:716。在-些实施方案中,引导序列包含SEQ ID NO:717。在一些实施方案中,引导序列包含SEQ ID NO:718。在一些实施方案中,引导序列包含SEQ ID NO:719。在一些实施方案中,引导序列包含SEQ ID NO:720。在一些实施方案中,引导序列包含SEQ ID NO:721。
在一些实施方案中,靶向TRBC的gRNA包含选自以下的引导序列:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列。
表5B TRBC引导序列、引导RNA序列和染色体坐标
/>
/>
/>
/>
/>
/>
/>
/>
在一些实施方案中,引导序列包含SEQ ID NO:618。在一些实施方案中,引导序列包含SEQ ID NO:619。在一些实施方案中,引导序列包含SEQ ID NO:620。在一些实施方案中,引导序列包含SEQ ID NO:621。在一些实施方案中,引导序列包含SEQ ID NO:622。在一些实施方案中,引导序列包含SEQ ID NO:623。在一些实施方案中,引导序列包含SEQ IDNO:624。在一些实施方案中,引导序列包含SEQ ID NO:625。在一些实施方案中,引导序列包含SEQ ID NO:626。在一些实施方案中,引导序列包含SEQ ID NO:627。在一些实施方案中,引导序列包含SEQ ID NO:628。在一些实施方案中,引导序列包含SEQ ID NO:629。在一些实施方案中,引导序列包含SEQ ID NO:630。在-些实施方案中,引导序列包含SEQ ID NO:631。在一些实施方案中,引导序列包含SEQ ID NO:632。在一些实施方案中,引导序列包含SEQID NO:633。在一些实施方案中,引导序列包含SEQ ID NO:634。在一些实施方案中,引导序列包含SEQ ID NO:635。在一些实施方案中,引导序列包含SEQ ID NO:636。在一些实施方案中,引导序列包含SEQ ID NO:637。在一些实施方案中,引导序列包含SEQ ID NO:638。在一些实施方案中,引导序列包含SEQ ID NO:639。在一些实施方案中,引导序列包含SEQ IDNO:640。在一些实施方案中,引导序列包含SEQ ID NO:641。在一些实施方案中,引导序列包含SEQ ID NO:642。在一些实施方案中,引导序列包含SEQ ID NO:643。在一些实施方案中,引导序列包含SEQ ID NO:644。在一些实施方案中,引导序列包含SEQ ID NO:645。在一些实施方案中,引导序列包含SEQ ID NO:646。在一些实施方案中,引导序列包含SEQ ID NO∶647。在一些实施方案中,引导序列包含SEQ ID NO:648。在一些实施方案中,引导序列包含SEQ ID NO:649。在一些实施方案中,引导序列包含SEQ ID NO:650。在一些实施方案中,引导序列包含SEQ ID NO:651。在一些实施方案中,引导序列包含SEQ ID NO:652。在一些实施方案中,引导序列包含SEQ ID NO:653。在一些实施方案中,引导序列包含SEQ ID NO:654。在一些实施方案中,引导序列包含SEQ ID NO:655。在一些实施方案中,引导序列包含SEQID NO:656。在一些实施方案中,引导序列包含SEQ ID NO:657。在一些实施方案中,引导序列包含SEQ ID NO:658。在一些实施方案中,引导序列包含SEQ ID NO:659。在一些实施方案中,引导序列包含SEQ ID NO:660。在一些实施方案中,引导序列包含SEQ ID NO:661。在一些实施方案中,引导序列包含SEQ ID NO:662。在一些实施方案中,引导序列包含SEQ IDNO:663。在一些实施方案中,引导序列包含SEQ ID NO:664。在一些实施方案中,引导序列包含SEQ ID NO:665。在一些实施方案中,引导序列包含SEQ ID NO:666。在一些实施方案中,引导序列包含SEQ ID NO:667。在一些实施方案中,引导序列包含SEQ ID NO:668。在一些实施方案中,引导序列包含SEQ ID NO:669。
在一些实施方案中,本公开提供了一种改变TRAC基因内的DNA序列的方法,所述方法包括向细胞递送本文公开的组合物。所述组合物可包含:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的gRNA的核酸。
在一些实施方案中,本公开提供了一种降低TRAC基因的表达的方法,所述方法包括向细胞递送本文公开的组合物。所述组合物可包含:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的gRNA的核酸。
在一些实施方案中,本公开提供了一种免疫疗法的方法,所述方法包括向受试者、其自体细胞和/或同种异体细胞施用本文公开的组合物。所述组合物可包含:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的gRNA的核酸。
在一些实施方案中,提供了一种通过本文公开的方法改变的细胞。细胞可离体改变。细胞可为T细胞、CD4+或CD8+细胞。细胞可为哺乳动物、灵长类动物或人类细胞。细胞可用于受试者的免疫疗法。
在一些实施方案中,提供了一种组合物,所述组合物包含:包含选自以下的引导序列的gRNA:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列。组合物可任选地还包含本文公开的核酸(例如,mRNA)、多肽、组合物或脂质核酸组装组合物中的任一者。
在某些实施方案中,本文公开的组合物用于改变细胞中TRAC基因内的DNA序列。在某些实施方案中,本文公开的组合物用于降低细胞中TRAC基因的表达。在一些实施方案中,本文公开的组合物用于受试者的免疫疗法。
在一些实施方案中,本公开提供了一种改变TRBC1和/或TRBC2基因内的DNA序列的方法,所述方法包括向细胞递送本文公开的组合物。所述组合物可包含:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的gRNA的核酸。
在一些实施方案中,本公开提供了一种降低TRBC1和/或TRBC2基因的表达的方法,所述方法包括向细胞递送本文公开的组合物。所述组合物可包含:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5C中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的gRNA的核酸。
在一些实施方案中,本公开提供了一种免疫疗法的方法,所述方法包括向受试者、其自体细胞和/或同种异体细胞施用本文公开的组合物。所述组合物可包含:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的gRNA的核酸。
在一些实施方案中,可提供一种通过本文公开的方法改变的细胞。细胞可离体改变。细胞为T细胞、CD4+或CD8+细胞。细胞可为哺乳动物、灵长类动物或人类细胞。细胞可用于受试者的免疫疗法。
在一些实施方案中,提供了一种组合物,所述组合物包含:包含选自以下的引导序列的gRNA:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列。组合物可任选地还包含本文公开的核酸(例如,mRNA)、多肽、组合物或脂质核酸组装组合物中的任一者。
在某些实施方案中,本文公开的组合物用于改变细胞中TRBC1和/或TRBC2基因内的DNA序列。在某些实施方案中,本文公开的组合物用于降低细胞中TRBC1和/或TRBC2基因的表达。在一些实施方案中,本文公开的组合物用于受试者的免疫疗法。
J.示例性DNA分子、载体、表达构建体、宿主细胞和产生方法
在某些实施方案中,本公开提供了包含编码本文所描述的多肽的序列的DNA分子。在一些实施方案中,DNA分子还包含不编码多肽的核酸。不编码本文公开的多肽的核酸包括但不限于启动子、强化子、调控序列和编码gRNA的核酸。
在一些实施方案中,DNA分子还包含编码crRNA、trRNA、或crRNA和trRNA的核苷酸序列。在一些实施方案中,编码crRNA、trRNA、或crRNA和trRNA的核苷酸序列包含以下或由以下组成:通过来自天然存在的CRISPR/Cas系统的重复序列的全部或一部分侧接的引导序列。包含crRNA、trRNA、或crRNA和trRNA或由crRNA、trRNA、或crRNA和trRNA组成的核酸还可包含载体序列,其中所述载体序列包含以下或由以下组成:不会与crRNA、trRNA、或crRNA和trRNA一起天然存在的核酸。在一些实施方案中,crRNA和trRNA由一个载体中的非连续核酸编码。在其他实施方案中,crRNA和trRNA可由连续核酸编码。在一些实施方案中,crRNA和trRNA由单一核酸的相对链编码。在其他实施方案中,crRNA和trRNA由单一核酸的相同链编码。
在一些实施方案中,DNA分子还包含可操作地连接到编码mRNA中的任一者的序列的启动子,所述mRNA编码本文所描述的多肽。在一些实施方案中,DNA分子为适用于在哺乳动物细胞,例如人类细胞或小鼠细胞,例如人类肝细胞或啮齿动物(例如小鼠)肝细胞中表达的表达构建体。在一些实施方案中,DNA分子为适用于在哺乳动物器官,例如人类肝脏或啮齿动物(例如小鼠)肝脏的细胞中表达的表达构建体。在一些实施方案中,DNA分子为质粒或游离基因。在一些实施方案中,DNA分子包含于宿主细胞,例如细菌或经培养的真核细胞中。示例性细菌包括变形菌门,例如大肠杆菌。示例性经培养的真核细胞包括原代肝细胞,包括啮齿动物(例如小鼠)或人类来源的肝细胞;肝细胞细胞系,包括啮齿动物(例如小鼠)或人类来源的肝细胞;人类细胞系;啮齿动物(例如小鼠)细胞系;CHO细胞;微生物真菌,例如裂殖或出芽酵母,例如酵母菌,例如酿酒酵母;和昆虫细胞。
在一些实施方案中,提供了一种制造本文所公开的mRNA的方法。在一些实施方案中,此类方法包括使本文所描述的DNA分子与RNA聚合酶在容许转录的条件下接触。在一些实施方案中,体外,例如在无细胞系统中进行接触。在一些实施方案中,RNA聚合酶为噬菌体源的RNA聚合酶,例如T7 RNA聚合酶。在一些实施方案中,提供了包括至少一种如上文所论述的经修饰的核苷酸的NTP。在一些实施方案中,NTP包括至少一种如上文所论述的经修饰的核苷酸并且不包含UTP。
在一些实施方案中,单独或与一种或多种gRNA一起的本文所公开的mRNA可包含在一个或多个载体的载体系统内或由其递送。在一些实施方案中,载体中的一者或多者或所有载体可为DNA载体。在一些实施方案中,载体中的一者或多者或所有载体可为RNA载体。在一些实施方案中,载体中的一者或多者或所有载体可为环状的。在其他实施方案中,载体中的一者或多者或所有载体可为线性的。在一些实施方案中,载体中的一者或多者或所有载体可包封于脂质纳米粒子、脂质体、非脂质纳米粒子或病毒衣壳中。非限制性示例性载体包括质粒、噬菌粒、粘粒、人工染色体、微型染色体、转位子、病毒载体和表达载体。
非限制性示例性病毒载体包括腺相关病毒(AAV)载体、慢病毒载体、腺病毒载体、辅助依赖型腺病毒载体(HDAd)、单纯疱疹病毒(HSV-1)载体、噬菌体T4、杆状病毒载体和反转录病毒载体。在一些实施方案中,病毒载体可为AAV载体。在其他实施方案中,病毒载体可为慢病毒载体。在一些实施方案中,慢病毒可为非整合性的。在一些实施方案中,病毒载体可为腺病毒载体。在一些实施方案中,腺病毒可为高克隆容量或“无肠(gutless)”腺病毒,其中除5′和3′倒转末端重复序列(ITR)之外的病毒编码区和包装信号(‘I’)从病毒缺失以增加其包装容量。在其他实施方案中,病毒载体可为HSV-1载体。在一些实施方案中,HSV-1类载体为辅助依赖型,并且在其他实施方案中,其为非辅助依赖型。例如,仅保留包装序列的扩增子载体需要具有结构性组分的辅助病毒用于包装,而去除非必需病毒功能的缺失30kb的HSV-1载体不需要辅助病毒。在额外实施方案中,病毒载体可为噬菌体T4。在一些实施方案中,当清空病毒头部时,噬菌体T4可能能够包装任何线性或环状DNA或RNA分子。在其他实施方案中,病毒载体可为杆状病毒载体。在其他实施方案中,病毒载体可为反转录病毒载体。在使用具有较小克隆容量的AAV或慢病毒载体的实施方案中,可能需要使用超过一个载体以递送如本文公开的载体系统的全部组分。例如,一个AAV载体可含有编码Cas蛋白的序列,而第二AAV载体可含有一个或多个引导序列。
在一些实施方案中,载体可能能够驱动细胞中一个或多个编码序列,例如本文公开的mRNA的编码序列的表达。在一些实施方案中,细胞可为原核细胞,例如细菌细胞。在一些实施方案中,细胞可为真核细胞,例如酵母、植物、昆虫或哺乳动物细胞。在一些实施方案中,真核细胞可为哺乳动物细胞。在一些实施方案中,真核细胞可为啮齿动物细胞。在一些实施方案中,真核细胞可为人类细胞。驱动不同类型细胞中的表达的合适启动子是本领域中已知的。在一些实施方案中,启动子可为野生型。在其他实施方案中,启动子可经修饰以供更高效或有效表达。在其他实施方案中,启动子可经截短但仍保留其功能。例如,启动子可具有正常大小或适用于将载体适当包装在病毒中的减小的大小。
在一些实施方案中,载体系统可包含编码本文公开的多肽的核苷酸序列的一个拷贝。在其它实施方案中,载体系统可包含编码本文公开的多肽的核苷酸序列的多于一个拷贝。在一些实施方案中,编码本文公开的多肽的核苷酸序列可操作地连接到至少一个转录或翻译控制序列。在一些实施方案中,编码蛋白质的核苷酸序列可操作地连接到至少一个启动子。
在一些实施方案中,启动子可为组成型、诱导型或组织特异性的。在一些实施方案中,启动子可为组成型启动子。非限制性示例性的组成型启动子包括巨细胞病毒即刻早期启动子(CMV)、猴病毒(SV40)启动子、腺病毒主要晚期启动子(MLP)、劳斯肉瘤病毒(RSV)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、磷酸甘油酸激酶(PGK)启动子、延长因子-α(EF1a)启动子、泛素启动子、肌动蛋白启动子、微管蛋白启动子、免疫球蛋白启动子、其功能性片段或前述中的任一者的组合。在一些实施方案中,启动子可为CMV启动子。在一些实施方案中,启动子可为经截短的CMV启动子。在其他实施方案中,启动子可为EF1a启动子。在一些实施方案中,启动子可为诱导型启动子。非限制性示例性的诱导型启动子包括可通过热冲击、光、化学物质、肽、金属、类固醇、抗生素或醇诱导的诱导型启动子。在一些实施方案中,诱导型启动子可为具有低基础(非诱导)表达水平的诱导型启动子,例如启动子(Clontech)。
在一些实施方案中,启动子可为组织特异性启动子,例如对肝脏中的表达具有特异性的启动子。
载体还可包含编码至少一个gRNA的核苷酸序列。在一些实施方案中,载体包含gRNA的一个拷贝。在其他实施方案中,载体包含gRNA的多于一个拷贝。在具有多于一个gRNA的实施方案中,gRNA可为不相同的以使得其靶向不同目标序列,或者可为相同的,这是因为其靶向相同目标序列。在其中载体包含多于一个gRNA的一些实施方案中,每个gRNA可具有其他不同特性,例如在与包含胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))和本文公开的RNA引导的切口酶的多肽的复合物内的活性或稳定性。在一些实施方案中,编码gRNA的核苷酸序列可操作地连接到至少一个转录或翻译控制序列,例如启动子、3′UTR或5′UTR。在一个实施方案中,启动子可为tRNA启动子,例如tRNALys3或tRNA嵌合体。参见Mefferd等人,RNA.201521:1683-9;Scherer等人,Nucleic Acids Res.200735:2620-2628。在一些实施方案中,启动子可通过RNA聚合酶III(Pol III)识别。Pol III启动子的非限制性实例包括U6和H1启动子。在一些实施方案中,编码gRNA的核苷酸序列可以可操作地连接到小鼠或人类U6启动子。在其他实施方案中,编码gRNA的核苷酸序列可以可操作地连接到小鼠或人类H1启动子。在具有多于一个gRNA的实施方案中,用于驱动表达的启动子可相同或不同。在一些实施方案中,编码gRNA的crRNA的核苷酸和编码gRNA的trRNA的核苷酸可提供于相同载体上。在一些实施方案中,编码crRNA的核苷酸和编码trRNA的核苷酸可通过同一启动子驱动。在一些实施方案中,crRNA和trRNA可转录为单一转录本。例如,crRNA和trRNA可由单一转录本进行处理以形成双分子gRNA。或者,crRNA和trRNA可转录为单分子gRNA。在其他实施方案中,crRNA和trRNA可通过其处于相同载体上的对应启动子来驱动。在其他实施方案中,crRNA和trRNA可通过不同载体编码。
在一些实施方案中,组合物包含载体系统,其中所述系统包含多于一个载体。在一些实施方案中,载体系统可包含一个单一载体。在其他实施方案中,载体系统可包含两个载体。在额外实施方案中,载体系统可包含三个载体。当将不同gRNA用于多任务(multiplexing)时或当使用gRNA的多个拷贝时,载体系统可包含多于三个载体。
在一些实施方案中,载体系统可包含诱导型启动子,以便仅在其递送至目标细胞之后开始表达。非限制性示例性的诱导型启动子包括可通过热冲击、光、化学物质、肽、金属、类固醇、抗生素或醇诱导的诱导型启动子。在一些实施方案中,诱导型启动子可为具有低基础(非诱导)表达水平的诱导型启动子,例如启动子(Clontech)。
在额外实施方案中,载体系统可包含组织特异性启动子,以便仅在其递送至特定组织中之后开始表达。
在一些实施方案中,可全身递送载体。在一些实施方案中,载体可递送于肝循环中。
表5C.序列表
以下序列表提供本文公开的某些序列的列表。应理解,如果相对于RNA提及DNA序列(包含Ts),则Ts应经Us(取决于上下文,其可经修饰或未经修饰)置换,并且反之亦然。在下表和通篇中,术语“mA”、“mC”、“mU”或“mG”用于指示已经2′-O-Me修饰的核苷酸。在下表中,“*”用于描绘PS修饰。在本申请中,术语A*、C*、U*或G*可用于表示用PS键连接到下一个(例如3′)核苷酸的核苷酸。*=PS键联;′m′=2′-O-Me核苷酸。在下表中,使用单氨基酸字母编码来提供肽序列。
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
(在上表中或本文中所描述的序列中的每一者中,经修饰序列可未经修饰或以替代性方式经修饰)
实施例
提供以下实施例以说明某些所公开实施方案并且不应解释为以任何方式限制本公开的范围。
如以下实施例中所使用,术语“编辑器”是指包含能够使DNA分子内的碱基脱氨的多肽的剂并且其为碱基编辑器。编辑器可能能够使DNA中的胞苷(C)脱氨。编辑器可包括通过任选的接头融合到胞苷脱氨酶(例如,APOBEC3A脱氨酶(A3A))的RNA引导的切口酶(例如,Cas9切口酶)。在一些情况下,编辑器包括UGI。在一些实施方案中,编辑器缺少UGI。
用于以下实施例中的示例性编辑器为BC22n(SEQ ID NO:3),其由通过XTEN接头融合到化脓性链球菌-D10A SpyCas9切口酶的智人APOBEC3A和编码BC22n的mRNA组成。还使用编码BC22n(SEQ ID NO:1)的mRNA。
实施例1.一般方法
1.1.制备脂质纳米粒子
一般而言,以各种摩尔比将脂质组分溶解于100%乙醇中。将RNA货物(例如,Cas9mRNA和sgRNA)溶解在25mM柠檬酸盐缓冲液、100mM NaCl(pH 5.0)中,产生大约0.45mg/mL的RNA货物浓度。
除非另外规定,否则脂质核酸组装体含有分别为50∶38∶9∶3摩尔比的可离子化脂质A(十八碳-9,12-二烯酸(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙酯,也称为(9Z,12Z)-十八碳-9,12-二烯酸3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙酯)、胆固醇、DSPC和PEG2k-DMG。除非另外规定,否则脂质核酸组装体用约6的脂质胺与RNA磷酸酯(N∶P)摩尔比和按重量计1∶1的gRNA与mRNA的比率配制。
使用交叉流技术,利用含脂质的乙醇与两个体积的RNA溶液和一个体积的水的冲击射流混合来制备LNP。经由混合交叉使含脂质的乙醇与两个体积的RNA溶液混合。经由线内T形管将第四水流与十字管的出口流混合(参见WO2016010840图2)。将LNP在室温下保持1小时并且进一步用水稀释(大约1∶1v/v)。使用切向流过滤在平板滤筒(Sartorius,100kDMWCO)上浓缩LNP,并且使用PD-10脱盐柱(GE)将其缓冲液交换至50mM Tris、45mM NaCl、5%(w/v)蔗糖,pH 7.5(TSS)中。或者,任选地使用100kDa Amicon旋转过滤器浓缩LNP,并且使用PD-10脱盐柱(GE)将其缓冲液交换至TSS中。所得混合物接着使用0.2μm无菌过滤器过滤。在进一步使用之前,将最终LNP储存在4℃或-80℃下。
1.2.mRNA的体外转录(“IVT”)
含有N1-甲基假-U的经封端和聚腺苷酸化mRNA是通过使用线性化质粒DNA模板和T7RNA聚合酶的体外转录产生。通过在以下条件下与XbaI一起在37℃下温育2小时来线性化含有T7启动子、转录序列和聚腺苷酸化区的质粒DNA:200ng/μL质粒、2U/μL XbaI(NEB)和1x反应缓冲液。通过在65℃下加热反应物20分钟来使XbaI失活。由酶和缓冲液盐纯化线性化质粒。用以产生经修饰mRNA的IVT反应是通过在以下条件下在37℃下温育1.5-4小时来进行:50ng/μL线性化质粒;各2-5mM的GTP、ATP、CTP和N1-甲基假-UTP(Trilink);10-25mMARCA (Trilink);5U/μL T7 RNA聚合酶(NEB);1U/μL鼠类核糖核酸酶抑制剂(NEB);0.004U/μL无机大肠杆菌焦磷酸酶(NEB);和1x反应缓冲液。将TURBO脱氧核糖核酸酶(ThermoFisher)添加至0.01U/μL的最终浓度,并且将反应物再温育30分钟以去除DNA模板。根据制造商的方案,使用MegaClear Transcription Clean-up试剂盒(ThermoFisher)或RNeasy Maxi试剂盒(Qiagen)来纯化mRNA。或者,经由沉淀方案(在一些情况下,其后接着是基于HPLC的纯化)来纯化mRNA。简言之,在脱氧核糖核酸酶消化之后,使用LiCl沉淀、乙酸铵沉淀和乙酸钠沉淀来纯化mRNA。对于经HPLC纯化的mRNA,在LiCl沉淀和重构之后,通过RP-IP HPLC纯化mRNA(参见例如Kariko等人,Nucleic Acids Research,2011,第39卷,第21期e142)。合并选择用于汇集的洗脱份并且通过如上文所描述的乙酸钠/乙醇沉淀来脱盐。在另一个替代方法中,mRNA用LiCl沉淀法纯化,然后通过切向流过滤进一步纯化。通过测量260nm处的吸光度(Nanodrop)来测定RNA浓度,并且通过毛细管电泳用Bioanlayzer(Agilent)来分析转录本。
从编码根据SEQ ID NO:360(参见表5C中的序列)的开放阅读框的质粒DNA产生Nme2Cas9 mRNA。从编码根据SEQ ID NO:8、11或23(参见表5C中的序列)的开放阅读框的质粒DNA产生化脓性链球菌(“Spy”)Cas9 mRNA。从编码根据SEQ ID NO:2或5的开放阅读框的质粒DNA产生BC22n mRNA。从编码根据SEQ ID NO:20的开放阅读框的质粒DNA产生BC22mRNA。从编码根据SEQ ID No:29的开放阅读框的质粒DNA产生具有2x UGI mRNA的BC22。从编码根据SEQ ID NO:26或35的开放阅读框的质粒DNA产生UGI mRNA。从编码根据SEQ IDNO:14或17的开放阅读框的质粒DNA产生BE3 mRNA。从编码根据SEQ ID NO:32的开放阅读框的质粒DNA产生BE4Max mRNA。当本段中引用的序列在下文中针对RNA提及时,应理解,T应替换为U(其为如上文所描述的N1-甲基假尿苷)。用于实施例中的信使RNA包括5′帽和3′聚腺苷酸化区,例如,高达100nt。
1.3.用于在靶编辑效率的下一代测序(“NGS”)和分析
根据制造商的方案,使用QuickExtractTM DNA提取溶液(Lucigen,目录号QE09050)提取基因组DNA。为了定量地测定基因组中的目标位置处的编辑效率,使用深度测序来鉴定通过基因编辑引入的插入和缺失的存在。围绕所关注基因(例如,TRAC)内的目标位点设计PCR引物,并且扩增所关注基因组区域。按本领域中的标准进行引物序列设计。
根据制造商的方案(Illumina)执行额外PCR以添加化学物质以进行测序。在Illumina MiSeq仪器上对扩增子测序。在消除具有低质量评分的读段之后,将读段与人类参考基因组(例如,hg38)进行比对。将与所关注目标区重叠的读段与局部基因组序列重新比对以改进所述比对。接着,计算野生型读段的数目相对于含有C-T突变、C-A/G突变或插入/缺失的读段的数目。在以所预测的Cas9切割位点为中心的20bp区中对插入和缺失进行评分。插入/缺失百分比定义为在20bp评分区内插入或缺失一个或多个碱基的测序读段的总数除以测序读段(包括野生型)的总数。在包括20bp sgRNA目标序列的上游10bp和下游10bp的40bp区中对C-T突变或C-A/G突变进行评分。C-T编辑百分比定义为在40bp区内具有一个或多个C-T突变的测序读段的总数除以测序读段(包括野生型)的总数。类似地计算C-A/G突变的百分比。
实施例1A-C-T转化
评估APOBEC3A脱氨酶-Cas9D10A编辑器的C-T转化活性的效率和C-T转化窗口的跨度。将C-T转化活性和窗口结果与编码BE3的构建体BC27进行比较(Komor AC,Kim YB,Packer MS,Zuris JA,Liu DR.Programmable editing of a target base in genomicDNA without double-stranded DNA cleavage.Nature.2016;533(7603):420-424)。构建体各自在单一实验中针对5种sgRNA一式三份地评估。
使用pUC19主链(登录号U47119)的质粒A表达来自U6启动子的化脓性链球菌单引导RNA(sgRNA)。称为pCI的质粒B表达来自CMV启动子的碱基编辑器构建体,其由通过XTEN接头融合到化脓性链球菌-D10A-Cas9的候选脱氨酶构成,所述XTEN接头然后与UGI的一个拷贝和SV40 NLS的一个拷贝融合。使用Mirus/>用质粒A和质粒B各100ng对在96孔板中在补充有10%胎牛血清(FBS)的杜尔贝科改良伊格尔培养基(Dulbecco′sModified Eagle′s Medium,DMEM)中生长的U-2OS细胞进行转染。在初始转染之后24小时,将细胞洗涤并重悬于新鲜培养基中。在额外48小时后,去除培养基并且用QuickExtractTMDNA提取溶液(Lucigen,目录号QE09050)溶解细胞。
与编码具有多于一种引导物(sg000296:P值0.0303;sg001373,P值0.0263)的大鼠APOBEC1脱氨酶(Uniprot ID P38483)的BC27相比,在融合物中编码智人APOBEC3A脱氨酶(Uniprot ID P31941)的构建体BC22具有显著更大的C-T转化活性。在所有引导物中,BC22的平均活性与BC27的平均活性相当(表6,图1A至图1E)。
在所有5种经测试的sgRNA中,BC22比BC27显著更可能将所有目标胞嘧啶转化成胸苷(表7,图2A至图2E,P值<0.005)。目标胞嘧啶为原型间隔区目标序列的位置1-10内(带下划线)或目标序列的第一位置5′中的任何胞嘧啶。sg000296的引导序列为CCUUCCGAAAGAGGCCCCCC(SEQ ID NO:156),并且基因座具有4个目标胞嘧啶。sg001373的目标引导序列为UCCCUGGCUGAGGAUCCCCA(SEQ ID NO:157),并且基因座具有5个目标胞嘧啶,包括目标序列的第一位置5′。sg001400的目标引导序列为ACUCACGAUGAAAUCCUGGA(SEQ IDNO:158),并且基因座具有4个目标胞嘧啶,包括目标序列的第一位置5′。sg003018的目标引导序列为GAGCCCCCCACUGUGGUGAC(SEQ ID NO:160),并且基因座具有6个目标胞嘧啶。sg005883的引导序列为CCCCCCGCCGUGUUUGUGGG(SEQ ID NO:159),并且基因座具有8个目标胞嘧啶。
与BC27相比,BC22转化的目标胞嘧啶的比率和位置范围显著更大(图3A至图3E)。与BC27相比,转化的目标胞嘧啶的比率和位置范围显著更大(图3A至图3E)。此较宽C-T转化窗口甚至适用于BC22在例如sg001400、sg003018上具有较小总C-T转化活性的引导物(表7,图3C至图3E)。
表6.含有至少1个胞嘧啶至胸苷转化的总读段的百分比。(n=3)
表7.所有目标胞嘧啶已转化为胸苷的C-T编辑读段的百分比(sg000296、sg001373、sg001400、sg003018)。对于sg005883,8种目标胞嘧啶中的至少6种已转化为胸苷的经编辑读段的百分比。(n/d=未进行)
/>
实施例2-碱基切除修复基因对编辑的影响
在各种细胞系中研究相对于非所要碱基切除修复活性,额外反式UGI基因表达对C-T转化活性的影响。
使用Mirus用100ng BC22或BC27、100ng另一CMV驱动的过表达质粒(pcDNA3.1)或对照质粒(pMAX)和6.25pmol单引导G000297对在96孔板中在补充有10%FBS的杜尔贝科改良伊格尔培养基(DMEM)中生长的U-2OS和HuH-7细胞进行共转染。与BC22和BC27串联测试的ORF为绿色荧光蛋白(pMAX-GFP,阴性对照)、尿嘧啶DNA糖苷酶(pCDNA3.1-UNG)、单链选择性单官能尿嘧啶-DNA糖苷酶1(pcDNA3.1-SMUG1)和尿嘧啶糖苷酶抑制剂(pCDNA3.1-UGI)。UNG和SMUG1是从DNA去除尿嘧啶的碱基切除修复蛋白。UGI是结合和抑制UDG的小蛋白。据报道,当UGI融合到构建体时,相对于C-A/G突变和插入/缺失的其他结果,其增加C-T突变的比率(Liu等人,Nature 2016)。为确定添加UNG转录本敲低是否进一步富集仅C-T编辑,额外转染条件包括BC22或BC27、pcDNA3.1-UGI、G000297和靶向UNG的siRNA池(Dharmacon,#M-011795-00)。在转染之后三天,去除培养基并且用QuickExtractTM DNA提取溶液(Lucigen,目录号QE09050)溶解细胞。
在HuH-7细胞中,当与阴性对照GFP的过表达相比时,用BC22或BC27过表达碱基切除修复蛋白UNG或SMUG1导致C-A/G突变和插入/缺失相对于仅C-T突变的比率显著增加1.3-1.7倍(表11,图5B)。相反,用UGI过表达阻断UNG导致含有C-A/G突变和插入/缺失的读段减少4.5-10.8倍,其中仅C-T突变显著增加1.56-2.2倍(表11,图5B)。额外UGI过表达导致无论使用BC22还是BC27,平均94%的总编辑为仅C-T编辑(图4B)。U-2OS可见类似趋势(表8,图4A、图5A),其中一个突出的差异为SMUG1和UNG过表达未导致编辑结果的相对比率的显著变化。在两个细胞系中,将靶向UNG基因的siRNA添加至UGI过表达质粒不增加仅C-T编辑相对于单独UGI过表达的比率(表8)。最后,在两个细胞系中,BC22总C-T转化活性高于BC27(图4A、图4B),表明BC22的先天性C-T转化活性高于BC27。
表8-编辑作为U-2OS细胞中总读段的%(n=3)
/>
表9.U-2OS细胞中编辑读段的%相对于GFP的倍数变化
表10.HuH-7细胞中不同DNA修复途径条件下的编辑百分比
表11.Huh-7细胞中编辑读段的%相对于GFP的倍数变化
实施例3-T细胞中的UGI mRNA滴定
mRNA编码融合蛋白BC22n(SEQ ID NO:3),其从N末端至C末端为智人APOBEC3A、XTEN接头、D10ACas9切口酶、接头和SV40 NLS。值得注意的是,BC22n多肽缺少UGI。使用BC22n和可变量的UGI mRNA编辑T细胞以确定反式UGI水平对编辑型态的影响。使用各自使用不同开放阅读框(SEQ ID No:26和35)编码相同蛋白质的2种不同UGI mRNA进行此实验。
3.1T细胞制备
健康人类供体血球分离术是商购获得的(Hemacare),并且将细胞在LOVO装置上洗涤并重悬于PBS/EDTA缓冲液(Miltenyi Biotec目录号130-070-525)中。使用CD4和CD8磁珠(Miltenyi Biotec目录号130-030-401/130-030-801),使用/>Plus和/>LS一次性试剂盒,经由阳性选择分离T细胞。将T细胞等分至小瓶中并冷冻保存于/>CS10(StemCell Technologies目录号07930)和Plasmalyte A(Baxter目录号2B2522X)的1∶1制剂中以供将来使用。在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者构成的T细胞基础培养基中:X-VIVO 15TM无血清造血细胞培养基(Lonza Bioscience),含有5%(v/v)胎牛血清、50μM 2-巯基乙醇、10mM N-乙酰基-L-(+)-半胱氨酸、10U/mL青霉素-链霉素,外加1X细胞因子(200 U/mL重组人类白细胞介素-2、5μg/mL重组人类白细胞介素-7和5μg/mL重组人类白细胞介素-15)。用TransActTM(1∶100稀释,Miltenyi Biotec)活化T细胞。细胞在电穿孔之前在T细胞基础培养基中扩增72小时。
3.2使用mRNA和sgRNA进行T细胞的电穿孔
在无菌水中制备含有编码BC22n(SEQ ID NO:2)的mRNA和一种UGI(SEQ ID NO:26或35)的溶液。将50μM靶向sgRNA G016017(SEQ ID NO:184)的TRAC从其储存板移出,并在95℃下变性2分钟,然后在冰上冷却。活化后七十二小时,采集T细胞,离心,并以12.5x10^6个T细胞/mL的浓度重悬于P3电穿孔缓冲液(Lonza)中。对于待电穿孔的每个孔,将1x10^5个T细胞与200ng BC22n mRNA、20pmol sgRNA和在0.02ng至26ng(稀释因子12.24)范围内的UGImRNA在最终体积为20μL的P3电穿孔缓冲液中混合。此mRNA+sgRNA+T细胞混合物一式三份转移至96孔NucleofectorTM板中并且使用制造商的脉冲码电穿孔。经电穿孔的T细胞立即在不含细胞因子的80μL T细胞基础培养基中静置10分钟,然后转移至含有额外100μL具有2X浓度的细胞因子的T细胞基础培养基的新平底96孔板中。经电穿孔的T细胞随后额外培养3天并且如实施例1中所描述收集用于NGS测序。
200ng BC22n mRNA的恒定剂量引起所有条件下的高总编辑(>92%)(表12和表13,插入/缺失、C-A/G和C-T的总和)。仅C-T的编辑比率以对电穿孔中的UGI mRNA浓度的剂量反应方式增加。在最高剂量的UGI mRNA SEQ ID NO:25或34下,含有插入/缺失和C-A/G突变的测序读段的百分比分别下降至7.4±0.4、7.4±0.6和2.9±0.2、3.6±0.3(表12和表13)。
表12-编辑作为具有UGI mRNA(SEQ ID NO:26)的总读段的百分比
表13-编辑作为具有UGI mRNA(SEQ ID NO:35)的总读段的百分比
实施例4:用顺式UGI进行体内编辑
对于用编辑器mRNA和sgRNA G000282以1∶1RNA重量比配制的LNP测试体内编辑功效和编辑结果。实验组包括:仅TSS缓冲液;编码裂解酶-spCas9(SEQ ID NO:8)的mRNA;编码包括融合到D10A SpyCas9的人类APOBEC3A和一个UGI拷贝(SEQ ID NO:20)的BC22的mRNA;和编码包括融合到D10A SpyCas9的大鼠APOBEC1和一个UGI拷贝(SEQ ID NO:14和17)的BE3的mRNA。
在此研究中使用6-10周龄范围内的CD-1雌性小鼠(n=5/组)。经由尾部静脉注射以相对于体重1mg/kg总RNA的剂量静脉内施用LNP。在给药后至少24小时,定期观测动物的不良反应。处理之后六天,在异氟烷麻醉下通过心脏穿刺将动物安乐死;收集血液和肝脏组织用于下游分析。将血液收集至血清分离管中或含有缓冲柠檬酸钠的管中以得到血浆。收集重量在5与15mg之间的肝脏穿孔以分离基因组DNA和总RNA。
表14和图7A描述了小鼠肝脏中的编辑结果。含有人类APOBEC3A(BC22)的构建体显示与Cas9裂解酶构建体的总编辑水平相当的总编辑水平,而大鼠APOBEC1(BE3)构建体显示小于总编辑活性的一半。与大鼠APOBEC1构建体(BE3)相比,含有人类APOBEC3A的构建体也实现超过两倍的C-T碱基转化的绝对百分比。
表14.肝脏组织中的TTR编辑(插入/缺失=插入或缺失;SD=标准偏差)
实施例5-用反式UGI进行体内编辑
当将UGI反式(作为单独的mRNA)递送时,将含有脱氨酶的构建体的体内编辑型态与Cas9进行比较。所使用的构建体编码包括D10A SpyCas9与脱氨酶的融合蛋白。此外,这些编辑条件之间的基因表达差异是经由转录组分析来分析。
5.1通过NGS测定的体内编辑
在此研究中使用6-10周龄范围内的四十五只可商购CD-1雌性小鼠(n=5/组)。给药前对动物称重以进行给药计算。在LNP中分别配制每一RNA物种。以6∶3∶2(编辑器mRNA∶sgRNA∶UGI mRNA)的RNA货物的w/w比率混合含有编辑器mRNA、UGI mRNA和sgRNA的制剂。第3组制剂混合物仅含有编辑器mRNA和sgRNA并且这些以2∶1(编辑器mRNA∶sgRNA)的w/w比率混合。除仅用TSS缓冲液给药的阴性对照组之外,所有组均接受sgRNA G000282。根据表15中所列出的剂量,经由尾部静脉注射静脉内施用制剂。在给药后至少24小时,定期观测动物的不良反应。处理之后六天,在异氟烷麻醉下通过心脏穿刺将动物安乐死;收集肝脏组织用于下游分析。收集重量在5与15mg之间的肝脏穿孔以分离基因组DNA和总RNA。用NGS测序分析基因组DNA样本,如实施例1中所描述。
表15-动物组和相应LNP。
编辑数据显示于表16和图8中。用Cas9 mRNA处理导致58.2%的Ttr基因编辑。在不存在UGI mRNA的情况下,用反式BC22n mRNA处理的动物显示29.26%的C-T转化和28%的插入/缺失,而用BC22n和UGI mRNA处理的动物显示较高的C-T编辑纯度(56.67%的C-T转化和仅5.6%的插入/缺失)。
将脂质剂量从0.3mg/kg降低至0.1mg/kg导致较低编辑水平(31.39%的C-T转化和3.67%的插入/缺失)。
表16-用不同LNP组合处理的小鼠中的Ttr编辑水平(SD=标准偏差)。
5.2全转录组测序
将肝脏穿孔与800μL TRIzol试剂(Thermo Fisher Scientific,目录号15596026)在含有陶瓷珠粒的溶解基质D管(MPBio,目录号116913100)中混合。将组织在珠粒搅拌器中匀浆化45秒并转移至冰中。在4C下以最大速度使溶解基质D管短暂离心5分钟,并且将~600μL TRIzol(无组织碎片)与等体积的无水乙醇混合。将混合物装载于Directzol RNA小量制备柱(Zymo Research,目录号R2051)中并且遵循制造商的方案提取RNA。经纯化的RNA样本在NanoDropTM 8000分光光度计(Thermo Fisher Scientific)中定量并使用无核酸酶水稀释至41.67ng/μL。从每个实验组随机选择2个样本用于进一步转录组分析。根据制造商的说明书,使用rRNA耗竭试剂盒(New England Biolabs,目录号E6350L)耗竭500ng(12μL)经纯化的总RNA的核糖体RNA (rRNA)组分。遵循制造商的方案,使用/>UltraTMII Directional RNA Library Prep Kit for/>(New England Biolabs,目录号E7765S)将耗竭rRNA的样本转化为双链DNA文库。在Qubit 4荧光计中定量扩增的文库,并且通过毛细管电泳获得每个文库的平均片段大小。以4nM的等摩尔浓度汇集文库,并且在NextSeq550测序平台(Illumina)中使用高输出300-循环试剂盒(Illumina,目录号20024908)进行双端测序。
用于差异基因表达分析的数据处理
产生呈FASTQ格式的测序读段并使用bcl2fastq程序(Illumina,v2.20)进行多路解编。如果每个索引读段与样本索引之间的汉明距离(Hamming,R.W.BellSyst.Tech.J.29,147-160)小于或等于一,则将读段分配至样本。用FastQC程序(v0.11.9)(Andrews S.Babraham Inst.)检验测序质量。通过用Bowtie2(v2.3.5.1)(Langmead,B.和Salzberg,S.L.Nat.Methods 9,357-359)将所有读段与人类rRNA序列(GenBank U13369.1)比对来鉴定核糖体RNA读段。使用Salmon(v0.14.1)(Patro R.等人,Nat.Methods 14,417-419)与非核糖体RNA读段进行转录组定量。使用DESeq2(v1.26.0)(Love,M.I.等人,GenomeBiol.15,550)对Salmon的输出进行差异基因表达分析。经Benjamini-Hochberg调整的p值小于0.05的基因或转录本被确定为差异表达的。
RNA-Seq分析揭示,与单独用BC22n(即无UGI mRNA)处理的那些动物中的223个事件和用反式Cas9和UGI mRNA处理的动物中的127个事件相比,用反式BC22n mRNA和UGImRNA处理仅产生53个差异表达基因(图9A至图9C)。
实施例6-用反式UGI在T细胞中进行编辑
6.1在T细胞中编辑
在CIITA基因座处用反式UGI和BC22n或Cas9编辑T细胞以评定编辑类型对MHC II抗原的影响。
健康人类供体血球分离术是商购获得的(Hemacare),并且将细胞在LOVO装置上洗涤并重悬于PBS/EDTA缓冲液(Miltenyi Biotec目录号130-070-525)中。使用CD4和CD8磁珠(Miltenyi Biotec目录号130-030-401/130-030-801),使用/>Plus和/>LS一次性试剂盒,经由阳性选择分离T细胞。将T细胞等分至小瓶中并冷冻保存于/>CS10(StemCell Technologies目录号07930)和Plasmalyte A(Baxter目录号2B2522X)的1∶1制剂中以供将来使用。在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者构成的T细胞基础培养基中:X-VIVO 15TM无血清造血细胞培养基(Lonza Bioscience),含有5%(v/v)胎牛血清、50μM 2-巯基乙醇、10mM N-乙酰基-L-(+)-半胱氨酸、10U/mL青霉素-链霉素,外加1X细胞因子(200U/mL重组人类白细胞介素-2、5μg/mL重组人类白细胞介素-7和5μg/mL重组人类白细胞介素-15)。用TransActTM(1∶100稀释,Miltenyi Biotec)活化T细胞。细胞在电穿孔之前在含有TransActTM的T细胞基础培养基中扩增72小时。
T细胞的电穿孔
在无菌水中制备含有编码Cas9(SEQ ID NO.11)、BC22n(SEQ ID NO:2)或UGI(SEQID NO:26)的mRNA的溶液。将50μM CIITA sgRNA从其储存板移出,并在95℃下变性2分钟,然后在冰上冷却。活化后七十二小时,采集T细胞,离心,并以12.5x10^6个T细胞/mL的浓度重悬于P3电穿孔缓冲液(Lonza)中。对于待电穿孔的每个孔,如表17中所描述,将1x10^5个T细胞与200ng编辑器mRNA、200ng UGI mRNA和20pmol sgRNA在最终体积为20μL的P3电穿孔缓冲液中混合。此混合物一式三份转移至96孔NucleofectorTM板中并且使用制造商的脉冲码电穿孔。经电穿孔的T细胞立即在不含细胞因子的80μL T细胞基础培养基中静置10分钟,然后转移至含有额外100μL补充有2X细胞因子的T细胞基础培养基的新平底96孔板中。所得板在37℃下温育4天。在96小时后,将T细胞以1∶3稀释至含1X细胞因子的新鲜T细胞基础培养基中。经电穿孔的T细胞随后额外培养3天并且如实施例1中所描述收集用于流式细胞术分析、NGS测序和转录组学。
流式细胞术和NGS测序
在编辑后第7天,T细胞通过流式细胞术表型分型以确定MHC II类蛋白质表达。简言之,在靶向HLA-DR、DQ、DP-PE(目录号361704)和同型对照-PE(/>目录号400234)的抗体混合液中温育T细胞。随后洗涤细胞,在Cytoflex流式细胞仪(BeckmanCoulter)上处理并使用FlowJo软件包进行分析。T细胞基于大小、形状、活力和MHC II表达进行门控。如实施例1中所描述,对DNA样本进行PCR和后续NGS分析。表17和图10显示CIITA基因编辑。对于Cas9和BC22n两种条件,总编辑接近完成,超过95%。表17和图11显示用与Cas9或BC22n mRNA组合的UGI mRNA进行电穿孔之后的MHC II类蛋白质表达。对于G018117,用BC22n编辑导致80.50%MHC II阴性细胞,而用Cas9编辑导致51.63%MHC II抗原阴性细胞。
表17-以总NGS读段的百分比呈现的T细胞中的CIITA编辑;缺少表面标志物HLADQ/DP/DR的细胞的百分比的流式细胞术评定
6.2-T细胞中的基因表达分析
全转录组测序
在编辑后第7天,采集用G018117和G18078处理的T细胞并保存在-80C下以供将来处理。遵循制造商的方案,使用Direct-zol RNA微量制备试剂盒(Zymo Research,目录号R2062)从TRIzolTM试剂中的样本提取总RNA。经纯化的RNA样本在NanoDropTM 8000分光光度计(Thermo Fisher Scientific)中定量并使用无核酸酶水稀释至41.67ng/μL。从图13A至图15B中所显示的每个一式三份实验中,随机选择每组样本以用于转录组分析。根据制造商的说明书,使用rRNA耗竭试剂盒(New England Biolabs,目录号E6350L)耗竭500ng(12μL)经纯化的总RNA的核糖体RNA(rRNA)组分。遵循制造商的方案,使用/>UltraTMII Directional RNA Library Prep Kit for/>(New England Biolabs,目录号E7765S)将耗竭rRNA的样本转化为双链DNA文库。在Qubit 4荧光计中定量扩增的文库,并且通过毛细管电泳获得每个文库的平均片段大小。以4nM的等摩尔浓度汇集文库,并且在NextSeq550测序平台(Illumina)中使用高输出300-循环试剂盒(Illumina,目录号20024908)进行双端测序。
用于差异基因表达分析的数据处理
产生呈FASTQ格式的测序读段并且使用bcl2fastq程序(Illumina,v2.20)进行多路解编。如果每个索引读段与样本索引之间的汉明距离(Hamming,R.W.BellSyst.Tech.J.29,147-160)小于或等于一,则将读段分配至样本。用FastQC程序(v0.11.9)(Andrews S.Babraham Inst.)检验测序质量。通过用Bowtie2(v2.3.5.1)(Langmead,B.和Salzberg,S.L.Nat.Methods 9,357-359)将所有读段与人类rRNA序列(GenBank U13369.1)比对来鉴定核糖体RNA读段。使用Salmon(v0.14.1)(Patro R.等人,Nat.Methods 14,417-419)与非核糖体RNA读段进行转录组定量。使用DESeq2(v1.26.0)(Love,M.I.等人,GenomeBiol.15,550)对Salmon的输出进行差异基因表达分析。经Benjamini-Hochberg调整的p值小于0.05的基因或转录本被确定为差异表达的。使用Metascape (Zhou,Y.等人,Nat.Comm.10,1523)依据基因本体来分析差异表达基因的列表。使用BioGrid、InWeb_IM和OmniPath8数据库确定蛋白质-蛋白质相互作用(Li,T.等人,Nat.Methods 14,61-64;Stark,C.等人,Nucleic Acids Res.34,535-539;Türei,D.等人,Nat.Methods 13,966-967)。使用分子复合物检测(MCODE)算法鉴定密集连接的网络(Bader,G.D.等人,BMCBioinformatics 4,1-27)并且保留依据p值的三个最佳评分项作为对应网络组件的功能描述。
与用Cas9 mRNA处理的样本相比,用BC22n mRNA电穿孔的T细胞显示MHC II类基因和HLA相关CD74基因的显著较强下调(表18和表19)。观测到对I类MHC基因的微小作用(表20和表21)。就转录组范围内的差异基因表达事件而言,当与Cas9 mRNA相比时,用BC22n mRNA处理导致较少差异表达基因(经调整p<0.05)。在用sgRNA G018076电穿孔的T细胞中,分别观测到Cas9和BC22n mRNA处理的总共553和65个差异基因表达事件(图12A至图12B)。在用sgRNA G018117电穿孔的T细胞中观测到类似趋势,在分别用Cas9和BC22n mRNA处理时,其显示303和30个差异基因表达事件(图13A至图13B)。当与用Cas9 mRNA处理的那些相比时,在用BC22n mRNA处理的T细胞中差异表达基因的列表中鉴定到较少蛋白质-蛋白质相互作用网络(图14A至图14B和图15A至图15B)。
表18-T细胞中II类HLA基因的差异基因表达(ns=不显著,*=经调整p<0.05,**=经调整p<0.01,***=经调整p<0.001)。关于转录本定量数据,参看表19。
/>
表19-T细胞中II类HLA基因的表达的转录本定量。每一平方含有每一百万个mRNA分子中来自给定基因的转录本的平均数目。关于统计显著性,请参看表19。
表20-用不同mRNA组合和CIITA靶向sgRNA处理后7天采集的T细胞中I类HLA基因的差异基因表达(ns=不显著,*=经调整p<0.05,**=经调整p<0.01,***=经调整p<0.001)。关于转录本定量数据,参看表21。
表21-T细胞中I类HLA基因的表达的转录本定量。每一平方含有每一百万个mRNA分子中来自给定基因的转录本的平均数目。关于统计显著性,请参看表20。
实施例7-APOBEC3A热点处的编辑评定
T细胞制备
健康人类供体血球分离术是商购获得的(Hemacare),并且将细胞在LOVO装置上洗涤并重悬于PBS/EDTA缓冲液(Miltenyi Biotec目录号1 30-070-525)中。使用CD4和CD8磁珠(Miltenyi Biotec目录号130-030-401/130-030-801),使用/>Plus和/>LS一次性试剂盒,经由阳性选择分离T细胞。将T细胞等分至小瓶中并冷冻保存在/>CS10(StemCell Technologies目录号07930)和Plasmalyte A(Baxter目录号2B2522X)的1∶1制剂中以供将来使用。在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者构成的T细胞基础培养基中:X-VIVO 15TM无血清造血细胞培养基(Lonza Bioscience),含有5%(v/v)胎牛血清、50μM 2-巯基乙醇、10mM N-乙酰基-L-(+)-半胱氨酸、10U/mL青霉素-链霉素,外加1X细胞因子(200U/mL重组人类白细胞介素-2、5μg/mL重组人类白细胞介素-7和5μg/mL重组人类白细胞介素-15)。用TransActTM(1∶100稀释,Miltenyi Biotec)活化T细胞。细胞在电穿孔之前在含有TransActTM的T细胞基础培养基中扩增72小时。
T细胞的mRNA和sgRNA电穿孔
在无菌水中制备含有编码Cas9(SEQ ID NO:11)、BC22n(SEQ ID NO:2)或UGI(SEQID NO:26)的mRNA的溶液。将50μM靶向sgRNA(G016017)的TRAC从其储存板移出,并在95℃下变性2分钟,然后在冰上冷却。活化后七十二小时,采集T细胞,离心,并以12.5x10^6个T细胞/mL的浓度重悬于P3电穿孔缓冲液(Lonza)中。对于待电穿孔的每个孔,将1x10^5个T细胞与200ng每一mRNA和20pmol sgRNA在最终体积为20μL的P3电穿孔缓冲液中混合。T细胞混合物一式三份转移至96孔NucleofectorTM板中并且使用制造商的脉冲码电穿孔。经电穿孔的T细胞立即在不含细胞因子的80μL T细胞基础培养基中静置10分钟,然后转移至含有额外100μL补充有2X细胞因子的T细胞基础培养基的新平底96孔板中。所得板在37℃下温育4天。在96小时后,将T细胞以1∶3稀释至含1X细胞因子的新鲜T细胞基础培养基中。经电穿孔的T细胞随后额外培养3天并且收集用于NGS测序。
NGS测序
在编辑后第7天,对DNA样本进行PCR和后续NGS分析,如实施例1中所描述。此研究表征除先前描述为对APOBEC酶呈阳性的肿瘤样本中的突变热点的10个基因组基因座外的在靶TRAC基因座(Buisson等人,2019)。这些位点的染色体位置列出于表22上。
表23、表24和表25显示在靶基因座中的C-T、C-A/G和插入/缺失编辑水平和所有样本群组的所预测的APOBEC热点位点。这些结果的图形表示显示于图16A至图16C中。与用Cas9mRNA处理的对照样本相比,除UGI mRNA和sgRNA G016017两者以外,用BC22n mRNA、UGImRNA或BC22n mRNA电穿孔的T细胞不显示先前报告为对APOBEC酶呈阳性的肿瘤样本中的突变热点的10个基因组基因座的编辑型态的任何显著变化(Buisson R.等人,(2019).Science 364,1-8.,)。在用BC22n mRNA、UGI mRNA和sgRNA G016017处理的样本中观测到在靶TRAC基因座处的高水平脱氨作用,但在用单独的BC22n mRNA、单独的Cas9 mRNA或单独的UGI mRNA处理的样本中不存在。
表22-在此研究中评估的突变热点的列表、其Entrez基因ID和基因组位置。
基因符号 | Entrez基因ID | 染色体 | 基因组位置 | 链 |
FAM83G | 644815 | 17 | 18,907,093 | - |
PCNT | 5116 | 21 | 47,783,764 | - |
CUEDC2 | 79004 | 10 | 104,184,490 | - |
PANX2 | 56666 | 22 | 50,615,649 | - |
GSE1 | 23199 | 16 | 85,691,140 | - |
ZNF672 | 79894 | 1 | 249,142,293 | + |
NLRP1 | 22861 | 17 | 5,461,801 | + |
MLLT4/AFDN | 4301 | 6 | 168,352,586 | + |
OR5A1 | 219982 | 11 | 59,211,279 | + |
KIAA1 522 | 57648 | 1 | 33,237,497 | + |
表23-除人类基因组中10个先前所描述的APOBEC热点以外,在靶TRAC基因座中C-T碱基转化的水平。SD=标准偏差;ND=未测定。
/>
表24-除人类基因组中10个先前所描述的APOBEC热点以外,在靶TRAC基因座中C-A/G置换的水平。SD=标准偏差;ND=未测定。
表25-除人类基因组中10个先前所描述的APOBEC热点以外,在靶TRAC基因座中插入和缺失(插入/缺失)的水平。SD=标准偏差;ND=未测定。
/>
实施例8-BC22n∶UGI的比率固定的T细胞中的LNP滴定
使用递送至活化人类T细胞的LNP,用Cas9或BC22n评定单目标和多目标编辑的效力。
8.1 T细胞制备
健康人类供体血球分离术是商购获得的(Hemacare),并且将细胞在LOVO装置上洗涤并重悬于PBS/EDTA缓冲液(Miltenyi Biotec目录号130-070-525)中。使用CD4和CD8磁珠(Miltenyi Biotec目录号130-030-401/130-030-801),使用/>Plus和/>LS一次性试剂盒,经由阳性选择分离T细胞。将T细胞等分至小瓶中并冷冻保存于/>CS10(StemCell Technologies目录号07930)和Plasmalyte A(Baxter目录号2B2522X)的1∶1制剂中,以供将来使用。在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者构成的T细胞基础培养基中:X-VIVO 15TM无血清造血细胞培养基(Lonza Bioscience),含有5%(v/v)胎牛血清、50μM 2-巯基乙醇、10mM N-乙酰基-L-(+)-半胱氨酸、10U/mL青霉素-链霉素,外加1X细胞因子(200U/mL重组人类白细胞介素-2、5μg/mL重组人类白细胞介素-7和5μg/mL重组人类白细胞介素-15)。用TransActTM(稀释1∶100,Miltenyi Biotec)活化T细胞。细胞在LNP转染之前在T细胞基础培养基中扩增72小时。
8.2 T细胞编辑
如实施例1中所描述,每一RNA物种,即UGI mRNA、sgRNA或编辑器mRNA分别在LNP中配制。编辑器mRNA编码BC22n(SEQ ID NO:5)或Cas9(SEQ ID NO:23)。靶向B2M(G015995)、TRAC(G016017)、TRBC1/2(G016206)和CIITA(G018117和G016086)的引导物是单独或组合使用的。在实验的Cas9和BC22n两组中均递送编码UGI的信使RNA(SEQ ID NO:26),以校正脂质量。先前实验已确立,UGI mRNA在与Cas9 mRNA一起使用时不影响总编辑或编辑型态。如表26中所描述,将LNP与编辑器mRNA、引导RNA和UGI mRNA依分别6∶3∶2的固定总RNA重量比混合。在表27中所描述的4-引导物实验中,LNP与个别引导物的剂量降低4倍,以维持总体6∶3编辑器mRNA∶引导物重量比并允许与基于总脂质递送的个别引导物效力进行比较。将LNP混合物在37℃下在改用6%食蟹猕猴血清(Bioreclamation IVT,目录号CYN220760)替代胎牛血清的T细胞基础培养基中温育5分钟。
活化后七十二小时,将T细胞洗涤并悬浮于基础T细胞培养基中。将预温育LNP混合物以1x10e5个T细胞/孔添加至每个孔中。在实验期间,在37℃下将T细胞与5%C02一起温育。在活化之后6天和8天和活化后第十天更换T细胞培养基,采集细胞以通过NGS和流式细胞术进行分析。如实施例1中所描述进行NGS分析。
表26和图17A至图17E描述当个别引导物用于编辑时T细胞的编辑型态。在所有测试的引导物中,总编辑和C-T编辑显示与BC22n mRNA、UGI mRNA和引导物的量增加的直接、剂量反应性关系。插入/缺失和C转化为A或G与剂量逆相关,其中较低剂量导致较高百分比的这些突变。在用Cas9编辑的样本中,总编辑和插入/缺失活性随总RNA剂量而增加。
表26编辑作为总读段的百分比-单引导物递送
/>
/>
表27和图18A至图18D以总读段的百分比描述了当同时使用四种引导物进行编辑时,T细胞的编辑型态。在这组实验中,每个引导物以与单引导物编辑实验相比25%的浓度使用。总共,T细胞同时暴露于6种不同LNP(编辑器mRNA、UGI mRNA、4种引导物)。与用Cas9编辑相比,用BC22n和反式UGI编辑使得每个基因座的最大总编辑百分比更高。
表27-编辑作为总读段的百分比-多引导物递送
/>
/>
在活化后第10天,T细胞通过流式细胞术进行表型分型以确定编辑是否导致细胞表面蛋白损失。简言之,在以下抗体的混合物中温育T细胞:B2M-FITC(BioLegend,目录号316304)、CD3-AF700(BioLegend,目录号317322)、HLA DR DQ DP-PE(BioLegend,目录号361704)和DAPI(BioLegend,目录号422801)。将未编辑的细胞子集与同型对照-PE(目录号400234)一起温育。随后洗涤细胞,在Cytoflex仪器(Beckman Coulter)上处理并使用FlowJo软件包进行分析。T细胞基于大小、形状、活力和抗原表达进行门控。
表28和图19A至图19I将表型分型结果报告为对于抗体结合呈阴性的细胞的百分比。BC22n和Cas9样本两者的抗原阴性细胞的百分比随着总RNA增加而以剂量反应性方式增加。对于所有测试的引导物,与用Cas9编辑的细胞相比,用BC22n编辑的细胞显示类似或更高的蛋白质敲除。在多编辑细胞中,与Cas9与反式UGI相比,BC22n与反式UGI显示基本上更高百分比的抗原阴性细胞。例如,在550ng的最高总RNA剂量下的BC22n编辑样本显示84.2%的缺少所有三种抗原的细胞,而Cas9编辑仅产生46.8%的此类三重敲除细胞。对于仅用一种引导物处理的样本,DNA编辑与抗原减少之间的相关性是稳固的。当将C-T转化与抗原敲除进行比较时,BC22n的R平方测量值为0.93。当将插入/缺失与抗原敲除进行比较时,Cas9的R平方测量值为0.95。
表28-流式细胞术数据-对于抗原呈阴性的细胞百分比(n=2)
/>
实施例9-用反式UGI滴定在T细胞中进行编辑
评定编辑型态以确定在具有不同编辑构建体的T细胞中实现高纯度C-T编辑所必需的UGI mRNA浓度。使用饱和剂量的编辑器mRNA和sgRNA和不同量的UGI mRNA来测量C-T编辑纯度(仅含有C-T转化的经编辑读段的%)。编辑器mRNA包括编码BC22n的mRNA(SEQ IDNO:5)、用总共2个融合UGI部分编码BC22的mRNA(SEQ ID NO:29)和编码包括2个融合UGI部分的BE4Max的mRNA(SEQ ID NO:32)(Koblan LW,Doman JL,Wilson C等人,NatBiotechnol.2018;36(9):843-846.)。
在无菌水中制备含有如表29中所列出的编辑器mRNA或UGI mRNA(SEQ ID NO:26)的溶液。将50μM靶向sgRNA G015995的B2M从其储存板移出,并在95℃下变性2分钟,然后在冰上冷却。活化后七十二小时,采集T细胞,离心,并以12.5x10^6个T细胞/mL的浓度重悬于P3电穿孔缓冲液(Lonza)中。对于待电穿孔的每个孔,将1x10^5个T细胞与200ng编辑器mRNA、20pmol sgRNA和在0.8ng至600.0ng(0.8nM至597.0nM)范围内的不同浓度的UGI mRNA在最终体积为20μL的P3电穿孔缓冲液中混合。此mRNA+sgRNA+T细胞混合物一式三份转移至96孔NucleofectorTM板中并使用制造商的脉冲码电穿孔。经电穿孔的T细胞立即在不含细胞因子的CTSTM OpTmizerTM T细胞扩增无血清培养基(SFM)(ThermoFisher目录号A1048501)中静置10分钟,然后转移至含有额外100μL具有2X浓度的细胞因子的相同培养基的新平底96孔板中。所得板在37℃下温育9天,在此期间将细胞分裂并且培养基再更新两次。如实施例1中所描述,收集并处理T细胞以进行NGS测序。
表29和图20A至图20C显示每个编辑类型的读段的百分比。反式UGI mRNA的水平的增加减少所有三个编辑器构建体的插入/缺失。在199nM UGI mRNA或更高的情况下,插入/缺失减少至小于所测试的每个编辑器构建体的总读段的2%。在低浓度的反式UGI mRNA下,编码UGI的编辑器构建体显示比缺少经编码UGI的BC22n构建体更多的C-T转化。表30和图21将表29和图20A至图20C中所撷取的数据表示为C-T转化的总编辑的百分比,也称为C-T纯度。对于所有构建体,增加反式UGI mRNA增加C-T总编辑并且增加C-T纯度。所有三个构建体在199nM UGI mRNA下显示超过95%C-T编辑纯度,其对应于约7∶1的UGI mRNA与编辑器mRNA的摩尔比。
表29-编辑类型作为随着UGI mRNA增加的总读段的百分比
/>
表30-C-T纯度:仅含有C-T转化、无插入/缺失、无C-A/G转化的经编辑测序读段的百分比(n=2)
实施例10.筛选CIITA引导RNA
通过使用Cas9和BC22两者评定MHC II类细胞表面表达的敲低来筛选CIITA gRNA在T细胞中的功效。在用RNP进行电穿孔进行CIITA编辑之后,测定对于MHC II类蛋白呈阴性的T细胞的百分比。
10.1.T细胞的RNP电穿孔
使用Cas9核糖核蛋白(RNP)的电穿孔来评定Cas9编辑活性。在解冻后,将Pan CD3+T细胞(StemCell,HLA-A*02.01/A*03.01)以0.5x10^6个细胞/mL的密度接种于由以下各者构成的T细胞RPMI培养基中:RPMI 1640(Invitrogen,目录号22400-089),含有5%(v/v)胎牛血清、1x Gluatmax(Gibco,目录号35050-061)、50μM 2-巯基乙醇、100uM非必需氨基酸(Invitrogen,目录号11140-050)、1mM丙酮酸钠、10mM HEPES缓冲液、1%的青霉素-链霉素和100U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)。用TransActTM(1∶100稀释,Miltenyi Biotec)活化T细胞。细胞在RNP转染之前在T细胞RPMI培养基中扩增72小时。
将靶向sgRNA的CIITA从其储存板移出,并在95℃下变性2分钟,然后在室温下冷却10分钟。制备20uM sgRNA和10uM重组Cas9-NLS蛋白质(SEQ ID No.36)的RNP混合物并在25℃下温育10分钟。将5μL RNP混合物与20μL P3电穿孔缓冲液(Lonza)中的100,000个细胞组合。将22μL RNP/细胞混合物转移至Lonza shuttle 96孔电穿孔板的相应孔中。用制造商的脉冲码对细胞一式两份地进行电穿孔。电穿孔后立即将T细胞RPMI培养基添加至细胞中。随后在编辑后2天如实施例1中所描述培养并收集经电穿孔的T细胞用于NGS测序。
10.2流式细胞术
在编辑后第10天,T细胞通过流式细胞术表型分型以确定HLAII类蛋白质表达。简言之,在靶向HLA-DR、DQ、DP-PE(目录号361704)和同型对照-AF647(目录号400234)的抗体的混合液中温育T细胞。随后洗涤细胞,在Cytoflex流式细胞仪(Beckman Coulter)上处理并使用FlowJo软件包进行分析。T细胞基于大小、形状、活力和MHC II表达进行门控。如实施例1中所描述,对DNA样本进行PCR和后续NGS分析。
10.3.T细胞的mRNA电穿孔
在CIITA编辑之后,通过用mRNA和引导物电穿孔来测定BC22编辑活性。在解冻后,将从商购获得的白细胞去除产物(StemCell)分离的Pan CD3+T细胞以0.5x10^6个细胞/mL的密度接种于由以下各者构成的T细胞R10培养基中:RPMI 1640(Invitrogen,目录号22400-089),含有10%(v/v)胎牛血清、2mM Gluatmax(Gibco,目录号35050-061)、22μM 2-巯基乙醇、100uM非必需氨基酸(Invitrogen,目录号11140-050)、1mM丙酮酸钠、10mM HEPES缓冲液、1%的青霉素-链霉素外加100U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)。用人类T-活化剂CD3/CD28(ThermoFisher)活化T细胞。细胞在mRNA转染之前在T细胞中扩增72小时。
将CIITA sgRNA从其储存板移出,并在95℃下变性2分钟,然后在室温下冷却10分钟。用P3缓冲液(Lonza)中的100,00个T细胞和10ng/uL编码UGI的mRNA(SEQ ID NO:26)、10ng/uL编码BC22的mRNA(SEQ ID NO:20)和2uM sgRNA来制备五十微升电穿孔混合物。将此混合物转移至Lonza shuttle 96孔电穿孔板的对应孔中。使用Lonza shuttle 96w程序用制造商的脉冲码在重复孔中对细胞进行电穿孔。电穿孔之后立即将具有IL-2的R10培养基添加至细胞中。随后在编辑后10天培养并收集经电穿孔的T细胞用于NGS测序和流式细胞术。如上文针对Cas9 RNP处理的细胞所描述进行流式细胞术。如实施例1中所描述,对DNA样本进行PCR和后续NGS分析。
表31和图22显示使用Cas9和BC22的对于MHC II类蛋白质HLA-DR、DQ、DP的细胞表面表达呈阴性的T细胞的平均百分比与从切割位点至剪接位点边界核苷酸的距离的关系。对于每个引导物,显示具有SpCas9的切割位点的基因组坐标以及受体剪接位点边界核苷酸或供体剪接位点边界核苷酸与切割位点之间的距离(核苷酸的#)。正数值显示在剪接位点边界核苷酸与切割位点之间的5′方向上的核苷酸的数目,而负数值显示在剪接位点边界核苷酸与切割位点之间的3′方向上的核苷酸的数目。
表31:引导物位置与蛋白质敲低效率
实施例11-用BC22n和Cas9筛选HLA-A引导物
通过评定HLA-A细胞表面表达的损失来筛选HLA-A引导RNA在T细胞中的功效。在通过mRNA递送进行HLA-A编辑之后,通过流式细胞术测定HLA-A2背景中对于HLA-A蛋白质呈阴性的T细胞的百分比(“HLA-A2-%”)。
11.1.T细胞的mRNA电穿孔
如下文所提供,使用编码Cas9的mRNA(SEQ ID NO:11)、编码BC22n的mRNA(SEQ IDNO:2)或编码UGI的mRNA(SEQ ID NO:26)的电穿孔来评定Cas9和BC22n编辑活性。在解冻后,将Pan CD3+T细胞(StemCell,HLA-A*02.01/A*02.01)以1x10^6个细胞/mL的密度接种于由以下各者构成的TCGM中:CTS OpTmizer T细胞扩增SFM(Thermofisher,目录号A3705001),补充有5%人类AB血清(Gemini,目录号100-512)、1X GlutaMAX(Thermofisher,目录号35050061)、10mM HEPES(Thermofisher,目录号15630080)、1x青霉素-链霉素,进一步补充有200U/mL IL-2(Peprotech,目录号200-02)、10ng/ml IL-7(Peprotech,目录号200-07)、10ng/ml IL-15(Peprotech,目录号200-15)。用TransActTM(1∶100稀释,Miltenyi Biotec)活化T细胞。细胞在mRNA电穿孔之前在37℃下在T细胞RPMI培养基中扩增72小时。
将HLA-A sgRNA从其储存板移出,并在95℃下变性2分钟,然后在室温下温育5分钟。用P3缓冲液(Lonza)中的100,000个T细胞、200ng编码UGI的mRNA、200ng编码BC22n的mRNA和20pmol sgRNA来制备BC22n电穿孔混合物。用P3缓冲液(Lonza)中的100,000个T细胞、200ng编码UGI的mRNA、200ng编码Cas9的mRNA和20pmol sgRNA来制备Cas9电穿孔混合物。将每个混合物转移至Lonza shuttle 96孔电穿孔板的对应孔中。使用Lonza shuttle96w,使用制造商的脉冲码对细胞重复两次电穿孔。电穿孔后立即在无细胞因子的预温热TCGM中回收细胞并在37℃下温育15分钟。经电穿孔的T细胞随后在进一步补充有200U/mLIL-2(Peprotech,目录号200-02)、10ng/ml IL-7(Peprotech,目录号200-07)、10ng/ml IL-15(Peprotech,目录号200-15)的TCGM中培养并且在编辑后8天收集用于流式细胞术。
11.2.流式细胞术
编辑后第8天,T细胞通过流式细胞术表型分型以确定HLA-A蛋白质表达。简言之,将T细胞与靶向HLA-A2的抗体(eBioscience目录号17-9876-42)一起温育。随后洗涤细胞,在Cytoflex流式细胞仪(Beckman Coulter)上处理并使用FlowJo软件包进行分析。T细胞基于大小、形状、活力和HLA-A2表达进行门控。表32显示在用BC22n或Cas9对HLA-A进行基因组编辑之后对于HLA-A表面蛋白质呈阴性的细胞的百分比。
表32-在用BC22n或Cas9对HLA-A进行基因组编辑之后对于HLA-A表面蛋白质呈阴性的细胞的百分比。
/>
/>
实施例12-用Cas9和BC22进行T细胞编辑、CIITA引导RNA
12.1 T细胞制备
在CIITA基因座处用反式UGI和BC22或Cas9编辑T细胞以评定编辑类型对MHC II类抗原的影响。
遵循制造商方案,使用EasySep人类T细胞分离试剂盒(Stem Cell Technology,目录号17951)从白细胞去除产物制备T细胞。将T细胞冷冻保存于Cryostor CS10冷冻培养基(目录号07930)中以供将来使用。在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者构成的T细胞R10培养基中:RPMI 1640(Corning,目录号10-040-CV),含有10%(v/v)胎牛血清、2mM Glutamax(Gibco,目录号35050-061)、22μM 2-巯基乙醇、100uM非必需氨基酸(Corning,目录号25-025-Cl)、1mM丙酮酸钠、10mM HEPES缓冲液、1%青霉素-链霉素外加100U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)。用人类T-活化剂CD3/CD28(Gibco,目录号11141D)活化T细胞。细胞在mRNA转染之前在T细胞培养基中扩增72小时。
12.2用RNA电穿孔进行T细胞编辑
在无菌水中制备含有编码Cas9蛋白质(SEQ ID NO:8)、BC22(SEQ ID NO:20)或UGI(SEQ ID NO:26)的mRNA的溶液。将50μM靶向sgRNA的CIITA从其储存板移出,并在95℃下变性2分钟,然后在冰上冷却。活化后七十二小时,采集T细胞,离心,并以12.5x10^6个T细胞/mL的浓度重悬于P3电穿孔缓冲液(Lonza)中。对于待电穿孔的每个孔,如表33中所描述,将1x10^5个T细胞与200ng编辑器mRNA、200ng UGI mRNA和20pmol sgRNA在最终体积为20μL的P3电穿孔缓冲液中混合。此混合物一式两份转移至96孔NucleofectorTM板中并使用制造商的脉冲码电穿孔。经电穿孔的T细胞在180ul R10培养基外加100U/mL重组人类白细胞介素-2中静置,然后转移至新平底96孔板中。所得板在37℃下温育4天。在编辑后第10天,收集细胞用于流式细胞术分析和NGS测序。
12.3流式细胞术和NGS测序
在编辑后第10天,T细胞通过流式细胞术表型分型以使用靶向HLA-DR、DQ、DP-PE的抗体(目录号361704)和同型对照-PE(/>目录号400234)确定如实施例6中所描述的MHC II类蛋白质表达。如实施例1中所描述,对DNA样本进行PCR和后续NGS分析。表33显示用BC22编辑的细胞的CIITA基因编辑和MHC II类阴性结果。表34显示用Cas9编辑的细胞的CIITA基因编辑和MHC II类阴性结果。
表33-用BC22进行CIITA编辑之后的编辑百分比和MHC-II阴性细胞的百分比
/>
/>
/>
表34-用Cas9进行CIITA编辑之后的编辑百分比和MHC-II阴性细胞的百分比
/>
/>
*G016111目标序列存在天然存在的C/T单核苷酸多态性。
实施例13-剂量反应和多重编辑
对来自表33的三种引导物G016086、G016092和G016067进一步表征随着引导物的量增加和与靶向TRAC(G013009、G016016或G016017)和B2M(G015991、G015995或G015996)的引导物组合的编辑功效。
如实施例6中所描述,通过以下偏差进行细胞制备、活化和电穿孔。使用两种分别编码BC22(SEQ ID NO:20)和UGI(SEQ ID NO:26)的mRNA物种进行编辑。在多种浓度的sgRNA下评定编辑,如表35和表36中所指示。当在单一反应中使用多种引导物时,每个引导物表示总引导物浓度的四分之一。
在编辑后第10天,T细胞通过流式细胞术表型分型以确定MHC II类蛋白质表达,如实施例6中所描述。另外,通过B2M-FITC抗体(BioLegend,目录号316304)进行B2M检测并且使用CD3-BV605抗体(BioLegend,目录号317322)测定CD3表达。如实施例1中所描述,对DNA样本进行PCR和后续NGS分析。表35提供用BC22和靶向CIITA的个别引导物编辑的细胞的MHCII类阴性流式细胞术结果和NGS编辑,其中图24A绘制C-T转化百分比并且图24B绘制MHC II类阴性百分比。表36显示用CIITA、B2M和TRAC引导物同时编辑的细胞的MHC II类阴性结果。
表35-CIITA编辑之后MHC-II阴性细胞百分比和NGS结果(n=2)
表36-CIITA、TRAC和B2M编辑之后抗原阴性细胞百分比
/>
实施例14.筛选TRAC引导RNA
通过使用含反式UGI的Cas9和含反式UGI的BC22来评定CD3表面表达的敲低来筛选TRAC gRNA在T细胞中的功效。在通过用mRNA和gRNA进行电穿孔进行TRAC编辑之后,测定对于CD3蛋白质呈阴性的T细胞的百分比和在TRAC基因座处编辑的百分比。
实施例14.1.T细胞制备
遵循制造商方案,使用EasySep人类T细胞分离试剂盒(Stem Cell Technology,目录号17951)从白细胞去除产物制备T细胞。将T细胞冷冻保存于Cryostor CS10冷冻培养基(目录号07930)中以供将来使用。在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者构成的T细胞R10培养基中:RPMI 1640(Corning,目录号10-040-CV),含有10%(v/v)胎牛血清、2mM Glutamax(Gibco,目录号35050-061)、22μM 2-巯基乙醇、100uM非必需氨基酸(Corning,目录号25-025-Cl)、1mM丙酮酸钠、10mM HEPES缓冲液、1%青霉素-链霉素外加100U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)。用人类T-活化剂CD3/CD28(Gibco,目录号11141D)活化T细胞。细胞在mRNA转染之前在T细胞培养基中扩增72小时。
实施例14.2.用RNA电穿孔进行T细胞编辑
在无菌水中制备含有编码Cas9蛋白质(SEQ ID NO:8)、BC22(SEQ ID NO:20)或UGI(SEQ ID NO:26)的mRNA的溶液。将50μM靶向sgRNA的TRAC从其储存板移出,并在95℃下变性2分钟,然后在冰上冷却。活化后七十二小时,采集T细胞,离心,并以12.5x10^6个T细胞/mL的浓度重悬于P3电穿孔缓冲液(Lonza)中。对于待电穿孔的每个孔,如表37中所描述,将1x10^5个T细胞与200ng编辑器mRNA、200ng UGI mRNA和20pmol sgRNA在最终体积为20μL的P3电穿孔缓冲液中混合。此混合物一式三份转移至96孔NucleofectorTM板中并且使用制造商的脉冲码电穿孔。经电穿孔的T细胞在180ul R10培养基外加100U/mL重组人类白细胞介素-2中静置,然后转移至新平底96孔板中。所得板在37℃下温育6天。在编辑后第9天,收集细胞用于流式细胞术分析和NGS测序。
实施例14.3.流式细胞术和NGS测序
在编辑后第9天,T细胞通过流式细胞术表型分型以使用靶向CD3的抗体目录号317322)和同型对照-PE/>目录号400269)确定如实施例6中所描述的CD3蛋白质表达。如实施例1中所描述,对DNA样本进行PCR和后续NGS分析。TRAC基因座处的每个编辑类型的平均百分比和用BC22和UGI编辑后的CD3阴性细胞的平均数目显示于表37中;用Cas9和UGI编辑后的结果显示于表38中。C-T编辑纯度计算为仅含有C-T转化的经编辑读段的百分比。
表37-用BC22和UGI进行TRAC编辑后的编辑百分比和CD3阴性细胞的百分比
/>
表38-用Cas9进行TRAC编辑之后的编辑百分比和CD3阴性细胞的百分比
/>
实施例15.筛选TRBC引导RNA
通过使用含反式UGI的Cas9和含反式UGI的BC22来评定CD3表面表达的敲低来筛选TRBC gRNA在T细胞中的功效。在通过用mRNA和gRNA进行电穿孔进行TRBC编辑之后,测定对于CD3蛋白质呈阴性的T细胞的百分比和在TRBC1基因座处的每个类型的编辑的百分比。
实施例15.1.T细胞制备
遵循制造商方案,使用EasySep人类T细胞分离试剂盒(Stem Cell Technology,目录号17951)从白细胞去除产物制备T细胞。将T细胞冷冻保存于Cryostor CS10冷冻培养基(目录号07930)中以供将来使用。在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者构成的T细胞R10培养基中:RPMI 1640(Corning,目录号10-040-CV),含有10%(v/v)胎牛血清、2mM Glutamax(Gibco,目录号35050-061)、22μM 2-巯基乙醇、100uM非必需氨基酸(Corning,目录号25-025-C1)、1mM丙酮酸钠、10mM HEPES缓冲液、1%青霉素-链霉素外加100U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)。用人类T-活化剂CD3/CD28(Gibco,目录号11141D)活化T细胞。细胞在mRNA转染之前在T细胞培养基中扩增72小时。
实施例15.2.用RNA电穿孔进行T细胞编辑
在无菌水中制备含有编码Cas9蛋白质(SEQ ID NO:8)、BC22(SEQ ID NO:20)或UGI(SEQ ID NO:26)的mRNA的溶液。将50μM靶向sgRNA的TRBC从其储存板移出,并在95℃下变性2分钟,然后在冰上冷却。活化后七十二小时,采集T细胞,离心,并以12.5x10^6个T细胞/mL的浓度重悬于P3电穿孔缓冲液(Lonza)中。对于待电穿孔的每个孔,如表39中所描述,将1x10^5个T细胞与200ng编辑器mRNA、200ng UGI mRNA和20pmol sgRNA在最终体积为20uL的P3电穿孔缓冲液中混合。此混合物一式三份转移至96孔NucleofectorTM板中并且使用制造商的脉冲码电穿孔。经电穿孔的T细胞在180ul R10培养基外加100U/mL重组人类白细胞介素-2中静置,然后转移至新平底96孔板中。所得板在37℃下温育6天。在编辑后第9天,收集细胞用于流式细胞术分析和NGS测序。
实施例15.3.流式细胞术和NGS测序
在编辑后第9天,T细胞通过流式细胞术表型分型以使用靶向CD3的抗体(目录号317322)和同型对照-PE(/>目录号400269)确定如实施例6中所描述的CD3蛋白质表达。如实施例1中所描述,对DNA样本进行PCR和后续NGS分析。TRAC基因座处的每个编辑类型的平均百分比和用BC22和UGI编辑后的CD3阴性细胞的平均数目显示于表39中;用Cas9和UGI编辑后的结果显示于表40中。C-T编辑纯度计算为仅含有C-T转化的经编辑读段的百分比。
表39-用BC22进行TRBC编辑之后的编辑百分比和CD3阴性细胞的百分比
/>
/>
/>
表40-用Cas9进行TRBC编辑之后的编辑百分比和CD3阴性细胞百分比
/>
/>
实施例16.在B2M编辑之后剖析RNA脱靶
实施例16.1.T细胞制备
健康人类供体血球分离术是商购获得的(Hemacare),并且将细胞在LOVO装置上洗涤并重悬于PBS/EDTA缓冲液(Miltenyi Biotec目录号130-070-525)中。使用CD4和CD8磁珠(Miltenyi Biotec目录号130-030-401/130-030-801),使用/>Plus和/>LS一次性试剂盒,经由阳性选择分离T细胞。将T细胞等分至小瓶中并冷冻保存于/>CS10(StemCell Technologies目录号07930)中以供将来使用。在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者组成的T细胞生长(TCG)培养基中:CTS OpTmizer T细胞扩增无血清培养基(Thermofisher,目录号A3705001),补充有5%人类AB血清(Gemini,目录号100-512)、1X GlutaMAX(Thermofisher,目录号35050061)、10mM HEPES(Thermofisher,目录号15630080)和1x青霉素-链霉素,进一步补充有200U/mLIL-2(Peprotech,目录号200-02)、10ng/ml IL-7(Peprotech,目录号200-07)、10ng/ml IL-15(Peprotech,目录号200-15)。用TransActTM(1:100稀释,Miltenyi Biotec,目录号130-111-160)活化T细胞。细胞在mRNA电穿孔之前在37℃下扩增72小时。
实施例16.2.T细胞的mRNA和sgRNA电穿孔
在无菌水中制备含有编码Cas9(SEQ ID NO:11)、BC22n(SEQ ID NO:2)、UGI(SEQID NO:26)或BE4MAX(SEQ ID NO:32)的mRNA的溶液。将50μM靶向sgRNA(G015995)的B2M从其储存板移出,并在95℃下变性2分钟,然后在室温下冷却。活化后七十二小时,采集T细胞,离心,并以12.5x10^6个T细胞/mL的浓度重悬于P3电穿孔缓冲液(Lonza)中。对于待电穿孔的每个孔,将1x10^5个T细胞与200ng mRNA和20pmol sgRNA在最终体积为20uL的P3电穿孔缓冲液中混合。T细胞混合物一式五份转移至96孔NucleofectorTM板中并使用制造商的脉冲码电穿孔。经电穿孔的T细胞立即在不含细胞因子的80μL TCG培养基中静置15分钟,然后转移至含有额外100μL补充有在章节16.1中所引用的2X细胞因子的TCG培养基的新平底96孔板中。
为了评估BC22n的表达水平达到峰值时的RNA脱靶,在电穿孔后24小时收集一部分经编辑的T细胞。此部分进一步分成2个板,对其中的一者进行细胞溶解、PCR扩增和NGS分析,而另一部分用于RNA提取和转录组测序。在电穿孔后第3天,收集剩余T细胞用于细胞溶解和NGS测序,这使得能够在编辑正常完成的时间点确认这些样本中的最大B2M编辑。
实施例16.3.NGS测序
在电穿孔后24和72小时,对T细胞进行溶解、B2M基因座的PCR扩增和后续NGS分析,如实施例1中所描述。表41和图25显示在B2M编辑之后在两个时间点处收集的T细胞中的B2M编辑水平。
表41.编辑之后B2M基因座处的平均编辑百分比
/>
实施例16.4.全转录组测序
在电穿孔后24小时,将T细胞离心,并且将细胞团块重悬于200uL TRIzolTM试剂(Thermo Fisher Scientific,目录号15596026)中,其在-80℃下冷冻以供将来处理。遵循制造商的方案,使用Direct-zol RNA微量制备试剂盒(Zymo Research,目录号R2062)从TRIzolTM试剂中的样本提取总RNA。经纯化的RNA样本在NanoDropTM 8000分光光度计(Thermo Fisher Scientific)中定量并使用无核酸酶水稀释至18.18ng/uL。从图25中所显示的每个实验组中,随机选择3个样本以用于转录组分析。根据制造商的说明书,使用rRNA耗竭试剂盒(New England Biolabs,目录号E6350L)从每个样本耗竭100ng(5.5uL)经纯化的总RNA的核糖体RNA(rRNA)组分。遵循制造商的方案,使用/>UltraTMII directional RNA library prep kit for/>(New England Biolabs,目录号E7765S)将耗竭rRNA的样本转化为双链DNA文库。在Qubit 4荧光计(Thermo FisherScientific)中定量扩增的文库,并且通过毛细管电泳获得每个文库的平均片段大小。以等摩尔浓度汇集文库,并且在Illumina NextSeq550平台中使用高输出300-循环试剂盒(Illumina,目录号20024908)进行测序。
实施例16.5.用于单核苷酸变体(SNV)分析的数据处理
用STAR v2.7.1a将双端读段与人类基因组GRCh38进行比对(Dobin等人,2013)。用Picard MarkDuplicates v2.19.0去除PCR重复(BroadInstitute,2019)。连续地部署GATK工具SplitNCigarReads、BaseRecalibrator、ApplyBQSRv4.1.8.1以预处理比对。用GATKHaplotypeCaller调用变体(Auwera等人,2013;DePristo等人,2011;McKenna等人,2010)。使用bcftools v1.8将从相同样本的重复中发现的变体合并(Li,2011)。通过使用vcflibv1.0.0排除对照物中发现的变体来检索样本特异性变体(Garrison,2016)。通过将C至U变体的数目除以每个样本的SNV的总数来计算相对C至U频率。使用不成对t检验比较处理组,并且使用Holm-Sidak方法确定统计显著性,其中α为0.05,而不假定一致标准偏差。
与用Cas9 mRNA处理的样本相比,用Cas9和UGI mRNA、BC22n和UGI mRNA或BE4MAX和UGI mRNA电穿孔的T细胞未显示C-U转换的频率的统计学显著(p<0.05)增加,从而表明在这些样本的转录组中不存在可检测的同源非依赖性胞嘧啶脱氨事件(表42和图26)。
表42-作为C-U转化的RNA转录本中SNV的平均百分比
/>
实施例17.B2M编辑之后经扩增的T细胞基因组的全基因组测序
实施例17.1.T细胞制备
健康人类供体血球分离术是商购获得的(Hemacare),并且将细胞在LOVO装置上洗涤并重悬于PBS/EDTA缓冲液(Miltenyi Biotec目录号130-070-525)中。使用CD4和CD8磁珠(Miltenyi Biotec目录号130-030-401/130-030-801),使用/>Plus和/>LS一次性试剂盒,经由阳性选择分离T细胞。将T细胞等分至小瓶中并冷冻保存于/>CS10(StemCell Technologies目录号07930)中以供将来使用。在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者组成的T细胞生长(TCG)培养基中:CTS OpTmizer T细胞扩增无血清培养基(Thermofisher,目录号A3705001),补充有5%人类AB血清(Gemini,目录号100-512)、1X GlutaMAX(Thermofisher,目录号35050061)、10mM HEPES(Thermofisher,目录号15630080)和1x青霉素-链霉素,进一步补充有200U/mLIL-2(Peprotech,目录号200-02)、10ng/ml IL-7(Peprotech,目录号200-07)、10ng/ml IL-15(Peprotech,目录号200-15)。用TransActTM(1∶100稀释,Miltenyi Biotec,目录号130-111-160)活化T细胞。细胞在mRNA电穿孔之前在37℃下扩增72小时。
实施例17.2.T细胞的mRNA和sgRNA电穿孔
在无菌水中制备含有编码Cas9(SEQ ID NO:11)、BC22n(SEQ ID NO:2)或UGI(SEQID NO:26)的mRNA的溶液。将50μM靶向sgRNA(G015995)的B2M从其储存板移出,并在95℃下变性2分钟,然后在室温下冷却。活化后七十二小时,采集T细胞,离心,并以12.5x10^6个T细胞/mL的浓度重悬于P3电穿孔缓冲液(Lonza)中。对于待电穿孔的每个孔,将1x10^5个T细胞与200ng mRNA和20pmol sgRNA在最终体积为20uL的P3电穿孔缓冲液中混合。T细胞混合物一式8份转移至96孔NucleofectorTM板中并使用制造商的脉冲码电穿孔。经电穿孔的T细胞立即在不含细胞因子的80μL TCG培养基中静置15分钟,然后转移至含有额外100μL补充有2X细胞因子的TCG培养基的新平底96孔板中。
为了促进扩增,使用含1X细胞因子的新鲜TCG培养基,在电穿孔后第3天和第6天分别以1∶4和1∶3的比率分离T细胞。在电穿孔后第7天,收集一部分细胞用于流式细胞术和NGS测序,而将剩余细胞冷冻用于后续单细胞全基因组扩增和测序。
实施例17.3.流式细胞术和NGS测序
在电穿孔后第7天,T细胞通过流式细胞术表型分型以评估用sgRNA G015995编辑之后B2M表达水平的损失。简言之,在4℃下将T细胞与抗CD3(目录号317340)、CD4(/>目录号300537)、CD8(/>目录号344706)和B2M(/>目录号316314)的抗体的混合物一起温育30分钟,以1∶200稀释于细胞染色缓冲液(/>目录号420201)中。随后洗涤细胞,在Cytoflex流式细胞仪(Beckman Coulter)上处理并使用FlowJo软件包进行分析。T细胞基于大小、形状和B2M表达进行门控。表43和图27显示在经编辑T细胞中表达B2M的细胞的百分比。
表43-通过对用不同mRNA组合和B2M sgRNA G015995处理后7天采集的T细胞的流式细胞术分析评定B2M表达的损失(缺少表面标志物的细胞的%)(SD=标准偏差)。
在电穿孔后第7天,也对T细胞进行溶解、B2M基因座的PCR扩增和后续NGS分析,如实施例1中所描述。表44和图28显示B2M编辑之后32个样本(每组一式8份)中的B2M编辑水平。
表44-用不同mRNA组合和B2M sgRNA G015995处理后7天采集的T细胞的B2M编辑百分比(插入/缺失=插入或缺失)。
实施例17.4.单一T细胞分离、溶解、全基因组扩增和测序
从每组8个重复中随机选择一个样本用于单一细胞分离、全基因组扩增和测序。将来自样本12、21和30(表44)的冷冻细胞转移至合同研究组织(Singulomics Corporation,Inc.)中,其中从每个样本分离10个单一T细胞。这些单一T细胞经溶解,并且其基因组根据先前公开的方法使用多重置换扩增(MDA)进行扩增(Dong等人,Nat Methods,2017)。如实施例1中所描述,对经扩增的基因组进行B2M基因座的PCR扩增和后续NGS分析,旨在确认单一T细胞中的经编辑基因型。遵循制造商的方案,从每组10个单一细胞,使用KAPA HyperPlus试剂盒(Roche,目录号07962410001)将6个DNA样本转化成全基因组测序文库。在IlluminaNovaSeq 6000平台中使用S4试剂盒v1.5(Illumina,目录号20028312)对所得18个文库进行测序。
实施例17.5.用于单核苷酸变体(SNV)分析的数据处理
用BWA-MEM v0.7.17将双端读段与人类基因组GRCh38进行比对(Li,2013)。用Picard MarkDuplicates v2.19.0去除PCR重复(Broad Institute,2019)。随后,使用GATKBaseRecalibrator和ApplyBQSR v4.1.8.1校正碱基评分(Auwera等人,2013;DePristo等人,2011;McKenna等人,2010)。使用DeepVariant v1.0.0调用变体(Poplin等人,2018)。通过将C-T变体的总数除以每个样本的SNV的总数来计算相对C-T频率。使用不成对t检验比较处理组,并且使用Holm-Sidak方法确定统计显著性,其中α为0.05,而不假定一致标准偏差。
与用Cas9 mRNA处理的样本相比,用Cas9和UGI mRNA电穿孔的T细胞或用BC22n和UGI mRNA处理的那些未显示在经扩增基因组DNA中C-T转换的频率的统计学上显著(p<0.05)增加,从而表明在这些样本中不存在可检测的同源非依赖性胞嘧啶脱氨事件(表45和图29)。
表45.用不同mRNA组合和靶向sgRNA G015995的B2M在电穿孔后7天采集的来自单一T细胞的经扩增基因组DNA中所有单核苷酸变体(SNV)的C-T转换百分比(SD=标准偏差;NA=不适用)。
实施例18.B2M编辑之后克隆扩增的eHap1细胞的全基因组测序
实施例18.1.eHap1细胞培养
完全单倍体、工程化Hap1(eHap1)细胞是商购获得的(Horizon Discovery目录号C669),并且细胞在由补充有10%(v/v)胎牛血清(Thermofisher目录号A3840001)和1x青霉素-链霉素(Thermofisher目录号15140122)的伊斯科夫改良杜尔贝科培养基(Iscove′sModified Dulbecco’s medium)(Thermofisher目录号12440053)构成的IMDM生长培养基中培养。在解冻后,将eHap1细胞在37℃下培养48小时并在LNP处理之前24小时以6x10^5个细胞/孔的密度接种于6孔板中,其在37℃下温育直至处理。
实施例18.2.eHap1编辑
B2M靶向sgRNA G015991和编码Cas9(SEQ ID NO:11)、BC22n(SEQ ID NO:2)、UGI(SEQ ID NO:26)或BE4MAX(SEQ ID NO:32)的mRNA配制为如实施例1中所描述的LNP中的个别RNA物种。将LNP以与以下总RNA浓度的不同组合施用至T细胞:0.104μg/mL编辑器mRNA;0.55μg/mL UGI mRNA;0.4175μg/mL sgRNA。将不同LNP组合(表46)预混合在补充有10μg/mL重组人类ApoE3(Peprotech目录号350-02)的IMDM生长培养基中,并在37℃下温育15分钟。去除eHap1细胞的培养基并且每个孔接受3mL LNP混合物。未处理的对照接受3mL补充有10μg/mL ApoE3而不含LNP的IMDM生长培养基。细胞在37℃下温育24小时并且去除培养基并用IMDM生长培养基替换。
在处理后三天和五天,将eHap1细胞分离,以较低密度重新接种,并返回至37℃温育箱。在5天时间点,用抗B2M抗体(BioLegend目录号316304)染色一部分细胞以通过流式细胞术评估B2M表达的损失。将这些细胞在4℃下与在细胞染色缓冲液(目录号420201)中以1∶200稀释的抗B2M抗体一起温育30分钟。随后洗涤细胞,在Cytoflex流式细胞仪(Beckman Coulter)上处理并使用FlowJo软件包进行分析。eHap1细胞基于大小、形状和B2M表达进行门控。表46和图30显示经编辑的eHap1细胞中B2M蛋白质表达水平。
表46-在B2M处用不同mRNA组合编辑之后B2M阴性eHap1细胞的平均百分比。
在处理之后七天,将eHap1细胞分离,汇集每个处理组的重复物并且离心所得细胞悬浮液。如实施例1中所描述,收集来自每个池的一小部分细胞用于批量NGS测序。表47和图31显示这些样本中的B2M编辑水平。将剩余eHap1细胞与抗B2M(BioLegend目录号316304)的抗体混合,以1∶200(v/v)稀释于细胞染色缓冲液(目录号420201)中并在4℃下温育30分钟。随后在MA900荧光活化细胞分选(FACS)仪器(Sony Biotechnology)中洗涤和处理细胞。对于B2M表达呈阴性的单一细胞个别地接种于96孔板中。对于未处理的对照,接种具有B2M表达的阳性信号的单一细胞。单一细胞在37℃下温育10天以允许建立和扩增单一细胞克隆。
表47-用不同mRNA组合和B2M sgRNA G015991处理之后eHap1细胞的B2M编辑结果(NGS测序)(插入/缺失=插入或缺失)。
实施例18.3.克隆扩增、基因组DNA的提取和全基因组测序
在培养10天后,在倒置荧光显微镜下目测检查克隆。将来自每个处理组的十二个克隆转移至6孔板,以使得能够进一步扩增。如实施例1中所描述收集来自每个克隆的一小部分细胞用于NGS测序,同时将剩余细胞接种于6板中并且在37℃下培养直至达到汇合。基于其在靶编辑结果,选择每组5个克隆进行全基因组测序。除eHap1细胞的一个非克隆样本以外,将来自所有克隆群体的细胞溶解,并且遵循制造商的方案,使用DNeasy血液和组织试剂盒(Qiagen目录号69504)提取其基因组DNA。遵循制造商的说明书,使用KAPA HyperPlus试剂盒(Roche,目录号07962410001)将DNA样本转化成全基因组测序文库。在IlluminaNovaSeq 6000平台中使用S4试剂盒v1.5(Illumina,目录号20028312)对所得36个文库进行测序。
实施例18.4.用于单核苷酸变体(SNV)分析的数据处理
首先用bwa(v0.7.17)将来自每个样本的读段与人类基因组构建hg38进行比对(Li,2013;Li和Durbin,2010)。用samtools(v1.11)模块fixmate、sort和markdup连续处理比对(Kumaran等人,2019;Li等人,2009)。使用DeepVariant(v1.0.0)从经处理的比对调用变体(Poplin等人,2018)。接着使用GLnexus(v1.3.1)合并来自每个样本的变体(Lin等人,2018;Yun等人,2021)。从所有克隆样本排除eHap1细胞的非克隆样本中出现的变体。也忽略读段深度低于10或基因型质量评分低于15的变体。通过将C-T变体的总数除以每个样本的SNV的总数来计算相对C-T频率。使用不成对t检验比较处理组,并且使用Holm-Sidak方法确定统计显著性,其中α为0.05,假定一致标准偏差。
与未处理的对照相比,在UGI mRNA不存在或存在的情况下,用Cas9、BC22n或BE4MAX mRNA处理的eHap1细胞并未显示在基因组中C-T转换的频率的统计学显著(p<0.05)增加,从而表明在这些样本中不存在可检测的同源非依赖性胞嘧啶脱氨事件(表48和图32)。
表48-在B2M处用不同mRNA组合编辑之后克隆扩增的eHap1细胞中所有单核苷酸变体(SNV)中C-T转换的百分比(NA=不适用)。
实施例19.经由电穿孔或LNP递送后在T细胞中用BC22n或Cas9进行同时四重编辑
为评定与递送条件和通过Cas9或碱基编辑器编辑相关的结构基因组变化的量,将T细胞用电穿孔处理以递送RNP或用脂质纳米粒子(LNP)处理以递送四种引导物,并且分析Cas9或BC22n的细胞活力、DNA双链断裂、编辑、表面蛋白质表达和染色体结构。
实施例19.1.T细胞制备
健康人类供体血球分离术是商购获得的(Hemacare),并且将细胞在LOVO装置上洗涤并重悬于PBS/EDTA缓冲液(Miltenyi Biotec目录号130-070-525)中。使用EasySepTM人类T细胞分离试剂盒(Stemcell目录号17951)经由阴性选择分离T细胞。将T细胞等分至小瓶中并冷冻保存于/>CS10(StemCell Technologies目录号07930)和Plasmalyte A(Baxter目录号2B2522X)的1∶1制剂中以供将来使用。
在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于基于OpTmizer的培养基中,所述培养基含有CTS OpTmizer T细胞扩增SFM和T细胞扩增补充物(ThermoFisher目录号A1048501)、5%人类AB血清(GeminiBio,目录号100-512)、1X青霉素-链霉素、1XGlutamax、10mM HEPES、200U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、5ng/ml重组人类白细胞介素7(Peprotech,目录号200-07)和5ng/ml重组人类白细胞介素15(Peprotech,目录号200-15)。T细胞在此培养基中用TransActTM(1∶100稀释,MiltenyiBiotec)活化72小时,此时将其洗涤并且一式四份接种以用于通过电穿孔或脂质纳米粒子编辑。
实施例19.2.用脂质纳米粒子进行单一gRNA和4gRNA T细胞编辑
LNP通常如实施例1用单一RNA物种货物配制。货物是选自编码BC22n的mRNA、编码Cas9的mRNA、编码UGI的mRNA、靶向B2M的sgRNA G015995、靶向TRAC的sgRNA G016017、靶向TRBC的sgRNA G016200或靶向CIITA的sgRNA G016086。每个LNP在37℃下在基于OpTmizer的培养基中温育15分钟,所述培养基具有如上文所描述的细胞因子,补充有20ug/ml重组人类ApoE3(Peprotech,目录号350-02)。活化后七十二小时,将T细胞洗涤并悬浮于具有细胞因子而无人类血清的OpTmizer培养基中。对于单一sgRNA编辑条件,将预温育的LNP混合物添加至100,000个细胞的每个孔中,以产生2.3ug/ml编辑器mRNA(BC22n或Cas9)、1.1ug/mLUGI和4.6ug/uL G016017的最终浓度。对于四重sgRNA编辑,将LNP混合物添加至100,000个细胞的每个孔中,以产生2.3ug/ml编辑器mRNA(BC22n或Cas9)、1.1ug/mL UGI、1.15ug/uLG015995、1.15ug/uL G016017、1.15ug/uL G016200和1.15ug/uL G016086的最终浓度。还包括对照组,其包括未经编辑的T细胞(无LNP)。在递送后16小时,使用细胞子集来测量细胞活力,并且处理另一细胞子集以用于γH2AX病灶成像。剩余T细胞在培养物中继续扩增。在活化后5天和8天以及活化后第十一天更换培养基,采集细胞以通过NGS、流式细胞术和UnIT进行分析。如同实施例1进行NGS。
实施例19.3.用mRNA电穿孔进行单一gRNA和4gRNA T细胞编辑
在活化后72小时进行电穿孔。靶向B2M的sgRNA G015995(SEQ ID NO:182)、靶向TRAC的sgRNA G016017(SEQ ID NO:184)、靶向TRBC的sgRNA G016200(SEQ ID NO:801)和sgRNA G016086(SEQ ID NO:586)在95℃下变性2分钟,然后在室温下冷却10分钟。采集T细胞,离心,并以12.5x10^6个T细胞/mL的浓度重悬于P3电穿孔缓冲液(Lonza)中。对于单一sgRNA编辑条件,将1x10^5个T细胞与40ng/uL编辑器mRNA(BC22n或Cas9)、10ng/uL UGImRNA和80pmol sgRNA在最终体积为20uL的P3电穿孔缓冲液中混合。对于四重sgRNA编辑条件,将1x10^5个T细胞与40ng/uL编辑器mRNA(BC22n或Cas9)、10ng/uL UGI mRNA和20pmol四种个别sgRNA在最终体积为20uL的P3电穿孔缓冲液中混合。此混合物一式四份转移至96孔NucleofectorTM板中并使用制造商的脉冲码电穿孔。经电穿孔的T细胞在80ul具有细胞因子的基于OpTmizer的培养基中静置,然后转移至新平底96孔板中。也包括对照组,其包括未经编辑的T细胞(无EP)。在递送后16小时,使用细胞子集来测量细胞活力,并且处理另一细胞子集以用于γH2AX病灶成像。
实施例19.4.经由Cell Titer Glo的相对活力
电穿孔或脂质纳米粒子递送后十六小时,从原始板去除20uL对照或编辑细胞并且添加至具有黑色壁的新平底96孔板(Corning目录号3904)。添加2.0(Promega目录号G9241)并且根据制造商的方案处理样本。相对发光单元(RLU)由CLARIstarplus(BMG Labtech)读板器读出,其中增益设定为3600。如表49和图33中所显示的相对活力是通过将所有样本RLU除以未处理的对照RLU的平均值来计算。所有电穿孔条件的活力均相比于未处理的对照水平下降了大于5倍,而LNP处理即使在同时对4种引导物进行编辑时也维持接近未处理的对照样本的细胞活力。
表49-用各种编辑和递送条件处理之后16小时的相对细胞活力
实施例19.5.γH2AX病灶的染色、成像和定量
电穿孔或脂质纳米粒子递送后16小时,使用Cytospin 4(Thermo Fisher)将T细胞细胞离心至载玻片上。在冰上在PBS/0.5%Trion X-100中预提取5分钟后,将细胞固定在4%多聚甲醛中10分钟。接着,将细胞在PBS中洗涤若干次并在PBS/0.1%TX-100/1%BSA中封闭30分钟。将初级抗体(小鼠抗磷酸-组蛋白H2A.X(Ser139)(Millipore目录号05-636)在4℃下在封闭缓冲液中温育过夜。在PBS/0.05%Tween-20中洗涤三次后,将二级抗体(山羊抗小鼠IgG Alexa 568(Thermo Fisher目录号A31556)在室温下在封闭缓冲液中温育30分钟。细胞在PBS/0.05%Tween-20中洗涤,并且细胞核用Hoechst 33342进行对比染色。通过共焦成像用Leica SP8产生图像。经由常规方案在Thermo Scientific HCS Studio CellAnalysis Software Spot Detector模块上进行图像分析。表50和图34显示在用所述编辑和递送条件处理之后,每个细胞核的总γH2AX光点强度。与LNP Cas9-4引导物样本相比,EPCas9与4种引导物样本显示每个细胞核的gH2AX病灶显著增加。
表50-用各种编辑和递送条件处理之后,每个细胞核的平均总γH2AX光点强度
实施例19.6.流式细胞术和NGS测序
在编辑后第8天,T细胞通过流式细胞术表型分型以使用靶向B2M-APC/FireTM 750(目录号316314)、CD3-BV605(/>目录号316314)和HLA II-DR、DP、DQ-PE(/>目录号361716)的抗体确定如实施例6中所描述的B2M、CD3和HLA II-DR、DP、DQ蛋白质表达。如实施例1中所描述,对DNA样本进行PCR和后续NGS分析。表51和图35显示在用LNP处理之后,所关注基因座的编辑百分比。在由LNP递送4种引导物的情况下,BC22n的每个基因座处的编辑百分比高于Cas9。表52和图36显示LNP处理之后的所关注表面蛋白表达。相比于用Cas9编辑,用BC22n编辑产生更大百分比的三重敲除细胞。
表51-在通过LNP递送用所述编辑方案处理之后的平均编辑百分比。
/>
表52-在通过LNP递送用所述编辑方案处理之后表达表面的细胞的平均百分比。
实施例19.7.通过UnIT测量结构变异和易位
在编辑后第8天,收集来自未处理的LNP-Cas9-4引导物和LNP-BC22n-4引导物样本的T细胞子集,短暂离心并重悬于100uL PBS中。使用DNeasy血液和组织试剂盒(Qiagen目录号69504)从细胞分离gDNA。将UnIT结构变异表征测定应用于这些gDNA样本。高分子量基因组DNA用Tn5转座酶和具有部分Illumina P5序列和12bp独特分子标识符(UMI)的转接子同时进行片段化和序列标记(‘片段化标记(tagmented)’)。使用P5引物和半嵌套基因特异性引物(GSP)的两个连续PCR将P7序列赋予Illumina,以产生每个样本两个Illumina相容性NGS文库。用两个文库对CRISPR/Cas9靶向切割位点的两个方向进行测序允许推断和定量基因组编辑之后DNA修复结果中的结构变异。如果两个片段与不同染色体比对,则将SV归类为“染色体间易位”。结构变异结果表明,当通过BC22n进行多重编辑时,染色体间易位降至背景水平,而Cas9多重编辑使得结构变异显著增加,如表53和图37中所显示。
表53-在通过LNP递送用所述编辑方案处理之后总独特分子标识符中的染色体间易位的平均百分比。
实施例20-用Cas9和BC22n在T细胞中进行CD38引导RNA筛选
实施例20.1T细胞制备
在CD38基因座处用Cas9或BC22n和UGI mRNA编辑T细胞以评定编辑结果和CD38表达的对应损失。
健康人类供体血球分离术是商购获得的(Hemacare),并且将细胞在LOVO装置上洗涤并重悬于CliniMACS PBS/EDTA缓冲液(Miltenyi Biotec,目录号1 30-070-525)中。使用CD4和CD8磁珠(Miltenyi Biotec,目录号130-030-401/130-030-801)使用CliniMACS Plus和CliniMACS LS一次性试剂盒,经由阳性选择分离T细胞。将T细胞等分至小瓶中并冷冻保存于Cryostor CS10(StemCell Technologies,目录号07930)中以供将来使用。在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者构成的T细胞X-VIVO 15扩增培养基中:X-VIVO 15(Lonza,目录号BE02-06Q),含有5%(v/v)胎牛血清(ThermoFisher,目录号A3160902)、50μM(1X)2-巯基乙醇(ThermoFisher,目录号31350010)、1%青霉素-链霉素(ThermoFisher,目录号15140122)、1M N-乙酰基L-胱氨酸(Fisher,目录号ICN19460325),稀释于磷酸盐缓冲盐水(PBS)中并且归一化至pH 7,补充有100U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、5ng/mL重组人类白细胞介素-7(Peprotech,目录号200-07)和5ng/mL重组人类白细胞介素-15(Peprotech,目录号200-15)。用TransActTM(1∶100稀释,Miltenyi Biotec,目录号130-111-160)活化T细胞。细胞在mRNA电穿孔之前在37℃下扩增72小时。
实施例20.2用RNA电穿孔进行T细胞编辑
在无菌水中制备含有编码Cas9蛋白质、BC22n或UGI的mRNA的溶液。将50μM靶向sgRNA的CD38从其储存板移出,并在95℃下变性2分钟,并且在室温下温育5分钟。活化后七十二小时,采集T细胞,离心,并以12.5x10^6个T细胞/mL的浓度重悬于P3电穿孔缓冲液(Lonza)中。如实施例1中所描述制备信使RNA。对于待电穿孔的每个孔,如表54中所描述,将1x10^5个T细胞与200ng Cas9或BC22n mRNA、200ng UGI mRNA和20pmol sgRNA在最终体积为20μL的P3电穿孔缓冲液中混合。此混合物一式两份转移至96孔NucleofectorTM板中并使用制造商的脉冲码电穿孔。经电穿孔的T细胞立即在不含细胞因子的80μL X-VIVO 15培养基中静置15分钟,然后转移至含有额外90μL补充有2X细胞因子的X-VIVO 15培养基的新平底96孔板中。所得板在37℃下温育10天。为了促进扩增,使用含1X细胞因子的新鲜X-VIVO15培养基,在电穿孔后第3天和第6天分别以1∶4和1∶3的比率分离T细胞。在电穿孔后第9天,将细胞以1∶2分成2个U形底板,并且收集一个板用于NGS测序,而另一板在第10天用于流式细胞术。
实施例20.3流式细胞术和NGS测序
编辑后第10天,T细胞通过流式细胞术表型分型以确定CD38受体表达。简言之,在4℃下将T细胞与抗CD3(BioLegend,目录号317340)、CD4(BioLegend,目录号300537)、以1∶200稀释的CD8(BioLegend,目录号344706)和CD38(BioLegend,目录号303546)的抗体的混合物一起温育30分钟,以1∶100稀释于细胞染色缓冲液(BioLegend,目录号420201)中。随后洗涤细胞并用以1∶10,000稀释于细胞染色缓冲液中的活力抗体DAPI(BioLegend,目录号422801)染色。接着细胞在Cytoflex流式细胞仪(Beckman Coulter)上处理并使用FlowJo软件包进行分析。T细胞基于大小、形状、活力和CD38表达进行门控。
在第9天,对DNA样本进行PCR和后续NGS分析,如实施例1中所描述。表54显示用BC22n或Cas9编辑的细胞的CD38基因编辑和CD38阳性结果。
表54-用Cas9或BC22n碱基编辑器进行CD38编辑之后的编辑百分比和CD38阳性细胞的百分比
/>
/>
无数据意指样本在所有重复物中都具有技术故障。N.A.在仅一个重复物可用时使用并且因此其不适用于计算标准偏差。
实施例21.用Nme2Cas9碱基编辑器和HepG2细胞中经化学修饰的sgRNA进行碱基编辑
用HepG2细胞中的各种引导物设计测试包含融合到Nme2Cas9 D16A切口酶的APOBEC3A脱氨酶结构域的碱基编辑器构建体的碱基转化效率。
HepG2细胞组成性过表达溶质载剂家族10成员1(SLC10A1)(HepG2-NTCP,Seeger等人,Mol Ther Nucleic Acids.2014年12月;3(12):e216)经解冻并重悬于补充有10%胎牛血清(FBS)的杜尔贝科改良伊格尔培养基(DMEM)(培养基Y)中,然后离心。丢弃上清液并且将细胞重悬于培养基Y中,并且以25,000个细胞/孔的密度将96孔胶原蛋白包被的板(Corning,目录号354407)接种于100uL培养基Y中。
Nme2Cas9碱基编辑器mRNA基本上如实施例1中所描述从编码SEQ ID No:304(2XNLS N末端,1xC末端NLS Nme2Cas9碱基编辑器)、SEQ ID No:310(2XNLS N末端,NLSNme2Cas9碱基编辑器)和SEQ ID No:301(1X C末端NLS Nme2Cas9碱基编辑器)的质粒通过体外转录制备。使用相同方法从质粒转录SpyCas9 mRNA和尿嘧啶糖苷酶抑制剂(UGI)mRNA(SEQ ID No:34)。
使用常规方法合成具有不同PAM序列(G020927、G020928)或VEGF(G020073)的靶向NTCP的经化学修饰的NmeCas9 sgRNA和靶向NTCP的SpyCas9 sgRNA(G020929)。
靶向NTCP的经测试NmeCas9 sgRNA包括24个核苷酸引导序列(如由N表示)和如下的引导骨架:mN*mNNNNNNNNmNNNmNNNNNNNNNNNNmGUUGmUmAmGmCUCCCmUmGmAmAmAmCmCGUUmGmCUAmCAAU*AAGmGmCCmGmUmCmGmAmAmAmGmAmUGUGCmCGCmAmAmCmGCUCUmGmCCmUmUmCmUGmGCmAmUC*mG*mU*mU(SEQ ID NO:522),除非另外指示,否则其中A、C、G、U和N分别为腺嘌呤、胞嘧啶、鸟嘌呤、尿嘧啶和任何核糖核苷酸。m指示2′O-甲基修饰,并且*指示核苷酸之间的硫代磷酸酯键联。引导物的未经修饰和经修饰的版本提供于表5C中。将引导RNA、编辑器mRNA和UGI mRNA以1∶1∶1重量比与含有分别为50∶38∶9∶3摩尔比的脂质A、胆固醇、DSPC和PEG2k-DMG的预混合转染试剂混合。试剂以约6.0的脂质胺与RNA磷酸(N∶P)摩尔比组合。RNA-脂质混合物与10%FBS培养基近似1∶1混合并温育10分钟。温育后,从400ng总编辑器RNA/孔开始,以8点、2倍连续稀释用RNA-脂质混合物处理细胞。
处理后72小时,溶解细胞以进行NGS分析,如实施例1中所提供。
编辑效率对引导物浓度的剂量反应一式三份进行。表55显示所计算的平均编辑百分比[在每个引导物浓度下和经计算的EC50值。VEGFA中的目标位点由于高GC含量而易于形成插入/缺失。所有编辑器mRNA实现相同的最大C-T编辑。EC50存在轻微差异,其中SEQ IDNo:310mRNA胜过SEQ ID No:304和SEQ ID No:301。
表55.VEGFA基因座(G020073)和Nme2Cas9碱基编辑器处HepG2-NTCP细胞中的平均编辑百分比
/>
实施例22.用PMH中经化学修饰的sgRNA进行碱基编辑
用原代小鼠肝细胞(PMH)中的各种引导物设计测试包含融合到Nme2Cas9切口酶的APOBEC3A脱氨酶结构域的碱基编辑器构建体的碱基转化效率。
PMH(In Vitro ADMET Laboratories,目录号MC148)经解冻并重悬于50mL经冷冻保存的Hepatocyte Recovery Media(CHRM)(Invitrogen,CM7000)中,然后离心。细胞通过接种补充剂重悬于肝细胞培养基中:具有FBS含量的Williams′E Medium PlatingSupplements(Gibco,目录号A13450)。细胞通过离心形成团块,重悬于培养基中,并且以20,000个细胞/孔的密度接种于经Bio-coat胶原蛋白I包被的96孔板(Corning#354407)上。使接种的细胞在37℃和5%CO2气氛下在组织培养温育箱中静置并粘附4-6小时。在温育后,检查细胞的单层形成并洗涤一次,并用100uL肝细胞维持培养基接种:Williams′E Medium(Gibco,目录号A12176-01)外加补充剂包(Gibco,目录号CM3000)。
Nme2Cas9碱基编辑器mRNA、SEQ ID No:304、SEQ ID No:310和SEQ ID No:301;和尿嘧啶糖苷酶抑制剂(UGI)mRNA(SEQ ID No:34)如实施例1中所描述来制备并且与靶向小鼠TTR的一系列经化学修饰的sgRNA成对并以128ng碱基编辑器mRNA的单次剂量筛选。处理后72小时,溶解细胞以进行NGS分析,如实施例1中所提供。代表性引导物的平均编辑(编辑类型的比率)显示于表56中。
表56-使用靶向TTR基因座的经修饰gRNA和Nme2Cas9碱基编辑器的PMH细胞中的平均编辑百分比。当报告仅1个重复物时,“n/a”意指SD不适用。
实施例23.用gRNA进行体内碱基编辑
在小鼠模型中用Nme2Cas9碱基编辑器构建体测试具有不同mRNA的经修饰的gRNA的编辑效率。
LNP通常如同实施例1用单一RNA物种作为货物制备。用分别为50:38:9:3摩尔比的脂质A、胆固醇、DSPC和PEG2k-DMG制备所使用LNP。用约6的脂质胺与RNA磷酸酯(N:P)摩尔比来配制LNP。LNP如实施例1中所描述配制,不同之处在于每个组分、引导RNA或mRNA个别地配制于LNP中,并且LNP在施用之前混合,如表57中所描述。对于Nme2Cas9和Nme2Cas9碱基编辑器样本,LNP以按gRNA与编辑器mRNA货物的重量计2∶1的比率混合。对于SpyCas9碱基编辑器样本,LNP以按gRNA与编辑器mRNA货物的重量计1∶2的比率混合。如表57和图38中所指示的剂量基于gRNA与编辑器mRNA的组合RNA重量计算。用额外0.03mpk UGI mRNA处理碱基编辑器样本。用于LNP制备的运输和储存溶液(TSS)在实验中作为仅媒介物阴性对照给药。
包括接头的测试NmeCas9 gRNA(G021844)具有(N)24的以下修饰模式:GUUGmUmAmGmCUCCCmUmUmC(L1)mGmAmCmCGUUmGmCUAmCAAU*AAGmGmCCmGmUmC(L1)mGmAmUGUGCmCGmCAAmCGCUCUmGmCC(L1)GGCAUCG*mU*mU(SEQ ID NO:519),除非另外指示,否则其中A、C、G、U和N分别为腺嘌呤、胞嘧啶、鸟嘌呤、尿嘧啶和任何核糖核苷酸。m指示2′O-甲基修饰,并且*指示核苷酸之间的硫代磷酸酯键联。引导物的未经修饰和经修饰版本提供于表5C(序列表)中。
将6-10周龄范围内的CD-1雌性小鼠用于涉及小鼠的每个研究中(除了TSS对照n=4之外,n=5/组)。根据表57中所列出的剂量,经由尾部静脉注射静脉内施用制剂。在给药后至少24小时,定期观测动物的不良反应。处理之后六天,在异氟烷麻醉下通过心脏穿刺将动物安乐死;收集肝脏组织用于下游分析。收集重量在5与15mg之间的肝脏穿孔以分离基因组DNA和总RNA。使用DNA分离试剂盒(ZymoResearch,D3010)提取基因组DNA并且用NGS测序分析样本,如实施例1中所描述。含有所指示gRNA的LNP的编辑效率显示于表57中并且说明于图38中。
表57-小鼠肝脏中的平均编辑百分比。
实施例24.C-T脱氨酶碱基编辑筛选
根据C-T转化活性的效率评估候选脱氨酶-Cas9融合构建体。将所有实验脱氨酶C-T转化活性与编码BE3的构建体BC27对照比较(Komor AC,Kim YB,Packer MS,Zuris JA,LiuDR.Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage.Nature.2016;533(7603):420-424)。总计,如表58中所提及的56种脱氨酶-Cas9融合构建体各自在单一实验中针对sg005883一式三份地评估。设计构建体并且进行如实施例1A中所描述的方法。
表59和图39显示所有测试的碱基编辑器构建体中含有至少1个胞嘧啶至胸苷转化的全部读段的百分比。
表58-在碱基编辑器活性筛选中测试的脱氨酶
/>
/>
/>
表59对于sg005883含有至少1种胞嘧啶至胸苷转化的总读段的百分比。(n=3)
实施例25.当在U-2OS细胞中由质粒表达时,通过具有各种接头的构建体进行碱基编辑
将表60中所列出的涵盖各种长度和柔性的一组六十八个氨基酸接头编码于如实施例1A中所提及的表达质粒BC27的N末端胞嘧啶脱氨酶与C末端Cas9切口酶之间的区中。表58中所描述的所选碱基编辑器构建体通过用来自表60的接头取代胞嘧啶脱氨酶结构域与Spy Cas9切口酶结构域之间的XTEN接头而重新设计。使用具有目标序列UCCCUGGCUGAGGAUCCCCA(SEQ ID NO:157)的sg001373进行BC27接头筛选。使用具有目标序列CCCCCCGCCGUGUUUGUGGG(SEQ ID NO:159)的sg005883进行另一10个脱氨酶结构域接头筛选。
表60.在接头活性筛选中测试的六十八个氨基酸接头。
/>
/>
使用pUC19主链(登录号U47119)的质粒A表达来自U6启动子的化脓性链球菌单引导RNA(sgRNA)。称为pCI的质粒B表达来自CMV启动子的碱基编辑器构建体,其由通过实验接头融合到化脓性链球菌-D10A-Cas9的候选脱氨酶构成,所述实验接头随后融合到UGI的一个拷贝和SV40 NLS的一个拷贝。使用Mirus/>用质粒A和质粒B各100ng对在96孔板中在补充有10%胎牛血清(FBS)的杜尔贝科改良伊格尔培养基(DMEM)中生长的U-2OS细胞进行转染。在初始转染之后24小时添加100uL新鲜培养基。在额外48小时后,去除培养基并且用QuickExtractTM DNA提取溶液(Lucigen,目录号QE09050)溶解细胞。表61A和表61B列出所有测试的脱氨酶结构域中含有至少1种胞嘧啶至胸苷转化的全部读段的百分比并且代表性数据显示于图40A至图40K中。
表61A.含有至少1种胞嘧啶至胸苷转化的总读段的百分比(C-T%)
/>
/>
/>
/>
表61B.含有至少1种胞嘧啶至胸苷转化的总读段的平均百分比(C-T%)
/>
/>
/>
/>
/>
实施例26.通过在Huh-7细胞中具有各种接头的构建体进行碱基编辑
使用mRNA和gRNA的脂染胺转染测定衍生自BC22但具有经取代于胞嘧啶脱氨酶与Cas9切口酶之间的来自表60的接头的选择碱基编辑器构建体的C-T碱基编辑活性。所测试的碱基编辑器mRNA包括SEQ ID NO:19和347-357。构建体在150ng至1.17ng范围内的Huh-7细胞中的碱基编辑器mRNA的稀释系列中经筛选,在100uL培养基中与20至0.15nM范围内的SERPINA1 sgRNA(G000255)和25至0.20ng的剂量的UGI mRNA(SEQ ID No:25)的稀释系列共递送。将每个构建体的C-T碱基编辑与BC22(SEQ ID No:19)进行比较。
实施例26.1.细胞制备和转染
在100uL培养基中以150ng碱基编辑器mRNA、25ng UGI mRNA和20nM sgRNA的最大剂量开始,使用RNAiMAX,以8点、两倍稀释系列转染96孔板中补充有10%胎牛血清(FBS)的杜尔贝科改良伊格尔培养基(DMEM)中生长的Huh-7细胞。
实施例26.2.通过NGS评估C-T编辑纯度
转染后七十二小时,对Huh-7细胞进行溶解、SERPINA1基因座的PCR扩增和后续NGS分析,如实施例1中所描述。表62和图41显示用2.3或75ng不同碱基编辑器mRNA和对应水平的经稀释UGI mRNA和G000255(SERPINA1)处理的样本中的SERPINA1编辑水平和C-T编辑纯度。具有不同接头的碱基编辑器mRNA的C-T转化平均百分比显示于表63A至表63B中。表64和图42显示在9.7至23.1ng范围内的EC90(编辑90%的最大C-T编辑所需的碱基编辑器mRNA的质量)。所有经测试的碱基编辑器mRNA在高剂量下具有类似水平的最大编辑。
表62-Huh-7中SERPINA1处的平均编辑百分比,插入/缺失=插入或缺失。
表63A-Huh-7细胞中SERPINA1处的平均C-T编辑百分比。
表63B-Huh-7细胞中SERPINA1处的平均C-T编辑百分比。
表64-在SERPINA1处产生90%的最大C-T编辑的BC22 mRNA的质量。还显示了每个EC90值的95%置信区间。
实施例27.在原代人类肝细胞(PHH)中通过具有各种接头的构建体进行碱基编辑
在PHH中测定衍生自BC22n但具有经取代于胞嘧啶脱氨酶与Cas9切口酶之间的来自表65的接头的选择碱基编辑器构建体的C-T碱基编辑活性。构建体(SEQ ID NO:341-346)在PHH细胞中的碱基编辑器mRNA的12点稀释系列中经筛选,与固定质量的ANAPC5 sgRNA(G019427)和UGI mRNA(SEQ ID NO:34)共递送。将每个基于测试的编辑器构建体的C-T编辑效率与BC22n(SEQ ID NO:1)进行比较。
表65-额外接头肽。
实施例27.1.细胞制备和转染
将PHH细胞解冻并在CHRM培养基(Gibco,目录号CM7000)中回收。接着将其重悬于原代肝细胞接种培养基(由William′s E培养基(Gibco,目录号A1217601)和原代肝细胞接种补充剂(Gibco,目录号CM3000)组成))中以33,000个细胞/孔的密度接种于经胶原蛋白包被的96孔板中二十四小时。在二十四小时后,洗涤细胞,并且在细胞上添加新鲜原代肝细胞维持培养基。细胞接着与个别地与UGI mRNA(SEQ ID No:34)、ANAPC5 sgRNA G019427或碱基编辑器mRNA一起形成的单独脂复合体同时转染。
脂质体转染试剂制备为50/9/38/3脂质A、DSPC、胆固醇和PEG2k-DMG的比率的脂质混合物,如实施例1中所描述。通过分别与每一RNA物种批量混合来组合脂质体转染试剂:碱基编辑器mRNA、UGI mRNA或gRNA G019427。物质以约6的脂质胺与RNA磷酸(N∶P)摩尔比组合。所得批量混合脂复合体材料(脂质试剂盒)在添加至肝细胞之前与10%FBS(Gibco;A3160501)一起在原代肝细胞维持培养基(由William′s E培养基(Gibco,目录号A1217601)和原代肝细胞维持补充剂(Gibco,目录号CM4000)组成)中预温育15分钟。
每个孔接受最终体积为100uL的三种组分:在400ng至0ng mRNA范围内的碱基编辑器mRNA、30ng UGI mRNA和5pmol G019427(ANAPC5)。
实施例27.2通过下一代测序(NGS)评估C-T编辑纯度
转染后七十二小时,对PHH细胞进行溶解、ANAPC5基因座的PCR扩增和后续NGS分析,如实施例1中所描述。表66和图43显示除30ng UGI mRNA(SEQ ID No:34)和5pmolG019427(ANAPC5)以外,用400或6.25ng不同碱基编辑器mRNA处理的样本中的ANAPC5总编辑水平和C-T编辑纯度。
一系列碱基编辑器mRNA剂量的C-T碱基编辑显示于表67中。如表68和图44中所显示计算EC95(编辑95%的最大C-T编辑所需的BC22n mRNA的质量)。所有碱基编辑器mRNA能够在高剂量下实现类似水平的最大编辑。
表66-使用设计有各种肽接头的碱基编辑构建体在PHH细胞中ANAPC5处的平均编辑百分比。插入/缺失=插入或缺失。
/>
表67-设计有各种肽接头的碱基编辑构建体在PHH中的ANAPC5基因座处的平均C-T编辑百分比。
表68-导致95%的最大C-T编辑的碱基编辑器mRNA的质量。还显示了每个EC95值的95%置信区间。
/>
实施例28.通过在T细胞中具有各种接头的构建体进行碱基编辑
测定衍生自BC22n但具有经取代于胞嘧啶脱氨酶与Cas9切口酶之间的来自表65的接头的选择碱基编辑器构建体的C-T碱基编辑活性。构建体(SEQ ID No:341-346)在健康人类T细胞中的碱基编辑器mRNA的12点稀释系列中经筛选,与固定量的TRAC sgRNA(G016017)和UGI mRNA(SEQ ID NO:34)共递送。将每个碱基编辑器mRNA构建体的C-T编辑效率与BC22n(SEQ ID NO:1)进行比较。
实施例28.1.T细胞制备
健康人类供体血球分离术是商购获得的(Hemacare),并且将细胞洗涤,重悬于PBS/EDTA缓冲液(Miltenyi Biotec目录号130-070-525)中并在MultiMACSTMCell 24Separator Plus装置(Miltenyi Biotec)中进行处理。使用Straight fromCD4/CD8 MicroBead试剂盒,人类(Miltenyi Biotec目录号130-122-352)经由阳性选择分离T细胞。将T细胞等分并且在/>CS10(StemCell Technologies目录号07930)中冷冻保存以供将来使用。
在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者构成的T细胞生长培养基(TCGM)中:CTS OpTmizer T细胞扩增SFM和T细胞扩增补充物(ThermoFisher目录号A1048501)、5%人类AB血清(GeminiBio,目录号100-512)、1X青霉素-链霉素、1XGlutamax、10mM HEPES、200U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、5ng/ml重组人类白细胞介素7(Peprotech,目录号200-07)和5ng/ml重组人类白细胞介素15(Peprotech,目录号200-15)。T细胞在此培养基中静置24小时,此时其经以1∶100体积比添加的T细胞TransActTM人类试剂(Miltenyi,目录号130-111-160)活化。T细胞在用于筛选实验之前活化48小时。
实施例28.2.T细胞电穿孔和扩增
使靶向TRAC的sgRNA(G016017)在95℃下变性2分钟,在室温下温育5分钟并储存于冰上。活化后48小时,采集T细胞,在500g下离心5分钟,并且以12.5x10^6个T细胞/mL的浓度重悬于P3电穿孔缓冲液(Lonza)中。对于待电穿孔的每个孔,将1x10^5个T细胞与减少量的在400ng至0ng的范围内的碱基编辑器mRNA、200ng UGI mRNA和40pmol G016017在最终体积为20uL的P3电穿孔缓冲液中混合。
所得混合物一式两份转移至96孔NucleofectorTM板(Lonza)并且使用制造商的脉冲码电穿孔。紧接在电穿孔之后,T细胞接受80μL TCGM并且将板在37℃下温育15分钟。在温育后,将80μL转移至含有80μL TCGM的新平底96孔板中。将T细胞在37℃下温育4天,此时将其混合,用新鲜TCGM以1∶4分裂,并且在通过流式细胞术进行表型评定之前再温育3天。
实施例28.3.通过下一代测序(NGS)评估C-T编辑纯度
电穿孔后四天,对T细胞进行溶解、TRAC基因座的PCR扩增和后续NGS分析,如实施例1中所描述。表69和图45显示除200ng UGI mRNA(SEQ ID No:34)和40pmol G016017(TRAC)以外,用400或6.25ng不同碱基编辑器mRNA处理的样本中的TRAC编辑水平和C-T编辑纯度。
在N末端胞嘧啶脱氨酶与C末端Cas9切口酶之间测试的接头都不限制胞嘧啶碱基编辑的功效或影响C-T编辑纯度的水平。
表69-用设计有各种接头肽的碱基编辑器构建体处理的T细胞中TRAC基因座处的平均编辑百分比。插入/缺失=插入或缺失。
实施例28.4.通过流式细胞术评估受体敲除
电穿孔后七天,通过流式细胞术测定T细胞以评估CD3表达的损失。将T细胞与可固定活力染料(Beckman Coulter,目录号C36628)和靶向以下分子的抗体混合液一起温育:CD3(Biolegend,目录号317336)、CD4(Biolegend,目录号317434)和CD8(Biolegend,目录号301046)。随后洗涤细胞,在Cytoflex LX仪器(Beckman Coulter)上使用FlowJo软件包进行分析。在确定任何标志物表达之前,T细胞以大小、活力和CD8阳性进行门控。所得数据绘制在GraphPad Prism v.9.0.2上并且使用可变斜率(四个参数)非线性回归进行分析。
如表70中所显示,用>100ng所测试的碱基编辑器mRNA中的任一者处理产生>95%的缺少CD3表达的CD8+T细胞。用每个非线性回归的95%置信区间测试的碱基编辑器mRNA的EC90(即,产生90%缺少CD3的CD8+T细胞的mRNA的质量)显示于表71和图46中。
表70-在用设计有各种接头肽的碱基编辑器构建体处理之后对于CD3表面表达呈阴性的CD8+T细胞的平均百分比。
表71-导致90%的最大CD3敲低的碱基编辑器mRNA的质量。还显示了每个EC90值的95%置信区间。
/>
实施例29.通过在T细胞中具有各种接头的构建体进行多重碱基编辑
经由蛋白质敲低测定衍生自BC22n但具有经取代于胞嘧啶脱氨酶与Cas9切口酶之间的来自表65的接头的选择碱基编辑器构建体的多个同时碱基编辑功效。构建体在健康人类T细胞中的碱基编辑器mRNA的12点稀释系列中经筛选,与固定质量的UGI mRNA(SEQ IDNO:34)和4种不同的91聚体sgRNA共递送。将每个mRNA构建体的效力与BC22n mRNA(SEQ IDNO:1)进行比较以评估每个接头在表型受体敲除方面的作用。
实施例29.1.T细胞制备
健康人类供体血球分离术是商购获得的(Hemacare),并且将细胞洗涤,重悬于PBS/EDTA缓冲液(Miltenyi Biotec目录号130-070-525)中并在MultiMACSTMCell 24Separator Plus装置(Miltenyi Biotec)中进行处理。使用Straight fromCD4/CD8MicroBead试剂盒,人类(Miltenyi Biotec目录号130-122-352)经由阳性选择分离T细胞。将T细胞等分并且在/>CS10(StemCell Technologies目录号07930)中冷冻保存以供将来使用。
在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者构成的T细胞生长培养基(TCGM)中:CTS OpTmizer T细胞扩增SFM和T细胞扩增补充物(ThermoFisher目录号A1048501)、5%人类AB血清(GeminiBio,目录号100-512)、1X青霉素-链霉素、1XGlutamax、10mM HEPES、200U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、5ng/ml重组人类白细胞介素7(Peprotech,目录号200-07)和5ng/ml重组人类白细胞介素15(Peprotech,目录号200-15)。T细胞在此培养基中静置24小时,此时其经以1∶100体积比添加的T细胞TransActTM人类试剂(Miltenyi,目录号130-111-160)活化。T细胞在用于筛选实验之前活化48小时。
实施例29.2.T细胞电穿孔和扩增
使靶向TRAC(G023520)、TRBC1/2(G023524)、CIITA(G023521)和HLA-A(G023523)的四个91聚体sgRNA在95℃下变性2分钟,在室温温育5分钟并储存在冰上。活化后48小时,采集T细胞,在500g下离心5分钟,并以12.5x10^6个T细胞/mL的浓度重悬于P3电穿孔缓冲液(Lonza)中。对于待电穿孔的每个孔,将1x10^5个T细胞与400ng至0ng的碱基编辑器mRNA(SEQ ID NO:1和321-326)、200ng UGI mRNA(SEQ ID NO:34)、3.6pmol G023520(TRAC)、6.96pmol G023524(TRBC1/2)、17.12pmol G023521(CIITA)和52.24pmol G023523(HLA-A)的稀释系列在最终体积为20uL的P3电穿孔缓冲液中混合。
所得混合物一式两份转移至96孔NucleofectorTM板(Lonza)并使用制造商的脉冲码电穿孔。紧接在电穿孔之后,T细胞接受80μL TCGM并且将板在37℃下温育15分钟。在温育后,将80μL转移至含有80μL TCGM的新平底96孔板中。将T细胞在37℃下温育4天,此时其通过新鲜TCGM以1∶4分裂,并且在通过流式细胞术进行表型评定之前再温育3天。
实施例29.3.通过流式细胞术评估受体敲除
电穿孔后七天,通过流式细胞术测定T细胞以评估CD3、HLA-A3和/或HLA-DR、DP、DQ的损失。将T细胞与可固定活力染料(Beckman Coulter,目录号C36628)和靶向以下分子的抗体混合液一起温育:CD3(Biolegend,目录号317336)、CD4(Biolegend,目录号317434)、CD8(Biolegend,目录号301046)、HLA-A3(ThermoFisher,目录号12-5754-42)和HLA-DP、DQ、DR (Biolegend,目录号361714)。随后洗涤细胞,在Cytoflex LX仪器(Beckman Coulter)上使用FlowJo软件包进行分析。在确定任何标志物表达之前,T细胞以大小、活力和CD8阳性进行门控。所得数据绘制在GraphPad Prism v.9.0.2上并使用可变斜率(四个参数)非线性回归进行分析。
如表72中所显示,用>100ng所测试的BC22n mRNA中的任一者处理产生>97%的缺少CD3、HLA-A3和HLA-DR、DP、DQ表达的CD8+T细胞。用每个非线性回归的95%置信区间测试的碱基编辑器mRNA的EC90(即,产生90%缺少CD3的CD8+T细胞的mRNA的质量)显示于表73和图47中。
表72-在用碱基编辑器mRNA处理之后对于CD3、HLA-A3和HLA-DR、DP、DQ表面表达呈阴性的CD8+T细胞的平均百分比。
表73-导致90%的CD3、HLA-A3和HLA-DR、DP、DQ(EC90)的最大敲低的碱基编辑器mRNA的质量。还显示了每个EC90值的95%置信区间。
实施例30用BC22n、UGI和91聚体sgRNA编辑人类T细胞
将通过NGS和/或受体敲除评定的91聚体sgRNA的碱基编辑功效与具有相同引导序列的100聚体sgRNA对照的碱基编辑功效进行比较。
经测试的91聚体sgRNA包括20个核苷酸引导序列(如由N表示)和如下的引导骨架:mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAmGmCmUmAmGmAmAmAmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCACGAAAGGGCACCGAGUCGGmUmGmC*mU(SEQ ID NO:520),除非另外指示,否则其中A、C、G、U和N分别为腺嘌呤、胞嘧啶、鸟嘌呤、尿嘧啶和任何核糖核苷酸。m指示2′O-甲基修饰,并且*指示核苷酸之间的硫代磷酸酯键。引导物的未经修饰和经修饰版本提供于表5C(序列表)中。
实施例30.1.T细胞制备
健康人类供体血球分离术是商购获得的(Hemacare),并且将细胞洗涤,重悬于PBS/EDTA缓冲液(Miltenyi Biotec目录号130-070-525)中并在MultiMACSTMCell 24Separator Plus装置(Miltenyi Biotec)中进行处理。使用Straight fromCD4/CD8 MicroBead试剂盒,人类(Miltenyi Biotec目录号130-122-352)经由阳性选择分离T细胞。将T细胞等分并在/>CS10(StemCell Technologies目录号07930)中冷冻保存以供将来使用。
在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者构成的T细胞生长培养基(TCGM)中:CTS OpTmizer T细胞扩增SFM和T细胞扩增补充物(ThermoFisher目录号A1048501)、5%人类AB血清(GeminiBio,目录号100-512)、1X青霉素-链霉素、1XGlutamax、10mM HEPES、200U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、5ng/ml重组人类白细胞介素7(Peprotech,目录号200-07)和5ng/ml重组人类白细胞介素15(Peprotech,目录号200-15)。T细胞在此培养基中静置24小时,此时其经以1∶100体积比添加的T细胞TransActTM人类试剂(Miltenyi,目录号130-111-160)活化。T细胞在LNP处理之前活化48小时。
实施例30.2.T细胞LNP处理和扩增
活化后四十八小时,采集T细胞,在500g下离心5分钟,并以1x10^6个T细胞/mL的浓度重悬于T细胞接种培养基(TCPM)中:无血清版本TCGM,含有400U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、10ng/ml重组人类白细胞介素7(Peprotech,目录号200-07)和10ng/ml重组人类白细胞介素15(Peprotech,目录号200-15)。在平底96孔板中每孔添加50μL TCPM中的T细胞(5x10^4个T细胞)以进行处理。
如实施例1中所描述以35/47.5/15/2.5(脂质A/胆固醇/DSPC/PEG2k-DMG)的比率制备LNP。用约6的脂质胺与RNA磷酸酯(N∶P)摩尔比来配制LNP。LNP囊封单一RNA物种,即如表74中所描述的sgRNA、BC22n mRNA(SEQ ID No:1)或UGI mRNA(SEQ ID No.34)。
表74-100聚体和91聚体sgRNA。
基因目标 | 100聚体 | 91聚体 |
TRAC | G016017 | G023520 |
TRBC1/2 | G016200 | G023524 |
CIITA | G016086 | G023521 |
B2M | G015991 | G023519 |
CD38 | G019771 | G023522 |
HLA-A | G021209 | G023523 |
在T细胞处理之前,囊封sgRNA的LNP在T细胞处理培养基(TCTM)中稀释至6.64μg/mL:含有20ug/mL rhApoE3,不存在白细胞介素2、5或7的TCGM版本。这些LNP在37℃下温育15分钟并使用TCTM以1∶4连续稀释,这产生6.64μg/mL至零范围内的8点稀释系列。类似地,将具有BC22n mRNA(SEQ ID NO:1)或UGI mRNA(SEQ ID NO:34)的单货物LNP在TCTM中分别稀释至3.32和1.67μg/mL,在37℃下温育15分钟,并以1∶1的体积与先前步骤中连续稀释的sgRNA LNP混合。最后,将来自所得混合物的50μL以1∶1体积比添加至96孔板中的T细胞中。将T细胞在37℃下温育24小时,此时将其收集,在500g下离心5分钟,重悬于200μL TCGM中,并返回至温育箱。
实施例30.3.通过下一代测序(NGS)评估编辑结果
LNP处理后四天,对T细胞进行溶解、每个靶向基因座的PCR扩增和后续NGS分析,如实施例1中所描述。表75至表80和图48、图50A、图50B、图51显示用减少质量的靶向TRAC、TRBC1、TRBC2、CIITA、B2M或CD38的100聚体或91聚体sgRNA处理的T细胞中的编辑水平和C-T编辑纯度。
当与其100聚体版本相比时,91聚体sgRNA在相同浓度下递送时产生较高编辑频率。对于通过NGS测定的所有5个不同组的sgRNA观测到此结果,所述sgRNA靶向6个不同基因组基因座。在100聚体与91聚体sgRNA之间未观测到C-T编辑纯度的差异。通过流式细胞术而非NGS评估靶向HLA-A基因的sgRNA集合,这是由于HLA-A基因座的超多态性质。
表75-用100聚体(G016017)或91聚体格式(G023520)中的sgRNA处理的T细胞中的TRAC基因座处的平均编辑百分比。
表76-用100聚体(G016200)或91聚体格式(G023524)中的sgRNA处理的T细胞中的TRBC1基因座处的平均编辑百分比。
/>
表77-用100聚体(G016200)或91聚体格式(G023524)中的sgRNA处理的T细胞中的TRBC2基因座处的平均编辑百分比。
表78-用100聚体(G016086)或91聚体格式(G023521)中的sgRNA处理的T细胞中的CIITA基因座处的平均编辑百分比。
/>
表79-用100聚体(G015991)或91聚体格式(G023519)中的sgRNA处理的T细胞中的B2M基因座处的平均编辑百分比。
表80-用100聚体(G019771)或91聚体格式(G023522)中的sgRNA处理的T细胞中的CD38基因座处的平均编辑百分比。
/>
实施例30.4.通过流式细胞术评估受体敲除
LNP处理后七天,通过流式细胞术测定T细胞以评估受体敲除。将T细胞与可固定活力染料(Beckman Coulter,目录号C36628)和靶向以下分子的抗体混合液一起温育:CD3(Biolegend,目录号317336)、CD4(Biolegend,目录号317434)和CD8(Biolegend,目录号301046)、B2M(Biolegend,目录号316306)、CD38(Biolegend,目录号303516)、HLA-A2(Biolegend,目录号343304)和HLA-DR、DP、DQ(Biolegend,目录号361714)。随后洗涤细胞,在Cytoflex LX仪器(Beckman Coulter)上使用FlowJo软件包进行分析。在确定任何标志物表达之前,T细胞以大小、活力和CD8阳性进行门控。所得数据绘制在GraphPad Prismv.9.0.2上并使用可变斜率(四个参数)非线性回归进行分析。
如表81至表83和图52、图53A至图55B中所显示,所有测试的91聚体sgRNA胜过其100聚体版本。如表84中所显示,此效力增加是可变的,其中CIITA观测到4.6倍增加并且B2M观测到1.14倍增加。在所测试的6个目标中,在100聚体格式(CIITA和HLA-A)中具有较低效力(即,较高EC50)的那些似乎最受益于使用91聚体sgRNA。
表81-在以100聚体或91聚体格式靶向TRAC或TRBC1/2的sgRNA之后对于CD3表面受体呈阴性的CD8+T细胞的平均百分比。
表82-分别以100聚体或91聚体格式处理靶向CIITA或HLA-A的sgRNA之后对于HLA-DR、DP、DQ或HLA-A2表面受体呈阴性的CD8+T细胞的平均百分比。
表83-分别以100聚体或91聚体格式用靶向B2M或CD38的sgRNA处理之后对于B2M或CD38表面受体呈阴性的CD8+T细胞的平均百分比。
表84-导致CD8+T细胞表面中受体表达的50%损失的sgRNA的量(pmol)(EC50)。最右行显示当与具有相同引导序列的其100聚体相比时,由91聚体sgRNA实现的效力的倍数增加。
实施例31 UGI mRNA剂量对体内编辑的碱基编辑影响
使用固定剂量的BC22n(SEQ ID No:1)和靶向ANAPC5(G019427)以及连续稀释的UGI mRNA(SEQ ID No:34)的引导RNA来评估体内肝脏编辑型态。
实施例31.1如通过NGS测定的体内编辑
在此研究中使用6-10周龄范围内的十五只可商购CD-1雌性小鼠(n=3/组)。给药前对动物称重以进行给药计算。在LNP中分别配制每一RNA物种。LNP通常如实施例1中所描述配制。LNP含有分别为50∶38∶9∶3摩尔比的可离子化脂质A、胆固醇、DSPC和PEG2k-DMG。脂质核酸组装体用约6的脂质胺与RNA磷酸酯(N∶P)摩尔比配制。LNP囊封单一RNA物种,G019427、BC22n mRNA(SEQ ID No:1)或UGI mRNA(SEQ ID No.34)。
将囊封碱基编辑器mRNA的LNP与囊封sgRNA的LNP分别以按重量计0.2mpk和0.1mpkRNA的固定剂量(编辑器mRNA和sgRNA)以及按重量计0.0、0.03、0.1和0.3mpk RNA的UGImRNA剂量同时混合和施用。阴性对照组仅用TSS缓冲液给药。根据表85中所列出的剂量,经由尾部静脉注射静脉内施用制剂。
表85-动物组和相应LNP
在给药后至少24小时,定期观测动物的不良反应。处理之后六天,在异氟烷麻醉下通过心脏穿刺将动物安乐死;收集肝脏组织用于下游分析。收集重量在5与15mg之间的肝脏穿孔以分离基因组DNA。用NGS测序分析基因组DNA样本,如实施例1中所描述。编辑数据和C-T纯度百分比显示于表86和图56至图57中。
表86-在UGI mRNA的量增加下小鼠肝脏中的ANAPC5基因座处的平均编辑百分比。
实施例32.体外确定BC22n与UGI比率
蛋白质表达水平使用蛋白质的经HiBiT标记版本确定。为确定针对具有高C-T纯度的有效碱基编辑所表达的碱基编辑器蛋白质和UGI蛋白质的相对量,进行并行编辑实验,其中的一者使用编码经HiBiT标记的碱基编辑器的mRNA并且其中的另一者使用编码经HiBiT标记的UGI的mRNA。
如实施例9中进行细胞制备、工程化和编辑测定。实验的一个组(经标记编辑器)用编码经HiBiT标记的BC22n(SEQ ID No.4)和mRNA UGI(SEQ ID No:34)的mRNA转染。实验的另一组(经标记UGI)用编码碱基编辑器(SEQ ID No:1)的mRNA和编码经Hibit标记的UGI的mRNA转染。
在转染后二十四小时,使用细胞titer-glo测定(Promega目录号G7571)确定每样本的活T细胞的数目并且使用HiBiT溶解检测测定(Promega目录号N3040)测量经HiBiT标记的蛋白质的数目。在转染后96小时进行NGS测序以评定总编辑和C-T纯度水平。针对总编辑水平绘制BC22n和UGI蛋白质水平以确定实现饱和编辑水平和C-T纯度所需的每个蛋白质细胞的最小数目。
BC22n与UGI蛋白质的最佳比率是通过将实现饱和编辑水平所需的每个细胞的BC22蛋白质的最小数目除以实现最大C-T纯度所需的每个细胞的UGI蛋白质的最小数目来计算。
可使用类似方法计算使用不同细胞类型、不同引导物或不同转染方法的碱基编辑器与UGI蛋白质的比率。
实施例33.以较低剂量进行体内UGI滴定
在小鼠中进行碱基编辑以评定总体编辑效率和较低水平的UGI mRNA的C-T纯度。实验细节如实施例30中所描述,但有以下例外。囊封BC22n mRNA的LNP和囊封sgRNA的LNP分别以0.2mg/kg和0.1mg/kg RNA货物的固定剂量混合,并且与0.0、0.0001、0.001、0.003、0.01、0.03、0.1和0.3mg/kg的UGI mRNA剂量组合。阴性对照组为经TSS处理的动物。经由尾部静脉注射静脉内施用制剂。处理后六天,在异氟烷麻醉下通过心脏穿刺将动物安乐死;收集肝脏组织用于下游分析。收集重量在5与15mg之间的肝脏穿孔以分离基因组DNA和总RNA。用如实施例1中所描述的NGS测序分析基因组DNA样本以确定小鼠肝脏中最大C-T编辑纯度所需的最小UGI mRNA剂量。
实施例34.工程化T细胞的细胞毒性敏感性
当通过自然杀手(NK)细胞靶向时,测定工程化T细胞的细胞毒性敏感性。
将NK细胞(Stemcell Technologies)解冻并以1x10^6个细胞/ml的细胞浓度重悬于由OpTmizer TCGM构成并且进一步补充有100U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、5ng/ml IL-7(Peprotech,目录号200-07)、5ng/ml IL-15(Peprotech,目录号200-15)的T细胞生长培养基(TCGM)中。细胞在37℃下温育24小时。
解冻后二十四小时,NK细胞用0.5μM Cell Trace Violet标记如下:将一小瓶CellTrace Violet (CellTraceTM Violet细胞增殖试剂盒,用于流式细胞术,目录号C34571)在来自试剂盒的DMSO中重构以得到5mM储备浓度。用18μL磷酸盐缓冲盐水(Coming,目录号21-040-CV)稀释2μL CTV储备液以获得0.5mM的浓度。NK细胞在500xg下离心5分钟,抽吸培养基,并且将细胞以1x10^6个细胞/mL的浓度重悬于磷酸盐缓冲盐水(PBS)中,使得CTV染料的最终浓度为0.5μM。将细胞与Cell Trace VioIet(CTV)染料溶液混合,在37℃下温育20分钟。通过添加TCGM来淬灭未结合染料并温育5分钟。将细胞以500xg离心5分钟。细胞以2x10^6个细胞/mL的浓度重悬于补充有100U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、5ng/ml IL-7(Peprotech,目录号200-07)、5ng/ml IL-15(Peprotech,目录号200-15)的TCGM中。为测试效应子:目标(E:T)比率范围,将经CTV标记的NK细胞等分至100ul培养基中,6点、2倍连续稀释,最高数目的细胞为2x10^5个细胞,包括仅培养基样本作为阴性对照。
使用如实施例14中所描述的BC22n和UGI mRNA使用靶向HLA-A的G023523或靶向B2M的G015991对T细胞进行工程化。还包括未编辑的(WT)T细胞、未染色的LD热杀灭型和7-AAD FMO(2x10^4未经标记的NK细胞和2x10^4WT T细胞)和CTV+(2x10^5CTV标记的NK细胞)作为对照。T细胞以TCGM的2x10^5个细胞的密度重悬,所述TCGM由OpTmizer TCGM构成并且进一步补充有100U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、5ng/ml IL-7(Peprotech,目录号200-07)、5ng/ml IL-15(Peprotech,目录号200-15)。将两万个T细胞添加至NK细胞和培养基对照的每个孔中。细胞在37℃下温育24小时。
在二十四小时时,将来自LD热杀灭孔的一半体积的细胞热杀灭并转移回至测定板中的相同孔。将细胞离心并重悬于80μL的7-AAD(BD Biosciences,目录号559925)于FACS缓冲液(PBS+2%FBS(Gibco,目录号A31605-02)+2mM EDTA(Invitrogen,目录号15-575-020))的1∶200v/v溶液中。通过流式细胞术使用Cytoflex LX仪器(Beckman Coulter)获取T细胞的特异性溶解数据并使用FlowJo软件包进行分析。首先在CTV阴性群体上绘制门闸以清除NK细胞,接着在单重态上门控,其后在7-AAD阴性群体上绘制门闸以对活T细胞进行门控。通过从100减去活细胞百分比来计算T细胞的溶解百分比。
实施例35.此段落有意留白。
实施例36.原代人类肝细胞中的碱基编辑器和UGI的蛋白质表达
用编码原代人类肝细胞中具有融合HiBiT标签的蛋白质的mRNA进行碱基编辑以确定适合于具有高C-T纯度的高效率编辑的碱基编辑器和UGI蛋白质酶单元的相对量。
将编码具有C末端HiBiT标签的BC22n(BC22n-HiBIT,SEQ ID NO:4)、具有C末端HiBiT标签的BC22-2XUGI(顺式UGI的2个串联拷贝)(BC22-2XUGI-HibIT,SEQ ID NO:314)和具有C末端HiBiT标签的UGI(UGI-HiBiT, SEQ ID NO:316)的信使RNA在剂量反应中以固定浓度的靶向B2M的引导RNA(G015991;SEQ ID NO:179)转染至原代人类肝细胞(PHH)中以确定细胞内碱基编辑器和UGI蛋白质拷贝的最小数目以进行具有高活性(总编辑%=2XEC90)和高C-T纯度(C-T纯度%=2X EC90)的碱基编辑。BC22n-HiBiT在固定浓度的B2M引导物和UGI(SEQ ID NO:34)上滴定,UGI-HiBiT在固定浓度的B2M引导物和BC22n(SEQ ID NO:1)上滴定,并且BC22-2XUGI-HiBiT在固定浓度的B2M引导物上滴定,而无任何额外反式UGImRNA。转染后二十小时进行HiBiT溶解测定(Promega目录号N3040)以确定早期时间点处的细胞内蛋白质水平。接着将那些蛋白质水平与转染后九十六小时衍生自NGS数据的B2M基因座处的端点编辑相关。
实施例36.1细胞制备和转染
将PHH细胞(ThermoFisher,批次HU8284)解冻并在CHRM培养基(Gibco,目录号CM7000)中回收。将细胞重悬于原代肝细胞接种培养基(由William′s E培养基(Gibco,目录号A1217601)和原代肝细胞接种补充剂(Gibco,目录号CM3000)组成)中,然后以30,000个细胞/孔的密度接种于经胶原蛋白包被的96孔板中持续二十四小时。洗涤细胞,并且添加新鲜原代肝细胞维持培养基。
如实施例1中所描述制备脂质体转染试剂,其中脂质A、DSPC、胆固醇和PEG2k-DMG摩尔比分别为50/9/38/3。每一RNA物种(碱基编辑器mRNA、UGI mRNA或gRNA G015991(SEQID NO:179))以约6的脂质胺与RNA磷酸酯(N∶P)摩尔比个别地与脂质体转染试剂批量混合。所得批量混合脂复合体材料在添加至肝细胞之前与10%FBS(Gibco,目录号A3160501)一起在原代肝细胞维持培养基(由William′s E培养基(Gibco,目录号A1217601)和原代肝细胞维持补充剂(Gibco,目录号CM4000)组成)中预温育15分钟。
对于BC22n-HiBiT滴定,每个孔接受最终体积为100uL的三种组分:在100ng至0ng范围内的BC22n-HiBiT mRNA、11ng UGI mRNA和2pmol G015991(B2M),如表87中所描述。对于UGI-HiBiT滴定,每个孔接受最终体积为100uL的三种组分:在100ng至0ng范围内的UGI-HiBiT mRNA、33ng BC22n mRNA和2pmol G015991(B2M),如表88中所描述。对于BC22-2XUGI-HiBiT滴定,每个孔接受最终体积为100uL的三种组分:在100ng至0ng范围内的BC22-2XUGI-HiBiT mRNA、11ng UGI mRNA和2pmol G015991(B2M),如表89中所描述。
转染后九十六小时,将对已与HiBiT板同时转染的单独PHH复制板进行溶解、B2M基因座的PCR扩增和后续NGS分析,如实施例1中所描述。所有实验都以生物一式三份进行。通过计算一组未处理孔的平均背景速率从所有孔减去背景C-T、C-A/G和插入/缺失编辑(都<2%)。不同BC22n-HiBiT mRNA浓度的编辑结果显示于表87中,并且不同BC22n-HiBiT mRNA浓度下的总编辑显示于图58A中。不同UGI-HiBiT mRNA浓度的编辑结果显示于表88中并且不同UGI-HiBiT mRNA浓度下的C-T纯度显示于图58B中。不同BC22-2XUGI-HiBiT mRNA浓度的编辑结果显示于表89中。不同BC22-2XUGI-HiBiT mRNA浓度的总编辑和C-T纯度分别显示于图58C和图58D中。
为促进不同大小的mRNA之间的比较,所有附图都以摩尔浓度显示mRNA剂量。出于这些目的,BC22n mRNA的分子量被视为1,724.25kDa,BC22-2X-UGI mRNA为1915.12kDa,UGImRNA为287.58kDa并且sgRNA为29.66kDa。将HiBiT标签添加至任何mRNA使其分子量增加18.24kDa。
表87-具有增加剂量的BC22n-HiBiT mRNA的PHH中的平均编辑。
表88-具有增加剂量的UGI-Hibit mRNA的PHH中的平均编辑。
表89-具有增加剂量的BC22-2XUGI-Hibit mRNA的PHH中的平均编辑。
实施例36.2评估细胞内蛋白质水平
转染后二十小时,根据制造商的方案,使用HiBiT溶解检测系统(Promega目录号N3040)检测蛋白质水平。Promega#N3010,具有HiBiT标签的可商购对照蛋白质(已知浓度和已知分子量)在PBS中连续稀释(1∶5)并且掺入至含有尚未转染的PHH的孔中为参考对照。将100μL经重构的HiBiT溶解试剂添加至标准孔和所有其他实验孔。将溶解物移动至白壁板,并且通过CLARIstar plus(BMG Labtech)读板器读出相对发光单元(RLU),其中增益设定为3,600。从所有孔减去背景信号,并且使用通过HiBiT标准推导的线性回归方程计算每个样本的每孔蛋白质拷贝数目。HiBiT定量呈现于表90中并且相对于3.7ng BC22-2XUGI-HiBiT mRNA样本的表达水平归一化。
表90-经Hibt标记的蛋白质的平均蛋白质表达(任意单位)。
表90中的数据用于产生双曲线并且内插在为实现饱和编辑或C-T纯度水平所需的最小剂量下表达的蛋白质单元。作为饱和水平的最低剂量在此处定义为EC90的两倍(2XEC90),对于每个所测试的mRNA分别实现90%总编辑或C-T纯度所需的浓度。表91显示在此实验中测试的mRNA的2X EC90剂量(以ng和nM为单位)和BC22和UGI肽单元及其在这些剂量下的比率。对于碱基编辑器和UGI-HiBiT,蛋白质单元等于肽单元。BC22-2XUGI的UGI肽单元是通过将BC22-2XUGI蛋白质单元乘以因子2来计算。对于用表达为单独的未融合蛋白的BC22n和UGI编辑的样本,在总编辑2x EC90下的BC22n肽单元与在C-T纯度2X EC90下的UGI肽单元的比率为大约1∶10。对于用BC22-2XUGI编辑的样本,在总编辑2x EC90下的碱基编辑器肽单元与在C-T纯度2X EC90下的UGI肽单元的比率为大约1∶5。
表91-相关编辑读出下mRNA和蛋白质的2X EC90。
实施例37.T细胞中碱基编辑器和UGI的蛋白质表达
用编码经分离人类T细胞中具有融合HiBiT标签的蛋白质的mRNA进行碱基编辑以确定适合于具有高C-T纯度的高效率编辑的碱基编辑和UGI蛋白质酶单元的相对量。
实施例37.1.T细胞制备
健康人类供体血球分离术是商购获得的(Hemacare),并且将细胞洗涤,重悬于PBS/EDTA缓冲液(Miltenyi Biotec目录号130-070-525)中并且在MultiMACSTM Cell 24Separator Plus装置(Miltenyi Biotec)中进行处理。使用Straightfrom/>CD4/CD8MicroBead试剂盒,人类(Miltenyi Biotec目录号130-122-352)经由阳性选择分离T细胞。将T细胞等分并在/>CS10(StemCell Technologies目录号07930)中冷冻保存以供将来使用。
在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者构成的T细胞生长培养基(TCGM)中:CTS OpTmizer T细胞扩增SFM和T细胞扩增补充物(ThermoFisher目录号A1048501)、5%人类AB血清(GeminiBio,目录号100-512)、1X青霉素-链霉素、1XGlutamax、10mM HEPES、200U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、5ng/ml重组人类白细胞介素7(Peprotech,目录号200-07)和5ng/ml重组人类白细胞介素15(Peprotech,目录号200-15)。在此培养基中24小时后。用以1∶100体积比添加的T细胞TransActTM,人类试剂(Miltenyi,目录号130-111-160)活化T细胞。
实施例37.2.T细胞LNP处理和扩增
活化后四十八小时,采集T细胞,在500g下离心5分钟,并以1x10^6个T细胞/mL的浓度重悬于T细胞接种培养基(TCPM)中:无血清版本TCGM,含有400U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、10ng/ml重组人类白细胞介素7(Peprotech,目录号200-07)和10ng/ml重组人类白细胞介素15(Peprotech,目录号200-15)。在平底96孔板中每孔添加50ul TCPM中的五万个T细胞以进行处理。
如实施例1中所描述以35/47.5/15/2.5(脂质A/胆固醇/DSPC/PEG2k-DMG)的摩尔比产生LNP。在T细胞处理之前,在T细胞处理培养基(TCTM)中制备两种单独的LNP混合物(下文称为混合物“A”和“B”):含有20ug/mL rhApoE3(Peprotech,目录号350-02),不存在白细胞介素2、5或7的TCGM版本。
为确定使总编辑饱和所需的BC22n-HiBiT mRNA的最小水平,混合物“A”由具有稀释至6.68μg/mL(3.83nM)的BC22n-HiBiT mRNA(SEQ ID NO:4)的LNP组成,而混合物“B”由具有稀释至1.67μg/mL(5.8nM)的UGI mRNA(SEQ ID NO:34)的LNP和含有稀释至6.68μg/mL(225.19nM)的比率为4.5/8.7/21.4/65.4的sgRNA G023520(TRAC)、G023524(TRBC1/2)、G023521(ClITA)和G023523(HLA-A)的多货物LNP组成。在37℃下将LNP混合物“A”和“B”个别地温育15分钟。混合物“A”在TCTM中以1∶4连续稀释,并且按体积计与混合物“B”1∶1混合。以1∶1体积比(50μL/孔)将所得溶液添加至96孔板中的T细胞中。
为确定使C-T纯度饱和所需的UGI-HiBiT mRNA的最小水平,混合物“A”由具有稀释至6.68μg/mL(21.84nM)的UGI-HiBiT mRNA(SEQ ID NO:316)的LNP组成,而混合物“B”由具有稀释至3.34μg/mL(1.94nM)的BC22n mRNA(SEQ ID NO:1)的LNP和含有稀释至6.68μg/mL(225.19nM)的比率为4.5/8.7/21.4/65.4的sgRNA G023520(TRAC)、G023524(TRBC1/2)、G023521 (CIITA)和G023523(HLA-A)的多货物LNP组成。在37℃下将LNP混合物“A”和“B”个别地温育15分钟。混合物“A”在TCTM中以1∶4连续稀释,并且按体积计与混合物“B”1∶1混合。以1∶1体积比(50μL/孔)将所得溶液添加至96孔板中的T细胞中。
为确定使总编辑和C-T纯度饱和所需的BC22-2XUGI-HiBiT mRNA的最小水平,混合物“A”由具有稀释至6.68μg/mL(3.46nM)的BC22-2XUGI-HiBiT mRNA(SEQ ID NO:314)的LNP组成,而混合物“B”由含有稀释至6.68μg/mL(225.19nM)的比率为4.5/8.7/21.4/65.4的sgRNA G023520(TRAC)、G023524(TRBC1/2)、G023521(CIITA)和G023523(HLA-A)的多货物LNP组成。在37℃下将LNP混合物“A”和“B”个别地温育15分钟。混合物“A”在TCTM中以1∶4连续稀释,并且按体积计与混合物“B”1∶1混合。以1∶1体积比(50μL/孔)将所得溶液添加至96孔板中的T细胞中。
在添加LNP之后,将T细胞在37℃下温育24小时,此时采集一半细胞用于细胞活力和蛋白质表达测定,并且将剩余细胞在500g下离心5分钟,重悬于200μL TCGM中,并返回至温育箱。
实施例37.3.通过下一代测序(NGS)评估编辑结果
在LNP处理后第4天,将T细胞在500g下离心5分钟,进行每个靶向基因座的溶解、PCR扩增和后续NGS分析,如实施例1中所描述。具有不同浓度的HiBiT mRNA的TRAC、TRBC1、TRBC2和CIITA基因座下的编辑结果分别显示于表92至表95中。图59A显示在不同BC22n-HiBiT mRNA浓度下的总编辑。图59B显示在不同UGI-HiBiT mRNA浓度下的C-T纯度。不同BC22-2XUGI-HiBiT mRNA浓度的总编辑和C-T纯度分别显示于图59C和图59D中。
表92至表95显示4种不同基因组基因座(TRAC、TRBC1、TRBC2和CIITA)的编辑数据。
表92.T细胞中TRAC基因座处的平均编辑。
表93.T细胞中TRBC1基因座处的平均编辑。
/>
表94.T细胞中TRBC2基因座处的平均编辑
/>
表95.T细胞中CIITA基因座处的平均编辑
/>
实施例37.4.评估细胞内蛋白质水平
在LNP处理后二十四小时,充分混合所有样本并且将25μL的两个等分试样转移至含有75μL TCGM的白壁96孔板中。一个板进行2.0细胞活力测定(Promega目录号G9242)并且另一个板进行/>HiBiT溶解检测测定(Promega目录号N3040)。遵循制造商的方案进行两种测定。使用已知数目的供体匹配T细胞或具有HiBiT标签(Promega目录号N3010)的可商购蛋白质制备标准曲线。HiBiT定量呈现于表96中,相对于0.0037nMBC22n-HiBiT mRNA样本的表达水平归一化。
表96.经HiBiT标记的蛋白质的平均蛋白质表达(任意单位)。
/>
来自表96的数据用于产生双曲线并且内插在为实现饱和编辑或C-T纯度水平所需的最小剂量下表达的蛋白质单元。作为饱和水平的最低剂量在此处定义为EC90的两倍(2XEC90),对于每个所测试的mRNA分别实现90%总编辑或C-T纯度所需的浓度。
表97显示在此实验中测试的mRNA的2X EC90剂量和BC22和UGI肽单元及其在这些剂量下的比率。对于碱基编辑器和UGI-HiBiT,蛋白质单元等于肽单元。BC22-2XUGI的UGI肽单元是通过将BC22-2XUGI蛋白质单元乘以因子2来计算。表98显示在总编辑2x EC90下的碱基编辑器肽单元与在C-T纯度2X EC90下的UGI肽单元的比率。
表97.相关编辑读出下mRNA和蛋白质的2X EC90。
/>
表98.碱基编辑器与UGI酶比率。
实施例38.用反式UGI进行体内编辑
当将UGI反式(作为单独的mRNA)递送时,将含有脱氨酶的构建体的体内编辑型态与Cas9进行比较。所使用的构建体编码包括D10A SpyCas9与脱氨酶的融合蛋白。
在此研究中使用6-10周龄范围内的二十四只可商购CD-1雌性小鼠(n=3/组)。给药前对动物称重以进行给药计算。在LNP中分别配制每一RNA物种。含有编辑器mRNA、UGImRNA和G019427sgRNA的制剂以RNA货物的w/w比率混合。第2组的制剂混合物仅含有编辑器mRNA和sgRNA并且这些以2∶1(编辑器mRNA∶sgRNA)的w/w比率混合。第3-8组含有以2∶1的w/w比率的mRNA∶stRNA以及以1∶3、1∶10、1∶30、1∶100、1∶300和1∶3000的w/w比率(编辑器mRNA+sgRNA∶UGI mRNA)混合的UGI mRNA。除仅用TSS缓冲液给药的阴性对照组之外,所有组在用G019427靶向的ANACP5基因座处产生编辑。根据表99中所列出的剂量,经由尾部静脉注射静脉内施用制剂。在给药后至少24小时,定期观测动物的不良反应。处理后六天,在异氟烷麻醉下通过心脏穿刺将动物安乐死;收集肝脏组织用于下游分析。收集重量在5与15mg之间的肝脏穿孔以分离基因组DNA。用NGS测序分析基因组DNA样本,如实施例1中所描述。编辑数据显示于表100和图60中。图60显示C-T纯度。
表99-每个实验组的RNA物种的剂量
表100-小鼠肝脏中的平均编辑
实施例39.工程化T细胞的细胞每性敏感性
当通过自然杀手(NK)细胞靶向时,测定工程化T细胞的细胞毒性敏感性。
NK细胞(Stemcell Technologies)经解冻并以1x10^6个细胞/ml的细胞浓度重悬于由OpTmizer TCGM构成并且进一步补充有100U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、5ng/mL IL-7(Peprotech,目录号200-07)、5ng/mL IL-15(Peprotech,目录号200-15)的T细胞生长培养基(TCGM)中。将细胞在37℃下温育24小时。
解冻后二十四小时,NK细胞用0.5μM Cell Trace Violet(CTV)标记如下:将一小瓶CTV (CellTraceTM Violet细胞增殖试剂盒,用于流式细胞术,目录号C34571)在来自试剂盒的DMSO中重构以得到5mM储备浓度。用18μL磷酸盐缓冲盐水(PBS)(Coming,目录号21-040-CV)稀释2μL CTV储备液以获得0.5mM的浓度。NK细胞在500x g下离心5分钟,抽吸培养基,并且将细胞以1x10^6个细胞/mL的浓度重悬于PBS中,使得CTV染料的最终浓度为0.5μM。将细胞与CTV染料溶液混合,在37℃下温育20分钟。通过添加TCGM来淬灭未结合染料并温育5分钟。将细胞以500x g离心5分钟。细胞以2x10^6个细胞/mL的浓度重悬于补充有100U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、5ng/mL IL-7(Peprotech,目录号200-07)、5ng/mL IL-15(Peprotech,目录号200-15)的TCGM中。为测试效应子:目标(E∶T)比率范围,将经CTV标记的NK细胞等分至100μL培养基中,6点、2倍连续稀释,最高数目的细胞为2x10^5个细胞。包括仅培养基样本作为阴性对照。
使用如实施例14中所描述的BC22n和UGI mRNA,使用靶向HLA-A的G023523(SEQ IDNO:501)作为测试样本并且用靶向B2M的G023519(SEQ ID NO:498)作为NK杀灭的阳性对照对T细胞进行工程化。测定未编辑的T细胞作为NK杀灭的阴性对照。流式细胞术的其他对照包括无T细胞的经CTV标记的NK细胞;组合未经标记的NK细胞与T细胞的“未染色”样本;和用7AAD染色的未经标记的热杀灭和非热杀灭NK细胞与T细胞的1∶1混合物。T细胞以2x10^5个细胞的密度重悬于由OpTmizer TCGM构成并且进一步补充有100U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、5ng/mL IL-7(Peprotech,目录号200-07)、5ng/mL IL-15(Peprotech,目录号200-15)的TCGM中。将两万个T细胞添加至NK细胞和培养基对照的每个孔中。将细胞在37℃下温育24小时。
在24小时时,将来自LD热杀灭孔的一半体积的细胞热杀灭并转移回至测定板中的相同孔。将细胞离心并重悬于80μL的7-AAD(BD Biosciences,目录号559925)于FACS缓冲液(PBS+2%FBS(Gibco,目录号A31605-02)+2mM EDTA(Invitrogen,目录号15-575-020))的1∶200v/v溶液中。通过流式细胞术使用Cytoflex LX仪器(Beckman Coulter)获取T细胞的特异性溶解数据并使用FlowJo软件包进行分析。首先在CTV阴性群体上绘制门闸以清除NK细胞,接着在单重态上门控,其后在7-AAD阴性群体上绘制门闸以对活T细胞进行门控。通过从100减去活细胞百分比来计算T细胞的溶解百分比。使用BC22n和HLA-A引导G023523(SEQ IDNO:501)编辑的T细胞受到保护,免受NK细胞介导的细胞毒性,如表101和图62中所显示。
表101-暴露于HLA-B和C匹配NK细胞的工程化T细胞的平均溶解百分比
实施例40-用于SpyCas9和Nme2Cas9碱基编辑器的编辑窗口
通过在引导区中具有胞嘧啶残基的一组目标位点上逐个位置地评估C-T转化功效来测定可用于通过设计有Nme2Cas9切口酶或SPyCas9切口酶和APOBEC3a的碱基编辑器脱氨作用的引导位置范围。
实施例40.1T细胞制备
健康人类供体血球分离术是商购获得的(Hemacare),并且将细胞洗涤并重悬于PBS/EDTA缓冲液(Miltenyi Biotec目录号130-070-525)中并且在MultiMACSTM Cell 24Separator Plus装置(Miltenyi Biotec)中进行处理。使用Straightfrom/>CD4/CD8 MicroBead试剂盒,人类(Miltenyi Biotec目录号130-122-352)经由阳性选择分离T细胞。将T细胞等分并在/>CS10(StemCell Technologies目录号07930)中冷冻保存以供将来使用。
在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者构成的T细胞生长培养基(TCGM)中:CTS OpTmizer T细胞扩增SFM和T细胞扩增补充物(ThermoFisher目录号A1048501)、5%人类AB血清(GeminiBio,目录号100-512)、1X青霉素-链霉素、1XGlutamax、10mM HEPES、200U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、5ng/ml重组人类白细胞介素7(Peprotech,目录号200-07)和5ng/ml重组人类白细胞介素15(Peprotech,目录号200-15)。T细胞在此培养基中静置24小时,此时其经以1∶100体积比添加的T细胞TransActTM人类试剂(Miltenyi,目录号130-111-160)活化。T细胞在电穿孔之前活化48小时。
实施例40.2用RNA电穿孔进行T细胞编辑
在P3缓冲液中制备含有编码Spy BC22n(SEQ ID NO:1)或Nme2 BC22n(SEQ ID NO:315)和UGI(SEQ ID NO:34)的mRNA的溶液。从储存移出靶向SCAP、LINC01588、LSP1、SEC61B、VEGFA、FancF、AAVS1或ARHGEF9基因座的引导RNA,并在95℃下变性2分钟并且在室温下温育5分钟。
活化后四十八小时,采集T细胞,离心,并以12.5x10^6个T细胞/mL的浓度重悬于P3电穿孔缓冲液(Lonza)中。对于待电穿孔的每个孔,将1x10^5个T细胞与200ng BC22n或Nme2碱基编辑器mRNA、200ng UGI mRNA和4μM sgRNA在最终体积为20μL的P3电穿孔缓冲液中混合。此混合物一式两份转移至96孔NucleofectorTM板中并使用制造商的脉冲码电穿孔。经电穿孔的T细胞立即在不含细胞因子的80μL CTS Optimizer T细胞生长培养基中静置15分钟,然后转移至含有额外80μL补充有2X细胞因子的CTS OpTmizer T细胞生长培养基的新平底96孔板中。将所得板在37℃下温育4天。在电穿孔后第4天,采集100μL细胞用于DNA提取。对DNA样本进行PCR和通过两个单独引物组(技术重复物)的后续NGS分析,如实施例1中所描述。
实施例40.3碱基编辑器编辑窗口分析
将位置值分配给原型间隔区和其5′和3′相邻核苷酸内的每个DNA碱基。对于SpyCas9,位置1-20表示SpyCas9引导物所结合的20个碱基,其中位置1为PAM远端碱基并且位置20为PAM近端碱基。对于Nme2Cas9,位置1-24表示Nme2Cas9引导物所结合的24个碱基,其中位置1为PAM远端碱基并且位置24为PAM近端碱基。原型间隔区外部的5′和3′端分别被分配为负和正位置;相对于位置1。
定义转化频率:引导物可经设计以靶向基因的参考链(链+)或反向互补链(链-)。对于链+引导物,记录目标区中的每个野生型胞嘧啶位置并且将所述位置处的转化频率(胞嘧啶至胸腺嘧啶)计算为在所述位置处具有胸腺嘧啶的测序读段与在所述位置处具有胞嘧啶或胸腺嘧啶的读段的比率;对于链-引导物,记录目标区中的每个野生型鸟嘌呤位置并且将所述位置处的转化频率(鸟嘌呤至腺嘌呤)计算为在所述位置处具有腺嘌呤的测序读段与在所述位置处具有腺嘌呤和鸟嘌呤的读段的比率。
对引导活性进行分类:测量每个引导物的四个重复物:两个生物重复物中的每一者的两个技术重复物。将进一步分析仅具有>500个测序读段的重复物中的位置。对于每个引导物,位置的平均转化频率为重复物的平均值,并且引导物的所有位置的最高平均转化频率用于对此引导物的转化活性进行分类:低、中和高活性引导物分别具有<50%、50%和<70%、>70%的最高平均转化频率。选择BC22n(n=38)和Nme2碱基编辑器(n=14)的高活性引导物以用于如表102中所显示的进一步窗口分析。
表102-包括在编辑窗口分析中的高活性引导序列
定义所有引导物上每个位置的转化率:如果引导物具有所记录位置,则其重复物中的每一者在所述位置具有>500个测序读段被视为“案例”。针对所有引导物的每个位置对总案例求和并且充当转化率计算的分母。在每个案例中,如果转化频率大于50%,则其被视为高转化“事件”,并且总事件为所有引导物和重复物上的每个位置的高转化事件的总和。“事件”充当转化率计算的分子。位置的转化率等于在所有案例中针对每个位置的高转化事件的百分比。
表103显示spyBC22n C-T编辑窗口的位置、案例、事件和转化率。图63显示按位置BC22n的转化率。图64显示用于Nme2碱基编辑器的按位置的转化率。spyBC22n的位置1-11和Nme2BC22的位置4-20显示超过25%的转化率。
表103-针对Spy碱基编辑器和Nme2碱基编辑器构建体的转化率。
/>
/>
实施例41-用BC22n在T细胞中进行CIITA引导RNA筛选
使用C-T碱基编辑筛选不同sgRNA在人类T细胞中敲除CIITA基因的效力。在用mRNA和不同sgRNA电穿孔之后进行CIITA编辑之后,测定对于MHC II类和/或CD74蛋白质表达呈阴性的T细胞的百分比。
实施例41.1 T细胞制备
健康人类供体血球分离术是商购获得的(Hemacare),并且将细胞洗涤并重悬于PBS/EDTA缓冲液(Miltenyi Biotec目录号130-070-525)中并且在MultiMACSTM Cell 24Separator Plus装置(Miltenyi Biotec)中进行处理。使用Straightfrom/>CD4/CD8 MicroBead试剂盒,人类(Miltenyi Biotec目录号130-122-352)经由阳性选择分离T细胞。将T细胞等分并在/>CS10(StemCell Technologies目录号07930)中冷冻保存以供将来使用。
在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者构成的T细胞生长培养基(TCGM)中:CTS OpTimizer T细胞扩增SFM和T细胞扩增补充物(ThermoFisher目录号A1048501)、5%人类AB血清(GeminiBio,目录号100-512)、1X青霉素-链霉素、1XGlutamax、10mM HEPES、200U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、5ng/mL重组人类白细胞介素7(Peprotech,目录号200-07)和5ng/ml重组人类白细胞介素15(Peprotech,目录号200-15)。T细胞在此培养基中静置24小时,此时其经以1:100体积比添加的T细胞TransActTM人类试剂(Miltenyi,目录号130-111-160)活化。T细胞在电穿孔之前活化48小时。
实施例41.2用RNA电穿孔进行T细胞编辑
在P3缓冲液中制备含有编码BC22n(SEQ ID NO:1)和UGI(SEQ ID NO:34)的mRNA的溶液。将100μM CIITA靶向sgRNA从其储存板移出,并在95℃下变性2分钟,并且在室温下温育5分钟。活化后四十八小时,采集T细胞,离心,并以12.5x10^6个T细胞/mL的浓度重悬于P3电穿孔缓冲液(Lonza)中。对于电穿孔,如表1中所描述,将1x10^5个T细胞与20ng/μL BC22nmRNA、20ng/μL UGI mRNA和20pmol sgRNA在最终体积为20μL的P3电穿孔缓冲液中混合。此混合物一式两份转移至96孔NucleofectorTM板中并使用制造商的脉冲码电穿孔。经电穿孔的T细胞立即在不含细胞因子的80μL CTS Optimizer T细胞生长培养基中静置15分钟,然后转移至含有额外80μL补充有2X细胞因子的CTS Optimizer T细胞生长培养基的新平底96孔板中。将所得板在37℃下温育10天。在电穿孔后第4天,细胞在2个U形底板中以1:2分裂。收集一个板用于NGS测序,而另一个板补充有含1X细胞因子的CTS Optimizer新鲜培养基。此板在第7天用于流式细胞术。
实施例41.3流式细胞术和NGS测序
编辑后第7天,通过流式细胞术测定T细胞以确定CD74和HLA-DR、DP、DQ的表面表达。简言之,将T细胞与在细胞染色缓冲液(BioLegend,目录号420201)中稀释的抗体的混合物一起在4℃下温育30分钟。抗CD3(BioLegend,目录号317336)、CD4(BioLegend,目录号317434)、CD8(BioLegend,目录号301046)和Viakrome(Beckman Coulter,目录号C36628)的抗体以1∶100稀释,并且抗HLA II-DR(BioLegend,目录号327018)、HLA II-DP(BDBiosciences,目录号750872)、HLA II-DQ(BioLegend,目录号561504)和CD74(BioLegend,目录号326808)的抗体以1∶50稀释。随后洗涤细胞,重悬于100μL细胞染色缓冲液中并且在Cytoflex流式细胞仪(Beckman Coulter)上进行处理。使用FlowJo软件包分析流式细胞术数据。T细胞基于大小、形状、活力、CD8、HLA II-DP、HLA II-DQ、HLA II-DR和CD74表达进行门控。
表104.用BC22n对CIITA进行基因组编辑之后对于表面蛋白质呈阴性的细胞的百分比。(n=2)
/>
/>
/>
/>
/>
/>
在编辑后第4天,对DNA样本进行PCR和后续NGS分析,如实施例1中所描述。表105显示用BC22n编辑的T细胞中的CIITA编辑结果。
表105-在CIITA基因座处用BC22n的平均编辑百分比。(n=2)
/>
/>
/>
/>
/>
实施例42-在T细胞中筛选与BC22n呈剂量-反应的CIITA sgRNA
进一步测定实施例41中鉴定的高效CIITA sgRNA在T细胞中在多个引导物浓度下的碱基编辑功效。通过NGS或通过流式细胞术破坏HLA-DR、DP、DQ的表面蛋白质表达测定每一者的效力的基因组编辑功效。
实施例42.1T细胞制备
健康人类供体血球分离术是商购获得的(Hemacare),并且将细胞洗涤并重悬于PBS/EDTA缓冲液(Miltenyi Biotec目录号1 30-070-525)中并且在MultiMACSTM Cell 24Separator Plus装置(Miltenyi Biotec)中进行处理。使用Straightfrom/>CD4/CD8 MicroBead试剂盒,人类(Miltenyi Biotec目录号130-122-352)经由阳性选择分离T细胞。将T细胞等分并在/>CS10(StemCell Technologies目录号07930)中冷冻保存以供将来使用。/>
在解冻后,将T细胞以1.0x10^6个细胞/mL的密度接种于由以下各者构成的T细胞生长培养基(TCGM)中:CTS OpTmizer T细胞扩增SFM和T细胞扩增补充物(ThermoFisher目录号A1048501)、5%人类AB血清(GeminiBio,目录号100-512)、1X青霉素-链霉素、1XGlutamax、10mM HEPES、200U/mL重组人类白细胞介素-2(Peprotech,目录号200-02)、5ng/mL重组人类白细胞介素7(Peprotech,目录号200-07)和5ng/mL重组人类白细胞介素15(Peprotech,目录号200-15)。T细胞在此培养基中静置24小时,此时其经以1∶100体积比添加的T细胞TransActTM人类试剂(Miltenyi,目录号130-111-160)活化。T细胞在电穿孔之前活化48小时。
实施例42.2用RNA电穿孔进行T细胞编辑
在P3缓冲液中制备含有编码BC22n(SEQ ID NO:1)和UGI(SEQ ID NO:34)的mRNA的溶液。将100μM靶向sgRNA的CIITA从其储存板移出,并在95℃下变性2分钟,并且在室温下温育5分钟。活化后四十八小时,采集T细胞,离心,并以12.5x10^6个T细胞/mL的浓度重悬于P3电穿孔缓冲液(Lonza)中。在96孔PCR板中从60pmol开始,一式两份地在P3电穿孔缓冲液中以1∶2的比率连续稀释每个sgRNA。稀释之后,将1x10^5个T细胞、20ng/μL BC22n mRNA和20ng/μL UGI mRNA与sgRNA板混合以制备最终体积为20μL的P3电穿孔缓冲液。此混合物转移至4个对应96孔NucleofectorTM板中并使用制造商的脉冲码电穿孔。经电穿孔的T细胞立即在不含细胞因子的80μL CTS Optimizer T细胞生长培养基中静置15分钟,然后转移至含有额外80μL补充有2X细胞因子的CTS OpTmizer T细胞生长培养基的新平底96孔板中。将所得板在37℃下温育7天。在电穿孔后第4天,细胞在2个U形底板中以1∶2分裂,并且收集一个板用于NGS测序,而将另一个板补充有含有1X细胞因子的CTS Optimizer新鲜培养基。此板在第7天用于流式细胞术。
实施例42.3流式细胞术和NGS测序
编辑后第7天,通过流式细胞术测定T细胞以确定HLA-DR、DP、DQ的表面表达。简言之,将T细胞与在细胞染色缓冲液(BioLegend,目录号420201)中稀释的抗体的混合物一起在4℃下温育30分钟。抗CD3(BioLegend,目录号317336)、CD4(BioLegend,目录号317434)、CD8(BioLegend,目录号301046)和Viakrome(Beckman Coulter,目录号C36628)的抗体以1∶100稀释,并且抗HLAII-DR、DP、DQ(BioLegend,目录号361714)的抗体以1∶50稀释。随后洗涤细胞,重悬于100μL细胞染色缓冲液中并在Cytoflex流式细胞仪(Beckman Coulter)上进行处理。使用FlowJo软件包分析流式细胞术数据。T细胞基于大小、形状、活力、CD8和HLA-DR、DP、DO进行门控。
表106显示CIITA编辑结果和在用BC22n进行碱基编辑之后T细胞中对于HLA-DR、DP、DQ呈阴性的T细胞的百分比。
表106-编辑百分比和在用BC22n碱基编辑器进行CIITA编辑之后的HLA II-DP、DQ、DR阴性细胞的百分比
/>
/>
/>
/>
/>
实施例43.额外实施方案
以下经编号实施方案提供对本文中的实施方案的额外支持和描述。
实施方案A1.一种mRNA,所述mRNA包含编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽的开放阅读框,其中所述多肽不包含尿嘧啶糖苷酶抑制剂(UGI)。
实施方案A2.一种组合物,所述组合物包含:第一mRNA,其包含编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽的第一开放阅读框;和第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框,其中所述第二mRNA不同于所述第一mRNA,任选地其中所述组合物包含脂质纳米粒子。
实施方案A3.如实施方案A2所述的组合物,其中所述第一多肽不包含UGI。
实施方案A4.如实施方案A2或A3所述的组合物,其中所述第二mRNA与所述第一mRNA的摩尔比为1∶1至30∶1。
实施方案A5.一种修饰目标基因的方法,所述方法包括向细胞递送:第一mRNA,其包含编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的第一多肽的第一开放阅读框;第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框,其中所述第二mRNA不同于所述第一mRNA;和至少一种引导RNA(gRNA)。
实施方案A6.如实施方案A2-A5中任一项所述的组合物或方法,其中所述第二mRNA与所述第一mRNA的摩尔比为1∶1至30∶1。
实施方案A7.如实施方案A4-A6中任一项所述的组合物或方法,其中所述摩尔比为2∶1至30∶1。
实施方案A8.如实施方案A4-A6中任一项所述的组合物或方法,其中所述摩尔比为7∶1至22∶1。
实施方案A9.一种细胞,所述细胞包含含有以下的组合物:第一mRNA,所述第一mRNA包含编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽的第一开放阅读框;和第二mRNA,所述第二mRNA包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框,其中所述第二mRNA不同于所述第一mRNA。
实施方案A10.一种工程化细胞,所述工程化细胞包含至少一种碱基编辑和/或插入/缺失,其中所述碱基编辑和/或插入/缺失是通过使细胞与组合物接触而形成,所述组合物包含含有编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽的第一开放阅读框的第一mRNA和包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框的第二mRNA,其中所述第二mRNA不同于所述第一mRNA。
实施方案A11.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A包含与SEQ ID NO:40具有至少87%同一性的氨基酸序列。
实施方案A12.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A包含与SEQ ID NO:40具有至少90%同一性的氨基酸序列。
实施方案A13.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A包含与SEQ ID NO:40具有至少95%同一性的氨基酸序列。
实施方案A14.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A包含与SEQ ID NO:40具有至少98%同一性的氨基酸序列。
实施方案A15.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A包含与SEQ ID NO:40具有至少99%同一性的氨基酸序列。
实施方案A16.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A包含SEQ ID NO:40的氨基酸序列。
实施方案A17.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A为人类A3A。
实施方案A18.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A为野生型A3A。
实施方案A19.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,其中所述UGI包含与SEQ ID NO:27具有至少80%同一性的氨基酸序列。
实施方案A20.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,其中所述UGI包含与SEQ ID NO:27具有至少90%同一性的氨基酸序列。
实施方案A21.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,其中所述UGI包含与SEQ ID NO:27具有至少95%同一性的氨基酸序列。
实施方案A22.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,其中所述UGI包含与SEQ ID NO:27具有至少98%同一性的氨基酸序列。
实施方案A23.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,其中所述UGI包含与SEQ ID NO:27具有至少99%同一性的氨基酸序列。
实施方案A24.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,其中所述UGI包含SEQ ID NO:27的氨基酸序列。
实施方案A25.如前述实施方案中任一项所述的组合物、方法或细胞,所述组合物、方法或细胞还包含至少一种引导RNA(gRNA)。
实施方案A26.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,所述组合物、方法、细胞或工程化细胞包含gRNA,其中所述gRNA为sgRNA。
实施方案A27.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,所述组合物、方法、细胞或工程化细胞包含gRNA,其中所述gRNA为dgRNA。
实施方案A28.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,所述组合物、方法、细胞或工程化细胞包含gRNA,其中所述gRNA为包含含有发夹区的sgRNA的保守部分的短单引导RNA(短sgRNA),其中所述发夹区缺少至少5-10个核苷酸,并且其中所述短sgRNA包含5′端修饰和/或3′端修饰。
实施方案A29.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为Cas切口酶。
实施方案A30.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为2类Cas切口酶。
实施方案A31.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为Cas9切口酶。
实施方案A32.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为化脓性链球菌Cas9切口酶。
实施方案A33.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为D10A SpyCas9切口酶。
实施方案A34.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为脑膜炎奈瑟菌Cas9切口酶。
实施方案A35.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为D16A Nme2 Cas9切口酶。
实施方案A36.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶包含与SEQ ID NO:70、73或76中的任一者具有至少80%、90%、95%、98%或99%同一性的氨基酸序列。
实施方案A37.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶包含SEQ ID NO:70、73或76中的任一者的氨基酸序列。
实施方案A38.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码所述RNA引导的切口酶的序列包含与SEQ ID NO:72、75或78中的任一者的核苷酸序列具有至少80%、90%、95%、98%或99%同一性的核苷酸序列。
实施方案A39.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码所述RNA引导的切口酶的序列包含与SEQ ID NO:72、75或78中的任一者的核苷酸序列具有至少90%同一性的核苷酸序列。
实施方案A40.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码所述RNA引导的切口酶的序列包含与SEQ ID NO:72、75或78中的任一者的核苷酸序列具有至少95%同一性的核苷酸序列。
实施方案A41.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码所述RNA引导的切口酶的序列包含与SEQ ID NO:72、75或78中的任一者的核苷酸序列具有至少98%同一性的核苷酸序列。
实施方案A42.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码所述RNA引导的切口酶的序列包含与SEQ ID NO:72、75或78中的任一者的核苷酸序列具有至少99%同一性的核苷酸序列。
实施方案A43.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码所述RNA引导的切口酶的序列包含SEQ ID NO:71、72、74、75或77-90中的任一者的核苷酸序列。
实施方案A44.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述mRNA包含与SEQ ID NO:91-98中的任一者具有至少90%同一性的5′UTR。
实施方案A45.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述mRNA包含与SEQ ID NO:99-106中的任一者具有至少90%同一性的3′UTR。
实施方案A46.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述mRNA包含来自同一来源的5′UTR和3′UTR。
实施方案A47.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述mRNA包含选自Cap0、Cap1和Cap2的5′帽。
实施方案A48.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽的开放阅读框和/或编码尿嘧啶糖苷酶抑制剂(UGI)的开放阅读框包含最小腺嘌呤密码子和/或最小尿苷密码子。
实施方案A49.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽的开放阅读框和/或编码尿嘧啶糖苷酶抑制剂(UGI)的开放阅读框包含最小腺嘌呤密码子。
实施方案A50.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽的开放阅读框和/或编码尿嘧啶糖苷酶抑制剂(UGI)的开放阅读框具有增加哺乳动物中的mRNA翻译的密码子。
实施方案A51.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽的开放阅读框和/或编码尿嘧啶糖苷酶抑制剂(UGI)的开放阅读框具有增加哺乳动物中的mRNA翻译的密码子,其中所述哺乳动物为人类。
实施方案A52.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A位于所述多肽中的RNA引导的切口酶的N末端。
实施方案A53.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中经编码RNA引导的切口酶包含核定位信号(NLS)。
实施方案A54.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码RNA引导的切口酶包含核定位信号(NLS),并且其中所述NLS处于所述RNA引导的切口酶的C末端。
实施方案A55.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码RNA引导的切口酶包含核定位信号(NLS),并且其中所述NLS处于所述RNA引导的切口酶的N末端,或者其中NLS融合到所述RNA引导的切口酶的N末端和C末端两者。
实施方案A56.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码RNA引导的切口酶包含核定位信号(NLS),并且其中接头存在于RNA引导的切口酶的N末端与NLS之间,任选地其中所述接头为肽接头。
实施方案A57.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码RNA引导的切口酶包含核定位信号(NLS),并且其中所述NLS包含与SEQ ID NO:63和110-122中的任一者具有至少80%、85%、90%或95%同一性的序列。
实施方案A58.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码RNA引导的切口酶包含核定位信号(NLS),并且其中所述NLS包含SEQID NO:63和110-122中的任一者的序列。
实施方案A59.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码RNA引导的切口酶包含核定位信号(NLS),并且其中所述NLS由与SEQID NO:123-135中的任一者的序列具有至少80%、85%、90%、95%、98%或100%同一性的序列编码。
实施方案A60.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码RNA引导的切口酶包含核定位信号(NLS),并且其中所述A3A位于所述多肽中的所述NLS的N末端。
实施方案A61.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码RNA引导的切口酶包含核定位信号(NLS),并且其中所述RNA引导的切口酶位于所述多肽中的所述NLS的N末端。
实施方案A62.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽的开放阅读框包含与SEQ ID NO:1的序列具有至少80%、85%、90%、95%、98%或100%同一性的序列。
实施方案A63.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽的开放阅读框包含与序列SEQ ID NO:4具有至少80%、85%、90%、95%、98%或100%同一性的序列。
实施方案A64.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述mRNA中至少10%的尿苷由经修饰的尿苷取代。
实施方案A65.如实施方案A64所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经修饰的尿苷为N1-甲基-假尿苷、假尿苷、5-甲氧基尿苷或5-碘尿苷中的一者或多者。
实施方案A66.如实施方案A64或A65所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经修饰的尿苷为N1-甲基-假尿苷或5-甲氧基尿苷中的一者或两者。
实施方案A67.如实施方案A64-A66中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经修饰的尿苷为N1-甲基-假尿苷。
实施方案A68.如实施方案A64-A66中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经修饰的尿苷为5-甲氧基尿苷。
实施方案A69.如实施方案A64-A68中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中15%至45%的尿苷由经修饰的尿苷取代。
实施方案A70.如实施方案A64-A69中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中至少20%或至少30%的尿苷由经修饰的尿苷取代。
实施方案A71.如实施方案A64-A70中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中至少80%或至少90%的尿苷由经修饰的尿苷取代。
实施方案A72.如实施方案A64-A71中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中100%的尿苷由经修饰的尿苷取代。
实施方案A73.如前述实施方案中任一项所述的mRNA、组合物、方法或细胞,所述mRNA、组合物、方法或细胞进一步编码A3A与RNA引导的切口酶之间的肽接头,任选地其中所述肽接头为XTEN。
实施方案A74.如前述实施方案中任一项所述的mRNA、组合物、方法或细胞,所述mRNA、组合物、方法或细胞进一步编码所述A3A与RNA引导的切口酶之间的肽接头,其中所述肽接头包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个或更多个氨基酸。
实施方案A75.如前述实施方案中任一项所述的mRNA、组合物、方法或细胞,所述mRNA、组合物、方法或细胞进一步编码所述A3A与RNA引导的切口酶之间的肽接头,其中所述肽接头包含选自SEQ ID NO:46-59和211-267的一个或多个序列。
实施方案A76.一种多肽,所述多肽由如前述实施方案A中任一项所述的mRNA编码。
实施方案A77.一种载体,所述载体包含如前述实施方案A中任一项所述的mRNA。
实施方案A78.一种表达构建体,所述表达构建体包含可操作地连接到编码如前述实施方案A中任一项所述的mRNA的序列的启动子。
实施方案A79.一种质粒,所述质粒包含实施方案A78所述的表达构建体。
实施方案A80.一种宿主细胞,所述宿主细胞包含实施方案A77所述的载体、实施方案A78所述的表达构建体或实施方案A79所述的质粒。
实施方案A81.如前述实施方案中任一项所述的mRNA或组合物,其中所述mRNA或组合物被配制为脂质核酸组装组合物,任选地为脂质纳米粒子。
实施方案A82.根据前述实施方案中任一项所述的mRNA或组合物用于修饰细胞中的目标基因的用途。
实施方案A83.根据前述实施方案中任一项所述的mRNA或组合物用于制造用于修饰细胞中的目标基因的药剂的用途。
实施方案A84.一种修饰细胞中的目标基因的方法,所述方法包括向所述细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,所述脂质核酸组装组合物包含:
(a)第一mRNA,其包含编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽的第一开放阅读框;
(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和
(c)一种或多种引导RNA。
实施方案A85.如实施方案A84所述的方法,其中部分(a)和(b)在单独的脂质核酸组装组合物中。
实施方案A86.如实施方案A84所述的方法,其中部分(a)和(b)在同一脂质核酸组装组合物中。
实施方案A87.如实施方案A84所述的方法,其中部分(a)和(c)在单独的脂质核酸组装组合物中。
实施方案A88.如实施方案A84所述的方法,其中部分(a)和(c)在同一脂质核酸组装组合物中。
实施方案A89.如实施方案A84所述的方法,其中部分(b)和(c)在单独的脂质核酸组装组合物中。
实施方案A90.如实施方案A84所述的方法,其中部分(a)和(c)在同一脂质核酸组装组合物中,并且部分(b)在单独的脂质核酸组装组合物中。
实施方案A91.如实施方案A84所述的方法,其中部分(a)、(b)和(c)各自在单独的脂质核酸组装组合物中。
实施方案A92.如实施方案A84所述的方法,其中部分(a)、(b)和(c)在同一脂质核酸组装组合物中。
实施方案A93.如实施方案A84-A88、A90和A92中任一项所述的方法,其中所述一种或多种引导RNA各自在单独的脂质核酸组装组合物中。
实施方案A94.如实施方案A84-A93中任一项所述的方法,所述方法包括向所述细胞递送脂质核酸组装组合物,所述脂质核酸组装组合物包含在同一脂质核酸组装组合物中的包含编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽的第一开放阅读框的第一mRNA和包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框的第二mRNA。
实施方案A95.如实施方案A84至A93中任一项所述的方法,所述方法包括向细胞递送:第一脂质核酸组装组合物,其包含含有编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽的第一开放阅读框的第一mRNA;和第二脂质核酸组装组合物,其包含含有编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框的第二mRNA。
实施方案A96.如实施方案A84-A95中任一项所述的方法,所述方法还包括递送一种或多种脂质核酸组装组合物中的一种或多种引导RNA,所述一种或多种脂质核酸组装组合物与包含所述A3A和UGI的脂质核酸组装组合物分离。
实施方案A97.如实施方案A84-A96中任一项所述的方法,其中向所述细胞递送至少2、3、4、5、6、7、8、9或10种脂质核酸组装组合物。
实施方案A98.如实施方案A84-A97中任一项所述的方法,其中至少一种脂质核酸组装组合物包含脂质纳米粒子(LNP),任选地其中所有脂质核酸组装组合物包含LNP。
实施方案A99.如实施方案A84-A98中任一项所述的方法,其中至少一种脂质核酸组装组合物为脂质复合物组合物。
实施方案A100.如实施方案A84-A99中任一项所述的方法,其中所述脂质核酸组装组合物包含可离子化脂质。
实施方案A101.如实施方案A84-A100中任一项所述的方法,其中所述脂质核酸组装组合物包含可离子化脂质,并且其中所述可离子化脂质包含可生物降解的可离子化脂质。
实施方案A102.如实施方案A84-A101中任一项所述的方法,其中所述脂质核酸组装组合物包含可离子化脂质,并且其中所述可离子化脂质的PK值在约5.1至约7.4的范围内的pKa的范围内,所述pKa在例如约5.5至约6.6、约5.6至约6.4、约5.8至约6.2、或约5.8至约6.5的范围内。
实施方案A103.如实施方案A84-A102中任一项所述的方法,其中所述脂质核酸组装组合物包含胺脂质。
实施方案A104.如实施方案A84-A103中任一项所述的方法,其中所述脂质核酸组装组合物包含脂质A。
实施方案A105.如实施方案A84-A104中任一项所述的方法,其中所述脂质核酸组装组合物包含辅助脂质。
实施方案A106.如实施方案A84-A105中任一项所述的方法,其中所述脂质核酸组装组合物包含辅助脂质,其中所述辅助脂质为胆固醇。
实施方案A107.如实施方案A84-A106中任一项所述的方法,其中所述脂质核酸组装组合物包含隐形脂质。
实施方案A108.如实施方案A84-A107中任一项所述的方法,其中所述脂质核酸组装组合物包含隐形脂质,其中所述隐形脂质为PEG2k-DMG。
实施方案A109.如实施方案A84-A108中任一项所述的方法,其中所述脂质核酸组装组合物包含中性脂质。
实施方案A110.如实施方案A84-A109中任一项所述的方法,其中所述脂质核酸组装组合物包含中性脂质,其中所述中性脂质为DSPC。
实施方案A111.如实施方案A84-A110中任一项所述的方法,其中所述脂质核酸组装组合物包含中性脂质,其中所述中性脂质以约9mol%存在。
实施方案A112.如实施方案A84-A111中任一项所述的方法,其中所述脂质核酸组装组合物包含隐形脂质,其中所述隐形脂质以约3mol%存在。
实施方案A113.如实施方案A84-A112中任一项所述的方法,其中所述脂质核酸组装组合物包含辅助脂质,其中所述辅助脂质以约38mol%存在。
实施方案A114.如实施方案A84-A113中任一项所述的方法,其中所述脂质核酸组装组合物的N/P比为约6。
实施方案A115.如实施方案A84-A114中任一项所述的方法,其中所述脂质核酸组装组合物包含约50mol%胺脂质如脂质A;约9mol%中性脂质如DSPC;约3mol%隐形脂质如PEG脂质,例如PEG2k-DMG,并且所述脂质组分的其余部分为辅助脂质如胆固醇,其中所述N/P比为约6。
实施方案A116.如实施方案A84-A115中任一项所述的方法,所述方法包含靶向降低或消除细胞表面上的MHC I类表达的基因的一种gRNA,和/或靶向降低或消除细胞表面上的MHC II类表达的基因的一种gRNA,和/或靶向降低或消除内源性TCR表达的基因的一种gRNA。
实施方案A117.如实施方案A84-A115中任一项所述的方法,所述方法包含选自以下的至少两种gRNA:靶向降低或消除细胞表面上的MHC I类表达的基因的一种gRNA、靶向降低或消除细胞表面上的MHC II类表达的基因的一种gRNA和靶向降低或消除内源性TCR表达的基因的一种gRNA。
实施方案A118.如实施方案A84-A115中任一项所述的方法,所述方法包含靶向降低或消除细胞表面上的MHC I类表达的基因的一种gRNA、靶向降低或消除细胞表面上的MHCII类表达的基因的一种gRNA和靶向降低或消除内源性TCR表达的一种gRNA。
实施方案A119.如实施方案A84-A115中任一项所述的方法,所述方法包含选自靶向TRAC、TRBC、B2M、HLA-A或CIITA的gRNA的一种gRNA。
实施方案A120.如实施方案A84-A116和A119中任一项所述的方法,其中所述gRNA靶向TRBC,其中所述gRNA包含选自以下的引导序列:i)SEQ ID NO:706-721;ii)选自SEQ IDNO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列。
实施方案A121.如实施方案A84-A116和A119中任一项所述的方法,其中所述gRNA靶向TRBC,其中所述gRNA包含选自以下的引导序列:i)SEQ ID NO:618-669;ii)选自SEQ IDNO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列。
实施方案A122.如实施方案A84-A115中任一项所述的方法,所述方法包含选自靶向TRAC、TRBC或B2M的gRNA的至少两种gRNA,其中两种引导RNA不靶向相同基因。
实施方案A123.如实施方案A84-A115中任一项所述的方法,所述方法包含选自靶向TRAC、TRBC或HLA-A的gRNA的至少两种gRNA,其中两种引导RNA不靶向相同基因。
实施方案A124.如实施方案A84-A115中任一项所述的方法,所述方法包含靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA。
实施方案A125.如实施方案A84-A115中任一项所述的方法,所述方法包含靶向B2M的一种引导RNA和靶向CIITA的一种gRNA。
实施方案A126.如实施方案A84-A115中任一项所述的方法,所述方法包含靶向HLA-A的一种引导RNA和靶向CIITA的一种gRNA,任选地其中所述细胞对于HLA-B为同型接合的并且对于HLA-C为同型接合的。
实施方案A127.如实施方案A84-A115中任一项所述的方法,所述方法包含靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA和靶向B2M的一种gRNA。
实施方案A128.如实施方案A84-A115中任一项所述的方法,所述方法包含靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA和靶向HLA-A的一种gRNA,任选地其中所述细胞对于HLA-B为同型接合的并且对于HLA-C为同型接合的。
实施方案A129.如实施方案A84-A115中任一项所述的方法,所述方法包含靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA、靶向B2M的一种gRNA和靶向CIITA的一种gRNA。
实施方案A130.如实施方案A84-A115中任一项所述的方法,所述方法包含靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA、靶向HLA-A的一种gRNA和靶向CIITA的一种gRNA,任选地其中所述细胞对于HLA-B为同型接合的并且对于HLA-C为同型接合的。
实施方案A131.如前述实施方案中任一项所述的方法,其中所述方法产生目标序列内的胞嘧啶(C)至胸腺嘧啶(T)转化。
实施方案A132.如前述实施方案中任一项所述的方法,其中相对于所述目标序列中的总编辑,所述方法引起至少60%C-T转化。
实施方案A133.如前述实施方案中任一项所述的方法,其中相对于所述目标序列中的总编辑,所述方法引起至少65%、70%、75%、80%、85%、90%、95%、98%或99%的C-T转化。
实施方案A134.如前述实施方案中任一项所述的方法,其中C-T转化与非预期编辑的比率大于1∶1。
实施方案A135.如前述实施方案中任一项所述的方法,其中C-T转化与非预期编辑的比率为2∶1至99∶1。
实施方案A136.如前述实施方案中任一项所述的方法,其中C-T转化与非预期编辑的比率为2∶1、3∶1、4∶1、5∶1、6∶1、7∶1或8∶1。
实施方案A137.如前述实施方案中任一项所述的方法,其中所述方法使A3A进行对应于相对于所述引导序列的5′端的位置-1至位置10中的任一者的碱基编辑。
实施方案A138.如前述实施方案中任一项所述的方法,其中所述方法使所述A3A在距所述引导序列的5′端的1、2、3、4、5、6、7、8、9或10个核苷酸位置处进行碱基编辑。
实施方案A139.如前述实施方案中任一项所述的方法,其中所述第一mRNA、所述第二mRNA和所述引导RNA在存在时以约6∶2∶3(w∶w∶w)的比率递送。
实施方案A140.如前述实施方案中任-项所述的方法,其中所述mRNA、组合物或LNP以5至600ng的总RNA量施用。
实施方案A141.如前述实施方案中任一项所述的方法,其中所述总RNA量为8至550ng。
实施方案A142.如前述实施方案中任一项所述的方法,其中所述总RNA量为35至550ng。
实施方案A143.如前述实施方案中任一项所述的方法,其中所述总RNA量为70至550ng。
实施方案A144.如前述实施方案中任一项所述的方法,其中所述总RNA量为138至550ng。
实施方案A145.如前述实施方案中任一项所述的方法,其中所述总RNA量为275至550ng。
实施方案A146.如前述实施方案中任一项所述的方法、细胞或工程化细胞,其中所述细胞为淋巴细胞。
实施方案A147.如前述实施方案中任一项所述的方法、细胞或工程化细胞,其中所述细胞为B淋巴细胞。
实施方案A148.如前述实施方案中任一项所述的方法、细胞或工程化细胞,其中所述细胞为T淋巴细胞。
实施方案A149.如前述实施方案中任一项所述的方法或用途,其中所述目标基因的修饰是在体内进行。
实施方案A150.如前述实施方案中任一项所述的方法或用途,其中所述目标基因的修饰是离体进行。
实施方案A151.如前述实施方案中任一项所述的方法或用途,其中所述目标基因的修饰降低或消除所述目标基因的表达。
实施方案A152.如前述实施方案中任一项所述的方法或用途,其中所述目标基因的基因组编辑或修饰使所述目标基因的表达降低至少50%、55%、60%、65%、70%、75%、80%、85%、90%、或95%。
实施方案A153.如前述实施方案中任一项所述的方法或用途,其中所述目标基因的基因组编辑或修饰在所述基因中产生错义突变。
实施方案A154.一种多肽,所述多肽包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶,其中所述多肽不包含尿嘧啶糖苷酶抑制剂(UGI)。
实施方案A155.一种组合物,所述组合物包含:第一多肽,其包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶;和第二多肽,其包含UGI,其中所述第二多肽不同于所述第一多肽。
实施方案A156.如实施方案A152或A153所述的多肽,其中所述A3A经由肽接头,任选地XTEN融合到所述RNA引导的切口酶。
实施方案A157.如实施方案A152或A153所述的多肽,其中所述A3A连接到包含有机分子、聚合物或化学部分的接头。
实施方案A158.一种药物组合物,所述药物组合物包含前述实施方案A中任一项所述的mRNA、组合物或多肽,和药学上可接受的载剂。
实施方案A159.一种试剂盒,所述试剂盒包含前述实施方案A中任一项所述的mRNA、组合物或多肽。
实施方案A160.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽以氨基至羧基末端顺序包括:A3A、接头和RNA引导的切口酶。
实施方案A161.一种改变TRAC基因内的DNA序列的方法,所述方法包括向细胞递送:
(a)包含选自以下的引导序列的gRNA:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
(b)编码(a.)的gRNA的核酸。
实施方案A162.一种降低TRAC基因的表达的方法,所述方法包括向细胞递送:
(a)包含选自以下的引导序列的gRNA:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
(b)编码(a.)的gRNA的核酸。
实施方案A163.一种免疫疗法的方法,所述方法包括向受试者施用包含工程化细胞的组合物,
其中所述细胞包含选自以下的基因组坐标内的至少一个核苷酸的基因修饰:
chr14:22547596-22547616;chr14:22550570-22550590;chr14:22547763-22547783;chr14:22550596-22550616;chr14:22550566-22550586;chr14:22547753-22547773;chr14:22550601-22550621;chr14:22550599-22550619;chr14:22547583-22547603;chr14:22547671-22547691;chr14:22547770-22547790;chr14:22547676-22547696;chr14:22547772-22547792;chr14:22547771-22547791;chr14:22547733-22547753;chr14:22547776-22547796;或其中所述细胞是通过向所述细胞递送以下各物而经工程化:
(a)包含选自以下的引导序列的gRNA:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
(b)编码(a.)的gRNA的核酸。
实施方案A164.如实施方案A161-A163中任一项所述的方法,其中所述引导序列包含SEQ ID NO:706-709中的任一者。
实施方案A165.如实施方案A161-A164中任一项所述的方法,其中所述引导序列包含SEQ ID NO:706-708中的任一者。
实施方案A166.如实施方案A161-A165中任一项所述的方法,其中所述引导序列包含SEQ ID NO:706。
实施方案A167.如实施方案A161-A165中任一项所述的方法,其中所述引导序列包含SEQ ID NO:707。
实施方案A168.如实施方案A161-A165中任一项所述的方法,其中所述引导序列包含SEQ ID NO:708。
实施方案A169.一种改变TRBC1和/或TRBC2基因内的DNA序列的方法,所述方法包括向细胞递送组合物,其中所述组合物包含:
(a)包含选自以下的引导序列的gRNA:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
(b)编码(a.)的引导RNA的核酸。
实施方案A170.一种降低TRBC1和/或TRBC2基因的表达的方法,所述方法包括向细胞递送组合物,其中所述组合物包含:
(a)包含选自以下的引导序列的gRNA:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
(b)编码(a.)的引导RNA的核酸。
实施方案A171.一种免疫疗法的方法,所述方法包括向受试者施用包含工程化细胞的组合物,
其中所述细胞包含选自以下的基因组坐标内的至少一个核苷酸的修饰:chr7:142791757-142791777;chr7:142801104-142801 124;chr7:142791811-142791831;chr7:142801158-142801 178;chr7:142792728-142792748;chr7:142791719-142791739;chr7:142791766-142791786;chr7:142801113-142801133;chr7:142791928-142791948;chr7:142801275-142801295;chr7:142792062-142792082;chr7:142801409-142801429;chr7∶142792713-142792733;chr7:142802126-142802146;chr7:142791808-142791828;chr7:142801155-142801175;chr7:142792003-142792023;chr7:142801350-142801370;chr7:142791760-142791780;chr7:142791715-142791735;chr7:142792781-142792801;chr7:142792040-142792060;chr7:142801387-142801407;chr7:142791862-142791882;chr7:142791716-142791736;chr7:142791787-142791807;chr7:142791759-142791779;chr7:142801106-142801126;chr7:142791807-142791827;chr7:142801154-142801174;chr7:142791879-142791899;chr7:142801226-142801246;chr7:142791805-142791825;chr7:142791700-142791720;chr7:142791765-142791785;chr7:142801112-142801132;chr7∶142791820-142791840;chr7:142791872-142791892;chr7:142801219-142801239;chT7:142791700-142791720;chr7:142791806-142791826;chr7:142801153-142801173;chr7:142792035-142792055;chr7:142792724-142792744;chr7:142792754-142792774;chr7:142791804-142791824;chr7:142792684-142792704;chr7:142791823-142791843;chr7:142792728-142792748;chr7:142792721-142792741;chr7:142792749-142792769;chr7:142792685-142792705;chr7:142791816-142791836;chr7:142801163-142801183;chr7:142792686-142792706;chr7:142791793-142791813;chr7:142793110-142793130;chr7:142791815-142791835;chr7:142801162-142801182;chr7:142792770-142792790;chr7:142792047-142792067;chr7:142801394-142801414;chr7:142791871-142791891;chr7:142801218-142801238;chr7:142791894-142791914;chr7:142792723-142792743;chr7:142792724-142792744;chr7:142791897-142791917;chr7:142801244-142801264;chr7:142792757-142792777;chr7:142792740-142792760;chr7:142792758-142792778;或
其中所述细胞是通过向细胞递送以下各物而经工程化:
(a)包含选自以下的引导序列的gRNA:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
(b)编码(a.)的引导RNA的核酸。
实施方案A172.如实施方案A169-A171中任一项所述的方法,其中所述引导序列包含SEQ ID NO:618-627中的任一者。
实施方案A173.如实施方案A169-A172中任一项所述的方法,其中所述引导序列包含SEQ ID NO:618-621中的任一者。
实施方案A174.如实施方案A169-A173中任一项所述的方法,其中所述引导序列包含SEQ ID NO:618。
实施方案A175.如实施方案A169-A173中任一项所述的方法,其中所述引导序列包含SEQ ID NO:619。
实施方案A176.如实施方案A169-A173中任一项所述的方法,其中所述引导序列包含SEQ ID NO:620。
实施方案A177.如实施方案A169-A173中任一项所述的方法,其中所述引导序列包含SEQ ID NO:621。
实施方案A178.如实施方案A161-A177中任一项所述的方法,其中所述组合物还包含实施方案A1-A76中任一项所述的mRNA或组合物。
实施方案A179.一种组合物,所述组合物包含:
(a)包含选自以下的引导序列的gRNA:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;和任选地
(b)实施方案A1-A76中任一项所述的mRNA或组合物。
实施方案A180.如实施方案A179所述的组合物,其中所述引导序列包含SEQ IDNO:706-709中的任一者。
实施方案A181.如实施方案A179或A180所述的组合物,所述组合物用于改变细胞中的TRAC基因内的DNA序列。
实施方案A182.如实施方案A179-A181中任一项所述的组合物,所述组合物用于降低细胞中的TRAC基因的表达。
实施方案A183.如实施方案A179-A182中任一项所述的组合物,所述组合物用于受试者的免疫疗法中。
实施方案A184.一种组合物,所述组合物包含:
(a)包含选自以下的引导序列的gRNA:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;和任选地
(b)实施方案A1 1-A75中任一项所述的mRNA或组合物。
实施方案A185.如实施方案A184所述的组合物,其中所述引导序列包含SEQ IDNO:618-621中的任一者。
实施方案A186.如实施方案A184或A185所述的组合物,所述组合物用于改变细胞中的TRBC1和/或TRBC2基因内的DNA序列。
实施方案A187.如实施方案A184至A186中任一项所述的组合物,所述组合物用于降低细胞中的TRBC1和/或TRBC2基因的表达。
实施方案A188.如实施方案A184至A187中任一项所述的组合物,所述组合物用于受试者的免疫疗法中。
实施方案A189.一种细胞,所述细胞是通过实施方案A120-A121和A161-A178中任一项所述的方法改变。
实施方案A190.如实施方案A189所述的细胞,其中所述细胞是离体改变的。
实施方案A191.如实施方案A189或A190所述的细胞,其中所述细胞为T细胞。
实施方案A192.如实施方案A189-A191中任一项所述的细胞,其中所述细胞为CD4+或CD8+T细胞。
实施方案A193.如实施方案A189-A192中任一项所述的细胞,其中所述细胞为哺乳动物细胞、灵长类动物细胞或人类细胞。
实施方案A194.如实施方案A189-A193中任一项所述的细胞,所述细胞用于受试者的免疫疗法中。
实施方案A195.一种已降低或消除TRAC的表面表达的工程化细胞,所述工程化细胞包含人类TRAC基因中的基因修饰,其中所述基因修饰包含选自以下的基因组坐标内的至少一个核苷酸的修饰:
chr14:22547596-22547616;chr14:22550570-22550590;chr14:22547763-22547783;chr14:22550596-22550616;chr14:22550566-22550586;chr14:22547753-22547773;chr14:22550601-22550621;chr14:22550599-22550619;chr14:22547583-22547603;chr14:22547671-22547691;chr14:22547770-22547790;chr14:22547676-22547696;chr14:22547772-22547792;chr14:22547771-22547791;chr14:22547733-22547753;chr14:22547776-22547796。
实施方案A196.一种已降低或消除TRBC1/2的表面表达的工程化细胞,所述工程化细胞包含人类TRBC1/2基因中的基因修饰,其中所述基因修饰包含选自以下的基因组坐标内的至少一个核苷酸的修饰:
chr7:142791757-142791777;chr7:142801104-142801124;chr7:142791811-142791831;chr7:142801158-142801178;chr7:142792728-142792748;chr7:142791719-142791739;chr7:142791766-142791786;chr7:142801113-142801 133;chr7:142791928-142791948;chr7:142801275-142801295;chr7:142792062-142792082;chr7:142801409-142801429;chr7:142792713-142792733;chr7:142802126-142802146;chr7:142791808-142791828;chr7:142801155-142801175;chr7:142792003-142792023;chr7:142801350-142801370;chr7:142791760-142791780;chr7:142791715-142791735;chr7:142792781-142792801;chr7:142792040-142792060;chr7:142801387-142801407;chr7:142791862-142791882;chr7:142791716-142791736;chr7:142791787-142791807;chr7:142791759-142791779;chr7:142801106-142801126;chr7:142791807-142791827;chr7:142801154-142801174;chr7:142791879-142791899;chr7:142801226-142801246;chr7:142791805-142791825;chr7:142791700-142791720;chr7:142791765-142791785;chr7:142801112-142801132;chr7:142791820-142791840;chr7:142791872-142791892;chr7:142801219-142801239;chr7:142791700-142791720;chr7:142791806-142791826;chr7:142801153-142801173;chr7:142792035-142792055;chr7:142792724-142792744;chr7:142792754-142792774;chr7:142791804-142791824;chr7:142792684-142792704;chr7:142791823-142791843;chr7:142792728-142792748;chr7:142792721-142792741;chr7:142792749-142792769;chr7:142792685-142792705;chr7:142791816-142791836;chr7:142801163-142801183;chr7:142792686-142792706;chr7:142791793-142791813;chr7:142793110-142793130;chr7:142791815-142791835;chr7:142801162-142801182;chr7:142792770-142792790;chr7:142792047-142792067;chr7:142801394-142801414;chr7:142791871-142791891;chr7:142801218-142801238;chr7:142791894-142791914;chr7:142792723-142792743;chr7:142792724-142792744;chr7:142791897-142791917;chr7:142801244-142801264;chr7:142792757-142792777;chr7:142792740-142792760;chr7:142792758-142792778。
实施方案A197.一种或多种脂质核酸组装组合物,任选地脂质纳米粒子,所述脂质核酸组装组合物包含:
(a)第一mRNA,其包含编码包含APOBEC3A脱氨酶(A3A)和RNA引导的切口酶的多肽的第一开放阅读框;
(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和
(c)一种或多种引导RNA。
实施方案A198.如前述实施方案中任一项所述的方法、细胞或工程化细胞,其中所述细胞为免疫细胞。
实施方案A199.如前述实施方案中任一项所述的方法、细胞或工程化细胞,其中所述细胞为淋巴细胞。
实施方案A200.如前述实施方案中任一项所述的方法、细胞或工程化细胞,其中所述细胞为T细胞。
以下经编号实施方案提供对本文中的实施方案的额外支持和描述。
实施方案B1.一种mRNA,所述mRNA包含编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的开放阅读框,其中所述多肽不包含尿嘧啶糖苷酶抑制剂(UGI)。
实施方案B2.一种组合物,所述组合物包含:第一mRNA,其包含编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的第一开放阅读框;和第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框,其中所述第二mRNA不同于所述第一mRNA,任选地其中所述组合物包含脂质纳米粒子。
实施方案B3.如实施方案B2所述的组合物,其中所述第一开放阅读框不包含编码UGI的序列。
实施方案B4.如实施方案B2或B3所述的组合物,其中所述第二mRNA与所述第一mRNA的摩尔比为1∶1至30∶1。
实施方案B5.如实施方案B2-B4中任一项所述的组合物,其中所述组合物包含第一组合物和第二组合物,其中所述第一组合物包含含有编码包含胞苷脱氨酶和RNA引导的切口酶并且不包含尿嘧啶糖苷酶抑制剂(UGI)的多肽的第一开放阅读框的第一mRNA,并且所述第二组合物包含含有编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框的第二mRNA,其中所述第二mRNA不同于所述第一mRNA,任选地其中所述组合物包含脂质纳米粒子。
实施方案B6.如实施方案B2-B5中任一项所述的组合物,其中所述第一mRNA和所述第二mRNA在同一或单独小瓶中。
实施方案B7.一种修饰目标基因的方法,所述方法包括向细胞递送:第一mRNA,其包含编码包含胞苷脱氨酶和RNA引导的切口酶的第一多肽的第一开放阅读框;第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框,其中所述第二mRNA不同于所述第一mRNA;和至少一种引导RNA(gRNA),其中如果所述切口酶为SpyCas9切口酶,则所述gRNA为SpyCas9 gRNA,并且如果所述切口酶为NmeCas9切口酶,则所述gRNA为Nme gRNA。
实施方案B8.如实施方案B2-B7中任一项所述的组合物或方法,其中所述第二mRNA与所述第一mRNA的摩尔比为1∶1至30∶1。
实施方案B9.如实施方案B2-B7中任一项所述的组合物或方法,其中所述摩尔比为2∶1至30∶1。
实施方案B10.如实施方案B2-B7中任一项所述的组合物或方法,其中所述摩尔比为7∶1至22∶1。
实施方案B11.一种细胞,所述细胞包含含有以下的组合物:第一mRNA,其包含编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的第一开放阅读框;和第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框,其中所述第二mRNA不同于所述第一mRNA。
实施方案B12.一种工程化细胞,所述工程化细胞包含至少一种碱基编辑和/或插入/缺失,其中所述碱基编辑和/或插入/缺失是通过使细胞与组合物接触而形成,所述组合物包含含有编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的第一开放阅读框的第一mRNA和包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框的第二mRNA,其中所述第二mRNA不同于所述第一mRNA。
实施方案B13.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述胞苷脱氨酶为
(i)APOBEC家族的酶,任选地为APOBEC3亚群的酶;
(ii)包含与SEQ ID NO:40、41和960-1023中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;
(iii)包含与SEQ ID NO:40、41和960-1013中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;
(iv)包含与SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;或
(v)包含与SEQ ID NO:40、976、981、984、986和1014-1023中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶。
实施方案B14.如实施方案B13所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述胞苷脱氨酶包含与SEQ ID NO:40、41和960-1023具有至少80%、85%、87%、90%、95%、98%、99%或100%同一性的氨基酸序列。
实施方案B15.如实施方案B13所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述胞苷脱氨酶包含与SEQ ID NO:40、41和960-1013具有至少80%、85%、87%、90%、95%、98%、99%或100%同一性的氨基酸序列。
实施方案B16.如实施方案B13所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述胞苷脱氨酶包含与SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009具有至少80%、85%、87%、90%、95%、98%、99%或100%同一性的氨基酸序列。
实施方案B17.如实施方案B13所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述胞苷脱氨酶包含与SEQ ID NO:40、976、981、984、986、1014-1023具有至少80%、85%、87%、90%、95%、98%、99%或100%同一性的氨基酸序列。
实施方案B18.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述胞苷脱氨酶为APOBEC3A脱氨酶(A3A)。
实施方案B19.如实施方案B18所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A包含与SEQ ID NO:40具有至少87%同一性的氨基酸序列。
实施方案B20.如实施方案B18所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A包含与SEQ ID NO:40具有至少90%同一性的氨基酸序列。
实施方案B21.如实施方案B18所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A包含与SEQ ID NO:40具有至少95%同一性的氨基酸序列。
实施方案B22.如实施方案B18所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A包含与SEQ ID NO:40具有至少98%同一性的氨基酸序列。
实施方案B23.如实施方案B18所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A包含与SEQ ID NO:40具有至少99%同一性的氨基酸序列。
实施方案B24.如实施方案B18所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A包含SEQ ID NO:40的氨基酸序列。
实施方案B25.如实施方案B18-B24中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A为人类A3A。
实施方案B26.如实施方案B18-B24中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A为野生型A3A。
实施方案B27.如实施方案B18所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A包含与SEQ ID NO:976、977、993-1006和1009具有至少87%、90%、95%、98%、99%或100%同一性的氨基酸序列。
实施方案B28.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,其中所述UGI包含与SEQ ID NO:27具有至少80%同一性的氨基酸序列。
实施方案B29.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,其中所述UGI包含与SEQ ID NO:27具有至少90%同一性的氨基酸序列。
实施方案B30.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,其中所述UGI包含与SEQ ID NO:27具有至少95%同一性的氨基酸序列。
实施方案B31.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,其中所述UGI包含与SEQ ID NO:27具有至少98%同一性的氨基酸序列。
实施方案B32.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,其中所述UGI包含与SEQ ID NO:27具有至少99%同一性的氨基酸序列。
实施方案B33.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,其中所述UGI包含SEQ ID NO:27的氨基酸序列。
实施方案B34.如前述实施方案中任一项所述的组合物、方法或细胞,所述组合物、方法或细胞还包含至少一种引导RNA(gRNA)。
实施方案B35.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,所述组合物、方法、细胞或工程化细胞包含gRNA,其中所述gRNA为sgRNA。
实施方案B36.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,所述组合物、方法、细胞或工程化细胞包含gRNA,其中所述gRNA为dgRNA。
实施方案B37.如前述实施方案中任一项所述的组合物、方法、细胞或工程化细胞,所述组合物、方法、细胞或工程化细胞包含gRNA,其中所述gRNA为包含含有发夹区的sgRNA的保守部分的短单引导RNA(短sgRNA),其中所述发夹区缺少至少5-10个核苷酸并且其中所述短sgRNA包含5′端修饰或3′端修饰或两者。
实施方案B38.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为Cas切口酶。
实施方案B39.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为2类Cas切口酶。
实施方案B40.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为Cas9切口酶。
实施方案B41.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导切口酶为化脓性链球菌(Spy)Cas9切口酶。
实施方案B42.如实施方案B41所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为D10A SpyCas9切口酶。
实施方案B43.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶包含与SEQ ID NO:70、73或76中的任一者具有至少80%、90%、95%、98%或99%同一性的氨基酸序列。
实施方案B44.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶包含SEQ ID NO:70、73或76中的任一者的氨基酸序列。
实施方案B45.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码所述RNA引导的切口酶的序列包含与SEQ ID NO:72、75或78中的任一者的核苷酸序列具有至少80%、90%、95%、98%或99%同一性的核苷酸序列。
实施方案B46.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码所述RNA引导的切口酶的序列包含与SEQ ID NO:72、75或78中的任一者的核苷酸序列具有至少90%同一性的核苷酸序列。
实施方案B47.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码所述RNA引导的切口酶的序列包含与SEQ ID NO:72、75或78中的任一者的核苷酸序列具有至少95%同一性的核苷酸序列。
实施方案B48.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码所述RNA引导的切口酶的序列包含与SEQ ID NO:72、75或78中的任一者的核苷酸序列具有至少98%同一性的核苷酸序列。
实施方案B49.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码所述RNA引导的切口酶的序列包含与SEQ ID NO:72、75或78中的任一者的核苷酸序列具有至少99%同一性的核苷酸序列。
实施方案B50.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码所述RNA引导的切口酶的序列包含SEQ ID NO:71、72、74、75或77-90中的任一者的核苷酸序列。
实施方案B51.如实施方案B1-B37中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为脑膜炎奈瑟菌(Nme)Cas9切口酶。
实施方案B52.如实施方案B51所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为D16A NmeCas9切口酶,任选地为D16A Nme2Cas9。
实施方案B53.如实施方案B1-B37、B51或B52中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码所述RNA引导的切口酶的序列包含SEQ ID NO:380和387中的任一者的核苷酸序列。
实施方案B54.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述mRNA包含与SEQ ID NO:91-98中的任一者具有至少90%同一性的5′UTR。
实施方案B55.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述mRNA包含与SEQ ID NO:99-106中的任一者具有至少90%同一性的3′UTR。
实施方案B56.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述mRNA包含来自同一来源的5′UTR和3′UTR。
实施方案B57.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述mRNA包含选自Cap0、Cap1和Cap2的5′帽。
实施方案B58.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的开放阅读框和/或编码尿嘧啶糖苷酶抑制剂(UGI)的开放阅读框包含最小腺嘌呤密码子和/或最小尿苷密码子。
实施方案B59.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的开放阅读框和/或编码尿嘧啶糖苷酶抑制剂(UGI)的开放阅读框包含最小腺嘌呤密码子。
实施方案B60.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的开放阅读框和/或编码尿嘧啶糖苷酶抑制剂(UGI)的开放阅读框具有增加哺乳动物中的mRNA翻译的密码子。
实施方案B61.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的开放阅读框和/或编码尿嘧啶糖苷酶抑制剂(UGI)的开放阅读框具有增加哺乳动物中的mRNA翻译的密码子,其中所述哺乳动物为人类。
实施方案B62.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述胞苷脱氨酶位于所述多肽中的所述RNA引导的切口酶的N末端。
实施方案B63.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中经编码的RNA引导的切口酶包含核定位信号(NLS)。
实施方案B64.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中经编码的RNA引导的切口酶包含核定位信号(NLS),并且其中所述NLS处于所述RNA引导的切口酶的C末端。
实施方案B65.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中经编码的RNA的引导切口酶包含核定位信号(NLS),并且其中所述NLS处于所述RNA引导的切口酶的N末端,或其中NLS融合到所述RNA引导的切口酶的N末端和C末端两者。
实施方案B66.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中经编码的RNA引导的切口酶包含核定位信号(NLS),并且其中接头存在于所述RNA引导的切口酶的N末端与NLS之间,任选地其中所述接头为肽接头。
实施方案B67.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中经编码的RNA引导的切口酶包含核定位信号(NLS),并且其中所述NLS包含与SEQID NO:63和110-122具有至少80%、85%、90%或95%同一性的序列。
实施方案B68.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中经编码的RNA引导的切口酶包含核定位信号(NLS),并且其中所述NLS包含SEQ IDNO:63和110-122中的任一者的序列。
实施方案B69.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中经编码RNA引导的切口酶包含核定位信号(NLS),并且其中所述NLS由与SEQ IDNO:123-135中的任一者的序列具有至少80%、85%、90%、95%、98%或100%同一性的序列编码。
实施方案B70.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中经编码的RNA引导的切口酶包含核定位信号(NLS),并且其中所述胞苷脱氨酶位于所述多肽中的所述NLS的N末端。
实施方案B71.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中经编码的RNA引导的切口酶包含核定位信号(NLS),并且其中所述RNA引导的切口酶位于所述多肽中的所述NLS的N末端。
实施方案B72.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的开放阅读框包含与SEQ IDNO:1的序列具有至少80%、85%、90%、95%、98%或100%同一性的序列。
实施方案B73.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的开放阅读框包含与SEQ IDNO:4的序列具有至少80%、85%、90%、95%、98%或100%同一性的序列。
实施方案B74.如前述实施方案中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述mRNA中至少10%的尿苷由经修饰的尿苷取代。
实施方案B75.如实施方案B64所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经修饰的尿苷为N1-甲基-假尿苷、假尿苷、5-甲氧基尿苷或5-碘尿苷中的一者或多者。
实施方案B76.如实施方案B64或B65所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经修饰的尿苷为N1-甲基-假尿苷或5-甲氧基尿苷中的一者或两者。
实施方案B77.如实施方案B74-B76中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经修饰的尿苷为N1-甲基-假尿苷。
实施方案B78.如实施方案B74-B76中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经修饰的尿苷为5-甲氧基尿苷。
实施方案B79.如实施方案B74-B78中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中15%至45%的尿苷由经修饰的尿苷取代。
实施方案B80.如实施方案B74-B79中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中至少20%或至少30%的尿苷由经修饰的尿苷取代。
实施方案B81.如实施方案B74-B80中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中至少80%或至少90%的尿苷由经修饰的尿苷取代。
实施方案B82.如实施方案B74-B81中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中100%的尿苷由经修饰的尿苷取代。
实施方案B83.如前述实施方案中任一项所述的mRNA、组合物、方法或细胞,所述mRNA、组合物、方法或细胞进一步编码所述胞苷脱氨酶与RNA引导的切口酶之间的肽接头,任选地其中所述肽接头为XTEN。
实施方案B84.如前述实施方案中任一项所述的mRNA、组合物、方法或细胞,所述mRNA、组合物、方法或细胞进一步编码所述胞苷脱氨酶与RNA引导的切口酶之间的肽接头,其中所述肽接头包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少1 5个、至少20个、至少25个、至少30个、至少40个、至少50个或更多个氨基酸。
实施方案B85.如前述实施方案中任一项所述的mRNA、组合物、方法或细胞,所述mRNA、组合物、方法或细胞进一步编码所述胞苷脱氨酶与RNA引导的切口酶之间的肽接头,其中所述肽接头包含选自SEQ ID NO:46-59、61和211-272的一个或多个序列。
实施方案B86.一种多肽,所述多肽由前述实施方案中任一项所述的mRNA编码。
实施方案B87.一种核糖核蛋白复合物(RNP),所述核糖核蛋白复合物(RNP)包含(i)由前述实施方案中任一项所述的mRNA中的任一者编码的多肽;和(ii)引导RNA。
实施方案B88.一种载体,所述载体包含前述实施方案中任一项所述的mRNA。
实施方案B89.一种表达构建体,所述表达构建体包含可操作地连接到编码前述实施方案中任一项所述的mRNA的序列的启动子。
实施方案B90.一种质粒,所述质粒包含实施方案B89所述的表达构建体。
实施方案B91.一种宿主细胞,所述宿主细胞包含实施方案B88所述的载体、实施方案B89所述的表达构建体或实施方案B90所述的质粒。
实施方案B92.如前述实施方案中任一项所述的mRNA或组合物,其中所述mRNA或组合物被配制为脂质核酸组装组合物,任选地为脂质纳米粒子。
实施方案B93.根据前述实施方案中任一项所述的mRNA或组合物用于修饰细胞中的目标基因的用途。
实施方案B94.根据前述实施方案中任一项所述的mRNA或组合物用于制造用于修饰细胞中的目标基因的药剂的用途。
实施方案B95.一种修饰细胞中的目标基因的方法,所述方法包括向所述细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,所述脂质核酸组装组合物包含:
(a)第一mRNA,其包含编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的第一开放阅读框;
(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和
(c)一种或多种引导RNA。
实施方案B96.如实施方案B95所述的方法,其中部分(a)和(b)在单独的脂质核酸组装组合物中。
实施方案B97.如实施方案B95所述的方法,其中部分(a)和(b)在同一脂质核酸组装组合物中。
实施方案B98.如实施方案B95所述的方法,其中部分(a)和(c)在单独的脂质核酸组装组合物中。
实施方案B99.如实施方案B95所述的方法,其中部分(a)和(c)在同一脂质核酸组装组合物中。
实施方案B100.如实施方案B95所述的方法,其中部分(b)和(c)在单独的脂质核酸组装组合物中。
实施方案B101.如实施方案B95所述的方法,其中部分(a)和(c)在同一脂质核酸组装组合物中,并且部分(b)在单独的脂质核酸组装组合物中。
实施方案B102.如实施方案B95所述的方法,其中部分(a)、(b)和(c)各自在单独的脂质核酸组装组合物中。
实施方案B103.如实施方案B95所述的方法,其中部分(a)、(b)和(c)在同一脂质核酸组装组合物中。
实施方案B104.如实施方案B95和B98-B103中任一项所述的方法,其中所述一种或多种引导RNA各自在单独的脂质核酸组装组合物中。
实施方案B105.如实施方案B95-B104中任一项所述的方法,所述方法包括向所述细胞递送脂质核酸组装组合物,所述脂质核酸组装组合物包含在同一脂质核酸组装组合物中的包含编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的第一开放阅读框的第一mRNA和包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框的第二mRNA。
实施方案B106.如实施方案B95-B104中任一项所述的方法,所述方法包括向所述细胞递送:第一脂质核酸组装组合物,其包含含有编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的第一开放阅读框的第一mRNA;和第二脂质核酸组装组合物,其包含含有编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框的第二mRNA。
实施方案B107.如实施方案B95-B104中任一项所述的方法,所述方法还包括递送一种或多种脂质核酸组装组合物中的一种或多种引导RNA,所述一种或多种脂质核酸组装组合物与包含胞苷脱氨酶和UGI的脂质核酸组装组合物分离。
实施方案B108.如实施方案B95-B107中任一项所述的方法,其中向所述细胞递送至少2、3、4、5、6、7、8、9或10种脂质核酸组装组合物。
实施方案B109.如实施方案B95-B108中任一项所述的方法,其中至少一种脂质核酸组装组合物包含脂质纳米粒子(LNP),任选地其中所有脂质核酸组装组合物包含LNP。
实施方案B110.如实施方案B95-B109中任一项所述的方法,其中至少一种脂质核酸组装组合物为脂质复合物组合物。
实施方案B111.如实施方案B95-B110中任一项所述的方法,其中所述脂质核酸组装组合物包含可离子化脂质。
实施方案B112.如实施方案B95-B111中任一项所述的方法,其中所述脂质核酸组装组合物包含可离子化脂质,并且其中所述可离子化脂质包含可生物降解可离子化脂质。
实施方案B113.如实施方案B95-B112中任一项所述的方法,其中所述脂质核酸组装组合物包含可离子化脂质,并且其中所述可离子化脂质的PK值在约5.1至约7.4的范围内的pKa的范围内,所述pKa在例如约5.5至约6.6、约5.6至约6.4、约5.8至约6.2、或约5.8至约6.5的范围内。
实施方案B114.如实施方案B95-B113中任一项所述的方法,其中所述脂质核酸组装组合物包含胺脂质。
实施方案B115.如实施方案B95-B114中任一项所述的方法,其中所述脂质核酸组装组合物包含脂质A。
实施方案B116.如实施方案B95-B115中任一项所述的方法,其中所述脂质核酸组装组合物包含辅助脂质。
实施方案B117.如实施方案B95-B116中任一项所述的方法,其中所述脂质核酸组装组合物包含辅助脂质,其中所述辅助脂质为胆固醇。
实施方案B118.如实施方案B95-B117中任一项所述的方法,其中所述脂质核酸组装组合物包含隐形脂质。
实施方案B119.如实施方案B95-B118中任一项所述的方法,其中所述脂质核酸组装组合物包含隐形脂质,其中所述隐形脂质为PEG2k-DMG。
实施方案B120.如实施方案B95-B119中任一项所述的方法,其中所述脂质核酸组装组合物包含中性脂质。
实施方案B121.如实施方案B95-B120中任一项所述的方法,其中所述脂质核酸组装组合物包含中性脂质,其中所述中性脂质为DSPC。
实施方案B122.如实施方案B95-B121中任一项所述的方法,其中所述脂质核酸组装组合物包含中性脂质,其中所述中性脂质以约9mol%存在。
实施方案B123.如实施方案B95-B122中任一项所述的方法,其中所述脂质核酸组装组合物包含隐形脂质,其中所述隐形脂质以约3mol%存在。
实施方案B124.如实施方案B95-B123中任一项所述的方法,其中所述脂质核酸组装组合物包含辅助脂质,其中所述辅助脂质以约38mol%存在。
实施方案B125.如实施方案B95-B124中任一项所述的方法,其中所述脂质核酸组装组合物的N/P比为约6。
实施方案B126.如实施方案B95-B125中任一项所述的方法,其中所述脂质核酸组装组合物包含约50mol%胺脂质如脂质A;约9mol%中性脂质如DSPC;约3mol%隐形脂质如PEG脂质,例如PEG2k-DMG,并且所述脂质组分的其余部分为辅助脂质如胆固醇,其中所述N/P比为约6。
实施方案B127.如实施方案B95-B126中任一项所述的方法,所述方法包含靶向降低或消除细胞表面上的MHC I类表达的基因的一种gRNA,和/或靶向降低或消除细胞表面上的MHC II类表达的基因的一种gRNA,和/或靶向降低或消除内源性TCR表达的基因的一种gRNA。
实施方案B128.如实施方案B95-B127中任一项所述的方法,所述方法包含选自以下的至少两种gRNA:靶向降低或消除细胞表面上的MHC I类表达的基因的一种gRNA、靶向降低或消除细胞表面上的MHC II类表达的基因的一种gRNA和靶向降低或消除内源性TCR表达的基因的一种gRNA。
实施方案B129.如实施方案B95-B128中任一项所述的方法,所述方法包含靶向降低或消除细胞表面上的MHC I类表达的基因的一种gRNA,靶向降低或消除细胞表面上的MHCII类表达的基因的一种gRNA,和靶向降低或消除内源性TCR表达的基因的一种gRNA。
实施方案B130.如实施方案B95-129中任一项所述的方法,所述方法包含选自靶向TRAC、TRBC、B2M、HLA-A或CIITA的gRNA的一种gRNA。
实施方案B131.如实施方案B95-B130中任一项所述的方法,其中所述gRNA靶向TRBC,其中所述gRNA包含选自以下的引导序列:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列。
实施方案B132.如实施方案B95-B130中任一项所述的方法,其中所述gRNA靶向TRBC,其中所述gRNA包含选自以下的引导序列:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列。
实施方案B133.如实施方案B95-B130中任一项所述的方法,所述方法包含选自靶向TRAC、TRBC或B2M的gRNA的至少两种gRNA,其中所述两种引导RNA不靶向相同基因。
实施方案B134.如实施方案B95-B130中任一项所述的方法,所述方法包含选自靶向TRAC、TRBC或HLA-A的gRNA的至少两种gRNA,其中所述两种引导RNA不靶向相同基因。
实施方案B135.如实施方案B95-B130中任一项所述的方法,所述方法包含靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA。
实施方案B136.如实施方案B95-B130中任一项所述的方法,所述方法包含靶向B2M的一种引导RNA和靶向CIITA的一种gRNA。
实施方案B137.如实施方案B95-B130中任一项所述的方法,所述方法包含靶向HLA-A的一种引导RNA和靶向CIITA的一种gRNA,任选地其中所述细胞对于HLA-B为同型接合的并且对于HLA-C为同型接合的。
实施方案B138.如实施方案B95-B130中任一项所述的方法,所述方法包含靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA和靶向B2M的一种gRNA。
实施方案B139.如实施方案B95-B130中任一项所述的方法,所述方法包含靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA和靶向HLA-A的一种gRNA,任选地其中所述细胞对于HLA-B为同型接合的并且对于HLA-C为同型接合的。
实施方案B140.如实施方案B95-B130中任一项所述的方法,所述方法包含靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA、靶向B2M的一种gRNA和靶向CIITA的一种gRNA。
实施方案B141.如实施方案B95-B130中任一项所述的方法,所述方法包含靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA、靶向HLA-A的一种gRNA和靶向CIITA的一种gRNA,任选地其中所述细胞对于HLA-B为同型接合的并且对于HLA-C为同型接合的。
实施方案B142.如前述实施方案中任一项所述的方法,其中所述方法产生目标序列内的胞嘧啶(C)至胸腺嘧啶(T)转化。
实施方案B143.如前述实施方案中任一项所述的方法,其中相对于所述目标序列中的总编辑,所述方法引起至少60%的C-T转化。
实施方案B144.如前述实施方案中任一项所述的方法,其中相对于所述目标序列中的总编辑,所述方法引起至少65%、70%、75%、80%、85%、90%、95%、98%或99%的C-T转化。
实施方案B145.如前述实施方案中任一项所述的方法,其中C-T转化与非预期编辑的比率大于1∶1。
实施方案B146.如前述实施方案中任一项所述的方法,其中C-T转化与非预期编辑的比率为2∶1至99∶1。
实施方案B147.如前述实施方案中任一项所述的方法,其中C-T转化与非预期编辑的比率为2∶1、3∶1、4∶1、5∶1、6∶1、7∶1或8∶1。
实施方案B148.如前述实施方案中任一项所述的方法,其中所述方法使所述胞苷脱氨酶进行对应于相对于所述引导序列的5′端的位置-1至位置10中的任一者的碱基编辑。
实施方案B149.如前述实施方案中任一项所述的方法,其中所述方法使所述胞苷脱氨酶在距所述引导序列的5′端的1、2、3、4、5、6、7、8、9或10个核苷酸的位置处进行碱基编辑。
实施方案B150.如前述实施方案中任一项所述的方法,其中所述第一mRNA、所述第二mRNA和所述引导RNA在存在时以约6∶2∶3(w∶w∶w)的比率递送。
实施方案B151.如前述实施方案中任一项所述的方法,其中所述mRNA、组合物或LNP以5至600ng的总RNA量施用。
实施方案B152.如前述实施方案中任一项所述的方法,其中所述总RNA量为8至550ng。
实施方案B153.如前述实施方案中任一项所述的方法,其中所述总RNA量为35至550ng。
实施方案B154.如前述实施方案中任一项所述的方法,其中所述总RNA量为70至550ng。
实施方案B155.如前述实施方案中任一项所述的方法,其中所述总RNA量为138至550ng。
实施方案B156.如前述实施方案中任一项所述的方法,其中所述总RNA量为275至550ng。
实施方案B157.如前述实施方案中任一项所述的方法、细胞或工程化细胞,其中所述细胞为淋巴细胞。
实施方案B158.如前述实施方案中任一项所述的方法、细胞或工程化细胞,其中所述细胞为B淋巴细胞。
实施方案B159.如前述实施方案中任一项所述的方法、细胞或工程化细胞,其中所述细胞为T淋巴细胞。
实施方案B160.如前述实施方案中任一项所述的方法或用途,其中所述目标基因的修饰在体内进行。
实施方案B161.如前述实施方案中任一项所述的方法或用途,其中所述目标基因的修饰是离体进行。
实施方案B162.如前述实施方案中任一项所述的方法或用途,其中所述目标基因的修饰降低或消除所述目标基因的表达。
实施方案B163.如前述实施方案中任一项所述的方法或用途,其中所述目标基因的基因组编辑或修饰使所述目标基因的表达降低至少50%、55%、60%、65%、70%、75%、80%、85%、90%、或95%。
实施方案B164.如前述实施方案中任一项所述的方法或用途,其中所述目标基因的基因组编辑或修饰在所述基因中产生错义突变。
实施方案B165.一种多肽,所述多肽包含胞苷脱氨酶和RNA引导的切口酶,其中所述多肽不包含尿嘧啶糖苷酶抑制剂(UGI)。
实施方案B166.一种核糖核蛋白复合物(RNP),所述核糖核蛋白复合物(RNP)包含实施方案B165所述的多肽和引导RNA,其中如果所述RNP包含SpyCas9切口酶,则所述引导RNA为Spy引导RNA,并且其中如果所述RNP包含NmeCas切口酶,则所述引导RNA为Nme引导RNA。
实施方案B167.一种组合物,所述组合物包含:第一多肽,其包含胞苷脱氨酶和RNA引导的切口酶,其中所述第一多肽不包含尿嘧啶糖苷酶抑制剂(UGI);和第二多肽,其包含UGI,其中所述第二多肽不同于所述第一多肽。
实施方案B168.如实施方案B165-B167中任一项所述的多肽、RNP或组合物,其中所述胞苷脱氨酶经由肽接头,任选地XTEN融合到所述RNA引导的切口酶。
实施方案B169.如实施方案B165-B167中任一项所述的多肽、RNP或组合物,其中所述胞苷脱氨酶连接到包含有机分子、聚合物或化学部分的接头。
实施方案B170.一种药物组合物,所述药物组合物包含前述实施方案中任一项所述的mRNA、RNP、组合物或多肽,和药学上可接受的载剂。
实施方案B171.一种试剂盒,所述试剂盒包含前述实施方案中任一项所述的mRNA、RNP、组合物或多肽。
实施方案B172.如前述实施方案中任一项所述的mRNA、RNP、组合物、方法、细胞或工程化细胞,其中包含胞苷脱氨酶和RNA引导的切口酶的多肽以氨基至羧基末端顺序包括:胞苷脱氨酶、接头和RNA引导的切口酶。
实施方案B173.一种改变TRAC基因内的DNA序列的方法,所述方法包括向细胞递送:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的RRNA的核酸。
实施方案B174.一种降低TRAC基因的表达的方法,所述方法包括向细胞递送:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的gRNA的核酸。
实施方案B175.一种免疫疗法的方法,所述方法包括向受试者施用包含工程化细胞的组合物,
其中所述细胞包含选自以下的基因组坐标内的至少一个核苷酸的基因修饰:
chr14:22547596-22547616;chr14:22550570-22550590;chr14:22547763-22547783;chr14:22550596-22550616;chr14:22550566-22550586;chr14:22547753-22547773;chr14:22550601-22550621;chr14:22550599-22550619;chr14:22547583-22547603;chr14:22547671-22547691;chr14:22547770-22547790;chr14:22547676-22547696;chr14:22547772-22547792;chr14:22547771-22547791;chrl4:22547733-22547753;chr14:22547776-22547796;或
其中所述细胞是通过向所述细胞递送以下各物而经工程化:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的gRNA的核酸。
实施方案B176.如实施方案B173-B175中任一项所述的方法,其中所述引导序列包含SEQ ID NO:706-709中的任一者。
实施方案B177.如实施方案B173-B175中任一项所述的方法,其中所述引导序列包含SEQ ID NO:706-708中的任一者。
实施方案B178.如实施方案B173-B175中任一项所述的方法,其中所述引导序列包含SEQ ID NO:706。
实施方案B179.如实施方案B173-B175中任一项所述的方法,其中所述引导序列包含SEQ ID NO:707。
实施方案B180.如实施方案B173-B175中任一项所述的方法,其中所述引导序列包含SEQ ID NO:708。
实施方案B181.一种改变TRBC1和/或TRBC2基因内的DNA序列的方法,所述方法包括向细胞递送组合物,其中所述组合物包含:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的引导RNA的核酸。
实施方案B182.一种降低TRBC1和/或TRBC2基因的表达的方法,所述方法包括向细胞递送组合物,其中所述组合物包含:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的引导RNA的核酸。
实施方案B183.一种免疫疗法的方法,所述方法包括向受试者施用包含工程化细胞的组合物,
其中所述细胞包含选自以下的基因组坐标内的至少一个核苷酸的修饰:chr7:142791757-142791777;chr7:142801104-142801124;chr7:142791811-142791831;chr7:142801158-142801178;chr7:142792728-142792748;chr7:142791719-142791739;chr7:142791766-142791786;chr7:142801113-142801133;chr7:142791928-142791948;chr7:142801275-142801295;chr7:142792062-142792082;chr7:142801409-142801429;chr7:142792713-142792733;chr7:142802126-142802146;chr7:142791808-142791828;chr7:142801155-142801175;chr7:142792003-142792023;chr7:142801350-142801370;chr7:142791760-142791780;chr7:142791715-142791735;chr7:142792781-142792801;chr7:142792040-142792060;chr7:142801387-142801407;chr7:142791862-142791882;chr7:142791716-142791736;chr7:142791787-142791807;chr7:142791759-142791779;chr7:142801106-142801126;chr7:142791807-142791827;chr7:142801154-142801174;chr7:142791879-142791899;chr7:142801226-142801246;chr7:142791805-142791825;chr7:142791700-142791720;chr7:142791765-142791785;chr7:142801112-142801132;chr7:142791820-142791840;chr7:142791872-142791892;chr7:142801219-142801239;chr7:142791700-142791720;chr7:142791806-142791826;chr7:142801153-142801173;chr7:142792035-142792055;chr7:142792724-142792744;chr7:142792754-142792774;chr7:142791804-142791824;chr7:142792684-142792704;chr7:142791823-142791843;chr7:142792728-142792748;chr7:142792721-142792741;chr7:142792749-142792769;chr7:142792685-142792705;chr7:142791816-142791836;chr7:142801163-142801183;chr7:142792686-142792706;chr7:142791793-142791813;chr7:142793110-142793130;chr7:142791815-142791835;chr7:142801162-142801182;chr7:142792770-142792790;chr7:142792047-142792067;chr7:142801394-142801414;chr7:142791871-142791891;chr7:142801218-142801238;chr7:142791894-142791914;chr7:142792723-142792743;chr7:142792724-142792744;chr7:142791897-142791917;chr7:142801244-142801264;chr7:142792757-142792777;chr7:142792740-142792760;chr7:142792758-142792778;或
其中所述细胞是通过向细胞递送以下各物而经工程化:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的引导RNA的核酸。
实施方案B184.如实施方案B181-B183中任一项所述的方法,其中所述引导序列包含SEQ ID NO:618-627中的任一者。
实施方案B185.如实施方案B181-B184中任一项所述的方法,其中所述引导序列包含SEQ ID NO:618-621中的任一者。
实施方案B186.如实施方案B181-B185中任一项所述的方法,其中所述引导序列包含SEQ ID NO:618。
实施方案B187.如实施方案B181-B185中任一项所述的方法,其中所述引导序列包含SEQ ID NO:619。
实施方案B188.如实施方案B181-B185中任一项所述的方法,其中所述引导序列包含SEQ ID NO:620。
实施方案B189.如实施方案B181-B185中任一项所述的方法,其中所述引导序列包含SEQ ID NO:621。
实施方案B190.如实施方案B173-B189中任一项所述的方法,其中所述组合物还包含前述实施方案中任一项所述的与mRNA或组合物相关的mRNA或组合物。
实施方案B191.一种组合物,所述组合物包含:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;和任选地
b.前述实施方案中任一项所述的与mRNA或组合物相关的mRNA或组合物。
实施方案B192.如实施方案B191所述的组合物,其中所述引导序列包含SEQ IDNO:706-709中的任一者。
实施方案B193.如实施方案B191或B192所述的组合物,所述组合物用于改变细胞中的TRAC基因内的DNA序列。
实施方案B194.如实施方案B191-B193中任一项所述的组合物,所述组合物用于降低细胞中的TRAC基因的表达。
实施方案B195.如实施方案B191-B194中任一项所述的组合物,所述组合物用于受试者的免疫疗法中。
实施方案B196.一种组合物,所述组合物包含:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;和任选地
b.前述实施方案中任一项所述的与mRNA或组合物相关的mRNA或组合物。
实施方案B197.如实施方案B196所述的组合物,其中所述引导序列包含SEQ IDNO:618-621中的任一者。
实施方案B198.如实施方案B196或B197所述的组合物,所述组合物用于改变细胞中的TRBC1和/或TRBC2基因内的DNA序列。
实施方案B199.如实施方案B196-B198中任一项所述的组合物,所述组合物用于降低细胞中的TRBC1和/或TRBC2基因的表达。
实施方案B200.如实施方案B196-B199中任一项所述的组合物,所述组合物用于受试者的免疫疗法中。
实施方案B201.一种细胞,所述细胞是通过实施方案B120-B121和161-178中任一项所述的方法改变。
实施方案B202.根据实施方案B201所述的细胞,其中所述细胞是离体改变的。
实施方案B203.根据实施方案B201或B202所述的细胞,其中所述细胞为T细胞。
实施方案B204.根据实施方案B201-B203中任一项所述的细胞,其中所述细胞为CD4+或CD8+T细胞。
实施方案B205.根据实施方案B201-B204中任一项所述的细胞,其中所述细胞为哺乳动物细胞、灵长类动物细胞或人类细胞。
实施方案B206.根据实施方案B201-B205中任一项所述的细胞,所述细胞用于受试者的免疫疗法中。
实施方案B207.一种已降低或消除TRAC的表面表达的工程化细胞,所述工程化细胞包含人类TRAC基因中的基因修饰,其中所述基因修饰包含选自以下的基因组坐标内的至少一个核苷酸的修饰:
chr14:22547596-22547616;chr14:22550570-22550590;chr14:22547763-22547783;chr14:22550596-22550616;chr14:22550566-22550586;chr14:22547753-22547773;chr14:22550601-22550621;chr14:22550599-22550619;chr14:22547583-22547603;chr14:22547671-22547691;chr14:22547770-22547790;chr14:22547676-22547696;chr14:22547772-22547792;chr14:22547771-22547791;chr14:22547733-22547753;chr14:22547776-22547796。
实施方案B208.一种已降低或消除TRBC1/2的表面表达的工程化细胞,所述工程化细胞包含人类TRBC1/2基因中的基因修饰,其中所述基因修饰包含选自以下的基因组坐标内的至少一个核苷酸的修饰:
chr7:142791757-142791777;chr7:142801 104-142801 124;chr7:14279181 1-142791831;chr7:142801158-142801178;chr7:142792728-142792748;chr7:142791719-142791739;chr7:142791766-142791786;chr7:142801113-142801133;chr7:142791928-142791948;chr7:142801275-142801295;chr7:142792062-142792082;chr7:142801409-142801429;chr7:142792713-142792733;chr7:142802126-142802146;chr7:142791808-142791828;chr7∶142801155-142801175;chr7:142792003-142792023;chr7:142801350-142801370;chr7:142791760-142791780;chr7:142791715-142791735;chr7:142792781-142792801;chr7:142792040-142792060;chr7:142801387-142801407;chr7:142791862-142791882;chr7:142791716-142791736;chr7:142791787-142791807;chr7:142791759-142791779;chr7:142801106-142801126;chr7:142791807-142791827;chr7:142801154-142801174;chr7:142791879-142791899;chr7:142801226-142801246;chr7:142791805-142791825;chr7:142791700-142791720;chr7:142791765-142791785;chr7:142801112-142801132;chr7:142791820-142791840;chr7:142791872-142791892;chr7:142801219-142801239;chr7:142791700-142791720;chr7:142791806-142791826;chr7:142801153-142801173;chr7:142792035-142792055;chr7:142792724-142792744;chr7:142792754-142792774;chr7:142791804-142791824;chr7:142792684-142792704;chr7:142791823-142791843;chr7:142792728-142792748;chr7:142792721-142792741;chr7:142792749-142792769;chr7:142792685-142792705;chr7:142791816-142791836;chr7:142801163-142801183;chr7:142792686-142792706;chr7:142791793-142791813;chr7:142793110-142793130;chr7:142791815-142791835;chr7:142801162-142801182;chr7:142792770-142792790;chr7:142792047-142792067;chr7:142801394-142801414;chr7:142791871-142791891;chr7:142801218-142801238;chr7:142791894-142791914;chr7:142792723-142792743;chr7:142792724-142792744;chr7:142791897-142791917;chr7:142801244-142801264;chr7:142792757-142792777;chr7:142792740-142792760;chr7:142792758-142792778。
实施方案B209.一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,所述脂质核酸组装组合物包含:
(a)第一mRNA,其包含编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的第一开放阅读框;
(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和
(c)一种或多种引导RNA。
实施方案B210.如前述实施方案中任一项所述的方法、细胞或工程化细胞,其中所述细胞为免疫细胞。
实施方案B211.如前述实施方案中任一项所述的方法、细胞或工程化细胞,其中所述细胞为淋巴细胞。
实施方案B212.如前述实施方案中任一项所述的方法、细胞或工程化细胞,其中所述细胞为T细胞。
Claims (146)
1.一种组合物,所述组合物包含:第一mRNA,其包含编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的第一开放阅读框;和第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框,其中所述第二mRNA不同于所述第一mRNA,任选地其中所述组合物包含脂质纳米粒子。
2.如权利要求1所述的组合物,其中所述第一开放阅读框不包含编码UGI的序列。
3.如权利要求1或2所述的组合物,其中所述组合物包含第一组合物和第二组合物,其中所述第一组合物包含含有编码包含胞苷脱氨酶和RNA引导的切口酶并且不包含尿嘧啶糖苷酶抑制剂(UGI)的多肽的第一开放阅读框的第一mRNA,并且所述第二组合物包含含有编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框的第二mRNA,其中所述第二mRNA不同于所述第一mRNA,任选地其中所述组合物包含脂质纳米粒子。
4.如权利要求1-3中任一项所述的组合物,其中所述第一mRNA和所述第二mRNA在同一或单独小瓶中。
5.一种修饰目标基因的方法,所述方法包括向细胞递送:第一mRNA,其包含编码包含胞苷脱氨酶和RNA引导的切口酶的第一多肽的第一开放阅读框;第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框,其中所述第二mRNA不同于所述第一mRNA;和至少一种引导RNA(gRNA)。
6.如权利要求5所述的方法,其中如果所述切口酶为SpyCas9切口酶,则所述gRNA为SpyCas9 gRNA,并且如果所述切口酶为NmeCas9切口酶,则所述gRNA为Nme gRNA。
7.如权利要求5或6所述的方法,其中所述第一开放阅读框不包含编码UGI的序列。
8.如权利要求1-7中任一项所述的组合物或方法,其中所述第二mRNA与所述第一mRNA的摩尔比为1∶1至30∶1。
9.如权利要求1-7中任一项所述的组合物或方法,其中所述摩尔比为2∶1至30∶1。
10.如权利要求1-7中任一项所述的组合物或方法,其中所述摩尔比为7∶1至22∶1。
11.一种mRNA,所述mRNA包含编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的开放阅读框,其中所述多肽不包含尿嘧啶糖苷酶抑制剂(UGI)。
12.一种修饰细胞中的目标基因内的至少一个胞苷的方法,所述方法包括在所述细胞中表达以下各物或使所述细胞与以下各物接触:(i)包含胞苷脱氨酶和RNA引导的切口酶的第一多肽,其中所述第一多肽不包含尿嘧啶糖苷酶抑制剂(UGI);(ii)UGI多肽;和(iii)至少一种引导RNA(gRNA),其中所述第一多肽和gRNA与所述目标基因一起形成复合物并且修饰所述目标基因中的至少一个胞苷。
13.如权利要求12所述的方法,其中如果所述切口酶为SpyCas9切口酶,则所述gRNA为SpyCas9 gRNA,并且如果所述切口酶为NmeCas9切口酶,则所述gRNA为Nme gRNA。
14.如权利要求12或13所述的方法,其中所述UGI多肽与所述第一多肽的比率为10∶1至50∶1。
15.一种细胞,其中权利要求1-4和8-11中任一项所述的mRNA或组合物已引入至所述细胞中,其中所述细胞在所述引入之后已经修饰。
16.一种工程化细胞,所述工程化细胞通过权利要求5-10和12-14所述的方法改变。
17.一种工程化细胞,所述工程化细胞包含至少一种碱基编辑和/或插入/缺失,其中所述碱基编辑和/或插入/缺失是通过使细胞与组合物接触而形成,所述组合物包含含有编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的第一开放阅读框的第一mRNA和包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框的第二mRNA,其中所述第二mRNA不同于所述第一mRNA。
18.如权利要求17所述的工程化细胞,其中所述第一开放阅读框不包含编码UGI的序列。
19.如权利要求1-18中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述胞苷脱氨酶为
(i)APOBEC家族的酶,任选地为APOBEC3亚群的酶;
(ii)包含与SEQ ID NO:40、41和960-1023中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;
(iii)包含与SEQ ID NO:40、41和960-1013中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;
(iv)包含与SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶;或
(v)包含与SEQ ID NO:40、976、981、984、986和1014-1023中的任一者至少80%同一的氨基酸序列的胞苷脱氨酶。
20.如权利要求19所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述胞苷脱氨酶包含与SEQ ID NO:40、41和960-1023具有至少80%、85%、87%、90%、95%、98%、99%或100%同一性的氨基酸序列。
21.如权利要求19所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述胞苷脱氨酶包含与SEQ ID NO:40、41和960-1013具有至少80%、85%、87%、90%、95%、98%、99%或100%同一性的氨基酸序列。
22.如权利要求19所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述胞苷脱氨酶包含与SEQ ID NO:40、41、976、977、979、980、984-987、993-1006和1009至少80%、85%、87%、90%、95%、98%、99%或100%同一性的氨基酸序列。
23.如权利要求19所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述胞苷脱氨酶包含与SEQ ID NO:40、976、981、984、986、1014-1023具有至少80%、85%、87%、90%、95%、98%、99%或100%同一性的氨基酸序列。
24.如权利要求1-23中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述胞苷脱氨酶为APOBEC3A脱氨酶(A3A)。
25.如权利要求24所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A包含SEQID NO:40的氨基酸序列或与SEQ ID NO:40具有至少87%、至少90%、至少95%、至少98%、至少99%同一性的氨基酸序列。
26.如权利要求24-25中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A为人类A3A。
27.如权利要求24-26中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A为野生型A3A。
28.如权利要求24所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述A3A包含与SEQ ID NO:976、977、993-1006和1009具有至少87%、90%、95%、98%、99%或100%同一性的氨基酸序列。
29.如权利要求1-28中任一项所述的组合物、方法、细胞或工程化细胞,其中所述UGI包含SEQ ID NO:27的氨基酸序列或与SEQ ID NO:27具有至少80%、至少90%、至少95%、至少98%、至少99%同一性的氨基酸序列。
30.如权利要求1-4、8-10和15-29中任一项所述的组合物、方法或细胞,所述组合物、方法或细胞还包含至少一种引导RNA(gRNA)。
31.如权利要求1-4、8-10和15-30中任一项所述的组合物、方法、细胞或工程化细胞,所述组合物、方法、细胞或工程化细胞包含gRNA,其中所述gRNA为sgRNA。
32.如权利要求1-4、8-10和15-31中任一项所述的组合物、方法、细胞或工程化细胞,所述组合物、方法、细胞或工程化细胞包含gRNA,其中所述gRNA为包含含有发夹区的sgRNA的保守部分的短单引导RNA(短sgRNA),其中所述发夹区缺少至少5-10个核苷酸并且其中所述短sgRNA包含5′端修饰或3′端修饰或两者。
33.如权利要求1-32中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为Cas9切口酶。
34.如权利要求1-33中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为化脓性链球菌(Spy)Cas9切口酶。
35.如权利要求34所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为D10A SpyCas9切口酶。
36.如权利要求1-35中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶包含SEQ ID NO:70、73或76中的任一者的氨基酸序列或与SEQ ID NO:70、73或76中的任一者具有至少80%、90%、95%、98%或99%同一性的氨基酸序列。
37.如权利要求1-36中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码所述RNA引导的切口酶的序列包含SEQ ID NO:72、75或78中的任一者的核苷酸序列或与SEQID NO:72、75或78中的任一者的核苷酸序列具有至少80%、90%、95%、98%或99%同一性的核苷酸序列。
38.如权利要求1-37中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码所述RNA引导的切口酶的所述序列包含SEQ ID NO:71、72、74、75或77-90中的任一者的核苷酸序列。
39.如权利要求1-33中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为脑膜炎奈瑟菌(Nme)Cas9切口酶。
40.如权利要求39所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述RNA引导的切口酶为D16A NmeCas9切口酶,任选地为D16A Nme2Cas9。
41.如权利要求1-33、39或40中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码所述RNA引导的切口酶的序列包含SEQ ID NO:380和387中的任一者的核苷酸序列。
42.如权利要求1-41中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述mRNA包含与SEQ ID NO:91-98中的任一者具有至少90%同一性的5′UTR。
43.如权利要求1-42中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述mRNA包含与SEQ ID NO:99-106中的任一者具有至少90%同一性的3′UTR。
44.如权利要求1-43中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述mRNA还包含选自Cap0、Cap1、Cap2的5′帽和共转录或转录后添加的帽,任选地其中所述共转录添加的帽选自抗逆帽类似物(ARCA)、AG(m7G(5′)ppp(5′)(2′OMeA)pG或GG(m7G(5′)ppp(5′)(2′OMeG)pG、转录后添加的帽。
45.如权利要求1-44中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述mRNA还包含多腺苷酸化(poly-A)尾,任选地其中所述poly-A尾通过PCR加尾或酶促加尾添加至所述mRNA并且任选地其中所述poly-A尾包含SEQ ID NO:109的序列。
46.如权利要求1-45中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的所述开放阅读框和/或编码尿嘧啶糖苷酶抑制剂(UGI)的所述开放阅读框包含(i)最小腺嘌呤密码子和/或最小尿苷密码子;(ii)最小腺嘌呤密码子;(iii)增加哺乳动物中所述mRNA的翻译的密码子;或(iv)增加哺乳动物中所述mRNA的翻译的密码子,其中所述哺乳动物为人类。
47.如权利要求1-46中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述胞苷脱氨酶位于所述多肽中的所述RNA引导的切口酶的N末端。
48.如权利要求1-47中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码的RNA引导的切口酶包含核定位信号(NLS)。
49.如权利要求1-48中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码的RNA引导的切口酶包含核定位信号(NLS),并且其中所述NLS处于所述RNA引导的切口酶的C末端。
50.如权利要求1-49中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码的RNA引导的切口酶包含核定位信号(NLS),并且其中所述NLS处于所述RNA引导的切口酶的N末端,或其中NLS融合到所述RNA引导的切口酶的所述N末端和所述C末端两者。
51.如权利要求1-50中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码的RNA引导的切口酶包含核定位信号(NLS),并且其中接头存在于所述RNA引导的切口酶的所述N末端与所述NLS之间,任选地其中所述接头为肽接头。
52.如权利要求1-51中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码的RNA引导的切口酶包含核定位信号(NLS),并且其中所述NLS包含与SEQ ID NO:63和110-122中的任一者具有至少80%、85%、90%或95%同一性的序列。
53.如权利要求1-52中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码的RNA引导的切口酶包含核定位信号(NLS),并且其中所述NLS包含SEQ ID NO:63和110-122中的任一者的序列。
54.如权利要求1-53中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码的RNA引导的切口酶包含核定位信号(NLS),并且其中所述NLS是由与SEQ ID NO:123-135中的任一者的序列具有至少80%、85%、90%、95%、98%或100%同一性的序列编码。
55.如权利要求1-54中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码的RNA引导的切口酶包含核定位信号(NLS),并且其中所述胞苷脱氨酶位于所述多肽中的所述NLS的N末端。
56.如权利要求1-55中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经编码的RNA引导的切口酶包含核定位信号(NLS),并且其中所述RNA引导的切口酶位于所述多肽中的所述NLS的N末端。
57.如权利要求1-56中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的所述开放阅读框包含与SEQ ID NO:1的序列具有至少80%、85%、90%、95%、98%或100%同一性的序列。
58.如权利要求1-57中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的所述开放阅读框包含与SEQ ID NO:4的序列具有至少80%、85%、90%、95%、98%或100%同一性的序列。
59.如权利要求1-58中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的所述开放阅读框包含与SEQ ID NO:321的序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的序列。
60.如权利要求1-59中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的所述开放阅读框包含与SEQ ID NO:313的序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的序列。
61.如权利要求1-60中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述mRNA中至少10%的尿苷由经修饰的尿苷取代。
62.如权利要求61所述的mRNA、组合物、方法、细胞或工程化细胞,其中所述经修饰的尿苷为N1-甲基-假尿苷、假尿苷、5-甲氧基尿苷或5-碘尿苷中的一者或多者。
63.如权利要求61-62中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中15%至45%的尿苷由所述经修饰的尿苷取代。
64.如权利要求61-63中任一项所述的mRNA、组合物、方法、细胞或工程化细胞,其中至少20%或至少30%、至少80%、或至少90%、或100%的尿苷由所述经修饰的尿苷取代。
65.如前述权利要求61-64中任一项所述的mRNA、组合物、方法或细胞,所述mRNA、组合物、方法或细胞进一步编码所述胞苷脱氨酶与所述RNA引导的切口酶之间的肽接头,任选地其中所述肽接头为XTEN或所述肽接头包含GTKDSTKDIPETPSKD的序列(SEQ ID NO:268)。
66.如权利要求61-65中任一项所述的mRNA、组合物、方法或细胞,所述mRNA、组合物、方法或细胞进一步编码所述胞苷脱氨酶与所述RNA引导的切口酶之间的肽接头,其中所述肽接头包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少40个、至少50个或更多个氨基酸。
67.如权利要求61-66中任一项所述的mRNA、组合物、方法或细胞,所述mRNA、组合物、方法或细胞进一步编码所述胞苷脱氨酶与所述RNA引导的切口酶之间的肽接头,其中所述肽接头包含选自SEQ ID NO:46-59、61和211-272的一个或多个序列。
68.一种多肽,所述多肽由权利要求1-28和33-67中任一项所述的mRNA中的任一者编码。
69.一种核糖核蛋白复合物(RNP),所述核糖核蛋白复合物(RNP)包含(i)由权利要求1-28和33-67中任一项所述的mRNA中的任一者编码的多肽;和(ii)引导RNA。
70.一种载体,所述载体包含权利要求1-28和33-67中任一项所述的mRNA中的任一者。
71.一种表达构建体,所述表达构建体包含可操作地连接到编码权利要求1-28、33至60和65-67中任一项所述的mRNA中的任一者的序列的启动子。
72.一种质粒,所述质粒包含权利要求71所述的表达构建体。
73.一种宿主细胞,所述宿主细胞包含权利要求70所述的载体、权利要求71所述的表达构建体或权利要求72所述的质粒。
74.如权利要求1-4、8-11和19-67中任一项所述的mRNA或组合物,其中所述mRNA或所述组合物被配制成脂质核酸组装组合物,任选地为脂质纳米粒子。
75.根据权利要求1-4、8-11和19-67中任一项所述的mRNA或组合物用于修饰细胞中的目标基因的用途。
76.根据权利要求1-4、8-11和19-67中任一项所述的mRNA或组合物用于制造用于修饰细胞中的目标基因的药剂的用途。
77.一种修饰细胞中的目标基因的方法,所述方法包括向所述细胞递送一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,所述脂质核酸组装组合物包含:
(a)第一mRNA,其包含编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的第一开放阅读框;
(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和
(c)一种或多种引导RNA。
78.如权利要求77所述的方法,其中部分(a)、(b)和(c)各自在单独的脂质核酸组装组合物中。
79.如权利要求77所述的方法,其中部分(a)、(b)和(c)在同一脂质核酸组装组合物中。
80.如权利要求77-79中任一项所述的方法,其中所述一种或多种引导RNA各自在单独的脂质核酸组装组合物中。
81.如权利要求77-80中任一项所述的方法,所述方法包括向所述细胞递送脂质核酸组装组合物,所述脂质核酸组装组合物包含在同一脂质核酸组装组合物中的包含编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的第一开放阅读框的第一mRNA和包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框的第二mRNA。
82.如权利要求77-81中任一项所述的方法,所述方法包括向所述细胞递送:第一脂质核酸组装组合物,其包含含有编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的第一开放阅读框的第一mRNA;和第二脂质核酸组装组合物,其包含含有编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框的第二mRNA。
83.如权利要求77-82中任一项所述的方法,所述方法还包括递送一种或多种脂质核酸组装组合物中的一种或多种引导RNA,所述一种或多种脂质核酸组装组合物与包含所述胞苷脱氨酶和所述UGI的所述脂质核酸组装组合物分开。
84.如权利要求77-83中任一项所述的方法,其中向所述细胞递送至少2、3、4、5、6、7、8、9或10种脂质核酸组装组合物。
85.如权利要求77-84中任一项所述的方法,其中至少一种脂质核酸组装组合物包含脂质纳米粒子(LNP),任选地其中所有脂质核酸组装组合物包含LNP。
86.如权利要求77-85中任一项所述的方法,其中至少一种脂质核酸组装组合物为脂质复合物组合物。
87.如权利要求77-86中任一项所述的方法,其中所述脂质核酸组装组合物包含可离子化脂质。
88.如权利要求77-87中任一项所述的方法,其中所述脂质核酸组装组合物包含可离子化脂质并且其中所述可离子化脂质的pKa在约5.1至约7.4,例如约5.5至约6.6、约5.6至约6.4、约5.8至约6.2、或约5.8至约6.5的范围内。
89.如权利要求77-88中任一项所述的方法,其中所述脂质核酸组装组合物包含(i)胺脂质;(ii)辅助脂质;(iii)隐形脂质;(iv)中性脂质;或(i)-(iv)中的一者或多者的组合。
90.如权利要求89所述的方法,其中(i)所述胺脂质为脂质A;(ii)所述辅助脂质为胆固醇;(iii)所述隐形脂质为PEG2k-DMG;(iv)所述中性脂质为DSPC;或(i)-(iv)中的一者或多者的组合。
91.如权利要求77-90中任一项所述的方法,其中所述脂质核酸组装组合物的N/P比为约6。
92.如权利要求77-91中任一项所述的方法,其中所述脂质核酸组装组合物包含约50mol%胺脂质如脂质A;约9mol%中性脂质如DSPC;约3mol%隐形脂质如PEG脂质,例如PEG2k-DMG,并且所述脂质组分的其余部分为辅助脂质如胆固醇,其中所述N/P比为约6。
93.如权利要求77-92中任一项所述的方法,其中所述脂质核酸组装组合物包含约35mol%胺脂质如脂质A;约15mol%中性脂质如DSPC;约2.5mol%隐形脂质如PEG脂质,例如PEG2k-DMG,并且所述脂质组分的其余部分为辅助脂质如胆固醇,其中所述N/P比为约6。
94.如权利要求77-93中任一项所述的方法,所述方法包含靶向降低或消除细胞表面上的MHC I类表达的基因的一种gRNA,和/或靶向降低或消除细胞表面上的MHC II类表达的基因的一种gRNA,和/或靶向降低或消除内源性TCR表达的基因的一种gRNA。
95.如权利要求77-94中任一项所述的方法,所述方法包含选自以下的至少两种gRNA:靶向降低或消除细胞表面上的MHC I类表达的基因的一种gRNA、靶向降低或消除细胞表面上的MHC II类表达的基因的一种gRNA和靶向降低或消除内源性TCR表达的基因的一种gRNA。
96.如权利要求77-95中任一项所述的方法,所述方法包含靶向降低或消除细胞表面上的MHC I类表达的基因的一种gRNA、靶向降低或消除细胞表面上的MHC II类表达的基因的一种gRNA和靶向降低或消除内源性TCR表达的基因的一种gRNA。
97.如权利要求77-96中任一项所述的方法,所述方法包含选自靶向TRAC、TRBC、B2M、HLA-A或CIITA的gRNA的一种gRNA。
98.如权利要求77-97中任一项所述的方法,其中所述gRNA靶向TRBC,其中所述gRNA包含选自以下的引导序列:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列。
99.如权利要求77-97中任一项所述的方法,其中所述gRNA靶向TRBC,其中所述gRNA包含选自以下的引导序列:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列。
100.如权利要求77-97中任一项所述的方法,所述方法包含选自靶向TRAC、TRBC或B2M的gRNA的至少两种gRNA,其中所述两种引导RNA不靶向相同基因。
101.如权利要求77-97中任一项所述的方法,所述方法包含选自靶向TRAC、TRBC或HLA-A的gRNA的至少两种gRNA,其中所述两种引导RNA不靶向相同基因。
102.如权利要求77-97中任一项所述的方法,所述方法包含靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA。
103.如权利要求77-97中任一项所述的方法,所述方法包含靶向B2M的一种引导RNA和靶向CIITA的一种gRNA。
104.如权利要求77-97中任一项所述的方法,所述方法包含靶向HLA-A的一种引导RNA和靶向CIITA的一种gRNA,任选地其中所述细胞对于HLA-B为同型接合的并且对于HLA-C为同型接合的。
105.如权利要求77-97中任一项所述的方法,所述方法包含靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA和靶向B2M的一种gRNA。
106.如权利要求77-97中任一项所述的方法,所述方法包含靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA和靶向HLA-A的一种gRNA,任选地其中所述细胞对于HLA-B为同型接合的并且对于HLA-C为同型接合的。
107.如权利要求77-97中任一项所述的方法,所述方法包含靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA、靶向B2M的一种gRNA和靶向CIITA的一种gRNA。
108.如权利要求77-97中任一项所述的方法,所述方法包含靶向TRAC的一种引导RNA和靶向TRBC的一种gRNA、靶向HLA-A的一种gRNA和靶向CIITA的一种gRNA,任选地其中所述细胞对于HLA-B为同型接合的并且对于HLA-C为同型接合的。
109.如权利要求5-10、12-14、19-67和77一108中任一项所述的方法,其中所述方法在存在于目标序列内时产生胞嘧啶(C)至胸腺嘧啶(T)转化,任选地其中如果所述切口酶为SpyCas9切口酶,则所述C-T转化包含1-12个C-T转化,并且如果所述切口酶为NmeCas9切口酶,则所述C-T转化包含1-20个C-T转化。
110.如权利要求5-10、12-14、19-67和77-109中任一项所述的方法,其中相对于所述目标序列中的总编辑,所述方法引起至少60%的C-T转化。
111.如权利要求5-10、12-14、19-67和77-110中任一项所述的方法,其中相对于所述目标序列中的总编辑,所述方法引起至少65%、70%、75%、80%、85%、90%、95%、98%或99%的C-T转化。
112.如权利要求5-10、12-14、19-67和77-111中任一项所述的方法,其中C-T转化与非预期编辑的比率大于1∶1。
113.如权利要求5-10、12-14、19-67和77-112中任一项所述的方法,其中C-T转化与非预期编辑的比率为2∶1至99∶1。
114.如权利要求5-10、12-14、19-67和77-113中任一项所述的方法,其中C-T转化与非预期编辑的比率为2∶1、3∶1、4∶1、5∶1、6∶1、7∶1或8∶1。
115.如权利要求5-10、12-14、19-67和77-114中任一项所述的方法,其中所述方法使所述胞苷脱氨酶在对应于所述引导序列的5′端的相对位置-1至位置10中的任一者进行碱基编辑。
116.如权利要求5-10、12-14、19-67和77-115中任一项所述的方法,其中所述方法使所述胞苷脱氨酶在距所述引导序列的5′端的1、2、3、4、5、6、7、8、9或10个核苷酸的位置处存在的胞苷进行碱基编辑。
117.如权利要求5-10、12-14、19-67和77-116中任一项所述的方法,其中所述切口酶为SpyCas9切口酶,并且所述方法使所述胞苷脱氨酶在距所述引导序列的5′端的1、2、3、4、5、6、7、8、9、10或11个核苷酸的位置处存在的胞苷进行碱基编辑。
118.如权利要求5-10、12-14、19-67和77-116中任一项所述的方法,其中所述切口酶为NmeCas9切口酶,并且所述方法使所述胞苷脱氨酶在距所述引导序列的5′端的4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸的位置处存在的胞苷进行碱基编辑。
119.如权利要求5-10、12-14、19-67和77-118中任一项所述的方法,其中所述第一mRNA、所述第二mRNA和所述引导RNA在存在时以约6∶2∶3(w∶w∶w)的比率递送。
120.如权利要求5-10、12-67和77-119中任一项所述的方法、细胞或工程化细胞,其中所述细胞为淋巴细胞。
121.如权利要求5-10、12-14、19-67和75-120中任一项所述的方法或用途,其中所述目标基因的修饰是在体内进行。
122.如权利要求5-10、12-14、19-67和75-120中任一项所述的方法或用途,其中所述目标基因的修饰是离体进行。
123.如权利要求5-10、12-14、19-67和75-122中任一项所述的方法或用途,其中所述目标基因的修饰降低或消除所述目标基因的表达。
124.如权利要求5-10、12-14、19-67和75-123中任一项所述的方法或用途,其中所述目标基因的基因组编辑或修饰使所述目标基因的表达降低至少50%、55%、60%、65%、70%、75%、80%、85%、90%、或95%。
125.如权利要求5-10、12-14、19-67和75-124中任一项所述的方法或用途,其中所述目标基因的基因组编辑或修饰在所述基因中产生错义突变。
126.一种多肽,所述多肽包含胞苷脱氨酶和RNA引导的切口酶,其中所述多肽不包含尿嘧啶糖苷酶抑制剂(UGI)。
127.一种核糖核蛋白复合物(RNP),所述核糖核蛋白复合物(RNP)包含权利要求126所述的多肽和引导RNA,其中如果所述RNP包含SpyCas9切口酶,则所述引导RNA为Spy引导RNA,并且其中如果所述RNP包含NmeCas切口酶,则所述引导RNA为Nme引导RNA。
128.一种组合物,所述组合物包含:第一多肽,其包含胞苷脱氨酶和RNA引导的切口酶,其中所述第一多肽不包含尿嘧啶糖苷酶抑制剂(UGI);和第二多肽,其包含UGI,其中所述第二多肽不同于所述第一多肽。
129.如权利要求126-128中任一项所述的多肽、RNP或组合物,其中所述胞苷脱氨酶经由肽接头,任选地XTEN或包含GTKDSTKDIPETPSKD的序列(SEQ ID NO:268)的肽接头融合到所述RNA引导的切口酶。
130.如权利要求126-128中任一项所述的多肽、RNP或组合物,其中所述胞苷脱氨酶连接到包含有机分子、聚合物或化学部分的接头。
131.一种药物组合物,所述药物组合物包含权利要求1-4、8-11、19-69、74和126-130所述的mRNA、RNP、组合物或多肽,和药学上可接受的载剂。
132.一种试剂盒,所述试剂盒包含权利要求1-4、8-11、19-69、74和126-130中任一项所述的mRNA、RNP、组合物或多肽。
133.如权利要求1-132中任一项所述的mRNA、RNP、组合物、方法、用途、细胞或工程化细胞,其中包含胞苷脱氨酶和RNA引导的切口酶的所述多肽以氨基至羧基末端顺序包括:所述胞苷脱氨酶、接头和所述RNA引导的切口酶。
134.一种改变TRAC基因内的DNA序列的方法,所述方法包括向细胞递送:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的gRNA的核酸。
135.一种降低TRAC基因的表达的方法,所述方法包括向细胞递送:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的gRNA的核酸。
136.一种免疫疗法的方法,所述方法包括向受试者施用包含工程化细胞的组合物,
其中所述细胞包含选自以下的基因组坐标内的至少一个核苷酸的基因修饰:
chr14:22547596-22547616;chr14:22550570-22550590;chr14:22547763-22547783;chr14∶22550596-22550616;chr14:22550566-22550586;chr14∶22547753-22547773;chr14:22550601-22550621;chr14:22550599-22550619;chr14:22547583-22547603;chr14:22547671-22547691;chr14:22547770-22547790;chr14:22547676-22547696;chr14:22547772-22547792;chr14:22547771-22547791;chr14:22547733-22547753;chr14:22547776-22547796;或
其中所述细胞是通过向所述细胞递送以下各物而经工程化:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的gRNA的核酸。
137.一种改变TRBC1和/或TRBC2基因内的DNA序列的方法,所述方法包括向细胞递送组合物,其中所述组合物包含:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的引导RNA的核酸。
138.一种降低TRBC1和/或TRBC2基因的表达的方法,所述方法包括向细胞递送组合物,其中所述组合物包含:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的引导RNA的核酸。
139.一种免疫疗法的方法,所述方法包括向受试者施用包含工程化细胞的组合物,
其中所述细胞包含选自以下的基因组坐标内的至少一个核苷酸的修饰:chr7:142791757-142791777;chr7:142801104-142801124;chr7:142791811-142791831;chr7:142801158-142801178;chr7:142792728-142792748;chr7:142791719-142791739;chr7:142791766-142791786;chr7:142801113-142801133;chr7:142791928-142791948;chr7:142801275-142801295;chr7:142792062-142792082;chr7:142801409-142801429;chr7:142792713-142792733;chr7:142802126-142802146;chr7:142791808-142791828;chr7:142801155-142801175;chr7:142792003-142792023;chr7:142801350-142801370;chr7:142791760-142791780;chr7:142791715-142791735;chr7:142792781-142792801;chr7:142792040-142792060;chr7:142801387-142801407;chr7:142791862-142791882;chr7:142791716-142791736;chr7:142791787-142791807;chr7:142791759-142791779;chr7:142801106-142801126:chr7:142791807-142791827;chr7:142801154-142801174;chr7:142791879-142791899;chr7:142801226-142801246;chr7:142791805-142791825;chr7:142791700-142791720;chr7:142791765-142791785;chr7:142801112-142801132;chr7:142791820-142791840;chr7:142791872-142791892;chr7:142801219-142801239;chr7:142791700-142791720;chr7:142791806-142791826;chr7:142801153-142801173;chr7:142792035-142792055;chr7:142792724-142792744;chr7:142792754-142792774;chr7:142791804-142791824;chr7:142792684-142792704;chr7:142791823-142791843;chr7:142792728-142792748;chr7:142792721-142792741;chr7:142792749-142792769;chr7:142792685-142792705;chr7:142791816-142791836;chr7:142801163-142801183;chr7:142792686-142792706;chr7:142791793-142791813;chr7:142793110-142793130;chr7:142791815-142791835;chr7:142801162-142801182;chr7:142792770-142792790;chr7:142792047-142792067;chr7:142801394-142801414;chr7:142791871-142791891;chr7:142801218-142801238;chr7:142791894-142791914;chr7:142792723-142792743;chr7:142792724-142792744;chr7:142791897-142791917;chr7:142801244-142801264;chr7:142792757-142792777;chr7:142792740-142792760;chr7:142792758-142792778;或
其中所述细胞是通过向细胞递送以下各物而经工程化:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;或
b.编码(a.)的引导RNA的核酸。
140.一种组合物,所述组合物包含:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:706-721;ii)选自SEQ ID NO:706-721的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO∶706-721的序列至少95%、90%或85%同一的引导序列;iv)包含表5A中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;和任选地
b.如前述权利要求中任一项所述的与mRNA或组合物相关的mRNA或组合物。
141.一种组合物,所述组合物包含:
a.包含选自以下的引导序列的gRNA:i)SEQ ID NO:618-669;ii)选自SEQ ID NO:618-669的序列的至少17、18、19或20个连续核苷酸;iii)与选自SEQ ID NO:618-669的序列至少95%、90%或85%同一的引导序列;iv)包含表5B中所列出的基因组坐标的10个连续核苷酸±10个核苷酸的序列;v)来自(iv)的序列的至少17、18、19或20个连续核苷酸;或vi)与选自(v)的序列至少95%、90%或85%同一的引导序列;和任选地
b.如前述权利要求中任一项所述的与mRNA或组合物相关的mRNA或组合物。
142.一种已降低或消除TRAC的表面表达的工程化细胞,所述工程化细胞包含人类TRAC基因中的基因修饰,其中所述基因修饰包含选自以下的基因组坐标内的至少一个核苷酸的修饰:
chr14:22547596-22547616;chr14:22550570-22550590;chr14:22547763-22547783;chr14:22550596-22550616;chr14:22550566-22550586;chr14:22547753-22547773;chr14:22550601-22550621;chr14:22550599-22550619;chr14:22547583-22547603;chr14∶22547671-22547691;chr14:22547770-22547790;chr14∶22547676-22547696;chr14:22547772-22547792;chr14:22547771-22547791;chr14:22547733-22547753;chr14:22547776-22547796。
143.一种已降低或消除TRBC1/2的表面表达的工程化细胞,所述工程化细胞包含人类TRBC1/2基因中的基因修饰,其中所述基因修饰包含选自以下的基因组坐标内的至少一个核苷酸的修饰:
chr7:142791757-142791777;chr7:142801104-142801124;chr7:142791811-142791831;chr7:142801158-142801178;chr7:142792728-142792748;chr7:142791719-142791739;chr7:142791766-142791786;chr7:142801113-142801133;chr7:142791928-142791948;chr7:142801275-142801295;chr7:142792062-142792082;chr7:142801409-142801429;chr7:142792713-142792733;chr7:142802126-142802146;chr7:142791808-142791828;chr7:142801155-142801175;chr7:142792003-142792023;chr7:142801350-142801370;chr7:142791760-142791780;chr7:142791715-142791735;chr7:142792781-142792801;chr7:142792040-142792060;chr7:142801387-142801407;chr7:142791862-142791882;chr7:142791716-142791736;chr7:142791787-142791807;chr7:142791759-142791779;chr7:142801106-142801126;chr7:142791807-142791827;chr7:142801154-142801174;chr7:142791879-142791899;chr7:142801226-142801246;chr7:142791805-142791825;chr7:142791700-142791720;chr7:142791765-142791785;chr7:142801112-142801132;chr7:142791820-142791840;chr7:142791872-142791892;chr7:142801219-142801239;chr7:142791700-142791720;chr7:142791806-142791826;chr7:142801153-142801173;chr7:142792035-142792055;chr7:142792724-142792744;chr7:142792754-142792774;chr7:142791804-142791824;chr7:142792684-142792704;chr7:142791823-142791843;chr7:142792728-142792748;chr7:142792721-142792741;chr7:142792749-142792769;chr7:142792685-142792705;chr7:142791816-142791836;chr7:142801163-142801183;chr7:142792686-142792706;chr7:142791793-142791813;chr7:142793110-142793130;chr7:142791815-142791835;chr7:142801162-142801182;chr7:142792770-142792790;chr7:142792047-142792067;chr7:142801394-142801414;chr7:142791871-142791891;chr7:142801218-142801238:chr7:142791894-142791914;chr7:142792723-142792743;chr7:142792724-142792744;chr7:142791897-142791917;chr7:142801244-142801264;chr7:142792757-142792777;chr7:142792740-142792760;chr7:142792758-142792778。
144.一种脂质核酸组装组合物,所述脂质核酸组装组合物包含mRNA,所述mRNA包含编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的开放阅读框,其中所述多肽不包含尿嘧啶糖苷酶抑制剂(UGI)。
145.一种或多种脂质核酸组装组合物,任选地为脂质纳米粒子,所述脂质核酸组装组合物包含:
(a)第一mRNA,其包含编码包含胞苷脱氨酶和RNA引导的切口酶的多肽的第一开放阅读框;
(b)第二mRNA,其包含编码尿嘧啶糖苷酶抑制剂(UGI)的第二开放阅读框;和
(c)一种或多种引导RNA。
146.如权利要求134-143中任一项所述的方法、细胞或工程化细胞,其中所述细胞为免疫细胞、淋巴细胞或T细胞。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/124,060 | 2020-12-11 | ||
US63/130,104 | 2020-12-23 | ||
US63/165,636 | 2021-03-24 | ||
US202163275424P | 2021-11-03 | 2021-11-03 | |
US63/275,424 | 2021-11-03 | ||
PCT/US2021/062922 WO2022125968A1 (en) | 2020-12-11 | 2021-12-10 | Polynucleotides, compositions, and methods for genome editing involving deamination |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117280024A true CN117280024A (zh) | 2023-12-22 |
Family
ID=89203144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180093243.2A Pending CN117280024A (zh) | 2020-12-11 | 2021-12-10 | 用于涉及脱氨作用的基因组编辑的多核苷酸、组合物和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117280024A (zh) |
-
2021
- 2021-12-10 CN CN202180093243.2A patent/CN117280024A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI839337B (zh) | 用於基因組編輯之多核苷酸、組合物及方法 | |
US20240002820A1 (en) | Polynucleotides, Compositions, and Methods for Genome Editing Involving Deamination | |
CN116018403A (zh) | 体外细胞递送方法 | |
AU2015369725A1 (en) | CRISPR having or associated with destabilization domains | |
TW202027798A (zh) | 用於從白蛋白基因座表現轉殖基因的組成物及方法 | |
US20230035659A1 (en) | Compositions and Methods for TTR Gene Editing and Treating ATTR Amyloidosis Comprising a Corticosteroid or Use Thereof | |
TW202102529A (zh) | 用於多肽表現之多核苷酸、組合物及方法 | |
TW202020156A (zh) | 用於治療原發性高草酸尿症第1型(ph1)之羥酸氧化酶1(hao1)基因編輯之組合物及方法 | |
JP2023531384A (ja) | 新規なomni-59、61、67、76、79、80、81及び82クリスパーヌクレアーゼ | |
US20230374456A1 (en) | T-Cell Immunoglobulin and Mucin Domain 3 (TIM3) Compositions and Methods for Immunotherapy | |
US20230383253A1 (en) | Lymphocyte Activation Gene 3 (LAG3) Compositions and Methods for Immunotherapy | |
Sjeklocha et al. | β‐globin matrix attachment region improves stable genomic expression of the Sleeping beauty transposon | |
US20230141052A1 (en) | Methods and compositions for genomic integration | |
CA3153563A1 (en) | Novel crispr enzymes, methods, systems and uses thereof | |
US20240167008A1 (en) | Novel crispr enzymes, methods, systems and uses thereof | |
CN117280024A (zh) | 用于涉及脱氨作用的基因组编辑的多核苷酸、组合物和方法 | |
CN117940426A (zh) | Dna依赖性蛋白质激酶抑制剂以及其组合物和用途 | |
US20230383252A1 (en) | Natural Killer Cell Receptor 2B4 Compositions and Methods for Immunotherapy | |
US20240228577A1 (en) | Programmed Cell Death Protein 1 (PD1) Compositions and Methods for Cell-Based Therapy | |
WO2023028471A1 (en) | Programmed cell death protein 1 (pd1) compositions and methods for cell-based therapy | |
WO2023019269A2 (en) | Novel omni 115, 124, 127, 144-149, 159, 218, 237, 248, 251-253 and 259 crispr nucleases | |
TW202325848A (zh) | 用於基因體編輯之多核苷酸、組合物及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |