JP2023156337A - 改良されたハイスループットコンビナトリアル遺伝子改変システムおよび最適化されたCas9酵素変異体 - Google Patents
改良されたハイスループットコンビナトリアル遺伝子改変システムおよび最適化されたCas9酵素変異体 Download PDFInfo
- Publication number
- JP2023156337A JP2023156337A JP2023119639A JP2023119639A JP2023156337A JP 2023156337 A JP2023156337 A JP 2023156337A JP 2023119639 A JP2023119639 A JP 2023119639A JP 2023119639 A JP2023119639 A JP 2023119639A JP 2023156337 A JP2023156337 A JP 2023156337A
- Authority
- JP
- Japan
- Prior art keywords
- dna
- restriction enzyme
- vector
- iis restriction
- type iis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108091033409 CRISPR Proteins 0.000 title description 18
- 230000001976 improved effect Effects 0.000 title description 17
- 238000012239 gene modification Methods 0.000 title description 3
- 230000005017 genetic modification Effects 0.000 title 1
- 235000013617 genetically modified food Nutrition 0.000 title 1
- 108020004414 DNA Proteins 0.000 claims abstract description 255
- 238000000034 method Methods 0.000 claims abstract description 71
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 68
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 53
- 229920001184 polypeptide Polymers 0.000 claims abstract description 49
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 49
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 29
- 102000053602 DNA Human genes 0.000 claims abstract description 28
- 235000004279 alanine Nutrition 0.000 claims abstract description 15
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims abstract description 13
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims abstract description 8
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 claims abstract description 5
- 108090000623 proteins and genes Proteins 0.000 claims description 141
- 102000004169 proteins and genes Human genes 0.000 claims description 119
- 239000013598 vector Substances 0.000 claims description 119
- 235000018102 proteins Nutrition 0.000 claims description 115
- 108091008146 restriction endonucleases Proteins 0.000 claims description 84
- 230000035772 mutation Effects 0.000 claims description 60
- 239000013604 expression vector Substances 0.000 claims description 50
- 239000012634 fragment Substances 0.000 claims description 49
- 102000040430 polynucleotide Human genes 0.000 claims description 31
- 108091033319 polynucleotide Proteins 0.000 claims description 31
- 239000002157 polynucleotide Substances 0.000 claims description 31
- 125000000539 amino acid group Chemical group 0.000 claims description 24
- 239000002131 composite material Substances 0.000 claims description 23
- 150000007523 nucleic acids Chemical class 0.000 claims description 22
- 238000006467 substitution reaction Methods 0.000 claims description 20
- 102000039446 nucleic acids Human genes 0.000 claims description 19
- 108020004707 nucleic acids Proteins 0.000 claims description 19
- 230000027455 binding Effects 0.000 claims description 15
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 13
- 102000004190 Enzymes Human genes 0.000 claims description 10
- 108090000790 Enzymes Proteins 0.000 claims description 10
- 239000013603 viral vector Substances 0.000 claims description 10
- 239000000203 mixture Substances 0.000 claims description 9
- 238000005520 cutting process Methods 0.000 claims description 8
- 238000004519 manufacturing process Methods 0.000 claims description 8
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 8
- 238000000137 annealing Methods 0.000 claims description 6
- 229930182817 methionine Natural products 0.000 claims description 5
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 claims description 5
- 230000001177 retroviral effect Effects 0.000 claims description 5
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 3
- 239000004474 valine Substances 0.000 claims description 3
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 2
- 210000004027 cell Anatomy 0.000 description 91
- 108010054624 red fluorescent protein Proteins 0.000 description 37
- 230000000694 effects Effects 0.000 description 33
- 238000003860 storage Methods 0.000 description 26
- 108091026890 Coding region Proteins 0.000 description 25
- 235000001014 amino acid Nutrition 0.000 description 22
- 230000009437 off-target effect Effects 0.000 description 21
- 150000001413 amino acids Chemical class 0.000 description 19
- 239000002773 nucleotide Substances 0.000 description 19
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 17
- 238000003776 cleavage reaction Methods 0.000 description 16
- 230000007017 scission Effects 0.000 description 16
- 238000003556 assay Methods 0.000 description 15
- 239000013612 plasmid Substances 0.000 description 15
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 14
- 125000003729 nucleotide group Chemical group 0.000 description 14
- 238000012163 sequencing technique Methods 0.000 description 14
- 239000005090 green fluorescent protein Substances 0.000 description 13
- 238000013518 transcription Methods 0.000 description 13
- 230000035897 transcription Effects 0.000 description 13
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 12
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 12
- 230000008685 targeting Effects 0.000 description 12
- 241000713666 Lentivirus Species 0.000 description 11
- 230000002068 genetic effect Effects 0.000 description 11
- 210000005260 human cell Anatomy 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 238000002703 mutagenesis Methods 0.000 description 11
- 231100000350 mutagenesis Toxicity 0.000 description 11
- 230000001580 bacterial effect Effects 0.000 description 10
- 239000000523 sample Substances 0.000 description 10
- 101710163270 Nuclease Proteins 0.000 description 9
- 101150063416 add gene Proteins 0.000 description 9
- 238000012216 screening Methods 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 230000007018 DNA scission Effects 0.000 description 8
- 241000894007 species Species 0.000 description 8
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 description 7
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 7
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 7
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 description 7
- 238000012512 characterization method Methods 0.000 description 7
- 230000029087 digestion Effects 0.000 description 7
- 230000004927 fusion Effects 0.000 description 7
- 238000010362 genome editing Methods 0.000 description 7
- 230000006798 recombination Effects 0.000 description 7
- 108020004705 Codon Proteins 0.000 description 6
- 102000004533 Endonucleases Human genes 0.000 description 6
- 108010042407 Endonucleases Proteins 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 208000015181 infectious disease Diseases 0.000 description 6
- 231100000241 scar Toxicity 0.000 description 6
- 125000006850 spacer group Chemical group 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 241000193996 Streptococcus pyogenes Species 0.000 description 5
- 239000002253 acid Substances 0.000 description 5
- 150000007513 acids Chemical class 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000000684 flow cytometry Methods 0.000 description 5
- 230000009438 off-target cleavage Effects 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 230000003612 virological effect Effects 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 230000002922 epistatic effect Effects 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 102000034287 fluorescent proteins Human genes 0.000 description 4
- 108091006047 fluorescent proteins Proteins 0.000 description 4
- 238000001502 gel electrophoresis Methods 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000005304 joining Methods 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 238000007480 sanger sequencing Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 3
- 108091093088 Amplicon Proteins 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 108700010070 Codon Usage Proteins 0.000 description 3
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 3
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 3
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 3
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000010230 functional analysis Methods 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 231100000518 lethal Toxicity 0.000 description 3
- 230000001665 lethal effect Effects 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 230000000869 mutational effect Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 2
- 108700011259 MicroRNAs Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 108010084455 Zeocin Proteins 0.000 description 2
- 210000005006 adaptive immune system Anatomy 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 239000002543 antimycotic Substances 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000005754 cellular signaling Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 238000003205 genotyping method Methods 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000005580 one pot reaction Methods 0.000 description 2
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 238000007671 third-generation sequencing Methods 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical group C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 1
- 238000009010 Bradford assay Methods 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000863012 Caulobacter Species 0.000 description 1
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000007702 DNA assembly Methods 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241001038769 Enterococcus timonensis Species 0.000 description 1
- 101150066002 GFP gene Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- QEFRNWWLZKMPFJ-ZXPFJRLXSA-N L-methionine (R)-S-oxide Chemical compound C[S@@](=O)CC[C@H]([NH3+])C([O-])=O QEFRNWWLZKMPFJ-ZXPFJRLXSA-N 0.000 description 1
- QEFRNWWLZKMPFJ-UHFFFAOYSA-N L-methionine sulphoxide Natural products CS(=O)CCC(N)C(O)=O QEFRNWWLZKMPFJ-UHFFFAOYSA-N 0.000 description 1
- 241000186779 Listeria monocytogenes Species 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 101800000135 N-terminal protein Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 239000012124 Opti-MEM Substances 0.000 description 1
- 101800001452 P1 proteinase Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- ZYFVNVRFVHJEIU-UHFFFAOYSA-N PicoGreen Chemical compound CN(C)CCCN(CCCN(C)C)C1=CC(=CC2=[N+](C3=CC=CC=C3S2)C)C2=CC=CC=C2N1C1=CC=CC=C1 ZYFVNVRFVHJEIU-UHFFFAOYSA-N 0.000 description 1
- 239000004695 Polyether sulfone Substances 0.000 description 1
- 101710182846 Polyhedrin Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 239000012083 RIPA buffer Substances 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 239000006146 Roswell Park Memorial Institute medium Substances 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 241001138501 Salmonella enterica Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000194042 Streptococcus dysgalactiae Species 0.000 description 1
- 241000194048 Streptococcus equi Species 0.000 description 1
- 241001134658 Streptococcus mitis Species 0.000 description 1
- 241000194019 Streptococcus mutans Species 0.000 description 1
- 241000194025 Streptococcus oralis Species 0.000 description 1
- 241000193991 Streptococcus parasanguinis Species 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 239000003070 absorption delaying agent Substances 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 229960003669 carbenicillin Drugs 0.000 description 1
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- -1 coatings Substances 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000002742 combinatorial mutagenesis Methods 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000007884 disintegrant Substances 0.000 description 1
- 239000002612 dispersion medium Substances 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 230000012361 double-strand break repair Effects 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 235000003599 food sweetener Nutrition 0.000 description 1
- UHBYWPGGCSDKFX-VKHMYHEASA-N gamma-carboxy-L-glutamic acid Chemical compound OC(=O)[C@@H](N)CC(C(O)=O)C(O)=O UHBYWPGGCSDKFX-VKHMYHEASA-N 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 125000004435 hydrogen atom Chemical class [H]* 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000004941 influx Effects 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- LSDPWZHWYPCBBB-UHFFFAOYSA-O methylsulfide anion Chemical compound [SH2+]C LSDPWZHWYPCBBB-UHFFFAOYSA-O 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 229910052754 neon Inorganic materials 0.000 description 1
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000001293 nucleolytic effect Effects 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 1
- 230000004983 pleiotropic effect Effects 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920006393 polyether sulfone Polymers 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 239000003531 protein hydrolysate Substances 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 229940115920 streptococcus dysgalactiae Drugs 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 238000011311 validation assay Methods 0.000 description 1
- 238000012418 validation experiment Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1082—Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
- C12N15/1031—Mutagenizing nucleic acids mutagenesis by gene assembly, e.g. assembly by oligonucleotide extension PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1058—Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/66—General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
- C40B40/08—Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B20/00—Methods specially adapted for identifying library members
- C40B20/04—Identifying library members by means of a tag, label, or other readable or detectable entity associated with the library members, e.g. decoding processes
Abstract
【課題】特定のポリペプチド、および前記ポリペプチドを使用して標的部位でDNA分子を切断する方法を提供する。
【解決手段】特定配列の残基1003に対応する残基が置換され、かつ前記特定配列の残基661に対応する残基が置換されている、特定のアミノ酸配列を含むポリペプチド。前記特定配列の残基1003に対応する残基がヒスチジンで置換され、かつ前記特定配列の残基661に対応する残基がアラニンで置換されている、前記ポリペプチドを提供する。また、標的部位でDNA分子を切断する方法であって、標的DNA部位を含むDNA分子を前記ポリペプチドおよび標的DNA部位に特異的に結合する短いガイドRNA(sgRNA)と接触させることにより、該DNA分子を標的DNA部位で切断することを含む、方法を提供する。
【選択図】図1a
【解決手段】特定配列の残基1003に対応する残基が置換され、かつ前記特定配列の残基661に対応する残基が置換されている、特定のアミノ酸配列を含むポリペプチド。前記特定配列の残基1003に対応する残基がヒスチジンで置換され、かつ前記特定配列の残基661に対応する残基がアラニンで置換されている、前記ポリペプチドを提供する。また、標的部位でDNA分子を切断する方法であって、標的DNA部位を含むDNA分子を前記ポリペプチドおよび標的DNA部位に特異的に結合する短いガイドRNA(sgRNA)と接触させることにより、該DNA分子を標的DNA部位で切断することを含む、方法を提供する。
【選択図】図1a
Description
関連出願
本出願は、2018年9月19日出願の米国仮特許出願第62/733,410号に基づく優先権の利益を主張し、その内容全体は全ての目的に関して引用により本明細書中に包含させる。
本出願は、2018年9月19日出願の米国仮特許出願第62/733,410号に基づく優先権の利益を主張し、その内容全体は全ての目的に関して引用により本明細書中に包含させる。
背景
組換えタンパク質は、産業用や医療用を含む様々な用途でますます重要性を増している。組換えタンパク質、特に酵素および抗体の機能性は遺伝子変異によって改善される可能性があるため、より望ましい特性を有する組換えタンパク質を特定し、それらの用途での有効性を向上させることができるようにするために、可能性のある組換えタンパク質の遺伝子変異体を幅広く作製し、選択するための継続的な努力が行われてきた。
組換えタンパク質は、産業用や医療用を含む様々な用途でますます重要性を増している。組換えタンパク質、特に酵素および抗体の機能性は遺伝子変異によって改善される可能性があるため、より望ましい特性を有する組換えタンパク質を特定し、それらの用途での有効性を向上させることができるようにするために、可能性のある組換えタンパク質の遺伝子変異体を幅広く作製し、選択するための継続的な努力が行われてきた。
Cas9(CRISPR関連タンパク質9)は、ストレプトコッカス属のグラム陽性菌の一種であるストレプトコッカス・ピオゲネス(Streptococcus pyogenes)などの細菌におけるCRISPR(Clustered Regularly Interspaced Short Palindromic Repeat)適応免疫系に関連するRNA誘導型DNAエンドヌクレアーゼである。近年、遺伝子編集のためのCRISPRの利用が増加していることから、Cas9は遺伝子組換えによる性能向上を目指す多くの人々の関心を集めている酵素である。しかしながら、特定のタンパク質の多数の遺伝子変異体を体系的に作製し、スクリーニングするための現在利用可能なシステムは、多くの場合、面倒で、労力がかかり、従って非効率的である。
このように、新たなハイスループットコンビナトリアル遺伝子組み換えシステム/方法ならびに改良された特徴を有する遺伝子組換えタンパク質(例えば、Cas9酵素)に対する明確なニーズがある。本発明は、このニーズおよび他の関連するニーズを満たす。
発明の概要
これまでに、本発明者らが率いる研究グループは、高次のバーコード化されたコンビナトリアル遺伝子ライブラリーのハイスループット機能解析のためのシステムを考案し、これをコンビナトリアル遺伝子エンマス(en masse)またはCombiGEMと称した。このシステムは、例えば、バーコード化されたデュアルガイドRNA(gRNA)の組合せのライブラリー、および二様(two-wise)または三様(three-wise)のバーコード化されたヒトマイクロRNA(miRNA)前駆体のライブラリーを作製するため、所望の機能性についてさらにスクリーニングするために用いられている(例えば、Wong et al. (Nat. Biotechnol. 2015 September; 33(9):952-961)、Wong et al. (Proc. Nat. Acad. Sci., March 1, 2016, 113(9):2544-2549)、WO2016/070037およびWO2016/115033を参照のこと)。米国特許第9,315,806号も参照のこと。本発明者らは現在、CombiGEMシステムをさらに改良し、高次コンビナトリアル変異体ライブラリーの各メンバーの何れか2つの隣接する遺伝子要素間のシームレスな連結を提供する改良されたCombinSEALプラットフォームを開発した。言い換えると、このプラットフォームは、連結部位のそれぞれにおいて、如何なる人工的なアミノ酸配列または外来アミノ酸配列も導入しないので、野生型タンパク質の天然アミノ酸配列を維持しながら、コンビナトリアル変異を含むタンパク質変異体の大規模なコレクションを作製することを可能にする。
これまでに、本発明者らが率いる研究グループは、高次のバーコード化されたコンビナトリアル遺伝子ライブラリーのハイスループット機能解析のためのシステムを考案し、これをコンビナトリアル遺伝子エンマス(en masse)またはCombiGEMと称した。このシステムは、例えば、バーコード化されたデュアルガイドRNA(gRNA)の組合せのライブラリー、および二様(two-wise)または三様(three-wise)のバーコード化されたヒトマイクロRNA(miRNA)前駆体のライブラリーを作製するため、所望の機能性についてさらにスクリーニングするために用いられている(例えば、Wong et al. (Nat. Biotechnol. 2015 September; 33(9):952-961)、Wong et al. (Proc. Nat. Acad. Sci., March 1, 2016, 113(9):2544-2549)、WO2016/070037およびWO2016/115033を参照のこと)。米国特許第9,315,806号も参照のこと。本発明者らは現在、CombiGEMシステムをさらに改良し、高次コンビナトリアル変異体ライブラリーの各メンバーの何れか2つの隣接する遺伝子要素間のシームレスな連結を提供する改良されたCombinSEALプラットフォームを開発した。言い換えると、このプラットフォームは、連結部位のそれぞれにおいて、如何なる人工的なアミノ酸配列または外来アミノ酸配列も導入しないので、野生型タンパク質の天然アミノ酸配列を維持しながら、コンビナトリアル変異を含むタンパク質変異体の大規模なコレクションを作製することを可能にする。
このように、本発明は、第一に、コンビナトリアル変異体を体系的に作製し、スクリーニングするための改良されたハイスループット遺伝子組換えシステムを提供する。ある面において、本発明は、DNA鎖の5'から3'の方向に、第1のタイプのIIS型制限酵素のための第1の認識部位;DNAエレメント;第2のタイプのIIS型制限酵素のための第1および第2の認識部位;DNAエレメントに一意的に割り当てられたバーコード;ならびに、第1のタイプのIIS型制限酵素のための第2の認識部位、を含むDNA構築物を提供する。ある態様において、DNA構築物は直線状構築物である。他の態様において、DNA構築物は、環状構築物または細菌ベースのDNAプラスミドもしくはDNAウイルスベクターを含むDNAベクターである。DNA構築物は、好ましくは単離され、すなわち、有意な量の他のDNA配列が存在しない状態で単離される。ある態様において、本発明は、上記および本明細書に記載のDNA構築物のうちの少なくとも2つの、場合により多くのDNA構築物を含むライブラリーを提供し、ライブラリーメンバーの各々は、一意的に割り当てられたバーコードとともに、異なるポリヌクレオチド配列を有する別個のDNAエレメントを有する。
本発明の別の面において、別のDNA構築物が提供される:該DNA構築物は、DNA鎖の5'から3'の方向に、第1のタイプのIIS型制限酵素のための認識部位;複数のDNAエレメント;プライマー結合部位;ならびに、複数のバーコードの各々が、複数のDNAエレメントのうちの1つに一意的に割り当てられており、第2のタイプのIIS制限酵素のための認識部位を含み、ここで、複数のDNAエレメントは、複数のDNAエレメントのうちの何れか2つの間の連結点において、如何なる外来配列も含まず、タンパク質のためのコード化配列(例えば、天然または野生型タンパク質のためのコード化配列)を形成するように互いに接続されており、ここで、複数のバーコードの各々が、割り当てられたDNAエレメントの逆の順序で配置されている。ある態様において、DNA構築物は直線状である。他の態様において、DNA構築物は環状であり、例えば、細菌ベースのDNAプラスミドもしくはDNAウイルスベクターを含むDNAベクターである。そのような構築物のライブラリーもまた、少なくとも2つ、場合により多くの構築物を含むように提供され、各メンバーは、異なるポリヌクレオチド配列のDNAエレメントのセットおよび一意的に割り当てられたバーコードのセットを有する。
上記および本明細書に記載のいずれかのDNA構築物のいくつかの態様において、第1のタイプのIIS型制限酵素および第2のタイプのIIS型制限酵素は、DNA分子を切断することにより適合性の端末を作製する。ある態様において、第1のタイプのIIS型制限酵素はBsaIである。ある態様において、第2のタイプのIIS型制限酵素はBbsIである。
1つのさらなる面において、本発明は、コンビナトリアル遺伝子構築物の作製方法に関する。この方法は、以下の工程を含む:(a) 請求項2に記載の第1のDNAベクターを第1のタイプのIIS型制限酵素で切断して、第1のDNAセグメント、第2のタイプのIIS型制限酵素のための第1および第2の認識部位ならびに第1のタイプのIIS型制限酵素により作製された第1および第2の末端に隣接する第1のバーコードを含む第1のDNAフラグメントを遊離させる工程;(b) プロモーターを含む最初の発現ベクターを第2のタイプのIIS型制限酵素で切断して、該最初の発現ベクターをプロモーターの3’末端付近で線形化(linearize)し、かつ(a)のDNAフラグメントの第1および第2の末端と適合性の2つの末端を作成する工程;(c) (a)の第1のDNAフラグメントを(b)の線形化された発現ベクターにアニーリングおよびライゲーションして、第1のDNAフラグメントおよび第1のバーコードがその3’末端でプロモーターに作動可能に連結されている1ウェイ(1-way)複合型発現ベクター(1-way composite expression vector)を形成する工程;(d) 請求項2に記載の第2のDNAベクターを第1のタイプのIIS型制限酵素で切断して、第2のDNAセグメント、第2のタイプのIIS型制限酵素のための第1および第2の認識部位ならびに第1のタイプのIIS型制限酵素により作製された第1および第2の末端に隣接する第2のバーコードを含む第2のDNAフラグメントを遊離させる工程;(e) (c)の複合型発現ベクターを、第2のタイプのIIS型制限酵素で切断して、第1のDNAエレメントと第1のバーコードの間で複合型発現ベクターを線形化し、かつ(d)のDNAフラグメントの第1および第2の末端と適合性の2つの末端を作成する工程;ならびに、(f) (d)の第2のDNAフラグメントを第1のDNAエレメントと第1のバーコードの間で(e)の線形化された複合型発現ベクターにアニーリングおよびライゲーションして、第1のDNAフラグメント、第2のDNAフラグメント、第2のバーコードおよび第1のバーコードがこの順でその3’末端でプロモーターに作動可能に連結されている、2ウェイ複合型発現ベクターを形成する工程(ここで、第1および第2のDNAエレメントが、互いに直接隣接するそのN末端由来の予め選択されたタンパク質の第1および第2のセグメントをコードし、該第1および第2のDNAフラグメントが、予め選択されたタンパク質に見いだされないアミノ酸残基をもたらす外来ヌクレオチド配列を含まない2ウェイ複合型発現ベクター中で互いに結合しており、かつ該第1および第2のDNAエレメントがそれぞれ、1以上の変異を含む)。
この方法のある態様において、工程(d)から(f)は、n番目のDNAエレメント、第2のタイプのIIS型制限酵素のための第1および第2の認識部位ならびにn番目のバーコードを含むn番目のDNAフラグメントを、nウェイ(n-way)複合型発現ベクターに組み込むためにn回目まで繰り返され、ここで該n番目のDNAエレメントが、予め選択されたタンパク質のn番目または第2番目から最後のセグメントをそのC末端からコードしている。この方法は、以下の工程をさらに含む:(x) 第1のタイプのIIS型制限酵素のための第1および第2の認識部位の間に、(n+1)番目のDNAエレメント、プライマー結合部位ならびに(n+1)番目のバーコードを含む、最終DNAベクターを提供する工程;(y) 該最終DNAベクターを第1のタイプのIIS型制限酵素で切断して、5’から3’の順に、(n+1)番目のDNAエレメント、プライマー結合部位ならびに第1のタイプのIIS型制限酵素により作製された第1および第2の末端に隣接する(n+1)番目のバーコードを含む最終DNAフラグメントを遊離させる工程;(z) 該最終DNAフラグメントを、工程(d)から(f)をn回繰り返し後に作製され、かつ第2のタイプのIIS型制限酵素により線形化されたnウェイ複合型発現ベクターにアニーリングおよびライゲーションして、最終複合型発現ベクター(final composite expression vector)を形成する工程(ここで、第1、第2およびn番目までならびに(n+1)番目のDNAエレメントが、そのN末端から互いにすぐに隣接している予め選択されたタンパク質の第1、第2およびn番目までならびに最終セグメントをコードし、第1、第2およびn番目までならびに最終DNAフラグメントが、予め選択されたタンパク質に見出されない何らかのアミノ酸残基をもたらす任意の外来ヌクレオチド配列を含まない最終複合型発現ベクター中で互いに結合されており、かつDNAエレメントの各々が、1個以上の変異を含む)。
上記および本明細書に記載の方法のある態様において、第1のタイプのIIS型制限酵素および第2のタイプのIIS型制限酵素は、DNA分子を切断することにより適合性の末端を作製する。ある態様において、第1のタイプのIIS型制限酵素はBsaIである。ある態様において、第2のタイプのIIS型制限酵素はBbsIである。
さらなる面において、本発明は、上記および本明細書に記載の方法により作製された少なくとも2つ、場合により多くの最終複合型発現ベクターを含むライブラリーを提供する。
第二に、本発明は、本明細書に記載の改善されたハイスループット遺伝子改変システムを用いることにより作製および同定される、改善したオンターゲット(on-target)の切断能および低減したオフターゲット(off-target)の切断能を有するSpCas9変異体を提供する。一面において、本発明は、配列番号1および4-13のいずれか1つに記載のアミノ酸配列を含むポリヌクレオチド(好ましくは、単離されたポリヌクレオチド)を提供し、このポリペプチドは基本配列として機能し、ここで、配列番号1の残基661、695、848、923、924、926、1003または1060に対応する少なくとも1つのおそらくより多くの残基が、例えば置換によって修飾されている。本発明のいくつかの例示的なポリペプチドは、本明細書の表2に提供される。ある態様において、配列番号1の残基1003に対応する残基が置換され、配列番号1の残基661に対応する残基が置換される。ある態様において、ポリペプチドはさらに、配列番号1の残基926に対応する残基で置換されている。例えば、このポリペプチドは、ヒスチジンで置換された配列番号1の残基1003に対応する残基およびアラニンで置換された配列番号1の残基661に対応する残基を有する。別の例では、ポリペプチドは、残基1003がヒスチジンで置換され、残基661がアラニンで置換されており、要すれば残基926においてアラニンでの置換をさらに含んでいてもよい、配列番号1に記載の基本アミノ酸配列を有する。さらなる例では、ポリペプチドは、配列番号1に記載の基本アミノ酸配列を有し、ここで、残基695、848および926はアラニンで置換され、残基923はメチオニンで置換され、残基924はバリンで置換される。また、(1)上記および本明細書に記載のポリペプチド;および(2)生理学的に許容される賦形剤を含む組成物も提供される。
別の面において、本発明は、上記および本明細書に記載のポリペプチドをコードするポリヌクレオチド配列を含む核酸(好ましくは、単離された核酸)、ならびに該核酸を含む組成物を提供する。本発明はまた、本発明のポリペプチドをコードするポリヌクレオチド配列に操作可能に連結されたプロモーターを含む発現カセット、および該発現カセットを含むベクター(例えば、細菌ベースのプラスミドまたはウイルスベースのベクター)、該本発明の発現カセットまたはポリペプチドを含む宿主細胞を提供する。
さらなる面において、本発明は、標的部位でDNA分子を切断する方法を提供する。この方法は、標的DNA部位を含むDNA分子を、上記および本明細書に記載のポリペプチドおよび標的DNA部位に特異的に結合するショートガイドRNA(sgRNA)と接触させる工程を含み、それによって該DNA分子を標的DNA部位で切断させる。この方法のある態様において、DNA分子は、生細胞内のゲノムDNAであり、細胞は、sgRNAおよびポリペプチドをコードするポリヌクレオチド配列でトランスフェクトされている。ある場合において、細胞は、sgRNAをコードする第1のベクターおよびポリペプチドをコードする第2のベクターでトランスフェクトされている。他の場合において、細胞は、sgRNAおよびポリペプチドの両方をコードするベクターでトランスフェクトされている。本方法のある態様において、第1および第2のベクターの各々は、レトロウイルスベクター、特にレンチウイルスベクターなどのウイルスベクターである。
上記および本明細書に記載されたハイスループットコンビナトリアル遺伝子組換えシステム、方法および関連する組成物は、原核細胞および真核細胞のいずれかにおける使用のために、適当なときに改変を加えて、好適である。いくつかの等価物もまた、上記および本明細書の記載から導き出すことができる。例えば、DNA構築物の各々におけるDNAエレメントおよびそれに対応するバーコードの配置を入れ替えることができ、すなわち、DNA構築物は、5’から3’へ、第1のタイプのIIS型制限酵素のための第1の認識部位、DNAエレメントに一意的に割り当てられたバーコード、第2のタイプのIIS型制限酵素のための第1および第2の認識部位、DNAエレメント、および第1のタイプのIIS型制限酵素のための第2の認識部位を含む。このようなDNA構築物およびそのライブラリーを、本明細書に記載の方法と同様の方法で用いることにより、本明細書に記載のものと同様の中間ベクターおよび最終ベクターを作製することができる。ただし、これらのベクターにおけるDNAエレメントおよびバーコードの相対的な位置が適宜入れ替えられることを除く。
定義
本明細書で用いる“CRISPR-Cas9”または“Cas9”は、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)を含むいくつかの細菌種に見出されるCRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)適応免疫系に関連するRNA誘導型DNAエンドヌクレアーゼ酵素であるCRISPR関連タンパク質9を意味する。ストレプトコッカス・ピオゲネス由来のCas9タンパク質であるSpCas9は、配列番号1に記載のアミノ酸配列を有し、このアミノ酸配列は、配列番号2に記載のポリヌクレオチド配列によってコードされている。配列番号1の残基661、695、848、923、924、926、1003および1060のような既知の重要な保存残基の少なくとも一部(例えば、少なくとも2つ、3つ、4つ、5つまたはそれ以上、例えば、少なくとも半分であるが、必ずしも全てではない)を含む有意な配列相同性を有する追加のCas9酵素は、図18の配列アラインメントを参照のこと。本明細書で用いる用語“Cas9タンパク質”は、配列番号1と実質的なアミノ酸配列同一性を有する、例えば、少なくとも50%、60%、70%、75%、最大80%、85%またはそれ以上の全体的な配列同一性を有する、何れかのRNA誘導DNAエンドヌクレアーゼ酵素を包含する。野生型Cas9タンパク質の例としては、細菌種Streptococcus mutans、Streptococcus dysgalactiae、Streptococcus equi、Streptococcus oralis、Streptococcus mitis、Listeria monocytogenes、Enterococcus timonensis、Streptococcus thermophilusおよびStreptococcus parasanguinisに由来するものが挙げられ、それぞれ配列番号4~13に記載のアミノ酸配列を有する。
本明細書で用いる“CRISPR-Cas9”または“Cas9”は、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)を含むいくつかの細菌種に見出されるCRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)適応免疫系に関連するRNA誘導型DNAエンドヌクレアーゼ酵素であるCRISPR関連タンパク質9を意味する。ストレプトコッカス・ピオゲネス由来のCas9タンパク質であるSpCas9は、配列番号1に記載のアミノ酸配列を有し、このアミノ酸配列は、配列番号2に記載のポリヌクレオチド配列によってコードされている。配列番号1の残基661、695、848、923、924、926、1003および1060のような既知の重要な保存残基の少なくとも一部(例えば、少なくとも2つ、3つ、4つ、5つまたはそれ以上、例えば、少なくとも半分であるが、必ずしも全てではない)を含む有意な配列相同性を有する追加のCas9酵素は、図18の配列アラインメントを参照のこと。本明細書で用いる用語“Cas9タンパク質”は、配列番号1と実質的なアミノ酸配列同一性を有する、例えば、少なくとも50%、60%、70%、75%、最大80%、85%またはそれ以上の全体的な配列同一性を有する、何れかのRNA誘導DNAエンドヌクレアーゼ酵素を包含する。野生型Cas9タンパク質の例としては、細菌種Streptococcus mutans、Streptococcus dysgalactiae、Streptococcus equi、Streptococcus oralis、Streptococcus mitis、Listeria monocytogenes、Enterococcus timonensis、Streptococcus thermophilusおよびStreptococcus parasanguinisに由来するものが挙げられ、それぞれ配列番号4~13に記載のアミノ酸配列を有する。
用語“核酸”または“ポリヌクレオチド”は、いずれかの一本鎖または二本鎖形態のデオキシリボヌクレオチドまたはリボヌクレオチドおよびそれらのポリマーを意味する。特に限定されない限り、この用語は、対照核酸と同様の結合特性を有し、天然のヌクレオチドと同様の方法で代謝される、天然ヌクレオチドの既知の類縁体を含む核酸を包含する。他に特記されない限り、特定の核酸配列はまた、その保存された修飾変異体(例えば、縮重コドン置換)および相対的配列ならびに明示的に記載された配列も当然包含する。具体的には、縮重コドン置換は、1以上の選択された(または全ての)コドンの3番目の位置が混合塩基および/またはデオキシイノシン残基で置換される配列を生成することによって達成され得る(Batzer et al., Nucleic Acid Res., 19:5081 (1991); Ohtsuka et al., J. Biol. Chem., 260:2605-2608 (1985);および、Cassol et al., (1992); Rossolini et al., Mol. Cell. Probes, 8:91-98 (1994))。核酸およびポリヌクレオチドという用語は、遺伝子、cDNAおよび遺伝子によってコードされるmRNAと互換的に用いられる。
用語“ポリペプチド”、“ペプチド”および“タンパク質”は、本明細書中で互換的に用いられ、アミノ酸残基のポリマーを意味する。この用語は、1以上のアミノ酸残基が、対応する天然アミノ酸の人工的な化学模倣体、ならびに天然アミノ酸ポリマーおよび非天然アミノ酸ポリマーである、アミノ酸ポリマーに適用される。本明細書で用いるこれらの用語は、アミノ酸残基が共有ペプチド結合によって連結されている、完全長タンパク質(すなわち、抗原)を含む、任意の長さのアミノ酸鎖を包含する。
用語“アミノ酸”は、天然および合成アミノ酸、ならびに天然アミノ酸と同様の方法で機能するアミノ酸類縁体およびアミノ酸模倣体を意味する。天然アミノ酸とは、遺伝コードによってコード化されたアミノ酸、ならびに後に修飾されるアミノ酸、例えばヒドロキシプロリン、γ-カルボキシグルタミン酸およびO-ホスホセリンである。アミノ酸類縁体とは、天然アミノ酸と同じ基本的な化学構造を有する化合物、すなわち、水素、カルボキシル基、アミノ基およびR基に結合するα炭素を有する化合物、例えば、ホモセリン、ノルロイシン、メチオニンスルホキシド、メチオニンメチルスルホニウムなどを意味する。そのような類縁体は、修飾されたR基(例えば、ノルロイシン)または修飾されたペプチド骨格を有するが、天然アミノ酸と同じ基本的な化学構造を保持している。“アミノ酸模倣体”とは、アミノ酸の一般的な化学構造とは異なる構造を有するが、天然アミノ酸と同様の方法で機能する化合物を意味する。
アミノ酸は、本明細書中、それらの一般的に知られている三文字記号、またはIUPAC-IUB生化学命名委員会(CBN:Biochemical Nomenclature Commission)によって推奨される一文字記号のいずれかによって記載され得る。同様に、ヌクレオチドもそれらの一般的に認められた一文字記号によって記載され得る。
“発現カセット”とは、宿主細胞における特定のポリヌクレオチド配列の転写を可能にする一連の指定された核酸エレメントを有する、組換えまたは合成により生成された核酸構築物である。発現カセットは、プラスミド、ウイルスゲノムまたは核酸フラグメントの一部であってもよい。一般的には、発現カセットは、プロモーターに作動可能に連結された、転写されるべきポリヌクレオチドを含む。この文脈における“作動可能に連結された”とは、ポリヌクレオチドコード化配列およびプロモーターなどの2つまたはそれ以上の遺伝的エレメントが、該コード化配列の転写を指向するプロモーターなどのエレメントの適切な生物学的機能を可能にする相対的位置に配置されたことを意味する。発現カセット内に存在し得る他のエレメントには、転写を増強するもの(例えば、エンハンサー)および転写を終結させるもの(例えば、ターミネーター)、ならびに発現カセットから産生される組換えタンパク質に特定の結合親和性または抗原性を付与するエレメントが含まれる。
“ベクター”は、細菌ベースの構造体(例えば、プラスミド)またはウイルスベースの構造体(例えば、ウイルスゲノム)から組換え的に産生された環状の核酸構築物である。一般的には、ベクターは、目的の1以上の遺伝的構成要素(例えば、1以上のタンパク質をコードするポリヌクレオチド配列)に加えて、自己複製起源を含む。ある場合には、ベクターは発現カセットを含んでもよく、これによりベクターは発現ベクターとなる。他の場合には、ベクターは、コード化配列を発現するための構成(apparatus)を含まず、むしろ、ある遺伝子構築物から別の遺伝子構築物への目的の1以上の遺伝的構成要素(例えば、コード化配列)の貯蔵および/または移動のためのキャリア(担体)またはシャトルとして作用し得る。要すれば、ベクターは、該ベクターを収容し、該ベクターからのタンパク質発現を可能にする、形質転換された宿主細胞またはトランスフェクトされた宿主細胞の容易な検出を可能にするために、抗生物質耐性タンパク質(例えば、細菌宿主細胞の検出のため)または蛍光タンパク質(例えば、真核生物宿主細胞の検出のため)などのタンパク質をコードしてもよい、1以上の選択マーカーまたは同定マーカーをコードする配列をさらに含んでいてもよい。
用語“異種”とは、組換え構築物中の2つのポリヌクレオチド配列または2つのポリペプチド配列のような2つのエレメント間の関係を記載する文脈中で用いられるとき、該2つのエレメントが、2つの異なる起源に由来し、現在、天然に見出されない、互いに相対的な位置に配置されているものとして記載される。例えば、タンパク質のコード化配列の発現を誘導する“異種”プロモーターは、コード化配列の発現を誘導するために天然に見出されないプロモーターである。別の例として、組換えポリペプチドを形成するために“異種”ペプチドと融合されたペプチドの場合、2つのペプチド配列は、2つの異なる親タンパク質に由来するか、または同じタンパク質に由来するが、互いに直接隣接しない2つの別個の部分である。言い換えれば、互いに“異種”な2つのエレメントの配置は、天然に見出され得るより長いポリヌクレオチドまたはポリペプチド配列をもたらさない。
本明細書で用いる用語“バーコード”は、該バーコードの存在に基づいて、予め決定されたポリヌクレオチド配列またはそのコード化されたアミノ酸配列を検出/同定するのを可能にするために、別の、予め決定されたポリヌクレオチド配列(例えば、SpCas9等の目的のタンパク質のコーディング配列の1つのセグメント)に一意的に割り当てられた、ポリヌクレオチド配列の短い伸張(一般的には最大30ヌクレオチド長、例えば約4または5ヌクレオチド長から約6、7、8、9、10、12、20または25ヌクレオチドの間)を意味する。
“IIS型制限酵素”は、非対称DNA配列を認識し、その認識配列の外側を(3’または5’)切断するエンドヌクレアーゼである。これらの酵素は、対称性または回文性のDNA配列を認識し、その認識配列内で切断するIIP型制限酵素とは異なる作用をする。IIS型制限酵素は、認識配列の外側でDNA鎖を切断するため、認識配列とは無関係にあらゆる配列のオーバーハングを生成することができる。従って、2つの異なるIIS型制限酵素を用いて、同じサイズおよび同じ方向のオーバーハング(すなわち、オーバーハングは両方とも3'または5'オーバーハングであり、同じ数のヌクレオチドを有する)だけでなく、一致したオーバーハングまたは互換性のある末端(すなわち、2つの対向する鎖上のオーバーハングは完全に相補的である)を生成することが可能であり、これにより、2つの異なるIIS型制限酵素によって生成された2つの末端間のアニーリングおよびライゲーションが可能になる。
本明細書で用いる用語“短いガイドRNA”または“sgRNA”とは、予め決められた標的部位でDNA分子に特異的に結合し、標的部位に隣接するDNA分子を切断するようにCRISPRヌクレアーゼを誘導する、約15~50(例えば、20、25または30)ヌクレオチド長のRNA分子を意味する。
ヌクレオチド配列は、2つのポリヌクレオチド配列、特に2つの一本鎖DNAまたはRNA配列が、2つの配列間の実質的または完全な(例えば、少なくとも約80%、85%、90%、95%、96%、97%、98%、99%または100%までの)ワトソン-クリック相補性に基づいて二本鎖構造を形成するように互いに複合化したときに、他方に“特異的に結合する”。
“生理学的に許容される賦形剤/担体”および“薬学的に許容される賦形剤/担体”とは、送達標的(細胞、組織または生きた生物)への活性剤の投与を補助する物質、および送達標的(細胞、組織または生きた生物)による吸収をしばしば補助する物質を意味し、レシピエントに有意な影響を及ぼすことなく、本発明の組成物中に含有され得る。生理学的/薬学的に許容される賦形剤の限定されない例としては、水、NaCl、通常の生理食塩水、乳化リンゲル、通常のスクロース、通常のグルコース、結合剤、充填剤、崩壊剤、滑沢剤、コーティング剤、甘味料、香料および着色剤などが挙げられる。本明細書で用いる用語“生理学的に/薬学的に許容される賦形剤/担体”は、意図された用途に適合する、あらゆるおよび全ての溶媒、分散媒体、コーティング剤、抗菌剤および抗真菌剤、等張剤および吸収遅延剤などを含むことを意図する。
予め決定された値に関連して用いられるとき、用語“約”は、その値の±10%を包含する範囲を意味する。
詳細な説明
I.一般
本発明は、望ましい生物学的機能性を有する組換えタンパク質を高効率で生成し、同定するための、新たに改良された高次の遺伝子組換えおよびスクリーニングプラットフォームに関する。本発明はまた、このプラットフォームによって産生される組換えタンパク質を提供する。
I.一般
本発明は、望ましい生物学的機能性を有する組換えタンパク質を高効率で生成し、同定するための、新たに改良された高次の遺伝子組換えおよびスクリーニングプラットフォームに関する。本発明はまた、このプラットフォームによって産生される組換えタンパク質を提供する。
A.組換え技術
組換え遺伝学の分野において一般的な方法および技術を開示する基本的なテキストとしては、Sambrook and Russell, Molecular Cloning, A Laboratory Manual (3rd ed. 2001);Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990);および、Ausubel et al., eds., Current Protocols in Molecular Biology (1994)が挙げられる。
組換え遺伝学の分野において一般的な方法および技術を開示する基本的なテキストとしては、Sambrook and Russell, Molecular Cloning, A Laboratory Manual (3rd ed. 2001);Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990);および、Ausubel et al., eds., Current Protocols in Molecular Biology (1994)が挙げられる。
核酸について、サイズはキロベース(kb)または塩基対(bp)のいずれかで示される。これらは、アガロースゲル電気泳動もしくはアクリルアミドゲル電気泳動、配列決定された核酸または公表されているDNA配列から得られた推定値である。タンパク質について、サイズはキロダルトン(kDa)またはアミノ酸残基数で示される。タンパク質のサイズは、ゲル電気泳動、配列決定されたタンパク質、それが由来するアミノ酸配列または公表されているタンパク質配列から推定される。
市販されていないオリゴヌクレオチドは、化学的に合成することができ、例えば、Beaucage & Caruthers, Tetrahedron Lett. 22: 1859-1862 (1981)に最初に記載された固相ホスホロアミダイトトリエステル(phosphoramidite triester)法に従って、Van Devanterらの、Nucleic Acids Res. 12: 6159-6168 (1984)に記載のように、自動化された合成装置を用いて、化学的に合成することができる。オリゴヌクレオチドの精製は、何らかの当該技術分野で認められた戦略、例えば、Pearson & Reanier, J. Chrom. 255: 137-149 (1983)に記載の天然アクリルアミドゲル電気泳動またはアニオン交換HPLCを用いて行われる。
目的のポリペプチド、例えばSpCas9タンパク質またはそのフラグメントをコードするポリヌクレオチド配列、および合成オリゴヌクレオチドは、例えばWallaceらの、Gene 16: 21-26 (1981)に記載の二本鎖テンプレートを配列決定するための鎖終結法を用いて、クローニングまたはサブクローニング後に確認することができる。
B.ポリヌクレオチドコーディング配列の修飾
目的の予め選択されたタンパク質(例えば、SpCas9)の既知のアミノ酸配列を考慮すると、当技術分野で知られているインビトロまたはインビボの方法ならびに本明細書に記載のインビトロまたはインビボの方法によって決定され得るように、当該タンパク質の望ましい特徴または改善された生物学的機能性を達成するために、修飾することができる。アミノ酸配列に対する可能な修飾としては、置換(保存的または非保存的);アミノ酸配列の1つまたは複数の位置における1以上のアミノ酸残基の欠失または付加が挙げられ得る。
目的の予め選択されたタンパク質(例えば、SpCas9)の既知のアミノ酸配列を考慮すると、当技術分野で知られているインビトロまたはインビボの方法ならびに本明細書に記載のインビトロまたはインビボの方法によって決定され得るように、当該タンパク質の望ましい特徴または改善された生物学的機能性を達成するために、修飾することができる。アミノ酸配列に対する可能な修飾としては、置換(保存的または非保存的);アミノ酸配列の1つまたは複数の位置における1以上のアミノ酸残基の欠失または付加が挙げられ得る。
様々な変異作製プロトコルが確立されており、当技術分野で記載されており、目的のタンパク質をコードするポリヌクレオチド配列を改変するために容易に用いることができる。例えば、Zhangら、Proc. Natl. Acad. Sci. USA, 94: 4504-4509 (1997);および、Stemmer, Nature, 370: 389-391 (1994)を参照のこと。これらの方法は、核酸セットの変異体、ならびにコード化されたタンパク質の変異体を生成するために、別個にまたは組み合わせて用いることができる。
多様性を生成する変異誘発法としては、例えば、部位特異的変異誘発法(Botstein and Shortle, Science, 229: 1193-1201 (1985))、ウラシル含有テンプレートを用いた変異誘発法(Kunkel, Proc. Natl. Acad. Sci. USA, 82: 488-492 (1985))、オリゴヌクレオチド介在(oligonucleotide-directed)変異誘発法(Zoller and Smith, Nucl. Acids Res., 10: 6487-6500 (1982))、ホスホロチオエート修飾DNA変異誘発法(Taylor et al., Nucl. Acids Res., 13: 8749-8764および8765-8787 (1985))、およびギャップ付き二本鎖DNAを用いた変異誘発法(Kramer et al., Nucl. Acids Res., 12: 9441-9456 (1984))が挙げられる。
他の可能性のある変異誘発法としては、点ミスマッチ修復法(Kramer et al., Cell, 38: 879-887 (1984))、修復欠損宿主株を用いた変異誘発法(Carter et al., Nucl. Acids Res. 13: 4431-4443 (1985))、欠失変異誘発法(Eghtedarzadeh and Henikoff, Nucl. Acids Res., 14: 5115 (1986))、制限選択法および制限精製法(Wells et al., Phil. Trans. R. Soc. Lond. A, 317: 415-423 (1986))、全遺伝子合成による変異誘発法(Nambiar et al., Science, 223: 1299-1301 (1984))、二本鎖切断修復法(Mandecki, Proc. Natl. Acad. Sci. USA, 83: 7177-7181 (1986))、ポリヌクレオチド鎖終結法による変異誘発法(米国特許第5,965,408号)、ならびにエラープローン(error-prone)PCR(Leung et al., Biotechniques, 1: 11-15 (1989))が挙げられる。
C.好ましいコドン使用のための核酸の修飾
目的のタンパク質またはそのフラグメントをコードするポリヌクレオチド配列は、特定のタイプの宿主細胞における組換え発現を増強するために、または潜在的な開裂/再ライゲーション(re-ligation)のための望ましい部位における制限エンドヌクレアーゼ認識配列の構築を可能にするようなさらなる遺伝子操作を容易にするために、好ましいコドン使用頻度と一致するように、コドン縮重の原理に基づいてさらに変更することができる。後者の使用法は、コンビナトリアル突然変異誘発を受ける標的タンパク質(例えば、SpCas9タンパク質)の複数のコーディングセグメントのシームレスな結合が、コーディングセグメントをIIS型制限酵素で消化して、天然タンパク質のコーディング配列に特異的に由来するオーバーハングを生成することに依存し、これらのセグメントの何れか2つの間の連結部における何らかの外来配列またはいわゆるスカー配列(scar sequence)を排除することができるため、本発明では特に重要である。
目的のタンパク質またはそのフラグメントをコードするポリヌクレオチド配列は、特定のタイプの宿主細胞における組換え発現を増強するために、または潜在的な開裂/再ライゲーション(re-ligation)のための望ましい部位における制限エンドヌクレアーゼ認識配列の構築を可能にするようなさらなる遺伝子操作を容易にするために、好ましいコドン使用頻度と一致するように、コドン縮重の原理に基づいてさらに変更することができる。後者の使用法は、コンビナトリアル突然変異誘発を受ける標的タンパク質(例えば、SpCas9タンパク質)の複数のコーディングセグメントのシームレスな結合が、コーディングセグメントをIIS型制限酵素で消化して、天然タンパク質のコーディング配列に特異的に由来するオーバーハングを生成することに依存し、これらのセグメントの何れか2つの間の連結部における何らかの外来配列またはいわゆるスカー配列(scar sequence)を排除することができるため、本発明では特に重要である。
修飾の完了時に、コード化配列は、配列決定によって確認され、その後、さらなる操作のためまたはタンパク質の組換え発現のために、適切なベクターにサブクローニングされる。
D.組換えポリペプチドの発現
目的の組換えポリペプチド(例えば、改良されたCas9タンパク質)を、本明細書に記載のポリペプチドをコードするポリヌクレオチド配列に依存して、組換え遺伝学の分野で常套の技術を用いて発現させることができる。
目的の組換えポリペプチド(例えば、改良されたCas9タンパク質)を、本明細書に記載のポリペプチドをコードするポリヌクレオチド配列に依存して、組換え遺伝学の分野で常套の技術を用いて発現させることができる。
(I)発現系
目的のポリペプチドをコードする核酸の高レベルの発現を得るために、一般的に、転写を指向する強力なプロモーター、転写/翻訳ターミネーターおよび翻訳開始のためのリボソーム結合部位を含む発現ベクター中にポリヌクレオチドコーディング配列をサブクローニングする。適切な細菌プロモーターは、当技術分野でよく知られており、例えば、Sambrook and Russell(上記)およびAusubelら(上記)に記載されている。組換えポリペプチドを発現させるための細菌発現系は、例えば、大腸菌、バチルス属菌(Bacillus sp.)、サルモネラ菌およびカウロバクター菌(Caulobacter)が利用可能である。かかる発現系のキットは市販されている。哺乳動物細胞、酵母および昆虫細胞用の真核生物発現系は、当技術分野でよく知られており、また市販されている。いくつかの例示的な真核生物発現ベクターとしては、アデノウイルスベクター、アデノ随伴ベクターおよびレンチウイルス由来のウイルスベクターなどのレトロウイルスベクターが挙げられる。
目的のポリペプチドをコードする核酸の高レベルの発現を得るために、一般的に、転写を指向する強力なプロモーター、転写/翻訳ターミネーターおよび翻訳開始のためのリボソーム結合部位を含む発現ベクター中にポリヌクレオチドコーディング配列をサブクローニングする。適切な細菌プロモーターは、当技術分野でよく知られており、例えば、Sambrook and Russell(上記)およびAusubelら(上記)に記載されている。組換えポリペプチドを発現させるための細菌発現系は、例えば、大腸菌、バチルス属菌(Bacillus sp.)、サルモネラ菌およびカウロバクター菌(Caulobacter)が利用可能である。かかる発現系のキットは市販されている。哺乳動物細胞、酵母および昆虫細胞用の真核生物発現系は、当技術分野でよく知られており、また市販されている。いくつかの例示的な真核生物発現ベクターとしては、アデノウイルスベクター、アデノ随伴ベクターおよびレンチウイルス由来のウイルスベクターなどのレトロウイルスベクターが挙げられる。
目的のタンパク質をコードする異種ポリヌクレオチド配列の発現を指向するために用いられるプロモーターは、特定の用途によって変わる。プロモーターは、要すれば、その自然環境における転写開始部位からの距離とほぼ同じ距離で、異種転写開始部位から離れて配置される。しかしながら、当技術分野で知られているように、この距離の多少の変動は、プロモーター機能を損なうことなく可能である。
プロモーターに加えて、発現ベクターは、一般的に、宿主細胞における所望のポリペプチドの発現に必要なすべての付加的要素を含む転写ユニットまたは発現カセットを含む。したがって、一般的な発現カセットは、ポリペプチドをコードする核酸配列に作動可能に連結されたプロモーターと、転写物の効率的なポリアデニル化、リボソーム結合部位および翻訳終結に必要なシグナルとを含む。分泌されたタンパク質の組換え発現の場合、タンパク質をコードするポリヌクレオチド配列は、一般的には、開裂可能なシグナルペプチド配列に連結されて、形質転換された細胞による組換えポリペプチドの分泌を促進する。一方、組換えポリペプチドが宿主細胞表面上で発現されることが意図される場合、適切なアンカー配列がコード化配列と協働して用いられる。カセットの付加的な要素には、エンハンサー、およびゲノムDNAが構造遺伝子として用いられるとき、機能的スプライシングドナー部位およびアクセプター部位を有するイントロンが含まれ得る。
プロモーター配列に加えて、発現カセットはまた、効率的な終結を提供するために、コーディング配列の下流に転写終結領域を含むべきである。終結領域は、プロモーター配列と同じ遺伝子から得られてもよいし、異なる遺伝子から得られてもよい。
真核生物ウイルス由来の調節エレメントを含む発現ベクターは、一般的には真核生物発現ベクター、例えばSV40ベクター、パピローマウイルスベクター、レンチウイルスベクターおよびエプスタインバーウイルス由来のベクターに用いられる。他の例示的な真核生物発現ベクターとしては、pMSG、pAV009/A+、pMTO10/A+、pMAMneo-5、バキュロウイルスpDSVEおよびSV40初期プロモーター、SV40後期プロモーター、メタロチオネインプロモーター、マウス乳腺腫瘍ウイルスプロモーター、ラウス肉腫ウイルスプロモーター、ポリヘドリンプロモーターまたは真核細胞での発現に有効であることが示されている他のプロモーターの指示下でタンパク質の発現を可能にする他の何らかのベクターが挙げられる。
発現ベクターに一般的に含まれるエレメントはまた、大腸菌で機能するレプリコン、組換えプラスミドを宿主とする細菌の選択を可能にするための抗生物質耐性をコード化する遺伝子、および真核生物配列の挿入を可能にするためのプラスミドの非必須領域における固有の制限部位を含んでいてもよい。選択される特定の抗生物質耐性遺伝子は重要ではなく、当技術分野で知られている多くの耐性遺伝子のいずれかが適している。原核生物配列は、必要に応じて、真核生物細胞におけるDNAの複製を妨げないようなものが選択され得る。抗生物質耐性選択マーカーと同様に、既知の代謝経路に基づく代謝選択マーカーもまた、形質転換された宿主細胞を選択するための手段として用いられ得る。
上記のように、当業者は、タンパク質の生物学的活性を保持したまま、タンパク質またはそのコード化配列に対して様々な保存的置換を行うことができることを認識し得る。さらに、ポリヌクレオチドのコード化配列の修飾もまた、特定の発現宿主における好ましいコドン使用に対応するために、または結果として得られるアミノ酸配列を改変することなく制限酵素切断部位を生成するために行われ得る。
(II)トランスフェクション法
標準的なトランスフェクション法は、大量の組換えポリペプチドを発現する細菌細胞系、哺乳動物細胞系、酵母細胞系、昆虫細胞系または植物細胞系を作製するために用いられ、これらは標準的技術を用いて精製される(例えば、Colley et al., J. Biol. Chem. 264: 17619-17622 (1989); Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)を参照のこと)。真核細胞および原核細胞の形質転換は、標準的技術に従って行われる(例えば、Morrison, J. Bact. 132: 349-351 (1977); Clark-Curtiss & Curtiss, Methods in Enzymology 101: 347-362 (Wu et al., eds, 1983)を参照のこと)。
標準的なトランスフェクション法は、大量の組換えポリペプチドを発現する細菌細胞系、哺乳動物細胞系、酵母細胞系、昆虫細胞系または植物細胞系を作製するために用いられ、これらは標準的技術を用いて精製される(例えば、Colley et al., J. Biol. Chem. 264: 17619-17622 (1989); Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)を参照のこと)。真核細胞および原核細胞の形質転換は、標準的技術に従って行われる(例えば、Morrison, J. Bact. 132: 349-351 (1977); Clark-Curtiss & Curtiss, Methods in Enzymology 101: 347-362 (Wu et al., eds, 1983)を参照のこと)。
宿主細胞に外来ヌクレオチド配列を導入するための周知のいずれかの方法を用いることができる。これらには、リン酸カルシウムトランスフェクション、ポリブレン、プロトプラスト融合、エレクトロポレーション、リポソーム、マイクロインジェクション、プラズマベクター、ウイルスベクターおよびクローン化されたゲノムDNA、cDNA、合成DNAまたは他の外来遺伝物質を宿主細胞に導入するための他の周知のいずれかの方法の使用が含まれる(例えば、上記のSambrook and Russellを参照のこと)。用いられる特定の遺伝子工学的方法が、組換えポリペプチドを発現することができる宿主細胞への少なくとも1つの遺伝子の導入に成功し得ることのみが必要である。
II.改良されたコンビナトリアル遺伝子改変システム
本発明者らは、以前に開発されたハイスループットCombiGEMコンビナトリアル遺伝子改変システム等に基づいて、それぞれが目的のタンパク質(例えば、SpCas9)の一部に対応し、そのアミノ酸配列中に少なくとも1つ、場合によっては複数の変異を含む複数のタンパク質セグメントをコード化するDNAエレメントをシームレスに結合させ、結果として得られる複合タンパク質変異体が、意図的に導入された変異を除いて、無関係なアミノ酸残基を有さないようにすることを目的として、これらのシステムをさらに改良した。以前の方法では、IIP型制限エンドヌクレアーゼを利用してDNA配列(コンビナトリアルタンパク質変異体のセグメントをコードする)を切断し、再ライゲーションしていたが、このタイプのエンドヌクレアーゼの性質(ヌクレオチド配列の短い回文配列に結合して切断する)は、一般的に、使用者(ユーザー)が余分なヌクレオチドを導入して切断部位を設計することを必要とし、その結果、システムによって生成されたタンパク質変異体の2つのセグメント間の各結合点に、外来アミノ酸残基(複数もある)または“scar”配列を生じることになる。これらの外来アミノ酸残基は、タンパク質配列をさらに変化させ、変異体の機能的スクリーニングを妨げる可能性がある。
本発明者らは、以前に開発されたハイスループットCombiGEMコンビナトリアル遺伝子改変システム等に基づいて、それぞれが目的のタンパク質(例えば、SpCas9)の一部に対応し、そのアミノ酸配列中に少なくとも1つ、場合によっては複数の変異を含む複数のタンパク質セグメントをコード化するDNAエレメントをシームレスに結合させ、結果として得られる複合タンパク質変異体が、意図的に導入された変異を除いて、無関係なアミノ酸残基を有さないようにすることを目的として、これらのシステムをさらに改良した。以前の方法では、IIP型制限エンドヌクレアーゼを利用してDNA配列(コンビナトリアルタンパク質変異体のセグメントをコードする)を切断し、再ライゲーションしていたが、このタイプのエンドヌクレアーゼの性質(ヌクレオチド配列の短い回文配列に結合して切断する)は、一般的に、使用者(ユーザー)が余分なヌクレオチドを導入して切断部位を設計することを必要とし、その結果、システムによって生成されたタンパク質変異体の2つのセグメント間の各結合点に、外来アミノ酸残基(複数もある)または“scar”配列を生じることになる。これらの外来アミノ酸残基は、タンパク質配列をさらに変化させ、変異体の機能的スクリーニングを妨げる可能性がある。
これらの望ましくない余分なアミノ酸残基の導入を回避するために、本発明者らは、タンパク質のセグメントをコード化する複数のDNAコーディング配列を構築し、ライゲーションするために、代わりにIIS型制限酵素を用いて、コンビナトリアル遺伝子変異体のライブラリーを構築するとき、セグメント間のこのような望ましくない“scar”配列を完全に除去できることを発見した。この方法は、IIS型エンドヌクレアーゼが、それらの非対称認識部位の外側でDNA鎖を切断することができるという事実を利用しており、これにより、これらの酵素によるDNA切断後に、野生型タンパク質の天然DNAコーディング配列の一部を有する互換性のある末端または一致したオーバーハングが生成されることを可能にしている。互換性のある末端または一致したオーバーハングにおける天然タンパク質由来のコーディング配列の使用は、タンパク質セグメント間のシームレスな結合を補助するだけでなく、特定の方向性のライゲーションを可能にし、コンビナトリアルタンパク質変異体を構築するプロセスの効率をさらに向上させる。
A.タンパク質セグメントをコードするDNAセグメントのライブラリーの生成
コンビナトリアルタンパク質変異体のライブラリーを作製する第一の工程は、タンパク質のセグメントのそれぞれについてライブラリーを作製することである:タンパク質変異体は、タンパク質セグメントまたはモジュールの予め決定された個数(例えば、3個、4個、5個、6個またはそれ以上)を端から端まで結合することによって生成されるように設計することができる。本明細書に記載のように、予め決定された個数は、n+1として表され、目的のタンパク質については、n=5の6個のセグメントからなるように考案される。最初に、野生型タンパク質の最N末端部分に対応し、タンパク質のこの部分に1個以上の可能な変異を含む第1のタンパク質セグメントをコード化するDNAエレメントのライブラリーまたは個々のメンバーのコレクションを、組換え生産または化学合成などの既知の方法によって生成され、適切な制限酵素部位および予め決定された変異(または予め決定された変異セット)を有するDNAエレメントに一意的に割り当てられたバーコード配列を含むDNAベクター(その目的のためのいわゆるストレージベクター)に組み込まれてもよい。DNAエレメントが比較的長いときは、ストレージベクターに組み込む前に、ギブソンアセンブリーのような既知の方法で短いフラグメントを結合させることによって最初に作製されてもよい。上記のように、DNA配列変異を生成する方法は、当業者にはよく知られており、例えば、1以上のヌクレオチドの欠失、挿入および/または置換によって、天然バージョンまたは野生型配列を改変することによって、配列変異体を生成するために容易に用いられ得る。
コンビナトリアルタンパク質変異体のライブラリーを作製する第一の工程は、タンパク質のセグメントのそれぞれについてライブラリーを作製することである:タンパク質変異体は、タンパク質セグメントまたはモジュールの予め決定された個数(例えば、3個、4個、5個、6個またはそれ以上)を端から端まで結合することによって生成されるように設計することができる。本明細書に記載のように、予め決定された個数は、n+1として表され、目的のタンパク質については、n=5の6個のセグメントからなるように考案される。最初に、野生型タンパク質の最N末端部分に対応し、タンパク質のこの部分に1個以上の可能な変異を含む第1のタンパク質セグメントをコード化するDNAエレメントのライブラリーまたは個々のメンバーのコレクションを、組換え生産または化学合成などの既知の方法によって生成され、適切な制限酵素部位および予め決定された変異(または予め決定された変異セット)を有するDNAエレメントに一意的に割り当てられたバーコード配列を含むDNAベクター(その目的のためのいわゆるストレージベクター)に組み込まれてもよい。DNAエレメントが比較的長いときは、ストレージベクターに組み込む前に、ギブソンアセンブリーのような既知の方法で短いフラグメントを結合させることによって最初に作製されてもよい。上記のように、DNA配列変異を生成する方法は、当業者にはよく知られており、例えば、1以上のヌクレオチドの欠失、挿入および/または置換によって、天然バージョンまたは野生型配列を改変することによって、配列変異体を生成するために容易に用いられ得る。
図7aは、タンパク質セグメントをコードするDNAエレメントをベクターに挿入してライゲーションし、5’から3’まで、第1のタイプのIIS型制限酵素(例えば、BsaI)のための第1の認識部位、DNAエレメント、第2のタイプのIIS型制限酵素(例えば、BbsI)のための第1および第2の認識部位、それが有する特定の変異(複数可)のためにDNAエレメントに一意的に割り当てられたバーコード、ならびに第1のタイプのIIS型制限酵素(例えば、BsaI)のための第2の認識部位を含むDNA構築物を形成する方法の例を示す。コンビナトリアル変異試験のための(n+1)個のセグメントまたはモジュールを有するように設計または“分解された(deconstructed)”タンパク質については、DNAセグメントを含むストレージベクターのライブラリーを、後続のDNAエレメントのそれぞれについて、2番目、3番目およびn番目のDNAエレメント(それぞれ、2番目、3番目およびn番目のタンパク質セグメントまでをコード化する)、タンパク質の2番目から最後または最C末端部分までに対応するn番目のタンパク質セグメントについて、同様の方法で構築することができる。
タンパク質の最後のセグメントまたは最C末端セグメントをコード化するDNAエレメントについては、(n+1)番目のDNAエレメントを含むベクターのライブラリーを構築するために、構造的に異なるストレージベクターが用いられる。図7aに例示のように、最後のDNAエレメントのまたは(n+1)番目のDNAエレメントは、このストレージベクターに挿入されて、5'から3'の順に、第1のタイプのIIS型制限酵素(例えば、BsaI)のための第1の認識部位、(n+1)番目のDNAエレメント、プライマー結合部位として機能する短いヌクレオチド配列伸張部、それが有する特定の変異(複数もある)のためにDNAエレメントに一意的に割り当てられたバーコード、および第1のタイプのIIS型制限酵素(例えば、BsaI)のための第2の認識部位を含むDNA構築物を形成する。プライマー結合部位の存在および配置は、タンパク質変異体のための複合コーディング配列(すべてのn+1個のDNAエレメントを組み合わせたもの)が生成された後、ユニバーサルプライマー(プライマー結合部位に特異的に結合する)を利用して結合されたバーコードの迅速な配列決定を可能にし、該変異体に含まれる変異の容易な同定を可能にし、複合コーディング配列全体を配列決定するという手間のかかる作業を行う必要がなくなる。
ライブラリー内の可能性のある組合せタンパク質変異体それぞれの均等な機会を確保するために、変異のユニークなセットを有するDNAエレメントはそれぞれ、好ましくは等モル比でライブラリー中に存在する。
B.コンビナトリアルタンパク質変異体ライブラリーの作成
第1、第2およびn番目までのDNAエレメントならびに(n+1)番目のDNAエレメントを含むストレージベクターのライブラリーが構築されると、タンパク質セグメントまたはモジュールをコードするDNAエレメントを含むDNAフラグメントは、まず、ストレージベクターの酵素的消化の方法、例えば、第1のタイプのIIS型制限エンドヌクレアーゼ(例えば、BsaI)を用いて、ベクターを2つの部位で切断することによって放出される。ストレージベクターの消化は、タンパク質セグメントをコードするDNAエレメント(変異を有する)およびその一意的に割り当てられたバーコードを含み、2つタイプのIIS型制限酵素(例えば、BbsI)認識部位が間に挟まれているDNAフラグメントをそれぞれ放出する。DNAフラグメントの2つの末端は、第1のタイプのIIS型制限酵素の切断によって生じるオーバーハングを有する。
第1、第2およびn番目までのDNAエレメントならびに(n+1)番目のDNAエレメントを含むストレージベクターのライブラリーが構築されると、タンパク質セグメントまたはモジュールをコードするDNAエレメントを含むDNAフラグメントは、まず、ストレージベクターの酵素的消化の方法、例えば、第1のタイプのIIS型制限エンドヌクレアーゼ(例えば、BsaI)を用いて、ベクターを2つの部位で切断することによって放出される。ストレージベクターの消化は、タンパク質セグメントをコードするDNAエレメント(変異を有する)およびその一意的に割り当てられたバーコードを含み、2つタイプのIIS型制限酵素(例えば、BbsI)認識部位が間に挟まれているDNAフラグメントをそれぞれ放出する。DNAフラグメントの2つの末端は、第1のタイプのIIS型制限酵素の切断によって生じるオーバーハングを有する。
一方、タンパク質変異体全体をコード化する最終的な複合DNAエレメントを担持して発現させることを目的とするDNAベクター(その目的のためのいわゆるデスティネーションベクター(destination vector))は、DNAコーディング配列の発現に必要なすべての遺伝的要素を含む発現ベクターである。前のセクションで記載の通り、転写のための1つの必須要素は、配列の転写を指示するために、コーディング配列に作動可能に連結されるべきプロモーターである。一般的には、プロモーターは、該コーディング配列に対して異種プロモーターである。
ストレージベクターライブラリーから産生されたDNAフラグメントを得るために、デスティネーションベクターは、DNAフラグメントの挿入/ライゲーションを可能にし、転写のためのプロモーターの制御下でDNAフラグメント内にDNAエレメント(タンパク質セグメントをコードする)を配置するように、プロモーターから下流の適当な距離にある部位で、同じくIIS型制限酵素による消化により直線化される。デスティネーションベクターを直線化するために用いられるIIS型制限酵素は、多くの場合、ストレージベクターからDNAフラグメントを放出するために用いられるものとは異なる。しかし、それらは、好ましくは、DNAフラグメントのデスティネーションベクターへのライゲーションを可能にするように、同じサイズおよび一致したオーバーハングを生じることが好ましい。
図7bに記載のように、第1のタンパク質セグメントの完全種(full variety)をコード化する第1のDNAエレメントの完全種を含むストレージベクターのライブラリーを、第1のタイプのIIS型制限酵素によって消化すると、対応するバーコードとともに第1のDNAエレメントの完全種を含むDNAフラグメントのライブラリーがそのストレージベクターから放出される。これらの第1のDNAフラグメントのこのライブラリーは、好ましくは、各配列種に対して等モル比で、次いで、直線化されたデスティネーションベクターにライゲーションされ、その結果、一様(1-wise)のライブラリーが得られる。結果として得られる一様(1-wise)のライブラリーの各メンバーには、プロモーターが第1のDNAエレメントに作動可能に連結されており、第1のDNAエレメントによってコード化される第1または最N末端のタンパク質セグメントの発現を指向できる機能的発現カセットが含まれ得る。
一様のライブラリーは、その後、IIS型制限酵素で再度消化され、第1のDNAエレメントとそのバーコードとの間でライブラリーの各メンバーが2回切断され、各切断部位に2つのオーバーハングが生成される。
一方、第2のタンパク質セグメントの完全種をコード化する第2のDNAエレメントの完全種を含むストレージベクターのライブラリーを、第1のタイプのIIS型制限酵素で消化すると、対応するバーコードとともに第2のDNAエレメントの完全種を含むDNAフラグメントのライブラリーが、そのストレージベクターから放出される。これらの第2のDNAフラグメントのこのライブラリーは、好ましくは各配列種に対して等モル比で、次いで、第1のDNAエレメントとその対応するバーコードとの間の直線化された一様(1-wise)の発現ベクターにライゲーションされ、その結果、二様(2-wise)の発現ベクターの新しいライブラリーが得られる。結果として得られる二様(2-wise)のライブラリーの各メンバーは、プロモーターが、第2のDNAエレメントと融合した第1のDNAエレメントに作動可能に連結され、第1のDNAエレメントと第2のDNAエレメントとの融合によってコードされる融合した第1および第2のタンパク質セグメントの発現を指向できる機能的発現カセットを含み得る。第1および第2のタンパク質セグメント間の融合点における何らかの外来アミノ酸残基または“scar”配列を除去するために、第1のDNAエレメントとそのバーコードとの間に位置する2つの切断部位は、(1)直線化された1方向ベクターの2つの末端のオーバーハングと、第2のDNAエレメントの完全種を含むストレージベクターのライブラリーから放出された第2のDNAフラグメントの2つの末端のオーバーハングとの間に(配列およびオーバーハングの大きさ/方向の両方で)完全に一致すること、および(2)それらのライゲーション時に第1のDNAエレメントの尾部(tail)または3'末端と第2のDNAエレメントの頭部(head)または5’末端との間の一致したオーバーハング配列が、同じ位置で目的の野生型タンパク質中に見出されるアミノ酸配列伸長をコード化すること、を確実にするように慎重に設計されなければならない。言い換えれば、切断部位の設計は、2つの隣接するタンパク質セグメントのシームレスな結合を確実にする。
第2のストレージベクターのライブラリーから放出された第2のDNAフラグメントのライブラリーの、直線化された1方向発現ベクターライブラリーへのライゲーション完了時に、2方向複合発現ベクターのライブラリーが構築される。最後の二段落で概説した工程のサイクルを繰り返して、第3のDNAフラグメントを、n番目および(n+1)番目のDNAフラグメントまで複合発現ベクターに組み込み、最終的な複合発現ベクターのライブラリーを得ることができ、このライブラリーは、突然変異のすべての可能な組み合わせを含む完全長タンパク質変異体をコードするDNAコーディング配列の完全な配列を含み、各変異体コーディング配列の後に複合バーコード配列が続き、これはDNAエレメントに一意的に割り当てられた対応するすべてのバーコードを有し、該DNAエレメントがどのように融合されているかを逆の順序で示すことができる。
C.タンパク質変異体の機能的スクリーニング
デスティネーションベクターの最終的なライブラリーは、特定の変異セットを含む全長のタンパク質バリアントをコードするための全てのn+1個のDNAエレメントを含む複合DNAコーディング配列に作動可能に連結されたプロモーターをそれぞれ有する発現ベクターであるため、これらのタンパク質変異体は、適当な報告システムにおいて、何らかの特定の望ましい機能的特徴を容易に発現させ、スクリーニングし、選択することができる。例えば、ウイルスベースのデスティネーションベクターを用いて、宿主細胞をトランスフェクトし、機能的分析に適した細胞環境で目的のタンパク質変異体を直接発現させることができる。
デスティネーションベクターの最終的なライブラリーは、特定の変異セットを含む全長のタンパク質バリアントをコードするための全てのn+1個のDNAエレメントを含む複合DNAコーディング配列に作動可能に連結されたプロモーターをそれぞれ有する発現ベクターであるため、これらのタンパク質変異体は、適当な報告システムにおいて、何らかの特定の望ましい機能的特徴を容易に発現させ、スクリーニングし、選択することができる。例えば、ウイルスベースのデスティネーションベクターを用いて、宿主細胞をトランスフェクトし、機能的分析に適した細胞環境で目的のタンパク質変異体を直接発現させることができる。
図2aは、SpCas9変異体がそれらの機能性をスクリーニングする方法の一例を示す:赤色蛍光タンパク質(RFP)およびRFP遺伝子配列を標的とするgRNAを安定的に発現する細胞株を、各変異体のオンターゲット活性を示すために、SpCas9変異体をコードする配列を含むレンチウイルスベクターでトランスフェクトし、同義変異を有するRFPおよびgRNAを安定的に発現する別の細胞株をトランスフェクトし、バリアントのオフターゲット活性を示す。CombiSEALプラットフォームは、あらゆるタンパク質の有用な変異体を生成することが可能であるように設計されているため、目的のタンパク質の特定の機能性に応じて、種々の機能性スクリーニングアッセイが考えられる。望ましい機能特性(Cas9タンパク質の場合のように、オンターゲットおよびオフターゲット活性プロファイル)のクローンが発見されると、複合バーコードの配列決定が行われ、特定の変異体における特定の変異を即座に同定することができる。
III.最適化されたCAS9酵素
本発明者らは、新たに改良されたCombiSEALコンビナトリアル遺伝子組換えシステムを利用して、一連のSpCas9変異体を同定し、それらの機能的特性を特徴付けた。試験された変異体中、Opti-SpCas9と称される特定の変異体は、高度に望ましい機能的プロファイルを有することが分かった:それは、効力を損なうことなく増強された遺伝子編集特異性を有し、広い試験範囲を有する。その機能的特性を考慮すると、この改良されたCas9酵素は、CRISPRゲノム編集スキームにおいて非常に価値のあるツールである
本発明者らは、新たに改良されたCombiSEALコンビナトリアル遺伝子組換えシステムを利用して、一連のSpCas9変異体を同定し、それらの機能的特性を特徴付けた。試験された変異体中、Opti-SpCas9と称される特定の変異体は、高度に望ましい機能的プロファイルを有することが分かった:それは、効力を損なうことなく増強された遺伝子編集特異性を有し、広い試験範囲を有する。その機能的特性を考慮すると、この改良されたCas9酵素は、CRISPRゲノム編集スキームにおいて非常に価値のあるツールである
野生型SpCas9タンパク質は、配列番号1に記載のアミノ酸配列を有し、その対応するDNAコーディング配列は配列番号2に記載されている。このエンドヌクレアーゼに関するこれまでの研究は、DNAと相互作用する領域およびアミノ酸残基を含む、このタンパク質の構造についての洞察を提供した。本発明者らは、CombiSEALプラットフォームを開発するための試験中に、標的および非標的DNA鎖と相互作用することが以前に予測されていたSpCas9のアミノ酸配列の特定残基に導入された変異、特に置換が、エンドヌクレアーゼの性能に直接的な影響を与えることを確認した。具体的には、R661、Q695、K848、Q926、K1003およびK1060のような残基での置換が、酵素のオンターゲット/オフターゲット編集活性を変化させることがわかった。変異体Opti-SpCas9は、野生型SpCas9の二重変異体である:配列番号1の残基661がアラニンで置換され、残基1003がヒスチジンで置換されている。そのアミノ酸配列は、配列番号3に記載されている。これらの置換は、修飾されたエンドヌクレアーゼの増加したオンターゲット編集効率、および高度に望ましい表現型である減少したオフターゲット活性の原因である。
本発明者らはまた、R661A、K1003HおよびQ926Aの三重変異体を同定したが、この三重変異体は、Opti-SpCas9からのオフターゲット編集をさらに約80%まで減少させる一方で、そのオンターゲット活性もまた実質的に減少させる。この三重変異体は、オフターゲット切断の回避が特に重要である状況において価値を有し得る。さらに、OptiHF-SpCas9と称される第二の変異体が作製されており、これは5つの点変異Q695A、K848A、E923M、T924VおよびQ926Aを有する(表2の変異体46を参照のこと)。Opti-SpCas9およびOptiHF-SpCas9のアミノ酸配列は、それぞれ配列番号3および配列番号13に記載されている。表2は、それらが含む点突然変異(複数もある)ならびにそれらのオンターゲットおよびオフターゲット開裂プロファイルを詳細に示す本試験で分析されたSpCas9変異体のまとめを提供する。
本明細書に記載のSpCas9変異体は、生細胞ゲノムの遺伝子操作における有益なツールである。CRISPRシステムによる標的化DNA切断のためにこれらの変異体を用いるため、一般的に、変異体(例えば、Opti-SpCas9)の発現を指向する発現ベクターと、標的部位でゲノムDNAを切断するために、SpCas9変異体を細胞のゲノム内の予め選択された標的部位に導くための適切な配列のsgRNAをコードする発現ベクターとを、生細胞に導入する。ある態様において、発現ベクターは、レトロウイルスベクター、特にレンチウイルスベクターなどのウイルスベクターである。SpCas9変異体をコードする発現ベクターおよびsgRNAをコードする発現ベクターは、2つの別個のベクターであることが多いが、いくつかの態様において、1つの単一発現ベクターが、SpCas9変異体およびsgRNAの両方のコーディング配列を含み、2つのコーディング配列が、同じプロモーターまたは2つの別個のプロモーターのいずれかに作動可能に連結されている。プロモーターは、一般的に、コード化配列に対して異種であるため、特定のタイプの受容細胞に適したプロモーターを用いることをさらに考慮してもよい。
実施例
以下の例は、例示の目的でのみ提供され、限定されるものではない。当業者であれば、本質的に同じかまたは同様の結果を得るために変更または改変され得る様々な重要ではないパラメータを容易に認識し得る。
以下の例は、例示の目的でのみ提供され、限定されるものではない。当業者であれば、本質的に同じかまたは同様の結果を得るために変更または改変され得る様々な重要ではないパラメータを容易に認識し得る。
実施例1:バーコード化されたコンビナトリアル遺伝子ユニットをシームレスに組み立て、SpCas9変異体のスクリーニングのようなタンパク質最適化のための新規方法を提供するためのハイスループットプラットフォームとしてのCombiSEAL
タンパク質機能上の複数の変異の複合効果を予測することは困難であるため、膨大な数のタンパク質配列の変異体を機能的に評価する能力は、タンパク質工学に実用的に有用であろう。本発明は、コンビナトリアルな変更を加えたバーコード化されたタンパク質変異体の拡大可能な組立および並列特性評価を可能にするハイスループットプラットフォームを提供する。このプラットフォームCombiSEALは、広く用いられているストレプトコッカス・ピオゲネス Cas9(SpCas9)ヌクレアーゼの948個の組合せ変異体のライブラリーを系統的に解析し、ヒト細胞におけるゲノム編集活性を最適化することにより説明される。SpCas9変異体の多数のオンターゲット部位およびオフターゲット部位での編集活性を一括評価することが容易なため、最適化された変異体の同定が加速され、変異エピスタシスの研究が容易になる。Opti-SpCas9の同定に成功し、これは、効力を損なうことなく増強された編集特異性を有し、幅広い標的範囲を有するものである。このプラットフォームは、コンビナトリアルな大量修飾によるタンパク質操作に広く適用可能である。
タンパク質機能上の複数の変異の複合効果を予測することは困難であるため、膨大な数のタンパク質配列の変異体を機能的に評価する能力は、タンパク質工学に実用的に有用であろう。本発明は、コンビナトリアルな変更を加えたバーコード化されたタンパク質変異体の拡大可能な組立および並列特性評価を可能にするハイスループットプラットフォームを提供する。このプラットフォームCombiSEALは、広く用いられているストレプトコッカス・ピオゲネス Cas9(SpCas9)ヌクレアーゼの948個の組合せ変異体のライブラリーを系統的に解析し、ヒト細胞におけるゲノム編集活性を最適化することにより説明される。SpCas9変異体の多数のオンターゲット部位およびオフターゲット部位での編集活性を一括評価することが容易なため、最適化された変異体の同定が加速され、変異エピスタシスの研究が容易になる。Opti-SpCas9の同定に成功し、これは、効力を損なうことなく増強された編集特異性を有し、幅広い標的範囲を有するものである。このプラットフォームは、コンビナトリアルな大量修飾によるタンパク質操作に広く適用可能である。
説明
タンパク質工学とは、新たなまたは増強された特性を有する、酵素、抗体およびゲノム編集タンパク質を生成するための重要な方法であることが証明されている1-7。タンパク質配列のコンビナトリアル最適化は、多数の変異体を作成してスクリーニングするための戦略に依存しているが、現在の方法では、ハイスループットな方法で複数の改変体を体系的かつ効率的に構築して試験する能力には限界がある8-11。構造的・生化学的知識に基づく従来の部位特異的変異誘発法は、機能的に関連する変異体の生成を容易にするが、このような一対一のアプローチを用いて組合せ変異体をスクリーニングすることは、スループットおよび拡大可能性に欠けている。遺伝子合成技術は、プールされた形式で組合せ変異体を作製するために導入することができ、それは一般的に、合成された1キロ塩基あたり1~10個のエラーを生じ12,13、導入する変異がタンパク質の異なる領域に散在している場合は、不可能な程に高価である。このようなコンビナトリアルDNAアセンブリ14,15ならびに組換えおよびシャッフリング16のような方法は、タンパク質配列全体を組み立てるために複数の変異配列を共に融合させることにより組合せ変異体を作成するが、その後の遺伝子型決定および変異の特性評価には、クローン単離株の選択または長い読み取り配列決定が必要であり、それらのいずれも多数の変異体を追跡するためには実施可能ではない。エラーを起こしやすいポリメラーゼ連鎖反応および指向進化(directed evolution)のための変異株を用いた変異誘発は、所望の変異体を積極的に選択することができるが、コドン内に2つ以上の特異的なヌクレオチド変異が稀に発生するため、アミノ酸のサブセットに対する選択バイアスに煩わされる。配列無作為化によってタンパク質変異体の多様性を実現できたとしても、選択されたヒットを1つ1つ遺伝子型決定して分析するスループットが非常に限られていることが、タンパク質工学の大きな障害となっている。さらに、残りの非目標変異から所望の表現型を与える正確な変異をピンポイントで特定することは、組み合わせ最適化プロセスを加速させるのに役立つ。
タンパク質工学とは、新たなまたは増強された特性を有する、酵素、抗体およびゲノム編集タンパク質を生成するための重要な方法であることが証明されている1-7。タンパク質配列のコンビナトリアル最適化は、多数の変異体を作成してスクリーニングするための戦略に依存しているが、現在の方法では、ハイスループットな方法で複数の改変体を体系的かつ効率的に構築して試験する能力には限界がある8-11。構造的・生化学的知識に基づく従来の部位特異的変異誘発法は、機能的に関連する変異体の生成を容易にするが、このような一対一のアプローチを用いて組合せ変異体をスクリーニングすることは、スループットおよび拡大可能性に欠けている。遺伝子合成技術は、プールされた形式で組合せ変異体を作製するために導入することができ、それは一般的に、合成された1キロ塩基あたり1~10個のエラーを生じ12,13、導入する変異がタンパク質の異なる領域に散在している場合は、不可能な程に高価である。このようなコンビナトリアルDNAアセンブリ14,15ならびに組換えおよびシャッフリング16のような方法は、タンパク質配列全体を組み立てるために複数の変異配列を共に融合させることにより組合せ変異体を作成するが、その後の遺伝子型決定および変異の特性評価には、クローン単離株の選択または長い読み取り配列決定が必要であり、それらのいずれも多数の変異体を追跡するためには実施可能ではない。エラーを起こしやすいポリメラーゼ連鎖反応および指向進化(directed evolution)のための変異株を用いた変異誘発は、所望の変異体を積極的に選択することができるが、コドン内に2つ以上の特異的なヌクレオチド変異が稀に発生するため、アミノ酸のサブセットに対する選択バイアスに煩わされる。配列無作為化によってタンパク質変異体の多様性を実現できたとしても、選択されたヒットを1つ1つ遺伝子型決定して分析するスループットが非常に限られていることが、タンパク質工学の大きな障害となっている。さらに、残りの非目標変異から所望の表現型を与える正確な変異をピンポイントで特定することは、組み合わせ最適化プロセスを加速させるのに役立つ。
ここで、本発明者らは、ハイスループットショートリード配列決定(図1)によって容易に追跡することができるバーコード付きの組合せ変異体のプールされたアセンブリのためのCombinatorial Genetics En Masse(CombiGEM)17-19、本発明者らはCombiSEALと称するプラットフォームで用いられているバーコード連結戦略とシームレスなコンビナトリアルDNAアセンブリを結合させるための新しいクローニング法を案出した。CombiSEALは、タンパク質配列を構成可能な部分にモジュール化することで機能し、それぞれの部分は、定義された位置に所定の変異を指定したバーコードでタグ付けされた変異体のレパートリーを含む。IIS型制限酵素部位は、バーコード化された部分に隣接するように用いられ、タンパク質をコードする配列に由来する切断されたオーバーハングを形成し、それにより上記部分との融合時にシームレスなライゲーションを達成する。独特のバーコードを連結し、複数部分のプールクローニングを繰り返した後、結果として得られるライブラリー内の各タンパク質コード化配列変異体に結合させる。この方法は、複数の変異をカバーするタンパク質コード領域全体にわたって長いリード配列決定を行う必要性を回避するため、他の戦略よりも有利であり、これは、クローン単離体を選択する必要なく、短い(例えば、~50塩基対)バーコードのハイスループット配列決定によってプール内の各変異体を定量的に追跡する費用対効果の高い方法を提供する。さらに、プールされた変異体の特性評価により、同じ実験条件下での直接の比較が可能になり、変異エピスタシスの研究が容易になる。CombiGEMが個別の遺伝子要素のコンビナトリアルアセンブリを可能にするのとは異なり、CombiSEALは、連続した配列(例えば、タンパク質の異なるセグメント)をシームレスに結合させるための融合スカー配列を残さない。従って、この新しいプラットフォームは、タンパク質工学のために大きな可能性を秘めている。
結果
SpCas9組合せ変異体のハイスループットスクリーニング。高い編集特異性および活性を有する最適化された変異体を同定する目的で、CombiSEALを用いて、ゲノム工学に広く利用されているCRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)ヌクレアーゼであるSpCas9の組合せ変異体ライブラリーのアセンブルを行った20-23。これまでに、eSpCas9(1.1)3、SpCas9-HF14、HypaCas95およびevoCas96を含む、特定の変異を組み合わせたSpCas9ヌクレアーゼを、オフターゲット編集を最小限に抑えるように操作した。しかしながら、これらの変異体は、ミスマッチした5’-グアニン(5’G)で始まるgRNAとの非適合性のために標的化可能な部位が少ない3-6,24-27。現在までに作製され、試験された組合せ変異体の数は限られており(表1)、そのため、エキストラ5’Gを有するgRNAとの良好な適合性を有する他のSpCas9変異体をより体系的に探索する必要がある。
SpCas9組合せ変異体のハイスループットスクリーニング。高い編集特異性および活性を有する最適化された変異体を同定する目的で、CombiSEALを用いて、ゲノム工学に広く利用されているCRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)ヌクレアーゼであるSpCas9の組合せ変異体ライブラリーのアセンブルを行った20-23。これまでに、eSpCas9(1.1)3、SpCas9-HF14、HypaCas95およびevoCas96を含む、特定の変異を組み合わせたSpCas9ヌクレアーゼを、オフターゲット編集を最小限に抑えるように操作した。しかしながら、これらの変異体は、ミスマッチした5’-グアニン(5’G)で始まるgRNAとの非適合性のために標的化可能な部位が少ない3-6,24-27。現在までに作製され、試験された組合せ変異体の数は限られており(表1)、そのため、エキストラ5’Gを有するgRNAとの良好な適合性を有する他のSpCas9変異体をより体系的に探索する必要がある。
CombiSEALを用いて、SpCas9配列を4つの部分にモジュール化し、個々の部分で異なる無作為変異および特異的変異を含むバーコード化されたインサートをストレージベクターにクローニングした(図1a;図7a、b;詳細について方法を参照)。コンビナトリアルバーコード化ライブラリー(4×2×17×7=952個のSpCas9変異体、野生型(WT)SpCas9およびeSpCas9(1.1)配列を含む)を、レンチウイルスベクターにプールして組み込んだ。ライブラリー中の個々の部分および組み立てられた構築物を配列決定し、バーコード化された変異体の高精度な組立物を確認した(詳細について方法を参照)。本発明者らは、大腸菌(E. coli)に貯蔵されたプラスミドプール(すなわち、952個の変異体のうちの951個)および感染したヒト細胞プール(すなわち、952個の変異体のうちの948個)の両方の中で、ライブラリーに対する高いカバレッジを検出し(図1b)、プラスミドと感染細胞プールの間、および感染細胞プールの生物学的複製間での再現性の高い関連(representation)を検出した(図7c)。
ロバストで特異的なSpCas9変異体を探索するために、赤色蛍光タンパク質(RFP)およびRFP遺伝子配列を標的とするgRNA(以下、RFPsg5-ONおよびRFPsg8-ONと称する;図2a)を安定的に発現させるモノクローナルヒト細胞株を用いてレポーターシステムを確立した。5’G3-6から始まる20ヌクレオチドのgRNAを主に用いた以前のスクリーニングとは異なり、レポーター系で追加の5’Gを担持するgRNAを用いて、標的化範囲を犠牲にしない互換性のあるSpCas9変異体を探した。次いで、細胞をSpCas9変異体ライブラリーに感染させ、感染後14日目のRFP蛍光レベルに基づいてビンに選別した。RFP蛍光の損失は、DNAの切断および標的部位のIndel介在による破壊を反映しており、したがって、活性なSpCas9変異体を有する細胞を、RFPレベルの低い選別されたビンに濃縮し得る。バーコード化されたSpCas9変異体を追跡するためにIllumina HiSeqを用いて、変異体の亜集団は、選別されていない集団と比較して、RFPのレベルが最も低い細胞集団(すなわち、ビンA)の約5%を包含する選別されたビンで1.5倍以上濃縮されることが分かった(図2b;図8)。WT SpCas9は、レポーター系RFPsg5-ONおよびRFPsg8-ONの両方に対して濃縮されたもののうちの1つであり、一方、eSpCas9(1.1)はRFPsg8-ONに対して濃縮された。SpCas9変異体のオンターゲットおよびオフターゲット活性の並行した特徴付けを容易にするために、不一致部位の標的化がSpCas9変異体のオフターゲット活性を示すようなRFPでの同義変異を有する細胞株をさらに作製した(すなわち、RFPsg5-OFF5-2およびRFPsg8-OFF5;図2a)。WT SpCas9を、eSpCas9(1.1)ではなく、RFPsg5-OFF5-2およびRFPsg8-OFF5の両方に対して濃縮した(図2b;図8)。
SpCas9変異体のライブラリーのオンターゲットおよびオフターゲット活性を、選別されていない集団に対する選別されたビンの濃縮度に基づいてランク付けし、プロットして、大多数の変異体がSpCas9のオンターゲットおよびオフターゲット活性の両方を減じることがわかった(図3a)。活性が最適化された変異体を、RFPsg5-ONおよびRFPsg8-ONの両方について、WTの少なくとも90%、RFPsg5-OFF5-2およびRFPsg8-OFF5の両方について、WTの60%未満の濃縮比を有する変異体として定義した。nOne変異体(以下、Opti-SpCas9と称する)はこれらの基準を満たし、さらなる特性決定のために評価した(表2)。また、RFPsg5-ONおよびRFPsg8-ONの両方についてWTの少なくとも50%以上、ならびにRFPsg5-OFF5-2およびRFPsg8-OFF5の両方についてWTの90%未満の濃縮比に基づいて、OptiHF-SpCas9と称する高忠実性(high fidelity)の変異体も同定した(表2)。Opti-SpCas9およびOptiHF-SpCas9の効率および特異性を、それらのオンターゲットおよびオフターゲット活性を測定するための個々の検証アッセイにより検証した。一致または不一致のRFP部位を標的とするgRNAをそれぞれ発現する複数の細胞株を用いて、WTと比較したとき、Oppi-SpCas9は同等のオンターゲット活性(すなわち、94.6%;3つのミスマッチ部位からの平均)および実質的に減少したオフターゲット活性(すなわち、1.7%;3つのミスマッチ部位からの平均)を示し、一方、OptiHF-SpCas9は、オンターゲット(すなわち、63.6%;2つのマッチ部位からの平均)およびオフターゲット(すなわち、2.0%;2つのミスマッチ部位からの平均)の両方で活性の低下を示した(図3b)ことが確認された。
SpCas9の編集効率のための変異エピスタシスの検討。CombiSEALによるタンパク質変異体の体系的構築は、アミノ酸置換のセットを中立(neutral)、有益(beneficial)または有害(deleterious)として分類し、それらの予測が困難なエピスタシス相互作用を探索することを可能にする。SpCas9の編集活性の指標として濃縮率を用いて(図9)、突然変異の組み合わせとエピスタティック相互作用によってもたらされるオンターゲットおよびオフターゲット活性を示すヒートマップを構築した(図4;図10)。その結果、SpCas9のアミノ酸残基に導入された置換基の数および種類が、標的および非標的DNA鎖(例えば、R661、Q695、K848、Q926、K1003、K1060など)と相互作用することが予測され、オンターゲット(標的)での効率を最大化し、オフターゲット(標的以外)での活性を最小化するという最適なバランスを支配していることが明らかになった。活性を最適化した変異体Opti-SpCas9は、これらのDNA接触残基(すなわち、R661AおよびK1003H)における2つの置換変異によってWTとは異なる。SpCas9の1003番目のアミノ酸位置に導入された3つの保存的な塩基性残基(すなわち、リジン、アルギニンおよびヒスチジン)間で比較したところ、K1003HがR661A変異と正のエピスタティック相互作用を示し、Opti-SpCas9に高い編集効率を与える好ましい置換であることが明らかになった(図4)。SpCas9-HF14に対してより高い特異性を与えることが示されたQ926A置換をOpti-SpCas9に加えると、そのオフターゲット効果がわずかに減少し(すなわち、Opti-SpCas9では1.0%からOpti-SpCas9+Q926Aでは0.2%に、3つのミスマッチした標的部位からの平均)、試験した3つのマッチした部位全体でそのオンターゲット活性を21.6%、62.4%および99.9%と大幅に低下させた(図3b)。さらに、これらのDNA接触残基に3つ以上の変異を有するほとんどのSpCas9変異体は、オンターゲットおよびオフターゲットの両方の標的部位での編集の発生が少ないことが明らかになった(図4)。これらの結果は、これらのDNA接触残基の過剰なアラニン置換がSpCas9の編集活性を著しく低下させるという以前の知見と一致している25。しかし、興味深いことに、2つのドメインをつなぐリンカー領域に位置するE923M+T924V変異およびE923H+T924L変異のようなSpCas9のHNHおよびRuvCヌクレアーゼドメイン28のコンフォメーション制御に関与する残基に導入された追加の置換により、DNA接触残基に3つ以上の変異を有するSpCas9変異体のいくつかは、RFPsg5-ON部位でのオンターゲット編集を回復した(図4)。高忠実性変異体OptiHF-SpCas9もまた、Q695A、K848AおよびQ926A置換に加えてE923M+T924V変異を含み、Q695A、K848AおよびQ926Aトリプル変異のみを有する変異体よりも、RFPsg8-ON部位でわずかに高いオンターゲット活性を示した(図4)。これらのデータは、SpCas9のDNA結合活性および切断活性が機能的に結合してその編集特異性および編集効率を決定するというモデルを支持し5,29、リンカー残基を修飾することによってSpCas9の編集性能をプログラムする可能性を強調している。
最適化されたSpCas9変異体の特徴付け。gRNA設計および構築において、5’Gは、通常、U6プロモーター下での効率的な転写を促進するために、gRNA配列の先頭に含まれるか、付加される。WT SpCas9は、プロトスペーサー配列とミスマッチの5’Gが追加されたgRNAと互換性がある。一方、eSpCas9(1.1)、SpCas9-HF1、HypaCas9およびevoCas9は、さらなる5’G(すなわち、G-N20)を有するか、または開始グアニン(すなわち、H-N19)を欠く20ヌクレオチドのgRNAを用いたとき、それらの編集効率を失う4,6,24-26,30。プロトスペーサー配列にマッチした5’Gを有するgRNAの使用は、N20-NGGと比較して、G-N19-NGG部位の利用可能性に基づいてヒトゲノム内の編集可能な部位数を約4.3倍も顕著に減少させることができた(図11)。Opti-SpCas9の編集活性を、さらに5’Gを付加したgRNAを用いて特徴付けしたところ、Opti-SpCas9は、本発明者らが以前に試験した内因性遺伝子座のアッセイに基づき3-5,18,31、WTと同等(すなわち、95.1%)のオンターゲットDNA切断活性を示したが、一方、eSpCas9(1.1)およびHypaCas9は、大幅な活性低下を示した(すなわち、それぞれ32.4%および25.6%)(図5a;図12)。編集の減少は、2つのSpCas9変異体のタンパク質発現レベルの低下によるものではなかった(図13)。これらの結果は、追加の5'Gを有するgRNAが用いられた本発明のスクリーニングシステム(図2;3a)で観察されたこれらの変異体のオンターゲット活性の結果、ならびに緑色蛍光タンパク質(GFP)破壊アッセイを用いた独立した検証実験に基づく結果と一致する(図3b;図14)。さらに、Opti-SpCas9、eSpCas9(1.1)およびHypaCas9は、マッチした5’Gで始まる20ヌクレオチドのgRNAを用いたとき、WTと同等の編集活性(すなわち、それぞれ109.1%、103.3%および106.8%)を示した(図5a)。Opti-SpCas9を、OptiHF-SpCas9およびより最近特徴づけられた高忠実性変異体-evoCas96およびSniper-Cas932とさらに比較したところ、OptiHF-SpCas9、evoCas9およびSniper-Cas9は、Opti-SpCas9よりも少ないオンターゲット編集を生成したことが明らかになった(すなわち、追加の5’Gを有するgRNAを用いて発現させたとき、それぞれ60.7%、99.8%および51.7%まで減少し、20ヌクレオチドのgRNA配列で一致した5’Gから始まるgRNAを用いたとき、それぞれ40.1%、87.7%および63.9%に減少した)(図5b;図12;図13)。すなわち、U6下での転写のための20ヌクレオチドのgRNA配列の最初の塩基としてマッチした5’Gを有するという制限は、特異性を改善した他の以前に操作されたSpCas9の実用性を制限しているが、追加の5’Gを有するgRNAと互換的に作用するOpti-SpCas9には適用されない。これらの知見は、操作されたSpCas9が特異性のために必ずしも標的範囲を犠牲にする必要はないことを強調している。
異なるSpCas9変異体のオフターゲット活性をさらに調べた。VEGFA部位3およびDNMT1部位4のgRNAを用いてWT SpCas9によって編集される8つの可能性のあるオフターゲット遺伝子座を増幅させ3-5,31、WT SpCas9によって誘導されるゲノムインデルが、それらのうちの4つの部位(すなわち、VEGFA OFF1、VEGFA OFF2、VEGFA OFF3およびDNMT1 OFF1)でOVCAR8-ADR細胞において検出された。WTの代わりにOpti-SpCas9、eSpCas9(1.1)およびHypaCas9を用いたとき、VEGFA OFF1部位のみでオフターゲット編集が検出された(図15)。4つの変異体のうち、Opti-SpCas9は、その部位で最大のオンターゲット活性およびオフターゲット活性を示した(図15)。異なるSpCas9変異体のミスマッチ許容度を比較するために、レポーター遺伝子ターゲット(すなわち、ゲノムに組み込まれたGFP遺伝子配列)に対する1塩基から4塩基のミスマッチを含むgRNAを生成した。これらのミスマッチ塩基は、gRNAのスペーサー配列の異なる位置にまたがっている。GFP蛍光の消失は、DNAの切断および標的部位のインデル介在の破壊を反映するように測定された。Opti-SpCas9は、2塩基以上のミスマッチ塩基を有するgRNAに対して大部分が不耐性であることが明らかになったが、2塩基のミスマッチを有する8つの部位のうち1つで比較的低レベルの活性(すなわち、Opti-SpCas9では3.5%、WTでは73.2%)が検出された(図16)。eSpCas9(1.1)およびHypaCas9は、本発明者らのレポーターシステムでは、オンターゲット部位およびオフターゲット部位の両方で、編集がより少ない(すなわち、60%以上減少)ことが観察された(図16)。WTとOpti-SpCas9との間の同程度のオンターゲット活性(すなわち、WTの97.6%)で、Opti-SpCas9は、WTよりも高い特異性を示し、これは、単一塩基ミスマッチを含む20個の部位のうち13個でオフターゲット編集の生成が有意に少ないことによって示されたが、それでもかなりの量のオフターゲット編集が検出されていた(図16)。他にも、eSpCas9(1.1)、SpCas9-HF1、HypaCas9、evoCas9およびSniper-Cas93,5,6,32を用いた単一塩基ミスマッチ部位での編集活性も報告されている。それにもかかわらず、コンピューター内(in silico)で予測されたゲノム中のオフターゲット部位の大部分は、gRNA配列に対して2個以上のミスマッチを含んでおり33、したがって、1塩基ミスマッチに対する許容性は、正確なゲノム編集を達成するためにSpCas9の有用性を制限するものであってはならない。さらにGUIDE-Seqを実施して、Opti-SpCas9および他の操作されたSpCas9変異体によってもたらされるゲノム全体の切断活性を調べた。その結果、Opti-SpCas9はWTに比べてオフターゲット切断の発生が顕著に少なく、OptiHF-SpCas9は、eSpCas9(1.1)、HypaCas9、evoCas9およびSniper-Cas9などの他の報告された高忠実性変異体に匹敵するオン/オフターゲット比の増加を示した(図5c、表3)。eSpCas9(1.1)およびHypaCas9と比較して、Opti-SpCas9は、切断型gRNAの使用とのより良い適合性を示し(図17)、これはOpti-SpCas9の編集特異性を改善するための相補的な戦略を提供し得る34。
考察
本発明者らは、タンパク質工学のための高次の組合せ変異の迅速かつ同時プロファイリングに対するまだ満たされていない必要性に対応するために、CombiSEAL称される、簡易でありながら非常に強力なプラットフォームを確立した。この戦略は、プールされたアセンブリアプローチを用いて、個々の組合せ変異体を1つずつ構築するための面倒な工程を回避し、多数のタンパク質変異体から上位のパフォーマーを同定するための並列試験を可能にするためにバーコード化法を利用してタンパク質操作を容易にする。さらに、この方法は、変異間のエピスタシス関係のマッピングにも適用できる。CombiSEAL法を用いて、本発明者らは、Opti-SpCas9およびOptiHF-SpCas9(ヒト細胞における幅広い範囲の内因性標的に対して優れたゲノム編集効率および特異性を有する新規変異体)を同定することに成功した(表3)。CombiSEALパイプラインを、より広範なプロトスペーサー隣接モチーフの柔軟性を有するもの7およびリボ核タンパク質送達との互換性が強化されているもの35など、多面的または他の特性を有する変異体の探索を広げるために、さらに多くのCas9変異体を構築するために容易に適用することができる。CombiSEALは、ゲノムの正確な編集のためのCRISPR酵素(SaCas936およびCpf137を含む)およびその誘導体(例えば、塩基編集体38-41)の操作生成を加速することが想定されている。また、このアプローチの一般化可能性は、多様なタンパク質だけでなく、合成DNAおよび遺伝子制御回路を含む他の生体分子およびシステムを体系的に設計するための可能性を拡大し、多くの生物医学およびバイオテクノロジーの応用に関連している。
本発明者らは、タンパク質工学のための高次の組合せ変異の迅速かつ同時プロファイリングに対するまだ満たされていない必要性に対応するために、CombiSEAL称される、簡易でありながら非常に強力なプラットフォームを確立した。この戦略は、プールされたアセンブリアプローチを用いて、個々の組合せ変異体を1つずつ構築するための面倒な工程を回避し、多数のタンパク質変異体から上位のパフォーマーを同定するための並列試験を可能にするためにバーコード化法を利用してタンパク質操作を容易にする。さらに、この方法は、変異間のエピスタシス関係のマッピングにも適用できる。CombiSEAL法を用いて、本発明者らは、Opti-SpCas9およびOptiHF-SpCas9(ヒト細胞における幅広い範囲の内因性標的に対して優れたゲノム編集効率および特異性を有する新規変異体)を同定することに成功した(表3)。CombiSEALパイプラインを、より広範なプロトスペーサー隣接モチーフの柔軟性を有するもの7およびリボ核タンパク質送達との互換性が強化されているもの35など、多面的または他の特性を有する変異体の探索を広げるために、さらに多くのCas9変異体を構築するために容易に適用することができる。CombiSEALは、ゲノムの正確な編集のためのCRISPR酵素(SaCas936およびCpf137を含む)およびその誘導体(例えば、塩基編集体38-41)の操作生成を加速することが想定されている。また、このアプローチの一般化可能性は、多様なタンパク質だけでなく、合成DNAおよび遺伝子制御回路を含む他の生体分子およびシステムを体系的に設計するための可能性を拡大し、多くの生物医学およびバイオテクノロジーの応用に関連している。
方法
DNAベクターの構築
この試験で用いたベクター(表4)を、PCR、制限酵素消化、ライゲーションおよびギブソンアセンブリーを含む標準的分子クローニング技術を用いて構築した。カスタムオリゴヌクレオチドをは、Integrated DNA TechnologiesおよびGenewizから購入した。ベクター構築物を大腸菌株DH5αに形質転換し、50μg/mlのカルベニシリン/アンピシリンを用いて該構築物を含むコロニーを単離した。DNAを、Plasmid Mini(Takara)またはMidi(Qiagen)キットを用いて抽出および精製した。ベクター構築物の配列をサンガー配列決定法で確認した。
DNAベクターの構築
この試験で用いたベクター(表4)を、PCR、制限酵素消化、ライゲーションおよびギブソンアセンブリーを含む標準的分子クローニング技術を用いて構築した。カスタムオリゴヌクレオチドをは、Integrated DNA TechnologiesおよびGenewizから購入した。ベクター構築物を大腸菌株DH5αに形質転換し、50μg/mlのカルベニシリン/アンピシリンを用いて該構築物を含むコロニーを単離した。DNAを、Plasmid Mini(Takara)またはMidi(Qiagen)キットを用いて抽出および精製した。ベクター構築物の配列をサンガー配列決定法で確認した。
選択マーカーとしてのZeocinと共に、eSpCas9(1.1)、HypaCas9またはSpCas9-HF1をコードするレンチウイルス発現ベクターを作成するために、SpCas9配列を、Phusion DNA polymerase(New England Biolabs)を用いたPCRによりpAWp30(Addgene #73857)、eSpCas9(1.1) (Addgene #71814)およびVP12(Addgene #72247)から増幅/変異させ、Gibson Assembly Master Mix(New England Biolabs)を用いてpFUGWレンチウイルス発現ベクター骨格にクローニングした。evoCas9、Sniper-Cas9およびxCas9(3.7)をコードするレンチウイルス発現ベクターを、それぞれAddgene構築物#107550、#113912および#1803380からそれらのSpCas9配列を増幅させ、pFUGWベクター骨格にクローニングすることによって作成した。特定の遺伝子を標的としたgRNAのU6プロモーター駆動発現を含むストレージベクターを構築するために、既報18のように、gRNAの標的配列とのオリゴペアを合成し、アニーリングし、T4 DNAリガーゼ(New England Biolabs)を用いてBbsI消化したpAWp28ベクター(Addgene#73850)にクローニングした。U6プロモーター下での転写を有利にするために、20ヌクレオチドスペーサー配列の開始位置に追加の5’Gを有するgRNAと適合性のあるSpCas9変異体を探索するために、図5および図14で用いた幾つかを除いて、追加の5’Gを有するgRNAを本試験で用いた。gRNAのスペーサー配列を表5に列記する。gRNAのU6駆動発現のためのレンチウイルスベクターを構築するために、ストレージベクターをBglII酵素およびMfeI酵素(ThermoFisher Scientific)で消化してU6-gRNA発現カセットを調製し、ベクターをBamHI酵素およびEcoRI酵素(ThermoFisher Scientific)で消化して生成した互換性のある付着性末端を介したライゲーションを用いて、pAWp12(Addgene #72732)ベクター骨格に挿入した。デュアルRFPおよびGFP蛍光タンパク質レポーターとともにgRNAを発現させるために、U6駆動gRNA発現カセットを、上記と同じ戦略を用いて、pAWp12の代わりに、レンチウイルスベクター骨格であるpAWp9(Addgene #73851)に挿入した。
SpCas9のバーコード化DNAパーツの作製
この試験を開始したときに利用可能な先行知識に導かれて、本発明者らは、gRNA誘導ゲノム部位(SpCas9-HF14およびeSpCas9(1.1)3においてそれぞれ同定されたものを含む)における標的DNA鎖および非標的DNA鎖と接触すること、またはDNA切断のためのSpCas9のHNHおよびRuvCヌクレアーゼドメインのコンフォメーションダイナミクスを制御すること28が予測されるアミノ酸残基での組合せ変異体のライブラリー構築に焦点を当てた。8つのアミノ酸残基を選択し、特定のまたは無作為に生成された置換変異を保持するように修飾した(図1a)。塩基性残基を、それらの荷電残基の役割を評価するために、アラニンに変異させた。eSpCas9(1.1)に以前に導入されたK1003でのアラニン置換に加えて、この残基は、タンパク質の安定性への影響を最小にするために、他の正に荷電した残基(すなわち、アルギニンおよびヒスチジン)にも変異させた。SpCas9上のこれらの変異の特定の組み合わせは、望ましくないオフターゲット活性を最小限に抑えながら、そのオンターゲット編集効率を最大にし、gRNAとの適合性を高めることができるという仮説が立てられた。
この試験を開始したときに利用可能な先行知識に導かれて、本発明者らは、gRNA誘導ゲノム部位(SpCas9-HF14およびeSpCas9(1.1)3においてそれぞれ同定されたものを含む)における標的DNA鎖および非標的DNA鎖と接触すること、またはDNA切断のためのSpCas9のHNHおよびRuvCヌクレアーゼドメインのコンフォメーションダイナミクスを制御すること28が予測されるアミノ酸残基での組合せ変異体のライブラリー構築に焦点を当てた。8つのアミノ酸残基を選択し、特定のまたは無作為に生成された置換変異を保持するように修飾した(図1a)。塩基性残基を、それらの荷電残基の役割を評価するために、アラニンに変異させた。eSpCas9(1.1)に以前に導入されたK1003でのアラニン置換に加えて、この残基は、タンパク質の安定性への影響を最小にするために、他の正に荷電した残基(すなわち、アルギニンおよびヒスチジン)にも変異させた。SpCas9上のこれらの変異の特定の組み合わせは、望ましくないオフターゲット活性を最小限に抑えながら、そのオンターゲット編集効率を最大にし、gRNAとの適合性を高めることができるという仮説が立てられた。
組合せ変異体を構築するために、SpCas9配列を4つの部分(すなわち、P1、P2、P3およびP4)にモジュール化し、P1には4個のインサート、P2には2個のインサート、P3には17個のインサート、およびP4には7個のインサートを作成した。各インサートは、Phusion(New England Biolabs)またはKapa HiFi(Kapa Biosystems)DNAポリメラーゼを用いたPCRにより、pAWp30(Addgene #73857)またはeSpCas9(1.1)(Addgene #71814)から増幅し、変異させた。SpCas9のアミノ酸位置923、924および926に部位特異的変異を生成するために、3つの元のコドン配列をPCRプライマー中の縮重コドンNNSで置換した。ストレージベクター(pAWp61またはpAWp62)にクローニングした後、各DNAインサートに固有の8塩基対バーコードを付加した。制限酵素部位BsaIを末端に隣接するように付加した(BbsI部位およびバーコード配列決定用のプライマー結合部位を、それぞれpAWp61およびpAWp62用のインサートとバーコードの間に導入した)。このようにして、本発明の各pAWp61およびpAWp62ストレージベクターを、それぞれ“BsaI-インサート-BbsI-BbsI-バーコード-BsaI”および“BsaI-インサート-プライマー-結合部位-バーコード-BsaI”として構成した。個々のインサートとそれらのバーコードの配列同一性を確認するために、サンガー配列決定を行った。目的の操作された配列にBsaI部位またはBbsI部位が含まれる場合、BsaIおよびBbsIの代わりに他のIIS型制限酵素部位を用いることができるか、または同義変異をタンパク質をコードする配列に導入して、同じアミノ酸残基をコードしながら制限部位を除去することができた。
SpCas9用のバーコード化組合せ変異ライブラリーの作成
SpCas9の各部分のインサートを含むストレージベクターを等モル比で混合した。プールされたインサートを、混合したストレージベクターをBsaIでシングルポット消化反応させることで生成した。目的のベクター(pAWp60)をBbsIで消化した。消化されたP1インサートおよびベクターをライゲーションして、目的のベクターにプールされたP1ライブラリーを作成した。このP1ライブラリーを再度BbsIで消化し、消化されたP2インサートとライゲーションして、2ウェイ(two-way)の組合せ(P1×P2)でライブラリーを作成した。順次、ライゲーション反応を行い、3ウェイ(P1×P2×P3)および4ウェイ(P1×P2×P3×P4)の組み合わせのライブラリーを作成した。プールされたアセンブリ工程の後、インサートのタンパク質をコードする部分をベクター構築物の一端にシームレスに結合させて局在させ、もう一方の端にそれぞれのバーコードを連結させた。952個のSpCas9変異体の4つの部分(4×2×17×7)の組合せライブラリーを構築し、それぞれが、gRNAで誘導されたゲノム部位の標的DNA鎖および非標的DNA鎖と相互作用するか3,4、あるいはSpCas9のヌクレアーゼドメインの立体構造ダイナミクスを変化させる28と予測されたアミノ酸残基に1~8個の変異(WTを除く)を有していた(図1a)。この組み合わせの複雑さは、バーコード付きのパーツを追加することで拡張でき、数万またはそれ以上のコンビナトリアルな修飾を同時に試験することができるようにスケールアップすることができる。サンガー配列決定分析を行ったところ、2ウェイ(20/20コロニー)、3ウェイ(14/15コロニー)および4ウェイ(8/8コロニー)のライブラリーにおいて、組み立てられたバーコード付きの組合せ変異体構築物の大部分が予想される変異を有することが確認された。意図しない塩基置換を行った1つの3ウェイ組合せ変異体構築物を除き、他の構築物には無作為な変異は検出されなかった。最終的に得られたライブラリーをpFUGWレンチウイルスベクターにサブクローニングし、EFSプロモーター下で選択マーカーであるゼオシン(Zeocin)とともにSpCas9の変異体を発現させた。レンチウイルスベクターに組み入れたバーコード付きSpCas9変異体(ライブラリーからサンプリングした7つのコロニーのうち7つ)の全長配列をサンガー配列決定法で調べたところ、予想される変異のみが存在し、無作為な変異は存在しないことが確認された。
SpCas9の各部分のインサートを含むストレージベクターを等モル比で混合した。プールされたインサートを、混合したストレージベクターをBsaIでシングルポット消化反応させることで生成した。目的のベクター(pAWp60)をBbsIで消化した。消化されたP1インサートおよびベクターをライゲーションして、目的のベクターにプールされたP1ライブラリーを作成した。このP1ライブラリーを再度BbsIで消化し、消化されたP2インサートとライゲーションして、2ウェイ(two-way)の組合せ(P1×P2)でライブラリーを作成した。順次、ライゲーション反応を行い、3ウェイ(P1×P2×P3)および4ウェイ(P1×P2×P3×P4)の組み合わせのライブラリーを作成した。プールされたアセンブリ工程の後、インサートのタンパク質をコードする部分をベクター構築物の一端にシームレスに結合させて局在させ、もう一方の端にそれぞれのバーコードを連結させた。952個のSpCas9変異体の4つの部分(4×2×17×7)の組合せライブラリーを構築し、それぞれが、gRNAで誘導されたゲノム部位の標的DNA鎖および非標的DNA鎖と相互作用するか3,4、あるいはSpCas9のヌクレアーゼドメインの立体構造ダイナミクスを変化させる28と予測されたアミノ酸残基に1~8個の変異(WTを除く)を有していた(図1a)。この組み合わせの複雑さは、バーコード付きのパーツを追加することで拡張でき、数万またはそれ以上のコンビナトリアルな修飾を同時に試験することができるようにスケールアップすることができる。サンガー配列決定分析を行ったところ、2ウェイ(20/20コロニー)、3ウェイ(14/15コロニー)および4ウェイ(8/8コロニー)のライブラリーにおいて、組み立てられたバーコード付きの組合せ変異体構築物の大部分が予想される変異を有することが確認された。意図しない塩基置換を行った1つの3ウェイ組合せ変異体構築物を除き、他の構築物には無作為な変異は検出されなかった。最終的に得られたライブラリーをpFUGWレンチウイルスベクターにサブクローニングし、EFSプロモーター下で選択マーカーであるゼオシン(Zeocin)とともにSpCas9の変異体を発現させた。レンチウイルスベクターに組み入れたバーコード付きSpCas9変異体(ライブラリーからサンプリングした7つのコロニーのうち7つ)の全長配列をサンガー配列決定法で調べたところ、予想される変異のみが存在し、無作為な変異は存在しないことが確認された。
個々の検証のためのSpCas9変異体の生成
Opti-SpCas9を含む個々のSpCas9変異体をコードするレンチウイルスベクターを、個々のインサートおよびベクターを用いて1つずつ組み立てたことを除いて、上記の組合せ変異体ライブラリーの生成に用いたのと同じ方法で構築した。
Opti-SpCas9を含む個々のSpCas9変異体をコードするレンチウイルスベクターを、個々のインサートおよびベクターを用いて1つずつ組み立てたことを除いて、上記の組合せ変異体ライブラリーの生成に用いたのと同じ方法で構築した。
ヒト細胞培養
HEK293T細胞を、American Type Culture Collection (ATCC)から入手した。OVCAR8-ADR細胞を、落谷(国立がん研究センター、日本)42から寄贈された。OVCAR8-ADR細胞の同一性を、細胞株認証テスト(cell line authentication test)(Genetica DNA Laboratories)により確認した。モノクローナルの安定なOVCAR8-ADR細胞株を、UBCプロモーターおよびCMVプロモーターからそれぞれ発現されるRFP遺伝子およびGFP遺伝子をコードするレンチウイルスと共に、RFP部位を標的とするgRNAのタンデムU6プロモーター駆動発現カセットを細胞に導入することにより作製した。RFPsg5-ON、RFPsg8-ONおよびRFP-sg6-ON系統は、gRNAのスペーサーと完全に一致するRFP上の標的部位を含むが、一方、RFPsg5-OFF5-2、RFPsg8-OFF5およびRFPsg5-OFF5系統は、同義変異を有し、gRNAスペーサーと不一致であるRFP上の標的部位を含む(表6)。HEK293T細胞を、10%熱不活化FBSおよび1×抗生物質-抗真菌剤(Life Technologies)を添加したDMEM中、37℃にて、5%CO2で培養した。OVCAR8-ADR細胞を、10%熱不活化FBSおよび1×抗生物質-抗真菌剤(Life Technologies)を添加したRPMI中、37℃にて5%CO2で培養した。
HEK293T細胞を、American Type Culture Collection (ATCC)から入手した。OVCAR8-ADR細胞を、落谷(国立がん研究センター、日本)42から寄贈された。OVCAR8-ADR細胞の同一性を、細胞株認証テスト(cell line authentication test)(Genetica DNA Laboratories)により確認した。モノクローナルの安定なOVCAR8-ADR細胞株を、UBCプロモーターおよびCMVプロモーターからそれぞれ発現されるRFP遺伝子およびGFP遺伝子をコードするレンチウイルスと共に、RFP部位を標的とするgRNAのタンデムU6プロモーター駆動発現カセットを細胞に導入することにより作製した。RFPsg5-ON、RFPsg8-ONおよびRFP-sg6-ON系統は、gRNAのスペーサーと完全に一致するRFP上の標的部位を含むが、一方、RFPsg5-OFF5-2、RFPsg8-OFF5およびRFPsg5-OFF5系統は、同義変異を有し、gRNAスペーサーと不一致であるRFP上の標的部位を含む(表6)。HEK293T細胞を、10%熱不活化FBSおよび1×抗生物質-抗真菌剤(Life Technologies)を添加したDMEM中、37℃にて、5%CO2で培養した。OVCAR8-ADR細胞を、10%熱不活化FBSおよび1×抗生物質-抗真菌剤(Life Technologies)を添加したRPMI中、37℃にて5%CO2で培養した。
レンチウイルスの作製および形質導入
レンチウイルスを、1ウェルあたり2.5×105個のHEK293T細胞を用いて6ウェルプレートにて作製した。細胞を、100μlのOptiMEM培地(Life Technologies)中に混合した0.5μgのレンチウイルスベクター、1μgのpCMV-dR8.2-dvprベクター、0.5μgのpCMV-VSV-Gベクターと共に、FuGENE HDトランスフェクション試薬(Promega)を用いて、15分間トランスフェクションした。トランスフェクションの1日後に、培地を新鮮な培養液に交換した。その後、トランスフェクションの48から96時間後の間に、24時間毎にウイルス上清を回収して、一緒にプールし、0.45μmのポリエーテルスルホン膜を通してろ過した。個々のベクター構築物を用いたトランスダクションでは、500μlのろ過したウイルス上清を用いて、8μg/mlポリブレン(Sigma)の存在下で2.5×105細胞を一晩感染させた。ヒト細胞(OVCAR8-ADR)にプールされたライブラリーを導入するために、同じ試験条件を用いてレンチウイルス産生をスケールアップした。ほとんどの組合せで十分な再現性を有する高カバレッジのライブラリーを確保するために、試験するライブラリーサイズの300倍以上の細胞を含む出発細胞集団で感染を行った。レンチウイルスを、感染多重度が約0.3になるように調整して、8μg/mlのポリブレン存在下で感染効率が約30%になるようにし、SpCas9変異体ライブラリーが低コピー数で提供されるようにした。
レンチウイルスを、1ウェルあたり2.5×105個のHEK293T細胞を用いて6ウェルプレートにて作製した。細胞を、100μlのOptiMEM培地(Life Technologies)中に混合した0.5μgのレンチウイルスベクター、1μgのpCMV-dR8.2-dvprベクター、0.5μgのpCMV-VSV-Gベクターと共に、FuGENE HDトランスフェクション試薬(Promega)を用いて、15分間トランスフェクションした。トランスフェクションの1日後に、培地を新鮮な培養液に交換した。その後、トランスフェクションの48から96時間後の間に、24時間毎にウイルス上清を回収して、一緒にプールし、0.45μmのポリエーテルスルホン膜を通してろ過した。個々のベクター構築物を用いたトランスダクションでは、500μlのろ過したウイルス上清を用いて、8μg/mlポリブレン(Sigma)の存在下で2.5×105細胞を一晩感染させた。ヒト細胞(OVCAR8-ADR)にプールされたライブラリーを導入するために、同じ試験条件を用いてレンチウイルス産生をスケールアップした。ほとんどの組合せで十分な再現性を有する高カバレッジのライブラリーを確保するために、試験するライブラリーサイズの300倍以上の細胞を含む出発細胞集団で感染を行った。レンチウイルスを、感染多重度が約0.3になるように調整して、8μg/mlのポリブレン存在下で感染効率が約30%になるようにし、SpCas9変異体ライブラリーが低コピー数で提供されるようにした。
細胞選別
細胞選別を、BD Influx cell sorter (BD Biosciences)で行った。滴下遅延(Drop delay)をBD Accudropビーズを用いて測定した。細胞を、70μmナイロンメッシュフィルターを通してろ過した後、1.0 Drop Pure 選別モードで100μmのノズルを通して選別した。細胞をGFP陽性シグナルで分け(gated)、RFPの蛍光強度に基づいて3つのビン(すなわち、A、B、C)に分類し、RFPレベルの低い細胞を包含する各ビンに集団の約5%の細胞を集めた。各ビンに選別される集団中の細胞の割合を、選別された集団における個々の組合せの存在性(representation)と、ビン間の変異体の濃縮を検出する感度との間のトレードオフのバランスをとるために調整することができる。各サンプルの選別されたビンには、約20万~30万個の細胞が集められた。
細胞選別を、BD Influx cell sorter (BD Biosciences)で行った。滴下遅延(Drop delay)をBD Accudropビーズを用いて測定した。細胞を、70μmナイロンメッシュフィルターを通してろ過した後、1.0 Drop Pure 選別モードで100μmのノズルを通して選別した。細胞をGFP陽性シグナルで分け(gated)、RFPの蛍光強度に基づいて3つのビン(すなわち、A、B、C)に分類し、RFPレベルの低い細胞を包含する各ビンに集団の約5%の細胞を集めた。各ビンに選別される集団中の細胞の割合を、選別された集団における個々の組合せの存在性(representation)と、ビン間の変異体の濃縮を検出する感度との間のトレードオフのバランスをとるために調整することができる。各サンプルの選別されたビンには、約20万~30万個の細胞が集められた。
バーコード配列決定用のサンプル調製
組合せ変異体ベクターライブラリーについては、Plasmid Mini kit(Qiagen)を用いてベクターライブラリーで形質転換した大腸菌からプラスミドDNAを抽出した。組合せ変異体ライブラリーを感染させたヒト細胞プールについては、DNeasy Blood & Tissue Kit(Qiagen)を用いて、様々な試験条件下で採取した細胞のゲノムDNAを抽出した。DNA濃度を、Quant-iT PicoGreen dsDNA Assay Kit (Life Technologies)で測定した。個々の組合せ変異体を表す固有のバーコード、Illuminaアンカー配列および多重配列決定用の8塩基対のインデックスバーコードをそれぞれ含む、393塩基対のフラグメントのPCR増幅を、Kapa HiFi Hotstart Ready-mix(Kapa Biosystems)を用いて行った。用いたフォワードプライマーおよびリバースプライマーは、5’-AATGATACGGCGACCACCGAGATCTACACGGAACCGCAACGGTATTC-3’および5’-CAAGCAGAAGACGGCATACGAGATNNNNNNNNGGTTGCGTCAGCAAACACAG-3’であり、ここで、NNNNNNNNは、各試験サンプルに割り当てられた特定のインデックスバーコードを示す。集団分布を歪める可能性のあるPCRにおけるバイアスを避けるため、PCR条件を最適化して、増幅が対数増殖期で起こるようにした。PCRアンプリコンを、StepOnePlus Real Time PCRシステム(Applied Biosystems)でKapa SYBR Fast qPCR Master Mix(Kapa Biosystems)を用いてリアルタイムPCR定量を行う前に、Agencourt AMPure XPビーズ(Beckman Coulter Genomics)を1:0.5および1:0.95の比率で用いて、2回のサイズ選択を行って精製した。定量的PCRに用したフォワードプライマーおよびリバースプライマーは、それぞれ5’-AATGATACGGCGACCACCGA-3’および5’-CAAGCAGAAGACGGCATACGA-3’であった。その後、定量したサンプルを所望の比率でプールして多重化し、高感度DNAチップ(Agilent)を用いてAgilent 2100 Bioanalyzerで評価し、プライマー(5’-CCACCGAGATCTACGGAACCGCAACGGTATTC-3’)およびインデックスバーコードプライマー(5’-GTGGCGTGGTGCACTGTTTGCTGACGCAACC-3’)を用いてIllumina HiSeqで分析した。
組合せ変異体ベクターライブラリーについては、Plasmid Mini kit(Qiagen)を用いてベクターライブラリーで形質転換した大腸菌からプラスミドDNAを抽出した。組合せ変異体ライブラリーを感染させたヒト細胞プールについては、DNeasy Blood & Tissue Kit(Qiagen)を用いて、様々な試験条件下で採取した細胞のゲノムDNAを抽出した。DNA濃度を、Quant-iT PicoGreen dsDNA Assay Kit (Life Technologies)で測定した。個々の組合せ変異体を表す固有のバーコード、Illuminaアンカー配列および多重配列決定用の8塩基対のインデックスバーコードをそれぞれ含む、393塩基対のフラグメントのPCR増幅を、Kapa HiFi Hotstart Ready-mix(Kapa Biosystems)を用いて行った。用いたフォワードプライマーおよびリバースプライマーは、5’-AATGATACGGCGACCACCGAGATCTACACGGAACCGCAACGGTATTC-3’および5’-CAAGCAGAAGACGGCATACGAGATNNNNNNNNGGTTGCGTCAGCAAACACAG-3’であり、ここで、NNNNNNNNは、各試験サンプルに割り当てられた特定のインデックスバーコードを示す。集団分布を歪める可能性のあるPCRにおけるバイアスを避けるため、PCR条件を最適化して、増幅が対数増殖期で起こるようにした。PCRアンプリコンを、StepOnePlus Real Time PCRシステム(Applied Biosystems)でKapa SYBR Fast qPCR Master Mix(Kapa Biosystems)を用いてリアルタイムPCR定量を行う前に、Agencourt AMPure XPビーズ(Beckman Coulter Genomics)を1:0.5および1:0.95の比率で用いて、2回のサイズ選択を行って精製した。定量的PCRに用したフォワードプライマーおよびリバースプライマーは、それぞれ5’-AATGATACGGCGACCACCGA-3’および5’-CAAGCAGAAGACGGCATACGA-3’であった。その後、定量したサンプルを所望の比率でプールして多重化し、高感度DNAチップ(Agilent)を用いてAgilent 2100 Bioanalyzerで評価し、プライマー(5’-CCACCGAGATCTACGGAACCGCAACGGTATTC-3’)およびインデックスバーコードプライマー(5’-GTGGCGTGGTGCACTGTTTGCTGACGCAACC-3’)を用いてIllumina HiSeqで分析した。
バーコード配列決定データ分析
各組合せ変異体のバーコード読み取りを、配列決定データから処理した。各組合せを表すバーコードリードを、インデックスバーコードによって分類された各サンプルの100万リードあたりで正規化した。プロファイリングを2つの生物学的複製で行った。選別されたビンAと選別されていない集団の間の各組合せ変異体の頻度を測定し、残りの集団に対するそれらの間の濃縮率(E)を計算した。ビンAを選択したのは、このビンでは変異体の濃縮が最も明らかだったためである(図2b)。用いた式は以下の通りである:
式中、Nbinは、選別されたビンにおける組合せ変異体の頻度を表し、Nunsortedは、選別されていないビンにおける組合せ変異体の頻度を表す。
各組合せ変異体のバーコード読み取りを、配列決定データから処理した。各組合せを表すバーコードリードを、インデックスバーコードによって分類された各サンプルの100万リードあたりで正規化した。プロファイリングを2つの生物学的複製で行った。選別されたビンAと選別されていない集団の間の各組合せ変異体の頻度を測定し、残りの集団に対するそれらの間の濃縮率(E)を計算した。ビンAを選択したのは、このビンでは変異体の濃縮が最も明らかだったためである(図2b)。用いた式は以下の通りである:
式中、Nbinは、選別されたビンにおける組合せ変異体の頻度を表し、Nunsortedは、選別されていないビンにおける組合せ変異体の頻度を表す。
選別されたビンAと選別されていない集団とを比較した複製から検出された対数変換された平均スコア(すなわち、log2(E))を、標的編集活性の尺度として用いた。データの信頼性を高めるために、選別されていない集団において300個以上の絶対リードを与えたバーコードのみを分析した。プールされたスクリーンから得られたlog2(E)スコアと個々の検証データとの相関関係(図9)を、プールされたスクリーンにおいて組合せ毎に細胞増殖倍率を増やして実験ノイズを減らすことで改善することができた43。活性が最適化された変異体(すなわち、本試験で同定されたOpti-SpCas9)は、log2(E)(ビンA 対 選別されていない集団)が、RFPsg5-ONおよびRFPsg8-ONの両方でWTの少なくとも90%を超える、RFPsg5-OFF5-2およびRFPsg8-OFF5の両方でWTの60%未満であるものとして定義された。OptiHF-SpCas9は、RFPsg5-ONおよびRFPsg8-ONの両方でWTの少なくとも50%を超え、RFPsg5-OFF5-2およびRFPsg8-OFF5の両方でWTの90%未満の濃縮比に基づいて、高忠実性を有する変異体として同定された。全リストを表2に示す。
エピスタシスを決定するために、既報のタンパク質適合性についての文献44,45と同様のスコアリングシステムを適用して、図4の各組合せについてエピスタシス(ε)スコアを計算した。εスコアを次のように決定した:観察された適合度-予期される適合度(ここで、組合せ[X,Y]の予期される適合度は、加法モデルによる(log2(E[X])+log2(E[Y]))である)。一般的には、予測よりも優れた適合度を示す組合せを正のエピスタシスと定義し、予測よりも適合度が低い組合せを負のエピスタシスと定義した。致死またはほぼ致死的な組合せ変異体のlog2(E)値は、比較のために、本試験では8つの変異を有するSpCas9変異体(すなわち、R661A+Q695A+K848A+E923M+T924V+Q926A+K1003A+R1060A)と等しく設定し、本発明者らの個々の検証データにより、標的RFP配列を破壊する最小の活性が確認された(図3b)。予期される適合度は、致死または致死に近い組合せ変異体のlog2(E)値を上限とし、意味のない予測適合度に起因する偽のエピスタシス値を最小限に抑えた。将来的には、プールされたスクリーニングにSpCas9の核酸分解変異体を致死変異体として含めて比較することが有益であり得る。
蛍光タンパク質破壊アッセイ(Fluorescent protein disruption assay)
蛍光タンパク質破壊アッセイを、SpCas9発現およびgRNA発現によってもたらされた蛍光タンパク質(すなわち、GFPまたはRFP)の標的部位におけるDNA切断およびインデル介在破壊を評価するために行い、その結果、細胞蛍光の消失がもたらされた。GFPまたはRFPレポーター遺伝子をSpCas9およびgRNAとともに有する細胞を洗浄し、2%の熱不活化FBSを添加した1×PBSに再懸濁し、LSR Fortessaアナライザー(Becton Dickinson)でアッセイした。細胞を、前方散乱光(forward Scatter)および側方散乱光(side scatter)で分け(gate)た。各データセットにおいて、サンプルあたり少なくとも1×104個の細胞を記録した。
蛍光タンパク質破壊アッセイを、SpCas9発現およびgRNA発現によってもたらされた蛍光タンパク質(すなわち、GFPまたはRFP)の標的部位におけるDNA切断およびインデル介在破壊を評価するために行い、その結果、細胞蛍光の消失がもたらされた。GFPまたはRFPレポーター遺伝子をSpCas9およびgRNAとともに有する細胞を洗浄し、2%の熱不活化FBSを添加した1×PBSに再懸濁し、LSR Fortessaアナライザー(Becton Dickinson)でアッセイした。細胞を、前方散乱光(forward Scatter)および側方散乱光(side scatter)で分け(gate)た。各データセットにおいて、サンプルあたり少なくとも1×104個の細胞を記録した。
イムノブロット分析
プロテアーゼ阻害剤(Gold Biotechnology #GB-108-2)を添加した2×RIPA緩衝液で細胞を溶解した。溶解物を、氷上で培養プレートを掻き取って回収し、15,000rpmで15分間、4℃にて遠心分離した。上清をBradford assay(BioRad)を用いて定量した。タンパク質を99℃で5分間変性させた後、10%ポリアクリルアミドゲル(Bio-Rad)でゲル電気泳動を行った。タンパク質を、110V、4℃にて、2時間かけてポリフッ化ビニリデン膜に転写した。用いた一次抗体は、抗Cas9(7A9-3A3)(1:2,000、Cell Signaling #14697)および抗βアクチン(1:10,000、Sigma #A2228)であった。二次抗体は、HRP結合抗マウスIgG(1:20,000、Cell Signaling #7076)を用いた。膜を、WesternBright ECL HRP基質(Advansta #K-12045-D20)により発色させた。
プロテアーゼ阻害剤(Gold Biotechnology #GB-108-2)を添加した2×RIPA緩衝液で細胞を溶解した。溶解物を、氷上で培養プレートを掻き取って回収し、15,000rpmで15分間、4℃にて遠心分離した。上清をBradford assay(BioRad)を用いて定量した。タンパク質を99℃で5分間変性させた後、10%ポリアクリルアミドゲル(Bio-Rad)でゲル電気泳動を行った。タンパク質を、110V、4℃にて、2時間かけてポリフッ化ビニリデン膜に転写した。用いた一次抗体は、抗Cas9(7A9-3A3)(1:2,000、Cell Signaling #14697)および抗βアクチン(1:10,000、Sigma #A2228)であった。二次抗体は、HRP結合抗マウスIgG(1:20,000、Cell Signaling #7076)を用いた。膜を、WesternBright ECL HRP基質(Advansta #K-12045-D20)により発色させた。
T7エンドヌクレアーゼIアッセイ
T7エンドヌクレアーゼIアッセイを行い、gRNAが標的とするゲノム遺伝子座におけるDNAミスマッチ切断を評価した。QuickExtract DNA抽出液(Epicentre)またはDNeasy Blood & Tissue Kit(Qiagen)を用いて、細胞培養物からゲノムDNAを抽出した。表7に示したプライマーおよびPCR条件でPCRを行い、Agencourt AMPure XP beads (Beckman Coulter Genomics)を用いて精製して、標的遺伝子座を有するアンプリコンを得た。約400ngのPCRアンプリコンを変性させ、自己アニーリングさせ、4ユニットのT7エンドヌクレアーゼI(New England Biolabs)と37℃にて40分間インキュベートした。反応生成物を2%アガロースゲル電気泳動を用いて分離した。定量化を、ImageJを用いて測定した相対的なバンド強度に基づいて行った。インデルの割合を、式100×(1-(1-(b+c)/(a+b+c))1/2)(式中、aは切断されていないPCR産物の積分強度であり、bおよびcは各切断産物の積分強度である。)で概算した46。
T7エンドヌクレアーゼIアッセイを行い、gRNAが標的とするゲノム遺伝子座におけるDNAミスマッチ切断を評価した。QuickExtract DNA抽出液(Epicentre)またはDNeasy Blood & Tissue Kit(Qiagen)を用いて、細胞培養物からゲノムDNAを抽出した。表7に示したプライマーおよびPCR条件でPCRを行い、Agencourt AMPure XP beads (Beckman Coulter Genomics)を用いて精製して、標的遺伝子座を有するアンプリコンを得た。約400ngのPCRアンプリコンを変性させ、自己アニーリングさせ、4ユニットのT7エンドヌクレアーゼI(New England Biolabs)と37℃にて40分間インキュベートした。反応生成物を2%アガロースゲル電気泳動を用いて分離した。定量化を、ImageJを用いて測定した相対的なバンド強度に基づいて行った。インデルの割合を、式100×(1-(1-(b+c)/(a+b+c))1/2)(式中、aは切断されていないPCR産物の積分強度であり、bおよびcは各切断産物の積分強度である。)で概算した46。
ゲノムワイドなオフターゲットのGUIDE-Seq検出
ゲノムワイドなオフターゲットをGUIDE-Seq法47を用いて測定した。各GUIDE-Seqサンプルでは、SpCas9変異体およびgRNAを感染させた150万個のOVCAR8-ADR細胞を、製造業者のプロトコルに従って100μlのNeonチップ(ThermoFisher Scientific)を用いて、1,000pmolの新鮮なアニールされたGUIDE-seq末端保護dsODNとともにエレクトロポレーションした。用いたdsODNオリゴの配列は以下の通りであった:
5’-P-G*T*TTAATTGAGTTGTCATATGTTAATAACGGT*A*T-3’および
5’-P-A*T*ACCGTTATTAACATATGACAACTCAATTAA*A*C-3’
ここで、Pは5’リン酸化を示し、*はホスホロチオエート結合を示す。エレクトロポレーションの72時間後にDNeasy Blood and Tissue kit(Qiagen)を用いてゲノムDNAを抽出した。ゲノムDNA濃度を、Qubit fluorometer dsDNA HS assay(ThermoFisher Scientific)で定量し、400ngを若干の変更を加えたGUIDE-Seqプロトコルに従ってライブラリー構築に用いた。要するに、KAPA Frag Kit (KAPA Biosystems)を用いてDNAを酵素的に断片化した後、アダプターをライゲーションし、2回のヘミネステッドPCRを行ってdsODN組み込み配列を濃縮した。様々なイルミナプラットフォームでシングルインデックスシーケンスワークフローを用いてデュアルインデックスデータを得るためにイルミナシーケンスワークフローを統合するために、サンプルインデックス(インデックス2)を固有の分子インデックス(表8)に従ってリード1の先頭に配置して、半機能アダプターを再設計した。最終的なシーケンスライブラリーを、Illumina用のKAPA Library Quantification Kitで定量化し、Illumina NextSeq 500 Systemで配列決定を行った。インデックス1のデータ逆多重化(de-multiplexing)をbcl2fq v2.19で行い、続いてインデックス2の逆多重化およびGUIDE-Seqソフトウェア48を用いた解析のためのフォーマット化のためのカスタムスクリプトを行った。
ゲノムワイドなオフターゲットをGUIDE-Seq法47を用いて測定した。各GUIDE-Seqサンプルでは、SpCas9変異体およびgRNAを感染させた150万個のOVCAR8-ADR細胞を、製造業者のプロトコルに従って100μlのNeonチップ(ThermoFisher Scientific)を用いて、1,000pmolの新鮮なアニールされたGUIDE-seq末端保護dsODNとともにエレクトロポレーションした。用いたdsODNオリゴの配列は以下の通りであった:
5’-P-G*T*TTAATTGAGTTGTCATATGTTAATAACGGT*A*T-3’および
5’-P-A*T*ACCGTTATTAACATATGACAACTCAATTAA*A*C-3’
ここで、Pは5’リン酸化を示し、*はホスホロチオエート結合を示す。エレクトロポレーションの72時間後にDNeasy Blood and Tissue kit(Qiagen)を用いてゲノムDNAを抽出した。ゲノムDNA濃度を、Qubit fluorometer dsDNA HS assay(ThermoFisher Scientific)で定量し、400ngを若干の変更を加えたGUIDE-Seqプロトコルに従ってライブラリー構築に用いた。要するに、KAPA Frag Kit (KAPA Biosystems)を用いてDNAを酵素的に断片化した後、アダプターをライゲーションし、2回のヘミネステッドPCRを行ってdsODN組み込み配列を濃縮した。様々なイルミナプラットフォームでシングルインデックスシーケンスワークフローを用いてデュアルインデックスデータを得るためにイルミナシーケンスワークフローを統合するために、サンプルインデックス(インデックス2)を固有の分子インデックス(表8)に従ってリード1の先頭に配置して、半機能アダプターを再設計した。最終的なシーケンスライブラリーを、Illumina用のKAPA Library Quantification Kitで定量化し、Illumina NextSeq 500 Systemで配列決定を行った。インデックス1のデータ逆多重化(de-multiplexing)をbcl2fq v2.19で行い、続いてインデックス2の逆多重化およびGUIDE-Seqソフトウェア48を用いた解析のためのフォーマット化のためのカスタムスクリプトを行った。
本明細書に引用されている、GenBank受託番号または同等の配列識別番号を含む、すべての特許、特許出願およびその他の刊行物は、すべての目的に関してその内容全体が引用により本明細書中に包含される。
文献
Claims (32)
- 5’から3’の順に、
第1のタイプのIIS型制限酵素のための第1の認識部位、
DNAエレメント、
第2のタイプのIIS型制限酵素のための第1および第2の認識部位、
DNAエレメントに一意的に割り当てられたバーコード、および
第1のタイプのIIS型制限酵素のための第2の認識部位
を含む、DNA構築物。 - DNAベクターである、請求項1に記載のDNA構築物。
- 請求項1に記載のDNA構築物を2以上含む、ライブラリー。
- 5’から3’の順に、
第1のタイプのIIS型制限酵素のための認識部位、
複数のDNAエレメント、
プライマー結合部位、ならびに
複数のDNAエレメントの1つにそれぞれ一意的に割り当てられた複数のバーコードおよび第2のタイプのIIS型制限酵素のための認識部位
を含むDNA構築物であって、ここで、複数のDNAエレメントが互いに連結されて、複数のDNAエレメントの何れか2つの間の何れの連結点でも外来配列を含まないタンパク質をコードする配列を形成し、かつ該複数のバーコードが、それらが割り当てされたDNAエレメントの逆の順で配置されている、DNA構築物。 - DNAベクターである、請求項4に記載のDNA構築物。
- 第1のタイプのIIS型制限酵素および第2のタイプのIIS型制限酵素が、DNA分子を切断することにより適合性の末端を作成する、請求項1、2、4および5のいずれか一項に記載のDNA構築物。
- 第1のタイプのIIS型制限酵素がBsaIであり、第2のタイプのIIS型制限酵素がBbsIである、請求項1、2、4および5のいずれか一項に記載のDNA構築物。
- コンビナトリアル遺伝子構築物の作製方法であって、
(a) 請求項2に記載の第1のDNAベクターを第1のタイプのIIS型制限酵素で切断して、第1のDNAセグメント、第2のタイプのIIS型制限酵素のための第1および第2の認識部位ならびに第1のタイプのIIS型制限酵素により作成された第1および第2の末端に隣接する第1のバーコードを含む第1のDNAフラグメントを遊離させる工程;
(b) プロモーターを含む最初の発現ベクターを第2のタイプのIIS型制限酵素で切断して、該最初の発現ベクターをプロモーターの3’末端付近で線形化し、かつ(a)のDNAフラグメントの第1および第2の末端と適合性の2つの末端を作成する工程;
(c) (a)の第1のDNAフラグメントを(b)の線形化された発現ベクターにアニーリングおよびライゲーションして、第1のDNAフラグメントおよび第1のバーコードがその3’末端でプロモーターに作動可能に連結されている一方向複合型発現ベクターを形成する工程;
(d) 請求項2に記載の第2のDNAベクターを第1のタイプのIIS型制限酵素で切断して、第2のDNAセグメント、第2のタイプのIIS型制限酵素のための第1および第2の認識部位ならびに第1のタイプのIIS型制限酵素により作成された第1および第2の末端に隣接する第2のバーコードを含む第2のDNAフラグメントを遊離させる工程;
(e) (c)の複合型発現ベクターを、第2のタイプのIIS型制限酵素で切断して、第1のDNAエレメントと第1のバーコードの間で複合型発現ベクターを線形化し、かつ(d)のDNAフラグメントの第1および第2の末端と適合性の2つの末端を作成する工程;
(f) (d)の第2のDNAフラグメントを第1のDNAエレメントと第1のバーコードの間の(e)の線形化された複合型発現ベクターにアニーリングおよびライゲーションして、第1のDNAフラグメント、第2のDNAフラグメント、第2のバーコードおよび第1のバーコードがこの順でその3’末端にてプロモーターに作動可能に連結されている、2ウェイ複合型発現ベクターを形成する工程
を含み、ここで、第1および第2のDNAエレメントが、互いに直接隣接するそのN末端由来の予め選択されたタンパク質の第1および第2のセグメントをコードし、該第1および第2のDNAフラグメントが、予め選択されたタンパク質に見出されないアミノ酸残基をもたらす外来ヌクレオチド配列を含まない2ウェイ複合型発現ベクター中で互いに結合しており、かつ該第1および第2のDNAエレメントがそれぞれ1以上の変異を含む、
作製方法。 - 工程(d)から(f)を、n番目のDNAエレメント、第2のタイプのIIS型制限酵素のための第1および第2の認識部位ならびにn番目のバーコードを含む第nのDNAフラグメントをn方向複合型発現ベクターに組み込むためにn回目まで繰り返し、ここで該n番目のDNAエレメントが、そのC末端から、予め選択されたタンパク質のn番目または2番目から最後のセグメントをコードしている、請求項8に記載の方法であって、
(x) 第1のタイプのIIS型制限酵素のための第1および第2の認識部位の間に、(n+1)番目のDNAエレメント、プライマー結合部位ならびに(n+1)番目のバーコードを含む、最終DNAベクターを提供する工程;
(y) 該最終DNAベクターを第1のタイプのIIS型制限酵素で切断して、5’から3’の順に、(n+1)番目のDNAエレメント、プライマー結合部位ならびに第1のタイプのIIS型制限酵素により作成された第1および第2の末端に隣接する(n+1)番目のバーコードを含む最終DNAフラグメントを遊離させる工程;
(z) 該最終DNAフラグメントを、工程(d)から(f)をn回繰り返した後に作製され、かつ第2のタイプのIIS型制限酵素により線形化されたnウェイ複合型発現ベクターにアニーリングおよびライゲーションして、最終複合型発現ベクターを形成する工程
をさらに含み、ここで、第1、第2および(n+1)番目までのDNAエレメントが、そのN末端から互いにすぐに隣接している予め選択されたタンパク質の第1、第2およびn番目までならびに最後のセグメントをコードし、第1、第2およびn番目までならびに最後のDNAフラグメントが、予め選択されたタンパク質に見出されないアミノ酸残基をもたらす何らかの外因性ヌクレオチド配列を含まない最終複合型発現ベクター中で互いに結合されており、かつDNAエレメントの各々が、1以上の変異を含む、
作製方法。 - 第1のタイプのIIS型制限酵素および第2のタイプのIIS型制限酵素が、DNA分子を切断することにより適合性の末端を作成する、請求項8または9に記載の方法。
- 第1のタイプのIIS型制限酵素がBsaIであり、第2のタイプのIIS型制限酵素がBbsIである、請求項8または9に記載の方法。
- 請求項9に記載の方法により作製される、最終複合型発現ベクターの2以上を含む、ライブラリー。
- 配列番号1の残基1003に対応する残基が置換され、かつ配列番号1の残基661に対応する残基が置換されている、配列番号1および4-13のいずれか1つに記載のアミノ酸配列を含むポリペプチド。
- 配列番号1の残基1003に対応する残基がヒスチジンで置換され、かつ配列番号1の残基661に対応する残基がアラニンで置換されている、請求項13に記載のポリペプチド。
- 配列番号1に記載のアミノ酸配列を含む請求項14に記載のポリペプチドであって、残基1003がヒスチジンで置換され、かつ残基661がアラニンで置換されており、さらに残基926にてアラニン置換を含んでいてよい、ポリペプチド。
- 配列番号1の残基695、848および926に対応する残基が、アラニンで置換され、配列番号1の残基923に対応する残基が、メチオニンで置換され、かつ配列番号1の残基924に対応する残基が、バリンで置換されている、請求項13に記載のポリペプチド。
- 配列番号1に記載のアミノ酸配列を含む請求項16に記載のポリペプチドであって、配列番号1の残基695、848および926に対応する残基がアラニンで置換され、配列番号1の残基923に対応する残基がメチオニンで置換され、そして配列番号1の残基924に対応する残基がバリンで置換されている、ポリペプチド。
- 請求項13に記載のポリペプチドおよび生理学的に許容される賦形剤を含む、組成物。
- 請求項13から17のいずれか一項に記載のポリペプチドをコードするポリヌクレオチド配列を含む、核酸。
- 請求項17に記載の核酸および生理学的に許容される賦形剤を含む、組成物。
- 請求項13から17のいずれか一項に記載のポリペプチドをコードするポリヌクレオチド配列に作動可能に連結されたプロモーターを含む、発現カセット。
- 請求項21に記載の発現カセットを含む、ベクター。
- ウイルスベクターである、請求項22に記載のベクター。
- 請求項19に記載の発現カセットまたは請求項13から17のいずれか一項に記載のポリペプチドを含む、宿主細胞。
- 標的部位でDNA分子を切断する方法であって、標的DNA部位を含むDNA分子を請求項13から17のいずれか一項に記載のポリペプチドおよび標的DNA部位に特異的に結合する短いガイドRNA(sgRNA)と接触させることにより、該DNA分子を標的DNA部位で切断することを含む、方法。
- DNA分子が生細胞内のゲノムDNAであり、かつ該細胞が、sgRNAおよびポリペプチドをコードするポリヌクレオチド配列でトランスフェクトされている、請求項25に記載の方法。
- 細胞が、sgRNAをコードする第1のベクターおよびポリペプチドをコードする第2のベクターでトランスフェクトされている、請求項26に記載の方法。
- 細胞が、sgRNAおよびポリペプチドの両方をコードするベクターでトランスフェクトされている、請求項26に記載の方法。
- 第1および第2のベクターがそれぞれ、ウイルスベクターである、請求項27に記載の方法。
- ベクターがウイルスベクターである、請求項28に記載の方法。
- ウイルスベクターがレトロウイルスベクターである、請求項29または30に記載の方法。
- レトロウイルスベクターがレンチウイルスベクターである、請求項31に記載の方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862733410P | 2018-09-19 | 2018-09-19 | |
US62/733,410 | 2018-09-19 | ||
PCT/CN2019/106096 WO2020057481A1 (en) | 2018-09-19 | 2019-09-17 | Improved high-throughput combinatorial genetic modification system and optimized cas9 enzyme variants |
JP2021515089A JP2022501025A (ja) | 2018-09-19 | 2019-09-17 | 改良されたハイスループットコンビナトリアル遺伝子改変システムおよび最適化されたCas9酵素変異体 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021515089A Division JP2022501025A (ja) | 2018-09-19 | 2019-09-17 | 改良されたハイスループットコンビナトリアル遺伝子改変システムおよび最適化されたCas9酵素変異体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023156337A true JP2023156337A (ja) | 2023-10-24 |
Family
ID=69888347
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021515089A Pending JP2022501025A (ja) | 2018-09-19 | 2019-09-17 | 改良されたハイスループットコンビナトリアル遺伝子改変システムおよび最適化されたCas9酵素変異体 |
JP2023119639A Pending JP2023156337A (ja) | 2018-09-19 | 2023-07-24 | 改良されたハイスループットコンビナトリアル遺伝子改変システムおよび最適化されたCas9酵素変異体 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021515089A Pending JP2022501025A (ja) | 2018-09-19 | 2019-09-17 | 改良されたハイスループットコンビナトリアル遺伝子改変システムおよび最適化されたCas9酵素変異体 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230193251A1 (ja) |
EP (2) | EP4253549A3 (ja) |
JP (2) | JP2022501025A (ja) |
KR (1) | KR20210060541A (ja) |
CN (1) | CN112955549A (ja) |
WO (1) | WO2020057481A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020254872A2 (en) | 2019-06-17 | 2020-12-24 | Crispr Therapeutics Ag | Methods and compositions for improved homology directed repair |
WO2022018638A1 (en) | 2020-07-21 | 2022-01-27 | Crispr Therapeutics Ag | Genome-editing compositions and methods to modulate faah for treatment of neurological disorders |
WO2022133246A1 (en) | 2020-12-17 | 2022-06-23 | Vertex Pharmaceuticals Incorporated | Compositions and methods for editing beta-globin for treatment of hemaglobinopathies |
WO2022238958A1 (en) | 2021-05-12 | 2022-11-17 | Crispr Therapeutics Ag | Multiplex gene editing |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5965408A (en) | 1996-07-09 | 1999-10-12 | Diversa Corporation | Method of DNA reassembly by interrupting synthesis |
DK1557464T3 (da) * | 2004-01-23 | 2011-01-24 | Sloning Biotechnology Gmbh | Enzymatisk fremstilling af nykleinsyremolekylder |
EP2115144A1 (en) * | 2007-02-05 | 2009-11-11 | Philipps-Universität Marburg | Method of cloning at least one nucleic acid molecule of interest using type iis restriction endonucleases, and corresponding cloning vectors, kits and system using type iis restriction endonucleases |
AU2013282323B2 (en) | 2012-06-29 | 2018-05-10 | Massachusetts Institute Of Technology | Massively parallel combinatorial genetics |
US10253321B2 (en) * | 2013-05-01 | 2019-04-09 | Dna2.0, Inc. | Methods, compositions and kits for a one-step DNA cloning system |
CA2932439A1 (en) * | 2013-12-12 | 2015-06-18 | The Broad Institute, Inc. | Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes |
US10017770B2 (en) * | 2014-07-03 | 2018-07-10 | Ut-Battelle, Llc | TNT cloning system |
EP3212789B1 (en) * | 2014-10-31 | 2020-04-22 | Massachusetts Institute of Technology | Massively parallel combinatorial genetics for crispr |
WO2016115033A1 (en) | 2015-01-12 | 2016-07-21 | Massachusetts Institute Of Technology | Microrna combinations for anti-cancer therapeutics |
MA41349A (fr) * | 2015-01-14 | 2017-11-21 | Univ Temple | Éradication de l'herpès simplex de type i et d'autres virus de l'herpès associés guidée par arn |
WO2016176325A1 (en) * | 2015-04-27 | 2016-11-03 | California Institute Of Technology | Methods and compositions for rapid assembly of genetic modules |
US9926546B2 (en) * | 2015-08-28 | 2018-03-27 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases |
JP6799586B2 (ja) * | 2015-08-28 | 2020-12-16 | ザ ジェネラル ホスピタル コーポレイション | 遺伝子操作CRISPR−Cas9ヌクレアーゼ |
EA201890611A1 (ru) * | 2015-09-01 | 2018-08-31 | Те Риджентс Оф Те Юниверсити Оф Калифорния | Библиотеки модульных полипептидов и способы их получения и применения |
WO2018035387A1 (en) * | 2016-08-17 | 2018-02-22 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
WO2018064208A1 (en) * | 2016-09-28 | 2018-04-05 | The Broad Institute, Inc. | Systematic screening and mapping of regulatory elements in non-coding genomic regions, methods, compositions, and applications thereof |
KR20230164759A (ko) * | 2016-10-07 | 2023-12-04 | 인티그레이티드 디엔에이 테크놀로지스 아이엔씨. | S. 피오게네스 cas9 돌연변이 유전자 및 이에 의해 암호화되는 폴리펩티드 |
CN110290813A (zh) * | 2016-10-14 | 2019-09-27 | 通用医疗公司 | 表观遗传学调控的位点特异性核酸酶 |
GB201621589D0 (en) * | 2016-12-19 | 2017-02-01 | Univ Gent And Katholieke Univ Leuven K U Leuven R&D | Polynucleotide shuffling method |
US20180208914A1 (en) * | 2017-01-26 | 2018-07-26 | Excision Biotherapeutics, Inc. | Lentivirus and non-integrating lentivirus as viral vector to deliver crispr therapeutic |
-
2019
- 2019-09-17 CN CN201980061793.9A patent/CN112955549A/zh active Pending
- 2019-09-17 JP JP2021515089A patent/JP2022501025A/ja active Pending
- 2019-09-17 EP EP23178221.0A patent/EP4253549A3/en active Pending
- 2019-09-17 KR KR1020217011033A patent/KR20210060541A/ko unknown
- 2019-09-17 US US17/278,189 patent/US20230193251A1/en active Pending
- 2019-09-17 WO PCT/CN2019/106096 patent/WO2020057481A1/en unknown
- 2019-09-17 EP EP19863047.7A patent/EP3853363A4/en active Pending
-
2023
- 2023-07-24 JP JP2023119639A patent/JP2023156337A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP3853363A4 (en) | 2022-12-14 |
EP4253549A2 (en) | 2023-10-04 |
CN112955549A (zh) | 2021-06-11 |
JP2022501025A (ja) | 2022-01-06 |
WO2020057481A1 (en) | 2020-03-26 |
US20230193251A1 (en) | 2023-06-22 |
EP4253549A3 (en) | 2023-12-06 |
EP3853363A1 (en) | 2021-07-28 |
KR20210060541A (ko) | 2021-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6878554B2 (ja) | RNA誘導型FokIヌクレアーゼ(RFN)を用いたRNA誘導型ゲノム編集の特異性の増大 | |
Miller et al. | Continuous evolution of SpCas9 variants compatible with non-G PAMs | |
JP2023156337A (ja) | 改良されたハイスループットコンビナトリアル遺伝子改変システムおよび最適化されたCas9酵素変異体 | |
EP3916086A1 (en) | Nucleic acid-guided nucleases | |
US10011850B2 (en) | Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing | |
JP2020507347A (ja) | 高忠実度cas9バリアントおよびそれらの利用 | |
KR20150140663A (ko) | 방향적 진화를 위한 라이브러리의 생산 방법 | |
US20210108249A1 (en) | Long Adapter Single Stranded Oligonucleotide (LASSO) Probes to Capture and Clone Complex Libraries | |
CN116179513B (zh) | 一种Cpf1蛋白及其在基因编辑中的应用 | |
Nyerges et al. | Swapped genetic code blocks viral infections and gene transfer | |
WO2022266298A1 (en) | Systems, methods, and compositions comprising miniature crispr nucleases for gene editing and programmable gene activation and inhibition | |
WO2023070043A1 (en) | Compositions and methods for targeted editing and evolution of repetitive genetic elements | |
AU2022291127A1 (en) | Crispr-transposon systems for dna modification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230817 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230817 |