JP2022533040A - 合成ゲノム - Google Patents
合成ゲノム Download PDFInfo
- Publication number
- JP2022533040A JP2022533040A JP2021566246A JP2021566246A JP2022533040A JP 2022533040 A JP2022533040 A JP 2022533040A JP 2021566246 A JP2021566246 A JP 2021566246A JP 2021566246 A JP2021566246 A JP 2021566246A JP 2022533040 A JP2022533040 A JP 2022533040A
- Authority
- JP
- Japan
- Prior art keywords
- genome
- synthetic
- codons
- sense
- prokaryotic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108020004705 Codon Proteins 0.000 claims abstract description 489
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 201
- -1 map Proteins 0.000 claims description 80
- 241000588724 Escherichia coli Species 0.000 claims description 73
- 102000004169 proteins and genes Human genes 0.000 claims description 65
- 150000001413 amino acids Chemical class 0.000 claims description 62
- 230000006798 recombination Effects 0.000 claims description 61
- 238000005215 recombination Methods 0.000 claims description 61
- 239000003550 marker Substances 0.000 claims description 59
- 238000000034 method Methods 0.000 claims description 54
- 230000021615 conjugation Effects 0.000 claims description 52
- 238000006467 substitution reaction Methods 0.000 claims description 43
- 108700039887 Essential Genes Proteins 0.000 claims description 40
- 230000015572 biosynthetic process Effects 0.000 claims description 29
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 29
- 238000012239 gene modification Methods 0.000 claims description 28
- 102000040430 polynucleotide Human genes 0.000 claims description 28
- 108091033319 polynucleotide Proteins 0.000 claims description 28
- 239000002157 polynucleotide Substances 0.000 claims description 28
- 238000003786 synthesis reaction Methods 0.000 claims description 28
- 238000009482 thermal adhesion granulation Methods 0.000 claims description 28
- 238000011144 upstream manufacturing Methods 0.000 claims description 28
- 230000001404 mediated effect Effects 0.000 claims description 26
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 25
- 108020005038 Terminator Codon Proteins 0.000 claims description 21
- 238000004519 manufacturing process Methods 0.000 claims description 21
- 230000001580 bacterial effect Effects 0.000 claims description 20
- 229920001184 polypeptide Polymers 0.000 claims description 19
- 101100311938 Dictyostelium discoideum phesA gene Proteins 0.000 claims description 16
- 101100423325 Dictyostelium discoideum phesB gene Proteins 0.000 claims description 16
- 101150080777 pheS gene Proteins 0.000 claims description 16
- 230000001939 inductive effect Effects 0.000 claims description 15
- 101150093386 prfA gene Proteins 0.000 claims description 14
- 101150027417 recU gene Proteins 0.000 claims description 14
- 230000005540 biological transmission Effects 0.000 claims description 13
- 101150073450 ribE gene Proteins 0.000 claims description 12
- 241001138501 Salmonella enterica Species 0.000 claims description 9
- 241000607768 Shigella Species 0.000 claims description 9
- 101150008263 accD gene Proteins 0.000 claims description 9
- 230000006698 induction Effects 0.000 claims description 9
- 101150037566 nrdB gene Proteins 0.000 claims description 9
- 230000002441 reversible effect Effects 0.000 claims description 9
- 230000035899 viability Effects 0.000 claims description 9
- 101150002100 ftsK gene Proteins 0.000 claims description 8
- 101150009419 ribF gene Proteins 0.000 claims description 7
- 101150037064 rpoA gene Proteins 0.000 claims description 7
- 101150070497 accC gene Proteins 0.000 claims description 6
- 241000023308 Acca Species 0.000 claims description 5
- 101100015910 Alkalihalobacillus halodurans (strain ATCC BAA-125 / DSM 18197 / FERM 7344 / JCM 9153 / C-125) hemL2 gene Proteins 0.000 claims description 5
- 101100234243 Aquifex aeolicus (strain VF5) kdtA gene Proteins 0.000 claims description 5
- 101100019907 Arabidopsis thaliana KDSA2 gene Proteins 0.000 claims description 5
- 101100225285 Bacillus subtilis (strain 168) efp gene Proteins 0.000 claims description 5
- 101100013238 Bacillus subtilis (strain 168) folB gene Proteins 0.000 claims description 5
- 101100397224 Bacillus subtilis (strain 168) isp gene Proteins 0.000 claims description 5
- 101100087825 Bacillus subtilis (strain 168) nrdE gene Proteins 0.000 claims description 5
- 101100518689 Bacillus subtilis (strain 168) padR gene Proteins 0.000 claims description 5
- 101100462937 Bacillus subtilis (strain 168) pbpA gene Proteins 0.000 claims description 5
- 101100078797 Bacillus subtilis (strain 168) racE gene Proteins 0.000 claims description 5
- 101100362510 Bacillus subtilis (strain 168) rpsN1 gene Proteins 0.000 claims description 5
- 101100366267 Bacillus subtilis (strain 168) spoIIIE gene Proteins 0.000 claims description 5
- 101100377044 Bacillus subtilis (strain 168) yraL gene Proteins 0.000 claims description 5
- 101100180240 Burkholderia pseudomallei (strain K96243) ispH2 gene Proteins 0.000 claims description 5
- 101100423982 Clostridium acetobutylicum (strain ATCC 824 / DSM 792 / JCM 1419 / LMG 5710 / VKM B-1787) serS1 gene Proteins 0.000 claims description 5
- 101100450422 Clostridium perfringens (strain 13 / Type A) hemC gene Proteins 0.000 claims description 5
- 101100039285 Clostridium perfringens (strain 13 / Type A) rpsM gene Proteins 0.000 claims description 5
- 101100239133 Corynebacterium glutamicum (strain ATCC 13032 / DSM 20300 / BCRC 11384 / JCM 1318 / LMG 3730 / NCIMB 10025) murB1 gene Proteins 0.000 claims description 5
- 101100087840 Dictyostelium discoideum rnrB-2 gene Proteins 0.000 claims description 5
- 101100075089 Epichloe uncinata lolA1 gene Proteins 0.000 claims description 5
- 101100075091 Epichloe uncinata lolA2 gene Proteins 0.000 claims description 5
- 101100511447 Epichloe uncinata lolC1 gene Proteins 0.000 claims description 5
- 101100511448 Epichloe uncinata lolC2 gene Proteins 0.000 claims description 5
- 101100289323 Epichloe uncinata lolD1 gene Proteins 0.000 claims description 5
- 101100021536 Epichloe uncinata lolD2 gene Proteins 0.000 claims description 5
- 101000787195 Escherichia coli (strain K12) Aldose sugar dehydrogenase YliI Proteins 0.000 claims description 5
- 101100269720 Escherichia coli (strain K12) alsK gene Proteins 0.000 claims description 5
- 101100445550 Escherichia coli (strain K12) erpA gene Proteins 0.000 claims description 5
- 101100155531 Escherichia coli (strain K12) ispU gene Proteins 0.000 claims description 5
- 101100128678 Escherichia coli (strain K12) lptG gene Proteins 0.000 claims description 5
- 101100034375 Escherichia coli (strain K12) ribC gene Proteins 0.000 claims description 5
- 101100041075 Escherichia coli (strain K12) rsmI gene Proteins 0.000 claims description 5
- 101100047683 Escherichia coli (strain K12) tsaD gene Proteins 0.000 claims description 5
- 101100101537 Escherichia coli (strain K12) ubiV gene Proteins 0.000 claims description 5
- 101100540702 Escherichia coli (strain K12) waaU gene Proteins 0.000 claims description 5
- 101100333797 Escherichia coli espP gene Proteins 0.000 claims description 5
- 101100135734 Haloferax mediterranei (strain ATCC 33500 / DSM 1411 / JCM 8866 / NBRC 14739 / NCIMB 2177 / R-4) pccB gene Proteins 0.000 claims description 5
- 101100171532 Haloferax volcanii (strain ATCC 29605 / DSM 3757 / JCM 8879 / NBRC 14742 / NCIMB 2012 / VKM B-1768 / DS2) hdrA gene Proteins 0.000 claims description 5
- 101000972485 Homo sapiens Lupus La protein Proteins 0.000 claims description 5
- 101100419195 Leptospira borgpetersenii serovar Hardjo-bovis (strain L550) rpsC2 gene Proteins 0.000 claims description 5
- 101100529965 Leptospira borgpetersenii serovar Hardjo-bovis (strain L550) rpsK2 gene Proteins 0.000 claims description 5
- 101100356737 Listeria monocytogenes serovar 1/2a (strain ATCC BAA-679 / EGD-e) ribCF gene Proteins 0.000 claims description 5
- 101100303649 Methanopyrus kandleri (strain AV19 / DSM 6324 / JCM 9639 / NBRC 100938) rpl24 gene Proteins 0.000 claims description 5
- 101100200099 Methanopyrus kandleri (strain AV19 / DSM 6324 / JCM 9639 / NBRC 100938) rps13 gene Proteins 0.000 claims description 5
- 101100253802 Methanopyrus kandleri (strain AV19 / DSM 6324 / JCM 9639 / NBRC 100938) rps14 gene Proteins 0.000 claims description 5
- 101100023016 Methanothermobacter marburgensis (strain ATCC BAA-927 / DSM 2133 / JCM 14651 / NBRC 100331 / OCM 82 / Marburg) mat gene Proteins 0.000 claims description 5
- 101100178317 Methylorubrum extorquens (strain ATCC 14718 / DSM 1338 / JCM 2805 / NCIMB 9133 / AM1) folK gene Proteins 0.000 claims description 5
- 101100353043 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) ppm1 gene Proteins 0.000 claims description 5
- 101000967356 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) Fatty-acid O-methyltransferase Proteins 0.000 claims description 5
- 101100399552 Neisseria meningitidis serogroup B (strain MC58) lolD gene Proteins 0.000 claims description 5
- 241001195348 Nusa Species 0.000 claims description 5
- 108010049395 Prokaryotic Initiation Factor-2 Proteins 0.000 claims description 5
- 101000728677 Pseudomonas sp Bifunctional aspartate aminotransferase and L-aspartate beta-decarboxylase Proteins 0.000 claims description 5
- 101150078442 RPL5 gene Proteins 0.000 claims description 5
- 101100508762 Rattus norvegicus Impa1 gene Proteins 0.000 claims description 5
- 101100066772 Rhodobacter capsulatus (strain ATCC BAA-309 / NBRC 16581 / SB1003) nifF gene Proteins 0.000 claims description 5
- 101100418717 Rhodobacter capsulatus (strain ATCC BAA-309 / NBRC 16581 / SB1003) rbsR gene Proteins 0.000 claims description 5
- 101100423624 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) leuS2 gene Proteins 0.000 claims description 5
- 101100540701 Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720) waaK gene Proteins 0.000 claims description 5
- 101100052502 Shigella flexneri yciB gene Proteins 0.000 claims description 5
- 101100443856 Streptococcus pyogenes serotype M18 (strain MGAS8232) polC gene Proteins 0.000 claims description 5
- 101100278777 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) dxs1 gene Proteins 0.000 claims description 5
- 101100010154 Streptomyces ribosidificus rbmA gene Proteins 0.000 claims description 5
- 101100063936 Streptomyces ribosidificus rbmC gene Proteins 0.000 claims description 5
- 101100147268 Symbiobacterium thermophilum (strain T / IAM 14863) rpsD1 gene Proteins 0.000 claims description 5
- 101100111814 Thermococcus kodakarensis (strain ATCC BAA-918 / JCM 12380 / KOD1) suhB gene Proteins 0.000 claims description 5
- 101100361105 Treponema pallidum (strain Nichols) rodA gene Proteins 0.000 claims description 5
- 241000700605 Viruses Species 0.000 claims description 5
- 101150046124 accA gene Proteins 0.000 claims description 5
- 101150014732 asnS gene Proteins 0.000 claims description 5
- 101150057035 bamD gene Proteins 0.000 claims description 5
- 101150005346 coaBC gene Proteins 0.000 claims description 5
- 101150102170 coaD gene Proteins 0.000 claims description 5
- 101150000622 csrA gene Proteins 0.000 claims description 5
- 101150064923 dapD gene Proteins 0.000 claims description 5
- 101150076598 dnaB gene Proteins 0.000 claims description 5
- 101150014291 dnaC gene Proteins 0.000 claims description 5
- 101150008507 dnaE gene Proteins 0.000 claims description 5
- 101150035285 dnaE1 gene Proteins 0.000 claims description 5
- 101150003155 dnaG gene Proteins 0.000 claims description 5
- 101150016422 dnaX gene Proteins 0.000 claims description 5
- 101150118992 dxr gene Proteins 0.000 claims description 5
- 101150056470 dxs gene Proteins 0.000 claims description 5
- 101150107963 eno gene Proteins 0.000 claims description 5
- 101150099753 entD gene Proteins 0.000 claims description 5
- 101150019247 fldA gene Proteins 0.000 claims description 5
- 101150064419 folA gene Proteins 0.000 claims description 5
- 101150095307 folK gene Proteins 0.000 claims description 5
- 101150105698 ftsE gene Proteins 0.000 claims description 5
- 101150054895 ftsH gene Proteins 0.000 claims description 5
- 101150005487 ftsI gene Proteins 0.000 claims description 5
- 101150069904 ftsN gene Proteins 0.000 claims description 5
- 101150098503 ftsX gene Proteins 0.000 claims description 5
- 101150117187 glmS gene Proteins 0.000 claims description 5
- 101150111330 glmU gene Proteins 0.000 claims description 5
- 101150024902 glnS gene Proteins 0.000 claims description 5
- 101150070420 gyrA gene Proteins 0.000 claims description 5
- 101150107144 hemC gene Proteins 0.000 claims description 5
- 101150050618 hemD gene Proteins 0.000 claims description 5
- 101150083586 hemL gene Proteins 0.000 claims description 5
- 101150036807 hemL1 gene Proteins 0.000 claims description 5
- 101150068015 holB gene Proteins 0.000 claims description 5
- 101150064873 ispA gene Proteins 0.000 claims description 5
- 101150068863 ispE gene Proteins 0.000 claims description 5
- 101150017044 ispH gene Proteins 0.000 claims description 5
- 101150049174 kdsA gene Proteins 0.000 claims description 5
- 101150098537 kdsB gene Proteins 0.000 claims description 5
- 101150021684 leuS gene Proteins 0.000 claims description 5
- 101150030499 lnt gene Proteins 0.000 claims description 5
- 101150052914 lolA gene Proteins 0.000 claims description 5
- 101150114977 lolB gene Proteins 0.000 claims description 5
- 101150058349 lolC gene Proteins 0.000 claims description 5
- 101150090708 lolD gene Proteins 0.000 claims description 5
- 101150009359 lptD gene Proteins 0.000 claims description 5
- 101150033242 lpxC gene Proteins 0.000 claims description 5
- 101150054032 lspA gene Proteins 0.000 claims description 5
- 101150106833 metG gene Proteins 0.000 claims description 5
- 101150062025 metG1 gene Proteins 0.000 claims description 5
- 101150095438 metK gene Proteins 0.000 claims description 5
- 101150001852 mrdB gene Proteins 0.000 claims description 5
- 101150092863 mreC gene Proteins 0.000 claims description 5
- 101150030423 mreD gene Proteins 0.000 claims description 5
- 101150067482 msbA gene Proteins 0.000 claims description 5
- 101150068440 msrB gene Proteins 0.000 claims description 5
- 101150095093 murB gene Proteins 0.000 claims description 5
- 101150047269 murI gene Proteins 0.000 claims description 5
- 101150101723 nrdA gene Proteins 0.000 claims description 5
- 101150073438 nusA gene Proteins 0.000 claims description 5
- 101150063790 orn gene Proteins 0.000 claims description 5
- 101150060462 pbpB gene Proteins 0.000 claims description 5
- 101150057826 plsC gene Proteins 0.000 claims description 5
- 101150043065 prmC gene Proteins 0.000 claims description 5
- 101150108007 prs gene Proteins 0.000 claims description 5
- 101150086435 prs1 gene Proteins 0.000 claims description 5
- 101150070305 prsA gene Proteins 0.000 claims description 5
- 101150005327 pssA gene Proteins 0.000 claims description 5
- 101150054232 pyrG gene Proteins 0.000 claims description 5
- 101150006862 pyrH gene Proteins 0.000 claims description 5
- 101150060382 ribC gene Proteins 0.000 claims description 5
- 101150003625 ribD gene Proteins 0.000 claims description 5
- 101150051820 ribH gene Proteins 0.000 claims description 5
- 101150088248 ribH1 gene Proteins 0.000 claims description 5
- 108010037379 ribosome releasing factor Proteins 0.000 claims description 5
- 101150091119 rpl18a gene Proteins 0.000 claims description 5
- 101150043079 rpl22 gene Proteins 0.000 claims description 5
- 101150083684 rplE gene Proteins 0.000 claims description 5
- 101150053568 rplP gene Proteins 0.000 claims description 5
- 101150003798 rplQ gene Proteins 0.000 claims description 5
- 101150001987 rplS gene Proteins 0.000 claims description 5
- 101150070580 rplV gene Proteins 0.000 claims description 5
- 101150075881 rplX gene Proteins 0.000 claims description 5
- 101150040440 rpmB gene Proteins 0.000 claims description 5
- 101150081398 rpmB1 gene Proteins 0.000 claims description 5
- 101150110282 rpmC gene Proteins 0.000 claims description 5
- 101150034869 rpo5 gene Proteins 0.000 claims description 5
- 101150106872 rpoH gene Proteins 0.000 claims description 5
- 101150063255 rps17 gene Proteins 0.000 claims description 5
- 101150008822 rpsA gene Proteins 0.000 claims description 5
- 101150078369 rpsB gene Proteins 0.000 claims description 5
- 101150018028 rpsC gene Proteins 0.000 claims description 5
- 101150087540 rpsD gene Proteins 0.000 claims description 5
- 101150114376 rpsD2 gene Proteins 0.000 claims description 5
- 101150094975 rpsH gene Proteins 0.000 claims description 5
- 101150039612 rpsK gene Proteins 0.000 claims description 5
- 101150049069 rpsM gene Proteins 0.000 claims description 5
- 101150107339 rpsN gene Proteins 0.000 claims description 5
- 101150116648 rpsP gene Proteins 0.000 claims description 5
- 101150052647 rpsQ gene Proteins 0.000 claims description 5
- 101150006569 rpsR gene Proteins 0.000 claims description 5
- 101150029588 rpsR1 gene Proteins 0.000 claims description 5
- 101150061587 rpsS gene Proteins 0.000 claims description 5
- 101150028844 rpsZ gene Proteins 0.000 claims description 5
- 101150061025 rseP gene Proteins 0.000 claims description 5
- 101150114545 secE gene Proteins 0.000 claims description 5
- 101150065339 secF gene Proteins 0.000 claims description 5
- 101150017268 secM gene Proteins 0.000 claims description 5
- 101150059374 secY gene Proteins 0.000 claims description 5
- 101150051721 serS gene Proteins 0.000 claims description 5
- 101150032811 suhB gene Proteins 0.000 claims description 5
- 101150017221 tdcF gene Proteins 0.000 claims description 5
- 101150046628 thrS gene Proteins 0.000 claims description 5
- 101150031421 thrS-cat gene Proteins 0.000 claims description 5
- 101150037435 tnaB gene Proteins 0.000 claims description 5
- 101150003415 trmD gene Proteins 0.000 claims description 5
- 101150064364 tsaE gene Proteins 0.000 claims description 5
- 101150033948 tsf gene Proteins 0.000 claims description 5
- 101150027375 virA gene Proteins 0.000 claims description 5
- 101150040194 waaA gene Proteins 0.000 claims description 5
- 101150068841 wzyE gene Proteins 0.000 claims description 5
- 101150074744 yabQ gene Proteins 0.000 claims description 5
- 101150091860 yqgF gene Proteins 0.000 claims description 5
- 101150029344 yrfF gene Proteins 0.000 claims description 5
- XOOUIPVCVHRTMJ-UHFFFAOYSA-L zinc stearate Chemical compound [Zn+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O XOOUIPVCVHRTMJ-UHFFFAOYSA-L 0.000 claims description 5
- 101150096853 zipA gene Proteins 0.000 claims description 5
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 claims description 4
- 101100152417 Bacillus spizizenii (strain ATCC 23059 / NRRL B-14472 / W23) tarI gene Proteins 0.000 claims description 4
- 101100000756 Bacillus subtilis (strain 168) acpA gene Proteins 0.000 claims description 4
- 101100488070 Bacillus subtilis (strain 168) bsdC gene Proteins 0.000 claims description 4
- 101100113088 Bacillus subtilis (strain 168) cgoX gene Proteins 0.000 claims description 4
- 101100221728 Bacillus subtilis (strain 168) coxA gene Proteins 0.000 claims description 4
- 101100239088 Bacillus subtilis (strain 168) murAA gene Proteins 0.000 claims description 4
- 101100131847 Bacillus subtilis (strain 168) murAB gene Proteins 0.000 claims description 4
- 101100096170 Bacillus subtilis (strain 168) sodA gene Proteins 0.000 claims description 4
- 101100518072 Brucella suis biovar 1 (strain 1330) obg gene Proteins 0.000 claims description 4
- 101100423897 Clostridium perfringens (strain 13 / Type A) glnS gene Proteins 0.000 claims description 4
- 101150040913 DUT gene Proteins 0.000 claims description 4
- 101100038183 Dictyostelium discoideum polr2a gene Proteins 0.000 claims description 4
- 101100409079 Dictyostelium discoideum ppox gene Proteins 0.000 claims description 4
- 101100465553 Dictyostelium discoideum psmB6 gene Proteins 0.000 claims description 4
- 101100425816 Dictyostelium discoideum top2mt gene Proteins 0.000 claims description 4
- 101100383780 Escherichia coli (strain K12) chpS gene Proteins 0.000 claims description 4
- 101100445181 Escherichia coli (strain K12) engB gene Proteins 0.000 claims description 4
- 101100343768 Escherichia coli (strain K12) lptA gene Proteins 0.000 claims description 4
- 101100075243 Escherichia coli (strain K12) lptC gene Proteins 0.000 claims description 4
- 101100128674 Escherichia coli (strain K12) lptF gene Proteins 0.000 claims description 4
- 101100184177 Escherichia coli (strain K12) mlaB gene Proteins 0.000 claims description 4
- 101100188475 Escherichia coli (strain K12) obgE gene Proteins 0.000 claims description 4
- 101100086120 Escherichia coli (strain K12) yhhQ gene Proteins 0.000 claims description 4
- 101100544844 Escherichia coli (strain K12) yqgD gene Proteins 0.000 claims description 4
- 101100443653 Haloferax volcanii (strain ATCC 29605 / DSM 3757 / JCM 8879 / NBRC 14742 / NCIMB 2012 / VKM B-1768 / DS2) lig gene Proteins 0.000 claims description 4
- 101100010081 Haloferax volcanii (strain ATCC 29605 / DSM 3757 / JCM 8879 / NBRC 14742 / NCIMB 2012 / VKM B-1768 / DS2) ligN gene Proteins 0.000 claims description 4
- 101000937642 Homo sapiens Malonyl-CoA-acyl carrier protein transacylase, mitochondrial Proteins 0.000 claims description 4
- 101100399603 Lactiplantibacillus plantarum (strain ATCC BAA-793 / NCIMB 8826 / WCFS1) lpdC gene Proteins 0.000 claims description 4
- 101100393312 Lactobacillus delbrueckii subsp. bulgaricus (strain ATCC 11842 / DSM 20081 / BCRC 10696 / JCM 1002 / NBRC 13953 / NCIMB 11778 / NCTC 12712 / WDCM 00102 / Lb 14) gpsA1 gene Proteins 0.000 claims description 4
- 101100509110 Leifsonia xyli subsp. xyli (strain CTCB07) ispDF gene Proteins 0.000 claims description 4
- 101100363550 Leptospira borgpetersenii serovar Hardjo-bovis (strain L550) rpsE2 gene Proteins 0.000 claims description 4
- 102100027329 Malonyl-CoA-acyl carrier protein transacylase, mitochondrial Human genes 0.000 claims description 4
- 101100037096 Methanococcus maripaludis (strain S2 / LL) rpl6 gene Proteins 0.000 claims description 4
- 101100254826 Methanopyrus kandleri (strain AV19 / DSM 6324 / JCM 9639 / NBRC 100938) rps5 gene Proteins 0.000 claims description 4
- 101100510108 Mus musculus Guk1 gene Proteins 0.000 claims description 4
- 101100169519 Pyrococcus abyssi (strain GE5 / Orsay) dapAL gene Proteins 0.000 claims description 4
- 101150034081 Rpl18 gene Proteins 0.000 claims description 4
- 101150085962 SPT5 gene Proteins 0.000 claims description 4
- 101100126492 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) ispG1 gene Proteins 0.000 claims description 4
- 101150023061 acpP gene Proteins 0.000 claims description 4
- 101150051130 acpP1 gene Proteins 0.000 claims description 4
- 101150045155 adk gene Proteins 0.000 claims description 4
- 101150065294 adkA gene Proteins 0.000 claims description 4
- 101150106256 bamA gene Proteins 0.000 claims description 4
- 101150082227 bcsB gene Proteins 0.000 claims description 4
- 101150016646 cdsA gene Proteins 0.000 claims description 4
- 101150000386 cpfC gene Proteins 0.000 claims description 4
- 101150011637 cysS gene Proteins 0.000 claims description 4
- 101150011371 dapA gene Proteins 0.000 claims description 4
- 101150073654 dapB gene Proteins 0.000 claims description 4
- 101150000582 dapE gene Proteins 0.000 claims description 4
- 101150083941 degS gene Proteins 0.000 claims description 4
- 101150090981 fabG gene Proteins 0.000 claims description 4
- 101150100150 fabI gene Proteins 0.000 claims description 4
- 101150084167 fabZ gene Proteins 0.000 claims description 4
- 101150031187 fba gene Proteins 0.000 claims description 4
- 101150108901 fbaA gene Proteins 0.000 claims description 4
- 101150073342 folC gene Proteins 0.000 claims description 4
- 101150102318 fre gene Proteins 0.000 claims description 4
- 101150037476 ftsB gene Proteins 0.000 claims description 4
- 101150049376 ftsY gene Proteins 0.000 claims description 4
- 101150103988 gltX gene Proteins 0.000 claims description 4
- 101150055337 glyQ gene Proteins 0.000 claims description 4
- 101150071168 glyQS gene Proteins 0.000 claims description 4
- 101150068008 gmk gene Proteins 0.000 claims description 4
- 101150095733 gpsA gene Proteins 0.000 claims description 4
- 101150006844 groES gene Proteins 0.000 claims description 4
- 101150102931 hemG gene Proteins 0.000 claims description 4
- 101150042363 hemH gene Proteins 0.000 claims description 4
- 101150072694 hisS gene Proteins 0.000 claims description 4
- 101150013339 holA gene Proteins 0.000 claims description 4
- 101150077178 infC gene Proteins 0.000 claims description 4
- 101150000769 ispB gene Proteins 0.000 claims description 4
- 101150014059 ispD gene Proteins 0.000 claims description 4
- 101150022203 ispDF gene Proteins 0.000 claims description 4
- 101150018742 ispF gene Proteins 0.000 claims description 4
- 101150081094 ispG gene Proteins 0.000 claims description 4
- 101150107488 ligA gene Proteins 0.000 claims description 4
- 101150070838 lptE gene Proteins 0.000 claims description 4
- 101150041203 lpxA gene Proteins 0.000 claims description 4
- 101150103033 lpxB gene Proteins 0.000 claims description 4
- 101150093674 lpxD gene Proteins 0.000 claims description 4
- 101150015864 lpxH gene Proteins 0.000 claims description 4
- 101150070011 lpxK gene Proteins 0.000 claims description 4
- 101150068528 mabA gene Proteins 0.000 claims description 4
- 101150103246 mazE gene Proteins 0.000 claims description 4
- 101150064202 mrdA gene Proteins 0.000 claims description 4
- 101150035528 mukB gene Proteins 0.000 claims description 4
- 101150039901 mukF gene Proteins 0.000 claims description 4
- 101150025333 murA gene Proteins 0.000 claims description 4
- 101150023205 murA1 gene Proteins 0.000 claims description 4
- 101150089003 murA2 gene Proteins 0.000 claims description 4
- 101150105645 murJ gene Proteins 0.000 claims description 4
- 101150087368 mviN gene Proteins 0.000 claims description 4
- 101150115599 nusG gene Proteins 0.000 claims description 4
- 101150047627 pgk gene Proteins 0.000 claims description 4
- 101150079312 pgk1 gene Proteins 0.000 claims description 4
- 101150095149 pgkA gene Proteins 0.000 claims description 4
- 101150016769 pheT gene Proteins 0.000 claims description 4
- 101150105758 phnN gene Proteins 0.000 claims description 4
- 101150084911 ribA gene Proteins 0.000 claims description 4
- 101150036579 ribBA gene Proteins 0.000 claims description 4
- 101150015255 rplB gene Proteins 0.000 claims description 4
- 101150028073 rplD gene Proteins 0.000 claims description 4
- 101150034310 rplF gene Proteins 0.000 claims description 4
- 101150037704 rplJ gene Proteins 0.000 claims description 4
- 101150104526 rplM gene Proteins 0.000 claims description 4
- 101150047850 rplN gene Proteins 0.000 claims description 4
- 101150117577 rplO gene Proteins 0.000 claims description 4
- 101150066158 rplR gene Proteins 0.000 claims description 4
- 101150071779 rplT gene Proteins 0.000 claims description 4
- 101150008233 rplU gene Proteins 0.000 claims description 4
- 101150021143 rplW gene Proteins 0.000 claims description 4
- 101150096944 rpmA gene Proteins 0.000 claims description 4
- 101150045855 rpmD gene Proteins 0.000 claims description 4
- 101150047139 rpo1N gene Proteins 0.000 claims description 4
- 101150027173 rpsE gene Proteins 0.000 claims description 4
- 101150030614 rpsI gene Proteins 0.000 claims description 4
- 101150011891 tadA gene Proteins 0.000 claims description 4
- 101150113425 thiL gene Proteins 0.000 claims description 4
- 101150082896 topA gene Proteins 0.000 claims description 4
- 101150059846 trpS gene Proteins 0.000 claims description 4
- 101150004782 trpS2 gene Proteins 0.000 claims description 4
- 101150062288 ubiB gene Proteins 0.000 claims description 4
- 101150085844 ubiD gene Proteins 0.000 claims description 4
- 101150099114 ubiJ gene Proteins 0.000 claims description 4
- 101150112181 valS gene Proteins 0.000 claims description 4
- ACWBQPMHZXGDFX-QFIPXVFZSA-N valsartan Chemical compound C1=CC(CN(C(=O)CCCC)[C@@H](C(C)C)C(O)=O)=CC=C1C1=CC=CC=C1C1=NN=NN1 ACWBQPMHZXGDFX-QFIPXVFZSA-N 0.000 claims description 4
- 101150000568 ydiL gene Proteins 0.000 claims description 4
- 101100192284 Bacillus subtilis (strain 168) spoVC gene Proteins 0.000 claims description 3
- 101100173127 Caldanaerobacter subterraneus subsp. tengcongensis (strain DSM 15242 / JCM 11007 / NBRC 100824 / MB4) fabZ gene Proteins 0.000 claims description 3
- 101100062109 Desulfuromonas acetoxidans cyd gene Proteins 0.000 claims description 3
- 101100480329 Enterococcus faecalis (strain TX4000 / JH2-2) tyrS1 gene Proteins 0.000 claims description 3
- 101150039774 GAPA1 gene Proteins 0.000 claims description 3
- 101100508942 Haloferax volcanii (strain ATCC 29605 / DSM 3757 / JCM 8879 / NBRC 14742 / NCIMB 2012 / VKM B-1768 / DS2) ipp gene Proteins 0.000 claims description 3
- 101100327514 Methanosarcina acetivorans (strain ATCC 35395 / DSM 2834 / JCM 12185 / C2A) cfbE gene Proteins 0.000 claims description 3
- 101100227989 Mus musculus Fbxl14 gene Proteins 0.000 claims description 3
- 101100282114 Pseudomonas aeruginosa (strain UCBPP-PA14) gap2 gene Proteins 0.000 claims description 3
- 101100408978 Streptococcus agalactiae serotype V (strain ATCC BAA-611 / 2603 V/R) ppaC gene Proteins 0.000 claims description 3
- 101150027005 divIB gene Proteins 0.000 claims description 3
- 101150078207 fabA gene Proteins 0.000 claims description 3
- 101150015067 fabB gene Proteins 0.000 claims description 3
- 101150101609 ftsA gene Proteins 0.000 claims description 3
- 101150071760 ftsL gene Proteins 0.000 claims description 3
- 101150026421 ftsQ gene Proteins 0.000 claims description 3
- 101150043569 ftsW gene Proteins 0.000 claims description 3
- 101150111615 ftsZ gene Proteins 0.000 claims description 3
- 101150073818 gap gene Proteins 0.000 claims description 3
- 101150091570 gapA gene Proteins 0.000 claims description 3
- 101150074096 mraY gene Proteins 0.000 claims description 3
- 101150034514 murC gene Proteins 0.000 claims description 3
- 101150093075 murD gene Proteins 0.000 claims description 3
- 101150043597 murE gene Proteins 0.000 claims description 3
- 101150102210 murF gene Proteins 0.000 claims description 3
- 101150037968 murG gene Proteins 0.000 claims description 3
- 101150049023 nadE gene Proteins 0.000 claims description 3
- 101150117951 ndd gene Proteins 0.000 claims description 3
- 101150092823 ppa gene Proteins 0.000 claims description 3
- 101150031139 pth gene Proteins 0.000 claims description 3
- 101150101943 tyrS gene Proteins 0.000 claims description 3
- 101150098466 rpsL gene Proteins 0.000 claims 1
- 210000004027 cell Anatomy 0.000 description 150
- 108020004566 Transfer RNA Proteins 0.000 description 95
- 108020004414 DNA Proteins 0.000 description 79
- 239000012634 fragment Substances 0.000 description 74
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 70
- 235000018102 proteins Nutrition 0.000 description 62
- 229940024606 amino acid Drugs 0.000 description 57
- 235000001014 amino acid Nutrition 0.000 description 57
- 239000013612 plasmid Substances 0.000 description 47
- 150000007523 nucleic acids Chemical class 0.000 description 38
- 108091033409 CRISPR Proteins 0.000 description 36
- 125000006850 spacer group Chemical group 0.000 description 35
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 30
- 108700026244 Open Reading Frames Proteins 0.000 description 30
- 102000039446 nucleic acids Human genes 0.000 description 25
- 108020004707 nucleic acids Proteins 0.000 description 25
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 description 24
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 description 24
- 239000004098 Tetracycline Substances 0.000 description 23
- 239000002609 medium Substances 0.000 description 23
- 229960002180 tetracycline Drugs 0.000 description 23
- 229930101283 tetracycline Natural products 0.000 description 23
- 235000019364 tetracycline Nutrition 0.000 description 23
- 150000003522 tetracyclines Chemical class 0.000 description 23
- 239000000047 product Substances 0.000 description 22
- 230000006835 compression Effects 0.000 description 21
- 238000007906 compression Methods 0.000 description 21
- 241000894006 Bacteria Species 0.000 description 20
- 238000013461 design Methods 0.000 description 20
- 125000001314 canonical amino-acid group Chemical group 0.000 description 19
- 230000005017 genetic modification Effects 0.000 description 19
- 235000013617 genetically modified food Nutrition 0.000 description 19
- 230000035772 mutation Effects 0.000 description 18
- 230000010076 replication Effects 0.000 description 18
- 101150031737 yceQ gene Proteins 0.000 description 18
- 230000014616 translation Effects 0.000 description 17
- 238000002744 homologous recombination Methods 0.000 description 16
- 238000010354 CRISPR gene editing Methods 0.000 description 14
- 230000006801 homologous recombination Effects 0.000 description 14
- 229960001153 serine Drugs 0.000 description 14
- 235000004400 serine Nutrition 0.000 description 14
- 101100375584 Escherichia coli (strain K12) yaaY gene Proteins 0.000 description 13
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 13
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 13
- 239000008103 glucose Substances 0.000 description 13
- 238000013519 translation Methods 0.000 description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 description 11
- 238000002474 experimental method Methods 0.000 description 11
- 230000012010 growth Effects 0.000 description 10
- 238000012163 sequencing technique Methods 0.000 description 10
- 239000006142 Luria-Bertani Agar Substances 0.000 description 9
- 229960005091 chloramphenicol Drugs 0.000 description 9
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 9
- 229930027917 kanamycin Natural products 0.000 description 9
- 229960000318 kanamycin Drugs 0.000 description 9
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 9
- 229930182823 kanamycin A Natural products 0.000 description 9
- 230000007246 mechanism Effects 0.000 description 9
- 239000002773 nucleotide Substances 0.000 description 9
- 125000003729 nucleotide group Chemical group 0.000 description 9
- 239000013615 primer Substances 0.000 description 9
- 230000001105 regulatory effect Effects 0.000 description 9
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 8
- 229930182566 Gentamicin Natural products 0.000 description 8
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 8
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 8
- 229960003767 alanine Drugs 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 229960002518 gentamicin Drugs 0.000 description 8
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 230000010354 integration Effects 0.000 description 8
- 208000024191 minimally invasive lung adenocarcinoma Diseases 0.000 description 8
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 8
- 241001515965 unidentified phage Species 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 7
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 7
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 7
- 238000013459 approach Methods 0.000 description 7
- 238000009709 capacitor discharge sintering Methods 0.000 description 7
- 238000003776 cleavage reaction Methods 0.000 description 7
- 238000010362 genome editing Methods 0.000 description 7
- 238000010348 incorporation Methods 0.000 description 7
- 229960003136 leucine Drugs 0.000 description 7
- 238000007481 next generation sequencing Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 101150025220 sacB gene Proteins 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 229960005322 streptomycin Drugs 0.000 description 7
- 230000001225 therapeutic effect Effects 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- 108020005098 Anticodon Proteins 0.000 description 6
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 6
- 108010026552 Proteome Proteins 0.000 description 6
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 6
- 235000004279 alanine Nutrition 0.000 description 6
- 239000003242 anti bacterial agent Substances 0.000 description 6
- 230000000977 initiatory effect Effects 0.000 description 6
- 235000005772 leucine Nutrition 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 108020003589 5' Untranslated Regions Proteins 0.000 description 5
- 229920001817 Agar Polymers 0.000 description 5
- NIGWMJHCCYYCSF-UHFFFAOYSA-N Fenclonine Chemical compound OC(=O)C(N)CC1=CC=C(Cl)C=C1 NIGWMJHCCYYCSF-UHFFFAOYSA-N 0.000 description 5
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 5
- 239000008272 agar Substances 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 229940088710 antibiotic agent Drugs 0.000 description 5
- 239000000499 gel Substances 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 238000007480 sanger sequencing Methods 0.000 description 5
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 4
- 108700005081 Overlapping Genes Proteins 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 4
- 108091028113 Trans-activating crRNA Proteins 0.000 description 4
- 229960000723 ampicillin Drugs 0.000 description 4
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 4
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 230000005782 double-strand break Effects 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 4
- 238000005192 partition Methods 0.000 description 4
- 230000009145 protein modification Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 239000005720 sucrose Substances 0.000 description 4
- 231100000331 toxic Toxicity 0.000 description 4
- 230000002588 toxic effect Effects 0.000 description 4
- HNSDLXPSAYFUHK-UHFFFAOYSA-N 1,4-bis(2-ethylhexyl) sulfosuccinate Chemical compound CCCCC(CC)COC(=O)CC(S(O)(=O)=O)C(=O)OCC(CC)CCCC HNSDLXPSAYFUHK-UHFFFAOYSA-N 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 241001591554 Escherichia coli str. K-12 substr. MDS42 Species 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- 241000187654 Nocardia Species 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 3
- 244000057717 Streptococcus lactis Species 0.000 description 3
- 235000014897 Streptococcus lactis Nutrition 0.000 description 3
- 229950006334 apramycin Drugs 0.000 description 3
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 3
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 3
- 239000004202 carbamide Substances 0.000 description 3
- 235000013877 carbamide Nutrition 0.000 description 3
- 230000032823 cell division Effects 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 210000003705 ribosome Anatomy 0.000 description 3
- 238000013207 serial dilution Methods 0.000 description 3
- 239000013605 shuttle vector Substances 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- OJHZNMVJJKMFGX-RNWHKREASA-N (4r,4ar,7ar,12bs)-9-methoxy-3-methyl-1,2,4,4a,5,6,7a,13-octahydro-4,12-methanobenzofuro[3,2-e]isoquinoline-7-one;2,3-dihydroxybutanedioic acid Chemical compound OC(=O)C(O)C(O)C(O)=O.O=C([C@@H]1O2)CC[C@H]3[C@]4([H])N(C)CC[C@]13C1=C2C(OC)=CC=C1C4 OJHZNMVJJKMFGX-RNWHKREASA-N 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- QZDDFQLIQRYMBV-UHFFFAOYSA-N 2-[3-nitro-2-(2-nitrophenyl)-4-oxochromen-8-yl]acetic acid Chemical compound OC(=O)CC1=CC=CC(C(C=2[N+]([O-])=O)=O)=C1OC=2C1=CC=CC=C1[N+]([O-])=O QZDDFQLIQRYMBV-UHFFFAOYSA-N 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 2
- 229910000013 Ammonium bicarbonate Inorganic materials 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 2
- 101100378010 Bacillus subtilis (strain 168) accC1 gene Proteins 0.000 description 2
- 101100322122 Bacillus subtilis (strain 168) accC2 gene Proteins 0.000 description 2
- 101100059000 Bacillus subtilis (strain 168) capA gene Proteins 0.000 description 2
- 101100170098 Bacillus subtilis (strain 168) defA gene Proteins 0.000 description 2
- 241000193764 Brevibacillus brevis Species 0.000 description 2
- 101100499417 Chlamydia pneumoniae dnaA1 gene Proteins 0.000 description 2
- 241000186031 Corynebacteriaceae Species 0.000 description 2
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 2
- 241000186226 Corynebacterium glutamicum Species 0.000 description 2
- 108010041052 DNA Topoisomerase IV Proteins 0.000 description 2
- 239000003155 DNA primer Substances 0.000 description 2
- 101100070376 Dictyostelium discoideum alad gene Proteins 0.000 description 2
- 101100098219 Dictyostelium discoideum argS1 gene Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 101100289348 Epichloe uncinata lolE1 gene Proteins 0.000 description 2
- 101100289349 Epichloe uncinata lolE2 gene Proteins 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 101100024149 Escherichia coli (strain K12) mqsA gene Proteins 0.000 description 2
- 101100538646 Escherichia coli (strain K12) tsaC gene Proteins 0.000 description 2
- 101100544116 Escherichia coli (strain K12) yghX gene Proteins 0.000 description 2
- 101100324575 Escherichia coli O78:H11 (strain H10407 / ETEC) gspS2 gene Proteins 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 244000199866 Lactobacillus casei Species 0.000 description 2
- 235000013958 Lactobacillus casei Nutrition 0.000 description 2
- 241000186606 Lactobacillus gasseri Species 0.000 description 2
- 241000186604 Lactobacillus reuteri Species 0.000 description 2
- 101100508198 Leptospira borgpetersenii serovar Hardjo-bovis (strain L550) infA2 gene Proteins 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 101100083407 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) pgsA1 gene Proteins 0.000 description 2
- 241000204031 Mycoplasma Species 0.000 description 2
- 241000204051 Mycoplasma genitalium Species 0.000 description 2
- 102000010562 Peptide Elongation Factor G Human genes 0.000 description 2
- 108010077742 Peptide Elongation Factor G Proteins 0.000 description 2
- 241000589540 Pseudomonas fluorescens Species 0.000 description 2
- 101100235354 Pseudomonas putida (strain ATCC 47054 / DSM 6125 / CFBP 8728 / NCIMB 11950 / KT2440) lexA1 gene Proteins 0.000 description 2
- 101150033071 RPO7 gene Proteins 0.000 description 2
- 101150102982 RpS10 gene Proteins 0.000 description 2
- 241000490596 Shewanella sp. Species 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 101100095302 Streptococcus gordonii secA1 gene Proteins 0.000 description 2
- 241000187747 Streptomyces Species 0.000 description 2
- 241001655322 Streptomycetales Species 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 101150084570 UTP25 gene Proteins 0.000 description 2
- 101150013885 accB gene Proteins 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 125000003275 alpha amino acid group Chemical group 0.000 description 2
- 230000006229 amino acid addition Effects 0.000 description 2
- 235000012538 ammonium bicarbonate Nutrition 0.000 description 2
- 239000001099 ammonium carbonate Substances 0.000 description 2
- XZNUGFQTQHRASN-XQENGBIVSA-N apramycin Chemical compound O([C@H]1O[C@@H]2[C@H](O)[C@@H]([C@H](O[C@H]2C[C@H]1N)O[C@@H]1[C@@H]([C@@H](O)[C@H](N)[C@@H](CO)O1)O)NC)[C@@H]1[C@@H](N)C[C@@H](N)[C@H](O)[C@H]1O XZNUGFQTQHRASN-XQENGBIVSA-N 0.000 description 2
- 101150024756 argS gene Proteins 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 101150079521 aspS gene Proteins 0.000 description 2
- 229920001222 biopolymer Polymers 0.000 description 2
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 101150085662 cydA gene Proteins 0.000 description 2
- 101150080183 cydC gene Proteins 0.000 description 2
- 230000001086 cytosolic effect Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 101150060629 def gene Proteins 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 101150020338 dnaA gene Proteins 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 101150112623 hemA gene Proteins 0.000 description 2
- 101150055960 hemB gene Proteins 0.000 description 2
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 2
- 229940097277 hygromycin b Drugs 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 101150071451 infA gene Proteins 0.000 description 2
- 238000005040 ion trap Methods 0.000 description 2
- 239000004310 lactic acid Substances 0.000 description 2
- 235000014655 lactic acid Nutrition 0.000 description 2
- 229940017800 lactobacillus casei Drugs 0.000 description 2
- 229940001882 lactobacillus reuteri Drugs 0.000 description 2
- 101150002823 lepB gene Proteins 0.000 description 2
- 101150047523 lexA gene Proteins 0.000 description 2
- 101150034005 lolE gene Proteins 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 101150035917 mreB gene Proteins 0.000 description 2
- 231100000252 nontoxic Toxicity 0.000 description 2
- 230000003000 nontoxic effect Effects 0.000 description 2
- 101150076330 pgsA gene Proteins 0.000 description 2
- 230000000243 photosynthetic effect Effects 0.000 description 2
- 101150112552 plsB gene Proteins 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 101150003695 proS gene Proteins 0.000 description 2
- 238000001243 protein synthesis Methods 0.000 description 2
- 230000002797 proteolythic effect Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000002271 resection Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 101150005793 ribB gene Proteins 0.000 description 2
- 101150079036 rnc gene Proteins 0.000 description 2
- 101150051303 rnpA gene Proteins 0.000 description 2
- 101150040886 rpoE gene Proteins 0.000 description 2
- 101150036132 rpsG gene Proteins 0.000 description 2
- 101150103887 rpsJ gene Proteins 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 101150108659 secA gene Proteins 0.000 description 2
- 101150055937 secD gene Proteins 0.000 description 2
- 101150077142 sigH gene Proteins 0.000 description 2
- 230000037432 silent mutation Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000008093 supporting effect Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 101150072126 tilS gene Proteins 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 101150007324 ubiA gene Proteins 0.000 description 2
- 101150071657 yafF gene Proteins 0.000 description 2
- FXTLFZWJXBBXGX-QMMMGPOBSA-N (2R)-2-anilino-3-selanylpropanoic acid Chemical compound OC(=O)[C@H](C[SeH])NC1=CC=CC=C1 FXTLFZWJXBBXGX-QMMMGPOBSA-N 0.000 description 1
- YMBQDEOCKOLCJG-AXDSSHIGSA-N (2S)-2-amino-6-[(2-methylcycloprop-2-en-1-yl)methoxycarbonylamino]hexanoic acid Chemical compound CC1=CC1COC(=O)NCCCC[C@H](N)C(O)=O YMBQDEOCKOLCJG-AXDSSHIGSA-N 0.000 description 1
- DOCYTUNUHIGJTI-QMMMGPOBSA-N (2r)-2-[(2-nitrophenyl)methylamino]-3-sulfanylpropanoic acid Chemical compound OC(=O)[C@H](CS)NCC1=CC=CC=C1[N+]([O-])=O DOCYTUNUHIGJTI-QMMMGPOBSA-N 0.000 description 1
- VKBLQCDGTHFOLS-NSHDSACASA-N (2s)-2-(4-benzoylanilino)propanoic acid Chemical compound C1=CC(N[C@@H](C)C(O)=O)=CC=C1C(=O)C1=CC=CC=C1 VKBLQCDGTHFOLS-NSHDSACASA-N 0.000 description 1
- CRTOKRWMAPBEKF-AWEZNQCLSA-N (2s)-2-(benzylamino)-3-(4-hydroxy-2-nitrophenyl)propanoic acid Chemical compound C([C@@H](C(=O)O)NCC=1C=CC=CC=1)C1=CC=C(O)C=C1[N+]([O-])=O CRTOKRWMAPBEKF-AWEZNQCLSA-N 0.000 description 1
- FVQDAMVODWHNOJ-VIFPVBQESA-N (2s)-2-(carboxymethylamino)-3-phenylpropanoic acid Chemical compound OC(=O)CN[C@H](C(O)=O)CC1=CC=CC=C1 FVQDAMVODWHNOJ-VIFPVBQESA-N 0.000 description 1
- XCKUCSJNPYTMAE-QMMMGPOBSA-N (2s)-2-(chloroamino)-3-phenylpropanoic acid Chemical compound OC(=O)[C@@H](NCl)CC1=CC=CC=C1 XCKUCSJNPYTMAE-QMMMGPOBSA-N 0.000 description 1
- ONLQWUTVKUBXQR-QMMMGPOBSA-N (2s)-2-[(4,5-dimethoxy-2-nitrophenyl)methylamino]-3-hydroxypropanoic acid Chemical compound COC1=CC(CN[C@@H](CO)C(O)=O)=C([N+]([O-])=O)C=C1OC ONLQWUTVKUBXQR-QMMMGPOBSA-N 0.000 description 1
- JCIYZTBXUJCAMW-JTQLQIEISA-N (2s)-2-[[5-(dimethylamino)naphthalen-1-yl]sulfonylamino]propanoic acid Chemical compound C1=CC=C2C(S(=O)(=O)N[C@@H](C)C(O)=O)=CC=CC2=C1N(C)C JCIYZTBXUJCAMW-JTQLQIEISA-N 0.000 description 1
- POGSZHUEECCEAP-ZETCQYMHSA-N (2s)-2-amino-3-(3-amino-4-hydroxyphenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(N)=C1 POGSZHUEECCEAP-ZETCQYMHSA-N 0.000 description 1
- ZHUOMTMPTNZOJE-VIFPVBQESA-N (2s)-2-amino-3-(3-cyanophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC(C#N)=C1 ZHUOMTMPTNZOJE-VIFPVBQESA-N 0.000 description 1
- PEMUHKUIQHFMTH-QMMMGPOBSA-N (2s)-2-amino-3-(4-bromophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(Br)C=C1 PEMUHKUIQHFMTH-QMMMGPOBSA-N 0.000 description 1
- KWIPUXXIFQQMKN-VIFPVBQESA-N (2s)-2-amino-3-(4-cyanophenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(C#N)C=C1 KWIPUXXIFQQMKN-VIFPVBQESA-N 0.000 description 1
- JSXMFBNJRFXRCX-NSHDSACASA-N (2s)-2-amino-3-(4-prop-2-ynoxyphenyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(OCC#C)C=C1 JSXMFBNJRFXRCX-NSHDSACASA-N 0.000 description 1
- SDZGVFSSLGTJAJ-ZETCQYMHSA-N (2s)-2-azaniumyl-3-(2-nitrophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1[N+]([O-])=O SDZGVFSSLGTJAJ-ZETCQYMHSA-N 0.000 description 1
- NEMHIKRLROONTL-QMMMGPOBSA-N (2s)-2-azaniumyl-3-(4-azidophenyl)propanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N=[N+]=[N-])C=C1 NEMHIKRLROONTL-QMMMGPOBSA-N 0.000 description 1
- CYHRSNOITZHLJN-NSHDSACASA-N (2s)-2-azaniumyl-3-(4-propan-2-ylphenyl)propanoate Chemical compound CC(C)C1=CC=C(C[C@H](N)C(O)=O)C=C1 CYHRSNOITZHLJN-NSHDSACASA-N 0.000 description 1
- IBCKYXVMEMSMQM-JTQLQIEISA-N (2s)-3-(3-acetylphenyl)-2-aminopropanoic acid Chemical compound CC(=O)C1=CC=CC(C[C@H](N)C(O)=O)=C1 IBCKYXVMEMSMQM-JTQLQIEISA-N 0.000 description 1
- ZXSBHXZKWRIEIA-JTQLQIEISA-N (2s)-3-(4-acetylphenyl)-2-azaniumylpropanoate Chemical compound CC(=O)C1=CC=C(C[C@H](N)C(O)=O)C=C1 ZXSBHXZKWRIEIA-JTQLQIEISA-N 0.000 description 1
- QHGDJQUCSGUYMF-QMMMGPOBSA-N (2s)-3-hydroxy-2-[(2-nitrophenyl)methylamino]propanoic acid Chemical compound OC[C@@H](C(O)=O)NCC1=CC=CC=C1[N+]([O-])=O QHGDJQUCSGUYMF-QMMMGPOBSA-N 0.000 description 1
- OJTJKAUNOLVMDX-LBPRGKRZSA-N (2s)-6-amino-2-(phenylmethoxycarbonylamino)hexanoic acid Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)OCC1=CC=CC=C1 OJTJKAUNOLVMDX-LBPRGKRZSA-N 0.000 description 1
- DQUHYEDEGRNAFO-QMMMGPOBSA-N (2s)-6-amino-2-[(2-methylpropan-2-yl)oxycarbonylamino]hexanoic acid Chemical compound CC(C)(C)OC(=O)N[C@H](C(O)=O)CCCCN DQUHYEDEGRNAFO-QMMMGPOBSA-N 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- PWKSKIMOESPYIA-UHFFFAOYSA-N 2-acetamido-3-sulfanylpropanoic acid Chemical compound CC(=O)NC(CS)C(O)=O PWKSKIMOESPYIA-UHFFFAOYSA-N 0.000 description 1
- QDGAVODICPCDMU-UHFFFAOYSA-N 2-amino-3-[3-[bis(2-chloroethyl)amino]phenyl]propanoic acid Chemical compound OC(=O)C(N)CC1=CC=CC(N(CCCl)CCCl)=C1 QDGAVODICPCDMU-UHFFFAOYSA-N 0.000 description 1
- JINGUCXQUOKWKH-UHFFFAOYSA-N 2-aminodecanoic acid Chemical compound CCCCCCCCC(N)C(O)=O JINGUCXQUOKWKH-UHFFFAOYSA-N 0.000 description 1
- AKVBCGQVQXPRLD-UHFFFAOYSA-N 2-aminooctanoic acid Chemical compound CCCCCCC(N)C(O)=O AKVBCGQVQXPRLD-UHFFFAOYSA-N 0.000 description 1
- JVPFOKXICYJJSC-UHFFFAOYSA-N 2-azaniumylnonanoate Chemical compound CCCCCCCC(N)C(O)=O JVPFOKXICYJJSC-UHFFFAOYSA-N 0.000 description 1
- JVGVDSSUAVXRDY-UHFFFAOYSA-N 3-(4-hydroxyphenyl)lactic acid Chemical compound OC(=O)C(O)CC1=CC=C(O)C=C1 JVGVDSSUAVXRDY-UHFFFAOYSA-N 0.000 description 1
- UQTZMGFTRHFAAM-ZETCQYMHSA-N 3-iodo-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(I)=C1 UQTZMGFTRHFAAM-ZETCQYMHSA-N 0.000 description 1
- FBTSQILOGYXGMD-LURJTMIESA-N 3-nitro-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C([N+]([O-])=O)=C1 FBTSQILOGYXGMD-LURJTMIESA-N 0.000 description 1
- 101710171204 30S ribosomal protein S20 Proteins 0.000 description 1
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- CMUHFUGDYMFHEI-QMMMGPOBSA-N 4-amino-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N)C=C1 CMUHFUGDYMFHEI-QMMMGPOBSA-N 0.000 description 1
- XWHHYOYVRVGJJY-UHFFFAOYSA-N 4-fluorophenylalanine Chemical compound OC(=O)C(N)CC1=CC=C(F)C=C1 XWHHYOYVRVGJJY-UHFFFAOYSA-N 0.000 description 1
- PZNQZSRPDOEBMS-QMMMGPOBSA-N 4-iodo-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(I)C=C1 PZNQZSRPDOEBMS-QMMMGPOBSA-N 0.000 description 1
- GTVVZTAFGPQSPC-UHFFFAOYSA-N 4-nitrophenylalanine Chemical compound OC(=O)C(N)CC1=CC=C([N+]([O-])=O)C=C1 GTVVZTAFGPQSPC-UHFFFAOYSA-N 0.000 description 1
- 102220615425 40S ribosomal protein S13_K43R_mutation Human genes 0.000 description 1
- 102100022749 Aminopeptidase N Human genes 0.000 description 1
- 241000187390 Amycolatopsis lactamdurans Species 0.000 description 1
- 241000372033 Andromeda Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 101000666833 Autographa californica nuclear polyhedrosis virus Uncharacterized 20.8 kDa protein in FGF-VUBI intergenic region Proteins 0.000 description 1
- 101000977023 Azospirillum brasilense Uncharacterized 17.8 kDa protein in nodG 5'region Proteins 0.000 description 1
- 101000977027 Azospirillum brasilense Uncharacterized protein in nodG 5'region Proteins 0.000 description 1
- 241000194108 Bacillus licheniformis Species 0.000 description 1
- 241000194107 Bacillus megaterium Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 101000933555 Bacillus subtilis (strain 168) Biofilm-surface layer protein A Proteins 0.000 description 1
- 101100031703 Bacillus subtilis (strain 168) gamP gene Proteins 0.000 description 1
- 101100068894 Bacillus subtilis (strain 168) glvA gene Proteins 0.000 description 1
- 101100432204 Bacillus subtilis (strain 168) yhjQ gene Proteins 0.000 description 1
- 101100106892 Bacillus subtilis (strain 168) ysdC gene Proteins 0.000 description 1
- 101100489185 Bacillus subtilis (strain 168) yugH gene Proteins 0.000 description 1
- 101000962005 Bacillus thuringiensis Uncharacterized 23.6 kDa protein Proteins 0.000 description 1
- 101000961984 Bacillus thuringiensis Uncharacterized 30.3 kDa protein Proteins 0.000 description 1
- 101100263837 Bovine ephemeral fever virus (strain BB7721) beta gene Proteins 0.000 description 1
- 241000186146 Brevibacterium Species 0.000 description 1
- 108010049990 CD13 Antigens Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000010804 Caulobacter vibrioides Species 0.000 description 1
- 241000047960 Chromohalobacter salexigens Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- CKLJMWTZIZZHCS-UHFFFAOYSA-N D-OH-Asp Natural products OC(=O)C(N)CC(O)=O CKLJMWTZIZZHCS-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 1
- OUYCCCASQSFEME-MRVPVSSYSA-N D-tyrosine Chemical compound OC(=O)[C@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-MRVPVSSYSA-N 0.000 description 1
- 229930195709 D-tyrosine Natural products 0.000 description 1
- 101150027068 DEGS1 gene Proteins 0.000 description 1
- 238000007702 DNA assembly Methods 0.000 description 1
- 101710156804 DNA ligase A Proteins 0.000 description 1
- 101100336222 Dictyostelium discoideum gchA gene Proteins 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 101100220202 Drosophila melanogaster Cds gene Proteins 0.000 description 1
- 101000644901 Drosophila melanogaster Putative 115 kDa protein in type-1 retrotransposable element R1DM Proteins 0.000 description 1
- 101000785191 Drosophila melanogaster Uncharacterized 50 kDa protein in type I retrotransposable element R1DM Proteins 0.000 description 1
- 101100120170 Drosophila melanogaster fkh gene Proteins 0.000 description 1
- 101100092061 Drosophila melanogaster rpr gene Proteins 0.000 description 1
- 101000747704 Enterobacteria phage N4 Uncharacterized protein Gp1 Proteins 0.000 description 1
- 101000747702 Enterobacteria phage N4 Uncharacterized protein Gp2 Proteins 0.000 description 1
- 101100316840 Enterobacteria phage P4 Beta gene Proteins 0.000 description 1
- 101000861206 Enterococcus faecalis (strain ATCC 700802 / V583) Uncharacterized protein EF_A0048 Proteins 0.000 description 1
- 101100522299 Escherichia coli (strain K12) agaW gene Proteins 0.000 description 1
- 101100068895 Escherichia coli (strain K12) glvG gene Proteins 0.000 description 1
- 101100375704 Escherichia coli (strain K12) ybbV gene Proteins 0.000 description 1
- 101100266905 Escherichia coli (strain K12) ydeU gene Proteins 0.000 description 1
- 101000769180 Escherichia coli Uncharacterized 11.1 kDa protein Proteins 0.000 description 1
- 101000758599 Escherichia coli Uncharacterized 14.7 kDa protein Proteins 0.000 description 1
- 241001302160 Escherichia coli str. K-12 substr. DH10B Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000206596 Halomonas Species 0.000 description 1
- YZJSUQQZGCHHNQ-UHFFFAOYSA-N Homoglutamine Chemical compound OC(=O)C(N)CCCC(N)=O YZJSUQQZGCHHNQ-UHFFFAOYSA-N 0.000 description 1
- 108091029795 Intergenic region Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-UWTATZPHSA-N L-Alanine Natural products C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-UWTATZPHSA-N L-Aspartic acid Natural products OC(=O)[C@H](N)CC(O)=O CKLJMWTZIZZHCS-UWTATZPHSA-N 0.000 description 1
- WTDRDQBEARUVNC-LURJTMIESA-N L-DOPA Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-LURJTMIESA-N 0.000 description 1
- WTDRDQBEARUVNC-UHFFFAOYSA-N L-Dopa Natural products OC(=O)C(N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-UHFFFAOYSA-N 0.000 description 1
- 235000019766 L-Lysine Nutrition 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 1
- 229930064664 L-arginine Natural products 0.000 description 1
- 235000014852 L-arginine Nutrition 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- 229930182844 L-isoleucine Natural products 0.000 description 1
- 239000004395 L-leucine Substances 0.000 description 1
- 235000019454 L-leucine Nutrition 0.000 description 1
- 229930182821 L-proline Natural products 0.000 description 1
- ZKZBPNGNEQAJSX-REOHCLBHSA-N L-selenocysteine Chemical compound [SeH]C[C@H](N)C(O)=O ZKZBPNGNEQAJSX-REOHCLBHSA-N 0.000 description 1
- 229930182853 L-selenocysteine Natural products 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 240000006024 Lactobacillus plantarum Species 0.000 description 1
- 235000013965 Lactobacillus plantarum Nutrition 0.000 description 1
- 101100227592 Lactococcus lactis subsp. cremoris (strain MG1363) folKE gene Proteins 0.000 description 1
- 101000768930 Lactococcus lactis subsp. cremoris Uncharacterized protein in pepC 5'region Proteins 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 101000976301 Leptospira interrogans Uncharacterized 35 kDa protein in sph 3'region Proteins 0.000 description 1
- 101000976302 Leptospira interrogans Uncharacterized protein in sph 3'region Proteins 0.000 description 1
- 101000778886 Leptospira interrogans serogroup Icterohaemorrhagiae serovar Lai (strain 56601) Uncharacterized protein LA_2151 Proteins 0.000 description 1
- 101100088535 Leptospira interrogans serogroup Icterohaemorrhagiae serovar Lai (strain 56601) rplP gene Proteins 0.000 description 1
- 101001018085 Lysobacter enzymogenes Lysyl endopeptidase Proteins 0.000 description 1
- 101100038261 Methanococcus vannielii (strain ATCC 35089 / DSM 1224 / JCM 13029 / OCM 148 / SB) rpo2C gene Proteins 0.000 description 1
- 101710181812 Methionine aminopeptidase Proteins 0.000 description 1
- 101000768804 Micromonospora olivasterospora Uncharacterized 10.9 kDa protein in fmrO 5'region Proteins 0.000 description 1
- 241001430197 Mollicutes Species 0.000 description 1
- 108010086093 Mung Bean Nuclease Proteins 0.000 description 1
- 101000723939 Mus musculus Transcription factor HIVEP3 Proteins 0.000 description 1
- 241000187480 Mycobacterium smegmatis Species 0.000 description 1
- 241000202936 Mycoplasma mycoides Species 0.000 description 1
- DTERQYGMUDWYAZ-ZETCQYMHSA-N N(6)-acetyl-L-lysine Chemical compound CC(=O)NCCCC[C@H]([NH3+])C([O-])=O DTERQYGMUDWYAZ-ZETCQYMHSA-N 0.000 description 1
- CYZKJBZEIFWZSR-LURJTMIESA-N N(alpha)-methyl-L-histidine Chemical compound CN[C@H](C(O)=O)CC1=CNC=N1 CYZKJBZEIFWZSR-LURJTMIESA-N 0.000 description 1
- 101000658690 Neisseria meningitidis serogroup B Transposase for insertion sequence element IS1106 Proteins 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- CIQHWLTYGMYQQR-QMMMGPOBSA-N O(4')-sulfo-L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(OS(O)(=O)=O)C=C1 CIQHWLTYGMYQQR-QMMMGPOBSA-N 0.000 description 1
- GEYBMYRBIABFTA-VIFPVBQESA-N O-methyl-L-tyrosine Chemical compound COC1=CC=C(C[C@H](N)C(O)=O)C=C1 GEYBMYRBIABFTA-VIFPVBQESA-N 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241001442654 Percnon planissimum Species 0.000 description 1
- 101100145480 Prochlorococcus marinus (strain SARG / CCMP1375 / SS120) rpoC2 gene Proteins 0.000 description 1
- 241000519590 Pseudoalteromonas Species 0.000 description 1
- 241000590028 Pseudoalteromonas haloplanktis Species 0.000 description 1
- 108091008109 Pseudogenes Proteins 0.000 description 1
- 102000057361 Pseudogenes Human genes 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 241000589776 Pseudomonas putida Species 0.000 description 1
- 101000748660 Pseudomonas savastanoi Uncharacterized 21 kDa protein in iaaL 5'region Proteins 0.000 description 1
- 101000584469 Rice tungro bacilliform virus (isolate Philippines) Protein P1 Proteins 0.000 description 1
- 101001121571 Rice tungro bacilliform virus (isolate Philippines) Protein P2 Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 241000607764 Shigella dysenteriae Species 0.000 description 1
- 101000773449 Sinorhizobium fredii (strain NBRC 101917 / NGR234) Uncharacterized HTH-type transcriptional regulator y4sM Proteins 0.000 description 1
- 101000818096 Spirochaeta aurantia Uncharacterized 15.5 kDa protein in trpE 3'region Proteins 0.000 description 1
- 101000818098 Spirochaeta aurantia Uncharacterized protein in trpE 3'region Proteins 0.000 description 1
- 101000766081 Streptomyces ambofaciens Uncharacterized HTH-type transcriptional regulator in unstable DNA locus Proteins 0.000 description 1
- 101001026590 Streptomyces cinnamonensis Putative polyketide beta-ketoacyl synthase 2 Proteins 0.000 description 1
- 241000187392 Streptomyces griseus Species 0.000 description 1
- 101000987243 Streptomyces griseus Probable cadicidin biosynthesis thioesterase Proteins 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 101000804403 Synechococcus elongatus (strain PCC 7942 / FACHB-805) Uncharacterized HIT-like protein Synpcc7942_1390 Proteins 0.000 description 1
- 101000750910 Synechococcus elongatus (strain PCC 7942 / FACHB-805) Uncharacterized HTH-type transcriptional regulator Synpcc7942_2319 Proteins 0.000 description 1
- 101000750896 Synechococcus elongatus (strain PCC 7942 / FACHB-805) Uncharacterized protein Synpcc7942_2318 Proteins 0.000 description 1
- 101000644897 Synechococcus sp. (strain ATCC 27264 / PCC 7002 / PR-6) Uncharacterized protein SYNPCC7002_B0001 Proteins 0.000 description 1
- 241001441724 Tetraodontidae Species 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108010070926 Tripeptide aminopeptidase Proteins 0.000 description 1
- 101000916321 Xenopus laevis Transposon TX1 uncharacterized 149 kDa protein Proteins 0.000 description 1
- 101000916336 Xenopus laevis Transposon TX1 uncharacterized 82 kDa protein Proteins 0.000 description 1
- 101001000760 Zea mays Putative Pol polyprotein from transposon element Bs1 Proteins 0.000 description 1
- 101000760088 Zymomonas mobilis subsp. mobilis (strain ATCC 10988 / DSM 424 / LMG 404 / NCIMB 8938 / NRRL B-806 / ZM1) 20.9 kDa protein Proteins 0.000 description 1
- 101000678262 Zymomonas mobilis subsp. mobilis (strain ATCC 10988 / DSM 424 / LMG 404 / NCIMB 8938 / NRRL B-806 / ZM1) 65 kDa protein Proteins 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 101150061138 acpS gene Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 230000029936 alkylation Effects 0.000 description 1
- 238000005804 alkylation reaction Methods 0.000 description 1
- 125000000266 alpha-aminoacyl group Chemical group 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 229940126575 aminoglycoside Drugs 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 229960005261 aspartic acid Drugs 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 101150063565 bcsQ gene Proteins 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000029918 bioluminescence Effects 0.000 description 1
- 238000005415 bioluminescence Methods 0.000 description 1
- JCZLABDVDPYLRZ-AWEZNQCLSA-N biphenylalanine Chemical compound C1=CC(C[C@H](N)C(O)=O)=CC=C1C1=CC=CC=C1 JCZLABDVDPYLRZ-AWEZNQCLSA-N 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000001925 catabolic effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000001360 collision-induced dissociation Methods 0.000 description 1
- 238000001977 collision-induced dissociation tandem mass spectrometry Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 101150104165 dnaN gene Proteins 0.000 description 1
- 230000029036 donor selection Effects 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 238000000132 electrospray ionisation Methods 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N ferric oxide Chemical compound O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- 101150075316 folE gene Proteins 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 101150034785 gamma gene Proteins 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- 229960002743 glutamine Drugs 0.000 description 1
- 229960002449 glycine Drugs 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 101150053330 grpE gene Proteins 0.000 description 1
- 101150013736 gyrB gene Proteins 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 229960002885 histidine Drugs 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 238000003368 label free method Methods 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 229940072205 lactobacillus plantarum Drugs 0.000 description 1
- 231100001231 less toxic Toxicity 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 229920006008 lipopolysaccharide Polymers 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 230000004777 loss-of-function mutation Effects 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 101150084449 mbiA gene Proteins 0.000 description 1
- 210000005060 membrane bound organelle Anatomy 0.000 description 1
- 238000012269 metabolic engineering Methods 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 101150116543 mrcB gene Proteins 0.000 description 1
- 101150104167 mukE gene Proteins 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 101150111394 nadD gene Proteins 0.000 description 1
- 229920005615 natural polymer Polymers 0.000 description 1
- HYIMSNHJOBLJNT-UHFFFAOYSA-N nifedipine Chemical compound COC(=O)C1=C(C)NC(C)=C(C(=O)OC)C1C1=CC=CC=C1[N+]([O-])=O HYIMSNHJOBLJNT-UHFFFAOYSA-N 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 239000011022 opal Substances 0.000 description 1
- 101150012629 parE gene Proteins 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 101150113162 pbl gene Proteins 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 101150032960 prfB gene Proteins 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 229960002429 proline Drugs 0.000 description 1
- 230000005892 protein maturation Effects 0.000 description 1
- 108040001032 pyrrolysyl-tRNA synthetase activity proteins Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 108090000589 ribonuclease E Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 101150100149 rph gene Proteins 0.000 description 1
- 101150077293 rplC gene Proteins 0.000 description 1
- 101150050931 rplL gene Proteins 0.000 description 1
- 101150109946 rpo1C gene Proteins 0.000 description 1
- 101150085857 rpo2 gene Proteins 0.000 description 1
- 101150090202 rpoB gene Proteins 0.000 description 1
- 101150042391 rpoC gene Proteins 0.000 description 1
- 101150103066 rpoC1 gene Proteins 0.000 description 1
- 101150001070 rpsT gene Proteins 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 150000003355 serines Chemical class 0.000 description 1
- 229940007046 shigella dysenteriae Drugs 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- WPLOVIFNBMNBPD-ATHMIXSHSA-N subtilin Chemical compound CC1SCC(NC2=O)C(=O)NC(CC(N)=O)C(=O)NC(C(=O)NC(CCCCN)C(=O)NC(C(C)CC)C(=O)NC(=C)C(=O)NC(CCCCN)C(O)=O)CSC(C)C2NC(=O)C(CC(C)C)NC(=O)C1NC(=O)C(CCC(N)=O)NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C1NC(=O)C(=C/C)/NC(=O)C(CCC(N)=O)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)CNC(=O)C(NC(=O)C(NC(=O)C2NC(=O)CNC(=O)C3CCCN3C(=O)C(NC(=O)C3NC(=O)C(CC(C)C)NC(=O)C(=C)NC(=O)C(CCC(O)=O)NC(=O)C(NC(=O)C(CCCCN)NC(=O)C(N)CC=4C5=CC=CC=C5NC=4)CSC3)C(C)SC2)C(C)C)C(C)SC1)CC1=CC=CC=C1 WPLOVIFNBMNBPD-ATHMIXSHSA-N 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 238000004885 tandem mass spectrometry Methods 0.000 description 1
- 229960002898 threonine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 102000022575 tripeptide aminopeptidase activity proteins Human genes 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
- 229960004799 tryptophan Drugs 0.000 description 1
- 229960004441 tyrosine Drugs 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 229960004295 valine Drugs 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 101150032601 yejM gene Proteins 0.000 description 1
- 101150107208 ygaY gene Proteins 0.000 description 1
- 101150027861 yidC gene Proteins 0.000 description 1
- JPZXHKDZASGCLU-LBPRGKRZSA-N β-(2-naphthyl)-alanine Chemical compound C1=CC=CC2=CC(C[C@H](N)C(O)=O)=CC=C21 JPZXHKDZASGCLU-LBPRGKRZSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
- C12N15/1031—Mutagenizing nucleic acids mutagenesis by gene assembly, e.g. assembly by oligonucleotide extension PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
- C12N1/205—Bacterial isolates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本発明は、1つ若しくは2つ以上のセンスコドンの5つ若しくは4つ以下の出現を含む合成原核生物ゲノム;及び/又は合成原核生物ゲノムが、親ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の、1つ若しくは2つ以上のセンスコドンの出現を含む、親ゲノムに由来する合成原核生物ゲノム;及び/又は1つ若しくは2つ以上のセンスコドンの出現がない、100個若しくは101個以上、200個若しくは201個以上、又は1000個若しくは1001個以上の遺伝子を含む合成原核生物ゲノム;を提供する。
Description
本発明は、合成ゲノム及びそれを産生する方法に関する。
ゲノムの設計及び合成は、生物学を理解し、改変するための強力なアプローチを提供する。ゲノム合成は代謝工学を加速させる可能性がある。特に、ゲノム合成は、同義コドンの機能を解明し、遺伝的にコードされた非天然ポリマー合成を容易にする可能性がある(Wang, K., et al., 2016. Nature, 539(7627), 59-64)。
標準的な遺伝コードは、61個のセンスコドンを使用して20種のカノニカルアミノ酸をコードし、20種のアミノ酸のうちの18種は、1つより多い同義コドンによってコードされる。自然界は、遺伝子内の各位置において各アミノ酸をコードするために最大で6つまでの同義語から1つのセンスコドンを選択する。同義コドンの選択は、mRNAフォールディング、転写及び翻訳調節配列、翻訳速度、共翻訳フォールディング、タンパク質レベルに影響を及ぼす可能性があり、新たな、未だに理解されていない役割を有する(Wang, K., et al., 2016. Nature, 539(7627), 59-64;及びCambray, G., et al., 2018. Nature biotechnology, 36(10), 1005-1015)。
標的コドンの同義コドンによるゲノムワイド置換(同義コドン圧縮)は、遺伝的にコードされた非カノニカルバイオポリマーのインビボでの生合成を容易にするためにセンスコドンを非カノニカルアミノ酸(又は他のモノマー)に再割当するための基礎を提供することができる(Chin, J.W., 2017. Nature, 550(7674), 53-60)。
部位特異的変異誘発アプローチが、大腸菌(E.coli)ゲノムにおける最大で321個までのアンバー終止コドンを置換するために使用されている(Mukai, T., et al., 2015. Scientific reports, 5, p.9699)。しかしながら、センスコドンは一般に終止コドンより数桁多く、変異誘発よりむしろ、ゲノム合成が、多くの場合においてセンスコドン除去に取り組むのに好ましい手段であり得る。
ゲノム合成は、合成ゲノムを有するマイコプラズマの作製を可能にし(Gibson, D.G., et al., 2010. Science, 329(5987), 52-56)、16個の染色体のうちの1つ又は2つのDNAが合成DNAに置換されているS.セレビシエ(S. cerevisiae)の9つの株の作製を可能にした(Zhang, W., et al., 2017. Science, 355(6329), eaaf3981;及びRichardson, S.M., et al., 2017. Science, 355(6329), 1040-1044)。これらの実験は個々の株において最大で1MbまでのDNA(0.99Mb、酵母;1.08Mb、マイコプラズマ)を置換している。プログラムされた組換えによるゲノム改変強化のためのレプリコン切除(REXER,replicon excision for enhanced genome engineering through programmed recombination)は、単一のステップにおいて100kbを超える大腸菌ゲノムを合成DNAで置換することについて報告している。さらに、REXERは、220kbの大腸菌ゲノムを230kbの合成DNAで置換するためにゲノム段階的交換合成(GENESIS,genome stepwise interchange synthesis)によって反復され得ることが示されている(Wang, K., et al., 2016. Nature, 539(7627), 59-64;国際公開第2018/020248号パンフレット)。
ゲノム合成は、個々の遺伝子における同義コドン(Napolitano, M.G., et al., 2016. PNAS, 113(38), E5588-E5597)、ゲノム領域及び必須オペロン(Wang, K., et al., 2016. Nature, 539(7627), 59-64;及びLau, Y.H., et al. 2017. Nucleic acids research, 45(11), 6971-6980)を変更するために使用されている。例えば、Wangらは、必須遺伝子及び標的コドンの両方に豊富にある大腸菌ゲノムの20kb領域を置換するために、定義された「書き換えスキーム」を使用した。
しかしながら、これらの研究は、単一の株のゲノムにおける標的化されたセンスコドンのほんの一部(最大で4.7%)しか変異していない。その結果として、これらの方法をゲノムワイド同義コドン圧縮に適用することにより、生存可能なゲノムを産生することができるかどうかは不明である。例えば、Wangらで試験した定義された書き換えスキームが、少数のセンスコドンが20種のカノニカルアミノ酸をコードするために使用される生物を作製するためにゲノムワイドに適用され得るかどうかは不明である。
Wang, K., et al., 2016. Nature, 539(7627), 59-64
Cambray, G., et al., 2018. Nature biotechnology, 36(10), 1005-1015
Chin, J.W., 2017. Nature, 550(7674), 53-60
Mukai, T., et al., 2015. Scientific reports, 5, p.9699
Gibson, D.G., et al., 2010. Science, 329(5987), 52-56
Zhang, W., et al., 2017. Science, 355(6329), eaaf3981
Richardson, S.M., et al., 2017. Science, 355(6329), 1040-1044
Napolitano, M.G., et al., 2016. PNAS, 113(38), E5588-E5597
Lau, Y.H., et al. 2017. Nucleic acids research, 45(11), 6971-6980
それ故、1つ又は2つ以上のセンスコドンが除去されている合成ゲノムが求められている。また、合成ゲノムを産生するための改善された方法も求められている。
本発明者らは、驚くべきことに、1つ又は2つ以上のセンスコドンが除去されている、生存可能な合成原核生物ゲノムが産生され得ることを見出した。特に、本発明者らは、細胞タンパク質をコードするために使用されるコドンの数が、2つのセンスコドン及び1つの終止コドンのゲノムワイド書き換えによって64個から61個まで減少している、生存可能な合成ゲノムを産生した。本発明者らはまた、前記合成ゲノムを含む大腸菌宿主細胞を産生した。
本発明者らはまた、驚くべきことに、定義された書き換え及びリファクタリングスキームが、標的コドンの99.9%超についてゲノムワイド同義コドン圧縮を可能にすることができることを見出した。本発明者らは、許容されない位置における代替の書き換え及びリファクタリングが、ゲノムワイド同義コドン圧縮を可能にすることを見出した。
本発明者らはまた、驚くべきことに、組換えを介した遺伝子改変(例えば、REXER及び/又はGENESIS)が、合成ゲノムを効果的に産生するために誘導コンジュゲーション(directed conjugation)と組み合わされ得ることを見出した。特に、本発明者らは、例えば、DNAの少なくとも約4Mbが前記方法により効果的に置換され得ること、及び前記方法により、合成DNAの設計における失敗(許容されない位置)をコドンレベルの分解能で同定することができることを見出した。
したがって、一態様では、本発明は、1つ又は2つ以上のセンスコドンの5つ又は4つ以下の出現(occurrence)を含む合成原核生物ゲノムを提供する。一部の実施形態では、合成原核生物ゲノムは、1つ又は2つ以上のセンスコドンの4つ若しくは3つ以下、3つ若しくは2つ以下、2つ若しくは1つ以下、1つ若しくは0個の出現を含むか、又は出現を含まない。一部の実施形態では、1つ又は2つ以上のセンスコドンは、1つのセンスコドン又は2つのセンスコドン、好ましくは2つのセンスコドンからなる。一部の実施形態では、合成原核生物ゲノムは、2つ又は3つ以上のセンスコドン、好ましくは2つのセンスコドンの出現を含まず、1つの終止コドン、好ましくはアンバー終止コドン(TAG)の出現を含まない。
合成原核生物ゲノムは、合成細菌ゲノム、好ましくは合成の大腸菌(Escherichia coli)ゲノム、サルモネラ・エンテリカ(Salmonella enterica)ゲノム、又は志賀赤痢菌(Shigella dysenteriae)ゲノムであってもよい。一部の実施形態では、合成原核生物ゲノムは、100kb~10Mb、又は1Mb~10Mb、又は2Mb~6Mbのサイズである。合成原核生物ゲノムは生存可能であり得る。一部の実施形態では、合成原核生物ゲノムは、100個若しくは101個以上、200個若しくは201個以上、又は1000個若しくは1001個以上の遺伝子を含み、遺伝子は1つ又は2つ以上のセンスコドンの出現がなくてもよく、好ましくは遺伝子は必須遺伝子である。
一部の実施形態では、1つ又は2つ以上のセンスコドンは、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択され、好ましくは1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択され、より好ましくは1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、TTG、TTA、GCG及びGCAから選択され、最も好ましくは1つ又は2つ以上のセンスコドンは、TCG及び/又はTCAである。
一部の実施形態では、合成原核生物ゲノムは、アンバー終止コドン(TAG)の10個若しくは9個以下、5個若しくは4個以下の出現を含むか、又は出現を含まない。
さらなる態様では、本発明は、100個若しくは101個以上、200個若しくは201個以上、又は1000個若しくは1001個以上の遺伝子を含む合成原核生物ゲノムを提供し、遺伝子は、1つ又は2つ以上のセンスコドンの5つ又は4つ以下の出現を合計で含み、好ましくは遺伝子は必須遺伝子である。一部の実施形態では、遺伝子は、1つ若しくは2つ以上のセンスコドンの4つ若しくは3つ以下、3つ若しくは2つ以下、2つ若しくは1つ以下、1つ若しくは0個の出現を合計で含むか、又は出現を含まない。一部の実施形態では、1つ又は2つ以上のセンスコドンは、1つのセンスコドン又は2つのセンスコドン、好ましくは2つのセンスコドンからなる。
合成原核生物ゲノムは、合成細菌ゲノム、好ましくは合成の大腸菌ゲノム、サルモネラ・エンテリカゲノム、又は志賀赤痢菌ゲノムであってもよい。一部の実施形態では、合成原核生物ゲノムは、100kb~10Mb、又は1Mb~10Mb、又は2Mb~6Mbのサイズである。合成原核生物ゲノムは生存可能であり得る。
一部の実施形態では、1つ又は2つ以上のセンスコドンは、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択され、好ましくは1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択され、より好ましくは1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、TTG、TTA、GCG及びGCAから選択され、最も好ましくは1つ又は2つ以上のセンスコドンは、TCG及び/又はTCAである。
一部の実施形態では、合成原核生物ゲノムは、アンバー終止コドン(TAG)の10個若しくは9個以下、5個若しくは4個以下の出現を含むか、又は出現を含まない。
さらなる態様では、本発明は、親原核生物ゲノムに由来する合成原核生物ゲノムを提供し、その合成原核生物ゲノムは、親原核生物ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ若しくは2つ以上のセンスコドンの出現を含むか、又はその合成原核生物ゲノムは、1つ若しくは2つ以上のセンスコドンの出現を含まない。一部の実施形態では、1つ又は2つ以上のセンスコドンは、1つのセンスコドン又は2つのセンスコドン、好ましくは2つのセンスコドンからなる。
合成原核生物ゲノムは、細菌ゲノム、好ましくは大腸菌ゲノム、サルモネラ・エンテリカゲノム、又は志賀赤痢菌ゲノムであってもよい。一部の実施形態では、合成原核生物ゲノムは、100kb~10Mb、又は1Mb~10Mb、又は2Mb~6Mbのサイズである。合成原核生物ゲノムは生存可能であり得る。
一部の実施形態では、1つ又は2つ以上のセンスコドンは、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択され、好ましくは1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択され、より好ましくは1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、TTG、TTA、GCG及びGCAから選択され、最も好ましくは1つ又は2つ以上のセンスコドンはTCG及び/又はTCAであり、TCG及び/又はTCAは同義センスコドンで置換されていてもよい。
好ましくは、親原核生物ゲノムにおける1つ又は2つ以上のセンスコドンの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、同義センスコドンで置換されている。一部の実施形態では、親原核生物ゲノムにおけるTCG及び/又はTCAの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、AGC及び/又はAGTで置換され、最も好ましくは親原核生物ゲノムにおけるTCGの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、AGCで置換され、及び/又は親原核生物ゲノムにおけるTCAの出現の90%、95%、90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、AGTで置換されている。
一部の実施形態では、合成原核生物ゲノムは、アンバー終止コドン(TAG)の10個若しくは9個以下、5個若しくは4個以下の出現を含むか、又は出現を含まず、好ましくは親原核生物ゲノムにおけるTAGの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、又は全てが、TAAで置換されている。
一部の実施形態では、親原核生物ゲノムにおける2つ又は3つ以上のセンスコドン、好ましくは2つのセンスコドンの出現の99.9%若しくはそれ以上、又は100%が、同義センスコドンで置換され、親原核生物ゲノムにおけるTAGの出現の全てが、TAAで置換されている。
親原核生物ゲノムにおける1つ又は2つ以上のセンスコドンを含む重複する領域を共有する1つ又は2つ以上の遺伝子対がリファクタリングされてもよく、好ましくは1つ又は2つ以上の遺伝子対が、センスコドンのうちの1つ又は2つ以上の同義センスコドンでの置換が、遺伝子対の両方又は一方のコードされたタンパク質配列を変化させるものである。
一部の実施形態では、逆向きの遺伝子対に関して、合成挿入物が遺伝子間に挿入され、合成挿入物が重複する領域を含み、及び/又は同じ向きの遺伝子対に関して、合成挿入物が遺伝子間に挿入され、合成挿入物が、(i)終止コドン、(ii)重複する領域の上流から約20~200bp、及び(iii)重複する領域を含む。
さらなる態様では、本発明は、1つ又は2つ以上のセンスコドンの出現がない、20個又は21個以上、30個又は31個以上、40個又は41個以上、50個又は51個以上、100個又は101個以上の必須遺伝子を含むポリヌクレオチドを提供する。一部の実施形態では、1つ又は2つ以上のセンスコドンは、1つのセンスコドン又は2つのセンスコドン、好ましくは2つのセンスコドンからなる。
一部の実施形態では、1つ又は2つ以上のセンスコドンは、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択され、好ましくは1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択され、より好ましくは1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、TTG、TTA、GCG及びGCAから選択され、最も好ましくは1つ又は2つ以上のセンスコドンはTCG及び/又はTCAである。
遺伝子の1つ又は2つ以上のセンスコドンの出現は、同義センスコドンで置換されていてもよく、好ましくはTCGコドンはAGCで置換され、及び/又はTCAコドンはAGTで置換されている。
必須遺伝子は、ribF、lspA、ispH、dapB、folA、imp、yabQ、ftsL、ftsI、murE、murF、mraY、murD、ftsW、murG、murC、ftsQ、ftsA、ftsZ、lpxC、secM、secA、can、folK、hemL、yadR、dapD、map、rpsB、tsf、pyrH、frr、dxr、ispU、cdsA、yaeL、yaeT、lpxD、fabZ、lpxA、lpxB、dnaE、accA、tilS、proS、yafF、hemB、secD、secF、ribD、ribE、thiL、dxs、ispA、dnaX、adk、hemH、lpxH、cysS、folD、entD、mrdB、mrdA、nadD、holA、rlpB、leuS、lnt、glnS、fldA、cydA、infA、cydC、ftsK、lolA、serS、rpsA、msbA、lpxK、kdsB、mukF、mukE、mukB、asnS、fabA、mviN、rne、fabD、fabG、acpP、tmk、holB、lolC、lolD、lolE、purB、minE、minD、pth、prsA、ispE、lolB、hemA、prfA、prmC、kdsA、topA、ribA、fabI、tyrS、ribC、ydiL、pheT、pheS、rplT、infC、thrS、nadE、gapA、yeaZ、aspS、argS、pgsA、yefM、metG、folE、yejM、gyrA、nrdA、nrdB、folC、accD、fabB、gltX、ligA、zipA、dapE、dapA、der、hisS、ispG、suhB、tadA、acpS、era、rnc、lepB、rpoE、pssA、yfiO、rplS、trmD、rpsP、ffh、grpE、csrA、ispF、ispD、ftsB、eno、pyrG、chpR、lgt、fbaA、pgk、yqgD、metK、yqgF、plsC、ygiT、parE、ribB、cca、ygjD、tdcF、yraL、yhbV、infB、nusA、ftsH、obgE、rpmA、rplU、ispB、murA、yrbB、yrbK、yhbN、rpsI、rplM、degS、mreD、mreC、mreB、accB、accC、yrdC、def、fmt、rplQ、rpoA、rpsD、rpsK、rpsM、secY、rplO、rpmD、rpsE、rplR、rplF、rpsH、rpsN、rplE、rplX、rplN、rpsQ、rpmC、rplP、rpsC、rplV、rpsS、rplB、rplW、rplD、rplC、rpsJ、fusA、rpsG、rpsL、trpS、yrfF、asd、rpoH、ftsX、ftsE、ftsY、yhhQ、bcsB、glyQ、gpsA、rfaK、kdtA、coaD、rpmB、dfp、dut、gmk、spoT、gyrB、dnaN、dnaA、rpmH、rnpA、yidC、tnaB、glmS、glmU、wzyE、hemD、hemC、yigP、ubiB、ubiD、hemG、yihA、ftsN、murI、murB、birA、secE、nusG、rplJ、rplL、rpoB、rpoC、ubiA、plsB、lexA、dnaB、ssb、alsK、groS、psd、orn、yjeE、rpsR、chpS、ppa、valS、yjgP、yjgQ、及びdnaCからなるリストのうちの1つ又は2つ以上から選択される必須遺伝子を含んでもよい。
さらなる態様では、本発明は、本発明による合成原核生物ゲノム又は本発明によるポリヌクレオチドを含む原核生物宿主細胞を提供する。
原核生物宿主細胞は生存可能であり得る。原核生物宿主細胞は、細菌の細胞、好ましくは大腸菌の細胞、サルモネラ・エンテリカの細胞、又は志賀赤痢菌の細胞であってもよい。好ましくは、宿主細胞は、1つ又は2つ以上の非タンパク質性アミノ酸、好ましくは2つ又は3つ以上の非タンパク質性アミノ酸、最も好ましくは3つ又は4つ以上の非タンパク質性アミノ酸を含むポリペプチドの産生に使用するのに適している。
さらなる態様では、本発明は、1つ又は2つ以上の非タンパク質性アミノ酸、好ましくは2つ又は3つ以上の非タンパク質性アミノ酸、最も好ましくは3つ又は4つ以上の非タンパク質性アミノ酸を含むポリペプチドを産生するための本発明による原核生物宿主細胞の使用を提供する。
さらなる態様では、本発明は、合成ゲノムを産生するための方法であって、
(a)親ゲノムを準備するステップと、
(b)親ゲノムに対して組換えを介した遺伝子改変の1回又は2回以上のラウンドを実行して、2つ又は3つ以上の異なる部分的合成ゲノムを産生するステップと、
(c)2つ又は3つ以上の異なる部分的合成ゲノムとの誘導コンジュゲーションの1回又は2回以上のラウンドを実行して、合成ゲノムを産生するステップと
を含み、部分的合成ゲノムの各々が、1つ又は2つ以上のセンスコドンの各々の50個若しくは49個以下、20個若しくは19個以下、10個若しくは9個以下、5個若しくは4個以下、又は0個の出現を有する合成領域を含むか、又は部分的合成ゲノムの各々が、親ゲノムにおける対応する領域と比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ又は2つ以上のセンスコドンの各々の出現を有する合成領域を含む、方法を提供する。
(a)親ゲノムを準備するステップと、
(b)親ゲノムに対して組換えを介した遺伝子改変の1回又は2回以上のラウンドを実行して、2つ又は3つ以上の異なる部分的合成ゲノムを産生するステップと、
(c)2つ又は3つ以上の異なる部分的合成ゲノムとの誘導コンジュゲーションの1回又は2回以上のラウンドを実行して、合成ゲノムを産生するステップと
を含み、部分的合成ゲノムの各々が、1つ又は2つ以上のセンスコドンの各々の50個若しくは49個以下、20個若しくは19個以下、10個若しくは9個以下、5個若しくは4個以下、又は0個の出現を有する合成領域を含むか、又は部分的合成ゲノムの各々が、親ゲノムにおける対応する領域と比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ又は2つ以上のセンスコドンの各々の出現を有する合成領域を含む、方法を提供する。
合成領域は、親ゲノムの90%若しくはそれ以上、95%若しくはそれ以上、99%若しくはそれ以上又は100%を合計で占めてもよい。一部の実施形態では、合成領域は、10~1000kb、50~1000kb、100~1000kb、又は100~500kbのサイズである。
方法は、組換えを介した遺伝子改変の各ラウンド後及び/又は誘導コンジュゲーションの各ラウンド後に部分的合成ゲノムの生存能を試験するステップをさらに含んでもよい。
2つ又は3つ以上の異なる部分的合成ゲノムは、少なくとも1つの部分的合成ドナーゲノム及び少なくとも1つの部分的合成レシピエントゲノムを含んでもよい。一部の実施形態では、少なくとも1つの部分的合成ドナーゲノムは、合成領域及び伝達起点のすぐ下流の2つの相同領域が隣接した第1の選択可能マーカーを含み、少なくとも1つの部分的合成レシピエントゲノムは、2つの対応する相同領域が隣接した第2の選択可能マーカーを含み、第1の選択可能マーカーは陽性選択可能マーカーを含んでいてもよく、及び/又は第2の選択可能マーカーは陰性選択可能マーカーを含んでいてもよい。一部の実施形態では、少なくとも1つの部分的合成レシピエントゲノムに存在する合成領域は、相同領域が隣接した領域の外側である。一部の実施形態では、方法は、選択可能マーカーについての選択の1回又は2回以上のラウンドをさらに含む。
組換えを介した遺伝子改変の1回又は2回以上のラウンドは、プログラムされた組換えによるゲノム改変強化のためのレプリコン切除(REXER)の1回又は2回以上のラウンドを含んでもよい。
合成ゲノムは、本発明による合成原核生物ゲノムであってもよい。
さらなる態様では、本発明は、本発明の方法によって産生される合成原核生物ゲノムを提供する。
詳細な説明
本明細書で使用される場合、「含む(comprising)」、「含む(comprises)」及び「から構成される(comprised of)」という用語は、「包含する(including)」若しくは「包含する(includes)」、又は「含有する(containing)」若しくは「含有する(contains)」と同義であり、包括的又はオープンエンドであり、付加的な列挙されていない構成、要素又はステップを排除しない。「含む(comprising)」、「含む(comprises)」及び「から構成される(comprised of)」という用語は、「からなる(consisting of)」という用語も包含する。
本明細書で使用される場合、「含む(comprising)」、「含む(comprises)」及び「から構成される(comprised of)」という用語は、「包含する(including)」若しくは「包含する(includes)」、又は「含有する(containing)」若しくは「含有する(contains)」と同義であり、包括的又はオープンエンドであり、付加的な列挙されていない構成、要素又はステップを排除しない。「含む(comprising)」、「含む(comprises)」及び「から構成される(comprised of)」という用語は、「からなる(consisting of)」という用語も包含する。
合成ゲノム
ゲノム
本明細書で使用される場合、「ゲノム」は、遺伝子及び非コードDNAの両方を包含する、生物の遺伝物質である。本明細書で使用される場合、「合成ゲノム」は、合成的に構築されたゲノムである。典型的に、合成ゲノムは、既存(すなわち、「親」)のゲノムの遺伝子修飾によって産生される。それ故、合成ゲノムは親ゲノムに由来し得る、すなわち、1つ又は2つ以上の遺伝子修飾を含むことを除いて親ゲノムと同一であり得る。当業者は、合成ゲノムの基になっている親ゲノム及び実行される遺伝子修飾を容易に同定することができるであろう。本明細書で使用される場合、「親ゲノム」は、任意の天然に存在する、市販の、寄託された、カタログに載っている若しくはそうでなければ周知のゲノム、又はそれらの誘導体であり得る。
ゲノム
本明細書で使用される場合、「ゲノム」は、遺伝子及び非コードDNAの両方を包含する、生物の遺伝物質である。本明細書で使用される場合、「合成ゲノム」は、合成的に構築されたゲノムである。典型的に、合成ゲノムは、既存(すなわち、「親」)のゲノムの遺伝子修飾によって産生される。それ故、合成ゲノムは親ゲノムに由来し得る、すなわち、1つ又は2つ以上の遺伝子修飾を含むことを除いて親ゲノムと同一であり得る。当業者は、合成ゲノムの基になっている親ゲノム及び実行される遺伝子修飾を容易に同定することができるであろう。本明細書で使用される場合、「親ゲノム」は、任意の天然に存在する、市販の、寄託された、カタログに載っている若しくはそうでなければ周知のゲノム、又はそれらの誘導体であり得る。
本発明の合成ゲノムは合成原核生物ゲノムである。原核生物は、膜結合型核、ミトコンドリア、又は任意の他の膜結合型細胞小器官を欠く単細胞生物である。原核生物は、2つの領域である、古細菌及び細菌に分けられる。原核生物のゲノムは一般に、DNAの環状二本鎖片であり、その複数のコピーはいかなる時でも存在し得る。
好ましくは、本発明の合成ゲノムは合成細菌ゲノムである。好ましくは、合成細菌ゲノムは、異種タンパク質産生、特に1つ又は2つ以上の非タンパク質性アミノ酸を含むポリペプチド(例えば、Ferrer-Miralles, N. and Villaverde, A., 2013. Microbial Cell Factories, 12:113に記載されているもの)の産生に適している。適切な細菌ゲノムとしては、エシェリキア(escherichia)(例えば、大腸菌)、カウロバクテリア(caulobacteria)(例えば、カウロバクター・クレセンタス(Caulobacter crescentus))、光合成細菌(例えば、ロドバクター・スフェロイデス(Rodhobacter sphaeroides))、低温適応型細菌(例えば、シュードアルテロモナス・ハロプランクティス(Pseudoalteromonas haloplanktis)、シェワネラ属種(Shewanella sp.)株Ac10)、シュードモナス(pseudomonads)(例えば、シュードモナス・フルオレッセンス(Pseudomonas fluorescens)、シュードモナス・プチダ(Pseudomonas putida)、シュードモナス・エルギノーザ(Pseudomonas aeruginosa))、好塩性細菌(例えば、ハロモナス・エロンガタ(Halomonas elongate)、クロモハロバクター・サレキシゲンス(Chromohalobacter salexigens))、ストレプトミセテス(streptomycetes)(例えば、ストレプトマイセス・リビダンス(Streptomyces lividans)、ストレプトマイセス・グリゼウス(Streptomyces griseus))、ノカルディア(nocardia)(例えば、ノカルディア・ラクタムジュランス(Nocardia lactamdurans))、マイコバクテリア(mycobacteria)(例えば、マイコバクテリウム・スメグマティス(Mycobacterium smegmatis))、コリネフォーム細菌(coryneform bacteria)(例えば、コリネバクテリウム・グルタミクム(Corynebacterium glutamicum)、コリネバクテリウム・アンモニアゲネス(Corynebacterium ammoniagenes)、ブレビバクテリウム・ラクトファーメンタム(Brevibacterium lactofermentum))、バシラス(bacilli)(例えば、バシラス・サチリス(Bacillus subtilis)、バシラス・ブレビス(Bacillus brevis)、バシラス・メガテリウム(Bacillus megaterium)、バシラス・リケニフォルミス(Bacillus licheniformis)、バシラス・アミロリケファシエンス(Bacillus amyloliquefaciens))、及び乳酸菌(例えば、ラクトコッカス・ラクチス(Lactococcus lactis)、ラクトバチルス・プランタルム(Lactobacillus plantarum)、ラクトバチルス・カゼイ(Lactobacillus casei)、ラクトバチルス・ロイテリ(Lactobacillus reuteri)、ラクトバチルス・ガセリ(Lactobacillus gasseri))ゲノムが挙げられる。一部の実施形態では、合成ゲノムは合成グラム陰性細菌ゲノムである。
細菌ゲノムは、約130kb~14Mb超の程度のサイズの範囲であり得る。それ故、一部の実施形態では、本発明の合成原核生物ゲノムは、100kb~20Mb、又は130kb~15Mb、又は200kb~15Mb、又は300kb~15Mb、又は500kb~15Mb、又は1Mb~15Mb、又は1Mb~10Mb、又は1Mb~8Mb、又は1Mb~6Mb、又は2Mb~6Mb、又は2Mb~5Mb、又は3Mb~5Mb、又は約4Mbのサイズである。合成原核生物ゲノムは、100個若しくは101個以上、200個若しくは201個以上、300個若しくは301個以上、400個若しくは401個以上、500個若しくは501個以上、600個若しくは601個以上、700個若しくは701個以上、800個若しくは801個以上、900個若しくは901個以上、1000個若しくは1001個以上、1500個若しくは1501個以上、又は2000個若しくは2001個以上の遺伝子、好ましくは1000個若しくは1001個以上の遺伝子を含むことができる。合成原核生物ゲノムは、100個若しくは101個以上、200個若しくは201個以上、300個若しくは301個以上、400個若しくは401個以上、500個若しくは501個以上、600個若しくは601個以上、700個若しくは701個以上、800個若しくは801個以上、900個若しくは901個以上、1000個若しくは1001個以上、1500個若しくは1501個以上、又は2000個若しくは2001個以上の遺伝子を含むことができ、それらの遺伝子について翻訳及び/又は予測タンパク質産物の証拠が存在し、好ましくは1000個又は1001個以上の遺伝子である。好ましくは、合成原核生物ゲノムは、100個又は101個以上、200個又は201個以上、300個又は301個以上、400個又は401個以上、500個又は501個以上の必須遺伝子、好ましくは300個又は301個以上の必須遺伝子を含む。
好ましくは、本発明の合成ゲノムは、合成の大腸菌ゲノム、サルモネラ・エンテリカゲノム、又は志賀赤痢菌ゲノムである。これらは、Lukjancenko, O., et al., 2010. Microbial ecology, 60(4), pp.708-720; 及びKarberg, K.A., et al., 2011. PNAS, 108(50), pp.20154-20159に開示されているように系統学的に関連した種である。
より好ましくは、本発明の合成ゲノムは合成大腸菌ゲノムである。親ゲノムは、MDS42、K-12、MG1655、BL21、BL21(DE3)、AD494、Origami、HMS174、BLR(DE3)、HMS174(DE3)、Tuner(DE3)、Origami2(DE3)、Rosetta2(DE3)、Lemo21(DE3)、NiCo21(DE3)、T7 Express、SHuffle Express、C41(DE3)、C43(DE3)、及びm15 pREP4又はそれらの誘導体を包含する任意の適切な大腸菌ゲノムであってもよい(Rosano, G.L. and Ceccarelli, E.A., 2014. Frontiers in microbiology, 5, p.172)。最も好ましくは、親ゲノムは、MDS42、MG1655、若しくはBL21又はそれらの誘導体である。MG1655は大腸菌の野生型株と見なされる。この株のゲノム配列のジェンバンクIDは、U00096である。BL21は広範に市販されている。例えば、それは、カタログ番号C2530H(https://www.neb.com/products/c2530-bl21-competent-e-coli)でNew England BioLabs社から購入することができる。
一部の実施形態では、合成ゲノムは、少ない合成ゲノム又は最小合成ゲノムである。「少ないゲノム」は、親ゲノムのサイズが、非必須遺伝子及び/又は非コード領域を除去することによって低減しているものである。「最小ゲノム」は、例えば、ゲノムの全ての非必須領域の削除によって生存能を維持しながら、その最小サイズまで低減しているゲノムである。
本発明の合成ゲノムは生存可能なゲノムであり得る。本明細書で使用される場合、「生存可能なゲノム」とは、細胞の生存能を引き起こす及び/又は維持するのに十分な核酸配列を含有するゲノム、例えば、複製、転写、翻訳、エネルギー産生、輸送、膜及び細胞質成分の産生、並びに細胞分裂に必要とされる分子をコードするゲノムを指す。
好ましくは、1つ又は2つ以上のtRNA又は終結因子が合成ゲノムから削除されてもよく、合成ゲノムは生存可能なままであり得る。例えば、置換(又は削除)されている1つ又は2つ以上のセンスコドンのみを解読するtRNAは非必須であり得る。同様に、tRNAが解読する残りのセンスコドンが、代替のtRNAによっても解読され得る場合、置換(又は削除)されている1つ又は2つ以上のセンスコドンを解読するtRNAは非必須であり得る。例えば、tRNASer
UGAをコードするserTは、大腸菌におけるTCAコドンを解読する唯一のtRNAであるので、通常、必須である。しかしながら、合成ゲノムがTCAコドンを含有しない場合、serTは非必須であり得る。
センスコドン
本発明は、1つ若しくは2つ以上のセンスコドンの5つ若しくは4つ以下の出現を含む合成原核生物ゲノム;及び/又は合成原核生物ゲノムが、親ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ又は2つ以上のセンスコドンの出現を含む、親ゲノムに由来する合成原核生物ゲノム;及び/又は1つ若しくは2つ以上のセンスコドンの出現がない、100個若しくは101個以上、200個若しくは201個以上、又は1000個若しくは1001個以上の遺伝子を含む合成原核生物ゲノムを提供する。
本発明は、1つ若しくは2つ以上のセンスコドンの5つ若しくは4つ以下の出現を含む合成原核生物ゲノム;及び/又は合成原核生物ゲノムが、親ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ又は2つ以上のセンスコドンの出現を含む、親ゲノムに由来する合成原核生物ゲノム;及び/又は1つ若しくは2つ以上のセンスコドンの出現がない、100個若しくは101個以上、200個若しくは201個以上、又は1000個若しくは1001個以上の遺伝子を含む合成原核生物ゲノムを提供する。
1つ又は2つ以上のセンスコドンは、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つのセンスコドンからなってもよい。好ましくは、1つ又は2つ以上のセンスコドンは、1つのセンスコドン又は2つのセンスコドン、最も好ましくは2つのセンスコドンからなる。
合成原核生物ゲノムは、1つ若しくは2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、若しくは8つ)のセンスコドンの5つ若しくは4つ以下(例えば、5つ、4つ、3つ、2つ、1つ)の出現を含んでもよいか、又は出現を含まなくてもよい。一部の実施形態では、合成原核生物ゲノムは、1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)のセンスコドンの各々の5つ又は4つ以下(例えば、5つ、4つ、3つ、2つ、1つ、0個)を含む。他の実施形態では、合成原核生物ゲノムは、合わせて(すなわち、全部で)1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)のセンスコドンの5つ又は4つ以下(例えば、5つ、4つ、3つ、2つ、1つ、0個)を含む。好ましい実施形態では、合成原核生物ゲノムは、1つのセンスコドンの出現を含まない。他の好ましい実施形態では、合成原核生物ゲノムは、2つのセンスコドンの出現を含まない。
合成原核生物ゲノムは、親ゲノムに由来してもよく、1つ若しくは2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、若しくは8つ)の天然センスコドンの5つ若しくは4つ以下(例えば、5つ、4つ、3つ、2つ、1つ)の出現を含むか、又は出現を含まない。一部の実施形態では、合成原核生物ゲノムは、1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)の天然センスコドンの各々の5つ又は4つ以下(例えば、5つ、4つ、3つ、2つ、1つ、0個)を含む。他の実施形態では、合成原核生物ゲノムは、合わせて(すなわち、全部で)1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)の天然センスコドンの5つ又は4つ以下(例えば、5つ、4つ、3つ、2つ、1つ、0個)を含む。好ましい実施形態では、合成原核生物ゲノムは、親ゲノムに由来し、1つの天然センスコドンの出現を含まない。他の好ましい実施形態では、合成原核生物ゲノムは、親ゲノムに由来し、2つの天然センスコドンの出現を含まない。
一部の実施形態では、合成原核生物ゲノムは、100個若しくは101個以上、200個若しくは201個以上、300個若しくは301個以上、400個若しくは401個以上、500個若しくは501個以上、600個若しくは601個以上、700個若しくは701個以上、800個若しくは801個以上、900個若しくは901個以上、1000個若しくは1001個以上、1500個若しくは1501個以上、又は2000個若しくは2001個以上の遺伝子、好ましくは1000個若しくは1001個以上の遺伝子を含む。一部の実施形態では、遺伝子は、翻訳及び/又は予測タンパク質産物の証拠が存在するものである。例えば、合成原核生物ゲノムは、100個若しくは101個以上、200個若しくは201個以上、300個若しくは301個以上、400個若しくは401個以上、500個若しくは501個以上、600個若しくは601個以上、700個若しくは701個以上、800個若しくは801個以上、900個若しくは901個以上、1000個若しくは1001個以上、1500個若しくは1501個以上、又は2000個若しくは2001個以上の遺伝子、好ましくは1000個若しくは1001個以上の遺伝子を含むことができ、それらの遺伝子について翻訳及び/又は予測タンパク質産物の証拠が存在する。好ましくは、合成原核生物ゲノムは、100個又は101個以上、200個又は201個以上、300個又は301個以上、400個又は401個以上、500個又は501個以上の必須遺伝子、好ましくは300個又は301個以上の必須遺伝子を含む。好ましくは、(必須)遺伝子は、1つ又は2つ以上のセンスコドンの出現を有さない。
合成原核生物ゲノムは、親ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)のセンスコドンの出現を含んでもよい。一部の実施形態では、合成原核生物ゲノムは、親ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)のセンスコドンの各々の出現を含む。他の実施形態では、合成原核生物ゲノムは、親ゲノムと比較して、合わせて10%、5%、2%、1%、0.5%、0.1%未満の1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)のセンスコドンの出現を含む。好ましい実施形態では、合成原核生物ゲノムは、親ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つのセンスコドンを含む。他の好ましい実施形態では、合成原核生物ゲノムは、親ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の2つのセンスコドンを含む。
合成原核生物ゲノムは、1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)のセンスコドンの出現がない、100個若しくは101個以上、200個若しくは201個以上、又は1000個若しくは1001個以上の遺伝子を含んでもよい。好ましくは、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)のセンスコドンの出現を有さない。好ましい実施形態では、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、1つのセンスコドンの出現を有さない。他の好ましい実施形態では、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、2つのセンスコドンの出現を有さない。実質的に全てとは、10個又は9個以下(例えば、10個、9個、8個、7個、6個、5個、4個、3個、2個、1個、又は0個)の遺伝子を除いて全てが1つ又は2つ以上のセンスコドンの出現を含むことを意味する。
合成原核生物ゲノムは、1つ若しくは2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)の天然センスコドンの出現がない、100個若しくは101個以上、200個若しくは201個以上、又は1000個若しくは1001個以上の遺伝子を含んでもよい。好ましくは、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、1つ又は2つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つ)の天然センスコドンの出現を有さない。好ましい実施形態では、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、1つの天然センスコドンの出現を有さない。他の好ましい実施形態では、合成原核生物ゲノムにおける全て又は実質的に全ての遺伝子は、2つの天然センスコドンの出現を有さない。実質的に全てとは、10個又は9個以下(例えば、10個、9個、8個、7個、6個、5個、4個、3個、2個、1個、又は0個)の遺伝子を除いて全てが1つ又は2つ以上の天然センスコドンの出現を含むことを意味する。
好ましくは、遺伝子はタンパク質をコードし(例えば、遺伝子は翻訳及び/又は予測タンパク質産物の証拠が存在するものである)、及び/又は遺伝子は必須遺伝子である。それ故、より好ましい実施形態では、合成原核生物ゲノムは、1つ又は2つのセンスコドンの出現がない、100個若しくは101個以上、200個若しくは201個以上、又は1000個若しくは1001個以上のタンパク質をコードする遺伝子及び/又は100個若しくは101個以上、200個若しくは201個以上、又は300個若しくは301個以上の必須遺伝子を含む。他のより好ましい実施形態では、合成原核生物ゲノムにおける全て又は実質的に全てのタンパク質をコードする遺伝子及び/又は必須遺伝子は、1つ又は2つのセンスコドンの出現を含まない。
好ましい実施形態では、タンパク質は1つ若しくは2つ以上のセンスコドンの残りの出現のいずれかから翻訳されず、及び/又は1つ若しくは2つ以上のセンスコドンの残りの出現を含む遺伝子は推定若しくは非コード遺伝子である。一部の実施形態では、1つ又は2つ以上のセンスコドンの残りの出現を含む遺伝子の翻訳は低減及び/又は阻止される(例えば、遺伝子は5’配列において終止コドンを含んでもよい)。
センスコドンのいずれかの残りの出現が、合成原核生物ゲノムが生存可能であることを確保するために必要な場合がある。例えば、合成原核生物ゲノムにおける1つ若しくは2つ以上のセンスコドンの残りの出現の1つ若しくは2つ以上、好ましくは全てが、必須遺伝子の調節エレメントに存在してもよく、及び/又は1つ若しくは2つ以上のセンスコドンの残りの出現の1つ若しくは2つ以上、好ましくは全てが、翻訳若しくは予測タンパク質産物についての証拠が存在しない遺伝子(すなわち、推定又は非コード遺伝子)にあってもよい。
本明細書で使用される場合、「センスコドン」は、アミノ酸をコードするヌクレオチドトリプレットである。それ故、センスコドンは、遺伝子予測によって、すなわち、タンパク質をコードするゲノムの領域(すなわち、遺伝子)及び対応するオープンリーディングフレーム(ORF)を同定することによってゲノム内で同定され得る。典型的に、ゲノムは天然に61個のセンスコドンを含む:GCT、GCC、GCA、GCG、CGT、CGC、CGA、CGG、AGA、AGG、AAT、AAC、GAT、GAC、TGT、TGC、CAA、CAG、GAA、GAG、GGT、GGC、GGA、GGG、CAT、CAC、ATT、ATC、ATA、TTA、TTG、CTT、CTC、CTA、CTG、AAA、AAG、ATG、TTT、TTC、CCT、CCC、CCA、CCG、TCT、TCC、TCA、TCG、AGT、AGC、ACT、ACC、ACA、ACG、TGG、TAT、TAC、GTT、GTC、GTA、及びGTG(DNAのコード鎖上で5’から3’に読む)。標準的な遺伝コードは61個のトリプレットコドンを使用して20種のカノニカルアミノ酸をコードする。20種のアミノ酸のうちの18種は、1つより多い同義コドンによってコードされる(図17を参照のこと)。1つ又は2つ以上のセンスコドンは1つ又は2つ以上の天然センスコドン、すなわち、親ゲノムに存在するセンスコドンであり得る。
DNAの61個のセンスコドンは対応するmRNAに転写され、続いて1つ又は2つ以上のtRNAによって解読される。tRNAは、mRNAのセンスコドンによって指示されるようにリボソームにアミノ酸を運ぶ。tRNAは、相補的アンチコドンによって1つ又は2つ以上のセンスコドンを認識することができる。続いて、センスコドンの配列はポリペプチド(すなわち、アミノ酸の配列)に翻訳される。大腸菌ゲノムにおけるコドン及びアンチコドン相互作用は図17に示される。
好ましくは、他のセンスコドンではなく、1つ又は2つ以上のセンスコドンのゲノムワイド除去により、前記1つ又は2つ以上のセンスコドンに対応する全てのコグネイトtRNAを、ゲノムに残っている1つ又は2つ以上のセンスコドンを解読する能力を除去することなく削除することができる。それ故、1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、GCG、GCA、GTG、GTA、CTG、CTA、TTG、TTA、ACG、ACA、CCG、CCA、CGG、CGA、CGT、CGC、AGG、AGA、GGG、GGA、GGT、GGC、ATT、及びATCから選択され得る。
セリン、ロイシン及びアラニンについてのアミノアシル-tRNA合成酵素は、それらのコグネイトtRNAのアンチコドンを認識しない。これは、内在性合成酵素による誤ったアミノアシル化を導かないコグネイトアンチコドンを担持するtRNAを導入することによって、これらのボックス内のコドンの新しいアミノ酸への割当を容易にすることができる。それ故、1つ又は2つ以上のセンスコドンは、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択され得る。
好ましくは、1つ又は2つ以上のセンスコドンはこれらの基準の両方を満たすので、1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択され得る。より好ましくは、1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、TTG、TTA、GCG及びGCAから選択される。最も好ましくは、1つ又は2つ以上のセンスコドンはTCG及び/又はTCAである。
好ましくは、ゲノムが非タンパク質性アミノ酸へのコドン再割当と適合するように1つ又は2つ以上のセンスコドンは除去される。それ故、1つ又は2つ以上のセンスコドンは、TCA、CTA、又はTTAのうちの1つ又は2つ以上を含んでもよい。あるいは、2つ又は3つ以上のセンスコドンが除去され、その2つ又は3つ以上のセンスコドンは、GCG及びGCA;GCT及びGCC;TCG及びTCA;AGT及びAGC;TCT及びTCC;CTG及びCTA;TTG及びTTA;並びにCTT及びCTCからなる群から選択される、センスコドン対のうちの1つ又は2つ以上を含む。好ましくは、2つ又は3つ以上のセンスコドンが除去され、その2つ又は3つ以上のセンスコドンは、GCG及びGCA;TCG及びTCA;AGT及びAGC;CTG及びCTA;並びにTTG及びTTAからなる群から選択される、センスコドン対のうちの1つ又は2つ以上を含む。より好ましくは、2つ又は3つ以上のセンスコドンはTCG及びTCAを含む。
センスコドンの除去を達成するために、それらは同義センスコドンで置換され得る。これは、コードされたタンパク質配列が変化しないことを確保するために好ましい。例えば、本発明は、親ゲノムにおける1つ又は2つ以上のセンスコドンの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、同義センスコドンで置換されている、合成原核生物ゲノムを提供する。当業者は、適切な同義センスコドン置換を推定することができる。例えば、大腸菌では、典型的に、TCG、TCA、TCT、TCC、AGT及びAGCの全てはセリンをコードし、典型的に、GCG、GCA、GCT及びGCCの全てはアラニンをコードし、典型的に、CTG、CTA、CTT、CTC、TTG及びTTAの全てはロイシンをコードする。
一部の実施形態では、置換は定義された置換であり、すなわち、1つのセンスコドンが単一の同義センスコドンで置換されている。好ましくは、親ゲノムにおける1つ又は2つ以上のセンスコドンの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、定義された(すなわち、単一の)同義センスコドンで置換されている。
例えば、定義された置換は、GCT若しくはGCCのいずれかで置換されたGCG;GCT若しくはGCCのいずれかで置換されたGCA;TCT、TCC、AGT、若しくはAGCのいずれか1つで置換されたTCG;TCT、TCC、AGT、若しくはAGCのいずれか1つで置換されたTCA;TCG、TCA、TCT、若しくはTCCのいずれか1つで置換されたAGT;TCG、TCA、TCT、若しくはTCCのいずれか1つで置換されたAGC;CTT、CTC、TTG若しくはTTAのいずれか1つで置換されたCTG;CTT、CTC、TTG若しくはTTAのいずれか1つで置換されたCTA;CTG、CTA、CTT若しくはCTCのいずれか1つで置換されたTTG;又はCTG、CTA、CTT若しくはCTCのいずれか1つで置換されたTTAであってもよい。好ましくは、1つ又は2つ以上の定義されたセンスコドン置換は、GCGからGCT又はGCCのいずれか;GCAからGCT又はGCCのいずれか;TCGからAGT又はAGCのいずれか;TCAからAGT又はAGCのいずれか;AGTからTCA又はTCTのいずれか;AGCからTCG又はTCC又はTCAのいずれか;TTGからCTT;及びTTAからCTCのうちの1つ又は2つ以上から選択される。より好ましくは、TCG及び/又はTCAはAGC及び/又はAGTで置換されている。最も好ましくは、TCGはAGCで置換され、及び/又はTCAはAGTで置換されている。
好ましくは、定義された置換は、ゲノムが非タンパク質性アミノ酸へのコドン再割当と適合するようなものである。例えば、(i)GCGは、GCT若しくはGCCのいずれかで置換されていてもよく、GCAは、GCT若しくはGCCのいずれかで置換されていてもよく;(ii)TCGは、TCT、TCC、AGT、若しくはAGCのいずれかで置換されていてもよく、TCAは、TCT、TCC、AGT、若しくはAGCのいずれかで置換されていてもよく;(iii)AGTは、TCG、TCA、TCT、若しくはTCCのいずれかで置換されていてもよく、AGCは、TCG、TCA、TCT、若しくはTCCのいずれかで置換されていてもよく;(iv)CTGは、CTT、CTC、TTG若しくはTTAのいずれかで置換されていてもよく、CTAは、CTT、CTC、TTG若しくはTTAのいずれかで置換されていてもよく;又は(v)TTGは、CTG、CTA、CTT若しくはCTCのいずれかで置換されていてもよく、TTAは、CTG、CTA、CTT若しくはCTCのいずれかで置換されていてもよい。
好ましくは、定義された置換スキームは、以下の表に列挙されたもののうちの1つ又は2つ以上である:
好ましくは、これらのコドン置換のいずれも、大腸菌において高度に保存された調節配列であるリボソーム結合部位(AGGAGG)に影響を及ぼさない。選択されたコドン置換は、生存能を評価するために小さな試験領域(例えば、必須標的遺伝子及び標的コドンの両方が豊富なゲノムの20kb領域)で試験されてもよい。コドン置換が小さな試験領域で生存可能でない場合、それらは無視され得る。
定義された置換同義センスコドンでの親ゲノムにおける1つ又は2つ以上のセンスコドンの置換が生存可能なゲノムを生じない場合、代替の置換同義センスコドンが使用され得る。例えば、親ゲノムにおける1つ又は2つ以上のセンスコドンの出現の99.9%が定義された(すなわち、単一の)同義センスコドンで置換されていてもよく、残りの0.1%が代替の同義センスコドンで置換されていてもよい。例えば、TCGの出現の99.9%がAGCで置換されていてもよく、0.1%がTCT、TCC、AGT若しくはAGCで置換されていてもよく;及び/又はTCAの出現の99.9%がAGTで置換されていてもよく、0.1%がTCT、TCC、AGT若しくはAGCで置換されていてもよい。
本明細書で使用される場合、「終止コドン」は、タンパク質への翻訳の終結をコードするヌクレオチドトリプレットである。典型的に、ゲノムは3つの終止コドン:TAA(「オーカー」)、TGA(「オパール」又は「ウンバー(umber)」)及びTAG(「アンバー」)を天然に含む。
一部の実施形態では、合成原核生物ゲノムは、1つ若しくは2つの終止コドンの10個若しくは9個以下、5個若しくは4個以下の出現をさらに含むか、又は出現を含まず、好ましくはアンバー終止コドン(TAG)の10個若しくは9個以下、5個若しくは4個以下の出現を含むか、又は出現を含まない。好ましくは、親原核生物ゲノムにおけるTAGの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、又は全ては、TAA(オーカー終止コドン)で置換されている。好ましい実施形態では、合成原核生物ゲノムはアンバー終止コドン(TAG)の出現を含まず、親原核生物ゲノムにおけるTAGの出現の全てはTAA(オーカー終止コドン)で置換されていてもよい。
したがって、好ましい実施形態では、本発明の合成原核生物ゲノムは、1つ若しくは2つ以上、又は2つ若しくは3つ以上のセンスコドンの出現を含まず、1つの終止コドン、好ましくはアンバー終止コドン(TAG)の出現を含まない。より好ましい実施形態では、本発明の合成原核生物ゲノムは、2つのセンスコドン、好ましくはTCG及びTCAの出現を含まず、アンバー終止コドン(TAG)の出現を含まず、親原核生物ゲノムにおけるTCG、TCA及びTAGは同義コドンで置換されていてもよく、例えば、親原核生物ゲノムにおけるTCGの出現の99.9%又はそれ以上はAGCで置換され、親原核生物ゲノムにおけるTCAの出現の99.9%又はそれ以上はAGTで置換され、親原核生物ゲノムにおけるTAGの出現の全てはTAAで置換されている。
一部の実施形態では、合成原核生物ゲノムは、配列番号1又は配列番号2に対して少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、又は99.9%同一であるポリヌクレオチド配列を含む。
本発明は、配列番号1又は配列番号2に対して少なくとも98%、98.5%、99%、99.5%、99.6%、99.7%、99.8%、99.9%、99.95%又は100%同一である合成原核生物ゲノムを提供する。
配列比較は、目測で行われてもよいか、又はより通常は、容易に利用可能な配列比較プログラムを活用して行われてもよい。これらの公的及び商業的に利用可能なコンピュータープログラムは、2つ又は3つ以上の配列の間の配列同一性を計算することができる。
配列同一性は連続する配列にわたって計算することができる、すなわち、1つの配列を他の配列と整列させ、1つの配列における各アミノ酸を、一度に1残基ずつ他の配列における対応するアミノ酸と直接比較する。これは「ギャップなし」アラインメントと呼ばれる。典型的に、このようなギャップなしアラインメントは、比較的少数の残基(例えば、50未満の連続するアミノ酸)にわたってのみ実施される。
これは非常に簡単で一貫した方法であるが、この方法は、例えば、他の点では同一の配列対において、1つの挿入又は欠失がそれに続くアミノ酸残基をアラインメントから除外することを考慮しておらず、それ故、グローバルアラインメントを実施した場合に相同性%の大幅な低下をもたらす可能性がある。それによって、ほとんどの配列比較方法は、全体的な相同性スコアに過度にペナルティを与えることなく起こり得る挿入及び欠失を考慮に入れた最適なアラインメントを生成するように設計される。これは、配列アラインメントに「ギャップ」を挿入して局所的相同性を最大化することを試みることにより達成される。
しかしながら、これらのより複雑な方法は、同数の同一アミノ酸に関して、できる限り少ないギャップ(2つの比較配列間のより高い関連性を反映する)を有する配列アラインメントが多くのギャップを有するものより高いスコアを獲得するように、アラインメント中に生じる各ギャップに「ギャップペナルティ」を割り当てる。典型的に、ギャップの存在に比較的高いコストを課し、ギャップ中の各後続残基にはより小さいペナルティを課す「アフィンギャップコスト」を使用する。これは最もよく使用されるギャップスコアリングシステムである。高いギャップペナルティは当然、より少数のギャップを有する最適化されたアラインメントを生成する。ほとんどのアラインメントプログラムは、ギャップペナルティを変更することができる。しかしながら、配列比較のためにこのようなソフトウェアを使用する場合、デフォルト値を使用することが好ましい。例えば、GCG Wisconsin Bestfitパッケージ(下記参照)を使用する場合、アミノ酸配列のデフォルトギャップペナルティは、1つのギャップに対しては-12、また各伸長に対しては-4である。
そのため、配列同一性の最大%の計算には、最初に、ギャップペナルティを考慮した最適なアラインメントの生成が必要となる。このようなアラインメントを実行するための適切なコンピュータープログラムは、GCG Wisconsin Bestfitパッケージ(University of Wisconsin, U.S.A; Devereux et al., 1984, Nucleic Acids Research 12:387)である。配列比較を実施することができる他のソフトウェアの例としては、限定するものではないが、BLASTパッケージ(Ausubel et al., 1999 ibid - Chapter 18を参照のこと)、FASTA(Atschul et al., 1990, J. Mol. Biol., 403-410)及びGENEWORKS比較ツール一式が挙げられる。BLAST及びFASTAの両方は、オフライン及びオンライン検索に利用可能である(Ausubel et al., 1999 ibid, pages 7-58から7-60を参照のこと)。しかしながら、GCG Bestfitプログラムを使用することが好ましい。
適切には、配列同一性は配列の全体にわたって決定され得る。適切には、配列同一性は、本明細書中に列挙した配列と比較される候補配列の全体にわたって決定され得る。
最終的な配列同一性は同一性の観点から測定され得るが、アラインメントプロセスそれ自体は、典型的に、全か無かの対比較に基づくものではない。その代わり、化学的類似性又は進化距離に基づいて各ペアワイズ比較にスコアを割り当てる、スケーリングした類似性スコア行列が一般に使用される。慣用されるこのような行列の例は、BLOSUM62行列(BLASTプログラム一式のためのデフォルト行列)である。GCG Wisconsinプログラムは一般に、パブリックデフォルト値又は供給される場合、カスタムシンボル比較表のいずれかを使用する(さらなる詳細についてはユーザーマニュアルを参照のこと)。好ましくは、GCGパッケージにはパブリックデフォルト値、又は他のソフトウェアの場合にはデフォルト行列、例えばBLOSUM62が使用される。
ソフトウェアにより最適なアラインメントが生成されれば、配列同一性%を計算することができる。このソフトウェアは、典型的に、これを配列比較の一環として行い、数値結果をもたらす。
リファクタリング
ゲノムは、多数の重複するオープンリーディングフレーム(ORF)を含有し、これは、3’、3’(逆向きのORFの間)又は5’、3’(同じ向きのORFの間)と分類され得る。1つ又は2つ以上のセンスコドン(すなわち、置換されるもの)は、親ゲノムにおける重複の両方のクラス内に見出され得る。
ゲノムは、多数の重複するオープンリーディングフレーム(ORF)を含有し、これは、3’、3’(逆向きのORFの間)又は5’、3’(同じ向きのORFの間)と分類され得る。1つ又は2つ以上のセンスコドン(すなわち、置換されるもの)は、親ゲノムにおける重複の両方のクラス内に見出され得る。
重複内の各ORFの1つ又は2つ以上のセンスコドンの置換が、いずれかのORFのコードされたタンパク質配列を変化させずに(すなわち、同義コドンを導入することによって)達成され得る場合、親ゲノムを編集(例えば、リファクタリング)する必要はなくてもよい。しかしながら、コードされたタンパク質配列が1つ又は2つ以上のセンスコドンの置換によって変化される(すなわち、1つ又は2つ以上の同義センスコドンがORFの一方又は両方に導入されない)場合、親ゲノムを編集(例えば、リファクタリングする)必要があり得る。
それ故、一部の実施形態では、親ゲノムにおける1つ又は2つ以上のセンスコドンを含む重複する領域を共有する1つ又は2つ以上の遺伝子対はリファクタリングされる。「リファクタリングされる」とは、遺伝子が、コードされたタンパク質配列に対する変化を阻止するために再編成されることを意味する。好ましくは、遺伝子対は、センスコドン置換(例えば、定義された同義コドン置換)が、遺伝子対の両方又はいずれかのコードされたタンパク質配列を変化させるものである。最も好ましくは、親ゲノムにおける1つ又は2つ以上のセンスコドンを含む重複する領域を共有する全ての遺伝子対はリファクタリングされ、その遺伝子対は、センスコドン置換(例えば、定義された同義コドン置換)が、遺伝子対の両方又はいずれかのコードされたタンパク質配列を変化させるものである。
3’、3’重複(すなわち、逆向きの遺伝子対)に関して、合成挿入物が遺伝子間に挿入されてもよい。3’、3’重複に関して、合成挿入物は重複する領域を含んでもよい。
5’、3’重複(すなわち、上流の遺伝子及び下流の遺伝子を含む、同じ向きの遺伝子対)に関して、合成挿入物が遺伝子間に挿入されてもよい。5’、3’重複に関して、合成挿入物は、(i)終止コドン;(ii)重複する領域の上流から約20~200bp、又は20~100bp、又は20~50bp;及び(iii)重複する領域を含んでもよい。好ましくは、合成挿入物は、(i)終止コドン;(ii)重複する領域の上流から約20bp;及び(iii)重複する領域を含む。これにより、下流のORFについてのRBSの配列及びこのRBSとその開始コドンとの間の距離が保存される。
好ましい実施形態では、終止コドンは、下流の遺伝子について元の開始部位とインフレームである。好ましくは、終止コドンはTAAである。
上記の特定の変異、すなわち、1つ又は2つ以上のセンスコドンの量を減少させることを目的とした変異(例えば、1つ若しくは2つ以上のセンスコドンの置換及び/又はリファクタリング)及びアンバー終止コドンの量を減少させることを目的とした変異とは別に、合成原核生物ゲノムは、親ゲノムと比較して、1000個又は999個以下、100個又は99個以下、50個又は49個以下、20個又は19個以下、10個又は9個以下の付加的(すなわち、プログラムされていない)変異を含んでもよい。好ましくは、合成原核生物ゲノムは、標的コドン当たり(すなわち、親ゲノムにおける1つ又は2つ以上のセンスコドンの出現当たり)2×10-4個又はそれ以下の付加的又はプログラムされていない変異を含む。
ポリヌクレオチド
本発明は、1つ又は2つ以上のセンスコドンの出現がない、1つ又は2つ以上の遺伝子を含むポリヌクレオチドを提供する。ポリヌクレオチドは、1つ又は2つ以上のセンスコドンの出現がない、2個若しくは3個以上、3個若しくは4個以上、4個若しくは5個以上、5個若しくは6個以上、10個若しくは11個以上、20個若しくは21個以上、30個若しくは31個以上、40個若しくは41個以上、50個若しくは51個以上、100個若しくは101個以上、200個若しくは201個以上、500個若しくは501個以上、600個若しくは601個以上、700個若しくは701個以上、800個若しくは801個以上、900個若しくは901個以上、1000個若しくは1001個以上、1500個若しくは1501個以上、又は2000個若しくは2001個以上の遺伝子を含んでもよい。好ましくは、ポリヌクレオチドは、1つ又は2つ以上のセンスコドンの出現がない、100個又は101個以上の遺伝子を含む。より好ましくは、ポリヌクレオチドは、1つ又は2つ以上のセンスコドンの出現がない、1000個又は1001個以上の遺伝子を含む。
本発明は、1つ又は2つ以上のセンスコドンの出現がない、1つ又は2つ以上の遺伝子を含むポリヌクレオチドを提供する。ポリヌクレオチドは、1つ又は2つ以上のセンスコドンの出現がない、2個若しくは3個以上、3個若しくは4個以上、4個若しくは5個以上、5個若しくは6個以上、10個若しくは11個以上、20個若しくは21個以上、30個若しくは31個以上、40個若しくは41個以上、50個若しくは51個以上、100個若しくは101個以上、200個若しくは201個以上、500個若しくは501個以上、600個若しくは601個以上、700個若しくは701個以上、800個若しくは801個以上、900個若しくは901個以上、1000個若しくは1001個以上、1500個若しくは1501個以上、又は2000個若しくは2001個以上の遺伝子を含んでもよい。好ましくは、ポリヌクレオチドは、1つ又は2つ以上のセンスコドンの出現がない、100個又は101個以上の遺伝子を含む。より好ましくは、ポリヌクレオチドは、1つ又は2つ以上のセンスコドンの出現がない、1000個又は1001個以上の遺伝子を含む。
1つ又は2つ以上のセンスコドンは、1つ、2つ、3つ、4つ、5つ、6つ、7つ、又は8つのセンスコドンからなってもよい。好ましくは、1つ又は2つ以上のセンスコドンは、1つのセンスコドン又は2つのセンスコドン、最も好ましくは2つのセンスコドンからなる。それ故、好ましい実施形態では、ポリヌクレオチドは、1つ又は2つのセンスコドンの出現がない、100個又は101個以上の遺伝子を含む。他の好ましい実施形態では、ポリヌクレオチドは、1つ又は2つのセンスコドンの出現がない、1000個又は1001個以上の遺伝子を含む。
1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、GCG、GCA、GTG、GTA、CTG、CTA、TTG、TTA、ACG、ACA、CCG、CCA、CGG、CGA、CGT、CGC、AGG、AGA、GGG、GGA、GGT、GGC、ATT、及びATCから選択されてもよい。あるいは、1つ又は2つ以上のセンスコドンは、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択されてもよい。好ましくは、1つ又は2つ以上のセンスコドンは、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択される。より好ましくは、1つ又は2つ以上のセンスコドンは、TCG、TCA、TTG、TTA、GCG及びGCAから選択される。最も好ましくは、1つ又は2つ以上のセンスコドンはTCG及び/又はTCAである。
遺伝子の1つ又は2つ以上のセンスコドンは同義センスコドンで置換され得る。好ましくは、置換は定義された置換であり、すなわち、1つのセンスコドンが単一の同義センスコドンで置換されている。
例えば、GCGは、GCT若しくはGCCで置換されていてもよく;GCAは、GCT若しくはGCCで置換されていてもよく;TCGは、TCT、TCC、AGT、若しくはAGCで置換されていてもよく;TCAは、TCT、TCC、AGT、若しくはAGCで置換されていてもよく;AGTは、TCG、TCA、TCT、若しくはTCCで置換されていてもよく;AGCは、TCG、TCA、TCT、若しくはTCCで置換されいててもよく;CTGは、CTT、CTC、TTG若しくはTTAで置換されいててもよく;CTAは、CTT、CTC、TTG若しくはTTAで置換されていてもよく;TTGは、CTG、CTA、CTT若しくはCTCで置換されていてもよく;又はTTAは、CTG、CTA、CTT若しくはCTCで置換されていてもよい。好ましくは、1つ又は2つ以上の定義されたセンスコドン置換は、GCGからGCT又はGCC;GCAからGCT又はGCC;TCGからAGT又はAGC;TCAからAGT又はAGC;AGTからTCA又はTCT;AGCからTCG又はTCC又はTCA;TTGからCTT;及びTTAからCTCから選択される。より好ましくは、TCG及び/又はTCAは、AGC及び/又はAGTで置換されている。最も好ましくは、TCGはAGCで置換され、及び/又はTCAはAGTで置換されている。
一部の実施形態では、遺伝子は、翻訳及び/又は予測タンパク質産物の証拠が存在するものである。
好ましい実施形態では、遺伝子は必須遺伝子である。必須遺伝子は、ribF、lspA、ispH、dapB、folA、imp、yabQ、ftsL、ftsI、murE、murF、mraY、murD、ftsW、murG、murC、ftsQ、ftsA、ftsZ、lpxC、secM、secA、can、folK、hemL、yadR、dapD、map、rpsB、tsf、pyrH、frr、dxr、ispU、cdsA、yaeL、yaeT、lpxD、fabZ、lpxA、lpxB、dnaE、accA、tilS、proS、yafF、hemB、secD、secF、ribD、ribE、thiL、dxs、ispA、dnaX、adk、hemH、lpxH、cysS、folD、entD、mrdB、mrdA、nadD、holA、rlpB、leuS、lnt、glnS、fldA、cydA、infA、cydC、ftsK、lolA、serS、rpsA、msbA、lpxK、kdsB、mukF、mukE、mukB、asnS、fabA、mviN、rne、fabD、fabG、acpP、tmk、holB、lolC、lolD、lolE、purB、minE、minD、pth、prsA、ispE、lolB、hemA、prfA、prmC、kdsA、topA、ribA、fabI、tyrS、ribC、ydiL、pheT、pheS、rplT、infC、thrS、nadE、gapA、yeaZ、aspS、argS、pgsA、yefM、metG、folE、yejM、gyrA、nrdA、nrdB、folC、accD、fabB、gltX、ligA、zipA、dapE、dapA、der、hisS、ispG、suhB、tadA、acpS、era、rnc、lepB、rpoE、pssA、yfiO、rplS、trmD、rpsP、ffh、grpE、csrA、ispF、ispD、ftsB、eno、pyrG、chpR、lgt、fbaA、pgk、yqgD、metK、yqgF、plsC、ygiT、parE、ribB、cca、ygjD、tdcF、yraL、yhbV、infB、nusA、ftsH、obgE、rpmA、rplU、ispB、murA、yrbB、yrbK、yhbN、rpsI、rplM、degS、mreD、mreC、mreB、accB、accC、yrdC、def、fmt、rplQ、rpoA、rpsD、rpsK、rpsM、secY、rplO、rpmD、rpsE、rplR、rplF、rpsH、rpsN、rplE、rplX、rplN、rpsQ、rpmC、rplP、rpsC、rplV、rpsS、rplB、rplW、rplD、rplC、rpsJ、fusA、rpsG、rpsL、trpS、yrfF、asd、rpoH、ftsX、ftsE、ftsY、yhhQ、bcsB、glyQ、gpsA、rfaK、kdtA、coaD、rpmB、dfp、dut、gmk、spoT、gyrB、dnaN、dnaA、rpmH、rnpA、yidC、tnaB、glmS、glmU、wzyE、hemD、hemC、yigP、ubiB、ubiD、hemG、yihA、ftsN、murI、murB、birA、secE、nusG、rplJ、rplL、rpoB、rpoC、ubiA、plsB、lexA、dnaB、ssb、alsK、groS、psd、orn、yjeE、rpsR、chpS、ppa、valS、yjgP、yjgQ、及びdnaCからなるリストのうちの1つ又は2つ以上から選択されてもよい。
好ましくは、必須遺伝子は、ribF、lspA、ispH、dapB、folA、imp、yabQ、lpxC、secM、secA、can、folK、hemL、yadR、dapD、map、rpsB、tsf、pyrH、frr、dxr、ispU、cdsA、yaeL、yaeT、lpxD、fabZ、lpxA、lpxB、dnaE、accA、tilS、proS、yafF、hemB、secD、secF、ribD、ribE、thiL、dxs、ispA、dnaX、adk、hemH、lpxH、cysS、folD、entD、mrdB、mrdA、nadD、holA、rlpB、leuS、lnt、glnS、fldA、cydA、infA、cydC、ftsK、lolA、serS、rpsA、msbA、lpxK、kdsB、mukF、mukE、mukB、asnS、fabA、mviN、rne、fabD、fabG、acpP、tmk、holB、lolC、lolD、lolE、purB、minE、minD、pth、prsA、ispE、lolB、hemA、prfA、prmC、kdsA、topA、ribA、fabI、tyrS、ribC、ydiL、pheT、pheS、rplT、infC、thrS、nadE、gapA、yeaZ、aspS、argS、pgsA、yefM、metG、folE、yejM、gyrA、nrdA、nrdB、folC、accD、fabB、gltX、ligA、zipA、dapE、dapA、der、hisS、ispG、suhB、tadA、acpS、era、rnc、lepB、rpoE、pssA、yfiO、rplS、trmD、rpsP、ffh、grpE、csrA、ispF、ispD、ftsB、eno、pyrG、chpR、lgt、fbaA、pgk、yqgD、metK、yqgF、plsC、ygiT、parE、ribB、cca、ygjD、tdcF、yraL、yhbV、infB、nusA、ftsH、obgE、rpmA、rplU、ispB、murA、yrbB、yrbK、yhbN、rpsI、rplM、degS、mreD、mreC、mreB、accB、accC、yrdC、def、fmt、rplQ、rpoA、rpsD、rpsK、rpsM、secY、rplO、rpmD、rpsE、rplR、rplF、rpsH、rpsN、rplE、rplX、rplN、rpsQ、rpmC、rplP、rpsC、rplV、rpsS、rplB、rplW、rplD、rplC、rpsJ、fusA、rpsG、rpsL、trpS、yrfF、asd、rpoH、ftsX、ftsE、ftsY、yhhQ、bcsB、glyQ、gpsA、rfaK、kdtA、coaD、rpmB、dfp、dut、gmk、spoT、gyrB、dnaN、dnaA、rpmH、rnpA、yidC、tnaB、glmS、glmU、wzyE、hemD、hemC、yigP、ubiB、ubiD、hemG、yihA、ftsN、murI、murB、birA、secE、nusG、rplJ、rplL、rpoB、rpoC、ubiA、plsB、lexA、dnaB、ssb、alsK、groS、psd、orn、yjeE、rpsR、chpS、ppa、valS、yjgP、yjgQ、及びdnaCからなるリストのうちの1つ又は2つ以上から選択されてもよい。
したがって、本発明は、TCGコドン及び/又はTCAコドンがない、1つ又は2つ以上の必須遺伝子を含むポリヌクレオチドを提供し、その1つ又は2つ以上の必須遺伝子は、ribF、lspA、ispH、dapB、folA、imp、yabQ、lpxC、secM、secA、can、folK、hemL、yadR、dapD、map、rpsB、tsf、pyrH、frr、dxr、ispU、cdsA、yaeL、yaeT、lpxD、fabZ、lpxA、lpxB、dnaE、accA、tilS、proS、yafF、hemB、secD、secF、ribD、ribE、thiL、dxs、ispA、dnaX、adk、hemH、lpxH、cysS、folD、entD、mrdB、mrdA、nadD、holA、rlpB、leuS、lnt、glnS、fldA、cydA、infA、cydC、ftsK、lolA、serS、rpsA、msbA、lpxK、kdsB、mukF、mukE、mukB、asnS、fabA、mviN、rne、fabD、fabG、acpP、tmk、holB、lolC、lolD、lolE、purB、minE、minD、pth、prsA、ispE、lolB、hemA、prfA、prmC、kdsA、topA、ribA、fabI、tyrS、ribC、ydiL、pheT、pheS、rplT、infC、thrS、nadE、gapA、yeaZ、aspS、argS、pgsA、yefM、metG、folE、yejM、gyrA、nrdA、nrdB、folC、accD、fabB、gltX、ligA、zipA、dapE、dapA、der、hisS、ispG、suhB、tadA、acpS、era、rnc、lepB、rpoE、pssA、yfiO、rplS、trmD、rpsP、ffh、grpE、csrA、ispF、ispD、ftsB、eno、pyrG、chpR、lgt、fbaA、pgk、yqgD、metK、yqgF、plsC、ygiT、parE、ribB、cca、ygjD、tdcF、yraL、yhbV、infB、nusA、ftsH、obgE、rpmA、rplU、ispB、murA、yrbB、yrbK、yhbN、rpsI、rplM、degS、mreD、mreC、mreB、accB、accC、yrdC、def、fmt、rplQ、rpoA、rpsD、rpsK、rpsM、secY、rplO、rpmD、rpsE、rplR、rplF、rpsH、rpsN、rplE、rplX、rplN、rpsQ、rpmC、rplP、rpsC、rplV、rpsS、rplB、rplW、rplD、rplC、rpsJ、fusA、rpsG、rpsL、trpS、yrfF、asd、rpoH、ftsX、ftsE、ftsY、yhhQ、bcsB、glyQ、gpsA、rfaK、kdtA、coaD、rpmB、dfp、dut、gmk、spoT、gyrB、dnaN、dnaA、rpmH、rnpA、yidC、tnaB、glmS、glmU、wzyE、hemD、hemC、yigP、ubiB、ubiD、hemG、yihA、ftsN、murI、murB、birA、secE、nusG、rplJ、rplL、rpoB、rpoC、ubiA、plsB、lexA、dnaB、ssb、alsK、groS、psd、orn、yjeE、rpsR、chpS、ppa、valS、yjgP、yjgQ、及びdnaCからなるリストから選択される。好ましくは、ポリヌクレオチドは、TCGコドン及び/又はTCAコドンがない、2つ若しくは3つ以上、3つ若しくは4つ以上、4つ若しくは5つ以上、5つ若しくは6つ以上、10個若しくは11個以上、20個若しくは21個以上、30個若しくは31個以上、40個若しくは41個以上、50個若しくは51個以上、100個若しくは101個以上、又は200個若しく201個以上の必須遺伝子を含む。
一部の実施形態では、ポリヌクレオチドは、配列番号1若しくは配列番号2に対して又は配列番号1若しくは配列番号2のいずれかの断片に対して少なくとも80%、85%、90%、95%、98%、99%、99.5%、99.8%、若しくは99.9%、又は100%同一であるポリヌクレオチド配列を含み、好ましくはその断片は、少なくとも10kb、20kb、50kb、100kb、又は500kbの長さである。
好ましくは、ポリヌクレオチドは生存可能である。すなわち、ポリヌクレオチドは、ゲノムが生存可能なゲノムであるようにゲノムに取り込まれ得る。好ましくは、ポリヌクレオチドは、親ゲノムの対応する領域を置換し、前記ゲノムの生存能を保持することができる。本明細書で使用される場合、「生存可能なゲノム」とは、細胞の生存能を引き起こし、及び/又は維持するのに十分な核酸配列を含有するゲノム、例えば、複製、転写、翻訳、エネルギー産生、輸送、膜及び細胞質成分の産生、並びに細胞分裂に必要とされる分子をコードするゲノムを指す。それ故、本発明はまた、本発明のポリヌクレオチドを含む生存可能な合成原核生物ゲノム(例えば、生存可能な合成大腸菌ゲノム)を提供する。
本発明は、配列番号1若しくは配列番号2に対して又は配列番号1若しくは配列番号2のいずれかの断片に対して少なくとも98%、98.5%、99%、99.5%、99.6%、99.7%、99.8%、99.9%、99.95%又は100%同一であるポリヌクレオチドを提供し、好ましくはその断片は、少なくとも10kb、20kb、50kb、100kb、又は500kbの長さである。
宿主細胞及びその使用
宿主細胞
本発明はまた、本発明の合成原核生物ゲノム又はポリヌクレオチドを含む宿主細胞を提供する。宿主細胞は単離された宿主細胞であり得る。
宿主細胞
本発明はまた、本発明の合成原核生物ゲノム又はポリヌクレオチドを含む宿主細胞を提供する。宿主細胞は単離された宿主細胞であり得る。
本発明の宿主細胞は原核生物細胞である。より好ましくは、宿主細胞は細菌細胞である。好ましくは、細菌宿主細胞は、異種タンパク質産生、特に、1つ又は2つ以上の非タンパク質性アミノ酸(例えば、Ferrer-Miralles, N. and Villaverde, A., 2013. Microbial Cell Factories, 12:113に記載されているもの)を含むポリペプチドの産生に適している。適切な細菌宿主細胞としては、エシェリキア(例えば、大腸菌)、カウロバクテリア(例えば、カウロバクター・クレセンタス)、光合成細菌(例えば、ロドバクター・スフェロイデス)、低温適応型細菌(例えば、シュードアルテロモナス・ハロプランクティス、シェワネラ属種株Ac10)、シュードモナス(例えば、シュードモナス・フルオレッセンス、シュードモナス・プチダ、シュードモナス・エルギノーザ)、好塩性細菌(例えば、ハロモナス・エロンガタ、クロモハロバクター・サレキシゲンス)、ストレプトミセテス(例えば、ストレプトマイセス・リビダンス、ストレプトマイセス・グリゼウス)、ノカルディア(例えば、ノカルディア・ラクタムジュランス)、マイコバクテリア(例えば、マイコバクテリウム・スメグマティス)、コリネフォーム細菌(例えば、コリネバクテリウム・グルタミクム、コリネバクテリウム・アンモニアゲネス、ブレビバクテリウム・ラクトファーメンタム)、バシラス(例えば、バシラス・サチリス、バシラス・ブレビス、バシラス・メガテリウム、バシラス・リケニフォルミス、バシラス・アミロリケファシエンス)、及び乳酸菌(例えば、ラクトコッカス・ラクチス、ラクトバチルス・プランタルム、ラクトバチルス・カゼイ、ラクトバチルス・ロイテリ、ラクトバチルス・ガセリ)が挙げられる。一部の実施形態では、細菌宿主細胞はグラム陰性細菌である。
好ましくは、宿主細胞は、大腸菌、サルモネラ・エンテリカ、又は志賀赤痢菌である。より好ましくは、宿主細胞は大腸菌である。適切な大腸菌宿主細胞としては、MDS42、K-12、MG1655、BL21、BL21(DE3)、AD494、Origami、HMS174、BLR(DE3)、HMS174(DE3)、Tuner(DE3)、Origami2(DE3)、Rosetta2(DE3)、Lemo21(DE3)、NiCo21(DE3)、T7 Express、SHuffle Express、C41(DE3)、C43(DE3)、及びm15 pREP4又はそれらの誘導体が挙げられる(Rosano, G.L. and Ceccarelli, E.A., 2014. Frontiers in microbiology, 5, p.172)。最も好ましくは、宿主細胞は、MDS42、MG1655、若しくはBL21又はそれらの誘導体である。MG1655は大腸菌の野生型株と見なされる。この株のゲノム配列のジェンバンクIDは、U00096である。BL21は広範に市販されている。例えば、それは、カタログ番号C2530HでNew England BioLabs社から購入することができる。
宿主細胞は、好ましくは、合成原核生物ゲノム又はポリヌクレオチドが存在していたものからの(又は由来する)ものと同じであってもよい。例えば、合成原核生物ゲノムが合成大腸菌ゲノムである場合、宿主細胞は好ましくは大腸菌である。細胞の親ゲノムが、本発明の合成原核生物ゲノムを産生するように修飾されている場合、宿主細胞は好ましくは同じ細胞であり、すなわち、好ましくは合成原核生物ゲノムを含む宿主細胞は親ゲノムの宿主細胞(親宿主細胞)と同じである。
宿主細胞は生存可能であり得る、すなわち、増殖及び複製することができる。
細胞のゲノムが、本発明の合成原核生物ゲノムを産生するように修飾されている場合、合成原核生物ゲノムは、好ましくは、親宿主細胞に存在する場合、増殖速度を実質的に減少させないものである。それ故、好ましくは、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞と比較して増殖速度を実質的に減少させない。一部の実施形態では、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞より4倍、3倍、2倍、又は約1.6倍未満遅い倍加時間を有する。倍加時間は、当業者に公知の任意の方法によって決定することができる。一部の実施形態では、倍加時間は、LB培地中で37℃、25℃又は42℃で決定される。
細胞のゲノムが、本発明の合成原核生物ゲノムを産生するように修飾されている場合、合成原核生物ゲノムは、好ましくは、親宿主細胞に存在する場合、あらゆる実質的な表現型の変化を引き起こさないものである。それ故、好ましくは、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞と比較してあらゆる実質的な表現型の変化を有さない。一部の実施形態では、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞より100%、50%、又は約20%未満長い平均細胞長を有する。例えば、細胞長は、約1.5~3ミクロンであってもよい。細胞長は当業者に公知の任意の方法によって決定することができる。一部の実施形態では、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞のプロテオームと実質的に異ならないプロテオームを有する。プロテオームは、当業者に公知の任意の方法によって決定することができる。
代替のカノニカルアミノ酸への再割当
一部の実施形態では、1つ又は2つ以上のセンスコドン(すなわち、親ゲノムから除去されているもの)は、代替のカノニカルアミノ酸をコードするように再割当される。例えば、TCG及びTCAが除去されている場合、一方又は両方は、セリン以外のカノニカルアミノ酸(例えば、アラニン)をコードするように再割当され得る。
一部の実施形態では、1つ又は2つ以上のセンスコドン(すなわち、親ゲノムから除去されているもの)は、代替のカノニカルアミノ酸をコードするように再割当される。例えば、TCG及びTCAが除去されている場合、一方又は両方は、セリン以外のカノニカルアミノ酸(例えば、アラニン)をコードするように再割当され得る。
例えば、本発明の合成原核生物ゲノムは、1つ又は2つ以上のセンスコドンを実質的又は完全に欠いている。そのため、1つ又は2つ以上のtRNA又は終結因子は合成ゲノムから削除されてもよい。例えば、置換(又は削除)されている1つ又は2つ以上のセンスコドンを解読するtRNAは合成原核生物ゲノムから削除されてもよい。置換(又は削除)されている1つ又は2つ以上のセンスコドンを解読するtRNAは削除されてもよく、tRNAが、置換(又は削除)されている1つ又は2つ以上のセンスコドンのみを解読する場合、又は代替としてtRNAが、置換(又は削除)されている1つ若しくは2つ以上のセンスコドン及び置換(又は削除)されていない1つ若しくは2つ以上のセンスコドンを解読する場合、tRNAが、置換(又は削除)されていない1つ若しくは2つ以上のセンスコドンについて非必須である(すなわち、tRNAが解読する1つ若しくは残りのセンスコドンが1つ若しくは2つ以上の代替のtRNAによって解読される)場合、合成原核生物ゲノムは生存可能なままである。例えば、合成原核生物ゲノムがTCAセンスコドンを欠く場合、tRNASer
UGAをコードするserTは削除されてもよく、及び/又は合成原核生物ゲノムがTCGセンスコドンを欠く場合、tRNASer
CGAをコードするserUは削除されてもよい。1つ又は2つ以上のtRNAの削除は、例えば、再割当された内在性tRNA又は直交アミノアシル-tRNA合成酵素/tRNA対と組み合わせて使用されて、1つ又は2つ以上のセンスコドンを代替のアミノ酸へ再割当することができる。
例えば、TCG及びTCAが合成原核生物ゲノムから除去されている場合、tRNASer
UGAをコードするserT、及びtRNASer
CGAをコードするserUは、合成原核生物ゲノムから削除されてもよく、いずれかのtRNACGAを(例えばtRNAAla
CGAに)再割当することができ、直交アミノアシル-tRNA合成酵素/tRNACGA対を(例えば、異種核酸によって又は合成原核生物ゲノムへの取り込みによって)宿主細胞に導入してTCGを代替のカノニカルアミノ酸へ再割当することができる。それ故、一部の実施形態では、本発明の宿主細胞は、1つ若しくは2つ以上の再割当されたtRNA及び/又は1つの直交アミノアシル-tRNA合成酵素(aaRS,aminoacyl-tRNA synthetase)-tRNA対をコードする1つ若しくは2つ以上の異種ヌクレオチド(例えばプラスミド)をさらに含む。一部の実施形態では、本発明の宿主細胞は、直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対をコードするプラスミドをさらに含む。あるいは、直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対は、合成原核生物ゲノムへの取り込みによって宿主細胞に導入され得る。それ故、一部の実施形態では、合成原核生物ゲノムは直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対をコードし、好ましくは天然tRNAをコードする遺伝子は親原核生物ゲノムから削除されている。好ましい実施形態では、本発明の宿主細胞は1つ又は2つ以上の再割当されたtRNAをさらに含む。tRNAを再割当するための方法は当業者に周知である。
代替のカノニカルアミノ酸をコードするための再割当はバイオセーフティーを増加させることができる。それ故、一部の実施形態では、本発明の宿主細胞はバイオセーフティーを増加させている。したがって、本発明はバイオセーフティーが改善された宿主細胞を提供する。
例えば、代替のカノニカルアミノ酸をコードするための再割当は、合成原核生物ゲノムを含む宿主細胞をバクテリオファージ感染に対して耐性にすることができる。1つ又は2つ以上のバクテリオファージ遺伝子は典型的に1つ又は2つ以上のセンスコドンを含むので、1つ又は2つ以上のバクテリオファージ遺伝子が翻訳される場合、代替のカノニカルアミノ酸は、対応するバクテリオファージタンパク質に取り込まれ得る。代替のカノニカルアミノ酸の取り込みは、前記タンパク質の活性を不安定化し、破壊し、又は低減させ得るので、バクテリオファージの感染性を低減させ、宿主細胞をバクテリオファージ感染に対して耐性にする。
それ故、一部の実施形態では、本発明の宿主細胞はファージ感染に対して耐性がある。例えば、細胞のゲノムが本発明の合成原核生物ゲノムを産生するように修飾されている場合、合成原核生物ゲノムは、親宿主細胞に存在する場合、ファージ感染に対する耐性を増加させるものであり得る。それ故、一部の実施形態では、合成原核生物ゲノムを含む宿主細胞は、親ゲノムを含む宿主細胞と比較してファージ耐性が増加している。
したがって、本発明は、ファージ耐性宿主細胞及びファージ耐性が増加している宿主細胞を提供する。
また、代替のカノニカルアミノ酸をコードするための再割当により、遺伝物質、例えば、抗生物質耐性遺伝子を、それらが野生型株ではなく、書き換えられた株において機能的であるように設計することを可能にすることができる。例えば、宿主細胞がある特定の条件(例えば、抗生物質の存在下)で増殖するが、他の宿主細胞(例えば、親宿主細胞)は増殖しないように、遺伝物質は、(例えば、異種核酸によって又は合成原核生物ゲノムへの取り込みによって)本発明の宿主細胞に取り込まれ得る。それ故、一部の実施形態では、本発明の宿主細胞は、宿主細胞を含む組成物を、他の宿主細胞(例えば、他の原核生物)による夾雑に対して、より耐性にすることができる。
非タンパク質性アミノ酸への再割当
一部の実施形態では、1つ又は2つ以上のセンスコドン(すなわち、親ゲノムから除去されたもの)は、非カノニカルアミノ酸(非タンパク質性アミノ酸)をコードするように再割当される。
一部の実施形態では、1つ又は2つ以上のセンスコドン(すなわち、親ゲノムから除去されたもの)は、非カノニカルアミノ酸(非タンパク質性アミノ酸)をコードするように再割当される。
それ故、本発明は、1つ又は2つ以上の非タンパク質性アミノ酸、好ましくは2つ又は3つ以上の非タンパク質性アミノ酸、最も好ましくは3つ又は4つ以上の非タンパク質性アミノ酸を含むポリペプチドを産生するための本発明による宿主細胞の使用を提供する。
本発明はまた、本発明による宿主細胞を使用することによって得られた又は得ることができるポリペプチドを提供する。一部の実施形態では、ポリペプチドは、1つ又は2つ以上の非タンパク質性アミノ酸、好ましくは2つ又は3つ以上の非タンパク質性アミノ酸、最も好ましくは3つ又は4つ以上の非タンパク質性アミノ酸を含む。それ故、本発明はまた、2つ又は3つ以上の非タンパク質性アミノ酸を含むポリペプチド及び3つ又は4つ以上の非タンパク質性アミノ酸を含むポリペプチドを提供する。
本明細書で使用される場合、「非タンパク質性アミノ酸」(「非コードアミノ酸」又は「非カノニカルアミノ酸」としても知られている)は、天然にコードされていないか、又は遺伝コードに見出されないアミノ酸である。タンパク質を組み立てるための翻訳機構による22種のみのアミノ酸(タンパク質性アミノ酸、すなわち、標準的な遺伝コードの20種及び特別な翻訳機構によって取り込まれ得る追加の2種)の使用にもかかわらず、140種を超えるアミノ酸が、タンパク質中に天然に存在することが知られており、さらに数千種が天然に存在し得るか、又は実験室で合成され得る。それ故、非タンパク質性アミノ酸は、L-アラニン、L-システイン、L-アスパラギン酸、L-グルタミン酸、L-フェニルアラニン、グリシン、L-ヒスチジン、L-イソロイシン、L-リジン、L-ロイシン、L-メチオニン、L-アスパラギン、L-プロリン、L-グルタミン、L-アルギニン、L-セリン、L-トレオニン、L-バリン、L-トリプトファン及びL-チロシン、並びに任意にL-ピロリジン及びL-セレノシステインを除外する任意のアミノ酸を含み得る。
一部の実施形態では、非タンパク質性アミノ酸は非天然アミノ酸(UAA)である。
非タンパク質性アミノ酸又はUAAは特に限定されない。適切な非タンパク質性アミノ酸及びUAAは当業者に周知であり、例えば、Neumann, H., 2012. FEBS letters, 586(15), pp.2057-2064;及びLiu, C.C. and Schultz, P.G., 2010. Annual review of biochemistry, 79, pp.413-444に開示されているものがある。一部の実施形態では、非タンパク質性アミノ酸及び/又はUAAは、p-アセチルフェニルアラニン、m-アセチルフェニルアラニン、O-アリルチロシン、フェニルセレノシステイン、p-プロパルギルオキシフェニルアラニン、p-アジドフェニルアラニン、p-ボロノフェニルアラニン、O-メチルチロシン、p-アミノフェニルアラニン、p-シアノフェニルアラニン、m-シアノフェニルアラニン、p-フルオロフェニルアラニン、p-ヨードフェニルアラニン、p-ブロモフェニルアラニン、p-ニトロフェニルアラニン、L-DOPA、3-アミノチロシン、3-ヨードチロシン、p-イソプロピルフェニルアラニン、3-(2-ナフチル)アラニン、ビフェニルアラニン、ホモグルタミン、D-チロシン、p-ヒドロキシフェニル乳酸、2-アミノカプリル酸、ビピリジルアラニン、HQ-アラニン、p-ベンゾイルフェニルアラニン、o-ニトロベンジルシステイン、o-ニトロベンジルセリン、4,5-ジメトキシ-2-ニトロベンジルセリン、o-ニトロベンジルリジン、o-ニトロベンジルチロシン、2-ニトロフェニルアラニン、ダンシルアラニン、p-カルボキシメチルフェニルアラニン、3-ニトロチロシン、スルホチロシン、アセチルリジン、メチルヒスチジン、2-アミノノナン酸、2-アミノデカン酸、ピロリジン、Cbz-リジン、Boc-リジン及びアリルオキシカルボニルリジンのうちの1つ又は2つ以上から選択される。
原核生物、例えば大腸菌は典型的に、ユビキチン化、グリコシル化及びリン酸化などの、ほとんどの真核生物の翻訳後修飾を取り込むことができず、また、それらは典型的に、他の真核生物成熟プロセス、及びタンパク質分解性のタンパク質成熟を行うこともできない。さらに、正確なジスルフィド結合形成及びリポ多糖夾雑が厄介になる可能性がある(Ovaa, H., 2014. Frontiers in chemistry, 2, p.15を参照のこと)。しかしながら、抗体、酵素及びサイトカインなどの治療用タンパク質は、通常、翻訳後修飾及びジスルフィド結合を保ち、多くの場合、それらの正確に折り畳まれた状態を達成するためにタンパク質分解性成熟を必要とする。それ故、大多数の治療用タンパク質は真核生物及び哺乳動物細胞系において産生される。しかしながら、原核生物宿主細胞、例えば大腸菌における発現は、一般に安価で、遺伝子修飾を受けやすく、変異ライブラリー開発に関して用途が広く、工業規模の発酵に適している(Ovaa, H., 2014. Frontiers in chemistry, 2, p.15)。
それ故、一部の実施形態では、ポリペプチドは治療用ポリペプチドであり、好ましくは、哺乳動物のタンパク質修飾が1つ又は2つ以上の非タンパク質性アミノ酸によって導入されている。例えば、アンバーコドン抑制が、1つ又は2つ以上の非タンパク質性アミノ酸(すなわち、哺乳動物のタンパク質修飾)を治療用ポリペプチドに取り込むために以前に使用されている。本発明は2つ又は3つ以上の非タンパク質性アミノ酸を取り込むことを可能にする。それ故、本発明は、2つ又は3つ以上の非タンパク質性アミノ酸を含む治療用ポリペプチドを提供する。
本発明の合成原核生物ゲノムは1つ又は2つ以上のセンスコドンを実質的又は完全に欠いているので、1つ又は2つ以上のtRNA又は終結因子は合成ゲノムから削除されてもよい。例えば、置換(又は削除)されている1つ又は2つ以上のセンスコドンのみを解読するtRNAは合成原核生物ゲノムから削除されてもよい。例えば、合成原核生物ゲノムがTCAセンスコドンを欠く場合、tRNASer
UGAをコードするsetTは削除されてもよく、及び/又は合成原核生物ゲノムがTCGセンスコドンを欠く場合、tRNASer
CGAをコードするserUは削除されてもよい。次いで合成原核生物ゲノムが、非タンパク質性アミノ酸のタンパク質への取り込みを導くために(直交アミノアシル-tRNA合成酵素-tRNA対と併せて)使用されてもよい。
遺伝子コード拡張は、所望の遺伝子における望ましい部位に導入された割り当てられていないコドン(例えば、アンバー終止コドン、UAG)に応答して、非タンパク質性アミノ酸のタンパク質への取り込みを導くために直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対を使用する。直交合成酵素は内在性tRNAを認識せず、細胞に提供される(又は細胞によって合成される)非タンパク質性アミノ酸で直交コグネイトtRNA(内在性合成酵素の効果的な基質ではない)を特異的にアミノアシル化する(Chin, J.W., 2017. Nature, 550(7674), 53-60)。当業者は、適切な直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対を同定及び/又は生成することができる(例えば、Elliott, T. S. et al., 2014. Nat Biotechnol 32, 465-472; Elliott, T. S., et al., 2016. Cell Chem Biol 23, 805-815;及びKrogager, T. P. et al., 2018. Nat Biotechnol 36, 156-159)。それ故、一部の実施形態では、本発明の宿主細胞は、1つの直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対をコードする1つ又は2つ以上の異種ヌクレオチド(例えば、プラスミド)をさらに含む。好ましい実施形態では、本発明の宿主細胞は、直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対をコードするプラスミドをさらに含む。あるいは、直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対は、合成原核生物ゲノムへ取り込むことによって宿主細胞に導入され得る。それ故、一部の実施形態では、合成原核生物ゲノムは直交アミノアシル-tRNA合成酵素(aaRS)-tRNA対をコードし、好ましくは、天然tRNAをコードする遺伝子は親原核生物ゲノムから削除されている。
それ故、一部の実施形態では、本発明の宿主細胞は、前記センスコドンを含む1つ又は2つ以上の遺伝子を含む1つ又は2つ以上の異種ヌクレオチド(例えば、プラスミド)をさらに含む。好ましい実施形態では、宿主細胞は、前記センスコドンを含む遺伝子を含むプラスミドをさらに含む。1つ又は2つ以上のセンスコドンは遺伝子の望ましい部位に存在し得、好ましくは、その望ましい部位により、1つ又は2つ以上の非タンパク質性アミノ酸(すなわち、哺乳動物のタンパク質修飾)のポリペプチド、好ましくは治療用ポリペプチドへの取り込みが可能になる。
他の実施形態では、前記センスコドンは、合成原核生物ゲノムにおける1つ又は2つ以上の遺伝子に存在し得る(例えば、異種ヌクレオチドは合成原核生物ゲノムに取り込まれ得る)。1つ又は2つ以上のセンスコドンは遺伝子の望ましい部位に存在し得、好ましくは、その望ましい部位により、1つ又は2つ以上の非タンパク質性アミノ酸(すなわち、哺乳動物のタンパク質修飾)のポリペプチド、好ましくは治療用ポリペプチドへの取り込みが可能になる。
例えば、TCG及びTCAが合成原核生物ゲノムから除去されている場合、tRNASer
UGAをコードするserT、及びtRNASer
CGAをコードするserUは、合成原核生物ゲノムから削除されてもよく、直交アミノアシル-tRNA合成酵素/tRNACGA対が、1つ又は2つ以上の非タンパク質性アミノ酸を含むポリペプチドをコードするように、TCGコドンを含む(異種)遺伝子と組み合わせて使用されてもよい。それ故、本発明の宿主細胞は、例えば、(i)直交アミノアシル-tRNA合成酵素/tRNACGA対をコードするプラスミド;及び(ii)1つ又は2つ以上のTCGコドンを含む遺伝子を含むプラスミドをさらに含んでもよい。同様に、AGT及びAGCが除去される場合、tRNASer
GCUをコードするserVは合成原核生物ゲノムから削除されてもよく、直交アミノアシル-tRNA合成酵素/tRNAACU対及び/又は直交アミノアシル-tRNA合成酵素/tRNAGCU対が使用されてもよい。同様に、CTG及びCTAが除去される場合、tRNALeu
CAGをコードするleuP、Q、T、V、及びtRNALeu
UAGをコードするleuWは、合成原核生物ゲノムから削除されてもよく、直交アミノアシル-tRNA合成酵素/tRNACAG対が使用されてもよい。同様に、TTG及びTTAが除去される場合、tRNALeu
CAAをコードするleuX、及びtRNALeu
UAAをコードするleuZは、合成原核生物ゲノムから削除されてもよく、直交アミノアシル-tRNA合成酵素/tRNACAA対及び/又は直交アミノアシル-tRNA合成酵素/tRNAUAA対が使用されてもよい。同様に、GCG及びGCAが除去される場合、tRNAAla
UGCをコードするalaT、U、Vは、合成原核生物ゲノムから削除されてもよく、直交アミノアシル-tRNA合成酵素/tRNACGC対が使用されてもよい。
一部の実施形態では、合成原核生物ゲノムは終結因子(例えば、RF1)をコードする遺伝子を欠き、及び/又は宿主細胞は非タンパク質性アミノ酸の組み込みの効率を増加させるために終結因子(例えば、RF1)を欠く。
合成ゲノムを産生するための方法
一態様では、本発明は、合成ゲノムを産生するための方法であって、
(a)親ゲノムを準備するステップと、
(b)親ゲノムに対して組換えを介した遺伝子改変の1回又は2回以上のラウンドを実行して、2つ又は3つ以上の異なる部分的合成ゲノムを産生するステップと、
(c)2つ又は3つ以上の異なる部分的合成ゲノムとの誘導コンジュゲーションの1回又は2回以上のラウンドを実行して、合成ゲノムを産生するステップと
を含む方法を提供する。
一態様では、本発明は、合成ゲノムを産生するための方法であって、
(a)親ゲノムを準備するステップと、
(b)親ゲノムに対して組換えを介した遺伝子改変の1回又は2回以上のラウンドを実行して、2つ又は3つ以上の異なる部分的合成ゲノムを産生するステップと、
(c)2つ又は3つ以上の異なる部分的合成ゲノムとの誘導コンジュゲーションの1回又は2回以上のラウンドを実行して、合成ゲノムを産生するステップと
を含む方法を提供する。
組換えを介した遺伝子改変
好ましくは、組換えを介した遺伝子改変の1回又は2回以上のラウンドが、2つ又は3つ以上の異なる部分的合成ゲノムを提供するために、親ゲノムの10~1000kb、50~1000kb、100~1000kb、又は100~500kbを編集するために使用される。それ故、好ましい実施形態では、組換えを介した遺伝子改変の各ラウンドにより、親ゲノムのDNAの10kb若しくはそれ以上、50kb若しくはそれ以上、100kb若しくはそれ以上、又は約100kbが挿入又は置換されている。
好ましくは、組換えを介した遺伝子改変の1回又は2回以上のラウンドが、2つ又は3つ以上の異なる部分的合成ゲノムを提供するために、親ゲノムの10~1000kb、50~1000kb、100~1000kb、又は100~500kbを編集するために使用される。それ故、好ましい実施形態では、組換えを介した遺伝子改変の各ラウンドにより、親ゲノムのDNAの10kb若しくはそれ以上、50kb若しくはそれ以上、100kb若しくはそれ以上、又は約100kbが挿入又は置換されている。
本明細書で使用される場合、「組換えを介した遺伝子改変」(「リコンビニアリング」としても知られている)という用語は、相同組換え系に基づく遺伝子改変(すなわち、ゲノム編集)のための方法である。典型的に、リコンビニアリングは、バクテリオファージタンパク質である、Racプロファージ由来のRecE/RecT又はバクテリオファージラムダ由来のレッドαβδによって媒介される大腸菌における相同組換えに基づく。組換えを介した遺伝子改変の任意の適切な方法が使用されてもよい。組換えを介した遺伝子改変のための方法は当業者に周知である。
「古典的組換え」(大腸菌におけるラムダレッドを介した組換えによって例示される)では、合成DNAの短い領域がゲノムに挿入され得るか、又は2段階プロセス:i)合成DNAのストレッチを保ち、陽性選択マーカーと連結し、ゲノムの標的領域の各末端に相同領域(HR)が隣接した直鎖状二本鎖DNA(dsDNA)による細胞の形質転換、及び(ii)相同領域によって媒介される組換え、その後の陽性選択マーカーによるゲノム組み込みについての選択においてゲノムDNAを置換するために使用され得る。このアプローチは、ゲノムDNAの2~3kbを挿入又は置換するために使用され得る。それ故、古典的組換えが使用される場合、多くのラウンドの組換えを介した遺伝子改変が親ゲノムの100~500kbを編集するために必要とされる。
それ故、好ましい実施形態では、組換えを介した遺伝子改変の1回又は2回以上のラウンドは、プログラムされた組換えによるゲノム改変強化のためのレプリコン切除(REXER)の1回又は2回以上のラウンドを含む。
REXERは、国際公開第2018/020248号パンフレット(参照により本明細書に組み込まれる)に記載されている。REXERの各ラウンドは、親ゲノムのDNAの約50kb~250kb、又は約100kbを挿入又は置換するために使用され得る。
それ故、組換えを介した遺伝子改変の1回又は2回以上のラウンドは、
i)宿主細胞(例えば、大腸菌)を準備するステップであって、その宿主細胞はエピソームレプリコン(例えば、プラスミド又は細菌人工染色体)及び標的核酸(例えば、ゲノム)を含み、そのエピソームレプリコンはドナー核酸配列(すなわち、合成領域)を含み、そのドナー核酸配列は順番に、5’-相同組換え配列1-所望の配列-相同組換え配列2-3’を含み、その所望の配列は陽性選択可能マーカーを含み、その標的核酸は順番に、5’-相同組換え配列1-陰性選択可能マーカー-相同組換え配列2-3’を含む、ステップ、
ii)前記宿主細胞における核酸組換えを支持することができるヘルパータンパク質(例えば、ラムダレッドタンパク質)を準備するステップ、
iii)前記宿主細胞における核酸切除を支持することができるヘルパータンパク質及び/又はRNA(例えば、CRISPR/Cas9タンパク質/RNA)を準備するステップ、
iv)前記ドナー核酸配列の切除を誘導するステップ、
v)切除されたドナー核酸と前記標的核酸との間の組換えを可能にするようにインキュベートするステップ、並びに
vi)前記ドナー核酸を前記標的核酸へ取り込んだ組換え体を選択するステップ
を含んでもよい。
i)宿主細胞(例えば、大腸菌)を準備するステップであって、その宿主細胞はエピソームレプリコン(例えば、プラスミド又は細菌人工染色体)及び標的核酸(例えば、ゲノム)を含み、そのエピソームレプリコンはドナー核酸配列(すなわち、合成領域)を含み、そのドナー核酸配列は順番に、5’-相同組換え配列1-所望の配列-相同組換え配列2-3’を含み、その所望の配列は陽性選択可能マーカーを含み、その標的核酸は順番に、5’-相同組換え配列1-陰性選択可能マーカー-相同組換え配列2-3’を含む、ステップ、
ii)前記宿主細胞における核酸組換えを支持することができるヘルパータンパク質(例えば、ラムダレッドタンパク質)を準備するステップ、
iii)前記宿主細胞における核酸切除を支持することができるヘルパータンパク質及び/又はRNA(例えば、CRISPR/Cas9タンパク質/RNA)を準備するステップ、
iv)前記ドナー核酸配列の切除を誘導するステップ、
v)切除されたドナー核酸と前記標的核酸との間の組換えを可能にするようにインキュベートするステップ、並びに
vi)前記ドナー核酸を前記標的核酸へ取り込んだ組換え体を選択するステップ
を含んでもよい。
適切には、前記ドナー核酸を前記標的核酸へ取り込んだ組換え体を選択するステップは、ドナー核酸の陽性選択可能マーカーの獲得及び標的核酸の陰性選択可能マーカーの喪失の選択を含む。適切には、ドナー核酸の陽性選択可能マーカーの獲得及び標的核酸の陰性選択可能マーカーの喪失の選択は同時に実行される。適切には、前記所望の配列は陽性選択可能マーカー及び陰性選択可能マーカーの両方を含む。適切には、陰性選択可能マーカーは、sacB(スクロース感受性)、rpsL(S12リボソームタンパク質-ストレプトマイシン感受性)、又はpheST251A_A294G(4-クロロフェニルアラニン感受性)からなる群から選択される。適切には、陽性選択可能マーカーは、CmR(クロラムフェニコール耐性)、KanR(カナマイシン耐性)、HygR(ハイグロマイシン耐性)、ゲンタマイシンR(ゲンタマイシン耐性)、又はテトラサイクリンR(テトラサイクリン耐性)からなる群から選択される。適切には、組換え体を選択するステップは、前記陽性及び陰性マーカーの連続選択、又は前記陰性及び陽性マーカーの連続選択を含む。適切には、組換え体を選択するステップは、前記陽性及び陰性マーカーの同時選択を含む。
適切には、上記の前記方法は、標的核酸配列における少なくとも1つの二本鎖切断を誘導するステップであって、前記二本鎖切断は、前記相同組換え配列1と前記相同組換え配列2との間である、ステップをさらに含む。適切には、少なくとも2つの二本鎖切断は標的核酸配列において誘導され、各々の前記二本鎖切断は、前記相同組換え配列1と前記相同組換え配列2との間である。
適切には、前記切除されたドナー核酸は、前記相同組換え配列1から開始し、前記相同組換え配列2で終了する。
適切には、前記エピソームレプリコンはドナー核酸配列と独立した陰性選択可能マーカーを含む。適切には、前記方法は、ドナー核酸配列と独立した前記陰性選択可能マーカーの喪失を選択することによってエピソームレプリコンの喪失を選択するさらなるステップを含む。適切には、前記エピソームレプリコンは順番に、切除切断部位1-ドナー核酸配列-切除切断部位2を含む。適切には、前記標的核酸は、前記宿主細胞内で機能することができるその独自の複製起点を所有する。適切には、前記エピソームレプリコンはプラスミド核酸である。適切には、前記エピソームレプリコンは細菌人工染色体(BAC,bacterial artificial chromosome)である。適切には、前記標的核酸は宿主細胞ゲノムである。
エピソームレプリコン(例えば、BAC)は、例えば、Kouprina, N., et al., 2004. Methods Mol Biol 255, 69-89に記載されているように、S.セレビシエにおいて相同組換えによって組み立てられ得る。アセンブリは、合成DNAの7~14個のストレッチ、各々6~13kbの長さ;選択コンストラクト(陰性選択マーカー及び/又は陽性選択マーカーを含む);及びBACシャトルベクター骨格を組み合わせることができる。合成DNAのストレッチは、エピソームレプリコンにおけるドナー核酸配列(すなわち、合成領域)に全体的に対応し得、各ストレッチは80~200bpの互いに重複しているDNA配列を含み、重複領域は書き換えられている標的を1つも含まない。ストレッチは、適切な制限部位(例えば、BsaI、AvrII、SpeI、又はXbaI)が隣接したpSC101又はpSTベクターに供給され得る。それ故、アセンブリの間、合成DNAストレッチは、対応する制限酵素での消化によって切除され得る。エピソームレプリコンのアセンブリは配列決定によって検証され得る。
適切には、2つの相同領域は、30~100bp、又は40~50bp、又は約50bpの長さであってもよい。
CRISPR/Cas9機構が切除のために使用されてもよい。一部の実施形態では、CRISPR/Cas9機構は、Cas9、tracrRNA及び2つのスペーサーRNAを含み、そのスペーサーRNAは切除のための2つの相同領域を標的とする。好ましい実施形態では、スペーサーRNAは直鎖状二本鎖スペーサーである。他の実施形態では、CRISPR/Cas9機構はCas9及び2つのsgRNAを含み、そのsgRNAは切除のための2つの相同領域を標的とする。
ラムダレッド組換え機構が組換えのために使用されてもよい。ラムダレッド組換え機構はラムダアルファ/ベータ/ガンマを含んでもよい。
方法は、REXERの1回又は2回以上のラウンドを実施するステップ、すなわち、第1のドナー核酸配列を用いた上記のステップ、前記第1のドナー核酸配列と連続するさらなるドナー配列を選択するステップ、及び部分的合成ゲノムが組み立てられるまで前記さらなるドナー核酸配列を用いて前記ステップを反復するステップを含んでもよい。これは、Wang, K. et al., 2016. Nature 539, 59-64に記載されている、ゲノム段階交換合成(GENESIS)として知られており、図4に概略的に示される。
好ましい実施形態では、ドナー配列は、本発明による合成ゲノムの領域及び/又は本発明によるポリヌクレオチドに対応する。
それ故、ドナー配列(すなわち、合成領域)は、1つ若しくは2つ以上のセンスコドンの20個若しくは19個以下の出現を含んでもよく、及び/又はドナー配列は、1つ若しくは2つ以上のセンスコドンの出現がない、10個若しくは11個以上、20個若しくは21個以上、又は100個若しくは101個以上の遺伝子を含んでもよい。
ドナー配列(すなわち、合成領域)は、それらが、1つ若しくは2つ以上のセンスコドンの各々の50個若しくは49個以下、20個若しくは19個以下、10個若しくは9個以下、5個若しくは4個以下、又は0個の出現を有すること、及び/又は親ゲノムにおける対応する領域と比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ若しくは2つ以上のセンスコドンの各々の出現を含むこと、及び/又は1つ若しくは2つ以上のセンスコドンの出現がない、10個若しくは11個以上、20個若しくは21個以上、又は100個若しくは101個以上の遺伝子を含むことを除いて親ゲノムの配列(すなわち、非合成領域)と同一であってもよい。
ドナー配列(すなわち、合成領域)はまた、親ゲノムの配列(すなわち、非合成領域)に対してリファクタリングされてもよい。3’、3’重複(すなわち、逆向きの遺伝子対)に関して、合成挿入物が遺伝子間に挿入されてもよい。3’、3’重複に関して、合成挿入物は重複する領域を含んでもよい。5’、3’重複(すなわち、同じ向きの遺伝子対)に関して、合成挿入物が遺伝子間に挿入されてもよい。5’、3’重複に関して、合成挿入物は、(i)終止コドン;(ii)重複する領域の上流から、約20~200bp、又は20~100bp、又は20~50bp;及び(iii)重複する領域を含んでもよい。好ましくは、合成挿入物は、(i)終止コドン;(ii)重複する領域の上流から約20bp;及び(iii)重複する領域を含む。好ましい実施形態では、終止コドンは下流の遺伝子について元の開始部位とインフレームである。好ましくは、終止コドンはTAAである。
好ましくは、ドナー配列(すなわち、合成領域)は、合計で50~10000kb、100~5000kb、100~2000kb、100~1000kb、又は100~500kbのサイズである。好ましくは、各ドナー配列は、50~300kb、100~200kb、又は約100kbのサイズである。
したがって、ドナー配列は、それらが、1つ又は2つ以上のセンスコドンの出現を含まないこと、及び親ゲノムにおける1つ又は2つ以上のセンスコドンを含む重複する領域を共有する全ての遺伝子対がリファクタリングされることを除いて、各々約100kbのサイズであってもよく、親ゲノムの対応する配列と同一であってもよく、遺伝子対は、センスコドン置換が遺伝子対の両方又は一方のコードされたタンパク質配列を変化させるものである。
好ましい実施形態では、ゲノムの生存能は組換えを介した遺伝子改変の各ラウンド後に試験される。一部の実施形態では、ゲノムの配列は組換えを介した遺伝子改変の各ラウンド後に検証される。
部分的合成ゲノム
本発明は、2つ又は3つ以上の異なる部分的合成ゲノムを提供する。
本発明は、2つ又は3つ以上の異なる部分的合成ゲノムを提供する。
本明細書で使用される場合、「部分的合成ゲノム」は、親ゲノムの1つ又は2つ以上の連続する領域が編集されているゲノム(すなわち、部分的合成ゲノムが1つ又は2つ以上の合成領域を含む)であり、1つ又は2つ以上の連続する(合成)領域は親ゲノムの全体を占めない。好ましくは、本発明の部分的合成ゲノムは1つの連続する(合成)領域を有する。対照的に、「合成ゲノム」は親ゲノムの実質的に全てを占めるゲノム編集を含んでもよい。
本発明の部分的合成ゲノムは原核生物ゲノムであってもよい。好ましくは、本発明の部分的合成ゲノムは細菌ゲノムである。より好ましくは、本発明の部分的合成ゲノムは、大腸菌、サルモネラ・エンテリカ、又は志賀赤痢菌ゲノムである。最も好ましくは、本発明の部分的合成ゲノムは大腸菌ゲノムである。一部の実施形態では、部分的合成ゲノムは少ない又は最小の部分的合成ゲノムである。好ましい実施形態では、部分的合成ゲノムは生存可能なゲノムである。
一部の実施形態では、本発明の部分的合成ゲノムは、100kb~20Mb、又は130kb~15Mb、又は200kb~15Mb、又は300kb~15Mb、又は500kb~15Mb、又は1Mb~15Mb、又は1Mb~10Mb、又は1Mb~8Mb、又は1Mb~6Mb、又は2Mb~6Mb、又は2Mb~5Mb、又は3Mb~5Mb、又は約4Mbのサイズである。
部分的合成ゲノムは、1つ又は2つ以上のセンスコドンの各々の50個若しくは49個以下、20個若しくは19個以下、10個若しくは9個以下、5個若しくは4個以下、又は0個の出現を有する合成領域を含んでもよいか、又は部分的合成ゲノムは、親ゲノムにおける対応する領域と比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ又は2つ以上のセンスコドンの各々の出現を有する合成領域を含んでもよい。
好ましくは、合成領域は、50~10000kb、100~5000kb、又は100~500kbのサイズである。
それ故、部分的合成ゲノムは、1つ若しくは2つ以上のセンスコドンの各々の10個若しくは9個以下、5個若しくは4個以下、又は0個の出現を有する100~5000kbの1つ又は2つ以上の連続する領域を含んでもよく、及び/又は部分的合成ゲノムは、親ゲノムにおける対応する領域と比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ若しくは2つ以上のセンスコドンの各々の出現を有する100~5000kbの1つ若しくは2つ以上の連続する領域を含んでもよく、及び/又は部分的合成ゲノムは、1つ若しくは2つ以上のセンスコドンの出現がない、10個若しくは11個以上、20個若しくは21個以上、又は100個若しくは101個以上の遺伝子を有する100~5000kbの1つ若しくは2つ以上の連続する領域を含んでもよい。
部分的合成ゲノムの残り(すなわち、非合成領域)は、変更していないセンスコドンを有してもよい。それ故、部分的合成ゲノムは、親ゲノムにおける対応する領域と比較して、100%若しくは99%の各々のセンスコドンの出現を有する1つ若しくは2つ以上の非合成領域を含んでもよく、及び/又は部分的合成ゲノムは、各センスコドンの出現を有する100個若しくは101個以上の遺伝子を有する1つ若しくは2つ以上の非合成領域を含んでもよい。非合成領域は、500kb~20Mb、又は500kb~10Mb、又は500kb~5Mb、又は約3.5Mbのサイズであってもよい。
例えば、部分的合成ゲノムは、1つ若しくは2つ以上のセンスコドンの出現がない、10個若しくは11個以上、20個若しくは21個以上、又は100個若しくは101個以上の遺伝子を有する100~5000kbの1つの連続する領域(すなわち、合成領域)及び各センスコドンの出現を有する100個若しくは101個以上の遺伝子を有する500kb~10000kbの1つの連続する領域(すなわち、非合成領域)を含んでもよい。
2つ又は3つ以上の異なる部分的合成ゲノムは同じ親ゲノムに由来してもよく、すなわち、実質的に同じ配列を含んでもよく、例えば、2つ又は3つ以上の異なる部分的合成ゲノムは、90%、95%、99%、又は99.5%の配列同一性を共有してもよい。
2つ又は3つ以上の異なる部分的合成ゲノムは、合成領域が親ゲノムの90%若しくはそれ以上、95%若しくはそれ以上、99%若しくはそれ以上又は100%を合計で占めるように1つ又は2つ以上の合成領域を含んでもよい。好ましくは、2つ又は3つ以上の異なる部分的合成ゲノムの各々は1つ又は2つ以上の合成領域を含み、その合成領域は実質的に重複しない(例えば、合成領域間の重複は10kb又はそれ未満、好ましくは約3~4kbである)。それ故、2つ又は3つ以上の異なる部分的合成ゲノムの各々は、1つの特有又は実質的に特有の合成領域を含んでもよい。
それ故、好ましい実施形態では、2つ又は3つ以上の異なる部分的合成ゲノムの各々は、1つ又は2つ以上のセンスコドンの出現がない、10個若しくは11個以上、20個若しくは21個以上、又は100個若しくは101個以上の遺伝子を有する100~5000kbの1つの連続する合成領域及び各センスコドンの出現を有する100個又は101個以上の遺伝子を有する500kb~10000kbの1つの非合成の連続する領域を含み、その合成領域は合計で親ゲノムの実質的に全てを占め、その合成領域は実質的に重複しない。
2つ又は3つ以上の異なる部分的合成ゲノムは誘導コンジュゲーションに適切であり得る。それ故、好ましい実施形態では、2つ又は3つ以上の異なる部分的合成ゲノムは、少なくとも1つの部分的合成ドナーゲノム及び少なくとも1つの部分的合成レシピエントゲノムを含む。本発明の方法は、少なくとも1つの部分的合成ドナーゲノム及び少なくとも1つの部分的合成レシピエントゲノムを提供するために、組換えを介した遺伝子改変、好ましくはラムダレッドを介した遺伝子改変(誘導コンジュゲーションの前)の1回又は2回以上のラウンドのさらなるステップを含んでもよい。方法は、少なくとも1つの部分的合成ドナーゲノム及び少なくとも1つの部分的合成レシピエントゲノムについての選択の1回又は2回以上のラウンドをさらに含んでもよい。
少なくとも1つの部分的合成ドナーゲノムは、合成領域及び伝達起点のすぐ下流の2つの相同領域が隣接した第1の選択可能マーカーを含んでもよく、少なくとも1つの部分的合成レシピエントゲノムは、2つの対応する相同領域が隣接した第2の選択可能マーカーを含んでもよく、第1の選択可能マーカーは陽性選択可能マーカーを含んでいてもよく、及び/又は第2の選択可能マーカーは陰性選択可能マーカーを含んでいてもよい。
適切には、陰性選択可能マーカーは、sacB(スクロース感受性)、rpsL(S12リボソームタンパク質-ストレプトマイシン感受性)、又はpheST251A_A294G(4-クロロフェニルアラニン感受性)からなる群から選択される。適切には、陽性選択可能マーカーは、CmR(クロラムフェニコール耐性)、KanR(カナマイシン耐性)、HygR(ハイグロマイシン耐性)、ゲンタマイシンR(ゲンタマイシン耐性)、又はテトラサイクリンR(テトラサイクリン耐性)からなる群から選択される。選択可能マーカーは、組換えを介した遺伝子改変の1つ又は2つ以上のステップにおけるものと異なってもよい。
好ましくは、少なくとも1つの部分的合成レシピエントゲノムに存在する合成領域は、相同領域が隣接した領域の外側にある、すなわち、合成領域は実質的に重複しない。好ましくは、相同領域は、3kb~500kbの長さ、最も好ましくは約3~5kbである。
誘導コンジュゲーション
誘導コンジュゲーションの1回又は2回以上のラウンドは、合成ゲノムを産生するために本発明の2つ又は3つ以上の異なる部分的合成ゲノムに対して実行されてもよい。
誘導コンジュゲーションの1回又は2回以上のラウンドは、合成ゲノムを産生するために本発明の2つ又は3つ以上の異なる部分的合成ゲノムに対して実行されてもよい。
誘導コンジュゲーションの各ラウンドは、より大きな連続する合成領域を有する部分的合成ゲノムを提供するために使用され得る。例えば、組換えを介した遺伝子改変の1回又は2回以上のラウンド後、各々が約500kbの連続する合成領域を有する、8つの部分的合成ゲノムが存在し得る。誘導コンジュゲーションの1回目のラウンド後、部分的合成ゲノムの2つは、各々が約500kbの連続する合成領域を有する6つの部分的合成ゲノム、及び約1Mbの連続する合成領域を有する1つの部分的合成ゲノムを提供するために組み合わされてもよい。2回目のラウンドは、各々が約500kbの連続する合成領域を有する5つの部分的合成ゲノム、及び約1.5Mbの連続する合成領域を有する1つの部分的合成ゲノム;又は各々が約500kbの連続する合成領域を有する4つの部分的合成ゲノム、及び各々が約1Mbの連続する合成領域を有する2つの部分的合成ゲノムを提供することができる。誘導コンジュゲーションの数回のラウンドの後、完全な合成ゲノム(すなわち、約4Mbの連続する合成領域を有するもの)が提供され得る。例を図10及び11bに概略的に示す。
誘導コンジュゲーションの任意の適切な方法が使用されてもよい。誘導コンジュゲーションの方法は当業者に周知であり、例えば、Ma, N.J., Moonan, D.W. and Isaacs, F.J., 2014. Nature Protocols, 9(10), p.2285に記載されている。合成ゲノムへの経路は限定されない。
それ故、誘導コンジュゲーションの1回又は2回以上のラウンドは、
i)部分的合成レシピエントゲノムを含む第1の宿主細胞、並びに部分的合成ドナーゲノム及びコンジュゲートプラスミドを含む第2の宿主細胞を準備するステップ、
ii)部分的合成レシピエントゲノム及び部分的合成ドナーゲノムのコンジュゲーションのステップ、並びに
iii)ドナーゲノムの合成領域が部分的合成レシピエントゲノムに取り込まれている組換え体を選択するステップ
を含んでもよい。
i)部分的合成レシピエントゲノムを含む第1の宿主細胞、並びに部分的合成ドナーゲノム及びコンジュゲートプラスミドを含む第2の宿主細胞を準備するステップ、
ii)部分的合成レシピエントゲノム及び部分的合成ドナーゲノムのコンジュゲーションのステップ、並びに
iii)ドナーゲノムの合成領域が部分的合成レシピエントゲノムに取り込まれている組換え体を選択するステップ
を含んでもよい。
部分的合成ドナーゲノムは、合成領域及び伝達起点のすぐ下流の2つの相同領域が隣接した第1の選択可能マーカーを含んでもよく、部分的合成レシピエントゲノムは、2つの対応する相同領域が隣接した第2の選択可能マーカーを含んでもよく、第1の選択可能マーカーは陽性選択可能マーカーを含んでいてもよく、及び/又は第2の選択可能マーカーは陰性選択可能マーカーを含んでいてもよい。それ故、ステップ(iii)は、前記選択可能マーカーの選択、すなわち、第1の選択可能マーカーの獲得及び第2の選択可能マーカーの喪失の選択を含んでもよい。
適切には、陰性選択可能マーカーは、sacB(スクロース感受性)、rpsL(S12リボソームタンパク質-ストレプトマイシン感受性)、又はpheST251A_A294G(4-クロロフェニルアラニン感受性)からなる群から選択される。適切には、陽性選択可能マーカーは、CmR(クロラムフェニコール耐性)、KanR(カナマイシン耐性)、HygR(ハイグロマイシン耐性)、ゲンタマイシンR(ゲンタマイシン耐性)、又はテトラサイクリンR(テトラサイクリン耐性)からなる群から選択される。選択可能マーカーは、組換えを介した遺伝子改変の1つ又は2つ以上のステップにおけるものと異なっていてもよい。
好ましくは、相同領域は、3kb~500kbの長さ、最も好ましくは約3~5kbである。好ましくは、誘導コンジュゲーションのステップが誘導コンジュゲーションの最後のステップである場合、相同領域は50kb~500kbである。
ステップ(ii)は、第1の宿主細胞及び第2の宿主細胞をインキュベートするステップを含んでもよい。例えば、第1の宿主細胞及び第2の宿主細胞は、混合され、適切な培地(例えば、寒天プレート)に移され、約37℃で約1~3時間、インキュベートされてもよい。
コンジュゲートプラスミドはFプラスミドであってもよく、好ましくはコンジュゲートプラスミドは伝達起点を含まない。(例えば、図22c)。
好ましい実施形態では、ゲノムの生存能は誘導コンジュゲーションの各ラウンドの後に試験される。有利には、これは、ゲノム編集(例えば、センスコドン置換)が生存可能なゲノムをもたらすことを検証し、許可されていない編集を修正することを可能にする。一部の実施形態では、ゲノムの配列は誘導コンジュゲーションの各ラウンドの後に検証される。
当業者は、開示されるように本発明の範囲から逸脱せずに本明細書に開示される本発明の全ての特徴を組み合わせることができることを理解するであろう。
本発明の好ましい特徴及び実施形態はここで非限定的な例として記載される。
本発明の実施は、他に示されない限り、化学、生化学、分子生物学、微生物学及び免疫学の従来の技術を利用し、それらは当業者の能力の範囲内である。そのような技術は文献に説明されている。例えば、Sambrook, J., Fritsch, E.F. and Maniatis, T. (1989) Molecular Cloning: A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory Press; Ausubel, F.M. et al. (1995 and periodic supplements) Current Protocols in Molecular Biology, Ch. 9, 13 and 16, John Wiley & Sons; Roe, B., Crabtree, J. and Kahn, A. (1996) DNA Isolation and Sequencing: Essential Techniques, John Wiley & Sons; Polak, J.M. and McGee, J.O’D. (1990) In Situ Hybridization: Principles and Practice, Oxford University Press; Gait, M.J. (1984) Oligonucleotide Synthesis: A Practical Approach, IRL Press;及びLilley, D.M. and Dahlberg, J.E. (1992) Methods in Enzymology: DNA Structures Part A: Synthesis and Physical Analysis of DNA, Academic Pressを参照のこと。
[実施例]
[実施例]
同義コドン圧縮を用いたゲノムの設計
本発明者らは最初に、オープンリーディングフレーム(ORF)におけるセリンコドンTCG及びTCA並びに終止コドンTAGが、それらの同義AGC、AGT、及びTAAでそれぞれ体系的に置換されている、大腸菌MDS42ゲノム(Uniprot受託番号AP012306.1)の型を設計した(図1a、図18、配列番号1)。本発明者らは、同義コドン圧縮のためのこの定義された書き換えスキームが、必須遺伝子が豊富な大腸菌ゲノムの20kb領域で可能であることを以前に示した(Wang, K. et al., 2016. Nature 539, 59-64)。しかしながら、この領域は、ゲノム内の標的コドンの0.46%しか占めていない。
本発明者らは最初に、オープンリーディングフレーム(ORF)におけるセリンコドンTCG及びTCA並びに終止コドンTAGが、それらの同義AGC、AGT、及びTAAでそれぞれ体系的に置換されている、大腸菌MDS42ゲノム(Uniprot受託番号AP012306.1)の型を設計した(図1a、図18、配列番号1)。本発明者らは、同義コドン圧縮のためのこの定義された書き換えスキームが、必須遺伝子が豊富な大腸菌ゲノムの20kb領域で可能であることを以前に示した(Wang, K. et al., 2016. Nature 539, 59-64)。しかしながら、この領域は、ゲノム内の標的コドンの0.46%しか占めていない。
大腸菌は多数の重複するオープンリーディングフレーム(ORF)を含有し、本発明者らは、重複を、3’、3’(逆向きのORFの間)又は5’、3’(同じ向きのORFの間)に分類する。標的化されたコドンは重複の両方のクラス内に見出される。3’、3’重複内の各ORFの書き換えが、いずれかのORFのコードされたタンパク質配列を変化させずに、すなわち、同義コドンを導入することによって達成され得る場合、重複構造は維持され、配列は直接書き換えられた。しかしながら、これが不可能であった場合、本発明者らは、重複する領域を複製し、各ORFを個々に書き換えた(図1b、表1)。
5’、3’重複に関して、本発明者らは、ORFの間の重複の領域及び重複の上流の20bp配列の両方を複製することによってORFを分離した。このリファクタリングにより、本発明者らは、各ORFを独立して書き換えることが可能になる(図1c、表1)。本発明者らのストラテジーは、下流ORFについてのRBSの配列及びこのRBSとその開始コドンとの間の距離を保存する。
同義コドン圧縮についての定義された規則及びリファクタリングを使用して、本発明者らは、18,218個の全ての標的コドンがそれらの標的同義語に書き換えられるゲノムを設計した(図1d)。
書き換えられた区画の合成
本発明者らは、設計されたゲノム上で、小分子への合成経路を設計するために一般的に使用されるものと同様の逆合成を実施した(図2)。本発明者らは、ゲノムを、8つの区画である、およそ0.5MbのA~Hに切断し(図1d、図2a、図18、配列番号1)、次いで各区画を4~5つの断片に切断した(図2b)。これにより、91kb~136kbの37個の断片を得た(図1d、表2)。本発明者らは、非必須遺伝子間の遺伝子間領域において、断片の間、及び区画の間に境界を配置した。断片を、およそ10kbの9~14個のストレッチにさらに切断した(図2c、表2)。
本発明者らは、設計されたゲノム上で、小分子への合成経路を設計するために一般的に使用されるものと同様の逆合成を実施した(図2)。本発明者らは、ゲノムを、8つの区画である、およそ0.5MbのA~Hに切断し(図1d、図2a、図18、配列番号1)、次いで各区画を4~5つの断片に切断した(図2b)。これにより、91kb~136kbの37個の断片を得た(図1d、表2)。本発明者らは、非必須遺伝子間の遺伝子間領域において、断片の間、及び区画の間に境界を配置した。断片を、およそ10kbの9~14個のストレッチにさらに切断した(図2c、表2)。
本発明者らは、S.セレビシエにおける相同組換えにより各断片を含有するREXERのためのBAC(図2c、図20)を組み立てた(Wang, K. et al., 2016. Nature 539, 59-64;及びKouprina, N., et al., 2004. Methods Mol Biol 255, 69-89)。断片の36については、BACアセンブリは円滑に進行した(表3)。断片37は組み立てるのが困難であったので、本発明者らは、2つの50kbの断片にそれを分割し(37a及び37b)、組み立てるために真っすぐにした(表3)。
本発明者らは、REXERにより、7つの異なる株においてゲノム置換を開始した。各株のREXERについての開始点は、区画A、C、D、E、F、G又はHの始まりに対応し(図1d、2b、図3)、区画Bは、以下に記載されるように、後で区画Aに設けた。本発明者らは、陽性及び陰性選択マーカーを担持するカセットを導入することによって各株におけるゲノム置換の開始点をマークした。本発明者らは、Cas9(Jiang, W., et al., 2013. Nat Biotechnol 31, 233-239)、ラムダレッド組換え機構(Datsenko, K. A. & Wanner, B. L., 2000. Proc Natl Acad Sci USA 97, 6640-6645)、及び各区画について関連する株へ最初に書き換えられた断片を含有するBACを導入し、関連するCas9スペーサー(Jiang, W., et al., 2013. Nat Biotechnol 31, 233-239)をコードするDNAの細胞への付加によってゲノムDNAの置換を開始した。BACからの書き換えられたDNAのCas9を介した切除及びこのDNAのゲノムへのラムダレッドを介した組換えにより、書き換えられたDNAでのゲノムDNAの区画の置換、ゲノムからの陽性及び陰性選択マーカーの除去、並びに新たな直交の陽性及び陰性選択マーカーの導入が生じた。標的領域にわたって組み換えられたクローンを、ゲノムから陰性選択マーカーが喪失したこと、及びBACから陽性選択マーカーを獲得したことに基づいて選択した。
各株において、最初のREXERにおいて導入される陽性及び陰性選択マーカーは、次のラウンドのREXERについての鋳型を提供し、ゲノム段階の交換合成(GENESIS)を可能にする(図2b、図4)。本発明者らは、初期のラウンドのREXERについてスペーサーをコードしたプラスミドを使用した(表4、図20d、図21)。しかしながら、本発明者らは、その後、REXERが、PCRによって生成した直鎖状二本鎖スペーサーのエレクトロポレーションによって開始され得ることを見出した(表4、図21a)。これらのスペーサーは細胞分裂を介して伝播しないので、これにより、REXERの1つのステップからの細胞を、REXERの次のステップのためにより迅速に使用することが可能になった。この進歩はGENESISを加速させた。区画A、C、D、E、F、及びGについて、本発明者らが、およそ0.5MbのゲノムDNAを合成DNAで置換するまで、本発明者らは、REXERの4~5つのステップについて時計回りの方向にGENESISを進行させた。区画Aを最初に開始し、他の区画の前に完了したので、本発明者らは、区画Aの終わりに達すると、区画Bを介してGENESISを進行した。
各REXER後、本発明者らは得られたゲノムの配列を決定して、ゲノムの標的化された領域にわたって完全に書き換えられた細胞を同定した(表4)。並行して、本発明者らは、多数の単一ステップのREXER(表4)を実行して、書き換えることが困難であり得るゲノムの100kb領域を迅速に同定し、その後、本発明者らはGENESISを介してそれらに達した。区画A、C、D、E、F及びGの全てを含む、38ステップのうちの35について、本発明者らは、GENESISによって標的化されたゲノム配列を完全に書き換えることができた。本発明者らは、区画Bにおける断片9について、並びに区画Hにおける断片37a及び1について合成DNAによる対応するゲノム領域の不完全な置換のみを観察した(表4)。
設計上の欠陥の同定及び修復
REXER後にいくつかのクローンを配列決定することにより、本発明者らは、各標的コドンが書き換えられる頻度をスコア付けし、それによってゲノム領域についての書き換えランドスケープを集約することが可能になる。断片1での書き換えランドスケープから、本発明者らは、本発明者らの定義したスキームにより書き換え難いような、メチオニンアミノペプチダーゼをコードする必須遺伝子である、mapにおける4番目のコドン(Ser4、TCA)を直接同定した(図5a)。本発明者らはまた、必須遺伝子ftsI及びmurEの14bpの重複、並びにftsI及びmurEにおけるいくつかのセリンコドンを包含する第2の領域を同定し、これは、本発明者らの書き換えられ、リファクタリングされた配列によって置換されていなかった。本発明者らは、この領域を同じ書き換えスキームで以前に書き換えたので、ここで使用した20bpではなく重複に182bpを加えたものを複製した場合(Wang, K. et al., 2016. Nature 539, 59-64)(図1c)、本発明者らは、この領域についての合成DNAの不具合が、その書き換えにおいてではなく、そのリファクタリングにおいてであると結論付けている。拡張したリファクタリング(図5b)及びmapにおけるSer4でのTCAからTCTの変異(図5c、表5)の両方を含有した、新たな断片1のBACを用いたREXERにより、ゲノムの標的化した100kb領域の完全な書き換えが可能になった(図5d)。
REXER後にいくつかのクローンを配列決定することにより、本発明者らは、各標的コドンが書き換えられる頻度をスコア付けし、それによってゲノム領域についての書き換えランドスケープを集約することが可能になる。断片1での書き換えランドスケープから、本発明者らは、本発明者らの定義したスキームにより書き換え難いような、メチオニンアミノペプチダーゼをコードする必須遺伝子である、mapにおける4番目のコドン(Ser4、TCA)を直接同定した(図5a)。本発明者らはまた、必須遺伝子ftsI及びmurEの14bpの重複、並びにftsI及びmurEにおけるいくつかのセリンコドンを包含する第2の領域を同定し、これは、本発明者らの書き換えられ、リファクタリングされた配列によって置換されていなかった。本発明者らは、この領域を同じ書き換えスキームで以前に書き換えたので、ここで使用した20bpではなく重複に182bpを加えたものを複製した場合(Wang, K. et al., 2016. Nature 539, 59-64)(図1c)、本発明者らは、この領域についての合成DNAの不具合が、その書き換えにおいてではなく、そのリファクタリングにおいてであると結論付けている。拡張したリファクタリング(図5b)及びmapにおけるSer4でのTCAからTCTの変異(図5c、表5)の両方を含有した、新たな断片1のBACを用いたREXERにより、ゲノムの標的化した100kb領域の完全な書き換えが可能になった(図5d)。
断片9についてのREXER後の書き換えランドスケープから、本発明者らは、書き換えられていなかった26kbのゲノム領域を同定した(図6)。書き換えられた断片9を含有するBACの存在下で、この領域内及び周囲のゲノムの10kb領域を削除する試みにより、ゲノムの10kbに書き換えることが困難であった領域を絞り込んだ。10kbのゲノム領域にわたるREXERにより、yceQにおいて得られた書き換えランドスケープ内の最小値が明らかになった。これにより、yceQ内の5つの標的コドンを書き換えることが問題であると同定された。同様に、断片37aでのREXER後の書き換えランドスケープ、その後のさらなる配列決定により、本発明者らは、書き換えられていなかった、yaaYの3’末端における単一コドンを同定することができた(図7)。
yceQ及びyaaYの両方は「予測タンパク質」をコードし、yceQにおける複数の挿入物は生存可能であり、これらの予測遺伝子からのmRNA産生及び/又はタンパク質合成の証拠は存在しない(Pundir, S., et al., 2017. Methods Mol Biol 1558, 41-55)。特に、yceQ及びyaaY内で書き換え難いコドンの全ては、必須遺伝子の5’非翻訳領域(UTR,untranslated region)内にある。本発明者らは、yceQ及びyaaYを書き換えることによって導入された配列変化が、隣接する必須遺伝子の調節に悪影響を及ぼすことを示唆している。実際に、yceQにおける標的コドンを、RNA二次構造及びrne(必須リボヌクレアーゼRNase Eをコードする)の5’UTR内のプロモーターエレメントにマッピングし(図8)、これらの配列はRNAse E恒常性を制御するのに不可欠である(Schuck, A., et al. 2009. Mol Microbiol 72, 470-478)。
本発明者らは、yceQの5’配列に終止コドンを導入することによって断片9を修正し、これにより、いずれかの潜在的な翻訳を最小限に抑えるが、rne転写を調節するための天然配列を保持する(図6、表5)。この新たなBACでのREXERにより、対応する100kbのゲノム領域が完全に書き換えられた(図6、表5)。yaaYにおける問題のあるコドンにてTCAからAGCへ置き換えた断片37aを含有する、新たなBACでのREXERにより、ゲノムの対応する領域が完全に書き換えられた(図7、表5)。
全ての最初に問題となった配列を特定し、修正することにより、本発明者らは、区画A及びBが完全に書き換えられる株のアセンブリ(図9)、及び区画Hが完全に書き換えられる株のアセンブリ(表5、図9)を完了した。これにより、7つの異なる株において全ての区画のアセンブリを完了した。
書き換えられたゲノムのアセンブリ
本発明者らは、書き換えられた区画を単一ゲノムに組み立てるためにコンジュゲーションベースのストラテジーを開発した(Isaacs, F. J. et al., 2011. Science 333, 348-353; Ma, N. J., et al., 2014. Nat Protoc 9, 2285-2300;及びLederberg, J. & Tatum, E. L., 1946. Nature 158, 558)。本発明者らのストラテジーは、伝達起点(oriT)を含有する、書き換えられた「ドナー」区画を、ドナーとの相同性を提供するために伸長されている、それらの隣接する書き換えられた「レシピエント」区画にコンジュゲートすることによって時計回りに書き換えられたゲノムを組み立てる(図10、図11a、図22a、b)。これにより、ドナー及びレシピエントの両方の書き換えられた区画を含有する新たなゲノムを生成する。次いでこの新たなゲノムを含有する細胞は、次の書き換えられるドナーのためのレシピエントとして使用することができ、プロセスの反復により、書き換えられた区画を徐々に書き換えられたレシピエントに付加することにより、書き換えられたゲノムを組み立てることが可能になる(図10、図11a、b)。ドナー細胞は、ドナーゲノムのレシピエント細胞への伝達を容易にするF’プラスミドの型を含有したが、標準的なF’プラスミドと異なり、それ自体をレシピエント細胞に伝達する能力はなく(図22c)、結果としてこのF’プラスミドは、全てのコンジュゲーション後、レシピエント細胞から喪失される必要はない。これにより、本発明者らのワークフローが加速された。
本発明者らは、書き換えられた区画を単一ゲノムに組み立てるためにコンジュゲーションベースのストラテジーを開発した(Isaacs, F. J. et al., 2011. Science 333, 348-353; Ma, N. J., et al., 2014. Nat Protoc 9, 2285-2300;及びLederberg, J. & Tatum, E. L., 1946. Nature 158, 558)。本発明者らのストラテジーは、伝達起点(oriT)を含有する、書き換えられた「ドナー」区画を、ドナーとの相同性を提供するために伸長されている、それらの隣接する書き換えられた「レシピエント」区画にコンジュゲートすることによって時計回りに書き換えられたゲノムを組み立てる(図10、図11a、図22a、b)。これにより、ドナー及びレシピエントの両方の書き換えられた区画を含有する新たなゲノムを生成する。次いでこの新たなゲノムを含有する細胞は、次の書き換えられるドナーのためのレシピエントとして使用することができ、プロセスの反復により、書き換えられた区画を徐々に書き換えられたレシピエントに付加することにより、書き換えられたゲノムを組み立てることが可能になる(図10、図11a、b)。ドナー細胞は、ドナーゲノムのレシピエント細胞への伝達を容易にするF’プラスミドの型を含有したが、標準的なF’プラスミドと異なり、それ自体をレシピエント細胞に伝達する能力はなく(図22c)、結果としてこのF’プラスミドは、全てのコンジュゲーション後、レシピエント細胞から喪失される必要はない。これにより、本発明者らのワークフローが加速された。
本発明者らは、ドナー及びレシピエント細胞を混合することによってコンジュゲーションを開始し、ドナーからレシピエントへのゲノム伝達の程度を制御するためにコンジュゲーションの時間及び条件を変化させた。ドナーとレシピエント細胞との間のコンジュゲーション後、本発明者らは、レシピエント細胞を選択し、次いでドナーからの書き換えられた配列の末端に陽性マーカーを獲得し、レシピエントの伸長の末端に陰性マーカーを喪失したそれらのレシピエントを選択した(図11a)。
本発明者らは、区画A~Eを通して書き換えられたゲノムの収束合成を実施した(図10、図11b)。次いで本発明者らは、FについてのレシピエントとしてA~E株を使用し、書き換えられた株A~Fを生成した。次いでA~FをF~Gについてのレシピエントとして使用し、A~Gを生成し、このコンジュゲーションは、コンジュゲーション効率を増加させるためにドナーとレシピエント株との間で、かなり長い共有した書き換えられた配列(0.4Mb)を使用した。
完全に書き換えられたゲノムを作製するために、本発明者らは、A~G-37abを作製するために37a及び37bをA~Gに導入することによってレシピエント株を最初に作製した(最終的なドナーに115kbの相同領域を提供する)。本発明者らは、H株とAB株との間のコンジュゲーションによって最終的なドナー株を作製し、これにより、H、A及び区画Bからの断片9が書き換えられる、H-A-09株を得た(図10、図11b)。A及びBからの追加の配列をHに付加して、本発明者らは、最終的なコンジュゲーションにおけるAの書き換えを消去しないことを確実にした。H-A-09ドナー株とA~G-37abレシピエント株との間の最終的なコンジュゲーションにより、大腸菌の合成が生じ、これを本発明者らは大腸菌Syn61と命名し、その大腸菌Syn61では、ゲノム内の1.8×104個の全ての標的コドンが書き換えられている(図19、配列番号2)。本発明者らの書き換えられたゲノムの合成は、8つのみのプログラムされていない変異を導入し(表6)、これらの変異のうちの4つは、100kbのBACの調製の間に発生し、4つは書き換えプロセスの間に発生した。
Syn61における同義コドン圧縮の結果
Syn61は、37℃でLBにグルコースを加えたものでは、MDS42より1.6倍のみ遅く倍加し、この割合は25℃で増加し、42℃で減少した(図13a)。Syn61は、MDS42より65%多いAGT及びAGCコドンを含有するが、これらのコドンを解読するtRNAである、serVのさらなるコピーを提供し(図12a)、増殖を増加させず(図13a)、これにより、serVは制限されていないことが示唆される。Syn61細胞の画像化により、それらがMDS42よりわずかに長いことが示唆される(図13b、c)。Syn61のプロテオームは、MDS42のプロテオームと同等であった(図13d)。TCGコドンを標的化した、直交アミノアシル-tRNA合成酵素/tRNACGA対を使用した、非カノニカルアミノ酸の共翻訳取り込みは、MDS42において極めて毒性が強かったが、Syn61では完全に無毒であり、Syn61におけるTCGコドンの除去についての表現型の検証を提供した(図12b)。このアプローチはまた、さらなる洞察も提供した(図14a、b、c)。tRNASer UGAをコードするserTは、大腸菌におけるTCAコドンを解読するtRNAのみであるので、必須である。Syn61はTCAコドンを含有しないので、serTは本発明者らの株では非必須であるべきである。実際に、本発明者らは、Syn61においてserT(図12c、図14d、図23)、並びにserU及びprfA(図14e、f、図23)を容易に除去することができることを実証した。これらのデータは、本発明者らが、ゲノムから標的コドンを除去した機能的な確認を提供し、tRNA及び標的コドンを解読する終結因子がSyn61において除去され得ることを示し、書き換えから生じるSyn61の特有の特性を実証する。
Syn61は、37℃でLBにグルコースを加えたものでは、MDS42より1.6倍のみ遅く倍加し、この割合は25℃で増加し、42℃で減少した(図13a)。Syn61は、MDS42より65%多いAGT及びAGCコドンを含有するが、これらのコドンを解読するtRNAである、serVのさらなるコピーを提供し(図12a)、増殖を増加させず(図13a)、これにより、serVは制限されていないことが示唆される。Syn61細胞の画像化により、それらがMDS42よりわずかに長いことが示唆される(図13b、c)。Syn61のプロテオームは、MDS42のプロテオームと同等であった(図13d)。TCGコドンを標的化した、直交アミノアシル-tRNA合成酵素/tRNACGA対を使用した、非カノニカルアミノ酸の共翻訳取り込みは、MDS42において極めて毒性が強かったが、Syn61では完全に無毒であり、Syn61におけるTCGコドンの除去についての表現型の検証を提供した(図12b)。このアプローチはまた、さらなる洞察も提供した(図14a、b、c)。tRNASer UGAをコードするserTは、大腸菌におけるTCAコドンを解読するtRNAのみであるので、必須である。Syn61はTCAコドンを含有しないので、serTは本発明者らの株では非必須であるべきである。実際に、本発明者らは、Syn61においてserT(図12c、図14d、図23)、並びにserU及びprfA(図14e、f、図23)を容易に除去することができることを実証した。これらのデータは、本発明者らが、ゲノムから標的コドンを除去した機能的な確認を提供し、tRNA及び標的コドンを解読する終結因子がSyn61において除去され得ることを示し、書き換えから生じるSyn61の特有の特性を実証する。
考察
本発明者らは、4Mbのゲノム全体を合成DNAで置換した大腸菌を作製し、本発明者らの実験ではゲノム置換のスケールは、S.セレビシエの単一株でのマイコプラズマ又は染色体置換においてゲノム置換について以前に報告されていたものよりおよそ4倍大きい(図15a)。
本発明者らは、4Mbのゲノム全体を合成DNAで置換した大腸菌を作製し、本発明者らの実験ではゲノム置換のスケールは、S.セレビシエの単一株でのマイコプラズマ又は染色体置換においてゲノム置換について以前に報告されていたものよりおよそ4倍大きい(図15a)。
本発明者らは、大腸菌の単一株での全ての既知の1.8×104個の標的コドン(2つのセンスコドンであるTCG及びTCA、アンバーコドンであるTAG)のゲノムワイド除去を実証した。本発明者らの研究は、部位特異的変異誘発によってアンバー終止コドンを除去する実験より60倍多いコドンを除去する(図15b)。さらに、これは、全ての標的化されたセンスコドンの完全で、ゲノムワイドな書き換えを実証する(図15b)。それ故、本発明者らは、通常の64個の代わりに61個のコドンを使用する合成生物を作製した。新たな生物は、20種のカノニカルアミノ酸をコードするために少ない数のセンスコドンを使用する。
本発明者らの合成ゲノムは、標的コドン当たり2×10-4個のみのプログラムされていない変異を含有する(図15c)。これは、有利には、部位特異的変異誘発法によってアンバーコドンを置換するために報告されている標的コドン当たり1.05個のプログラムされていない変異に匹敵する(Lajoie, M. J. et al., 2013. Science 342, 357-360)(図15c)。
本発明者らの最終的な合成ゲノムは、本発明者らが、ゲノムの標的コドンの83個(0.43%)のみで以前に決定した書き換え規則を使用して、定義したリファクタリング及び書き換えスキームを使用して書き換えた(Wang, K. et al. 2016. Nature 539, 59-64)。書き換え規則はゲノムの1.8×104個の標的コドンの99.9%で行ったのに対して、リファクタリング規則は重複の99%で行った。
本発明者らの最初の書き換えスキームの修正が、ゲノム全体の1.8×104個の標的コドンの7つのみで必要であった。これらのコドンのうちの1つは必須遺伝子にあったが、その他の6つは必須遺伝子の5’UTR内にあった。それ故、本発明者らの定義した書き換えスキームの変化の1つを除いて全ては、翻訳に対する変更した同義語の直接的な影響ではなく、必須遺伝子の5’UTRに対する意図していない変更を修正する。
本発明者らが、設計したゲノムを、区画、断片、及びストレッチに切断し、REXER、GENESIS及び誘導コンジュゲーションの収束的でシームレスでロバストな組み込みによる設計を実現するために開発したストラテジーは、将来のゲノム合成についての青写真を提供する。将来の研究では、本発明者らは、大腸菌Syn61における同義コドン圧縮の結果をさらに特徴付け、大腸菌及び他の生物におけるさらなる書き換えスキームを試験する。さらに、本発明者らは、非カノニカルバイオポリマー合成のためのセンスコドン再割当を試験する。
方法
書き換えられたゲノム設計
本発明者らは、3547個の注釈付きのCDSを有する、大腸菌MDS42ゲノム(2016年10月07日に公開された受託番号AP012306.1)の配列に対する本発明者らの合成ゲノム設計に基づいた。本発明者らは、開始ゲノムの注釈を手動でキュレートして3つのCDSを除去し、別の12個を追加した。除去した3つの予測CDSは、htgA、ybbV、及びyzfAであり、これらの配列がタンパク質をコードするという証拠は存在せず(Pundir, S., et al., 2017. Methods Mol Biol 1558, 41-55)、これらの配列は、良好に特徴付けられた遺伝子と完全に又は大部分が重複しており、これにより、それらの重複する遺伝子を破壊することなく、又は大きな反復領域を作製することなくそれらを書き換えることは困難になる。反対に、偽遺伝子ydeU、ygaY、pbl、yghX、yghY、agaW、yhiK、yhjQ、rph、ysdC、glvG、及びcybCはCDSに推奨された。rpsLでの陰性選択を可能にするために、本発明者らは、rpsLのゲノムコピーをrpsLK43Rに変異させた。最後に、本発明者らの社内のMDS42のディープシークエンシングにより、AP012306.1では報告されていなかった、mrcBとhemLとの間の51bpの挿入物が明らかになった。本発明者らは、本発明者らの開始ゲノム配列におけるこの挿入物を手動で導入し、注釈を付けた。
書き換えられたゲノム設計
本発明者らは、3547個の注釈付きのCDSを有する、大腸菌MDS42ゲノム(2016年10月07日に公開された受託番号AP012306.1)の配列に対する本発明者らの合成ゲノム設計に基づいた。本発明者らは、開始ゲノムの注釈を手動でキュレートして3つのCDSを除去し、別の12個を追加した。除去した3つの予測CDSは、htgA、ybbV、及びyzfAであり、これらの配列がタンパク質をコードするという証拠は存在せず(Pundir, S., et al., 2017. Methods Mol Biol 1558, 41-55)、これらの配列は、良好に特徴付けられた遺伝子と完全に又は大部分が重複しており、これにより、それらの重複する遺伝子を破壊することなく、又は大きな反復領域を作製することなくそれらを書き換えることは困難になる。反対に、偽遺伝子ydeU、ygaY、pbl、yghX、yghY、agaW、yhiK、yhjQ、rph、ysdC、glvG、及びcybCはCDSに推奨された。rpsLでの陰性選択を可能にするために、本発明者らは、rpsLのゲノムコピーをrpsLK43Rに変異させた。最後に、本発明者らの社内のMDS42のディープシークエンシングにより、AP012306.1では報告されていなかった、mrcBとhemLとの間の51bpの挿入物が明らかになった。本発明者らは、本発明者らの開始ゲノム配列におけるこの挿入物を手動で導入し、注釈を付けた。
本発明者らは、i)全ての標的コドンを同定し、書き換え、ii)標的コドンを含有する重複する遺伝子配列を同定し、分解するカスタムPythonスクリプトを作成した。本発明者らのキュレートしたMDS42開始配列から、本発明者らは、TCG、TCA及びTAGコドンの全てが、それぞれ、AGC、AGT及びTAAで置換されている、新たな合成ゲノムを生成するためにスクリプトを使用した。このスクリプトは、標的コドンを含有する重複を有する91個のCDSを報告した。33個の例では、遺伝子は尾-尾(3’、3’)で重複しており(表1)、これらのうちの12個は、重複する遺伝子にサイレント変異を導入することによって書き換えることができたが、残りの21個は遺伝子を分離するために複製した(図1b)。頭-尾(5’、3’)で重複する遺伝子の58個の例は、下流遺伝子の内在性発現を可能にするように、重複に上流配列の20bpを加えたものを複製することによって分解した(図1c)。1bpより長い重複に関して、インフレームTAAを導入して、下流遺伝子について元のRBSからの発現を終結させた。prfB(終結因子RF-2)は、その調節内部終止コドンに起因して、本発明者らの開始MDS42ゲノムにおいてCDSとして注釈が付けられていなかったため、本発明者らは、遺伝子内の全ての標的コドンを手動で書き換え、それによって内部終止コドンを維持した。得られたゲノム設計は、1,156,625個のコドンを有する3556個のCDSを含有し、そのうちの18,218個が書き換えられた(図18、配列番号1)。
書き換えられたストレッチの逆合成
本発明者らは、設計したゲノムを91~136kbの37個の断片に分割した。本発明者らは、i)境界配列が、必要な場合、REXER4を組み込みのために使用することができるように5’-NGG-3’PAMからなり、ii)PAMが標的コドンの50bp内に位置せず、iii)PAMが非必須遺伝子の間にあり、iv)PAMがプロモーターなどのいずれかの注釈の付いた特徴を妨げないように、これらの断片を区切る境界配列を選択した。本発明者らは、これらの境界の上流及び下流の約50~100bpの領域を「ランディング部位」と呼び、それらをLxxとして注釈を付け、ここでxxは上流断片の数であり、例えば、L01は、断片1と2の間のランディング部位である。本発明者らの設計において、ランディング部位配列は断片の3’末端及び次の5’末端に含有され、その結果として、37個全ての断片は、それらの隣接する断片と54~155bpの重複する相同を含有する。
本発明者らは、設計したゲノムを91~136kbの37個の断片に分割した。本発明者らは、i)境界配列が、必要な場合、REXER4を組み込みのために使用することができるように5’-NGG-3’PAMからなり、ii)PAMが標的コドンの50bp内に位置せず、iii)PAMが非必須遺伝子の間にあり、iv)PAMがプロモーターなどのいずれかの注釈の付いた特徴を妨げないように、これらの断片を区切る境界配列を選択した。本発明者らは、これらの境界の上流及び下流の約50~100bpの領域を「ランディング部位」と呼び、それらをLxxとして注釈を付け、ここでxxは上流断片の数であり、例えば、L01は、断片1と2の間のランディング部位である。本発明者らの設計において、ランディング部位配列は断片の3’末端及び次の5’末端に含有され、その結果として、37個全ての断片は、それらの隣接する断片と54~155bpの重複する相同を含有する。
各断片を、4~15kbの7~14個のストレッチにさらに分解した。本発明者らは、互いに80~200bpの重複を含有するようにストレッチを設計し、重複領域を、あらゆる書き換え標的を含まない遺伝子間領域で定義した。合計409個のストレッチを合成し(GENEWIZ社、USA)、BsaI、AvrII、SpeI、又はXbaI制限部位が隣接したpSC101又はpSTベクターに供給した。合成ストレッチは天然では、これらの制限部位のうちの少なくとも1つを含有しなかった。
REXER/GENESISのための選択カセット及びプラスミドの構築
この節に記載しているクローニング手順は、rpsLK43R変異によってストレプトマイシンに耐性がある大腸菌DH10bにおいて実施した。この研究全体にわたって使用したプラスミドpKW20_CDFtet_pAraRedCas9_tracrRNAは、以前に記載されているように、アラビノース誘導プロモーターの制御下でCas9及びラムダ-レッド組換え成分アルファ/ベータ/ガンマ、並びにその天然プロモーター下でtracrRNAをコードする(Wang, K. et al., 2016. Nature 539, 59-64)。
この節に記載しているクローニング手順は、rpsLK43R変異によってストレプトマイシンに耐性がある大腸菌DH10bにおいて実施した。この研究全体にわたって使用したプラスミドpKW20_CDFtet_pAraRedCas9_tracrRNAは、以前に記載されているように、アラビノース誘導プロモーターの制御下でCas9及びラムダ-レッド組換え成分アルファ/ベータ/ガンマ、並びにその天然プロモーター下でtracrRNAをコードする(Wang, K. et al., 2016. Nature 539, 59-64)。
REXERのためのプロトスペーサーは、プラスミドpKW1_MB1Amp_スペーサーにおいてコードされ(図21a)、これは、以前に記載されているように、その内在性プロモーターの制御下でpMB1複製起点、アンピシリン耐性マーカー及びプロトスペーサーアレイを含有する(Wang, K. et al., 2016. Nature 539, 59-64)。このプラスミドから、本発明者らは、誘導体pKW3_MB1Amp _TracrK_スペーサーを構築し(表5)、これは、プロトスペーサーアレイの上流にtracrRNAをさらに含有する。このために、本発明者らは、その修飾された内在性プロモーターと共にtracrRNAを含有するPCR産物を、NEBuilder HiFi Master Mixを使用したギブソンアセンブリによってpKW1_MB1Amp_スペーサーのBamHI部位に導入した。このプラスミドから、また、ギブソンアセンブリによってCas9をさらにコードする誘導体を構築し、pKW5_MB1Amp_TracrK_Cas9_スペーサーと命名した。
各REXERステップについて、これらの3つのプラスミドのうちの1つの誘導体を、BAC及びゲノムを切断するための標的配列に対応する、2個(REXER2)又は4個(REXER4)のプロトスペーサーを含有するプロトスペーサー/直接反復アレイを保有するように構築した。異なるプロトスペーサーアレイを、複数ラウンドのPCRにより重複しているオリゴから構築し、その産物を、pKW1_MB1Amp_スペーサー、pKW3_MB1Amp_TracrK_スペーサー又はpKW5_MB1Amp_TracrK_Cas9_スペーサーの骨格における制限部位AccIとEcoRIとの間にギブソンアセンブリによって挿入した。各アセンブリから得られたプロトスペーサーアレイは、サンガー配列決定によって変異がないことを検証した。
REXER及びGENESISにおいて使用した陽性-陰性選択カセットは、-1/+1(rpsL-KanR)、-2/+2(sacB-CmR)及び-3/+3(pheST251A_A294G-HygR)である。-1/+1及び-2/+2は以前に記載されている通りである(Wang, K. et al., 2016. Nature 539, 59-64)。-3/+3では、pheST251A_A294Gは、4-クロロフェニルアラニンの存在下で優性致死性であり、HygRはハイグロマイシンに対する耐性を与える。両方のタンパク質は、EM7プロモーターの制御下でポリシストロン的に発現される。-3/+3カセットはデノボ合成した。-3/+3カセットは、pheS*/HygRとも称される。
ゲノムランディング部位に二重選択カセットを含有する大腸菌株の構築。
本発明者らの設計によれば、合成断片による置換のために標的化されるゲノムの各領域には、上流のランディング部位及び下流のランディング部位が隣接しており、これらのゲノムランディング部位配列は上記のランディング部位配列と同じである。REXER/GENESISを開始するには、上流のゲノムランディング部位に二重選択カセットの挿入を必要とする。本発明者らは、ラムダ-レッドを介した組換えによってランディング部位に二重選択カセットを挿入した。簡潔に説明すると、sacB-CmR又はrpsL-KanRカセットのいずれかを、所望のゲノムランディング部位に対する相同領域を含有するプライマーを用いてPCR増幅させた。組換え実験のために、本発明者らは、以前に記載されているようにエレクトロコンピテントセルを調製し(Wang, K. et al., 2016. Nature 539, 59-64)、3μgの精製したPCR産物を、ラムダ-レッドアルファ/ベータ/ガンマ遺伝子を発現するpKW20_CDFtet_pAraRedCas9_tracrRNAプラスミドを保有する100μLのMDS42rpsLK43R細胞にエレクトロポレーションした。アラビノースプロモーター(pAra)の制御下で、OD600=0.2で開始して1時間、0.5%でL-アラビノースを添加して、組換え機構を誘導した。事前に誘導した細胞をエレクトロポレーションし、次いで4mLのスーパーオプティマルブロス(SOB,super optimal broth)培地中で37℃にて1時間回収した。次いで細胞を、10μg/mLのテトラサイクリンを含む100mLのLB培地で希釈し、37℃、200rpmで4時間増殖させた。その後、細胞を遠心沈殿させ、4mLのH2Oに再懸濁し、段階希釈し、播種し、10μg/mLのテトラサイクリン、18μg/mLのクロラムフェニコール(sacB-CmR用)又は50μg/mLのカナマイシン(rpsL-KanR用)を含有するLB寒天プレート上で37℃にて一晩インキュベートした。
本発明者らの設計によれば、合成断片による置換のために標的化されるゲノムの各領域には、上流のランディング部位及び下流のランディング部位が隣接しており、これらのゲノムランディング部位配列は上記のランディング部位配列と同じである。REXER/GENESISを開始するには、上流のゲノムランディング部位に二重選択カセットの挿入を必要とする。本発明者らは、ラムダ-レッドを介した組換えによってランディング部位に二重選択カセットを挿入した。簡潔に説明すると、sacB-CmR又はrpsL-KanRカセットのいずれかを、所望のゲノムランディング部位に対する相同領域を含有するプライマーを用いてPCR増幅させた。組換え実験のために、本発明者らは、以前に記載されているようにエレクトロコンピテントセルを調製し(Wang, K. et al., 2016. Nature 539, 59-64)、3μgの精製したPCR産物を、ラムダ-レッドアルファ/ベータ/ガンマ遺伝子を発現するpKW20_CDFtet_pAraRedCas9_tracrRNAプラスミドを保有する100μLのMDS42rpsLK43R細胞にエレクトロポレーションした。アラビノースプロモーター(pAra)の制御下で、OD600=0.2で開始して1時間、0.5%でL-アラビノースを添加して、組換え機構を誘導した。事前に誘導した細胞をエレクトロポレーションし、次いで4mLのスーパーオプティマルブロス(SOB,super optimal broth)培地中で37℃にて1時間回収した。次いで細胞を、10μg/mLのテトラサイクリンを含む100mLのLB培地で希釈し、37℃、200rpmで4時間増殖させた。その後、細胞を遠心沈殿させ、4mLのH2Oに再懸濁し、段階希釈し、播種し、10μg/mLのテトラサイクリン、18μg/mLのクロラムフェニコール(sacB-CmR用)又は50μg/mLのカナマイシン(rpsL-KanR用)を含有するLB寒天プレート上で37℃にて一晩インキュベートした。
BACアセンブリ及び送達
本発明者らは、97~136kbの合成DNAを含有する細菌人工染色体(BAC,Bacterial Artificial Chromosomes)シャトルベクターを構築した。5’側では、合成DNAには、ゲノムに対する相同性領域(HR1)、及びCas9切断部位が隣接した。3’側では、合成DNAには、二重選択カセット、ゲノムに対する相同性領域(HR2)、及び第2のCas9切断部位が隣接した。BACはまた、陰性選択マーカー、BAC起点、URAマーカー及びYAC起点(自己複製配列に融合したCEN6セントロメア(CEN/ARS))も含有した(図2c、図20a~c)。
本発明者らは、97~136kbの合成DNAを含有する細菌人工染色体(BAC,Bacterial Artificial Chromosomes)シャトルベクターを構築した。5’側では、合成DNAには、ゲノムに対する相同性領域(HR1)、及びCas9切断部位が隣接した。3’側では、合成DNAには、二重選択カセット、ゲノムに対する相同性領域(HR2)、及び第2のCas9切断部位が隣接した。BACはまた、陰性選択マーカー、BAC起点、URAマーカー及びYAC起点(自己複製配列に融合したCEN6セントロメア(CEN/ARS))も含有した(図2c、図20a~c)。
BACは、S.セレビシエでの相同組換えによって組み立てた。各アセンブリは、i)各々が6~13kbの長さである、合成DNAの7~14個のストレッチを、ii)選択コンストラクト(以下を参照のこと)及びiii)BACシャトルベクター骨格と組み合わせた(図20a~c、Wang, K. et al., 2016. Nature 539, 59-64)。
合成DNAストレッチは、GENEWIZによって提供されたそれらのソースベクターからBsaI、AvrII、SpeI、又はXbaI制限部位での消化によって切除した。AvrII、SpeI、及びXbaIの場合、制限消化に続いて、Mung Beanヌクレアーゼ処理を行って付着末端を除去した。
選択コンストラクトは、断片の最も3’側のストレッチに対する相同性領域、二重選択カセット(sacB-CmR又はrpsL-KanR)、標的化されたゲノム遺伝子座に対する相同性領域(HR2)、陰性選択マーカー(rpsL、sacB又はpheS*-HygR)及びYACを含有した。特定の二重選択カセット、陰性選択マーカー、及び相同領域配列については、図20dを参照のこと。本発明者らは、NEBuilder HiFi DNA Assembly Master Mixを用いて3つのPCR断片からpSC101骨格において選択コンストラクトのエピソーム型を組み立てた。このエピソーム型は、BsaIによる制限消化がBACアセンブリのためのDNA断片を生じるように設計した。
BAC起点及びURA3マーカーを含有するBAC骨格を、鋳型として以前に記載されているBAC(Wang, K. et al., 2016. Nature 539, 59-64)を使用してPCRによって増幅させ、PCR産物をBACアセンブリのために使用した。これらのPCRアセンブリのために使用したプライマーを図20dに列挙する。
ストレッチ、選択コンストラクト、及びBAC骨格を組み立てるために、30~50fmolのDNAの各片をS.セレビシエスフェロプラストに形質転換し、これらは以前に記載されているように調製した(Kouprina, N.,et al., 2004. Methods Mol Biol 255, 69-89)。アセンブリ後、本発明者らは、重複している断片のジャンクション及びベクター挿入ジャンクションにおいてコロニーPCRによって正確に組み立てられたBACを潜在的に保有する酵母クローンを同定した。コロニーPCRによって正確であるように見えるクローンは、以下に記載するように、大腸菌への形質転換後にNGSによって検証された配列であった。
組み立てられたBACは、製造業者の使用説明書に従ってGentra Puregene Yeast/Bact. Kit(Qiagen社)を用いて酵母から抽出した。エレクトロポレーションによってMDS42rpsLK43R細胞に組み立てられたBACを形質転換した。BACの大きなサイズに起因して、本発明者らは、時々、標的細胞への非効率なエレクトロポレーションを観察した。その結果、本発明者らは、ラムダ-レッドを介した組換え(上記の通り)によって50bpの相同領域を有するPCR産物として提供されたoriT-アプラマイシンカセットを、アセンブリ後にいくつかのBACに導入した(図20a~c)。これにより、コンジュゲーションによって、首尾よく形質転換された大腸菌から他の株へのBACの伝達が促進された。
REXER及びGENESISによる書き換えられた区画の合成
本発明者らは、連続REXER実験(GENESIS)のために種々のゲノム及びプラスミド選択マーカーを使用した(表4)。本発明者らは、選択のためのゲノムランディング部位においてrpsL-KanR(-1/+1)又はsacB-CmR(-2/+2)カセットを使用した。本発明者らは、エピソーム選択マーカーとしてrpsL-KanR-sacB(-1/+1、-2)、rpsL-KanR-pheS*-HygR(-1/+1、-3/+3)又はsacB-CmR-rpsL(-2/+2、-1)カセットを使用した。
本発明者らは、連続REXER実験(GENESIS)のために種々のゲノム及びプラスミド選択マーカーを使用した(表4)。本発明者らは、選択のためのゲノムランディング部位においてrpsL-KanR(-1/+1)又はsacB-CmR(-2/+2)カセットを使用した。本発明者らは、エピソーム選択マーカーとしてrpsL-KanR-sacB(-1/+1、-2)、rpsL-KanR-pheS*-HygR(-1/+1、-3/+3)又はsacB-CmR-rpsL(-2/+2、-1)カセットを使用した。
各REXERについて、関連する上流のゲノムランディング部位においてpKW20_ CDFtet_pAraRedCas9_tracrRNA及び二重選択カセットを含有するMDS42rpsLK43R細胞に、関連するBACを形質転換した。本発明者らは、2%グルコース、5μg/mlのテトラサイクリン及びBACのために選択した抗生物質(すなわち、18μg/mlのクロラムフェニコール又は50μg/mlのカナマイシン)を補足したLB寒天に細胞を播種した。本発明者らは、5μg/mlのテトラサイクリン及びBAC特異的抗生物質を含むLB培地に個々のコロニーを接種し、37℃、200rpmで一晩細胞を増殖させた。一晩の培養物を、5μg/mlのテトラサイクリン、及びBAC特異的抗生物質を含むLB培地でOD600=0.05に希釈し、OD600≒0.2まで約2時間振盪させながら37℃で増殖させた。ラムダ-レッド発現を誘導するために、本発明者らは、0.5%の最終濃度になるようにアラビノース粉末を培養物に添加し、振盪させながら37℃でさらに1時間培養物をインキュベートした。本発明者らは、OD600≒0.6で細胞を採取し、以前に記載されているように細胞をエレクトロコンピテントにした(Wang, K. et al., 2016. Nature 539, 59-64)。
各REXER実験のために、直鎖状dsDNAプロトスペーサーアレイを、ユニバーサルプライマーを使用してpKW1_MB1Amp_スペーサーからPCR増幅させた(図21a)。およそ5~10μgの消化した得られたDpnI及び精製したPCR産物を100μLのエレクトロコンピテント及び誘導細胞に形質転換した。細胞を37℃で1時間4mlのSOB培地中で回収し、次いで5μg/mLのテトラサイクリン及びBACのために選択した抗生物質を補足した100mLのLBで希釈し、振盪させながら37℃でさらに4時間インキュベートした。あるいは、エレクトロコンピテント及び誘導細胞に、5μgの環状プロトスペーサーアレイ(pKW1_MB1Amp_スペーサー又はpKW3_MB1Amp_スペーサープラスミド)を形質転換し、37℃でSOB培地中で1時間回収した後、振盪させながら37℃でさらに4時間、100μg/mLのアンピシリンを補足した100mLのLBに移した(図21a、b)。REXER2が十分でなかった場合、本発明者らは、以前に記載されているようにpKW5_MB1Amp_スペーサープラスミドを使用してREXER4を実施した(Wang, K. et al., 2016. Nature 539, 59-64)。
本発明者らは、培養物を遠心沈殿させ、それを4mlのMilli-Q濾過水に再懸濁し、5μg/mlのテトラサイクリン、陰性選択マーカーに対して選択した薬剤及びBACに由来する陽性マーカーのために選択した抗生物質を含むLB寒天の選択プレートに段階希釈で塗抹した。このプレートを37℃で一晩インキュベートした。複数のコロニーを選び、Milli-Q濾過水に再懸濁し、50μg/mlのカナマイシン、18μg/mlのクロラムフェニコール、200μg/mlのストレプトマイシン、7.5%のスクロース又は2.5mMの4-クロロ-フェニルアラニンを補足したいくつかのLB寒天プレートに配置した。コロニーPCRをまた、ランディング部位のゲノム遺伝子座に隣接するプライマー対及びBACから新たに組み込んだ選択カセットの位置の両方を使用して再懸濁したコロニーから実施した。REXERを介した組換えにより、上流のゲノム遺伝子座におよそ500bpのバンドが生じ、対照MDS42rk/MDS42sC株についての2.5kb(rk-ランディング部位)又は3.5kb(sC-ランディング部位)のバンドはゲノムからランディング部位の除去が成功していることを示す。置換したDNAの3’末端に隣接するプライマー対は、およそ2.5kb(pBAC上のrK選択カセット)又は3.5kb(pBAC上のsC選択カセット)のバンド及び選択マーカーの組み込みの成功を示す対照MDS42rk/MDS42sC株についての500bpのバンドを生成する。
プラスミドに基づく環状プロトスペーサーアレイを以前のREXER実験に使用した場合、次の実験の前にプラスミドを喪失させなければならなかった。それ故、最初のREXER実験からの成功したクローンを、2%グルコース、5μg/mLのテトラサイクリン及びゲノム内の陽性マーカーのために選択した抗生物質を補足したLBで、振盪させながら37℃で高密度の培養物になるまで増殖させた。次いで2μLの培養物を、同じ補足物を含むLB寒天プレートに画線し、37℃で一晩インキュベートした。いくつかのコロニーを、LB寒天プレート上のレプリカ及び100μg/mLのアンピシリンを補足したLB寒天プレートに配置して、プラスミドの喪失をスクリーニングした。
BAC編集
大腸菌におけるBAC上の選択カセットにおいて機能喪失変異に遭遇した場合、欠陥のあるカセットを、50bpの相同領域が隣接し、ラムダ-レッドを介した組換えによって組み込まれているPCR産物として提供される適切な二重選択カセットで置換した(図20d)。
大腸菌におけるBAC上の選択カセットにおいて機能喪失変異に遭遇した場合、欠陥のあるカセットを、50bpの相同領域が隣接し、ラムダ-レッドを介した組換えによって組み込まれているPCR産物として提供される適切な二重選択カセットで置換した(図20d)。
自然変異を修正するか、又は書き換えられたコドンを変化させるかのいずれかのために、BACの合成の書き換えられた配列の変化を2段階の置換アプローチによって導入した。書き換えられた配列の末端に選択カセット-2/+2及び-1を含有するBACに関して、-3/+3カセットを、望ましい遺伝子座を標的化する50bpの相同領域が隣接し、ラムダ-レッドを介した組換えによって組み込まれたPCR産物として提供し、続いて+3について選択した。書き換えられたDNAとゲノムとの間の相同性に起因して、得られたクローンの一部はBAC上に-3/+3を含有し、一部はゲノム上に含有する。BAC上のカセットでクローンを同定するために、クローンを、(1)+3について、(2)-3に対して、並びに(3)+2について及び-3に対して選択して寒天プレート上のレプリカに播種した。(3)ではなくプレート(1)及び(2)で生存したクローンのみが、BACに組み込まれた-3/+3カセットを有する。カセットの位置は、QIAprep Spin Miniprep Kitを使用してBACを精製し、続いてゲノタイピングすることによって検証した。第2のステップでは、50bpの相同領域が隣接し、ラムダ-レッドを介した組換えによって組み込まれた望ましい配列のPCR産物を提供することによって-3/+3カセットを置換し、続いて+2について及び-3に対して選択した。BACを上記のようにゲノタイピングし、NGSによって配列を検証した。
伝達不可能なF’プラスミドの調製及びエピソームのコンジュゲート伝達
本発明者らは、ゲノムDNAのコンジュゲーション、及び株間のBACの伝達のために使用するF’プラスミドの型を作製して、F’プラスミド自体を伝達せずにoriTを担持する配列の伝達を可能にした(図22c)。本発明者らは、F’プラスミド自体内の伝達起点(oriT)のニック部位を削除することによってこれを達成し、関連するアプローチは以前に報告されている(Strand, T. A., et al., 2014. PLoS One 9, e90372)。F’プラスミド誘導体であるpRK24(addgene#51950)を、50bpの相同領域が隣接したPCR産物として望ましいマーカーを組み込むことによって修飾し、組み込みを、TetRの代わりにKanRを有するpKW20のバリアントを使用してラムダ-レッドを介した組換えによって実施した。最初に、pRK24においてアンピシリン耐性を与えるβ-ラクタマーゼ遺伝子を、感染した細菌細胞の視覚識別を可能にする生物発光を生成する人工T5-luxABCDEオペロン(Bryksin, A. V. & Matsumura, I., 2010. PLoS One 5, e13244)で置換した。次に、TetRを、50μg/mLのアプラマイシンで選択するためにアミノグリコシド3-N-アセチルトランスフェラーゼIVを産生するT3-aac3で置換した。最後に、oriTのニック部位の24bpの削除を、ブラストサイジン-Sデアミナーゼを発現するEM7-bsdを組み込むことによって行い、低塩TYE/LB中で50μg/mLのブラストサイジンで選択することができる。pJF146と呼ばれる得られたF’プラスミド(図22c)を、QIAprep Spin Miniprep Kit (QIAgen社)を使用して抽出し、後のコンジュゲーションのためにドナー株にエレクトロポレーションによって形質転換した。
本発明者らは、ゲノムDNAのコンジュゲーション、及び株間のBACの伝達のために使用するF’プラスミドの型を作製して、F’プラスミド自体を伝達せずにoriTを担持する配列の伝達を可能にした(図22c)。本発明者らは、F’プラスミド自体内の伝達起点(oriT)のニック部位を削除することによってこれを達成し、関連するアプローチは以前に報告されている(Strand, T. A., et al., 2014. PLoS One 9, e90372)。F’プラスミド誘導体であるpRK24(addgene#51950)を、50bpの相同領域が隣接したPCR産物として望ましいマーカーを組み込むことによって修飾し、組み込みを、TetRの代わりにKanRを有するpKW20のバリアントを使用してラムダ-レッドを介した組換えによって実施した。最初に、pRK24においてアンピシリン耐性を与えるβ-ラクタマーゼ遺伝子を、感染した細菌細胞の視覚識別を可能にする生物発光を生成する人工T5-luxABCDEオペロン(Bryksin, A. V. & Matsumura, I., 2010. PLoS One 5, e13244)で置換した。次に、TetRを、50μg/mLのアプラマイシンで選択するためにアミノグリコシド3-N-アセチルトランスフェラーゼIVを産生するT3-aac3で置換した。最後に、oriTのニック部位の24bpの削除を、ブラストサイジン-Sデアミナーゼを発現するEM7-bsdを組み込むことによって行い、低塩TYE/LB中で50μg/mLのブラストサイジンで選択することができる。pJF146と呼ばれる得られたF’プラスミド(図22c)を、QIAprep Spin Miniprep Kit (QIAgen社)を使用して抽出し、後のコンジュゲーションのためにドナー株にエレクトロポレーションによって形質転換した。
oriTを含有するエピソームDNAの伝達をコンジュゲーションによって実施した(Isaacs, F. J. et al., 2011. Science 333, 348-353;及びMa, N. J., et al. 2014. Nat Protoc 9, 2285-2300)。ドナー株にpJF146及びoriTを有する組み立てられたBACを二重形質転換した(上記を参照のこと)。レシピエント株にpKW20を形質転換した。5mlのドナー及びレシピエント培養物を選択LB培地中で一晩飽和するまで増殖させ、続いて抗生物質を含まないLB培地で3回洗浄した。再懸濁したドナー及びレシピエント株を4:1の比で合わせて、TYE寒天プレートにスポットし、37℃で1時間インキュベートした。細胞をプレートから洗い流し、2%のグルコース、レシピエント株のために選択した5μg/mlのテトラサイクリン及びBACのために選択した抗生物質を含むLB寒天プレートに段階希釈で塗抹した。BACの伝達の成功を、BAC-ベクター挿入ジャンクションのコロニーPCRによって確認した。
書き換えられた区画からの合成ゲノムの組み立て
ゲノムDNAの伝達を、その後のrecBCDを介した組換えと合わせて、部分的合成大腸菌ゲノムを合成ゲノムに組み立てた。ドナー及びレシピエント株の調製において、rpsL-HygR-oriT又はGmR-oriTカセットをPCR産物として供給し、ラムダ-レッドを介した組換えによってドナー株ゲノムに組み込んだ(図22a、b)。これとは別に、pheS*-HygRカセットを、ドナー株の合成DNAのおよそ3kb下流に組み込んだ。これにより、3’pheS*-HygR選択カセットを有する3kbの合成DNAセグメントのPCR増幅のための鋳型ゲノムDNAが提供された。このPCR産物をレシピエント株に提供して、ラムダ-レッドを介した組換えでWT DNAを置換した。それによって、合成セグメントの3’末端における選択マーカーを置換し、ドナー合成DNAに対する3kbの相同領域を生成した。このストラテジーは、それらのそれぞれのドナーに対して3kbの相同を有し、常に3’末端にpheS-HygRを有するレシピエント株を体系的に生成するのに役立った。さらに、ドナー株にpJF146を形質転換し、テトラサイクリンに対する感受性を確認した。対照的に、pKW20をドナー株に維持してテトラサイクリン耐性を与えた。
ゲノムDNAの伝達を、その後のrecBCDを介した組換えと合わせて、部分的合成大腸菌ゲノムを合成ゲノムに組み立てた。ドナー及びレシピエント株の調製において、rpsL-HygR-oriT又はGmR-oriTカセットをPCR産物として供給し、ラムダ-レッドを介した組換えによってドナー株ゲノムに組み込んだ(図22a、b)。これとは別に、pheS*-HygRカセットを、ドナー株の合成DNAのおよそ3kb下流に組み込んだ。これにより、3’pheS*-HygR選択カセットを有する3kbの合成DNAセグメントのPCR増幅のための鋳型ゲノムDNAが提供された。このPCR産物をレシピエント株に提供して、ラムダ-レッドを介した組換えでWT DNAを置換した。それによって、合成セグメントの3’末端における選択マーカーを置換し、ドナー合成DNAに対する3kbの相同領域を生成した。このストラテジーは、それらのそれぞれのドナーに対して3kbの相同を有し、常に3’末端にpheS-HygRを有するレシピエント株を体系的に生成するのに役立った。さらに、ドナー株にpJF146を形質転換し、テトラサイクリンに対する感受性を確認した。対照的に、pKW20をドナー株に維持してテトラサイクリン耐性を与えた。
コンジュゲーションのために、ドナー及びレシピエント株を、2%のグルコース、5μg/mlのテトラサイクリン及び50μg/mlのカナマイシン又は20μg/mlのクロラムフェニコール(ドナー)及び50μg/mlのアプラマイシン及び200μg/mLのハイグロマイシンB(レシピエント)を含むLB培地中で一晩飽和するまで増殖させた。一晩の培養物を同じ選択LB培地中で1:10に希釈し、OD600=0.5まで増殖させた。ドナー及びレシピエント培養物の両方の50mlを、2%のグルコースを含むLB培地で3回洗浄し、次いで各々を、2%のグルコースを含む400μlのLB培地に再懸濁した。320μlのドナーを80μlのレシピエントと混合し、TYE寒天プレートにスポットし、37℃でインキュベートした。インキュベーション時間は、伝達した合成DNAの長さ及びレシピエント株の倍加時間に応じ、1時間~3時間まで変化させた。細胞をプレートから洗い流し、2%のグルコース及び5μg/mlのテトラサイクリンを含む100mlのLB培地に移し、振盪させながら37℃で2時間インキュベートした。続いて、50μg/mlのカナマイシン又は20μg/mlのクロラムフェニコール(ドナーの伝達した陽性選択マーカーのための選択)を添加し、その後、37℃でさらに2時間インキュベートした。培養物を遠心沈殿させ、4mlのMilli-Q濾過水に再懸濁し、2%のグルコース、5μg/mlのテトラサイクリン、2.5mMの4-クロロ-フェニルアラニン及び50μg/mlのカナマイシン又は20μg/mlのクロラムフェニコールを含むLB寒天の選択プレートに段階希釈で塗抹した。DNA伝達及び組換えの成功を、pheS*-HygRカセットの喪失、ドナーの選択カセットの組み込み及びGm-oriTカセットの非存在についてコロニーPCRによって決定した。
全ゲノムの調製及び次世代シークエンシングのためのBACライブラリー
製造業者の使用説明書に従ってDNEasy Blood and Tissue Kit(QIAgen社)を使用して大腸菌ゲノムDNAを精製した。製造業者の使用説明書に従ってQIAprep Spin Miniprep Kit(QIAgen社)を用いて細胞からBACを抽出した。本発明者らは、このキットが130kbを超えるBACの精製に適していることを見出した。本発明者らは、DNA剪断を低減させるように精製全体の間、試料の激しい振盪を回避した。
製造業者の使用説明書に従ってDNEasy Blood and Tissue Kit(QIAgen社)を使用して大腸菌ゲノムDNAを精製した。製造業者の使用説明書に従ってQIAprep Spin Miniprep Kit(QIAgen社)を用いて細胞からBACを抽出した。本発明者らは、このキットが130kbを超えるBACの精製に適していることを見出した。本発明者らは、DNA剪断を低減させるように精製全体の間、試料の激しい振盪を回避した。
製造業者の使用説明書に従ってIllumina Nextera XT Kitを使用してPaired-end Illuminaシークエンシングライブラリーを調製した。MiSeq Reagent kit v3を用いて2×300又は2×75サイクルを実行して、シークエンシングデータをIllumina MiSeqで得た。
シークエンシングデータ分析
この研究における配列分析のための標準的なワークフローはiSeqパッケージに集約されている。簡潔に述べると、シークエンシングリードを、ソフトクリッピングをアクティブにしたbowtie2を使用して参照の書き換えられたゲノム又は野生型ゲノムにアラインメントした(Langmead, B. & Salzberg, S. L., 2012. Nat Methods 9, 357-359)。アラインメントしたリードを分類し、samtoolsを用いてインデックスを付けた(Li, H. et al., 2009. Bioinformatics 25, 2078-2079)。カスタマイズしたPythonスクリプトをsamtools及びigvtoolsの機能と合わせてサマリーを呼び出すバリアントを生じさせた。このスクリプトを使用して、Integrative Genomics Viewerでの視覚分析と組み合わせて変異、インデル及び構造変動を評価した(Thorvaldsdottir, H., et al., 2013. Brief Bioinform 14, 178-192)。
この研究における配列分析のための標準的なワークフローはiSeqパッケージに集約されている。簡潔に述べると、シークエンシングリードを、ソフトクリッピングをアクティブにしたbowtie2を使用して参照の書き換えられたゲノム又は野生型ゲノムにアラインメントした(Langmead, B. & Salzberg, S. L., 2012. Nat Methods 9, 357-359)。アラインメントしたリードを分類し、samtoolsを用いてインデックスを付けた(Li, H. et al., 2009. Bioinformatics 25, 2078-2079)。カスタマイズしたPythonスクリプトをsamtools及びigvtoolsの機能と合わせてサマリーを呼び出すバリアントを生じさせた。このスクリプトを使用して、Integrative Genomics Viewerでの視覚分析と組み合わせて変異、インデル及び構造変動を評価した(Thorvaldsdottir, H., et al., 2013. Brief Bioinform 14, 178-192)。
本発明者らは、標的ゲノム領域にわたって書き換えランドスケープを生成するためにカスタムPythonスクリプトを作成した。簡潔に述べると、スクリプトは、BAMアラインメントファイル、fastaの参照及び入力としてジェンバンクアノテーションファイルを受け取る。これは書き換えのための標的コドンを同定し、アラインメントファイル内のこれらの標的コドンとアラインメントするリードを集約する。次いでこれは各標的コドンにおける書き換え頻度を出力し、所望のゲノム領域の長さにわたってこれらの頻度をプロットする。
増殖率の測定及び分析
細菌コロニーを、2%のグルコース及び100μg/mLのストレプトマイシンを含むLB中で37℃にて一晩増殖させた。一晩の培養物を1:50に希釈し、温度(25℃、37℃、又は42℃)及び培地条件(LB、2%のグルコースを含むLB、M9最少培地、2XTY)を変化させながら増殖についてモニターした。OD600の測定を、高速で線形振盪させながらBiomek自動ワークステーションプラットフォームにおいて18時間の間、5分毎に行った。
細菌コロニーを、2%のグルコース及び100μg/mLのストレプトマイシンを含むLB中で37℃にて一晩増殖させた。一晩の培養物を1:50に希釈し、温度(25℃、37℃、又は42℃)及び培地条件(LB、2%のグルコースを含むLB、M9最少培地、2XTY)を変化させながら増殖についてモニターした。OD600の測定を、高速で線形振盪させながらBiomek自動ワークステーションプラットフォームにおいて18時間の間、5分毎に行った。
倍加時間を決定するために、増殖曲線をlog2変換した。指数増殖の間の曲線の線形位相において、一次導関数を決定し(d(log2(x))/dt)、最大のlog2導関数を有する10の連続する時点を使用して、各複製についての倍加時間を計算した。合計10個の独立して増殖させた生物学的複製を、書き換えられたSyn61株及びwt MDS42rpsLK43Rについて測定した。平均倍加時間及び平均からの標準偏差を、n=10の全ての複製について計算した。
顕微鏡検査及び細胞サイズの測定
細胞を、100μg/mLのストレプトマイシンを補足したLB中で振盪させながらおよそOD600=0.2まで増殖させた。細菌の薄層をアガロースパッドとカバースリップとの間に挟んだ。標準的な顕微鏡スライドを、1%のアガロースパッド(Sigma-Aldrich社のA4018-5G)を用いて調製した。2μl~4μlの細菌培養物の試料をパッドの上部に滴下した。これを、パッドの約1mmの高さに適合させたガラススペーサーによって両側で支持した#1のカバースリップで覆った。試料を、63X 1.25NAのPlan Neofluar位相対物レンズ(Zeiss UK社、Cambridge、UK)を使用して直立Zeiss Axiophot位相差顕微鏡で画像化した。画像は、ueye cockpitソフトウェア(IDS Imaging Development Systems GmbH社、Obersulm、Germany)の制御下でIDS ueyeモノクロカメラを使用して撮影した。各試料の10個の視野を撮影した。さらに定量するために、画像をNikon NIS Elementsソフトウェアにロードした(Nikon Instruments社、Surrey、UK)。一般的な分析ツールを使用して細菌をセグメント化するために強度閾値を適用した。1ミクロンのサイズ下限を課してバックグラウンド微粒子及びダストを除去した。続いて、一般的な分析定量ツールを使用して長さの測定をセグメント化した細菌で行った。
細胞を、100μg/mLのストレプトマイシンを補足したLB中で振盪させながらおよそOD600=0.2まで増殖させた。細菌の薄層をアガロースパッドとカバースリップとの間に挟んだ。標準的な顕微鏡スライドを、1%のアガロースパッド(Sigma-Aldrich社のA4018-5G)を用いて調製した。2μl~4μlの細菌培養物の試料をパッドの上部に滴下した。これを、パッドの約1mmの高さに適合させたガラススペーサーによって両側で支持した#1のカバースリップで覆った。試料を、63X 1.25NAのPlan Neofluar位相対物レンズ(Zeiss UK社、Cambridge、UK)を使用して直立Zeiss Axiophot位相差顕微鏡で画像化した。画像は、ueye cockpitソフトウェア(IDS Imaging Development Systems GmbH社、Obersulm、Germany)の制御下でIDS ueyeモノクロカメラを使用して撮影した。各試料の10個の視野を撮影した。さらに定量するために、画像をNikon NIS Elementsソフトウェアにロードした(Nikon Instruments社、Surrey、UK)。一般的な分析ツールを使用して細菌をセグメント化するために強度閾値を適用した。1ミクロンのサイズ下限を課してバックグラウンド微粒子及びダストを除去した。続いて、一般的な分析定量ツールを使用して長さの測定をセグメント化した細菌で行った。
質量分析
各株について3つの生物学的複製を実施した。各大腸菌溶解物からのタンパク質を、50mMの重炭酸アンモニウム中に6Mの尿素を含有する緩衝液中で可溶化し、10mMのDTTで還元し、55mMのヨードアセトアミドでアルキル化した。アルキル化後、タンパク質を50mMの重炭酸アンモニウムで1Mの尿素に希釈し、1:50のタンパク質対酵素比にて37℃で2時間、Lys-C(Promega社、UK)で消化し、続いて1:100のタンパク質対酵素比にて37℃で12時間、トリプシン(Promega社、UK)で消化した。得られたペプチド混合物を、2%v/vの最終濃度までギ酸を添加することによって酸性化した。およそ300nL/分のフローを送達するためにUltimate U3000 HPLC(ThermoScientific Dionex社、San Jose, USA)を使用してナノスケールキャピラリーLC-MS/MSによって消化物を二連(1ugの開始タンパク質/注入)で分析した。C18 Acclaim PepMap100 3μm、75μm×250mmのnanoViper(ThermoScientific Dionex社、San Jose、USA)での分離前に、C18 Acclaim PepMap100 5μm、100μm×20mmのnanoViper(ThermoScientific Dionex社、San Jose、USA)によりペプチドを捕捉した。ペプチドをアセトニトリルの100分の勾配(2%~60%)で溶出した。分析カラム出口は、ナノフローエレクトロスプレーイオン化源を介して、ハイブリッド二重圧力線形イオントラップ質量分析計(Orbitrap Velos、ThermoScientific社、San Jose、USA)と直接接続させた。完全なMSスペクトルについて30,000、続いて線形イオントラップで10のMS/MSスペクトルの分解能を使用して、データ依存分析を実行した。MSスペクトルを300~2000のm/z範囲にわたって収集した。MS/MSスキャンは、衝突誘起解離について35の閾値エネルギーを使用して収集した。標準的な設定を使用してMaxQuant 1.5.5.1で全ての生ファイルを処理し、MaxQuantソフトウェアスイートに組み込まれたAndromeda検索エンジンを用いて大腸菌株K-12に対して検索した。酵素検索の特異性は、両方のエンドプロテイナーゼについてトリプシン/Pであった。各ペプチドについて最大で2つの誤った切断が許容された。システインのカルバミドメチル化を酸化メチオニンによる固定修飾として設定し、タンパク質N-アセチル化を可変修飾と見なした。この検索は、前駆イオンについて6ppmの初期質量許容差及びCID MS/MSスペクトルについて0.5Daで実施した。偽発見率はペプチド及びタンパク質レベルで1%に固定した。MaxQuantのPerseus (1.5.5.3)モジュールを使用して統計的分析を実行した。統計的分析の前に、既知の夾雑物にマッピングしたペプチド、リバースヒット及び部位によってのみ同定されたタンパク質群を除去した。少なくとも2つのペプチドで同定したタンパク質群のみのうちの1つは特有であり、2つの定量事象をデータ分析のために考慮した。各株において少なくとも1回定量したタンパク質について、Syn61の複製にわたる各タンパク質の平均存在量をMDS42複製の存在量で割り、次いでlog2変換した。株間の存在量の差についてのP値を、2標本t検定(Perseus)によって計算した。
各株について3つの生物学的複製を実施した。各大腸菌溶解物からのタンパク質を、50mMの重炭酸アンモニウム中に6Mの尿素を含有する緩衝液中で可溶化し、10mMのDTTで還元し、55mMのヨードアセトアミドでアルキル化した。アルキル化後、タンパク質を50mMの重炭酸アンモニウムで1Mの尿素に希釈し、1:50のタンパク質対酵素比にて37℃で2時間、Lys-C(Promega社、UK)で消化し、続いて1:100のタンパク質対酵素比にて37℃で12時間、トリプシン(Promega社、UK)で消化した。得られたペプチド混合物を、2%v/vの最終濃度までギ酸を添加することによって酸性化した。およそ300nL/分のフローを送達するためにUltimate U3000 HPLC(ThermoScientific Dionex社、San Jose, USA)を使用してナノスケールキャピラリーLC-MS/MSによって消化物を二連(1ugの開始タンパク質/注入)で分析した。C18 Acclaim PepMap100 3μm、75μm×250mmのnanoViper(ThermoScientific Dionex社、San Jose、USA)での分離前に、C18 Acclaim PepMap100 5μm、100μm×20mmのnanoViper(ThermoScientific Dionex社、San Jose、USA)によりペプチドを捕捉した。ペプチドをアセトニトリルの100分の勾配(2%~60%)で溶出した。分析カラム出口は、ナノフローエレクトロスプレーイオン化源を介して、ハイブリッド二重圧力線形イオントラップ質量分析計(Orbitrap Velos、ThermoScientific社、San Jose、USA)と直接接続させた。完全なMSスペクトルについて30,000、続いて線形イオントラップで10のMS/MSスペクトルの分解能を使用して、データ依存分析を実行した。MSスペクトルを300~2000のm/z範囲にわたって収集した。MS/MSスキャンは、衝突誘起解離について35の閾値エネルギーを使用して収集した。標準的な設定を使用してMaxQuant 1.5.5.1で全ての生ファイルを処理し、MaxQuantソフトウェアスイートに組み込まれたAndromeda検索エンジンを用いて大腸菌株K-12に対して検索した。酵素検索の特異性は、両方のエンドプロテイナーゼについてトリプシン/Pであった。各ペプチドについて最大で2つの誤った切断が許容された。システインのカルバミドメチル化を酸化メチオニンによる固定修飾として設定し、タンパク質N-アセチル化を可変修飾と見なした。この検索は、前駆イオンについて6ppmの初期質量許容差及びCID MS/MSスペクトルについて0.5Daで実施した。偽発見率はペプチド及びタンパク質レベルで1%に固定した。MaxQuantのPerseus (1.5.5.3)モジュールを使用して統計的分析を実行した。統計的分析の前に、既知の夾雑物にマッピングしたペプチド、リバースヒット及び部位によってのみ同定されたタンパク質群を除去した。少なくとも2つのペプチドで同定したタンパク質群のみのうちの1つは特有であり、2つの定量事象をデータ分析のために考慮した。各株において少なくとも1回定量したタンパク質について、Syn61の複製にわたる各タンパク質の平均存在量をMDS42複製の存在量で割り、次いでlog2変換した。株間の存在量の差についてのP値を、2標本t検定(Perseus)によって計算した。
直交アミノアシル-tRNA合成酵素tRNAxxxsを使用したCYPK取り込みの毒性(Elliott, T. S. et al., 2014. Nat Biotechnol 32, 465-472; Elliott, T. S., et al., 2016. Cell Chem Biol 23, 805-815;及びKrogager, T. P. et al., 2018. Nat Biotechnol 36, 156-159)
エレクトロコンピテントMDS42及びSyn61細胞に、PylRS及びtRNAPyl xxxを発現させるためにプラスミドpKW1_MmPylS_PylTXXXを形質転換し、ここで、XXXは示したアンチコドンである。tRNAPylのアンチコドンがCGA(pKW1_MmPylS_PylTCGA)、UGA(pKW1_MmPylS_PylTUGA)又はGCU(pKW1_MmPylS_PylTGCU)に変異した、このプラスミドの3つのバリアントを使用した。細胞を、75μg/mlのスペクチノマイシンを含むLB培地中で一晩増殖させた。一晩の培養物を、0mM、0.5mM、1mM、2.5mM及び5mMでNε-(((2-メチルシクロプロパ-2-エン-1-イル)メトキシ)カルボニル)-L-リジン(CYPK)を補足したLBで1:100に希釈し、増殖を上記のように測定した。「最大増殖%」を、CYPKの非存在下での最終OD600で割ったCYPKの示した濃度の存在下での最終OD600として決定した。最終OD600は600分後に決定した。
エレクトロコンピテントMDS42及びSyn61細胞に、PylRS及びtRNAPyl xxxを発現させるためにプラスミドpKW1_MmPylS_PylTXXXを形質転換し、ここで、XXXは示したアンチコドンである。tRNAPylのアンチコドンがCGA(pKW1_MmPylS_PylTCGA)、UGA(pKW1_MmPylS_PylTUGA)又はGCU(pKW1_MmPylS_PylTGCU)に変異した、このプラスミドの3つのバリアントを使用した。細胞を、75μg/mlのスペクチノマイシンを含むLB培地中で一晩増殖させた。一晩の培養物を、0mM、0.5mM、1mM、2.5mM及び5mMでNε-(((2-メチルシクロプロパ-2-エン-1-イル)メトキシ)カルボニル)-L-リジン(CYPK)を補足したLBで1:100に希釈し、増殖を上記のように測定した。「最大増殖%」を、CYPKの非存在下での最終OD600で割ったCYPKの示した濃度の存在下での最終OD600として決定した。最終OD600は600分後に決定した。
相同組換えによるprfA、serU及びserTの削除
選択タンパク質の発現がserU又はserTによる解読に依存しないように、図1aに記載した書き換えスキームに従って、pheS*-HygR及びrpsL-KanRカセットの書き換えられた型をデノボ合成した。prfAを削除するために、書き換えられたrpsL-KanRを、prfA隣接ゲノム配列と約50bpの相同を含有するオリゴを用いて増幅させた。同じことを、書き換えられた選択カセットpheS*-HygRを用いてserU及びserTに対して行った。オリゴヌクレオチド配列を図23に提供する。プラスミドpKW20_CDFtet_pAraRedCas9_tracrRNAを保有するSyn61細胞を、LBの代わりに2xTYを使用して上記のようにコンピテントにした。細胞に約8μgのPCR産物をエレクトロポレーションし、4mLのSOBで1時間回収し、次いで5μg/mlのテトラサイクリンを補足した100mLの2xTYに移した。4時間後、細胞を遠心沈殿させ、500μLのH2Oに再懸濁し、5μg/mlのテトラサイクリン及び200μg/mlのハイグロマイシンB(pheS*-HygR用)又は50μg/mlのカナマイシン(rpsL-KanR用)を補足した2xTY寒天プレートに段階希釈で播種した。各場合において、所望の遺伝子座に隣接するプライマーを用いたコロニーPCRによって削除を検証した。
選択タンパク質の発現がserU又はserTによる解読に依存しないように、図1aに記載した書き換えスキームに従って、pheS*-HygR及びrpsL-KanRカセットの書き換えられた型をデノボ合成した。prfAを削除するために、書き換えられたrpsL-KanRを、prfA隣接ゲノム配列と約50bpの相同を含有するオリゴを用いて増幅させた。同じことを、書き換えられた選択カセットpheS*-HygRを用いてserU及びserTに対して行った。オリゴヌクレオチド配列を図23に提供する。プラスミドpKW20_CDFtet_pAraRedCas9_tracrRNAを保有するSyn61細胞を、LBの代わりに2xTYを使用して上記のようにコンピテントにした。細胞に約8μgのPCR産物をエレクトロポレーションし、4mLのSOBで1時間回収し、次いで5μg/mlのテトラサイクリンを補足した100mLの2xTYに移した。4時間後、細胞を遠心沈殿させ、500μLのH2Oに再懸濁し、5μg/mlのテトラサイクリン及び200μg/mlのハイグロマイシンB(pheS*-HygR用)又は50μg/mlのカナマイシン(rpsL-KanR用)を補足した2xTY寒天プレートに段階希釈で播種した。各場合において、所望の遺伝子座に隣接するプライマーを用いたコロニーPCRによって削除を検証した。
上記の明細書に述べられている全ての刊行物は、参照により本明細書に組み込まれる。本発明の開示された方法、細胞、組成物及び使用の様々な修正及び変形は、本発明の範囲及び趣旨から逸脱することなく、当業者に明らかであろう。本発明は特定の好ましい実施形態に関連して開示されてきたが、特許請求される本発明は、そのような特定の実施形態に過度に限定されるべきではないことが理解されるべきである。実際に、当業者に自明である、本発明を実行するための開示された方法の様々な修正は、添付の特許請求の範囲の範囲内であることが意図される。
Claims (41)
- 1つ又は2つ以上のセンスコドンの5つ又は4つ以下の出現を含む合成原核生物ゲノム。
- 1つ又は2つ以上のセンスコドンの4つ若しくは3つ以下、3つ若しくは2つ以下、2つ若しくは1つ以下、1つ若しくは0個の出現を含むか、又は出現を含まない、請求項1に記載の合成原核生物ゲノム。
- 100個若しくは101個以上、200個若しくは201個以上、又は300個若しくは301個以上の遺伝子を含む合成原核生物ゲノムであって、前記遺伝子が1つ又は2つ以上のセンスコドンの5つ又は4つ以下の出現を合計で含み、好ましくは、前記遺伝子が必須遺伝子である、前記合成原核生物ゲノム。
- 遺伝子が、1つ又は2つ以上のセンスコドンの4つ若しくは3つ以下、3つ若しくは2つ以下、2つ若しくは1つ以下、1つ若しくは0個の出現を合計で含むか、又は出現を含まない、請求項3に記載の合成原核生物ゲノム。
- 合成細菌ゲノム、好ましくは、合成の大腸菌ゲノム、合成のサルモネラ・エンテリカゲノム、又は合成の志賀赤痢菌ゲノムである、請求項1~4のいずれかに記載の合成原核生物ゲノム。
- 1つ又は2つ以上のセンスコドンが、1つのセンスコドン又は2つのセンスコドン、好ましくは2つのセンスコドンからなる、請求項1~5のいずれかに記載の合成原核生物ゲノム。
- 2つ又は3つ以上のセンスコドン、好ましくは2つのセンスコドンの出現を含まず、かつ、1つの終止コドン、好ましくはアンバー終止コドン(TAG)の出現を含まない、請求項1~6のいずれかに記載の合成原核生物ゲノム。
- 1つ又は2つ以上のセンスコドンが、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択され、好ましくは前記1つ又は2つ以上のセンスコドンが、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択され、より好ましくは前記1つ又は2つ以上のセンスコドンが、TCG、TCA、AGT、AGC、TTG、TTA、GCG及びGCAから選択され、最も好ましくは前記1つ又は2つ以上のセンスコドンが、TCG及び/又はTCAである、請求項1~7のいずれかに記載の合成原核生物ゲノム。
- アンバー終止コドン(TAG)の10個若しくは9個以下、5個若しくは4個以下の出現を含むか、又は出現を含まない、請求項1~8のいずれかに記載の合成原核生物ゲノム。
- 親原核生物ゲノムに由来する合成原核生物ゲノムであって、前記親原核生物ゲノムと比較して、10%、5%、2%、1%、0.5%、0.1%未満の、1つ若しくは2つ以上のセンスコドンの出現を含むか、又は1つ若しくは2つ以上のセンスコドンの出現を含まない、前記合成原核生物ゲノム。
- 細菌ゲノム、好ましくは大腸菌ゲノム、サルモネラ・エンテリカゲノム、又は志賀赤痢菌ゲノムである、請求項10に記載の合成原核生物ゲノム。
- 1つ又は2つ以上のセンスコドンが、1つのセンスコドン又は2つのセンスコドン、好ましくは2つのセンスコドンからなる、請求項10又は11に記載の合成原核生物ゲノム。
- 1つ又は2つ以上のセンスコドンが、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択され、好ましくは前記1つ又は2つ以上のセンスコドンが、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択され、より好ましくは前記1つ又は2つ以上のセンスコドンが、TCG、TCA、AGT、AGC、TTG、TTA、GCG及びGCAから選択され、最も好ましくは前記1つ又は2つ以上のセンスコドンが、TCG及び/又はTCAであり、TCG及び/又はTCAが同義センスコドンで置換されていてもよい、請求項10~12のいずれかに記載の合成原核生物ゲノム。
- 親原核生物ゲノムにおける1つ又は2つ以上のセンスコドンの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、同義センスコドンで置換され、好ましくは前記親原核生物ゲノムにおけるTCG及び/又はTCAの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、AGC及び/又はAGTで置換され、最も好ましくは前記親原核生物ゲノムにおけるTCGの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、AGCで置換され、及び/又は前記親原核生物ゲノムにおけるTCAの出現の90%、95%、90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、99.5%若しくはそれ以上、99.6%若しくはそれ以上、99.7%若しくはそれ以上、99.8%若しくはそれ以上、99.9%若しくはそれ以上、又は100%が、AGTで置換されている、請求項10~13のいずれかに記載の合成原核生物ゲノム。
- アンバー終止コドン(TAG)の10個若しくは9個以下、5個若しくは4個以下の出現を含むか、又は出現を含まず、好ましくは親原核生物ゲノムにおけるTAGの出現の90%若しくはそれ以上、95%若しくはそれ以上、98%若しくはそれ以上、99%若しくはそれ以上、又は全てが、TAAで置換されている、請求項10~14のいずれかに記載の合成原核生物ゲノム。
- 親原核生物ゲノムにおける2つ若しくは3つ以上のセンスコドン、好ましくは2つのセンスコドンの出現の99.9%若しくはそれ以上、又は100%が、同義センスコドンで置換され、かつ、親原核生物ゲノムにおけるTAGの出現の全てがTAAで置換されている、請求項10~15のいずれかに記載の合成原核生物ゲノム。
- 親原核生物ゲノムにおける1つ又は2つ以上のセンスコドンを含む重複する領域を共有する1つ又は2つ以上の遺伝子対がリファクタリングされ、好ましくは前記1つ又は2つ以上の遺伝子対が、その中の前記センスコドンのうちの1つ又は2つ以上の同義センスコドンでの置換が、前記遺伝子対の両方又は一方のコードされたタンパク質配列を変化させるものである、請求項10~16のいずれかに記載の合成原核生物ゲノム。
- 逆向きの遺伝子対に関して、合成挿入物が遺伝子間に挿入され、前記合成挿入物が重複する領域を含み、及び/又は同じ向きの遺伝子対に関して、合成挿入物が遺伝子間に挿入され、前記合成挿入物が、(i)終止コドン、(ii)前記重複する領域の上流から約20~200bp、及び(iii)前記重複する領域を含む、請求項17に記載の合成原核生物ゲノム。
- 生存可能である、請求項1~18のいずれかに記載の合成原核生物ゲノム。
- 100kb~10Mb、又は1Mb~10Mb、又は2Mb~6Mbのサイズである、請求項1~19のいずれかに記載の合成原核生物ゲノム。
- 1つ又は2つ以上のセンスコドンの出現がない、20個又は21個以上、30個又は31個以上、40個又は41個以上、50個又は51個以上、100個又は101個以上の必須遺伝子を含む、ポリヌクレオチド。
- 1つ又は2つ以上のセンスコドンが、1つのセンスコドン又は2つのセンスコドン、好ましくは2つのセンスコドンからなる、請求項21に記載のポリヌクレオチド。
- 1つ又は2つ以上のセンスコドンが、TCG、TCA、TCT、TCC、AGT、AGC、GCG、GCA、GCT、GCC、CTG、CTA、CTT、CTC、TTG、及びTTAから選択され、好ましくは前記1つ又は2つ以上のセンスコドンが、TCG、TCA、AGT、AGC、GCG、GCA、CTG、CTA、TTG、及びTTAから選択され、より好ましくは前記1つ又は2つ以上のセンスコドンが、TCG、TCA、AGT、AGC、TTG、TTA、GCG及びGCAから選択され、最も好ましくは前記1つ又は2つ以上のセンスコドンが、TCG及び/又はTCAである、請求項21又は22に記載のポリヌクレオチド。
- 遺伝子の1つ又は2つ以上のセンスコドンの出現が、同義センスコドンで置換され、好ましくはTCGコドンがAGCで置換され、及び/又はTCAコドンがAGTで置換されている、請求項21~23のいずれかに記載のポリヌクレオチド。
- 必須遺伝子が、ribF、lspA、ispH、dapB、folA、imp、yabQ、ftsL、ftsI、murE、murF、mraY、murD、ftsW、murG、murC、ftsQ、ftsA、ftsZ、lpxC、secM、secA、can、folK、hemL、yadR、dapD、map、rpsB、tsf、pyrH、frr、dxr、ispU、cdsA、yaeL、yaeT、lpxD、fabZ、lpxA、lpxB、dnaE、accA、tilS、proS、yafF、hemB、secD、secF、ribD、ribE、thiL、dxs、ispA、dnaX、adk、hemH、lpxH、cysS、folD、entD、mrdB、mrdA、nadD、holA、rlpB、leuS、lnt、glnS、fldA、cydA、infA、cydC、ftsK、lolA、serS、rpsA、msbA、lpxK、kdsB、mukF、mukE、mukB、asnS、fabA、mviN、rne、fabD、fabG、acpP、tmk、holB、lolC、lolD、lolE、purB、minE、minD、pth、prsA、ispE、lolB、hemA、prfA、prmC、kdsA、topA、ribA、fabI、tyrS、ribC、ydiL、pheT、pheS、rplT、infC、thrS、nadE、gapA、yeaZ、aspS、argS、pgsA、yefM、metG、folE、yejM、gyrA、nrdA、nrdB、folC、accD、fabB、gltX、ligA、zipA、dapE、dapA、der、hisS、ispG、suhB、tadA、acpS、era、rnc、lepB、rpoE、pssA、yfiO、rplS、trmD、rpsP、ffh、grpE、csrA、ispF、ispD、ftsB、eno、pyrG、chpR、lgt、fbaA、pgk、yqgD、metK、yqgF、plsC、ygiT、parE、ribB、cca、ygjD、tdcF、yraL、yhbV、infB、nusA、ftsH、obgE、rpmA、rplU、ispB、murA、yrbB、yrbK、yhbN、rpsI、rplM、degS、mreD、mreC、mreB、accB、accC、yrdC、def、fmt、rplQ、rpoA、rpsD、rpsK、rpsM、secY、rplO、rpmD、rpsE、rplR、rplF、rpsH、rpsN、rplE、rplX、rplN、rpsQ、rpmC、rplP、rpsC、rplV、rpsS、rplB、rplW、rplD、rplC、rpsJ、fusA、rpsG、rpsL、trpS、yrfF、asd、rpoH、ftsX、ftsE、ftsY、yhhQ、bcsB、glyQ、gpsA、rfaK、kdtA、coaD、rpmB、dfp、dut、gmk、spoT、gyrB、dnaN、dnaA、rpmH、rnpA、yidC、tnaB、glmS、glmU、wzyE、hemD、hemC、yigP、ubiB、ubiD、hemG、yihA、ftsN、murI、murB、birA、secE、nusG、rplJ、rplL、rpoB、rpoC、ubiA、plsB、lexA、dnaB、ssb、alsK、groS、psd、orn、yjeE、rpsR、chpS、ppa、valS、yjgP、yjgQ、及びdnaCからなるリストのうちの1つ又は2つ以上から選択される必須遺伝子を含む、請求項21~24のいずれかに記載のポリヌクレオチド。
- 請求項1~20のいずれかに記載の合成原核生物ゲノム又は請求項21~25のいずれかに記載のポリヌクレオチドを含む原核生物宿主細胞。
- 生存可能である、請求項26に記載の原核生物宿主細胞。
- 細菌の細胞、好ましくは大腸菌の細胞、サルモネラ・エンテリカの細胞、又は志賀赤痢菌の細胞である、請求項26又は27に記載の原核生物宿主細胞。
- 1つ又は2つ以上の非タンパク質性アミノ酸、好ましくは2つ又は3つ以上の非タンパク質性アミノ酸、最も好ましくは3つ又は4つ以上の非タンパク質性アミノ酸を含むポリペプチドの産生に使用するための、請求項26~28のいずれかに記載の原核生物宿主細胞。
- 1つ又は2つ以上の非タンパク質性アミノ酸、好ましくは2つ又は3つ以上の非タンパク質性アミノ酸、最も好ましくは3つ又は4つ以上の非タンパク質性アミノ酸を含むポリペプチドを産生するための、請求項26~29のいずれかに記載の原核生物宿主細胞の使用。
- 合成ゲノムを産生するための方法であって、
(a)親ゲノムを準備するステップと、
(b)前記親ゲノムに対して組換えを介した遺伝子改変の1回又は2回以上のラウンドを実行して、2つ又は3つ以上の異なる部分的合成ゲノムを産生するステップと、
(c)前記2つ又は3つ以上の異なる部分的合成ゲノムとの誘導コンジュゲーションの1回又は2回以上のラウンドを実行して、合成ゲノムを産生するステップと
を含み、前記部分的合成ゲノムの各々が、1つ又は2つ以上のセンスコドンの各々の50個若しくは49個以下、20個若しくは19個以下、10個若しくは9個以下、5個若しくは4個以下、又は0個の出現を有する合成領域を含むか、又は前記部分的合成ゲノムの各々が、前記親ゲノムにおける対応する領域と比較して、10%、5%、2%、1%、0.5%、0.1%未満の1つ又は2つ以上のセンスコドンの各々の前記出現を有する合成領域を含む、前記方法。 - 合成領域が、親ゲノムの90%若しくはそれ以上、95%若しくはそれ以上、99%若しくはそれ以上又は100%を合計でカバーする、請求項31に記載の合成ゲノムを産生するための方法。
- 合成領域が、10~1000kb、50~1000kb、100~1000kb、又は100~500kbのサイズである、請求項31又は32に記載の合成ゲノムを産生するための方法。
- 部分的合成ゲノムの生存能が、組換えを介した遺伝子改変の各ラウンド後及び/又は誘導コンジュゲーションの各ラウンド後に試験される、請求項31~33のいずれかに記載の合成ゲノムを産生するための方法。
- 2つ又は3つ以上の異なる部分的合成ゲノムが、少なくとも1つの部分的合成ドナーゲノム及び少なくとも1つの部分的合成レシピエントゲノムを含む、請求項31~34のいずれかに記載の合成ゲノムを産生するための方法。
- 少なくとも1つの部分的合成ドナーゲノムが、合成領域及び伝達起点のすぐ下流の2つの相同領域が隣接した第1の選択可能マーカーを含み、少なくとも1つの部分的合成レシピエントゲノムが、2つの対応する相同領域が隣接した第2の選択可能マーカーを含み、かつ、前記第1の選択可能マーカーが陽性選択可能マーカーを含んでいてもよく、及び/又は前記第2の選択可能マーカーが陰性選択可能マーカーを含んでいてもよい、請求項35に記載の合成ゲノムを産生するための方法。
- 少なくとも1つの部分的合成レシピエントゲノムに存在する合成領域が、相同領域が隣接した領域の外側である、請求項36に記載の合成ゲノムを産生するための方法。
- 選択可能マーカーについての選択の1回又は2回以上のラウンドをさらに含む、請求項36又は37に記載の合成ゲノムを産生するための方法。
- 組換えを介した遺伝子改変の1回又は2回以上のラウンドが、プログラムされた組換えによるゲノム改変強化のためのレプリコン切除(REXER)の1回又は2回以上のラウンドを含む、請求項31~38のいずれかに記載の合成ゲノムを産生するための方法。
- 合成ゲノムが、請求項1~20のいずれかに記載の合成原核生物ゲノムである、請求項31~39のいずれかに記載の合成ゲノムを産生するための方法。
- 請求項31~40のいずれかに記載の方法によって産生される合成原核生物ゲノム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB1906775.0A GB201906775D0 (en) | 2019-05-14 | 2019-05-14 | Synthetic genome |
GB1906775.0 | 2019-05-14 | ||
PCT/EP2020/063445 WO2020229592A1 (en) | 2019-05-14 | 2020-05-14 | Synthetic genome |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022533040A true JP2022533040A (ja) | 2022-07-21 |
JPWO2020229592A5 JPWO2020229592A5 (ja) | 2023-05-18 |
Family
ID=67384685
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021566246A Pending JP2022533040A (ja) | 2019-05-14 | 2020-05-14 | 合成ゲノム |
Country Status (9)
Country | Link |
---|---|
US (2) | US20220282241A1 (ja) |
EP (1) | EP3969582A1 (ja) |
JP (1) | JP2022533040A (ja) |
CN (1) | CN114026230A (ja) |
AU (1) | AU2020273571A1 (ja) |
BR (1) | BR112021022451A2 (ja) |
CA (1) | CA3135971A1 (ja) |
GB (1) | GB201906775D0 (ja) |
WO (1) | WO2020229592A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20240117295A1 (en) | 2021-05-28 | 2024-04-11 | United Kingdom Research And Innovation | Microorganisms and uses thereof |
GB202110137D0 (en) | 2021-07-14 | 2021-08-25 | Res & Innovation Uk | Methods for optimising protein production |
WO2023034856A1 (en) * | 2021-08-31 | 2023-03-09 | New York University | COMPOSITIONS AND METHODS FOR SWITCHING ANTIBIOTIC RESISTANCE MARKERS PROGRESSIVELY FOR INTEGRATION (mSwAP-In) |
WO2023205267A1 (en) * | 2022-04-20 | 2023-10-26 | The Administrators Of The Tulane Educational Fund | Enhanced cell-free bacteriophage synthesis by genetic modulation of bacterial transcription/translation machinery (txtl) machinery |
WO2024017956A2 (en) | 2022-07-19 | 2024-01-25 | United Kingdom Research And Innovation | Genetic codes |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012164083A1 (en) * | 2011-06-01 | 2012-12-06 | Actogenix N.V. | Polycistronic expression system for bacteria |
EP3149176B1 (en) * | 2014-05-30 | 2019-10-23 | The Trustees of Columbia University in the City of New York | Methods for altering polypeptide expression |
GB201613135D0 (en) * | 2016-07-29 | 2016-09-14 | Medical Res Council | Genome editing |
-
2019
- 2019-05-14 GB GBGB1906775.0A patent/GB201906775D0/en not_active Ceased
-
2020
- 2020-05-14 EP EP20726379.9A patent/EP3969582A1/en active Pending
- 2020-05-14 BR BR112021022451A patent/BR112021022451A2/pt unknown
- 2020-05-14 US US17/610,974 patent/US20220282241A1/en active Pending
- 2020-05-14 CA CA3135971A patent/CA3135971A1/en active Pending
- 2020-05-14 JP JP2021566246A patent/JP2022533040A/ja active Pending
- 2020-05-14 AU AU2020273571A patent/AU2020273571A1/en active Pending
- 2020-05-14 WO PCT/EP2020/063445 patent/WO2020229592A1/en unknown
- 2020-05-14 CN CN202080035720.5A patent/CN114026230A/zh active Pending
-
2023
- 2023-05-22 US US18/321,475 patent/US20230392138A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20240132874A1 (en) | 2024-04-25 |
BR112021022451A2 (pt) | 2022-02-15 |
US20230392138A1 (en) | 2023-12-07 |
CA3135971A1 (en) | 2020-11-19 |
AU2020273571A1 (en) | 2021-10-14 |
WO2020229592A1 (en) | 2020-11-19 |
US20220282241A1 (en) | 2022-09-08 |
EP3969582A1 (en) | 2022-03-23 |
CN114026230A (zh) | 2022-02-08 |
GB201906775D0 (en) | 2019-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022533040A (ja) | 合成ゲノム | |
Arnaud et al. | New vector for efficient allelic replacement in naturally nontransformable, low-GC-content, gram-positive bacteria | |
JP4658478B2 (ja) | 縮小されたゲノムを有する細菌 | |
JP6329554B2 (ja) | 宿主細胞改変方法 | |
WO2016210373A2 (en) | Recombinant bacteria engineered for biosafety, pharmaceutical compositions, and methods of use thereof | |
US20240158736A1 (en) | Microorganisms and uses thereof | |
CA2747462C (en) | Systems and methods for the secretion of recombinant proteins in gram negative bacteria | |
Burdett | tRNA modification activity is necessary for Tet (M)-mediated tetracycline resistance | |
KR102050870B1 (ko) | 무항생제 플라스미드 유지 시스템에서 플라스미드 카피 수의 정량적 조절 방법 | |
Hemmis et al. | Thioredoxin-like proteins in F and other plasmid systems | |
Altenbuchner et al. | Escherichia coli | |
US20240229013A9 (en) | Synthetic genome | |
Dubey et al. | An ECF41 family σ factor controls motility and biogenesis of lateral flagella in Azospirillum brasilense sp245 | |
Gc et al. | HicA toxin-based counterselection marker for allelic exchange mutations in Fusobacterium nucleatum | |
KR101349070B1 (ko) | 외래 유전자 강제 발현 벡터 | |
PL208884B1 (pl) | Wektor do wytwarzania polipeptydu heterologicznego oraz sposoby zwiększania wytwarzania pełnej długości polipeptydu heterologicznego | |
Danchin | The emergence of the first cells | |
WO2024017956A2 (en) | Genetic codes | |
JP3058186B2 (ja) | 新規なクローニング及び/又は発現ベクター、それらの製造方法及びそれらの使用 | |
Coppinger | Experimental Evolution of Peptidoglycan Biosynthesis in Vibrio fischeri | |
Armbruster et al. | Identification and Characterization of the Lipoprotein N-acyltransferase in Bacteroides | |
Patil | Crosstalk Between Prokaryotic Replication Initiation and Acidic Phospholipids | |
CA3203195A1 (en) | Glycosyltransferase deficient corynebacterium for the production of fucosyllactose | |
Turner | Autogenous transcriptional attenuation of de novo pyrimidine biosynthesis in Bacillus subtilis | |
CN110607318A (zh) | 一种基于多元自动化基因组工程在类球红细菌中实现基因编辑的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230510 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230510 |