JP2023537054A - 新規の細菌タンパク質繊維 - Google Patents
新規の細菌タンパク質繊維 Download PDFInfo
- Publication number
- JP2023537054A JP2023537054A JP2023508481A JP2023508481A JP2023537054A JP 2023537054 A JP2023537054 A JP 2023537054A JP 2023508481 A JP2023508481 A JP 2023508481A JP 2023508481 A JP2023508481 A JP 2023508481A JP 2023537054 A JP2023537054 A JP 2023537054A
- Authority
- JP
- Japan
- Prior art keywords
- protein
- ena
- fibers
- self
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000835 fiber Substances 0.000 title claims abstract description 361
- 108010077805 Bacterial Proteins Proteins 0.000 title description 3
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 438
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 373
- 102000002067 Protein Subunits Human genes 0.000 claims abstract description 147
- 108010001267 Protein Subunits Proteins 0.000 claims abstract description 115
- 238000000034 method Methods 0.000 claims abstract description 60
- 150000001413 amino acids Chemical class 0.000 claims description 105
- 210000004027 cell Anatomy 0.000 claims description 96
- 210000004899 c-terminal region Anatomy 0.000 claims description 60
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 50
- 230000015572 biosynthetic process Effects 0.000 claims description 50
- 238000000338 in vitro Methods 0.000 claims description 41
- 230000014509 gene expression Effects 0.000 claims description 39
- 239000000017 hydrogel Substances 0.000 claims description 30
- 210000004897 n-terminal region Anatomy 0.000 claims description 25
- 150000007523 nucleic acids Chemical group 0.000 claims description 23
- 239000000178 monomer Substances 0.000 claims description 21
- 238000004519 manufacturing process Methods 0.000 claims description 20
- 108020004414 DNA Proteins 0.000 claims description 18
- 230000012010 growth Effects 0.000 claims description 17
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 13
- 125000000539 amino acid group Chemical group 0.000 claims description 12
- 102000039446 nucleic acids Human genes 0.000 claims description 12
- 108020004707 nucleic acids Proteins 0.000 claims description 12
- 238000002955 isolation Methods 0.000 claims description 8
- 210000004666 bacterial spore Anatomy 0.000 claims description 3
- 230000009089 cytolysis Effects 0.000 claims description 3
- 239000002667 nucleating agent Substances 0.000 claims description 2
- 239000012460 protein solution Substances 0.000 claims description 2
- 235000018102 proteins Nutrition 0.000 abstract description 340
- 238000000429 assembly Methods 0.000 abstract description 45
- 230000000712 assembly Effects 0.000 abstract description 45
- 241000193830 Bacillus <bacterium> Species 0.000 abstract description 43
- 230000001580 bacterial effect Effects 0.000 abstract description 33
- 238000003259 recombinant expression Methods 0.000 abstract description 26
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 abstract description 15
- 235000018417 cysteine Nutrition 0.000 abstract description 13
- 239000002121 nanofiber Substances 0.000 abstract description 11
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 abstract description 8
- 108010059397 ENA-VASP proteins Proteins 0.000 description 465
- 241000083551 Ena Species 0.000 description 296
- 210000004215 spore Anatomy 0.000 description 123
- 235000001014 amino acid Nutrition 0.000 description 108
- 108090000765 processed proteins & peptides Proteins 0.000 description 51
- 241000193755 Bacillus cereus Species 0.000 description 45
- 241001660259 Cereus <cactus> Species 0.000 description 44
- 102000004196 processed proteins & peptides Human genes 0.000 description 31
- 230000003993 interaction Effects 0.000 description 30
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 28
- 238000010186 staining Methods 0.000 description 28
- 241000894007 species Species 0.000 description 27
- 241000588724 Escherichia coli Species 0.000 description 26
- 238000001338 self-assembly Methods 0.000 description 26
- 230000006870 function Effects 0.000 description 24
- 239000012528 membrane Substances 0.000 description 23
- 229920001184 polypeptide Polymers 0.000 description 23
- 238000003780 insertion Methods 0.000 description 20
- 230000037431 insertion Effects 0.000 description 20
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 18
- 239000000126 substance Substances 0.000 description 18
- 108091026890 Coding region Proteins 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 17
- 238000001727 in vivo Methods 0.000 description 17
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 16
- 239000013598 vector Substances 0.000 description 16
- 238000003917 TEM image Methods 0.000 description 15
- 230000004048 modification Effects 0.000 description 15
- 238000012986 modification Methods 0.000 description 15
- 241000894006 Bacteria Species 0.000 description 14
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 14
- 108010076818 TEV protease Proteins 0.000 description 14
- 239000011324 bead Substances 0.000 description 14
- 238000004627 transmission electron microscopy Methods 0.000 description 14
- 241000193388 Bacillus thuringiensis Species 0.000 description 13
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 13
- 238000003776 cleavage reaction Methods 0.000 description 13
- 239000000203 mixture Substances 0.000 description 13
- 239000013612 plasmid Substances 0.000 description 13
- 230000001105 regulatory effect Effects 0.000 description 13
- 230000007017 scission Effects 0.000 description 13
- 239000012620 biological material Substances 0.000 description 12
- 239000000463 material Substances 0.000 description 12
- 239000008188 pellet Substances 0.000 description 12
- 241000194106 Bacillus mycoides Species 0.000 description 11
- 101150032642 ena gene Proteins 0.000 description 11
- 230000001404 mediated effect Effects 0.000 description 11
- 238000002887 multiple sequence alignment Methods 0.000 description 11
- 238000003752 polymerase chain reaction Methods 0.000 description 11
- 210000000805 cytoplasm Anatomy 0.000 description 10
- 238000002474 experimental method Methods 0.000 description 10
- 239000012634 fragment Substances 0.000 description 10
- 230000004927 fusion Effects 0.000 description 10
- 238000001000 micrograph Methods 0.000 description 10
- 239000002773 nucleotide Substances 0.000 description 10
- 125000003729 nucleotide group Chemical group 0.000 description 10
- 239000000047 product Substances 0.000 description 10
- 238000000746 purification Methods 0.000 description 10
- 239000000243 solution Substances 0.000 description 10
- 230000028070 sporulation Effects 0.000 description 10
- 239000000725 suspension Substances 0.000 description 10
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 10
- 238000004132 cross linking Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 238000006467 substitution reaction Methods 0.000 description 9
- 125000004429 atom Chemical group 0.000 description 8
- 239000004202 carbamide Substances 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 238000009826 distribution Methods 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 238000011534 incubation Methods 0.000 description 8
- 108020004999 messenger RNA Proteins 0.000 description 8
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 8
- 239000007787 solid Substances 0.000 description 8
- 125000006850 spacer group Chemical group 0.000 description 8
- 239000010409 thin film Substances 0.000 description 8
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 7
- 238000011529 RT qPCR Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 238000005119 centrifugation Methods 0.000 description 7
- 239000013604 expression vector Substances 0.000 description 7
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 7
- 239000012139 lysis buffer Substances 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 7
- 239000011780 sodium chloride Substances 0.000 description 7
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 7
- 238000011282 treatment Methods 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 241001290017 Bacillus cytotoxicus NVH 391-98 Species 0.000 description 6
- 241000272168 Laridae Species 0.000 description 6
- 239000002981 blocking agent Substances 0.000 description 6
- 239000010949 copper Substances 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 238000001035 drying Methods 0.000 description 6
- 238000001493 electron microscopy Methods 0.000 description 6
- 230000007613 environmental effect Effects 0.000 description 6
- 108020001507 fusion proteins Proteins 0.000 description 6
- 102000037865 fusion proteins Human genes 0.000 description 6
- 230000001717 pathogenic effect Effects 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 230000000717 retained effect Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 235000014469 Bacillus subtilis Nutrition 0.000 description 5
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 5
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 5
- 241000192125 Firmicutes Species 0.000 description 5
- COQLPRJCUIATTQ-UHFFFAOYSA-N Uranyl acetate Chemical compound O.O.O=[U]=O.CC(O)=O.CC(O)=O COQLPRJCUIATTQ-UHFFFAOYSA-N 0.000 description 5
- 229940097012 bacillus thuringiensis Drugs 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 239000010408 film Substances 0.000 description 5
- 239000010931 gold Substances 0.000 description 5
- 229910052737 gold Inorganic materials 0.000 description 5
- 230000002452 interceptive effect Effects 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 229920002521 macromolecule Polymers 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 239000002086 nanomaterial Substances 0.000 description 5
- 230000036961 partial effect Effects 0.000 description 5
- 229910000160 potassium phosphate Inorganic materials 0.000 description 5
- 235000011009 potassium phosphates Nutrition 0.000 description 5
- 108020001580 protein domains Proteins 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 238000010561 standard procedure Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 238000012800 visualization Methods 0.000 description 5
- 238000005406 washing Methods 0.000 description 5
- 241000193738 Bacillus anthracis Species 0.000 description 4
- 241001560509 Bacillus cytotoxicus Species 0.000 description 4
- 241001645734 Bacillus tropicus Species 0.000 description 4
- 241000193403 Clostridium Species 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 108010067770 Endopeptidase K Proteins 0.000 description 4
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 101100038261 Methanococcus vannielii (strain ATCC 35089 / DSM 1224 / JCM 13029 / OCM 148 / SB) rpo2C gene Proteins 0.000 description 4
- 108010085220 Multiprotein Complexes Proteins 0.000 description 4
- 102000007474 Multiprotein Complexes Human genes 0.000 description 4
- 108010021466 Mutant Proteins Proteins 0.000 description 4
- 102000008300 Mutant Proteins Human genes 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 4
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 210000002808 connective tissue Anatomy 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 108091008053 gene clusters Proteins 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- NTHXOOBQLCIOLC-UHFFFAOYSA-N iohexol Chemical compound OCC(O)CN(C(=O)C)C1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C1I NTHXOOBQLCIOLC-UHFFFAOYSA-N 0.000 description 4
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 4
- YOBAEOGBNPPUQV-UHFFFAOYSA-N iron;trihydrate Chemical compound O.O.O.[Fe].[Fe] YOBAEOGBNPPUQV-UHFFFAOYSA-N 0.000 description 4
- 239000006166 lysate Substances 0.000 description 4
- 238000013081 phylogenetic analysis Methods 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 238000003762 quantitative reverse transcription PCR Methods 0.000 description 4
- 101150085857 rpo2 gene Proteins 0.000 description 4
- 101150090202 rpoB gene Proteins 0.000 description 4
- 102200049243 rs121912470 Human genes 0.000 description 4
- 210000002966 serum Anatomy 0.000 description 4
- 238000002741 site-directed mutagenesis Methods 0.000 description 4
- 239000002904 solvent Substances 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 241001219265 Bacillus manliponensis Species 0.000 description 3
- 241001645733 Bacillus pacificus Species 0.000 description 3
- 241000012248 Bacillus toyonensis Species 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 102000035195 Peptidases Human genes 0.000 description 3
- 108010029485 Protein Isoforms Proteins 0.000 description 3
- 102000001708 Protein Isoforms Human genes 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- 108700005078 Synthetic Genes Proteins 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 230000021615 conjugation Effects 0.000 description 3
- 238000013480 data collection Methods 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 230000009881 electrostatic interaction Effects 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 229940088598 enzyme Drugs 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 238000007306 functionalization reaction Methods 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 238000006116 polymerization reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 230000006337 proteolytic cleavage Effects 0.000 description 3
- 230000003362 replicative effect Effects 0.000 description 3
- 102220037927 rs1050347 Human genes 0.000 description 3
- 102220290891 rs1313810606 Human genes 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- UQDJGEHQDNVPGU-UHFFFAOYSA-N serine phosphoethanolamine Chemical compound [NH3+]CCOP([O-])(=O)OCC([NH3+])C([O-])=O UQDJGEHQDNVPGU-UHFFFAOYSA-N 0.000 description 3
- 238000005063 solubilization Methods 0.000 description 3
- 230000007928 solubilization Effects 0.000 description 3
- 230000006641 stabilisation Effects 0.000 description 3
- 238000011105 stabilization Methods 0.000 description 3
- 229920001059 synthetic polymer Polymers 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000001018 virulence Effects 0.000 description 3
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241001645732 Bacillus albus Species 0.000 description 2
- 241000257169 Bacillus cereus ATCC 10987 Species 0.000 description 2
- 241000006378 Bacillus cereus group Species 0.000 description 2
- 241000194107 Bacillus megaterium Species 0.000 description 2
- 241001645711 Bacillus mobilis Species 0.000 description 2
- 241000881337 Clostridium taeniosporum Species 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 241000672609 Escherichia coli BL21 Species 0.000 description 2
- 241000701959 Escherichia virus Lambda Species 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- MSFSPUZXLOGKHJ-UHFFFAOYSA-N Muraminsaeure Natural products OC(=O)C(C)OC1C(N)C(O)OC(CO)C1O MSFSPUZXLOGKHJ-UHFFFAOYSA-N 0.000 description 2
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 2
- 108010013639 Peptidoglycan Proteins 0.000 description 2
- 241000235648 Pichia Species 0.000 description 2
- 241000235346 Schizosaccharomyces Species 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 206010052428 Wound Diseases 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000001261 affinity purification Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 150000005829 chemical entities Chemical class 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 102000021178 chitin binding proteins Human genes 0.000 description 2
- 108091011157 chitin binding proteins Proteins 0.000 description 2
- 230000004186 co-expression Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 231100000599 cytotoxic agent Toxicity 0.000 description 2
- 239000002619 cytotoxin Substances 0.000 description 2
- 230000018044 dehydration Effects 0.000 description 2
- 238000006297 dehydration reaction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000502 dialysis Methods 0.000 description 2
- 238000010494 dissociation reaction Methods 0.000 description 2
- 230000005593 dissociations Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000012149 elution buffer Substances 0.000 description 2
- 231100000249 enterotoxic Toxicity 0.000 description 2
- 230000002242 enterotoxic effect Effects 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 238000012224 gene deletion Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 230000003053 immunization Effects 0.000 description 2
- 238000002649 immunization Methods 0.000 description 2
- 238000003126 immunogold labeling Methods 0.000 description 2
- 238000012744 immunostaining Methods 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 210000003000 inclusion body Anatomy 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 238000011081 inoculation Methods 0.000 description 2
- 230000000749 insecticidal effect Effects 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 101150094164 lysY gene Proteins 0.000 description 2
- 235000018977 lysine Nutrition 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 230000004899 motility Effects 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 230000006911 nucleation Effects 0.000 description 2
- 238000010899 nucleation Methods 0.000 description 2
- 238000006384 oligomerization reaction Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 238000005498 polishing Methods 0.000 description 2
- -1 poly(NANP) Polymers 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 230000012743 protein tagging Effects 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- 230000000087 stabilizing effect Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 125000004434 sulfur atom Chemical group 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 229940094937 thioredoxin Drugs 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- OVKKNJPJQKTXIT-JLNKQSITSA-N (5Z,8Z,11Z,14Z,17Z)-icosapentaenoylethanolamine Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)NCCO OVKKNJPJQKTXIT-JLNKQSITSA-N 0.000 description 1
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 102000013563 Acid Phosphatase Human genes 0.000 description 1
- 108010051457 Acid Phosphatase Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 241000349360 Amphibacillus marinus Species 0.000 description 1
- 241001499237 Anaerobacillus alkalidiazotrophicus Species 0.000 description 1
- 241001358254 Anaeromicrobium Species 0.000 description 1
- 241001112741 Bacillaceae Species 0.000 description 1
- 241000193833 Bacillales Species 0.000 description 1
- 241000976738 Bacillus aryabhattai Species 0.000 description 1
- 241000193410 Bacillus atrophaeus Species 0.000 description 1
- 241001363720 Bacillus aurantiacus Species 0.000 description 1
- 241000262674 Bacillus bombysepticus Species 0.000 description 1
- 241000947228 Bacillus endophyticus Species 0.000 description 1
- 241001645712 Bacillus luti Species 0.000 description 1
- 241001645710 Bacillus nitratireducens Species 0.000 description 1
- 241001645736 Bacillus paranthracis Species 0.000 description 1
- 241000906059 Bacillus pseudomycoides Species 0.000 description 1
- 241000194103 Bacillus pumilus Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 241000105655 Bacillus thuringiensis serovar chinensis CT-43 Species 0.000 description 1
- 241000790486 Bacillus wiedmannii Species 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- 241000606125 Bacteroides Species 0.000 description 1
- 101000666358 Barley stripe mosaic virus Movement protein TGB2 Proteins 0.000 description 1
- 101000971127 Bartonella henselae Autotransporter adhesin BadA Proteins 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 108010075254 C-Peptide Proteins 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- 101710168515 Cell surface glycoprotein Proteins 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 241001112696 Clostridia Species 0.000 description 1
- 241000193470 Clostridium sporogenes Species 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- OABOXRPGTFRBFZ-IMJSIDKUSA-N Cys-Cys Chemical group SC[C@H](N)C(=O)N[C@@H](CS)C(O)=O OABOXRPGTFRBFZ-IMJSIDKUSA-N 0.000 description 1
- 101710112752 Cytotoxin Proteins 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000588921 Enterobacteriaceae Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- OTMSDBZUPAUEDD-UHFFFAOYSA-N Ethane Chemical compound CC OTMSDBZUPAUEDD-UHFFFAOYSA-N 0.000 description 1
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 1
- XZWYTXMRWQJBGX-VXBMVYAYSA-N FLAG peptide Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 XZWYTXMRWQJBGX-VXBMVYAYSA-N 0.000 description 1
- 206010016952 Food poisoning Diseases 0.000 description 1
- 208000019331 Foodborne disease Diseases 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 241001135750 Geobacter Species 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 241000193004 Halobacillus Species 0.000 description 1
- 101001081176 Homo sapiens Hyaluronan mediated motility receptor Proteins 0.000 description 1
- 102100027735 Hyaluronan mediated motility receptor Human genes 0.000 description 1
- 206010058490 Hyperoxia Diseases 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241000588747 Klebsiella pneumoniae Species 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- 241001386813 Kraken Species 0.000 description 1
- 125000002061 L-isoleucyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])[C@](C([H])([H])[H])([H])C(C([H])([H])[H])([H])[H] 0.000 description 1
- 125000003440 L-leucyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 1
- 125000003580 L-valyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(C([H])([H])[H])(C([H])([H])[H])[H] 0.000 description 1
- 229910025794 LaB6 Inorganic materials 0.000 description 1
- 241000246099 Legionellales Species 0.000 description 1
- GDBQQVLCIARPGH-UHFFFAOYSA-N Leupeptin Natural products CC(C)CC(NC(C)=O)C(=O)NC(CC(C)C)C(=O)NC(C=O)CCCN=C(N)N GDBQQVLCIARPGH-UHFFFAOYSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000751411 Lysinibacillus meyeri Species 0.000 description 1
- 241000823111 Lysinibacillus sinduriensis Species 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 1
- 238000000585 Mann–Whitney U test Methods 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 101800000135 N-terminal protein Proteins 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 241000320412 Ogataea angusta Species 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 101800001452 P1 proteinase Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 241000592795 Paenibacillus sp. Species 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- 108700001094 Plant Genes Proteins 0.000 description 1
- 101710130420 Probable capsid assembly scaffolding protein Proteins 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241001451093 Rummeliibacillus pycnus Species 0.000 description 1
- 101710099182 S-layer protein Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 241001123227 Saccharomyces pastorianus Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 101710204410 Scaffold protein Proteins 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000297434 Stenotarsus subtilis Species 0.000 description 1
- 241000193998 Streptococcus pneumoniae Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 244000045067 Suillus grevillei Species 0.000 description 1
- 241000216203 Sulfolobus thuringiensis Species 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 239000007984 Tris EDTA buffer Substances 0.000 description 1
- 108010046334 Urease Proteins 0.000 description 1
- 241000607265 Vibrio vulnificus Species 0.000 description 1
- 241000890396 Virgibacillus dokdonensis Species 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000235017 Zygosaccharomyces Species 0.000 description 1
- 238000005903 acid hydrolysis reaction Methods 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- MGSKVZWGBWPBTF-UHFFFAOYSA-N aebsf Chemical compound NCCC1=CC=C(S(F)(=O)=O)C=C1 MGSKVZWGBWPBTF-UHFFFAOYSA-N 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 239000003905 agrochemical Substances 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 230000010310 bacterial transformation Effects 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000032770 biofilm formation Effects 0.000 description 1
- 230000036983 biotransformation Effects 0.000 description 1
- 239000006161 blood agar Substances 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 238000013216 cat model Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002361 compost Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 238000000604 cryogenic transmission electron microscopy Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000013578 denaturing buffer Substances 0.000 description 1
- 238000000432 density-gradient centrifugation Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 230000001079 digestive effect Effects 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 150000002019 disulfides Chemical class 0.000 description 1
- 230000005059 dormancy Effects 0.000 description 1
- 238000002296 dynamic light scattering Methods 0.000 description 1
- 210000004177 elastic tissue Anatomy 0.000 description 1
- 238000000635 electron micrograph Methods 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012847 fine chemical Substances 0.000 description 1
- 239000013305 flexible fiber Substances 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 239000002044 hexane fraction Substances 0.000 description 1
- 239000012510 hollow fiber Substances 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000000222 hyperoxic effect Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000009878 intermolecular interaction Effects 0.000 description 1
- 230000006917 intersubunit interaction Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- GDBQQVLCIARPGH-ULQDDVLXSA-N leupeptin Chemical compound CC(C)C[C@H](NC(C)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C=O)CCCN=C(N)N GDBQQVLCIARPGH-ULQDDVLXSA-N 0.000 description 1
- 108010052968 leupeptin Proteins 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 150000002669 lysines Chemical class 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000008204 material by function Substances 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 238000007392 microtiter assay Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 230000003990 molecular pathway Effects 0.000 description 1
- 230000000921 morphogenic effect Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 239000002070 nanowire Substances 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 238000002439 negative-stain electron microscopy Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 238000000059 patterning Methods 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 238000005191 phase separation Methods 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 238000011533 pre-incubation Methods 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- RYVMUASDIZQXAA-UHFFFAOYSA-N pyranoside Natural products O1C2(OCC(C)C(OC3C(C(O)C(O)C(CO)O3)O)C2)C(C)C(C2(CCC3C4(C)CC5O)C)C1CC2C3CC=C4CC5OC(C(C1O)O)OC(CO)C1OC(C1OC2C(C(OC3C(C(O)C(O)C(CO)O3)O)C(O)C(CO)O2)O)OC(CO)C(O)C1OC1OCC(O)C(O)C1O RYVMUASDIZQXAA-UHFFFAOYSA-N 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000027756 respiratory electron transport chain Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 239000002002 slurry Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 230000004763 spore germination Effects 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 125000005289 uranyl group Chemical group 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/32—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Artificial Filaments (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本発明は、バイオナノ材料としての適用のための、バチルス属(Bacillus)芽胞付属物(Ena)並びに新規タンパク質多量体アセンブリー及び繊維アセンブリーの分野に関する。特に、本発明は、保存されたN末端システイン含有領域を含有する、細菌DUF3992ドメイン含有タンパク質サブユニットから構成された自己アセンブルタンパク質、及び操作されたタンパク質、並びにこれらの多量体及び繊維に関する。さらに、前記自己アセンブルタンパク質サブユニットの組換え発現は、新規のタンパク質ナノ繊維及びバチルス属芽胞などの改変提示表面の作製法をもたらす。最後に、生物医学的適用及び生物工学的適用における前記多量体、繊維及び表面の使用が本明細書において記載される。
Description
本発明は、バイオナノ材料としての適用のための、バチルス属(Bacillus)芽胞付属物(Ena)並びに新規タンパク質多量体アセンブリー及び繊維アセンブリーの分野に関する。特に、本発明は、保存されたN末端システイン含有領域を含有する、細菌DUF3992ドメイン含有タンパク質サブユニットから構成された自己アセンブルタンパク質、及び操作されたタンパク質、並びにこれらの多量体及び繊維に関する。さらに、前記自己アセンブルタンパク質サブユニットの組換え発現は、新規のタンパク質ナノ繊維及びバチルス属芽胞などの改変された提示表面の作製法をもたらす。最後に、生物医学的適用及び生物工学的適用における前記多量体、繊維及び表面の使用が本明細書において記載される。
自己アセンブル分子は、化学的機能性及び形状を制御し、これにより、生物学的活性を制御する魅力的な機会をもたらす。それらのモジュラー性、生体適合性及び生体分解性を含む、タンパク質の固有の特性は、高性能なナノ材料をデザインする、興味深い機会を提供する(Herrera Estrada及びChampion、2015;Jainら、2018)。自然に着想を得て、いくつかのタンパク質/ペプチドが、ナノ粒子、小胞、ケージ及び繊維アセンブリーの範囲の、様々な複合体構造へと自己アセンブルするように操作されており、これらは、生物学的操作された多様な領域において、多数の適用をもたらす、新規の機能性を付与されうる(Matsuurua、2014;Katyalら、2019)。自己アセンブルペプチド及び自己アセンブルタンパク質のアミノ酸配列の変動並びに環境パラメータの操作は、特性をモジュレートし、自己アセンブリーを制御して、多様な、オンデマンドの超分子的ナノ構造を得ることを可能とする(Lombardiら、2019)。アミノ酸内の側鎖の多様な特性は、無限の配列組合せによる、それらの化学修飾に対する可能性をもたらすほか、タンパク質のアミン末端及び/又はカルボキシ末端の改変は、タンパク質ポリマーの、特異的なナノアーキテクチャーへの自己アセンブリーを微調整しうる(Aluriら、2012;Yuら、1996)。したがって、天然の自己アセンブルタンパク質又は自己アセンブルペプチドは、自己アセンブリー以外の多様な特性であって、自己治癒、シアーシニング、形状記憶などを含む特性を誘導するように操作されうる(Chen及びZou、2019)。
増殖に不利な条件に直面した場合、ファーミキューテス門(Firmicutes)に属する細菌は、代謝的に休眠性であり、非繁殖性である、芽胞状態へと分化しうる。これらの芽胞は、それらの脱水状態及び固有の多層化細胞構造のために、環境ストレス因子に対する、極度の回復力を呈し、それらの形成の数百年後においてもなお、代謝的に活性であり、複製的である、栄養増殖状態へと発芽しうる(Setlow、2014)。このようにして、バチルス属及びクロストリジウム属(Clostridia)に属するファーミキューテスは、長期間にわたる、乾燥、飢餓、高酸素又は抗生剤によるストレスに耐えることが可能である。芽胞は、典型的に、細菌DNAを含有する、最内部の脱水コアからなる。コアは、芽胞の発芽時に出現する、栄養細胞の細胞壁として機能する、ペプチドグリカンの薄層により取り囲まれた内膜により封入されている。次いで、休眠に必須である、修飾ペプチドグリカンによる、厚い外皮層が現れる(Atrih及びFoster、1999)。外皮層は、いくつかのタンパク質性被膜層により取り囲まれている。一部のクロストリジウム属種及び大半のバチルス・セレウス(Bacillus cereus)群種において、芽胞は、(糖)タンパク質及び脂質からなる、最も外側の、緩い準結晶性外膜層により封入されている(Stewart、2015)。バチルス属及びクロストリジウム属芽胞の表面はまた、数マイクロメートル長であり、かつ、数ナノメートル幅である、株及び種の間において、大きな構造的多様性を示す、フィラメント状付属物によっても装飾されうる(Hachisuka及びKuno、1976;Rodeら、1971;Walkerら、2007)。広義におけるバチルス・セレウスは、それらの系統発生関係にもかかわらず、高度な生態的多様性を提示する、グラム陽性芽胞形成菌の群である。これらの芽胞は、それらの脱水状態及び固有の多層化細胞構造のために、環境ストレス因子に対する、極度の回復力を呈し、それらの形成の数百年後においてもなお、代謝的に活性であり、複製的である、栄養増殖状態へと発芽しうる(Setlow、2014)。B.セレウス(B.cereus)芽胞は、識別及び機能が未詳である、マイクロメートル長の付属物により装飾されている。芽胞付属物(これ以降Enaと称される)の数及び形状は、B.セレウス群の株及び種の間において変動し、一部の株は、なお、異なる形状のEnaを、同時に発現させる(Smirnovaら、2013)。栄養細胞の表面において、Enaに相似する構造は観察されていないことから、それらが、芽胞特異的繊維を表すことを示唆する。Enaは、B.セレウス群に属する株の芽胞の間における、広範な特徴であると考えられる。Ankolekarらは、B.セレウスの47の食物分離株の全てが、付属物を伴う芽胞を産生することを示した(Ankolekar及びLabbe、2010)。付属物はまた、B.セレウスと近縁であり、その殺虫活性について最も良く知られた(Ankolekar及びLabbe、2010)、バチルス・チューリンギエンシスの、食物媒介型腸毒性分離株12株中10株(バチルス・チューリンギエンシス)の芽胞上においても見出された。まとめると、これは、これらのEna構造を、持続可能な新生体材料を操作するための、興味深い出発点とする。目覚ましいことに、B.セレウス群に属する種における、芽胞付属物の存在は、既に、1960年代に報告されたが、それらの組成及び遺伝子同一性を特徴付けようとする取組みは、繊維を可溶化させ、酵素により消化することの困難のために失敗していた(Gerhardt及びRibi、1964;DesRosier及びLara、1981)。したがって、過酷な環境条件下における持続可能性などの特性が改善された、新種類の高性能生体材料の、デザイン、開発及び作製を可能とする、このような芽胞付属物の構造的特徴付けに対する、関心及び必要性が存在する。
Herrera Estrada及びChampion、2015
Jainら、2018
Matsuurua、2014
Katyalら、2019
Lombardiら、2019
Aluriら、2012
Yuら、1996
Chen及びZou、2019
Setlow、2014
Atrih及びFoster、1999
Bacillus cereus
Stewart、2015
Hachisuka及びKuno、1976
Rodeら、1971
Walkerら、2007
Setlow、2014
Smirnovaら、2013
Ankolekar及びLabbe、2010
Ankolekar及びLabbe、2010
Gerhardt及びRibi、1964
DesRosier及びLara、1981
(発明の要旨)
本発明は、食中毒流行株である、B.セレウスNVH-0075/95株から単離された芽胞付属物(Ena)についての、遺伝子ベース及び構造的ベースの分解することに基づく。2つの主要形状である、S型繊維及びL型繊維のタンパク質性繊維を明らかにした。cryo-EM及び三次元ヘリックス再構築を使用することにより、バチルス属芽胞付属物(Ena)は、βシートの拡張により、水平方向に積み重ねする多量体を形成する、ゼリーロール状トポロジーを伴うサブユニットにより特徴付けられた、グラム陽性菌線毛の新規クラスを形成することが示された。さらに、Ena繊維は、長手方向において、多量体を架橋する、それらのN末端タンパク質サブユニットペプチドの伸長を介する、ジスルフィド架橋により安定化される結果として、熱、乾燥及び化学的損傷に対して、高度に抵抗性である、可撓性線毛をもたらす(また、図2も参照されたい)。三次元構造は、Ena繊維が、本明細書において、初めて、「Ena」タンパク質としてアノテーションされた、各ファミリーメンバーについて、現在のところ機能が未知であり、保存されたN末端領域を伴う、細菌DUF3992ドメイン含有タンパク質のタンパク質ファミリーから構成されることの推定を可能とした。S型繊維及びL型繊維の構成要素についての遺伝子同一性は、潜在的Enaタンパク質サブユニットをコードする遺伝子を欠く突然変異体についての解析により確認された。系統発生解析は、S型Ena繊維が、B.セレウス群に属する種のサブセット内に固有に存在する、ジシストロニックオペロンによりコードされることを示し、異なる生態型及び病原型の間において規定されたEnaクレードであって、少なくとも2つの保存されたシステイン残基及びスペーサー領域(図8を参照されたい)を伴うN末端領域により特徴付けられたEnaタンパク質に続き、本明細書において規定された、フォールディング構造への自己アセンブリーを可能とし、多量体アセンブリー又は繊維アセンブリーを結果としてもたらす、DUF3992ドメインをコードする、一般特徴を有するEna遺伝子を伴うEnaクレードの存在を明らかにした。インビボにおいて、Enaオペロンにおいてコードされたサブユニットは、Enaのアセンブリーについて、相互依存的である。驚くべきことに、組換え発現されたEnaタンパク質は、個別に、インビボにおけるEnaのタンパク質ナノ繊維と類似する特性及び構造を伴う、タンパク質ナノ繊維へと自己アセンブルするように作製されうる。したがって、Enaは、細菌芽胞が遭遇する、過酷な条件へと特異的に適合された、線毛の新規のクラスを表し、本明細書において、遺伝子ベース及び構造的ベースを明らかにすることにより、次世代生体材料として適用可能な、円板又はヘリックスなどのタンパク質アセンブリーをもたらすように、改変された芽胞又は改変された及び操作されたEnaプロトマー若しくは多量体をどのようにして作製するのかについての洞察が確立される。
本発明は、食中毒流行株である、B.セレウスNVH-0075/95株から単離された芽胞付属物(Ena)についての、遺伝子ベース及び構造的ベースの分解することに基づく。2つの主要形状である、S型繊維及びL型繊維のタンパク質性繊維を明らかにした。cryo-EM及び三次元ヘリックス再構築を使用することにより、バチルス属芽胞付属物(Ena)は、βシートの拡張により、水平方向に積み重ねする多量体を形成する、ゼリーロール状トポロジーを伴うサブユニットにより特徴付けられた、グラム陽性菌線毛の新規クラスを形成することが示された。さらに、Ena繊維は、長手方向において、多量体を架橋する、それらのN末端タンパク質サブユニットペプチドの伸長を介する、ジスルフィド架橋により安定化される結果として、熱、乾燥及び化学的損傷に対して、高度に抵抗性である、可撓性線毛をもたらす(また、図2も参照されたい)。三次元構造は、Ena繊維が、本明細書において、初めて、「Ena」タンパク質としてアノテーションされた、各ファミリーメンバーについて、現在のところ機能が未知であり、保存されたN末端領域を伴う、細菌DUF3992ドメイン含有タンパク質のタンパク質ファミリーから構成されることの推定を可能とした。S型繊維及びL型繊維の構成要素についての遺伝子同一性は、潜在的Enaタンパク質サブユニットをコードする遺伝子を欠く突然変異体についての解析により確認された。系統発生解析は、S型Ena繊維が、B.セレウス群に属する種のサブセット内に固有に存在する、ジシストロニックオペロンによりコードされることを示し、異なる生態型及び病原型の間において規定されたEnaクレードであって、少なくとも2つの保存されたシステイン残基及びスペーサー領域(図8を参照されたい)を伴うN末端領域により特徴付けられたEnaタンパク質に続き、本明細書において規定された、フォールディング構造への自己アセンブリーを可能とし、多量体アセンブリー又は繊維アセンブリーを結果としてもたらす、DUF3992ドメインをコードする、一般特徴を有するEna遺伝子を伴うEnaクレードの存在を明らかにした。インビボにおいて、Enaオペロンにおいてコードされたサブユニットは、Enaのアセンブリーについて、相互依存的である。驚くべきことに、組換え発現されたEnaタンパク質は、個別に、インビボにおけるEnaのタンパク質ナノ繊維と類似する特性及び構造を伴う、タンパク質ナノ繊維へと自己アセンブルするように作製されうる。したがって、Enaは、細菌芽胞が遭遇する、過酷な条件へと特異的に適合された、線毛の新規のクラスを表し、本明細書において、遺伝子ベース及び構造的ベースを明らかにすることにより、次世代生体材料として適用可能な、円板又はヘリックスなどのタンパク質アセンブリーをもたらすように、改変された芽胞又は改変された及び操作されたEnaプロトマー若しくは多量体をどのようにして作製するのかについての洞察が確立される。
本発明の第1の態様は、自己アセンブル特性を伴うタンパク質に関し、アミノ酸配列において、PFAM13157クラスに属することを特徴とする、すなわち、その配列内のDUF3992ドメインの存在により特徴付けられ、具体的には、本明細書に提示されたEnaタンパク質の三次元構造フォールド、具体的には、Ena1B(配列番号8において示された配列を有する)のフォールドと、DaliZスコアが、6以上、6.5以上又は、好ましくは、(n/10)-4[式中、nは、前記タンパク質配列のアミノ酸数である。]以上として規定された、高度に著しい類似性スコアでマッチすることが必要である。実施形態において、前記自己アセンブルタンパク質サブユニットは、本出願において同定されたEnaタンパク質配列を表す、配列番号1~80、配列番号145及び配列番号146又は配列番号1~80、配列番号145若しくは配列番号146の配列のうちのいずれか1つに対する少なくとも60%若しくは少なくとも70%若しくは少なくとも80%若しくは少なくとも90%の同一性を有する、任意の原核生物ホモログの群から選択されるアミノ酸配列を含む、細菌由来タンパク質によりもたらされるが、この場合、同一性%は、配列の全長ウィンドウにわたり計算される。実のところ、細菌Enaファミリーは、下記において記載される、異なるメンバーにさらに分類されるので、本明細書において開示されたEna1Bフォールドにマッチするための、本明細書において記載された構造的要件は、配列番号8の参照構造配列に対する、60%の同一性をなおも下回る相同性を伴う細菌タンパク質を、さらに表すことが多い。したがって、一実施形態は、表1に示された、その隠れマルコフモデルと連携することにより決定された、DUF3992ドメインを含み、前記タンパク質サブユニットが、本明細書において規定されたフォールド類似性スコアが6.5以上でEna1B構造にマッチする三次元(予測)フォールドを有し、Ena1Bが、配列番号8に対応し、Ena1Bの参照構造が、本明細書の表2に提示され、PDB7A02に寄託された座標に対応する、単離された自己アセンブルタンパク質に関する。
具体的な実施形態において、本明細書において言及された自己アセンブルタンパク質は、上記において規定され、かつ/又は配列番号1~80、配列番号145若しくは配列番号146において示されたアミノ酸配列によりもたらされた、前記Enaタンパク質ファミリーに関し、バチルス属のEna1A(配列番号1~7)、Ena1B(配列番号8~14)、Ena1C(配列番号15~20)、バチルス属のEna2A(配列番号21~28、配列番号145)、Ena2B(配列番号29~37)、Ena2C(配列番号38~48、配列番号146)及び他のバチルス属のEna3(配列番号49~80)タンパク質のそれぞれの異なる種類又はこれらのうちのいずれか1つの細菌オーソログについての代表例を提示し、これらは配列番号1~80、配列番号145若しくは配列番号146に示された、任意の配列に対する少なくとも80%の同一性を有する。配列保存の領域及びレベルは、図16~19に示された、複数の配列アライメントごとに、Enaファミリーメンバーについて示される。
さらなる実施形態は、本明細書において記載された、前記自己アセンブルタンパク質に関する。これは、操作された自己アセンブルタンパク質であり、この場合、本明細書において記載された、Enaフォールド及びHMMプロファイルは、本明細書において記載された、Ena1Bフォールド及びDUF3992プロファイルとマッチするが、例えば、異種N末端タグ若しくは異種C末端タグ及び/又は立体障害、天然Ena配列又は野生型Ena配列と比較して、1つ以上の突然変異を含有する場合もあり、ペプチド若しくはスキャフォールドの挿入又は多数のアミノ酸の欠失を含有する場合もあり、共インキュベーション時にアセンブルする、「スプリット」部分など、個別のEnaタンパク質部分として提供される場合もある、タンパク質配列変異体を含む修飾のうちの少なくとも1つであるがこれらに限定されない修飾を、さらに含むことにより「操作された」又は「修飾」された、Ena1Bフォールド及びDUF3992プロファイルにマッチする。
本発明の第2の態様は、前記自己アセンブルタンパク質サブユニットのうちの、少なくとも7つを含む、又は含有し、好ましくは、7つ~最大12の間のサブユニットを含む、又は含有する、タンパク質多量体に関する。これは、非共有結合的に連結される。より具体的に述べると、前記多量体は、βシートの拡張(Remaut及びWaksman、2006において記載された、タンパク質間相互作用の原理)を介して、非共有結合的に積み重ねられた、7つ、8つ、9つ、10、11、12、13、14、15、16、17、18、19、20以上の、本明細書において規定された、Ena自己アセンブルタンパク質サブユニットからなる。具体的な実施形態において、本明細書において記載された、前記多量体は、例えば、前記多量体の、異なるタンパク質サブユニット間のCys接続によりもたらされる、共有結合的接続をさらに含みうる(適切な条件下において)。一実施形態において、前記多量体は、「それ自体として」存在する、すなわち、フィラメント集合体又は繊維集合体としてではなく存在するので、非自然発生の多量体アセンブリーである。特に、本明細書において、Enaタンパク質として規定された、前記自己アセンブルタンパク質サブユニットは、さらなる多量体との、分子間ジスルフィド架橋の形成のために、本明細書において、互換的に使用された、それらのN末端領域又はN末端接続部において、少なくとも2つの保存されたシステイン残基をさらに含みうる。具体的な実施形態において、多量体アセンブリーは、本明細書においてさらに規定された、又は配列番号1~80、配列番号145又は配列番号146において示されたアミノ酸配列によりもたらされた、Enaタンパク質ファミリーに由来する、7つ~12のタンパク質サブユニットを含み、バチルス属のEna1A(配列番号1~7)、Ena1B(配列番号8~14)、Ena1C(配列番号15~20)、バチルス属のEna2A(配列番号21~28、配列番号145)、Ena2B(配列番号29~37)、Ena2C(配列番号38~48、配列番号146)及び他のバチルス属のEna3(配列番号49~80)タンパク質のそれぞれの異なる種類又はこれらの細菌オーソログの代表例を提示し、これらは配列番号1~80、配列番号145若しくは配列番号146に示された任意の配列に対する少なくとも80%の同一性を有する。具体的な実施形態は、本明細書において記載された、同一な自己アセンブルタンパク質による、7つ~12のタンパク質サブユニットを伴う前記多量体に関する。代替的に、多量体は、少なくとも7つのタンパク質サブユニットを含み、この場合、前記タンパク質サブユニットのうちの少なくとも1つは、本明細書において規定され、非自然発生のEnaタンパク質に関する、操作されたEna自己アセンブルタンパク質である。具体的な実施形態において、前記多量体は、少なくとも7つ、好ましくは、最大において12のEnaタンパク質サブユニットを含み、この場合、少なくとも1つのサブユニットは、N末端及び/又はC末端において、立体障害を含み、これにより、多量体が、繊維へと、さらにアセンブルすることを防止する、操作されたEnaタンパク質(図14)である。具体的な実施形態において、前記N末端又はC末端における立体障害は、異種N末端タグ及び/又は異種C末端タグである。具体的な実施形態において、立体障害などを形成するための、前記異種N末端タグ及び/若しくは異種C末端タグ又は異種N末端伸長部及び/若しくは異種C末端伸長部は、最小において、1、2、3、4、5、好ましくは、6アミノ酸残基以上である。ある特定の実施形態は、前記Enaタンパク質サブユニットが、同一なEna自己アセンブルタンパク質の場合もあり、異なるEna自己アセンブルタンパク質の場合もある前記多量体であって、それらのうちの少なくとも1つが、異種N末端タグ及び/又は異種C末端タグを含むように操作された前記多量体に関する。代替的に、前記少なくとも1つの操作されたEnaタンパク質サブユニットは、Ena突然変異タンパク質変異体の場合もあり、融合タンパク質である、又は図15において例示及び記載され、実施例節において概括された通り、露出ループにおける、ペプチドドメイン又はタンパク質ドメインの挿入を含有する、Enaタンパク質の場合もある。
具体的な実施形態は、ホモ多量体又はヘテロ多量体である、本明細書において記載された前記多量体に関し、より具体的に述べると、6つ又は7つ~12のサブユニットからなる多量体に関し、好ましくは、7量体に関するので、7つのサブユニットからなる、若しくは9量体に関するので、9つのサブユニットからなり、これにより、いずれもが、おそらく、円板様多量体を形成する、又は10量体、11量体若しくは12量体に関するので、それぞれ10、11若しくは12のサブユニットからなり、これにより、おそらく、βプロペラ構造による、ヘリックスターン若しくはヘリックスアークを形成する(図14)。
別の実施形態は、タンパク質サブユニットのN末端領域モチーフ内及びC末端領域モチーフ内に存在するシステイン(C)が、1つの多量体を別の多量体へと長手方向において接続する、ジスルフィド架橋を形成しうる(最終的に、図14A;図16~17におけるS型繊維へのアセンブリーをもたらす)ように、アミノ酸残基によるコンセンサスモチーフZXnCCXmC[配列中、Xは、任意のアミノ酸であり、nは、1又は2であり、mは、10~12の間であり、Zは、好ましくは、Leu、Ile、Val又はPheである。]が存在する、N末端領域又はN末端接続部(Ntc)領域を含み、好ましくは、C末端領域又はC末端受容部領域が、コンセンサスモチーフGX2/3CX4Y[配列中、Gは、グリシンであり、Xは、任意のアミノ酸(2つ又は3つの残基)であり、Yは、チロシンである。]を含む、前記自己アセンブルタンパク質のサブユニット又はDUF3992含有自己アセンブルタンパク質サブユニット若しくはEnaタンパク質サブユニット若しくは操作されたEnaタンパク質サブユニットの多量体に関する。さらなる代替的実施形態は、本明細書において規定された、モチーフZXnCCXmCを伴う、N末端接続部領域を含むが、N末端スペーサー領域がより短い[配列中、mは、7~9である。]、又はN末端スペーサー領域がより長い[配列中、mは、13~16である。]、操作された自己アセンブルタンパク質のサブユニット又は多量体に関する。前記操作された多量体は、自己アセンブルすると、前記スペーサー領域についてのmが、10~12である多量体によりアセンブルされた繊維と比較して、可撓性が小さい、又は剛性が大きい繊維を結果としてもたらす。さらなる代替的実施形態は、タンパク質サブユニットのN末端領域モチーフ内及びC末端領域モチーフ内に存在するシステイン(C)が、1つの多量体を別の多量体へと長手方向において接続する、ジスルフィド架橋を形成しうる(最終的に、図14B;図19におけるL型繊維へのアセンブリーをもたらす)ように、アミノ酸残基によるコンセンサスモチーフZXnC(C)XmC[配列中、Xは、任意のアミノ酸であり、nは、1又は2であり、mは、10~12の間であり、Zは、好ましくは、Leu、Ile、Val又はPheであり、Cは、cysであり、(C)は、任意選択的なCysであり、これは、1つ又は2つのcysが、これらのEnaタンパク質のための前記モチーフ内に存在することを意味する(本明細書では、最終的に、Ena3タンパク質として、さらに分類される)]が存在する、N末端領域又はN末端接続部領域を含み、好ましくは、C末端領域又はC末端受容部領域が、コンセンサスモチーフS-Z-N-Y-X-B[配列中、Zは、Leu又はIleであり、Bは、Phe又はTyrであり、Xは、任意のアミノ酸である。]を含む、前記Enaタンパク質サブユニットにより構成された、前記自己アセンブルタンパク質のサブユニット又は多量体に関する。
本発明の別の態様は、本明細書において記載された前記多量体のうちの、少なくとも2つを含むように作製されたタンパク質繊維に関し、この場合、前記多量体は、ジスルフィド結合を介して、より具体的に述べると、少なくとも1つのジスルフィド結合、好ましくは、2つ以上のジスルフィド結合を介して、長手方向において架橋することを妨げられない。前記ジスルフィド結合は、長手方向において形成されたタンパク質繊維の先行層を構成する多量体の、1つ以上のサブユニットの、N末端領域内及び/又はC末端領域内に、1つ以上のシステイン残基が存在する多量体の、1つ以上のサブユニットの、N末端領域又はN末端接続部のシステイン残基の側鎖の間において形成されうる。前記タンパク質繊維は、組換えにより作製された繊維でありうる。
別の実施形態において、前記タンパク質繊維は、本明細書において規定された操作された多量体である少なくとも1つの多量体、又は本明細書において規定された少なくとも1つの操作されたEnaタンパク質を含む少なくとも1つの多量体のうちの少なくとも2つの多量体を含む、操作されたタンパク質繊維である。好ましい実施形態において、タンパク質繊維は、タンパク質サブユニットが、本明細書において記載された、同一な自己アセンブルタンパク質サブユニットを含み、かつ/又は同一なEnaタンパク質から構成される多量体を含む。
本発明の別の態様は、(操作された)自己アセンブルタンパク質、好ましくは、本明細書において規定されたEnaタンパク質のコード配列を含むDNAエレメントに作動可能に連結された、プロモーター又は調節配列エレメントを含む、キメラ遺伝子構築物に関する。より具体的に述べると、前記コード配列は、配列番号1~80、配列番号145若しくは配列番号146に示されたEnaタンパク質又は配列番号1~80、配列番号145若しくは配列番号146のうちのいずれかに対する少なくとも80%のアミノ酸同一性を有する、Ena1/Ena2A、Ena1/Ena2B、Ena1/Ena2C又はEna3Aを含む前記Enaファミリーメンバーのうちのいずれかの機能的ホモログを含むタンパク質をコードする場合もあり、本明細書において規定された、これらの操作されたEnaタンパク質形態をコードする場合もある。具体的な実施形態において、前記プロモーター又は調節エレメントは、コード配列に対して、異種であり、作動可能に連結され、任意選択的に、当技術分野において公知の、誘導的プロモーターである。
さらなる実施形態は、本明細書において記載されたキメラ遺伝子の発現又は本明細書において記載された、多量体若しくはタンパク質アセンブリーの、自己アセンブルプロトマーの発現のための宿主細胞に関する。別の実施形態は、本明細書において記載されたキメラ遺伝子又は操作されたEna遺伝子又は操作されたEnaタンパク質をコードする遺伝子を含む、改変された芽胞形成細胞又は改変された芽胞形成細菌に関する。別の実施形態は、Enaタンパク質若しくはこれらの操作された形態又は本明細書において記載された多量体を含み、かつ/若しくは提示する、又はタンパク質繊維、特に、操作されたタンパク質繊維若しくは修飾タンパク質繊維、本明細書において記載された、組換え作製繊維若しくは組換え作製芽胞を有する、改変された細菌芽胞、特に、改変されたバチルス属芽胞に関する。
本発明のさらなる態様において、本明細書において記載された、Enaタンパク質、多量体アセンブリー若しくはタンパク質繊維又はこれらのいずれかの操作された形態を含む、改変された表面又は固体支持体が提供される。前記改変された表面は、前記Enaタンパク質、多量体又は繊維の、前記表面への共有結合的接合により構成され、細胞表面の場合もあり、人工表面、特に、任意の種類の材料固体表面の場合もある。したがって、前記改変された表面は、例えば、前記改変された表面が、Enaタンパク質溶液へと、曝露された又は接触された場合に、タンパク質繊維のエピタキシャル成長のための、核生成剤として使用される場合があり、この場合、前記Enaタンパク質は、好ましくは、単量体形態又はオリゴマー形態において存在する。
さらなる実施形態は、操作されたEnaタンパク質繊維及び/又は本明細書において記載されたEnaタンパク質繊維を含み、膜が、好ましくは、当技術分野において公知の薄膜である、タンパク質膜に関する。代替的に、本明細書において記載された、操作されたタンパク質繊維及び/又は本明細書において記載された、Enaタンパク質繊維を含むハイドロゲルが本明細書において開示される。さらなる実施形態は、より太いスレッド様バンドルへと紡がれた、操作されたタンパク質繊維を含むナノワイヤーに関する。
本発明の最後の態様は、本明細書において記載されたタンパク質アセンブリー、より詳細には、Enaタンパク質、多量体アセンブリー及び繊維アセンブリー又は改変された表面、特に、本明細書において記載された、芽胞表面又は合成表面を組換えにより作製する方法に関する。
一実施形態は、自己アセンブルDUF3992ドメイン含有単量体又は本明細書において記載された多量体を作製する方法であって、
a)本明細書において記載されたキメラ遺伝子構築物を、宿主細胞内において、又は本明細書において記載された宿主細胞を使用して発現させるステップであって、自己アセンブルタンパク質サブユニットが、任意選択的に、N末端タグ及び/又はC末端タグを含むステップ、並びに(任意選択的に)
b)自己アセンブルされたDUF3992ドメイン含有タンパク質又は多量体を精製するステップであって、後者が、発現されたタンパク質サブユニットのオリゴマー化の後において形成されるステップ
を含む方法について記載する。
a)本明細書において記載されたキメラ遺伝子構築物を、宿主細胞内において、又は本明細書において記載された宿主細胞を使用して発現させるステップであって、自己アセンブルタンパク質サブユニットが、任意選択的に、N末端タグ及び/又はC末端タグを含むステップ、並びに(任意選択的に)
b)自己アセンブルされたDUF3992ドメイン含有タンパク質又は多量体を精製するステップであって、後者が、発現されたタンパク質サブユニットのオリゴマー化の後において形成されるステップ
を含む方法について記載する。
別の実施形態は、繊維アセンブリー又はエピタキシャル成長が停止された、又は少なくとも妨げられた、自己アセンブルDUF3992ドメイン含有タンパク質又はEnaタンパク質を、組換えにより作製する方法であり、したがって、繊維成長が遮断された、操作されたEnaタンパク質を、組換えにより作製する方法であって、上記において記載された方法を含み、N末端タグ及び/又はC末端タグが、長手方向の繊維形成において、タンパク質サブユニット又は多量体の自己アセンブリーに立体障害をもたらすように、少なくとも1、好ましくは少なくとも6、より好ましくは少なくとも9、又は15アミノ酸の長さである方法をもたらす。さらなる実施形態において、前記N末端タグ又はC末端タグは、長手方向の剛性繊維形成において、タンパク質サブユニット又は多量体の自己アセンブリーを可逆的に妨げる、又は阻むように、少なくとも6アミノ酸の長さである。前記の場合、N末端タグ又はC末端タグは、例えば、プロテアーゼによるタグの除去並びにサブユニット及び多量体のアセンブリーの立体障害を反転させるための、プロテアーゼ認識配列を含むことにより、除去可能なタグでありうる。
別の実施形態は、本明細書において記載されたタンパク質繊維を作製する方法であって、上記の方法のステップa)及びb)を含み、N末端タグ及び/又はC末端タグが、除去可能なタグ又は切断可能なタグとして存在し、ステップc)をさらに含み、形成された多量体の、タンパク質繊維への、さらなる自己アセンブリーを可能とするように、N末端タグ及び/又はC末端タグが、除去又は切断される方法に関する。代替的に、ステップc)は、精製ステップb)の前に行われる場合もある。さらに、本明細書において記載された改変された表面を作製する方法であって、ステップa)、b)及び/又はc)(又は、逆に、c)及び/若しくはb))を含み、ステップd)をさらに含み、表面が、(操作された)Enaタンパク質、多量体又は繊維を、前記表面へと提示する、又は共有結合的に接合させることにより改変される方法も提示される。
最後に、本明細書において記載された繊維など、タンパク質アセンブリーは、Enaタンパク質繊維の組換え作製のための方法であって、
a)本明細書において記載された、キメラ遺伝子構築物を、宿主細胞内において、若しくは本明細書において記載された宿主細胞を使用して発現させるステップ又はEnaタンパク質若しくは本明細書において記載された、操作されたEnaタンパク質を発現させるステップであって、タンパク質サブユニットが、立体障害を有さないので、自己アセンブルタンパク質が、遊離N末端接続部を伴う、野生型又は操作された自己アセンブルEnaタンパク質からなるステップ、並びに(任意選択的に)
b)細胞質内において発現されたタンパク質サブユニットのオリゴマー化の後において形成された、繊維又は多量体などのEnaタンパク質アセンブリーを単離するステップ
を含む方法において示された通りに、細胞内において作製される。
a)本明細書において記載された、キメラ遺伝子構築物を、宿主細胞内において、若しくは本明細書において記載された宿主細胞を使用して発現させるステップ又はEnaタンパク質若しくは本明細書において記載された、操作されたEnaタンパク質を発現させるステップであって、タンパク質サブユニットが、立体障害を有さないので、自己アセンブルタンパク質が、遊離N末端接続部を伴う、野生型又は操作された自己アセンブルEnaタンパク質からなるステップ、並びに(任意選択的に)
b)細胞質内において発現されたタンパク質サブユニットのオリゴマー化の後において形成された、繊維又は多量体などのEnaタンパク質アセンブリーを単離するステップ
を含む方法において示された通りに、細胞内において作製される。
記載された図面は、概略図に過ぎず、非限定的なものである。図面において、要素の一部の大きさは、例示を目的として誇張され、縮尺通りではない場合がある。
本発明は、ある特定の図面を参照しながら、特定の実施形態について記載されるが、本発明は、これらに限定されず、特許請求の範囲だけにより限定される。特許請求の範囲内の、いかなる参照記号も、範囲を限定するものとしてみなされないものとする。当然ながら、全ての態様又は利点は、必ずしも、本発明のいかなる特定の実施形態に従っても達成されない場合があることが理解されるものとする。したがって、例えば、当業者は、本発明は、本明細書において教示又は示唆されうる他の態様又は利点を、必ずしも達成することなく、本明細書において教示された、1つの利点又は利点群を達成又は最適化する形において、実現又は実施される場合があることを認識する。本発明は、その特色及び利点と併せた、組織化及び操作法のいずれについても、付属の図面と共に読まれる場合に、以下の「発明を実施するための形態」を参照することにより、最も良く理解されうる。本発明の態様及び利点は、本明細書の下記において記載された実施形態から明らかとなり、これらを参照しながら解明される。本明細書を通して、「一実施形態」又は「ある実施形態」に対する言及は、実施形態との関連において記載された、特定の特色、構造又は特徴が、本発明の少なくとも1つの実施形態に含まれることを意味する。したがって、本明細書を通して、多様な箇所における、「一実施形態において」又は「ある実施形態において」という語句の出現は、必ずしも、全てが、同じ実施形態に言及するものではない。
定義
単数形の名詞に言及する場合に、不定冠詞又は定冠詞、例えば、「ある(a)」又は「ある(an)」、「その」が使用される場合、これは、何らかの別の事柄が具体的に言明されない限りにおいて、この名詞の複数形を含む。本記載及び特許請求の範囲において、「~を含むこと」という用語が使用される場合、これは、他の要素又はステップを除外しない。さらに、本記載及び特許請求の範囲において、「第1の」、「第2の」、「第3の」などの用語が、同様の要素を識別するために使用されるが、必ずしも、継起的順序又は時間的順序について記載するために使用されるわけではない。このようにして使用される用語は、適切な状況下において互換的であり、本明細書において記載された、本発明の実施形態は、本明細書において記載又は例示された順序以外の順序における操作が可能であることが理解されるものとする。以下の用語又は定義は、本発明の理解の一助とするためだけに提示される。本明細書において具体的に規定されない限りにおいて、本明細書において使用される全ての用語は、それらが、本発明の技術分野の当業者に対して有する意味と同じ意味を有する。実施者は、当技術分野の定義及び用語について、特に、Sambrookら、「Molecular Cloning:A Laboratory Manual」、4版、Cold Spring Harbor Press、Plainsview、New York(2012);及びAusubelら、「Current Protocols in Molecular Biology」、(増刊114号)、John Wiley & Sons、New York(2016)へと方向付けられる。そうでないことが規定されない限りにおいて、本明細書において使用される、全ての技術用語及び科学用語は、当業者(例えば、分子的生物学、生化学、構造生物学及び/又は数理生物学)により一般に理解される意味と同じ意味を有する。
単数形の名詞に言及する場合に、不定冠詞又は定冠詞、例えば、「ある(a)」又は「ある(an)」、「その」が使用される場合、これは、何らかの別の事柄が具体的に言明されない限りにおいて、この名詞の複数形を含む。本記載及び特許請求の範囲において、「~を含むこと」という用語が使用される場合、これは、他の要素又はステップを除外しない。さらに、本記載及び特許請求の範囲において、「第1の」、「第2の」、「第3の」などの用語が、同様の要素を識別するために使用されるが、必ずしも、継起的順序又は時間的順序について記載するために使用されるわけではない。このようにして使用される用語は、適切な状況下において互換的であり、本明細書において記載された、本発明の実施形態は、本明細書において記載又は例示された順序以外の順序における操作が可能であることが理解されるものとする。以下の用語又は定義は、本発明の理解の一助とするためだけに提示される。本明細書において具体的に規定されない限りにおいて、本明細書において使用される全ての用語は、それらが、本発明の技術分野の当業者に対して有する意味と同じ意味を有する。実施者は、当技術分野の定義及び用語について、特に、Sambrookら、「Molecular Cloning:A Laboratory Manual」、4版、Cold Spring Harbor Press、Plainsview、New York(2012);及びAusubelら、「Current Protocols in Molecular Biology」、(増刊114号)、John Wiley & Sons、New York(2016)へと方向付けられる。そうでないことが規定されない限りにおいて、本明細書において使用される、全ての技術用語及び科学用語は、当業者(例えば、分子的生物学、生化学、構造生物学及び/又は数理生物学)により一般に理解される意味と同じ意味を有する。
本明細書において使用された、「核酸配列」、「DNA配列」又は「核酸分子」という用語は、リボヌクレオチド又はデオキシリボヌクレオチドである、任意の長さのヌクレオチドのポリマー形態を指す。この用語は、分子の一次構造だけを指す。したがって、この用語は、二本鎖及び一本鎖のDNA及びRNAを含む。この用語はまた、自然発生のヌクレオチドのうちの1つ以上の、類似体による、公知の種類の修飾、例えば、メチル化、「キャップ」置換も含む。「核酸構築物」とは、自然において、一体に見出されない、1つ以上の機能的単位を含むように構築された核酸分子を意味する。例は、環状DNA分子、直鎖状DNA分子、二本鎖DNA分子、染色体外DNA分子(プラスミド)、コスミド(ラムダファージに由来するCOS配列を含有するプラスミド)、非天然の核酸配列を含むウイルスゲノムなどを含む。「コード配列」とは、適切な調節配列の制御下に置かれた場合に、mRNAへと転写され、かつ/又はポリペプチドへと翻訳される、ヌクレオチド配列である。コード配列の境界は、5’末端における翻訳開始コドン及び3’末端における翻訳終止コドンにより決定される。コード配列は、mRNA、cDNA、組換えヌクレオチド配列又はゲノムDNAを含みうるがこれらに限定されない一方、ある特定の状況下において、イントロンもまた存在しうる。本明細書において使用された、「遺伝子のプロモーター領域」又は「調節エレメント」とは、コード配列に作動可能に連結され、おそらく、適切な誘導条件下に置かれた場合に、前記コード配列の転写を促進するのに十分である、機能的DNA配列単位を指す。「作動可能に連結された」は、このように記載された構成要素が、それらの意図された形で機能することを可能とする関係にある並置を指す。コード配列である核酸分子へと「作動可能に連結された」プロモーター配列は、コード配列の発現が、プロモーター配列と適合性の条件下において達成されるような形においてライゲーションされる。本明細書において使用された、「遺伝子」は、遺伝子のプロモーター領域並びにコード配列の両方を含む。「遺伝子」は、プロモーター配列に作動可能に連結された、ゲノム配列(可能なイントロンを含む)並びにスプライシングされたメッセンジャーに由来するcDNAの両方に関する。「ターミネーター」又は「転写終結シグナル」という用語は、3’側におけるプロセシング及び一次転写物のポリアデニル化及び転写の終結のシグナルを伝達する、転写単位の末端におけるDNA配列である、制御配列を包摂する。ターミネーターは、天然の遺伝子に由来する場合もあり、他の様々な植物遺伝子に由来する場合もあり、T-DNAに由来する場合もある。付加されるターミネーターは、例えば、ノパリンシンターゼ遺伝子又はオクトピンシンターゼ遺伝子に由来する場合もあり、代替的に、別の遺伝子に由来する場合もある。「キメラ遺伝子」又は「キメラ構築物」又は「キメラ遺伝子構築物」とは、プロモーター配列又は調節核酸配列が、会合された核酸コード配列の、転写又は発現を調節できるように、プロモーター配列又は調節核酸配列が、mRNAをコードする核酸配列に作動的に連結されている、又はこれと会合された、組換え核酸配列分子を意味する。キメラ遺伝子の調節核酸配列は、自然において見出された、会合された核酸配列に、作動的に連結されておらず、コード核酸配列分子に対して異種でありうるが、これは、その配列が、自然において、キメラ構築物内においてもたらされた配置と同じ配置において存在しないことを意味する。より一般的に、本明細書において、「異種」という用語は、その由来が異なる、配列又は分子として規定される。
本明細書においてさらに、「タンパク質」、「ポリペプチド」及び「ペプチド」という用語は、アミノ酸残基のポリマー並びにこれらの変異体及び合成類似体を指すように、互換的に使用される。単量体又はプロトマーは、アミノ末端~カルボキシ末端にわたる、単一のポリペプチド鎖により規定される。本明細書において使用された、「タンパク質サブユニット」とは、多量体タンパク質の複合体又はアセンブリーの部分を形成しうる、単量体又はプロトマーを指す。
「キメラポリペプチド」、「キメラタンパク質」、「カイマー」、「融合ポリペプチド」、「融合タンパク質」という用語は、本明細書において、互換的に使用され、同じタンパク質に由来する場合もあり、由来しない場合もある、少なくとも2つの個別であり、かつ、顕著に異なる、ポリペプチド構成要素を含むタンパク質を指す。用語はまた、それが、人工であることを意味する、非自然発生の分子も指す。キメラポリペプチド(本明細書において規定された)を指す場合における、「~へと融合された」という用語及び「共有結合的に連結された」、「接続された」、「接合された」、「ライゲーションされた」、「コンジュゲートされた」など、他の文法的同等物は、2つ以上のポリペプチド構成要素を連結するための、任意の化学的機構又は組換え機構を指す。2つ以上のポリペプチド構成要素の融合は、配列の直接的な融合の場合もあり、例えば、介在するアミノ酸配列又はリンカー配列若しくは化学的リンカーを伴う、間接的な融合の場合もある。融合アミノ酸残基又は(ポリ)ペプチドの、本明細書において記載された、目的のEnaタンパク質又は別のタンパク質への融合は、共有結合的ペプチド結合でありうるが、また、化学的連結により得られた融合も指す。本明細書において使用され、本明細書において、「~へと接続された」、「~へとコンジュゲートされた」、「~へとライゲーションされた」と互換的に使用された、「~へと融合された」という用語は、特に、例えば、組換えDNA技術による「遺伝子的融合」のほか、安定的な共有結合的連結を結果としてもたらす、「化学的コンジュゲーション及び/又は酵素的コンジュゲーション」を指す。
「分子複合体」又は「複合体」という用語は、タンパク質の場合もあり、化学的実体の場合もある、少なくとも1つの他の分子と会合された分子を指す。「~と会合された」という用語は、化学的実体若しくは化合物又はその部分と、タンパク質上の結合性ポケット又は結合性部位との近接の条件を指す。本明細書において使用された、「タンパク質複合体」又は「タンパク質アセンブリー」又は「多量体」という用語は、巨大分子のうちの少なくとも1つが、タンパク質である、2つ以上の、会合された巨大分子の群を指す。本明細書において使用された、タンパク質複合体又はタンパク質アセンブリーとは、典型的に、生理学的条件下において形成されうる、巨大分子の結合又は会合を指す。タンパク質のサブユニット又はプロトマーなど、タンパク質複合体の個々のメンバーは、非共有結合的相互作用又は共有結合的相互作用により連結される。「~に結合すること」とは、直接的な場合であれ、間接的な場合であれ、任意の相互作用を意味する。直接的相互作用とは、結合パートナーの間の接触を含意する。間接的相互作用とは、相互作用パートナーが、2つを超える分子の複合体内において相互作用する、任意の相互作用を意味する。相互作用は、1つ以上の架橋分子を一助として、完全に間接的な場合もあり、1つ以上の分子の、さらなる相互作用により安定化された、パートナー間の直接的な接触がなおも存在する、部分的に間接的な場合もある。結合又は会合は、非共有結合的(この場合、並置は、例えば、水素結合又はファンデルワールス相互作用又は静電的相互作用により、エネルギー的に優先される)な場合もあり、例えば、ペプチド結合又はジスルフィド結合により、共有結合的な場合もある。
タンパク質複合体は、多量体でありうることが理解されるであろう。タンパク質複合体アセンブリーは、ホモ多量体複合体の形成を結果としてもたらす場合もあり、ヘテロ多量体複合体の形成を結果としてもたらす場合もある。さらに、相互作用は、安定的な場合もあり、一過性の場合もある。「多量体」、「多量体複合体」又は「多量体タンパク質又は多量体アセンブリー」という用語は、複数の同一のポリペプチド単量体又は異種ポリペプチド単量体を含む。ポリペプチドは、複数の単一のポリペプチド単量体の自己アセンブリー(すなわち、「ホモ多量体アセンブリー」)又は複数の異なるポリペプチド単量体の自己アセンブリー(すなわち、「ヘテロ多量体アセンブリー」)から形成された、多量体アセンブリー(すなわち:2量体、3量体、5量体、6量体、7量体、8量体など)へと自己アセンブルすることが可能でありうる。本明細書において使用された、「複数」とは、2つ以上を意味する。多量体アセンブリーは、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10、11、12以上のポリペプチド単量体を含む。多量体アセンブリーは、任意の目的のための使用が可能であり、広範にわたるタンパク質「ナノ材料」を開発するための方途をもたらしうる。有限の、ケージ様タンパク質アセンブリー又はシェル様タンパク質アセンブリーに加えて、多量体アセンブリーは、適切な対称性の標的アーキテクチャーを選び出すことによってもデザインされうる。本発明の単量体若しくはプロトマー及び/又は多量体アセンブリーは、階層的アセンブリーの利点が付随する繊維など、高次アセンブリーのデザインにおいて使用されうる。結果として得られる多量体アセンブリー又は繊維アセンブリーは、優れた剛性及び単分散性を伴う、高次材料であり、多量体自体又は繊維自体として機能的な場合もあり、多量体アセンブリー又は繊維を含有する改変された表面など、高機能材料の形態ベース及び広範な適用を伴う、カスタムデザイン型分子機械として機能的な場合もある。より具体的に述べると、本明細書において使用された多量体とは、アーク様構造、ターン様構造、リング様構造若しくは円板様構造を形成するように、互いと非共有結合的に会合され;かつ/又はナノ繊維の自己アセンブル若しくは誘発性形成へと成長若しくは発達するように、さらに改変された、ホモ多量体タンパク質複合体又はヘテロ多量体タンパク質複合体を指す。前記多量体アセンブリーは、本明細書において規定されたEnaタンパク質又はEnaタンパク質の変異体、突然変異体及び/若しくは操作されたEnaタンパク質のほか、操作された多量体と呼ばれた、前記Enaタンパク質ベースの多量体へと会合し、これにより、前記多量体を、ある特定の適用に要求された、さらなる改変へと拡張しうる、他のタンパク質を含有しうる。
「タンパク質ドメイン」とは、タンパク質内の、顕著に異なる、機能的単位及び/又は構造的単位である。通例、タンパク質ドメインは、タンパク質の全体的な役割に寄与する、特定の機能又は相互作用の一因をなす。ドメインは、類似するドメインが、異なる機能を伴うタンパク質内に見出されうる、様々な生物学的文脈において存在しうる。タンパク質二次構造エレメント(SSE)は、その三次元の三次構造へのタンパク質フォールドの前に、中間体として、自発的に形成されることが典型的である。タンパク質の、2つの最も一般的な二次構造エレメントは、アルファヘリックス及びベータ(β)シートであるが、βターン及びオメガループもまた生じる。ベータシートは、少なくとも2つ又は3つの骨格水素結合により、水平方向に接続されたベータ鎖(また、β鎖とも称される)からなり、一般に、ツイスト、プリーツのあるシートを形成する。β鎖とは、伸長コンフォメーション内の骨格を伴う、典型的に、3~10アミノ酸長の、ポリペプチド鎖の連なりである。βターンは、ポリペプチド鎖の方向の変化を引き起こす、タンパク質の、不規則的二次構造の種類である。ベータターン(βターン、βターン、βベンド、タイトターン、リバースターン)は、β鎖を接続するのに主に用いられる、タンパク質内及びポリペプチド内における、極めて一般的なモチーフである。
「組換えポリペプチド」とは、組換え法を使用して、すなわち、組換えポリヌクレオチド又は合成ポリヌクレオチドの発現を介して作られるポリペプチドであって、インビトロにおいて得られる場合もあり、かつ/又は細胞内の文脈において得られる場合もあるポリペプチドを意味する。キメラポリペプチド又はその生体活性部分が、組換えにより作製される場合、これはまた、好ましくは、培養培地を実質的に含まないことでもある、すなわち、培養培地は、タンパク質調製物の容量の、約20%未満、より好ましくは約10%未満を表し、最も好ましくは約5%未満を表す。「単離された」又は「精製された」とは、通常、その天然状態において、それに随伴する構成要素を実質的に、又は本質的に含まない材料を意味する。
タンパク質の「ホモログ」、「複数のホモログ」は、問題の非修飾タンパク質又は野生型タンパク質と比べて、アミノ酸の置換、欠失及び/又は挿入を有し、かつ、それらが由来する非修飾タンパク質と同様の生物学的活性及び機能的活性を有する、ペプチド、オリゴペプチド、ポリペプチド、タンパク質及び酵素を包摂する。本明細書において使用された、「アミノ酸同一性」という用語は、配列が、比較域にわたり、アミノ酸の一対一対応ベースにおいて同一である程度を指す。したがって、「配列同一性の百分率」は、比較ウィンドウにわたり、最適にアライメントされた、2つの配列を比較し、両方の配列において、同一なアミノ酸残基(例えば、本明細書においてまた、1文字コードにおいても指し示される、Ala、Pro、Ser、Thr、Gly、Val、Leu、Ile、Phe、Tyr、Trp、Lys、Arg、His、Asp、Glu、Asn、Gln、Cys及びMet)が生じる位置の数を決定して、マッチした位置の数をもたらし、マッチした位置の数を、比較ウィンドウにおける位置の総数(すなわち、ウィンドウのサイズ)により除し、結果に、100を乗じて、配列同一性の百分率をもたらすことにより計算される。本明細書において使用された、「置換」又は「突然変異」は、1つ以上のアミノ酸又はヌクレオチドそれぞれの、親タンパク質又はその断片のアミノ酸配列又はヌクレオチド配列と比較して異なる、アミノ酸又はヌクレオチドによる置換えから生じる。タンパク質又はその断片は、タンパク質の活性に対して、実質的な作用を及ぼさない、保存的アミノ酸置換を有しうることが理解される。本明細書において提示された、配列アミノ酸同一性の百分率は、好ましくは、天然の野生型タンパク質若しくは自然の野生型タンパク質の全長又は言及された、特異的なアミノ酸配列に対応する比較ウィンドウに照らした百分率である。
「野生型」という用語は、自然発生の供給源から単離された、又は細胞、細胞系若しくは生物に含まれた、遺伝子又は遺伝子産物を指す。野生型遺伝子又は野生型遺伝子産物は、集団内において、最も高頻度において観察される遺伝子であるので、自然において観察された遺伝子又は遺伝子産物の「正常」形態又は「野生型」形態と、任意に称される。これに対し、「修飾された」、「操作された」、「突然変異体」又は「変異体」という用語は、野生型又は自然発生の遺伝子又は遺伝子産物と比較した場合に、配列、翻訳後修飾及び/又は機能的特性の修飾(すなわち、特徴の変更)を提示する、遺伝子又は遺伝子産物を指す。ノックアウトとは、非機能的遺伝子産物及び/又は機能をもたらすような、修飾遺伝子又は突然変異体遺伝子又は欠失遺伝子を指す。自然発生の突然変異体又は変異体も単離されうることが注目されるが、これらは、野生型遺伝子又は野生型遺伝子産物と比較した場合に、特徴が変更されており、参照遺伝子又は参照タンパク質と比較して、異なる配列を有するという事実により同定される。
詳細な説明
本発明は、いくつかの集合体において、次世代生体材料として適用可能な、新規のタンパク質アセンブリーに関する。本明細書において開示された多量体アセンブリーの作出は、特異的な特性を伴い、多数の適用における潜在的可能性を伴う、剛性であるが、可撓性でもある構造の作製のために、これらのタンパク質アセンブリーを操作し、モジュレートするための、多数の機会をもたらした、バチルス属芽胞付属物(Ena)の、構造的基礎及び遺伝子的基礎の解明に基づく。Enaタンパク質ファミリーの、これらの多量体アセンブリー及び繊維アセンブリーの構成単位としての同定は、タンパク質の自己アセンブル特性を、細菌タンパク質のパネル内に存在する、DUF3992タンパク質ドメインの存在と直接相関させ、多量体アセンブリーを形成することを可能とした。さらに、DUF3992ドメインの存在は、多量体アセンブリーを、長手方向において、剛性繊維へと共有結合的に接続することを可能とする、モチーフZXnC(C)XmC[配列中、Zは、Ile、Phe、Leu又はValであり、nは、1又は2残基であり、mは、10~12残基であり、Cは、Cysであり、Xは、任意のアミノ酸である。]によりもたらされる、少なくとも2つの保存されたシステイン残基を含む、保存されたN末端接続部領域と組み合わせた、DUF3992のHMMプロファイル(表1に提示された)への準拠により決定される。しかし、繊維の可撓性は、N末端の近傍における、12~15アミノ酸のスペーサー領域の特徴により保持され、積み重ね多量体の間のギャップの維持を可能とする(図3を参照されたい)。
本発明は、いくつかの集合体において、次世代生体材料として適用可能な、新規のタンパク質アセンブリーに関する。本明細書において開示された多量体アセンブリーの作出は、特異的な特性を伴い、多数の適用における潜在的可能性を伴う、剛性であるが、可撓性でもある構造の作製のために、これらのタンパク質アセンブリーを操作し、モジュレートするための、多数の機会をもたらした、バチルス属芽胞付属物(Ena)の、構造的基礎及び遺伝子的基礎の解明に基づく。Enaタンパク質ファミリーの、これらの多量体アセンブリー及び繊維アセンブリーの構成単位としての同定は、タンパク質の自己アセンブル特性を、細菌タンパク質のパネル内に存在する、DUF3992タンパク質ドメインの存在と直接相関させ、多量体アセンブリーを形成することを可能とした。さらに、DUF3992ドメインの存在は、多量体アセンブリーを、長手方向において、剛性繊維へと共有結合的に接続することを可能とする、モチーフZXnC(C)XmC[配列中、Zは、Ile、Phe、Leu又はValであり、nは、1又は2残基であり、mは、10~12残基であり、Cは、Cysであり、Xは、任意のアミノ酸である。]によりもたらされる、少なくとも2つの保存されたシステイン残基を含む、保存されたN末端接続部領域と組み合わせた、DUF3992のHMMプロファイル(表1に提示された)への準拠により決定される。しかし、繊維の可撓性は、N末端の近傍における、12~15アミノ酸のスペーサー領域の特徴により保持され、積み重ね多量体の間のギャップの維持を可能とする(図3を参照されたい)。
新規の原核生物自己アセンブルタンパク質ファミリーである、Enaタンパク質
本発明の第1の態様は、許容的な緩衝液条件下において、自己アセンブルタンパク質多量体アセンブリーを得るのに要求された構造エレメントをもたらす、DUF3992ドメインを含む、自己アセンブルタンパク質サブユニットに関する。この文脈において、「自己アセンブリー」は、外的制御又は鋳型を伴わない、それらの相互的な非共有結合的相互作用の結果としての、超分子秩序構造内の、分子の自発的組織化を指す。個々の分子の化学構造及びコンフォメーション構造は、これらが、どのようにアセンブルされるのかについての命令を保有する。同じ分子が、分子自己アセンブルシステムの構成単位を構成する場合もあり、異なる分子がこれを構成する場合もある。一般に、相互作用は、溶液、ランダムコイル又は無秩序凝集物などの低秩序状態下において確立され、結晶又はフォールディングされた巨大分子の場合もあり、巨大分子のさらなるアセンブリーの場合もある、最終的な秩序状態をもたらす。低分子又はタンパク質の、十分な秩序構造への会合は、熱力学的原理により駆動され、したがって、エネルギー最小化に基づき駆動される。分子アセンブリー過程に関与する相互作用は、静電相互作用、疎水性相互作用、水素結合、ファンデルワールス相互作用、芳香族積み重ね相互作用、及び/又は金属配位相互作用である。非共有結合的であり、個別において弱い力であるが、これらの力は、高度に安定的なアセンブリーを発生させ、最終アセンブリーの形状及び機能を統御しうる(Lombardiら、2019)。本明細書においてEnaタンパク質と呼ばれた、本明細書において記載される前記自己アセンブルタンパク質サブユニットは、本明細書において、異なる状況下及び生体材料内において適用されることが想定された、自己アセンブル多量体及びタンパク質繊維を形成することが可能である。多量体アセンブリー又は繊維アセンブリーは、構成単位又はサブユニットと称された、既存の構成要素、より具体的に述べると、本明細書において記載された、単離された自己アセンブルタンパク質である、Enaタンパク質から得られうる。
本発明の第1の態様は、許容的な緩衝液条件下において、自己アセンブルタンパク質多量体アセンブリーを得るのに要求された構造エレメントをもたらす、DUF3992ドメインを含む、自己アセンブルタンパク質サブユニットに関する。この文脈において、「自己アセンブリー」は、外的制御又は鋳型を伴わない、それらの相互的な非共有結合的相互作用の結果としての、超分子秩序構造内の、分子の自発的組織化を指す。個々の分子の化学構造及びコンフォメーション構造は、これらが、どのようにアセンブルされるのかについての命令を保有する。同じ分子が、分子自己アセンブルシステムの構成単位を構成する場合もあり、異なる分子がこれを構成する場合もある。一般に、相互作用は、溶液、ランダムコイル又は無秩序凝集物などの低秩序状態下において確立され、結晶又はフォールディングされた巨大分子の場合もあり、巨大分子のさらなるアセンブリーの場合もある、最終的な秩序状態をもたらす。低分子又はタンパク質の、十分な秩序構造への会合は、熱力学的原理により駆動され、したがって、エネルギー最小化に基づき駆動される。分子アセンブリー過程に関与する相互作用は、静電相互作用、疎水性相互作用、水素結合、ファンデルワールス相互作用、芳香族積み重ね相互作用、及び/又は金属配位相互作用である。非共有結合的であり、個別において弱い力であるが、これらの力は、高度に安定的なアセンブリーを発生させ、最終アセンブリーの形状及び機能を統御しうる(Lombardiら、2019)。本明細書においてEnaタンパク質と呼ばれた、本明細書において記載される前記自己アセンブルタンパク質サブユニットは、本明細書において、異なる状況下及び生体材料内において適用されることが想定された、自己アセンブル多量体及びタンパク質繊維を形成することが可能である。多量体アセンブリー又は繊維アセンブリーは、構成単位又はサブユニットと称された、既存の構成要素、より具体的に述べると、本明細書において記載された、単離された自己アセンブルタンパク質である、Enaタンパク質から得られうる。
さらに、本明細書において記載された他の実施形態は、本明細書において言及された、「改変された」構成単位若しくは「操作された」構成単位又は「改変された」タンパク質サブユニット若しくは「操作された」タンパク質サブユニット又は「改変された」アセンブリー若しくは「操作された」アセンブリーに関し、それらの自己アセンブリーをコードする、全ての必要な情報を含有する、新たな単位又は新たな機能性を伴う単位を創出するように、化学的組成、長さ及び相互作用の配向性を変化させることにより、得られた既存の(天然の)構成要素からデザイン又は導出されると規定される。環境変数を制御することにより、システムは、新たな熱力学的最小に到達し、異なる秩序構造をもたらす。大半の場合において、タンパク質サブユニットの自己アセンブリーは、非共有結合的相互作用により生じるため、それらの自己アセンブリーは、可逆性であり、環境に対して高感度であり、活性は、タンパク質の会合及び解離を制御して微調整されうる。これらのタンパク質の自己アセンブル特性は、DUF3992ドメインの存在によりもたらされる。
「機能未知ドメイン」タンパク質ファミリー又は「DUF」タンパク質ファミリーは、それ自体、暫定的名称として命名され、タンパク質機能が、同定された後に、より具体的な名称へと改名される(又は既存のドメインへと統合される)傾向がある。したがって、DUF3992含有タンパク質は、PFAMデータベース内において、機能的に特徴付けられておらず、細菌内において見出され、典型的に、98~122アミノ酸の間の長さである、タンパク質ファミリーとして公知であるが、本発明は、実のところ、本明細書において記載された、Ena1Bタンパク質フォールドにもまた、さらにマッチする、原核生物DUF3992ドメイン含有タンパク質への自己アセンブリーの機能を初めて規定する。PFAMデータベース(version 33.1)はまた、機能的に重要でありうる、単一の完全に保存された残基であるTが存在することについても言及している(El-Gebaliら、2019、「The Pfam database」;http://pfam.xfam.org/family/PF13157)。この「機能未知ドメイン」3992は、この特定のDUF3992タンパク質ドメインを含むことが公知(Pfam-B_480 release 24.0)であり、また、PFAM13157ファミリーについてのPFAMデータベース(また、本明細書において提示された表1も参照されたい)においても提示されている、64の細菌タンパク質のアライメントに従い得られた、隠れマルコフモデル(HMM)により構造的に特徴付けられている。PFAM13157ファミリーのDUF3992ドメインタンパク質についてのHMMプロファイルはまた、http://pfam.xfam.org/family/PF13157#tabview=tab4においても示されており、Wheelerら(2014):「hidden Markov models are shown by drawing a stack of letters for each position,where the height of the stack corresponds to the conservation at that position,and the height of each letter within a stack depends on the frequency of that letter at that position」における通りに解釈されるものとする。
よって、自発的にアセンブルするタンパク質群であって、かつて、データベース内において、機能が未知である、仮説的タンパク質として指し示された、DUF3992ドメインを含む、このタンパク質群は、今や、細菌Enaタンパク質ファミリーの規定を構成するアノテーションの一部でありうる。したがって、Enaタンパク質ファミリーは、本明細書の表1に提示されたHMMプロファイルと連携する、それらのHMMプロファイルに基づき分類され、長さが、約100~160アミノ酸であり、多量体などの高次構造へと、自発的にアセンブルする能力を伴い、好ましくは、前記多量体が、好ましくは、長手方向の共有結合的ジスルフィド架橋の形成により安定化された繊維構造へと、さらにアセンブルする能力を有する、細菌DUF3992タンパク質として規定される。さらに、Enaタンパク質の構造的規定は、Enaフォールドを伴う、これらの細菌DUF3992自己アセンブルタンパク質に関し、この場合、前記Enaフォールドは、シートが、BIDGトポロジー及びCHEFトポロジーにあり、本明細書において記載され、アミノ酸配列に基づく、(予測)フォールドの、本明細書において提示された、cryoEMによる、Ena1Bの参照構造のフォールドであって、Zスコアが、6.5以上であり、繊維内の先行サブユニットへの、共有結合的接続のための保存されたZ-Xn-C(C)-Xm-Cモチーフ[配列中、X=任意のアミノ酸であり、Z=Leu/Val/Ile/Pheであり、n=1~2残基であり、m=10~12残基であり、C=Cysである。]を含有する、N末端「Ntc」エレメントを伴う、参照構造のフォールドと比較したマッチングから導出可能である、8本のβ鎖によるβサンドウィッチを含む。
より具体的に述べると、本明細書において記載された多量体内のDUF3992ドメイン含有タンパク質サブユニットは、当技術分野において公知であり、例えば、Remaut及びWaksman(2006)において、他のタンパク質内のβシートのエッジに結合するタンパク質のうちの1つに由来するβ鎖間の静電相互作用を介する、タンパク質サブユニットのスタッガリングとして、かつて記載された構造特徴である、βシートの拡張を介して、互いと、非共有結合的に連結される(また、図2D、2E及び3Cも参照されたい)。最後に、細菌DUF3992ドメイン含有自己アセンブルタンパク質は、本明細書において、配列番号1~80及び145~146により提示され、本規定を適用することにより、すなわち、当業者が、タンパク質が、DUF3992ドメインを含むのかどうかを規定し、構造が、Enaフォールドとしてもたらされていること、すなわち、PDB7A02において提示されたEna1B構造と比較したZスコアが、少なくとも6.5である、マッチングフォールドを有することを確認するように、当業者に公知であり、本明細書において例示された、構造マッチングツールを適用して、アミノ酸配列に基づき、簡単に予測されうる、そのフォールドを比較することを可能とする、簡単なHMMR解析(例えば、https://www.ebi.ac.uk/Tools/hmmer/に提示されており、本明細書において、表1として提示された行列に基づく)を介して、新たに発見されたタンパク質が、このタンパク質ファミリーのメンバーであるのかどうかを検証することにより、このEnaタンパク質ファミリー下に収まることが簡単に検証されうる。さらに、DUF3992ドメインを伴うタンパク質が、本明細書において主張される通り、少なくとも7つ、好ましくは、6つ~12のタンパク質サブユニットによる多量体として、自己アセンブルし、出現する傾向を有するのかどうかは、例えば、SDS-PAGE、動的光散乱解析、サイズ除外クロマトグラフィー又は、好ましくは、陰性染色透過電子顕微鏡法であるがこれらに限定されない、当業者により公知の試験により決定されうる。
本明細書において開示された、DUF3992ドメイン含有Ena自己アセンブルタンパク質は、バチルス属芽胞上において観察された通り、N末端において、剛性の線毛アセンブリー又は付属物アセンブリーの形成を優先する、保存されたシステイン残基により特徴付けられる。この観察に基づき、本明細書において、この自己アセンブルタンパク質ファミリーが、インビトロにおいて、繊維を形成する能力が探索された(図13~14を参照されたい)。本明細書において同定された、これらのタンパク質サブユニットの、これらの構造特徴は、前記システイン残基側鎖の存在を介して、自己アセンブルした、いくつかの多量体を、共有結合的に、強力に接続することを可能とする。したがって、細菌Enaタンパク質のファミリーは、DUF3992ドメインと、N末端領域内における、少なくとも1つ以上の保存されたCys残基とを構成する。より具体的に述べると、前記Enaタンパク質ファミリーは、本明細書において、Ena1タンパク質、Ena2タンパク質及びEna3タンパク質を含有することが同定されており、この場合、Ena1及びEna2は、各々、全てが、それらのN末端領域内及びC末端領域内において、本明細書においてさらに詳細に記載される通り、特異的なアミノ酸残基コンセンサスモチーフを含む、3つのメンバー(A、B、C)を含有することが示された。前記Ena遺伝子/タンパク質ファミリーはまた、実施例において、構造的、かつ、系統発生的にも、より詳細に記載され、「Ena1」遺伝子クラスター又は「Ena2」遺伝子クラスターは、バチルス属種に存在し、S型繊維の形成を可能とし、加えて、L型繊維の形成に、単一のEna3A遺伝子が要求されることを明らかにする。本明細書において記載された、バチルス属天然S型タンパク質繊維は、Ena1A、Ena1B及びEna1C/Ena2A、Ena2B及びEna2Cの3つのメンバー全てが、芽胞上において形成されることを要求する。驚くべきことに、Ena1C/Ena2Cは、エクスビボの繊維集合体内に、構造的に存在しなかったので、自己アセンブル特性を有するが、インビボの芽胞形成時において、繊維形成に対して、異なる寄与を有する。目覚ましいことに、Ena1A、Ena1B又はEna1C/Ena2A、Ena2B又はEna2Cである、これら3つのメンバーの組換え発現は、宿主細胞内において、多量体の形成を結果としてもたらした。さらに、立体障害を伴わない、単一のEna1A又はEna1B/Ena2A又はEna2B(例えば、野生型配列)の組換え発現はなお、宿主細胞内における、S型様繊維の形成も可能とした。組換え発現されたEna1Cは、異なる種類の多量体アセンブリーを結果としてもたらし、円板型多量体を示した。さらに、組換え発現されたEna1A又はEna1B/Ena2A又はEna2Bは、本明細書においてさらに規定された通り、立体障害により停止された場合、ヘリックスターン型多量体又はヘリックスアーク型多量体を形成する。最後に、バチルス属ゲノム内に、単一のEnaサブユニットを含むオペロンによりコードされた、Ena3Aタンパク質はまた、DUF3992ドメインも含み、そのN末端において、保存されたCys残基パターンを有する。しかし、C末端領域は、Ena1/Ena2タンパク質より多様である。このEna3Aは、バチルス属芽胞上において観察された通り、L型繊維を構成することが同定されている。L型繊維は、繊維を安定化させるために、ジスルフィド結合を介して、長手方向に積み重ねられた、円板様多量体として出現する。
本明細書において、前記Enaタンパク質は、その特異的なHMMプロファイルにより特徴付けられ、本明細書において提示された実施例において記載された通り、細菌DUF3992ドメイン含有タンパク質から構成された、PFAM13157のタンパク質として規定され、好ましくは、S型繊維及びL型繊維を形成するサブユニットについて、本明細書において規定された、保存されたCys残基プロファイル(図16~19を参照されたい)を有し、より好ましくは、また、本明細書において記載された、保存されたC末端モチーフも有することをさらに裏付け、とりわけ、細菌Ena1タンパク質サブファミリー、細菌Ena2タンパク質サブファミリー及び細菌Ena3タンパク質サブファミリーのメンバーを含む。Enaタンパク質ファミリーは、細菌である、バチルス属種群にその由来を有し、細菌に由来するタンパク質配列に限定される。構造的に、Enaタンパク質は、並置された2つのβシートから構成された、ゼリーロール状三次元構造により特徴付けられ、この場合、前記βシートは、鎖である、BIDG及びCHEFからなるトポロジーをもたらし、典型的に、最初の10~20残基の長さである、「伸長部」又は「接続部」からなる可撓性N末端領域に続く、積み重ね繊維内の多量体間の物理的距離を確保する、約5~16残基の長さのスペーサーをさらに含む(図8及び17~19を参照されたい)。したがって、特定の実施形態において、本発明の多量体は、少なくとも6つ、好ましくは、6つ~12のEnaタンパク質サブユニットを含み、この場合、サブユニット(i)のBIDGによるβシートは、(i-1)のCHEFによるβシートにより拡張され、サブユニット(i)のCHEFによるβシートは、(i+1)のBIDGによるβシートにより拡張される。より詳細には、多量体は、7つ~12、7つ~11、7つ~10、8つ~10若しくは9つのタンパク質サブユニット又は、正確に述べると、7つ、9つ、10、11若しくは12のサブユニットを含みうる。
系統発生的、かつ、機能的な特徴付けを念頭に置くと、本明細書において使用された、この「Enaタンパク質」のファミリーは、本明細書において、バチルス・セレウスNVH 0075-95 383株のEna1A(配列番号1)、Ena1B(配列番号8)及びEna1C(配列番号15)及びバチルス・シトトキシクス(Bacillus cytotoxicus)NVH 391-98株のEna2A(配列番号21)、Ena2B(配列番号29)、Ena2C(配列番号38)及びバチルス・セレウスのEna3A(配列番号49)並びに他の細菌株における、多数のホモログ及び/又はオーソログにより、さらに例示された、各Enaタンパク質ファミリーメンバーの各クラスターについて、代表的タンパク質を開示する、配列番号1~80、配列番号145又は配列番号146に示された、バチルス属タンパク質のリストとして例示されるがこれらに限定されず、この場合、ファミリーメンバーの各オーソログ配列は、それらの全長にわたり規定された通りの、本明細書において使用された配列に対する、少なくとも80%の同一性を有する(また、実施例の「系統発生的解析」及び図16~19も参照されたい)。より具体的に述べると、バチルス・セレウスNVH 0075-95 383株の、Ena1Aタンパク質及びEna1Bタンパク質は、それぞれ、配列番号1及び配列番号8において示され、比較ウィンドウとしての全配列にわたり、少なくとも80%のアミノ酸同一性を有し、DUF3992ドメイン並びにN末端及びC末端の保存されたCys残基を含む、任意のその細菌ホモログは、候補オーソログである(図16~17)。バチルス・セレウスNVH 0075-95 383株のEna1Cタンパク質は、配列番号15において示され、比較ウィンドウとしての全配列にわたり、少なくとも60、70又は80%のアミノ酸同一性を有し、DUF3992ドメイン並びにN末端及びC末端の保存されたCys残基を含む、任意のその細菌ホモログは、候補オーソログである(図18)。同様に、バチルス・シトトキシクスNVH 391-98株のEna2Aタンパク質及びEna2Bタンパク質は、配列番号21及び配列番号29に、それぞれ示され、比較ウィンドウとしての全配列にわたり、少なくとも80%のアミノ酸同一性を有し、DUF3992ドメイン並びにN末端及びC末端の保存されたCys残基を含む、任意のその細菌ホモログは、候補オーソログである(図16~17)。バチルス・シトトキシクスNVH 391-98株のEna2Cタンパク質は、配列番号38において示され、比較ウィンドウとしての全配列にわたり、少なくとも60、70又は80%のアミノ酸同一性を有し、DUF3992ドメイン並びにN末端及びC末端の保存されたCys残基を含む、任意のその細菌ホモログは、候補オーソログである(図18)。バチルス・セレウスのEna3Aタンパク質は、配列番号49(複数種の参照番号)において示され、比較ウィンドウとしての全配列にわたり、少なくとも60、70又は80%のアミノ酸同一性を有し、DUF3992ドメイン並びにN末端及びC末端の保存されたCys残基を含む、任意のその細菌ホモログは、候補オーソログである(図19)。
多量体アセンブリー
本発明の第2の態様は、タンパク質多量体アセンブリー又は多量体に関する。これは、「機能未知ドメイン3992」(DUF3992)ドメインタンパク質及び典型的な、N末端の保存された領域を伴う、少なくとも7つ、好ましくは、7つ~12の間若しくはこれを超える自己アセンブルタンパク質サブユニットを含み、前記タンパク質サブユニットは、互いに非共有結合的に接続されている。
本発明の第2の態様は、タンパク質多量体アセンブリー又は多量体に関する。これは、「機能未知ドメイン3992」(DUF3992)ドメインタンパク質及び典型的な、N末端の保存された領域を伴う、少なくとも7つ、好ましくは、7つ~12の間若しくはこれを超える自己アセンブルタンパク質サブユニットを含み、前記タンパク質サブユニットは、互いに非共有結合的に接続されている。
前記自己アセンブルDUF3992ドメイン含有タンパク質サブユニットは、より具体的に述べると、Enaタンパク質配列及び/又は操作されたEnaタンパク質配列を含む、タンパク質サブユニットに関する。
別の実施形態は、7つ~12のタンパク質サブユニットを含み、前記タンパク質サブユニットが、Enaタンパク質及び/又はその操作されたEnaタンパク質形態を含む多量体を開示する。具体的な実施形態において、前記多量体は、配列番号1~80、145~146に示されたEnaタンパク質又はこれらのうちのいずれか1つに対する、少なくとも60%の同一性又はこれらのうちのいずれか1つに対する少なくとも70%若しくは少なくとも80%若しくは少なくとも85%若しくは少なくとも90%若しくは少なくとも95%若しくは少なくとも97%の同一性を有するホモログ、これらの機能的なオーソログ及び/又はこれらの操作されたEnaタンパク質形態から選択されたタンパク質サブユニットを含む。本明細書において記載された、これらの多量体は、DUF3992ドメインを含み、6つ、7つ、8つ、9つ、10、11又は12のタンパク質サブユニット(図14~15)からなることが規定されているタンパク質サブユニットの自己アセンブリーにより形成される。これらのタンパク質多量体は、本明細書において、「それ自体としての」多量体のフォーマットにおいて、多数の適用のために機能すると規定されるが、これは、多量体が、溶液中、細胞内又は別の種類のインビトロ環境内において、独立の単位であると規定される一方、それ自体における、DUF3992ドメイン又はEnaタンパク質サブユニットの、このような多量体は、自然において見出されず、繊維を形成するそれらの傾向のために、インビボ又は天然の条件において、「それ自体として」形成又はアセンブルしないことを意味する。S型繊維は、個別の多量体から構成されず、水平方向の非共有結合的相互作用、とりわけ、後続のタンパク質サブユニット間におけるβシートの拡張により形成された、連続ヘリックス構造として、長手方向の繊維へと連なる、多量体によるEna構造を含む。加えて、N末端領域内及びC末端領域内における、保存されたCys残基の存在のために、これらは、共有結合的ジスルフィド架橋により、さらに剛直化される。独立生成物「それ自体として」の、Ena1/Ena2A多量体又はEna1/Ena2B多量体を形成するため、「立体障害」は、多量体のさらなるアセンブリングを防止することが(図13A及び14Aを参照されたい)要求される。したがって、具体的に規定された前記多量体は、例えば、N末端の、他の多量体との、共有結合的接続に対して、立体障害をもたらすことにより、それらの繊維成長が停止される。本明細書において互換的に使用された、「立体障害型(sterically frustrated)」N末端領域又は「立体障害型(sterically hindered)」N末端領域又は「立体障害型(sterically blocked)」N末端領域は、本明細書において、自然発生のEnaタンパク質N末端に対する構造的差違として規定され、この場合、構造的差違は、N末端の、他のタンパク質又は多量体との、共有結合的連結に対して、立体障害を結果としてもたらす。例えば、少なくとも1~5、6、7、8、9、10、11、12、13、14、15アミノ酸残基以上の、異種N末端タグを、1つ以上の野生型Enaタンパク質サブユニットへと付加することにより、例えば、異なる多量体の共有結合的連結を防止することにより、多量体の、長手方向への成長を停止させる、「操作された又は修飾」異種タグ付けEnaタンパク質が形成される。前記多量体のタンパク質サブユニットのN末端に立体障害をもたらす代替法は、例えば、長手方向の相互作用、とりわけ、S型繊維形成に要求された、C末端の伸長部又はタグである。又は代替法は、N末端接続部又はC末端接続部の、任意のジスルフィド連結に立体障害をもたらす、化学的リンカーの付加の場合もあり、N末端のEnaタンパク質配列を突然変異させて、システインを除去することによる場合もあり、他の多量体とのジスルフィド架橋の形成に立体障害をもたらす、Enaタンパク質変異体の創出の場合もある。したがって、特定の実施形態は、本明細書において記載された多量体に関し、この場合、少なくとも1つのタンパク質サブユニットは、立体障害を形成するように、少なくとも1~5、6、7、8、9、10、11、12、13、14、15アミノ酸以上の、異種N末端タグ及び/若しくは異種C末端タグ又は異種N末端伸長部及び/若しくは異種C末端伸長部又は異種N末端接続部及び/若しくは異種C末端接続部をさらに含む。したがって、「それ自体としての」、Ena1/Ena2A及び/又はEna1/Ena2Bアセンブリーの、10量体、11量体又は12量体を得るために、これらの多量体の、繊維への、さらなるアセンブリーを防止する、N末端における立体障害の存在が所望される(図14~15を参照されたい)。したがって、独立のタンパク質単位としての、これらの多量体は、本明細書においてまた、さらにより詳細にも記載された、前記多量体の、少なくとも1つのタンパク質サブユニットの操作時に形成されうる。したがって、特定の実施形態は、立体障害を施された、N末端領域及び/若しくはC末端領域又はN末端接続部及び/若しくはC末端接続部を伴う、単一ターン多量体又は単一ヘリックスアーク多量体として示された、停止多量体である、本明細書において記載された多量体に関する。
代替的に、Ena1C/Ena2Cタンパク質は、組換え発現された場合に、リング様多量体又は円板様多量体を形成することが示されている。インビトロにおいて、立体障害を施されたN末端領域及び/又はC末端領域を伴う、又はこれを伴わない、閉環状多量体又は円板様構造が形成される。なおさらに、特定の場合において、第1のN末端接続部領域を欠く、組換え発現された、切断型Ena1C/Ena2Cタンパク質であってもなお、自己アセンブリーが可能であり、多量体へとアセンブルすることが可能である。一実施形態において、多量体を構成する、これらのEna1Cは、それぞれ、7つ又は9つのサブユニットを伴う、7量体又は9量体からなりうる(また、図14B及び15Bも参照されたい)。
組換えにより作製されたEna1C多量体又は9量体リング構造は、Ena1C多量体アセンブリーを、生体機能的ツール及び構造的ツールとして適合させる、突然変異又は挿入により、異種N末端タグ又は異種C末端タグを付加することにより、さらに操作されうる。
具体的な実施形態において、DUF3992ドメイン含有タンパク質又は、とりわけ、Enaタンパク質、そのホモログ若しくはその操作された形態を含む、6つ~12のタンパク質サブユニットを含む、本明細書において記載された、前記多量体は、単離された多量体である。前記単離された多量体は、「それ自体としての」多量体を作製する、本明細書において記載されたキメラ遺伝子の組換え発現、任意選択的に、これに続く、産生宿主からの、前記多量体の精製により得られる。したがって、一実施形態は、少なくとも6つ、若しくは、好ましくは、7つ~12のサブユニットからなる前記単離された多量体又は操作された多量体又はその天然の対応物若しくは野生型タンパク質形態であるタンパク質サブユニットと比較して、少なくとも1つの操作されたタンパク質サブユニットを含む多量体に関する。具体的な実施形態において、本明細書において記載された多量体の、タンパク質サブユニットは、ホモマー多量体の場合もあり、ヘテロマー多量体の場合もあり、後者は、同一なDUF3992サブユニットを含む場合もあり、野生型Enaタンパク質サブユニット及び、例えば、タグ付けEnaタンパク質又は突然変異体Enaタンパク質サブユニットなど、操作されたEnaタンパク質サブユニットからなる場合もある。ヘテロマー多量体は、1種類のEnaタンパク質からなる場合もあり、いくつかの種類のEnaタンパク質メンバーからなる場合もある。
全体として、少なくとも7つのDUF3992ドメイン含有タンパク質サブユニットを含むように、本明細書において規定された多量体である。これは、本明細書において規定された少なくとも1つの、Enaタンパク質であることが可能であり、タンパク質サブユニットが、βシートの拡張を介して非共有結合的に連結された、少なくとも1つの、操作されたEnaタンパク質サブユニットを含みうる。N末端領域及び/若しくはC末端領域により誘発され、多量体間ジスルフィド架橋を形成する、さらなるオリゴマー化及び共有結合的相互作用を防止し、かつ/又は前記多量体アセンブリーのための、さらなる機能性若しくは特性を獲得することを目的として、本明細書に、非自然発生のEnaタンパク質サブユニットとして規定された。
本明細書において規定された、「操作されたDUF3992含有タンパク質サブユニット」又は本明細書において規定された、「操作されたEnaタンパク質」は、それぞれ、DUF3992含有タンパク質又はEnaタンパク質の非自然発生形態に関する。これは、それでも自己アセンブルすることが可能であり、多量体構造又は繊維構造を形成することが可能である。本明細書において互換的に使用された、操作された若しくは修飾若しくはモジュレートされたタンパク質サブユニット又はタンパク質サブユニット変異体は、それらの一次構造特徴レベルにおける差違、すなわち、野生型(Ena)タンパク質と比較した、それらのアミノ酸配列における差違のほか、他の修飾による差違、すなわち、化学的リンカー又は化学的タグによる差違を示しうる。したがって、操作されたタンパク質サブユニットは、他の修飾の中において、例えば、1つ以上のアミノ酸の置換、挿入若しくは欠失を含む、突然変異体タンパク質又はタグ付けされたタンパク質の場合もあり、標識されたタンパク質の場合もある、融合タンパク質又はその配列内若しくはそのトポロジー内に挿入を伴うタンパク質又は部分Enaタンパク質若しくはスプリットEnaタンパク質のアセンブリーにより形成されたタンパク質に関しうる。したがって、一実施形態において、天然Enaタンパク質と比較した、修飾Enaタンパク質であり、非自然発生タンパク質である、操作されたEnaタンパク質が開示される。本明細書において提示された非限定例は、より具体的に述べると、繊維アセンブリーの形成を伴わない多量体形成のために、立体障害を施されたEnaタンパク質サブユニットを獲得するように、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15アミノ酸残基長以上の異種タグを伴う、N末端又はC末端においてタグ付けされたEnaタンパク質;Ena突然変異体タンパク質又は変異体タンパク質;β鎖の間における、その露出ループのうちの1つの中に、異種ペプチド若しくは異種タンパク質が挿入された、Enaタンパク質融合体若しくはEnaタンパク質又は宿主内において個別に発現された、Enaスプリットタンパク質部分のアセンブリー時に形成されたEnaタンパク質に関する。
タグは、野生型タンパク質配列内において自然発生でない場合、「異種融合体」を結果としてもたらす、「異種タグ」又は「異種標識」であり、タンパク質の精製を容易にするための適用又は繊維形成の成長が立体障害を施された多量体をアセンブルするための適用を目的として付加される。本明細書において使用された、「検出用標識」、「標識化」又は「タグ」という用語は、本明細書において記載された、単離された(ポリ)ペプチド又は精製(ポリ)ペプチドの、検出、視覚化及び/又は単離された、精製及び/又は固定化を可能とする、検出用標識又は検出用タグを指し、これらの目的のために、当技術分野において公知である、任意の標識/タグを含むことが意図される。キチン結合性タンパク質(CBP)、マルトース結合性タンパク質(MBP)、グルタチオン-S-トランスフェラーゼ(GST)、ポリ(His)(例えば、6×His又はHis6)、Strep-tag(登録商標)、Strep-tag II(登録商標)及びTwin-Strep-tag(登録商標)などのアフィニティータグ;チオレドキシン(TRX)、ポリ(NANP)及びSUMOなどの可溶化タグ;FLAGタグなどのクロマトグラフィータグ;V5タグ、EPEAタグ、myc-タグ及びHAタグなどのエピトープタグ;蛍光タンパク質(例えば、GFP、YFP、RFPなど)及び蛍光染料(例えば、FITC、TRITC、クマリン及びシアニン)などの、蛍光標識又は蛍光タグ(すなわち、蛍光色素/フルオロフォア);ルシフェラーゼなどの発光標識又は発光タグ;及び(他の)酵素標識(例えば、ペルオキシダーゼ、アルカリホスファターゼ、ベータ-ガラクトシダーゼ、ウレアーゼ又はグルコースオキシダーゼ)が、特に、好ましい。また、前出の標識又はタグのうちのいずれかの組合せも含まれる。
好ましくは、タグの付加により操作されうる、前記機能的操作されたタンパク質サブユニット又は操作されたEnaタンパク質サブユニット若しくは操作されたEnaタンパク質単量体は、さらに、操作されたEnaタンパク質サブユニットのホモ多量体アセンブリー又は操作されたEnaタンパク質サブユニットと、非操作(例えば、野生型)Enaタンパク質サブユニットとを組み合わせる、ヘテロ多量体アセンブリーとして、それ自体における、停止多量体又は停止繊維を形成することが可能でありうる。
特定の実施形態において、タンパク質サブユニットは、少なくとも1つのEna突然変異体タンパク質サブユニット又はEna変異体タンパク質サブユニットを含む、操作されたEnaタンパク質でありうる。例えば、限定せずに述べると、このようなEna突然変異体又はEna変異体は、多量体又はタンパク質サブユニットの表面側鎖の修飾又は突然変異が、どの位置において実行可能であるのかを裏付ける構造情報に由来しうる(また、図15も参照されたい)。Ena1Bサブユニット突然変異体について提起された置換と同様に可能な置換は、配列番号8内の残基である、A31、T32、A33、T57、T61、V63、V69、T70、T72、A73、T76、V78、T96、L98、T100及びA101について示された、Ena1Bについての図15において示される。関連のある置換え残基の例は、システイン又はリシン又はアジド側鎖を伴う非天然アミノ酸など、クリック化学反応に適する非天然アミノ酸を含む。
さらに、Ena1B(配列番号8)内の挿入部位の例は、以下のβ鎖:残基A30~A33を伴う鎖であるB~C;残基T55~P59を伴う鎖であるD~E;残基S66~T72を伴う鎖であるE~F;及び残基G99~A103のループを伴う鎖であるH~Iを接続するループに配置された位置により、図15に示される。このようなループ内の、異種タンパク質若しくは異種ペプチド又はリンカーの挿入は、400残基長以下のアミノ酸配列からなりうるが、なおも、多量体の形成に要求された、フォールディング及び構造特徴を保持する。とりわけ、このような挿入変異体又は機能的突然変異体である、操作されたEnaタンパク質を、どのようにして創出するのかは、例えば、例えばそれ自体としてのEna1B一次アミノ酸配列を改変すること:Ena1Bタンパク質を、残基S66において切断することにより、β鎖であるEと、β鎖であるFとの間に、単一残基のペプチド又は(ポリ)ペプチドをまず挿入し、そのN末端残基のインサートを、Ena1BのC末端であるS66へと付加し、そのC末端のインサートを、Ena1BのN末端であるG67へと付加することによる、配列の並べ替えによる創出として想定されうる。挿入はまた、多数のアミノ酸を、前記Enaタンパク質のループから除去することによっても創出されうる、例えば、Ena1B配列残基S66~T72は、インサートにより置換えられうる。当業者は、Enaタンパク質の、開示された構造特徴に基づき、本明細書において提示された、異なるEnaタンパク質ループ領域内に、どのようにして、同様のインサートを創出するのかについて承知しており、また、これにより、Enaホモログ又はその操作されたEnaタンパク質形態のための、同様のインサートも創出しうる。
Enaタンパク質について、本明細書において規定された、N末端領域及びC末端領域とは、野生型Enaタンパク質配列を指す。前記野生型(又は置換/突然変異体)Enaタンパク質について、「N末端領域」は、可撓性N末端接続部に続く、スペーサー及び前記Enaタンパク質サブユニットのゼリーロール状フォールディングを構成する、典型的なBIDG-CHEFによるβシートの、最初のβ鎖であるBを含む、Enaタンパク質配列の最初の部分として規定される。本明細書において規定されたEnaタンパク質の「C末端領域」とは、BIDG-CHEFによるβシートの、最後のβ鎖であるI及びこれに後続する、可能な残りのC末端残基を含む、タンパク質配列の末端である。
検討しうる1つの適用は、Enaタンパク質サブユニットを、例えば、抗体など、別の機能的部分又はタンパク質が、前記Enaタンパク質又はEna多量体へと融合され、任意選択的に、表面又は支持体へとカップリングされた、機能化多量体をもたらす、操作されたEnaタンパク質フォーマットにおいて修飾することである。
構造的に興味深い融合体を作るために、当業者は、Enaタンパク質を、巡回置換タンパク質として操作することについて検討しうる。「タンパク質の巡回置換」又は「巡回置換タンパク質」という用語は、そのアミノ酸配列内のアミノ酸の順序を、野生型タンパク質配列と比較して変化させ、その結果として、接続性は異なるが、全体的三次元(3D)形状は類似するタンパク質構造を伴うタンパク質を指す。タンパク質の巡回置換は、例えば、Bliven及びPrlic(2012)において記載された通り、野生型タンパク質の第1の部分の配列(N末端と隣接する)が、結果として得られる、巡回置換タンパク質の第2の部分の配列(そのC末端の近傍において)と類縁であるという意味において、巡回置換についての数学的概念と類似する。タンパク質の、その野生のタンパク質と比較した巡回置換は、前記タンパク質の新規のN末端及びC末端を創出するように、野生型タンパク質のN末端及びC末端(Enaタンパク質について、本明細書の上記において規定された)が「接続され」、タンパク質配列が、別の部位において、中断又は切断された、タンパク質配列の遺伝子操作又は人工操作を介して得られる。したがって、本発明の巡回置換Enaタンパク質は、野生型Enaタンパク質配列のN末端と、C末端との接続及びアクセス可能部位又は露出部位(優先的に、βターン又はループ)における、フォールディングが、野生型Enaタンパク質のフォールディングと比較して保持された前記Enaタンパク質サブユニット、又はこれと類似する前記Enaタンパク質サブユニットの切断又は配列の中断の結果である。前記巡回置換スキャフォールドタンパク質内の、N末端と、C末端との前記接続は、野生型タンパク質の、元のN末端及びC末端の近傍における、ペプチド結合による連結又はペプチドリンカーの導入若しくはペプチドの連なりの欠失に続く、ペプチド結合又は残りのアミノ酸の導入の結果でありうる。結果として得られるEnaタンパク質のN末端及びC末端の、この再配置は、二次N末端及び二次C末端と称される。
最後に、本明細書において記載された多量体は、次世代生体材料の分野において、多数の適用をもたらす。一実施形態において、前記多量体は、固体表面へとカップリングされ、それ自体として、極度の弾力性挙動を有する特性を伴う改変された表面をもたらすので、極めて安定かつ剛性の材料である。
繊維状アセンブリー
本発明の別の態様は、少なくとも2つの多量体を含む、組換えにより作製された繊維に関し、この場合、前記多量体は、少なくとも7つのタンパク質サブユニット又は7つ~12のサブユニットに関する。自己アセンブルDUF3992ドメイン含有タンパク質、Enaタンパク質からなり、特に、前記タンパク質サブユニットが、βシートの拡張を介して非共有結合的に連結され、前記多量体が長手方向に積み重ねられ、少なくとも1つのジスルフィド架橋を介して共有結合的に接続される。したがって、タンパク質繊維は、非天然の宿主内において、インセルロにおける組換えにより作製される場合もあり、かつ/又はインビトロにおける組換えにより作製される場合もあり、ヘテロマー多量体を含む場合もあり、ホモマー多量体を含む場合もある。ヘテロマータンパク質繊維が想定される場合、多量体は、1つ以上の自己アセンブルDUF3992ドメイン含有Enaタンパク質を含む場合もあるが、代替的に、タンパク質サブユニットは、1つ以上のサブユニットが、それらの操作されたタンパク質形態であることを除き、同一である。ホモ多量体タンパク質繊維は、特異的Enaタンパク質又はEnaタンパク質の突然変異体、変異体又は操作されたEnaタンパク質を、宿主細胞内において組換え発現させることにより作出されうる。インビボのバチルス属繊維上において観察されたラッフル膜(実施例を参照されたい)は、組換えにより作製された繊維内において、決して見られなかったので、1つ以上のEnaタンパク質サブユニットを含む、任意の組換え作製タンパク質繊維は、非自然発生の繊維となる。
本発明の別の態様は、少なくとも2つの多量体を含む、組換えにより作製された繊維に関し、この場合、前記多量体は、少なくとも7つのタンパク質サブユニット又は7つ~12のサブユニットに関する。自己アセンブルDUF3992ドメイン含有タンパク質、Enaタンパク質からなり、特に、前記タンパク質サブユニットが、βシートの拡張を介して非共有結合的に連結され、前記多量体が長手方向に積み重ねられ、少なくとも1つのジスルフィド架橋を介して共有結合的に接続される。したがって、タンパク質繊維は、非天然の宿主内において、インセルロにおける組換えにより作製される場合もあり、かつ/又はインビトロにおける組換えにより作製される場合もあり、ヘテロマー多量体を含む場合もあり、ホモマー多量体を含む場合もある。ヘテロマータンパク質繊維が想定される場合、多量体は、1つ以上の自己アセンブルDUF3992ドメイン含有Enaタンパク質を含む場合もあるが、代替的に、タンパク質サブユニットは、1つ以上のサブユニットが、それらの操作されたタンパク質形態であることを除き、同一である。ホモ多量体タンパク質繊維は、特異的Enaタンパク質又はEnaタンパク質の突然変異体、変異体又は操作されたEnaタンパク質を、宿主細胞内において組換え発現させることにより作出されうる。インビボのバチルス属繊維上において観察されたラッフル膜(実施例を参照されたい)は、組換えにより作製された繊維内において、決して見られなかったので、1つ以上のEnaタンパク質サブユニットを含む、任意の組換え作製タンパク質繊維は、非自然発生の繊維となる。
具体的な実施形態において、本明細書において記載された、タンパク質サブユニット又は多量体は、モチーフ内に存在するCysを、長手方向において接続して、共有結合的ジスルフィド結合を形成することにより、前記多量体のS型繊維の形成を可能とするように、ZXnCCXmC[配列中、Zは、Leu、Ile、Val又はPheであり、Xは、任意のアミノ酸であり、nは、1又は2残基であり、mは、10~12である。]として示された、保存されたアミノ酸残基の配列モチーフを伴う、本明細書において、互換的に使用された、「N末端領域」又は「N末端接続部」又は「N末端接続部領域」を含み、本明細書において、互換的に使用された、GX2/3CX4Y[配列中、Xは、任意のアミノ酸である。]として示された、保存されたアミノ酸のモチーフを伴う、「C末端領域」又は「C末端受容部領域」を含む。具体的な実施形態において、これらの多量体により形成された、前記タンパク質繊維は、ヘリックス構造を有する(例えば、図13a~14a)。こうして、タンパク質繊維は、多量体が、立体障害されない場合に限り形成されうる。
別の実施形態において、前記タンパク質繊維の剛性及び/又は弾性をモジュレートするための「操作された多量体」であって、1つ以上のタンパク質サブユニットのN末端領域が、N末端の保存されたモチーフZXnCCXmC[配列中、Zは、Leu、Ile、Val又はPheであり、Xは、任意のアミノ酸であり、nは、1又は2残基であるが、mが、10~12残基ではなく、7、8又は9アミノ酸残基である結果として、より短い(例えば、配列番号1のEna1A又は配列番号8のEna1Bと比較して)N末端領域をもたらす、又はmが、13~16残基の間である結果として、より長い(例えば、配列番号1のEna1A又は配列番号8のEna1Bと比較して)N末端領域をもたらす]を含む、「操作された多量体」が作製される。前記操作された多量体は、S型繊維又はヘリックス状繊維のアセンブリーにおいて、前記システインを介して、C末端受容部モチーフGX2/3CX4Yとの共有結合的S-S間架橋を形成することを、やはり可能としうるが、mが、10~12残基である多量体と比較して、安定性又は剛性が低下する場合がある。S型繊維又はヘリックス状繊維の形成は、ジスルフィド架橋の形成を伴わずに可能でありうるが、これは、はるかに不安定であり、弾力性が低下した繊維構造を結果としてもたらす。実際、本明細書において支援された通り、N末端システインによる共有結合的連結を含む繊維構造は、例えば、芽胞付属物が、過酷な条件下において存続することを可能とする安定性をもたらす。繊維の管腔内に存在するジスルフィド結合は、この強度を可能とするので、繊維内において好ましい。
さらに、円板型多量体を含む、L型タンパク質繊維はまた、長手方向において、N末端の保存されたCys残基と、先行層の接続部の多量体との共有結合的連結を介しても架橋される。前記繊維は、配列番号49~80において示されたEna3又はこれらのうちのいずれか1つに対する少なくとも80%を伴うホモログの組換え発現により形成されうる。本明細書において、L型の繊維形成において機能的である、前記Ena3タンパク質は、Ena1/Ena2A及びEna1/Ena2BのS型繊維を形成するサブユニットへと微細に適合された、保存されたモチーフ、すなわち、第2のCysが、一部のEna3タンパク質内の、別のアミノ酸により置換えられる場合があるので、ZXnC(C)XmC[配列中、Zは、Leu、Ile、Val又はPheであり、Xは、任意のアミノ酸であり、nは、1又は2残基であり、mは、10~12である。]により規定されたモチーフを伴う、N末端接続部を含有し、前記モチーフ内に存在するCysを、長手方向において接続して、共有結合的ジスルフィド結合を形成することにより、前記多量体のL型繊維の形成を可能とするように、S-Z-N-Y-X-B[配列中、Zは、Leu又はIleであり、Bは、Phe又はTyrであり、Xは、任意のアミノ酸である。]として示された、保存されたアミノ酸のモチーフを伴う、本明細書において、互換的に使用された、「C末端領域」又は「C末端受容部領域」を含むように、さらに規定される。具体的な実施形態において、これらの多量体により形成された、前記タンパク質繊維は、円板様構造を有する(例えば、図13b~14b)。こうして、タンパク質繊維は、多量体が、立体障害されない場合に限り形成されうる。
例えば、少なくとも1~5、6、7、8、9、10、11、12、13、14、15アミノ酸以上の、異種N末端タグの付加により、立体障害は、ジスルフィド架橋の形成を防止する、又はこれに負の影響を及ぼし、これにより、繊維形成を防止する、又は繊維の部分形成若しくは強度及び弾力性若しくは剛性の低下した繊維を結果としてもたらす(実施例を参照されたい)。
具体的な実施形態において、前記少なくとも2つの多量体を含む、作製されたタンパク質繊維は、1つの多量体の、少なくとも1つのタンパク質サブユニットのN末端接続部領域のCys残基の側鎖と、先行層の多量体の受容部領域の、タンパク質サブユニットのCys残基の側鎖との間の、少なくとも1つのジスルフィド結合を介して、この長手方向において、共有結合的に連結される。好ましい実施形態の、繊維の異なる多量体の間において、少なくとも2つのジスルフィド結合が形成され、最も好ましくは、各ジスルフィド結合は、繊維の先行多量体のタンパク質サブユニット内に存在する、Cysの硫黄原子に結合するように、1つ以上のタンパク質サブユニットのN末端領域内のシステインに由来する硫黄原子を含有する。具体的な実施形態において、前記N末端領域は、それらのいずれもが、繊維の別の多量体とのジスルフィド架橋に参与するように、前記保存されたアミノ酸モチーフ内に、2つの連続Cysを有する。他の実施形態は、少なくとも2つの多量体を含むナノ繊維としての、前記タンパク質繊維に関し、この場合、前記多量体は、積み重ねし、タンパク質サブユニット(i)のN末端の保存されたモチーフの、第1のCys残基及び第2のCys残基と、サブユニット(i-9)のβ鎖であるIのCys残基及びサブユニット(i-10)のβ鎖であるBのCys残基のそれぞれとにより形成された、ジスルフィド架橋を介して共有結合的に連結される。
したがって、本明細書において記載されたタンパク質繊維は、各々が、本明細書において記載された、自己アセンブルDUF3992ドメイン含有タンパク質を含む、より詳細には、Enaタンパク質又は操作されたEnaタンパク質を含む、少なくとも7つのタンパク質サブユニットを含む、2つ以上の多量体から構成され、この場合、前記タンパク質サブユニットは、非共有結合的に連結され、前記多量体は、積み重ね多量体の間において、共有結合的ジスルフィド結合を形成することだけにより、長手方向に積み重ねられる。前記タンパク質繊維内において、前記多量体は、組成が同一な場合もあり、異なる場合もある。前記多量体は、本明細書において規定された通り、繊維の剛性をモジュレートするための、操作された多量体でありうる。さらに、前記少なくとも2つの前記タンパク質繊維の多量体は、同一なタンパク質サブユニットを含む多量体の場合もあり、異なるタンパク質サブユニットを含む多量体の場合もある。ジスルフィド架橋を介して共有結合的にだけ接続された識別可能な多量体円板を含むL型繊維と対称的に、S型繊維内に存在する多量体は、共有結合的にだけ接続された、単一のユニットとして識別可能ではなく、βプロペラによるヘリックス構造内のタンパク質サブユニットによる、βシートの連続的な拡張であり、加えて、ジスルフィド架橋により架橋された、あらゆるヘリックスターンである。したがって、本明細書において使用された、「タンパク質繊維を含む多量体」とは、S-S間架橋だけを介して接続された、識別可能な個別の円板様多量体(例えば、Ena3Aベースのタンパク質サブユニットだけを含む)からなっているタンパク質繊維を指す場合もあり、非共有結合により、繊維状ヘリックス構造へと、連続的に接続され、S-S間架橋を介して、さらに架橋された、ヘリックスターン様多量体(例えば、Ena1/Ena2Aタンパク質ベースであり、かつ/又はEna1/Ena2Bタンパク質ベースである)から集成されたタンパク質繊維を指す場合もある。
さらに、代替的実施形態は、本明細書において記載された、2つ以上の多量体を含む繊維として規定された、操作されたタンパク質繊維を含み、この場合、少なくとも1つの多量体は、本明細書において規定された、操作された多量体であり、かつ/又は少なくとも1つのタンパク質サブユニットは、本明細書において規定された、操作されたタンパク質サブユニットである。
別の実施形態は、組換えにより作製されたタンパク質繊維又はインビトロにおいて作製及び精製されたタンパク質繊維に関し、この場合、前記繊維は、本明細書においてさらに記載されたキメラ遺伝子の、組換え発現又はインビトロ発現により得られうる。前記インビトロにおいて作製された繊維は、本明細書において開示されたS型繊維であることが可能であり、Ena1Aタンパク質及び/若しくはEna1Bタンパク質並びに/又はこれらの操作された形態を含む多量体により形成されうる。前記インビトロにおいて作製された繊維は、インビボにおいて、Ena1A、Ena1B及びEna1Cが、S型繊維を形成する(実施例を参照されたい)ことが、不可欠に要求されることが明らかである、バチルス属芽胞上など、自然発生ではない。具体的な実施形態は、前記タンパク質繊維の多量体が、本明細書において記載された、少なくとも1つの操作された多量体又は本明細書において記載された、操作されたタンパク質サブユニット、特に、少なくとも1つの、本明細書において記載された、操作されたEnaタンパク質を含む、少なくとも1つの多量体を含む点において、操作されたタンパク質繊維である、インビトロにおいて作製されたタンパク質繊維に関する。さらなる実施形態は、操作されたタンパク質繊維をもたらすが、この場合、本明細書において記載されたタンパク質繊維は、別のタンパク質へと融合される、又は化学的部分又は機能的部分など、別の部分へとコンジュゲートされる。
本発明の別の態様は、プロモーター又は調節エレメントにより制御されて発現すると、本明細書において規定された、自己アセンブルタンパク質を含有する、タンパク質のサブユニット又はプロトマーをコードする核酸分子を結果としてもたらす、核酸配列に作動可能に連結された、少なくとも1つの前記異種プロモーター又は調節エレメントを含み、前記異種プロモーター配列又は異種調節エレメント配列が、細菌由来の自己アセンブルタンパク質をコードする核酸配列としての(又はこの天然形態と異なる)、別の供給源に由来する、DNAエレメントを含む、キメラ遺伝子又はキメラ構築物をもたらす。さらなる実施形態において、前記キメラ遺伝子は、Ena突然変異体タンパク質の場合もあり、変異体タンパク質の場合もある、本明細書において記載されたEnaタンパク質又はその操作されたEnaタンパク質、伸長Enaタンパク質(繊維形成を防止するように、立体障害を施された)又は融合タンパク質をコードする核酸分子に作動可能に連結された、異種プロモーターエレメント又は調節的発現エレメントを含む。さらに、前記キメラ構築物は、発現カセット内に存在する場合もあり、インビトロにおいてタンパク質を作製するための、クローニングベクター又は発現ベクターの一部として存在する場合もある。
「発現カセット」は、目的の遺伝子配列/コード配列の発現を方向付けることが可能な、任意の核酸構築物を含む。これは、発現カセットのプロモーターに作動可能に連結されている。発現カセットは、一般に、好ましくは(転写方向にある、5’から3’へと)、プロモーター領域、転写開始領域と作動可能に連結された、ポリヌクレオチド配列、そのホモログ、変異体又は断片及びRNAポリメラーゼのための停止シグナル及びポリアデニル化シグナルを含む終結配列を含む、DNA構築物である。これらの領域の全ては、形質転換される、原核細胞又は真核細胞などの生体細胞内における作動が可能であることが理解される。好ましくは、RNAポリメラーゼ結合性部位及びポリアデニル化シグナルを含む、転写開始領域を含むプロモーター領域は、形質転換される生体細胞に対し、天然の場合もあり、代替的供給源に由来する場合もあり、この場合、領域は、生体細胞内において、機能的である。このようなカセットは、「ベクター」へと構築されうる。
本明細書において使用された、「ベクター」、「ベクター構築物」、「発現ベクター」又は「遺伝子導入ベクター」という用語は、それが連結された、別の核酸分子を輸送することが可能な核酸分子を指すことが意図され、プラスミドベクター、コスミドベクター、ラムダファージなどのファージベクター、アデノウイルス、AAV若しくはバキュロウイルスベクターなどのウイルスベクター又は細菌人工染色体(BAC)、酵母人工染色体(YAC)又はP1人工染色体(PAC)などの人工染色体ベクターを含むがこれらに限定されない、任意の適切な種類を含む、当業者に公知である、任意のベクターを含む。発現ベクターは、プラスミドのほか、ウイルスベクターを含み、一般に、所望されるコード配列と、特定の宿主生物(例えば、細菌、酵母、植物、昆虫又は哺乳動物)又はインビトロ発現系における、作動可能に連結されたコード配列の発現に必要である、適切なDNA配列とを含有する。発現ベクターは、それらが導入された宿主細胞内の、自律的な複製が可能である(例えば、宿主細胞内において機能する複製起点を有するベクター)。他のベクターは、宿主細胞へと導入されると、宿主細胞のゲノムへと組み込まれ、これにより、宿主ゲノムと共に複製される。適切なベクターは、所望に応じ、かつ、特定の宿主生物(例えば、細菌細胞、酵母細胞)に従い、プロモーター配列、エンハンサー配列、ターミネーター配列などの調節配列を有する。クローニングベクターは、一般に、ある特定の、所望されたDNA断片を操作及び増幅するのに使用され、所望されたDNA断片の発現に必要とされた、機能的配列を欠く場合がある。当技術分野において、原核細胞にトランスフェクトすることにおける使用のための、発現ベクターの構築もまた周知であるので、標準的技法(当技術分野による規定及び用語について、例えば、Sambrookら、「Molecular Cloning:A Laboratory Manual」、4版、Cold Spring Harbor Press、Plainsview、New York(2012);及びAusubelら、「Current Protocols in Molecular Biology(増刊114号)」、John Wiley & Sons、New York(2016)を参照されたい)を介して達せられうる。
さらなる実施形態は、本明細書において記載されたキメラ遺伝子を発現させる宿主細胞に関し、これにより、おそらく、多量体のプロトマー若しくはタンパク質サブユニットを含む宿主細胞又は本明細書において記載された繊維を形成する宿主細胞を結果としてもたらす。「宿主細胞」は、原核細胞の場合もあり、真核細胞の場合もある。細胞は、一過性にトランスフェクトされる場合もあり、安定的にトランスフェクトされる場合もある。発現ベクターの、原核細胞及び真核細胞への、このようなトランスフェクションは、標準的な細菌の形質転換、リン酸カルシウム共沈降、電気穿孔又はリポソーム媒介トランスフェクション、DEAEデキストラン媒介トランスフェクション、ポリカチオン媒介トランスフェクション若しくはウイルス媒介トランスフェクションを含むがこれらに限定されない、当技術分野において公知である、任意の技法を介して達せられうる。全ての標準的技法について、例えば、Sambrookら、「Molecular Cloning:A Laboratory Manual」、4版、Cold Spring Harbor Press、Plainsview、New York(2012);及びAusubelら、「Current Protocols in Molecular Biology(増刊114号)」、John Wiley & Sons、New York(2016)を参照されたい。本文脈における、組換え宿主細胞は、本発明の、単離されたDNA分子、単離された核酸分子又は単離された発現構築物又は単離ベクターを含有する遺伝子改変された宿主細胞である。DNAは、限定せずに述べると、形質転換、リポフェクション、電気穿孔又はウイルス媒介形質導入を含む、特定の種類の細胞に適切の、当技術分野に公知である、任意の手段により導入されうる。本発明のキメラタンパク質の発現を可能とするDNA構築物は、クローニング、ハイブリダイゼーションスクリーニング及びポリメラーゼ連鎖反応(PCR)など、当技術分野において公知の技法により、容易に調製される。クローニング、DNAの単離、増幅及び精製のための標準的技法、DNAリガーゼ、DNAポリメラーゼ、制限エンドヌクレアーゼなどを伴う、酵素反応及び多様な分離法のための標準的技法は、当業者により公知であり、当業者により一般に援用された、標準的技法である。Sambrookら(2012)、Wu(編)(1993)及びAusubelら(2016)において、多数の標準的技法が記載されている。本発明により使用されうる、代表的宿主細胞は、細菌細胞、酵母細胞、植物細胞及び動物細胞を含むがこれらに限定されない。本発明による使用に適する細菌宿主細胞は、エスケリキア属(Escherichia spp.)種細胞、バチルス属種細胞、ストレプトミセス属(Streptomyces spp.)種細胞、エルウィニア属(Erwinia spp.)種細胞、クレブシエラ属(Klebsiella spp.)種細胞、セラチア属(Serratia spp.)種細胞、シュードモナス属(Pseudomonas spp.)種細胞及びサルモネラ属(Salmonella spp.)種細胞を含む。本発明による使用に適する動物宿主細胞は、昆虫細胞及び哺乳動物細胞(最も特定すると、チャイニーズハムスター(例えば、CHO)及びHeLa細胞系などのヒト細胞系に由来する)を含む。本発明による使用に適する酵母宿主細胞は、サッカロミセス属(Saccharomyces)、シゾサッカロミセス属(Schizosaccharomyces)、クルイウェロミセス属(Kluyveromyces)、ピキア属(Pichia)(例えば、ピキア・パストリス(Pichia pastoris))、ハンセヌラ属(Hansenula)(例えば、ハンセヌラ・ポリモルファ(Hansenula polymorpha))、ヤロウィア属(Yarowia)、シュワンニオミセス属(Schwaniomyces)、シゾサッカロミセス属(Schizosaccharomyces)、ジゴサッカロミセス属(Zygosaccharomyces)などの中の種を含む。サッカロミセス・セレウィシエ(Saccharomyces cerevisiae)、S.カールスバーゲンシス(S.carlsbergensis)及びK.ラクティス(K.lactis)が、最も一般に使用された酵母宿主であり、簡便な真菌宿主である。宿主細胞は、懸濁液、フラスコ培養物、組織培養物、臓器培養物などにおいて用意されうる。代替的に、宿主細胞はまた、トランスジェニック動物でもありうる。
具体的な実施形態は、バチルス属種の芽胞形成時に、インビボにおける、操作されたEna多量体及び操作されたEna繊維への自己アセンブルのための、(操作された)Enaタンパク質を伴う、改変された芽胞を形成するように、遺伝子が発現されるように、Enaタンパク質又は本明細書において規定された、操作されたEnaタンパク質をコードするキメラ遺伝子を含む、前記バチルス属種細胞に関する。したがって、具体的な実施形態は、Enaタンパク質又は操作されたEnaタンパク質を含む、組換えタンパク質繊維を含む、又はこれを提示する、バチルス属芽胞又は芽胞に関する。前記芽胞上の、前記操作された繊維は、ある特定の環境又は文脈において、芽胞を適用するために有利でありうる。
別の実施形態は、このような改変された芽胞を作製する方法であって、芽胞形成細菌細胞内において、本明細書において記載されたキメラ遺伝子を組換え発現させるステップ及び芽胞形成を誘導するための条件下においてインキュベートするステップを含む方法に関する。
本発明の別の態様は、改変された表面又は固体支持体に関する。これは、本発明の(操作された)多量体又は(操作された)タンパク質繊維を含有する。特に、本明細書において規定された、Ena自己アセンブルタンパク質サブユニットが、固体表面へと共有結合的に連結された、改変された表面が開示される。特定の実施形態は、少なくとも1つのEnaタンパク質サブユニット又は操作されたEnaタンパク質が、固体支持体へと共有結合的に連結された前記改変された表面に関する。このような改変された表面は、本明細書において記載された多量体及び繊維をさらに形成する、エピタキシャル成長を可能とする核生成表面であって、前記タンパク質サブユニット及び表面へと連結され、少なくとも1つのEnaタンパク質サブユニットを含む前記改変された表面が、Enaタンパク質をさらに含む溶液へと曝露されると、これにより、互いと共に、多量体へと自己アセンブルし、共有結合的ジスルフィド架橋が形成されると、前記表面から成長する、タンパク質繊維を形成する、核生成表面として使用されうる。
表面の固定化は、当業者により公知の手段を使用することによる、前記表面上における、少なくとも1つの(操作された)Enaタンパク質サブユニットの共有結合的結合として想定されうる。このような手段は、当技術分野において公知の、クリック化学反応、例えば、NHS化学反応を介する、遊離アミンへの架橋(リシンを介する、N末端における架橋)、ジスルフィド架橋、チオールベースの架橋、タグ(例えば、スナップ又はソルターゼタグ)の付加、表面への、タンパク質の共有結合的接合を可能とする、Enaタンパク質のN末端又はC末端における融合を含むがこれらに限定されない。具体的な実施形態において、単量体Enaサブユニットが、表面へとカップリングされる条件は、変性緩衝液条件に関すると想定される。
タンパク質繊維又は操作されたタンパク質繊維はまた、宿主の細胞又は微生物表面上に融合又は接合される場合もあり、繊維又は操作された繊維を含む、改変された表面を得るように、Enaタンパク質を含有する溶液へと曝露される、外来表面上へと核化される場合もある。
したがって、本明細書において、前記表面の固定化は、生体表面上において達せられる場合もあり、合成表面において達せられる場合もある。生体表面は、細胞、細菌、(芽胞)芽胞の表面又は他の自然発生の表面若しくは組換えにより作製された表面を含む。組換えタンパク質の、高密度における表面発現は、医薬、ファインケミカル、生物変換、廃棄物処理及び農薬作製の分野における、生物工学的適用の、いくつかの領域において、細胞表面提示の使用の成功のための必須条件である。
人工表面又は合成表面は、例えば、ビーズ、スライド、チップ、プレート又はカラムを含みうる。より詳細には、人工表面は、微粒子(例えば、ビーズ又は顆粒)の場合もあり、平板の場合もあり、プリーツ型の場合もあり、中空糸の場合もあり、チューブの場合もある、シート形態(例えば、膜又はフィルター、ガラス製又はプラスチック製のスライド、マイクロ滴定アッセイプレート、ディップスティック、キャピラリーデバイス)の場合もある。生物工学的適用の範囲は、本明細書において記載された、多量体組成物又は繊維などのタンパク質アセンブリーによる、合成表面のコーティング又は活性化を使用する。
したがって、本発明はまた、生体材料の生物医学分野又は生物工学分野において、ある特定の目標を完遂するように、Enaタンパク質又はその誘導体の作製を、合成表面への、多量体アセンブリー及び/又は繊維アセンブリーの形成をもたらす自己アセンブル特性でカップリングさせ、これらを、さらに特異的な、捕捉手段又は提示手段及び捕捉分子又は提示分子のためのコンフォメーションにおいて、前記表面上に提示する、システム又はインビトロの方法ももたらす。
本発明は、さらに、微粒子の文脈において、タンパク質サブユニット、多量体若しくは繊維又はこれらの任意の操作された形態を作出することにより得られた、直接適用可能な産物に関する。本発明に従う、自己アセンブルタンパク質サブユニットは、実際に、多量体アセンブリーのほか、点突然変異を介して、異なる機能について微調整されうる、長型であり、弾力性であり、可撓性であるナノ繊維、ペプチド又はタンパク質融合体及びコンジュゲートへと、たやすく自己アセンブルすることを可能とする。過酷な条件下においてもなお、剛性及び安定性が大きいが、可撓性も極めて大きな、前記操作されたナノ繊維は、次世代生体材料をもたらす。一実施形態において、このような生体材料は、本明細書において記載された、操作されたタンパク質繊維及び/又は本明細書において記載されたタンパク質繊維を含む、タンパク質薄膜の形態において存在する。実施例節(及び、例えば、図8F及び12)において提示される、「薄い」とは、バチルス属上において観察されたEna付属物の、少なくとも直径サイズと同等である、繊維のサイズであって、いくつかの層が、この直径サイズ(約8nm)の倍数を有するので、ナノメートルの範囲にあるサイズにより規定された、限定数の層だけが可能であることを意味する。実のところ、このような薄膜は、繊維により形成された、稠密であり、かつ、保護された環境をもたらす。例えば、本明細書において観察された、洗浄剤、化学物質、熱、UV及び他の過酷な条件に対する抵抗性の増大は、このような薄膜が、膜の反対側にある分子を保護することを可能とする。
別の実施形態は、本発明の操作されたタンパク質繊維を含み、任意選択的に、本明細書において記載されたタンパク質繊維を含むハイドロゲルに関する。別の実施形態において、本明細書において記載された、操作された多量体又は本明細書において記載された、操作されたタンパク質サブユニットを含む多量体を含む、ハイドロゲルが開示される。ハイドロゲルは、顕著に異なる三次元構造を維持する、膨潤性ポリマー材料として公知である。ハイドロゲルは、人体における使用のためにデザインされた、最初の生体材料であった。ハイドロゲルデザインにおける、新規の手法は、この、治療剤、センサー、マイクロ流体システム、ナノリアクター及び相互作用性表面において適用される、生体材料についての調査研究の分野を再活性化させている。ハイドロゲルは、疎水性相互作用、静電相互作用又は他の種類の分子間相互作用により自己アセンブルしうる。自然において見出された、認識モチーフを使用する、ハイドロゲル形成ポリマーのデザインは、正確に規定された三次元構造の形成に対する、潜在的可能性を増強する。本発明の(操作された)多量体又は(操作された)タンパク質繊維はまた、そのための方法が当業者に公知である、ハイドロゲルを形成するための、十分に構造化された、三次元構成単位も提示する。明らかにされた、本発明の構造の多用途性は、とりわけ、一次構造を改変すること、すなわち、ハイドロゲル生体材料の、新たなクラスのデザインの成功のために、本発明の、操作されたタンパク質サブユニット、多量体又は繊維を使用することにより、その安定性及び特異性を操る機会をもたらす。さらに、本明細書においてまた、ハイブリッドハイドロゲルも、想定され、通例、少なくとも2つの、顕著に異なる分子のクラス、例えば、共有結合的に、又は非共有結合的に相互接続された、合成ポリマー及び生物学的巨大分子に由来する構成要素を保有するハイドロゲルシステムと称される。合成ポリマーと比較して、タンパク質及びタンパク質モジュールは、十分に規定され、かつ、均一である構造、一貫した力学的特性及び協調的なフォールディング/アンフォールディング間遷移を有する。前記ハイブリッドハイドロゲル内において使用された、本発明のタンパク質繊維又はタンパク質多量体は、構造形成に対して、ナノメートルレベルにおける制御レベルを付与することが可能であり、合成部分は、ある特定の生物医学的適用における、ハイブリッド材料の生体適合性に寄与しうる。アミノ酸配列を最適化すること、すなわち、操作されたEnaタンパク質を適用することにより、特異的な適用のためになされる、応答性ハイブリッドハイドロゲルの微調整がデザインされうる。異なる種類のハイドロゲルの、潜在的な適用は、組織工学、合成細胞外マトリックス、植込み式デバイス、バイオセンサー、分離システム、酵素による材料制御活性、リン脂質二重層の脱安定化剤、可逆性細胞接合を制御する材料、三次元空間内に、反応性基が正確に配置された、ナノリアクター、応答性ハイドロゲルを伴う、高性能マイクロ流体素子及びエネルギー転換システムを含む。
本発明の最後の態様は、自己アセンブルタンパク質サブユニット、多量体、インビトロ作製型タンパク質繊維若しくはインビボ/インセルロ作製型タンパク質繊維を作製するための方法又は「停止」Enaタンパク質、Enaタンパク質の操作された形態、多量体及び繊維をさらに作製する方法並びに本発明の改変された表面を作製する方法に関する。前記タンパク質サブユニット単量体又は自己アセンブルした多量体を作製する方法は、
a)本発明のタンパク質サブユニット又は多量体が細胞質内に存在する細胞を得るための、細胞内における、異種N末端タグ又は異種C末端タグを含む操作されたEnaタンパク質を任意選択的にコードする、本明細書において記載されたキメラ遺伝子の組換え発現ステップ、及び任意選択的に、
b)例えば、細胞の溶解及び分離により、前記タンパク質又は多量体を、前記改変された細胞から精製又は単離するステップ
を含む、組換え工程又はインビトロ工程である。
a)本発明のタンパク質サブユニット又は多量体が細胞質内に存在する細胞を得るための、細胞内における、異種N末端タグ又は異種C末端タグを含む操作されたEnaタンパク質を任意選択的にコードする、本明細書において記載されたキメラ遺伝子の組換え発現ステップ、及び任意選択的に、
b)例えば、細胞の溶解及び分離により、前記タンパク質又は多量体を、前記改変された細胞から精製又は単離するステップ
を含む、組換え工程又はインビトロ工程である。
一実施形態は、前記細胞内において発現されたキメラ遺伝子のタンパク質サブユニットが、操作されたタンパク質サブユニット又は操作されたEnaタンパク質の場合もあり、1つ以上の野生型Enaタンパク質及び/又は本発明の操作されたタンパク質サブユニットの異なる形態の発現をもたらす、1つを超えるキメラ構築物の場合もある前記方法に関する。
別の実施形態は、ステップb)における精製が、封入体の単離及び可溶化、可溶化されたタンパク質サブユニットのリフォールディング並びにリフォールディングしたタンパク質多量体の精製のステップを含む方法に関する。例えば、アフィニティークロマトグラフィー、イオン交換クロマトグラフィー、ゲル濾過又はさらなる代替法を使用する、さらなる精製法が、当業者に公知である。
別の実施形態において、細胞内において組換えにより発現させる前記方法において使用されるキメラ遺伝子によりコードされた、本明細書において記載されたタンパク質サブユニット、特に、(操作された)Enaタンパク質サブユニットは、異種N末端タグ又は異種C末端タグを含む。前記N末端タグ又はC末端タグは、多量体へと自己アセンブルすることがやはり可能であるが、非天然の立体障害である、N末端タグ又はC末端タグの存在のために、これらのタンパク質サブユニット又は多量体の、さらなる繊維形成又は「成長」を停止させる、タンパク質サブユニットの作製を結果としてもたらしうる。最も好ましい前記異種N末端タグ又は異種C末端タグは、繊維形成の停止若しくは阻止又はエピタキシャル成長の遮断若しくは遅延を結果としてもたらすように、少なくとも1~5、6、7、9アミノ酸又は少なくとも15アミノ酸である。前記異種N末端タグ又は異種C末端タグは、本明細書において記載された、アフィニティータグでありうる。
別の実施形態は、宿主細胞内においてタンパク質繊維を組換えにより作製する方法であって、
a)キメラ遺伝子を、細胞内において、又は本明細書において記載された、Enaタンパク質サブユニット又は多量体を含む宿主細胞を使用して発現させるステップ及び
b)任意選択的に、細胞の溶解により、自己アセンブルされたタンパク質繊維を単離するステップ
を含み、
前記自己アセンブルタンパク質サブユニット又はEnaタンパク質をコードする核酸が、異種N末端タグ又は異種C末端タグをもたらさない
方法に関する。タグ非含有Enaタンパク質又は非立体障害Enaタンパク質を組換え発現させることにより、細胞質内における、繊維への自発的自己アセンブリーは、インビボにおいて、S型様繊維を容易に作製することを可能とする。
a)キメラ遺伝子を、細胞内において、又は本明細書において記載された、Enaタンパク質サブユニット又は多量体を含む宿主細胞を使用して発現させるステップ及び
b)任意選択的に、細胞の溶解により、自己アセンブルされたタンパク質繊維を単離するステップ
を含み、
前記自己アセンブルタンパク質サブユニット又はEnaタンパク質をコードする核酸が、異種N末端タグ又は異種C末端タグをもたらさない
方法に関する。タグ非含有Enaタンパク質又は非立体障害Enaタンパク質を組換え発現させることにより、細胞質内における、繊維への自発的自己アセンブリーは、インビボにおいて、S型様繊維を容易に作製することを可能とする。
さらなる実施形態は、タンパク質繊維又は本発明に従う、操作されたタンパク質繊維を作製するためのインビトロの方法であって、
a)細胞内における、本明細書において記載されたキメラ遺伝子の発現ステップであって、本発明のタンパク質サブユニット又は多量体が存在する細胞を得、前記タンパク質サブユニットが、切断可能な異種N末端タグ又は異種C末端タグを含むステップ、
b)前記タンパク質又は多量体を、前記細胞から精製するステップ、
c)N末端タグ又はC末端タグを切断して、繊維を形成するように、互いと、共有結合的に接続するための多量体を結果としてもたらすステップ
を含む方法に関する。
a)細胞内における、本明細書において記載されたキメラ遺伝子の発現ステップであって、本発明のタンパク質サブユニット又は多量体が存在する細胞を得、前記タンパク質サブユニットが、切断可能な異種N末端タグ又は異種C末端タグを含むステップ、
b)前記タンパク質又は多量体を、前記細胞から精製するステップ、
c)N末端タグ又はC末端タグを切断して、繊維を形成するように、互いと、共有結合的に接続するための多量体を結果としてもたらすステップ
を含む方法に関する。
代替的に、前記タンパク質繊維は、ステップb)と、ステップc)とが反転された前記方法により作製される。切断可能なタグは、例えば、タンパク質分解性切断部位を伴うタグ又は当業者により公知の切断可能なタグである。
別の実施形態は、本明細書において開示された改変された表面を作製する方法であって、繊維、多量体又はこれらの操作された形態を作製及び精製するための方法ステップに続き、タンパク質、多量体又は繊維を、生体表面の場合もあり、人工表面の場合もある表面へと、共有結合的に接合させる、さらなるステップを含む方法をさらにもたらす。
最後に、本明細書において、既に触れられた通り、生物医学領域及び生物工学領域など、異なる分野における、次世代生体材料としての、前記Enaタンパク質又は操作されたEnaタンパク質サブユニット由来のアセンブリーについては、多数の適用がなされている。したがって、前記ナノ材料の使用及び有用性は、無尽蔵である。
本開示に従う方法及び生成物について、特定の実施形態、具体的構成並びに材料及び/又は分子が本明細書において論じられてきたが、本発明の範囲から逸脱しない限りにおいて、形態及び詳細の、多様な変化又は改変がなされうることが理解されるものとする。以下の実施例は、特定の実施形態を、より良く例示するために提示されるものであり、本出願を限定するものとは考えられないものとする。本出願は、特許請求の範囲だけにより限定される。
[実施例1]バチルス・セレウスNVH 0075/95株は、2つの形状型を有する芽胞付属物を示す
バチルス属種及びクロストリジウム属種により形成された芽胞は、高頻度において、表面接合型の、羽毛様、リボン様又は線毛様付属物を保有する(Driks、2007)が、これらの役割は、それらのアセンブリーに関与する経路についての分子アノテーションの欠如のために、大部分、謎のまま残っている。それらについての最初の観察(Hachisuka及びKuno、1976;Hodgikiss、1971)の半世紀後において、本発明者らは、本明細書において、cryoEMによる、高分解能のデノボ構造決定を援用して、B.セレウス芽胞上において見出された付属物を、構造的に、かつ、遺伝子的に特徴付ける。
バチルス属種及びクロストリジウム属種により形成された芽胞は、高頻度において、表面接合型の、羽毛様、リボン様又は線毛様付属物を保有する(Driks、2007)が、これらの役割は、それらのアセンブリーに関与する経路についての分子アノテーションの欠如のために、大部分、謎のまま残っている。それらについての最初の観察(Hachisuka及びKuno、1976;Hodgikiss、1971)の半世紀後において、本発明者らは、本明細書において、cryoEMによる、高分解能のデノボ構造決定を援用して、B.セレウス芽胞上において見出された付属物を、構造的に、かつ、遺伝子的に特徴付ける。
B.セレウスNVH 0075/95株についての、陰性染色EMイメージングは、直径を、約1μmとし、外膜層により、緊密に包み込まれた、稠密なコアを伴い、TEM画像上において、芽胞体から、2~3μmの長さの嚢状の平板構造として発生し、典型的な芽胞を示した(図1A)。芽胞は、夥多な、マイクロメートル単位の長さの付属物(Ena)を示した(図1A)。平均像の芽胞は、200nm~6μmの長さの範囲のEnaを、20~30数え(図1E)、中央値の長さは、約600nmであった。Enaの密度は、外膜の近傍にある、芽胞体の極において、最高度であった。ここにおいて、Enaは、外膜から、芽胞表面の上方、数十ナノメートルを隔てて、個別の繊維又は個別の繊維のバンドルとして出現するように見えた(図1B及び7B)。精査は、Enaが、2つの顕著に異なる形状を示すことを明らかにした(図1C、1D)。主要形状又は「スタッガリング型」(S型)形状は、観察された繊維のうちの、約90%を表す。陰性染色による二次元クラス像において、S型Enaは、幅が約110Åであり、極における、スタッガリング型の出現をもたらすが、縮尺を変更した下方に、芽胞表面を指し示す。遠位末端において、S型Enaは、長さを、50~100nmとし、厚さを、約35Åとする、複数のフィラメント状伸長部又は「ラッフル膜」において終結する(図1C)。Enaの副次形状又は「ラダー様」(L型)形状は、薄型であり、幅が約80Åであり、単一のフィラメント状伸長部において終結し、寸法は、S型繊維において見られたラッフル膜と同様である(図1D)。L型Enaは、S型Enaの、うろこ状の、互い違いの出現を欠く代わりに、円板様ユニットの積み重ねによる、高さ約40Åのラダーを示す。S型Enaが、外膜を横切り、芽胞体へとつながることが見られうるのに対し、L型Enaは、外膜から出現するように見える(図7A)。いずれのEna形状も、個々の芽胞上に共存在する(図7C)。いずれのEna形状も、グラム陽性菌においてかつて観察された(Mandlikら、2008;Melville及びCraig、2013)、ソルターゼ媒介型線毛又はIV型線毛を想起させない。それらの組成を同定しようとする試みにおいて、せん断力により抽出及び精製されたEnaを、質量分析による同定のために、トリプシン消化にかけた。しかし、S型Ena及びL型Enaの両方に対する、良好なエンリッチメントにもかかわらず、大部分が、夾雑母細胞タンパク質である、EA1 S層タンパク質及び芽胞コートタンパク質を含有する、トリプシン消化により得られたペプチドの中から、Enaの明確な候補物質は同定されなかった。強力な還元条件(200mM以下のβ-メルカプトエタノール)、熱処理(100℃)、限定的酸性加水分解(1MのHClにより、1時間にわたる)又は8Mの尿素若しくは6Mの塩化グアニジウムなどのカオトロープを伴うインキュベーションを含む、SDS-PAGEにより、Ena単量体を解像しようとする試みは、成功しなかった。Ena繊維はまた、オートクレーブ処理時、乾燥処理時又はプロテイナーゼKによる処理時においても、それらの構造的特性を保持した(図7C)。
本発明者らは、B.セレウスのEnaが、2つの主要形状:1)数マイクロメートルの長さであり、芽胞体から出現し、外膜を横切る、スタッガリング型Ena又はS型Ena及び2)小型であり、少数であり、外膜表面から直接出現するように見える、ラダー型Ena又はL型Enaを取ることを見出した。
[実施例2]芽胞付属物についてのcryo-EMは、それらの分子識別を同定する
Enaの性質について、さらに実験するために、B.セレウスNVH 0075/95株芽胞から精製された繊維を、低温電子顕微鏡法(cryo-EM)によりイメージングし、三次元再構築を使用して解析した。単離された繊維は、S型Enaと、L型Enaとの、9.4:1の比を示したが、これは、芽胞上において見られた繊維についての比と同様であった。寸法を、300×300ピクセル(246×246Å2)とする枠を、繊維の全長に沿って抽出し、枠間の重複を、21Åとして、RELION 3.0を使用する、二次元クラス分けにかけた(Zivanovら、2018)。二次元クラス平均像についてのパワースペクトルが、S型Enaについて、十分に秩序化されたヘリックス対称性を明らかにした(図2A、2B)のに対し、L型Enaは、並進対称性を主に示した(図1D)。約54.5Åのヘリックス半径に基づき、本発明者らは、S型Enaについてのパワースペクトル内の層線である、Z’及びZ’’が、それぞれ、-11及び1のベッセル次数を有すると推定した(図2A、2B)。抽出された枠の大部分を保持する二次元クラスにおいて、ベッセル次数を1とする層線は、赤道から、0.02673Å-1の距離において見出され、37.4Åのピッチに対応し、陰性染色によってもまた見られた、見かけの「ローブ」の間隔と良好に一致した(図1C、2B及び7)。適正なヘリックスパラメータは、RELION 3.0を使用する、三次元再構築及び実空間におけるベイズ精緻化のために、サブユニットのライズ及びツイストについての、一連の系統的出発値を使用する、経験法により導出した(He及びScheres、2017)。フーリエ-ベッセル指数化による推定に基づき、被験出発値間のサンプリング分解能を、0.1Å及び1度として、インプットのライズ及びツイストを、それぞれ、3.05~3.65Å及び29~35度の範囲において変動させた。この手法は、ヘリックスパラメータの固有のセットに収束する結果として、サブユニット側鎖について、明確な二次構造及び識別可能な密度を伴う、三次元マップをもたらした(図2C)。再構成されたマップは、サブユニット1つ当たりのライズ及びツイストを、3.22937Å及び31.0338度とする、左巻き1出発点型ヘリックスに対応し、ターン1回転当たり、11.6のユニットを伴うヘリックスに対応する(図2D)。RELION 3.0における、精緻化及びポストプロセシングの後、マップは、FSC0.143基準に従い、3.2Åの分解能であることが見出された。結果として得られるマップは、約100残基の、8本のβ鎖によるβサンドウィッチドメインを含む、十分に規定されたサブユニットを示した(図2E)。側鎖密度は、配列をF-C-M-V/T-I-R-Yとする短モチーフを、手作業により推定するのに十分な品質であった(図8A)。B.セレウスNVH 0075/95株のプロテオームについての検索は、KMP91697.1(配列番号1)及びKMP91698.1(配列番号8)によりコードされた、2つの、機能が未知である、仮説的タンパク質を同定した(図8B)。Enaサブユニットについての、電位マップのさらなる精査及び手作業によるモデル構築は、これが、KMP91697.1遺伝子座の15bp下流に配置された、KMP91698.1によりコードされた配列と、十分に適合することを示した。いずれの遺伝子も、同様のサイズ(KMP91698.1及びKMP91697.1について、それぞれ、117及び126アミノ酸であり、推定分子量を、12及び14kDaとする)の仮説的タンパク質をコードし、39%の対応のあるアミノ酸配列同一性、機能が未知である共有されたドメイン(DUF)3992及び同様のCysパターンを有している。マイナス鎖上の、KMP91698.1の、さらに下流において、KMP91699.1遺伝子座(配列番号15)は、160アミノ酸であり、推定分子量を17kDaとする、仮説的タンパク質を含有する、第3のDUF3992をコードする。このように、KMP91697.1、KMP91698.1及びKMP91699.1は、本明細書の下記において、Ena1A、Ena1B及びEna1Cと称された、候補Enaサブユニットをコードすると考えられる(図8B、8C)。
Enaの性質について、さらに実験するために、B.セレウスNVH 0075/95株芽胞から精製された繊維を、低温電子顕微鏡法(cryo-EM)によりイメージングし、三次元再構築を使用して解析した。単離された繊維は、S型Enaと、L型Enaとの、9.4:1の比を示したが、これは、芽胞上において見られた繊維についての比と同様であった。寸法を、300×300ピクセル(246×246Å2)とする枠を、繊維の全長に沿って抽出し、枠間の重複を、21Åとして、RELION 3.0を使用する、二次元クラス分けにかけた(Zivanovら、2018)。二次元クラス平均像についてのパワースペクトルが、S型Enaについて、十分に秩序化されたヘリックス対称性を明らかにした(図2A、2B)のに対し、L型Enaは、並進対称性を主に示した(図1D)。約54.5Åのヘリックス半径に基づき、本発明者らは、S型Enaについてのパワースペクトル内の層線である、Z’及びZ’’が、それぞれ、-11及び1のベッセル次数を有すると推定した(図2A、2B)。抽出された枠の大部分を保持する二次元クラスにおいて、ベッセル次数を1とする層線は、赤道から、0.02673Å-1の距離において見出され、37.4Åのピッチに対応し、陰性染色によってもまた見られた、見かけの「ローブ」の間隔と良好に一致した(図1C、2B及び7)。適正なヘリックスパラメータは、RELION 3.0を使用する、三次元再構築及び実空間におけるベイズ精緻化のために、サブユニットのライズ及びツイストについての、一連の系統的出発値を使用する、経験法により導出した(He及びScheres、2017)。フーリエ-ベッセル指数化による推定に基づき、被験出発値間のサンプリング分解能を、0.1Å及び1度として、インプットのライズ及びツイストを、それぞれ、3.05~3.65Å及び29~35度の範囲において変動させた。この手法は、ヘリックスパラメータの固有のセットに収束する結果として、サブユニット側鎖について、明確な二次構造及び識別可能な密度を伴う、三次元マップをもたらした(図2C)。再構成されたマップは、サブユニット1つ当たりのライズ及びツイストを、3.22937Å及び31.0338度とする、左巻き1出発点型ヘリックスに対応し、ターン1回転当たり、11.6のユニットを伴うヘリックスに対応する(図2D)。RELION 3.0における、精緻化及びポストプロセシングの後、マップは、FSC0.143基準に従い、3.2Åの分解能であることが見出された。結果として得られるマップは、約100残基の、8本のβ鎖によるβサンドウィッチドメインを含む、十分に規定されたサブユニットを示した(図2E)。側鎖密度は、配列をF-C-M-V/T-I-R-Yとする短モチーフを、手作業により推定するのに十分な品質であった(図8A)。B.セレウスNVH 0075/95株のプロテオームについての検索は、KMP91697.1(配列番号1)及びKMP91698.1(配列番号8)によりコードされた、2つの、機能が未知である、仮説的タンパク質を同定した(図8B)。Enaサブユニットについての、電位マップのさらなる精査及び手作業によるモデル構築は、これが、KMP91697.1遺伝子座の15bp下流に配置された、KMP91698.1によりコードされた配列と、十分に適合することを示した。いずれの遺伝子も、同様のサイズ(KMP91698.1及びKMP91697.1について、それぞれ、117及び126アミノ酸であり、推定分子量を、12及び14kDaとする)の仮説的タンパク質をコードし、39%の対応のあるアミノ酸配列同一性、機能が未知である共有されたドメイン(DUF)3992及び同様のCysパターンを有している。マイナス鎖上の、KMP91698.1の、さらに下流において、KMP91699.1遺伝子座(配列番号15)は、160アミノ酸であり、推定分子量を17kDaとする、仮説的タンパク質を含有する、第3のDUF3992をコードする。このように、KMP91697.1、KMP91698.1及びKMP91699.1は、本明細書の下記において、Ena1A、Ena1B及びEna1Cと称された、候補Enaサブユニットをコードすると考えられる(図8B、8C)。
[実施例3]インビトロにおいて、Ena1Bは、芽胞付属物様ナノ繊維へと自己アセンブルする
B.セレウスNVH0075/95株から単離された芽胞付属物のサブユニット同一性を確認するために、本発明者らは、Ena1B及びN末端TEVプロテアーゼ切断可能6×Hisタグのコード配列に対応する合成遺伝子断片を、E.コリの細胞質内の組換え発現(配列番号83において示されたrecEna1B)のためのベクターへとクローニングした。組換えタンパク質は、アフィニティー精製の前に、8Mの尿素中において可溶化される封入体を形成することが見出された。急速な希釈による、カオトロピック剤の除去が、単離されたS型Ena内において見られた部分的ヘリックスターンを想起させる、夥多な可溶性三日月形オリゴマーの形成を結果としてもたらした(図8A~8E)ことは、リフォールディングした組換えEna1B(recEna1B)が、天然のサブユニット-サブユニット間β拡張による接触部を採用することを示唆する(図8E)。本発明者らは、recEna1Bが、サブユニットのNtcにおける、6×Hisタグによる立体障害のために、単一ターンの水準において停止された、ヘリックス型付属物へと自己アセンブルすると推論した。実際、タンパク質分解による、アフィニティータグの除去は、たやすく、直径を110Åとし、ヘリックスパラメータを、S型Enaと同様とする、繊維の形成を結果としてもたらしたが、エクスビボの繊維において見られた、遠位ラッフル膜を欠いた(図8F)。cryoEMによるデータの収集及び三次元ヘリックス再構築を実施して、インビトロにおけるrecEna1Bナノ繊維が、エクスビボにおけるS型Enaと同型であるのかどうかについて評価した。RELION 3.0を使用する、実空間におけるヘリックスパラメータの精緻化は、それぞれ、3.43721Å及び32.3504度である、サブユニットのライズ及びツイストに収束し、エクスビボにおけるS型Enaにおいて見出されたものより、約0.2Å及び1.3度大きく、ターン1回転当たりのピッチを38.3Åとし、11.1のサブユニットを伴う左巻きヘリックスに対応した。ヘリックスパラメータの微細な差違を別にすれば、インビトロにおけるEna1B繊維(推定分解能を3.2Åとする;図9A、9B)についての三次元再構築マップは、繊維サブユニットのサイズ及び接続性に関して、エクスビボにおけるS型Enaと、ほぼ同型であった(図9D)。recEna1B及びエクスビボにおけるS型Enaについての三次元cryoEMマップの精査は、前者におけるEna1B残基についての側鎖適合の改善を示し(図9B、9C、9D)、エクスビボEnaマップ内において、特に、ループである、L1、L3、L5及びL7におけるEna1Aの、部分的側鎖特徴を示す領域を明らかにした(図8B、9B、9C)。エクスビボマップのEna1B特徴が優勢であるが、これは、エクスビボにおけるS型Enaが、Ena1A繊維と、Ena1B繊維との混合集団からなること又はS型Enaが、Ena1A及びEna1Bの両方を含む混合組成を有することを示唆した。recEna1A又はrecEna1Bにより得られた血清を使用する免疫金標識化は、単一のEna内における、サブユニット特異的標識化を示し、これらが、Ena1Aと、Ena1Bとの混合組成を有することを確認した(図9E)。Ena1C血清による、S型Enaの染色は、見られなかった(図9E)。Ena1A及びEna1Bについての、系統的パターン化又はモル比が、1つを超えるサブユニットを含有する、非対称的ユニットによる、免疫金標識化又はヘリックス再構築から区別できなかったことは、繊維内の、Ena1A及びEna1Bの分布が、ランダムであることを示唆する。Ena1Aの特徴と、Ena1Bの特徴とが混合された、多数の側鎖の密度を別にすれば、エクスビボにおけるEnaについての、cryoEM電位マップが、固有の主鎖コンフォメーションを示すことから、Ena1Aと、Ena1Bとが、ほぼ同型のフォールドを有することを指し示した。
B.セレウスNVH0075/95株から単離された芽胞付属物のサブユニット同一性を確認するために、本発明者らは、Ena1B及びN末端TEVプロテアーゼ切断可能6×Hisタグのコード配列に対応する合成遺伝子断片を、E.コリの細胞質内の組換え発現(配列番号83において示されたrecEna1B)のためのベクターへとクローニングした。組換えタンパク質は、アフィニティー精製の前に、8Mの尿素中において可溶化される封入体を形成することが見出された。急速な希釈による、カオトロピック剤の除去が、単離されたS型Ena内において見られた部分的ヘリックスターンを想起させる、夥多な可溶性三日月形オリゴマーの形成を結果としてもたらした(図8A~8E)ことは、リフォールディングした組換えEna1B(recEna1B)が、天然のサブユニット-サブユニット間β拡張による接触部を採用することを示唆する(図8E)。本発明者らは、recEna1Bが、サブユニットのNtcにおける、6×Hisタグによる立体障害のために、単一ターンの水準において停止された、ヘリックス型付属物へと自己アセンブルすると推論した。実際、タンパク質分解による、アフィニティータグの除去は、たやすく、直径を110Åとし、ヘリックスパラメータを、S型Enaと同様とする、繊維の形成を結果としてもたらしたが、エクスビボの繊維において見られた、遠位ラッフル膜を欠いた(図8F)。cryoEMによるデータの収集及び三次元ヘリックス再構築を実施して、インビトロにおけるrecEna1Bナノ繊維が、エクスビボにおけるS型Enaと同型であるのかどうかについて評価した。RELION 3.0を使用する、実空間におけるヘリックスパラメータの精緻化は、それぞれ、3.43721Å及び32.3504度である、サブユニットのライズ及びツイストに収束し、エクスビボにおけるS型Enaにおいて見出されたものより、約0.2Å及び1.3度大きく、ターン1回転当たりのピッチを38.3Åとし、11.1のサブユニットを伴う左巻きヘリックスに対応した。ヘリックスパラメータの微細な差違を別にすれば、インビトロにおけるEna1B繊維(推定分解能を3.2Åとする;図9A、9B)についての三次元再構築マップは、繊維サブユニットのサイズ及び接続性に関して、エクスビボにおけるS型Enaと、ほぼ同型であった(図9D)。recEna1B及びエクスビボにおけるS型Enaについての三次元cryoEMマップの精査は、前者におけるEna1B残基についての側鎖適合の改善を示し(図9B、9C、9D)、エクスビボEnaマップ内において、特に、ループである、L1、L3、L5及びL7におけるEna1Aの、部分的側鎖特徴を示す領域を明らかにした(図8B、9B、9C)。エクスビボマップのEna1B特徴が優勢であるが、これは、エクスビボにおけるS型Enaが、Ena1A繊維と、Ena1B繊維との混合集団からなること又はS型Enaが、Ena1A及びEna1Bの両方を含む混合組成を有することを示唆した。recEna1A又はrecEna1Bにより得られた血清を使用する免疫金標識化は、単一のEna内における、サブユニット特異的標識化を示し、これらが、Ena1Aと、Ena1Bとの混合組成を有することを確認した(図9E)。Ena1C血清による、S型Enaの染色は、見られなかった(図9E)。Ena1A及びEna1Bについての、系統的パターン化又はモル比が、1つを超えるサブユニットを含有する、非対称的ユニットによる、免疫金標識化又はヘリックス再構築から区別できなかったことは、繊維内の、Ena1A及びEna1Bの分布が、ランダムであることを示唆する。Ena1Aの特徴と、Ena1Bの特徴とが混合された、多数の側鎖の密度を別にすれば、エクスビボにおけるEnaについての、cryoEM電位マップが、固有の主鎖コンフォメーションを示すことから、Ena1Aと、Ena1Bとが、ほぼ同型のフォールドを有することを指し示した。
[実施例4]インビトロにおいて、Ena1Cは、7量体の多量体へと自己アセンブルする
Ena1C(WP_000802321)の野生型配列を、E.コリ内の発現についてコドン最適化し、Twist Bioscience製の合成遺伝子として注文し、pET28aベクター内に、さらにサブクローニングした(NcoI-XhoI)。N末端6×ヒスチジンタグに続き、TEV切断部位(配列番号89:ENLYFQG)を有するように、インサートをデザインした。大スケールの組換え発現を、ファージ抵抗性である、NEB製のT7 Express lysY/Iq E.coli strain内において実行した。得られたプラスミド(pET28a_Ena1A;pET28a_Ena1B)を使用して、C43(DE3)株のコンピテント細胞を形質転換した。単一のコロニーを使用して、一晩にわたる(ON)、LBによる培養を開始した。10mlの一晩培養物を使用して、37Cにおける、1lのLB、25mg/mlのカナマイシンに接種した。組換え発現は、OD600を、0.8として、1mMのIPTGを添加することにより誘導し、培養物を放置し、一晩にわたりインキュベートした。4000gにおいて、15分間にわたる遠心分離により、細胞をペレット化させた。全細胞ペレットを、変性溶解緩衝液(20mMのリン酸カリウム、500mMのNaCl、10mMのβ-ME、20mMのイミダゾール、8Mの尿素、pH7.5)中に再懸濁させ、氷上において、超音波処理した。Beckman coulter製のJA-20型ローター内における、20,000rpmで45分間にわたる遠心分離により、可溶性画分と、不溶性画分とを分離するように、溶解物を遠心分離した。清明化した溶解物を、Ni Sepharoseを充填された、5mlのHisTrap HPカラムへとロードし、変性溶解緩衝液により平衡化させた。室温において、AKTA精製装置を使用して、勾配モード(20~250mMのイミダゾール)において、結合されたタンパク質を、溶出緩衝液(20mMのリン酸カリウム、pH7.5、8M尿素、250mMのイミダゾール)により溶出させた。結果として得られた画分を、SDS-PAGEにより解析して、純度について点検した。20mMのリン酸カリウム、10mMのβ-ME、pH7.5に対する透析(一晩にわたり、1リットルに対して100μlとし、カットオフを3kDaとする)により、Ena1Cを含有する画分を、プールし、リフォールディングさせた。リフォールディングさせた材料のうちの、アリコート分割された5μlを、フォルムバール/カーボングリッド(Cu製400メッシュ;Electron Microscopy Sciences)上に沈着させ、2%(w/v)の酢酸ウラニルを使用して染色した。
Ena1C(WP_000802321)の野生型配列を、E.コリ内の発現についてコドン最適化し、Twist Bioscience製の合成遺伝子として注文し、pET28aベクター内に、さらにサブクローニングした(NcoI-XhoI)。N末端6×ヒスチジンタグに続き、TEV切断部位(配列番号89:ENLYFQG)を有するように、インサートをデザインした。大スケールの組換え発現を、ファージ抵抗性である、NEB製のT7 Express lysY/Iq E.coli strain内において実行した。得られたプラスミド(pET28a_Ena1A;pET28a_Ena1B)を使用して、C43(DE3)株のコンピテント細胞を形質転換した。単一のコロニーを使用して、一晩にわたる(ON)、LBによる培養を開始した。10mlの一晩培養物を使用して、37Cにおける、1lのLB、25mg/mlのカナマイシンに接種した。組換え発現は、OD600を、0.8として、1mMのIPTGを添加することにより誘導し、培養物を放置し、一晩にわたりインキュベートした。4000gにおいて、15分間にわたる遠心分離により、細胞をペレット化させた。全細胞ペレットを、変性溶解緩衝液(20mMのリン酸カリウム、500mMのNaCl、10mMのβ-ME、20mMのイミダゾール、8Mの尿素、pH7.5)中に再懸濁させ、氷上において、超音波処理した。Beckman coulter製のJA-20型ローター内における、20,000rpmで45分間にわたる遠心分離により、可溶性画分と、不溶性画分とを分離するように、溶解物を遠心分離した。清明化した溶解物を、Ni Sepharoseを充填された、5mlのHisTrap HPカラムへとロードし、変性溶解緩衝液により平衡化させた。室温において、AKTA精製装置を使用して、勾配モード(20~250mMのイミダゾール)において、結合されたタンパク質を、溶出緩衝液(20mMのリン酸カリウム、pH7.5、8M尿素、250mMのイミダゾール)により溶出させた。結果として得られた画分を、SDS-PAGEにより解析して、純度について点検した。20mMのリン酸カリウム、10mMのβ-ME、pH7.5に対する透析(一晩にわたり、1リットルに対して100μlとし、カットオフを3kDaとする)により、Ena1Cを含有する画分を、プールし、リフォールディングさせた。リフォールディングさせた材料のうちの、アリコート分割された5μlを、フォルムバール/カーボングリッド(Cu製400メッシュ;Electron Microscopy Sciences)上に沈着させ、2%(w/v)の酢酸ウラニルを使用して染色した。
図14B(i)に示された通り、Ena1Cの組換え発現だけにより、9つのサブユニットによる円板又はリングが形成された。これらの円板において、βシートの拡張を介する、サブユニットの、水平方向の相互作用は、9枚羽根のβプロペラをもたらすことが見られうる。
[実施例5]Enaは、グラム陽性菌線毛の、新規のファミリーを表す
天然S型Enaが、Ena1Aと、Ena1Bとの混合組成を示すことを認識すると、本発明者らは、モデル構築のために、recEna1Bの、三次元cryoEMによる再構築に、引き続き携わった。Enaサブユニットは、鎖である、BIDG及びCHEFからなる、2つの並置されたβシートから構成された、典型的なゼリーロール状フォールド(Richardson、1981)からなる(図2E)。ゼリーロール状ドメインに、本明細書の下記において、N末端接続部(「Ntc」)と称された、15残基の可撓性N末端伸長部が前置される。サブユニットは、スタッガリング型のβシートの拡張を介して、隣り合って整列する(Remaut及びWaksman、2006)が、この場合、サブユニットiの鎖BIDGは、先行サブユニットであるi-1の鎖CHEFにより拡張され、サブユニットiの鎖CHEFは、連続する、次のサブユニットである、i+1の鎖BIDGにより拡張される(図2E、図10A、10B)。このように、芽胞付属物内の充填は、ヘリックスターン1回転当たりの羽根を11.6枚とし、サブユニット1つ当たりの軸方向のライズを、3.2Åとする、8本のβ鎖のβシートによる、傾斜したβプロペラと考えられうる(図2E)。βプロペラ内のサブユニット-サブユニット間の接触は、Enaサブユニット上における、2つの相補性静電パッチにより、さらに安定化される(図10C)。これらの水平方向の接触に加えて、ヘリックスターンを隔てたサブユニットはまた、Ntcを介しても接続され、この場合、各サブユニットiのNtcは、先行ヘリックスターン内のサブユニットである、i-9及びi-10と、ジスルフィド結合により接触する(図2E、図10B)。これらの接触は、サブユニットi内の、Cys 10及びCys 11の、それぞれ、サブユニットであるi-9及びi-10の鎖であるI及びBの、Cys 109及びCys 24とのジスルフィド結合を介してなされる(図2E、10B)。こうして、Ntcを介するジスルフィド結合は、ヘリックスターンの架橋による、長手方向の繊維の安定化のほか、さらに、隣接するサブユニットの共有結合的架橋による、βプロペラ内の、水平方向の安定化を結果としてもたらす。Ntc接触部は、ヘリックスの管腔側にあり、直径約1.2nmの中空を残す(図10D)。残基12~17は、Enaゼリーロール状ドメインと、Ntcとの間において、可撓性スペーサー領域を形成する。目覚ましいことに、このスペーサー領域は、Enaサブユニット間の長手方向において、4.5Åのギャップを創出し、これらのEnaサブユニットは、Ntcを介する接触以外に、直接的に接触しない(図3C、8B)。Ntcスペーサーにおける可撓性と、ヘリックスターンを隔てた、長手方向における、サブユニットの、直接的なタンパク質間接触の欠如は、Ena繊維において、曲がりやすさ及び弾性の増大を創出する(図3)。芽胞会合繊維の、二次元クラス平均像は、ピッチの変化を8Å以下とする、長手方向の伸縮(範囲:37.1~44.9Å;図3D)及びヘリックスターン1回転当たり10度以下の軸方向における揺動(図3A、3B)を示す。
天然S型Enaが、Ena1Aと、Ena1Bとの混合組成を示すことを認識すると、本発明者らは、モデル構築のために、recEna1Bの、三次元cryoEMによる再構築に、引き続き携わった。Enaサブユニットは、鎖である、BIDG及びCHEFからなる、2つの並置されたβシートから構成された、典型的なゼリーロール状フォールド(Richardson、1981)からなる(図2E)。ゼリーロール状ドメインに、本明細書の下記において、N末端接続部(「Ntc」)と称された、15残基の可撓性N末端伸長部が前置される。サブユニットは、スタッガリング型のβシートの拡張を介して、隣り合って整列する(Remaut及びWaksman、2006)が、この場合、サブユニットiの鎖BIDGは、先行サブユニットであるi-1の鎖CHEFにより拡張され、サブユニットiの鎖CHEFは、連続する、次のサブユニットである、i+1の鎖BIDGにより拡張される(図2E、図10A、10B)。このように、芽胞付属物内の充填は、ヘリックスターン1回転当たりの羽根を11.6枚とし、サブユニット1つ当たりの軸方向のライズを、3.2Åとする、8本のβ鎖のβシートによる、傾斜したβプロペラと考えられうる(図2E)。βプロペラ内のサブユニット-サブユニット間の接触は、Enaサブユニット上における、2つの相補性静電パッチにより、さらに安定化される(図10C)。これらの水平方向の接触に加えて、ヘリックスターンを隔てたサブユニットはまた、Ntcを介しても接続され、この場合、各サブユニットiのNtcは、先行ヘリックスターン内のサブユニットである、i-9及びi-10と、ジスルフィド結合により接触する(図2E、図10B)。これらの接触は、サブユニットi内の、Cys 10及びCys 11の、それぞれ、サブユニットであるi-9及びi-10の鎖であるI及びBの、Cys 109及びCys 24とのジスルフィド結合を介してなされる(図2E、10B)。こうして、Ntcを介するジスルフィド結合は、ヘリックスターンの架橋による、長手方向の繊維の安定化のほか、さらに、隣接するサブユニットの共有結合的架橋による、βプロペラ内の、水平方向の安定化を結果としてもたらす。Ntc接触部は、ヘリックスの管腔側にあり、直径約1.2nmの中空を残す(図10D)。残基12~17は、Enaゼリーロール状ドメインと、Ntcとの間において、可撓性スペーサー領域を形成する。目覚ましいことに、このスペーサー領域は、Enaサブユニット間の長手方向において、4.5Åのギャップを創出し、これらのEnaサブユニットは、Ntcを介する接触以外に、直接的に接触しない(図3C、8B)。Ntcスペーサーにおける可撓性と、ヘリックスターンを隔てた、長手方向における、サブユニットの、直接的なタンパク質間接触の欠如は、Ena繊維において、曲がりやすさ及び弾性の増大を創出する(図3)。芽胞会合繊維の、二次元クラス平均像は、ピッチの変化を8Å以下とする、長手方向の伸縮(範囲:37.1~44.9Å;図3D)及びヘリックスターン1回転当たり10度以下の軸方向における揺動(図3A、3B)を示す。
こうして、B.セレウス芽胞付属物は、βシートの拡張により形成された、水平方向の非共有結合的サブユニット間接触と、ジスルフィド結合されたN末端接続部ペプチドによる、長手方向の共有結合的ヘリックスターン間接触とを伴う結果として、極度の化学的安定性(図7)を、高度の繊維的可撓性と組み合わせるアーキテクチャーもたらす、左巻き単一出発点型ヘリックスを含む、新規のクラスの細菌線毛を表す。
共有結合され、高度に緊密である、ゼリーロール状フォールドは、乾燥処理、高温処理及びプロテアーゼへの曝露に抗する、Ena繊維の、高度な化学的/物理的安定性を結果としてもたらす。数百のサブユニットによる、直鎖状フィラメントの形成は、サブユニット-サブユニット間複合体の解離が、線毛の破断を結果としてもたらすことを回避するように、高度の可撓性を伴う、安定的であり、長寿命である、サブユニット-サブユニット間の相互作用を要求する。この高度の安定性及び可撓性は、環境内、又は感染サイクルにおいて、芽胞により満たされうる、極限的条件に対して、適合性である可能性が高い。
グラム陽性菌において、表面繊維又は「線毛」を形成する、2つの分子経路:1)ソルターゼにより触媒されたペプチド転移反応による、線毛サブユニットの共有結合的連結を包摂する、ソルターゼ媒介型線毛アセンブリー(Ton-That及びSchneewind、2004)及び2)疎水性N末端ヘリックスのコイルドコイル相互作用を介する、サブユニットの、非共有結合的アセンブリーを包摂する、IV型線毛アセンブリー(Melville及びCraig、2013)が公知である。ソルターゼ媒介型線毛及びIV型線毛は、栄養細胞上において形成されるが、現在のところ、これらの経路がまた、芽胞付属物のアセンブリーの一因をもなすことを示唆する証拠は見られない。
本実験まで、芽胞付属物の遺伝子同一性及びタンパク質組成が公知であった、唯一の種は、他の大半のクロストリジウム属及びバチルス属種において見出されたものと構造的に顕著に異なる、大型(長さ4.5μm、幅0.5μm及び厚さ30nm)のリボン様付属物を保有する、非毒性の環境種である、クロストリジウム・テニオスポールム(Clostridium taeniosporum)である。C.テニオスポールム(C.taeniosporum)は、外膜層を欠き、付属物は、コートの外側の、組成が未知である、別の層へと接合されていると考えられる(Walkerら、2007)。C.テニオスポールムの芽胞付属物は、それらのうちの3つが、他の種において、公知のホモログを有さず、B.スブティリスの芽胞膜タンパク質である、SpoVMのオーソログを有さない、4つの主要な構成要素からなる(Walkerら、2007)。したがって、C.テニオスポールム芽胞の表面上の付属物は、B.セレウス群に属する種の芽胞の表面において見出された繊維と、顕著に異なる種類の繊維を表す。
本発明者らによる構造的実験は、新規のクラスの線毛を明らかにするが、この場合、サブユニットは、螺旋状に巻き付いた繊維へと組織化され、ヘリックスターン内部における、水平方向へのβシートの拡張及びヘリックスターンを隔てた、長手方向のジスルフィド架橋により一体に保持さる。線毛アセンブリー内の、共有結合的架橋は、グラム陽性菌線毛内において見られた、ソルターゼ媒介型イソペプチド結合の形成について公知である(Ton-That及びSchneewind、2004)。Ena内において、架橋は、サブユニットiのN末端接続部内の、保存されたCys-Cysモチーフの、ヘリックス構造内の位置である、i-9及びi-10に配置された、Enaサブユニットのコアドメイン内の、2つの単一のCys残基へのジスルフィド結合を介して生じる。このように、N末端接続部は、ヘリックスターンを隔てた、共有結合的架橋のほか、先行ヘリックスターン内の、2つの隣接するサブユニット(すなわち、i-9及びi-10)との分岐的相互作用を形成する。N末端接続部又はN末端伸長部の使用はまた、シャペロン-アッシャー型線毛及びバクテロイデス属(bacteroides)V型線毛においても見られるが、これらのシステムは、非共有結合的フォールド補完機構を援用して、長寿命のサブユニット-サブユニット間接触を達成し、共有結合的安定化を欠く(Sauerら、1999;Xuら、2016)。Enaにおいて、N末端接続部は、可撓性リンカーを介して、Enaコアドメインへと接合されるため、Ena繊維内のヘリックスターンは、大きな旋回自由度及び長手方向の伸縮を受ける能力を有する。これらの相互作用は、高度に化学的に安定であるが、可撓度の大きな繊維を結果としてもたらす。Enaの伸縮性及び曲がりやすさが、機能的に重要であるのかどうかは、未だ不明である。いくつかのシャペロン-アッシャー型線毛内において、線毛のヘリックスの巻き戻し及び巻き取りによりもたらされる、可逆性バネ様伸縮が、接着性細菌に対して及ぼされた、せん断応力及び引っ張り応力への耐性に重要であることが見出されたことが注目される(Millerら、2006;Fallmanら、2005)。おそらく、Enaにおいて見られた、長手方向の伸縮は、同様の役割を果たしうる。
[実施例6]Ena1における、S型Enaのためのコード領域
B.セレウスNVH 0075/95株において、Ena1A、Ena1B及びEna1Cは、上流において、dedA(genbank受託番号:KMP91696.1)と、機能が未知である、93残基のタンパク質をコードする遺伝子(DUF1232、genbank受託番号:KMP91696.1)とにより挟まれたゲノム領域内においてコードされる(図4A)。下流において、Ena遺伝子クラスターは、酸性ホスファターゼをコードする遺伝子に隣接する。Ena遺伝子クラスター内において、それぞれ、Ena1A及びEna1Bは、フォワードの配向性において見出され、Ena1Cは、リバースの配向性において見出される(図4A)。それぞれ、栄養増殖細胞及び芽胞形成細胞を表す、培養の4及び16時間後単離されたmRNAから作られた、NVH 0075/95株cDNAについてのPCR解析は、Ena1A及びEna1Bが、栄養増殖時ではなく、芽胞形成時において、バイシストロニックの転写物から、共発現されることを指し示した(図4B)。栄養細胞内において、フォワードプライマーが、Ena1Aの上流のdedA内に配置され、リバースプライマーが、Ena1B内に配置された場合に、弱い増幅シグナルが観察された(図4B、レーン2)ことは、一部のEnaA及びEnaBが、dedAと共発現されることを示唆する。これは、栄養細胞内において、又は芽胞形成の極早期において観察されたが、芽胞形成の後期段階において観察されず、不適正に終結したdedA mRNAの画分を表しうる。定量リアルタイムPCR解析は、芽胞形成細胞内における、Ena1A、Ena1B及びEna1Cの発現の、栄養細胞内と比較した増大を示した(図4B)。
B.セレウスNVH 0075/95株において、Ena1A、Ena1B及びEna1Cは、上流において、dedA(genbank受託番号:KMP91696.1)と、機能が未知である、93残基のタンパク質をコードする遺伝子(DUF1232、genbank受託番号:KMP91696.1)とにより挟まれたゲノム領域内においてコードされる(図4A)。下流において、Ena遺伝子クラスターは、酸性ホスファターゼをコードする遺伝子に隣接する。Ena遺伝子クラスター内において、それぞれ、Ena1A及びEna1Bは、フォワードの配向性において見出され、Ena1Cは、リバースの配向性において見出される(図4A)。それぞれ、栄養増殖細胞及び芽胞形成細胞を表す、培養の4及び16時間後単離されたmRNAから作られた、NVH 0075/95株cDNAについてのPCR解析は、Ena1A及びEna1Bが、栄養増殖時ではなく、芽胞形成時において、バイシストロニックの転写物から、共発現されることを指し示した(図4B)。栄養細胞内において、フォワードプライマーが、Ena1Aの上流のdedA内に配置され、リバースプライマーが、Ena1B内に配置された場合に、弱い増幅シグナルが観察された(図4B、レーン2)ことは、一部のEnaA及びEnaBが、dedAと共発現されることを示唆する。これは、栄養細胞内において、又は芽胞形成の極早期において観察されたが、芽胞形成の後期段階において観察されず、不適正に終結したdedA mRNAの画分を表しうる。定量リアルタイムPCR解析は、芽胞形成細胞内における、Ena1A、Ena1B及びEna1Cの発現の、栄養細胞内と比較した増大を示した(図4B)。
本発明者らの知る限りにおいて、典型的なEnaフィラメントが、B.セレウス栄養細胞の表面において観察されていないことは、それらが、芽胞特異的構造であることを指し示す。NVH 0075/95株のqRT-PCR解析が、芽胞形成時における、Ena1A-Ena1C転写物の、栄養細胞と比較した増大を裏付けたことは、この仮定を支持する。かつて、B.チューリンギエンシス・キネンシス血清型CT-43株(B.thuringiensis serovar chinensis CT-43)について、転写解析が実施され、接種の7時間後、9時間後、13時間後(細胞のうちの30%が、芽胞形成を受ける)及び22時間後における転写を決定した(Wangら、2013)。後者株の発現が、遺伝子1つ当たりのリード数を、RPKM(Reads Per Kilo bases per Million reads)へと転換することにより正規化され、DEGseqソフトウェアパッケージにより解析されるのに対し、本実験は、Ena遺伝子の発現レベルを、ハウスキーピング遺伝子である、rpoBと比べて決定するので、B.セレウスNVH 0075/95株内の、Ena1A、Ena1B及びEna1Cの発現レベルを、B.チューリンギエンシス・キネンシス血清型CT-43株内の、Ena2A-Ena2C(CT43_CH0783~785)の発現レベルと、直接比較することは困難である。しかし、いずれの実験も、EnaA及びEnaBが、芽胞形成時に限り転写されることを指し示す。公表されたトランスクリプトームプロファイリングデータの個別のセットを検索することにより、本発明者らは、B.アントラーキス(B.antracis)芽胞に由来するEnaは、かつて、報告されていないが、Ena2A-Ena2Cはまた、芽胞形成時において、B.アントラーキス内においても発現されることを見出した(Bergmanら、2006)。
エクスビボにおけるS型Enaについての、cryoEMマップ及び免疫金TEM解析は、これらが、Ena1A及びEna1Bの両方を含有することを指し示した(図9B~9D)。Ena1サブユニットの、B.セレウスのEnaへの相対的寄与を決定するために、本発明者らは、Ena1A、Ena1Bのほか、Ena1Cに対して、個別の染色体ノックアウトを行い、TEMにより、それらのそれぞれの芽胞について探索した。全てのEna1突然変異体は、野生型と同様の寸法及び無傷の外膜を伴う芽胞をもたらした(図5A、図11)。Ena1A突然変異体及びEna1B突然変異体のいずれも、S型Enaを完全に欠く芽胞を結果としてもたらし、エクスビボにおける繊維の混合含量と一致した。Ena1C突然変異体もまた、芽胞上におけるS型Enaの喪失を結果としてもたらした(図5A)が、抗Ena1C血清による染色は、S型Ena内部のタンパク質の存在を同定しなかった(図9D)。3つの突然変異体全ては、やはり、サイズ及び数密度が野生型芽胞と同様である、L型Enaの存在を示したが、統計学的解析は、L型Enaが、Ena1B突然変異体及びEna1C突然変異体において、長さを、わずかに増大させることを除外しない(長さについて、それぞれ、p=0.003及びp<0.0001)(図5B)。こうして、Ena1A、Ena1B及びEna1Cは、インビボにおけるS型Enaアセンブリーのために、相互的に要求されるが、L型Enaアセンブリーのためには相互的に要求されない。Ena1B突然変異体の、Ena1A-Ena1Bを含有する、低コピープラスミド(pMAD-I-SceI)による補完は、S型Enaの発現を回復させた。これらのサブユニットの、プラスミドベースの発現は、芽胞1個当たりのS型Enaの数の、平均約2倍の増大及びEna長の劇的な増大を結果としてもたらし、Ena長は、今や、数ミクロンに達した(図5A、5B、図11D)。こうして、S型Enaの数及び長さは、利用可能なEna1Aサブユニット及びEna1Bサブユニットの濃度に依存する。注目すべきことに、Ena1A及びEna1Bを過剰発現させる、いくつかの芽胞は、外膜を欠くと考えられた、又はS型Enaの、外膜内部への取込みを示した(図11C、11D)。これは、S型Enaが、芽胞体から発生し、Ena発現の、濃度又はタイミングの不均衡が、芽胞表面構造のミスアセンブリー及び/又は非局在化を結果としてもたらしうることを裏付ける。S型Enaと対照的に、野生型芽胞及び突然変異体芽胞についての精査は、L型Enaが、芽胞体ではなく、外膜の表面から発生することを示唆する。本実験において、L型Enaの分子同一性又はL型Ena及びS型Enaのそれぞれにおいて見られた、単一末端若しくは複数末端のラッフル膜は、確認されなかった。
[実施例7]Ena1A-Ena1C遺伝子の系統発生的分布
B.セレウスs.l.群及び他の関連のあるバチルス属種内における、Ena1A-Ena1Cの発生について探索するために、クローズドゲノムを欠いている種についてのスキャフォールドを付加した、全ての、キュレーションされ、利用可能である、バチルス属種のクローズドゲノムを含有するデータベースに対して、Ena1A-Ena1Cのホモログについての、対応のあるtBLASTn検索を実施した(n=735)。B.セレウスNVH 0075/95株のEna1ABのうち、カバレッジ(>90%)及びアミノ酸シーケンシング類似性(>80%)が大きなホモログは、解析された、B.セレウス株85株中11株、B.ヴィートマニイ(B.wiedmannii)株119株中13株、B.シトトキシクス株14株中14株、B.ルティー(B.luti)(100%)株1株中1株、B.モビリス(B.mobilis)株6株中3株、B.ミコイデス株33株中3株、B.トロピクス(B.tropics)株1株中1株及び両方のB.パラントラーキス(B.paranthracis)株を含む48株において見出された。これらの株のうち、31株だけはまた、B.セレウスNVH 0075/95株のEna1Cに対する配列同一性及びカバレッジの大きなホモログをコードする遺伝子も保有した(図6)。探索された、全てのB.シトトキシクスゲノム(14株中14株)は、仮説的なEna1Aタンパク質及びEna1Bタンパク質をコードしたが、14株中12株だけは、B.セレウスNVH 0075-95株のEna1Cと比較して、中程度のアミノ酸保存だけを示す、Ena1Cオーソログをコードした(平均値のアミノ酸配列同一性:63.9%)(図6、図11)。
B.セレウスs.l.群及び他の関連のあるバチルス属種内における、Ena1A-Ena1Cの発生について探索するために、クローズドゲノムを欠いている種についてのスキャフォールドを付加した、全ての、キュレーションされ、利用可能である、バチルス属種のクローズドゲノムを含有するデータベースに対して、Ena1A-Ena1Cのホモログについての、対応のあるtBLASTn検索を実施した(n=735)。B.セレウスNVH 0075/95株のEna1ABのうち、カバレッジ(>90%)及びアミノ酸シーケンシング類似性(>80%)が大きなホモログは、解析された、B.セレウス株85株中11株、B.ヴィートマニイ(B.wiedmannii)株119株中13株、B.シトトキシクス株14株中14株、B.ルティー(B.luti)(100%)株1株中1株、B.モビリス(B.mobilis)株6株中3株、B.ミコイデス株33株中3株、B.トロピクス(B.tropics)株1株中1株及び両方のB.パラントラーキス(B.paranthracis)株を含む48株において見出された。これらの株のうち、31株だけはまた、B.セレウスNVH 0075/95株のEna1Cに対する配列同一性及びカバレッジの大きなホモログをコードする遺伝子も保有した(図6)。探索された、全てのB.シトトキシクスゲノム(14株中14株)は、仮説的なEna1Aタンパク質及びEna1Bタンパク質をコードしたが、14株中12株だけは、B.セレウスNVH 0075-95株のEna1Cと比較して、中程度のアミノ酸保存だけを示す、Ena1Cオーソログをコードした(平均値のアミノ酸配列同一性:63.9%)(図6、図11)。
B.セレウス群ゲノム内の、Ena1A-Ena1Cのホモログについて検索したところ、仮説的なEnaA-EnaCタンパク質をコードする、オーソログの候補遺伝子クラスターが発見された。これら3つのタンパク質は、それぞれ、B.セレウスNVH 0075-95株の、Ena1A、Ena1B及びEna1Cとの、59.3±0.9%、43.3±1.6%及び53.9±2.2%の平均アミノ酸配列同一性を有し、遺伝子シンテニーを共有した(図6B)。オーソログのEna遺伝子クラスターは、Ena2A-Ena2Cと名付けられた。B.スブティリス(n=127)及びB.シュードミコイデス(B.pseudomycoides)(n=8)を除き、解析された、全てのゲノム(n=735)は、Ena1(n=48)又はEna2(n=476)の遺伝子クラスターを保有した。Ena1A-Ena1C又はEna2A-Ena2Cは、同時に存在せず、解析されたゲノムの間において、キメラのEna1A-Ena1C/Ena2A-Ena2Cクラスターは、発見されなかった(図6)。Ena1A-Ena1Cと、Ena2A-Ena2Cとの間における、タンパク質系統樹内の、大きな分割に加えて、Ena1A配列、Ena1B配列の間において、とりわけ、Ena1C配列の間において、顕著に異なるサブクラスターが見られた(図11)。Ena1A配列は、2つの主要なサブクラスターへと分けられた:1つのサブクラスターは、B.シトトキシクス株のうちの大部分において存在し、別のサブクラスターは、B.ヴィートマニイ株及びB.セレウス株において見出された(図11A)。EnaBタンパク質について、より大きな変動が明らかとなった:Ena1B配列は、2つのクラスターを形成し;1つのクラスターは、B.セレウス分離株及びB.ヴィートマニイ分離株を含有し、他のクラスターは、B.シトトキシクスを伴った(図11)。また、Ena2Bタンパク質の、個別のサブクラスターも見られ(図11)、Ena2BとEna1Bの残部と、それぞれ約78%及び約48%の配列同一性を共有した、B.ミコイデス、B.セレウス、B.チューリンギエンシス、B.パシフィクス(B.pacificus)及びB.ヴィートマニイの分離株を含有する。EnaCは、3つのタンパク質のうちにおいて、最も可変的であった:Ena1Cは、B.ヴィートマニイ、B.セレウス、B.アントラーキス、B.パラントラーキス、B.モビリス、B.トロピクス(B.tropicus)及びB.ルティーの分離株を含有する、単一系統クレードを形成したが、種内、Ena2AB保有株内のほか、Ena1AB保有株のサブセット内においても、大幅な配列変動を有した。
B.セレウス群株の間において、Ena1A-Ena1C遺伝子より、Ena2A-Ena2Cのホモログ又はオーソログが、はるかにより一般的であり;探索された、B.トヨネンシス(B.toyonensis)(n=204)、B.アルブス(B.albus)(n=1)、B.ボムビセプティクス(B.bombysepticus)(n=1)、B.ニトラティレデュケンス(B.nitratireducens)(n=6)、B.チューリンギエンシス(n=50)の全てのゲノム及びB.セレウス(87%、85株中74株)、B.ヴィートマニイ(119株中105株、89.3%)、B.トロピクス(71%、7株中5株)及びB.ミコイデス(91%、33株中30株)のうちの大部分は、タンパク質のEna2A-Ena2C形態を有した(図6)。誤分類された、ストレプトコッカス・ニューモニエ(Streptococcus pneumoniae)の、3つのゲノム(GCA_001161325、GCA_001170885、GCA_001338635)及び誤分類された、B.スブティリスの1つのゲノム(GCA_004328845)を除き、B.スブティリス(n=127)若しくはB.シュードミコイデス(n=8)のゲノム又はB.セレウス群以外の、他の任意のゲノム内に、Enaオーソログは、見出されなかった。これらのゲノム及びB.スブティリスは、分類学的分類のための、3つの異なる方法(Masthree、7-lociMLST及びKraken;「方法」節を参照されたい)により再解析したところ、B.セレウスとして再分類された。少数のパエニバチルス属(Peanibacillus spp.)種株のゲノムは、Ena1A-Ena1Cに対するアミノ酸配列類似性が低レベルである、仮説的タンパク質をコードする遺伝子を有したが、コーネラ・アビエティス(Cohnella abietis)株(GCF_004295585.1)のゲノムにおいて、Ena1A及びEna1Bと、ある程度類似する、仮説的タンパク質をコードする遺伝子もまた見出された。バチルス属以外のこれらのヒットは、アネロミクロビウム属(Anaeromicrobium)、コーネラ属(Cochnella)において見出された、これらの遺伝子及びバチルス綱(Bacillales)のDUF3992ドメイン内におけるヒットであった。
少数のゲノムは、それらの種の他の株と比較して、Ena遺伝子クラスター内において、偏差を有した。B.ミコイデス株3株中2株(GCF_007673655及びGCF_007677835.1)は、Ena1A-Ena1Bオペロンの下流において、Ena1C対立遺伝子を欠いた(データは示さない)。しかし、B.セレウスNVH 0075/95株のEna1Cに対する、50%の同一性を有する仮説的タンパク質をコードする、潜在的Ena1Cオーソログが、それらのゲノム内の、他の箇所において見出された。B.セレウス(Rock3-44株によるアセンブリー:GCA_000161255.1)としてアノテーションされ、B.ミコイデス(図6)のこれらの株と共に群分けされ、B.チューリンギエンシスと共に、それらのEna1A-Ena1C分布パターンを共有した、1つのゲノムは、通例、Ena2遺伝子を保有するが、B.チューリンギエンシス(LM1212株;GCF_003546665)としてアノテーションされたゲノムは、全てのEna遺伝子を欠いた。この株は、B.トロピクスの参照株と、ほぼ同一であり、これもまた、両方のEna遺伝子クラスターを欠いた。
本発明者らによる、S型繊維についての系統発生解析は、機能が未知のドメインである、DUF3992を包摂する、保存されたタンパク質ファミリーに属するEnaサブユニットを明らかにする。
[実施例8]インビボにおける、タグ非含有のEna1A又はEna1Bによる、S型繊維の組換え作製
Ena1A(WP_000742049.1)及びEna1B(WP_000526007.1)の野生型配列を、E.コリについてコドン最適化し、Twist Bioscience製の合成遺伝子として注文し、pET28aベクター内に、さらにサブクローニングした(NcoI-XhoI)。得られたプラスミド(pET28a_Ena1A;pET28a_Ena1B)を使用して、C43(DE3)株のコンピテント細胞を形質転換した。単一のコロニーを使用して、一晩にわたる(ON)、LBによる培養を開始した。10mlの一晩培養物を使用して、37Cにおける、1lのLB、25mg/mlのカナマイシンに接種した。組換え発現は、OD600を、0.8として、1mMのIPTGを添加することにより誘導し、培養物を、放置して一晩にわたりインキュベートした。4000gにおいて、15分間にわたる遠心分離により、細胞をペレット化させた。細胞ペレットを、1倍濃度のPBS、1mg/mlのリゾチーム、1mMのAEBSF、50μMのロイペプチン、1mMのEDTA中に再懸濁させ、十分な攪拌下、室温において、30分間にわたりインキュベートし、この後、DNアーゼ及びMgCl2を、それぞれ、10μg/ml及び10mMの最終濃度まで添加し、さらに、30分間にわたりインキュベートした。遠心分離(15分間、4000g)を介して、細胞破砕物をペレット化させた。上清を、注意深く除去し、20.000rpmにおいて、50分間にわたり、遠心分離した。上清を廃棄し、ペレットを、懸濁液(1倍濃度のPBS)へと戻した。結果として得られた懸濁液を、miliQ中5倍に希釈し、フォルムバール/カーボングリッド(Cu製の400メッシュ;Electron Microscopy Sciences)上に沈着させ、2%(w/v)の酢酸ウラニルを使用して染色した。TEM解析は、直径を10~11nmとする、マイクロメートル単位の長さの繊維の存在を明らかにした。枠付けされた繊維セグメントについての二次元クラス分け像を観察し、図12に示された繊維のS型性を確認する。
Ena1A(WP_000742049.1)及びEna1B(WP_000526007.1)の野生型配列を、E.コリについてコドン最適化し、Twist Bioscience製の合成遺伝子として注文し、pET28aベクター内に、さらにサブクローニングした(NcoI-XhoI)。得られたプラスミド(pET28a_Ena1A;pET28a_Ena1B)を使用して、C43(DE3)株のコンピテント細胞を形質転換した。単一のコロニーを使用して、一晩にわたる(ON)、LBによる培養を開始した。10mlの一晩培養物を使用して、37Cにおける、1lのLB、25mg/mlのカナマイシンに接種した。組換え発現は、OD600を、0.8として、1mMのIPTGを添加することにより誘導し、培養物を、放置して一晩にわたりインキュベートした。4000gにおいて、15分間にわたる遠心分離により、細胞をペレット化させた。細胞ペレットを、1倍濃度のPBS、1mg/mlのリゾチーム、1mMのAEBSF、50μMのロイペプチン、1mMのEDTA中に再懸濁させ、十分な攪拌下、室温において、30分間にわたりインキュベートし、この後、DNアーゼ及びMgCl2を、それぞれ、10μg/ml及び10mMの最終濃度まで添加し、さらに、30分間にわたりインキュベートした。遠心分離(15分間、4000g)を介して、細胞破砕物をペレット化させた。上清を、注意深く除去し、20.000rpmにおいて、50分間にわたり、遠心分離した。上清を廃棄し、ペレットを、懸濁液(1倍濃度のPBS)へと戻した。結果として得られた懸濁液を、miliQ中5倍に希釈し、フォルムバール/カーボングリッド(Cu製の400メッシュ;Electron Microscopy Sciences)上に沈着させ、2%(w/v)の酢酸ウラニルを使用して染色した。TEM解析は、直径を10~11nmとする、マイクロメートル単位の長さの繊維の存在を明らかにした。枠付けされた繊維セグメントについての二次元クラス分け像を観察し、図12に示された繊維のS型性を確認する。
[実施例9]Enaタンパク質の生物学的役割:見通し
Enaの機能についての知見を伴わない限り、本発明者らは、それらの生物学的役割について推測できるに過ぎない。B.セレウス群種のEnaは、グラム陰性栄養細菌内及びグラム陽性栄養細菌内の、生体表面(他の細菌を含む)及び非生体表面への接着、収縮運動、バイオフィルムの形成、DNAの取込み(天然のコンピテンス)及び交換(コンジュゲーション)、エクソプロテインの分泌、電子移動(ゲオバクター属(Geobacter))並びにバクテリオファージへの感受性(Lukaszczykら、2019;Proft及びBaker、2009)において役割を果たす線毛に相似する。一部の細菌は、異なる機能を果たす、複数種類の線毛を発現させる。線毛繊維の、最も一般的な機能は、金属、ガラス、プラスチックロックから、植物、動物又はヒトの組織にわたる、多様な範囲の表面への接着である。病原性細菌において、線毛は、宿主組織のコロニー形成において、枢要的役割を果たし、重要な毒力決定因子として機能することが多い。同様に、C.スポロゲネス(C.sporogenes)芽胞の表面において発現された付属物は、培養された線維芽細胞への、それらの接合を容易とすることが示されている(Panessa-Warrenら、2007)。しかし、Enaは、それらが、芽胞の代謝的休眠状態において生じる可能性が低い、エネルギー要求過程であるので、能動的運動性又はDNA若しくはタンパク質の取込み/輸送に関与する可能性が低い。Enaは、強力な潜在的病原可能性を伴う、近縁のバチルス属種の群である、B.セレウス群(図6)に属する株の芽胞の間における、広範な特徴であると考えられる(Ehling-Schulzら、2019)。大半のB.セレウス群種について、芽胞を伴う、摂取、吸入又は創傷の汚染は、感染及び疾患発症の一次経路を形成する。Enaは、細胞表面の大半を覆うので、芽胞環境との重要な接触領域を形成することが合理的に予測され、B.セレウス種の播種及び毒力において、役割を果たすことが推測されうる。本発明者らによる系統発生解析は、病原性バチルス属における、Enaの広範な発生及び芽胞について実験するための、一次モデルシステムとして機能してきた、土壌中棲息種であり、かつ、消化器片利共生生物である、バチルス・スブティリス(Bacillus subtilis)などの非病原性種における、顕著な非存在を示す。Ankolekarらは、B.セレウスの47の食物分離株の全てが、付属物を伴う芽胞を産生することを示した(Ankolekar及びLabbe、2010)。付属物はまた、B.セレウスと近縁であり、その殺虫活性について最も良く知られた(Ankolekar及びLabbe、2010)、バチルス・チューリンギエンシスの、食物媒介型腸毒性分離株12株中10株の芽胞上においても見出された。
Enaの機能についての知見を伴わない限り、本発明者らは、それらの生物学的役割について推測できるに過ぎない。B.セレウス群種のEnaは、グラム陰性栄養細菌内及びグラム陽性栄養細菌内の、生体表面(他の細菌を含む)及び非生体表面への接着、収縮運動、バイオフィルムの形成、DNAの取込み(天然のコンピテンス)及び交換(コンジュゲーション)、エクソプロテインの分泌、電子移動(ゲオバクター属(Geobacter))並びにバクテリオファージへの感受性(Lukaszczykら、2019;Proft及びBaker、2009)において役割を果たす線毛に相似する。一部の細菌は、異なる機能を果たす、複数種類の線毛を発現させる。線毛繊維の、最も一般的な機能は、金属、ガラス、プラスチックロックから、植物、動物又はヒトの組織にわたる、多様な範囲の表面への接着である。病原性細菌において、線毛は、宿主組織のコロニー形成において、枢要的役割を果たし、重要な毒力決定因子として機能することが多い。同様に、C.スポロゲネス(C.sporogenes)芽胞の表面において発現された付属物は、培養された線維芽細胞への、それらの接合を容易とすることが示されている(Panessa-Warrenら、2007)。しかし、Enaは、それらが、芽胞の代謝的休眠状態において生じる可能性が低い、エネルギー要求過程であるので、能動的運動性又はDNA若しくはタンパク質の取込み/輸送に関与する可能性が低い。Enaは、強力な潜在的病原可能性を伴う、近縁のバチルス属種の群である、B.セレウス群(図6)に属する株の芽胞の間における、広範な特徴であると考えられる(Ehling-Schulzら、2019)。大半のB.セレウス群種について、芽胞を伴う、摂取、吸入又は創傷の汚染は、感染及び疾患発症の一次経路を形成する。Enaは、細胞表面の大半を覆うので、芽胞環境との重要な接触領域を形成することが合理的に予測され、B.セレウス種の播種及び毒力において、役割を果たすことが推測されうる。本発明者らによる系統発生解析は、病原性バチルス属における、Enaの広範な発生及び芽胞について実験するための、一次モデルシステムとして機能してきた、土壌中棲息種であり、かつ、消化器片利共生生物である、バチルス・スブティリス(Bacillus subtilis)などの非病原性種における、顕著な非存在を示す。Ankolekarらは、B.セレウスの47の食物分離株の全てが、付属物を伴う芽胞を産生することを示した(Ankolekar及びLabbe、2010)。付属物はまた、B.セレウスと近縁であり、その殺虫活性について最も良く知られた(Ankolekar及びLabbe、2010)、バチルス・チューリンギエンシスの、食物媒介型腸毒性分離株12株中10株の芽胞上においても見出された。
エクスビボにおける繊維についての、cryo-EM画像は、S型Ena及びL型Enaの末端における、幅2~3nmの繊維(ラッフル膜)を示した。ラッフル膜は、エンテロバクター科(Enterobacteriaceae)の、多くのグラム陰性菌において見られた、P型線毛及び1型線毛の原線維先端部に相似する(Proft及びBaker、2009)。グラム陰性線毛フィラメントにおいて、原線維先端部は、粘膜表面上の受容体との相互作用を増強するように、柔軟な局在化を伴う、接着タンパク質をもたらす(Mulveyら、1998)。インビトロにおいてアセンブルされた繊維上において、ラッフル膜と類似するフィラメントが観察されなかったことは、それらの形成が、Ena1Aサブユニット又はEna1Bサブユニットを超える、さらなる構成要素を要求することを示唆する。
本発明者らは、病原性バチルス属において広範に見られた、芽胞会合付属物又は芽胞会合線毛の新規のクラスの分子の同定を提示する。将来の分子実験及び感染実験は、芽胞媒介型病原性バチルス属の毒力において、Enaが、役割を果たすのかどうか、及びどのように役割を果たすのかを決定することを必要とする。本作業において提示された、Enaの遺伝子同一性及び構造的側面についての発見の進展は、いよいよ、インビトロにおける分子実験及びインビボにおける分子実験が、それらの生物学的役割を引き出し、異なるバチルス属種の間における、Enaの異種性についての基礎に対する洞察を得ることを可能とする。
[実施例10]Ena薄膜の調製
インセルロにおいて組換えにより作製された、Ena1BのS型繊維を単離した後、Ena1B原液を、miliQ中において、100mg×mL-1又は25mg×mL-1の最終濃度へと希釈することにより、Ena1B S型繊維の懸濁液を調製した。このEna1B懸濁液50μlを、シリコン処理カバースリップへと、直径を18mmとしてドロップキャストし、60℃において、1時間にわたりインキュベートした。結果として得られる薄膜を、そのまま使用した(図21a)、又はイメージングのために、カバースリップから剥がした(図21b~21c)。いずれの出発濃度のEna1B S型溶液も、厚さを、それぞれ、約21μm(図21c)及び3.7μmとする、フリースタンディングの半透明薄膜をもたらした。
インセルロにおいて組換えにより作製された、Ena1BのS型繊維を単離した後、Ena1B原液を、miliQ中において、100mg×mL-1又は25mg×mL-1の最終濃度へと希釈することにより、Ena1B S型繊維の懸濁液を調製した。このEna1B懸濁液50μlを、シリコン処理カバースリップへと、直径を18mmとしてドロップキャストし、60℃において、1時間にわたりインキュベートした。結果として得られる薄膜を、そのまま使用した(図21a)、又はイメージングのために、カバースリップから剥がした(図21b~21c)。いずれの出発濃度のEna1B S型溶液も、厚さを、それぞれ、約21μm(図21c)及び3.7μmとする、フリースタンディングの半透明薄膜をもたらした。
[実施例11]Enaのソフトハイドロゲル及び強化ハイドロゲルの調製
ENAハイドロゲルの調製:100mg×mL-1のEna1B S型繊維懸濁液50μlを、シリコン処理カバースリップへとピペッティングし、22℃において、1時間にわたり通気乾燥させた(図22a)。次に、50μlのmiliQを、乾燥した薄膜へとピペッティングし、22℃において、5分間にわたり放置して、再水和させる(図22b)結果として、薄膜の顕著な再膨潤をもたらした。次いで、マイクロピペットを使用して、過剰量の液体を除去し、結果として得られたEna1Bハイドロゲルを明らかにした(図22c)が、これは、図22dに例示されたフリースタンディングのハイドロゲルであった。
ENAハイドロゲルの調製:100mg×mL-1のEna1B S型繊維懸濁液50μlを、シリコン処理カバースリップへとピペッティングし、22℃において、1時間にわたり通気乾燥させた(図22a)。次に、50μlのmiliQを、乾燥した薄膜へとピペッティングし、22℃において、5分間にわたり放置して、再水和させる(図22b)結果として、薄膜の顕著な再膨潤をもたらした。次いで、マイクロピペットを使用して、過剰量の液体を除去し、結果として得られたEna1Bハイドロゲルを明らかにした(図22c)が、これは、図22dに例示されたフリースタンディングのハイドロゲルであった。
強化Enaハイドロゲルの調製:100mg×mL-1のEna1B S型繊維の懸濁液の液滴20μlを、4MのMgCl2、5MのNaCl又は100%(v/v)の絶対エタノールへと滴下し、22℃において、1時間にわたりインキュベートした。インキュベーション時間において、ENA液滴の高粘性は、繊維懸濁液の、選び出された溶液との混合を阻止し、液滴の形状を、効果的に安定化させる。水分活性が大きな塩溶液又はエタノール溶液は、ENA液滴の漸進的脱水をもたらす結果として、稠密なENAハイドロゲルの形成をもたらす。塩又はエタノールを除去するために、ENAハイドロゲルビーズを、1mLのmiliQへと、3回にわたり移し、22℃において、24時間にわたり通気乾燥させた(図23)。MgCl2中又はNaCl中のインキュベーションから結果として得られた、ENAハイドロゲルビーズが、不透明であったのに対し、エタノール中のインキュベーションは、安定的な、半透明の構造をもたらす。
[実施例12]組換えにより作製されたEna3Aは、L型繊維へと自己アセンブルする
B.セレウスNM0095-75株から導出された、Ena四重ノックアウト株(ΔEna1A-Ena1B-Ena1C-Ena3A)に由来する成熟芽胞は、任意の芽胞付属物の完全な非存在(図25c)を明らかにしたが、この突然変異体を、Ena3A配列(配列番号49)を含むpENA3Aにより形質転換すると、L型繊維の表現型レスキューが、芽胞表面上において生じた(図25d~25e)。
B.セレウスNM0095-75株から導出された、Ena四重ノックアウト株(ΔEna1A-Ena1B-Ena1C-Ena3A)に由来する成熟芽胞は、任意の芽胞付属物の完全な非存在(図25c)を明らかにしたが、この突然変異体を、Ena3A配列(配列番号49)を含むpENA3Aにより形質転換すると、L型繊維の表現型レスキューが、芽胞表面上において生じた(図25d~25e)。
したがって、バチルス属芽胞上において、L型Ena繊維を形成するのに、必須かつ十分な、Enaタンパク質ファミリーのさらなるメンバーとしての、Ena3Aの同定に基づき、blastによる検索及び系統発生解析を実施して、バチルス・セレウスEna3Aの候補オーソログ(配列番号49において提示された)をもたらした。同定されたホモログ(配列番号50~80)の、複数の配列アライメントを、図19に示し、DUF3992ドメインを含む、全ての配列のほかに、保存されたN末端接続部領域は、Ena3についてもまた存在することを裏付ける。
代表的ファミリーメンバーとして、配列番号49において提示されたEna3Aタンパク質を、組換え発現させたところ、本明細書においてまた、「recEna3A」とも呼ばれ、ヘリックスツイストを、18.4度とし、ライズを、44.9Åとし、直径を、75Åとする、螺旋状の7始点ラダー様(L型)繊維をもたらすことが示された。L型繊維は、7つのN末端接続部を介して共有結合的に接続されたEna3A 7量体リングの垂直方向の積み重ねから構築される。図24に示された通り、各サブユニットのBIDGシートの鎖Gは、各7量体リングユニット内の、隣接するサブユニットの、CHEFによるβシートの鎖Cにより拡張される。サブユニットは、サブユニットiのCCys21と、サブユニットi+1のCys81との間のジスルフィド結合及びサブユニットiのCys13と、サブユニットi+1のCys14との間のジスルフィド結合を介して、各リング内において、共有結合的に架橋される。リング間架橋は、隣接するリング内の、Cys8位(i)において、サブユニットjのCys20位とのジスルフィド結合を形成する、N末端接続部(Ntc)を介して確立される。
短いL型Ena3繊維の、インビトロにおける組換え作製は、立体障害型Ena3Aの発現、Ena3A多量体の精製に続く、TEVプロテアーゼとの共インキュベーションの後における、L型繊維のアセンブリー(図25a;Ena1Bについて記載された方法を使用する)により得られた。代替的に、E.コリにおける、立体障害を伴わない、Ena3Aの組換え発現は、「インセルロ」(本明細書においてまた、「インビボ」とも呼ばれた)の、細胞質内における、長いL型繊維のアセンブリーに続く、細胞培養物からの、繊維の単離(図25b;本明細書において記載された方法を使用する)を結果としてもたらした。
したがって、バチルス・セレウスATCC_10987株の、Ena3A L型繊維サブユニット(WP_017562367.1;配列番号49)のcryoEM構造は、図26(左パネル)に示された通り、繊維内の水平方向の接触及び長手方向の接触を実証するように、ちょうど3つのサブユニットを示すcryo-EMモデルをもたらす。Enaサブユニットは、BIDG-CHEFトポロジーを伴う、8本のβ鎖によるβサンドウィッチフォールドのほか、Ntcと称され、繊維内の長手方向の共有結合的接触の一因をなす、N末端伸長ペプチドにより規定される(図19)。このフォールドを、図19に提示されたホモログと、構造的に比較するために、選択されたEna3Aホモログである、WP_049681018.1(配列番号60)及びWP_100527630.1(配列番号75)について、AlphaFold v2.0を使用して予測された構造をマッチさせた。各構造について、各構造のCα原子iと、参照構造(Ena3AについてのcryoEMモデル:WP_017562367.1;配列番号49)の対応する原子Cαと間の、原子位置についての平均二乗偏差(RMSD)のほか、フォールド類似性スコア、すなわち、DaliによるZスコアについて解析した。(n/10)-4[式中、nは、配列長である。]より高値のZスコアは、高度に著しいフォールド類似性に対応すると考えられる(10.1093/bioinformatics/btn507)。n=116のとき、これは、Z=7.6に対応する。基準として、本発明者らはまた、本発明者らの参照構造であるEna3A(WP_017562367.1)についての、AlphaFoldモデルも提示するが、これは、実験によるcryoEM構造と、AlphaFoldモデルとの極めて良好な一致(RMSD=1.05;Z=12.1)を裏付ける。これらの予測は、本発明者らの参照配列に対する61%(WP_100527630.1)という低値の配列同一性を有するDUF3992配列が、Ntcが存在する同じEnaフォールドを取りうることを示す。
こうして、Ena3Aサブユニットは、DUF3992の分類を結果としてもたらす、HMMプロファイル検索に続く、デノボの構造予測及びEna3Aについて、本明細書において開示された、cryoEM構造との比較に基づき、明確に同定されうる。自己アセンブルEnaサブユニットは、Ena3A(配列番号49)に照らした、DaliによるZスコアが6.5以上である8本の鎖による、Enaベータサンドウィッチフォールドを含有し、Ena繊維内のジスルフィド媒介架橋のためのZ-N-C(C)-M-C-Xモチーフを伴うN末端接続部ペプチド[配列中、ZはLeu、Ile、Val又はPheであり、Nは1又は2残基であり、CはCysであり、Mは10~12アミノ酸であり、Xは任意のアミノ酸である。]を含有する。候補Enaサブユニットの自己アセンブリー及び繊維形成は、本明細書の「材料及び方法」において記載される通り、単離された繊維材料の、E.コリの細胞質内の組換え発現及び陰性染色透過電子視覚化によりなされる。
[実施例13]インビトロにおける組換えにより作製されたEna2Aは、S型繊維へと自己アセンブルする
Ena1B及びEna3Aのほかに、インビトロにおける組換え作製法が、それらの典型的な繊維形成のために、全てのEnaへと一般的に適用可能であることを確認するために、N末端6×His-TEV遮断剤を伴う、立体障害型Ena2A(配列番号145)の発現、Ena2A多量体の精製に続く、TEVプロテアーゼを伴う、共インキュベーションの後における、S型繊維のアセンブリーにより得られた、Ena2A S型繊維のインビトロアセンブリーを、図27に示す(図27;Ena1Bについて記載された方法を使用する)。
Ena1B及びEna3Aのほかに、インビトロにおける組換え作製法が、それらの典型的な繊維形成のために、全てのEnaへと一般的に適用可能であることを確認するために、N末端6×His-TEV遮断剤を伴う、立体障害型Ena2A(配列番号145)の発現、Ena2A多量体の精製に続く、TEVプロテアーゼを伴う、共インキュベーションの後における、S型繊維のアセンブリーにより得られた、Ena2A S型繊維のインビトロアセンブリーを、図27に示す(図27;Ena1Bについて記載された方法を使用する)。
同様に、インセルロ又はインビボにおける、E.コリによる、組換えEna繊維の作製がまた、さらなるEnaファミリーメンバーにも、Ena1B及びEna3Aについて示された通りに適用可能であることの確認として、E.コリにおける、立体障害を伴わないEna2Aの組換え発現は、「インセルロ」における、細胞質内における、S型繊維のアセンブリーに続く、細胞培養物からの、繊維の単離を結果としてもたらした(図28;本明細書において記載された方法を使用する)。
[実施例14]インビトロにおいて、Ena2Cは、多量体的円板を形成する
実施例4において、Ena1Cについて示された通り、組換えEnaCタンパク質を使用すると、インビトロにおいて、ヘリックス多量体ではなく、多量体円板型の構造が形成される。Ena2Cを念頭に、これを、さらに支援するために、同様に、E.コリBl21 C43において、N末端6×His-TEV遮断剤と共に、立体障害型Ena2C(配列番号146に提示された)を発現させることにより、9量体円板として、多量体を構成する、組換えEna2Cを作出した。
実施例4において、Ena1Cについて示された通り、組換えEnaCタンパク質を使用すると、インビトロにおいて、ヘリックス多量体ではなく、多量体円板型の構造が形成される。Ena2Cを念頭に、これを、さらに支援するために、同様に、E.コリBl21 C43において、N末端6×His-TEV遮断剤と共に、立体障害型Ena2C(配列番号146に提示された)を発現させることにより、9量体円板として、多量体を構成する、組換えEna2Cを作出した。
TEVプロテアーゼを使用する切断による、多量体の単離及び遮断剤の除去(本明細書において記載された方法において提示された通りの)は、L型様フィラメントをさらに結果としてもたらしたが、フィラメントは、高度に可撓性であり、閉ループへと湾曲した(図29)。
[実施例15]N末端接続部は、多量体の、繊維へのジスルフィド架橋に必須である
recEna1B S型繊維に由来する原子モデルは、サブユニットiのN末端接続部(Ntc)が、ジスルフィド架橋を介して、サブユニットである、i-9及びi-10へと接続されることを示す。2つの隣接するサブユニット(i-1、i)の間において、水平方向の、非共有結合的接触が存在するが、これらの相互作用は、頑健な繊維を形成するのに十分ではないことが予測される。この仮説を検証するために、recEna1B ΔNtc(配列番号8の野生型Ena1Bの、残基2~15を欠失させた)をクローニングし、E.コリにおいて発現させた。一晩にわたる誘導の後、細胞を採取し、TEMグリッドへと、直接沈着させ、ns-TEMを使用して解析した(図30)。短いS型Ena繊維は、細胞外培地中において見出されたが、破断点(図30b)と、破壊点(図30c~30e)とに分類された、擬似欠陥を呈した。破断点は、直線状繊維セグメントに沿って生じ、試料沈着ステップ及びブロッティングステップにおける溶質流から生じる、せん断力に続いて生じる可能性が高い。このような高頻度の破断は、野生型recEna1B繊維について観察されておらず、recEna1B ΔNtc繊維の引っ張り強度の低減を指し示す。破壊点は、繊維局所セグメントの臨界曲率が、2つ破損セグメントの間の降伏鋭角αcritを超えた場合に、屈曲繊維領域内において観察された。このような破壊点は、recEna1B ΔNtc繊維の、野生型recEna1B繊維と比較した、繊維可撓性の低減を示唆する。これらのデータは、N末端接続部が、サブユニット間ジスルフィド架橋を形成し、これにより、極めて良好な引っ張り強度及び可撓性を、S型繊維へと付与するのに必須である事実を裏付けている。
recEna1B S型繊維に由来する原子モデルは、サブユニットiのN末端接続部(Ntc)が、ジスルフィド架橋を介して、サブユニットである、i-9及びi-10へと接続されることを示す。2つの隣接するサブユニット(i-1、i)の間において、水平方向の、非共有結合的接触が存在するが、これらの相互作用は、頑健な繊維を形成するのに十分ではないことが予測される。この仮説を検証するために、recEna1B ΔNtc(配列番号8の野生型Ena1Bの、残基2~15を欠失させた)をクローニングし、E.コリにおいて発現させた。一晩にわたる誘導の後、細胞を採取し、TEMグリッドへと、直接沈着させ、ns-TEMを使用して解析した(図30)。短いS型Ena繊維は、細胞外培地中において見出されたが、破断点(図30b)と、破壊点(図30c~30e)とに分類された、擬似欠陥を呈した。破断点は、直線状繊維セグメントに沿って生じ、試料沈着ステップ及びブロッティングステップにおける溶質流から生じる、せん断力に続いて生じる可能性が高い。このような高頻度の破断は、野生型recEna1B繊維について観察されておらず、recEna1B ΔNtc繊維の引っ張り強度の低減を指し示す。破壊点は、繊維局所セグメントの臨界曲率が、2つ破損セグメントの間の降伏鋭角αcritを超えた場合に、屈曲繊維領域内において観察された。このような破壊点は、recEna1B ΔNtc繊維の、野生型recEna1B繊維と比較した、繊維可撓性の低減を示唆する。これらのデータは、N末端接続部が、サブユニット間ジスルフィド架橋を形成し、これにより、極めて良好な引っ張り強度及び可撓性を、S型繊維へと付与するのに必須である事実を裏付けている。
[実施例16]インセルロにおける、剛性のS型繊維のアセンブリーは、6アミノ酸という小さなサイズのN末端立体障害を含有する、recEna1Bの発現により阻まれる
本明細書において例示された、組換え発現実験のために使用された、元の立体障害構築物が、天然Ena配列を上回る、15のさらなるアミノ酸(M-His6-SSG-TEV;MHHHHHHSSGENLYFQ-Ena1B;さらなるアミノ酸は、太字において示されている)を含有したことを踏まえ、本発明者らは、N末端において、わずか6つのさらなるアミノ酸残基(M-TEV-Ena1B、M-ENLYFQ-Ena1B[配列中、Ena1Bは、N末端のMを伴わない配列番号8である。])又は9つのさらなるアミノ酸残基(M-His6-SSG-Ena1B)による、小型の立体障害を含有する構築物を作った(図31)。いずれの構築物の組換え発現も、インセルロにおける繊維形成を、やはり可能とするが、繊維収量は、15アミノ酸の立体障害を伴う、Ena1Bの発現と比較して、強く低減される。ns-TEMにおいて、繊維は、野生型recEna1B S型繊維(11~11.5nm)と比較して、小さな直径(9~9.5nm)を有し、それほど顕著な構造特徴を呈さない。原子cryoEMモデルから測定された、野生型Ena1B繊維の直径は、9.8~9.9nmであることに注意されたい。よって、繊維を取り巻く、ウラニル染色によるハローに起因して、ns-TEM画像から導出された直径は、「膨張」している。本発明者らは、6~9アミノ酸の範囲の立体障害が、インセルロにおける繊維形成を、完全には遮断せず、天然S型繊維をもたらさず、このため、Ena1Bが、繊維へと自己アセンブルする能力を低下させるので、インビトロ又はインビボにおける繊維アセンブリーにそれほど最適ではないと結論づける。
本明細書において例示された、組換え発現実験のために使用された、元の立体障害構築物が、天然Ena配列を上回る、15のさらなるアミノ酸(M-His6-SSG-TEV;MHHHHHHSSGENLYFQ-Ena1B;さらなるアミノ酸は、太字において示されている)を含有したことを踏まえ、本発明者らは、N末端において、わずか6つのさらなるアミノ酸残基(M-TEV-Ena1B、M-ENLYFQ-Ena1B[配列中、Ena1Bは、N末端のMを伴わない配列番号8である。])又は9つのさらなるアミノ酸残基(M-His6-SSG-Ena1B)による、小型の立体障害を含有する構築物を作った(図31)。いずれの構築物の組換え発現も、インセルロにおける繊維形成を、やはり可能とするが、繊維収量は、15アミノ酸の立体障害を伴う、Ena1Bの発現と比較して、強く低減される。ns-TEMにおいて、繊維は、野生型recEna1B S型繊維(11~11.5nm)と比較して、小さな直径(9~9.5nm)を有し、それほど顕著な構造特徴を呈さない。原子cryoEMモデルから測定された、野生型Ena1B繊維の直径は、9.8~9.9nmであることに注意されたい。よって、繊維を取り巻く、ウラニル染色によるハローに起因して、ns-TEM画像から導出された直径は、「膨張」している。本発明者らは、6~9アミノ酸の範囲の立体障害が、インセルロにおける繊維形成を、完全には遮断せず、天然S型繊維をもたらさず、このため、Ena1Bが、繊維へと自己アセンブルする能力を低下させるので、インビトロ又はインビボにおける繊維アセンブリーにそれほど最適ではないと結論づける。
[実施例17]操作されたEna1Bタンパク質構築物を適用する、S型繊維アセンブリー
BamHI部位により挟まれた、Ena1Bのループ領域である、BC、DE、EF及びHIに、HAタグ(YPYDVPDYA)を導入するように、構築物をデザインした。DEループのために、FLAGタグ(DYKDDDDK)を含有する、第2の構築物もまたデザインした。FLAGタグはまた、BamHI部位によっても挟まれる。インセルロにおける、効率的なS型重合を呈する、標的ループ内の、ペプチドタグ挿入についての明確な例を、下記及び図32の、アライメントされた配列に示す。図33に示された通り、異なる操作された繊維についてのウェスタンブロット解析は、繊維の表面上における、直鎖状タグ(FLAG及びHA)の提示の成功のほか、極めて良好な化学的安定性を裏付ける(SDS-PAGEの積み重ねゲル内において保持された、多量体及び繊維バンドのマーキングを参照されたい;試料は、1%SDS中において、15分間にわたり煮沸した)。
BamHI部位により挟まれた、Ena1Bのループ領域である、BC、DE、EF及びHIに、HAタグ(YPYDVPDYA)を導入するように、構築物をデザインした。DEループのために、FLAGタグ(DYKDDDDK)を含有する、第2の構築物もまたデザインした。FLAGタグはまた、BamHI部位によっても挟まれる。インセルロにおける、効率的なS型重合を呈する、標的ループ内の、ペプチドタグ挿入についての明確な例を、下記及び図32の、アライメントされた配列に示す。図33に示された通り、異なる操作された繊維についてのウェスタンブロット解析は、繊維の表面上における、直鎖状タグ(FLAG及びHA)の提示の成功のほか、極めて良好な化学的安定性を裏付ける(SDS-PAGEの積み重ねゲル内において保持された、多量体及び繊維バンドのマーキングを参照されたい;試料は、1%SDS中において、15分間にわたり煮沸した)。
操作されたEna1B挿入変異体を伴う、Ena1Bの天然配列(配列番号8)のアライメントである:
さらに、図34に示された通り、Enaタンパク質の、Enaスプリット変異体への操作もまた、インセルロにおいて、S型Ena繊維をアセンブルすることを可能とした。スプリット変異体は、それぞれ、Ala30において、したがって、そのBCループにおいて分割された(図15を参照されたい)Ena1B又は、代替的に、Ala100において、したがって、そのHIループにおいて分割されたEna1Bの、N末端部分及びC末端部分をコードする構築物をもたらすことにより構築された。インセルロにおける、Ena1Bの発現のために、かつて使用された構築物(すなわち、N末端6×His遮断剤を欠く、pET28a::Ena1B)において、Ala30における終止コドンに続き、前構築物の残基31の前に、追加のリボソーム結合性部位(RBS)及び新たなATG開始コドンをクローニングすることにより、スプリットBC構築物を作出した。インセルロにおけるEna1Bの発現のためにかつて使用された構築物(すなわち、N末端6×His遮断剤を欠く、pET28a::Ena1B)において、Ala100における終止コドンに続き、その前に追加のリボソーム結合性部位(RBS)及び新たなATG開始コドンをクローニングすることにより、スプリットHI構築物を作出した。
こうして、Enaタンパク質サブユニットは、それらを、スプリットタンパク質としての組換え発現のために用意することにより、操作されたEnaサブユニットとして使用されうるが、この場合、本明細書において、少なくとも、2つのポリペプチドへのスプリットは、共発現時における、フォールドの補完及び後続における、EnaS型繊維への自己アセンブリーを経ることが、やはり可能であることが示される。
[実施例18]磁気ビーズ上におけるEna1B S型繊維のエピタキシャル成長
組換えにより作製された、単離6×His_TEV_Ena1B多量体を、連続的に振盪しながら、室温において、1倍濃度のPBS中、3時間にわたり、100 nm Maleimide Super Mag Magnetic Beads(Raybiotech)と共に共インキュベートし、1倍濃度のPBS中、3ラウンドにわたる洗浄にかけて、結合しなかった、任意の立体障害型Ena1B多量体を除去した。次に、Ena1B機能化磁気ビーズを、連続的に振盪しながら、室温において、1倍濃度のPBS中、1時間にわたり、rec_6×His_TEV_Ena1B溶液及びTEVプロテアーゼと共に共インキュベートし、1倍濃度のPBS中、3ラウンドにわたる洗浄にかけて、結合しなかった、任意のrec_6×His_TEV_Ena1B及びTEVプロテアーゼを除去した。次に、3μlの機能化ビーズ懸濁液を、TEMグリッドへと沈着させ、nsTEM解析にかけ、磁気ビーズの表面へとテザリングされた。短いS型Ena1B繊維の存在を明らかにした(図35の右図パネル内の拡大図を参照されたい)。
組換えにより作製された、単離6×His_TEV_Ena1B多量体を、連続的に振盪しながら、室温において、1倍濃度のPBS中、3時間にわたり、100 nm Maleimide Super Mag Magnetic Beads(Raybiotech)と共に共インキュベートし、1倍濃度のPBS中、3ラウンドにわたる洗浄にかけて、結合しなかった、任意の立体障害型Ena1B多量体を除去した。次に、Ena1B機能化磁気ビーズを、連続的に振盪しながら、室温において、1倍濃度のPBS中、1時間にわたり、rec_6×His_TEV_Ena1B溶液及びTEVプロテアーゼと共に共インキュベートし、1倍濃度のPBS中、3ラウンドにわたる洗浄にかけて、結合しなかった、任意のrec_6×His_TEV_Ena1B及びTEVプロテアーゼを除去した。次に、3μlの機能化ビーズ懸濁液を、TEMグリッドへと沈着させ、nsTEM解析にかけ、磁気ビーズの表面へとテザリングされた。短いS型Ena1B繊維の存在を明らかにした(図35の右図パネル内の拡大図を参照されたい)。
[実施例19] S型Ena繊維による、表面の、非共有結合的機能化
100mMのトリスpH7.0中、室温において、1時間にわたり、Biotin-dPEG11-MAL(Sigma-Aldrich)を使用して、組換えにより作製されたEna1B S型繊維を、ビオチニル化させ、miliQ水による、2ラウンドにわたる洗浄にかけて、結合しなかった、任意のBiotin-dPEG11-MALを除去した。次に、ビオチニル化Ena1B S型繊維を、ストレプトアビジンコーティング金ビーズ(直径1.25μm)と共に共インキュベートし、TEMグリッドへと沈着させ、nsTEM解析にかけた。記録された顕微鏡写真は、S型繊維による、金ビーズの機能化、すなわち、繊維の、ビーズ表面への、明確なテザリングの成功を裏付ける(図36)。表面テザリングが、とりわけ、繊維先端部を介して生じるように、Biotin-dPEG11-MALによる修飾を、Ena繊維極においてアクセス可能な、不対システインへと方向付けた。
100mMのトリスpH7.0中、室温において、1時間にわたり、Biotin-dPEG11-MAL(Sigma-Aldrich)を使用して、組換えにより作製されたEna1B S型繊維を、ビオチニル化させ、miliQ水による、2ラウンドにわたる洗浄にかけて、結合しなかった、任意のBiotin-dPEG11-MALを除去した。次に、ビオチニル化Ena1B S型繊維を、ストレプトアビジンコーティング金ビーズ(直径1.25μm)と共に共インキュベートし、TEMグリッドへと沈着させ、nsTEM解析にかけた。記録された顕微鏡写真は、S型繊維による、金ビーズの機能化、すなわち、繊維の、ビーズ表面への、明確なテザリングの成功を裏付ける(図36)。表面テザリングが、とりわけ、繊維先端部を介して生じるように、Biotin-dPEG11-MALによる修飾を、Ena繊維極においてアクセス可能な、不対システインへと方向付けた。
[実施例20]部位指向突然変異誘発を介して、横方向に強化された、Enaネットワーク
Ena1B S型繊維又はEna3A L型繊維の表面において、溶媒へと露出されたトレオニン残基を、繊維間ジスルフィド架橋の形成を介して、共有結合的な水平方向のアンカリング点として用いられるように、システインにより置換した。組換えにより作製されたタンパク質である、Ena1B T31C、Ena3A T40C及びEna3A T69Cの各々は、E.コリ細胞質内において、良好に発現及び自己アセンブルした。Ena繊維の抽出を、酸化条件下において実施して、S-Sの形成を容易とした。後続において得られた繊維画分についてのnsTEM解析は、Ena3Aの点突然変異体としてのEna1Bのいずれについても、高度に絡まり合った、Ena繊維ネットワークの存在を明らかにした(図37b、37c、37e、37f)。Ena1B T31C繊維は、直径を変動させる、大型バンドルとして存在する(図37b)。単一のバンドルについての、高倍率のイメージングは、個々のS型繊維が、バンドル軸に沿って、並行的に配置された結果として、高度の引っ張り強度をもたらす可能性が高いことを解像した。このスケールの階層構造は、隣接するEna1B T31C S型繊維間における、ジッパー様S-Sアセンブリー機構を示唆する。逆に、Ena3A T40C又はEna3A T69CによるL型繊維単離物は、ランダムに配向したL型繊維から構成される。このようにして、Ena繊維の、水平方向の架橋は、強化Enaロープ又は強化Enaバンドル、強化Enaハイドロゲル及び強化Ena薄膜の形成(図37)を結果としてもたらしうる。
Ena1B S型繊維又はEna3A L型繊維の表面において、溶媒へと露出されたトレオニン残基を、繊維間ジスルフィド架橋の形成を介して、共有結合的な水平方向のアンカリング点として用いられるように、システインにより置換した。組換えにより作製されたタンパク質である、Ena1B T31C、Ena3A T40C及びEna3A T69Cの各々は、E.コリ細胞質内において、良好に発現及び自己アセンブルした。Ena繊維の抽出を、酸化条件下において実施して、S-Sの形成を容易とした。後続において得られた繊維画分についてのnsTEM解析は、Ena3Aの点突然変異体としてのEna1Bのいずれについても、高度に絡まり合った、Ena繊維ネットワークの存在を明らかにした(図37b、37c、37e、37f)。Ena1B T31C繊維は、直径を変動させる、大型バンドルとして存在する(図37b)。単一のバンドルについての、高倍率のイメージングは、個々のS型繊維が、バンドル軸に沿って、並行的に配置された結果として、高度の引っ張り強度をもたらす可能性が高いことを解像した。このスケールの階層構造は、隣接するEna1B T31C S型繊維間における、ジッパー様S-Sアセンブリー機構を示唆する。逆に、Ena3A T40C又はEna3A T69CによるL型繊維単離物は、ランダムに配向したL型繊維から構成される。このようにして、Ena繊維の、水平方向の架橋は、強化Enaロープ又は強化Enaバンドル、強化Enaハイドロゲル及び強化Ena薄膜の形成(図37)を結果としてもたらしうる。
[実施例21]細菌Ena自己アセンブルタンパク質の同定
本明細書に提示された観察及び解析に基づき、Enaタンパク質は、細菌DUF3992タンパク質に属し、N末端の保存されたCys含有モチーフを含有する、線毛形成タンパク質サブユニットの新規の細菌ファミリーとして同定される。第1に、細菌Enaタンパク質ファミリーメンバーの同定は、表1(又はPFAMデータベース:https://pfam.xfam.org/family/PF13157#tabview=tab4)において示された、PFAM13157のHMMプロファイルへの準拠についての解析が可能であり、Ena1/Ena2Aタンパク質及びEna1/Ena2Bタンパク質(図8Bを参照されたい)のための保存されたモチーフZXnCCXmC[配列中、Zは、Leu、Ile、Val又はPheであり、nは、1又は2であり、mは、10~12の間である。]に対応する、又はEna3タンパク質(図26を参照されたい)のための保存されたモチーフZXnC(C)XmCに対応する、本明細書に提示された、少なくとも1つの保存されたCysを含む、N末端接続部(Ntc)を含有する、DUF3992ドメインを含有するアミノ酸配列に基づく。
本明細書に提示された観察及び解析に基づき、Enaタンパク質は、細菌DUF3992タンパク質に属し、N末端の保存されたCys含有モチーフを含有する、線毛形成タンパク質サブユニットの新規の細菌ファミリーとして同定される。第1に、細菌Enaタンパク質ファミリーメンバーの同定は、表1(又はPFAMデータベース:https://pfam.xfam.org/family/PF13157#tabview=tab4)において示された、PFAM13157のHMMプロファイルへの準拠についての解析が可能であり、Ena1/Ena2Aタンパク質及びEna1/Ena2Bタンパク質(図8Bを参照されたい)のための保存されたモチーフZXnCCXmC[配列中、Zは、Leu、Ile、Val又はPheであり、nは、1又は2であり、mは、10~12の間である。]に対応する、又はEna3タンパク質(図26を参照されたい)のための保存されたモチーフZXnC(C)XmCに対応する、本明細書に提示された、少なくとも1つの保存されたCysを含む、N末端接続部(Ntc)を含有する、DUF3992ドメインを含有するアミノ酸配列に基づく。
第2に、Enaタンパク質として分類されるタンパク質についての構造要件は、当技術分野において公知である、モデル化ツールへと提供された、そのアミノ酸配列だけに基づき得、本明細書に提示され、PDB7A02が登録されたProtein Database(Version 1.0(2020年8月6日に登録が申請され、2020年8月24日に公開された))に寄託された、cryo-EMによるEna1Bの参照構造と比較され、(n/10)-4[式中、nは、アミノ酸数としての配列長である。]より高値のZスコアは、高度に著しいフォールド類似性に対応すると考えられる(Holmら、2008;24巻、23号、2780~2781頁;doi:10.1093/bioinformatics/btn507)ので、予測されたフォールドの、フォールド類似性スコア、すなわち、DaliによるZスコアが6.5以上である参照構造と比較されうる、当技術分野において公知である、モデル化ツールへと供給された、そのアミノ酸配列だけに基づきうるその(予測)フォールドから、明確に導出可能である。代替的に、図26に示された、フォールド類似性を決定するために、本明細書に提示された、cryo EMによるEna3の参照構造が使用される場合もある。
タンパク質フォールドのモデル化は、現在利用可能な供給源、例えば、Robetta(https://robetta.bakerlab.org/)若しくはAlphaFold v2.0(Jumperら、2021、Nature;doi.org/10.1038/s41586-021-03819-2)などを含むがこれらに限定されない、デノボ予測用ツールによりなされる場合もあり、利用可能なツール例えば、SWISS-MODEL(https://academic.oup.com/nar/article/46/W1/W296/5000024)、Phyre2(https://www.nature.com/articles/nprot.2015.053)、RaptorX(https://www.nature.com/articles/nprot.2012.085)及び他のツールなどを含みうるがこれらに限定されない、相同性ベースのタンパク質モデル化によりなされる場合もある。
例えば、DUF3992の分類及びN末端接続部の存在により特徴付けられた、多数の選択されたEna候補オーソログについての構造比較を、各構造(図38に示された)について、各構造のCα原子iと、参照構造(PDB7A02として寄託された、又は本明細書の表2に提示された、Ena1B(UniProt受託番号:A0A1Y6A695;本明細書において示された配列番号8に対応する)についてのcryoEMモデル)の対応する原子Cαと間の、原子位置についての平均二乗偏差(RMSD)のほか、フォールド類似性スコア、すなわち、DaliによるZスコアをもたらすことにより実施した。(n/10)-4[式中、nは、アミノ酸数としての配列長である。]より高値のZスコアは、高度に著しいフォールド類似性に対応すると考えられる。(Holmら、2008;24巻、23号、2780~2781頁;doi:10.1093/bioinformatics/btn507)。したがって、例えば、n=117である配列に基づくタンパク質について、これは、Z=7.6以上に対応し、大きなフォールド類似性をもたらす。配列である、WP_098507345.1及びWP_017562367.1(www.ncbi.nlm.nih.gov/protein/)を含有する、DUF3992ドメインについて、本発明者らは、AlphaFold v2.0により予測された推定構造を提示する。基準として、本発明者らはまた、本発明者らの参照構造であるEna1B(UniProt受託番号:A0A1Y6A695、配列番号8)についての、AlphaFoldモデルも提示するが、これは、実験によるcryoEM構造と、AlphaFoldモデル(RMSD=0.605;Z=12.4)との極めて良好な一致を裏付ける。これらの予測は、本発明者らの参照配列(Ena1B、配列番号8)に対する24.2%(WP_041638338.1)という低値の配列同一性を有する細菌のDUF3992配列が、Ntcが存在する同じEnaフォールドを取りうることを示す。Ena2A(WP_001277540.1;配列番号145;24.2%の同一性)について、本発明者らは、これが、実際に、Ena多量体及びS型Ena繊維を形成することを示した。こうして、Enaサブユニットは、HMMプロファイル検索(DUF3992ドメインを含有するタンパク質についてのHMM行列に対応する表1に従う)、に続いて、デノボの構造予測及び本明細書において開示されたEna1B及びEna3AのcryoEM構造(それぞれ、図38及び26)との比較に基づき、明確に同定されうる。自己アセンブルEnaサブユニットは、Ena1B(又はEna3A)に照らした、DaliによるZスコアが6.5以上である8本のβ鎖による、Enaベータサンドウィッチフォールドを含有し、Ena繊維内のジスルフィド媒介架橋のためのZ-Xn-C(C)-Xm-C-Xモチーフを伴うN末端接続部ペプチド[配列中、Zは、Leu、Ile、Val又はPheであり、nは、1又は2残基であり、Cは、Cysであり、(C)は、Ena3分類のための、任意選択的な第2のCysであり、mは、10~12アミノ酸であり、Xは、任意のアミノ酸である。]を含有する。候補Enaサブユニットの自己アセンブリー及び繊維形成は、本明細書の「材料及び方法」において記載される通り、単離された繊維材料の、E.コリの細胞質内の組換え発現及び陰性染色透過電子視覚化により決定される。具体的に述べると、S型繊維を形成するEnaサブユニットは、本明細書において提示されたEna1B構造と比較したZスコアが6.5以上である予測構造を伴い、配列番号1~14又は21~37に示された、Ena1/Ena2A及びEna1/Ena2Bの配列のうちのいずれかに対する、少なくとも80%の配列同一性を有し、Ntc内のZ-Xn-C-C-Xm-C-Xモチーフ[配列中、Zは、Leu、Ile、Val又はPheであり、nは、1又は2残基であり、Cは、Cysであり、mは、10~12アミノ酸であり、Xは、任意のアミノ酸である。]を含有し、C末端におけるGX2/3CX4Yモチーフ[配列中、G=Glyであり、X=任意のアミノ酸であり、C=Cysであり、Y=Tyrである。]を含有する、DUF3992ドメイン含有タンパク質として認識されうる。S型Ena繊維は、陰性染色透過電子顕微鏡法により観察された場合に、繊維のヘリックスターンが、互い違いに、ジグザグに出現することにより、容易に認識される(図1c)。具体的に述べると、L型繊維を形成するEnaサブユニットは、本明細書において提示されたEna3A構造と比較したZスコアが6.5以上である予測構造を伴い、配列番号49~80に示された、Ena3の配列のうちのいずれかに対する、少なくとも80%の配列同一性を有し、Ntc内のZ-Xn-C-Xm-C-Xモチーフ[配列中、Zは、Leu、Ile、Val又はPheであり、nは、1又は2残基であり、Cは、Cysであり、mは、10~12アミノ酸であり、Xは、任意のアミノ酸である。]を含有し、C末端におけるS-Z-N-Y-X-Bモチーフ[配列中、S=Serであり、Zは、Leu又はIleであり、N=Asn、Bは、Phe又はTyrであり、X=任意のアミノ酸である。]を含有する、DUF3992ドメイン含有タンパク質として認識されうる。L型Ena繊維は、陰性染色電子顕微鏡法により観察された場合に、繊維内の積み重ねリングが、ラダー様に出現することにより、容易に認識される(図1d)。
材料及び方法
B.セレウスの培養及び付属物の抽出
Enaを抽出するために、B.セレウスNVH0075-95株を、血液寒天プレート上に播種し、37℃において、3カ月間にわたりインキュベートした。成熟したら、芽胞を、再懸濁させ、miliQ水中において、3回にわたり洗浄した(4℃において、2400×gの遠心分離)。次いで、多様な有機破砕物及び無機破砕物を除去するために、ペレットを、20%のNycodenz(Axis-Shield)中に再懸濁させ、勾配が、v/v比を1:1とする、45%(w/v)のNycodenzと、47%(w/v)のNycodenzとの混合物から構成された、Nycodenzによる密度勾配遠心分離にかけた。次いで、芽胞細胞だけから構成されるペレットを、それぞれ、0.1%のSDSを含有する、1MのNaCl及びTE緩衝液(50mMのトリス-HCl;0.5mMのEDTA)により洗浄した。付属物を引き離すために、洗浄された芽胞を、氷上、20kHz±50Hz及び50ワット(Vibra Cell VC50T;Sonic&Materials Inc.;U.S)において、30秒間にわたり超音波処理するのに続き、4500×gにおいて遠心分離し、付属物を、上清中に回収した。芽胞及び栄養母細胞の残余成分をさらに除去するために、n-ヘキサンを添加し、v/v比を1:2とする上清中において、激しく混合した。次いで、混合物を放置して沈殿させて、水とヘキサンとの相分離を可能とした。次いで、付属物を含有するヘキサン画分を回収し、加圧空気下、55℃において、1.5時間にわたり保持して、ヘキサンを蒸発させた。最後に、さらなるcryo-EM試料の調製のために、付属物を、miliQ水中に再懸濁させた。
B.セレウスの培養及び付属物の抽出
Enaを抽出するために、B.セレウスNVH0075-95株を、血液寒天プレート上に播種し、37℃において、3カ月間にわたりインキュベートした。成熟したら、芽胞を、再懸濁させ、miliQ水中において、3回にわたり洗浄した(4℃において、2400×gの遠心分離)。次いで、多様な有機破砕物及び無機破砕物を除去するために、ペレットを、20%のNycodenz(Axis-Shield)中に再懸濁させ、勾配が、v/v比を1:1とする、45%(w/v)のNycodenzと、47%(w/v)のNycodenzとの混合物から構成された、Nycodenzによる密度勾配遠心分離にかけた。次いで、芽胞細胞だけから構成されるペレットを、それぞれ、0.1%のSDSを含有する、1MのNaCl及びTE緩衝液(50mMのトリス-HCl;0.5mMのEDTA)により洗浄した。付属物を引き離すために、洗浄された芽胞を、氷上、20kHz±50Hz及び50ワット(Vibra Cell VC50T;Sonic&Materials Inc.;U.S)において、30秒間にわたり超音波処理するのに続き、4500×gにおいて遠心分離し、付属物を、上清中に回収した。芽胞及び栄養母細胞の残余成分をさらに除去するために、n-ヘキサンを添加し、v/v比を1:2とする上清中において、激しく混合した。次いで、混合物を放置して沈殿させて、水とヘキサンとの相分離を可能とした。次いで、付属物を含有するヘキサン画分を回収し、加圧空気下、55℃において、1.5時間にわたり保持して、ヘキサンを蒸発させた。最後に、さらなるcryo-EM試料の調製のために、付属物を、miliQ水中に再懸濁させた。
Ena1B付属物の組換え発現、精製及びインビトロにおけるアセンブリー
Ena1Bは、E.コリ内の発現についてコドン最適化され、Twist biosciencesにおいて、合成され、pET28a発現ベクターへとクローニングされた(配列番号83)。Ena1B上に、中間のTEVプロテアーゼ切断部位(配列番号89:ENLYFQG)と共に、N末端6×ヒスチジンタグを有するように、インサートをデザインした。ファージ抵抗性である、NEB製のT7 Express lysY/Iq E.coli strain内において、大スケールの組換え発現を実行した。単一のコロニーを、20mLのLBへと接種し、初代培養のために、37℃、150rpmにおいて振盪しながら、一晩にわたり増殖させた。翌朝、6LのLBに、20mL/Lの初代培養物を接種し、37℃において、振盪しながら、OD600が、0.8に達するまで、増殖させ、この後、1mMのイソプロピルβ-D-1-チオガラクトピラノシド(IPTG)により、タンパク質の発現を誘導した。培養物を、37℃において、さらに3時間にわたり、インキュベートし、5,000rpmにおける遠心分離により採取した。全細胞ペレットを、可溶性の溶解緩衝液(20mMのリン酸カリウム、500mMのNaCl、10mMのβ-ME、20mMのイミダゾール、pH7.5)中に再懸濁させ、溶解のために、氷上において、超音波処理した。Beckman coulter製のJA-20型ローター内における、45分間にわたる18,000rpmの遠心分離により、可溶性画分と、不溶性画分とを分離するように、溶解物を遠心分離した。ペレットを、溶解緩衝液中に8Mの尿素から構成された変性溶解緩衝液中に、さらに溶解させた。次いで、溶解させたペレットを、Ni Sepharoseを充填されたHisTrap HPカラムに通し、変性溶解緩衝液により平衡化させた。次いで、室温において、AKTA精製装置を使用して、勾配モード(20~250mMのイミダゾール)において、結合されたタンパク質を、溶出緩衝液(20mMのリン酸カリウム、pH7.5、8M尿素、250mMのイミダゾール)により、カラムから溶出させた。Hampton製のdialysis buttonにより、変性条件下において、無傷N末端6×HISタグにより組換え精製されたEna1Bを、可溶性溶解緩衝液との緩衝液交換にかけた。N末端Hisタグは、2つの単量体の間の二重ジスルフィド架橋の形成を妨げ、Ena1Bは、スパイラルへとアセンブルした(図8E)。フィラメントへの自己アセンブリーを容易とするために、Hisタグを、TEVプロテアーゼにより切断した。変性条件下にある精製したEna1Bを、まず、20mMのHepes、pH7.0、50mMのNaClを含有する緩衝液により、一晩にわたり4℃において透析した。次いで、TEVプロテアーゼを、100mMのβMEと共に、等モル比において添加し、37℃において、2時間にわたりインキュベートした。これは、Ena1Bの、長型フィラメントへのアセンブリーをもたらした(図8F)。
Ena1Bは、E.コリ内の発現についてコドン最適化され、Twist biosciencesにおいて、合成され、pET28a発現ベクターへとクローニングされた(配列番号83)。Ena1B上に、中間のTEVプロテアーゼ切断部位(配列番号89:ENLYFQG)と共に、N末端6×ヒスチジンタグを有するように、インサートをデザインした。ファージ抵抗性である、NEB製のT7 Express lysY/Iq E.coli strain内において、大スケールの組換え発現を実行した。単一のコロニーを、20mLのLBへと接種し、初代培養のために、37℃、150rpmにおいて振盪しながら、一晩にわたり増殖させた。翌朝、6LのLBに、20mL/Lの初代培養物を接種し、37℃において、振盪しながら、OD600が、0.8に達するまで、増殖させ、この後、1mMのイソプロピルβ-D-1-チオガラクトピラノシド(IPTG)により、タンパク質の発現を誘導した。培養物を、37℃において、さらに3時間にわたり、インキュベートし、5,000rpmにおける遠心分離により採取した。全細胞ペレットを、可溶性の溶解緩衝液(20mMのリン酸カリウム、500mMのNaCl、10mMのβ-ME、20mMのイミダゾール、pH7.5)中に再懸濁させ、溶解のために、氷上において、超音波処理した。Beckman coulter製のJA-20型ローター内における、45分間にわたる18,000rpmの遠心分離により、可溶性画分と、不溶性画分とを分離するように、溶解物を遠心分離した。ペレットを、溶解緩衝液中に8Mの尿素から構成された変性溶解緩衝液中に、さらに溶解させた。次いで、溶解させたペレットを、Ni Sepharoseを充填されたHisTrap HPカラムに通し、変性溶解緩衝液により平衡化させた。次いで、室温において、AKTA精製装置を使用して、勾配モード(20~250mMのイミダゾール)において、結合されたタンパク質を、溶出緩衝液(20mMのリン酸カリウム、pH7.5、8M尿素、250mMのイミダゾール)により、カラムから溶出させた。Hampton製のdialysis buttonにより、変性条件下において、無傷N末端6×HISタグにより組換え精製されたEna1Bを、可溶性溶解緩衝液との緩衝液交換にかけた。N末端Hisタグは、2つの単量体の間の二重ジスルフィド架橋の形成を妨げ、Ena1Bは、スパイラルへとアセンブルした(図8E)。フィラメントへの自己アセンブリーを容易とするために、Hisタグを、TEVプロテアーゼにより切断した。変性条件下にある精製したEna1Bを、まず、20mMのHepes、pH7.0、50mMのNaClを含有する緩衝液により、一晩にわたり4℃において透析した。次いで、TEVプロテアーゼを、100mMのβMEと共に、等モル比において添加し、37℃において、2時間にわたりインキュベートした。これは、Ena1Bの、長型フィラメントへのアセンブリーをもたらした(図8F)。
エスケリキア・コリ(Escherichia coli)からの、インビボ/インセルロにおける組換えEna繊維の単離[図20における通りのS型繊維;及び図25における通りのL型繊維について、本明細書において例示された]
1リットルのLB、50μg/mlのカナマイシンに、立体障害を伴わない(すなわち、例えば、インビトロにおけるアセンブリー法と比較して、HISタグ-TEV切断部位を伴わない)、20mLの、一晩にわたる前培養物E.コリC43(DE3)pET28aによるEna1B又はEna3Aを接種する。ロータリーシェーカー内、37℃において、中期指数期(OD=0.7~1.0)までインキュベートし、温度を、25℃へと低下させ、最後に、1mMのイソプロピルβ-D-1-チオガラクトピラノシドを添加する。18時間にわたりインキュベートし、JLA 8.1型ローターを、5.000rcf及び4℃において使用して、細胞を採取する。プロペラ式の攪拌機を装備したオーバーヘッドスターラーを、2000rpmにおいて使用して、細胞ペレットを、1倍濃度のPBS、1%(w/v)のドデシル硫酸ナトリウム(SDS)中に再懸濁させる。細胞スラリーを、99℃へと設定された磁気ホットプレート上において、磁気スターラーバーにより連続的に攪拌しながら、30分間にわたりインキュベートする。ホモジナイズされた溶解物を、50mlのファルコンチューブへと移し、JLA 14.5型ローター内、20℃、20.000rcfにおいて、30分間にわたり遠心分離する。上清を廃棄し、ラジアルセレーションを伴う、Potter-Elvehjem組織グラインダーを使用して、ペレットを、1倍濃度のPBS中に再懸濁させ、ホモジネートを、20.000rcfにおいて、30分間にわたり遠心分離する。上清を廃棄し、ペレットを、miliQ中に再懸濁させ、20.000rcfにおいて、30分間わたり遠心分離する。所望の最終濃度に到達ように、清明化したEnaペレットを、miliQ中に再溶解させた。
1リットルのLB、50μg/mlのカナマイシンに、立体障害を伴わない(すなわち、例えば、インビトロにおけるアセンブリー法と比較して、HISタグ-TEV切断部位を伴わない)、20mLの、一晩にわたる前培養物E.コリC43(DE3)pET28aによるEna1B又はEna3Aを接種する。ロータリーシェーカー内、37℃において、中期指数期(OD=0.7~1.0)までインキュベートし、温度を、25℃へと低下させ、最後に、1mMのイソプロピルβ-D-1-チオガラクトピラノシドを添加する。18時間にわたりインキュベートし、JLA 8.1型ローターを、5.000rcf及び4℃において使用して、細胞を採取する。プロペラ式の攪拌機を装備したオーバーヘッドスターラーを、2000rpmにおいて使用して、細胞ペレットを、1倍濃度のPBS、1%(w/v)のドデシル硫酸ナトリウム(SDS)中に再懸濁させる。細胞スラリーを、99℃へと設定された磁気ホットプレート上において、磁気スターラーバーにより連続的に攪拌しながら、30分間にわたりインキュベートする。ホモジナイズされた溶解物を、50mlのファルコンチューブへと移し、JLA 14.5型ローター内、20℃、20.000rcfにおいて、30分間にわたり遠心分離する。上清を廃棄し、ラジアルセレーションを伴う、Potter-Elvehjem組織グラインダーを使用して、ペレットを、1倍濃度のPBS中に再懸濁させ、ホモジネートを、20.000rcfにおいて、30分間にわたり遠心分離する。上清を廃棄し、ペレットを、miliQ中に再懸濁させ、20.000rcfにおいて、30分間わたり遠心分離する。所望の最終濃度に到達ように、清明化したEnaペレットを、miliQ中に再溶解させた。
その頑健性について調べるための、Ena処理実験
B.セレウスNVH0075-95株(上記を参照されたい)から、エクスビボにおいて抽出されたEnaを、脱塩水中に再懸濁させ、121℃において、20分間にわたりオートクレーブ処理して、残りの細菌又は芽胞の不活性化を確保し、緩衝液による処理又は下記に表示の処理及び図7に示された処理にかけた。多様な処理時における、Enaの完全性を決定するために、陰性染色TEMを使用して、試料をイメージングし、Enaを枠付けし、下記において記載される、二次元クラス分けにかけた。プロテアーゼに対する抵抗性について調べるために、エクスビボにおけるEnaを、37℃において、4時間にわたり、1mg/mLの使用準備済みプロテイナーゼKによる消化(Thermo Scientific)にかけ、TEMによりイメージングした。乾燥処理の、付属物に対する効果について実験するために、2k rpmの速度において、2時間にわたり作動させた、Savant DNA120 Speedvac Concentrator(Thermo Scientific)を使用して、エクスビボにおけるEnaを、43℃において真空乾燥させた。
B.セレウスNVH0075-95株(上記を参照されたい)から、エクスビボにおいて抽出されたEnaを、脱塩水中に再懸濁させ、121℃において、20分間にわたりオートクレーブ処理して、残りの細菌又は芽胞の不活性化を確保し、緩衝液による処理又は下記に表示の処理及び図7に示された処理にかけた。多様な処理時における、Enaの完全性を決定するために、陰性染色TEMを使用して、試料をイメージングし、Enaを枠付けし、下記において記載される、二次元クラス分けにかけた。プロテアーゼに対する抵抗性について調べるために、エクスビボにおけるEnaを、37℃において、4時間にわたり、1mg/mLの使用準備済みプロテイナーゼKによる消化(Thermo Scientific)にかけ、TEMによりイメージングした。乾燥処理の、付属物に対する効果について実験するために、2k rpmの速度において、2時間にわたり作動させた、Savant DNA120 Speedvac Concentrator(Thermo Scientific)を使用して、エクスビボにおけるEnaを、43℃において真空乾燥させた。
陰性染色透過電子顕微鏡法(TEM)
NS-TEMによる、芽胞及び組換え発現付属物の視覚化のために、ELMOグロー放電器内、真空において、4mAのプラズマ電流により、45秒間にわたり、Electron Microscopy Sciences製の400孔メッシュを伴う、フォルムバール/カーボンコーティング銅グリッドに放電した。3μLの試料を、グリッド上に適用し、1分間にわたり、支持膜に結合させ、この後、Whatman製のグレード1の濾紙により、過剰量の液体を拭き取った。次いで、15μLずつ3滴のmiliQを使用して、グリッドを、3回にわたり洗浄するのに続き、過剰量の液体を拭き取った。洗浄されたグリッドを、2%の酢酸ウラニルの液滴15μL中、10秒間、2秒間及び1分間ずつの長さの持続時間により、3回にわたり保持し、各浸漬の間に拭き取るステップを行った。最後に、乾燥するまで、酢酸ウラニルコーティンググリッドを拭き取った。次いで、LaB6フィラメント及びTVIPS F416 CCDカメラを装備した、120kV JEOL 1400顕微鏡を使用して、グリッドをスクリーニングした。後出において記載される通り、RELION 3.0により、付属物の二次元クラスを生成した。
NS-TEMによる、芽胞及び組換え発現付属物の視覚化のために、ELMOグロー放電器内、真空において、4mAのプラズマ電流により、45秒間にわたり、Electron Microscopy Sciences製の400孔メッシュを伴う、フォルムバール/カーボンコーティング銅グリッドに放電した。3μLの試料を、グリッド上に適用し、1分間にわたり、支持膜に結合させ、この後、Whatman製のグレード1の濾紙により、過剰量の液体を拭き取った。次いで、15μLずつ3滴のmiliQを使用して、グリッドを、3回にわたり洗浄するのに続き、過剰量の液体を拭き取った。洗浄されたグリッドを、2%の酢酸ウラニルの液滴15μL中、10秒間、2秒間及び1分間ずつの長さの持続時間により、3回にわたり保持し、各浸漬の間に拭き取るステップを行った。最後に、乾燥するまで、酢酸ウラニルコーティンググリッドを拭き取った。次いで、LaB6フィラメント及びTVIPS F416 CCDカメラを装備した、120kV JEOL 1400顕微鏡を使用して、グリッドをスクリーニングした。後出において記載される通り、RELION 3.0により、付属物の二次元クラスを生成した。
cryo-TEMグリッドの調製及びcryo-EMデータの収集
まず、真空中において、5mAのプラズマ電流を、1分間にわたり使用して、間隔を1μmとする、2μmの小孔を伴う、QUANTIFOIL(登録商標)holey Cu 400メッシュグリッドに、グロー放電した。0.6mg/mL酸化グラフェン(GO)溶液3μLを、グリッドへと適用し、吸収のために、室温において、1分間にわたりインキュベートした。次いで、Whatman製のグレード1の濾紙を使用して、過剰量のGOを拭き取り、放置して乾燥させた。クライオプランジングのために、Gatan CP3クライオプランジャー内、湿度を100%とし、室温において、3μLのタンパク質試料を、GOコーティンググリッドに適用した。1分間にわたる吸収の後、Whatman製のグレード2の濾紙により、5秒間にわたり、両面から、機械的に拭き取り、180℃において、液体エタンへと、凍結プランジングする。次いで、グリッドを、データ収集まで、液体窒素中において保管した。エクスビボ付属物及びrecEna1B付属物について、2つのデータセットを収集したところ、収集パラメータの変化は、僅少であった。高分解能cryo-EMによる二次元顕微鏡写真による動画を、カウンティングモードのSerial EMにより自動化された、JEOL Cryoarm300顕微鏡上に記録した。エクスビボにおいて増殖させた付属物のために、顕微鏡に、K2 summit検出器を装備し、以下の通り:300keV、開口部100mm、フレーム数30、1Å2当たりの電子62.5個において、2.315秒間の露出とし、ピクセル1つ当たり0.82Åに設定した。recEna1Bデータセットのために、代わりに、ピクセルサイズを、ピクセル1つ当たり0.782Åとし、露出を、1Å2当たりの電子64.66個とし、61フレームにわたり撮影する、K3検出器を使用した。
まず、真空中において、5mAのプラズマ電流を、1分間にわたり使用して、間隔を1μmとする、2μmの小孔を伴う、QUANTIFOIL(登録商標)holey Cu 400メッシュグリッドに、グロー放電した。0.6mg/mL酸化グラフェン(GO)溶液3μLを、グリッドへと適用し、吸収のために、室温において、1分間にわたりインキュベートした。次いで、Whatman製のグレード1の濾紙を使用して、過剰量のGOを拭き取り、放置して乾燥させた。クライオプランジングのために、Gatan CP3クライオプランジャー内、湿度を100%とし、室温において、3μLのタンパク質試料を、GOコーティンググリッドに適用した。1分間にわたる吸収の後、Whatman製のグレード2の濾紙により、5秒間にわたり、両面から、機械的に拭き取り、180℃において、液体エタンへと、凍結プランジングする。次いで、グリッドを、データ収集まで、液体窒素中において保管した。エクスビボ付属物及びrecEna1B付属物について、2つのデータセットを収集したところ、収集パラメータの変化は、僅少であった。高分解能cryo-EMによる二次元顕微鏡写真による動画を、カウンティングモードのSerial EMにより自動化された、JEOL Cryoarm300顕微鏡上に記録した。エクスビボにおいて増殖させた付属物のために、顕微鏡に、K2 summit検出器を装備し、以下の通り:300keV、開口部100mm、フレーム数30、1Å2当たりの電子62.5個において、2.315秒間の露出とし、ピクセル1つ当たり0.82Åに設定した。recEna1Bデータセットのために、代わりに、ピクセルサイズを、ピクセル1つ当たり0.782Åとし、露出を、1Å2当たりの電子64.66個とし、61フレームにわたり撮影する、K3検出器を使用した。
画像処理
RELION 3.0(Zivanovら、2018)に実装された、MOTIONCORR2(Zhengら、2017)を使用して、ビーム誘導性画像動作について補正し、平均二次元顕微鏡写真を生成した。RELION 3.0に組み込まれた、CTFFIND4.2(Rohou及びGrigorieff、2015)を使用して、画像動について補正された顕微鏡写真を使用して、CTFパラメータを推定した。後続の処理は、RELION 3.0及びSPRING(Desfossesら、2014)を使用した。いずれのデータセットについても、EMAN2パッケージによる、e2helixboxer(Tangら、2007)を使用して、手作業により、付属物の座標を枠付けした。良好な氷及びEnaフィラメントの直線状の連なりを伴う顕微鏡写真を選択するように、特に注意を払った。フィラメントを、枠間距離を21Åとする、寸法300×300ピクセルの、重複単粒子枠へとセグメント化した。エクスビボにおけるEnaについて、顕微鏡写真1枚当たり平均2~3本の長型フィラメントを伴う、580枚の顕微鏡写真から、合計53,501のヘリックス断片を抽出した。recEna1Bフィラメントについて、顕微鏡写真1枚当たり平均4~5本のフィラメントを伴う、3,000枚の顕微鏡写真から、合計100,495のヘリックス断片を抽出した。不良粒子にフィルターをかけるために、RELION 3.0において、複数ラウンドにわたる二次元クラス分けを行った。数ラウンドにわたるフィルタリングの後、エクスビボ付属物及びrecEna1B付属物のうち、それぞれ、42,822及び65,466個の良好な粒子によるデータセットを選択した。
RELION 3.0(Zivanovら、2018)に実装された、MOTIONCORR2(Zhengら、2017)を使用して、ビーム誘導性画像動作について補正し、平均二次元顕微鏡写真を生成した。RELION 3.0に組み込まれた、CTFFIND4.2(Rohou及びGrigorieff、2015)を使用して、画像動について補正された顕微鏡写真を使用して、CTFパラメータを推定した。後続の処理は、RELION 3.0及びSPRING(Desfossesら、2014)を使用した。いずれのデータセットについても、EMAN2パッケージによる、e2helixboxer(Tangら、2007)を使用して、手作業により、付属物の座標を枠付けした。良好な氷及びEnaフィラメントの直線状の連なりを伴う顕微鏡写真を選択するように、特に注意を払った。フィラメントを、枠間距離を21Åとする、寸法300×300ピクセルの、重複単粒子枠へとセグメント化した。エクスビボにおけるEnaについて、顕微鏡写真1枚当たり平均2~3本の長型フィラメントを伴う、580枚の顕微鏡写真から、合計53,501のヘリックス断片を抽出した。recEna1Bフィラメントについて、顕微鏡写真1枚当たり平均4~5本のフィラメントを伴う、3,000枚の顕微鏡写真から、合計100,495のヘリックス断片を抽出した。不良粒子にフィルターをかけるために、RELION 3.0において、複数ラウンドにわたる二次元クラス分けを行った。数ラウンドにわたるフィルタリングの後、エクスビボ付属物及びrecEna1B付属物のうち、それぞれ、42,822及び65,466個の良好な粒子によるデータセットを選択した。
約50回にわたる、二次元クラス分けの反復の後、分解能良好な二次元クラス平均像を得ることができた。SPRINGパッケージのsegclassexam(Desfossesら、2014)を使用して、二次元クラス平均像についての、B因子増強型パワースペクトルを生成した。生成されたパワースペクトルは、分解能良好な層線により、シグナル対ノイズ比を増幅していた(図2B)。粗ヘリックスパラメータを推定するために、SPRINGにおけるsegclasslayerオプションを使用して、層線内のピークの座標及び位相を測定した。測定された距離及び位相に基づき、可能なベッセル次数のセットを推定し、この後、計算されたヘリックスパラメータを、RELION(He及びScheres、2017)における、ヘリックス再構築手順において使用した。relion_helix_toolboxを使用して、直径を110Åとする、特徴のない円筒を生成し、三次元クラス分けのための初期モデルとして使用した。フーリエ-ベッセル指数化から推定されたインプットのライズ及びツイストを、被験出発値間のサンプリング分解能を、0.1Å及び1度として、それぞれ、3.05~3.65Å及び29~35度の範囲において変動させた。このようにして、良好な接続性及び認識可能な二次構造を伴う電位マップが得られるまで、数ラウンドにわたる三次元クラス分けを行った。三次元クラス分け試行から生成された、25Åローパスフィルタリングマップを取り出し、三次元クラス分けからのアウトプット変換情報を使用して、粒子を再抽出し、三次元精緻化を行った。EMのマップの分解能を改善するために、複数ラウンドにわたる三次元精緻化を行った。分解能を、さらに改善するために、RELIONにおいて、ベイズポリッシングを実施した。最後に、maskcreateにより、ヘリックスのz軸のうちの、中央の50%を覆う、溶媒マスクを生成し、ポストプロセシングのために使用し、RELIONにおいて、ソルベントフラットニングされたフーリエシェル相関(FSC)曲線を計算した。2ラウンドにわたるポリッシングの後、ゴールドスタンダードである、FSC0.143基準のほか、RELIONにおいて計算された局所分解能に従い、分解能を3.2Åとするマップを得た(図9A)。
モデルの構築
非対称ユニットの接続性を改善するために、PHENIX(Afonineら、2018)に実装された、cryo-EM用密度改変ツールを使用した。まず、Coot(Emsleyら、2010)により、密度改変マップから、単一の非対称的サブユニットのための一次骨格を生成した。Ena1Bの一次配列を、非対称的ユニットへと、手作業によりスレッディングし、残基の化学的特性について検討するマップへと当てはめた。cootにおけるSSM Superposeオプションを使用して、単一のサブユニットから、ヘリックスを構築した。次いで、構築されたモデルを、Phenixにおける、複数ラウンドの実空間構造的精緻化にかけ、どの精緻化ラウンドの後においても、各残基を、手作業により精査した。モデルの検証は、Phenixに実装されたRefmacにおいて行った。全ての図のための視覚化及び画像は、ChimeraX(Goddardら、2018)、Chimera(Pettersenら、2004)、Pymolにより生成した。
非対称ユニットの接続性を改善するために、PHENIX(Afonineら、2018)に実装された、cryo-EM用密度改変ツールを使用した。まず、Coot(Emsleyら、2010)により、密度改変マップから、単一の非対称的サブユニットのための一次骨格を生成した。Ena1Bの一次配列を、非対称的ユニットへと、手作業によりスレッディングし、残基の化学的特性について検討するマップへと当てはめた。cootにおけるSSM Superposeオプションを使用して、単一のサブユニットから、ヘリックスを構築した。次いで、構築されたモデルを、Phenixにおける、複数ラウンドの実空間構造的精緻化にかけ、どの精緻化ラウンドの後においても、各残基を、手作業により精査した。モデルの検証は、Phenixに実装されたRefmacにおいて行った。全ての図のための視覚化及び画像は、ChimeraX(Goddardら、2018)、Chimera(Pettersenら、2004)、Pymolにより生成した。
Enaの免疫染色
ウサギ免疫化(28日間のSuperFast免疫化スケジュール;A055)のために、精製RecEna1A、精製RecEna1B及び精製RecEna1Cのアリコートを、Davids Biotechnologie GmbH(Germany)へと送付した。1カ月後に、血清を受け取り、さらなるアフィニティー精製を伴わずに使用した。免疫染色EMイメージングのために、精製エクスビボEnaの3μlアリコートを、フォルムバール/カーボングリッド(Cu製の400メッシュ;Electron Microscopy Sciences)上に沈着させ、1倍濃度のPBSにより洗浄し、1倍濃度のPBS中の0.5%(w/v)のBSAと共に、1時間にわたりインキュベートした。1倍濃度のPBSによる、さらなる洗浄の後、個々のグリッドを、それぞれ、抗Ena1A血清、抗Ena1B血清及び抗Ena1C血清の、1倍濃度のPBS中の、1000倍希釈液と共に、37℃において、2時間にわたりインキュベートした。1倍濃度のPBSによる洗浄の後、グリッドを、37℃において、1時間にわたり、ヤギにおいて産生された、10nm金標識化抗ウサギIgGの2000倍希釈液及びアフィニティー単離された抗体(G7277-4ML;Sigma-Aldrich)と共にインキュベートした。
ウサギ免疫化(28日間のSuperFast免疫化スケジュール;A055)のために、精製RecEna1A、精製RecEna1B及び精製RecEna1Cのアリコートを、Davids Biotechnologie GmbH(Germany)へと送付した。1カ月後に、血清を受け取り、さらなるアフィニティー精製を伴わずに使用した。免疫染色EMイメージングのために、精製エクスビボEnaの3μlアリコートを、フォルムバール/カーボングリッド(Cu製の400メッシュ;Electron Microscopy Sciences)上に沈着させ、1倍濃度のPBSにより洗浄し、1倍濃度のPBS中の0.5%(w/v)のBSAと共に、1時間にわたりインキュベートした。1倍濃度のPBSによる、さらなる洗浄の後、個々のグリッドを、それぞれ、抗Ena1A血清、抗Ena1B血清及び抗Ena1C血清の、1倍濃度のPBS中の、1000倍希釈液と共に、37℃において、2時間にわたりインキュベートした。1倍濃度のPBSによる洗浄の後、グリッドを、37℃において、1時間にわたり、ヤギにおいて産生された、10nm金標識化抗ウサギIgGの2000倍希釈液及びアフィニティー単離された抗体(G7277-4ML;Sigma-Aldrich)と共にインキュベートした。
定量的RT-PCR
定量的RT-PCR実験を、接種の4、8、12及び16時間後において、3つの独立のBacto培地培養物(37℃、150rpm)から採取されたB.セレウス培養物から単離されたmRNAに対して実施した。RNAの抽出、cDNAの合成及びRT-qPCR解析は、かつて本質的に記載された通り(Madslienら、2014)に実施したが、以下の変化:あらかじめ加熱された(65℃)TRIzol試薬(Invitrogen)及びそれらの間の氷上における冷却を伴う、Mini-BeadBeater-8(BioSpec)における、2分間ずつ4回にわたるビーズビーティングを伴った。RNA試料の各RT-qPCRは、3連において実施し、陰性対照は鋳型を追加せず、rpoBは、内部対照として使用した。各プライマー対についての、検量線の傾き及びPCR効率(E)は、系列希釈液のcDNA鋳型を増幅することにより推定した。mRNA転写物レベルの定量のために、E-Ct項を使用して、同じ各RT-qPCR反応物中の試料に由来する、標的遺伝子及び内部対照遺伝子(rpoB)のCt(閾値サイクル)値を、まず変換した。次いで、それらの変換Ct値を、内部対照遺伝子について得られた、対応する値により除することにより、標的遺伝子の発現レベルを正規化した(Duoduら、2010;Madslienら、2014;Pfaffl、2001)。以下の条件:2分間にわたり50℃、2分間にわたり95℃、95℃において15秒間、60℃において1分間及び95℃において15秒間の40サイクルにより、StepOne PCR software V.2.0(Applied Biosystem)を使用することにより、増幅を行った。RT-qPCR解析のために使用された、全てのプライマーを、表2に列挙する。cDNA上において、常套的なPCR反応を実施して、EnaA及びEnaBが、以下のプログラム:95℃において2分間、95℃において30秒間、54℃において30秒間及び72℃において1分間の30サイクルを使用する、Eppendorf Mastercyclerにおいて、増幅される、プライマーである、2180/2177及び2176/2175並びにDreamTaq DNAポリメラーゼ(Thermo Fisher)を使用するオペロンとして発現されることを確認した。
定量的RT-PCR実験を、接種の4、8、12及び16時間後において、3つの独立のBacto培地培養物(37℃、150rpm)から採取されたB.セレウス培養物から単離されたmRNAに対して実施した。RNAの抽出、cDNAの合成及びRT-qPCR解析は、かつて本質的に記載された通り(Madslienら、2014)に実施したが、以下の変化:あらかじめ加熱された(65℃)TRIzol試薬(Invitrogen)及びそれらの間の氷上における冷却を伴う、Mini-BeadBeater-8(BioSpec)における、2分間ずつ4回にわたるビーズビーティングを伴った。RNA試料の各RT-qPCRは、3連において実施し、陰性対照は鋳型を追加せず、rpoBは、内部対照として使用した。各プライマー対についての、検量線の傾き及びPCR効率(E)は、系列希釈液のcDNA鋳型を増幅することにより推定した。mRNA転写物レベルの定量のために、E-Ct項を使用して、同じ各RT-qPCR反応物中の試料に由来する、標的遺伝子及び内部対照遺伝子(rpoB)のCt(閾値サイクル)値を、まず変換した。次いで、それらの変換Ct値を、内部対照遺伝子について得られた、対応する値により除することにより、標的遺伝子の発現レベルを正規化した(Duoduら、2010;Madslienら、2014;Pfaffl、2001)。以下の条件:2分間にわたり50℃、2分間にわたり95℃、95℃において15秒間、60℃において1分間及び95℃において15秒間の40サイクルにより、StepOne PCR software V.2.0(Applied Biosystem)を使用することにより、増幅を行った。RT-qPCR解析のために使用された、全てのプライマーを、表2に列挙する。cDNA上において、常套的なPCR反応を実施して、EnaA及びEnaBが、以下のプログラム:95℃において2分間、95℃において30秒間、54℃において30秒間及び72℃において1分間の30サイクルを使用する、Eppendorf Mastercyclerにおいて、増幅される、プライマーである、2180/2177及び2176/2175並びにDreamTaq DNAポリメラーゼ(Thermo Fisher)を使用するオペロンとして発現されることを確認した。
欠失突然変異体の構築
B.セレウスNVH 0075/95株を、遺伝子欠失突然変異体のバックグラウンドとして使用した。マーカーレスの遺伝子置換え法(Janes及びStibitz、2006)を、微細な修飾と共に使用して、インフレームにおいて、リーディングフレームを、ATGTAA(5’-3’)により置換えることにより、Ena1B遺伝子を欠失させた。B.セレウスNVH 0075/95株の、ΔEna1Bバックグラウンドにおける、Ena1Cの欠失により、ΔEna1B ΔEna1C二重突然変異体を構築した。欠失突然変異体領域を創出するために、標的Ena遺伝子の上流(プライマーA及びB、表2)及び下流(プライマーC及びD、表2)を、PCRにより増幅した。PCR断片のアセンブリーを可能とするために、プライマーB及びCは、相補性の重複配列を含有した。次いで、鋳型としての、上流及び下流におけるPCR断片並びにAプライマー対及びDプライマー対を使用して、さらなるPCRステップを実施した(表2)。全てのPCR反応は、製造元の指示書に従い、Eppendorf Mastercycler勾配及びHigh fidelity AccuPrime Taq DNA Polymerase(ThermoFisher Scientific)を使用して行った。かつて記載された(Lindbackら、2012)通りに、最終的な単位複製配列を、さらなるI-SceI部位を含有する、熱感受性シャトルベクターであるpMAD(Arnaudら、2004)へとクローニングした。pMAD-I-SceIプラスミド構築物にOne Shot(商標)INV110 E.coli(ThermoFisher Scientific)を通過させて、B.セレウスにおける形質転換効率を増強するように、非メチル化DNAを達成した。電気穿孔(Mahillonら、1989)により、非メチル化プラスミドを、B.セレウスNVH 0075/95株へと導入した。PCRによる、形質転換体の検証の後、電気穿孔により、I-SceI酵素についての遺伝子を含有するプラスミドpBKJ233(非メチル化)を、形質転換株へと導入した。I-SceI酵素は、染色体に組み込まれたプラスミド内に、二本鎖DNA切断を施す。その後、相同組換えイベントは、組み込まれたプラスミドの切出しをもたらす結果として、所望される遺伝子の置換えをもたらす。遺伝子欠失は、プライマーA及びプライマーD(表2)を使用するPCR増幅並びにDNAシーケンシング(Eurofins Genomics)により検証した。
B.セレウスNVH 0075/95株を、遺伝子欠失突然変異体のバックグラウンドとして使用した。マーカーレスの遺伝子置換え法(Janes及びStibitz、2006)を、微細な修飾と共に使用して、インフレームにおいて、リーディングフレームを、ATGTAA(5’-3’)により置換えることにより、Ena1B遺伝子を欠失させた。B.セレウスNVH 0075/95株の、ΔEna1Bバックグラウンドにおける、Ena1Cの欠失により、ΔEna1B ΔEna1C二重突然変異体を構築した。欠失突然変異体領域を創出するために、標的Ena遺伝子の上流(プライマーA及びB、表2)及び下流(プライマーC及びD、表2)を、PCRにより増幅した。PCR断片のアセンブリーを可能とするために、プライマーB及びCは、相補性の重複配列を含有した。次いで、鋳型としての、上流及び下流におけるPCR断片並びにAプライマー対及びDプライマー対を使用して、さらなるPCRステップを実施した(表2)。全てのPCR反応は、製造元の指示書に従い、Eppendorf Mastercycler勾配及びHigh fidelity AccuPrime Taq DNA Polymerase(ThermoFisher Scientific)を使用して行った。かつて記載された(Lindbackら、2012)通りに、最終的な単位複製配列を、さらなるI-SceI部位を含有する、熱感受性シャトルベクターであるpMAD(Arnaudら、2004)へとクローニングした。pMAD-I-SceIプラスミド構築物にOne Shot(商標)INV110 E.coli(ThermoFisher Scientific)を通過させて、B.セレウスにおける形質転換効率を増強するように、非メチル化DNAを達成した。電気穿孔(Mahillonら、1989)により、非メチル化プラスミドを、B.セレウスNVH 0075/95株へと導入した。PCRによる、形質転換体の検証の後、電気穿孔により、I-SceI酵素についての遺伝子を含有するプラスミドpBKJ233(非メチル化)を、形質転換株へと導入した。I-SceI酵素は、染色体に組み込まれたプラスミド内に、二本鎖DNA切断を施す。その後、相同組換えイベントは、組み込まれたプラスミドの切出しをもたらす結果として、所望される遺伝子の置換えをもたらす。遺伝子欠失は、プライマーA及びプライマーD(表2)を使用するPCR増幅並びにDNAシーケンシング(Eurofins Genomics)により検証した。
Ena1のオーソログ及びホモログについての検索
バチルス属s.l.群に属する種の公開ゲノムを、NCBI RefSeqデータベース(n=735、NCB(https://www.ncbi.nlm.nih.gov/refseq/)からダウンロードした。表現型特徴のために、特に対象となる株(GCA_000171035.2_ASM17103v2、GCA_002952815.1_ASM295281v1、GCF_000290995.1_Baci_cere_AND1407_G13175)及びそのクローズドゲノムが、非存在である、又は極めて希少である種を除き、組み入れられた全てのアセンブリーは、NCBI RefSeqのキュレーションデータベースに由来する、クローズドゲノム及び公開ゲノムであった。アセンブリーは、QUAST(Gurevichら、2013)を使用して品質点検し、適正なサイズ(約4.9~6Mb)及びGC含量を約35%とするゲノムだけを、下流における解析に組み入れた。対応のあるtBLASTn検索を、実施して(e値を1×10-10とし、max_hsprを1とする、デフォルト条件による)、以下のNVH0075-95株に由来するクエリータンパク質配列:Ena1A(配列番号1)、Ena1B(配列番号87)、Ena1C(配列番号15)の、ホモログ及びオーソログについて検索した。クエリーとして使用されたEna1Bタンパク質配列(配列番号87)が、社内における単位複製配列のシーケンシング産物に由来したのに対し、Ena1A及びEna1Cのタンパク質配列のクエリーは、NVH0075-95株のためのアセンブリー(受託番号:GCF_001044825.1;それぞれタンパク質KMP91697.1及びKMP91699.1)に由来した。本発明者らは、対象タンパク質が、クエリータンパク質に、高カバレッジ(>70%)及び中程度の配列同一性(>30%)によりによりマッチした場合に、タンパク質のオーソログ又はホモログであると考えた。
バチルス属s.l.群に属する種の公開ゲノムを、NCBI RefSeqデータベース(n=735、NCB(https://www.ncbi.nlm.nih.gov/refseq/)からダウンロードした。表現型特徴のために、特に対象となる株(GCA_000171035.2_ASM17103v2、GCA_002952815.1_ASM295281v1、GCF_000290995.1_Baci_cere_AND1407_G13175)及びそのクローズドゲノムが、非存在である、又は極めて希少である種を除き、組み入れられた全てのアセンブリーは、NCBI RefSeqのキュレーションデータベースに由来する、クローズドゲノム及び公開ゲノムであった。アセンブリーは、QUAST(Gurevichら、2013)を使用して品質点検し、適正なサイズ(約4.9~6Mb)及びGC含量を約35%とするゲノムだけを、下流における解析に組み入れた。対応のあるtBLASTn検索を、実施して(e値を1×10-10とし、max_hsprを1とする、デフォルト条件による)、以下のNVH0075-95株に由来するクエリータンパク質配列:Ena1A(配列番号1)、Ena1B(配列番号87)、Ena1C(配列番号15)の、ホモログ及びオーソログについて検索した。クエリーとして使用されたEna1Bタンパク質配列(配列番号87)が、社内における単位複製配列のシーケンシング産物に由来したのに対し、Ena1A及びEna1Cのタンパク質配列のクエリーは、NVH0075-95株のためのアセンブリー(受託番号:GCF_001044825.1;それぞれタンパク質KMP91697.1及びKMP91699.1)に由来した。本発明者らは、対象タンパク質が、クエリータンパク質に、高カバレッジ(>70%)及び中程度の配列同一性(>30%)によりによりマッチした場合に、タンパク質のオーソログ又はホモログであると考えた。
Enaの遺伝子及びタンパク質についての比較ゲノミクス
アライメントされたEna1A-Ena1Cタンパク質の系統樹は、tBLASTn検索から結果として得られる、全てのヒットについて、FastTree(Priceら、2010)(デフォルト条件)による近似的最大尤度を使用して構築した。アミノ酸配列は、mafft v.7.310(Katohら、2019)を使用してアライメントし、JTT+CATモデル(Priceら、2010)を使用する、FastTreeを使用して、タンパク質アライメントについての、近似的最大尤度系統樹を作成した。全ての系統樹は、Microreact(Argimonら、2016)において視覚化し、Ena1A-Ena1C及びEna2A-Ena2Cについて、種並びに存在及び非存在についてのメタデータを、図に重ね合わせた。
アライメントされたEna1A-Ena1Cタンパク質の系統樹は、tBLASTn検索から結果として得られる、全てのヒットについて、FastTree(Priceら、2010)(デフォルト条件)による近似的最大尤度を使用して構築した。アミノ酸配列は、mafft v.7.310(Katohら、2019)を使用してアライメントし、JTT+CATモデル(Priceら、2010)を使用する、FastTreeを使用して、タンパク質アライメントについての、近似的最大尤度系統樹を作成した。全ての系統樹は、Microreact(Argimonら、2016)において視覚化し、Ena1A-Ena1C及びEna2A-Ena2Cについて、種並びに存在及び非存在についてのメタデータを、図に重ね合わせた。
配列表
>配列番号1:バチルス・セレウスNVH 0075-95 383株芽胞付属物(Ena)1Aのアミノ酸配列(GenBankタンパク質受託番号:KMP91697.1;126アミノ酸)
>配列番号2:GCF_007673655.1_Ena1A(125アミノ酸;B.ミコイデス)(NCBIデータベース上の通り)
>配列番号3:GCF_002251005.2_Ena1A(126アミノ酸;B.シトトキシクス)
>配列番号4:GCF_001884105.1_Ena1A(125アミノ酸;B.ルティー)
>配列番号5:GCA_000171035.2_Ena1A(126アミノ酸;B.セレウス)
>配列番号6:GCF_007682405.1_Ena1A(126アミノ酸;B.トロピクス)
>配列番号7:GCF_002572325.1_Ena1A(126アミノ酸;B.ヴィートマニイ)
>配列番号8:バチルス・セレウスNVH 0075-95 383株芽胞付属物(Ena)1Bのアミノ酸配列(GenBankタンパク質受託番号:KMP91698.1;117アミノ酸)
>配列番号9:GCF_000161255.1_Ena1B(120アミノ酸;B.セレウス)
>配列番号10:GCF_900095655.1_Ena1B(116アミノ酸;B.シトトキシクス)
>配列番号11:GCA_000171035.2_Ena1B(117アミノ酸;B.セレウス)
>配列番号12:GCF_002572325.1_Ena1B(117アミノ酸;B.ヴィートマニイ)
>配列番号13:GCF_001884105.1_Ena1B(117アミノ酸;B.ルティー)
>配列番号14:GCF_007682405.1_Ena1B(117アミノ酸;B.トロピクス)
>配列番号15:バチルス・セレウスNVH 0075-95 383株芽胞付属物(Ena)1Cのアミノ酸配列(GenBankタンパク質受託番号:KMP91699.1;155アミノ酸)
>配列番号16:GCF_900094915.1_Ena1C(150アミノ酸;B.シトトキシクス)
>配列番号17:GCF_000789315.1_Ena1C(155アミノ酸;B.セレウス)
>配列番号18:GCF_001044745.1_Ena1C(155アミノ酸;B.ヴィートマニイ)
>配列番号19:GCF_002568925.1_Ena1C(155アミノ酸;B.ヴィートマニイ)
>配列番号20:GCF_001884105.1_Ena1C(155アミノ酸;B.ルティー)
>配列番号21:バチルス・シトトキシクスNVH 391-98株芽胞付属物(Ena)2Aのアミノ酸配列(GenBankタンパク質受託番号:ABS21009.1;126アミノ酸)
>配列番号22:GCF_002555305.1_Ena2A(122アミノ酸;B.ヴィートマニイ)
>配列番号23:GCF_000712595.1_Ena2A(119アミノ酸;B.マンリポネンシス(B.manliponensis))
>配列番号24:GCF_000008005.1_Ena2A(122アミノ酸;B.セレウス)
>配列番号25:GCF_000161275.1_Ena2A(122アミノ酸;B.セレウス)
>配列番号26:GCF_000007845.1_Ena2A(122アミノ酸;B.アントラーキス)
>配列番号27:GCF_002589195.1_Ena2A(122アミノ酸;B.トヨネンシス)
>配列番号28:GCF_000290695.1_Ena2A(122アミノ酸;B.ミコイデス)
>配列番号29:バチルス・シトトキシクスNVH 391-98株芽胞付属物(Ena)2Bのアミノ酸配列(GenBankタンパク質受託番号:ABS21010.1;117アミノ酸)
>配列番号30:GCF_002555305.1_Ena2B(113アミノ酸;B.ヴィートマニイ)
>配列番号31:GCF_000712595.1_Ena2B(114アミノ酸;B.マンリポネンシス)
>配列番号32:GCF_000008005.1_Ena2B(112アミノ酸;B.セレウス)
>配列番号33:GCF_000803665.1_Ena2B(110アミノ酸;B.チューリンギエンシス)
>配列番号34:GCF_004023375.1_Ena2B(111アミノ酸;B.ミコイデス)
>配列番号35:GCF_000742875.1_Ena2B(114アミノ酸;B.アントラーキス)
>配列番号36:GCF_002589605.1_Ena2B(114アミノ酸;B.トヨネンシス)
>配列番号37:GCF_900095005.1_Ena2B(114アミノ酸;B.ミコイデス)
>配列番号38:バチルス・シトトキシクスNVH 391-98株芽胞付属物(Ena)2Cのアミノ酸配列(GenBankタンパク質受託番号:ABS21011.1;150アミノ酸)
>配列番号39:GCF_000338755.1_Ena2C(135;B.チューリンギエンシス)
>配列番号40:GCF_003386775.1_Ena2C(135;B.ミコイデス)
>配列番号41:GCF_002578975.1_Ena2C(135;B.ヴィートマニイ)
>配列番号42:GCF_006349595.1_Ena2C(135;B.パシフィクス)
>配列番号43:GCF_001455345.1_Ena2C(134;B.チューリンギエンシス)
>配列番号44:GCF_004023375.1_Ena2C(144;B.ミコイデス)
>配列番号45:GCF_003227955.1_Ena2C(136;B.アントラーキス)
>配列番号46:GCF_001317525.1_Ena2C(136;B.ヴィートマニイ)
>配列番号47:GCF_000712595.1_Ena2C(145;B.マンリポネンシス)
>配列番号48:GCF_007673655.1_Ena2C(139;B.ミコイデス)
>配列番号49:バチルス属(複数種:バチルス・セレウスATCC 10987-GCF_000008005.1株)芽胞付属物(Ena)3Aのアミノ酸配列(WP_017562367.1;113アミノ酸)
>配列番号50:WP_157293150.1/1-112のDUF3992ドメイン含有タンパク質[バチルス属種ms-22株]
>配列番号51:WP_105925236.1/1-114のDUF3992ドメイン含有タンパク質[バチルス属種LLTC93株]
>配列番号52:OLP66313.1/1-115の仮説的タンパク質:BACPU_06150[バチルス・プミルス(Bacillus pumilus)]
>配列番号53:WP_010787618.1/1-115のDUF3992ドメイン含有タンパク質[バチルス・アトロフェウス(Bacillus atrophaeus)]
>配列番号54:WP_040373377.1/1-116のDUF3992ドメイン含有タンパク質[ペリバチルス・プシクロサッカロリティクス(Peribacillus psychrosaccharolyticus)]
>配列番号55:WP_091498261.1/1-115のDUF3992ドメイン含有タンパク質[アンフィバチルス・マリヌス(Amphibacillus marinus)]
>配列番号56:WP_008633630.1/1-115の複数種:DUF3992ドメイン含有タンパク質[バチルス科(Bacillaceae)]
>配列番号57:WP_124051031.1/1-116のDUF3992ドメイン含有タンパク質[バチルス・エンドフィティクス(Bacillus endophyticus)]
>配列番号58:WP_049679853.1/1-114のDUF3992ドメイン含有タンパク質[ペリバチルス・ロイセレウリエ(Peribacillus loiseleuriae)]
>配列番号59:WP_062184382.1/1-118の複数種:DUF3992ドメイン含有タンパク質[バチルス綱]
>配列番号60:WP_049681018.1/1-118のDUF3992ドメイン含有タンパク質[ペリバチルス・ロイセレウリエ]
>配列番号61:WP_154975023.1/1-118のDUF3992ドメイン含有タンパク質[バチルス・メガテリウム(Bacillus megaterium)]
>配列番号62:WP_048022205.1/1-118のDUF3992ドメイン含有タンパク質[バチルス・アリアバッタイ(Bacillus aryabhattai)]
>配列番号63:WP_036199318.1/1-114のDUF3992ドメイン含有タンパク質[リシニバチルス・シンデュリエンシス(Lysinibacillus sinduriensis)]
>配列番号64:MQR85259.1/1-115のDUF3992ドメイン含有タンパク質[バチルス・メガテリウム(Bacillus megaterium)]
>配列番号65:WP_111616476.1/1-114のDUF3992ドメイン含有タンパク質[バチルス属種YR335株]
>配列番号66:TDL84647.1/1-113のDUF3992ドメイン含有タンパク質[ビブリオ・ブルニフィクス(Vibrio vulnificus)]
>配列番号67:WP_119116371.1/1-114のDUF3992ドメイン含有タンパク質[ペリバチルス・アサヒイ(Peribacillus asahii)]
>配列番号68:WP_000057858.1/1-116のDUF3992ドメイン含有タンパク質[バチルス・セレウス]
>配列番号69:WP_000192611.1/1-114のDUF3992ドメイン含有タンパク質[バチルス・セレウス]
>配列番号70:WP_000057857.1/1-114の複数種:DUF3992ドメイン含有タンパク質[バチルス・セレウス群]
>配列番号71:WP_035510401.1/1-114の複数種:DUF3992ドメイン含有タンパク質[ハロバチルス属(Halobacillus)]
>配列番号72:WP_101934191.1/1-114のDUF3992ドメイン含有タンパク質[ウィルギバチルス・ドクドネンシス(Virgibacillus dokdonensis)]
>配列番号73:WP_149173096.1/1-114のDUF3992ドメイン含有タンパク質[バチルス属種BPN334株]
>配列番号74:AAS42063.1/1-115の仮説的タンパク質:BCE_3153[バチルス・セレウス;ATCC受託番号:10987]
>配列番号75:WP_100527630.1/1-114のDUF3992ドメイン含有タンパク質[ペニバチルス属(Paenibacillus sp.)種GM1FR株]
>配列番号76:WP_026691041.1/1-115のDUF3992ドメイン含有タンパク質[バチルス・アウランティアクス(Bacillus aurantiacus)]
>配列番号77:WP_102693317.1/1-113のDUF3992ドメイン含有タンパク質[ルンメリイバチルス・ピクヌス(Rummeliibacillus pycnus)]
>配列番号78:WP_071391073.1/1-109のDUF3992ドメイン含有タンパク質[アネロバチルス・アルカリジアゾトロフィクス(Anaerobacillus alkalidiazotrophicus)]
>配列番号79:WP_107839371.1/1-111のDUF3992ドメイン含有タンパク質[リシニバチルス・メイエリ(Lysinibacillus meyeri)]
>配列番号80:WP_066166707.1/1-111のDUF3992ドメイン含有タンパク質[メタソリバチルス・フルオログリコフェニリティクス(Metasolibacillus fluoroglycofenilyticus)]
>配列番号81:組換えEna1Aのヌクレオチド配列(配列番号82をコードする;429bp)
>配列番号82:組換えEna1Aのアミノ酸配列(N末端6×Hisタグ及びTEV切断部位を伴う)
MHHHHHHSSGENLYFQGACECSSTVLTCCSDNSSNFVQDKVCNPWSSAEASTFTVYANNVNQNIVGTGYLTYDVGPGVSPANQITVTVLDSGGGTIQTFLVNEGTSISFTFRRFNIIQITTPATPIGTYQGEFCITTRYLMA
>配列番号83:組換えEna1Bのヌクレオチド配列(配列番号84をコードする;399bp)
>配列番号84:組換えEna1Bのアミノ酸配列(N末端6×Hisタグ及びTEV切断部位を伴う)
MHHHHHHSSGENLYFQGNCSTNLSCCANGQKTIVQDKVCIDWTAAATAAIIYADNISQDIYASGYLKVDTGTGPVTIVFYSGGVTGTAVETIVVATGSSASFTVRRFDTVTILGTAAAETGEFCMTIRYTLS
>配列番号85:組換えEna1Cのヌクレオチド配列(配列番号86をコードする;516bp)
>配列番号86:組換えEna1Cのアミノ酸配列(N末端6×Hisタグ及びTEV切断部位を伴う)
MHHHHHHSSGENLYFQGKPHKNIGCFAPLSIICQPTCPCPPPILPPERGDAELVTNEFAGDILISNDFIPISQKQLKQTNTTVNIWKNDGIVSLSGTISIYNNRNSTNALSIQIISSTTNTFTALPGNTISYTGFDLQSVSVIDIPSDPSIYIEGRYCFQLTYCKSKRDCL
>配列番号87:Ena1B_NM_Oslo(合成配列)
>配列番号88:図8における合成ペプチド
>配列番号89:TEV切断部位
>配列番号1:バチルス・セレウスNVH 0075-95 383株芽胞付属物(Ena)1Aのアミノ酸配列(GenBankタンパク質受託番号:KMP91697.1;126アミノ酸)
>配列番号2:GCF_007673655.1_Ena1A(125アミノ酸;B.ミコイデス)(NCBIデータベース上の通り)
>配列番号3:GCF_002251005.2_Ena1A(126アミノ酸;B.シトトキシクス)
>配列番号4:GCF_001884105.1_Ena1A(125アミノ酸;B.ルティー)
>配列番号5:GCA_000171035.2_Ena1A(126アミノ酸;B.セレウス)
>配列番号6:GCF_007682405.1_Ena1A(126アミノ酸;B.トロピクス)
>配列番号7:GCF_002572325.1_Ena1A(126アミノ酸;B.ヴィートマニイ)
>配列番号8:バチルス・セレウスNVH 0075-95 383株芽胞付属物(Ena)1Bのアミノ酸配列(GenBankタンパク質受託番号:KMP91698.1;117アミノ酸)
>配列番号9:GCF_000161255.1_Ena1B(120アミノ酸;B.セレウス)
>配列番号10:GCF_900095655.1_Ena1B(116アミノ酸;B.シトトキシクス)
>配列番号11:GCA_000171035.2_Ena1B(117アミノ酸;B.セレウス)
>配列番号12:GCF_002572325.1_Ena1B(117アミノ酸;B.ヴィートマニイ)
>配列番号13:GCF_001884105.1_Ena1B(117アミノ酸;B.ルティー)
>配列番号14:GCF_007682405.1_Ena1B(117アミノ酸;B.トロピクス)
>配列番号15:バチルス・セレウスNVH 0075-95 383株芽胞付属物(Ena)1Cのアミノ酸配列(GenBankタンパク質受託番号:KMP91699.1;155アミノ酸)
>配列番号16:GCF_900094915.1_Ena1C(150アミノ酸;B.シトトキシクス)
>配列番号17:GCF_000789315.1_Ena1C(155アミノ酸;B.セレウス)
>配列番号18:GCF_001044745.1_Ena1C(155アミノ酸;B.ヴィートマニイ)
>配列番号19:GCF_002568925.1_Ena1C(155アミノ酸;B.ヴィートマニイ)
>配列番号20:GCF_001884105.1_Ena1C(155アミノ酸;B.ルティー)
>配列番号21:バチルス・シトトキシクスNVH 391-98株芽胞付属物(Ena)2Aのアミノ酸配列(GenBankタンパク質受託番号:ABS21009.1;126アミノ酸)
>配列番号22:GCF_002555305.1_Ena2A(122アミノ酸;B.ヴィートマニイ)
>配列番号23:GCF_000712595.1_Ena2A(119アミノ酸;B.マンリポネンシス(B.manliponensis))
>配列番号24:GCF_000008005.1_Ena2A(122アミノ酸;B.セレウス)
>配列番号25:GCF_000161275.1_Ena2A(122アミノ酸;B.セレウス)
>配列番号26:GCF_000007845.1_Ena2A(122アミノ酸;B.アントラーキス)
>配列番号27:GCF_002589195.1_Ena2A(122アミノ酸;B.トヨネンシス)
>配列番号28:GCF_000290695.1_Ena2A(122アミノ酸;B.ミコイデス)
>配列番号29:バチルス・シトトキシクスNVH 391-98株芽胞付属物(Ena)2Bのアミノ酸配列(GenBankタンパク質受託番号:ABS21010.1;117アミノ酸)
>配列番号30:GCF_002555305.1_Ena2B(113アミノ酸;B.ヴィートマニイ)
>配列番号31:GCF_000712595.1_Ena2B(114アミノ酸;B.マンリポネンシス)
>配列番号32:GCF_000008005.1_Ena2B(112アミノ酸;B.セレウス)
>配列番号33:GCF_000803665.1_Ena2B(110アミノ酸;B.チューリンギエンシス)
>配列番号34:GCF_004023375.1_Ena2B(111アミノ酸;B.ミコイデス)
>配列番号35:GCF_000742875.1_Ena2B(114アミノ酸;B.アントラーキス)
>配列番号36:GCF_002589605.1_Ena2B(114アミノ酸;B.トヨネンシス)
>配列番号37:GCF_900095005.1_Ena2B(114アミノ酸;B.ミコイデス)
>配列番号38:バチルス・シトトキシクスNVH 391-98株芽胞付属物(Ena)2Cのアミノ酸配列(GenBankタンパク質受託番号:ABS21011.1;150アミノ酸)
>配列番号39:GCF_000338755.1_Ena2C(135;B.チューリンギエンシス)
>配列番号40:GCF_003386775.1_Ena2C(135;B.ミコイデス)
>配列番号41:GCF_002578975.1_Ena2C(135;B.ヴィートマニイ)
>配列番号42:GCF_006349595.1_Ena2C(135;B.パシフィクス)
>配列番号43:GCF_001455345.1_Ena2C(134;B.チューリンギエンシス)
>配列番号44:GCF_004023375.1_Ena2C(144;B.ミコイデス)
>配列番号45:GCF_003227955.1_Ena2C(136;B.アントラーキス)
>配列番号46:GCF_001317525.1_Ena2C(136;B.ヴィートマニイ)
>配列番号47:GCF_000712595.1_Ena2C(145;B.マンリポネンシス)
>配列番号48:GCF_007673655.1_Ena2C(139;B.ミコイデス)
>配列番号49:バチルス属(複数種:バチルス・セレウスATCC 10987-GCF_000008005.1株)芽胞付属物(Ena)3Aのアミノ酸配列(WP_017562367.1;113アミノ酸)
>配列番号50:WP_157293150.1/1-112のDUF3992ドメイン含有タンパク質[バチルス属種ms-22株]
>配列番号51:WP_105925236.1/1-114のDUF3992ドメイン含有タンパク質[バチルス属種LLTC93株]
>配列番号52:OLP66313.1/1-115の仮説的タンパク質:BACPU_06150[バチルス・プミルス(Bacillus pumilus)]
>配列番号53:WP_010787618.1/1-115のDUF3992ドメイン含有タンパク質[バチルス・アトロフェウス(Bacillus atrophaeus)]
>配列番号54:WP_040373377.1/1-116のDUF3992ドメイン含有タンパク質[ペリバチルス・プシクロサッカロリティクス(Peribacillus psychrosaccharolyticus)]
>配列番号55:WP_091498261.1/1-115のDUF3992ドメイン含有タンパク質[アンフィバチルス・マリヌス(Amphibacillus marinus)]
>配列番号56:WP_008633630.1/1-115の複数種:DUF3992ドメイン含有タンパク質[バチルス科(Bacillaceae)]
>配列番号57:WP_124051031.1/1-116のDUF3992ドメイン含有タンパク質[バチルス・エンドフィティクス(Bacillus endophyticus)]
>配列番号58:WP_049679853.1/1-114のDUF3992ドメイン含有タンパク質[ペリバチルス・ロイセレウリエ(Peribacillus loiseleuriae)]
>配列番号59:WP_062184382.1/1-118の複数種:DUF3992ドメイン含有タンパク質[バチルス綱]
>配列番号60:WP_049681018.1/1-118のDUF3992ドメイン含有タンパク質[ペリバチルス・ロイセレウリエ]
>配列番号61:WP_154975023.1/1-118のDUF3992ドメイン含有タンパク質[バチルス・メガテリウム(Bacillus megaterium)]
>配列番号62:WP_048022205.1/1-118のDUF3992ドメイン含有タンパク質[バチルス・アリアバッタイ(Bacillus aryabhattai)]
>配列番号63:WP_036199318.1/1-114のDUF3992ドメイン含有タンパク質[リシニバチルス・シンデュリエンシス(Lysinibacillus sinduriensis)]
>配列番号64:MQR85259.1/1-115のDUF3992ドメイン含有タンパク質[バチルス・メガテリウム(Bacillus megaterium)]
>配列番号65:WP_111616476.1/1-114のDUF3992ドメイン含有タンパク質[バチルス属種YR335株]
>配列番号66:TDL84647.1/1-113のDUF3992ドメイン含有タンパク質[ビブリオ・ブルニフィクス(Vibrio vulnificus)]
>配列番号67:WP_119116371.1/1-114のDUF3992ドメイン含有タンパク質[ペリバチルス・アサヒイ(Peribacillus asahii)]
>配列番号68:WP_000057858.1/1-116のDUF3992ドメイン含有タンパク質[バチルス・セレウス]
>配列番号69:WP_000192611.1/1-114のDUF3992ドメイン含有タンパク質[バチルス・セレウス]
>配列番号70:WP_000057857.1/1-114の複数種:DUF3992ドメイン含有タンパク質[バチルス・セレウス群]
>配列番号71:WP_035510401.1/1-114の複数種:DUF3992ドメイン含有タンパク質[ハロバチルス属(Halobacillus)]
>配列番号72:WP_101934191.1/1-114のDUF3992ドメイン含有タンパク質[ウィルギバチルス・ドクドネンシス(Virgibacillus dokdonensis)]
>配列番号73:WP_149173096.1/1-114のDUF3992ドメイン含有タンパク質[バチルス属種BPN334株]
>配列番号74:AAS42063.1/1-115の仮説的タンパク質:BCE_3153[バチルス・セレウス;ATCC受託番号:10987]
>配列番号75:WP_100527630.1/1-114のDUF3992ドメイン含有タンパク質[ペニバチルス属(Paenibacillus sp.)種GM1FR株]
>配列番号76:WP_026691041.1/1-115のDUF3992ドメイン含有タンパク質[バチルス・アウランティアクス(Bacillus aurantiacus)]
>配列番号77:WP_102693317.1/1-113のDUF3992ドメイン含有タンパク質[ルンメリイバチルス・ピクヌス(Rummeliibacillus pycnus)]
>配列番号78:WP_071391073.1/1-109のDUF3992ドメイン含有タンパク質[アネロバチルス・アルカリジアゾトロフィクス(Anaerobacillus alkalidiazotrophicus)]
>配列番号79:WP_107839371.1/1-111のDUF3992ドメイン含有タンパク質[リシニバチルス・メイエリ(Lysinibacillus meyeri)]
>配列番号80:WP_066166707.1/1-111のDUF3992ドメイン含有タンパク質[メタソリバチルス・フルオログリコフェニリティクス(Metasolibacillus fluoroglycofenilyticus)]
>配列番号81:組換えEna1Aのヌクレオチド配列(配列番号82をコードする;429bp)
>配列番号82:組換えEna1Aのアミノ酸配列(N末端6×Hisタグ及びTEV切断部位を伴う)
MHHHHHHSSGENLYFQGACECSSTVLTCCSDNSSNFVQDKVCNPWSSAEASTFTVYANNVNQNIVGTGYLTYDVGPGVSPANQITVTVLDSGGGTIQTFLVNEGTSISFTFRRFNIIQITTPATPIGTYQGEFCITTRYLMA
>配列番号83:組換えEna1Bのヌクレオチド配列(配列番号84をコードする;399bp)
>配列番号84:組換えEna1Bのアミノ酸配列(N末端6×Hisタグ及びTEV切断部位を伴う)
MHHHHHHSSGENLYFQGNCSTNLSCCANGQKTIVQDKVCIDWTAAATAAIIYADNISQDIYASGYLKVDTGTGPVTIVFYSGGVTGTAVETIVVATGSSASFTVRRFDTVTILGTAAAETGEFCMTIRYTLS
>配列番号85:組換えEna1Cのヌクレオチド配列(配列番号86をコードする;516bp)
>配列番号86:組換えEna1Cのアミノ酸配列(N末端6×Hisタグ及びTEV切断部位を伴う)
MHHHHHHSSGENLYFQGKPHKNIGCFAPLSIICQPTCPCPPPILPPERGDAELVTNEFAGDILISNDFIPISQKQLKQTNTTVNIWKNDGIVSLSGTISIYNNRNSTNALSIQIISSTTNTFTALPGNTISYTGFDLQSVSVIDIPSDPSIYIEGRYCFQLTYCKSKRDCL
>配列番号87:Ena1B_NM_Oslo(合成配列)
>配列番号88:図8における合成ペプチド
>配列番号89:TEV切断部位
>配列番号118~139:N末端モチーフ/C末端モチーフのコンセンサス配列
>配列番号140:Ena1B-DE-HA挿入変異体のアミノ酸配列(Ena1Bである、配列番号8に基づく)
>配列番号141:Ena1B-DE-Flag挿入変異体のアミノ酸配列(Ena1Bである、配列番号8に基づく)
>配列番号142:Ena1B-HI-HA挿入変異体のアミノ酸配列(Ena1Bである、配列番号8に基づく)
>配列番号143:HAタグ
>配列番号144:FLAGタグ
>配列番号145:バチルス・チューリンギエンシスEna2Aのアミノ酸配列(WP_001277540.1)
>配列番号146:バチルス・チューリンギエンシスEna2Cのアミノ酸配列(WP_014481960.1)
>配列番号147~150:C末端モチーフのコンセンサス配列
>配列番号140:Ena1B-DE-HA挿入変異体のアミノ酸配列(Ena1Bである、配列番号8に基づく)
>配列番号141:Ena1B-DE-Flag挿入変異体のアミノ酸配列(Ena1Bである、配列番号8に基づく)
>配列番号142:Ena1B-HI-HA挿入変異体のアミノ酸配列(Ena1Bである、配列番号8に基づく)
>配列番号143:HAタグ
>配列番号144:FLAGタグ
>配列番号145:バチルス・チューリンギエンシスEna2Aのアミノ酸配列(WP_001277540.1)
>配列番号146:バチルス・チューリンギエンシスEna2Cのアミノ酸配列(WP_014481960.1)
>配列番号147~150:C末端モチーフのコンセンサス配列
Claims (22)
- DUF3992ドメインを含む単離された自己アセンブルタンパク質であって、フォールド類似性Zスコアが6.5以上でEna1B構造にマッチする三次元予測フォールドを有し、Ena1Bが、配列番号8に対応する、単離された自己アセンブルタンパク質。
- アミノ酸配列が、配列番号1~80、145若しくは146又はこれらのうちのいずれか1つに対する少なくとも80%の同一性を有するホモログのアミノ酸配列の群から選択される、請求項1に記載の自己アセンブルタンパク質。
- 請求項1又は2のいずれか一項に記載の自己アセンブルタンパク質を含む、操作された自己アセンブルタンパク質。
- 請求項1~3のいずれか一項に記載の少なくとも7つのタンパク質を含む多量体であって、タンパク質が、多量体内に、非共有結合的に連結されたサブユニットとして存在する、多量体。
- 少なくとも1つのサブユニットが、請求項3に記載の操作された自己アセンブルタンパク質である、請求項4に記載の多量体。
- サブユニットが、アミノ酸配列モチーフZXnCCXmC[配列中、Zは、Leu、Ile、Val又はPheであり、nは、1又は2であり、mは、10~12の間である。]を含むN末端領域を含み、サブユニットが、アミノ酸配列モチーフGX2/3CX4Y[配列中、Xは、任意のアミノ酸である。]を含むC末端領域を含む、請求項4又は5に記載の多量体。
- 少なくとも1つの操作された自己アセンブルタンパク質サブユニットのN末端領域が、アミノ酸配列モチーフZXnCCXmC[配列中、mは、13~16の間である、又はmは、7~9である。]を含むことを特徴とする操作された多量体である、請求項6に記載の多量体。
- サブユニットが、アミノ酸配列モチーフZXnC(C)XmC[配列中、Zは、Leu、Ile、Val又はPheであり、nは、1又は2であり、mは、10~12の間であり、(C)は、任意選択的なCysである。]を含むN末端領域を含み、サブユニットが、アミノ酸配列モチーフS-Z-N-Y-X-B[配列中、Zは、Leu又はIleであり、Bは、Phe又はTyrであり、Xは、任意のアミノ酸である。]を含むC末端領域を含む、請求項4又は5に記載の多量体。
- 請求項4~8のいずれかに記載の少なくとも2つの多量体を含む組換え作製タンパク質繊維であって、多量体が長手方向に積み重ねられ、少なくとも1つのジスルフィド結合を介して共有結合的に連結されている、組換え作製タンパク質繊維。
- 請求項4~8のいずれかに記載の少なくとも2つの多量体を含むタンパク質繊維であって、多量体が長手方向に積み重ねられ、少なくとも1つのジスルフィド結合を介して共有結合的に連結されており、多量体の自己アセンブルタンパク質サブユニットが同一である、タンパク質繊維。
- 多量体が少なくとも1つの操作された多量体又は操作された自己アセンブルタンパク質を含むことを特徴とする操作されたタンパク質繊維である、請求項9又は10に記載のタンパク質繊維。
- 以下の作動可能に連結されたDNAエレメント:a)異種プロモーター、及びb)請求項1~3のいずれか一項に記載の自己アセンブルタンパク質をコードする核酸配列を含むキメラ遺伝子。
- 請求項1~3のいずれか一項に記載の自己アセンブルタンパク質、請求項4~8のいずれかに記載の多量体、請求項9~11のいずれかに記載のタンパク質繊維及び/又は請求項12に記載のキメラ遺伝子を含む宿主細胞。
- 請求項1~3のいずれか一項に記載の自己アセンブルタンパク質、請求項4~8のいずれか一項に記載の多量体、請求項9~11のいずれか一項に記載のタンパク質繊維及び/又は請求項12に記載のキメラ遺伝子を含む改変された細菌芽胞。
- 請求項1~3のいずれか一項に記載の自己アセンブルタンパク質、請求項4~8のいずれか一項に記載の多量体及び/又は請求項9~11のいずれか一項に記載のタンパク質繊維を含む改変された表面。
- 請求項1~11のいずれか一項に記載の自己アセンブルタンパク質、多量体又は繊維を作製する方法であって、
a.細胞内における、請求項12に記載のキメラ遺伝子の発現ステップであって、自己アセンブルタンパク質をコードする核酸が、任意選択的に、異種N末端タグ又は異種C末端タグを含む、発現ステップ、並びに任意選択的に
b.細胞からの単量体、多量体又は繊維の形態での自己アセンブルタンパク質の単離ステップ
を含む方法。 - 繊維形成又はエピタキシャル成長が停止された、請求項1~8のいずれか一項に記載の自己アセンブルタンパク質又は多量体を作製する方法であって、請求項16に記載の方法のステップを含み、異種N末端タグ又は異種C末端タグが、少なくとも6つのアミノ酸残基を含む、方法。
- 請求項9~11に記載のタンパク質繊維を作製するインビトロの方法であって、請求項16又は17に記載の方法のステップを含み、タグが、除去可能なタグであり、ステップbの前又は後に、タンパク質サブユニットからタグを除去して、繊維形成を可能とするステップをさらに含む、方法。
- 宿主細胞内において請求項9~11に記載のタンパク質繊維を組換えにより作製する方法であって、請求項16に記載の方法のステップを含み、インセルロ(in cellulo)における繊維形成を可能とするように、異種タグが、自己アセンブルタンパク質サブユニット上に存在せず、かつ/又はステップbにおける任意選択的な単離が細胞の溶解を介して得られる、方法。
- 請求項15に記載の改変された表面を作製する方法であって、請求項16~18のいずれか一項に記載の方法のステップを含み、単量体、多量体又は繊維の表面への共有結合的結合により、表面を改変するステップをさらに含む方法。
- 改変された表面を、請求項1~3のいずれか一項に記載のタンパク質を含むタンパク質溶液へと曝露することによる、多量体又は繊維のエピタキシャル成長のための核生成剤としての請求項15に記載の改変された表面の使用。
- 請求項11に記載の操作されたタンパク質繊維を含み、任意選択的に、請求項9又は10に記載のさらなるタンパク質繊維を含む、タンパク質薄膜又はハイドロゲル。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20189961 | 2020-08-07 | ||
EP20189961.4 | 2020-08-07 | ||
PCT/EP2021/072085 WO2022029325A2 (en) | 2020-08-07 | 2021-08-06 | Novel bacterial protein fibers |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023537054A true JP2023537054A (ja) | 2023-08-30 |
Family
ID=71995804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023508481A Pending JP2023537054A (ja) | 2020-08-07 | 2021-08-06 | 新規の細菌タンパク質繊維 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20230279059A1 (ja) |
EP (1) | EP4192846A2 (ja) |
JP (1) | JP2023537054A (ja) |
KR (1) | KR20230112606A (ja) |
CN (1) | CN116323645A (ja) |
BR (1) | BR112023001842A2 (ja) |
CA (1) | CA3189751A1 (ja) |
WO (1) | WO2022029325A2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114480207B (zh) * | 2022-02-22 | 2023-09-22 | 青岛蔚蓝赛德生物科技有限公司 | 一种太平洋芽孢杆菌及其降解污废水中硫化物的应用 |
WO2024079161A1 (en) | 2022-10-12 | 2024-04-18 | Vib Vzw | Metal-binding bacterial protein fibers |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120014993A1 (en) * | 2010-06-17 | 2012-01-19 | Walker James R | Clostridium taeniosporum spores and spore appendages as surface display hosts, drug delivery devices, and nanobiotechnological structures |
-
2021
- 2021-08-06 BR BR112023001842A patent/BR112023001842A2/pt unknown
- 2021-08-06 US US18/020,068 patent/US20230279059A1/en active Pending
- 2021-08-06 WO PCT/EP2021/072085 patent/WO2022029325A2/en unknown
- 2021-08-06 CN CN202180068575.5A patent/CN116323645A/zh active Pending
- 2021-08-06 JP JP2023508481A patent/JP2023537054A/ja active Pending
- 2021-08-06 KR KR1020237007971A patent/KR20230112606A/ko unknown
- 2021-08-06 CA CA3189751A patent/CA3189751A1/en active Pending
- 2021-08-06 EP EP21765573.7A patent/EP4192846A2/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN116323645A (zh) | 2023-06-23 |
CA3189751A1 (en) | 2022-02-10 |
EP4192846A2 (en) | 2023-06-14 |
WO2022029325A2 (en) | 2022-02-10 |
BR112023001842A2 (pt) | 2023-02-23 |
KR20230112606A (ko) | 2023-07-27 |
US20230279059A1 (en) | 2023-09-07 |
WO2022029325A3 (en) | 2022-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11352397B2 (en) | Genetic reprogramming of bacterial biofilms | |
Dueholm et al. | Expression of Fap amyloids in P seudomonas aeruginosa, P. fluorescens, and P. putida results in aggregation and increased biofilm formation | |
Leiman et al. | Morphogenesis of the T4 tail and tail fibers | |
US20170044220A1 (en) | Expression of triple-helical collagen-like products in e.coli | |
JP6594293B2 (ja) | 三重らせんタンパク質の精製 | |
JP2023537054A (ja) | 新規の細菌タンパク質繊維 | |
KR20180029953A (ko) | 세포 또는 유기체의 게놈으로의 DNA 서열의 표적화 혼입을 위한 Cas 9 레트로바이러스 인테그라제 시스템 및 Cas 9 재조합효소 시스템 | |
EP2764018B1 (en) | Self-assembling polypeptide polyhedra | |
WO2012063088A2 (en) | Collagen | |
JP2023502658A (ja) | 人工ナノポアおよびそれに関する使用および方法 | |
US11365225B2 (en) | Method of making recombinant silk and silk-amyloid hybrid proteins using bacteria | |
Pradhan et al. | Endospore Appendages: a novel pilus superfamily from the endospores of pathogenic Bacilli | |
Prakash et al. | Recombinant production of self-assembling β-structured peptides using SUMO as a fusion partner | |
CN109021086B (zh) | 一种抗菌肽天蚕素a突变体及其编码基因、制备方法和应用 | |
CN111019926A (zh) | Tev蛋白酶变体、其融合蛋白及制备方法和用途 | |
CN107365789A (zh) | 一种重组蛛丝蛋白纳米纤维膜的制备方法 | |
JP7166244B2 (ja) | 改変バクテリオファージ | |
CN113755469B (zh) | 肺炎克雷伯菌荚膜多糖解聚酶及其应用 | |
JP4507080B2 (ja) | 抗菌ペプチド及びその利用 | |
Pradhan et al. | Bacillus endospore appendages form a novel family of disulfide-linked pili | |
WO2024116130A1 (en) | Recombinant polypeptide | |
García-Rodríguez et al. | Similar mechanisms of retron-mediated anti-phage defense for different families of tailed phages | |
WO2024079161A1 (en) | Metal-binding bacterial protein fibers | |
Hawkins | Three Heads are Better Than One: A Structural Look at Staphylococcal Bacteriophage Capsids | |
Hughes | Rational and Computational Design of Superhelical Protein Nanotubes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240510 |