JP2023537054A

JP2023537054A - 新規の細菌タンパク質繊維

Info

Publication number: JP2023537054A
Application number: JP2023508481A
Authority: JP
Inventors: レモート，アン; スルーテル，マイク; アスフォルム，マリーナ; プラダン，ブラヤバンドゥ
Original assignee: フエー・イー・ベー・フエー・ゼツト・ウエー; フリエ・ウニベルシテイト・ブリユツセル; ノルウェージャン・ユニバーシティ・オブ・ライフ・サイエンシーズ
Priority date: 2020-08-07
Filing date: 2021-08-06
Publication date: 2023-08-30
Also published as: CN116323645A; CA3189751A1; EP4192846A2; WO2022029325A2; BR112023001842A2; KR20230112606A; US20230279059A1; WO2022029325A3

Abstract

本発明は、バイオナノ材料としての適用のための、バチルス属（Ｂａｃｉｌｌｕｓ）芽胞付属物（Ｅｎａ）並びに新規タンパク質多量体アセンブリー及び繊維アセンブリーの分野に関する。特に、本発明は、保存されたＮ末端システイン含有領域を含有する、細菌ＤＵＦ３９９２ドメイン含有タンパク質サブユニットから構成された自己アセンブルタンパク質、及び操作されたタンパク質、並びにこれらの多量体及び繊維に関する。さらに、前記自己アセンブルタンパク質サブユニットの組換え発現は、新規のタンパク質ナノ繊維及びバチルス属芽胞などの改変提示表面の作製法をもたらす。最後に、生物医学的適用及び生物工学的適用における前記多量体、繊維及び表面の使用が本明細書において記載される。

Description

本発明は、バイオナノ材料としての適用のための、バチルス属（Ｂａｃｉｌｌｕｓ）芽胞付属物（Ｅｎａ）並びに新規タンパク質多量体アセンブリー及び繊維アセンブリーの分野に関する。特に、本発明は、保存されたＮ末端システイン含有領域を含有する、細菌ＤＵＦ３９９２ドメイン含有タンパク質サブユニットから構成された自己アセンブルタンパク質、及び操作されたタンパク質、並びにこれらの多量体及び繊維に関する。さらに、前記自己アセンブルタンパク質サブユニットの組換え発現は、新規のタンパク質ナノ繊維及びバチルス属芽胞などの改変された提示表面の作製法をもたらす。最後に、生物医学的適用及び生物工学的適用における前記多量体、繊維及び表面の使用が本明細書において記載される。

自己アセンブル分子は、化学的機能性及び形状を制御し、これにより、生物学的活性を制御する魅力的な機会をもたらす。それらのモジュラー性、生体適合性及び生体分解性を含む、タンパク質の固有の特性は、高性能なナノ材料をデザインする、興味深い機会を提供する（ＨｅｒｒｅｒａＥｓｔｒａｄａ及びＣｈａｍｐｉｏｎ、２０１５；Ｊａｉｎら、２０１８）。自然に着想を得て、いくつかのタンパク質／ペプチドが、ナノ粒子、小胞、ケージ及び繊維アセンブリーの範囲の、様々な複合体構造へと自己アセンブルするように操作されており、これらは、生物学的操作された多様な領域において、多数の適用をもたらす、新規の機能性を付与されうる（Ｍａｔｓｕｕｒｕａ、２０１４；Ｋａｔｙａｌら、２０１９）。自己アセンブルペプチド及び自己アセンブルタンパク質のアミノ酸配列の変動並びに環境パラメータの操作は、特性をモジュレートし、自己アセンブリーを制御して、多様な、オンデマンドの超分子的ナノ構造を得ることを可能とする（Ｌｏｍｂａｒｄｉら、２０１９）。アミノ酸内の側鎖の多様な特性は、無限の配列組合せによる、それらの化学修飾に対する可能性をもたらすほか、タンパク質のアミン末端及び／又はカルボキシ末端の改変は、タンパク質ポリマーの、特異的なナノアーキテクチャーへの自己アセンブリーを微調整しうる（Ａｌｕｒｉら、２０１２；Ｙｕら、１９９６）。したがって、天然の自己アセンブルタンパク質又は自己アセンブルペプチドは、自己アセンブリー以外の多様な特性であって、自己治癒、シアーシニング、形状記憶などを含む特性を誘導するように操作されうる（Ｃｈｅｎ及びＺｏｕ、２０１９）。

増殖に不利な条件に直面した場合、ファーミキューテス門（Ｆｉｒｍｉｃｕｔｅｓ）に属する細菌は、代謝的に休眠性であり、非繁殖性である、芽胞状態へと分化しうる。これらの芽胞は、それらの脱水状態及び固有の多層化細胞構造のために、環境ストレス因子に対する、極度の回復力を呈し、それらの形成の数百年後においてもなお、代謝的に活性であり、複製的である、栄養増殖状態へと発芽しうる（Ｓｅｔｌｏｗ、２０１４）。このようにして、バチルス属及びクロストリジウム属（Ｃｌｏｓｔｒｉｄｉａ）に属するファーミキューテスは、長期間にわたる、乾燥、飢餓、高酸素又は抗生剤によるストレスに耐えることが可能である。芽胞は、典型的に、細菌ＤＮＡを含有する、最内部の脱水コアからなる。コアは、芽胞の発芽時に出現する、栄養細胞の細胞壁として機能する、ペプチドグリカンの薄層により取り囲まれた内膜により封入されている。次いで、休眠に必須である、修飾ペプチドグリカンによる、厚い外皮層が現れる（Ａｔｒｉｈ及びＦｏｓｔｅｒ、１９９９）。外皮層は、いくつかのタンパク質性被膜層により取り囲まれている。一部のクロストリジウム属種及び大半のバチルス・セレウス（Ｂａｃｉｌｌｕｓｃｅｒｅｕｓ）群種において、芽胞は、（糖）タンパク質及び脂質からなる、最も外側の、緩い準結晶性外膜層により封入されている（Ｓｔｅｗａｒｔ、２０１５）。バチルス属及びクロストリジウム属芽胞の表面はまた、数マイクロメートル長であり、かつ、数ナノメートル幅である、株及び種の間において、大きな構造的多様性を示す、フィラメント状付属物によっても装飾されうる（Ｈａｃｈｉｓｕｋａ及びＫｕｎｏ、１９７６；Ｒｏｄｅら、１９７１；Ｗａｌｋｅｒら、２００７）。広義におけるバチルス・セレウスは、それらの系統発生関係にもかかわらず、高度な生態的多様性を提示する、グラム陽性芽胞形成菌の群である。これらの芽胞は、それらの脱水状態及び固有の多層化細胞構造のために、環境ストレス因子に対する、極度の回復力を呈し、それらの形成の数百年後においてもなお、代謝的に活性であり、複製的である、栄養増殖状態へと発芽しうる（Ｓｅｔｌｏｗ、２０１４）。Ｂ．セレウス（Ｂ．ｃｅｒｅｕｓ）芽胞は、識別及び機能が未詳である、マイクロメートル長の付属物により装飾されている。芽胞付属物（これ以降Ｅｎａと称される）の数及び形状は、Ｂ．セレウス群の株及び種の間において変動し、一部の株は、なお、異なる形状のＥｎａを、同時に発現させる（Ｓｍｉｒｎｏｖａら、２０１３）。栄養細胞の表面において、Ｅｎａに相似する構造は観察されていないことから、それらが、芽胞特異的繊維を表すことを示唆する。Ｅｎａは、Ｂ．セレウス群に属する株の芽胞の間における、広範な特徴であると考えられる。Ａｎｋｏｌｅｋａｒらは、Ｂ．セレウスの４７の食物分離株の全てが、付属物を伴う芽胞を産生することを示した（Ａｎｋｏｌｅｋａｒ及びＬａｂｂｅ、２０１０）。付属物はまた、Ｂ．セレウスと近縁であり、その殺虫活性について最も良く知られた（Ａｎｋｏｌｅｋａｒ及びＬａｂｂｅ、２０１０）、バチルス・チューリンギエンシスの、食物媒介型腸毒性分離株１２株中１０株（バチルス・チューリンギエンシス）の芽胞上においても見出された。まとめると、これは、これらのＥｎａ構造を、持続可能な新生体材料を操作するための、興味深い出発点とする。目覚ましいことに、Ｂ．セレウス群に属する種における、芽胞付属物の存在は、既に、１９６０年代に報告されたが、それらの組成及び遺伝子同一性を特徴付けようとする取組みは、繊維を可溶化させ、酵素により消化することの困難のために失敗していた（Ｇｅｒｈａｒｄｔ及びＲｉｂｉ、１９６４；ＤｅｓＲｏｓｉｅｒ及びＬａｒａ、１９８１）。したがって、過酷な環境条件下における持続可能性などの特性が改善された、新種類の高性能生体材料の、デザイン、開発及び作製を可能とする、このような芽胞付属物の構造的特徴付けに対する、関心及び必要性が存在する。

ＨｅｒｒｅｒａＥｓｔｒａｄａ及びＣｈａｍｐｉｏｎ、２０１５Ｊａｉｎら、２０１８Ｍａｔｓｕｕｒｕａ、２０１４Ｋａｔｙａｌら、２０１９Ｌｏｍｂａｒｄｉら、２０１９Ａｌｕｒｉら、２０１２Ｙｕら、１９９６Ｃｈｅｎ及びＺｏｕ、２０１９Ｓｅｔｌｏｗ、２０１４Ａｔｒｉｈ及びＦｏｓｔｅｒ、１９９９ＢａｃｉｌｌｕｓｃｅｒｅｕｓＳｔｅｗａｒｔ、２０１５Ｈａｃｈｉｓｕｋａ及びＫｕｎｏ、１９７６Ｒｏｄｅら、１９７１Ｗａｌｋｅｒら、２００７Ｓｅｔｌｏｗ、２０１４Ｓｍｉｒｎｏｖａら、２０１３Ａｎｋｏｌｅｋａｒ及びＬａｂｂｅ、２０１０Ａｎｋｏｌｅｋａｒ及びＬａｂｂｅ、２０１０Ｇｅｒｈａｒｄｔ及びＲｉｂｉ、１９６４ＤｅｓＲｏｓｉｅｒ及びＬａｒａ、１９８１

（発明の要旨）
本発明は、食中毒流行株である、Ｂ．セレウスＮＶＨ－００７５／９５株から単離された芽胞付属物（Ｅｎａ）についての、遺伝子ベース及び構造的ベースの分解することに基づく。２つの主要形状である、Ｓ型繊維及びＬ型繊維のタンパク質性繊維を明らかにした。ｃｒｙｏ－ＥＭ及び三次元ヘリックス再構築を使用することにより、バチルス属芽胞付属物（Ｅｎａ）は、βシートの拡張により、水平方向に積み重ねする多量体を形成する、ゼリーロール状トポロジーを伴うサブユニットにより特徴付けられた、グラム陽性菌線毛の新規クラスを形成することが示された。さらに、Ｅｎａ繊維は、長手方向において、多量体を架橋する、それらのＮ末端タンパク質サブユニットペプチドの伸長を介する、ジスルフィド架橋により安定化される結果として、熱、乾燥及び化学的損傷に対して、高度に抵抗性である、可撓性線毛をもたらす（また、図２も参照されたい）。三次元構造は、Ｅｎａ繊維が、本明細書において、初めて、「Ｅｎａ」タンパク質としてアノテーションされた、各ファミリーメンバーについて、現在のところ機能が未知であり、保存されたＮ末端領域を伴う、細菌ＤＵＦ３９９２ドメイン含有タンパク質のタンパク質ファミリーから構成されることの推定を可能とした。Ｓ型繊維及びＬ型繊維の構成要素についての遺伝子同一性は、潜在的Ｅｎａタンパク質サブユニットをコードする遺伝子を欠く突然変異体についての解析により確認された。系統発生解析は、Ｓ型Ｅｎａ繊維が、Ｂ．セレウス群に属する種のサブセット内に固有に存在する、ジシストロニックオペロンによりコードされることを示し、異なる生態型及び病原型の間において規定されたＥｎａクレードであって、少なくとも２つの保存されたシステイン残基及びスペーサー領域（図８を参照されたい）を伴うＮ末端領域により特徴付けられたＥｎａタンパク質に続き、本明細書において規定された、フォールディング構造への自己アセンブリーを可能とし、多量体アセンブリー又は繊維アセンブリーを結果としてもたらす、ＤＵＦ３９９２ドメインをコードする、一般特徴を有するＥｎａ遺伝子を伴うＥｎａクレードの存在を明らかにした。インビボにおいて、Ｅｎａオペロンにおいてコードされたサブユニットは、Ｅｎａのアセンブリーについて、相互依存的である。驚くべきことに、組換え発現されたＥｎａタンパク質は、個別に、インビボにおけるＥｎａのタンパク質ナノ繊維と類似する特性及び構造を伴う、タンパク質ナノ繊維へと自己アセンブルするように作製されうる。したがって、Ｅｎａは、細菌芽胞が遭遇する、過酷な条件へと特異的に適合された、線毛の新規のクラスを表し、本明細書において、遺伝子ベース及び構造的ベースを明らかにすることにより、次世代生体材料として適用可能な、円板又はヘリックスなどのタンパク質アセンブリーをもたらすように、改変された芽胞又は改変された及び操作されたＥｎａプロトマー若しくは多量体をどのようにして作製するのかについての洞察が確立される。

本発明の第１の態様は、自己アセンブル特性を伴うタンパク質に関し、アミノ酸配列において、ＰＦＡＭ１３１５７クラスに属することを特徴とする、すなわち、その配列内のＤＵＦ３９９２ドメインの存在により特徴付けられ、具体的には、本明細書に提示されたＥｎａタンパク質の三次元構造フォールド、具体的には、Ｅｎａ１Ｂ（配列番号８において示された配列を有する）のフォールドと、ＤａｌｉＺスコアが、６以上、６．５以上又は、好ましくは、（ｎ／１０）－４［式中、ｎは、前記タンパク質配列のアミノ酸数である。］以上として規定された、高度に著しい類似性スコアでマッチすることが必要である。実施形態において、前記自己アセンブルタンパク質サブユニットは、本出願において同定されたＥｎａタンパク質配列を表す、配列番号１～８０、配列番号１４５及び配列番号１４６又は配列番号１～８０、配列番号１４５若しくは配列番号１４６の配列のうちのいずれか１つに対する少なくとも６０％若しくは少なくとも７０％若しくは少なくとも８０％若しくは少なくとも９０％の同一性を有する、任意の原核生物ホモログの群から選択されるアミノ酸配列を含む、細菌由来タンパク質によりもたらされるが、この場合、同一性％は、配列の全長ウィンドウにわたり計算される。実のところ、細菌Ｅｎａファミリーは、下記において記載される、異なるメンバーにさらに分類されるので、本明細書において開示されたＥｎａ１Ｂフォールドにマッチするための、本明細書において記載された構造的要件は、配列番号８の参照構造配列に対する、６０％の同一性をなおも下回る相同性を伴う細菌タンパク質を、さらに表すことが多い。したがって、一実施形態は、表１に示された、その隠れマルコフモデルと連携することにより決定された、ＤＵＦ３９９２ドメインを含み、前記タンパク質サブユニットが、本明細書において規定されたフォールド類似性スコアが６．５以上でＥｎａ１Ｂ構造にマッチする三次元（予測）フォールドを有し、Ｅｎａ１Ｂが、配列番号８に対応し、Ｅｎａ１Ｂの参照構造が、本明細書の表２に提示され、ＰＤＢ７Ａ０２に寄託された座標に対応する、単離された自己アセンブルタンパク質に関する。

具体的な実施形態において、本明細書において言及された自己アセンブルタンパク質は、上記において規定され、かつ／又は配列番号１～８０、配列番号１４５若しくは配列番号１４６において示されたアミノ酸配列によりもたらされた、前記Ｅｎａタンパク質ファミリーに関し、バチルス属のＥｎａ１Ａ（配列番号１～７）、Ｅｎａ１Ｂ（配列番号８～１４）、Ｅｎａ１Ｃ（配列番号１５～２０）、バチルス属のＥｎａ２Ａ（配列番号２１～２８、配列番号１４５）、Ｅｎａ２Ｂ（配列番号２９～３７）、Ｅｎａ２Ｃ（配列番号３８～４８、配列番号１４６）及び他のバチルス属のＥｎａ３（配列番号４９～８０）タンパク質のそれぞれの異なる種類又はこれらのうちのいずれか１つの細菌オーソログについての代表例を提示し、これらは配列番号１～８０、配列番号１４５若しくは配列番号１４６に示された、任意の配列に対する少なくとも８０％の同一性を有する。配列保存の領域及びレベルは、図１６～１９に示された、複数の配列アライメントごとに、Ｅｎａファミリーメンバーについて示される。

さらなる実施形態は、本明細書において記載された、前記自己アセンブルタンパク質に関する。これは、操作された自己アセンブルタンパク質であり、この場合、本明細書において記載された、Ｅｎａフォールド及びＨＭＭプロファイルは、本明細書において記載された、Ｅｎａ１Ｂフォールド及びＤＵＦ３９９２プロファイルとマッチするが、例えば、異種Ｎ末端タグ若しくは異種Ｃ末端タグ及び／又は立体障害、天然Ｅｎａ配列又は野生型Ｅｎａ配列と比較して、１つ以上の突然変異を含有する場合もあり、ペプチド若しくはスキャフォールドの挿入又は多数のアミノ酸の欠失を含有する場合もあり、共インキュベーション時にアセンブルする、「スプリット」部分など、個別のＥｎａタンパク質部分として提供される場合もある、タンパク質配列変異体を含む修飾のうちの少なくとも１つであるがこれらに限定されない修飾を、さらに含むことにより「操作された」又は「修飾」された、Ｅｎａ１Ｂフォールド及びＤＵＦ３９９２プロファイルにマッチする。

本発明の第２の態様は、前記自己アセンブルタンパク質サブユニットのうちの、少なくとも７つを含む、又は含有し、好ましくは、７つ～最大１２の間のサブユニットを含む、又は含有する、タンパク質多量体に関する。これは、非共有結合的に連結される。より具体的に述べると、前記多量体は、βシートの拡張（Ｒｅｍａｕｔ及びＷａｋｓｍａｎ、２００６において記載された、タンパク質間相互作用の原理）を介して、非共有結合的に積み重ねられた、７つ、８つ、９つ、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０以上の、本明細書において規定された、Ｅｎａ自己アセンブルタンパク質サブユニットからなる。具体的な実施形態において、本明細書において記載された、前記多量体は、例えば、前記多量体の、異なるタンパク質サブユニット間のＣｙｓ接続によりもたらされる、共有結合的接続をさらに含みうる（適切な条件下において）。一実施形態において、前記多量体は、「それ自体として」存在する、すなわち、フィラメント集合体又は繊維集合体としてではなく存在するので、非自然発生の多量体アセンブリーである。特に、本明細書において、Ｅｎａタンパク質として規定された、前記自己アセンブルタンパク質サブユニットは、さらなる多量体との、分子間ジスルフィド架橋の形成のために、本明細書において、互換的に使用された、それらのＮ末端領域又はＮ末端接続部において、少なくとも２つの保存されたシステイン残基をさらに含みうる。具体的な実施形態において、多量体アセンブリーは、本明細書においてさらに規定された、又は配列番号１～８０、配列番号１４５又は配列番号１４６において示されたアミノ酸配列によりもたらされた、Ｅｎａタンパク質ファミリーに由来する、７つ～１２のタンパク質サブユニットを含み、バチルス属のＥｎａ１Ａ（配列番号１～７）、Ｅｎａ１Ｂ（配列番号８～１４）、Ｅｎａ１Ｃ（配列番号１５～２０）、バチルス属のＥｎａ２Ａ（配列番号２１～２８、配列番号１４５）、Ｅｎａ２Ｂ（配列番号２９～３７）、Ｅｎａ２Ｃ（配列番号３８～４８、配列番号１４６）及び他のバチルス属のＥｎａ３（配列番号４９～８０）タンパク質のそれぞれの異なる種類又はこれらの細菌オーソログの代表例を提示し、これらは配列番号１～８０、配列番号１４５若しくは配列番号１４６に示された任意の配列に対する少なくとも８０％の同一性を有する。具体的な実施形態は、本明細書において記載された、同一な自己アセンブルタンパク質による、７つ～１２のタンパク質サブユニットを伴う前記多量体に関する。代替的に、多量体は、少なくとも７つのタンパク質サブユニットを含み、この場合、前記タンパク質サブユニットのうちの少なくとも１つは、本明細書において規定され、非自然発生のＥｎａタンパク質に関する、操作されたＥｎａ自己アセンブルタンパク質である。具体的な実施形態において、前記多量体は、少なくとも７つ、好ましくは、最大において１２のＥｎａタンパク質サブユニットを含み、この場合、少なくとも１つのサブユニットは、Ｎ末端及び／又はＣ末端において、立体障害を含み、これにより、多量体が、繊維へと、さらにアセンブルすることを防止する、操作されたＥｎａタンパク質（図１４）である。具体的な実施形態において、前記Ｎ末端又はＣ末端における立体障害は、異種Ｎ末端タグ及び／又は異種Ｃ末端タグである。具体的な実施形態において、立体障害などを形成するための、前記異種Ｎ末端タグ及び／若しくは異種Ｃ末端タグ又は異種Ｎ末端伸長部及び／若しくは異種Ｃ末端伸長部は、最小において、１、２、３、４、５、好ましくは、６アミノ酸残基以上である。ある特定の実施形態は、前記Ｅｎａタンパク質サブユニットが、同一なＥｎａ自己アセンブルタンパク質の場合もあり、異なるＥｎａ自己アセンブルタンパク質の場合もある前記多量体であって、それらのうちの少なくとも１つが、異種Ｎ末端タグ及び／又は異種Ｃ末端タグを含むように操作された前記多量体に関する。代替的に、前記少なくとも１つの操作されたＥｎａタンパク質サブユニットは、Ｅｎａ突然変異タンパク質変異体の場合もあり、融合タンパク質である、又は図１５において例示及び記載され、実施例節において概括された通り、露出ループにおける、ペプチドドメイン又はタンパク質ドメインの挿入を含有する、Ｅｎａタンパク質の場合もある。

具体的な実施形態は、ホモ多量体又はヘテロ多量体である、本明細書において記載された前記多量体に関し、より具体的に述べると、６つ又は７つ～１２のサブユニットからなる多量体に関し、好ましくは、７量体に関するので、７つのサブユニットからなる、若しくは９量体に関するので、９つのサブユニットからなり、これにより、いずれもが、おそらく、円板様多量体を形成する、又は１０量体、１１量体若しくは１２量体に関するので、それぞれ１０、１１若しくは１２のサブユニットからなり、これにより、おそらく、βプロペラ構造による、ヘリックスターン若しくはヘリックスアークを形成する（図１４）。

別の実施形態は、タンパク質サブユニットのＮ末端領域モチーフ内及びＣ末端領域モチーフ内に存在するシステイン（Ｃ）が、１つの多量体を別の多量体へと長手方向において接続する、ジスルフィド架橋を形成しうる（最終的に、図１４Ａ；図１６～１７におけるＳ型繊維へのアセンブリーをもたらす）ように、アミノ酸残基によるコンセンサスモチーフＺＸ_ｎＣＣＸ_ｍＣ［配列中、Ｘは、任意のアミノ酸であり、ｎは、１又は２であり、ｍは、１０～１２の間であり、Ｚは、好ましくは、Ｌｅｕ、Ｉｌｅ、Ｖａｌ又はＰｈｅである。］が存在する、Ｎ末端領域又はＮ末端接続部（Ｎｔｃ）領域を含み、好ましくは、Ｃ末端領域又はＣ末端受容部領域が、コンセンサスモチーフＧＸ_２／３ＣＸ_４Ｙ［配列中、Ｇは、グリシンであり、Ｘは、任意のアミノ酸（２つ又は３つの残基）であり、Ｙは、チロシンである。］を含む、前記自己アセンブルタンパク質のサブユニット又はＤＵＦ３９９２含有自己アセンブルタンパク質サブユニット若しくはＥｎａタンパク質サブユニット若しくは操作されたＥｎａタンパク質サブユニットの多量体に関する。さらなる代替的実施形態は、本明細書において規定された、モチーフＺＸ_ｎＣＣＸ_ｍＣを伴う、Ｎ末端接続部領域を含むが、Ｎ末端スペーサー領域がより短い［配列中、ｍは、７～９である。］、又はＮ末端スペーサー領域がより長い［配列中、ｍは、１３～１６である。］、操作された自己アセンブルタンパク質のサブユニット又は多量体に関する。前記操作された多量体は、自己アセンブルすると、前記スペーサー領域についてのｍが、１０～１２である多量体によりアセンブルされた繊維と比較して、可撓性が小さい、又は剛性が大きい繊維を結果としてもたらす。さらなる代替的実施形態は、タンパク質サブユニットのＮ末端領域モチーフ内及びＣ末端領域モチーフ内に存在するシステイン（Ｃ）が、１つの多量体を別の多量体へと長手方向において接続する、ジスルフィド架橋を形成しうる（最終的に、図１４Ｂ；図１９におけるＬ型繊維へのアセンブリーをもたらす）ように、アミノ酸残基によるコンセンサスモチーフＺＸ_ｎＣ（Ｃ）Ｘ_ｍＣ［配列中、Ｘは、任意のアミノ酸であり、ｎは、１又は２であり、ｍは、１０～１２の間であり、Ｚは、好ましくは、Ｌｅｕ、Ｉｌｅ、Ｖａｌ又はＰｈｅであり、Ｃは、ｃｙｓであり、（Ｃ）は、任意選択的なＣｙｓであり、これは、１つ又は２つのｃｙｓが、これらのＥｎａタンパク質のための前記モチーフ内に存在することを意味する（本明細書では、最終的に、Ｅｎａ３タンパク質として、さらに分類される）］が存在する、Ｎ末端領域又はＮ末端接続部領域を含み、好ましくは、Ｃ末端領域又はＣ末端受容部領域が、コンセンサスモチーフＳ－Ｚ－Ｎ－Ｙ－Ｘ－Ｂ［配列中、Ｚは、Ｌｅｕ又はＩｌｅであり、Ｂは、Ｐｈｅ又はＴｙｒであり、Ｘは、任意のアミノ酸である。］を含む、前記Ｅｎａタンパク質サブユニットにより構成された、前記自己アセンブルタンパク質のサブユニット又は多量体に関する。

本発明の別の態様は、本明細書において記載された前記多量体のうちの、少なくとも２つを含むように作製されたタンパク質繊維に関し、この場合、前記多量体は、ジスルフィド結合を介して、より具体的に述べると、少なくとも１つのジスルフィド結合、好ましくは、２つ以上のジスルフィド結合を介して、長手方向において架橋することを妨げられない。前記ジスルフィド結合は、長手方向において形成されたタンパク質繊維の先行層を構成する多量体の、１つ以上のサブユニットの、Ｎ末端領域内及び／又はＣ末端領域内に、１つ以上のシステイン残基が存在する多量体の、１つ以上のサブユニットの、Ｎ末端領域又はＮ末端接続部のシステイン残基の側鎖の間において形成されうる。前記タンパク質繊維は、組換えにより作製された繊維でありうる。

別の実施形態において、前記タンパク質繊維は、本明細書において規定された操作された多量体である少なくとも１つの多量体、又は本明細書において規定された少なくとも１つの操作されたＥｎａタンパク質を含む少なくとも１つの多量体のうちの少なくとも２つの多量体を含む、操作されたタンパク質繊維である。好ましい実施形態において、タンパク質繊維は、タンパク質サブユニットが、本明細書において記載された、同一な自己アセンブルタンパク質サブユニットを含み、かつ／又は同一なＥｎａタンパク質から構成される多量体を含む。

本発明の別の態様は、（操作された）自己アセンブルタンパク質、好ましくは、本明細書において規定されたＥｎａタンパク質のコード配列を含むＤＮＡエレメントに作動可能に連結された、プロモーター又は調節配列エレメントを含む、キメラ遺伝子構築物に関する。より具体的に述べると、前記コード配列は、配列番号１～８０、配列番号１４５若しくは配列番号１４６に示されたＥｎａタンパク質又は配列番号１～８０、配列番号１４５若しくは配列番号１４６のうちのいずれかに対する少なくとも８０％のアミノ酸同一性を有する、Ｅｎａ１／Ｅｎａ２Ａ、Ｅｎａ１／Ｅｎａ２Ｂ、Ｅｎａ１／Ｅｎａ２Ｃ又はＥｎａ３Ａを含む前記Ｅｎａファミリーメンバーのうちのいずれかの機能的ホモログを含むタンパク質をコードする場合もあり、本明細書において規定された、これらの操作されたＥｎａタンパク質形態をコードする場合もある。具体的な実施形態において、前記プロモーター又は調節エレメントは、コード配列に対して、異種であり、作動可能に連結され、任意選択的に、当技術分野において公知の、誘導的プロモーターである。

さらなる実施形態は、本明細書において記載されたキメラ遺伝子の発現又は本明細書において記載された、多量体若しくはタンパク質アセンブリーの、自己アセンブルプロトマーの発現のための宿主細胞に関する。別の実施形態は、本明細書において記載されたキメラ遺伝子又は操作されたＥｎａ遺伝子又は操作されたＥｎａタンパク質をコードする遺伝子を含む、改変された芽胞形成細胞又は改変された芽胞形成細菌に関する。別の実施形態は、Ｅｎａタンパク質若しくはこれらの操作された形態又は本明細書において記載された多量体を含み、かつ／若しくは提示する、又はタンパク質繊維、特に、操作されたタンパク質繊維若しくは修飾タンパク質繊維、本明細書において記載された、組換え作製繊維若しくは組換え作製芽胞を有する、改変された細菌芽胞、特に、改変されたバチルス属芽胞に関する。

本発明のさらなる態様において、本明細書において記載された、Ｅｎａタンパク質、多量体アセンブリー若しくはタンパク質繊維又はこれらのいずれかの操作された形態を含む、改変された表面又は固体支持体が提供される。前記改変された表面は、前記Ｅｎａタンパク質、多量体又は繊維の、前記表面への共有結合的接合により構成され、細胞表面の場合もあり、人工表面、特に、任意の種類の材料固体表面の場合もある。したがって、前記改変された表面は、例えば、前記改変された表面が、Ｅｎａタンパク質溶液へと、曝露された又は接触された場合に、タンパク質繊維のエピタキシャル成長のための、核生成剤として使用される場合があり、この場合、前記Ｅｎａタンパク質は、好ましくは、単量体形態又はオリゴマー形態において存在する。

さらなる実施形態は、操作されたＥｎａタンパク質繊維及び／又は本明細書において記載されたＥｎａタンパク質繊維を含み、膜が、好ましくは、当技術分野において公知の薄膜である、タンパク質膜に関する。代替的に、本明細書において記載された、操作されたタンパク質繊維及び／又は本明細書において記載された、Ｅｎａタンパク質繊維を含むハイドロゲルが本明細書において開示される。さらなる実施形態は、より太いスレッド様バンドルへと紡がれた、操作されたタンパク質繊維を含むナノワイヤーに関する。

本発明の最後の態様は、本明細書において記載されたタンパク質アセンブリー、より詳細には、Ｅｎａタンパク質、多量体アセンブリー及び繊維アセンブリー又は改変された表面、特に、本明細書において記載された、芽胞表面又は合成表面を組換えにより作製する方法に関する。

一実施形態は、自己アセンブルＤＵＦ３９９２ドメイン含有単量体又は本明細書において記載された多量体を作製する方法であって、
ａ）本明細書において記載されたキメラ遺伝子構築物を、宿主細胞内において、又は本明細書において記載された宿主細胞を使用して発現させるステップであって、自己アセンブルタンパク質サブユニットが、任意選択的に、Ｎ末端タグ及び／又はＣ末端タグを含むステップ、並びに（任意選択的に）
ｂ）自己アセンブルされたＤＵＦ３９９２ドメイン含有タンパク質又は多量体を精製するステップであって、後者が、発現されたタンパク質サブユニットのオリゴマー化の後において形成されるステップ
を含む方法について記載する。

別の実施形態は、繊維アセンブリー又はエピタキシャル成長が停止された、又は少なくとも妨げられた、自己アセンブルＤＵＦ３９９２ドメイン含有タンパク質又はＥｎａタンパク質を、組換えにより作製する方法であり、したがって、繊維成長が遮断された、操作されたＥｎａタンパク質を、組換えにより作製する方法であって、上記において記載された方法を含み、Ｎ末端タグ及び／又はＣ末端タグが、長手方向の繊維形成において、タンパク質サブユニット又は多量体の自己アセンブリーに立体障害をもたらすように、少なくとも１、好ましくは少なくとも６、より好ましくは少なくとも９、又は１５アミノ酸の長さである方法をもたらす。さらなる実施形態において、前記Ｎ末端タグ又はＣ末端タグは、長手方向の剛性繊維形成において、タンパク質サブユニット又は多量体の自己アセンブリーを可逆的に妨げる、又は阻むように、少なくとも６アミノ酸の長さである。前記の場合、Ｎ末端タグ又はＣ末端タグは、例えば、プロテアーゼによるタグの除去並びにサブユニット及び多量体のアセンブリーの立体障害を反転させるための、プロテアーゼ認識配列を含むことにより、除去可能なタグでありうる。

別の実施形態は、本明細書において記載されたタンパク質繊維を作製する方法であって、上記の方法のステップａ）及びｂ）を含み、Ｎ末端タグ及び／又はＣ末端タグが、除去可能なタグ又は切断可能なタグとして存在し、ステップｃ）をさらに含み、形成された多量体の、タンパク質繊維への、さらなる自己アセンブリーを可能とするように、Ｎ末端タグ及び／又はＣ末端タグが、除去又は切断される方法に関する。代替的に、ステップｃ）は、精製ステップｂ）の前に行われる場合もある。さらに、本明細書において記載された改変された表面を作製する方法であって、ステップａ）、ｂ）及び／又はｃ）（又は、逆に、ｃ）及び／若しくはｂ））を含み、ステップｄ）をさらに含み、表面が、（操作された）Ｅｎａタンパク質、多量体又は繊維を、前記表面へと提示する、又は共有結合的に接合させることにより改変される方法も提示される。

最後に、本明細書において記載された繊維など、タンパク質アセンブリーは、Ｅｎａタンパク質繊維の組換え作製のための方法であって、
ａ）本明細書において記載された、キメラ遺伝子構築物を、宿主細胞内において、若しくは本明細書において記載された宿主細胞を使用して発現させるステップ又はＥｎａタンパク質若しくは本明細書において記載された、操作されたＥｎａタンパク質を発現させるステップであって、タンパク質サブユニットが、立体障害を有さないので、自己アセンブルタンパク質が、遊離Ｎ末端接続部を伴う、野生型又は操作された自己アセンブルＥｎａタンパク質からなるステップ、並びに（任意選択的に）
ｂ）細胞質内において発現されたタンパク質サブユニットのオリゴマー化の後において形成された、繊維又は多量体などのＥｎａタンパク質アセンブリーを単離するステップ
を含む方法において示された通りに、細胞内において作製される。

記載された図面は、概略図に過ぎず、非限定的なものである。図面において、要素の一部の大きさは、例示を目的として誇張され、縮尺通りではない場合がある。

バチルス・セレウス芽胞が、Ｓ型Ｅｎａ及びＬ型Ｅｎａを保有することを示す。（Ａ、Ｂ）Ｂ．セレウスＮＶＨ００７５／９５株芽胞についてのネガティブ染色ＴＥＭ画像。芽胞体（ＳＢ）、外膜（Ｅ）及び芽胞付属物（Ｅｎａ）を示し、芽胞から、個別に、又は繊維クラスター（枠囲い）として出現する。芽胞遠位末端において、Ｅｎａは、単一又は複数のラッフル薄膜（Ｒ）により終結する。（Ｃ、Ｄ）単繊維についてのｃｒｙｏＴＥＭ画像及び陰性染色における、Ｓ型（Ｃ）Ｅｎａ及びＬ型Ｅｎａ（Ｄ）の二次元クラス平均像である。（Ｅ）Ｓ型Ｅｎａ及びＬ型Ｅｎａの全長分布及び芽胞１個当たりのＥｎａ数（挿入図）である（バッチ５つに由来する芽胞１５０個に由来するｎ＝１０２３）。また、図７も参照されたい。バチルス・セレウス芽胞が、Ｓ型Ｅｎａ及びＬ型Ｅｎａを保有することを示す。（Ａ、Ｂ）Ｂ．セレウスＮＶＨ００７５／９５株芽胞についてのネガティブ染色ＴＥＭ画像。芽胞体（ＳＢ）、外膜（Ｅ）及び芽胞付属物（Ｅｎａ）を示し、芽胞から、個別に、又は繊維クラスター（枠囲い）として出現する。芽胞遠位末端において、Ｅｎａは、単一又は複数のラッフル薄膜（Ｒ）により終結する。（Ｃ、Ｄ）単繊維についてのｃｒｙｏＴＥＭ画像及び陰性染色における、Ｓ型（Ｃ）Ｅｎａ及びＬ型Ｅｎａ（Ｄ）の二次元クラス平均像である。（Ｅ）Ｓ型Ｅｎａ及びＬ型Ｅｎａの全長分布及び芽胞１個当たりのＥｎａ数（挿入図）である（バッチ５つに由来する芽胞１５０個に由来するｎ＝１０２３）。また、図７も参照されたい。Ｓ型Ｅｎａの、ｃｒｙｏＴＥＭ構造を示す。（Ａ、Ｂ）ｃｒｙｏＴＥＭにより観察された、Ｂ．セレウスＮＶＨ００７５／９５株のＳ型Ｅｎａの、代表的二次元クラス平均像（Ａ）と対応するパワースペクトル（Ｂ）である。ヘリックス対称性を導出するのに使用されたベッセル次数が指し示される。（Ｃ）エクスビボにおけるＳ型Ｅｎａについて再構成された、ｃｒｙｏＥＭによる電位マップである（分解能を３．２Åとする）。（Ｄ）リボン表示法及び分子表面法により示されたＳ型Ｅｎａについての、デノボにおいて構築された三次元モデルの、ヘリックス１ターン分の側面図及び上面図である。Ｅｎａサブユニットは、ｉ～ｉ－１０と表示される。（Ｅ）Ｓ型Ｅｎａ１Ｂサブユニット（Ｎ末端～Ｃ末端における、青～赤のレインボー）についての、リボン表示及びトポロジー図並びにジスルフィド架橋を介する、サブユニットｉ－９（黄土色）及びｉ－１０（緑）とのその相互作用である。Ｓ型Ｅｎａの、ｃｒｙｏＴＥＭ構造を示す。（Ａ、Ｂ）ｃｒｙｏＴＥＭにより観察された、Ｂ．セレウスＮＶＨ００７５／９５株のＳ型Ｅｎａの、代表的二次元クラス平均像（Ａ）と対応するパワースペクトル（Ｂ）である。ヘリックス対称性を導出するのに使用されたベッセル次数が指し示される。（Ｃ）エクスビボにおけるＳ型Ｅｎａについて再構成された、ｃｒｙｏＥＭによる電位マップである（分解能を３．２Åとする）。（Ｄ）リボン表示法及び分子表面法により示されたＳ型Ｅｎａについての、デノボにおいて構築された三次元モデルの、ヘリックス１ターン分の側面図及び上面図である。Ｅｎａサブユニットは、ｉ～ｉ－１０と表示される。（Ｅ）Ｓ型Ｅｎａ１Ｂサブユニット（Ｎ末端～Ｃ末端における、青～赤のレインボー）についての、リボン表示及びトポロジー図並びにジスルフィド架橋を介する、サブユニットｉ－９（黄土色）及びｉ－１０（緑）とのその相互作用である。Ｎｔｃリンカーが、Ｓ型Ｅｎａへと、高度の可撓性及び弾性を与えることを示す。（Ａ）ちょうどヘリックス１９ターンを含む、Ｕ字型ターンをもたらす、単離Ｓ型Ｅｎａについての、ｃｒｙｏＴＥＭ画像である（オレンジにおいて概略表示されている）。（Ｂ、Ｃ）Ｎｔｃリンカー（残基１２～１７）の結果としての、Ｅｎａ１Ｂのゼリーロール状ドメイン間の、長手方向の間隔を強調する、Ｓ型Ｅｎａモデルについての、断面図及び三次元ｃｒｙｏＴＥＭ電位マップである。（Ｄ）陰性染色における、内生胞子会合Ｓ型Ｅｎａの二次元クラス平均像は、ピッチ及び軸方向曲率の変動を示す。ｒｅｃＥｎａ１Ｂナノ繊維についての、これらの構造的データは、リンカー領域を、部位として同定し、繊維の剛性及び可撓性を操作及びモジュレートする。Ｅｎａが、バイシストロニックであり、芽胞形成時に発現されることを示す。（Ａ）Ｅｎａ遺伝子の染色体内組織化及び転写物解析のために使用されたプライマー（矢印）である。（Ｂ）表示のプライマー対及び液体培養物中の、８及び１６時間にわたる増殖の後に、ＮＶＨ００７５／９５株から単離された、ｍＲＮＡから作製されたｃＤＮＡ又は対照としてのゲノムＤＮＡを使用する、ＰＣＲ産物についての、アガロースゲル電気泳動（１％）解析である。Ｅｎａ１Ｃの発現が、主要な付属物の構成要素である、Ｅｎａ１Ａ及びＥｎａ１Ｂより、目覚ましく高度であったことは注目される。（Ｃ）１６時間にわたる、Ｂ．セレウスＮＶＨ００７５／９５株の増殖時において、ｑＲＴ－ＰＣＲにより決定された、Ｅｎａ１Ａ（ｘ）、Ｅｎａ１Ｂ（▲）、Ｅｎａ１Ｃ（○）及びｄｅｄＡ（●）の、ｒｐｏＢと比べた転写レベルである。点線は、ＯＤ_６００の増大により測定された、細菌の増殖を表す。ウィスカーは、３回にわたる独立の実験の標準偏差を表す。Ｓ型Ｅｎａ及びＬ型Ｅｎａの組成を示す。（Ａ）Ｅｎａ１Ａ、Ｅｎａ１Ｂ、Ｅｎａ１Ａ及びＥｎａ１Ｂ又はＥｎａ１Ｃのほか、プラスミド（ｐＡＢ）に由来するＥｎａ１Ａ－Ｅｎａ１Ｂにより補完された、Ｅｎａ１Ｂの突然変異体を欠く、ＮＶＨ００７５／９５株突然変異体の芽胞についての代表的陰性染色画像である。挿入図は、それぞれの突然変異体において観察されたＥｎａの二次元クラス平均像である。（Ｂ）野生型ＮＶＨ００７５／９５株芽胞上及び突然変異体ＮＶＨ００７５／９５株芽胞上において見出されたＥｎａの全長分布及び数である。統計学的解析：野生型に対する、対応のあるマン－ホイットニーＵ検定である（芽胞のｎ：≧１８である；Ｅｎａのｎ：≧５０である；ｎｓ：^＊ｐ＜０．０５、^＊＊ｐ＜０．０１、^＊＊＊ｐ＜０．００１及び^＊＊＊＊ｐ＜０．０００１としたときに非有意である；－－－：平均値±標準偏差）。Ｅｎａが、病原性バチルス属において、広範に見られることを示す。（Ａ）ＥｎａＡ－ＥｎａＣのオーソログ及びホモログの集団の間において、平均アミノ酸配列同一性を指し示した、Ｅｎａ１遺伝子座及びＥｎａ２遺伝子座である。Ｅｎａ１Ｃは、顕著に大きな変動を示し、Ｂ．シトトキシクス（Ｂ．ｃｙｔｏｔｏｘｉｃｕｓ）において、Ｅｎａ１Ｃ及びＥｎａ２Ｃのいずれとも異なる（図１１Ｃを参照されたい）のに対し、他の種のゲノムは、ＥｎａＣを、異なる遺伝子座に配置している（Ｂ．ミコイデス（Ｂ．ｍｙｃｏｉｄｅｓ）の２つの分離株に該当する）。（Ｂ）バチルス属種の間における、Ｅｎａ１／Ｅｎａ２Ａ－Ｅｎａ２Ｃの分布である。Ｍａｓｈｔｒｅｅ（Ｋａｔｚら、２０１９；Ｏｎｄｏｖら、２０１６）により創出され、Ｍｉｃｒｏｒｅａｃｔ（Ａｒｇｉｍｏｎら、２０１６）において視覚化された、Ｂ．セレウスｓ．ｌ．群及びＢ．スブティリス（Ｂ．ｓｕｂｔｉｌｉｓ）の全ゲノムクラスター化である。Ｂ．スブティリスに根ざす。種についての形質（有色ノード）、これを取り巻く４つのリング上における、Ｂａｚｉｎｅｔによるクレード及びＥｎａの存在が、内側から外側へと、以下の順序において指し示される：クレードは、Ｂａｚｉｎｅｔ、２０１７（入手可能な場合）（Ｂａｚｉｎｅｔ、２０１７）に従いアノテーションされており、ＥｎａＡ、ＥｎａＢ及びＥｎａＣの存在（Ｅｎａ１：青緑、Ｅｎａ２：オレンジ、異なる遺伝子座：シアン）。ホモログ又はオーソログが見出されなかった場合、リングは、グレーである。Ｅｎａ１Ａ－Ｅｎａ１Ｃ及びＥｎａ２Ａ－Ｅｎａ２Ｃは、タンパク質が、対応するゲノム内において、ＮＭＨ００９５／７５株のＥｎａ１Ａ－Ｅｎａ１Ｃと、＞９０％のカバレッジ並びに、それぞれ、＞８０％及び５０～６５％の配列同一性を有することが見出される場合に、オーソログ又はホモログであると規定される。Ｉｎｔｅｒａｃｔｉｖｅｔｒｅｅは、ｈｔｔｐｓ：／／ｍｉｃｒｏｒｅａｃｔ．ｏｒｇ／ｐｒｏｊｅｃｔ／５ＵｉｘｘＥＹ９ｖｒ２ＡＶｚＸＤＶｗａ５ｔ／８ｂｃａｅ８２ｄにおいてアクセス可能である。Ｅｎａの形状及び頑健性を示す。（Ａ、Ｂ）２つのＥｎａ形状：Ｓ型（黒矢印）及びＬ型Ｅｎａ（白矢印）（Ａ）の表示を伴う、Ｂ．セレウスＮＶＨ００７５／９５株芽胞についての陰性染色ＴＥＭである。ほどけて、個々のＥｎａ繊維（Ｂ）へと分かれた、Ｓ型Ｅｎａバンドルについての拡大図である。（Ｃ）エクスビボにおける、単離Ｓ型Ｅｎａについての、陰性染色ＴＥＭ画像である。異なるストレス下において、Ｅｎａの安定性について調べるために、試料を、左から右へと、（１）非処理対照、（２）１時間にわたる、１ｍｇ／ｍｌのプロテイナーゼＫ、（３）オートクレーブ処理（すなわち、１２１℃において、２０分間にわたる）又は（４）４３℃における、４時間にわたる乾燥処理により処理した。挿入図は、処理されたＥｎａの構造的完全性について評価するための、二次元クラス平均像を示す。Ｓ型Ｅｎａは、一部の繊維が、乾燥処理時に、サブユニットの完全性を喪失すると考えられる（挿入図）が、プロテイナーゼＫ処理、オートクレーブ処理及び４３℃における乾燥処理に対して抵抗性であることが見出される。４３℃における乾燥処理は、乾燥時に、バチルス属芽胞が遭遇する条件を模倣しうる。Ｓ型Ｅｎａの構造決定及び組換え作製を示す。（Ａ）分解能を３．２Åとする、エクスビボにおけるＳ型Ｅｎａについての、三次元ｃｒｙｏＥＭ電位マップの代表的領域である。ＦＣＭＴＩＲＹ（配列番号８８）の配列を有するオクタマーペプチドを、ｃｒｙｏＥＭ電位マップ（スティックにより示されている）から、デノボにおいて推定し、Ｂ．セレウスＮＶＨ００７５／９５株ゲノムのＢＬＡＳＴ検索のために使用した。（Ｂ）ＤＵＦ３９９２含有タンパク質に対応する、３つのＯＲＦ（ＫＭＰ９１６９７．１：配列番号１のＥｎａ１Ａ、ＫＭＰ９１６９８．１：配列番号８のＥｎａ１Ｂ及びＫＭＰ９１６９９．１：配列番号１５のＥｎａ１Ｃ）の、複数の配列アライメントであり、このうち、前者２つは、ＥＭ電位マップから推定された配列モチーフに対応する、又はこれと類似する配列モチーフ（シアンにより影を付されている）を含有する。本明細書において、３つのＯＲＦは、Ｓ型Ｅｎａサブユニットに対応することが示され（明細書本文を参照されたい）、本明細書の下記において、それぞれ、Ｅｎａ１Ａ、Ｅｎａ１Ｂ及びＥｎａ１Ｃと称される。構築されたモデルから決定された二次構造及び構造エレメント（図２を参照されたい）は、配列の上方に、概略的に示される（Ｎｔｃ：Ｎ末端接続部；矢印は、図２に表示の通り、β鎖に対応する）。（Ｃ）Ｅ．コリ（Ｅ．ｃｏｌｉ）内において発現され、変性条件（８Ｍの尿素）下においてアフィニティー精製され、表示の通りに、β－メルカプトエタノール又はＴＥＶプロテアーゼ（Ｎ末端の６－Ｈｉｓタグを除去する）により処理された、組換えＥｎａ１ＢについてのＳＤＳＰＡＧＥである。ＴＥＶによる切断は、見かけの分子量を、Ｅｎａ１Ｂ単量体の予測分子量に対応する、１２．１ＫＤａとする分子種を結果としてもたらす。（Ｄ）リフォールディング後に形成された、ｒｅｃ１Ｅｎａ１Ｂオリゴマーについての、陰性染色ＴＥＭ画像である。（Ｅ）ｒｅｃＥｎａ１Ｂオリゴマーが、寸法及び形状において、Ｓ型Ｅｎａ繊維内に見出された、ヘリックス１ターン又はこのアークと類似する、開いた三日月形を形成することを示す拡大図である（モデル：右）。Ｎ末端Ｈｉｓタグによる立体障害は、ｒｅｃＥｎａ１Ｂの、単一のヘリックスアークへの重合を停止させると考えられる。（Ｆ）ｒｅｃＥｎａ１ＢのＴＥＶ消化の後に形成された、Ｅｎａ様繊維の陰性染色画像及び二次元クラス分け像である。Ｎ末端Ｈｉｓタグを除去すると、ｒｅｃＥｎａ１Ｂは、エクスビボにおいて、Ｓ型Ｅｎａについて見出された繊維に近似するヘリックス特性を伴う繊維へと、たやすくアセンブルする。Ｓ型Ｅｎａの構造決定及び組換え作製を示す。（Ａ）分解能を３．２Åとする、エクスビボにおけるＳ型Ｅｎａについての、三次元ｃｒｙｏＥＭ電位マップの代表的領域である。ＦＣＭＴＩＲＹ（配列番号８８）の配列を有するオクタマーペプチドを、ｃｒｙｏＥＭ電位マップ（スティックにより示されている）から、デノボにおいて推定し、Ｂ．セレウスＮＶＨ００７５／９５株ゲノムのＢＬＡＳＴ検索のために使用した。（Ｂ）ＤＵＦ３９９２含有タンパク質に対応する、３つのＯＲＦ（ＫＭＰ９１６９７．１：配列番号１のＥｎａ１Ａ、ＫＭＰ９１６９８．１：配列番号８のＥｎａ１Ｂ及びＫＭＰ９１６９９．１：配列番号１５のＥｎａ１Ｃ）の、複数の配列アライメントであり、このうち、前者２つは、ＥＭ電位マップから推定された配列モチーフに対応する、又はこれと類似する配列モチーフ（シアンにより影を付されている）を含有する。本明細書において、３つのＯＲＦは、Ｓ型Ｅｎａサブユニットに対応することが示され（明細書本文を参照されたい）、本明細書の下記において、それぞれ、Ｅｎａ１Ａ、Ｅｎａ１Ｂ及びＥｎａ１Ｃと称される。構築されたモデルから決定された二次構造及び構造エレメント（図２を参照されたい）は、配列の上方に、概略的に示される（Ｎｔｃ：Ｎ末端接続部；矢印は、図２に表示の通り、β鎖に対応する）。（Ｃ）Ｅ．コリ（Ｅ．ｃｏｌｉ）内において発現され、変性条件（８Ｍの尿素）下においてアフィニティー精製され、表示の通りに、β－メルカプトエタノール又はＴＥＶプロテアーゼ（Ｎ末端の６－Ｈｉｓタグを除去する）により処理された、組換えＥｎａ１ＢについてのＳＤＳＰＡＧＥである。ＴＥＶによる切断は、見かけの分子量を、Ｅｎａ１Ｂ単量体の予測分子量に対応する、１２．１ＫＤａとする分子種を結果としてもたらす。（Ｄ）リフォールディング後に形成された、ｒｅｃ１Ｅｎａ１Ｂオリゴマーについての、陰性染色ＴＥＭ画像である。（Ｅ）ｒｅｃＥｎａ１Ｂオリゴマーが、寸法及び形状において、Ｓ型Ｅｎａ繊維内に見出された、ヘリックス１ターン又はこのアークと類似する、開いた三日月形を形成することを示す拡大図である（モデル：右）。Ｎ末端Ｈｉｓタグによる立体障害は、ｒｅｃＥｎａ１Ｂの、単一のヘリックスアークへの重合を停止させると考えられる。（Ｆ）ｒｅｃＥｎａ１ＢのＴＥＶ消化の後に形成された、Ｅｎａ様繊維の陰性染色画像及び二次元クラス分け像である。Ｎ末端Ｈｉｓタグを除去すると、ｒｅｃＥｎａ１Ｂは、エクスビボにおいて、Ｓ型Ｅｎａについて見出された繊維に近似するヘリックス特性を伴う繊維へと、たやすくアセンブルする。天然Ｓ型Ｅｎａが、Ｅｎａ１Ａサブユニット及びＥｎａ１Ｂサブユニットの両方から構成されることを示す。（Ａ）カットオフを０．１４３として、３．２Åの最終分解能を指し示す、ｒｅｃＥｎａ１Ｂのヘリックス再構築についての、ＦＳＣ曲線及び局所分解能ヒートマップ（挿入図）である。ＦＳＣ曲線及び局所分解能は、ＲＥＬＩＯＮ３．０において、ヘリックス３ターンからなる、溶媒マスクを使用する、ポストプロセシングにより計算した。（Ｂ、Ｃ）精緻化Ｅｎａ１Ｂモデルを、マップへとドッキングさせて、エクスビボ（Ｂ）及びｒｅｃＥＮＡ１Ｂフィラメント（Ｃ）から計算されたｃｒｙｏＥＭマップについての、並列対照比較である。エクスビボＥｎａマップは、Ｅｎａ１Ａ配列内の、アミノ酸挿入領域に対応する、ループ３（Ｌ３）及びループ７（Ｌ７）（図８Ｂ）の近傍において、Ｅｎａ１Ｂモデルにより説明されなかった特徴を示す。（Ｄ）単一のＥｎａ１Ｂサブユニットにわたりマスキングされ、ＣＣＰＥＭパッケージ（Ｂｕｒｎｌｅｙら、２０１７）に由来する、ＴＥＭＰｙ：Ｄｉｆｆｍａｐ（Ｆａｒａｂｅｌｌａら、２０１５）により計算された、ｒｅｃＥｎａ１Ｂマップ（ピンク）及びｒｅｃＥｎａ１Ｂ／エクスビボ差違マップ（緑）である。両マップの差違は、Ｌ３、Ｌ７及びＮｔｃのコンフォメーションに位置特定された。（Ｅ）左から右へと、各々が、金（１０ｎｍ）標識化抗ウサギＩｇＧを二次抗体とする、抗Ｅｎａ１Ａ血清、抗Ｅｎａ１Ｂ血清及び抗Ｅｎａ１Ｃ血清により染色された、エクスビボにおけるＳ型Ｅｎａについての免疫金ＴＥＭである。Ｅｎａ１Ａ血清及びＥｎａ１Ｂ血清による特異的染色は、天然Ｅｎａ内の、両方のサブユニットの存在を確認する。Ｅｎａ１Ｃ血清による染色は、見られなかった。天然Ｓ型Ｅｎａが、Ｅｎａ１Ａサブユニット及びＥｎａ１Ｂサブユニットの両方から構成されることを示す。（Ａ）カットオフを０．１４３として、３．２Åの最終分解能を指し示す、ｒｅｃＥｎａ１Ｂのヘリックス再構築についての、ＦＳＣ曲線及び局所分解能ヒートマップ（挿入図）である。ＦＳＣ曲線及び局所分解能は、ＲＥＬＩＯＮ３．０において、ヘリックス３ターンからなる、溶媒マスクを使用する、ポストプロセシングにより計算した。（Ｂ、Ｃ）精緻化Ｅｎａ１Ｂモデルを、マップへとドッキングさせて、エクスビボ（Ｂ）及びｒｅｃＥＮＡ１Ｂフィラメント（Ｃ）から計算されたｃｒｙｏＥＭマップについての、並列対照比較である。エクスビボＥｎａマップは、Ｅｎａ１Ａ配列内の、アミノ酸挿入領域に対応する、ループ３（Ｌ３）及びループ７（Ｌ７）（図８Ｂ）の近傍において、Ｅｎａ１Ｂモデルにより説明されなかった特徴を示す。（Ｄ）単一のＥｎａ１Ｂサブユニットにわたりマスキングされ、ＣＣＰＥＭパッケージ（Ｂｕｒｎｌｅｙら、２０１７）に由来する、ＴＥＭＰｙ：Ｄｉｆｆｍａｐ（Ｆａｒａｂｅｌｌａら、２０１５）により計算された、ｒｅｃＥｎａ１Ｂマップ（ピンク）及びｒｅｃＥｎａ１Ｂ／エクスビボ差違マップ（緑）である。両マップの差違は、Ｌ３、Ｌ７及びＮｔｃのコンフォメーションに位置特定された。（Ｅ）左から右へと、各々が、金（１０ｎｍ）標識化抗ウサギＩｇＧを二次抗体とする、抗Ｅｎａ１Ａ血清、抗Ｅｎａ１Ｂ血清及び抗Ｅｎａ１Ｃ血清により染色された、エクスビボにおけるＳ型Ｅｎａについての免疫金ＴＥＭである。Ｅｎａ１Ａ血清及びＥｎａ１Ｂ血清による特異的染色は、天然Ｅｎａ内の、両方のサブユニットの存在を確認する。Ｅｎａ１Ｃ血清による染色は、見られなかった。Ｓ型Ｅｎａ内の、サブユニット間相互作用を示す。（Ａ、Ｂ）Ｓ型Ｅｎａ内の、水平方向のサブユニット間接触部についてのリボン表示（Ａ）及び概略表示（Ｂ）である。各サブユニットのＢＩＤＧシートの鎖Ｇは、後続のサブユニットのＣＨＥＦβシートの鎖Ｃにより拡張される。いずれのサブユニットも、それぞれ、９又は１０サブユニット上方に配置されたサブユニットのＮｔｃ（青）を介して共有結合的に架橋される。Ｃｙｓ１１及びＣｙｓ１０は、サブユニットｉ－１０の鎖Ｂ内の残基２４及びサブユニットｉ－９の鎖Ｉ内のＣｙｓ１０９とジスルフィド結合する。（Ｃ、Ｄ）原子モデル表面上の電荷分布を示す、Ｓ型Ｅｎａの、２つの隣接するサブユニット（Ｃ）及び２つのヘリックスターンについてのクーロンポテンシャルマップ（ＰｙＭＯＬにより計算された）である。各サブユニットは、サブユニット間の静電的安定化相互作用の一因をなす、サブユニット間表面において、相補的な、正に帯電した残基パッチと負に帯電した残基パッチとを保有する。同様に、Ｓ型Ｅｎａ内の積み重ねヘリックスリングは、相補的な帯電界面（Ｄ）を示す。バチルス属種の間の、ＥｎａＡ－ＥｎａＣのタンパク質配列の間における系統発生関係を示す。ＦａｓｔＴｒｅｅｖ．２．１．８（Ｐｒｉｃｅら、２０１０）により生成され、Ｍｉｃｒｏｒｅａｃｔ（Ａｒｇｉｍｏｎら、２０１６）において視覚化された、近似的最尤系統樹である。系統樹は、中点に根ざす。ノードは、アノテーションされた種に従い着色される。さらなる詳細について、「方法」を参照されたい。（Ａ）５９３の分離株の、Ｅｎａ１Ａアイソフォームと、Ｅｎａ２Ａアイソフォームとの関係である。Ｅｎａ１Ａ及びＥｎａ２Ａは、配列番号１において規定された、Ｅｎａ１Ａ＿ＧＣＦ＿００１０４４８２５；ＫＭＰ９１６９７．１のタンパク質配列との、＞９０％のカバレッジ並びに、それぞれ、＞８０％及び５０～６５％の配列同一性を有する、オーソログ又はホモログとして規定される。Ｉｎｔｅｒａｃｔｉｖｅｔｒｅｅは、ｈｔｔｐｓ：／／ｍｉｃｒｏｒｅａｃｔ．ｏｒｇ／ｐｒｏｊｅｃｔ／５ＵｉｘｘＥＹ９ｖｒ２ＡＶｚＸＤＶｗａ５ｔ／１ａ８５５８ｆｄにおいてアクセス可能である。（Ｂ）５９１の分離株の、Ｅｎａ１Ｂアイソフォームと、Ｅｎａ２Ｂアイソフォームとの関係である。Ｅｎａ１Ｂ、Ｅｎａ１Ｂ＿候補配列及びＥｎａ２Ｂは、それぞれ、配列番号８７において規定された、Ｅｎａ１Ｂ＿ＮＭ＿Ｏｓｌｏのタンパク質配列に対する＞９０％のカバレッジ並びに＞８０％、６０～８０％及び４０～６０％の配列同一性を有する、オーソログ又はホモログとして規定される。Ｉｎｔｅｒａｃｔｉｖｅｔｒｅｅは、ｈｔｔｐｓ：／／ｍｉｃｒｏｒｅａｃｔ．ｏｒｇ／ｐｒｏｊｅｃｔ／ｊＪ４ｐＡＲｖｑｆ９ｇｙＴ９１６ｓＴａｒ５ｕ／１３３２ｆ３ｂ３においてアクセス可能である。（Ｃ）５９１の分離株の、Ｅｎａ１Ｃアイソフォームと、Ｅｎａ２Ｃアイソフォームとの関係である。Ｅｎａ１Ｃ、Ｅｎａ１Ｃ＿候補配列及びＥｎａ２Ｃ＿候補配列は、それぞれ、配列番号１５（ＫＭＰ９１６９９．１）において規定された、Ｅｎａ１Ｃのタンパク質配列に対する＞９０％のカバレッジ並びに＞８０％、６０～８０％及び４０～６０％の配列同一性を有するオーソログ又はホモログとして規定される。さらに、オーソログ又はホモログが、通例のＥｎａＡ－ＥｎａＢ遺伝子座以外の、ゲノム内の箇所において見出された分離株は、シアンに着色される。Ｅｎａ１Ｃのホモログ又はオーソログを欠いた分離株は、グレーに着色される。Ｉｎｔｅｒａｃｔｉｖｅｔｒｅｅは、ｈｔｔｐｓ：／／ｍｉｃｒｏｒｅａｃｔ．ｏｒｇ／ｐｒｏｊｅｃｔ／ａＱａｑＣＵＣＪｏｊ２ｍｗ５５ＫＱｕｊｂＧＹ／０９９ｄ７８８５においてアクセス可能である。インビボにおいて、組換えにより作製された、Ｓ型Ｅｎａ１Ａ繊維を示す。単量体サブユニットの組換え発現後において、Ｅ．コリの細胞質内で形成された、陰性染色Ｅｎａ１Ａ繊維についての、倍率６０ｋのＴＥＭ画像である。自己アセンブリーのための、Ｅｎａ構成単位についての概略を示す。（Ａ）Ｓ型繊維：Ｎ末端接続部が、立体障害を保有し、インビトロにおいて、多量体的な、ヘリックス形配置へと自己アセンブルするが、高度の秩序構造を形成することを妨げられる、単量体のＥｎａ１／Ｅｎａ２サブユニットである。この配置にある多量体は、１０～１２の単量体から構成される。立体障害（タンパク質分解性切断を介する）の除去は、頭尾立体配置の多量体の積み重ね及び／又はいずれかの末端における、単量体実体の組込みをもたらし、不定なサイズのヘリックス繊維アセンブリーをもたらす。（Ｂ）Ｌ型繊維：Ｎ末端接続部が、立体障害を保有し、インビトロにおいて、多量体的な、円形配置へと自己アセンブルするが、高度の秩序構造を形成することを妨げられる、単量体のＥｎａ３Ａサブユニット又はＥｎａ１Ｃサブユニットである。この配置にある多量体は、７つ～９つの単量体から構成される。Ｅｎａ３Ａ多量体の立体障害（タンパク質分解性切断を介する）の除去は、頭尾立体配置の前記多量体の積み重ねをもたらし、不定なサイズの円筒状の繊維アセンブリーをもたらす。Ｅｎａの多量体アセンブリー及び繊維アセンブリーについての、詳細な構造組成を示す。（Ａ）ヘリックスアーク多量体及びＳ型繊維：（左－ｉ）ヘリックス形Ｅｎａ多量体のＮＳ－ＥＭクラス平均についての上面図；（中－ｉｉ）インビトロにおいて作製されたｒｅｃＥｎａ１ＢのｃｒｙｏＥＭボリュームから導出された、Ｅｎａヘリックスアーク配置についての上面図及び側面図：Ｅｎａ単量体は、個別に着色される；（右－ｉｉｉ）隣接するアークのＣ末端受容部領域と界面をなす、Ｎ末端接続部を介して係合する、頭尾積み重ね型Ｅｎａアークから構成された、ヘリックス形Ｓ型繊維である。（Ｂ）円板多量体及びＬ型繊維：（左－ｉ）インビトロにおいて作製された９量体Ｅｎａ１Ｃ多量体のｃｒｙｏ－ＥＭクラス平均についての上面図及び側面図；（中－ｉｉ）ｃｒｙｏＥＭボリュームから導出された、７量体であるＥｎａ３Ａ多量体及び９量体であるＥｎａ１Ｃリング配置についての上面図及び側面図：Ｅｎａ単量体又はＥｎａサブユニットは、個別に着色される；（右－ｉｉｉ）隣接するリングのＣ末端受容部領域と界面をなす、Ｎ末端接続部を介して係合する、頭尾積み重ね型Ｅｎａ３Ａ７量体リングから構成された、７量体Ｌ型繊維である。Ｅｎａ１Ｂナノ繊維エンジニアリング部位を示す。本明細書において、ｒｅｃＥｎａ１Ｂ（配列番号８４）構造は、単一アミノ酸、ペプチド又は完全ドメインの、鎖Ｅ～鎖Ｆ、鎖Ｂ～鎖Ｃ、鎖Ｈ～鎖Ｉ及び鎖Ｄ～鎖Ｅを接続するループへの挿入に適する部位（左）又は単一部位置換のための部位（右；赤色により強調されている）を裏付けるのに使用される。Ｅｎａ１／Ｅｎａ２Ａのタンパク質配列の、複数の配列アライメントを示す。識別子は、Ｅｎａ１Ａについての、配列番号１～７及びＥｎａ２Ａについての、配列番号２１～２８に対応する。Ｅｎａ１／Ｅｎａ２Ｂのタンパク質配列の、複数の配列アライメントを示す。識別子は、Ｅｎａ１Ｂについての、配列番号８～１４及びＥｎａ２Ｂについての、配列番号２９～３７に対応する。Ｅｎａ１／Ｅｎａ２Ｃのタンパク質配列の、複数の配列アライメントを示す。識別子は、Ｅｎａ１Ｃについての、配列番号１５～２０及びＥｎａ２Ｃについての、配列番号３８～４８に対応する。Ｅｎａ３タンパク質配列の、複数の配列アライメントを示す。配列番号４９～８０に対応する、選択された、代表的Ｅｎａ３ホモログの、複数の配列アライメントである。Ｅｎａ３タンパク質配列の、複数の配列アライメントを示す。配列番号４９～８０に対応する、選択された、代表的Ｅｎａ３ホモログの、複数の配列アライメントである。組換えＥｎａ１ＢＳ型繊維についての、陰性染色透過電子顕微鏡写真を示す。１ｍｇ×ｍＬ^－１のＥｎａ１Ｂ懸濁液３μｌを、Ｃｕメッシュフォルムバールグリッドへと沈着させ、ｍｉｌｉＱに続き、１％（ｗ／ｖ）の酢酸ウラニル中において、３回にわたり洗浄した。Ｅｎａ１ＢＳ型繊維から作製された薄膜を示す。（ａ）シリコン処理カバースリップ上における、半透明のＥｎａ１ＢＳ型薄膜である。１００ｍｇ×ｍＬ^－１のＳ型Ｅｎａ１Ｂ溶液をドロップキャスティングした後において、シリコン処理カバースリップから剥がれた、フリースタンディングのＥｎａ１ＢＳ型薄膜についての上面図（ｂ）及び側面図（ｃ）である。推定厚さは、２１μｍである。Ｅｎａ１ＢＳ型繊維に由来する、軟質ハイドロゲルを示す。（ａ）シリコン処理カバースリップ上における、半透明のＥｎａ１ＢＳ型薄膜である。（ｂ）５０μｌのｍｉｌｉＱの適用を介する再水和ステップである。（ｃ）過剰量のｍｉｌｉＱ水を除去した後において、結果として得られるハイドロゲルについての側面図である。（ｄ）ピンセットの間に把持された、フリースタンディングの、半透明Ｅｎａハイドロゲルである。４ＭのＭｇＣｌ_２（ａ）中、５ＭのＮａＣｌ（ｂ）中、及び１００％（ｖ／ｖ）のエタノール中の脱水の後において、強化されたＥｎａハイドロゲルビーズを示す。Ｅｎａ３Ａタンパク質から構成されたＬ型繊維を示す。（ａ）Ｌ型Ｅｎａ内の、水平方向のサブユニット（ｉ／ｉ＋１）間接触部及び軸方向のサブユニット（ｉ／ｊ）間接触部についてのリボン表示（ａ）及び概略表示（ｂ）である。リング間架橋は、隣接するリング内のＣｙｓ８位（ｉ）において、サブユニットｊのＣｙｓ２０位とジスルフィド結合を形成する、Ｎ末端接続部（Ｎｔｃ）を介して確立され；下挿入図：Ｌ型繊維についての、ｃｒｙｏＥＭによる二次元クラス平均像である。（ｃ）３．５ÅのｃｒｙｏＥＭマップへと組み込まれた、２つの７量体Ｅｎａ３Ａリングについてのカートゥーン表示である（透視ボリュームを白色とする）。（ｄ）単一の７量体Ｅｎａ３Ａモデルについての上面図及び側面図である。（ｅ）立体障害型６×Ｈｉｓ＿ＴＥＶ＿Ｅｎａ３Ａ多量体についての、ｃｒｙｏＥＭによる二次元クラス平均像である。（ｆ）対応する、ｃｒｙｏＥＭボリュームである。Ｅｎａ３Ａが、Ｌ型繊維の作製に、必須かつ十分であることを示す。（ａ）ＴＥＶプロテアーゼとの共インキュベーションの後に精製された、立体障害型Ｅｎａ３Ａ多量体から得られた、Ｌ型短繊維の、インビトロにおけるアセンブリーである。（ｂ）Ｅ．コリ内の、野生型ｒｅｃＥｎａ３Ａの組換え発現の後における、Ｌ型Ｅｎａ３Ａの長繊維の、インセルロ（ｉｎｃｅｌｌｕｌｏ）におけるアセンブリー及び後続の繊維画分の単離である。（ｃ）Ｂ．セレウスＮＭ００９５－７５株から導出された、Ｅｎａ四重ノックアウト株（ΔＥｎａ１Ａ－Ｅｎａ１Ｂ－Ｅｎａ１Ｃ－Ｅｎａ３Ａ）に由来する成熟芽胞についての、ｎｓＴＥＭ画像：任意の芽胞付属物の完全な非存在を裏付ける、代表的画像である。（ｄ）ｐＥＮＡ３Ａにより形質転換された、Ｅｎａ四重ノックアウト株についてのｎｓＴＥＭ画像：芽胞表面上における、Ｌ型繊維の表現型レスキューである。（ｅ）（ｄ）に示されたレスキュー株の表面上における、Ｌ型Ｅｎａ３Ａ繊維についての拡大画像であり、下方の挿入図における、対応する二次元クラス像は、Ｌ型形状を確認する。選択された、多数のＥｎａ３Ａホモログについての構造比較を示す。（左）繊維内の水平方向の接触及び長手方向の接触を実証するように、３つのサブユニットを示す、バチルス・セレウスＡＴＣＣ＿１０９８７株（ＷＰ＿０１７５６２３６７．１；配列番号４９）の、Ｅｎａ３ＡによるＬ型Ｅｎａ繊維についての、ｃｒｙｏＥＭ構造である。Ｅｎａサブユニットは、ＢＩＤＧ－ＣＨＥＦトポロジーを伴う、８本のβ鎖によるβサンドウィッチフォールドのほか、Ｎｔｃと称され、繊維内の長手方向の共有結合的接触の一因をなす、Ｎ末端伸長ペプチドにより規定される（図１９）。（右）選択されたＥｎａ３Ａホモログについて予測された構造である。各構造について、本発明者らは、各構造のＣα原子ｉと、参照構造（Ｅｎａ３ＡについてのｃｒｙｏＥＭモデル：ＷＰ＿０１７５６２３６７．１；配列番号４９）の対応するＣα原子と間における、原子位置の平均二乗偏差（ＲＭＳＤ）のほか、フォールド類似性スコア、すなわち、ＤａｌｉによるＺスコアを提示する。ＷＰ＿０４９６８１０１８．１（配列番号６０）及びＷＰ＿１００５２７６３０．１（配列番号７５）について、本発明者らは、ＡｌｐｈａＦｏｌｄｖ２．０により予測された推定構造を提示する。基準として、本発明者らはまた、本発明者らの参照構造であるＥｎａ３Ａ（ＷＰ＿０１７５６２３６７．１）についての、ＡｌｐｈａＦｏｌｄモデルも提示するが、これは、実験によるｃｒｙｏＥＭ構造と、ＡｌｐｈａＦｏｌｄモデルとの極めて良好な一致（ＲＭＳＤ＝１．０５；Ｚ＝１２．１）を裏付ける。インビトロにおける、Ｅｎａ２Ａの、Ｓ型繊維へのアセンブリーを示す。ａ）Ｅ．コリＢｌ２１ＤＥ３ｐＬｙｓＳ株内において、遮断剤である、Ｎ末端６×Ｈｉｓと共に組換え発現され、次いで、ＴＥＶプロテアーゼを使用する切断による、遮断剤の除去の後に、インビトロにおいてアセンブルされた、Ｅｎａ２ＡフィラメントについてのＮＳ－ＴＥＭ顕微鏡写真である。四角形は、Ｎ末端遮断剤の不完全な除去から生じる、Ｅｎａ２Ａ多量体のスパイラル（直径：約１０ｎｍ）を強調し、右図において、個々の多量体についての顕微鏡写真によりクロップアウトされる。ｂ）前出において、Ｅｎａ１Ｂについて得られた、二次元クラス平均像と同様の、高分解能の特徴を示す、インビトロにおいてアセンブルされた、Ｅｎａ２Ａフィラメントについての、ｃｒｙｏＥＭによる二次元クラス平均像である。右図は、ヘリックスパラメータを、ツイスト＝３１．０１度及びライズ＝３．１５Åとするヘリックス再構築により生成された、ピッチを約３８Åとし、直径を１１０Åとする、Ｅｎａ２Ａフィラメントについての、三次元再構築ボリューム（分解能＝５Å）のスナップ写真である。Ｅｎａ２Ａの、Ｓ型繊維へのインセルロアセンブリーを示す。Ｎ末端遮断剤を伴わずに、Ｅ．コリＢｌ２１（ＤＥ３）Ｃ４３株内において組換え発現された、Ｅｎａ２ＡについてのＮＳ－ＴＥＭ画像であり、右上の、陰性染色による二次元クラス平均像は、Ｓ－Ｅｎａ繊維の同一性を確認する。インビトロにおいて、９量体円板及びＬ型様短フィラメントへとアセンブルされたＥｎａ２Ｃを示す。ａ）Ｅ．コリＢｌ２１Ｃ４３内において、遮断剤である、Ｎ末端６×Ｈｉｓと共に組換え発現され、次いで、ＴＥＶプロテアーゼを使用する切断による遮断剤の除去の後において、インビトロにおいてアセンブルされた、Ｌ様Ｅｎａ２Ｃ短フィラメントについての、ｃｒｙｏ－ＥＭによる二次元顕微鏡写真である。結果として得られるフィラメントは、高度に可撓性であり、閉ループを形成するように湾曲する。ｂ）Ｅｎａ２Ｃの９量体円板１５～２０を含有する、直径約７０ｎｍのＬ様Ｅｎａ２Ｃフィラメントによる閉ループについての、ｃｒｙｏ－ＥＭによる二次元顕微鏡写真のクロップアウトである。ｃ）多量体の多様な配向性を表す、Ｅｎａ２Ｃの９量体円板についての、ｃｒｙｏＥＭによる二次元クラス平均像である。Ｎｔｃ欠失の、Ｅｎａ１ＢＳ型繊維の強度及び可撓性に対する影響を示す。細胞外環境（ａ）内に存在する、組換えＥｎａ１Ｂ ΔＮｔｃ繊維であり、引っ張り強度及び可撓性の低減の結果として、断裂（ｂ）及び破壊点（ｃ～ｅ）を呈する。ｎｓ－ＴＥＭを介してモニタリングされた、Ｅｎａ１Ｂが、Ｓ型繊維へと自己アセンブルする能力に対する、立体障害の長さの影響を示す。（ａ）野生型Ｅｎａ１ＢＳ型繊維：立体障害（Ｎ＝０）を示さない。（ｂ）Ｍ－ＴＥＶ－Ｅｎａ１Ｂである（Ｎ＝６）。（ｃ）Ｍ－Ｈｉｓ６－ＳＳＧ－Ｅｎａ１Ｂである（Ｎ＝９）。スケールバーは、１００ｎｍを表す。ペプチドタグの挿入に関する、Ｅｎａ１Ｂループの操作可能性を示す。ループである、ＤＥ及びＨＩ（図１５に指し示されている）並びに直鎖状タグである、ＦＬＡＧ及びＨＡの挿入について示された例である。抗Ｅｎａ１Ｂ一次抗体、抗ＨＡ一次抗体及び抗ＦＬＡＧ一次抗体を使用する、野生型Ｅｎａ１Ｂ構築物及び多様なループ修飾Ｅｎａ１Ｂ構築物（ＤＥ－ＨＡ、ＤＥ－ＦＬＡＧ、ＨＩ－ＨＡ）についてのウェスタンブロット解析を示す。４つの構築物（野生型Ｅｎａ１Ｂについての配列番号８及びＥｎａ１Ｂについての、配列番号１４０～１４２の挿入変異体）全てを、Ｅ．コリ内において発現させ、この後、全細胞溶解物及び全可溶性画分を、ＳＤＳ－ＰＡＧＥへとロードした。抗Ｅｎａ１Ｂパネル：積み重ねゲル中に保持された、Ｅｎａ１Ｂの高分子量バンドは、ＳＤＳ不溶性繊維（図３２のｎｓＴＥＭ画像を参照されたい）に対応し；抗ＨＡ及び抗ＦＬＡＧパネル：抗ＨＡ及び抗ＦＬＡＧに対する染色が陽性である、ＤＥ－ＨＡ、ＨＩ－ＨＡ、及びＤＥ－ＦＬＡＧの繊維画分は、それぞれ、Ｅｎａ１Ｂが、繊維超微細構造へとアセンブルされた場合の、ペプチドタグの表面アクセス可能性を裏付ける。スプリットＥｎａ構築物の共発現時に、インセルロにおいて、Ｓ型Ｅｎａ繊維へとアセンブルするＥｎａ１Ｂを示す。ＢＣループ内又はＨＩループ内の、それぞれ、Ａｌａ３０又はＡｌａ１００における、Ｅｎａ１Ｂの分割である。ａ）ＢＣスプリットＥｎａ１ＢによるＳ－Ｅｎａについての、ＮＳ－ＴＥＭ顕微鏡写真である。分割された半分、すなわち、鎖ＡＢ（オレンジにおいて示す）及び鎖ＣＤＥＦＧＨＩ（緑において示す）を強調する、スプリットＥｎａ１Ｂ構造についての上左カートゥーン表示である。上右枠囲いは、Ｓ型Ｅｎａフィラメントの存在を確認する、クロッピング／拡大画像である。ｂ）ＨＩスプリットＥｎａ１ＢによるＳ－Ｅｎａについての、ＮＳ－ＴＥＭ顕微鏡写真である。分割された半分、すなわち、鎖Ｉ（マゼンダにおいて示す）及び鎖ＡＢＣＤＥＦＧＨ（緑において示す）を強調する、スプリットＥｎａ１Ｂ構造についての上左カートゥーン表示である。上右枠囲いは、Ｓ型Ｅｎａフィラメントの存在を確認する、クロッピング／拡大画像である。固体支持体上における、Ｓ型繊維のエピタキシャル成長を示す。スケールバーは、１００ｎｍを表す。非共有結合的Ｅｎａ繊維による、固体表面の機能化を示す。ストレプトアビジンコーティング金ビーズ上の、ビオチニル化Ｅｎａ１ＢＳ型繊維についての、ｎｓＴＥＭ解析用の顕微鏡写真である。部位指向突然変異誘発により、Ｅｎａ繊維ネットワークを修飾する、Ｅｎａタンパク質の操作を示す。Ｅｎａ１ＢＳ型繊維のための部位指向突然変異誘発部位：表面露出残基であるＴ３１を、システイン残基への突然変異誘発のために選択した（ａ）。Ｅ．コリ内において組換え発現された、Ｅｎａ１ＢＴ３１Ｃの、エクスビボ精製繊維についての、対応するｎｓ－ＴＥＭ画像である（ｂ）及び白点線枠囲いに対応する拡大図（ｃ）である。Ｅｎａ３ＡＬ型繊維のための部位指向突然変異誘発部位：表面露出残基であるＴ４０及びＴ６９を、システイン残基への突然変異誘発のために選択した（ｄ）。Ｅ．コリ内において組換え発現された、Ｅｎａ３ＡＴ４０Ｃの及びＥｎａ３ＡＴ６９Ｃの、エクスビボ精製繊維についての、対応するｎｓ－ＴＥＭ画像である。スケールバーは、１００ｎｍ（ｃ）、又は２００ｎｍ（ｅ～ｆ）に対応する。架橋Ｅｎａ繊維は、強化バンドル又は「ロープ」及びクラスター化ハイドロゲルへとアセンブルする。ＡｌｐｈａＦｏｌｄによる予測を使用する、選択された、多数のＥｎａホモログについての構造比較を示す。Ｅｎａ１Ｂ（ＵｎｉＰｒｏｔ受託番号：Ａ０Ａ１Ｙ６Ａ６９５）についてのｃｒｙｏ－ＥＭ構造を、Ｅｎａ１Ｂ自体について、ＡｌｐｈａＦｏｌｄにより予測されたフォールド構造並びにＥｎａ２Ａ（ＮＣＢＩ受託番号：ＷＰ＿００１２７７５４０．１；配列番号１４５）、ＷＰ＿０１７５６２３６７．１及びＷＰ＿０４１６３８３３８．１の予測タンパク質配列と比較した。各構造の原子ｉと、参照構造（Ｅｎａ１ＢについてのｃｒｙｏＥＭモデル：ＵｎｉＰｒｏｔ受託番号：Ａ０Ａ１Ｙ６Ａ６９５；配列番号８に対応する）の対応する原子と間の、原子位置についての平均二乗偏差であるＲＭＳＤのほか、フォールド類似性スコア、すなわち、ＤａｌｉによるＺスコア（Ｊｕｍｐｅｒら、２０２１、Ｎａｔｕｒｅ；ｄｏｉ．ｏｒｇ／１０．１０３８／ｓ４１５８６－０２１－０３８１９－２）である。

本発明は、ある特定の図面を参照しながら、特定の実施形態について記載されるが、本発明は、これらに限定されず、特許請求の範囲だけにより限定される。特許請求の範囲内の、いかなる参照記号も、範囲を限定するものとしてみなされないものとする。当然ながら、全ての態様又は利点は、必ずしも、本発明のいかなる特定の実施形態に従っても達成されない場合があることが理解されるものとする。したがって、例えば、当業者は、本発明は、本明細書において教示又は示唆されうる他の態様又は利点を、必ずしも達成することなく、本明細書において教示された、１つの利点又は利点群を達成又は最適化する形において、実現又は実施される場合があることを認識する。本発明は、その特色及び利点と併せた、組織化及び操作法のいずれについても、付属の図面と共に読まれる場合に、以下の「発明を実施するための形態」を参照することにより、最も良く理解されうる。本発明の態様及び利点は、本明細書の下記において記載された実施形態から明らかとなり、これらを参照しながら解明される。本明細書を通して、「一実施形態」又は「ある実施形態」に対する言及は、実施形態との関連において記載された、特定の特色、構造又は特徴が、本発明の少なくとも１つの実施形態に含まれることを意味する。したがって、本明細書を通して、多様な箇所における、「一実施形態において」又は「ある実施形態において」という語句の出現は、必ずしも、全てが、同じ実施形態に言及するものではない。

定義
単数形の名詞に言及する場合に、不定冠詞又は定冠詞、例えば、「ある（ａ）」又は「ある（ａｎ）」、「その」が使用される場合、これは、何らかの別の事柄が具体的に言明されない限りにおいて、この名詞の複数形を含む。本記載及び特許請求の範囲において、「～を含むこと」という用語が使用される場合、これは、他の要素又はステップを除外しない。さらに、本記載及び特許請求の範囲において、「第１の」、「第２の」、「第３の」などの用語が、同様の要素を識別するために使用されるが、必ずしも、継起的順序又は時間的順序について記載するために使用されるわけではない。このようにして使用される用語は、適切な状況下において互換的であり、本明細書において記載された、本発明の実施形態は、本明細書において記載又は例示された順序以外の順序における操作が可能であることが理解されるものとする。以下の用語又は定義は、本発明の理解の一助とするためだけに提示される。本明細書において具体的に規定されない限りにおいて、本明細書において使用される全ての用語は、それらが、本発明の技術分野の当業者に対して有する意味と同じ意味を有する。実施者は、当技術分野の定義及び用語について、特に、Ｓａｍｂｒｏｏｋら、「ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ」、４版、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＰｒｅｓｓ、Ｐｌａｉｎｓｖｉｅｗ、ＮｅｗＹｏｒｋ（２０１２）；及びＡｕｓｕｂｅｌら、「ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ」、（増刊１１４号）、ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ、ＮｅｗＹｏｒｋ（２０１６）へと方向付けられる。そうでないことが規定されない限りにおいて、本明細書において使用される、全ての技術用語及び科学用語は、当業者（例えば、分子的生物学、生化学、構造生物学及び／又は数理生物学）により一般に理解される意味と同じ意味を有する。

本明細書において使用された、「核酸配列」、「ＤＮＡ配列」又は「核酸分子」という用語は、リボヌクレオチド又はデオキシリボヌクレオチドである、任意の長さのヌクレオチドのポリマー形態を指す。この用語は、分子の一次構造だけを指す。したがって、この用語は、二本鎖及び一本鎖のＤＮＡ及びＲＮＡを含む。この用語はまた、自然発生のヌクレオチドのうちの１つ以上の、類似体による、公知の種類の修飾、例えば、メチル化、「キャップ」置換も含む。「核酸構築物」とは、自然において、一体に見出されない、１つ以上の機能的単位を含むように構築された核酸分子を意味する。例は、環状ＤＮＡ分子、直鎖状ＤＮＡ分子、二本鎖ＤＮＡ分子、染色体外ＤＮＡ分子（プラスミド）、コスミド（ラムダファージに由来するＣＯＳ配列を含有するプラスミド）、非天然の核酸配列を含むウイルスゲノムなどを含む。「コード配列」とは、適切な調節配列の制御下に置かれた場合に、ｍＲＮＡへと転写され、かつ／又はポリペプチドへと翻訳される、ヌクレオチド配列である。コード配列の境界は、５’末端における翻訳開始コドン及び３’末端における翻訳終止コドンにより決定される。コード配列は、ｍＲＮＡ、ｃＤＮＡ、組換えヌクレオチド配列又はゲノムＤＮＡを含みうるがこれらに限定されない一方、ある特定の状況下において、イントロンもまた存在しうる。本明細書において使用された、「遺伝子のプロモーター領域」又は「調節エレメント」とは、コード配列に作動可能に連結され、おそらく、適切な誘導条件下に置かれた場合に、前記コード配列の転写を促進するのに十分である、機能的ＤＮＡ配列単位を指す。「作動可能に連結された」は、このように記載された構成要素が、それらの意図された形で機能することを可能とする関係にある並置を指す。コード配列である核酸分子へと「作動可能に連結された」プロモーター配列は、コード配列の発現が、プロモーター配列と適合性の条件下において達成されるような形においてライゲーションされる。本明細書において使用された、「遺伝子」は、遺伝子のプロモーター領域並びにコード配列の両方を含む。「遺伝子」は、プロモーター配列に作動可能に連結された、ゲノム配列（可能なイントロンを含む）並びにスプライシングされたメッセンジャーに由来するｃＤＮＡの両方に関する。「ターミネーター」又は「転写終結シグナル」という用語は、３’側におけるプロセシング及び一次転写物のポリアデニル化及び転写の終結のシグナルを伝達する、転写単位の末端におけるＤＮＡ配列である、制御配列を包摂する。ターミネーターは、天然の遺伝子に由来する場合もあり、他の様々な植物遺伝子に由来する場合もあり、Ｔ－ＤＮＡに由来する場合もある。付加されるターミネーターは、例えば、ノパリンシンターゼ遺伝子又はオクトピンシンターゼ遺伝子に由来する場合もあり、代替的に、別の遺伝子に由来する場合もある。「キメラ遺伝子」又は「キメラ構築物」又は「キメラ遺伝子構築物」とは、プロモーター配列又は調節核酸配列が、会合された核酸コード配列の、転写又は発現を調節できるように、プロモーター配列又は調節核酸配列が、ｍＲＮＡをコードする核酸配列に作動的に連結されている、又はこれと会合された、組換え核酸配列分子を意味する。キメラ遺伝子の調節核酸配列は、自然において見出された、会合された核酸配列に、作動的に連結されておらず、コード核酸配列分子に対して異種でありうるが、これは、その配列が、自然において、キメラ構築物内においてもたらされた配置と同じ配置において存在しないことを意味する。より一般的に、本明細書において、「異種」という用語は、その由来が異なる、配列又は分子として規定される。

本明細書においてさらに、「タンパク質」、「ポリペプチド」及び「ペプチド」という用語は、アミノ酸残基のポリマー並びにこれらの変異体及び合成類似体を指すように、互換的に使用される。単量体又はプロトマーは、アミノ末端～カルボキシ末端にわたる、単一のポリペプチド鎖により規定される。本明細書において使用された、「タンパク質サブユニット」とは、多量体タンパク質の複合体又はアセンブリーの部分を形成しうる、単量体又はプロトマーを指す。

「キメラポリペプチド」、「キメラタンパク質」、「カイマー」、「融合ポリペプチド」、「融合タンパク質」という用語は、本明細書において、互換的に使用され、同じタンパク質に由来する場合もあり、由来しない場合もある、少なくとも２つの個別であり、かつ、顕著に異なる、ポリペプチド構成要素を含むタンパク質を指す。用語はまた、それが、人工であることを意味する、非自然発生の分子も指す。キメラポリペプチド（本明細書において規定された）を指す場合における、「～へと融合された」という用語及び「共有結合的に連結された」、「接続された」、「接合された」、「ライゲーションされた」、「コンジュゲートされた」など、他の文法的同等物は、２つ以上のポリペプチド構成要素を連結するための、任意の化学的機構又は組換え機構を指す。２つ以上のポリペプチド構成要素の融合は、配列の直接的な融合の場合もあり、例えば、介在するアミノ酸配列又はリンカー配列若しくは化学的リンカーを伴う、間接的な融合の場合もある。融合アミノ酸残基又は（ポリ）ペプチドの、本明細書において記載された、目的のＥｎａタンパク質又は別のタンパク質への融合は、共有結合的ペプチド結合でありうるが、また、化学的連結により得られた融合も指す。本明細書において使用され、本明細書において、「～へと接続された」、「～へとコンジュゲートされた」、「～へとライゲーションされた」と互換的に使用された、「～へと融合された」という用語は、特に、例えば、組換えＤＮＡ技術による「遺伝子的融合」のほか、安定的な共有結合的連結を結果としてもたらす、「化学的コンジュゲーション及び／又は酵素的コンジュゲーション」を指す。

「分子複合体」又は「複合体」という用語は、タンパク質の場合もあり、化学的実体の場合もある、少なくとも１つの他の分子と会合された分子を指す。「～と会合された」という用語は、化学的実体若しくは化合物又はその部分と、タンパク質上の結合性ポケット又は結合性部位との近接の条件を指す。本明細書において使用された、「タンパク質複合体」又は「タンパク質アセンブリー」又は「多量体」という用語は、巨大分子のうちの少なくとも１つが、タンパク質である、２つ以上の、会合された巨大分子の群を指す。本明細書において使用された、タンパク質複合体又はタンパク質アセンブリーとは、典型的に、生理学的条件下において形成されうる、巨大分子の結合又は会合を指す。タンパク質のサブユニット又はプロトマーなど、タンパク質複合体の個々のメンバーは、非共有結合的相互作用又は共有結合的相互作用により連結される。「～に結合すること」とは、直接的な場合であれ、間接的な場合であれ、任意の相互作用を意味する。直接的相互作用とは、結合パートナーの間の接触を含意する。間接的相互作用とは、相互作用パートナーが、２つを超える分子の複合体内において相互作用する、任意の相互作用を意味する。相互作用は、１つ以上の架橋分子を一助として、完全に間接的な場合もあり、１つ以上の分子の、さらなる相互作用により安定化された、パートナー間の直接的な接触がなおも存在する、部分的に間接的な場合もある。結合又は会合は、非共有結合的（この場合、並置は、例えば、水素結合又はファンデルワールス相互作用又は静電的相互作用により、エネルギー的に優先される）な場合もあり、例えば、ペプチド結合又はジスルフィド結合により、共有結合的な場合もある。

タンパク質複合体は、多量体でありうることが理解されるであろう。タンパク質複合体アセンブリーは、ホモ多量体複合体の形成を結果としてもたらす場合もあり、ヘテロ多量体複合体の形成を結果としてもたらす場合もある。さらに、相互作用は、安定的な場合もあり、一過性の場合もある。「多量体」、「多量体複合体」又は「多量体タンパク質又は多量体アセンブリー」という用語は、複数の同一のポリペプチド単量体又は異種ポリペプチド単量体を含む。ポリペプチドは、複数の単一のポリペプチド単量体の自己アセンブリー（すなわち、「ホモ多量体アセンブリー」）又は複数の異なるポリペプチド単量体の自己アセンブリー（すなわち、「ヘテロ多量体アセンブリー」）から形成された、多量体アセンブリー（すなわち：２量体、３量体、５量体、６量体、７量体、８量体など）へと自己アセンブルすることが可能でありうる。本明細書において使用された、「複数」とは、２つ以上を意味する。多量体アセンブリーは、３つ、４つ、５つ、６つ、７つ、８つ、９つ、１０、１１、１２以上のポリペプチド単量体を含む。多量体アセンブリーは、任意の目的のための使用が可能であり、広範にわたるタンパク質「ナノ材料」を開発するための方途をもたらしうる。有限の、ケージ様タンパク質アセンブリー又はシェル様タンパク質アセンブリーに加えて、多量体アセンブリーは、適切な対称性の標的アーキテクチャーを選び出すことによってもデザインされうる。本発明の単量体若しくはプロトマー及び／又は多量体アセンブリーは、階層的アセンブリーの利点が付随する繊維など、高次アセンブリーのデザインにおいて使用されうる。結果として得られる多量体アセンブリー又は繊維アセンブリーは、優れた剛性及び単分散性を伴う、高次材料であり、多量体自体又は繊維自体として機能的な場合もあり、多量体アセンブリー又は繊維を含有する改変された表面など、高機能材料の形態ベース及び広範な適用を伴う、カスタムデザイン型分子機械として機能的な場合もある。より具体的に述べると、本明細書において使用された多量体とは、アーク様構造、ターン様構造、リング様構造若しくは円板様構造を形成するように、互いと非共有結合的に会合され；かつ／又はナノ繊維の自己アセンブル若しくは誘発性形成へと成長若しくは発達するように、さらに改変された、ホモ多量体タンパク質複合体又はヘテロ多量体タンパク質複合体を指す。前記多量体アセンブリーは、本明細書において規定されたＥｎａタンパク質又はＥｎａタンパク質の変異体、突然変異体及び／若しくは操作されたＥｎａタンパク質のほか、操作された多量体と呼ばれた、前記Ｅｎａタンパク質ベースの多量体へと会合し、これにより、前記多量体を、ある特定の適用に要求された、さらなる改変へと拡張しうる、他のタンパク質を含有しうる。

「タンパク質ドメイン」とは、タンパク質内の、顕著に異なる、機能的単位及び／又は構造的単位である。通例、タンパク質ドメインは、タンパク質の全体的な役割に寄与する、特定の機能又は相互作用の一因をなす。ドメインは、類似するドメインが、異なる機能を伴うタンパク質内に見出されうる、様々な生物学的文脈において存在しうる。タンパク質二次構造エレメント（ＳＳＥ）は、その三次元の三次構造へのタンパク質フォールドの前に、中間体として、自発的に形成されることが典型的である。タンパク質の、２つの最も一般的な二次構造エレメントは、アルファヘリックス及びベータ（β）シートであるが、βターン及びオメガループもまた生じる。ベータシートは、少なくとも２つ又は３つの骨格水素結合により、水平方向に接続されたベータ鎖（また、β鎖とも称される）からなり、一般に、ツイスト、プリーツのあるシートを形成する。β鎖とは、伸長コンフォメーション内の骨格を伴う、典型的に、３～１０アミノ酸長の、ポリペプチド鎖の連なりである。βターンは、ポリペプチド鎖の方向の変化を引き起こす、タンパク質の、不規則的二次構造の種類である。ベータターン（βターン、βターン、βベンド、タイトターン、リバースターン）は、β鎖を接続するのに主に用いられる、タンパク質内及びポリペプチド内における、極めて一般的なモチーフである。

「組換えポリペプチド」とは、組換え法を使用して、すなわち、組換えポリヌクレオチド又は合成ポリヌクレオチドの発現を介して作られるポリペプチドであって、インビトロにおいて得られる場合もあり、かつ／又は細胞内の文脈において得られる場合もあるポリペプチドを意味する。キメラポリペプチド又はその生体活性部分が、組換えにより作製される場合、これはまた、好ましくは、培養培地を実質的に含まないことでもある、すなわち、培養培地は、タンパク質調製物の容量の、約２０％未満、より好ましくは約１０％未満を表し、最も好ましくは約５％未満を表す。「単離された」又は「精製された」とは、通常、その天然状態において、それに随伴する構成要素を実質的に、又は本質的に含まない材料を意味する。

タンパク質の「ホモログ」、「複数のホモログ」は、問題の非修飾タンパク質又は野生型タンパク質と比べて、アミノ酸の置換、欠失及び／又は挿入を有し、かつ、それらが由来する非修飾タンパク質と同様の生物学的活性及び機能的活性を有する、ペプチド、オリゴペプチド、ポリペプチド、タンパク質及び酵素を包摂する。本明細書において使用された、「アミノ酸同一性」という用語は、配列が、比較域にわたり、アミノ酸の一対一対応ベースにおいて同一である程度を指す。したがって、「配列同一性の百分率」は、比較ウィンドウにわたり、最適にアライメントされた、２つの配列を比較し、両方の配列において、同一なアミノ酸残基（例えば、本明細書においてまた、１文字コードにおいても指し示される、Ａｌａ、Ｐｒｏ、Ｓｅｒ、Ｔｈｒ、Ｇｌｙ、Ｖａｌ、Ｌｅｕ、Ｉｌｅ、Ｐｈｅ、Ｔｙｒ、Ｔｒｐ、Ｌｙｓ、Ａｒｇ、Ｈｉｓ、Ａｓｐ、Ｇｌｕ、Ａｓｎ、Ｇｌｎ、Ｃｙｓ及びＭｅｔ）が生じる位置の数を決定して、マッチした位置の数をもたらし、マッチした位置の数を、比較ウィンドウにおける位置の総数（すなわち、ウィンドウのサイズ）により除し、結果に、１００を乗じて、配列同一性の百分率をもたらすことにより計算される。本明細書において使用された、「置換」又は「突然変異」は、１つ以上のアミノ酸又はヌクレオチドそれぞれの、親タンパク質又はその断片のアミノ酸配列又はヌクレオチド配列と比較して異なる、アミノ酸又はヌクレオチドによる置換えから生じる。タンパク質又はその断片は、タンパク質の活性に対して、実質的な作用を及ぼさない、保存的アミノ酸置換を有しうることが理解される。本明細書において提示された、配列アミノ酸同一性の百分率は、好ましくは、天然の野生型タンパク質若しくは自然の野生型タンパク質の全長又は言及された、特異的なアミノ酸配列に対応する比較ウィンドウに照らした百分率である。

「野生型」という用語は、自然発生の供給源から単離された、又は細胞、細胞系若しくは生物に含まれた、遺伝子又は遺伝子産物を指す。野生型遺伝子又は野生型遺伝子産物は、集団内において、最も高頻度において観察される遺伝子であるので、自然において観察された遺伝子又は遺伝子産物の「正常」形態又は「野生型」形態と、任意に称される。これに対し、「修飾された」、「操作された」、「突然変異体」又は「変異体」という用語は、野生型又は自然発生の遺伝子又は遺伝子産物と比較した場合に、配列、翻訳後修飾及び／又は機能的特性の修飾（すなわち、特徴の変更）を提示する、遺伝子又は遺伝子産物を指す。ノックアウトとは、非機能的遺伝子産物及び／又は機能をもたらすような、修飾遺伝子又は突然変異体遺伝子又は欠失遺伝子を指す。自然発生の突然変異体又は変異体も単離されうることが注目されるが、これらは、野生型遺伝子又は野生型遺伝子産物と比較した場合に、特徴が変更されており、参照遺伝子又は参照タンパク質と比較して、異なる配列を有するという事実により同定される。

詳細な説明
本発明は、いくつかの集合体において、次世代生体材料として適用可能な、新規のタンパク質アセンブリーに関する。本明細書において開示された多量体アセンブリーの作出は、特異的な特性を伴い、多数の適用における潜在的可能性を伴う、剛性であるが、可撓性でもある構造の作製のために、これらのタンパク質アセンブリーを操作し、モジュレートするための、多数の機会をもたらした、バチルス属芽胞付属物（Ｅｎａ）の、構造的基礎及び遺伝子的基礎の解明に基づく。Ｅｎａタンパク質ファミリーの、これらの多量体アセンブリー及び繊維アセンブリーの構成単位としての同定は、タンパク質の自己アセンブル特性を、細菌タンパク質のパネル内に存在する、ＤＵＦ３９９２タンパク質ドメインの存在と直接相関させ、多量体アセンブリーを形成することを可能とした。さらに、ＤＵＦ３９９２ドメインの存在は、多量体アセンブリーを、長手方向において、剛性繊維へと共有結合的に接続することを可能とする、モチーフＺＸ_ｎＣ（Ｃ）Ｘ_ｍＣ［配列中、Ｚは、Ｉｌｅ、Ｐｈｅ、Ｌｅｕ又はＶａｌであり、ｎは、１又は２残基であり、ｍは、１０～１２残基であり、Ｃは、Ｃｙｓであり、Ｘは、任意のアミノ酸である。］によりもたらされる、少なくとも２つの保存されたシステイン残基を含む、保存されたＮ末端接続部領域と組み合わせた、ＤＵＦ３９９２のＨＭＭプロファイル（表１に提示された）への準拠により決定される。しかし、繊維の可撓性は、Ｎ末端の近傍における、１２～１５アミノ酸のスペーサー領域の特徴により保持され、積み重ね多量体の間のギャップの維持を可能とする（図３を参照されたい）。

新規の原核生物自己アセンブルタンパク質ファミリーである、Ｅｎａタンパク質
本発明の第１の態様は、許容的な緩衝液条件下において、自己アセンブルタンパク質多量体アセンブリーを得るのに要求された構造エレメントをもたらす、ＤＵＦ３９９２ドメインを含む、自己アセンブルタンパク質サブユニットに関する。この文脈において、「自己アセンブリー」は、外的制御又は鋳型を伴わない、それらの相互的な非共有結合的相互作用の結果としての、超分子秩序構造内の、分子の自発的組織化を指す。個々の分子の化学構造及びコンフォメーション構造は、これらが、どのようにアセンブルされるのかについての命令を保有する。同じ分子が、分子自己アセンブルシステムの構成単位を構成する場合もあり、異なる分子がこれを構成する場合もある。一般に、相互作用は、溶液、ランダムコイル又は無秩序凝集物などの低秩序状態下において確立され、結晶又はフォールディングされた巨大分子の場合もあり、巨大分子のさらなるアセンブリーの場合もある、最終的な秩序状態をもたらす。低分子又はタンパク質の、十分な秩序構造への会合は、熱力学的原理により駆動され、したがって、エネルギー最小化に基づき駆動される。分子アセンブリー過程に関与する相互作用は、静電相互作用、疎水性相互作用、水素結合、ファンデルワールス相互作用、芳香族積み重ね相互作用、及び／又は金属配位相互作用である。非共有結合的であり、個別において弱い力であるが、これらの力は、高度に安定的なアセンブリーを発生させ、最終アセンブリーの形状及び機能を統御しうる（Ｌｏｍｂａｒｄｉら、２０１９）。本明細書においてＥｎａタンパク質と呼ばれた、本明細書において記載される前記自己アセンブルタンパク質サブユニットは、本明細書において、異なる状況下及び生体材料内において適用されることが想定された、自己アセンブル多量体及びタンパク質繊維を形成することが可能である。多量体アセンブリー又は繊維アセンブリーは、構成単位又はサブユニットと称された、既存の構成要素、より具体的に述べると、本明細書において記載された、単離された自己アセンブルタンパク質である、Ｅｎａタンパク質から得られうる。

さらに、本明細書において記載された他の実施形態は、本明細書において言及された、「改変された」構成単位若しくは「操作された」構成単位又は「改変された」タンパク質サブユニット若しくは「操作された」タンパク質サブユニット又は「改変された」アセンブリー若しくは「操作された」アセンブリーに関し、それらの自己アセンブリーをコードする、全ての必要な情報を含有する、新たな単位又は新たな機能性を伴う単位を創出するように、化学的組成、長さ及び相互作用の配向性を変化させることにより、得られた既存の（天然の）構成要素からデザイン又は導出されると規定される。環境変数を制御することにより、システムは、新たな熱力学的最小に到達し、異なる秩序構造をもたらす。大半の場合において、タンパク質サブユニットの自己アセンブリーは、非共有結合的相互作用により生じるため、それらの自己アセンブリーは、可逆性であり、環境に対して高感度であり、活性は、タンパク質の会合及び解離を制御して微調整されうる。これらのタンパク質の自己アセンブル特性は、ＤＵＦ３９９２ドメインの存在によりもたらされる。

「機能未知ドメイン」タンパク質ファミリー又は「ＤＵＦ」タンパク質ファミリーは、それ自体、暫定的名称として命名され、タンパク質機能が、同定された後に、より具体的な名称へと改名される（又は既存のドメインへと統合される）傾向がある。したがって、ＤＵＦ３９９２含有タンパク質は、ＰＦＡＭデータベース内において、機能的に特徴付けられておらず、細菌内において見出され、典型的に、９８～１２２アミノ酸の間の長さである、タンパク質ファミリーとして公知であるが、本発明は、実のところ、本明細書において記載された、Ｅｎａ１Ｂタンパク質フォールドにもまた、さらにマッチする、原核生物ＤＵＦ３９９２ドメイン含有タンパク質への自己アセンブリーの機能を初めて規定する。ＰＦＡＭデータベース（ｖｅｒｓｉｏｎ３３．１）はまた、機能的に重要でありうる、単一の完全に保存された残基であるＴが存在することについても言及している（Ｅｌ－Ｇｅｂａｌｉら、２０１９、「ＴｈｅＰｆａｍｄａｔａｂａｓｅ」；ｈｔｔｐ：／／ｐｆａｍ．ｘｆａｍ．ｏｒｇ／ｆａｍｉｌｙ／ＰＦ１３１５７）。この「機能未知ドメイン」３９９２は、この特定のＤＵＦ３９９２タンパク質ドメインを含むことが公知（Ｐｆａｍ－Ｂ＿４８０ｒｅｌｅａｓｅ２４．０）であり、また、ＰＦＡＭ１３１５７ファミリーについてのＰＦＡＭデータベース（また、本明細書において提示された表１も参照されたい）においても提示されている、６４の細菌タンパク質のアライメントに従い得られた、隠れマルコフモデル（ＨＭＭ）により構造的に特徴付けられている。ＰＦＡＭ１３１５７ファミリーのＤＵＦ３９９２ドメインタンパク質についてのＨＭＭプロファイルはまた、ｈｔｔｐ：／／ｐｆａｍ．ｘｆａｍ．ｏｒｇ／ｆａｍｉｌｙ／ＰＦ１３１５７＃ｔａｂｖｉｅｗ＝ｔａｂ４においても示されており、Ｗｈｅｅｌｅｒら（２０１４）：「ｈｉｄｄｅｎＭａｒｋｏｖｍｏｄｅｌｓａｒｅｓｈｏｗｎｂｙｄｒａｗｉｎｇａｓｔａｃｋｏｆｌｅｔｔｅｒｓｆｏｒｅａｃｈｐｏｓｉｔｉｏｎ，ｗｈｅｒｅｔｈｅｈｅｉｇｈｔｏｆｔｈｅｓｔａｃｋｃｏｒｒｅｓｐｏｎｄｓｔｏｔｈｅｃｏｎｓｅｒｖａｔｉｏｎａｔｔｈａｔｐｏｓｉｔｉｏｎ，ａｎｄｔｈｅｈｅｉｇｈｔｏｆｅａｃｈｌｅｔｔｅｒｗｉｔｈｉｎａｓｔａｃｋｄｅｐｅｎｄｓｏｎｔｈｅｆｒｅｑｕｅｎｃｙｏｆｔｈａｔｌｅｔｔｅｒａｔｔｈａｔｐｏｓｉｔｉｏｎ」における通りに解釈されるものとする。

よって、自発的にアセンブルするタンパク質群であって、かつて、データベース内において、機能が未知である、仮説的タンパク質として指し示された、ＤＵＦ３９９２ドメインを含む、このタンパク質群は、今や、細菌Ｅｎａタンパク質ファミリーの規定を構成するアノテーションの一部でありうる。したがって、Ｅｎａタンパク質ファミリーは、本明細書の表１に提示されたＨＭＭプロファイルと連携する、それらのＨＭＭプロファイルに基づき分類され、長さが、約１００～１６０アミノ酸であり、多量体などの高次構造へと、自発的にアセンブルする能力を伴い、好ましくは、前記多量体が、好ましくは、長手方向の共有結合的ジスルフィド架橋の形成により安定化された繊維構造へと、さらにアセンブルする能力を有する、細菌ＤＵＦ３９９２タンパク質として規定される。さらに、Ｅｎａタンパク質の構造的規定は、Ｅｎａフォールドを伴う、これらの細菌ＤＵＦ３９９２自己アセンブルタンパク質に関し、この場合、前記Ｅｎａフォールドは、シートが、ＢＩＤＧトポロジー及びＣＨＥＦトポロジーにあり、本明細書において記載され、アミノ酸配列に基づく、（予測）フォールドの、本明細書において提示された、ｃｒｙｏＥＭによる、Ｅｎａ１Ｂの参照構造のフォールドであって、Ｚスコアが、６．５以上であり、繊維内の先行サブユニットへの、共有結合的接続のための保存されたＺ－Ｘ_ｎ－Ｃ（Ｃ）－Ｘ_ｍ－Ｃモチーフ［配列中、Ｘ＝任意のアミノ酸であり、Ｚ＝Ｌｅｕ／Ｖａｌ／Ｉｌｅ／Ｐｈｅであり、ｎ＝１～２残基であり、ｍ＝１０～１２残基であり、Ｃ＝Ｃｙｓである。］を含有する、Ｎ末端「Ｎｔｃ」エレメントを伴う、参照構造のフォールドと比較したマッチングから導出可能である、８本のβ鎖によるβサンドウィッチを含む。

より具体的に述べると、本明細書において記載された多量体内のＤＵＦ３９９２ドメイン含有タンパク質サブユニットは、当技術分野において公知であり、例えば、Ｒｅｍａｕｔ及びＷａｋｓｍａｎ（２００６）において、他のタンパク質内のβシートのエッジに結合するタンパク質のうちの１つに由来するβ鎖間の静電相互作用を介する、タンパク質サブユニットのスタッガリングとして、かつて記載された構造特徴である、βシートの拡張を介して、互いと、非共有結合的に連結される（また、図２Ｄ、２Ｅ及び３Ｃも参照されたい）。最後に、細菌ＤＵＦ３９９２ドメイン含有自己アセンブルタンパク質は、本明細書において、配列番号１～８０及び１４５～１４６により提示され、本規定を適用することにより、すなわち、当業者が、タンパク質が、ＤＵＦ３９９２ドメインを含むのかどうかを規定し、構造が、Ｅｎａフォールドとしてもたらされていること、すなわち、ＰＤＢ７Ａ０２において提示されたＥｎａ１Ｂ構造と比較したＺスコアが、少なくとも６．５である、マッチングフォールドを有することを確認するように、当業者に公知であり、本明細書において例示された、構造マッチングツールを適用して、アミノ酸配列に基づき、簡単に予測されうる、そのフォールドを比較することを可能とする、簡単なＨＭＭＲ解析（例えば、ｈｔｔｐｓ：／／ｗｗｗ．ｅｂｉ．ａｃ．ｕｋ／Ｔｏｏｌｓ／ｈｍｍｅｒ／に提示されており、本明細書において、表１として提示された行列に基づく）を介して、新たに発見されたタンパク質が、このタンパク質ファミリーのメンバーであるのかどうかを検証することにより、このＥｎａタンパク質ファミリー下に収まることが簡単に検証されうる。さらに、ＤＵＦ３９９２ドメインを伴うタンパク質が、本明細書において主張される通り、少なくとも７つ、好ましくは、６つ～１２のタンパク質サブユニットによる多量体として、自己アセンブルし、出現する傾向を有するのかどうかは、例えば、ＳＤＳ－ＰＡＧＥ、動的光散乱解析、サイズ除外クロマトグラフィー又は、好ましくは、陰性染色透過電子顕微鏡法であるがこれらに限定されない、当業者により公知の試験により決定されうる。

本明細書において開示された、ＤＵＦ３９９２ドメイン含有Ｅｎａ自己アセンブルタンパク質は、バチルス属芽胞上において観察された通り、Ｎ末端において、剛性の線毛アセンブリー又は付属物アセンブリーの形成を優先する、保存されたシステイン残基により特徴付けられる。この観察に基づき、本明細書において、この自己アセンブルタンパク質ファミリーが、インビトロにおいて、繊維を形成する能力が探索された（図１３～１４を参照されたい）。本明細書において同定された、これらのタンパク質サブユニットの、これらの構造特徴は、前記システイン残基側鎖の存在を介して、自己アセンブルした、いくつかの多量体を、共有結合的に、強力に接続することを可能とする。したがって、細菌Ｅｎａタンパク質のファミリーは、ＤＵＦ３９９２ドメインと、Ｎ末端領域内における、少なくとも１つ以上の保存されたＣｙｓ残基とを構成する。より具体的に述べると、前記Ｅｎａタンパク質ファミリーは、本明細書において、Ｅｎａ１タンパク質、Ｅｎａ２タンパク質及びＥｎａ３タンパク質を含有することが同定されており、この場合、Ｅｎａ１及びＥｎａ２は、各々、全てが、それらのＮ末端領域内及びＣ末端領域内において、本明細書においてさらに詳細に記載される通り、特異的なアミノ酸残基コンセンサスモチーフを含む、３つのメンバー（Ａ、Ｂ、Ｃ）を含有することが示された。前記Ｅｎａ遺伝子／タンパク質ファミリーはまた、実施例において、構造的、かつ、系統発生的にも、より詳細に記載され、「Ｅｎａ１」遺伝子クラスター又は「Ｅｎａ２」遺伝子クラスターは、バチルス属種に存在し、Ｓ型繊維の形成を可能とし、加えて、Ｌ型繊維の形成に、単一のＥｎａ３Ａ遺伝子が要求されることを明らかにする。本明細書において記載された、バチルス属天然Ｓ型タンパク質繊維は、Ｅｎａ１Ａ、Ｅｎａ１Ｂ及びＥｎａ１Ｃ／Ｅｎａ２Ａ、Ｅｎａ２Ｂ及びＥｎａ２Ｃの３つのメンバー全てが、芽胞上において形成されることを要求する。驚くべきことに、Ｅｎａ１Ｃ／Ｅｎａ２Ｃは、エクスビボの繊維集合体内に、構造的に存在しなかったので、自己アセンブル特性を有するが、インビボの芽胞形成時において、繊維形成に対して、異なる寄与を有する。目覚ましいことに、Ｅｎａ１Ａ、Ｅｎａ１Ｂ又はＥｎａ１Ｃ／Ｅｎａ２Ａ、Ｅｎａ２Ｂ又はＥｎａ２Ｃである、これら３つのメンバーの組換え発現は、宿主細胞内において、多量体の形成を結果としてもたらした。さらに、立体障害を伴わない、単一のＥｎａ１Ａ又はＥｎａ１Ｂ／Ｅｎａ２Ａ又はＥｎａ２Ｂ（例えば、野生型配列）の組換え発現はなお、宿主細胞内における、Ｓ型様繊維の形成も可能とした。組換え発現されたＥｎａ１Ｃは、異なる種類の多量体アセンブリーを結果としてもたらし、円板型多量体を示した。さらに、組換え発現されたＥｎａ１Ａ又はＥｎａ１Ｂ／Ｅｎａ２Ａ又はＥｎａ２Ｂは、本明細書においてさらに規定された通り、立体障害により停止された場合、ヘリックスターン型多量体又はヘリックスアーク型多量体を形成する。最後に、バチルス属ゲノム内に、単一のＥｎａサブユニットを含むオペロンによりコードされた、Ｅｎａ３Ａタンパク質はまた、ＤＵＦ３９９２ドメインも含み、そのＮ末端において、保存されたＣｙｓ残基パターンを有する。しかし、Ｃ末端領域は、Ｅｎａ１／Ｅｎａ２タンパク質より多様である。このＥｎａ３Ａは、バチルス属芽胞上において観察された通り、Ｌ型繊維を構成することが同定されている。Ｌ型繊維は、繊維を安定化させるために、ジスルフィド結合を介して、長手方向に積み重ねられた、円板様多量体として出現する。

本明細書において、前記Ｅｎａタンパク質は、その特異的なＨＭＭプロファイルにより特徴付けられ、本明細書において提示された実施例において記載された通り、細菌ＤＵＦ３９９２ドメイン含有タンパク質から構成された、ＰＦＡＭ１３１５７のタンパク質として規定され、好ましくは、Ｓ型繊維及びＬ型繊維を形成するサブユニットについて、本明細書において規定された、保存されたＣｙｓ残基プロファイル（図１６～１９を参照されたい）を有し、より好ましくは、また、本明細書において記載された、保存されたＣ末端モチーフも有することをさらに裏付け、とりわけ、細菌Ｅｎａ１タンパク質サブファミリー、細菌Ｅｎａ２タンパク質サブファミリー及び細菌Ｅｎａ３タンパク質サブファミリーのメンバーを含む。Ｅｎａタンパク質ファミリーは、細菌である、バチルス属種群にその由来を有し、細菌に由来するタンパク質配列に限定される。構造的に、Ｅｎａタンパク質は、並置された２つのβシートから構成された、ゼリーロール状三次元構造により特徴付けられ、この場合、前記βシートは、鎖である、ＢＩＤＧ及びＣＨＥＦからなるトポロジーをもたらし、典型的に、最初の１０～２０残基の長さである、「伸長部」又は「接続部」からなる可撓性Ｎ末端領域に続く、積み重ね繊維内の多量体間の物理的距離を確保する、約５～１６残基の長さのスペーサーをさらに含む（図８及び１７～１９を参照されたい）。したがって、特定の実施形態において、本発明の多量体は、少なくとも６つ、好ましくは、６つ～１２のＥｎａタンパク質サブユニットを含み、この場合、サブユニット（ｉ）のＢＩＤＧによるβシートは、（ｉ－１）のＣＨＥＦによるβシートにより拡張され、サブユニット（ｉ）のＣＨＥＦによるβシートは、（ｉ＋１）のＢＩＤＧによるβシートにより拡張される。より詳細には、多量体は、７つ～１２、７つ～１１、７つ～１０、８つ～１０若しくは９つのタンパク質サブユニット又は、正確に述べると、７つ、９つ、１０、１１若しくは１２のサブユニットを含みうる。

系統発生的、かつ、機能的な特徴付けを念頭に置くと、本明細書において使用された、この「Ｅｎａタンパク質」のファミリーは、本明細書において、バチルス・セレウスＮＶＨ００７５－９５３８３株のＥｎａ１Ａ（配列番号１）、Ｅｎａ１Ｂ（配列番号８）及びＥｎａ１Ｃ（配列番号１５）及びバチルス・シトトキシクス（Ｂａｃｉｌｌｕｓｃｙｔｏｔｏｘｉｃｕｓ）ＮＶＨ３９１－９８株のＥｎａ２Ａ（配列番号２１）、Ｅｎａ２Ｂ（配列番号２９）、Ｅｎａ２Ｃ（配列番号３８）及びバチルス・セレウスのＥｎａ３Ａ（配列番号４９）並びに他の細菌株における、多数のホモログ及び／又はオーソログにより、さらに例示された、各Ｅｎａタンパク質ファミリーメンバーの各クラスターについて、代表的タンパク質を開示する、配列番号１～８０、配列番号１４５又は配列番号１４６に示された、バチルス属タンパク質のリストとして例示されるがこれらに限定されず、この場合、ファミリーメンバーの各オーソログ配列は、それらの全長にわたり規定された通りの、本明細書において使用された配列に対する、少なくとも８０％の同一性を有する（また、実施例の「系統発生的解析」及び図１６～１９も参照されたい）。より具体的に述べると、バチルス・セレウスＮＶＨ００７５－９５３８３株の、Ｅｎａ１Ａタンパク質及びＥｎａ１Ｂタンパク質は、それぞれ、配列番号１及び配列番号８において示され、比較ウィンドウとしての全配列にわたり、少なくとも８０％のアミノ酸同一性を有し、ＤＵＦ３９９２ドメイン並びにＮ末端及びＣ末端の保存されたＣｙｓ残基を含む、任意のその細菌ホモログは、候補オーソログである（図１６～１７）。バチルス・セレウスＮＶＨ００７５－９５３８３株のＥｎａ１Ｃタンパク質は、配列番号１５において示され、比較ウィンドウとしての全配列にわたり、少なくとも６０、７０又は８０％のアミノ酸同一性を有し、ＤＵＦ３９９２ドメイン並びにＮ末端及びＣ末端の保存されたＣｙｓ残基を含む、任意のその細菌ホモログは、候補オーソログである（図１８）。同様に、バチルス・シトトキシクスＮＶＨ３９１－９８株のＥｎａ２Ａタンパク質及びＥｎａ２Ｂタンパク質は、配列番号２１及び配列番号２９に、それぞれ示され、比較ウィンドウとしての全配列にわたり、少なくとも８０％のアミノ酸同一性を有し、ＤＵＦ３９９２ドメイン並びにＮ末端及びＣ末端の保存されたＣｙｓ残基を含む、任意のその細菌ホモログは、候補オーソログである（図１６～１７）。バチルス・シトトキシクスＮＶＨ３９１－９８株のＥｎａ２Ｃタンパク質は、配列番号３８において示され、比較ウィンドウとしての全配列にわたり、少なくとも６０、７０又は８０％のアミノ酸同一性を有し、ＤＵＦ３９９２ドメイン並びにＮ末端及びＣ末端の保存されたＣｙｓ残基を含む、任意のその細菌ホモログは、候補オーソログである（図１８）。バチルス・セレウスのＥｎａ３Ａタンパク質は、配列番号４９（複数種の参照番号）において示され、比較ウィンドウとしての全配列にわたり、少なくとも６０、７０又は８０％のアミノ酸同一性を有し、ＤＵＦ３９９２ドメイン並びにＮ末端及びＣ末端の保存されたＣｙｓ残基を含む、任意のその細菌ホモログは、候補オーソログである（図１９）。

多量体アセンブリー
本発明の第２の態様は、タンパク質多量体アセンブリー又は多量体に関する。これは、「機能未知ドメイン３９９２」（ＤＵＦ３９９２）ドメインタンパク質及び典型的な、Ｎ末端の保存された領域を伴う、少なくとも７つ、好ましくは、７つ～１２の間若しくはこれを超える自己アセンブルタンパク質サブユニットを含み、前記タンパク質サブユニットは、互いに非共有結合的に接続されている。

前記自己アセンブルＤＵＦ３９９２ドメイン含有タンパク質サブユニットは、より具体的に述べると、Ｅｎａタンパク質配列及び／又は操作されたＥｎａタンパク質配列を含む、タンパク質サブユニットに関する。

別の実施形態は、７つ～１２のタンパク質サブユニットを含み、前記タンパク質サブユニットが、Ｅｎａタンパク質及び／又はその操作されたＥｎａタンパク質形態を含む多量体を開示する。具体的な実施形態において、前記多量体は、配列番号１～８０、１４５～１４６に示されたＥｎａタンパク質又はこれらのうちのいずれか１つに対する、少なくとも６０％の同一性又はこれらのうちのいずれか１つに対する少なくとも７０％若しくは少なくとも８０％若しくは少なくとも８５％若しくは少なくとも９０％若しくは少なくとも９５％若しくは少なくとも９７％の同一性を有するホモログ、これらの機能的なオーソログ及び／又はこれらの操作されたＥｎａタンパク質形態から選択されたタンパク質サブユニットを含む。本明細書において記載された、これらの多量体は、ＤＵＦ３９９２ドメインを含み、６つ、７つ、８つ、９つ、１０、１１又は１２のタンパク質サブユニット（図１４～１５）からなることが規定されているタンパク質サブユニットの自己アセンブリーにより形成される。これらのタンパク質多量体は、本明細書において、「それ自体としての」多量体のフォーマットにおいて、多数の適用のために機能すると規定されるが、これは、多量体が、溶液中、細胞内又は別の種類のインビトロ環境内において、独立の単位であると規定される一方、それ自体における、ＤＵＦ３９９２ドメイン又はＥｎａタンパク質サブユニットの、このような多量体は、自然において見出されず、繊維を形成するそれらの傾向のために、インビボ又は天然の条件において、「それ自体として」形成又はアセンブルしないことを意味する。Ｓ型繊維は、個別の多量体から構成されず、水平方向の非共有結合的相互作用、とりわけ、後続のタンパク質サブユニット間におけるβシートの拡張により形成された、連続ヘリックス構造として、長手方向の繊維へと連なる、多量体によるＥｎａ構造を含む。加えて、Ｎ末端領域内及びＣ末端領域内における、保存されたＣｙｓ残基の存在のために、これらは、共有結合的ジスルフィド架橋により、さらに剛直化される。独立生成物「それ自体として」の、Ｅｎａ１／Ｅｎａ２Ａ多量体又はＥｎａ１／Ｅｎａ２Ｂ多量体を形成するため、「立体障害」は、多量体のさらなるアセンブリングを防止することが（図１３Ａ及び１４Ａを参照されたい）要求される。したがって、具体的に規定された前記多量体は、例えば、Ｎ末端の、他の多量体との、共有結合的接続に対して、立体障害をもたらすことにより、それらの繊維成長が停止される。本明細書において互換的に使用された、「立体障害型（ｓｔｅｒｉｃａｌｌｙｆｒｕｓｔｒａｔｅｄ）」Ｎ末端領域又は「立体障害型（ｓｔｅｒｉｃａｌｌｙｈｉｎｄｅｒｅｄ）」Ｎ末端領域又は「立体障害型（ｓｔｅｒｉｃａｌｌｙｂｌｏｃｋｅｄ）」Ｎ末端領域は、本明細書において、自然発生のＥｎａタンパク質Ｎ末端に対する構造的差違として規定され、この場合、構造的差違は、Ｎ末端の、他のタンパク質又は多量体との、共有結合的連結に対して、立体障害を結果としてもたらす。例えば、少なくとも１～５、６、７、８、９、１０、１１、１２、１３、１４、１５アミノ酸残基以上の、異種Ｎ末端タグを、１つ以上の野生型Ｅｎａタンパク質サブユニットへと付加することにより、例えば、異なる多量体の共有結合的連結を防止することにより、多量体の、長手方向への成長を停止させる、「操作された又は修飾」異種タグ付けＥｎａタンパク質が形成される。前記多量体のタンパク質サブユニットのＮ末端に立体障害をもたらす代替法は、例えば、長手方向の相互作用、とりわけ、Ｓ型繊維形成に要求された、Ｃ末端の伸長部又はタグである。又は代替法は、Ｎ末端接続部又はＣ末端接続部の、任意のジスルフィド連結に立体障害をもたらす、化学的リンカーの付加の場合もあり、Ｎ末端のＥｎａタンパク質配列を突然変異させて、システインを除去することによる場合もあり、他の多量体とのジスルフィド架橋の形成に立体障害をもたらす、Ｅｎａタンパク質変異体の創出の場合もある。したがって、特定の実施形態は、本明細書において記載された多量体に関し、この場合、少なくとも１つのタンパク質サブユニットは、立体障害を形成するように、少なくとも１～５、６、７、８、９、１０、１１、１２、１３、１４、１５アミノ酸以上の、異種Ｎ末端タグ及び／若しくは異種Ｃ末端タグ又は異種Ｎ末端伸長部及び／若しくは異種Ｃ末端伸長部又は異種Ｎ末端接続部及び／若しくは異種Ｃ末端接続部をさらに含む。したがって、「それ自体としての」、Ｅｎａ１／Ｅｎａ２Ａ及び／又はＥｎａ１／Ｅｎａ２Ｂアセンブリーの、１０量体、１１量体又は１２量体を得るために、これらの多量体の、繊維への、さらなるアセンブリーを防止する、Ｎ末端における立体障害の存在が所望される（図１４～１５を参照されたい）。したがって、独立のタンパク質単位としての、これらの多量体は、本明細書においてまた、さらにより詳細にも記載された、前記多量体の、少なくとも１つのタンパク質サブユニットの操作時に形成されうる。したがって、特定の実施形態は、立体障害を施された、Ｎ末端領域及び／若しくはＣ末端領域又はＮ末端接続部及び／若しくはＣ末端接続部を伴う、単一ターン多量体又は単一ヘリックスアーク多量体として示された、停止多量体である、本明細書において記載された多量体に関する。

代替的に、Ｅｎａ１Ｃ／Ｅｎａ２Ｃタンパク質は、組換え発現された場合に、リング様多量体又は円板様多量体を形成することが示されている。インビトロにおいて、立体障害を施されたＮ末端領域及び／又はＣ末端領域を伴う、又はこれを伴わない、閉環状多量体又は円板様構造が形成される。なおさらに、特定の場合において、第１のＮ末端接続部領域を欠く、組換え発現された、切断型Ｅｎａ１Ｃ／Ｅｎａ２Ｃタンパク質であってもなお、自己アセンブリーが可能であり、多量体へとアセンブルすることが可能である。一実施形態において、多量体を構成する、これらのＥｎａ１Ｃは、それぞれ、７つ又は９つのサブユニットを伴う、７量体又は９量体からなりうる（また、図１４Ｂ及び１５Ｂも参照されたい）。

組換えにより作製されたＥｎａ１Ｃ多量体又は９量体リング構造は、Ｅｎａ１Ｃ多量体アセンブリーを、生体機能的ツール及び構造的ツールとして適合させる、突然変異又は挿入により、異種Ｎ末端タグ又は異種Ｃ末端タグを付加することにより、さらに操作されうる。

具体的な実施形態において、ＤＵＦ３９９２ドメイン含有タンパク質又は、とりわけ、Ｅｎａタンパク質、そのホモログ若しくはその操作された形態を含む、６つ～１２のタンパク質サブユニットを含む、本明細書において記載された、前記多量体は、単離された多量体である。前記単離された多量体は、「それ自体としての」多量体を作製する、本明細書において記載されたキメラ遺伝子の組換え発現、任意選択的に、これに続く、産生宿主からの、前記多量体の精製により得られる。したがって、一実施形態は、少なくとも６つ、若しくは、好ましくは、７つ～１２のサブユニットからなる前記単離された多量体又は操作された多量体又はその天然の対応物若しくは野生型タンパク質形態であるタンパク質サブユニットと比較して、少なくとも１つの操作されたタンパク質サブユニットを含む多量体に関する。具体的な実施形態において、本明細書において記載された多量体の、タンパク質サブユニットは、ホモマー多量体の場合もあり、ヘテロマー多量体の場合もあり、後者は、同一なＤＵＦ３９９２サブユニットを含む場合もあり、野生型Ｅｎａタンパク質サブユニット及び、例えば、タグ付けＥｎａタンパク質又は突然変異体Ｅｎａタンパク質サブユニットなど、操作されたＥｎａタンパク質サブユニットからなる場合もある。ヘテロマー多量体は、１種類のＥｎａタンパク質からなる場合もあり、いくつかの種類のＥｎａタンパク質メンバーからなる場合もある。

全体として、少なくとも７つのＤＵＦ３９９２ドメイン含有タンパク質サブユニットを含むように、本明細書において規定された多量体である。これは、本明細書において規定された少なくとも１つの、Ｅｎａタンパク質であることが可能であり、タンパク質サブユニットが、βシートの拡張を介して非共有結合的に連結された、少なくとも１つの、操作されたＥｎａタンパク質サブユニットを含みうる。Ｎ末端領域及び／若しくはＣ末端領域により誘発され、多量体間ジスルフィド架橋を形成する、さらなるオリゴマー化及び共有結合的相互作用を防止し、かつ／又は前記多量体アセンブリーのための、さらなる機能性若しくは特性を獲得することを目的として、本明細書に、非自然発生のＥｎａタンパク質サブユニットとして規定された。

本明細書において規定された、「操作されたＤＵＦ３９９２含有タンパク質サブユニット」又は本明細書において規定された、「操作されたＥｎａタンパク質」は、それぞれ、ＤＵＦ３９９２含有タンパク質又はＥｎａタンパク質の非自然発生形態に関する。これは、それでも自己アセンブルすることが可能であり、多量体構造又は繊維構造を形成することが可能である。本明細書において互換的に使用された、操作された若しくは修飾若しくはモジュレートされたタンパク質サブユニット又はタンパク質サブユニット変異体は、それらの一次構造特徴レベルにおける差違、すなわち、野生型（Ｅｎａ）タンパク質と比較した、それらのアミノ酸配列における差違のほか、他の修飾による差違、すなわち、化学的リンカー又は化学的タグによる差違を示しうる。したがって、操作されたタンパク質サブユニットは、他の修飾の中において、例えば、１つ以上のアミノ酸の置換、挿入若しくは欠失を含む、突然変異体タンパク質又はタグ付けされたタンパク質の場合もあり、標識されたタンパク質の場合もある、融合タンパク質又はその配列内若しくはそのトポロジー内に挿入を伴うタンパク質又は部分Ｅｎａタンパク質若しくはスプリットＥｎａタンパク質のアセンブリーにより形成されたタンパク質に関しうる。したがって、一実施形態において、天然Ｅｎａタンパク質と比較した、修飾Ｅｎａタンパク質であり、非自然発生タンパク質である、操作されたＥｎａタンパク質が開示される。本明細書において提示された非限定例は、より具体的に述べると、繊維アセンブリーの形成を伴わない多量体形成のために、立体障害を施されたＥｎａタンパク質サブユニットを獲得するように、少なくとも１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５アミノ酸残基長以上の異種タグを伴う、Ｎ末端又はＣ末端においてタグ付けされたＥｎａタンパク質；Ｅｎａ突然変異体タンパク質又は変異体タンパク質；β鎖の間における、その露出ループのうちの１つの中に、異種ペプチド若しくは異種タンパク質が挿入された、Ｅｎａタンパク質融合体若しくはＥｎａタンパク質又は宿主内において個別に発現された、Ｅｎａスプリットタンパク質部分のアセンブリー時に形成されたＥｎａタンパク質に関する。

タグは、野生型タンパク質配列内において自然発生でない場合、「異種融合体」を結果としてもたらす、「異種タグ」又は「異種標識」であり、タンパク質の精製を容易にするための適用又は繊維形成の成長が立体障害を施された多量体をアセンブルするための適用を目的として付加される。本明細書において使用された、「検出用標識」、「標識化」又は「タグ」という用語は、本明細書において記載された、単離された（ポリ）ペプチド又は精製（ポリ）ペプチドの、検出、視覚化及び／又は単離された、精製及び／又は固定化を可能とする、検出用標識又は検出用タグを指し、これらの目的のために、当技術分野において公知である、任意の標識／タグを含むことが意図される。キチン結合性タンパク質（ＣＢＰ）、マルトース結合性タンパク質（ＭＢＰ）、グルタチオン－Ｓ－トランスフェラーゼ（ＧＳＴ）、ポリ（Ｈｉｓ）（例えば、６×Ｈｉｓ又はＨｉｓ６）、Ｓｔｒｅｐ－ｔａｇ（登録商標）、Ｓｔｒｅｐ－ｔａｇＩＩ（登録商標）及びＴｗｉｎ－Ｓｔｒｅｐ－ｔａｇ（登録商標）などのアフィニティータグ；チオレドキシン（ＴＲＸ）、ポリ（ＮＡＮＰ）及びＳＵＭＯなどの可溶化タグ；ＦＬＡＧタグなどのクロマトグラフィータグ；Ｖ５タグ、ＥＰＥＡタグ、ｍｙｃ－タグ及びＨＡタグなどのエピトープタグ；蛍光タンパク質（例えば、ＧＦＰ、ＹＦＰ、ＲＦＰなど）及び蛍光染料（例えば、ＦＩＴＣ、ＴＲＩＴＣ、クマリン及びシアニン）などの、蛍光標識又は蛍光タグ（すなわち、蛍光色素／フルオロフォア）；ルシフェラーゼなどの発光標識又は発光タグ；及び（他の）酵素標識（例えば、ペルオキシダーゼ、アルカリホスファターゼ、ベータ－ガラクトシダーゼ、ウレアーゼ又はグルコースオキシダーゼ）が、特に、好ましい。また、前出の標識又はタグのうちのいずれかの組合せも含まれる。

好ましくは、タグの付加により操作されうる、前記機能的操作されたタンパク質サブユニット又は操作されたＥｎａタンパク質サブユニット若しくは操作されたＥｎａタンパク質単量体は、さらに、操作されたＥｎａタンパク質サブユニットのホモ多量体アセンブリー又は操作されたＥｎａタンパク質サブユニットと、非操作（例えば、野生型）Ｅｎａタンパク質サブユニットとを組み合わせる、ヘテロ多量体アセンブリーとして、それ自体における、停止多量体又は停止繊維を形成することが可能でありうる。

特定の実施形態において、タンパク質サブユニットは、少なくとも１つのＥｎａ突然変異体タンパク質サブユニット又はＥｎａ変異体タンパク質サブユニットを含む、操作されたＥｎａタンパク質でありうる。例えば、限定せずに述べると、このようなＥｎａ突然変異体又はＥｎａ変異体は、多量体又はタンパク質サブユニットの表面側鎖の修飾又は突然変異が、どの位置において実行可能であるのかを裏付ける構造情報に由来しうる（また、図１５も参照されたい）。Ｅｎａ１Ｂサブユニット突然変異体について提起された置換と同様に可能な置換は、配列番号８内の残基である、Ａ３１、Ｔ３２、Ａ３３、Ｔ５７、Ｔ６１、Ｖ６３、Ｖ６９、Ｔ７０、Ｔ７２、Ａ７３、Ｔ７６、Ｖ７８、Ｔ９６、Ｌ９８、Ｔ１００及びＡ１０１について示された、Ｅｎａ１Ｂについての図１５において示される。関連のある置換え残基の例は、システイン又はリシン又はアジド側鎖を伴う非天然アミノ酸など、クリック化学反応に適する非天然アミノ酸を含む。

さらに、Ｅｎａ１Ｂ（配列番号８）内の挿入部位の例は、以下のβ鎖：残基Ａ３０～Ａ３３を伴う鎖であるＢ～Ｃ；残基Ｔ５５～Ｐ５９を伴う鎖であるＤ～Ｅ；残基Ｓ６６～Ｔ７２を伴う鎖であるＥ～Ｆ；及び残基Ｇ９９～Ａ１０３のループを伴う鎖であるＨ～Ｉを接続するループに配置された位置により、図１５に示される。このようなループ内の、異種タンパク質若しくは異種ペプチド又はリンカーの挿入は、４００残基長以下のアミノ酸配列からなりうるが、なおも、多量体の形成に要求された、フォールディング及び構造特徴を保持する。とりわけ、このような挿入変異体又は機能的突然変異体である、操作されたＥｎａタンパク質を、どのようにして創出するのかは、例えば、例えばそれ自体としてのＥｎａ１Ｂ一次アミノ酸配列を改変すること：Ｅｎａ１Ｂタンパク質を、残基Ｓ６６において切断することにより、β鎖であるＥと、β鎖であるＦとの間に、単一残基のペプチド又は（ポリ）ペプチドをまず挿入し、そのＮ末端残基のインサートを、Ｅｎａ１ＢのＣ末端であるＳ６６へと付加し、そのＣ末端のインサートを、Ｅｎａ１ＢのＮ末端であるＧ６７へと付加することによる、配列の並べ替えによる創出として想定されうる。挿入はまた、多数のアミノ酸を、前記Ｅｎａタンパク質のループから除去することによっても創出されうる、例えば、Ｅｎａ１Ｂ配列残基Ｓ６６～Ｔ７２は、インサートにより置換えられうる。当業者は、Ｅｎａタンパク質の、開示された構造特徴に基づき、本明細書において提示された、異なるＥｎａタンパク質ループ領域内に、どのようにして、同様のインサートを創出するのかについて承知しており、また、これにより、Ｅｎａホモログ又はその操作されたＥｎａタンパク質形態のための、同様のインサートも創出しうる。

Ｅｎａタンパク質について、本明細書において規定された、Ｎ末端領域及びＣ末端領域とは、野生型Ｅｎａタンパク質配列を指す。前記野生型（又は置換／突然変異体）Ｅｎａタンパク質について、「Ｎ末端領域」は、可撓性Ｎ末端接続部に続く、スペーサー及び前記Ｅｎａタンパク質サブユニットのゼリーロール状フォールディングを構成する、典型的なＢＩＤＧ－ＣＨＥＦによるβシートの、最初のβ鎖であるＢを含む、Ｅｎａタンパク質配列の最初の部分として規定される。本明細書において規定されたＥｎａタンパク質の「Ｃ末端領域」とは、ＢＩＤＧ－ＣＨＥＦによるβシートの、最後のβ鎖であるＩ及びこれに後続する、可能な残りのＣ末端残基を含む、タンパク質配列の末端である。

検討しうる１つの適用は、Ｅｎａタンパク質サブユニットを、例えば、抗体など、別の機能的部分又はタンパク質が、前記Ｅｎａタンパク質又はＥｎａ多量体へと融合され、任意選択的に、表面又は支持体へとカップリングされた、機能化多量体をもたらす、操作されたＥｎａタンパク質フォーマットにおいて修飾することである。

構造的に興味深い融合体を作るために、当業者は、Ｅｎａタンパク質を、巡回置換タンパク質として操作することについて検討しうる。「タンパク質の巡回置換」又は「巡回置換タンパク質」という用語は、そのアミノ酸配列内のアミノ酸の順序を、野生型タンパク質配列と比較して変化させ、その結果として、接続性は異なるが、全体的三次元（３Ｄ）形状は類似するタンパク質構造を伴うタンパク質を指す。タンパク質の巡回置換は、例えば、Ｂｌｉｖｅｎ及びＰｒｌｉｃ（２０１２）において記載された通り、野生型タンパク質の第１の部分の配列（Ｎ末端と隣接する）が、結果として得られる、巡回置換タンパク質の第２の部分の配列（そのＣ末端の近傍において）と類縁であるという意味において、巡回置換についての数学的概念と類似する。タンパク質の、その野生のタンパク質と比較した巡回置換は、前記タンパク質の新規のＮ末端及びＣ末端を創出するように、野生型タンパク質のＮ末端及びＣ末端（Ｅｎａタンパク質について、本明細書の上記において規定された）が「接続され」、タンパク質配列が、別の部位において、中断又は切断された、タンパク質配列の遺伝子操作又は人工操作を介して得られる。したがって、本発明の巡回置換Ｅｎａタンパク質は、野生型Ｅｎａタンパク質配列のＮ末端と、Ｃ末端との接続及びアクセス可能部位又は露出部位（優先的に、βターン又はループ）における、フォールディングが、野生型Ｅｎａタンパク質のフォールディングと比較して保持された前記Ｅｎａタンパク質サブユニット、又はこれと類似する前記Ｅｎａタンパク質サブユニットの切断又は配列の中断の結果である。前記巡回置換スキャフォールドタンパク質内の、Ｎ末端と、Ｃ末端との前記接続は、野生型タンパク質の、元のＮ末端及びＣ末端の近傍における、ペプチド結合による連結又はペプチドリンカーの導入若しくはペプチドの連なりの欠失に続く、ペプチド結合又は残りのアミノ酸の導入の結果でありうる。結果として得られるＥｎａタンパク質のＮ末端及びＣ末端の、この再配置は、二次Ｎ末端及び二次Ｃ末端と称される。

最後に、本明細書において記載された多量体は、次世代生体材料の分野において、多数の適用をもたらす。一実施形態において、前記多量体は、固体表面へとカップリングされ、それ自体として、極度の弾力性挙動を有する特性を伴う改変された表面をもたらすので、極めて安定かつ剛性の材料である。

繊維状アセンブリー
本発明の別の態様は、少なくとも２つの多量体を含む、組換えにより作製された繊維に関し、この場合、前記多量体は、少なくとも７つのタンパク質サブユニット又は７つ～１２のサブユニットに関する。自己アセンブルＤＵＦ３９９２ドメイン含有タンパク質、Ｅｎａタンパク質からなり、特に、前記タンパク質サブユニットが、βシートの拡張を介して非共有結合的に連結され、前記多量体が長手方向に積み重ねられ、少なくとも１つのジスルフィド架橋を介して共有結合的に接続される。したがって、タンパク質繊維は、非天然の宿主内において、インセルロにおける組換えにより作製される場合もあり、かつ／又はインビトロにおける組換えにより作製される場合もあり、ヘテロマー多量体を含む場合もあり、ホモマー多量体を含む場合もある。ヘテロマータンパク質繊維が想定される場合、多量体は、１つ以上の自己アセンブルＤＵＦ３９９２ドメイン含有Ｅｎａタンパク質を含む場合もあるが、代替的に、タンパク質サブユニットは、１つ以上のサブユニットが、それらの操作されたタンパク質形態であることを除き、同一である。ホモ多量体タンパク質繊維は、特異的Ｅｎａタンパク質又はＥｎａタンパク質の突然変異体、変異体又は操作されたＥｎａタンパク質を、宿主細胞内において組換え発現させることにより作出されうる。インビボのバチルス属繊維上において観察されたラッフル膜（実施例を参照されたい）は、組換えにより作製された繊維内において、決して見られなかったので、１つ以上のＥｎａタンパク質サブユニットを含む、任意の組換え作製タンパク質繊維は、非自然発生の繊維となる。

具体的な実施形態において、本明細書において記載された、タンパク質サブユニット又は多量体は、モチーフ内に存在するＣｙｓを、長手方向において接続して、共有結合的ジスルフィド結合を形成することにより、前記多量体のＳ型繊維の形成を可能とするように、ＺＸ_ｎＣＣＸ_ｍＣ［配列中、Ｚは、Ｌｅｕ、Ｉｌｅ、Ｖａｌ又はＰｈｅであり、Ｘは、任意のアミノ酸であり、ｎは、１又は２残基であり、ｍは、１０～１２である。］として示された、保存されたアミノ酸残基の配列モチーフを伴う、本明細書において、互換的に使用された、「Ｎ末端領域」又は「Ｎ末端接続部」又は「Ｎ末端接続部領域」を含み、本明細書において、互換的に使用された、ＧＸ_２／３ＣＸ_４Ｙ［配列中、Ｘは、任意のアミノ酸である。］として示された、保存されたアミノ酸のモチーフを伴う、「Ｃ末端領域」又は「Ｃ末端受容部領域」を含む。具体的な実施形態において、これらの多量体により形成された、前記タンパク質繊維は、ヘリックス構造を有する（例えば、図１３ａ～１４ａ）。こうして、タンパク質繊維は、多量体が、立体障害されない場合に限り形成されうる。

別の実施形態において、前記タンパク質繊維の剛性及び／又は弾性をモジュレートするための「操作された多量体」であって、１つ以上のタンパク質サブユニットのＮ末端領域が、Ｎ末端の保存されたモチーフＺＸ_ｎＣＣＸ_ｍＣ［配列中、Ｚは、Ｌｅｕ、Ｉｌｅ、Ｖａｌ又はＰｈｅであり、Ｘは、任意のアミノ酸であり、ｎは、１又は２残基であるが、ｍが、１０～１２残基ではなく、７、８又は９アミノ酸残基である結果として、より短い（例えば、配列番号１のＥｎａ１Ａ又は配列番号８のＥｎａ１Ｂと比較して）Ｎ末端領域をもたらす、又はｍが、１３～１６残基の間である結果として、より長い（例えば、配列番号１のＥｎａ１Ａ又は配列番号８のＥｎａ１Ｂと比較して）Ｎ末端領域をもたらす］を含む、「操作された多量体」が作製される。前記操作された多量体は、Ｓ型繊維又はヘリックス状繊維のアセンブリーにおいて、前記システインを介して、Ｃ末端受容部モチーフＧＸ_２／３ＣＸ_４Ｙとの共有結合的Ｓ－Ｓ間架橋を形成することを、やはり可能としうるが、ｍが、１０～１２残基である多量体と比較して、安定性又は剛性が低下する場合がある。Ｓ型繊維又はヘリックス状繊維の形成は、ジスルフィド架橋の形成を伴わずに可能でありうるが、これは、はるかに不安定であり、弾力性が低下した繊維構造を結果としてもたらす。実際、本明細書において支援された通り、Ｎ末端システインによる共有結合的連結を含む繊維構造は、例えば、芽胞付属物が、過酷な条件下において存続することを可能とする安定性をもたらす。繊維の管腔内に存在するジスルフィド結合は、この強度を可能とするので、繊維内において好ましい。

さらに、円板型多量体を含む、Ｌ型タンパク質繊維はまた、長手方向において、Ｎ末端の保存されたＣｙｓ残基と、先行層の接続部の多量体との共有結合的連結を介しても架橋される。前記繊維は、配列番号４９～８０において示されたＥｎａ３又はこれらのうちのいずれか１つに対する少なくとも８０％を伴うホモログの組換え発現により形成されうる。本明細書において、Ｌ型の繊維形成において機能的である、前記Ｅｎａ３タンパク質は、Ｅｎａ１／Ｅｎａ２Ａ及びＥｎａ１／Ｅｎａ２ＢのＳ型繊維を形成するサブユニットへと微細に適合された、保存されたモチーフ、すなわち、第２のＣｙｓが、一部のＥｎａ３タンパク質内の、別のアミノ酸により置換えられる場合があるので、ＺＸ_ｎＣ（Ｃ）Ｘ_ｍＣ［配列中、Ｚは、Ｌｅｕ、Ｉｌｅ、Ｖａｌ又はＰｈｅであり、Ｘは、任意のアミノ酸であり、ｎは、１又は２残基であり、ｍは、１０～１２である。］により規定されたモチーフを伴う、Ｎ末端接続部を含有し、前記モチーフ内に存在するＣｙｓを、長手方向において接続して、共有結合的ジスルフィド結合を形成することにより、前記多量体のＬ型繊維の形成を可能とするように、Ｓ－Ｚ－Ｎ－Ｙ－Ｘ－Ｂ［配列中、Ｚは、Ｌｅｕ又はＩｌｅであり、Ｂは、Ｐｈｅ又はＴｙｒであり、Ｘは、任意のアミノ酸である。］として示された、保存されたアミノ酸のモチーフを伴う、本明細書において、互換的に使用された、「Ｃ末端領域」又は「Ｃ末端受容部領域」を含むように、さらに規定される。具体的な実施形態において、これらの多量体により形成された、前記タンパク質繊維は、円板様構造を有する（例えば、図１３ｂ～１４ｂ）。こうして、タンパク質繊維は、多量体が、立体障害されない場合に限り形成されうる。

例えば、少なくとも１～５、６、７、８、９、１０、１１、１２、１３、１４、１５アミノ酸以上の、異種Ｎ末端タグの付加により、立体障害は、ジスルフィド架橋の形成を防止する、又はこれに負の影響を及ぼし、これにより、繊維形成を防止する、又は繊維の部分形成若しくは強度及び弾力性若しくは剛性の低下した繊維を結果としてもたらす（実施例を参照されたい）。

具体的な実施形態において、前記少なくとも２つの多量体を含む、作製されたタンパク質繊維は、１つの多量体の、少なくとも１つのタンパク質サブユニットのＮ末端接続部領域のＣｙｓ残基の側鎖と、先行層の多量体の受容部領域の、タンパク質サブユニットのＣｙｓ残基の側鎖との間の、少なくとも１つのジスルフィド結合を介して、この長手方向において、共有結合的に連結される。好ましい実施形態の、繊維の異なる多量体の間において、少なくとも２つのジスルフィド結合が形成され、最も好ましくは、各ジスルフィド結合は、繊維の先行多量体のタンパク質サブユニット内に存在する、Ｃｙｓの硫黄原子に結合するように、１つ以上のタンパク質サブユニットのＮ末端領域内のシステインに由来する硫黄原子を含有する。具体的な実施形態において、前記Ｎ末端領域は、それらのいずれもが、繊維の別の多量体とのジスルフィド架橋に参与するように、前記保存されたアミノ酸モチーフ内に、２つの連続Ｃｙｓを有する。他の実施形態は、少なくとも２つの多量体を含むナノ繊維としての、前記タンパク質繊維に関し、この場合、前記多量体は、積み重ねし、タンパク質サブユニット（ｉ）のＮ末端の保存されたモチーフの、第１のＣｙｓ残基及び第２のＣｙｓ残基と、サブユニット（ｉ－９）のβ鎖であるＩのＣｙｓ残基及びサブユニット（ｉ－１０）のβ鎖であるＢのＣｙｓ残基のそれぞれとにより形成された、ジスルフィド架橋を介して共有結合的に連結される。

したがって、本明細書において記載されたタンパク質繊維は、各々が、本明細書において記載された、自己アセンブルＤＵＦ３９９２ドメイン含有タンパク質を含む、より詳細には、Ｅｎａタンパク質又は操作されたＥｎａタンパク質を含む、少なくとも７つのタンパク質サブユニットを含む、２つ以上の多量体から構成され、この場合、前記タンパク質サブユニットは、非共有結合的に連結され、前記多量体は、積み重ね多量体の間において、共有結合的ジスルフィド結合を形成することだけにより、長手方向に積み重ねられる。前記タンパク質繊維内において、前記多量体は、組成が同一な場合もあり、異なる場合もある。前記多量体は、本明細書において規定された通り、繊維の剛性をモジュレートするための、操作された多量体でありうる。さらに、前記少なくとも２つの前記タンパク質繊維の多量体は、同一なタンパク質サブユニットを含む多量体の場合もあり、異なるタンパク質サブユニットを含む多量体の場合もある。ジスルフィド架橋を介して共有結合的にだけ接続された識別可能な多量体円板を含むＬ型繊維と対称的に、Ｓ型繊維内に存在する多量体は、共有結合的にだけ接続された、単一のユニットとして識別可能ではなく、βプロペラによるヘリックス構造内のタンパク質サブユニットによる、βシートの連続的な拡張であり、加えて、ジスルフィド架橋により架橋された、あらゆるヘリックスターンである。したがって、本明細書において使用された、「タンパク質繊維を含む多量体」とは、Ｓ－Ｓ間架橋だけを介して接続された、識別可能な個別の円板様多量体（例えば、Ｅｎａ３Ａベースのタンパク質サブユニットだけを含む）からなっているタンパク質繊維を指す場合もあり、非共有結合により、繊維状ヘリックス構造へと、連続的に接続され、Ｓ－Ｓ間架橋を介して、さらに架橋された、ヘリックスターン様多量体（例えば、Ｅｎａ１／Ｅｎａ２Ａタンパク質ベースであり、かつ／又はＥｎａ１／Ｅｎａ２Ｂタンパク質ベースである）から集成されたタンパク質繊維を指す場合もある。

さらに、代替的実施形態は、本明細書において記載された、２つ以上の多量体を含む繊維として規定された、操作されたタンパク質繊維を含み、この場合、少なくとも１つの多量体は、本明細書において規定された、操作された多量体であり、かつ／又は少なくとも１つのタンパク質サブユニットは、本明細書において規定された、操作されたタンパク質サブユニットである。

別の実施形態は、組換えにより作製されたタンパク質繊維又はインビトロにおいて作製及び精製されたタンパク質繊維に関し、この場合、前記繊維は、本明細書においてさらに記載されたキメラ遺伝子の、組換え発現又はインビトロ発現により得られうる。前記インビトロにおいて作製された繊維は、本明細書において開示されたＳ型繊維であることが可能であり、Ｅｎａ１Ａタンパク質及び／若しくはＥｎａ１Ｂタンパク質並びに／又はこれらの操作された形態を含む多量体により形成されうる。前記インビトロにおいて作製された繊維は、インビボにおいて、Ｅｎａ１Ａ、Ｅｎａ１Ｂ及びＥｎａ１Ｃが、Ｓ型繊維を形成する（実施例を参照されたい）ことが、不可欠に要求されることが明らかである、バチルス属芽胞上など、自然発生ではない。具体的な実施形態は、前記タンパク質繊維の多量体が、本明細書において記載された、少なくとも１つの操作された多量体又は本明細書において記載された、操作されたタンパク質サブユニット、特に、少なくとも１つの、本明細書において記載された、操作されたＥｎａタンパク質を含む、少なくとも１つの多量体を含む点において、操作されたタンパク質繊維である、インビトロにおいて作製されたタンパク質繊維に関する。さらなる実施形態は、操作されたタンパク質繊維をもたらすが、この場合、本明細書において記載されたタンパク質繊維は、別のタンパク質へと融合される、又は化学的部分又は機能的部分など、別の部分へとコンジュゲートされる。

本発明の別の態様は、プロモーター又は調節エレメントにより制御されて発現すると、本明細書において規定された、自己アセンブルタンパク質を含有する、タンパク質のサブユニット又はプロトマーをコードする核酸分子を結果としてもたらす、核酸配列に作動可能に連結された、少なくとも１つの前記異種プロモーター又は調節エレメントを含み、前記異種プロモーター配列又は異種調節エレメント配列が、細菌由来の自己アセンブルタンパク質をコードする核酸配列としての（又はこの天然形態と異なる）、別の供給源に由来する、ＤＮＡエレメントを含む、キメラ遺伝子又はキメラ構築物をもたらす。さらなる実施形態において、前記キメラ遺伝子は、Ｅｎａ突然変異体タンパク質の場合もあり、変異体タンパク質の場合もある、本明細書において記載されたＥｎａタンパク質又はその操作されたＥｎａタンパク質、伸長Ｅｎａタンパク質（繊維形成を防止するように、立体障害を施された）又は融合タンパク質をコードする核酸分子に作動可能に連結された、異種プロモーターエレメント又は調節的発現エレメントを含む。さらに、前記キメラ構築物は、発現カセット内に存在する場合もあり、インビトロにおいてタンパク質を作製するための、クローニングベクター又は発現ベクターの一部として存在する場合もある。

「発現カセット」は、目的の遺伝子配列／コード配列の発現を方向付けることが可能な、任意の核酸構築物を含む。これは、発現カセットのプロモーターに作動可能に連結されている。発現カセットは、一般に、好ましくは（転写方向にある、５’から３’へと）、プロモーター領域、転写開始領域と作動可能に連結された、ポリヌクレオチド配列、そのホモログ、変異体又は断片及びＲＮＡポリメラーゼのための停止シグナル及びポリアデニル化シグナルを含む終結配列を含む、ＤＮＡ構築物である。これらの領域の全ては、形質転換される、原核細胞又は真核細胞などの生体細胞内における作動が可能であることが理解される。好ましくは、ＲＮＡポリメラーゼ結合性部位及びポリアデニル化シグナルを含む、転写開始領域を含むプロモーター領域は、形質転換される生体細胞に対し、天然の場合もあり、代替的供給源に由来する場合もあり、この場合、領域は、生体細胞内において、機能的である。このようなカセットは、「ベクター」へと構築されうる。

本明細書において使用された、「ベクター」、「ベクター構築物」、「発現ベクター」又は「遺伝子導入ベクター」という用語は、それが連結された、別の核酸分子を輸送することが可能な核酸分子を指すことが意図され、プラスミドベクター、コスミドベクター、ラムダファージなどのファージベクター、アデノウイルス、ＡＡＶ若しくはバキュロウイルスベクターなどのウイルスベクター又は細菌人工染色体（ＢＡＣ）、酵母人工染色体（ＹＡＣ）又はＰ１人工染色体（ＰＡＣ）などの人工染色体ベクターを含むがこれらに限定されない、任意の適切な種類を含む、当業者に公知である、任意のベクターを含む。発現ベクターは、プラスミドのほか、ウイルスベクターを含み、一般に、所望されるコード配列と、特定の宿主生物（例えば、細菌、酵母、植物、昆虫又は哺乳動物）又はインビトロ発現系における、作動可能に連結されたコード配列の発現に必要である、適切なＤＮＡ配列とを含有する。発現ベクターは、それらが導入された宿主細胞内の、自律的な複製が可能である（例えば、宿主細胞内において機能する複製起点を有するベクター）。他のベクターは、宿主細胞へと導入されると、宿主細胞のゲノムへと組み込まれ、これにより、宿主ゲノムと共に複製される。適切なベクターは、所望に応じ、かつ、特定の宿主生物（例えば、細菌細胞、酵母細胞）に従い、プロモーター配列、エンハンサー配列、ターミネーター配列などの調節配列を有する。クローニングベクターは、一般に、ある特定の、所望されたＤＮＡ断片を操作及び増幅するのに使用され、所望されたＤＮＡ断片の発現に必要とされた、機能的配列を欠く場合がある。当技術分野において、原核細胞にトランスフェクトすることにおける使用のための、発現ベクターの構築もまた周知であるので、標準的技法（当技術分野による規定及び用語について、例えば、Ｓａｍｂｒｏｏｋら、「ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ」、４版、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＰｒｅｓｓ、Ｐｌａｉｎｓｖｉｅｗ、ＮｅｗＹｏｒｋ（２０１２）；及びＡｕｓｕｂｅｌら、「ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ（増刊１１４号）」、ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ、ＮｅｗＹｏｒｋ（２０１６）を参照されたい）を介して達せられうる。

さらなる実施形態は、本明細書において記載されたキメラ遺伝子を発現させる宿主細胞に関し、これにより、おそらく、多量体のプロトマー若しくはタンパク質サブユニットを含む宿主細胞又は本明細書において記載された繊維を形成する宿主細胞を結果としてもたらす。「宿主細胞」は、原核細胞の場合もあり、真核細胞の場合もある。細胞は、一過性にトランスフェクトされる場合もあり、安定的にトランスフェクトされる場合もある。発現ベクターの、原核細胞及び真核細胞への、このようなトランスフェクションは、標準的な細菌の形質転換、リン酸カルシウム共沈降、電気穿孔又はリポソーム媒介トランスフェクション、ＤＥＡＥデキストラン媒介トランスフェクション、ポリカチオン媒介トランスフェクション若しくはウイルス媒介トランスフェクションを含むがこれらに限定されない、当技術分野において公知である、任意の技法を介して達せられうる。全ての標準的技法について、例えば、Ｓａｍｂｒｏｏｋら、「ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ」、４版、ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＰｒｅｓｓ、Ｐｌａｉｎｓｖｉｅｗ、ＮｅｗＹｏｒｋ（２０１２）；及びＡｕｓｕｂｅｌら、「ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ（増刊１１４号）」、ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ、ＮｅｗＹｏｒｋ（２０１６）を参照されたい。本文脈における、組換え宿主細胞は、本発明の、単離されたＤＮＡ分子、単離された核酸分子又は単離された発現構築物又は単離ベクターを含有する遺伝子改変された宿主細胞である。ＤＮＡは、限定せずに述べると、形質転換、リポフェクション、電気穿孔又はウイルス媒介形質導入を含む、特定の種類の細胞に適切の、当技術分野に公知である、任意の手段により導入されうる。本発明のキメラタンパク質の発現を可能とするＤＮＡ構築物は、クローニング、ハイブリダイゼーションスクリーニング及びポリメラーゼ連鎖反応（ＰＣＲ）など、当技術分野において公知の技法により、容易に調製される。クローニング、ＤＮＡの単離、増幅及び精製のための標準的技法、ＤＮＡリガーゼ、ＤＮＡポリメラーゼ、制限エンドヌクレアーゼなどを伴う、酵素反応及び多様な分離法のための標準的技法は、当業者により公知であり、当業者により一般に援用された、標準的技法である。Ｓａｍｂｒｏｏｋら（２０１２）、Ｗｕ（編）（１９９３）及びＡｕｓｕｂｅｌら（２０１６）において、多数の標準的技法が記載されている。本発明により使用されうる、代表的宿主細胞は、細菌細胞、酵母細胞、植物細胞及び動物細胞を含むがこれらに限定されない。本発明による使用に適する細菌宿主細胞は、エスケリキア属（Ｅｓｃｈｅｒｉｃｈｉａｓｐｐ．）種細胞、バチルス属種細胞、ストレプトミセス属（Ｓｔｒｅｐｔｏｍｙｃｅｓｓｐｐ．）種細胞、エルウィニア属（Ｅｒｗｉｎｉａｓｐｐ．）種細胞、クレブシエラ属（Ｋｌｅｂｓｉｅｌｌａｓｐｐ．）種細胞、セラチア属（Ｓｅｒｒａｔｉａｓｐｐ．）種細胞、シュードモナス属（Ｐｓｅｕｄｏｍｏｎａｓｓｐｐ．）種細胞及びサルモネラ属（Ｓａｌｍｏｎｅｌｌａｓｐｐ．）種細胞を含む。本発明による使用に適する動物宿主細胞は、昆虫細胞及び哺乳動物細胞（最も特定すると、チャイニーズハムスター（例えば、ＣＨＯ）及びＨｅＬａ細胞系などのヒト細胞系に由来する）を含む。本発明による使用に適する酵母宿主細胞は、サッカロミセス属（Ｓａｃｃｈａｒｏｍｙｃｅｓ）、シゾサッカロミセス属（Ｓｃｈｉｚｏｓａｃｃｈａｒｏｍｙｃｅｓ）、クルイウェロミセス属（Ｋｌｕｙｖｅｒｏｍｙｃｅｓ）、ピキア属（Ｐｉｃｈｉａ）（例えば、ピキア・パストリス（Ｐｉｃｈｉａｐａｓｔｏｒｉｓ））、ハンセヌラ属（Ｈａｎｓｅｎｕｌａ）（例えば、ハンセヌラ・ポリモルファ（Ｈａｎｓｅｎｕｌａｐｏｌｙｍｏｒｐｈａ））、ヤロウィア属（Ｙａｒｏｗｉａ）、シュワンニオミセス属（Ｓｃｈｗａｎｉｏｍｙｃｅｓ）、シゾサッカロミセス属（Ｓｃｈｉｚｏｓａｃｃｈａｒｏｍｙｃｅｓ）、ジゴサッカロミセス属（Ｚｙｇｏｓａｃｃｈａｒｏｍｙｃｅｓ）などの中の種を含む。サッカロミセス・セレウィシエ（Ｓａｃｃｈａｒｏｍｙｃｅｓｃｅｒｅｖｉｓｉａｅ）、Ｓ．カールスバーゲンシス（Ｓ．ｃａｒｌｓｂｅｒｇｅｎｓｉｓ）及びＫ．ラクティス（Ｋ．ｌａｃｔｉｓ）が、最も一般に使用された酵母宿主であり、簡便な真菌宿主である。宿主細胞は、懸濁液、フラスコ培養物、組織培養物、臓器培養物などにおいて用意されうる。代替的に、宿主細胞はまた、トランスジェニック動物でもありうる。

具体的な実施形態は、バチルス属種の芽胞形成時に、インビボにおける、操作されたＥｎａ多量体及び操作されたＥｎａ繊維への自己アセンブルのための、（操作された）Ｅｎａタンパク質を伴う、改変された芽胞を形成するように、遺伝子が発現されるように、Ｅｎａタンパク質又は本明細書において規定された、操作されたＥｎａタンパク質をコードするキメラ遺伝子を含む、前記バチルス属種細胞に関する。したがって、具体的な実施形態は、Ｅｎａタンパク質又は操作されたＥｎａタンパク質を含む、組換えタンパク質繊維を含む、又はこれを提示する、バチルス属芽胞又は芽胞に関する。前記芽胞上の、前記操作された繊維は、ある特定の環境又は文脈において、芽胞を適用するために有利でありうる。

別の実施形態は、このような改変された芽胞を作製する方法であって、芽胞形成細菌細胞内において、本明細書において記載されたキメラ遺伝子を組換え発現させるステップ及び芽胞形成を誘導するための条件下においてインキュベートするステップを含む方法に関する。

本発明の別の態様は、改変された表面又は固体支持体に関する。これは、本発明の（操作された）多量体又は（操作された）タンパク質繊維を含有する。特に、本明細書において規定された、Ｅｎａ自己アセンブルタンパク質サブユニットが、固体表面へと共有結合的に連結された、改変された表面が開示される。特定の実施形態は、少なくとも１つのＥｎａタンパク質サブユニット又は操作されたＥｎａタンパク質が、固体支持体へと共有結合的に連結された前記改変された表面に関する。このような改変された表面は、本明細書において記載された多量体及び繊維をさらに形成する、エピタキシャル成長を可能とする核生成表面であって、前記タンパク質サブユニット及び表面へと連結され、少なくとも１つのＥｎａタンパク質サブユニットを含む前記改変された表面が、Ｅｎａタンパク質をさらに含む溶液へと曝露されると、これにより、互いと共に、多量体へと自己アセンブルし、共有結合的ジスルフィド架橋が形成されると、前記表面から成長する、タンパク質繊維を形成する、核生成表面として使用されうる。

表面の固定化は、当業者により公知の手段を使用することによる、前記表面上における、少なくとも１つの（操作された）Ｅｎａタンパク質サブユニットの共有結合的結合として想定されうる。このような手段は、当技術分野において公知の、クリック化学反応、例えば、ＮＨＳ化学反応を介する、遊離アミンへの架橋（リシンを介する、Ｎ末端における架橋）、ジスルフィド架橋、チオールベースの架橋、タグ（例えば、スナップ又はソルターゼタグ）の付加、表面への、タンパク質の共有結合的接合を可能とする、Ｅｎａタンパク質のＮ末端又はＣ末端における融合を含むがこれらに限定されない。具体的な実施形態において、単量体Ｅｎａサブユニットが、表面へとカップリングされる条件は、変性緩衝液条件に関すると想定される。

タンパク質繊維又は操作されたタンパク質繊維はまた、宿主の細胞又は微生物表面上に融合又は接合される場合もあり、繊維又は操作された繊維を含む、改変された表面を得るように、Ｅｎａタンパク質を含有する溶液へと曝露される、外来表面上へと核化される場合もある。

したがって、本明細書において、前記表面の固定化は、生体表面上において達せられる場合もあり、合成表面において達せられる場合もある。生体表面は、細胞、細菌、（芽胞）芽胞の表面又は他の自然発生の表面若しくは組換えにより作製された表面を含む。組換えタンパク質の、高密度における表面発現は、医薬、ファインケミカル、生物変換、廃棄物処理及び農薬作製の分野における、生物工学的適用の、いくつかの領域において、細胞表面提示の使用の成功のための必須条件である。

人工表面又は合成表面は、例えば、ビーズ、スライド、チップ、プレート又はカラムを含みうる。より詳細には、人工表面は、微粒子（例えば、ビーズ又は顆粒）の場合もあり、平板の場合もあり、プリーツ型の場合もあり、中空糸の場合もあり、チューブの場合もある、シート形態（例えば、膜又はフィルター、ガラス製又はプラスチック製のスライド、マイクロ滴定アッセイプレート、ディップスティック、キャピラリーデバイス）の場合もある。生物工学的適用の範囲は、本明細書において記載された、多量体組成物又は繊維などのタンパク質アセンブリーによる、合成表面のコーティング又は活性化を使用する。

したがって、本発明はまた、生体材料の生物医学分野又は生物工学分野において、ある特定の目標を完遂するように、Ｅｎａタンパク質又はその誘導体の作製を、合成表面への、多量体アセンブリー及び／又は繊維アセンブリーの形成をもたらす自己アセンブル特性でカップリングさせ、これらを、さらに特異的な、捕捉手段又は提示手段及び捕捉分子又は提示分子のためのコンフォメーションにおいて、前記表面上に提示する、システム又はインビトロの方法ももたらす。

本発明は、さらに、微粒子の文脈において、タンパク質サブユニット、多量体若しくは繊維又はこれらの任意の操作された形態を作出することにより得られた、直接適用可能な産物に関する。本発明に従う、自己アセンブルタンパク質サブユニットは、実際に、多量体アセンブリーのほか、点突然変異を介して、異なる機能について微調整されうる、長型であり、弾力性であり、可撓性であるナノ繊維、ペプチド又はタンパク質融合体及びコンジュゲートへと、たやすく自己アセンブルすることを可能とする。過酷な条件下においてもなお、剛性及び安定性が大きいが、可撓性も極めて大きな、前記操作されたナノ繊維は、次世代生体材料をもたらす。一実施形態において、このような生体材料は、本明細書において記載された、操作されたタンパク質繊維及び／又は本明細書において記載されたタンパク質繊維を含む、タンパク質薄膜の形態において存在する。実施例節（及び、例えば、図８Ｆ及び１２）において提示される、「薄い」とは、バチルス属上において観察されたＥｎａ付属物の、少なくとも直径サイズと同等である、繊維のサイズであって、いくつかの層が、この直径サイズ（約８ｎｍ）の倍数を有するので、ナノメートルの範囲にあるサイズにより規定された、限定数の層だけが可能であることを意味する。実のところ、このような薄膜は、繊維により形成された、稠密であり、かつ、保護された環境をもたらす。例えば、本明細書において観察された、洗浄剤、化学物質、熱、ＵＶ及び他の過酷な条件に対する抵抗性の増大は、このような薄膜が、膜の反対側にある分子を保護することを可能とする。

別の実施形態は、本発明の操作されたタンパク質繊維を含み、任意選択的に、本明細書において記載されたタンパク質繊維を含むハイドロゲルに関する。別の実施形態において、本明細書において記載された、操作された多量体又は本明細書において記載された、操作されたタンパク質サブユニットを含む多量体を含む、ハイドロゲルが開示される。ハイドロゲルは、顕著に異なる三次元構造を維持する、膨潤性ポリマー材料として公知である。ハイドロゲルは、人体における使用のためにデザインされた、最初の生体材料であった。ハイドロゲルデザインにおける、新規の手法は、この、治療剤、センサー、マイクロ流体システム、ナノリアクター及び相互作用性表面において適用される、生体材料についての調査研究の分野を再活性化させている。ハイドロゲルは、疎水性相互作用、静電相互作用又は他の種類の分子間相互作用により自己アセンブルしうる。自然において見出された、認識モチーフを使用する、ハイドロゲル形成ポリマーのデザインは、正確に規定された三次元構造の形成に対する、潜在的可能性を増強する。本発明の（操作された）多量体又は（操作された）タンパク質繊維はまた、そのための方法が当業者に公知である、ハイドロゲルを形成するための、十分に構造化された、三次元構成単位も提示する。明らかにされた、本発明の構造の多用途性は、とりわけ、一次構造を改変すること、すなわち、ハイドロゲル生体材料の、新たなクラスのデザインの成功のために、本発明の、操作されたタンパク質サブユニット、多量体又は繊維を使用することにより、その安定性及び特異性を操る機会をもたらす。さらに、本明細書においてまた、ハイブリッドハイドロゲルも、想定され、通例、少なくとも２つの、顕著に異なる分子のクラス、例えば、共有結合的に、又は非共有結合的に相互接続された、合成ポリマー及び生物学的巨大分子に由来する構成要素を保有するハイドロゲルシステムと称される。合成ポリマーと比較して、タンパク質及びタンパク質モジュールは、十分に規定され、かつ、均一である構造、一貫した力学的特性及び協調的なフォールディング／アンフォールディング間遷移を有する。前記ハイブリッドハイドロゲル内において使用された、本発明のタンパク質繊維又はタンパク質多量体は、構造形成に対して、ナノメートルレベルにおける制御レベルを付与することが可能であり、合成部分は、ある特定の生物医学的適用における、ハイブリッド材料の生体適合性に寄与しうる。アミノ酸配列を最適化すること、すなわち、操作されたＥｎａタンパク質を適用することにより、特異的な適用のためになされる、応答性ハイブリッドハイドロゲルの微調整がデザインされうる。異なる種類のハイドロゲルの、潜在的な適用は、組織工学、合成細胞外マトリックス、植込み式デバイス、バイオセンサー、分離システム、酵素による材料制御活性、リン脂質二重層の脱安定化剤、可逆性細胞接合を制御する材料、三次元空間内に、反応性基が正確に配置された、ナノリアクター、応答性ハイドロゲルを伴う、高性能マイクロ流体素子及びエネルギー転換システムを含む。

本発明の最後の態様は、自己アセンブルタンパク質サブユニット、多量体、インビトロ作製型タンパク質繊維若しくはインビボ／インセルロ作製型タンパク質繊維を作製するための方法又は「停止」Ｅｎａタンパク質、Ｅｎａタンパク質の操作された形態、多量体及び繊維をさらに作製する方法並びに本発明の改変された表面を作製する方法に関する。前記タンパク質サブユニット単量体又は自己アセンブルした多量体を作製する方法は、
ａ）本発明のタンパク質サブユニット又は多量体が細胞質内に存在する細胞を得るための、細胞内における、異種Ｎ末端タグ又は異種Ｃ末端タグを含む操作されたＥｎａタンパク質を任意選択的にコードする、本明細書において記載されたキメラ遺伝子の組換え発現ステップ、及び任意選択的に、
ｂ）例えば、細胞の溶解及び分離により、前記タンパク質又は多量体を、前記改変された細胞から精製又は単離するステップ
を含む、組換え工程又はインビトロ工程である。

一実施形態は、前記細胞内において発現されたキメラ遺伝子のタンパク質サブユニットが、操作されたタンパク質サブユニット又は操作されたＥｎａタンパク質の場合もあり、１つ以上の野生型Ｅｎａタンパク質及び／又は本発明の操作されたタンパク質サブユニットの異なる形態の発現をもたらす、１つを超えるキメラ構築物の場合もある前記方法に関する。

別の実施形態は、ステップｂ）における精製が、封入体の単離及び可溶化、可溶化されたタンパク質サブユニットのリフォールディング並びにリフォールディングしたタンパク質多量体の精製のステップを含む方法に関する。例えば、アフィニティークロマトグラフィー、イオン交換クロマトグラフィー、ゲル濾過又はさらなる代替法を使用する、さらなる精製法が、当業者に公知である。

別の実施形態において、細胞内において組換えにより発現させる前記方法において使用されるキメラ遺伝子によりコードされた、本明細書において記載されたタンパク質サブユニット、特に、（操作された）Ｅｎａタンパク質サブユニットは、異種Ｎ末端タグ又は異種Ｃ末端タグを含む。前記Ｎ末端タグ又はＣ末端タグは、多量体へと自己アセンブルすることがやはり可能であるが、非天然の立体障害である、Ｎ末端タグ又はＣ末端タグの存在のために、これらのタンパク質サブユニット又は多量体の、さらなる繊維形成又は「成長」を停止させる、タンパク質サブユニットの作製を結果としてもたらしうる。最も好ましい前記異種Ｎ末端タグ又は異種Ｃ末端タグは、繊維形成の停止若しくは阻止又はエピタキシャル成長の遮断若しくは遅延を結果としてもたらすように、少なくとも１～５、６、７、９アミノ酸又は少なくとも１５アミノ酸である。前記異種Ｎ末端タグ又は異種Ｃ末端タグは、本明細書において記載された、アフィニティータグでありうる。

別の実施形態は、宿主細胞内においてタンパク質繊維を組換えにより作製する方法であって、
ａ）キメラ遺伝子を、細胞内において、又は本明細書において記載された、Ｅｎａタンパク質サブユニット又は多量体を含む宿主細胞を使用して発現させるステップ及び
ｂ）任意選択的に、細胞の溶解により、自己アセンブルされたタンパク質繊維を単離するステップ
を含み、
前記自己アセンブルタンパク質サブユニット又はＥｎａタンパク質をコードする核酸が、異種Ｎ末端タグ又は異種Ｃ末端タグをもたらさない
方法に関する。タグ非含有Ｅｎａタンパク質又は非立体障害Ｅｎａタンパク質を組換え発現させることにより、細胞質内における、繊維への自発的自己アセンブリーは、インビボにおいて、Ｓ型様繊維を容易に作製することを可能とする。

さらなる実施形態は、タンパク質繊維又は本発明に従う、操作されたタンパク質繊維を作製するためのインビトロの方法であって、
ａ）細胞内における、本明細書において記載されたキメラ遺伝子の発現ステップであって、本発明のタンパク質サブユニット又は多量体が存在する細胞を得、前記タンパク質サブユニットが、切断可能な異種Ｎ末端タグ又は異種Ｃ末端タグを含むステップ、
ｂ）前記タンパク質又は多量体を、前記細胞から精製するステップ、
ｃ）Ｎ末端タグ又はＣ末端タグを切断して、繊維を形成するように、互いと、共有結合的に接続するための多量体を結果としてもたらすステップ
を含む方法に関する。

代替的に、前記タンパク質繊維は、ステップｂ）と、ステップｃ）とが反転された前記方法により作製される。切断可能なタグは、例えば、タンパク質分解性切断部位を伴うタグ又は当業者により公知の切断可能なタグである。

別の実施形態は、本明細書において開示された改変された表面を作製する方法であって、繊維、多量体又はこれらの操作された形態を作製及び精製するための方法ステップに続き、タンパク質、多量体又は繊維を、生体表面の場合もあり、人工表面の場合もある表面へと、共有結合的に接合させる、さらなるステップを含む方法をさらにもたらす。

最後に、本明細書において、既に触れられた通り、生物医学領域及び生物工学領域など、異なる分野における、次世代生体材料としての、前記Ｅｎａタンパク質又は操作されたＥｎａタンパク質サブユニット由来のアセンブリーについては、多数の適用がなされている。したがって、前記ナノ材料の使用及び有用性は、無尽蔵である。

本開示に従う方法及び生成物について、特定の実施形態、具体的構成並びに材料及び／又は分子が本明細書において論じられてきたが、本発明の範囲から逸脱しない限りにおいて、形態及び詳細の、多様な変化又は改変がなされうることが理解されるものとする。以下の実施例は、特定の実施形態を、より良く例示するために提示されるものであり、本出願を限定するものとは考えられないものとする。本出願は、特許請求の範囲だけにより限定される。

［実施例１］バチルス・セレウスＮＶＨ００７５／９５株は、２つの形状型を有する芽胞付属物を示す
バチルス属種及びクロストリジウム属種により形成された芽胞は、高頻度において、表面接合型の、羽毛様、リボン様又は線毛様付属物を保有する（Ｄｒｉｋｓ、２００７）が、これらの役割は、それらのアセンブリーに関与する経路についての分子アノテーションの欠如のために、大部分、謎のまま残っている。それらについての最初の観察（Ｈａｃｈｉｓｕｋａ及びＫｕｎｏ、１９７６；Ｈｏｄｇｉｋｉｓｓ、１９７１）の半世紀後において、本発明者らは、本明細書において、ｃｒｙｏＥＭによる、高分解能のデノボ構造決定を援用して、Ｂ．セレウス芽胞上において見出された付属物を、構造的に、かつ、遺伝子的に特徴付ける。

Ｂ．セレウスＮＶＨ００７５／９５株についての、陰性染色ＥＭイメージングは、直径を、約１μｍとし、外膜層により、緊密に包み込まれた、稠密なコアを伴い、ＴＥＭ画像上において、芽胞体から、２～３μｍの長さの嚢状の平板構造として発生し、典型的な芽胞を示した（図１Ａ）。芽胞は、夥多な、マイクロメートル単位の長さの付属物（Ｅｎａ）を示した（図１Ａ）。平均像の芽胞は、２００ｎｍ～６μｍの長さの範囲のＥｎａを、２０～３０数え（図１Ｅ）、中央値の長さは、約６００ｎｍであった。Ｅｎａの密度は、外膜の近傍にある、芽胞体の極において、最高度であった。ここにおいて、Ｅｎａは、外膜から、芽胞表面の上方、数十ナノメートルを隔てて、個別の繊維又は個別の繊維のバンドルとして出現するように見えた（図１Ｂ及び７Ｂ）。精査は、Ｅｎａが、２つの顕著に異なる形状を示すことを明らかにした（図１Ｃ、１Ｄ）。主要形状又は「スタッガリング型」（Ｓ型）形状は、観察された繊維のうちの、約９０％を表す。陰性染色による二次元クラス像において、Ｓ型Ｅｎａは、幅が約１１０Åであり、極における、スタッガリング型の出現をもたらすが、縮尺を変更した下方に、芽胞表面を指し示す。遠位末端において、Ｓ型Ｅｎａは、長さを、５０～１００ｎｍとし、厚さを、約３５Åとする、複数のフィラメント状伸長部又は「ラッフル膜」において終結する（図１Ｃ）。Ｅｎａの副次形状又は「ラダー様」（Ｌ型）形状は、薄型であり、幅が約８０Åであり、単一のフィラメント状伸長部において終結し、寸法は、Ｓ型繊維において見られたラッフル膜と同様である（図１Ｄ）。Ｌ型Ｅｎａは、Ｓ型Ｅｎａの、うろこ状の、互い違いの出現を欠く代わりに、円板様ユニットの積み重ねによる、高さ約４０Åのラダーを示す。Ｓ型Ｅｎａが、外膜を横切り、芽胞体へとつながることが見られうるのに対し、Ｌ型Ｅｎａは、外膜から出現するように見える（図７Ａ）。いずれのＥｎａ形状も、個々の芽胞上に共存在する（図７Ｃ）。いずれのＥｎａ形状も、グラム陽性菌においてかつて観察された（Ｍａｎｄｌｉｋら、２００８；Ｍｅｌｖｉｌｌｅ及びＣｒａｉｇ、２０１３）、ソルターゼ媒介型線毛又はＩＶ型線毛を想起させない。それらの組成を同定しようとする試みにおいて、せん断力により抽出及び精製されたＥｎａを、質量分析による同定のために、トリプシン消化にかけた。しかし、Ｓ型Ｅｎａ及びＬ型Ｅｎａの両方に対する、良好なエンリッチメントにもかかわらず、大部分が、夾雑母細胞タンパク質である、ＥＡ１Ｓ層タンパク質及び芽胞コートタンパク質を含有する、トリプシン消化により得られたペプチドの中から、Ｅｎａの明確な候補物質は同定されなかった。強力な還元条件（２００ｍＭ以下のβ－メルカプトエタノール）、熱処理（１００℃）、限定的酸性加水分解（１ＭのＨＣｌにより、１時間にわたる）又は８Ｍの尿素若しくは６Ｍの塩化グアニジウムなどのカオトロープを伴うインキュベーションを含む、ＳＤＳ－ＰＡＧＥにより、Ｅｎａ単量体を解像しようとする試みは、成功しなかった。Ｅｎａ繊維はまた、オートクレーブ処理時、乾燥処理時又はプロテイナーゼＫによる処理時においても、それらの構造的特性を保持した（図７Ｃ）。

本発明者らは、Ｂ．セレウスのＥｎａが、２つの主要形状：１）数マイクロメートルの長さであり、芽胞体から出現し、外膜を横切る、スタッガリング型Ｅｎａ又はＳ型Ｅｎａ及び２）小型であり、少数であり、外膜表面から直接出現するように見える、ラダー型Ｅｎａ又はＬ型Ｅｎａを取ることを見出した。

［実施例２］芽胞付属物についてのｃｒｙｏ－ＥＭは、それらの分子識別を同定する
Ｅｎａの性質について、さらに実験するために、Ｂ．セレウスＮＶＨ００７５／９５株芽胞から精製された繊維を、低温電子顕微鏡法（ｃｒｙｏ－ＥＭ）によりイメージングし、三次元再構築を使用して解析した。単離された繊維は、Ｓ型Ｅｎａと、Ｌ型Ｅｎａとの、９．４：１の比を示したが、これは、芽胞上において見られた繊維についての比と同様であった。寸法を、３００×３００ピクセル（２４６×２４６Å^２）とする枠を、繊維の全長に沿って抽出し、枠間の重複を、２１Åとして、ＲＥＬＩＯＮ３．０を使用する、二次元クラス分けにかけた（Ｚｉｖａｎｏｖら、２０１８）。二次元クラス平均像についてのパワースペクトルが、Ｓ型Ｅｎａについて、十分に秩序化されたヘリックス対称性を明らかにした（図２Ａ、２Ｂ）のに対し、Ｌ型Ｅｎａは、並進対称性を主に示した（図１Ｄ）。約５４．５Åのヘリックス半径に基づき、本発明者らは、Ｓ型Ｅｎａについてのパワースペクトル内の層線である、Ｚ’及びＺ’’が、それぞれ、－１１及び１のベッセル次数を有すると推定した（図２Ａ、２Ｂ）。抽出された枠の大部分を保持する二次元クラスにおいて、ベッセル次数を１とする層線は、赤道から、０．０２６７３Å^－１の距離において見出され、３７．４Åのピッチに対応し、陰性染色によってもまた見られた、見かけの「ローブ」の間隔と良好に一致した（図１Ｃ、２Ｂ及び７）。適正なヘリックスパラメータは、ＲＥＬＩＯＮ３．０を使用する、三次元再構築及び実空間におけるベイズ精緻化のために、サブユニットのライズ及びツイストについての、一連の系統的出発値を使用する、経験法により導出した（Ｈｅ及びＳｃｈｅｒｅｓ、２０１７）。フーリエ－ベッセル指数化による推定に基づき、被験出発値間のサンプリング分解能を、０．１Å及び１度として、インプットのライズ及びツイストを、それぞれ、３．０５～３．６５Å及び２９～３５度の範囲において変動させた。この手法は、ヘリックスパラメータの固有のセットに収束する結果として、サブユニット側鎖について、明確な二次構造及び識別可能な密度を伴う、三次元マップをもたらした（図２Ｃ）。再構成されたマップは、サブユニット１つ当たりのライズ及びツイストを、３．２２９３７Å及び３１．０３３８度とする、左巻き１出発点型ヘリックスに対応し、ターン１回転当たり、１１．６のユニットを伴うヘリックスに対応する（図２Ｄ）。ＲＥＬＩＯＮ３．０における、精緻化及びポストプロセシングの後、マップは、ＦＳＣ_{０．１４３}基準に従い、３．２Åの分解能であることが見出された。結果として得られるマップは、約１００残基の、８本のβ鎖によるβサンドウィッチドメインを含む、十分に規定されたサブユニットを示した（図２Ｅ）。側鎖密度は、配列をＦ－Ｃ－Ｍ－Ｖ／Ｔ－Ｉ－Ｒ－Ｙとする短モチーフを、手作業により推定するのに十分な品質であった（図８Ａ）。Ｂ．セレウスＮＶＨ００７５／９５株のプロテオームについての検索は、ＫＭＰ９１６９７．１（配列番号１）及びＫＭＰ９１６９８．１（配列番号８）によりコードされた、２つの、機能が未知である、仮説的タンパク質を同定した（図８Ｂ）。Ｅｎａサブユニットについての、電位マップのさらなる精査及び手作業によるモデル構築は、これが、ＫＭＰ９１６９７．１遺伝子座の１５ｂｐ下流に配置された、ＫＭＰ９１６９８．１によりコードされた配列と、十分に適合することを示した。いずれの遺伝子も、同様のサイズ（ＫＭＰ９１６９８．１及びＫＭＰ９１６９７．１について、それぞれ、１１７及び１２６アミノ酸であり、推定分子量を、１２及び１４ｋＤａとする）の仮説的タンパク質をコードし、３９％の対応のあるアミノ酸配列同一性、機能が未知である共有されたドメイン（ＤＵＦ）３９９２及び同様のＣｙｓパターンを有している。マイナス鎖上の、ＫＭＰ９１６９８．１の、さらに下流において、ＫＭＰ９１６９９．１遺伝子座（配列番号１５）は、１６０アミノ酸であり、推定分子量を１７ｋＤａとする、仮説的タンパク質を含有する、第３のＤＵＦ３９９２をコードする。このように、ＫＭＰ９１６９７．１、ＫＭＰ９１６９８．１及びＫＭＰ９１６９９．１は、本明細書の下記において、Ｅｎａ１Ａ、Ｅｎａ１Ｂ及びＥｎａ１Ｃと称された、候補Ｅｎａサブユニットをコードすると考えられる（図８Ｂ、８Ｃ）。

［実施例３］インビトロにおいて、Ｅｎａ１Ｂは、芽胞付属物様ナノ繊維へと自己アセンブルする
Ｂ．セレウスＮＶＨ００７５／９５株から単離された芽胞付属物のサブユニット同一性を確認するために、本発明者らは、Ｅｎａ１Ｂ及びＮ末端ＴＥＶプロテアーゼ切断可能６×Ｈｉｓタグのコード配列に対応する合成遺伝子断片を、Ｅ．コリの細胞質内の組換え発現（配列番号８３において示されたｒｅｃＥｎａ１Ｂ）のためのベクターへとクローニングした。組換えタンパク質は、アフィニティー精製の前に、８Ｍの尿素中において可溶化される封入体を形成することが見出された。急速な希釈による、カオトロピック剤の除去が、単離されたＳ型Ｅｎａ内において見られた部分的ヘリックスターンを想起させる、夥多な可溶性三日月形オリゴマーの形成を結果としてもたらした（図８Ａ～８Ｅ）ことは、リフォールディングした組換えＥｎａ１Ｂ（ｒｅｃＥｎａ１Ｂ）が、天然のサブユニット－サブユニット間β拡張による接触部を採用することを示唆する（図８Ｅ）。本発明者らは、ｒｅｃＥｎａ１Ｂが、サブユニットのＮｔｃにおける、６×Ｈｉｓタグによる立体障害のために、単一ターンの水準において停止された、ヘリックス型付属物へと自己アセンブルすると推論した。実際、タンパク質分解による、アフィニティータグの除去は、たやすく、直径を１１０Åとし、ヘリックスパラメータを、Ｓ型Ｅｎａと同様とする、繊維の形成を結果としてもたらしたが、エクスビボの繊維において見られた、遠位ラッフル膜を欠いた（図８Ｆ）。ｃｒｙｏＥＭによるデータの収集及び三次元ヘリックス再構築を実施して、インビトロにおけるｒｅｃＥｎａ１Ｂナノ繊維が、エクスビボにおけるＳ型Ｅｎａと同型であるのかどうかについて評価した。ＲＥＬＩＯＮ３．０を使用する、実空間におけるヘリックスパラメータの精緻化は、それぞれ、３．４３７２１Å及び３２．３５０４度である、サブユニットのライズ及びツイストに収束し、エクスビボにおけるＳ型Ｅｎａにおいて見出されたものより、約０．２Å及び１．３度大きく、ターン１回転当たりのピッチを３８．３Åとし、１１．１のサブユニットを伴う左巻きヘリックスに対応した。ヘリックスパラメータの微細な差違を別にすれば、インビトロにおけるＥｎａ１Ｂ繊維（推定分解能を３．２Åとする；図９Ａ、９Ｂ）についての三次元再構築マップは、繊維サブユニットのサイズ及び接続性に関して、エクスビボにおけるＳ型Ｅｎａと、ほぼ同型であった（図９Ｄ）。ｒｅｃＥｎａ１Ｂ及びエクスビボにおけるＳ型Ｅｎａについての三次元ｃｒｙｏＥＭマップの精査は、前者におけるＥｎａ１Ｂ残基についての側鎖適合の改善を示し（図９Ｂ、９Ｃ、９Ｄ）、エクスビボＥｎａマップ内において、特に、ループである、Ｌ１、Ｌ３、Ｌ５及びＬ７におけるＥｎａ１Ａの、部分的側鎖特徴を示す領域を明らかにした（図８Ｂ、９Ｂ、９Ｃ）。エクスビボマップのＥｎａ１Ｂ特徴が優勢であるが、これは、エクスビボにおけるＳ型Ｅｎａが、Ｅｎａ１Ａ繊維と、Ｅｎａ１Ｂ繊維との混合集団からなること又はＳ型Ｅｎａが、Ｅｎａ１Ａ及びＥｎａ１Ｂの両方を含む混合組成を有することを示唆した。ｒｅｃＥｎａ１Ａ又はｒｅｃＥｎａ１Ｂにより得られた血清を使用する免疫金標識化は、単一のＥｎａ内における、サブユニット特異的標識化を示し、これらが、Ｅｎａ１Ａと、Ｅｎａ１Ｂとの混合組成を有することを確認した（図９Ｅ）。Ｅｎａ１Ｃ血清による、Ｓ型Ｅｎａの染色は、見られなかった（図９Ｅ）。Ｅｎａ１Ａ及びＥｎａ１Ｂについての、系統的パターン化又はモル比が、１つを超えるサブユニットを含有する、非対称的ユニットによる、免疫金標識化又はヘリックス再構築から区別できなかったことは、繊維内の、Ｅｎａ１Ａ及びＥｎａ１Ｂの分布が、ランダムであることを示唆する。Ｅｎａ１Ａの特徴と、Ｅｎａ１Ｂの特徴とが混合された、多数の側鎖の密度を別にすれば、エクスビボにおけるＥｎａについての、ｃｒｙｏＥＭ電位マップが、固有の主鎖コンフォメーションを示すことから、Ｅｎａ１Ａと、Ｅｎａ１Ｂとが、ほぼ同型のフォールドを有することを指し示した。

［実施例４］インビトロにおいて、Ｅｎａ１Ｃは、７量体の多量体へと自己アセンブルする
Ｅｎａ１Ｃ（ＷＰ＿０００８０２３２１）の野生型配列を、Ｅ．コリ内の発現についてコドン最適化し、ＴｗｉｓｔＢｉｏｓｃｉｅｎｃｅ製の合成遺伝子として注文し、ｐＥＴ２８ａベクター内に、さらにサブクローニングした（ＮｃｏＩ－ＸｈｏＩ）。Ｎ末端６×ヒスチジンタグに続き、ＴＥＶ切断部位（配列番号８９：ＥＮＬＹＦＱＧ）を有するように、インサートをデザインした。大スケールの組換え発現を、ファージ抵抗性である、ＮＥＢ製のＴ７ＥｘｐｒｅｓｓｌｙｓＹ／ＩｑＥ．ｃｏｌｉｓｔｒａｉｎ内において実行した。得られたプラスミド（ｐＥＴ２８ａ＿Ｅｎａ１Ａ；ｐＥＴ２８ａ＿Ｅｎａ１Ｂ）を使用して、Ｃ４３（ＤＥ３）株のコンピテント細胞を形質転換した。単一のコロニーを使用して、一晩にわたる（ＯＮ）、ＬＢによる培養を開始した。１０ｍｌの一晩培養物を使用して、３７Ｃにおける、１ｌのＬＢ、２５ｍｇ／ｍｌのカナマイシンに接種した。組換え発現は、ＯＤ_６００を、０．８として、１ｍＭのＩＰＴＧを添加することにより誘導し、培養物を放置し、一晩にわたりインキュベートした。４０００ｇにおいて、１５分間にわたる遠心分離により、細胞をペレット化させた。全細胞ペレットを、変性溶解緩衝液（２０ｍＭのリン酸カリウム、５００ｍＭのＮａＣｌ、１０ｍＭのβ－ＭＥ、２０ｍＭのイミダゾール、８Ｍの尿素、ｐＨ７．５）中に再懸濁させ、氷上において、超音波処理した。Ｂｅｃｋｍａｎｃｏｕｌｔｅｒ製のＪＡ－２０型ローター内における、２０，０００ｒｐｍで４５分間にわたる遠心分離により、可溶性画分と、不溶性画分とを分離するように、溶解物を遠心分離した。清明化した溶解物を、ＮｉＳｅｐｈａｒｏｓｅを充填された、５ｍｌのＨｉｓＴｒａｐＨＰカラムへとロードし、変性溶解緩衝液により平衡化させた。室温において、ＡＫＴＡ精製装置を使用して、勾配モード（２０～２５０ｍＭのイミダゾール）において、結合されたタンパク質を、溶出緩衝液（２０ｍＭのリン酸カリウム、ｐＨ７．５、８Ｍ尿素、２５０ｍＭのイミダゾール）により溶出させた。結果として得られた画分を、ＳＤＳ－ＰＡＧＥにより解析して、純度について点検した。２０ｍＭのリン酸カリウム、１０ｍＭのβ－ＭＥ、ｐＨ７．５に対する透析（一晩にわたり、１リットルに対して１００μｌとし、カットオフを３ｋＤａとする）により、Ｅｎａ１Ｃを含有する画分を、プールし、リフォールディングさせた。リフォールディングさせた材料のうちの、アリコート分割された５μｌを、フォルムバール／カーボングリッド（Ｃｕ製４００メッシュ；ＥｌｅｃｔｒｏｎＭｉｃｒｏｓｃｏｐｙＳｃｉｅｎｃｅｓ）上に沈着させ、２％（ｗ／ｖ）の酢酸ウラニルを使用して染色した。

図１４Ｂ（ｉ）に示された通り、Ｅｎａ１Ｃの組換え発現だけにより、９つのサブユニットによる円板又はリングが形成された。これらの円板において、βシートの拡張を介する、サブユニットの、水平方向の相互作用は、９枚羽根のβプロペラをもたらすことが見られうる。

［実施例５］Ｅｎａは、グラム陽性菌線毛の、新規のファミリーを表す
天然Ｓ型Ｅｎａが、Ｅｎａ１Ａと、Ｅｎａ１Ｂとの混合組成を示すことを認識すると、本発明者らは、モデル構築のために、ｒｅｃＥｎａ１Ｂの、三次元ｃｒｙｏＥＭによる再構築に、引き続き携わった。Ｅｎａサブユニットは、鎖である、ＢＩＤＧ及びＣＨＥＦからなる、２つの並置されたβシートから構成された、典型的なゼリーロール状フォールド（Ｒｉｃｈａｒｄｓｏｎ、１９８１）からなる（図２Ｅ）。ゼリーロール状ドメインに、本明細書の下記において、Ｎ末端接続部（「Ｎｔｃ」）と称された、１５残基の可撓性Ｎ末端伸長部が前置される。サブユニットは、スタッガリング型のβシートの拡張を介して、隣り合って整列する（Ｒｅｍａｕｔ及びＷａｋｓｍａｎ、２００６）が、この場合、サブユニットｉの鎖ＢＩＤＧは、先行サブユニットであるｉ－１の鎖ＣＨＥＦにより拡張され、サブユニットｉの鎖ＣＨＥＦは、連続する、次のサブユニットである、ｉ＋１の鎖ＢＩＤＧにより拡張される（図２Ｅ、図１０Ａ、１０Ｂ）。このように、芽胞付属物内の充填は、ヘリックスターン１回転当たりの羽根を１１．６枚とし、サブユニット１つ当たりの軸方向のライズを、３．２Åとする、８本のβ鎖のβシートによる、傾斜したβプロペラと考えられうる（図２Ｅ）。βプロペラ内のサブユニット－サブユニット間の接触は、Ｅｎａサブユニット上における、２つの相補性静電パッチにより、さらに安定化される（図１０Ｃ）。これらの水平方向の接触に加えて、ヘリックスターンを隔てたサブユニットはまた、Ｎｔｃを介しても接続され、この場合、各サブユニットｉのＮｔｃは、先行ヘリックスターン内のサブユニットである、ｉ－９及びｉ－１０と、ジスルフィド結合により接触する（図２Ｅ、図１０Ｂ）。これらの接触は、サブユニットｉ内の、Ｃｙｓ１０及びＣｙｓ１１の、それぞれ、サブユニットであるｉ－９及びｉ－１０の鎖であるＩ及びＢの、Ｃｙｓ１０９及びＣｙｓ２４とのジスルフィド結合を介してなされる（図２Ｅ、１０Ｂ）。こうして、Ｎｔｃを介するジスルフィド結合は、ヘリックスターンの架橋による、長手方向の繊維の安定化のほか、さらに、隣接するサブユニットの共有結合的架橋による、βプロペラ内の、水平方向の安定化を結果としてもたらす。Ｎｔｃ接触部は、ヘリックスの管腔側にあり、直径約１．２ｎｍの中空を残す（図１０Ｄ）。残基１２～１７は、Ｅｎａゼリーロール状ドメインと、Ｎｔｃとの間において、可撓性スペーサー領域を形成する。目覚ましいことに、このスペーサー領域は、Ｅｎａサブユニット間の長手方向において、４．５Åのギャップを創出し、これらのＥｎａサブユニットは、Ｎｔｃを介する接触以外に、直接的に接触しない（図３Ｃ、８Ｂ）。Ｎｔｃスペーサーにおける可撓性と、ヘリックスターンを隔てた、長手方向における、サブユニットの、直接的なタンパク質間接触の欠如は、Ｅｎａ繊維において、曲がりやすさ及び弾性の増大を創出する（図３）。芽胞会合繊維の、二次元クラス平均像は、ピッチの変化を８Å以下とする、長手方向の伸縮（範囲：３７．１～４４．９Å；図３Ｄ）及びヘリックスターン１回転当たり１０度以下の軸方向における揺動（図３Ａ、３Ｂ）を示す。

こうして、Ｂ．セレウス芽胞付属物は、βシートの拡張により形成された、水平方向の非共有結合的サブユニット間接触と、ジスルフィド結合されたＮ末端接続部ペプチドによる、長手方向の共有結合的ヘリックスターン間接触とを伴う結果として、極度の化学的安定性（図７）を、高度の繊維的可撓性と組み合わせるアーキテクチャーもたらす、左巻き単一出発点型ヘリックスを含む、新規のクラスの細菌線毛を表す。

共有結合され、高度に緊密である、ゼリーロール状フォールドは、乾燥処理、高温処理及びプロテアーゼへの曝露に抗する、Ｅｎａ繊維の、高度な化学的／物理的安定性を結果としてもたらす。数百のサブユニットによる、直鎖状フィラメントの形成は、サブユニット－サブユニット間複合体の解離が、線毛の破断を結果としてもたらすことを回避するように、高度の可撓性を伴う、安定的であり、長寿命である、サブユニット－サブユニット間の相互作用を要求する。この高度の安定性及び可撓性は、環境内、又は感染サイクルにおいて、芽胞により満たされうる、極限的条件に対して、適合性である可能性が高い。

グラム陽性菌において、表面繊維又は「線毛」を形成する、２つの分子経路：１）ソルターゼにより触媒されたペプチド転移反応による、線毛サブユニットの共有結合的連結を包摂する、ソルターゼ媒介型線毛アセンブリー（Ｔｏｎ－Ｔｈａｔ及びＳｃｈｎｅｅｗｉｎｄ、２００４）及び２）疎水性Ｎ末端ヘリックスのコイルドコイル相互作用を介する、サブユニットの、非共有結合的アセンブリーを包摂する、ＩＶ型線毛アセンブリー（Ｍｅｌｖｉｌｌｅ及びＣｒａｉｇ、２０１３）が公知である。ソルターゼ媒介型線毛及びＩＶ型線毛は、栄養細胞上において形成されるが、現在のところ、これらの経路がまた、芽胞付属物のアセンブリーの一因をもなすことを示唆する証拠は見られない。

本実験まで、芽胞付属物の遺伝子同一性及びタンパク質組成が公知であった、唯一の種は、他の大半のクロストリジウム属及びバチルス属種において見出されたものと構造的に顕著に異なる、大型（長さ４．５μｍ、幅０．５μｍ及び厚さ３０ｎｍ）のリボン様付属物を保有する、非毒性の環境種である、クロストリジウム・テニオスポールム（Ｃｌｏｓｔｒｉｄｉｕｍｔａｅｎｉｏｓｐｏｒｕｍ）である。Ｃ．テニオスポールム（Ｃ．ｔａｅｎｉｏｓｐｏｒｕｍ）は、外膜層を欠き、付属物は、コートの外側の、組成が未知である、別の層へと接合されていると考えられる（Ｗａｌｋｅｒら、２００７）。Ｃ．テニオスポールムの芽胞付属物は、それらのうちの３つが、他の種において、公知のホモログを有さず、Ｂ．スブティリスの芽胞膜タンパク質である、ＳｐｏＶＭのオーソログを有さない、４つの主要な構成要素からなる（Ｗａｌｋｅｒら、２００７）。したがって、Ｃ．テニオスポールム芽胞の表面上の付属物は、Ｂ．セレウス群に属する種の芽胞の表面において見出された繊維と、顕著に異なる種類の繊維を表す。

本発明者らによる構造的実験は、新規のクラスの線毛を明らかにするが、この場合、サブユニットは、螺旋状に巻き付いた繊維へと組織化され、ヘリックスターン内部における、水平方向へのβシートの拡張及びヘリックスターンを隔てた、長手方向のジスルフィド架橋により一体に保持さる。線毛アセンブリー内の、共有結合的架橋は、グラム陽性菌線毛内において見られた、ソルターゼ媒介型イソペプチド結合の形成について公知である（Ｔｏｎ－Ｔｈａｔ及びＳｃｈｎｅｅｗｉｎｄ、２００４）。Ｅｎａ内において、架橋は、サブユニットｉのＮ末端接続部内の、保存されたＣｙｓ－Ｃｙｓモチーフの、ヘリックス構造内の位置である、ｉ－９及びｉ－１０に配置された、Ｅｎａサブユニットのコアドメイン内の、２つの単一のＣｙｓ残基へのジスルフィド結合を介して生じる。このように、Ｎ末端接続部は、ヘリックスターンを隔てた、共有結合的架橋のほか、先行ヘリックスターン内の、２つの隣接するサブユニット（すなわち、ｉ－９及びｉ－１０）との分岐的相互作用を形成する。Ｎ末端接続部又はＮ末端伸長部の使用はまた、シャペロン－アッシャー型線毛及びバクテロイデス属（ｂａｃｔｅｒｏｉｄｅｓ）Ｖ型線毛においても見られるが、これらのシステムは、非共有結合的フォールド補完機構を援用して、長寿命のサブユニット－サブユニット間接触を達成し、共有結合的安定化を欠く（Ｓａｕｅｒら、１９９９；Ｘｕら、２０１６）。Ｅｎａにおいて、Ｎ末端接続部は、可撓性リンカーを介して、Ｅｎａコアドメインへと接合されるため、Ｅｎａ繊維内のヘリックスターンは、大きな旋回自由度及び長手方向の伸縮を受ける能力を有する。これらの相互作用は、高度に化学的に安定であるが、可撓度の大きな繊維を結果としてもたらす。Ｅｎａの伸縮性及び曲がりやすさが、機能的に重要であるのかどうかは、未だ不明である。いくつかのシャペロン－アッシャー型線毛内において、線毛のヘリックスの巻き戻し及び巻き取りによりもたらされる、可逆性バネ様伸縮が、接着性細菌に対して及ぼされた、せん断応力及び引っ張り応力への耐性に重要であることが見出されたことが注目される（Ｍｉｌｌｅｒら、２００６；Ｆａｌｌｍａｎら、２００５）。おそらく、Ｅｎａにおいて見られた、長手方向の伸縮は、同様の役割を果たしうる。

［実施例６］Ｅｎａ１における、Ｓ型Ｅｎａのためのコード領域
Ｂ．セレウスＮＶＨ００７５／９５株において、Ｅｎａ１Ａ、Ｅｎａ１Ｂ及びＥｎａ１Ｃは、上流において、ｄｅｄＡ（ｇｅｎｂａｎｋ受託番号：ＫＭＰ９１６９６．１）と、機能が未知である、９３残基のタンパク質をコードする遺伝子（ＤＵＦ１２３２、ｇｅｎｂａｎｋ受託番号：ＫＭＰ９１６９６．１）とにより挟まれたゲノム領域内においてコードされる（図４Ａ）。下流において、Ｅｎａ遺伝子クラスターは、酸性ホスファターゼをコードする遺伝子に隣接する。Ｅｎａ遺伝子クラスター内において、それぞれ、Ｅｎａ１Ａ及びＥｎａ１Ｂは、フォワードの配向性において見出され、Ｅｎａ１Ｃは、リバースの配向性において見出される（図４Ａ）。それぞれ、栄養増殖細胞及び芽胞形成細胞を表す、培養の４及び１６時間後単離されたｍＲＮＡから作られた、ＮＶＨ００７５／９５株ｃＤＮＡについてのＰＣＲ解析は、Ｅｎａ１Ａ及びＥｎａ１Ｂが、栄養増殖時ではなく、芽胞形成時において、バイシストロニックの転写物から、共発現されることを指し示した（図４Ｂ）。栄養細胞内において、フォワードプライマーが、Ｅｎａ１Ａの上流のｄｅｄＡ内に配置され、リバースプライマーが、Ｅｎａ１Ｂ内に配置された場合に、弱い増幅シグナルが観察された（図４Ｂ、レーン２）ことは、一部のＥｎａＡ及びＥｎａＢが、ｄｅｄＡと共発現されることを示唆する。これは、栄養細胞内において、又は芽胞形成の極早期において観察されたが、芽胞形成の後期段階において観察されず、不適正に終結したｄｅｄＡｍＲＮＡの画分を表しうる。定量リアルタイムＰＣＲ解析は、芽胞形成細胞内における、Ｅｎａ１Ａ、Ｅｎａ１Ｂ及びＥｎａ１Ｃの発現の、栄養細胞内と比較した増大を示した（図４Ｂ）。

本発明者らの知る限りにおいて、典型的なＥｎａフィラメントが、Ｂ．セレウス栄養細胞の表面において観察されていないことは、それらが、芽胞特異的構造であることを指し示す。ＮＶＨ００７５／９５株のｑＲＴ－ＰＣＲ解析が、芽胞形成時における、Ｅｎａ１Ａ－Ｅｎａ１Ｃ転写物の、栄養細胞と比較した増大を裏付けたことは、この仮定を支持する。かつて、Ｂ．チューリンギエンシス・キネンシス血清型ＣＴ－４３株（Ｂ．ｔｈｕｒｉｎｇｉｅｎｓｉｓｓｅｒｏｖａｒｃｈｉｎｅｎｓｉｓＣＴ－４３）について、転写解析が実施され、接種の７時間後、９時間後、１３時間後（細胞のうちの３０％が、芽胞形成を受ける）及び２２時間後における転写を決定した（Ｗａｎｇら、２０１３）。後者株の発現が、遺伝子１つ当たりのリード数を、ＲＰＫＭ（ＲｅａｄｓＰｅｒＫｉｌｏｂａｓｅｓｐｅｒＭｉｌｌｉｏｎｒｅａｄｓ）へと転換することにより正規化され、ＤＥＧｓｅｑソフトウェアパッケージにより解析されるのに対し、本実験は、Ｅｎａ遺伝子の発現レベルを、ハウスキーピング遺伝子である、ｒｐｏＢと比べて決定するので、Ｂ．セレウスＮＶＨ００７５／９５株内の、Ｅｎａ１Ａ、Ｅｎａ１Ｂ及びＥｎａ１Ｃの発現レベルを、Ｂ．チューリンギエンシス・キネンシス血清型ＣＴ－４３株内の、Ｅｎａ２Ａ－Ｅｎａ２Ｃ（ＣＴ４３＿ＣＨ０７８３～７８５）の発現レベルと、直接比較することは困難である。しかし、いずれの実験も、ＥｎａＡ及びＥｎａＢが、芽胞形成時に限り転写されることを指し示す。公表されたトランスクリプトームプロファイリングデータの個別のセットを検索することにより、本発明者らは、Ｂ．アントラーキス（Ｂ．ａｎｔｒａｃｉｓ）芽胞に由来するＥｎａは、かつて、報告されていないが、Ｅｎａ２Ａ－Ｅｎａ２Ｃはまた、芽胞形成時において、Ｂ．アントラーキス内においても発現されることを見出した（Ｂｅｒｇｍａｎら、２００６）。

エクスビボにおけるＳ型Ｅｎａについての、ｃｒｙｏＥＭマップ及び免疫金ＴＥＭ解析は、これらが、Ｅｎａ１Ａ及びＥｎａ１Ｂの両方を含有することを指し示した（図９Ｂ～９Ｄ）。Ｅｎａ１サブユニットの、Ｂ．セレウスのＥｎａへの相対的寄与を決定するために、本発明者らは、Ｅｎａ１Ａ、Ｅｎａ１Ｂのほか、Ｅｎａ１Ｃに対して、個別の染色体ノックアウトを行い、ＴＥＭにより、それらのそれぞれの芽胞について探索した。全てのＥｎａ１突然変異体は、野生型と同様の寸法及び無傷の外膜を伴う芽胞をもたらした（図５Ａ、図１１）。Ｅｎａ１Ａ突然変異体及びＥｎａ１Ｂ突然変異体のいずれも、Ｓ型Ｅｎａを完全に欠く芽胞を結果としてもたらし、エクスビボにおける繊維の混合含量と一致した。Ｅｎａ１Ｃ突然変異体もまた、芽胞上におけるＳ型Ｅｎａの喪失を結果としてもたらした（図５Ａ）が、抗Ｅｎａ１Ｃ血清による染色は、Ｓ型Ｅｎａ内部のタンパク質の存在を同定しなかった（図９Ｄ）。３つの突然変異体全ては、やはり、サイズ及び数密度が野生型芽胞と同様である、Ｌ型Ｅｎａの存在を示したが、統計学的解析は、Ｌ型Ｅｎａが、Ｅｎａ１Ｂ突然変異体及びＥｎａ１Ｃ突然変異体において、長さを、わずかに増大させることを除外しない（長さについて、それぞれ、ｐ＝０．００３及びｐ＜０．０００１）（図５Ｂ）。こうして、Ｅｎａ１Ａ、Ｅｎａ１Ｂ及びＥｎａ１Ｃは、インビボにおけるＳ型Ｅｎａアセンブリーのために、相互的に要求されるが、Ｌ型Ｅｎａアセンブリーのためには相互的に要求されない。Ｅｎａ１Ｂ突然変異体の、Ｅｎａ１Ａ－Ｅｎａ１Ｂを含有する、低コピープラスミド（ｐＭＡＤ－Ｉ－ＳｃｅＩ）による補完は、Ｓ型Ｅｎａの発現を回復させた。これらのサブユニットの、プラスミドベースの発現は、芽胞１個当たりのＳ型Ｅｎａの数の、平均約２倍の増大及びＥｎａ長の劇的な増大を結果としてもたらし、Ｅｎａ長は、今や、数ミクロンに達した（図５Ａ、５Ｂ、図１１Ｄ）。こうして、Ｓ型Ｅｎａの数及び長さは、利用可能なＥｎａ１Ａサブユニット及びＥｎａ１Ｂサブユニットの濃度に依存する。注目すべきことに、Ｅｎａ１Ａ及びＥｎａ１Ｂを過剰発現させる、いくつかの芽胞は、外膜を欠くと考えられた、又はＳ型Ｅｎａの、外膜内部への取込みを示した（図１１Ｃ、１１Ｄ）。これは、Ｓ型Ｅｎａが、芽胞体から発生し、Ｅｎａ発現の、濃度又はタイミングの不均衡が、芽胞表面構造のミスアセンブリー及び／又は非局在化を結果としてもたらしうることを裏付ける。Ｓ型Ｅｎａと対照的に、野生型芽胞及び突然変異体芽胞についての精査は、Ｌ型Ｅｎａが、芽胞体ではなく、外膜の表面から発生することを示唆する。本実験において、Ｌ型Ｅｎａの分子同一性又はＬ型Ｅｎａ及びＳ型Ｅｎａのそれぞれにおいて見られた、単一末端若しくは複数末端のラッフル膜は、確認されなかった。

［実施例７］Ｅｎａ１Ａ－Ｅｎａ１Ｃ遺伝子の系統発生的分布
Ｂ．セレウスｓ．ｌ．群及び他の関連のあるバチルス属種内における、Ｅｎａ１Ａ－Ｅｎａ１Ｃの発生について探索するために、クローズドゲノムを欠いている種についてのスキャフォールドを付加した、全ての、キュレーションされ、利用可能である、バチルス属種のクローズドゲノムを含有するデータベースに対して、Ｅｎａ１Ａ－Ｅｎａ１Ｃのホモログについての、対応のあるｔＢＬＡＳＴｎ検索を実施した（ｎ＝７３５）。Ｂ．セレウスＮＶＨ００７５／９５株のＥｎａ１ＡＢのうち、カバレッジ（＞９０％）及びアミノ酸シーケンシング類似性（＞８０％）が大きなホモログは、解析された、Ｂ．セレウス株８５株中１１株、Ｂ．ヴィートマニイ（Ｂ．ｗｉｅｄｍａｎｎｉｉ）株１１９株中１３株、Ｂ．シトトキシクス株１４株中１４株、Ｂ．ルティー（Ｂ．ｌｕｔｉ）（１００％）株１株中１株、Ｂ．モビリス（Ｂ．ｍｏｂｉｌｉｓ）株６株中３株、Ｂ．ミコイデス株３３株中３株、Ｂ．トロピクス（Ｂ．ｔｒｏｐｉｃｓ）株１株中１株及び両方のＢ．パラントラーキス（Ｂ．ｐａｒａｎｔｈｒａｃｉｓ）株を含む４８株において見出された。これらの株のうち、３１株だけはまた、Ｂ．セレウスＮＶＨ００７５／９５株のＥｎａ１Ｃに対する配列同一性及びカバレッジの大きなホモログをコードする遺伝子も保有した（図６）。探索された、全てのＢ．シトトキシクスゲノム（１４株中１４株）は、仮説的なＥｎａ１Ａタンパク質及びＥｎａ１Ｂタンパク質をコードしたが、１４株中１２株だけは、Ｂ．セレウスＮＶＨ００７５－９５株のＥｎａ１Ｃと比較して、中程度のアミノ酸保存だけを示す、Ｅｎａ１Ｃオーソログをコードした（平均値のアミノ酸配列同一性：６３．９％）（図６、図１１）。

Ｂ．セレウス群ゲノム内の、Ｅｎａ１Ａ－Ｅｎａ１Ｃのホモログについて検索したところ、仮説的なＥｎａＡ－ＥｎａＣタンパク質をコードする、オーソログの候補遺伝子クラスターが発見された。これら３つのタンパク質は、それぞれ、Ｂ．セレウスＮＶＨ００７５－９５株の、Ｅｎａ１Ａ、Ｅｎａ１Ｂ及びＥｎａ１Ｃとの、５９．３±０．９％、４３．３±１．６％及び５３．９±２．２％の平均アミノ酸配列同一性を有し、遺伝子シンテニーを共有した（図６Ｂ）。オーソログのＥｎａ遺伝子クラスターは、Ｅｎａ２Ａ－Ｅｎａ２Ｃと名付けられた。Ｂ．スブティリス（ｎ＝１２７）及びＢ．シュードミコイデス（Ｂ．ｐｓｅｕｄｏｍｙｃｏｉｄｅｓ）（ｎ＝８）を除き、解析された、全てのゲノム（ｎ＝７３５）は、Ｅｎａ１（ｎ＝４８）又はＥｎａ２（ｎ＝４７６）の遺伝子クラスターを保有した。Ｅｎａ１Ａ－Ｅｎａ１Ｃ又はＥｎａ２Ａ－Ｅｎａ２Ｃは、同時に存在せず、解析されたゲノムの間において、キメラのＥｎａ１Ａ－Ｅｎａ１Ｃ／Ｅｎａ２Ａ－Ｅｎａ２Ｃクラスターは、発見されなかった（図６）。Ｅｎａ１Ａ－Ｅｎａ１Ｃと、Ｅｎａ２Ａ－Ｅｎａ２Ｃとの間における、タンパク質系統樹内の、大きな分割に加えて、Ｅｎａ１Ａ配列、Ｅｎａ１Ｂ配列の間において、とりわけ、Ｅｎａ１Ｃ配列の間において、顕著に異なるサブクラスターが見られた（図１１）。Ｅｎａ１Ａ配列は、２つの主要なサブクラスターへと分けられた：１つのサブクラスターは、Ｂ．シトトキシクス株のうちの大部分において存在し、別のサブクラスターは、Ｂ．ヴィートマニイ株及びＢ．セレウス株において見出された（図１１Ａ）。ＥｎａＢタンパク質について、より大きな変動が明らかとなった：Ｅｎａ１Ｂ配列は、２つのクラスターを形成し；１つのクラスターは、Ｂ．セレウス分離株及びＢ．ヴィートマニイ分離株を含有し、他のクラスターは、Ｂ．シトトキシクスを伴った（図１１）。また、Ｅｎａ２Ｂタンパク質の、個別のサブクラスターも見られ（図１１）、Ｅｎａ２ＢとＥｎａ１Ｂの残部と、それぞれ約７８％及び約４８％の配列同一性を共有した、Ｂ．ミコイデス、Ｂ．セレウス、Ｂ．チューリンギエンシス、Ｂ．パシフィクス（Ｂ．ｐａｃｉｆｉｃｕｓ）及びＢ．ヴィートマニイの分離株を含有する。ＥｎａＣは、３つのタンパク質のうちにおいて、最も可変的であった：Ｅｎａ１Ｃは、Ｂ．ヴィートマニイ、Ｂ．セレウス、Ｂ．アントラーキス、Ｂ．パラントラーキス、Ｂ．モビリス、Ｂ．トロピクス（Ｂ．ｔｒｏｐｉｃｕｓ）及びＢ．ルティーの分離株を含有する、単一系統クレードを形成したが、種内、Ｅｎａ２ＡＢ保有株内のほか、Ｅｎａ１ＡＢ保有株のサブセット内においても、大幅な配列変動を有した。

Ｂ．セレウス群株の間において、Ｅｎａ１Ａ－Ｅｎａ１Ｃ遺伝子より、Ｅｎａ２Ａ－Ｅｎａ２Ｃのホモログ又はオーソログが、はるかにより一般的であり；探索された、Ｂ．トヨネンシス（Ｂ．ｔｏｙｏｎｅｎｓｉｓ）（ｎ＝２０４）、Ｂ．アルブス（Ｂ．ａｌｂｕｓ）（ｎ＝１）、Ｂ．ボムビセプティクス（Ｂ．ｂｏｍｂｙｓｅｐｔｉｃｕｓ）（ｎ＝１）、Ｂ．ニトラティレデュケンス（Ｂ．ｎｉｔｒａｔｉｒｅｄｕｃｅｎｓ）（ｎ＝６）、Ｂ．チューリンギエンシス（ｎ＝５０）の全てのゲノム及びＢ．セレウス（８７％、８５株中７４株）、Ｂ．ヴィートマニイ（１１９株中１０５株、８９．３％）、Ｂ．トロピクス（７１％、７株中５株）及びＢ．ミコイデス（９１％、３３株中３０株）のうちの大部分は、タンパク質のＥｎａ２Ａ－Ｅｎａ２Ｃ形態を有した（図６）。誤分類された、ストレプトコッカス・ニューモニエ（Ｓｔｒｅｐｔｏｃｏｃｃｕｓｐｎｅｕｍｏｎｉａｅ）の、３つのゲノム（ＧＣＡ＿００１１６１３２５、ＧＣＡ＿００１１７０８８５、ＧＣＡ＿００１３３８６３５）及び誤分類された、Ｂ．スブティリスの１つのゲノム（ＧＣＡ＿００４３２８８４５）を除き、Ｂ．スブティリス（ｎ＝１２７）若しくはＢ．シュードミコイデス（ｎ＝８）のゲノム又はＢ．セレウス群以外の、他の任意のゲノム内に、Ｅｎａオーソログは、見出されなかった。これらのゲノム及びＢ．スブティリスは、分類学的分類のための、３つの異なる方法（Ｍａｓｔｈｒｅｅ、７－ｌｏｃｉＭＬＳＴ及びＫｒａｋｅｎ；「方法」節を参照されたい）により再解析したところ、Ｂ．セレウスとして再分類された。少数のパエニバチルス属（Ｐｅａｎｉｂａｃｉｌｌｕｓｓｐｐ．）種株のゲノムは、Ｅｎａ１Ａ－Ｅｎａ１Ｃに対するアミノ酸配列類似性が低レベルである、仮説的タンパク質をコードする遺伝子を有したが、コーネラ・アビエティス（Ｃｏｈｎｅｌｌａａｂｉｅｔｉｓ）株（ＧＣＦ＿００４２９５５８５．１）のゲノムにおいて、Ｅｎａ１Ａ及びＥｎａ１Ｂと、ある程度類似する、仮説的タンパク質をコードする遺伝子もまた見出された。バチルス属以外のこれらのヒットは、アネロミクロビウム属（Ａｎａｅｒｏｍｉｃｒｏｂｉｕｍ）、コーネラ属（Ｃｏｃｈｎｅｌｌａ）において見出された、これらの遺伝子及びバチルス綱（Ｂａｃｉｌｌａｌｅｓ）のＤＵＦ３９９２ドメイン内におけるヒットであった。

少数のゲノムは、それらの種の他の株と比較して、Ｅｎａ遺伝子クラスター内において、偏差を有した。Ｂ．ミコイデス株３株中２株（ＧＣＦ＿００７６７３６５５及びＧＣＦ＿００７６７７８３５．１）は、Ｅｎａ１Ａ－Ｅｎａ１Ｂオペロンの下流において、Ｅｎａ１Ｃ対立遺伝子を欠いた（データは示さない）。しかし、Ｂ．セレウスＮＶＨ００７５／９５株のＥｎａ１Ｃに対する、５０％の同一性を有する仮説的タンパク質をコードする、潜在的Ｅｎａ１Ｃオーソログが、それらのゲノム内の、他の箇所において見出された。Ｂ．セレウス（Ｒｏｃｋ３－４４株によるアセンブリー：ＧＣＡ＿０００１６１２５５．１）としてアノテーションされ、Ｂ．ミコイデス（図６）のこれらの株と共に群分けされ、Ｂ．チューリンギエンシスと共に、それらのＥｎａ１Ａ－Ｅｎａ１Ｃ分布パターンを共有した、１つのゲノムは、通例、Ｅｎａ２遺伝子を保有するが、Ｂ．チューリンギエンシス（ＬＭ１２１２株；ＧＣＦ＿００３５４６６６５）としてアノテーションされたゲノムは、全てのＥｎａ遺伝子を欠いた。この株は、Ｂ．トロピクスの参照株と、ほぼ同一であり、これもまた、両方のＥｎａ遺伝子クラスターを欠いた。

本発明者らによる、Ｓ型繊維についての系統発生解析は、機能が未知のドメインである、ＤＵＦ３９９２を包摂する、保存されたタンパク質ファミリーに属するＥｎａサブユニットを明らかにする。

［実施例８］インビボにおける、タグ非含有のＥｎａ１Ａ又はＥｎａ１Ｂによる、Ｓ型繊維の組換え作製
Ｅｎａ１Ａ（ＷＰ＿０００７４２０４９．１）及びＥｎａ１Ｂ（ＷＰ＿０００５２６００７．１）の野生型配列を、Ｅ．コリについてコドン最適化し、ＴｗｉｓｔＢｉｏｓｃｉｅｎｃｅ製の合成遺伝子として注文し、ｐＥＴ２８ａベクター内に、さらにサブクローニングした（ＮｃｏＩ－ＸｈｏＩ）。得られたプラスミド（ｐＥＴ２８ａ＿Ｅｎａ１Ａ；ｐＥＴ２８ａ＿Ｅｎａ１Ｂ）を使用して、Ｃ４３（ＤＥ３）株のコンピテント細胞を形質転換した。単一のコロニーを使用して、一晩にわたる（ＯＮ）、ＬＢによる培養を開始した。１０ｍｌの一晩培養物を使用して、３７Ｃにおける、１ｌのＬＢ、２５ｍｇ／ｍｌのカナマイシンに接種した。組換え発現は、ＯＤ_６００を、０．８として、１ｍＭのＩＰＴＧを添加することにより誘導し、培養物を、放置して一晩にわたりインキュベートした。４０００ｇにおいて、１５分間にわたる遠心分離により、細胞をペレット化させた。細胞ペレットを、１倍濃度のＰＢＳ、１ｍｇ／ｍｌのリゾチーム、１ｍＭのＡＥＢＳＦ、５０μＭのロイペプチン、１ｍＭのＥＤＴＡ中に再懸濁させ、十分な攪拌下、室温において、３０分間にわたりインキュベートし、この後、ＤＮアーゼ及びＭｇＣｌ_２を、それぞれ、１０μｇ／ｍｌ及び１０ｍＭの最終濃度まで添加し、さらに、３０分間にわたりインキュベートした。遠心分離（１５分間、４０００ｇ）を介して、細胞破砕物をペレット化させた。上清を、注意深く除去し、２０．０００ｒｐｍにおいて、５０分間にわたり、遠心分離した。上清を廃棄し、ペレットを、懸濁液（１倍濃度のＰＢＳ）へと戻した。結果として得られた懸濁液を、ｍｉｌｉＱ中５倍に希釈し、フォルムバール／カーボングリッド（Ｃｕ製の４００メッシュ；ＥｌｅｃｔｒｏｎＭｉｃｒｏｓｃｏｐｙＳｃｉｅｎｃｅｓ）上に沈着させ、２％（ｗ／ｖ）の酢酸ウラニルを使用して染色した。ＴＥＭ解析は、直径を１０～１１ｎｍとする、マイクロメートル単位の長さの繊維の存在を明らかにした。枠付けされた繊維セグメントについての二次元クラス分け像を観察し、図１２に示された繊維のＳ型性を確認する。

［実施例９］Ｅｎａタンパク質の生物学的役割：見通し
Ｅｎａの機能についての知見を伴わない限り、本発明者らは、それらの生物学的役割について推測できるに過ぎない。Ｂ．セレウス群種のＥｎａは、グラム陰性栄養細菌内及びグラム陽性栄養細菌内の、生体表面（他の細菌を含む）及び非生体表面への接着、収縮運動、バイオフィルムの形成、ＤＮＡの取込み（天然のコンピテンス）及び交換（コンジュゲーション）、エクソプロテインの分泌、電子移動（ゲオバクター属（Ｇｅｏｂａｃｔｅｒ））並びにバクテリオファージへの感受性（Ｌｕｋａｓｚｃｚｙｋら、２０１９；Ｐｒｏｆｔ及びＢａｋｅｒ、２００９）において役割を果たす線毛に相似する。一部の細菌は、異なる機能を果たす、複数種類の線毛を発現させる。線毛繊維の、最も一般的な機能は、金属、ガラス、プラスチックロックから、植物、動物又はヒトの組織にわたる、多様な範囲の表面への接着である。病原性細菌において、線毛は、宿主組織のコロニー形成において、枢要的役割を果たし、重要な毒力決定因子として機能することが多い。同様に、Ｃ．スポロゲネス（Ｃ．ｓｐｏｒｏｇｅｎｅｓ）芽胞の表面において発現された付属物は、培養された線維芽細胞への、それらの接合を容易とすることが示されている（Ｐａｎｅｓｓａ－Ｗａｒｒｅｎら、２００７）。しかし、Ｅｎａは、それらが、芽胞の代謝的休眠状態において生じる可能性が低い、エネルギー要求過程であるので、能動的運動性又はＤＮＡ若しくはタンパク質の取込み／輸送に関与する可能性が低い。Ｅｎａは、強力な潜在的病原可能性を伴う、近縁のバチルス属種の群である、Ｂ．セレウス群（図６）に属する株の芽胞の間における、広範な特徴であると考えられる（Ｅｈｌｉｎｇ－Ｓｃｈｕｌｚら、２０１９）。大半のＢ．セレウス群種について、芽胞を伴う、摂取、吸入又は創傷の汚染は、感染及び疾患発症の一次経路を形成する。Ｅｎａは、細胞表面の大半を覆うので、芽胞環境との重要な接触領域を形成することが合理的に予測され、Ｂ．セレウス種の播種及び毒力において、役割を果たすことが推測されうる。本発明者らによる系統発生解析は、病原性バチルス属における、Ｅｎａの広範な発生及び芽胞について実験するための、一次モデルシステムとして機能してきた、土壌中棲息種であり、かつ、消化器片利共生生物である、バチルス・スブティリス（Ｂａｃｉｌｌｕｓｓｕｂｔｉｌｉｓ）などの非病原性種における、顕著な非存在を示す。Ａｎｋｏｌｅｋａｒらは、Ｂ．セレウスの４７の食物分離株の全てが、付属物を伴う芽胞を産生することを示した（Ａｎｋｏｌｅｋａｒ及びＬａｂｂｅ、２０１０）。付属物はまた、Ｂ．セレウスと近縁であり、その殺虫活性について最も良く知られた（Ａｎｋｏｌｅｋａｒ及びＬａｂｂｅ、２０１０）、バチルス・チューリンギエンシスの、食物媒介型腸毒性分離株１２株中１０株の芽胞上においても見出された。

エクスビボにおける繊維についての、ｃｒｙｏ－ＥＭ画像は、Ｓ型Ｅｎａ及びＬ型Ｅｎａの末端における、幅２～３ｎｍの繊維（ラッフル膜）を示した。ラッフル膜は、エンテロバクター科（Ｅｎｔｅｒｏｂａｃｔｅｒｉａｃｅａｅ）の、多くのグラム陰性菌において見られた、Ｐ型線毛及び１型線毛の原線維先端部に相似する（Ｐｒｏｆｔ及びＢａｋｅｒ、２００９）。グラム陰性線毛フィラメントにおいて、原線維先端部は、粘膜表面上の受容体との相互作用を増強するように、柔軟な局在化を伴う、接着タンパク質をもたらす（Ｍｕｌｖｅｙら、１９９８）。インビトロにおいてアセンブルされた繊維上において、ラッフル膜と類似するフィラメントが観察されなかったことは、それらの形成が、Ｅｎａ１Ａサブユニット又はＥｎａ１Ｂサブユニットを超える、さらなる構成要素を要求することを示唆する。

本発明者らは、病原性バチルス属において広範に見られた、芽胞会合付属物又は芽胞会合線毛の新規のクラスの分子の同定を提示する。将来の分子実験及び感染実験は、芽胞媒介型病原性バチルス属の毒力において、Ｅｎａが、役割を果たすのかどうか、及びどのように役割を果たすのかを決定することを必要とする。本作業において提示された、Ｅｎａの遺伝子同一性及び構造的側面についての発見の進展は、いよいよ、インビトロにおける分子実験及びインビボにおける分子実験が、それらの生物学的役割を引き出し、異なるバチルス属種の間における、Ｅｎａの異種性についての基礎に対する洞察を得ることを可能とする。

［実施例１０］Ｅｎａ薄膜の調製
インセルロにおいて組換えにより作製された、Ｅｎａ１ＢのＳ型繊維を単離した後、Ｅｎａ１Ｂ原液を、ｍｉｌｉＱ中において、１００ｍｇ×ｍＬ^－１又は２５ｍｇ×ｍＬ^－１の最終濃度へと希釈することにより、Ｅｎａ１ＢＳ型繊維の懸濁液を調製した。このＥｎａ１Ｂ懸濁液５０μｌを、シリコン処理カバースリップへと、直径を１８ｍｍとしてドロップキャストし、６０℃において、１時間にわたりインキュベートした。結果として得られる薄膜を、そのまま使用した（図２１ａ）、又はイメージングのために、カバースリップから剥がした（図２１ｂ～２１ｃ）。いずれの出発濃度のＥｎａ１ＢＳ型溶液も、厚さを、それぞれ、約２１μｍ（図２１ｃ）及び３．７μｍとする、フリースタンディングの半透明薄膜をもたらした。

［実施例１１］Ｅｎａのソフトハイドロゲル及び強化ハイドロゲルの調製
ＥＮＡハイドロゲルの調製：１００ｍｇ×ｍＬ^－１のＥｎａ１ＢＳ型繊維懸濁液５０μｌを、シリコン処理カバースリップへとピペッティングし、２２℃において、１時間にわたり通気乾燥させた（図２２ａ）。次に、５０μｌのｍｉｌｉＱを、乾燥した薄膜へとピペッティングし、２２℃において、５分間にわたり放置して、再水和させる（図２２ｂ）結果として、薄膜の顕著な再膨潤をもたらした。次いで、マイクロピペットを使用して、過剰量の液体を除去し、結果として得られたＥｎａ１Ｂハイドロゲルを明らかにした（図２２ｃ）が、これは、図２２ｄに例示されたフリースタンディングのハイドロゲルであった。

強化Ｅｎａハイドロゲルの調製：１００ｍｇ×ｍＬ^－１のＥｎａ１ＢＳ型繊維の懸濁液の液滴２０μｌを、４ＭのＭｇＣｌ_２、５ＭのＮａＣｌ又は１００％（ｖ／ｖ）の絶対エタノールへと滴下し、２２℃において、１時間にわたりインキュベートした。インキュベーション時間において、ＥＮＡ液滴の高粘性は、繊維懸濁液の、選び出された溶液との混合を阻止し、液滴の形状を、効果的に安定化させる。水分活性が大きな塩溶液又はエタノール溶液は、ＥＮＡ液滴の漸進的脱水をもたらす結果として、稠密なＥＮＡハイドロゲルの形成をもたらす。塩又はエタノールを除去するために、ＥＮＡハイドロゲルビーズを、１ｍＬのｍｉｌｉＱへと、３回にわたり移し、２２℃において、２４時間にわたり通気乾燥させた（図２３）。ＭｇＣｌ_２中又はＮａＣｌ中のインキュベーションから結果として得られた、ＥＮＡハイドロゲルビーズが、不透明であったのに対し、エタノール中のインキュベーションは、安定的な、半透明の構造をもたらす。

［実施例１２］組換えにより作製されたＥｎａ３Ａは、Ｌ型繊維へと自己アセンブルする
Ｂ．セレウスＮＭ００９５－７５株から導出された、Ｅｎａ四重ノックアウト株（ΔＥｎａ１Ａ－Ｅｎａ１Ｂ－Ｅｎａ１Ｃ－Ｅｎａ３Ａ）に由来する成熟芽胞は、任意の芽胞付属物の完全な非存在（図２５ｃ）を明らかにしたが、この突然変異体を、Ｅｎａ３Ａ配列（配列番号４９）を含むｐＥＮＡ３Ａにより形質転換すると、Ｌ型繊維の表現型レスキューが、芽胞表面上において生じた（図２５ｄ～２５ｅ）。

したがって、バチルス属芽胞上において、Ｌ型Ｅｎａ繊維を形成するのに、必須かつ十分な、Ｅｎａタンパク質ファミリーのさらなるメンバーとしての、Ｅｎａ３Ａの同定に基づき、ｂｌａｓｔによる検索及び系統発生解析を実施して、バチルス・セレウスＥｎａ３Ａの候補オーソログ（配列番号４９において提示された）をもたらした。同定されたホモログ（配列番号５０～８０）の、複数の配列アライメントを、図１９に示し、ＤＵＦ３９９２ドメインを含む、全ての配列のほかに、保存されたＮ末端接続部領域は、Ｅｎａ３についてもまた存在することを裏付ける。

代表的ファミリーメンバーとして、配列番号４９において提示されたＥｎａ３Ａタンパク質を、組換え発現させたところ、本明細書においてまた、「ｒｅｃＥｎａ３Ａ」とも呼ばれ、ヘリックスツイストを、１８．４度とし、ライズを、４４．９Åとし、直径を、７５Åとする、螺旋状の７始点ラダー様（Ｌ型）繊維をもたらすことが示された。Ｌ型繊維は、７つのＮ末端接続部を介して共有結合的に接続されたＥｎａ３Ａ７量体リングの垂直方向の積み重ねから構築される。図２４に示された通り、各サブユニットのＢＩＤＧシートの鎖Ｇは、各７量体リングユニット内の、隣接するサブユニットの、ＣＨＥＦによるβシートの鎖Ｃにより拡張される。サブユニットは、サブユニットｉのＣＣｙｓ２１と、サブユニットｉ＋１のＣｙｓ８１との間のジスルフィド結合及びサブユニットｉのＣｙｓ１３と、サブユニットｉ＋１のＣｙｓ１４との間のジスルフィド結合を介して、各リング内において、共有結合的に架橋される。リング間架橋は、隣接するリング内の、Ｃｙｓ８位（ｉ）において、サブユニットｊのＣｙｓ２０位とのジスルフィド結合を形成する、Ｎ末端接続部（Ｎｔｃ）を介して確立される。

短いＬ型Ｅｎａ３繊維の、インビトロにおける組換え作製は、立体障害型Ｅｎａ３Ａの発現、Ｅｎａ３Ａ多量体の精製に続く、ＴＥＶプロテアーゼとの共インキュベーションの後における、Ｌ型繊維のアセンブリー（図２５ａ；Ｅｎａ１Ｂについて記載された方法を使用する）により得られた。代替的に、Ｅ．コリにおける、立体障害を伴わない、Ｅｎａ３Ａの組換え発現は、「インセルロ」（本明細書においてまた、「インビボ」とも呼ばれた）の、細胞質内における、長いＬ型繊維のアセンブリーに続く、細胞培養物からの、繊維の単離（図２５ｂ；本明細書において記載された方法を使用する）を結果としてもたらした。

したがって、バチルス・セレウスＡＴＣＣ＿１０９８７株の、Ｅｎａ３ＡＬ型繊維サブユニット（ＷＰ＿０１７５６２３６７．１；配列番号４９）のｃｒｙｏＥＭ構造は、図２６（左パネル）に示された通り、繊維内の水平方向の接触及び長手方向の接触を実証するように、ちょうど３つのサブユニットを示すｃｒｙｏ－ＥＭモデルをもたらす。Ｅｎａサブユニットは、ＢＩＤＧ－ＣＨＥＦトポロジーを伴う、８本のβ鎖によるβサンドウィッチフォールドのほか、Ｎｔｃと称され、繊維内の長手方向の共有結合的接触の一因をなす、Ｎ末端伸長ペプチドにより規定される（図１９）。このフォールドを、図１９に提示されたホモログと、構造的に比較するために、選択されたＥｎａ３Ａホモログである、ＷＰ＿０４９６８１０１８．１（配列番号６０）及びＷＰ＿１００５２７６３０．１（配列番号７５）について、ＡｌｐｈａＦｏｌｄｖ２．０を使用して予測された構造をマッチさせた。各構造について、各構造のＣα原子ｉと、参照構造（Ｅｎａ３ＡについてのｃｒｙｏＥＭモデル：ＷＰ＿０１７５６２３６７．１；配列番号４９）の対応する原子Ｃαと間の、原子位置についての平均二乗偏差（ＲＭＳＤ）のほか、フォールド類似性スコア、すなわち、ＤａｌｉによるＺスコアについて解析した。（ｎ／１０）－４［式中、ｎは、配列長である。］より高値のＺスコアは、高度に著しいフォールド類似性に対応すると考えられる（１０．１０９３／ｂｉｏｉｎｆｏｒｍａｔｉｃｓ／ｂｔｎ５０７）。ｎ＝１１６のとき、これは、Ｚ＝７．６に対応する。基準として、本発明者らはまた、本発明者らの参照構造であるＥｎａ３Ａ（ＷＰ＿０１７５６２３６７．１）についての、ＡｌｐｈａＦｏｌｄモデルも提示するが、これは、実験によるｃｒｙｏＥＭ構造と、ＡｌｐｈａＦｏｌｄモデルとの極めて良好な一致（ＲＭＳＤ＝１．０５；Ｚ＝１２．１）を裏付ける。これらの予測は、本発明者らの参照配列に対する６１％（ＷＰ＿１００５２７６３０．１）という低値の配列同一性を有するＤＵＦ３９９２配列が、Ｎｔｃが存在する同じＥｎａフォールドを取りうることを示す。

こうして、Ｅｎａ３Ａサブユニットは、ＤＵＦ３９９２の分類を結果としてもたらす、ＨＭＭプロファイル検索に続く、デノボの構造予測及びＥｎａ３Ａについて、本明細書において開示された、ｃｒｙｏＥＭ構造との比較に基づき、明確に同定されうる。自己アセンブルＥｎａサブユニットは、Ｅｎａ３Ａ（配列番号４９）に照らした、ＤａｌｉによるＺスコアが６．５以上である８本の鎖による、Ｅｎａベータサンドウィッチフォールドを含有し、Ｅｎａ繊維内のジスルフィド媒介架橋のためのＺ－Ｎ－Ｃ（Ｃ）－Ｍ－Ｃ－Ｘモチーフを伴うＮ末端接続部ペプチド［配列中、ＺはＬｅｕ、Ｉｌｅ、Ｖａｌ又はＰｈｅであり、Ｎは１又は２残基であり、ＣはＣｙｓであり、Ｍは１０～１２アミノ酸であり、Ｘは任意のアミノ酸である。］を含有する。候補Ｅｎａサブユニットの自己アセンブリー及び繊維形成は、本明細書の「材料及び方法」において記載される通り、単離された繊維材料の、Ｅ．コリの細胞質内の組換え発現及び陰性染色透過電子視覚化によりなされる。

［実施例１３］インビトロにおける組換えにより作製されたＥｎａ２Ａは、Ｓ型繊維へと自己アセンブルする
Ｅｎａ１Ｂ及びＥｎａ３Ａのほかに、インビトロにおける組換え作製法が、それらの典型的な繊維形成のために、全てのＥｎａへと一般的に適用可能であることを確認するために、Ｎ末端６×Ｈｉｓ－ＴＥＶ遮断剤を伴う、立体障害型Ｅｎａ２Ａ（配列番号１４５）の発現、Ｅｎａ２Ａ多量体の精製に続く、ＴＥＶプロテアーゼを伴う、共インキュベーションの後における、Ｓ型繊維のアセンブリーにより得られた、Ｅｎａ２ＡＳ型繊維のインビトロアセンブリーを、図２７に示す（図２７；Ｅｎａ１Ｂについて記載された方法を使用する）。

同様に、インセルロ又はインビボにおける、Ｅ．コリによる、組換えＥｎａ繊維の作製がまた、さらなるＥｎａファミリーメンバーにも、Ｅｎａ１Ｂ及びＥｎａ３Ａについて示された通りに適用可能であることの確認として、Ｅ．コリにおける、立体障害を伴わないＥｎａ２Ａの組換え発現は、「インセルロ」における、細胞質内における、Ｓ型繊維のアセンブリーに続く、細胞培養物からの、繊維の単離を結果としてもたらした（図２８；本明細書において記載された方法を使用する）。

［実施例１４］インビトロにおいて、Ｅｎａ２Ｃは、多量体的円板を形成する
実施例４において、Ｅｎａ１Ｃについて示された通り、組換えＥｎａＣタンパク質を使用すると、インビトロにおいて、ヘリックス多量体ではなく、多量体円板型の構造が形成される。Ｅｎａ２Ｃを念頭に、これを、さらに支援するために、同様に、Ｅ．コリＢｌ２１Ｃ４３において、Ｎ末端６×Ｈｉｓ－ＴＥＶ遮断剤と共に、立体障害型Ｅｎａ２Ｃ（配列番号１４６に提示された）を発現させることにより、９量体円板として、多量体を構成する、組換えＥｎａ２Ｃを作出した。

ＴＥＶプロテアーゼを使用する切断による、多量体の単離及び遮断剤の除去（本明細書において記載された方法において提示された通りの）は、Ｌ型様フィラメントをさらに結果としてもたらしたが、フィラメントは、高度に可撓性であり、閉ループへと湾曲した（図２９）。

［実施例１５］Ｎ末端接続部は、多量体の、繊維へのジスルフィド架橋に必須である
ｒｅｃＥｎａ１ＢＳ型繊維に由来する原子モデルは、サブユニットｉのＮ末端接続部（Ｎｔｃ）が、ジスルフィド架橋を介して、サブユニットである、ｉ－９及びｉ－１０へと接続されることを示す。２つの隣接するサブユニット（ｉ－１、ｉ）の間において、水平方向の、非共有結合的接触が存在するが、これらの相互作用は、頑健な繊維を形成するのに十分ではないことが予測される。この仮説を検証するために、ｒｅｃＥｎａ１Ｂ ΔＮｔｃ（配列番号８の野生型Ｅｎａ１Ｂの、残基２～１５を欠失させた）をクローニングし、Ｅ．コリにおいて発現させた。一晩にわたる誘導の後、細胞を採取し、ＴＥＭグリッドへと、直接沈着させ、ｎｓ－ＴＥＭを使用して解析した（図３０）。短いＳ型Ｅｎａ繊維は、細胞外培地中において見出されたが、破断点（図３０ｂ）と、破壊点（図３０ｃ～３０ｅ）とに分類された、擬似欠陥を呈した。破断点は、直線状繊維セグメントに沿って生じ、試料沈着ステップ及びブロッティングステップにおける溶質流から生じる、せん断力に続いて生じる可能性が高い。このような高頻度の破断は、野生型ｒｅｃＥｎａ１Ｂ繊維について観察されておらず、ｒｅｃＥｎａ１Ｂ ΔＮｔｃ繊維の引っ張り強度の低減を指し示す。破壊点は、繊維局所セグメントの臨界曲率が、２つ破損セグメントの間の降伏鋭角α^ｃｒｉｔを超えた場合に、屈曲繊維領域内において観察された。このような破壊点は、ｒｅｃＥｎａ１Ｂ ΔＮｔｃ繊維の、野生型ｒｅｃＥｎａ１Ｂ繊維と比較した、繊維可撓性の低減を示唆する。これらのデータは、Ｎ末端接続部が、サブユニット間ジスルフィド架橋を形成し、これにより、極めて良好な引っ張り強度及び可撓性を、Ｓ型繊維へと付与するのに必須である事実を裏付けている。

［実施例１６］インセルロにおける、剛性のＳ型繊維のアセンブリーは、６アミノ酸という小さなサイズのＮ末端立体障害を含有する、ｒｅｃＥｎａ１Ｂの発現により阻まれる
本明細書において例示された、組換え発現実験のために使用された、元の立体障害構築物が、天然Ｅｎａ配列を上回る、１５のさらなるアミノ酸（Ｍ－Ｈｉｓ６－ＳＳＧ－ＴＥＶ；ＭＨＨＨＨＨＨＳＳＧＥＮＬＹＦＱ－Ｅｎａ１Ｂ；さらなるアミノ酸は、太字において示されている）を含有したことを踏まえ、本発明者らは、Ｎ末端において、わずか６つのさらなるアミノ酸残基（Ｍ－ＴＥＶ－Ｅｎａ１Ｂ、Ｍ－ＥＮＬＹＦＱ－Ｅｎａ１Ｂ［配列中、Ｅｎａ１Ｂは、Ｎ末端のＭを伴わない配列番号８である。］）又は９つのさらなるアミノ酸残基（Ｍ－Ｈｉｓ６－ＳＳＧ－Ｅｎａ１Ｂ）による、小型の立体障害を含有する構築物を作った（図３１）。いずれの構築物の組換え発現も、インセルロにおける繊維形成を、やはり可能とするが、繊維収量は、１５アミノ酸の立体障害を伴う、Ｅｎａ１Ｂの発現と比較して、強く低減される。ｎｓ－ＴＥＭにおいて、繊維は、野生型ｒｅｃＥｎａ１ＢＳ型繊維（１１～１１．５ｎｍ）と比較して、小さな直径（９～９．５ｎｍ）を有し、それほど顕著な構造特徴を呈さない。原子ｃｒｙｏＥＭモデルから測定された、野生型Ｅｎａ１Ｂ繊維の直径は、９．８～９．９ｎｍであることに注意されたい。よって、繊維を取り巻く、ウラニル染色によるハローに起因して、ｎｓ－ＴＥＭ画像から導出された直径は、「膨張」している。本発明者らは、６～９アミノ酸の範囲の立体障害が、インセルロにおける繊維形成を、完全には遮断せず、天然Ｓ型繊維をもたらさず、このため、Ｅｎａ１Ｂが、繊維へと自己アセンブルする能力を低下させるので、インビトロ又はインビボにおける繊維アセンブリーにそれほど最適ではないと結論づける。

［実施例１７］操作されたＥｎａ１Ｂタンパク質構築物を適用する、Ｓ型繊維アセンブリー
ＢａｍＨＩ部位により挟まれた、Ｅｎａ１Ｂのループ領域である、ＢＣ、ＤＥ、ＥＦ及びＨＩに、ＨＡタグ（ＹＰＹＤＶＰＤＹＡ）を導入するように、構築物をデザインした。ＤＥループのために、ＦＬＡＧタグ（ＤＹＫＤＤＤＤＫ）を含有する、第２の構築物もまたデザインした。ＦＬＡＧタグはまた、ＢａｍＨＩ部位によっても挟まれる。インセルロにおける、効率的なＳ型重合を呈する、標的ループ内の、ペプチドタグ挿入についての明確な例を、下記及び図３２の、アライメントされた配列に示す。図３３に示された通り、異なる操作された繊維についてのウェスタンブロット解析は、繊維の表面上における、直鎖状タグ（ＦＬＡＧ及びＨＡ）の提示の成功のほか、極めて良好な化学的安定性を裏付ける（ＳＤＳ－ＰＡＧＥの積み重ねゲル内において保持された、多量体及び繊維バンドのマーキングを参照されたい；試料は、１％ＳＤＳ中において、１５分間にわたり煮沸した）。

操作されたＥｎａ１Ｂ挿入変異体を伴う、Ｅｎａ１Ｂの天然配列（配列番号８）のアライメントである：

さらに、図３４に示された通り、Ｅｎａタンパク質の、Ｅｎａスプリット変異体への操作もまた、インセルロにおいて、Ｓ型Ｅｎａ繊維をアセンブルすることを可能とした。スプリット変異体は、それぞれ、Ａｌａ３０において、したがって、そのＢＣループにおいて分割された（図１５を参照されたい）Ｅｎａ１Ｂ又は、代替的に、Ａｌａ１００において、したがって、そのＨＩループにおいて分割されたＥｎａ１Ｂの、Ｎ末端部分及びＣ末端部分をコードする構築物をもたらすことにより構築された。インセルロにおける、Ｅｎａ１Ｂの発現のために、かつて使用された構築物（すなわち、Ｎ末端６×Ｈｉｓ遮断剤を欠く、ｐＥＴ２８ａ：：Ｅｎａ１Ｂ）において、Ａｌａ３０における終止コドンに続き、前構築物の残基３１の前に、追加のリボソーム結合性部位（ＲＢＳ）及び新たなＡＴＧ開始コドンをクローニングすることにより、スプリットＢＣ構築物を作出した。インセルロにおけるＥｎａ１Ｂの発現のためにかつて使用された構築物（すなわち、Ｎ末端６×Ｈｉｓ遮断剤を欠く、ｐＥＴ２８ａ：：Ｅｎａ１Ｂ）において、Ａｌａ１００における終止コドンに続き、その前に追加のリボソーム結合性部位（ＲＢＳ）及び新たなＡＴＧ開始コドンをクローニングすることにより、スプリットＨＩ構築物を作出した。

こうして、Ｅｎａタンパク質サブユニットは、それらを、スプリットタンパク質としての組換え発現のために用意することにより、操作されたＥｎａサブユニットとして使用されうるが、この場合、本明細書において、少なくとも、２つのポリペプチドへのスプリットは、共発現時における、フォールドの補完及び後続における、ＥｎａＳ型繊維への自己アセンブリーを経ることが、やはり可能であることが示される。

［実施例１８］磁気ビーズ上におけるＥｎａ１ＢＳ型繊維のエピタキシャル成長
組換えにより作製された、単離６×Ｈｉｓ＿ＴＥＶ＿Ｅｎａ１Ｂ多量体を、連続的に振盪しながら、室温において、１倍濃度のＰＢＳ中、３時間にわたり、１００ｎｍＭａｌｅｉｍｉｄｅＳｕｐｅｒＭａｇＭａｇｎｅｔｉｃＢｅａｄｓ（Ｒａｙｂｉｏｔｅｃｈ）と共に共インキュベートし、１倍濃度のＰＢＳ中、３ラウンドにわたる洗浄にかけて、結合しなかった、任意の立体障害型Ｅｎａ１Ｂ多量体を除去した。次に、Ｅｎａ１Ｂ機能化磁気ビーズを、連続的に振盪しながら、室温において、１倍濃度のＰＢＳ中、１時間にわたり、ｒｅｃ＿６×Ｈｉｓ＿ＴＥＶ＿Ｅｎａ１Ｂ溶液及びＴＥＶプロテアーゼと共に共インキュベートし、１倍濃度のＰＢＳ中、３ラウンドにわたる洗浄にかけて、結合しなかった、任意のｒｅｃ＿６×Ｈｉｓ＿ＴＥＶ＿Ｅｎａ１Ｂ及びＴＥＶプロテアーゼを除去した。次に、３μｌの機能化ビーズ懸濁液を、ＴＥＭグリッドへと沈着させ、ｎｓＴＥＭ解析にかけ、磁気ビーズの表面へとテザリングされた。短いＳ型Ｅｎａ１Ｂ繊維の存在を明らかにした（図３５の右図パネル内の拡大図を参照されたい）。

［実施例１９］Ｓ型Ｅｎａ繊維による、表面の、非共有結合的機能化
１００ｍＭのトリスｐＨ７．０中、室温において、１時間にわたり、Ｂｉｏｔｉｎ－ｄＰＥＧ１１－ＭＡＬ（Ｓｉｇｍａ－Ａｌｄｒｉｃｈ）を使用して、組換えにより作製されたＥｎａ１ＢＳ型繊維を、ビオチニル化させ、ｍｉｌｉＱ水による、２ラウンドにわたる洗浄にかけて、結合しなかった、任意のＢｉｏｔｉｎ－ｄＰＥＧ１１－ＭＡＬを除去した。次に、ビオチニル化Ｅｎａ１ＢＳ型繊維を、ストレプトアビジンコーティング金ビーズ（直径１．２５μｍ）と共に共インキュベートし、ＴＥＭグリッドへと沈着させ、ｎｓＴＥＭ解析にかけた。記録された顕微鏡写真は、Ｓ型繊維による、金ビーズの機能化、すなわち、繊維の、ビーズ表面への、明確なテザリングの成功を裏付ける（図３６）。表面テザリングが、とりわけ、繊維先端部を介して生じるように、Ｂｉｏｔｉｎ－ｄＰＥＧ１１－ＭＡＬによる修飾を、Ｅｎａ繊維極においてアクセス可能な、不対システインへと方向付けた。

［実施例２０］部位指向突然変異誘発を介して、横方向に強化された、Ｅｎａネットワーク
Ｅｎａ１ＢＳ型繊維又はＥｎａ３ＡＬ型繊維の表面において、溶媒へと露出されたトレオニン残基を、繊維間ジスルフィド架橋の形成を介して、共有結合的な水平方向のアンカリング点として用いられるように、システインにより置換した。組換えにより作製されたタンパク質である、Ｅｎａ１ＢＴ３１Ｃ、Ｅｎａ３ＡＴ４０Ｃ及びＥｎａ３ＡＴ６９Ｃの各々は、Ｅ．コリ細胞質内において、良好に発現及び自己アセンブルした。Ｅｎａ繊維の抽出を、酸化条件下において実施して、Ｓ－Ｓの形成を容易とした。後続において得られた繊維画分についてのｎｓＴＥＭ解析は、Ｅｎａ３Ａの点突然変異体としてのＥｎａ１Ｂのいずれについても、高度に絡まり合った、Ｅｎａ繊維ネットワークの存在を明らかにした（図３７ｂ、３７ｃ、３７ｅ、３７ｆ）。Ｅｎａ１ＢＴ３１Ｃ繊維は、直径を変動させる、大型バンドルとして存在する（図３７ｂ）。単一のバンドルについての、高倍率のイメージングは、個々のＳ型繊維が、バンドル軸に沿って、並行的に配置された結果として、高度の引っ張り強度をもたらす可能性が高いことを解像した。このスケールの階層構造は、隣接するＥｎａ１ＢＴ３１ＣＳ型繊維間における、ジッパー様Ｓ－Ｓアセンブリー機構を示唆する。逆に、Ｅｎａ３ＡＴ４０Ｃ又はＥｎａ３ＡＴ６９ＣによるＬ型繊維単離物は、ランダムに配向したＬ型繊維から構成される。このようにして、Ｅｎａ繊維の、水平方向の架橋は、強化Ｅｎａロープ又は強化Ｅｎａバンドル、強化Ｅｎａハイドロゲル及び強化Ｅｎａ薄膜の形成（図３７）を結果としてもたらしうる。

［実施例２１］細菌Ｅｎａ自己アセンブルタンパク質の同定
本明細書に提示された観察及び解析に基づき、Ｅｎａタンパク質は、細菌ＤＵＦ３９９２タンパク質に属し、Ｎ末端の保存されたＣｙｓ含有モチーフを含有する、線毛形成タンパク質サブユニットの新規の細菌ファミリーとして同定される。第１に、細菌Ｅｎａタンパク質ファミリーメンバーの同定は、表１（又はＰＦＡＭデータベース：ｈｔｔｐｓ：／／ｐｆａｍ．ｘｆａｍ．ｏｒｇ／ｆａｍｉｌｙ／ＰＦ１３１５７＃ｔａｂｖｉｅｗ＝ｔａｂ４）において示された、ＰＦＡＭ１３１５７のＨＭＭプロファイルへの準拠についての解析が可能であり、Ｅｎａ１／Ｅｎａ２Ａタンパク質及びＥｎａ１／Ｅｎａ２Ｂタンパク質（図８Ｂを参照されたい）のための保存されたモチーフＺＸ_ｎＣＣＸ_ｍＣ［配列中、Ｚは、Ｌｅｕ、Ｉｌｅ、Ｖａｌ又はＰｈｅであり、ｎは、１又は２であり、ｍは、１０～１２の間である。］に対応する、又はＥｎａ３タンパク質（図２６を参照されたい）のための保存されたモチーフＺＸ_ｎＣ（Ｃ）Ｘ_ｍＣに対応する、本明細書に提示された、少なくとも１つの保存されたＣｙｓを含む、Ｎ末端接続部（Ｎｔｃ）を含有する、ＤＵＦ３９９２ドメインを含有するアミノ酸配列に基づく。

第２に、Ｅｎａタンパク質として分類されるタンパク質についての構造要件は、当技術分野において公知である、モデル化ツールへと提供された、そのアミノ酸配列だけに基づき得、本明細書に提示され、ＰＤＢ７Ａ０２が登録されたＰｒｏｔｅｉｎＤａｔａｂａｓｅ（Ｖｅｒｓｉｏｎ１．０（２０２０年８月６日に登録が申請され、２０２０年８月２４日に公開された））に寄託された、ｃｒｙｏ－ＥＭによるＥｎａ１Ｂの参照構造と比較され、（ｎ／１０）－４［式中、ｎは、アミノ酸数としての配列長である。］より高値のＺスコアは、高度に著しいフォールド類似性に対応すると考えられる（Ｈｏｌｍら、２００８；２４巻、２３号、２７８０～２７８１頁；ｄｏｉ：１０．１０９３／ｂｉｏｉｎｆｏｒｍａｔｉｃｓ／ｂｔｎ５０７）ので、予測されたフォールドの、フォールド類似性スコア、すなわち、ＤａｌｉによるＺスコアが６．５以上である参照構造と比較されうる、当技術分野において公知である、モデル化ツールへと供給された、そのアミノ酸配列だけに基づきうるその（予測）フォールドから、明確に導出可能である。代替的に、図２６に示された、フォールド類似性を決定するために、本明細書に提示された、ｃｒｙｏＥＭによるＥｎａ３の参照構造が使用される場合もある。

タンパク質フォールドのモデル化は、現在利用可能な供給源、例えば、Ｒｏｂｅｔｔａ（ｈｔｔｐｓ：／／ｒｏｂｅｔｔａ．ｂａｋｅｒｌａｂ．ｏｒｇ／）若しくはＡｌｐｈａＦｏｌｄｖ２．０（Ｊｕｍｐｅｒら、２０２１、Ｎａｔｕｒｅ；ｄｏｉ．ｏｒｇ／１０．１０３８／ｓ４１５８６－０２１－０３８１９－２）などを含むがこれらに限定されない、デノボ予測用ツールによりなされる場合もあり、利用可能なツール例えば、ＳＷＩＳＳ－ＭＯＤＥＬ（ｈｔｔｐｓ：／／ａｃａｄｅｍｉｃ．ｏｕｐ．ｃｏｍ／ｎａｒ／ａｒｔｉｃｌｅ／４６／Ｗ１／Ｗ２９６／５００００２４）、Ｐｈｙｒｅ２（ｈｔｔｐｓ：／／ｗｗｗ．ｎａｔｕｒｅ．ｃｏｍ／ａｒｔｉｃｌｅｓ／ｎｐｒｏｔ．２０１５．０５３）、ＲａｐｔｏｒＸ（ｈｔｔｐｓ：／／ｗｗｗ．ｎａｔｕｒｅ．ｃｏｍ／ａｒｔｉｃｌｅｓ／ｎｐｒｏｔ．２０１２．０８５）及び他のツールなどを含みうるがこれらに限定されない、相同性ベースのタンパク質モデル化によりなされる場合もある。

例えば、ＤＵＦ３９９２の分類及びＮ末端接続部の存在により特徴付けられた、多数の選択されたＥｎａ候補オーソログについての構造比較を、各構造（図３８に示された）について、各構造のＣα原子ｉと、参照構造（ＰＤＢ７Ａ０２として寄託された、又は本明細書の表２に提示された、Ｅｎａ１Ｂ（ＵｎｉＰｒｏｔ受託番号：Ａ０Ａ１Ｙ６Ａ６９５；本明細書において示された配列番号８に対応する）についてのｃｒｙｏＥＭモデル）の対応する原子Ｃαと間の、原子位置についての平均二乗偏差（ＲＭＳＤ）のほか、フォールド類似性スコア、すなわち、ＤａｌｉによるＺスコアをもたらすことにより実施した。（ｎ／１０）－４［式中、ｎは、アミノ酸数としての配列長である。］より高値のＺスコアは、高度に著しいフォールド類似性に対応すると考えられる。（Ｈｏｌｍら、２００８；２４巻、２３号、２７８０～２７８１頁；ｄｏｉ：１０．１０９３／ｂｉｏｉｎｆｏｒｍａｔｉｃｓ／ｂｔｎ５０７）。したがって、例えば、ｎ＝１１７である配列に基づくタンパク質について、これは、Ｚ＝７．６以上に対応し、大きなフォールド類似性をもたらす。配列である、ＷＰ＿０９８５０７３４５．１及びＷＰ＿０１７５６２３６７．１（ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｐｒｏｔｅｉｎ／）を含有する、ＤＵＦ３９９２ドメインについて、本発明者らは、ＡｌｐｈａＦｏｌｄｖ２．０により予測された推定構造を提示する。基準として、本発明者らはまた、本発明者らの参照構造であるＥｎａ１Ｂ（ＵｎｉＰｒｏｔ受託番号：Ａ０Ａ１Ｙ６Ａ６９５、配列番号８）についての、ＡｌｐｈａＦｏｌｄモデルも提示するが、これは、実験によるｃｒｙｏＥＭ構造と、ＡｌｐｈａＦｏｌｄモデル（ＲＭＳＤ＝０．６０５；Ｚ＝１２．４）との極めて良好な一致を裏付ける。これらの予測は、本発明者らの参照配列（Ｅｎａ１Ｂ、配列番号８）に対する２４．２％（ＷＰ＿０４１６３８３３８．１）という低値の配列同一性を有する細菌のＤＵＦ３９９２配列が、Ｎｔｃが存在する同じＥｎａフォールドを取りうることを示す。Ｅｎａ２Ａ（ＷＰ＿００１２７７５４０．１；配列番号１４５；２４．２％の同一性）について、本発明者らは、これが、実際に、Ｅｎａ多量体及びＳ型Ｅｎａ繊維を形成することを示した。こうして、Ｅｎａサブユニットは、ＨＭＭプロファイル検索（ＤＵＦ３９９２ドメインを含有するタンパク質についてのＨＭＭ行列に対応する表１に従う）、に続いて、デノボの構造予測及び本明細書において開示されたＥｎａ１Ｂ及びＥｎａ３ＡのｃｒｙｏＥＭ構造（それぞれ、図３８及び２６）との比較に基づき、明確に同定されうる。自己アセンブルＥｎａサブユニットは、Ｅｎａ１Ｂ（又はＥｎａ３Ａ）に照らした、ＤａｌｉによるＺスコアが６．５以上である８本のβ鎖による、Ｅｎａベータサンドウィッチフォールドを含有し、Ｅｎａ繊維内のジスルフィド媒介架橋のためのＺ－Ｘ_ｎ－Ｃ（Ｃ）－Ｘ_ｍ－Ｃ－Ｘモチーフを伴うＮ末端接続部ペプチド［配列中、Ｚは、Ｌｅｕ、Ｉｌｅ、Ｖａｌ又はＰｈｅであり、ｎは、１又は２残基であり、Ｃは、Ｃｙｓであり、（Ｃ）は、Ｅｎａ３分類のための、任意選択的な第２のＣｙｓであり、ｍは、１０～１２アミノ酸であり、Ｘは、任意のアミノ酸である。］を含有する。候補Ｅｎａサブユニットの自己アセンブリー及び繊維形成は、本明細書の「材料及び方法」において記載される通り、単離された繊維材料の、Ｅ．コリの細胞質内の組換え発現及び陰性染色透過電子視覚化により決定される。具体的に述べると、Ｓ型繊維を形成するＥｎａサブユニットは、本明細書において提示されたＥｎａ１Ｂ構造と比較したＺスコアが６．５以上である予測構造を伴い、配列番号１～１４又は２１～３７に示された、Ｅｎａ１／Ｅｎａ２Ａ及びＥｎａ１／Ｅｎａ２Ｂの配列のうちのいずれかに対する、少なくとも８０％の配列同一性を有し、Ｎｔｃ内のＺ－Ｘ_ｎ－Ｃ－Ｃ－Ｘ_ｍ－Ｃ－Ｘモチーフ［配列中、Ｚは、Ｌｅｕ、Ｉｌｅ、Ｖａｌ又はＰｈｅであり、ｎは、１又は２残基であり、Ｃは、Ｃｙｓであり、ｍは、１０～１２アミノ酸であり、Ｘは、任意のアミノ酸である。］を含有し、Ｃ末端におけるＧＸ_２／３ＣＸ_４Ｙモチーフ［配列中、Ｇ＝Ｇｌｙであり、Ｘ＝任意のアミノ酸であり、Ｃ＝Ｃｙｓであり、Ｙ＝Ｔｙｒである。］を含有する、ＤＵＦ３９９２ドメイン含有タンパク質として認識されうる。Ｓ型Ｅｎａ繊維は、陰性染色透過電子顕微鏡法により観察された場合に、繊維のヘリックスターンが、互い違いに、ジグザグに出現することにより、容易に認識される（図１ｃ）。具体的に述べると、Ｌ型繊維を形成するＥｎａサブユニットは、本明細書において提示されたＥｎａ３Ａ構造と比較したＺスコアが６．５以上である予測構造を伴い、配列番号４９～８０に示された、Ｅｎａ３の配列のうちのいずれかに対する、少なくとも８０％の配列同一性を有し、Ｎｔｃ内のＺ－Ｘ_ｎ－Ｃ－Ｘ_ｍ－Ｃ－Ｘモチーフ［配列中、Ｚは、Ｌｅｕ、Ｉｌｅ、Ｖａｌ又はＰｈｅであり、ｎは、１又は２残基であり、Ｃは、Ｃｙｓであり、ｍは、１０～１２アミノ酸であり、Ｘは、任意のアミノ酸である。］を含有し、Ｃ末端におけるＳ－Ｚ－Ｎ－Ｙ－Ｘ－Ｂモチーフ［配列中、Ｓ＝Ｓｅｒであり、Ｚは、Ｌｅｕ又はＩｌｅであり、Ｎ＝Ａｓｎ、Ｂは、Ｐｈｅ又はＴｙｒであり、Ｘ＝任意のアミノ酸である。］を含有する、ＤＵＦ３９９２ドメイン含有タンパク質として認識されうる。Ｌ型Ｅｎａ繊維は、陰性染色電子顕微鏡法により観察された場合に、繊維内の積み重ねリングが、ラダー様に出現することにより、容易に認識される（図１ｄ）。

材料及び方法
Ｂ．セレウスの培養及び付属物の抽出
Ｅｎａを抽出するために、Ｂ．セレウスＮＶＨ００７５－９５株を、血液寒天プレート上に播種し、３７℃において、３カ月間にわたりインキュベートした。成熟したら、芽胞を、再懸濁させ、ｍｉｌｉＱ水中において、３回にわたり洗浄した（４℃において、２４００×ｇの遠心分離）。次いで、多様な有機破砕物及び無機破砕物を除去するために、ペレットを、２０％のＮｙｃｏｄｅｎｚ（Ａｘｉｓ－Ｓｈｉｅｌｄ）中に再懸濁させ、勾配が、ｖ／ｖ比を１：１とする、４５％（ｗ／ｖ）のＮｙｃｏｄｅｎｚと、４７％（ｗ／ｖ）のＮｙｃｏｄｅｎｚとの混合物から構成された、Ｎｙｃｏｄｅｎｚによる密度勾配遠心分離にかけた。次いで、芽胞細胞だけから構成されるペレットを、それぞれ、０．１％のＳＤＳを含有する、１ＭのＮａＣｌ及びＴＥ緩衝液（５０ｍＭのトリス－ＨＣｌ；０．５ｍＭのＥＤＴＡ）により洗浄した。付属物を引き離すために、洗浄された芽胞を、氷上、２０ｋＨｚ±５０Ｈｚ及び５０ワット（ＶｉｂｒａＣｅｌｌＶＣ５０Ｔ；Ｓｏｎｉｃ＆ＭａｔｅｒｉａｌｓＩｎｃ．；Ｕ．Ｓ）において、３０秒間にわたり超音波処理するのに続き、４５００×ｇにおいて遠心分離し、付属物を、上清中に回収した。芽胞及び栄養母細胞の残余成分をさらに除去するために、ｎ－ヘキサンを添加し、ｖ／ｖ比を１：２とする上清中において、激しく混合した。次いで、混合物を放置して沈殿させて、水とヘキサンとの相分離を可能とした。次いで、付属物を含有するヘキサン画分を回収し、加圧空気下、５５℃において、１．５時間にわたり保持して、ヘキサンを蒸発させた。最後に、さらなるｃｒｙｏ－ＥＭ試料の調製のために、付属物を、ｍｉｌｉＱ水中に再懸濁させた。

Ｅｎａ１Ｂ付属物の組換え発現、精製及びインビトロにおけるアセンブリー
Ｅｎａ１Ｂは、Ｅ．コリ内の発現についてコドン最適化され、Ｔｗｉｓｔｂｉｏｓｃｉｅｎｃｅｓにおいて、合成され、ｐＥＴ２８ａ発現ベクターへとクローニングされた（配列番号８３）。Ｅｎａ１Ｂ上に、中間のＴＥＶプロテアーゼ切断部位（配列番号８９：ＥＮＬＹＦＱＧ）と共に、Ｎ末端６×ヒスチジンタグを有するように、インサートをデザインした。ファージ抵抗性である、ＮＥＢ製のＴ７ＥｘｐｒｅｓｓｌｙｓＹ／ＩｑＥ．ｃｏｌｉｓｔｒａｉｎ内において、大スケールの組換え発現を実行した。単一のコロニーを、２０ｍＬのＬＢへと接種し、初代培養のために、３７℃、１５０ｒｐｍにおいて振盪しながら、一晩にわたり増殖させた。翌朝、６ＬのＬＢに、２０ｍＬ／Ｌの初代培養物を接種し、３７℃において、振盪しながら、ＯＤ_６００が、０．８に達するまで、増殖させ、この後、１ｍＭのイソプロピルβ－Ｄ－１－チオガラクトピラノシド（ＩＰＴＧ）により、タンパク質の発現を誘導した。培養物を、３７℃において、さらに３時間にわたり、インキュベートし、５，０００ｒｐｍにおける遠心分離により採取した。全細胞ペレットを、可溶性の溶解緩衝液（２０ｍＭのリン酸カリウム、５００ｍＭのＮａＣｌ、１０ｍＭのβ－ＭＥ、２０ｍＭのイミダゾール、ｐＨ７．５）中に再懸濁させ、溶解のために、氷上において、超音波処理した。Ｂｅｃｋｍａｎｃｏｕｌｔｅｒ製のＪＡ－２０型ローター内における、４５分間にわたる１８，０００ｒｐｍの遠心分離により、可溶性画分と、不溶性画分とを分離するように、溶解物を遠心分離した。ペレットを、溶解緩衝液中に８Ｍの尿素から構成された変性溶解緩衝液中に、さらに溶解させた。次いで、溶解させたペレットを、ＮｉＳｅｐｈａｒｏｓｅを充填されたＨｉｓＴｒａｐＨＰカラムに通し、変性溶解緩衝液により平衡化させた。次いで、室温において、ＡＫＴＡ精製装置を使用して、勾配モード（２０～２５０ｍＭのイミダゾール）において、結合されたタンパク質を、溶出緩衝液（２０ｍＭのリン酸カリウム、ｐＨ７．５、８Ｍ尿素、２５０ｍＭのイミダゾール）により、カラムから溶出させた。Ｈａｍｐｔｏｎ製のｄｉａｌｙｓｉｓｂｕｔｔｏｎにより、変性条件下において、無傷Ｎ末端６×ＨＩＳタグにより組換え精製されたＥｎａ１Ｂを、可溶性溶解緩衝液との緩衝液交換にかけた。Ｎ末端Ｈｉｓタグは、２つの単量体の間の二重ジスルフィド架橋の形成を妨げ、Ｅｎａ１Ｂは、スパイラルへとアセンブルした（図８Ｅ）。フィラメントへの自己アセンブリーを容易とするために、Ｈｉｓタグを、ＴＥＶプロテアーゼにより切断した。変性条件下にある精製したＥｎａ１Ｂを、まず、２０ｍＭのＨｅｐｅｓ、ｐＨ７．０、５０ｍＭのＮａＣｌを含有する緩衝液により、一晩にわたり４℃において透析した。次いで、ＴＥＶプロテアーゼを、１００ｍＭのβＭＥと共に、等モル比において添加し、３７℃において、２時間にわたりインキュベートした。これは、Ｅｎａ１Ｂの、長型フィラメントへのアセンブリーをもたらした（図８Ｆ）。

エスケリキア・コリ（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）からの、インビボ／インセルロにおける組換えＥｎａ繊維の単離［図２０における通りのＳ型繊維；及び図２５における通りのＬ型繊維について、本明細書において例示された］
１リットルのＬＢ、５０μｇ／ｍｌのカナマイシンに、立体障害を伴わない（すなわち、例えば、インビトロにおけるアセンブリー法と比較して、ＨＩＳタグ－ＴＥＶ切断部位を伴わない）、２０ｍＬの、一晩にわたる前培養物Ｅ．コリＣ４３（ＤＥ３）ｐＥＴ２８ａによるＥｎａ１Ｂ又はＥｎａ３Ａを接種する。ロータリーシェーカー内、３７℃において、中期指数期（ＯＤ＝０．７～１．０）までインキュベートし、温度を、２５℃へと低下させ、最後に、１ｍＭのイソプロピルβ－Ｄ－１－チオガラクトピラノシドを添加する。１８時間にわたりインキュベートし、ＪＬＡ８．１型ローターを、５．０００ｒｃｆ及び４℃において使用して、細胞を採取する。プロペラ式の攪拌機を装備したオーバーヘッドスターラーを、２０００ｒｐｍにおいて使用して、細胞ペレットを、１倍濃度のＰＢＳ、１％（ｗ／ｖ）のドデシル硫酸ナトリウム（ＳＤＳ）中に再懸濁させる。細胞スラリーを、９９℃へと設定された磁気ホットプレート上において、磁気スターラーバーにより連続的に攪拌しながら、３０分間にわたりインキュベートする。ホモジナイズされた溶解物を、５０ｍｌのファルコンチューブへと移し、ＪＬＡ１４．５型ローター内、２０℃、２０．０００ｒｃｆにおいて、３０分間にわたり遠心分離する。上清を廃棄し、ラジアルセレーションを伴う、Ｐｏｔｔｅｒ－Ｅｌｖｅｈｊｅｍ組織グラインダーを使用して、ペレットを、１倍濃度のＰＢＳ中に再懸濁させ、ホモジネートを、２０．０００ｒｃｆにおいて、３０分間にわたり遠心分離する。上清を廃棄し、ペレットを、ｍｉｌｉＱ中に再懸濁させ、２０．０００ｒｃｆにおいて、３０分間わたり遠心分離する。所望の最終濃度に到達ように、清明化したＥｎａペレットを、ｍｉｌｉＱ中に再溶解させた。

その頑健性について調べるための、Ｅｎａ処理実験
Ｂ．セレウスＮＶＨ００７５－９５株（上記を参照されたい）から、エクスビボにおいて抽出されたＥｎａを、脱塩水中に再懸濁させ、１２１℃において、２０分間にわたりオートクレーブ処理して、残りの細菌又は芽胞の不活性化を確保し、緩衝液による処理又は下記に表示の処理及び図７に示された処理にかけた。多様な処理時における、Ｅｎａの完全性を決定するために、陰性染色ＴＥＭを使用して、試料をイメージングし、Ｅｎａを枠付けし、下記において記載される、二次元クラス分けにかけた。プロテアーゼに対する抵抗性について調べるために、エクスビボにおけるＥｎａを、３７℃において、４時間にわたり、１ｍｇ／ｍＬの使用準備済みプロテイナーゼＫによる消化（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）にかけ、ＴＥＭによりイメージングした。乾燥処理の、付属物に対する効果について実験するために、２ｋｒｐｍの速度において、２時間にわたり作動させた、ＳａｖａｎｔＤＮＡ１２０ＳｐｅｅｄｖａｃＣｏｎｃｅｎｔｒａｔｏｒ（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）を使用して、エクスビボにおけるＥｎａを、４３℃において真空乾燥させた。

陰性染色透過電子顕微鏡法（ＴＥＭ）
ＮＳ－ＴＥＭによる、芽胞及び組換え発現付属物の視覚化のために、ＥＬＭＯグロー放電器内、真空において、４ｍＡのプラズマ電流により、４５秒間にわたり、ＥｌｅｃｔｒｏｎＭｉｃｒｏｓｃｏｐｙＳｃｉｅｎｃｅｓ製の４００孔メッシュを伴う、フォルムバール／カーボンコーティング銅グリッドに放電した。３μＬの試料を、グリッド上に適用し、１分間にわたり、支持膜に結合させ、この後、Ｗｈａｔｍａｎ製のグレード１の濾紙により、過剰量の液体を拭き取った。次いで、１５μＬずつ３滴のｍｉｌｉＱを使用して、グリッドを、３回にわたり洗浄するのに続き、過剰量の液体を拭き取った。洗浄されたグリッドを、２％の酢酸ウラニルの液滴１５μＬ中、１０秒間、２秒間及び１分間ずつの長さの持続時間により、３回にわたり保持し、各浸漬の間に拭き取るステップを行った。最後に、乾燥するまで、酢酸ウラニルコーティンググリッドを拭き取った。次いで、ＬａＢ６フィラメント及びＴＶＩＰＳＦ４１６ＣＣＤカメラを装備した、１２０ｋＶＪＥＯＬ１４００顕微鏡を使用して、グリッドをスクリーニングした。後出において記載される通り、ＲＥＬＩＯＮ３．０により、付属物の二次元クラスを生成した。

ｃｒｙｏ－ＴＥＭグリッドの調製及びｃｒｙｏ－ＥＭデータの収集
まず、真空中において、５ｍＡのプラズマ電流を、１分間にわたり使用して、間隔を１μｍとする、２μｍの小孔を伴う、ＱＵＡＮＴＩＦＯＩＬ（登録商標）ｈｏｌｅｙＣｕ４００メッシュグリッドに、グロー放電した。０．６ｍｇ／ｍＬ酸化グラフェン（ＧＯ）溶液３μＬを、グリッドへと適用し、吸収のために、室温において、１分間にわたりインキュベートした。次いで、Ｗｈａｔｍａｎ製のグレード１の濾紙を使用して、過剰量のＧＯを拭き取り、放置して乾燥させた。クライオプランジングのために、ＧａｔａｎＣＰ３クライオプランジャー内、湿度を１００％とし、室温において、３μＬのタンパク質試料を、ＧＯコーティンググリッドに適用した。１分間にわたる吸収の後、Ｗｈａｔｍａｎ製のグレード２の濾紙により、５秒間にわたり、両面から、機械的に拭き取り、１８０℃において、液体エタンへと、凍結プランジングする。次いで、グリッドを、データ収集まで、液体窒素中において保管した。エクスビボ付属物及びｒｅｃＥｎａ１Ｂ付属物について、２つのデータセットを収集したところ、収集パラメータの変化は、僅少であった。高分解能ｃｒｙｏ－ＥＭによる二次元顕微鏡写真による動画を、カウンティングモードのＳｅｒｉａｌＥＭにより自動化された、ＪＥＯＬＣｒｙｏａｒｍ３００顕微鏡上に記録した。エクスビボにおいて増殖させた付属物のために、顕微鏡に、Ｋ２ｓｕｍｍｉｔ検出器を装備し、以下の通り：３００ｋｅＶ、開口部１００ｍｍ、フレーム数３０、１Å^２当たりの電子６２．５個において、２．３１５秒間の露出とし、ピクセル１つ当たり０．８２Åに設定した。ｒｅｃＥｎａ１Ｂデータセットのために、代わりに、ピクセルサイズを、ピクセル１つ当たり０．７８２Åとし、露出を、１Å^２当たりの電子６４．６６個とし、６１フレームにわたり撮影する、Ｋ３検出器を使用した。

画像処理
ＲＥＬＩＯＮ３．０（Ｚｉｖａｎｏｖら、２０１８）に実装された、ＭＯＴＩＯＮＣＯＲＲ２（Ｚｈｅｎｇら、２０１７）を使用して、ビーム誘導性画像動作について補正し、平均二次元顕微鏡写真を生成した。ＲＥＬＩＯＮ３．０に組み込まれた、ＣＴＦＦＩＮＤ４．２（Ｒｏｈｏｕ及びＧｒｉｇｏｒｉｅｆｆ、２０１５）を使用して、画像動について補正された顕微鏡写真を使用して、ＣＴＦパラメータを推定した。後続の処理は、ＲＥＬＩＯＮ３．０及びＳＰＲＩＮＧ（Ｄｅｓｆｏｓｓｅｓら、２０１４）を使用した。いずれのデータセットについても、ＥＭＡＮ２パッケージによる、ｅ２ｈｅｌｉｘｂｏｘｅｒ（Ｔａｎｇら、２００７）を使用して、手作業により、付属物の座標を枠付けした。良好な氷及びＥｎａフィラメントの直線状の連なりを伴う顕微鏡写真を選択するように、特に注意を払った。フィラメントを、枠間距離を２１Åとする、寸法３００×３００ピクセルの、重複単粒子枠へとセグメント化した。エクスビボにおけるＥｎａについて、顕微鏡写真１枚当たり平均２～３本の長型フィラメントを伴う、５８０枚の顕微鏡写真から、合計５３，５０１のヘリックス断片を抽出した。ｒｅｃＥｎａ１Ｂフィラメントについて、顕微鏡写真１枚当たり平均４～５本のフィラメントを伴う、３，０００枚の顕微鏡写真から、合計１００，４９５のヘリックス断片を抽出した。不良粒子にフィルターをかけるために、ＲＥＬＩＯＮ３．０において、複数ラウンドにわたる二次元クラス分けを行った。数ラウンドにわたるフィルタリングの後、エクスビボ付属物及びｒｅｃＥｎａ１Ｂ付属物のうち、それぞれ、４２，８２２及び６５，４６６個の良好な粒子によるデータセットを選択した。

約５０回にわたる、二次元クラス分けの反復の後、分解能良好な二次元クラス平均像を得ることができた。ＳＰＲＩＮＧパッケージのｓｅｇｃｌａｓｓｅｘａｍ（Ｄｅｓｆｏｓｓｅｓら、２０１４）を使用して、二次元クラス平均像についての、Ｂ因子増強型パワースペクトルを生成した。生成されたパワースペクトルは、分解能良好な層線により、シグナル対ノイズ比を増幅していた（図２Ｂ）。粗ヘリックスパラメータを推定するために、ＳＰＲＩＮＧにおけるｓｅｇｃｌａｓｓｌａｙｅｒオプションを使用して、層線内のピークの座標及び位相を測定した。測定された距離及び位相に基づき、可能なベッセル次数のセットを推定し、この後、計算されたヘリックスパラメータを、ＲＥＬＩＯＮ（Ｈｅ及びＳｃｈｅｒｅｓ、２０１７）における、ヘリックス再構築手順において使用した。ｒｅｌｉｏｎ＿ｈｅｌｉｘ＿ｔｏｏｌｂｏｘを使用して、直径を１１０Åとする、特徴のない円筒を生成し、三次元クラス分けのための初期モデルとして使用した。フーリエ－ベッセル指数化から推定されたインプットのライズ及びツイストを、被験出発値間のサンプリング分解能を、０．１Å及び１度として、それぞれ、３．０５～３．６５Å及び２９～３５度の範囲において変動させた。このようにして、良好な接続性及び認識可能な二次構造を伴う電位マップが得られるまで、数ラウンドにわたる三次元クラス分けを行った。三次元クラス分け試行から生成された、２５Åローパスフィルタリングマップを取り出し、三次元クラス分けからのアウトプット変換情報を使用して、粒子を再抽出し、三次元精緻化を行った。ＥＭのマップの分解能を改善するために、複数ラウンドにわたる三次元精緻化を行った。分解能を、さらに改善するために、ＲＥＬＩＯＮにおいて、ベイズポリッシングを実施した。最後に、ｍａｓｋｃｒｅａｔｅにより、ヘリックスのｚ軸のうちの、中央の５０％を覆う、溶媒マスクを生成し、ポストプロセシングのために使用し、ＲＥＬＩＯＮにおいて、ソルベントフラットニングされたフーリエシェル相関（ＦＳＣ）曲線を計算した。２ラウンドにわたるポリッシングの後、ゴールドスタンダードである、ＦＳＣ_{０．１４３}基準のほか、ＲＥＬＩＯＮにおいて計算された局所分解能に従い、分解能を３．２Åとするマップを得た（図９Ａ）。

モデルの構築
非対称ユニットの接続性を改善するために、ＰＨＥＮＩＸ（Ａｆｏｎｉｎｅら、２０１８）に実装された、ｃｒｙｏ－ＥＭ用密度改変ツールを使用した。まず、Ｃｏｏｔ（Ｅｍｓｌｅｙら、２０１０）により、密度改変マップから、単一の非対称的サブユニットのための一次骨格を生成した。Ｅｎａ１Ｂの一次配列を、非対称的ユニットへと、手作業によりスレッディングし、残基の化学的特性について検討するマップへと当てはめた。ｃｏｏｔにおけるＳＳＭＳｕｐｅｒｐｏｓｅオプションを使用して、単一のサブユニットから、ヘリックスを構築した。次いで、構築されたモデルを、Ｐｈｅｎｉｘにおける、複数ラウンドの実空間構造的精緻化にかけ、どの精緻化ラウンドの後においても、各残基を、手作業により精査した。モデルの検証は、Ｐｈｅｎｉｘに実装されたＲｅｆｍａｃにおいて行った。全ての図のための視覚化及び画像は、ＣｈｉｍｅｒａＸ（Ｇｏｄｄａｒｄら、２０１８）、Ｃｈｉｍｅｒａ（Ｐｅｔｔｅｒｓｅｎら、２００４）、Ｐｙｍｏｌにより生成した。

Ｅｎａの免疫染色
ウサギ免疫化（２８日間のＳｕｐｅｒＦａｓｔ免疫化スケジュール；Ａ０５５）のために、精製ＲｅｃＥｎａ１Ａ、精製ＲｅｃＥｎａ１Ｂ及び精製ＲｅｃＥｎａ１Ｃのアリコートを、ＤａｖｉｄｓＢｉｏｔｅｃｈｎｏｌｏｇｉｅＧｍｂＨ（Ｇｅｒｍａｎｙ）へと送付した。１カ月後に、血清を受け取り、さらなるアフィニティー精製を伴わずに使用した。免疫染色ＥＭイメージングのために、精製エクスビボＥｎａの３μｌアリコートを、フォルムバール／カーボングリッド（Ｃｕ製の４００メッシュ；ＥｌｅｃｔｒｏｎＭｉｃｒｏｓｃｏｐｙＳｃｉｅｎｃｅｓ）上に沈着させ、１倍濃度のＰＢＳにより洗浄し、１倍濃度のＰＢＳ中の０．５％（ｗ／ｖ）のＢＳＡと共に、１時間にわたりインキュベートした。１倍濃度のＰＢＳによる、さらなる洗浄の後、個々のグリッドを、それぞれ、抗Ｅｎａ１Ａ血清、抗Ｅｎａ１Ｂ血清及び抗Ｅｎａ１Ｃ血清の、１倍濃度のＰＢＳ中の、１０００倍希釈液と共に、３７℃において、２時間にわたりインキュベートした。１倍濃度のＰＢＳによる洗浄の後、グリッドを、３７℃において、１時間にわたり、ヤギにおいて産生された、１０ｎｍ金標識化抗ウサギＩｇＧの２０００倍希釈液及びアフィニティー単離された抗体（Ｇ７２７７－４ＭＬ；Ｓｉｇｍａ－Ａｌｄｒｉｃｈ）と共にインキュベートした。

定量的ＲＴ－ＰＣＲ
定量的ＲＴ－ＰＣＲ実験を、接種の４、８、１２及び１６時間後において、３つの独立のＢａｃｔｏ培地培養物（３７℃、１５０ｒｐｍ）から採取されたＢ．セレウス培養物から単離されたｍＲＮＡに対して実施した。ＲＮＡの抽出、ｃＤＮＡの合成及びＲＴ－ｑＰＣＲ解析は、かつて本質的に記載された通り（Ｍａｄｓｌｉｅｎら、２０１４）に実施したが、以下の変化：あらかじめ加熱された（６５℃）ＴＲＩｚｏｌ試薬（Ｉｎｖｉｔｒｏｇｅｎ）及びそれらの間の氷上における冷却を伴う、Ｍｉｎｉ－ＢｅａｄＢｅａｔｅｒ－８（ＢｉｏＳｐｅｃ）における、２分間ずつ４回にわたるビーズビーティングを伴った。ＲＮＡ試料の各ＲＴ－ｑＰＣＲは、３連において実施し、陰性対照は鋳型を追加せず、ｒｐｏＢは、内部対照として使用した。各プライマー対についての、検量線の傾き及びＰＣＲ効率（Ｅ）は、系列希釈液のｃＤＮＡ鋳型を増幅することにより推定した。ｍＲＮＡ転写物レベルの定量のために、Ｅ^－Ｃｔ項を使用して、同じ各ＲＴ－ｑＰＣＲ反応物中の試料に由来する、標的遺伝子及び内部対照遺伝子（ｒｐｏＢ）のＣｔ（閾値サイクル）値を、まず変換した。次いで、それらの変換Ｃｔ値を、内部対照遺伝子について得られた、対応する値により除することにより、標的遺伝子の発現レベルを正規化した（Ｄｕｏｄｕら、２０１０；Ｍａｄｓｌｉｅｎら、２０１４；Ｐｆａｆｆｌ、２００１）。以下の条件：２分間にわたり５０℃、２分間にわたり９５℃、９５℃において１５秒間、６０℃において１分間及び９５℃において１５秒間の４０サイクルにより、ＳｔｅｐＯｎｅＰＣＲｓｏｆｔｗａｒｅＶ．２．０（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍ）を使用することにより、増幅を行った。ＲＴ－ｑＰＣＲ解析のために使用された、全てのプライマーを、表２に列挙する。ｃＤＮＡ上において、常套的なＰＣＲ反応を実施して、ＥｎａＡ及びＥｎａＢが、以下のプログラム：９５℃において２分間、９５℃において３０秒間、５４℃において３０秒間及び７２℃において１分間の３０サイクルを使用する、ＥｐｐｅｎｄｏｒｆＭａｓｔｅｒｃｙｃｌｅｒにおいて、増幅される、プライマーである、２１８０／２１７７及び２１７６／２１７５並びにＤｒｅａｍＴａｑＤＮＡポリメラーゼ（ＴｈｅｒｍｏＦｉｓｈｅｒ）を使用するオペロンとして発現されることを確認した。

欠失突然変異体の構築
Ｂ．セレウスＮＶＨ００７５／９５株を、遺伝子欠失突然変異体のバックグラウンドとして使用した。マーカーレスの遺伝子置換え法（Ｊａｎｅｓ及びＳｔｉｂｉｔｚ、２００６）を、微細な修飾と共に使用して、インフレームにおいて、リーディングフレームを、ＡＴＧＴＡＡ（５’－３’）により置換えることにより、Ｅｎａ１Ｂ遺伝子を欠失させた。Ｂ．セレウスＮＶＨ００７５／９５株の、ΔＥｎａ１Ｂバックグラウンドにおける、Ｅｎａ１Ｃの欠失により、ΔＥｎａ１Ｂ ΔＥｎａ１Ｃ二重突然変異体を構築した。欠失突然変異体領域を創出するために、標的Ｅｎａ遺伝子の上流（プライマーＡ及びＢ、表２）及び下流（プライマーＣ及びＤ、表２）を、ＰＣＲにより増幅した。ＰＣＲ断片のアセンブリーを可能とするために、プライマーＢ及びＣは、相補性の重複配列を含有した。次いで、鋳型としての、上流及び下流におけるＰＣＲ断片並びにＡプライマー対及びＤプライマー対を使用して、さらなるＰＣＲステップを実施した（表２）。全てのＰＣＲ反応は、製造元の指示書に従い、ＥｐｐｅｎｄｏｒｆＭａｓｔｅｒｃｙｃｌｅｒ勾配及びＨｉｇｈｆｉｄｅｌｉｔｙＡｃｃｕＰｒｉｍｅＴａｑＤＮＡＰｏｌｙｍｅｒａｓｅ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を使用して行った。かつて記載された（Ｌｉｎｄｂａｃｋら、２０１２）通りに、最終的な単位複製配列を、さらなるＩ－ＳｃｅＩ部位を含有する、熱感受性シャトルベクターであるｐＭＡＤ（Ａｒｎａｕｄら、２００４）へとクローニングした。ｐＭＡＤ－Ｉ－ＳｃｅＩプラスミド構築物にＯｎｅＳｈｏｔ（商標）ＩＮＶ１１０Ｅ．ｃｏｌｉ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を通過させて、Ｂ．セレウスにおける形質転換効率を増強するように、非メチル化ＤＮＡを達成した。電気穿孔（Ｍａｈｉｌｌｏｎら、１９８９）により、非メチル化プラスミドを、Ｂ．セレウスＮＶＨ００７５／９５株へと導入した。ＰＣＲによる、形質転換体の検証の後、電気穿孔により、Ｉ－ＳｃｅＩ酵素についての遺伝子を含有するプラスミドｐＢＫＪ２３３（非メチル化）を、形質転換株へと導入した。Ｉ－ＳｃｅＩ酵素は、染色体に組み込まれたプラスミド内に、二本鎖ＤＮＡ切断を施す。その後、相同組換えイベントは、組み込まれたプラスミドの切出しをもたらす結果として、所望される遺伝子の置換えをもたらす。遺伝子欠失は、プライマーＡ及びプライマーＤ（表２）を使用するＰＣＲ増幅並びにＤＮＡシーケンシング（ＥｕｒｏｆｉｎｓＧｅｎｏｍｉｃｓ）により検証した。

Ｅｎａ１のオーソログ及びホモログについての検索
バチルス属ｓ．ｌ．群に属する種の公開ゲノムを、ＮＣＢＩＲｅｆＳｅｑデータベース（ｎ＝７３５、ＮＣＢ（ｈｔｔｐｓ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｒｅｆｓｅｑ／）からダウンロードした。表現型特徴のために、特に対象となる株（ＧＣＡ＿０００１７１０３５．２＿ＡＳＭ１７１０３ｖ２、ＧＣＡ＿００２９５２８１５．１＿ＡＳＭ２９５２８１ｖ１、ＧＣＦ＿０００２９０９９５．１＿Ｂａｃｉ＿ｃｅｒｅ＿ＡＮＤ１４０７＿Ｇ１３１７５）及びそのクローズドゲノムが、非存在である、又は極めて希少である種を除き、組み入れられた全てのアセンブリーは、ＮＣＢＩＲｅｆＳｅｑのキュレーションデータベースに由来する、クローズドゲノム及び公開ゲノムであった。アセンブリーは、ＱＵＡＳＴ（Ｇｕｒｅｖｉｃｈら、２０１３）を使用して品質点検し、適正なサイズ（約４．９～６Ｍｂ）及びＧＣ含量を約３５％とするゲノムだけを、下流における解析に組み入れた。対応のあるｔＢＬＡＳＴｎ検索を、実施して（ｅ値を１×１０^－１０とし、ｍａｘ＿ｈｓｐｒを１とする、デフォルト条件による）、以下のＮＶＨ００７５－９５株に由来するクエリータンパク質配列：Ｅｎａ１Ａ（配列番号１）、Ｅｎａ１Ｂ（配列番号８７）、Ｅｎａ１Ｃ（配列番号１５）の、ホモログ及びオーソログについて検索した。クエリーとして使用されたＥｎａ１Ｂタンパク質配列（配列番号８７）が、社内における単位複製配列のシーケンシング産物に由来したのに対し、Ｅｎａ１Ａ及びＥｎａ１Ｃのタンパク質配列のクエリーは、ＮＶＨ００７５－９５株のためのアセンブリー（受託番号：ＧＣＦ＿００１０４４８２５．１；それぞれタンパク質ＫＭＰ９１６９７．１及びＫＭＰ９１６９９．１）に由来した。本発明者らは、対象タンパク質が、クエリータンパク質に、高カバレッジ（＞７０％）及び中程度の配列同一性（＞３０％）によりによりマッチした場合に、タンパク質のオーソログ又はホモログであると考えた。

Ｅｎａの遺伝子及びタンパク質についての比較ゲノミクス
アライメントされたＥｎａ１Ａ－Ｅｎａ１Ｃタンパク質の系統樹は、ｔＢＬＡＳＴｎ検索から結果として得られる、全てのヒットについて、ＦａｓｔＴｒｅｅ（Ｐｒｉｃｅら、２０１０）（デフォルト条件）による近似的最大尤度を使用して構築した。アミノ酸配列は、ｍａｆｆｔｖ．７．３１０（Ｋａｔｏｈら、２０１９）を使用してアライメントし、ＪＴＴ＋ＣＡＴモデル（Ｐｒｉｃｅら、２０１０）を使用する、ＦａｓｔＴｒｅｅを使用して、タンパク質アライメントについての、近似的最大尤度系統樹を作成した。全ての系統樹は、Ｍｉｃｒｏｒｅａｃｔ（Ａｒｇｉｍｏｎら、２０１６）において視覚化し、Ｅｎａ１Ａ－Ｅｎａ１Ｃ及びＥｎａ２Ａ－Ｅｎａ２Ｃについて、種並びに存在及び非存在についてのメタデータを、図に重ね合わせた。

配列表
＞配列番号１：バチルス・セレウスＮＶＨ００７５－９５３８３株芽胞付属物（Ｅｎａ）１Ａのアミノ酸配列（ＧｅｎＢａｎｋタンパク質受託番号：ＫＭＰ９１６９７．１；１２６アミノ酸）
＞配列番号２：ＧＣＦ＿００７６７３６５５．１＿Ｅｎａ１Ａ（１２５アミノ酸；Ｂ．ミコイデス）（ＮＣＢＩデータベース上の通り）
＞配列番号３：ＧＣＦ＿００２２５１００５．２＿Ｅｎａ１Ａ（１２６アミノ酸；Ｂ．シトトキシクス）
＞配列番号４：ＧＣＦ＿００１８８４１０５．１＿Ｅｎａ１Ａ（１２５アミノ酸；Ｂ．ルティー）
＞配列番号５：ＧＣＡ＿０００１７１０３５．２＿Ｅｎａ１Ａ（１２６アミノ酸；Ｂ．セレウス）
＞配列番号６：ＧＣＦ＿００７６８２４０５．１＿Ｅｎａ１Ａ（１２６アミノ酸；Ｂ．トロピクス）
＞配列番号７：ＧＣＦ＿００２５７２３２５．１＿Ｅｎａ１Ａ（１２６アミノ酸；Ｂ．ヴィートマニイ）
＞配列番号８：バチルス・セレウスＮＶＨ００７５－９５３８３株芽胞付属物（Ｅｎａ）１Ｂのアミノ酸配列（ＧｅｎＢａｎｋタンパク質受託番号：ＫＭＰ９１６９８．１；１１７アミノ酸）
＞配列番号９：ＧＣＦ＿０００１６１２５５．１＿Ｅｎａ１Ｂ（１２０アミノ酸；Ｂ．セレウス）
＞配列番号１０：ＧＣＦ＿９０００９５６５５．１＿Ｅｎａ１Ｂ（１１６アミノ酸；Ｂ．シトトキシクス）
＞配列番号１１：ＧＣＡ＿０００１７１０３５．２＿Ｅｎａ１Ｂ（１１７アミノ酸；Ｂ．セレウス）
＞配列番号１２：ＧＣＦ＿００２５７２３２５．１＿Ｅｎａ１Ｂ（１１７アミノ酸；Ｂ．ヴィートマニイ）
＞配列番号１３：ＧＣＦ＿００１８８４１０５．１＿Ｅｎａ１Ｂ（１１７アミノ酸；Ｂ．ルティー）
＞配列番号１４：ＧＣＦ＿００７６８２４０５．１＿Ｅｎａ１Ｂ（１１７アミノ酸；Ｂ．トロピクス）
＞配列番号１５：バチルス・セレウスＮＶＨ００７５－９５３８３株芽胞付属物（Ｅｎａ）１Ｃのアミノ酸配列（ＧｅｎＢａｎｋタンパク質受託番号：ＫＭＰ９１６９９．１；１５５アミノ酸）
＞配列番号１６：ＧＣＦ＿９０００９４９１５．１＿Ｅｎａ１Ｃ（１５０アミノ酸；Ｂ．シトトキシクス）
＞配列番号１７：ＧＣＦ＿０００７８９３１５．１＿Ｅｎａ１Ｃ（１５５アミノ酸；Ｂ．セレウス）
＞配列番号１８：ＧＣＦ＿００１０４４７４５．１＿Ｅｎａ１Ｃ（１５５アミノ酸；Ｂ．ヴィートマニイ）
＞配列番号１９：ＧＣＦ＿００２５６８９２５．１＿Ｅｎａ１Ｃ（１５５アミノ酸；Ｂ．ヴィートマニイ）
＞配列番号２０：ＧＣＦ＿００１８８４１０５．１＿Ｅｎａ１Ｃ（１５５アミノ酸；Ｂ．ルティー）
＞配列番号２１：バチルス・シトトキシクスＮＶＨ３９１－９８株芽胞付属物（Ｅｎａ）２Ａのアミノ酸配列（ＧｅｎＢａｎｋタンパク質受託番号：ＡＢＳ２１００９．１；１２６アミノ酸）
＞配列番号２２：ＧＣＦ＿００２５５５３０５．１＿Ｅｎａ２Ａ（１２２アミノ酸；Ｂ．ヴィートマニイ）
＞配列番号２３：ＧＣＦ＿０００７１２５９５．１＿Ｅｎａ２Ａ（１１９アミノ酸；Ｂ．マンリポネンシス（Ｂ．ｍａｎｌｉｐｏｎｅｎｓｉｓ））
＞配列番号２４：ＧＣＦ＿０００００８００５．１＿Ｅｎａ２Ａ（１２２アミノ酸；Ｂ．セレウス）
＞配列番号２５：ＧＣＦ＿０００１６１２７５．１＿Ｅｎａ２Ａ（１２２アミノ酸；Ｂ．セレウス）
＞配列番号２６：ＧＣＦ＿０００００７８４５．１＿Ｅｎａ２Ａ（１２２アミノ酸；Ｂ．アントラーキス）
＞配列番号２７：ＧＣＦ＿００２５８９１９５．１＿Ｅｎａ２Ａ（１２２アミノ酸；Ｂ．トヨネンシス）
＞配列番号２８：ＧＣＦ＿０００２９０６９５．１＿Ｅｎａ２Ａ（１２２アミノ酸；Ｂ．ミコイデス）
＞配列番号２９：バチルス・シトトキシクスＮＶＨ３９１－９８株芽胞付属物（Ｅｎａ）２Ｂのアミノ酸配列（ＧｅｎＢａｎｋタンパク質受託番号：ＡＢＳ２１０１０．１；１１７アミノ酸）
＞配列番号３０：ＧＣＦ＿００２５５５３０５．１＿Ｅｎａ２Ｂ（１１３アミノ酸；Ｂ．ヴィートマニイ）
＞配列番号３１：ＧＣＦ＿０００７１２５９５．１＿Ｅｎａ２Ｂ（１１４アミノ酸；Ｂ．マンリポネンシス）
＞配列番号３２：ＧＣＦ＿０００００８００５．１＿Ｅｎａ２Ｂ（１１２アミノ酸；Ｂ．セレウス）
＞配列番号３３：ＧＣＦ＿０００８０３６６５．１＿Ｅｎａ２Ｂ（１１０アミノ酸；Ｂ．チューリンギエンシス）
＞配列番号３４：ＧＣＦ＿００４０２３３７５．１＿Ｅｎａ２Ｂ（１１１アミノ酸；Ｂ．ミコイデス）
＞配列番号３５：ＧＣＦ＿０００７４２８７５．１＿Ｅｎａ２Ｂ（１１４アミノ酸；Ｂ．アントラーキス）
＞配列番号３６：ＧＣＦ＿００２５８９６０５．１＿Ｅｎａ２Ｂ（１１４アミノ酸；Ｂ．トヨネンシス）
＞配列番号３７：ＧＣＦ＿９０００９５００５．１＿Ｅｎａ２Ｂ（１１４アミノ酸；Ｂ．ミコイデス）
＞配列番号３８：バチルス・シトトキシクスＮＶＨ３９１－９８株芽胞付属物（Ｅｎａ）２Ｃのアミノ酸配列（ＧｅｎＢａｎｋタンパク質受託番号：ＡＢＳ２１０１１．１；１５０アミノ酸）
＞配列番号３９：ＧＣＦ＿０００３３８７５５．１＿Ｅｎａ２Ｃ（１３５；Ｂ．チューリンギエンシス）
＞配列番号４０：ＧＣＦ＿００３３８６７７５．１＿Ｅｎａ２Ｃ（１３５；Ｂ．ミコイデス）
＞配列番号４１：ＧＣＦ＿００２５７８９７５．１＿Ｅｎａ２Ｃ（１３５；Ｂ．ヴィートマニイ）
＞配列番号４２：ＧＣＦ＿００６３４９５９５．１＿Ｅｎａ２Ｃ（１３５；Ｂ．パシフィクス）
＞配列番号４３：ＧＣＦ＿００１４５５３４５．１＿Ｅｎａ２Ｃ（１３４；Ｂ．チューリンギエンシス）
＞配列番号４４：ＧＣＦ＿００４０２３３７５．１＿Ｅｎａ２Ｃ（１４４；Ｂ．ミコイデス）
＞配列番号４５：ＧＣＦ＿００３２２７９５５．１＿Ｅｎａ２Ｃ（１３６；Ｂ．アントラーキス）
＞配列番号４６：ＧＣＦ＿００１３１７５２５．１＿Ｅｎａ２Ｃ（１３６；Ｂ．ヴィートマニイ）
＞配列番号４７：ＧＣＦ＿０００７１２５９５．１＿Ｅｎａ２Ｃ（１４５；Ｂ．マンリポネンシス）
＞配列番号４８：ＧＣＦ＿００７６７３６５５．１＿Ｅｎａ２Ｃ（１３９；Ｂ．ミコイデス）
＞配列番号４９：バチルス属（複数種：バチルス・セレウスＡＴＣＣ１０９８７－ＧＣＦ＿０００００８００５．１株）芽胞付属物（Ｅｎａ）３Ａのアミノ酸配列（ＷＰ＿０１７５６２３６７．１；１１３アミノ酸）
＞配列番号５０：ＷＰ＿１５７２９３１５０．１／１－１１２のＤＵＦ３９９２ドメイン含有タンパク質［バチルス属種ｍｓ－２２株］
＞配列番号５１：ＷＰ＿１０５９２５２３６．１／１－１１４のＤＵＦ３９９２ドメイン含有タンパク質［バチルス属種ＬＬＴＣ９３株］
＞配列番号５２：ＯＬＰ６６３１３．１／１－１１５の仮説的タンパク質：ＢＡＣＰＵ＿０６１５０［バチルス・プミルス（Ｂａｃｉｌｌｕｓｐｕｍｉｌｕｓ）］
＞配列番号５３：ＷＰ＿０１０７８７６１８．１／１－１１５のＤＵＦ３９９２ドメイン含有タンパク質［バチルス・アトロフェウス（Ｂａｃｉｌｌｕｓａｔｒｏｐｈａｅｕｓ）］
＞配列番号５４：ＷＰ＿０４０３７３３７７．１／１－１１６のＤＵＦ３９９２ドメイン含有タンパク質［ペリバチルス・プシクロサッカロリティクス（Ｐｅｒｉｂａｃｉｌｌｕｓｐｓｙｃｈｒｏｓａｃｃｈａｒｏｌｙｔｉｃｕｓ）］
＞配列番号５５：ＷＰ＿０９１４９８２６１．１／１－１１５のＤＵＦ３９９２ドメイン含有タンパク質［アンフィバチルス・マリヌス（Ａｍｐｈｉｂａｃｉｌｌｕｓｍａｒｉｎｕｓ）］
＞配列番号５６：ＷＰ＿００８６３３６３０．１／１－１１５の複数種：ＤＵＦ３９９２ドメイン含有タンパク質［バチルス科（Ｂａｃｉｌｌａｃｅａｅ）］
＞配列番号５７：ＷＰ＿１２４０５１０３１．１／１－１１６のＤＵＦ３９９２ドメイン含有タンパク質［バチルス・エンドフィティクス（Ｂａｃｉｌｌｕｓｅｎｄｏｐｈｙｔｉｃｕｓ）］
＞配列番号５８：ＷＰ＿０４９６７９８５３．１／１－１１４のＤＵＦ３９９２ドメイン含有タンパク質［ペリバチルス・ロイセレウリエ（Ｐｅｒｉｂａｃｉｌｌｕｓｌｏｉｓｅｌｅｕｒｉａｅ）］
＞配列番号５９：ＷＰ＿０６２１８４３８２．１／１－１１８の複数種：ＤＵＦ３９９２ドメイン含有タンパク質［バチルス綱］
＞配列番号６０：ＷＰ＿０４９６８１０１８．１／１－１１８のＤＵＦ３９９２ドメイン含有タンパク質［ペリバチルス・ロイセレウリエ］
＞配列番号６１：ＷＰ＿１５４９７５０２３．１／１－１１８のＤＵＦ３９９２ドメイン含有タンパク質［バチルス・メガテリウム（Ｂａｃｉｌｌｕｓｍｅｇａｔｅｒｉｕｍ）］
＞配列番号６２：ＷＰ＿０４８０２２２０５．１／１－１１８のＤＵＦ３９９２ドメイン含有タンパク質［バチルス・アリアバッタイ（Ｂａｃｉｌｌｕｓａｒｙａｂｈａｔｔａｉ）］
＞配列番号６３：ＷＰ＿０３６１９９３１８．１／１－１１４のＤＵＦ３９９２ドメイン含有タンパク質［リシニバチルス・シンデュリエンシス（Ｌｙｓｉｎｉｂａｃｉｌｌｕｓｓｉｎｄｕｒｉｅｎｓｉｓ）］
＞配列番号６４：ＭＱＲ８５２５９．１／１－１１５のＤＵＦ３９９２ドメイン含有タンパク質［バチルス・メガテリウム（Ｂａｃｉｌｌｕｓｍｅｇａｔｅｒｉｕｍ）］
＞配列番号６５：ＷＰ＿１１１６１６４７６．１／１－１１４のＤＵＦ３９９２ドメイン含有タンパク質［バチルス属種ＹＲ３３５株］
＞配列番号６６：ＴＤＬ８４６４７．１／１－１１３のＤＵＦ３９９２ドメイン含有タンパク質［ビブリオ・ブルニフィクス（Ｖｉｂｒｉｏｖｕｌｎｉｆｉｃｕｓ）］
＞配列番号６７：ＷＰ＿１１９１１６３７１．１／１－１１４のＤＵＦ３９９２ドメイン含有タンパク質［ペリバチルス・アサヒイ（Ｐｅｒｉｂａｃｉｌｌｕｓａｓａｈｉｉ）］
＞配列番号６８：ＷＰ＿００００５７８５８．１／１－１１６のＤＵＦ３９９２ドメイン含有タンパク質［バチルス・セレウス］
＞配列番号６９：ＷＰ＿０００１９２６１１．１／１－１１４のＤＵＦ３９９２ドメイン含有タンパク質［バチルス・セレウス］
＞配列番号７０：ＷＰ＿００００５７８５７．１／１－１１４の複数種：ＤＵＦ３９９２ドメイン含有タンパク質［バチルス・セレウス群］
＞配列番号７１：ＷＰ＿０３５５１０４０１．１／１－１１４の複数種：ＤＵＦ３９９２ドメイン含有タンパク質［ハロバチルス属（Ｈａｌｏｂａｃｉｌｌｕｓ）］
＞配列番号７２：ＷＰ＿１０１９３４１９１．１／１－１１４のＤＵＦ３９９２ドメイン含有タンパク質［ウィルギバチルス・ドクドネンシス（Ｖｉｒｇｉｂａｃｉｌｌｕｓｄｏｋｄｏｎｅｎｓｉｓ）］
＞配列番号７３：ＷＰ＿１４９１７３０９６．１／１－１１４のＤＵＦ３９９２ドメイン含有タンパク質［バチルス属種ＢＰＮ３３４株］
＞配列番号７４：ＡＡＳ４２０６３．１／１－１１５の仮説的タンパク質：ＢＣＥ＿３１５３［バチルス・セレウス；ＡＴＣＣ受託番号：１０９８７］
＞配列番号７５：ＷＰ＿１００５２７６３０．１／１－１１４のＤＵＦ３９９２ドメイン含有タンパク質［ペニバチルス属（Ｐａｅｎｉｂａｃｉｌｌｕｓｓｐ．）種ＧＭ１ＦＲ株］
＞配列番号７６：ＷＰ＿０２６６９１０４１．１／１－１１５のＤＵＦ３９９２ドメイン含有タンパク質［バチルス・アウランティアクス（Ｂａｃｉｌｌｕｓａｕｒａｎｔｉａｃｕｓ）］
＞配列番号７７：ＷＰ＿１０２６９３３１７．１／１－１１３のＤＵＦ３９９２ドメイン含有タンパク質［ルンメリイバチルス・ピクヌス（Ｒｕｍｍｅｌｉｉｂａｃｉｌｌｕｓｐｙｃｎｕｓ）］
＞配列番号７８：ＷＰ＿０７１３９１０７３．１／１－１０９のＤＵＦ３９９２ドメイン含有タンパク質［アネロバチルス・アルカリジアゾトロフィクス（Ａｎａｅｒｏｂａｃｉｌｌｕｓａｌｋａｌｉｄｉａｚｏｔｒｏｐｈｉｃｕｓ）］
＞配列番号７９：ＷＰ＿１０７８３９３７１．１／１－１１１のＤＵＦ３９９２ドメイン含有タンパク質［リシニバチルス・メイエリ（Ｌｙｓｉｎｉｂａｃｉｌｌｕｓｍｅｙｅｒｉ）］
＞配列番号８０：ＷＰ＿０６６１６６７０７．１／１－１１１のＤＵＦ３９９２ドメイン含有タンパク質［メタソリバチルス・フルオログリコフェニリティクス（Ｍｅｔａｓｏｌｉｂａｃｉｌｌｕｓｆｌｕｏｒｏｇｌｙｃｏｆｅｎｉｌｙｔｉｃｕｓ）］
＞配列番号８１：組換えＥｎａ１Ａのヌクレオチド配列（配列番号８２をコードする；４２９ｂｐ）
＞配列番号８２：組換えＥｎａ１Ａのアミノ酸配列（Ｎ末端６×Ｈｉｓタグ及びＴＥＶ切断部位を伴う）
ＭＨＨＨＨＨＨＳＳＧＥＮＬＹＦＱＧＡＣＥＣＳＳＴＶＬＴＣＣＳＤＮＳＳＮＦＶＱＤＫＶＣＮＰＷＳＳＡＥＡＳＴＦＴＶＹＡＮＮＶＮＱＮＩＶＧＴＧＹＬＴＹＤＶＧＰＧＶＳＰＡＮＱＩＴＶＴＶＬＤＳＧＧＧＴＩＱＴＦＬＶＮＥＧＴＳＩＳＦＴＦＲＲＦＮＩＩＱＩＴＴＰＡＴＰＩＧＴＹＱＧＥＦＣＩＴＴＲＹＬＭＡ
＞配列番号８３：組換えＥｎａ１Ｂのヌクレオチド配列（配列番号８４をコードする；３９９ｂｐ）
＞配列番号８４：組換えＥｎａ１Ｂのアミノ酸配列（Ｎ末端６×Ｈｉｓタグ及びＴＥＶ切断部位を伴う）
ＭＨＨＨＨＨＨＳＳＧＥＮＬＹＦＱＧＮＣＳＴＮＬＳＣＣＡＮＧＱＫＴＩＶＱＤＫＶＣＩＤＷＴＡＡＡＴＡＡＩＩＹＡＤＮＩＳＱＤＩＹＡＳＧＹＬＫＶＤＴＧＴＧＰＶＴＩＶＦＹＳＧＧＶＴＧＴＡＶＥＴＩＶＶＡＴＧＳＳＡＳＦＴＶＲＲＦＤＴＶＴＩＬＧＴＡＡＡＥＴＧＥＦＣＭＴＩＲＹＴＬＳ
＞配列番号８５：組換えＥｎａ１Ｃのヌクレオチド配列（配列番号８６をコードする；５１６ｂｐ）
＞配列番号８６：組換えＥｎａ１Ｃのアミノ酸配列（Ｎ末端６×Ｈｉｓタグ及びＴＥＶ切断部位を伴う）
ＭＨＨＨＨＨＨＳＳＧＥＮＬＹＦＱＧＫＰＨＫＮＩＧＣＦＡＰＬＳＩＩＣＱＰＴＣＰＣＰＰＰＩＬＰＰＥＲＧＤＡＥＬＶＴＮＥＦＡＧＤＩＬＩＳＮＤＦＩＰＩＳＱＫＱＬＫＱＴＮＴＴＶＮＩＷＫＮＤＧＩＶＳＬＳＧＴＩＳＩＹＮＮＲＮＳＴＮＡＬＳＩＱＩＩＳＳＴＴＮＴＦＴＡＬＰＧＮＴＩＳＹＴＧＦＤＬＱＳＶＳＶＩＤＩＰＳＤＰＳＩＹＩＥＧＲＹＣＦＱＬＴＹＣＫＳＫＲＤＣＬ
＞配列番号８７：Ｅｎａ１Ｂ＿ＮＭ＿Ｏｓｌｏ（合成配列）
＞配列番号８８：図８における合成ペプチド
＞配列番号８９：ＴＥＶ切断部位

＞配列番号１１８～１３９：Ｎ末端モチーフ／Ｃ末端モチーフのコンセンサス配列
＞配列番号１４０：Ｅｎａ１Ｂ－ＤＥ－ＨＡ挿入変異体のアミノ酸配列（Ｅｎａ１Ｂである、配列番号８に基づく）
＞配列番号１４１：Ｅｎａ１Ｂ－ＤＥ－Ｆｌａｇ挿入変異体のアミノ酸配列（Ｅｎａ１Ｂである、配列番号８に基づく）
＞配列番号１４２：Ｅｎａ１Ｂ－ＨＩ－ＨＡ挿入変異体のアミノ酸配列（Ｅｎａ１Ｂである、配列番号８に基づく）
＞配列番号１４３：ＨＡタグ
＞配列番号１４４：ＦＬＡＧタグ
＞配列番号１４５：バチルス・チューリンギエンシスＥｎａ２Ａのアミノ酸配列（ＷＰ＿００１２７７５４０．１）
＞配列番号１４６：バチルス・チューリンギエンシスＥｎａ２Ｃのアミノ酸配列（ＷＰ＿０１４４８１９６０．１）
＞配列番号１４７～１５０：Ｃ末端モチーフのコンセンサス配列

Claims

ＤＵＦ３９９２ドメインを含む単離された自己アセンブルタンパク質であって、フォールド類似性Ｚスコアが６．５以上でＥｎａ１Ｂ構造にマッチする三次元予測フォールドを有し、Ｅｎａ１Ｂが、配列番号８に対応する、単離された自己アセンブルタンパク質。
アミノ酸配列が、配列番号１～８０、１４５若しくは１４６又はこれらのうちのいずれか１つに対する少なくとも８０％の同一性を有するホモログのアミノ酸配列の群から選択される、請求項１に記載の自己アセンブルタンパク質。
請求項１又は２のいずれか一項に記載の自己アセンブルタンパク質を含む、操作された自己アセンブルタンパク質。
請求項１～３のいずれか一項に記載の少なくとも７つのタンパク質を含む多量体であって、タンパク質が、多量体内に、非共有結合的に連結されたサブユニットとして存在する、多量体。
少なくとも１つのサブユニットが、請求項３に記載の操作された自己アセンブルタンパク質である、請求項４に記載の多量体。
サブユニットが、アミノ酸配列モチーフＺＸ_ｎＣＣＸ_ｍＣ［配列中、Ｚは、Ｌｅｕ、Ｉｌｅ、Ｖａｌ又はＰｈｅであり、ｎは、１又は２であり、ｍは、１０～１２の間である。］を含むＮ末端領域を含み、サブユニットが、アミノ酸配列モチーフＧＸ_２／３ＣＸ_４Ｙ［配列中、Ｘは、任意のアミノ酸である。］を含むＣ末端領域を含む、請求項４又は５に記載の多量体。
少なくとも１つの操作された自己アセンブルタンパク質サブユニットのＮ末端領域が、アミノ酸配列モチーフＺＸ_ｎＣＣＸ_ｍＣ［配列中、ｍは、１３～１６の間である、又はｍは、７～９である。］を含むことを特徴とする操作された多量体である、請求項６に記載の多量体。
サブユニットが、アミノ酸配列モチーフＺＸ_ｎＣ（Ｃ）Ｘ_ｍＣ［配列中、Ｚは、Ｌｅｕ、Ｉｌｅ、Ｖａｌ又はＰｈｅであり、ｎは、１又は２であり、ｍは、１０～１２の間であり、（Ｃ）は、任意選択的なＣｙｓである。］を含むＮ末端領域を含み、サブユニットが、アミノ酸配列モチーフＳ－Ｚ－Ｎ－Ｙ－Ｘ－Ｂ［配列中、Ｚは、Ｌｅｕ又はＩｌｅであり、Ｂは、Ｐｈｅ又はＴｙｒであり、Ｘは、任意のアミノ酸である。］を含むＣ末端領域を含む、請求項４又は５に記載の多量体。
請求項４～８のいずれかに記載の少なくとも２つの多量体を含む組換え作製タンパク質繊維であって、多量体が長手方向に積み重ねられ、少なくとも１つのジスルフィド結合を介して共有結合的に連結されている、組換え作製タンパク質繊維。
請求項４～８のいずれかに記載の少なくとも２つの多量体を含むタンパク質繊維であって、多量体が長手方向に積み重ねられ、少なくとも１つのジスルフィド結合を介して共有結合的に連結されており、多量体の自己アセンブルタンパク質サブユニットが同一である、タンパク質繊維。
多量体が少なくとも１つの操作された多量体又は操作された自己アセンブルタンパク質を含むことを特徴とする操作されたタンパク質繊維である、請求項９又は１０に記載のタンパク質繊維。
以下の作動可能に連結されたＤＮＡエレメント：ａ）異種プロモーター、及びｂ）請求項１～３のいずれか一項に記載の自己アセンブルタンパク質をコードする核酸配列を含むキメラ遺伝子。
請求項１～３のいずれか一項に記載の自己アセンブルタンパク質、請求項４～８のいずれかに記載の多量体、請求項９～１１のいずれかに記載のタンパク質繊維及び／又は請求項１２に記載のキメラ遺伝子を含む宿主細胞。
請求項１～３のいずれか一項に記載の自己アセンブルタンパク質、請求項４～８のいずれか一項に記載の多量体、請求項９～１１のいずれか一項に記載のタンパク質繊維及び／又は請求項１２に記載のキメラ遺伝子を含む改変された細菌芽胞。
請求項１～３のいずれか一項に記載の自己アセンブルタンパク質、請求項４～８のいずれか一項に記載の多量体及び／又は請求項９～１１のいずれか一項に記載のタンパク質繊維を含む改変された表面。
請求項１～１１のいずれか一項に記載の自己アセンブルタンパク質、多量体又は繊維を作製する方法であって、
ａ．細胞内における、請求項１２に記載のキメラ遺伝子の発現ステップであって、自己アセンブルタンパク質をコードする核酸が、任意選択的に、異種Ｎ末端タグ又は異種Ｃ末端タグを含む、発現ステップ、並びに任意選択的に
ｂ．細胞からの単量体、多量体又は繊維の形態での自己アセンブルタンパク質の単離ステップ
を含む方法。
繊維形成又はエピタキシャル成長が停止された、請求項１～８のいずれか一項に記載の自己アセンブルタンパク質又は多量体を作製する方法であって、請求項１６に記載の方法のステップを含み、異種Ｎ末端タグ又は異種Ｃ末端タグが、少なくとも６つのアミノ酸残基を含む、方法。
請求項９～１１に記載のタンパク質繊維を作製するインビトロの方法であって、請求項１６又は１７に記載の方法のステップを含み、タグが、除去可能なタグであり、ステップｂの前又は後に、タンパク質サブユニットからタグを除去して、繊維形成を可能とするステップをさらに含む、方法。
宿主細胞内において請求項９～１１に記載のタンパク質繊維を組換えにより作製する方法であって、請求項１６に記載の方法のステップを含み、インセルロ（in cellulo）における繊維形成を可能とするように、異種タグが、自己アセンブルタンパク質サブユニット上に存在せず、かつ／又はステップｂにおける任意選択的な単離が細胞の溶解を介して得られる、方法。
請求項１５に記載の改変された表面を作製する方法であって、請求項１６～１８のいずれか一項に記載の方法のステップを含み、単量体、多量体又は繊維の表面への共有結合的結合により、表面を改変するステップをさらに含む方法。
改変された表面を、請求項１～３のいずれか一項に記載のタンパク質を含むタンパク質溶液へと曝露することによる、多量体又は繊維のエピタキシャル成長のための核生成剤としての請求項１５に記載の改変された表面の使用。
請求項１１に記載の操作されたタンパク質繊維を含み、任意選択的に、請求項９又は１０に記載のさらなるタンパク質繊維を含む、タンパク質薄膜又はハイドロゲル。