KR20230112606A

KR20230112606A - 신규 박테리아 단백질 섬유

Info

Publication number: KR20230112606A
Application number: KR1020237007971A
Authority: KR
Inventors: 한 르모; 미케 슬뢰털; 마리나 아스프홀름; 브라야반두 프라단
Original assignee: 브이아이비 브이지더블유; 브리제 유니버시타이트 브루셀; 노르웨이 유니버시티 오브 라이프 사이언시스
Priority date: 2020-08-07
Filing date: 2021-08-06
Publication date: 2023-07-27
Also published as: EP4192846A2; CN116323645A; WO2022029325A2; WO2022029325A3; US20230279059A1; JP2023537054A; CA3189751A1; BR112023001842A2

Abstract

본 발명은 생체나노물질로서 적용을 위한 바실러스 (Bacillus) 내생포자 부속물 (Ena) 및 신규 단백질 다량체 및 섬유질 조립체의 분야에 관한 것이다. 특히, 본 발명은 보존된 N-말단 시스테인-함유 영역을 함유하는, 박테리아 DUF3992 도메인-함유 단백질 서브유닛, 및 조작된 단백질을 비롯하여, 이의 다량체 및 섬유로 구성된 자가-조립 단백질에 관한 것이다. 또한, 상기 자가-조립 단백질 서브유닛의 재조합 발현은 신규 단백질 나노섬유 및 변형된 디스플레이 표면, 예컨대 바실러스 포자의 제조 방법을 제공한다. 마지막으로, 생체의학 및 생물공학 적용에서 상기 다량체, 섬유 및 표면의 용도가 본 명세서에 기술된다.

Description

신규 박테리아 단백질 섬유

본 발명은 생체나노물질로서 적용을 위한 바실러스 (Bacillus) 내생포자 부속물 (Ena) 및 신규 단백질 다량체 및 섬유질 조립체의 분야에 관한 것이다. 특히 본 발명은 보존된 N-말단 시스테인-함유 영역을 함유하는, 박테리아 DUF3992 도메인-함유 단백질 서브유닛, 및 조작된 단백질을 비롯하여, 이의 다량체 및 섬유로 구성된 자기-조립 단백질에 관한 것이다. 또한, 상기 자가-조립 단백질 서브유닛의 재조합 발현은 신규 단백질 나노섬유 및 변형된 디스플레이 표면, 예컨대 바실러스 포자의 제조 방법을 제공한다. 마지막으로, 생체의학 및 생명공학 적용에서 상기 다량체, 섬유 및 표면의 용도가 본 명세서에 기술된다.

자가-조립 분자는 화학적 기능성 및 형상 및 따라서 생물학적 활성을 제어하기 위해 도전적인 기회를 제공한다. 그들 모듈 속성, 생체적합성, 및 생분해성을 포함한, 단백질의 고유한 성질은 스마트 나노물질을 디자인할 흥미로운 기회를 제공한다 (Herrera Estrada & Champion, 2015; Jain et al., 2018). 자연에서 영감을 받아서, 몇몇 단백질/펩티드가 나노입자, 소포체, 케이지, 및 섬유질 조립체에 이르는 다양한 복합체 구조로 자가-조립되도록 조작되었으며, 이들은 생체공학의 다양한 분야에서 수많은 적용을 제공하는 신규한 기능성을 부여받을 수 있다 (Matsuurua 2014; Katyal et al., 2019). 자가-조립 펩티드 및 단백질의 아미노산 서열을 다양화하고 환경 매개변수를 조작하는 것은 성질을 조정하고, 다양한 온디맨드 초분자 나노구조를 수득하도록 자가-조립을 제어하도록 허용한다 (Lombardi et al., 2019). 아미노산 측쇄의 다양한 성질은 무한한 서열 조합으로 그들 화학적 변형의 가능성을 제공할뿐 만 아니라, 단백질의 아민-말단 및/또는 카르복시-말단의 변형은 특별한 나노구조로 단백질 중합체의 자가-조립을 조율할 수 있다 (Aluri et al., 2012; Yu et al., 1996). 따라서 천연 자가-조립 단백질 또는 펩티드는 자가-치유, 전단-박화, 형상 기억 등을 포함하여, 자가-조립 이외의 다양한 성질을 유도하도록 조작될 수 있다 (Chen and Zou, 2019).

불리한 성장 조건에 직면했을 때, 피르미큐테스 (Firmicutes) 문에 속하는 박테리아는 대사적으로 휴면기인 비-생산적 내생포자 상태로 분화될 수 있다. 이들 내생포자는 그들 탈수 상태 및 고유한 다층 세포 구조 덕분에 환경 스트레스 요인을 향해 극도의 탄성을 나타내고, 그들 형성 이후 수백년 후에도 대사적으로 활동적인 복제성 영양 성장 상태로 발아될 수 있다 (Setlow, 2014). 이러한 방식으로, 바실리 (Bacilli) 및 클로스트리디아 (Clostridia) 강에 속하는 피르미큐테스는 장기간의 가뭄, 기아, 높은 산소 또는 항생제 스트레스를 견딜 수 있다. 내생포자는 전형적으로 박테리아 DNA를 함유하는 가장 안쪽 탈수된 포자핵으로 이루어진다. 포자핵은 포자 발아 동안 출현하는 영양 세포의 세포벽으로서 기능하게 되는 펩티도글리칸의 ?昰? 층으로 둘러싸인 내막으로 둘러싸여진다. 그 다음에 휴면에 필수적인 변형된 펩티도글리칸의 두꺼운 피질층이 온다 (Atrih and Foster, 1999). 피질층은 그 다음으로 몇개의 단백질성 외피층으로 둘러싸인다. 일부 클로스트리듐 (Clostridium) 및 대부분의 바실러스 세레우스 (Bacillus cereus) 그룹 종에서, 포자는 (당)단백질 및 지질로 이루어진 가장 바깥쪽의 느슨한 준결정 포자외막층으로 둘러싸인다 (Stewart, 2015). 바실러스 및 클로스트리듐 내생포자의 표면은 또한 균주 및 종 간에 상당한 구조적 다양성을 보이는, 다수의 마이크로미터 길이 및 소수의 나노미터 너비의 필라멘트 부속물로 장식될 수 있다 (Hachisuka and Kuno, 1976; Rode et al., 1971; Walker et al., 2007). 바실러스 세레우스 센수 라토 (Bacillus cereus sensu lato)는 그들의 계통발생학적 관계에도 불구하고 높은 생태학적 다양성을 나타내는 그람-양성 내생포자-형성 박테리아 그룹이다. 그들 내생포자는 그들의 탈수된 상태 및 고유한 다층 세포 구조 덕분에 환경 스트레스 요인에 대해서 극도의 탄성을 나타내고 대사적으로 활성있는 복제성 영양 성장 상태로 발아될 수 있다 (Setlow, 2014). 비. 세레우스 내생포자는 알려지지 않은 정체 및 기능의 마이크로미터-길이 부속물이 장식된다. 비. 세레우스 그룹 균주 및 종 간에 내생포자 부속물 (이하 Ena)의 개수는 다양하고 비. 세레우스 그룹 균주 및 종 및 일부 균주간에 상이한 형상의 Ena를 동시에 발현하기도 한다 (Smirnova et al., 2013). Ena를 닮은 구조는 영양 세포의 표면 상에서 관찰되지 않아서 그들이 포자-특이적 섬유를 나타낸다는 것을 시사한다. Ena는 비. 세레우스 그룹에 속하는 균주의 포자 간에 널리퍼진 특성으로 보인다. Ankolekar 등은 비. 세레우스의 모든 47종의 식품 단리주가 부속물을 갖는 내생포자를 생산한다는 것을 확인하였다 (Ankolekar & Labbe, 2010). 부속물은 또한 비. 세레우스와 밀접하게 관련되고, 이의 살충 활성으로 가장 잘알려진, 12종의 식품-매개, 장독소성 바실러스 투린지엔시스 (Bacillus thuringiensis) 단리주 중 10종의 포자에서 발견되었다 (Ankolekar & Labbe, 2010). 전체적으로, 이 때문에 Ena 구조는 신규한 지속가능한 생체물질로 조작을 위한 흥미로운 출발점이 된다. 놀랍게도, 비. 세레우스 그룹에 속하는 종에서 포자 부속물의 존재는 이미 60년대에 보고되었지만 그들 조성 및 유전적 정체를 특징규명하려는 노력은 섬유를 가용화시키고 효소적으로 분해하는데 어려움으로 인해 실패하였다 (Gerhardt & Ribi, 1964; DesRosier & Lara, 1981). 따라서, 혹독한 환경 조건에서 지속가능성같이 개선된 성질을 갖는 새로운 유형의 스마트 생체물질을 설계, 개발 및 생산할 수 있도록 이러한 내생포자 부속물의 구조적 특징규명을 위한 관심 및 요구가 존재한다.

본 발명은 2개의 주요 형상의 단백질성 섬유, S-형 및 L-형 섬유를 밝힌, 식중독 발생 균주 비. 세레우스 NVH-0075/95로부터 단리된 내생포자 부속물 (Ena)의 유전적 및 구조적 기초의 해결을 기반으로 한다. cryo-EM 및 3D 나선식 재구성을 사용하여, 바실러스 내생포자 부속물 (Ena)이 β-시트 확대에 의해 측면으로 적층되는 다량체를 형성하는 젤리롤 토폴로지를 갖는 서브유닛을 특징으로 하는, 신규 클래스의 그람-양성 선모를 형성한다는 것을 보여주었다. 또한, Ena 섬유는 다량체를 가교하는 그들의 N-말단 단백질 서브유닛 펩티드의 연장을 통한 디술피드 가교결합에 의해 종방향으로 안정화되어서 열, 가뭄 및 화학적 손상에 매우 내성인 유연한 선모 (도 2 참조)를 생성시킨다. 3D 구조는 Ena 섬유가 지금까지 기능이 알려지지 않은 박테리아 DUF3992 도메인-함유 단백질의 단백질 패밀리, 및 각 패밀리 구성원에 대해 보존된 N-말단 영역으로 구성된다는 것을 추론할 수 있게 하고, 본 명세서에서 최초로 'Ena' 단백질로서 주석을 달았다. S-형 및 L-형 섬유의 유전적 정체는 잠재적인 Ena 단백질 서브유닛을 코딩하는 유전자가 결여된 돌연변이체의 분석을 통해서 확인하였다. 계통발생학적 분석은 S-형 ena 섬유가 비. 세레우스 그룹에 속하는 종의 서브세트에 고유하게 존재하는 디-시스트론 오페론에 의해 코딩된다는 것을 보여주고, 상이한 생태형 및 병원형 중에 정의된 ena 분기군의 존재를 밝혀주었는데, 이들 Ena 유전자는 본 명세서에 정의된 바와 같이 폴딩된 구조로 자가-조립을 허용하여, 다량체 또는 섬유질 조립체를 생성시키는, 적어도 2개의 보존된 시스테인 잔기를 갖는 N-말단 영역 및 스페이서 영역 (도 8 참조)에 이어서, DUF3992 도메인을 특징으로 하는, Ena 단백질을 코딩하는 공통성을 갖는다. 생체내에서, Ena 오페론에서 코딩되는 서브유닛은 Ena의 조립에 상호의존적이다. 놀랍게도, 재조합적으로 발현된 Ena 단백질은 생체내 Ena의 것과 유사한 성질 및 구조를 갖는 단백질 나노섬유로 개별적으로 자가-조립될 수 있게 만들 수 있다. 따라서, Ena는 박테리아 포자가 마주치게 되는 혹독한 조건에 대해 특별하게 적합화된 신규한 부류의 선모를 대표하고, 유전적 및 구조적 기초를 밝힘으로써, 단백질 조립체 예컨대 차세대 생체물질로서 적용가능한 디스크 또는 나선을 제공하도록 변형된 포자, 또는 변형 및 조작된 Ena 프로토머 또는 다량체를 생산하는 방법에 대한 통찰력을 본 명세서에서 확립한다.

본 발명의 제1 양태는 PFAM13157 클래스에 속하는 이의 아미노산 서열을 특징으로 하고, 다시 말해서, 이의 서열에 DUF3992 도메인의 존재를 특징으로 하고, 본 명세서에 표시된 바와 같이, Ena 단백질의 3D 구조 폴드, 특히 6 이상, 6.5 이상, 또는 바람직하게 n/10-4 이상 (여기서, n은 상기 단백질 서열의 아미노산 개수임)의 Dali Z-점수로서 정의된, 고도로 유의한 유사성 점수를 갖는, Ena1B (SEQ ID NO:8로 표시된 서열을 가짐)의 폴드에 일치시키는 것을 더욱 요구하는, 자가-조립 성질을 갖는 단백질에 관한 것이다. 일 구현예에서, 상기 자가-조립 단백질 서브유닛은 본 출원에서 확인된 Ena 단백질 서열을 나타내는, SEQ ID NO:1-80, SEQ ID NO:145 및 SEQ ID NO:146의 군으로부터 선택되는 아미노산 서열을 포함하는 박테리아 기원 단백질, 또는 SEQ ID NO:1-80, SEQ ID NO:145 또는 SEQ ID NO:146의 서열 중 어느 하나의 적어도 60%, 또는 적어도 70% 또는 적어도 80% 또는 적어도 90% 동일성을 갖는 임의의 원핵생물 상동체에 의해 제공되고, 여기서 % 동일성은 서열의 전체 길이 창 상에서 계산된다. 실제로, 본 명세서에 개시된 바와 같은 Ena1B 폴드에 일치하기 위해 본 명세서에 기술된 구조적 요건은 종종 여전히, 박테리아 Ena 패밀리가 하기 기술되는 바와 같이, 상이한 구성원으로 더욱 분류되므로, SEQ ID NO:8의 구조적 기준 서열과 60% 미만의 동일성의 상동체를 갖는 박테리아 단백질을 의미한다. 따라서, 일 구현예는 표 1에 도시된 바와 같이 이의 은닉 마르코브 모델 (Hidden Markov Model)에 정렬시켜서 결정되는, DUF3992 도메인을 포함하는 단리된 자가-조립 단백질에 관한 것이고, 상기 단백질 서브유닛은 본 명세서에 정의된 바와 같이, 6.5 이상의 폴드 유사성 점수로 Ena1B 구조에 일치하는 3D (예상) 폴드를 가지며, Ena1B는 SEQ ID NO:8에 상응하고, Ena1B 기준 구조는 표 2로 본 명세서에서 제공하고, PDB7A02로 기탁된 좌표에 상응한다.

특정 구현예에서, 본 명세서에서 언급되는 자가-조립 단백질은 상기 정의된 바와 같고/같거나, 각각 바실러스 Ena1A (SEQ ID NO: 1-7), Ena1B (SEQ ID NO: 8-14), Ena1C (SEQ ID NO: 15-20), 바실러스 Ena2A (SEQ ID NO: 21-28, SEQ ID NO:145), Ena2B (SEQ ID NO: 29-37), Ena2C (SEQ ID NO: 38-48, SEQ ID NO:146), 및 상이한 유형의 다른 바실러스 Ena3 (SEQ ID NO: 49-80) 단백질의 대표적인 예를 제공하는, SEQ ID NO: 1-80, SEQ ID NO:145, 또는 SEQ ID NO:146으로 표시된 아미노산 서열, 또는 SEQ ID NO:1-80, SEQ ID NO:145 또는 SEQ ID NO:146으로 표시된 임의 서열의 적어도 80% 동일성을 갖는, 이의 어느 하나의 박테리아 오솔로그에 의해 제공되는, 상기 Ena 단백질 패밀리에 관한 것이다. 서열 보존 영역 및 수준은 도 16-19에 표시된 다수의 서열 정렬을 통해 Ena 패밀리 구성원에 대해 표시된다.

추가 구현예는 조작된 자가-조립 단백질인, 본 명세서에 기술된 바와 같은 상기 자가-조립 단백질에 관한 것으로서, 본 명세서에 기술된 바와 같은 Ena 폴드 및 HMM 프로파일은 본 명세서에 기술된 바와 같지만, 예를 들어, 제한없이, 이종성 N-말단 또는 C-말단 태그, 및/또는 입체 블록을 포함하는 변형 중 적어도 하나, 천연 또는 야생형 Ena 서열과 비교하여 하나 이상의 돌연변이를 함유할 수 있거나, 또는 펩티드 또는 스캐폴드의 삽입, 또는 다수의 아미노산의 결실을 함유할 수 있거나, 또는 공-인큐베이션시 조립되는 '분할' 부분같은, Ena 단백질의 별개 부분으로서 제공될 수 있는 단백질 서열 변이체를 더 포함하여 '조작'되거나 또는 '변형'된, Ena1B 폴드 및 DUF3992 프로파일과 일치한다.

본 발명의 제2 양태는 비-공유적으로 연결되는, 적어도 7개의 상기 자가-조립 단백질 서브유닛, 및 바람직하게 7 내지 최대 12개 서브유닛을 포함하거나 또는 함유하는 단백질 다량체에 관한 것이다. 보다 특히, 상기 다량체는 β-시트 확대 ([Remaut and Waksman, 2006]에 기술된 바와 같은 단백질-단백질 상호작용 원리)를 통해 비공유적으로 적층되는, 본 명세서에 정의된 바와 같은 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개, 또는 그 이상의 자가-조립 Ena 단백질 서브유닛으로 이루어진다. 특정 구현예에서, 본 명세서에 기술된 바와 같은 상기 다량체는 (적합한 조건에서) 상기 다량체의 상이한 단백질 서브유닛 간에 예를 들어, Cys 연결에 의해 제공되는, 공유 연결을 더 포함할 수 있다. 일 구현예에서, 상기 다량체는 '그 자체로', 즉 필라멘트 또는 섬유 성상으로서가 아니게, 존재하며, 따라서 비-천연 발생 다량체 조립체이다. 특히, 본 명세서에서 Ena 단백질로서 정의된 상기 자가-조립 단백질 서브유닛은 추가 다량체와 분자간 디술피드 가교 형성을 위해서, 본 명세서에서 상호교환적으로 사용되는, 그들 N-말단 영역 또는 N-말단 연결부에 적어도 2개의 보존된 시스테인 잔기를 더 포함할 수 있다. 특정 구현예에서, 다량체 조립체는 본 명세서에서 더욱 정의되는 바와 같거나, 또는 각각 바실러스 Ena1A (SEQ ID NO: 1-7), Ena1B (SEQ ID NO: 8-14), Ena1C (SEQ ID NO: 15-20), 바실러스 Ena2A (SEQ ID NO: 21-28, SEQ ID NO:145), Ena2B (SEQ ID NO: 29-37), Ena2C (SEQ ID NO: 38-48, SEQ ID NO:146), 및 상이한 유형의 다른 바실러스 Ena3 (SEQ ID NO: 49-80) 단백질의 대표적인 예를 제공하는 SEQ ID NO: 1-80, SEQ ID NO:145, 또는 SEQ ID NO:146으로 표시된 아미노산 서열, 또는 SEQ ID NO:1-80, SEQ ID NO:145, 또는 SEQ ID NO:146로 표시된 임의 서열의 적어도 80% 동일성을 갖는, 이의 박테리아 오솔로그로 제공되는 바와 같은, Ena 단백질 패밀리로부터 7 내지 12개 단백질 서브유닛을 포함한다. 특정 구현예는 본 명세서에 기술된 바와 같이 동일한 자가-조립 단백질을 갖는 7 내지 12개 단백질 서브유닛을 갖는 상기 다량체에 관한 것이다. 대안적으로, 다량체는 적어도 7개 단백질 서브유닛을 포함하고, 상기 단백질 서브유닛 중 적어도 하나는 본 명세서에 정의된 바와 같고, 비-천연 발생 Ena 단백질에 관한, 조작된 자가-조립 Ena 단백질이다. 특정 구현예에서, 상기 다량체는 적어도 7개, 바람직하게 최대로 12개 Ena 단백질 서브유닛을 포함하고, 적어도 하나의 서브유닛은 N-말단 및/또는 C-말단에 입체 블록을 포함하여서, 다량체가 섬유로 더욱 조립되는 것을 방지한, 조작된 Ena 단백질이다 (도 14). 특정 구현예에서, 상기 N-말단 또는 C-말단 입체 블록은 이종성 N-말단 및/또는 C-말단 태그이다. 특정 구현예에서 이러한 입체 블록을 형성하기 위한 상기 이종성 N-말단 및/또는 C-말단 태그 또는 연장부는 최소로 1, 2, 3, 4, 5, 바람직하게 6개, 또는 그 이상의 아미노산 잔기이다. 일정 구현예는 상기 다량체에 관한 것으로서, 상기 Ena 단백질 서브유닛은 동일하거나 또는 상이한 자가-조립 Ena 단백질일 수 있고, 그들 중 적어도 하나는 이종성 N-말단 및/또는 C-말단 태그를 포함하도록 조작된다. 대안적으로, 상기 적어도 하나의 조작된 Ena 단백질 서브유닛은 Ena 돌연변이체 단백질 변이체일 수 있거나, 또는 도 15에 예시하고 기술되고, 실시예 섹션에 요약된 바와 같이, 융합 단백질이거나, 또는 노출된 루프에 삽입된 펩티드 또는 단백질 도메인을 함유하는, Ena 단백질일 수 있다.

특정 구현예는 동종다량체 또는 이종다량체인 본 명세서에 기술된 바와 같은 상기 다량체에 관한 것이고, 보다 특히, 6, 또는 7 내지 12개 서브유닛으로 이루어진 다량체에 관한 것이고, 바람직하게 7개 서브유닛으로 이루어진 7량체, 또는 9개 서브유닛으로 이루어진 9량체에 관한 것으로서, 이들 둘 모두는 가능하게 디스크-유사 다량체를 형성할 수 있거나, 또는 각각 10개, 11개 또는 12개 서브유닛으로 이루어진 10량체, 11량체 또는 12량체에 관한 것으로서, 이들은 나선 회전부 또는 β-프로펠러 구조의 아크를 형성한다 (도 14).

다른 구현예는 N-말단 영역 또는 N-말단 연결부 (Ntc) 영역을 포함하는, 상기 자가-조립 단백질 서브유닛, 또는 자가-조립 DUF3992-함유 단백질 서브유닛 또는 Ena 단백질 서브유닛 또는 조작된 Ena 단백질 서브유닛의 다량체에 관한 것으로서, 아미노산 잔기 공통 모티프 ZX_nCCX_mC가 존재하고, 여기서 X는 임의 아미노산이고, n은 1 또는 2이고, m은 10 내지 12이고, Z는 바람직하게 Leu, Ile, Val 또는 Phe이고, 바람직하게 C-말단 영역 또는 C-말단 수신기 영역은 공통 모티프 GX_2/3CX₄Y를 포함하고, 여기서 G는 글리신이고, X는 임의 아미노산 (2 또는 3 잔기)이고, Y는 티로신이고, 따라서 단백질 서브유닛의 상기 N-말단 및 C-말단 영역 모티프에 존재하는 시스테인 (C)은 다른 다량체에 한 다량체를 종방향으로 연결시키기 위한 디술피드 가교를 형성할 수 있다 (궁극적으로 도 14A; 도 16-17에서와 같은 S-섬유로 조립을 일으킴). 추가의 대안적인 구현예는 본 명세서에 정의된 바와 같은 모티프 ZX_nCCX_mC를 갖지만, 더 짧은 N-말단 스페이서 영역 (여기서, m은 7 내지 9임) 또는 더 긴 N-말단 스페이서 영역 (여기서, m은 13 내지 16)을 갖는 N-말단 연결부 영역을 포함하는 조작된 자가-조립 단백질 서브유닛 또는 다량체에 관한 것이다. 상기 조작된 다량체는 자가-조립 시에 상기 스페이서 영역의 경우 m이 10 내지 12인, 다량체를 갖는 조립된 섬유와 비교하여 더 낮은 가요성 또는 증가된 강성을 갖는 섬유를 생성시키게 된다. 추가의 대안적인 구현예는 상기 자가-조립 단백질 서브유닛 또는 상기 Ena 단백질 서브유닛으로 구성된 다량체에 관한 것으로서, 아미노산 잔기 공통 모티프 ZX_nC(C)X_mC가 존재하는 N-말단 영역 또는 N-말단 연결부 영역을 포함하고, 여기서 X는 임의 아미노산이고, n은 1 또는 2이고, m은 10 내지 12이고, Z는 바람직하게 Leu, Ile, Val 또는 Phe이고, C는 cys이고 (C)는 임의 Cys로서, 이들 Ena 단백질에 대한 상기 모티프에 1개 또는 2개 cys가 존재한다는 것을 의미하고 (궁극적으로 본 명세서에서 Ena3 단백질로서 더욱 분류됨), 바람직하게 C-말단 영역 또는 C-말단 수신기 영역은 공통 모티프 S-Z-N-Y-X-B를 포함하고, 여기서 Z는 Leu 또는 Ile이고, B는 Phe 또는 Tyr이고, X는 임의 아미노산으로서, 단백질 서브유닛의 상기 N-말단 영역 모티프 및 C-말단 영역 모티프에 존재하는 시스테인 (C)은 다른 다량체에 한 다량체를 종방향으로 연결하기 위해 디술피드 가교를 형성할 수 있다 (궁극적으로 도 14B; 도 19에서 같은 L-섬유로 조립을 일으킴).

본 발명의 다른 양태는 본 명세서에 기술된 바와 같은 적어도 2개의 상기 다량체를 포함하도록 생산된 단백질 섬유에 관한 것으로서, 상기 다량체는 디술피드 결합을 통해서, 보다 특히 적어도 하나의 디술피드 결합, 바람직하게 2개 이상의 디술피드 결합을 통해서 종방향으로 가교되는 것을 방해받지 않는다. 상기 디술피드 결합은 종방향으로 형성된 단백질 섬유의 선행층을 구성하는 다량체의 하나 이상의 서브유닛의 N-말단 및/또는 C-말단 영역에 존재하는 하나 이상의 시스테인 잔기와 다량체의 하나 이상의 서브유닛의 N-말단 영역 또는 N-말단 연결부의 시스테인 잔기의 측쇄 간에 형성될 수 있다. 상기 단백질 섬유는 재조합적으로 생산된 섬유일 수 있다.

다른 구현예에서, 상기 단백질 섬유는 적어도 하나의 다량체가 본 명세서에 정의된 바와 같이 조작된 다량체이거나, 또는 적어도 하나의 다량체가 본 명세서에 정의된 바와 같은 적어도 하나의 조작된 Ena 단백질을 포함하는 것인, 적어도 2개 다량체를 포함하는, 조작된 단백질 섬유이다. 바람직한 구현예에서 단백질 섬유는 다량체를 포함하고, 단백질 서브유닛은 본 명세서에 기술된 바와 같이 동일한 자가-조립 단백질 서브유닛을 포함하고/하거나, 동일한 Ena 단백질로 구성된다.

본 발명의 다른 양태는 본 명세서에 정의된 바와 같은, (조작된) 자가-조립 단백질, 바람직하게 Ena 단백질에 대한 코딩 서열을 포함하는 DNA 구성요소에 작동적으로 연결된 프로모터 또는 조절 서열 구성체를 포함하는 키메라 유전자 구성체에 관한 것이다. 보다 특히, 상기 코딩 서열은 SEQ ID NO: 1-80; SEQ ID NO:145, 또는 SEQ ID NO:146으로 표시된 바와 같은 Ena 단백질을 포함하는 단백질, 또는 SEQ ID NO:1-80, SEQ ID NO:145, 또는 SEQ ID NO:146 중 어느 하나에 대해 적어도 80% 아미노산 동일성을 갖는, Ena1/2A, Ena1/2B, Ena1/2C, 또는 Ena3A를 포함하는 임의의 상기 Ena 패밀리 구성원의 기능적 상동체를 코딩할 수 있거나, 또는 본 명세서에 정의된 바와 같은, 이의 조작된 Ena 단백질 형태를 코딩할 수 있다. 상기 프로모터 또는 조절 구성요소는 이것이 작동적으로 연결되는 코딩 서열에 이종성이고, 임의로 당분야에 공지된 바와 같이, 유도성 프로모터이다.

추가 구현예는 본 명세서에 기술된 바와 같은 키메라 유전자의 발현, 또는 본 명세서에 기술된 바와 같은 다량체 또는 단백질 조립체의 자가-조립 프로토머의 발현을 위한 숙주 세포에 관한 것이다. 다른 구현예는 본 명세서에 기술된 바와 같은 키메라 유전자, 또는 조작된 Ena 유전자 또는 조작된 Ena 단백질을 코딩하는 유전자를 포함하는, 변형된 포자-형성 세포 또는 박테리아에 관한 것이다. 다른 구현예는 본 명세서에 기술된 바와 같은 Ena 단백질, 또는 이의 조작된 형태, 또는 다량체를 포함하고/하거나 디스플레이하거나, 또는 본 명세서에 기술된 바와 같은, 단백질 섬유, 특히 조작되거나 또는 변형된 단백질 섬유, 재조합적으로 생산된 섬유 또는 포자를 갖는, 변형된 박테리아 포자, 특히 변형된 바실러스 내생포자에 관한 것이다.

본 발명의 추가 양태에서, 변형된 표면 또는 고형 지지체가 제공되고, 상기 표면은 본 명세서에 기술된 바와 같은 Ena 단백질, 다량체 조립체, 또는 단백질 섬유, 또는 이의 임의의 조작된 형태를 포함한다. 상기 변형된 표면은 상기 표면에 상기 Ena 단백질, 다량체 또는 섬유의 공유 부착에 의해 구성되고, 세포 또는 인공 표면, 특히 임의 물질 유형의 고형 표면일 수 있다. 따라서, 상기 변형된 표면은 예를 들어 상기 변형된 표면이 Ena 단백질의 용액에 노출되거나 또는 그와 접촉할 때, 단백질 섬유의 에피택셜 성장을 위한 핵형성제로서 사용될 수 있고, 상기 Ena 단백질은 바람직하게 단량체 또는 올리고머 형태로 존재한다.

추가 구현예는 본 명세서에 기술된 바와 같은 조작된 Ena 단백질 섬유 및/또는 Ena 단백질 섬유를 포함하는 단백질 필름에 관한 것이고, 상기 필름은 바람직하게 당분야에 공지된 바와 같이, 박막이다. 대안적으로, 본 명세서에 기술된 바와 같은 조작된 단백질 섬유 및/또는 본 명세서에 기술된 바와 같은 Ena 단백질 섬유를 포함하는 히드로겔이 본 명세서에 개시된다. 추가 구현예는 더 두꺼운, 실-유사 다발로 방사되는 조작된 단백질 섬유를 포함하는 나노와이어에 관한 것이다.

본 발명의 최종 양태는 본 명세서에 기술된 바와 같은 단백질 조립체, 보다 특히 Ena 단백질, 다량체 및 섬유질 조립체, 또는 본 명세서에 기술된 바와 같은 변형된 표면, 특히 포자 표면 또는 합성 표면을 재조합적으로 제조하기 위한 방법에 관한 것이다.

일 구현예는 하기 단계를 포함하는, 본 명세서에 기술된 바와 같은 자가-조립 DUF3992 도메인-함유 단량체, 또는 다량체를 제조하기 위한 방법을 기술한다:

a) 본 명세서에 기술된 바와 같은 키메라 유전자 구성체를 숙주 세포에서, 또는 본 명세서에 기술된 바와 같은 숙주 세포를 사용하여 발현시키는 단계로서, 자가-조립 단백질 서브유닛은 임의로 N-말단 및/또는 C-말단 태그를 포함하는 것인 단계, 및 (임의로)

b) 자가-조립된 DUF3992-도메인-함유 단백질 또는 다량체를 정제하는 단계로서, 후자는 발현된 단백질 서브유닛의 올리고머화 이후에 형성된 것인 단계.

다른 구현예는 섬유 조립 또는 에피택셜 성장으로 저지되거나 또는 적어도 저해되는 자가-조립 DUF3992 도메인-함유 또는 Ena 단백질을 재조합적으로 제조하기 위한 방법, 따라서 상기 기술된 바와 같은 방법을 포함하는, 섬유 과성장으로 차단된 조작된 Ena 단백질을 재조합적으로 제조하기 위한 방법에 관한 것으로서, N-말단 및/또는 C-말단 태그는 종방향 섬유 형성으로 단백질 서브유닛 또는 다량체의 자가-조립을 입체적으로 차단하기 위해 적어도 1, 바람직하게 적어도 6, 보다 바람직하게 적어도 9, 또는 15개 아미노산 길이이다. 추가 구현예에서, 상기 N-말단 또는 C-말단 태그는 종방향 강성 성유 형성으로 단백질 서브유닛 또는 다량체의 자가-조립을 가역적으로 저지 또는 방해하기 위해 적어도 6개 아미노산 길이이다. 상기 경우에 N-말단 또는 C-말단 태그는 예를 들어 서브유닛 및 다량체 조립체의 입체 차단의 반전, 및 프로테아제에 의한 태그의 제거를 위한 프로테아제 인식 서열을 포함하여서, 제거가능한 태그일 수 있다.

다른 구현예는 상기 방법의 단계 a) 및 b)를 포함하는, 본 명세서에 기술된 바와 같은 단백질을 제조하기 위한 방법에 관한 것으로서, N-말단 및/또는 C-말단 태그는 제거가능 또는 절단가능 태그로서 존재하고, 상기 방법은 N-말단 및/또는 C-말단 태그를 제거 또는 절단하여 형성된 다량체가 단백질 섬유로 추가로 자가-조립하도록 허용하는 단계 c)를 더 포함한다. 대안적으로, 단계 c)는 정제 단계 b) 전에 수행될 수 있다. 또한, 방법은 표면을 (조작된) Ena 단백질, 다량체 또는 섬유를 상기 표면에 디스플레이하거나 또는 공유적으로 부착시켜서 변형시키는 단계 d)를 더 포함하는, 단계 a), b), 및/또는 c) (또는 c) 및/또는 b))를 포함하는 본 명세서에 기술된 바와 같이 변형된 표면을 제조하기 위해 제공된다.

마지막으로, 단백질 조립체, 예컨대 본 명세서에 기술된 바와 같은 섬유는 하기 단계를 포함하는, Ena 단백질 섬유의 재조합 제조를 위한 방법에서 기술된 바와 같이, 세포 내에서 생산될 수 있다:

a) 본 명세서에 기술된 바와 같은 키메라 유전자 구성체를 숙주 세포에서, 또는 본 명세서에 기술된 바와 같은 숙주 세포를 사용하여 발현시키거나, 또는 본 명세서에 기술된 바와 같은 Ena 단백질, 또는 조작된 Ena 단백질을 발현시키는 단계로서, 단백질 서브유닛은 입체 블록을 갖지 않아서, 자가-조립 단백질은 자유 N-말단 연결부를 갖는 야생형 또는 조작된 자가-조립 Ena 단백질로 이루어지는 것인 단계, 및 (임의로)

b) 세포질내에서 발현된 단백질 서브유닛의 올리고머화 이후에 형성된, Ena 단백질 조립체, 예컨대 섬유 또는 다량체의 단리 단계.

기술된 도면은 오직 개략적이고 비제한적이다. 도면에서, 일부 구성요소의 크기는 예시 목적으로 과장될 수 있고 비례적으로 도시되지 않을 수 있다.
도 1. 바실러스 세레우스 ( Bacillus cereus ) 내생포자는 S-형 및 L-형 Ena를 보유한다.
(A,B) 포자 몸체 (SB), 포자외막 (E), 및 개별적으로 내생포자로부터 또는 섬유 클러스터 (박스)로서 출현된 내생포자 부속물 (Ena)을 보여주는, 비. 세레우스 NVH 0075/95 내생포자의 음성 염색 TEM. 원위 말단에서, Ena는 단일 또는 다수의 얇은 주름부 (R)에서 종료된다. (C, D) S-형 (C) 및 L-형 Ena (D)의 단일 섬유 cryoTEM 이미지 및 음성 염색 2D 클래스 평균. (E) S-형 및 L-형 Ena의 길이 분포 및 내생포자 당 Ena의 개수 (삽입), (n=1023, 150개 내생포자 유래, 5개 배치 유래). 도 7을 또한 참조한다.
도 2. S-형 Ena의 CryoTEM 구조.
(A, B) cryoTEM에 의해서 검토된 비. 세레우스 NVH 0075/95 S-형 Ena의 대표적인 2D 클래스 평균 (A) 및 상응하는 파워 스펙트럼 (B). 나선 대칭을 유도하는데 사용된 베셀 차수가 표시된다. (C) 생체외 S-형 Ena의 재구성된 cryoEM 전자 전위 맵 (3.2 Å 분해능). (D) 리본 표시 및 분자 표면에 표시된 S-형 Ena의 신규 구축된 3D 모델의 단일 나선 회전부의 측면도 및 평면도. Ena 서브유닛은 i 내지 i-10으로 표시된다. (E) S-형 Ena1B 서브유닛의 리본 표시 및 토폴로지 다이아그램 (N-말단에서 C-말단으로 파란색에서 붉은색 무지개), 및 디술피드 가교결합을 통한 서브유닛 i-9 (모래색) 및 i-10 (녹색)과 이의 상호작용.
도 3. Ntc 링커는 S-형 Ena에 높은 가요성 및 탄력성을 제공한다.
(A) 단지 19개 나선 회전부 (오렌지색으로 개략적으로 도시)를 포함하는 U-회전부를 만드는 단리된 S-형 Ena의 cryoTEM 이미지. (B, C) Ntc 링커 (잔기 12-17)의 결과로서 Ena1B 젤리롤 도메인 사이에 종방향 간격을 강조한, S-형 Ena 모델의 단면 및 3D cryoTEM 전자 전위 맵. (D) 내생포자-연관된 S-형 Ena의 음성 염색 2D 클래스 평균은 피치 및 축 곡률의 변동을 보여준다. recEna1B 나노섬유에 대한 이들 구조적 데이터는 링커 영역을 섬유 강성 및 가요성을 조작하고 조정하기 위한 부위로서 확인한다.
도 4. ena 는 바이시스트론이고 포자형성 동안 발현된다.
(A) ena 유전자의 염색체 조직 및 전사물 분석에 사용된 프라이머 (화살표). (B) 대조군으로서 게놈 DNA 또는 액체 배양으로 8시간 및 16시간 성장 후 NVH 0075/95로부터 단리된 mRNA로 만들어진 cDNA 및 표시된 프라이머 쌍을 사용한 PCR 생산물의 아가로스 겔 전기영동 (1%) 분석. 특히, ena1C의 발현은 주요 부속물의 성분인 ena1A 및 ena1B에 비해서 놀랍게도 더 높았다. (C) 비. 세레우스 균주 NVH 0075/95의 16시간 성장 동안 qRT-PCR에 의해 결정된 rpoB 대비 ena1A (x), ena1B (▲), ena1C (○) 및 dedA (●)의 전사 수준. 점선은 OD₆₀₀ 의 증가로 측정된 박테리아 성장을 나타낸다. 위스커는 3회 독립 실험의 표준 편차를 나타낸다.
도 5. S-형 및 L-형 Ena의 조성.
(A) ena1A, ena1B, ena1A 및 B 또는 ena1C가 결여된 NVH 0075/95 돌연변이체를 비롯하여, 플라스미드 (pAB)로부터의 ena1A-ena1B로 보완된 ena1B 돌연변이체의 내생포자의 대표적인 음성 염색 이미지. 삽도는 각각의 돌연변이체에 대해 관찰된 Ena의 2D 클래스 평균이다. (B) WT 및 돌연변이체 NVH 0075/95 내생포자에서 발견된 길이 분포 및 Ena의 개수. 통계: WT에 대한 쌍별 Mann-Whitney U 검정 WT (n: ≥ 18 포자; n: ≥ 50 Ena; ns: 비유의, * p<0.05, ** p<0.01, *** p<0.001 and **** p<0.0001. ---: 평균 ± s.d.)
도 6. Ena는 병원성 바실리에서 널리 퍼져있다.
(A) EnaA-C 오솔로그 및 상동체의 개체군 간에 표시된 평균 아미노산 서열 동일성을 갖는 Ena1 및 Ena2 유전자좌. Ena1C는 상당히 더 많은 변이를 보이고, 비. 시토톡시쿠스 (B. cytotoxicus)에서 Ena1C 및 Ena2C 둘 모두가 상이하고 (도 11C 참조), 한편 다른 게놈은 상이한 유전자좌에 위치된 enaC 를 갖는다 (비. 미코이데스 (B. mycoides)의 2개 단리주에 적용됨). (B) 바실러스 종 중에 ena1/2A-C 의 분포. Mashtree (Katz et al., 2019; Ondov et al., 2016)가 생성한 비. 세레우스 s.I. 그룹 및 비. 서브틸리스의 전체 게놈 클러스터링 및 Microreact에서 시각화 (Argimon et al., 2016). 비. 서브틸리스에 뿌리를 둔다. 종에 대한 형질 (유색 교점), 바지넷 (Bazinet) 분기점 및 ena 의 존재는 내부에서 외부로 하기 순서로 주변 4개 고리에 표시된다: 분기군은 Bazinet 2017 (입수가능한 경우) (Bazinet, 2017), 및 enaA, enaB 및 enaC 의 존재에 따라서 주석이 달린다 (Ena1: 짙은 청록색, Ena2: 오렌지색, 상이한 유전자좌: 청록색). 상동체 또는 오솔로그가 발견되었을 때, 고리는 회색이다. Ena1A-C 및 Ena2A-C는 NMH 0095/75 균주의 Ena1A-C와 각각, > 80% 및 50-65% 서열 동일성 및 >90% 커버리지를 갖는 상응하는 게놈에서 발견되었을 때 오솔로그 또는 상동체로서 정의된다. https://microreact.org/project/5UixxEY9vr2AVzXDVwa5t/8bcae82d에서 접속가능한 상호작용 트리.
도 7. Ena 형상 및 견고성.
(A, B) 2개 Ena 형상: S-형 (검은색 화살촉) 및 L-형 Ena (흰색 화살촉)를 나타내는 비. 세레우스 NVH 0075/95 내생포자의 음성 염색 TEM (A), A개별 Ena 섬유로 분할된 이탈된 S-형 Ena 다발의 ALC 클로즈업 도면 (B). (C) 단리된 생체외 S-형 Ena의 음성 염색 TEM 이미지. 상이한 스트레스 하에 Ena 안정성을 시험하기 위해서, 샘플은 좌측에서 우측으로, 다음과 같이 처리되었다: (1) 미처리 대조군, (2) 1 mg/mL 프로테이나제 K로 1시간, (3) 오토클레이빙 (즉, 121℃에서 20분) 또는 43℃에서 4시간 건조 (4). 삽도는 처리된 Ena의 구조적 무결성을 평가하기 위해 2D 클래스 평균을 도시한다. S-형 Ena는 프로테이나제 K 처리, 오토클레이빙 및 43℃에서 건조에 내성인 것으로 확인되지만, 일부 섬유는 건조 시에 서브유닛 무결성을 상실하는 것으로 보인다 (삽도). 43℃에서 건조는 가뭄 동안 바실러스 포자가 마주하게 되는 조건을 모방할 수 있다.
도 8. S-형 Ena 구조 결정 및 재조합 생산.
(A) 3.2Å 분해능에서, 생체외 S-형 Ena에 대한 3D cryoEM 전위 맵의 대표적인 영역. 서열 FCMTIRY (SEQ ID NO:88)를 갖는 8량체 펩티드는 cryoEM 전위 맵 (스틱으로 표시됨)으로부터 신규로 추론되었고 비. 세레우스 NVH 0075/95 게놈의 BLAST 검색에 사용되었다. (B) DUF3992 함유 단백질에 상응하는 3개 ORF (KMP91697.1: Ena1A SEQ ID NO: 1, KMP91698.1: Ena1B SEQ ID NO: 8 및 KMP91699.1: Ena1C SEQ ID NO: 15)의 다수 서열 정렬로서, 여기서 전자의 2개는 EM 전위 맵 (청록색으로 음영)으로부터 추론된 것에 상응하거나 또는 그에 유사한 서열 모티프를 함유한다. 3개 ORF가 여기서 S-형 Ena 서브유닛 (주 텍스트 참조)에 상응하는 것으로 확인되고 이하 각각 Ena1A, Ena1B 및 Ena1C라고 한다. 구축 모델로부터 결정된 2차 구조 및 구조적 구성요소 (도 2 참조)는 서열 위에 개략적으로 도시된다 (Ntc: N-말단 연결부; 화살표는 도 2에 표시된, β-가닥에 상응함). (C) 이. 콜라이에서 발현되고, 변성 조건 (8 M 우레아) 하에서 친화성 정제되고, 표시된 바와 같이 β-머캅토에탄올 또는 TEV 프로테아제 (N-말단 6-His 태그 제거를 위함)로 처리된 재조합 Ena1B의 SDS PAGE. TEV 절단은 Ena1B 단량체의 예상 MW에 상응하는, 겉보기 MW 12.1 KDa의 종을 생성시킨다. (D) 리폴딩 이후에 형성된 rec1Ena1B 올리고머의 음성 염색 TEM 이미지. (E) recEna1B 올리고머가 치수 및 형태에서 S-형 Ena 섬유 (모델 - 우측)에서 발견된 단일 나선 회전부 또는 아크와 유사한 개방 초승달을 형성한다는 것을 보여주는 클로즈업 도면. N-말단 His-태그에 의한 입체 방해는 recEna1B 중합을 단일 나선 아크로 저지시키는 것으로 여겨진다. (F) recEna1B의 TEV 분해 이후에 형성된 Ena-유사 섬유의 음성 염색 이미지 및 2D 분류. N-말단 His-태그의 제거 시에, recEna1B는 생체외 S-형 Ena에 대해 발견된 것과 밀접하게 닮은 나선 성질을 갖는 섬유로 쉽게 조립된다.
도 9. 천연 S-형 Ena는 Ena1A 및 Ena1B 서브유닛 둘 모두로 구성된다.　
(A) 0.143의 컷오프에서 3.2Å의 최종 분해능을 나타내는, recEna1B 나선 재구성의 FSC 곡선 및 국소 분해능　히트맵 (삽도). FSC 곡선 및 국소 분해능은 3개 나선 회전부로 이루어진 용매 마크스를 사용하여 RELION3.0에서 후처리하여 계산되었다. (B, C) 맵에 도킹된 정밀화된 Ena1B 모델과, 생체외 (B) 및 recENA1B 필라멘트 (C)로부터 계산된 cryoEM 맵의 나란한 비교. 생체외 Ena 맵은 Ena1A 서열에서 아미노산 삽입 영역에 상응하는, 루프 3 (L3) 및 7 (L7) 근처 Ena1B 모델에 의해 설명되지 않은 특성을 보여준다 (도 8B). (D) 단일 Ena1B 서브유닛 상에서 차폐되고 CCPEM 패키지 (Burnley et al., 2017)의 TEMPy:Diffmap (Farabella et al., 2015)에 의해 계산된 recEna1B 맵 (분홍색) 및 recEna1B-생체외 편차 맵 (녹색). 양쪽 맵에서 편차는 L3, L7 및 Ntc의 배좌에 위치된다. (E) 좌측에서 우측으로, 항-Ena1A, 항-Ena1B 및 항-Ena1C 혈청으로 염색되고, 각각은 2차 항체로서 금-표지된 (10 nm) 항-토끼 IgG를 사용한, 생체외 S-형 Ena의 면역금 TEM. Ena1A 및 Ena1B 혈청으로 특이적 염색은 천연 EnA에서 양쪽 서브유닛의 존재를 확인해 준다. Ena1C 혈청에서 염색이 보이지 않았다.
도 10. S-형 Ena에서 서브유닛간 상호작용.
(A, B) S-형 Ena에서 측면 서브유닛-서브유닛 접촉의 리본 (A) 및 개략적 (B) 표시. 각 서브유닛의 BIDG 시트의 가닥 G는 다음 서브유닛의 CHEF β-시트의 가닥 C에 의해 확대된다. 양쪽 서브유닛은 각각 위의 9 또는 10 서브유닛에 위치된 서브유닛의 Ntc (파란색)를 통해서 공유적으로 가교결합된다. Cys11 및 Cys10은 서브유닛 i-10의 B 가닥의 잔기 24 및 서브유닛 i-9의 가닥 I의 Cys109와 디술피드 결합을 이룬다. (C, D) 원자 모델 표면 상의 전하 분포를 보여주는 S-형 Ena의 2개 나선 회전부 및 2개의 인접한 서브유닛의 쿨롱 전위 맵 (PyMOL에서 계산됨) (C). 각각의 서브유닛은 서브유닛 간 정전기적 안정화 상호작용을 담당하는 서브유닛간 표면에 잔기의 상보적 양성 및 음성 하전된 잔기의 패치를 보유한다. 유사하게, S-형 Ena에서 적층된 나선 고리는 전하 상보성 계면 (D)을 보인다.　
도 11. 바실러스 종 간 EnaA-C 단백질 서열 사이의 계통발생적 관계. Microreact (Argimon et al., 2016)으로 시각화시킨, FastTree v.2.1.8 (Price et al., 2010)에 의해 발생된 근사 우도 트리. 트리는 중간점에서 뿌리를 내린다. 교점은 주석달린 종에 따라서 채색된다. 추가 상세사항은 방법을 참조한다. (A) 593개 단리주의 Ena1A 및 Ena2A 이소폼 간 관계. Ena1A 및 Ena2A는 SEQ ID NO: 1로 정의된 Ena1A_GCF_001044825; KMP91697.1 단백질 서열과 각각, >80% 및 50-65% 서열 동일성 및 > 90% 커버리지를 갖는 오솔로그 또는 상동체로서 정의된다. https://microreact.org/project/5UixxEY9vr2AVzXDVwa5t/1a8558fd에서 접근가능한 상호작용 트리. B) 591개 단리주의 Ena1B 및 Ena2B 이소폼 간 관계. Ena1B, Ena1B_후보 및 Ena2B는 각각 SEQ ID NO:87에 정의된 Ena1B_NM_Oslo 단백질 서열과 각각 >80%, 60-80% 및 40-60% 서열 동일성 및 > 90% 커버리지를 갖는 오솔로그 또는 상동체로서 정의된다. https://microreact.org/project/jJ4pARvqf9gyT916sTar5u/1332f3b3에서 접속가능한 상호작용 트리. (C) 591개 단리주의 Ena1C 및 Ena2C 간 관계. Ena1C, Ena1C_후보 및 Ena2C_후보는 각각 SEQ ID NO:15 (KMP91699.1)로 정의된 Ena1C 단백질 서열과 >80%, 60-80% 및 40-60% 서열 동일성 및 > 90% 커버리지를 갖는 오솔로그 또는 상동체로서 정의된다. 또한, 일반적인 EnaA-B 유전자좌 이외의 게놈 내 다른 곳에서 오솔로그 또는 상동체가 발견된 단리주는 청록색으로 채색된다. Ena1C 상동체 또는 오솔로그가 결여된 단리주는 회색으로 채색된다. https://microreact.org/project/aQaqCUCJoj2mw55KQujbGY/099d7885에 접속가능한 상호작용 트리.
도 12: 생체내에서 재조합적으로 생산된 Ena1A S-형 섬유.
단량체 서브유닛의 재조합 발현 이후에 이. 콜라이의 세포질에서 형성된 음성적으로 염색된 Ena1A 섬유의 60k 배율 TEM 이미지.
도 13. 자가-조립을 위한 Ena 빌딩 블록의 개략도.
(A) S-형 섬유: 입체 블록을 보유하는 N-말단 연결부를 갖는 단량체 Ena1/2 서브유닛은 다량체, 나선 배열로 시험관내에서 자가-조립되지만, 고차 구조를 형성하는데 방해를 받는다. 이 배열의 다량체는 10개 내지 12개 단량체로 구성된다. (단백질가수분해 절단을 통한) 입체 블록의 제거는 수미식 입체구성으로 다량체의 적층 및/또는 양쪽 말단에 단량체 독립체의 도입을 촉발하여서, 무한 크기의 나선형, 섬유질 조립체를 발생시킨다.
(B) L-형 섬유: 입체 블록을 보유하는 N-말단 연결부를 갖는 단량체 Ena3A 또는 Ena1C 서브유닛은 다량체, 원형 배열로 시험관내 자가-조립되지만, 고차 구조를 형성하는데 방해를 받는다. 이러한 배열의 다량체는 7개 내지 9개 단량체로 구성된다. Ena3A 다량체의 (단백질가수분해 절단을 통한) 입체블록의 제거는 수미식 입체구성으로 상기 다량체의 적층을 촉발시켜서 무한 크기의 원통형, 섬유질 조립체를 발생시킨다.
도 14. Ena 다량체 및 섬유질 조립체의 상세한 구조적 조성.
(A) 나선 아크 다량체 및 S-형 섬유: (좌측-i) 나선 Ena 다량체의 상위 NS-EM 클래스 평균; (중간-ii) 시험관내 생산된 recEna1B cryoEM 부피로부터 유래된 나선 Ena 아크 배열의 상면도 및 측면도: Ena 단량체는 개별적으로 채색된다; (우측-iii) 인접한 아크의 C-말단 수신기 영역과 접속된 N-말단 연결부를 통해 연동된 수미식 적층된 Ena 아크로 구성된 나성 S-형 섬유.
(B) 원형 디스크 다량체 및 L-형 섬유: (좌측 -i) 시험관내 생산된 9량체 Ena1C 다량체의 상면도 및 측면도 cryo-EM 클래스 평균; (중간-ii) cryoEM 부피로부터 유래된 7량체 Ena3A 다량체, 및 9량체 Ena1C 고리 배열의 상면도 및 측면도: Ena 단량체 또는 서브유닛은 별개로 채색된다; (우측-iii) 인접한 고리의 C-말단 수신기 영역과 접속된 N-말단 연결부를 통해 연동된 수미식 적층된 Ena3A 7량체 고리로 구성된 7량체 L-형 섬유.
도 15. Ena1B 나노섬유 조작 부위.
recEna1B (SEQ ID NO:84) 구조는 여기서 루프 연결 가닥 E-F, B-C, H-I 및 D-E으로 단일 아미노산, 펩티드 또는 전체 도메인의 삽입을 위한 적합한 부위 (좌측), 또는 단일-부위 치환을 위한 부위 (우측: 붉은색으로 강조)를 입증하는데 사용된다.
도 16. Ena1/2A 단백질 서열의 다수 서열 정렬.
식별자는 Ena1A의 SEQ ID NO: 1-7 및 Ena2A의 SEQ ID NO: 21-28에 상응한다.
도 17. Ena1/2B 단백질 서열의 다수 서열 정렬.
식별자는 Ena1B의 SEQ ID NO: 8-14 및 Ena2B의 SEQ ID NO: 29-37에 상응한다.
도 18. Ena1/2C 단백질 서열의 다수 서열 정렬.
식별자는 Ena1C의 SEQ ID NO: 15-20 및 Ena2C의 SEQ ID NO:38-48에 상응한다.
도 19. Ena3 단백질 서열의 다수 서열 정렬.
SEQ ID NO: 49 - 80에 상응하는, 선택된 대표적인 Ena3 상동체의 다수 서열 정렬.
도 20. 재조합 Ena1B S-형 섬유의 음성 염색 투과 전자 현미경 사진.
3 μl의 1 mg.mL^-1 Ena1B 현탁액을 Cu-메쉬 포름바르 그리드에 침착시키고, miliQ와 이어서 1% (w/v) 우라닐 아세테이트로 3x 세척하였다.
도 21: Ena1B S-형 섬유로부터 생산된 박막.
(a) 실리콘처리된 커버 슬립 상의 반투명 Ena1B S-형 박막, 100 mg.mL^-1 Ena1B S-형 용액을 드롭-캐스팅 후 실리콘처리된 커버 슬립으로부터 이탈시킨 독립형 Ena1B S-형 박막의 (b) 상면도 및 (c) 측면도. 추정 두께는 21 μm이다.
도 22: Ena1B S-형 섬유로부터의 연질 히드로겔.
(a) 실리콘처리된 커버 슬립 상의 반투명 Ena1B S-형 박막, (b) 50 μl miliQ 적용을 통한 재수화 단계, (c) 과량 miliQ 물 제거 후 최종 히드로겔의 측면도, (d) 핀셋 사이에 잡혀있는 독립형, 반투명, Ena 히드로겔.
도 23. 4M MgCl ₂ (a), 5M NaCl (b) 및 100% (v/v) 에탄올에서 탈수 후 강화된 Ena 히드로겔 비드.
도 24. Ena3A 단백질로 구성된 L-형 섬유.
L-형 Ena에서 측면 (i/i+1) 및 축 (i/j) 서브유닛 - 서브유닛 접촉의 (a) 리본도 및 (b) 개략도. 고리간 가교결합은 이웃 고리의 서브유닛 j의 Cys8과 위치 Cys8 (i)에서 디술피드 결합을 형성하는 N-말단 연결부 (Ntc)를 통해서 확립된다; 하단 삽도: L-형 섬유의 cryoEM 2D 클래스 평균; (c) 3.5Å cryoEM 맵 (흰색의 투명 부피)으로 구축된 2개의 7량체 Ena3A 고리의 만화도; (d) 단일 Ena3A 7량체의 모델의 상면도 및 측면도; (e) 입체적으로 차단된 6xHis_TEV_Ena3A 다량체의 cryoEM 2D 클래스 평균 및 (f) 상응하는 cryoEM 부피.
도 25. Ena3A는 L-형 섬유 생산에 필수적이고 충분하다.
(a) TEV 프로테아제와 공-인큐베이션 후 정제된, 입체적으로 차단된 Ena3A 다량체로부터 수득된 짧은 L-형 섬유의 시험관내 조립; (b) 이. 콜라이에서 WT recEna3A의 재조합 발현 및 섬유 분획의 후속 단리 이후에 긴 L-형 Ena3A 섬유의 세포내 조립; (c) 비. 세레우스 NM 0095-75로부터 유래된 사중 Ena-녹아웃 균주 (Dena1A-1B-1C-ena3A)로부터의 성숙한 포자의 nsTEM 이미지: 임의의 내생포자 부속물의 완전한 부재를 입증하는 대표적인 이미지; (d) pENA3A로 형질전환된 사중 Ena-녹아웃 균주의 nsTEM 이미지: 포자 표면 상에서 L-형 섬유의 표현형 구제; (e) L-형 형상을 확인한 하단 삽도의 상응하는 2D 클래스와 함께 (d)에 도시된 구제 균주의 표면 상에서 L-형 Ena3A 섬유의 확대 이미지.
도 26. 다수의 선택된 Ena3A 상동체의 구조적 비교.
(좌측) 섬유에서 측방향 및 종방향 접촉을 기록하기 위해 3개 서브유닛을 보여주는 바실러스 세레우스 균주 ATCC_10987 (WP_017562367.1; SEQ ID NO:49)의 Ena3A L-형 Ena 섬유의 CryoEM 구조. Ena 서브유닛은 BIDG - CHEF 토폴로지를 비롯하여, Ntc라고 하고, 섬유에서 종방향 공유 접촉을 담당하는 N-말단 연장 펩티드를 갖는 8-가닥 β-샌드위치 폴드로 정의된다 (도 19). (우측) 선택된 Ena3A 상동체의 예상 구조. 각 구조에 대해서, 우리는 각 구조의 Cα 원자 i 및 기준 구조 (Ena3A의 cryoEM 모델: WP_017562367.1, SEQ ID NO: 49)의 상응하는 Cα 원자 간 원자 위치의 평균 제곱근 편차 (RMSD)를 비롯하여, 폴드 유사성 점수, 즉 Dali Z-점수를 제공한다. WP_049681018.1 (SEQ ID NO: 60) 및 WP_100527630.1 (SEQ ID NO:75) 경우에, 우리는 AlphaFold v2.0로 예측된 추정 구조를 제공한다. 벤치마크로서, 우리는 또한 우리의 기준 구조 Ena3A (WP_017562367.1)의 AlphaFold 모델을 제공하여서, 실험적 cryoEM 구조 및 AlphaFold 모델 간에 우수한 일치를 입증한다 (RMSD=1.05; Z=12.1).
도 27. S-형 섬유로 Ena2A의 시험관내 조립.
a) N-말단 6X His 차단제를 갖는 이. 콜라이 Bl21 DE3 pLysS에서 재조합적으로 발현된 다음에 TEV 프로테아제를 사용한 절단을 통해 차단제의 제거 이후 시험관내에서 조립된 Ena2a 필라멘트의 NS-TEM 현미경 사진. N-말단 차단제의 불완전 제거로 생성된 Ena2A 다량체 나선 (직경 ∼10 nm)을 강조한 사각형은 우측에, 개별 다량체의 현미경 사진 크롭-아웃에서 확대되었다. b) 초기에 수득된 Ena1B의 2D 클래스 평균을 닮은 더 높은 분해능 특성을 보여주는 시험관내 조립된 Ena2A 필라멘트의 Cryo-EM 2D 클래스 평균. 우측에, 비틀림 =31.01도 및 상승 = 3.15Å의 나선 매개변수로 나선 재구성하여 생성된 피치 ∼38Å 및 직경 110Å의 Ena2A 필라멘트의 3D 재구성 부피 (분해능= 5Å)의 스냅샷.
도 28. S-형 섬유로 Ena2A의 세포내 조립.
임의의 N-말단 차단제가 없는 Bl21 (DE3) C43 이. 콜라이에서 재조합적으로 발현된 Ena2A의 NS-TEM 이미지로서, 상단 우측 음성 염색 2D 클래스 평균은 S-Ena 섬유의 정체를 확인한다.
도 29. Ena2C는 시험관내에서 9량체 디스크 및 짧은 L-유사 필라멘트로 조립된다.
a) N-말단 6X His 차단제를 갖고, 이. 콜라이 Bl21 C43에서 재조합적으로 발현되고 나서, TEV 프로테아제를 사용한 절단으로 차단제의 제거 이후 시험관내에서 조립된 짧은 L-유사 Ena2C 필라멘트의 Cryo-EM 2D 현미경사진. 최종 필라멘트는 고도로 유연하고 구부러져서 닫힌 루프를 형성한다. b) 15-20개 Ena2C 9량체 디스크를 함유하는 대략 직경 70 nm의 Ena2C L-유사 필라멘트 닫힌 루프의 Cryo-EM 2D 현미경 사진 크롭-아웃. c) 다량체의 다양한 배향을 나타내는 Ena2C 8량체 디스크의 Cryo-EM 2D 클래스 평균.
도 30. Ena1B S-형 섬유 강도 및 가요성에 대한 Ntc 결실의 영향.
세포외 환경에 존재하는 재조합 Ena1BΔNtc 섬유 (a), 감소된 인장 강도 및 가요성의 결과로서 파열 (b) 및 균열점 (c-e)을 나타낸다.
도 31. ns-TEM를 통해서 모니터링된, S-형 섬유로 자가조립하는 Ena1B의 능력에 대한 입체 블록 길이의 영향.
(a) WT Ena1B S-형 섬유 - 입체 블록 없음 (N=0); (b) M-TEV-Ena1B (N=6); (c) M-His6-SSG-Ena1B (N=9). 스케일바는 100 nm를 나타낸다.
도 32. 펩티드 태그 삽입과 관련된 Ena1B 루프의 조작가능성의 입증.
루프 DE 및 HI (도 15에 표시된 바와 같음), 및 선형 태그 FLAG 및 HA의 삽입에 대한 예가 도시된다.
도 33. a-Ena1B, a-HA 및 a-FLAG 1차 항체를 사용한 WT Ena1B 및 다양한 루프-변형된 Ena1B 구성체 (DE-HA, DE-FLAG, HI-HA)의 웨스턴 블롯 분석.
모든 4개 구성체 (WT Ena1B의 경우 SEQ ID NO:8, 및 Ena1B 삽입 변이체 경우 SEQ ID NO: 140-142)는 이. 콜라이에서 발현시켰고 이후 전체 세포 용해물 및 가용성 분획을 SDS-PAGE에 로딩하였다. 항-Ena1B 패널: 스태킹 겔에 유지된 Ena1B의 고분자량 밴드는 SDS-불용성 섬유에 상응한다 (도 32의 nsTEM 이미지 참조); 항-HA 및 항-FLAG 패널: DE-HA, HI-HA 및 DE-FLAG의 섬유 분획은 각각 a-HA 및 a-FLAG에 대해 양성 염색되어서, Ena1B가 섬유 초미세구조로 조립될 때 펩티드 태그의 표면 접근가능성을 입증한다.
도 34. Ena1B는 분할 Ena 구성체의 공-발현 시, 세포내에서 S-형 Ena 섬유로 조립된다.
각각 Ala30 또는 Ala100에서 BC 또는 HI 루프에서 Ena1B의 분할. a) 분할-BC Ena1B S-Ena의 NS-TEM 현미경 사진. 분할 절반, 즉 가닥 AB (오렌지색) 및 가닥 CDEFGHI (녹색)를 강조한 분할 Ena1B 구조의 상단 좌측 만화도. 상단 우측 박스에서, 잘라서 확대한 이미지는 S-Ena 필라멘트의 존재를 확인한다. b) 분할-HI Ena1B S-Ena의 NS-TEM 현미경 사진. 분할 절반, 즉 가닥 I (자홍색) 및 가닥 ABCDEFGH (녹색)을 강조한 분할 Ena1B 구조의 상단 좌측 만화도. 상단 우측 박스에서, 잘라서 확대한 이미지는 S-Ena 필라멘트의 존재를 확인한다.
도 35. 고형 지지체 상에서 S-형 섬유의 에피택셜 성장.
스케일바는 100 nm를 나타낸다.
도 36. 고형 표면의 비-공유 Ena 섬유 기능화.
스트렙타비딘-코팅된 금 비드 상에서 바이오틴화된 Ena1B S-형 섬유의 nsTEM 분석 현미경 사진.
도 37. Ena 섬유 네트워크를 변형시키기 위한 부위-지정 돌연변이유발에 의한 Ena 단백질의 조작.
Ena1B S-형 섬유에 대한 부위-지정 돌연변이유발 부위: 표면 노출된 잔기 T31이 시스테인 잔기로 돌연변이유발을 위해 선택되었다 (a); Ena1B T31C의 이. 콜라이에서 재조합적으로 발현된 생체외 정제된 섬유의 상응하는 ns-TEM 이미지 (b) 및 점선 흰색 박스에 상응하는 확대도. (c); Ena3A L-형 섬유에 대한 부위-지정 돌연변이유발 부위: 표면 노출된 잔기 T40 및 T69가 시스테인 잔기로 돌연변이유발을 위해 선택되었다 (d); 이. 콜라이 Ena3A T40C 및 Ena3A T69C에서 재조합적으로 발현된 생체외 정제된 섬유의 상응하는 ns-TEM 이미지. 스케일바는 100 nm (c) 또는 200 nm (e-f)에 상응한다. 가교 결합된 Ena 섬유는 강화된 다발 또는 '로브', 및 클러스터링된 히드로겔로 조립된다.
도 38. Alphafold 예측을 사용한 다수의 선택된 Ena 상동체의 구조적 비교. Ena1B (UniProt. A0A1Y6A695)에 대한 Cryo-EM 구조는 Ena1B 그 자체, 및 예측된 Ena2A (NCBI ID: WP_001277540.1; SEQ ID NO:145), WP_017562367.1 및 WP_041638338.1 단백질 서열에 대한 Alphafold 예측된 폴드 구조와 비교되었다. 각 구조의 원자 i 및 기준 구조 (Ena1B의 cryoEM 모델 - Uniprot: A0A1Y6A695; SEQ ID NO:8에 상응)의 상응하는 원자 간 원자 위치의 RMSD, 평균 제곱근 편차를 비롯하여, 폴드 유사성 점수, 즉 Dali Z-점수 (Jumper et al., 2021 Nature; doi.org/10.1038/s41586-021-03819-2).

본 발명은 특정 구현예에 대해서 일정 도면을 참조하여 설명되지만, 이것이 아닌 청구항에 의해서만 제한된다. 청구항의 임의의 참조 기호는 범주를 제한하는 것으로 해석되어서는 안된다. 물론, 반드시는 아니지만 모든 양태 또는 장점은 본 발명의 임의의 특정한 구현예에 따라서 달성될 수 있다는 것을 이해한다. 따라서, 예를 들어, 당업자는 본 발명이 본 명세서에서 교시될 수 있거나 또는 제안될 수 있는 다른 양태 또는 장점을 반드시 획득하지 않고 본 명세서에 교시된 바와 같은 하나의 장점 또는 장점의 그룹을 달성하거나 또는 획득하는 방식으로 구현될 수 있거나 또는 수행될 수 있다는 것을 인식할 것이다. 이의 특성 및 장점과 함께, 구성 및 작동 방법에 관한 본 발명이 첨부된 도면과 함께 읽혀질 때 하기 상세한 설명을 참조하여 최고로 이해될 수 있다. 본 발명의 양태 및 장점은 이하 본 명세서에 기술된 구현예(들)로부터 자명할 것이고 그에 의해서 명료해질 것이다. "한 구현예" 또는 "일 구현예"에 대한 본 명세서 전반에서의 언급은 구현예와 함께 기술된 특정한 특성, 구조 또는 특징이 본 발명의 적어도 하나의 구현예에 포함된다는 것을 의미한다. 따라서, 본 명세서 전반의 다양한 위치에서 '일 구현예에서' 또는 '한 구현예에서"의 어구 출현은 반드시 모든 동일한 구현예를 언급하지 않지만, 그럴 수도 있다.

정의

단수 명사를 언급할 때 정관사 또는 부정관사, 예를 들어 "한", "일" 또는 "그"가 사용되는 경우에, 이것은 특별히 그외 다른 것을 언급하지 않으면 그 명사의 복수를 포함한다. 용어 "포함하는"이 본 명세서 및 청구항에서 사용되는 경우에, 다른 구성요소 또는 단계를 배제하지 않는다. 또한, 명세서 및 청구항에서 용어 제1, 제2, 제3 등이 유사한 구성요소를 구별하는데 사용되고, 반드시 순차적 또는 연대기적 순서를 설명하는데 사용되는 것은 아니다. 이렇게 사용되는 용어는 적절한 상황 하에서 상호교환가능하고 본 명세서에 기술된 본 발명의 구현예는 본 명세서에서 기술되거나 또는 예시되는 것 이외의 다른 순서로 작동될 수 있다는 것을 이해해야 한다. 하기 용어 또는 정의는 오로지 본 발명의 이해를 돕기위해 제공된다. 본 명세서에서 특별히 정의되지 않으면, 본 명세서에서 사용되는 모든 용어는 본 발명의 분야의 당업자에게 동일한 의미를 갖는다. 실무자는 특히 당분야의 정의 및 용어에 대해서, 하기 문헌을 따른다: Sambrook et al., Molecular Cloning: A Laboratory Manual, 4^th ed., Cold Spring Harbor Press, Plainsview, New York (2012); and Ausubel et al., Current Protocols in Molecular Biology (Supplement 114), John Wiley & Sons, New York (2016). 달리 정의하지 않으면, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 당분야 (예를 들어, 분자 생물학, 생화학, 구조 생물학, 및/또는 계산 생물학)의 당업자가 통상적으로 이해하는 바와 동일한 의미를 갖는다.

본 명세서에서 사용되는 용어 "핵산 서열", "DNA 서열" 또는 "핵산 분자(들)"는 임의 길이의 뉴클레오티드의 중합체 형태, 리보뉴클레오티드 또는 데옥시리보뉴클레오티드를 의미한다. 이 용어는 분자의 1차 구조만을 의미한다. 따라서, 이 용어는 이중-가닥 및 단일-가닥 DNA, 및 RNA를 포함한다. 또한, 기지 유형의 변형, 예를 들어, 메틸화, 유사체에 의하 천연 발생 뉴클레오티드의 하나 이상의 "캡" 치환를 포함한다. "핵산 구성체"란 자연계에서 함께 발견되지 않는 하나 이상의 기능성 유닛을 포함하도록 구성된 핵산 분자를 의미한다. 예는 원형, 선형, 이중-가닥, 염색체외 DNA 분자 (플라스미드), 코스미드 (람다 파지 유래 COS 서열을 함유하는 플라스미드), 비천연 핵산 서열을 포함하는 바이러스 게놈 등을 포함한다. "코딩 서열"은 적절한 조절 서열의 제어 하에 존재할 때 mRNA로 전사 및/또는 폴리펩티드로 번역되는, 뉴클레오티드 서열이다. 코딩 서열의 경계는 5'-말단에 번역 출발 코돈 및 3'-말단에 번역 중지 코돈에 의해 결정된다. 코딩 서열은 mRNA, cDNA, 재조합 뉴클레오티드 서열 또는 게놈 DNA를 포함할 수 있지만, 이에 제한되지 않는 한편, 인트론은 일정 상황 하에서 역시 존재할 수 있다. 본 명세서에서 사용되는 "유전자의 프로모터 영역" 또는 "조절 구성요소"는 코딩 서열에 작동적으로 연결되고 가능하게 적절한 유도 조건 하에 배치될 때, 상기 코딩 서열의 전사를 촉진하기에 충분한 기능성 DNA 서열 유닛을 의미한다. "작동적으로 연결된"은 이렇게 기술된 성분이 그들의 의도하는 방식으로 기능하도록 허용하는 관계에 있는 병치를 의미한다. 코딩 서열인 핵산 분자에 "작동적으로 연결된" 프로모터 서열은 프로모터 서열과 상용성인 조건 하에서 코딩 서열의 발현이 달성되는 방식으로 결찰된다. 본 명세서에서 사용되는 "유전자"는 유전자의 프로모터 영역을 비롯하여 코딩 서열을 포함한다. 이것은 프로모터 서열에 작동적으로 연결되는, 스플라이싱된 메신저로부터 유래되는 cDNA 뿐만 아니라, 게놈 서열 (가능한 인트론 포함) 둘 모두를 의미한다. 용어 "종결자" 또는 "전사 종결 신호"는 1차 전사물의 3' 프로세싱 및 폴리아데닐화 및 전사의 종결에 신호전달하는 전사 유닛 말단에 DNA 서열인 제어 서열을 포괄한다. 종결자는 천연 유전자, 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래될 수 있다. 첨가하려는 종결자는 예를 들어, 노팔린 신타제 또는 옥토핀 신타제 유전자, 또는 대안적으로 다른 유전자로부터 유래될 수 있다. "키메라 유전자" 또는 "키메라 구성체" 또는 "키메라 유전자 구성체"는 프로모터 또는 조절 핵산 서열이 mRNA를 코딩하는 핵산 서열에 작동적으로 연결되거나, 또는 그와 회합되어서, 프로모터 또는 조절 핵산 서열이 회합된 핵산 코딩 서열의 전사 또는 발현을 조절할 수 있게 되는 재조합 핵산 서열 분자를 의미한다. 키메라 유전자의 조절 핵산 서열은 자연계에서 발견되는 바와 같이 회합된 핵산 서열에 작동적으로 연결되지 않고, 코딩 핵산 서열 분자에 이종성일 수 있는데, 이의 서열이 키메라 구성체에서 존재하는 바와 같이 동일한 성상으로 자연계에 존재하지 않는다는 것을 의미한다. 보다 일반적으로, 용어 "이종성"은 이의 기원과 상이한 서열 또는 분자로서 본 명세서에서 정의된다.

용어 "단백질", "폴리펩티드", 및 "펩티드"는 아미노산 잔기의 중합체 및 변이체 및 이의 합성 유사체를 의미하기 위해서 본 명세서에서 또한 상호교환적으로 사용된다. 단량체 또는 프로토머는 아미노-말단에서 카르복시-말단으로 단일 폴리펩티드 사슬로서 정의된다. 본 명세서에서 사용되는 "단백질 서브유닛"은 다량체 단백질 복합체 또는 조립체의 일부를 형성할 수 있는, 단량체 또는 프로토머를 의미한다.

용어 "키메라 폴리펩티드", "키메라 단백질", "키메라", "융합 폴리펩티드", "융합 단백질"은 본 명세서에서 상호교환적으로 사용되고, 동일한 단백질로부터 기원할 수 있거나 또는 그렇지 않을 수 있는 적어도 2종의 별개의 구별되는 폴리펩티드 서분을 포함하는 단백질을 의미한다. 용어는 또한 인간이 만든 것을 의미하는 비-천연 발생 분자를 의미한다. (본 명세서에 정의된 바와 같은) 키메라 폴리펩티드를 언급할 때, 용어 "∼에 융합된", 및 다른 문법적 등가물, 에컨대 "공유적으로 연결된", "연결된", "부착된", "결찰된", "접합된"은 둘 이상의 폴리펩티드 성분을 연결하기 위한 임의의 화학적 또는 재조합 기전을 의미한다. 둘 이상의 폴리펩티드 성분의 융합은 서열의 직접 융합일 수 있거나, 또는 예를 들어 개재 아미노산 서열 또는 링커 서열, 또는 화학적 링커에 의한, 간접 융합일 수 있다. Ena 단백질 또는 본 명세서에 기술된 바와 같은 다른 관심 단백질에 아미노산 잔기 또는 (폴리)펩티드의 융합은 공유 펩티드 결합일 수 있거나, 또는 화학적 연결에 의해 수득된 융합을 의미한다. 본 명세서에서 사용되고, "∼에 연결된", "∼에 접합된", "∼에 결찰된"으로서 본 명세서에서 상호교환적으로 사용되는 용어 "∼에 융합된"은 예를 들어, 재조합 DNA 기술을 비롯하여, 안정한 공유 연결을 생성시키는 "화학적 및/또는 효소적 접합"에 의한 "유전자 융합"을 의미한다.

용어 "분자 복합체" 또는 "복합체"는 단백질 또는 화학적 독립체일 수 있는, 적어도 하나의 다른 분자와 회합된 분자를 의미한다. 용어 "∼와 회합된"은 화학적 독립체 또는 화합물, 또는 이의 일부, 및 단백질 상의 결합 포켓 또는 결합 부위 간에 근접 상태를 의미한다. 본 명세서에서 사용되는 용어 "단백질 복합체" 또는 "단백질 조립체" 또는 "다량체"는 거대분자 중 적어도 하나는 단백질인, 둘 이상의 회합된 거대분자의 그룹을 의미한다. 본 명세서에서 사용되는 단백질 복합체 또는 조립체는 전형적으로 생리적 조건 하에서 형성될 수 있는 거대 분자의 결합 또는 회합을 의미한다. 단백질 복합체, 예컨대 단백질 서브유닛 또는 프로토머의 개별 구성원은 비-공유 또는 공유 상호작용에 의해 연결된다. "결합"은 간접적이거나 또는 직접적인, 임의의 상호작용을 의미할 수 있다. 직접 상호작용은 결합 파트너 간 접촉을 의미한다. 간접 상호작용은 상호작용 파트너가 2개 초과의 분자의 복합체에서 상호작용하는, 임의의 상호작용을 의미한다. 상호작용은 하나 이상의 가교 분자의 도움으로 완전하게 간접적일 수 있거나, 또는 하나 이상의 분자의 추가적인 상호작용에 의해 안정화되는, 파트너 간 직접 접촉이 여전히 존재하는 경우에, 부분적으로 간접적일 수 있다. 결합 또는 회합은 예를 들어 병치가 수소 결합 또는 반 데르 발스 또는 정전기적 상호작용에 의해 에너지적으로 선호되어서, 비-공유적일 수 있거나, 또는 예를 들어 펩티드 또는 디술피드 결합에 의해 공유적일 수 있다.

단백질 복합체가 다량체일 수 있다는 것을 이해한다. 단백질 복합체 조립체는 동종-다량체 또는 이종-다량체 복합체의 형성을 일으킬 수 있다. 또한, 상호작용은 안정할 수 있거나 또는 일시적일 수 있다. 또한, 용어 "다량체(들)", "다량체 복합체" 또는 "다량체 단백질(들) 또는 조립체"는 다수의 동일하거나 또는 이종성인 폴리펩티드 단량체"를 포함한다. 폴리펩티드는 다수의 단일 폴리펩티드 단량체의 자가-조립 (즉, "동종-다량체 조립체") 또는 다수의 상이한 폴리펩티드 단량체의 자가-조립 (즉, "이종-단량체 조립체")으로 형성되는 다량체 조립체 (즉, 이량체, 삼량체, 오량체, 육량체, 7량체, 8량체 등)로 자가-조립될 수 있다. 본 명세서에서 사용되는 "다수"는 2 이상을 의미한다. 다량체 조립체는 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 또는 그 이상의 폴리펩티드 단량체를 포함한다. 다량체 조립체는 임의 목적으로 사용될 수 있고, 다양한 단백질 "나노물질"를 개발하기 위한 방식을 제공한다. 유한한, 케이지-유사 또는 쉘-유사 단백질 조립체이외에도, 그들은 적절한 목표 대칭 아키텍처를 선택하여 디자인될 수 있다. 본 발명의 단량체 또는 프로토머 및/또는 다량체 조립체는 계층적 조립의 수반되는 장점과 함께, 고차 조립체, 예컨대 섬유의 디자인에서 사용될 수 있다. 최종 다량체 또는 섬유질 조립체는 우수한 강성 및 단분산성을 갖는 고도로 정렬된 물질이고, 다량체 또는 섬유 그 자체로 기능성일 수 있거나, 또는 고급 기능성 물질, 예컨대 다량체 조립체 또는 섬유를 함유하는 표면, 및 광범위 적용성을 갖는 맞춤-디자인된 분자 기계의 기초를 형성한다. 보다 특히, 본 명세서에서 사용되는 다량체는 서로 비공유적으로 회합되어서 아크, 회전부, 고리 또는 디스크-유사 구조를 형성하고/하거나, 추가로 변형되어 나노섬유의 자가-조립 또는 촉발된 형성으로 성장 또는 발달하는 동종다량체 또는 이종다량체 단백질 복합체를 의미한다. 상기 다량체 조립체는 본 명세서에 정의된 바와 같은 Ena 단백질, 또는 Ena 단백질 변이체, 돌연변이체, 및/또는 조작된 Ena 단백질을 비롯하여, 조작된 다량체라고 하는 상기 Ena 단백질-기반 다량체에 회합되어서, 일정 적용에 필요한 추가 변형을 향해서 상기 다량체를 확장시킬 수 있는 다른 단백질을 함유할 수 있다.

"단백질 도메인"은 단백질의 별개의 기능적 및/또는 구조적 단위이다. 일반적으로, 단백질 도메인은 단백질의 전체 역할에 기여하는, 특정 기능 또는 상호작용을 담당한다. 도메인은 다양한 생물학적 상황에서 존재할 수 있고, 여기서 유사한 도메인이 상이한 기능을 갖는 단백질에서 발견될 수 있다. 단백질 2차 구조 구성요소 (SSE)는 전형적으로 이의 3차원 3차 구조로 단백질 폴딩 전에 중간체로서 자발적으로 형성된다. 단백질의 2가지 가장 일반적인 2차 구조 구성요소는 알파 나선 및 베타 (β) 시트이지만, β-회전부 및 오메가 루프도 역시 발생된다. 베타 시트는 적어도 2개 또는 3개의 골격 수소 결합에 의해 측면에서 연결된 베타 가닥 (또한 β-가닥)으로 이루어져서, 일반적으로 뒤틀린, 주름잡힌 시트를 형성한다. β-가닥은 연장된 입체구성의 골격을 갖는 전형적으로 3 내지 10개 아미노산 길이인 폴리펩티드 사슬의 스트레치이다. β-회전부는 폴리펩티드 사슬 방향으로 변화를 야기하는 단백질의 비규칙적 2차 구조 유형이다. 베타 회전부 (β 회전부, β-회전부, β-벤드, 타이트 회전부, 역 회전부)는 주로 β-가닥을 연결하는 역할을 하는, 단백질 및 폴리펩티드의 매우 일반적인 모티프이다.

"재조합 폴리펩티드"란, 재조합 기술을 사용하여, 즉 시험관내 및/또는 세포 상황에서 수득될 수 있는, 재조합 또는 합성 폴리뉴클레오티드의 발현을 통해서 만들어진 폴리펩티드를 의미한다. 키메라 폴리펩티드 또는 이의 생물학적 활성 부분이 재조합적으로 생산되는 경우에, 이것은 또한 바람직하게 배양 배지가 실질적으로 없고, 다시 말해서, 배양 배지는 단백질 조제물의 부피의 약 20% 미만, 보다 바람직하게 약 10% 미만, 및 가장 바람직하게 약 5% 미만을 나타낸다. "단리된" 또는 "정제된"이란 일반적으로 이의 천연 상태에서 이것을 동반하는 성분이 실질적으로 또는 본질적으로 없는 물질을 의미한다.

단백질의 "상동체", "상동체"는 대상 비변형 또는 야생형 단백질에 비해서 아미노산 치환, 결실, 및/또는 삽입을 갖고, 그들이 유래된 비변형된 단백질과 유사한 생물학적 및 기능적 활성을 갖는 펩티드, 올리고펩티드, 폴리펩티드, 단백질 및 효소를 포괄한다. 본 명세서에서 사용되는 용어 "아미노산 동일성"은 비교창 상에서 아미노산별로 서열이 동일한 정도를 의미한다. 따라서, "서열 동일성의 백분율"은 비교창 상에서 2개의 최적으로 정렬된 서열을 비교하고, 양쪽 서열에서 동일한 아미노산 잔기 (예를 들어, 본 명세서에서 1-글자 코드로도 표시되는, Ala, Pro, Ser, Thr, Gly, Val, Leu, Ile, Phe, Tyr, Trp, Lys, Arg, His, Asp, Glu, Asn, Gln, Cys 및 Met)가 존재하는 위치의 개수를 결정하여 일치되는 위치의 개수를 산출하고서, 일치하는 위치의 개수를 비교창의 전체 위치 개수 (즉, 창 크기)로 나누고, 그 결과에 100을 곱해서 서열 동일성의 백분율을 산출함으로써 계산된다. 본 명세서에서 사용되는 "치환" 또는 "돌연변이"는 부모 단백질의 아미노산 서열 또는 뉴클레오티드 서열 또는 이의 단편과 개별적으로 비교하여, 상이한 아미노산 또는 뉴클레오티드로 하나 이상의 아미노산 또는 뉴클레오티드의 치환에 의해서 생성된다. 단백질 또는 이의 단편은 단백질의 활성에 실질적으로 효과를 갖지 않는 보존성 아미노산 치환을 가질 수 있다는 것을 이해한다. 본 명세서에서 제공되는 아미노산 동일성의 백분율은 바람직하게 천연 또는 천연 야생형 단백질, 또는 언급되는 특정 아미노산 서열의 전체 길이에 상응하는 비교창을 고려한 것이다.

용어 "야생형"은 천연 발생 공급원으로부터 단리되거나, 세포, 세포주 또는 유기체에 포함되는, 유전자 또는 유전자 생산물을 의미한다. 야생형 유전자 또는 유전자 생산물은 개체군에서 가장 빈번하게 관찰되고, 따라서 자연계에서 관찰되는 유전자 또는 유전자 생산물의 "정상" 또는 야생형" 형태로 임의로 디자인된다. 대조적으로, 용어 "변형된", "조작된", "돌연변이체" 또는 "변이체"는 야생형 또는 천연-발생 유전자 또는 유전자 생산물과 비교했을 때 서열, 번역후 변형 및/또는 기능적 성질의 변형 (즉, 변경된 특징)을 나타내는 유전자 또는 유전자 생산물을 의미한다. 녹-아웃은 비-기능적 유전자 생산물 및/또는 기능을 제공하도록 변형되거나 또는 돌연변이체이거나 또는 결실된 유전자를 의미한다. 천연 발생 돌연변이체 또는 변이체가 단리될 수 있다는 것을 유의하고, 이들은 야생형 유전자 또는 유전자 산물과 비교했을 때 변경된 특징, 및 기준 유전자 또는 단백질과 비교했을 때 상이한 서열을 갖는다는 사실을 통해서 확인된다.

상세한 설명

본 발명은 차세대 생체물질로서 몇몇 성상으로 적용가능한 신규한 단백질 조립체에 관한 것이다. 본 명세서에 개시되는 다량체 조립체의 생성은 바실러스 내생포자 부속물 (Ena)의 구조적 및 유전적 기초의 해독을 기반으로 하여서, 특별한 성질을 갖고 수많은 적용 잠재성을 갖는 견고하지만 유연한 구조물의 생산을 위해 이들 단백질 조립체를 조작하고 조정할 많은 기회를 이끈다. 이들 다량체 및 섬유질 조립체의 빌딩 블록으로서 Ena 단백질 패밀리의 확인은 단백질의 자가-조립 성질을 박테리아 단백질 패널에 존재하는 DUF3992 단백질 도메인의 존재와 직접적으로 상관시켜서, 다량체 조립체를 형성하도록 허용한다. 또한, DUF3992 도메인의 존재는, 다량체 조립체를 종방향으로 강성 섬유에 공유적으로 연결하도록 허용하는, 모티프 ZX_nC(C)X_mC (여기서, Z는 Ile, Phe, Leu 또는 Val이고, n은 1 또는 2 잔기이고, m은 10-12 잔기이고, C는 Cys이고, X는 임의 아미노산임)에 의해 제공되는, 적어도 2개의 보존된 시스테인 잔기를 포함하는, 보존된 N-말단 연결부 영역과 조합하여 DUF3992 HMM 프로파일 (표 1에 제공)에 대한 준수에 의해 결정된다. 섬유의 가요성은 N-말단 근처 12-15 aa 스페이서 영역의 특징에 의해서 유지되어서, 적층된 다량체 간에 갭을 유지하도록 허용한다 (도 3 참조).

신규한 원핵생물 자가-조립 단백질 패밀리, Ena 단백질.

본 발명의 제1 양태는 허용되는 완충 조건 하에서 자가-조립 단백질 다량체 조립체를 수득하는데 필요한 구조적 구성요소를 제공하는, DUF3992 도메인을 포함하는, 자가-조립 단백질 서브유닛에 관한 것이다. 이러한 상황에서, '자가-조립'은 외부 제어 또는 주형없이 그들의 상호적 비-공유적 상호작용 덕분에 정렬된 초분자 구조로 분자의 자발적 조직을 의미한다. 개별 분자의 화학적 및 입체형태적 구조는 이들이 어떻게 조립되는가에 대한 설명을 전달한다. 동일하거나 또는 상이한 분자는 분자 자가-조립 시스템의 빌딩 블록을 구성할 수 있다. 일반적으로, 상호작용은 덜 정돈된 상태에서, 예컨대 용액, 무작위 코일에서, 또는 결정 또는 폴딩된 거대분자, 또는 거대분자의 추가 조립체일 수 있는, 정돈된 최종 상태로 이어지는 무질서한 응집체에서 확립된다. 잘 정돈된 구조로 소형 분자 또는 단백질의 회합은 따라서 에너지 최소화를 기반으로 하는, 열역학 원리에 의해 구동된다. 분자 조립 과정에 관여되는 상호작용은 정전기, 소수성, 수소 결합, 반 데르 발스 상호작용, 방향족 스태킹, 및/또는 금속 배위이다. 비-공유적이고 개별적으로 약하지만, 이들 힘은 고도로 안정한 조립체를 생성할 수 있고 최종 조립체의 형태 및 기능을 지배할 수 있다 (Lombardi et al., 2019). 본 명세서에 기술되고, 본 명세서에서 Ena 단백질이라고 불리는, 상기 자가-조립 단백질 서브유닛은 상이한 상황 및 생체물질에서 적용하려고 본 명세서에서 고려되는 자가-조립 다량체 및 단백질 섬유를 형성할 수 있다. 다량체 또는 섬유질 조립체는 빌딩 블록, 또는 서브유닛, 보다 특히 본 명세서에 기술된 바와 같은 단리된 자가-조립 단백질, Ena 단백질이라고 불리는 기존 성분으로부터 수득될 수 있다.

또한, 본 명세서에 기술된 다른 구현예는 본 명세서에서 언급되는 바와 같은, '변형된' 또는 '조작된' 빌딩 블록 또는 단백질 서브유닛, 또는 조립체에 관한 것이고, 그들 자가-조립체를 코딩하는 모든 필요한 정보를 함유하는, 새로운 단위, 또는 새로운 기능성을 갖는 단위를 생성하도록 화학 조성, 길이, 및 상호작용의 비방향성을 변화시켜서 수득되는 존재하는 (천연) 것으로부터 디자인되거나 또는 유래되는 것으로 정의된다. 환경 변수를 제어하여서, 시스템은 새로운 열역학적 최소값에 도달하여 상이한 정렬된 구조를 야기한다. 대부분의 경우에, 단백질 서브유닛 자가-조립체는 비-공유 상호작용에 의해 발생되므로, 그들 자가-조립은 가역적이고 환경에 민감하며, 활성은 단백질의 회합 및 해리를 제어하여 조율될 수 있다. 이들 단백질의 자가-조립 성질은 DUF3992 도메인의 존재에 의해 제공된다.

'미지 기능의 도메인' 또는 'DUF' 단백질 패밀리는 가칭으로 지정되고 단백질 기능이 확인된 이후에 보다 특정한 명칭으로 개명 (또는 기존 도메인에 병합)되는 경향이 있다. 따라서, 본 발명은 사실 본 명세서에 기술된 바와 같이, 또한 역시 Ena1B 단백질 폴드에 일치되는 원핵생물 DUF3992 도메인-함유 단백질에 대한 자가-조립의 기능을 최초로 정의하지만, DUF3992-함유 단백질은 기능적으로 특징규명되지 않고, 박테리아에서, 전형적으로 98 내지 122 아미노산 길이로 존재하는, 단백질 패밀리로서 알려진 PFAM 데이터베이스에 존재한다. PFAM 데이터베이스 (version 33.1)는 또한 기능적으로 중요할 수 있는 단일한 완전하게 보존된 잔기 T가 존재한다고 언급한다 (El-Gebali et al. 2019, The Pfam database; http://pfam.xfam.org/family/PF13157). 이러한 '미지 기능의 도메인' 3992는 PFAM13157 패밀리에 대한 PFAM 데이터베이스에서 또한 제공되는, 이러한 특정 DUF3992 단백질 도메인을 포함하는 것으로 알려진 64개 박테리아 단백질 (Pfam-B_480 release 24.0)의 정렬에 따라 수득되는 은닉 마르코프 모델 (HMM)에 의해서 구조적으로 특징규명된다 (본 명세서에서 제공되는 표 1을 또한 참조). PFAM13157 패밀리의 DUF3992 도메인 단백질에 대한 HMM 프로파일은 또한 http://pfam.xfam.org/family/PF13157#tabview=tab4 에 표시되고, [Wheeler et al. (2014)]에서 처럼 다음과 같이 해석된다: '은닉 마르코프 모델은 각 위치에 대해 글자 스택을 그려서 도시되고, 여기서 스택의 높이는 그 위치에서 보존에 상응하고, 스택 내 각 글자의 높이는 그 위치에서, 그 글자의 빈도에 의존한다'.

따라서, 미지 기능의 가상 단백질로서 데이터베이스에서 이전에 표시된, DUF3992 도메인을 포함하는 자발적으로 조립되는 단백질의 이러한 그룹은 이제 박테리아 Ena 단백질 패밀리의 정의를 구성하는 일부일 수 있다. 따라서, Ena 단백질 패밀리는 100 내지 160 아미노산 길이를 갖고, 고차 구조 다량체로 자발적으로 조립되는 능력을 갖는, 표 1에서 본 명세서에서 제공되는 것과 정렬된 그들 HMM 프로파일을 기반으로 단백질을 분류하는 박테리아 DUF3992로서 정의되고, 바람직하게 상기 다량체는 종방향 공유 디술피드 가교의 형성에 의해 안정화된, 섬유질 구조로 더욱 조립되는 능력을 갖는다. 또한, Ena 단백질의 구조적 정의는 Ena 폴드를 갖는 이들 박테리아 DUF3992 자가-조립 단백질에 관한 것으로서, Ena 폴드는 6.5 이상의 Z-점수를 갖고, 섬유에서 선행 서브유닛과 공유 연결을 위해 보존된 Z-X_n-C(C)-X_m-C 모티프 (여기서 X= 임의 아미노산이고, Z= Leu/Val/Ile/Phe이고, n=1 내지 2 잔기이고, m=10 내지 12 잔기이고, C= Cys임)를 함유하는 N-말단 'Ntc' 구성요소를 가지고, 본 명세서에서 제공되는 기준 Ena1B cryoEM 구조 폴드와 비교하여, 아미노산 서열을 기반으로 (예측) 폴드의 일치로부터 유래되고, 본 명세서에 기술된 바와 같은, BIDG 및 CHEF 토폴로지에 시트를 갖는, 8-가닥 β-샌드위치를 포함한다.

보다 특히, 본 명세서에서 기술된 바와 같이 다량체의 DUF3992 도메인-함유 단백질 서브유닛은 다른 단백질에서 β 시트의 모서리에 결합하는 단백질 중 하나로부터 β-가닥 간에 정전기적 상호작용을 통해서 단백질 서브유닛의 스태거링으로서 예를 들어, [Remaut and Waksman (2006)]에서 이전이 기술하고, 당분야에 공지된 구조적 특성인, β-시트 확대를 통해 서로에 비공유적으로 연결된다 (또한 도 2D, E 및 3C 참조). 마지막으로, 박테리아 DUF3992 도메인-함유 자가-조립 단백질은 본 명세서에서 SEQ ID NO: 1-80 및 145-146으로 제공되고, 본 발명의 정의를 적용하여, 즉, 당업자가 단백질이 DUF3992 도메인을 포함하는지 여부를 정의할 수 있게 하는, 단순 HMMR 분석 (예를 들어 https://www.ebi.ac.uk/Tools/hmmer/ 에서 제공되고 표 1에서 본 명세서에 제공되는 매트릭스 기반)을 통해서, 새롭게 발굴된 단백질이 이러한 단백질 패밀리의 구성원인지 여부를 검증하여, 이러한 Ena 단백질 패밀리에 속하는 것으로 단순하게 검증할 수 있고, 아미노산 서열을 기반으로 단순하게 예측할 수 있는 이의 폴드를 비교하고, 당업자에게 공지되고, 본 명세서에 예시된 바와 같은, 구조 일치 도구를 적용하여서, 구조가 다시 말해, PDB7A02로 제공되는 Ena1B 구조와 비교하여 적어도 6.5의 Z 점수를 갖는 일치 폴드를 갖는, Ena 폴드로서 제공되는 것을 보장한다. 또한, DUF3992 도메인을 갖는 단백질이 본 명세서에서 청구되는 적어도 7개, 바람직하게 6개 내지 12개 단백질 서브유닛의 다량체로서 조립되어 나타나는 경향을 갖는지 여부는 당업자에게 공지된 시험, 예를 들어, 제한없이, SDS-PAGE, 동적 빛 산란 분석, 크기-배제 크로마토그래피, 또는 바람직하게 음성 염색 투과 전자 현미경을 통해서 결정될 수 있다.

본 명세서에 개시되는 바와 같은 DUF3992 도메인-함유 자가-조립 Ena 단백질은 바실러스 내생포자에서 관찰된 바와 같은, 강성 선모 또는 부속물 조립체의 형성을 선호하는 보존된 시스테인 잔기에 의해 N-말단에서 특징규명된다. 이러한 관찰을 기반으로, 시험관내에서 섬유를 형성하는 이러한 자가-조립 단백질 패밀리의 능력은 본 명세서에서 조사되었다 (도 13-14 참조). 본 명세서에서 확인된 이들 단백질 서브유닛의 이들 구조적 특성은 상기 시스테인 잔기 측쇄의 존재를 통해서 몇개 자가-조립된 다량체 간에 공유적으로 강력하게 연결될 수 있게 한다. 따라서, 박테리아 Ena 단백질의 패밀리는 N-말단 영역에 적어도 하나 이상의 보존된 cys 잔기 및 DUF3992 도메인으로 구성된다. 보다 특히, 상기 Ena 단백질 패밀리는 Ena1, Ena2 및 Ena3 단백질을 함유하는 것으로 본 명세서에서 확인되었고, Ena1 및 Ena2는 각각 3개 구성원 (A, B, C)을 함유하는 것으로 확인되었으며, 모두는 본 명세서에서 더욱 상세하게 기술된 바와 같이, 그들 N-말단 및 C-말단 영역에 특별한 아미노산 잔기 공통 모티프를 포함한다. 상기 Ena 유전자/단백질 패밀리는 또한 구조적으로 계통발생학적으로 실시예에서 보다 상세하게 기술되고, 'Ena1' 또는 'Ena2' 유전자 클러스터가 바실러스 종에 존재하여, S-형 섬유 형성을 허용하고, 또한 단일 Ena3A 유전자가 L-형 섬유 형성에 필요하다는 것을 밝혀준다. 본 명세서에 기술된 바와 같은 바실러스 S-형 천연 단백질 섬유는 내생포자에 형성되는데 모든 3개 구성원, Ena1/2 A, B 및 C를 필요로 한다. 놀랍게도, Ena1/2C는 생체외 섬유 성상에 구조적으로 존재하지 않아서, Ena1/2C 단백질은 자가-조립 성질을 갖지만, 생체내에서 포자형성 동안 섬유 형성에 상이한 기여를 갖는다. 놀랍게도, 이들 3개 구성원, Ena1/2A, B, 또는 C의 재조합 발현은 숙주 세포에서 다량체의 형성을 일으켰다. 또한, 입체 블록없는 단일 Ena1/2 A 또는 B 단백질 (예를 들어, 야생형 서열)의 재조합 발현은 숙주 세포 내에서 S-형 유사 섬유의 형성을 허용하였다. 재조합적으로 발현된 Ena1C는 상이한 유형의 다량체 조립체를 생성시켰고, 디스크-형 다량체를 보였다. 또한, 재조합적으로 발현된 Ena1/2A 또는 B는 본 명세서에서 더욱 정의되는 바와 같이, 입체 블록에 의해 저지될 때, 나선 회전부 또는 아크-형 다량체를 형성한다. 마지막으로, 바실러스 게놈에 단일 Ena 서브유닛을 포함하는 오페론에 의해 코딩되는, Ena3A 단백질은 또한 DUF3992-도메인을 포함하고, 이의 N-말단에 보존된 Cys 잔기 패턴을 갖는다. 그러나, C-말단 영역은 Ena1/2 단백질에 비해 더 다양하다. 이러한 Ena3A는 바실러스 내생포자에서 관찰되는 L-형 섬유를 구성하는 것으로 확인되었다. L-형 섬유는 섬유의 안정화를 위해 디술피드 결합을 통해서 종방향으로 적층된 디스크-유사 다량체로서 나타난다.

상기 Ena 단백질은 특별한 HMM 프로파일에 의해 특징규명된 바와 같이, 박테리아 DUF3992 도메인-함유 단백질로 구성된, PFAM 13157의 단백질로서 본 명세서에서 정의되고, 본 명세서에서 제공되는 실시예에 기술된 바와 같이, 바람직하게 S-형 및 L-형 섬유 형성 서브유닛에 대해 본 명세서에서 정의된 바와 같은, 보존된 Cys 잔기 프로파일 (도 16-19 참조), 및 보다 바람직하게 또한 본 명세서에 기술된 바와 같은 보존된 C-말단 모티프를 갖고, 특히 박테리아 Ena1, Ena2, 및 Ena3 단백질 서브패밀리의 구성원을 포함하는 것으로 더욱 입증된다. Ena 단백질 패밀리는 박테리아 바실러스 spp. 그룹에서 이의 기원을 갖고, 박테리아로부터 기원된 단백질 서열에 제한된다. 구조적으로, Ena 단백질은 2개의 병치된 β-시트로 구성된 젤리롤 3D 구조를 특징으로 하고, 상기 β-시트는 가닥 BIDG 및 CHEF로 이루어지고, 또한 전형적으로 처음 10-20 잔기 길이인, '연장부' 또는 '연결부'와 이어서, 적층된 섬유에서 다량체간 물리적 거리, 약 5-16 잔기 길이를 보장하기 위한 스페이서로 이루어지는 유연한 N-말단 영역을 포함하는 토폴로지를 제공한다 (도 8, 및 17-19 참조). 따라서, 특정 구현예에서, 본 발명의 다량체는 적어도 6개, 바람직하게 6 내지 12개의, Ena 단백질 서브유닛을 포함하고, 서브유닛 (i)의 BIDG β-시트는 (i-1)의 CHEF β-시트에 의해 확대되고, 서브유닛 (i)의 CHEF β-시트는 (i+1)의 BIDG β-시트에 의해 확대된다. 보다 특히, 다량체는 7 내지 12, 7 내지 11, 7 내지 10, 8 내지 10, 또는 9개 단백질 서브유닛, 또는 정확하게 7, 9, 10, 11 또는 12개 서브유닛을 포함할 수 있다.

이러한 패밀리의 계통발생학적 및 기능적 특징규명의 관점에서, 본 명세서에서 사용되는, 'Ena 단백질'은 바실러스 세레우스 (Bacillus cereus) NVH 0075-95 383 Ena1A (SEQ ID NO:1), Ena1B (SEQ ID NO:8), 및 Ena1C (SEQ ID NO:15) 및 바실러스 시토톡시쿠스 (Bacillus cytotoxicus) NVH 391-98 Ena2A (SEQ ID NO: 21), Ena2B (SEQ ID NO: 29), Ena2C (SEQ ID NO: 38), 및 바실러스 세레우스 Ena3A (SEQ ID NO:49), 및 다른 박테리아 균주의 다수의 상동체 및/또는 오솔로그에 의해서 본 명세서에서 더욱 예시되는, 각각의 Ena 단백질 패밀리 구성원의 각 클러스터에 대한 대표적인 단백질을 개시하는, SEQ ID NO:1-80, SEQ ID NO:145 또는 SEQ ID NO:146로 표시되는 바실러스 단백질의 목록으로서 예시되지만, 이에 제한되지 않고, 여기서 패밀리 구성원의 각각의 오솔로그 서열은 그들 전체 길이 상에서 정의된 본 명세서에서 사용되는 서열과 적어도 80% 동일성을 갖는다 (또한 실시예 '계통발생학적 분석'; 및 도 16-19 참조). 보다 특히, 바실러스 세레우스 NVH 0075-95 383 Ena1A 및 Ena1B 단백질은 각각 SEQ ID NO:1 및 SEQ ID NO:8로 표시되고, DUF3992 도메인 및 N-말단 및 C-말단 보존된 Cys 잔기를 포함하는, 비교창으로서 전체 서열 상에서 적어도 80% 아미노산 동일성을 갖는 이의 임의의 박테리아 상동체는 후보 오솔로그이다 (도 16-17). 바실러스 세레우스 NVH 0075-95 383 Ena1C 단백질은 SEQ ID NO: 15로 표시되고, DUF3992 도메인 및 N-말단 및 C-말단 보존된 Cys 잔기를 포함하는, 비교창으로서 전체 서열 상에서 적어도 60, 70 또는 80% 아미노산 동일성을 갖는 이의 임의의 박테리아 상동체는 후보 오솔로그이다 (도 18). 유사하게, 바실러스 시토톡시쿠스 NVH 391-98 Ena2A 및 Ena2B 단백질은 각각 SEQ ID NO:21 및 SEQ ID NO:29로 표시되고, DUF3992 도메인 및 N-말단 및 C-말단 보존된 Cys 잔기를 포함하는, 비교창으로서 전체 서열 상에서 적어도 80% 아미노산 동일성을 갖는 이의 임의의 박테리아 상동체는 후보 오솔로그이다 (도 16-17). 바실러스 시토톡시쿠스 NVH 391-98 Ena2C 단백질은 SEQ ID NO: 38로 표시되고, DUF3992 도메인 및 N-말단 및 C-말단 보존된 Cys 잔기를 포함하는, 비교창으로서 전체 서열 상에서 적어도 60, 70 또는 80% 아미노산 동일성을 갖는 이의 임의의 박테리아 상동체는 후보 오솔로그이다 (도 18). 바실러스 세레우스 Ena3A 단백질은 SEQ ID NO: 49 (다종 ref.)로서 표시되고, DUF3992 도메인 및 N-말단 및 C-말단 보존된 Cys 잔기를 포함하는, 비교창으로서 전체 서열 상에서 적어도 60, 70 또는 80% 아미노산 동일성을 갖는 이의 임의의 박테리아 상동체는 후보 오솔로그이다 (도 19).

다량체 조립체

본 발명의 제2 양태는 '미지-기능-의-도메인 (Domain-of-Unknown-Function) 3992' (DUF3992) 도메인 단백질 및 전형적인 N-말단 보존된 영역을 갖는 적어도 7개, 바람직하게 7 내지 12개, 또는 그 이상의 자가-조립 단백질 서브유닛을 포함하는, 단백질 다량체 조립체 또는 다량체에 관한 것으로서, 상기 단백질 서브유닛은 서로 비공유적으로 연결된다.

상기 자가-조립 DUF3992 도메인-함유 단백질 서브유닛은 보다 특히 Ena 단백질 서열, 및/또는 조작된 Ena 단백질 서열을 포함하는 단백질 서브유닛에 관한 것이다.

다른 구현예은 7-12개 단백질 서브유닛을 포함하는 다량체를 개시하고, 상기 단백질 서브유닛은 Ena 단백질, 및/또는 이의 조작된 Ena 단백질 형태를 포함한다. 특정 구현예에서, 상기 다량체는 SEQ ID NO:1-80, 145-146으로 표시된 Ena 단백질, 또는 이의 어느 하나의 적어도 60% 동일성, 또는 이의 어느 하나의 적어도 70%, 또는 적어도 80%, 또는 적어도 85%, 또는 적어도 90%, 또는 적어도 95%, 또는 적어도 97% 동일성을 갖는 상동체, 이의 기능적 오솔로그, 및/또는 이의 조작된 Ena 단백질 형태로부터 선택되는 단백질 서브유닛을 포함한다. 본 명세서에 기술된 바와 같은 이들 다량체는 DUF3992 도메인을 포함하고 6, 7, 8, 9, 10, 11 또는 12개 단백질 서브유닛으로 이루어진 것으로 정의된 단백질 서브유닛의 자가-조립에 의해 형성된다 (도 14-15). 이들 단백질 다량체는 다량체 '그 자체'의 형태로 다수 적용을 위해 기능하는 것으로 본 명세서에서 정의되며, 다량체가 용액, 세포, 또는 다른 유형의 시험관 환경 내에서 독립적인 단위인 것으로 정의된다는 것을 의미하는 한편, DUF3992 도메인 또는 Ena 단백질 서브유닛의 이러한 다량체는 그 자체로 자연계에서 발견되지 않고, 섬유를 형성하는 그들 경향덕분에 자연 상태 또는 생체내에서 '그자체로' 형성되거나 또는 조립되지 않는다. S-형 섬유는 별개 다량체로 구성되지 않지만, 후속 단백질 서브유닛 간에, 측면 비-공유 상호작용, 특히 β-시트 확대를 통해서 연속 나선 구조가 형성되므로 종방향 섬유로 계속되는 다량체 Ena 구조를 포함한다. 또한, N-말단 및 C-말단 영역에 보존된 Cys 잔기의 존재덕분에, 이들은 공유 디술피 가교에 의해 더 강성화된다. 독립형 생산물로서 Ena1/2A 또는 Ena1/2B 다량체 '그 자체'를 형성시키기 위해서, '입체 블록'은 다량체의 추가 조립을 방지하는 것이 필요하다 (도 13A 및 14A 참조). 따라서 상기 특별히 정의된 다량체는 예를 들어, 다른 다량체와 공유 연결의 진행을 N-말단에서 입체적으로 방해받아서, 그들 섬유 성장이 저지된다. 본 명세서에서 상호교환적으로 사용되는 '입체적으로 훼방된' 또는 '입체적으로 방해된' 또는 '입체적으로 차단된' N-말단 영역은 천연 발생 Ena 단백질 N-말단에 대한 구조적 차이로서 본 명세서에서 정의되며, 상기 구조적 차이는 다른 단백질 또는 다량체와 공유 연결로부터 N-말단의 입체 방해를 생성시킨다. 예를 들어, 적어도 1-5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15개 또는 그 이상의 아미노산 잔기의 이종성 N-말단 태그를 하나 이상의 야생형 Ena 단백질 서브유닛에 첨가하여, '조작된 또는 변형된' 이종성 태그화 Ena 단백질이 형성되어서, 예를 들어, 상이한 다량체의 공유 연결을 방해하여서, 종방향으로 다량체의 과성장을 저지하게 된다. 상기 다량체의 단백질 서브유닛의 N-말단을 입체적으로 훼방시키기 위한 대안은 예를 들어 특히 S-형 섬유 형성을 위해, 종방향 상호작용에 필요한 C-말단 연장부 또는 태그이다. 또는 대안으로서 N-말단 또는 C-말단 연결부의 임의의 디술피드 연결을 입체적으로 차단하는 화학적 링커를 첨가하거나, 또는 시스테인을 제거하도록 N-말단 Ena 단백질 서열을 돌연변이시키거나, 또는 다른 다량체와 디술피드 가교 형성을 입체적으로 방해하기 위해 Ena 단백질 변이체의 생성일 수 있다. 따라서, 특정 구현예는 본 명세서에 기술된 바와 같은 다량체에 관한 것으로서, 적어도 하나의 단백질 서브유닛은 입체 블록을 형성하도록 적어도 1-5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15개 또는 그 이상의 아미노산의 이종성 N-말단 및/또는 C-말단 태그 또는 연장부 또는 연결부를 더 포함한다. 따라서, Ena1/2A 및/또는 Ena1/2B 조립체의 10량체, 11량체 또는 12량체를 '그 자체로' 수득하기 위해서, 섬유로 이들 다량체의 추가 조립을 방지하도록 N-말단에 입체 블록의 존재가 바람직하다 (도 14-15 참조). 따라서 독립형 단백질 단위로서 이들 다량체는 본 명세서에서 보다 상세하게 또한 기술되는 바와 같이, 상기 다량체의 적어도 하나의 단백질 서브유닛의 조작 시 형성될 수 있다. 따라서, 특정 구현예는 입체적으로 훼방되는 N-말단 및/또는 C-말단 영역 또는 연결부를 갖는, 단일 회전부 또는 나선 아크 다량체로서 기재된 저지된 다량체인, 본 명세서에 기술된 바와 같은 다량체에 관한 것이다.

대안적으로, Ena1/2C 단백질은 재조합적으로 발현될 때 고리-유사 또는 디스크-유사 다량체를 형성하는 것으로 확인되었다. 닫힌 원형 다량체 또는 디스크-유사 구조는 입체적으로 훼방된 N-말단 및/또는 C-말단 영역이 존재하거나 또는 없이, 시험관내에서 형성된다. 또한 특정 경우에, 제1 N-말단 연결부 영역이 결여된, 재조합적으로 발현된 절두형 Ena1/2C 단백질은 다량체로 자가-조립 및 조립될 수 있다. 일 구현예에서, 이들 Ena1C 구성된 다량체는 각각 7개 또는 9개 서브유닛을 갖는 7량체 또는 9량체로 이루어질 수 있다 (또한 도 14B 및 15B 참조).

재조합적으로 생산된 Ena1C 다량체 또는 9량체 고리 구조는 이종성 N-말단 또는 C-말단 태그를 첨가하거나, 생체기능적 및 구조적 도구로서 Ena1C 다량체 조립체를 적합화시키기 위해 돌연변이 또는 삽입에 의해서 더욱 조작될 수 있다.

특정 구현예에서, DUF3992 도메인-함유 단백질을 포함하는 6 내지 12개 단백질 서브유닛, 또는 특히 Ena 단백질, 이의 상동체 또는 이의 조작된 형태를 포함하는, 본 명세서에 기술된 바와 같은 상기 다량체는 단리된 다량체이다. 상기 단리된 다량체는 다량체를 '그 자체로' 생산하기 위해, 본 명세서에 기술된 바와 같은 키메라 유전자의 재조합 발현과 이어서, 임의로 생산 숙주로부터 상기 다량체의 정제를 통해서 수득된다. 따라서, 일 구현예은 적어도 6, 또는 바람직하게 7-12개 서브유닛으로 이루어진 상기 단리된 다량체, 또는 조작된 다량체 또는 이의 천연 대응물 또는 야생형 단백질 형태의 단백질 서브유닛과 비교하여 적어도 하나의 조작된 단백질 서브유닛을 포함하는 다량체에 관한 것이다. 특정 구현예에서, 본 명세서에 기술된 바와 같은 다량체의 단백질 서브유닛은 동종체 다량체, 또는 이종체 다량체일 수 있고, 후자는 동일한 DUF3992 서브유닛을 포함할 수 있거나, 또는 야생형 Ena 단백질 서브유닛 및 조작된 Ena 단백질 서브유닛, 예컨대 예를 들어 태그화 Ena 단백질, 또는 돌연변이체 Ena 단백질 서브유닛으로 이루어질 수 있다. 이종체 다량체는 1개 유형의 Ena 단백질 또는 몇개 유형의 Ena 단백질 구성원으로 이루어질 수 있다.

전반적으로, 본 명세서에 정의된 바와 같은 적어도 하나의 Ena 단백질일 수 있는, 적어도 7개 DUF3992 도메인-함유 단백질 서브유닛을 포함하고, 상기 단백질 서브유닛은 β-시트 확대를 통해서 비공유적으로 연결된 것인, 본 명세서에 정의된 바와 같은 다량체는 다량체간 디술피드 가교를 형성하는 N-말단 및/또는 C-말단 영역에 의해서 촉발되는 공유 상호작용 및 추가 올리고머화를 방지하고/하거나, 상기 다량체 조립체에 대한 추가의 기능성 또는 성질을 획득하기 위한 목적으로, 비-천연 발생 Ena 단백질 서브유닛으로서 본 명세서에서 정의된, 적어도 하나의 조작된 Ena 단백질 서브유닛을 포함할 수 있다.

본 명세서에 정의된 바와 같은 '조작된 DUF3992-함유 단백질 서브유닛', 또는 본 명세서에 정의된 바와 같은 '조작된 Ena 단백질'은 여전히 다량체 또는 섬유질 구조를 자가-조립할 수 있고 형성할 수 있는, 각각 DUF3992-함유 또는 Ena 단백질의 비-천연 발생 형태에 관한 것이다. 본 명세서에서 상호교환적으로 사용되는, 조작되거나 또는 변형되거나 또는 조정된 단백질 서브유닛 또는 단백질 서브유닛 변이체는 야생형 (Ena) 단백질과 비교하여 그들 1차 구조 특성 수준에서, 즉 그들 아미노산 서열에서 차이를 비롯하여, 다른 변형, 즉 화학적 링커 또는 태그에 의해서 차이를 나타낼 수 있다. 따라서, 조작된 단백질 서브유닛은 예를 들어 하나 이상의 아미노산 치환, 삽입 또는 결실을 포함하는 돌연변이체 단백질, 또는 태그화 또는 표지화될 수 있는 융합 단백질, 또는 이의 서열 또는 이의 토폴로지에 삽입을 갖는 단백질, 또는 다른 변형중에서도 부분 또는 분할-Ena 단백질의 조립에 의해 형성된 단백질을 고려할 수 있다. 따라서, 일 구현예에서, 조작된 Ena 단백질이 개시되고, 상기 조작된 Ena 단백질은 천연 Ena 단백질과 비교하여 변형된 Ena 단백질이고, 비-천연 발생 단백질이다. 본 명세서에서 제공되는 비제한적인 예는 임의의 섬유질 조립체를 형성하지 않고 다량체 형성을 위한 입체적으로 훼방된 Ena 단백질 서브유닛을 획득하기 위해, 적어도 1,2,3,4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15개 또는 그 이상의 아미노산 잔기 길이의 이종성 태그에 의해서, N-말단 또는 C-말단 태그된 Ena 단백질; Ena 돌연변이체 또는 변이체 단백질; β-가닥 사이에 이의 노출된 루프 중 하나 내에 삽입된 이종성 펩티드 또는 단백질을 갖는 Ena 단백질 융합체 또는 Ena 단백질, 또는 숙주에서 개별적으로 발현된 Ena 분할-단백질 부분의 조립 시 형성된 Ena 단백질에 관한 것이다.

태그는 야생형 단백질 서열에서 천연적으로 발생되지 않고, 적용 목적을 위해서, 예컨대 단백질의 정제를 촉진하거나, 또는 섬유 형성의 과성장에서 입체적으로 방해된 다량체를 조립하기 위해서 첨가되면, '이종성 융합'을 일으키는 '이종성 태그' 또는 '이종성 표지'이다. 본 명세서에서 사용되는 용어 "검출가능한 표지", "표지화" 또는 "태그"는 본 명세서에 기술된 단리 또는 정제된 (폴리-)펩티드의 검출, 시각화, 및/또는 단리, 정제 및/또는 고정화를 허용하는 검출가능한 표지 또는 태그를 의미하고, 이들 목적을 위하 당분야에 공지된 임의 표지/태그를 포함하는 것을 의미한다. 특히 바람직한 것은 친화성 태그, 예컨대 키틴 결합 단백질 (CBP), 말토스 결합 단백질 (MBP), 글루타티온-S-트랜스퍼라제 (GST), 폴리(His) (예를 들어, 6x His 또는 His6), Strep-tag®, Strep-태그 II® 및 Twin-Strep-tag®; 가용화 태그, 예컨대 티오레독신 (TRX), 폴리(NANP) 및 SUMO; 크로마토그래피 태그, 예컨대 FLAG-태그; 에피토프 태그, 예컨대 V5-태그, EPEA-태그, myc-태그 및 HA-태그; 형광 표지 또는 태그 (즉, 형광색소/형광단), 예컨대 형광성 단백질 (예를 들어, GFP, YFP, RFP 등) 및 형광성 염료 (예를 들어, FITC, TRITC, 쿠마린, 및 시아닌); 발광 표지 또는 태그, 예컨대 루시퍼라제; 및 (다른) 효소 표지 (예를 들어, 퍼옥시다제, 알칼리 포스파타제, 베타-갈락토시다제, 우레아제 또는 글루코스 옥시다제)이다. 또한 임의의 전술한 표지 또는 태그의 조합을 포함한다.

바람직하게 태그의 첨가에 의해 조작되는, 상기 기능 조작된 단백질 서브유닛 또는 조작된 Ena 단백질 서브유닛 또는 단량체는 조작된 Ena 단백질 서브유닛의 동종 다량체 조립체로서, 또는 조작 및 비-조작 (예를 들어, 야생형)된 Ena 단백질 서브유닛을 조합한 이종다량체 조립체로서, 그 자체로, 저지된 다량체, 또는 저지된 섬유를 추가로 형성할 수 있다.

특정 구현예에서, 단백질 서브유닛은 적어도 하나의 Ena 돌연변이체 또는 Ena 변이체 단백질 서브유닛을 포함하는 조작된 Ena 단백질일 수 있다. 예를 들어, 비제한적이지만, 이러한 Ena 돌연변이체 또는 변이체는 다량체 또는 단백질 서브유닛의 표면 측쇄의 변형 또는 돌연변이가 실현가능한 경우를 입증하는 구조적 정보로부터 유래될 수 있다 (또한, 도 15 참조). Ena1B 서브유닛 돌연변이체에 대해 제안된 것과 유사하게 가능한 치환은 잔기 A31, T32, A33, T57, T61, V63, V69, T70, T72, A73, T76, V78, T96, L98, T100, 및 A101의 경우에, SEQ ID NO:8로 표시된 바와 같은 Ena1B에 대해 도 15에 도시되어 있다. 관련 치환 잔기의 예는 시스테인 또는 리신, 또는 클릭 화학에 맞는 비천연 아미노산, 예컨대 아지드 측쇄를 갖는 것들을 포함한다.

또한, Ena1B (SEQ ID NO:8)의 삽입 부위의 예는 하기 β-가닥을 연결하는 루프에 위치된 위치로 도 15에 도시된다: 잔기 A30 내지 A33을 갖는 B-C 가닥; 잔기 T55 내지 P59를 갖는 D-E 가닥; 잔기 S66 내지 T72를 갖는 E-F 가닥; 잔기 G99 내지 A103의 루프를 갖는 및 H 내지 I 가닥. 이러한 루프에서 이종성 단백질 또는 펩티드 또는 링커의 삽입은 400 잔기 이하의 길이의 아미노산 서열로 이루어질 수 있고, 여전히 다량체 형성에 필요한 폴딩 및 구조적 특성을 보유한다. 특히 이러한 삽입 변이체 또는 기능적 돌연변이체 조작된 Ena 단백질을 생성시키는 방법은 예를 들어, 다음과 같이, 예를 들어 Ena1B의 1차 아미노산 서열을 변형시키는 것을 고려할 수 있다: Ena1B 단백질을 잔기 S66에서 절단하여 β 가닥 E 및 F 사이에 단일 잔기 펩티드 또는 (폴리)펩티드를 먼저 삽입시키고, S66의 C-말단에 이의 N-말단 잔기의 삽입 및 Ena1B의 G67의 N-말단에 이의 C-말단 삽입을 첨가하여 서열의 재정렬. 삽입은 또한 상기 Ena 단백질의 루프로부터 다수 아미노산을 제거하여 생성시킬 수 있고, 예를 들어, Ena1B 서열 잔기 S66 내지 T72를 삽입부로 치환시킬 수 있다. 당업자는 Ena 단백질의 개시된 구조적 특성을 기반으로 본 명세서에 제공된 바와 같은 상이한 Ena 단백질 루프 영역에 유사한 삽입부를 생성시키는 방법을 알고있고, 또한 그리하여 Ena 상동체 또는 이의 조작된 Ena 단백질 형태에 대해 유사한 삽입을 생성시킬 수 있다.

Ena 단백질에 대해 본 명세서에 정의된 바와 같은 N-말단 영역 및 C-말단 영역은 야생형 Ena 단백질 서열이라고 한다. 상기 야생형 (또는 치환/ 돌연변이체 변이체) Ena 단백질 경우에, 'N-말단 영역'은 유연한 N-말단 연결부에 이어서 스페이서를 포함하는 Ena 단백질 서열의 제1 부분, 및 상기 Ena 단백질 서브유닛의 젤리롤 폴딩을 포함하는 전형적인 BIDG CHEF β-시트의 제1 β-가닥 B로서 정의된다. 본 명세서에 정의되는 바와 같은 Ena 단백질의 'C-말단 영역'은 BIDG CHEF β-시트의 마지막 β-가닥 I 및 이후 가능한 나머지 C-말단 잔기를 포함하는 단백질 서열의 말단이다.

고려할 수 있는 한가지 적용은 조작된 Ena 단백질 형태의 Ena 단백질 서브유닛을 변형시켜서 다른 기능성 모이어티 또는 단백질, 예컨대 예를 들어 항체 등을 상기 Ena 단백질 또는 Ena 다량체에 융합시켜서, 임의로 표면 또는 지지체에 커플링된 기능화된 다량체를 제공하는 것이다.

구조적으로 매력적인 융합을 만들기 위해서, 당업자는 원형으로 교체된 단백질로서 Ena 단백질의 조작을 고려할 수 있다. 용어 "단백질의 원형 교체 (permutation)" 또는 "원형으로 교체된 단백질"은 야생형 단백질 서열과 비교하여, 이의 아미노산 서열에서 아미노산의 변화된 순서를 갖는 단백질을 의미하는데, 그 결과로서 단백질 구조는 상이한 연결성을 갖지만, 전체적으로 유사한 3차 (3D) 형태를 갖는다. 단백질의 원형 교체는 예를 들어 [Bliven and Prlic (2012)]에 기술된 바와 같이, 최종 원형으로 교체된 단백질 (이의 C-말단 근처)의 제2 부분의 서열과 관련된다는 의미에서, 환형 교체의 수학적 개념과 유사하다. 이의 야생형 단백질과 비교하여 단백질의 원형 교체는 단백질 서열의 유전적 또는 인공적 조작을 통해서 수득되어서, 야생형 단백질 (Ena 단백질에 대해 본 명세서에서 상기 정의된 바와 같음)의 N-말단 및 C-말단은 '연결되고', 단백질 서열은 다른 부위에서 개재되거나 또는 절단되어서, 상기 단백질의 신규한 N-말단 및 C-말단을 생성한다. 따라서, 본 발명의 원형으로 교체된 Ena 단백질은 야생형 Ena 단백질 서열의 연결된 N-말단 및 C-말단, 및 상기 Ena 단백질 서브유닛의 접근가능하거나 또는 노출된 부위 (우선적으로 β-회전부 또는 루프)에서 절단 또는 개재된 서열의 결과이고, 그리하여 폴딩은 야생형 Ena 단백질의 폴딩과 비교하여 유지되거나 또는 유사하다. 상기 원형으로 교체된 스캐폴드 단백질에서 N-말단 및 C-말단의 상기 연결은 펩티드 결합 연결, 또는 펩티드 링커의 도입, 또는 야생형 단백질이면, 펩티드 결합 또는 나머지 아미노산이 후속되는, 본래 N-말단 및 C-말단 근처에 펩티드 스트레치의 결실의 결과일 수 있다. 최종 Ena 단백질의 N-말단 및 C-말단의 이러한 재배열은 2차 N-말단 및 C-말단이라고 한다.

마지막으로, 본 명세서에서 기술되는 바와 같은 다량체는 차세대 생체물질의 분야에서 수많은 적용을 제공한다. 일 구현예에서, 상기 다량체는 고형 표면에 커플링될 수 있고, 이와 같이, 극도의 탄성 거동을 갖는 특성을 갖고, 따라서 매우 안정하고 강성인 물질의 변형된 표면을 제공한다.

섬유질 조립체.

본 발명의 다른 양태는 적어도 2개 다량체를 포함하는 재조합적으로 생산된 섬유에 관한 것이고, 상기 다량체는 자가-조립 DUF3992 도메인-함유 단백질, 특히 Ena 단백질을 포함하는, 적어도 7개 단백질 서브유닛, 또는 7-12개 서브유닛을 포함하고, 상기 단백질 서브유닛은 β-시트 확대를 통해서 비공유적으로 연결되고, 상기 다량체는 종방향으로 적층되고 적어도 하나의 디술피드 가교를 통해서 공유적으로 연결된다. 따라서, 단백질 섬유는 비천연 숙주에서, 재조합적으로, 세포내에서 및/또는 시험관내에서 생산될 수 있고, 이종체 또는 동종체 다량체를 포함할 수 있다. 이종체 단백질 섬유가 고려될 때, 다량체는 하나 이상의 자가-조립 DUF3992-도메인-함유 Ena 단백질을 포함할 수 있거나, 또는 대안적으로 단백질 서브유닛은 하나 이상의 서브유닛이 이의 조작된 단백질 형태인 것을 제외하고 동일하다. 동종 다량체단백질 섬유는 숙주 세포에서 특별한 Ena 단백질 또는 Ena 단백질 돌연변이체, 변이체 또는 조작된 Ena 단백질을 재조합적으로 발현하여 생성될 수 있다. 하나 이상의 Ena 단백질 서브유닛을 포함하는 임의의 재조합적으로 생산된 단백질 섬유는 생체내 바실러스 섬유 상에서 관찰된 주름 (실시예 참조)이 재조합적으로 생산된 섬유에서는 전혀 보이지 않았으므로 비-천연 발생 섬유일 것이다.

특정 구현예에서, 본 명세서에 기술된 바와 같은 단백질 서브유닛 또는 다량체는 ZX_nCCX_mC (여기서, Z는 Leu, Ile, Val 또는 Phe이고, X는 임의 아미노산이고, n은 1 또는 2 잔기이고, m은 10-12임)로서 표시되는 보존된 아미노산 잔기 서열 모티프를 갖는, 본 명세서에서 상호교환적으로 사용되는, 'N-말단 영역' 또는 'N-말단 연결부' 또는 'N-말단 연결부 영역'을 포함하고, GX_2/3CX₄Y (여기서, X는 임의 아미노산임)로 표시되는 보존된 아미노산 모티프를 갖는, 본 명세서에서 상호교환적으로 사용되는, C-말단 영역' 또는 'C-말단 수신기 영역'을 포함하여서, 공유 디술피드 결합을 형성하도록 상기 모티프에 존재하는 Cys를 종방향으로 연결하여 상기 다량체의 S-형 섬유 형성을 허용한다. 특정 구현예에서, 이들 다량체에 의해 형성되는 상기 단백질 섬유는 나선 구조를 갖는다 (예를 들어, 도 13a-14a 참조). 단백질 섬유는 따라서 다량체가 입체적으로 방해받지 않는 경우에만 형성될 수 있다.

다른 구현예에서, 상기 단백질 섬유의 강성 및/또는 탄력성을 조정하기 위해 '조작된 다량체'가 생산되고, 하나 이상의 단백질 서브유닛의 N-말단 영역은 N-말단 보존된 모티프 ZX_nCCX_mC를 포함하고, 여기서, Z는 Leu, Ile, Val 또는 Phe이고, X는 임의 아미노산이고, n은 1 또는 2 잔기이지만, m은 10-12 잔기 대신에 7, 8 또는 9개 아미노산 잔기여서, 그 결과로 (예를 들어, SEQ ID NO:1의 Ena1A 또는 SEQ ID NO:8의 Ena1B와 비교하여) 더 짧은 N-말단 영역을 가지게 되거나, 또는 m은 13 내지 16 잔기여서, 그 결과로 (예를 들어, SEQ ID NO:1의 Ena1A 또는 SEQ ID NO:8의 Ena1B와 비교하여) 더 긴 N-말단 영역 말단 영역을 갖는다. 상기 조작된 다량체는 여전히 S-형 또는 나선 섬유의 조립에서 C-말단 수신기 모티프 GX_2/3CX₄Y와 상기 시스테인을 통한 공유 S-S 가교를 형성하도록 허용할 수 있지만, m이 10-12개 잔기인 것과 비교하여 안정성 또는 강성이 더 낮을 수 있다. S-형 또는 나선 섬유의 형성은 디술피드 가교 형성없이 가능할 수 있지만, 이것은 그 결과로 훨씬 더 낮은 안정성 및 더 낮은 탄성 섬유 구조를 생성시키게 된다. 실제로, 본 명세서에서 뒷받침되는 바와 같이, N-말단 시스테인 공유 연결을 포함하는 섬유 구조는 예를 들어 내생포자 부속물이 혹독한 조건에서 살아남을 수 있는 안정성을 제공한다. 섬유의 내강에 존재하는 디술피드 결합은 이러한 강도를 허용하고, 따라서 섬유에서 바람직하다.

또한, 디스크-형 다량체를 포함하는 L-형 단백질 섬유는 또한 선행 층 연결기의 다량체 및 N-말단 보존된 Cys 잔기 간 공유 연결을 통해서 종방향으로 가교 결합된다. 상기 섬유는 SEQ ID NO:49-80로 표시된 바와 같은, Ena3, 또는 이의 어느 하나의 적어도 80%의 상동체의 재조합 발현을 통해서 형성될 수 있다. L-형 섬유 형성에서 기능성인 상기 Ena3 단백질은 Ena1/2 A&B S-형 섬유 형성 서브유닛에 대해 약간 적합화된, 보존된 모티프, 즉 ZX_nC(C)X_mC (여기서, Z는 Leu, Ile, Val 또는 Phe이고, X는 임의 아미노산이고, n은 1 또는 2 잔기이고, m은 10-12임)로서 정의되는 바와 같이, 제2 Cys이 일부 Ena3 단백질에서 다른 아미노산으로 치환될 수 있는 모티프를 갖는 N-말단 연결부를 함유하고, S-Z-N-Y-X-B (여기서, Z는 Leu 또는 Ile이고, B는 Phe 또는 Tyr이고, X는 임의 아미노산임)로서 표시되는 보존된 아미노산 모티프를 갖는, 본 명세서에서 상호교환적으로 사용되는, 'C-말단 영역' 또는 'C-말단 수신기 영역'을 포함하여, 공유 디술피드 결합을 형성하도록 상기 모티프에 존재하는 CyS를 종방향으로 연결하여 상기 다량체의 L-형 섬유 형성을 허용하는 것으로 본 명세서에서 더욱 정의된다. 특정 구현예에서, 이들 다량체에 의해 형성된 상기 단백질 섬유는 디스크-유사 구조를 갖는다 (예를 들어, 도 13b-14b 참조). 단백질 섬유는 따라서 다량체가 입체적으로 방해받지 않는 경우에만 형성될 수 있다.

예를 들어, 적어도 1 내지 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15개, 또는 그 이상의 아미노산의 이종성 N-말단 태그를 첨가하여, 입체 방해가 디술피드 가교 형성을 방해하게 되거나 또는 부정적으로 영향을 미쳐서, 섬유 형성을 방지하거나, 또는 부분적으로 형성된 섬유 또는 덜 강하고 덜 탄성이거나 강성인 섬유를 생성시키게 된다 (실시예 참조).

특정 구현예에서, 상기 적어도 2개 다량체를 포함하는 생산된 단백질 섬유는 이러한 종??향으로 선행 청의 다량체의 수신기 영역의 단백질 서브유닛의 Cys 잔기와 한 다량체의 적어도 하나의 단백질 서브유닛의 N-말단 연결부 영역의 Cys 잔기의 측쇄 간에 적어도 하나의 디술피드 결합을 통해서 공유적으로 연결된다. 바람직한 구현예에서, 섬유의 상이한 다량체 간에 형성된 적어도 2개 디술피드 결합이 존재하고, 가장 바람직하게 각각의 디술피드 결합은 섬유의 선행 다량체의 단백질 서브유닛에 존재하는 cys의 황 원자에 대한 결합을 만들기 위해서 하나 이상의 단백질 서브유닛의 N-말단 영역의 시스테인으로부터의 황 원자를 함유한다. 특정 구현예에서 상기 N-말단 영역은 상기 보존된 아미노산 모티프에 2개의 연속 Cys를 가져서 둘 모두가 섬유의 다른 다량체와 디술피드 가교에 참여한다. 다른 구현예는 적어도 2개 다량체를 포함하는 나노섬유로서 상기 단백질 섬유에 관한 것으로서, 상기 다량체는 적층되고, 단백질 서브유닛 (i)의 N 말단 보존된 모티프의 제1 및 제2 Cys 잔기, 및 각각 서브유닛 (i-9)의 β-가닥 I 및 서브유닛 (i-10)의 B의 Cys 잔기에 의해 형성되는 디술피드 가교(들)를 통해서 공유적으로 연결된다.

따라서, 본 명세서에 기술된 바와 같은 단백질 섬유는 각각이 본 명세서에 기술된 바와 같은, 자가-조립 DUF3992 도메인-함유 단백질을 포함하거나, 또는 보다 특히 Ena 단백질 또는 조작된 Ena 단백질을 포함하는, 적어도 7개 단백질 서브유닛을 포함하는, 둘 이상의 다량체로 구성되고, 상기 단백질 서브유닛은 비공유적으로 연결되고, 상기 다량체는 오로지 상기 적층된 다량체 간에 공유 디술피드 결합을 형성하여 종방향으로 적층된다. 상기 단백질 섬유에서, 상기 다량체는 조성이 동일할 수 있거나 또는 상이할 수 있다. 그리고 상기 다량체는 본 명세서에 정의된 바와 같이, 섬유의 강성을 조정하기 위해 조작된 다량체일 수 있다. 또한, 상기 단백질 섬유의 상기 적어도 2개 다량체는 동일한 단백질 서브유닛을 포함하거나, 또는 상이한 단백질 서브유닛을 포함하는 다량체일 수 있다. 디술피드 가교를 통해서 오직 공유적으로 연결된 구별가능한 다량체 디스크를 포함하는, L-형 섬유와 대조적으로, S-형 섬유에 존재하는 다량체는 오로지 공유적으로 연결된 단일 단위로서 구별불가할 것이지만, β-프로펠러 나선 구조로 단백질 서브유닛의 연속적인 β-시트 확대일 것이고, 추가로 모든 나선 회전부는 디술피드 가교에 의해 가교될 것이다. 따라서, 본 명세서에서 사용되는 '다량체를 포함하는 단백질 섬유'는 S-S 가교를 통해서만 오로지 연결되는 (예를 들어, 오로지 Ena3A-기반 단백질 서브유닛을 포함하는) 구별가능한 별개 디스크-유사 다량체로 이루어지는 단백질 섬유, 또는 섬유질 나선 구조로 연속적으로 비공유적으로 연결되고, S-S 가교를 통해서 더 가교 결합되는, 나선-회전부-유사 다량체 (예를 들어, Ena1/2A 및/또는 Ena1/2B 단백질-기반)로부터 컴파일링된 단백질 섬유를 의미할 수 있다.

또한, 대안적인 구현예는 본 명세서에 기술된 바와 같은 둘 이상의 다량체를 포함하는 섬유로서 정의되는, 조작된 단백질 섬유를 포함하고, 적어도 하나의 다량체는 본 명세서에 정의된 바와 같은, 조작된 다량체이고/이거나, 적어도 하나의 단백질 서브유닛은 본 명세서에 정의된 바와 같은, 조작된 단백질 서브유닛이다.

다른 구현예는 재조합적으로 생산되거나 또는 시험관내에서 생산되고 정제된 단백질 섬유에 관한 것이고, 상기 섬유는 본 명세서에서 더욱 기술된 바와 같은 키메라 유전자의 재조합 또는 시험관내 발현을 통해서 수득가능할 수 있다. 상기 시험관내 생산된 섬유는 본 명세서에 개시된 바와 같은 S-형 섬유일 수 있고, Ena1A 및/또는 Ena1B 단백질, 및/또는 이의 조작된 형태를 포함하는 다량체에 의해서 형성될 수 있다. 상기 시험관내 생산된 섬유는 자연계, 예컨대 바실러스 내생포자에서 발생되지 않는데, Ena1A, Ena1B 및 Ena1C가 생체내에서 S-형 섬유를 형성하는데 필수불가결하게 요구된다는 것이 분명하다 (실시예 참조). 특정 구현예는 상기 단백질 섬유의 다량체가 본 명세서에 기술된 바와 같은 적어도 하나의 조작된 다량체, 또는 본 명세서에 기술된 바와 같은, 조작된 단백질 서브유닛, 특히 본 명세서에 기술된 바와 같은 적어도 하나의 조작된 Ena 단백질을 포함하는 적어도 하나의 다량체를 포함하는 것인 조작된 단백질 섬유인 상기 시험관내 생산된 단백질 섬유에 관한 것이다. 추가 구현예는 조작된 단백질 섬유를 제공하고, 본 명세서에 기술된 바와 같은 단백질 섬유는 다른 단백질에 융합되거나 또는 다른 모이어티, 예컨대 화학적 모이어티, 또는 기능적 모이어티에 접합된다.

본 발명의 다른 양태는 상기 프로모터 또는 조절 구성요소에 의해 제어되는 발현시, 본 명세서에 정의된 바와 같은, 자가-조립 단백질을 함유하는 단백질 서브유닛 또는 프로토머를 코딩하는 핵산 분자를 생성하게 되는 핵산 서열에 작동적으로 연결된 적어도 이종성 프로모터 또는 조절 구성요소를 포함하는 DNA 구성요소를 포함하는 키메라 유전자 또는 키메라 구성체를 제공하고, 상기 이종성 프로모터 또는 이종성 조절 구성요소 서열은 박테리아에서 유래되는 자가-조립 단백질을 코딩하는 핵산 서열과 상이한 공급원으로부터 기원한다 (또는 이의 천연 형태와 상이함). 추가 구현예에서, 상기 키메라 유전자는 본 명세서에 기술된 바와 같은, Ena 단백질, 또는 Ena 돌연변이체 또는 변이체 단백질, 연장된 Ena 단백질 (섬유 형성을 방지하도록 입체적으로 훼방됨) 또는 융합 단백질일 수 있는, 이의 조작된 Ena 단백질을 코딩하는 핵산 분자에 작동적으로 연결된 이종성 프로모터 구성요소 또는 조절 발현 구성요소를 포함한다. 또한, 상기 키메라 구성체는 발현 카세트에 존재할 수 있거나, 또는 시험관내에서 단백질의 생산을 위한 클로닝 또는 발현 벡터의 일부로서 존재할 수 있다.

"발현 카세트"는 발현 카세트의 프로모터에 작동적으로 연결된, 관심 유전자/코딩 서열의 발현을 유도할 수 있는 임의의 핵산 구성체를 포함한다. 발현 카세트는 일반적으로 바람직하게 프로모터 영역, 전사 개시 영역과 작동적으로 연결된 폴리뉴클레오티드 서열, 이의 상동체, 변이체 또는 단편, 및 RNA 중합효소에 대한 중지 신호 및 폴리아데닐화 신호를 포함하는 종결 서열을 포함하는 (전사 방향으로 5'에서 3'으로), DNA 구성체이다. 모든 이들 영역은 형질전환시키려는 생물학적 세포, 예컨대 원핵생물 또는 진핵생물 세포에서 작동할 수 있어야 한다는 것을 이해한다. 바람직하게 RNA 중합효소 결합 부위, 및 폴리아데닐화 신호를 포함하는, 전사 개시 영역을 포함하는 프로모터 영역은 형질전환시키려는 생물학적 세포에 천연일 수 있거나, 또는 대안적인 공급원으로부터 유래될 수 있고, 여기서 영역은 생물학적 세포에서 기능성이다. 이러한 카세트는 "벡터"로 구축될 수 있다.

본 명세서에서 사용되는 용어 "벡터", "벡터 구성체", "발현 벡터", 또는 "유전자 전달 벡터"는 이것에 연결된 다른 핵산 분자를 수송할 수 있는 핵산 분자를 의미하고자 하고, 제한없이, 플라스미드 벡터, 코스미드 벡터, 파지 벡터, 예컨대 람다 파지, 바이러스 벡터, 예컨대 아데노바이러스, AAV 또는 배큘로바이러스 벡터, 또는 인공 염색체 벡터 예컨대 박테리아 인공 염색체 (BAC), 효모 인공 염색체 (YAC), 또는 P1 인공 염색체 (PAC)를 포함하는, 임의의 적합한 유형을 포함하여, 당업자에게 공지된 임의 벡터를 포함한다. 발현 벡터는 플라스미드를 비롯하여 바이러스 벡터를 포함하고, 일반적으로 특정 숙주 유기체 (예를 들어, 박테리아, 효모, 식물, 곤충, 또는 포유동물) 또는 시험관내 발현 시스템에서 작동적으로 연결된 코딩 서열의 발현에 필요한 적절한 DNA 서열 및 바람직한 코딩 서열을 함유한다. 발현 벡터는 그들이 도입되는 숙주 세포에서 자율 복제할 수 있다 (예를 들어, 숙주 세포에서 기능하는 복제 기원을 갖는 벡터). 다른 벡터는 숙주 세포에 도입 시 숙주 세포의 게놈에 통합될 수 있고, 그리하여 숙주 게놈과 함께 복제된다. 적합한 벡터는 특정 숙주 유기체 (예를 들어, 박테리아 세포, 효모 세포)에 따르고 바람직한 조절 서열, 예컨대 프로모터, 인핸서, 종결자 서열 등을 갖는다. 클로닝 벡터는 일반적으로 일정한 바람직한 DNA 단편을 조작하고 증폭시키는데 사용되고 바람직한 DNA 단편의 발현에 필요한 기능적 서열이 결여될 수 있다. 원핵생물 세포를 형질감염시키는데 사용을 위한 발현 벡터의 구축은 또한 당분야에서 충분히 공지되어 있고, 따라서 표준 기술을 통해 수행될 수 있다 (예를 들어, 당분야의 정의 및 용어에 대해 하기 문헌을 참조함: Sambrook, et al. Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Press, Plainsview, New York (2012); and Ausubel et al., Current Protocols in Molecular Biology (Supplement 114), John Wiley & Sons, New York (2016)).

추가 구현예는 본 명세서에 기술된 바와 같은 키메라 유전자를 발현하는 숙주 세포에 관한 것으로서, 그리하여 가능하게 그 결과로 다량체의 프로토머 또는 단백질 서브유닛을 포함하거나 또는 본 명세서에 기술된 바와 같은 섬유를 형성하는 숙주 세포가 생성된다. '숙주 세포'는 원핵생물일 수 있거나 또는 진핵생물일 수 있다. 세포는 일시적으로 또는 안정하게 형질감염될 수 있다. 원핵생물 및 진핵생물 세포로 발현 벡터의 이러한 형질감염은 제한없이 표준 박테리아 형질전환, 칼슘 포스페이트 공-침전, 전기천공, 또는 리포솜 매개-, DEAE 덱스트란 매개-, 다가양이온 매개-, 또는 바이러스 매개 형질감염을 포함한, 당분야에 공지된 임의 기술을 통해서 수행될 수 있다. 모든 표준 기술에 대해서, 예를 들어, 하기 문헌들을 참조한다: Sambrook et al., Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Press, Plainsview, New York (2012); and Ausubel et al., Current Protocols in Molecular Biology (Supplement 114), John Wiley & Sons, New York (2016). 본 문맥에서 재조합 숙주 세포는 본 발명의 단리된 DNA 분자, 핵산 분자 또는 발현 구성체 또는 벡터를 함유하도록 유전자 변형된 것들이다. DNA는 제한없이, 형질전환, 리포펙션, 전기천공 또는 바이러스 매개 형질도입을 포함한, 특정 유형의 세포에 적절한, 당분야에 공지된 임의 수단에 의해서 도입될 수 있다. 본 발명의 키메라 단백질을 발현할 수 있는 DNA 구성체는 당분야에 공지된 기술 예컨대 클로닝, 혼성화, 스크리닝 및 중합효소 연쇄 반응 (PCR)을 통해서 쉽게 제조될 수 있다. 클로닝, DNA 단리, 증폭 및 정제, DNA 리가제, DNA 중합효소, 제한 엔도뉴클레아제 등을 포함한 효소 반응, 및 다양한 분리 기술에 대한 표준 기술은 공지되어 있고 당업자가 통상적으로 적용한다. 다수의 표준 기술이 [Sambrook et al. (2012), Wu (ed.) (1993)] 및 [Ausubel et al. (2016)]에 기술되어 있다. 본 발명에서 사용될 수 있는 대표적인 숙주 세포는 박테리아 세포, 효모 세포, 식물 세포, 및 동물 세포를 포함하지만, 이에 제한되지 않는다. 본 발명에서 사용에 적합한 박테리아 숙주 세포는 에스케리치아 (Escherichia) spp. 세포, 바실러스 (Bacillus) spp. 세포, 스트렙토마이세스 (Streptomyces) spp. 세포, 어위니아 (Erwinia) spp. 세포, 클렙시엘라 (Klebsiella) spp. 세포, 세라티아 (Serratia) spp. 세포, 슈도모나스 (Pseudomonas) spp. 세포, 및 살모넬라 (Salmonella) spp. 세포를 포함한다. 본 발명에서 사용에 적합한 동물 숙주 세포는 곤충 세포 및 포유동물 세포를 포함하고, 가장 특히 중국 햄스터 (예를 들어, CHO), 및 인간 세포주, 예컨대 HeLa로부터 유래된다. 본 발명에서 사용에 적합한 효모 숙주 세포는 사카로마이세스 (Saccharomyces), 스키조사카로마이세스 (Schizosaccharomyces), 클루이베로마이세스 (Kluyveromyces), 피키아 (Pichia) (예를 들어, 피키아 파스토리스 (Pichia pastoris)), 한세눌라 (Hansenula) (예를 들어, 한세눌라 폴리모르파 (Hansenula polymorpha)), 야로위아 (Yarowia), 슈와니오마이세스 (Schwaniomyces), 스키조사카로마이세스 (Schizosaccharomyces), 자이고사카로마이세스 (Zygosaccharomyces) 등에 속하는 종을 포함한다. 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae), 에스. 칼스베르겐시스 (S. carlsbergensis) 및 케이. 락티스 (K. lactis)가 가장 일반적으로 사용되는 효모 숙주이고, 편리한 진균 숙주이다. 숙주 세포는 현탁 또는 플라스크 배양, 조직 배양, 장기 배양 등으로 제공될 수 있다. 대안적으로, 숙주 세포는 또한 유전자이식 동물일 수 있다.

특정 구현예는 본 명세서에 정의된 바와 같은, Ena 단백질, 또는 조작된 Ena 단백질을 코딩하는 키메라 유전자를 포함하는 바실러스 spp. 세포에 관한 것으로서, 상기 바실러스 spp.의 포자 형성 시에, 유전자가 발현되어서 생체내에서 조작된 Ena 다량체 및 섬유로 자가-조립을 위해 (조작된) Ena 단백질을 갖는, 변형된 내생포자를 형성한다. 따라서, 특정 구현예는 Ena 단백질 또는 조작된 Ena 단백질을 포함하는 재조합 단백질 섬유를 포함하거나 또는 디스플레이하는 바실러스 포자 또는 내생포자에 관한 것이다. 상기 포자 상의 상기 조작된 섬유는 일정 환경 또는 상황에서 포자를 적용하는데 유리할 수 있다.

다른 구현예는 포자-형성 박테리아 세포에서 본 명세서에 기술된 바와 같은 키메라 유전자(들)의 재조합 발현 단계, 및 포자형성을 유도하기 위한 조건에서 인큐베이션하는 단계를 포함하는, 이러한 변형된 내생포자를 제조하기 위한 방법에 관한 것이다.

본 발명의 다른 양태는 본 발명의 (조작된) 다량체 또는 단백질 섬유를 함유하는, 변형된 표면 또는 고형 지지체에 관한 것이다. 특히 변형된 표면이 개시되고, 본 명세서에 정의된 바와 같은 자가-조립 Ena 단백질 서브유닛이 고형 표면에 공유적으로 연결된다. 특정 구현예는 상기 변형된 표면에 관한 것으로서, 적어도 하나의 Ena 단백질 서브유닛 또는 조작된 Ena 단백질은 고형 지지체에 공유적으로 연결된다. 이러한 변형된 표면은 적어도 하나의 Ena 단백질 서브유닛을 포함하는 상기 변형된 표면이 Ena 단백질을 더 포함하는 용액에 노출될 때, 다량체로 서로 자가-조립되고, 공유 디술피드 가교 형성시, 상기 표면으로부터 과성장되는 단백질 섬유를 형성하게 되는, 상기 단백질 서브유닛 및 표면에 연결된, 본 명세서에 기술된 바와 같은 다량체 및 섬유를 더 형성하도록 에피택셜 성장을 허용하는 핵형성제 표면으로서 사용될 수 있다.

표면 고정화는 당업자에게 공지된 수단을 사용하여 상기 표면 상에 적어도 하나의 (조작된) Ena 단백질 서브유닛의 공유 결합으로서 고려될 수 있다. 이러한 수단은 당분야에 공지된 바와 같은, 클릭 화학, 예를 들어 NHS-화학을 통해서 (N-말단에, 리신을 통해) 유리 아민과 가교 결합, 디술피드 가교 결합, 티올-기반 가교 결합, 태그 (스냅- 또는 소르타제 태그 예를 들어)의 첨가, 표면에 단백질의 공유 부착을 허용하는 Ena 단백질의 N-말단 또는 C-말단에서의 융합을 포함하지만, 이에 제한되지 않는다. 단량체 Ena 서브유닛이 표면에 커플링되는 조건은 특정 구현예에서 변성 완충 조건과 관련된 것으로 여겨진다.

단백질 섬유 또는 조작된 단백질 섬유는 또한 숙주의 미생물 표면 또는 세포 상에 융합되거나 또는 부착될 수 있거나, 또는 Ena 단백질을 함유하는 용액에 노출되는 외래 표면 상에서 핵형성되어서 섬유 또는 조작된 섬유를 포함하는 변형된 표면을 수득할 수 있다.

따라서, 상기 표면 고정화는 본 명세서에서 생물학적 또는 합성 표면 상에서 수행될 수 있다. 생물학적 표면은 세포, 박테리아, (내생)포자의 표면, 또는 다른 천연 발생 또는 재조합 생산 표면을 포함한다. 재조합 단백질의 고밀도 표면 발현은 약학, 정밀 화학, 생물전환, 폐기물 처리 및 농약 생산 분야의 몇몇 생물공학적 적용 분야에서 세포 표면 디스플레이를 성공적으로 사용하기 위한 선결조건이다.

인공 또는 합성 표면은 예를 들어, 비드, 슬라이드, 칩, 플레이트, 또는 컬럼을 포함할 수 있다. 보다 특히, 인공 표면은 미립자 (예를 들어, 비드 또는 과립) 또는 편평하거나, 주름지거나, 또는 중공 섬유 또는 튜브일 수 있는 시트 형태 (예를 들어, 막 또는 필터, 유리 또는 플라스틱 슬라이드, 마이크로타이터 어세이 플레이트, 딥스틱, 모세관 장치)일 수 있다. 다양한 생물공학적 적용은 단백질 조립체, 예컨대 본 명세서에 기술된 바와 같은 다량체 조성물 또는 섬유를 사용한 합성 표면의 코팅 또는 활성화를 이용한다.

따라서, 본 발명은 또한 합성 표면 상에서 다량체 및/또는 섬유질 조립체의 형성을 야기시키고, 생체물질의 생체의학 또는 생명공학 분야에서 일정 목적을 수행하기 위해 추가의 특별한 포획 또는 디스플레이 수단 및 분자를 위한 형태로 상기 표면에 이들을 디스플레이하는 자가-조립 성질과 Ena 단백질 또는 이의 유도체의 생산을 결합시키는 시험관내 방법 또는 시스템을 제공한다.

본 발명은 또한 특정 상황에서 단백질 서브유닛, 다량체 또는 섬유 또는 이의 임의의 조작된 형태를 생성시켜서 수득된 직접적으로 적용가능한 생산물에 관한 것이다. 실제로 본 발명에 따른 자가-조립 단백질 서브유닛은 점 돌연변이, 펩티드 또는 단백질 융합, 및 접합을 통해 상이한 기능을 위해 재단될 수 있는, 긴, 탄성의, 유연한 나노섬유뿐만 아니라, 다량체 조립체로 쉽게 자가-조립될 수 있게 허용한다. 매우 높은 가요성을 갖지만, 혹독한 조건 하에서도, 높은 강성 및 안정성을 갖는 상기 조작된 나노섬유는 차세대 생체물질을 제공하게 된다. 일 구현예에서, 이러한 생체물질은 본 명세서에 기술된 바와 같은 조작된 단백질 섬유, 및/또는 본 명세서에 기술된 바와 같은 단백질 섬유를 포함하는 얇은 단백질 필름의 형태로 존재한다. 실시예 섹션 (및 예를 들어, 도 8F 및 12)에 제공되는 바와 같이, '얇은'이란 그 직경 크기 (대략, 8 nm)의 배수를 가져서, 나노미터 범위인 몇개 층을 갖는, 적어도 바실러스에서 관찰되는 Ena 부속물의 직경 크기와 유사한, 섬유의 크기로 정의되는 바와 같이, 오직 제한된 수의 층이 가능한 것을 의미한다. 이러한 박막은 실제로 섬유에 의해 형성되는 밀집되고 보호된 환경을 제공한다. 예를 들어, 세제, 화학물, 열, UV 및 본 명세서에서 관찰되는 바와 같은 다른 혹독한 조건에 대해 증가된 내성은 이러한 박막이 필름의 반대 측면 상의 분자를 보호하도록 허용한다.

다른 구현예는 본 발명의 조작된 단백질 섬유, 및 임의로 본 명세서에 기술된 바와 같은 단백질 섬유를 포함하는 히드로겔에 관한 것이다. 다른 구현예에서, 본 명세서에 기술된 바와 같은 조작된 다량체 또는 본 명세서에 기술된 바와 같은 조작된 단백질 서브유닛을 포함하는 다량체를 포함하는 히드로겔을 개시한다. 히드로겔은 별개의 3차원 구조를 유지하는 수-팽윤 중합체 물질로서 알려져 있다. 그들은 인간 신체에서 사용을 위해 디자인된 최초의 생체물질이었다. 히드로겔 디자인의 신규한 접근법은 치료제, 센서, 미세유체 시스템, 나노반응기 및 상호작용 표면에서 적용되는 생체물질 연구의 이러한 분야를 활성화시켰다. 히드로겔은 소수성, 정전기 또는 다른 유형의 분자 상호작용에 의해서 자가-조립될 수 있다. 자연계에서 발견되는 인식 모티프를 사용한, 히드로겔-형성 중합체의 디자인은 정확하게 정의된 3차원 구조의 형성을 위한 잠재성을 증강시킨다. 본 발명의 (조작된) 다량체 또는 단백질 섬유는 또한 방법이 당업자에게 공지된, 히드로겔을 형성하기 위한 충분히 구조화된 3D 빌딩 블록을 제공한다. 본 발명의 밝혀진 구조의 다양성은 특히 히드로겔 생체물질의 새로운 클래스의 성공적인 디자인을 위해 본 발명의 조작된 단백질 서브유닛, 다량체 또는 섬유를 사용하여, 이의 안정성 및 특이성을 조작할 기회를 제공한다. 더 나아가서, 또한 하이브리드 히드로겔이 본 명세서에서 고려되고, 일반적으로 공유적으로 또는 비공유적으로 상호연결된, 적어도 2종의 별개 클래스의 분자로부터의 성분, 예를 들어 합성 중합체 및 생물학적 거대분자를 보유하는 히드로겔 시스템이라고 한다. 합성 중합체와 비교하여, 단백질 및 단백질 모듈은 충분히 정의되고 균질한 구조, 일관된 기계적 성질, 및 협력적인 폴딩/언폴딩 전이를 갖는다. 상기 하이브리드 히드로겔에서 사용되는 본 발명의 단백질 섬유 또는 다량체는 나노미터 수준에서 구조 형성에 대한 제어 수준을 부여할 수 있고, 합성 부분은 일정 생체의학 적용에서 하이브리드 물질의 생체적합성에 기여할 수 있다. 아미노산 서열을 최적화하여서, 즉 조작된 Ena 단백질을 적용하여, 특정 적용을 위해 맞게 제작된 반응성 하이브리드 히드로겔을 디자인할 수 있다. 상이한 유형의 히드로겔의 가능한 적용은 조직 조작, 합성 세포외 매트릭스, 이식가능한 장치, 바이오센서, 분리 시스템, 효소 활성을 제어하는 물질, 인지질 이중층 탈안정화제, 가역적 세포 부착을 제어하는 물질, 3차원 공간에 정확하게 배치된 반응성 기를 갖는 나노반응기, 반응성 히드로겔을 갖는 스마트 미세유체학, 및 에너지-전환 시스템을 포함한다.

본 발명의 최종 양태는 상기 자가-조립 단백질 서브유닛, 다량체, 시험관내 또는 생체내/세포내 생산된 단백질 섬유를 제조하거나, 또는 추가로 '저지된' Ena 단백질, Ena 단백질, 다량체 및 섬유의 조작된 형태를 생산하고, 본 발명의 변형된 표면을 생산하기 위한 방법에 관한 것이다. 상기 단백질 서브유닛 단량체 또는 자가-조립된 다량체를 제조하기 위한 방법은 하기 단계를 포함하는 재조합 또는 시험관내 방법이다:

a) 세포를 수득하도록, 세포에서 본 명세서에 기술된 바와 같은, 임의로 이종성 N-말단 또는 C-말단 태그를 포함하는 조작된 Ena 단백질을 코딩하는, 키메라 유전자의 재조합 발현 단계로서, 본 발명의 단백질 서브유닛 또는 다량체는 시토졸에 존재하는 것인 단계, 및 임의로

b) 예를 들어 세포 용해 및 분리를 통해서, 상기 변형된 세포로부터 상기 단백질 또는 다량체를 정제하거나 또는 단리하는 단계.

일 구현예는 상기 방법에 관한 것으로서, 상기 세포에서 발현되는 키메라 유전자의 단백질 서브유닛은 조작된 단백질 서브유닛 또는 조작된 Ena 단백질일 수 있거나, 또는 하나 이상의 야생형 Ena 단백질 및/또는 본 발명의 조작된 단백질 서브유닛의 상이한 형태의 발현을 제공하는 하나 초과의 키메라 구성체일 수 있다.

다른 구현예는 상기 방법에 관한 것으로서, 단계 b)에서 정제는 봉입체의 단리 및 가용화, 가용화된 단백질 서브유닛의 리폴딩, 및 재폴딩된 단백질 다량체의 정제 단계를 포함한다. 예를 들어 친화성 크로마토그래피, 이온 교환 크로마토그래피, 겔 여과, 또는 추가 대안을 사용하는 추가의 정제 방법은 당업자에게 공지되어 있다.

다른 구현예에서, 세포에서 재조합적으로 발현시키기 위해 상기 방법에서 사용되는 키메라 유전자에 의해 코딩되는, 본 명세서에 기술된 바와 같은 단백질 서브유닛, 특히 (조작된) Ena 단백질 서브유닛은 이종성 N-말단 또는 C-말단 태그를 포함한다. 상기 N-말단 또는 C-말단 태그는 여전히 다량체로 자가-조립될 수 있는 단백질 서브유닛의 생산을 일으킬 수 있지만, 상기 N-말단 또는 C-말단 태그의 비천연 존재 덕분에, 입체 방해는 추가의 섬유 형성 또는 '과형성'으로 이들 단백질 서브유닛 또는 다량체를 저지시킨다. 가장 바람직하게 상기 이종성 N-말단 또는 C-말단 태그는 저지되거나 또는 방해된 섬유 형성 또는 에피택셜 성장의 차단 또는 지연을 야기하도록 적어도 1-5, 6, 7, 9 또는 적어도 15개 아미노산이다. 상기 이종성 N-말단 또는 C-말단 태그는 본 명세서에 기술된 바와 같이, 친화성 태그일 수 있다.

다른 구현예는

a) 본 명세서에 기술된 바와 같은 Ena 단백질 서브유닛 또는 다량체를 포함하는, 숙주 세포를 사용하거나, 또는 세포에서 키메라 유전자의 발현 단계, 및

b) 임의로, 세포를 용해시켜서 자가-조립된 단백질 섬유를 단리하는 단계

를 포함하는, 숙주 세포에서 단백질 섬유를 재조합적으로 제조하기 위한 방법에 관한 것으로서,

상기 자가-조립 단백질 서브유닛 또는 Ena 단백질을 코딩하는 핵산은 이종성 N-말단 또는 C-말단 태그를 제공하지 않는다. 태그-무함유 또는 비-입체 방해된 Ena 단백질을 재조합적으로 발현시켜서, 세포질에서 섬유로 자발적 자가 조립은 생체내에서 S-형 유사 섬유를 쉽게 생산하도록 허용한다.

추가 구현예는 하기 단계를 포함하는, 본 발명에 따른 단백질 섬유 또는 조작된 단백질 섬유를 제조하기 위한 시험관내 방법에 관한 것이다:

a) 본 발명의 단백질 서브유닛 또는 다량체가 존재하는 세포를 수득하기 위해서, 세포에서 본 명세서에 기술된 바와 같은 키메라 유전자의 발현 단계로서, 상기 단백질 서브유닛은 절단가능한 이종성 N-말단 또는 C-말단 태그를 포함하는 것인 단계,

b) 상기 세포로부터 상기 단백질 또는 다량체를 정제하는 단계,

c) 섬유를 형성하기 위해 서로에 공유적으로 연결을 위한 다량체를 생성하도록 N-말단 또는 C-말단 태그를 절단하는 단계.

대안적으로, 상기 단백질 섬유는 단계 b) 및 c)가 뒤바뀐 상기 방법을 통해서 생산된다. 절단가능한 태그는 예를 들어 단백질 가수분해 절단 부위를 갖는 태그, 또는 당업자에게 공지된 바와 같은 절단가능한 태그이다.

다른 구현예는 또한, 섬유, 다량체 또는 이의 조작된 형태를 제조하고 정제하기 위한 방법 단계, 및 이어서 생물학적 또는 인공 표면일 수 있는, 표면에 단백질, 다량체 또는 섬유를 공유적으로 부착시키는 추가 단계를 포함하는, 본 명세서에 개시된 바와 같이 변형된 표면을 제조하기 위한 방법을 제공한다.

마지막으로, 상이한 분야, 예컨대 생체의학 및 생명공학 분야에서 차세대 생체물질로서 상기 Ena 단백질 또는 조작된 Ena 단백질 서브유닛-유래 조립체에 대해서 본 명세서에서 이미 교시된 바와 같이 수많은 적용분야가 존재한다. 따라서, 상기 나노물질의 용도 및 활용성은 무한하다.

특정 구현예, 특정 구성을 비롯하여 재료 및/또는 분자가 개시에 따른 방법, 및 생산물에 대해 본 명세서에서 논의되었지만, 형태 및 상세사항에서 다양한 변화 또는 변형이 본 발명의 범주를 벗어나지 않고 만들어질 수 있다는 것을 이해한다. 하기 실시예는 특정 구현예를 더 잘 예시하기 위해 제공되고, 그들은 본 출원을 제한하는 것으로 간주되어서는 안된다. 본 출원은 오직 청구항에 의해서만 제한된다.

실시예

실시예 1. 바실러스 세레우스 NVH 0075/95는 2개 형태 유형의 내생포자 부속물을 보여준다.

바실러스 및 클로스트리듐 종에 의해 형성되는 내생포자는 빈번하게 표면-부착된 깃털-, 리본- 또는 선모-유사 부속물을 보유하고 (Driks, 2007), 이의 역할은 그들 조립에 관여되는 경로의 분자 주석의 결여로 인해서 대체로 불가사의한 채로 남아있다. 그들 최초 관찰 (Hachisuka and Kuno, 1976; Hodgikiss, 1971) 후 반세기만에, 우리는 본 명세서에서 비. 세레우스 포자 상에서 발견된 부속물을 구조적으로 유전적으로 특징규명하기 위해서 cryoEM을 통한 고분해능 신규 구조 결정을 적용한다.

비. 세레우스 균주 NVH 0075/95의 음성 염색 EM 이미지화는 TEM 이미지 상에서 내생포자 몸체로부터 편평한 2-3 μm 길이의 주머니 모양 구조로서 발산되는 포자외막층에 의해서 조밀하게 싸여진, ∼1 μm 직경의 조밀한 코어를 갖는 전형적인 내생포자를 보여주었다 (도 1A). 내생포자는 마이크로미터-길이 부속물 (Ena)의 존재를 보여주었다 (도 1A). 평균 내생포자는 대략 600 nm의 중간 길이를 갖는, 200 nm 내지 6 μm 길이 범위의 20 내지 30 Ena를 계측하였다 (도 1E). Ena의 밀도는 포자외막 근처에 존재하는 포자체의 극에서 가장 높게 나타났다. 거기서, Ena는 내생포자 표면 상에서 수십 나노미터를 분리하는 개별 섬유의 다발로서 또는 개별 섬유로서 포자외막으로부터 출현하는 것으로 보인다 (도 1B 및 7B). 정밀 검사는 Ena가 2개의 별개 형태를 보인다는 것을 밝혀주었다 (도 1C, D). 주요 또는 "스태거드-형" (S-형) 형태는 관찰된 섬유 중 대략 90%를 나타냈다. S-형 Ena는 ∼110 Å의 너비를 갖고, 음성 염색 2D 클래스에서, 포자 표면을 가리키는 교대식 비늘을 갖는, 극성, 스태거드 외관을 제공한다. 원위부에서, S-형 Ena는 50 - 100 nm 길이 및 ∼35Å 두께의 다수의 필라멘트 연장부 또는 "주름"에서 종결된다 (도 1C). 소수 또는 "사다리-유사" (L-형) Ena 형태는 더 얇고, ∼80Å 너비이며, S-형 섬유에서 보이는 주름과 유사한 치수를 갖는 단일 필라멘트 연장부에서 종결된다 (도 1D). L-형 Ena는 ∼40Å 높이의 적층된 디스크-유사 단위의 사다리를 보이는 대신에, S-형 Ena의 비늘 모양의, 스태거드 외관이 결여된다. S-형 Ena는 포자외막을 횡단하고, 포자 몸체에 연결된 것으로 보일 수 있는 반면, L-형 Ena는 포자외막으로부터 출현하는 것으로 보인다 (도 7A). 양쪽 Ena 형태는 개별 내생포자에 공존한다 (도 7C). 어떠한 Ena 형태도 그람-양성 박테리아에서 이전에 관찰된 소르타제-매개 또는 IV형 선모를 연상시키지 않는다 (Mandlik et al., 2008; Melville and Craig, 2013). 그들 조성을 확인하기 위해서, 전단력 추출되고 정제된 Ena는 질량 분광법에 의한 확인을 위해서 트립신 분해가 수행되었다. 그러나, S-형 및 L-형 Ena의 양호한 농축에도 불구하고, 대체로 오염된 모세포 단백질, EA1 S-층 및 포자 외피 단백질을 함유한, 트립신 펩티드 중에서 Ena에 대한 확실한 후보가 확인되지 않았다. 강한 환원 조건 (200 mM 이하의 β-머캅토에탄올), 열처리 (100℃), 제한된 산 가수분해 (1시간 1 M HCl), 또는 카오트로프 예컨대 8 M 우레아 또는 6 M 구아니디늄 클로라이드와 인큐베이션을 포함한, SDS-PAGE를 통해서 Ena 단량체를 분해하기 위한 시도는 성공적이지 않았다. Ena 섬유는 또한 오토클레이빙, 건조 또는 프로테이나제 K 처리 시 그들 구조적 성질을 유지하였다 (도 7C).

우리는 비. 세레우스 Ena가 2개 주요 형태가 있다는 것을 발견하였다: 1) 수 마이크로미터 길이이고, 포자 몸체로부터 출현하여 포자외막을 횡단하는 스태거드 또는 S-형, 및 2) 포자외막 표면으로부터 직접적으로 출현하는 것으로 보이는 보다 작고, 덜 풍부한 사다리-형 또는 L-형 Ena.

실시예 2. 내생포자 부속물의 Cryo-EM은 그들 분자 정체를 확인한다.

Ena의 성질을 더욱 연구하기 위해서, 비. 세레우스 NVH 0075/95 내생포자로부터 정제된 섬유는 극저온 전자 현미경 (cryo-EM)을 통해 이미지화하였고 3D 재구성을 사용해 분석되었다. 단리된 섬유는 내생포자에서 보이는 것과 유사하게, 9.4:1 비율의 S-형 및 L-형 Ena를 보였다. 300 X 300 픽셀 (246 x 246Å²)의 치수를 갖는 박스는 21Å의 상자간 중복으로, 섬유의 길이를 따라서 추출되었고, RELION 3.0 (Zivanov et al., 2018)를 사용하여 2D 분류가 수행되었다. 2D 클래스 평균의 파워 스펙트럼은 S-형 Ena에 대한 충분히 정돈된 나선 대칭을 밝혀주었고 (도 2A,B), 반면 L-형 En는 주로 병진 대칭을 보였다 (도 1D). 대략 54.5Å의 나선 반경을 기반으로, 우리는 각각 -11 및 1의 베셀 차수를 갖도록 S-형 Ena의 파워 스펙트럼에서 층선 Z' 및 Z"을 추정하였다 (도 2A, B). 대부분의 추출된 상자를 보유하는 2D 클래스에서, 베셀 (Bessel) 차수 1 층선은 37.4Å의 피치에 상응하는, 이퀘이터로부터 0.02673Å^-1 의 거리에서 발견되었고, 음성 염색에 의해 보이는 분명한 '로브'의 간격과 일치된다 (도 1C, 2B 및 7). 올바른 나선 매개변수는 서브유닛 상승 및 비틀림에 대한 체계적인 일련의 출발값은 RELION 3.0 (He and Scheres, 2017)를 사용한 3D 재구성 및 실제 공간 베이지안 (Bayesian) 정밀화에 사용되는 경험적 접근법을 통해서 도출되었다. 추정된 푸리에 (Fourier)-베셀 인덱싱을 기반으로, 입력 상승 및 비틀림은 시험된 출발값 사이에서 1도 및 0.1Å의 샘플링 분해능으로, 각각 3.05 - 3.65Å 및 29 - 35도의 범위로 다양하였다. 이러한 접근법은 나선 매개변수의 고유 세트에서 수렴되어서 서브유닛 측쇄 에 대해 분명한 2차 구조 및 확인가능한 밀도를 갖는 3D 맵을 생성시켰다 (도 2C). 재구성된 맵은 회전부 당 11.6 단위를 갖는 나선에 상응하는, 서브유닛 당 3.22937Å 및 31.0338도의 상승 및 비틀림을 갖는 좌측 방향 1-출발 나선에 상응한다 (도 2D). RELION 3.0에서 정밀화 및 후처리 후에, 맵은 FSC_0.143　기준에 따라서 분해능 3.2Å인 것으로 확인되었다. 최종 맵은 대략 100 잔기의 8-가닥 β-샌드위치를 포함하는 잘 정의된 서브유닛을 보였다 (도 2E). 측쇄 밀도는 서열 F-C-M-V/T-I-R-Y을 갖는 짧은 모티프를 수동으로 추론하기에 충분한 품질이었다 (도 8A). 비. 세레우스 NVH 0075/95 프로테옴의 검색은 KMP91697.1 (SEQ ID NO:1) 및 KMP91698.1 (SEQ ID NO: 8) (도 8B)에 의해 코딩되는, 미지 기능의 2개의 가상 단백질을 확인하였다. Ena 서브유닛의 수동 모델 구축 및 전자 전위 맵의 추가 검사는 KMP91697.1 유전자좌의 15 bp 하류에 위치된 KMP91698.1에 의해 코딩되는 서열과 이것이 충분히 적합하다는 것을 보여주었다. 양쪽 유전자는 39% 쌍별 아미노산 서열 동일성, 미지 기능의 공유 도메인 (DUF) 3992 및 유사한 Cys 패턴을 갖는, 유사한 크기 (각각 KMP91698.1 및 KMP91697.1에 대해 117 및 126 아미노산, 및 12 및 14 kDa의 추정 분자량)의 가상 단백질을 코딩한다. KMP91698.1의 더욱 하류에서, 마이너스 가닥 상에서, KMP91699.1 유전자좌 (SEQ ID NO:15)는 17 kDa의 추정 분자량의 160 아미노의 제3 DUF3992 함유 가상 단백질을 코딩한다. 이와 같이, KMP91697.1, KMP91698.1 및 KMP91699.1은 이하 Ena1A, Ena1B 및 Ena1C으로 불리는 후보 Ena 서브유닛을 코딩하는 것으로 간주된다 (도 8B,C).

실시예 3. Ena1B는 시험관내에서 내생포자 부속물-유사 나노섬유로 자가-조립된다.

비. 세레우스 NVH0075/95로부터 단리된 내생포자 부속물의 서브유닛 정체를 확인하기 위해서, 우리는 이. 콜라이 세포질에서 재조합 발현을 위해서 벡터로 Ena1B 및 N-말단 TEV 프로테아제 절단가능한 6xHis-태그의 코딩 서열에 상응하는 합성 유전자 단편을 클로닝하였다 (SEQ ID NO:83로 표시된 recEna1B). 재조합 단백질은 봉입체를 형성하는 것으로 확인되어서, 친화성 정제 전에 8 M 우레아에서 가용화시켰다. 신속한 희석에 의한 카오트로픽제의 제거는 단리된 S-형 Ena에서 확인된 부분 나선 회전부를 연상시키는 풍부한 가용성 초승달-형상 올리고머의 형성을 일으켜서 (도 8A-E), 재폴딩된 재조합 Ena1B (recEna1B)가 천연 서브유닛-서브유닛 β-확대 접촉을 채택한다는 것을 시사한다 (도 8E). 우리는 recEna1B가 서브유닛의 Ntc에서 6xHis-태그에 의한 입체 방해로 인해 단일 회전부 수준에서 저지된 나선 부속물로 자가-조립된다고 추론하였다. 실제로, 친화성 태그의 단백질 가수분해적 제거는 생체외 섬유에서 확인된 원위 주름이 결여되었지만, S-형 Ena와 유사한 나선 매개변수 및 110Å 직경의 섬유의 형성을 일으켰다 (도 8F). CryoEM 데이터 수집 및 3D 나선 재구성은 시험관내 recEna1B 나노섬유가 생체외 S-형 Ena와 동형인지 여부를 평가하기 위해 수행되었다. RELION 3.0을 사용한 나선 매개변수의 실제 공간 정밀화는 회전부 당 11.1 서브유닛 및 38.3Å 피치의 좌측방향 나선에 상응하고, 생체외 S-형 Ens에서 발견되는 것에 비해서, 대략 0.2Å 및 1.3도 더 높은, 각각 3.43721Å 및 32.3504도의 서브유닛 상승 및 비틀림에서 수렴되었다. 나선 매개변수의 미미한 차이외에도, 시험관내 Ena1B 섬유의 3D 재구성 맵 (3.2Å의 추정 분해능; 도 9A, B)은 섬유 서브유닛의 크기 및 연결성 관점에서 생체외 S-형 Ena와 거의 동형이었다 (도 9D). recEna1B 및 생체외 S-형 Ena에 대한 3D cryEM 맵의 정밀 검사는 전자에서 Ena1B 잔기에 대해 적합한 개선된 측쇄를 보였고 (도 9B, C, D), 특히 루프 L1, L3, L5 및 L7에서, Ena1A의 부분 측쇄 특징을 보인 생체외 Ena 맵에서의 영역을 밝혀주었다 (도 8B, 9B,C). 생체외 맵의 Ena1B 특징이 우세하지만, 이것은 생체외 S-형 Ena가 Ena1A 및 Ena1B 섬유의 혼합 개체군으로 이루어지거나, 또는 S-형 Ena가 Ena1A 및 Ena1B 둘 모두를 포함하는 혼합 조성을 갖는다는 것을 시사하였다. recEna1A 또는 recEna1B로 발생된 혈청을 사용하는 면역금 표지화는 단일 Ena 내에서 서브유닛-특이적 표지화를 보였고, 이들이 Ena1A 및 Ena1B의 혼합 조성을 갖는다는 것을 확인하였다 (도 9E). S-형 Ena의 염색은 Ena1C 혈청에서 보이지 않았다 (도 9E). Ena1A 및 Ena1B에 대한 체계적 패턴화 또는 몰비율은 하나 초과의 서브유닛을 함유하는 비대칭 단위에 의한 나선 재구성 또는 면역금 표지화로부터 구별할 수 없어서, 섬유에서 Ena1A 및 Ena1B의 분포는 무작위적이라는 것을 시사한다. 혼합된 Ena1A 및 Ena1B 특징을 갖는 다수의 측쇄 밀도 이외에도, 생체외 Ena의 cryoEM 전자 전위 맵은 고유한 주쇄 입체구성을 보여서, Ena1A 및 Ena1B가 거의 동형 폴드를 갖는다는 것을 의미한다.

실시예 4. Ena1C는 시험관내에서 7량체 다량체로 자가-조립된다.

Ena1C의 야생형 서열 (WP_000802321)은 이. 콜라이에서 발현을 위해 코돈 최적화되었고 Twist Bioscience에서 합성 유전자로서 주문하고 추가로 pET28a 벡터 (NcoI-XhoI)에 서브클로닝하였다. 삽입부는 N-말단 6X 히스티딘 태그에 이어서 TEV 절단 부위 (SEQ ID NO:89: ENLYFQG)를 갖도록 디자인되었다. 대규모 재조합 발현은 NEB의 파지 내성 T7 Express lysY/Iq 이. 콜라이에서 수행되었다. 수득된 플라스미드 (pET28a_Ena1A; pET28a_Ena1B)를 사용하여 C43(DE3)의 적격 세포를 형질전환시켰다. 단일 콜로니를 사용하여 밤샘 (ON) LB 배양을 시작하였다. 10 mL ON 배양을 사용하여 1 L의 LB, 25 mg/mL 카나마이신에 37℃에서 접종하였다. 재조합 발현은 1 mM IPTG의 첨가를 통해 0.8의 OD₆₀₀ 에서 유도하였고, 배양은 ON 인큐베이션을 위해 정치시켰다. 세포는 15분 동안 4000 g에서 원심분리를 통해 펠렛화하였다. 전체-세포 펠렛은 변성 용해 완충액 (20 mM 포타슘 포스페이트, 500 mM NaCl, 10 mM β-ME, 20 mM 이미다졸, 8M 우레아, pH 7.5)에 재현탁하였고 얼음에서 초음파처리하였다. 용해물은 Beckman coulter의 JA-20 로터에서 45분 동안 20,000 rpm으로 원심분리를 통해서 가용성 및 불용성 분획을 분리하기 위해 원심분리하였다. 맑은 용해물을 Ni 세파로스를 충전하고 변성 용해 완충액으로 평형화시킨 5 mL HisTrap HP 컬럼에 로딩하였다. 결합된 단백질은 실온에서 AKTA 정제기를 사용하여 농도구배 방식 (20-250 mM 이미다졸)으로 용리 완충액 (20 mM 포타슘 포스페이트, pH 7.5, 8 M 우레아, 250 mM 이미다졸)을 사용해 용리하였다. 최종 분획은 순도를 검토하기 위해 SDS-PAGE에서 분석하였다. Ena1C를 함유하는 분획을 모았고, 20 mM 포타슘 포스페이트, 10 mM β-ME, pH 7.5로 투석 (밤샘, 1리터에 대해 100 μl, 3 kDa 컷오프)을 통해서 재폴딩하였다. 재폴딩된 물질의 5 μl 분취액을 Formvar/Carbon 그리드 (400 메쉬, Cu; Electron Microscopy Sciences) 상에 침착시켰고 2% (w/v) 우라닐 아세테이트를 사용해 염색하였다.　

도 14B (i)에 도시된 바와 같이, 9개 서브유닛의 원형 디스크 또는 고리는 Ena1C의 재조합 발현에 의해서만 오로지 형성되었다. 이러한 디스크에서, β-시트 확대를 통한 서브유닛의 측면 상호작용은 9-블레이드 β-프로펠러를 발생시키는 것으로 볼 수 있다.

실시예 5. Ena는 그람-양성 선모의 신규 패밀리를 나타낸다.

천연 S-형 Ena가 혼합된 Ena1A 및 Ena1B 조성을 보인다는 것을 인식시, 우리는 모델 구축을 위해 recEna1B의 3D cryoEM 재구성을 계속하였다. Ena 서브유닛은 가닥 BIDG 및 CHEF로 이루어진 2개의 병치된 β-시트로 구성된 전형적인 젤리롤 폴드 (Richardson, 1981)로 이루어진다 (도 2E). 젤리롤 도메인은 이하 N-말단 연결부 ('Ntc')라고 불리는 유연한 15개 잔기 N-말단 연장부가 선행된다. 서브유닛은 스태거드 β-시트 확대를 통해서 나란히 정렬되고 (Remaut and Waksman, 2006), 여기서 서브유닛 i의 가닥 BIDG는 선행 서브유닛 i-1의 가닥 CHEF에 의해 확대되고, 서브유닛 i의 가닥 CHEF는 행 i+1에서 다음 서브유닛의 가닥 BIDG에 의해 확대된다 (도 2E, 도 10A, B). 이와 같이, 내생포자 부속물의 팩킹은 나선 회전부 당 11.6 블레이드 및 서브유닛 당 3.2Å의 축 상승을 갖는, 8-가닥 β-시트의 비스듬한 β-프로펠러로서 간주될 수 있다 (도 2E). β-프로펠러에서 서브유닛-서브유닛 접촉부는 Ena 서브유닛 상에서 2개의 상보적 정전기 팻치에 의해 더욱 안정화된다 (도 10C). 이들 측면 접촉이외에도, 나선 회전부를 가로지르는 서브유닛은 또한 Ntc를 통해서 연결되고, 각 서브유닛 i의 Ntc는 선행 나선 회전부에서 서브유닛 i-9 및 i-10과 디술피드 결합 접촉부를 만든다 (도 2E, 도 10B). 이들 접촉은 각각 서브유닛 i-9 및 i-10의 가닥 I 및 B에서 Cys 109 및 Cys 24과, 서브유닛 i에 Cys 10 및 Cys 11의 디술피드 결합을 통해 만들어진다 (도 2E, 10B). 따라서, Ntc를 통한 디술피드 결합은 나선 회전부의 가교를 통한 섬유의 종방향 안정화를 비롯하여, 인접한 서브유닛의 공유 가교 결합에 의한 β-프로펠러의 추가 측면 안정화를 일으킨다. Ntc 접촉부는 나선의 내강 측면에 위치되어서, 대략 1.2 nm 직경의 중심 보이드를 남긴다 (도 10D). 잔기 12-17은 Ena 젤리롤 도메인 및 Ntc 사이에 유연한 스페이서 영역을 형성한다. 놀랍게도, 이러한 스페이서 영역은 Ntc를 통한 것 이외에 직접 접촉하지 않는, Ena 서브유닛 사이의 4.5Å 종방향 갭을 생성시킨다 (도 3C, 8B). Ntc 스페이서의 가요성 및 나선 회전부를 가로지르는 서브유닛의 직접 종방향 단백질-단백질 접촉의 결여는 Ena 섬유에서 큰 굽힘성 및 탄력성을 생성시킨다 (도 3). 내생포자-연관된 섬유의 2D 클래스 평균은 8Å 이하의 피치 변화 (범위: 37.1 - 44.9Å; 도 3D), 및 나선 회전부 당 10도 이하의 축방향 흔들림으로, 종방향 신장을 보인다 (도 3A, B).

다라서, 비. 세레우스 내생포자 부속물은 β-시트 확대에 의해 형성된 비공유 측면 서브유닛 접촉부, 및 디술피드 결합된 N-말단 연결부 펩티드에 의한 나선 회전부 간 공유 종방향 접촉부를 갖는 좌측방향 단일 출발 나선을 포함하는, 신규 클래스의 박테리아 선모를 나타내고, 높은 섬유 가요성과 극도의 화학적 안정성 (도 7)을 조합한 아키텍처를 생성시킨다.

공유 결합, 및 매우 조밀한 젤리롤 폴드는 건조, 고온 처리, 및 프로테아제 노출을 견디는, Ena 섬유의 높은 화학적 및 물리적 안정성을 일으킨다. 수백개의 서브유닛의 선형 필라멘트의 형성은 서브유닛-서브유닛 복합체의 해리가 선모 파괴를 일으키는 것을 피하기 위해서 높은 가요성을 갖는 안정한, 수명이 긴 서브유닛-서브유닛 상호작용을 필요로 한다. 이러한 높은 안정성 및 가요성은 감염 주기 동안 또는 환경에서 내생포자가 만날 수 있는 극한 조건에 대한 적응일 수 있다.

다음의 2개 분자 경로는 그람-양성 박테리아에서 표면 섬유 또는 "선모"를 형성하는 것으로 알려져 있다: 1) 소르타제에 의해 촉매되는 전이펩티드화 반응을 통한 선모 서브유닛의 공유 연결을 포괄하는 소르타제-매개 선모 조립 (Ton-That and Schneewind, 2004), 및 2) 소수성 N-말단 나선의 코일-코일 상호작용을 통한 서브유닛의 비공유 조립을 포괄하는 IV형 선모 조립 (Melville and Craig, 2013). 소르타제-매개 선모 및 IV형 선모는 영양 세포 상에서 형성되지만, 지금까지, 이들 경로가 또한 내생포자 부속물의 조립을 담당한다는 것을 시사하는 증거를 입수할 수 없다.

본 연구까지, 포자 부속물의 유전적 정체 및 단백질 조성이 알려진 유일한 종은 대부분의 다른 클로스트리듐 및 바실러스 종에서 발견되는 것과 구조적으로 별개인, 큰 (4.5 μm 길이, 0.5 μm 너비 및 30 nm 두께) 리본-유사 부속물을 보유하는 비-독성원성 환경 종 클로스트리듐 타에니오스포룸 (Clostridium taeniosporum)이다. 씨. 타에니오스포룸은 포자외막층이 결여되고, 부속물은 외피 외부에, 미지 조성의 다른 층에 부착되는 것으로 보인다 (Walker et al., 2007). 씨. 타에니오스포룸 내생포자 부속물은 4개의 주요 성분으로 이루어지고, 이들 중 3개는 다른 종에서 알려진 상동체 및 비. 서브틸리스 포자 구성원 단백질 SpoVM의 오솔로그를 갖지 않는다 (Walker et al., 2007). 그러므로, 씨. 타에니오스포룸 내생포자 표면 상의 부속물은 비. 세레우스 그룹에 속하는 종의 포자 표면에서 발견되는 것과 별개 유형의 섬유를 나타낸다.

우리의 구조 연구는 신규한 클래스의 선모를 발견하였는데, 서브유닛이 나선 회전부 내부에 측면 β-시트 확대, 및 나선 회전부를 가로질러 종방향 디술피드 가교 결합을 통해 함께 유지되는 나선으로 감겨진 섬유로 조직된다. 선모 조립에서 공유 가교 결합은 그람 양성 선모에서 보이는 소르타제-매개된 이소펩티드 결합 형성에 대해 알려져 있다 (Ton-That and Schneewind, 2004). Ena에서, 가교 결합은 나선 구조의 위치 i-9 및 i-10에 위치된 Ena 서브유닛의 코어 도메인 내 2개 단일 Cys 잔기에 대한, 서브유닛 i의 N-말단 연결부의 보존된 Cys-Cys 모티프의 디술피드 결합을 통해서 일어난다. 이와 같이, N-말단 연결부는 선행 나선 회전부에서 2개의 인접한 서브유닛 (즉, i-9 및 i-10)과 분기 상호작용을 비롯하여, 나선 회전부를 가로지른 공유 가교를 형성한다. N-말단 연결부 또는 연장부의 사용은 또한 샤페론-어셔 선모 및 박테로이데스 V형 선모에서 보이지만, 이들 시스템은 긴 수명의 서브유닛-서브유닛 접촉을 얻기 위해 비-공유 폴드 상보성 기전을 적용하고, 공유 안정화는 결여된다 (Sauer et al., 1999; Xu et al., 2016). Ena에서, N-말단 연결부가 유연한 링커를 통해 Ena 코어 도메인에 부착되므로, Ena 섬유의 나선 회전부는 종방향 신장을 겪는 능력 및 큰 회전 자유도를 갖는다. 이들 상호작용은 큰 정도의 가요성을 갖는, 고도로 화학적으로 안정한 섬유를 생성시킨다. Ena의 신장성 및 굽힙성이 기능적으로 중요한지 여부는 아직 불분명하다. 특히, 몇몇 샤페론-어셔 선모에서, 선모의 나선식 풀림 및 되감김에 의해 제공되는 가역적 스프링-유사 신장은 부착 박테리아에 대해 발휘되는 전단 및 당김 응력을 견디는데 중요한 것으로 확인되었다 (Miller et al., 2006); (Fallman et al., 2005). 가능하게, Ena에서 보이는 종방향 신장은 유사한 역할을 제공할 수 있다.

실시예 6. S-형 Ena에 대한 ena1 코딩 영역.

비. 세레우스 NVH 0075/95에서, Ena1A, Ena1B 및 Ena1C는 상류에서 dedA 가 측접된 게놈 영역 (genbank: KMP91696.1) 및 미지 기능의 93-잔기 단백질을 코딩하는 유전자 (DUF1232, genbank: KMP91696.1)에서 코딩된다 (도 4A). 하류에, ena-유전자 클러스터는 산 포스파타제를 코딩하는 유전자가 측접된다. ena-유전자 클러스터 내에, ena1A 및 ena1B 는 각각 전방향에서, ena1C 는 역방향에서 발견된다 (도 4A). 배양의 4시간 및 16시간 후에 단리된 mRNA로부터 만들어진 NVH 0075/95 cDNA의 PCR 분석은, 영양 성장 및 포자형성 세포를 나타내고, 각각 표시된 ena1A 및 ena1B 는 영양 성장 동안이 아닌, 포자형성 동안 바이시스트론 전사물로부터 공-발현된다 (도 4B). 약한 증폭 신호는 전방향 프라이머가 ena1A의 상류dedA 에 위치되고, 역방향 프라이머가 ena1B 내에 위치될 때 영양 세포에서 관찰되었고 (도 4B, 레인 2), 일부 enaA 및 enaB 는 dedA 와 함께 공발현된다는 것을 시사한다. 이것은 후기 포자형성 단계 동안이 아닌 영양 세포 또는 포자형성의 매우 초기에 관찰되었고, 부적절하게 종결된 dedA mRNA의 분획을 나타낼 수 있다. 정량적-실시간 PCR 분자는 영양 세포와 비교하여 포자형성 세포에서 ena1A, ena1B 및 ena1C 의 증가된 발현을 보였다 (도 4B).

전형적인 Ena 필라멘트는 우리가 아는 한, 영양 비. 세레우스 세포의 표면 상에서 관찰된 적이 없었고, 그들이 내생포자-특이적 구조인 것을 의미한다. 그러한 가정을 뒷받침하기 위해서, qRT-PCR 분석 NVH 0075/95는 영양 세포와 비교하여, 포자형성 동안 증가된 ena1A-C 전사물을 입증하였다. 전사 분석은 비. 투린지엔시스 혈청형 키넨시스 (B. thuringiensis serovar chinensis) CT-43에 대해 이전에 수행되어서 접종 후 7시간, 9시간, 13시간 (포자형성을 겪은 세포의 30%) 및 22시간에 전사를 입증하였다 (Wang et al., 2013). 비. 세레우스 NVH 0075/95의 ena1A, B 및 C의 발현 수준을 비. 투린지엔시스 혈청형 키넨시스 CT-43 　(CT43_CH0783-785)의 ena2A-C의 발현 수준과 직접 비교하는 것은 어려운데　 후자 균주의 발현은 유전자 당 판독수를 RPKM (Reads Per Kilo bases per Million reads)으로 전환시켜서 정규화되었고 DEGseq 소프트웨어 패키지를 통해 분석되는 반면, 본 연구는 하우스 키핑 유전자 rpoB 에 비해서 ena 유전자의 발현 수준을 결정하기 때문이다. 그러나, 양쪽 연구는 enaA 및 enaB 가 포자형성 동안만 전사된다는 것을 의미한다. 공개된 전사체 프로파일링 데이터의 개별 세트를 조사하여서, 우리는 ena2A-C 가 또한 포자형성 동안 비. 안트라시스 (B. antracis)에서 발현된다는 것을 발견하였지만 (Bergman et al., 2006), Ena는 비. 안트라시스 포자로부터 이전에 보고된 적이 없다.

생체외 S-형 Ena의 CryoEM 맵 및 면역-금 TEM 분석은 이들이 Ena1A 및 Ena1B 둘 모두를 함유한다 것을 의미하였다 (도 9B-D). 비. 세레우스 Ena에 대한 Ena1 서브유닛의 상대적 기여를 결정하기 위해서, 우리는 ena1A, ena1B 를 비롯하여 ena1C 의 개별 염색체 녹아웃을 만들었고, TEM을 통해서 그들 개별 내생포자를 조사하였다. 모든 ena1 돌연변이체는 WT와 유사한 치수 및 온전한 포자외막을 갖는 내생포자를 만들었다 (도 5A, 도 11). ena1A 및 ena1B 돌연변이체는 S-형 Ena가 완전하게 결여된 내생포자를 생성시켰는데, 생체외 섬유의 혼합 함량과 일치된다. 또한 ena1C 돌연변이체는 내생포자 상에서 S-형 Ena의 상실을 야기시켰지만 (도 5A), 항-Ena1C 혈청을 사용한 염색은 S-형 Ena 내부에 단백질의 존재를 확인하지 못하였다 (도 9D). 모든 3종의 돌연변이체는 여전히 WT 내생포자와 유사한 크기 및 수밀도의 L-형 Ena의 존재를 보였으나, 통계 분석은 ena1B 및 ena1C 돌연변이체에서 길이의 약간 증가를 갖는 L-형 Ena를 배제하지 않는다 (길이 p=0.003 및 <0.0001, resp.) (도 5B). 따라서, Ena1A, Ena1B 및 Ena1C는 L-형 Ena 조립이 아닌, 생체내 S-형 Ena 조립에 상호 요구된다. ena1A-ena1B 를 함유하는 저카피수 플라스미드 (pMAD-I-SceI)로 ena1B 돌연변이체의 보완은 S-형 Ena 발현을 복원하였다. 이들 서브유닛의 플라스미드-기반 발현은 이제 수 미크론에 도달하는, Ena 길이의 급격한 증가, 및 포자 당 S-형 Ena 개수의 평균 ∼2배 증가를 야기시켰다 (도 5A, B, 도 11D). 따라서, S-형 Ena의 개수 및 길이는 이용가능한 Ena1A 및 Ena1B 서브유닛의 농도에 의존적이다. 특히, Ena1A 및 Ena1B를 과발현하는 몇몇 내생포자는 포자외막이 결여된 것으로 보였거나 또는 포자외막 내부에 S-형 Ena의 포획을 보여주었다 (도 11C, D). 이것은 S-형 Ena가 포자 몸체로부터 발산되고, ena 발현 시기 또는 농도의 불균형이 내생포자 표면 구조의 오-조립 및/또는 오-국재화를 야기할 수 있다는 것을 입증한다. S-형 Ena와 대조적으로, WT 및 돌연변이체 내생포자의 정밀 조사는 L-형 Ena가 포자 몸체아 아닌 포자외막의 표면으로부터 발산된다는 것을 시사한다. L-형 Ena의 분자적 정체, 또는 각각 L-형 및 S-형 Ena에서 확인된 단일 또는 다수 말단 주름은 본 연구에서 확인할 수 없었다.

실시예 7. ena1A-C 유전자의 계통발생학적 분포.

비. 세레우스 s.l. 그룹 및 바실러스 속의 다른 관련 종 내에서 ena1A-C 의 존재를 조사하기 위해서, ena1A-C 의 상동체에 대한 쌍별 tBLASTn 검색은 닫힌 게놈이 결여된 종에 대한 스캐폴드를 첨가하여, 모든 이용가능한 닫힌, 엄선된 바실러스 spp. 게놈을 함유하는 데이터베이스에서 수행되었다 (n=735). 비. 세레우스 NVH 0075/95의 ena1AB 의 아미노산 시퀀싱 유사성 (>80%) 및 높은 커버리지 (>90%)를 갖는 상동체는 분석된 85종 비. 세레우스 균주 중 11종, 119종 비. 위에드만니이 (B. wiedmannii) 균주 중 13종, 14종 비. 시토톡시쿠스 (B. cytotoxicus) 균주 중 14종, 1종 비. 루타이 (B. luti) 균주 중 하나 (100%), 6종 비. 모빌리스 균주 중 3종, 33종 비. 미코이데스 (B. mycoides) 균주 중 3종, 1종 비. 트로픽스 (B. tropics) 균주 중 1종, 및 양쪽 비. 파란트라시스 (B. paranthracis) 균주를 포함한 48종 균주에서 발견되었다. 이들 균주 중에서, 오직 31종만이 비. 세레우스 NVH 0075/95의 Ena1C에 대해 높은 서열 동일성 및 커버리지를 갖는 상동체를 코딩하는 유전자를 보유하였다 (도 6). 모든 조사된 비. 시토톡시쿠스 게놈 (14/14)은 가상 Ena1A 및 Ena1B 단백질을 코딩하였지만, 오직 12/14는 Ena1C 오솔로그를 코딩하여, 비. 세레우스 NVH 0075-95의 Ena1C와 비교하여 오직 중간정도 아미노산 보존을 보였다 (평균 63.9% 아미노산 서열 동일성) (도 6, 도 11).

비. 세레우스 그룹 게놈에서 Ena1A-C 상동체 검색 시에, 가상 EnaA-C 단백질을 코딩하는 후보 오솔로그 유전자 클러스터가 발견되었다. 이들 3종 단백질은 비. 세레우스 NVH0075-95의 Ena1A, Ena1B 및 Ena1C과 각각, 평균 59.3±0.9%, 43.3±1.6% 및 53.9±2.2% 아미노산 서열 동일성을 갖고, 유전자 신테니를 공유하였다 (도 6B). 오솔로그 ena 유전자 클러스터는 ena2A-C 로 명명되었다. 비. 서브틸리스 (n=127) 및 비. 슈도미코이데스 (B. pseudomycoides) (n=8)를 제외하고, 분석된 모든 게놈 (n=735)은 ena1 (n=48) 또는 ena2 (n=476) 유전자 클러스터를 보유하였다. Ena1A-C 또는 ena2A-C 는 동시에 존재하지 않았고 키메라 ena1A-C/2A-C 클러스터는 분석된 게놈 중에서 발굴되지 않았다 (도 6). 단백질 트리에서 Ena1A-C 및 Ena2A-C 간에 주요 분할이외에도, 별개 서브-클러스터가 Ena1A, Ena1B 및, 특히 Ena1C 서열 중에서 확인되었다 (도 11). Ena1A 서열은 2개 주요 서브-클러스터로 분리되었다: 하나는 대부분의 비. 시토톡시쿠스 균주에 존재하고, 다른 것은 비. 위에드만니이 (B. wiedmanni) 및 비. 세레우스 균주에서 발견되었 (도 11A). EnaB 단백질에 대해 더 많은 변이가 분명하였다: Ena1B 서열은 2개 클러스터를 형성하였다; 1개는 비. 세레우스 및 비. 위에드만니이 단리주를 함유하였고, 나머지는 비. 시토톡시쿠스였다 (도 11). 또한, Ena2B 단백질의 별개 서브-클러스터가 확인되었는데 (도 11), 각각 Ena2B 및 Ena1B의 나머지와 대략 ∼78% 및 ∼48% 서열 동일성을 공유하는, 비. 미코이데스, 비. 세레우스, 비. 투린지엔시스, 비. 파시피쿠스 (B. pacificus), 및 비. 위에드만니이의 단리주를 함유한다. EnaC는 3개 단백질 중 가장 가변적이었다: Ena1C는 비. 위에드만니이, 비. 세레우스, 비. 안트라시스, 비. 파라안트라시스, 비. 모필리스, 비. 트로피쿠스, 및 비. 루타이의 단리주를 함유하는 단계통 분기군을 형성하였지만, Ena2AB 를 보유하는 종 및 균주를 비롯하여 Ena1AB를 보유하는 균주의 서브세트에 상당한 서열 변이를 가졌다.

ena2A-C 상동체 또는 오솔로그는 ena1A-C 유전자에 비해서 비. 세레우스 그룹 균주에서 훨씬 더 일반적이었고, 모든 조사된 비. 토이오넨시스 (B. toyonensis) (n=204), 비. 알부스 (B. albus) (n=1), 비. 봄비셉티쿠스 (B. bombysepticus) (n=1), 비. 니트라티레두센스 (B. nitratireducens) (n=6), 비. 투린지엔시스 (n=50) 게놈 및 비. 세레우스 (87%, 74/85), 비. 위에드만니이 (105/119, 89.3%), 비. 트로피쿠스 (71%, 5/7) 및 비. 미코이데스 (91%, 30/33)의 대부분은 Ena2A-C 단백질 형태를 가졌다 (도 6). ena 오솔로그는 비. 서브틸리스 (n=127) 또는 비. 슈도미코이데스 (n=8) 게놈에서 또는 3종의 오분류된 스트렙토코쿠스 뉴모니아에 (Streptococcus pneumoniae) 게놈 (GCA_001161325, GCA_001170885, GCA_001338635) 및 하나의 오분류된 비. 서브틸리스 게놈 (GCA_004328845)을 제외하고, 비. 세레우스 그룹 밖의 임의의 다른 게놈에서 발견되었다. 이들 게놈 및 비. 서브틸리스는 분류학적 분류를 위한 3개 상이한 방법으로 재분석했을 때 비. 세레우스로 재분류되었다 (Masthree, 7-lociMLST and Kraken, see Methods). 소수의 파에니바실러스 (Peanibacillus) spp. 균주의 게놈은 Ena1A-C와 낮은 수준의 아미노산 서열 유사성을 갖는 가상 단백질을 코딩하는 유전자를 가졌고, Ena1A 및 B와 일부 유사성을 갖는 가상 단백질을 코딩하는 유전자는 또한 코넬라 아비에티스 (Cohnella abietis) 균주 (GCF_004295585.1)의 게놈에서 발견되었다. 바실러스 속 외부에서 이들 히트는 아에로미크로비움 (Anaeromicrobium), 코넬라 (Cochnella), 및 바실랄레스 (Bacillales) 목에서 발견되는, 이들 유전자의 DUF3992 도메인에 있었다.

소수의 게놈은 그들 종의 다른 균주와 비교하여 ena-유전자 클러스터에 편차를 가졌다. 3종 비. 미코이데스 균주 중 2종 (GCF_007673655 및 GCF_007677835.1)은 ena1A-B 오페론 하류에 ena1C 대립유전자가 결여되었다 (데이터 미도시). 그러나, 비. 세레우스 NVH 0075/95의 Ena1C와 50% 동일성을 갖는 가상 단백질을 코딩하는 잠재적인 ena1c 오솔로그가 그들 게놈의 다른 곳에서 발견되었다. 한 게놈은 비. 미코이데스의 이들 균주와 함께 그룹화된 비. 세레우스 (균주 Rock3-44 조립: GCA_000161255.1)로서 주석이 달렸고 (도 6) 그들 ena1A-C 분포 패턴을 공유하였다. 비. 투린지엔시스는 일반적으로 ena2 유전자를 보유하지만, 게놈은 모든 ena 유전자가 결여된 비. 투린지엔시스 (균주 LM1212, GCF_003546665)로서 주석이 달렸다. 이러한 균주는 역시 양쪽 ena 유전자 클러스터가 결여된, 비. 트로피쿠스의 기준 균주와 거의 동일하였다.

S-형 섬유에 대한 우리의 계통발생학적 분석은 미지 기능 도메인 DUF3992를 포괄하는 단백질의 보존된 패밀리에 속하는 Ena 서브유닛을 밝혀준다.

실시예 8. 생체내에서 태그-무함유 Ena1A 또는 Ena1B S-형 섬유의 재조합 생산.

Ena1A (WP_000742049.1) 및 Ena1B (WP_000526007.1)의 야생형 서열은 이. 콜라이에 대해 코돈 최적화되었고, Twist Bioscience에서 합성 유전자로서 주문되었고, pET28a 벡터 (NcoI-XhoI)에 추가로 서브클로닝되었다. 수득된 플라스미드 (pET28a_Ena1A; pET28a_Ena1B)는 C43(DE3)의 적격 세포를 형질전환시키는데 사용되었다. 단일 콜로니를 사용하여 밤샘 (ON) LB 배양을 시작하였다. 10 mL ON 배양을 사용해 1 L LB, 25 mg/mL 카나마이신에 37℃에서 접종하였다. 재조합 발현은 1 mM IPTG의 첨가를 통해 0.8의 OD₆₀₀ 에서 유도되었고, 배양은 ON 인큐베이션을 위해 방치하였다. 세포는 4000 g에서 15분 원심분리를 통해 펠렛화하였다. 세포 펠렛은 1xPBS, 1 mg/mL 리소자임, 1 mM AEBSF, 50 μM 류펩틴, 1 mM EDTA에 재현탁하였고, 강한 교반 하에 실온에서 30분 동안 인큐베이션한 다음에 DNAse 및 MgCl₂ 를 각각 10 μg/mL 및 10 mM의 최종 농도로 첨가하였으며, 추가 30분 동안 인큐베이션하였다. 세포 찌꺼기는 원심분리 (15분, 4000g)를 통해 펠렛화하였다. 상청액을 조심스럽게 제거하였고, 50분 동안 20.000 rpm에서 원심분리하였다. 상청액을 버리고 펠렛을 다시 현탁액 (1xPBS)에 넣었다. 최종 현탁액을 5배로 miliQ에 희석하였고, Formvar/Carbon 그리드 (400 메쉬, Cu; Electron Microscopy Sciences)에 침착시키고, 2% (w/v) 우라닐 아세테이트를 사용해 염색하였다. TEM 분석은 10-11 nm의 직경과 마이크로미터 길이 섬유의 존재를 밝혀주었다. 박스의 섬유 절편의 2D 분류는 도 12에 도시된 바와 같이 관찰된 섬유의 S-형 속성을 확인하였다.

실시예 9. Ena 단백질의 생물학적 역할: 전망

Enas의 기능에 대한 지식없이, 우리는 그들 생물학적 역할에 대해서만 추측할 수 있다. 비. 세레우스 그룹 종의 Ena는 그람-음성 및 그람-양성 영양 박테리아에서 살아있는 표면 (다른 박테리아 포함) 및 비-생존 표면에 부착, 연축 운동, 생물막 형성, DNA 흡수 (자연 능력) 및 교환 (접합), 외단백질의 분비, 전자 전달 (Geobacter) 및 박테리오파지 감수성에서 역할을 하는, 선모를 닮았다 (Lukaszczyk et al., 2019; Proft and Baker, 2009). 일부 박테리아는 상이한 기능을 수행하는 다수 유형의 선모를 발현한다. 선모-섬유의 가장 일반적인 기능은 금속, 유리, 플라스틱 암석부터 식물, 동물 또는 인간의 조직에 이르는 광범위 범위의 표면에 대한 부착이다. 병원성 박테리아에서, 선모는 종종 숙주 조직의 집락화에서 중추적인 역할을 하고 중요한 병독성 결정자로서 기능한다. 유사하게, 씨. 스포로게네스 내생포자의 표면 상에서 발현되는 부속물은 배양된 섬유아세포에 대한 그들 부착을 촉진하는 것으로 확인되었다 (Panessa-Warren et al., 2007). 그러나, Ena는 그들이 내생포자의 대사적으로 휴지기 상태에서 발생되지 않을 것 같은 에너지 요구 과정이므로 DNA 또는 단백질의 흡수/수송 또는 활동적 운동성에 관여하지 않는 듯하다. Ena는 강력한 병원성 잠재성을 같는 밀접하게 관련된 바실러스 종의 그룹인, 비. 세레우스 그룹에 속하는 균주의 포장 중에서 널리 퍼져있는 특성으로 보인다 (도 6) (Ehling-Schulz et al., 2019). 대부분의 비. 세레우스 그룹 종 경우에, 내생포자에 의한 섭취, 흡입 또는 상처 오염은 감염 및 질환 발병의 주요 경로를 형성한다. Ena는 많은 세포 표면을 덮고있어서 그들은 내생포자 환경과 중요한 접촉 영역을 형성할 것으로 합리적으로 예상할 수 있고, 비. 세레우스 종의 전파 및 병독성에서 역할을 할 것으로 추측할 수 있다. 우리의 계통발생학적 분석은 병원성 바실리에서 Ena의 광범위한 존재, 및 내생포자 연구를 위한 주요 모델 시스템으로 기능하는 비-병원성 종 예컨대 바실러스 서브틸리스, 토양-거주 종 및 위장 공생균에서 현저한 부재를 확인하였다. Ankolekar 등은 비. 세레우스의 모든 47종의 식품 단리주가 부속물을 갖는 내생포자를 생산하였다는 것을 보여주었다 (Ankolekar and Labbe, 2010). 부속물은 또한 비. 세레우스와 밀접하게 관련되고, 이의 살충 활성으로 가장 잘 알려져 있는, 바실러스 투린지엔시스의 12종의 식품-매개, 장독소원성 단리주 중 10종의 포자에서 발견되었다 (Ankolekar and Labbe, 2010).

생체외 섬유의 cryo-EM 이미지는 S-형 및 L-형 Ena의 말단에서 2-3 nm 너비 섬유 (주름부)을 보여주었다. 주름부는 엔테로박테리아세아에 (Enterobacteriaceae) 과의 많은 그람-음성 박테리아에서 확인되는 1형 및 P-선무의 첨단 피브릴라와 닮았다 (Proft and Baker, 2009). 그람-음성 선모 필라멘트에서, 첨단 피브릴라는 점막 표면 상의 수용체와 상호작용을 증강시키기 위해 유연한 위치에 접착 단백질을 제공한다 (Mulvey et al., 1998). 주름부 유사한 필라멘트가 시험관내에서 조립된 섬유에서 관찰되지 않아서, 그들 형성이 Ena1A 또는 Ena1B 서브유닛 이외의 추가 성분을 요구한다는 것을 시사한다.

우리는 병원성 바실리에서 널리퍼진 신규 클래스의 포자-회합 부속물 또는 선모의 분자적 확인을 제시한다. 추가의 분자적 및 감염 연구는 포자-매개 병원성 바실리의 병독성에서 Ena가 역할을 하는지 여부 및 역할을 하는 방법을 결정하는 것을 필요로 할 것이다. 이러한 작업에서 제시하는 Ena의 구조적 측면 및 유전적 정체를 밝히데서의 진보는 이제 그들 생물학적 역할(들)을 알아내고, 상이한 바실러스 종 중에서 Ena 이질성의 기초에 대한 통찰력을 얻기 위해 시험관내 및 생체내 분자 연구를 가능하게 한다.

실시예 10. Ena 박막의 제조

세포내에서 재조합적으로 생산된 S-섬유, Ena1B의 단리 후에, Ena1B S-형 섬유의 현탁액은 100 mg.mL^-1 또는 25 mg.mL^-1의 최종 농도로 miliQ에 EnA1B 스톡 용액을 희석시켜서 제조되었다. 50 μl의 이 Ena1B 현탁액을 18 mm 직경의 실리콘처리된 커버 슬립 상에 드롭-캐스팅하였고, 60℃에서 1시간 동안 인큐베이션하였다. 최종 박막은 그대로 사용하거나 (도 21a) 또는 이미지화를 위해서 커버 슬립으로부터 이탈시켰다 (도 21b-c). Ena1B S-형 용액의 양쪽 출발 농도는 각각 대략 21 μm (도 21c) 및 3.7 μm의 두께를 갖는 독립형, 반투명 박막을 생성시켰다.

실시예 11. 연질 및 강화 Ena 히드로겔의 제조

ENA 히드로겔 제조 - 50 μl의 100 mg.mL^-1 Ena1B S-형 섬유 현탁액은 실리콘처리된 커버슬립 상에 파이펫팅하였고 22℃에서 1시간 동안 공기 건조하였다 (도 22a). 다으?瀏?, 50 μl miliQ를 건조된 필름 상에 파이펫팅하고 5분 동안 22℃에서 재수화되도록 방치하여서 (도 22b) 박막을 눈에 띄게 재팽윤시켰다. 다음으로, 과량의 액체는 미세파이펫을 사용해 제거하여 도 22d에 예시된 바와 같은 독립형인, 최종 Ena1B 히드로겔 (도 22c)을 드러냈다.

강화 ENA 히드로겔 제조 - 100 mg.mL^-1 Ena1B S-형 섬유 현탁액의 20 μl 액적을 4 M MgCl₂, 5 M NaCl 또는 100% (v/v) 무수 에탄올에 점적하고 1시간 동안 22℃에서 인큐베이션하였다. 고점도의 ENA 액적은 선택된 용액과 섬유 현탁액의 혼합을 방지하여, 인큐베이션 기간 동안 액적 기하구조를 효과적으로 안정화시켰다. 염 또는 에탄올 용액의 높은 수분 활성은 ENA 액적의 점진적 탈수를 야기하여서 조밀한 ENA 히드로겔의 형성을 초래하였다. ENA 히드로겔 비드는 염 또는 에탄올의 제거를 위해서 1 mL의 miliQ로 3회 옮겼고, 공기 건조를 위해서 24시간 동안 22℃에 방치하였다 (도 23). MgCl₂ 또는 NaCl에서 인큐베이션으로 생성된 ENA 히드로겔 비드는 불투명하였지만, 에탄올 인큐베이션은 안정한, 반투명 구조를 야기하였다.

실시예 12. 재조합적으로 생산된 Ena3A는 L-형 섬유로 자가-조립된다.

비. 세레우스 NM 0095-75로부터 유래된 사중 Ena-녹아웃 균주 (Dena1A-1B-1C-ena3A)로부터의 성숙한 포자는 임의의 내생포자 부속물의 완전한 부재를 밝혀주었지만 (도 25c), Ena3A 서열 (SEQ ID NO:49)을 포함하는 pENA3A로 이 돌연변이체를 형질전환시킨 경우에, L-형 섬유의 표현형 구제가 포자 표면에서 일어났다 (도 25d-e).

따라서, 바실러스 내생포자 상에서 L-형 Ena 섬유를 형성시키기에 필수적이고 충분한, Ena 단백질 패밀리의 추가 구성원으로서 Ena3A의 확인을 기반으로, blast 검색 및 계통발생학적 분석을 수행하여 바실러스 세레우스 Ena3A의 후보 오솔로그 (SEQ ID NO:49로 표시)를 제공하였다. 확인된 상동체 (SEQ ID NO:50-80)의 다중 서열 정렬은 도 19에 도시되고,DUF3992-도메인을 포함하는 모든 서열외에도, 보존된 N-말단 연결부 영역이 역시 Ena3에 존재한다는 것을 입증하였다.

대표적인 패밀리 구성원으로서, SEQ ID NO:49로 표시되는 Ena3A 단백질은 재조합적으로 발현되었고, 또한 본 명세서에서 'recEna3A'로 불리며, 18.4도의 나선 비틀림, 44.9Å의 상승, 및 75Å의 직경을 갖는, 나선형, 7-출발 사다리-유사 (L-형) 섬유를 생산하는 것으로 확인되었다. L-형 섬유는 7개 N-말단 연결부를 통해서 공유적으로 연결된, 수직으로 적층된 Ena3A 7량체 고리로 구축된다. 도 24에 도시된 바와 같이, 각 서브유닛의 BIDG 시트의 가닥 G는 각 7량체 고리 단위 내에 인접한 서브유닛의 CHEF β-시트의 가닥 C에 의해 확대된다. 서브유닛은 서브유닛 i의 Cys21 및 서브유닛 i+1의 Cys81 간, 및 서브유닛 i의 Cys13 및 서브유닛 i+1의 Cys14 간에 디술피드 결합을 통해 각 고리 내에서 공유적으로 가교 결합된다. 고리간 가교결합은 이웃하는 고리에서 서브유닛 j의 Cys20와 위치 Cys8 (i)에서 디술피드 결합을 형성하는 N-말단 연결부 (Ntc)를 통해서 확립된다.

짧은 Ena3 L-형 섬유의 시험관내 재조합 생산은 입체적으로 차단된 Ena3A를 발현하고, Ena3A 다량체를 정제하고 나서, TEV 프로테아제와 공-인큐베이션 후 L-섬유의 조립을 통해서 수득되었다 (도 25a; Ena1B에 대해 기술된 방법 사용). 대안적으로, 이. 콜라에서 입체 블록없는 Ena3A의 재조합 발현은 세포질에서 긴 L-섬유의 '세포내' (본 명세서에서 또한 '생체내'라고도 함) 조립을 일으켰고, 이어서 세포 배양으로부터 섬유를 단리하였다 (도 25b; 본 명세서에 기술된 방법 사용).

따라서, 바실러스 세레우스 균주 ATCC_10987의 Ena3A L-형 섬유 서브유닛 (WP_017562367.1; SEQ ID NO:49)의 CryoEM 구조는 섬유에서 측면 및 종방향 접촉을 기록하기 위해 단지 3개 서브유닛을 보여주는 도 26에 도시된 cryo-EM 모델 (좌측 패널)을 제공한다. Ena 서브유닛은 BIDG - CHEF 토폴로지를 갖는 8-가닥 β-샌드위치 폴드를 비롯하여, Ntc라고 하고, 섬유에서 종방향 공유 접촉을 담당하는 N-말단 연장부 펩티드로 정의된다(도 19). 도 19에 제시된 바와 같은 상동체와 이러한 폴드를 구조적으로 비교하기 위해서, 선택된 Ena3A 상동체 WP_049681018.1 (SEQ ID NO: 60) 및 WP_100527630.1 (SEQ ID NO:75)에 대해 AlphaFold v2.0을 사용해 예측된 구조를 일치시켰다. 각 구조 경우에, 각 구조의 Cα 원자 i 및 기준 구조 (Ena3A의 cryoEM 모델: WP_017562367.1, SEQ ID NO: 49)의 상응하는 Cα 원자 간 원자 위치의 평균 제곱근 편차 (RMSD) 뿐만 아니라, 폴드 유사성 점수, 즉, Dali Z-점수를 분석하였다. n/10-4 (여기서, n은 서열 길이임)보다 높은 Z-점수는 매우 유의한 폴드 유사성에 상응하는 것으로 간주된다 (10.1093/bioinformatics/btn507). n=116 경우, 이것은 Z=7.6에 상응한다. 벤치마크로서, 우리는 또한 우리의 기준 구조 Ena3A (WP_017562367.1)의 AlphaFold 모델을 제공하여서, 실험적 cryoEM 구조 및 AlphaFold 모델 간 우수한 일치를 입증하였다 (RMSD=1.05; Z=12.1). 이들 예측은 우리 기준 서열에 대해서 61% 정도로 낮은 서열 동일성을 갖는 DUF3992 서열 (WP_100527630.1)이 Ntc가 존재하는 동일한 ENA-폴드를 채택할 수 있다는 것을 보여준다.

따라서, Ena3A 서브유닛은 HMM 프로파일 검색을 기반으로 분명하게 확인될 수 있어서, DUF3992 분류와, 이어서 신규 구조 예측 및 여기서 Ena3A cryoEM 구조와 비교가 후속된다. 자가-조립 Ena 서브유닛은 6.5 이상의 Ena3A (SEQ ID NO: 49)에 대한 Dali Z-점수로 8-가닥 Ena 베타-샌트위치 폴드를 가지게되고, Ena 섬유에서 디술피드-매개된 가교 결합을 위해 Z-N-C(C)-M-C-X 모티프를 갖는 N-말단 연결부 펩티드를 합유하게 되며, 여기서 Z는 Leu, Ile, Val 또는 Phe이고, N은 1 또는 2 잔기이고, C는 Cys이고, M은 10 내지 12 아미노산이고, X는 임의 아미노산이다. 후보 Ena 서브유닛의 자가 조립 및 섬유 형성은 본 명세서의 재료 및 방법에 기술된 바와 같이, 이. 콜라이의 세포질에서 재조합 발현 및 단리된 섬유 물질의 음성 염색 투과 전자 가시화에 의해 수행된다.

실시예 13. 시험관내 재조합 생산된 Ena2A는 S-형 섬유로 자가-조립된다.

Ena1B, 및 Ena3A 이외에도, 시험관내 재조합 제조 방법이 그들의 전형적인 섬유 형성을 위해 모든 Ena에 일반적으로 적용가능하다는 것을 확인하기 위해서, N-말단 6X His-TEV 차단제를 갖는 입체적으로 차단된 Ena2A (SEQ ID NO: 145)의 발현, Ena2A 다량체의 정제에 이어서, TEV 프로테아제와 공-인큐베이션 후 S-섬유의 조립으로 수득되는 바와 같은 시험관내 조립 Ena2A S-형 섬유를 도 27에 도시한다 (도 27; Ena1B에 대해 기술된 바와 같은 방법 사용).

유사하게, Ena1B 및 Ena3A에 대해 도시된 바와 같이 추가 Ena 패밀리 구성원에 대해서도 재조합 Ena 섬유의 세포내 또는 생체내 이. 콜라이 생산이 적용가능하다는 확인으로서, 이. 콜라이에서 입체 블록없는 Ena2A의 재조합 발현은 세포질에서 S-섬유의 '세포내' 조립에 이어서, 세포 배양으로부터 섬유의 단리를 야기하였다 (도 28; 본 명세서에 기술된 바와 같은 방법 사용).

실시예 14. Ena2C는 시험관내에서 다량체 디스크를 형성한다.

Ena1C에 대해 실시예 4에 표시한 바와 같이, 나선 다량체보다는 구조의 다량체 디스크-형이 재조합 EnaC 단백질을 사용해 시험관내에서 형성된다. 유사하게, Ena2C의 관점에서 이를 더욱 뒷받침하기 위해서, 9량체 디스크로서, 다량체를 구성하는 재조합 Ena2C는 이. 콜라이 Bl21 C43에서 N-말단 6X His-TEV 차단제로 입체적으로 차단된 Ena2C (SEQ ID NO:146으로 표시)를 발현하여 생성되었다.

다량체의 단리 및 TEV 프로테아제를 사용한 절단에 의한 차단제의 제거 (본 명세서에 기술된 방법에서 제공)는 또한 L-형-유사 필라멘트를 생성시켰지만, 필라멘트는 매우 유연하고 닫힌 루프로 구부러졌다(도 29).

실시예 15. The N-말단 연결부는 섬유로 다량체의 디술피드 가교 결합에 필수적이다.

recEna1B S-형 섬유로부터 원자 모델은 서브유닛 i의 N-말단 연결부 (Ntc)가 디술피드 가교 결합을 통해서 서브유닛 i-9 및 i-10에 연결된다는 것을 보여준다. 측면, 비공유 접촉이 2개 이웃하는 서브유닛 (i-1,i) 사이에 존재하지만, 이들 상호작용은 강건한 섬유를 형성시키기에 충분한 것으로 기대되지 않는다. 그 가설을 시험하기 위해서, recEna1BΔNtc (SEQ ID NO:8의 WT Ena1B의 잔기 2-15의 결실)를 클로닝하여 이. 콜라이에서 발현시켰다. 세포는 밤샘 유도 후에 수확하였고 TEM 그리드에 직접 침작시키고 ns-TEM을 사용해 분석하였다 (도 30). 짧은 S-형 Ena 섬유가 세포외 배지에서 발견되었지만, 파열 (도 30b) 및 균열점 (도 30c-e)으로 분류되는, 거짓 결함을 나타냈다. 파열점은 곧은 섬유 절편을 따라서 발생되고, 유사하게 샘플 침착 및 블롯팅 단계 동안 용질 흐름으로부터 발생되는 전단력을 따르는 듯하다. 이러한 빈번한 파열은 WT recEna1B 섬유 경우에 관찰되지 않았고, recEna1BΔNtc 섬유의 감소된 인장 강도를 의미한다. 균열점은 국소 섬유 절편의 임계 굴곡률이 초과할 때 구부러진 섬유 영역에서 관찰되어서, 2개의 파괴된 절편 간에 예리한 각도의 α^crit 를 생성시켰다. 이러한 균열점은 WT recEna1B 섬유와 비교하여 recEna1BΔNtc 섬유에 대해 감소된 섬유 가요성을 시사한다. 이들 데이터는 N-말단 연결부가 서브유닛간 디술피드 가교를 형성하는데 필수적이고, 그러므로 S-형 섬유에 우수한 인장 강도 및 가요성을 부여한다는 사실을 뒷받침한다.

실시예 16. 강성 S-형 섬유의 세포내 조립은 6 아미노산만큼 작은 크기의 N-말단 입체 블록을 함유하는 recEna1B 발현에 의해 방해받는다.

천연 Ena 서열에 비해 15개 추가 아미노산을 함유하는 본 명세서에 예시된 재조합 발현 실험에 사용되는, 본래 입체 블록 구성체가 주어지면 (M-His6-SSG-TEV, MHHHHHHSSGENLYFQ-Ena1B, 추가 아미노산은 굵은체로 표시), 우리는 N-말단에 오직 6 (M-TEV-Ena1B, M-ENLYFQ-Ena1B, 여기서 Ena1B는 N-말단 M없는 SEQ ID NO:8임) 또는 9 (M-His6-SSG-Ena1B)의 추가 아미노산 잔기의 더 작은 입체 블록을 함유하는 구성체를 만들었다 (도 31). 양쪽 구성체의 재조합 발현은 세포내 섬유 형성을 허용하지만, 섬유 수율은 15aa의 입체 블록을 갖는 Ena1B의 발현과 비교하여 강력하게 감소된다. 섬유는 WT recEna1B S-형 섬유 (11-11.5 nm)와 비교하여 ns-TEM에서 더 작은 직경 (9-9.5 nm)을 가지고, 덜 두드러진 구조적 특성을 나타낸다. 원자 cryoEM 모델로부터 측정된 WT Ena1B 섬유의 직경은 9.8-9.9 nm인 것을 유의한다. 따라서, ns-TEM 이미지로부터 도출된 직경은 섬유를 둘러싼 우라닐 염색 할로로 인해 '팽창'된다. 우리는 6 내지 9 아미노산 범위의 입체 블록은 이들 입체 블록이 세포내에서 섬유 형성을 전체적으로 차단하지 않으므로 시험관내 또는 생체내 섬유 조립에 덜 최적이고, 천연 S-형 섬유를 산출하지 않고, 따라서 섬유로 자가-조립되는 Ena1B의 능력을 저하시킨다고 결론내렸다.

실시예 17. 조작된 Ena1B 단백질 구성체를 적용하는 S-형 섬유 조립.

구성체는 BamHI 부위가 측접된, Ena1B의 BC, DE, EF 및 HI 루프 영역에 HA-태그 (YPYDVPDYA)가 도입되도록 디자인되었다. DE 루프 경우에, FLAG-태그 (DYKDDDDK)를 함유하는 제2 구성체가 역시 디자인되었다. FLAG-태그는 또한 BamHI 부위가 측접된다. 표적 루프 중 펩티드 태그 삽입의 분명한 예는 하기 정렬된 서열 및 세포내 효율적인 S-형 중합을 나타내는 도 32에 표시된다. 도 33에 도시된 바와 같은, 상이한 조작된 섬유의 웨스턴 블롯 분석은 섬유 표면 상에 선형 태그 (FLAG 및 HA)의 성공적인 제시를 비롯하여, 우수한 화학적 안정성을 입증한다 (참조: 표시된 다량체 및 섬유 밴드는 SDS-PAGE의 스태킹 겔에 유지되었고, 샘플은 15분 동안 1% SDS에서 끓였음).

조작된 Ena1B 삽입 변이체와 Ena1B 천연 서열 (SEQ ID NO:8)의 정렬:

더 나아가서, Ena 분할-변이체로 Ena 단백질의 조작은 또한 도 34에 도시된 바와 같이, S-형 Ena 섬유가 세포내에서 조립되도록 허용하였다. 분할 변이체는 각각 이의 BC 루프에서, Ala30에서 분할 (도 15), 또는 대안적으로 이의 HI 루프에서, Ala100에서 분할되는 Ena1B 분할의 N-말단 및 C-말단 부분을 코딩하는 구성체를 제공하여 구축되었다. 분할 BC 구성체는 Ala30에서 중지 코돈에 이어서, Ena1B의 세포내 발현을 위해 초기에 사용된 구성체 (즉, N 말단 6X His 차단제가 결여된 pet28a::Ena1B)에서 잔기 31 앞에 여분의 리보솜 결합 부위 (RBS) 및 새로운 ATG 출발 코돈을 클로닝하여 생성되었다. 분할 HI 구성체는 Ala100에서 중지 코돈에 이어서, Ena1B의 세포내 발현에 초기에 사용된 구성체 (즉, N 말단 6X His 차단제 결여된 pet28a::Ena1B)에서 전자의 앞에 여분 리보솜 결합 부위 (RBS) 및 새로운 ATG 추발 코돈을 클로닝하여 생성되었다.

따라서, Ena 단백질 서브유닛은 분할-단백질로서 재조합 발현을 위해 그들을 제공하여 조작된 Ena 서브유닛으로서 사용될 수 있고, 적어도 2개 폴리펩티드로 분할은 여기서 여전히 공-발현시 폴드 보완을 겪을 수 있고, 후속하여 Ena S-형 섬유로 자가-조립될 수 있다는 것을 보여준다.

실시예 18. 자성 비드 상에서 Ena1B S-형 섬유의 에피택셜 성장.

단리된 재조합 생산된 6xHis_TEV_Ena1B 다량체는 계속 진탕하면서 RT에서 3시간 동안 1xPBS 중 100 nm 말레이미드 Super Mag 자성 비드 (Raybiotech)와 공-인큐베이션시키고, 임의의 비결합된, 입체적으로 차단된 Ena1B 다량체를 제거하기 위해서 1xPBS로 3회 세척을 수행하였다. 다음으로, Ena1B 기능화된 자성 비드는 연속 진팅하면서 RT에서 1시간 동안 1xPBS 중 TEV-프로테아제 및 rec_6xHis_TEV_Ena1B 용액과 공-인큐베이션하였고, 임의의 미결합된 rec_6xHis_TEV_Ena1B 및 TEV-프로테아제를 제거하기 위해서 1xPBS로 3회 세척하였다. 다음으로, 3 μl이 기능화된 비드 현탁액을 TEM 그리드 상에 침착시키고 nsTEM 분석을 수행하여서, 자성 비드의 표면에 속박된 짧은 S-형 Ena1B 섬유의 존재를 밝혔다 (도 35의 우측 도면 패널에서 확대도 참조).

실시예 19. S-형 Ena 섬유에 의한 비-공유 표면 기능화.

재조합 생산된 Ena1B S-형 섬유는 100 mM Tris pH 7.0 중에 RT에서 1시간 동안 바이오틴-dPEG11-MAL (Sigma-Aldrich)을 사용해 바이오틴화되었고, 임의의 미결합된 바이오틴-dPEG11-MAL을 제거하기 위해서 miliQ 물로 2회 세척되었다. 다음으로, 바이오틴화된 Ena1B S-형 섬유를 스트렙타비딘-코팅된 금 비드 (1.25 μm 직경)와 공-인큐베이션시켰고, TEM 그리드 상에 침착시키고 nsTEM 분석을 수행하였다. 기록된 현미경 사진은 S-형 섬유에 의한 금 비드의 성공적인 기능화, 즉 비드 표면 상에 섬유의 속발을 입증하였다 (도 36). 바이오틴-dPEG11-MAL 변형은 Ena 섬유 극부에서 접근가능한 비결합된 시스테인에 대한 것이어서, 표면 속박은 특별히 섬유 말단을 통해서 발생된다.

실시예 20. 부위-지정 돌연변이유발을 통해 측면 강화된 Ena 네트워크.

Ena1B S-형 또는 Ena3A L-형 섬유의 표면 상에 용매 노출된 트레오닌 잔기는 시스테인으로 치환되어서 섬유간 디술피드 결합의 형성을 통한 공유, 측면, 앵커린 점으로서 제공되었다. 각각의 재조합 생산된 단백질 Ena1B T31C, Ena3A T40C 및 Ena3A T69C는 이. 콜라이 세포질에서 발현되었고 충분히 자가-조립되었다. Ena 섬유의 추출은 S-S 형성을 촉진하도록 산화 조건 하에서 수행되었다. 후속하여 수득된 섬유 분획의 nsTEM 분석은 Ena3A 점 돌연변이체로서 Ena1B 모두에 대해 매우 얽혀진 Ena 섬유 네트워크의 존재를 밝혀주었다 (도 37b,c,e,f). Ena1B T31C 섬유는 다양한 직경의 보다 큰 다발로서 존재한다 (도 37b). 단일 다발의 고배율 이미지화는 다발 축을 따라서 병렬 방식으로 배열되는 개별 S-섬유를 해결하여서, 아마도 더 높은 인장 강도를 초래한다. 이러한 계측 규모는 이웃하는 Ena 1B T31C S-형 섬유 간에 지퍼-유사 S-S 조립 기전을 시사한다. 반대로, Ena3A T40C 또는 T69C L-형 섬유 단리물은 무작위로 배향된 L-형 섬유로 구성된다. 이러한 방식으로, Ena 섬유의 측면 가교 결합은 강화된 Ena 로프 또는 다발, 히드로겔 및 Ena 박막의 형성을 야기할 수 있다 (도 37).

실시예 21. 박테리아 자가-조립 Ena 단백질 확인.

본 명세서에서 제시하는 관찰 및 분석을 기반으로, Ena 단백질은 박테리아 DUF3992 단백질에 속하고, N-말단 보존된 Cys-함유 모티프를 함유하는, 선모-형성 단백질 서브유닛의 신규한 박테리아 패밀리로서 확인된다. 먼저, 박테리아 Ena 단백질 패밀리 구성원의 확인은 표 1에 표시된 바와 같이 PFAM13157의 HMM 프로파일 (또는 PFAM 데이터베이스: https://pfam.xfam.org/family/PF13157#tabview=tab4)에 대한 준수에 대해 분석할 수 있고, Ena1/2 A & B 단백질 경우 보존된 모티프 ZX_nCCX_mC (여기서, Z는 Leu, Ile, Val, 또는 Phe이고, n은 1 또는 2이고, m은 10 내지 12임) (도 8B 참조)에 상응하거나, Ena3 단백질 경우 보존된 모티프 ZX_nC(C)X_mC (도 26 참조)에 상응하는, 본 명세서에 제시된 바와 같은, 적어도 하나의 보존된 Cys를 포함하는 N-말단 연결부 (Ntc)를 함유하는, DUF3992 도메인을 함유하는 아미노산 서열을 기반으로 한다.

두번째로, Ena 단백질로서 분류하려는 단백질에 대한 구조적 요건은 단순히, 당분야에 공지된 바와 같고, 본 명세서에서 제시되는 바와 같은 Ena1B cryo-EM 기준 구조와 비교되고, 항목 PDB7A02 (Version 1.0 - 6/8/20에 항목 제출-24/8/20 공개)로 단백질 데이터베이스에 기탁되는, 모델링 도구에 공급된 이의 아미노산을 기반으로 할 수 있는 이의 (예측된) 폴드로부터 명확하게 파생가능하고 예측된 폴드의, 폴드 유사성 점수, 즉 Dali Z 점수는 6.5 이상으로서, Z-점수가 (n/10) -4 보다 높은 Z-점수 (여기서, n은 아미노산 개수로서 서열 길이임)는, 고도로 유의한 폴드 유사성으로 간주되기 때문이다 (Holm et al., 2008; Vol. 24 no. 23 p.2780-2781; doi:10.1093/bioinformatics/btn507). 대안적으로, 본 명세서에서 제시되는 Ena3 cryo EM 기준 구조는 도 26에 도시된 바와 같이, 폴드 유사성을 결정하는데 사용될 수 있다.

단백질 폴드의 모델링은 신규 예측 도구를 통해 수행될 수 있는데, 예를 들어, 제한없이 현재 입수가능한 소스 예컨대 Robetta (https://robetta.bakerlab.org/), 또는 AlphaFold v2.0 (Jumper, et al.　2021, Nature; doi.org/10.1038/s41586-021-03819-2)로 수행될 수 있거나, 또는 예를 들어, 제한없이 예를 들어 SWISS-MODEL (https://academic.oup.com/nar/article/46/W1/W296/5000024), Phyre2 (https://www.nature.com/articles/nprot.2015.053), RaptorX (https://www.nature.com/articles/nprot.2012.085) 등의 입수가능한 도구로 수행될 수 있는 상동성 기반 단백질 모델링에 의해 수행될 수 있다.

예를 들어, DUF3992 분류 및 N-말단 연결부의 존재를 특징으로 하는, 다수의 선택된 Ena 후보 오솔로그의 구조적 비교는 각 구조 (도 38에 도시)에 대해서, 기준 구조 (Ena1B - Uniprot: A0A1Y6A695의 cryoEM 모델; PDB7A02로서 기탁된 본 명세서의 좌표로 표시되거나 또는 표 2에 제공되는 바와 같은 SEQ ID NO:8에 상응)의 상응하는 Cα 및 각 구조의 Cα 원자 i 간 원자 위치의 평균 제곱근 편차 (RMSD)를 비롯하여, 폴드 유사성 점수, 즉, Dali Z-점수를 제공하여 수행되었다. (n/10) -4 보다 높은 Z-점수 (여기서, n은 아미노산 개수로서 서열 길이임)는 고도로 유의한 폴드 유사성에 상응하는 것으로 간주된다 (Holm et al., 2008; Vol. 24 no. 23 p.2780-2781; doi:10.1093/bioinformatics/btn507). 따라서, 예를 들어 n=117의 서열을 기반으로 하는 단백질 경우에, 이것은 Z = 7.6 이상에 상응하여 강력한 폴드 유사성을 제공한다. 서열 WP_098507345.1 및 WP_017562367.1 (www.ncbi.nlm.nih.gov/protein/)을 함유하는 DUF3992-도메인 경우에, 우리는 AlphaFold v2.0으로 예측된 추정 구조를 제공한다. 벤치마크로서, 또한 우리의 기준 구조 Ena1B의 AlphaFold 모델 (UniProt. A0A1Y6A695, SEQ ID NO:8)을 제공하여서, 실험적 cryoEM 구조 및 the AlphaFold 모델 (RMSD=0.605; Z=12.4) 간 우수한 일치를 입증한다. 이들 예측은 우리의 기준 서열 (Ena1B, SEQ ID NO:8)과 24.2% 정도로 낮은 서열 동일성을 갖는 박테리아 DUF3992 서열 (WP_041638338.1)이 Ntc 존재하는 동일한 Ena-폴드를 채택할 수 있다는 것을 보여준다. Ena2A (WP_001277540.1; SEQ ID NO:145; 24.2% 동일성) 경우에, 우리는 이것이 실제로 Ena 다량체 및 S-형 Ena 섬유를 형성한다는 것을 보여주었다. 따라서, Ena 서브유닛은 HMM 프로파일 검색 (표 1에 따름, DUF3992-도메인 함유 단백질의 HMM 매트릭스에 상응)과 이어서, 신규 구조 예측 및 여기서 개시된 Ena1B 및 Ena3A cryoEM 구조 (각각 도 38 및 26)와 비교를 기반으로 분명하게 확인될 수 있다. 자가-조립 Ena 서브유닛은 Ena1B (또는 Ena3A)에 대해 6.5 이상의 Dali Z-점수로 8-가닥 Ena 베타-샌드위치 폴드를 함유할 것이고, Ena 섬유에서 디술피드-매개 가교-결합을 위해 Z-X_n-C(C)-X_m-C-X 모티프를 갖는 N 말단 연결부 펩티드를 함유하게 될 것이며, 여기서 Z는 Leu, Ile, Val 또는 Phe이고, n은 1 또는 2 잔기이고, C는 Cys이고, (C)는 Ena3 분류에 대한 선택적 제2 Cys이고, m은 10 내지 12 아미노산이고, X는 임의 아미노산이다. 후보 Ena 서브유닛의 자가-조립 및 섬유 형성은 본 명세서의 재료 및 방법에서 기술된 바와 같이, 이. 콜라이의 세포질에서 재조합 발현 및 단리된 섬유 물질의 음성 염색 투과 전자 가시화에 의해 결정된다. 특히, S-형 섬유 형성 Ena 서브유닛은 본 명세서에 제공되는 바와 같이 Ena1B 구조와 비교하여 6.5 이상의 Z-점수를 갖는 예측된 구조를 갖고, SEQ ID NO: 1-14 또는 21 내지 37로 표시된 임의의 Ena1/2 A & B 서열과 적어도 80% 서열 동일성을 가지며, Ntc에 Z-X_n-C-C- X_m-C-X 모티프 (여기서, Z는 Leu, Ile, Val 또는 Phe이고, n은 1 또는 2 잔기이고, C는 Cys이고, m은 10 내지 12 아미노산이고, X는 임의 아미노산임)를 함유하고, C-말단에 GX_2/3CX₄Y 모티프 (여기서, G= Gly이고, X= 임의 아미노산이고, C= Cys이고, Y= Tyr임)를 함유하는, DUF3992-도메인 함유 단백질로서 인식될 수 있다. S-형 Ena 섬유는 음성 염색 전자 현미경을 통해 관찰 시 섬유 나선 회전부의 스태거드 지그-재그 외관에 의해 쉽게 인식된다 (도 1c). 특히, L-형 섬유 형성 Ena 서브유닛은 본 명세서에 제공되는 바와 같이, Ena3A 구조와 비교하여 6.5 이상의 Z-점수를 갖는 예측된 구조를 갖고, SEQ ID NO: 49 내지 80으로 표시되는 임의의 Ena3과 적어도 80% 서열 동일성을 갖고, Ntc에 Z-X_n-C-X_m-C-X 모티프 (여기서, Z는 Leu, Ile, Val 또는 Phe이고, n은 1 또는 2 잔기이고, C는 Cys이고, m은 10 내지 12 아미노산이고, X는 임의 아미노산임)를 함유하고, C-말단에 S-Z-N-Y-X-B 모티프 (여기서, S= Ser이고, Z는 Leu 또는 Ile이고, N=Asn이고, B는 Phe 또는 Tyr이고, X= 임의 아미노산임)를 함유하는, DUF3992-도메인 함유 단백질로서 인식될 수 있다. L-형 Ena 섬유는 음성 염색 전자 현미경으로 관찰 시 섬유에서 적층된 고리의 사다리-유사 외관으로 쉽게 인식된다 (도 1d).

표 1. DUF3992 단백질의 은닉 마르코브 모델.

재료 및 방법

비. 세레우스의 배양 및 부속물 추출

Ena의 추출을 위해서, 비. 세레우스 균주 NVH 0075-95는 혈액 한천 플레이트에 도말하였고 37℃에서 3개월 동안 인큐베이션하였다. 성숙화 시에, 포자를 재현탁하였고 milli-Q 물에서 3회 세척하였다 (원심분리 2400 xg, 4℃). 다양한 유기 및 무기 찌꺼기를 제거하기 위해서, 이어서 펠렛을 20% Nycodenz (Axis-Shield)에 재현탁하였고 구배가 1:1 v/v 비율의 45% 및 47% (w/v) Nycodenz의 혼합물로 구성된, Nycodenz 밀도 구배 원심분리를 수행하였다. 포자 세포만으로 이루어진 펠렛은 각각 0.1% SDS를 함유하는 1 M NaCl 및 TE 완충액 (50 mM Tris-HCl; 0.5 mM EDTA)으로 세척하였다. 부속물을 탈착시키기 위해서, 세척된 포자는 30초 동안 얼음 상에서 20k Hz ± 50 Hz 및 50 와트 (Vibra Cell VC50T; Sonic & Materials Inc.; U.S.)로 초음파 처리된 다음에 4500 xg에서 원심분리하여서 상청액에서 부속물을 수집하였다. 포자 및 영양 모세포의 잔류 성분을 더욱 제거하기 위해서, n-헥산을 첨가하였고 1:2 v/v 비율로 상청액과 강력하게 혼합하였다. 다음으로 혼합물은 물과 헥산의 분리를 허용하도록 정치시켰다. 부속물을 함유하는 헥산 분획을 수집하였고 kept at 55℃에 가압 하에 1.5시간 동안 유지시켜서 헥산을 증발시켰다. 마지막으로 부속물은 추가 cryo-EM 샘플 제조를 위해서 mill-Q 물에 재현탁하였다.

Ena1B 부속물의 재조합 발현, 정제 및 시험관내 조립

Ena1B는 이. 콜라이에서 발현을 위해 코돈 최적화시켰고, Pet28a 발현 벡터에 Twist biosciences (SEQ ID NO:83)에서 합성하고 클로닝하였다. 삽입부는 사이에 TEV 프로테아제 절단 부위 (SEQ ID NO:89: ENLYFQG)와 함께 Ena1B 상에 N-말단 6X 히스티딘 태그를 갖도록 디자인되었다. 대규모 재조합 발현은 NEB의 파지 내성 T7 Express lysY/Iq 이. 콜라이 균주에서 수행하였다. 단일 콜로니는 20 mL의 LB에 접종하였고 1차 배양을 위해 밤새 150 rpm으로 진탕하면서 37℃에서 성장시켰다. 다음날 아침에 6 L의 LB에 20 mL/L의 1차 배양물을 접종하였고 37℃에서 OD₆₀₀ 가 0.8에 도달할 때까지 성장시킨 후에 단백질 발현은 1 mM 이소프로필 β-D-1-티오갈락토피라노시드 (IPTG)를 사용해 유도시켰다. 배양은 추가 3시간 동안 37℃에서 인큐베이션되었고 5,000 rpm에서 원심분리를 통해 수확되었다. 전체-세포 펠렛은 가용성 용해 완충액 (20 mM 포타슘 포스페이트, 500 mM NaCl, 10 mM β-ME, 20 mM 이미다졸, pH 7.5)에 재현탁되었고 용해를 위해 얼음에서 초음파 처리되었다. 용해물은 Beckman coulter의 JA-20 로터에서 45분 동안 18,000 rpm으로 원심분리하여서 가용성 및 불용성 분획을 분리하도록 원심분리되었다. 펠렛은 용해 완충액 중에 8 M 우레아로 이루어진 변성 용해 완충액에 더 용해되었다. 다음으로 용해된 펠렛은 Ni 세파로스가 충전되고 변성 용해 완충액으로 평형화된 HisTrap HP 컬럼을 통과하였다. 결합된 단백질은 실온에서 AKTA 정제기를 사용해 구배 방식 (20-250 mM 이미다졸)으로 용리 완충액 (20 mM 포타슘 포스페이트, pH 7.5, 8 M 우레아, 250 mM 이미다졸)을 사용해 컬럼으로부터 용리되었다. 변성 조건에서 온전한 N 말단 6X HIS 태그를 갖는 재조합 정제된 Ena1B에 대해서 Hampton의 투석 버튼을 통해 가용성 용해 완충액으로 완충액 교환을 수행하였다. N 말단 His 태그가 2개 단량체 간 이중 디술피드 가교의 형성을 방해하여, Ena1B는 나선으로 조립되었다 (도 8E). 필라멘트로 자가-조립을 촉진하기 위해서, His-태그는 TEV 프로테아제를 통해서 절단되었다. 변성 조건에서 정제된 Ena1B는 20 mM Hepes, pH 7.0, 50 mM NaCl을 함유하는 완충액으로 밤새 4℃에서 먼저 투석되었다. 100 mM β-ME와 함께 TEV 프로테아제가 등몰 비율로 첨가되었고 2시간 동안 37℃에서 인큐베이션되었다. 이것으로 Ena1B는 긴 필라멘트로 조립되었다 (도 8F).

에스케리치아 콜라이로부터 재조합 생체내/세포내 Ena 섬유의 단리: [본 명세서에서 도20에 S-형 섬유; 및 도 25에 L-형 섬유로서 예시됨]

입체 블록이 없는, (즉, 예를 들어, 시험관내 조립 방법과 비교하여 HIS 태그-TEV 절단 부위없음), 이. 콜라이 C43(DE3) pET28a Ena1B 또는 Ena3A의 20 mL의 밤샘 전배양물을 1 리터의 LB, 50 μg/mL 카나마이신에 접종하였다. 대수기 중간 (OD=0.7-1.0)까지 37℃에 회전식 진탕기에서 인큐베이션하고, 온도를 25℃로 낮추고 1 mM의 최종 이소프로필 β-d-1-티오갈락토피라노시드를 첨가한다. 18시간 동안 인큐베이션하고, 5.000 rcf 및 4℃에서 JLA 8.1 로터를 사용해 세포를 수확한다. 2000 rmp에서 프로펠러 스타일 교반기에 장착된 오버헤드 교반기를 사용하여 1xPBS, 1% (w/v) 소듐 도데실 술페이트 (SDS)에 세포 펠렛을 재현탁한다. 자성 교반기 막대를 사용해 연속 교반하면서 99℃로 설정된 자성 열판 상에서 30분 동안 세포 슬러리를 인큐베이션한다. 균질화된 용해물을 50 mL 팔콘 튜브로 옮기고 30분 동안 20.000 rcf으로 JLA 14.5 로터에서 20℃에서 원심분리한다. 상청액을 버리고 방사형 톱니형 Potter-Elvehjem 조직 분쇄기를 사용해 1xPBS에 펠렛을 재현탁이키고 균질물을 30분 동안 20.000 rcf으로 원심분리시킨다. 상청액을 버리고 펠렛을 miliQ에 재현탁하고 30분 동안 20.000 rcf으로 원심분리시킨다. 원하는 최종 농도에 도달하도록 맑은 Ena 펠렛을 miliQ에 재용해시킨다.

이의 견고성을 시험하기 위한 Ena 처리 실험

비. 세레우스 균주 NVH 0075-95로부터 추출된 생체외 Ena (상기 참조)는 탈이온수에 재현탁하였고 잔류 박테리아 또는 포자의 불활성화를 보장하도록 20분 동안 121℃에서 오토클레이빙된 다음에, 하기에 표시되고 도 7에 도시된 바와 같이, 또는 완충액으로 처리되었다. 다양한 처리시 Ena 무결성을 결정하기 위해서, 샘플은 음성 염색 TEM을 사용해 이미지화하였고 Ena는 박스에 넣고 하기 기술된 바와 같이 2D 분류를 수행하였다. 프로테아제 내성을 시험하기 위해서, 생체외 Ena는 37℃에서 4시간 동안 1 mg/mL의 사용 준비된 프로테이나제 K　분해 (Thermo Scientific)가 수행되었고, TEM을 통해 이미지화되었다. 부속물에 대한 건조 효과를 연구하기 위해서, 생체외 Ena는 2k rpm 속도로 2시간 동안 작동되는 Savant DNA120 Speedvac Concentrator (Thermo scientific)를 사용해 43℃에서 진공 건조되었다.

음성-염색 투과 전자 현미경 (TEM)

NS-TEM을 통해 포자 및 재조합 발현된 부속물의 가시화를 위해서, Electron Microscopy Sciences의 400-홀 메쉬의 formvar/carbon 코팅된 구리 그리드는 45초 동안 진공에서 4 mA의 플라즈마 전류를 사용해 ELMO 글로우 방전기에서 방전시켰다. 3 μL의 샘플을 그리드에 도포하였고 1분 동안 지지체 필름에 결합되게 한 다음에 여분의 액체는 Whatman 등급 1 필터지로 블로팅하였다. 다음으로 그리드는 15 μL의 3개 액적의 milli-Q를 사용해 3회 세척한 다음에 여분 액체를 블로팅하였다. 세척된 그리드는 각 침지 사이에 블로팅 단계와 함께 10초, 2초, 및 1분 지속기간으로 3회 2% 우라닐 아세테이트의 15 μL 액적에 유지시켰다. 마지막으로, 우라닐 아세테이트 코팅된 그리드를 건조될 때까지 블로팅하였다. 다음으로 그리드는 LaB6 필라멘트 및 TVIPS F416 CCD 카메라가 장착된 120 kV JEOL 1400 현미경을 사용해 스크리닝되었다. 부속물의　2D 클래스는 이후 기술되는 바와 같이, RELION 3.0에서 생성되었다.

cryo-TEM 그리드의 제조 및 cryo-EM 데이터 수집

2 μm 홀 및 1 μm 간격의 QUANTIFOIL ® holey Cu 400 메쉬 그리드는 먼저 1분 동안 5 mA의 플라즈마 전류를 사용해 진공에서 글로우 방전되었다. 3 μL의 0.6 mg/mL 그라펜 옥시드 (GO) 용액을 그리드에 도포하였고, 실온에서 흡수를 위해 1분 동안 인큐베이션되었다. 다음으로, Extra GO를 블로팅하고, Whatman 등급 1 필터지를 사용해 건조를 위치 방치하였다. 극저온화를 위해서, 3 μL의 단백질 샘플을 Gatan CP3 cryo-plunger에서 100% 습도 및 실온에서 GO 코팅된 그리드에 도포하였다. 1분 흡수 후에, 양쪽 측면으로부터 5초 동안 Whatman 등급 2 필터지를 사용해 기계-블로팅하였고, 180℃에서 액체 에탄에 급냉시켰다. 그리드는 데이터 수집까지 액체 질소에 저장하였다. 수집 매개변수를 약간 변화시켜서 생체외 및 recEna1B 부속물에 대해 2개 데이터세트를 수집하였다. 고분해능 cryo-EM 2D 현미경 사진 동영상은 계측 모드에서 Serial EM으로 자동화된 JEOL Cryoarm300 현미경에서 기록하였다. 생체외 성장된 부속물 경우에, 현미경은 K2 정상 검출기가 장착되었고, 하기 설정을 가졌다: 300 keV, 100 mm 조리개, 30 프레임, 62.5 e^-/Å², 2.315초 노출, 및 0.82 Å/pxl. recEna1B 데이터세트 경우에, 0.782 Å/pxl의 픽셀 크기, 64.66 e^-/Å² 의 노출로 61 프레임을 찍어서, K3 검출기를 대신 사용하였다.

이미지 처리

RELION 3.0 (Zivanov et al., 2018)에서 구현되는 MOTIONCORR2 (Zheng et al., 2017)를 사용하여 빔-유도된 이미지 움직임을 보정하였고 평균 20D 현미경 사진을 생성시켰다. 움직임-보정된 현미경 사진은 RELION 3.0에 통합된 CTFFIND4.2 (Rohou and Grigorieff, 2015)를 사용해 CTF 매개변수를 추정하는데 사용되었다. 후속 처리는 RELION 3.0. 및 SPRING (Desfosses et al., 2014)를 사용하였다. 양쪽 데이터세트 경우에, 부속물의 좌표는 EMAN2 패키지의 e2helixboxer 를 사용해 수동으로 박스처리되었다 (Tang et al., 2007). Ena 필라멘트의 양호한 얼음 및 직선 스트레치가 있는 현미경 사진을 선택하도록 특별히 주의하였다. 필라멘트는 21Å의 박스간 거리와 300 x 300 pxl 치수의 중복 단일-입자 박스로 분할되었다. 생체외 Ena 경우에, 총 53,501 나선 단편이 현미경 사진 당 평균 2-3개의 긴 필라멘트가 존재하는 580개 현미경사진으로부터 추출되었다. recEna1B 필라멘트 경우에, 100,495 나선 단편은 현미경 사진 당 평균 4-5개 필라멘트가 있는 3,000개 현미경사진으로부터 추출되었다. 불량 입자를 걸러내기 위해서, 다수 라운드의 2D 분류를 RELION 3.0에서 실시하였다. 몇 라운드의 필터링 후에, 생체외 및 recEna1B 부속물의 42,822개 및 65,466개 양호한 입자의 데이터세트가 각각 선택되었다.

2D 분류의 ∼50회 반복 실행 후, 잘 분해된 2D 클래스 평균을 수득하였다. SPRING 패키지의 segclassexam (Desfosses et al., 2014)가 2D 클래스 평균의 B-요인 증강된 파워 스펙트럼을 생성시키는데 사용되었다. 생성된 파워 스펙트럼은 잘 분해된 층선의 증폭된 신호 대 잡음비를 가졌다 (도 2B). 미정제 나선 매개변수를 추정하기 위해서, 층선에서 피크의 좌표 및 위상은 SPRING의 segclasslayer 옵션을 사용해 측정하였다. 측정된 거리 및 위상을 기반으로 베셀 차수의 가능한 세트를 추론하였고, 이후 계산된 나선 매개변수는 RELION의 나선 재구선 절차에서 사용되었다 (He and Scheres, 2017). relion_helix_toolbox 를 사용해 생성된 110Å 직경의 무특징 실린더가 3D 분류의 초기 모델로서 사용되었다. 푸리에 - 베셀 인덱싱으로부터 추론된 입력 상승 및 비틀림은 각각 3.05 - 3.65Å 및 29 - 35도 범위로 다양하였고, 시험된 출발값 사이에 1도 및 0.1Å의 샘플채취 분해능을 가졌다. 그렇게 하여서, 양호한 연결성 및 인식가능한 2차 구조를 갖는 전자 전위 맵이 획득될 때까지 몇회의 3D 분류를 실행하였다. 3D 분류의 출력 번역 정보는 3D 분류 실행으로부터 생성된 25Å 저대역 필터링 맵을 선택해 수행되었다. EM 맵의 분해능을 개선시키기 위해서, 다수회의 3D 정밀화를 실행하였다. 분해능을 더욱 개선시키기 위해서, 베이지안 폴리싱을 RELION에서 수행하였다. 마지막으로, 나선 z-축의 중심 50%를 덮는 용매 마스크를 maskcreate 에서 생성시켰고 후처리 및 RELION에서 용매-평탄화 푸리에 쉘 상관도 (FSC) 곡선을 계산하는데 사용되었다. 2회 폴리싱 후에, FSC_0.143　골드-표준 기준에 따른 3.2Å 분해능의 맵을 비롯하여 RELION에서 계산된 국소 분해능을 수득하였다 (도 9A).

모델 구축

비대칭 유닛의 연결성을 개선시키기 위해서, PHENIX에서 구현되는 cryo-EM 도구에 대한 밀도 변형 (Afonine et al., 2018)을 사용하였다. 처음에 밀도 변형된 맵으로부터 단일 비대칭 서브유닛에 대한 1차 골격을 Coot에서 생성시켰다 (Emsley et al., 2010). Ena1B의 1차 서열은 비대칭 유닛으로 수동으로 끼워넣고 잔기의 화학적 성질을 고려하여 맵에 적합화시켰다. coot의 SSM Superpose 옵션을 사용하여서 단일 서브유닛으로부터 나선을 구축하였다. 구축 모델은 Phenix에서 다수회의 실제 공간 구조 정밀화가 수행되었고, 각 잔기는 모든 정밀화 라운드 이후에 수동으로 조사되었다. 모델 검증은 Phenix에서 구현되는 Refmac에서 수행되었다. 도면의 모든 시각화 및 이미지는 ChimeraX (Goddard et al., 2018), Chimera (Pettersen et al., 2004), Pymol에서 생성되었다.

Ena의 면역염색

정제된 RecEna1A,　RecEna1B　및 RecEna1C의 분취액은 토끼 면역화를 위해 Davids Biotechnologie GmbH (Germany)로 보내졌다 (28일 초고속 면역화 일정; A055). 1개월 후에 혈청을 받아서 추가 친화성 정제없이 사용하였다. 면역염색 EM 이미지화를 위해서, 정제된 생체외 Ena의 3 ㎕ 분취액을 Formvar/Carbon 그리드 (400 메쉬, Cu; Electron Microscope Sciences)에 침착시켰고, 1xPBS로 세척하고, 1시간 동안 1xPBS 중 0.5% (w/v) BSA와 인큐베이션하였다. 1xPBS로 추가 세척 후,　개별 그리드는　2시간 동안 37℃에서 각각 항-Ena1A, 항-Ena1B, 및 항-Ena1C 혈청의 1xPBS 중 1000-배 희석물과 인큐베이션되었다. 1xPBS로 세척 후, 그리드는 1시간 동안 37℃에서 염소에서 생산된 10 nm 금표지된　항-토끼 IgG, 및 친화성 단리된 항체　(G7277-.4ML; Sigma-Aldrich)의 2000배 희석물과 인큐베이션되었다.　　

정량적 RT-PCR

정량적 RT-PCR 실험은 접종 후 4시간, 8시간, 12시간 및 16시간에 3개 독립 박토 배양 배지 (37℃, 150 rpm)로부터 수확된 비. 세레우스 배양물로부터 단리된 mRNA에 대해 수행되었다. RNA 추출, cDNA 합성 및 RT-qPCR 분석은 하기처럼 변화시켜서, 본질적으로 이전에 기술된 대로 수행되었다 (Madslien et al., 2014): 예열 (65℃)된 TRIzol 시약 (Invitrogen) 및 사이에 얼음 냉각하면서 Mini-BeadBeater-8 (BioSpec)에서 2분 동안 4회 비드 비팅. RNA 샘플의 각 RT-qPCR은 삼중으로 수행되었고, 음성 대조군에는 주형을 첨가하지 않았고, rpoB 는 내부 대조군으로 사용되었다. 표준 곡선의 기울기 및 각 프라이머 쌍에 대한 PCR 효율 (E)은 cDNA 주형의 연속 희석물을 증폭시켜서 추정하였다. mRNA 전사물 수준의 정량을 위해서, 각 RT-qPCR 반응에서 동일 샘플로부터 유래된 내부 대조군 유전자 (rpoB) 및 표적 유전자의 Ct (threshold cycle) 값을 먼저 용어 E^-Ct를 사용해 변환시켰다. 다음으로 표적 유전자의 발현 수준은 내부 대조군 유전자에 대해 수득된 상응하는 값으로 그들 변환된 Ct-값을 나누어서 정규화되었다 (Duodu et al., 2010; Madslien et al., 2014; Pfaffl, 2001). 하기 조건으로 StepOne PCR 소프트웨어 V.2.0 (Applied Biosystems)를 사용해 증폭을 수행하였다: 2분 동안 50℃, 2분 동안 95℃, 95℃에서 15초, 60℃에서 1분 및 95℃에서 15초의 40 사이클. RT-qPCR 분석에 사용된 모든 프라이머는 표 2에 열거된다. 프라이머 2180/2177 및 2176/2175 및 DreamTaq DNA 중합효소 (Thermo Fisher)를 사용하여서 하기 프로그램을 사용해 Eppendorf Mastercycler에서 증폭시킨, 정규 PCR 반응을 cDNA에 대해 수행하여서 enaA 및 enaB가 오페론으로서 발현되었다는 것을 확인하였다: 95℃에서 2분, 95℃에서 30초, 54℃에서 30초, 및 72℃에서 1분의 30사이클.

결실 돌연변이체의 구축

비. 세레우스 균주 NVH 0075/95는 유전자 결실 돌연변이체에 대한 배경으로서 사용되었다. ena1B 유전자는 약간 수정한 마커리스 유전자 치환 방법 (Janes and Stibitz, 2006)을 사용해 ATGTAA (5'-3')로 리딩 프레임을 치환시켜서 인-프레임으로 결실되었다. ΔEna1BΔEna1C 이중 돌연변이체는 비. 세레우스 균주 NVH 0075/95Δena1B 배경에서 ena1C 결실을 통해 구축되었다. 결실 돌연변이체를 생성시키기 위해서, 표적 ena 유전자의 상류 (프라이머 A 및 B, 표 2) 및 하류 (프라이머 C 및 D, 표 2) 영역을 PCR로 증폭시켰다. PCR 단편의 조립을 허용하기 위해서, 프라이머 B 및 C는 상보성 중복 서열을 함유하였다. 추가 PCR 단계가 주형으로서 상류 및 하류 PCR 단편 및 A 및 D 프라이머 쌍을 사용해, 수행되었다 (표 2). 모든 PCR 반응은 제조사 설명서에 따라서 Eppendorf Mastercycler gradient 및 고충실도 AccuPrime Taq DNA 중합효소 (ThermoFisher Scientific)를 사용해 수행되었다. 최종 앰플리콘은 이전에 (Lindback et al., 2012)에 기술된 대로 추가 I-SceI 부위를 함유하는 열감수성 셔틀 벡터 pMAD (Arnaud et al., 2004)에 클로닝되었다. pMAD-I-SceI 플라스미드 구성체를 One Shot™ INV110 이. 콜라이 (ThermoFisher Scientific)를 통해 계대하여서 비. 세레우스에서 형질전환 효율을 증강시키도록 비메틸화된 DNA를 획득하였다. 미메틸화된 플라스미드는 전기천공을 통해서 비. 세레우스 NVH 0075/95에 도입되었다 (Mahillon et al., 1989). PCR을 통해 형질전환의 검증 후, I-SceI 효소에 대한 유저자를 함유하는, 플라스미드 pBKJ233 (비메틸화)는 전기천공을 통해 형질전환체 균주에 도입되었다. I-SceI 효소는 염색체 통합된 플라스미드에서 이중-가닥 DNA 파괴를 만든다. 후속하여, 상동성 재조합 사건은 통합된 플라스미드의 절개를 야기하여서 원하는 유전자 치환이 일어난다. 유전자 결실은 프라이머 A 및 D (표 2)를 사용한 PCR 증폭 및 DNA 시퀀싱 (Eurofins Genomics)으로 검증하였다.

Ena1의 오솔로그 및 상동체 검색

바실러스 s.I 그룹에 속하는 종의 공공으로 입수가능한 게놈을 NCBI RefSeq 데이터베이스 (n=735, NCB (https://www.ncbi.nlm.nih.gov/refseq/)로부터 다운로드하였다. 표현형 특징때문에 특히 관심있는 균주 (GCA_000171035.2_ASM17103v2, GCA_002952815.1_ASM295281v1, GCF_000290995.1_Baci_cere_AND1407_G13175) 및 닫힌 게놈이 존재하지 않거나 또는 매우 드문 종을 제외하고, 포함된 모든 조립체는 NCBI RefSeq의 엄선된 데이터베이스로부터 닫히고 공개적으로 입수가능한 게놈이었다. 조립체는 QUAST (Gurevich et al., 2013)를 사용해 품질 검사되었고, 올바른 크기 (∼4.9-6Mb) 및 ∼35%의 GC 함량을 갖는 게놈만 후속 분석에 포함시켰다. 쌍별 tBLASTn 검색을 수행하여서 (e-값 1e-10, max_hspr 1, 디폴트 설정) 균주 NVH 0075-95로부터 하기 문의-단백질 서열의 상동체 및 오솔로그를 검색하였다: Ena1A (SEQ ID NO:1), Ena1B (SEQ ID NO:87), Ena1C (SEQ ID NO:15). 문의로서 사용된 Ena1B 단백질 서열 (SEQ ID NO:87)은 내부 앰플리콘 시퀀싱된 생산물로부터 기원하였고, 한편 Ena1A 및 Ena1C 단백질 서열 문의 균주 NVH 0075-95에 대한 조립체로부터 기원되었다 (각각 수탁 번호 GCF_001044825.1, 단백질 KMP91697.1 및 KMP91699.1). 우리는 대상 단백질이 높은 커버리지 (>70%) 및 중간정도 서열 동일성 (>30%)으로 문의 단백질과 일치하였을 때 단백질 오솔로그 또는 상동체로서 간주하였다.

ena-게놈 및 단백질의 비교 유전체학

정렬된 Ena1A-C 단백질의 계통수는 tBLASTn 검색으로부터 생성된 모든 히트에 대해 FastTree (Price et al., 2010) (디폴트 설정)를 통한 근사 최대 우도를 사용해 구축하였다. 아미노산 서열은 mafft v.7.310 (Katoh et al., 2019)을 사용해 정렬되었고, 단백질 정렬의 근사-최대-우도 계통수는 JTT+CAT 모델 (Price et al., 2010)을 사용하는 FastTree를 사용해 만들었다. 모든 계통수는 Microreact (Argimon et al., 2016)에서 시각화하였고, 종의 메타데이터, 및 Ena1A-C 및 Ena2A-C의 존재 및 부재는 도면에 더하였다.

서열 목록

>SEQ ID NO:1: 바실러스 세레우스 NVH 0075-95 383 내생포자 부속물 (Ena) 1A 아미노산 서열 (GenBank 단백질 ID: KMP91697.1; 126aa)

>SEQ ID NO:2: GCF_007673655.1_Ena1A 125aa 비. 미코이데스 (ncbi 데이터베이스와 같음)

>SEQ ID NO:3: GCF_002251005.2_Ena1A 126aa 비. 시토톡시쿠스

>SEQ ID NO:4: GCF_001884105.1_Ena1A 125aa 비. 루타이

>SEQ ID NO:5: GCA_000171035.2_Ena1A 126aa 비. 세레우스

>SEQ ID NO:6: GCF_007682405.1_Ena1A 126 aa 비. 트로피쿠스

>SEQ ID NO:7: GCF_002572325.1_Ena1A 126aa 비. 위에드만니이

>SEQ ID NO:8: 바실러스 세레우스 NVH 0075-95 383 내생포자 부속물 (Ena) 1B 아미노산 서열 (GenBank 단백질 ID: KMP91698.1; 117aa)

>SEQ ID NO:9: GCF_000161255.1_Ena1B 120aa 비. 세레우스

>SEQ ID NO:10: GCF_900095655.1_Ena1B 116 aa 비. 시토톡시쿠스

>SEQ ID NO:11: GCA_000171035.2_Ena1B 117 aa 비. 세레우스

>SEQ ID NO:12: GCF_002572325.1_Ena1B 117 aa 비. 위에드만니이

>SEQ ID NO:13: GCF_001884105.1_Ena1B 117 aa 비. 루타이

>SEQ ID NO:14: GCF_007682405.1_Ena1B 117 aa 비. 트로피쿠스

>SEQ ID NO:15: 바실러스 세레우스 NVH 0075-95 383 내생포자 부속물 (Ena) 1C 아미노산 서열 (GenBank 단백질 ID: KMP91699.1; 155aa)

>SEQ ID NO:16: GCF_900094915.1_Ena1C 150 aa 비. 시토톡시쿠스

>SEQ ID NO:17: GCF_000789315.1_Ena1C 155 aa 비. 세레우스

>SEQ ID NO:18: GCF_001044745.1_Ena1C 155 aa 비. 위에드만니이

>SEQ ID NO:19: GCF_002568925.1_Ena1C 155 aa 비. 위에드만니이

>SEQ ID NO:20: GCF_001884105.1_Ena1C 155 aa 비. 루타이

>SEQ ID NO:21: 바실러스 시토톡시쿠스 NVH 391-98 내생포자 부속물 (Ena) 2A 아미노산 서열 (GenBank 단백질 ID: ABS21009.1; 126aa)

>SEQ ID NO:22: GCF_002555305.1_Ena2A 122aa 비. 위에드만니이

>SEQ ID NO:23: GCF_000712595.1_Ena2A 119aa 비. 만리포넨시스

>SEQ ID NO:24: GCF_000008005.1_Ena2A 122aa 비. 세레우스

>SEQ ID NO:25: GCF_000161275.1_Ena2A 122aa 비. 세레우스

>SEQ ID NO:26: GCF_000007845.1_Ena2A 122 aa 비. 안트라시스

>SEQ ID NO:27: GCF_002589195.1_Ena2A 122aa 비. 토이오넨시스

>SEQ ID NO:28: GCF_000290695.1_Ena2A 122 aa 비. 미코이데스

>SEQ ID NO:29: 바실러스 시토톡시쿠스 NVH 391-98 내생포자 부속물 (Ena) 2B 아미노산 서열 (GenBank 단백질 ID: ABS21010.1; 117aa)

>SEQ ID NO:30: GCF_002555305.1_Ena2B 113 aa 비. 위에드만니이

>SEQ ID NO:31: GCF_000712595.1_Ena2B 114aa 비. 만리포넨시스

>SEQ ID NO:32: GCF_000008005.1_Ena2B 112 aa 비. 세레우스

>SEQ ID NO:33: GCF_000803665.1_Ena2B 110aa 비. 투린지엔시스

>SEQ ID NO:34: GCF_004023375.1_Ena2B 111 aa 비. 미코이데스

>SEQ ID NO:35: GCF_000742875.1_Ena2B 114 aa 비. 안트라시스

>SEQ ID NO:36: GCF_002589605.1_Ena2B 114 aa 비. 토이오넨시스

>SEQ ID NO:37: GCF_900095005.1_Ena2B 114 aa 비. 미코이데스

>SEQ ID NO:38: 바실러스 시토톡시쿠스 NVH 391-98 내생포자 부속물 (Ena) 2C 아미노산 서열 (GenBank 단백질 ID: ABS21011.1; 150aa)

>SEQ ID NO:39: GCF_000338755.1_Ena2C 135 비. 투린지엔시스

>SEQ ID NO:40: GCF_003386775.1_Ena2C 135 비. 미코이데스

>SEQ ID NO:41: GCF_002578975.1_Ena2C 135 비. 위에드만니이

>SEQ ID NO:42: GCF_006349595.1_Ena2C 135 비. 파시피쿠스

>SEQ ID NO:43: GCF_001455345.1_Ena2C 134 비. 투린지엔시스

>SEQ ID NO:44: GCF_004023375.1_Ena2C 144 비. 미코이데스

>SEQ ID NO:45: GCF_003227955.1_Ena2C 136 비. 안트라시스

>SEQ ID NO:46: GCF_001317525.1_Ena2C 136 비. 위에드만니이

>SEQ ID NO:47: GCF_000712595.1_Ena2C 145 비. 만리포넨시스

>SEQ ID NO:48: GCF_007673655.1_Ena2C 139 비. 미코이데스

>SEQ ID NO: 49: 바실러스 (다종-바실러스 세레우스 ATCC10987-GCF_000008005.1) 내생포자 부속물 (Ena) 3A 아미노산 서열 (WP_017562367.1; 113aa)

>SEQ ID NO: 50: WP_157293150.1/1-112 DUF3992 도메인-함유 단백질 [바실러스 sp. ms-22]

>SEQ ID NO: 51:WP_105925236.1/1-114 DUF3992 도메인-함유 단백질 [바실러스 sp. LLTC93]

>SEQ ID NO: 52: OLP66313.1/1-115 가상 단백질 BACPU_06150 [바실러스 푸밀루스 (Bacillus pumilus)]

>SEQ ID NO: 53: WP_010787618.1/1-115 DUF3992 도메인-함유 단백질 [바실러스 아트로파에우스 (Bacillus atrophaeus)]

>SEQ ID NO: 54: WP_040373377.1/1-116 DUF3992 도메인-함유 단백질 [페리바실러스 사이크로사카롤리티쿠스 (Peribacillus psychrosaccharolyticus)]

>SEQ ID NO: 55: WP_091498261.1/1-115 DUF3992 도메인-함유 단백질 [암피바실러스 마리누스 (Amphibacillus marinus)]

>SEQ ID NO: 56: WP_008633630.1/1-115 다종, DUF3992 도메인-함유 단백질 [바실라세아에 (Bacillaceae)]

>SEQ ID NO: 57: WP_124051031.1/1-116 DUF3992 도메인-함유 단백질 [바실러스 엔도피티쿠스 (Bacillus endophyticus)]

>SEQ ID NO: 58: WP_049679853.1/1-114 DUF3992 도메인-함유 단백질 [페리바실러스 로이셀레우리아에 (Peribacillus loiseleuriae)]

>SEQ ID NO: 59: WP_062184382.1/1-118 다종, DUF3992 도메인-함유 단백질 [바실랄레스 (Bacillales)]

>SEQ ID NO: 60: WP_049681018.1/1-118 DUF3992 도메인-함유 단백질 [페리바실러스 로이셀레우리아에 (Peribacillus loiseleuriae)]

>SEQ ID NO: 61: WP_154975023.1/1-118 DUF3992 도메인-함유 단백질 [바실러스 메가테리움 (Bacillus megaterium)]

>SEQ ID NO: 62: WP_048022205.1/1-118 DUF3992 도메인-함유 단백질 [바실러스 아리아바타이 (Bacillus aryabhattai)]

>SEQ ID NO: 63: WP_036199318.1/1-114 DUF3992 도메인-함유 단백질 [리시니바실러스 신두리엔시스 (Lysinibacillus sinduriensis)]

>SEQ ID NO: 64: MQR85259.1/1-115 DUF3992 도메인-함유 단백질 [바실러스 메가테리움 (Bacillus megaterium)]

>SEQ ID NO: 65: WP_111616476.1/1-114 DUF3992 도메인-함유 단백질 [바실러스 sp. YR335]

>SEQ ID NO: 66: TDL84647.1/1-113 DUF3992 도메인-함유 단백질 [비브리오 벌니피쿠스 (Vibrio vulnificus)]

>SEQ ID NO: 67: WP_119116371.1/1-114 DUF3992 도메인-함유 단백질 [페리바실러스 아사히이 (Peribacillus asahii)]

>SEQ ID NO: 68: WP_000057858.1/1-116 DUF3992 도메인-함유 단백질 [바실러스 세레우스]

>SEQ ID NO: 69: WP_000192611.1/1-114 DUF3992 도메인-함유 단백질 [바실러스 세레우스]

>SEQ ID NO: 70: WP_000057857.1/1-114 다종: DUF3992 도메인-함유 단백질 [바실러스 세레우스 그룹]

>SEQ ID NO: 71: WP_035510401.1/1-114 다종: DUF3992 도메인-함유 단백질 [할로바실러스 (Halobacillus)]

>SEQ ID NO: 72: WP_101934191.1/1-114 DUF3992 도메인-함유 단백질 [버지바실러스 독도넨시스 (Virgibacillus dokdonensis)]

>SEQ ID NO: 73: WP_149173096.1/1-114 DUF3992 도메인-함유 단백질 [바실러스 sp. BPN334]

>SEQ ID NO: 74: AAS42063.1/1-115 가상 단백질 BCE_3153 [바실러스 세레우스 ATCC 10987]

>SEQ ID NO: 75: WP_100527630.1/1-114 DUF3992 도메인-함유 단백질 [파에니바실러스 sp. GM1FR]

>SEQ ID NO: 76: WP_026691041.1/1-115 DUF3992 도메인-함유 단백질 [바실러스 아우란티카쿠스 (Bacillus aurantiacus)]

>SEQ ID NO: 77: WP_102693317.1/1-113 DUF3992 도메인-함유 단백질 [루멜리바실러스 피크누스 (Rummeliibacillus pycnus)]

>SEQ ID NO: 78: WP_071391073.1/1-109 DUF3992 도메인-함유 단백질 [아나에로바실러스 알칼리디아조트로피쿠스 (Anaerobacillus alkalidiazotrophicus)]

>SEQ ID NO: 79: WP_107839371.1/1-111 DUF3992 도메인-함유 단백질 [리시니바실러스 메이어리 (Lysinibacillus meyeri)]

>SEQ ID NO: 80: WP_066166707.1/1-111 DUF3992 도메인-함유 단백질 [메타솔리바실러스 플루오로글리코페닐리티쿠스 (Metasolibacillus fluoroglycofenilyticus)]

>SEQ ID NO:81: 재조합 Ena1A 뉴클레오티드 서열 (SEQ ID NO:82 코딩; 429 bp)

>SEQ ID NO:82: 재조합 Ena1A 아미노산 서열 (N-말단 6xHis 태그 및 TEV 절단 부위 가짐)

>SEQ ID NO:83: 재조합 Ena1B 뉴클레오티드 서열 (SEQ ID NO:84 코딩; 399bp)

>SEQ ID NO:84: 재조합 Ena1B 아미노산 서열 (N-말단 6xHis 태그 및 TEV 절단 부위 가짐)

>SEQ ID NO:85: 재조합 Ena1C 뉴클레오티드 서열 (SEQ ID NO:86 코딩; 516bp)

>SEQ ID NO:86: 재조합 Ena1C 아미노산 서열 ( N-말단 6xHis 태그 및 TEV 절단 부위 가짐)

>SEQ ID NO:87: Ena1B_NM_Oslo (합성 서열)

>SEQ ID NO:88: 도 8의 합성 펩티드

>SEQ ID NO:89: TEV 절단 부위

PCR 단편의 조립을 허용하기 위해서, 프라이머 B 및 C는 서로 중복된 서열 (이탤릭체)를 함유한다.

>SEQ ID NO:118-139: N-/C-말단 모티프 공통 서열

>SEQ ID NO: 140: Ena1B-DE-HA 삽입 변이체 아미노산 서열 (SEQ ID NO:8 Ena1B 기반)

>SEQ ID NO: 141: Ena1B-DE-Flag 삽입 변이체 아미노산 서열 (SEQ ID NO:8 Ena1B 기반)

>SEQ ID NO: 142: Ena1B-HI-HA 삽입 변이체 아미노산 서열 (SEQ ID NO:8 Ena1B 기반)

>SEQ ID NO:143: HA-태그

>SEQ ID NO:144: FLAG-태그

>SEQ ID NO:145: Ena2A 아미노산 서열 바실러스 투린지엔시스 (WP_001277540.1)

>SEQ ID NO:146: Ena2C 아미노산 서열 바실러스 투린지엔시스 (WP_014481960.1)

> SEQ ID NO: 147-150: C-말단 모티프 공통 서열.

참고문헌

SEQUENCE LISTING <110> VIB VZW VRIJE UNIVERSITEIT BRUSSEL Norwegian University of Life Sciences <120> NOVEL BACTERIAL PROTEIN FIBERS <130> HaRe/ENA/694 <150> EP 20189961.4 <151> 2020-08-07 <160> 150 <170> PatentIn version 3.5 <210> 1 <211> 126 <212> PRT <213> Bacillus cereus <400> 1 Met Ala Cys Glu Cys Ser Ser Thr Val Leu Thr Cys Cys Ser Asp Asn 1 5 10 15 Ser Ser Asn Phe Val Gln Asp Lys Val Cys Asn Pro Trp Ser Ser Ala 20 25 30 Glu Ala Ser Thr Phe Thr Val Tyr Ala Asn Asn Val Asn Gln Asn Ile 35 40 45 Val Gly Thr Gly Tyr Leu Thr Tyr Asp Val Gly Pro Gly Val Ser Pro 50 55 60 Ala Asn Gln Ile Thr Val Thr Val Leu Asp Ser Gly Gly Gly Thr Ile 65 70 75 80 Gln Thr Phe Leu Val Asn Glu Gly Thr Ser Ile Ser Phe Thr Phe Arg 85 90 95 Arg Phe Asn Ile Ile Gln Ile Thr Thr Pro Ala Thr Pro Ile Gly Thr 100 105 110 Tyr Gln Gly Glu Phe Cys Ile Thr Thr Arg Tyr Leu Met Ala 115 120 125 <210> 2 <211> 125 <212> PRT <213> Bacillus mycoides <400> 2 Met Ser Cys Asn Cys Ser Val Thr Ala Leu Thr Cys Cys Pro Asp Asp 1 5 10 15 Ser Ser Asn Tyr Val Gln Asp Lys Val Cys Asn Pro Trp Ser Ser Ile 20 25 30 Glu Asn Leu Thr Phe Thr Val Tyr Gly Asn Asn Val Asn Gln Asn Ile 35 40 45 Val Gly Thr Gly Tyr Ile Thr Tyr Asp Val Gly Pro Gly Ala Ser Pro 50 55 60 Ala Asn Asp Ile Thr Val Thr Val Leu Asp Ser Gly Gly Gly Pro Ile 65 70 75 80 Gln Thr Phe Thr Met Val Glu Gly Thr Ser Ile Ala Phe Thr Phe Arg 85 90 95 Arg Phe Asn Thr Ile Gln Ile Thr Thr Pro Ala Thr Ala Gly Thr Tyr 100 105 110 Gln Gly Glu Phe Cys Ile Thr Thr Arg Tyr Ala Met Ser 115 120 125 <210> 3 <211> 126 <212> PRT <213> Bacillus cytotoxicus <400> 3 Met Ala Cys Asn Cys Ser Val Thr Ala Leu Thr Cys Cys Pro Asp Glu 1 5 10 15 Ser Asn Asn Phe Val Gln Asp Lys Val Cys Asn Pro Trp Ser Ser Ala 20 25 30 Glu Ala Ser Thr Phe Thr Val Tyr Gly Asn Asn Ile Asn Gln Asn Ile 35 40 45 Val Gly Thr Gly Tyr Leu Thr Tyr Asp Val Gly Pro Gly Val Ser Pro 50 55 60 Ala Asn Ala Ile Thr Val Asn Val Leu Asp Ser Gly Gly Gly Ile Ile 65 70 75 80 Gln Thr Phe Thr Val Thr Glu Gly Met Ser Val Ala Phe Thr Phe Arg 85 90 95 Arg Phe Asp Val Ile Gln Ile Val Thr Pro Ala Thr Pro Ala Gly Thr 100 105 110 Tyr Gln Gly Glu Phe Cys Ile Thr Thr Arg Tyr Val Met Ser 115 120 125 <210> 4 <211> 125 <212> PRT <213> Bacillus luti <400> 4 Met Ala Cys Glu Cys Ser Ser Thr Val Leu Thr Cys Cys Ser Asp Asn 1 5 10 15 Ser Ser Asn Phe Val Gln Asp Lys Val Cys Asn Pro Trp Ser Ser Ala 20 25 30 Glu Asp Ser Thr Phe Thr Val Tyr Ala Asn Asn Val Asn Gln Asn Ile 35 40 45 Ile Gly Thr Gly Tyr Leu Thr Tyr Asn Val Gly Pro Gly Val Ser Pro 50 55 60 Ala Asn Gln Ile Thr Val Thr Val Leu Asp Ser Gly Gly Gly Pro Ile 65 70 75 80 Gln Thr Phe Leu Val Asn Glu Gly Thr Ser Ile Ser Phe Thr Phe Arg 85 90 95 Arg Phe Asn Ile Ile Gln Ile Thr Thr Pro Val Thr Pro Val Gly Thr 100 105 110 Tyr Gln Gly Glu Phe Cys Ile Thr Thr Arg Tyr Leu Met 115 120 125 <210> 5 <211> 126 <212> PRT <213> Bacillus cereus <400> 5 Met Ala Cys Glu Cys Ser Ser Thr Val Leu Thr Cys Cys Ser Asp Asn 1 5 10 15 Ser Ser Asn Phe Val Gln Asp Lys Val Cys Asn Pro Arg Ser Ser Ala 20 25 30 Glu Ala Ser Thr Phe Thr Val Tyr Ala Asn Asn Val Asn Gln Asn Ile 35 40 45 Val Gly Thr Gly Tyr Leu Thr Tyr Asp Val Gly Pro Gly Val Ser Pro 50 55 60 Ala Asn Gln Ile Thr Val Thr Val Leu Asp Ser Gly Gly Gly Thr Ile 65 70 75 80 Gln Thr Phe Leu Val Asn Glu Gly Thr Ser Ile Ser Phe Thr Phe Arg 85 90 95 Arg Phe Asn Ile Ile Gln Ile Thr Thr Pro Ala Thr Pro Ile Gly Thr 100 105 110 Tyr Gln Gly Glu Phe Cys Ile Thr Thr Arg Tyr Leu Met Ala 115 120 125 <210> 6 <211> 126 <212> PRT <213> Bacillus tropicus <400> 6 Met Ala Cys Glu Cys Ser Ser Thr Val Leu Thr Cys Cys Ser Asp Asn 1 5 10 15 Ser Ser Asn Phe Val Gln Asp Lys Val Cys Asn Pro Trp Ser Ser Ala 20 25 30 Glu Ala Ser Thr Phe Thr Val Tyr Ala Asn Asn Val Asn Gln Asn Ile 35 40 45 Val Gly Thr Gly Tyr Leu Thr Tyr Asp Val Gly Pro Gly Val Ser Pro 50 55 60 Ala Asn Gln Ile Thr Val Thr Val Leu Asp Ser Gly Gly Gly Thr Ile 65 70 75 80 Gln Thr Phe Leu Val Asn Glu Gly Thr Ser Ile Ser Phe Thr Phe Arg 85 90 95 Arg Phe Asn Ile Ile Gln Ile Thr Thr Pro Ala Thr Pro Ile Gly Thr 100 105 110 Tyr Gln Gly Glu Phe Cys Ile Thr Thr Arg Tyr Leu Met Ala 115 120 125 <210> 7 <211> 126 <212> PRT <213> Bacillus wiedmannii <400> 7 Met Ala Cys Glu Cys Ser Gly Thr Val Leu Thr Cys Cys Ser Asp Asn 1 5 10 15 Ser Ser Asn Phe Val Gln Asp Lys Val Cys Asn Ser Trp Ser Ser Ala 20 25 30 Ala Ala Ser Thr Phe Thr Val Tyr Ala Asn Asn Val Asn Gln Asn Ile 35 40 45 Val Gly Thr Gly Tyr Leu Thr Tyr Asp Val Gly Pro Gly Val Ser Pro 50 55 60 Ala Asn Gln Ile Thr Val Ala Val Leu Asp Ser Gly Gly Gly Thr Ile 65 70 75 80 Gln Ser Phe Thr Val Ser Glu Gly Thr Ser Ile Ala Phe Thr Phe Arg 85 90 95 Arg Phe Asn Ile Ile Gln Ile Thr Thr Pro Ala Thr Pro Leu Gly Thr 100 105 110 Tyr Gln Gly Glu Phe Cys Ile Thr Thr Arg Tyr Leu Ile Ser 115 120 125 <210> 8 <211> 117 <212> PRT <213> Bacillus cereus <400> 8 Met Gly Asn Cys Ser Thr Asn Leu Ser Cys Cys Ala Asn Gly Gln Lys 1 5 10 15 Thr Ile Val Gln Asp Lys Val Cys Ile Asp Trp Thr Ala Ala Ala Thr 20 25 30 Ala Ala Ile Ile Tyr Ala Asp Asn Ile Ser Gln Asp Ile Tyr Ala Ser 35 40 45 Gly Tyr Leu Lys Val Asp Thr Gly Thr Gly Pro Val Thr Ile Val Phe 50 55 60 Tyr Ser Gly Gly Val Thr Gly Thr Ala Val Glu Thr Ile Val Val Ala 65 70 75 80 Thr Gly Ser Ser Ala Ser Phe Thr Val Arg Arg Phe Asp Thr Val Thr 85 90 95 Ile Leu Gly Thr Ala Ala Ala Glu Thr Gly Glu Phe Cys Met Thr Ile 100 105 110 Arg Tyr Thr Leu Ser 115 <210> 9 <211> 120 <212> PRT <213> Bacillus cereus <400> 9 Met Gly Asn Cys Gly Thr Asn Leu Ser Cys Cys Ala Asn Ala Gln Lys 1 5 10 15 Thr Ile Val Gln Asp Lys Val Cys Ile Asp Trp Thr Ile Thr Thr Ile 20 25 30 Ala Ala Pro Gly Gln Ile Ile Tyr Ala Asp Asn Ile Ser Gln Asp Ile 35 40 45 Tyr Ala Ser Gly Tyr Leu Lys Val Glu Thr Gly Thr Gly Pro Val Thr 50 55 60 Ile Thr Phe Tyr Ser Gly Gly Thr Gly Gly Thr Ala Val Glu Thr Ile 65 70 75 80 Ile Val Ala Ser Gly Ser Ser Ala Ser Phe Thr Val Arg Arg Phe Asp 85 90 95 Thr Val Ala Ile Leu Gly Thr Thr Leu Gly Glu Thr Gly Glu Phe Cys 100 105 110 Met Thr Ile Arg Tyr Ser Leu Ser 115 120 <210> 10 <211> 116 <212> PRT <213> Bacillus cytotoxicus <400> 10 Met Lys Asn Tyr Ser Ala Asn Leu Ser Cys Cys Ala Asn Ser Gln Lys 1 5 10 15 Asn Ile Val Gln Asp Lys Val Cys Ile Asn Trp Thr Ala Thr Ala Ala 20 25 30 Pro Ala Ile Ile Tyr Ala Asp Asn Ile Ala Gln Asp Ile Tyr Ala Ser 35 40 45 Gly Tyr Leu Lys Val Asp Thr Gly Thr Gly Pro Val Thr Leu Val Phe 50 55 60 Tyr Ser Gly Gly Ile Gly Gly Thr Ala Val Glu Thr Ile Thr Val Ala 65 70 75 80 Thr Gly Ser Gly Ala Ser Phe Thr Val Arg Arg Phe Asp Thr Val Thr 85 90 95 Ile Leu Gly Thr Ala Ala Ala Glu Thr Gly Glu Phe Cys Met Thr Ile 100 105 110 Arg Tyr Thr Leu 115 <210> 11 <211> 117 <212> PRT <213> Bacillus cereus <400> 11 Met Gly Asn Cys Ser Thr Asn Leu Ser Cys Cys Ala Asn Gly Gln Lys 1 5 10 15 Thr Ile Val Gln Asp Lys Val Cys Ile Asp Trp Thr Ala Ala Ala Thr 20 25 30 Ala Ala Ile Ile Tyr Ala Asp Asn Ile Ser Gln Asp Ile Tyr Ala Ser 35 40 45 Gly Tyr Leu Lys Val Asp Thr Gly Thr Gly Pro Val Thr Ile Val Phe 50 55 60 Tyr Ser Gly Gly Val Thr Gly Thr Ala Val Glu Thr Ile Val Val Ala 65 70 75 80 Thr Gly Ser Ser Ala Ser Phe Thr Val Arg Arg Phe Asp Thr Val Thr 85 90 95 Ile Leu Gly Thr Ala Ala Ala Glu Thr Gly Glu Phe Cys Met Thr Ile 100 105 110 Arg Tyr Thr Leu Ser 115 <210> 12 <211> 117 <212> PRT <213> Bacillus wiedmannii <400> 12 Met Gly Asn Cys Ser Thr Asn Leu Ser Cys Cys Ala Asn Ser Gln Lys 1 5 10 15 Thr Ile Val Gln Asp Lys Val Cys Ile Asp Trp Thr Ala Ser Ala Thr 20 25 30 Ala Glu Val Ile Tyr Ala Asp Asn Ile Ser Gln Asp Ile Tyr Ala Ser 35 40 45 Gly Tyr Leu Lys Val Asp Thr Gly Thr Gly Pro Val Thr Leu Val Phe 50 55 60 Tyr Ser Gly Gly Ile Ala Gly Thr Ala Leu Glu Thr Ile Val Val Ala 65 70 75 80 Thr Gly Ser Ser Ala Ser Phe Thr Val Arg Arg Phe Asp Thr Val Thr 85 90 95 Ile Leu Gly Thr Ala Ala Ala Glu Thr Gly Glu Phe Cys Met Thr Ile 100 105 110 Arg Tyr Ser Leu Ser 115 <210> 13 <211> 117 <212> PRT <213> Bacillus luti <400> 13 Met Gly Asn Cys Ser Thr Asn Leu Ser Cys Cys Ala Asn Gly Gln Lys 1 5 10 15 Thr Ile Val Gln Asp Lys Val Cys Ile Asp Trp Thr Ala Ala Val Thr 20 25 30 Ala Ala Ile Ile Tyr Ala Asp Asn Ile Ser Gln Asp Ile Tyr Ala Ser 35 40 45 Gly Tyr Leu Lys Val Asp Thr Gly Thr Gly Pro Val Thr Ile Asn Phe 50 55 60 Tyr Ser Gly Gly Thr Gly Gly Thr Ile Val Glu Thr Ile Thr Val Ala 65 70 75 80 Ser Gly Ser Ser Ala Ser Phe Thr Val Arg Arg Phe Asp Thr Val Thr 85 90 95 Ile Ile Gly Thr Ala Ala Ala Glu Thr Gly Glu Phe Cys Met Thr Ile 100 105 110 Arg Tyr Thr Leu Ser 115 <210> 14 <211> 117 <212> PRT <213> Bacillus tropicus <400> 14 Met Gly Asn Cys Ser Thr Asn Leu Ser Cys Cys Ala Asn Gly Gln Lys 1 5 10 15 Thr Ile Val Gln Asp Lys Val Cys Ile Asp Trp Thr Ala Ala Ala Thr 20 25 30 Ala Ala Ile Ile Tyr Ala Asp Asn Ile Ser Gln Asp Ile Tyr Ala Ser 35 40 45 Gly Tyr Leu Lys Val Asp Thr Gly Thr Gly Pro Val Thr Ile Val Phe 50 55 60 Tyr Ser Gly Gly Val Thr Gly Thr Ala Leu Glu Thr Ile Val Val Ala 65 70 75 80 Thr Gly Ser Ser Ala Ser Phe Thr Val Arg Arg Phe Asp Thr Val Thr 85 90 95 Ile Leu Gly Thr Ala Ala Gly Glu Thr Gly Glu Phe Cys Met Thr Ile 100 105 110 Arg Tyr Thr Leu Ser 115 <210> 15 <211> 155 <212> PRT <213> Bacillus cereus <400> 15 Met Lys Pro His Lys Asn Ile Gly Cys Phe Ala Pro Leu Ser Ile Ile 1 5 10 15 Cys Gln Pro Thr Cys Pro Cys Pro Pro Pro Ile Leu Pro Pro Glu Arg 20 25 30 Gly Asp Ala Glu Leu Val Thr Asn Glu Phe Ala Gly Asp Ile Leu Ile 35 40 45 Ser Asn Asp Phe Ile Pro Ile Ser Gln Lys Gln Leu Lys Gln Thr Asn 50 55 60 Thr Thr Val Asn Ile Trp Lys Asn Asp Gly Ile Val Ser Leu Ser Gly 65 70 75 80 Thr Ile Ser Ile Tyr Asn Asn Arg Asn Ser Thr Asn Ala Leu Ser Ile 85 90 95 Gln Ile Ile Ser Ser Thr Thr Asn Thr Phe Thr Ala Leu Pro Gly Asn 100 105 110 Thr Ile Ser Tyr Thr Gly Phe Asp Leu Gln Ser Val Ser Val Ile Asp 115 120 125 Ile Pro Ser Asp Pro Ser Ile Tyr Ile Glu Gly Arg Tyr Cys Phe Gln 130 135 140 Leu Thr Tyr Cys Lys Ser Lys Arg Asp Cys Leu 145 150 155 <210> 16 <211> 150 <212> PRT <213> Bacillus cytotoxicus <400> 16 Met Gln Lys His Lys Lys Ile Gly Cys Phe Ala Pro Leu Ser Ile Ile 1 5 10 15 Cys Glu Val Pro Cys Pro Pro Pro Pro Pro Ile Ser Asn Ala Glu Phe 20 25 30 Val Thr Asn Glu Phe Ala Gly Asn Phe Leu Ile Thr Asn Asp Thr Phe 35 40 45 Leu Pro Glu Thr Asn Gln Leu Lys Gln Ser Asp Ser Thr Phe Glu Leu 50 55 60 Trp Lys Gly Asp Gly Leu Ser Ser Leu Ser Gly Ser Ile Ser Val Tyr 65 70 75 80 Asn Asn Arg Asn Ser Thr Thr Ala Ile Thr Val Gln Ile Val Gly Glu 85 90 95 Thr Thr Asn Thr Leu Thr Ala Leu Pro Gly Asn Thr Val Ser Tyr Thr 100 105 110 Gly Ser Gly Leu Gln Ser Val Ser Leu Ile Asn Ile Pro Ser Asp Ser 115 120 125 Ser Val Tyr Ile Glu Gly Arg Tyr Cys Cys Gln Ile Thr Tyr Cys Lys 130 135 140 Phe Lys Ser Asp Cys Met 145 150 <210> 17 <211> 155 <212> PRT <213> Bacillus cereus <400> 17 Leu Lys Pro His Lys Asn Ile Gly Cys Phe Ala Pro Leu Ser Ile Ile 1 5 10 15 Cys Gln Pro Thr Cys Pro Cys Pro Pro Pro Ile Ser Pro Pro Glu Arg 20 25 30 Gly Asp Ala Glu Leu Val Thr Asn Glu Phe Ala Gly Asp Ile Leu Ile 35 40 45 Ser Asn Asp Phe Ile Pro Ile Ser Gln Lys Gln Leu Lys Gln Thr Asn 50 55 60 Thr Thr Val Asn Ile Trp Lys Asn Asp Gly Ile Ile Ser Leu Ser Gly 65 70 75 80 Thr Ile Ser Ile Tyr Asn Asn Arg Asn Ser Thr Asn Ala Leu Ser Ile 85 90 95 Gln Ile Ile Ser Ser Thr Thr Asn Thr Phe Thr Val Leu Pro Gly Asn 100 105 110 Thr Ile Ser Tyr Thr Gly Phe Asp Leu Gln Ser Val Ser Val Ile Asp 115 120 125 Ile Pro Ser Asp Pro Ser Ile Tyr Ile Glu Gly Arg Tyr Cys Phe Gln 130 135 140 Leu Thr Tyr Cys Lys Ser Lys Arg Asp Cys Leu 145 150 155 <210> 18 <211> 155 <212> PRT <213> Bacillus wiedmannii <400> 18 Leu Lys Pro His Lys Asn Ile Gly Cys Phe Ala Pro Leu Ser Ile Ile 1 5 10 15 Cys Gln Pro Ile Cys Pro Cys Pro Pro Pro Ile Pro Pro Pro Glu Arg 20 25 30 Cys Asp Ala Glu Leu Ile Thr Asn Glu Phe Ala Gly Asp Ile Leu Ile 35 40 45 Ser Asn Asp Phe Ile Pro Ile Ser Gln Lys Gln Leu Lys Gln Thr Tyr 50 55 60 Ser Thr Val Thr Ile Trp Lys Asn Gly Gly Ile Val Ser Leu Ser Gly 65 70 75 80 Thr Ile Ser Ile Tyr Asn Asn Arg Asn Ser Thr Ser Ala Leu Ser Val 85 90 95 Gln Ile Ile Gly Ser Thr Thr Asn Ile Phe Thr Val Leu Pro Gly Asn 100 105 110 Thr Ile Ser Tyr Thr Gly Phe Asp Leu Leu Ser Val Ser Ile Ile Asp 115 120 125 Ile Pro Ser Asp Pro Ser Ile Tyr Ile Glu Gly Arg Tyr Cys Phe Gln 130 135 140 Leu Thr Tyr Cys Lys Ser Lys Leu Asp Cys Leu 145 150 155 <210> 19 <211> 155 <212> PRT <213> Bacillus wiedmannii <400> 19 Leu Lys Pro His Lys Asn Ile Gly Cys Phe Ala Pro Leu Ser Ile Ile 1 5 10 15 Cys Gln Pro Ile Cys Pro Cys Pro Pro Pro Ile Pro Pro Pro Glu Arg 20 25 30 Cys Asp Ala Glu Leu Ile Thr Asn Glu Phe Ala Gly Asp Ile Leu Ile 35 40 45 Ser Asn Asp Phe Ile Pro Ile Ser Gln Lys Gln Leu Lys Gln Thr Tyr 50 55 60 Ser Thr Val Thr Ile Trp Lys Asn Gly Gly Ile Val Ser Leu Ser Gly 65 70 75 80 Thr Ile Ser Ile Tyr Asn Asn Arg Asn Ser Thr Ser Ala Leu Ser Val 85 90 95 Gln Ile Ile Gly Ser Thr Thr Asn Ile Phe Thr Val Leu Pro Gly Asn 100 105 110 Thr Ile Ser Tyr Thr Gly Phe Asp Leu Leu Ser Val Ser Ile Ile Asp 115 120 125 Ile Pro Ser Asp Pro Ser Ile Tyr Ile Glu Gly Arg Tyr Cys Phe Gln 130 135 140 Leu Thr Tyr Cys Lys Ser Lys Leu Asp Cys Leu 145 150 155 <210> 20 <211> 155 <212> PRT <213> Bacillus luti <400> 20 Leu Lys Pro His Lys Asn Ile Gly Cys Phe Ala Pro Leu Ser Ile Ile 1 5 10 15 Cys Gln Pro Ile Cys Pro Cys Pro Pro Pro Ile Pro Pro Pro Glu Gln 20 25 30 Cys Asp Ala Glu Leu Ile Thr Asn Glu Phe Ala Gly Asn Ile Phe Ile 35 40 45 Ser Asn Asp Phe Ile Ser Val Ala Gln Arg Gln Ser Lys Gln Ile Tyr 50 55 60 Pro Thr Leu Thr Ile Trp Lys Asp Asp Gly Ser Ile Ser Leu Ser Gly 65 70 75 80 Thr Ile Ser Val Tyr Asn Ser Lys Asn Ser Thr Asp Ala Leu Thr Val 85 90 95 Gln Ile Val Ser Asn Asn Thr Asn Thr Phe Thr Val Leu Pro Gly Asn 100 105 110 Thr Ile Ser Tyr Thr Gly Ser Asn Leu Gln Ser Val Ser Ile Ile Asp 115 120 125 Ile Pro Thr Asp Pro Ser Thr Tyr Ile Glu Gly Arg Tyr Cys Phe Gln 130 135 140 Leu Thr Tyr Cys Lys Ser Lys Arg Asp Cys Leu 145 150 155 <210> 21 <211> 126 <212> PRT <213> Bacillus cytotoxicus <400> 21 Met Ala Cys Asn Cys Ser Val Thr Ala Leu Thr Cys Cys Pro Asp Glu 1 5 10 15 Ser Asn Asn Phe Val Gln Asp Lys Val Cys Asn Pro Trp Ser Ser Ser 20 25 30 Glu Ala Ser Thr Phe Thr Val Tyr Gly Asn Asn Ile Asn Gln Asn Ile 35 40 45 Val Gly Thr Gly Tyr Leu Thr Tyr Asp Val Gly Pro Gly Val Ser Pro 50 55 60 Ala Asn Ala Ile Thr Val Asn Val Leu Asp Ser Gly Gly Gly Ile Ile 65 70 75 80 Gln Thr Phe Thr Val Thr Glu Gly Met Ser Val Ala Phe Thr Phe Arg 85 90 95 Arg Phe Asp Val Ile Gln Ile Val Thr Pro Ala Thr Pro Val Gly Thr 100 105 110 Tyr Gln Gly Glu Phe Cys Ile Thr Thr Arg Tyr Val Met Ser 115 120 125 <210> 22 <211> 122 <212> PRT <213> Bacillus wiedmannii <400> 22 Met Ser Cys Glu Cys Ser Gly Ile Ala Leu Thr Cys Cys Pro Asp Lys 1 5 10 15 Asn Tyr Val Gln Asp Lys Val Cys Ser Pro Trp Ser Ala Thr Val Val 20 25 30 Ala Thr Ala Ile Asp Asn Val Leu Tyr Thr Asn Asn Ile Asn Gln Asn 35 40 45 Val Val Gly Thr Gly Phe Val Lys Tyr Asp Val Gly Pro Gly Pro Ile 50 55 60 Thr Val Glu Val Leu Asp Ser Ala Gly Thr Val Leu Asp Thr Gln Thr 65 70 75 80 Leu Asn Pro Gly Thr Ser Ile Gly Phe Thr Tyr Arg Arg Phe Asp Ile 85 90 95 Ile Gln Val Val Leu Pro Ala Thr Pro Ala Gly Thr Tyr Gln Gly Glu 100 105 110 Phe Cys Ile Thr Thr Arg Tyr Pro Leu Ser 115 120 <210> 23 <211> 119 <212> PRT <213> Bacillus manliponensis <400> 23 Met Ser Cys Glu Cys Thr Ser Thr Val Leu Ser Cys Cys Pro Asp Lys 1 5 10 15 Thr Phe Val Gln Asp Lys Val Cys Ser Pro Trp Ser Gly Thr Val Val 20 25 30 Ala Ala Asp Val Thr Val Ile Leu Tyr Thr Asn Asn Ile Asn Gln Thr 35 40 45 Val Val Gly Thr Gly Phe Ile Lys Tyr Asp Val Gly Pro Thr Asp Ile 50 55 60 Thr Val Gln Val Leu Asp Ser Thr Ala Thr Ile Ile Asp Thr Gln Thr 65 70 75 80 Leu Ser Pro Gly Ser Ser Leu Gly Phe Thr Tyr Arg Gln Phe Asn Thr 85 90 95 Ile Gln Val Ile Leu Pro Leu Ala Thr Pro Gly Val Tyr Gln Gly Glu 100 105 110 Phe Cys Ile Thr Ser Arg Tyr 115 <210> 24 <211> 122 <212> PRT <213> Bacillus cereus <400> 24 Met Ser Cys Glu Cys Ser Gly Ala Ala Leu Thr Cys Cys Pro Asp Lys 1 5 10 15 Asn Tyr Val Gln Asp Lys Val Cys Ser Pro Trp Ser Gly Thr Val Val 20 25 30 Ala Thr Ala Ile Thr Asn Val Leu Tyr Asn Asn Asn Ile Asn Gln Asn 35 40 45 Val Ile Gly Thr Gly Phe Val Arg Tyr Asp Val Gly Pro Ala Ala Ile 50 55 60 Thr Leu Thr Val Leu Asp Ser Ala Gly Asn Thr Leu Asp Thr Gln Thr 65 70 75 80 Leu Asn Pro Gly Thr Ser Ile Ala Phe Thr Tyr Arg Arg Phe Glu Thr 85 90 95 Ile Glu Val Thr Leu Pro Ala Ala Thr Ala Gly Thr Tyr Gln Gly Glu 100 105 110 Phe Cys Ile Thr Thr Arg Tyr Pro Leu Ser 115 120 <210> 25 <211> 122 <212> PRT <213> Bacillus cereus <400> 25 Met Ser Cys Glu Cys Ser Gly Ser Ala Leu Thr Cys Cys Pro Asp Lys 1 5 10 15 Asn Tyr Val Gln Asp Lys Val Cys Ser Pro Trp Ser Gly Thr Val Val 20 25 30 Ala Thr Ala Ile Thr Asn Val Leu Tyr Asn Asn Asn Ile Asn Gln Asn 35 40 45 Met Ile Gly Thr Gly Phe Val Arg Tyr Asp Val Gly Pro Ala Pro Ile 50 55 60 Thr Leu Thr Val Leu Asp Ala Ala Gly Ala Thr Ile Asp Thr Gln Thr 65 70 75 80 Leu Asn Pro Gly Thr Ser Ile Ala Phe Thr Tyr Arg Arg Phe Val Thr 85 90 95 Ile Glu Val Thr Leu Pro Ala Ala Thr Ala Gly Thr Tyr Gln Gly Glu 100 105 110 Phe Cys Ile Thr Thr Arg Tyr Pro Leu Ser 115 120 <210> 26 <211> 122 <212> PRT <213> Bacillus anthracis <400> 26 Met Ser Cys Glu Cys Ser Gly Thr Ala Leu Thr Cys Cys Pro Asp Lys 1 5 10 15 Asn Tyr Val Gln Asp Lys Val Cys Ser Pro Trp Ser Ala Thr Val Val 20 25 30 Ala Thr Ala Ile Asp Asn Val Leu Tyr Thr Asn Asn Ile Asn Gln Asn 35 40 45 Val Val Gly Thr Gly Phe Val Lys Tyr Asp Val Gly Pro Gly Pro Ile 50 55 60 Thr Val Glu Ala Leu Asp Ser Ala Gly Thr Val Ile Asp Thr Gln Thr 65 70 75 80 Leu Asn Pro Gly Thr Ser Ile Gly Phe Thr Tyr Arg Arg Phe Asp Ile 85 90 95 Ile Gln Val Val Leu Pro Ala Thr Pro Ala Gly Thr Tyr Gln Gly Glu 100 105 110 Phe Cys Ile Thr Thr Arg Tyr Pro Leu Ser 115 120 <210> 27 <211> 122 <212> PRT <213> Bacillus toyonensis <400> 27 Met Ser Cys Glu Cys Ser Gly Ser Ala Leu Thr Cys Cys Pro Asp Lys 1 5 10 15 Asn Tyr Val Gln Asp Lys Val Cys Ser Pro Trp Ser Ala Thr Val Val 20 25 30 Val Thr Ala Ile Asp Asn Val Leu Tyr Thr Asn Asn Ile Asn Gln Asn 35 40 45 Val Ile Gly Thr Gly Phe Val Lys Tyr Asp Val Gly Pro Gly Pro Ile 50 55 60 Thr Val Glu Ala Leu Asp Ser Ala Gly Ala Thr Ile Asp Thr Gln Thr 65 70 75 80 Leu Asn Pro Gly Thr Ser Ile Ala Phe Thr Tyr Arg Arg Phe Asp Ser 85 90 95 Ile Gln Val Val Leu Pro Ala Thr Pro Ala Gly Thr Tyr Gln Gly Glu 100 105 110 Phe Cys Ile Thr Thr Arg Tyr Pro Leu Ser 115 120 <210> 28 <211> 122 <212> PRT <213> Bacillus mycoides <400> 28 Met Ser Cys Glu Cys Ser Gly Ser Ala Leu Thr Cys Cys Pro Asp Lys 1 5 10 15 Asn Tyr Val Gln Asp Lys Val Cys Ser Pro Trp Ser Ala Thr Val Val 20 25 30 Ala Thr Ala Ile Asp Asn Val Leu Tyr Thr Asn Asn Ile Asn Gln Asn 35 40 45 Val Ile Gly Thr Gly Phe Val Lys Tyr Asp Val Gly Pro Gly Pro Ile 50 55 60 Thr Val Glu Ala Leu Asp Ser Ala Gly Ala Thr Ile Asp Thr Gln Thr 65 70 75 80 Leu Asn Pro Gly Thr Ser Ile Ala Phe Thr Tyr Arg Arg Phe Asp Ser 85 90 95 Ile Gln Val Val Leu Pro Ala Thr Pro Ala Gly Thr Tyr Gln Gly Glu 100 105 110 Phe Cys Ile Thr Thr Arg Tyr Ser Leu Ser 115 120 <210> 29 <211> 117 <212> PRT <213> Bacillus cytotoxicus <400> 29 Met Glu Asn Tyr Ser Ala Asn Leu Ser Cys Cys Ala Asn Ser Gln Lys 1 5 10 15 Asn Ile Val Gln Asp Lys Val Cys Ile Asn Trp Thr Ala Ser Ala Ala 20 25 30 Pro Ala Ile Ile Tyr Ala Asp Asn Ile Ala Gln Asp Ile Tyr Ala Ser 35 40 45 Gly Tyr Leu Lys Val Asp Thr Gly Thr Gly Pro Val Thr Leu Val Phe 50 55 60 Tyr Ser Gly Gly Ile Gly Gly Thr Ala Val Glu Thr Ile Thr Val Ala 65 70 75 80 Thr Gly Ser Gly Ala Ser Phe Thr Val Arg Arg Phe Asp Thr Val Thr 85 90 95 Ile Leu Gly Thr Ala Ser Ala Glu Thr Gly Glu Phe Cys Met Thr Ile 100 105 110 Arg Tyr Thr Leu Ile 115 <210> 30 <211> 113 <212> PRT <213> Bacillus wiedmannii <400> 30 Leu Thr Cys Cys Pro Asp Lys Asn Tyr Val Gln Asp Lys Val Cys Ser 1 5 10 15 Pro Trp Ser Ala Thr Val Val Ala Thr Ala Ile Asp Asn Val Leu Tyr 20 25 30 Thr Asn Asn Ile Asn Gln Asn Val Val Gly Thr Gly Phe Val Lys Tyr 35 40 45 Asp Val Gly Pro Gly Pro Ile Thr Val Glu Val Leu Asp Ser Ala Gly 50 55 60 Thr Val Leu Asp Thr Gln Thr Leu Asn Pro Gly Thr Ser Ile Gly Phe 65 70 75 80 Thr Tyr Arg Arg Phe Asp Ile Ile Gln Val Val Leu Pro Ala Thr Pro 85 90 95 Ala Gly Thr Tyr Gln Gly Glu Phe Cys Ile Thr Thr Arg Tyr Pro Leu 100 105 110 Ser <210> 31 <211> 114 <212> PRT <213> Bacillus manliponensis <400> 31 Met Gly Ser Asn Tyr Ser Gly Leu Ser Cys Cys Ser Asn Lys Thr Ile 1 5 10 15 Val Gln Asp Lys Val Cys Leu Asp Trp Ser Ile Asp Gly Thr Gly Ala 20 25 30 Val Val Val Tyr Thr Asn Asn Val Thr Gln Glu Ile Val Ala Ser Gly 35 40 45 Tyr Val Lys Tyr Asp Val Gly Val Gly Asp Ile Thr Val Glu Phe Leu 50 55 60 Val Gly Thr Thr Pro Val Glu Thr Leu Thr Ile Ser Pro Gly Ser Ser 65 70 75 80 Ala Ala Phe Thr Val Arg Arg Phe Thr Asp Ile Glu Ile Thr Thr Ala 85 90 95 Gly Val Gly Glu His Gln Gly Glu Phe Cys Ile Thr Leu Arg Tyr Pro 100 105 110 Ile Ser <210> 32 <211> 112 <212> PRT <213> Bacillus cereus <400> 32 Met Gly Asn Ser Ser Leu Ser Cys Cys Ser Asn Asn Thr Leu Val Gln 1 5 10 15 Asp Gln Val Cys Ile Asp Trp Ser Ala Thr Gly Ala Val Thr Glu Thr 20 25 30 Val Tyr Thr Asn Asn Ile Thr Gln Asp Leu Tyr Ala Ser Gly Tyr Val 35 40 45 Lys Tyr Asp Val Gly Thr Ala Pro Ile Thr Val Asn Phe Leu Val Gly 50 55 60 Ala Thr Val Val Asn Thr Ile Thr Val Gln Pro Gln Ser Ser Gly Ser 65 70 75 80 Phe Thr Val Arg Tyr Phe Thr Thr Ile Gln Ile Val Thr Thr Gly Thr 85 90 95 Gly Val Ser Gln Gly Gln Leu Cys Leu Thr Val Arg Tyr Pro Ile Ser 100 105 110 <210> 33 <211> 110 <212> PRT <213> Bacillus thuringiensis <400> 33 Asn Ser Asn Leu Ser Cys Cys Ser Ser Lys Thr Leu Val Gln Asp Gln 1 5 10 15 Val Cys Ile Asp Trp Ala Ala Thr Gly Ala Val Thr Glu Thr Val Tyr 20 25 30 Thr Asn Asn Ile Thr Gln Asp Leu Tyr Ala Ser Gly Tyr Val Lys Tyr 35 40 45 Asp Val Gly Thr Ala Pro Ile Thr Val Asn Phe Leu Val Gly Ala Thr 50 55 60 Val Val Asn Thr Ile Thr Val Gln Pro Gln Ser Ser Gly Ser Phe Thr 65 70 75 80 Val Arg Tyr Phe Thr Thr Ile Gln Ile Val Thr Thr Gly Thr Gly Val 85 90 95 Ser Gln Gly Gln Leu Cys Leu Thr Val Arg Tyr Pro Ile Ser 100 105 110 <210> 34 <211> 111 <212> PRT <213> Bacillus mycoides <400> 34 Cys Asn Ser Asn Leu Ser Cys Cys Ser Asn Lys Thr Leu Val Gln Asp 1 5 10 15 Gln Val Cys Ile Asp Trp Ser Ala Thr Gly Ala Val Thr Glu Thr Val 20 25 30 Tyr Thr Asn Asn Ile Thr Gln Asp Leu Tyr Ala Ser Gly Tyr Val Lys 35 40 45 Tyr Asp Val Gly Val Asn Pro Val Thr Val Asn Phe Leu Val Gly Ala 50 55 60 Thr Val Val Asn Thr Ile Thr Ile Gln Pro Gln Ser Ser Gly Ser Phe 65 70 75 80 Thr Val Arg Tyr Phe Thr Thr Ile Gln Ile Val Thr Thr Gly Ile Gly 85 90 95 Thr Ser Gln Gly Gln Leu Cys Leu Thr Val Arg Tyr Pro Ile Ser 100 105 110 <210> 35 <211> 114 <212> PRT <213> Bacillus anthracis <400> 35 Met Gly Met Arg Ser Ser Ser Leu Ser Cys Cys Ser Asn Lys Thr Leu 1 5 10 15 Val Gln Asp Gln Val Cys Thr Asp Trp Ser Ile Thr Gly Ala Gly Thr 20 25 30 Gln Ile Val Tyr Thr Asn Asn Ile Ala Gln Glu Val Tyr Gly Ser Gly 35 40 45 Tyr Val Lys Tyr Asp Val Gly Thr Ala Pro Ile Thr Val Asp Phe Leu 50 55 60 Val Gly Ala Thr Val Val Asp Thr Ile Thr Val Gln Pro Gln Ser Ser 65 70 75 80 Gly Thr Phe Thr Val Arg Tyr Phe Thr Thr Val Arg Ile Thr Thr Thr 85 90 95 Gly Thr Thr Val Asn Gln Gly Glu Phe Cys Ile Thr Val Arg Tyr Pro 100 105 110 Ile Ser <210> 36 <211> 114 <212> PRT <213> Bacillus toyonensis <400> 36 Met Gly Met Arg Ser Ser Ser Leu Ser Cys Cys Ser Asn Lys Thr Leu 1 5 10 15 Val Gln Asp Gln Val Cys Thr Asp Trp Ser Ile Thr Gly Ala Gly Thr 20 25 30 Gln Ile Val Tyr Thr Asn Asn Ile Thr Gln Glu Val Tyr Gly Ser Gly 35 40 45 Tyr Val Lys Tyr Asp Val Gly Ala Asn Pro Ile Thr Val Asp Phe Leu 50 55 60 Val Gly Ala Thr Val Val Asp Thr Ile Thr Val Gln Pro Gln Ser Ser 65 70 75 80 Gly Thr Phe Thr Ile Arg Tyr Phe Thr Thr Ile Arg Ile Thr Thr Thr 85 90 95 Gly Thr Thr Val Ser Gln Gly Glu Phe Cys Ile Thr Val Arg Tyr Pro 100 105 110 Ile Ser <210> 37 <211> 114 <212> PRT <213> Bacillus mycoides <400> 37 Met Gly Met Arg Ser Ser Ser Leu Ser Cys Cys Ser Asn Lys Thr Leu 1 5 10 15 Val Gln Asp Gln Val Cys Thr Asp Trp Ser Ile Thr Gly Ala Gly Asn 20 25 30 Gln Ile Val Tyr Thr Asn Asn Leu Thr Gln Glu Ile Tyr Gly Ser Gly 35 40 45 Tyr Val Lys Tyr Asp Thr Gly Ala Asn Pro Ile Thr Val Asp Phe Leu 50 55 60 Val Gly Ala Thr Val Val Asp Thr Ile Thr Val Gln Pro Gln Ser Ser 65 70 75 80 Gly Thr Phe Thr Val Arg His Phe Thr Thr Val Arg Ile Thr Thr Thr 85 90 95 Gly Thr Thr Val Asn Gln Gly Glu Phe Cys Ile Thr Val Arg Tyr Ser 100 105 110 Ile Ser <210> 38 <211> 150 <212> PRT <213> Bacillus cytotoxicus <400> 38 Met Gln Lys His Lys Lys Ile Gly Cys Phe Ala Pro Leu Ser Ile Ile 1 5 10 15 Cys Glu Val Pro Cys Pro Pro Pro Pro Pro Ile Ser Asn Ala Glu Phe 20 25 30 Val Thr Asn Glu Phe Val Gly Asn Phe Leu Ile Thr Asn Asp Thr Phe 35 40 45 Leu Pro Glu Thr Asn Gln Leu Lys Gln Ser Asp Ser Thr Phe Glu Leu 50 55 60 Trp Lys Gly Asp Gly Leu Ser Ser Leu Ser Gly Ser Ile Ser Val Tyr 65 70 75 80 Asn Asn Arg Asn Ser Thr Thr Ala Ile Thr Val Gln Ile Val Gly Glu 85 90 95 Thr Thr Asn Thr Leu Thr Ala Leu Pro Gly Asn Thr Val Ser Tyr Thr 100 105 110 Gly Ser Gly Leu Gln Ser Val Ser Leu Ile Asn Ile Pro Ser Asp Pro 115 120 125 Ser Val Tyr Ile Glu Gly Arg Tyr Cys Cys Gln Ile Thr Tyr Cys Lys 130 135 140 Phe Lys Ser Asp Cys Met 145 150 <210> 39 <211> 135 <212> PRT <213> Bacillus thuringiensis <400> 39 Lys Lys Asn Ile Gly Cys Tyr Ala Pro Leu Ser Ile Ile Cys Pro Pro 1 5 10 15 Tyr Asp Pro Pro Asn Pro Pro Glu Pro Pro Gly Cys Glu Leu Ile Thr 20 25 30 Asn Glu Phe Ala Gly Asn Phe Leu Ile Thr Lys Glu Ile Pro Pro Pro 35 40 45 Ser Glu Asn Pro Thr Leu Ile Leu Trp Glu Gly Asp Gly Val Val Lys 50 55 60 Ile Ser Gly Thr Ile Ser Val Tyr Asn Ser Thr Ser Ser Thr Ala Gly 65 70 75 80 Ile Thr Val Gln Ile Ile Gly Lys Val Thr Asn Thr Phe Thr Val Tyr 85 90 95 Pro Gly Asn Thr Met Ser Tyr Thr Gly Gln Ser Leu Gln Ser Val Ala 100 105 110 Ile Ile Asp Ile Pro Asn Asn Pro Thr Arg Tyr Met Glu Gly Lys Tyr 115 120 125 Cys Cys Gln Phe Ser Phe Cys 130 135 <210> 40 <211> 135 <212> PRT <213> Bacillus mycoides <400> 40 Lys Lys Asn Ile Gly Cys Tyr Ala Pro Leu Ser Ile Ile Cys Pro Pro 1 5 10 15 Tyr Asp Pro Pro Lys Pro Pro Lys Pro Pro Ser Cys Glu Leu Val Thr 20 25 30 Asn Glu Phe Ala Gly Asn Phe Phe Ile Thr Lys Glu Ile Pro Pro Pro 35 40 45 Ser Glu Asn Ser Thr Leu Val Leu Trp Glu Gly Asp Gly Leu Leu Lys 50 55 60 Ile Ser Gly Thr Ile Ser Val Tyr Asn Ser Thr Ser Ser Thr Gly Gly 65 70 75 80 Ile Thr Val Gln Ile Ile Gly Gln Val Thr Asn Thr Phe Thr Val Tyr 85 90 95 Pro Gly Asn Thr Met Ser Tyr Thr Gly Gln Ser Leu Gln Ser Val Thr 100 105 110 Ile Val Asn Ile Pro Asn Asn Pro Ile Gln Tyr Ile Glu Gly Lys Tyr 115 120 125 Cys Cys Gln Phe Ser Phe Cys 130 135 <210> 41 <211> 135 <212> PRT <213> Bacillus wiedmannii <400> 41 Lys Lys Asn Ile Gly Cys Tyr Ala Pro Leu Ser Ile Ile Cys Pro Pro 1 5 10 15 Tyr Asp Pro Pro Asn Pro Pro Asn Pro Ser Ser Cys Glu Leu Val Asn 20 25 30 Asn Glu Phe Ala Gly Asn Phe Phe Ile Thr Lys Glu Ile Pro Pro Pro 35 40 45 Ser Glu Ser Ser Thr Leu Ile Leu Trp Glu Gly Asp Gly Val Leu Lys 50 55 60 Ile Ser Gly Thr Ile Ser Val Tyr Asn Ser Thr Ser Ser Thr Glu Ala 65 70 75 80 Val Thr Val Gln Ile Ile Gly Gln Val Thr Asn Thr Phe Thr Val Tyr 85 90 95 Pro Gly Asn Thr Met Ser Tyr Thr Gly Gln Ser Leu Gln Ser Leu Ala 100 105 110 Ile Ile Asp Ile Pro Asn Asn Pro Thr Arg Tyr Met Glu Gly Lys Tyr 115 120 125 Cys Cys Gln Phe Ser Phe Cys 130 135 <210> 42 <211> 135 <212> PRT <213> Bacillus pacificus <400> 42 Lys Lys Asn Ile Gly Cys Tyr Ala Pro Leu Ser Ile Ile Cys Pro Pro 1 5 10 15 Tyr Asp Pro Pro Thr Pro Pro Asp Pro Pro Ser Cys Glu Leu Val Asn 20 25 30 Asn Glu Phe Ala Gly Asn Phe Phe Ile Thr Lys Glu Ile Pro Pro Pro 35 40 45 Ser Glu Gly Ser Thr Leu Ile Leu Trp Glu Gly Asp Gly Val Leu Lys 50 55 60 Ile Ser Gly Asn Ile Ser Val Tyr Asn Ser Thr Ser Ser Thr Glu Ala 65 70 75 80 Val Thr Val Gln Ile Ile Gly Gln Val Thr Asn Thr Phe Thr Val Tyr 85 90 95 Pro Gly Asn Thr Met Ser Tyr Thr Gly Gln Ser Leu Gln Ser Val Ala 100 105 110 Ile Ile Asn Leu Pro Asn Asn Pro Ile Arg Tyr Ile Glu Gly Lys Tyr 115 120 125 Cys Cys Gln Phe Ser Phe Cys 130 135 <210> 43 <211> 134 <212> PRT <213> Bacillus thuringiensis <400> 43 Lys Asn Ile Gly Cys Tyr Ala Pro Leu Ser Ile Ile Cys Pro Pro Tyr 1 5 10 15 Asp Pro Pro Asp Pro Pro Asn Pro Pro Ser Cys Glu Leu Val Thr Asn 20 25 30 Glu Phe Ala Gly Asn Phe Phe Ile Thr Lys Glu Ile Pro Pro Pro Ser 35 40 45 Lys Ser Pro Thr Leu Thr Leu Trp Glu Gly Asp Gly Ile Leu Lys Ile 50 55 60 Ser Gly Thr Ile Ser Val Tyr Asn Ser Thr Ser Ser Thr Glu Ala Val 65 70 75 80 Thr Val Gln Ile Ile Gly Gln Val Thr Asn Ala Phe Thr Val Tyr Pro 85 90 95 Gly Asn Thr Met Ser Tyr Thr Gly Gln Ser Leu Gln Ser Met Thr Ile 100 105 110 Ile Asn Ile Pro His Asn Pro Thr Arg Tyr Ile Glu Gly Lys Tyr Cys 115 120 125 Cys Gln Phe Ser Phe Cys 130 <210> 44 <211> 143 <212> PRT <213> Bacillus mycoides <400> 44 Lys Lys Asn Ile Gly Cys Tyr Ala Pro Leu Ser Ile Ile Cys Pro Pro 1 5 10 15 Tyr Pro Pro Pro Asn Pro Pro Glu Pro Pro Gly Cys Glu Leu Val Met 20 25 30 Asn Glu Phe Ala Gly Asn Phe Phe Ile Thr Asn Glu Ile Pro Leu Pro 35 40 45 Pro Lys Glu Asn Pro Asn Pro Phe Arg Thr Leu Pro Leu Trp Glu Gly 50 55 60 Asp Gly Val Leu Lys Ile Ser Gly Thr Ile Ser Ile Tyr Asn Ser Thr 65 70 75 80 Ser Ser Thr Gly Glu Val Thr Val Gln Ile Val Gly Gln Val Thr Ser 85 90 95 Thr Phe Ile Phe Tyr Pro Gly Asn Thr Met Ser Tyr Thr Gly Lys Ser 100 105 110 Leu Gln Ser Val Thr Ile Ile Asn Ile Pro Asn Thr Pro Thr Gln Tyr 115 120 125 Ile Glu Gly Lys Tyr Cys Cys Gln Phe Ser Phe Cys Leu Asn Arg 130 135 140 <210> 45 <211> 136 <212> PRT <213> Bacillus anthracis <400> 45 Lys Asn Ile Gly Cys Phe Ala Pro Leu Ser Ile Ile Cys Pro Asp Pro 1 5 10 15 Cys Pro Ser Thr Pro Pro Pro Asn Pro Asn Cys Glu Arg Val Thr Asn 20 25 30 Glu Phe Ala Gly Asn Phe Leu Ile Thr Lys Asn Thr Met Pro Ser Ala 35 40 45 Lys Gly Ala Ser Gln Ser Met Ile Leu Trp Gln Ser Asp Gly Ile Leu 50 55 60 Leu Ile Ser Gly Thr Val Ser Val Tyr Asn Ser Thr Ser Ser Thr Glu 65 70 75 80 Ala Ile Thr Ile Glu Ile Val Gly Ala Val Thr Asn Ile Phe Thr Met 85 90 95 Phe Pro Gly Asn Thr Ile Ser Tyr Thr Gly Lys Asp Leu Gln Ser Val 100 105 110 Ser Ile Ala Asn Ile Gln His Asn Pro Ser Leu Tyr Leu Glu Gly Lys 115 120 125 Tyr Cys Cys Gln Phe Thr Cys Cys 130 135 <210> 46 <211> 136 <212> PRT <213> Bacillus wiedmannii <400> 46 Lys Asn Ile Gly Cys Phe Ala Pro Leu Ser Ile Ile Cys Pro Asp Pro 1 5 10 15 Cys Pro Pro Pro Pro Pro Pro Asn Pro Ser Cys Glu Arg Val Thr Asn 20 25 30 Glu Phe Ala Gly Asn Phe Leu Ile Thr Asn Asn Thr Ile Ser Ser Val 35 40 45 Lys Asp Thr Ser Gln Ser Met Ile Leu Trp Gln Ser Asp Gly Ile Leu 50 55 60 Leu Ile Ser Gly Thr Val Ser Val Tyr Asn Ser Thr Ser Ser Thr Glu 65 70 75 80 Ala Ile Thr Ile Glu Ile Val Gly Ala Val Thr Asn Ile Phe Thr Val 85 90 95 Phe Pro Gly Asn Thr Ile Ser Tyr Thr Gly Lys Asn Leu Gln Ser Val 100 105 110 Ser Ile Thr Asn Ile Gln Asn Asn Pro Ser Leu Tyr Leu Glu Gly Lys 115 120 125 Tyr Cys Cys Gln Phe Thr Cys Cys 130 135 <210> 47 <211> 145 <212> PRT <213> Bacillus manliponensis <400> 47 Leu Ser Asn Arg Lys Arg Ile Gly Cys Phe Ala Pro Leu Gly Met Asn 1 5 10 15 Cys Tyr Pro Pro Ser Pro Pro Leu Phe Pro Pro Pro Lys Pro Ile Glu 20 25 30 Thr Glu Leu Ile Thr Asn Glu Phe Cys Gly Asn Phe Leu Val Thr Asp 35 40 45 Gln Pro Leu Pro Ser Arg Glu Thr Leu Glu Leu Trp Gln Arg Asp Glu 50 55 60 Thr Ser Leu Ile Thr Gly Thr Val Ser Ile Tyr Asn Ser Ser Asn Ser 65 70 75 80 Thr His Pro Val Ser Ile Gln Ile Ile Asp Lys Ile Ala His Gln Phe 85 90 95 Ile Val Phe Pro Gly Asn Thr Thr Ser Phe Thr Gly Asn Ala Leu Gln 100 105 110 Ser Ile Ser Ile Ile Asp Ile Pro Asn Asp Ser Pro Leu Tyr Ile Glu 115 120 125 Gly Lys Tyr Cys Cys Gln Phe Thr Tyr Cys Arg Lys Lys Met Asn Cys 130 135 140 Met 145 <210> 48 <211> 140 <212> PRT <213> Bacillus mycoides <400> 48 Leu Asn Lys Lys Lys Gln Ile Gly Cys Tyr Ala Pro Leu Glu Leu Ser 1 5 10 15 Cys His Pro Ile Tyr Pro Pro Cys Pro Pro Gln Pro Asn Pro Gly Cys 20 25 30 Glu Leu Val Ser Asn Glu Phe Ser Gly Asn Phe Leu Val Arg Asp Gly 35 40 45 Gln Val Gln Thr Leu Gln Leu Trp Lys Ser Asp Gly Ile Thr Ser Ile 50 55 60 Ser Gly Thr Ile Ser Val Tyr Asn Ser Ser Asn Ser Thr Asp Pro Ala 65 70 75 80 Thr Ile Val Ile Ser Gly Ile Ser Thr Thr Thr Leu Ile Val Leu Pro 85 90 95 Gly Asn Thr Ser Ser Phe Thr Gly Thr Asp Leu Gln Ser Val Glu Met 100 105 110 Ile Asp Ile Pro Asn Thr Ser Leu Ser Tyr Leu Glu Gly Lys Tyr Cys 115 120 125 Cys Gln Phe Thr Tyr Cys His Ser Lys Ser Asn Ala 130 135 140 <210> 49 <211> 113 <212> PRT <213> Bacillus cereus <400> 49 Met Ala Gln Ile Gly Asn Cys Cys Thr Glu Gln Leu Cys Cys Val Asn 1 5 10 15 Asp Ala Val Cys Cys Thr Ile Ile Leu Asp Asp Thr Gly Gly Thr Ala 20 25 30 Leu Pro Ile Trp Asp Asp Ala Thr Thr Phe Val Ile Asn Gly Thr Ile 35 40 45 Met Val Glu Asn Asn Gly Thr Val Gly Val Gly Pro Thr Ala Ala Leu 50 55 60 Thr Val Asn Gly Thr Ala Val Gly Gly Phe Val Val Ala Pro Gly Glu 65 70 75 80 Arg Ser Ile Thr Met Asn Asp Ile Asn Ser Ile Ala Ile Val Gly Ala 85 90 95 Gly Thr Gly Thr Ser Ser Val Lys Ile Ser Phe Ser Ile Asn Tyr Lys 100 105 110 Phe <210> 50 <211> 112 <212> PRT <213> Bacillus sp. ms-22 <400> 50 Met Leu Gly Gly Cys Ser Asn Glu Gln Ala Gly Phe Val Asn Asp Ala 1 5 10 15 Val Cys Phe Thr Leu Asp Leu Ala Ala Ala Ala Asp Ala Val Val Val 20 25 30 Trp Thr Asp Gly Thr Pro Tyr Val Ile Asn Gly Thr Ile Met Gly Glu 35 40 45 Asn Asn Gly Ile Val Ala Val Ala Pro Thr Val Thr Leu Glu Ile Asn 50 55 60 Gly Thr Ala Val Pro Asp Phe Thr Val Pro Pro Gly Glu Ser Arg Ser 65 70 75 80 Ile Thr Leu Ser Asp Leu Asn Ser Ile Gly Ile Val Ala Thr Gly Gly 85 90 95 Thr Ser Thr Gly Asn Ile Val Val Ser Phe Ser Leu Asn Tyr Gln Tyr 100 105 110 <210> 51 <211> 114 <212> PRT <213> Bacillus sp. LLTC93 <400> 51 Met Ala Ile Leu Gly Gly Cys Ser Asn Glu Gln Thr Gly Phe Val Asn 1 5 10 15 Asp Ala Val Cys Phe Thr Val Asp Leu Ala Ala Ala Ala Asp Ala Val 20 25 30 Val Val Trp Thr Asp Gly Thr Pro Phe Val Ile Asn Gly Thr Ile Met 35 40 45 Val Glu Asn Asn Gly Ile Val Ala Val Ala Pro Thr Val Thr Leu Glu 50 55 60 Val Asn Gly Thr Ala Val Pro Asp Phe Thr Val Pro Pro Gly Glu Ser 65 70 75 80 Arg Ser Ile Thr Leu Asn Asp Ile Asn Ser Ile Gly Ile Val Gly Thr 85 90 95 Gly Gly Thr Ser Thr Gly Asn Ile Val Val Ser Phe Ser Leu Asn Tyr 100 105 110 Gln Tyr <210> 52 <211> 115 <212> PRT <213> Bacillus pumilus <400> 52 Met Ala Ile Leu Gly Gly Cys Ser Asn Glu Gln Thr Gly Phe Val Asn 1 5 10 15 Asp Ala Val Cys Phe Thr Val Asp Leu Gly Ala Thr Ala Pro Asp Ala 20 25 30 Val Val Val Trp Thr Asp Gly Thr Pro Phe Val Ile Asn Gly Thr Ile 35 40 45 Met Val Glu Asn Asn Gly Ile Ala Ala Val Ala Pro Thr Val Ser Leu 50 55 60 Gln Val Asn Asp Ala Ala Val Pro Gly Phe Thr Val Pro Pro Gly Glu 65 70 75 80 Ser Arg Ser Ile Thr Leu Asn Asp Ile Asn Ser Ile Gly Ile Ile Gly 85 90 95 Thr Gly Gly Thr Ser Thr Gly Asn Ile Val Val Ser Phe Ser Leu Asn 100 105 110 Tyr Gln Tyr 115 <210> 53 <211> 115 <212> PRT <213> Bacillus atrophaeus <400> 53 Met Ala Met Leu Gly Gly Cys Ser Asn Glu Gln Met Gly Phe Val Asn 1 5 10 15 Asp Ala Val Cys Phe Thr Ile Asp Leu Gly Asp Thr Gly Ala Val Ala 20 25 30 Thr Pro Val Trp Glu Asp Gly Thr Ser Phe Val Ile Asn Gly Thr Ile 35 40 45 Met Val Glu Asn Asn Gly Ile Val Gly Val Gly Pro Thr Ala Ser Leu 50 55 60 Thr Val Asn Gly Thr Ala Val Ala Gly Phe Thr Val Ala Pro Gly Glu 65 70 75 80 Ser Arg Ser Ile Thr Leu Asn Asp Ile Asn Ser Ile Gly Ile Val Gly 85 90 95 Thr Gly Gly Thr Gly Thr Ala Asn Val Thr Val Ser Phe Ser Leu Asn 100 105 110 Tyr Gln Tyr 115 <210> 54 <211> 116 <212> PRT <213> Peribacillus psychrosaccharolyticus <400> 54 Met Ala Gln Ile Gly Ser Cys Asn Gly Glu Gln Leu Val Gly Val Asn 1 5 10 15 Asp Ser Val Cys Leu Thr Leu Glu Leu Asp Asp Ala Val Ala Pro Thr 20 25 30 Val Val Trp Thr Asp Val Thr Pro Tyr Val Ile Asn Gly Thr Ile Met 35 40 45 Ile Glu Asn Asn Gly Ile Val Gly Val Gly Gln Asp Ala Ala Leu Ser 50 55 60 Val Asn Gly Thr Ala Ile Ala Asp Phe Val Val Val Pro Gly Glu Ala 65 70 75 80 Arg Ser Ile Thr Leu Asp Asn Ile Asn Ser Ile Ser Leu Leu Gly Ser 85 90 95 Gly Gly Glu Ala Gly Ala Ser Ser Ser Val Asn Val Ala Phe Ser Leu 100 105 110 Asn Tyr Lys Phe 115 <210> 55 <211> 115 <212> PRT <213> Amphibacillus marinus <400> 55 Met Ala Gln Leu Gly Ser Cys Cys Gly Asp Glu Leu Val Gly Val Asn 1 5 10 15 Asp Ala Val Cys Phe Thr Val Asp Leu Glu Ala Thr Gly Glu Gly Ala 20 25 30 Asp Leu Ile Leu Trp Glu Asp Glu Thr Ser Phe Ile Ile Asn Gly Ser 35 40 45 Ile Met Val Glu Asn Asn Gly Ile Ile Gly Ala Ser Pro Thr Ala Ala 50 55 60 Leu Thr Val Asn Gly Ala Ala Ile Pro Gly Phe Thr Val Ala Pro Gly 65 70 75 80 Glu Ala Arg Ser Ile Thr Leu Asn Asp Ile Glu Thr Ile Gly Leu Thr 85 90 95 Gly Thr Gly Thr Gly Thr Gly Ser Val Lys Val Ser Phe Ser Ile Asn 100 105 110 Tyr Lys Tyr 115 <210> 56 <211> 115 <212> PRT <213> Bacillus cereus <400> 56 Met Ala Leu Leu Gly Gly Cys Ser Asp Met Ser Val Ser Ser Val Asn 1 5 10 15 Asp Ala Val Cys Phe Thr Ile Thr Leu Glu Asp Thr Thr Ala Gly Thr 20 25 30 Pro Val Glu Val Trp Glu Asp Ser Thr Gly Phe Ala Ile Asn Gly Thr 35 40 45 Ile Met Ile Glu Asn Asn Gly Ile Thr Glu Thr Ser Pro Thr Ala Ser 50 55 60 Leu Leu Val Asn Asp Thr Glu Val Thr Gly Phe Thr Val Ala Pro Gly 65 70 75 80 Glu Ser Arg Ala Ile Thr Leu Asp Asn Leu Asn Ser Ile Gly Ile Ser 85 90 95 Gly Ala Gly Thr Gly Ser Ser Ala Val Lys Val Ser Phe Ser Leu Asn 100 105 110 Tyr Lys Phe 115 <210> 57 <211> 116 <212> PRT <213> Bacillus endophyticus <400> 57 Met Ala Gln Leu Gly Gly Cys Ser Ser Asp Glu Leu Gly Val Val Asn 1 5 10 15 Asp Ala Val Cys Val Thr Ile Asp Leu Pro Val Thr Thr Val Gly Thr 20 25 30 Pro Ile Pro Val Trp Thr Asp Thr Ser Thr Phe Ala Ile Asn Gly Thr 35 40 45 Ile Val Val Glu Asn Asn Gly Thr Val Gly Ile Ser Pro Thr Ala Ser 50 55 60 Leu Glu Val Asn Gly Thr Ala Val Thr Asp Phe Thr Val Gly Pro Gly 65 70 75 80 Glu Ala Gln Ser Ile Thr Leu Asn Asn Ile Glu Ser Ile Ala Ile Ala 85 90 95 Gly Thr Gly Gly Thr Gly Thr Ala Ile Val Lys Val Ala Phe Ser Leu 100 105 110 Asn Tyr Lys Phe 115 <210> 58 <211> 114 <212> PRT <213> Peribacillus loiseleuriae <400> 58 Met Ala Gln Ile Gly Asn Cys Cys Ser Glu Gln Leu Val Gly Val Asn 1 5 10 15 Asp Ala Leu Cys Phe Thr Ile Asp Leu Ala Asp Thr Ala Thr Asp Thr 20 25 30 Ile Asp Leu Trp Asn Asn Asn Thr Thr Phe Val Ile Asn Gly Thr Ile 35 40 45 Met Val Glu Asn Asn Gly Ile Asn Gly Val Thr Thr Thr Ala Thr Leu 50 55 60 Met Val Asn Gly Thr Ala Val Thr Gly Phe Thr Val Gly Pro Gly Glu 65 70 75 80 Ala Met Ser Val Thr Met Asn Asn Ile Asn Ser Ile Gly Leu Val Gly 85 90 95 Ala Gly Thr Gly Thr Ala Ser Val Lys Val Ser Phe Ser Leu Asn Tyr 100 105 110 Lys Phe <210> 59 <211> 118 <212> PRT <213> Bacillus cereus <400> 59 Met Ala Gln Ile Gly Asn Cys Cys Asn Asp Gln Leu Val Gly Val Asn 1 5 10 15 Asp Ala Leu Cys Phe Thr Ile Val Leu Asp Asp Thr Asn Gly Thr Ala 20 25 30 Ile Asp Leu Trp Asn Asp Ala Thr Thr Phe Val Ile Asn Gly Thr Ile 35 40 45 Met Val Glu Asn Asn Gly Thr Ile Gly Val Ala Pro Thr Ala Ser Leu 50 55 60 Thr Val Asn Gly Thr Pro Val Gly Gly Phe Ile Val Gly Pro Gly Glu 65 70 75 80 Ala Arg Ser Ile Thr Met Asn Asp Ile Asn Ser Ile Gly Ile Val Gly 85 90 95 Ala Gly Gly Thr Pro Val Gly Ser Thr Ala Asn Val Lys Val Ser Phe 100 105 110 Ser Leu Asn Tyr Lys Phe 115 <210> 60 <211> 118 <212> PRT <213> Peribacillus loiseleuriae <400> 60 Met Ala Gln Ile Gly Asn Cys Cys Asn Asp Ser Leu Val Gly Val Asn 1 5 10 15 Asp Ala Leu Cys Phe Thr Ile Asp Ile Ala Asp Thr Asp Gly Thr Pro 20 25 30 Leu Val Leu Trp Asn Asp Ala Thr Thr Phe Val Ile Asn Gly Thr Ile 35 40 45 Met Val Glu Asn Asn Gly Thr Ile Gly Val Ser Pro Thr Ala Ala Leu 50 55 60 Thr Val Asn Gly Thr Pro Ile Ala Gly Phe Ile Val Gly Pro Gly Glu 65 70 75 80 Ala Lys Ser Val Thr Leu Asn Asp Ile Asn Ser Ile Gly Ile Ile Gly 85 90 95 Thr Gly Gly Thr Pro Ala Gly Ser Thr Ala Ser Val Lys Val Ser Phe 100 105 110 Ser Leu Asn Tyr Lys Phe 115 <210> 61 <211> 118 <212> PRT <213> Bacillus megaterium <400> 61 Met Ala Gln Leu Gly Ser Cys Cys Ser Asp Ser Leu Gly Val Val Asn 1 5 10 15 Asp Ala Val Cys Phe Thr Val Asp Leu Ala Asp Thr Gly Gly Thr Glu 20 25 30 Ile Val Leu Trp Asn Asp Ser Thr Thr Phe Ile Ile Asn Gly Thr Val 35 40 45 Met Val Glu Asn Asn Gly Val Thr Gly Val Gly Pro Thr Ala Ser Leu 50 55 60 Thr Val Asn Gly Val Ala Val Ala Gly Phe Val Val Glu Pro Gly Ser 65 70 75 80 Ala Arg Ala Ile Thr Val Asn Asp Ile Asn Thr Ile Gly Ile Ile Gly 85 90 95 Thr Gly Gly Ala Pro Leu Gly Ser Thr Ser Asn Val Lys Ile Ser Phe 100 105 110 Ser Leu Asn Tyr Lys Phe 115 <210> 62 <211> 118 <212> PRT <213> Bacillus aryabhattai <400> 62 Met Ala Asp Leu Gly Ser Cys Cys Ser Asp Asn Leu Gly Val Val Asn 1 5 10 15 Asp Ala Val Cys Phe Thr Ile Ser Leu Gly Asp Thr Asp Gly Ser Pro 20 25 30 Ile Ser Ile Trp Ser Asn Gly Thr Thr Phe Val Val Asn Gly Thr Ile 35 40 45 Met Val Glu Asn Asn Gly Leu Ala Asn Val Gly Ser Thr Ala Ser Leu 50 55 60 Phe Val Asn Gly Ser Ala Ile Glu Gly Phe Val Val Ala Pro Gly Glu 65 70 75 80 Ala Arg Ala Ile Thr Ile Asn Asp Ile Asn Ile Ile Gly Ile Val Gly 85 90 95 Ala Gly Gly Thr Pro Val Gly Ser Thr Ser Lys Val Lys Ile Ser Phe 100 105 110 Ser Ile Asn Tyr Lys Phe 115 <210> 63 <211> 114 <212> PRT <213> Lysinibacillus sinduriensis <400> 63 Met Ala Gln Leu Gly Gly Cys Asn Gly Glu Gln Leu Val Gly Val Asn 1 5 10 15 Asp Ala Ile Cys Phe Thr Val Leu Leu Asp Asp Thr Gly Ala Thr Pro 20 25 30 Leu Pro Ile Trp Ser Asp Ala Thr Thr Tyr Ile Ile Asn Gly Thr Ile 35 40 45 Met Val Glu Asn Asn Gly Val Val Gly Ala Ser Pro Thr Ala Ala Leu 50 55 60 Thr Val Asn Gly Thr Ala Val Asp Gly Phe Val Val Ala Pro Gly Glu 65 70 75 80 Ala Arg Ser Ile Thr Met Asn Asp Ile Asn Ser Ile Ala Leu Thr Gly 85 90 95 Thr Gly Ala Gly Thr Ala Asn Val Lys Val Ser Phe Ser Leu Asn Tyr 100 105 110 Lys Phe <210> 64 <211> 115 <212> PRT <213> Bacillus megaterium <400> 64 Met Ala Gln Leu Gly Gly Cys Ser Ser Glu Gly Asp Phe Gly Ser Val 1 5 10 15 Asn Asp Ala Val Cys Thr Thr Val Glu Leu Ser Asp Thr Gly Val Thr 20 25 30 Pro Ile Thr Ile Trp Ala Asp Thr Thr Ser Tyr Ile Ile Asn Gly Thr 35 40 45 Ile Leu Ile Glu Asn Asn Gly Ile Ile Gly Ala Ser Pro Thr Ala Ser 50 55 60 Leu Leu Val Asn Gly Thr Pro Val Ala Asp Phe Thr Val Ala Ala Gly 65 70 75 80 Glu Ala Arg Ser Leu Thr Val Asp Asn Ile Asn Leu Ile Gln Leu Ala 85 90 95 Gly Val Gly Ala Gly Thr Ala Arg Val Lys Val Ser Phe Ser Leu Asn 100 105 110 Tyr Gln Phe 115 <210> 65 <211> 114 <212> PRT <213> Bacillus sp. YR335 <400> 65 Met Ser Lys Leu Gly Asn Cys Cys Gln Asp Gln Leu Val Gly Val Asn 1 5 10 15 Asp Ala Leu Cys Phe Thr Ile Asn Leu Thr Asn Thr Gly Gly Ser Pro 20 25 30 Ile Pro Ile Trp Asp Asp Ala Thr Ser Phe Asn Ile Asn Gly Thr Ile 35 40 45 Leu Ile Glu Asn Lys Gly Val Ile Gly Ala Ser Pro Thr Ala Ala Leu 50 55 60 Val Val Asn Gly Thr Pro Val Ala Gly Phe Ile Val Gly Ala Gly Glu 65 70 75 80 Val Arg Ser Ile Thr Met Ser Asn Ile Asn Ser Ile Arg Ile Thr Gly 85 90 95 Ala Gly Thr Gly Thr Ala Pro Val Met Ile Ser Phe Ser Ile Asn Tyr 100 105 110 Lys Tyr <210> 66 <211> 113 <212> PRT <213> Vibrio vulnificus <400> 66 Met Gln Tyr Gly Asn Cys Cys Asn Gly Leu Phe Gly Ile Val Ser Asp 1 5 10 15 Ala Val Cys Phe Thr Val Asn Leu Ser Asn Thr Ala Gly Val Ala Leu 20 25 30 Glu Leu Trp Asn Asp Ala Thr Pro Phe Ile Ile Asn Gly Thr Ile Val 35 40 45 Val Glu Asn Asn Gly Ile Ile Gly Ala Ser Pro Thr Ala Ala Leu Ser 50 55 60 Val Asn Gly Thr Pro Val Gly Gly Phe Ile Val Thr Ala Gly Gln Val 65 70 75 80 Lys Ser Ile Thr Met Asn Asn Ile Asn Ser Ile Gly Leu Ile Gly Ser 85 90 95 Gly Thr Gly Thr Ala Ser Val Arg Val Ser Phe Ser Leu Asn Tyr Lys 100 105 110 Phe <210> 67 <211> 114 <212> PRT <213> Peribacillus asahii <400> 67 Met Ala Asn Leu Gly Gly Phe Ser Asn Asn Pro Leu Asn Val Ile Ser 1 5 10 15 Asp Ser Val Ser Cys Thr Ile Glu Ser Gly Asp Thr Asn Gly Ala Ala 20 25 30 Thr Thr Ile Trp Gln Asp Asp Thr Pro Phe Val Ile Asn Gly Thr Ile 35 40 45 Val Val Asp Asn Lys Gly Lys Val Gly Ala Ser Pro Lys Ala Ala Leu 50 55 60 Leu Val Asn Gly Thr Ala Ile Asn Gly Phe Val Val Ala Pro Gly Glu 65 70 75 80 Cys Arg Ser Ile Thr Val Asn Asp Leu His Ser Ile Ser Ile Ile Val 85 90 95 Thr Gly Thr Gly Thr Ala Lys Ile Asn Ile Ser Phe Ser Leu Asn Tyr 100 105 110 Lys Phe <210> 68 <211> 116 <212> PRT <213> Bacillus cereus <400> 68 Met Ala Gln Leu Gly Asn Cys Ser Asn Ser Gln Gln Asn Thr Val Asn 1 5 10 15 Asp Thr Val Cys Asn Asn Ile Val Leu Glu Asp Thr Ala Gly Val Pro 20 25 30 Ile Ser Ile Trp Asp Asn Asn Thr Asn Met Ile Ile Asn Gly Thr Ile 35 40 45 Leu Val Gln Asn Asn Arg Ile Ile Gly Ile Gly Thr Thr Thr Ala Leu 50 55 60 Thr Val Asn Asp Thr Thr Val Cys Gly Phe Val Val Arg Pro Gly Glu 65 70 75 80 Ser Arg Ser Ile Thr Met Asn Asp Ile Asn Ser Ile Gly Ile Val Gly 85 90 95 Val Gly Ala Gly Val Asn Ser Ser Asn Val Lys Ile Ser Phe Ser Ile 100 105 110 Asn Tyr Lys Phe 115 <210> 69 <211> 114 <212> PRT <213> Bacillus cereus <400> 69 Met Thr Gln Leu Gly Asn Tyr Ser Ser Ser Gln Gln Ser Thr Val Asn 1 5 10 15 Asp Ala Ile Cys Ser Asp Ile Val Leu Glu Asp Thr Ala Gly Val Pro 20 25 30 Val Pro Ile Trp Asp Asp Asn Thr Asn Met Ile Ile Asn Gly Thr Ile 35 40 45 Leu Val Gln Asn Asn Gly Ile Ile Gly Val Gly Ala Thr Ala Ala Leu 50 55 60 Ile Val Asn Gly Thr Pro Val Gly Gly Phe Ile Val Gly Pro Gly Glu 65 70 75 80 Ser Arg Ser Ile Thr Ile Asn Asp Ile Asn Ser Ile Gly Ile Val Gly 85 90 95 Ala Gly Thr Asn Ser Ser Asn Ile Lys Val Ser Phe Ser Ile Asn Tyr 100 105 110 Lys Phe <210> 70 <211> 114 <212> PRT <213> Bacillus cereus group <400> 70 Met Ala Gln Leu Gly Asn Cys Ser Asn Phe Gln Gln Gln Ala Val Asn 1 5 10 15 Asp Ala Val Cys Cys Asn Ile Val Leu Ser Asp Thr Gly Gly Thr Pro 20 25 30 Val Pro Ile Trp Asn Asp Asp Thr Ser Arg Ile Ile Asn Gly Thr Ile 35 40 45 Leu Val Gln Asn Asp Gly Ile Ile Gly Val Gly Ala Thr Ala Ser Leu 50 55 60 Ile Val Asn Gly Thr Ala Val Gly Gly Phe Thr Val Gly Pro Gly Glu 65 70 75 80 Ser Arg Ser Ile Thr Met Ser Asp Ile Asn Ser Ile Gly Ile Val Gly 85 90 95 Ala Gly Thr Asn Ser Ser Asn Val Lys Val Ser Phe Ser Ile Asn Tyr 100 105 110 Lys Phe <210> 71 <211> 114 <212> PRT <213> Halobacillus <400> 71 Met Ala Gln Leu Gly Ser Cys Ile Ser Asn Ser Tyr Cys Cys Val Asn 1 5 10 15 Asp Ala Val Cys Cys Thr Ile Ser Leu Glu Asp Thr Gly Glu Ile Pro 20 25 30 Val Thr Val Trp Glu Asp Val Thr Asp Phe Val Ile Asn Gly Thr Ile 35 40 45 Met Ile Glu Asn Asn Gly Ile Thr Asp Thr Ser Pro Thr Ala Ala Leu 50 55 60 Tyr Val Asn Gly Glu Ala Ile Gly Asp Phe Val Leu Ala Pro Gly Glu 65 70 75 80 Cys Arg Ser Ile Thr Leu Asn Asp Ile Asn Ser Ile Gly Ile Val Gly 85 90 95 Ala Gly Thr Gly Ser Ser Asn Val Lys Val Ser Phe Ser Ile Asn Tyr 100 105 110 Lys Phe <210> 72 <211> 114 <212> PRT <213> Virgibacillus dokdonensis <400> 72 Met Ala Gln Leu Gly Leu Cys Asn Thr Asp Ser Leu Cys Cys Ile Asn 1 5 10 15 Asp Ala Val Cys Cys Thr Ile Thr Leu Glu Asp Thr Ala Thr Thr Pro 20 25 30 Ile Ser Val Trp Glu Asn Ala Ser Thr Phe Ile Ile Asn Gly Thr Ile 35 40 45 Val Ile Glu Asn Asn Gly Leu Val Val Gly Ser Pro Thr Ala Glu Leu 50 55 60 Tyr Val Asn Gly Thr Ala Val Ser Gly Phe Val Val Glu Pro Gly Glu 65 70 75 80 Cys Arg Ser Ile Thr Leu Glu Gly Val Asn Ser Ile Gly Ile Val Gly 85 90 95 Ser Gly Thr Gly Ser Ser Asn Val Lys Ile Ser Phe Ser Ile Asn Tyr 100 105 110 Lys Phe <210> 73 <211> 114 <212> PRT <213> Bacillus sp. BPN334 <400> 73 Met Ala Gln Ile Gly Asn Cys Cys Thr Glu Gln Leu Cys Cys Val Asn 1 5 10 15 Asp Ala Val Cys Cys Thr Ile Ile Leu Asp Asp Thr Asp Gly Thr Ala 20 25 30 Leu Pro Ile Trp Asp Asp Ser Thr Thr Phe Val Ile Asn Gly Thr Ile 35 40 45 Met Val Glu Asn Asn Gly Ala Val Gly Val Gly Ser Thr Ala Ala Leu 50 55 60 Thr Val Asn Gly Thr Ala Val Gly Gly Phe Val Val Ala Pro Gly Glu 65 70 75 80 Cys Arg Ser Ile Thr Met Asn Asp Ile Asn Ser Ile Ala Ile Val Gly 85 90 95 Ser Gly Thr Gly Thr Ser Ser Val Lys Ile Ser Phe Ser Leu Asn Tyr 100 105 110 Lys Phe <210> 74 <211> 115 <212> PRT <213> Bacillus cereus ATCC 10987 <400> 74 Met Leu Ala Gln Ile Gly Asn Cys Cys Thr Glu Gln Leu Cys Cys Val 1 5 10 15 Asn Asp Ala Val Cys Cys Thr Ile Ile Leu Asp Asp Thr Gly Gly Thr 20 25 30 Ala Leu Pro Ile Trp Asp Asp Ala Thr Thr Phe Val Ile Asn Gly Thr 35 40 45 Ile Met Val Glu Asn Asn Gly Thr Val Gly Val Gly Pro Thr Ala Ala 50 55 60 Leu Thr Val Asn Gly Thr Ala Val Gly Gly Phe Val Val Ala Pro Gly 65 70 75 80 Glu Cys Arg Ser Ile Thr Met Asn Asp Ile Asn Ser Ile Ala Ile Val 85 90 95 Gly Ala Gly Thr Gly Thr Ser Ser Val Lys Ile Ser Phe Ser Ile Asn 100 105 110 Tyr Lys Phe 115 <210> 75 <211> 114 <212> PRT <213> Paenibacillus sp. GM1FR <400> 75 Met Ala Gln Ile Gly Asn Cys Asn Asn Thr Val Ser Pro Ala Val Val 1 5 10 15 Asn Asp Ala Val Cys Thr Thr Ile Ser Leu Ser Asp Thr Gly Gly Thr 20 25 30 Pro Thr Ile Ile Tyr Glu Asn Ser Ser Thr Phe Leu Ile Asn Gly Thr 35 40 45 Ile Leu Ile Glu Asn Asn Gly Val Gly Val Ser Pro Thr Ala Ala Leu 50 55 60 Leu Ile Asp Gly Val Gln Ile Pro Gly Phe Val Val Ala Pro Gly Ser 65 70 75 80 Ser Arg Ser Tyr Thr Ala Pro Thr Ile Asn Ser Ile Ser Leu Ile Gly 85 90 95 Ala Gly Leu Gly Thr Thr Ser Ile Lys Ile Ala Phe Ser Leu Asn Tyr 100 105 110 Arg Phe <210> 76 <211> 115 <212> PRT <213> Bacillus aurantiacus <400> 76 Met Ala Gln Leu Gly Ser Cys Gly Arg Gln Gln Gln Asp Cys Cys Val 1 5 10 15 Asn Asp Ala Val Cys Phe Asn Ile Glu Ile Glu Thr Gly Gly Glu Glu 20 25 30 Gln Leu Val Trp Thr Asn Asn Gly Ala Phe Thr Ile Asn Gly Thr Ile 35 40 45 Val Ile Glu Asn Asp Gly Ile Glu Glu Gly Pro Ser Ala Ser Leu Val 50 55 60 Val Asn Gly Val Ala Thr Gly Val Val Val Ala Pro Gly Glu Ser Glu 65 70 75 80 Ala Val Thr Leu Asp Asn Leu Asn Ser Ile Ser Val Ala Pro Glu Gly 85 90 95 Gly Gly Glu Gly Leu Thr Ser Asp Val Lys Val Ala Phe Ser Ile Asn 100 105 110 Tyr Arg Phe 115 <210> 77 <211> 113 <212> PRT <213> Rummeliibacillus pycnus <400> 77 Met Ala Lys Leu Gly Asn Cys His Met Glu Pro Cys Cys Val Asn Asp 1 5 10 15 Ala Val Cys Ser Thr Val His Val Val Asn Gln Ser Leu Val Thr Val 20 25 30 Trp Thr Asn Glu Ser Pro Phe Asn Ile Asn Gly Thr Ile Val Val Glu 35 40 45 Asn Pro Leu Gln Asp Gly Asn Ala Thr Gln Gln Thr Val Arg Leu Ile 50 55 60 Ile Thr Gly Ser Ser Gly Thr Asp Val Asn Ile Ala Pro Gly Gln Thr 65 70 75 80 Val Ala Leu Thr Val Arg Gly Leu His Ile Ile Gln Val Gln Gly Leu 85 90 95 Thr Thr Gly Thr Thr Asp Val Lys Val Ser Phe Ser Leu Asn Tyr Lys 100 105 110 Phe <210> 78 <211> 109 <212> PRT <213> Anaerobacillus alkalidiazotrophicus <400> 78 Met Ala Gln Leu Gly Lys Cys Phe Pro Thr Thr Leu Cys Cys Val Asn 1 5 10 15 Asp Ala Val Cys Cys Asp Ile Ser Val Thr Val Gly Thr Gly Pro Val 20 25 30 Asp Leu Tyr Thr Asn Ser Thr Asn Phe Pro Val Asn Gly Thr Phe Met 35 40 45 Val Asp Asn Ser Asn Ser Ser Thr Gly Asn Val Thr Leu Thr Asp Gly 50 55 60 Thr Asn Ala Ile Asp Val Ala Pro Gly Thr Cys Gln Ala Ile Thr Tyr 65 70 75 80 Ser Asp Ile Asn Asn Gly Glu Ser Ile Thr Trp Gln Thr Thr Ala Ala 85 90 95 Ala Asp Phe Lys Val Ser Phe Ser Ile Asn Tyr Lys Phe 100 105 <210> 79 <211> 111 <212> PRT <213> Lysinibacillus meyeri <400> 79 Met Ala Lys Leu Gly Ser Cys Cys Gly Ser Lys Thr Ser Val His Asp 1 5 10 15 Ser Val Cys Gln Asp Val Thr Leu Thr Asp Glu Thr Pro Val Ile Val 20 25 30 Trp Glu Asn Ser Thr Pro Phe Ser Ile Asn Gly Thr Ile Leu Val Glu 35 40 45 Asn Ala Ser Ser Ser Thr Ala Asp Val Thr Leu Thr Val Thr Ser Asn 50 55 60 Pro Ala Thr Pro Ala Ile Ala Ala Ile Ala Pro Gly Asn Ser Val Ser 65 70 75 80 Val Thr Ala Asn Asn Ile Ser Asp Ile Gln Leu Ala Gly Glu Ala Ala 85 90 95 Glu Val Ala Asn Val Lys Ile Ser Tyr Ser Leu Asn Tyr Asn Phe 100 105 110 <210> 80 <211> 111 <212> PRT <213> Metasolibacillus fluoroglycofenilyticus <400> 80 Met Ala Lys Leu Gly Ser Cys Cys Gly Ser Lys Thr Ser Val His Asp 1 5 10 15 Ser Val Cys Gln Asp Leu Thr Leu Thr Asp Glu Thr Ala Val Thr Val 20 25 30 Trp Glu Asn Ser Thr Pro Phe Ala Ile Asn Gly Thr Ile Leu Val Glu 35 40 45 Asn Ala Ser Ser Ser Thr Gly Asp Val Thr Leu Thr Val Thr Ser Ser 50 55 60 Pro Ala Thr Pro Ala Ile Pro Pro Ile Thr Pro Gly Asn Ser Ile Ser 65 70 75 80 Ile Thr Ala Asn Asn Ile Ala Asp Ile Gln Leu Ala Gly Thr Ala Ala 85 90 95 Ser Val Ala Asn Val Lys Ile Ser Tyr Ser Leu Asn Tyr Asn Phe 100 105 110 <210> 81 <211> 429 <212> DNA <213> Artificial Sequence <220> <223> recombinant Ena1A nucleotide sequence <400> 81 atgcatcacc atcaccatca cagcagcggt gaaaatctgt attttcaggg cgcttgtgaa 60 tgtagcagca cagtcctgac ctgttgttcg gacaactcta gtaattttgt gcaggataaa 120 gtttgcaacc cctggtcttc cgcggaagca agcactttca ccgtatatgc gaacaatgtt 180 aaccaaaaca ttgtcggcac cggctattta acatatgatg tggggcccgg tgtgagcccg 240 gccaaccaga ttacggttac ggttctggac tccggcggcg gtactatcca gacctttctg 300 gtcaacgaag ggacgtctat ctcatttacc tttcgccgct ttaacattat tcagattaca 360 accccagcca caccgattgg cacgtatcag ggtgaatttt gcatcacgac ccggtattta 420 atggcctaa 429 <210> 82 <211> 142 <212> PRT <213> Artificial Sequence <220> <223> recombinant Ena1A amino acid sequence (with N-terminal 6xHis tag and TEV cleavage site) <400> 82 Met His His His His His His Ser Ser Gly Glu Asn Leu Tyr Phe Gln 1 5 10 15 Gly Ala Cys Glu Cys Ser Ser Thr Val Leu Thr Cys Cys Ser Asp Asn 20 25 30 Ser Ser Asn Phe Val Gln Asp Lys Val Cys Asn Pro Trp Ser Ser Ala 35 40 45 Glu Ala Ser Thr Phe Thr Val Tyr Ala Asn Asn Val Asn Gln Asn Ile 50 55 60 Val Gly Thr Gly Tyr Leu Thr Tyr Asp Val Gly Pro Gly Val Ser Pro 65 70 75 80 Ala Asn Gln Ile Thr Val Thr Val Leu Asp Ser Gly Gly Gly Thr Ile 85 90 95 Gln Thr Phe Leu Val Asn Glu Gly Thr Ser Ile Ser Phe Thr Phe Arg 100 105 110 Arg Phe Asn Ile Ile Gln Ile Thr Thr Pro Ala Thr Pro Ile Gly Thr 115 120 125 Tyr Gln Gly Glu Phe Cys Ile Thr Thr Arg Tyr Leu Met Ala 130 135 140 <210> 83 <211> 399 <212> DNA <213> Artificial Sequence <220> <223> recombinant Ena1B nucleotide sequence <400> 83 atgcaccacc accaccatca ttctagcggt gaaaacctgt actttcaggg taactgcagc 60 accaatctgt catgctgtgc caatggtcag aagaccattg tccaggataa agtctgcatc 120 gactggaccg cagccgctac tgcagcaatc atttacgctg ataatatcag ccaagacatc 180 tacgcttcag gctatctgaa agtggataca ggtacgggtc ccgtgaccat cgtcttttac 240 tctggtggag tcacaggcac cgctgtggag accattgtgg tcgccacggg ttcgtcggcc 300 agctttacgg tgcgccgttt tgataccgtc actattctgg gcaccgcagc agcggagact 360 ggtgagtttt gtatgaccat ccgttacact ttgagctaa 399 <210> 84 <211> 132 <212> PRT <213> Artificial Sequence <220> <223> recombinant Ena1B amino acid sequence (with N-terminal 6xHis tag and TEV cleavage site) <400> 84 Met His His His His His His Ser Ser Gly Glu Asn Leu Tyr Phe Gln 1 5 10 15 Gly Asn Cys Ser Thr Asn Leu Ser Cys Cys Ala Asn Gly Gln Lys Thr 20 25 30 Ile Val Gln Asp Lys Val Cys Ile Asp Trp Thr Ala Ala Ala Thr Ala 35 40 45 Ala Ile Ile Tyr Ala Asp Asn Ile Ser Gln Asp Ile Tyr Ala Ser Gly 50 55 60 Tyr Leu Lys Val Asp Thr Gly Thr Gly Pro Val Thr Ile Val Phe Tyr 65 70 75 80 Ser Gly Gly Val Thr Gly Thr Ala Val Glu Thr Ile Val Val Ala Thr 85 90 95 Gly Ser Ser Ala Ser Phe Thr Val Arg Arg Phe Asp Thr Val Thr Ile 100 105 110 Leu Gly Thr Ala Ala Ala Glu Thr Gly Glu Phe Cys Met Thr Ile Arg 115 120 125 Tyr Thr Leu Ser 130 <210> 85 <211> 516 <212> DNA <213> Artificial Sequence <220> <223> recombinant Ena1C nucleotide sequence <400> 85 atgcatcatc atcatcacca ttccagcggt gagaatctct atttccaagg caaaccgcac 60 aaaaatatcg gctgctttgc gccgctctcc attatctgcc agccgacctg tccgtgcccg 120 ccgccaattt taccgccgga acgcggtgac gccgagctgg tcacaaatga atttgcgggg 180 gacatcctga ttagcaacga ttttattcca attagccaga aacagctgaa acaaacaaac 240 accaccgtta atatctggaa aaacgacgga atcgtttccc tgagcggcac gatttcaatt 300 tataataatc gcaattcgac caacgcgctg tcgattcaga ttatcagtag tacgaccaat 360 acctttacag cgctcccggg gaatacgatt tcctatactg gttttgacct gcagtccgtc 420 tctgttatcg acattccaag cgatccaagt atctacattg agggccgcta ttgttttcag 480 ttaacttact gtaaatctaa acgcgattgt ctttaa 516 <210> 86 <211> 171 <212> PRT <213> Artificial Sequence <220> <223> recombinant Ena1C amino acid sequence (with N-terminal 6xHis tag and TEV cleavage site) <400> 86 Met His His His His His His Ser Ser Gly Glu Asn Leu Tyr Phe Gln 1 5 10 15 Gly Lys Pro His Lys Asn Ile Gly Cys Phe Ala Pro Leu Ser Ile Ile 20 25 30 Cys Gln Pro Thr Cys Pro Cys Pro Pro Pro Ile Leu Pro Pro Glu Arg 35 40 45 Gly Asp Ala Glu Leu Val Thr Asn Glu Phe Ala Gly Asp Ile Leu Ile 50 55 60 Ser Asn Asp Phe Ile Pro Ile Ser Gln Lys Gln Leu Lys Gln Thr Asn 65 70 75 80 Thr Thr Val Asn Ile Trp Lys Asn Asp Gly Ile Val Ser Leu Ser Gly 85 90 95 Thr Ile Ser Ile Tyr Asn Asn Arg Asn Ser Thr Asn Ala Leu Ser Ile 100 105 110 Gln Ile Ile Ser Ser Thr Thr Asn Thr Phe Thr Ala Leu Pro Gly Asn 115 120 125 Thr Ile Ser Tyr Thr Gly Phe Asp Leu Gln Ser Val Ser Val Ile Asp 130 135 140 Ile Pro Ser Asp Pro Ser Ile Tyr Ile Glu Gly Arg Tyr Cys Phe Gln 145 150 155 160 Leu Thr Tyr Cys Lys Ser Lys Arg Asp Cys Leu 165 170 <210> 87 <211> 116 <212> PRT <213> Artificial Sequence <220> <223> Ena1B_NM_Oslo <400> 87 Met Gly Asn Cys Ser Thr Asn Leu Ser Cys Cys Ala Asn Gly Gln Ile 1 5 10 15 Ile Val Gln Asp Lys Val Cys Ile Asp Trp Thr Ala Ala Ala Thr Ala 20 25 30 Ala Ile Ile Tyr Ala Asp Asn Ile Ser Gln Asp Ile Tyr Ala Ser Gly 35 40 45 Tyr Leu Lys Val Asp Thr Gly Thr Gly Pro Val Thr Ile Val Phe Tyr 50 55 60 Ser Gly Gly Val Thr Gly Thr Ala Val Glu Thr Ile Val Val Ala Thr 65 70 75 80 Gly Ser Ser Ala Ser Phe Thr Val Arg Arg Phe Asp Thr Val Thr Ile 85 90 95 Leu Gly Thr Ala Ala Ala Glu Thr Gly Glu Phe Cys Met Thr Ile Arg 100 105 110 Tyr Thr Leu Ser 115 <210> 88 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic peptide in figure 8 <400> 88 Phe Cys Met Thr Ile Arg Tyr 1 5 <210> 89 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> TEV cleavage site <400> 89 Glu Asn Leu Tyr Phe Gln Gly 1 5 <210> 90 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 90 aatggcgcca gttcaattac 20 <210> 91 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 91 cctctctaca tagcctttcc cctctctctt 30 <210> 92 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 92 aaggctatgt agagagggga attagtat 28 <210> 93 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 93 cctcctattc tcccacctga aa 22 <210> 94 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 94 tccatgtggt atggcaaaaa 20 <210> 95 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 95 ccatatatta catactaatt cccctctc 28 <210> 96 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 96 aattagtatg taatatatgg tgatttaaag att 33 <210> 97 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 97 aacctacttg cccctgtcct 20 <210> 98 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 98 cgcatcttgt ttaggtgcaa 20 <210> 99 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 99 atttttttgt tatccttttc ataagactgt ttac 34 <210> 100 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 100 tgaaaaggat aacaaaaaaa ttattgcttt tg 32 <210> 101 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 101 aggtggaggg acaatccaaa c 21 <210> 102 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 102 tccatgtggt atggcaaaaa 20 <210> 103 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 103 ccatatatta catagccttt cccctctc 28 <210> 104 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 104 aaaggctatg taatatatgg tgatttaaag at 32 <210> 105 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 105 aacctacttg cccctgtcct 20 <210> 106 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 106 aagtgcgtct aatcaacaag gaaa 24 <210> 107 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 107 gggaaatctc ccatgaacac a 21 <210> 108 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 108 aggtggaggg acaatccaaa c 21 <210> 109 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 109 ggcgaaacgt aaatgaaatg c 21 <210> 110 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 110 ccactggaag tagcgcatct t 21 <210> 111 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 111 gccgctgttc caagaattgt 20 <210> 112 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 112 cctcctattc tcccacctga aa 22 <210> 113 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 113 ctccagcgaa ctcattggta act 23 <210> 114 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 114 gggtgtacga gggtgatatg aatt 24 <210> 115 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 115 tgtcgttccg ccaagtgtt 19 <210> 116 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 116 gcggatgttg ttggacaa 18 <210> 117 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> primer <400> 117 Ala Cys Gly Thr Gly Cys Ala Ala Ala Cys Ala Cys Ala Thr Gly Ala 1 5 10 15 Ala Thr Cys Gly 20 <210> 118 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X can be Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(14) <223> Xaa can be any naturally occurring amino acid <400> 118 Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Cys 1 5 10 15 <210> 119 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(15) <223> Xaa can be any naturally occurring amino acid <400> 119 Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Cys 1 5 10 15 <210> 120 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(16) <223> Xaa can be any naturally occurring amino acid <400> 120 Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Cys <210> 121 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (6)..(15) <223> Xaa can be any naturally occurring amino acid <400> 121 Xaa Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Cys 1 5 10 15 <210> 122 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (6)..(16) <223> Xaa can be any naturally occurring amino acid <400> 122 Xaa Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Cys <210> 123 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (6)..(17) <223> Xaa can be any naturally occurring amino acid <400> 123 Xaa Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Cys <210> 124 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> C-terminal motif <220> <221> misc_feature <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(8) <223> Xaa can be any naturally occurring amino acid <400> 124 Gly Xaa Xaa Cys Xaa Xaa Xaa Xaa Tyr 1 5 <210> 125 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> C-termninal motif <220> <221> misc_feature <222> (2)..(4) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (6)..(9) <223> Xaa can be any naturally occurring amino acid <400> 125 Gly Xaa Xaa Xaa Cys Xaa Xaa Xaa Xaa Tyr 1 5 10 <210> 126 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(17) <223> Xaa can be any naturally occurring amino acid <400> 126 Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Cys <210> 127 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(18) <223> Xaa can be any naturally occurring amino acid <400> 127 Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Cys <210> 128 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(19) <223> Xaa can be any naturally occurring amino acid <400> 128 Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa Cys 20 <210> 129 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(20) <223> Xaa can be any naturally occurring amino acid <400> 129 Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa Xaa Cys 20 <210> 130 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(11) <223> Xaa can be any naturally occurring amino acid <400> 130 Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Cys 1 5 10 <210> 131 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(12) <223> Xaa can be any naturally occurring amino acid <400> 131 Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Cys 1 5 10 <210> 132 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(13) <223> Xaa can be any naturally occurring amino acid <400> 132 Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Cys 1 5 10 <210> 133 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (6)..(18) <223> Xaa can be any naturally occurring amino acid <400> 133 Xaa Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Cys <210> 134 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (6)..(19) <223> Xaa can be any naturally occurring amino acid <400> 134 Xaa Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa Cys 20 <210> 135 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (6)..(20) <223> Xaa can be any naturally occurring amino acid <400> 135 Xaa Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa Xaa Cys 20 <210> 136 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (6)..(21) <223> Xaa can be any naturally occurring amino acid <400> 136 Xaa Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa Xaa Xaa Cys 20 <210> 137 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (6)..(12) <223> Xaa can be any naturally occurring amino acid <400> 137 Xaa Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Cys 1 5 10 <210> 138 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (6)..(13) <223> Xaa can be any naturally occurring amino acid <400> 138 Xaa Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Cys 1 5 10 <210> 139 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> N-terminal motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is Leu, Ile, Val, or Phe <220> <221> misc_feature <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (6)..(14) <223> Xaa can be any naturally occurring amino acid <400> 139 Xaa Xaa Xaa Cys Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Cys 1 5 10 15 <210> 140 <211> 117 <212> PRT <213> Artificial Sequence <220> <223> Ena1B-DE-HA insertion variant <400> 140 Met Gly Asn Cys Ser Thr Asn Leu Ser Cys Cys Ala Asn Gly Gln Lys 1 5 10 15 Thr Ile Val Gln Asp Lys Val Cys Ile Asp Trp Thr Ala Ala Ala Thr 20 25 30 Ala Ala Ile Ile Tyr Ala Asp Asn Ile Ser Gln Asp Ile Tyr Ala Ser 35 40 45 Gly Tyr Leu Lys Val Asp Thr Gly Ser Gly Pro Val Thr Ile Val Phe 50 55 60 Tyr Ser Gly Gly Val Thr Gly Thr Ala Val Glu Thr Ile Val Val Ala 65 70 75 80 Thr Gly Ser Ser Ala Ser Phe Thr Val Arg Arg Phe Asp Thr Val Thr 85 90 95 Ile Leu Gly Thr Ala Ala Ala Glu Thr Gly Glu Phe Cys Met Thr Ile 100 105 110 Arg Tyr Thr Leu Ser 115 <210> 141 <211> 127 <212> PRT <213> Artificial Sequence <220> <223> Ena1B-DE-Flag insertion variant <400> 141 Met Gly Asn Cys Ser Thr Asn Leu Ser Cys Cys Ala Asn Gly Gln Lys 1 5 10 15 Thr Ile Val Gln Asp Lys Val Cys Ile Asp Trp Thr Ala Ala Ala Thr 20 25 30 Ala Ala Ile Ile Tyr Ala Asp Asn Ile Ser Gln Asp Ile Tyr Ala Ser 35 40 45 Gly Tyr Leu Lys Val Asp Thr Gly Ser Asp Tyr Lys Asp Asp Asp Asp 50 55 60 Lys Gly Ser Gly Pro Val Thr Ile Val Phe Tyr Ser Gly Gly Val Thr 65 70 75 80 Gly Thr Ala Val Glu Thr Ile Val Val Ala Thr Gly Ser Ser Ala Ser 85 90 95 Phe Thr Val Arg Arg Phe Asp Thr Val Thr Ile Leu Gly Thr Ala Ala 100 105 110 Ala Glu Thr Gly Glu Phe Cys Met Thr Ile Arg Tyr Thr Leu Ser 115 120 125 <210> 142 <211> 128 <212> PRT <213> Artificial Sequence <220> <223> Ena1B-HI-HA insertion variant <400> 142 Met Gly Asn Cys Ser Thr Asn Leu Ser Cys Cys Ala Asn Gly Gln Lys 1 5 10 15 Thr Ile Val Gln Asp Lys Val Cys Ile Asp Trp Thr Ala Ala Ala Thr 20 25 30 Ala Ala Ile Ile Tyr Ala Asp Asn Ile Ser Gln Asp Ile Tyr Ala Ser 35 40 45 Gly Tyr Leu Lys Val Asp Thr Gly Thr Gly Pro Val Thr Ile Val Phe 50 55 60 Tyr Ser Gly Gly Val Thr Gly Thr Ala Val Glu Thr Ile Val Val Ala 65 70 75 80 Thr Gly Ser Ser Ala Ser Phe Thr Val Arg Arg Phe Asp Thr Val Thr 85 90 95 Ile Leu Gly Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Gly Ser 100 105 110 Ala Ala Glu Thr Gly Glu Phe Cys Met Thr Ile Arg Tyr Thr Leu Ser 115 120 125 <210> 143 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> HA-tag <400> 143 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1 5 <210> 144 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> FLAG-tag <400> 144 Asp Tyr Lys Asp Asp Asp Asp Lys 1 5 <210> 145 <211> 122 <212> PRT <213> Bacillus thuringiensis <400> 145 Met Ser Cys Glu Cys Ser Gly Ser Ala Leu Thr Cys Cys Pro Asp Lys 1 5 10 15 Asn Tyr Val Gln Asp Lys Val Cys Ser Pro Trp Ser Ala Thr Val Val 20 25 30 Ala Thr Ala Ile Asp Asn Val Leu Tyr Thr Asn Asn Ile Asn Gln Asn 35 40 45 Val Val Gly Thr Gly Phe Val Lys Tyr Asp Val Gly Pro Gly Pro Ile 50 55 60 Thr Val Glu Ala Leu Asp Ser Ala Gly Gly Thr Ile Asp Thr Gln Thr 65 70 75 80 Leu Asn Pro Gly Thr Ser Ile Ala Phe Thr Tyr Arg Arg Phe Asp Ser 85 90 95 Ile Gln Val Val Leu Pro Ala Thr Pro Ala Gly Thr Tyr Gln Gly Glu 100 105 110 Phe Cys Ile Thr Thr Arg Tyr Pro Leu Ser 115 120 <210> 146 <211> 141 <212> PRT <213> Bacillus thuringiensis <400> 146 Met Lys Asn Lys Lys Asn Ile Gly Cys Phe Ala Pro Leu Ser Ile Ile 1 5 10 15 Cys Pro Asp Pro Cys Pro Pro Pro Pro Pro Pro Asn Pro Asn Cys Glu 20 25 30 Arg Val Thr Asn Glu Phe Ala Gly Asn Phe Leu Ile Thr Asn Asn Thr 35 40 45 Ile Pro Ser Ala Lys Asp Ala Ser Gln Ser Met Ile Leu Trp Gln Ser 50 55 60 Asp Gly Ile Leu Leu Ile Ser Gly Thr Val Ser Val Tyr Asn Ser Thr 65 70 75 80 Ser Ser Thr Glu Thr Ile Thr Ile Gln Ile Val Gly Thr Val Thr Asn 85 90 95 Ile Phe Thr Val Phe Pro Gly Asn Thr Ile Ser Tyr Thr Gly Lys Asp 100 105 110 Leu His Ser Val Ser Ile Ile Asn Ile Thr Ser Asn Pro Ser Leu Tyr 115 120 125 Leu Glu Gly Lys Tyr Cys Cys Glu Phe Thr Cys Cys Leu 130 135 140 <210> 147 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Conserved motif <220> <221> misc_feature <222> (5)..(5) <223> Xaa can be any naturally occurring amino acid <400> 147 Ser Leu Asn Tyr Xaa Phe 1 5 <210> 148 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Conserved motif <220> <221> misc_feature <222> (5)..(5) <223> Xaa can be any naturally occurring amino acid <400> 148 Ser Leu Asn Tyr Xaa Tyr 1 5 <210> 149 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Conserved motif <220> <221> misc_feature <222> (5)..(5) <223> Xaa can be any naturally occurring amino acid <400> 149 Ser Ile Asn Tyr Xaa Phe 1 5 <210> 150 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Conserved motif <220> <221> misc_feature <222> (5)..(5) <223> Xaa can be any naturally occurring amino acid <400> 150 Ser Ile Asn Tyr Xaa Tyr 1 5

Claims

DUF3992 도메인을 포함하는, 단리된 자가-조립 단백질로서, 단백질은 6.5 이상의 폴드 유사성 Z-점수로 Ena1B 구조에 일치하는 3차원 예측 폴드를 갖고, Ena1B는 SEQ ID NO:8에 상응하는 것인 단리된 자가-조립 단백질.
제1항에 있어서, 아미노산 서열은 SEQ ID NO: 1-80, 145 또는 146의 아미노산 서열, 또는 이의 어느 하나의 적어도 80% 동일성을 갖는 상동체의 아미노산 서열의 군으로부터 선택되는 것인 단리된 자가-조립 단백질.
제1항 또는 제2항의 자가-조립 단백질을 포함하는, 조작된 자가-조립 단백질.
제1항 내지 제3항 중 어느 하나의 항에 따른 단백질 적어도 7개를 포함하는 다량체로서, 상기 단백질은 비-공유적으로 연결된 서브유닛으로서 다량체에 존재하는 것인 다량체.
제4항에 있어서, 적어도 하나의 서브유닛은 제3항에 따른 조작된 자가-조립 단백질인 다량체.
제4항 또는 제5항에 있어서, 상기 서브유닛은 아미노산 서열 모티프 ZX_nCCX_mC (여기서, Z는 Leu, Ile, Val, 또는 Phe이고, n은 1 또는 2이고, m은 10 내지 12임)를 포함하는 N-말단 영역을 포함하고, 아미노산 서열 모티프 GX_2/3CX₄Y (여기서, X는 임의 아미노산임)를 포함하는 C-말단 영역을 포함하는 것인 다량체.
제6항에 있어서, 적어도 하나의 조작된 자가-조립 단백질 서브유닛의 N-말단 영역은 아미노산 서열 모티프 ZX_nCCX_mC (여기서, m은 13 내지 16이거나, 또는 m은 7-9임)를 포함하는 것을 특징으로 하는 조작된 다량체인, 다량체.
제4항 또는 제5항에 있어서, 상기 서브유닛은 아미노산 서열 모티프 ZX_nC(C)X_mC (여기서, Z는 Leu, Ile, Val, 또는 Phe이고, n은 1 또는 2이고, m은 10 내지 12이고, (C)는 임의적 Cys임)를 포함하는 N-말단 영역을 포함하고, 아미노산 서열 모티프 S-Z-N-Y-X-B (여기서, Z는 Leu 또는 Ile이고, B는 Phe 또는 Tyr이고, X는 임의 아미노산임)를 포함하는 C-말단 영역을 포함하는 것인 다량체.
제4항 내지 제8항 중 어느 하나의 항의 다량체 적어도 2개를 포함하는 재조합 생산된 단백질 섬유로서, 상기 다량체는 종방향으로 적층되고 적어도 하나의 디술피드 결합을 통해서 공유적으로 연결되는 것인 단백질 섬유.
제4항 내지 제8항 중 어느 하나의 항의 다량체 적어도 2개를 포함하는 단백질 섬유로서, 상기 다량체는 종방향으로 적층되고 적어도 하나의 디술피드 결합을 통해서 공유적으로 연결되고, 다량체의 자가-조립 단백질 서브유닛은 동일한 것인 단백질 섬유.
제9항 또는 제10항에 있어서, 다량체는 적어도 하나의 조작된 다량체 또는 조작된 자가-조립 단백질을 포함하는 것을 특징으로 하는 조작된 단백질 섬유인, 단백질 섬유.
하기 작동적으로 연결된 DNA 구성요소를 포함하는 키메라 유전자: a) 이종성 프로모터, 및 b) 제1항 내지 제3항 중 어느 하나의 항에 따른 자가-조립 단백질을 코딩하는 핵산 서열.
제1항 내지 제3항 중 어느 하나의 항의 자가-조립 단백질, 제4항 내지 제8항 중 어느 하나의 항의 다량체, 제9항 내지 제11항 중 어느 하나의 항의 단백질 섬유, 및/또는 제12항의 키메라 유전자를 포함하는 숙주 세포.
변형된 박테리아 내생포자로서, 상기 포자는 제1항 내지 제3항 중 어느 하나의 항의 자가-조립 단백질, 제4항 내지 제8항 중 어느 하나의 항에 따른 다량체, 제9항 내지 제11항 중 어느 하나의 항의 단백질 섬유, 및/또는 제12항의 키메라 유전자를 포함하는 것인 내생포자.
제1항 내지 제3항 중 어느 하나의 항의 자가-조립 단백질, 제4항 내지 제8항 중 어느 하나의 항에 따른 다량체, 및/또는 제9항 내지 제11항 중 어느 하나의 항의 단백질 섬유를 포함하는 변형된 표면.
제1항 내지 제11항 중 어느 하나의 항의 자가-조립 단백질, 다량체 또는 섬유를 제조하기 위한 방법으로서,
a. 세포에서 제12항의 키메라 유전자를 발현하는 단계로서, 상기 자가-조립 단백질을 코딩하는 핵산은 임의로 이종성 N-말단 또는 C-말단 태그를 포함하는 것인 단계, 및 임의로,
b. 상기 세포로부터 단량체, 다량체, 또는 섬유 형태로 자가-조립 단백질을 단리하는 단계
를 포함하는 것인 제조 방법.
섬유 형성 또는 에피택셜 성장이 저지된 제1항 내지 제8항 중 어느 하나의 항의 자가-조립 단백질 또는 다량체를 제조하기 위한 방법으로서, 제16항의 방법의 단계를 포함하고, 이종성 N-말단 또는 C-말단 태그는 적어도 6개 아미노산 잔기를 포함하는 것인 제조 방법.
제9항 내지 제11항 중 어느 하나의 항의 단백질 섬유를 시험관내에서 제조하기 위한 방법으로서, 제16항 또는 제17항의 방법의 단계를 포함하고, 태그는 제거가능한 태그이고, 섬유 형성을 허용하는 단계 b) 이전 또는 이후에 단백질 서브유닛으로부터 태그를 제거하는 단계를 더 포함하는 것인 제조 방법.
숙주 세포에서 제9항 내지 제11항 중 어느 하나의 항의 단백질 섬유를 재조합적으로 제조하기 위한 방법으로서, 제16항의 방법의 단계를 포함하고, 이종성 태그가 자가-조립 단백질 서브유닛에 존재하지 않아서, 세포내에서 섬유 형성을 허용하고/하거나, 단계 b의 임의적 단리는 세포 용해를 통해 수득되는 것인 제조 방법.
제15항에 따른 변형된 표면을 제조하기 위한 방법으로서, 제16항 내지 제18항 중 어느 하나의 항의 방법의 단계를 포함하고, 표면을 상기 표면에 상기 단량체, 다량체 또는 섬유의 공유 결합을 통해서 변형시키는 단계를 더 포함하는 것인 제조 방법.
다량체 또는 섬유의 에피택설 성장을 위한 핵형성제로서 제15항의 변형된 표면의 용도로서, 상기 변형된 표면을 제1항 내지 제3항 중 어느 하나의 항의 단백질을 포함하는 단백질 용액에 노출시키는 것에 의한 것인 용도.
제11항의 조작된 단백질 섬유를 포함하고, 임의로 제9항 또는 제10항의 추가 단백질 섬유를 포함하는, 얇은 단백질 필름 또는 히드로겔.