KR20190115064A

KR20190115064A - 식물 세포에서 니트로게나제 폴리펩티드의 발현

Info

Publication number: KR20190115064A
Application number: KR1020197026185A
Authority: KR
Inventors: 크레이그 크리스토퍼 우드; 로버트 실라스 알렌; 쇼코 오카다; 앤드류 찰스 워든; 킴벌리 델마 틸브룩; 매튜 크레이그 테일러
Original assignee: 커먼웰쓰 사이언티픽 앤 인더스트리알 리서치 오거니제이션
Priority date: 2017-02-06
Filing date: 2018-02-06
Publication date: 2019-10-10
Also published as: MY202283A; PH12019501787A1; RU2019127979A; AU2018216169A1; MX2019009318A; IL268466A; US11802290B2; AU2018216169B2; CA3052215A1; JP2020510413A; EP3577216A1; MX2024000163A; WO2018141030A1; CN110475861A; EP3577216A4; US20200095598A1; ZA201905440B; JP2023052262A; BR112019016166A2; RU2019127979A3

Abstract

본 발명은 식물 세포의 미토콘드리아에서 니트로게나제 폴리펩티드의 생성을 위한 방법 및 수단에 관한 것이다. 본 개시는 하나 이상의 MTP-Nif 융합 및/또는 번역 NifD-NifK 및 NifE-NifN 융합을 발현하는 식물 세포를 제공한다. 본 개시는 또한 상기 융합을 암호화하는 핵산 구조물뿐만 아니라 상기 융합을 발현시키고 이를 식물 세포의 미토콘드리아에 표적화하기 위한 발현 구조물을 제공한다. 본 개시는 또한 본 발명의 식물 세포를 포함하는 트랜스제닉 식물 및 상기로부터 수득된 생성물을 제공한다.

Description

식물 세포에서 니트로게나제 폴리펩티드의 발현

본 발명은 식물 세포의 미토콘드리아에서 니트로게나제 폴리펩티드의 생성을 위한 방법 및 수단에 관한 것이다.

질소고정세균은 효소 복합체, 니트로게나제에 의해 촉매화되는 생물학적 질소 고정(BNF)을 통해 N₂ 기체로부터 암모니아를 생성시킨다. 거기에다 현대 농업의 수요는 상기 고정된 질소원을 훨씬 앞지르며, 결과적으로 공업적으로-생산된 질소 비료가 농업에서 광범위하게 사용된다(Smil, 2002). 그러나, 비료의 생산 및 적용은 모두 오염의 원인이며(Good and Beatty, 2011) 지속불가능한 것으로 간주된다(Rockstrom et al., 2009). 전세계에 살포된 비료의 대부분은 농작물에 의해 흡수되지 않아(Cui et al., 2013; de Bruijn, 2015), 비료 유출물, 잡초의 촉진 및 수로의 부영양화를 도출한다(Good and Beatty, 2011). 생성된 녹조는 산소 수준을 감소시켜, 국소적인 및 산호초 전체를 통한 연안의 환경 손상을 야기한다(De'ath et al., 2012; Glibert et al., 2014; Sutton et al., 2008). 더욱 또한, 과도한 비옥화는 많은 선진국에서 문제가 되지만, 몇몇 지역에서 그의 유용성은 작황을 제한한다(Mueller et al., 2012). 비료 자체의 생산은 상당한 에너지 투입을 요하며, 비용은 연간 미화 1000억 달러로 추정된다.

명백하게 공업적으로-생산된 질소 의존성을 감소시키는 전략이 요구된다. 이를 위해서, 생물학적 질소 고정이 가능하게 식물을 조작하는 개념이 오랫 동안 상당한 관심을 끌어왔으며(Merrick and Dixon, 1984), 최근 검토가 집중되었다(de Bruijn, 2015; Oldroyd and Dixon, 2014). 잠재적인 접근법은 i) 콩과식물로부터 곡류로 질소자급영양체의 공생 관계를 확장시키고(Santi et al., 2013), ii) 세포내 공생 미생물을 질소 고정이 가능하도록 재-조작하고(Geddes et al., 2015), iii) 식물 세포내로 니트로게나제를 유전자 조작함을 포함한다(Curatti and Rubio, 2014). 이들 접근법은 모두 기술적 어려움으로 인해 원대하고 투기적이다.

질소고정세균에서 생물학적 질소 고정이 가능한 효소 복합체인 니트로게나제는 그의 생합성 및 기능을 위해 다중유전자 조립 경로를 요하며, 광범위하게 검토되고 있다(Hu and Ribbe, 2013; Rubio and Ludden, 2008; Seefeldt et al., 2009). 정규의 철-몰리브데늄 니트로게나제의 성분은 NifD 및 NifK라 표기되는 촉매 단백질 및 전자 공여체 NifH를 포함한다. 약 12개의 다른 단백질, 구체적으로 NifM, NifS, NifU, NifE, NifN, NifX, NifV, NifJ, NifY, NifF, NifZ 및 NifQ가 상기 복합체의 성숙화, 스캐폴딩 및 보조-인자 삽입을 포함한 질소고정세균에서의 니트로게나제 조립에 관련된다. 유전자 병변, 질소자급영양체 대 비-질소고정 원핵생물간의 상보성 분석 및 계통발생 분석(Dos Santos et al., 2012; Temme et al., 2012; Wang et al., 2013)은 핵심 성분으로서 간주되는 Nif 단백질(NifD, NifK, NifB, NifE 및 NifN)의 부분집합을 도출한 반면, 다른 것들은 최적화된 활성에 필요한 것으로 생각되며 보조적인 것으로 간주된다. 특정한 생화학적 조건이 또한 니트로게나제 조립 및 기능에 요구된다. 이들 중에서 가장 중요한 것은 니트로게나제가 대단히 산소 민감성이라는 것이다(Robson and Postgate, 1980). 더욱 또한 다량의 ATP, 환원제, 쉽게 입수할 수 있는 Fe, Mo, S-아데노실메티오닌 및 호모시트레이트가 금속단백질 촉매 중심의 생합성 및 기능에 요구된다(Hu and Ribbe, 2013; Rubio and Ludden, 2008). 이들 인자는 모두 식물 세포에서 기능성 니트로게나제 복합체 생성의 기술적 어려움에 원인이 된다.

본 발명자는 식물 세포에서 NifD의 생성에 관찰된 어려움에 비추어, 식물 세포에서 동량의 NifD 및 NifK를 갖는 것이 중요함을 판단하였다. 폴리펩티드의 상세한 분석은 상기가 융합 단백질로서 발현되며 기능을 유지할 수 있었을 뿐만 아니라 야생형 C-말단을 갖는 NifK 성분의 중요성을 지적하였다. 따라서, 하나의 태양에서, 본 발명은 미토콘드리아 및

(i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP),

(ii) N-말단 및 C-말단을 갖는 NifD 폴리펩티드(ND),

(iii) 올리고펩티드 링커(linker), 및

(iv) N-말단을 갖는 NifK 폴리펩티드(NK)

를 포함하는 융합 폴리펩티드를 포함하는 식물 세포를 제공하며, 여기에서 MTP의 C-말단은 ND의 N-말단에 번역에 의해 융합되고, 링커는 ND의 C-말단 및 NK의 N-말단에 번역에 의해 융합된다.

하나의 실시태양에서, 융합 폴리펩티드의 C-말단은 NK의 C-말단이다. 바람직한 실시태양에서, NK의 C-말단은 야생형 NifK 폴리펩티드의 C 말단과 동일하다, 즉 NK는 임의의 인공적으로 부가된 C-말단 연장이 없다. 야생형 C-말단을 갖는 것이 NifK 활성을 유지하는데 중요하다.

또 다른 실시태양에서, 링커는 ND 및 NK를 식물 세포 또는 세균 세포에서 기능적 배열로 회합시키기에 충분한 길이를 갖는다. 하나의 실시태양에서, 링커는 길이가 8 내지 50 아미노산이다. 바람직하게, 링커는 길이가 적어도 약 20 아미노산, 적어도 약 25 아미노산, 또는 적어도 약 30 아미노산이다. 보다 바람직하게, 링커는 길이가 25 내지 35 아미노산이다. 가장 바람직하게, 링커는 길이가 약 30 아미노산이다. 이와 관련하여, "약 30"은 27, 28, 29, 30, 31, 32 또는 33 아미노산을 의미한다.

하나의 실시태양에서, 융합 폴리펩티드 중 NifD 폴리펩티드 및 NifK 폴리펩티드는 2개의 별도의 폴리펩티드로서 존재하는 경우의 NifD 폴리펩티드 및 NifK 폴리펩티드와 동일한 기능을 갖는다. 바람직하게, 융합 폴리펩티드의 생화학적 활성은 야생형 NifD 폴리펩티드 및 야생형 NifK 폴리펩티드와 동일하다.

본 발명은 또한 식물 세포에서 동량의 NifE 및 NifN을 갖는 중요성을 판단하였다. 폴리펩티드의 상세한 분석은 상기가 융합 단백질로서 발현되고 기능을 유지할 수 있었을 뿐만 아니라 Nif 폴리펩티드가 기능성으로 존재하기 위해서 링커가 필요함을 지적하였다. 따라서, 추가의 태양에서 본 발명은 미토콘드리아 및

(i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP),

(ii) N-말단 및 C-말단을 갖는 NifE 폴리펩티드(NE),

(iii) 올리고펩티드 링커, 및

(iv) N-말단을 갖는 NifN 폴리펩티드(NN)

를 포함하는 융합 폴리펩티드를 포함하는 식물 세포를 제공하며, 여기에서 MTP의 C-말단은 NE의 N-말단에 번역에 의해 융합되고, 링커는 NE의 C-말단 및 NN의 N-말단에 번역에 의해 융합된다.

상기 태양의 하나의 실시태양에서, 링커는 NE 및 NN을 식물 세포 또는 세균 세포에서 기능적 배열로 회합시키기에 충분한 길이를 갖는다. 예를 들어, 하나의 실시태양에서 링커는 길이가 적어도 약 70 Å, 적어도 약 100 Å, 또는 약 70 Å 내지 약 150 Å, 또는 약 100 Å 내지 약 120 Å, 또는 약 100 Å, 또는 약 104 Å이다. 하나의 실시태양에서, 올리고펩티드 링커는 길이가 적어도 약 20 아미노산, 또는 적어도 약 30 아미노산, 또는 적어도 약 40 아미노산, 또는 약 20 아미노산 내지 약 70 아미노산, 또는 약 30 아미노산 내지 약 70 아미노산, 또는 약 30 아미노산 내지 약 60 아미노산, 또는 약 30 아미노산 내지 약 50 아미노산, 또는 약 25 아미노산, 또는 약 30 아미노산, 또는 약 35 아미노산, 또는 약 40 아미노산, 또는 약 45 아미노산, 또는 약 46 아미노산, 또는 약 50 아미노산, 또는 약 55 아미노산이다.

하나의 실시태양에서, 융합 폴리펩티드 중 NifE 폴리펩티드 및 NifN 폴리펩티드는 2개의 별도의 폴리펩티드로서 존재하는 경우의 NifE 폴리펩티드 및 NifN 폴리펩티드와 동일한 기능을 갖는다. 바람직하게, 융합 폴리펩티드의 생화학적 활성은 야생형 NifE 폴리펩티드 및 야생형 NifN 폴리펩티드와 동일하다.

하나의 실시태양에서, MTP는 융합 폴리펩티드가 기질 가공 프로테아제(MPP)에 의해 절단되어 N-말단 절단 펩티드 및 (ii) 내지 (iv)를 포함하는 가공된 융합 폴리펩티드(CF)를 생성시킬 수 있도록 MPP에 대한 프로테아제 절단 부위를 포함한다. 하나의 실시태양에서, CF는 MTP의 C-말단 아미노산 중 전부는 아닌 일부, 바람직하게는 MTP의 C-말단 아미노산 중 5 내지 45 아미노산을 포함한다. 하나의 실시태양에서, MPP에 의한 절단은 융합 폴리펩티드로부터 5 내지 50 아미노산을 제거하여 CF를 생성시킨다. 바람직한 실시태양에서, CF는 MTP의 C-말단으로부터 약 5 내지 약 11 아미노산 잔기, 예를 들어 MTP의 C-말단으로부터 6 또는 7 아미노산, 7 또는 8 아미노산, 8 또는 9 아미노산, 9 또는 10 아미노산, 또는 11 또는 12 아미노산을 포함한다.

상기 두 태양의 하나의 실시태양에서, 식물 세포는 하나 이상의 NF 융합 폴리펩티드(NF)를 추가로 포함하며, 각각의 NF는 (i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP) 및 (ii) N-말단을 갖는 Nif 폴리펩티드(NP)를 포함하며, 여기에서 MTP의 C-말단은 NP의 N-말단에 번역에 의해 융합되고, 각각의 MTP는 독립적으로 동일하거나 상이하며 각각의 NP는 독립적으로 동일하거나 상이하고, 미토콘드리아는 하나 이상의 NF 및/또는 그의 가공된 생성물(CF)을 포함하며, 각각의 CF는, 존재하는 경우, 그의 MTP 내의 상응하는 NF의 절단에 의해 생성된다. 바람직하게, NF 폴리펩티드 중 적어도 하나는 NifH이다. 바람직한 실시태양에서, 각각의 CF는 독립적으로 MTP의 C-말단으로부터 약 5 내지 약 11 아미노산 잔기, 예를 들어 MTP의 C-말단으로부터 6 또는 7 아미노산, 7 또는 8 아미노산, 8 또는 9 아미노산, 9 또는 10 아미노산, 또는 11 또는 12 아미노산을 포함한다.

하나의 실시태양에서, 융합 폴리펩티드(들)를 암호화하는 외인성 폴리뉴클레오티드(들)를 세포의 게놈내에 통합시킨다.

본 발명자는 또한 모두 16개의 클렙시엘라 뉴모니아에(Klebsiella pneumoniae) 생합성 및 기능성 니트로게나제(Nif) 단백질이 식물 세포에서, 예를 들어 니코티아나 벤타미아나(Nicotiana benthamiana) 잎에서 미토콘드리아 표적화 펩티드(MTP)-Nif 융합물로서 개별적으로 발현될 수 있음을 입증하였다. 본 발명자는 이들 융합물이 니트로게나제 기능을 잠재적으로 지지하는 생화학적 및 유전학적 특징을 갖는 세포이하 장소인 미토콘드리아 기질(MM)에 정확하게 표적화됨을 입증하였다. NifJ, NifH, NifD, NifK, NifY, NifE, NifN, NifX, NifU, NifS, NifV, NifM, NifF, NifB 및 NifQ 폴리펩티드를 웨스턴 블럿 분석에 의해 검출할 수 있었다. 그러나, 촉매분해에 관련된 핵심 성분인 NifD는 최소로 풍부하였다. 니트로게나제 NifD-NifK 이종이량체의 결정 구조를 사용하여, 발현 수준을 개선시키는 NifD-NifK 번역 융합 단백질을 설계하였다. 최종적으로, 4개의 Nif 융합 폴리펩티드(NifB, NifS, NifH, NifY)가 성공적으로 동시-발현되었으며, 이는 니트로게나제의 다수의 성분을 미토콘드리아에 표적화할 수 있음을 입증한다. 이러한 결과는 질소 기체의 암모니아로의 환원을 지지하기 위한 세포내 환경 중 니트로게나제 구성성분의 재편성 가능성을 확립시킨다.

모든 Nif 단백질 중에서, 니트로게나제 촉매 복합체의 필수 성분인 NifD는 발현이 가장 어렵다. NifD 단백질의 낮은 수준은 NIFD RNA의 높은 수준과 상반되었으며, 이는 번역률 또는 단백질 안정성이 NifD 단백질 풍부성을 제한하고 있음을 암시한다. 촉매분해에서 NifD의 결정적인 중요성인, 세균에서 고도로 발현되고(Poza-Carrion et al., 2014), 바람직하게는 NifK와의 동몰비로 발현되어야 하는 그의 요건을 고려하여, 본 발명자는 상기 2개의 핵심 성분을 함께 융합시켰으며 NifD 풍부성이 상기 전략을 통해 증대될 수 있음을 발견하였다. 상기 NifD-NifK 융합은 또한 단일 카세트에 의한 발현에 연계되는 장점을 가졌으며, 이는 이상적인 1:1 비에서 상기 두 서브유닛 모두의 번역을 허용하여 고유의 이종이량체의 화학량론을 모방하게 한다. 더욱 또한 링커 자체를, 상기 2개의 서브유닛이 촉매분해에 요구되는 정확한 α₂β₂ 이종사량체성 구조를 형성하기에 충분한 가요성을 허용하도록 설계하였다. 본 발명자는 NifD-NifK 융합 폴리펩티드가 개별적인 NifD 및 NifK 발현을, 가능하게는 앞서 입증된 것보다 더 큰 효능으로 적어도 기능적으로 대체할 것임을 기대한다.

따라서, 하나의 태양에서, 본 발명은 미토콘드리아 및 (i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP) 및 (ii) N-말단을 갖는 NifD 폴리펩티드(ND)를 포함하는 NifD 융합 폴리펩티드(NDF)를 암호화하는 외인성 폴리뉴클레오티드를 포함하는 식물 세포를 제공하며, 여기에서 MTP의 C-말단은 ND의 N-말단에 번역에 의해 융합되고, 미토콘드리아는 NDF 및/또는 그의 가공된 NifD 생성물(CDF)을 포함하며, CDF는, 존재하는 경우, 상기 MTP 내의 NDF의 절단에 의해 생성된다.

하나의 실시태양에서, MTP는 NDF가 기질 가공 프로테아제(MPP)에 의해 절단되어 N-말단 절단 펩티드 및 CDF를 생성시킬 수 있도록 상기 MPP에 대한 프로테아제 절단 부위를 포함한다. 하나의 실시태양에서, CDF는 MTP의 C-말단으로부터 약 5 내지 약 11 아미노산 잔기, 예를 들어 MTP의 C-말단으로부터 6 또는 7 아미노산, 7 또는 8 아미노산, 8 또는 9 아미노산, 9 또는 10 아미노산, 또는 11 또는 12 아미노산을 포함한다.

하나의 태양에서, 본 발명은 하나 이상의 NF 융합 폴리펩티드(NF)를 포함하는 식물 세포를 제공하며, 각각의 NF는 (i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP) 및 (ii) N-말단을 갖는 Nif 폴리펩티드(NP)를 포함하고, 상기 NP는 NifE, NifF, NifJ, NifM, NifN, NifQ, NifS, NifU, NifV, NifW, NifX, NifY 및 NifZ로 이루어지는 그룹 중에서 선택되며, 상기 MTP의 C-말단은 NP의 N-말단에 번역에 의해 융합되고, 각각의 MTP는 독립적으로 동일하거나 상이하며 각각의 NP는 독립적으로 동일하거나 상이하고, 미토콘드리아는 하나 이상의 NF 및/또는 그의 가공된 생성물(CF)을 포함하며, 각각의 CF는, 존재하는 경우, 그의 MTP 내의 상응하는 NF의 절단에 의해 생성된다. 하나의 실시태양에서, NF 폴리펩티드는 NifD, NifH 및 NifK로 이루어지는 그룹 중에서 선택된 Nif 폴리펩티드 중 하나 이상 또는 바람직하게는 전부를 추가로 포함한다. 바람직한 실시태양에서, NifK 및/또는 NifN의 C-말단은 각각 야생형 NifK 폴리펩티드 또는 야생형 NifN 폴리펩티드의 C 말단과 동일하다, 즉 상기 NifK 및/또는 NifN, 바람직하게는 둘 다 임의의 인공적으로 부가된 C-말단 연장이 없다.

바람직한 실시태양에서, 각각의 CF는 독립적으로 MTP의 C-말단으로부터 약 5 내지 약 11 아미노산 잔기, 예를 들어 MTP의 C-말단으로부터 6 또는 7 아미노산, 7 또는 8 아미노산, 8 또는 9 아미노산, 9 또는 10 아미노산, 또는 11 또는 12 아미노산을 포함한다.

또 다른 태양에서, 본 발명은 미토콘드리아, 제1 Nif 융합 폴리펩티드(NF)를 암호화하는 제1 외인성 폴리뉴클레오티드 및 제2 NF를 암호화하는 제2 외인성 폴리뉴클레오티드를 포함하는 식물 세포를 제공하며, 각각의 NF는 (i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP) 및 (ii) N-말단을 갖는 Nif 폴리펩티드(NP)를 포함하고, 여기에서 상기 MTP의 C-말단은 NP의 N-말단에 번역에 의해 융합되며, 각각의 MTP는 독립적으로 동일하거나 상이하고 각각의 NP는 독립적으로 동일하거나 상이하며, 미토콘드리아는 (a) 제1 NF 및/또는 그의 가공된 생성물(제1 CF) 및 (b) 제2 NF 및/또는 그의 가공된 생성물(제2 CF)을 포함하고, 각각의 CF는, 존재하는 경우, 그의 MTP 내의 상응하는 NF의 절단에 의해 생성된다. 바람직한 실시태양에서, 제1 및 제2 NF는 NifE, NifF, NifJ, NifM, NifN, NifQ, NifS, NifU, NifV, NifW, NifX, NifY 및 NifZ로 이루어지는 그룹 중에서 선택된다. 바람직한 실시태양에서, NifK(존재하는 경우) 및/또는 NifN의 C-말단은 각각 야생형 NifK 폴리펩티드 또는 야생형 NifN 폴리펩티드의 C 말단과 동일하다, 즉 상기 NifK 및/또는 NifN, 바람직하게는 둘 다 임의의 인공적으로 부가된 C-말단 연장이 없다.

하나의 실시태양에서, 식물 세포는 하나 이상의 NF를 암호화하는 하나 이상의 외인성 폴리뉴클레오티드를 추가로 포함하며, 각각의 NF는 (i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP) 및 (ii) N-말단을 갖는 Nif 폴리펩티드(NP)를 포함하고, 여기에서 상기 MTP의 C-말단은 NP의 N-말단에 번역에 의해 융합되며, 각각의 MTP는 독립적으로 동일하거나 상이하고 각각의 NP는 독립적으로 동일하거나 상이하며, 미토콘드리아는 하나 이상의 NF 및/또는 그의 가공된 생성물(CF)을 포함하고, 각각의 CF는, 존재하는 경우, 그의 MTP 내의 상응하는 NF의 절단에 의해 생성된다. 바람직한 실시태양에서, 하나 이상의 NF는 NifE, NifF, NifJ, NifM, NifN, NifQ, NifS, NifU, NifV, NifW, NifX, NifY 및 NifZ로 이루어지는 그룹 중에서 선택된다. 바람직한 실시태양에서, NifK(존재하는 경우) 및/또는 NifN의 C-말단은 각각 야생형 NifK 폴리펩티드 또는 야생형 NifN 폴리펩티드의 C 말단과 동일하다, 즉 상기 NifK 및/또는 NifN, 바람직하게는 둘 다 임의의 인공적으로 부가된 C-말단 연장이 없다.

하나 또는 추가의 실시태양에서, MTP 중 적어도 하나, 또는 MTP 중 하나 초과, 또는 각각의 MTP는, 기질 가공 프로테아제(MPP)에 대한 프로테아제 절단 부위를 포함하는 각각의 NF가 MPP에 의해 절단되어 N-말단 절단 펩티드 및 상응하는 CF를 생성시킬 수 있도록 MPP에 대한 프로테아제 절단 부위를 포함한다. 바람직한 실시태양에서, 각각의 CF는 독립적으로 MTP의 C-말단으로부터 약 5 내지 약 11 아미노산 잔기, 예를 들어 MTP의 C-말단으로부터 6 또는 7 아미노산, 7 또는 8 아미노산, 8 또는 9 아미노산, 9 또는 10 아미노산, 또는 11 또는 12 아미노산을 포함한다.

추가의 태양에서, 본 발명은 미토콘드리아 및

(a) NifD 융합 폴리펩티드(NDF)를 암호화하는 제1 외인성 폴리뉴클레오티드(NDF는 (i) C-말단을 갖는 제1 미토콘드리아 표적화 펩티드(MTP1) 및 (ii) N-말단을 갖는 NifD 폴리펩티드(ND)를 포함하고, 여기에서 MTP1의 C-말단은 ND의 N-말단에 번역에 의해 융합된다),

(b) NifH 융합 폴리펩티드(NHF)를 암호화하는 제2 외인성 폴리뉴클레오티드(NHF는 (i) C-말단을 갖는 제2 미토콘드리아 표적화 펩티드(MTP2) 및 (ii) N-말단을 갖는 NifH 폴리펩티드(NH)를 포함하고, 여기에서 MTP2의 C-말단은 NH의 N-말단에 번역에 의해 융합된다), 및

(c) NifK 융합 폴리펩티드(NKF)를 암호화하는 제3 외인성 폴리뉴클레오티드(NKF는 (i) C-말단을 갖는 제3 미토콘드리아 표적화 펩티드(MTP3) 및 (ii) N-말단을 갖는 NifK 폴리펩티드(NK)를 포함하고, 여기에서 제3 MTP의 C-말단은 NK의 N-말단에 번역에 의해 융합된다)

를 포함하는 식물 세포를 제공하며, 여기에서 각각의 MTP1, MTP2 및 MTP3는 독립적으로 동일하거나 상이하고,

식물 세포는, 제1 외인성 폴리뉴클레오티드를 포함하고 제2 및 제3 외인성 폴리뉴클레오티드는 없는 상응하는 식물 세포 중의 NDF 및/또는 CDF의 수준보다 큰 NDF 및/또는 그의 가공된 생성물(CDF) 수준을 포함하고, CDF는, 존재하는 경우, MTP1 내의 NDF의 절단에 의해 생성된다. 바람직한 실시태양에서, 식물 세포는 NifE, NifF, NifJ, NifM, NifN, NifQ, NifS, NifU, NifV, NifW, NifX, NifY 및 NifZ로 이루어지는 그룹 중에서 선택된 하나 이상의 NF를 암호화하는 하나 이상의 외인성 폴리뉴클레오티드를 추가로 포함한다. 바람직한 실시태양에서, NifK 및/또는 NifN(존재하는 경우)의 C-말단은 각각 야생형 NifK 폴리펩티드 또는 야생형 NifN 폴리펩티드의 C 말단과 동일하다, 즉 상기 NifK 및/또는 NifN, 바람직하게는 둘 다 임의의 인공적으로 부가된 C-말단 연장이 없다.

하나의 실시태양에서, CDF는 미토콘드리아 중에 존재한다.

추가의 실시태양에서, 미토콘드리아는 NHF(CHF) 및 NKF(CKF) 중 하나 또는 둘 다의 가공된 생성물을 추가로 포함하며, 여기에서 CHF 및 CKF(존재하는 경우)는 각각 MTP2 및 MTP3 내의 NHF 및 NKF의 절단에 의해 생성된다. 바람직한 실시태양에서, CHF 및/또는 CKF는 독립적으로 MTP의 C-말단으로부터 약 5 내지 약 11 아미노산 잔기, 예를 들어 MTP의 C-말단으로부터 6 또는 7 아미노산, 7 또는 8 아미노산, 8 또는 9 아미노산, 9 또는 10 아미노산, 또는 11 또는 12 아미노산을 포함한다.

추가의 실시태양에서, 식물 세포는 (i) MTP1이, NDF가 MPP에 의해 절단되어 N-말단 절단 펩티드 및 CDF를 생성시킬 수 있도록 MPP에 대한 프로테아제 절단 부위를 포함하고, (ii) MTP2가, NHF가 MPP에 의해 절단되어 N-말단 절단 펩티드 및 가공된 NifH 생성물(CHF)을 생성시킬 수 있도록 MPP에 대한 프로테아제 절단 부위를 포함하고, (iii) MTP3가, NKF가 MPP에 의해 절단되어 N-말단 절단 펩티드 및 가공된 NifK 생성물(CKF)을 생성시킬 수 있도록 MPP에 대한 프로테아제 절단 부위를 포함한다 중 하나, 하나 이상, 또는 이들 전부를 특징으로 하며, 여기에서 미토콘드리아는 CDF, CHF 및 CKF 중 하나 이상 또는 전부를 포함한다. 바람직한 실시태양에서, 각각의 CDF, CHF 및/또는 CKF는 독립적으로 MTP의 C-말단으로부터 약 5 내지 약 11 아미노산 잔기, 예를 들어 MTP의 C-말단으로부터 6 또는 7 아미노산, 7 또는 8 아미노산, 8 또는 9 아미노산, 9 또는 10 아미노산, 또는 11 또는 12 아미노산을 포함한다.

추가의 태양에서, 본 발명은 미토콘드리아, NifD 폴리펩티드(ND)를 암호화하는 제1 외인성 폴리뉴클레오티드 및 NifK 폴리펩티드(NK)를 암호화하는 제2 외인성 폴리뉴클레오티드를 포함하는 식물 세포를 제공하고, 여기에서 ND 및 NK 중 하나 또는 둘 다는 그의 N-말단에서, C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP)에 번역에 의해 융합되고, ND 및 NK가 모두 MTP에 번역에 의해 융합되는 경우, 각각의 MTP는 독립적으로 동일하거나 상이하고, 제2 외인성 폴리뉴클레오티드는 제1 외인성 폴리뉴클레오티드에 공유 결합하거나 공유 결합하지 않으며, 식물 세포는 대략 동일한 ND 수준 및 NK 수준을 포함한다.

바람직한 실시태양에서, NifK의 C-말단은 야생형 NifK 폴리펩티드의 C-말단과 동일하다, 즉 NifK는 임의의 인공적으로 부가된 C-말단 연장이 없다. 바람직한 실시태양에서, ND 및/또는 NK의 절단은 MTP의 C-말단으로부터 약 5 내지 약 11 아미노산 잔기, 예를 들어 MTP의 C-말단으로부터 6 또는 7 아미노산, 7 또는 8 아미노산, 8 또는 9 아미노산, 9 또는 10 아미노산, 또는 11 또는 12 아미노산을 갖는 절단된 생성물 폴리펩티드를 생성시킨다.

하나의 실시태양에서, ND의 수준 및 NK의 수준은 MTP-Nif 융합 및 그의 가공된 생성물을 포함한다.

추가의 태양에서, 본 발명은 미토콘드리아 및 NifH 융합 폴리펩티드(NHF)를 암호화하는 외인성 폴리뉴클레오티드를 포함하는 식물 세포를 제공하고, NHF는 (i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP) 및 (ii) N-말단을 갖는 NifH 폴리펩티드(NH)를 포함하며, 여기에서 MTP의 C-말단은 NH의 N-말단에 번역에 의해 융합되고, 미토콘드리아는 NHF 및/또는 그의 가공된 NifH 생성물(CHF)을 포함하며, CHF(존재하는 경우)는 MTP 내의 NHF의 절단에 의해 생성된다.

하나의 실시태양에서, MTP는 NHF가 MPP에 의해 절단되어 N-말단 절단 펩티드 및 CHF를 생성할 수 있도록 기질 가공 프로테아제(MPP)에 대한 프로테아제 절단 부위를 포함한다. 하나의 실시태양에서, CHF는 MTP의 C-말단으로부터 약 5 내지 약 11 아미노산 잔기, 예를 들어 MTP의 C-말단으로부터 6 또는 7 아미노산, 7 또는 8 아미노산, 8 또는 9 아미노산, 9 또는 10 아미노산, 또는 11 또는 12 아미노산을 포함한다.

추가의 태양에서, 본 발명은 미토콘드리아 및 Nif 융합 폴리펩티드(NF)를 암호화하는 외인성 폴리뉴클레오티드를 포함하는 식물 세포를 제공하며, NF는 (i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP) 및 (ii) N-말단을 갖는 Nif 폴리펩티드(NP)를 포함하고, 여기에서 MTP의 C-말단은 NP의 N-말단에 번역에 의해 융합되며, 미토콘드리아는 NF 및/또는 그의 가공된 NP 생성물(CF)을 포함하고, CF(존재하는 경우)는 MTP 내의 NF의 절단에 의해 생성되며, NF 및 또는 CF, 바람직하게는 NF 및 CF 모두는 상응하는 야생형 Nif 폴리펩티드에 비해 고유의 C-말단을 갖는다.

바람직한 실시태양에서, NP는 NifD 폴리펩티드, NifK 폴리펩티드, 및 NifN 폴리펩티드로 이루어지는 그룹 중에서 선택된다. 바람직하게는 NifK 및 NifN 모두.

추가의 태양에서, 본 발명은 미토콘드리아 및 NifD 융합 폴리펩티드(NDF)를 암호화하는 제1 외인성 폴리뉴클레오티드(NDF는 (i) C-말단을 갖는 제1 미토콘드리아 표적화 펩티드(MTP1) 및 (ii) N-말단을 갖는 NifD 폴리펩티드(ND)를 포함하고, 여기에서 MTP1의 C-말단은 ND의 N-말단에 번역에 의해 융합된다), 및

(a) NifH 융합 폴리펩티드(NHF)를 암호화하는 제2 외인성 폴리뉴클레오티드(NHF는 (i) C-말단을 갖는 제2 미토콘드리아 표적화 펩티드(MTP2) 및 (ii) N-말단을 갖는 NifH 폴리펩티드(NH)를 포함하고, 여기에서 MTP2의 C-말단은 NH의 N-말단에 번역에 의해 융합된다),

(b) NifK 융합 폴리펩티드(NKF)를 암호화하는 제3 외인성 폴리뉴클레오티드(NKF는 (i) C-말단을 갖는 제3 미토콘드리아 표적화 펩티드(MTP3) 및 (ii) N-말단을 갖는 NifK 폴리펩티드(NK)를 포함하고, 여기에서 MTP3의 C-말단은 NK의 N-말단에 번역에 의해 융합되며, 바람직하게 NKF는 야생형 NifK 폴리펩티드에 비해 고유의 C-말단을 갖는다), 및

(c) NDF, NHF 및 NKF 이외의 Nif 융합 폴리펩티드(NF)를 암호화하는 외인성 제4 폴리뉴클레오티드(NF는 (i) C-말단을 갖는 제4 미토콘드리아 표적화 펩티드(MTP4) 및 (ii) N-말단을 갖는 Nif 폴리펩티드(NP)를 포함하고, 여기에서 MTP4의 C-말단은 NP의 N-말단에 번역에 의해 융합된다)

중 하나, 하나 이상, 또는 전부를 포함하는 식물 세포를 제공하며, 여기에서 각각의 MTP1, MTP2, MPT3 및 MTP4는 독립적으로 동일하거나 상이하다. 하나의 실시태양에서, 제4 외인성 폴리뉴클레오티드는 NifE, NifF, NifJ, NifM, NifN, NifQ, NifS, NifU, NifV, NifW, NifX, NifY 및 NifZ로 이루어지는 그룹 중에서 선택된 하나 이상의 NP를 암호화한다. 바람직한 실시태양에서, NifK 및/또는 NifN(존재하는 경우)의 C-말단은 각각 야생형 NifK 폴리펩티드 또는 야생형 NifN 폴리펩티드의 C 말단과 동일하다, 즉 상기 NifK 및/또는 NifN, 바람직하게는 둘 다 임의의 인공적으로 부가된 C-말단 연장이 없다.

하나의 실시태양에서, 각각의 NF는 미토콘드리아내로 전좌될 수 있다.

상기 태양 중 임의의 하나의 실시태양에서, 미토콘드리아는 (i) NifD, NifH, NifK, NifB, NifE 및 NifN, 또는 (ii) NifD, NifH, NifK 및 NifS로 이루어지는 그룹 중에서 선택된 하나, 적어도 2개, 적어도 3개, 적어도 4개, 또는 모든 Nif 폴리펩티드를 포함한다.

하나 또는 추가의 실시태양에서, Nif 융합 폴리펩티드 중 하나, 하나 이상 또는 전부는 식물 세포에서 기질 가공 프로테아제(MPP)에 의해 MTP 내에서 절단되며, 바람직하게는 적어도 NifD 융합 폴리펩티드 또는 NifH 융합 폴리펩티드는 MPP에 의해 절단된다.

하나 또는 추가의 실시태양에서, ND, NDF, CDF, NH, NHF, CHF, NK, NKF, CKF, NF, CFNB, NE, NN 및 NS로 이루어지는 그룹 중에서 선택된 폴리펩티드 중 하나 이상은, 바람직하게는 NPC가 니트로게나제 활성을 갖도록, 적어도 1, 바람직하게는 적어도 2, 또는 적어도 3, 또는 적어도 4, 또는 적어도 5, 또는 적어도 6, 또는 적어도 7개의 다른 Nif 폴리펩티드와 회합하여, Nif 단백질 복합체(NPC)를 형성할 수 있다.

하나 또는 추가의 실시태양에서, CDF, CKF, CHF 또는 CF는 크기가 각각 ND, NK, NH 또는 NP보다, 바람직하게는 5 내지 50 아미노산 잔기만큼 더 크고/크거나, CDF, CKF, CHF 또는 CF는 크기가 각각 NDF, NKF, NHF 또는 NF보다, 바람직하게는 5 내지 45 아미노산 잔기만큼 더 작다. 바람직한 실시태양에서, 각각의 CDF, CKF, CHF 또는 CF는 독립적으로 MTP의 C-말단으로부터 약 5 내지 약 11 아미노산 잔기, 예를 들어 MTP의 C-말단으로부터 6 또는 7 아미노산, 7 또는 8 아미노산, 8 또는 9 아미노산, 9 또는 10 아미노산, 또는 11 또는 12 아미노산을 포함한다.

하나 또는 추가의 실시태양에서, MTP는 적어도 10 아미노산, 바람직하게는 10 내지 80 아미노산을 포함한다.

하나 또는 추가의 실시태양에서, MTP 중 적어도 하나, 그 이상, 또는 전부는 미토콘드리아 단백질 전구체의 MTP, 또는 그의 변이체(variant), 바람직하게는 식물 MTP를 포함한다.

하나 또는 추가의 실시태양에서, 외인성 폴리뉴클레오티드(들)를 세포의 게놈내에 통합시킨다.

하나 또는 추가의 실시태양에서, 세포는 원형질체가 아니다.

하나 또는 추가의 실시태양에서, 세포는 아라비도프시스 탈리아나(Arabidopsis thaliana) 원형질체 이외의 세포이다.

추가의 태양에서, 본 발명은 본 발명에 따른 세포를 포함하는 트랜스제닉 식물(transgenic plant)을 제공하며, 여기에서 트랜스제닉 식물은 외인성 폴리뉴클레오티드(들)에 대해 트랜스제닉이고/이거나 트랜스제닉 식물은 융합 폴리펩티드(들)를 암호화하는 외인성 폴리뉴클레오티드(들)에 대해 트랜스제닉이다.

하나의 실시태양에서, 외인성 폴리뉴클레오티드 중 하나, 하나 이상, 또는 전부는 식물의 뿌리에서 발현된다, 바람직하게는 식물의 잎에서보다는 식물의 뿌리에서 더 큰 수준으로 발현된다.

하나 또는 추가의 실시태양에서, 트랜스제닉 식물은 상응하는 야생형 식물에 비해 증가된 수율, 바이오매스, 생장률, 활력, 생물학적 질소 고정으로부터 유래된 질소 이득, 질소 사용 효율, 비생물 스트레스 내성, 및/또는 영양소 결핍 내성의, 상응하는 야생형 식물에 비해 변경된 표현형을 갖는다.

대안의 실시태양에서, 트랜스제닉 식물은 상응하는 야생형 식물에 비해 동일한 생장률 및/또는 표현형을 갖는다.

하나 또는 추가의 실시태양에서, 트랜스제닉 식물은 밀, 벼, 옥수수, 라이밀(triticale), 귀리, 또는 보리와 같은 곡류 식물, 바람직하게는 밀이다.

하나의 실시태양에서, 트랜스제닉 식물은 외인성 폴리뉴클레오티드(들)에 대해 동형접합성 또는 이형접합성이다.

하나 또는 추가의 실시태양에서, 트랜스제닉 식물은 현장에서 재배 중이다.

추가의 태양에서, 본 발명은 현장에서 재배 중인 적어도 100개의 본 발명에 따른 식물의 집단을 제공한다.

추가의 태양에서, 본 발명은 NifD 융합 폴리펩티드(NDF)를 제공하며, NDF는 (i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP) 및 (ii) N-말단을 갖는 NifD 폴리펩티드(ND)를 포함하고, 여기에서 MTP의 C-말단은 ND의 N-말단에 번역에 의해 융합된다.

추가의 태양에서, 본 발명은 NifH 융합 폴리펩티드(NHF)를 제공하며, NHF는 (i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP) 및 (ii) N-말단을 갖는 NifH 폴리펩티드(NH)를 포함하고, 여기에서 MTP의 C-말단은 NH의 N-말단에 번역에 의해 융합된다.

추가의 태양에서, 본 발명은 Nif 융합 폴리펩티드(NF)를 제공하며, NF는 (i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP) 및 (ii) N-말단을 갖는 Nif 폴리펩티드(NP)를 포함하고, 여기에서 MTP의 C-말단은 NP의 N-말단에 번역에 의해 융합되고, NF는 상응하는 야생형 Nif 폴리펩티드에 비해 고유의 C-말단을 갖는다.

바람직한 실시태양에서, NP는 NifD 폴리펩티드, NifK 폴리펩티드, 및 NifN 폴리펩티드로 이루어지는 그룹 중에서 선택된다.

추가의 태양에서, 본 발명은 Nif 융합 폴리펩티드(NF), NifK 융합 폴리펩티드(NKF) 및 NifN 융합 폴리펩티드(NNF)의 조합을 제공하며, 각각의 NF는 (i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP) 및 (ii) N-말단을 갖는 Nif 폴리펩티드(NP)를 포함하고, 여기에서 MTP의 C-말단은 NP의 N-말단에 번역에 의해 융합되고, 각각의 NF의 MTP는 독립적으로 동일하거나 상이하며, 각각의 NKF 및 NNF는 상응하는 야생형 Nif 폴리펩티드에 비해 고유의 C-말단을 갖는다.

추가의 태양에서, 본 발명은

(i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP),

(ii) N-말단 및 C-말단을 갖는 NifD 폴리펩티드(ND),

(iii) 올리고펩티드 링커, 및

(ii) N-말단을 갖는 NifK 폴리펩티드(NK)

를 포함하는 융합 폴리펩티드를 제공하며, 여기에서 MTP의 C-말단은 ND의 N-말단에 번역에 의해 융합되고, 링커는 ND의 C-말단 및 NK의 N-말단에 번역에 의해 융합된다.

하나의 실시태양에서, 링커는 ND 및 NK가 식물 세포 또는 세균 세포에서 기능적 배열로 회합되게 하기에 충분한 길이를 갖는다. 하나의 실시태양에서, 링커는 길이가 8 내지 50 아미노산이다. 바람직하게, 링커는 길이가 적어도 약 20 아미노산, 적어도 약 25 아미노산, 또는 적어도 약 30 아미노산이다.

하나의 실시태양에서, 융합 폴리펩티드의 C-말단은 NK의 C-말단이다.

또 다른 태양에서, 본 발명은

(i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP),

(ii) N-말단 및 C-말단을 갖는 NifE 폴리펩티드(NE),

(iii) 올리고펩티드 링커, 및

(ii) N-말단을 갖는 NifN 폴리펩티드(NN)

를 포함하는 융합 폴리펩티드를 제공하며, 여기에서 MTP의 C-말단은 NE의 N-말단에 번역에 의해 융합되고, 링커는 NE의 C-말단 및 NN의 N-말단에 번역에 의해 융합된다.

하나의 실시태양에서, 링커는 NE 및 NN이 식물 세포 또는 세균 세포에서 기능적 배열로 회합되게 하기에 충분한 길이를 갖는다. 예를 들어, 하나의 실시태양에서, 링커는 길이가 적어도 약 70 Å, 적어도 약 100 Å, 또는 약 70 Å 내지 약 150 Å, 또는 약 100 Å 내지 약 120 Å, 또는 약 100 Å, 또는 약 104 Å이다. 상기 태양의 추가의 실시태양에서, 올리고펩티드 링커는 길이가 적어도 약 20 아미노산, 또는 적어도 약 30 아미노산, 또는 적어도 약 40 아미노산, 또는 약 20 아미노산 내지 약 70 아미노산, 또는 약 30 아미노산 내지 약 70 아미노산, 또는 약 30 아미노산 내지 약 60 아미노산, 또는 약 30 아미노산 내지 약 50 아미노산, 또는 약 25 아미노산, 또는 약 30 아미노산, 또는 약 35 아미노산, 또는 약 40 아미노산, 또는 약 45 아미노산, 또는 약 46 아미노산, 또는 약 50 아미노산, 또는 약 55 아미노산이다.

하나의 실시태양에서, 상기 태양 중 어느 하나의 융합 폴리펩티드(들)는 기질 가공 프로테아제(MPP)에 의해 절단되어 하나 이상의 가공된 Nif 폴리펩티드 생성물을 생성시킬 수 있다.

추가의 실시태양 중 하나에서, 융합 폴리펩티드(들)는 식물 세포 또는 세균 세포, 바람직하게는 식물 세포의 미토콘드리아 중에 존재한다.

추가의 태양에서, 본 발명은 융합 폴리펩티드(들)의 MTP 내에서 절단에 의해 본 발명에 따른 융합 폴리펩티드(들)로부터 생성된 가공된 Nif 폴리펩티드를 제공한다.

하나의 실시태양에서, 가공된 Nif 폴리펩티드는 식물 세포의 미토콘드리아 기질 중에서 MPP에 의한 융합 폴리펩티드의 절단에 의해 생성되었다.

하나 또는 추가의 실시태양에서, 가공된 Nif 폴리펩티드는 식물 세포 또는 세균 세포, 바람직하게는 식물 미토콘드리아, 보다 바람직하게는 식물 세포 미토콘드리아의 미토콘드리아 기질(MM) 중에 존재한다.

하나 또는 추가의 실시태양에서, 융합 폴리펩티드(들) 또는 가공된 Nif 폴리펩티드는 임의로 세균 세포 중에서 측정된 바와 같이, 상응하는 야생형 Nif 폴리펩티드와 동일한 생화학적 활성을 갖는다, 바람직하게는 상응하는 야생형 Nif 폴리펩티드와 대략 동일한 수준의 생화학적 활성을 갖는다.

하나 또는 추가의 실시태양에서, 융합 폴리펩티드(들) 또는 가공된 Nif 폴리펩티드는, 바람직하게는 Nif 단백질 복합체(NPC)가 니트로게나제 활성을 갖도록, 적어도 1, 바람직하게는 적어도 2, 또는 적어도 3, 또는 적어도 4, 또는 적어도 5, 또는 적어도 6, 또는 적어도 7개의 다른 Nif 폴리펩티드와 회합하여 NPC를 형성시킨다.

추가의 태양에서, 본 발명은 본 발명에 따른 융합 폴리펩티드 또는 가공된 Nif 폴리펩티드 중 하나, 하나 이상 또는 전부를 암호화하는 폴리뉴클레오티드를 제공한다.

하나의 실시태양에서, NF는 NifD 융합 폴리펩티드(NDF)이고 폴리뉴클레오티드는

(i) NifH 융합 폴리펩티드(NHF)(NHF는 C-말단을 갖는 제2 미토콘드리아 표적화 펩티드(MTP2) 및 상기 MTP2의 C-말단이 NifH 폴리펩티드(NH)의 N-말단에 번역에 의해 융합되도록 N-말단을 갖는 NH를 포함한다),

(ii) NifK 융합 폴리펩티드(NKF)(NKF는 C-말단을 갖는 제3 미토콘드리아 표적화 펩티드(MTP3) 및 상기 MTP3의 C-말단이 NifK 폴리펩티드(NK)의 N-말단에 번역에 의해 융합되도록 N-말단을 갖는 NK를 포함한다), 및

(iii) NDF, NHF 및 NKF 이외의 Nif 융합 폴리펩티드(NF)(NF는 C-말단을 갖는 제4 미토콘드리아 표적화 펩티드(MTP4) 및 상기 MTP4의 C-말단이 Nif 폴리펩티드(NP)의 N-말단에 번역에 의해 융합되도록 N-말단을 갖는 NP를 포함한다)

중 하나, 하나 이상 또는 전부를 암호화하는 하나 이상의 뉴클레오티드 서열을 추가로 포함하며, 여기에서 각각의 MTP1, MTP2, MPT3 및 MTP4는 독립적으로 동일하거나 상이하다.

하나 또는 추가의 실시태양에서, 폴리뉴클레오티드는 식물 세포에서 발현을 위해 코돈-변형되었다(codon-modified).

하나 또는 추가의 실시태양에서, 폴리뉴클레오티드는 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드 또는 상기 내의 각 서열에 작동적으로 연결된 프로모터 및/또는 상기 폴리뉴클레오티드에 작동적으로 연결된 번역 조절 요소를 포함한다.

하나의 실시태양에서, 프로모터는 식물의 뿌리, 잎 및/또는 줄기에서 폴리뉴클레오티드의 발현을 부여한다, 바람직하게 프로모터는 식물의 종자에 비해 식물의 뿌리, 잎 또는 줄기 중 하나, 하나 이상, 또는 전부에서 폴리뉴클레오티드의 발현을 부여한다.

하나 또는 추가의 실시태양에서, 폴리뉴클레오티드는 식물 세포 또는 세균 세포 중에 존재한다, 바람직하게는 식물 세포의 게놈에 통합된다.

추가의 태양에서, 본 발명은 제1 Nif 융합 폴리펩티드(NF)를 암호화하는 제1 폴리뉴클레오티드 및 제2 NF를 암호화하는 제2 폴리뉴클레오티드를 포함하는 핵산 구조물을 제공하며, 각각의 NF는 (i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP) 및 (ii) N-말단을 갖는 Nif 폴리펩티드(NP)를 포함하고, 여기에서 MTP의 C-말단은 NP의 N-말단에 번역에 의해 융합되고, 각각의 MTP는 독립적으로 동일하거나 상이하다.

하나의 실시태양에서, 핵산 구조물은 하나 이상의 NF를 암호화하는 하나 이상의 폴리뉴클레오티드를 추가로 포함하며, 각각의 NF는 (i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP) 및 (ii) N-말단을 갖는 Nif 폴리펩티드(NP)를 포함하고, 여기에서 MTP의 C-말단은 NP의 N-말단에 번역에 의해 융합되고, 각각의 MTP는 독립적으로 동일하거나 상이하며 각각의 NP는 독립적으로 동일하거나 상이하다.

추가의 태양에서, 본 발명은 NifD 융합 폴리펩티드(NDF)를 암호화하는 제1 폴리뉴클레오티드(NDF는 (i) C-말단을 갖는 제1 미토콘드리아 표적화 펩티드(MTP1) 및 (ii) N-말단을 갖는 NifD 폴리펩티드(ND)를 포함하고, 여기에서 MTP1의 C-말단은 ND의 N-말단에 번역에 의해 융합된다), 및

(a) NifH 융합 폴리펩티드(NHF)를 암호화하는 제2 폴리뉴클레오티드(NHF는 (i) C-말단을 갖는 제2 미토콘드리아 표적화 펩티드(MTP2) 및 (ii) N-말단을 갖는 NifH 폴리펩티드(NH)를 포함하고, 여기에서 MTP2의 C-말단은 NH의 N-말단에 번역에 의해 융합된다),

(b) NifK 융합 폴리펩티드(NKF)를 암호화하는 제3 폴리뉴클레오티드(NKF는 (i) C-말단을 갖는 제3 미토콘드리아 표적화 펩티드(MTP3) 및 (ii) N-말단을 갖는 NifK 폴리펩티드(NK)를 포함하고, 여기에서 MTP3의 C-말단은 NK의 N-말단에 번역에 의해 융합되며, 바람직하게 NKF는 야생형 NifK 폴리펩티드에 비해 고유의 C-말단을 갖는다), 및

(c) NDF, NHF 및 NKF 이외의 Nif 융합 폴리펩티드(NF)를 암호화하는 제4 폴리뉴클레오티드(NF는 (i) C-말단을 갖는 제4 미토콘드리아 표적화 펩티드(MTP4) 및 (ii) N-말단을 갖는 Nif 폴리펩티드(NP)를 포함하고, 여기에서 MTP4의 C-말단은 NP의 N-말단에 번역에 의해 융합된다)

중 하나, 하나 이상, 또는 전부를 포함하는 핵산 구조물을 제공하며, 여기에서 각각의 MTP1, MTP2, MPT3 및 MTP4는 독립적으로 동일하거나 상이하다.

하나의 실시태양에서, 각각의 NF는 식물 세포의 미토콘드리아내로 전좌될 수 있다.

추가의 태양에서, 본 발명은 본 발명에 따른 폴리뉴클레오티드, 또는 본 발명에 따른 핵산 구조물을 포함하거나 암호화하는 키메릭 벡터를 제공한다.

하나의 실시태양에서, 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드 또는 상기 내의 각 서열은 프로모터, 및 임의로 전사 종결 서열에 작동적으로 연결된다.

하나의 실시태양에서, 프로모터는 식물의 뿌리, 잎 및/또는 줄기에서 폴리뉴클레오티드 중 하나, 하나 이상, 또는 전부의 발현을 부여한다, 바람직하게 폴리뉴클레오티드는 식물의 종자에 비해 식물의 뿌리, 잎 또는 줄기 중 하나, 하나 이상, 또는 전부에서 우세하게 발현한다.

추가의 태양에서, 본 발명은 본 발명에 따른 융합 폴리펩티드 또는 가공된 Nif 폴리펩티드 중 하나, 하나 이상 또는 전부, 본 발명에 따른 폴리뉴클레오티드 중 하나, 하나 이상 또는 전부, 본 발명에 따른 핵산 구조물, 및/또는 본 발명에 따른 벡터를 포함하는 세포를 제공한다.

하나의 실시태양에서, 세포는 식물 세포 또는 세균 세포이다.

추가의 실시태양에서, 식물 세포는 곡류 식물 세포, 예를 들어 밀 세포, 벼 세포, 옥수수 세포, 라이밀 세포, 귀리 세포, 또는 보리 세포, 바람직하게는 밀 세포이다.

추가의 태양에서, 본 발명은 본 발명에 따른 융합 폴리펩티드(들) 또는 가공된 Nif 폴리펩티드(들)의 생성 방법을 제공하며, 상기 방법은 세포에서 본 발명에 따른 폴리뉴클레오티드를 발현시킴을 포함한다.

추가의 태양에서, 본 발명은 본 발명에 따른 세포의 생성 방법을 제공하며, 상기 방법은 본 발명에 따른 폴리뉴클레오티드, 본 발명에 따른 핵산 구조물, 및/또는 본 발명에 따른 벡터를 세포 내로 도입시키는 단계를 포함한다.

추가의 태양에서, 본 발명은 본 발명에 따른 트랜스제닉 식물의 생성 방법을 제공하며, 상기 방법은

i) 본 발명에 따른 폴리뉴클레오티드, 본 발명에 따른 핵산 구조물, 및/또는 본 발명에 따른 벡터를 식물의 세포 내로 도입시키고,

ii) 상기 세포로부터 트랜스제닉 식물을 재생시키고,

iii) 임의로 상기 식물로부터 종자를 수확(harvesting)하고, 및/또는

iv) 임의로 상기 트랜스제닉 식물로부터 하나 이상의 자손 식물(progeny plant)을 생성시킴으로써, 트랜스제닉 식물을 생성시키는

단계들을 포함한다.

추가의 태양에서, 본 발명은 게놈내에 본 발명에 따른 폴리뉴클레오티드, 또는 본 발명에 따른 핵산 구조물 중 어느 하나에 정의된 바와 같은 폴리뉴클레오티드가 통합된 식물의 생성 방법을 제공하며, 상기 방법은

i) 2개의 모 식물을 이종 교배하고(여기에서 적어도 하나의 식물은 폴리뉴클레오티드(들)를 포함한다),

ii) 상기 이종 교배로부터의 하나 이상의 자손 식물을 상기 폴리뉴클레오티드(들)의 존재 또는 부재에 대해 선별하고,

iii) 상기 폴리뉴클레오티드(들)를 포함하는 자손 식물을 선택함으로써, 상기 식물을 생성시키는

단계들을 포함한다.

하나의 실시태양에서, 폴리뉴클레오티드(들)는 식물에 니트로게나제 활성을 부여하는 폴리펩티드(들)를 암호화한다.

하나 또는 추가의 실시태양에서, 모 식물 중 적어도 하나는 4배체 또는 6배체 밀 식물이다.

하나 또는 추가의 실시태양에서, 단계 ii)는 하나 이상의 자손 식물로부터의 DNA를 포함하는 샘플을 폴리뉴클레오티드(들)에 대해 분석함을 포함한다.

하나 또는 추가의 실시태양에서, 단계 iii)은

i) 폴리뉴클레오티드(들)에 대해 동형접합성인 자손 식물을 선택하고/하거나

ii) 상기 식물 또는 그의 하나 이상의 자손 식물을 폴리뉴클레오티드(들)의 존재 및/또는 발현에 대해서 또는 상기 정의된 바와 같은 변경된 표현형에 대해서 분석함

을 포함한다.

하나의 또는 추가의 실시태양에서, 상기 방법은

iv) 단계 i)의 이종 교배의 자손을, 1차 부모의 유전자형의 대부분을 갖지만 폴리뉴클레오티드를 포함하는 식물을 생성시키기에 충분한 횟수 동안 상기 폴리뉴클레오티드(들)가 없는 1차 부모 식물과 동일한 유전자형의 식물과 역교배하고,

iv) 상기 폴리뉴클레오티드를 포함하고/하거나 상기 정의된 바와 같은 변경된 표현형을 갖는 자손 식물을 선택함

을 추가로 포함한다.

하나 또는 추가의 실시태양에서, 상기 방법은 식물 또는 자손 식물을 적어도 하나의 다른 유전자 마커에 대해 분석하는 단계를 추가로 포함한다.

추가의 태양에서, 본 발명은 본 발명에 따른 방법을 사용하여 생성된 식물을 제공한다.

추가의 태양에서, 본 발명은 재조합 세포 및/또는 트랜스제닉 식물을 생성시키기 위한 본 발명에 따른 폴리뉴클레오티드, 본 발명에 따른 핵산 구조물, 및/또는 본 발명에 따른 벡터의 용도를 제공한다.

하나의 실시태양에서, 트랜스제닉 식물은 외인성 폴리뉴클레오티드, 핵산 구조물, 및/또는 벡터가 없는 상응하는 식물과 비교할 때 상기 정의된 바와 같은 변경된 표현형을 갖는다.

추가의 태양에서, 본 발명은 본 발명에 따른 폴리뉴클레오티드, 또는 본 발명에 따른 핵산 구조물 중 어느 하나에 정의된 바와 같은 폴리뉴클레오티드를 포함하는 식물의 식별 방법을 제공하며, 상기 방법은

i) 식물로부터 핵산 샘플을 수득하고,

ii) 상기 샘플을 상기 폴리뉴클레오티드(들)의 존재 또는 부재에 대해서 선별하는

단계들을 포함한다.

하나의 실시태양에서, 폴리뉴클레오티드(들)의 존재는 식물이 외인성 폴리뉴클레오티드(들)가 없는 상응하는 식물과 비교할 때 상기 정의된 바와 같은 변경된 표현형을 가짐을 가리킨다.

하나 또는 추가의 실시태양에서, 상기 방법은 본 발명에 따른 식물을 식별한다.

하나 또는 추가의 실시태양에서, 상기 방법은 단계 i) 전에 종자로부터 식물을 생성시킴을 추가로 포함한다.

추가의 태양에서, 본 발명은 본 발명에 따른 식물의 식물 부분을 제공한다.

하나의 실시태양에서, 식물 부분은 본 발명에 따른 폴리뉴클레오티드, 또는 본 발명에 따른 핵산 구조물 중 어느 하나에 정의된 바와 같은 폴리뉴클레오티드를 포함하는 종자이다.

추가의 태양에서, 본 발명은 식물 부분의 생성 방법을 제공하며, 상기 방법은

a) 본 발명에 따른 식물을 재배하고,

b) 식물 부분을 수확함

을 포함한다.

추가의 태양에서, 본 발명은 종자로부터 수득된 밀가루, 통밀, 전분, 오일, 종실박(seedmeal) 또는 다른 생성물의 생성 방법을 제공하며, 상기 방법은

a) 본 발명에 따른 종자를 수득하고,

b) 밀가루, 통밀, 전분, 오일 또는 다른 생성물을 추출하거나, 또는 종실박을 생성시킴

을 포함한다.

추가의 태양에서, 본 발명은 본 발명에 따른 식물 및/또는 식물 부분으로부터 생성된 생성물을 제공한다.

하나의 실시태양에서, 상기 부분은 종자이다.

하나 또는 추가의 실시태양에서, 생성물은 식품 생성물 또는 음료 생성물이다. 바람직하게, i) 식품 생성물은 밀가루, 전분, 오일, 효모빵 또는 무효모빵, 파스타, 국수, 동물 사료, 씨리얼, 스낵, 케이크, 맥아, 페이스트리 및 밀가루로 만든 소스를 함유하는 식품이거나, 또는 ii) 음료 생성물은 주스, 맥주 또는 맥아이다. 상기와 같은 생성물의 제조 방법은 당해 분야의 숙련가들에게 주지되어 있다.

대안의 실시태양에서, 생성물은 비-식품이다. 비-식품 생성물의 예는 비제한적으로 필름, 코팅, 접착제, 건축 자재 및 포장재를 포함한다. 상기와 같은 생성물의 제조 방법은 당해 분야의 숙련가들에게 주지되어 있다.

추가의 태양에서, 본 발명은 본 발명에 다른 식품 생성물의 제조 방법을 제공하며, 상기 방법은 종자, 또는 상기 종자로부터의 밀가루, 통밀 또는 전분을 또 다른 식품 성분과 혼합함을 포함한다.

추가의 태양에서, 본 발명은 본 발명에 따른 종자를 발아시키는 단계를 포함하는, 맥아의 제조 방법을 제공한다.

추가의 태양에서, 본 발명은 동물 사료로서 본 발명에 따른 식물 또는 그의 부분, 또는 동물 소비용 사료 또는 인간 소비용 식품의 생성을 위한 용도를 제공한다.

추가의 태양에서, 본 발명은 본 발명에 따른 융합 폴리펩티드(들) 또는 가공된 Nif 폴리펩티드(들), 본 발명에 따른 폴리뉴클레오티드, 본 발명에 따른 핵산 구조물, 본 발명에 따른 벡터, 또는 본 발명에 따른 세포, 및 하나 이상의 허용 가능한 담체를 포함하는 조성물을 제공한다.

추가의 태양에서, 본 발명은 식물 세포에서 니트로게나제 단백질 복합체의 재편성 방법을 제공하며, 상기 방법은 본 발명에 따른 2개 이상의 폴리뉴클레오티드, 본 발명에 따른 2개 이상의 핵산 구조물, 및/또는 본 발명에 따른 벡터를 상기 세포 내로 도입시키고, 상기 식물 세포를 상기 폴리뉴클레오티드 또는 벡터가 발현되기에 충분한 시간 동안 배양함을 포함한다.

추가의 태양에서, 본 발명은 본 발명에 따른 2개 이상의 폴리뉴클레오티드, 본 발명에 따른 2개 이상의 핵산 구조물, 및/또는 본 발명에 따른 벡터를 식물 또는 식물 세포 내로 도입시킴을 포함하는, 식물의 수율, 바이오매스, 생장률, 활력, 생물학적 질소 고정으로부터 유래된 질소 이득, 질소 사용 효율, 비생물 스트레스 내성, 및/또는 영양소 결핍 내성을 증가시키는 방법을 제공한다.

본 발명은 단지 예시를 목적으로 의도된, 본 명세서에 기재된 특정한 실시태양에 의해 범위가 제한되지 않는다. 기능적으로 동등한 생성물, 조성물 및 방법은 본 명세서에 기재된 바와 같이, 명백히 본 발명의 범위내에 있다.

본 명세서 전체를 통하여, 달리 구체적으로 서술되거나 문맥상 달리 요구되지 않는 한, 단일 단계, 물질의 조성물, 단계들의 그룹 또는 물질의 조성물들의 그룹에 대한 언급은 상기 단계들, 물질의 조성물들, 단계들의 그룹들 또는 물질의 조성물들의 그룹 중 하나 및 다수(즉 하나 이상)를 포함하는 것으로 간주될 것이다.

본 발명은 하기의 비-제한적인 실시예에 의해 그리고 첨부된 도면을 참조로 하여 이하에 기재된다.

도 1 - pCW440의 T-DNA의 유전자 지도. 표지: 35SP, 완전길이 CaMV 35S 프로모터, 전사 방향을 도시한다; T7 프로모터, T7 RNA 폴리머라제의 프로모터; dCoxIV MTP, dCoxIV 미토콘드리아 표적화 펩티드; AscI, MTP와의 인-프레임 융합물의 삽입을 위한 AscI에 대한 제한 효소 부위; T7 종결자, T7 RNA 폴리머라제에 대한 전사 종결 영역; 변형된 nos polyA, nos 3' 폴리아데닐화 신호.
도 2 - 세균 및 엔 벤타미아나(N. benthamiana) 잎에서 생성된 NifH, NifD, NifK 및 NifY 융합 폴리펩티드의 웨스턴 블럿 분석의 사진, 각각의 폴리펩티드는 dCoxIV MTP 및 HA 또는 FLAG 에피토프를 포함하는 C-말단 연장부에 융합된다. 레인 내용물: 1, 대조용 잎 추출물(p19 침투만) 및 폴리펩티드 분자량 마커; 색칠된 화살표 = 72 kDa, 아래의 다음 화살표들(색칠되지 않은)은 55, 40, 33, 25 및 17 kDa이다; 레인 2-5, 세균 BL21-Gold에서 발현된 pCW446 dCoxIV-NifH-HA(레인 2) 또는 2개의 상이한 잎 침투(레인 3,4); 레인 5-7, 세균에서 발현된 pCW447-dCoxIV-NifD-FLAG(레인 5) 또는 2개의 상이한 잎 침투(레인 6,7); 레인 8-10, 세균에서 발현된 pCW448-dCoxIV-NifK-HA(레인 8) 또는 2개의 상이한 잎 침투(레인 9, 10); 레인 11-13, 세균에서 발현된 pCW449-dCoxIV-NifY-HA(레인 11) 또는 2개의 상이한 잎 침투(레인 12,13); 레인 14-15, 잎 침투에서 발현된 4개 벡터 pCW446, pCW447, pCW448, 및 pCW449의 조합. 레인 15는 또한 세포질 국소화된 Lbh를 발현하는 벡터 pCW444의 침투를 포함한다. 블럿 A는 2개의 1차 항체, 항-HA 및 항-FLAG로 프로빙되고; 블럿 B는 오직 항-HA만으로 프로빙되었다. 블롯 A의 보다 긴 노출, 레인 14는 NifH, NifK 및 NifY 폴리펩티드(그러나 NifD는 아니다)에 대한 신호를 밝혀내었다.
도 3 - 엔 벤타미아나 잎에서 pFAγ::GFP 융합 폴리펩티드를 일시적으로 발현시키는데 사용되는 구조물의 개략도. 야생형 pFAγ 아미노산 서열을 위에 도시하고 돌연변이된 아미노산 서열(mFAγ)을 아래에 도시한다. 화살표는 MPP에 의한 예측된 절단점을 가리킨다. 35S Pr, CaMV 35S 프로모터; T7P, T7 RNA 폴리머라제 프로모터; MTP, pFAγ 또는 mFAγ 영역; GFP, GFP 폴리펩티드; T7T, T7 RNA 폴리머라제 전사 종결자; NOS, nos 유전자의 3' 전사 종결자/폴리아데닐화 영역.
도 4 - pFAγ::NifF::HA 또는 pFAγ::NifZ::FLAG 융합 폴리펩티드를 암호화하는 구조물을 발현하는 엔 벤타미아나 또는 이 콜라이(E. coli) 세포로부터의 단백질 추출물의 SDS-PAGE 후 HA(좌측 패널) 또는 FLAG(우측 패널)에 대한 항체로 프로빙된 웨스턴 블럿의 사진. 레인 위의 + 및 - 기호는 각각 상기 레인에 적용된 엔 벤타미아나 또는 이 콜라이 단백질 추출물의 존재 또는 부재를 가리키며; 상기 세균 추출물에 사용된 추출물 희석 인자를 괄호안에 나타낸다.
도 5 - 엔 벤타미아나 잎 세포에서 pFAγ::NifH::HA를 발현하는데 사용된 유전자 구조물의 도해. 뉴클레오티드 서열 중 밑줄친 잔기는 트립신에 의한 단백질분해적 절단 부위(카복실쪽)를 가리킨다. 화살표는 미토콘드리아 가공 펩티다제(MPP)에 의한 절단점을 가리킨다. 펩티드 ISTQVVR(서열번호 44) 및 AVQGAPTMR(서열번호 45)이 질량 분광분석에 의해 검출되었다.
도 6 - pFAγ::Nif::HA 또는 pFAγ::Nif::FLAG 융합 폴리펩티드를 암호화하는 구조물을 발현하는 엔 벤타미아나 세포로부터의 단백질 추출물의 SDS-PAGE 후 HA(상부 좌측 패널) 또는 FLAG(상부 우측 패널)에 대한 항체로 프로빙된 웨스턴 블럿의 사진. 레인 위의 문자(K,B,E,S 등)는 유전자 구조물에 의해 암호화된 융합 폴리펩티드 중에 포함된 Nif 폴리펩티드를 가리킨다. pFAγ::NifJ::FLAG에 대한 블럿의 상단 부근의 희미한 밴드는 별표(*)로 나타낸다. 분자량 마커의 크기(kDa)는 좌측에 나타낸다. 하부 패널은 쿠마씨 염색후 상응하는 젤을 도시한다.
도 7 - pFAγ::NifD::FLAG를 암호화하는 동일한 구조물을 함유하는 엔 벤타미아나 잎 또는 이 콜라이로부터의 단백질 추출물의 웨스턴 블럿의 사진. 블럿은 FLAG 에피토프에 대한 항체에 의해 프로빙된다. 첫 번째 레인 중의 마커의 분자량을 나타낸다. 이 콜라이 추출물에 대한 희석 인자를 괄호안에 나타낸다.
도 8 - 각각 레인 2 및 3에서 양성 및 음성 대조용으로서 pFAγ::NifD::HA 또는 mFAγ::NifD::HA 또는 pFAγ::NifK::HA 및 pFAγ::GFP를 암호화하는 구조물을 함유하는 이 콜라이 또는 엔 벤타미아나 잎(도면의 상단에 나타냄)으로부터의 단백질 추출물의 웨스턴 블럿의 사진. 사용된 구조물 및 암호화된 Nif 폴리펩티드(D 또는 K)를 각 레인 위에 나타낸다. 블럿을 HA 에피토프에 대한 항체로 프로빙하였다. 첫 번째 레인 중에 마커의 분자량을 나타낸다. 하부 패널은 쿠마씨 염색된 젤을 도시한다. 쿠마씨 염색된 젤 중의 주 밴드는 엔 벤타미아나 잎 샘플로부터의 루비스코(Rubisco)이다.
도 9 - NifK 및 NifH 폴리펩티드의 동시-발현은 식물체 중의 NifD 융합 폴리펩티드 수준을 증대시킨다. NifD, NifK 및 NifH 융합 폴리펩티드의 동시-발현을 위한 구조물의 잎 세포 내로의 도입후 생성된 폴리펩티드의 웨스턴 블럿의 사진. 레인 1, pRA24 + pRA10 + pRA25; 레인 2, pRA22 + pRA10 + pRA25; 레인 3, pRA19 + pRA10 + pRA25; 레인 4, pRA19 + pRA25; 레인 5, pRA10 + pRA25; 레인 6, pRA10; 레인 7, pRA11; 레인 8, pRA25; 레인 9, pRA22; 레인 10, pRA24; 레인 11, pRA19; 레인 12, 분자량 마커, 우측의 숫자는 kDa을 가리킨다. 구조물 및 암호화된 폴리펩티드의 목록은 표 4를 참조하시오(또한 블럿의 상단에 나타냄). 레인 1의 별표는 NifD 특정 밴드의 위치를 가리킨다.
도 10 - NifD::FLAG, NifK(C-말단 연장 없음), NifS::HA 및 NifH::HA 융합 폴리펩티드의 발현을 위한 잎 세포 내로의 구조물 조합의 도입후 생성된 폴리펩티드의 웨스턴 블럿의 사진. 상부 패널은 항-FLAG 항체로 프로빙되었으며, 하부 패널은 항-HA 항체로 프로빙되었다. 레인 1 및 12는 표시된 크기(kDa)를 갖는 분자량 마커를 도시한다. 레인 2의 단일 별표는 NifD 특정 밴드 위치를 가리키며, 이중 별표는 보다 작은 붕괴 NifD::FLAG 폴리펩티드 또는 내부 번역 개시 폴리펩티드의 위치를 가리킨다. 괄호안의 숫자는 배경 FLAG 밴드에 대한 NifD 특정 밴드의 양을 나타낸다. NifK::HA, NifS::HA 및 Nif::H 융합 폴리펩티드의 위치를 하부 패널에 도시한다. 구조물 및 암호화된 폴리펩티드의 조합을 각 레인의 상단에 나타낸다. 약어: D-FLAG(pRA07; pFAγ::NifD::FLAG), H-HA(pRA10; pFAγ::NifH::HA), K(pRA25; pFAγ::NifK), K-HA(pRA11, pFAγ::NifK::HA), S-HA(pRA16; pFAγ::NifS::HA), D-HA(pRA19, pFAγ::NifD::HA).
도 11 - NifD::FLAG, NifK(C-말단 연장 없음) 또는 NifK::HA 및 NifH::HA 융합 폴리펩티드의 발현을 위해 구조물을 잎 세포 내로 단독으로 또는 함께 도입후 생성된 폴리펩티드의 웨스턴 블럿의 사진. 도입된 구조물을 각 레인 위에 나타내며, 암호화된 융합 폴리펩티드는 각 레인 아래에 나타낸다. 블럿을 절단하고 항-HA 항체(레인 1-7) 또는 항-FLAG 항체(레인 9-12)로 프로빙하였다. 별표는 레인 11 및 12 중의 NifD::FLAG 특정 밴드를 가리킨다. pRA19 및 pRA07에 대한 희미한 NifD 밴드(레인 2 및 3)를 관찰하기 위해서 웨스턴 블럿의 보다 긴 노출이 필요하였다.
도 12 - NifD::링커::NifK 이종-이량체의 모델, NifD 및 NifK 서브유닛을 각각 녹색 및 청색으로서 도시한다. 공간 충전 모델은 NifD의 C-말단을 NifK의 N-말단에 연결시키는 적색의 링커 펩티드를 나타낸다.
도 13 - 포함된 NifH 서브유닛(보라색)에 대한 에이 빈란디이(A. vinlandii) 아미노산 서열과 함께 NifD(녹색) 및 NifK(청색)에 대한 케이 뉴모니아에(K. pneumoniae) 아미노산 서열을 사용하는, 2개의 NifH 폴리펩티드와 복합체화된 이량체로서 NifD::링커::NifK 융합 폴리펩티드의 상동성 모델. 설계된 링커를 적색 반데르 발스 원자 표현으로 도시한다. 좌측 및 우측 상은 서로에 대해 수직 축 둘레에서 90도 회전한다.
도 14 - 상부 패널: pRA01(레인 2, GFP), pRA11(레인 3, pFAγ::NifK::HA), pRA19(레인 4, pFAγ::NifD::HA) 및 pRA20(레인 5, pFAγ::NifD-링커(FLAG)-NifK::HA)로부터 생성된 폴리펩티드의, HA 에피토프 검출 항체를 사용하는 웨스턴 블럿의 사진. 분자량 마커의 크기(레인 1, kDa)를 좌측에 나타낸다. 하부 패널은 쿠마씨 염색된 젤을 도시한다.
도 15 - 다중-카세트 벡터 pKT100 및 pKT-HC의 구조의 개략도. LB: T-DNA의 좌측 경계; RB: 우측 경계; P1-5/T1-5: 발현 카세트 1-5의 프로모터/종결자. PS/TS: 선택 유전자를 함유하는 발현 카세트의 프로모터/종결자; MAR: 기질-회합된 영역. 제한 효소 부위의 위치를 화살표로 표시한다.
도 16 - 상부 패널: 유전자 구조물을 수용한 엔 벤타미아나 잎 샘플로부터의 단백질 추출물의 젤 전기영동후, 항-HA 및 항-GFP 항체의 조합으로 프로빙된 웨스턴 블럿의 사진. 레인 1, 폴리펩티드 분자량 마커(kDa). 도입된 벡터: 레인 2, pRA01(pFAγ::GFP); 레인 3-7, pRA01 외에, 카세트 1-5로부터 pFAγ::NifH::HA를 발현하기 위한 벡터. 하부 패널: 동일한 멤브레인의 폰소 염색. pFAγ::NifH::HA 밴드 및 pFAγ::GFP에 대한 밴드의 이중선을 나타낸다.
도 17 - A. 상부 패널: 유전자 구조물을 수용한 엔 벤타미아나 잎 샘플로부터의 단백질 추출물의 젤 전기영동후, 항-HA 항체로 프로빙된 웨스턴 블럿의 사진. 레인 1 및 3, 폴리펩티드 분자량 마커(kDa). 도입된 벡터: 레인 2, pRA01(pFAγ::GFP); 레인 4, HC13. 하부 패널: 동일한 멤브레인의 폰소 염색. 밴드의 정체를 가리킨다. B. 항-MYC 항체로 프로빙된 동일한 웨스턴 블럿.
도 18. 상부 패널: pRA01(pFAγ::GFP, G로 표시된 레인), pRA16(pFAγ::NifS::HA, S로 표시된 레인) 및 pRA19(인간 코돈-최적화된 pFAγ::NifD::HA, D로 표시된 레인)의 조합 침투후 4일째에 엔 벤타미아나 잎으로부터의 단백질 추출물의 웨스턴 블럿의 사진. 웨스턴 블럿은 항-HA 및 항-GFP 항체로 프로빙되었다. 과포화 없이 NifS 및 GFP를 분석하기 위해서, 노출을 제한하였다. NifD::HA 검출은 블럿의 보다 오랜 노출을 요하였다. 분자량 마커의 크기(kDa)를 레인 1에 나타낸다. 하부 패널: pRA01(pFAγ::GFP, G로 표시된 레인), pRA22(인간 코돈-최적화된 mFAγ::NifD::HA, D-mMTP 표시된 레인), pRA19(인간 코돈-최적화된 pFAγ::NifD::HA, D-HA 표시된 레인), pRA26(인간 코돈-최적화된 ΔFAγ::NifD::HA, D-stop 표시된 레인 및 pRA24(아라비도프시스(Arabidopsis) 코돈-최적화된 pFAγ::NifD::HA, D-alt 표시된 레인)의 조합 침투후 4일째에 엔 벤타미아나 잎으로부터의 단백질 추출물의 웨스턴 블럿의 사진. 블럿은 항-HA 및 항-GFP 항체로 프로빙되었다. NifD-HA 검출은 블럿의 보다 오랜 노출을 요하였다.
도 19 - pRA25의 존재 또는 부재하에서 NifD::HA를 발현하는 P19 및 SN6, SN7 또는 SN8 구조물(실시예 20)을 동시-발현하는 구조물 침투후 엔 벤타미아나 잎 세포로부터의 단백질 추출물의 SDS-PAGE 후, 항-HA 항체를 사용하는 웨스턴 블럿의 사진. unpro/pro: FAγ⁵¹::NifD의 가공되지 않은 또는 가공된 형태. degr prod: 대략 48 kDa 크기의 NifD-특이적인 분해 생성물.
서열 목록에 대한 설명
서열번호 1 - 시토크롬-c 옥시다제 서브유닛 IV의 고유 MTP(CoxIV MTP)의 아미노산 서열.
서열번호 2 - 시토크롬-c 옥시다제 서브유닛 IV(dCoxIV)의 유도체 MTP의 아미노산 서열.
서열번호 3 - MTP의 내수송 및 가공에 관련된 dCoxIV의 모티프 xRxxxSSx 중의 보존된 아르기닌 및 세린 잔기.
서열번호 4 - T-DNA 우측 경계(뉴클레오티드 1-164), HindIII 부위 및 XhoI 부위가 측면에 인접한 35S 프로모터(뉴클레오티드 219-1564), CTCGAG(XhoI), T7 프로모터(뉴클레오티드 1571-1587), ATG로 출발하는 dCoxIV-암호화 서열(뉴클레오티드 1650-1742), AscI 부위(뉴클레오티드 1743-1750), T7 종결자(뉴클레오티드 1810-1856), nos 3' 종결자(뉴클레오티드 1861-2084) 및 T-DNA 좌측 경계(뉴클레오티드 2186-2346) 성분들을 갖는 pCW440의 T-DNA 영역의 뉴클레오티드 서열.
서열번호 5 - 야생형 케이 뉴모니아에 HifH의 아미노산 서열.
서열번호 6 - 야생형 케이 뉴모니아에 HifD의 아미노산 서열.
서열번호 7 - 야생형 케이 뉴모니아에 HifK의 아미노산 서열.
서열번호 8 - 야생형 케이 뉴모니아에 HifY의 아미노산 서열.
서열번호 9 - 야생형 케이 뉴모니아에 HifB의 아미노산 서열.
서열번호 10 - 야생형 케이 뉴모니아에 HifE의 아미노산 서열.
서열번호 11 - 야생형 케이 뉴모니아에 HifN의 아미노산 서열.
서열번호 12 - 야생형 케이 뉴모니아에 HifQ의 아미노산 서열.
서열번호 13 - 야생형 케이 뉴모니아에 HifS의 아미노산 서열.
서열번호 14 - 야생형 케이 뉴모니아에 HifU의 아미노산 서열.
서열번호 15 - 야생형 케이 뉴모니아에 HifX의 아미노산 서열.
서열번호 16 - 야생형 케이 뉴모니아에 HifF의 아미노산 서열.
서열번호 17 - 야생형 케이 뉴모니아에 HifZ의 아미노산 서열.
서열번호 18 - 야생형 케이 뉴모니아에 HifJ의 아미노산 서열.
서열번호 19 - 야생형 케이 뉴모니아에 HifM의 아미노산 서열.
서열번호 20 - 야생형 케이 뉴모니아에 HifV의 아미노산 서열.
서열번호 21 - HA 에피토프(아미노산 7-15)를 포함하는 C-말단 연장(17aa)의 아미노산 서열
서열번호 22 - FLAG 에피토프를 포함하는 C-말단 연장(12aa)의 아미노산 서열
서열번호 23 - pCW446에 의해 암호화된 dCoxIV::NifH::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-31은 dCoxIV MTP에 상응하며, 아미노산 32-34는 AscI 부위에서 클로닝의 결과였고, 아미노산 35-326은 케이 뉴모니아에 NifH 아미노산(개시 코돈 Met가 제거된)이었으며, 아미노산 327-343은 HA 에피토프를 포함한다.
서열번호 24 - pCW447에 의해 암호화된 dCoxIV::NifD::FLAG 융합 폴리펩티드의 아미노산 서열. 아미노산 1-31은 dCoxIV MTP에 상응하며, 아미노산 32-34는 AscI 부위에서 클로닝의 결과였고, 아미노산 35-515는 케이 뉴모니아에 NifD 아미노산(2개의 N-말단 Met 잔기가 제거된)이었으며, 아미노산 516-527은 FLAG 에피토프를 포함한다.
서열번호 25 - pCW448에 의해 암호화된 dCoxIV::NifK::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-31은 dCoxIV MTP에 상응하며, 아미노산 32-34는 AscI 부위에서 클로닝의 결과였고, 아미노산 35-553은 케이 뉴모니아에 NifK 아미노산이었으며, 아미노산 554-570은 HA 에피토프를 포함한다.
서열번호 26 - pCW449에 의해 암호화된 dCoxIV::NifY::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-31은 dCoxIV MTP에 상응하며, 아미노산 32-34는 AscI 부위에서 클로닝의 결과였고, 아미노산 35-253은 케이 뉴모니아에 NifY 아미노산(개시 코돈 Met 없이)이었으며, 아미노산 254-270은 HA 에피토프를 포함한다.
서열번호 27 - NifH::HA를 암호화하는 AscI 단편, AscI-NifH-HA-AscI의 뉴클레오티드 서열.
서열번호 28 - NifD::FLAG를 암호화하는 AscI 단편, AscI-NifD-FLAG-AscI의 뉴클레오티드 서열.
서열번호 29 - NifK::HA를 암호화하는 AscI 단편, AscI-NifK-HA-AscI의 뉴클레오티드 서열.
서열번호 30 - NifY::HA를 암호화하는 AscI 단편, AscI-NifY-HA-AscI의 뉴클레오티드 서열.
서열번호 31 - pCW452에 의해 암호화된 dCoxIV::NifB::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-31은 dCoxIV MTP에 상응하며, 아미노산 32-34는 AscI 부위에서 클로닝의 결과였고, 아미노산 35-501은 케이 뉴모니아에 NifB 아미노산(개시 코돈 Met 없이)이었으며, 아미노산 502-518은 HA 에피토프를 포함한다.
서열번호 32 - pCW454에 의해 암호화된 dCoxIV::NifE::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-31은 dCoxIV MTP에 상응하며, 아미노산 32-34는 AscI 부위에서 클로닝의 결과였고, 아미노산 35-490은 케이 뉴모니아에 NifE 아미노산(개시 코돈 Met 없이)이었으며, 아미노산 491-507은 HA 에피토프를 포함한다.
서열번호 33 - pCW455에 의해 암호화된 dCoxIV::NifN::FLAG 융합 폴리펩티드의 아미노산 서열. 아미노산 1-31은 dCoxIV MTP에 상응하며, 아미노산 32-34는 AscI 부위에서 클로닝의 결과였고, 아미노산 35-493은 케이 뉴모니아에 NifN 아미노산(개시 코돈 Met 없이)이었으며, 아미노산 494-505는 FLAG 에피토프를 포함한다.
서열번호 34 - pCW456에 의해 암호화된 dCoxIV::NifQ::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-31은 dCoxIV MTP에 상응하며, 아미노산 32-34는 AscI 부위에서 클로닝의 결과였고, 아미노산 35-200은 클렙시엘라 스페시즈 NifQ 아미노산(개시 코돈 Met 없이)이었으며, 아미노산 201-217은 HA 에피토프를 포함한다.
서열번호 35 - pCW450에 의해 암호화된 dCoxIV::NifS::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-31은 dCoxIV MTP에 상응하며, 아미노산 32-34는 AscI 부위에서 클로닝의 결과였고, 아미노산 35-433은 케이 뉴모니아에 NifS 아미노산(개시 코돈 Met 없이)이었으며, 아미노산 434-450은 HA 에피토프를 포함한다.
서열번호 36 - pCW451에 의해 암호화된 dCoxIV::NifU::FLAG 융합 폴리펩티드의 아미노산 서열. 아미노산 1-31은 dCoxIV MTP에 상응하며, 아미노산 32-34는 AscI 부위에서 클로닝의 결과였고, 아미노산 35-493은 케이 뉴모니아에 NifU 아미노산(개시 코돈 Met 없이)이었으며, 아미노산 494-505는 FLAG 에피토프를 포함한다.
서열번호 37 - pCW453에 의해 암호화된 dCoxIV::NifX::FLAG 융합 폴리펩티드의 아미노산 서열. 아미노산 1-31은 dCoxIV MTP에 상응하며, 아미노산 32-34는 AscI 부위에서 클로닝의 결과였고, 아미노산 35-189는 케이 뉴모니아에 NifX 아미노산(개시 코돈 Met 없이)이었으며, 아미노산 190-201은 FLAG 에피토프를 포함한다.
서열번호 38 - pRA00내로 클로닝 전략의 결과로서 부가된 pFAγ MTP(아미노산 1-77) 및 아미노산 트리플릿 GAP(78-80)를 포함하는 N-말단 연장의 아미노산 서열. MPP에 의한 절단은 아미노산 잔기 42와 43 사이에서 발생한다.
서열번호 39 - pRA21내로 클로닝 전략의 결과로서 부가된 mFAγ 서열(아미노산 1-77) 및 아미노산 트리플릿 GAP(78-80)를 포함하는, 벡터 pRA21에서 암호화된, 변형된 N-말단 연장의 아미노산 서열. 서열번호 38에 비해 아미노산 12-18, 24-33 및 39-45에서 알라닌 아미노산 치환이 MPP에 의한 절단을 피하도록 설계되었다.
서열번호 40 - pRA05에 의해 암호화된 pFAγ::NifF::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 케이 뉴모니아에 NifX 클로닝의 결과였고, 아미노산 81-256은 케이 뉴모니아에 NifF 아미노산(서열번호 16)이었으며, 아미노산 257-267은 HA 에피토프를 포함한다.
서열번호 41 - pRA04에 의해 암호화된 pFAγ::NifZ::FLAG 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-228은 케이 뉴모니아에 NifZ 아미노산(서열번호 17)이었으며, 아미노산 229-238은 FLAG 에피토프를 포함한다.
서열번호 42 - pRA10에 의해 암호화된 pFAγ::NifH::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-372는 케이 뉴모니아에 NifH 아미노산(개시자 Met 없이 서열번호 5)이었으며, 아미노산 373-389는 HA 에피토프를 포함한다.
서열번호 43 - 가공되지 않은, pFAγ로부터의 트립신 펩티드의 아미노산 서열.
서열번호 44 - MPP에 의한 가공후, pFAγ로부터의 트립신 펩티드의 아미노산 서열.
서열번호 45 - MPP에 의한 가공후, pFAγ로부터의 트립신 펩티드의 아미노산 서열.
서열번호 46 - pRA03에 의해 암호화된 pFAγ::NifB::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-547은 케이 뉴모니아에 NifB 아미노산(개시자 Met 없이 서열번호 9)이었으며, 아미노산 548-564는 HA 에피토프를 포함한다.
서열번호 47 - pRA07에 의해 암호화된 pFAγ::NifD::FLAG 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-561은 케이 뉴모니아에 NifD 아미노산(개시자 Met 없이 및 Met 다음의 서열번호 6)이었으며, 아미노산 562-573은 FLAG 에피토프를 포함한다.
서열번호 48 - pRA09에 의해 암호화된 pFAγ::NifE::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-536은 케이 뉴모니아에 NifE 아미노산(개시자 Met 없이 서열번호 10)이었으며, 아미노산 537-553은 HA 에피토프를 포함한다.
서열번호 49 - pRA06에 의해 암호화된 pFAγ::NifJ::FLAG 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-1251은 케이 뉴모니아에 NifJ 아미노산(서열번호 18)이었으며, 아미노산 1252-1261은 FLAG 에피토프를 포함한다.
서열번호 50 - pRA11에 의해 암호화된 pFAγ::NifK::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-599는 케이 뉴모니아에 NifK 아미노산(개시자 Met 없이 서열번호 7)이었으며, 아미노산 600-616은 HA 에피토프를 포함한다.
서열번호 51 - pRA18에 의해 암호화된 pFAγ::NifM::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-346은 케이 뉴모니아에 NifM 아미노산(서열번호 19)이었으며, 아미노산 347-357은 HA 에피토프를 포함한다.
서열번호 52 - pRA13에 의해 암호화된 pFAγ::NifN::FLAG 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-539는 케이 뉴모니아에 NifN 아미노산(개시자 Met 없이 서열번호 11)이었으며, 아미노산 540-551은 FLAG 에피토프를 포함한다.
서열번호 53 - pRA08에 의해 암호화된 pFAγ::NifQ::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-246은 케이 뉴모니아에 NifQ 아미노산(개시자 Met 없이 서열번호 12)이었으며, 아미노산 247-263은 HA 에피토프를 포함한다.
서열번호 54 - pRA16에 의해 암호화된 pFAγ::NifS::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-478은 케이 뉴모니아에 NifS 아미노산(개시자 Met 없이 서열번호 13)이었으며, 아미노산 479-496은 HA 에피토프를 포함한다.
서열번호 55 - pRA15에 의해 암호화된 pFAγ::NifU::FLAG 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-353은 케이 뉴모니아에 NifU 아미노산(개시자 Met 없이 서열번호 14)이었으며, 아미노산 354-365는 FLAG 에피토프를 포함한다.
서열번호 56 - pRA17에 의해 암호화된 pFAγ::NifV::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-461은 케이 뉴모니아에 NifV 아미노산(서열번호 20)이었으며, 아미노산 462-471은 FLAG 에피토프를 포함한다.
서열번호 57 - pRA14에 의해 암호화된 pFAγ::NifX::FLAG 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-235는 케이 뉴모니아에 NifX 아미노산(개시자 Met 없이 서열번호 15)이었으며, 아미노산 236-247은 FLAG 에피토프를 포함한다.
서열번호 58 - pRA12에 의해 암호화된 pFAγ::NifY::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-299는 케이 뉴모니아에 NifY 아미노산(개시자 Met 없이 서열번호 8)이었으며, 아미노산 300-316은 HA 에피토프를 포함한다.
서열번호 59 - pRA19에 의해 암호화된 pFAγ::NifD::HA 융합 폴리펩티드의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-561은 케이 뉴모니아에 NifD 아미노산(개시자 Met 없이 및 Met 다음의 서열번호 6)이었으며, 아미노산 562-574는 HA 에피토프를 포함한다.
서열번호 60 - 어떠한 C-말단 연장도 없는, pFAγ::NifK 융합 폴리펩티드(pRA25)의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-599는 케이 뉴모니아에 NifK 아미노산(개시자 Met 없이 서열번호 7)이었다.
서열번호 61 - 하이포크레아 제코리나(Hypocrea jecorina) 셀로비오하이드롤라제 II(수납 번호 AAG39980.1)로부터의 공지된 비구조화 링커 영역으로부터의 11-잔기 섹션의 아미노산 서열.
서열번호 62 - 8-잔기 FLAG 에피토프의 아미노산 서열.
서열번호 63 - 링커의 아미노산 서열. 링커는 길이가 30 잔기이고 알라닌에 의해 교체된 최종 아르기닌을 갖는 하이포크레아 제코리나 셀로비오하이드롤라제 II(수납 번호 AAG39980.1, ATPPPGSTTTR; 서열번호 61)로부터의 공지된 비구조화 링커 영역으로부터의 11-잔기 섹션, 이어서 8-잔기 FLAG 에피토프(DYKDDDDK; 서열번호 62), 이어서 최종적으로 알라닌에 의해 교체된 아르기닌을 갖는 11-잔기 비구조화 링커 서열의 또 다른 사본으로 이루어진다.
서열번호 64 - NifK에 대한 어떠한 C-말단 연장도 없는, pFAγ::NifD-링커-NifK 융합 폴리펩티드(pRA02)의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-561은 케이 뉴모니아에 NifD 아미노산(개시자 Met 없이 및 Met 다음의 서열번호 6)이었고, 아미노산 562-592는 30 아미노산 링커였고, 아미노산 593-1110은 케이 뉴모니아에 NifK 아미노산(개시자 Met 없이 서열번호 7)이었다.
서열번호 65 - NifK에 대한 어떠한 C-말단 연장도 없는, pFAγ::NifD-링커-NifK::HA 융합 폴리펩티드(pRA20)의 아미노산 서열. 아미노산 1-77은 pFAγ MTP에 상응하며, 아미노산 78-80(GAP)은 AscI 부위에서 클로닝의 결과였고, 아미노산 81-561은 케이 뉴모니아에 NifD 아미노산(개시자 Met 없이 및 Met 다음의 서열번호 6)이었고, 아미노산 562-592는 30 아미노산 링커였고, 아미노산 593-1110은 케이 뉴모니아에 NifK 아미노산(개시자 Met 없이 서열번호 7)이었고 아미노산 1111-1119는 HA 에피토프를 포함한다.
서열번호 66 - 서열번호 67의 아미노산 347-356에 상응하는, MYC 에피토프를 포함하는 C-말단 연장의 아미노산 서열.
서열번호 67 - pFAγ::NifM::MYC 융합 폴리펩티드의 아미노산 서열.
서열번호 68 - 번역 개시 코돈에서 출발하여, pRA19에서 pFAγ::NifD::HA 융합 폴리펩티드를 암호화하는 뉴클레오티드 서열.
서열번호 69 - 케이 뉴모니아에로부터의 NifK 폴리펩티드의 C-말단에서 최종 4개 아미노산 잔기의 아미노산 서열.
서열번호 70. pFAγ-C 폴리펩티드를 암호화하는 DNA 단편의 뉴클레오티드 서열.
서열번호 71. pFAγ-C 폴리펩티드의 아미노산 서열.
서열번호 72. 올리고뉴클레오티드 프라이머 NifD-F.
서열번호 73. 올리고뉴클레오티드 프라이머 NifD-R.
서열번호 74. 야생형 케이 뉴모니아에 NifW의 아미노산 서열.
서열번호 75. MTP-FAγ⁵¹ 폴리펩티드의 아미노산 서열.
서열번호 76. FAγ-scar⁹ 폴리펩티드의 아미노산 서열.
서열번호 77. CPN60 MTP의 아미노산 서열.
서열번호 78. CPN60/No GG링커 MTP의 아미노산 서열.
서열번호 79. 초산화물 디스뮤타제(SOD) MTP(At3G10920)의 아미노산 서열.
서열번호 80. 배가된 초산화물 디스뮤타제(2SOD) MTP(At3G10920)의 아미노산 서열.
서열번호 81. 변형된 초산화물 디스뮤타제(SODmod) MTP(At3g10920)의 아미노산 서열.
서열번호 82. 배가된 변형된 초산화물 디스뮤타제(2SODmod) MTP(At3g10920)의 아미노산 서열.
서열번호 83. L29 MTP(At1G07830)의 아미노산 서열.
서열번호 84. 뉴로스포라 크라싸(Neurospora crassa) F0 ATPase 서브유닛 9(SU9) MTP의 아미노산 서열.
서열번호 85. gATPase 감마 서브유닛(FAγ51) MTP의 아미노산 서열.
서열번호 86. CoxIV 트윈 스트렙(ABM97483) MTP의 아미노산 서열.
서열번호 87. CoxIV 10xHis(ABM97483) MTP의 아미노산 서열.
서열번호 88. 초산화물 디스뮤타제(SOD) MTP(서열번호 80)에 대한 예측된 scar의 아미노산 서열.
서열번호 89. 배가된 초산화물 디스뮤타제(2SOD) MTP(서열번호 81)에 대한 예측된 scar의 아미노산 서열.
서열번호 90. L29 MTP(서열번호 84)에 대한 예측된 scar의 아미노산 서열.
서열번호 91. 뉴로스포라 크라싸 F0 ATPase 서브유닛 9(SU9) MTP(서열번호 85)에 대한 예측된 scar의 아미노산 서열.
서열번호 92. gATPase 감마 서브유닛(FAγ51) MTP(서열번호 86)에 대한 예측된 scar의 아미노산 서열.
서열번호 93. CoxIV 트윈 스트렙 MTP(서열번호 87)에 대한 예측된 scar의 아미노산 서열.
서열번호 94. CoxIV 10xHis MTP(서열번호 88)에 대한 예측된 scar의 아미노산 서열.
서열번호 95. 변이체 NifD의 아미노산 서열.
서열번호 96. 변이체 NifS의 아미노산 서열.
서열번호 97. NifK 9 아미노산 C-말단 연장.
서열번호 98. 올리고뉴클레오티드 프라이머.
서열번호 99. 올리고뉴클레오티드 프라이머.
서열번호 100. 올리고뉴클레오티드 프라이머.
서열번호 101. 올리고뉴클레오티드 프라이머.
서열번호 102. 올리고뉴클레오티드 프라이머 BO1.
서열번호 103. 올리고뉴클레오티드 프라이머 BO2.
서열번호 104. 링커의 아미노산 서열.
서열번호 105. 올리고뉴클레오티드 프라이머 pRA31DK-FW.
서열번호 106. 올리고뉴클레오티드 프라이머 pRA31DK-RV.
서열번호 107. 올리고뉴클레오티드 프라이머 D_start_RV.
서열번호 108. 올리고뉴클레오티드 프라이머 K_end_FW.
서열번호 109. 올리고뉴클레오티드 프라이머.
서열번호 110. 올리고뉴클레오티드 프라이머.
서열번호 111. NifD-링커-NifK 폴리펩티드 9 아미노산 서열 N-말단 연장
서열번호 112. HA 에피토프의 아미노산 서열.
서열번호 113. NifE-NifN HA 폴리펩티드 링커의 아미노산 서열.
서열번호 114. 올리고뉴클레오티드 프라이머 pRAEN-FW.
서열번호 115. 올리고뉴클레오티드 프라이머 pRAEN-RV.
서열번호 116. 올리고뉴클레오티드 프라이머 E_start_RV.
서열번호 117. 올리고뉴클레오티드 프라이머 N_end_FW.
서열번호 118. 올리고뉴클레오티드 프라이머.
서열번호 119. 올리고뉴클레오티드 프라이머.
서열번호 120. SCSV-S4 버전 1 프로모터의 뉴클레오티드 서열.
서열번호 121. SCSV-S4 버전 2 프로모터의 뉴클레오티드 서열.
서열번호 122. SCSV-S7 프로모터의 뉴클레오티드 서열.
서열번호 123. CaMV-35S 긴 버전 프로모터의 뉴클레오티드 서열.
서열번호 124. CaMV-2x25S 프로모터의 뉴클레오티드 서열.
서열번호 125. P19 바이러스 억제인자 단백질의 아미노산 서열.
서열번호 126. P19 펩티드의 아미노산 서열.
서열번호 127. 아미노산 서열 P19 펩티드.
서열번호 128-143. NifK 펩티드의 아미노산 서열.
서열번호 144-154. NifH 펩티드의 아미노산 서열.
서열번호 155-160. NifB 펩티드의 아미노산 서열.
서열번호 161-165. NifJ 펩티드의 아미노산 서열.
서열번호 166-174. NifS 펩티드의 아미노산 서열.
서열번호 175-182. NifX 펩티드의 아미노산 서열.
서열번호 183-186. NifF 펩티드의 아미노산 서열.

일반적인 기법 및 정의

달리 구체적으로 정의되지 않는 한, 본 명세서에 사용되는 모든 과학기술 용어는 당해 분야(예를 들어 세포 배양, 분자 유전학, 식물 분자 생물학, 단백질 화학, 및 생화학에서)의 통상적인 숙련가에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다.

달리 나타내지 않는 한, 본 발명에 사용되는 재조합 단백질, 세포 배양, 및 면역학적 기법은 당해 분야의 숙련가에게 주지된 표준 과정이다. 상기와 같은 기법은 하기와 같은 출처의 문헌 전체를 통해 기재되고 설명된다: J. Perbal, A Practical Guide to Molecular Cloning, John Wiley and Sons (1984), J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbour Laboratory Press (1989), T.A. Brown (editor), Essential Molecular Biology: A Practical Approach, Volumes 1 and 2, IRL Press (1991), D.M. Glover and B.D. Hames (editors), DNA Cloning: A Practical Approach, Volumes 1-4, IRL Press (1995 and 1996), and F.M. Ausubel et al. (editors), Current Protocols in Molecular Biology, Greene Pub. Associates and Wiley-Interscience (1988, including all updates until present), Ed Harlow and David Lane (editors) Antibodies: A Laboratory Manual, Cold Spring Harbour Laboratory, (1988), 및 J.E. Coligan et al. (editors) Current Protocols in Immunology, John Wiley & Sons (현재까지의 모든 업데이트물 포함).

"및/또는"이란 용어, 예를 들어 "X 및/또는 Y"는 "X 및 Y" 또는 "X 또는 Y" 중 어느 하나를 의미하는 것으로 이해될 것이며 상기 두 의미 모두 또는 어느 하나의 의미에 대한 분명한 지지를 제공하는 것으로 간주될 것이다.

본 명세서 전체를 통해 "포함하다"란 단어 또는 "포함하는("comprises" 또는 "comprising")"과 같은 변형은 서술된 요소, 정수 또는 단계, 또는 요소들, 정수들 또는 단계들의 그룹의 포함을 암시하지만, 임의의 다른 요소, 정수 또는 단계, 또는 요소들, 정수들 또는 단계들의 그룹의 제외를 의미하지는 않는 것으로 이해될 것이다.

니트로게나제는 질소(N₂)의 강한 삼중 결합의 환원을 촉매화하여 암모니아(NH₃)를 생성시키는 진정세균 및 고세균 중의 효소이다. 니트로게나제는 자연에서 오직 세균에서만 발견된다. 상기는 별도로 정제될 수 있는 2개 효소, 즉 디니트로게나제 및 디니트로게나제 리덕타제의 복합체이다. 디니트로게나제(또한 성분 I 또는 몰리브데늄-철(MoFe) 단백질로서 지칭됨)는 2개의 NifD 및 2개의 NifK 폴리페티드의 사량체(α₂β₂)이며, 또한 2개의 "P-클러스터" 및 2개의 "FeMo-보조인자"(FeMo-Co)를 함유한다. NifD-NifK 서브유닛의 각 쌍은 하나의 P-클러스터 및 하나의 FeMo-Co를 함유한다. FeMo-Co는 호모시트레이트 분자(몰리브데늄 원자에 배위되고 3개의 황 리간드에 의해 Fe₄-S₃ 클러스터에 가교된다)와 착화된 MoFe₃-S₃ 클러스터로 구성된 금속클러스터이다. FeMo-Co는 세포에서 별도로 조립되고 이어서 apo-MoFe 단백질에 통합된다. P-클러스터는 또한 금속클러스터이며 8개의 Fe 및 7개의 황 원자를 함유하고 FeMo-Co와 유사하지만 다른 구조를 갖는다. P-클러스터는 디니트로게나제의 αβ 서브유닛 계면에 위치하며 2개의 서브유닛 모두로부터의 시스테이닐 잔기에 의해 배위된다. 디니트로게나제 리덕타제(또한 성분 II 또는 "Fe 단백질"로서 지칭된다)는 서브유닛 계면 및 2개의 Mg-ATP 결합 부위(각각의 서브유닛에 하나씩)에 단일 Fe₄-S₄ 클러스터를 또한 함유하는 NifH 폴리펩티드의 이량체이다. 상기 효소는 디니트로게나제에 대한 편성 전자 공여체이며, 여기에서 상기 전자는 Fe₄-S₄ 클러스터로부터 P-클러스터로 전달되고 차례로 N₂ 환원 부위인 FeMo-Co로 전달된다.

Mo-함유 니트로게나제가 세균에서 가장 흔히 발견되는 니트로게나제이지만, 유전적으로 독특하지만 유사한 보조인자 및 서브유닛 조성을 갖는 2개의 상동성 니트로게나제, 즉 각각 Vnf(바나듐 질소 고정) 및 Anf(대체 질소 고정) 유전자에 의해 암호화되는 바나듐-함유 니트로게나제 및 Fe-단독 니트로게나제가 존재한다. 자연에서 일부 세균은 니트로게나제의 3가지 유형을 모두 가지며, 다른 세균, 예를 들어 클렙시엘라 뉴모니아에는 단지 Mo- 및 V-함유 효소만 또는 단지 Mo-함유 효소만을 함유한다.

다양한 질소 고정(Nif) 유전자가 FeMo-Co의 생합성 및 니트로게나제 성분의 그의 촉매적으로 활성인 형태로의 성숙에 요구된다. FeMo-Co 합성에서 NifB, NifE, NifH, NifN, NifQ, NifV 및 NifX 폴리펩티드의 역할이 기재되었다(Rubio and Ludden, 2005).

원핵생물 효소 니트로게나제에 의해 촉매화되는 생물학적 N₂ 고정은 합성 N₂ 비료의 사용에 대한 대안이다. 산소에 대한 니트로게나제의 민감성은 직접적인 Nif 유전자 전달에 의한 식물, 예를 들어 곡류 작물로의 공학적 생물학적 질소 고정에 대해 큰 장벽이다.

본 발명자는 Nif 폴리펩티드를 식물 세포의 미토콘드리아 기질(MM)에 표적화하는 것이 산소 민감성 문제를 극복할 수도 있음을 고려하였다. MM은 산소 민감성 Fe-S 클러스터를 함유하는 다른 효소들을 기능하게 하는 산소 소비 효소를 갖는다. 미토콘드리아 Fe-S 클러스터 조립 기구는 질소자급영양 균등체와 유사하다((Balk and Pilon, 2011; Lill and M

hlenhoff, 2008). 따라서 니트로게나제 생합성에 대한 필요조건 중 일부는 이미 MM 중에 준비가 되어 있어, 재편성에 필요한 Nif 유전자의 수를 감소시킬 수 있다. 보조인자 호모시트레이트는 TCA 주기의 부분으로서 생성된다. 또한 ATP의 높은 환원 전위 및 농도가 존재하며((Geigenberger and Fernie, 2014; Mackenzie and McIntosh, 1999), 이는 모두 니트로게나제 효소 촉매반응에 전제조건이다. 추가로 미토콘드리아 중의 글루타메이트 신타제의 존재는 니트로게나제에 의해 고정된 임의의 암모늄을 식물 대사에 진입시키는 진입점을 제공한다. 이러한 특징이 제공되고 미토콘드리아 자체가 α-프로테오박테리아 기원이라는 사실을 고려하여, 본 발명자는 상기 세포소기관이 니트로게나제의 기능적 재편성을 시도하기 위한 장소로서 매우 적합한 것으로 고려하였다.

식물 세포 미토콘드리아에서 니트로게나제의 재편성을 향한 첫 번째 단계로서, 개별적인 Nif 단백질을 MM에 정확하게 표적화할 수 있다는 증거가 필요하였다. 이를 위해서, 발명자는 단독으로, 또는 보다 중요하게는 함께 트랜스유전자의 발현을 제공하는 발현 플랫폼(Wood et al., 2009)으로서 모델 식물 니코티아나 벤타미아나를 선택하였다. 대부분의 MM-위치한 단백질은 핵-암호화되기 때문에, 본 발명자는 앞서 특성화된 N-말단 펩티드 표적화 신호(Lee et al., 2012)를 사용하여, 세포이하 신호전달 및 수송 과정의 이해에 대한 최근의 진보(Huang et al., 2009; Murcha et al., 2014)에 의존하였다.

모델인 세균 질소자급영양체 클렙시엘라 뉴모니아에는 니트로게나제의 생합성 및 촉매 기능에 16개의 독특한 단백질을 사용한다. 본 발명자는 식물 MM에의 표적화를 위해 케이 뉴모니아에로부터의 16개 Nif 단백질을 모두 재조작하고 엔 벤타미아나 잎에서 이들의 발현 및 가공을 평가하였다. 16개의 Nif 폴리펩티드를 모두 일시적으로 발현시키고 서열 특이성 MM 가공에 대해 시험하였다. 본 발명자는 16개의 Nif 폴리펩티드가 모두 식물 잎 세포에서 MTP:Nif 융합 폴리펩티드로서 개별적으로 발현될 수 있음을 확립시켰다. 더욱 또한, 본 발명자는 이들 단백질을, 니트로게나제 기능을 잠재적으로 수용하는 세포이하 장소인 미토콘드리아 기질(MM)에 표적화할 수 있으며 미토콘드리아 가공 프로테아제(MPP)에 의해 절단할 수 있다는 증거를 제공한다. 이는 상기와 같은 접근법의 실행가능성에 대한 최초의 실용적 입증이며 식물에서 내인성 질소 고정의 조작 목적을 향한 중요한 진전을 나타낸다.

미토콘드리아 표적화 펩티드(MTP)-Nif 융합 폴리펩티드

본 발명은 미토콘드리아 표적화 펩티드(MTP)-Nif 융합 폴리펩티드 및 그의 절단된 폴리펩티드 생성물에 관한 것이다. 본 발명의 MTP-Nif 융합 폴리펩티드가 식물 세포에서 발현될 때, MTP-Nif 융합 폴리펩티드 및/또는 절단된 폴리펩티드 생성물은 미토콘드리아 기질(MM)을 표적화한다. 바람직하게, 융합 폴리펩티드는 식물 세포에 니트로게나제 리덕타제 및/또는 니트로게나제 활성, 또는 세포 중의 상응하는 야생형 Nif 폴리펩티드에 의해 부여되는 활성과 동일한 활성을 부여한다.

본 명세서에 사용되는 바와 같이, "융합 폴리펩티드"란 용어는 펩티드 결합에 의해 공유 결합되는 2개 이상의 기능성 폴리펩티드 도메인을 포함하는 폴리펩티드를 의미한다. 전형적으로, 융합 폴리펩티드는 본 발명의 키메릭 폴리뉴클레오티드에 의해 단일 폴리펩티드 쇄로서 암호화된다. 하나의 실시태양에서, 본 발명의 융합 폴리펩티드는 미토콘드리아 표적화 펩티드(MTP) 및 Nif 폴리펩티드(NP)를 포함한다. 상기 실시태양에서, MTP의 C-말단은 NP의 N-말단에 번역에 의해 융합된다. 또 다른 실시태양에서, 본 발명의 폴리펩티드는 MTP의 C-말단 부분 및 NP를 포함하며, 여기에서 상기 C-말단 부분은 MPP에 의한 MTP의 절단으로부터 생성된다. 상기 실시태양에서, MTP의 C-말단 부분의 C-말단은 NP의 N-말단에 번역에 의해 융합된다.

본 명세서에 사용되는 바와 같이, "N-말단에 번역에 의해 융합된"이란 용어는 MTP 폴리펩티드의 C-말단이 펩티드 결합에 의해 NP의 N-말단 아미노산에 공유 결합됨으로써 융합 폴리펩티드가 됨을 의미한다. 하나의 실시태양에서, NP는 상응하는 야생형 NP에 비해 그의 고유의 번역 개시 메티오닌(Met) 잔기 또는 그의 2개의 N-말단 Met 잔기를 포함하지 않는다. 또 다른 실시태양에서, NP는 번역 개시 Met 또는 야생형 NP 폴리펩티드, 예를 들어 NifD의 2개의 N-말단 Met 잔기 중 하나 또는 둘 다를 포함한다.

상기와 같은 폴리펩티드는 전형적으로 키메릭 단백질 암호화 영역의 발현에 의해 생성되며 이때 MTP를 암호화하는 뉴클레오티드의 번역 판독 프레임은 NP를 암호화하는 뉴클레오티드의 판독 프레임과 인-프레임 결합된다. 숙련가는 MTP의 C-말단이 링커 없이 또는 하나 이상의 아미노산 잔기, 예를 들어 1 내지 5 아미노산 잔기의 링커를 통해 NP의 N-말단 아미노산에 번역에 의해 융합될 수 있음을 알 것이다. 상기와 같은 링커는 또한 MTP의 부분인 것으로 간주될 수 있다. 단백질 암호화 영역의 발현에 이어서 식물 세포의 MM에서 MTP의 절단이 있을 수 있으며, 상기와 같은 절단(일어나는 경우)은 본 발명의 융합 폴리펩티드의 생성 개념에 포함된다.

융합 폴리펩티드 또는 가공된 Nif 폴리펩티드는 바람직하게는 상응하는 야생형 Nif 폴리펩티드의 경우에 필적하는 기능성 Nif 활성을 갖는다. 융합 폴리펩티드 또는 가공된 Nif 폴리펩티드의 기능 활성을 세균 및 생화학적 상보성 분석에서 측정할 수 있다. 바람직한 실시태양에서 융합 폴리펩티드 또는 가공된 Nif 폴리펩티드는 야생형 Nif 활성의 약 70 내지 100%를 갖는다.

융합 폴리펩티드는 하나 초과의 MTP, 및/또는 하나 초과의 NP를 포함할 수 있다, 예를 들어 융합 폴리펩티드는 MTP, NifD 폴리펩티드 및 NifK 폴리펩티드를 포함할 수 있다. 융합 폴리펩티드는 또한, 예를 들어 2개의 NP를 연결하는 올리고펩티드 링커를 포함할 수 있다. 바람직하게, 링커는 2개 이상의 기능성 도메인, 예를 들어 2개의 NP, 예를 들어 NifD 및 NifK가 식물 세포에서 기능성 배열로 회합되게 하기에 충분한 길이를 갖는다. 상기와 같은 링커는 길이가 8 내지 50 아미노산 잔기, 바람직하게는 길이가 약 25 내지 35 아미노산, 보다 바람직하게는 길이가 약 30 아미노산 잔기일 수 있다. 융합 폴리펩티드를 적합한 세포에서 통상적인 수단에 의해, 예를 들어 상기 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드 서열의 유전자 발현에 의해 수득할 수 있다.

본 명세서에 사용되는 바와 같이, "실질적으로 정제된 폴리펩티드"는 예를 들어 세포 중의 폴리펩티드와 정상적으로 회합하는 성분(예를 들어 지질, 핵산, 탄수화물)이 실질적으로 없는 폴리펩티드를 의미한다. 바람직하게, 실질적으로 정제된 폴리펩티드는 상기 성분이 적어도 90% 없다.

본 발명의 식물 세포, 트랜스제닉 식물 및 그의 부분은 본 발명의 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함한다. 본 발명의 폴리펩티드는 식물 세포 중에, 특히 식물 세포의 미토콘드리아 중에 자연적으로 존재하지 않으며, 따라서 상기 폴리펩티드를 암호화하는 폴리뉴클레오티드를, 상기가 식물 세포 중에 자연적으로 존재하지 않지만 식물 세포 또는 전구 세포 내로 도입되었기 때문에 본 명세서에서 외인성 폴리뉴클레오티드라 칭할 수 있다. 따라서 본 발명의 폴리펩티드를 생성시키는 본 발명의 세포, 식물 및 식물 부분을, 재조합 폴리펩티드를 생성시킨다라고 할 수 있다. 폴리펩티드와 관련하여 "재조합"이란 용어는 세포에 의해 생성시 외인성 폴리뉴클레오티드에 의해 암호화된 폴리펩티드를 지칭하며, 상기 폴리뉴클레오티드는 재조합 DNA 또는 RNA 기법, 예를 들어 형질전환에 의해 세포 또는 전구 세포 내로 도입되었다. 전형적으로, 식물 세포, 식물 또는 식물 부분은, 적어도 언젠가 상기 식물 세포 또는 식물의 생애 중에 일정량의 폴리펩티드가 생성되게 하는 비-내인성 유전자를 포함한다.

하나의 실시태양에서, 본 발명의 폴리펩티드는 천연 생성 폴리펩티드가 아니다. 또 다른 실시태양에서, 본 발명의 폴리펩티드는 천연 생성이지만, 상기가 자연적으로 존재하지 않는 식물 세포, 바람직하게는 식물 세포의 미토콘드리아 중에 존재한다.

Nif 폴리펩티드

본 명세서에 사용되는 바와 같이, "Nif 폴리펩티드" 및 "Nif 단백질"이란 용어는 호환 가능하게 사용되며 니트로게나제 활성에 관련된 천연 생성 폴리펩티드에 대해 아미노산 서열이 관련된 폴리펩티드를 의미하고, 여기에서 본 발명의 Nif 폴리펩티드는 NifD 폴리펩티드, NifH 폴리펩티드, NifK 폴리펩티드, NifB 폴리펩티드, NifE 폴리펩티드, NifN 폴리펩티드, NifF 폴리펩티드, NifJ 폴리펩티드, NifM 폴리펩티드, NifQ 폴리펩티드, NifS 폴리펩티드, NifU 폴리펩티드, NifV 폴리펩티드, NifW 폴리펩티드, NifX 폴리펩티드, NifY 폴리펩티드 및 NifZ 폴리펩티드(이들은 각각 본 명세서에 정의된 바와 같다)로 이루어지는 그룹 중에서 선택된다. 본 발명의 Nif 폴리펩티드는 본 명세서에 사용되는 바와 같이, 상응하는 천연 생성 Nif 폴리펩티드에 대해 N-말단 또는 C-말단, 또는 이들 모두에 결합된 추가적인 아미노산 잔기를 갖는 천연 생성 Nif 폴리펩티드의 폴리펩티드 상동체를 의미하는, "Nif 융합 폴리펩티드"를 포함한다. 상기에 언급된 바와 같이, Nif 융합 폴리펩티드는 상응하는 야생형 Nif 폴리펩티드에 비해 번역 개시 Met 또는 2개의 N-말단 Met 잔기가 없을 수 있다. 천연 생성 Nif 폴리펩티드에 상응하는, 즉 N-말단 또는 C-말단 또는 이들 모두에 결합된 추가적인 아미노산 잔기가 없는 Nif 융합 폴리펩티드의 아미노산 잔기를 또한 본 명세서에서 Nif 폴리펩티드(이 경우에 "NP"라 약기함)로서, 또는 NifD 폴리펩티드("ND") 등으로서 지칭한다. 바람직한 실시태양에서, "N-말단 또는 C-말단 또는 이들 모두에 결합된 추가적인 아미노산 잔기"는 NP의 N-말단에 결합된 미토콘드리아 표적화 펩티드(MTP) 또는 가공된 MTP, 또는 NP에 대한 N-말단 또는 C-말단, 또는 이들 모두인 에피토프 서열("태그"), 또는 MTP 또는 가공된 MTP 모두 및 에피토프 서열을 포함한다.

천연 생성 Nif 폴리펩티드는 오직 질소-고정 세균을 포함한 일부 세균, 예를 들어 자유 생활 질소 고정 세균, 연합 질소 고정 세균 및 공생 질소 고정 세균에서만 존재한다. 자유 생활 질소 고정 세균은 다른 유기체와 직접적인 상호작용 없이 상당한 수준의 질소를 고정시킬 수 있다. 비제한적으로, 상기 자유 생활 질소 고정 세균은 아조토박터(Azotobacter), 베이제링키아(Beijerinckia), 클렙시엘라, 시아노박테리아(Cyanobacteria) 속(호기성 유기체로서 분류됨)의 구성원 및 클로스트리디움, 데설포비브리오(Desulfovibrio) 속의 구성원, 및 홍색 황세균, 홍색 비-황세균 및 녹색 황세균이라 명명된 세균을 포함한다. 연합 질소 고정 세균은 포아세아에(Poaceae)(잔디류)의 다수의 구성원과 밀접한 연합을 형성할 수 있는 원핵생물 유기체들이다. 이들 세균은 숙주 식물의 근권내 인지가능한 양의 질소를 고정시킨다. 아조스피릴룸(Azospirillum) 속의 구성원이 전형적인 연합 질소 고정 세균이다. 공생 질소 고정 세균은 숙주 식물과 동반하여 공생적으로 질소를 고정시키는 세균들이다. 식물은 질소 고정에 필요한 에너지를 위해 질소 고정 세균에 의해 사용되는, 광합성으로부터의 당을 제공한다. 리조비아(Rhizobia) 속의 구성원이 전형적인 연합 질소 고정 세균이다.

본 발명의 Nif 폴리펩티드 또는 Nif 융합 폴리펩티드는 NifH, NifD, NifK, NifB, NifE, NifN, NifF, NifJ, NifM, NifQ, NifS, NifU, NifV, NifW, NifX, NifY 및 NifZ 폴리펩티드로 이루어지는 그룹 중에서 선택된다.

폴리펩티드 또는 폴리펩티드의 부류는 참조 아미노산 서열에 대한 그의 아미노산 서열의 일치성 정도(일치성%)에 의해, 또는 또 다른 것에 대해서보다는 하나의 참조 아미노산 서열에 대해 더 큰 일치성%를 가짐에 의해 한정될 수 있다. 폴리펩티드 또는 폴리펩티드의 부류를 또한 서열의 일치성 정도 외에, 천연 생성 Nif 폴리펩티드와 동일한 생물학적 활성을 가짐에 의해 한정할 수 있다.

폴리펩티드의 일치성%를 끊김 생성 벌점 = 5 및 끊김 확장 벌점 = 0.3과 함께 GAP(Needleman and Wunsch, 1970) 분석(GCG 프로그램)에 의해, 또는 Blastp 버전 2.5 또는 그의 업데이트된 버전(Altschul et al, 1997)에 의해 측정하며, 여기에서 각각의 경우에 상기 분석은 참조 서열을 포함한 2개의 서열을 상기 참조 서열의 전체 길이에 걸쳐 정렬시킨다. 본 명세서에 사용되는 바와 같이, 참조 서열은 케이 뉴모니아에로부터의 천연 생성 Nif 폴리펩티드를 제공하는 것들, 서열번호 1-20을 포함한다.

하기의 정의에서, 서열번호로서 제공된 참조 서열에 대한 아미노산 서열의 일치성 정도를, 10,000으로 설정된 최대 표적 서열수를 제외한 디폴트 매개변수를 사용하여 Blastp, 버전 2.5 또는 그의 업데이트된 버전(Altschul et al, 1997)에 의해 측정하고 상기 참조 아미노산 서열의 전체 길이를 따라 측정한다.

천연 생성 세균 중 NifH 폴리펩티드는 니트로게나제 복합체의 구조 성분이며 종종 철(Fe) 단백질이라 칭한다. 상기는 서브유닛과 2개의 ATP-결합 도메인간에 결합된 Fe₄S₄ 클러스터와 동종이량체를 형성한다. NifH는 MoFe 단백질(NifD/NifK 이종사량체)에 대한 편성 전자 공여체이며 따라서 니트로게나제 리덕타제(EC 1.18.6.1)로서 기능한다. NifH는 또한 FeMo-Co 생합성 및 apo-MoFe 단백질 성숙화에 관련된다. 본 명세서에 사용되는 바와 같이, "NifH 폴리펩티드"는, 서열이 서열번호 5로서 제공된 아미노산 서열에 적어도 41% 일치하는 아미노산을 포함하고 도메인 TIGR01287, PRK13236, PRK13233 및 cd02040 중 하나 이상을 포함하는 폴리펩티드를 의미한다. TIGR01287 도메인이 각각의 몰리브데늄-철 니트로게나제 리덕타제(NifH), 바나듐-철 니트로게나제 리덕타제(VnfH), 및 철-철 니트로게나제 리덕타제(AnfH) 중에 존재하지만 광-독립적인 원엽록소 리덕타제로부터의 상동성 단백질은 제외한다. 따라서, 본 명세서에 사용되는 바와 같이, NifH 폴리펩티드는, 서열이 서열번호 5에 적어도 41% 일치하는 아미노산을 포함하는 철-결합 폴리펩티드, VnfH 철-결합 폴리펩티드 및 AnfH 철-결합 폴리펩티드의 하위부류를 포함한다. 천연 생성 NifH 폴리펩티드는 전형적으로 260 내지 300 아미노산의 길이를 가지며 천연 단량체는 약 30 kDa의 분자량을 갖는다. 다수의 NifH 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifH 폴리펩티드가 클렙시엘라 미키가넨시스(Klebsiella michiganensis)(수납 번호 WP_049123239.1, 서열번호 5에 99% 일치함), 브렌네리아 구드위니이(Brenneria goodwinii)(WP_048638817.1, 93% 일치함), 시데록시단스 리토트로피쿠스(Sideroxydans lithotrophicus)(WP_013029017.1, 84% 일치함), 데니트로비브리오 아세티필루스(Denitrovibrio acetiphilus)(WP_013010353.1, 80% 일치함), 데설포비브리오 아프리카누스(Desulfovibrio africanus)(WP_014258951.1, 72% 일치함), 클로로비움 파에오박테로이데스(Chlorobium phaeobacteroides)(WP_011744626.1, 69% 일치함), 메타노사에타 콘실리이(Methanosaeta concilii)(WP_013718497.1, 64% 일치함), 로도박터(Rhodobacter)(WP_009565928.1, 61% 일치함), 메타노칼도코커스 인페르누스(Methanocaldococcus infernus)(WP_013099472.1, 42% 일치함) 및 데설포스포로시누스 영이아에(Desulfosporosinus youngiae)(WP_007781874.1, 41% 일치함)로부터 보고되었다. NifH 폴리펩티드는 하기의 문헌들에 기재되고 리뷰되었다: Thiel et al., (1997), Pratte et al., (2006), Boison et al., (2006) 및 Staples et al., (2007).

본 명세서에 사용되는 바와 같이, 기능성 NifH 폴리펩티드는 다른 필수적인 서브유닛, 예를 들어 NifD 및 NifK, 및 FeMo 또는 다른 보조인자와 함께 기능성 니트로게나제 단백질 복합체를 형성할 수 있는 NifH 폴리펩티드이다.

본 명세서에 사용되는 바와 같이, "NifD 폴리펩티드"는, 서열이 서열번호 6으로서 제공된 아미노산 서열에 적어도 33% 일치하는 아미노산을 포함하고 (i) 도메인 TIGR01282 및 COG2710(이들은 모두 서열번호 6에 나타낸 아미노산 서열을 갖는 폴리펩티드를 포함하는 철-몰리브데늄 결합 폴리펩티드에서 발견된다) 중 하나 또는 이들 모두, 또는 (ii) 철-바나듐 결합 도메인 TIGR01860(이 경우에 NifD 폴리펩티드는 VnfD 폴리펩티드의 하위부류 중에 있다), 또는 (iii) 철-철 결합 도메인 TIGR1861(이 경우에 NifD 폴리펩티드는 AnfD 폴리펩티드의 하위부류 중에 있다)를 포함하는 폴리펩티드를 의미한다.

본 명세서에 사용되는 바와 같이, NifD 폴리펩티드는, 서열이 서열번호 6에 적어도 33% 일치하는 아미노산을 포함하는 철-몰리브데늄(FeMo-Co) 결합 폴리펩티드, VnfD 철-바나듐 폴리펩티드 및 AnfD 폴리펩티드의 하위부류를 포함한다. 천연 생성 NifD 폴리펩티드는 전형적으로 470 내지 540 아미노산의 길이를 갖는다. 다수의 NifD 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifD 폴리펩티드가 라오울텔라 오르니티노리티카(Raoultella ornithinolytica)(수납 번호 WP_044347161.1, 서열번호 6에 96% 일치함), 클루이베라 인테르메디아(Kluyvera intermedia)(WP_047370273.1, 93% 일치함), 딕케야 다단티이(Dickeya dadantii)(WP_038902190.1, 89% 일치함), 톨루모나스 스페시즈(Tolumonas sp.) BRL6-1(WP_024872642.1, 81% 일치함), 마그네토스피릴룸 그리피스왈덴세(Magnetospirillum gryphiswaldense)(WP_024078601.1, 68% 일치함), 써모아나에로박테리움 써모사카로리티쿰(Thermoanaerobacterium thermosaccharolyticum)(WP_013298320.1, 42% 일치함), 메타노써모박터 써마우토트로피쿠스(Methanothermobacter thermautotrophicus)(WP_010877172.1, 38% 일치함), 데설포비브리오 아프리카누스(Desulfovibrio africanus)(WP_014258953.1, 37% 일치함), 데설포토마쿨룸 스페시즈(Desulfotomaculum sp.) LMa1(WP_066665786.1, 37% 일치함), 데설포미크로비움 바쿨라툼(Desulfomicrobium baculatum)(WP_015773055.1, 36% 일치함), 피스케렐라 무스시콜라(Fischerella muscicola)(WP_016867598.1, 34% 일치함)의 VnfD 폴리펩티드 및 오피투타세아에 박테리움(Opitutaceae bacterium) TAV5(WP_009512873.1, 33% 일치함)의 AnfD 폴리펩티드로부터 보고되었다. NifD 폴리펩티드는 하기의 문헌에 기재되고 리뷰되었다: Lawson and Smith (2002), Kim and Rees (1994), Eady (1996), Robson et al., (1989), Dilworth et al., (1988), Dilworth et al., (1993), Miller and Eady (1988), Chiu et al., (2001), Mayer et al., (1999), 및 Tezcan et al., (2005).

철-몰리브데늄 하위부류의 NifD 폴리펩티드는 니트로게나제 복합체의 핵심 서브유닛이며, FeMo 보조인자와 함께 니트로게나제의 코어 및 기질 환원 부위의 α₂β₂ MoFe 단백질 복합체의 α 서브유닛이다. 본 명세서에 사용되는 바와 같이, 기능성 NifD 폴리펩티드는 다른 필수 서브유닛, 예를 들어 NifH 및 NifK, 및 FeMo 또는 다른 보조인자와 함께 기능성 니트로게나제 단백질 복합체를 형성할 수 있는 NifD 폴리펩티드이다.

본 명세서에 사용되는 바와 같이, "NifK 폴리펩티드"는, 서열이 서열번호 7로서 제공된 아미노산 서열에 적어도 31% 일치하는 아미노산을 포함하고 보존된 도메인 cd01974, TIGR01286, 또는 cd01973 중 하나 이상을 포함하는 폴리펩티드를 의미하며, 이 경우에 상기 NifK 폴리펩티드는 VnfK 폴리펩티드의 하위부류 중에 있다. 본 명세서에 사용되는 바와 같이, NifK 폴리펩티드는 철-바나듐 니트로게나제로부터의 VnfK 폴리펩티드를 포함한다. 천연 생성 NifK 폴리펩티드는 전형적으로 430 내지 530 아미노산의 길이를 갖는다. 다수의 NifK 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifK 폴리펩티드가 클렙시엘라 미키가넨시스(수납 번호 WP_049080161.1, 서열번호 7에 99% 일치함), 라오울텔라 오르니티노리티카(WP_044347163.1, 96% 일치함), 클렙시엘라 바리이콜라(Klebsiella variicola)(SBM87811.1, 94% 일치함), 클루이베라 인테르메디아(WP_047370272.1, 89% 일치함), 라넬라 아쿠아틸리스(Rahnella aquatilis)(WP_014333919.1, 82% 일치함), 톨루모나스 아우엔시스(Tolumonas auensis)(WP_012728880.1, 75% 일치함), 슈도모나스 스투트제리(Pseudomonas stutzeri)(WP_011912506.1, 68% 일치함), 비브리오 나트리에젠스(Vibrio natriegens)(WP_065303473.1, 65% 일치함), 아조아르쿠스 톨루클라스티쿠스(Azoarcus toluclasticus)(WP_018989051.1, 54% 일치함), 프랑키아 스페시즈(Frankia sp.)(prf||2106319A, 50% 일치함) 및 메타노사르시나 아세티보란스(Methanosarcina acetivorans)(WP_011021239.1, 31% 일치함)로부터 보고되었다. 서열번호 7에 31% 미만의 일치성을 갖지만 상기 나열된 도메인 중 어느 것도 함유하지 않으며 따라서 본 명세서에서 데이터베이스 중에 NifK 폴리펩티드로서 포함되지 않는 "NifK"로서 주석을 단 폴리펩티드의 일부의 예가 존재한다. NifK 폴리펩티드가 하기의 문헌에 기재되고 리뷰되었다: Kim and Rees (1994), Eady (1996), Robson et al., (1989), Dilworth et al., (1988), Dilworth et al., (1993), Miller and Eady (1988), Igarashi and Seefeldt (2003), Fani et al., (2000) 및 Rubio and Ludden (2005).

철-몰리브데늄 하위부류의 NifK 폴리펩티드는 니트로게나제의 코어에서 α₂β₂ MoFe 단백질 복합체의 β 서브유닛인 니트로게나제 복합체의 핵심 서브유닛이다. 본 명세서에 사용되는 바와 같이, 기능성 NifK 폴리펩티드는 다른 필수적인 서브유닛, 예를 들어 NifD 및 NifH, 및 FeMO 또는 다른 보조인자와 함께 기능성 니트로게나제 단백질 복합체를 형성할 수 있는 NifK 폴리펩티드이다. 바람직한 실시태양에서, 아미노산 서열 서열번호 7과 정렬시, 본 발명의 NifK 폴리펩티드의 아미노산 서열은 그의 C-말단에 아미노산 DLVR(서열번호 7의 잔기 517-520), C-말단 아미노산인 아르기닌을 갖는다. 즉, 본 발명의 NifK 폴리펩티드 및 NifK 융합 폴리펩티드는 바람직하게는 고유의 NifK 폴리펩티드와 동일한 C-말단을 갖는다, 즉 C-말단에 인공적인 부가를 갖지 않는다. 상기와 같은 바람직한 NifK 폴리펩티드는 실시예에 나타낸 바와 같이, NifD 및 NifH 폴리펩티드와 기능성 니트로게나제 복합체를 보다 양호하게 형성할 수 있다.

천연 생성 세균 중의 NifB 폴리펩티드는 FeMo-Co 합성에 관련된 단백질로, [4Fe-4S] 클러스터를, FeMo-Co의 전구체로서 작용하는 중심 C 원자를 갖는 보다 높은 핵성의 Fe-S 클러스터, NifB-Co로 전환시킨다(Guo et al., 2016). 따라서 NifB는 FeMo-Co 합성 경로에서 첫 번째 개입 단계를 촉매화한다. NifB의 NifB-co 생성물은 NifE-NifN 복합체에 결합할 수 있으며 금속클러스터 담체 단백질 NifX에 의해 NifB로부터 NifE-NifN으로 왕복할 수 있다.

본 명세서에 사용되는 바와 같이, "NifB 폴리펩티드"는, 서열이 서열번호 9로서 제공된 아미노산 서열에 적어도 27% 일치하는 아미노산을 포함하는 폴리펩티드를 의미한다. 대부분의 NifB 폴리펩티드는 보존된 도메인 TIGR01290, NifB 보존된 도메인 cd00852, NifX-NifB 상과 보존된 도메인 cl00252 및 라디칼_SAM 보존된 도메인 cd01335 중 하나 이상을 포함한다. 본 명세서에 사용되는 바와 같이, NifB 폴리펩티드는 NifB 기능을 갖는 것으로서 주석이 달렸지만 상기 도메인 중 하나를 갖지 않는 천연 생성 폴리펩티드를 포함한다. 천연 생성 NifB 폴리펩티드는 전형적으로 440 내지 500 아미노산의 길이를 가지며 천연 단량체는 약 50 kDa의 분자량을 갖는다. 다수의 NifB 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifB 폴리펩티드가 라오울텔라 오르니티노리티카(수납 번호 WP_041145602.1, 서열번호 9에 91% 일치함), 코사코니아 라디신시탄스(Kosakonia radicincitans)(WP_043953592.1, 80% 일치함), 딕케야 크리산테미(Dickeya chrysanthemi)(WP_040003311.1, 76% 일치함), 펙토박테리움 아트로셉티쿰(Pectobacterium atrosepticum)(WP_011094468.1, 70% 일치함), 브렌네리아 구드위니이(WP_048638849.1, 63% 일치함), 할로로도스피라 할로필라(Halorhodospira halophila)(WP_011813098.1, 59% 일치함), 메타노사르시나 바르케리(Methanosarcina barkeri)(WP_048108879.1, 50% 일치함), 클로스트리디움 푸리니리티쿰(Clostridium purinilyticum)(WP_050355163.1, 40% 일치함), 게오필룸 루비쿤둠(Geofilum rubicundum)(GAO28552.1, 35% 일치함) 및 데설포비브리오 살렉시겐스(Desulfovibrio salexigens)(WP_015850328.1, 27% 일치함)로부터 보고되었다. 본 명세서에 사용되는 바와 같이, "기능성 NifB 폴리펩티드"는 [4Fe-4S] 클러스터로부터 NifB-co를 형성할 수 있는 NifB 폴리펩티드이다. NifB 폴리펩티드가 하기의 문헌들에 기재되고 리뷰되었다: Curatti et al., (2006) 및 Allen et al., (1995).

NifEN 복합체는, 디니트로게나제의 정확한 조립에 필요하고 또한 디니트로게나제와 구조적으로 유사한 스캐폴드 복합체이다(Fay et al., 2016). NifEN 복합체는 각각 NifE 및 NifN의 2개 서브유닛으로 구성되어 이종사량체(여기에서 ENα₂β₂라 칭한다)를 형성한다. 천연 생성 세균 중의 NifE 폴리펩티드는 NifN 폴리펩티드와의 ENα₂β₂ 사량체의 α 서브유닛인 폴리펩티드이며, 상기 ENα₂β₂ 사량체는 FeMo-Co 합성에 요구되고 FeMo-Co가 합성되는 스캐폴드로서 기능하는 것으로 제안된다.

본 명세서에 사용되는 바와 같이, "NifE 폴리펩티드"는, 서열이 서열번호 10으로서 제공된 아미노산 서열에 적어도 32% 일치하는 아미노산을 포함하고 도메인 TIGR01283 및 PRK14478 중 하나 또는 둘 다를 포함하는 폴리펩티드를 의미한다. TIGR01283 도메인 단백질과의 구성원은 또한 상과 cl02775의 구성원이다. 천연 생성 NifE 폴리펩티드는 전형적으로 440 내지 490 아미노산의 길이를 가지며 천연 단량체는 약 50 kDa의 분자량을 갖는다. 다수의 NifE 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifE 폴리펩티드가 클렙시엘라 미키가넨시스(수납 번호 WP_049114606.1, 서열번호 10에 99% 일치함), 클렙시엘라 바리이콜라(Klebsiella variicola)(SBM87755.1, 92% 일치함), 딕케야 파라디시아카(Dickeya paradisiaca)(WP_012764127.1, 89% 일치함), 톨루모나스 아우엔시스(Tolumonas auensis)(WP_012728883.1, 75% 일치함), 슈도모나스 스투트제리(WP_003297989.1, 69% 일치함), 아조토박터 비넬란디이(Azotobacter vinelandii)(WP_012698965.1, 62% 일치함), 트리코르무스 아졸라에(Trichormus azollae)(WP_013190624.1, 55% 일치함), 파에니바실러스 두루스(Paenibacillus durus)(WP_025698318.1, 50% 일치함), 설퓨리쿠르붐 쿠지엔세(Sulfuricurvum kujiense)(WP_013460149.1, 44% 일치함), 메타노박테리움 포르미시쿰(Methanobacterium formicicum)(AIS31022.1, 39% 일치함), 아나에로무사 아시다미노필라(Anaeromusa acidaminophila)(WP_018701501.1, 35% 일치함) 및 메가스파에라 세레비지아에(Megasphaera cerevisiae)(WP_048514099.1, 32% 일치함)로부터 보고되었다. 본 명세서에 사용되는 바와 같이, "기능성 NifE 폴리펩티드"는 복합체가 FeMo-Co를 합성할 수 있도록 NifN과 함께 기능성 사량체를 형성할 수 있는 NifE 폴리펩티드이다. NifE 폴리펩티드는 하기의 문헌들에 기재되고 리뷰되었다: Fay et al., (2016), Hu et al., (2005), Hu et al., (2006) 및 Hu et al., (2008).

천연 생성 세균 중 NifF 폴리펩티드는 NifH에 대한 전자 공여체인 플라보독신이다. 본 명세서에 사용되는 바와 같이, "NifF 폴리펩티드"는, 서열이 서열번호 16으로서 제공된 아미노산 서열에 적어도 34% 일치하는 아미노산을 포함하고 아조박터 및 다른 세균 속 PRK09267로부터의 Nif 단백질상에서 발견되는 플라보독신 긴 도메인 도메인 TIGR01752 및 플라보독신 FLDA 도메인 중 하나 또는 둘 다를 포함하는 폴리펩티드를 의미한다. NifF 폴리펩티드는 비-질소 고정 세균에서 피루베이트 포르메이트-리아제 활성화 및 코발아민-의존성 메티오닌 신타제 활성과 관련된 플라보독신을 포함하지만 보다 넓은 기능에 관련된 다른 플라보독신은 제외한다. 천연 생성 NifF 폴리펩티드는 전형적으로 160 내지 200 아미노산의 길이를 가지며 천연 단량체는 약 19 kDa의 분자량을 갖는다. 다수의 NifF 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifF 폴리펩티드가 클렙시엘라 미키가넨시스(수납 번호 WP_004122417.1, 서열번호 16에 99% 일치함), 클렙시엘라 바리이콜라(WP_040968713.1, 85% 일치함), 코사코니아 라디신시탄스(WP_035885760.1, 76% 일치함), 딕케야 크리산테미(WP_039999438.1, 72% 일치함), 브렌네리아 구드위니이(WP_048638838.1, 62% 일치함), 메틸로모나스 메타니카(Methylomonas methanica)(WP_064006977.1, 56% 일치함), 아조토박터 비넬란디이(WP_012698862.1, 50% 일치함), 클로로바쿨룸 테피둠(Chlorobaculum tepidum)(WP_010933399.1, 39% 일치함), 캄필로박터 쇼와에(Campylobacter showae)(WP_002949173.1, 37% 일치함) 및 아조토박터 크로모코쿰(Azotobacter chromococcum)(WP_039801725.1, 34% 일치함)으로부터 보고되었다. 본 명세서에 사용되는 바와 같이, "기능성 NifF 폴리펩티드"는 NifH 폴리펩티드에 대한 전자 공여체일 수 있는 NifF 폴리펩티드이다. NifF 폴리펩티드는 문헌[Drummond(1985)]에 기재되고 리뷰되었다.

천연 생성 세균 중의 NifJ 폴리펩티드는 NifH에 대한 전자 공여체인 피루베이트:플라보독신(페레독신) 옥시도리덕타제이다. 본 명세서에 사용되는 바와 같이, "NifJ 폴리펩티드"는, 서열이 서열번호 18로서 제공된 아미노산 서열에 적어도 40% 일치하는 아미노산을 포함하고 보존된 도메인 TIGR02176을 포함하는 폴리펩티드를 의미한다. 천연 생성 NifJ 폴리펩티드는 전형적으로 1100 내지 1200 아미노산의 길이를 가지며 천연 단량체는 약 128 kDa의 분자량을 갖는다. 다수의 NifJ 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifJ 폴리펩티드가 클렙시엘라 미키가넨시스(수납 번호 WP_024360006.1, 서열번호 18에 99% 일치함), 라오울텔라 오르니티노리티카(WP_044347157.1, 95% 일치함), 클렙시엘라 쿠아시뉴모니아에(Klebsiella quasipneumoniae)(WP_050533844.1, 92% 일치함), 코사코니아 오리자에(Kosakonia oryzae)(WP_064566543.1, 82% 일치함), 딕케야 솔라니(Dickeya solani)(WP_057084649.1, 78% 일치함), 라넬라 아쿠아틸리스(Rahnella aquatilis)(WP_014683040.1, 72% 일치함), 써모아나에로박터 마트라니이(Thermoanaerobacter mathranii)(WP_013149847.1, 64% 일치함), 클로스티리디움 보툴리눔(Clostridium botulinum)(WP_053341220.1, 60% 일치함), 스피로카에타 아프리카나(Spirochaeta africana)(WP_014454638.1, 52% 일치함) 및 비브리오 콜레라에(Vibrio cholerae)(CSA83023.1, 40% 일치함)로부터 보고되었다. 본 명세서에 사용되는 바와 같이, "기능성 NifJ 폴리펩티드"는 NifH 폴리펩티드에 대한 전자 공여체일 수 있는 NifJ 폴리펩티드이다. NifJ 폴리펩티드는 문헌[Schmitz et al., (2001)]에 기재되고 리뷰되었다.

천연 생성 세균 중의 NifM 폴리펩티드는 NifH의 성숙화에 필요한 폴리펩티드이다. NifM의 부재하에서, NifH는 이종으로 발현될 때 이 콜라이 및 효모에서 단지 낮은 수준으로만 존재하였으며 NifD-NifK로 전자를 공여할 수 없었다. 본 명세서에 사용되는 바와 같이, "NifM 폴리펩티드"는, 서열이 서열번호 19로서 제공된 아미노산 서열에 적어도 26% 일치하는 아미노산을 포함하고 도메인 TIGR02933을 포함하는 폴리펩티드를 의미한다. NifM 폴리펩티드는 펩티딜-프롤릴 시스-트랜스 이소머라제에 상동성이며 NifH에 대한 보조 단백질인 것으로 보인다. 천연 생성 NifM 폴리펩티드는 전형적으로 240 내지 300 아미노산의 길이를 가지며 천연 단량체는 약 30 kDa의 분자량을 갖는다. 다수의 NifM 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifM 폴리펩티드가 클렙시엘라 옥시토카(Klebsiella oxytoca)(수납 번호 WP_064342940.1, 서열번호 19에 99% 일치함), 클렙시엘라 미키가넨시스(WP_004122413.1, 97% 일치함), 라오울텔라 오르니티노리티카(WP_044347181.1, 85% 일치함), 클렙시엘라 바리이콜라(Klebsiella variicola)(WP_063105800.1, 75% 일치함), 코사코니아 라디신시탄스(WP_035885759.1, 59% 일치함), 펙토박테리움 아트로셉티쿰(Pectobacterium atrosepticum)(WP_011094472.1, 42% 일치함), 브렌네리아 구드위니이(WP_048638837.1, 33% 일치함), 슈도모나스 아에루기노사(Pseudomonas aeruginosa) PAO1(CAA75544.1, 28% 일치함), 마리노박테리움 스페시즈(Marinobacterium sp.) AK27(WP_051692859.1, 27% 일치함) 및 테레디니박터 투르네라에(Teredinibacter turnerae)(WP_018415157.1, 26% 일치함)로부터 보고되었다. 본 명세서에 사용되는 바와 같이, "기능성 NifM 폴리펩티드"는 NifH 폴리펩티드의 성숙화를 위해 NifH 폴리펩티드와 복합체화할 수 있는 NifM 폴리펩티드이다. NifM 폴리펩티드는 문헌[Petrova et al., (2000)]에 기재되고 리뷰되었다.

천연 생성 세균 중의 NifN 폴리펩티드는 NifE 폴리펩티드와의 ENα₂β₂ 사량체의 β 서브유닛이고 상기 ENα₂β₂ 사량체는 FeMo-Co 합성에 필요하며 FeMo-Co가 합성되는 스캐폴드로서 기능하는 것으로 제안된다. 본 명세서에 사용되는 바와 같이, "NifN 폴리펩티드"는 (i) 서열이 서열번호 11로서 제공된 서열에 적어도 76% 일치하는 아미노산을 포함하는 폴리펩티드, 및/또는 (ii) 서열이 서열번호 11로서 제공된 서열에 적어도 34% 일치하는 아미노산을 포함하고 보존된 도메인 TIGR01285, cd01966 및 PRK14476 중 하나 이상을 포함하는 폴리펩티드를 의미한다. NifN은 몰리브데늄-철 단백질 β 쇄 NifK에 구조적으로 관련된다. 보존된 TIGR01285를 포함하는 폴리펩티드는 NifN 폴리펩티드의 대부분의 예를 포함하지만 일부 NifN 폴리펩티드, 예를 들어 클로로비움 테피둠(Chlorobium tepidum)의 추정적인 NifN은 제외하며, 따라서 NifN의 정의는 상기 보존된 TIGR01285 도메인을 포함하는 폴리펩티드로 제한되지 않는다. PRK14476 도메인 단백질과의 구성원은 또한 상과 cl02775의 구성원이다. 천연 생성 NifN 폴리펩티드는 전형적으로 410 내지 470 아미노산의 길이를 갖지만, NifB에 자연적으로 융합될 때는 약 900 아미노산 잔기를 가질 수 있으며 천연 단량체는 약 50 kDa의 분자량을 갖는다. 다수의 NifN 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifN 폴리펩티드가 클렙시엘라 옥시토카(수납 번호 WP_064391778.1, 서열번호 11에 97% 일치함), 클루이베라 인테르메디아(WP_047370268.1, 80% 일치함), 라넬라 아쿠아틸리스(Rahnella aquatilis)(WP_014683026.1, 70% 일치함), 브렌네리아 구드위니이(WP_048638830.1, 65% 일치함), 메틸로박터 툰드리팔루둠(Methylobacter tundripaludum)(WP_027147663.1, 46% 일치함), 칼로트릭스 파리에티나(Calothrix parietina)(WP_015195966.1, 41% 일치함), 자이모모나스 모빌리스(Zymomonas mobilis)(WP_023593609.1, 37% 일치함), 파에니바실러스 마씰리엔시스(Paenibacillus massiliensis)(WP_025677480.1, 35% 일치함) 및 데설피토박테리움 하프니엔세(Desulfitobacterium hafniense)(WP_018306265.1, 34% 일치함)로부터 보고되었다. 본 명세서에 사용되는 바와 같이, "기능성 NifN 폴리펩티드"는 복합체가 FeMo-Co를 합성할 수 있도록 NifE와 함께 기능성 사량체를 형성할 수 있는 NifN 폴리펩티드이다. NifN 폴리펩티드는 하기의 문헌들에 기재되고 리뷰되었다: Fay et al., (2016), Brigle et al., (1987), Fani et al., (2000), 및 Hu et al., (2005).

천연 생성 세균 중의 NifQ 폴리펩티드는, 추정상 초기 MoO₄ ^2- 가공에서 FeMo-Co 합성에 관련된 폴리펩티드이다. 보존된 C-말단 시스테인 잔기는 금속 결합에 관련될 수 있다. 본 명세서에 사용되는 바와 같이, "NifQ 폴리펩티드"는, 서열이 서열번호 12로서 제공된 아미노산 서열에 적어도 34% 일치하는 아미노산을 포함하고 CL04826 도메인 단백질과의 구성원 및 pfam04891 도메인 단백질과의 구성원인 폴리펩티드를 의미한다. 천연 생성 NifQ 폴리펩티드는 전형적으로 160 내지 250 아미노산의 길이를 갖지만 350 아미노산 잔기만큼 길 수도 있으며 천연 단량체는 약 20 kDa의 분자량을 갖는다. 다수의 NifQ 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifQ 폴리펩티드가 클렙시엘라 옥시토카(수납 번호 WP_064391765.1, 서열번호 12에 95% 일치함), 클렙시엘라 바리이콜라(CTQ06350.1, 75% 일치함), 클루이베라 인테르메디아(WP_047370257.1, 63% 일치함), 펙토박테리움 아트로셉티쿰(WP_043878077.1, 59% 일치함), 메소리조븀 메탈리듀란스(Mesorhizobium metallidurans)(WP_008878174.1, 46% 일치함), 로도슈도모나스 팔루스트리스(Rhodopseudomonas palustris)(WP_011501504.1, 42% 일치함), 파라부르크홀데리아 스프렌티아에(Paraburkholderia sprentiae)(WP_027196569.1, 41% 일치함), 부르크홀데리아 스타빌리스(Burkholderia stabilis)(GAU06296.1, 39% 일치함) 및 쿠프리아비두스 옥살라티쿠스(Cupriavidus oxalaticus)(WP_063239464.1, 34% 일치함)로부터 보고되었다. 본 명세서에 사용되는 바와 같이, "기능성 NifQ 폴리펩티드"는 MoO₄ ^2-를 가공할 수 있는 NifQ 폴리펩티드이다. NifQ 폴리펩티드는 하기의 문헌들에 기재되고 리뷰되었다: Allen et al., (1995) 및 Siddavattam et al., (1993).

천연 생성 세균 중의 NifS 폴리펩티드는, 예를 들어 Fe-S 클러스터 합성 및 수복을 위한 황의 동원에 관련되는 철-황(FeS) 클러스터 생합성에 관련된 시스테인 데설푸라제이다. 본 명세서에 사용되는 바와 같이, "NifS 폴리펩티드"는 (i) 서열이 서열번호 13으로서 제공된 아미노산 서열에 적어도 90% 일치하는 아미노산을 포함하는 폴리펩티드, 및/또는 (ii) 서열이 서열번호 13으로서 제공된 서열에 적어도 36% 일치하는 아미노산을 포함하고 보존된 도메인 TIGR03402 및 COG1104 중 하나 또는 둘 다를 포함하는 폴리펩티드를 의미한다. TIGR03402 도메인 단백질과는 연장된 질소 고정 시스템에서 거의 항상 발견되는 계통군 + IscS 및 또한 NifS-유사/NifU-유사 시스템의 부분보다는 첫 번째에 더 밀접하게 관련된 제2 계통군을 포함한다. TIGR03402 도메인 단백질과는 입실론 프로테오박테리아, 예를 들어 헬리코박터 파이로리(Helicobacter pylori)에서 발견되는 보다 먼 계통군(또한 문헌에서 NifS라 명명함)(대신에 TIGR03403에서 형성됨)까지 연장되지 않는다. COG1104 도메인 단백질과는 시스테인 설피네이트 데설피나제/시스테인 데설푸라제 또는 관련된 효소를 포함한다. 일부 NifS 폴리펩티드는 아스파레이트 아미노트랜스퍼라제 도메인 cl18945를 포함한다. 천연 생성 NifS 폴리펩티드는 전형적으로 370 내지 440 아미노산의 길이를 가지며 천연 단량체는 약 43 kDa의 분자량을 갖는다. 다수의 NifS 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifS 폴리펩티드가 클렙시엘라 미키가넨시스(수납 번호 WP_004138780.1, 서열번호 13에 99% 일치함), 라오울텔라 테리게나(Raoultella terrigena)(WP_045858151.1, 89% 일치함), 클루이베라 인테르메디아(WP_047370265.1, 80% 일치함), 라넬라 아쿠아틸리스(Rahnella aquatilis)(WP_014333911.1, 73% 일치함), 아가리보란스 길부스(Agarivorans gilvus)(WP_055731597.1, 64% 일치함), 아조스피릴룸 브라실렌세(Azospirillum brasilense)(WP_014239770.1, 60% 일치함), 데설포사르시나 세토니카(Desulfosarcina cetonica)(WP_054691765.1, 55% 일치함), 클로스트리디움 인테스티날레(Clostridium intestinale)(WP_021802294.1, 47% 일치함), 클로스트리디이살리박터 파우시보란스(Clostridiisalibacter paucivorans)(WP_026894054.1, 36% 일치함) 및 바실러스 코아굴란스(Bacillus coagulans)(WP_061575621.1, 42% 일치하며 COG1104 중에 있다)로부터 보고되었다. 본 명세서에 사용되는 바와 같이, "기능성 NifS 폴리펩티드"는 철-황(FeS) 클러스터 생합성 및/또는 수복에 기능할 수 있는 NifS 폴리펩티드이다. NifS 폴리펩티드는 하기의 문헌들에 기재되고 리뷰되었다: Clausen et al., (2000), Johnson et al., (2005), Olson et al., (2000) 및 Yuvaniyama et al., (2000).

천연 생성 세균 중의 NifU 폴리펩티드는 니트로게나제 성분을 위한 철-황(FeS) 클러스터 생합성에 관련된 분자 스캐폴드 폴리펩티드이다. 본 명세서에 사용되는 바와 같이, "NifU 폴리펩티드"는, 서열이 서열번호 14로서 제공된 서열에 적어도 31% 일치하는 아미노산을 포함하고 도메인 TIGR02000을 포함하는 폴리펩티드를 의미한다. TIGR02000 도메인 단백질과의 구성원이 니트로게나제 성숙화에 특이적으로 관련된다. NifU는 N-말단 도메인(pfam01592) 및 C-말단 도메인(pfam01106)을 포함한다. 3개의 상이하지만 부분적으로 상동성인 Fe-S 클러스터 조립 시스템이 기재되었다: Isc, Suf, 및 Nif. Nif 시스템(NifU는 그의 부분이다)은 다수의 질소-고정 종에서 Fe-S 클러스터의 니트로게나제에의 공여와 관련된다. 헬리코박터 및 캄필로박터로부터의 균등한 도메인 구조를 갖는 Isc 및 Suf 상동체는 본 명세서의 NifU의 정의로부터 제외된다. 따라서, NifU는 니트로게나제 성숙화에 관련된 NifU 폴리펩티드에 특이적이다. NifU의 N-말단 영역의 상동체를 포함하는 IscU 단백질(예를 들어 에스케리키아 콜라이 및 사카로마이세스 세레비지아에 및 호모 사피엔스로부터의)인 관련된 TIGR01999 도메인 단백질과의 구성원이 또한 본 명세서의 NifU의 정의로부터 제외된다. 천연 생성 NifU 폴리펩티드는 전형적으로 260 내지 310 아미노산의 길이를 가지며 천연 단량체는 약 29 kDa의 분자량을 갖는다. 다수의 NifU 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifU 폴리펩티드가 클렙시엘라 미키가넨시스(수납 번호 WP_049136164.1, 서열번호 14에 97% 일치함), 클렙시엘라 바리아콜라(WP_050887862.1, 90% 일치함), 딕케야 솔라니(Dickeya solani)(WP_057084657.1, 80% 일치함), 브렌네리아 구드위니이(WP_048638833.1, 73% 일치함), 톨루모나스 아우엔시스(WP_012728889.1, 66% 일치함), 아가리보란스 길부스(Agarivorans gilvus)(WP_055731596.1, 58% 일치함), 데설포쿠르부스 벡시넨시스(Desulfocurvus vexinensis)(WP_028587630.1, 54% 일치함), 로도슈도모나스 팔루스트리스(Rhodopseudomonas palustris)(WP_044417303.1, 49% 일치함), 헬리코박터 파이로리(Helicobacter pylori)(WP_001051984.1, 31% 일치함) 및 설푸로븀 스페시즈(Sulfurovum sp.) PC08-66(KIM05011.1, 31% 일치함)로부터 보고되었다. 본 명세서에 사용되는 바와 같이, "기능성 NifU 폴리펩티드"는 철-황(FeS) 클러스터 생합성에 관련된 분자 스캐폴드 폴리펩티드로서 기능할 수 있는 NifU 폴리펩티드이다. NifU 폴리펩티드는 하기의 문헌들에 기재되고 리뷰되었다: Hwang et al., (1996), M

hlenhoff et al., (2003) 및 Ouzounis et al., (1994).

천연 생성 세균 중의 NifV 폴리펩티드는 아세틸-조효소 A(아세틸-CoA)로부터 2-옥소글루타레이트로의 아세틸기의 전달에 의해 호모시트레이트를 생성시키는 호모시트레이트 신타제(EC 2.3.3.14)이다. 이어서 호모시트레이트는 FeMo-Co의 합성에 사용된다. 본 명세서에 사용되는 바와 같이, "NifV 폴리펩티드"는, 서열이 서열번호 20으로서 제공된 아미노산 서열에 적어도 39% 일치하는 아미노산을 포함하고 도메인 TIGR02660 및 DRE_TIM 중 하나 또는 둘 다를 포함하는 폴리펩티드를 의미한다. TIGR02660 도메인 단백질과의 구성원은 2-이소프로필말레이트 신타제, (R)-시트라말레이트 신타제, 및 질소 고정 외의 과정과 관련된 호모시트레이트 신타제를 포함하는 효소에 상동성이다. cd07939 도메인 단백질과는 또한 헬리코박테리움 클로룸(Heliobacterium chlorum) 및 클루코나세토박터 디아조트로피쿠스(Gluconacetobacter diazotrophicus)의 NifV 단백질(FrbC에 이종상동성인 듯하다)을 포함한다. 상기 과는 DRE-TIM 메탈로리아제 상과에 속한다. DRE-TIM 메탈로리아제는 2-이소프로필말레이트 신타제(IPMS), 알파-이소프로필말레이트 신타제(LeuA), 3-하이드록시-3-메틸글루타릴-CoA 리아제, 호모시트레이트 신타제, 시트라말레이트 신타제, 4-하이드록시-2-옥소발레레이트 알돌라제, 리-시트레이트 신타제, 트랜스카복실라제 5S, 피루베이트 카복실라제, AksA, 및 FrbC를 포함한다. 이들 구성원은 모두 8개의 알파 나선에 의해 둘러싸인 배럴을 형성하는 8개의 평행한 베타 가닥을 갖는 코어 베타(8)-알파(8) 모티프로 이루어지는 보존된 트리오스-포스페이트 이소머라제(TIM) 배럴 도메인을 공유한다. 상기 도메인은 배럴의 코어를 덮는 불변 잔기의 클러스터에 의해 형성된 2가 양이온-결합 부위를 함유하는 촉매 중심을 갖는다. 또한, 촉매 부위는 3개의 불변 잔기, 아스파테이트(D), 아르기닌(R), 및 글루타메이트(E)(도메인 명칭 "DRE-TIM"에 대한 근거이다)를 포함한다. 천연 생성 NifV 폴리펩티드는 전형적으로 360 내지 390 아미노산의 길이를 갖지만, 일부의 구성원은 약 490 아미노산 잔기의 길이이며, 천연 단량체는 약 41 kDa의 분자량을 갖는다. 다수의 NifV 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifV 폴리펩티드가 클렙시엘라 미키가넨시스(수납 번호 WP_049083341.1, 서열번호 20에 95% 일치함), 라오울텔라 오르니티노리티카(WP_045858154.1, 86% 일치함), 클루이베라 인테르메디아(WP_047370264.1, 81% 일치함), 딕케야 다단티이(Dickeya dadantii)(WP_038912041.1, 70% 일치함), 브렌네리아 구드위니이(WP_048638835.1, 59% 일치함), 마그네토코커스 마리누스(Magnetococcus marinus)(WP_011712856.1, 46% 일치함), 스핑고모나스 위티키이(Sphingomonas wittichii)(WP_037528703.1, 43% 일치함), 프랑키아 스페시즈(Frankia sp.) EI5c(OAA29062.1, 41% 일치함) 및 클로스트리디움 스페시즈(Clostridium sp.) 매딩레이(Maddingley) MBC34-26(EKQ56006.1, 39% 일치함)로부터 보고되었다. 본 명세서에 사용되는 바와 같이, "기능성 NifV 폴리펩티드"는 호모시트레이트 신타제로서 기능할 수 있는 NifV 폴리펩티드이다. NifV 폴리펩티드는 하기의 문헌들에 기재되고 리뷰되었다: Hu et al., (2008), Lee et al., (2000), Masukawa et al., (2007) 및 Zheng et al., (1997).

천연 생성 세균 중의 NifX 폴리펩티드는 적어도 FeMo-Co 전구체를 NifB에서 NifE-NifN으로 전달하는 것을 지원하는, FeMo-Co 합성에 관련된 폴리펩티드이다. 본 명세서에 사용되는 바와 같이, "NifX 폴리펩티드"는, 서열이 서열번호 15로서 제공된 아미노산 서열에 적어도 29% 일치하는 아미노산을 포함하고 보존된 도메인 TIGR02663 및 cd00853 중 하나 또는 둘 다를 포함하는 폴리펩티드를 의미한다. NifX는, NifX, NafY 및 NifB의 C-말단 영역이 모두 pfam02579 도메인을 포함하고 각각이 FeMo-Co의 합성에 관련된다는 점에서, NifB 및 NifY를 포함하는 보다 큰 철-몰리브데늄 클러스터-결합 단백질과에 포함된다. 따라서, 일부의 NifX 폴리펩티드는 NifY로서 또는 이와 역으로 데이터베이스에 주석이 달렸다. 천연 생성 NifX 폴리펩티드는 전형적으로 110 내지 160 아미노산의 길이를 가지며 천연 단량체는 약 15 kDa의 분자량을 갖는다. 다수의 NifX 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifX 폴리펩티드가 클렙시엘라 미키가넨시스(수납 번호 WP_049070199.1, 서열번호 15에 97% 동일함), 클렙시엘라 옥시토카(WP_064342937.1, 97% 일치함), 라오울텔라 오르니티노리티카(WP_044347173.1, 91% 일치함), 클렙시엘라 바리이콜라(WP_044612922.1, 83% 일치함), 코사코니아 라디신시탄스(Kosakonia radicincitans)(WP_043953583.1, 75% 일치함), 딕케야 크리산테미(WP_039999416.1, 68% 일치함), 라넬라 아쿠아틸리스(Rahnella aquatilis)(WP_047608097.1, 58% 일치함), 아조토박터 크로오코슘(Azotobacter chroococcum)(WP_039800848.1, 34% 일치함), 베기아토아 렙토미티포르미스(Beggiatoa leptomitiformis)(WP_062149047.1, 33% 일치함) 및 메틸로베르사틸리스 디스시풀로룸(Methyloversatilis discipulorum)(WP_020165972.1, 29% 일치함)으로부터 보고되었다. 본 명세서에 사용되는 바와 같이, "기능성 NifX 폴리펩티드"는 FeMo-Co 전구체를 NifB에서 NifE-NifN으로 전달할 수 있는 NifX 폴리펩티드이다. NifX 폴리펩티드가 하기의 문헌들에 기재되고 리뷰되었다: Allen et al., (1994) 및 Shah et al., (1999).

천연 생성 세균 중의 NifY 폴리펩티드는 적어도 FeMo-Co 전구체를 NifB에서 NifE-NifN으로 전달하는 것을 지원하는, FeMo-Co 합성에 관련된 폴리펩티드이다. 본 명세서에 사용되는 바와 같이, "NifY 폴리펩티드"는, 서열이 서열번호 8로서 제공된 아미노산 서열에 적어도 34% 일치하는 아미노산을 포함하고 보존된 도메인 TIGR02663 및 cd00853 중 하나 또는 둘 다를 포함하는 폴리펩티드를 의미한다. NifY는, NifX, NafY 및 NifB의 C-말단 영역이 모두 pfam02579 도메인을 포함하고 각각이 FeMo-Co의 합성에 관련된다는 점에서, NifB 및 NifX를 포함하는 보다 큰 철-몰리브데늄 클러스터-결합 단백질과에 포함된다. 다수의 NifY 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifY 폴리펩티드가 클렙시엘라 미키가넨시스(수납 번호 WP_049089500.1, 서열번호 8에 99% 일치함), 클렙시엘라 옥시토카(WP_064342935.1, 98% 일치함), 클렙시엘라 쿠아시뉴모니아에(WP_044524054.1, 90% 일치함), 클렙시엘라 바리이콜라(WP_049010739.1, 81% 일치함), 클루이베라 인테르메디아(WP_047370270.1, 69% 일치함), 딕케야 크리산테미(WP_039999411.1, 62% 일치함), 세라티아 스페시즈(Serratia sp.) ATCC 39006(WP_037382461.1, 57% 일치함), 라넬라 아쿠아틸리스(WP_014683024.1, 47% 일치함), 슈도모나스 푸티다(Pseudomonas putida)(AEX25784.1, 37% 일치함) 및 아조토박터 비넬란디이(WP_012698835.1, 34% 일치함)로부터 보고되었다. 본 명세서에 사용되는 바와 같이, "기능성 NifY 폴리펩티드"는 FeMo-Co 전구체를 NifB에서 NifE-NifN으로 전달할 수 있는 NifY 폴리펩티드이다.

천연 생성 세균 중의 NifZ 폴리펩티드는 두 번째 Fe₄S₄ 쌍의 커플링에 특히 필요한, Fe-S 클러스터 합성에 관련된 폴리펩티드이다. 본 명세서에 사용되는 바와 같이, "NifZ 폴리펩티드"는, 서열이 서열번호 17로서 제공된 서열에 적어도 28% 일치하는 아미노산을 포함하고 보존된 도메인 pfam04319를 포함하는 폴리펩티드를 의미한다. 약 75 아미노산 잔기의 상기 도메인은 일부 구성원 및 보다 긴 NifZ 단백질의 아미노 말단 절반에서 고립되어 발견된다. 천연 생성 NifZ 폴리펩티드는 전형적으로 70 내지 150 아미노산의 길이를 가지며 천연 단량체는 약 9 내지 약 16 kDa의 분자량을 갖는다. 다수의 NifZ 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifZ 폴리펩티드가 클렙시엘라 미키가넨시스(수납 번호 WP_057173223.1, 서열번호 17에 93% 일치성), 클렙시엘라 옥시토카(WP_064342939.1, 95% 일치함), 클렙시엘라 바리이콜라(WP_043875005.1, 77% 일치함), 코사코니아 라디신시탄스(WP_043953588.1, 67% 일치함), 코사코니아 사카리(Kosakonia sacchari)(WP_065368553.1, 58% 일치함), 페리파셀루스 암니콜라(Ferriphaselus amnicola)(WP_062627625.1, 47% 일치함), 파라부르크홀데리아 제노보란스(Paraburkholderia xenovorans)(WP_011491838.1, 41% 일치함), 아시디티오바실러스 페리보란스(Acidithiobacillus ferrivorans)(WP_014029050.1, 35% 일치함) 및 브라디리조븀 올리고트로피쿰(Bradyrhizobium oligotrophicum)(WP_015665422.1, 28% 일치함)으로부터 보고되었다. 본 명세서에 사용되는 바와 같이, "기능성 NifZ 폴리펩티드"는 Fe-S 클러스터 합성에서 Fe₄S₄ 클러스터를 커플링할 수 있는 NifZ 폴리펩티드이다. NifZ 폴리펩티드는 하기의 문헌들에 기재되고 리뷰되었다: Cotton (2009) 및 Hu et al., (2004).

천연 생성 세균 중의 NifW 폴리펩티드는 NifZ 폴리펩티드와 회합하여 보다 고차의 복합체를 형성하고(Lee et al., 1998) MoFe 단백질(NifD-NifK) 합성 또는 활성에 관련된 폴리펩티드이다. NifW 및 NifZ는 MoFe 단백질의 형성 또는 축적에 관련되는 듯하다(Paul and Merrick, 1989). 본 명세서에 사용되는 바와 같이, "NifW 폴리펩티드"는, 서열이 서열번호 74로서 제공된 아미노산 서열에 적어도 28% 일치하는 아미노산을 포함하고 보존된 NifW 상과 단백질 도메인, 아키텍쳐 ID 번호 10505077을 포함하고 P과 PF03206인 폴리펩티드를 의미한다. 다수의 NifW 폴리펩티드가 동정되었으며 다수의 서열을 공개적으로 입수 가능한 데이터베이스에서 입수할 수 있다. 예를 들어, NifW 폴리펩티드가 클렙시엘라 옥시토카(수납 번호 WP_064342938.1, 서열번호 74에 98% 일치함), 클렙시엘라 미키가넨시스(WP_049080155.1, 94% 일치함), 엔테로박터 스페시즈(Enterobacter sp.) 10-1(WP_095103586.1, 90% 일치함), 클렙시엘라 쿠아시뉴모니아에(WP_065877373.1, 81% 일치함), 펙토박테리움 폴라리스(Pectobacterium polaris)(WP_095699971.1, 69% 일치함), 딕케야 파라디시아카(Dickeya paradisiaca)(WP_012764136.1, 58% 일치함), 브렌네리아 구드위니이(WP_053085547.1, 36% 일치함), 아쿠아스피릴룸 스페시즈(Aquaspirillum sp.) LM1(WP_077299824.1, 44% 일치함), 칸디다투스 뮤프로테오박테리아 박테리움(Candidatus Muproteobacteria bacterium) RBG_16_64_10(OGI40729, 34% 일치함), 아조토박터 비넬란디이(ACO76430.1, 32% 일치함) 및 메틸로칼둠 마리눔(Methylocaldum marinum)(BBA37427.1, 28% 일치함)으로부터 보고되었다. 본 명세서에 사용되는 바와 같이, "기능성 NifW 폴리펩티드"는 MoFe 단백질의 형성, 축적 또는 활성 중 하나 이상을 촉진하거나 증대시키는 NifW 폴리펩티드이다. 기능성 NifW는 NifZ와 상호작용하고/하거나 MoFe-단백질의 산소 보호에 한 역할을 할 수 있다(Gavini et al.,(1998)).

한정된 폴리펩티드에 관하여, 상기에 제공된 경우보다 더 큰 일치성 숫자%는 바람직한 실시태양을 포함함을 알 것이다. 따라서, 적용 가능한 경우, 최소의 일치성 숫자%에 비추어, 폴리펩티드는 관련된 지명된 서열번호에 적어도 30%, 보다 바람직하게는 적어도 35%, 보다 바람직하게는 적어도 40%, 보다 바람직하게는 적어도 45%, 보다 바람직하게는 적어도 50%, 보다 바람직하게는 적어도 55%, 보다 바람직하게는 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 91%, 보다 바람직하게는 적어도 92%, 보다 바람직하게는 적어도 93%, 보다 바람직하게는 적어도 94%, 보다 바람직하게는 적어도 95%, 보다 바람직하게는 적어도 96%, 보다 바람직하게는 적어도 97%, 보다 바람직하게는 적어도 98%, 보다 바람직하게는 적어도 99%, 보다 바람직하게는 적어도 99.1%, 보다 바람직하게는 적어도 99.2%, 보다 바람직하게는 적어도 99.3%, 보다 바람직하게는 적어도 99.4%, 보다 바람직하게는 적어도 99.5%, 보다 바람직하게는 적어도 99.6%, 보다 바람직하게는 적어도 99.7%, 보다 바람직하게는 적어도 99.8%, 및 훨씬 더 바람직하게는 적어도 99.9% 일치하는 아미노산 서열을 포함하는 것이 바람직하다.

본 명세서에 정의된 폴리펩티드의 아미노산 서열 돌연변이체는 적합한 뉴클레오티드 변화를 본 명세서에서 정의된 핵산 내로 도입시키거나, 또는 목적하는 폴리펩티드의 시험관내 합성에 의해 제조할 수 있다. 상기와 같은 돌연변이체는 예를 들어 하나 이상의 아미노산 결실, 삽입 또는 치환을 포함한다. 결실, 삽입 및 치환 돌연변이의 조합을 수행하여 최종 구조물에 도달할 수 있지만, 단 상기 최종 폴리펩티드 생성물은 목적하는 특징을 가져야 한다. 바람직한 아미노산 서열 돌연변이체는 참조 야생형 폴리펩티드에 비해 단지 1, 2, 3, 4, 또는 10 미만의 아미노산 변화를 갖는다.

돌연변이된(변경된) 폴리펩티드를 당해 분야에 공지된 임의의 기법을 사용하여, 예를 들어 유도 진화 또는 합리적인 설계 전략(하기 참조)을 사용하여 제조할 수 있다. 돌연변이된/변경된 DNA로부터 유래된 생성물을 본 명세서에 기재된 기법을 사용하여, 식물에서의 그의 발현이 상응하는 야생형 식물에 비해 그의 표현형을 변경시키는지의 여부, 예를 들어 그의 발현이 상응하는 야생형 식물에 비해 증가된 수율, 바이오매스, 생장률, 활력, 생물학적 질소 고정으로부터 유래된 질소 이득, 질소 사용 효율, 비생물 스트레스 내성, 및/또는 영양소 결핍 내성을 생성시키는지의 여부를 판단하도록 쉽게 선별할 수 있다.

아미노산 서열 돌연변이체의 설계에서, 돌연변이 부위의 위치 및 돌연변이의 성질은 변형되는 특징(들)에 따라 변할 것이다. 돌연변이 부위를 예를 들어, (1) 첫 번째를 보존적 아미노산 선택으로 치환시키고 이어서 성취된 결과에 따라 보다 많은 라디칼 선택으로 치환시키거나, (2) 표적 잔기를 결실시키거나, 또는 (3) 상기 위치한 부위에 인접한 다른 잔기들을 삽입함으로써 개별적으로 또는 연속적으로 변형시킬 수 있다.

아미노산 서열 결실은 일반적으로 약 1 내지 15 잔기, 보다 바람직하게는 약 1 내지 10 잔기 및 전형적으로 약 1 내지 5 연속 잔기의 범위이다.

치환 돌연변이체는 제거된 폴리펩티드 분자 중에 적어도 하나의 아미노산 잔기 및 대신에 삽입된 상이한 잔기를 갖는다. 일정한 활성을 유지하는 것이 바람직한 경우, 관련된 단백질과 중에 고도로 보존된 아미노산 위치에 오직 보존된 치환만을 수행하거나 치환을 수행하지 않는 것이 바람직할 수 있다. 보존적 치환의 예는 표 1에 "예시적인 치환"의 제목하에 있다.

바람직한 실시태양에서 돌연변이/변이체 폴리펩티드는 천연 생성 폴리펩티드에 비해 1 또는 2 또는 3 또는 4의 보존적 아미노산 변화를 갖는다. 보존적 아미노산 변화의 상세한 내용을 표 1에 제공한다. 바람직한 실시태양에서, 본 발명의 상이한 폴리펩티드들간에 고도로 보존된 모티프 또는 도메인 중 하나 이상에서 변화가 없다. 숙련가가 알고 있는 바와 같이, 상기와 같은 작은 변화는 재조합 세포에서 발현시 폴리펩티드의 활성을 변경시키지 않음을 합리적으로 예측할 수 있다.

본 발명의 폴리펩티드의 1차 아미노산 서열을 사용하여 밀접하게 관련된 폴리펩티드와의 비교를 근거로 그의 변이체/돌연변이체를 설계할 수 있다. 숙련가가 이해하는 바와 같이, 밀접하게 관련된 단백질들간에 고도로 보존된 잔기는, 특히 비-보존성 치환에 대해 덜 변경될 수 있는 듯하며, 활성이 덜 보존된 잔기보다 유지될 수 있는 듯하다(상기 참조). 보존된 아미노산 잔기를 식별하기 위한 보다 엄격한 시험은 동일한 기능의 보다 멀리 관련된 폴리펩티드를 정렬시키는 것이다. 고도로 보존된 잔기는 기능을 유지하기 위해 유지되어야 하는 반면, 비-보존된 잔기는 기능을 유지하는 동안 더 치환되거나 또는 더 결실될 수 있다.

세포에서 합성 중에 또는 합성 후에, 예를 들어 글리코실화, 아세틸화, 인산화 또는 단백질분해적 절단에 의해 차별적으로 변형된 본 발명의 폴리펩티드가 또한 본 발명의 범위내에 포함된다.

합리적인 설계

단백질을 단백질 구조 및 폴딩에 관한 공지된 정보를 근거로 합리적으로 설계할 수 있다. 이를 스크래치(드노보 설계)에 의해 또는 고유의 스캐폴드에 근거한 재설계(예를 들어 문헌[Hellinga, 1997]; 및 [Lu and Berry, Protein Structure Design and Engineering, Handbook of Proteins 2, 1153-1157 (2007)]을 참조하시오)에 의해 수행할 수 있다. 예를 들어 본 명세서의 실시예 10을 참조하시오. 단백질 설계는 전형적으로, 주어진 또는 표적 구조로 폴딩되고 컴퓨터 모델을 사용하여 수행될 수 있는 서열 식별을 수반한다. 컴퓨터 단백질 설계 알고리즘은 표적 구조로 폴딩시 에너지가 낮은 서열에 대한 서열-형태해석 공간을 탐색한다. 컴퓨터 단백질 설계 알고리즘은 단백질 에너지학 모델을 사용하여 어떻게 돌연변이가 단백질의 구조 및 기능에 영향을 미치는가를 평가한다. 이들 에너지 함수는 전형적으로 분자 역학, 통계학(즉 지식-기반), 및 다른 경험 항의 조합을 포함한다. 적합한 입수 가능한 소프트웨어는 IPRO(Interative Protein Redesign and Optimization), EGAD(A Genetic Algorithm for Protein Design), 로제타 디자인(Rosetta Design), 샤펜(Sharpen), 및 아발론(Abalone)을 포함한다.

식물에서 미토콘드리아 단백질 내수송

거의 모든 미토콘드리아 단백질은 시토솔에서 핵 암호화되고 번역되며, 따라서 미토콘드리아내로의 그의 전좌를 요한다. 폴리펩티드내 신호 서열은 그의 내수송을 4개의 상이한 미토콘드리아내 장소: 외막(OM), 막간 공간(IS), 내막(IM), 또는 기질(MM)로 향하게 한다. 이들 신호 서열은 그들의 생화학적 성질 및 적어도 4개의 별개의 내수송 경로(폴리펩티드를 4개의 장소 중 하나 이상으로 향하게 한다)를 통한 안내 트래픽킹(trafficking)에 의해 구별된다(Chacinska et al., 2009). 이들 4개의 경로는 (1) 폴리펩티드를 MM, IS 또는 IM으로 향하게 하는 일반적인 내수송 경로(또한 "고전적인" 예비-서열 경로로서 지칭된다); (2) IM으로의 수송에 사용되는 담체 내수송 경로, (3) 미토콘드리아 막간 공간(MIA) 조립 경로, 및 (4) 폴리펩티드의 OM으로의 수송에 사용되는 분류 및 조립 기구(SAM) 경로이다. 일반적인 내수송 경로는 절단성 예비-서열(또한 신호 서열로서 공지됨)을 갖는 폴리펩티드를 내수송한다. 이들 폴리펩티드는 또한 소수성 분류 신호(HSS)를 가질 수 있다. 담체 내수송 경로는 신호와 같은 내부 예비-서열 및 소수성 영역을 갖는 폴리펩티드를 내수송한다. MIA 경로는 트윈 시스테인 잔기를 갖는 폴리펩티드를 내수송한다. SAM 경로는 β 신호 및 추정적인 TOM20 신호를 함유하는 폴리펩티드를 내수송한다. 이들 경로는 모두 외막의 트랜스로카제(TOM)을 사용하며 첫 번째 및 두 번째 경로는 또한 막간 복합체의 TIM23 트랜스로카제를 사용한다. 오직 첫 번째 경로만이 기질 가공 펩티다제(기질 가공 프로테아제, MPP)를 사용한다.

모든 미토콘드리아 표적화된 폴리펩티드의 공통적인 특징은 정확한 장소로의 수송을 안내하는 폴리펩티드내 적어도 하나의 도메인의 존재이다. 상기에 대해 가장 잘 연구된 것은 MPP에 의해 기질 중에서 절단되는 "고전적인" N-말단 예비-서열 도메인이다(Murcha et al., 2004). 식물 및 동물 미토콘드리아 단백질의 약 70%가 절단성 예비-서열을 갖는 것으로 추정되었지만 내부 및 C-말단 신호 서열이 또한 모두 발견되었다(문헌[Pfanner and Geissler (2001)], 문헌[Schleiff and Soll (2000)]에서 리뷰되었다). 아라비도프시스에서, 이들 예비-서열의 범위는 평균 길이 50 아미노산 잔기의 11 내지 109 아미노산 잔기 길이이다. 첫 번째 경로에 대한 예비-서열을 충분히 한정하는 공통 서열은 존재하지 않지만, 상기는 높은 비율의 소수성이고 양으로 하전된 아미노산을 함유하는 경향이 있다. 추가의 특징은, 대개 처음 10 아미노산 잔기내에서 출발하는 양친성 α-나선을 형성시키는 그의 능력이다(Roise et al., 1986). 이들 도메인은 소수성(Ala, Leu, Phe, Val), 하이드록실화된(Ser, Thr) 및 양으로 하전된(Arg, Lys) 아미노산 잔기가 풍부하고 산성 아미노산은 부족하다. 다수의 미토콘드리아 단백질에 걸쳐, 세린(16-17%) 및 알라닌(12-13%)이 미토콘드리아 신호 펩티드에서 크게 과도하게 많으며, 아르기닌이 풍부하다(12%). MPP 절단점은 대부분의 예비-서열에 대해서, 대개는 P2 위치(잘라지기 쉬운 결합으로부터 -2 aa), 또는 대부분의 다른 경우에 P3에서, 보존된 아르기닌 잔기의 존재에 의해 한정된다(Huang et al., 2009).

미토콘드리아 예비-서열은 소수성 잔기를 통해 Tom20 수용체와 상호작용한다. 연구는 α-나선의 소수성 표면이 TOM 내수송 복합체의 TOM20 성분에 의한 펩티드의 인식을 촉진하는 반면, 양전하는 TOM22 서브유닛에 의해 인식됨을 입증하였다(Abe et al., 2000). 최종적으로, 대부분의 예비-서열은 Hsp70과 함께 폴리펩티드의 수송을 안내하며, 상응하게 거의 모든 식물 예비-서열은 Hsp70 분자 샤페론에 대한 적어도 하나의 결합 모티프를 함유한다(Zhang and Glaser, 2002). 샤페론 Hsp70은 단백질 폴딩에 관련되며, 단백질 응집을 방지하고, 분자 모터로서 기능하여, 전구체를 미토콘드리아 막을 가로질러 잡아당긴다. 내막을 가로지르는 전기 막전위(Δψ)(∼100 mV, 내부 음성)는 또한 전기영동 효과를 통해 양으로 하전된 예비-서열의 전좌를 구동한다.

절단성 예비-서열을 갖는 단백질의 대부분은 일반적인 내수송 경로(외막(TOM) 복합체의 수송체 및 내막 23 복합체(TIM23)의 수송체를 사용한다)를 통해 미토콘드리아 기질행이다. 그러나 절단성 예비-서열을 갖는 일부 단백질은 내막(Murcha et al., 2005)에서 또는, 상기가 또한 소수성 분류 신호(HSS)를 함유하는 경우에는 내막 공간(Glick et al., 1992)에서 조립할 수 있다. 절단된 예비-서열을 갖지 않는 기질 국소화된 단백질의 예는 매우 적다. 아라비도프시스에서, 오직 글루타메이트 데하이드로게나제만이, 가공되지 않은 완전길이 예비-서열과 함께 기질 중에서 발견되었다(Huang et al., 2009).

기질 표적화되지 않는 단백질의 경우, 다양한 내부 비-절단성 국소화 신호가 사용된다. 상기는 전형적으로 특정한 트래피킹(trafficking) 경로와 관련되며, 특정한 단백질 부류에 추가로 맞춰진다. 식물에서, 지금까지 무엇이 막간 공간 단백질에 대한 내부 신호 서열을 정확하게 구성하는지를 측정한 연구는 없었다. 그러나, 트윈 시스테인 잔기를 갖는 모티프가 미토콘드리아 막간 공간 조립 경로(MIA)를 통한 수송과 관련되는 듯하다(Carrie et al., 2010; Darshi et al., 2012). 최종적으로, 비-절단성 내부 서열이 또한 담체 경로(다중 막관통 영역을 갖는 단백질을 삽입하기 위해 TOM 및 TIM22 기구를 사용한다)를 통해 내막행 단백질에 의해 사용된다(Kerscher et al., 1997; Sirrenberg et al., 1996). 이들 서열은 전형적으로 소수성 영역에 이어서 내부 서열과 같은 예비-서열을 함유하며, 따라서 N-말단 예비-서열과 유사하지만 그들의 동족 단백질내 그들의 내부 위치에 의해 구별된다.

광합성 유기체에서, 핵 암호화된 미토콘드리아 단백질은 엽록체와 미토콘드리아 트래픽킹을, 이들 두 세포소기관과 그들의 프로테옴간의 많은 유사성에도 불구하고 구별할 필요가 있다. 대개 미토콘드리아 예비-서열 중에 존재하는 α-나선은 대개 엽록체 예비-서열 중에 존재하지 않으며(Zhang and Glaser, 2002), 이는 보다 더 구조화되지 않고 높은 β 시트 도메인 구조를 나타내는 경향이 있다(Bruce, 2001).

식물에서, MPP는 내막 결합된 Cytbc₁ 복합체에 고정되지만, 활성 MPP 부위는 상기 기질에 면하여 위치하며, 상기 두 단백질의 기능은 독립적이다(Glaser and Dessi, 1999).

미토콘드리아 표적화 펩티드

본 명세서에 사용되는 바와 같이, "미토콘드리아 표적화 펩티드" 또는 "MTP"란 용어는, 표적 단백질을 미토콘드리아로 향하게 하고 선택된 표적 단백질, 예를 들어 Nif 폴리펩티드, Gus, GFP 등을 미토콘드리아로 향하게 하기 위해서 MTP-표적 단백질 번역 융합에 이종으로 사용될 수 있는 적어도 10 아미노산 및 바람직하게는 10 내지 약 80 아미노산 잔기 길이를 포함하는 아미노산 서열을 의미한다.

MTP는 전형적으로 그의 N-말단에 상기가 유래되는 폴리펩티드의 번역 개시자 메티오닌을 포함한다. MTP는, 표적 단백질의 개시자 Met에 상응하는 Met 잔기에 펩티드 결합에 의해, 또는 Met 잔기가 생략될 수 있고 펩티드 결합이 야생형에서 상기 표적 단백질의 제2 아미노산인 아미노산 잔기에 직접 융합되도록 Nif 폴리펩티드 또는 "표적 단백질"에 번역에 의해 융합된다. MTP는 전형적으로 염기성이고 하이드록실화된 아미노산이 풍부하며 대개 산성 아미노산 또는 연장된 소수성 신장부가 부족하다. MTP는 양친성 나선을 형성할 수 있다.

이론에 의해 얽매이고자 하는 것은 아니지만, MTP는 전형적으로 미토콘드리아 외막상의 수용체에 결합하는 흡수-표적화 서열을 포함한다. 외막에 결합시, 융합 폴리펩티드는 바람직하게는 막 전좌를 겪어 채널 단백질을 수송하고, 미토콘드리아의 이중막을 통과하여 미토콘드리아 기질(MM)로 간다. 이어서 흡수-표적화 서열은 전형적으로 절단되고 성숙한 융합 단백질은 폴딩된다.

MTP는 후속적으로 단백질을 미토콘드리아의 상이한 영역, 예를 들어 미토콘드리아 기질(MM)에 표적화하는 추가적인 신호를 포함할 수 있다. 하나의 실시태양에서, 흡수-표적화 서열은 기질 표적화 서열이다.

MTP는 Nif 폴리펩티드에 번역에 의해 융합될 때 절단성이거나 비-절단성일 수 있다. 하나의 실시태양에서, 세포 중에서 생성되는 MTP-Nif 융합 폴리펩티드의 적어도 50%는 상기 세포 중에서 절단된다. 또 다른 실시태양에서, MTP-Nif 융합 폴리펩티드의 50% 미만이 세포 중에서 절단된다, 예를 들어 MTP는 절단되지 않는다. 하나의 실시태양에서, MTP는 MTP에 대한 절단 부위를 포함하지 않는다. MTP는 절단 부위(MTP 서열 내에)를 포함할 수 있다. 절단시, 생성된 가공된 생성물(즉 성숙 NP)의 N-말단 부분은 MTP의 하나 이상의 C-말단 아미노산을 포함할 수 있다. 한편으로, 절단 부위는 전체 MTP 서열이 절단되도록, 예를 들어 링커가 절단 서열을 포함할 수 있도록 융합 폴리펩티드내에 위치할 수 있다.

고유의 미토콘드리아 표적화 펩티드는 전구체 단백질의 N-말단에 위치하며 N-말단 부분은 전형적으로 미토콘드리아내로의 내수송 도중에 또는 상기 내수송 후에 절단된다. 절단은 전형적으로 일반적인 기질 가공 프로테아제(MPP)에 의해 촉매화되며, 상기 MPP는 식물에서 호흡쇄의 bc₁ 복합체에 통합된다. 상기 프로테아제는 보존을 거의 나타내지 않는 광범위한 아미노산 서열을 갖는 거의 1000 전구체 단백질의 절단 부위를 인식한다. 하나의 실시태양에서, MTP는 MPP에 대한 프로테아제 절단 부위를 포함한다. 추가의 실시태양에서, 가공된 생성물은 MPP에 의한 MTP 내 융합 단백질의 절단에 의해 생성된다.

하나의 실시태양에서, MTP는 절단되지 않는다. 본 발명자는 MTP의 통합이 Nif 단백질의 완전한 가공을 항상 유도하지는 않음을 입증하였다. 일부 예(NifX-FLAG, NifD-HA_opt1 및 NifDK-HA)에서, 가공된 및 가공되지 않은 Nif 단백질이 모두 관찰되었다. MTP에 대한 일반적인 공통 서열이 존재하지 않고 내부 단백질 서열이 미토콘드리아 표적화에 영향을 미칠 수 있음(Becker et al., 2012)을 고려할 때, 본 발명자가 Nif 단백질들간에 가공 효율의 차이를 발견한 것은 어쩌면 놀랍지 않을 것이다.

본 발명과 관련하여 사용될 수 있는 적합한 MTP는 비제한적으로 문헌[von Heijne (1986)] 또는 문헌[Roise and Schatz (1988)]에 의해 한정된 바와 같은 일반적인 구조를 갖는 펩티드를 포함한다. MTP의 비제한적인 예는 문헌[von Heijne (1986)]의 표 I에 정의된 미토콘드리아 표적화 펩티드이다.

하나의 실시태양에서, MTP는 F1-ATPase γ-서브유닛(pFAγ)이다. 적합한 pFAγ MTP의 일례는 에이 탈리아나(A. thaliana)로부터의 것이다(Lee et al., 2012). 하나의 실시태양에서, pFAγ MTP는 길이가 77 아미노산이며, MMP에 의한 그의 절단은 융합 폴리펩티드의 N-말단에 38 MTP 잔기를 남긴다. 바람직한 실시태양에서, pFAγ MTP는 길이가 77 아미노산 미만이다. 예를 들어, pFAγ MTP는 길이가 약 51 아미노산일 수 있으며, MMP에 의한 그의 절단은 융합 폴리펩티드의 N-말단에 9 MTP 잔기를 남긴다.

숙련가는 미토콘드리아 단백질 및 그의 표적화 서열의 예측을 위한 소프트웨어, 예를 들어 MitoProtII, PSORT, TargetP, NNPSL이 존재함을 알 것이다.

MitoProtII는 다수의 생리화학적 매개변수(예를 들어 N-말단 부분 중의 아미노산 조성, 또는 17 잔기 창에 대해 가장 높은 총 소수성)를 근거로 서열의 미토콘드리아 국소화를 예측하는 프로그램이다. PSORT는 다양한 서열-유래된 특징, 예를 들어 서열 모티프의 존재 및 아미노산 조성을 근거로 세포이하 위치를 예측하는 프로그램이다. TargetP는 N-말단 예비서열: 엽록체 수송 펩티드, 미토콘드리아 표적화 펩티드 또는 분비 경로 신호 펩티드 중 어느 하나의 예측된 존재를 근거로 진핵생물 단백질의 세포이하 위치를 예측한다. TargetP는, 보다 이른 2원 예측인자, SignalP 및 ChloroP를 사용하는 인공 신경망(ANN)의 2개 층내로의 투입물로서 N-말단 서열을 요한다. N-말단 예비서열을 함유하는 것으로 예측된 서열의 경우, 잠재적인 절단 부위를 또한 예측할 수 있다. NNPSL은 4개의 세포이하 위치(시토졸, 세포외, 핵 및 미토콘드리아) 중 하나를 탐문 서열에 지정하기 위해 아미노산 조성을 사용하는 또 다른 ANN-기반 방법이다.

숙련가는 통상적인 방법 및 본 명세서에 개시된 방법을 근거로, 선택된 MTP가 융합 폴리펩티드를 미토콘드리아 기질에 표적화하는지를 쉽게 판정할 수 있다. 본 발명자는 가공된 단백질의 검출을 지원하기 위해서, 아라비도프시스 원형질체에서 GFP를 수송할 수 있고(Lee et al., 2012) 비교적 긴 것으로서 앞서 입증된 표적화 펩티드를 선택하였다. 본 명세서의 실시예에 나타낸 바와 같이, 선택된 MTP는 선택된 니트로게나제 단백질 모두를 MM에 표적화하였다. 이러한 결론은 다수의 증거에 근거한다. 먼저, 엔 벤타미아나 발현된 Nif 폴리펩티드에 대해 관찰된 크기가 MM 펩티다제 가공으로부터 생성되는 예상된 크기와 일치하였다. 이는 또한 세균(가공되지 않은 완전길이) 및 작은 크기의 식물 미토콘드리아 발현된 Nif(NifF 및 NifZ)간에 관찰된 크기의 차이에 의해 반영되었다. 추가로, MTP를 미토콘드리아 내수송 기구에 의해 가공될 수 없게 만든, 상기 MTP의 돌연변이는 NifD 및 GFP 융합 모두에 대해 보다 큰 밴드를 생성시켰으며, 이는 가공된 및 가공되지 않은 단백질간의 크기 차이와 일치하였다. 최종적으로, 예시적인 융합 폴리펩티드에 대한 질량 분광분석은 MTP-NifH가, 기질 중 특정한 가공에 대해 예측된 바와 같이 MTP의 잔기 42-43 사이에서 절단되었음을 판정하였다.

본 발명의 일부 실시태양에서, 선택된 MTP의 다수의 나란한 사본을 사용하는 것이 유용할 수 있다. 중복된 또는 다중의 표적화 펩티드에 대한 암호화 서열을 기존 MTP로부터의 유전자 조작을 통해 획득할 수 있다. MTP의 양을 세포 분획화에 이어서, 예를 들어 정량적인 면역블럿 분석에 의해 측정할 수 있다. 따라서, 본 발명에서, "미토콘드리아 표적화 펩티드" 또는 "MTP"란 용어는 표적 Nif 단백질을 미토콘드리아로 향하게 하는 하나의 아미노산 펩티드의 하나 이상의 사본을 포함한다. 바람직한 실시태양에서, MTP는 선택된 MTP의 2개의 사본을 포함한다. 또 다른 실시태양에서, MTP는 선택된 MTP의 3개의 사본을 포함한다. 또 다른 실시태양에서, MTP는 선택된 MTP의 4개 이상의 사본을 포함한다.

숙련가는 MTP 서열이 고유의 MTP 서열로 제한되지 않으며, 서열 변이체가 여전히 미토콘드리아 표적화 기능을 하는 한, 천연-생성 MTP에 비해 아미노산 치환, 결실 및/또는 삽입을 포함할 수 있다.

숙련가는 MTP가 클로닝 전략의 결과로서 그의 N- 또는 C-말단에 아미노산이 인접할 수 있고 링커로서 기능할 수 있음을 알 것이다. 이들 추가적인 아미노산은 MTP의 부분을 형성하는 것으로 간주될 수 있다.

숙련가는 또한 MTP가 올리고펩티드 링커 및/또는 태그, 예를 들어 에피토프 태그에 N- 또는 C-말단 융합될 수 있음을 알 것이다. 바람직한 실시태양에서, 식물 세포에서 생성된 본 발명의 Nif 융합 폴리펩티드 중 하나 이상 또는 전부는 상응하는 야생형 Nif 폴리펩티드에 비해 부가된 에피토프 태그가 없다.

링커

폴리펩티드와 관련하여 본 명세서에 사용되는 바와 같이, "링커" 또는 "올리고펩티드 링커"란 용어는 2개 이상의 기능성 도메인, 예를 들어 MTP 및 NP, 2개의 NP, NP 및 태그를 공유 결합시키는 하나 이상의 아미노산을 의미한다. 아미노산은 링커내에서 및 링커와 기능성 도메인 사이 모두에서 펩티드 결합을 통해 공유 결합된다. 링커는 2개 이상 도메인의 기능에 실질적인 유해 효과를 야기하지 않으면서 하나의 기능성 도메인의, 다른 것에 대한 이동의 자유를 제공할 수 있다. 링커는 기능성 도메인 중 하나 또는 둘 모두의 적합한 폴딩 및 기능의 촉진을 도울 수 있다. 숙련가는 링커의 크기를 실험적으로 결정하거나 또는 단백질 폴딩 정보를 근거로 모델링할 수 있음을 알 것이다.

링커는 MPP와 같은 프로테아제에 대한 절단 부위를 포함할 수 있다. 상기와 같은 링커는 또한 MTP의 부분인 것으로 간주될 수 있다.

숙련가는 MTP의 C-말단을 링커 없이 또는 하나 이상의 아미노산 잔기, 예를 들어 1 내지 5 아미노산 잔기의 링커를 통해 NP의 N-말단 아미노산에 번역에 의해 융합시킬 수 있음을 알 것이다. 상기와 같은 링커는 또한 MTP의 부분인 것으로 간주될 수 있다.

실시태양에서, 링커는 적어도 1 아미노산, 적어도 2 아미노산, 적어도 3 아미노산, 적어도 4 아미노산, 적어도 5 아미노산, 적어도 6 아미노산, 적어도 7 아미노산, 적어도 8 아미노산, 적어도 9 아미노산, 적어도 10 아미노산, 적어도 12 아미노산, 적어도 14 아미노산, 적어도 16 아미노산, 적어도 18 아미노산, 적어도 20 아미노산, 적어도 25 아미노산, 적어도 30 아미노산, 적어도 35 아미노산, 적어도 40 아미노산, 적어도 45 아미노산, 적어도 50 아미노산, 적어도 60 아미노산, 적어도 70 아미노산, 적어도 80 아미노산, 적어도 90 아미노산, 또는 약 100 아미노산을 포함한다. 실시태양에서, 링커의 최대 크기는 100 아미노산, 바람직하게는 60 아미노산, 보다 바람직하게는 40 아미노산이다.

일부 실시태양에서, 링커는 융합 폴리펩티드의 안정성을 증가시키기 위해서 하나의 기능성 도메인의 다른 것에 대한 이동을 허용할 것이다. 경우에 따라, 링커는 폴리-글리신의 반복 또는 글리신, 프롤린 및 알라닌 잔기의 조합을 포함할 수 있다.

2개의 Nif 폴리펩티드를 연결시키기 위한 링커, 예를 들어 NifD-링커-NifK 및 NifE-링커-NifN이 바람직하게는 다수의 기준을 근거로, 링커 중의 아미노산의 수 및 서열에 대해서 선택된다. 불필요한 디설파이드 결합의 형성을 피하기 위한 시스테인 잔기의 결여, 불필요한 표면 염 가교 상호작용 가능성을 감소시키기 위한 하전된 잔기(Glu, Asp, Arg, Lys)가 거의 없거나 바람직하게는 없음, 폴리펩티드의 표면을 침투하는 경향을 촉진할 수 있는 소수성 잔기(Phe, Trp, Tyr, Met, Val, Ile, Leu)가 거의 없거나 없음, 및 번역후 변형될 수 있는 아미노산이 없음이 존재한다. 이와 관련하여 "하전된 잔기가 거의 없음"은 링커 중 10% 미만의 상기 아미노산 잔기를 의미하고, "소수성 잔기가 거의 없음"은 링커 중 15% 미만의 상기 아미노산 잔기를 의미한다.

하나의 실시태양에서, 링커는 시스테인 잔기를 포함하지 않는다.

하나의 실시태양에서, 링커는 4, 3, 또는 2, 또는 1개의 하전된 잔기를 포함하거나 또는 상기 잔기를 포함하지 않는다. 바람직하게, 링커는 총 4, 3, 또는 2, 또는 1개의 글루탐산, 아스파트산, 아르기닌 및 리신 잔기를 포함하거나 이들 잔기를 포함하지 않는다.

하나의 실시태양에서, 링커는 4, 3, 또는 2, 또는 1개의 소수성 잔기를 포함하거나 또는 상기 잔기를 포함하지 않는다. 바람직하게, 링커는 총 4, 3, 또는 2, 또는 1개의 페닐알라닌, 트립토판, 티로신, 메티오닌, 발린, 이소류신 및 류신 잔기를 포함하거나 이들 잔기를 포함하지 않는다.

하나의 실시태양에서, 링커의 적어도 70%, 또는 적어도 80%, 또는 적어도 90%는 쓰레오닌, 세린, 글리신 및 알라닌 중에서 선택된 잔기를 포함한다.

폴리펩티드의 변형에서 올리고펩티드 링커의 용도는 하기의 문헌에 리뷰되어 있다: Chen et al., (2013) 및 Zhang et al., (2009).

태그

특정한 실시태양에서, 융합 폴리펩티드는 융합 폴리펩티드 또는 그의 가공된 생성물의 검출 또는 정제에 적합한 적어도 하나의 태그를 포함한다. 태그는 전형적으로 융합 폴리펩티드의 C-말단 또는 N-말단 도메인에 결합된다. 바람직한 실시태양에서, 태그는 Nif 폴리펩티드의 C-말단에 결합된다. 태그는 일반적으로 하나 이상의 리간드, 예를 들어 친화성 기질, 예를 들어 크로마토그래피 지지체 또는 비드의 하나 이상의 리간드, 또는 항체에 높은 친화성으로 결합할 수 있는 펩티드 또는 아미노산 서열이다. 숙련가는 태그가 바람직하게는 융합 단백질 중에, 일단 MTP가 미토콘드리아내로 내수송 후 절단되면 NP로부터 상기 태그의 제거를 생성시키지 않는 위치에 위치함을 알 것이다. 더욱이, 태그는 미토콘드리아 내수송 기구를 방해해서는 안 된다. 바람직한 실시태양에서, 본 발명의 폴리뉴클레오티드는 N-에서 C-말단 순서로, N-말단 MTP, Nif 폴리펩티드 및 검출/정제 태그를 포함하는 융합 폴리펩티드를 암호화한다. 또 다른 실시태양에서, 융합 폴리펩티드는 N-에서 C-말단 순서로, N-말단 MTP, 검출/정제 태그 및 Nif 폴리펩티드를 포함한다.

융합 폴리펩티드 또는 그의 가공된 생성물의 검출, 단리 또는 정제에 유용한 태그의 추가의 예시적인 비제한적 예는 인간 인플루엔자 헤마글루티닌(HA) 태그, 예를 들어 6 또는 8 히스티딘 잔기를 포함하는 히스티딘 태그, 형광 태그, 예를 들어 플루오레세인, 레소루핀 및 그의 유도체, Arg-태그, FLAG-태그, 스트렙-태그, 항체에 의해 인식될 수 있는 에피토프, 예를 들어 c-myc-태그(항-c-myc 항체에 의해 인식됨), SBP-태그, S-태그, 칼모듈린 결합 펩티드, 셀룰로스 결합 도메인, 키틴 결합 도메인, 글루타치온 S-트랜스퍼라제-태그, 말토스 결합 단백질, NusA, TrxA, DsbA, Avi-태그 등을 포함한다.

Nif 폴리펩티드를 수반하는 번역 융합

과학 문헌에 보고된 바와 같이 다수의 Nif 폴리펩티드에 대한 번역 융합이 수행되었다. 이들을 표 2에 요약하고 문헌[Buren and Rubio, (2018)]에서 리뷰한다. 이들 중 대부분은 검출 및 정제를 목적으로 에피토프 또는 결합 도메인, 예를 들어 히스티딘 태그 또는 스트렙 태그의 단백질에의 인위적인 첨가를 수반하며, 단지 몇 개만이 식물 세포에서 발현되었다. 세균에서 Nif 폴리펩티드간의 천연 생성 융합에 대한 몇 개의 보고서가 존재한다. 세균 숙주에서의 분석을 위해서, 상이한 길이(7-10 히스티딘)의 His 태그를 NifD(Christiansen et al., 1998), NifE(Goodwin et al., 1998), NifM(Gavini et al., 2006) 및 NifB의 완전길이 및 절두된 버전 모두(Fay et al., 2015)에 첨가하였다. 각각의 경우에, Nif 기능이 세균 또는 시험관내 니트로게나제 재편성 분석에서 입증된 바와 같이 변형된 Nif 폴리펩티드에 대해 유지되었다.

티엘(Tiel) 등(1995)은 29 뉴클레오티드의 자연발생 결실 및 따라서 청-녹조류 아나바에나 바리아빌리스(Anabaena variabilis)에서 NifE 및 NifN 유전자 사이의 유전자간 영역 중 9개 아미노산 및 NifE 정지 코돈의 결실을 확인하였다. 결실은 NifE 및 NifN 폴리펩티드의 적어도 일부의 니트로게나제 기능을 유지하는 NifE-NifN 폴리펩티드 융합을 생성시켰다. NifE-NifN 융합 폴리펩티드는 또한 융합 연접 영역에 19개의 다른 아미노산 치환을 가졌으며, 이는 Nif 기능에, 그러나 미지의 방식으로 영향을 미칠 수도 있다. 융합 유전자는 발현되었으나, 오직 엄격한 혐기성 조건하에서만 발현되었다. 비-융합 유전자에 비해 활성의 감소가 존재하는지는 보고되지 않았다.

서(Suh) 등(1996)은 NifD의 정지 코돈 및 NifK의 번역 개시 코돈(ATG)을 포함한 결실에 의해 에이 비넬란디이(A. vinelandii)의 염색체의 NifD 및 NifK 유전자간 인공 연접을 생성시켜, pBG1404라 표기되는 벡터를 형성시켰다. 결실은 NifK 폴리펩티드의 아미노산 2-10에서 3 아미노산 및 7 아미노산 치환의 순 손실을 생성시켰다. pBG1404를 함유하는 에이 비넬란디이 숙주 세포는 상응하는 야생형 세균에 비해 저 질소 배지에서 생육이 훼손되었다.

위그(Wiig) 등(2011)은 클로스트리디움 파스퇴리아눔(Clostridium pastuerianum)에서 발견되는 NifN 및 NifB 유전자간의 자연발생 번역 융합을 사용하였으며 상기가 세균 및 생화학적 상보성 분석에서 NifN 및 NifB 활성에 기능성임을 판정하였다. 상기 융합은 임의의 펩티드 링커 없이 직접적이었다, 즉 NifN의 C-말단은 NifB의 N-말단에 직접적으로 공유 결합되었다.

효모 및 식물 세포에서, 번역 융합을 사용하여 핵 중에서 암호화된 단백질을 미토콘드리아 기질로 향하게 하였다. 효모 발현 분석에서, 미토콘드리아 표적화 펩티드(MTP) 및 일부 Nif 폴리펩티드(NifH, NifM, NifS 및 NifU)의 번역 융합은 호기성 조건하에서 생육시 기능성임이 입증되었다(Lopez-Torrejon et al., 2016). 에피토프 융합(FLAG 및 HIS)은 또한 NifH, NifM, NifS 및 NifU에 융합시 기능성인 것으로 나타났지만, 이들 융합은 효모 세포질내에 국소화하고자 하였으며 효모가 혐기성 조건하에서 생육하는 경우에만 기능성이었다. 뷰렌(Buren) 등(2017)은 NifB의 용해성 변이체의 미토콘드리아-기질 표적화된 버전이 효모의 미토콘드리아로부터 재-단리될 때 시험관내 상보성 분석에서 기능성임을 입증하였다. NifB의 상기 버전은 N-말단 MTP, NifB의 절두된 변이체(NifX-유사 도메인 없음) 및 C-말단 10xHis 에피토프 태그를 포함하였다. 다수의 MTP-Nif 융합이 또한 효모 발현 분석에서 생성되었다. 그러나, 동시-발현된 단백질의 이러한 큰 합주는 효모에서 활성을 나타내지 못하였다(Buren et al., 2017).

CPN-60 유전자로부터 MTP를 NifH, NifM, NifS 및 NifU의 N-말단에 융합시켰으며 상기는 Fe 단백질을 10% 산소의 감소된 산소 장력하에서 생육된 식물로부터 재-단리했을 때 시험관내 상보성 분석을 통해 기능성임이 입증되었다(US2016/0304842).

폴리뉴클레오티드

"폴리뉴클레오티드" 및 "핵산"이란 용어는 본 명세서에서 호환 가능하게 사용된다. 이들은 임의의 길이의 중합체성 형태의 뉴클레오티드, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드, 또는 이들의 유사체를 의미한다. 본 명세서에서 정의된 폴리뉴클레오티드는 게놈, cDNA, 반합성, 또는 합성 기원의, 단일 가닥 또는 바람직하게는 이중 가닥일 수 있으며 그의 기원 또는 조작에 의해: (1) 상기가 자연에서 회합된 폴리뉴클레오티드의 전부 또는 일부와 회합되지 않거나(예를 들어 고유의 프로모터 암호화 서열을 포함하지 않는 Nif 폴리뉴클레오티드), (2) 상기가 자연에서 연결된 것 이외의 폴리뉴클레오티드에 연결되거나(예를 들어 MTP 암호화 뉴클레오티드 서열 및/또는 비-고유 프로모터 암호화 서열에 연결된 Nif 폴리뉴클레오티드), 또는 (3) 자연에서 존재하지 않는다(예를 들어 본 발명의 MTP-Nif 융합 폴리펩티드를 암호화하는 폴리뉴클레오티드). 하기는 폴리뉴클레오티드의 비제한적인 예이다: 유전자 또는 유전자 단편의 암호화 또는 비-암호화 영역, 결합 분석으로부터 한정된 유전자좌들(유전자좌), 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA(tRNA), 리보솜 RNA(rRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지된 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 임의의 서열의 단리된 키메릭 DNA, 핵산 탐침, 및 프라이머. 폴리뉴클레오티드는 변형된 뉴클레오티드, 예를 들어 메틸화된 뉴클레오티드 및 뉴클레오티드 유사체를 포함할 수 있다. 존재하는 경우, 뉴클레오티드 구조에 대한 변형을 중합체의 조립 전 또는 후에 부여할 수 있다. 뉴클레오티드의 서열은 비-뉴클레오티드 성분에 의해 중단될 수 있다. 폴리뉴클레오티드를 중합 후에, 예를 들어 표지화 성분과의 접합에 의해 추가로 변형시킬 수 있다.

"단리된 폴리뉴클레오티드"는 상기 폴리뉴클레오티드와 통상적으로 연결되거나(예를 들어 조절 서열) 또는 회합되는 성분이 실질적으로 없다. 따라서, 단리된 폴리뉴클레오티드는 다른 세포 물질, 또는 재조합 기법에 의해 생성시 배양 배지가 실질적으로 없거나, 또는 화학적으로 합성시 화학적 전구체 또는 다른 화학물질이 실질적으로 없다. 바람직하게, 단리된 폴리뉴클레오티드는 상기 성분이 적어도 60% 없거나, 보다 바람직하게는 적어도 75% 없거나, 보다 바람직하게는 적어도 90% 없다.

본 명세서에 사용되는 바와 같이, "유전자"란 용어는 그의 가장 넓은 개념으로 간주되어야 하며, 구조 유전자의 전사된 영역, 및 번역된 경우, 단백질 암호화 영역을 포함하고 5' 또는 3' 단부상에서 적어도 약 2 kb의 거리에 대해 상기 5' 및 3' 단부 모두상의 암호화 영역에 인접하여 위치하고 상기 유전자의 발현에 관련된 서열을 포함하는 데옥시리보뉴클레오티드 서열을 포함한다. 이에 관하여, 유전자는 주어진 유전자와 자연적으로 관련된 조절 신호, 예를 들어 프로모터, 인헨서, 번역 및 전사 종결 및/또는 폴리아데닐화 신호, 또는 이종 조절 신호(이 경우 유전자를 "키메릭 유전자"라 칭한다)를 포함한다. 단백질 암호화 영역의 5'에 위치하고 mRNA상에 존재하는 서열을 5' 비-번역된 서열이라 칭한다. 단백질 암호화 영역의 3' 또는 하류에 위치하고 mRNA상에 존재하는 서열을 3' 비-번역된 서열이라 칭한다. "유전자"란 용어는 유전자의 cDNA 및 게놈 형태 모두를 포함한다. 유전자의 게놈 형태 또는 클론은 "인트론", "개재 영역", 또는 "개재 서열"이라 칭하는 비-암호화 서열로 중단될 수 있는 암호화 영역을 함유한다. 인트론은 핵 RNA(nRNA)로 전사되는 유전자의 분절이다. 인트론은 인헨서와 같은 조절 요소를 함유할 수 있다. 인트론은 핵 또는 1차 전사물로부터 제거되거나 "이어맞추기 해제"되며; 따라서 인트론은 mRNA 전사물 중에 존재하지 않는다. mRNA는 번역 동안 발생기 폴리펩티드 중의 아미노산의 서열 또는 순서를 명시하는 기능을 한다. "유전자"란 용어는 본 명세서에 기재된 본 발명 단백질의 전부 또는 일부를 암호화하는 합성 또는 융합 분자 및 상기 중 어느 하나에 대한 상보성 뉴클레오티드 서열을 포함한다.

본 명세서에 사용되는 바와 같이, "키메릭 DNA"(또한 본 명세서에서 "DNA 구조물"이라 지칭된다)는 자연에서 자연적으로 발견되지 않고 2개의 DNA 부분을 단일 분자로 인공적으로 결합시킨 임의의 DNA 분자를 의미하며, 그의 각 부분은 자연에서 발견될 수도 있지만 전체는 자연에서 발견되지 않는다. 예를 들어, 본 발명의 MTP-Nif 융합 폴리펩티드를 암호화하는 DNA 구조물. 전형적으로, 키메릭 DNA는 자연에서 함께 자연적으로 발견되지 않는(예를 들어 비-고유 프로모터 암호화 서열에 연결된 Nif 폴리뉴클레오티드) 조절 및 전사된 또는 단백질 암호화 서열을 포함한다. 상응하게, 키메릭 DNA는 상이한 공급원으로부터 유래된 조절 서열 및 암호화 서열, 또는 동일한 공급원으로부터 유래되지만 자연에서 발견되는 것과 상이한 방식으로 배열된 조절 서열 및 암호화 서열을 포함할 수 있다. 개방 판독 프레임을 그의 천연 상류 및 하류 조절 요소에 연결시킬 수도 있고, 연결시키지 않을 수도 있다. 개방 판독 프레임은 비-자연적 장소에서, 또는 세균 플라스미드 또는 바이러스 벡터와 같이 자연적으로 발견되지 않는 레플리콘 또는 벡터에서, 예를 들어 식물 게놈에 통합될 수 있다. "키메릭 DNA"란 용어는 숙주에서 복제가능한 DNA 분자로 제한되지 않고, 예를 들어 특정한 어댑터 서열에 의해 레플리콘내로 결찰될 수 있는 DNA를 포함한다.

"트랜스유전자"는 형질전환 과정에 의해 게놈 내로 통합된 유전자이다. 상기 용어는 전구 세포의 게놈 내로 도입되는 자손 세포, 식물, 종자, 비-인간 유기체 또는 그의 부분 중의 유전자를 포함한다. 상기와 같은 자손 세포 등은 1차 형질전환된 세포인 전구 세포로부터 적어도 3 또는 4세대 자손일 수 있다. 자손은 유성 생식 또는 영양에 의해, 예를 들어 감자의 괴경 또는 사탕수수의 그루터기 묘종으로부터 생성될 수 있다. "유전자 변형된"이란 용어 및 그의 변형은 유전자를 형질전환 또는 형질도입에 의해 세포 내로 도입시키거나, 유전자를 세포에서 돌연변이시키고 세포에서 유전자를 유전적으로 변경시키거나 그의 조절을 변형시키거나, 또는 상술한 바와 같이 변형된 임의의 세포의 자손을 포함하는 보다 광범위한 용어이다.

본 명세서에 사용되는 바와 같은 "게놈 영역"은 트랜스유전자, 또는 트랜스유전자의 그룹(또한 본 명세서에서 클러스터라 칭한다)이 세포에 삽입되었거나, 또는 그의 선행작업이 있었던 게놈내 위치를 지칭한다. 상기와 같은 영역은 오직, 인간의 개입에 의해, 예를 들어 본 명세서에 기재된 방법에 의해 통합된 뉴클레오티드만을 포함한다.

본 발명의 "재조합 폴리뉴클레오티드"는 인공 재조합 방법에 의해 구성되었거나 변형된 핵산 분자를 지칭한다. 재조합 폴리뉴클레오티드는 세포 중에, 그의 고유의 상태에 비해 변경된 양으로 존재하거나 변경된 비율(예를 들어 mRNA의 경우에서)로 발현될 수 있다. 하나의 실시태양에서, 폴리뉴클레오티드를, 상기 폴리뉴클레오티드를 자연적으로 포함하지 않는 세포 내로 도입시킨다. 전형적으로 외인성 DNA가 mRNA의 전사를 위한 주형으로서 사용되며, 이어서 상기는 형질전환된 세포내에서 본 발명의 폴리펩티드를 암호화하는 아미노산 잔기의 연속적인 서열로 번역된다. 또 다른 실시태양에서, 폴리뉴클레오티드는 세균 세포에 내인성이며 그의 발현을 재조합 수단에 의해 변경시킨다, 예를 들어 외인성 조절 서열을 내인성 관심 유전자의 상류에 도입시켜 상기 형질전환된 세포가 상기 유전자에 의해 암호화된 폴리펩티드를 발현할 수 있게 한다.

본 발명의 재조합 폴리뉴클레오티드는 상기가 존재하는 세포-기반 또는 무세포 발현 시스템의 다른 성분과 분리되지 않은 폴리뉴클레오티드, 및 후속적으로 적어도 일부 다른 성분으로부터 정제되는 상기 세포-기반 또는 무세포 시스템 중에서 생성된 폴리뉴클레오티드를 포함한다. 폴리뉴클레오티드는 자연 중에 존재하는 뉴클레오티드의 연속적인 신장부(예를 들어 Nif 폴리뉴클레오티드)이거나, 또는 결합되어 단일 폴리뉴클레오티드를 형성하는 상이한 공급원(천연 생성 및/또는 합성)으로부터의 2개 이상의 연속적인 신장부(예를 들어 MTP 암호화 뉴클레오티드 서열 및/또는 비-고유 프로모터 암호화 서열에 연결된 Nif 폴리뉴클레오티드)를 포함할 수 있다. 전형적으로, 상기와 같은 키메릭 폴리뉴클레오티드는 적어도, 관심 세포에서 개방 판독 프레임의 전사를 구동하기에 적합한 프로모터에 작동적으로 연결된 본 발명의 폴리펩티드를 암호화하는 개방 판독 프레임을 포함한다.

상기 정의된 폴리뉴클레오티드에 관하여, 상기에 제공된 경우보다 더 큰 일치성 숫자%는 바람직한 실시태양을 포함함을 알 것이다. 따라서, 적용 가능한 경우, 최소의 일치성 숫자%에 비추어, 폴리펩티드는 관련된 지명된 서열번호에 적어도 60%, 보다 바람직하게는 적어도 65%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 보다 바람직하게는 적어도 80%, 보다 바람직하게는 적어도 85%, 보다 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 91%, 보다 바람직하게는 적어도 92%, 보다 바람직하게는 적어도 93%, 보다 바람직하게는 적어도 94%, 보다 바람직하게는 적어도 95%, 보다 바람직하게는 적어도 96%, 보다 바람직하게는 적어도 97%, 보다 바람직하게는 적어도 98%, 보다 바람직하게는 적어도 99%, 보다 바람직하게는 적어도 99.1%, 보다 바람직하게는 적어도 99.2%, 보다 바람직하게는 적어도 99.3%, 보다 바람직하게는 적어도 99.4%, 보다 바람직하게는 적어도 99.5%, 보다 바람직하게는 적어도 99.6%, 보다 바람직하게는 적어도 99.7%, 보다 바람직하게는 적어도 99.8%, 및 훨씬 더 바람직하게는 적어도 99.9% 일치하는 폴리뉴클레오티드 서열을 포함하는 것이 바람직하다.

본 발명의, 또는 본 발명에 유용한 폴리뉴클레오티드는 엄격한 조건하에서, 본 명세서에 정의된 폴리뉴클레오티드에 선택적으로 하이브리드화할 수 있다. 본 명세서에 사용되는 바와 같이, 엄격한 조건은 (1) 하이브리드화 동안 42 ℃에서 변성제, 예를 들어 포름아미드, 예를 들어 50%(v/v) 포름아미드를 0.1%(w/v) 소 혈청 알부민, 0.1% 피콜, 0.1% 폴리비닐피롤리돈, 750 mM NaCl을 갖는 pH 6.5의 50 mM 나트륨 포스페이트 완충제, 75 mM 나트륨 시트레이트와 함께 사용하거나; 또는 (2) 42 ℃에서 0.2 SSC 및 0.1% SDS 중의 50% 포름아미드, 5 x SSC(0.75 M NaCl, 0.075 M 나트륨 시트레이트), 50 mM 나트륨 포스페이트(pH 6.8), 0.1% 나트륨 피로포스페이트, 5 x 덴하르트 용액, 초음파 가공된 연어 정자 DNA(50 g/㎖), 0.1% SDS 및 10% 덱스트란 설페이트를 사용하고/하거나 (3) 세척을 위해 저 이온 강도 및 고온, 예를 들어 50 ℃에서 0.015 M NaCl/0.0015 M 나트륨 시트레이트/0.1% SDS를 사용하는 것들이다.

본 발명의 폴리뉴클레오티드는 천연 생성 분자에 비해, 뉴클레오티드 잔기의 결실, 삽입 또는 치환인 하나 이상의 돌연변이를 가질 수 있다. 참조 서열에 비해 돌연변이를 갖는 폴리뉴클레오티드는 천연 생성이거나(즉 천연 공급원으로부터 단리되거나) 또는 합성적(예를 들어 부위-지향된 돌연변이유발 또는 상술한 바와 같은 핵산 상의 DNA 셔플링을 수행함으로써)일 수 있다.

본 발명의 폴리뉴클레오티드를 식물 세포에서 발현을 위해 코돈-변형시킬 수 있다. 숙련가는 단백질 암호화 영역을 질소 고정 세균에서, 예를 들어 천연 생성 폴리뉴클레오티드의 암호화 영역에 비해 코돈 최적화할 수 있음을 알 것이다.

핵산 구조물

본 발명은 본 발명의 하나 이상의 폴리뉴클레오티드를 포함하는 핵산 구조물, 및 상기를 포함하는 벡터 및 숙주 세포, 그의 제조 및 사용 방법, 및 그의 용도를 포함한다. 본 발명은 작동적으로 결합되거나 연결된 요소들에 관한 것이다. "작동적으로 결합된" 또는 "작동적으로 연결된" 등은 기능적 관계로 폴리뉴클레오티드 요소들의 연결을 지칭한다. 전형적으로, 작동적으로 결합된 핵산 서열은 연속적으로 연결되며, 필요한 경우 2개의 단백질 암호화 영역을 연속적으로 및 판독 프레임으로 결합시킨다. 암호화 서열은 RNA 폴리머라제가 2개의 암호화 서열을 단일 RNA로 전사하는 경우, 또 다른 암호화 서열"에 작동적으로 결합되며", 상기 RNA는 번역되는 경우 이어서 상기 두 암호화 서열 모두로부터 유래되는 아미노산을 갖는 단일 폴리펩티드로 번역된다. 암호화 서열은 발현된 서열이 최종적으로 목적하는 단백질을 생성하도록 가공되는 한 서로에 대해 연속적일 필요는 없다.

본 명세서에 사용되는 바와 같이, "시스-작용 서열", "시스-작용 요소" 또는 "시스-조절 영역" 또는 "조절 영역"이란 용어 또는 유사한 용어는, 적합하게 위치하고 발현 가능한 유전자 서열에 결합되는 경우, 적어도 부분적으로 상기 유전자 서열의 발현을 조절할 수 있는 뉴클레오티드의 임의의 서열을 의미하는 것으로 간주될 것이다. 당해 분야의 숙련가는 시스-조절 영역이 전사 또는 번역-후 수준에서 유전자 서열의 발현 수준 및/또는 세포-유형 특이성 및/또는 발생 특이성을 활성화, 침묵화, 증대, 억제 또는 달리 변경시킬 수 있음을 알 것이다. 본 발명의 바람직한 실시태양에서, 시스-작용 서열은 발현성 유전자 서열의 발현을 증대시키거나 자극하는 활성제 서열이다.

프로모터 또는 인헨서 요소를 전사 가능한 폴리뉴클레오티드에 "작동적으로 결합시키는"은 상기 전사 가능한 폴리뉴클레오티드(예를 들어 단백질-암호화 폴리뉴클레오티드 또는 다른 전사물)를 프로모터의 조절성 조절하에 두고, 이어서 상기 폴리뉴클레오티드의 전사를 조절함을 의미한다. 이종 프로모터/구조 유전자 조합의 구성에서, 프로모터 또는 그의 변이체를 상기 프로모터와, 자연적인 배경(즉, 상기 프로모터가 유래되는 유전자)에서 상기 프로모터가 조절하는 단백질 암호화 영역간의 거리와 대략적으로 동일한 상기 전사 가능한 폴리뉴클레오티드의 전사 개시 부위로부터의 거리에 위치시키는 것이 일반적으로 바람직하다. 당해 분야에 공지된 바와 같이, 상기 거리의 약간의 변동은 기능의 상실 없이 수용될 수 있다. 유사하게, 전사 가능한 폴리뉴클레오티드를 조절하에 놓는 것에 관하여 조절 서열 요소(예를 들어 오퍼레이터, 인헨서 등)의 바람직한 배치는 자연적인 배경(즉 상기가 유래되는 유전자)에 상기 요소의 배치에 의해 한정된다.

본 명세서에 사용되는 바와 같은 "프로모터" 또는 "프로모터 서열"은 관심 세포에서 전사의 개시 및 전사 수준을 조절하는, 일반적으로 RNA 암호화 영역의 상류(5')인 유전자 영역을 지칭한다. "프로모터"는 고전적인 게놈 유전자의 전사 조절 서열, 예를 들어 TATA 박스 및 CCAAT 박스 서열뿐만 아니라, 발생 및/또는 환경 자극에 반응하여, 또는 조직-특이적인 또는 세포-유형-특이적인 방식으로 유전자 발현을 변경시키는 추가적인 조절 요소(즉 상류 활성화 서열, 인헨서 및 사이렌서)를 포함한다. 프로모터는 대개, 반드시는 아니지만(예를 들어, 일부 PolIII 프로모터), 구조 유전자의 상류에 위치하며, 상기 유전자의 발현을 조절한다. 더욱 또한, 프로모터를 포함하는 조절 요소는 대개 유전자의 전사 개시 부위의 2 kb 이내에 위치한다. 프로모터는 개시 부위에 더 멀리 배치된 추가적인 특정한 조절 요소를 함유하여, 세포에서의 발현을 추가로 증대시키고/시키거나 작동적으로 결합되는 구조 유전자의 발현 타이밍 또는 유도성을 변경시킬 수 있다.

"구성적 프로모터"는 식물과 같은 유기체의 다수 또는 모든 조직에서 작동적으로 연결된 전사된 서열의 발현을 지시하는 프로모터를 지칭한다. 본 명세서에 사용되는 바와 같은 "구성적"이란 용어는 유전자가 반드시 모든 세포 유형에서 동일한 수준으로 발현됨을 가리키는 것이 아니고, 유전자가, 종종 약간의 수준 변화가 검출될 수는 있지만, 광범위한 세포 유형에서 발현됨을 가리킨다. 본 명세서에 사용되는 바와 같은 "선택성 발현"은 예를 들어 식물의 특정 기관, 예를 들어 배젖, 배아, 잎, 열매, 괴경 또는 뿌리에서의 거의 독점적인 발현을 지칭한다. 바람직한 실시태양에서, 프로모터는 식물, 바람직하게는 곡류 식물의 뿌리, 잎 및/또는 줄기에서 선택적으로 또는 우선적으로 발현된다. 따라서 선택성 발현은, 식물이 경험하는 거의 모든 조건하에서 식물의 다수 또는 모든 조직의 발현을 지칭하는 구조적 발현과 대조될 수 있다.

선택성 발현은 또한 특정한 식물 조직, 기관 또는 발생 단계에서의 유전자 발현 산물의 구획화를 생성시킬 수 있다. 특정한 세포이하 장소, 예를 들어 색소체, 시토솔, 액포 또는 아포플라스틱 공간의 구획화는 필요한 세포 구획으로의 수송을 위한 적합한 신호, 예를 들어 신호 펩티드의 유전자 산물 구조에의 포함에 의해, 또는 반-자율적 세포소기관(색소체 및 미토콘드리아)의 경우에 상기 세포소기관 게놈내 적합한 조절 서열을 갖는 유전자 서열의 직접적인 통합에 의해 성취될 수 있다.

"조직-특이성 프로모터" 또는 "기관-특이성 프로모터"는 식물의 다수의 다른 조직 또는 기관, 바람직하게는 대부분의, 모두는 아니지만, 다른 모든 조직 또는 기관에 비해 하나의 조직 또는 기관에서 우선적으로 발현되는 프로모터이다. 전형적으로, 프로모터는 다른 조직 또는 기관에서보다 특정한 조직 또는 기관에서 10배 더 높은 수준으로 발현된다.

하나의 실시태양에서, 프로모터는 줄기-특이성 프로모터, 잎-특이성 프로모터 또는 식물의 공중 부분(적어도 줄기 및 잎)에서 유전자 발현을 지시하는 프로모터(녹색 조직 특이성 프로모터), 예를 들어 리불로스-1,5-비스포스페이트 카복실라제 옥시게나제(루비스코) 프로모터이다.

줄기-특이성 프로모터의 예는 비제한적으로 US 5,625,136 및 문헌[Bam et al.(2008)]에 기재된 것들을 포함한다.

하나의 실시태양에서, 프로모터는 뿌리 특이성 프로모터이다. 뿌리 특이성 프로모터의 예는 비제한적으로 산 키티나제 유전자에 대한 프로모터 및 CaMV 35S 프로모터의 특정한 서브도메인을 포함한다.

본 발명에 의해 고려되는 프로모터는 형질전환시키고자 하는 숙주 식물에 고유하거나 또는 또 다른 공급원으로부터 유래될 수 있으며, 이때 상기 영역은 상기 숙주 식물에서 기능성이다. 다른 공급원은 아그로박테리움(Agrobacterium) T-DNA 유전자, 예를 들어 노팔린, 옥타핀, 만노핀의 생합성을 위한 유전자의 프로모터 또는 다른 오핀 프로모터, 조직 특이성 프로모터(예를 들어 US 5,459,252 및 WO 91/13992를 참조하시오); 바이러스(숙주 특이성 바이러스 포함)로부터의 프로모터, 또는 부분적 또는 전적인 합성 프로모터를 포함한다. 외떡잎 및 쌍떡잎 식물에서 기능성인 다수의 프로모터가 당해 분야에 주지되어 있으며(예를 들어, 문헌[Greve, 1983]; [Salomon et al., 1984]; [Garfinkel et al., 1983]; [Barker et al., 1983]을 참조하시오); 식물 및 바이러스로부터 단리된 다양한 프로모터, 예를 들어 콜리플라워 모자이크 바이러스 프로모터(CaMV 35S, 19S)를 포함한다. 프로모터 활성에 대한 비제한적인 평가 방법이 하기의 문헌들에 개시되어 있다: Medberry et al. (1992, 1993), Sambrook et al. (1989, 상기) 및 US 5,164,316.

한편으로 또는 추가로, 프로모터는 예를 들어 식물의 적합한 발생 단계에서 도입된 폴리뉴클레오티드의 발현을 구동할 수 있는 유도성 프로모터 또는 발생 조절된 프로모터일 수 있다. 사용될 수 있는 다른 시스-작용 서열은 전사 및/또는 번역 인헨서를 포함한다. 인헨서 영역은 당해 분야의 숙련가에게 주지되어 있으며, ATG 번역 개시 코돈 및 인접 서열을 포함할 수 있다. 포함되는 경우, 개시 코돈은 전체 서열의 번역(번역되는 경우)이 보장되도록 외래 또는 외인성 폴리뉴클레오티드와 관련된 암호화 서열의 판독 프레임과 위상이 일치해야 한다. 번역 개시 영역은 상기 번역 개시 영역의 공급원으로부터, 또는 외래 또는 외인성 폴리뉴클레오티드로부터 제공될 수 있다. 서열은 또한 전사를 구동시키기 위해 선택된 프로모터의 공급원으로부터 유래될 수 있으며, mRNA의 번역을 증가시키기 위해 특별히 변형시킬 수 있다.

본 발명의 핵산 구조물은 전사 종결 서열을 포함할 수 있는 약 50 내지 1,000 뉴클레오티드 염기쌍으로부터의 3' 비-번역 서열을 포함할 수 있다. 3' 비-번역 서열은 폴리아데닐화 신호 및 mRNA 가공을 수행할 수 있는 임의의 다른 조절 신호를 포함할 수도, 포함하지 않을 수도 있는 전사 종결 신호를 함유할 수 있다. 폴리아데닐화 신호는 mRNA 전구체의 3' 단부에 폴리아데닐산 트랙의 부가를 위해 기능한다. 폴리아데닐화 신호는 정규 형태 5' AATAAA-3'에 대한 상동성의 존재에 의해 통상적으로 인식되지만 변화가 드물지 않다. 폴리아데닐화 신호를 포함하지 않는 전사 종결 서열은 4개 이상의 티미딘의 실행을 포함하는 PolI 또는 PolIII RNA 폴리머라제에 대한 종결자를 포함한다. 적합한 3' 비-번역 서열의 예는 아그로박테리움 튜메파시엔스(Agrobacterium tumefaciens)의 옥토핀 신타제(ocs) 유전자 또는 노팔린 신타제(nos) 유전자로부터의 폴리아데닐화 신호를 함유하는 3' 전사된 비-번역 영역이다(Bevan et al., 1983). 적합한 3' 비-번역 서열은 또한 식물 유전자, 예를 들어 리불로스-1,5-비스포스페이트 카복실라제(ss루비스코) 유전자로부터 유래될 수 있지만, 당해 분야의 숙련가들에게 공지된 다른 3' 요소도 또한 사용될 수 있다.

전사 개시 부위와 암호화 서열, 즉 번역되지 않은 5' 리더 서열(5'UTR)의 시작 사이에 삽입된 DNA 서열은 번역뿐만 아니라 전사되는 경우 유전자 발현에 영향을 미칠 수 있기 때문에, 특정한 리더 서열을 또한 사용할 수 있다. 적합한 리더 서열은 외래 또는 내인성 DNA 서열의 최적의 발현을 지시하도록 선택된 서열을 포함하는 것을 포함한다. 예를 들어, 상기와 같은 리더 서열은, 예를 들어 문헌[Joshi(1987)]에 기재된 바와 같이 mRNA 안정성을 증가시키거나 유지시킬 수 있고 번역의 부적합한 개시를 방지할 수 있는 바람직한 공통 서열을 포함한다.

벡터

본 발명은 유전자 구조물의 조작 또는 전달을 위한 벡터의 용도를 포함한다. 벡터는 외래 유전 물질을 또 다른 세포(여기에서 상기 물질이 복제되거나 발현될 수 있다)내로 인공적으로 운반하는데 사용될 수 있는 핵산 분자, 바람직하게는 DNA 분자이다. 외래 DNA를 함유하는 벡터를 "재조합 벡터"라 칭한다. 벡터의 예는 비제한적으로 플라스미드, 바이러스 벡터, 코스미드, 염색체외 요소, 미니염색체, 인공 염색체를 포함한다. 벡터는 전이 요소를 포함할 수 있다.

벡터는 바람직하게는 이중 가닥 DNA이며 하나 이상의 독특한 제한 부위를 함유하고 표적 세포 또는 조직 또는 그의 전구 세포 또는 조직을 포함한 한정된 숙주 세포에서 자율적으로 복제될 수 있거나, 또는 클로닝된 서열이 재현되도록 상기 한정된 숙주 세포의 게놈, 바람직하게는 핵 게놈(nuclear genome) 내에 통합될 수 있다. 상응하게, 벡터는 자율적으로 복제하는 벡터, 즉 염색체외 개체로서 존재하는 벡터(그의 복제는 염색체 복제와 독립적이다), 예를 들어 선형 또는 폐쇄된 환상 플라스미드, 염색체외 요소, 미니염색체, 또는 인공 염색체일 수 있다. 벡터는 자기-복제를 보장하는 임의의 수단을 함유할 수 있다. 한편으로, 벡터는 세포 내로 도입시 수용 세포의 게놈, 바람직하게는 핵 게놈에 통합되고 상기가 통합된 염색체(들)와 함께 복제되는 것일 수 있다. 벡터 시스템은 숙주 세포 내로 도입되는 전체 DNA, 또는 트랜스포손을 함께 함유하는 단일 벡터 또는 플라스미드, 2개 이상의 벡터 또는 플라스미드를 포함할 수 있다. 벡터의 선택은 전형적으로 상기 벡터가 도입되는 세포와의 양립성에 따라 변할 것이다. 벡터는 또한 선택 마커, 예를 들어 항생제 내성 유전자, 제초제 내성 유전자 또는 적합한 형질전환체의 선택에 사용될 수 있는 다른 유전자를 포함할 수 있다. 상기와 같은 유전자의 예는 당해 분야의 숙련가에게 주지되어 있다.

본 발명의 핵산 구조물을 벡터, 예를 들어 플라스미드 내로 도입시킬 수 있다. 플라스미드 벡터는 전형적으로 원핵생물 및 진핵생물 세포에서 발현 카세트의 용이한 선택, 증폭 및 형질전환을 제공하는 추가적인 핵산 서열을 포함한다, 예를 들어 pUC-유래된 벡터, pSK-유래된 벡터, pGEM-유래된 벡터, pSP-유래된 벡터, pBS-유래된 벡터, 또는 하나 이상의 T-DNA 영역을 함유하는 2원 벡터. 추가적인 핵산 서열은 벡터의 자율적인 복제를 제공하는 복제 기원, 바람직하게는 항생체 또는 제초제 내성을 암호화하는 선택성 마커 유전자, 핵산 서열 또는 핵산 구조물 중에서 암호화된 유전자를 삽입하기 위한 다수의 부위를 제공하는 독특한 다중 클로닝 부위, 및 원핵생물 및 진핵생물(특히 식물) 세포의 형질전환을 증대시키는 서열을 포함한다.

"마커 유전자"는 상기 마커 유전자를 발현하는 세포에 분명한 표현형을 부여하고 상기와 같이 형질전환된 세포를 상기 마커를 갖지 않는 세포와 구별할 수 있게 하는 유전자를 의미한다. 선택성 마커 유전자는 선택제(예를 들어 제초제, 항생제, 방사선, 열 또는 형질전환되지 않은 세포에 손상을 주는 다른 처리)에 대한 내성을 근거로 "선택"할 수 있는 특성을 부여한다. 선별성 마커 유전자(또는 리포터 유전자)는 관찰 또는 시험을 통해, 즉 "선별"에 의해 확인할 수 있는 특성(예를 들어 형질전환되지 않은 세포에는 존재하지 않는 β-글루쿠로니다제, 루시페라제, GFP 또는 다른 효소 활성)을 부여한다. 마커 유전자 및 관심 뉴클레오티드 서열을 연결할 필요는 없다.

형질전환체의 식별을 용이하게 하기 위해서, 핵산 구조물은 바람직하게는 외래 또는 외인성 폴리뉴클레오티드로서 또는 상기 외에, 선택성 또는 선별성 마커 유전자를 포함한다. 마커의 실제 선택은 상기가 숙주 세포, 바람직하게는 식물 숙주 세포와 함께 기능성(즉 선택성)인 한 중요하지 않다. 마커 유전자 및 외래 또는 외인성 관심 폴리뉴클레오티드를 연결할 필요는 없으며, 따라서 예를 들어 US 4,399,216에 기재된 바와 같이 연결되지 않은 유전자의 동시-형질전환이 또한 식물 형질전환에 효율적인 공정이다.

세균 선택성 마커의 예는 항생제 내성, 예를 들어 암피실린, 에리쓰로마이신, 클로람페니콜 또는 테트라사이클린 내성, 바람직하게는 카나마이신 내성을 부여하는 마커이다. 식물 형질전환체의 선택을 위한 예시적인 선택성 마커는 비제한적으로 하이그로마이신 B 내성을 암호화하는 hyg 유전자; 카나마이신, 파로모마이신, G418에 대한 내성을 부여하는 네오마이신 포스포트랜스퍼라제(nptII) 유전자; 예를 들어 EP 256223에 기재된 바와 같은, 글루타치온 유래된 제초제에 대한 내성을 부여하는 래트 간으로부터의 글루타치온-S-트랜스퍼라제 유전자; 예를 들어 WO 87/05327에 기재된 바와 같은, 과발현시 글루타민 신시타제 억제제, 예를 들어 포스피노트리신에 대한 내성을 부여하는 글루타민 신시타제 유전자; 예를 들어 EP 275957에 기재된 바와 같은, 선택제 포스피노트리신에 대한 내성을 부여하는 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes)로부터의 아세틸트랜스퍼라제 유전자; 예를 들어 문헌[Hinchee et al.(1988)]에 기재된 바와 같은, N-포스포노메틸글리신에 대한 내성을 부여하는 5-에놀쉬키메이트-3-포스페이트 신타제(EPSPS)를 암호화하는 유전자; 예를 들어 WO91/02071에 기재된 바와 같은 비알라포스에 대한 내성을 부여하는 bar 유전자; 브로목시닐에 대한 내성을 부여하는 클렙시엘라 오자에나에(Klebsiella ozaenae)로부터의 bxn과 같은 니트릴라제 유전자(Stalker et al., 1988); 메토트렉세이트에 대한 내성을 부여하는 디하이드로폴레이트 리덕타제(DHFR) 유전자(Thillet et al., 1988); 이미다졸리논, 설포닐우레아 또는 다른 ALS-억제 화학물질에 대한 내성을 부여하는 돌연변이 아세토락테이트 신타제 유전자(ALS)(EP 154,204); 5-메틸 트립토판에 대한 내성을 부여하는 돌연변이된 안트라닐레이트 신타제 유전자; 또는 제초제에 대한 내성을 부여하는 달라폰 데할로게나제 유전자를 포함한다.

바람직한 선별성 마커는 비제한적으로 다양한 발색성 기질이 공지되어 있는 β-글루쿠로니다제(GUS) 효소를 암호화하는 uidA 유전자; 발색성 기질이 공지되어 있는 효소를 암호화하는 β-갈락토시다제 유전자; 칼슘-민감성 생물발광 검출에 사용될 수 있는 아에쿠오린 유전자(Prasher et al., 1985); 녹색 형광 단백질 유전자(Niedz et al., 1995) 또는 그의 유도체; 생물발광 검출을 허용하는 루시페라제(luc) 유전자(Ow et al., 1986), 및 당해 분야에 공지된 다른 것들을 포함한다. 본 명세서에 사용되는 바와 같은 "리포터 분자"는 그의 화학적 성질에 의해, 단백질 생성물을 참조로 프로모터 활성의 측정을 용이하게 하는 분석적으로 식별 가능한 신호를 제공하는 분자를 의미한다.

바람직하게, 핵산 구조물을 예를 들어 식물의 게놈에 안정하게 통합시킨다. 상응하게, 핵산은 분자를 게놈내에 통합되게 하는 적합한 요소를 포함하거나, 또는 상기 구조물은 식물 세포의 염색체에 통합될 수 있는 적합한 벡터 중에 놓인다.

본 발명의 하나의 실시태양은 본 명세서에 정의된 적어도 하나의 폴리뉴클레오티드를 포함하고 상기 폴리뉴클레오티드를 숙주 세포내로 전달할 수 있는 재조합 벡터를 포함한다. 상기와 같은 벡터는 이종 핵산 서열, 즉 자연적으로 본 발명의 핵산 분자에 인접하여 발견되지 않고 바람직하게 상기 핵산 분자(들)가 유래되는 종 이외의 종으로부터 유래되는 핵산 서열을 함유한다. 벡터는 원핵생물 또는 진핵생물의 RNA 또는 DNA일 수 있으며, 전형적으로 바이러스 또는 플라스미드이다.

본 발명의 재조합 벡터는 융합 단백질로서 핵산 분자의 발현을 유도하는 융합 서열을 포함한다.

재조합 벡터는 또한 본 명세서에서 정의된 폴리뉴클레오티드의 핵산 서열 주변에 및/또는 상기 서열 내에 개재 및/또는 번역되지 않은 서열을 포함할 수 있다.

바람직하게, 재조합 벡터는 식물 세포와 같은 숙주 세포의 게놈에 안정하게 통합된다. 상응하게, 재조합 벡터는 상기 벡터가 게놈내에, 또는 세포의 염색체내에 통합되게 하는 적합한 요소를 포함할 수 있다.

재조합 세포

본 발명의 또 다른 실시태양은 본 발명의 하나 이상의 폴리뉴클레오티드, 구조물 또는 벡터로 형질전환된 숙주 세포, 또는 그의 자손 세포인 재조합 세포, 예를 들어 재조합 식물 세포를 포함한다. "재조합 세포"란 용어는 본 명세서에서 "트랜스제닉 세포"란 용어와 호환 가능하게 사용된다.

핵산 분자의 세포내로의 형질전환을, 핵산 분자를 세포내에 삽입할 수 있는 임의의 방법에 의해 수행할 수 있다. 형질전환 기법은 비제한적으로 형질감염, 일렉트로포레이션, 미세주입, 리포펙션, 흡착 및 원형질체 융합을 포함한다. 재조합 세포는 단세포로 남아있거나 또는 조직, 기관 또는 다세포 유기체로 성장할 수 있다. 본 발명의 형질전환된 핵산 분자는 염색체외에 남아있거나 또는 발현되는 능력이 유지되는 바와 같은 방식으로 형질전환된 세포의 염색체내 하나 이상의 부위에 통합될 수 있다.

바람직한 숙주 세포는 식물 세포, 보다 바람직하게는 곡류 식물의 세포, 보다 바람직하게는 보리 또는 밀세포, 및 훨씬 더 바람직하게는 밀세포이다.

재조합 세포는 배양물 중의 세포, 시험관내 세포, 또는 유기체, 예를 들어 식물, 또는 기관, 예를 들어 뿌리, 잎 또는 줄기 중의 세포일 수 있다. 바람직하게, 세포는 식물, 보다 바람직하게는 식물의 뿌리, 잎, 및/또는 줄기 중에 있다.

하나의 실시태양에서, 식물 세포에서 활성 NifDK의 발현은 NifD, NifK, NifH, NifB, NifE, NifN 및 임의로, NifU, NifS, NifO, NifV, NifY, NifW, 및/또는 NifZ의 발현을 요한다.

또 다른 또는 추가의 실시태양에서, 식물 세포에서 활성 NifH의 발현은 NifH 및 NifM 및 임의로, NifU 및/또는 NifN의 발현을 요한다.

하나의 실시태양에서, 식물 세포에서 니트로게나제 활성의 재편성은 적어도 NifD, NifK, NifH, NifB, NifE, NifN 및 NifM의 발현을 요한다.

숙련가는 Nif 단백질의 보다 작은 부분집합이 식물 세포에서 기능성 니트로게나제 재편성을 생성시킬 수 있음을 알 것이다. 발명자가 아는 한, 임의의 광합성 유기체로의 니트로게나제 유전자 전달에 관한 유일한 보고서는 클라미도모나스(Chlamydomonas)의 엽록체 게놈 중 NifH의 도입을 기재하였다(Cheng et al., 2005). NifH는 상기 NifH 생합성 전구체 단백질 NifM, NifS 및 NifU가 동시-발현되지 않는다는 사실에도 불구하고, 엽록소 생합성 돌연변이체를 보완할 수 있었다. 이는 내인성 진핵생물 균등체가 일부 Nif 단백질을 기능적으로 대체할 수 있음을 입증하였다. 실제로 최근의 보고서는 이 콜라이가 오직 8개의 Nif 단백질만을 사용하여 니트로게나제 기능을 재편성할 수 있음을 입증하였으며(Wang et al., 2013), 이는 식물에서 기능의 성취가 Nif 단백질의 전체 보체를 발현시키는 것보다 덜 복잡할 수 있음을 암시한다. 발명자는 아직도 식물체에서의 Nif 단백질의 기능을 확립시켜야 하지만, 생합성 및 기능성 Nif 단백질의 레퍼토리가 니트로게나제 기능을 잠재적으로 지지하는 환경에서 발현될 수 있다는 것은 유망한 것이다.

트랜스제닉 식물

명사로서 본 명세서에 사용되는 바와 같은 "식물"이란 용어는 전체 식물을 지칭하며 식물계의 임의의 구성원을 지칭하나, 형용사로서 사용되는 경우 식물 중에 존재하거나, 상기로부터 수득되거나, 상기로부터 유래되거나, 또는 상기와 관련되는 임의의 물질, 예를 들어 식물 기관(예를 들어 잎, 줄기, 뿌리, 꽃), 단세포(예를 들어 화분), 종자, 식물 세포 등을 지칭한다. 묘목 및 뿌리 및 새싹이 나타난 발아된 종자가 또한 "식물"의 의미내에 포함된다. 본 명세서에 사용되는 바와 같은 "식물 부분"이란 용어는 식물로부터 수득되고 상기 식물의 게놈 DNA를 포함하는 하나 이상의 식물 조직 또는 기관을 지칭한다. 식물 부분은 영양 구조(예를 들어 잎, 줄기), 뿌리, 꽃 기관/구조, 종자(배아, 떡잎 및 종자 코트 포함), 식물 조직(예를 들어 맥관 조직, 기본 조직 등), 세포 및 그의 자손을 포함한다. 본 명세서에 사용되는 바와 같은 "식물 세포"란 용어는 식물로부터 또는 식물 중에서 수득된 세포를 지칭하며 원형질체 또는 식물로부터 유래된 다른 세포, 생식세포-생성 세포, 및 전체 식물로 재생되는 세포를 포함한다. 식물 세포는 배양 중의 세포일 수 있다. "식물 조직"은 식물 중의 또는 식물로부터 수득된("외식편") 분화된 조직 또는 미성숙 또는 성숙 배아, 종자, 뿌리, 새싹, 열매, 괴경, 화분, 종양 조직, 예를 들어 뿌리혹, 및 다양한 형태의 배양 중 식물 세포의 응집, 예를 들어 캘러스로부터 유래된 미분화 조직을 의미한다. 종자 중의 또는 종자로부터의 예시적인 식물 조직은 떡잎, 배아 및 배축이다. 따라서 본 발명은 식물 및 식물 부분 및 이들을 포함하는 생성물을 포함한다.

본 명세서에 사용되는 바와 같이, "종자"란 용어는 수확 준비가 된 또는 식물로부터 수확된, 예를 들어 전형적으로 실지에서 상업적으로 수확된, 또는 수정후 및 종자 휴지가 확립되기에 앞서 및 수확전에 식물 중에 존재하는 "발생 종자"로서, 식물의 "성숙한 종자"를 지칭한다.

본 명세서에 사용되는 바와 같은 "트랜스제닉 식물"은 동일한 종, 변종 또는 품종의 야생형 식물에서 발견되지 않는 핵산 구조물을 함유하는 식물을 지칭한다. 즉, 트랜스제닉 식물(형질전환된 식물)은 상기 형질전환 전에는 함유하지 않았던 유전 물질(트랜스유전자)을 함유한다. 트랜스유전자는 식물 세포, 또는 또 다른 식물 세포, 또는 비-식물 공급원으로부터 수득되거나 또는 상기로부터 유래된 유전자 서열, 또는 합성 서열을 포함할 수 있다. 전형적으로, 트랜스유전자를 인간 조작에 의해, 예를 들어 형질전환에 의해 식물 내로 도입시켰으나, 당해 분야의 숙련가가 인정하는 임의의 방법을 사용할 수 있다. 유전 물질은 바람직하게는 식물의 게놈, 바람직하게는 핵 게놈 내로 안정하게 통합된다. 도입된 유전 물질은 동일한 종에서 자연적으로 존재하지만, 요소들의 재배열된 순서로 또는 상이한 배열로 존재하는 서열, 예를 들어 안티센스 서열을 포함할 수 있다. 상기와 같은 서열을 함유하는 식물은 본 명세서에서 "트랜스제닉 식물"에 포함된다.

바람직한 실시태양에서, 트랜스제닉 식물은 그의 자손이 목적하는 표현형 때문에 분리되지 않도록, 도입된 모든 유전자(트랜스유전자)에 대해 동형접합성이다. 트랜스제닉 식물은 또한 예를 들어 하이브리드 종자로부터 증식된 F1 자손에서와 같이, 도입된 트랜스유전자(들)에 대해 이형접합성일 수 있다. 상기와 같은 식물은 당해 분야에 주지된 하이브리드 활력과 같은 장점을 제공할 수 있다.

본 발명과 관련하여 정의된 바와 같은 트랜스제닉 식물은 재조합 기법을 사용하여 유전자 변형시킨 식물의 자손을 포함하며, 여기에서 상기 자손은 관심 트랜스유전자를 포함한다. 상기와 같은 자손은 1차 트랜스제닉 식물의 자가수정에 의해 또는 상기와 같은 식물과 같은 종의 또 다른 식물과의 이종교배에 의해 수득될 수 있다. 이는 일반적으로 목적하는 식물 또는 식물 기관에서의 본 명세서에서 정의된 적어도 하나의 단백질의 생성을 조절할 수 있다. 트랜스제닉 식물 부분은 상기 트랜스유전자를 포함하는 식물의 모든 부분 및 세포, 예를 들어 배양된 조직, 캘러스 및 원형질체를 포함한다.

트랜스제닉 식물을 당해 분야에 공지된 기법, 예를 들어 하기의 문헌들에 일반적으로 기재된 기법을 사용하여 생성시킬 수 있다: A. Slater et al., Plant Biotechnology - The Genetic Manipulation of Plants, Oxford University Press (2003), 및 P. Christou and H. Klee, Handbook of Plant Biotechnology, John Wiley and Sons (2004).

"비-트랜스제닉 식물"은 재조합 DNA 기법에 의한 유전 물질의 도입에 의해 유전자 변형되지 않은 것이다. 본 명세서에 사용되는 바와 같이, "동질 식물과 비교하여"란 용어 또는 유사한 어구는 트랜스제닉 식물에 비해 동질이지만 관심 트랜스유전자는 없는 식물을 지칭한다. 바람직하게, 상응하는 비-트랜스제닉 식물은 관심 트랜스제닉 식물의 선조, 또는 상기 구조물이 없는 동기 식물계통(종종 "분리개체"라 칭한다)과 동일한 품종 또는 변종의 식물, 또는 "빈 벡터" 구조물로 형질전환된 동일한 품종 또는 변종의 식물이며, 비-트랜스제닉 식물일 수 있다. 본 명세서에 사용되는 바와 같은 "야생형"은 본 발명에 따라 변형되지 않은 세포, 조직 또는 식물을 지칭한다. 야생형 세포, 조직 또는 식물을, 외인성 핵산의 발현 수준 또는 특성 변형의 정도 및 성질을 본 명세서에 기재된 바와 같이 변형된 세포, 조직 또는 식물과 비교하기 위한 대조군으로서 사용할 수 있다.

본 발명과 관련하여 정의된 바와 같은 트랜스제닉 식물은 재조합 기법을 사용하여 유전자 변형시킨 식물의 자손을 포함하며, 여기에서 상기 자손은 관심 트랜스유전자를 포함한다. 상기와 같은 자손은 1차 트랜스제닉 식물의 자가수정에 의해 또는 상기와 같은 식물과 같은 종의 또 다른 식물과의 이종교배에 의해 수득될 수 있다. 트랜스제닉 식물 부분은 상기 트랜스유전자를 포함하는 식물의 모든 부분 및 세포, 예를 들어 배양된 조직, 캘러스 및 원형질체를 포함한다.

본 발명의 실시에서 사용이 고려되는 식물은 외떡잎 및 쌍떡잎 식물 모두를 포함한다. 표적 식물은 비제한적으로 하기를 포함한다: 곡류(예를 들어, 밀, 보리, 호밀, 귀리, 벼, 옥수수, 수수 및 관련 작물); 포도; 비트(사탕무 및 사료용 비트); 이과, 핵과 및 씨없는 작은 열매(사과, 배, 자두, 복숭아, 아몬드, 체리, 딸기, 라즈베리 및 블랙베리); 콩과 식물(콩, 렌틸콩, 완두콩, 대두); 오일 식물(평지씨 또는 다른 배추속 식물, 겨자, 양귀비, 올리브, 해바라기, 잇꽃, 아마, 코코넛, 피마자오일 식물, 코코아 빈, 땅콩); 오이과 식물(호박, 오이, 멜론); 섬유 식물(면, 아마, 삼베, 황마); 시트러스 열매(오렌지, 레몬, 자몽, 만다린); 채소(시금치, 상추, 아스파라거스, 양배추, 당근, 양파, 토마토, 감자, 파프리카); 녹나무과(아보카도, 계피, 장뇌); 또는 옥수수, 담배, 너트류, 커피, 사탕수수, 차, 포도나무, 홉, 잔디, 바나나 및 천연고무 식물뿐만 아니라 장식용 식물(꽃, 관목, 활엽수 및 침엽수, 예를 들어 구과식물)과 같은 식물. 바람직하게 식물은 곡류 식물, 보다 바람직하게 밀, 벼, 옥수수, 라이밀, 귀리 또는 보리, 훨씬 더 바람직하게는 밀이다.

본 명세서에 사용되는 바와 같이, "밀"이란 용어는 트리티쿰(Triticum) 속의 임의의 종 및 그의 선조뿐만 아니라 다른 종과의 이종 교배에 의해 생성된 그의 자손을 지칭한다. 밀은 42개의 염색체로 구성된, AABBDD의 게놈 구조를 갖는 "6배체 밀", 및 28개의 염색체로 구성된, AABB의 게놈 구조를 갖는 "4배체 밀"을 포함한다. 6배체 밀은 티 아에스티붐(T. aestivum), 티 스펠타(T. spelta), 티 마차(T. macha), 티 콤팍툼(T. compactum), 티 스파에로코쿰(T. sphaerococcum), 티 바빌로비이(T. vavilovii) 및 그의 종간 교배물을 포함한다. 6배체의 바람직한 종은 티 아에스티붐 ssp 아에스티붐(또한 "빵밀"이라 칭한다)이다. 4배체 밀은 티 두룸(T. durum)(또한 본 명세서에서 두룸밀 또는 트리티쿰 투르기둠 ssp 두룸(Triticum turgidum ssp. durum)으로서 지칭된다), 티 디코코이데스(T. dicoccoides), 티 디코쿰(T. dicoccum), 티 폴로니쿰(T. polonicum) 및 그의 종간 교배를 포함한다. 또한, "밀"이란 용어는 6배체 또는 4배체 트리티쿰 스페시즈, 예를 들어 A 게놈의 경우 티 우아르투(T. uartu), 티 모노코쿰(T. monococcum) 또는 티 보에오티쿰(T. boeoticum), B 게놈의 경우 아에길롭스 스펠토이데스(Aegilops speltoides), 및 D 게놈의 경우 티 타우스키이(T. tauschii)(또한 아에길롭스 스쿠아로사(Aegilops squarrosa) 또는 아에길롭스 타우스키이(Aegilops tauschii)로서 공지됨)의 잠재적인 선조를 포함한다. 특히 바람직한 선조는 A 게놈의 선조이며, 훨씬 더 바람직하게 상기 A 게놈 선조는 티 모노코쿰이다. 본 발명에 사용하기 위한 밀 품종은 비제한적으로 상기 나열된 종들 중 어느 하나에 속할 수 있다. 또한 비-트리쿰 종(예를 들어 호밀[세칼레 세레알레(Secale cereale)]), 예를 들어 비제한적으로 트리티칼레(Triticale)와의 생식 교배에서 부모로서 트리티쿰 스페시즈를 사용하는 통상적인 기법에 의해 생성된 식물이 포함된다.

본 명세서에 사용되는 바와 같이, "보리"란 용어는 호르데움(Hordeum) 속의 임의의 종 및 그의 선조뿐만 아니라 다른 종과의 이종 교배에 의해 생성된 그의 자손을 지칭한다. 상기 식물은 상업적으로 재배되는 호르데움 종, 예를 들어 호르데움 불가레(Hordeum vulgare)의 균주 또는 품종 또는 변종, 또는 상업적인 그레인 생산에 적합한 것이 바람직하다.

세포내 유전자의 직접적인 전달을 위한 4개의 일반적인 방법이 기재되었다: (1) 화학적 방법(Graham et al., 1973); (2) 물리적 방법, 예를 들어 미세주입(Capecchi, 1980); 일렉트로포레이션(예를 들어 WO 87/06614, US 5,472,869, 5,384,253, WO 92/09696 및 WO 93/21335를 참조하시오); 및 유전자 총법(예를 들어 US 4,945,050 및 US 5,141,131을 참조하시오); (3) 바이러스 벡터(Clapp, 1993; Lu et al., 1993; Eglitis et al., 1988); 및 (4) 수용체-매개된 기전(Curiel et al., 1992; Wagner et al., 1992).

사용될 수 있는 가속화 방법은 예를 들어 미세발사체 충격 등을 포함한다. 형질전환 핵산 분자를 식물 세포에 전달하기 위한 방법의 일례는 미세발사체 충격이다. 상기 방법은 문헌[Yang et al., Particle Bombardment Technology for Gene Transfer, Oxford Press, Oxford, England (1994)]에서 리뷰되었다. 비-생물학적 입자(미세발사체)를 핵산으로 코팅하고 추진력에 의해 세포내로 전달할 수 있다. 예시적인 입자는 텅스텐, 금, 백금 등으로 구성된 것을 포함한다. 미세발사체 충격의 특정한 장점은 상기가 외떡잎식물을 재현 가능하게 형질전환시키는 유효한 수단인 것 외에, 원형질체의 단리도, 아그로박테리움 감염의 감수성도 필요로 하지 않는다는 것이다. 본 발명에 사용하기에 적합한 입자 전달 시스템은 헬륨 가속화 PDS-1000/He 건이며, 바이오 래드 레보라토리즈(Bio-Rad Laboratories)로부터 입수할 수 있다. 상기 충격을 위해서, 미성숙 배아 또는 유래된 표적 세포, 예를 들어 미성숙 배아로부터의 배반 또는 캘러스를 고체 배양 배지상에 배열할 수 있다.

또 다른 대안의 실시태양에서, 색소체를 안정하게 형질전환시킬 수 있다. 고등 식물에서의 색소체 형질전환에 대해 개시된 방법은 선택성 마커를 함유하는 DNA의 입자 총 전달 및 상기 DNA의 상동성 재조합을 통한 색소체 게놈에의 표적화를 포함한다(US 5,451,513, US 5,545,818, US 5,877,402, US 5,932479, 및 WO 99/05265).

아그로박테리움-매개된 전달은, DNA를 전체 식물 조직 내로 도입시킴으로써 원형질체로부터 완전한 식물 재생 요구를 우회할 수 있기 때문에 유전자를 식물 세포 내로 도입시키는데 널리 적용 가능한 시스템이다. DNA를 식물 세포 내로 도입시키기 위한 아그로박테리움-매개된 식물 통합 벡터의 용도는 당해 분야에 주지되어 있다(예를 들어 US 5,177,010, US 5,104,310, US 5,004,863, US 5,159,135를 참조하시오). 추가로, T-DNA의 통합은 재배열을 거의 생성시키지 않는 비교적 정확한 공정이다. 전달되는 DNA의 영역은 경계 서열에 의해 한정되며, 개재 DNA가 대개 식물 게놈내에 삽입된다.

아그로박테리움 형질전환 벡터는 이 콜라이뿐만 아니라 아그로박테리움에서 복제 가능하며, 이는 기재된 바와 같이 편리한 조작을 허용한다(Klee et al., Plant DNA Infectious Agents, Hohn and Schell, (editors), Springer-Verlag, New York, (1985): 179-203). 더욱이, 아그로박테리움-매개된 유전자 전달을 위한 벡터의 기술적 진보는 벡터 중 유전자 및 제한 부위의 재배열을 개선시켜 다양한 폴리펩티드 암호화 유전자를 발현할 수 있는 벡터의 구성을 용이하게 하였다. 기재된 벡터는 삽입된 폴리펩티드 암호화 유전자의 직접적인 발현에 편리한 프로모터 및 폴리아데닐화 부위가 인접한 다중-링커 영역을 가지며 본 목적에 적합하다. 또한, 무장된 및 무장해제된 Ti 유전자를 모두 함유하는 아그로박테리움을 형질전환에 사용할 수 있다. 아그로박테리움-매개된 형질전환이 효율적인 식물 변종에서, 상기는 유전자 전달의 용이하고 한정된 성질로 인해 선택되는 방법이다.

아그로박테리움 형질전환 방법을 사용하여 형성된 트랜스제닉 식물은 전형적으로 하나의 염색체상에 단일 유전자좌를 함유한다. 상기와 같은 트랜스제닉 식물을, 부가된 유전자에 대해 반접합유전자인 것으로 지칭할 수 있다. 부가된 구조 유전자에 대해 동형접합성인 트랜스제닉 식물, 즉 염색체쌍의 각 염색체상의 동일한 유전자좌에 유전자 하나씩, 2개의 부가된 유전자를 함유하는 트랜스제닉 식물이 보다 바람직하다. 동형적합성 트랜스제닉 식물을, 단일의 부가된 유전자를 함유하는 독립적인 분리개체 트랜스제닉 식물을 생식 짝짓기(자가생식)하고, 생성된 종자의 일부를 발아시키고, 생성된 식물을 관심 유전자에 대해 분석함으로써 수득할 수 있다.

2개의 상이한 트랜스제닉 식물을 또한 짝짓기하여 2개의 독립적으로 분리된 외인성 유전자를 함유하는 자손을 생성시킬 수 있음을 또한 이해해야 한다. 적합한 자손의 자가생식은 2개의 외인성 유전자 모두에 동형적합성인 식물을 생성시킬 수 있다. 모 식물에 대한 역-교배 및 비-트랜스제닉 식물과의 이종교배가 또한, 영양 번식에서처럼 고려된다. 상이한 특성 및 작물에 통상적으로 사용되는 다른 번식 방법에 대한 설명을 하기의 문헌에서 찾을 수 있다: Fehr, Breeding Methods for Cultivar Development, J. Wilcox (editor) American Society of Agronomy, Madison Wis. (1987).

식물 원형질체의 형질전환을 칼슘 포스페이트 침전, 폴리에틸렌 글리콜 처리, 일렉트로포레이션 및 이들 처리의 조합에 기반한 방법을 사용하여 성취할 수 있다. 이들 시스템을 상이한 식물 변종에 적용하는 것은 원핵생물로부터 특정한 식물 균주를 재생시키는 능력에 따라 변한다. 원형질체로부터 곡류의 재생을 위한 예시적인 방법이 기재되어 있다(Fujimura et al., 1985; Toriyama et al., 1986; Abdullah et al., 1986).

다른 세포 형질전환 방법을 또한 사용할 수 있으며, 여기에는 비제한적으로 화분내 직접적인 DNA 전달, 식물의 번식 기관내 DNA의 직접적인 주입, 또는 미성숙 배아 세포내 DNA의 직접적인 주입에 이은 건조된 배아의 재수화에 의한 DNA의 식물 내로의 도입이 포함된다.

단일 식물 원형질체 형질전환체로부터 또는 다양한 형질전환된 외식편으로부터 식물의 재생, 성장 및 재배는 당해 분야에 주지되어 있다(Weissbach et al., Methods for Plant Molecular Biology, Academic Press, San Diego, (1988)). 상기 재생 및 생장 과정은 전형적으로 형질전환된 세포의 선택, 뿌리내린 묘목 단계를 통한 통상적인 배발생 단계를 통해 개별화된 세포를 배양하는 단계를 포함한다. 트랜스제닉 배아 및 종자는 유사하게 재생된다. 그 후에 생성된 트랜스제닉 뿌리내린 새싹을 토양과 같은 적합한 식물 생장 배지에 심는다.

외래의 외인성 유전자를 함유하는 식물의 성장 또는 재생은 당해 분야에 주지되어 있다. 바람직하게, 재생된 식물을 자가-수분하여 동형접합성 트랜스제닉 식물을 제공한다. 달리, 재생된 식물로부터 수득된 화분을 작물학적으로 중요한 계통의 종자-번식된 식물에 교배한다. 환언하면, 이들 중요한 계통의 식물로부터의 화분을 사용하여 재생 식물을 수분한다. 목적하는 외인성 핵산을 함유하는 본 발명의 트랜스제닉 식물을 당해 분야의 숙련가에게 주지된 방법을 사용하여 재배한다.

주로 아그로박테리움 튜마파시엔스의 사용에 의한 쌍떡잎 식물의 형질전환 방법, 및 트랜스제닉 식물의 수득이 목화(US 5,004,863, US 5,159,135, US 5,518,908); 대두(US 5,569,834, US 5,416,011); 배추속 식물(US 5,463,174); 땅콩(Cheng et al., 1996); 및 완두콩(Grant et al., 1995)에 대해 공개되었다.

외인성 핵산의 도입에 의한 식물내 유전자 변이의 도입 및 원형질체 또는 미성숙 식물 배아로부터 식물의 재생을 위한 곡류 식물, 예를 들어 밀 및 보리의 형질전환 방법이 당해 분야에, 예를 들어 CA 2,092,588, AU 61781/94, AU 667939, US 6,100,447, WO 97/048814, US 5,589,617, US 6,541,257에 주지되어 있으며, 다른 방법이 WO 99/14314에 나열되어 있다. 바람직하게, 트랜스제닉 밀 또는 보리 식물을 아그로박테리움 튜메파시엔스 매개된 형질전환 과정에 의해 생성시킨다. 목적하는 핵산 구조물을 운반하는 벡터를 조직 배양된 식물 또는 외식편, 또는 원형질체와 같은 적합한 식물계의 재생 가능한 밀 세포 내로 도입시킬 수 있다. 재생 가능한 밀 세포는 바람직하게는 미성숙 배아의 배반, 성숙 배아, 이들로부터 유래된 캘러스, 또는 분열 조직으로부터 유래한다.

트랜스제닉 세포 및 식물 중 트랜스유전자의 존재를 확인하기 위해서, 폴리머라제 쇄 반응(PCR) 증폭 또는 서던 블럿 분석을 당해 분야의 숙련가들에게 공지된 방법을 사용하여 수행할 수 있다. 트랜스유전자의 발현 생성물을 상기 생성물의 성질에 따라 다양한 방식 중 어느 하나로 검출할 수 있으며, 웨스턴 블럿 및 효소 분석을 포함한다. 단백질 발현을 정량분석하고 상이한 식물 조직에서 복제를 검출하는데 특히 유용한 하나의 방식은 리포터 유전자, 예를 들어 GUS를 사용하는 것이다. 일단 트랜스제닉 식물이 수득되었으면, 이를 생장시켜 목적하는 표현형을 갖는 식물 조직 또는 부분을 생성시킬 수 있다. 식물 조직 또는 식물 부분을 수확하고/하거나 종자를 수집할 수 있다. 종자는 목적하는 특성을 갖는 조직 또는 부분을 갖는 추가적인 식물의 생장을 위한 공급원으로서 작용할 수 있다.

"폴리머라제 쇄 반응"("PCR")은 "상류" 및 "하류" 프라이머로 이루어지는 "프라이머쌍" 또는 "프라이머 세트", 및 중합 촉매, 예를 들어 DNA 폴리머라제, 및 전형적으로 열-안정성 폴리머라제 효소를 사용하는 표적 폴리뉴클레오티드로 구성된 사본을 복제하는 반응이다. PCR 방법은 당해 분야에 공지되어 있으며, 예를 들어 문헌["PCR" (M.J. McPherson and S.G Moller (editors), BIOS Scientific Publishers Ltd, Oxford, (2000))]에 교시되어 있다. PCR을 본 발명의 폴리뉴클레오티드를 발현하는 식물 세포로부터 단리된 mRNA의 역 전사로부터 획득된 cDNA상에서 수행할 수 있다. 그러나, PCR을 식물로부터 단리된 게놈 DNA상에서 수행하는 것이 일반적으로 더 용이할 것이다.

프라이머는, 표적 서열에 서열 특이적인 방식으로 하이브리드화할 수 있고 PCR 동안 연장될 수 있는 올리고뉴클레오티드 서열이다. 앰플리콘 또는 PCR 산물 또는 PCR 단편 또는 증폭 산물은 프라이머 및 표적 서열의 새로 합성된 사본을 포함하는 연장 생성물이다. 멀티플렉스 PCR 시스템은 하나 초과의 앰프리콘을 동시에 생성시키는 다중 프라이머 세트를 함유한다. 프라이머를 표적 서열에 완벽하게 합치시킬 수 있거나 또는 상기는 특정한 표적 서열에 제한 효소 또는 촉매적 핵산 인식/절단 부위를 도입시킬 수 있는 내부 오합치된 염기를 함유할 수 있다. 프라이머는 또한 추가적인 서열을 함유하고/하거나 변형된 또는 표지된 뉴클레오티드를 함유하여 앰플리콘의 포획 또는 검출을 용이하게 한다. DNA의 열 변성의 반복된 주기, 프라이머의 그의 상보성 서열에의 어닐링 및 폴리머라제에 의한 어닐링된 프라이머의 연장은 표적 서열의 기하급수적인 증폭을 생성시킨다. 표적 또는 표적 서열 또는 주형이란 용어는 증폭되는 핵산 서열을 지칭한다.

뉴클레오티드 서열의 직접적인 서열분석 방법은 당해 분야의 숙련가에게 주지되어 있으며 예를 들어 상기 문헌[Ausubel et al.] 및 [Sambrook et al.]에서 찾을 수 있다. 서열분석을 임의의 적합한 방법, 예를 들어 디데옥시 서열분석, 화학적 서열분석 또는 이들의 변형에 의해 수행할 수 있다. 직접적인 서열분석은 특정 서열의 임의의 염기쌍의 변화를 측정하는 장점이 있다.

식물/그레인 가공

본 발명의 그레인/종자, 바람직하게는 곡류 그레인, 또는 본 발명의 다른 식물 부분을 당해 분야에 공지된 임의의 기법을 사용하여 가공하여 식품 성분, 식품 또는 비-식품 생성물을 제조할 수 있다.

하나의 실시태양에서, 생성물은 통밀가루, 예를 들어 초미세 분쇄된 통밀가루, 또는 약 100%의 그레인으로 제조된 밀가루이다. 통밀가루는 정제된 밀가루 구성분(정제된 밀가루 또는 정제된 밀가루) 및 거친 분획(초미세 분쇄된 거친 분획)을 포함한다.

정제된 밀가루는 예를 들어 세척된 그레인, 예를 들어 밀 또는 보리 그레인을 분쇄하고 걸러 제조한 밀가루일 수 있다. 정제된 밀가루의 입자 크기는 98% 이상이 "212 마이크로미터(U.S. Wire 70)"로 표시된 우븐 망포의 구멍 이하의 구멍을 갖는 천을 통과하는 밀가루로서 기재된다. 거친 분획은 겨 및 배아 중 적어도 하나를 포함한다. 예를 들어, 배아는 낟알내에서 발견되는 배아 식물이다. 배아는 지질, 섬유질, 비타민, 단백질, 무기질 및 식물영양소, 예를 들어 플라보노이드를 포함한다. 겨는 다수의 세포층을 포함하며 상당량의 지질, 섬유질, 비타민, 단백질, 무기질 및 식물영양소, 예를 들어 플라보노이드를 갖는다. 추가로, 거친 분획은 호분층을 포함할 수 있으며 상기 층도 또한 지질, 섬유질, 비타민, 단백질, 무기질 및 식물영양소, 예를 들어 플라보노이드를 포함한다. 호분층은 기술적으로는 배젖의 부분으로 간주되지만, 겨와 동일한 특징 중 다수를 나타내며 따라서 전형적으로는 분쇄 공정 동안 겨 및 배아와 함께 제거된다. 호분층은 단백질, 비타민 및 식물영양소, 예를 들어 페룰산을 함유한다.

추가로, 거친 분획을 정제된 밀가루 구성성분과 블렌딩할 수 있다. 거친 분획을 정제된 밀가루 구성성분과 혼합하여 통밀가루를 형성시켜, 정제된 밀가루에 비해 증가된 영양가, 섬유 함량, 및 산화방지 능력을 갖는 통밀가루를 제공할 수 있다. 예를 들어, 거친 분획 또는 통밀가루를 다양한 양으로 사용하여 베이크드 상품, 스낵 제품, 및 식료품 중의 정제된 또는 통밀가루를 대체할 수 있다. 본 발명의 통밀가루(즉 초미세 분쇄된 통밀가루)를 또한 소비자의 홈메이드 베이크드 제품에 사용하기 위해 소비자에게 직접 판매할 수 있다. 예시적인 실시태양에서, 통밀가루의 과립화 프로파일은 통밀가루 입자의 98 중량%가 212 마이크로미터 미만이도록 하는 것이다.

추가의 실시태양에서, 통밀가루 및/또는 거친 분획의 겨 및 배아내에서 발견되는 효소를, 상기 통밀가루 및/또는 거친 분획의 안정화를 위해 불활성화시킨다. 안정화는 증기, 열, 방사선, 또는 겨 및 배아층 중에서 발견되는 효소를 불활성화시키기 위한 다른 처리를 사용하는 공정이다. 안정화된 밀가루는 그의 조리 특성을 유지하며 보다 긴 저장수명을 갖는다.

추가의 실시태양에서, 통밀가루, 거친 분획 또는 정제된 밀가루는 식품 생성물의 성분(재료)일 수 있으며 식품 생성물의 제조에 사용될 수 있다. 예를 들어, 식품 생성물은 베이글, 비스킷, 빵, 번, 크루와상, 덤플링, 잉글리쉬 머핀, 머핀, 피타빵, 퀵브레드, 냉장/동결된 반죽 제품, 반죽, 베이크드 빈즈, 부리토, 칠리, 타코, 타말레, 토르티야, 포트 파이, 조리 완료된 곡류, 조리 완료된 고기, 스터핑, 전자레인지용 식사, 브라우니, 케이크, 치즈케이크, 커피 케이크, 쿠키, 디저트, 패스트리, 스위트롤, 막대 사탕, 파이 크러스트, 파이 속, 이유식, 베이킹 믹스, 튀김옷, 브레딩, 그레이비 믹스, 고기 증량제, 고기 대용물, 시즈닝 믹스, 수프 믹스, 그레이비, 루, 샐러드 드레싱, 수프, 사워 크림, 국수, 파스타, 라멘 국수, 차우멘 국수, 로메인 국수, 아이스크림 포함물, 막대 아이스크림, 아이스크림콘, 아이스크림 샌드위치, 크래커, 크루통, 도넛, 에그롤, 압출 스낵, 과일곡물 바, 전자레인지용 스낵 제품, 영양바, 팬케이크, 초벌 구이 베이커리 제품, 프레첼, 푸딩, 그래놀라 베이스 제품, 스낵칩, 스낵 식품, 스낵 믹스, 와플, 피자 크러스트, 동물 사료 또는 펫 푸드일 수 있다.

또 다른 실시태양에서, 통밀가루, 정제된 밀가루 또는 거친 분획은 영양 보충물의 성분일 수 있다. 예를 들어, 영양 보충물은 하나 이상의 추가적인 성분, 전형적으로 비타민, 무기질, 허브, 아미노산, 효소, 산화방지제, 허브, 향신료, 프로바이오틱스, 추출물, 프리바이오틱스 및 섬유질을 포함한 성분을 함유하는 식사에 첨가되는 제품일 수 있다. 본 발명의 통밀가루, 정제된 밀가루 또는 거친 분획은 비타민, 무기질, 아미노산, 효소 및 섬유질을 포함한다. 예를 들어, 거친 분획은 농축된 양의 식이섬유뿐만 아니라 다른 필수 영양소, 예를 들어 B-비타민, 셀레늄, 크로뮴, 망간, 마그네슘 및 산화방지제(이들은 건강한 식사에 필수적이다)를 함유한다. 예를 들어 22 그램의 본 발명의 거친 분획은 섬유질의 개인 1일 권장소비의 33%를 전달한다. 영양 보충물은 개인의 전반적인 건강에 도움을 주는 임의의 공지된 영양 성분을 포함할 수 있으며, 예를 들어 비제한적으로 비타민, 무기질, 다른 섬유질 성분, 지방산, 산화방지제, 아미노산, 펩티드, 단백질, 루테인, 리보스, 오메가-3 지방산, 및/또는 다른 영양 성분을 포함한다. 보충물을 비제한적으로 하기의 형태로 전달할 수 있다: 인스턴트 음료 믹스, 바로 마실 수 있는 음료, 영양바, 웨이퍼, 쿠키, 크래커, 젤샷, 캡슐, 츄잉검, 츄잉정, 및 환제. 하나의 실시태양은 섬유질 보충물을 풍미 쉐이크 또는 맥아형 음료의 형태로 전달하며, 상기 실시태양은 어린이용 섬유질 보충물로서 특히 매력적일 수 있다.

추가적인 실시태양에서, 분쇄 공정을 사용하여 멀티그레인 밀가루 또는 멀티그레인 거친 분획을 제조할 수 있다. 예를 들어, 한 가지 유형의 그레인으로부터의 겨 및 배아를 분쇄하고 또 다른 곡물 유형의 분쇄된 배젖 또는 통밀가루와 블렌딩할 수 있다. 한편으로 한 가지 유형의 그레인의 겨 및 배아를 분쇄하고 또 다른 유형의 그레인의 분쇄된 배젖 또는 통밀가루와 블렌딩할 수 있다. 본 발명은 한 가지 이상 그레인의 겨, 배아, 배젖, 및 통밀가루 중 하나 이상의 임의의 조합을 혼합함을 포함함을 고려한다. 상기 멀티그레인 접근법을 사용하여 주문제작 밀가루를 제조하고 한 가지 밀가루의 제조에 다수 유형의 곡물 그레인의 품질 및 영양 함량을 활용할 수 있다.

본 발명의 통밀가루, 거친 분획 및/또는 그레인 생성물을 당해 분야에 공지된 임의의 분쇄 공정에 의해 생성시킬 수 있음이 고려된다. 예시적인 실시태양은 그레인의 배젖, 겨 및 배아를 별도의 스트림으로 분리시키지 않고 그레인을 단일 스트림으로 분쇄함을 수반한다. 깨끗하고 단련된 그레인을 1차 통과 분쇄기, 예를 들어 햄머밀, 롤러밀, 핀밀, 충격밀, 디스크밀, 공기분쇄 밀, 갭밀 등으로 운반한다. 분쇄 후에, 그레인을 배출하고 시프터로 운반한다. 추가로, 본 발명의 통밀가루, 거친 분획 및/또는 그레인 생성물을 다수의 다른 공정, 예를 들어 발효, 인스턴트화, 압출, 캡슐화, 토스팅, 로스팅 등에 의해 변형시키거나 향상시킬 수 있음이 고려된다.

맥아제조

본 발명에 의해 제공되는 맥아-기반 음료는 출발 물질의 일부 또는 전체로서 맥아를 사용하여 생성시킨 알콜 음료(증류 음료 포함) 및 비-알콜 음료를 수반한다. 예로는 맥주, 발포주(저-맥아 맥주 음료), 위스키, 저-알콜 맥아-기반 음료(예를 들어 1% 미만의 알콜을 함유하는 맥아-기반 음료), 및 비-알콜 음료를 포함한다.

맥아제조는 보리 및 밀 그레인과 같은 그레인의 조절된 침지 및 발아에 이은 건조의 공정이다. 상기 사건의 순서는 주로 죽은 배젖 세포벽을 해중합시키고 그레인 영양소를 동원하는 공정인 그레인 변형을 야기하는 다수 효소의 합성에 중요하다. 후속의 건조 공정에서, 화학적 갈변 반응으로 인해 풍미와 색상이 발생한다. 맥아의 주요 용도는 음료 생산이지만, 상기를 또한 다른 산업 공정에, 예를 들어 베이킹 산업에서 효소원으로서 또는 식품 산업에서 풍미 및 착색제로서, 예를 들어 맥아로서 또는 맥아가루로서, 또는 간접적으로 맥아 시럽 등으로서 사용할 수 있다.

하나의 실시태양에서, 본 발명은 맥아 조성물의 제조 방법에 관한 것이다. 상기 방법은 바람직하게는

(i) 본 발명의 그레인, 예를 들어 보리 또는 밀 그레인을 제공하고,

(ii) 상기 그레인을 침지하고,

(iii) 상기 침지된 그레인을 소정의 조건하에서 발아시키고,

(iv) 상기 발아된 그레인을 건조시키는

단계들을 포함한다.

예를 들어, 맥아를 문헌[Hoseney, Principles of Cereal Science and Technology, Second Edition, 1994: American Association of Cereal Chemists, St. Paul, Minn.]에 기재된 방법 중 어느 하나에 의해 생성시킬 수 있다. 그러나, 맥아 생성에 적합한 임의의 다른 방법, 예를 들어 전문 맥아의 제조 방법, 예를 들어 비제한적으로 맥아의 로스팅 방법을 또한 본 발명과 함께 사용할 수 있다.

맥아는 주로 맥주의 양조뿐만 아니라 증류주의 제조에 사용된다. 양조는 맥아즙 생산, 주 및 부 발효 및 후-처리를 포함한다. 먼저 맥아를 분쇄하고 수중에서 교반하고 가열한다. 이러한 "담금" 동안, 맥아제조에서 활성화된 효소가 커넬의 전분을 발효성 당으로 분해시킨다. 생성된 맥아즙을 둥명화하고, 효모를 가하고, 혼합물을 발효시키고 후-처리를 수행한다.

니트로게나제 복합체의 검출

니트로게나제 복합체의 검출을, NifDK 단백질 복합체와 NifH 단백질간의 상호작용의 검출을 허용하는 임의의 방법에 의해 수행할 수 있다. NifDK 단백질 복합체와 NifH 단백질간의 상호작용의 검출에 적합한 방법은 공-면역침전, 친화성 블럿팅, 풀다운, FRET 등을 포함하여 단백질-단백질 상호작용의 검출에 대해 당해 분야에 공지된 임의의 방법을 포함한다.

한편으로, 니트로게나제 복합체의 검출을, 생성되는 니트로게나제 복합체의 활성을 측정함으로써 수행할 수 있다.

니트로게나제 활성의 측정에 적합한 방법은 2질소의 암모니아로의 효소적 환원의 검출에 대해 당해 분야에 공지된 임의의 방법을 포함하며, 여기에서 전자가 NifH 단백질에서 NifDK 단백질 복합체로 전달된다. 예를 들어, 질소 고정 활성을 아세틸렌 환원 분석에 의해 평가할 수 있다. 간단히, 상기 기법은 3중 결합된 기질을 환원시키는 니트로게나제 복합체의 능력을 사용하는 간접적인 방법이다. 니트로게나제 효소는 아세틸렌(C₂H₂)을 에틸렌(C₂H₄)으로 환원시킨다. 상기 두 기체를 모두 기체 크로마토그래피를 사용하여 정량분석할 수 있다. 질소 고정을 또한 수소 방출 분석에 의해 측정할 수 있다. H₂는 N₂ 고정의 편성 부산물이다. 따라서 니트로게나제 활성의 간접적인 크기를 통과 H₂ 센서 또는 기체 크로마토그래프를 사용하여 기체 스트림 중의 H₂ 농도를 정량분석함으로써 획득할 수 있다.

N ₂ 고정의 검출

질소 고정을 식물-토양계 중의 총 N의 순 증가를 측정하고(N 평형법); 2) 식물 N을 토양으로부터 흡수된 분획과 N₂ 고정으로부터 유도된 분획으로 분리시키고(N 차이, 15N 자연 존재비, 15N 아이소타입 희석 및 우레이드 방법) 및 3) 니트로게나제의 활성을 측정함(아세틸렌 환원 및 수소 방출 분석)으로써 평가할 수 있다.

실시예

실시예 1. 물질 및 방법

일시 발현 시스템에서 식물 세포 중 유전자의 발현

유전자를 필수적으로 문헌[Wood et al.,(2009)]에 기재된 바와 같이 일시 발현 시스템을 사용하여 식물 세포에서 발현시켰다. 강한, 구성적 35S 프로모터에 의해 식물 세포에서 발현되는 암호화 영역을 함유하는 2원 벡터를 아그로박테리움 튜메파시엔스 균주 AGL1 또는 GV3101 내로 도입시켰다. p19 바이러스 침묵 억제인자의 발현을 위해서 키메릭 2원 벡터, 35S:p19를 WO2010/057246에 기재된 바와 같이, AGL1 내로 별도로 도입시켰다. 재조합 에이 튜메파시엔스(A. tumefaciens) 세포를 50 ㎎/L 카나마이신 및 50 ㎎/L 리팜피신이 보충된 LB 브로쓰에서 28 ℃에서 정지상으로 증식시켰다. 이어서 세균을 실온에서 5분간 5000 g에서 원심분리에 의해 펠릿화한 후에 10 mM MES pH 5.7, 10 mM MgCl₂ 및 100 μM 아세토시링곤을 함유하는 침투 완충제 중에서 OD600 = 1.0으로 재현탁시켰다. 이어서 세포를 28 ℃에서 3시간 동안 진탕시키면서 배양하고 그 후에 OD600을 측정하고 OD600=0.125의 최종 농도에 도달하는데 필요한, 바이러스 억제인자 구조물 35S:p19를 포함한 각 배양물의 부피를 새로운 튜브에 가하였다. 최종 부피는 상기 침투 완충제로 보충되었다. 이어서 잎을 상기 배양 혼합물로 침투시키고 식물을 전형적으로는 침투후 추가로 3 내지 5일 동안 생장시킨 후에 잎 원반을 분석을 위해 회수하였다.

하나 초과의 관심 유전자를 함께 과-발현시키기 위해서, 각각의 추가적인 유전자를 에이 튜메파시엔스 균주 내로 별도로 도입시키고 이전과 같이 증식시켰다. 세균 현탁액을, 각 세균 균주가 OD600 = 0.125의 최종 농도에 있도록 혼합하였다. 바이러스 침묵 억제인자 35S:p19를 암호화하는 유전자를 함유하는 세균 균주가 동일한 농도로 모든 혼합물 중에 포함되었다. 예를 들어, 일시적인 잎 분석에서 4개 유전자를 발현시키기 위한 바이러스 억제인자 구조물을 포함하는 침윤된 혼합물의 최종 OD600은 5 x 0.125 = 0.625 단위였다. 상기 일시적인 분석 포맷에서 각각 식물 세포내 별도의 T-DNA 벡터로부터 적어도 5개의 유전자의 동시 과-발현은 앞서 설명되었다(Wood et al., 2009).

잎 조직으로부터 단백질 추출

T-DNA 도입 후 식물 세포에서 생성된 폴리펩티드를 분석하기 위해서, 니코티아나 벤타미아나 잎 샘플을, 침투후 5일째에(달리 서술되지 않는 한) 침투된 영역으로부터 약 2x2 ㎝ 잎 조각을 절제함으로써 수확하였다. 상기를 액체 질소에서 바로 동결시키고 2 ㎖ 에펜도르프 튜브에서 분말로 분쇄하였다. 300 ㎕의 완충제를 각 분말 샘플에 가하였다. 완충제는 125 mM 트리스-HCl 6.8, 4% 나트륨 도데실 설페이트(SDS), 20% 글리세롤, 60 mM 디티오쓰레이톨(DTT)을 함유하였다. 샘플을 95 ℃에서 3분 동안 가열한 후에 12000 g에서 2분 동안 원심분리시켰다. 추출된 폴리펩티드를 함유하는 상등액을 제거하고 검출하고자 하는 폴리펩티드의 예상되는 수준에 따라 10 ㎕ 내지 100 ㎕를 웨스턴 블럿팅에 사용하였다.

웨스턴 블럿 분석

추출된 샘플 중의 폴리펩티드를 200 V에서 약 1시간 동안 NuPAGE Bis Tris 4-12% 젤(써모피셔(ThermoFisher))상에서 SDS-폴리아크릴아미드 젤 전기영동(SDS-PAGE)에 의해 분리하였다. 분리된 폴리펩티드를 공급자의 설명(써모피셔)에 따라 반-건조 장치를 사용하여 각 젤로부터 PVDF 멤브레인으로 전달하였다. 블럿팅 후에, 젤을 1시간 동안 쿠마씨 염료로 염색하고, 이어서 남아있는 단백질의 시각화를 위해 수 중에서 세정하여 폴리펩티드의 전달이 발생하였음을 보였다. 결합된 폴리펩티드를 갖는 멤브레인을 4 ℃에서 밤새 5% 탈지분유를 함유하는 TBST 완충제로 차단하였다. TBST 완충제가 존재한다. 항-HA 및 항-FLAG 항체를 시그마로부터 구입하였다. 항-GFP 항체는 레일라 블랙맨(Leila Blackman)(오스트레일리아 국립 대학, 오스트레일리아 캔버라 소재)의 선물이었다. 항체를 5% 탈지분유와 함께 TBST 중에서 1:5000 희석으로 가하였으며 상기 멤브레인을 상기 용액 중에서 2시간 동안 배양하였다. 이어서 멤브레인을 TBST로 3x20분 동안 세척하였다. 2차 항체, 임뮨 스타(Immun-Star) 염소 항-마우스(GAM)-HRP 접합체(바이오래드(Biorad))를 5% 탈지유와 함께 TBST 중에서 1:5000으로 가하고 상기 멤브레인을 1시간 동안 배양한 다음 상기 멤브레인을 TBST로 3x15분 동안 세척하였다. 2차 항체 검출을 위해서, 애머샴(Amersham) ECL 시약을 사용하였으며 멤브레인을 X-선 현상액으로 또는 애머샴 이미저(애머샴)상에서 현상하였다.

원형질체 제조

잎 조직으로부터 원형질체를 단리시키기 위해서, 프로토콜을 하기와 같이 문헌[Breuers et al., (2012)]으로부터 알맞게 변형시켰다. 침투후 3일째에(3 dpi), 2 ㎝ 제곱 면적의 침투된 잎을 절제하고, 조각으로 절단하고 5 ㎖ 주사기로 옮겼다. 1.5%(w/v) 셀룰라제 R-10, 0.4%(w/v) 마세로자임 R-10, 0.4 M 만니톨, 20 mM KCl, 20 mM MES pH 5.6, 10 mM CaCl₂ 및 0.1%(w/v) BSA를 함유하는 소화 용액 2 ㎖을 가하고 순한 진공을 수동으로 적용하여 상기 용액의 상기 잎 조직 중의 세포간 공간내로의 진입을 촉진하였다. 상기 용액 및 잎 조각을 2 ㎖ 에펜도르프 튜브로 옮기고 혼합물을 실온에서 1시간 동안 배양하였다. 생성된 원형질체를, 상기 튜브를 손으로 뒤집어 순하게 추출하였다. 잎 찌꺼기를 핀셋을 사용하여 제거하고 원형질체가 침전되게 한 후에 상기 용액을 영상화 용액(0.4 M 만니톨, 20 mM KCl, 20 mM MES pH 5.6, 10 mM CaCl₂, 0.1% BSA)으로 교체하였다.

공초점 레이저-스캐닝 현미경검사 및 미토콘드리아 염색

원형질체를 40x 수침 대물렌즈를 갖는 직립 레이카(Leica) 공초점 레이저-스캐닝 현미경을 사용하여 영상화하였다. GFP는 488 ㎚에서 여기되었으며 방출은 499-535 ㎚에서 기록되었다. 미토콘드리아를 미토트랙커(MitoTracker)R 레드 CMXRos(써모피셔 사이언티픽)의 100 nM 용액을 사용하여 10 내지 20분간 염색하였다. 미토트랙커R 레드 CMXRos는 561 ㎚에서 여기되었으며 방출은 570-624 ㎚에서 기록되었다.

RNA 추출, cDNA 합성 및 분석

아그로박테리움이 침투된 엔 벤타미아나 세포로부터 RNA를 추출하기 위해서, 면적이 약 2x2 ㎝인 잎 조각을 액체 질소로 동결시키고, 분말로 분쇄하고, 샘플당 500 ㎕의 트리졸 완충제(써모피셔 사이언티픽)를 가하였다. 이어서, 하기의 변형을 제외하고 트리졸 공급자의 설명에 따랐다: 클로로포름 추출을 반복하고 RNA를 37 ℃에서 용해시켰다. 추출된 RNA를 RQ1 DNAse(프로메가(Promega))로 처리하여 임의의 추출된 DNA를 제거하였다. 이어서 RNA 제제를 식물 RNAeasy 컬럼(퀴아겐)을 사용하여 추가로 정제하였다. 수행시, cDNA 합성을 공급자의 프로토콜에 따라, 올리고-dT 프라이머와 함께 슈퍼스크립트(Superscript) III 역전사효소(써모피셔 사이언티픽)를 사용하여 수행하였다. 각 RNA 샘플의 RT-PCR 분석을 위해서, 3개의 별도의 cDNA 합성 반응을 수행하였다. 20 ㎕ cDNA 반응을 무-뉴클레아제 수 중에서 20배 희석하였다. qRT-PCR을 퀴아겐 로터 유전자 Q 실시간 PCR 기계상에서 수행하였다. 9.6 ㎕의 각각의 cDNA를 10 ㎕의 2x 센시패스트 부재 ROX SYBR Taq(바이오라인(Bioline)) 및 0.4 ㎕의 순방향 및 역방향 프라이머(각각 10 μmol로)에 20 ㎕의 최종 반응 부피로 가하였다. 모든 qPCR 반응(참조 및 특정 유전자 모두에 대한)을 하기의 순환 조건하에서 3회 중복하여 수행하였다: 1 주기의 95 ℃/5분, 45주기의 95 ℃/15초, 60 ℃/15초 및 72 ℃/20초. 형광을 72 ℃ 단계에서 측정하였다. 이어서 55 ℃ 내지 99 ℃ 용융 주기를 수행하였다. 구성적으로 발현된 엔 벤타미아나 GADPH mRNA에 대한 대조용 증폭을 사용하여 로터 유전자 소프트웨어 패키지에서 비교 정량분석 프로그램으로 유전자 발현을 표준화하였다. 3회 중복 분석의 평균을 나타내는 3개의 cDNA 각 세트에 대한 값을 평균하여, 평균의 표준 오차(SEM)를 계산하였다.

탠덤 질량 스펙트럼 분석

침투된 엔 벤타미아나 조직을 액체 N₂ 하에서 분쇄하고 이어서 2 ㎖ 에펜도르프 튜브에서 50 mM 트리스-HCL pH 7.5, 1 mM EDTA, 150 mM NaCl, 0.2% SDS, 10% 글리세롤, 5 mM DTT, 0.5 mM PMSF 및 1% 식물용 프로테아제 억제제 칵테일(시그마, 카탈로그 번호 P9599) 중의 렛쉬(Retsch) 조직-분쇄기를 사용하여 처리하였다. 단백질 추출물을 원심분리에 의해 등명화하고 상등액을 아가로스 비드(시그마, 카탈로그 번호 A2095)에 접합된 단클론 항-HA 항체와의 밤새 배양을 위한 투입물로서 직접 사용하였다. 결합되지 않은 단백질을 150 mM 트리스-HCL pH 7.5, 5 mM EDTA, 150 mM NaCl, 0.1% 트리톤 X-100, 5% 글리세롤, 5 mM DTT, 0.5 mM PMSF 및 1% 프로테아제 억제제 칵테일에 의한 일련의 세척에 의해 제거하였다. 결합된 단백질을 95 ℃에서 10분 동안 렘리 완충제(50 mM 트리스-HCl, pH 6.8, 2% (w/v) SDS, 0.1% (w/v) 브로모페놀 블루, 10% (v/v) 글리세롤, 100 mM DTT) 중에서 비드를 배양하여 용출시켰다. 투입물 및 면역-침전된 단백질 샘플을 SDS-PAGE에 의해 분리시키고 융합 폴리펩티드(MTP::NifH::AH)를 함유하는 젤의 면적을 복제 젤로부터 동반 웨스턴 분석에 의해 측정하였다. 상기 융합 폴리펩티드를 함유하는 영역을 절제하고, 인-젤 트립신 절단으로 처리하고, 트립신 생성물을 에이질런트(Agilent) Q-TOF 6550 질량 분광계에 커플링된 에이질런트 칩 큐브 시스템을 사용하여 탠덤 질량 스펙트럼 분석에 의해 분석하였다(Campbell et al., 2014). 공통의 오염물질, 예를 들어 첨가된 트립신 및 케라틴으로부터의 트립신 펩티드로부터 유래된 질량 스펙트럼을 확인한 후에 남은 질량 스펙트럼 데이터를, 15 ppm의 전구체 질량 허용오차, 50 ppm의 생성물 질량 허용오차, 디폴트 Q-TOF 득점 및 엄격한 디폴트 '자동확인' 설정과 함께 스펙트럼밀(SpectrumMill) 소프트웨어(에이질런트 Rev B.04.01.141 SP1)를 사용하여 NCBI(데이터베이스 번호 10/3/2015) + HA 서열로부터의 니코티아나 종의 모든 단백질 서열을 함유하는 데이터베이스에 대한 검색에 사용하였다. 아크릴아미드에 의한 시스테인 잔기의 변형은 필수 변형이었으며 메티오닌의 산화는 가변 변형으로서 허용되었다. 처음에, 트립신 절단이 필수였으며 2개 이하의 누락 절단이 허용되었다. 펩티드 합치를 확인한 후에, 비-트립신 절단을 허용하는 남아있는 합치되지 않은 스펙트럼에 대해 검색을 반복하였다.

분자 모델링에 사용되는 소프트웨어

모든 상동성 모델을 악셀리스 디스커버리 스튜디오(Accelrys Discovery Studio) 3.5에서 실행된 바와 같은 MODELLER 프로그램(Sali and Blundell, 2013)을 사용하여 구성하였다. 상기 상동성 모델을 형성시키기 위한 적합한 주형을 브록해븐(Brookhaven) 단백질 데이터뱅크에 대한 BLAST 검색을 사용하여 확인하였다. 모든 서열 정렬을 디스커버리 스튜디오 3.5에서 실행된 바와 같이 ClustalW 알고리즘(Sali and Blundell, 2013)을 사용하여 수행하였다. 모든 분자 동력학 시뮬레이션을 앰버(Amber) 12로 수행하였다.

아조토박터 비넬란디이의 형질전환

플라스미드를 문헌[Dos Santos(2011)]의 방법에 따라 아조토박터 비넬란디이내로 형질전환시켰다. 간단히, 에이 비넬란디이 DJ1271을 DMSO 스톡으로부터 몰리브데이트가 없는 고체 버크(Burk) 배지상에 긋고 추가로 계대배양하여 DMSO 오염 세포를 제거하였다. 1 루프풀 세포를 사용하여, 125 ㎖ 삼각 플라스크 중의 몰리브데이트가 없고 철이 첨가된 50 ㎖의 변형된 버크 배지를 접종하였다. 배양물을 28 ℃에서 160 rpm에서 진탕시키면서 20 내지 24시간 동안 배양하였다. 1 ng의 목적하는 플라스미드 DNA를 50 ㎕ 분액의 수용성 세포에 가하고 실온에서 20분 동안 배양하였다. 이어서 세포-DNA 혼합물을 3.8 ㎖의 변형된 버크 배지에 가하고 160 rpm에서 진탕시키면서 28 ℃에서 24시간 동안 회수하였다. 상기 회수된 세포의 분액을 6 ㎍/㎖ 카나마이신 및 20 ㎍/㎖ 암피실린을 함유하는 변형된 고체 버크 배지상에 도말하여 pMMB66EH 및 그의 유도체의 운반을 선택하였다. 상기 플레이트를 28 ℃에서 3 내지 5일 동안 배양하였다. 단일 콜로니를 변형된 고체 버크 배지상에서 재-계대배양하여 단일 콜로니 단리물을 수득하였다. 암피실린 내성을 유지하는 재-계대배양된 단리물을 사용하여 DMSO 모액의 제조 및 추가의 시험을 위해 변형된 고체 버크 배지를 접종하였다.

실시예 2. Nif 폴리펩티드를 식물 미토콘드리아에 표적화하기 위한 효모 CoxIV 유전자로부터의 MTP의 용도

발명자가 아는 한, 고등 식물에서, 예를 들어 식물 미토콘드리아에서 세균 니트로게나제(Nif) 폴리펩티드의 생성에 대한 공개된 보고서는 없다. 미토콘드리아에서 상기와 같은 생성을 시도하기 위해, 발명자는 니코티아나 벤타미아나에서 식물-기반 일시 발현 시스템을 개발하여 Nif 폴리펩티드가 식물 세포에서 생성되고 검출될 수 있는지를 측정하고 미토콘드리아 표적화 펩티드(MTP)를 사용함으로써 세균 Nif 폴리펩티드를 기본으로 하는 융합 폴리펩티드가 식물 세포 중의 미토콘드리아에 표적화될 수 있는지의 여부를 시험하였다. 미토콘드리아에 대한 국소화를 시험하기 위해서, 효모 시토크롬-c 옥시다제 서브유닛 IV(CoxIV) 단백질의 N-말단 영역으로부터 유래된 MTP를 선택하였다. CoxIV MTP는 식물 세포에서 미토콘드리아 국소화 및 GFP와의 융합 폴리펩티드의 가공을 제공하는 것으로 나타났다(Kohler et al., 1997). CoxIV MTP(서열번호 1)는 길이가 절단에 앞서 단지 29 아미노산이었으며, 다수의 다른 MTP보다 더 짧았다(Huang et al., 2009). 상기 MTP를 효모 세포에서 가공하는 경우, 17 또는 25 아미노산이 제거되어(Hurt et al., 1985), 잠재적으로 폴리펩티드의 N-말단에 부착된 MTP로부터 아미노산 잔기가 4 아미노산 잔기 정도만큼 적게 남았다. 그러나, 식물 세포에서 나중의 연구(Huang et al, 2009)는 미토콘드리아 기질 프로테아제(MMP)에 의한 미토콘드리아 기질(MM)에서의 가공이 아미노산 20-21에서 세린-세린의 바로 상류에서 펩티드를 절단하여 융합 폴리펩티드의 N-말단 단부에서 MTP로부터 10 아미노산 잔기가 첨가된 가공된 융합 폴리펩티드를 생성시킴을 예측하였다. 발명자는 보다 짧은 MTP 서열이, 특히 절단-후 융합이 단지 10 아미노산만을 첨가하는 경우 장점일 수도 있는 것으로 간주하였다.

CoxIV MTP의 유도체(본 명세서에서 dCoxIV(서열번호 2)로서 지칭된다)를 설계하였다. dCoxIV는 후앙(Huang) 등(2009)(미토콘드리아 표적화 및 가공 부위에 대한 게놈-전체 연구로부터 식물 미토콘드리아 기질(MM)에서 내수송 및 가공에 가장 중요한 잔기가 절단 부위의 상류 3 또는 4 잔기(-3R 또는 -4R) 위치의 아르기닌 및 절단 부위 바로 뒤의 2개의 세린 잔기(+1S, +2S)임을 발견하였다)에 따르면 미토콘드리아내로의 폴리펩티드의 내수송 및 가공에 관련된 모티프 xRxxxSSx(서열번호 3) 중에 보존된 아르기닌 및 세린 잔기를 포함한다. dCoxIV는 N-말단 단부를 향해 삽입된 2개의 추가적인 아미노산을 가졌으며 또한 서열번호 2의 28번 위치에서 고유 CoxIV MTP 중에 상응하는 글루타민보다는 글루타메이트를 가졌다. 이러한 변화는 dCoxIV 펩티드의 국소화 또는 절단에 영향을 미치지 않는 것으로 예상되었다.

벡터 pCW440 및 pCW441의 구성

식물 세포 내로의 유전자의 도입을 위해서, 다목적 식물/세균 발현 벡터 pCW440을 설계하고 제조하였다. 이는 에스케리키아 콜라이 및 아그로박테리움 튜메파시엔스 세균 모두에서 복제 및 선택을 허용할뿐만 아니라 에이 튜메파시엔스로부터의 유전자의 식물 세포내로의 전달을 위한 T-DNA 영역을 함유하는 2원 벡터를 기본으로 하였다. pCW440을 제조하기 위해서, pORE1(Coutu et al., 2007)을 식물 선택성 마커 유전자의 제거를 위해 처리하여, pORE1-null을 생성시켰다. 상기 벡터는 35S 프로모터 및 nos 3' 전사 종결자 영역을 함유하였다. DNA 단편을, T7 RNA 폴리머라제, 5'UTR 서열, ATG 개시 코돈에 의해 개시된 dCoxIV MTP를 암호화하는 뉴클레오티드 서열, 제한 효소 AscI에 대한 암호화 부위, 및 T7 RNA 폴리머라제에 대한 전사 종결 영역을 순서대로 함유하도록 합성하였다. 상기 단편의 서열은 부분적으로 pET14b 벡터(노보겐(Novogene))에 근거하였다. 상기 단편에 35S 프로모터와 nos 3' 영역 사이에서 pORE-null내로의 결찰을 허용하는 제한 부위가 측면 인접하여, pCW440을 생성시켰다. pCW440의 T-DNA 영역의 뉴클레오티드 서열을 서열번호 4로서 제공한다.

상기 벡터의 T-DNA 내 발현 카세트의 성분은 전사 방향 순으로, 식물 세포에서 하류 단백질 암호화 영역의 발현을 구동하여 융합 폴리펩티드를 생성시키기 위한, 클로닝 목적의 HindIII 부위 및 XhoI 부위가 측면에 인접한 CaMV 35S 프로모터(서열번호 4의 뉴클레오티드 219-1564), 이어서 적합한 이 콜라이 세포에서 상기 암호화 영역의 발현을 허용하여 동일한 폴리펩티드를 생성시키는 T7 프로모터(뉴클레오티드 1571-1587), 이어서 ATG 개시 코돈에 의해 개시되는 dCoxIV MTP를 암호화하는 뉴클레오티드(뉴클레오티드 1650-1742), 이어서 상기 단백질 암호화 영역의 삽입을 위한 클로닝 부위로서 AscI에 대한 제한 효소 부위(뉴클레오티드 1743-1750), 이어서 T7 RNA 폴리머라제 전사 종결 서열(뉴클레오티드 1810-1856) 및 최종적으로 nos 3' 식물 전사 종결 서열(뉴클레오티드 1861-2084)이었다. pCW440의 유전자 지도를 도 1에 개략적으로 나타낸다.

MTP를 암호화하는 뉴클레오티드 서열을, AscI 부위에 임의의 목적하는 단백질 암호화 영역의 삽입을 허용하여, 번역된 폴리펩티드 중의 dCoxIV 아미노산의 C-말단에 암호화된 단백질의 인-프레임 융합을 제공하는 방식으로 pCW440에 삽입하였다. 상기 벡터 및 그의 유도체는 이 콜라이에서 안정하였으며 이들을 T7 폴리머라제 프로모터 시스템에 의한 단백질 생성에 사용할 수 있다(Studier and Moffatt, 1986). 따라서, 다목적 pCW440을 상업적으로 입수할 수 있는 T7 RNA 폴리머라제 세포주, 예를 들어 BL21 골드(여기에서 T7 프로모터 및 종결자는 융합 단백질의 발현을 조절한다)를 사용하여 세균에서 융합 폴리펩티드를 발현하는 베이스 벡터로서 설계하였다. 세균은 미토콘드리아가 없기 때문에, MTP를 포함하는 완전길이 융합 폴리펩티드의 가공은 이 콜라이에서 발생하지 않을 것이다. 동일한 벡터를 식물 세포에서 사용하여, 식물 세포에서 내인성 전사 기구를 사용하는 유전자 발현을 조절하는 35S 프로모터 및 nos 3' 종결자의 조절하에서 동일한 융합 폴리펩티드를 발현시킬 수 있다.

pCW441을 생성시키기 위해서, 개시 메티오닌 잔기 없이 GFP의 개방 판독 프레임을 암호화하는 DNA 단편(Brosnan et al., 2007)을, pCW440의 AscI 부위내로의 삽입을 허용하고 dCoxIV 및 GFP간의 번역 융합을 허용하는 AscI 부위가 측면 인접한 PCR에 의해서 증폭시켰다. 상기 AscI 부위에서의 삽입은 융합 폴리펩티드의 연접에서 3개의 추가적인 아미노산을 도입시켰다. 상기 DNA 단편을 pCW440에 삽입하여 pCW441을 생성시켰다.

dCoxIV 영역이 GUS-융합 폴리펩티드를 식물 미토콘드리아로 향하게 할 수 있는지를 시험하기 위해서, pCW441(dCoxIV::GFP)을 포함하는 에이 튜메파시엔스 세포를 실시예 1에 기재된 바와 같은 방법을 사용하여 엔 벤타미아나 잎에 침투시켰다. GFP에의 N-말단 융합은 일반적으로 그의 형광발생 활성에 영향을 미치지 않는 것으로 공지되었으며(Kohler et al., 1997), 따라서 dCoxIV::GFP 폴리펩티드는 발현되는 경우 형광발생 활성을 유지함이 예상되었다. 대조용 침투를 세포질 위치한 GFP를 발현시키기 위한 구조물, pUQ214(Brosnan et al., 2007)을 함유하는 에이 튜메파시엔스와 동시에 수행하였다. 모든 침투는 침묵의 바이러스 억제인자를 암호화하는 구조물, p19(또한 대조용 침투로서 단독으로 사용되었다)를 포함하는 에이 튜메파시엔스 세포를 포함하였다. 침투 4일 후에, 침투된 잎 대역을, 488 ㎚에서 청색광 여기 및 GFP 필터와 함께 광학 현미경검사에 의해 형광에 대해 검사하여 임의의 GFP 폴리펩티드를 검출하였다. pCW441이 침투된 잎의 세포에서 형광이 관찰되었다. 현미경하에서, 다수의 작은 세포이하 구조물이, 선행 보고서(Kohler et al., 1997)와 일치하는 결과인, 형광을 방출함이 관찰되었다. 상기 구조는 매우 이동성이었으며 세포의 테두리에 모이는 경향이 있었고, 이는 이들이 미토콘드리아임과 일치한다. 대조적으로, 세포질 GFP를 암호화하는 유전자가 도입된 세포는 보다 고르게 형광을 방출하였다. dCoxIV는 식물 세포내 작은 미토콘드리아-유사 입자의 이동에 의해 입증되는 바와 같이, dCoxIV::GFP 폴리펩티드를 식물 미토콘드리아로 향하게 하기에 충분하다는 결론이 내려졌다.

벡터 pCW446, pCW447, pCW448 및 pCW449의 설계 및 구성

dCoxIV::GFP 융합 폴리펩티드가 일시 발현 후에 식물 세포에서 생성되었고 미토콘드리아에 국소화하는 것으로 보인다는 관찰을 근거로, dCoxIV::Nif 융합 폴리펩티드의 발현을 제공하도록 일련의 벡터를 설계하고 구성하였다. 처음에, 유전자 구조물을, 클렙시엘라 뉴모니아에 NifH, NifD, NifK 및 NifY에의 융합을 발현하도록 설계하고 제조하였다. 야생형 케이 뉴모니아에 NifH, NifD, NifK 및 NifY의 아미노산 서열을 각각 서열번호 5, 6, 7 및 8로서 제공한다. 번역 효율을 개선시키고자, 이들 폴리펩티드를 암호화하는 단백질 암호화 영역을 인간 코돈 바이아스를 사용하여 코돈-변형시키고, 은성 이어맞추기 부위, 은성 폴리아데닐화 신호, 및 내부 반복 서열을 상업적인 공급자(진아트(Geneart))에 의해 뉴클레오티드 서열로부터 제거하였다. 각각의 융합 폴리펩티드에 대해서, Nif 개시자 메티오닌을 생략시켰다. 더욱 또한, 개방 판독 프레임은 각각, 각각의 폴리펩티드에 대한 C-말단 연장을 암호화하는 뉴클레오티드 서열을 포함하였으며, 상기 연장은 HA- 또는 FLAG-에피토프(예를 들어 Wood et al., 2006)를 포함하여 상업적인 공급원으로부터의 에피토프에 대한 항체를 사용하는 폴리펩티드의 보다 용이한 검출을 제공한다. 번역된 폴리펩티드가 유사한 크기를 갖는 경우, 상이한 에피토프를 가하여, 상이한 항체(상업적으로 입수할 수 있다)의 사용에 의한 단백질의 구별을 가능하게 하였다. 예를 들어 NifD 및 NifK 융합 폴리펩티드는 유사한 크기를 가졌으며 따라서 NifD를 FLAG 에피토프에 융합시키고 NifK를 HA 에피토프에 융합시켰다. 각각의 C-말단에 첨가된 아미노산 서열은 HA 에피토프의 경우 서열번호 21로서, FLAG 에피토프의 경우 서열번호 22로서 제공된다. dCoxIV MTP 및 에피토프를 포함하는 융합 폴리펩티드에 대한 아미노산 서열을 각각 서열번호 23, 24, 25 및 26으로서 제공한다.

NifH::HA, NifD::FLAG, NifK::HA 및 NifY::HA 폴리펩티드를 암호화하는 코돈-최적화된 뉴클레오티드 서열을 각각 서열번호 27, 28, 29 및 30으로서 제공한다. 이들 뉴클레오티드 서열을 갖는 DNA 단편은 상업적인 공급자에 의해 합성되고, 각각 측면 인접하는 AscI 제한 부위를 포함하며, 각각 pCW440의 AscI 부위에 삽입되어 벡터 pCW446(pCoxIV::NifH::HA), pCW447(pCoxIV::NifD::FLAG), pCW448(pCoxIV::NifK::HA) 및 pCW449(pCoxIV::NifY::HA)를 생성시켰다.

세균에서 융합 폴리펩티드의 발현

상기 벡터의 다목적 성질은 적합한 세균 세포에서 유전자의 발현 및 융합 폴리펩티드의 생성을 허용하여, 젤 전기영동 및 면역-검출 실험에서 대조용으로서 사용될 수 있는 폴리펩티드의 공급원을 제공하였다. 따라서, 상기 벡터를, 37 ℃에서 오버나이트 익스프레스(Overnight Express) 배지(EMD-밀리포어(Millipore)에서 증식에 의해 유도후 유전자 구조물 중의 T7 프로모터로부터 발현을 허용하는 이 콜라이 균주 BL21.1-골드(스트라타진(Stratagene)) 내로 도입시켰다. pCW446, pCW447, pCW448 또는 pCW449를 갖는 세균 배양물을 원심분리시켜 세포를 수집하였다. 세포를 실온에서 2분간 절반 부피의 버그버스터(BugBuster) 시약(EMD-밀리포어)에 용해시켰다. 용해물을 추가로 원심분리시켜 봉입체를 수집하고 이를 절반 부피 버그버스터 시약에서 추가로 2회 세척하였다. 봉입체를, SDS를 함유하는 표준 렘리 완충제에 용해시키고 필요에 따라 추가 희석하여 웨스턴 블럿상에 뚜렷한 신호를 생성시켰다. 웨스턴 블럿을, 최종 검출 용액으로서 켐스타(ChemStar) 화학발광 시약(애머샴)과 함께 HA 또는 FLAG를 1:5000 희석으로 인식하는 상업적으로 입수할 수 있는 항체 및 토끼 항-마우스 HRP 2차로 프로빙하였다.

식물 세포에서 융합 폴리펩티드의 발현

dCoxIV::Nif::HA 또는 FLAG 태그된 융합 폴리펩티드의 발현을 위한 각각의 유전자 구조물을 실시예 1에 기재된 방법을 사용하여 엔 벤타미아나 잎에 별도로 도입시켰다. 상기에 언급한 바와 같이, 모든 침투물은 바이러스 침묵 억제인자를 암호화하는 구조물, p19를 포함하는 에이 튜메파시엔스 세포를 포함하여 유전자 침묵 반응을 감소시켰다. 5일 후에, 침투된 대역을 수확하고 실시예 1에 기재된 바와 같이 및 세균-생성된 추출물에 대해 상기에서와 같이, HA 또는 FLAG 에피토프와 결합하는 항체를 사용하여 웨스턴 블럿 기법에 의해 처리하였다. 이는 폴리펩티드를 검출하였으며 그의 크기 및 상대적인 발현 수준을 분석하였다. 젤 전기영동 단계에서, 세균 및 식물 추출물의 분액을 인접한 레인에 적용하여 폴리펩티드 크기의 가능한 작은 변화를 검출할 수 있게 하였으며, 상기 변화는 dCoxIV MTP가 절단된 경우 예측되었다. 예를 들어, 완전길이 dCoxIV::NifY::HA 폴리펩티드의 크기는 대략 30 kDa인 반면 가공된 dCoxIV::NifY::HA 폴리펩티드의 크기는 28 kDa인 것으로 예측되었다.

웨스턴 블럿(도 2) 조사시, dCoxIV::NifH::HA 폴리펩티드에 상응하는 밴드의 존재는 pCW446의 T-DNA가 도입된 샘플에 대해 쉽게 관찰되었다. 상기 NifH 융합 폴리펩티드는 밴드의 강도를 근거로, 잎 세포 중의 NifK 및 NifY 융합 폴리펩티드보다 더 강하게 발현되었다. 식물 세포에서 생성된 NifH 융합 폴리펩티드의 크기는 젤 전기영동에서 대략 40 kDa으로, 세균 발현된 폴리펩티드의 경우와 동일한 것으로 나타났다. 상기 크기는 완전길이 dCoxIV::NifH::HA 융합 단백질에 대해 예상되었다. 유사한 방식으로, dCoxIV::NifK::HA 폴리펩티드에 상응하는 밴드가, pCW448의 T-DNA가 잎 세포 내로 도입된 샘플에 대해 관찰되었고, dCoxIV::NifY::HA에 상응하는 밴드는 pCW449의 T-DNA가 도입된 샘플에 대해 관찰되었다. 각각의 경우에, 식물-발현된 폴리펩티드는, NifK 폴리펩티드에 대해 대략 60 kDa 및 NifY 폴리펩티드에 대해 대략 30 kDa인, 상응하는 세균-발현된 폴리펩티드와 동일한 크기인 것으로 나타났다. 세균- 및 식물-발현된 폴리펩티드의 이동성의 현저한 차이의 결여를 근거로, 발명자는 각각의 경우에 dCoxIV MTP가 식물 세포에서 어떠한 의미있는 정도로도 절단되지는 않는다는 결론을 내렸다.

dCoxIV::NifD::FLAG 융합 폴리펩티드에 대해서, 세균 세포에 비해 식물 세포에 대해 매우 상이한 결과가 관찰되었다. 융합 폴리펩티드가 세균에서 pCW447로부터 발현되고 샘플을 FLAG-태그된 폴리펩티드 검출에 항체를 사용하는 웨스턴 블럿에 의해 분석시, 완전길이 융합 폴리펩티드에 대해 예상된 바와 같이, 55 kDa에서 강한 밴드가 관찰되었다(도 2). 그러나, pCW447로부터의 T-DNA를 식물 세포 내로 도입시킨 경우, 영상화 기법에 의해 웨스턴 블럿의 연장된 노출후에 조차도, dCoxIV::NifD::FLAG 폴리펩티드에 대해 검출가능한 밴드는 존재하지 않았다. 이는 NifD 서열을 포함하는 융합 폴리펩티드의 생성의 결여 또는 매우 빠른 턴-오버를 암시하였다.

NifD 구조물에 대한 실험을 결과의 조사를 위해 수회 반복하였다. 다시, dCoxIV::NifD::FLAG 폴리펩티드는 웨스턴 블럿의 연장된 노출후에 조차 식물 세포로부터의 추출물에서 검출되지 않았다. 유전자 구조물을 NifD-특이성 및 35S-특이성 프라이머에 의한 서열분석에 의해 검사하여 pCW440 주쇄 중의 프로모터 및 NifD 단편의 정확한 서열을 확인하였다. 이 콜라이 균주에서도 동일한 구조물이 잘 발현되었기 때문에 개방 판독 프레임이 완전함은 분명하였다.

식물 세포에서 다른 Nif 융합 폴리펩티드의 발현

각각의 경우에 케이 뉴모니아에 서열을 사용하고 베이스 벡터로서 pCW440을 사용하여, 보다 큰 Nif 융합 폴리펩티드 세트를 암호화하는 유사한 유전자 구조물을 제조하였다. 상기는 단백질 암호화 영역의 코돈 최적화, 고유 Nif 개시자 메티오닌의 누락, 및 각 융합 폴리펩티드에 대한 HA- 또는 FLAG-에피토프 태그를 함유하는 C-말단 연장부의 첨가를 포함하였다. 상기 구조물은 pCW452(dCoxIV::NifB::HA; 아미노산 서열 서열번호 31); pCW454(dCoxIV::NifE::HA; 서열번호 32); pCW455(dCoxIV::NifN::FLAG; 서열번호 33); pCW456(dCoxIV::NifQ::HA; 서열번호 34); pCW450(dCoxIV::NifS::HA; 서열번호 35); pCW451(dCoxIV::NifU::FLAG; 서열번호 36) 및 pCW453(dCoxIV:NifX::FLAG; 서열번호 37)이었다.

이들 각각의 경우에, 엔 벤타미아나 세포에서 완전길이 융합 폴리펩티드의 생성은 아그로박테리움으로부터 관련된 T-DNA의 도입후 쉽게 검출되었다. 각각의 경우에, 검출된 완전길이 폴리펩티드의 크기는 상응하는 세균-생성된 폴리펩티드의 크기와 동일하였으며, 이는 식물 세포에서 MMP에 의한 MTP의 절단의 결여를 가리킨다. 일부의 경우에, 웨스턴 블럿상에서 다수의 밴드가 관찰되었다. 특히, NifH::HA, NifS::HA 및 NifN::FLAG에 대한 dCoxIV 번역 융합 폴리펩티드의 발현은, C-말단 단부의 에피토프가 상기 검출된 밴드에 여전히 존재하도록, 추정상 개방 판독 프레임내 은성의 내부 개시 코돈에서 출발하는 번역에 기인하거나 또는 식물 세포 중의 또는 추출 동안의 상기 폴리펩티드의 절단에 기인하는 웨스턴 블럿상의 일부 보다 작은 밴드를 생성시켰다. 상기 분석으로부터, NifH, NifS, NifU 및 NifX 융합 폴리펩티드의 생성은 다른 것들보다 더 큰 수준으로 존재하는 것으로 나타난 반면, NifK, NifY, NifE, NifN, NifB 및 NifQ 융합 폴리펩티드는 보통 내지 낮은 수준으로 검출되었다. 다시 한번, 식물 세포에서 NifD 융합 폴리펩티드의 생성은 검출되지 않았다. 발명자는 NifD 폴리펩티드를 제외한 모든 Nif 융합 폴리펩티드를, 유사한 코돈 사용 매개변수 및 동일한 프로모터 및 폴리아데닐화 조절 서열에도 불구하고 상이한 수준으로 발현되거나 또는 상이한 풍부성으로 축적되지만, 상기 접근법을 사용하여 식물 세포에서 발현시킬 수 있다는 결론을 내렸다. 중요하게, 발명자는 NifD에 대한 구조물 또는 융합 폴리펩티드에 관하여, 분명히 뛰어나기 때문에, 독특한 어떤 것이 존재한다는 결론을 내렸다.

실시예 3. 식물 세포에서 NifD 융합 폴리펩티드의 생성을 검출하기 위한 추가의 시도

실시예 2에 기재된 바와 같은 dCoxIV::NifD::FLAG 융합 폴리펩티드의 검출 결여를 고려하여, 발명자는 상기 Nif 융합 폴리펩티드가 추정상 산소 농도에 관련된 분해, 잎 세포에서 광합성 또는 잠재적으로, 추정상 추정적인 샤페론 단백질(Ribbe and Burgess, 2001)의 결여로 인한 폴리펩티드의 미스-폴딩 및 따라서 불안성에 대해 민감할 수도 있음을 가정하였다. 상기 가설을 시험하기 위해서 dCoxIV::NifD::FLAG 폴리펩티드를 암호화하는 T-DNA를 갖는 벡터 pCW447을 함유하는 에이 튜메파시엔스를 엔 벤타미아나 잎에 침투시켰다. 침투된 식물 조직을 절제하고 가변 조건하에서 24시간 동안 액체 배양 배지상에 유지시켰다. 각각의 이들 변화의 조합을 또한 시험하였다. 변화는 식물 조직을 암실에서 또는 조명하에 21%(주변 산소 농도), 5% 또는 1%의 산소 농도에서 유지시킴을 포함하였다. GroEL 폴리펩티드(Ribbe and Burgess, 2001) 또는 레가에모글로빈(Ott et al., 2005)을 발현하는 유전자 구조물의 동시-도입을 또한 일부 침투에서 수행하였다(Lhb; 도 6 및 3). 이는 GroEL- 및 Lbh-암호화 서열을 pORE1-35S 발현 벡터(Wood et al., 2009)내로 삽입하여, 각각 pCW-GroEL 및 PCW444 구조물을 생성시킴으로써 성취되었다. 상기 두 구조물을 모두 아그로벡테리움내로 형질전환시켰으며 앞서 기재된 바와 같이 일시적인 잎 발현에 사용하였다.

이러한 상기 조건 또는 유전자의 변화 중 어느 것도, 대조용 침투가 다른 Nif 융합 폴리펩티드, 예를 들어 dCoxIV::NifN::FLAG 폴리펩티드의 강한 생성을 제공하였다 하더라도, 엔 벤타미아나 세포에서 dCoxIV::NifD::FLAG 융합 폴리펩티드의 검출을 생성시키지 못했다.

발명자는 상기 실험으로부터 식물 세포에서 NifD 융합 폴리펩티드의 발현이, 해결할 필요가 있는 문제를 제공하였다는 결론을 내렸다.

실시예 4. 식물 세포에서 Nif 폴리펩티드의 조합을 발현하는 다중 벡터의 발현

발명자는 또한 4개의 Nif 융합 폴리펩티드가 엔 벤타미아나 잎 시스템에서 발현될 수 있는지의 여부, 및 상기가 dCoxIV::NifD 폴리펩티드의 생성 수준을 개선시킬 수도 있는지의 여부를 시험하였다. 이는 4개의 에이 튜메파시엔스 세포 현탁액을 혼합함으로써 시도되었으며, 각각의 현탁액은 p19 구조물을 함유하는 에이 튜메파시엔스와 함께, 상이한 발현 유전자, 즉 NifY::HA, NifD::FLAG, NifK::HA 및 NifH::HA에의 dCoxIV 융합에 대한 유전자를 함유하였다. 침투된 잎 조직으로부터의 추출물을 이전과 같이 웨스턴 블럿팅에 의해 분석시, 상기 4개의 Nif 유전자 공-침투 실험은, 각각이 단독 발현시보다 훨씬 더 낮은 수준으로 검출되었고 dCoxIVNifD에 대해서는 밴드를 검출할 수 없었지만, dCoxIV::NifK, dCoxIV::NifY 및 dCoxIV::NifH에 대한 밴드를 생성시켰다. 따라서, 다시 한번, NifD 융합 폴리펩티드는 다른 Nif 폴리펩티드와 상이한 것으로 나타났다. dCoxIV::NifK::HA, dCoxIV::NifH::HA 및 dCoxIV::NifY::HA의 조합은 동시-발현된 dCoxIV::NifD::FLAG의 생성을 검출 가능한 수준으로 증대시키지 않았다.

논의.

상술한 실험에서, 유전자 구조물을 합성하고 사용하였으며, 각각은 10개의 상이한 Nif 폴리펩티드에 별도로 융합된 효모 미토콘드리아 표적화 펩티드(MTP)의 유도체, dCoxIV를 암호화하였다. 이들을 또한 각각의 C-말단에서 HA 또는 FLAG 에피토프 태그에 융합시켜, 세균 또는 식물 세포에서 생성시 폴리펩티드를 검출하였으며, 이들은 에이 튜메파시엔스에 의한 T-DNA의 도입후 잎 조직에서 발현되는 것으로 나타났다. 미토콘드리아내 MTP의 가공을, 상기 세균 및 엔 벤타미아나 세포로부터 추출된 폴리펩티드의 크기를 조심스럽게 비교함으로써 시험하였다. 10개의 dCoxIV-Nif 융합 폴리펩티드 모두 이 콜라이 세균에서 생성 후에 웨스턴 블럿 분석에서 쉽게 검출되었으나, 상기 폴리펩티드 중 단지 9개만이 엔 벤타미아나 세포 내로 도입 후 검출되는 것으로 관찰되었다. 예외는 dCoxIV::NifD::FLAG 폴리펩티드이며 이는 일관되게 검출되지 않았다. 식물 조직을 유지시키는 환경 조건의 변화 - 감소된 산소 농도, 식물 조직의 암실 대 조명하에서의 유지, 또는 동시-발현된 레가에모글로빈 또는 GroEL 샤페로닌 단백질의 존재는 상기 폴리펩티드의 검출을 생성시키지 않았다.

NifD는 니트로게나제 효소 복합체의 중요한 성분이다. 따라서, 하기 실시예의 실험을 NifD 융합 폴리펩티드의 발현 결여를 경감시키고자 수행하였다.

실시예 5. 식물 미토콘드리아내로 단백질의 유도에 대한 pFAγ MTP의 확인

실시예 2-4에 기재된 바와 같이, 11개의 시험된 Nif 융합 폴리펩티드 중 10개의 생성이 dCoxIV MTP를 사용하여 엔 벤타미아나 잎 세포에서 입증되었으며, 유일한 예외는 NifD 융합 폴리펩티드였다. 각각의 경우에, 표적화 펩티드의 가공은 관찰되지 않았다. 따라서 발명자는 NifD 및 다른 Nif 폴리펩티드와 융합된 상이한 MTP 서열이 식물 세포에서 검출 가능한 발현 및 상기 융합 폴리펩티드의 절단을 제공하는지의 여부를 시험하였다. 상기 목적을 위해서, 발명자는 에이 탈리아나 F1-ATPase γ-서브유닛(pFAγ)으로부터 MTP를 선택하였다. 길이가 77 아미노산 잔기인 상기 MTP를 GFP 리포터 폴리펩티드와의 융합에 의해 아라비도프시스 원형질체에서 기능적으로 확인하였다(Lee et al., 2012). 기질 가공 프로테아제(MPP)에 의한 pFAγ MTP 서열의 절단이 아미노산 42 다음에 발생하여, 상기 융합 폴리펩티드의 N-말단에 융합된 35 아미노산의 C-말단 부분을 남겼다. 상기 35 아미노산 중 얼마나 많은 아미노산이 미토콘드리아 국소화 및 엔 벤타미아나 잎 세포에서의 가공에 필요한지는 공지되어 있지 않으며, 따라서 발명자는 전체 77개 아미노산 서열을 사용하기로 하였다. 따라서 융합된 Nif 폴리펩티드를 완전한 식물 잎 세포의 MM으로 운반하는 pFAγ MTP의 능력을 엔 벤타미아나 일시 잎 분석 시스템을 사용하여 시험하였다.

3개의 아미노산 gly-ala-pro(GAP)에 의해 분리되고 또한 측면 인접하는 NcoI 및 AscI 제한 부위를 포함하는 GFP(GFP 65T, 진뱅크 수납 번호 U43284; Haas et al., 1996)에 융합된 pFAγ MTP의 77개 아미노산(서열번호 38의 아미노산 1-77)으로 이루어지는 319 아미노산 폴리펩티드를 암호화하는 970 bp의 DNA 단편을 화학적으로 합성하였다. NcoI 및 AscI(부분) 절단 후에, 단편을 pCW441의 NcoI - AscI 부위에 삽입하여 벡터 pRA01을 생성시켰다. AscI에 의한 pRA01의 절단은 GFP 암호화 영역을 절제하였지만 pFAγ MTP 서열 및 GAP 아미노산을 남겨, Nif 융합 폴리펩티드의 클로닝을 위한 베이스 벡터로서 사용되는 벡터 pRA00을 생성시켰다. Nif 또는 다른 폴리펩티드를 pFAγ MTP + GAP 아미노산의 하류에 상기 AscI 부위에서의 DNA 서열의 삽입에 의해 융합시킬 때, 생성된 유전자 구조물은 상기 융합 연접에서 pFAγ MTP + GAP 아미노산을 암호화하였고, 이에 의해 Nif 또는 다른 폴리펩티드(서열번호 38)에 80 아미노산 N-말단 연장을 가하였다. 미토콘드리아에서 pFAγ MTP의 가공은 개시제 메티오닌을 포함하여 N-말단으로부터 42 아미노산을 절단시켜, 발현된 폴리펩티드의 크기를 약 4.6 kDa 까지 감소시킬 것으로 예상되었다. 따라서 MTP의 절단은 Nif 또는 다른 폴리펩티드에 N-말단 융합된 C-말단 연장으로부터 38 아미노산을 남길 것으로 예상되었다.

동일한 길이의 N-말단 연장을 암호화하지만 MPP에 의한 미토콘드리아 가공은 제공하지 않는 대조용 벡터로서, pFAγ MTP의 불능 버전을 암호화하는 제2 벡터를 제조하였다. 상기 벡터에서, pFAγ의 절단 부위의 아미노산을 포함하여, 24 아미노산 치환이 그의 미노콘드리아 인식 및 가공에 필요한 MTP의 영역에 도입되었다(Lee et al., 2012). 각각의 치환은 pRA1의 pFAγ MTP 중의 야생형 아미노산을 알라닌 잔기로 교체시켰다(도 3). 따라서, pFAγ MTP의 변형된 버전(본 명세서에서 mFAγ로서 표기됨)은 정확하게 가공되지 않을 것이며 대신에 상응하는 가공되지 않은 pFAγ 융합 폴리펩티드와 동일한 수의 아미노산 잔기를 갖는 완전길이 융합 폴리펩티드를 유도할 것이다. 따라서 상기 변형된 벡터를 웨스턴 블럿 분석에서, 융합 폴리펩티드를 발현하여 가공되지 않은 분자량 대조용을 제공하는 벡이스 벡터로서 사용하였다. 2개의 벡터 pRA001 및 그의 mFAγ 유도체는 모두 2원 벡터이며, 에이 튜메파시엔스로부터 식물 세포내로의 그의 T-DNA의 전달을 제공한다. C-말단 단부의 GAP 트리플릿을 포함하여 변형된 mFAγ N-말단 연장의 아미노산 서열을 서열번호 39로서 제공한다.

식물 세포에서 미토콘드리아에 융합 폴리펩티드를 국소화하는 pFAγ MTP의 능력을 시험하기 위해서, pRA01을 일시적인 엔 벤타미아나 잎 분석에 사용하였다. 식물 세포에서 pFAγ::GFP 융합 폴리펩티드의 기질 가공을 검출하기 위한 대조용으로서, mFAγ::GFP 융합 폴리펩티드를 암호화하는 상응하는 벡터를 또한 제조하였으며 pRA21로서 표기하였다(표 3). pRA01 또는 pRA21을 함유하는 에이 튜메파시엔스에 의한 잎의 침투후 5일째에, 상기 침투된 대역으로부터 잎 샘플을 수확하고 단백질 추출물을 실시예 1에 기재된 바와 같이 제조하였다. SDS-PAGE 젤 전기영동 및 웨스턴 블럿팅을 GFP 항체를 사용하여 단백질 추출물상에서 수행하였다. pRA01(pFAγ::GFP)의 도입으로부터, 예상된 부위에서 절단된 GFP 폴리펩티드에 대해 예상된 크기(∼30 kDa)를 갖는 폴리펩티드 밴드가 웨스턴 블럿상에서 관찰된 반면, pRA21(mFAγ::GFP)의 경우, 가공되지 않은 융합 폴리펩티드에 대해 예상된 크기(∼35 kDa)의 보다 큰 크기의 밴드가 관찰되었다(도 4). ∼28 kDa의 희미한 밴드가 pRA01 및 pRA21 모두에 대해 관찰되었다(GFP 폴리펩티드를 암호화하는 어떠한 유전자도 없는 음성 대조용에서 관찰되지 않았다). 이는 GFP 폴리펩티드의 분해 생성물 또는 또 다른 전사 또는 번역으로부터 발생하는 것을 나타내는 듯하였다. pFAγ::GFP 융합 폴리펩티드의 가공은, 절단된 형태에 대한 밴드가 절단되지 않은 형태에 대한 밴드보다 훨씬 더 강하였기 때문에 효율적인 것으로 보였다(도 4). 발명자는 pFAγ::GFP 융합 폴리펩티드가 완전한 엔 벤타미아나 잎 세포의 MM에서 가공되고 있다는 결론을 내렸으며, 이는 적어도 융합 폴리펩티드의 MTP 부분이 MM으로 운반되고 있고 MPP에 접근가능함을 암시한다.

GFP 폴리펩티드의 국소화를 시각화하기 위해서, 원형질체를 pRA01(pFAγ::GFP)을 함유하는 잎 조직으로부터 실시예 1에 기재된 바와 같이 제조하였으며 공초점 현미경검사에 의해 검사하였다. 원형질체를 40x 수침 대물렌즈를 갖는 직립 레이카 공초점 레이저-스캐닝 현미경을 사용하여 영상화하였다. GFP는 488 ㎚에서 여기되었고 방출은 499-535 ㎚에서 기록되었다. 미토콘드리아를 식별하기 위한 대조염색으로서, 원형질체를 또한 100 nM의 미토트랙커R 레드 CMXRos(써모피셔 사이언티픽, Cat. No. M7512) 용액을 사용하여 10 내지 20분 동안 염색하였다. 미토트랙커R 레드 CMXRos가 561 ㎚로부터 여기되었고 방출은 570-624 ㎚에서 기록되었다. 이렇게 하여, 2개의 형광단 모두에 대한 형광상을 오버레이할 수 있었다. 상기 수단에 의해, GFP 형광이 미토트랙커R과 함께 국소화되었고 따라서 미토콘드리아에 국소화된 것으로 관찰되었다. 따라서 발명자는 적어도 pFAγ::GFP에 대해서, MTP가 융합 폴리펩티드를 엔 벤타미아나 잎 세포 중의 MM으로 전좌하고 있으며 또한 MPP에 의한 그의 절단을 제공한다는 결론을 내렸다(도 4). 상기 결론은 MPP에 의한 MTP의 가공이 오직 MM에서만 발생한다는 지식에 근거하였다.

실시예 6. Nif 융합 폴리펩티드의 식물 미토콘드리아로의 전좌

이어서 발명자는 pFAγ MTP가 Nif 융합 폴리펩티드를 MM으로 전좌할 수 있는지의 여부 및 상기가 MPP에 의한 MTP의 절단을 제공하는지를 시험하고자 하였다. 먼저 이를 시험하기 위해서, 2개의 Nif 단백질(NifF 및 NifZ)을 그들의 비교적 작은 분자량(이는 웨스턴 블럿팅에 의한 절단된 및 절단되지 않은 폴리펩티드의 분명한 식별을 가능하게 할 것이다) 때문에 융합 폴리펩티드의 구성을 위해 선택하였다. C-말단 융합물로서 HA 또는 FLAG 에피토프에 융합된 클렙시엘라 뉴모니아에 NifF 및 NifZ 폴리펩티드에 대한 단백질 암호화 영역이 인간-코돈 최적화되고 상업적인 공급자에 의해 합성되었다. DNA 단편을, Nif 개방 판독 프레임이 N-말단 pFAγ MTP와 번역 융합되어 벡터 pRA05 및 pRA04(표 3)를 생성시키도록 pRA00의 AscI 부위에 삽입하였다. HA 및 FLAG 에피토프를 각각 NifF 및 NifZ 폴리펩티드의 C-말단에 통합시켜 상응하는 항체에 의한 검출을 허용하였다. 대조용으로서 상기 pFAγ::Nif 융합 폴리펩티드의 가공되지 않은 버전을 생성시키기 위해서 T7 RNA 폴리머라제에 의해 이 콜라이에서 동일한 구조물을 발현시켰다. MTP가 MPP를 갖지 않는 세균에서 가공되지 않음을 고려하여, 식물- 및 세균-발현된 폴리펩티드의 크기 차이가, 젤 전기영동 및 웨스턴 블럿 방법에 의한 가공의 검출을 가능하게 하였다. 가공전의 pFAγ::Nif::HA 및 pFAγ::NifZ::FLAG 융합 폴리펩티드의 아미노산 서열을 각각 서열번호 40 및 41로서 제공한다.

웨스턴 블럿(도 4)은 엔 벤타미아나 잎으로부터 검출된 폴리펩티드의 크기가 각각의 경우에 이 콜라이에서 생성된 상응하는 폴리펩티드보다 더 작음을 밝혀내었다. 각각의 pRA05(pFAγ::NifF::HA) 및 pRA04(pFAγ::NifZ::FLAG)에 대해서, 식물 세포로부터 검출된 폴리펩티드는 그의 MTP 중 융합 폴리펩티드의 절단에 대해 예상된 크기에 상응하는 반면, 이 콜라이 추출물로부터 검출된 폴리펩티드는 가공되지 않은 pFAγ::Nif 융합 폴리펩티드에 대해 예상된 크기를 가졌다. 발명자는 상기 데이터로부터 pFAγ MTP가 적어도 Nif-융합된 폴리펩티드의 MTP 부분을 MM내로 수송하고 식물 세포에서 MPP에 의한 MTP의 절단을 제공할 수 있다는 결론을 내렸다.

실시예 7. 질량 분광분석에 의한 MTP 절단의 입증

융합 폴리펩티드의 pFAγ 부분 중 예측된 MTP 가공 부위가 MPP에 의해 미토콘드리아에서 절단됨을 입증하기 위해서, 펩티드 구조물을 질량 분광분석에 의해 분석하였다. 이를 위해서, 발명자는 pRA10(표 3)으로 표기되는 융합 폴리펩티드 pFAγ::NifH::HA를 암호화하는 pRA00을 기본으로 하는 유전자 구조물을 설계하고 제조하였다. 가공전의 상기 융합 폴리펩티드의 아미노산 서열을 서열번호 42로서 제공한다. NifH 융합 폴리펩티드를 니트로게나제 효소 복합체의 코어 성분으로서 NifH의 중요성 및 앞서 식물 세포에서 관찰된 dCoxIV::NifH::HA 폴리펩티드의 높은 수준의 발현(실시예 2)으로 인해 선택하였다. pRA10 구조물을 엔 벤타미아나 잎 세포 내로 도입시키고 침투된 조직을 4일 후에 수확하였다. 상기 조직을 액체 질소하에서 분쇄시키고 이어서 2 ㎖ 에펜도르프 튜브에서 50 mM 트리스-HCl pH 7.5, 1 mM EDTA, 150 mM NaCl, 10% 글리세롤, 5 mM DTT, 0.5 mM PMSF 및 1% 식물용 프로테아제 억제제 칵테일(시그마, 카탈로그 번호 P9599)을 함유하는 단백질 추출 완충제(PEB)의 존재하에서 렛쉬 조직분쇄기를 사용하여 가공하였다. 미토콘드리아에 표적화된 NifH 융합 폴리펩티드의 용해도를 개선시키기 위해서 0.2%(w/v) SDS를 상기 PEB에 가하였다. 조 단백질 추출물을 원심분리에 의해 등명화하고 이어서 HA-함유 폴리펩티드를 면역-침전시키기 위해서 아가로스 비드(시그마, 카탈로그 번호 A2095)에 접합된 단클론 항-HA 항체의 존재하에서 배양하였다. 결합되지 않은 단백질을 150 mM 트리스-HCl pH 7.5, 5 mM EDTA, 150 mM NaCl, 0.1% 트리톤 X-100, 5% 글리세롤, 5 mM DTT, 0.5 mM PMSF 및 1% 식물용 프로테아제 억제제 칵테일에 의한 일련의 세척에 의해 제거하였다. 결합된 단백질을 95 ℃에서 10분 동안 렘리 완충제 중에서 비드를 배양하여 용출시키고 이어서 변성 SDS-PAGE 상에서 전기영동에 의해 추가로 정제하였다. 동반 웨스턴 블럿 분석에 의해 pFAγ::NifH::HA 융합 폴리펩티드를 함유하는 것으로 판정된 젤 영역을 절제하고 트립신에 의한 인-젤 절단을 가한 다음 에이질런트 Q-TOF 6550 질량 분광계에 커플링된 에이질런트 칩 큐브 시스템을 사용하여 실시예 1에 기재된 바와 같이 생성된 펩티드의 탠덤 질량 스펙트럼 분석을 수행하였다(Campbell et al., 2014). 상기 분석은 NifH 내의 영역에 일치하는 5개의 완전히 절단된 트립신 펩티드 및 잔기 42와 43 사이의 MTP의 정확한 절단과 일치하는 여섯 번째 반-트립신 펩티드를 밝혀내었다(도 5). 가공되지 않은 MTP로부터 획득될 수도 있는 트립신 펩티드 SISTQVVR(서열번호 43)은 관찰되지 않았다. 대신에, 검출된 대부분의 N-말단 펩티드는 반-트립신 ISTQVVR(서열번호 44)이었으며, 이는 그의 MS/MS 스펙트럼에서 y-이온의 완전한 시리즈에 의해 확인되었다.

상기 데이터는 결론적으로 pFAγ::NifH::HA 폴리펩티드의 적어도 MTP 부분이 MM으로 전좌되었고 MPP에 의해 N-말단 연장부내 MTP 중의 소정의 부위에서 절단되었음을 입증하였다. 상기 데이터는 pFAγ MTP가 MM에서의 전좌 및 가공에 필요한 모든 신호를 함유함을 암시하였다.

실시예 8. 식물의 미토콘드리아 기질 중 다중 니트로게나제 단백질의 발현

엔 벤타미아나 잎 세포에서 pFAγ MTP에 융합된 GFP, NifF, NifZ 및 NifH 폴리펩티드의 미토콘드리아에서의 발현 및 가공의 성공을 고려하여, 발명자는 pFAγ MTP에의 융합 폴리펩티드로서 나머지 13 Nif 폴리펩티드를 발현시키고자 하였다. 모델 질소자급영양체, 클렙시엘라 뉴모니아에에서, 16개의 Nif 단백질이 니트로게나제 생합성 또는 기능에 관련되는 반면 다른 4개는 미지의 기능을 갖거나 전사 조절에 관련된다(Oldroyd and Dixon, 2014). 발명자는 pFAγ MTP가 실시예 2-4에 나타낸 데이터에 비추어 NifD 융합 폴리펩티드의 생성 및 절단을 제공하는지의 여부에 특히 관심이 있었다.

케이 뉴모니아에의 16 Nif 폴리펩티드를 암호화하는 DNA 단편의 코돈-최적화된 버전을 획득하였으며 이들을 각각 pRA00의 AscI 부위에 별도로 삽입하여 일련의 유전자 구조물을 제조하였다(표 3). 각각의 유전자 구조물은 N-말단 pFAγ MTP, 이어서 Nif 서열(그의 개시자 메티오닌이 있거나 없이), 및 이어서 적합한 항체에 의한 검출을 위한 HA 또는 FLAG 에피토프를 포함하는 C-말단 연장을 갖는 융합 폴리펩티드를 암호화하였다. 식물 발현을 위해서, 각각의 구조물은 단백질 암호화 영역에 측면 인접하는 35S 프로모터 및 nos 3' 전사 종결자 영역을 포함하였다. 상기 16개의 융합 폴리펩티드에 대한 아미노산 서열을 서열번호 40-42 및 46-58로 나타낸다.

각각 16개의 유전자 구조물을 함유하는 에이 튜메파시엔스 세포를 엔 벤타미아나 잎에 별도로 침투시키고, 4일 후에, 단백질 추출물을 제조하고 이전과 같이 젤 전기영동 및 웨스턴 블럿팅에 의해 분석하였다. HA-태그된 pFAγ-Nif 폴리펩티드를 암호화하는 각각의 구조물에 대해서, 대략 MPP에 대해 예상된 바와 같은 크기를 갖는 밴드가 웨스턴 블럿상에서 검출되었다(표 3, 도 6). 단백질 풍부성이 HA-태그된 폴리펩티드들간에 다양하였으며, NifB, NifH, NifK, NifS 및 NifY 융합 폴리펩티드가 검출하기 가장 용이하였다. NifF, NifE 및 NifM 폴리펩티드가 보다 낮은 수준으로 존재한 반면, NifQ 폴리펩티드의 검출은 볼 수 있기 위해서 상기 블럿의 보다 오랜 노출이 요구되었다. 흥미롭게, 추가로, 보다 높은 분자량의 밴드들이 각각의 개별적인 Nif::HA 구조물에 크기-특이적인 NifB, NifS, NifH 및 NifY 구조물(도 6)에 의한 침투에 대해 검출되었다. 이들 추가적인 밴드는 1차 밴드에 비해 분자량이 대략적으로 2배였으며, 이는 상기 폴리펩티드가 젤 전기영동 중 변성 조건에도 불구하고 이량체화됨을 발명자에게 제시한다. NifB, NifS 및 NifH 단백질이 세균에서 동종-이량체로서 기능함은 보고되었다(Rubio and Ludden, 2008; Yuvaniyama et al., 2000).

FLAG-태그된 pFAγ::Nif::FLAG 융합 폴리펩티드가 NifJ, NifN, NifV, NifU, NifX 및 NifZ 서열을 포함하는 각각의 구조물에 대해서 웨스턴 블럿에서 관찰되었다(도 6, 상부 우측 패널). FLAG 항체는 HA 항체보다 엔 벤타미아나 추출물로부터 보다 많은 배경 밴드를 생성시켰다. 그럼에도 불구하고, 상기 결과는 HA-태그된 단백질에 대한 경우와 유사하였다. 상이한 Nif::FLAG 융합 폴리펩티드에 대해서 신호 강도의 상당한 변화가 보였다. 추가로, NifU 구조물에 특이적인 보다 높은 분자량 밴드가 관찰되었다(도 6). pFAγ::NifX::FLAG 구조물은 또한, 예측된, 가공된 분자량에 대해 예상된 것보다 더 큰 강도의, 추가적인 더 작은 밴드를 생성시켰다.

현저하게도 상기 16개의 유전자 구조물 중 15개가 검출 가능한 폴리펩티드 생성을 제공함을 고려하여, 다수의 침투 복제에도 불구하고, 발명자는 이 콜라이에서 동일한 유전자 구조물의 발현이 예상 분자량의 볼 수 있는 밴드를 쉽게 생성시켰다하더라도(도 7), 상기 식물 분석에서 pFAγ::NifD::FLAG 구조물(pRA07)에 대한 어떠한 특정한 밴드도 검출할 수 없었다. 실제로, 심지어 세균-생성된 추출물의 1:100 희석조차 웨스턴 블럿상에서 쉽게 관찰되는 밴드를 생성시켰다. 상기 세균 추출물로부터의 결과는 유전자 구조물 pRA07이, 적어도 단백질 암호화 영역에 대해 기능성임을 입증하였다. 따라서, 상기 pFAγ::NifD::FLAG 폴리펩티드의 현저한 예외와 함께, 필수적인 Nif 폴리펩티드의 전체 세트의 모두가 니트로게나제 생합성에 필요하였으며 기능은 pFAγ MTP에의 융합을 사용하여 식물 잎 세포에서 성공적으로 발현되었다. 추가로 상기 관찰된 밴드의 분자량은 MM에서 융합 폴리펩티드의 가공과 일치하였다(표 3).

니트로게나제 활성은 다수의 Nif 단백질의 합심된 작용을 필요로 하기 때문에, 식물에서 기능성 니트로게나제 재편성은 생합성 및 기능을 위해 질소고정 세균에 의해 사용되는 Nif 단백질 중 다수를 필요로 할 것이 예상되었다. 따라서 발명자는 다수의 Nif 단백질을 pFAγ MTP를 사용하여 엔 벤타미아나 MM에서 발현시킬 수 있는지를 측정하고자 하였다. 상기 개념을 시험하기 위해서, 웨스턴 블럿 분석에 의해 상기 생성된 폴리펩티드를 식별할 수 있는 상이한 크기의 Nif 융합 폴리펩티드 중 4개를 암호화하는 유전자 구조물, 즉 pFAγ::NifB::HA(pRA03), pFAγ::NifS::HA(pRA16), pFAγ::NifH::HA(pRA10) 및 pFAγ::NifY::HA(pRA12)를 암호화하는 구조물을 선택하였다. 이들 구조물로 형질전환된 4개의 에이 튜메파시엔스 배양물을 동량으로 혼합하고 이어서 혼합물을 엔 벤타미아나 잎에 침투시켰다. 축적된 폴리펩티드 수준을 각 배양물이 별도로 침투되었을 때와 비교하였다. 각각의 폴리펩티드는 상기 4개의 유전자 조합으로부터 보다는 단일 구조물로부터 발현시 더 풍부하였다. 그럼에도 불구하고, 4개의 Nif 융합 폴리펩티드 모두 상기 유전자 조합으로부터의 단백질 추출물 중에서 쉽게 검출되었으며, 각각의 폴리펩티드에 대해 관찰된 분자량은 개별 및 조합 침투에 대해 동일하였다. 이는 Nif 융합 폴리펩티드의 조합이 식물 세포에서 미토콘드리아로의 각각의 Nif 융합 폴리펩티드의 목적하는 표적화 및 가공을 생성시킬 수 있음을 보였다.

실시예 9. 엔 벤타미아나에서 NifD 융합 폴리펩티드 생성을 개선시키기 위한 시도

니트로게나제의 촉매 활성에서 NifD의 핵심 역할을 고려하여, 발명자는 NifD 융합 폴리펩티드 생성의 결여 이유를 확인하고자 하였으며 식물 분석에서 그의 풍부성을 개선시키기 위한 다수의 접근법을 시험하였다. 먼저, 발명자는 mRNA 발현 수준을 측정함으로써 NifD 융합 폴리펩티드 생성/축적의 결여가 낮은 트랜스유전자 전사 또는 mRNA 불안정성에 기여할 수 있는지의 여부를 시험하였다. 이를 수행하기 위해서, pRA07로부터 침투된 엔 벤타미아나 세포 중의 mRNA의 수준을 먼저 실시예 1에 기재된 바와 같이 qRT-PCR에 의해 측정하고 pFAγ::NifU::FLAG(pRA15)를 암호화하는 구조물로부터 전사된 mRNA 수준과 비교하였다. 상기 두 번째 구조물을, 상기 구조물이 상술한 바와 같이 식물 세포에서 높은 수준의 폴리펩티드 생성을 제공하였기 때문에 대조용으로서 사용하였다. 증폭 효율에서 임의의 편향을 제거하기 위해, 2개의 Nif 융합 유전자 모두에 의해 공유된 pFAγ MTP 영역내에 어닐링된 올리고뉴클레오티드 프라이머를 사용하였다. 상기 RT-PCR 분석으로부터의 결과는 pFAγ::NifD::FLAG mRNA의 수준이 pFAγ::NifU::FLAG mRNA보다 3배를 초과하여 더 큰 것을 입증하였다. 둘째로, cDNA를, pRA07로부터 전사되고, 클로닝되고 서열분석된 식물-생성된 mRNA로부터 합성하였으며 그의 뉴클레오티드 서열은 완벽하게 베이스임이 입증되었다. 따라서, pFAγ::NifD::FLAG 융합 폴리펩티드의 축적이 결여는 낮은 mRNA 수준 또는 불안정성에 기인하지 않았다. 상기 실험은 또한 pFAγ::NifD::FLAG를 암호화하는 pRA07 중의 T-DNA가 완전히 기능성이며 상기 구조물 중의 35S 프로모터가 마찬가지로 기능성임을 입증하였다. 따라서, 엔 벤타미아나 세포에서 NifD 융합 폴리펩티드를 검출할 수 없음은 상기 mRNA의 발현 중 임의의 병변에 기인하지 않았다.

pFAγ::NifD::FLAG 및 mRNA 축적을 암호화하는 유전자의 전사는 NifD 융합 폴리펩티드 생성을 명백히 제한하지는 않기 때문에, NifD 융합 폴리펩티드의 축적의 결여를 극복하고자 상기 유전자 구조물에 대한 다수의 변화를 수행하였다. 먼저, 가능성을 고려하고 C-말단 연장 중 FLAG 에피토프의 존재가 NifD 융합 폴리펩티드의 생성 또는 불안정성의 결여를 야기하는지를 시험하였다. 상기 가능성을 시험하기 위해서, 상기 FLAG 에피토프를 HA 에포토프로 치환시킨 구조물(pRA19(pFAγ::NifD::HA)라 표기됨)을 설계하고 제조하였다. HA 에피토프는 상기 에피토프로 시험된 태그된 Nif 융합 폴리펩티드 각각의 축적 및 검출을 하용하였다(표 3). 상기 융합 폴리펩티드의 아미노산 서열을 서열번호 59로서 제공한다. 둘째로, NifD::HA 개방 판독 프레임의 코돈 사용을, 상이한 mRNA 서열이 번역 효율을 개선시킬 수도 있는지의 여부를 측정하고자, 인간 세포에서의 번역에 최적화하기보다는 에이 탈리아나에서의 코돈 사용에 더 가깝게 닮도록 변형시켰다. 상기 구조물을 pRA24라 표기하였으며; 상기는 pRA19와 동일한 pFAγ::NifD::HA 폴리펩티드(서열번호 59)를 암호화하였다. 추가로, 실시예 5에 기재된 바와 같은 pFAγ보다는 변형된 mFAγ N-말단 연장을 갖는 NifD 융합 폴리펩티드의 버전을 암호화하는 유전자 구조물(mFAγ::NifD::HA)을 제조하였다. 상기 구조물(pRA22)을, 미토콘드리아 표적화 및/또는 가공(발생하는 경우)이 NifD 융합 폴리펩티드 생성의 결여에 적어도 부분적으로 책임이 있는 지를 시험하기 위해서 제조하였다. 상기 질문을 다루기 위해 설계된 3개의 구조물을 표 3에 나열한다.

엔 벤타미아나 잎을 상기 침투된 조직으로부터 제조된 상기 구조물 및 단백질 추출물을 함유하는 에이 튜메파시엔스로 침투시키고 분석하였다. 현저하게, 웨스턴 블럿은 pRA19 또는 pRA24(pFAγ::NifD::HA) 구조물이 도입되었을 때 기질-가공된 및 가공되지 않은 NifD 융합 폴리펩티드에 대해 예상된 분자량의 HA-함유 밴드를 나타내었다(도 8). pRA22의 도입은 오직 보다 큰(가공되지 않은) 융합 폴리펩티드만을 생성시켰다. 상기 실험에서, pRA19의 식물 세포 내로의 도입은 웨스턴 블럿에서 pRA24보다 더 강한 NifD::HA 융합 폴리펩티드 밴드를 생성시켰으나, 후속의 반복 실험에서, 강도의 차이는 크지 않았다. 기질 가공을, pRA22(mFAγ::NifD::HA)로부터 생성된 경우와 세균 생성된 폴리펩티드의 밴드 위치를 비교함으로써 확인하였다(도 8). pFAγ::NifD::HA의 가공된 및 가공되지 않은 형태에 크기가 상응하는 2개 밴드의 관찰은 상기 NifD 융합 폴리펩티드의 가공이 상술한 바와 같은 다른 Nif 융합 폴리펩티드의 경우만큼 효율적이지 않음을 가리켰다. pFAγ::NifD::HA 폴리펩티드의 관찰된 수준은 동일한 발현 구조물 설계 및 발현 조건에도 불구하고 양성 대조용으로서 사용된 pFAγ::NifK::HA 융합 폴리펩티드(레인 2)의 수준보다 여전히 훨씬 더 낮았다. 더욱 또한, 3개의 변형된 NifD::HA 구조물 각각에 대해서, 보다 낮은 분자량의 추가적인 밴드가 웨스턴 블럿상에서 관찰되었으며, 이들 중 일부는 특정한 pFAγ::NifD::HA 버전에 특이적이었다. 예를 들어, 약 50 kDa의 강한 밴드는 변형된 NifD::HA 구조물 모두에 대해 존재하였지만, 약 40 kDa의 상이한, 강한 밴드는 pRA22 도입시 샘플에 특유인 것으로 나타났다. 이들 밴드는 pFAγ::NifK::HA 또는 GFP 대조용에 대해서는 존재하지 않았으므로, 이들은 NifD::HA 분해 생성물 또는 가능하게는 또 다른 전사 또는 번역 개시 신호의 생성물을 나타낼 수 있었다.

발명자는 HA 에피토프에 의한 FLAG 에피토프의 치환이 적어도 부분적으로, NifD 융합 폴리펩티드의 축적의 개선을 담당할 수 있다는 결론을 내렸다.

논의

상술한 실험에서, 발명자는 클렙시엘라에서 니트로게나제 기능에 필요한 16개 Nif 폴리펩티드 모두 MTP:Nif 융합 폴리펩티드로서 식물 잎 세포에서 유전자 구조물로부터 발현될 수 있고 상기 폴리펩티드는 미토콘드리아에서 가공된 형태로 축적될 수 있음을 입증하였다. 더욱 또한, 상기 실험은 상기 단백질이 니트로게나제 기능을 잠재적으로 수용하는 세포이하 장소인 MM에 표적화될 수 있음을 보였다. 발명자는 상기 실험이 상기와 같은 접근법의 실행가능성에 대한 최초의 실제 증명이라 여긴다.

MM에 대한 Nif 융합 폴리펩티드의 표적화에 대한 결론은 여러 줄의 증거에 근거하였다. 먼저, 식물-발현된 Nif 폴리펩티드 각각의 크기는 MPP에 의한 가공으로부터 생성되는 예상 크기와 일치하였다. 보다 작은 분자량은 세균-생성된 폴리펩티드(완전 길이, 가공되지 않은)에 비해 식물-발현된 Nif 융합 폴리펩티드의 경우에 관찰되었으며, 이는 MPP에 의한 Nif 융합 폴리펩티드의 가공을 가리켰다. 추가로 MTP 서열이, 상기 MTP를 미토콘드리아 내수송 기구에 의해 가공될 수 없게 돌연변이되었을 때, 보다 큰 폴리펩티드가 NifD 및 GFP 융합 폴리펩티드 모두에 대해 관찰되었으며, 이는 가공된 및 가공되지 않은 폴리펩티드간의 크기의 차이와 일치하였다. 최종적으로 및 결론적으로, 질량 분광분석은 pFAγ::NifH가 기질 중 특정 가공에 대해 예상된 바와 같이 MTP의 잔기 42-43사이에서 절단됨을 판정하였으며, 이는 MTP 서열이 Nif 폴리펩티드에 융합시 절단될 수 있음을 보인다.

MTP의 존재가 항상 Nif 단백질의 완전한 가공을 유도하지는 않았다. 예를 들어, NifX::FLAG 구조물 및 NifD::HA 구조물 중 2개는 가공된 및 가공되지 않은 융합 폴리펩티드 모두의 축적을 생성시켰다. 더욱이, 강한, 구성적 35S 프로모터의 사용에도 불구하고, 폴리펩티드 축적 수준의 상당한 정도의 가변성이 다양한 Nif 융합 폴리펩티드에 대해 관찰되었다. 추가로, 예상된 폴리펩티드보다 더 짧은 것이, 상기 폴리펩티드의 C-말단의 에피토프의 존재를 통해 검출된 Nif 융합 폴리펩티드 중 일부에 대해 관찰되었다.

모든 Nif 융합 폴리펩티드 중에서, NifD 폴리펩티드가 검출 가능한 수준으로 생성시키기에 가장 어려웠다. 이는 NifD 유전자 발현의 결여 또는 mRNA의 불안정성에 기인한 것이 아니었으며, 불충분한 번역 및/또는 단백질 불안정성이 NifD 융합 폴리펩티드 풍부성을 제한할 수도 있었다. 세균에서 고도로 발현되어야 하는 요건(Poza-Carrion et al., 2014)을 포함하여, 니트로게나제 기능에서 NifD의 지극한 중요성을 고려할 때, 상기 문제는 극복해야 할 필요가 있었다.

실시예 10. 인실리코 모델링을 사용하는 니트로게나제 폴리펩티드 구조 및 기능의 조사

세균 니트로게나제는 활성 효소를 형성하기 위해 결합시킬 필요가 있는 다수의 상이한 Nif 폴리펩티드로 구성된 금속단백질 복합체이다. 발명자는 각각의 상응하는 야생형 폴리펩티드에 비해 각각의 Nif 폴리펩티드의 N-말단 또는 C-말단에서의 아미노산 연장이 각각의 개별적인 폴리펩티드 및 조립체의 생화학적 기능 및 식물 세포내 효소 복합체의 기능을 방해할 수도 있는지의 여부를 고려하였다. 상술한 실시예에서, 식물 세포 내로 도입된 트랜스유전자에 의해 암호화된 Nif 융합 폴리펩티드를 미토콘드리아 표적화 펩티드(MTP)를 사용하여 미토콘드리아 기질로 향하게 하였다. 그러나, 상기 공정은 MPP에 의한 절단 전의 보다 긴 서열 또는 절단 후의 보다 짧은 서열로 각각의 니트로게나제 폴리펩티드의 N-말단을 연장시켰다. 상기 연장이 기능에 필요한 촉매 중심 또는 단백질-단백질 계면을 방해함으로써 니트로게나제 복합체의 기능에 영향을 미칠 수도 있는지를 시험하기 위해서, 발명자는 먼저 니트로게나제 폴리펩티드 NifH, NifD, NifK, NifE, NifN, NifS 및 NifU에 대한 N- 및 C-말단 연장의 영향을 예측하는 세균 니트로게나제 서브유닛의 상동성 모델을 사용하였다. 유사하게, FLAG, HA 및 MYC 에피토프와 같은 에피토프 태그를 폴리펩티드의 C-말단에 통상적으로 가하여 세포 추출물로부터의 검출 또는 정제를 허용한다. 야생형 세균 니트로게나제를 형성하는 개별적인 성분 및 단백질 복합체 중 다수가 결정화되었으며 단일 폴리펩티드 또는 다중단백질 복합체로서 이들의 구조를 조사하였다. 따라서, 발명자는 케이 뉴모니아에 아미노산 서열을 기본으로, 각각의 Nif 폴리펩티드에의 연장 및 번역 융합과 같은 다양한 변화의 영향을 모델링하기 위해 상기 고해상도 구조를 사용하였다.

방법: 분자 모델링에 사용되는 소프트웨어

각각의 Nif 폴리펩티드 및 상기 폴리펩티드를 함유하는 복합체에 대한 상동성 모델을 악셀리스 디스커버리 스튜디오 3.5에서 실행된 바와 같은 MODELLER 프로그램(Sali and Blundell, 2013)을 사용하여 구성하였다. 상기 상동성 모델을 형성시키기 위한 적합한 주형을 브룩해븐 단백질 데이터뱅크에 대한 BLAST 검색을 사용하여 확인하였다. 주형 폴리펩티드를 표 4에 나열하며, 이들 대부분은 에이 비넬란디이로부터 유래된다. 서열 정렬을 디스커버리 스튜디오 3.5에서 실행된 바와 같이 ClustalW 알고리즘(Sali and Blundell, 2013)을 사용하여 수행하였다. 모든 분자 동력학 시뮬레이션을 앰버 12로 수행하였다.

결과: NifH 구조

NifD-NifK-NifH 복합체로부터의 에이 비넬란디이 NifH 구조는 케이 뉴모니아에 NifH 서열에 비해 C-말단에서 더 짧은 17 아미노산 잔기였으나, 달리 2개의 NifH 폴리펩티드는 시험된 다른 Nif 폴리펩티드보다 더 고도로 상동성이었다(표 4). 따라서 케이 뉴모니아에 NifH 폴리펩티드 서열을 사용하여 하기에 기재되는 바와 같이 구성된 상동성 모델을, 상기 서열로부터 상기 17 아미노산을 생략시킨 후에 구성하였다.

NifD-NifK 및 NifD-NifK-NifH 복합체

케이 뉴모니아에로부터의 NifD 및 NifK 폴리펩티드를 사용하는 NifD-NifK α₂β₂ 이종사량체 구조의 모델을 구성하고 분자동력학 시뮬레이션에 의해 시험하였다. 상기 모델을 주형으로서 에이 비넬란디이로부터의 NifD-NifK 복합체(PDB ID: 1FP4, NifD 및 NifK만)의 결정 구조를 사용하여 악셀리스 디스커버리 스튜디오 3.5에서 실행한 바와 같은 MODELLER 알고리즘을 사용하여 구성하였다. 케이 뉴모니아에 및 에이 비넬란디이간의 NifD 일치성은 73.2%였고 NifK의 경우 65%였다. 이어서 두 번째 모델을 케이 뉴모니아에 NifD, NifK 및 NifH 폴리펩티드(NifD-NifK-NifH α₂β₂γ₄ 이종팔량체) 3개 전부를 포함하는 복합체에 대해서 PDB ID: 1N2C를 사용하여 구성하였다. 이는 상기 두 번째 모델이 C- 또는 N-말단 연장에 의해 불리한 영향을 미칠 수도 있는 NifD-NifK와 NifH 서브유닛과의 상호작용을 밝혀내는지를 시험하기 위해 수행되었다. 발명자는 상기 두 번째 모델로부터, NifK 서브유닛의 C-말단이 상기 복합체의 코어 중에 묻혀있고 NifK의 5개의 C-말단 잔기와 인접한 서브유닛간의 수소 결합 및 염 가교를 포함하여, 상기 인접한 NifK 및 NifD 서브유닛 모두의 다수의 잔기와 접촉하게 만들어졌음을 관찰하였다. 이는 NifD-NifK 모델에서 관찰된 것과 일치하였다. 발명자는 야생형 케이 뉴모니아에 서열에 비해 NifK 폴리펩티드에의 임의의 C-말단 연장이 상기 복합체의 붕괴를 생성시켜, 니트로게나제 활성에 관하여 덜 안정한 형태 또는 완전히 비-기능성인 복합체를 유도하는 듯하다는 결론을 내렸다. 대조적으로, NifD 및 NifH 서브유닛의 C-말단은 상기 복합체의 표면에 놓이며 따라서 상기 효소 복합체의 형성 및 기능을 붕괴시키지 않으면서 NifD 및 NifH 폴리펩티드의 C-말단에 연장이 이루어질 수 있음이 예측되었다. 에이 비넬란디이 NifH 구조의 모델은 케이 뉴모니아에의 C-말단으로부터 생략된 17 아미노산 잔기가 또한, 17 잔기 연장의 범위내에 있는 NifD-NifK-NifH 복합체 중에 '구멍'이 존재하지 않으므로 표면상에서 종결될 것을 예측하였다. 유사하게, NifD, NifK 및 NifH 서브유닛에 대한 N-말단이 또한 상기 복합체의 표면에 놓이며 이들 N-말단은 연장의 부가를 가능하게 할 것이라는 결론이 내려졌다.

NifEN 복합체

케이 뉴모니아에 NifE-NifN 서열에 대한 합당한 상동성을 갖는 NifE-NifN α₂β₂ 이종사량체 구조를 브룩해븐 프로테인 데이터뱅크에서 입수할 수 있었지만, 상기 NifN 구조 중 C-말단으로부터 23개 잔기의 누락이 존재하였으며, 이는 입수할 수 있는 균등한 NifD-NifK α₂β₂ 이종사량체 구조에서 보이는 바와 같이 복합체의 코어내로 다시 폴딩된 듯하다. 추가로, 상기 모델에 불필요한 불확실성을 가중시킬 수도 있는 NifE 구조의 N-말단으로부터의 22 잔기 누락이 존재하였다. NifE-NifN α₂β₂ 이종사량체는 에이 비넬란디이로부터의 NifD-NifK α₂β₂ 이종사량체와 동일한 폴딩을 공유하였으므로(PDB ID: NifH-NifD-NifK-NifH 복합체를 함유하는 1N2C, NifE-NifN 및 NifD-NifK 복합체에 대해 4 Å의 중첩 RMSD), NifD-NifK 구조가 NifE-NifN 상동성 모델의 형성시 주형으로서 대신 사용되었다. 상기의 추가적인 장점은 NifE 및 NifN 서열의 말단의 거의 완전한 커버리지였다. 이는 또한 NifE-NifN 말단과 NifH간의 가능한 상호작용(존재하는 경우), 및 상기 서브유닛 중 어느 하나상의 말단 영역의 변경이 복합체 형성 또는 활성 부위 접근성을 잠재적으로 방해하는지의 여부를 조사할 수 있게 하였다.

따라서 케이 뉴모니아에 NifE-NifN α₂β₂ 이종사량체 모델이 에이 비넬란디이 NifD-NifK 구조를 통해 구성되었다. NifD-NifK 모델과 유사하게, NifE 및 NifN 서브유닛의 C- 및 N-말단은, 상기 구조의 코어에서 종결된 NifN C-말단을 제외하고 상기 복합체의 표면에서 종결되었다. 케이 뉴모니아에 NifE 서열의 N-말단은 인접한 NifK 서브유닛(상동성 모델에서 NifN)과 접촉시킨 19 잔기의 합당하게 잘-보존된 신장부와 함께 NifD의 N-말단보다 18 아미노산 잔기만큼 더 짧았다. 상기 모델로부터, NifE의 C- 또는 N-말단의 연장이 상기 복합체의 구조 또는 기능에 유해한 영향을 미치지 않을 것으로 예상되지만, NifN의 C-말단은 연장을 허용하지 않는 듯하다는 결론이 내려졌다. 51 아미노산 잔기의 비교적 긴 서열이 에이 비넬란디이 NifK 구조의 N-말단에 존재하였으나 케이 뉴모니아에 NifN 서열 중에는 상응하는 서열이 존재하지 않았다. 상기 모델에서, 여분의 아미노산 잔기는 NifD와 NifK 단위 사이의 계면 밖을 따라 놓인다. 촉매 코어는 상기 서열로부터 차폐되었다. 이러한 관찰로부터, MPP에 의한 절단(생리적 pH에서 양으로 하전된(+8) 35 잔기의 N-말단 연장을 남긴다) 후에 pFAγ MTP 서열은 아마도 비구조 태양을 유지하고 용매 노출된 채로 남아있을 것이라는 결론이 내려졌다. 더욱 또한, NifD-NifK 주형 구조로부터, 케이 뉴모니아에 NifN의 N-말단의 여분의 아미노산 잔기가 허용될 수 있다는 결론을 지지하는 선례가 존재하였다. NifN 중 상기와 같은 N-말단 연장이 상기 단위 중 임의의 단위의 촉매 기능 또는 조립을 방해할 것을 암시하는 것은 없다. 다른 한편으로, NifN의 C-말단은 효소의 코어내에 묻히는 것으로 예상되었다. 현저하게, 상기는 고도로 보존된 NifK의 C-말단보다 6 잔기 더 길었으며, 따라서 이들 잔기가 관련될 수도 있는 상호작용의 정확한 성질은 알려지지 않은 채로 있다. 에이 비넬란디이 NifD-NifK α₂β₂ 이종사량체와 케이 뉴모니아에 NifE-NifN α₂β₂ 이종사량체간의 폴딩의 유사성을 근거로, NifN의 C-말단에 대한 변경, 특히 연장은 상기 복합체의 2차 구조 및 4차 구조에 해로운 영향을 미칠 수도 있음이 예측되었다. 야생형 NifN 폴리펩티드와 동일한 C-말단을 사용해야 한다는 결론이 내려졌다.

NifS 모델

케이 뉴모니아에 NifS의 상동성 모델을 동종이량체인 기능 단위를 갖는 이 콜라이로부터의 시스테인 데설푸라제의 구조를 통해 구성하였다. 케이 뉴모니아에 NifS의 C-말단에서 마지막 11개 아미노산 잔기는 상기 모델링에 포함되지 않았다. 케이 뉴모니아에 NifS에 대한 상동성 모델을 동종이량체로서 구성하였으며 N- 및 C-말단이 상기 구조의 표면에 놓이는 것이 관찰되었다. 분석된 대부분의 Nif 폴리펩티드에 관하여, MPP에 의한 가공 후 남아있는 pFAγ MTP 아미노산 잔기는 상기 동종이량체에 불리한 영향을 미치지 않는 것으로 예측되었다. NifU 및 NifS 폴리펩티드는 상호작용할 수 있음이 입증되었지만(Yuvaniyama et al., 2000), 상기 상호작용의 정확한 물리적 성질은 알려지지 않고 있다. N- 또는 C-말단의 연장이, 하나가 존재하는 경우, NifU 및 NifS간의 물리적 상호작용을 붕괴시킬 수 있다.

NifU 모델

케이 뉴모니아에 NifU에 대한 브룩해븐 프로테인 데이터뱅크 중의 가장 가까운 합치는, 동종삼량체로서 결정화된 아쿠이펙스 아에오리쿠스(Aquifex aeolicus)로부터의 철-황 클러스터 단백질(IscU), PDB ID: 2Z7E였다. 정렬은 2Z7E의 단량체(120 잔기)에 대해 양호한 상동성을 보였지만, NifU 서열은 상당히 더 길어서(271 잔기), C-말단에 대략 150 잔기가 모델링되지 않았다. 따라서 C-말단 151 잔기를 제외한, 케이 뉴모니아에 NifU의 상동성 모델을, 주형으로서 아쿠이펙스 아에오리쿠스로부터의 철-황 클러스터 단백질(IscU)을 사용하여 구성하였다. N-말단은 서브유닛의 '상단'에서 잘 커버되고 무리를 이루었다. NifU 폴리펩티드의 N-말단이 MTP 서열에 융합되는 경우 상기 구조가 NifS 폴리펩티드와의 상호작용을 허용할 것인지의 여부를 확실히 예측할 수는 없었다.

요약하면, 대부분의 Nif 폴리펩티드상의 N-말단에서 아미노산 연장은 필요한 기능의 상실 없이 허용이 예측된다는 결론이 내려졌다. NifK 및 NifN의 C-말단에 대한 연장은 복합체 형성 및 기능의 붕괴에 가장 민감한 것으로 예측되었다. 이어서 이러한 결과는 발명자에 의해 사용되어, 핵 게놈 중 트랜스유전자로부터의 발현 및 식물 미토콘드리아의 기질내로의 전좌를 위한 기능성 니트로게나제 폴리펩티드의 설계를 안내하는데 도움이 되었다.

실시예 11. NifD 및 다른 Nif 융합 폴리펩티드의 동시-발현

발명자는 NifD 융합 폴리펩티드의 생성 및 축적을 개선시키기 위해 추가의 접근법을 시도하였다. 질소 고정 세균에서, NifD, NifK 및 NifH는 수소 결합, 정전기적 상호작용 및 소수성 상호작용을 통해 강하게 상호작용하여 니트로게나제 복합체의 촉매 코어를 형성한다. 실시예 10에 기재된 단백질 구조 모델링은, NifK와 다른 2개의 폴리펩티드, NifD 및 NifH간의 유효한 복합체 형성이 NifK 중의 야생형 C-말단 아미노산 서열, 즉 C-말단의 마지막 4개 잔기(예를 들어 서열번호 7의 잔기 517-520)로서 아미노산 잔기 DLVR(서열번호 69)의 존재에 의존함을 밝혀내었다. 상술한 실험에서, 발명자는 9 아미노산의 HA 에피토프를 포함한 17 아미노산의 C-말단 서열이 부가된 NifK 융합 폴리펩티드를 사용하였다. 실시예 10에 기재된 모델링은 상기 NifK 서열이 C-말단 연장때문에 NifD와의 상호작용에 최적이 아닐 수도 있음을 예측하였다. 따라서 발명자는 NifD 구조물과 야생형 C-말단을 갖는 NifK 폴리펩티드의 동시-발현이 NifD 융합 폴리펩티드의 공-축적을 개선시킬 수도 있는지의 여부를 시험하기로 하였다.

베이스 벡터로서 pRA00을 사용하여, C-말단 연장 없이 pFAγ::NifK 융합을 암호화하는 유전자 구조물을 제조하였다. 상기 구조물을 pRA25로 표기하였다(표 3). 상기 폴리펩티드의 아미노산 서열을 서열번호 60으로서 제공한다. 침투를 pRA25(pFAγ::NifK)와 pRA24(pFAγ::NifD::HA)의 조합으로 엔 벤타미아나 잎에서 수행하였으며 앞서 사용된 pRA11(pFAγ::NifK::HA)와 pRA24에 비교하였다. 상기 NifD 폴리펩티드의 수준을 젤 전기영동 및 HA 항체를 사용하는 웨스턴 블럿팅에 의해 비교하였다. 놀랍게도, pRA25(C-말단 연장 또는 에피토프 없는 pFAγ::NifK)와의 공-침투는 pRA11(C-말단 연장을 갖는 pFAγ::NifK)와의 공-침투에 비해 NifD 융합 폴리펩티드의 축적을 실질적으로 증가시켰다. 상기 실험에서, 혼합물 중 pRA11의 포함은 NifD 융합 폴리펩티드의 축적을 증대시키지 않는 듯 하였지만, 반복 실험에서 pRA11을 사용하여 약간의 증가가 존재하였다. NifD 구조물 단독 또는 NifK 및 NifH 구조물과의 조합의 침투에 따른 웨스턴 블럿 사진을 도 9에 도시한다. 도 9에 도시된 블럿에 대해서, pRA19를 단독으로 침투시켰을 때(레인 11) NifD 융합 폴리펩티드에 대한 밴드를 보기 위해서는 보다 긴 노출이 필요하였다.

다른 침투의 경우, pFAγ::NifH::HA 구조물 pRA10을 NifD 및 NifK의 조합에 가하였다(도 9의 레인 1-3). 이는 NifD 융합 폴리펩티드의 축적 수준을 추가로 증대시켰다. 이는 야생형 C-말단을 갖는 NifK 폴리펩티드의 존재가 pRA19로부터의 NifD 번역 생성물을 안정화시키고 NifH 구조물의 부가가, 추정상 상기를 프로테아제 활성으로부터 보호함으로써 NifD 융합 폴리펩티드의 축적을 추가로 증대시킴을 가리켰다.

NifD 융합 폴리펩티드의 개선된 축적이 미토콘드리아 기질에서 발생하는지를 시험하기 위해서, pFAγ::NifH::HA(pRA10) 및 pFAγ::NifK(pRA25) 구조물을 비-기능성 MTP(pRA22, mFAγ::NifD::HA)를 갖는 NifD의 버전과 동시-발현시켰다. 상기 융합 폴리펩티드는 N-말단 도메인 중 오직 아미노산에서만 pFAγ::NifD::HA와 상이하였다. 비-기질 표적화된 mFAγ::NifD::HA 융합 폴리펩티드는 기질 표적화된 pFAγ::NifD::HA 폴리펩티드와 동일한 수준으로 축적되지 않음이 관찰되었다(도 9, 레인 2 및 3 비교). 이는 NifD 폴리펩티드의 개선된 축적이 MM에서 발생하는 듯함을 입증하였으며 상기가 상호작용하여 단백질 복합체를 형성시킴을 암시하였다. 상기 결론은 NifD::HA에 융합된 MTP 서열의 가공 정도가 NifK 및 NifH 폴리펩티드의 존재하에서 증가한다는 관찰에 의해 강화되었다.

코돈-최적화된 구조물 pRA24를 NifK(C-말단 연장 없음) 및 NifH 구조물과 함께 사용시, NifD 융합 폴리펩티드가 훨씬 더 높은 수준으로 축적되었다(도 9, 레인 1). 또 다른 침투에 의해, NifK 및 NiFH 구조물로부터의 동시-발현이 절단된:절단되지 않은 pFAγ::NifD::HA 융합 폴리펩티드의 비를 증가시킴이 관찰되었다.

C-말단 연장의 존재 또는 부재하에서 NifK를 암호화하는 구조물의 동시-발현이 또한 pFAγ::NifD::FLAG 축적을 증대시킬 수 있는지를 측정하기 위해서, pRA25 및 pRA07의 조합을 잎 세포 내로 도입시켰다. pRA10과의 추가적인 조합을 또한 일부 침투에서 수행하였다. FLAG 에피토프를 검출하는 항체를 사용하여, NifD::FLAG 융합 폴리펩티드를 웨스턴 블럿(상부 패널, 도 10)에서 검출하였으며, 이는 NifD::FLAG 폴리펩티드의 축적이 NifK::HA 융합 폴리펩티드와의 동시-발현에 의해 증대됨을 나타낸다. 이는 발명자가 NifD::FLAG 융합 폴리펩티드를 검출한 최초였으며; 앞서 검출 결여에 대한 실시예 2-5에서 보고된 결과를 참조하시오. NifD::FLAG 폴리펩티드 축적 수준이 C-말단 연장이 없는 NifK를 암호화하는 구조물의 동시-발현에 의해 보다 큰 정도로 증대되었다. NifH 및 NifK(C-말단 연장 없음) 구조물이 동시-침투되었을 때(레인 1, 도 10) NifD::FLAG 융합 폴리펩티드의 가장 큰 수준이 관찰되었다. 즉, 상기 조합에 NifH 융합 폴리펩티드의 부가가 NifD 융합 폴리펩티드 수준을 훨씬 더 증대시켰다. 상기 결과는 에피토프 태그(HA 또는 FLAG)에 관계없이, NifD 축적이 C-말단 연장 없는 NifH:HA 및 NifK에 의해 증대됨을 입증하였다.

추가의 침투로부터의 웨스턴 블럿을 도 11에 도시한다. 상기 실험은 또한 pRA07로부터의 pFAγ::NifD::FLAG 축적의 수준이 pRA10(pFAγ::NifH::HA) 및 pRA25(pFAγ::NifK)의 동시-도입에 의해 증가됨을 보였다. pRA25와의 조합을 다시 pRA11(NifK, C-말단 연장있음)과의 조합과 비교하였다, 도 11의 레인 10 및 11 참조. NifD 밴드의 강도를 정량분석하고 배경 밴드 중 하나의 강도에 표준화시, NifD::FLAG 축적의 수준이 pRA11에 비해 pRA25와의 동시-발현에 의해 약 50%까지 증가되는 것으로 밝혀졌다. 따라서, NifK(C-말단 연장 없음) 및 NifH의 조합은 HA-태그된 NifD 폴리펩티드 외의 NifD 융합 폴리펩티드의 축적을 도왔으며, C-말단 연장을 갖는 NifK 폴리펩티드보다 더 NifD 융합 폴리펩티드 축적을 증가시켰다.

종합해보면, 상기 결과는 NifH, NifK 및 NifD 폴리펩티드의 조합이 식물의 미토콘드리아에서 NifD 융합 폴리펩티드의 축적을 개선시킴을 가리켰다. 발명자가 알고 있는 바로는, 이는, 특히 미토콘드리아에 표적화시, NifH와 NifK와의 동시-발현에 의한 식물 세포 중 NifD 축적의 증대에 대한 최초 보고서이다. 또한, NifK의 야생형 C-말단이 NifD의 축적에 이로우며, NifH가 NifD 융합 폴리펩티드의 풍부성을 추가로 증대시킨다는 결론이 내려졌다. NifD 축적에 대한 NifH 및 NifK 폴리펩티드의 양의 효과가 NifD 암호화 영역의 코돈-최적화에 의해 더욱 증대되었다. 또한, 도 9의 레인 1에서 NifD 융합 폴리펩티드의 풍부성은 pFAγ::NifK::HA 폴리펩티드의 경우에 접근함이 주목되었다. 발명자는 이들 두 핵심 성분의 동몰의 풍부성이 식물 세포에서 니트로게나제 기능에 이로울 것으로 생각하였다.

NifD 융합 폴리펩티드 수준에 대한 NifK 및 NifH의 이로운 효과를 근거로, 발명자는 이어서 NifS 융합 폴리펩티드의 동시-발현이 NifD 축적을 증대시킬 수 있는지를 시험하였다. NifS는 니트로게나제 조립체의 초기 단계에 관련된 시스테인 데설푸라제이며, 이때 상기는 Fe-S 클러스터 형성을 위해 황(S)을 동원한다. 상기 Fe-S 클러스터는 니트로게나제 복합체에 필수적이다. 이를 위해서, 에이 튜메파시엔스의 조합(각각 상기 구조물들 중 하나를 함유한다)을 엔 벤타미아나 잎에 동시-침투시켰다. pFAγ::NifD::FLAG(pRA07) 융합 폴리펩티드를 암호화하는 구조물을 상기 실험에 사용하였다. 놀랍게도, pFAγ::NifS::HA 구조물(pRA16)과 NifD::FLAG 구조물과의 조합은 또한 후자 폴리펩티드의 축적을 증가시켰다(도 10에서 레인 6 및 11 비교). NifS 융합 폴리펩티드의 동시-생성은 NifD 융합 폴리펩티드의 축적을 증가시킨다는 결론이 내려졌다.

발명자는 상기 실험에서 또 다른 놀랍고 뜻밖의 현상을 관찰하였다. 도 10에서 볼 수 있는 바와 같이, 상응하는 구조물로부터 검출된 NifH::HA, NifK::HA 및 NifS::HA 융합 폴리펩티드 각각의 수준은 NifD::FLAG 구조물을 또한 동시-도입시켰을 때, 상기 구조물들을 단독으로 도입시켰을 때에 비해 실질적으로 감소하였다. 레인 5와 7, 6과 9, 및 3과 8을 비교할 때, 감소 비율은 NifH::HA의 경우 42%, NifS::HA의 경우 37% 및 NifK::HA의 경우 36%이었다. pFAγ::NifD::FLAG 구조물(pRA07)의 동시-도입은, 동시-도입된 두 번째 Nif 융합 구조물의 발현에 음의 영향을 미치는 듯하였다. 상기 현상을 추가로 조사하였다.

상기 폴리펩티드가 식물 세포에서 회합하는지를 입증하기 위해서, pRA07을 포함하는 유전자 조합의 도입 후에 단백질 추출물을 FLAG 에피토프와 결합하는 항체와 배양하여 NifD::FLAG 폴리펩티드 및 상기에 결합된 임의의 다른 폴리펩티드를 면역-침전시킨다. 상기 침전된 폴리펩티드(들)를 전기영동하고 블럿을 HA 에피토프에 대한 항체로 프로빙한다. 면역침전되고 HA 에피토프를 함유하는 폴리펩티드, 예를 들어 pFA::NifH::HA가 검출된다. 비-변성 조건하에서 크기 배제 크로마토그래피를 또한 사용하여 다중-폴리펩티드 단백질 복합체의 형성, 특히 NifD, NifH 및 NifK 융합 폴리펩티드의 회합을 입증할 수 있다.

실시예 12. NifDK 융합 폴리펩티드의 구성

NifH 및 NifK 융합 폴리펩티드의 동시-발현이 식물 세포에서 NifD 수준의 안정화에 영향을 미친다는 발견은 발명자로 하여금 니트로게나제 중 NifD의 이종사량체 상대인 NifK를 NifK 폴리펩티드에 융합시키는 방식을 설계하게 하였다. 상기 전략은 또한 NifD 폴리펩티드를 가능한 프로테아제 활성으로부터 보호할 수 있는 것으로 생각되었으며, 발명자는 상기가 낮은 수준의 NifD 축적에 원인일 수도 있다고 생각하였다. 더욱 또한, 세균에서 NifD 및 NifK 폴리펩티드는 거의 동량으로 존재하며(Poza-Carrion et al., 2014) 상기 서브유닛들은 니트로게나제의 결정 구조 중에서 1:1 비로 발견된다(Schmid et al., 2002). 발명자는 상기 두 폴리펩티드의 직접적인 융합이 상기 폴리펩티드의 동등한 비를 보장할 것이라 생각하였다.

그러나, 상기 전략은 하기와 같이 단일 폴리펩티드 쇄의 적합한 단백질 폴딩을 제공하기 위해서, NifD 및 NifK 단위를 결합시키기 위해 아미노산 링커의 삽입을 필요로 하는 것으로 밝혀졌다. 케이 뉴모니아에로부터의 NifD-K α₂β₂ 이종사량체의 상동성 모델을, 주형으로서 아조토박터 비넬란디이로부터의 NifD-K 복합체의 결정 구조(PDB ID: 1FP4, (Schmid et al., 2002))를 사용하여 구성하였다. 케이 뉴모니아에 및 상응하는 에이 비넬란디이 폴리펩티드의 정렬시, 아미노산 서열 일치성은 NifD 폴리펩티드의 경우 72.2% 및 NifK 폴리펩티드의 경우 67.3%이었다. 케이 뉴모니아에 D₂K₂ 이종사량체에 대한 구조 모델에서, 각각의 NifD 서브유닛의 C-말단은 그의 NifK 상대의 N-말단으로부터 대략 47 Å이었다. 따라서, 상기 길이의 링커가 상기 두 유닛을 연결시키는 것으로 설계되었다. 상기 링커는 길이가 30 잔기이며 최종 아르기닌이 알라닌에 의해 교체된, 하이포크레아 제코리나(Hypocrea jecorina) 셀로비오하이드롤라제 II(수납 번호 AAG39980.1, ATPPPGSTTTR; 서열번호 61)로부터의 공지된 비구조화 링커 영역으로부터 11-잔기 섹션, 이어서 8-잔기 FLAG 에피토프(DYKDDDDK; 서열번호 62), 이어서 최종적으로 아르기닌이 알라닌에 의해 교체된 11-잔기 비구조화 링커 서열(전체 링커 서열: ATPPPGSTTTADYKDDDDKATPPPGSTTTA; 서열번호 63)의 또 다른 사본으로 이루어졌다. 상기 아르기닌의 교체는 상기 링커의 중심 FLAG 에피토프 중의 음으로 하전된 잔기와의 잠재적인 정전기적 상호작용을 감소시키도록 설계되었다. 명백한 상호작용 또는 배좌 균주가 NifD-NifK 단위 중 어느 하나 및 융합 폴리펩티드의 링커 사이, 또는 상기 링커 자체 내에 확실히 존재하지 않게 하기 위해서(상기는 상기 D와 K 단위의 그들 고유의 배향으로 회합하는 능력에 유해할 수 있다), 기하학적 최적화 및 평형화를, 10.0 Å의 용질로부터 최소 경계 거리로 8면체 TIP3P 워터 박스 중의 일정한 압력에서 복합 융합 폴리펩티드(금속 중심 중 어느 것도 포함하지 않는)의 이량체상에서 수행하였다. 상기 계산은 2 fs 시간단계 및 SHAKE 구속을 사용하여 총 5 ns에 걸쳐 298 K에서 ff99SB 력장을 사용하는 앰버 12를 사용하여 수행되었다.

30-아미노산 링커를 포함하는, NifD-링커-NifK 복합 폴리펩티드의 예측된 구조(도 12)를 검사하였으며, 이는 상기 링커의 부가가 고유 NifD-NifK 복합체를 모방하는 구조로의 전체 융합 폴리펩티드의 폴딩을 허용함을 보였다. NifD-링커-NifK 폴리펩티드의 이량체에 결합된 2개의 NifH 서브유닛을 추가로 포함하는 두 번째 모델(도 13)을 조립하였으며, 상기는 링커의 부가가 NifH 서브유닛의 결합을 방해하지는 않는 듯함을 보였다. 따라서, 상기 융합 폴리펩티드를 암호화하는 구조물을 설계하고, pFAγ MTP를 포함하는 N-말단 연장을 갖는 pRA00을 근거로 제조하였다(pRA02). pFAγ::NifD-링커-NifK 융합 폴리펩티드의 아미노산 서열을 서열번호 64로서 제공한다.

두 번째 구조물에서, HA 에피토프를 포함하는 C-말단 연장을 암호화된 폴리펩티드의 NifK 유닛의 C-말단에 부가하여 HA 항체를 갖는 융합 단백질의 검출을 가능하게 하였으며, 달리 상기 암호화된 폴리펩티드의 나머지는 pRA02의 경우와 동일하였다. 두 번째 구조물을 pRA20으로 표기하였다. pFAγ::NifD-링커-NifK::HA 융합 폴리펩티드의 아미노산 서열을 서열번호 65로서 제공한다. 첫 번째 암호화된 융합 폴리펩티드는 구조 성분 pFAγ::NifD-링커(FLAG)-NifK를 갖는 반면, 두 번째는 pFAγ::NifD-링커(FLAG)-NifK::HA였다.

pRA20을 엔 벤타미아나 세포 내로 도입시키고 단백질 추출물을 웨스턴 블럿팅에 의해 검사할 때(도 14), 2개의 특정한 밴드가 상기 폴리펩티드에 대해 예측된 크기 범위에서 대략 120 kDa에서 검출되었다. 상기 두 밴드의 가까움은 MTP 예비-서열의 가공되지 않은 및 가공된 형태 모두가 존재함을 암시하였다. 상부 밴드는 하부 밴드보다 더 큰 강도를 가졌으며, 이는 가공이 단지 부분적으로만 발생하였음을 암시한다. pFAγ::NifD-링커(FLAG)-NifK::HA 폴리펩티드의 축적 수준은 병행 침투에서 pFAγ::NifD::HA의 경우보다 실질적으로 더 컸고, pFAγ::NifK::HA의 경우보다는 훨씬 작았다(도 14).

실시예 13. 식물체에서 니트로게나제 폴리펩티드의 동시-발현을 위한 다중-유전자 구조물의 생성

식물 세포에서 기능성 니트로게나제를 생성시키기 위해서, 3개의 코어 구조 단백질 NifD, NifH 및 NifK, 및 NifB, NifE 및 NifN을 포함한 다수의 보조 Nif 단백질을 암호화하는 유전자를 세포에 도입시키고 대등하게 발현시킬 필요가 있을 것이다. 다수의 트랜스유전자의 게놈 통합을, 하나의 T-DNA 내에 다수의 발현 카세트(각각 상이한 Nif 폴리펩티드의 발현을 유도한다)를 함유하는 형질전환 구조물을 사용하여 성취할 수 있다. 상기와 같은 설계는 경우에 따라, T-DNA의 하나의 게놈 위치내로의 통합을 제공할 것이다. 따라서 발명자는 3개의 독립적인 다중-유전자 구조물(이들은 단일 형질전환 사건에서 병용되는 경우, 15 트랜스유전자를 포함하는 3개의 T-DNA의 식물 게놈내로의 통합을 허용하였다)을 설계하고 제조하였다. 상기 3개의 T-DNA는 각각 상이한 선택성 마커 유전자를 함유하였으며 따라서 이들은 하기와 같이 독립적으로 선택될 수 있었다.

토마스 반헤르케 박사(Dr Thomas Vanhercke)(CSIRO 농식품, 오스트레일리아 캔버라 소재)로부터 수득한 2원 벡터 pDCOT를 출발 벡터로서 사용하였다. 상기는 2원 벡터 pORE_04(Coutu et al., 2007; 진뱅크 수납 번호 AY562542.1)와 동일한 주쇄 서열 및 좌측- 및 우측-경계 T-DNA 서열을 갖는다. 선택성 마커 유전자 카세트 외에, pDCOT의 T-DNA 영역은 4개의 발현 카세트를 함유하였으며, 각각의 카세트는 클로닝 목적의 독특한 제한 부위가 측면 인접하고 있는 강한, 구성 프로모터 및 전사 종결자/폴리아데닐화 영역을 포함하였다. 각각의 프로모터에 이어서, 각각의 발현 카세트는 또한, 식물 세포에서 생성되는 mRNA로부터의 최적화된 번역을 위한 독특한 클로닝 부위 바로 앞에 담배 모자이크 바이러스 Ω 리더 서열(TMVΩ)을 함유하였다. 상기 상이한 카세트 중의 프로모터 및 종결자 서열을 상기 벡터내 서열 반복을 제한하기 위해 변화시켰으며, 이는 형질전환에 따른 식물내 발현의 침묵화를 감소시킬 것으로 생각되었다. 추가로, 카세트 1 및 2, 및 카세트 4 및 선택성 마커 카세트는 각각 기질-결합된 영역(MAR) 서열에 의해 분리되어 하나의 발현 카세트로부터 또 다른 카세트로의 전사 방해를 감소시켰다. pDCOT 중 선택성 마커 유전자 카세트는 항생제 카나마이신에 대한 내성을 부여하는 NPTII 유전자였다. 상기 pDCOT 벡터는, 프로모터, TMVΩ, 클로닝 부위 및 종결자/폴리아데닐화 서열을 순서대로 포함하는 각각의 발현 카세트가 독특한 제한 부위에 의해 측면 인접되어, 카세트의 간단한 교환을 허용한다는 점에서, 발현 카세트의 배열에서 모듈이었다.

형질전환 벡터내 개별적인 유전자 발현 카세트의 수를 증가시키기 위해서, 다섯 번째 발현 카세트를 하기와 같이 원래 pDCOT 벡터 중에 존재하는 독특한 KpnI/AatII 부위 사이에서 pDCOT에 삽입하였다. 다섯 번째 발현 카세트에 대한 DNA 단편을, 증대된 CaMV 35S 프로모터에 이어서 TMVΩ 리더 서열, 이어서 트랜스유전자 삽입을 위한 독특한 클로닝 부위(Bstz171/SbfI) 및 최종적으로 nos 3' 종결자 영역을 함유하도록 설계하고 합성하였다. 5' KpnI 부위 및 3' AatII 부위가 측면 인접한 전체 선택 카세트를, pDCOT 내로의 지향성 클로닝을 위한 제한 부위를 사용하여 pDCOT에 삽입하였다. 이는 상기 다섯 번째 발현 카세트를 MAR 서열과 선택성 마커 유전자 카세트 사이에 삽입하였다. pKT100의 구조를 도 15에 개략적으로 도시한다.

pDCOT 및 그의 유도체 pKT100 중의 프로모터 중 일부는 에이 탈리아나 루비스코 작은 서브유닛 유전자(아라트-루비스코(Arath-Rubisco)/SSU)로부터 유래하였으며, 상기 유전자는 조명하에 녹색 조직에서 트랜스유전자 발현을 제공하는 반면, 상기 벡터 중의 다른 카세트는 구성적 발현을 위해 CaMV 35S 프로모터 서열을 사용하였다. Nif 폴리펩티드의 발현을 위한 초기 구조물의 경우, 모두 구성적으로 발현되어야 하는 것이 바람직하였으며, 따라서 상기 아라트-루비스코/SSU 프로모터를 다른 식물 바이러스-기반 구성적 프로모터로 교체하였고, 이와 동시에 최종 벡터내 서열 반복이 감소되었다. 선택된 교번의 구성적 프로모터는 세스트럼 누른잎 오갈 바이러스(CmYLCV) 프로모터 Cm4(Sahoo et al., 2014) 및 서브테라니언 클로버 스턴트 바이러스(SCSV) 프로모터 S7 및 S4(Schunmann et al., 2003)의 유도체였다. 상기 사용된 Cm4 프로모터 서열은 5' 단부에서 MluI 부위 및 임의의 불필요한 3' UTR 서열의 존재를 피하기 위해서 상기 CmYLCV 전사 개시 부위(Sahoo et al., 2014)에 대해 -271 내지 +5에 뉴클레오티드를 포함하였다. 각각의 프로모터 서열은 5' UTR에 TMV 리더 서열을 포함하였으며 교체시키려는 프로모터에 사용되는 것들에 합치되는 독특한 제한 부위, 구체적으로 CmYLCV Cm4의 경우 MluI/BamHI, SCSV S7의 경우 NruI/ApaI 및 SCSV S4의 경우 XmaI/NatI가 측면에 인접하였다. 각각의 프로모터 서열은 상업적인 공급자에 의해 합성되었다. 표준 제한 절단 및 지향성 클로닝을 사용하여 각각의 프로모터 서열을 순차적인 방식으로 교환하여 pKT-HC를 생성시켰다.

3개의 벡터를 사용하여 식물 세포에서 15 이하의 트랜스유전자를 대등하게 발현시키기 위해서, 각각의 벡터는 상이한 선택성 마커 유전자를 갖는 것이 바람직하였다. pDCOT 선택 카세트 중의 선택성 마커 유전자는 카나마이신 내성을 부여하는 NptII 효소를 암호화하였다(Bevan et al., 1983). 각각 하이그로마이신 B 및 글루포시네이트 암모늄/포스피노트리신(BASTA)에 대한 내성을 부여하는 Hpt(Waldron et al., 1985) 및 Bar(Block et al., 1987)을 암호화하는 교번 유전자를, 이들이 식물에서의 선택에 사용하기에 적합하기 때문에 선택하였다. pDCOT의 선택 카세트에서 NptII 암호화 영역에 측면 인접한 제한 부위와 합치하는 FseI/AscI 제한 부위가 측면 인접된, 이들 폴리펩티드를 암호화하는 DNA 단편이 상업적인 출처에 의해 제조되었다. 표준 제한 절단 및 지향성 클로닝을 사용하여 pKT-HC 중의 NptII 암호화 영역을 Hpt 암호화 영역 또는 Bar 암호화 영역으로 교체하여, pKT-HC, pKT-IC 및 pKT-JC라 칭하는 3개의 다중-유전자 벡터 세트를 생성시켰다. 각각 도 15에 도시된 바와 같은 유전자 구조, 및 표 5에 요약된 바와 같은 성분을 가졌다.

실시예 14. 다중-유전자 벡터로부터 식물 세포에서 Nif 폴리펩티드의 발현

다중-유전자 벡터에서 각각의 발현 카세트의 트랜스유전자 발현 능력을 입증하고 비교하기 위해서, 5개 구조물 세트를 제조하였으며, 여기에서 pFAγ::NifH::HA 융합 폴리펩티드를 암호화하는 단백질 암호화 영역이 각각의 발현 카세트내에 별도로 삽입되었다. MTP-NifH-HA의 정확한 삽입을 갖는 구조물을 그의 HindIII 제한 효소 절단 패턴에 의해 식별하였으며, 아그로박테리움 튜마파시엔스 균주 GV3101의 형질전환에 사용하였다. 이어서 엔 벤타미아나 일시적인 잎 발현 시스템(실시예 1)을 사용하여 단백질 발현을 평가하였으며, 이때 잎은 3개의 GV3101 균주, 즉 pFAγ::NifH::HA 구조물을 함유하는 것, 두 번째 pRA01, 및 p19 침묵 억제인자 단백질의 발현에 대한 벡터를 함유하는 세 번째 균주의 혼합물로 침투되었고, 각각 35S 프로모터에 의해 구동되었다. 상기 실험에서, pRA01은 GFP 형광에 의해 단백질 합성에 대한 양성 대조용으로서 제공되었다. 잎 조직을 4일 후에 수확하였으며 단백질 추출물을 상술한 바와 같이 젤 전기영동 및 웨스턴 블럿팅에 의해 분석하였다. 웨스턴 블럿을 항-HA 및 항-GFP 1차 항체 및 양고추냉이 페록시다제(바이오래드(BioRad))에 연결된 염소 항-마우스 2차 항체로 프로빙하였다. 애머샴 ECL 웨스턴 블럿팅 검출 시약(GE 헬쓰케어 라이프 사이언시즈)을 적용시킴으로써 화학발광 신호를 생성시켰고 이를 CCD 이미저를 사용하여 문서로 기록하였다. pFAγ::NifH::HA의 발현이 각각의 개별적인 발현 카세트로부터 관찰되었으며(도 16), 이에 의해 T-DNA의 일시적인 도입 후 잎 세포에서 강한, 구성적인 방식으로 Nif 융합 폴리펩티드를 발현시키는 다중-유전자 벡터 중의 각 프로모터의 능력을 확인하였다.

이어서 pKT-HC 벡터를 기본으로, 하나의 T-DNA 중에 5개의 개별적인 Nif 융합 폴리펩티드를 암호화하는 다중-유전자 벡터를 구성하였다. 각각의 Nif 암호화 영역을 각 발현 카세트 중의 독특한 클로닝 부위에 의해 순차적인 방식으로 삽입하였다. pFAγ::NifH::HA에 대한 암호화 영역을 카세트 1에 삽입하고, pFAγ::NifS::HA에 대한 영역을 카세트 2에 삽입하고, pFAγ::NifM::MYC에 대한 영역을 카세트 3에 삽입하고, pFAγ::NifU::HA에 대한 영역을 카세트 4에 삽입하고, pFAγ::NifZ::MYC에 대한 영역을 카세트 5에 삽입하였다(도 4). pFAγ::NifM::MYC 융합 폴리펩티드의 아미노산 서열을 서열번호 67로서 제공한다. HC13으로서 지칭되는 최종 구조물을 사용하여 에이 튜메파시엔스 균주 GV3101을 형질전환시켰고 상기 형질전환된 세포를 상술한 바와 같은 방법을 사용하여 엔 벤타미아나 잎을 침투시키는데 사용하였다. 웨스턴 블럿 분석은 HC13으로부터 발현된 폴리펩티드가 pFAγ::NifH::HA, pFAγ::NifM::MYC, pFAγ::NifS::HA 및 pFAγ::NifU::HA에 대해 예상되는 크기에서 분명히 검출될 수 있음을 보였다(도 17). NifM 및 NifU 융합 폴리펩티드는 NifH 및 NifS 융합 폴리펩티드보다 더 낮은 수준으로 축적되었지만, 여전히 분명하게 검출될 수 있었다. 대조용 pFAγ::GFP에 대한 레인(레인 2)에서 또한 관찰되는 배경 신호가 pFAγ::NifZ::MYC에 대해 예상되는 밴드와 동일한 위치에 있었지만(도 17B), 레인 4에서의 신호 크기가 레인 2에서의 경우보다 훨씬 더 강하였다. 발명자는 5개의 Nif 융합 폴리펩티드가 모두 단일의 연속적인 유전자 구조물로부터 발현된다는 결론을 내렸다.

식물의 안정한 형질전환.

유전자 구조물을 함유하는 아그로박테리움 튜메파시엔스를 사용하여 침지법(Bechtold et al., 1993), 구체적으로 HC13에 의해 에이 탈리아나를 형질전환시켰다. 상기 처리된 식물로부터 종자를 수집하였다. 상기 종자를, 안정하게 형질전환된 식물을 선택하기 위해 적합한 선택제를 함유하는 조직 배양 배지상에 도말하고, 이를 성숙을 위해 생육 토양으로 옮긴다. 트랜스제닉인 것으로 나타난 식물로부터 종자를 수집하고 파종하여 자손 식물을 생성시킨다. 상기 트랜스유전자에 동형접합성인 자손 식물을 식별하고 선택한다. 상기 트랜스유전자의 발현 수준을 표준 qRT-PCR 방법에 의해 분석하고 에피토프를 함유하는 융합 폴리펩티드의 축적 수준을 상술한 일시 발현 실험에 관한 웨스턴 블럿 방법에 의해 측정한다.

실시예 15. 동시-발현된 트랜스유전자에 대한 NifD 구조물의 영향

실시예 11에 기재된 바와 같이, 뜻밖에도, 특정한 NifD 융합 폴리펩티드를 암호화하는 구조물(pRA07, pRA19)을 다른 Nif-발현 구조물과 동시-침투시킬 때, Nif-발현 구조물 모두의 발현이 현저하게 감소되는 것으로 밝혀졌다(도 10). 특정한 구조물 pRA19는 인간 코돈 사용에 따라 최적화된 뉴클레오티드 서열을 가졌다. 따라서 발명자는 감소된 발현을 피하고자, 상기 발현의 범위 및 원인을 이해하고자 하였다.

먼저, 상기 영향이 pRA19 및 pRA01의 조합에 특이적인지를 알아보기 위해서, pRA01(pFAγ::GFP)로부터 T-DNA를 엔 벤타미아나 잎 세포 내로 단독으로 또는 pRA19(pFAγ::NifD::HA, 인간 코돈 최적화된) 또는 pRA16(pFAγ::NifS::HA)과 함께 도입시키거나, 또는 pRA01, pRA19 및 pRA16 3개 모두를 병용하였다. 이전과 같이, 침묵 억제인자를 발현하는 구조물 p19를 포함하는 에이 튜메파시엔스를 대조용을 포함한 모든 침투물에 포함시켰다. 침투후 4일째에, 침투된 엔 벤타미아나 잎의 배축 표면을 자외선(UV)광에 노출시키고 사진촬영을 하여 GFP 발현의 강도를 측정하였다. pRA01로 침투된 영역에 대해 관찰된 형광과 비교하여, pRA19 + pRA01에 대한 GFP 형광의 현저한 감소가 존재하였으며, 형광은 거의 볼 수가 없었다. 대조적으로 pRA16 + pRA01의 경우 형광을 분명하게 볼 수 있었지만, 2개의 T-DNA를 사용하는 경우 희석으로부터 예상되는 바와 같이 pRA01 단독에 비해 형광의 약간의 감소가 관찰되었다. 이어서, GFP 및 NifS 융합 폴리펩티드 축적 수준을 젤 전기영동 및 항-HA 및 항-GFP 항체를 사용하는 웨스턴 블럿팅에 의해 비교하였다. 관찰된 GFP 형광 수준과 일관되게, pFAγ::GFP 축적 수준이 pRA19를 pRA01과 함께 침투시켰을 때 감소한 반면, pFAγ::GFP의 수준은 pRA16 및 pRA01를 동시-도입시켰을 때 단지 약간 낮아졌다(도 18). 3개의 구조물을 모두 동시-도입시켰을 때, pFAγ::NifS::HA 축적 수준이 또한 pRA19를 포함시키지 않았을 때에 비해 현저하게 낮아졌다. 따라서, pRA19로부터 T-DNA의 도입에 의해 야기된 감소는 pRA01로부터 pFAγ::GFP의 감소로 제한되지 않았다.

상기 하향-조절의 범위 및 방식을 추가로 조사하기 위해서, 추가적인 구조물을 단독으로 또는 pRA19와 함께 또는 NifD 융합 폴리펩티드를 암호화하는 다른 구조물과 함께 도입시켰으며, 단백질 및 mRNA 트랜스유전자 모두의 발현 수준뿐만 아니라 UV광 하에서의 형광 강도를 분석하였다. 이전과 같이, pRA19로부터 T-DNA의 도입은 GFP 형광 및 동시-도입된 pRA16으로부터 GFP 및 pFAγ::NifS::HA 융합 폴리펩티드 모두에 대한 단백질 수준의 감소를 유도하였다. 그러나, 이는 NifD-NifK 융합 폴리펩티드(pFAγ::NifD-링커-NifK::HA)를 암호화하는 pRA24(pFAγ::NifD::HA, 아라비도프시스 코돈 사용에 의해 코돈-최적화됨) 또는 pRA20을 동시-도입시키는 경우가 아니었다. 현저하게, pRA24 및 pRA20은 pRA19와 동일한 NifD 아미노산 서열을 암호화하였으나 이들은 아라비도프시스 코돈 사용을 기준으로 코돈-최적화되기 때문에 상이한 뉴클레오티드 서열을 사용하였다. 이러한 관찰을 근거로, 발명자는 pRA19의 하향 조절 효과가 가능하게는 pRA19의 T-DNA로부터 전사된 특정한 NifD-암호화 RNA 서열에 의해 촉발되는 것으로 간주하였다.

상기 하향-조절 효과가 단백질 및/또는 RNA 수준에서 발생하는지를 판정하기 위해서, RNA를 동일한 침투된 영역으로부터 추출하고 qRT-PCR에 의해 분석하였다. GFP 특이적인 프라이머를 사용하여, pRA19 + pRA01 조합에 대한 GFP mRNA의 수준이 pRA01 단독에 대한 수준에 비해 약 25%까지 낮게 감소함을 발견하였다. pRA16 및 pRA01을 병용하는 경우, 상기 감소는 2개 구조물 병용시 예상되는 바와 같이, pRA01 단독에 비해 50% 미만이었다. 이어서, pFAγ 펩티드를 암호화하는 RNA의 부분에 어닐링된 프라이머를 사용하여(이때 상기 프라이머는 동시에 발현되는 2개의 트랜스유전자 모두로부터 mRNA 영역을 증폭시킬 것이다), qRT-PCR 분석은 트랜스유전자 감소 수준이 pRA16 + pRA01에 비해 pRA19 + pRA01 조합의 경우 대략 50% 더 큰 것으로 측정하였다. 종합해보면, 이들 결과는 엔 벤타미아나 잎 세포 내로의 pRA19의 도입은 동시-발현된 트랜스유전자의 mRNA 및 단백질 수준 모두를 감소시키는 효과를 가짐을 보였다. 이는 대조용 유전자(GADPH)의 발현 수준이 모든 침투 실험에 걸쳐 일정하고 전체 단백질 합성 수준이 젤의 쿠마씨 염색에 의해 입증된 바와 같이 모든 침투에 대해 유사한 듯하기 때문에, 일반적인 mRNA/단백질 하향-조절 효과는 아닌 듯하였다. 종합해보면, 이들 결과는 pRA19의 T-DNA로부터 생성된 NifD 폴리펩티드를 암호화하는 mRNA의 본래 성질이 mRNA 및 단백질 수준에서 동시-도입된 트랜스유전자의 하향-조절을 유도함을 가리켰다.

RNA-매개된 유전자 침묵화의 한 가지 잘 확립된 방식은 RNA 간섭(RNAi)이라 지칭되는 공정인, 아고너트 단백질을 상보성 또는 상보성에 가까운 서열을 갖는 폴리뉴클레오티드의 발현을 감소시키도록 안내하는 21-24 뉴클레오티드 길이의 siRNA에 의해 수행되는 것으로 공지되어 있다. 그러나, pRA01(GFP) 또는 pRA16(NifS)에 의해 암호화된 RNA 서열을 갖는 pRA19로부터의 인간 코돈-최적화된 암호화 영역의 RNA 서열의 정렬은 아고너트 매개된 침묵화에 필요한 서열 상보성을 제공하기에 충분한 상동성의 신장을 밝히지 않았다. 상기 발견을 근거로, 특정한 NifD RNA 서열이 동시-도입된 트랜스유전자의 침묵화를 촉발하지만, 상기 침묵화 효과기는 pRA19 구조물 - GFP 및 다른 트랜스유전자와 서열 상보성을 공유하는 영역 중 어딘가에 존재하는 것으로 가정되었다. 상기 가설을 시험하기 위해서, pRA19와 동일하지만 mMTP를 함유하고 따라서 상기 MTP 영역의 부분 중에서 상이한 RNA 서열을 갖는 pRA22(mFAγ::NifD::HA)를 pRA01과 함께 도입시켰다. 비교를 위해서, pRA19 + pRA01 및 pRA24 + pRA01 조합을 또한 도입시켰다. 형광 강도로부터, pRA22 + pRA01 조합은 pRA24 + pRA01 조합과 대략 동일한 수준으로 GFP를 발현하는 듯하였다. 웨스턴 블럿팅으로부터, pRA24 + pRA01 및 pRA22 + pRA01 조합은 GFP 단백질 축적의 적은 감소를 나타낸 반면, pRA19 + pRA01은 GFP 단백질의 현저한 감소를 보였다. 이들 결과는 MTP 서열의, 다른 트랜스유전자에 대해 감소된 상보성을 갖는 서열로의 변형이 인간 코돈-최적화된 NifD 서열에 의한 하향-조절을 경감시킴을 입증하였다. 이는 pRA19에서 인간 코돈-최적화된 NifD RNA가 pFAγ 서열과 함께 트랜스유전자 하향-조절을 촉발함을 암시하였다. 선택적으로, 그러나 상호배타적이지는 않게, NifD 뉴클레오티드 서열 자체는 하향-조절의 개시를 촉발하기에 충분하였으나, NifD RNA의 상류 영역은 하향-조절을 야기하기 위해 트랜스유전자에 상보성이 요구되었다.

다른 트랜스유전자에 대한 인간 코돈-최적화된 NifD의 하향-조절 효과가 NifD RNA(NifD 단백질은 아님)의 성질임을 확인하기 위해서, pRA19에 거의 동일한 RNA 서열을 갖지만 MTP내에 조기 정지 코돈 및 프레임 이동을 생성시키는 2개의 뉴클레오티드 변화를 갖는 구조물을 설계하였다. 이를 pRA26(ΔFAγ::NifD::HA)이라 칭하였다. 하향-조절 기전이 RNA-매개 및 단백질-비매개되는 경우, pRA26은 pRA19와 유사하게 GFP 및 다른 Nif 구조물을 하향조절하는 것으로 예상될 수 있었다. 추가의 시험으로서, 인간 코돈-최적화된 NifD 구조물 pRA07(pFAγ::nifD:FLAG)을 또한 동시-도입시켰다. pRA07은 NifD 영역에서 pRA19에 일치하는 RNA 서열을 발현시키지만, HA 에피토프가 FLAG에 의해 교체되었기 때문에 에피토프 영역에서는 발현시키지 않을 것이다. 5일 후에, 형광 수준이 상기 침투된 대역에서 관찰되었다. 선행 실험과 일관되게, GFP 형광은 pRA19 + pRA01 조합에 대해 감소되었다. 형광이 또한 pRA26 + pRA01 및 pRA7 + pRA01 조합 모두에 대해 현저하게 감소되었다. 웨스턴 블럿팅은 pRA26이 pRA19에 비해 GFP 발현의 감소에 유사한 효과를 가짐을 가리켰다. 인간 코돈-최적화된 NifD mRNA는 NifD 단백질이 생성되지 않거나 에피토프가 변화되는 경우에조차 다른 트랜스유전자의 발현을 감소시킬 수 있는 것으로 결론이 내려졌다. 인간 코돈-최적화된 NifD RNA 서열의 변화가 트랜스유전자 하향-조절을 방지함을 보이는 선행 결과와 함께, pRA19에서 NifD 서열에 의한 트랜스유전자 발현의 감소는 특정한 NifD 인간 코돈-최적화된 RNA 서열의 결과로서 발생함이 결론적으로 입증되었다. pRA19에서 pFAγ::NifD::HA 융합 폴리펩티드 암호화 영역의 뉴클레오티드 서열은 서열번호 68로서 제공된다.

실시예 16. Nif 폴리펩티드 기능을 시험하기 위한 세균 발현 실험

상기 실시예에 기재된 바와 같이, 유전자 구조물을 제조하고, 에이 튜메파시엔스에 의한 합성 유전자의 도입과 함께 엔 벤타미아나 잎 세포 시스템을 사용하여 예시된, 식물 세포에서 Nif 융합 폴리펩티드의 생성에 대해 시험하였다. Nif 폴리펩티드의 N-말단에 부가된 미토콘드리아 표적화 펩티드(MTP) 및 C-말단 연장에 부가된 에피토프 태그의 인-프레임 융합을 갖는 융합 폴리펩티드를 설계하였다. 단백질 폴딩 및 회합의 모델링(실시예 10)이 N-말단 및 C-말단 연장의 대부분이 복합체 형성 및 기능을 방지하지 않을 것으로 예측하였지만, 발명자는 생체내 생물계에서 이들 연장이 고유의 Nif 폴리펩티드에 비해 융합 폴리펩티드의 기능에 영향을 미칠 수도 있는지의 여부를 시험하고자 하였다.

식물 세포에서의 발현 및 미토콘드리아내로의 전좌를 위해 설계된 Nif 융합 폴리펩티드, 및 그의 가공된 폴리펩티드 생성물을 세균 니트로게나제 발현 시스템에서의 그의 기능에 대해 시험하였다. 발명자는 니트로게나제 시스템에의 부가에 의해 개별적으로, 또는 반복해서 또는 심지어 다른 변형된 Nif 폴리펩티드와 함께 각각의 변형된 폴리펩티드를 분석할 수 있게 하는 시스템을 설정하였다. 상기 시스템은 이 콜라이에서, 시험하고자 하는 Nif 융합 폴리펩티드를 암호화하는 단일 Nif 유전자를 야생형 Nif 폴리펩티드를 암호화하는 상응하는 유전자 대신에 교환함으로써 변형시킨 야생형 니트로게나제 유전자 클러스터를 사용하였다. 이어서 각각 에틸렌 및 수소 생성 분석을 사용하여 니트로게나제 또는 니트로게나제 리덕타제 활성을 분석하여 Nif 융합 폴리펩티드가 상응하는 야생형 Nif 폴리펩티드 대신에 기능할 수 있는지의 여부를 판정하였다. 문헌[Smanski et al.(2014)]의 시스템에 기반한 세균 니트로게나제 벡터 시스템이 상기를 위한 토대였다. 상기 시스템에서, 니트로게나제 활성에 필요한 모든 야생형 유전자는 단일의 광범위 숙주-범위 발현 벡터, pMIT2.1내에 함유되었으며, 여기에서 유전자의 발현은 제2 플라스미드, pN249로부터의 유도성 프로모터/T7-RNA 폴리머라제 시스템으로 조절되었다. 이 콜라이에서 발현시, 야생형 세균 Nif 폴리펩티드의 전체 세트가 생성되었으며 이들은 함께 표준 아세틸렌 환원 분석(ARA, 니트로게나제 활성에 대한 디팩토 측정)에서 아세틸렌으로부터 에틸렌의 생성에 의해, 또는 니트로게나제 리덕타제 활성에 대한 수소 생성에 의해 분석될 수 있는 활성을 갖는 니트로게나제 효소 복합체를 제공하였다.

pMIT2.1 및 그의 유도체와 함께 사용되는 방법은 하기와 같았다. 이 콜라이 균주 DH5α의 세포를, 각각 항생제 클로람페니콜 및 스펙티노마이신에 대한 내성을 부여하는 2개의 플라스미드 pMIT2.1 및 pN249로 형질전환시켰다. 상기 형질전환된 세포를 클로람페니콜(34 ㎎/L) 및 스펙티노마이신(80 ㎎/L)을 함유하는 LB 배지(10 g/L 트립톤, 5 g/L 효모 추출물, 10 g/L NaCl)상에서의 증식에 의해 선택하였다. 형질전환된 세포를 37 ℃에서 항생제를 함유하는 LB 배지 중에서 밤새 1.0의 광학 밀도로 호기성으로 증식시켰다. 상기 배양물을 10,000 g에서 1분간 원심분리시키고 상등액을 버렸다. 상기 세포를 N 공급원이 없고, 25 g/L Na₂HPO₄, 3 g/L KH₂PO₄, 0.25 g/L MgSO₄.7H₂O, 1 g/L NaCl, 0.1 g/L CaCl₂.2H₂O, 2.9 ㎎/L FeCl₃, 0.25 ㎎/L Na₂MoO₄.2H₂O, 및 1.5 ㎖/L의 10% 세린이 보충된 20 g/L 슈크로스(최소 배지)를 함유하는 1 부피의 유도 배지에 재-현탁시켰다. 모액을 필터 살균하였다. Nif 유전자 발현의 유도를 위해서, 상기 배지에 이소프로필-β-D-1-티오갈락토피라노시드(IPTG; 골드 바이오(Gold Bio) #I2481C25 2S9)를 0.1 mM, 0.5 mM 또는 1.0 mM, 달리 서술되지 않으면 일반적으로 1.0 mM의 최종 농도로 보충하였다. 세포 현탁액을 13cc 배양 플라스크로 옮기고 크림프-잠금 시스템을 사용하여 기밀 고무 밀봉으로 캡핑하고 헤드공간을 순수한 N₂ 기체로 20분간 살포하였다. 이어서 상기 현탁액을 30 ℃에서 200 rpm으로 진탕시키면서 5시간 동안 배양하였다. 상기 후에, 아세틸렌 환원 분석(ARA)을 1.5 cc의 순수한 C₂H₂(BOC 기체, 장비 등급)의 주입에 의해 시작하고 3시간 동안 및 이어서 18시간까지 추가로 배양하였다. 상기 두 시점 모두에서 에틸렌의 생성을 에이질런트 6890N GC 장비를 사용하여 화염 이온화 검출(GC-FID)과 함께 기체 크로마토그래피에 의해 측정하였다. 헤드공간 샘플(0.5 cc)을 분할/무분할 유입구에 10:1 분할 방식으로 수동으로 주입하였다. 상기 장비는 하기의 매개변수하에서 작동하였다: 200 ℃의 유입구 및 FID 온도, 35 ㎝/초의 캐리어 He의 평균 속도, 120 ℃의 등온 오븐 온도. RT-알루미나 본드/MAPD 컬럼(30 m x 0.32 ㎜ x 5 ㎛)을 검출기 단부에 커플링된 5 m 입자 트랩 컬럼과 함께 사용하였다. 상기 장비의 분석 성능을 적합한 블랭크 및 표준을 실행시켜 분석하였다. 이러한 조건하에서, 에틸렌은 약 2.3분째에 상기 컬럼으로부터 방출되었고 아세틸렌은 약 3.1분째에 방출되었다. 상기 GC 시스템은 상기 포맷에서 유일한 다른 검출 가능한 피크로서 아세틸렌으로부터의 분명한 분해와 함께 에틸렌을 0.00001% atm 만큼 낮은 수준에서 검출할 수 있었으며, 따라서 대단히 민감하였다. 에틸렌 생성의 경우, 0.5 cc의 헤드공간 샘플을 IPTG 첨가후 상이한 시점에서, 일반적으로 3시간 및 18시간째에 취하였다.

양성 대조용으로서 이 콜라이 균주 DH5α에서 야생형 pMIT2.1 및 pN249를 사용하는 분석 시스템은 IPTG가 생육 배지에 첨가되지 않은 경우 단지 잔량 수준의 에틸렌을 생성시킨 반면, IPTG를 0.1 mM, 0.5 mM 또는 1.0 mM로 생육 배지에 첨가하면 에틸렌 생성량을 크게 증가시켰다. 에틸렌 생성 비율은 3시간 샘플링으로부터 18시간까지 및 또한 IPTG 농도가 증가함에 따라 크게 증가하였으며, 이는 증가된 Nif 유전자 발현에 따라 증가되는 니트로게나제 활성을 가리킨다. 이러한 결과는 IPTG가 상기 발현 시스템에서 Nif 유전자 발현 및 니트로게나제 형성을 빠르게 유도함을 입증하였으며, 이는 문헌[Smanski et al.,(2014)]과 일치하였다.

선행 실시예에 기재된 바와 같이, pFAγ MTP 아미노산 서열은 식물 미토콘드리아에서 절단되어 가공된 Nif 융합 폴리펩티드의 Nif 폴리펩티드의 N-말단에 융합된 38 아미노산 잔기를 남겼다. 상기와 같은 N-말단 연장이 융합 폴리펩티드의 기능을 변경시키는지를 시험하고, 세균 분석 시스템이 작동함을 입증하기 위해서, 117 bp의 DNA 단편(서열번호 70)을, 주형으로서 pRA10 DNA를 사용하여 PCR에 의해 합성하였다. 상기 DNA 단편은 번역 개시를 위한 Met에 의한 N-말단 Ile 잔기의 치환, 플러스 C-말단의 추가적인 Thr 잔기를 제외하고 pFAγ MTP의 C-말단 부분과 동일한 서열의 38 아미노산을 암호화하였다. Nif 폴리펩티드 중 어느 하나를 암호화하는 유전자의 개시 코돈의 상류에서 직접 인-프레임 융합시, 키메릭 유전자는 상기 선택된 Nif 폴리펩티드에의 번역 융합을 암호화하도록 그렇게 설계되었다. 39 아미노산 폴리펩티드(본 명세서에서 이후부터 pFAγ-C라 칭한다)의 아미노산 서열을 서열번호 71로서 제공한다.

pFAγ-C에 대한 DNA 단편을 다양한 기법, 예를 들어 불활성 단부 결찰, 이어맞추기 중복 PCR 및 유도된 리가제 순환 기법(de Kok et al., 2014)에 의해, pMIT2.1 중의 NifH, NifM, NifD, NifK, NifE, NifN 또는 NifB를 암호화하는 유전자의 번역 개시 코돈의 바로 상류에 삽입하였다. 일례로서, 117bp DNA 단편을 하기와 같이, pMIT2.1상의 NifD 유전자의 단백질 암호화 영역과 인-프레임 융합시켰다. pMIT2.1 DNA를, NifD 유전자의 개시 코돈(ATG)이 5' 단부에 있고 번역 개시 코돈의 바로 5'에서 NifD 유전자의 뉴클레오티드 서열이 생성물의 3' 단부를 형성하도록 프라이머를 사용하여 증폭시켜 선형 DNA 생성물을 생성시켰다. 이를 성취하기 위해서, PCR을 프라이머 NifD-F 5'-ATGATGACTAATGCTACTGGCGAACGTAACCTG-3'(서열번호 72) 및 NifD-R 5'-CCGGCTCCTCCGCTAGATAAAAATGTGA-3'(서열번호 73)을 사용하여 수행하였다. 상기 증폭을 96 ℃ 30초, 이어서 30 주기의 92 ℃ 20초, 55 ℃ 20초, 및 72 ℃ 6분, 이어서 72 ℃ 10분의 PCR 프로토콜로, pMIT2.1 DNA 주형과 함께 퓨전(Phusion)-HF 프루프리딩 폴리머라제(NEB, 카탈로그 M05081L)를 사용하여 수행하였다. 상기 반응 생성물을 DpnI로 처리하여 벡터 주형 DNA를 제거하였다. PCR 생성물은 필수적으로 pMIT2.1의 선형화된 형태로, NifD 번역 개시 코돈의 바로 상류에서 개방되었다. 117bp 단편을 T4 DNA 리가제를 사용하여 상기 선형화된 pMIT2.1에 결찰시켜 pCW1001을 생성시켰다. 상기 117bp 단편의 결찰을 또한, 일루미나 앰플리가제(Illumina Ampligase)(일루미나, A8101) 및 문헌[de Kok et al.(2014)]에 개략된 조건을 사용하여 결찰 순환 반응 조건(LCR)을 사용하여 성취하였다.

pMIT2.1 DNA상의 증폭 반응의 충실도 및 정확성을 측정하고 뉴클레오티드 치환이 야생형 Nif 유전자에서 발생하지 않았음을 판정하기 위해서, 상기 선형화된 pMIT2.1 DNA의 샘플을 결찰시켜 환상 분자를 재생시키고 이를 이 콜라이 DH5α의 형질전환에 사용하였다. 재-결찰된 pMIT2.1을 함유하는 대략 10개의 별도의 콜로니를 상술한 바와 같이 아세틸렌으로부터의 에틸렌 생성에 대해 분석하여, 불활성화 돌연변이가 PCR 증폭에 의해 DNA 중에 통합되지 않음을 입증하였다. 벡터를 또한 서열분석하여 구성의 정확도 및 충실도를 보장할 수 있다.

벡터 pCW1001 및 pN249를 DH5α 내로 도입시키고 클로람페니콜 및 스펙티노마이신으로 선택된 세포를 형질전환시켰다. 유도 배지에서 상기 세포로부터 증식된 배양물을, 기질로서 아세틸렌 기체를 첨가하고 유전자 발현을 유도하기 위한 1 mM IPTG 및 헤드공간으로서 N₂ 기체를 사용하여 ARA 분석에서 에틸렌 생성에 대해 시험한다. 에틸렌의 생성은, 달리 동일한 야생형 NifD 폴리펩티드에 대한 39 아미노산 N-말단 연장이 니트로게나제 활성을 허용함을 가리킨다.

각각의 경우에 번역 개시 코돈의 바로 상류 위치에서 pMIT2.1 DNA를 선형화하는 적합한 프라이머 쌍을 사용하고 상기 위치에 117bp 단편을 삽입하는 유사한 접근법을 사용하여, 예를 들어 NifH, NifK, NifB, NifE, NifM 및 NifN을 포함한, pMIT2.1 중의 다른 Nif 유전자를 변형시킨다. 변형된 Nif 융합 폴리펩티드의 조합이 달리 동일한 야생형 니트로게나제 복합체에서 기능을 유지하는지를 시험하기 위해, 연속적인 라운드의 Nif 유전자 변형을 또한 수행하여 단일 벡터 중에 2개 이상의 Nif 유전자 변형의 조합을 생성시킨다.

Nif 융합 폴리펩티드의 생물학적 기능을 시험하기 위한 교번 분석 시스템은 특정한 Nif 유전자 중의 돌연변이체인 에이 비넬란디이의 돌연변이체를 사용하는 세균 상보성 분석이다. 이를 수행하기 위해서, 상기 Nif 융합 폴리펩티드를 암호화하는 유전자 서열을 광범위한 숙주 범위 플라스미드, 예를 들어 세균 에이 비넬란디이의 균주에서 번식될 수 있는 pMMB66EH(Furste et al. 1986)에 개별적으로 삽입한다. 각각의 생성된 유전자 구조물을, NifH 융합 폴리펩티드 기능을 시험하기 위해 에이 비넬란디이의 돌연변이 균주, 예를 들어 내인성 NifH 유전자의 5' 단부로부터 200 bp가 없는 균주 DJ1271 내로 도입시킨다. 개별적인 Nif 활성이 없는 다른 돌연변이 균주를 표 6에 나열한다. 이들 돌연변이는 상기 돌연변이체를 적합한 생육 조건하에서 대기 질소를 고정시킬 수 없게 한다. DJ1271 중의 기능성 NifH 유전자의 발현은 예를 들어 니트로게나제 활성을 복원시킨다. 따라서 상기는 다른 Nif 폴리펩티드와 회합시 변형된 NifH 융합 폴리펩티드를 기능에 대해 평가하기에 유용한 시험 시스템이다.

상기 폴리펩티드의 기능을 평가하기 위해서, 형질전환체의 생육을 무-질소 배지에서 평가할 수 있다. 상기 생육 배지 중 첨가된 질소원의 부재하에서, 에이 비넬란디이는 생육을 위해 대기 질소를 고정시켜야 한다. 변형된 NifH 융합 폴리펩티드가 기능성인 경우, DJ1271에서 상기 폴리펩티드의 과발현은 첨가된 질소가 없는 고체 배지상에서 생육하는 능력을 복원시킬 것이다. 한편으로, 니트로게나제 기능을 상기에 개략된 바와 같은 방법에서 아세틸렌 환원 분석(ARA)을 통해 분석할 수 있다. 상기 ARA는 무-질소 배지에서의 생육보다 더 큰 민감성으로 니트로게나제 활성을 측정한다.

상기 발현 시스템은 세균 중 Nif 융합 폴리펩티드의 기능을 시험하며, 이때 니트로게나제 기능에 필요한 다른 Nif 성분들 모두 상기 세균에서 암호화된다.

실시예 17. MTP 서열의 변형 및 그의 Nif 폴리펩티드와의 용도

실시예 5 내지 9에 기재되고 사용된 바와 같은 77 아미노산 잔기 길이(서열번호 38의 아미노산 1-77)의 pFAγ MTP 서열은 아라비도프시스 탈리아나 F1-ATPase-감마-서브유닛(Lee et al., 2012)으로부터 유래되었으며, 그의 단편을 여기에서 MTP-FAγ⁷⁷라 표기한다. MTP-FAγ⁷⁷과 원위 Nif 폴리펩티드간의 번역 융합을 암호화하는 유전자 서열의 제조를 위해 실시예 5에 사용된 클로닝 프로토콜은 AscI 클로닝 부위 및 여분의 염기로 이루어진 융합 연접에 개재 9 뉴클레오티 링커를 사용하여 판독 프레임을 유지시켰다. 상기 링커의 사용은 MTP-FAγ⁷⁷의 C-말단과 관심 폴리펩티드(예를 들어 GFP 또는 Nif)의 N-말단 사이에, 추가적인 3개의 아미노산, 즉 Gly-Ala-Pro(GAP)를 생성시켰다. 따라서 상기 암호화된 폴리펩티드는 미토콘드리아에서 절단에 앞서, 미토콘드리아내로 융합 폴리펩티드의 전달 및 미토콘드리아 기질 펩티다제(MMP)에 의한 예측 부위에서의 절단에 유효한 것으로 나타난 80 아미노산의 N-말단 연장을 포함하였다. 실시예 5-9에 기재된 바와 같이, MTP-FAγ⁷⁷은 식물 미토콘드리아 기질로 16개의 상이한 Nif 융합 폴리펩티드를 지향시킬 수 있고 MTP-FAγ⁷⁷ 서열이 MMP에 의해 미토콘드리아내에서 가공된다는 결론이 내려졌다. 절단은 42 아미노산 다음에 발생하여, 관심 GFP 또는 Nif 폴리펩티드, MTP-FAγ⁷⁷ + GAP로부터 유래하는 35 잔기에 융합된 38 아미노산 잔기의 N-말단 연장을 남겼다. 상기 N-말단 연장을 여기에서 FAγ-scar³⁸이라 칭한다.

발명자는 MTP 기능을 여전히 유지하면서 식물 세포에서 Nif 폴리펩티드와 함께 사용하기 위해 MTP-FAγ⁷⁷의 77 아미노산으로부터 MTP 서열을 단축시키고자 하였다. 발명자는 26 아미노산을 MTP-FAγ⁷⁷의 C-말단으로부터 잘라내어 MTP-FAγ⁵¹(서열번호 75)로서 표기되는 MTP를 생성시킬 수 있는지를 조사하였다. 발명자는 MTP-FAγ⁵¹이 아미노산 42 다음에 MPP에 의해 절단되어, 가공된 융합 폴리펩티드의 N-말단에서 MTP-FAγ⁵¹로부터 9 아미노산(ISTQVVRNR; 서열번호 76)을 남김을 예측하였다. 상기 9-아미노산 서열을 FAγ-scar⁹라 표기하였다.

MTP-FAγ⁵¹의 기능을 시험하기 위해서, NifH 또는 GFP에 융합된 상기 MTP를 암호화하는 유전자 구조물을 제조하였다. 상기 구조물은, MTP-FAγ⁵¹이 MTP-FAγ⁷⁷ + GAP보다는 각 폴리펩티드의 N-말단에 융합됨을 제외하고 pRA10(서열번호 42) 중의 NifH 유전자 또는 pRA01(서열번호 38) 중의 GFP 유전자와 동일한 변형된 NifH 또는 GFP 유전자를 포함하였다. 생성된 구조물을 pRA34(MTP-FAγ⁵¹::NifH) 및 pRA35(MTP-FAγ⁵¹::GFP)로 표시하였다. 일례로서 pRA01을 사용하여 결찰 순환 반응(de Kok et al 2014)에 의해 절두를 수행하였다. MTP-FAγ⁷⁷의 C-말단 29 아미노산을 암호화하는 뉴클레오티드 및 아미노산 GAP를 암호화하는 추가의 9 뉴클레오티드가 없는 pRA01을 프라이머 5'- ATGGTGAGCAAGGGCGAGGAG-3'(서열번호 xxx) 및 5'- GCGGTTACGCACCACTTGAGTTG-3'(서열번호 xxx) 및 주형으로서 pRA01을 사용하여 PCR에 의해 증폭시켰다. 생성되는 PCR 생성물을 문헌[de Kok et al.(2014)]에 개략된 조건으로 가교 올리고 5'- CTCCTCGCCCTTGCTCACCATGCGGTTACGCACCACTTGAGTTG-3' 및 일루미나 앰플리가제(일루미나, A8101)와 결찰시켰다. 상기 구조물을 엔 벤타미아나 잎 시스템에서 시험하고 MTP-FAγ⁷⁷ + GAP를 갖는 상응하는 구조물에 비교하였다. pRA34 및 pRA01에 대해서, 단백질 추출물을 침투된 잎 조직으로부터 생성시켰다. 비교를 위해 상기 추출물에 SDS PAGE 및 HA-항체를 사용하는 웨스턴 블럿 분석을 수행하여 단백질 발현 수준 및 MPP 가공 효율을 평가하였다.

가공되지 않은 융합 폴리펩티드에 대한 대조용으로서 사용된, MTP-FAγ⁵¹::NifH::HA(pRA34) 및 MTP-FAγ^77+GAP::NifH::HA(pRA10)를 암호화하는 구조물을 발현하는 이 콜라이로부터의 단백질 추출물은 가공되지 않은 MTP::NifH에 대해 예상된 크기의 폴리펩티드 밴드를 생성시켰다. 상기 구조물이 침투된 엔 벤타미아나 잎 조직으로부터의 단백질 추출물은 가공된 폴리펩티드에 대해 예상된 크기에 상응하는, 상응하는 세균 추출물보다 더 작은 크기의 폴리펩티드 밴드를 생성시켰다. 예를 들어, MTP-FAγ⁵¹::NifH::HA 폴리펩티드의 발현은 두 폴리펩티드간에 예상되는 크기 차이에 따라 MTP-FAγ^77+GAP::NifH::HA보다 작은 MW에서 밴드를 생성시켰다. 따라서, MTP-FAγ⁵¹ 아미노산 서열은 Nif 폴리펩티드를 식물 세포 중의 미토콘드리아 기질에 표적화할 수 있고 MPP에 의한 가공을 제공한다는 결론이 내려졌다. 폴리펩티드 발현 수준 및 가공 효율은 보다 긴 MTP만큼 양호하였다. 추가로, 보다 작은 크기의 보다 적은 폴리펩티드 밴드(분해 산물을 가리키는 것으로 생각된다)가 pRA34에 대한 블럿에서 HA 항체로 검출되었다. 발명자는 보다 짧은 MTP 서열이 뜻밖에도 N-말단 MTP::Nif 분해를 감소시킨다는 결론을 내렸다.

실험을 또한 융합-GFP 폴리펩티드를 암호화하는 pRA35로 수행하여 상기를 pRA01과 비교하였다. 형광에 의한 폴리펩티드의 국소화를 시각화하기 위해서, pRA01(pFAγ^77+GAP::GFP) 또는 pRA35(FAγ⁵¹::GFP) 암호화 구조물이 침투된 잎 조직을 공초점 현미경검사에 의해 검사하였다. 잎 샘플을 40x 수침 대물렌즈를 갖는 직립 레이카 현미경을 사용하여 영상화하였다. GFP가 488 ㎚에서 여기되었고 형광 방출이 기록되었다. 상기 두 구조물 모두에 대해서, GFP 형광이 동일한 국소화 패턴으로 작은 세포이하 바디 중에 국소화됨이 관찰되었다. 실시예 1에 기재된 바와 같이 미토콘드리아 국소화에 대해 시험되었고 pRA34에 대한 가공 데이터로부터의 pRA01과의 비교를 근거로, 발명자는 단축된 MTP-FAγ⁵¹이 합성 융합 폴리펩티드를 식물 세포의 미토콘드리아로 지향시킬 수 있고 미토콘드리아 중 MPP에 의한 그의 가공을 제공할 수 있다는 결론을 내렸다.

일련의 상이한 MTP 서열을, Nif 폴리펩티드의, 식물 세포의 미토콘드리아 기질로의 전좌에서 그의 성능을 평가하기 위해 시험하였다. 골든게이트(GoldenGate) 클로닝 시스템(Weber et al., 2011)을, 프로모터, 5'-UTR, 3'-UTR, N- 및 C-말단 연장 및 종결자를 포함하여 상이한 유전자 요소의 조립에 사용하였다. 각각의 요소는 요소들의 모듈식 조립 및 용이한 교환을 허용하는 한정된 경계를 가졌다. 따라서 문헌[Engler et al., (2014)]에 의해 기재된 바와 같은 성분들을 갖는 상기 클로닝 시스템을 MTP::Nif 융합 폴리펩티드의 생성에 대해서 매우 다양한 상이한 유전자 구조물을 시험하는데 사용하였다. 상기 골든게이트 클로닝 시스템은 그의 인식 서열 밖을 절단하는 IIS형 제한 효소를 사용하였기 때문에, 연접 서열내 제한 효소 클로닝 부위의 사용을 피할 수 있었다. 이는 pRA00 중에 존재하는 Gly-Ala-Pro 서열 없이 MTP::Nif 융합을 암호화하는 유전자의 구성을 허용하였으며 실시예 5-9에 기재된 바와 같은 AscI 제한 부위의 사용을 피하였다. MTP::폴리펩티드 융합의 연접에서 Gly-Gly 가교를 대신에 사용하여, 상기 골든게이트 시스템을 적합시켰다. 글리신이 MTP 서열의 -1 위치에서 그의 통상적인 존재로 인해 상기 결합에 대한 표준 아미노산으로서 선택되었다.

MPP에 의한 절단후 Nif 폴리펩티드의 N-말단에 융합된 상이한 남아있는 아미노산 잔기("scar")를 남기는 것으로 예측되는 상이한 길이(30-70 아미노산 잔기)의 일련의 상이한 MTP를 선택하였다(표 7). 상기 scar 서열은 길이가 0-36 아미노산 잔기의 범위였다. 골든게이트 클로닝 시스템을 사용하여, 식물 세포에서의 발현을 위해 다수의 Nif(표 8)와 상기 MTP의 조합을 사용하여 17개의 상이한 유전자 구조물을 조립하였다. 이들 융합에 사용된 NifD 및 NifS 폴리펩티드 서열은, 문헌[Temme et al.,(2012)]에 따른 서열을 사용하는 대신에, 실시예 5-9에 사용된 서열의 변이체였다. 상기 변이체 아미노산 서열을 각각 서열번호 95 및 서열번호 96으로 제공한다. 변이체 NifD 아미노산 서열(서열번호 95)은 서열번호 6으로서 제공된 483 아미노산의 서열과, 39, 41, 87, 96, 355 및 483번 위치에서 6개 아미노산 치환에 의해 상이하였다. 이들 모든 벡터의 경우, 프로모터, 5' 및 3'UTR 및 종결자가 동일하였다. 이들 구조물(각각 P19 침묵 억제인자 단백질을 생성시키는 구조물과 혼합되었다)을 함유하는 아그로박테리움 배양물을 엔 벤타미아나 잎 내로 개별적으로 도입시켰으며, 단백질 추출물이 침투-후 5일째에 생성되었다. SDS-PAGE 및 웨스턴 블럿 분석을 상기 단백질 추출물상에서 수행하였다. MTP::NifD 구조물에 의한 침투에 대해서, pRA25(pFAγ::NifK)를, C-말단 연장 없이 NifK의 동시-발현이 NifD 풍부성을 증대시키는 것으로 입증되었기 때문에(실시예 11) 동시-침투시켰다. 표 8은 식물 세포에서 생성된 폴리펩티드의 검출 및 각각의 MTP::Nif 융합 폴리펩티드에 대한 MPP(가공)에 의한 절단에 대한 결과를 요약한다.

MTP::Nif 융합물로서 번역에 의해 융합시, MTP-FAγ⁵¹은 시험된 모든 Nif 폴리펩티드에 대해 절단된 MTP::Nif 폴리펩티드를 생성시켰다(표 7). NifM 융합 폴리펩티드는 FAγ⁵¹에 융합시 단지 부분적으로 가공된 반면, 다른 Nif 융합 폴리펩티드는 보다 효율적으로 가공되었으며, 이는 상이한 Nif에 대한 가공 효율이 상기 하나의 MTP에 대해서 변할 수 있음을 입증한다. MTP의 C 말단에 융합된 HA 에피토프를 갖고, 이어서 NifH에 융합된 FAγ⁵¹의 버전(SN29)을 시험하였다. 상기 구조물로부터 발현된 폴리펩티드를 웨스턴 블럿 분석에 의해 검출하였다(표 8).

2개의 버전을 NifD에 융합된 CPN60 MTP에 대해 시험하였다. 하나의 버전에서, MTP를 Gly-Gly 링커가 CPN60 MTP(서열번호 77)와 NifD(SN11) 사이에 놓이도록 융합시켰다. 다른 버전(SN4)에서, CPN60 MTP(서열번호 78)를 NifD 폴리펩티드의 처음 메티오닌에 직접 융합시켰다. CPN60은 그의 아미노산 서열에서 C-말단 티로신 바로 뒤에서 절단되는 것으로 예상되었기 때문에, 상기 구조물은 이론적으로 야생형 N-말단을 갖는, 즉 "scar"이 없는 NifD 폴리펩티드를 생성시킬 것인 반면, SN11 구조물은 MTP(GlyGly)::NifD 융합의 절단 후에 Gly-Gly 연장을 남길 것으로 예상되었다. 놀랍게도, 이들 매우 유사한 구조물은 웨스턴 블럿 분석에 의해 입증된 바와 같이 상이한 결과를 생성시켰다: SN11은 가공되지 않은 CPN60(GlyGly)::NifD에 대해 예상된 크기의 폴리펩티드 밴드를 생성시킨 반면, SN4는 가공된 및 가공되지 않은 폴리펩티드 모두에 상응하는 밴드를 생성시켰으며, 이때 가공된 폴리펩티드보다 더 많은 가공되지 않은 폴리펩티드가 존재하였다. 더욱 또한, SN4에 의한 침투로부터의 단백질을 웨스턴 블럿에 의해 나란한 pRA24+pRA25(FAγ^77+GAP::NifD::HA + FAγ^77+GAP::NifK) 침투로부터 추출된 단백질(또한 실시예 11을 참조하시오)과 비교시, 상기 SN4 구조물이 상기 pRA24 구조물보다 상당히 적은 정확하게 가공된 폴리펩티드를 생성시킴이 자명하였다. 따라서, 상기 CPN60 MTP가 융합 폴리펩티드를 표적화할 수 있고 기질 가공이 야생형 NifD 폴리펩티드를 생성시키게 하였지만, 발현 수준 및 가공 효율은 낮은 것으로 나타났다(US2016/0304842). SN11의 경우, CPN60과 NifD간의 Gly-Gly 결합은 MTP의 가공을 방지할 수도 있었다.

초산화물 디스뮤타제 폴리펩티드로부터의 다양한 MTP를 또한, 단일 또는 탠덤 MTP로서, 및 Gly-Gly 결합에 앞서 C-말단에 Ile 및 Gln을 포함시키거나 포함시키지 않고 시험하였다. 폴리펩티드는 Ile 및 Gln 잔기를 함유하지 않는 SOD MTP(SN15, 서열번호 81 및 SN16, 서열번호 82)를 함유하는 버전의 경우 웨스턴 블럿 분석에 의해 검출되지 않은 반면, Ile 및 Gln 잔기(SN12, 서열번호 79 및 SN13, 서열번호 80)를 유지하는 버전은 검출 가능한 폴리펩티드를 생성시켰지만, 이들은 MPP에 의해 가공되지 않은 듯하였다. 대조적으로, 또 다른 시험된 MTP, L29(SN17, 서열번호 83)는 NifD에 융합시 강한 폴리펩티드 신호를 생성시켰다. 상기 MTP를 갖는 가공된 및 가공되지 않은 형태간의 작은 크기 차이로 인해, 가공 효율을 측정하기 위해 추가적인 실험이 필요할 것이다. L29 MTP는 절단된 Nif 폴리펩티드를 효율적인 방식으로 생성시킴이 예상된다. 최종적으로, 발명자는 C-말단에, 그러나 Gly-Gly 결합의 상류에 융합된 트윈 스트렙 태그(Buren et al. 2017)를 갖는 CoxIV MTP(SN19, 서열번호 86)를 시험하였다. 상기 MTP는 NifD에 융합시 웨스턴 블럿 분석에 의해, 미토콘드리아 기질 가공과 일치하는 크기의 강한 신호를 제공하였다.

세균 시스템에서 Nif 폴리펩티드에 융합된 상이한 scar 서열의 기능 시험

통합된 다양한 MTP 및 절단후 Nif 융합 폴리펩티드의 N 말단에 남은 서열의 Nif 폴리펩티드 기능에 대한 결과를 MIT2.1 시스템에서 평가하였다. 예를 들어, Ile 대신에 첫 번째 아미노산으로서 Met를 갖는, pFAγ-scar⁹를 암호화하는 DNA 단편을, 안내된 리가제 순환 기법(de Kok et al., 2014)에 의해 pMIT2.1 중의 Nif 유전자의 번역 개시 코돈의 바로 상류에 삽입하였다. 상기 구조물의 제조에 사용된 방법은 실시예 16에서 NifB에 대해 기재된 바와 같았다. pFAγ-scar⁹를 암호화하는 27 bp DNA 단편을 pMIT2.1 중의 다양한 Nif 유전자의 5' 말단에 융합시켰다. 이 콜라이의 형질전환 및 아세틸렌 환원 분석을 사용하는 니트로게나제 기능 시험을 실시예 16에 따라 수행하였다. 상기 분석은 NifB의 N-말단에의 9 아미노산 연장의 부가가, 변형되지 않은 pMIT2.1에 대해 관찰된 에틸렌 생성 수준과 비교시 니트로게나제 기능을 변화시키지 않음을 보였다. 유사한 방식으로, NifH, NifD, NifK, NifE 및 NifN이 또한 그들 각각의 N-말단에서 상기 9 아미노산 연장을 허용하였으며, 이때 NifH에 대해서는 완전한 활성을 가졌지만, 다른 경우에는 활성의 약간의 감소가 있었다. NifD, NifK, NifE 및 NifN의 N-말단에 대한 9 아미노산 연장은 각각 변형되지 않은 pMIT2.1의 경우에 비해 50%, 70%, 30%, 및 50%인 아세틸렌 환원 활성 수준을 생성시켰다. 다른 Nif 폴리펩티드, 즉 NifJ, NifY, NifQ, NifF, NifU, NifS, NifV, NifW, NifZ 및 NifM을 동일한 방식으로 시험한다. 상기와 같은 분석을 사용하여, 최적의 MTP 서열이 각각의 Nif 폴리펩티드에 대해 선택된다.

실시예 18. NifK의 C-말단에의 부가는 그의 활성을 파괴한다

실시예 10에 기재된 바와 같이, 발명자는 NifK 서브유닛의 C-말단이 NifD-NifK-NifH 단백질 복합체의 코어에 묻히고 야생형 서열에 비해 NifK 폴리펩티에 대한 임의의 C-말단 연장이 상기 복합체의 붕괴를 생성시키는 듯함을 케이 뉴모니아에로부터의 NifK 폴리펩티드 구조의 모델링으로부터 결론지었다. 이를 실시예 16에 기재된 세균 니트로게나제 시스템을 사용하여 pMIT2.1의 변형에 의해 기능적으로 시험하였다. 야생형 서열에 비해 9 아미노산 C-말단 연장을 갖는 변형된 NifK 폴리펩티드를 발현시키기 위해서, 하기와 같이 아미노산 서열 YPYDVPDYA(서열번호 97)의 첨가에 의해 상기 플라스미드를 변형시켰다.

NifK 변형을 도입시키기 위해서, 이 콜라이에서의 발현에 대해 코돈 최적화된, 아미노산 YPYDVPDYA(서열번호 97)을 암호화하는 뉴클레오티드 서열을 NifK의 3' 단부에서 역방향 프라이머의 5'에 가하였다. pMIT2.1의 처음 절반을 차지하는 상기 프라이머, 5'-TCATCAAGCGTAATCAGG AACATCGTAGGGGTAACGAACCAGATCGAAAGAATAGTCGG-3'(서열번호 98), 및 순방향 프라이머 5'-AAGGGCGAATTCCAGCACACTGG-3'(서열번호 99)를, 주형으로서 pTopoH-J(실시예 16) DNA와 함께 PCR에 사용하여 7909bp 생성물을 제공하였다. 나머지 7222bp를 또한 프라이머 5'-CCTGATTGTATCCGCATCTGATGCTAC-3'(서열번호 100) 및 5'-AACCTGCAGGGCTAACTAACTAACCACGGACAAAAAACC-3'(서열번호 101)을 사용하여 PCR에 의해 증폭시켰다. 이어서 실시예 16에 기재된 바와 유사한 방식으로, 상기 두 PCR 단편을 문헌[de Kok et al., (2014)]의 방법을 사용하여 프라이머 BO1, 5'-GGTAGCATCAGATGC GGATACAATCAGGTCATCAAGCGTAATCAGGAACATCGAGG-3'(서열번호 102) 및 BO2, 5'-CCAGTGTGCTGGAATTCGCCCTTAACCTGCAGGGCTAACTAACTAAC CACG-3'(서열번호 103)과 결찰 순환 반응(LCR)을 사용하여 함께 결찰시켰다. 상기 결찰된 DNA 단편을 SbfI로 절단하고 변형되지 않은 NifBQFUSVWZM 유전자를 함유하는 pB-ori로부터의 SbfI 단편에 결찰시켜, NifK에 부가된 C-말단 연장을 갖는 융합 폴리펩티드를 암호화하는 변형된 MIT2.1 벡터를 생성시켰다.

상기 생성된 유전자 구조물을 pN249를 함유하는 이 콜라이 균주 DH5α 내로 도입시키고, 상기 두 벡터 모두로 형질전환된 세포의 배양물을 실시예 16에 기재된 바와 같이 증식시켰다. 상기 배양물을 아세틸렌 환원 분석에서 에틸렌 생성에 대해 시험하였다. 상기 결과는 NifK에 부가된 9-아미노산 C-말단 연장이 에틸렌 생성을 완전히 없앰을 보였다. 대조용, 변형되지 않은 pMIT2.1은 양성 에틸렌 생성을 생성시켰다. 발명자는 야생형 C-말단에 비해 NifK의 C-말단에서 번역에 의해 융합된 연장이 아세틸렌의 환원에 의해 측정되는 바와 같이 니트로게나제 활성을 없앴다고 결론을 내렸으며, 이는 실시예 10에 기재된 모델링 연구와 일치한다.

상기 생화학적 시험이 NifK의 C 말단에 대한 연장이 니트로게나제 기능을 없앴음을 입증하였고 선행의 식물체내 실험이 NifD 및 야생형 C 말단을 갖는 NifK의 동시-발현이 NifD 풍부성을 증대시킴(실시예 11)을 입증하였음을 고려하여, 발명자는 NifK 폴리펩티드 중의 야생형 C 말단이 NifD-NifK 이종-사량체의 안정성과 기능 모두 및 따라서 니트로게나제 활성에 중요하다는 결론을 내렸다.

이는 야생형 C 말단을 갖는 NifK와 함께 NifD를 발현하는 유전자의 상이한 버전(pRA25)을 발현시키고 NifD 풍부성을 평가함으로써 추가로 조사되었다. 실시예 20은 엔 벤타미아나 중 NifD 풍부성을 평가하기 위해 제조된 각각 NifD 유전자를 포함하는 일련의 유전자 구조물을 기재한다. 상기 실험에서 NifD는 C-말단 HA 에피토프를 포함하였다. 모든 엔 벤타미아나 침투에 사용되는 바와 같은 침묵 억제인자 P19를 발현하는 유전자 구조물의 존재하에서, 및 동시-침투된 pRA25(NifK)의 존재 및 부재하에서 상기 구조물(표 8)의 동시-침투 후에, NifD::HA의 단백질 풍부성 및 MPP 가공을 SDS PAGE 및 항-HA 항체를 사용하는 웨스턴 블럿 분석에 의해 평가하였다. 상기 분석(도 19)은 각각의 경우에 pRA25의 부가가, 특히 SN7 및 pRA25의 조합에 대해서, NifD 풍부성을 크게 증대시킴을 보였다. 가장 중요하게, 가공된 대 가공되지 않은 NifD의 비가 pRA25의 부가에 의해 증대되었다. 상기 결과는 NifK에 의한 NifD의 안정화가 미토콘드리아 기질에서 발생하며, 중요하게는 야생형 C-말단을 갖는 NifK 폴리펩티드에 의존하여 상기를 성취한다는 결론을 더욱 지지하였다.

더욱 중요하게, 대략 48 kDa이고 NifD의 분해 생성물인 것으로 생각되는 폴리펩티드 밴드가 상기 시험된 모든 구조물에 대해 관찰되었다. 상기 폴리펩티드는 항-HA 항체로 검출되었고 젤상에서 예리하게 한정된 폴리펩티드 밴드로서 관찰되었기 때문에, 상기는 NifD의 C-말단을 포함하는 특정한 절단 생성물을 나타냈어야 했다. 뜻밖에도, 상기 생성물의 양은 pRA25(NifK)의 동시-발현에 의해 또한 증대되었다. 이는 NifD 및 NifK 폴리펩티드간의 상호작용을 가리켰다. 이러한 관찰을 근거로, 발명자는 NifD 분해가 미토콘드리아 기질 특이성이며 MM에서 NifD 및 NifK의 상호작용에 대한 지지를 제공하는 것으로 간주하였다.

NifD::HA 암호화 구조물을 식물 세포 내로 도입시켰을 때 생성되는 대략 48 kDa의 폴리펩티드에 관해 시험된 한 가지 가능성은 상기 48 kDa 폴리펩티드가 두 번째, 하류 번역 개시로부터 생성된다는 것이었다. NifD 유전자는 48 kDa 번역 생성물을 유도할 수도 있는 영역 중에 Met 잔기에 상응하는 다수의 ATG 코돈을 갖는다. 상기 가능성을 시험하기 위해서, NifD 개시 코돈의 하류 두 번째 내지 다섯 번째 Met 코돈을 Ala 코돈으로 교체함을 제외하고, pRA24와 동일한 유전자 구조물(pRA30)을 제조하였다. pRA30 및 pRA24의 엔 벤타미아나 잎에의 별도 침투 및 SDS-PAGE 및 웨스턴 블럿팅에 의한 분석 후에, pRA24 및 pRA30에 대한 밴딩 패턴이 동일하였고, 이때 대략 48 kDa 폴리펩티드 생성물이 여전히 존재하였다. 상기 관찰은 NifD::HA 유전자 발현시 관찰되는 48 kDa 크기의 밴드는 교번 번역 개시에 기인한다는 가설을 반박하였다. 상기 폴리펩티드는 MM에서의 미지의 분해 공정에 의해 생성되는 것으로 결론이 내려졌다.

실시예 19. NifD-NifK 및 NifE-NifN 융합 폴리펩티드의 평가

실시예 12는 NifD의 C-말단과 NifK의 N-말단 사이에 30 아미노산 잔기로 이루어지는 링커를 사용하는, NifD-NifK 융합 폴리펩티드를 암호화하는 유전자의 설계 및 구성을 기재한다. 링커는 폴리펩티드의 검출을 위한 FLAG 에피토프를 포함하였다. 이제 상기 FLAG 에피토프를 HA 에피토프로 교체함을 제외하고 NifD-(FLAG)링커-NifK의 동일한 배열을 갖는 두 번째 유전자를 설계하고 구성하였다. 상기 두 번째 유전자에서 링커에 의해 암호화된, 또한 30 아미노산 잔기의 아미노산 서열은 상기 링커 중에 아미노산 12-20으로서 HA 에피토프와 함께 ATPPPGSTTTAYPYDVPDYATPPPGSTTTA(서열번호 104)였다. 이들 융합 폴리펩티드 모두를 하기와 같이, 실시예 16에 기재된 pMIT2.1 벡터-기반 세균 시스템에서 아세틸렌 환원 분석에 의해 기능성에 대해 시험하였다.

먼저, pRA31로부터의 NifD::HA링커::NifK 유전자를 프라이머 pRA31DK-FW 5'-ATGATGACTAACGCTACAGGAGAA-3'(서열번호 105), 및 pRA31DK-RV 5'-TCATCATCTAACCAAATCAAAACTGTAATCTG-3'(서열번호 106)을 사용하여 PCR 증폭시켰다. 상기 유전자 중의 뉴클레오티드 서열을 아라비도프시스 탈리아나에서의 발현을 위해 코돈-최적화하였다. nifD 및 nifK 유전자가 없는 pMIT2.1의 처음 절반을 또한 프라이머 D_start_RV 5'-CCGGCTCCTCCGCTAGATAAAAATGTG AATTTTTGCATGCAGCC-3'(서열번호 107), 및 K_end_FW 5'-CCTGATTGTATCCGCATCTGATGCTACCGTGGTTGA-3'(서열번호 108)을 사용하여 PCR에 의해 생성시켰다. 상기 증폭된 PCR 생성물을 가교 올리고 5'- TTCTCCTGTAGCGTTAGTCATCATCCGGCTCCTCCGCTA-3'(서열번호 109) 및 5'- CAGATGCGGATACAATCAGGTCATCATCTAACCAAATCAAAACTG-3'(서열번호 110)을 사용하여 결찰 순환 반응에 의해 결찰시키고, SbfI로 절단하였다. 상기 절단된 DNA 단편을 SbfI로 또한 절단된 pB-ori DNA에 결찰시켜, NifD::HA링커::NifK 융합 유전자를 포함하는 pMIT2.1의 변형된 형태를 생성시켰다.

이 콜라이(DH5α) 세포에서 기능 시험은 NifD::HA링커::NifK 유전자를 포함하는 변형된 pMIT2.1 벡터가 변형되지 않은 pMIT2.1 수준의 약 10%로, 아세틸렌을 에틸렌으로 환원시킬 수 있음을 보였다. 즉, 달리 동일한 야생형 NifD와 NifK 폴리펩티드 사이에 30 아미노산 링커를 갖는 융합된 폴리펩티드는 세균 시스템에서 10배 감소된 활성을 갖는다 하더라도 명백히 기능성이었다.

융합 폴리펩티드의 니트로게나제 활성을 증가시키고자, 2개의 변화를 수행하고 실험을 필수적으로 반복하였다. 상기 변화는 먼저 NifD에 대한 변이체 아미노산 서열(Temme et al., 2012)을 사용하는 것이고(실시예 17 참조), 두 번째는 에이 탈리아나보다는 케이 뉴모니아에에 대해 코돈-최적화된 뉴클레오티드 서열을 사용하는 것이었다. 상기 구조물을 상술한 바와 동일한 방식으로 생성시켰다. 즉, 별도의 NifD 및 NifK 폴리펩티드를 암호화하는, 변형되지 않은 pMIT2.1 중의 nifD 및 nifK 사이의 오페론 구조를, NifD-링커-NifK의 번역 융합을 암호화하는 뉴클레오티드 서열로 교체시켜, 각각의 FLAG- 및 HA-함유 링커에 대한 변형된 pMIT2.1 중의 NifD::링커::NifK 유전자를 형성시켰다. 이 콜라이(DH5α) 세포에서 기능 시험은 pMIT2.1 중의 변형된 NifD::FLAG링커::NifK 및 NifD::HA링커::NifK 유전자가 변형되지 않은 pMIT2.1의 양에 대한 양의 약 100% 및 80%로 아세틸렌을 환원시켜 에틸렌을 생성시킴을 보였다. 상기 첫 번째 NifD-링커-NifK 융합에 대해 감소된 활성은 이상적인 NifD 아미노산 서열, 또는 식물-최적화된 코돈 사용, 또는 이 둘 모두보다 적은 것에 기인한다는 결론이 내려졌다. 이는 숙주 세포에 따른 적합한 폴리펩티드 서열 및 코돈-최적화 사용의 중요성을 입증하였다.

식물 세포에서의 발현 및 미토콘드리아 기질내로의 내수송을 위해서, MTP 서열이 필요했을 것이며 상기 MTP 내-절단 후에 N-말단 연장은 남아있을 것으로 예측되었다. 예를 들어, MTP-FAγ⁵¹의 사용에 이어서(실시예 17), MPP에 의한 절단은 Nif 폴리펩티드에 융합된 9-아미노산 N-말단 연장을 남겼을 것이다. 따라서, 효율적인 번역을 제공하기 위해 9(Ile)의 첫 번째 잔기를 Met 잔기로 교체시킴을 제외하고, NifD-링커-NifK 폴리펩티드에의 상기와 같은 9 아미노산 연장의 부가 효과를 시험하였다. 9-아미노산 서열을 상술한 바와 같은 클로닝 접근법을 사용하여 NifD::링커::NifK 융합 폴리펩티드의 NifD 부분의 N-말단에 부가하였다. 이어서 이들 두 변형의 조합의 아세틸렌 환원 능력을 pMIT2.1 시스템에서 시험하였다.

상기 구조물을 생성시키기 위해서, 9 아미노산 연장을 암호화하는 27 뉴클레오티드의 DNA 서열(MSTQVVRNR, 서열번호 111)을, 링커 중의 FLAG 및 HA 에피토프 각각에 대해서 NifD::링커::NifK 융합 유전자의 5' 단부에 가하였다. 상기 구조물을 함유하는 이 콜라이상에서의 아세틸렌 환원 분석은 NifD::HA링커::NifK 폴리펩티드에의 9 아미노산 N-말단 연장의 부가가 N-말단에 9 아미노산 연장이 없는 NifD::HA링커::NifK와 대략 동일한 수준의 에틸렌 생성을 생성시킴, 즉 N-말단 연장이 잘 허용되며 니트로게나제 활성을 감소시키지 않음을 보였다. 이는 9 아미노산 연장을 야생형 NifD에 그의 활성의 감소 없이 가할 수 있다는 선행의 발견과 일치하였다.

발명자는 또한 변형되지 않은 MIT2.1로부터 nifD 유전자의 정지 코돈, 이격자 서열 및 nifK 암호화 영역에 대한 리보솜 결합 부위를 제거함으로써 MIT2.1 시스템에서 임의의 링커 서열 없이 NifD와 NifK간의 번역 융합의 기능을 시험하였다. NifD-NifK 폴리펩티드를 암호화하는 판독 프레임의 상기 직접적인 융합(본 명세서에서 NifD-링커 없음-NifK라 칭함)은 양성 대조용에 비해 아세틸렌 환원 활성을 5%까지 감소시켰다. 이러한 NifD-링커 없음-NifK의 기능의 감소는 융합 폴리펩티드의 NifD와 NifK 부분간의 적합한 입체형태적 회합을 허용하여 기능성 디니트로게나제 구조를 형성시키는 약 30 아미노산 잔기의 가요성 링커를 포함하는 이점을 보였다.

NifE-NifN 융합

NifD 및 NifK와 유사하게, NifE 및 NifN은 이종-사량체를 형성시키는 것으로 공지되어 있다. 니트로게나제 활성에 관한 상기 복합체의 기능은 NifB로부터 FeMo 보조인자 코어, NifQ로부터 몰리브데늄, 및 FeMo 보조인자 성숙을 위한 NifV로부터 호모시트레이트를 수용하는 것이다(Hu and Ribbe, 2011). 발명자는 NifE 및 NifN이 최적의 니트로게나제 기능을 위해서 동몰 수준으로 발현되어야 하고 상기 두 폴리펩티드의 융합이 니트로게나제의 재조합 발현에 필요한 프로모터, MTP 및 종결자의 수를 감소시킬 것임을 깨달았다. 따라서 NifE 및 NifN간의 융합 폴리펩티드를 암호화하는 유전자를, 46 아미노산 잔기의 링커를 NifD-링커-NifK 융합 폴리펩티드에 대한 30 아미노산 잔기 대신에 사용함을 제외하고, NifD 및 NifK 융합에 대한 이유(상기)에 따라 설계하고 제조하였다. 상기를 하기와 같이 설계하고, 구성하고 시험하였다.

케이 뉴모니아에로부터의 NifE-NifN α₂β₂ 이종-사량체의 상동성 모델을 주형으로서 아조토박터 비넬란디이로부터의 NifE-NifN 복합체의 결정 구조(PDB ID: 3PDI, (Kaiser et al., 2011))를 사용하여 구성하였다. 케이 뉴모니아에 및 상응하는 에이 비넬란디이 폴리펩티드를 정렬시키는 경우, 아미노산 서열 일치성은 NifE 폴리펩티드의 경우 68.1% 및 NifN 폴리펩티드의 경우 44.2%였다. 발명자는 케이 뉴모니아에 α₂β₂ 이종-사량체(NifE₂NifN₂)에 대한 구조 모델에서, 각각의 NifE 서브유닛의 C-말단이 그의 NifN 상대의 N-말단으로부터 대략 70 Å임을 깨달았다. 따라서, 46 아미노산 잔기를 갖는 2개의 단위를 연결시키는 적합한 길이의 링커를 설계하였다. 발명자는 상기 링커가 상기 이종-사량체의 표면 둘레에서 구부러져야 하고 약 104 Å의 길이를 가짐을 고려하였으며, 따라서 46 아미노산 잔기의 수가 선택되었다. 발명자는 또한 상기 링커가 가요성을 포함하여 다수의 다른 특성을 최적으로 가져야 함을 고려하였다.

상기 선택된 46-잔기 링커의 아미노산 서열은 탈라로마이세스 푸니쿨로수스(Talaromyces funiculosus)(UniProtKB: Q8WZJ4)로부터의 셀로비오하이드롤라제의 탄수화물 결합 도메인 및 촉매 도메인 사이에 자연적으로 존재하는 링커에 근거하였다. 상기는 불필요한 디설파이드 결합의 형성을 피하기 위한 시스테인 잔기의 결여, 불필요한 표면 염 가교 상호작용 가능성을 감소시키기 위한, 존재하지 않거나 거의 없는 하전된 잔기(Glu, Asp, Arg, Lys), 폴리펩티드의 표면을 침투하는 경향을 촉진할 수도 있는, 존재하지 않거나 거의 없는 소수성 잔기(Phe, Trp, Tyr, Met, Val, Ile, Leu), 및 번역후 변형된 아미노산이 없는 링커 서열(Uniprot entry www.uniprot.org/uniprot/Q8WZJ4를 참조하시오)(여기에서 상기 링커는 잔기 457-493이다)을 포함한 다수의 기준을 근거로 선택되었다. 셀로비오하이드롤라제 서열 중 2번 위치의 Phe 잔기를 Ser로 교체시켜 소수성을 감소시켰다. HA 에피토프 서열 YPYDVPDYA(서열번호 112)를, 단지 융합 폴리펩티드의 검출 및 정량분석을 돕기 위해 링커의 아미노산 16과 17 사이에 삽입하였다 - 상기 링커는 기능에 상기와 같은 에피토프가 필요하지 않다. HA 에피토프를, 유지된 단일의 양으로 하전된 리신 잔기로부터 떨어뜨리기 위해서 상기 링커의 중심보다는 N-말단에 가깝게 위치시켰다. 생성되는 링커 서열은 TSSGGTSTGGSTTTTAYPYDVPDYASGTTSTKASTTSTSSTSTGTG(서열번호 113)이며, 아미노산 17-25로서 HA 에피토프 및 32번 위치에 유지된 리신을 함유하였다.

유전자 구조물을 생성시키고 NifE-링커-NifN 융합 폴리펩티드의 기능을 시험하기 위해서, pMIT2.1 중의 NifE 및 NifN 시스트론간의 영역을, pMIT2.1 변형에서 선행 구조물에 관한 것과 동일한 클로닝 접근법을 사용하여, 46-잔기 링커를 포함하는 번역 융합을 암호화하는 뉴클레오티드 서열로 교체하였다. 상기 융합 유전자를 이 콜라이에서 시험하고자 하더라도, 상기 뉴클레오티드 서열을 아라비도프시스 탈리아나에 대해 코돈-최적화하였다. nifE::HA링커::nifN 유전자를 프라이머 pRAEN-FW 5'-ATGAAGGGAAATGAGATTCTTGCTCTT-3'(서열번호 114), 및 pRAEN-RV 5'-TCATCAATCAGCAGCATAAGCACC-3'(서열번호 115)를 사용하여 pRA01-EN으로부터 PCR 증폭시켰다. nifE 및 nifN 없는 pMIT2.1의 첫 번째 절반을 또한 프라이머 E_start_RV 5'-TTGTAATAACCTCCAGTGATGAATTGAATA-3'(서열번호 116), 및 N_end_FW 5'- CTAGAGATTAATATGGAGAAATTAAGCATG -3'(서열번호 117)을 사용하여 PCR에 의해 생성시켰다. 상기 증폭된 PCR 생성물을 가교 올리고 5'- AAGAGCAAGAATCTCATTTCCCTTCATTTGTAATAACCTCCAGTGATGAATTGATAGTG-3'(서열번호 118) 및 5'- TAGTTTTCATGCTTAATTTCTCCATATTAATCTCT AGTCATCAATCAGCAGCATAAGCACC -3'(서열번호 119)을 사용하여 결찰 순환 반응을 사용하여 결찰시키고, 그 후에 변형되지 않은 pMIT2.1(pB-ori)의 두 번째 절반을, 2개의 DNA를 모두 SbfI로 절단한 후에 변형된 첫 번째 절반과 결찰시켰다. 생성된 구조물을 AtNifE::링커::NifN/MIT2.1로 표기하였다.

아세틸렌 환원 분석에 의한 이 콜라이 세포에서 AtNifE::링커::NifN 유전자를 포함하는 변형된 MIT2.1 벡터의 기능 시험은 변형되지 않은 MIT2.1의 수준에 비해 약 40%의 에틸렌 생성을 보였다.

식물 세포에서의 발현 및 미토콘드리아 기질내로의 내수송을 위해서, MTP 서열이 요구되었을 것이며 N-말단 연장은 MPP에 의한 상기 MTP 서열내 절단 후에 남아있는 듯하였다. 예를 들어, MPP에 의한 절단과 함께 MTP-FAγ⁷⁷의 사용은 융합 폴리펩티드상에 38-아미노산 N-말단 연장을 남겼을 것이다. 따라서, 효율적인 번역을 제공하기 위한 첫 번째 Ile 잔기의 Met 잔기에 의한 치환과 함께, 상기와 같은 38 아미노산 연장의 부가 효과를, 상기를 암호화하는 뉴클레오티드 서열을 AtnifE::링커::nifN 유전자에 가함으로써 시험하였다. 상기 유전자의 번역은 상기에 의해 38 아미노산 연장을 NifE::링커::NifN 융합 폴리펩티드의 NifE의 N-말단에 부가했을 것이다. 니트로게나제 활성에 대한 이들 두 변형의 조합의 효과를 이전과 동일한 클로닝 접근법을 사용하여, pMIT2.1 시스템에서 시험하였다.

이 콜라이에서 38aa::AtNifE::링커::NifN 유전자를 포함하는 변형된 pMIT2.1 벡터는 변형되지 않은 pMIT2.1의 수준에 비해 약 25%의 에틸렌 생성을 생성시켰다. 즉, N-말단에서 38 아미노산 연장의 사용은 변형되지 않은 pMIT2.1에 비해, 감소되기는 했지만 양의 니트로게나제 활성을 생성시켰다. 발명자는 상기 감소가 적어도 부분적으로는 이 콜라이에서 유효 번역에 최적 이하인 에이 탈리아나 코돈 사용에 기인한 것(이는 세균 코돈-최적화와 함께 고유의 클렙시엘라 NifE 및 NifN의 번역 융합을 생성시킴으로써 쉽게 시험될 수 있었다)으로 간주하였다. 발명자는 NifE-링커-NifN 융합 폴리펩티드 기능을 하기와 같이 최적화할 수 있는 다른 방식을 고려하였다. NifE의 N-말단의 38 아미노산 연장은, NifE₂NifN₂ 이종-사량체의 NifE 서브유닛의 N-말단이 FeMo 보조인자가 존재하는 공동에 가깝게 있기 때문에 상기 이종사량체로부터의 유효한 FeMo 보조인자 방출을 방해할 수도 있다(Kaiser et al., 2011). NifE₂NifN₂ 이종-사량체 활성을 MPP 가공시 완전히 제거되는 MTP의 사용에 의해, 또는 완전히 제거되지 않은 MTP 서열을 사용하는 경우 여분의 연장을 수용하기 위해 NifE의 N-말단 암호화 영역을 절두시킴으로써 증가시킬 수 있다. 또한, 46 아미노산 링커가 고리를 끊어 FeMo 보조인자 공동의 입구를 부분적으로 막아 NifB로부터 FeMo 보조인자 코어를 수용하거나 또는 성숙한 FeMo 보조인자를 방출시키는 것을 방해할 가능성이 고려되었다. 이 경우에, 상기 링커를 단축시키거나 또는 NifE의 C-말단을 절두하거나, 또는 이 둘 모두를 수행하여 상기 공동을 막는 링커 영역을 피할 수 있다. 이러한 전략에 따른 변이체를 pMIT2.1 시스템을 사용하여 용이하게 시험하고 최적화할 수 있다.

요약

NifD-링커-NifK 및 NifE-링커-NifN 융합 폴리펩티드 모두 pMIT2.1 세균 시스템에서 아세틸렌의 환원을 지지할 수 있었다, 즉 니트로게나제 활성을 제공하는데 기능성이었다. NifD-링커-NifK에의 9 아미노산 N-말단 연장의 부가는 완전한 니트로게나제 활성을 제공하였다. NifE-링커-NifN 융합 폴리펩티드에 보다 긴, 38 아미노산 N-말단 연장의 부가는 또한, N-말단 연장이 없는 폴리펩티드에 비해 감소된 활성을 갖지만, 기능성인 것으로 나타났다. 발명자는 식물 세포에서, 다른 필요한 Nif 폴리펩티드와 함께 N-말단 MTP 서열을 사용하는 상기 융합 폴리펩티드의 발현 전략이 니트로게나제 활성의 발현을 허용할 것이라는 결론을 내렸다. 여기에 예시된 NifD-NifK 및 NifE-NifN 융합 전략의 추가적인 장점은 최적 니트로게나제 기능을 위해 동몰 수준의 서브유닛의 생성을 포함하였고, 2개의 폴리펩티드, 또는 2쌍의 폴리펩티드가 식물 세포에서 니트로게나제의 재조합 발현에 필요한 프로모터, MTP 및 종결자의 수를 감소시킬 것이라는 것이었다.

실시예 20. 식물 세포에서 Nif 융합 폴리펩티드 발현을 위한 상이한 프로모터 시험

일련의 상이한 프로모터를, 엔 벤타미아나 잎 세포에서 예시되는 식물 세포에서 Nif 폴리펩티드를 생성시키는 Nif 유전자 발현에서 그의 유효성에 대해 평가하였다. 5개의 상이한 프로모터, 즉 서브테라니언 클로버 스턴트 바이러스로부터의 S4 프로모터(SCSV-S4)의 2개 버전(Sch

nmann et al., 2003a; Sch

nmann et al., 2003b), SCSV-S7 프로모터(Sch

nmann et al., 2003a), 및 CaMV 35S 프로모터의 2개 버전, 즉 상기 35S 프로모터의 보다 긴 형태 및 유전자 발현을 극대화하기 위한 배가된 인헨서를 포함하는 증대된 형태(2x35S)를 상기 목적을 위해 선택하였다(표 9). 상기 SCSV 프로모터는 대부분의 식물 조직에서 강하게 발현되며 구성적 프로모터인 것으로 간주된다. Nif 프로모터의 예로서 이들 시험에 사용된 NifD 폴리펩티드는 실시예 17에 사용된 버전(서열번호 95)이었다. NifD가 Nif 폴리펩티드의 일례로서 상기 실험에서 선택되었는데, 그 이유는 시험된 모든 Nif 폴리펩티드(실시예 5-9) 중에서, 상기가 가장 발현시키기 어렵기 때문이었다. 식물 미토콘드리아에서 전좌 및 가공을 위해 FAγ⁵¹ MTP를 암호화하는 서열(표 9)을 포함하여, 각각 상이한 프로모터를 사용하고 달리 동일한 5개의 벡터를 제조하였다. 골든게이트 클로닝 방법(Weber et al., 2011, Engler et al., 2014)을 사용하여, 모듈 유전자 조립 접근법을 허용하는 5개의 구조물을 생성시켰다.

이들 벡터를 함유하는 아그로박테리움 세포들(각각 P19 침묵 억제인자 단백질을 생성시키는 구조물을 함유하는 아그로박테리움 세포와 혼합되었다)을 엔 벤타미아나 잎 내로 개별적으로 도입시키고 침투후 5일째에 단백질 추출물을 생성시켰다. 상응하는, 대응된 침투를, C-말단 연장 없는 NifK의 동시-발현이 NifD 풍부성을 증대시키는 것으로 나타났기 때문에(실시예 11), pRA25(pFAγ^77+GAP::NifK)의 첨가와 함께 또는 상기 첨가 없이 상기 구조물로 수행하였다. SDS-PAGE 및 항-HA 항체를 사용하는 웨스턴 블럿 분석을 상기 단백질 추출물상에서 수행하였다(도 19 - 실시예 18 참조). 표 9는 식물 세포에서 생성된 폴리펩티드의 검출 및 각각의 FAγ⁵¹::NifD 융합 폴리펩티드에 대한 MPP에 의한 절단(가공)의 결과를 요약한다.

5개의 구조물은 모두 식물 세포 내로 도입시, 항체로 검출된 폴리펩티드를 생성시켰다(도 19). 각각의 경우에, 가공된 및 가공되지 않은 형태의 FAγ⁵¹::NifD 모두와 일치하는 크기를 갖는 폴리펩티드 밴드가 관찰되었지만, 상기 두 폴리펩티드 풍부성 및 가공된:가공되지 않은 폴리펩티드의 비, 즉 가공 효율에 상당한 변화가 존재하였다(표 9). 가장 현저하게, 각각의 구조물 SN6, SN7 및 SN8에 대해서, pRA25로부터 pFAγ^77+GAP::NifK의 포함은 NifD의 절대 수준 및 뜻밖에도 NifD 단백질의 가공된 대 가공되지 않은 형태의 비를 모두 증대시켰다. 이는 구조물 SN7에 대해서 가장 뚜렷하였는데, 이때 가공되지 않은 NifD의 수준은 pFAγ^77+GAP::NifK가 존재하든 존재하지 않든 동일하였지만, 가공된 NifD의 수준은 상기 NifK 폴리펩티드의 존재에 의해 크게 증가되었다.

이러한 결과는 놀랍게도, 각각의 구조물에 동일한 MTP의 사용에도 불구하고, 상이한 프로모터가 단백질 발현 수준뿐만 아니라 미토콘드리아 기질-표적화된 Nif 단백질의 가공 효율에 상당한 영향을 미칠 수 있음을 입증하였다. 이러한 결과는 또한 C-말단 연장 없이 NifK의 발현의 NifD 풍부성에 대한 증대된 역할을 입증하였다.

실시예 21. 니트로게나제 기능에 대한 NifS 및 NifU의 가외성 시험

니트로게나제의 기능에 대해서, 각각의 철 황(Fe-S) 클러스터 생합성을 위해 상이한 니트로게나제 성분에 철-황 단편을 제공하는 2개의 Nif 단백질이 존재한다. NifS는 황을 활성화시켜 설파이드를 공급하는 피리독살 P-의존성 시스테인 데설푸라제(Zheng et al., 1993)이고, NifU는 NifS로부터 설파이드를 수용하고 상기 Fe-S 클러스터를 조립하는 분자 스캐폴드이다(Agar et al., 2000). 이들은 함께 상기 Fe-S 클러스터를, FeMo 보조인자 코어(L-클러스터) 조립(Hu and Ribbe 2011)을 위해 NifB에 공급할 뿐만 아니라 NifZ의 도움(Lee et al., 2009)과 함께 [4Fe-4S] 및 연속적인 P-클러스터([Fe8-S7]) 형성을 위해 펩티딜-프롤릴 시스/트랜스 이소머라제 NifM(Gavini et al., 2006)의 지원으로 Fe 단백질(NifH)에 공급한다. 진핵생물 중에, Fe-S 단편을, Fe-S 클러스터를 함유하는 다양한 효소에 제공하는 NifS 및 NifU의 이종상동체가 존재한다(Couturier et al., 2013). 특히, 식물 미토콘드리아는 각각 NifS 및 NifU의 이종상동체로서 NfsI(At5g65720) 및 IsuI(At4g22220) 폴리펩티드를 갖는 반면, 색소체에서 Nfs2(At1g08490) 및 SufB(At4g04770)는 각각 NifS 및 NifU에 대해 기능상 균등물이다. 상기 미토콘드리아 및 색소체 시스템은 모두 그들의 고유의 세포소기관 환경에서 Fe-S 클러스터 조립 및 그들의 표적 효소로의 전달을 충족시키기 위해 추가적인 보조 단백질의 도움을 받는다. 최근에, 효모 미토콘드리아 및 담배 색소체에서 NifS 및 NifU가 재조합 Fe 단백질 활성에 필요하지 않음이 입증되었다(Lopez-Torrejon et al., 2016; Ivleva et al., 2016).

이 콜라이에서 pMIT2.1 시스템 중의 NifS 및 NifU의 식물 이종상동체의 기능성을 시험하기 위해서, 클렙시엘라 NifS 및 NifU 유전자를 식물 NfsI 및 IsuI 유전자로, 단독으로 또는 2개의 교체를 함께 교체한다. 변형된 pMIT2.1의 니트로게나제 기능을 아세틸렌 환원 분석에 의해 평가한다. 또한, 에이 탈리아나 nfsI 돌연변이체(SALK_083681) 및 isuI 돌연변이체(SALK_006332)를, 세균 Nif 효소가 이들 식물 돌연변이를 보완할 수 있는지를 알아보기 위해서, 각각, 미토콘드리아 기질에 표적화된, 클렙시엘라 NifS 및 NifU 유전자를 포함하는 유전자 구조물로 형질전환시킨다. 상기 실험은 세균 Nif 단백질이 식물 균등물에 기능상 대체될 수 있음을 입증하고자 한다(Frazzon et al., 2007). 성공적인 상보성은 미토콘드리아에 니트로게나제 단백질을 기능성 상태로 표적화하는 상기 선택된 MTP의 능력을 나타낸다. 상기 실험은 식물에서, Nif 폴리펩티드, 이 경우에 NifS 및 NifU의 니트로게나제-관련된 기능의 최초의 입증을 제공한다.

실시예 22. 질량 분광분석을 사용하는 Nif 폴리펩티드 발현의 측정

웨스턴 블럿 및 항체 검출 방법을 사용하지 않고 따라서 Nif 폴리펩티드에 부가되는 에피토프의 사용이 회피된 Nif 폴리펩티드 검출 및 정량분석 기법을 개발하기 위해서, 발명자는 질량 분광분석법을 사용하여, 구체적으로 단백질분해적 절단 바텀업 MS/MS 프로토콜을 사용하여 다양한 Nif 단백질을 직접 검출하고 정량분석하고자 하였다. 이는 전체 스캔으로 모 이온의 오르비트랩(Orbitrap) 질량 분석기와 함께 고 질량 분석 및 질량 정확성을 제공하기 위해 나란히 작동하는 3개의 질량 분석기를 갖는 오리트랩 퓨전 트리브리드(Oritrap Fusion Tribrid) 질량 분광계(써모피셔)를 사용하였다. 상기 장비의 방법 및 감도는 이때 입수 가능한 다른 장비보다 복잡한, 정제되지 않은 단백질 혼합물로부터 더 많은 단백질 및 펩티드 식별을 성취할 수 있는 것으로 생각되었다. 상기 장비를 먼저, Nif 단백질을 발현하는 세균, 구체적으로 형질전환되고 16개의 상이한 Nif 폴리펩티드를 암호화하는 pMIT2.1을 발현하는 이 콜라이 세포에서 펩티드 및 단백질의 표적화되지 않은 검출을 허용하는 데이터 의존적인 방식으로 샘플을 분석함으로써 시험하였다. 조 단백질 혼합물을 트립신으로 처리하여 분자량 검출 범위의 펩티드를 제공하였다. 일단 Nif 폴리펩티드의 트립신 절단에 의해 생성된 특정한 펩티드가 확인되었으면, 그의 예상되는 체류 시간에서 관심 펩티드의 모 질량을 특이적으로 단리하는 표적화된 목록을 생성시킬 수 있었다. 상기 표적화된 접근법은 Nif 단백질로부터의 펩티드가 낮은 풍부성으로 인해 누락되거나 또는 다수의 내인성 세균 또는 식물 트립신 펩티드로 인해 상기 데이터 의존적인 방법에 의해 선택되지 않을 가능성을 제거하는데 일조하였다.

상기 질량 분광분석 기반 프로토콜은 pMIT2.1 플라스미드로 형질전환된 이 콜라이에서 발현되는 16개의 상이한 Nif 단백질의 완전한 총체를 검출하는데 성공적이었다. 적어도 하나의 특정한 펩티드가 상기 모든 16개 Nif 폴리펩티드에 대해서 검출되었다. 다수의 특정한 트립신 펩티드가 거의 모든 Nif 폴리펩티드에 대해 검출되었으며, 최대 19개 이하의 펩티드가 상기 Nif 폴리펩티드에 대해 검출되었고, 이는 전체 Nif 폴리펩티드 서열의 4 내지 55%를 커버한다(표 10). 다수의 상기 Nif 폴리펩티드에 대한 PEP 점수 합은 매우 높았으며(표 10) 이는 Nif 폴리펩티드 수준을 특이적으로 검출하고 측정하는 상기 방법의 능력에 대한 완전한 신뢰도를 가리킨다. 이와 관련하여, 이후 오류 확률(PEP) 점수 합은 펩티드 스펙트럼 합치의 PEP 값의 음의 대수의 합이다. PEP 점수 합이 클수록, 검출에 대한 거짓 양성 가능성이 적다.

이어서 상기 방법은 관심 벡터를 함유하는 아그로박테리움이 침투된 식물 잎 샘플을 가공하기 위해 하기에 기재된 방법을 사용하여, 다양한 MTP::Nif 유전자 구조물을 발현하는 엔 벤타미아나 세포로부터의 조 추출물에 대해 시험하였다. 모든 침투는 P19 침묵 억제인자 단백질(서열번호 125)의 동시-발현에 대한 유전자 구조물을 함유하는 아그로박테리움과의 혼합물을 포함하였다. 상기 P19 바이러스 억제인자 단백질로부터 2개의 특정한 트립신 펩티드(서열번호 126; 서열번호 127)의 검출을 일시적인 발현 시스템의 성공을 위해 양성 대조군으로서 사용하였다.

상기 방법은 식물 세포에서 일시적으로 발현시 각각의 NifK, NifB, NifH, NifF, NifJ, NifS 및 NifX 폴리펩티드로부터의 3 내지 16개의 특정한 트립신 펩티드를 특이적으로 검출하는데 성공적이었다. 예를 들어, 이들 Nif 융합 폴리펩티드로부터 식물 세포에서 검출된 특정한 펩티드를 하기에 나열한다. 각각의 상기 일시적인 발현 실험에 대해서, P19로부터 2개의 특정한 펩티드가 또한 검출되었다. 특정한 Nif 펩티드가 검출되지 않은 다른 Nif 폴리펩티드를 발현하는 유전자를 사용하는 일부 실험에서, P19로부터 2개의 특정한 펩티드는 또한 검출되지 않았다. 이는 추정상 최적이하의 식물 건강으로 인해, 상기 실험에서 불충분한 형질전환 효율을 암시하였다. 상기 실험을 보다 양호한 식물로 반복한다.

식물 세포에서 검출된 NifK로부터의 예시적인, 특정한 펩티드:

식물 세포에서 검출된 NifH로부터의 특정한 펩티드:

식물 세포에서 검출된 NifB로부터의 특정한 펩티드:

식물 세포에서 검출된 NifJ로부터의 특정한 펩티드:

식물 세포에서 검출된 NifS로부터의 특정한 펩티드:

식물 세포에서 검출된 NifX로부터의 특정한 펩티드:

식물 세포에서 검출된 NifF로부터의 특정한 펩티드:

방법

식물 잎 샘플을 액체 질소로 동결시키고 액체 질소하에서 막자사발과 막자로 분쇄하였다. 2 부피(v/v)의 우레아/SDS 완충제(6 M 우레아, 2% SDS, 62.5 mM 트리스-HCl pH 6.8, 65 mM DTT)를 상기 분쇄된 잎 원반에 가하고 세포 용해 및 DTT에 의한 단백질의 환원을 위해 실온(30분)에 방치하였다. 샘플을 16,000 g에서 5분간 원심분리시켰다. 10 내지 20 ㎕의 용해성 분획을 100 ㎕의 우레아 완충제와 함께 마이크로콘-30 MWCO 필터에 적용하고 10,000 g에서 10분간 원심분리시켰다. 시스테인 잔기를 100 ㎕의 우레아 완충제 및 3.5 ㎕의 40% 아크릴아미드의 첨가에 의해 아크릴아미드로 불활성화시키고, 실온에서 30분간 배양한 다음 10,000 g에서 10분간 원심분리시켰다. 100 ㎕의 암모늄 비카보네이트(수 중 25 mM)의 2회의 세척 단계 및 상기와 같은 원심분리 후에 60 ㎕ ABC 중의 0.5 ㎍ 트립신(프로메가)에 의한 트립신 절단을 수행하고 37C에서 밤새 배양하였다. 상기 트립신 절단으로부터의 펩티드를 10,000 g에서 10분간 원심분리에 의해 용출시켰다. 280 ㎚에서의 광학 밀도를 사용하여(나노드롭(Nanodrop)) 펩티드 농도를 측정하고 샘플을 LCMS 로딩 완충제로 50 ng/㎕로 희석하였다.

각각의 샘플로부터 250 ng의 트립신 절단물을 오르비트랩 퓨전 트리브리드 질량 분광계에 직접 커플링된 디오넥스 나노메이트(Dionex Nanomate) 3000(써모피셔) 나노 LC 시스템상에 주입하였다. 상기 펩티드를 액클레임(Acclaim) PepMap C18(300 Å, 5 ㎜ x 300 ㎛) 트랩 컬럼상에서 10 ㎕/분의 유량으로 로딩 용매에 의해 5분간 탈염시키고, 35C에서 액클레임 PepMap C18(100 Å, 150 ㎜ x 0.075 ㎜) 컬럼상에서 0.3 ㎕/분의 유량으로 분리시켰다. 60분에 걸쳐 5%에서 40% 용매 B의 선형 구배를 사용한 다음 세척하고 5분에 걸쳐 40-99% B로 재-평형화하고, 99% B에서 5분 유지시키고, 6분에 걸쳐 5% B로 복귀시키고, 7분간 유지시켰다. 사용된 용매는 (A) 0.1% 포름산, 99.9% 수; (B) 0.08% 포름산, 80% 아세토니트릴, 19.92% 수였다. 나노-LC를 오르비트랩 퓨전 MS의 나노스프레이 플렉스 이온(Nanospray Flex Ion) 소스에 직접 커플링시켰다. 상기 이온 분무 전압을 2400 V로 설정하고, 스위프 가스(sweep gas)를 1 Arb로 설정하고, 이온 전달 튜브 온도를 300 ℃로 설정하였다. 데이터를 오르비탭-MS 서베이 스캔에 이어서 3초 기간에 걸쳐 120,000 분해능의 고분해능 오르비트랩 스캔 및 선형 이온 트랩에서 다수의 MS/MS 사건의 병행 획득으로 이루어지는 데이터-의존적인 획득 방식으로 획득하였다. 제1 단계 MS 분석을 4 x 10⁵의 AGC 표적 및 50 ms의 최대 주입 시간으로 m/z 400-1500의 질량 범위에 걸쳐 양이온 방식으로 수행하였다. 탠덤 질량 스펙트럼을, 충전 상태 2-7로 1000 카운트의 강도 한계를 초과하는 전구체 이온상에서 이온 트랩으로 획득하였다. 스펙트럼을 1.6 m/z 고립 창의 사중극자 고립을 사용하여 획득하고 (고에너지 충돌 해리) HCD를 최적의 펩티드 단편화를 위한 전구체 이온의 크기 및 전하를 기준으로 28%로 설정하였다. 이온 트랩 스캔 속도를 4 x 10³의 AGC 표적 및 300 ms의 최대 주입 시간으로 빠르게 설정하고, 상기 오르비트랩이 고분해능 MS 스펙트럼을 수집하는 동안 상기 장비를, 3초 창 동안 상기 트랩내에 이온을 주입하기 위해 최대의 평행화가능한 시간을 사용하도록 설정하였다. 동역학적 배제를, 15초 구간 및 10 ppm의 질량 허용과 함께 1회 발생 후에 전구체 이온이 배제되도록 설정하였다.

프로테옴 디스커버러(Proteome Discoverer) v2.1(서모피셔)에서 시퀘스트(Sequest) 알고리즘을 사용하여 단백질 식별을 수행하였다. 카브아미도메틸을 알킬화제로서 선택하고, 트립신을 절단 효소로서 선택하였으며, H, M, W 및 탈아미드화된 N 및 Q상의 산화를 위한 동역학적 변형을 선택하였고, 이들 3개의 변형은 최대였다. 탠덤 질량 분광분석 데이터를 Nif 구조물의 사내 데이터베이스, 통상적인 오염, 및 유니프롯(UniProt)으로부터 주석이 달린 유기체 특이적인 데이터베이스에 대해 검색하였다. 상기 데이터베이스 검색 결과를 수작업으로 선별하여 프로테옴 디스커버러 소프트웨어내에 내장된 FDR 도구에 의해 측정된 1%의 전체적인 오류발견율(FDR)을 사용하여 단백질 식별을 생성시켰다.

당해 분야의 숙련가는 다수의 변화 및/또는 변형을 본 개시의 광범위한 일반적인 범위로부터 이탈됨 없이 상술한 실시태양에 대해 수행할 수 있음을 알 것이다. 따라서 본 실시태양은 모든 면에서 제한이 아닌 예시적인 것으로서 간주되어야 한다.

본 명세서에서 논의되고/되거나 참조된 모든 간행물은 내용 전체가 본 명세서에 인용된다.

본 명세서에 포함된 서류, 행위, 물질, 장치, 물품 등에 대한 임의의 논의는 오직 본 발명에 대한 개념을 제공하기 위한 것이다. 이들 자료가 모두 본 출원의 각 청구항의 우선일 이전에 존재하였기 때문에 종래 기술의 토대를 형성하거나 또는 본 발명과 관련된 분야의 통상적인 일반적 지식임을 인정하는 것으로서 간주해서는 안 된다.

참조문헌

SEQUENCE LISTING <110> COMMONWEALTH SCIENTIFIC AND INDUSTRIAL RESEARCH ORGANISATION <120> EXPRESSION OF NITROGENASE POLYPEPTIDES IN PLANT CELLS <130> IPA191057-AU <150> AU 2017900359 <151> 2017-02-06 <160> 186 <170> PatentIn version 3.5 <210> 1 <211> 29 <212> PRT <213> Saccharomyces cerevisiae <400> 1 Met Leu Ser Leu Arg Gln Ser Ile Arg Phe Phe Lys Pro Ala Thr Arg 1 5 10 15 Thr Leu Cys Ser Ser Arg Tyr Leu Leu Gln Gln Lys Pro 20 25 <210> 2 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> Derivative sequence <400> 2 Met Gly Leu Ser Leu Leu Arg Gln Ser Ile Arg Phe Phe Lys Pro Ala 1 5 10 15 Thr Arg Thr Leu Cys Ser Ser Arg Tyr Leu Leu Glu Gln Lys Pro 20 25 30 <210> 3 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Motif <220> <221> X <222> (1)..(1) <223> Any amino acid <220> <221> X <222> (3)..(5) <223> Any amino acid <220> <221> X <222> (8)..(8) <223> Any amino acid <400> 3 Xaa Arg Xaa Xaa Xaa Ser Ser Xaa 1 5 <210> 4 <211> 2346 <212> DNA <213> Artificial Sequence <220> <223> Vector sequence <400> 4 ctcctgtggt tggcatgcac atacaaatgg acgaacggat aaaccttttc acgccctttt 60 aaatatccga ttattctaat aaacgctctt ttctcttagg tttacccgcc aatatatcct 120 gtcaaacact gatagtttaa actgaaggcg ggaaacgaca atctgctagt ggatctccca 180 gtcacgacgt tgtaaaacgg gcgccccgcg gaaagctttc gacgaattaa ttccaatccc 240 acaaaaatct gagcttaaca gcacagttgc tcctctcaga gcagaatcgg gtattcaaca 300 ccctcatatc aactactacg ttgtgtataa cggtccacat gccggtatat acgatgactg 360 gggttgtaca aaggcggcaa caaacggcgt tcccggagtt gcacacaaga aatttgccac 420 tattacagag gcaagagcag cagctgacgc gtacacaaca agtcagcaaa cagacaggtt 480 gaacttcatc cccaaaggag aagctcaact caagcccaag agctttgcta aggccctaac 540 aagcccacca aagcaaaaag cccactggct cacgctagga accaaaaggc ccagcagtga 600 tccagcccca aaagagatct cctttgcccc ggagattaca atggacgatt tcctctatct 660 ttacgatcta ggaaggaagt tcgaaggtga aggtgacgac actatgttca ccactgataa 720 tgagaaggtt agcctcttca atttcagaaa gaatgctgac ccacagatgg ttagagaggc 780 ctacgcagca ggtctcatca agacgatcta cccgagtaac aatctccagg agatcaaata 840 ccttcccaag aaggttaaag atgcagtcaa aagattcagg actaattgca tcaagaacac 900 agagaaagac atatttctca agatcagaag tactattcca gtatggacga ttcaaggctt 960 gcttcataaa ccaaggcaag taatagagat tggagtctct aaaaaggtag ttcctactga 1020 atctaaggcc atgcatggag tctaagattc aaatcgagga tctaacagaa ctcgccgtga 1080 agactggcga acagttcata cagagtcttt tacgactcaa tgacaagaag aaaatcttcg 1140 tcaacatggt ggagcacgac actctggtct actccaaaaa tgtcaaagat acagtctcag 1200 aagaccaaag ggctattgag acttttcaac aaaggataat ttcgggaaac ctcctcggat 1260 tccattgccc agctatctgt cacttcatcg aaaggacagt agaaaaggaa ggtggctcct 1320 acaaatgcca tcattgcgat aaaggaaagg ctatcattca agatctctct gccgacagtg 1380 gtcccaaaga tggaccccca cccacgagga gcatcgtgga aaaagaagac gttccaacca 1440 cgtcttcaaa gcaagtggat tgatgtgaca tctccactga cgtaagggat gacgcacaat 1500 cccactatcc ttcgcaagac ccttcctcta tataaggaag ttcatttcat ttggagagga 1560 cacgctcgag taatacgact cactataggg agaccacaac ggtttccctc tagaaataat 1620 tttgtttaac tttaagaagg agatatacca tgggcttgtc actactacgt caatctataa 1680 gatttttcaa gccagccaca agaactttgt gtagctctag atatctgctt gagcaaaaac 1740 ccggcgcgcc ggctgctaac aaagcccgaa aggaagctga gttggctgct gccaccgctg 1800 agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggggt tttttgctgc 1860 ttaagattga atcctgttgc cggtcttgcg atgattatca tataatttct gttgaattac 1920 gttaagcatg taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg 1980 attagagtcc cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac 2040 taggataaat tatcgcgcgc ggtgtcatct atgttactag atccctaggg aagttcctat 2100 tccgaagttc ctattctctg aaaagtatag gaacttcttt gcgtattggg cgctcttggc 2160 ctttttggcc accggtcgta cggttaaaac caccccagta cattaaaaac gtccgcaatg 2220 tgttattaag ttgtctaagc gtcaatttgt ttacaccaca atatatcctg ccaccagcca 2280 gccaacagct ccccgaccgg cagctcggca caaaatcacc actcgataca ggcagcccat 2340 cagtcc 2346 <210> 5 <211> 293 <212> PRT <213> Klebsiella pneumoniae <400> 5 Met Thr Met Arg Gln Cys Ala Ile Tyr Gly Lys Gly Gly Ile Gly Lys 1 5 10 15 Ser Thr Thr Thr Gln Asn Leu Val Ala Ala Leu Ala Glu Met Gly Lys 20 25 30 Lys Val Met Ile Val Gly Cys Asp Pro Lys Ala Asp Ser Thr Arg Leu 35 40 45 Ile Leu His Ala Lys Ala Gln Asn Thr Ile Met Glu Met Ala Ala Glu 50 55 60 Val Gly Ser Val Glu Asp Leu Glu Leu Glu Asp Val Leu Gln Ile Gly 65 70 75 80 Tyr Gly Asp Val Arg Cys Ala Glu Ser Gly Gly Pro Glu Pro Gly Val 85 90 95 Gly Cys Ala Gly Arg Gly Val Ile Thr Ala Ile Asn Phe Leu Glu Glu 100 105 110 Glu Gly Ala Tyr Glu Asp Asp Leu Asp Phe Val Phe Tyr Asp Val Leu 115 120 125 Gly Asp Val Val Cys Gly Gly Phe Ala Met Pro Ile Arg Glu Asn Lys 130 135 140 Ala Gln Glu Ile Tyr Ile Val Cys Ser Gly Glu Met Met Ala Met Tyr 145 150 155 160 Ala Ala Asn Asn Ile Ser Lys Gly Ile Val Lys Tyr Ala Lys Ser Gly 165 170 175 Lys Val Arg Leu Gly Gly Leu Ile Cys Asn Ser Arg Gln Thr Asp Arg 180 185 190 Glu Asp Glu Leu Ile Ile Ala Leu Ala Glu Lys Leu Gly Thr Gln Met 195 200 205 Ile His Phe Val Pro Arg Asp Asn Ile Val Gln Arg Ala Glu Ile Arg 210 215 220 Arg Met Thr Val Ile Glu Tyr Asp Pro Ala Cys Lys Gln Ala Asn Glu 225 230 235 240 Tyr Arg Thr Leu Ala Gln Lys Ile Val Asn Asn Thr Met Lys Val Val 245 250 255 Pro Thr Pro Cys Thr Met Asp Glu Leu Glu Ser Leu Leu Met Glu Phe 260 265 270 Gly Ile Met Glu Glu Glu Asp Thr Ser Ile Ile Gly Lys Thr Ala Ala 275 280 285 Glu Glu Asn Ala Ala 290 <210> 6 <211> 483 <212> PRT <213> Klebsiella pneumoniae <400> 6 Met Met Thr Asn Ala Thr Gly Glu Arg Asn Leu Ala Leu Ile Gln Glu 1 5 10 15 Val Leu Glu Val Phe Pro Glu Thr Ala Arg Lys Glu Arg Arg Lys His 20 25 30 Met Met Val Ser Asp Pro Lys Met Lys Ser Val Gly Lys Cys Ile Ile 35 40 45 Ser Asn Arg Lys Ser Gln Pro Gly Val Met Thr Val Arg Gly Cys Ala 50 55 60 Tyr Ala Gly Ser Lys Gly Val Val Phe Gly Pro Ile Lys Asp Met Ala 65 70 75 80 His Ile Ser His Gly Pro Ala Gly Cys Gly Gln Tyr Ser Arg Ala Glu 85 90 95 Arg Arg Asn Tyr Tyr Thr Gly Val Ser Gly Val Asp Ser Phe Gly Thr 100 105 110 Leu Asn Phe Thr Ser Asp Phe Gln Glu Arg Asp Ile Val Phe Gly Gly 115 120 125 Asp Lys Lys Leu Ser Lys Leu Ile Glu Glu Met Glu Leu Leu Phe Pro 130 135 140 Leu Thr Lys Gly Ile Thr Ile Gln Ser Glu Cys Pro Val Gly Leu Ile 145 150 155 160 Gly Asp Asp Ile Ser Ala Val Ala Asn Ala Ser Ser Lys Ala Leu Asp 165 170 175 Lys Pro Val Ile Pro Val Arg Cys Glu Gly Phe Arg Gly Val Ser Gln 180 185 190 Ser Leu Gly His His Ile Ala Asn Asp Val Val Arg Asp Trp Ile Leu 195 200 205 Asn Asn Arg Glu Gly Gln Pro Phe Glu Thr Thr Pro Tyr Asp Val Ala 210 215 220 Ile Ile Gly Asp Tyr Asn Ile Gly Gly Asp Ala Trp Ala Ser Arg Ile 225 230 235 240 Leu Leu Glu Glu Met Gly Leu Arg Val Val Ala Gln Trp Ser Gly Asp 245 250 255 Gly Thr Leu Val Glu Met Glu Asn Thr Pro Phe Val Lys Leu Asn Leu 260 265 270 Val His Cys Tyr Arg Ser Met Asn Tyr Ile Ala Arg His Met Glu Glu 275 280 285 Lys His Gln Ile Pro Trp Met Glu Tyr Asn Phe Phe Gly Pro Thr Lys 290 295 300 Ile Ala Glu Ser Leu Arg Lys Ile Ala Asp Gln Phe Asp Asp Thr Ile 305 310 315 320 Arg Ala Asn Ala Glu Ala Val Ile Ala Arg Tyr Glu Gly Gln Met Ala 325 330 335 Ala Ile Ile Ala Lys Tyr Arg Pro Arg Leu Glu Gly Arg Lys Val Leu 340 345 350 Leu Tyr Ile Gly Gly Leu Arg Pro Arg His Val Ile Gly Ala Tyr Glu 355 360 365 Asp Leu Gly Met Glu Ile Ile Ala Ala Gly Tyr Glu Phe Ala His Asn 370 375 380 Asp Asp Tyr Asp Arg Thr Leu Pro Asp Leu Lys Glu Gly Thr Leu Leu 385 390 395 400 Phe Asp Asp Ala Ser Ser Tyr Glu Leu Glu Ala Phe Val Lys Ala Leu 405 410 415 Lys Pro Asp Leu Ile Gly Ser Gly Ile Lys Glu Lys Tyr Ile Phe Gln 420 425 430 Lys Met Gly Val Pro Phe Arg Gln Met His Ser Trp Asp Tyr Ser Gly 435 440 445 Pro Tyr His Gly Tyr Asp Gly Phe Ala Ile Phe Ala Arg Asp Met Asp 450 455 460 Met Thr Leu Asn Asn Pro Ala Trp Asn Glu Leu Thr Ala Pro Trp Leu 465 470 475 480 Lys Ser Ala <210> 7 <211> 520 <212> PRT <213> Klebsiella pneumoniae <400> 7 Met Ser Gln Thr Ile Asp Lys Ile Asn Ser Cys Tyr Pro Leu Phe Glu 1 5 10 15 Gln Asp Glu Tyr Gln Glu Leu Phe Arg Asn Lys Arg Gln Leu Glu Glu 20 25 30 Ala His Asp Ala Gln Arg Val Gln Glu Val Phe Ala Trp Thr Thr Thr 35 40 45 Ala Glu Tyr Glu Ala Leu Asn Phe Arg Arg Glu Ala Leu Thr Val Asp 50 55 60 Pro Ala Lys Ala Cys Gln Pro Leu Gly Ala Val Leu Cys Ser Leu Gly 65 70 75 80 Phe Ala Asn Thr Leu Pro Tyr Val His Gly Ser Gln Gly Cys Val Ala 85 90 95 Tyr Phe Arg Thr Tyr Phe Asn Arg His Phe Lys Glu Pro Ile Ala Cys 100 105 110 Val Ser Asp Ser Met Thr Glu Asp Ala Ala Val Phe Gly Gly Asn Asn 115 120 125 Asn Met Asn Leu Gly Leu Gln Asn Ala Ser Ala Leu Tyr Lys Pro Glu 130 135 140 Ile Ile Ala Val Ser Thr Thr Cys Met Ala Glu Val Ile Gly Asp Asp 145 150 155 160 Leu Gln Ala Phe Ile Ala Asn Ala Lys Lys Asp Gly Phe Val Asp Ser 165 170 175 Ser Ile Ala Val Pro His Ala His Thr Pro Ser Phe Ile Gly Ser His 180 185 190 Val Thr Gly Trp Asp Asn Met Phe Glu Gly Phe Ala Lys Thr Phe Thr 195 200 205 Ala Asp Tyr Gln Gly Gln Pro Gly Lys Leu Pro Lys Leu Asn Leu Val 210 215 220 Thr Gly Phe Glu Thr Tyr Leu Gly Asn Phe Arg Val Leu Lys Arg Met 225 230 235 240 Met Glu Gln Met Ala Val Pro Cys Ser Leu Leu Ser Asp Pro Ser Glu 245 250 255 Val Leu Asp Thr Pro Ala Asp Gly His Tyr Arg Met Tyr Ser Gly Gly 260 265 270 Thr Thr Gln Gln Glu Met Lys Glu Ala Pro Asp Ala Ile Asp Thr Leu 275 280 285 Leu Leu Gln Pro Trp Gln Leu Leu Lys Ser Lys Lys Val Val Gln Glu 290 295 300 Met Trp Asn Gln Pro Ala Thr Glu Val Ala Ile Pro Leu Gly Leu Ala 305 310 315 320 Ala Thr Asp Glu Leu Leu Met Thr Val Ser Gln Leu Ser Gly Lys Pro 325 330 335 Ile Ala Asp Ala Leu Thr Leu Glu Arg Gly Arg Leu Val Asp Met Met 340 345 350 Leu Asp Ser His Thr Trp Leu His Gly Lys Lys Phe Gly Leu Tyr Gly 355 360 365 Asp Pro Asp Phe Val Met Gly Leu Thr Arg Phe Leu Leu Glu Leu Gly 370 375 380 Cys Glu Pro Thr Val Ile Leu Ser His Asn Ala Asn Lys Arg Trp Gln 385 390 395 400 Lys Ala Met Asn Lys Met Leu Asp Ala Ser Pro Tyr Gly Arg Asp Ser 405 410 415 Glu Val Phe Ile Asn Cys Asp Leu Trp His Phe Arg Ser Leu Met Phe 420 425 430 Thr Arg Gln Pro Asp Phe Met Ile Gly Asn Ser Tyr Gly Lys Phe Ile 435 440 445 Gln Arg Asp Thr Leu Ala Lys Gly Lys Ala Phe Glu Val Pro Leu Ile 450 455 460 Arg Leu Gly Phe Pro Leu Phe Asp Arg His His Leu His Arg Gln Thr 465 470 475 480 Thr Trp Gly Tyr Glu Gly Ala Met Asn Ile Val Thr Thr Leu Val Asn 485 490 495 Ala Val Leu Glu Lys Leu Asp Ser Asp Thr Ser Gln Leu Gly Lys Thr 500 505 510 Asp Tyr Ser Phe Asp Leu Val Arg 515 520 <210> 8 <211> 220 <212> PRT <213> Klebsiella pneumoniae <400> 8 Met Ser Asp Asn Asp Thr Leu Phe Trp Arg Met Leu Ala Leu Phe Gln 1 5 10 15 Ser Leu Pro Asp Leu Gln Pro Ala Gln Ile Val Asp Trp Leu Ala Gln 20 25 30 Glu Ser Gly Glu Thr Leu Thr Pro Glu Arg Leu Ala Thr Leu Thr Gln 35 40 45 Pro Gln Leu Ala Ala Ser Phe Pro Ser Ala Thr Ala Val Met Ser Pro 50 55 60 Ala Arg Trp Ser Arg Val Met Ala Ser Leu Gln Gly Ala Leu Pro Ala 65 70 75 80 His Leu Arg Ile Val Arg Pro Ala Gln Arg Thr Pro Gln Leu Leu Ala 85 90 95 Ala Phe Cys Ser Gln Asp Gly Leu Val Ile Asn Gly His Phe Gly Gln 100 105 110 Gly Arg Leu Phe Phe Ile Tyr Ala Phe Asp Glu Gln Gly Gly Trp Leu 115 120 125 Tyr Asp Leu Arg Arg Tyr Pro Ser Ala Pro His Gln Gln Glu Ala Asn 130 135 140 Glu Val Arg Ala Arg Leu Ile Glu Asp Cys Gln Leu Leu Phe Cys Gln 145 150 155 160 Glu Ile Gly Gly Pro Ala Ala Ala Arg Pro Ile Arg His Arg Ile His 165 170 175 Pro Met Lys Ala Gln Pro Gly Thr Thr Ile Gln Ala Gln Cys Glu Ala 180 185 190 Ile Asn Thr Leu Leu Ala Gly Arg Leu Pro Pro Trp Leu Ala Lys Arg 195 200 205 Leu Asn Arg Asp Asn Pro Leu Glu Glu Arg Val Phe 210 215 220 <210> 9 <211> 468 <212> PRT <213> Klebsiella pneumoniae <400> 9 Met Thr Ser Cys Ser Ser Phe Ser Gly Gly Lys Ala Cys Arg Pro Ala 1 5 10 15 Asp Asp Ser Ala Leu Thr Pro Leu Val Ala Asp Lys Ala Ala Ala His 20 25 30 Pro Cys Tyr Ser Arg His Gly His His Arg Phe Ala Arg Met His Leu 35 40 45 Pro Val Ala Pro Ala Cys Asn Leu Gln Cys Asn Tyr Cys Asn Arg Lys 50 55 60 Phe Asp Cys Ser Asn Glu Ser Arg Pro Gly Val Ser Ser Thr Leu Leu 65 70 75 80 Thr Pro Glu Gln Ala Val Val Lys Val Arg Gln Val Ala Gln Ala Ile 85 90 95 Pro Gln Leu Ser Val Val Gly Ile Ala Gly Pro Gly Asp Pro Leu Ala 100 105 110 Asn Ile Ala Arg Thr Phe Arg Thr Leu Glu Leu Ile Arg Glu Gln Leu 115 120 125 Pro Asp Leu Lys Leu Cys Leu Ser Thr Asn Gly Leu Val Leu Pro Asp 130 135 140 Ala Val Asp Arg Leu Leu Asp Val Gly Val Asp His Val Thr Val Thr 145 150 155 160 Ile Asn Thr Leu Asp Ala Glu Ile Ala Ala Gln Ile Tyr Ala Trp Leu 165 170 175 Trp Leu Asp Gly Glu Arg Tyr Ser Gly Arg Glu Ala Gly Glu Ile Leu 180 185 190 Ile Ala Arg Gln Leu Glu Gly Val Arg Arg Leu Thr Ala Lys Gly Val 195 200 205 Leu Val Lys Ile Asn Ser Val Leu Ile Pro Gly Ile Asn Asp Ser Gly 210 215 220 Met Ala Gly Val Ser Arg Ala Leu Arg Ala Ser Gly Ala Phe Ile His 225 230 235 240 Asn Ile Met Pro Leu Ile Ala Arg Pro Glu His Gly Thr Val Phe Gly 245 250 255 Leu Asn Gly Gln Pro Glu Pro Asp Ala Glu Thr Leu Ala Ala Thr Arg 260 265 270 Ser Arg Cys Gly Glu Val Met Pro Gln Met Thr His Cys His Gln Cys 275 280 285 Arg Ala Asp Ala Ile Gly Met Leu Gly Glu Asp Arg Ser Gln Gln Phe 290 295 300 Thr Gln Leu Pro Ala Pro Glu Ser Leu Pro Ala Trp Leu Pro Ile Leu 305 310 315 320 His Gln Arg Ala Gln Leu His Ala Ser Ile Ala Thr Arg Gly Glu Ser 325 330 335 Glu Ala Asp Asp Ala Cys Leu Val Ala Val Ala Ser Ser Arg Gly Asp 340 345 350 Val Ile Asp Cys His Phe Gly His Ala Asp Arg Phe Tyr Ile Tyr Ser 355 360 365 Leu Ser Ala Ala Gly Met Val Leu Val Asn Glu Arg Phe Thr Pro Lys 370 375 380 Tyr Cys Gln Gly Arg Asp Asp Cys Glu Pro Gln Asp Asn Ala Ala Arg 385 390 395 400 Phe Ala Ala Ile Leu Glu Leu Leu Ala Asp Val Lys Ala Val Phe Cys 405 410 415 Val Arg Ile Gly His Thr Pro Trp Gln Gln Leu Glu Gln Glu Gly Ile 420 425 430 Glu Pro Cys Val Asp Gly Ala Trp Arg Pro Val Ser Glu Val Leu Pro 435 440 445 Ala Trp Trp Gln Gln Arg Arg Gly Ser Trp Pro Ala Ala Leu Pro His 450 455 460 Lys Gly Val Ala 465 <210> 10 <211> 457 <212> PRT <213> Klebsiella pneumoniae <400> 10 Met Lys Gly Asn Glu Ile Leu Ala Leu Leu Asp Glu Pro Ala Cys Glu 1 5 10 15 His Asn His Lys Gln Lys Ser Gly Cys Ser Ala Pro Lys Pro Gly Ala 20 25 30 Thr Ala Ala Gly Cys Ala Phe Asp Gly Ala Gln Ile Thr Leu Leu Pro 35 40 45 Ile Ala Asp Val Ala His Leu Val His Gly Pro Ile Gly Cys Ala Gly 50 55 60 Ser Ser Trp Asp Asn Arg Gly Ser Ala Ser Ser Gly Pro Thr Leu Asn 65 70 75 80 Arg Leu Gly Phe Thr Thr Asp Leu Asn Glu Gln Asp Val Ile Met Gly 85 90 95 Arg Gly Glu Arg Arg Leu Phe His Ala Val Arg His Ile Val Thr Arg 100 105 110 Tyr His Pro Ala Ala Val Phe Ile Tyr Asn Thr Cys Val Pro Ala Met 115 120 125 Glu Gly Asp Asp Leu Glu Ala Val Cys Gln Ala Ala Gln Thr Ala Thr 130 135 140 Gly Val Pro Val Ile Ala Ile Asp Ala Ala Gly Phe Tyr Gly Ser Lys 145 150 155 160 Asn Leu Gly Asn Arg Pro Ala Gly Asp Val Met Val Lys Arg Val Ile 165 170 175 Gly Gln Arg Glu Pro Ala Pro Trp Pro Glu Ser Thr Leu Phe Ala Pro 180 185 190 Glu Gln Arg His Asp Ile Gly Leu Ile Gly Glu Phe Asn Ile Ala Gly 195 200 205 Glu Phe Trp His Ile Gln Pro Leu Leu Asp Glu Leu Gly Ile Arg Val 210 215 220 Leu Gly Ser Leu Ser Gly Asp Gly Arg Phe Ala Glu Ile Gln Thr Met 225 230 235 240 His Arg Ala Gln Ala Asn Met Leu Val Cys Ser Arg Ala Leu Ile Asn 245 250 255 Val Ala Arg Ala Leu Glu Gln Arg Tyr Gly Thr Pro Trp Phe Glu Gly 260 265 270 Ser Phe Tyr Gly Ile Arg Ala Thr Ser Asp Ala Leu Arg Gln Leu Ala 275 280 285 Ala Leu Leu Gly Asp Asp Asp Leu Arg Gln Arg Thr Glu Ala Leu Ile 290 295 300 Ala Arg Glu Glu Gln Ala Ala Glu Leu Ala Leu Gln Pro Trp Arg Glu 305 310 315 320 Gln Leu Arg Gly Arg Lys Ala Leu Leu Tyr Thr Gly Gly Val Lys Ser 325 330 335 Trp Ser Val Val Ser Ala Leu Gln Asp Leu Gly Met Thr Val Val Ala 340 345 350 Thr Gly Thr Arg Lys Ser Thr Glu Glu Asp Lys Gln Arg Ile Arg Glu 355 360 365 Leu Met Gly Glu Glu Ala Val Met Leu Glu Glu Gly Asn Ala Arg Thr 370 375 380 Leu Leu Asp Val Val Tyr Arg Tyr Gln Ala Asp Leu Met Ile Ala Gly 385 390 395 400 Gly Arg Asn Met Tyr Thr Ala Tyr Lys Ala Arg Leu Pro Phe Leu Asp 405 410 415 Ile Asn Gln Glu Arg Glu His Ala Phe Ala Gly Tyr Gln Gly Ile Val 420 425 430 Thr Leu Ala Arg Gln Leu Cys Gln Thr Ile Asn Ser Pro Ile Trp Pro 435 440 445 Gln Thr His Ser Arg Ala Pro Trp Arg 450 455 <210> 11 <211> 461 <212> PRT <213> Klebsiella pneumoniae <400> 11 Met Ala Asp Ile Phe Arg Thr Asp Lys Pro Leu Ala Val Ser Pro Ile 1 5 10 15 Lys Thr Gly Gln Pro Leu Gly Ala Ile Leu Ala Ser Leu Gly Ile Glu 20 25 30 His Ser Ile Pro Leu Val His Gly Ala Gln Gly Cys Ser Ala Phe Ala 35 40 45 Lys Val Phe Phe Ile Gln His Phe His Asp Pro Val Pro Leu Gln Ser 50 55 60 Thr Ala Met Asp Pro Thr Ser Thr Ile Met Gly Ala Asp Gly Asn Ile 65 70 75 80 Phe Thr Ala Leu Asp Thr Leu Cys Gln Arg Asn Asn Pro Gln Ala Ile 85 90 95 Val Leu Leu Ser Thr Gly Leu Ser Glu Ala Gln Gly Ser Asp Ile Ser 100 105 110 Arg Val Val Arg Gln Phe Arg Glu Glu Tyr Pro Arg His Lys Gly Val 115 120 125 Ala Ile Leu Thr Val Asn Thr Pro Asp Phe Tyr Gly Ser Met Glu Asn 130 135 140 Gly Phe Ser Ala Val Leu Glu Ser Val Ile Glu Gln Trp Val Pro Pro 145 150 155 160 Ala Pro Arg Pro Ala Gln Arg Asn Arg Arg Val Asn Leu Leu Val Ser 165 170 175 His Leu Cys Ser Pro Gly Asp Ile Glu Trp Leu Arg Arg Cys Val Glu 180 185 190 Ala Phe Gly Leu Gln Pro Ile Ile Leu Pro Asp Leu Ala Gln Ser Met 195 200 205 Asp Gly His Leu Ala Gln Gly Asp Phe Ser Pro Leu Thr Gln Gly Gly 210 215 220 Thr Pro Leu Arg Gln Ile Glu Gln Met Gly Gln Ser Leu Cys Ser Phe 225 230 235 240 Ala Ile Gly Val Ser Leu His Arg Ala Ser Ser Leu Leu Ala Pro Arg 245 250 255 Cys Arg Gly Glu Val Ile Ala Leu Pro His Leu Met Thr Leu Glu Arg 260 265 270 Cys Asp Ala Phe Ile His Gln Leu Ala Lys Ile Ser Gly Arg Ala Val 275 280 285 Pro Glu Trp Leu Glu Arg Gln Arg Gly Gln Leu Gln Asp Ala Met Ile 290 295 300 Asp Cys His Met Trp Leu Gln Gly Gln Arg Met Ala Ile Ala Ala Glu 305 310 315 320 Gly Asp Leu Leu Ala Ala Trp Cys Asp Phe Ala Asn Ser Gln Gly Met 325 330 335 Gln Pro Gly Pro Leu Val Ala Pro Thr Gly His Pro Ser Leu Arg Gln 340 345 350 Leu Pro Val Glu Arg Val Val Pro Gly Asp Leu Glu Asp Leu Gln Thr 355 360 365 Leu Leu Cys Ala His Pro Ala Asp Leu Leu Val Ala Asn Ser His Ala 370 375 380 Arg Asp Leu Ala Glu Gln Phe Ala Leu Pro Leu Val Arg Ala Gly Phe 385 390 395 400 Pro Leu Phe Asp Lys Leu Gly Glu Phe Arg Arg Val Arg Gln Gly Tyr 405 410 415 Ser Gly Met Arg Asp Thr Leu Phe Glu Leu Ala Asn Leu Ile Arg Glu 420 425 430 Arg His His His Leu Ala His Tyr Arg Ser Pro Leu Arg Gln Asn Pro 435 440 445 Glu Ser Ser Leu Ser Thr Gly Gly Ala Tyr Ala Ala Asp 450 455 460 <210> 12 <211> 167 <212> PRT <213> Klebsiella pneumoniae <400> 12 Met Pro Pro Leu Asp Trp Leu Arg Arg Leu Trp Leu Leu Tyr His Ala 1 5 10 15 Gly Lys Gly Ser Phe Pro Leu Arg Met Gly Leu Ser Pro Arg Asp Trp 20 25 30 Gln Ala Leu Arg Arg Arg Leu Gly Glu Val Glu Thr Pro Leu Asp Gly 35 40 45 Glu Thr Leu Thr Arg Arg Arg Leu Met Ala Glu Leu Asn Ala Thr Arg 50 55 60 Glu Glu Glu Arg Gln Gln Leu Gly Ala Trp Leu Ala Gly Trp Met Gln 65 70 75 80 Gln Asp Ala Gly Pro Met Ala Gln Ile Ile Ala Glu Val Ser Leu Ala 85 90 95 Phe Asn His Leu Trp Gln Asp Leu Gly Leu Ala Ser Arg Ala Glu Leu 100 105 110 Arg Leu Leu Met Ser Asp Cys Phe Pro Gln Leu Val Val Met Asn Glu 115 120 125 His Asn Met Arg Trp Lys Lys Phe Phe Tyr Arg Gln Arg Cys Leu Leu 130 135 140 Gln Gln Gly Glu Val Ile Cys Arg Ser Pro Ser Cys Asp Glu Cys Trp 145 150 155 160 Glu Arg Ser Ala Cys Phe Glu 165 <210> 13 <211> 400 <212> PRT <213> Klebsiella pneumoniae <400> 13 Met Lys Gln Val Tyr Leu Asp Asn Asn Ala Thr Thr Arg Leu Asp Pro 1 5 10 15 Met Val Leu Glu Ala Met Met Pro Phe Leu Thr Asp Phe Tyr Gly Asn 20 25 30 Pro Ser Ser Ile His Asp Phe Gly Ile Pro Ala Gln Ala Ala Leu Glu 35 40 45 Arg Ala His Gln Gln Ala Ala Ala Leu Leu Gly Ala Glu Tyr Pro Ser 50 55 60 Glu Ile Ile Phe Thr Ser Cys Ala Thr Glu Ala Thr Ala Thr Ala Ile 65 70 75 80 Ala Ser Ala Ile Ala Leu Leu Pro Glu Arg Arg Glu Ile Ile Thr Ser 85 90 95 Val Val Glu His Pro Ala Thr Leu Ala Ala Cys Glu His Met Glu Arg 100 105 110 Glu Gly Tyr Arg Ile His Arg Ile Ala Val Asp Gly Glu Gly Ala Leu 115 120 125 Asp Met Ala Gln Phe Arg Ala Ala Leu Ser Pro Arg Val Ala Leu Val 130 135 140 Ser Val Met Trp Ala Asn Asn Glu Thr Gly Val Leu Phe Pro Ile Gly 145 150 155 160 Glu Met Ala Glu Leu Ala His Glu Gln Gly Ala Leu Phe His Cys Asp 165 170 175 Ala Val Gln Val Val Gly Lys Ile Pro Ile Ala Val Gly Gln Thr Arg 180 185 190 Ile Asp Met Leu Ser Cys Ser Ala His Lys Phe His Gly Pro Lys Gly 195 200 205 Val Gly Cys Leu Tyr Leu Arg Arg Gly Thr Arg Phe Arg Pro Leu Leu 210 215 220 Arg Gly Gly His Gln Glu Tyr Gly Arg Arg Ala Gly Thr Glu Asn Ile 225 230 235 240 Cys Gly Ile Val Gly Met Gly Ala Ala Cys Glu Leu Ala Asn Ile His 245 250 255 Leu Pro Gly Met Thr His Ile Gly Gln Leu Arg Asn Arg Leu Glu His 260 265 270 Arg Leu Leu Ala Ser Val Pro Ser Val Met Val Met Gly Gly Gly Gln 275 280 285 Pro Ala Val Pro Gly Thr Val Asn Leu Ala Phe Glu Phe Ile Glu Gly 290 295 300 Glu Ala Ile Leu Leu Leu Leu Asn Gln Ala Gly Ile Ala Ala Ser Ser 305 310 315 320 Gly Ser Ala Cys Thr Ser Gly Ser Leu Glu Pro Ser His Val Met Arg 325 330 335 Ala Met Asn Ile Pro Tyr Thr Ala Ala His Gly Thr Ile Arg Phe Ser 340 345 350 Leu Ser Arg Tyr Thr Arg Glu Lys Glu Ile Asp Tyr Val Val Ala Thr 355 360 365 Leu Pro Pro Ile Ile Asp Arg Leu Arg Ala Leu Ser Pro Tyr Trp Gln 370 375 380 Asn Gly Lys Pro Arg Pro Ala Asp Ala Val Phe Thr Pro Val Tyr Gly 385 390 395 400 <210> 14 <211> 274 <212> PRT <213> Klebsiella pneumoniae <400> 14 Met Trp Asn Tyr Ser Glu Lys Val Lys Asp His Phe Phe Asn Pro Arg 1 5 10 15 Asn Ala Arg Val Val Asp Asn Ala Asn Ala Val Gly Asp Val Gly Ser 20 25 30 Leu Ser Cys Gly Asp Ala Leu Arg Leu Met Leu Arg Val Asp Pro Gln 35 40 45 Ser Glu Ile Ile Glu Glu Ala Gly Phe Gln Thr Phe Gly Cys Gly Ser 50 55 60 Ala Ile Ala Ser Ser Ser Ala Leu Thr Glu Leu Ile Ile Gly His Thr 65 70 75 80 Leu Ala Glu Ala Gly Gln Ile Thr Asn Gln Gln Ile Ala Asp Tyr Leu 85 90 95 Asp Gly Leu Pro Pro Glu Lys Met His Cys Ser Val Met Gly Gln Glu 100 105 110 Ala Leu Arg Ala Ala Ile Ala Asn Phe Arg Gly Glu Ser Leu Glu Glu 115 120 125 Glu His Asp Glu Gly Lys Leu Ile Cys Lys Cys Phe Gly Val Asp Glu 130 135 140 Gly His Ile Arg Arg Ala Val Gln Asn Asn Gly Leu Thr Thr Leu Ala 145 150 155 160 Glu Val Ile Asn Tyr Thr Lys Ala Gly Gly Gly Cys Thr Ser Cys His 165 170 175 Glu Lys Ile Glu Leu Ala Leu Ala Glu Ile Leu Ala Gln Gln Pro Gln 180 185 190 Thr Thr Pro Ala Val Ala Ser Gly Lys Asp Pro His Trp Gln Ser Val 195 200 205 Val Asp Thr Ile Ala Glu Leu Arg Pro His Ile Gln Ala Asp Gly Gly 210 215 220 Asp Met Ala Leu Leu Ser Val Thr Asn His Gln Val Thr Val Ser Leu 225 230 235 240 Ser Gly Ser Cys Ser Gly Cys Met Met Thr Asp Met Thr Leu Ala Trp 245 250 255 Leu Gln Gln Lys Leu Met Glu Arg Thr Gly Cys Tyr Met Glu Val Val 260 265 270 Ala Ala <210> 15 <211> 156 <212> PRT <213> Klebsiella pneumoniae <400> 15 Met Pro Pro Ile Asn Arg Gln Phe Asp Met Val His Ser Asp Glu Trp 1 5 10 15 Ser Met Lys Val Ala Phe Ala Ser Ser Asp Tyr Arg His Val Asp Gln 20 25 30 His Phe Gly Ala Thr Pro Arg Leu Val Val Tyr Gly Val Lys Ala Asp 35 40 45 Arg Val Thr Leu Ile Arg Val Val Asp Phe Ser Val Glu Asn Gly His 50 55 60 Gln Thr Glu Lys Ile Ala Arg Arg Ile His Ala Leu Glu Asp Cys Val 65 70 75 80 Thr Leu Phe Cys Val Ala Ile Gly Asp Ala Val Phe Arg Gln Leu Leu 85 90 95 Gln Val Gly Val Arg Ala Glu Arg Val Pro Ala Asp Thr Thr Ile Val 100 105 110 Gly Leu Leu Gln Glu Ile Gln Leu Tyr Trp Tyr Asp Lys Gly Gln Arg 115 120 125 Lys Asn Gln Arg Gln Arg Asp Pro Glu Arg Phe Thr Arg Leu Leu Gln 130 135 140 Glu Gln Glu Trp His Gly Asp Pro Asp Pro Arg Arg 145 150 155 <210> 16 <211> 176 <212> PRT <213> Klebsiella pneumoniae <400> 16 Met Ala Asn Ile Gly Ile Phe Phe Gly Thr Asp Thr Gly Lys Thr Arg 1 5 10 15 Lys Ile Ala Lys Met Ile His Lys Gln Leu Gly Glu Leu Ala Asp Ala 20 25 30 Pro Val Asn Ile Asn Arg Thr Thr Leu Asp Asp Phe Met Ala Tyr Pro 35 40 45 Val Leu Leu Leu Gly Thr Pro Thr Leu Gly Asp Gly Gln Leu Pro Gly 50 55 60 Leu Glu Ala Gly Cys Glu Ser Glu Ser Trp Ser Glu Phe Ile Ser Gly 65 70 75 80 Leu Asp Asp Ala Ser Leu Lys Gly Lys Thr Val Ala Leu Phe Gly Leu 85 90 95 Gly Asp Gln Arg Gly Tyr Pro Asp Asn Phe Val Ser Gly Met Arg Pro 100 105 110 Leu Phe Asp Ala Leu Ser Ala Arg Gly Ala Gln Met Ile Gly Ser Trp 115 120 125 Pro Asn Glu Gly Tyr Glu Phe Ser Ala Ser Ser Ala Leu Glu Gly Asp 130 135 140 Arg Phe Val Gly Leu Val Leu Asp Gln Asp Asn Gln Phe Asp Gln Thr 145 150 155 160 Glu Ala Arg Leu Ala Ser Trp Leu Glu Glu Ile Lys Arg Thr Val Leu 165 170 175 <210> 17 <211> 148 <212> PRT <213> Klebsiella pneumoniae <400> 17 Met Arg Pro Lys Phe Thr Phe Ser Glu Glu Val Arg Val Val Arg Ala 1 5 10 15 Ile Arg Asn Asp Gly Thr Val Ala Gly Phe Ala Pro Gly Ala Leu Leu 20 25 30 Val Arg Arg Gly Ser Thr Gly Phe Val Arg Asp Trp Gly Val Phe Leu 35 40 45 Gln Asp Gln Ile Ile Tyr Gln Ile His Phe Pro Glu Thr Asp Arg Ile 50 55 60 Ile Gly Cys Arg Glu Gln Glu Leu Ile Pro Ile Thr Gln Pro Trp Leu 65 70 75 80 Ala Gly Asn Leu Gln Tyr Arg Asp Ser Val Thr Cys Gln Met Ala Leu 85 90 95 Ala Val Asn Gly Asp Val Val Val Ser Ala Gly Gln Arg Gly Arg Val 100 105 110 Glu Ala Thr Asp Arg Gly Glu Leu Gly Asp Ser Tyr Thr Val Asp Phe 115 120 125 Ser Gly Arg Trp Phe Arg Val Pro Val Gln Ala Ile Ala Leu Ile Glu 130 135 140 Glu Arg Glu Glu 145 <210> 18 <211> 1171 <212> PRT <213> Klebsiella pneumoniae <400> 18 Met Ser Gly Lys Met Lys Thr Met Asp Gly Asn Ala Ala Ala Ala Trp 1 5 10 15 Ile Ser Tyr Ala Phe Thr Glu Val Ala Ala Ile Tyr Pro Ile Thr Pro 20 25 30 Ser Thr Pro Met Ala Glu Asn Val Asp Glu Trp Ala Ala Gln Gly Lys 35 40 45 Lys Asn Leu Phe Gly Gln Pro Val Arg Leu Met Glu Met Gln Ser Glu 50 55 60 Ala Gly Ala Ala Gly Ala Val His Gly Ala Leu Gln Ala Gly Ala Leu 65 70 75 80 Thr Thr Thr Tyr Thr Ala Ser Gln Gly Leu Leu Leu Met Ile Pro Asn 85 90 95 Met Tyr Lys Ile Ala Gly Glu Leu Leu Pro Gly Val Phe His Val Ser 100 105 110 Ala Arg Ala Leu Ala Thr Asn Ser Leu Asn Ile Phe Gly Asp His Gln 115 120 125 Asp Val Met Ala Val Arg Gln Thr Gly Cys Ala Met Leu Ala Glu Asn 130 135 140 Asn Val Gln Gln Val Met Asp Leu Ser Ala Val Ala His Leu Ala Ala 145 150 155 160 Ile Lys Gly Arg Ile Pro Phe Val Asn Phe Phe Asp Gly Phe Arg Thr 165 170 175 Ser His Glu Ile Gln Lys Ile Glu Val Leu Glu Tyr Glu Gln Leu Ala 180 185 190 Thr Leu Leu Asp Arg Pro Ala Leu Asp Ser Phe Arg Arg Asn Ala Leu 195 200 205 His Pro Asp His Pro Val Ile Arg Gly Thr Ala Gln Asn Pro Asp Ile 210 215 220 Tyr Phe Gln Glu Arg Glu Ala Gly Asn Arg Phe Tyr Gln Ala Leu Pro 225 230 235 240 Asp Ile Val Glu Ser Tyr Met Thr Gln Ile Ser Ala Leu Thr Gly Arg 245 250 255 Glu Tyr His Leu Phe Asn Tyr Thr Gly Ala Ala Asp Ala Glu Arg Val 260 265 270 Ile Ile Ala Met Gly Ser Val Cys Asp Thr Val Gln Glu Val Val Asp 275 280 285 Thr Leu Asn Ala Ala Gly Glu Lys Val Gly Leu Leu Ser Val His Leu 290 295 300 Phe Arg Pro Phe Ser Leu Ala His Phe Phe Ala Gln Leu Pro Lys Thr 305 310 315 320 Val Gln Arg Ile Ala Val Leu Asp Arg Thr Lys Glu Pro Gly Ala Gln 325 330 335 Ala Glu Pro Leu Cys Leu Asp Val Lys Asn Ala Phe Tyr His His Asp 340 345 350 Asp Ala Pro Leu Ile Val Gly Gly Arg Tyr Ala Leu Gly Gly Lys Asp 355 360 365 Val Leu Pro Asn Asp Ile Ala Ala Val Phe Asp Asn Leu Asn Lys Pro 370 375 380 Leu Pro Met Asp Gly Phe Thr Leu Gly Ile Val Asp Asp Val Thr Phe 385 390 395 400 Thr Ser Leu Pro Pro Arg Gln Gln Thr Leu Ala Val Ser His Asp Gly 405 410 415 Ile Thr Ala Cys Lys Phe Trp Gly Met Gly Ser Asp Gly Thr Val Gly 420 425 430 Ala Asn Lys Ser Ala Ile Lys Ile Ile Gly Asp Lys Thr Pro Leu Tyr 435 440 445 Ala Gln Ala Tyr Phe Ser Tyr Asp Ser Lys Lys Ser Gly Gly Ile Thr 450 455 460 Val Ser His Leu Arg Phe Gly Asp Arg Pro Ile Asn Ser Pro Tyr Leu 465 470 475 480 Ile His Arg Ala Asp Phe Ile Ser Cys Ser Gln Gln Ser Tyr Val Glu 485 490 495 Arg Tyr Asp Leu Leu Asp Gly Leu Lys Pro Gly Gly Thr Phe Leu Leu 500 505 510 Asn Cys Ser Trp Ser Asp Ala Glu Leu Glu Gln His Leu Pro Val Gly 515 520 525 Phe Lys Arg Tyr Leu Ala Arg Glu Asn Ile His Phe Tyr Thr Leu Asn 530 535 540 Ala Val Asp Ile Ala Arg Glu Leu Gly Leu Gly Gly Arg Phe Asn Met 545 550 555 560 Leu Met Gln Ala Ala Phe Phe Lys Leu Ala Ala Ile Ile Asp Pro Gln 565 570 575 Thr Ala Ala Asp Tyr Leu Lys Gln Ala Val Glu Lys Ser Tyr Gly Ser 580 585 590 Lys Gly Ala Ala Val Ile Glu Met Asn Gln Arg Ala Ile Glu Leu Gly 595 600 605 Met Ala Ser Leu His Gln Val Thr Ile Pro Ala His Trp Ala Thr Leu 610 615 620 Asp Glu Pro Ala Ala Gln Ala Ser Ala Met Met Pro Asp Phe Ile Arg 625 630 635 640 Asp Ile Leu Gln Pro Met Asn Arg Gln Cys Gly Asp Gln Leu Pro Val 645 650 655 Ser Ala Phe Val Gly Met Glu Asp Gly Thr Phe Pro Ser Gly Thr Ala 660 665 670 Ala Trp Glu Lys Arg Gly Ile Ala Leu Glu Val Pro Val Trp Gln Pro 675 680 685 Glu Gly Cys Thr Gln Cys Asn Gln Cys Ala Phe Ile Cys Pro His Ala 690 695 700 Ala Ile Arg Pro Ala Leu Leu Asn Gly Glu Glu His Asp Ala Ala Pro 705 710 715 720 Val Gly Leu Leu Ser Lys Pro Ala Gln Gly Ala Lys Glu Tyr His Tyr 725 730 735 His Leu Ala Ile Ser Pro Leu Asp Cys Ser Gly Cys Gly Asn Cys Val 740 745 750 Asp Ile Cys Pro Ala Arg Gly Lys Ala Leu Lys Met Gln Ser Leu Asp 755 760 765 Ser Gln Arg Gln Met Ala Pro Val Trp Asp Tyr Ala Leu Ala Leu Thr 770 775 780 Pro Lys Ser Asn Pro Phe Arg Lys Thr Thr Val Lys Gly Ser Gln Phe 785 790 795 800 Glu Thr Pro Leu Leu Glu Phe Ser Gly Ala Cys Ala Gly Cys Gly Glu 805 810 815 Thr Pro Tyr Ala Arg Leu Ile Thr Gln Leu Phe Gly Asp Arg Met Leu 820 825 830 Ile Ala Asn Ala Thr Gly Cys Ser Ser Ile Trp Gly Ala Ser Ala Pro 835 840 845 Ser Ile Pro Tyr Thr Thr Asn His Arg Gly His Gly Pro Ala Trp Ala 850 855 860 Asn Ser Leu Phe Glu Asp Asn Ala Glu Phe Gly Leu Gly Met Met Leu 865 870 875 880 Gly Gly Gln Ala Val Arg Gln Gln Ile Ala Asp Asp Met Thr Ala Ala 885 890 895 Leu Ala Leu Pro Val Ser Asp Glu Leu Ser Asp Ala Met Arg Gln Trp 900 905 910 Leu Ala Lys Gln Asp Glu Gly Glu Gly Thr Arg Glu Arg Ala Asp Arg 915 920 925 Leu Ser Glu Arg Leu Ala Ala Glu Lys Glu Gly Val Pro Leu Leu Glu 930 935 940 Gln Leu Trp Gln Asn Arg Asp Tyr Phe Val Arg Arg Ser Gln Trp Ile 945 950 955 960 Phe Gly Gly Asp Gly Trp Ala Tyr Asp Ile Gly Phe Gly Gly Leu Asp 965 970 975 His Val Leu Ala Ser Gly Glu Asp Val Asn Ile Leu Val Phe Asp Thr 980 985 990 Glu Val Tyr Ser Asn Thr Gly Gly Gln Ser Ser Lys Ser Thr Pro Val 995 1000 1005 Ala Ala Ile Ala Lys Phe Ala Ala Gln Gly Lys Arg Thr Arg Lys 1010 1015 1020 Lys Asp Leu Gly Met Met Ala Met Ser Tyr Gly Asn Val Tyr Val 1025 1030 1035 Ala Gln Val Ala Met Gly Ala Asp Lys Asp Gln Thr Leu Arg Ala 1040 1045 1050 Ile Ala Glu Ala Glu Ala Trp Pro Gly Pro Ser Leu Val Ile Ala 1055 1060 1065 Tyr Ala Ala Cys Ile Asn His Gly Leu Lys Ala Gly Met Arg Cys 1070 1075 1080 Ser Gln Arg Glu Ala Lys Arg Ala Val Glu Ala Gly Tyr Trp His 1085 1090 1095 Leu Trp Arg Tyr His Pro Gln Arg Glu Ala Glu Gly Lys Thr Pro 1100 1105 1110 Phe Met Leu Asp Ser Glu Glu Pro Glu Glu Ser Phe Arg Asp Phe 1115 1120 1125 Leu Leu Gly Glu Val Arg Tyr Ala Ser Leu His Lys Thr Thr Pro 1130 1135 1140 His Leu Ala Asp Ala Leu Phe Ser Arg Thr Glu Glu Asp Ala Arg 1145 1150 1155 Ala Arg Phe Ala Gln Tyr Arg Arg Leu Ala Gly Glu Glu 1160 1165 1170 <210> 19 <211> 266 <212> PRT <213> Klebsiella pneumoniae <400> 19 Met Asn Pro Trp Gln Arg Phe Ala Arg Gln Arg Leu Ala Arg Ser Arg 1 5 10 15 Trp Asn Arg Asp Pro Ala Ala Leu Asp Pro Ala Asp Thr Pro Ala Phe 20 25 30 Glu Gln Ala Trp Gln Arg Gln Cys His Met Glu Gln Thr Ile Val Ala 35 40 45 Arg Val Pro Glu Gly Asp Ile Pro Ala Ala Leu Leu Glu Asn Ile Ala 50 55 60 Ala Ser Leu Ala Ile Trp Leu Asp Glu Gly Asp Phe Ala Pro Pro Glu 65 70 75 80 Arg Ala Ala Ile Val Arg His His Ala Arg Leu Glu Leu Ala Phe Ala 85 90 95 Asp Ile Ala Arg Gln Ala Pro Gln Pro Asp Leu Ser Thr Val Gln Ala 100 105 110 Trp Tyr Leu Arg His Gln Thr Gln Phe Met Arg Pro Glu Gln Arg Leu 115 120 125 Thr Arg His Leu Leu Leu Thr Val Asp Asn Asp Arg Glu Ala Val His 130 135 140 Gln Arg Ile Leu Gly Leu Tyr Arg Gln Ile Asn Ala Ser Arg Asp Ala 145 150 155 160 Phe Ala Pro Leu Ala Gln Arg His Ser His Cys Pro Ser Ala Leu Glu 165 170 175 Glu Gly Arg Leu Gly Trp Ile Ser Arg Gly Leu Leu Tyr Pro Gln Leu 180 185 190 Glu Thr Ala Leu Phe Ser Leu Ala Glu Asn Ala Leu Ser Leu Pro Ile 195 200 205 Ala Ser Glu Leu Gly Trp His Leu Leu Trp Cys Glu Ala Ile Arg Pro 210 215 220 Ala Ala Pro Met Glu Pro Gln Gln Ala Leu Glu Ser Ala Arg Asp Tyr 225 230 235 240 Leu Trp Gln Gln Ser Gln Gln Arg His Gln Arg Gln Trp Leu Glu Gln 245 250 255 Met Ile Ser Arg Gln Pro Gly Leu Cys Gly 260 265 <210> 20 <211> 381 <212> PRT <213> Klebsiella pneumoniae <400> 20 Met Glu Arg Val Leu Ile Asn Asp Thr Thr Leu Arg Asp Gly Glu Gln 1 5 10 15 Ser Pro Gly Val Ala Phe Arg Thr Ser Glu Lys Val Ala Ile Ala Glu 20 25 30 Ala Leu Tyr Ala Ala Gly Ile Thr Ala Met Glu Val Gly Thr Pro Ala 35 40 45 Met Gly Asp Glu Glu Ile Ala Arg Ile Gln Leu Val Arg Arg Gln Leu 50 55 60 Pro Asp Ala Thr Leu Met Thr Trp Cys Arg Met Asn Ala Leu Glu Ile 65 70 75 80 Arg Gln Ser Ala Asp Leu Gly Ile Asp Trp Val Asp Ile Ser Ile Pro 85 90 95 Ala Ser Asp Lys Leu Arg Gln Tyr Lys Leu Arg Glu Pro Leu Ala Val 100 105 110 Leu Leu Glu Arg Leu Ala Met Phe Ile His Leu Ala His Thr Leu Gly 115 120 125 Leu Lys Val Cys Ile Gly Cys Glu Asp Ala Ser Arg Ala Ser Gly Gln 130 135 140 Thr Leu Arg Ala Ile Ala Glu Val Ala Gln Asn Ala Pro Ala Ala Arg 145 150 155 160 Leu Arg Tyr Ala Asp Thr Val Gly Leu Leu Asp Pro Phe Thr Thr Ala 165 170 175 Ala Gln Ile Ser Ala Leu Arg Asp Val Trp Ser Gly Glu Ile Glu Met 180 185 190 His Ala His Asn Asp Leu Gly Met Ala Thr Ala Asn Thr Leu Ala Ala 195 200 205 Val Ser Ala Gly Ala Thr Ser Val Asn Thr Thr Val Leu Gly Leu Gly 210 215 220 Glu Arg Ala Gly Asn Ala Ala Ala Trp Lys Pro Ser Ala Leu Gly Leu 225 230 235 240 Glu Arg Cys Leu Gly Val Glu Thr Gly Val His Phe Ser Ala Leu Pro 245 250 255 Ala Leu Cys Gln Arg Val Ala Glu Ala Ala Gln Arg Ala Ile Asp Pro 260 265 270 Gln Gln Pro Leu Val Gly Glu Leu Val Phe Thr His Glu Ser Gly Val 275 280 285 His Val Ala Ala Leu Leu Arg Asp Ser Glu Ser Tyr Gln Ser Ile Ala 290 295 300 Pro Ser Leu Met Gly Arg Ser Tyr Arg Leu Val Leu Gly Lys His Ser 305 310 315 320 Gly Arg Gln Ala Val Asn Gly Val Phe Asp Gln Met Gly Tyr His Leu 325 330 335 Asn Ala Ala Gln Ile Asn Gln Leu Leu Pro Ala Ile Arg Arg Phe Ala 340 345 350 Glu Asn Trp Lys Arg Ser Pro Lys Asp Tyr Glu Leu Val Ala Ile Tyr 355 360 365 Asp Glu Leu Cys Gly Glu Ser Ala Leu Arg Ala Arg Gly 370 375 380 <210> 21 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> C-terminal extension <400> 21 Ala Gly Gly Gly Gly Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Pro 1 5 10 15 Gly <210> 22 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> C-terminal extension <400> 22 Ala Gly Asp Tyr Lys Asp Asp Asp Asp Lys Pro Gly 1 5 10 <210> 23 <211> 343 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 23 Met Gly Leu Ser Leu Leu Arg Gln Ser Ile Arg Phe Phe Lys Pro Ala 1 5 10 15 Thr Arg Thr Leu Cys Ser Ser Arg Tyr Leu Leu Glu Gln Lys Pro Gly 20 25 30 Ala Pro Thr Met Arg Gln Cys Ala Ile Tyr Gly Lys Gly Gly Ile Gly 35 40 45 Lys Ser Thr Thr Thr Gln Asn Leu Val Ala Ala Leu Ala Glu Met Gly 50 55 60 Lys Lys Val Met Ile Val Gly Cys Asp Pro Lys Ala Asp Ser Thr Arg 65 70 75 80 Leu Ile Leu His Ala Lys Ala Gln Asn Thr Ile Met Glu Met Ala Ala 85 90 95 Glu Val Gly Ser Val Glu Asp Leu Glu Leu Glu Asp Val Leu Gln Ile 100 105 110 Gly Tyr Gly Asp Val Arg Cys Ala Glu Ser Gly Gly Pro Glu Pro Gly 115 120 125 Val Gly Cys Ala Gly Arg Gly Val Ile Thr Ala Ile Asn Phe Leu Glu 130 135 140 Glu Glu Gly Ala Tyr Glu Asp Asp Leu Asp Phe Val Phe Tyr Asp Val 145 150 155 160 Leu Gly Asp Val Val Cys Gly Gly Phe Ala Met Pro Ile Arg Glu Asn 165 170 175 Lys Ala Gln Glu Ile Tyr Ile Val Cys Ser Gly Glu Met Met Ala Met 180 185 190 Tyr Ala Ala Asn Asn Ile Ser Lys Gly Ile Val Lys Tyr Ala Lys Ser 195 200 205 Gly Lys Val Arg Leu Gly Gly Leu Ile Cys Asn Ser Arg Gln Thr Asp 210 215 220 Arg Glu Asp Glu Leu Ile Ile Ala Leu Ala Glu Lys Leu Gly Thr Gln 225 230 235 240 Met Ile His Phe Val Pro Arg Asp Asn Ile Val Gln Arg Ala Glu Ile 245 250 255 Arg Arg Met Thr Val Ile Glu Tyr Asp Pro Ala Cys Lys Gln Ala Asn 260 265 270 Glu Tyr Arg Thr Leu Ala Gln Lys Ile Val Asn Asn Thr Met Lys Val 275 280 285 Val Pro Thr Pro Cys Thr Met Asp Glu Leu Glu Ser Leu Leu Met Glu 290 295 300 Phe Gly Ile Met Glu Glu Glu Asp Thr Ser Ile Ile Gly Lys Thr Ala 305 310 315 320 Ala Glu Glu Asn Ala Ala Ala Gly Gly Gly Gly Gly Tyr Pro Tyr Asp 325 330 335 Val Pro Asp Tyr Ala Pro Gly 340 <210> 24 <211> 527 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 24 Met Gly Leu Ser Leu Leu Arg Gln Ser Ile Arg Phe Phe Lys Pro Ala 1 5 10 15 Thr Arg Thr Leu Cys Ser Ser Arg Tyr Leu Leu Glu Gln Lys Pro Gly 20 25 30 Ala Pro Thr Asn Ala Thr Gly Glu Arg Asn Leu Ala Leu Ile Gln Glu 35 40 45 Val Leu Glu Val Phe Pro Glu Thr Ala Arg Lys Glu Arg Arg Lys His 50 55 60 Met Met Val Ser Asp Pro Lys Met Lys Ser Val Gly Lys Cys Ile Ile 65 70 75 80 Ser Asn Arg Lys Ser Gln Pro Gly Val Met Thr Val Arg Gly Cys Ala 85 90 95 Tyr Ala Gly Ser Lys Gly Val Val Phe Gly Pro Ile Lys Asp Met Ala 100 105 110 His Ile Ser His Gly Pro Ala Gly Cys Gly Gln Tyr Ser Arg Ala Glu 115 120 125 Arg Arg Asn Tyr Tyr Thr Gly Val Ser Gly Val Asp Ser Phe Gly Thr 130 135 140 Leu Asn Phe Thr Ser Asp Phe Gln Glu Arg Asp Ile Val Phe Gly Gly 145 150 155 160 Asp Lys Lys Leu Ser Lys Leu Ile Glu Glu Met Glu Leu Leu Phe Pro 165 170 175 Leu Thr Lys Gly Ile Thr Ile Gln Ser Glu Cys Pro Val Gly Leu Ile 180 185 190 Gly Asp Asp Ile Ser Ala Val Ala Asn Ala Ser Ser Lys Ala Leu Asp 195 200 205 Lys Pro Val Ile Pro Val Arg Cys Glu Gly Phe Arg Gly Val Ser Gln 210 215 220 Ser Leu Gly His His Ile Ala Asn Asp Val Val Arg Asp Trp Ile Leu 225 230 235 240 Asn Asn Arg Glu Gly Gln Pro Phe Glu Thr Thr Pro Tyr Asp Val Ala 245 250 255 Ile Ile Gly Asp Tyr Asn Ile Gly Gly Asp Ala Trp Ala Ser Arg Ile 260 265 270 Leu Leu Glu Glu Met Gly Leu Arg Val Val Ala Gln Trp Ser Gly Asp 275 280 285 Gly Thr Leu Val Glu Met Glu Asn Thr Pro Phe Val Lys Leu Asn Leu 290 295 300 Val His Cys Tyr Arg Ser Met Asn Tyr Ile Ala Arg His Met Glu Glu 305 310 315 320 Lys His Gln Ile Pro Trp Met Glu Tyr Asn Phe Phe Gly Pro Thr Lys 325 330 335 Ile Ala Glu Ser Leu Arg Lys Ile Ala Asp Gln Phe Asp Asp Thr Ile 340 345 350 Arg Ala Asn Ala Glu Ala Val Ile Ala Arg Tyr Glu Gly Gln Met Ala 355 360 365 Ala Ile Ile Ala Lys Tyr Arg Pro Arg Leu Glu Gly Arg Lys Val Leu 370 375 380 Leu Tyr Ile Gly Gly Leu Arg Pro Arg His Val Ile Gly Ala Tyr Glu 385 390 395 400 Asp Leu Gly Met Glu Ile Ile Ala Ala Gly Tyr Glu Phe Ala His Asn 405 410 415 Asp Asp Tyr Asp Arg Thr Leu Pro Asp Leu Lys Glu Gly Thr Leu Leu 420 425 430 Phe Asp Asp Ala Ser Ser Tyr Glu Leu Glu Ala Phe Val Lys Ala Leu 435 440 445 Lys Pro Asp Leu Ile Gly Ser Gly Ile Lys Glu Lys Tyr Ile Phe Gln 450 455 460 Lys Met Gly Val Pro Phe Arg Gln Met His Ser Trp Asp Tyr Ser Gly 465 470 475 480 Pro Tyr His Gly Tyr Asp Gly Phe Ala Ile Phe Ala Arg Asp Met Asp 485 490 495 Met Thr Leu Asn Asn Pro Ala Trp Asn Glu Leu Thr Ala Pro Trp Leu 500 505 510 Lys Ser Ala Ala Gly Asp Tyr Lys Asp Asp Asp Asp Lys Pro Gly 515 520 525 <210> 25 <211> 570 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 25 Met Gly Leu Ser Leu Leu Arg Gln Ser Ile Arg Phe Phe Lys Pro Ala 1 5 10 15 Thr Arg Thr Leu Cys Ser Ser Arg Tyr Leu Leu Glu Gln Lys Pro Gly 20 25 30 Ala Pro Ser Gln Thr Ile Asp Lys Ile Asn Ser Cys Tyr Pro Leu Phe 35 40 45 Glu Gln Asp Glu Tyr Gln Glu Leu Phe Arg Asn Lys Arg Gln Leu Glu 50 55 60 Glu Ala His Asp Ala Gln Arg Val Gln Glu Val Phe Ala Trp Thr Thr 65 70 75 80 Thr Ala Glu Tyr Glu Ala Leu Asn Phe Arg Arg Glu Ala Leu Thr Val 85 90 95 Asp Pro Ala Lys Ala Cys Gln Pro Leu Gly Ala Val Leu Cys Ser Leu 100 105 110 Gly Phe Ala Asn Thr Leu Pro Tyr Val His Gly Ser Gln Gly Cys Val 115 120 125 Ala Tyr Phe Arg Thr Tyr Phe Asn Arg His Phe Lys Glu Pro Ile Ala 130 135 140 Cys Val Ser Asp Ser Met Thr Glu Asp Ala Ala Val Phe Gly Gly Asn 145 150 155 160 Asn Asn Met Asn Leu Gly Leu Gln Asn Ala Ser Ala Leu Tyr Lys Pro 165 170 175 Glu Ile Ile Ala Val Ser Thr Thr Cys Met Ala Glu Val Ile Gly Asp 180 185 190 Asp Leu Gln Ala Phe Ile Ala Asn Ala Lys Lys Asp Gly Phe Val Asp 195 200 205 Ser Ser Ile Ala Val Pro His Ala His Thr Pro Ser Phe Ile Gly Ser 210 215 220 His Val Thr Gly Trp Asp Asn Met Phe Glu Gly Phe Ala Lys Thr Phe 225 230 235 240 Thr Ala Asp Tyr Gln Gly Gln Pro Gly Lys Leu Pro Lys Leu Asn Leu 245 250 255 Val Thr Gly Phe Glu Thr Tyr Leu Gly Asn Phe Arg Val Leu Lys Arg 260 265 270 Met Met Glu Gln Met Ala Val Pro Cys Ser Leu Leu Ser Asp Pro Ser 275 280 285 Glu Val Leu Asp Thr Pro Ala Asp Gly His Tyr Arg Met Tyr Ser Gly 290 295 300 Gly Thr Thr Gln Gln Glu Met Lys Glu Ala Pro Asp Ala Ile Asp Thr 305 310 315 320 Leu Leu Leu Gln Pro Trp Gln Leu Leu Lys Ser Lys Lys Val Val Gln 325 330 335 Glu Met Trp Asn Gln Pro Ala Thr Glu Val Ala Ile Pro Leu Gly Leu 340 345 350 Ala Ala Thr Asp Glu Leu Leu Met Thr Val Ser Gln Leu Ser Gly Lys 355 360 365 Pro Ile Ala Asp Ala Leu Thr Leu Glu Arg Gly Arg Leu Val Asp Met 370 375 380 Met Leu Asp Ser His Thr Trp Leu His Gly Lys Lys Phe Gly Leu Tyr 385 390 395 400 Gly Asp Pro Asp Phe Val Met Gly Leu Thr Arg Phe Leu Leu Glu Leu 405 410 415 Gly Cys Glu Pro Thr Val Ile Leu Ser His Asn Ala Asn Lys Arg Trp 420 425 430 Gln Lys Ala Met Asn Lys Met Leu Asp Ala Ser Pro Tyr Gly Arg Asp 435 440 445 Ser Glu Val Phe Ile Asn Cys Asp Leu Trp His Phe Arg Ser Leu Met 450 455 460 Phe Thr Arg Gln Pro Asp Phe Met Ile Gly Asn Ser Tyr Gly Lys Phe 465 470 475 480 Ile Gln Arg Asp Thr Leu Ala Lys Gly Lys Ala Phe Glu Val Pro Leu 485 490 495 Ile Arg Leu Gly Phe Pro Leu Phe Asp Arg His His Leu His Arg Gln 500 505 510 Thr Thr Trp Gly Tyr Glu Gly Ala Met Asn Ile Val Thr Thr Leu Val 515 520 525 Asn Ala Val Leu Glu Lys Leu Asp Ser Asp Thr Ser Gln Leu Gly Lys 530 535 540 Thr Asp Tyr Ser Phe Asp Leu Val Arg Ala Gly Gly Gly Gly Gly Tyr 545 550 555 560 Pro Tyr Asp Val Pro Asp Tyr Ala Pro Gly 565 570 <210> 26 <211> 270 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 26 Met Gly Leu Ser Leu Leu Arg Gln Ser Ile Arg Phe Phe Lys Pro Ala 1 5 10 15 Thr Arg Thr Leu Cys Ser Ser Arg Tyr Leu Leu Glu Gln Lys Pro Gly 20 25 30 Ala Pro Ser Asp Asn Asp Thr Leu Phe Trp Arg Met Leu Ala Leu Phe 35 40 45 Gln Ser Leu Pro Asp Leu Gln Pro Ala Gln Ile Val Asp Trp Leu Ala 50 55 60 Gln Glu Ser Gly Glu Thr Leu Thr Pro Glu Arg Leu Ala Thr Leu Thr 65 70 75 80 Gln Pro Gln Leu Ala Ala Ser Phe Pro Ser Ala Thr Ala Val Met Ser 85 90 95 Pro Ala Arg Trp Ser Arg Val Met Ala Ser Leu Gln Gly Ala Leu Pro 100 105 110 Ala His Leu Arg Ile Val Arg Pro Ala Gln Arg Thr Pro Gln Leu Leu 115 120 125 Ala Ala Phe Cys Ser Gln Asp Gly Leu Val Ile Asn Gly His Phe Gly 130 135 140 Gln Gly Arg Leu Phe Phe Ile Tyr Ala Phe Asp Glu Gln Gly Gly Trp 145 150 155 160 Leu Tyr Asp Leu Arg Arg Tyr Pro Ser Ala Pro His Gln Gln Glu Ala 165 170 175 Asn Glu Val Arg Ala Arg Leu Ile Glu Asp Cys Gln Leu Leu Phe Cys 180 185 190 Gln Glu Ile Gly Gly Pro Ala Ala Ala Arg Pro Ile Arg His Arg Ile 195 200 205 His Pro Met Lys Ala Gln Pro Gly Thr Thr Ile Gln Ala Gln Cys Glu 210 215 220 Ala Ile Asn Thr Leu Leu Ala Gly Arg Leu Pro Pro Trp Leu Ala Lys 225 230 235 240 Arg Leu Asn Arg Asp Asn Pro Leu Glu Glu Arg Val Phe Ala Gly Gly 245 250 255 Gly Gly Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Pro Gly 260 265 270 <210> 27 <211> 950 <212> DNA <213> Artificial Sequence <220> <223> AscI Fragment <400> 27 ggcgcgccaa ctatgagaca atgtgctatc tatggaaagg gtggaatcgg aaagtctact 60 actactcaga accttgttgc tgctcttgct gagatgggaa agaaagttat gatcgttgga 120 tgcgatccta aggctgattc tactagactt atcctccatg ctaaggctca gaacaccatt 180 atggaaatgg ctgctgaggt tggatctgtt gaagatcttg agcttgagga tgttctccaa 240 atcggatacg gtgatgttag atgtgctgaa tctggtggac ctgaacctgg tgttggatgt 300 gctggaagag gtgttattac cgctatcaac ttccttgaag aagagggagc ttacgaggat 360 gatctcgatt tcgttttcta cgatgtgctc ggagatgttg tttgtggtgg atttgctatg 420 cctatcagag agaacaaggc tcaagagatc tacatcgttt gctctggtga gatgatggct 480 atgtatgctg ctaacaacat ctctaaggga atcgtgaagt acgctaagtc tggaaaggtt 540 agacttggag gactcatctg taactctaga cagactgata gagaggatga gcttattatc 600 gctttggctg agaagttggg aactcagatg atccatttcg tgccaagaga taacatcgtt 660 cagagagctg agatcagaag gatgactgtt atcgaatacg atcctgcttg caaacaagct 720 aacgagtata gaactctcgc tcagaagatc gttaacaaca ctatgaaggt ggtgcctact 780 ccttgtacta tggatgaact tgagtctctc ctcatggaat ttggaatcat ggaagaagag 840 gatacctcta tcatcggaaa gactgctgct gaagaaaacg ctgctgccgg cggtggaggt 900 ggataccctt acgacgttcc tgattacgct cccgggtgat gaggcgcgcc 950 <210> 28 <211> 1502 <212> DNA <213> Artificial Sequence <220> <223> AscI fragment <400> 28 ggcgcgccaa ctaatgctac tggtgaaaga aacctcgctc tcatccaaga ggttttggaa 60 gtttttcctg agactgctag gaaagaaagg cgtaagcaca tgatggtgtc tgatcctaag 120 atgaagtctg tgggaaagtg catcatctct aacagaaagt ctcagcctgg tgtgatgact 180 gttagaggat gtgcttatgc tggatctaag ggtgttgttt tcggacctat caaggatatg 240 gctcatatct ctcatggacc tgctggatgt ggacaatatt ctagagctga gcgtaggaac 300 tactacactg gtgtttctgg tgtggattct ttcggaactc tcaacttcac ctctgatttc 360 caagagcgtg atatcgtttt cggaggtgat aagaagctct ctaagttgat cgaagagatg 420 gaactcttgt tcccactcac taagggaatc actatccaat ctgagtgccc tgttggactt 480 atcggagatg atatttctgc tgtggctaac gcttcttcta aggctcttga taagcctgtt 540 atccctgtta gatgtgaagg attcagggga gtttctcagt ctcttggaca tcatatcgct 600 aacgatgtgg tgagagattg gatccttaac aacagagagg gacaaccttt cgagactact 660 ccttacgatg ttgctatcat cggagactac aacattggag gtgatgcttg ggcttctaga 720 atccttcttg aagagatggg actcagagtt gttgctcaat ggtctggtga tggtactctt 780 gttgagatgg aaaacacccc tttcgttaag ctcaacctcg ttcattgcta ccgtagcatg 840 aactacattg ctagacacat ggaagagaag caccaaattc cttggatgga gtacaacttc 900 ttcggaccta ctaagatcgc tgagtctctt agaaagatcg ctgatcagtt cgatgatacc 960 atcagagcta atgctgaggc tgttattgct agatacgagg gacaaatggc tgctattatc 1020 gctaagtaca gacctagact cgagggaaga aaggttttgc tttacatcgg aggactcaga 1080 cctagacatg ttattggagc ttacgaggat ctcggaatgg aaattattgc tgctggatac 1140 gagttcgctc acaacgatga ttacgataga actctccctg acctcaaaga gggaactctt 1200 cttttcgatg acgcttcttc atacgagctt gaggcttttg ttaaggctct taagcctgat 1260 ctcatcggat ctggaatcaa agagaagtac atcttccaga agatgggagt tcctttcaga 1320 cagatgcact cttgggatta ttctggacct taccatggat acgacggatt tgctatcttc 1380 gctagggata tggatatgac tctcaacaat cctgcttgga acgaacttac tgctccttgg 1440 cttaagtctg ctgccggcga ctacaaagac gatgatgaca aacccgggtg atgaggcgcg 1500 cc 1502 <210> 29 <211> 1631 <212> DNA <213> Artificial Sequence <220> <223> AscI fragment <400> 29 ggcgcgccat ctcaaactat tgataagatc aacagctgct acccactctt tgagcaagat 60 gaataccaag agcttttccg taacaagaga cagcttgaag aggctcatga tgctcagaga 120 gttcaagaag ttttcgcttg gactactact gctgaatacg aggctctcaa ctttagaaga 180 gaggctctta ctgttgaccc tgctaaggct tgtcaacctc ttggagctgt tctttgttct 240 cttggattcg ctaacaccct tccttatgtt catggatctc agggatgtgt ggcttacttc 300 agaacctact tcaacaggca cttcaaagaa cctatcgctt gcgttagcga ttctatgact 360 gaagatgctg ctgttttcgg aggtaacaac aacatgaacc ttggacttca gaacgcttct 420 gctctttaca agcctgagat tatcgctgtg tctactactt gcatggctga agttatcgga 480 gatgatctcc aggctttcat tgctaacgct aagaaggatg gattcgtcga ttcttctatc 540 gctgttcctc atgctcacac tccatctttc atcggatctc atgttaccgg atgggataat 600 atgttcgagg gattcgctaa gaccttcact gctgattatc aaggacagcc tggaaagttg 660 cctaagttga atctcgttac cggattcgag acttacctcg gaaacttcag agtgctcaag 720 agaatgatgg aacagatggc tgtgccttgc tctcttcttt ctgatccttc tgaagtgctc 780 gatactcctg ctgatggaca ttataggatg tactctggtg gaactaccca gcaagaaatg 840 aaggaagctc ctgacgctat cgatactctt cttcttcaac cttggcaact cctcaagtct 900 aagaaagttg tgcaagagat gtggaaccag cctgctactg aagttgctat tcctcttgga 960 cttgctgcta ctgatgagct tctcatgact gtttctcagc tttctggaaa gcctatcgct 1020 gatgctctta ctcttgagag aggtagactc gttgatatga tgctcgattc tcatacttgg 1080 ctccacggaa agaagtttgg actttacgga gatcctgact tcgttatggg acttactaga 1140 ttcttgctcg agcttggatg tgagcctact gttatccttt ctcacaacgc taacaagagg 1200 tggcaaaagg ctatgaacaa gatgcttgat gcttctccat acggaaggga ttctgaggtt 1260 ttcatcaact gcgatctctg gcatttccgt tctctcatgt tcactagaca gcctgatttc 1320 atgatcggaa acagctacgg aaagttcatc cagagagata ctctcgctaa gggaaaggct 1380 ttcgaagttc ctcttatcag acttggattc ccactcttcg atagacatca tctccacaga 1440 caaactactt ggggatatga aggtgctatg aacatcgtta ctaccctcgt taacgctgtt 1500 cttgagaagt tggattctga tacttctcag ctcggaaaga ccgattactc tttcgatctc 1560 gtgagagccg gcggtggagg tggataccct tacgacgttc ctgattacgc tcccgggtga 1620 tgaggcgcgc c 1631 <210> 30 <211> 731 <212> DNA <213> Artificial Sequence <220> <223> AscI fragment <400> 30 ggcgcgccat ctgataatga tacacttttt tggaggatgc tcgctctttt ccagtctctt 60 cctgatcttc aacctgctca aatcgttgat tggcttgctc aagaatctgg tgagactctt 120 actcctgaga gacttgctac tcttactcaa cctcaactcg ctgcttcttt tccttctgct 180 actgctgtta tgtctcctgc tagatggtct agagttatgg cttctcttca gggtgctctc 240 ccagctcatc ttagaatcgt tagacctgct caaagaactc ctcaacttct tgctgctttc 300 tgttctcagg atggacttgt tatcaacgga catttcggac agggtagact ctttttcatc 360 tacgcttttg atgagcaggg aggatggctt tacgatctta gaagatatcc ttctgctcct 420 catcagcaag aggctaatga agttagagct agacttatcg aggattgcca gcttttgttc 480 tgtcaagaaa ttggaggacc tgctgctgct agacctatta gacatagaat ccaccctatg 540 aaggctcaac ctggaactac tatccaagct caatgtgagg ctatcaacac tcttcttgct 600 ggtagacttc ctccttggct tgctaaaaga ctcaacagag ataacccgct cgaagagagg 660 gttttcgccg gcggtggagg tggataccct tacgacgttc ctgattacgc tcccgggtga 720 tgaggcgcgc c 731 <210> 31 <211> 518 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 31 Met Gly Leu Ser Leu Leu Arg Gln Ser Ile Arg Phe Phe Lys Pro Ala 1 5 10 15 Thr Arg Thr Leu Cys Ser Ser Arg Tyr Leu Leu Glu Gln Lys Pro Gly 20 25 30 Ala Pro Thr Ser Cys Ser Ser Phe Ser Gly Gly Lys Ala Cys Arg Pro 35 40 45 Ala Asp Asp Ser Ala Leu Thr Pro Leu Val Ala Asp Lys Ala Ala Ala 50 55 60 His Pro Cys Tyr Ser Arg His Gly His His Arg Phe Ala Arg Met His 65 70 75 80 Leu Pro Val Ala Pro Ala Cys Asn Leu Gln Cys Asn Tyr Cys Asn Arg 85 90 95 Lys Phe Asp Cys Ser Asn Glu Ser Arg Pro Gly Val Ser Ser Thr Leu 100 105 110 Leu Thr Pro Glu Gln Ala Val Val Lys Val Arg Gln Val Ala Gln Ala 115 120 125 Ile Pro Gln Leu Ser Val Val Gly Ile Ala Gly Pro Gly Asp Pro Leu 130 135 140 Ala Asn Ile Ala Arg Thr Phe Arg Thr Leu Glu Leu Ile Arg Glu Gln 145 150 155 160 Leu Pro Asp Leu Lys Leu Cys Leu Ser Thr Asn Gly Leu Val Leu Pro 165 170 175 Asp Ala Val Asp Arg Leu Leu Asp Val Gly Val Asp His Val Thr Val 180 185 190 Thr Ile Asn Thr Leu Asp Ala Glu Ile Ala Ala Gln Ile Tyr Ala Trp 195 200 205 Leu Trp Leu Asp Gly Glu Arg Tyr Ser Gly Arg Glu Ala Gly Glu Ile 210 215 220 Leu Ile Ala Arg Gln Leu Glu Gly Val Arg Arg Leu Thr Ala Lys Gly 225 230 235 240 Val Leu Val Lys Ile Asn Ser Val Leu Ile Pro Gly Ile Asn Asp Ser 245 250 255 Gly Met Ala Gly Val Ser Arg Ala Leu Arg Ala Ser Gly Ala Phe Ile 260 265 270 His Asn Ile Met Pro Leu Ile Ala Arg Pro Glu His Gly Thr Val Phe 275 280 285 Gly Leu Asn Gly Gln Pro Glu Pro Asp Ala Glu Thr Leu Ala Ala Thr 290 295 300 Arg Ser Arg Cys Gly Glu Val Met Pro Gln Met Thr His Cys His Gln 305 310 315 320 Cys Arg Ala Asp Ala Ile Gly Met Leu Gly Glu Asp Arg Ser Gln Gln 325 330 335 Phe Thr Gln Leu Pro Ala Pro Glu Ser Leu Pro Ala Trp Leu Pro Ile 340 345 350 Leu His Gln Arg Ala Gln Leu His Ala Ser Ile Ala Thr Arg Gly Glu 355 360 365 Ser Glu Ala Asp Asp Ala Cys Leu Val Ala Val Ala Ser Ser Arg Gly 370 375 380 Asp Val Ile Asp Cys His Phe Gly His Ala Asp Arg Phe Tyr Ile Tyr 385 390 395 400 Ser Leu Ser Ala Ala Gly Met Val Leu Val Asn Glu Arg Phe Thr Pro 405 410 415 Lys Tyr Cys Gln Gly Arg Asp Asp Cys Glu Pro Gln Asp Asn Ala Ala 420 425 430 Arg Phe Ala Ala Ile Leu Glu Leu Leu Ala Asp Val Lys Ala Val Phe 435 440 445 Cys Val Arg Ile Gly His Thr Pro Trp Gln Gln Leu Glu Gln Glu Gly 450 455 460 Ile Glu Pro Cys Val Asp Gly Ala Trp Arg Pro Val Ser Glu Val Leu 465 470 475 480 Pro Ala Trp Trp Gln Gln Arg Arg Gly Ser Trp Pro Ala Ala Leu Pro 485 490 495 His Lys Gly Val Ala Ala Gly Gly Gly Gly Gly Tyr Pro Tyr Asp Val 500 505 510 Pro Asp Tyr Ala Pro Gly 515 <210> 32 <211> 507 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 32 Met Gly Leu Ser Leu Leu Arg Gln Ser Ile Arg Phe Phe Lys Pro Ala 1 5 10 15 Thr Arg Thr Leu Cys Ser Ser Arg Tyr Leu Leu Glu Gln Lys Pro Gly 20 25 30 Ala Pro Lys Gly Asn Glu Ile Leu Ala Leu Leu Asp Glu Pro Ala Cys 35 40 45 Glu His Asn His Lys Gln Lys Ser Gly Cys Ser Ala Pro Lys Pro Gly 50 55 60 Ala Thr Ala Ala Gly Cys Ala Phe Asp Gly Ala Gln Ile Thr Leu Leu 65 70 75 80 Pro Ile Ala Asp Val Ala His Leu Val His Gly Pro Ile Gly Cys Ala 85 90 95 Gly Ser Ser Trp Asp Asn Arg Gly Ser Ala Ser Ser Gly Pro Thr Leu 100 105 110 Asn Arg Leu Gly Phe Thr Thr Asp Leu Asn Glu Gln Asp Val Ile Met 115 120 125 Gly Arg Gly Glu Arg Arg Leu Phe His Ala Val Arg His Ile Val Thr 130 135 140 Arg Tyr His Pro Ala Ala Val Phe Ile Tyr Asn Thr Cys Val Pro Ala 145 150 155 160 Met Glu Gly Asp Asp Leu Glu Ala Val Cys Gln Ala Ala Gln Thr Ala 165 170 175 Thr Gly Val Pro Val Ile Ala Ile Asp Ala Ala Gly Phe Tyr Gly Ser 180 185 190 Lys Asn Leu Gly Asn Arg Pro Ala Gly Asp Val Met Val Lys Arg Val 195 200 205 Ile Gly Gln Arg Glu Pro Ala Pro Trp Pro Glu Ser Thr Leu Phe Ala 210 215 220 Pro Glu Gln Arg His Asp Ile Gly Leu Ile Gly Glu Phe Asn Ile Ala 225 230 235 240 Gly Glu Phe Trp His Ile Gln Pro Leu Leu Asp Glu Leu Gly Ile Arg 245 250 255 Val Leu Gly Ser Leu Ser Gly Asp Gly Arg Phe Ala Glu Ile Gln Thr 260 265 270 Met His Arg Ala Gln Ala Asn Met Leu Val Cys Ser Arg Ala Leu Ile 275 280 285 Asn Val Ala Arg Ala Leu Glu Gln Arg Tyr Gly Thr Pro Trp Phe Glu 290 295 300 Gly Ser Phe Tyr Gly Ile Arg Ala Thr Ser Asp Ala Leu Arg Gln Leu 305 310 315 320 Ala Ala Leu Leu Gly Asp Asp Asp Leu Arg Gln Arg Thr Glu Ala Leu 325 330 335 Ile Ala Arg Glu Glu Gln Ala Ala Glu Leu Ala Leu Gln Pro Trp Arg 340 345 350 Glu Gln Leu Arg Gly Arg Lys Ala Leu Leu Tyr Thr Gly Gly Val Lys 355 360 365 Ser Trp Ser Val Val Ser Ala Leu Gln Asp Leu Gly Met Thr Val Val 370 375 380 Ala Thr Gly Thr Arg Lys Ser Thr Glu Glu Asp Lys Gln Arg Ile Arg 385 390 395 400 Glu Leu Met Gly Glu Glu Ala Val Met Leu Glu Glu Gly Asn Ala Arg 405 410 415 Thr Leu Leu Asp Val Val Tyr Arg Tyr Gln Ala Asp Leu Met Ile Ala 420 425 430 Gly Gly Arg Asn Met Tyr Thr Ala Tyr Lys Ala Arg Leu Pro Phe Leu 435 440 445 Asp Ile Asn Gln Glu Arg Glu His Ala Phe Ala Gly Tyr Gln Gly Ile 450 455 460 Val Thr Leu Ala Arg Gln Leu Cys Gln Thr Ile Asn Ser Pro Ile Trp 465 470 475 480 Pro Gln Thr His Ser Arg Ala Pro Trp Arg Ala Gly Gly Gly Gly Gly 485 490 495 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Pro Gly 500 505 <210> 33 <211> 505 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 33 Met Gly Leu Ser Leu Leu Arg Gln Ser Ile Arg Phe Phe Lys Pro Ala 1 5 10 15 Thr Arg Thr Leu Cys Ser Ser Arg Tyr Leu Leu Glu Gln Lys Pro Gly 20 25 30 Ala Pro Ala Asp Ile Phe Arg Thr Asp Lys Pro Leu Ala Val Ser Pro 35 40 45 Ile Lys Thr Gly Gln Pro Leu Gly Ala Ile Leu Ala Ser Leu Gly Ile 50 55 60 Glu His Ser Ile Pro Leu Val His Gly Ala Gln Gly Cys Ser Ala Phe 65 70 75 80 Ala Lys Val Phe Phe Ile Gln His Phe His Asp Pro Val Pro Leu Gln 85 90 95 Ser Thr Ala Met Asp Pro Thr Ser Thr Ile Met Gly Ala Asp Gly Asn 100 105 110 Ile Phe Thr Ala Leu Asp Thr Leu Cys Gln Arg Asn Asn Pro Gln Ala 115 120 125 Ile Val Leu Leu Ser Thr Gly Leu Ser Glu Ala Gln Gly Ser Asp Ile 130 135 140 Ser Arg Val Val Arg Gln Phe Arg Glu Glu Tyr Pro Arg His Lys Gly 145 150 155 160 Val Ala Ile Leu Thr Val Asn Thr Pro Asp Phe Tyr Gly Ser Met Glu 165 170 175 Asn Gly Phe Ser Ala Val Leu Glu Ser Val Ile Glu Gln Trp Val Pro 180 185 190 Pro Ala Pro Arg Pro Ala Gln Arg Asn Arg Arg Val Asn Leu Leu Val 195 200 205 Ser His Leu Cys Ser Pro Gly Asp Ile Glu Trp Leu Arg Arg Cys Val 210 215 220 Glu Ala Phe Gly Leu Gln Pro Ile Ile Leu Pro Asp Leu Ala Gln Ser 225 230 235 240 Met Asp Gly His Leu Ala Gln Gly Asp Phe Ser Pro Leu Thr Gln Gly 245 250 255 Gly Thr Pro Leu Arg Gln Ile Glu Gln Met Gly Gln Ser Leu Cys Ser 260 265 270 Phe Ala Ile Gly Val Ser Leu His Arg Ala Ser Ser Leu Leu Ala Pro 275 280 285 Arg Cys Arg Gly Glu Val Ile Ala Leu Pro His Leu Met Thr Leu Glu 290 295 300 Arg Cys Asp Ala Phe Ile His Gln Leu Ala Lys Ile Ser Gly Arg Ala 305 310 315 320 Val Pro Glu Trp Leu Glu Arg Gln Arg Gly Gln Leu Gln Asp Ala Met 325 330 335 Ile Asp Cys His Met Trp Leu Gln Gly Gln Arg Met Ala Ile Ala Ala 340 345 350 Glu Gly Asp Leu Leu Ala Ala Trp Cys Asp Phe Ala Asn Ser Gln Gly 355 360 365 Met Gln Pro Gly Pro Leu Val Ala Pro Thr Gly His Pro Ser Leu Arg 370 375 380 Gln Leu Pro Val Glu Arg Val Val Pro Gly Asp Leu Glu Asp Leu Gln 385 390 395 400 Thr Leu Leu Cys Ala His Pro Ala Asp Leu Leu Val Ala Asn Ser His 405 410 415 Ala Arg Asp Leu Ala Glu Gln Phe Ala Leu Pro Leu Val Arg Ala Gly 420 425 430 Phe Pro Leu Phe Asp Lys Leu Gly Glu Phe Arg Arg Val Arg Gln Gly 435 440 445 Tyr Ser Gly Met Arg Asp Thr Leu Phe Glu Leu Ala Asn Leu Ile Arg 450 455 460 Glu Arg His His His Leu Ala His Tyr Arg Ser Pro Leu Arg Gln Asn 465 470 475 480 Pro Glu Ser Ser Leu Ser Thr Gly Gly Ala Tyr Ala Ala Ala Gly Asp 485 490 495 Tyr Lys Asp Asp Asp Asp Lys Pro Gly 500 505 <210> 34 <211> 217 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 34 Met Gly Leu Ser Leu Leu Arg Gln Ser Ile Arg Phe Phe Lys Pro Ala 1 5 10 15 Thr Arg Thr Leu Cys Ser Ser Arg Tyr Leu Leu Glu Gln Lys Pro Gly 20 25 30 Ala Pro Pro Pro Leu Asp Trp Leu Arg Arg Leu Trp Leu Leu Tyr His 35 40 45 Ala Gly Lys Gly Ser Phe Pro Leu Arg Met Gly Leu Ser Pro Arg Asp 50 55 60 Trp Gln Ala Leu Arg Arg Arg Leu Gly Glu Val Glu Thr Pro Leu Asp 65 70 75 80 Gly Glu Thr Leu Thr Arg Arg Arg Leu Met Ala Glu Leu Asn Ala Thr 85 90 95 Arg Glu Glu Glu Arg Gln Gln Leu Gly Ala Trp Leu Ala Gly Trp Met 100 105 110 Gln Gln Asp Ala Gly Pro Met Ala Gln Ile Ile Ala Glu Val Ser Leu 115 120 125 Ala Phe Asn His Leu Trp Gln Asp Leu Gly Leu Ala Ser Arg Ala Glu 130 135 140 Leu Arg Leu Leu Met Ser Asp Cys Phe Pro Gln Leu Val Val Met Asn 145 150 155 160 Glu His Asn Met Arg Trp Lys Lys Phe Phe Tyr Arg Gln Arg Cys Leu 165 170 175 Leu Gln Gln Gly Glu Val Ile Cys Arg Ser Pro Ser Cys Asp Glu Cys 180 185 190 Trp Glu Arg Ser Ala Cys Phe Glu Ala Gly Gly Gly Gly Gly Tyr Pro 195 200 205 Tyr Asp Val Pro Asp Tyr Ala Pro Gly 210 215 <210> 35 <211> 450 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 35 Met Gly Leu Ser Leu Leu Arg Gln Ser Ile Arg Phe Phe Lys Pro Ala 1 5 10 15 Thr Arg Thr Leu Cys Ser Ser Arg Tyr Leu Leu Glu Gln Lys Pro Gly 20 25 30 Ala Pro Lys Gln Val Tyr Leu Asp Asn Asn Ala Thr Thr Arg Leu Asp 35 40 45 Pro Met Val Leu Glu Ala Met Met Pro Phe Leu Thr Asp Phe Tyr Gly 50 55 60 Asn Pro Ser Ser Ile His Asp Phe Gly Ile Pro Ala Gln Ala Ala Leu 65 70 75 80 Glu Arg Ala His Gln Gln Ala Ala Ala Leu Leu Gly Ala Glu Tyr Pro 85 90 95 Ser Glu Ile Ile Phe Thr Ser Cys Ala Thr Glu Ala Thr Ala Thr Ala 100 105 110 Ile Ala Ser Ala Ile Ala Leu Leu Pro Glu Arg Arg Glu Ile Ile Thr 115 120 125 Ser Val Val Glu His Pro Ala Thr Leu Ala Ala Cys Glu His Met Glu 130 135 140 Arg Glu Gly Tyr Arg Ile His Arg Ile Ala Val Asp Gly Glu Gly Ala 145 150 155 160 Leu Asp Met Ala Gln Phe Arg Ala Ala Leu Ser Pro Arg Val Ala Leu 165 170 175 Val Ser Val Met Trp Ala Asn Asn Glu Thr Gly Val Leu Phe Pro Ile 180 185 190 Gly Glu Met Ala Glu Leu Ala His Glu Gln Gly Ala Leu Phe His Cys 195 200 205 Asp Ala Val Gln Val Val Gly Lys Ile Pro Ile Ala Val Gly Gln Thr 210 215 220 Arg Ile Asp Met Leu Ser Cys Ser Ala His Lys Phe His Gly Pro Lys 225 230 235 240 Gly Val Gly Cys Leu Tyr Leu Arg Arg Gly Thr Arg Phe Arg Pro Leu 245 250 255 Leu Arg Gly Gly His Gln Glu Tyr Gly Arg Arg Ala Gly Thr Glu Asn 260 265 270 Ile Cys Gly Ile Val Gly Met Gly Ala Ala Cys Glu Leu Ala Asn Ile 275 280 285 His Leu Pro Gly Met Thr His Ile Gly Gln Leu Arg Asn Arg Leu Glu 290 295 300 His Arg Leu Leu Ala Ser Val Pro Ser Val Met Val Met Gly Gly Gly 305 310 315 320 Gln Pro Ala Val Pro Gly Thr Val Asn Leu Ala Phe Glu Phe Ile Glu 325 330 335 Gly Glu Ala Ile Leu Leu Leu Leu Asn Gln Ala Gly Ile Ala Ala Ser 340 345 350 Ser Gly Ser Ala Cys Thr Ser Gly Ser Leu Glu Pro Ser His Val Met 355 360 365 Arg Ala Met Asn Ile Pro Tyr Thr Ala Ala His Gly Thr Ile Arg Phe 370 375 380 Ser Leu Ser Arg Tyr Thr Arg Glu Lys Glu Ile Asp Tyr Val Val Ala 385 390 395 400 Thr Leu Pro Pro Ile Ile Asp Arg Leu Arg Ala Leu Ser Pro Tyr Trp 405 410 415 Gln Asn Gly Lys Pro Arg Pro Ala Asp Ala Val Phe Thr Pro Val Tyr 420 425 430 Gly Ala Gly Gly Gly Gly Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 435 440 445 Pro Gly 450 <210> 36 <211> 319 <212> PRT <213> Artificial Sequence <220> <223> fusion polypeptide <400> 36 Met Gly Leu Ser Leu Leu Arg Gln Ser Ile Arg Phe Phe Lys Pro Ala 1 5 10 15 Thr Arg Thr Leu Cys Ser Ser Arg Tyr Leu Leu Glu Gln Lys Pro Gly 20 25 30 Ala Pro Trp Asn Tyr Ser Glu Lys Val Lys Asp His Phe Phe Asn Pro 35 40 45 Arg Asn Ala Arg Val Val Asp Asn Ala Asn Ala Val Gly Asp Val Gly 50 55 60 Ser Leu Ser Cys Gly Asp Ala Leu Arg Leu Met Leu Arg Val Asp Pro 65 70 75 80 Gln Ser Glu Ile Ile Glu Glu Ala Gly Phe Gln Thr Phe Gly Cys Gly 85 90 95 Ser Ala Ile Ala Ser Ser Ser Ala Leu Thr Glu Leu Ile Ile Gly His 100 105 110 Thr Leu Ala Glu Ala Gly Gln Ile Thr Asn Gln Gln Ile Ala Asp Tyr 115 120 125 Leu Asp Gly Leu Pro Pro Glu Lys Met His Cys Ser Val Met Gly Gln 130 135 140 Glu Ala Leu Arg Ala Ala Ile Ala Asn Phe Arg Gly Glu Ser Leu Glu 145 150 155 160 Glu Glu His Asp Glu Gly Lys Leu Ile Cys Lys Cys Phe Gly Val Asp 165 170 175 Glu Gly His Ile Arg Arg Ala Val Gln Asn Asn Gly Leu Thr Thr Leu 180 185 190 Ala Glu Val Ile Asn Tyr Thr Lys Ala Gly Gly Gly Cys Thr Ser Cys 195 200 205 His Glu Lys Ile Glu Leu Ala Leu Ala Glu Ile Leu Ala Gln Gln Pro 210 215 220 Gln Thr Thr Pro Ala Val Ala Ser Gly Lys Asp Pro His Trp Gln Ser 225 230 235 240 Val Val Asp Thr Ile Ala Glu Leu Arg Pro His Ile Gln Ala Asp Gly 245 250 255 Gly Asp Met Ala Leu Leu Ser Val Thr Asn His Gln Val Thr Val Ser 260 265 270 Leu Ser Gly Ser Cys Ser Gly Cys Met Met Thr Asp Met Thr Leu Ala 275 280 285 Trp Leu Gln Gln Lys Leu Met Glu Arg Thr Gly Cys Tyr Met Glu Val 290 295 300 Val Ala Ala Ala Gly Asp Tyr Lys Asp Asp Asp Asp Lys Pro Gly 305 310 315 <210> 37 <211> 201 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 37 Met Gly Leu Ser Leu Leu Arg Gln Ser Ile Arg Phe Phe Lys Pro Ala 1 5 10 15 Thr Arg Thr Leu Cys Ser Ser Arg Tyr Leu Leu Glu Gln Lys Pro Gly 20 25 30 Ala Pro Pro Pro Ile Asn Arg Gln Phe Asp Met Val His Ser Asp Glu 35 40 45 Trp Ser Met Lys Val Ala Phe Ala Ser Ser Asp Tyr Arg His Val Asp 50 55 60 Gln His Phe Gly Ala Thr Pro Arg Leu Val Val Tyr Gly Val Lys Ala 65 70 75 80 Asp Arg Val Thr Leu Ile Arg Val Val Asp Phe Ser Val Glu Asn Gly 85 90 95 His Gln Thr Glu Lys Ile Ala Arg Arg Ile His Ala Leu Glu Asp Cys 100 105 110 Val Thr Leu Phe Cys Val Ala Ile Gly Asp Ala Val Phe Arg Gln Leu 115 120 125 Leu Gln Val Gly Val Arg Ala Glu Arg Val Pro Ala Asp Thr Thr Ile 130 135 140 Val Gly Leu Leu Gln Glu Ile Gln Leu Tyr Trp Tyr Asp Lys Gly Gln 145 150 155 160 Arg Lys Asn Gln Arg Gln Arg Asp Pro Glu Arg Phe Thr Arg Leu Leu 165 170 175 Gln Glu Gln Glu Trp His Gly Asp Pro Asp Pro Arg Arg Ala Gly Asp 180 185 190 Tyr Lys Asp Asp Asp Asp Lys Pro Gly 195 200 <210> 38 <211> 80 <212> PRT <213> Artificial Sequence <220> <223> N-terminal extension <400> 38 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 <210> 39 <211> 80 <212> PRT <213> Artificial Sequence <220> <223> N-terminal extension <400> 39 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Ala Ala Ala Ala Ala 1 5 10 15 Ala Ala Ala Arg Pro Ile Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 20 25 30 Ala Glu Glu Gly Leu Leu Ala Ala Ala Ala Ala Ala Ala Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 <210> 40 <211> 267 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 40 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Met Ala Asn Ile Gly Ile Phe Phe Gly Thr Asp Thr Gly Lys Thr Arg 85 90 95 Lys Ile Ala Lys Met Ile His Lys Gln Leu Gly Glu Leu Ala Asp Ala 100 105 110 Pro Val Asn Ile Asn Arg Thr Thr Leu Asp Asp Phe Met Ala Tyr Pro 115 120 125 Val Leu Leu Leu Gly Thr Pro Thr Leu Gly Asp Gly Gln Leu Pro Gly 130 135 140 Leu Glu Ala Gly Cys Glu Ser Glu Ser Trp Ser Glu Phe Ile Ser Gly 145 150 155 160 Leu Asp Asp Ala Ser Leu Lys Gly Lys Thr Val Ala Leu Phe Gly Leu 165 170 175 Gly Asp Gln Arg Gly Tyr Pro Asp Asn Phe Val Ser Gly Met Arg Pro 180 185 190 Leu Phe Asp Ala Leu Ser Ala Arg Gly Ala Gln Met Ile Gly Ser Trp 195 200 205 Pro Asn Glu Gly Tyr Glu Phe Ser Ala Ser Ser Ala Leu Glu Gly Asp 210 215 220 Arg Phe Val Gly Leu Val Leu Asp Gln Asp Asn Gln Phe Asp Gln Thr 225 230 235 240 Glu Ala Arg Leu Ala Ser Trp Leu Glu Glu Ile Lys Arg Thr Val Leu 245 250 255 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Pro Gly 260 265 <210> 41 <211> 238 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 41 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Met Arg Pro Lys Phe Thr Phe Ser Glu Glu Val Arg Val Val Arg Ala 85 90 95 Ile Arg Asn Asp Gly Thr Val Ala Gly Phe Ala Pro Gly Ala Leu Leu 100 105 110 Val Arg Arg Gly Ser Thr Gly Phe Val Arg Asp Trp Gly Val Phe Leu 115 120 125 Gln Asp Gln Ile Ile Tyr Gln Ile His Phe Pro Glu Thr Asp Arg Ile 130 135 140 Ile Gly Cys Arg Glu Gln Glu Leu Ile Pro Ile Thr Gln Pro Trp Leu 145 150 155 160 Ala Gly Asn Leu Gln Tyr Arg Asp Ser Val Thr Cys Gln Met Ala Leu 165 170 175 Ala Val Asn Gly Asp Val Val Val Ser Ala Gly Gln Arg Gly Arg Val 180 185 190 Glu Ala Thr Asp Arg Gly Glu Leu Gly Asp Ser Tyr Thr Val Asp Phe 195 200 205 Ser Gly Arg Trp Phe Arg Val Pro Val Gln Ala Ile Ala Leu Ile Glu 210 215 220 Glu Arg Glu Glu Asp Tyr Lys Asp Asp Asp Asp Lys Pro Gly 225 230 235 <210> 42 <211> 389 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 42 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Thr Met Arg Gln Cys Ala Ile Tyr Gly Lys Gly Gly Ile Gly Lys Ser 85 90 95 Thr Thr Thr Gln Asn Leu Val Ala Ala Leu Ala Glu Met Gly Lys Lys 100 105 110 Val Met Ile Val Gly Cys Asp Pro Lys Ala Asp Ser Thr Arg Leu Ile 115 120 125 Leu His Ala Lys Ala Gln Asn Thr Ile Met Glu Met Ala Ala Glu Val 130 135 140 Gly Ser Val Glu Asp Leu Glu Leu Glu Asp Val Leu Gln Ile Gly Tyr 145 150 155 160 Gly Asp Val Arg Cys Ala Glu Ser Gly Gly Pro Glu Pro Gly Val Gly 165 170 175 Cys Ala Gly Arg Gly Val Ile Thr Ala Ile Asn Phe Leu Glu Glu Glu 180 185 190 Gly Ala Tyr Glu Asp Asp Leu Asp Phe Val Phe Tyr Asp Val Leu Gly 195 200 205 Asp Val Val Cys Gly Gly Phe Ala Met Pro Ile Arg Glu Asn Lys Ala 210 215 220 Gln Glu Ile Tyr Ile Val Cys Ser Gly Glu Met Met Ala Met Tyr Ala 225 230 235 240 Ala Asn Asn Ile Ser Lys Gly Ile Val Lys Tyr Ala Lys Ser Gly Lys 245 250 255 Val Arg Leu Gly Gly Leu Ile Cys Asn Ser Arg Gln Thr Asp Arg Glu 260 265 270 Asp Glu Leu Ile Ile Ala Leu Ala Glu Lys Leu Gly Thr Gln Met Ile 275 280 285 His Phe Val Pro Arg Asp Asn Ile Val Gln Arg Ala Glu Ile Arg Arg 290 295 300 Met Thr Val Ile Glu Tyr Asp Pro Ala Cys Lys Gln Ala Asn Glu Tyr 305 310 315 320 Arg Thr Leu Ala Gln Lys Ile Val Asn Asn Thr Met Lys Val Val Pro 325 330 335 Thr Pro Cys Thr Met Asp Glu Leu Glu Ser Leu Leu Met Glu Phe Gly 340 345 350 Ile Met Glu Glu Glu Asp Thr Ser Ile Ile Gly Lys Thr Ala Ala Glu 355 360 365 Glu Asn Ala Ala Ala Gly Gly Gly Gly Gly Tyr Pro Tyr Asp Val Pro 370 375 380 Asp Tyr Ala Pro Gly 385 <210> 43 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Tryptic peptide <400> 43 Ser Ile Ser Thr Gln Val Val Arg 1 5 <210> 44 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Tryptic peptide <400> 44 Ile Ser Thr Gln Val Val Arg 1 5 <210> 45 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Tryptic peptide <400> 45 Ala Val Gln Gly Ala Pro Thr Met Arg 1 5 <210> 46 <211> 564 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 46 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Thr Ser Cys Ser Ser Phe Ser Gly Gly Lys Ala Cys Arg Pro Ala Asp 85 90 95 Asp Ser Ala Leu Thr Pro Leu Val Ala Asp Lys Ala Ala Ala His Pro 100 105 110 Cys Tyr Ser Arg His Gly His His Arg Phe Ala Arg Met His Leu Pro 115 120 125 Val Ala Pro Ala Cys Asn Leu Gln Cys Asn Tyr Cys Asn Arg Lys Phe 130 135 140 Asp Cys Ser Asn Glu Ser Arg Pro Gly Val Ser Ser Thr Leu Leu Thr 145 150 155 160 Pro Glu Gln Ala Val Val Lys Val Arg Gln Val Ala Gln Ala Ile Pro 165 170 175 Gln Leu Ser Val Val Gly Ile Ala Gly Pro Gly Asp Pro Leu Ala Asn 180 185 190 Ile Ala Arg Thr Phe Arg Thr Leu Glu Leu Ile Arg Glu Gln Leu Pro 195 200 205 Asp Leu Lys Leu Cys Leu Ser Thr Asn Gly Leu Val Leu Pro Asp Ala 210 215 220 Val Asp Arg Leu Leu Asp Val Gly Val Asp His Val Thr Val Thr Ile 225 230 235 240 Asn Thr Leu Asp Ala Glu Ile Ala Ala Gln Ile Tyr Ala Trp Leu Trp 245 250 255 Leu Asp Gly Glu Arg Tyr Ser Gly Arg Glu Ala Gly Glu Ile Leu Ile 260 265 270 Ala Arg Gln Leu Glu Gly Val Arg Arg Leu Thr Ala Lys Gly Val Leu 275 280 285 Val Lys Ile Asn Ser Val Leu Ile Pro Gly Ile Asn Asp Ser Gly Met 290 295 300 Ala Gly Val Ser Arg Ala Leu Arg Ala Ser Gly Ala Phe Ile His Asn 305 310 315 320 Ile Met Pro Leu Ile Ala Arg Pro Glu His Gly Thr Val Phe Gly Leu 325 330 335 Asn Gly Gln Pro Glu Pro Asp Ala Glu Thr Leu Ala Ala Thr Arg Ser 340 345 350 Arg Cys Gly Glu Val Met Pro Gln Met Thr His Cys His Gln Cys Arg 355 360 365 Ala Asp Ala Ile Gly Met Leu Gly Glu Asp Arg Ser Gln Gln Phe Thr 370 375 380 Gln Leu Pro Ala Pro Glu Ser Leu Pro Ala Trp Leu Pro Ile Leu His 385 390 395 400 Gln Arg Ala Gln Leu His Ala Ser Ile Ala Thr Arg Gly Glu Ser Glu 405 410 415 Ala Asp Asp Ala Cys Leu Val Ala Val Ala Ser Ser Arg Gly Asp Val 420 425 430 Ile Asp Cys His Phe Gly His Ala Asp Arg Phe Tyr Ile Tyr Ser Leu 435 440 445 Ser Ala Ala Gly Met Val Leu Val Asn Glu Arg Phe Thr Pro Lys Tyr 450 455 460 Cys Gln Gly Arg Asp Asp Cys Glu Pro Gln Asp Asn Ala Ala Arg Phe 465 470 475 480 Ala Ala Ile Leu Glu Leu Leu Ala Asp Val Lys Ala Val Phe Cys Val 485 490 495 Arg Ile Gly His Thr Pro Trp Gln Gln Leu Glu Gln Glu Gly Ile Glu 500 505 510 Pro Cys Val Asp Gly Ala Trp Arg Pro Val Ser Glu Val Leu Pro Ala 515 520 525 Trp Trp Gln Gln Arg Arg Gly Ser Trp Pro Ala Ala Leu Pro His Lys 530 535 540 Gly Val Ala Ala Gly Gly Gly Gly Gly Tyr Pro Tyr Asp Val Pro Asp 545 550 555 560 Tyr Ala Pro Gly <210> 47 <211> 573 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 47 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Thr Asn Ala Thr Gly Glu Arg Asn Leu Ala Leu Ile Gln Glu Val Leu 85 90 95 Glu Val Phe Pro Glu Thr Ala Arg Lys Glu Arg Arg Lys His Met Met 100 105 110 Val Ser Asp Pro Lys Met Lys Ser Val Gly Lys Cys Ile Ile Ser Asn 115 120 125 Arg Lys Ser Gln Pro Gly Val Met Thr Val Arg Gly Cys Ala Tyr Ala 130 135 140 Gly Ser Lys Gly Val Val Phe Gly Pro Ile Lys Asp Met Ala His Ile 145 150 155 160 Ser His Gly Pro Ala Gly Cys Gly Gln Tyr Ser Arg Ala Glu Arg Arg 165 170 175 Asn Tyr Tyr Thr Gly Val Ser Gly Val Asp Ser Phe Gly Thr Leu Asn 180 185 190 Phe Thr Ser Asp Phe Gln Glu Arg Asp Ile Val Phe Gly Gly Asp Lys 195 200 205 Lys Leu Ser Lys Leu Ile Glu Glu Met Glu Leu Leu Phe Pro Leu Thr 210 215 220 Lys Gly Ile Thr Ile Gln Ser Glu Cys Pro Val Gly Leu Ile Gly Asp 225 230 235 240 Asp Ile Ser Ala Val Ala Asn Ala Ser Ser Lys Ala Leu Asp Lys Pro 245 250 255 Val Ile Pro Val Arg Cys Glu Gly Phe Arg Gly Val Ser Gln Ser Leu 260 265 270 Gly His His Ile Ala Asn Asp Val Val Arg Asp Trp Ile Leu Asn Asn 275 280 285 Arg Glu Gly Gln Pro Phe Glu Thr Thr Pro Tyr Asp Val Ala Ile Ile 290 295 300 Gly Asp Tyr Asn Ile Gly Gly Asp Ala Trp Ala Ser Arg Ile Leu Leu 305 310 315 320 Glu Glu Met Gly Leu Arg Val Val Ala Gln Trp Ser Gly Asp Gly Thr 325 330 335 Leu Val Glu Met Glu Asn Thr Pro Phe Val Lys Leu Asn Leu Val His 340 345 350 Cys Tyr Arg Ser Met Asn Tyr Ile Ala Arg His Met Glu Glu Lys His 355 360 365 Gln Ile Pro Trp Met Glu Tyr Asn Phe Phe Gly Pro Thr Lys Ile Ala 370 375 380 Glu Ser Leu Arg Lys Ile Ala Asp Gln Phe Asp Asp Thr Ile Arg Ala 385 390 395 400 Asn Ala Glu Ala Val Ile Ala Arg Tyr Glu Gly Gln Met Ala Ala Ile 405 410 415 Ile Ala Lys Tyr Arg Pro Arg Leu Glu Gly Arg Lys Val Leu Leu Tyr 420 425 430 Ile Gly Gly Leu Arg Pro Arg His Val Ile Gly Ala Tyr Glu Asp Leu 435 440 445 Gly Met Glu Ile Ile Ala Ala Gly Tyr Glu Phe Ala His Asn Asp Asp 450 455 460 Tyr Asp Arg Thr Leu Pro Asp Leu Lys Glu Gly Thr Leu Leu Phe Asp 465 470 475 480 Asp Ala Ser Ser Tyr Glu Leu Glu Ala Phe Val Lys Ala Leu Lys Pro 485 490 495 Asp Leu Ile Gly Ser Gly Ile Lys Glu Lys Tyr Ile Phe Gln Lys Met 500 505 510 Gly Val Pro Phe Arg Gln Met His Ser Trp Asp Tyr Ser Gly Pro Tyr 515 520 525 His Gly Tyr Asp Gly Phe Ala Ile Phe Ala Arg Asp Met Asp Met Thr 530 535 540 Leu Asn Asn Pro Ala Trp Asn Glu Leu Thr Ala Pro Trp Leu Lys Ser 545 550 555 560 Ala Ala Gly Asp Tyr Lys Asp Asp Asp Asp Lys Pro Gly 565 570 <210> 48 <211> 553 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 48 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Lys Gly Asn Glu Ile Leu Ala Leu Leu Asp Glu Pro Ala Cys Glu His 85 90 95 Asn His Lys Gln Lys Ser Gly Cys Ser Ala Pro Lys Pro Gly Ala Thr 100 105 110 Ala Ala Gly Cys Ala Phe Asp Gly Ala Gln Ile Thr Leu Leu Pro Ile 115 120 125 Ala Asp Val Ala His Leu Val His Gly Pro Ile Gly Cys Ala Gly Ser 130 135 140 Ser Trp Asp Asn Arg Gly Ser Ala Ser Ser Gly Pro Thr Leu Asn Arg 145 150 155 160 Leu Gly Phe Thr Thr Asp Leu Asn Glu Gln Asp Val Ile Met Gly Arg 165 170 175 Gly Glu Arg Arg Leu Phe His Ala Val Arg His Ile Val Thr Arg Tyr 180 185 190 His Pro Ala Ala Val Phe Ile Tyr Asn Thr Cys Val Pro Ala Met Glu 195 200 205 Gly Asp Asp Leu Glu Ala Val Cys Gln Ala Ala Gln Thr Ala Thr Gly 210 215 220 Val Pro Val Ile Ala Ile Asp Ala Ala Gly Phe Tyr Gly Ser Lys Asn 225 230 235 240 Leu Gly Asn Arg Pro Ala Gly Asp Val Met Val Lys Arg Val Ile Gly 245 250 255 Gln Arg Glu Pro Ala Pro Trp Pro Glu Ser Thr Leu Phe Ala Pro Glu 260 265 270 Gln Arg His Asp Ile Gly Leu Ile Gly Glu Phe Asn Ile Ala Gly Glu 275 280 285 Phe Trp His Ile Gln Pro Leu Leu Asp Glu Leu Gly Ile Arg Val Leu 290 295 300 Gly Ser Leu Ser Gly Asp Gly Arg Phe Ala Glu Ile Gln Thr Met His 305 310 315 320 Arg Ala Gln Ala Asn Met Leu Val Cys Ser Arg Ala Leu Ile Asn Val 325 330 335 Ala Arg Ala Leu Glu Gln Arg Tyr Gly Thr Pro Trp Phe Glu Gly Ser 340 345 350 Phe Tyr Gly Ile Arg Ala Thr Ser Asp Ala Leu Arg Gln Leu Ala Ala 355 360 365 Leu Leu Gly Asp Asp Asp Leu Arg Gln Arg Thr Glu Ala Leu Ile Ala 370 375 380 Arg Glu Glu Gln Ala Ala Glu Leu Ala Leu Gln Pro Trp Arg Glu Gln 385 390 395 400 Leu Arg Gly Arg Lys Ala Leu Leu Tyr Thr Gly Gly Val Lys Ser Trp 405 410 415 Ser Val Val Ser Ala Leu Gln Asp Leu Gly Met Thr Val Val Ala Thr 420 425 430 Gly Thr Arg Lys Ser Thr Glu Glu Asp Lys Gln Arg Ile Arg Glu Leu 435 440 445 Met Gly Glu Glu Ala Val Met Leu Glu Glu Gly Asn Ala Arg Thr Leu 450 455 460 Leu Asp Val Val Tyr Arg Tyr Gln Ala Asp Leu Met Ile Ala Gly Gly 465 470 475 480 Arg Asn Met Tyr Thr Ala Tyr Lys Ala Arg Leu Pro Phe Leu Asp Ile 485 490 495 Asn Gln Glu Arg Glu His Ala Phe Ala Gly Tyr Gln Gly Ile Val Thr 500 505 510 Leu Ala Arg Gln Leu Cys Gln Thr Ile Asn Ser Pro Ile Trp Pro Gln 515 520 525 Thr His Ser Arg Ala Pro Trp Arg Ala Gly Gly Gly Gly Gly Tyr Pro 530 535 540 Tyr Asp Val Pro Asp Tyr Ala Pro Gly 545 550 <210> 49 <211> 1261 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 49 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Met Ser Gly Lys Met Lys Thr Met Asp Gly Asn Ala Ala Ala Ala Trp 85 90 95 Ile Ser Tyr Ala Phe Thr Glu Val Ala Ala Ile Tyr Pro Ile Thr Pro 100 105 110 Ser Thr Pro Met Ala Glu Asn Val Asp Glu Trp Ala Ala Gln Gly Lys 115 120 125 Lys Asn Leu Phe Gly Gln Pro Val Arg Leu Met Glu Met Gln Ser Glu 130 135 140 Ala Gly Ala Ala Gly Ala Val His Gly Ala Leu Gln Ala Gly Ala Leu 145 150 155 160 Thr Thr Thr Tyr Thr Ala Ser Gln Gly Leu Leu Leu Met Ile Pro Asn 165 170 175 Met Tyr Lys Ile Ala Gly Glu Leu Leu Pro Gly Val Phe His Val Ser 180 185 190 Ala Arg Ala Leu Ala Thr Asn Ser Leu Asn Ile Phe Gly Asp His Gln 195 200 205 Asp Val Met Ala Val Arg Gln Thr Gly Cys Ala Met Leu Ala Glu Asn 210 215 220 Asn Val Gln Gln Val Met Asp Leu Ser Ala Val Ala His Leu Ala Ala 225 230 235 240 Ile Lys Gly Arg Ile Pro Phe Val Asn Phe Phe Asp Gly Phe Arg Thr 245 250 255 Ser His Glu Ile Gln Lys Ile Glu Val Leu Glu Tyr Glu Gln Leu Ala 260 265 270 Thr Leu Leu Asp Arg Pro Ala Leu Asp Ser Phe Arg Arg Asn Ala Leu 275 280 285 His Pro Asp His Pro Val Ile Arg Gly Thr Ala Gln Asn Pro Asp Ile 290 295 300 Tyr Phe Gln Glu Arg Glu Ala Gly Asn Arg Phe Tyr Gln Ala Leu Pro 305 310 315 320 Asp Ile Val Glu Ser Tyr Met Thr Gln Ile Ser Ala Leu Thr Gly Arg 325 330 335 Glu Tyr His Leu Phe Asn Tyr Thr Gly Ala Ala Asp Ala Glu Arg Val 340 345 350 Ile Ile Ala Met Gly Ser Val Cys Asp Thr Val Gln Glu Val Val Asp 355 360 365 Thr Leu Asn Ala Ala Gly Glu Lys Val Gly Leu Leu Ser Val His Leu 370 375 380 Phe Arg Pro Phe Ser Leu Ala His Phe Phe Ala Gln Leu Pro Lys Thr 385 390 395 400 Val Gln Arg Ile Ala Val Leu Asp Arg Thr Lys Glu Pro Gly Ala Gln 405 410 415 Ala Glu Pro Leu Cys Leu Asp Val Lys Asn Ala Phe Tyr His His Asp 420 425 430 Asp Ala Pro Leu Ile Val Gly Gly Arg Tyr Ala Leu Gly Gly Lys Asp 435 440 445 Val Leu Pro Asn Asp Ile Ala Ala Val Phe Asp Asn Leu Asn Lys Pro 450 455 460 Leu Pro Met Asp Gly Phe Thr Leu Gly Ile Val Asp Asp Val Thr Phe 465 470 475 480 Thr Ser Leu Pro Pro Arg Gln Gln Thr Leu Ala Val Ser His Asp Gly 485 490 495 Ile Thr Ala Cys Lys Phe Trp Gly Met Gly Ser Asp Gly Thr Val Gly 500 505 510 Ala Asn Lys Ser Ala Ile Lys Ile Ile Gly Asp Lys Thr Pro Leu Tyr 515 520 525 Ala Gln Ala Tyr Phe Ser Tyr Asp Ser Lys Lys Ser Gly Gly Ile Thr 530 535 540 Val Ser His Leu Arg Phe Gly Asp Arg Pro Ile Asn Ser Pro Tyr Leu 545 550 555 560 Ile His Arg Ala Asp Phe Ile Ser Cys Ser Gln Gln Ser Tyr Val Glu 565 570 575 Arg Tyr Asp Leu Leu Asp Gly Leu Lys Pro Gly Gly Thr Phe Leu Leu 580 585 590 Asn Cys Ser Trp Ser Asp Ala Glu Leu Glu Gln His Leu Pro Val Gly 595 600 605 Phe Lys Arg Tyr Leu Ala Arg Glu Asn Ile His Phe Tyr Thr Leu Asn 610 615 620 Ala Val Asp Ile Ala Arg Glu Leu Gly Leu Gly Gly Arg Phe Asn Met 625 630 635 640 Leu Met Gln Ala Ala Phe Phe Lys Leu Ala Ala Ile Ile Asp Pro Gln 645 650 655 Thr Ala Ala Asp Tyr Leu Lys Gln Ala Val Glu Lys Ser Tyr Gly Ser 660 665 670 Lys Gly Ala Ala Val Ile Glu Met Asn Gln Arg Ala Ile Glu Leu Gly 675 680 685 Met Ala Ser Leu His Gln Val Thr Ile Pro Ala His Trp Ala Thr Leu 690 695 700 Asp Glu Pro Ala Ala Gln Ala Ser Ala Met Met Pro Asp Phe Ile Arg 705 710 715 720 Asp Ile Leu Gln Pro Met Asn Arg Gln Cys Gly Asp Gln Leu Pro Val 725 730 735 Ser Ala Phe Val Gly Met Glu Asp Gly Thr Phe Pro Ser Gly Thr Ala 740 745 750 Ala Trp Glu Lys Arg Gly Ile Ala Leu Glu Val Pro Val Trp Gln Pro 755 760 765 Glu Gly Cys Thr Gln Cys Asn Gln Cys Ala Phe Ile Cys Pro His Ala 770 775 780 Ala Ile Arg Pro Ala Leu Leu Asn Gly Glu Glu His Asp Ala Ala Pro 785 790 795 800 Val Gly Leu Leu Ser Lys Pro Ala Gln Gly Ala Lys Glu Tyr His Tyr 805 810 815 His Leu Ala Ile Ser Pro Leu Asp Cys Ser Gly Cys Gly Asn Cys Val 820 825 830 Asp Ile Cys Pro Ala Arg Gly Lys Ala Leu Lys Met Gln Ser Leu Asp 835 840 845 Ser Gln Arg Gln Met Ala Pro Val Trp Asp Tyr Ala Leu Ala Leu Thr 850 855 860 Pro Lys Ser Asn Pro Phe Arg Lys Thr Thr Val Lys Gly Ser Gln Phe 865 870 875 880 Glu Thr Pro Leu Leu Glu Phe Ser Gly Ala Cys Ala Gly Cys Gly Glu 885 890 895 Thr Pro Tyr Ala Arg Leu Ile Thr Gln Leu Phe Gly Asp Arg Met Leu 900 905 910 Ile Ala Asn Ala Thr Gly Cys Ser Ser Ile Trp Gly Ala Ser Ala Pro 915 920 925 Ser Ile Pro Tyr Thr Thr Asn His Arg Gly His Gly Pro Ala Trp Ala 930 935 940 Asn Ser Leu Phe Glu Asp Asn Ala Glu Phe Gly Leu Gly Met Met Leu 945 950 955 960 Gly Gly Gln Ala Val Arg Gln Gln Ile Ala Asp Asp Met Thr Ala Ala 965 970 975 Leu Ala Leu Pro Val Ser Asp Glu Leu Ser Asp Ala Met Arg Gln Trp 980 985 990 Leu Ala Lys Gln Asp Glu Gly Glu Gly Thr Arg Glu Arg Ala Asp Arg 995 1000 1005 Leu Ser Glu Arg Leu Ala Ala Glu Lys Glu Gly Val Pro Leu Leu 1010 1015 1020 Glu Gln Leu Trp Gln Asn Arg Asp Tyr Phe Val Arg Arg Ser Gln 1025 1030 1035 Trp Ile Phe Gly Gly Asp Gly Trp Ala Tyr Asp Ile Gly Phe Gly 1040 1045 1050 Gly Leu Asp His Val Leu Ala Ser Gly Glu Asp Val Asn Ile Leu 1055 1060 1065 Val Phe Asp Thr Glu Val Tyr Ser Asn Thr Gly Gly Gln Ser Ser 1070 1075 1080 Lys Ser Thr Pro Val Ala Ala Ile Ala Lys Phe Ala Ala Gln Gly 1085 1090 1095 Lys Arg Thr Arg Lys Lys Asp Leu Gly Met Met Ala Met Ser Tyr 1100 1105 1110 Gly Asn Val Tyr Val Ala Gln Val Ala Met Gly Ala Asp Lys Asp 1115 1120 1125 Gln Thr Leu Arg Ala Ile Ala Glu Ala Glu Ala Trp Pro Gly Pro 1130 1135 1140 Ser Leu Val Ile Ala Tyr Ala Ala Cys Ile Asn His Gly Leu Lys 1145 1150 1155 Ala Gly Met Arg Cys Ser Gln Arg Glu Ala Lys Arg Ala Val Glu 1160 1165 1170 Ala Gly Tyr Trp His Leu Trp Arg Tyr His Pro Gln Arg Glu Ala 1175 1180 1185 Glu Gly Lys Thr Pro Phe Met Leu Asp Ser Glu Glu Pro Glu Glu 1190 1195 1200 Ser Phe Arg Asp Phe Leu Leu Gly Glu Val Arg Tyr Ala Ser Leu 1205 1210 1215 His Lys Thr Thr Pro His Leu Ala Asp Ala Leu Phe Ser Arg Thr 1220 1225 1230 Glu Glu Asp Ala Arg Ala Arg Phe Ala Gln Tyr Arg Arg Leu Ala 1235 1240 1245 Gly Glu Glu Asp Tyr Lys Asp Asp Asp Asp Lys Pro Gly 1250 1255 1260 <210> 50 <211> 616 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 50 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Ser Gln Thr Ile Asp Lys Ile Asn Ser Cys Tyr Pro Leu Phe Glu Gln 85 90 95 Asp Glu Tyr Gln Glu Leu Phe Arg Asn Lys Arg Gln Leu Glu Glu Ala 100 105 110 His Asp Ala Gln Arg Val Gln Glu Val Phe Ala Trp Thr Thr Thr Ala 115 120 125 Glu Tyr Glu Ala Leu Asn Phe Arg Arg Glu Ala Leu Thr Val Asp Pro 130 135 140 Ala Lys Ala Cys Gln Pro Leu Gly Ala Val Leu Cys Ser Leu Gly Phe 145 150 155 160 Ala Asn Thr Leu Pro Tyr Val His Gly Ser Gln Gly Cys Val Ala Tyr 165 170 175 Phe Arg Thr Tyr Phe Asn Arg His Phe Lys Glu Pro Ile Ala Cys Val 180 185 190 Ser Asp Ser Met Thr Glu Asp Ala Ala Val Phe Gly Gly Asn Asn Asn 195 200 205 Met Asn Leu Gly Leu Gln Asn Ala Ser Ala Leu Tyr Lys Pro Glu Ile 210 215 220 Ile Ala Val Ser Thr Thr Cys Met Ala Glu Val Ile Gly Asp Asp Leu 225 230 235 240 Gln Ala Phe Ile Ala Asn Ala Lys Lys Asp Gly Phe Val Asp Ser Ser 245 250 255 Ile Ala Val Pro His Ala His Thr Pro Ser Phe Ile Gly Ser His Val 260 265 270 Thr Gly Trp Asp Asn Met Phe Glu Gly Phe Ala Lys Thr Phe Thr Ala 275 280 285 Asp Tyr Gln Gly Gln Pro Gly Lys Leu Pro Lys Leu Asn Leu Val Thr 290 295 300 Gly Phe Glu Thr Tyr Leu Gly Asn Phe Arg Val Leu Lys Arg Met Met 305 310 315 320 Glu Gln Met Ala Val Pro Cys Ser Leu Leu Ser Asp Pro Ser Glu Val 325 330 335 Leu Asp Thr Pro Ala Asp Gly His Tyr Arg Met Tyr Ser Gly Gly Thr 340 345 350 Thr Gln Gln Glu Met Lys Glu Ala Pro Asp Ala Ile Asp Thr Leu Leu 355 360 365 Leu Gln Pro Trp Gln Leu Leu Lys Ser Lys Lys Val Val Gln Glu Met 370 375 380 Trp Asn Gln Pro Ala Thr Glu Val Ala Ile Pro Leu Gly Leu Ala Ala 385 390 395 400 Thr Asp Glu Leu Leu Met Thr Val Ser Gln Leu Ser Gly Lys Pro Ile 405 410 415 Ala Asp Ala Leu Thr Leu Glu Arg Gly Arg Leu Val Asp Met Met Leu 420 425 430 Asp Ser His Thr Trp Leu His Gly Lys Lys Phe Gly Leu Tyr Gly Asp 435 440 445 Pro Asp Phe Val Met Gly Leu Thr Arg Phe Leu Leu Glu Leu Gly Cys 450 455 460 Glu Pro Thr Val Ile Leu Ser His Asn Ala Asn Lys Arg Trp Gln Lys 465 470 475 480 Ala Met Asn Lys Met Leu Asp Ala Ser Pro Tyr Gly Arg Asp Ser Glu 485 490 495 Val Phe Ile Asn Cys Asp Leu Trp His Phe Arg Ser Leu Met Phe Thr 500 505 510 Arg Gln Pro Asp Phe Met Ile Gly Asn Ser Tyr Gly Lys Phe Ile Gln 515 520 525 Arg Asp Thr Leu Ala Lys Gly Lys Ala Phe Glu Val Pro Leu Ile Arg 530 535 540 Leu Gly Phe Pro Leu Phe Asp Arg His His Leu His Arg Gln Thr Thr 545 550 555 560 Trp Gly Tyr Glu Gly Ala Met Asn Ile Val Thr Thr Leu Val Asn Ala 565 570 575 Val Leu Glu Lys Leu Asp Ser Asp Thr Ser Gln Leu Gly Lys Thr Asp 580 585 590 Tyr Ser Phe Asp Leu Val Arg Ala Gly Gly Gly Gly Gly Tyr Pro Tyr 595 600 605 Asp Val Pro Asp Tyr Ala Pro Gly 610 615 <210> 51 <211> 357 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 51 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Met Asn Pro Trp Gln Arg Phe Ala Arg Gln Arg Leu Ala Arg Ser Arg 85 90 95 Trp Asn Arg Asp Pro Ala Ala Leu Asp Pro Ala Asp Thr Pro Ala Phe 100 105 110 Glu Gln Ala Trp Gln Arg Gln Cys His Met Glu Gln Thr Ile Val Ala 115 120 125 Arg Val Pro Glu Gly Asp Ile Pro Ala Ala Leu Leu Glu Asn Ile Ala 130 135 140 Ala Ser Leu Ala Ile Trp Leu Asp Glu Gly Asp Phe Ala Pro Pro Glu 145 150 155 160 Arg Ala Ala Ile Val Arg His His Ala Arg Leu Glu Leu Ala Phe Ala 165 170 175 Asp Ile Ala Arg Gln Ala Pro Gln Pro Asp Leu Ser Thr Val Gln Ala 180 185 190 Trp Tyr Leu Arg His Gln Thr Gln Phe Met Arg Pro Glu Gln Arg Leu 195 200 205 Thr Arg His Leu Leu Leu Thr Val Asp Asn Asp Arg Glu Ala Val His 210 215 220 Gln Arg Ile Leu Gly Leu Tyr Arg Gln Ile Asn Ala Ser Arg Asp Ala 225 230 235 240 Phe Ala Pro Leu Ala Gln Arg His Ser His Cys Pro Ser Ala Leu Glu 245 250 255 Glu Gly Arg Leu Gly Trp Ile Ser Arg Gly Leu Leu Tyr Pro Gln Leu 260 265 270 Glu Thr Ala Leu Phe Ser Leu Ala Glu Asn Ala Leu Ser Leu Pro Ile 275 280 285 Ala Ser Glu Leu Gly Trp His Leu Leu Trp Cys Glu Ala Ile Arg Pro 290 295 300 Ala Ala Pro Met Glu Pro Gln Gln Ala Leu Glu Ser Ala Arg Asp Tyr 305 310 315 320 Leu Trp Gln Gln Ser Gln Gln Arg His Gln Arg Gln Trp Leu Glu Gln 325 330 335 Met Ile Ser Arg Gln Pro Gly Leu Cys Gly Tyr Pro Tyr Asp Val Pro 340 345 350 Asp Tyr Ala Pro Gly 355 <210> 52 <211> 551 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 52 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Ala Asp Ile Phe Arg Thr Asp Lys Pro Leu Ala Val Ser Pro Ile Lys 85 90 95 Thr Gly Gln Pro Leu Gly Ala Ile Leu Ala Ser Leu Gly Ile Glu His 100 105 110 Ser Ile Pro Leu Val His Gly Ala Gln Gly Cys Ser Ala Phe Ala Lys 115 120 125 Val Phe Phe Ile Gln His Phe His Asp Pro Val Pro Leu Gln Ser Thr 130 135 140 Ala Met Asp Pro Thr Ser Thr Ile Met Gly Ala Asp Gly Asn Ile Phe 145 150 155 160 Thr Ala Leu Asp Thr Leu Cys Gln Arg Asn Asn Pro Gln Ala Ile Val 165 170 175 Leu Leu Ser Thr Gly Leu Ser Glu Ala Gln Gly Ser Asp Ile Ser Arg 180 185 190 Val Val Arg Gln Phe Arg Glu Glu Tyr Pro Arg His Lys Gly Val Ala 195 200 205 Ile Leu Thr Val Asn Thr Pro Asp Phe Tyr Gly Ser Met Glu Asn Gly 210 215 220 Phe Ser Ala Val Leu Glu Ser Val Ile Glu Gln Trp Val Pro Pro Ala 225 230 235 240 Pro Arg Pro Ala Gln Arg Asn Arg Arg Val Asn Leu Leu Val Ser His 245 250 255 Leu Cys Ser Pro Gly Asp Ile Glu Trp Leu Arg Arg Cys Val Glu Ala 260 265 270 Phe Gly Leu Gln Pro Ile Ile Leu Pro Asp Leu Ala Gln Ser Met Asp 275 280 285 Gly His Leu Ala Gln Gly Asp Phe Ser Pro Leu Thr Gln Gly Gly Thr 290 295 300 Pro Leu Arg Gln Ile Glu Gln Met Gly Gln Ser Leu Cys Ser Phe Ala 305 310 315 320 Ile Gly Val Ser Leu His Arg Ala Ser Ser Leu Leu Ala Pro Arg Cys 325 330 335 Arg Gly Glu Val Ile Ala Leu Pro His Leu Met Thr Leu Glu Arg Cys 340 345 350 Asp Ala Phe Ile His Gln Leu Ala Lys Ile Ser Gly Arg Ala Val Pro 355 360 365 Glu Trp Leu Glu Arg Gln Arg Gly Gln Leu Gln Asp Ala Met Ile Asp 370 375 380 Cys His Met Trp Leu Gln Gly Gln Arg Met Ala Ile Ala Ala Glu Gly 385 390 395 400 Asp Leu Leu Ala Ala Trp Cys Asp Phe Ala Asn Ser Gln Gly Met Gln 405 410 415 Pro Gly Pro Leu Val Ala Pro Thr Gly His Pro Ser Leu Arg Gln Leu 420 425 430 Pro Val Glu Arg Val Val Pro Gly Asp Leu Glu Asp Leu Gln Thr Leu 435 440 445 Leu Cys Ala His Pro Ala Asp Leu Leu Val Ala Asn Ser His Ala Arg 450 455 460 Asp Leu Ala Glu Gln Phe Ala Leu Pro Leu Val Arg Ala Gly Phe Pro 465 470 475 480 Leu Phe Asp Lys Leu Gly Glu Phe Arg Arg Val Arg Gln Gly Tyr Ser 485 490 495 Gly Met Arg Asp Thr Leu Phe Glu Leu Ala Asn Leu Ile Arg Glu Arg 500 505 510 His His His Leu Ala His Tyr Arg Ser Pro Leu Arg Gln Asn Pro Glu 515 520 525 Ser Ser Leu Ser Thr Gly Gly Ala Tyr Ala Ala Ala Gly Asp Tyr Lys 530 535 540 Asp Asp Asp Asp Lys Pro Gly 545 550 <210> 53 <211> 263 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 53 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Pro Pro Leu Asp Trp Leu Arg Arg Leu Trp Leu Leu Tyr His Ala Gly 85 90 95 Lys Gly Ser Phe Pro Leu Arg Met Gly Leu Ser Pro Arg Asp Trp Gln 100 105 110 Ala Leu Arg Arg Arg Leu Gly Glu Val Glu Thr Pro Leu Asp Gly Glu 115 120 125 Thr Leu Thr Arg Arg Arg Leu Met Ala Glu Leu Asn Ala Thr Arg Glu 130 135 140 Glu Glu Arg Gln Gln Leu Gly Ala Trp Leu Ala Gly Trp Met Gln Gln 145 150 155 160 Asp Ala Gly Pro Met Ala Gln Ile Ile Ala Glu Val Ser Leu Ala Phe 165 170 175 Asn His Leu Trp Gln Asp Leu Gly Leu Ala Ser Arg Ala Glu Leu Arg 180 185 190 Leu Leu Met Ser Asp Cys Phe Pro Gln Leu Val Val Met Asn Glu His 195 200 205 Asn Met Arg Trp Lys Lys Phe Phe Tyr Arg Gln Arg Cys Leu Leu Gln 210 215 220 Gln Gly Glu Val Ile Cys Arg Ser Pro Ser Cys Asp Glu Cys Trp Glu 225 230 235 240 Arg Ser Ala Cys Phe Glu Ala Gly Gly Gly Gly Gly Tyr Pro Tyr Asp 245 250 255 Val Pro Asp Tyr Ala Pro Gly 260 <210> 54 <211> 496 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 54 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Lys Gln Val Tyr Leu Asp Asn Asn Ala Thr Thr Arg Leu Asp Pro Met 85 90 95 Val Leu Glu Ala Met Met Pro Phe Leu Thr Asp Phe Tyr Gly Asn Pro 100 105 110 Ser Ser Ile His Asp Phe Gly Ile Pro Ala Gln Ala Ala Leu Glu Arg 115 120 125 Ala His Gln Gln Ala Ala Ala Leu Leu Gly Ala Glu Tyr Pro Ser Glu 130 135 140 Ile Ile Phe Thr Ser Cys Ala Thr Glu Ala Thr Ala Thr Ala Ile Ala 145 150 155 160 Ser Ala Ile Ala Leu Leu Pro Glu Arg Arg Glu Ile Ile Thr Ser Val 165 170 175 Val Glu His Pro Ala Thr Leu Ala Ala Cys Glu His Met Glu Arg Glu 180 185 190 Gly Tyr Arg Ile His Arg Ile Ala Val Asp Gly Glu Gly Ala Leu Asp 195 200 205 Met Ala Gln Phe Arg Ala Ala Leu Ser Pro Arg Val Ala Leu Val Ser 210 215 220 Val Met Trp Ala Asn Asn Glu Thr Gly Val Leu Phe Pro Ile Gly Glu 225 230 235 240 Met Ala Glu Leu Ala His Glu Gln Gly Ala Leu Phe His Cys Asp Ala 245 250 255 Val Gln Val Val Gly Lys Ile Pro Ile Ala Val Gly Gln Thr Arg Ile 260 265 270 Asp Met Leu Ser Cys Ser Ala His Lys Phe His Gly Pro Lys Gly Val 275 280 285 Gly Cys Leu Tyr Leu Arg Arg Gly Thr Arg Phe Arg Pro Leu Leu Arg 290 295 300 Gly Gly His Gln Glu Tyr Gly Arg Arg Ala Gly Thr Glu Asn Ile Cys 305 310 315 320 Gly Ile Val Gly Met Gly Ala Ala Cys Glu Leu Ala Asn Ile His Leu 325 330 335 Pro Gly Met Thr His Ile Gly Gln Leu Arg Asn Arg Leu Glu His Arg 340 345 350 Leu Leu Ala Ser Val Pro Ser Val Met Val Met Gly Gly Gly Gln Pro 355 360 365 Ala Val Pro Gly Thr Val Asn Leu Ala Phe Glu Phe Ile Glu Gly Glu 370 375 380 Ala Ile Leu Leu Leu Leu Asn Gln Ala Gly Ile Ala Ala Ser Ser Gly 385 390 395 400 Ser Ala Cys Thr Ser Gly Ser Leu Glu Pro Ser His Val Met Arg Ala 405 410 415 Met Asn Ile Pro Tyr Thr Ala Ala His Gly Thr Ile Arg Phe Ser Leu 420 425 430 Ser Arg Tyr Thr Arg Glu Lys Glu Ile Asp Tyr Val Val Ala Thr Leu 435 440 445 Pro Pro Ile Ile Asp Arg Leu Arg Ala Leu Ser Pro Tyr Trp Gln Asn 450 455 460 Gly Lys Pro Arg Pro Ala Asp Ala Val Phe Thr Pro Val Tyr Gly Ala 465 470 475 480 Gly Gly Gly Gly Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Pro Gly 485 490 495 <210> 55 <211> 365 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 55 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Trp Asn Tyr Ser Glu Lys Val Lys Asp His Phe Phe Asn Pro Arg Asn 85 90 95 Ala Arg Val Val Asp Asn Ala Asn Ala Val Gly Asp Val Gly Ser Leu 100 105 110 Ser Cys Gly Asp Ala Leu Arg Leu Met Leu Arg Val Asp Pro Gln Ser 115 120 125 Glu Ile Ile Glu Glu Ala Gly Phe Gln Thr Phe Gly Cys Gly Ser Ala 130 135 140 Ile Ala Ser Ser Ser Ala Leu Thr Glu Leu Ile Ile Gly His Thr Leu 145 150 155 160 Ala Glu Ala Gly Gln Ile Thr Asn Gln Gln Ile Ala Asp Tyr Leu Asp 165 170 175 Gly Leu Pro Pro Glu Lys Met His Cys Ser Val Met Gly Gln Glu Ala 180 185 190 Leu Arg Ala Ala Ile Ala Asn Phe Arg Gly Glu Ser Leu Glu Glu Glu 195 200 205 His Asp Glu Gly Lys Leu Ile Cys Lys Cys Phe Gly Val Asp Glu Gly 210 215 220 His Ile Arg Arg Ala Val Gln Asn Asn Gly Leu Thr Thr Leu Ala Glu 225 230 235 240 Val Ile Asn Tyr Thr Lys Ala Gly Gly Gly Cys Thr Ser Cys His Glu 245 250 255 Lys Ile Glu Leu Ala Leu Ala Glu Ile Leu Ala Gln Gln Pro Gln Thr 260 265 270 Thr Pro Ala Val Ala Ser Gly Lys Asp Pro His Trp Gln Ser Val Val 275 280 285 Asp Thr Ile Ala Glu Leu Arg Pro His Ile Gln Ala Asp Gly Gly Asp 290 295 300 Met Ala Leu Leu Ser Val Thr Asn His Gln Val Thr Val Ser Leu Ser 305 310 315 320 Gly Ser Cys Ser Gly Cys Met Met Thr Asp Met Thr Leu Ala Trp Leu 325 330 335 Gln Gln Lys Leu Met Glu Arg Thr Gly Cys Tyr Met Glu Val Val Ala 340 345 350 Ala Ala Gly Asp Tyr Lys Asp Asp Asp Asp Lys Pro Gly 355 360 365 <210> 56 <211> 471 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 56 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Met Glu Arg Val Leu Ile Asn Asp Thr Thr Leu Arg Asp Gly Glu Gln 85 90 95 Ser Pro Gly Val Ala Phe Arg Thr Ser Glu Lys Val Ala Ile Ala Glu 100 105 110 Ala Leu Tyr Ala Ala Gly Ile Thr Ala Met Glu Val Gly Thr Pro Ala 115 120 125 Met Gly Asp Glu Glu Ile Ala Arg Ile Gln Leu Val Arg Arg Gln Leu 130 135 140 Pro Asp Ala Thr Leu Met Thr Trp Cys Arg Met Asn Ala Leu Glu Ile 145 150 155 160 Arg Gln Ser Ala Asp Leu Gly Ile Asp Trp Val Asp Ile Ser Ile Pro 165 170 175 Ala Ser Asp Lys Leu Arg Gln Tyr Lys Leu Arg Glu Pro Leu Ala Val 180 185 190 Leu Leu Glu Arg Leu Ala Met Phe Ile His Leu Ala His Thr Leu Gly 195 200 205 Leu Lys Val Cys Ile Gly Cys Glu Asp Ala Ser Arg Ala Ser Gly Gln 210 215 220 Thr Leu Arg Ala Ile Ala Glu Val Ala Gln Asn Ala Pro Ala Ala Arg 225 230 235 240 Leu Arg Tyr Ala Asp Thr Val Gly Leu Leu Asp Pro Phe Thr Thr Ala 245 250 255 Ala Gln Ile Ser Ala Leu Arg Asp Val Trp Ser Gly Glu Ile Glu Met 260 265 270 His Ala His Asn Asp Leu Gly Met Ala Thr Ala Asn Thr Leu Ala Ala 275 280 285 Val Ser Ala Gly Ala Thr Ser Val Asn Thr Thr Val Leu Gly Leu Gly 290 295 300 Glu Arg Ala Gly Asn Ala Ala Ala Trp Lys Pro Ser Ala Leu Gly Leu 305 310 315 320 Glu Arg Cys Leu Gly Val Glu Thr Gly Val His Phe Ser Ala Leu Pro 325 330 335 Ala Leu Cys Gln Arg Val Ala Glu Ala Ala Gln Arg Ala Ile Asp Pro 340 345 350 Gln Gln Pro Leu Val Gly Glu Leu Val Phe Thr His Glu Ser Gly Val 355 360 365 His Val Ala Ala Leu Leu Arg Asp Ser Glu Ser Tyr Gln Ser Ile Ala 370 375 380 Pro Ser Leu Met Gly Arg Ser Tyr Arg Leu Val Leu Gly Lys His Ser 385 390 395 400 Gly Arg Gln Ala Val Asn Gly Val Phe Asp Gln Met Gly Tyr His Leu 405 410 415 Asn Ala Ala Gln Ile Asn Gln Leu Leu Pro Ala Ile Arg Arg Phe Ala 420 425 430 Glu Asn Trp Lys Arg Ser Pro Lys Asp Tyr Glu Leu Val Ala Ile Tyr 435 440 445 Asp Glu Leu Cys Gly Glu Ser Ala Leu Arg Ala Arg Gly Asp Tyr Lys 450 455 460 Asp Asp Asp Asp Lys Pro Gly 465 470 <210> 57 <211> 247 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 57 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Pro Pro Ile Asn Arg Gln Phe Asp Met Val His Ser Asp Glu Trp Ser 85 90 95 Met Lys Val Ala Phe Ala Ser Ser Asp Tyr Arg His Val Asp Gln His 100 105 110 Phe Gly Ala Thr Pro Arg Leu Val Val Tyr Gly Val Lys Ala Asp Arg 115 120 125 Val Thr Leu Ile Arg Val Val Asp Phe Ser Val Glu Asn Gly His Gln 130 135 140 Thr Glu Lys Ile Ala Arg Arg Ile His Ala Leu Glu Asp Cys Val Thr 145 150 155 160 Leu Phe Cys Val Ala Ile Gly Asp Ala Val Phe Arg Gln Leu Leu Gln 165 170 175 Val Gly Val Arg Ala Glu Arg Val Pro Ala Asp Thr Thr Ile Val Gly 180 185 190 Leu Leu Gln Glu Ile Gln Leu Tyr Trp Tyr Asp Lys Gly Gln Arg Lys 195 200 205 Asn Gln Arg Gln Arg Asp Pro Glu Arg Phe Thr Arg Leu Leu Gln Glu 210 215 220 Gln Glu Trp His Gly Asp Pro Asp Pro Arg Arg Ala Gly Asp Tyr Lys 225 230 235 240 Asp Asp Asp Asp Lys Pro Gly 245 <210> 58 <211> 316 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 58 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Ser Asp Asn Asp Thr Leu Phe Trp Arg Met Leu Ala Leu Phe Gln Ser 85 90 95 Leu Pro Asp Leu Gln Pro Ala Gln Ile Val Asp Trp Leu Ala Gln Glu 100 105 110 Ser Gly Glu Thr Leu Thr Pro Glu Arg Leu Ala Thr Leu Thr Gln Pro 115 120 125 Gln Leu Ala Ala Ser Phe Pro Ser Ala Thr Ala Val Met Ser Pro Ala 130 135 140 Arg Trp Ser Arg Val Met Ala Ser Leu Gln Gly Ala Leu Pro Ala His 145 150 155 160 Leu Arg Ile Val Arg Pro Ala Gln Arg Thr Pro Gln Leu Leu Ala Ala 165 170 175 Phe Cys Ser Gln Asp Gly Leu Val Ile Asn Gly His Phe Gly Gln Gly 180 185 190 Arg Leu Phe Phe Ile Tyr Ala Phe Asp Glu Gln Gly Gly Trp Leu Tyr 195 200 205 Asp Leu Arg Arg Tyr Pro Ser Ala Pro His Gln Gln Glu Ala Asn Glu 210 215 220 Val Arg Ala Arg Leu Ile Glu Asp Cys Gln Leu Leu Phe Cys Gln Glu 225 230 235 240 Ile Gly Gly Pro Ala Ala Ala Arg Pro Ile Arg His Arg Ile His Pro 245 250 255 Met Lys Ala Gln Pro Gly Thr Thr Ile Gln Ala Gln Cys Glu Ala Ile 260 265 270 Asn Thr Leu Leu Ala Gly Arg Leu Pro Pro Trp Leu Ala Lys Arg Leu 275 280 285 Asn Arg Asp Asn Pro Leu Glu Glu Arg Val Phe Ala Gly Gly Gly Gly 290 295 300 Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Pro Gly 305 310 315 <210> 59 <211> 574 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 59 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Thr Asn Ala Thr Gly Glu Arg Asn Leu Ala Leu Ile Gln Glu Val Leu 85 90 95 Glu Val Phe Pro Glu Thr Ala Arg Lys Glu Arg Arg Lys His Met Met 100 105 110 Val Ser Asp Pro Lys Met Lys Ser Val Gly Lys Cys Ile Ile Ser Asn 115 120 125 Arg Lys Ser Gln Pro Gly Val Met Thr Val Arg Gly Cys Ala Tyr Ala 130 135 140 Gly Ser Lys Gly Val Val Phe Gly Pro Ile Lys Asp Met Ala His Ile 145 150 155 160 Ser His Gly Pro Ala Gly Cys Gly Gln Tyr Ser Arg Ala Glu Arg Arg 165 170 175 Asn Tyr Tyr Thr Gly Val Ser Gly Val Asp Ser Phe Gly Thr Leu Asn 180 185 190 Phe Thr Ser Asp Phe Gln Glu Arg Asp Ile Val Phe Gly Gly Asp Lys 195 200 205 Lys Leu Ser Lys Leu Ile Glu Glu Met Glu Leu Leu Phe Pro Leu Thr 210 215 220 Lys Gly Ile Thr Ile Gln Ser Glu Cys Pro Val Gly Leu Ile Gly Asp 225 230 235 240 Asp Ile Ser Ala Val Ala Asn Ala Ser Ser Lys Ala Leu Asp Lys Pro 245 250 255 Val Ile Pro Val Arg Cys Glu Gly Phe Arg Gly Val Ser Gln Ser Leu 260 265 270 Gly His His Ile Ala Asn Asp Val Val Arg Asp Trp Ile Leu Asn Asn 275 280 285 Arg Glu Gly Gln Pro Phe Glu Thr Thr Pro Tyr Asp Val Ala Ile Ile 290 295 300 Gly Asp Tyr Asn Ile Gly Gly Asp Ala Trp Ala Ser Arg Ile Leu Leu 305 310 315 320 Glu Glu Met Gly Leu Arg Val Val Ala Gln Trp Ser Gly Asp Gly Thr 325 330 335 Leu Val Glu Met Glu Asn Thr Pro Phe Val Lys Leu Asn Leu Val His 340 345 350 Cys Tyr Arg Ser Met Asn Tyr Ile Ala Arg His Met Glu Glu Lys His 355 360 365 Gln Ile Pro Trp Met Glu Tyr Asn Phe Phe Gly Pro Thr Lys Ile Ala 370 375 380 Glu Ser Leu Arg Lys Ile Ala Asp Gln Phe Asp Asp Thr Ile Arg Ala 385 390 395 400 Asn Ala Glu Ala Val Ile Ala Arg Tyr Glu Gly Gln Met Ala Ala Ile 405 410 415 Ile Ala Lys Tyr Arg Pro Arg Leu Glu Gly Arg Lys Val Leu Leu Tyr 420 425 430 Ile Gly Gly Leu Arg Pro Arg His Val Ile Gly Ala Tyr Glu Asp Leu 435 440 445 Gly Met Glu Ile Ile Ala Ala Gly Tyr Glu Phe Ala His Asn Asp Asp 450 455 460 Tyr Asp Arg Thr Leu Pro Asp Leu Lys Glu Gly Thr Leu Leu Phe Asp 465 470 475 480 Asp Ala Ser Ser Tyr Glu Leu Glu Ala Phe Val Lys Ala Leu Lys Pro 485 490 495 Asp Leu Ile Gly Ser Gly Ile Lys Glu Lys Tyr Ile Phe Gln Lys Met 500 505 510 Gly Val Pro Phe Arg Gln Met His Ser Trp Asp Tyr Ser Gly Pro Tyr 515 520 525 His Gly Tyr Asp Gly Phe Ala Ile Phe Ala Arg Asp Met Asp Met Thr 530 535 540 Leu Asn Asn Pro Ala Trp Asn Glu Leu Thr Ala Pro Trp Leu Lys Ser 545 550 555 560 Ala Ala Gly Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Pro Gly 565 570 <210> 60 <211> 599 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 60 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Ser Gln Thr Ile Asp Lys Ile Asn Ser Cys Tyr Pro Leu Phe Glu Gln 85 90 95 Asp Glu Tyr Gln Glu Leu Phe Arg Asn Lys Arg Gln Leu Glu Glu Ala 100 105 110 His Asp Ala Gln Arg Val Gln Glu Val Phe Ala Trp Thr Thr Thr Ala 115 120 125 Glu Tyr Glu Ala Leu Asn Phe Arg Arg Glu Ala Leu Thr Val Asp Pro 130 135 140 Ala Lys Ala Cys Gln Pro Leu Gly Ala Val Leu Cys Ser Leu Gly Phe 145 150 155 160 Ala Asn Thr Leu Pro Tyr Val His Gly Ser Gln Gly Cys Val Ala Tyr 165 170 175 Phe Arg Thr Tyr Phe Asn Arg His Phe Lys Glu Pro Ile Ala Cys Val 180 185 190 Ser Asp Ser Met Thr Glu Asp Ala Ala Val Phe Gly Gly Asn Asn Asn 195 200 205 Met Asn Leu Gly Leu Gln Asn Ala Ser Ala Leu Tyr Lys Pro Glu Ile 210 215 220 Ile Ala Val Ser Thr Thr Cys Met Ala Glu Val Ile Gly Asp Asp Leu 225 230 235 240 Gln Ala Phe Ile Ala Asn Ala Lys Lys Asp Gly Phe Val Asp Ser Ser 245 250 255 Ile Ala Val Pro His Ala His Thr Pro Ser Phe Ile Gly Ser His Val 260 265 270 Thr Gly Trp Asp Asn Met Phe Glu Gly Phe Ala Lys Thr Phe Thr Ala 275 280 285 Asp Tyr Gln Gly Gln Pro Gly Lys Leu Pro Lys Leu Asn Leu Val Thr 290 295 300 Gly Phe Glu Thr Tyr Leu Gly Asn Phe Arg Val Leu Lys Arg Met Met 305 310 315 320 Glu Gln Met Ala Val Pro Cys Ser Leu Leu Ser Asp Pro Ser Glu Val 325 330 335 Leu Asp Thr Pro Ala Asp Gly His Tyr Arg Met Tyr Ser Gly Gly Thr 340 345 350 Thr Gln Gln Glu Met Lys Glu Ala Pro Asp Ala Ile Asp Thr Leu Leu 355 360 365 Leu Gln Pro Trp Gln Leu Leu Lys Ser Lys Lys Val Val Gln Glu Met 370 375 380 Trp Asn Gln Pro Ala Thr Glu Val Ala Ile Pro Leu Gly Leu Ala Ala 385 390 395 400 Thr Asp Glu Leu Leu Met Thr Val Ser Gln Leu Ser Gly Lys Pro Ile 405 410 415 Ala Asp Ala Leu Thr Leu Glu Arg Gly Arg Leu Val Asp Met Met Leu 420 425 430 Asp Ser His Thr Trp Leu His Gly Lys Lys Phe Gly Leu Tyr Gly Asp 435 440 445 Pro Asp Phe Val Met Gly Leu Thr Arg Phe Leu Leu Glu Leu Gly Cys 450 455 460 Glu Pro Thr Val Ile Leu Ser His Asn Ala Asn Lys Arg Trp Gln Lys 465 470 475 480 Ala Met Asn Lys Met Leu Asp Ala Ser Pro Tyr Gly Arg Asp Ser Glu 485 490 495 Val Phe Ile Asn Cys Asp Leu Trp His Phe Arg Ser Leu Met Phe Thr 500 505 510 Arg Gln Pro Asp Phe Met Ile Gly Asn Ser Tyr Gly Lys Phe Ile Gln 515 520 525 Arg Asp Thr Leu Ala Lys Gly Lys Ala Phe Glu Val Pro Leu Ile Arg 530 535 540 Leu Gly Phe Pro Leu Phe Asp Arg His His Leu His Arg Gln Thr Thr 545 550 555 560 Trp Gly Tyr Glu Gly Ala Met Asn Ile Val Thr Thr Leu Val Asn Ala 565 570 575 Val Leu Glu Lys Leu Asp Ser Asp Thr Ser Gln Leu Gly Lys Thr Asp 580 585 590 Tyr Ser Phe Asp Leu Val Arg 595 <210> 61 <211> 11 <212> PRT <213> Hypocrea jecorina <400> 61 Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Arg 1 5 10 <210> 62 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> FLAG epitope <400> 62 Asp Tyr Lys Asp Asp Asp Asp Lys 1 5 <210> 63 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 63 Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Ala Asp Tyr Lys Asp Asp 1 5 10 15 Asp Asp Lys Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Ala 20 25 30 <210> 64 <211> 1110 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 64 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Thr Asn Ala Thr Gly Glu Arg Asn Leu Ala Leu Ile Gln Glu Val Leu 85 90 95 Glu Val Phe Pro Glu Thr Ala Arg Lys Glu Arg Arg Lys His Met Met 100 105 110 Val Ser Asp Pro Lys Met Lys Ser Val Gly Lys Cys Ile Ile Ser Asn 115 120 125 Arg Lys Ser Gln Pro Gly Val Met Thr Val Arg Gly Cys Ala Tyr Ala 130 135 140 Gly Ser Lys Gly Val Val Phe Gly Pro Ile Lys Asp Met Ala His Ile 145 150 155 160 Ser His Gly Pro Ala Gly Cys Gly Gln Tyr Ser Arg Ala Glu Arg Arg 165 170 175 Asn Tyr Tyr Thr Gly Val Ser Gly Val Asp Ser Phe Gly Thr Leu Asn 180 185 190 Phe Thr Ser Asp Phe Gln Glu Arg Asp Ile Val Phe Gly Gly Asp Lys 195 200 205 Lys Leu Ser Lys Leu Ile Glu Glu Met Glu Leu Leu Phe Pro Leu Thr 210 215 220 Lys Gly Ile Thr Ile Gln Ser Glu Cys Pro Val Gly Leu Ile Gly Asp 225 230 235 240 Asp Ile Ser Ala Val Ala Asn Ala Ser Ser Lys Ala Leu Asp Lys Pro 245 250 255 Val Ile Pro Val Arg Cys Glu Gly Phe Arg Gly Val Ser Gln Ser Leu 260 265 270 Gly His His Ile Ala Asn Asp Val Val Arg Asp Trp Ile Leu Asn Asn 275 280 285 Arg Glu Gly Gln Pro Phe Glu Thr Thr Pro Tyr Asp Val Ala Ile Ile 290 295 300 Gly Asp Tyr Asn Ile Gly Gly Asp Ala Trp Ala Ser Arg Ile Leu Leu 305 310 315 320 Glu Glu Met Gly Leu Arg Val Val Ala Gln Trp Ser Gly Asp Gly Thr 325 330 335 Leu Val Glu Met Glu Asn Thr Pro Phe Val Lys Leu Asn Leu Val His 340 345 350 Cys Tyr Arg Ser Met Asn Tyr Ile Ala Arg His Met Glu Glu Lys His 355 360 365 Gln Ile Pro Trp Met Glu Tyr Asn Phe Phe Gly Pro Thr Lys Ile Ala 370 375 380 Glu Ser Leu Arg Lys Ile Ala Asp Gln Phe Asp Asp Thr Ile Arg Ala 385 390 395 400 Asn Ala Glu Ala Val Ile Ala Arg Tyr Glu Gly Gln Met Ala Ala Ile 405 410 415 Ile Ala Lys Tyr Arg Pro Arg Leu Glu Gly Arg Lys Val Leu Leu Tyr 420 425 430 Ile Gly Gly Leu Arg Pro Arg His Val Ile Gly Ala Tyr Glu Asp Leu 435 440 445 Gly Met Glu Ile Ile Ala Ala Gly Tyr Glu Phe Ala His Asn Asp Asp 450 455 460 Tyr Asp Arg Thr Leu Pro Asp Leu Lys Glu Gly Thr Leu Leu Phe Asp 465 470 475 480 Asp Ala Ser Ser Tyr Glu Leu Glu Ala Phe Val Lys Ala Leu Lys Pro 485 490 495 Asp Leu Ile Gly Ser Gly Ile Lys Glu Lys Tyr Ile Phe Gln Lys Met 500 505 510 Gly Val Pro Phe Arg Gln Met His Ser Trp Asp Tyr Ser Gly Pro Tyr 515 520 525 His Gly Tyr Asp Gly Phe Ala Ile Phe Ala Arg Asp Met Asp Met Thr 530 535 540 Leu Asn Asn Pro Ala Trp Asn Glu Leu Thr Ala Pro Trp Leu Lys Ser 545 550 555 560 Ala Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Ala Asp Tyr Lys Asp 565 570 575 Asp Asp Asp Lys Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Ala Ser 580 585 590 Gln Thr Ile Asp Lys Ile Asn Ser Cys Tyr Pro Leu Phe Glu Gln Asp 595 600 605 Glu Tyr Gln Glu Leu Phe Arg Asn Lys Arg Gln Leu Glu Glu Ala His 610 615 620 Asp Ala Gln Arg Val Gln Glu Val Phe Ala Trp Thr Thr Thr Ala Glu 625 630 635 640 Tyr Glu Ala Leu Asn Phe Arg Arg Glu Ala Leu Thr Val Asp Pro Ala 645 650 655 Lys Ala Cys Gln Pro Leu Gly Ala Val Leu Cys Ser Leu Gly Phe Ala 660 665 670 Asn Thr Leu Pro Tyr Val His Gly Ser Gln Gly Cys Val Ala Tyr Phe 675 680 685 Arg Thr Tyr Phe Asn Arg His Phe Lys Glu Pro Ile Ala Cys Val Ser 690 695 700 Asp Ser Met Thr Glu Asp Ala Ala Val Phe Gly Gly Asn Asn Asn Met 705 710 715 720 Asn Leu Gly Leu Gln Asn Ala Ser Ala Leu Tyr Lys Pro Glu Ile Ile 725 730 735 Ala Val Ser Thr Thr Cys Met Ala Glu Val Ile Gly Asp Asp Leu Gln 740 745 750 Ala Phe Ile Ala Asn Ala Lys Lys Asp Gly Phe Val Asp Ser Ser Ile 755 760 765 Ala Val Pro His Ala His Thr Pro Ser Phe Ile Gly Ser His Val Thr 770 775 780 Gly Trp Asp Asn Met Phe Glu Gly Phe Ala Lys Thr Phe Thr Ala Asp 785 790 795 800 Tyr Gln Gly Gln Pro Gly Lys Leu Pro Lys Leu Asn Leu Val Thr Gly 805 810 815 Phe Glu Thr Tyr Leu Gly Asn Phe Arg Val Leu Lys Arg Met Met Glu 820 825 830 Gln Met Ala Val Pro Cys Ser Leu Leu Ser Asp Pro Ser Glu Val Leu 835 840 845 Asp Thr Pro Ala Asp Gly His Tyr Arg Met Tyr Ser Gly Gly Thr Thr 850 855 860 Gln Gln Glu Met Lys Glu Ala Pro Asp Ala Ile Asp Thr Leu Leu Leu 865 870 875 880 Gln Pro Trp Gln Leu Leu Lys Ser Lys Lys Val Val Gln Glu Met Trp 885 890 895 Asn Gln Pro Ala Thr Glu Val Ala Ile Pro Leu Gly Leu Ala Ala Thr 900 905 910 Asp Glu Leu Leu Met Thr Val Ser Gln Leu Ser Gly Lys Pro Ile Ala 915 920 925 Asp Ala Leu Thr Leu Glu Arg Gly Arg Leu Val Asp Met Met Leu Asp 930 935 940 Ser His Thr Trp Leu His Gly Lys Lys Phe Gly Leu Tyr Gly Asp Pro 945 950 955 960 Asp Phe Val Met Gly Leu Thr Arg Phe Leu Leu Glu Leu Gly Cys Glu 965 970 975 Pro Thr Val Ile Leu Ser His Asn Ala Asn Lys Arg Trp Gln Lys Ala 980 985 990 Met Asn Lys Met Leu Asp Ala Ser Pro Tyr Gly Arg Asp Ser Glu Val 995 1000 1005 Phe Ile Asn Cys Asp Leu Trp His Phe Arg Ser Leu Met Phe Thr 1010 1015 1020 Arg Gln Pro Asp Phe Met Ile Gly Asn Ser Tyr Gly Lys Phe Ile 1025 1030 1035 Gln Arg Asp Thr Leu Ala Lys Gly Lys Ala Phe Glu Val Pro Leu 1040 1045 1050 Ile Arg Leu Gly Phe Pro Leu Phe Asp Arg His His Leu His Arg 1055 1060 1065 Gln Thr Thr Trp Gly Tyr Glu Gly Ala Met Asn Ile Val Thr Thr 1070 1075 1080 Leu Val Asn Ala Val Leu Glu Lys Leu Asp Ser Asp Thr Ser Gln 1085 1090 1095 Leu Gly Lys Thr Asp Tyr Ser Phe Asp Leu Val Arg 1100 1105 1110 <210> 65 <211> 1119 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 65 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Thr Asn Ala Thr Gly Glu Arg Asn Leu Ala Leu Ile Gln Glu Val Leu 85 90 95 Glu Val Phe Pro Glu Thr Ala Arg Lys Glu Arg Arg Lys His Met Met 100 105 110 Val Ser Asp Pro Lys Met Lys Ser Val Gly Lys Cys Ile Ile Ser Asn 115 120 125 Arg Lys Ser Gln Pro Gly Val Met Thr Val Arg Gly Cys Ala Tyr Ala 130 135 140 Gly Ser Lys Gly Val Val Phe Gly Pro Ile Lys Asp Met Ala His Ile 145 150 155 160 Ser His Gly Pro Ala Gly Cys Gly Gln Tyr Ser Arg Ala Glu Arg Arg 165 170 175 Asn Tyr Tyr Thr Gly Val Ser Gly Val Asp Ser Phe Gly Thr Leu Asn 180 185 190 Phe Thr Ser Asp Phe Gln Glu Arg Asp Ile Val Phe Gly Gly Asp Lys 195 200 205 Lys Leu Ser Lys Leu Ile Glu Glu Met Glu Leu Leu Phe Pro Leu Thr 210 215 220 Lys Gly Ile Thr Ile Gln Ser Glu Cys Pro Val Gly Leu Ile Gly Asp 225 230 235 240 Asp Ile Ser Ala Val Ala Asn Ala Ser Ser Lys Ala Leu Asp Lys Pro 245 250 255 Val Ile Pro Val Arg Cys Glu Gly Phe Arg Gly Val Ser Gln Ser Leu 260 265 270 Gly His His Ile Ala Asn Asp Val Val Arg Asp Trp Ile Leu Asn Asn 275 280 285 Arg Glu Gly Gln Pro Phe Glu Thr Thr Pro Tyr Asp Val Ala Ile Ile 290 295 300 Gly Asp Tyr Asn Ile Gly Gly Asp Ala Trp Ala Ser Arg Ile Leu Leu 305 310 315 320 Glu Glu Met Gly Leu Arg Val Val Ala Gln Trp Ser Gly Asp Gly Thr 325 330 335 Leu Val Glu Met Glu Asn Thr Pro Phe Val Lys Leu Asn Leu Val His 340 345 350 Cys Tyr Arg Ser Met Asn Tyr Ile Ala Arg His Met Glu Glu Lys His 355 360 365 Gln Ile Pro Trp Met Glu Tyr Asn Phe Phe Gly Pro Thr Lys Ile Ala 370 375 380 Glu Ser Leu Arg Lys Ile Ala Asp Gln Phe Asp Asp Thr Ile Arg Ala 385 390 395 400 Asn Ala Glu Ala Val Ile Ala Arg Tyr Glu Gly Gln Met Ala Ala Ile 405 410 415 Ile Ala Lys Tyr Arg Pro Arg Leu Glu Gly Arg Lys Val Leu Leu Tyr 420 425 430 Ile Gly Gly Leu Arg Pro Arg His Val Ile Gly Ala Tyr Glu Asp Leu 435 440 445 Gly Met Glu Ile Ile Ala Ala Gly Tyr Glu Phe Ala His Asn Asp Asp 450 455 460 Tyr Asp Arg Thr Leu Pro Asp Leu Lys Glu Gly Thr Leu Leu Phe Asp 465 470 475 480 Asp Ala Ser Ser Tyr Glu Leu Glu Ala Phe Val Lys Ala Leu Lys Pro 485 490 495 Asp Leu Ile Gly Ser Gly Ile Lys Glu Lys Tyr Ile Phe Gln Lys Met 500 505 510 Gly Val Pro Phe Arg Gln Met His Ser Trp Asp Tyr Ser Gly Pro Tyr 515 520 525 His Gly Tyr Asp Gly Phe Ala Ile Phe Ala Arg Asp Met Asp Met Thr 530 535 540 Leu Asn Asn Pro Ala Trp Asn Glu Leu Thr Ala Pro Trp Leu Lys Ser 545 550 555 560 Ala Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Ala Asp Tyr Lys Asp 565 570 575 Asp Asp Asp Lys Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Ala Ser 580 585 590 Gln Thr Ile Asp Lys Ile Asn Ser Cys Tyr Pro Leu Phe Glu Gln Asp 595 600 605 Glu Tyr Gln Glu Leu Phe Arg Asn Lys Arg Gln Leu Glu Glu Ala His 610 615 620 Asp Ala Gln Arg Val Gln Glu Val Phe Ala Trp Thr Thr Thr Ala Glu 625 630 635 640 Tyr Glu Ala Leu Asn Phe Arg Arg Glu Ala Leu Thr Val Asp Pro Ala 645 650 655 Lys Ala Cys Gln Pro Leu Gly Ala Val Leu Cys Ser Leu Gly Phe Ala 660 665 670 Asn Thr Leu Pro Tyr Val His Gly Ser Gln Gly Cys Val Ala Tyr Phe 675 680 685 Arg Thr Tyr Phe Asn Arg His Phe Lys Glu Pro Ile Ala Cys Val Ser 690 695 700 Asp Ser Met Thr Glu Asp Ala Ala Val Phe Gly Gly Asn Asn Asn Met 705 710 715 720 Asn Leu Gly Leu Gln Asn Ala Ser Ala Leu Tyr Lys Pro Glu Ile Ile 725 730 735 Ala Val Ser Thr Thr Cys Met Ala Glu Val Ile Gly Asp Asp Leu Gln 740 745 750 Ala Phe Ile Ala Asn Ala Lys Lys Asp Gly Phe Val Asp Ser Ser Ile 755 760 765 Ala Val Pro His Ala His Thr Pro Ser Phe Ile Gly Ser His Val Thr 770 775 780 Gly Trp Asp Asn Met Phe Glu Gly Phe Ala Lys Thr Phe Thr Ala Asp 785 790 795 800 Tyr Gln Gly Gln Pro Gly Lys Leu Pro Lys Leu Asn Leu Val Thr Gly 805 810 815 Phe Glu Thr Tyr Leu Gly Asn Phe Arg Val Leu Lys Arg Met Met Glu 820 825 830 Gln Met Ala Val Pro Cys Ser Leu Leu Ser Asp Pro Ser Glu Val Leu 835 840 845 Asp Thr Pro Ala Asp Gly His Tyr Arg Met Tyr Ser Gly Gly Thr Thr 850 855 860 Gln Gln Glu Met Lys Glu Ala Pro Asp Ala Ile Asp Thr Leu Leu Leu 865 870 875 880 Gln Pro Trp Gln Leu Leu Lys Ser Lys Lys Val Val Gln Glu Met Trp 885 890 895 Asn Gln Pro Ala Thr Glu Val Ala Ile Pro Leu Gly Leu Ala Ala Thr 900 905 910 Asp Glu Leu Leu Met Thr Val Ser Gln Leu Ser Gly Lys Pro Ile Ala 915 920 925 Asp Ala Leu Thr Leu Glu Arg Gly Arg Leu Val Asp Met Met Leu Asp 930 935 940 Ser His Thr Trp Leu His Gly Lys Lys Phe Gly Leu Tyr Gly Asp Pro 945 950 955 960 Asp Phe Val Met Gly Leu Thr Arg Phe Leu Leu Glu Leu Gly Cys Glu 965 970 975 Pro Thr Val Ile Leu Ser His Asn Ala Asn Lys Arg Trp Gln Lys Ala 980 985 990 Met Asn Lys Met Leu Asp Ala Ser Pro Tyr Gly Arg Asp Ser Glu Val 995 1000 1005 Phe Ile Asn Cys Asp Leu Trp His Phe Arg Ser Leu Met Phe Thr 1010 1015 1020 Arg Gln Pro Asp Phe Met Ile Gly Asn Ser Tyr Gly Lys Phe Ile 1025 1030 1035 Gln Arg Asp Thr Leu Ala Lys Gly Lys Ala Phe Glu Val Pro Leu 1040 1045 1050 Ile Arg Leu Gly Phe Pro Leu Phe Asp Arg His His Leu His Arg 1055 1060 1065 Gln Thr Thr Trp Gly Tyr Glu Gly Ala Met Asn Ile Val Thr Thr 1070 1075 1080 Leu Val Asn Ala Val Leu Glu Lys Leu Asp Ser Asp Thr Ser Gln 1085 1090 1095 Leu Gly Lys Thr Asp Tyr Ser Phe Asp Leu Val Arg Tyr Pro Tyr 1100 1105 1110 Asp Val Pro Asp Tyr Ala 1115 <210> 66 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> C-terminal extension <400> 66 Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 1 5 10 <210> 67 <211> 356 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 67 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Met Lys Ser Val Lys Asn Ile Gln Lys Ile Thr Lys Ala 50 55 60 Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala Val Gln Gly Ala Pro 65 70 75 80 Met Asn Pro Trp Gln Arg Phe Ala Arg Gln Arg Leu Ala Arg Ser Arg 85 90 95 Trp Asn Arg Asp Pro Ala Ala Leu Asp Pro Ala Asp Thr Pro Ala Phe 100 105 110 Glu Gln Ala Trp Gln Arg Gln Cys His Met Glu Gln Thr Ile Val Ala 115 120 125 Arg Val Pro Glu Gly Asp Ile Pro Ala Ala Leu Leu Glu Asn Ile Ala 130 135 140 Ala Ser Leu Ala Ile Trp Leu Asp Glu Gly Asp Phe Ala Pro Pro Glu 145 150 155 160 Arg Ala Ala Ile Val Arg His His Ala Arg Leu Glu Leu Ala Phe Ala 165 170 175 Asp Ile Ala Arg Gln Ala Pro Gln Pro Asp Leu Ser Thr Val Gln Ala 180 185 190 Trp Tyr Leu Arg His Gln Thr Gln Phe Met Arg Pro Glu Gln Arg Leu 195 200 205 Thr Arg His Leu Leu Leu Thr Val Asp Asn Asp Arg Glu Ala Val His 210 215 220 Gln Arg Ile Leu Gly Leu Tyr Arg Gln Ile Asn Ala Ser Arg Asp Ala 225 230 235 240 Phe Ala Pro Leu Ala Gln Arg His Ser His Cys Pro Ser Ala Leu Glu 245 250 255 Glu Gly Arg Leu Gly Trp Ile Ser Arg Gly Leu Leu Tyr Pro Gln Leu 260 265 270 Glu Thr Ala Leu Phe Ser Leu Ala Glu Asn Ala Leu Ser Leu Pro Ile 275 280 285 Ala Ser Glu Leu Gly Trp His Leu Leu Trp Cys Glu Ala Ile Arg Pro 290 295 300 Ala Ala Pro Met Glu Pro Gln Gln Ala Leu Glu Ser Ala Arg Asp Tyr 305 310 315 320 Leu Trp Gln Gln Ser Gln Gln Arg His Gln Arg Gln Trp Leu Glu Gln 325 330 335 Met Ile Ser Arg Gln Pro Gly Leu Cys Gly Glu Gln Lys Leu Ile Ser 340 345 350 Glu Glu Asp Leu 355 <210> 68 <211> 1723 <212> DNA <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 68 atggcaatgg ctgttttccg tcgcgaaggg aggcgtctcc tcccttgaat acgccgctcg 60 cccaatcgct gctatccgat ctcctctctc ttctgaccag gaggaaggac ttcttggagt 120 tcgatctatc tcaactcaag tggtgcgtaa ccgcatgaag agtgttaaga acatccaaaa 180 gatcacaaag gcaatgaaga tggttgctgc ttccaagctt agagcagttc aaggcgcgcc 240 aactaatgct actggtgaaa gaaacctcgc tctcatccaa gaggttttgg aagtttttcc 300 tgagactgct aggaaagaaa ggcgtaagca catgatggtg tctgatccta agatgaagtc 360 tgtgggaaag tgcatcatct ctaacagaaa gtctcagcct ggtgtgatga ctgttagagg 420 atgtgcttat gctggatcta agggtgttgt tttcggacct atcaaggata tggctcatat 480 ctctcatgga cctgctggat gtggacaata ttctagagct gagcgtagga actactacac 540 tggtgtttct ggtgtggatt ctttcggaac tctcaacttc acctctgatt tccaagagcg 600 tgatatcgtt ttcggaggtg ataagaagct ctctaagttg atcgaagaga tggaactctt 660 gttcccactc actaagggaa tcactatcca atctgagtgc cctgttggac ttatcggaga 720 tgatatttct gctgtggcta acgcttcttc taaggctctt gataagcctg ttatccctgt 780 tagatgtgaa ggattcaggg gagtttctca gtctcttgga catcatatcg ctaacgatgt 840 ggtgagagat tggatcctta acaacagaga gggacaacct ttcgagacta ctccttacga 900 tgttgctatc atcggagact acaacattgg aggtgatgct tgggcttcta gaatccttct 960 tgaagagatg ggactcagag ttgttgctca atggtctggt gatggtactc ttgttgagat 1020 ggaaaacacc cctttcgtta agctcaacct cgttcattgc taccgtagca tgaactacat 1080 tgctagacac atggaagaga agcaccaaat tccttggatg gagtacaact tcttcggacc 1140 tactaagatc gctgagtctc ttagaaagat cgctgatcag ttcgatgata ccatcagagc 1200 taatgctgag gctgttattg ctagatacga gggacaaatg gctgctatta tcgctaagta 1260 cagacctaga ctcgagggaa gaaaggtttt gctttacatc ggaggactca gacctagaca 1320 tgttattgga gcttacgagg atctcggaat ggaaattatt gctgctggat acgagttcgc 1380 tcacaacgat gattacgata gaactctccc tgacctcaaa gagggaactc ttcttttcga 1440 tgacgcttct tcatacgagc ttgaggcttt tgttaaggct cttaagcctg atctcatcgg 1500 atctggaatc aaagagaagt acatcttcca gaagatggga gttcctttca gacagatgca 1560 ctcttgggat tattctggac cttaccatgg atacgacgga tttgctatct tcgctaggga 1620 tatggatatg actctcaaca atcctgcttg gaacgaactt actgctcctt ggcttaagtc 1680 tgctgccggc tacccttacg acgttcctga ttacgctccc ggg 1723 <210> 69 <211> 4 <212> PRT <213> Klebsiella pneumoniae <400> 69 Asp Leu Arg Val 1 <210> 70 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 70 atgtcaactc aagtggtgcg taaccgcatg aagagtgtta agaacatcca aaagatcaca 60 aaggcaatga agatggttgc tgcttccaag cttagagcag ttcaaggcgc gccaact 117 <210> 71 <211> 39 <212> PRT <213> Artificial Sequence <220> <223> Fusion polypeptide <400> 71 Met Ser Thr Gln Val Val Arg Asn Arg Lys Ser Val Lys Asn Ile Gln 1 5 10 15 Lys Ile Thr Lys Ala Met Lys Met Val Ala Ala Ser Lys Leu Arg Ala 20 25 30 Val Gln Gly Ala Pro Thr Met 35 <210> 72 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 72 atgatgacta atgctactgg cgaacgtaac ctg 33 <210> 73 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 73 ccggctcctc cgctagataa aaatgtga 28 <210> 74 <211> 86 <212> PRT <213> Klebsiella pneumoniae <400> 74 Met Met Glu Trp Phe Tyr Gln Ile Pro Gly Val Asp Glu Leu Arg Ser 1 5 10 15 Ala Glu Ser Phe Phe Gln Phe Phe Ala Val Pro Tyr Gln Pro Glu Leu 20 25 30 Leu Gly Arg Cys Ser Leu Pro Val Leu Ala Thr Phe His Arg Lys Leu 35 40 45 Arg Ala Glu Val Pro Leu Gln Asn Arg Leu Glu Asp Asn Asp Arg Ala 50 55 60 Pro Trp Leu Leu Ala Arg Arg Leu Leu Ala Glu Ser Tyr Gln Gln Gln 65 70 75 80 Phe Gln Glu Ser Gly Thr 85 <210> 75 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> N-terminal extension <400> 75 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg 50 <210> 76 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> MTP scar <400> 76 Ile Ser Thr Gln Val Val Arg Asn Arg 1 5 <210> 77 <211> 33 <212> PRT <213> Artificial Sequence <220> <223> N-terminal extension <400> 77 Met Tyr Arg Phe Ala Ser Asn Leu Ala Ser Lys Ala Arg Ile Ala Gln 1 5 10 15 Asn Ala Arg Gln Val Ser Ser Arg Met Ser Trp Ser Arg Asn Tyr Gly 20 25 30 Gly <210> 78 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> N-terminal extension <400> 78 Met Tyr Arg Phe Ala Ser Asn Leu Ala Ser Lys Ala Arg Ile Ala Gln 1 5 10 15 Asn Ala Arg Gln Val Ser Ser Arg Met Ser Trp Ser Arg Asn Tyr 20 25 30 <210> 79 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> N-terminal extension <400> 79 Met Ala Ile Arg Cys Val Ala Ser Arg Lys Thr Leu Ala Gly Leu Lys 1 5 10 15 Glu Thr Ser Ser Arg Leu Leu Arg Ile Arg Gly Ile Gln Gly Gly 20 25 30 <210> 80 <211> 60 <212> PRT <213> Artificial Sequence <220> <223> N-terminal extension <400> 80 Met Ala Ile Arg Cys Val Ala Ser Arg Lys Thr Leu Ala Gly Leu Lys 1 5 10 15 Glu Thr Ser Ser Arg Leu Leu Arg Ile Arg Gly Ile Gln Met Ala Ile 20 25 30 Arg Cys Val Ala Ser Arg Lys Thr Leu Ala Gly Leu Lys Glu Thr Ser 35 40 45 Ser Arg Leu Leu Arg Ile Arg Gly Ile Gln Gly Gly 50 55 60 <210> 81 <211> 29 <212> PRT <213> Artificial Sequence <220> <223> N-terminal extension <400> 81 Met Ala Ile Arg Cys Val Ala Ser Arg Lys Thr Leu Ala Gly Leu Lys 1 5 10 15 Glu Thr Ser Ser Arg Leu Leu Arg Ile Arg Gly Gly Gly 20 25 <210> 82 <211> 56 <212> PRT <213> Artificial Sequence <220> <223> N-terminal extension <400> 82 Met Ala Ile Arg Cys Val Ala Ser Arg Lys Thr Leu Ala Gly Leu Lys 1 5 10 15 Glu Thr Ser Ser Arg Leu Leu Arg Ile Arg Gly Met Ala Ile Arg Cys 20 25 30 Val Ala Ser Arg Lys Thr Leu Ala Gly Leu Lys Glu Thr Ser Ser Arg 35 40 45 Leu Leu Arg Ile Arg Gly Gly Gly 50 55 <210> 83 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> N-terminal extension <400> 83 Met Phe Leu Thr Arg Phe Val Gly Arg Arg Phe Leu Ala Ala Ala Ser 1 5 10 15 Ala Arg Ser Glu Ser Thr Thr Ala Ala Ala Ala Ala Ser Thr Ile Arg 20 25 30 Gly Gly <210> 84 <211> 70 <212> PRT <213> Artificial Sequence <220> <223> N-terminal extension <400> 84 Met Ala Ser Thr Arg Val Leu Ala Ser Arg Leu Ala Ser Gln Met Ala 1 5 10 15 Ala Ser Ala Lys Val Ala Arg Pro Ala Val Arg Val Ala Gln Val Ser 20 25 30 Lys Arg Thr Ile Gln Thr Gly Ser Pro Leu Gln Thr Leu Lys Arg Thr 35 40 45 Gln Met Thr Ser Ile Val Asn Ala Thr Thr Arg Gln Ala Phe Gln Lys 50 55 60 Arg Ala Tyr Ser Gly Gly 65 70 <210> 85 <211> 53 <212> PRT <213> Artificial Sequence <220> <223> N-terminal extension <400> 85 Met Ala Met Ala Val Phe Arg Arg Glu Gly Arg Arg Leu Leu Pro Ser 1 5 10 15 Ile Ala Ala Arg Pro Ile Ala Ala Ile Arg Ser Pro Leu Ser Ser Asp 20 25 30 Gln Glu Glu Gly Leu Leu Gly Val Arg Ser Ile Ser Thr Gln Val Val 35 40 45 Arg Asn Arg Gly Gly 50 <210> 86 <211> 61 <212> PRT <213> Artificial Sequence <220> <223> N-terminal extension <400> 86 Met Leu Ser Leu Arg Gln Ser Ile Arg Phe Phe Lys Pro Ala Thr Arg 1 5 10 15 Thr Leu Cys Ser Ser Arg Tyr Leu Leu Gln Gln Lys Pro Ser Ala Trp 20 25 30 Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser Gly Gly Gly Ser Gly 35 40 45 Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly 50 55 60 <210> 87 <211> 43 <212> PRT <213> Artificial Sequence <220> <223> N-terminal extension <400> 87 Met Leu Ser Leu Arg Gln Ser Ile Arg Phe Phe Lys Pro Ala Thr Arg 1 5 10 15 Thr Leu Cys Ser Ser Arg Tyr Leu Leu Gln Gln Lys Pro Gly Gly His 20 25 30 His His His His His His His His His Gly Gly 35 40 <210> 88 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Predicted scar <400> 88 Ile Gln Gly Gly 1 <210> 89 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> predicted scar <400> 89 Ile Gln Gly Gly 1 <210> 90 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> predicted scar <400> 90 Glu Ser Thr Thr Ala Ala Ala Ala Ala Ser Thr Ile Arg Gly Gly 1 5 10 15 <210> 91 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> predicted scar <400> 91 Tyr Ser Gly Gly 1 <210> 92 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> predicted scar <400> 92 Ile Ser Thr Gln Val Val Arg Asn Arg Gly Gly 1 5 10 <210> 93 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> predicted scar <400> 93 Gln Gln Lys Pro Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly 1 5 10 15 Gly Ser Gly Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe 20 25 30 Glu Lys Gly Gly 35 <210> 94 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> predicted scar <400> 94 Lys Pro Gly Gly His His His His His His His His His His Gly Gly 1 5 10 15 <210> 95 <211> 488 <212> PRT <213> Artificial Sequence <220> <223> variant <400> 95 Met Met Thr Asn Ala Thr Gly Glu Arg Asn Leu Ala Leu Ile Gln Glu 1 5 10 15 Val Leu Glu Val Phe Pro Glu Thr Ala Arg Lys Glu Arg Arg Lys His 20 25 30 Met Met Val Ser Asp Pro Glu Met Glu Ser Val Gly Lys Cys Ile Ile 35 40 45 Ser Asn Arg Lys Ser Gln Pro Gly Val Met Thr Val Arg Gly Cys Ala 50 55 60 Tyr Ala Gly Ser Lys Gly Val Val Phe Gly Pro Ile Lys Asp Met Ala 65 70 75 80 His Ile Ser His Gly Pro Val Gly Cys Gly Gln Tyr Ser Arg Ala Gly 85 90 95 Arg Arg Asn Tyr Tyr Thr Gly Val Ser Gly Val Asp Ser Phe Gly Thr 100 105 110 Leu Asn Phe Thr Ser Asp Phe Gln Glu Arg Asp Ile Val Phe Gly Gly 115 120 125 Asp Lys Lys Leu Ser Lys Leu Ile Glu Glu Met Glu Leu Leu Phe Pro 130 135 140 Leu Thr Lys Gly Ile Thr Ile Gln Ser Glu Cys Pro Val Gly Leu Ile 145 150 155 160 Gly Asp Asp Ile Ser Ala Val Ala Asn Ala Ser Ser Lys Ala Leu Asp 165 170 175 Lys Pro Val Ile Pro Val Arg Cys Glu Gly Phe Arg Gly Val Ser Gln 180 185 190 Ser Leu Gly His His Ile Ala Asn Asp Val Val Arg Asp Trp Ile Leu 195 200 205 Asn Asn Arg Glu Gly Gln Pro Phe Glu Thr Thr Pro Tyr Asp Val Ala 210 215 220 Ile Ile Gly Asp Tyr Asn Ile Gly Gly Asp Ala Trp Ala Ser Arg Ile 225 230 235 240 Leu Leu Glu Glu Met Gly Leu Arg Val Val Ala Gln Trp Ser Gly Asp 245 250 255 Gly Thr Leu Val Glu Met Glu Asn Thr Pro Phe Val Lys Leu Asn Leu 260 265 270 Val His Cys Tyr Arg Ser Met Asn Tyr Ile Ala Arg His Met Glu Glu 275 280 285 Lys His Gln Ile Pro Trp Met Glu Tyr Asn Phe Phe Gly Pro Thr Lys 290 295 300 Ile Ala Glu Ser Leu Arg Lys Ile Ala Asp Gln Phe Asp Asp Thr Ile 305 310 315 320 Arg Ala Asn Ala Glu Ala Val Ile Ala Arg Tyr Glu Gly Gln Met Ala 325 330 335 Ala Ile Ile Ala Lys Tyr Arg Pro Arg Leu Glu Gly Arg Lys Val Leu 340 345 350 Leu Tyr Met Gly Gly Leu Arg Pro Arg His Val Ile Gly Ala Tyr Glu 355 360 365 Asp Leu Gly Met Glu Ile Ile Ala Ala Gly Tyr Glu Phe Ala His Asn 370 375 380 Asp Asp Tyr Asp Arg Thr Leu Pro Asp Leu Lys Glu Gly Thr Leu Leu 385 390 395 400 Phe Asp Asp Ala Ser Ser Tyr Glu Leu Glu Ala Phe Val Lys Ala Leu 405 410 415 Lys Pro Asp Leu Ile Gly Ser Gly Ile Lys Glu Lys Tyr Ile Phe Gln 420 425 430 Lys Met Gly Val Pro Phe Arg Gln Met His Ser Trp Asp Tyr Ser Gly 435 440 445 Pro Tyr His Gly Tyr Asp Gly Phe Ala Ile Phe Ala Arg Asp Met Asp 450 455 460 Met Thr Leu Asn Asn Pro Ala Trp Asn Glu Leu Thr Ala Pro Trp Leu 465 470 475 480 Lys Ser Gly Val Arg Pro Arg Ser 485 <210> 96 <211> 400 <212> PRT <213> Artificial Sequence <220> <223> variant <400> 96 Met Lys Gln Val Tyr Leu Asp Asn Asn Ala Thr Thr Arg Leu Asp Pro 1 5 10 15 Met Val Leu Glu Ala Met Met Pro Phe Leu Thr Asp Phe Tyr Gly Asn 20 25 30 Pro Ser Ser Ile His Asp Phe Gly Ile Pro Ala Gln Ala Ala Leu Glu 35 40 45 Arg Ala His Gln Gln Ala Ala Ala Leu Leu Gly Ala Glu Tyr Pro Ser 50 55 60 Glu Ile Ile Phe Thr Ser Cys Ala Thr Glu Ala Thr Ala Thr Ala Ile 65 70 75 80 Ala Ser Ala Ile Ala Leu Leu Pro Glu Arg Arg Glu Ile Ile Thr Ser 85 90 95 Val Val Glu His Pro Ala Thr Leu Ala Ala Cys Glu His Leu Glu Arg 100 105 110 Gln Gly Tyr Arg Ile His Arg Ile Ala Val Asp Ser Glu Gly Ala Leu 115 120 125 Asp Met Ala Gln Phe Arg Ala Ala Leu Ser Pro Arg Val Ala Leu Val 130 135 140 Ser Val Met Trp Ala Asn Asn Glu Thr Gly Val Leu Phe Pro Ile Gly 145 150 155 160 Glu Met Ala Glu Leu Ala His Glu Gln Gly Ala Leu Phe His Cys Asp 165 170 175 Ala Val Gln Val Val Gly Lys Ile Pro Ile Ala Val Gly Gln Thr Arg 180 185 190 Ile Asp Met Leu Ser Cys Ser Ala His Lys Phe His Gly Pro Lys Gly 195 200 205 Val Gly Cys Leu Tyr Leu Arg Arg Gly Thr Arg Phe Arg Pro Leu Leu 210 215 220 Arg Gly Gly His Gln Glu Tyr Gly Arg Arg Ala Gly Thr Glu Asn Ile 225 230 235 240 Cys Gly Ile Val Gly Met Gly Ala Ala Cys Glu Leu Ala Asn Ile His 245 250 255 Leu Pro Gly Met Thr His Ile Gly Gln Leu Arg Asn Arg Leu Glu His 260 265 270 Arg Leu Leu Ala Ser Val Pro Ser Val Met Val Met Gly Gly Gly Gln 275 280 285 Pro Arg Val Pro Gly Thr Val Asn Leu Ala Phe Glu Phe Ile Glu Gly 290 295 300 Glu Ala Ile Leu Leu Leu Leu Asn Gln Ala Gly Ile Ala Ala Ser Ser 305 310 315 320 Gly Ser Ala Cys Thr Ser Gly Ser Leu Glu Pro Ser His Val Met Arg 325 330 335 Ala Met Asn Ile Pro Tyr Thr Ala Ala His Gly Thr Ile Arg Phe Ser 340 345 350 Leu Ser Arg Tyr Thr Arg Glu Lys Glu Ile Asp Tyr Val Val Ala Thr 355 360 365 Leu Pro Pro Ile Ile Asp Arg Leu Arg Ala Leu Ser Pro Tyr Trp Gln 370 375 380 Asn Gly Lys Pro Arg Pro Ala Asp Ala Val Phe Thr Pro Val Tyr Gly 385 390 395 400 <210> 97 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> C-terminal extension <400> 97 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1 5 <210> 98 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 98 tcatcaagcg taatcaggaa catcgtaggg gtaacgaacc agatcgaaag aatagtcgg 59 <210> 99 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 99 aagggcgaat tccagcacac tgg 23 <210> 100 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 100 cctgattgta tccgcatctg atgctac 27 <210> 101 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 101 aacctgcagg gctaactaac taaccacgga caaaaaacc 39 <210> 102 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 102 ggtagcatca gatgcggata caatcaggtc atcaagcgta atcaggaaca tcgagg 56 <210> 103 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 103 ccagtgtgct ggaattcgcc cttaacctgc agggctaact aactaaccac g 51 <210> 104 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 104 Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Ala Tyr Pro Tyr Asp Val 1 5 10 15 Pro Asp Tyr Ala Thr Pro Pro Pro Gly Ser Thr Thr Thr Ala 20 25 30 <210> 105 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 105 atgatgacta acgctacagg agaa 24 <210> 106 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 106 tcatcatcta accaaatcaa aactgtaatc tg 32 <210> 107 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 107 ccggctcctc cgctagataa aaatgtgaat ttttgcatgc agcc 44 <210> 108 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 108 cctgattgta tccgcatctg atgctaccgt ggttga 36 <210> 109 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 109 ttctcctgta gcgttagtca tcatccggct cctccgcta 39 <210> 110 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 110 cagatgcgga tacaatcagg tcatcatcta accaaatcaa aactg 45 <210> 111 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 111 Met Ser Thr Gln Val Val Arg Asn Arg 1 5 <210> 112 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> HA epitope sequence <400> 112 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1 5 <210> 113 <211> 46 <212> PRT <213> Artificial Sequence <220> <223> linker <400> 113 Thr Ser Ser Gly Gly Thr Ser Thr Gly Gly Ser Thr Thr Thr Thr Ala 1 5 10 15 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Thr Thr Ser Thr Lys 20 25 30 Ala Ser Thr Thr Ser Thr Ser Ser Thr Ser Thr Gly Thr Gly 35 40 45 <210> 114 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 114 atgaagggaa atgagattct tgctctt 27 <210> 115 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 115 tcatcaatca gcagcataag cacc 24 <210> 116 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 116 ttgtaataac ctccagtgat gaattgaata 30 <210> 117 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 117 ctagagatta atatggagaa attaagcatg 30 <210> 118 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 118 aagagcaaga atctcatttc ccttcatttg taataacctc cagtgatgaa ttgatagtg 59 <210> 119 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide primer <400> 119 tagttttcat gcttaatttc tccatattaa tctctagtca tcaatcagca gcataagcac 60 c 61 <210> 120 <211> 545 <212> PRT <213> Artificial Sequence <220> <223> promoter <400> 120 Thr Ala Ala Thr Thr Gly Thr Thr Ala Thr Thr Ala Thr Cys Ala Ala 1 5 10 15 Thr Ala Ala Ala Ala Gly Ala Ala Thr Thr Thr Thr Thr Ala Thr Thr 20 25 30 Gly Thr Thr Ala Thr Thr Gly Thr Gly Thr Thr Ala Thr Thr Thr Gly 35 40 45 Gly Thr Ala Ala Thr Thr Thr Ala Thr Gly Cys Thr Thr Ala Thr Ala 50 55 60 Ala Gly Thr Ala Ala Thr Thr Cys Thr Ala Thr Gly Ala Thr Thr Ala 65 70 75 80 Ala Thr Thr Gly Thr Gly Ala Ala Thr Thr Ala Ala Thr Ala Ala Gly 85 90 95 Ala Cys Thr Ala Ala Thr Gly Ala Gly Gly Ala Thr Ala Ala Thr Ala 100 105 110 Ala Thr Thr Gly Ala Ala Thr Thr Thr Gly Ala Thr Thr Ala Ala Ala 115 120 125 Thr Thr Ala Ala Cys Thr Cys Thr Gly Cys Gly Ala Ala Gly Cys Cys 130 135 140 Ala Thr Ala Thr Gly Thr Cys Thr Thr Thr Cys Ala Cys Gly Thr Gly 145 150 155 160 Ala Gly Ala Gly Thr Cys Ala Cys Gly Thr Gly Ala Thr Gly Thr Cys 165 170 175 Thr Cys Cys Gly Cys Gly Ala Cys Ala Gly Gly Cys Thr Gly Gly Cys 180 185 190 Ala Cys Gly Gly Gly Gly Cys Thr Thr Ala Gly Thr Ala Thr Thr Ala 195 200 205 Cys Cys Cys Cys Cys Gly Thr Gly Cys Cys Gly Gly Gly Ala Thr Cys 210 215 220 Ala Gly Ala Gly Ala Cys Ala Thr Thr Thr Gly Ala Cys Thr Ala Ala 225 230 235 240 Ala Thr Gly Thr Thr Gly Ala Cys Thr Thr Gly Gly Ala Ala Thr Ala 245 250 255 Ala Thr Ala Gly Cys Cys Cys Thr Thr Gly Gly Ala Thr Thr Ala Gly 260 265 270 Ala Thr Gly Ala Cys Ala Cys Gly Thr Gly Gly Ala Cys Gly Cys Thr 275 280 285 Cys Ala Gly Gly Ala Thr Cys Thr Gly Thr Gly Ala Thr Gly Cys Thr 290 295 300 Ala Gly Thr Gly Ala Ala Gly Cys Gly Cys Thr Thr Ala Ala Gly Cys 305 310 315 320 Thr Gly Ala Ala Cys Gly Ala Ala Thr Cys Thr Gly Ala Cys Gly Gly 325 330 335 Ala Ala Gly Ala Gly Cys Gly Gly Ala Cys Ala Ala Ala Cys Gly Cys 340 345 350 Ala Cys Ala Thr Gly Gly Ala Cys Thr Ala Thr Gly Gly Cys Cys Cys 355 360 365 Ala Cys Thr Gly Cys Thr Thr Thr Ala Thr Thr Ala Ala Ala Gly Ala 370 375 380 Ala Gly Thr Gly Ala Ala Thr Gly Ala Cys Ala Gly Cys Thr Gly Thr 385 390 395 400 Cys Thr Thr Thr Gly Cys Thr Thr Cys Ala Ala Gly Ala Cys Gly Ala 405 410 415 Ala Gly Thr Ala Ala Ala Gly Ala Ala Thr Ala Gly Thr Gly Gly Ala 420 425 430 Ala Ala Ala Cys Gly Cys Gly Thr Ala Ala Ala Gly Ala Ala Thr Ala 435 440 445 Ala Gly Cys Gly Thr Ala Cys Thr Cys Ala Gly Thr Ala Cys Gly Cys 450 455 460 Thr Thr Cys Gly Thr Gly Gly Cys Thr Thr Thr Ala Thr Ala Ala Ala 465 470 475 480 Thr Ala Gly Thr Gly Cys Thr Thr Cys Gly Thr Cys Thr Thr Ala Thr 485 490 495 Thr Cys Thr Thr Cys Gly Thr Thr Gly Thr Ala Thr Cys Ala Thr Cys 500 505 510 Ala Ala Cys Gly Ala Ala Gly Ala Ala Gly Thr Thr Ala Ala Gly Cys 515 520 525 Thr Thr Thr Gly Thr Thr Cys Thr Gly Cys Gly Thr Thr Thr Thr Ala 530 535 540 Ala 545 <210> 121 <211> 528 <212> PRT <213> Artificial Sequence <220> <223> promoter <400> 121 Thr Ala Ala Thr Thr Gly Thr Thr Ala Thr Thr Ala Thr Cys Ala Ala 1 5 10 15 Thr Ala Ala Ala Ala Gly Ala Ala Thr Thr Thr Thr Thr Ala Thr Thr 20 25 30 Gly Thr Thr Ala Thr Thr Gly Thr Gly Thr Thr Ala Thr Thr Thr Gly 35 40 45 Gly Thr Ala Ala Thr Thr Thr Ala Thr Gly Cys Thr Thr Ala Thr Ala 50 55 60 Ala Gly Thr Ala Ala Thr Thr Cys Thr Ala Thr Gly Ala Thr Thr Ala 65 70 75 80 Ala Thr Thr Gly Thr Gly Ala Ala Thr Thr Ala Ala Thr Ala Ala Gly 85 90 95 Ala Cys Thr Ala Ala Thr Gly Ala Gly Gly Ala Thr Ala Ala Thr Ala 100 105 110 Ala Thr Thr Gly Ala Ala Thr Thr Thr Gly Ala Thr Thr Ala Ala Ala 115 120 125 Thr Thr Ala Ala Cys Thr Cys Thr Gly Cys Gly Ala Ala Gly Cys Cys 130 135 140 Ala Thr Ala Thr Gly Thr Cys Thr Thr Thr Cys Ala Cys Gly Thr Gly 145 150 155 160 Ala Gly Ala Gly Thr Cys Ala Cys Gly Thr Gly Ala Thr Gly Thr Cys 165 170 175 Thr Cys Cys Gly Cys Gly Ala Cys Ala Gly Gly Cys Thr Gly Gly Cys 180 185 190 Ala Cys Gly Gly Gly Gly Cys Thr Thr Ala Gly Thr Ala Thr Thr Ala 195 200 205 Cys Cys Cys Cys Cys Gly Thr Gly Cys Cys Gly Gly Gly Ala Thr Cys 210 215 220 Ala Gly Ala Gly Ala Cys Ala Thr Thr Thr Gly Ala Cys Thr Ala Ala 225 230 235 240 Ala Thr Gly Thr Thr Gly Ala Cys Thr Thr Gly Gly Ala Ala Thr Ala 245 250 255 Ala Thr Ala Gly Cys Cys Cys Thr Thr Gly Gly Ala Thr Thr Ala Gly 260 265 270 Ala Thr Gly Ala Cys Ala Cys Gly Thr Gly Gly Ala Cys Gly Cys Thr 275 280 285 Cys Ala Gly Gly Ala Thr Cys Thr Gly Thr Gly Ala Thr Gly Cys Thr 290 295 300 Ala Gly Thr Gly Ala Ala Gly Cys Gly Cys Thr Thr Ala Ala Gly Cys 305 310 315 320 Thr Gly Ala Ala Cys Gly Ala Ala Thr Cys Thr Gly Ala Cys Gly Gly 325 330 335 Ala Ala Gly Ala Gly Cys Gly Gly Ala Cys Ala Ala Ala Cys Gly Cys 340 345 350 Ala Cys Ala Thr Gly Gly Ala Cys Thr Ala Thr Gly Gly Cys Cys Cys 355 360 365 Ala Cys Thr Gly Cys Thr Thr Thr Ala Thr Thr Ala Ala Ala Gly Ala 370 375 380 Ala Gly Thr Gly Ala Ala Thr Gly Ala Cys Ala Gly Cys Thr Gly Thr 385 390 395 400 Cys Thr Thr Thr Gly Cys Thr Thr Cys Ala Ala Gly Ala Cys Gly Ala 405 410 415 Ala Gly Thr Ala Ala Ala Gly Ala Ala Thr Ala Gly Thr Gly Gly Ala 420 425 430 Ala Ala Ala Cys Gly Cys Gly Thr Ala Ala Ala Gly Ala Ala Thr Ala 435 440 445 Ala Gly Cys Gly Thr Ala Cys Thr Cys Ala Gly Thr Ala Cys Gly Cys 450 455 460 Thr Thr Cys Gly Thr Gly Gly Cys Thr Thr Thr Ala Thr Ala Ala Ala 465 470 475 480 Thr Ala Gly Thr Gly Cys Thr Thr Cys Gly Thr Cys Thr Thr Ala Thr 485 490 495 Thr Cys Thr Thr Cys Gly Thr Thr Gly Thr Ala Thr Cys Ala Thr Cys 500 505 510 Ala Ala Cys Gly Ala Ala Gly Ala Ala Gly Thr Thr Ala Ala Gly Cys 515 520 525 <210> 122 <211> 569 <212> PRT <213> Artificial Sequence <220> <223> promoter <400> 122 Thr Ala Ala Thr Thr Ala Ala Thr Ala Gly Thr Ala Ala Thr Thr Ala 1 5 10 15 Thr Gly Ala Thr Thr Ala Ala Thr Thr Ala Thr Gly Ala Gly Ala Thr 20 25 30 Ala Ala Gly Ala Gly Thr Thr Gly Thr Thr Ala Thr Thr Ala Ala Thr 35 40 45 Gly Cys Thr Thr Ala Thr Gly Ala Gly Gly Ala Ala Thr Ala Ala Ala 50 55 60 Gly Ala Ala Thr Gly Ala Thr Thr Ala Ala Thr Ala Thr Thr Gly Thr 65 70 75 80 Thr Thr Ala Ala Thr Thr Thr Thr Ala Thr Thr Cys Cys Gly Cys Gly 85 90 95 Ala Ala Gly Cys Gly Gly Thr Gly Thr Gly Thr Thr Ala Thr Gly Thr 100 105 110 Thr Thr Thr Thr Gly Thr Thr Gly Gly Ala Gly Ala Cys Ala Thr Cys 115 120 125 Ala Cys Gly Thr Gly Ala Cys Thr Cys Thr Cys Ala Cys Gly Thr Gly 130 135 140 Ala Thr Gly Thr Cys Thr Cys Cys Gly Cys Gly Ala Cys Ala Gly Gly 145 150 155 160 Cys Thr Gly Gly Cys Ala Cys Gly Gly Gly Gly Cys Thr Thr Ala Gly 165 170 175 Thr Ala Thr Thr Ala Cys Cys Cys Cys Cys Gly Thr Gly Cys Cys Gly 180 185 190 Gly Gly Ala Thr Cys Ala Gly Ala Gly Ala Cys Ala Thr Thr Thr Gly 195 200 205 Ala Cys Thr Ala Ala Ala Thr Ala Thr Thr Gly Ala Cys Thr Thr Gly 210 215 220 Gly Ala Ala Thr Ala Ala Thr Ala Gly Cys Cys Cys Thr Thr Gly Gly 225 230 235 240 Ala Thr Thr Ala Gly Ala Thr Gly Ala Cys Ala Cys Gly Thr Gly Gly 245 250 255 Ala Cys Gly Cys Thr Cys Ala Gly Gly Ala Thr Cys Thr Gly Thr Gly 260 265 270 Ala Thr Gly Cys Thr Ala Gly Thr Gly Ala Ala Gly Cys Gly Cys Thr 275 280 285 Thr Ala Ala Gly Cys Thr Gly Ala Ala Cys Gly Ala Ala Thr Cys Thr 290 295 300 Gly Ala Cys Gly Gly Ala Ala Gly Ala Gly Cys Gly Gly Ala Cys Ala 305 310 315 320 Thr Ala Cys Gly Cys Ala Cys Ala Thr Gly Gly Ala Thr Thr Ala Thr 325 330 335 Gly Gly Cys Cys Cys Ala Cys Ala Thr Gly Thr Cys Thr Ala Ala Ala 340 345 350 Gly Thr Gly Thr Ala Thr Cys Thr Cys Thr Thr Thr Ala Cys Ala Gly 355 360 365 Cys Thr Ala Thr Ala Thr Cys Gly Ala Thr Gly Thr Gly Ala Cys Gly 370 375 380 Thr Ala Ala Gly Ala Thr Gly Cys Thr Thr Thr Ala Cys Thr Thr Cys 385 390 395 400 Gly Cys Thr Thr Cys Gly Ala Ala Gly Thr Ala Ala Ala Gly Thr Ala 405 410 415 Gly Gly Ala Ala Ala Thr Thr Gly Cys Thr Cys Gly Cys Thr Ala Ala 420 425 430 Gly Thr Thr Ala Thr Thr Cys Thr Thr Thr Thr Cys Thr Gly Ala Ala 435 440 445 Ala Gly Ala Ala Ala Thr Thr Ala Ala Thr Thr Thr Ala Ala Thr Thr 450 455 460 Cys Thr Ala Ala Ala Thr Thr Ala Ala Ala Thr Thr Ala Ala Ala Thr 465 470 475 480 Gly Ala Gly Thr Gly Gly Cys Thr Ala Thr Ala Ala Ala Thr Ala Gly 485 490 495 Thr Gly Thr Cys Gly Ala Thr Gly Cys Thr Ala Cys Cys Thr Cys Ala 500 505 510 Cys Ala Thr Cys Gly Thr Ala Thr Thr Cys Thr Thr Cys Thr Thr Cys 515 520 525 Gly Cys Ala Thr Cys Gly Thr Cys Thr Gly Thr Thr Cys Thr Gly Gly 530 535 540 Thr Thr Thr Thr Ala Ala Gly Gly Ala Ala Thr Thr Cys Thr Ala Gly 545 550 555 560 Ala Gly Thr Cys Ala Gly Ala Cys Cys 565 <210> 123 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 123 ggaggaattc caatcccaca aaaatctgag cttaacagca cagttgctcc tctcagagca 60 gaatcgggta ttcaacaccc tcatatcaac tactacgttg tgtataacgg tccacatgcc 120 ggtatatacg atgactgggg ttgtacaaag gcggcaacaa acggcgttcc cggagttgca 180 cacaagaaat ttgccactat tacagaggca agagcagcag ctgacgcgta cacaacaagt 240 cagcaaacag acaggttgaa cttcatcccc aaaggagaag ctcaactcaa gcccaagagc 300 tttgctaagg ccctaacaag cccaccaaag caaaaagccc actggctcac gctaggaacc 360 aaaaggccca gcagtgatcc agccccaaaa gagatctcct ttgccccgga gattacaatg 420 gacgatttcc tctatcttta cgatctagga aggaagttcg aaggtgaagg tgacgacact 480 atgttcacca ctgataatga gaaggttagc ctcttcaatt tcagaaagaa tgctgaccca 540 cagatggtta gagaggccta cgcagcaagt ctcatcaaga cgatctaccc gagtaacaat 600 ctccaggaga tcaaatacct tcccaagaag gttaaagatg cagtcaaaag attcaggact 660 aattgcatca agaacacaga gaaagacata tttctcaaga tcagaagtac tattccagta 720 tggacgattc aaggcttgct tcataaacca aggcaagtaa tagagattgg agtctctaaa 780 aaggtagttc ctactgaatc taaggccatg catggagtct aagattcaaa tcgaggatct 840 aacagaactc gccgtcaaga ctggcgaaca gttcatacag agtcttttac gactcaatga 900 caagaagaaa atcttcgtca acatggtgga gcacgacact ctggtctact ccaaaaatgt 960 caaagataca gtctcagaag atcaaagggc tattgagact tttcaacaaa ggataatttc 1020 gggaaacctc ctcggattcc attgcccagc tatctgtcac ttcatcgaaa ggacagtaga 1080 aaaggaaggt ggctcctaca aatgccatca ttgcgataaa ggaaaggcta tcattcaaga 1140 tctctctgcc gacagtggtc ccaaagatgg acccccaccc acgaggagca tcgtggaaaa 1200 agaagaggtt ccaaccacgt ctacaaagca agtggattga tgtgacatct ccactgacgt 1260 aagggatgac gcacaatccc actatccttc gcaagaccct tcctctatat aaggaagttc 1320 atttcatttg gagaggacac gctcgagtat aagagctcat ttttacaaca attaccaaca 1380 acaacaaaca acaaacaaca ttacaattac atttacaatt atcgatac 1428 <210> 124 <211> 839 <212> DNA <213> Artificial Sequence <220> <223> promoter <400> 124 gtcaacatgg tggagcacga cactctggtc tactccaaaa atgtcaaaga tacagtctca 60 gaagatcaaa gggctattga gacttttcaa caaaggataa tttcgggaaa cctcctcgga 120 ttccattgcc cagctatctg tcacttcatc gaaaggacag tagaaaagga aggtggctcc 180 tacaaatgcc atcattgcga taaaggaaag gctatcattc aagatctctc tgccgacagt 240 ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga ggttccaacc 300 acgtctacaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac tctggtctac 360 tccaaaaatg tcaaagatac agtctcagaa gatcaaaggg ctattgagac ttttcaacaa 420 aggataattt cgggaaacct cctcggattc cattgcccag ctatctgtca cttcatcgaa 480 aggacagtag aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggct 540 atcattcaag atctctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600 atcgtggaaa aagaagaggt tccaaccacg tctacaaagc aagtggattg atgtgacatc 660 tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720 taaggaagtt catttcattt ggagaggaca cgctcgagta taagagctca tttttacaac 780 aattaccaac aacaacaaac aacaaacaac attacaatta catttacaat tatcgatac 839 <210> 125 <211> 172 <212> PRT <213> Tombusvirus <400> 125 Met Glu Arg Ala Ile Gln Gly Asn Asp Ala Arg Glu Gln Ala Asn Ser 1 5 10 15 Glu Arg Trp Asp Gly Gly Ser Gly Ser Ser Thr Ser Pro Phe Gln Leu 20 25 30 Pro Asp Glu Ser Pro Ser Trp Thr Glu Trp Arg Leu His Asn Asp Glu 35 40 45 Thr Asn Ser Asn Gln Asp Asn Pro Leu Gly Phe Lys Glu Ser Trp Gly 50 55 60 Phe Gly Lys Val Val Phe Lys Arg Tyr Leu Arg Tyr Glu Arg Thr Glu 65 70 75 80 Thr Ser Leu His Arg Val Leu Gly Ser Trp Thr Gly Asp Ser Val Asn 85 90 95 Tyr Ala Ala Ser Arg Phe Phe Gly Val Asn Gln Ile Gly Cys Thr Tyr 100 105 110 Ser Ile Arg Phe Arg Gly Val Ser Val Thr Ile Ser Gly Gly Ser Arg 115 120 125 Thr Leu Gln His Leu Cys Glu Met Ala Ile Arg Ser Lys Gln Glu Leu 130 135 140 Leu Gln Leu Thr Pro Val Glu Val Glu Ser Asn Val Ser Arg Gly Cys 145 150 155 160 Pro Glu Gly Val Glu Thr Phe Glu Glu Glu Ser Glu 165 170 <210> 126 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 126 Leu His Asn Asp Glu Thr Asn Ser Asn Gln Asp Asn Pro Leu Gly Phe 1 5 10 15 Lys <210> 127 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 127 Val Leu Gly Ser Trp Thr Gly Asp Ser Val Asn Tyr Ala Ala Ser Arg 1 5 10 15 <210> 128 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 128 Ile Asn Ser Cys Tyr Pro Leu Phe Glu Gln Asp Glu Tyr Gln Glu Leu 1 5 10 15 Phe Arg <210> 129 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 129 Gln Leu Glu Glu Ala His Asp Ala Gln Arg 1 5 10 <210> 130 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 130 Glu Ala Leu Thr Val Asp Pro Ala Lys 1 5 <210> 131 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 131 Thr Phe Thr Ala Asp Tyr Gln Gly Gln Pro Gly Lys 1 5 10 <210> 132 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 132 Leu Pro Lys Leu Asn Leu Val Thr Gly Phe Glu Thr Tyr Leu Gly Asn 1 5 10 15 Phe Arg <210> 133 <211> 28 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 133 Met Met Glu Gln Met Ala Val Pro Cys Ser Leu Leu Ser Asp Pro Ser 1 5 10 15 Glu Val Leu Asp Thr Pro Ala Asp Gly His Tyr Arg 20 25 <210> 134 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 134 Met Tyr Ser Gly Gly Thr Thr Gln Gln Glu Met Lys 1 5 10 <210> 135 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 135 Glu Ala Pro Asp Ala Ile Asp Thr Leu Leu Leu Gln Pro Trp Gln Leu 1 5 10 15 Leu Lys <210> 136 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 136 Phe Gly Leu Tyr Gly Asp Pro Asp Phe Val Met Gly Leu Thr Arg 1 5 10 15 <210> 137 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 137 Asp Ser Glu Val Phe Ile Asn Cys Asp Leu Trp His Phe Arg 1 5 10 <210> 138 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 138 Gln Pro Asp Phe Met Ile Gly Asn Ser Tyr Gly Lys 1 5 10 <210> 139 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 139 Ala Phe Glu Val Pro Leu Ile Arg 1 5 <210> 140 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 140 Leu Gly Phe Pro Leu Phe Asp Arg 1 5 <210> 141 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 141 Gln Thr Thr Trp Gly Tyr Glu Gly Ala Met Asn Ile Val Thr Thr Leu 1 5 10 15 Val Asn Ala Val Leu Glu Lys 20 <210> 142 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 142 Leu Asp Ser Asp Thr Ser Gln Leu Gly Lys 1 5 10 <210> 143 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 143 Thr Asp Tyr Ser Phe Asp Leu Val Arg 1 5 <210> 144 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 144 Leu Gly Thr Gln Met Ile His Phe Val Pro Arg 1 5 10 <210> 145 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 145 Met Thr Val Ile Glu Tyr Asp Pro Ala Cys Lys 1 5 10 <210> 146 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 146 Val Met Ile Val Gly Cys Asp Pro Lys 1 5 <210> 147 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 147 Cys Ala Glu Ser Gly Gly Pro Glu Pro Gly Val Gly Cys Ala Gly Arg 1 5 10 15 <210> 148 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 148 Ser Thr Thr Thr Gln Asn Leu Val Ala Ala Leu Ala Glu Met Gly Lys 1 5 10 15 <210> 149 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 149 Ser Thr Thr Thr Gln Asn Leu Val Ala Ala Leu Ala Glu Met Gly Lys 1 5 10 15 Lys <210> 150 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 150 Gln Thr Asp Arg Glu Asp Glu Leu Ile Ile Ala Leu Ala Glu Lys 1 5 10 15 <210> 151 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 151 Ala Gln Glu Ile Tyr Ile Val Cys Ser Gly Glu Met Met Ala Met Tyr 1 5 10 15 Ala Ala Asn Asn Ile Ser Lys 20 <210> 152 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 152 Ala Val Gln Gly Ala Pro Thr Met Arg 1 5 <210> 153 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 153 Leu Gly Gly Leu Ile Cys Asn Ser Arg 1 5 <210> 154 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 154 Ala Gln Asn Thr Ile Met Glu Met Ala Ala Glu Val Gly Ser Val Glu 1 5 10 15 Asp Leu Glu Leu Glu Asp Val Leu Gln Ile Gly Tyr Gly Asp Val Arg 20 25 30 <210> 155 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 155 Leu Cys Leu Ser Thr Asn Gly Leu Val Leu Pro Asp Ala Val Asp Arg 1 5 10 15 <210> 156 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 156 Phe Ala Ala Ile Leu Glu Leu Leu Ala Asp Val Lys 1 5 10 <210> 157 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 157 Gly Glu Ser Glu Ala Asp Asp Ala Cys Leu Val Ala Val Ala Ser Ser 1 5 10 15 Arg <210> 158 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 158 Ala Val Gln Gly Ala Pro Thr Ser Cys Ser Ser Phe Ser Gly Gly Lys 1 5 10 15 <210> 159 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 159 Ile Asn Ser Val Leu Ile Pro Gly Ile Asn Asp Ser Gly Met Ala Gly 1 5 10 15 Val Ser Arg <210> 160 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 160 Gln Val Ala Gln Ala Ile Pro Gln Leu Ser Val Val Gly Ile Ala Gly 1 5 10 15 Pro Gly Asp Pro Leu Ala Asn Ile Ala Arg 20 25 <210> 161 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 161 Ile Ala Gly Glu Leu Leu Pro Gly Val Phe His Val Ser Ala Arg 1 5 10 15 <210> 162 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 162 Gly Thr Ala Gln Asn Pro Asp Ile Tyr Phe Gln Glu Arg 1 5 10 <210> 163 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 163 Ile Pro Phe Val Asn Phe Phe Asp Gly Phe Arg 1 5 10 <210> 164 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 164 Ile Glu Val Leu Glu Tyr Glu Gln Leu Ala Thr Leu Leu Asp Arg Pro 1 5 10 15 Ala Leu Asp Ser Phe Arg 20 <210> 165 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 165 Ser Gly Gly Ile Thr Val Ser His Leu Arg 1 5 10 <210> 166 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 166 Glu Lys Glu Ile Asp Tyr Val Val Ala Thr Leu Pro Pro Ile Ile Asp 1 5 10 15 Arg <210> 167 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 167 Glu Ile Asp Tyr Val Val Ala Thr Leu Pro Pro Ile Ile Asp Arg 1 5 10 15 <210> 168 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 168 Ile Ala Val Asp Gly Glu Gly Ala Leu Asp Met Ala Gln Phe Arg 1 5 10 15 <210> 169 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 169 Glu Ile Ile Thr Ser Val Val Glu His Pro Ala Thr Leu Ala Ala Cys 1 5 10 15 Glu His Met Glu Arg 20 <210> 170 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 170 Ile Asp Met Leu Ser Cys Ser Ala His Lys 1 5 10 <210> 171 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 171 Ala Met Asn Ile Pro Tyr Thr Ala Ala His Gly Thr Ile Arg 1 5 10 <210> 172 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 172 Gln Val Tyr Leu Asp Asn Asn Ala Thr Thr Arg 1 5 10 <210> 173 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 173 Ile Pro Ile Ala Val Gly Gln Thr Arg 1 5 <210> 174 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 174 Gly Val Gly Cys Leu Tyr Leu Arg 1 5 <210> 175 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 175 Val Pro Ala Asp Thr Thr Ile Val Gly Leu Leu Gln Glu Ile Gln Leu 1 5 10 15 Tyr Trp Tyr Asp Lys 20 <210> 176 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 176 Gln Phe Asp Met Val His Ser Asp Glu Trp Ser Met Lys 1 5 10 <210> 177 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 177 Val Val Asp Phe Ser Val Glu Asn Gly His Gln Thr Glu Lys 1 5 10 <210> 178 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 178 Arg Ala Gly Asp Tyr Lys Asp Asp Asp Asp Lys Pro Gly 1 5 10 <210> 179 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 179 Ala Arg Gly Asp Tyr Lys Asp Asp Asp Asp Lys Pro Gly 1 5 10 <210> 180 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 180 His Val Asp Gln His Phe Gly Ala Thr Pro Arg 1 5 10 <210> 181 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 181 Val Ala Phe Ala Ser Ser Asp Tyr Arg 1 5 <210> 182 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 182 Leu Leu Gln Glu Gln Glu Trp His Gly Asp Pro Asp Pro Arg 1 5 10 <210> 183 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 183 Leu Ala Ser Trp Leu Glu Glu Ile Lys Arg 1 5 10 <210> 184 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 184 Val Leu Gly Ser Trp Thr Gly Asp Ser Val Asn Tyr Ala Ala Ser Arg 1 5 10 15 <210> 185 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 185 Gln Leu Gly Glu Leu Ala Asp Ala Pro Val Asn Ile Asn Arg 1 5 10 <210> 186 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> peptide <400> 186 Phe Val Gly Leu Val Leu Asp Gln Asp Asn Gln Phe Asp Gln Thr Glu 1 5 10 15 Ala Arg

Claims

미토콘드리아 및
(i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP),
(ii) N-말단 및 C-말단을 갖는 NifD 폴리펩티드(ND),
(iii) 올리고펩티드 링커(linker), 및
(iv) N-말단을 갖는 NifK 폴리펩티드(NK)
를 포함하는 융합 폴리펩티드를 포함하는 식물 세포로서,
MTP의 C-말단이 ND의 N-말단에 번역에 의해 융합되고, 링커가 ND의 C-말단 및 NK의 N-말단에 번역에 의해 융합되는 식물 세포.
제1항에 있어서,
융합 폴리펩티드의 C-말단이 NK의 C-말단이고, 임의로 NK의 C-말단이 야생형 NifK C-말단인 식물 세포.
제2항 또는 제3항에 있어서,
올리고펩티드 링커는 길이가 8 내지 50 아미노산인 식물 세포.
제1항 내지 제3항 중 어느 한 항에 있어서,
융합 폴리펩티드 중의 NifD 폴리펩티드 및 NifK 폴리펩티드가, 2개의 별도의 폴리펩티드로서 존재하는 경우의 NifD 폴리펩티드 및 NifK 폴리펩티드와 동일한 기능을 갖는 식물 세포.
미토콘드리아 및
(i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP),
(ii) N-말단 및 C-말단을 갖는 NifE 폴리펩티드(NE),
(iii) 올리고펩티드 링커, 및
(iv) N-말단을 갖는 NifN 폴리펩티드(NN)
를 포함하는 융합 폴리펩티드를 포함하는 식물 세포로서,
MTP의 C-말단이 NE의 N-말단에 번역에 의해 융합되고, 링커가 NE의 C-말단 및 NN의 N-말단에 번역에 의해 융합되는 식물 세포.
제5항에 있어서,
올리고펩티드 링커는 길이가 적어도 약 20 아미노산, 또는 적어도 약 30 아미노산, 또는 적어도 약 40 아미노산, 또는 약 20 아미노산 내지 약 70 아미노산, 또는 약 30 아미노산 내지 약 70 아미노산, 또는 약 30 아미노산 내지 약 60 아미노산, 또는 약 30 아미노산 내지 약 50 아미노산, 또는 약 25 아미노산, 또는 약 30 아미노산, 또는 약 35 아미노산, 또는 약 40 아미노산, 또는 약 45 아미노산, 또는 약 46 아미노산, 또는 약 50 아미노산, 또는 약 55 아미노산인 식물 세포.
제5항 또는 제6항에 있어서,
융합 폴리펩티드 중의 NifE 폴리펩티드 및 NifN 폴리펩티드가 2개의 별도의 폴리펩티드로서 존재하는 경우의 NifE 폴리펩티드 및 NifN 폴리펩티드와 동일한 기능을 갖는, 바람직하게는 각각 야생형 NifE 폴리펩티드 및 야생형 NifN 폴리펩티드와 동일한 기능을 갖는 식물 세포.
제1항 내지 제7항 중 어느 한 항에 있어서,
MTP가, 융합 폴리펩티드가 기질 가공 프로테아제(MPP)에 의해 절단되어 N-말단 절단 펩티드 및 (ii) 내지 (iv)를 포함하는 가공된 융합 폴리펩티드(CF)를 생성시킬 수 있도록 MPP에 대한 프로테아제 절단 부위를 포함하는 식물 세포.
제8항에 있어서,
CF가 MTP의 C-말단 아미노산 중 전부는 아닌 일부, 바람직하게는 MTP의 C-말단 아미노산 중 5 내지 45 아미노산을 포함하는 식물 세포.
제1항 내지 제9항 중 어느 한 항에 있어서,
MTP가 F1-ATPase γ-서브유닛 MTP의 약 51 아미노산을 포함하는 식물 세포.
제1항 내지 제10항 중 어느 한 항에 있어서,
하나 이상의 NF 융합 폴리펩티드(NF)를 추가로 포함하며, 각각의 NF가 (i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP) 및 (ii) N-말단을 갖는 Nif 폴리펩티드(NP)를 포함하고, MTP의 C-말단이 NP의 N-말단에 번역에 의해 융합되며, 각각의 MTP가 독립적으로 동일하거나 상이하고 각각의 NP가 독립적으로 동일하거나 상이하며, 미토콘드리아가 하나 이상의 NF 및/또는 그의 가공된 생성물(CF)을 포함하고, 각각의 CF가, 존재하는 경우, 그의 MTP 내의 상응하는 NF의 절단에 의해 생성되는 식물 세포.
제11항에 있어서,
NF 폴리펩티드 중 적어도 하나가 NifH인 식물 세포.
제1항 내지 제12항 중 어느 한 항에 있어서,
미토콘드리아가 (i) NifD, NifH, NifK, NifB, NifE 및 NifN, 또는 (ii) NifD, NifH, NifK 및 NifS로 이루어진 그룹 중에서 선택된 하나, 적어도 2개, 적어도 3개, 적어도 4개, 또는 모든 Nif 폴리펩티드를 포함하는 식물 세포.
제1항 내지 제13항 중 어느 한 항에 있어서,
MTP가 적어도 10 아미노산, 바람직하게는 10 내지 80 아미노산을 포함하는 식물 세포.
제1항 내지 제14항 중 어느 한 항에 있어서,
MTP 중 적어도 하나, 또는 그 이상, 또는 전부가 미토콘드리아 단백질 전구체의 MTP, 또는 그의 변이체(variant), 바람직하게는 식물 MTP를 포함하는 식물 세포.
제1항 내지 제15항 중 어느 한 항에 있어서,
융합 폴리펩티드(들)를 암호화하는 외인성 폴리뉴클레오티드(들)가 세포의 핵 게놈(nuclear genome)에 통합되는 식물 세포.
제1항 내지 제16항 중 어느 한 항에 있어서,
아라비도프시스 탈리아나(Arabidopsis thaliana) 원형질체 이외의 세포인 식물 세포.
제1항 내지 제17항 중 어느 한 항에 따른 세포를 포함하는 트랜스제닉 식물(transgenic plant)로서, 융합 폴리펩티드(들)를 암호화하는 하나 이상의 외인성 폴리뉴클레오티드(들)에 대해 트랜스제닉인 트랜스제닉 식물.
제18항에 있어서,
외인성 폴리뉴클레오티드 중 하나, 하나 이상, 또는 전부가 식물의 뿌리에서 발현되는, 바람직하게는 식물의 잎에서보다는 식물의 뿌리에서 더 큰 수준으로 발현되는 트랜스제닉 식물.
제18항 또는 제19항에 있어서,
밀, 벼, 옥수수, 라이밀(triticale), 귀리, 또는 보리와 같은 곡류 식물, 바람직하게는 밀인 트랜스제닉 식물.
제18항 내지 제20항 중 어느 한 항에 있어서,
외인성 폴리뉴클레오티드(들)에 대해 동형접합성 또는 이형접합성인 트랜스제닉 식물.
제19항 내지 제21항 중 어느 한 항에 있어서,
현장에서 재배 중인 트랜스제닉 식물.
현장에서 재배 중인, 적어도 100개의 제18항 내지 제22항 중 어느 한 항에 따른 식물의 집단.
(i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP),
(ii) N-말단 및 C-말단을 갖는 NifD 폴리펩티드(ND),
(iii) 올리고펩티드 링커, 및
(ii) N-말단을 갖는 NifK 폴리펩티드(NK)
를 포함하는 융합 폴리펩티드로서,
MTP의 C-말단이 ND의 N-말단에 번역에 의해 융합되고, 링커가 ND의 C-말단 및 NK의 N-말단에 번역에 의해 융합되는 융합 폴리펩티드.
제24항에 있어서,
융합 폴리펩티드의 C-말단이 NK의 C-말단이고, 임의로 NK의 C 말단이 야생형 NifK C 말단인 융합 폴리펩티드.
(i) C-말단을 갖는 미토콘드리아 표적화 펩티드(MTP),
(ii) N-말단 및 C-말단을 갖는 NifE 폴리펩티드(NE),
(iii) 올리고펩티드 링커, 및
(ii) N-말단을 갖는 NifN 폴리펩티드(NN)
를 포함하는 융합 폴리펩티드로서,
MTP의 C-말단이 NE의 N-말단에 번역에 의해 융합되고, 링커가 NE의 C-말단 및 NN의 N-말단에 번역에 의해 융합되는 융합 폴리펩티드.
제26항에 있어서,
올리고펩티드 링커는 길이가 약 46 아미노산인 융합 폴리펩티드.
제24항 내지 제27항 중 어느 한 항에 있어서,
융합 폴리펩티드(들)가 기질 가공 프로테아제(MPP)에 의해 절단되어 (ii) 내지 (iv)를 포함하는 하나 이상의 가공된 Nif 폴리펩티드 생성물을 생성시킬 수 있는 융합 폴리펩티드(들).
제24항 내지 제28항 중 어느 한 항에 있어서,
식물 세포 또는 세균 세포, 바람직하게는 식물 세포의 미토콘드리아 중에 존재하는 융합 폴리펩티드(들).
융합 폴리펩티드(들)의 MTP 내에서 절단에 의해 제24항 내지 제29항 중 어느 한 항에 따른 융합 폴리펩티드(들)로부터 생성된, 가공된 Nif 폴리펩티드.
제30항에 있어서,
식물 세포의 미토콘드리아 기질 중에서 MPP에 의한 융합 폴리펩티드의 절단에 의해 생성된, 가공된 Nif 폴리펩티드.
제30항 또는 제31항에 있어서,
식물 세포 또는 세균 세포, 바람직하게는 식물 미토콘드리아, 보다 바람직하게는 식물 세포 미토콘드리아의 미토콘드리아 기질(MM) 중에 존재하는 가공된 Nif 폴리펩티드.
제24항 내지 제29항 중 어느 한 항에 있어서,
임의로 세균 세포 중에서 측정된 바와 같은, 상응하는 야생형 Nif 폴리펩티드와 동일한 생화학적 활성을 갖는, 바람직하게는 상응하는 야생형 Nif 폴리펩티드와 대략 동일한 수준의 생화학적 활성을 갖는 융합 폴리펩티드(들) 또는 가공된 Nif 폴리펩티드.
제24항 내지 제29항 중 어느 한 항에 따른 융합 폴리펩티드 중 하나, 하나 이상을 암호화하는 폴리뉴클레오티드.
제34항에 있어서,
세균에서 상응하는 Nif 단백질을 암호화하는 천연-생성 폴리뉴클레오티드에 비해, 식물 세포에서의 발현을 위해 코돈-변형된(codon-modified) 폴리뉴클레오티드.
제34항 또는 제35항에 있어서,
폴리뉴클레오티드에 작동적으로 연결된 프로모터를 추가로 포함하는 폴리뉴클레오티드.
제34항 내지 제36항 중 어느 한 항에 있어서,
식물 세포 또는 세균 세포 중에 존재하는, 바람직하게는 식물 세포의 핵 게놈에 통합된 폴리뉴클레오티드.
제34항 내지 제37항 중 어느 한 항에 따른 폴리뉴클레오티드를 포함하거나 암호화하는 키메릭 벡터.
제18항 내지 제22항 중 어느 한 항에 따른 트랜스제닉 식물의 생성 방법으로서,
i) 제34항 내지 제37항 중 어느 한 항에 따른 폴리뉴클레오티드, 및/또는 제38항에 따른 벡터를 식물의 세포 내로 도입시키고,
ii) 상기 세포로부터 트랜스제닉 식물을 재생시키고,
iii) 임의로 상기 식물로부터 종자를 수확(harvesting)하고, 및/또는
iv) 임의로 상기 트랜스제닉 식물로부터 하나 이상의 자손 식물(progeny plant)을 생성시킴으로써 트랜스제닉 식물을 생성시키는
단계들을 포함하는 방법.
제18항 내지 제22항 중 어느 한 항에 따른 식물의 식물 부분.
제40항에 있어서,
제34항 내지 제37항 중 어느 한 항에 따른 폴리뉴클레오티드를 포함하는 종자인 식물 부분.
종자로부터 수득된 밀가루, 통밀, 전분, 오일, 종실박(seedmeal) 또는 다른 생성물의 생성 방법으로서,
a) 제41항의 종자를 수득하고,
b) 밀가루, 통밀, 전분, 오일 또는 다른 생성물을 추출하거나, 또는 종실박을 생성시킴
을 포함하는 방법.
제18항 내지 제22항 중 어느 한 항에 따른 식물 및/또는 제40항 또는 제41항에 따른 식물 부분으로부터 생성된 생성물.
식품 생성물의 제조 방법으로서, 제41항의 종자, 또는 상기 종자로부터의 밀가루, 통밀, 또는 전분을 또 다른 식품 성분과 혼합함을 포함하는 방법.