KR20220039797A

KR20220039797A - 피레노이드-유사 구조

Info

Publication number: KR20220039797A
Application number: KR1020227006860A
Authority: KR
Inventors: 알리스테어 제임스 맥코믹; 니콜라 제인 앳킨슨
Original assignee: 더 유니버시티 코트 오브 더 유니버시티 오브 에딘버그
Priority date: 2019-08-02
Filing date: 2020-07-31
Publication date: 2022-03-29
Also published as: CN114466928A; JP2022542372A; BR112022001371A2; GB201911068D0; CA3145850A1; AR119558A1; US20220282268A1; AU2020325675A1; EP4007770A1; WO2021023982A1

Abstract

본 개시의 양태는 변형된 루비스코 및 EPYC1 폴리펩티드의 응집체를 형성하기 위한 변형된 루비스코 및 추가로 변형된 필수 피레노이드 성분 1(EPYC1)을 갖는 유전적으로 변경된 식물에 관한 것이다. 본 개시의 다른 양태는 이러한 식물 뿐만 아니라 생산할 뿐만 아니라 이들 유전적으로 변경된 식물을 재배하는 방법에 관한 것이다.

Description

피레노이드-유사 구조

관련 출원의 전후 참조

본 출원은 2019년 8월 2일에 출원된 영국 출원 번호 1911068.3의 이익을 주장하며, 이는 전문이 본원에 참조로 포함된다.

ASCII 텍스트 파일 형식으로 서열 목록의 제출

하기 제출된 ASCII 텍스트 파일 형식의 내용물은 전문이 본원에 참조로 포함된다: 서열 목록의 컴퓨터 판독 가능한 형태(CRF)(파일명: 794542000841SEQLIST.TXT, 기록일: 2020년 7월 15일, 크기: 175 KB).

기술 분야

본 개시는 유전적으로 변경된 식물에 관한 것이다. 특히, 본 개시는 변형된 루비스코(Rubisco) 및 EPYC1 폴리펩티드의 응집체를 형성하기 위한 변형된 루비스코 및 변형된 필수 피레노이드 성분 1(Essential Pyrenoid Component 1)(EPYC1)을 갖는 유전적으로 변경된 식물에 관한 것이다.

시아노박테리아, 조류 및 뿔이끼류라고 하는 육상 식물의 군을 포함하는 여러 광합성 유기체는 리불로스 1,5-바이포스페이트 카르복실라제 옥시게나제(루비스코) 주변의 CO₂ 농도를 적극적으로 증가시키는 생물물리학적 CO₂-농축 메커니즘(CCM)을 진화시켰다. CCM은 루비스코가 CO₂에 대한 친화성이 비교적 낮고 회전율이 느리기 때문에 루비스코 효율을 개선시킨다. 조류 CCM은 원형질막과 엽록체 외피에서 무기 탄소(Ci) 수송체를 포함하며, 이들은 함께 작용하여 엽록체의 액체-유사 소기관인 피레노이드 내의 루비스코에 주위 농도 이상의 CO₂를 전달한다.

쌀, 밀 및 대두와 같은 주요 작물을 포함하는 고등 식물에서 가장 일반적인 형태의 CO₂ 동화는 C₃ 광합성이다. C₃ 광합성에서, 엽록체로의 CO₂ 전달은 수동 확산에 의해 발생하며, 이는 광합성 효율을 제한한다. 더욱이, 루비스코(광호흡)에 의해 촉매되는 O₂와의 경쟁적인 부반응은 C₃ 식물에서 최대 50%의 생산성 손실을 초래할 수 있는 것으로 추정되었다(South, et al., JIPB (2018) 60: 1217-1230). 조류 CCM 메커니즘을 고등 식물로 옮기면 광범위한 형태학적 또는 유전적 변화를 요구하지 않고 C₃ 광합성의 많은 비효율성을 해결할 것이다. 실제로, 조류 CCM의 주요 성분은 고등 식물에서 정확하게 국한되는 것으로 나타났다(Atkinson, et al., Plant Biotech. J. (2016) 14: 1302-1315).

CO₂가 CCM에서 효과적으로 농축기 위해서는 루비스코가 응집되어야 한다. 녹조류 클라미도모나스 레인하드티이(Chlamydomonas reinhardtii)의 피레노이드는 피레노이드에서 루비스코를 응집시키는 역할을 하는 루비스코 링커 단백질인 필수 피레노이드 성분 1(EPYC1)을 포함한다(Mackinder, et al., PNAS (2016) 113: 5958-5963). C. 레인하드티이의 루비스코 및 EPYC1은 피레노이드의 액체-액체 상 분리 특성을 유도하는데 필요하고 충분한 것으로 나타났다(Wunder, et al., Nat. Commun. (2018) 9: 5076). C. 레인하드티이의 루비스코 작은 서브유닛(SSU, rbcS 핵 유전자 패밀리에 의해 인코딩됨)은 SSU-결핍이 심한 A. 탈리아나(A. thaliana) 돌연변이체를 보완할 수 있다(Atkinson, et al., New Phyt. (2017) 214: 655-667). C. 레인하드티이 SSU를 발현하는 식물은 고등 식물 루비스코 큰 서브유닛(LSU) 및 C. 레인하드티이 루비스코 SSU를 포함하는 하이브리드 루비스코를 조립할 수 있으며, 이 하이브리드 루비스코는 내인성 A. 탈리아나 루비스코와 비교하여 단지 약간만 손상된 루비스코 기능을 갖는다. 또한, 하이브리드 루비스코를 갖는 식물은 야생형 식물과 유사한 식물 성장을 갖는다. 더욱이, 하이브리드 루비스코를 갖는 식물은 A. 탈리아나 SSU로 보완된 SSU-결핍이 심한 A. 탈리아나 돌연변이체와 유사한 전체 루비스코 수준을 갖는다. 대조적으로, 담배 루비스코를 시아노박테리아 루비스코로 대체하면, CO₂에 대한 시아노박테리아 루비스코의 낮은 친화성 및 낮은 발현 수준으로 인해, 크게 상승된 CO₂ 농도에서 성장시킨 경우에도 성장이 더딘 트랜스플라스토믹(transplastomic) 식물이 생산되었다(Lin, et al., Nature (2014) 513: 547-550; Occhialini, et al., Plant J. (2016) 85: 148-160; Long, et al., Nat. Commun. (2018) 9: 3570).

하이브리드 루비스코를 갖는 조작 식물의 성공에도 불구하고, 고등 식물에서 루비스코를 응집시키려는 시도는 성공하지 못했다. 이전에 시험된 조류 CCM 성분과 달리, C. 레인하드티이 EPYC1은 고등 식물에서 발현될 때 엽록체에 국한될 수 없었다. 또한, EPYC1이 하이브리드 루비스코를 갖는 식물에서 발현되었을 때, 응집체는 관찰되지 않았다. EPYC1에 고등 식물 엽록체-표적화 펩티드를 첨가하면 EPYC1은 정확하게 국한되지만, EPYC1이 엽록체에 국한되었을 때에도 루비스코 응집체는 관찰되지 않았다.

간단한 개요

놀랍게도, 내인성 EPYC1 선도 서열의 제거 및 이 선도 서열을 더 잘 처리된 이종성 선도 서열로 대체하는 것이 고등 식물에서 관찰 가능한 EPYC1 응집체를 생성하는 것으로 밝혀졌다. 이중 종결인자의 사용과 같은 추가 변형으로 인한 EPYC1의 발현 증가는 EPYC1 응집을 더욱 개선시켰다. 또한, 놀랍게도 C. 레인하드티이 루비스코 SSU α-나선, 및 선택적으로 β-시트 및 βA-βB 루프가 고등 식물에서 EPYC1 응집체를 관찰하는데 필요하고 충분하다는 것이 밝혀졌다. 본 발명자들에 의해 확인된, 놀라운 신규한 변형된 EPYC1 및 필요한 C. 레인하드티이 루비스코 SSU 구조적 모티프는 본 개시의 많은 양태 및 이들의 다양한 구체예에 대한 기초로서 작용한다.

본 개시의 양태는 변형된 루비스코 및 필수 피레노이드 성분 1(EPYC1) 폴리펩티드의 응집체를 형성하기 위한 변형된 루비스코를 포함하는 유전적으로 변경된 고등 식물 또는 이의 일부를 포함한다. 이 양태의 추가 구체예에서, 변형된 루비스코는 조류 루비스코 작은 서브유닛(SSU) 폴리펩티드 또는 변형된 고등 식물 루비스코 SSU 폴리펩티드이고, 여기서 고등 식물 루비스코 SSU 폴리펩티드의 적어도 일부는 조류 루비스코 SSU 폴리펩티드의 적어도 일부로 대체된다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, 유전적으로 변경된 고등 식물 또는 이의 일부는 EPYC1 폴리펩티드 및 응집체를 추가로 포함한다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 다른 구체예에서, 응집체는 공초점 현미경, 투과 전자 현미경(TEM), 저온-전자 현미경(cryo-EM) 또는 액체-액체 상 분리 검정에 의해 검출될 수 있다. 변형된 고등 식물 루비스코를 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 변형된 고등 식물 루비스코 폴리펩티드는 내인성 루비스코 SSU 폴리펩티드를 포함한다. 변형된 고등 식물 루비스코를 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 변형된 고등 식물 루비스코 SSU 폴리펩티드는 하나 이상의 고등 식물 루비스코 SSU α-나선을 하나 이상의 조류 루비스코 SSU α-나선으로 대체하고/하거나; 하나 이상의 고등 식물 루비스코 SSU β-가닥을 하나 이상의 조류 루비스코 SSU β-가닥으로 대체하고/거나; 고등 식물 루비스코 SSU βA-βB 루프를 조류 루비스코 SSU βA-βB 루프로 대체함으로써 변형되었다. 이 양태의 추가적인 구체예에서, 고등 식물 루비스코 SSU 폴리펩티드는 2개의 고등 식물 루비스코 SSU α-나선을 2개의 조류 루비스코 SSU α-나선으로 대체함으로써 변형된다. 이 양태의 추가 구체예에서, 2개의 고등 식물 루비스코 SSU α-나선은 SEQ ID NO: 1의 아미노산 23-35 및 아미노산 80-93에 상응하고, 2개의 조류 루비스코 SSU α-나선은 SEQ ID NO: 2의 아미노산 23-35 및 아미노산 86-99에 상응한다. 2개의 고등 식물 루비스코 SSU α-나선을 2개의 조류 루비스코 SSU α-나선으로 대체한 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 고등 식물 루비스코 SSU 폴리펩티드는 4개의 고등 식물 루비스코 SSU β-가닥을 4개의 조류 루비스코 SSU β-가닥으로 대체하고, 고등 식물 루비스코 SSU βA-βB 루프를 조류 루비스코 SSU βA-βB 루프로 대체함으로써 추가로 변형된다. 이 양태의 추가 구체예에서, 4개의 고등 식물 루비스코 SSU β-가닥은 SEQ ID NO: 1의 아미노산 39-45, 아미노산 68-70, 아미노산 98-105 및 아미노산 110-118에 상응하고, 4개의 조류 루비스코 SSU β-가닥은 SEQ ID NO: 2의 아미노산 39-45, 아미노산 74-76, 아미노산 104-111 및 아미노산 116-124에 상응하고, 고등 식물 루비스코 SSU βA-βB 루프는 SEQ ID NO: 1의 아미노산 46-67에 상응하고, 조류 루비스코 SSU βA-βB 루프는 SEQ ID NO: 2의 아미노산 46-73에 상응한다.

변형된 고등 식물 루비스코를 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 고등 식물 루비스코 SSU 폴리펩티드는 SEQ ID NO: 140, SEQ ID NO: 141, SEQ ID NO: 142, SEQ ID NO: 143, SEQ ID NO: 144, SEQ ID NO: 145, SEQ ID NO: 146, SEQ ID NO: 147, SEQ ID NO: 148, SEQ ID NO: 149, SEQ ID NO: 150, SEQ ID NO: 151, SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155 또는 SEQ ID NO: 156과 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는다. 변형된 고등 식물 루비스코를 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 조류 루비스코 SSU 폴리펩티드는 SEQ ID NO: 2, SEQ ID NO: 30, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 162, SEQ ID NO: 163 또는 SEQ ID NO: 164와 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는다. 이 양태의 추가적인 구체예에서, 조류 루비스코 SSU 폴리펩티드는 SEQ ID NO: 2, SEQ ID NO: 30, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 162, SEQ ID NO: 163 또는 SEQ ID NO: 164이다. 변형된 고등 식물 루비스코를 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, 변형된 고등 식물 루비스코 SSU 폴리펩티드는 변형이 없는 고등 식물 루비스코 SSU 폴리펩티드와 비교하여 EPYC1 폴리펩티드에 대해 증가된 친화성을 갖는다.

본 개시의 추가적인 양태에서, 유전적으로 변경된 고등 식물 또는 이의 일부는 변형된 루비스코 및 EPYC1 폴리펩티드의 응집체를 형성하기 위한 EPYC1 폴리펩티드를 포함한다. 전술한 임의의 양태의 추가 구체예에서, EPYC1 폴리펩티드는 조류 EPYC1 폴리펩티드이다. 이 양태의 추가적인 구체예에서, 조류 EPYC1 폴리펩티드는 SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 165, SEQ ID NO: 166 또는 SEQ ID NO: 167과 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 갖는다. 이 양태의 또 다른 구체예에서, 조류 EPYC1 폴리펩티드는 SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 165, SEQ ID NO: 166 또는 SEQ ID NO: 167이다. 전술한 임의의 양태의 또 다른 구체예에서, EPYC1 폴리펩티드는 변형된 EPYC1 폴리펩티드이다. 이 양태의 추가 구체예에서, 변형된 EPYC1 폴리펩티드는 제1 조류 EPYC1 반복 영역의 1개 이상, 2개 이상, 4개 이상 또는 8개의 직렬 카피를 포함한다. 이 양태의 추가적인 구체예에서, 변형된 EPYC1 폴리펩티드는 제1 조류 EPYC1 반복 영역의 4개의 직렬 카피 또는 8개의 직렬 카피를 포함한다. 변형된 EPYC1 폴리펩티드가 제1 조류 EPYC1 반복 영역의 직렬 카피를 포함하는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제1 조류 EPYC1 반복 영역은 SEQ ID NO: 36과 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드이다. 이 양태의 추가 구체예에서, 제1 조류 EPYC1 반복 영역은 SEQ ID NO: 36이다. 변형된 EPYC1을 포함하는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 변형된 EPYC1 폴리펩티드는 천연 EPYC1 선도 서열 없이 및/또는 C-말단 캡을 포함하여 발현된다. 이 양태의 또 다른 구체예에서, 천연 EPYC1 선도 서열은 SEQ ID NO: 42와 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드를 포함하고, C-말단 캡은 SEQ ID NO: 41과 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드를 포함한다. 이 양태의 추가 구체예에서, C-말단 캡은 SEQ ID NO: 41이다. 변형된 EPYC1을 포함하는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 변형된 EPYC1 폴리펩티드는 상응하는 변형되지 않은 EPYC1 폴리펩티드와 비교하여 루비스코 SSU 폴리펩티드에 대해 증가된 친화성을 갖는다.

전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 양태에서, 응집체는 식물 세포의 적어도 하나의 엽록체의 엽록체 기질에 국한된다. 이 양태의 추가 구체예에서, 식물 세포는 잎 엽육 세포이다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 식물은 동부, 대두, 카사바, 쌀, 콩, 밀 또는 다른 C₃ 작물의 군으로부터 선택된다.

본 개시의 추가 양태는 EPYC1 폴리펩티드를 인코딩하는 제1 핵산 서열 및 변형된 루비스코를 인코딩하는 제2 핵산 서열을 포함하는 유전적으로 변경된 고등 식물 또는 이의 일부를 포함한다. 이 양태의 추가 구체예에서, 제1 핵산 서열은 제1 프로모터에 작동 가능하게 연결된다. 이 양태의 추가 구체예에서, 제1 프로모터는 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 또는 엽육 세포 특정 프로모터의 군으로부터 선택된다. 이 양태의 또 다른 구체예에서, 제1 프로모터는 CaMV35S 프로모터, CaMV35S 프로모터의 유도체, CsVMV 프로모터, CsVMV 프로모터의 유도체, 옥수수 유비퀴틴 프로모터, 트레포일 프로모터, 엽맥 모자이크 카사바 바이러스 프로모터 및 A. 탈리아나 UBQ10 프로모터의 군으로부터 선택된 항시적 프로모터이다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제1 핵산 서열은 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1 핵산 서열은 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않는다. 이 양태의 추가적인 구체예에서, 엽록체의 전이 펩티드는 SEQ ID NO: 63과 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드이다. 이 양태의 또 다른 구체예에서, 엽록체의 전이 펩티드는 SEQ ID NO: 63이다. 천연 EPYC1 선도 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, 천연 EPYC1 선도 서열은 SEQ ID NO: 65의 뉴클레오티드 60-137에 상응한다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제1 핵산 서열은 1개 또는 2개의 종결인자에 작동 가능하게 연결된다. 이 양태의 추가 구체예에서, 1개 또는 2개의 종결인자는 HSP 종결인자, NOS 종결인자, OCS 종결인자, 인트론리스(intronless) 엑텐신 종결인자, 35S 종결인자, pinII 종결인자, rbcS 종결인자, 액틴 종결인자 또는 이들의 임의의 조합의 군으로부터 선택된다.

전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제2 핵산 서열은 제2 프로모터에 작동 가능하게 연결된다. 이 양태의 추가 구체예에서, 제2 프로모터는 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 또는 엽육 세포 특정 프로모터의 군으로부터 선택된다. 이 양태의 추가적인 구체예에서, 제2 프로모터는 CaMV35S 프로모터, CaMV35S 프로모터의 유도체, CsVMV 프로모터, CsVMV 프로모터의 유도체, 옥수수 유비퀴틴 프로모터, 트레포일 프로모터, 엽맥 모자이크 카사바 바이러스 프로모터 및 A. 탈리아나 UBQ10 프로모터의 군으로부터 선택된 항시적 프로모터이다. 제2 프로모터에 작동 가능하게 연결된 제2 핵산 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제2 핵산 서열은 조류 루비스코 SSU 폴리펩티드를 인코딩한다. 이 양태의 추가적인 구체예에서, 제2 핵산 서열은 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제4 핵산 서열에 작동 가능하게 연결되고, 상기 제2 핵산 서열은 천연 조류 SSU 선도 서열을 인코딩하지 않고 천연 조류 SSU 선도 서열을 인코딩하는 핵산 서열에 작동 가능하게 연결되지 않는다. 이 양태의 추가 구체예에서, 엽록체의 전이 펩티드는 SEQ ID NO: 64와 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드이다. 이 양태의 또 다른 구체예에서, 엽록체의 전이 펩티드는 SEQ ID NO: 64이다. 천연 조류 SSU 선도 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 천연 조류 SSU 선도 서열은 SEQ ID NO: 32의 아미노산 1 내지 45에 상응한다. 제2 프로모터에 작동 가능하게 연결된 제2 핵산 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, 제2 핵산 서열은 종결인자에 작동 가능하게 연결된다. 이 양태의 추가적인 구체예에서, 종결인자는 HSP 종결인자, NOS 종결인자, OCS 종결인자, 인트론리스 엑텐신 종결인자, 35S 종결인자, pinII 종결인자, rbcS 종결인자 또는 액틴 종결인자의 군으로부터 선택된다. 제2 프로모터에 작동 가능하게 연결된 제2 핵산 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제2 핵산 서열은 변형된 고등 식물 루비스코 SSU 폴리펩티드를 인코딩하고, 여기서 고등 식물 루비스코 SSU 폴리펩티드의 적어도 일부는 조류 루비스코 SSU 폴리펩티드의 적어도 일부로 대체된다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, EPYC1 폴리펩티드는 전술한 구체예 중 어느 하나의 EPYC1 폴리펩티드이다. 이 양태의 추가적인 구체예에서, 루비스코 SSU 폴리펩티드는 전술한 구체예 중 어느 하나의 루비스코 SSU 폴리펩티드이다.

전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 식물 또는 이의 일부의 적어도 하나의 세포는 루비스코 폴리펩티드 및 EPYC1 폴리펩티드의 응집체를 포함한다. 이 양태의 추가 구체예에서, 응집체는 적어도 하나의 식물 세포의 적어도 하나의 엽록체의 엽록체 기질에 국한된다. 이 양태의 추가적인 구체예에서, 식물 세포는 잎 엽육 세포이다. 루비스코 폴리펩티드 및 EPYC1 폴리펩티드의 응집체를 포함하는 식물 또는 이의 일부를 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 응집체는 공초점 현미경, 투과 전자 현미경(TEM), 저온-전자 현미경(cryo-EM) 또는 액체-액체 상 분리 검정에 의해 검출될 수 있다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 식물은 동부, 대두, 카사바, 쌀, 밀 또는 다른 C3 작물의 군으로부터 선택된다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, 유전적으로 변경된 고등 식물 세포는 전술한 구체예 중 어느 하나의 식물 또는 식물 부분으로부터 생산된다.

본 개시의 또 다른 양태는 a) EPYC1 폴리펩티드를 인코딩하는 제1 핵산 서열을 식물 세포, 조직 또는 다른 체외이식편에 도입하는 단계; b) 식물 세포, 조직 또는 다른 체외이식편을 유전적으로 변경된 소식물체로 재생시키는 단계; 및 c) 유전적으로 변경된 소식물체를 EPYC1 폴리펩티드를 인코딩하는 제1 핵산을 갖는 유전적으로 변경된 식물로 성장시키는 단계를 포함하는 전술한 임의의 구체예의 유전적으로 변경된 고등 식물을 생산하는 방법을 포함한다. 이 양태의 추가적인 구체예는 변형된 루비스코 SSU 폴리펩티드를 인코딩하는 제2 핵산 서열을 단계 (a) 이전에 또는 단계 (a)와 동시에 식물 세포, 조직 또는 다른 체외이식편에 도입하는 단계를 추가로 포함하고, 여기서 단계 (c)의 유전적으로 변경된 식물은 변형된 루비스코 SSU 폴리펩티드를 인코딩하는 제2 핵산을 추가로 포함한다. 이 양태의 추가적인 구체예는 단계 (b) 이전에 식물 세포, 조직 또는 다른 체외이식편을 스크리닝하거나 선택하거나; 단계 (b)와 (c) 사이에 소식물체를 스크리닝하거나 선택하거나; 단계 (c) 이후에 식물을 스크리닝하거나 선택함으로써 제1 핵산 서열 및 선택적으로 제2 핵산 서열의 성공적인 도입을 확인하는 단계를 추가로 포함한다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 형질전환은 입자 충격(즉, 유전자 주입(biolistics), 유전자 총), 아그로박테리움-매개 형질전환, 리조븀-매개 형질전환 및 원형질체 트랜스펙션 또는 형질전환의 군으로부터 선택된 형질전환 방법을 사용하여 수행된다.

전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제1 핵산 서열은 제1 벡터와 함께 도입되고, 제2 핵산 서열은 제2 벡터와 함께 도입된다. 이 양태의 추가 구체예에서, 제1 핵산 서열은 제1 프로모터에 작동 가능하게 연결된다. 이 양태의 추가적인 구체예에서, 제1 프로모터는 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 또는 엽육 세포 특정 프로모터의 군으로부터 선택된다. 이 양태의 또 다른 구체예에서, 제1 프로모터는 CaMV35S 프로모터, CaMV35S 프로모터의 유도체, CsVMV 프로모터, CsVMV 프로모터의 유도체, 옥수수 유비퀴틴 프로모터, 트레포일 프로모터, 엽맥 모자이크 카사바 바이러스 프로모터 또는 A. 탈리아나 UBQ10 프로모터의 군으로부터 선택된 항시적 프로모터이다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제1 핵산 서열은 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1 핵산 서열은 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않는다. 이 양태의 또 다른 구체예에서, 엽록체의 전이 펩티드는 SEQ ID NO: 63과 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드이다. 이 양태의 또 다른 구체예에서, 내인성 엽록체의 전이 펩티드는 SEQ ID NO: 63이다. 천연 EPYC1 선도 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 천연 EPYC1 선도 서열은 SEQ ID NO: 65의 뉴클레오티드 60 내지 137에 상응한다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, 제1 핵산 서열은 1개 또는 2개의 종결인자에 작동 가능하게 연결된다. 이 양태의 추가적인 구체예에서, 1개 또는 2개의 종결인자는 HSP 종결인자, NOS 종결인자, OCS 종결인자, 인트론리스 엑텐신 종결인자, 35S 종결인자, pinII 종결인자, rbcS 종결인자, 액틴 종결인자 또는 이들의 임의의 조합의 군으로부터 선택된다.

전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가적인 구체예에서, 제2 핵산 서열은 제2 프로모터에 작동 가능하게 연결된다. 이 양태의 추가 구체예에서, 제2 프로모터는 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 및 엽육 세포 특정 프로모터로 구성된 군으로부터 선택된다. 이 양태의 또 다른 구체예에서, 제2 프로모터는 CaMV35S 프로모터, CaMV35S 프로모터의 유도체, CsVMV 프로모터, CsVMV 프로모터의 유도체, 옥수수 유비퀴틴 프로모터, 트레포일 프로모터, 엽맥 모자이크 카사바 바이러스 프로모터 또는 A. 탈리아나 UBQ10 프로모터로 구성된 군으로부터 선택된 항시적 프로모터이다. 제2 프로모터에 작동 가능하게 연결된 제2 핵산 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제2 핵산 서열은 조류 SSU 폴리펩티드를 인코딩한다. 이 양태의 추가적인 구체예에서, 제2 핵산 서열은 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제4 핵산 서열에 작동 가능하게 연결되고, 상기 제2 핵산 서열은 천연 SSU 선도 서열을 인코딩하지 않고 천연 SSU 선도 서열을 인코딩하는 핵산 서열에 작동 가능하게 연결되지 않는다. 이 양태의 추가 구체예에서, 엽록체의 전이 펩티드는 SEQ ID NO: 64와 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드이다. 이 양태의 또 다른 구체예에서, 엽록체의 전이 펩티드는 SEQ ID NO: 64이다. 천연 SSU 선도 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가적인 구체예에서, 천연 SSU 선도 서열은 SEQ ID NO: 32의 아미노산 1 내지 45에 상응한다. 제2 프로모터에 작동 가능하게 연결된 제2 핵산 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제2 핵산 서열은 종결인자에 작동 가능하게 연결된다. 이 양태의 추가 구체예에서, 종결인자는 HSP 종결인자, NOS 종결인자, OCS 종결인자, 인트론리스 엑텐신 종결인자, 35S 종결인자, pinII 종결인자, rbcS 종결인자 또는 액틴 종결인자의 군으로부터 선택된다. 제2 프로모터에 작동 가능하게 연결된 제2 핵산 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, 제2 핵산 서열은 변형된 고등 식물 루비스코 SSU 폴리펩티드를 인코딩하고, 여기서 고등 식물 루비스코 SSU 폴리펩티드의 적어도 일부는 조류 루비스코 SSU 폴리펩티드의 적어도 일부로 대체된다.

제2 벡터를 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가적인 구체예에서, 제2 벡터는 내인성 루비스코 SSU 폴리펩티드를 인코딩하는 핵산에 작동 가능하게 연결된 핵 게놈 서열을 표적화하는 하나 이상의 유전자 편집 성분을 포함한다. 이 양태의 추가 구체예에서, 하나 이상의 유전자 편집 성분은 핵 게놈 서열을 표적화하는 리보핵단백질 복합체; TALEN 단백질 인코딩 서열을 포함하는 벡터(여기서 TALEN 단백질은 핵 게놈 서열을 표적화함); ZFN 단백질 인코딩 서열을 포함하는 벡터(여기서 ZFN 단백질은 핵 게놈 서열을 표적화함); 올리고뉴클레오티드 공여체(ODN)(여기서 ODN은 핵 게놈 서열을 표적화함); 또는 CRISPR/Cas 효소 인코딩 서열 및 표적화 서열을 포함하는 벡터(여기서 표적화 서열은 핵 게놈 서열을 표적화함)의 군으로부터 선택된다. 유전자 편집을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예는 고등 식물 루비스코 SSU 폴리펩티드의 적어도 일부가 조류 루비스코 SSU 폴리펩티드의 적어도 일부로 대체된 유전자 편집 결과를 포함한다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, EPYC1 폴리펩티드는 전술한 구체예 중 어느 하나의 EPYC1 폴리펩티드이다. 이 양태의 추가적인 구체예에서, 루비스코 SSU 폴리펩티드는 전술한 구체예 중 어느 하나의 루비스코 SSU 폴리펩티드이다.

고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결된 제1 핵산 서열로서, 상기 제1 핵산 서열이 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않은, 제1 핵산 서열 및 1개 또는 2개의 종결인자에 작동 가능하게 연결된 제1 핵산 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제1 벡터는 제1 핵산 서열의 제1 카피를 포함하고, 여기서 제1 핵산 서열은 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않고, 상기 제1 핵산 서열은 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1 핵산 서열은 제1 프로모터에 작동 가능하게 연결되고, 상기 제1 핵산 서열은 1개의 종결인자에 작동 가능하게 연결되며; 상기 제1 벡터는 제1 핵산 서열의 제2 카피를 추가로 포함하고, 여기서 제1 핵산 서열은 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않고, 상기 제1 핵산 서열은 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1 핵산 서열은 제3 프로모터에 작동 가능하게 연결되고, 상기 제1 핵산 서열은 2개의 종결인자에 작동 가능하게 연결된다. 이 양태의 추가 구체예에서, 제1 프로모터는 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 또는 엽육 세포 특정 프로모터의 군으로부터 선택되고; 제3 프로모터는 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 또는 엽육 세포 특정 프로모터의 군으로부터 선택되고; 상기 제1 및 제3 프로모터는 동일하지 않다. 이 양태의 또 다른 구체예에서, 엽록체의 전이 펩티드는 SEQ ID NO: 63과 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드이다. 이 양태의 또 다른 구체예에서, 천연 EPYC1 선도 서열은 SEQ ID NO: 65의 뉴클레오티드 60 내지 137에 상응한다. 이 양태의 추가적인 구체예에서, 종결인자는 HSP 종결인자, NOS 종결인자, OCS 종결인자, 인트론리스 엑텐신 종결인자, 35S 종결인자, pinII 종결인자, rbcS 종결인자, 액틴 종결인자 또는 이들의 임의의 조합의 군으로부터 선택된다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, 식물 또는 식물 부분은 전술한 구체예 중 어느 하나의 방법에 의해 생산된다.

본 개시의 추가 양태는 a) 유전적으로 변경된 묘목, 유전적으로 변경된 소식물체, 유전적으로 변경된 삽목, 유전적으로 변경된 괴경, 유전적으로 변경된 뿌리 또는 유전적으로 변경된 종자를 토양에 심어 유전적으로 변경된 식물을 생산하거나, 유전적으로 변경된 묘목, 유전적으로 변경된 소식물체 또는 유전적으로 변경된 삽목을 근경 또는 토양에서 성장한 제2 식물에 접목하여 유전적으로 변경된 식물을 생산하는 단계; b) 수확 가능한 종자, 수확 가능한 잎, 수확 가능한 뿌리, 수확 가능한 삽목, 수확 가능한 목재, 수확 가능한 과일, 수확 가능한 커널, 수확 가능한 괴경 및/또는 수확 가능한 곡물을 생산하도록 식물을 재배하는 단계; 수확 가능한 종자, 수확 가능한 잎, 수확 가능한 뿌리, 수확 가능한 삽목, 수확 가능한 목재, 수확 가능한 과일, 수확 가능한 커널, 수확 가능한 괴경 및/또는 수확 가능한 곡물을 수확하는 단계; 및 c) 수확 가능한 종자, 수확 가능한 잎, 수확 가능한 뿌리, 수확 가능한 삽목, 수확 가능한 목재, 수확 가능한 과일, 수확 가능한 커널, 수확 가능한 괴경 및/또는 수확 가능한 곡물을 수확하는 단계를 포함하는, 유전적으로 변경된 식물을 갖는 전술한 임의의 구체예의 유전적으로 변경된 식물을 재배하는 방법을 포함한다.

열거된 구체예

1. 필수 피레노이드 성분 1(EPYC1) 폴리펩티드 및 변형된 루비스코의 응집체를 형성하기 위한 변형된 루비스코를 포함하는 유전적으로 변경된 고등 식물 또는 이의 일부로서, 상기 변형된 루비스코가 조류 루비스코 작은 서브유닛(SSU) 폴리펩티드 또는 변형된 고등 식물 루비스코 SSU 폴리펩티드를 포함하고, 여기서 고등 식물 루비스코 SSU 폴리펩티드의 적어도 일부가 조류 루비스코 SSU 폴리펩티드의 적어도 일부로 대체된, 유전적으로 변경된 고등 식물 또는 이의 일부.

2. 구체예 1에 있어서, EPYC1 폴리펩티드 및 응집체를 추가로 포함하는 식물 또는 이의 일부.

3. 구체예 1에 있어서, 조류 루비스코 SSU 폴리펩티드를 포함하는 변형된 루비스코가 변형되지 않은 루비스코와 비교하여 EPYC1 폴리펩티드에 대해 증가된 친화성을 갖는 식물 또는 이의 일부.

4. 구체예 1에 있어서, 변형된 고등 식물 루비스코 SSU 폴리펩티드가 하나 이상의 고등 식물 루비스코 SSU α-나선을 하나 이상의 조류 루비스코 SSU α-나선으로 대체하고/하거나; 하나 이상의 고등 식물 루비스코 SSU β-가닥을 하나 이상의 조류 루비스코 SSU β-가닥으로 대체하고/하거나; 고등 식물 루비스코 SSU βA-βB 루프를 조류 루비스코 SSU βA-βB 루프로 대체함으로써 변형된 식물 또는 이의 일부.

5. 구체예 1에 있어서, 변형된 고등 식물 루비스코 SSU 폴리펩티드가 변형이 없는 고등 식물 루비스코 SSU 폴리펩티드와 비교하여 EPYC1 폴리펩티드에 대해 증가된 친화성을 갖는 식물 또는 이의 일부.

6. EPYC1 폴리펩티드 및 변형된 루비스코의 응집체를 형성하기 위한 EPYC1 폴리펩티드를 포함하는 유전적으로 변경된 고등 식물 또는 이의 일부.

7. 구체예 6에 있어서, EPYC1 폴리펩티드가 조류 EPYC1 폴리펩티드 또는 제1 조류 EPYC1 반복 영역의 1개 이상, 2개 이상, 4개 이상 또는 8개의 직렬 카피를 포함하는 변형된 EPYC1 폴리펩티드인 식물 또는 이의 일부.

8. 구체예 7에 있어서, 조류 EPYC1 폴리펩티드가 트렁케이션된 성숙 EPYC1 폴리펩티드인 식물 또는 이의 일부.

9. 구체예 8에 있어서, 트렁케이션된 성숙 EPYC1 폴리펩티드가 트렁케이션되지 않은 EPYC1 폴리펩티드와 비교하여 변형된 루비스코에 대해 증가된 친화성을 갖는 식물 또는 이의 일부.

10. 구체예 7에 있어서, 변형된 EPYC1 폴리펩티드가 천연 EPYC1 선도 서열 없이 발현되고/되거나 C-말단 캡을 포함하는 식물 또는 이의 일부.

11. 구체예 10에 있어서, 변형된 EPYC1 폴리펩티드가 상응하는 변형되지 않은 EPYC1 폴리펩티드와 비교하여 변형된 루비스코에 대해 증가된 친화성을 갖는 식물 또는 이의 일부.

12. 구체예 6에 있어서, 응집체가 식물 세포의 적어도 하나의 엽록체의 엽록체 기질에 국한되고, 상기 식물 세포가 잎 엽육 세포인 식물 또는 이의 일부.

13. EPYC1 폴리펩티드를 인코딩하는 제1 핵산 서열 및 변형된 루비스코 폴리펩티드를 인코딩하는 제2 핵산 서열을 포함하는 유전적으로 변경된 고등 식물 또는 이의 일부.

14. 구체예 13에 있어서, 제1 핵산 서열이 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1 핵산 서열이 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않으며, 제2 핵산 서열이 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제4 핵산 서열에 작동 가능하게 연결되고, 상기 제2 핵산 서열이 천연 조류 SSU 선도 서열을 인코딩하지 않고 천연 조류 SSU 선도 서열을 인코딩하는 핵산 서열에 작동 가능하게 연결되지 않는 식물 또는 이의 일부.

15. 구체예 13에 있어서, EPYC1 폴리펩티드가 트렁케이션된 성숙 EPYC1 폴리펩티드 또는 제1 조류 EPYC1 반복 영역의 1개 이상, 2개 이상, 4개 이상 또는 8개의 직렬 카피를 포함하는 변형된 EPYC1 폴리펩티드인 식물 또는 이의 일부.

16. 구체예 13에 있어서, 변형된 루비스코 폴리펩티드가 조류 루비스코 작은 서브유닛(SSU) 폴리펩티드 또는 변형된 고등 식물 루비스코 SSU 폴리펩티드를 포함하고, 여기서 고등 식물 루비스코 SSU 폴리펩티드의 적어도 일부가 조류 루비스코 SSU 폴리펩티드의 적어도 일부로 대체된 식물 또는 이의 일부.

17. 구체예 13에 있어서, 식물 또는 이의 일부가 변형된 루비스코 폴리펩티드 및 EPYC1 폴리펩티드의 응집체를 추가로 포함하는 식물 또는 이의 일부.

18. 구체예 1의 유전적으로 변경된 고등 식물을 생산하는 방법으로서,

a) EPYC1 폴리펩티드를 인코딩하는 제1 핵산 서열을 식물 세포, 조직 또는 다른 체외이식편에 도입하는 단계;

b) 식물 세포, 조직 또는 다른 체외이식편을 유전적으로 변경된 소식물체로 재생시키는 단계; 및

c) 유전적으로 변경된 소식물체를 EPYC1 폴리펩티드를 인코딩하는 제1 핵산을 갖는 유전적으로 변경된 식물로 성장시키는 단계를 포함하는, 방법.

19. 구체예 18에 있어서, 변형된 루비스코 SSU 폴리펩티드를 인코딩하는 제2 핵산 서열을 단계 (a) 이전에 또는 단계 (a)와 동시에 식물 세포, 조직 또는 다른 체외이식편에 도입하는 단계를 추가로 포함하고, 여기서 단계 (c)의 유전적으로 변경된 식물이 변형된 루비스코 SSU 폴리펩티드를 인코딩하는 제2 핵산을 추가로 포함하는 방법.

20. 구체예 18에 있어서, 제1 핵산 서열이 제1 벡터와 함께 도입되고, 상기 제1 벡터가 제1 핵산 서열의 제1 카피를 포함하고, 여기서 제1 핵산 서열이 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않으며, 상기 제1 핵산 서열이 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1 핵산 서열이 제1 프로모터에 작동 가능하게 연결되고, 상기 제1 핵산 서열이 1개의 종결인자에 작동 가능하게 연결되며; 상기 제1 벡터가 제1 핵산 서열의 제2 카피를 추가로 포함하고, 여기서 제1 핵산 서열이 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않으며, 상기 제1 핵산 서열이 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1 핵산 서열이 제3 프로모터에 작동 가능하게 연결되고, 상기 제1 핵산 서열이 2개의 종결인자에 작동 가능하게 연결되는 방법.

21. 변형된 루비스코 및 필수 피레노이드 성분 1(EPYC1) 폴리펩티드의 응집체를 형성하기 위한 변형된 루비스코를 포함하는 유전적으로 변경된 고등 식물 또는 이의 일부.

22. 구체예 21에 있어서, 변형된 루비스코가 조류 루비스코 작은 서브유닛(SSU) 폴리펩티드 또는 변형된 고등 식물 루비스코 SSU 폴리펩티드를 포함하고, 여기서 고등 식물 루비스코 SSU 폴리펩티드의 적어도 일부가 조류 루비스코 SSU 폴리펩티드의 적어도 일부로 대체된 식물 또는 이의 일부.

23. 구체예 21 또는 구체예 22에 있어서, EPYC1 폴리펩티드 및 응집체를 추가로 포함하는 식물 또는 이의 일부.

24. 구체예 21-23 중 어느 하나에 있어서, 응집체가 공초점 현미경, 투과 전자 현미경(TEM), 저온-전자 현미경(cryo-EM) 또는 액체-액체 상 분리 검정에 의해 검출될 수 있는 식물 또는 이의 일부.

25. 구체예 22-24 중 어느 하나에 있어서, 변형된 고등 식물 루비스코 폴리펩티드가 내인성 루비스코 SSU 폴리펩티드를 포함하는 식물 또는 이의 일부.

26. 구체예 22-25 중 어느 하나에 있어서, 변형된 고등 식물 루비스코 SSU 폴리펩티드가 하나 이상의 고등 식물 루비스코 SSU α-나선을 하나 이상의 조류 루비스코 SSU α-나선으로 대체하고/하거나; 하나 이상의 고등 식물 루비스코 SSU β-가닥을 하나 이상의 조류 루비스코 SSU β-가닥으로 대체하고/하거나; 고등 식물 루비스코 SSU βA-βB 루프를 조류 루비스코 SSU βA-βB 루프로 대체함으로써 변형된 식물 또는 이의 일부.

27. 구체예 26에 있어서, 고등 식물 루비스코 SSU 폴리펩티드가 2개의 고등 식물 루비스코 SSU α-나선을 2개의 조류 루비스코 SSU α-나선으로 대체함으로써 변형된 식물 또는 이의 일부.

28. 구체예 27에 있어서, 2개의 고등 식물 루비스코 SSU α-나선이 SEQ ID NO: 1의 아미노산 23-35 및 아미노산 80-93에 상응하고 2개의 조류 루비스코 SSU α-나선이 SEQ ID NO: 2의 아미노산 23-35 및 아미노산 86-99에 상응하는 식물 또는 이의 일부.

29. 구체예 27 또는 구체예 28에 있어서, 고등 식물 루비스코 SSU 폴리펩티드가 4개의 고등 식물 루비스코 SSU β-가닥을 4개의 조류 루비스코 SSU β-가닥으로 대체하고, 고등 식물 루비스코 SSU βA-βB 루프를 조류 루비스코 SSU βA-βB 루프로 대체함으로써 추가로 변형된 식물 또는 이의 일부.

30. 구체예 29에 있어서, 4개의 고등 식물 루비스코 SSU β-가닥이 SEQ ID NO: 1의 아미노산 39-45, 아미노산 68-70, 아미노산 98-105 및 아미노산 110-118에 상응하고, 4개의 조류 루비스코 SSU β-가닥이 SEQ ID NO: 2의 아미노산 39-45, 아미노산 74-76, 아미노산 104-111 및 아미노산 116-124에 상응하고, 고등 식물 루비스코 SSU βA-βB 루프가 SEQ ID NO: 1의 아미노산 46-67에 상응하고, 조류 루비스코 SSU βA-βB 루프가 SEQ ID NO: 2의 아미노산 46-73에 상응하는 식물 또는 이의 일부.

31. 구체예 22-30 중 어느 하나에 있어서, 고등 식물 루비스코 SSU 폴리펩티드가 SEQ ID NO: 140, SEQ ID NO: 141, SEQ ID NO: 142, SEQ ID NO: 143, SEQ ID NO: 144, SEQ ID NO: 145, SEQ ID NO: 146, SEQ ID NO: 147, SEQ ID NO: 148, SEQ ID NO: 149, SEQ ID NO: 150, SEQ ID NO: 151, SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155 또는 SEQ ID NO: 156과 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 식물 또는 이의 일부.

32. 구체예 22-31 중 어느 하나에 있어서, 조류 루비스코 SSU 폴리펩티드가 SEQ ID NO: 2, SEQ ID NO: 30, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 162, SEQ ID NO: 163 또는 SEQ ID NO: 164와 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 식물 또는 이의 일부.

33. 구체예 32에 있어에서, 조류 루비스코 SSU 폴리펩티드가 SEQ ID NO: 2, SEQ ID NO: 30, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 162, SEQ ID NO: 163 또는 SEQ ID NO: 164인 식물 또는 이의 일부.

34. 구체예 22-31 중 어느 하나에 있어서, 변형된 고등 식물 루비스코 SSU 폴리펩티드가 변형이 없는 고등 식물 루비스코 SSU 폴리펩티드와 비교하여 EPYC1 폴리펩티드에 대해 증가된 친화성을 갖는 식물 또는 이의 일부.

35. 변형된 루비스코 및 EPYC1 폴리펩티드의 응집체를 형성하기 위한 EPYC1 폴리펩티드를 포함하는 유전적으로 변경된 고등 식물 또는 이의 일부.

36. 구체예 21-35 중 어느 하나에 있어서, EPYC1 폴리펩티드가 조류 EPYC1 폴리펩티드인 식물 또는 이의 일부.

37. 구체예 35 또는 구체예 36에 있어서, 조류 EPYC1 폴리펩티드가 SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 165, SEQ ID NO: 166 또는 SEQ ID NO: 167과 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 식물 또는 이의 일부.

38. 구체예 37에 있어서, 조류 EPYC1 폴리펩티드가 SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 165, SEQ ID NO: 166 또는 SEQ ID NO: 167인 식물 또는 이의 일부.

39. 구체예 21-37 중 어느 하나에 있어서, EPYC1 폴리펩티드가 변형된 EPYC1 폴리펩티드인 식물 또는 이의 일부.

40. 구체예 39에 있어서, 변형된 EPYC1 폴리펩티드가 제1 조류 EPYC1 반복 영역의 1개 이상, 2개 이상, 4개 이상 또는 8개의 직렬 카피를 포함하는 식물 또는 이의 일부.

41. 구체예 40에 있어서, 변형된 EPYC1 폴리펩티드가 제1 조류 EPYC1 반복 영역의 4개의 직렬 카피 또는 8개의 직렬 카피를 포함하는 식물 또는 이의 일부.

42. 구체예 40 또는 구체예 41에 있어서, 제1 조류 EPYC1 반복 영역이 SEQ ID NO: 36과 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 식물 또는 이의 일부.

43. 구체예 42에 있어서, 제1 조류 EPYC1 반복 영역이 SEQ ID NO: 36인 식물 또는 이의 일부.

44. 구체예 39-43 중 어느 하나에 있어서, 변형된 EPYC1 폴리펩티드가 천연 EPYC1 선도 서열 없이 발현되고/되거나 C-말단 캡을 포함하는 식물 또는 이의 일부.

45. 구체예 44에 있어서, 천연 EPYC1 선도 서열이 SEQ ID NO: 42와 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드를 포함하고, C-말단 캡이 SEQ ID NO: 41과 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드를 포함하는 식물 또는 이의 일부.

46. 구체예 45에 있어서, C-말단 캡이 SEQ ID NO: 41인 식물 또는 이의 일부.

47. 구체예 39-46 중 어느 하나에 있어서, 변형된 EPYC1 폴리펩티드가 상응하는 변형되지 않은 EPYC1 폴리펩티드와 비교하여 루비스코 SSU 폴리펩티드에 대해 증가된 친화성을 갖는 식물 또는 이의 일부.

48. 구체예 21-47 중 어느 하나에 있어서, 응집체가 식물 세포의 적어도 하나의 엽록체의 엽록체 기질에 국한된 식물 또는 이의 일부.

49. 구체예 48에 있어서, 식물 세포가 잎 엽육 세포인 식물.

50. 구체예 21-49 중 어느 하나에 있어서, 식물이 동부, 대두, 카사바, 쌀, 콩, 밀 및 다른 C3 작물로 구성된 군으로부터 선택되는 식물.

51. EPYC1 폴리펩티드를 제1 핵산 서열 및 변형된 루비스코를 인코딩하는 제2 핵산 서열을 포함하는 유전적으로 변경된 고등 식물 또는 이의 일부.

52. 구체예 51에 있어서, 제1 핵산 서열이 제1 프로모터에 작동 가능하게 연결된 식물 또는 이의 일부.

53. 구체예 52에 있어서, 제1 프로모터가 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 및 엽육 세포 특정 프로모터로 구성된 군으로부터 선택되는 식물 또는 이의 일부.

54. 구체예 53에 있어서, 제1 프로모터가 CaMV35S 프로모터, CaMV35S 프로모터의 유도체, CsVMV 프로모터, CsVMV 프로모터의 유도체, 옥수수 유비퀴틴 프로모터, 트레포일 프로모터, 엽맥 모자이크 카사바 바이러스 프로모터 및 A. 탈리아나 UBQ10 프로모터로 구성된 군으로부터 선택된 항시적 프로모터인 식물 또는 이의 일부.

55. 구체예 51-54 중 어느 하나에 있어서, 제1 핵산 서열이 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1 핵산 서열이 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않는 식물 또는 이의 일부.

56. 구체예 55에 있어서, 엽록체의 전이 펩티드가 SEQ ID NO: 63과 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 식물 또는 이의 일부.

57. 구체예 56에 있어서, 엽록체의 전이 펩티드가 SEQ ID NO: 63인 식물 또는 이의 일부.

58. 구체예 55-57 중 어느 하나에 있어서, 천연 EPYC1 선도 서열이 SEQ ID NO: 65의 뉴클레오티드 60 내지 137에 상응하는 식물 또는 이의 일부.

59. 구체예 51-58 중 어느 하나에 있어서, 제1 핵산 서열이 1개 또는 2개의 종결인자에 작동 가능하게 연결된 식물 또는 이의 일부.

60. 구체예 59에 있어서, 1개 또는 2개의 종결인자가 HSP 종결인자, NOS 종결인자, OCS 종결인자, 인트론리스 엑텐신 종결인자, 35S 종결인자, pinII 종결인자, rbcS 종결인자, 액틴 종결인자 및 이들의 임의의 조합으로 구성된 군으로부터 선택되는 식물 또는 이의 일부.

61. 구체예 51-60 중 어느 하나에 있어서, 제2 핵산 서열이 제2 프로모터에 작동 가능하게 연결된 식물 또는 이의 일부.

62. 구체예 61에 있어서, 제2 프로모터가 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 및 엽육 세포 특정 프로모터로 구성된 군으로부터 선택되는 식물 또는 이의 일부.

63. 구체예 62에 있어서, 제2 프로모터가 CaMV35S 프로모터, CaMV35S 프로모터의 유도체, CsVMV 프로모터, CsVMV 프로모터의 유도체, 옥수수 유비퀴틴 프로모터, 트레포일 프로모터, 엽맥 모자이크 카사바 바이러스 프로모터 및 A. 탈리아나 UBQ10 프로모터로 구성된 군으로부터 선택된 항시적 프로모터인 식물 또는 이의 일부.

64. 구체예 61-63 중 어느 하나에 있어서, 제2 핵산 서열이 조류 루비스코 SSU 폴리펩티드를 인코딩하는 식물 또는 이의 일부.

65. 구체예 64에 있어서, 제2 핵산 서열이 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제4 핵산 서열에 작동 가능하게 연결되고, 상기 제2 핵산 서열이 천연 조류 SSU 선도 서열을 인코딩하지 않고 천연 조류 SSU 선도 서열을 인코딩하는 핵산 서열에 작동 가능하게 연결되지 않는 식물 또는 이의 일부.

66. 구체예 65에 있어서, 엽록체의 전이 펩티드가 SEQ ID NO: 64와 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 식물 또는 이의 일부.

67. 구체예 66에 있어서, 엽록체의 전이 펩티드가 SEQ ID NO: 64인 식물 또는 이의 일부.

68. 구체예 65-67 중 어느 하나에 있어서, 천연 SSU 선도 서열이 SEQ ID NO: 32의 아미노산 1 내지 45에 상응하는 식물 또는 이의 일부.

69. 구체예 61-68 중 어느 하나에 있어서, 제2 핵산 서열이 종결인자에 작동 가능하게 연결된 식물 또는 이의 일부.

70. 구체예 69에 있어서, 종결인자가 HSP 종결인자, NOS 종결인자, OCS 종결인자, 인트론리스 엑텐신 종결인자, 35S 종결인자, pinII 종결인자, rbcS 종결인자 및 액틴 종결인자로 구성된 군으로부터 선택되는 식물 또는 이의 일부.

71. 구체예 61-63 중 어느 하나에 있어서, 제2 핵산 서열이 변형된 고등 식물 루비스코 SSU 폴리펩티드를 인코딩하고, 여기서 고등 식물 루비스코 SSU 폴리펩티드의 적어도 일부가 조류 루비스코 SSU 폴리펩티드의 적어도 일부로 대체된 식물 또는 이의 일부.

72. 구체예 51-71 중 어느 하나에 있어서, EPYC1 폴리펩티드가 구체예 36-47 중 어느 하나의 EPYC1 폴리펩티드인 식물 또는 이의 일부.

73. 구체예 51-72 중 어느 하나에 있어서, 루비스코 SSU 폴리펩티드가 구체예 25-34 중 어느 하나의 루비스코 SSU 폴리펩티드인 식물 또는 이의 일부.

74. 구체에 51-73 중 어느 하나에 있어서, 식물 또는 이의 일부의 적어도 하나의 세포가 루비스코 폴리펩티드 및 EPYC1 폴리펩티드의 응집체를 포함하는 식물 또는 이의 일부.

75. 구체예 74에 있어서, 응집체가 적어도 하나의 식물 세포의 적어도 하나의 엽록체의 엽록체 기질에 국한된 식물 또는 이의 일부.

76. 구체예 75에 있어서, 식물 세포가 잎 엽육 세포인 식물.

77. 구체예 74-76 중 어느 하나에 있어서, 응집체가 공초점 현미경, 투과 전자 현미경(TEM), 저온-전자 현미경(cryo-EM) 또는 액체-액체 상 분리 검정에 의해 검출될 수 있는 식물.

78. 구체예 71-77 중 어느 하나에 있어서, 식물이 동부, 대두, 카사바, 쌀, 밀 및 다른 C3 작물로 구성된 군으로부터 선택되는 식물.

79. 구체예 21-78 중 어느 하나의 식물 또는 식물 부분으로부터 수득 가능한 유전적으로 변경된 고등 식물 세포.

80. 구체예 21-79 중 어느 하나의 유전적으로 변경된 고등 식물을 생산하는 방법으로서,

d) EPYC1 폴리펩티드를 인코딩하는 제1 핵산 서열을 식물 세포, 조직 또는 다른 체외외식편에 도입하는 단계;

e) 식물 세포, 조직 또는 다른 체외이식편을 유전적으로 변경된 소식물체로 재생시키는 단계; 및

f) 유전적으로 변경된 소식물체를 EPYC1 폴리펩티드를 인코딩하는 제1 핵산을 갖는 유전적으로 변경된 식물로 성장시키는 단계를 포함하는, 방법.

81. 구체예 80에 있어서, 변형된 루비스코 SSU 폴리펩티드를 인코딩하는 제2 핵산 서열을 단계 (a) 이전에 또는 단계 (a)와 동시에 식물 세포, 조직 또는 다른 체외이식편에 도입하는 단계를 추가로 포함하고, 여기서 단계 (c)의 유전적으로 변경된 식물이 변형된 루비스코 SSU 폴리펩티드를 인코딩하는 제2 핵산을 추가로 포함하는 방법.

82. 구체예 80 또는 구체예 81에 있어서, 단계 (b) 이전에 식물 세포, 조직 또는 다른 체외이식편을 스크리닝하거나 선택하거나; 단계 (b)와 (c) 사이에 소식물체를 스크리닝하거나 선택하거나; 단계 (c) 이후에 식물을 스크리닝하거나 선택함으로써 제1 핵산 서열 및 선택적으로 제2 핵산 서열의 성공적인 도입을 확인하는 단계를 추가로 포함하는 방법.

83. 구체예 80-82 중 어느 하나에 있어서, 형질전환이 입자 충격(즉, 유전자 주입, 유전자 총), 아그로박테리움-매개 형질전환, 리조븀-매개 형질전환 및 원형질체 트랜스펙션 또는 형질전환으로 구성된 군으로부터 선택된 형질전환 방법을 사용하여 수행되는 방법.

84. 구체예 81-83 중 어느 하나에 있어서, 제1 핵산 서열이 제1 벡터와 함께 도입되고, 제2 핵산 서열이 제2 벡터와 함께 도입되는 방법.

85. 구체예 84에 있어서, 제1 핵산 서열이 제1 프로모터에 작동 가능하게 연결된 방법.

86. 구체예 85에 있어서, 제1 프로모터가 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 및 엽육 세포 특정 프로모터로 구성된 군으로부터 선택되는 방법.

87. 구체예 86에 있어서, 제1 프로모터가 CaMV35S 프로모터, CaMV35S 프로모터의 유도체, CsVMV 프로모터, CsVMV 프로모터의 유도체, 옥수수 유비퀴틴 프로모터, 트레포일 프로모터, 엽맥 모자이크 카사바 바이러스 프로모터 및 A. 탈리아나 UBQ10 프로모터로 구성된 군으로부터 선택된 항시적 프로모터인 방법.

88. 구체예 80-87 중 어느 하나에 있어서, 제1 핵산 서열이 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1 핵산 서열이 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않는 방법.

89. 구체예 88에 있어서, 엽록체의 전이 펩티드가 SEQ ID NO: 63과 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 방법.

90. 구체예 89에 있어서, 내인성 엽록체의 전이 펩티드가 SEQ ID NO: 63인 방법.

91. 구체예 88-90 중 어느 하나에 있어서, 천연 EPYC1 선도 서열이 SEQ ID NO: 65의 뉴클레오티드 60 내지 137에 상응하는 방법.

92. 구체예 80-91 중 어느 하나에 있어서, 제1 핵산 서열이 1개 또는 2개의 종결인자에 작동 가능하게 연결된 방법.

93. 구체예 92에 있어서, 1개 또는 2개의 종결인자가 HSP 종결인자, NOS 종결인자, OCS 종결인자, 인트론리스 엑텐신 종결인자, 35S 종결인자, pinII 종결인자, rbcS 종결인자, 액틴 종결인자 및 이들의 임의의 조합으로 구성된 군으로부터 선택되는 방법.

94. 구체예 81-93 중 어느 하나에 있어서, 제2 핵산 서열이 제2 프로모터에 작동 가능하게 연결된 방법.

95. 구체예 94에 있어서, 제2 프로모터가 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 및 엽육 세포 특정 프로모터로 구성된 군으로부터 선택되는 방법.

96. 구체예 95에 있어서, 제2 프로모터가 CaMV35S 프로모터, CaMV35S 프로모터의 유도체, CsVMV 프로모터, CsVMV 프로모터의 유도체, 옥수수 유비퀴틴 프로모터, 트레포일 프로모터, 엽맥 모자이크 카사바 바이러스 프로모터 및 A. 탈리아나 UBQ10 프로모터로 구성된 군으로부터 선택된 항시적 프로모터인 방법.

97. 구체예 94-96 중 어느 하나에 있어서, 제2 핵산 서열이 조류 SSU 폴리펩티드를 인코딩하는 방법.

98. 구체예 97에 있어서, 제2 핵산 서열이 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제4 핵산 서열에 작동 가능하게 연결되고, 상기 제2 핵산 서열이 천연 조류 SSU 선도 서열을 인코딩하지 않고 천연 조류 SSU 선도 서열을 인코딩하는 핵산 서열에 작동 가능하게 연결되지 않는 방법.

99. 구체예 98에 있어서, 엽록체의 전이 펩티드가 SEQ ID NO: 64와 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 방법.

100. 구체예 99에 있어서, 엽록체의 전이 펩티드가 SEQ ID NO: 64인 방법.

101. 구체예 98-100 중 어느 하나에 있어서, 천연 조류 SSU 선도 서열이 SEQ ID NO: 32의 아미노산 1 내지 45에 상응하는 방법.

102. 구체예 94-101 중 어느 하나에 있어서, 제2 핵산 서열이 종결인자에 작동 가능하게 연결된 방법.

103. 구체예 102에 있어서, 종결인자가 HSP 종결인자, NOS 종결인자, OCS 종결인자, 인트론리스 엑텐신 종결인자, 35S 종결인자, pinII 종결인자, rbcS 종결인자 및 액틴 종결인자로 구성된 군으로부터 선택되는 방법.

104. 구체예 94-96 중 어느 하나에 있어서, 제2 핵산 서열이 변형된 고등 식물 루비스코 SSU 폴리펩티드를 인코딩하고, 여기서 고등 식물 루비스코 SSU 폴리펩티드의 적어도 일부가 조류 루비스코 SSU 폴리펩티드의 적어도 일부로 대체된 방법.

105. 구체예 104에 있어서, 제2 벡터가 내인성 루비스코 SSU 폴리펩티드를 인코딩하는 핵산에 작동 가능하게 연결된 핵 게놈 서열을 표적화하는 하나 이상의 유전자 편집 성분을 포함하는 방법.

106. 구체예 105에 있어서, 하나 이상의 유전자 편집 성분이 핵 게놈 서열을 표적화하는 리보핵단백질 복합체; TALEN 단백질 인코딩 서열을 포함하는 벡터(여기서 TALEN 단백질은 핵 게놈 서열을 표적화함); ZFN 단백질 인코딩 서열을 포함하는 벡터(여기서 ZFN 단백질은 핵 게놈 서열을 표적화함); 올리고뉴클레오티드 공여체(ODN)(여기서 ODN은 핵 게놈 서열을 표적화함); 및 CRISPR/Cas 효소 인코딩 서열 및 표적화 서열을 포함하는 벡터(여기서 표적화 서열은 핵 게놈 서열을 표적화함)로 구성된 군으로부터 선택되는 방법.

107. 구체예 105 또는 구체예 106에 있어서, 유전자 편집의 결과로 고등 식물 루비스코 SSU 폴리펩티드의 적어도 일부가 조류 루비스코 SSU 폴리펩티드의 적어도 일부로 대체된 방법.

108. 구체예 80-107 중 어느 하나에 있어서, EPYC1 폴리펩티드가 구체예 36-47 중 어느 하나의 EPYC1 폴리펩티드인 방법.

109. 구체예 81-108 중 어느 하나에 있어서, 루비스코 SSU 폴리펩티드가 구체예 25-34 중 어느 하나의 루비스코 SSU 폴리펩티드인 방법.

110. 구체예 88 또는 구체예 92에 있어서, 제1 벡터가 제1 핵산 서열의 제1 카피를 포함하고, 여기서 제1 핵산 서열이 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않으며, 상기 제1 핵산 서열이 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1 핵산 서열이 제1 프로모터에 작동 가능하게 연결되고, 상기 제1 핵산 서열이 1개의 종결인자에 작동 가능하게 연결되며; 상기 제1 벡터가 제1 핵산 서열의 제2 카피를 추가로 포함하고, 여기서 제1 핵산 서열이 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않으며, 상기 제1 핵산 서열이 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1 핵산 서열이 제3 프로모터에 작동 가능하게 연결되고, 상기 제1 핵산 서열이 2개의 종결인자에 작동 가능하게 연결되는 방법.

111. 구체예 110에 있어서, 제1 프로모터가 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 및 엽육 세포 특정 프로모터로 구성된 군으로부터 선택되고; 제3 프로모터가 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 및 엽육 세포 특정 프로모터로 구성된 군으로부터 선택되고; 제1 및 제3 프로모터가 동일하지 않은 방법.

112. 구체예 111에 있어서, 엽록체의 전이 펩티드가 SEQ ID NO: 63과 적어도 70% 서열 동일성, 적어도 75% 서열 동일성, 적어도 80% 서열 동일성, 적어도 85% 서열 동일성, 적어도 90% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 방법.

113. 구체예 112에 있어서, 천연 EPYC1이 선도 서열이 SEQ ID NO: 65의 뉴클레오티드 60 내지 137에 상응하는 방법.

114. 구체예 113에 있어서, 종결인자가 HSP 종결인자, NOS 종결인자, OCS 종결인자, 인트론리스 엑텐신 종결인자, 35S 종결인자, pinII 종결인자, rbcS 종결인자, 액틴 종결인자 및 이들의 임의의 조합으로 구성된 군으로부터 선택되는 방법.

115. 구체예 80-114 중 어느 하나의 방법에 의해 생산된 식물 또는 식물 부분.

116. 구체예 21-79 및 115 중 어느 하나의 유전적으로 변경된 식물을 재배하는 방법으로서,

a) 유전적으로 변경된 묘목, 유전적으로 변경된 소식물체, 유전적으로 변경된 삽목, 유전적으로 변경된 괴경, 유전적으로 변경된 뿌리 또는 유전적으로 변경된 종자를 토양에 심어 유전적으로 변경된 식물을 생산하거나, 유전적으로 변경된 묘목, 유전적으로 변경된 소식물체 또는 유전적으로 변경된 삽목을 근경 또는 토양에서 성장한 제2 식물에 접목하여 유전적으로 변경된 식물을 생산하는 단계;

b) 수확 가능한 종자, 수확 가능한 잎, 수확 가능한 뿌리, 수확 가능한 삽목, 수확 가능한 목재, 수확 가능한 과일, 수확 가능한 커널, 수확 가능한 괴경 및/또는 수확 가능한 곡물을 생산하도록 식물을 재배하는 단계; 및

c) 수확 가능한 종자, 수확 가능한 잎, 수확 가능한 뿌리, 수확 가능한 삽목, 수확 가능한 목재, 수확 가능한 과일, 수확 가능한 커널, 수확 가능한 괴경 및/또는 수확 가능한 곡물을 수확하는 단계를 포함하는, 방법.

특허 또는 출원 파일은 색으로 제작된 적어도 하나의 도면을 함유한다. 색 도면(들)을 갖는 특허 또는 특허 출원의 카피는 요청시 필요한 요금의 지불과 함께 관청에 의해 제공될 것이다.
도 1a-1d는 필수 피레노이드 성분 1(EPYC1) 및 루비스코 작은 서브유닛(SSU)의 구조를 제시한다. 도 1a는 4개의 반복 영역이 밝은 회색(제1 반복 영역), 회색(제2 반복 영역), 어두운 회색(제3 반복 영역) 및 가장 어두운 회색(제4 반복 영역)으로 제시되고, 각각의 반복 영역의 예측 α-나선이 흑색으로 제시되고, N- 및 C-말단이 백색으로 제시되는 EPYC1의 개략도를 제시한다. 도 1b는 각각의 반복 영역 내의 4개의 반복 영역이 정렬된(밝은 회색(SEQ ID NO: 36), 회색(SEQ ID NO: 69), 어두운 회색(SEQ ID NO: 70) 및 더 어두운 회색(SEQ ID NO: 71)으로 강조됨) EPYC1의 서열(SEQ ID NO: 34), 및 굵은 글씨체 및 밑줄로 제시된 예측 α-나선(SEQ ID NO: 169, SEQ ID NO: 170)를 제시한다. N-말단(SEQ ID NO: 68) 및 C-말단(SEQ ID NO: 41)은 회색으로 제시되고, 26(V)과 27(A) 사이의 엽록체의 전이 펩티드의 예측 절단 부위가 흑색 화살촉으로 표시된다. 도 1c는 4개의 β-시트(밝은 회색으로 제시되고 표지됨), 2개의 α-나선 영역(어두운 회색으로 제시되고 표지됨) 및 1개의 βA-βB 루프(회색으로 상단에 제시되고 표지됨)를 갖는 아라비돕시스 탈리아나로부터의 루비스코 SSU 1A(1A_At)의 예측 모델을 제시한다. 도 1d는 어두운 회색으로 강조된 α-나선, 밝은 회색으로 강조된 β-시트 및 회색으로 강조된 βA-βB 루프를 갖는 성숙 A. 탈리아나 SSU 1A(1A_At; SEQ ID NO: 1) 및 성숙 클라미도모나스 레인하드티이 SSU 1(S1_Cr; SEQ ID NO: 2)의 아미노산 정렬을 제시한다. 2개의 C. 레인하드티이 SSU(S1_Cr 및 S2_Cr) 사이에 상이한 4개의 아미노산은 굵은 글씨로 제시된다(제시된 S1_Cr은 이들 위치에 T, A, T 및 F를 갖는 반면, 제시되지 않은 S2_Cr는 이들 위치에 S, S, S 및 W를 각각 갖는다).
도 2a-2c는 EPYC1과 상이한 SSU 사이의 상호작용을 측정하기 위한 효모 2-하이브리드(Y2H) 실험의 결과를 제시한다. 도 2a는 류신(L) 및 트립토판(W)이 결여된 효모 합성 최소 배지(SD 배지)(SD-L-W) 및 L, W 및 히스티딘(H)이 결여된 효모 합성 최소 배지(SD 배지)(SD-L-W-H)에서의 Y2H 상호작용을 제시하며, 여기서 상호작용 강도는 억제제 3-아미노-1,2,4-트리아졸(3-AT; 10 mM 3-AT에서의 성장 = 강한 상호작용)의 증가하는 농도에서의 성장에 의해 입증된다(EPYC1 = C. 레인하드티이 EPYC1; S1_Cr = C. 레인하드티이 SSU 1; S2_Cr = C. 레인하드티이 SSU 2; 1A_At = A. 탈리아나 SSU 1A; 및 1A_AtMOD = C. 레인하드티이로부터의 2개의 α-나선 영역을 갖는 변형된 1A_At). 도 2b는 양성 대조군(BD + 및 AD +), 음성 대조군(BD - 및 AD -), 상이한 벡터에서의 관심 유전자의 발현, 및 자가-상호작용의 시험을 포함하는 Y2H 대조군을 제시한다(LSU_Cr = C. 레인하드티이 루비스코 큰 서브유닛). 도 2c는 추가적인 Y2H 대조군(AtCP12 = A. 탈리아나 CP12-2 (유전자 ID: AT3G62410); CAH3 = C. 레인하드티이 탄산 탈수효소 3 (유전자 ID: Cre09.g415700.t1.2); LCIB = C. 레인하드티이 저-CO₂ 유도성 단백질 B (유전자 ID: Cre10.g452800.t1.2); LCIC = C. 레인하드티이 저-CO₂ 유도성 단백질 C (유전자 ID: Cre06.g307500.t1.1); 및 LSU_At = A. 탈리아나 루비스코 큰 서브유닛)을 제시한다. 도 2a-2c의 경우, BD = 결합 도메인(즉, 나열된 유전자는 pGBKT7 벡터에서 발현됨), AD = 활성화 도메인(즉, 나열된 유전자는 pGADT7 벡터에서 발현됨), 및 OD = 600 nm에서의 광학 밀도(OD₆₀₀)에 의해 측정된 효모 세포가 플레이팅된 세포 밀도.
도 3a-3c는 천연 및 변형된 A. 탈리아나 및 C. 레인하드티이 SSU뿐만 아니라 이들의 EPYC1과의 상호작용을 제시한다. 도 3a는 A. 탈리아나(1A_At(At1g67090; SEQ ID NO: 1) 및 C. 레인하드티이(S1_Cr(Cre02.g120100.t1.2; SEQ ID NO: 30)로부터의 성숙 SSU; 및 S2_Cr(Cre02.g120150.t1.2; SEQ ID NO: 2))의 펩티드 서열의 정렬을 제시한다. 도 3b는 굵은 글씨로 제시된 S1_Cr과 S2_Cr 사이에 상이한 잔기를 갖는 펩티드 서열 1A_At(At1g67090; SEQ ID NO: 1), S1_Cr(Cre02.g120100.t1.2; SEQ ID NO: 30) 및 S2_Cr(Cre02.g120150.t1.2; SEQ ID NO: 2)을 제시한다. 1A_At의 변형된 버전(1A_AtMod (β-시트) = C. 레인하드티이 β-시트로 대체된 A. 탈리아나 β-시트(SEQ ID NO: 23); 1A_AtMod (루프) = C. 레인하드티이 βA-βB 루프로 대체된 A. 탈리아나 βA-βB 루프 (SEQ ID NO: 24); 1A_AtMod (β-시트 및 루프) = C. 레인하드티이 β-시트 및 βA-βB 루프로 대체된 A. 탈리아나 β-시트 및 βA-βB 루프(SEQ ID NO: 25); 1A_AtMod (A. 탈리아나 α-나선) = C. 레인하드티이 α-나선으로 대체된 α-나선(SEQ ID NO: 26); 1A_AtMod (α-나선 및 β-시트) = C. 레인하드티이 α-나선 및 β-시트로 대체된 A. 탈리아나 α-나선 및 β-시트(SEQ ID NO: 27); 1A_AtMod (α-나선, β-시트 및 루프) = C. 레인하드티이 α-나선, β-시트 및 βA-βB 루프로 대체된 A. 탈리아나 α-나선, β-시트 및 βA-βB 루프(SEQ ID NO: 28); 식물 형질전환에 사용된 1A_At-TP를 갖는 1A_AtMod(Atkinson et al., 2017) = A. 탈리아나 루비스코 작은 서브유닛 1A 전이 펩티드(1A_At-TP; 밑줄)를 갖는 1A_AtMod(α-나선)(SEQ ID NO: 33)) 및 S2_Cr(식물 형질전환에 사용된 1A_At-TP를 갖는 S2_Cr(Atkinson et al., 2017) = 1A_At-TP(밑줄)을 갖는 S2_Cr(SEQ ID NO: 22))이 또한 제시된다. 도 3a-3b에서, A. 탈리아나 α-나선은 가장 밝은 회색으로 강조되고(SEQ ID NO: 3, SEQ ID NO: 4), C. 레인하드티이 α-나선은 어두운 회색으로 강조되고(SEQ ID NO: 10, SEQ ID NO: 12), A. 탈리아나 β-시트는 밝은 회색으로 강조되고(SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8), C. 레인하드티이 β-시트는 회색으로 강조되고(SEQ ID NO: 11, SEQ ID NO: 6, SEQ ID NO: 13, SEQ ID NO: 14)(A. 탈리아나 및 C. 레인하드티이에서 동일한 잔기 TMW(SEQ ID NO: 6)를 갖는 β-시트를 제외함), A. 탈리아나 βA-βB 루프는 밝은 회색으로 강조되고(SEQ ID NO: 9), C. 레인하드티이 βA-βB 루프는 가장 어두운 회색으로 강조된다(SEQ ID NO: 15). 도 3c는 상이한 농도의 3-AT를 사용하여 EPYC1과 1A_At의 변형된 버전(1A_AtMOD) 사이의 상호작용 강도를 측정하는 Y2H 실험의 결과를 제시하며, 여기서 상이한 1A_At 성분(α-나선, β-시트 및 βA-βB 루프)은 표시된 바와 같은 S1_Cr로부터의 것으로 대체되었다(1A_AtMOD 버전의 펩티드 서열은 도 3b에 제시된다). 상호작용 강도는 히트 맵(우측 상의 키; 성장이 관찰된 3-AT의 농도가 높을수록, 상호작용이 강함)에 의해 표시된다. 2회의 생물학적 복제가 수행되었고, 실험은 각각 적어도 2회 반복되었다. 위 양성/음성의 배제를 보장하기 위해 적절한 대조군이 포함되었다.
도 4a-4k는 C. 레인하드티이 EPYC1의 천연 및 변형된 버전 및 이들의 S1_Cr과의 상호작용을 제시한다. EPYC1의 4개의 반복 영역은 가장 밝은 회색(제1 반복 영역), 회색(제2 반복 영역), 어두운 회색(제3 반복 영역) 및 가장 어두운 회색(제4 반복 영역)으로 강조된다. 도 4a-4b는 전장 천연 EPYC1(Cre10.g436550.t1.2; (SEQ ID NO: 34))뿐만 아니라 N-말단으로부터 상이한 트렁케이션을 갖는 변형된 EPYC1의 펩티드 서열을 제시한다. 도 4a에서, N-ter = N-말단(SEQ ID NO: 68); N-ter+1rep = N-말단 + 제1 반복 영역(SEQ ID NO: 43); N-ter+2reps = N-말단, 제1 반복 영역, 및 제2 반복 영역(SEQ ID NO: 44); N-ter+3reps = N-말단, 제1 반복 영역, 제2 반복 영역, 및 제3 반복 영역(SEQ ID NO: 45); 및 N-ter+4reps = N-말단, 제1 반복 영역, 제2 반복 영역, 제3 반복 영역, 및 제4 반복 영역(SEQ ID NO: 46). 도 4b에서 4reps+C-ter / mEPYC1 = 제1 반복 영역, 제2 반복 영역, 제3 반복 영역, 제4 반복 영역, 및 C-말단(SEQ ID NO: 47); 3reps+C-ter = 제2 반복 영역, 제3 반복 영역, 제4 반복 영역, 및 C-말단(SEQ ID NO: 48); 2reps+C-ter = 제3 반복 영역, 제4 반복 영역, 및 C-말단(SEQ ID NO: 49); 1rep+C-ter = 제4 반복 영역 및 C-말단(SEQ ID NO: 50); 및 C-ter = C-말단(SEQ ID NO: 41). 도 4c-4d는 N-말단으로부터의 상이한 트렁케이션을 갖는 천연 EPYC1 단백질 및 변이체 EPYC1 단백질의 정렬을 제시한다(도 4a-4b에 제시된 펩티드 서열). 도 4c는 천연 및 트렁케이션된 EPYC1 단백질의 N-말단 부분의 정렬을 제시한다. 도 4d는 천연 및 트렁케이션된 EPYC1 단백질의 C-말단 부분의 정렬을 제시한다. 도 4e-4f는 전장 천연 EPYC1(Cre10.g436550.t1.2; SEQ ID NO: 34)뿐만 아니라 반복 영역이 알파 나선 내에 점 돌연변이(굵은 글씨로 제시됨)를 갖는 제1 반복 영역(EPYC1-α1), 알파 나선 내에 점 돌연변이(굵은 글씨로 제시됨)를 갖는 제2 반복 영역(EPYC1-α2), 알파 나선 내에 점 돌연변이(굵은 글씨로 제시됨)를 갖는 제3 반복 영역(EPYC1-α3) 및 알파 나선 내에 점 돌연변이(굵은 글씨로 제시됨)를 갖는 제4 반복 영역(EPYC1-α4)의 상이한 조합으로 치환된 변형된 EPYC1의 펩티드 서열을 제시한다. 도 4e에서, EPYC1(Cre10.g436550.t1.2) = 전장 천연 EPYC1 (SEQ ID NO: 34); EPYC1-α1 = EPYC1-α1으로 대체된 제1 반복 영역을 갖는 전장 EPYC1(SEQ ID NO: 51); EPYC1-α1,2 = EPYC1-α1으로 대체된 제1 반복 영역 및 EPYC1-α2로 대체된 제2 반복 영역을 갖는 전장 EPYC1(SEQ ID NO: 52); 및 EPYC1-α1,2,3 = EPYC1-α1으로 대체된 제1 반복 영역, EPYC1-α2로 대체된 제2 반복 영역 및 EPYC1-α3로 대체된 제3 반복 영역을 갖는 전장 EPYC1(SEQ ID NO: 53). 도 4f에서, EPYC1-α1,2,3,4 = EPYC1-α1으로 대체된 제1 반복 영역, EPYC1-α2로 대체된 제2 반복 영역, EPYC1-α3로 대체된 제3 반복 영역 및 EPYC1-α4로 대체된 제4 반복 영역을 갖는 전장 EPYC1(SEQ ID NO: 54); EPYC1-α3,4 = EPYC1-α3로 대체된 제3 반복 영역 및 EPYC1-α4로 대체된 제4 반복 영역을 갖는 전장 EPYC1(SEQ ID NO: 55); 및 EPYC1-α4 = EPYC1-α4로 대체된 제4 반복 영역을 갖는 전장 EPYC1(SEQ ID NO: 56). 도 4g-4h는 천연 EPYC1 단백질 및 알파 나선 점 돌연변이 반복 영역으로 반복 영역 치환을 갖는 변이체 EPYC1 단백질(도 4e-4f에 제시된 펩티드 서열)의 정렬을 제시한다. 도 4g는 천연 및 트렁케이션된 EPYC1 단백질의 N-말단 부분의 정렬을 제시한다. 도 4h는 천연 및 트렁케이션된 EPYC1 단백질의 C-말단 부분의 정렬을 제시한다. 도 4i는 효모에서 천연 EPYC1 및 EPYC1의 N-말단 트렁케이션된 변형된 버전의 면역블롯을 제시한다. 도 4j는 Y2H 실험에 의해 측정된 바와 같은 S1_Cr과 EPYC1의 변형된 버전 사이의 상호작용 강도를 제시한다(본 패널에서 시험된 EPYC1의 변형된 버전의 펩티드 서열은 도 4a-4b에 제시됨). 도 4k는 Y2H 실험에 의해 측정된 바와 같은 S1_Cr과 EPYC1의 추가의 변형된 버전 사이의 상호작용 강도를 제시한다(본 패널에서 시험된 EPYC1의 변형된 버전의 펩티드 서열은 도 4e-4f에 제시됨). 도 4j-4k의 경우, 상호작용 강도는 히트 맵(우측 상의 키; 성장이 관찰된 3-AT의 농도가 높을수록, 상호작용이 강함)으로 표시되고, EPYC1의 4개의 반복 영역은 블록 다이어그램에서 좌측에서 우측으로 제시되고(백색의 N-말단, 가장 밝은 회색의 제1 반복 영역, 회색의 제2 반복 영역, 회색의 제3 반복 영역, 흑색의 제4 반복 영역 및 백색의 C-말단), 알파 나선 점 돌연변이 반복 영역에 의한 영역 치환은 블록 내에서 흑색 또는 어두운 회색의 수직 막대로 표시된다. 2회의 생물학적 복제가 수행되었고, 실험은 각각 적어도 2회 반복되었다.
도 5a-5f는 SSU와의 상호작용 강도를 증가시키기 위해 이루어진 EPYC1 변형 및 EPYC1 변형을 시험하기 위한 실험으로부터의 결과를 제시한다. 도 5a는 제1 반복 영역의 1, 2, 4 또는 8개의 탠덤 반복부(합성 EPYC1 1 rep(SEQ ID NO: 36), 합성 EPYC1 2 reps(SEQ ID NO: 37), 합성 EPYC1 4 reps(SEQ ID NO: 38) 및 합성 EPYC1 8 reps(SEQ ID NO: 39))의 펩티드 서열, 추가 알파-나선이 삽입(굵은 글씨 및 밑줄로 제시됨)된 제1 반복 영역(합성 EPYC1 2 α-나선 1 rep (SEQ ID NO: 57))의 펩티드 서열, 각각 추가 알파-나선이 삽입(굵은 글씨 및 밑줄로 제시됨)된 제1 반복 영역의 4개의 카피(합성 EPYC1 2 α-나선 4 reps(SEQ ID NO: 58)), 및 제1 반복부의 알파-나선에 점 돌연변이(굵은 글씨 및 큰 글꼴로 제시됨)를 각각 함유하는 제1 반복 영역의 3개의 버전(각각, 합성 EPYC1 변형 α-나선 1 rep(SEQ ID NO: 59), 합성 EPYC1 α-나선 녹아웃 A(SEQ ID NO: 60) 및 합성 EPYC1 α-나선 녹아웃 B(SEQ ID NO: 61))을 제시한다. 도 5b-5d는 천연 EPYC1 단백질 및 상이한 수의 탠덤 반복부(도 5a에 제시된 펩티드 서열)를 갖는 합성 EPYC1 단백질의 정렬을 제시한다. 도 5b는 천연 및 합성 EPYC1 단백질의 N-말단 부분의 정렬을 제시한다. 도 5c는 천연 및 합성 EPYC1 단백질의 중앙 부분의 정렬을 제시한다. 도 5d는 천연 및 트렁케이션된 EPYC1 단백질의 C-말단 부분의 정렬을 제시한다. 도 5e는 제1 반복 영역(가장 밝은 회색) 및 예측 α-나선(α-나선에 대해 가장 어두운 회색, 변형된 α-나선에 대해 가장 밝은 회색, α-나선 녹아웃 A에 대해 더 밝은 회색 또는 α-나선 녹아웃 B에 대해 밝은 회색으로 채워진 수직 막대에 의해 표시됨)을 기초로 한 S1_Cr과 EPYC1의 합성 변이체 사이의 Y2H 실험에 의해 측정된 바와 같은 상호작용 강도를 제시한다(본 패널에서 시험된 EPYC1의 합성 변이체의 펩티드 서열은 도 5a에 제시됨). 상호작용 강도는 히트 맵(우측 상의 키; 성장이 관찰된 3-AT의 농도가 높을수록, 상호작용이 강함)에 의해 표시된다. 도 5f는 PCOILS 생물정보학 도구를 사용하여 EPYC1의 제1 반복 영역 및 EPYC1의 제1 반복 영역의 합성 변이체에 대한 예측된 코일드 코일 도메인 확률을 제시한다. 일치하는 색-코딩된 아미노산 서열은 그래프 아래에 제시되며, 야생형 서열과 상이한 잔기는 굵은 글씨 및 밑줄로 제시된다. 상단에는 EPYC1 1 rep(야생형) 서열(SEQ ID NO: 36)이 있으며; 위에서 두 번째는 α-나선 녹아웃 B 서열(SEQ ID NO: 60)이고; 위에서 세 번째는 α-나선 녹아웃 A 서열(SEQ ID NO: 61)이고; 위에서 네 번째는 변형된 α-나선 서열(SEQ ID NO: 59)이고; 하단에는 2개의 α-나선 서열(SEQ ID NO: 57)이 있다. 상감 그래프는 전장 EPYC1에 대한 코일드 코일 도메인 확률을 제시한다.
도 6a-6c는 C. 레인하드티이로부터의 성숙 EPYC1의 면역침전 및 온전한 단백질 질량분광법을 제시한다. 도 6a는 C. 레인하드티이 세포 용해질(투입), 면역침전 공정 동안의 세척 내용물(세척) 및 용리된 면역침전된 EPYC1(IP)을 함유하는 쿠마시-염색된 SDS-PAGE 겔을 제시한다. 도 6b는 EPYC1의 전기분무 이온화(ESI) 전하 상태 분포를 제시한다. 도 6c는 EPYC1의 디컨볼루션된(deconvoluted) 중성 분자 질량(달톤(Da) 단위)을 제시한다.
도 7a-7c는 고등 식물에서 EPYC1을 발현시키는 데 사용된 이원 벡터의 맵뿐만 아니라 고등 식물에서의 EPYC1 발현을 제시하는 검정 결과를 제시한다. 도 7a는 회색의 A. 탈리아나 루비스코 작은 서브유닛 1A 전이 펩티드(1A_At-TP), 밝은 회색의 EPYC1, 둘 모두 회색으로 제시되는 35S 항시적 프로모터(35S) 및 옥토파인 신타제 종결인자(ocs), 가장 밝은 회색으로 제시된 아그로박테리움 튜메파시엔스(Agrobacterium tumefaciens)에서 저-카피 플라스미드의 복제를 허용하는 플라스미드 pVS1으로부터의 복제 기점(oriV), 가장 어두운 회색으로 제시된 스펙티노마이신에 대한 내성을 부여하는 아미노글리코시드 아데닐릴트랜스페라제에 대한 발현 카세트(SmR), 가장 밝은 회색으로 제시된 고-카피수 ColE1/pMB1/pBR322/pUC 복제 기점(ori), 가장 어두운 회색으로 제시된 oriV에 결합하고 이를 활성화시키는 트랜스-액틴 복제 단백질(trfA), 백색의 olesin1 프로모터(Olesin pro)를 나타내는 pFAST-R 선택 카세트(oleosin1의 코딩 서열(OLE1, A. 탈리아나)에 융합된 E. 콰드리콜로르로부터의 단량체 tagRFP(Shimada, et al., Plant J. (2010) 61: 519-528-667)), 회색의 olesin1 5' UTR(Olesin 5' UTR), 가장 어두운 회색 점선을 갖는 가장 어두운 회색의 변형된 olesin1 유전자(Olesin), 가장 어두운 회색의 형광 태그(TagRFP), 백색의 olesin1 종결인자(Olesin term), 회색의 식물 세포 유전체로의 T-DNA의 통합에 필요한 우측 경계 서열(RB T-DNA 반복부), 및 회색의 식물 세포 유전체로의 T-DNA의 통합에 필요한 좌측 경계 서열(LB T-DNA 반복부)을 갖는 식물 형질전환에 사용되는 1A_At-TP::EPYC1(SEQ ID NO: 67)을 갖는 이원 벡터의 맵을 제시한다. 도 7b는 다음 작제물의 N. 벤타미아나(N. benthamiana)에서의 일시적 발현을 제시한다: 1A_At 엽록체의 전이 펩티드가 없는 녹색 형광 단백질(GFP)과 융합된 EPYC1(EPYC1::GFP, 상단 행), 1A_At 엽록체의 전이 펩티드를 갖는 GFP와 융합된 EPYC1(1A_At-TP::EPYC1::GFP, 중간 행), 및 GFP와 융합된 루비스코의 A. 탈리아나 1A 작은 서브유닛(RbcS1A::GFP, 하단 행). 도 7c는 다음 작제물의 A. 탈리아나에서의 안정적 발현을 제시한다: 1A_At 엽록체의 전이 펩티드가 없는 GFP과 융합된 EPYC1(EPYC1::GFP, 상단 행), 및 1A_At 엽록체의 전이 펩티드를 갖는 GFP와 융합된 EPYC1(1A_At-TP::EPYC1::GFP, 하단 행). 도 7b-7c의 경우, GFP 채널은 좌측 열에 제시되고, 엽록소 자가형광 채널은 중간 열에 제시되고, GFP 및 엽록소의 오버레이는 백색의 중첩 신호와 함께 우측 열에 제시되고, 스케일 바는 10 μm를 나타낸다.
도 8a-8e는 EPYC1을 발현하는 고등 식물로부터의 단백질 발현 및 성장 데이터를 제시한다. 도 8a는 다음 3개의 배경에서 1A_At-TP::EPYC1을 발현하는 A. 탈리아나 식물 계통으로부터 추출된 단백질로부터의 1A_At-TP::EPYC1에 대한 면역 블롯을 제시한다: 야생형(EPYC1, 상단 행), S2_Cr이 보충된 루비스코 작은 서브유닛 돌연변이체 1a3b 돌연변이체(S2_Cr_EPYC1, 중간 행), 및 1A_AtMOD가 보충된 1a3b(1A_AtMOD_EPYC1, 하단 행). 면역블롯은 EPYC1이 결여된 상응하는 분리체(Seg 1, Seg 2, Seg 3)와 비교하여 배경 당 3개의 독립적으로 형질전환된 동형접합 T3 계통(Line 1, Line 2, Line 3)에서의 상대적인 EPYC1 발현 수준을 나타낸다. 도 8b는 도 8a의 계통의 식물로부터의 31일에 수확된 식물의 신선 및 건조 중량을 제시한다. 배경(EPYC1, S2_Cr_EPYC1, 1A_AtMOD_EPYC1) 당 3개의 독립적으로 형질전환된 동형접합 T3 계통("_1", "_2", "_3"로 표시됨)으로부터의 데이터가 백색 막대로 제시되는 반면, 각각의 계통에 대한 EPYC1이 결여된 상응하는 분리체로부터의 데이터는 흑색 막대로 제시된다. 값은 12개의 로제트(rosette)에 대해 이루어진 측정의 평균 ± 표준 오차이며, 별표는 스튜던츠의 쌍을 이룬 샘플 t-검정에 의해 결정된 바와 같은 형질전환된 계통과 분리체 사이의 유의한 차이(P<0.05)를 나타낸다. 도 8c는 도 8a-8b에 기재된 9개의 형질전환된 계통의 로제트 성장을 제시한다. 로제트 성장은 mm² 단위의 면적으로 측정되고, 값은 16개의 로제트에 대해 이루어진 측정의 평균 ± 표준 오차이며, 배경(EPYC1, S2_Cr_EPYC1, 1A_AtMOD_EPYC1) 당 3개의 독립적으로 형질전환된 동형접합 T3 계통으로부터의 데이터는 흑색 원으로 제시되는 반면, 각각의 계통에 대해 EPYC1이 결여된 상응하는 분리체로부터의 데이터는 백색 원으로 제시된다. 도 8d는 상이한 발현 시스템으로부터 추출된 EPYC1의 밴딩 패턴을 비교하는 면역블롯을 제시한다. 레인 1: 200 mM DTT를 갖는 샘플 로딩 완충액에서 추출된 A. 탈리아나 안정적 발현 계통 EPYC1_1으로부터의 단백질. 레인 2: 프로테아제 억제제를 포함하는 면역침전(IP) 추출 완충액으로 추출된 EPYC1_1 계통으로부터의 단백질. 레인 3: IP 추출 완충액으로 추출된 C. 레인하드티이(균주 CC-1690m)로부터의 단백질. 레인 4: 효모 용해 완충액에서 추출된 EPYC1::GAL4 결합 도메인을 발현하는 효모로부터의 단백질. 블롯은 문헌[Mackinder, et al., PNAS (2016) 113: 5958-5963]으로부터의 항-EPYC1 항체로 프로빙되었다. 도 8e는 C. 레인하드티이(좌측) 및 A. 탈리아나 계통 S2_Cr_EPYC1(우측)에서 루비스코 큰 서브유닛(LSU; 하단)에 대한 EPYC1(상단)의 풍부함의 비율측정 비교를 예시하는 면역블롯을 제시한다. 레인 당 로딩된 가용성 단백질의 양은 μg 단위로 각각의 블롯 위에 표시되고, 3개의 독립적인 생물학적 복제물이 검정되었다.
도 9a-9e는 고등 식물에서 EPYC1과 루비스코 사이의 상호작용을 특성규명하는 방법의 결과를 제시한다. 도 9a는 항-EPYC1 항체에 가교된 단백질-A 코팅된 비드를 사용하여 수행된 4개의 상이한 트랜스제닉 A. 탈리아나 계통으로부터의 EPYC1과 함께 루비스코의 공동-면역침전의 결과를 제시한다. 상단 행은 S2_Cr로 보충되고 1A_AtTP와 융합된 EPYC1을 발현하는 루비스코 작은 서브유닛 돌연변이체 1a3b 돌연변이체로부터의 데이터를 제시한다. 두 번째 행은 1A_AtMOD로 보충되고 1A_AtTP와 융합된 EPYC1을 발현하는 1a3b 돌연변이체로부터의 데이터를 제시한다. 세 번째 행은 1A_AtTP와 융합된 EPYC1을 발현하는 야생형(WT) 식물로부터의 데이터를 제시한다. 하단 행은 EPYC1이 없는 S2_Cr로 보충된 1a3b로부터의 데이터를 제시한다. 좌측의 블롯(EPYC1 IP)은 항-EPYC1 항체(문헌[Mackinder, et al., PNAS (2016) 113: 5958-5963] 유래)로 프로빙되는 경우의 결과를 제시하는 반면, 우측 상의 블롯(Co-IP)은 루비스코 큰 서브유닛(LSU)에 대한 항체로 프로빙되는 경우의 결과를 제시한다. 좌측에서 우측으로의 레인(열)은 투입(투입), 통과(F-T), 4차 세척(세척) 및 비등 용리(용리)로부터의 결과를 나타낸다. 음성 대조군(Neg.)은 상이하였다: Neg. (*)은 단백질-A 비드 상의 항-EPYC1 항체가 항-HA 항체로 대체되고 IP가 이전과 같이 계속되는 대조군이었고, Neg. (**)는 단백질-A 비드 상의 항-EPYC1 항체가 항체로 대체되지 않고 IP가 이전과 같이 계속되는 대조군이었다(둘 모두의 경우, 용리된 샘플만 제시됨). 삼중 별표(***)는 EPYC1을 발현하지 않는 대조군 계통(S2_Cr)을 포함하는 모든 샘플에서 항-EPYC1 항체로 관찰된 비-특이적 밴드를 나타낸다. 도 9b는 C-말단에서 YFP^N 또는 YFP^C에 융합된 단백질을 일시적으로 발현하는 3개의 N. 벤타미아나 계통에서의 이분자 형광 보완 검정을 제시한다. 상단 행은 YFP^N에 융합된 C. 레인하드티이 루비스코 작은 서브유닛 2(S2_Cr)(S2_Cr::YFP^N) 및 YFP^C에 융합된 EPYC1(EPYC1::YFP^C)을 발현하는 식물로부터의 데이터를 나타낸다. 중간 행은 YFP^N에 융합된 EPYC1(EPYC1::YFP^N) 및 YFP^C에 융합된 S2_Cr(S2_Cr::YFP^C)을 발현하는 식물로부터의 데이터를 나타낸다. 하단 행은 YFP^N에 융합된 C. 레인하드티이로부터의 2개의 α-나선 영역을 갖는 변형된 1A_At(1A_AtMOD::YFP^N) 및 YFP^C에 융합된 EPYC1(EPYC1::YFP^C)를 발현하는 식물로부터의 데이터를 나타낸다. 도 9c는 C-말단에서 YFP^N 또는 YFP^C에 융합된 단백질을 일시적으로 발현하는 3개의 추가의 N. 벤타미아나 계통에서의 이분자 형광 보완 검정을 제시한다. 상단 행은 YFP^N에 융합된 EPYC1(EPCY1::YFP^N) 및 YFP^C에 융합된 1A_AtMOD(1A_AtMOD::YFP^C)을 발현하는 식물로부터의 데이터를 나타낸다. 중간 행은 YFP^N에 융합된 A. 탈리아나 SSU 1A(1A_At)(1A_At::YFP^N) 및 YFP^C에 융합된 EPYC1(EPYC1::YFP^C)을 발현하는 식물로부터의 데이터를 나타낸다. 하단 행은 YFP^N에 융합된 EPYC1(EPYC1::YFP^N) 및 YFP^C에 융합된 1A_At(1A_At::YFP^C)을 발현하는 식물로부터의 데이터를 나타낸다. 도 9d는 C-말단에서 YFP^N 또는 YFP^C에 융합된 단백질을 일시적으로 발현하는 3개의 N. 벤타미아나 계통에서의 음성 대조군 이분자 형광 보완 검정을 제시한다. 상단 행은 YFP^N에 융합된 AtCP12(AtCP12::YFP^N) 및 YFP^C에 융합된 EPYC1(EPYC1::YFP^C)을 발현하는 식물로부터의 데이터를 나타낸다. 중간 행은 YFP^N에 융합된 EPYC1(EPYC1::YFP^N) 및 YFP^C에 융합된 AtCP12(AtCP12::YFP^C)을 발현하는 식물로부터의 데이터를 나타낸다. 하단 행은 YFP^N에 융합된 AtCP12(AtCP12::YFP^N) 및 YFP^C에 융합된 1A_At(1A_At::YFP^C)을 발현하는 식물로부터의 데이터를 나타낸다. 도 9e는 2개의 추가의 N. 벤타미아나 계통에서의 추가의 음성 대조군 이분자 형광 보완 검정을 제시한다. 상단 행은 YFP^N에 융합된 1A_At(1A_At::YFP^N) 및 YFP^C에 융합된 AtCP12(AtCP12::YFP^C)을 일시적으로 발현하는 식물로부터의 데이터를 나타낸다. 하단 행은 형질전환되지 않은 식물로부터의 데이터를 나타낸다. 도 9b-9d에서, 좌측 열의 신호는 재구성된 YFP 형광이고, 중간 열의 신호는 엽록소 자가형광이고, YFP 및 엽록소 채널의 오버레이는 백색으로 제시된 중첩 신호와 함께 우측 열에 있으며, 스케일 바는 10 μm를 나타낸다.
도 10a-10e는 루비스코 및 EPYC1 혼합물에 대한 시험관 내 상 분리 데이터를 제시한다. 도 10a는 실온에서 혼합한 후 약 3분 후에 15 μM 루비스코(C. 레인하드티이(Cr), A. 탈리아나 야생형 식물(At), A. 탈리아나 S2_Cr 식물(S2_C)로부터 추출되거나, 루비스코 없음(-)) 및 10 μM EPYC1(우측의 4개의 튜브 내; 좌측 3개의 튜브에 EPYC1이 첨가되지 않음)을 함유하는 튜브의 이미지를 제시한다. 도 10b는 표시된 바와 같이 상이한 농도 및 비율의 EPYC1 및 루비스코를 함유하는 시험관 내 샘플의 미분 간섭 현미경(DIC) 및 표면형광(GFP) 현미경 이미지를 제시한다. EPYC1을 함유하는 샘플의 형광은 EPYC1::GFP의 포함 때문이다(최종 EPYC1 농도는 0.25 μM의 EPYC1::GFP를 포함함). 2개의 가장 좌측의 열에서, 루비스코는 C 레인하드티이로부터 정제되었고; 2개의 중간 열에서, 루비스코는 A. 탈리아나 S2_Cr 식물(S2_Cr)로부터 정제되었고; 2개의 가장 우측의 열에서, 루비스코는 야생형 A. 탈리아나 식물(아라비돕시스)로부터 정제되었다. 스케일 바는 15 μm를 나타낸다. 도 10c는 15 μM의 분리된 S2_Cr 루비스코 및 10 μM의 EPYC1을 함유하는 시험관 내 샘플에서 액적 융합의 시간-경과 현미경 이미지를 제시한다. 상단 행은 미분 간섭(DIC) 채널을 나타내고, 하단 행은 표면 형광(GFP) 채널을 나타낸다. 시리즈의 각각의 이미지의 첫 번째 이미지에 대한 초 단위(s)의 경과 시간이 상단에 표시된다. 스케일 바는 5 μm를 나타낸다. 도 10d는 40 μM의 루비스코(루비스코는 C. 레인하드티이(Cr), A. 탈리아나 S2_Cr 식물(S2_Cr) 또는 야생형 A. 탈리아나 식물(At)로부터 추출되었음; 루비스코가 없는 샘플은 -로 표시됨) 및 표시된 바와 같은 상이한 μM 농도의 EPYC1(0 μM, 3.75 μM 또는 10 μM)을 함유하는 샘플에 대한 SDS-PAGE에 의한 액적 침강 분석을 제시한다. 도 10e는 15 μM의 루비스코(루비스코는 C. 레인하드티이(Cr), A. 탈리아나 S2_Cr 식물(S2_Cr) 또는 야생형 A. 탈리아나 식물(At)로부터 추출되었음) 및 표시된 바와 같은 상이한 μM 농도의 EPYC1(3.75 μM 또는 10 μM)을 함유하는 샘플에 대한 SDS-PAGE에 의한 추가의 액적 침강 분석을 제시한다. 도 10d-10e의 경우, 샘플은 원심분리에 의해 수확된 탈혼합된 루비스코 및 EPYC1의 액적이었고, 상층액 분획(벌크 용액; S) 및 재현탁된 펠렛 분획(액적; P) 둘 모두가 겔에서 실행되었다(M은 좌측을 따라 kDa로 표시된 크기 키와 함께 마커 레인을 나타내고; 루비스코 큰 서브유닛(LSU), EPYC1 및 루비스코 작은 서브유닛(SSU)에 해당하는 밴드의 위치는 우측을 따라 표시된다).
도 11A-11b는 고등 식물 엽록체에서 루비스코의 국소화 데이터를 제시한다. 도 11a는 EPYC1을 발현하는 A. 탈리아나 S2_Cr 계통의 엽록체에서 루비스코의 면역금 표지(immunogold labeling)의 투과 전자 현미경 이미지를 제시한다(스케일 바는 0.5 μm임). 도 11b는 EPYC1이 없는 S2_Cr이 보충된 A. 탈리아나 1a3b 돌연변이체 식물의 엽록체에서 루비스코의 면역금 표지의 투과 전자 현미경 이미지를 제시한다(스케일 바는 0.5 μm임).
도 12a-12l은 TobiEPYC1 유전자 발현 카세트, 고등 식물에서 TobiEPYC1을 발현시키는 데 사용된 이원 벡터의 맵, 및 TobiEPYC1을 발현하는 식물 및 원형질체의 형광 현미경 이미지를 제시한다. 도 12a는 트렁케이션된 버전의 EPYC1 N-말단을 갖는 천연 및 합성 EPYC1의 변이체(TobiEPYC1 변이체)에 대한 6개의 상이한 유전자 발현 카세트를 제시한다. 각각의 카세트는 좌측에서 우측으로 35S 프로모터(35s pro; 회색); A. 탈리아나 루비스코 SSU 1A으로부터의 57개의 잔기의 엽록체 신호 펩티드(SP1A; 흑색); EPYC1 N-말단의 트렁케이션된 버전(표지되지 않음; 가장 밝은 회색); 각각의 반복 영역에 예측된 α-나선(흑색)을 갖는 EPYC1 반복 영역(가장 밝은 회색의 제1 반복 영역; 회색의 제2 반복 영역; 회색의 제3 반복 영역; 및 흑색의 제4 반복 영역); EPYC1 C-말단(표지되지 않음; 가장 밝은 회색); 및 이중 종결인자 HSP(어두운 회색) 및 nos(회색)를 함유한다. 카세트 2, 4 및 6은 또한 종결인자 전에 C-말단 녹색 형광 단백질 태그(GFP; 밝은 회색)를 함유한다. 도 12b는 서로를 향해 있는 벡터 내의 TobiEPYC1 유전자 발현 카세트의 배열을 제시한다. 제1 카세트(시계 방향)는 카사바 잎맥 모자이크 바이러스 프로모터(CsVMV pro), 열 충격 단백질(A. 탈리아나) 종결인자(HSP term) 및 노팔린 신타제(A. 튜메파시엔스) 종결인자(Nos term)에 의해 구동된다. 제2 카세트(반시계 방향)는 35S 프로모터(35S prom) 및 단 하나의 종결인자 - 옥토파인 신타제 종결인자(OCS term)에 의해 구동된다. 도 12c는 회색의 A. 탈리아나 루비스코 작은 서브유닛 1A 전이 펩티드(1A_At-TP), 밝은 회색의 TobiEPYC1, 둘 모두 백색으로 제시된 35S 항시적 프로모터(35S pro) 및 CsVMV 항시적 프로모터(CsVMV pro), 회색으로 제시된 6xHA 태그, 밝은 회색으로 제시된 eGFP, 어두운 회색 점선으로 가장 어두운 회색으로 제시된 코돈 최적화된 터보 GFP(tGFP), 회색으로 제시된 HSP 종결인자(HSP term), 백색으로 제시된 Nos 종결인자(Nos term), 백색으로 제시된 OCS 종결인자(OCS term), 가장 밝은 회색으로 제시된 A. 튜메파시엔스에서 저-카피 플라스미드의 복제를 허용하는 플라스미드 pVS1으로부터의 복제 기점(oriV), 가장 밝은 회색으로 제시된 고-카피수 ColE1/pMB1/pBR322/pUC 복제 기점(ori), 가장 밝은 회색으로 제시된 카나마이신에 내성을 부여하는 아미노글리코시드 포스포트랜스페라제에 대한 발현 카세트(KanR), 가장 어두운 회색으로 제시된 슈도모나스 플라스미드 pVS1로부터의 안정성 단백질(pVS1 StaA), 가장 어두운 회색으로 제시된 플라스미드 pVS1으로부터의 복제 단백질(pVS1 RepA), 백색의 olesin1 프로모터(Olesin pro)를 나타내는 pFAST-R 선택 카세트(oleosin1의 코딩 서열(OLE1, A. 탈리아나)에 융합된 E. 콰드리콜로르로부터의 단량체 tagRFP(Shimada, et al., Plant J. (2010) 61: 519-528-667)), 회색의 olesin1 5' UTR(Olesin 5' UTR), 어두운 회색 점선이 있는 가장 어두운 회색의 변형된 olesin1 유전자(Olesin), 가장 어두운 회색의 형광 태그(TagRFP), 백색의 olesin1 종결인자(Olesin term), 가장 밝은 회색의 식물 세포 유전체로의 T-DNA의 통합에 필요한 우측 경계 서열(RB T-DNA 반복부), 및 가장 밝은 회색의 식물 세포 유전체로의 T-DNA의 통합에 필요한 좌측 경계 서열(LB T-DNA 반복부)을 갖는 식물 형질전환에 사용된 TobiEPYC1::GFP를 갖는 이원 벡터(도 12a로부터의 카세트 2; 도 12b의 벡터에서 카세트 2의 배열)(SEQ ID NO: 168)의 맵을 제시한다. 도 12d는 N. 벤타미아나에서 TobiEPYC1::GFP의 일시적인 발현의 형광 현미경 이미지를 제시한다(좌측의 GFP 채널, 25의 이득(gain) 및 2% 레이저에서 이미지화됨; 중간의 엽록소 자가형광 채널; 우측의 GFP 및 엽록소 채널의 오버레이, 중첩 영역은 백색으로 제시됨). 도 12e는 N. 벤타미아나에서 TobiEPYC1::GFP의 일시적 발현의 형광 현미경 이미지를 제시한다(GFP 채널, 10의 이득 및 1% 레이저에서 이미지화됨). 도 12f는 A. 탈리아나 S2_Cr 계통에서 TobiEPYC1::GFP의 안정적 발현의 형광 현미경 이미지를 제시한다(좌측의 GFP 채널; 중간의 엽록소 자가형광 채널; 우측의 GFP 및 엽록소 채널의 오버레이, 중첩 영역은 백색으로 제시됨). 도 12g는 TobiEPYC1::GFP를 안정적으로 발현하는 A. 탈리아나 S2_Cr 계통으로부터의 원형질체의 형광 현미경 이미지를 제시한다(좌측의 GFP 채널; 좌측에서 두 번째의 엽록소 자가형광 채널; 우측에서 두 번째의 명시야 이미지; 우측의 GFP, 엽록소 및 명시야 이미지의 오버레이, 중첩된 형광의 영역은 백색으로 제시됨). 도 12h는 TobiEPYC1::GFP를 안정적으로 발현하는 A. 탈리아나 S2_Cr 계통으로부터의 또 다른 세트의 원형질체의 형광 현미경 이미지를 제시한다(좌측의 GFP 채널; 중간의 엽록소 자가형광 채널; 우측의 GFP 및 엽록소 채널의 오버레이). 도 12i는 TobiEPYC1::GFP를 안정적으로 발현하는 A. 탈리아나 S2_Cr 계통으로부터의 또 다른 세트의 원형질체의 형광 현미경 이미지를 제시하며, 화살표는 TobiEPYC1 응집체의 영역을 나타낸다(좌측의 GFP 채널; 중간의 엽록소 자가형광 채널; 우측의 GFP 및 엽록소 채널의 오버레이). 도 12j는 TobiEPYC1::GFP를 안정적으로 발현하는 A. 탈리아나 S2_Cr 계통으로부터의 또 다른 세트의 원형질체의 형광 현미경 이미지를 제시한다(좌측의 GFP 채널; 좌측에서 두 번째의 엽록소 자가형광 채널; 우측에서 두 번째의 명시야 이미지; 우측의 GFP, 엽록소 및 명시야 이미지의 오버레이). 도 12k는 TobiEPYC1::GFP를 안정적으로 발현하는 A. 탈리아나 식물로부터의 최근에 터진 원형질체로부터의 엽록체를 제시하며, 점선 화살표는 엽록체 외부의 EPYC1 응집체를 나타낸다(좌측의 GFP 채널; 좌측에서 두 번째의 엽록소 자가형광 채널; 우측에서 두 번째의 명시야 이미지; 우측의 GFP, 엽록소 및 명시야 이미지의 오버레이). 도 12l은 TobiEPYC1::GFP를 안정적으로 발현하는 야생형 A. 탈리아나로부터의 원형질체의 형광 현미경 이미지를 제시한다(좌측의 GFP 채널; 중간의 엽록소 자가형광 채널; 우측의 GFP 및 엽록소 채널의 오버레이, 중첩 형광의 영역은 백색으로 제시됨). 도 12d-12l의 경우, 스케일 바는 10 μm이고, 이미지는 대표적인 이미지이다.
도 13a-13e는 광표백(FRAP) 실험 후 형광 회복으로부터의 결과를 제시한다. 도 13a는 A. 탈리아나 S2_Cr 조직에서 TobiEPYC1::GFP 응집체의 2개의 샘플(각각 상단 및 하부에 걸쳐 제시됨)에서 광표백(FRAP) 시간 경과 후 형광 회복으로부터의 이미지를 제시한다(스케일 바 = 5 μm). 가장 좌측의 이미지는 표백 사건 이전의 응집체(표백 전)를 제시하며, 표백 전 이미지 위에 겹쳐진 백색 원은 표백을 위해 표적화된 영역을 표시한다. 우측 상의 이미지는 표백 사건 후 다양한 시점에서의 응집체를 제시하며, 표백 후 경과된 시간은 초(0.6초, 2.6초, 7.4초, 9초, 16초 및 24초)로 표시된다. 도 13b는 신호가 분석된 원형 광심 영역(ROI)을 나타내는 오버레이를 갖는 영상화 시간 경과(도 13a의 시점 0.6초)로부터의 예시적 이미지를 제시한다(표백된 영역은 위의 원; 표백되지 않은 영역은 아래 원; 스케일 바 = 2.5 μm). 도 13c는 도 13b에 표시된 ROI에 대한 FRAP 곡선을 제시한다. 시간 경과 동안 ROI로부터의 미가공 형광 신호 강도(데이터는 도 13a의 상단 데이터 세트에 해당함)가 표시되며, 표백 사건의 시간은 흑색 수직선으로 표시된다. 표백된 ROI로부터의 데이터는 회색으로 플롯팅된다. 표백되지 않은 ROI로부터의 데이터는 어두운 회색으로 플롯팅된다. 도 13d는 각 시점에서 표백되지 않은 신호에 대한 표준화 후 도 13b에 표시된 ROI에 대한 FRAP 곡선을 제시한다(데이터는 도 13a의 상단의 데이터 세트에 해당함). 데이터는 도 13c에서와 같이 음영 처리된다. 도 13e는 TobiEPYC1을 안정적으로 발현하는 A. 탈리아나 S2_Cr 식물로부터의 단백질 추출물을 프로빙하기 위해 α-EPYC1을 사용하는 웨스턴 블롯을 제시한다. 3개의 가장 좌측의 레인 각각은 TobiEPYC1 유전자 발현 카세트(도 12a에 제시됨)를 발현하는 상이한 식물로부터의 단백질 추출물(TobiEPYC1 1, TobiEPYC1 2 및 TobiEPYC1 3)을 함유하고, 좌측으로부터의 네 번째 레인 및 우측 상의 레인은 TobiEPYC1을 발현하지 않는 A. 탈리아나 S2Cr 계통으로부터의 단백질 추출물을 함유하고, 우측 레인으로부터 두 번째는 4 reps TobiEPYC1 유전자 발현 카세트(도 12a에 제시됨)를 발현하는 식물로부터의 단백질 추출물을 함유한다(kDa 단위의 단백질 중량은 백색으로 오버레이되고; 우측 상의 회색 화살표는 EPYC1에 해당하는 밴드의 위치를 나타내고; 흑색 화살표는 비-특이적 밴드를 나타냄).
도 14a-14c는 조류 종 볼복스 카르테리(Volvox carteri) 및 고니움 펙토랄레(Gonium pectorale)로부터의 루비스코 SSU를 갖는 C. 레인하드티이 RbcS1의 아미노산 정렬을 제시한다. 도 14a-14b는 C. 레인하드티이 S1_Cr(SEQ ID NO: 30)과 V. 카르테리로부터의 루비스코 SSU의 정렬을 제시한다(SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 162, SEQ ID NO: 163)). 도 14a는 C. 레인하드티이 RbcS1의 N-말단 부분 및 V. 카르테리 루비스코 SSU의 정렬을 제시한다. 도 14b는 C. 레인하드티이 RbcS1의 C 말단 부분 및 V. 카르테리 루비스코 SSU의 정렬을 제시한다. 도 14c는 C. 레인하드티이 S1_Cr(SEQ ID NO: 30)과 G. 펙토랄레 SSU(SEQ ID NO: 164)의 정렬을 제시한다. 도 14a-14c의 경우, α-나선의 정렬은 굵은 글씨로 제시된다.
도 15는 C. 레인하드티이 EPYC1(SEQ ID NO: 34)과 조류 종 V. 카르테리(SEQ ID NO: 166), G. 펙토랄레(SEQ ID NO: 167) 및 테트라바에나 소시알리스(Tetrabaena socialis)(SEQ ID NO: 168)로부터의 EPYC1 동족체의 아미노산 정렬을 제시하며, α-나선의 정렬은 굵은 글씨로 제시된다.
도 16은 이중 GFP 발현을 위한 이원 벡터(EPYC1-dGFP)의 개략도를 제시한다. 이러한 벡터는 다음의 2개의 작제물을 반대 방향으로 인코딩한다: C-말단에서 turboGFP에 융합된 EPYC1(tGFP; 좌측) 및 C-말단에서 향상된 GFP에 융합된 EPYC1(eGFP; 우측). 둘 모두의 작제물에서, EPYC1은 아미노산 잔기 27(아래를 가리키는 작은 삼각형으로 표시됨)에서 트렁케이션되고, N-말단에서 엽록체 A. 탈리아나 루비스코 작은 서브유닛 1A 전이 펩티드(RbcS1A TP)에 융합된다. EPYC1-tGFP 발현은 콜리플라워 모자이크 바이러스 35S 프로모터(35S prom; 좌측을 가리키는 삼각형)에 의해 구동된다. EPYC1-eGFP는 카사바 잎맥 모자이크 바이러스 프로모터(CsVMV prom; 우측을 가리키는 삼각형)에 의해 구동된다. eGFP 발현 카세트의 경우, 열 충격 단백질 종결인자(HSP ter) 및 노팔린 신타제 종결인자(nos ter)를 포함하는 이중 종결인자 시스템이 발현을 증가시키기 위해 사용되었다. tGFP 발현 카세트의 경우, 단일 옥토파인 신타제 종결인자(ocs ter)가 사용되었다.
도 17은 A. 탈리아나 트랜스제닉 식물 및 대조군에서 EPYC1 단백질 수준을 도시하는 면역블롯을 제시한다. 상단 2개의 면역블롯은 항-EPYC1 항체로 만들어졌다. 하단 2개의 면역블롯은 항-액틴 항체로 만들어진 로딩 대조군이다. 각각의 열은 상이한 식물로부터의 가용성 단백질 추출물을 함유한다. 좌측의 8개의 열은 모두 C. 레인하드티이(S2_Cr)로부터의 SSU로 보충된 A. 탈리아나 1a3b 루비스코 돌연변이체 배경의 트랜스제닉 식물로부터 유래된다. 우측의 2개의 열은 야생형 배경(WT)의 트랜스제닉 식물로부터 유래된다. S2_Cr 배경에서, EPYC1-dGFP를 발현하는 3개의 상이한 T2 트랜스제닉 식물로부터의 추출물은 각각 Ep1, Ep2 및 Ep3로 표지된 열에 제시된다. 이들 식물의 홀(azygous) 응집체로부터의 추출물은 각각 Az1, Az2 및 Az3로 표지된 열에 제시된다. 단지 EPYC1::eGFP 또는 단지 EPYC1::tGFP로 형질전환된 S2_Cr 식물로부터의 추출물은 각각 eGFP 및 tGFP로 표지된 열에 제시된다. EpWT 및 EpAz로 표지된 열은 각각 T2 EPYC1-dGFP WT 형질전환체 및 홀 응집체로부터의 추출물을 제시한다. EPYC1::eGFP(63.9 kDa), EPYC1::tGFP(55.4 kDa) 및 액틴의 중량과 일치하는 밴드의 위치는 우측을 따라 표시된다.
도 18a-18l은 EPYC1을 발현하는 트랜스제닉 A. 탈리아나 엽록체에서의 응축물 형성을 제시한다. 도 18a는 3개의 상이한 배경의 A. 탈리아나 식물에서 EPYC1-dGFP의 발현의 공초점 현미경 이미지를 제시한다: 야생형(WT; 상단 행), C. 레인하드티이 루비스코 작은 서브유닛으로 보충된 1a3b 루비스코 돌연변이체(S2_Cr; 중간 행), 및 피레노이드 형성에 필요한 2개의 C. 레인하드티이 작은 서브유닛 α-나선을 함유하도록 변형된 천연 A. 탈리아나 루비스코 작은 서브유닛이 보충된 1a3b 루비스코 돌연변이체(1A_AtMOD; 하단 행). 좌측 열의 이미지는 GFP 채널을 제시한다. 우측 열의 이미지는 엽록소 자가형광이 있는 GFP 채널의 오버레이를 제시한다. 스케일 바는 10 μm를 나타낸다. 도 18b는 EPYC1-dGFP로 형질전환되지 않은 21일령 S2_Cr 식물(좌측) 및 EPYC1-dGFP를 발현하는 21일령 S2_Cr 트랜스제닉 계통(우측)으로부터의 엽록체의 투과 전자 현미경 이미지를 제시한다. 스케일 바는 0.5 μm를 나타낸다. 화살표는 우측의 EPYC1 발현 엽록체의 기질 내의 응축물을 가리킨다. 도 18c는 EPYC1-dGFP를 발현하는 A. 탈리아나 S2_Cr 엽록체의 공초점 현미경 이미지의 2개 채널을 제시한다. 좌측의 이미지는 엽록소 자가형광을 제시한다. 우측의 이미지는 엽록소 자가형광이 있는 GFP 채널의 오버레이를 제시한다. 화살표는 하나의 엽록체의 엽록소 자가형광의 어두운 점을 가리키며, 이는 엽록소 자가형광이 EPYC1-dGFP 축적 부위에서 감소되는 것을 나타낸다. 스케일 바는 5 μm를 나타낸다. 도 18d는 EPYC1-dGFP를 발현하는 A. 탈리아나 S2_Cr 엽록체의 엽록체 내부의 EPYC1-dGFP 응축물의 초-해상도 구조화 조명 현미경(SIM) 이미지의 z-투영을 제시한다. 이미지는 GFP 및 엽록소 자가형광 채널의 오버레이이다. 화살표는 높은 GFP 신호의 둥근 영역을 나타낸다. 스케일 바는 2 μm를 나타낸다. 도 18e는 깊이(z) 치수를 표시하기 위해 회전된 도 18d에 제시된 동일한 엽록체의 3차원 투영을 제시한다. 이미지는 GFP 및 엽록소 자가형광 채널의 오버레이이다. 점선 화살표는 이미지 부피의 상대적인 x, y 및 z 축을 나타낸다. 실선 화살표는 높은 GFP 신호의 둥근 영역을 나타낸다. 스케일 바는 1 μm를 나타낸다. 도 18f는 C. 레인하드티이 세포의 투과 전자 현미경(TEM) 이미지에서 피레노이드의 SIM 이미지에서의 응축물 크기(우측)와 EPYC1-dGFP를 발현하는 A. 탈리아나 S2_Cr 식물의 엽록체의 SIM 이미지에서의 응축물 크기(좌측)의 예시적 비교를 제시한다. TEM 이미지의 스케일 바는 0.5 μm를 나타낸다. 2 μm의 표지된 막대는 각각 A. 탈리아나 엽록체(좌측) 및 C. 레인하드티이 피레노이드(우측)에서 GFP-발현 영역의 폭에 걸쳐 있다. 도 18g-18h는 EPYC1-dGFP를 발현하는 트랜스제닉 A. 탈리아나 S2_Cr 잎 조직의 공초점 형광 현미경 이미지를 제시한다. 좌측 패널은 GFP 채널을 제시한다. 중간 패널은 엽록소 자가형광을 제시한다. 우측 패널은 GFP 및 엽록소 채널의 오버레이를 제시한다. 도 18g는 모든 엽록체에서 응축물을 볼 수 있는 단일 세포의 z-스택의 최대 투영을 제시한다. 스케일 바는 5 μm를 나타낸다. 도 18h는 상이한 발현 수준의 EPYC1-dGFP를 갖는 트랜스제닉 A. 탈리아나 S2_Cr 계통 Ep1-3의 이미지를 제시한다(도 17에 제시된 바와 같음). 스케일 바는 10 μm를 나타낸다. 도 18i는 C-말단에서 tGFP(EPYC1::tGFP; 상단 행) 또는 eGFP(EPYC1::eGFP; 하단 행)에 융합된 EPYC1의 단일 EPYC1 발현 카세트를 발현하는 트랜스제닉 A. 탈리아나 S2_Cr 식물에서의 응축물의 대표적 공초점 형광 현미경 이미지를 제시한다. 좌측 이미지는 GFP 채널을 제시한다. 중간 이미지는 엽록소 자가형광을 제시한다. 우측 이미지는 GFP 및 엽록소 채널의 오버레이를 제시한다. 스케일 바는 10 μm를 나타낸다. 도 18j-18l은 C. 레인하드티이 피레노이드(n=55) 및 3개의 EPYC1-dGFP-발현 트랜스제닉 A. 탈리아나 S2_Cr 트랜스제닉 계통의 엽록체(Ep1-3; n=42)의 공초점 이미지로부터 유래된 데이터의 산점도를 제시한다. 도 18j는 μm 단위의 피레노이드(C. 레인하드티이 세포의 경우) 또는 응축물(트랜스제닉 A. 탈리아나의 경우)의 직경을 제시하며, 평균 직경은 넓은 수평선으로 표시되고, 평균의 표준 오차(SEM)는 오차 막대로 표시된다. 도 18k는 각각의 엽록체의 μm 단위의 추정 부피에 대해 플롯팅된 μm 단위의 응축물의 부피를 제시하며, Ep1-3 각각으로부터의 데이터는 상이한 음영으로 플롯팅된다. 도 18l은 트랜스제닉 A. 탈리아나 S2_Cr 트랜스제닉 계통 Ep1-3(각각의 계통에 대해 n=27 엽록체)에 대한 응축물에 의해 차지된 엽록체 부피의 추정 백분율의 플롯을 제시한다. 넓은 수평 막대는 각각의 계통에 대한 평균 값을 나타내고, 오차 막대는 SEM을 나타낸다.
도 19a-19c는 A. 탈리아나 엽록체에서 EPYC1-dGFP 응축물의 액체-액체 상 분리 특성의 인 플란타(in planta) 형광 현미경 분석을 제시한다. 도 19a는 EPYC1-dGFP를 발현하는 28개의 WT(좌측), 17개의 S2_Cr(중간) 및 22개의 1A_AtMOD 엽록체의 단면에 걸친 GFP 형광 강도 분포 플롯을 제시한다. 각각의 플롯 선은 상이한 엽록체로부터의 데이터를 나타낸다. 표준화된 GFP 형광은 y-축에 제시된다. 엽록체를 가로지르는 표준화된 상대 거리는 x-축에 제시된다. 도 19b-19c는 EPYC1-dGFP를 발현하는 S2_Cr 트랜스제닉 A. 탈리아나 계통에서 광표백(FRAP) 검정 후 형광 회복을 제시한다. 도 19b는 살아 있는(상단) 및 고정(하단) 잎 조직의 응축물에 대한 대표적인 FRAP 시간-경과에서 GFP 채널로부터의 정지 이미지를 제시한다. 가장 좌측의 이미지는 표백 사건 전의 GFP 분포를 제시한다. 우측의 이미지는 표백 사건 후 시간 경과에 따른 GFP 분포를 제시한다. 표백 사건 이후 경과된 시간은 초 단위로 이미지 위에 제시된다. 스케일 바는 1 μm를 나타낸다. 도 19c는 13-16개의 엽록체에서 응축물의 형광 회복의 플롯을 제시한다. y-축은 표백되지 않은 영역에 대한 표백된 영역의 GFP 신호를 제시하며, 여기서 표백되지 않은 영역으로부터의 신호는 1(수평 점선)로 정의되었다. x-축은 초 단위의 경과된 시간을 제시하며, 표백 사건의 시간은 화살표로 표시된다. 밝은 회색으로 제시된 데이터는 살아 있는 조직의 응축물로부터 유래된 반면, 어두운 회색으로 제시된 데이터는 고정된 조직에서 유래된다. 실선은 각각의 데이터 세트의 평균을 나타내고, 음영 영역은 평균의 표준 오차를 나타낸다.
도 20a-20f는 응축물에서 단백질 국소화에 대한 면역학적 및 분획화 데이터를 제시한다. 도 20a는 전체 잎 조직(투입), 응축물 추출 및 원심분리 후의 상층액(상층액) 및 가용성 펠렛(pellet)에 대한 항-EPYC1(상단 행), 항-루비스코 큰 서브유닛(LSU; 두 번째 행), 항-루비스코 작은 서브유닛(SSU, 세 번째 행) 및 항-C. 레인하드티이 루비스코 작은 서브유닛 2(CrRbcS2; 하단 행) 면역블롯을 제시한다. 항-SSU 및 항-LSU 항체는 C. 레인하드티이 루비스코보다 고등 식물 루비스코에 대해 더 큰 특이성을 갖는 폴리클로날 루비스코 항체이다. 열은 EPYC1을 발현하지 않는 야생형 A. 탈리아나 식물(WT), C. 레인하드티이 루비스코 작은 서브유닛으로 보충되고 EPYC1을 발현하지 않는 A. 탈리아나 1a3b 루비스코 돌연변이체 식물(S2_Cr) 및 EPYC1-dGFP를 발현하는 S2_Cr 식물(S2_Cr_EPYC1)로부터의 샘플을 함유한다. WT 샘플의 경우, 투입만 제시된다. 화살표는 C. 레인하드티이 루비스코 작은 서브유닛 2(CrRbcS2; 15.5 kD); A. 탈리아나 루비스코 작은 서브유닛 1B, 2B, 및 3B(각각 AtRbcS1B, AtRbcS2B 및 AtRbcS3B; 14.8 kD); 및 A. 탈리아나 루비스코 작은 서브유닛 1A(AtRbcS1A; 14.7kD)의 예상 분자량과 일치하는 밴드를 나타낸다. 도 20b는 펠렛화된 응축물의 조성을 나타내는 쿠마시-염색된 SDS-PAGE 겔을 제시한다. 열은 도 20a에서와 같이 표지된다. 화살표는 EPYC1-GFP 융합 단백질(EPYC1::GFP)의 예상 분자량과 일치하는 밴드를 나타내며, EPYC1::GFP 표지 옆의 2개의 화살표는 EPYC1의 2개의 태깅된 버전인 EPYC1:eGFP 및 EPY1:tGFP; 루비스코 큰 서브유닛(LSU; 55 kD); C. 레인하드티이 루비스코 작은 서브유닛 2(CrRbcS2; 15.5 kD); 및 A. 탈리아나 루비스코 작은 서브유닛(AtRbcS)을 나타낸다. 도 20c는 EPYC1-GFP로 형질전환되고(S2_Cr_EPYC1 펠렛, 상단 이미지), EPYC1-GFP로 형질전환되지 않은(S2_Cr 펠렛, 하단 이미지) S2_Cr 식물로부터의 응축물로부터의 GFP 신호의 형광 현미경 이미지를 제시한다. 스케일 바는 50 μm를 나타낸다. 도 20d는 폴리클로날 항-루비스코(좌측) 또는 항-CrRbcS2(우측)로 프로빙된 EPYC1-dGFP를 발현하는 S2_Cr A. 탈리아나 식물의 엽록체의 대표적인 면역금 전자 현미경(EM) 이미지를 제시한다. 우측 이미지의 면역금-표지된 섹션은 원으로 표시된다. 스케일 바는 0.5 μm를 나타낸다. 도 20e는 EPYC1-dGFP를 발현하는 S2_Cr A. 탈리아나 식물의 면역금 EM 이미지에서 엽록체의 나머지와 비교한 응축물 내부에 있었던 면역금 입자의 비율의 산점도를 제시한다. 데이터는 폴리클로날 항-루비스코 항체(루비스코 항체) 또는 항-C. 레인하드티이 루비스코 작은 서브유닛 2 항체(CrRbcS2 항체)로 프로빙된 경우 37-39개의 엽록체로부터 유래된다. 산점도에 겹쳐진 선은 평균 및 SEM을 나타낸다. 도 20f는 EPYC1-dGFP를 발현하는 트랜스제닉 A. 탈리아나 S2_Cr 식물로부터의 엽육 세포의 단면에서 응축물을 갖는 엽록체의 대표적인 TEM 이미지를 제시한다. 섹션은 항-루비스코 항체로 면역금 표지(하나의 엽록체에서 화살표로 표시된 작은 흑색 점)에 의해 프로빙되었다. 스케일 바는 1 μm를 나타낸다.
도 21a-21k는 트랜스제닉 A. 탈리아나 식물에서 성장 및 광합성에 대한 루비스코의 EPYC1-매개 응축의 영향을 제시한다. 도 21a는 200 μmol 광자 m^-2 s^-1 광에서 성장된 EPYC1-dGFP WT를 발현하는 트랜스제닉 A. 탈리아나 식물(흑색 막대) 및 각각의 계통의 각각의 홀 응집체(백색 막대)의 밀리그램 단위의 신선한 중량(FW(mg))을 제시한다. 도 21b는 200 μmol 광자 m^-2 s^-1 광에서 성장된 EPYC1-dGFP WT를 발현하는 트랜스제닉 A. 탈리아나 식물(흑색 막대) 및 각각의 계통의 각각의 홀 응집체(백색 막대)의 밀리그램 단위의 건조 중량(DW(mg))을 제시한다. 도 21c는 900 μmol 광자 m^-2 s^-1 광에서 성장된 EPYC1-dGFP WT를 발현하는 트랜스제닉 A. 탈리아나 식물(흑색 막대) 및 각각의 계통의 각각의 홀 응집체(백색 막대)의 밀리그램 단위의 신선한 중량(FW(mg))을 제시한다. 도 21d는 900 μmol 광자 m^-2 s^-1 광에서 성장된 EPYC1-dGFP WT를 발현하는 트랜스제닉 A. 탈리아나 식물(흑색 막대) 및 각각의 계통의 각각의 홀 응집체(백색 막대)의 밀리그램 단위의 건조 중량(DW(mg))을 제시한다. 도 21a-21d에서, 표시된 데이터는 3개의 T2 EPYC1-dGFP S2_Cr 트랜스제닉 계통(각각 EP1, EP2 및 EP3) 및 EPYC1-dGFP WT 형질전환체(EpWT) 및 이들 각각의 홀 응집체로부의 것이다. 식물은 성장 32일 후에 측정되었다. 막대는 평균을 나타내고, 오차 막대는 각각의 계통에 대한 ≥12개 개별 식물에 대한 SEM을 나타낸다. 별표는 ANOVA에 의해 결정된 바와 같은 S2_Cr 배경과 WT 배경 사이의 성장에서의 유의한 차이(P<0.05)를 나타내고; 동일한 배경(즉, S2_Cr 또는 WT)에서의 트랜스제닉/대조군 계통은 성장에서 유의한 차이가 없었다. 도 21e-21g는 중량이 도 21a-21d에 표시된 동일한 8개의 S2_Cr 트랜스제닉 형질전환체 및 홀 응집체에 대한 시간 경과(발아 후 일)에 따른 로제트 면적(mm² 단위)의 플롯을 제시한다. 트랜스제닉 계통은 도 21a-21d에서와 같이 표지된다. 트랜스제닉 계통 EP1-3의 홀 응집체는 각각 Az1-3으로 표지된다. EpWT의 홀 응집체는 AzWT로 표지된다. x-축은 발아 후 일을 표시한다. 데이터 포인트는 각각의 계통에 대한 ≥12개의 개별 식물의 평균을 나타낸다. 오차 막대는 SEM을 나타낸다. 도 21e-21f는 200 μmol 광자 m^-2 s^-1 광 하에서 성장한 식물로부터의 데이터를 제시한다. 도 21e는 도 21f에 플롯팅된 동일한 데이터의 오버레이를 제시한다. 도 21g는 900 μmol 광자 m^-2 s^-1 광 하에서 성장한 식물로부터의 데이터를 제시한다. 도 21h는 도 21a-g에 기재된 동일한 8개의 A. 탈리아나 계통에 대한 μmol CO₂ m^-2 s^-1 단위의 순 CO₂ 동화(A)의 플롯을 제시한다. x-축은 포화 광(1500 μmol 광자 m^-2 s^-1) 하에서 세포 간 CO₂ 농도(C_i)를 표시한다. 식물 계통은 도 21c에서와 같이 표지된다. 데이터 포인트 및 오차 막대는 각각 10개 이상의 개별 로제트의 개별 잎에서 이루어진 측정의 평균 및 SEM을 제시한다. 도 21i-21k는 도 21a-21d에 포함된 동일한 8개의 A. 탈리아나 계통으로부터의 가스 교환 데이터로부터 유래된 광합성 파라미터를 제시한다. 식물 계통은 도 21a-21b에서와 같이 표지된다. 플롯은 15 내지 24개의 전체 로제트에 대해 이루어진 측정의 평균 및 SEM을 표시한다. 별표는 ANOVA에 의해 결정된 유의한 차이(P<0.05)를 나타낸다. 도 21i는 루비스코 부위의 μmol로 표준화된 CO₂의 주위 세포 외 농도에서 초 당 μmol CO₂에 의한 순 CO₂ 동화 속도(A_루비스코)의 플롯을 제시한다. 도 21j는 μmol CO₂ m^-2 s^-1에 의한 루비스코 카르복실화의 최대 속도(V_cmax)의 플롯을 제시한다. 도 21k는 μmol 전자(e^-) m^-2 s^-1에 의한 최대 전자 수송(J_max)의 플롯을 제시한다.

하기 설명은 예시적인 방법, 파라미터 등을 기술한다. 그러나, 이러한 설명이 본 개시의 범위를 제한하려는 것이 아니고 예시적인 구체예의 설명으로서 제공되는 것으로 의도된다.

유전적으로 변경된 식물

본 개시의 양태는 변형된 루비스코 및 필수 피레노이드 성분 1(EPYC1) 폴리펩티드의 응집체의 형성을 위해 변형된 루비스코를 포함하는 유전적으로 변경된 고등 식물 또는 이의 일부를 포함한다. 변형된 루비스코 및 EPYC1의 응집체는 또한, 변형된 루비스코 및 EPYC1의 응축물로서 지칭될 수 있다. 이 양태의 추가 구체예는 조류 루비스코 작은 서브유닛(SSU) 폴리펩티드 또는 변형된 고등 식물 루비스코 SSU 폴리펩티드인 변형된 루비스코를 포함하며, 여기서, 고등 식물 루비스코 SSU 폴리펩티드의 적어도 일부는 조류 루비스코 SSU 폴리펩티드의 적어도 일부로 대체된다. 전술한 임의의 구체예와 조합될 수 있는, 이 양태의 추가 구체예에서, 유전적으로 변경된 고등 식물 또는 이의 일부는 EPYC1 폴리펩티드 및 응집체를 추가로 포함한다. 전술한 임의의 구체예와 조합될 수 있는, 이 양태의 또 다른 구체예는 공초점 현미경법, 투과 전자 현미경법(TEM), 저온-전자 현미경법(cryo-EM), 액체-액체상 분리 검정, 또는 상 분리 검정에 의해 검출 가능한 응집체를 포함한다. 이 양태의 또 다른 구체예는 엽록소 자가형광을 검정하고 응집체가 존재할 때 엽록소 자가형광의 변위를 관찰함으로써 검출 가능한 응집체를 포함한다. 전술한 임의의 구체예와 조합될 수 있는, 바람직한 구체예는 생체 내에서 공초점 현미경법에 의해 검출 가능한 응집체를 포함한다. 이 양태의 추가 구체예는 내부 혼합을 수행한 응집체를 포함한다. 이 양태의 추가 구체예는 엽록체 틸라코이드 막을 치환하는 응집체를 포함한다. 변형된 고등 식물 루비스코를 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예는 내인성 루비스코 SSU 폴리펩티드를 포함하는 변형된 고등 식물 루비스코 폴리펩티드를 포함한다. 변형된 고등 식물 루비스코를 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 변형된 고등 식물 루비스코 SSU 폴리펩티드는 하나 이상의 고등 식물 루비스코 SSU α-나선을 하나 이상의 조류 루비스코 SSU α-나선으로 치환하고/하거나, 하나 이상의 고등 식물 루비스코 SSU β-가닥을 하나 이상의 조류 루비스코 SSU β-가닥으로 치환하고/하거나 고등 식물 루비스코 SSU βA-βB 루프를 조류 루비스코 SSU βA-βB 루프로 치환함으로써 변형되었다. 이 양태의 추가 구체예는 2개의 고등 식물 루비스코 SSU α-나선을 2개의 조류 루비스코 SSU α-나선으로 치환함으로써 변형된 고등 식물 루비스코 SSU 폴리펩티드를 포함한다. 이 양태의 추가 구체예에서, 2개의 고등 식물 루비스코 SSU α-나선은 SEQ ID NO: 1의 아미노산 23-35 및 아미노산 80-93에 상응하고, 2개의 조류 루비스코 SSU α-나선은 SEQ ID NO: 2의 아미노산 23-35 및 아미노산 86-99에 상응한다. 2개의 고등 식물 루비스코 SSU α-나선을 2개의 조류 루비스코 SSU α-나선으로 대체한 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 고등 식물 루비스코 SSU 폴리펩티드는 4개의 고등 식물 루비스코 SSU β-가닥을 4개의 조류 루비스코 SSU β-가닥으로 대체하고, 고등 식물 루비스코 SSU βA-βB 루프를 조류 루비스코 SSU βA-βB 루프로 대체함으로써 추가로 변형된다. 이 양태의 추가 구체예에서, 4개의 고등 식물 루비스코 SSU β-가닥은 SEQ ID NO: 1의 아미노산 39-45, 아미노산 68-70, 아미노산 98-105 및 아미노산 110-118에 상응하고, 4개의 조류 루비스코 SSU β-가닥은 SEQ ID NO: 2의 아미노산 39-45, 아미노산 74-76, 아미노산 104-111 및 아미노산 116-124에 상응하고, 고등 식물 루비스코 SSU βA-βB 루프는 SEQ ID NO: 1의 아미노산 46-67에 상응하고, 조류 루비스코 SSU βA-βB 루프는 SEQ ID NO: 2의 아미노산 46-73에 상응한다.

변형된 고등 식물 루비스코를 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예는 SEQ ID NO: 140, SEQ ID NO: 141, SEQ ID NO: 142, SEQ ID NO: 143, SEQ ID NO: 144, SEQ ID NO: 145, SEQ ID NO: 146, SEQ ID NO: 147, SEQ ID NO: 148, SEQ ID NO: 149, SEQ ID NO: 150, SEQ ID NO: 151, SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, 또는 SEQ ID NO: 156과 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 고등 식물 루비스코 SSU 폴리펩티드를 포함한다. 변형된 고등 식물 루비스코를 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예는 SEQ ID NO: 2, SEQ ID NO: 30, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 162, SEQ ID NO: 163, 또는 SEQ ID NO: 164와 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 조류 루비스코 SSU 폴리펩티드를 포함한다. 이 양태의 추가 구체예에서, 조류 루비스코 SSU 폴리펩티드는 SEQ ID NO: 2, SEQ ID NO: 30, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 162, SEQ ID NO: 163 또는 SEQ ID NO: 164이다. 변형된 고등 식물 루비스코를 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예는 변형 없는 고등 식물 루비스코 SSU 폴리펩티드와 비교하여 EPYC1 폴리펩티드에 대한 증가된 또는 변경된 친화성을 갖는 변형된 고등 식물 루비스코 SSU 폴리펩티드를 포함한다.

본 개시의 추가적인 양태에서, 유전적으로 변경된 고등 식물 또는 이의 일부는 변형된 루비스코 및 EPYC1 폴리펩티드의 응집체를 형성하기 위한 EPYC1 폴리펩티드를 포함한다. 변형된 루비스코 및 EPYC1의 응집체는 또한, 변형된 루비스코 및 EPYC1의 응축물로서 지칭될 수 있다. 전술한 임의의 양태의 추가 구체예에서, EPYC1 폴리펩티드는 조류 EPYC1 폴리펩티드이다. 이 양태의 추가 구체예는 SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 165, SEQ ID NO: 166, 또는 SEQ ID NO: 167과 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열을 갖는 조류 EPYC1 폴리펩티드를 포함한다. 이 양태의 또 다른 구체예에서, 조류 EPYC1 폴리펩티드는 SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 165, SEQ ID NO: 166 또는 SEQ ID NO: 167이다. 이 양태의 추가 구체예는 SEQ ID NO: 35에 해당하는 성숙 또는 트렁케이션된 형태의 EPYC1인 EPYC1을 포함한다. 이 양태의 추가 구체예는 SEQ ID NO: 35에 해당하는 성숙한 천연 형태의 EPYC1을 형성하기 위해 잔기 26(V)과 27(A) 사이에 트렁케이션된 SEQ ID NO: 34에 해당하는 전장 형태의 EPYC1을 포함한다. 전술한 임의의 양태의 또 다른 구체예에서, EPYC1 폴리펩티드는 변형된 EPYC1 폴리펩티드이다. 이 양태의 추가 구체예에서, 변형된 EPYC1 폴리펩티드는 제1 조류 EPYC1 반복 영역의 1개 이상, 2개 이상, 4개 이상 또는 8개의 직렬 카피를 포함한다. 이 양태의 추가 구체예에서, 변형된 EPYC1 폴리펩티드는 제1 조류 EPYC1 반복 영역의 4개의 직렬 카피 또는 8개의 직렬 카피를 포함한다. 제1 조류 EPYC1 반복 영역의 탠뎀 카피를 포함하는 변형된 EPYC1 폴리펩티드를 포함하는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예는 SEQ ID NO: 36과 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 제1 조류 EPYC1 반복 영역을 포함한다. 이 양태의 추가 구체예에서, 제1 조류 EPYC1 반복 영역은 SEQ ID NO: 36이다. 변형된 EPYC1을 포함하는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 변형된 EPYC1 폴리펩티드는 천연 EPYC1 선도 서열 없이 및/또는 C-말단 캡을 포함하여 발현된다. 이 양태의 또 다른 구체예는 SEQ ID NO: 42와 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드를 포함하는 천연 EPYC1 선도 서열, 및 SEQ ID NO: 41과 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드를 포함하는 C-말단 캡을 포함한다. 이 양태의 추가 구체예에서, C-말단 캡은 SEQ ID NO: 41이다. 변형된 EPYC1을 포함하는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 변형된 EPYC1 폴리펩티드는 상응하는 변형되지 않은 EPYC1 폴리펩티드와 비교하여 루비스코 SSU 폴리펩티드에 대해 증가된 친화성을 갖는다.

전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 양태에서, 응집체는 식물 세포의 적어도 하나의 엽록체의 엽록체 기질에 국한된다. 응집체는 또한, 응축물로서 지칭될 수 있다. 이 양태의 추가 구체예에서, 식물 세포는 잎 엽육 세포이다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 식물은 동부콩(예를 들어, 검은콩, 캐트장(catjang), 야드롱 콩(yardlong bean), 비그나 운구이쿨라타(Vigna unguiculata)), 대두(예를 들어, 대두, 소야 빈(soya bean), 글리신 맥스(Glycine max), 글리신 소야(Glycine soja)), 카사바(예를 들어, 마니옥, 유카, 마니호트 에스쿨렌타(Manihot esculenta)), 쌀(예를 들어, 인디카 쌀, 자포니카 쌀, 향미, 찹쌀, 오리자 사티바(Oryza sativa), 오리자 글라베리마(Oryza glaberrima)), 밀(예를 들어, 일반 밀, 스펠트, 듀럼, 외알밀, 에머밀, 카뮤, 트리티쿰 아에스티붐(Triticum aestivum), 트리티쿰 스펠타(Triticum spelta), 트리티쿰 듀럼(Triticum durum), 트리티쿰 우라르투(Triticum urartu), 트리티쿰 모노코쿰(Triticum monococcum), 트리트쿰 투라니쿰(Triticum turanicum), 트리티쿰(Triticum) 종), 보리(예를 들어, 호르데움 불가레(Hordeum vulgare)), 호밀(즉, 세칼레 세레알레(Secale cereale)), 귀리(즉, 아베나 사티바(Avena sativa)), 토마토(예를 들어, 솔라눔 리코페르시쿰(Solanum lycopersicum)), 감자(예를 들어, 적갈색 감자, 노란 감자, 적색 감사, 솔라눔 튜베로숨(Solanum tuberosum)), 카놀라(예를 들어, 브라시카 라파(Brassica rapa), 브라시아 나푸스(Brassica napus), 브라시카 준세아(Brassica juncea)), 또는 다른 C3 작물의 군으로부터 선택된다. 일부 구체예에서, 식물은 담배(즉, 니코티아나 타바쿰(Nicotiana tabacum), 니코티아나 에드워드소니(Nicotiana edwardsonii), 니코티아나 플룸바그니폴리아(Nicotiana plumbagnifolia), 니코티아나 롱기플로라(Nicotiana longiflora), 니코티아나 벤타미아나(Nicotiana benthamiana)) 또는 아라비돕시스(Arabidopsis)(즉, 바위냉이, 애기장대, 아라비돕시스 탈리아나(Arabidopsis thaliana))이다.

본 개시의 추가 양태는 EPYC1 폴리펩티드를 인코딩하는 제1 핵산 서열 및 변형된 루비스코를 인코딩하는 제2 핵산 서열을 포함하는 유전적으로 변경된 고등 식물 또는 이의 일부를 포함한다. 이 양태의 추가 구체예는 SEQ ID NO: 35에 해당하는 성숙 또는 트렁케이션된 형태의 EPYC1인 EPYC1을 포함한다. 이 양태의 추가 구체예는 SEQ ID NO: 35에 해당하는 성숙한 천연 형태의 EPYC1을 형성하기 위해 잔기 26(V)과 27(A) 사이에 트렁케이션된 SEQ ID NO: 34에 해당하는 전장 형태의 EPYC1을 포함한다. 이 양태의 또 다른 구체예는 2개의 별도의 발현 카세트를 포함하는 바이너리 벡터가 도입된 제1 핵산 서열을 포함하며, 여기서, 각 발현 카세트는 제1 핵산 서열을 포함한다. 이 양태의 추가 구체예에서, 제1 핵산 서열은 제1 프로모터에 작동 가능하게 연결된다. 이 양태의 추가 구체예에서, 제1 프로모터는 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 또는 엽육 세포 특정 프로모터의 군으로부터 선택된다. 이 양태의 또 다른 구체예는 CaMV35S 프로모터, CaMV35S 프로모터의 유도체, CsVMV 프로모터, CsVMV 프로모터의 유도체, 옥수수 유비퀴틴 프로모터, 트레호일 프로모터, 정맥 모자이크 카사바 바이러스 프로모터, 및 A. 탈리아나 UBQ10 프로모터의 군으로부터 선택된 항시적 프로모터인 제1 프로모터를 포함한다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예는 고등 식물 세포에서 기능성인 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결된 제1 핵산 서열, 및 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않은 제1 핵산 서열을 포함한다. 이 양태의 추가 구체예는 SEQ ID NO: 63과 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 엽록체의 전이 펩티드를 포함한다. 이 양태의 또 다른 구체예에서, 엽록체의 전이 펩티드는 SEQ ID NO: 63이다. 천연 EPYC1 선도 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, 천연 EPYC1 선도 서열은 SEQ ID NO: 65의 뉴클레오티드 60-137에 상응한다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제1 핵산 서열은 1개 또는 2개의 종결인자에 작동 가능하게 연결된다. 이 양태의 추가 구체예는 HSP 종결인자, NOS 종결인자, OCS 종결인자, 인트론리스(intronless) 엑텐신 종결인자, 35S 종결인자, pinII 종결인자, rbcS 종결인자, 액틴 종결인자, 또는 이들의 임의의 조합의 군으로부터 선택된 1 또는 2개의 종결인자를 포함한다.

전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예는 제2 프로모터에 작동 가능하게 연결된 제2 핵산 서열을 포함한다. 이 양태의 추가 구체예에서, 제2 프로모터는 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 또는 엽육 세포 특정 프로모터의 군으로부터 선택된다. 이 양태의 추가적인 구체예에서, 제2 프로모터는 CaMV35S 프로모터, CaMV35S 프로모터의 유도체, CsVMV 프로모터, CsVMV 프로모터의 유도체, 옥수수 유비퀴틴 프로모터, 트레포일 프로모터, 엽맥 모자이크 카사바 바이러스 프로모터 및 A. 탈리아나 UBQ10 프로모터의 군으로부터 선택된 항시적 프로모터이다. 제2 프로모터에 작동 가능하게 연결된 제2 핵산 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제2 핵산 서열은 조류 루비스코 SSU 폴리펩티드를 인코딩한다. 이 양태의 추가적인 구체예에서, 제2 핵산 서열은 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제4 핵산 서열에 작동 가능하게 연결되고, 상기 제2 핵산 서열은 천연 조류 SSU 선도 서열을 인코딩하지 않고 천연 조류 SSU 선도 서열을 인코딩하는 핵산 서열에 작동 가능하게 연결되지 않는다. 이 양태의 추가 구체예에서, 엽록체의 전이 펩티드는 SEQ ID NO: 64와 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드이다. 이 양태의 또 다른 구체예에서, 엽록체의 전이 펩티드는 SEQ ID NO: 64이다. 천연 조류 SSU 선도 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 천연 조류 SSU 선도 서열은 SEQ ID NO: 32의 아미노산 1 내지 45에 상응한다. 천연 조류 SSU 선도 서열을 갖는 준설한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 천연 조류 SSU 선도 서열은 SEQ ID NO: 31의 아미노산 1 내지 45에 해당한다. 제2 프로모터에 작동 가능하게 연결된 제2 핵산 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, 제2 핵산 서열은 종결인자에 작동 가능하게 연결된다. 이 양태의 추가적인 구체예에서, 종결인자는 HSP 종결인자, NOS 종결인자, OCS 종결인자, 인트론리스 엑텐신 종결인자, 35S 종결인자, pinII 종결인자, rbcS 종결인자 또는 액틴 종결인자의 군으로부터 선택된다. 제2 프로모터에 작동 가능하게 연결된 제2 핵산 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제2 핵산 서열은 변형된 고등 식물 루비스코 SSU 폴리펩티드를 인코딩하고, 여기서 고등 식물 루비스코 SSU 폴리펩티드의 적어도 일부는 조류 루비스코 SSU 폴리펩티드의 적어도 일부로 대체된다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, EPYC1 폴리펩티드는 전술한 구체예 중 어느 하나의 EPYC1 폴리펩티드이다. 이 양태의 추가 구체예는 SEQ ID NO: 35에 해당하는 성숙 또는 트렁케이션된 형태의 EPYC1인 EPYC1을 포함한다. 이 양태의 추가 구체예는 SEQ ID NO: 35에 해당하는 성숙한 천연 형태의 EPYC1을 형성하기 위해 잔기 26(V)과 27(A) 사이에 트렁케이션된 SEQ ID NO: 34에 해당하는 전장 형태의 EPYC1을 포함한다. 이 양태의 추가적인 구체예에서, 루비스코 SSU 폴리펩티드는 전술한 구체예 중 어느 하나의 루비스코 SSU 폴리펩티드이다.

전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예는 루비스코 폴리펩티드 및 EPYC1 폴리펩티드의 응집체를 포함하는 식물의 적어도 하나의 세포 또는 이의 일부를 포함한다. 이 양태의 추가 구체예에서, 응집체는 적어도 하나의 식물 세포의 적어도 하나의 엽록체의 엽록체 기질에 국한된다. 이 양태의 추가적인 구체예에서, 식물 세포는 잎 엽육 세포이다. 루비스코 폴리펩티드 및 EPYC1 폴리펩티드의 응집체를 포함하는 식물 또는 이의 일부를 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 응집체는 공초점 현미경법, 투과 전자 현미경법(TEM), 저온-전자 현미경법(cryo-EM), 또는 액체-액체상 분리 검정에 의해 검출 가능하다. 이 양태의 또 다른 구체예는 엽록소 자가형광을 검정하고 응집체가 존재할 때 엽록소 자가형광의 변위를 관찰함으로써 검출 가능한 응집체를 포함한다. 전술한 임의의 구체예와 조합될 수 있는, 바람직한 구체예는 생체 내에서 공초점 현미경법에 의해 검출 가능한 응집체를 포함한다. 이 양태의 추가 구체예는 내부 혼합을 수행한 응집체를 포함한다. 이 양태의 추가 구체예는 엽록체 틸라코이드 막을 치환하는 응집체를 포함한다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 식물은 동부콩(예를 들어, 검은콩, 캐트장(catjang), 야드롱 콩(yardlong bean), 비그나 운구이쿨라타(Vigna unguiculata)), 대두(예를 들어, 대두, 소야 빈(soya bean), 글리신 맥스(Glycine max), 글리신 소야(Glycine soja)), 카사바(예를 들어, 마니옥, 유카, 마니호트 에스쿨렌타(Manihot esculenta)), 쌀(예를 들어, 인디카 쌀, 자포니카 쌀, 향미, 찹쌀, 오리자 사티바(Oryza sativa), 오리자 글라베리마(Oryza glaberrima)), 밀(예를 들어, 일반 밀, 스펠트, 듀럼, 외알밀, 에머밀, 카뮤, 트리티쿰 아에스티붐(Triticum aestivum), 트리티쿰 스펠타(Triticum spelta), 트리티쿰 듀럼(Triticum durum), 트리티쿰 우라르투(Triticum urartu), 트리티쿰 모노코쿰(Triticum monococcum), 트리트쿰 투라니쿰(Triticum turanicum), 트리티쿰(Triticum) 종), 보리(예를 들어, 호르데움 불가레(Hordeum vulgare)), 호밀(즉, 세칼레 세레알레(Secale cereale)), 귀리(즉, 아베나 사티바(Avena sativa)), 토마토(예를 들어, 솔라눔 리코페르시쿰(Solanum lycopersicum)), 감자(예를 들어, 적갈색 감자, 노란 감자, 적색 감사, 솔라눔 튜베로숨(Solanum tuberosum)), 카놀라(예를 들어, 브라시카 라파(Brassica rapa), 브라시아 나푸스(Brassica napus), 브라시카 준세아(Brassica juncea)), 또는 다른 C3 작물의 군으로부터 선택된다. 일부 구체예에서, 식물은 담배(즉, 니코티아나 타바쿰(Nicotiana tabacum), 니코티아나 에드워드소니(Nicotiana edwardsonii), 니코티아나 플룸바그니폴리아(Nicotiana plumbagnifolia), 니코티아나 롱기플로라(Nicotiana longiflora), 니코티아나 벤타미아나(Nicotiana benthamiana)) 또는 아라비돕시스(Arabidopsis)(즉, 바위냉이, 애기장대, 아라비돕시스 탈리아나(Arabidopsis thaliana))이다.

전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, 유전적으로 변경된 고등 식물은 전술한 구체예 중 어느 하나의 식물 또는 식물 부분으로부터 생성된다. 식물 부분과 관련하여 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 추가 구체예는 잎, 줄기, 뿌리, 괴경, 꽃, 종자, 알맹이, 그레인, 열매, 세포, 또는 이의 일부인 식물 부분 및 하나 이상의 유전적 변형을 포함하는 유전적으로 변경된 식물 부분을 포함한다. 이 양태의 추가 구체예는 열매, 괴경, 알맹이, 또는 그레인인 식물 부분을 포함한다. 화분립 또는 배주와 관련하여 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예는 전술한 구체예 중 어느 하나의 식물의 유전적으로 변경된 화분립 또는 유전적으로 변경된 배주를 포함하며, 여기서, 유전적으로 변경된 화분립 또는 유전적으로 변경된 배주는 하나 이상의 유전적 변경을 포함한다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예는 전술한 임의의 구체예의 유전적으로 변경된 식물로부터 생성된 유전적으로 변경된 원형질체를 포함하며, 여기서, 유전적으로 변경된 원형질체는 하나 이상의 유전적 변경을 포함한다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예는 전술한 구체예 중 어느 하나의 유전적으로 변경된 식물로부터의 원형질체 또는 세포로부터 생성된 유전적으로 변경된 조직 배양물을 포함하며, 여기서, 세포 또는 원형질체는 잎, 잎 엽육 세포, 꽃밥, 암술, 줄기, 육경, 뿌리, 뿌리끝, 괴경, 열매, 종자, 알갱이, 그레인, 꽃, 자엽, 배축, 배아, 또는 분열조직 세포의 군으로부터 선택된 식물 부분으로부터 생성되며, 여기서, 유전적으로 변경된 조직 배양물은 하나 이상의 유전적 변경을 포함한다. 이 양태의 추가 구체예는 하나 이상의 유전적 변경을 포함하는 유전적으로 변경된 조직 배양물로부터 재생된 유전적으로 변경된 식물을 포함한다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예는 전술한 구체예의 어느 하나의 유전적으로 변경된 식물로부터 생성된 유전적으로 변경된 식물 종자를 포함한다.

유전적으로 변경된 식물을 생산 및 재배하는 방법

본 개시의 다른 양태는 a) 식물 세포, 조직, 또는 다른 체외이식편에 EPYC1 폴리펩티드를 인코딩하는 제1 핵산 서열을 도입하고; b) 유전적으로 변경된 소식물체에 식물 세포, 조직, 또는 다른 체외이식편을 재생하고; c) EPYC1 폴리펩티드를 인코딩하는 제1 핵산으로 유전적으로 변경된 소식물체를 유전적으로 변경된 식물로 성장시키는 것을 포함하는, 전술한 임의의 구체예의 유전적으로 변경된 고등 식물을 생산하는 방법을 포함한다. 이 양태의 추가 구체예는 SEQ ID NO: 35에 해당하는 성숙 또는 트렁케이션된 형태의 EPYC1인 EPYC1을 포함한다. 이 양태의 추가 구체예는 SEQ ID NO: 35에 해당하는 성숙한 천연 형태의 EPYC1을 형성하기 위해 잔기 26(V)과 27(A) 사이에서 트렁케이션된 SEQ ID NO: 34에 해당하는 전장 형태의 EPYC1을 포함한다. 이 양태의 추가 구체예는 단계 (a) 전에 또는 단계 (a)와 동시에, 식물 세포, 조직, 또는 다른 체외이식편에 변형된 루비스코 SSU 폴리펩티드를 인코딩하는 제2 핵산 서열을 도입하는 것을 추가로 포함하며, 여기서, 단계 (c)의 유전적으로 변경된 식물은 변형된 루비스코 SSU 폴리펩티드를 인코딩하는 제2 핵산을 추가로 포함한다. 이 양태의 추가 구체예는 단계 (b) 전에 식물 세포, 조직, 또는 다른 체외이식편을 스크리닝 또는 선택하거나; 단계 (b)와 단계 (c) 사이에 소식물체를 스크리닝 또는 선택하거나; 단계 (c) 후에 식물을 스크리닝 또는 선택함으로써 제1 핵산 서열 및 선택적으로 제2 핵산 서열의 연속적인 도입을 식별하는 것을 추가로 포함한다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 형질전환은 입자 충격(즉, 바이올리스틱(biolistics), 유전자 건), 아그로박테륨-매개 형질전환, 리조븀-매개 형질전환, 또는 형질체 트랜스펙션 또는 형질전환을 이용하여 수행된다.

전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제1 핵산 서열은 제1 벡터와 함께 도입되고, 제2 핵산 서열은 제2 벡터와 함께 도입된다. 이 양태의 추가 구체예는 2개의 별도의 발현 카세트를 포함하는 바이너리 벡터가 도입된 제1 핵산 서열을 포함하며, 여기서, 각 발현 카세트는 제1 핵산 서열을 포함한다. 이 양태의 추가 구체예에서, 제1 핵산 서열은 제1 프로모터에 작동 가능하게 연결된다. 이 양태의 추가적인 구체예에서, 제1 프로모터는 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 또는 엽육 세포 특정 프로모터의 군으로부터 선택된다. 이 양태의 또 다른 구체예에서, 제1 프로모터는 CaMV35S 프로모터, CaMV35S 프로모터의 유도체, CsVMV 프로모터, CsVMV 프로모터의 유도체, 옥수수 유비퀴틴 프로모터, 트레호일 프로모터, 정맥 모자이크 카사바 바이러스 프로모터, 또는 A. 탈리아나 UBQ10 프로모터의 군으로부터 선택된 항시적 프로모터이다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제1 핵산 서열은 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1핵산 서열은 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않는다. 이 양태의 또 다른 구체예에서, 엽록체의 전이 펩티드 SEQ ID NO: 63과 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드이다. 이 양태의 또 다른 구체예에서, 내인성 엽록체의 전이 펩티드는 SEQ ID NO: 63이다. 천연 EPYC1 선도 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 천연 EPYC1 선도 서열은 SEQ ID NO: 65의 뉴클레오티드 60 내지 137에 상응한다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, 제1 핵산 서열은 1개 또는 2개의 종결인자에 작동 가능하게 연결된다. 이 양태의 추가 구체예에서, 1개 또는 2개의 종결인자는 HSP 종결인자, NOS 종결인자, OCS 종결인자, 인트론리스 엑텐신 종결인자, 35S 종결인자, pinII 종결인자, rbcS 종결인자, 액틴 종결인자, 또는 이들의 임의의 조합의 군으로부터 선택된다.

전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가적인 구체예에서, 제2 핵산 서열은 제2 프로모터에 작동 가능하게 연결된다. 이 양태의 추가 구체예에서, 제2 프로모터는 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 및 엽육 세포 특정 프로모터로 구성된 군으로부터 선택된다. 이 양태의 또 다른 구체예는 CaMV35S 프로모터, CaMV35S 프로모터의 유도체, CsVMV 프로모터, CsVMV 프로모터의 유도체, 옥수수 유비퀴틴 프로모터, 트레호일 프로모터, 정맥 모자이크 카사바 바이러스 프로모터, 또는 A. 탈리아나 UBQ10 프로모터로 이루어진 군으로부터 선택된 항시적 프로모터인 제2 프로모터를 포함한다. 제2 프로모터에 작동 가능하게 연결된 제2 핵산 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제2 핵산 서열은 조류 SSU 폴리펩티드를 인코딩한다. 이 양태의 추가적인 구체예에서, 제2 핵산 서열은 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제4 핵산 서열에 작동 가능하게 연결되고, 상기 제2 핵산 서열은 천연 SSU 선도 서열을 인코딩하지 않고 천연 SSU 선도 서열을 인코딩하는 핵산 서열에 작동 가능하게 연결되지 않는다. 이 양태의 추가 구체예는 SEQ ID NO: 64와 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 엽록체의 전이 펩티드를 포함한다. 이 양태의 또 다른 구체예에서, 엽록체의 전이 펩티드는 SEQ ID NO: 64이다. 천연 SSU 선도 서열을 갖는, 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예는 SEQ ID NO: 32의 아미노산 1 내지 45에 해당하는 천연 SSU 선도 서열을 포함한다. 천연 조류 SSU 선도 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 천연 조류 SSU 선도 서열은 SEQ ID NO: 31의 아미노산 1 내지 45에 해당한다. 제2 프로모터에 작동 가능하게 연결된 제2 핵산 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제2 핵산 서열은 종결인자에 작동 가능하게 연결된다. 이 양태의 추가 구체예는 HSP 종결인자, NOS 종결인자, OCS 종결인자, 인트론리스 엑텐신 종결인자, 35S 종결인자, pinII 종결인자, rbcS 종결인자, 또는 액틴 종결인자의 군으로부터 선택된 종결인자를 포함한다. 제2 프로모터에 작동 가능하게 연결된 제2 핵산 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, 제2 핵산 서열은 변형된 고등 식물 루비스코 SSU 폴리펩티드를 인코딩하고, 여기서 고등 식물 루비스코 SSU 폴리펩티드의 적어도 일부는 조류 루비스코 SSU 폴리펩티드의 적어도 일부로 대체된다.

제2 벡터를 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, 제2 벡터는 내인성 루비스코 SSU 폴리펩티드를 인코딩한느 핵산에 작동 가능하게 연결된 핵 게놈 서열을 표적화하는 하나 이상의 유전자 편집 성분을 포함한다. 이 양태의 추가 구체예는 핵 세놈 서열을 표적화하는 리보핵산 단백질 복합체; TALEN 단백질 인코딩 서열을 포함하는 벡터로서, TALEN 단백질이 핵 게놈 서열을 표적화하는 벡터; ZFN 단백질 인코딩 서열을 포함하는 벡터로서, ZFN 단백질이 핵 게놈 서열을 표적화하는 벡터; 핵 게놈 서열을 표적화하는 올리고뉴클레오티드 공여체(ODN); 또는 CRISPR/Cas 효소 인코딩 서열 및 표적화 서열을 포함하는 벡터로서, 표적화 서열은 핵 게놈 서열을 표적화하는 벡터의 군으로부터 선택된 하나 이상의 유전자 편집 성분을 포함한다. 유전자 편집을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예는 조류 루비스코 SSU 폴리펩티드의 적어도 일부로 대체되는 고등 식물 루비스코 SSU 폴리펩티드의 적어도 일부인 유전자 편집의 결과를 포함한다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, EPYC1 폴리펩티드는 전술한 구체예 중 어느 하나의 EPYC1 폴리펩티드이다. 이 양태의 추가적인 구체예에서, 루비스코 SSU 폴리펩티드는 전술한 구체예 중 어느 하나의 루비스코 SSU 폴리펩티드이다.

고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결된 제1 핵산 서열로서, 상기 제1 핵산 서열이 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않은, 제1 핵산 서열 및 1개 또는 2개의 종결인자에 작동 가능하게 연결된 제1 핵산 서열을 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예에서, 제1 벡터는 제1 핵산 서열의 제1 카피를 포함하고, 여기서 제1 핵산 서열은 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않고, 상기 제1 핵산 서열은 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1 핵산 서열은 제1 프로모터에 작동 가능하게 연결되고, 상기 제1 핵산 서열은 1개의 종결인자에 작동 가능하게 연결되며; 상기 제1 벡터는 제1 핵산 서열의 제2 카피를 추가로 포함하고, 여기서 제1 핵산 서열은 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않고, 상기 제1 핵산 서열은 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1 핵산 서열은 제3 프로모터에 작동 가능하게 연결되고, 상기 제1 핵산 서열은 2개의 종결인자에 작동 가능하게 연결된다. 이 양태의 추가 구체예에서, 제1 프로모터는 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 또는 엽육 세포 특정 프로모터의 군으로부터 선택되고; 제3 프로모터는 항시적 프로모터, 유도적 프로모터, 잎 특정 프로모터 또는 엽육 세포 특정 프로모터의 군으로부터 선택되고; 상기 제1 및 제3 프로모터는 동일하지 않다. 이 양태의 또 다른 구체예는 SEQ ID NO: 63과 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 엽록체의 전이 펩티드를 포함한다. 이 양태의 또 다른 구체예에서, 천연 EPYC1 선도 서열은 SEQ ID NO: 65의 뉴클레오티드 60 내지 137에 상응한다. 이 양태의 추가적인 구체예에서, 종결인자는 HSP 종결인자, NOS 종결인자, OCS 종결인자, 인트론리스 엑텐신 종결인자, 35S 종결인자, pinII 종결인자, rbcS 종결인자, 액틴 종결인자 또는 이들의 임의의 조합의 군으로부터 선택된다. 전술한 임의의 구체예와 조합될 수 있는 이 양태의 추가 구체예에서, 식물 또는 식물 부분은 전술한 구체예 중 어느 하나의 방법에 의해 생성된다.

본 개시의 추가 양태는 a) 유전적으로 변경된 묘목, 유전적으로 변경된 소식물체, 유전적으로 변경된 삽목, 유전적으로 변경된 괴경, 유전적으로 변경된 뿌리 또는 유전적으로 변경된 종자를 토양에 심어 유전적으로 변경된 식물을 생산하거나, 유전적으로 변경된 묘목, 유전적으로 변경된 소식물체 또는 유전적으로 변경된 삽목을 근경 또는 토양에서 성장한 제2 식물에 접목하여 유전적으로 변경된 식물을 생산하는 단계; b) 수확 가능한 종자, 수확 가능한 잎, 수확 가능한 뿌리, 수확 가능한 삽목, 수확 가능한 목재, 수확 가능한 과일, 수확 가능한 커널, 수확 가능한 괴경 및/또는 수확 가능한 곡물을 생산하도록 식물을 재배하는 단계; 수확 가능한 종자, 수확 가능한 잎, 수확 가능한 뿌리, 수확 가능한 삽목, 수확 가능한 목재, 수확 가능한 과일, 수확 가능한 커널, 수확 가능한 괴경 및/또는 수확 가능한 곡물을 수확하는 단계; 및 c) 수확 가능한 종자, 수확 가능한 잎, 수확 가능한 뿌리, 수확 가능한 삽목, 수확 가능한 목재, 수확 가능한 과일, 수확 가능한 커널, 수확 가능한 괴경 및/또는 수확 가능한 곡물을 수확하는 단계를 포함하는, 유전적으로 변경된 식물을 갖는 전술한 임의의 구체예의 유전적으로 변경된 식물을 재배하는 방법을 포함한다. 이 양태의 추가 구체예는 WT 식물의 식물 성장 속도 및/또는 광합성 효율과 유사한 전술한 임의의 구체예의 유전적으로 변경된 식물의 식물 성장 속도 및/또는 광합성 효율을 포함한다. 이 양태의 또 다른 구체예는 WT 식물의 식물 성장 속도 및/또는 광합성 효율과 비교하여 개선된 전술한 임의의 구체예의 유전적으로 변경된 식물의 식물 성장 속도 및/또는 광합성 효율을 포함한다. 이 양태의 또 다른 구체예는 WT 식물의 수율과 비교하여 개선되는 전술된 임의의 구체예의 유전적으로 변경된 식물의 수율을 포함한다. 이 양태의 추가 구체예는 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 100%만큼 개선된 수율을 포함한다.

유전적으로 변경된 식물 및 식물 세포를 생산하는 분자 생물학적 방법

본 발명의 일 구체예는 변형된 루비스코 및 EPYC1 폴리펩티드의 응집체 또는 응축물의 형성을 위한 변형된 루비스코 및 필수 피레노이드 성분 1(EPYC1)을 함유한 유전적으로 변경된 식물 또는 식물 세포를 제공한다. 예를 들어, 본 개시는 EPYC1 폴리펩티드를 인코딩하는 제1 핵산 서열 및 변형된 루비스코를 인코딩하는 제2 핵산 서열을 갖는 식물을 제공한다. 또한, 본 개시는 조류 EPYC1 폴리펩티드, 변형된 EPYC1 폴리펩티드, 조류 루비스코 작은 서브유닛(SSU) 폴리펩티드, 및 변형된 루비스코 SSU 폴리펩티드를 갖는 식물을 제공한다.

본 발명의 특정 양태는 C. 레인하드티이 단백질 EPYC1 (C. 레인하드티이 EPYC1 게놈 서열 = SEQ ID NO: 66; C. 레인하드티이 EPYC1 전사체 서열 = SEQ ID NO: 65; C. 레인하드티이 EPYC1 전장 단백질 = SEQ ID NO: 34; C. 레인하드티이 성숙 EPYC1 단백질 = SEQ ID NO: 35)에 관한 것이다. EPYC1은 더 짧은 말단 영역에 측면에 있는 4개의 매우 유사한 반복 영역으로 이루어진다(도 1a 및 도 1b). 4개의 유사한 반복 영역 각각은 예측된 무질서화된 도메인 및 예측된 α-나선을 함유한 더 짧고 덜 무질서화된 도메인으로 이루어진다. 본 발명의 추가 양태는 EPYC1의 상동체 또는 이종상동체에 관한 것이다. 일부 구체예에서, EPYC1의 상동체 또는 이종상동체는 C. 레인하드티이 EPYC1과 구조적으로 유사하다. 도 15에 도시된 바와 같이, 3개의 다른 밀접하게 관련된 조류 종, 즉, 볼복스 카르테리(Volvox carteri), 고늄 펙토랄레(Gonium pectorale), 및 테트라바에나 소시알리스(Tetrabaena socialis)는 C. 레인하드티이 EPYC1(SEQ ID NO: 166(V. 카르테리); SEQ ID NO: 167(G. 펙토랄레); C. 레인하드티이 EPYC1에서와 예측된 α-나선 영역을 함유한 동일한 반복 영역을 갖는 SEQ ID NO: 165(T. 소시알리스))과 상동성인 단백질을 갖는다.

천연 C. 레인하드티이 단백질 EPYC1의 N-말단에서, SEQ ID NO: 34에서 아미노산 26에서의 절단 부위(도 1b에서 검정색 화살표로 표시됨)는 SEQ ID NO: 35의 성숙 EPYC1 단백질에서 트렁케이션된 N-말단을 초래한다. 바람직하게는, 고등 식물에서 EPYC1의 발현은 생산된 EPYC1 단백질이 트렁케이션된 N-말단을 갖도록 코딩 서열을 사용한다. 이 양태의 추가 구체예는 SEQ ID NO: 40과 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 트렁케이션된 N-말단(즉, 성숙 EPYC1 단백질의 N-말단)을 포함한다. 이 양태의 추가 구체예는 SEQ ID NO: 40인 트렁케이션된 N-말단(즉, 성숙 EPYC1 단백질의 N-말단)을 포함한다.

본 발명의 변형된 EPYC1 폴리펩티드는 제1 EPYC1 반복 도메인의 탠뎀 카피를 포함한다. 이 양태의 추가 구체예에서, 변형된 EPYC1 폴리펩티드는 제1 조류 EPYC1 반복 영역의 1개 이상, 2개 이상, 4개 이상 또는 8개의 직렬 카피를 포함한다. 이 양태의 추가 구체예에서, 변형된 EPYC1 폴리펩티드는 제1 조류 EPYC1 반복 영역의 4개의 직렬 카피 또는 8개의 직렬 카피를 포함한다. 예시적인 변형된 EPYC1 서열은 도 5a에 도시되어 있다. 이 양태의 일부 구체예는 SEQ ID NO: 36과 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 제1 조류 EPYC1 반복 영역을 포함한다. 이 양태의 추가 구체예에서, 제1 조류 EPYC1 반복 영역은 SEQ ID NO: 36이다. 이 양태의 또 다른 구체예는 천연 EPYC1 선도 서열 없이 발현되고/되거나 C-말단 캡을 포함하는 변형된 EPYC1 폴리펩티드를 포함한다. 이 양태의 또 다른 구체예는 SEQ ID NO: 42와 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 천연 EPYC1 선도 서열 및 SEQ ID NO: 41과 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 C-말단을 포함한다. 이 양태의 또 다른 구체예는 SEQ ID NO: 41인 C-말단 캡을 포함한다. 이 양태의 추가 구체예는 천연 EPYC1 선도 서열 대신에 사용되는 트렁케이션된 N-말단(즉, 성숙 EPYC1 단백질의 N-말단)을 포함한다. 이 양태의 추가 구체예는 SEQ ID NO: 40과 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 트렁케이션된 N-말단(즉, 성숙 EPYC1 단백질의 N-말단)을 포함한다. 이 양태의 추가 구체예는 SEQ ID NO: 40인 트렁케이션된 N-말단(즉, 성숙 EPYC1 단백질의 N-말단)을 포함한다. 천연 EPYC1 선도 서열을 갖지 않고 트렁케이션된 N-말단(즉, 성숙 EPYC1 단백질의 N-말단) 및 C-말단 캡을 갖는 변형된 EPYC1 서열을 함유한 예시적인 유전자 발현 카세트는 도 12a 및 도 12b에 도시되어 있다.

고등 식물에서 EPYC1의 정확한 표적화를 위해, 고등 식물 엽록체 표적화 서열은 EPYC1 서열에 부착된다. 일부 구체예에서, 이러한 엽록체 표적화 서열은 1A_At 엽록체의 전이 펩티드이다. 추가 구체예에서, 엽록체 표적화 서열은 1B_At 엽록체의 전이 펩티드(SEQ ID NO: 18), 2B_At 엽록체의 전이 펩티드(SEQ ID NO: 19), 또는 3B_At 엽록체의 전이 펩티드(SEQ ID NO: 20)이다. 추가 구체예에서, 엽록체 표적화 서열은 엽록소 a/b-결합 단백질, 루비스코 액티라제, 페레독신, 또는 전분 신타제 단백질로부터 수득된다. 추가 구체예에서, 엽록체 전이 서열은 트렁케이션된 엽록체 전이 서열(예를 들어, 1A_At 엽록체의 전이 펩티드의 55 잔기)이다. 이 양태의 추가 구체예는 SEQ ID NO: 64와 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 엽록체의 전이 펩티드를 포함한다. 이 양태의 또 다른 구체예에서, 엽록체의 전이 펩티드는 SEQ ID NO: 64이다. EPYC1 서열(성숙 EPYC1 및 변형된 EPYC1)에 부착된 55 잔기 1A_At 엽록체의 전이 펩티드를 함유한 예시적인 유전자 발현 카세트는 도 12a 및 도 12b에 도시되어 있다. 당해 분야에 공지된 수단은 EPYC1 표적화를 위한 이의 적합성에 대한 엽록체 표적화 서열을 시험하고 엽록체 표적화 서열의 길이를 최적화하기 위해 사용될 수 있다(예를 들어, Shen, et al., Sci. Rep. (2017): 46231).

본 발명의 추가 양태는 조류 루비스코 SSU 단백질에 관한 것이다. 일부 구체예에서, 조류 루비스코 SSU 단백질은 C. 레인하드티이 루비스코 SSU 단백질, S1_Cr(SEQ ID NO: 30) 또는 S2_Cr(SEQ ID NO: 2)이다(도 1d 및 도 3d). 본 발명의 다른 양태는 C. 레인하드티이 루비스코 SSU의 조류 상동체 또는 이종상동체에 관한 것이다. 이 양태의 추가 구체예에서, 조류 루비스코 SSU 단백질은 V. 카르테리 또는 G. 펙토랄레 루비스코 SSU 단백질(도 14a 내지 도 14c; SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161; SEQ ID NO: 162; SEQ ID NO: 163, 및 SEQ ID NO: 164)이다. 이 양태의 다른 구체예에서, C. 레인하드티이 루비스코 SSU의 조류 상동체 또는 이종상동체는 SEQ ID NO: 30 또는 SEQ ID NO: 2와 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%¸ 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 75%¸ 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 갖는다. 본 발명의 추가 양태는 조류 루비스코 SSU 선도 서열이 없는 조류 루비스코 SSU 단백질에 관한 것이다. 이 양태의 일부 구체예에서, 조류 루비스코 SSU 선도 서열은 SEQ ID NO: 29와 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%¸ 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 75%¸ 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%와 동일한 아미노산 서열을 갖는다. 이 양태의 추가 구체예에서, 조류 루비스코 SSU 선도 서열은 SEQ ID NO: 29이다.

본 발명의 변형된 루비스코 SSU는 하나 이상의 고등 식물 루비스코 SSU α-나선을 하나 이상의 조류 루비스코 SSU α-나선으로 치환하고/하거나; 하나 이상의 고등 식물 루비스코 SSU β-가닥을 하나 이상의 조류 루비스코 SSU β-가닥으로 치환하고/하거나; 고등 식물 루비스코 SSU βA-βB 루프를 조류 루비스코 SSU βA-βB 루프로 치환함으로써 변형된 고등 식물 루비스코 SSU를 포함한다. 일부 구체예에서, 고등 식물 루비스코 SSU 폴리펩티드는 2개의 고등 식물 루비스코 SSU α-나선을 2개의 조류 루비스코 SSU α-나선으로 치환함으로써 변경된다. 추가 구체예에서, 고등 식물 루비스코 SSU 폴리펩티드는 4개의 고등 식물 루비스코 SSU β-가닥을 4개의 조류 루비스코 SSU β-가닥으로 치환함으로써, 및 고등 식물 루비스코 SSU βA-βB 루프를 조류 루비스코 SSU βA-βB 루프로 치환함으로써 추가로 변형된다. 본 발명의 고등 식물 루비스코 SSU 폴리펩티드는 SEQ ID NO: 140, SEQ ID NO: 141, SEQ ID NO: 142, SEQ ID NO: 143, SEQ ID NO: 144, SEQ ID NO: 145, SEQ ID NO: 146, SEQ ID NO: 147, SEQ ID NO: 148, SEQ ID NO: 149, SEQ ID NO: 150, SEQ ID NO: 151, SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, 또는 SEQ ID NO: 156과 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드를 포함한다. 본 발명의 조류 루비스코 SSU 폴리펩티드는 SEQ ID NO: 2, SEQ ID NO: 30, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 162, SEQ ID NO: 163, 또는 SEQ ID NO: 164와 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드를 포함한다. 이 양태의 추가 구체예에서, 조류 루비스코 SSU 폴리펩티드는 SEQ ID NO: 2, SEQ ID NO: 30, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 162, SEQ ID NO: 163 또는 SEQ ID NO: 164이다. 이 양태의 추가 구체예는 SEQ ID NO: 1에서 아미노산 23-35(즉, SEQ ID NO: 3) 및 아미노산 80-93(즉, SEQ ID NO: 4)에 해당하는 2개의 고등 식물 루비스코 SSU α-나선, 및 SEQ ID NO: 2에서 아미노산 23-35(즉, SEQ ID NO: 10) 및 아미노산 86-99(즉, SEQ ID NO: 12)에 해당하는 2개의 조류 루비스코 SSU α-나선을 포함한다. 2개의 조류 루비스코 SSU α-나선으로 치환되는 2개의 고등 식물 루비스코 SSU α-나선, 4개의 고등 식물 루비스코 SSU β-가닥을 4개의 조류 루비스코 SSU β-가닥으로 치환시킴으로써 및 고등 식물 루비스코 SSU βA-βB 루프를 조류 루비스코 SSU βA-βB 루프로 치환시킴으로써 추가로 변형된 고등 식물 루비스코 SSU 폴리펩티드를 갖는 전술한 임의의 구체예와 조합될 수 있는 이 양태의 또 다른 구체예. 이 양태의 추가 구체예는 SEQ ID NO: 1에서 아미노산 39-45(즉, SEQ ID NO: 5), 아미노산 68-70(즉, SEQ ID NO: 6), 아미노산 98-105(즉, SEQ ID NO: 7), 및 아미노산 110-118(즉, SEQ ID NO: 8)에 해당하는 4개의 고등 식물 루비스코 SSU β-가닥, SEQ ID NO: 2에서 아미노산 39-45(즉, SEQ ID NO: 11), 아미노산 74-76(즉, SEQ ID NO: 6), 아미노산 104-111(즉, SEQ ID NO: 13), 및 아미노산 116-124(즉, SEQ ID NO: 14)에 해당하는 4개의 조류 루비스코 SSU β-가닥, SEQ ID NO: 1에서 아미노산 46-67(즉, SEQ ID NO: 9)에 해당하는 고등 식물 루비스코 SSU βA-βB 루프, 및 SEQ ID NO: 2에서 아미노산 46-73(즉, SEQ ID NO: 15)에 해당하는 조류 루비스코 SSU βA-βB 루프를 포함한다. 추가 구체예에서, 조류 루비스코 SSU βA-βB 루프는 SEQ ID NO: 16에 해당한다.

고등 식물 엽록체 표적화 서열은 조류 루비스코 SSU 또는 변형된 루비스코 SSU에 부착된다. 일부 구체예에서, 이러한 엽록체 표적화 서열은 1A_At 엽록체의 전이 펩티드이다. 추가 구체예에서, 엽록체 표적화 서열은 1B_At 엽록체의 전이 펩티드(SEQ ID NO: 18), 2B_At 엽록체의 전이 펩티드(SEQ ID NO: 19), 또는 3B_At 엽록체의 전이 펩티드(SEQ ID NO: 20)이다. 추가 구체예에서, 엽록체 표적화 서열은 엽록소 a/b-결합 단백질, 루비스코 액티베이제, 페레독신, 또는 전분 신타제 단백질로부터 얻어진다. 추가 구체예에서, 엽록체 전이 서열은 트렁케이션된 엽록체 전이 서열(예를 들어, 1A_At 엽록체의 전이 펩티드의 57 잔부)이다. 이 양태의 추가 구체예는 SEQ ID NO: 63과 적어도 70% 서열 동일성, 적어도 71% 서열 동일성, 적어도 72% 서열 동일성, 적어도 73% 서열 동일성, 적어도 74% 서열 동일성, 적어도 75% 서열 동일성, 적어도 76% 서열 동일성, 적어도 77% 서열 동일성, 적어도 78% 서열 동일성, 적어도 79% 서열 동일성, 적어도 80% 서열 동일성, 적어도 81% 서열 동일성, 적어도 82% 서열 동일성, 적어도 83% 서열 동일성, 적어도 84% 서열 동일성, 적어도 85% 서열 동일성, 적어도 86% 서열 동일성, 적어도 87% 서열 동일성, 적어도 88% 서열 동일성, 적어도 89% 서열 동일성, 적어도 90% 서열 동일성, 적어도 91% 서열 동일성, 적어도 92% 서열 동일성, 적어도 93% 서열 동일성, 적어도 94% 서열 동일성, 적어도 95% 서열 동일성, 적어도 96% 서열 동일성, 적어도 97% 서열 동일성, 적어도 98% 서열 동일성, 또는 적어도 99% 서열 동일성을 갖는 폴리펩티드인 엽록체의 전이 펩티드를 포함한다. 이 양태의 또 다른 구체예에서, 엽록체의 전이 펩티드는 SEQ ID NO: 63이다. SSU 서열에 부착된 57 잔기 1A_At 엽록체의 전이 펩티드를 함유한 예시적인 서열(1A_At-TP를 갖는 S2_Cr(SEQ ID NO: 22) 및 1A_At-TP를 갖는 1A_AtMOD(SEQ ID NO: 33))은 도 3b에 도시되어 있다. 당해 분야에 공지된 수단은 변형된 루비스코 SSU 표적화에 대한 이의 적합성에 대해 엽록체 표적화 서열을 시험하고, 엽록체 표적화 서열의 길이를 최적화하기 위해 사용될 수 있다(예를 들어, Shen, et al., Sci. Rep. (2017): 46231).

유전적으로 변경된 단자엽 및 쌍자엽 식물 세포의 형질전환 및 생성은 당해 분야에 널리 공지되어 있다(예를 들어, 문헌[Weising, et al., Ann. Rev. Genet. 22:421-477 (1988); 미국특허 제5,679,558호; Agrobacterium Protocols, ed: Gartland, Humana Press Inc. (1995); 및 Wang, et al. Acta Hort. 461:401-408 (1998)] 참조). 방법의 선택은 형질전환되는 식물의 타입, 특정 적용, 및/또는 원하는 결과에 따라 달라진다. 적절한 형질전환 기술은 숙련된 실무자에 의해 용이하게 선택된다.

세포 DNA(예를 들어, 게놈 DNA 및 세포소기관 DNA)를 결실, 삽입 또는 달리 변형시키기 위한 당해 분야에 공지된 임의의 방법이 본원에 개시된 본 발명을 실시하는 데 사용될 수 있다. 예를 들어, 아르고박테륨 투메파시엔스(Agrobacterium tumefaciens)의 결실 또는 삽입을 위한 유전자 작제물을 함유한,디스암 Ti 플라스미드(disarmed Ti plasmid)는 식물 세포를 형질전환시키기 위해 사용될 수 있으며, 그 후에, 형질전환된 식물은 당해 분야, 예를 들어, EP 0116718호, EP 0270822호, PCT 공개 WO 84/02913호 및 공개된 유럽특허출원("EP") 0242246호에 기술된 절차를 이용하여 형질전환된 식물 세포로부터 재생될 수 있다. Ti-플라스미드 벡터 각각은 Ti-플라스미드의 T-DNA의 경계 서열 사이에, 또는 적어도, Ti-플라스미드의 T-DNA의의 우측 경계 서열의 좌측에 위치된 유전자를 함유한다. 물론, 다른 타입의 벡터는 직접 유전자 전달(예를 들어, EP 0233247호에 기술된 바와 같음), 꽃가루 매개 형질전환(예를 들어, EP 0270356호, PCT 공개 WO 85/01856호, 및 미국특허 제4,684,611호에 기술된 바와 같음), 식물 RNA 바이러스-매개 형질전환(예를 들어, EP 0 067 553호 및 미국특허 제4,407,956호에 기술된 바와 같음), 리포솜-매개 형질전환(예를 들어, 미국특허 제4,536,475호에 기술된 바와 같음), 및 옥수수(예를 들어, 미국특허 제6,140,553; Fromm et al., Bio/Technology (1990) 8, 833-839); Gordon-Kamm et al., The Plant Cell, (1990) 2, 603-618)) 및 쌀(Shimamoto et al., Nature, (1989) 338, 274-276; Datta et al., Bio/Technology, (1990) 8, 736-740)의 특정 세포주를 형질전환시키기 위한 방법 및 일반적으로 단자엽을 형질전환시키는 방법(PCT 공개 WO 92/09696호)과 같은 다른 방법과 같은 절차를 사용하여, 식물 세포를 형질전환시키기 위해 사용될 수 있다. 목화 형질전환을 위해, PCT 특허공개 WO 00/71733호에 기술된 방법이 사용될 수 있다. 대두 형질전환을 위해, 당해 분야, 예를 들어, 문헌[Hinchee et al. (Bio/Technology, (1988) 6, 915) and Christou et al. (Trends Biotech, (1990) 8, 145)]에 공지된 방법 또는 WO 00/42207호의 방법이 언급된다.

본 발명의 유전적으로 변경된 식물은 동일한 특징을 갖는 더욱 유전적으로 변경된 식물을 제조하거나 동일하거나 관련된 식물 종의 다른 품종에서 유전적 변경(들)을 도입하기 위해 기존 식물 육종 계획에서 사용될 수 있다. 변경된 식물로부터 얻어진 종자는 바람직하게는, 핵 DNA에서 안정한 삽입물로서 또는 내인성 유전자 또는 프로모터에 대한 변형으로서 유전적 변경(들)을 함유한다. 본 발명에 따른 유전적 변경(들)을 포함하는 식물은 본 발명의 유전적 변경(들)을 포함하는 식물, 예를 들어, 과일 나무 또는 관상용 식물의 근경을 포함하거나 이로부터 유도된 식물을 포함한다. 이에 따라, 형질전환된 식물 또는 식물 부분 상에 삽입된 임의의 비-트랜스제닉 이식된 식물 부분이 본 발명에 포함된다.

도입된 유전자의 발현을 야기시키는, 발현 벡터 또는 발현 카세트에서 든지, 도입된 유전자 구성요소는 통상적으로, 식물-발현 가능한 프로모터를 사용할 것이다. 본원에서 사용되는 '식물-발현 가능한 프로모터'는 식물 세포에서 본 발명의 유전적 변경(들)의 발현을 보장하는 프로모터를 지칭한다. 식물에서 구성적 발현을 유도하는 프로모터의 예는 당해 분야에 공지되어 있고, 꽃양배추 모자이크 바이러스(cauliflower mosaic virus; CaMV), 예를 들어, 단리물 CM 1841(Gardner et al., Nucleic Acids Res, (1981) 9, 2871-2887), CabbB S(Franck et al., Cell (1980) 21, 285-294; Kay et al., Science, (1987) 236, 4805) 및 CabbB JI(Hull and Howell, Virology, (1987) 86, 482-493)의 강한 구성적 35S 프로모터("35S 프로모터"); 카사바 베인 모자이크 바이러스 프로모터(CsVMV); 유비퀴틴 패밀리로부터의 프로모터(예를 들어, 문헌[Christensen et al., Plant Mol Biol, (1992) 18, 675-689]의 옥수수 유비퀴틴 프로모터, 또는 문헌[Norris et al. Plant Mol. Biol. (1993) 21, 895-906]의 A. 탈리아나 UBQ10 프로모터), gos2 프로모터(de Pater et al., The Plant J (1992) 2, 834-844), emu 프로모터(Last et al., Theor Appl Genet, (1990) 81, 581-588), 액틴 프로모터, 예를 들어, 문헌[The Plant J, (1996) 10, 107]에 기술된 프로모터, 문헌[]에 기술된 쌀 액틴 프로모터(Zhang et al. (The Plant Cell, (1991) 3, 1155-1165); 카사바 베인 모자이크 바이러스의 프로모터(WO 97/48819, Verdaguer et al. (Plant Mol Biol, (1998) 37, 1055-1067), 수브테라니안 클로버 스툰트 바이러스(Subterranean Clover Stunt Virus)로부터의 pPLEX 시리즈의 프로모터(WO 96/06932호, 특히, S4 또는 S7 프로모터), 알코올 데하이드로게나제 프로모터, 예를 들어, pAdh1S(GenBank 기탁번호 X04049, X00581), 및 T DNA의 각각 1' 및 2' 유전자의 발현을 유도하는 TR1' 프로모터 및 TR2' 프로모터(각각 "TR1' 프로모터" 및 "TR2' 프로모터")(Velten et al., EMBO J, (1984) 3, 2723 2730)를 지칭한다.

대안적으로, 식물-발현 가능한 프로모터는 조직-특이적 프로모터, 즉, 식물의 일부 세포 또는 조직에서, 예를 들어, 잎 엽육 세포에서 더 높은 수준의 발현을 유도하는 프로모터일 수 있다. 바람직한 구체예에서, 잎 엽육 특이적 프로모터 또는 잎 보호 세포 특이적 프로모터가 사용될 것이다. 비제한적인 예는 잎 특이적 Rbcs1A 프로모터(A. 탈리아나 루비스코 작은 서브유닛 1A (AT1G67090) 프로모터), GAPA-1 프로모터(A. 탈리아나 글리세르알데하이드 3-포스페이트 데하이드로게나제 A 서브유닛 1(AT3G26650) 프로모터), 및 FBA2 프로모터(A. 탈리아나 프룩토스-비스포스페이트 알돌라제 2 317(AT4G38970) 프로모터)(Kromdijk et al., Science, 2016)를 포함한다. 추가의 비제한적인 예는 잎 엽육 특이적 FBPase 프로모터(Peleget al., Plant J, 2007), 옥수수 또는 쌀 rbcS 프로모터(Nomura et al., Plant Mol Biol, 2000), 잎 보호 세포 특이적 A. 탈리아나 KAT1 프로모터(Nakamura et al., Plant Phys, 1995), A. 탈리아나 미로시나제-티오글루코시드 글루코하이드롤라제 1(TGG1) 프로모터(Husebye et al., Plant Phys, 2002), A. 탈리아나 rha1 프로모터(Terryn et al., Plant Cell, 1993), A. 탈리아나 AtCHX20 프로모터(Padmanaban et al., Plant Phys, 2007), A. 탈리아나 HIC(높은 이산화탄소) 프로모터(Gray et al., Nature, 2000), A. 탈리아나 CYTOCHROME P450 86A2(CYP86A2) 모노-옥시게나제 프로모터(pCYP)(Francia et al., Plant Signal & Behav, 2008; Galbiati et al., The Plant Journal, 2008), 감자 ADP-글루코스 피로포스포릴라제(AGPase) 프로모터(Muller-Rober et al., The Plant Cell 1994), 포도 R2R3 MYB60 전사 인자 프로모터(Galbiati et al., BMC Plant Bio, 2011), A. 탈리아나 AtMYB60 프로모터(Cominelli et al., Current Bio, 2005; Cominelli et al., BMC Plant Bio, 2011), A. 탈리아나 At1g22690-프로모터(pGC1)(Yang et al., Plant Methods, 2008), 및 A. 탈리아나 AtMYB 61 프로모터(Liang et al., Curr Biol, 2005)를 포함한다. 이러한 식물 프로모터는 인헨서 요소와 조합될 수 있거나, 이러한 것은 최소 프로모터 요소와 조합될 수 있거나, 원하는 발현 프로파일을 보장하기 위해 반복된 요소를 포함할 수 있다.

일부 구체예에서, 식물 세포에서 발현을 증가시키기 위한 유전적 요소가 사용될 수 있다. 예를 들어, 도입된 유전자의 5' 단부 또는 3' 단부에서 또는 도입된 유전자의 코딩 서열에서 인트론, 예를 들어, hsp70 인트론. 다른 이러한 유전적 요소는 프로모터 인헨서 요소, 중복 또는 3중 중복 프로모터 영역, 다른 이식유전자와 상이한 또는 내인성(식물 숙주) 유전자 선도 서열과 상이한 5' 선도 서열, 동일한 식물에서 다른 이식 유전자와 상이한 또는 내인성(식물 숙주) 트레일러 서열과 상이한 3' 트레일러 서열을 포함할 수 있지만, 이로 제한되지 않는다.

본 발명의 도입된 유전자는 삽입된 유전자 부분이 적합한 3' 단부 전사 조절 신호(예를 들어, 전사체 형성 및 폴리아데닐화 신호)의 업스트림(즉, '5)이도록 숙주 세포 DNA에 삽입될 수 있다. 이는 바람직하게는, 식물 세포 게놈(핵 또는 엽록체)에 유전자를 삽입함으로써 달성된다. 바람직한 폴리아데닐화 및 전사체 형성 신호는 A. 투메파시엔스 노팔린 신타제 유전자(Nos 종결인자; Depicker et al., J. Molec Appl Gen, (1982) 1, 561-573), 옥토핀 신타제 유전자(OCS 종결인자; Gielen et al., EMBO J, (1984) 3:835 845), A. 탈리아나 열충격 단백질 종결인자(HSP 종결인자); SCSV 또는 Malic 효소 종결인자(Schunmann et al., Plant Funct Biol, (2003) 30:453-460), 및 형질전환된 식물 세포에서 3' 비번역된 DNA 서열로서 작용하는 T DNA 유전자 7(Velten and Schell, Nucleic Acids Res, (1985) 13, 6981 6998)의 폴리아데닐화 및 전사체 형성 신호를 포함한다. 일부 구체예에서, 도입된 유전자 중 하나 이상은 핵 게놈에 안정하게 통합된다. 안정한 통합은 핵산 서열이 핵 게놈에 통합된 상태로 남아 있고, 후속 식물 세대 전반에 걸쳐 계속 발현된다(예를 들어, 검출 가능한 mRNA 전사체 또는 단백질이 생성됨). 핵 세놈에 안정한 통합 및/또는 이의 편집은 당해 분야의 임의의 공지된 방법(예를 들어, 미세입자 충격, 아그로박테륨-매개 형질전환, CRISPR/Cas9, 원형질체의 전기천공, 미세주입 등)에 의해 달성될 수 있다.

용어 재조합 또는 변형된 핵산은 유전 공학 기술 또는 화학적 합성에 의해 폴리뉴클레오티드의 단리된 세그먼트의 인공 조작에 의해 달성된 달리 분리된 서열의 2개의 세그먼트들의 조합에 의해 이루어진 폴리뉴클레오티드를 지칭한다. 그렇게 함으로써, 기능들의 원하는 조합을 생성하기 위해 원하는 기능의 폴리뉴클레오타이드 세그먼트들을 함께 결합할 수 있다.

본원에서 사용되는 용어 "과발현" 및 "상향조절"은 유전자 변형의 결과로서 야생형 유기체(예를 들어, 식물)에서 발현에 비해 증가된 발현(예를 들어, mRNA, 폴리펩티드 등)을 지칭한다. 일부 구체예에서, 발현의 증가는 야생형에서의 발현보다 약 10% 더 약간의 증가이다. 일부 구체예에서, 발현 증가는 야생형에서의 발현에 비해 50% 이상(예를 들어, 60%, 70%, 80%, 100% 등)의 증가이다. 일부 구체예에서, 내인성 유전자는 과발현된다. 일부 구체예에서, 외인성 유전자는 발현됨에 의해 과발현된다. 식물에서 유전자의 과발현은 항시적 프로모터, 유도적 프로모터, 높은 발현 프로모터, 인헨서, 전사 및/또는 번역 조절 서열, 코돈 최적화, 변형된 전사 인자, 및/또는 과발현되는 유전자의 발현을 조절하는 돌연변이체 또는 변형된 유전자의 사용을 포함하지만, 이로 제한되지 않는 당해 분야의 임의의 공지된 방법을 통해 달성될 수 있다.

재조합 핵산이 특정 서열의 발현, 클로닝, 또는 복제를 위해 의도되는 경우에, 숙주 세포에 도입하기 위해 제조된 DNA 작제물은 통상적으로, 원하는 폴리펩티드를 인코딩하는 의도된 DNA 단편을 포함하는, 숙주에 의해 인식된 복제 시스템(예를 들어, 벡터)을 포함할 것이고, 또한, 폴리펩티드-인코딩 세그먼트에 작동 가능하게 연결된 전사 및 번역 개시 조절 서열을 포함할 수 있다. 추가적으로, 이러한 작제물은 세포 국소화 신호(예를 들어, 원형질막 국소화 신호)를 포함할 수 있다. 바람직한 구체예에서, 이러한 DNA 작제물은 숙주 세포의 게놈 DNA, 엽록체 DNA 또는 미토콘드리아 DNA에 도입된다.

일부 구체예에서, 비-통합된 발현 시스템은 하나 이상의 도입된 유전자의 발현을 유도하기 위해 사용될 수 있다. 발현 시스템(발현 벡터)은 예를 들어, 복제 기점 또는 자가 복제 서열(ARS) 및 발현 조절 서열, 프로모터, 인헨서 및 필수 처리 정보 부위, 예를 들어, 리보솜-결합 부위, RNA 스플라이스 부위, 폴리아데닐화 사이트, 전사 종결인자 서열, 및 mRNA 안정화 서열을 포함할 수 있다. 신호 펩티드는 또한, 적절한 경우, 동일한 또는 관련된 종의 분비된 폴리펩티드로부터 포함될 수 있으며, 이는 단백질이 세포막, 세포벽을 통과하고/거나 여기에 머물거나, 세포로부터 분비될 수 있다.

본원에 개시된 본 발명의 방법을 실시하는 데 유용한 선택 가능한 마커는 양성의 선택 가능한 마커일 수 있다. 통상적으로, 양성 선택은 유전적으로 변경된 세포가 고려되는 재조합 폴리뉴클레오티드가 세포 내에 존재하는 경우에만 독성 물질의 존재 하에서 생존할 수 있는 경우를 지칭한다. 음성의 선택 가능한 마커 및 스크리닝 가능한 마커는 또한, 당해 분야에 널리 공지되어 있고, 본 발명에 의해 고려된다. 당업자는 이용 가능한 임의의 관련 마커가 본원에 개시된 본 발명을 실시하는 데 사용될 수 있음을 인식할 것이다.

본 발명의 재조합 균주의 스크리닝 및 분자 분석은 핵산 하이브리드화 기술을 사용하여 수행될 수 있다. 하이브리드화 절차는 본원에 교시된 바와 같이 유용한 대상 조절 서열에 대한 충분한 상동성을 갖는, 본원에 교시된 기술을 사용하여 변형된 것과 같은 폴리뉴클레오티드를 식별하는 데 유용하다. 특정 하이브리드화 기술은 본 발명에서 필수적인 것은 아니다. 하이브리드화 기술이 개선됨에 따라, 이러한 것은 당업자에 의해 용이하게 적용될 수 있다. 하이브리드화 프로브는 당업자에게 공지된 임의의 적절한 표지로 표지될 수 있다. 하이브리드화 조건 및 세척 조건, 예를 들어, 온도 및 염 농도는 검출 임계값의 엄격성을 변경하기 위해 달라질 수 있다(예를 들어, 하이브리드화 조건에 대한 추가 지침을 위해 문헌[Sambrook et al. (1989) vide infra or Ausubel et al. (1995) Current Protocols in Molecular Biology, John Wiley & Sons, NY, N.Y.] 참조).

추가적으로, 유전적으로 변경된 균주의 스크리닝 및 분자 분석뿐만 아니라 원하는 단리된 핵산의 생성은 중합효소 연쇄 반응(PCR)을 사용하여 수행될 수 있다. PCR은 핵산 서열의 반복적, 효소적, 프라이밍된 합성이다. 이러한 절차는 널리 공지되어 있고 당업자에 의해 통상적으로 사용되고 있다(Mullis, 미국특허 4,683,195, 4,683,202, 및 4,800,159; 문헌[Saiki et al. (1985) Science 230:1350-1354] 참조). PCR은 표적 서열의 마주하는 가닥에 하이브리드화하는 2개의 올리고뉴클레오티드 프라이머의 측면에 있는 고려되는 DNA 단편의 효소적 증폭을 기초로 한다. 프라이머는 3' 말단이 서로를 향하도록 배향된다. 주형의 열 변성, 이의 상보적인 서열에 대한 프라이머의 어닐링, 및 DNA 중합효소로의 어닐링된 프라이머의 확장의 반복된 사이클은 PCR 프라이머의 5' 말단에 의해 규정된 세그먼트의 증폭을 초래한다. 각 프라이머의 확장 산물이 다른 프라이머에 대한 주형으로서 역할을 할 수 있기 때문에, 각 사이클은 본질적으로 이전 사이클에서 생산된 DNA 주형의 양을 배가시킨다. 이는 수 시간 안에 최대 수백만 배까지 특정 표적 단편을 기하급수적으로 축적한다. 호열성 박테륨 테르무스 아쿠아티쿠스(Thermus aquaticus)로부터 단리된, Taq 중합효소와 같은 열안정한 DNA 중합효소를 사용함으로써, 증폭 공정은 완전히 자동화될 수 있다. 사용될 수 있는 다른 효소는 당업자에게 공지되어 있다.

본 발명의 핵산 및 단백질은 또한, 구체적으로 개시된 서열의 동족체를 포함할 수 있다. 상동성(예를 들어, 서열 동일성)은 50% 내지 100%일 수 있다. 일부 경우에, 이러한 상동성은 80% 초과, 85% 초과, 90% 초과, 또는 95% 초과이다. 서열(들)의 임의의 의도된 사용을 위해 필요한 상동성 또는 동일성의 정도는 당업자에 의해 용이하게 식별된다. 본원에서 사용되는, 2개의 핵산의 서열 동일성 백분율은 당해 분야에 공지된 알고리즘, 예를 들어, 문헌[Karlin and Altschul (1990) Proc. Natl. Acad. Sci. USA 87:2264-2268, Karlin and Altschul (1993) Proc. Natl. Acad. Sci. USA 90:5873-5877에서 변형됨]에 개시된 알고리즘을 사용하여 결정된다. 이러한 알고리즘은 BLASTN, BLASTP, 및 BLASTX, 문헌[Altschul et al. (1990) J. Mol. Biol. 215:402-410]의 프로그램에 포함된다. BLAST 뉴클레오티드 검색은 원하는 서열 동일성 백분율을 갖는 뉴클레오티드 서열을 얻기 위해, BLASTN 프로그램, 스코어=100, 워드길이=12로 수행된다. 비교 목적을 위해 간격 정렬(gapped alignment)을 얻기 위해, Gapped BLAST가 문헌[Altschul et al. (1997) Nucl. Acids. Res. 25:3389-3402]에 기술된 바와 같이 사용된다. BLAST 및 Gapped BLAST 프로그램을 사용할 때, 개개 프로그램(BLASTN 및 BLASTX)의 기본 파라미터가 사용된다[www.ncbi.nih.gov 참조]. 당업자는 기본 설정(예를 들어, BLASTP에 대해: 갭 개방 패널티: 11, 갭 확장 패널티: 1, 기대값: 10, 워드 크기: 3, 최대 스코어: 25, 최대 정렬: 15, 및 매트릭스: blosum62; 및 BLASTN에 대해: 갭 개방 패널티: 5, 갭 확장 패널티: 2, 핵 매치: 1, 핵 미스매치 -3, 기대값: 10, 워드 크기: 11, 최대 스코어: 25, 및 최대 정렬: 15)을 갖는 적합한 BLAST 프로그램을 사용하여 기준 서열과 고려되는 서열을 정렬함으로써 기준 서열에서 아미노산 또는 핵산에 해당하는 위치가 발생하는 고려되는 서열에서 용이하게 결정할 수 있다.

바람직한 숙주 세포는 식물 세포이다. 본 맥락에서, 재조합 숙주 세포는 단리된 핵 분자를 함유하거나, 숙주 세포에 일반적으로 존재하고 기능하는 하나 이상의 결실된 또는 달리 비-기능성 유전자를 함유하거나, 적어도 하나의 재조합 단백질을 제조하기 위한 하나 이상의 유전자를 함유하기 위해 유전적으로 변형된 것이다. 본 발명의 단백질(들)을 인코딩하는 핵산(들)은 비제한적으로, 형질전환, 리포펙션, 전기천공 또는 당업자에 의해 공지된 임의의 다른 방법을 포함하는 특정 타입의 세포에 대해 적절한 당해 분야에 공지된 임의의 수단에 의해 도입될 수 있다.

식물 육종 방법

식물 육종은 현재 생식질 분석, 현재 생식질의 문제점 및 약점 정의, 프로그램 목표의 설정 및 특정 육종 목표의 정의로 시작된다. 다음 단계는 프로그램 목표를 충족시키기 위한 형질을 지닌 생식질을 선택하는 것이다. 선택된 생식질은 원하는 형질을 재조합하기 위해 교배되고, 선택을 통해 품종 또는 부모 계통이 개발된다. 목표는 부모 생식질로부터 바람직한 형질의 개선된 조합을 단일 품종 또는 하이브리드에서 조합하는 것이다. 이러한 중요한 형질은 더 높은 수확량, 현장 수행능, 개량된 과일 및 농업 품질, 생물학적 스트레스 예컨대, 질병 및 해충에 대한 내성, 및 환경 스트레스, 예컨대 가뭄 및 더위에 대한 내성을 포함할 수 있다.

각 육종 프로그램에는 육종 절차의 효율성에 대한 주기적이고 객관적인 평가가 포함되어야 한다. 평가 기준은 목표와 목적에 따라 다르지만, 적절한 표준과의 비교를 기반으로 하는 연간 선택의 이득, 고급 육종 계통의 전체 가치, 및 투입 단위 당(예를 들어, 연간, 지출된 달러당 등) 생산된 성공적인 품종의 수를 포함해야 한다. 유망한 고급 육종 계통을 철저하게 테스트하고 적어도 3년 동안 상업 대상 지역(들)을 대표하는 환경에서 적절한 표준과 비교한다. 가장 우수한 계통이 새로운 상업용 품종의 후보이다; 몇가지 형질이 여전히 결핍된 것은 추가 선택을 위한 새로운 개체군을 생성하기 위해 부모로서 사용된다. 마케팅 및 유통의 마지막 단계로 이어지는 이러한 과정은 일반적으로 첫 번째 교배 또는 선택이 이루어진 후 5 내지 10년이 걸린다.

육종 또는 선택 방법의 선택은 식물 번식 방식, 개량되는 형질(들)의 유전성, 및 상업적으로 사용되는 품종의 유형(예를 들어, F₁ 하이브리드 품종, 근교 품종 등)에 의존적이다. 고도로 유전성인 형질의 경우, 단일 위치에서 평가되는 우수한 개별 식품을 선택하는 것이 효과적이지만, 유전성이 낮은 형질의 경우, 선택은 관련 식물 과의 반복 평가로부터 얻은 평균 값을 기반으로 해야 한다. 유전의 복잡성은 또한 번식 방법의 선택에도 영향을 미친다. 역교배 육종은 고도로 유전성인 형질에 대한 하나 또는 몇 개의 유전자를 바람직한 품종으로 전달하는데 사용되는 반면(예를 들어, 질병-내성 품종을 육종하기 위해), 반복된 선택 기술은 수 많은 유전자에 의해 제어되는 양적으로 유전되는 형질에 대해 사용되며, 다양한 반복된 선택 기술이 사용된다. 일반적으로 사용되는 선택 방법은 혈통 선택, 수정된 혈통 선택, 대량 선택 및 반복 선택을 포함한다.

혈통 선택은 일반적으로 자가-수분 작물 또는 교차-수분 작물의 근친 계통의 개량에 사용된다. 유리한 보완적인 형질을 갖는 두 부모가 교배되어 F₁을 생성한다. F₂ 개체군은 하나 또는 여러 개의 F₁을 자가 교배하거나 2개의 F₁을 교배(형매 교배)함으로써 생성된다. 가장 우수한 개체의 선택은 일반적으로 F₂ 개체군에서 시작된다; 그 후, F₃에서 시작하여 가장 우수한 과의 최고의 개체가 선택된다. 이러한 과에 대한 반복 테스트 또는 이러한 과의 개체를 포함하는 하이브리드 조합은 종종 F₄ 세대에서 이어서 유전성이 낮은 형질에 대한 선택의 효율성을 향상시킨다. 동계교배(즉, F₆ 및 F₇)의 고급 단계에서, 표현형적으로 유사한 계통의 최고의 계통 또는 혼합물이 새로운 품종으로서의 잠재적 표출에 대해 테스트된다.

대량 및 반복 선택은 자가 수분- 또는 교배-수분 작물의 개체군을 개량하는데 사용될 수 있다. 이형접합 개체의 유전적으로 가변적인 개체군은 여러 다른 부모를 교배하여 확인되거나 생성된다. 최고의 식물은 개체의 우월성, 우수한 자손 또는 탁월한 조합 능력을 기반으로 선택된다. 선택된 식물은 추가 선택 주기가 계속되는 새로운 개체군을 생성하기 위해 교배된다.

역교배 육종(즉, 반복 선택)은 단순 유전된 고도로 유전성 형질에 대한 유전자를 반복적 부모인 바람직한 동형접합 품종 또는 계통으로 전달하는데 사용될 수 있다. 전달될 형질의 공급원은 공여친이라고 불린다. 생성된 식물은 반복친(예를 들어, 품종)의 속성 및 공여친으로부터 전달되는 바람직한 형질을 가질 것으로 예상된다. 초기 교배 후, 공여친의 표현형을 갖는 개체가 선택되고 반복친과 반복적으로 교배(역교배)된다. 생성된 식물은 반복친의 속성(예를 들어, 품종) 및 공여친으로부터 전달되는 바람직한 형질을 가질 것으로 예상된다.

엄밀한 의미의 단일-종자 혈통 절차는 분리된 개체군을 플랜팅하고, 식물 당 하나의 종자 샘플을 수확하고, 하나의 종자 샘플을 사용하여 다음 세대를 플랜팅하는 것에 관한 것이다. 개체군이 F₂로부터 원하는 근친 교배 수준으로 발전하는 경우, 계통이 파생된 식물은 각각 다른 F₂ 개체로 추적될 것이다. 어떤 종자는 발아에 실패하거나 어떤 식물은 하나 이상의 종자를 생산하지 못하기 때문에 개체군의 식물 수는 세대마다 감소한다. 결과적으로, 개체군에서 원래 샘플링된 모든 F₂ 식물이 세대 진행이 완료될 때 자손으로 대표되는 것은 아닐 것이다.

표현형 관찰 외에도, 식물의 유전자형이 또한 시험될 수 있다. 식물 유전자형의 분석, 비교 및 특성 규명에 사용 가능한 많은 실험실 기반 기술이 있다; 이들로는 동질효소 전기영동, 제한 단편 길이 다형성(RFLP), 무작위 증폭 다형성 DNA(RAPD), 임의 프라이밍된 중합효소 연쇄 반응(AP-PCR), DNA 증폭 핑거프린팅(DAF), 서열 특성 규명된 증폭 영역(SCAR), 증폭된 단편 길이 다형성(AFLP), 단순 서열 반복(SSR - 이는 또한 마이크로새털라이트(Microsatellite)로 불림) 및 단일 뉴클레오티드 다형성(SNP)이 있다.

분자 마커 또는 "마커"는 또한 육종 과정 동안 정성적 형질을 선택하는데 사용될 수 있다. 예를 들어, 실제 관심 대립유전자 내의 서열 함유 마커 또는 대립유전자에 밀접하게 연결된 마커가 관심 대립유전자를 함유하는 식물을 선택하는데 사용될 수 있다. 선택 과정에서 마커의 사용은 종종 유전적 마커 강화 선택 또는 마커 보조 선택이라고 한다. 마커 분석을 수행하는 방법은 일반적으로 당업자에게 알려져 있다.

돌연변이 육종은 또한 식물 품종에 새로운 형질을 도입하는데 사용될 수 있다. 자연적으로 발생하거나 인위적으로 유도된 돌연변이는 식물 육종가에게 유용한 가변성의 원천일 수 있다. 인위적 돌연변이 유발의 목표는 원하는 특성에 대한 돌연변이 비율을 높이는 것이다. 돌연변이 비율은 온도, 장기 종자 보관, 조직 배양 조건, 방사선(예컨대, X-선, 감마선, 중성자, 베타 방사선, 또는 자외선), 화학적 돌연변이원(예컨대, 염기 유사체 예컨대, 5-브로모-우라실), 항생제, 알킬화제(예컨대, 황 머스타드, 질소 머스타드, 에폭시드, 에틸렌아민, 설페이트, 설포네이트, 설폰 또는 락톤), 아지드, 하이드록실아민, 아질산 또는 아크리딘을 포함하는 많은 상이한 수단에 의해 증가될 수 있다. 돌연변이유발을 통해 원하는 형질이 관찰되면, 그 형질은 전통적인 육종 기술에 의해 기존 생식질에 통합될 수 있다. 돌연변이 육종에 대한 자세한 내용은 문헌 [Principles of Cultivar Development: Theory and Technique, Walter Fehr (1991), Agronomy Books, 1 (https://lib.dr.iastate.edu/agron_books/1)]에서 찾아볼 수 있다.

이중 반수체의 생성은 또한 육종 프로그램에서 동형접합체 계통의 발달에 사용될 수 있다. 이중 반수체는 이형접합체 식물의 염색체 세트를 두 배로 늘려 완전한 동형접합체 개체를 생성함으로써 생산된다. 예를 들어, 문헌 [Wan, et al., Theor. Appl. Genet., 77:889-892, 1989] 참조.

사용될 수 있는 육종 방법의 추가의 비제한적인 예는 비제한적으로 본원에 참조로 통합된 문헌 [Principles of Plant Breeding, John Wiley and Son, pp. 115-161 (1960); Principles of Cultivar Development: Theory and Technique, Walter Fehr (1991), Agronomy Books, 1 (https://lib.dr.iastate.edu/agron_books/1)]에서 발견된 것들을 포함한다.

본 발명을 일반적으로 설명하였으나, 본 발명을 추가로 예시하기 위해 본원에 포함되고 청구범위에 의해 정의된 본 발명의 범위를 제한하려는 의도가 아닌 특정 실시예를 참조하여 본 발명이 더욱 잘 이해될 것이다.

실시예

본 개시는 청구된 바와 같은 본 개시의 범위를 어떤 식으로든 제한하고자 하는 것은 아닌 하기 실시예에 더욱 상세히 설명되어 있다. 첨부된 도면은 본 개시의 명세서 및 설명의 필수 부분으로 간주되어야 한다. 하기 실시예는 설명을 위해 제공되지만, 청구된 개시를 제한하지 않는다.

실시예 1: 루비스코 및 EPYC1은 상호작용하며, 상호작용 강도를 증가하도록 설계될 수 있다

하기 실시예는 EPYC1의 다양한 변이체와 루비스코 작은 서브유닛(SSU)의 다양한 변이체의 개발 및 엔지니어링을 설명한다. 이 실시예는 또한 EPYC1 변이체와 루비스코 SSU 변이체 간의 상호작용을 테스트하는 효모 2-하이브리드 실험을 설명한다.

재료 및 방법

클라미도모나스 레인하드티이 및 아라비돕시스 탈리아나 루비스코 작은 서브유닛 (SSU) 및 C. 레인하드티이 단백질 필수 피레노이드 성분 1 (EPYC1)

C. 레인하드티이는 2개의 유사한 루비스코 SSU 동족체인 S1_Cr (SEQ ID NO: 30)과 S2_Cr(SEQ ID NO: 2)을 가지며, 이들은 동일한 크기와 동일한 α-나선 및 β-시트를 갖는다. S1_Cr 및 S2_Cr은 단백질 수준에서 97.1% 동일성을 공유하고, 아미노산 서열이 4개 잔기만 다르다(도 1d에서 굵게 표시). 이들 4개 잔기 중 하나는 βA-βB 루프에 있으며, 이는 이 루프에 S1_Cr과 S2_Cr 사이에 하나의 잔기 차이(A47S)가 있음을 의미한다. 성숙 A. 탈리아나 SSU 1A(1A_At; SEQ ID NO: 1; 도 1c에 도시된 구조)와 C. 레인하드티이 SSU는 구조적으로 유사하지만, 단백질 수준에서 단지 45.0%의 동일성을 갖는다. C. 레인하드티이 S1_Cr 및 S2_Cr(140개 아미노산(aa))은 1A_At (125 aa)보다 전체적으로 더 길고, 1A_At보다 βA-βB 루프(6 aa) 및 C-말단(9 aa)이 더 길다. 도 3a에 도시된 바와 같이, SSU의 α-나선, β-가닥 및 βA-βB 루프 영역은 A.탈리아나와 C. 레인하드티이 사이에 실질적으로 상이하다.

C. 레인하드티이 단백질 EPYC1은 더 짧은 말단 영역(도 1a-1b)(전체 길이 EPYC1 = SEQ ID NO: 34; 성숙 EPYC1(즉, 절단 부위 처리 후) = SEQ ID NO: 35)이 측접된 4개의 고도로 유사한 반복 영역으로 구성된 모듈 단백질이다. 4개의 유사한 반복 영역 각각은 예측된 무질서한 도메인과 예측된 α-나선을 함유하는 더 짧고 덜 무질서한 도메인으로 구성된다. EPYC1 단백질은 BLAST에서 단지 3개의 밀접하게 관련된 다른 조류 종, 즉 볼복스 카테리(Volvox carteri)(VOLCADRAFT_103023, 63.5% 동일성), 고늄 펙토레일(Gonium pectorale)(GPECTOR_43g955, 42.2% 동일성) 및 테트라배나 소시알리스(Tetrabaena socialis)(A1O1_04388, 44.9% 동일성)의 단백질에 정렬한다. 도 15에 도시된 바와 같이, 모든 3개의 상동체는 또한 예측된 α-나선 영역을 갖는 반복 영역을 갖는다(EPYC1에서와 같이). EPYC1 동족체를 가진 두 종의 조류 종인 V. 카테리와 G. 펙토레일의 루비스코 SSU는 α-나선을 가지며, 이는 C. 레인하드티이 S1_Cr의 것과 거의 동일하다(도 14a-14c에서 굵은 글씨 참조). 이는 EPYC1 및 SSU가 이러한 종에서 유사한 방식으로 상호작용함을 강력하게 나타낸다.

효모 2-하이브리드(Y2H)

효모 2-하이브리드 플라스미드 벡터 pGBKT7(결합 도메인 벡터) 및 pGADT7(활성화 도메인 벡터)을 사용하여 관심 단백질 간의 상호작용을 검출하였다. 유전자는 표 1에 나열된 Q5 DNA 중합효소(NEB)와 프라이머를 사용하여 증폭하였다. S1_Cr과 S2_Cr 둘 모두는 초기에 효모 2-하이브리드 테스트에 사용하였으며, S2_Cr은 C. 레인하드티이에서 더 많이 고도로 발현되기 때문에 이후 실험에서 사용하였다. EPYC1의 코딩 서열은 온라인 툴(www.idtdna.com/CodonOpt)을 이용하여 고등 식물에서의 발현에 최적화된 코돈이다. EPYC1의 모든 변이체는 Gblock 단편(IDT)으로 합성하였으며, 표 1에 나열된 프라이머를 사용하여 증폭되었다. 그런 다음 증폭된 유전자를 다중 클로닝 부위를 사용하여 각 벡터에 클로닝하여 각각 GAL4 DNA 결합 또는 활성화 도메인과의 융합을 생성하였다.

표 1: 효모 2-하이브리드 검정에 사용되는 벡터를 생성하는데 사용되는 프라이머 목록.

컴피턴트 효모 세포(Y2H Gold, Clontech)는 카나마이신(50μg ml^-1)이 보충된 YPDA 배지에서 성장한 50 ml 배양물로부터 준비하였다. 세포를 ddH2O 및 리튬 아세테이트/TE 용액(100 mM LiAc, 10 mM Tris-HCl [pH 7.5], 1 mM EDTA)으로 세척한 후 리튬 아세테이트/TE 용액에 재현탁시켰다. 그런 다음 세포는 50 μl의 컴피턴트 세포를 1 μg의 각 플라스미드 벡터 및 PEG 용액(100 mM LiAc, 10 mM Tris-HCl [pH 7.5], 1 mM EDTA, 40% [v/v] PEG 4000)과 혼합함으로써 결합 및 활성화 도메인 벡터로 공동 형질전환시켰다. 세포를 30분 동안 30℃에서 인큐베이션한 다음 20분 동안 42℃의 열 충격을 가하였다. 세포를 원심분리하고, 500 μl YPDA에 재현탁시키고, 30℃에서 약 90분 동안 인큐베이션한 다음, 원심분리하고 TE(10 mM Tris-HCl [pH 7.5], 1mM EDTA)에서 세척하였다. 펠렛을 200 μl TE에 재현탁하고, SD-L-W(류신 및 트립토판이 결여된 표준 덱스트로스 배지(최소 효모 배지), Anachem)에 도포하고 30℃에서 3일 동안 성장시켰다. 생성된 콜로니 중 10 내지 15개를 공동 형질전환당 풀링하고 24시간 동안 단일 배양물에서 성장시켰다. 다음 날 1 ml의 배양물을 수확하고, 세포 밀도 (OD₆₀₀)를 측정하고, 원심분리하고, 그 후 TE에서 희석하여 0.5 또는 0.1의 최종 OD₆₀₀을 제공하였다.

그 후, 효모 배양물을 SD-L-W (류신(L) 및 트립토판(W)이 결여된 효모 합성 최소 배지) 및 SD-L-W-H (L, W 및 히스티딘(H)이 결여된 효모 합성 최소 배지)(Anachem) 상에 플레이팅하였다. 결합 및 활성화 도메인 작제물 둘 모두를 발현하는 효모를 SD-L-W 상에서 성장시켜 두 플라스미드 모두의 존재를 확인하였다. 상호작용 강도를 평가하기 위해, 효모를 다양한 농도의 HIS3 억제제 3-아미노트리아졸(3-AT)과 SD-L-W-H 상에 플레이팅하였다. 그 후, 이들 플레이트를 3일 동안 인큐베이션한 후, 성장의 존재 유무를 평가하고, 반 누에스 앤 베그스(van Nues and Beggs)와 같이 반-정량적 효모 2-하이브리드 검정을 수행하였다(van Nues and Beggs, Genetics (2000) 157: 1451-1467). 동일한 효모 형질전환을 각 상호작용 연구에 사용하였다. 동일한 효모 형질전환 플레이트 상의 상이한 콜로니는 독립적인 생물학적 복제물로 간주되었다(E. 콜라이의 경우). 상이한 액체 배양 농도(0.5 및 0.1 OD)의 2개의 생물학적 복제물(각 상호작용에 대한 상단 및 하단 행)을 스폿팅하였다. 각 상호작용 실험은 적어도 2회 수행하였다. 효모 상호작용 연구의 요약 도면은 도 3c, 4j-4k 및 5e에 도시되어 있다.

표 2는 효모 2-하이브리드 검정에 사용된 벡터에 대한 설명을 제공한다. 도 2a-2b는 표 2에 나열된 처음 7개 벡터(pGBKT7_EPYC1 to pGADT7_LSU_Cr)를 사용한 검정의 예시적 결과를 보여준다; 각 상호작용 실험은 2개의 생물학적 복제물을 가지고, 적어도 2회 수행하였다. 도 3c, 4j-4k 및 5e는 중간 31개 벡터(pGADT7_1A_AtMOD(β-시트) 내지 pGBKT7_synthEPYC1 α-나선 녹아웃 2)를 사용한 검정 결과의 요약 도면을 보여준다. 도 2b-2c는 마지막 10개의 벡터(pGBKT7_LSU_Cr 내지 pGADT7_LSU_At)를 사용한 검정으로부터의 예시적인 결과를 보여준다; 각 상호작용 실험은 2개의 생물학적 복제물을 가지고, 적어도 2회 수행하였다.

표 2: 효모 2-하이브리드 검정에 사용되는 벡터.

단백질 추출은 용해 완충액(50 mM Tris HCl [pH 233 6], 4% [v/v] SDS, 8 M 우레아, 30% [v/v] 글리세롤, 0.1 M DTT, 0.005% [w/v] 브로모페놀 블루)에서 밤새 액체 배양물로부터 1의 OD₆₀₀으로 효모 세포를 재현탁시키고, 65℃에서 30분 동안 인큐베이션하고, 10% (w/v) Bis-Tris 단백질 겔 (Expedeon) 상에 직접적으로 로딩함으로써 수행하였다. 도 4i에 도시된 면역블롯에서, 단백질은 EPYC1::GAL4 결합 도메인의 N-말단 절두된 버젼을 발현하는 효모로부터 추출하고, 항-EPYC1으로 면역블롯팅하였다.

액체 크로마토그래피-질량 분광법(LC-MS)

세포 용해물을 맥킨더(Mackinder) 등에 따라 C. 레인하드티이 세포로부터 제조하였다 (Mackinder, et al., PNAS (2016) 113: 5958-5963). 2%(w/v) 디지토닌으로 막 가용화 후, 정화된 용해물을 20 μg 항-EPYC1 항체와 함께 인큐베이션한 150 μl 단백질 A Dynabead에 적용하였다. Dynabead 세포 용해물을 4℃에서 회전하면서 1.5시간 동안 인큐베이션하였다. 그 후, 비드를 0.1% (w/v) 디지토닌을 함유하는 IP 완충액(50mM HEPES, 50 mM KOAc, 2 mM Mg(OAc)₂.4H₂O, 1 mM CaCl₂, 200 mM 소르비톨, 1 mM NaF, 0.3 mM NA₃VO₄, Roche cOmplete EDTA-비함유 프로테아제 억제제)으로 4회 세척하였다. 용리 완충액(50mM Tris-HCl, 0.2M 글리신[pH 2.6])에서 10분 동안 인큐베이션하여 비드로부터 EPYC1을 용리하고, 용리액을 1:10(v/v) Tris-HCl(pH 8.5)로 즉시 중성화시켰다. 소량의 용리액을 SDS-PAGE 겔에 진행시키고, 쿠마시(coomassie)로 염색하고(도 6a), 나머지 샘플은 LC-MS에 사용하였다.

온전한 단백질 LC-MS 실험은 전기분무 이온화(즉, 전기분무 이온화 질량 분광법(ESI-MS); Waters Corp., Manchester, UK)가 장착된 Synapt G2 Q-ToF 장치에서 수행하였다. 역상 C4 Aeris Widepore 50 × 2.1 mm HPLC 컬럼(Phenomenex, CA, USA)이 장착된 Acquity UPLC를 사용하여 LC 분리를 달성하였으며, 10분에 걸쳐 5-95% 아세토니트릴(0.1% 포름산)의 구배를 사용하였다. MassLynx v4.1을 사용하여 데이터 분석을 수행하고 MaxEnt를 사용하여 디콘볼루션을 수행하였다.

EPYC1의 PCOILS 분석

PCOILS는 제출된 단백질 서열에서 코일드-코일 도메인의 존재 확률(0-1)을 예측하는 온라인 도구(https://toolkit.tuebingen.mpg.de/#/tools/pcoils)이다. 제출 후 직접 출력은 도 5f에 도시되어 있다.

결과

EPYC1은 Y2H 검정에서 C. 레인하드티이 SSU 및 변형된 A.탈리아나 SSU와 상호작용한다

C. 레인하드티이 SSU(도 1c-1d)의 2개의 α-나선은 이전에 EPYC1(도 1a-1b)에 대한 잠재적인 결합 부위로 제안되었다(Meyer, et al., PNAS(2012) 109: 19474-19479, Mackinder 등, PNAS(2016) 113: 5958-5963). 이 가설은 반정량적 Y2H 접근 방식을 사용하여 테스트되었다. Y2H 검정에서, EPYC1은 C. 레인하드티이 SSU 동족체인 S1_Cr 및 S2_Cr 둘 모두와 비교적 강한 단백질-단백질 상호작용(즉, 10mM 3-AT에서 성장)을 나타내었다(도 2a). 대조적으로, EPYC1은 A. 탈리아나(1A_At)의 1A SSU와 상호작용하지 않았으나, C. 레인하드티이의 α-나선을 수반하는 하이브리드 1A SSU와 약하게 상호작용하였다 (1A_AtMOD; 문헌 [Atkinson, et al., New Phyt.(2017) 214: 655-667]에 기술됨).

Y2H 검정은 EPYC1이 그 자체와 상호작용하지 않음을 추가로 보여주었다(도 2a-2b). 도 2b-2c에 도시된 바와 같이, EPYC1은 또한 피레노이드와 관련된 다른 C. 레인하드티이 CCM 성분(즉, LCIB, LCIC 및 CAH3) 또는 엽록체 기질(AtCP12, 문헌 [L

pez-Calcagno, et al., Front. Plant Sci. (2014) 5:9]에 기술됨)에서 발견되는 또 다른 본질적으로 무질서한 단백질과 상호작용하지 않았다. 이러한 결과는 EPYC1이 Y2H 검정에서 위양성 단백질-단백질 상호작용을 일으키지 않는 경향이 있음을 나타낸다.

고등 식물 루비스코 SSU가 EPYC1에 대한 친화성을 높이도록 설계될 수 있다.

다음으로 EPYC1과의 상호작용에 필요한 C. 레인하드티이 SSU의 주요 도메인을 확인하였다. SSU의 구조적 구성요소를 분리하기 위해 3개의 별개의 β-시트(βA, βC 및 βD), βA-βB 루프 및 2개의 α-나선과 연관된 S1_Cr의 잔기를 보유하는 1A_At의 총 6가지 상이한 키메라 버전 (αA 및 αB)(Spreitzer, Arch. Biochem. Biophys, (2003) 414: 141-149)을 생성하였다(도 3b).

이전과 같이 Y2H 검정에서 테스트할 경우, EPYC1은 1A_At와 상호작용하지 않았다(도 3c). S1_Cr의 βA-βB 루프 또는 β-시트, 또는 이 둘 모두를 함께 갖는 키메라 1A_At는 또한 상호작용을 허용하지 않았다. C. 레인하드티이 SSU의 2개의 α-나선을 갖는 키메라 1A_At와 EPYC1 사이에서만 상호작용이 관찰되었다(도 3c). S1_Cr α-나선이 단독으로 있는 S1_Cr 1A_At는 최소 상호작용(즉, 0 mM 3-AT에서)을 생성하였으며, 이는 S1_Cr의 β-시트와 βA-βB 루프의 통합에 의해 강화되었다. 특히, C. 레인하드티이의 α-나선, β-시트 및 βA-βB 루프를 갖는 변형된 1A_At 변이체(즉, S1_Cr에 대해 79% 서열 동일성을 가짐)는 S1_Cr에 비해 더 강한 상호작용을 나타내었다(도 3c). 이러한 결과는 고등 식물 루비스코 SSU가 C. 레인하드티이 SSU의 구조적 성분을 포함함으로써 EPYC1에 대한 친화도를 증가시키도록 조작될 수 있음을 나타내었다.

EPYC1은 루비스코 SSU와의 상호 작용 강도를 높이도록 설계될 수 있다.

루비스코 SSU와의 상호작용에 필요한 EPYC1의 주요 영역을 특성 규명하기 위해 다양한 절두된 EPYC1 변이체를 생성하였다. EPYC1은 N-말단과 C-말단에서 더 짧은 말단 영역이 측접해 있는 4개의 매우 유사한 반복 서열로 구성된 모듈식 단백질이기 때문에, N-말단 또는 C-말단 방향에서 순차적으로 각 영역을 제거하기 위해 절두가 이루어졌다(도 4a-4b; 도 4c-4d에 도시된 천연 EPYC1 단백질과 이들 서열의 정렬). 절두된 EPYC1 변이체는 효모에서 잘 발현되었다 (도 4i). 절두된 EPYC1 변이체를 사용한 Y2H 검정 결과는 도 4j에 도시되어 있다. EPYC1 N-말단 단독(N-ter)은 S1_Cr과 상호작용하지 않았지만, 첫 번째 EPYC1 반복 영역의 추가는 상호작용을 검출하기에 충분하였다. 각 후속 반복 영역의 추가는 증가된 농도의 3-AT에서의 성장과 상관관계가 있었으며, 이는 EPYC1이 모듈형 단백질이고 각 반복부가 SSU와의 상호작용에 부가 효과를 갖는다는 것을 확인시켜준다. C-말단 꼬리의 추가는 상호작용의 강도를 추가로 증가시켰다. 흥미롭게도 C-말단 단독으로도 S1_Cr과 상호작용하며, 이는 SSU 결합 부위가 반복 영역에 국한되지 않았음을 시사한다.

EPYC1과 SSU 사이의 상호작용은 4개의 반복부 각각에서 예측된 보존된 α-나선을 통해 매개될 수 있으며, 이를 통해 함께 EPYC1이 적어도 4개의 루비스코 복합체에 결합할 수 있다고 가정하였다(Mackinder, et al., PNAS (2016)) 113: 5958-5963, Freeman Rosenzweig, et al., Cell (2017) 171: 148-162). 4개 도메인 각각의 상대적 기여도는 첫 번째 반복부에서 잔기 "RQELESL"(SEQ ID NO: 119) 및 후속 3개의 반복부에서 "KQELESL"(SEQ ID NO: 120)의 7개 알라닌으로의 돌연변이를 통해 예측된 α-나선 구조를 제거함으로써 분석되었다(도 4e-4f; 도 4g-4h에 도시된 천연 EPYC1 단백질과 이들 서열의 정렬). 도 4k에 도시된 바와 같이, 단일 나선의 돌연변이는 Y2H 검정에서 테스트할 때 상호작용 강도에 영향을 미치지 않았다. 그러나, S1_Cr과의 순차적으로 더 약한 상호작용이 α-나선 영역의 (즉, 첨가) 돌연변이가 증가함에 따라 관찰되었다. 모두 4개의 α-나선이 돌연변이된 경우, 상호작용은 완전히 근절되지는 않았다. 후자의 발견은 C-말단에 대한 추가 SSU 결합 부위(들)에 대한 증거를 뒷받침하는데, 4개의 α-나선이 모두 없는 경우 상호 작용 강도가 C-말단 단독의 상호작용 강도와 동일하게 감소되었기 때문이다(도 4j). 전반적으로 데이터는 EPYC1이 4개의 반복 영역과 C-말단 각각에 각각 위치한 적어도 5개의 SSU 상호작용 부위를 가지고 있음을 시사하였다.

PCOILS를 사용한 EPYC1의 분석은 EPYC1의 추정 α-나선이 코일드-코일 도메인처럼 행동할 수 있음을 시사하였으며, 제1 반복부는 가장 높은 예측 값을 보여준다(도 5c)(Gruber, et al., J. Struct. (2006) 155: 140-145; Zimmermann, et al., J. Mol. Bio. (2017) 430: 2237-2243). 따라서, 제1 반복 영역이 SSU 상호작용에 대한 친화성이 증가된 합성 EPYC1을 조작하는데 유용한 표적 스캐폴드가 될 수 있다고 가정하였다. 일렬로 제1 반복부의 1, 2, 4 또는 8 복사체를 함유하는 4개의 합성 EPYC1 변이체를 작제하였다(도 5a; 정렬은 도 5b-5d에 도시됨). 도 5e에 도시된 바와 같이, 첫 번째 반복부의 4개 복사체(합성 EPYC1 4 reps)는 Y2H 검정에서 테스트할 때 성숙한 천연 EPYC1과 비교하여 S1_Cr 및 1A_AtMOD와의 더 강한 상호작용 강도를 보여주었다. 가장 강한 상호작용은 테스트된 최대 3-AT 농도 (80 mM)에서 성장한 8개 반복부를 갖는 변이체(합성 EPYC1 8 reps)에서 관찰되었다.

단일 복사체 변이체(합성 EPYC1 1 rep)를 사용하여 PCOILS 도구(도 5a)의 예측을 기반으로 하는 α-나선 영역의 변형을 상호작용 강도(도 5e)에 대해 비교하였다. α-나선 영역(SVLPANWRQELESLRNNWRQELESLRNGNGSS(SEQ ID NO: 121))의 복제 또는 α-나선(WRQELESLRNQ(SEQ ID NO: 122)) 근처의 G-Q 치환은 코일드-코일 거동의 증가된 확률을 예측하였다(도 5f). PCOILS의 예측과 달리, 전자의 변형은 상호 작용을 근절한 반면, 후자는 천연 1 rep 변형과 비교하여 상호 작용 강도를 변경하지 않았다. 마지막으로, α-나선 내의 L-R 치환(WRQELESRRNG(SEQ ID NO: 123)) 또는 α-나선 내의 E-W R 치환(WRQWLESLRNG(SEQ ID NO: 124))은 각각 상호작용을 녹아웃시키도록 시도되었다. 두 치환 모두 상호작용을 근절하였다. 이러한 결과는 EPYC1 α-나선이 전통적인 코일드-코일 도메인처럼 행동하지 않지만, α-나선 내의 단일 점 돌연변이조차도 상호작용에 영향을 미칠 수 있음을 시사하였다. 이들 결과는 도 4k에 제시된 것을 뒷받침한다.

EPYC1의 N-말단은 절단 부위를 함유한다.

N-말단의 제거는 또한 상호작용 강도를 증가시켰으며, 이는 엽록체로의 도입 동안 절단될 엽록체의 전이 펩티드로서의 N-말단의 예측된 역할과 일치하였다(Mackinder, et al., PNAS (2016) 113: 5958-5963). 예측 도구 ChloroP 및 PredAlgo는 각각 잔기 78 및 170에서의 절단을 시사하였다(Emanuelsson, et al., Nat. Protoc. (2007) 2: 953-971). 그러나, 두 예측 모두 EPYC1 기능에 필요한 반복 영역 내에서 절단을 초래할 것이기 때문에 설득력이 없었다. 잠재적인 절단 부위를 확인하기 위해, C. 레인하드티이의 EPYC1을 면역침전시키고, 전자분무 이온화 질량 분광법(ESI-MS)을 사용하여 분석하였다. 온전한 단백질 ESI-MS 분석은 29622-30621 Da 범위의 성숙 EPYC1의 여러 프로테오폼을 밝혀내었다(도 6c). 프로테오폼 간의 분자 질량 차이는 80 Da이며, 이는 다양한 인산화 상태를 암시한다. 이러한 관찰은 EPYC1의 고도로 인산화된 특성을 강조하는 이전 보고서와 일치하였다(Turkina, et al., Proteomics (2006) 6: 2693-2704; Wang, et al., MCP (2014) 13: 2337-2353). 고도로 번역 후 변형된 EPYC1 상태는 성숙 단백질의 정확한 분자 질량 측정을 어렵게 하였다. 그러나, 확인된 가장 작은 프로테오폼은 29.6 kDa의 분자 질량을 가졌으며, 이는 EPYC1의 이론적인 질량을 기준으로 하여 잔기 26(V)과 27(A) 사이의 절단 부위를 나타낸다(도 1b).

실시예 2: EPYC1은 고등 식물에서 엽록체를 표적으로 할 수 있으며, EPYC1은 식물에서 루비스코와 상호작용한다

다음 실시예는 EPYC1 발현을 고등 식물 엽록체(예를 들어, N. 벤타미아나 및 A. 탈리아나)에 성공적으로 표적화할 수 있는 EPYC1 작제물의 조작을 설명한다. 고등 식물 엽록체에서 발현되는 경우, EPYC1은 식물의 루비스코와 상호작용하는 것으로 나타났다.

재료 및 방법

식물 재료 및 성장 조건

아라비돕시스 (아라비돕시스 탈리아나, Col-0) 종자는 퇴비에 파종하고, 4℃에서 3일 동안 성층화하고, 20℃, 주변 CO₂, 70% 상대 습도 및 150 μmol 광자 m^-2 s^-1에서 12시간(h) 명, 12시간 암 조건에서 성장시켰다. 서로 상이한 유전자형의 비교를 위해, 동일한 연령과 저장 이력의 종자로부터 식물을 성장시키고, 동일한 환경 조건에서 재배한 식물로부터 수확하였다. N. 벤타미아나를 12 h 명, 12 h 암 조건에서 150 μmol 광자 m^-2 s^-1로 20℃에서 성장시켰다.

작제물 설계 및 형질전환

EPYC1의 코딩 서열은 온라인 툴(www.idtdna.com/CodonOpt)을 이용하여 고등 식물에서의 발현에 최적화된 코돈이다. EPYC1의 모든 변이체는 Gblock 단편(IDT)으로 합성하였고, Plant MoClo 시스템의 레벨 0 수용체 벡터 pAGM1299 및 pICH41264(Engler, et al., ACS Synth. Bio. (2014) 3:839-843) 또는 C- 또는 N-말단 YFP를 함유하는 pB7WG2,0 벡터로 직접 클로닝하였다. 표 3은 식물 형질전환에 사용된 벡터에 대한 설명을 제공한다. 도 7b-7c, 8a-8c 및 9a는 처음 5개 벡터(pICH47742_EPYC1::GFP 내지 pAGM8031_EPYC1::GFP_pFast)를 사용하여 검정의 예시적인 결과를 보여준다. 도 8d-8e는 마지막 11개 벡터(pB7_S2_Cr::YFP^N 내지 pB7_S2_Cr::YFP^N까지)를 사용한 검정의 예시적인 결과를 보여준다.

표 3: 식물 형질전환에 사용되는 벡터.

융합 단백질을 생성하기 위해, 유전자 발현 작제물을 이원 수준 M 수용체 벡터로 조립하였다. 수준 M 벡터는 N. 벤타미아나에서 일시적인 유전자 발현(Sch

b, et al., Mol. and Gen. Genetics (1997) 256: 581-585) 또는 플로랄 딥핑에 의한 A. 탈리아나 식물에서 안정한 삽입(Clough and Bent, Plant J. (1998) 16: 735-743)을 위해 아그로박테리움 투메파시엔스(AGL1)로 형질전환하였다. pFAST-R 선택 카세트를 사용하여 T3 세대에서 동형접합 삽입 계통을 확인하였다(Shimada, et al., Plant J. (2010) 61: 519-528).

DNA 및 잎 단백질 분석

PCR 반응은 표 4에 나열된 유전자-특이적 프라이머를 사용하여 McCormick 및 Kruger (McCormick and Kruger, Plant J. (2015) 81: 570-683)에서와 같이 수행하였다.

표 4: 식물 형질전환에 사용되는 벡터를 생성하는데 사용된 프라이머 목록.

가용성 단백질은 70℃에서 15분 동안 200 mM DTT를 갖는 5x Bolt LDS 샘플 완충액(ThermoFisher Scientific)에서 21일령 식물(6번째 및 7번째 잎)의 동결된 잎 재료로부터 추출되었다. 추출물을 원심분리하고, 상층액을 4-12% (w/v) 폴리아크릴아미드 겔에서 SDS-PAGE로 처리하고, 니트로셀룰로스 막으로 옮겼다. 1:10,000 희석으로 밀 루비스코(Howe, et al., PNAS (1982) 79: 6903-6907) 또는 1:2,000 희석으로 EPYC1(Mackinder, et al., PNAS 2016) 113: 5958-5963) 이어서 1:10,000 희석으로 HRP-결합된 염소 항-토끼 IgG(Abcam)에 대해 발생된 토끼 혈청으로 막을 프로빙시키고, Pierce ECL Western Blotting Substrate(Life Technologies)를 사용하여 가시화하였다.

성장 분석 및 광합성 측정

WT, S2_Cr 또는 1A_AtMOD 배경에서 1A_AtTP(1A_At-TP::EPYC1)와 융합된 EPYC1을 발현하는 A. 탈리아나 식물 계통을 테스트하였다. 배경(WT, S2_Cr 또는 1A_AtMOD) 당 3개의 독립적으로 형질전환된 T3 계통(계통 1, 계통 2 및 계통 3)을 측정하고, EPYC1이 결여된 상응하는 분리선(계통 1 Seg, 계통 2 Seg 및 계통 3 Seg)과 비교하였다.

성장 분석을 위해, 식물을 31일째에 수확하고, 신선한 중량(FW) 및 건조 중량(DW)을 측정하였다. 도 8b-8c의 값은 12개 로제트(FW 및 DW 측정에 있어서) 또는 16개 로제트(성장 검정에 있어서)에 대해 수행된 측정의 평균 ± SE이다. 별표는 스튜던트 페어드 샘플 t-테스트에 의해 결정되는 바와 같이 형질전환된 계통과 분리물 사이의 FW 또는 DW에서의 현저한 차이(P<0.05)를 나타낸다. 로제트 성장률은 사내 이미징 시스템을 사용하여 정량화하였다(Dobrescu, et al., Plant Methods (2017) 13: 95).

광합성 측정을 위해, 성장 분석에 사용된 동일한 식물을 31일째(수확 전)에 측정하였다. 12개 식물 각각의 단일 잎에서 측정한 측정치의 평균 ± SE는 하기 표 5에 제시된다. 광계 II(PSII)의 최대 양자 수율(암순응 잎 형광, Fv/Fm)은 Hansatech Handy PEA 연속 여기 엽록소 형광계(Hansatech Instruments Ltd.)를 사용하여 측정하였다 (Maxwell and Johnson, J. of Exp. Bot. 2000) 51: 659-668).

공동-면역침전 및 면역블로팅

보완된 루비스코 돌연변이 배경(S2_Cr, 1A_AtMOD 또는 1A_At)에서 EPYC1을 발현하는 35일된 A. 탈리아나 식물의 로제트를 급속 동결하고 액체 N₂에서 분쇄하였다. 동일한 부피의 IP 추출 완충액(100mM HEPES [pH 7.5], 150mM NaCl, 4mM EDTA, 5mM DTT, 0.4mM PMSF, 10%[v/v] 글리세롤, 0.1%[v/v] Triton- X-100 및 10 ml 당 1개의 Roche cComplete EDTA-비함유 프로테아제 억제제 정제)를 첨가하고, 샘플을 4℃에서 15분 동안 회전시키고, 4℃에서 원심분리하고, Miracloth(Merck)의 두층을 통해 여과하였다. 각 추출물(2 ml)은 4℃에서 1시간 동안 IP 완충액에서 사전 평형화된 50 μl 단백질 A Dynabead(ThermoFisher Scientific)와 함께 인큐베이션한 후 비드를 경사분리 함으로써 사전-세정하였다. 3.5 μg 항-EPYC1 항체를 50 μl 단백질 A Dynabead에 적용하여 항체-코팅된 비드를 생성하고, 이를 4℃에서 30분 동안 회전시켰다. Pierce BS3 가교제(Thermo Scientific)를 사용하여 항체를 비드에 가교시켰다. 각 단백질 추출물을 항체-코팅된 비드와 함께 인큐베이션하고 4℃에서 2시간 동안 회전시켰다. 결합되지 않은 샘플(통과)을 경사 분리하고, 비드를 세척 완충액(20mM Tris-HCl[pH 8], 150 147mM NaCl, 0.1%[w/v] SDS, 1%[v/v] Triton-X-100, 2mM EDTA)으로 4회 세척하였다. 50 μl 용리 완충액(2x LDS 샘플 완충액, 200mM DTT)을 첨가하고 70℃에서 15분 동안 가열한 후 비드를 경사 분리함으로써 면역복합체를 용리시켰다.

용리된 면역복합체를 SDS-PAGE 및 면역블롯팅에 적용하였다. 1A_At-TP::EPYC1 항체 혈청은 EPYC1의 C-말단을 표적으로 한다(Emanuelsson, et al., Nat. Protoc. (2007) 2: 953-971). 면역블롯팅을 위해 두 가지 항체를 사용하였다: 항-EPYC1 (Mackinder, et al., PNAS (2016) 171: 133-147) 및 항-루비스코(문헌 [Mackinder 2016]에서 사용되고, 문헌 [Howe, et al., PNAS (1982) 79: 6903-6907]에 처음 공개된 바와 같은 루비스코 항체). 도 8e에서, A. 탈리아나 단백질 추출물의 EPYC1의 비율을 농도계를 이용하여 C. 레인하드티이 추출물의 비율과 비교하였다. 이로부터 루비스코 LSU까지의 EPYC1의 화학량론을 추정하였다. 도 9a에서 우측 블롯(Co-IP)은 루비스코 큰 서브유닛(LSU)에 대한 항체로 프로빙할 때의 결과를 나타낸다. 왼쪽에서 오른쪽으로 레인은 입력(입력), 통과(FT), 4차 세척(세척) 및 끓는 용리(용리)의 결과를 각각 표시하며, 이들은 각각 SDS-페이지 겔에서 실행되었으며, 니트로셀룰로스 막으로 옮기고, 항-루비스코 또는 항-EPYC1 항체로 프로빙하였다. 음성 대조군(Neg.)은 단백질-A 비드의 항-EPYC1 항체를 항-HA 항체(^*) 또는 항체 없음(^**)으로 교체하고 이전과 같이 IP를 진행하여 수행하였다(용리된 샘플만 표시). 3개의 별표(^***)는 EPYC1(S2_Cr)을 발현하지 않는 대조군 계통을 포함한 모든 샘플에서 항-EPYC1 항체로 관찰된 비특이적 밴드를 나타낸다.

이분자 형광 보완 분석(BiFC)

이분자 형광 보완 분석(BiFC)을 수행하여 생체내 EPYC1-루비스코 상호작용에 대한 추가적인 정보를 제공하였다. 3개의 루비스코 SSU(1A_At, S2_Cr 및 1A_AtMOD) 및 EPYC1은 각각 C-말단에서 YF^PN 또는 YF^PC에 융합되어 N. 벤타미아나에서 일시적으로 공동 발현되었다(Walter, et al., Plant J. (2004) 40: 428-438).

공초점 레이저 스캐닝 현미경

잎은 액킨슨(Atkinson) 등의 문헌 [Atkinson, et al., Plant Biotech. J. (2016) 14: 1302-1315]에서와 같이 Leica TCS SP2 레이저 스캐닝 공초점 현미경 또는 Leica TCS SP8 레이저 스캐닝 공초점 현미경으로 이미지화하였다.

결과

EPYC1은 고등 식물 엽록체를 표적으로 할 수 있다

EPYC1은 고등 식물에서의 핵 발현을 위해 코돈 최적화시키고(도 7a), 이원 발현 벡터를 작제하고, 이에 의해 EPYC1을 GFP에 C-말단으로 융합시키고 35S 항시적 프로모터의 제어 하에 발현시켰다. 레벨 M 수용체 pAGM8031을 플라스미드 조립에 사용하였다. 상기 표 3에 기재된 벡터를 사용하여 N. 벤타미아나 식물의 잎을 농(agro)-침투시키고, A. 탈리아나 식물을 안정적으로 형질전환하였다. 그 후, EPYC1::GFP의 국소화를 N. 벤타미아나 잎(도 7b) 및 안정적으로 형질전환된 A. 탈리아나 식물(도 7c)에서 가시화시켰다. 지금까지 식물에서 발현된 다른 엽록체 CCM 성분들(Atkinson, et al., Plant Biotech. J. (2016) 14: 1302-1315)과 달리, EPYC1은 N. 벤타미아나 또는 A.탈리아나의 엽록체에 국소화될 수 없었으며, 엽록체에는 형광 신호가 없었다(도 5a-5b의 오버레이 이미지 참조). 따라서, 1A_At 엽록체의 전이 펩티드 (1A_At-TP)를 전장 EPYC1::GFP의 N-말단에 첨가하였다. 1A_At-TP로의 융합은 N. 벤타미아나(도 7b의 1행 대 2행) 및 A. 탈리아나(도 7c의 1행 대 2행) 둘 모두에서 엽록체 기질에 EPYC1::GFP의 재국소화를 발생시켰다.

식물 엽록체의 EPYC1 발현은 식물의 성장 또는 광합성 효율을 방해하지 않았다.

이전에 액킨슨 등(Atkinson, et al., New Phytol. (2017) 214: 655-667)에 의해 이전에 만들어진 S2_Cr 또는 1A_AtMOD로 보완된 야생형 A. 탈리아나 식물 및 2개의 루비스코 작은 서브유닛(1a3b) 돌연변이 계통(Atkinson, et al., New Phytol. (2017) 214: 655-667)(도 3a)은 1A_At-TP::EPYC1(GFP 태그 결여)로 형질전환하였다(플라스미드 맵에 대해서는 도 7a 참조). 추가 분석을 위해 각 배경에서 3개의 동형접합 T3 계통을 선택하였다(EPYC1_1-3; S2_Cr_EPYC1_1-3 및 1A_AtMOD_EPYC1_1-3).

성장 분석은 상응하는 분리체와 비교하여 1A_At-TP::EPYC1을 발현하는 일부 식물에 대해 약간 감소된 성장 표현형(즉, 면적, FW 및 DW)을 나타내었지만, 관찰된 감소는 일관되게 유의하지 않았다(도 8b-8c).

표 5는 A. 탈리아나 식물을 발현하는 EPYC1에 대한 PSII(Fv/Fm) 측정의 최대 양자 수율을 보여준다. 3가지 유전적 배경(WT, S2_Cr 및 1A_AtMOD) 각각에 대해 3개의 독립적으로 형질전환된 T3 계통(계통 1, 계통 2행 및 계통 3)을 측정하고 EPYC1이 결여된 상응하는 분리체(계통 1 Seg, 계통 2 Seg 및 계통 3 Seg)와 비교하였다. 유전적 배경에 관계없이 1A_At-TP::EPYC1의 추가는 암 적응 잎 형광에 의해 측정된 광합성 효율에 영향을 미치지 않았다; Fv/Fm).

표 5: 3가지 유전적 배경에서 1A _At -TP::EPYC1 발현 A. 탈리아나 식물에 대한 PSII ( F v/ F m) 측정의 최대 양자 수율.

A.탈리아나에서 1A_At-TP::EPYC1에 대한 면역블롯은 약 34kDa의 우세한 밴드를 생성하였으며(성숙한 천연 C. 레인하드티이 이소형[35kDa]보다 약간 작음), 이는 1A_At-TP와 EPYC1의 N-말단 영역의 일부 둘 모두의 절단을 시시하였다(항체 혈청은 EPYC1의 C-말단을 표적화함)(Emanuelsson, et al., Nat. Protoc. (2007) 2:953-971)(도 8d 및 9a). 농도계 분석은 가장 높게 발현하는 A. 탈리아나 계통에서 EPYC1의 단백질 수준은 루비스코 LSU와 관련하여 C. 레인하드티이에서의 EPYC1의 단백질 수준보다 약 14배 낮음을 보여주었다(도 8e). 낮은 CO₂ 조건 하에서 성장한 C.레인하드티이에서 EPYC1 대 루비스코 LSU에 대한 약 1:6의 보고된 비율에 근거하여(Mackinder, et al., PNAS (2016) 171: 133-147), 형질전환 계통에서 EPYC1 대 A. 탈리아나 LSU의 화학양론은 1:84로서 추정되었다. 이 비율은 또한 시험관내 재구성된 피레노이드 시스템에서 상-분리된 물질에서 루비스코 (즉, 8 LSU) 당 1 내지 4 EPYC1 펩티드의 관찰된 발생보다 낮았다 (Wunder, et al., Nat. Commun. (2018) 9: 5076). 29 kDa에서의 비특이적 밴드에 더하여, A. 탈리아나의 EPYC1에 대한 몇 개의 더 작은 밴드가 또한 입증되었다(도 8a). C. 레인하드티이 또는 효모로부터 추출된 EPYC1에 대한 추가 밴드는 관찰되지 않았으며(도 8d), 이는 EPYC1이 식물 프로테아제에 의해 표적화될 수 있음을 시시하였다.

상기 결과는 엽록체에서 EPYC1의 구성적 발현이 시험된 조건에서 식물 성장에 영향을 미치지 않았음을 보여주었다. 또한, 엽록체에서 EPYC1의 구성적 발현은 Fv/Fm으로 측정한 식물 광합성 효율에 영향을 미치지 않았다.

EPYC1은 고등 식물에서 루비스코와 상호작용한다

특정 SSU가 효모 2-하이브리드 시스템에서 EPYC1과 상호작용할 수 있음을 확인한 후, 루비스코와의 상호작용이 플란타에서 발생하는지 여부를 다음으로 조사하였다. 여러 A. 탈리아나 식물 계통, 구체적으로 2개의 보완된 1a3b 돌연변이 계통과 EPYC1을 발현하는 1개의 야생형 계통(각각 S2_Cr_EPYC1_1, 1A_AtMOD_EPYC1_1 및 EPYC1_1)을 평가하였다. EPYC1은 단백질 A 코팅된 비드에 부착된 항-EPYC1 항체를 사용하여 이들 각각의 계통으로부터 면역침전시켰으며, 용리물은 EPYC1 또는 루비스코에 대한 항체를 사용하여 면역블롯에 의해 분석하였다(도 9a). 예기치 않게 LSU가 S2_Cr_EPYC1 및 1A_AtMOD_EPYC1 계통의 용리액과 EPYC1을 발현하는 야생형에서 검출되었다. 관찰된 공동 면역침전(co-IP)이 루비스코의 난잡함이나 비드 또는 항체에 대한 비특이적 결합의 결과가 아님을 확인하기 위해 여러 음성 대조군을 포함시켰다. 항-HA 코팅된 비드 또는 항체가 없는 비드가 있는 풀다운의 용리액, 또는 EPYC1로 형질전환되지 않은 S2_Cr 식물의 용리액에서는 루비스코가 검출되지 않았다. 따라서, 이러한 결과는 EPYC1이 C. 레인하드티이 또는 C. 레인하드티이-유사 SSU가 없는 형질전환된 식물 계통에서 루비스코와 상호작용할 수 있음을 나타내었다. 그러나, 이러한 상호작용은 피레노이드의 경우와 같이 액체-유사 상 분리와 유사한 가시적인 응집을 촉진하기에 충분하지 않았다. 테스트한 세 계통 사이의 EPYC1 발현 수준의 고유한 변화로 인해 상호작용의 상대적 강도를 완전히 정량화하는 것은 불가능하였다. 그럼에도 불구하고, EPYC1 IP 검정에서 용리된 EPYC1의 수준은 유사하였으나, 1A_AtMOD_EPYC1 및 S2_Cr_EPYC1 co-IP 검정에서 용리된 더 많은 양의 루비스코는, 야생형 배경에서보다 해당 계통에서 EPYC1과 더 강한 상호작용을 시사할 수 있다.

도 9a에 도시된 면역침전 결과와 일치하게, 재구성된 YFP 형광에 대한 BiFC 신호는 YFP^N에 융합된 단백질 및 YFP^C에 융합된 단백질에 관계없이 EPYC1 및 3개의 SSU 각각을 공동-발현하는 식물에서 관찰되었다(도 9b-9e). 그러나, 실시예 3에 기술된 결과는 EPYC1과 1A_At SSU 사이에서 관찰된 명백한 상호작용이 진정한 상호작용이 아님을 나타내었다. 대신, 이 상호작용은 분할된 YFP 반쪽의 자가 조립 경향의 결과로 관찰되었을 가능성이 있다(Waadt, et al., Plant J. (2008) 56: 506-516). 유사하게, 음성 대조군인 AtCP12::YFP^C는 예기치 않게 1A_At::YFP^N로 BiFC 신호를 생성하였으나 1A_At::YFP^C와 AtCP12::YFP^N 간에 상호 작용이 관찰되지 않았기 때문에 이 상호 작용은 인위적일 가능성이 높다. EPYC1과 1A_At SSU 사이에서 관찰된 겉보기 상호작용이 상 분리를 촉진하기에 충분한 진정한 상호작용이 아니라는 해석은 하기 실시예 3에 제시된 실험 결과에 의해 확인되었다.

실시예 3: EPYC1은 이종계에서 액체-유사 응집체를 나타내도록 조작될 수 있고, TobiEPYC1 작제물의 발현은 고등 식물 엽록체에서 구형 응집체를 생성한다

하기 실시예는 시험관내 시스템을 사용하여 EPYC1의 액체-유사 응집체의 검출을 기술한다. 또한, 하기 실시예는 고등 식물 엽록체에서 TobiEPYC1::GFP 작제물의 구형 응집체의 검출을 기술한다.

재료 및 방법

단백질 생산, 액적 침강 검정 및 현미경

루비스코를 암모늄 설페이트 침전, 이온-교환 크로마토그래피, 및 겔 여과의 조합을 이용하여 25 내지 30 일령된 A. 탈리아나 로제트(야생형 식물 및 S2_Cr 라인)로부터 정제하였다(Shivhare and Mueller-Cajar, Plant Phys. (2017) 1505-1516). S2_Cr 라인의 하이브리드 루비스코 복합체는 A. 탈리아나 LSU 및 A. 탈리아나 SSU와 S2_Cr(대략 1:1)의 혼합 집단으로 이루어졌다(Atkinson, et al., New Phytol. (2017) 214: 655-667). 루비스코를 또한 C. 레인하드티이 세포(CC-2677)로부터 정제하였다. EPYC1 및 EPYC1::GFP를 이. 콜라이에서 생산하고, Wunder 등의 문헌[Wunder, et al., Nature Commun. (2018) 9: 5076]에 기재된 바와 같이 정제하였다.

EPYC1-루비스코 액적을 완충액 A(20 mM Tris-HCl[pH 8.0] 및 50 mM NaCl)에서 5 분 동안 10 μl 반응으로 실온에서 재구성하고, 4℃에서 21,100 × g로 4 분 동안 원심분리에 의해 벌크 용액으로부터 분리하였다. EPYC1을 사용한 액체-액체 상 분리를 Wunder 등의 문헌[Wunder, et al., Nature Commun. (2018) 9: 5076]에 의해 개발된 시험관내 검정을 이용하여 시험하였다. 펠렛(액적) 및 상층액(벌크 용액) 분획을 SDS-PAGE 및 쿠마시 염색으로 처리하였다.

광 및 형광 현미경의 경우, 반응 용액(5 μl)을 커버슬립 표면 상에서 초점을 맞춘 ×100 오일 침지 배율로 차등 간섭 대비 및 동일형광 현미경에 대한 설정을 사용하여(플루오레세인 이소티오시아네이트 필터 설정을 사용하여) 3 내지 5 분 후에 Nikon Eclipse Ti 도립 현미경으로 영상화하였다. 사용된 커버슬립은 22 × 22 mm(Superior Marienfeld, 독일)이었고, 22 × 22 커버슬립(Live Cell Instrument, 대한민국)에 대해 1-웰 Chamlide CMS 챔버에 고정하였다. ImageJ를 사용하여 모든 이미지를 의사착색하였다.

면역금 표지 및 전자 현미경

21 일령된 S2_Cr 및 S2_Cr_EPYC1 식물로부터 잎 샘플을 취하고, 4%(v/v) 파라포름알데하이드, 0.5%(v/v) 글루타르알데히드 및 0.05 M 소듐 카코딜레이트[pH 7.2]로 고정하였다. 잎 스트립(1 mm 폭)을 15 분 동안 3 회 고정제로 진공 침윤시킨 다음, 4℃에서 밤새 회전시켰다. 샘플을 PBS로 3 회 세정하고, 이어서 50%, 70%, 80% 및 90% 에탄올(v/v)로 각각 1 시간 동안 이후 100% 에탄올로 3 회 순차적으로 진공 침윤시킴으로써 탈수시켰다. 샘플을 각각 1 시간 동안 에탄올과 혼합된 증가 농도의 LR 백색 수지(30%, 50%, 70%[w/v])로, 이어서 100% 수지로 3 회 침윤시켰다. 수지를 50℃에서 밤새 캡슐에서 중합하였다. 절편(1 μm 두께)을 Leica Ultracut 울트라마이크로톰에서 절단하고, 톨루이딘 블루로 염색하고, 광학 현미경으로 관찰하여 조사에 적합한 영역을 선택하였다. 선택된 면적으로부터 초박형 절편(60 nm 두께)을 절단하고, 플라스틱-코팅된 구리 그리드 상에 장착하였다. 그리드를 TBSTT(0.05% [v/v] Triton X-100 및 0.05% [v/v] Tween 20를 갖는 Tris-완충 염수) 중 1%(w/v) BSA로 차단하고, 1:250 희석으로 TBSTT에서 항-루비스코 항체와 밤새 인큐베이션하고, TBSTT 및 물로 각각 2 회 세척하였다. TBSTT에서 15 nm 금 입자-접합 염소 항-토끼 이차 항체(Abcam)와의 인큐베이션을 이전과 같이 세척하기 전에 1:200 희석으로 1 시간 동안 수행하였다. 그리드를 2%(w/v) 우라닐 아세테이트에서 염색한 다음 JEOL JEM-1400 Plus TEM에서 관찰하였다. 이미지를 GATAN OneView 카메라에서 수집하였다.

TobiEPYC1 작제물 설계 및 식물 형질전환 및 응집체 데이터

TobiEPYC1 유전자 발현 카세트는 도 12a에 나타나 있다. 카세트 1(TobiEPYC1)은 트렁케이션된 N-말단 도메인(SEQ ID NO: 40) 전장 제1 내지 제4 반복 영역(가장 옅은 회색(SEQ ID NO: 36), 회색(SEQ ID NO: 69), 회색(SEQ ID NO: 70) 및 검정색(SEQ ID NO: 71)), 및 전장 C-말단 도메인(SEQ ID NO: 41)을 함유하는, 천연 EPYC1의 트렁케이션된 버전을 함유하였다. 카세트 2(TobiEPYC1::GFP)는 GFP와 융합된 천연 EPYC1의 동일한 트렁케이션된 버전을 함유하였다. 카세트 3(4 개의 reps TobiEPYC1)은 제1 반복 영역(SEQ ID NO: 38)의 4 개의 카피를 갖는 EPYC1의 동일한 합성 버전을 함유하였다. 카세트 4 GFP(4 개의 reps TobiEPYC1::GFP)은 GFP와 융합된 제1 반복 영역의 4 개의 카피를 갖는 EPYC1의 합성 버전을 함유하였다. 카세트 5(8 개의 reps TobiEPYC1)은 제1 반복 영역(SEQ ID NO: 39)의 8 개의 카피를 갖는 EPYC1의 합성 버전을 함유하였다. 카세트 6(8 개의 reps TobiEPYC1::GFP)은 GFP와 융합된 제1 반복 영역의 8 개의 카피를 갖는 EPYC1의 동일한 합성 버전을 함유하였다.

이원 플라스미드 작제물을 Golden Gate MoClo 시스템(Engler, et al., ACS Synth. Bio. (2014) 3: 839-843)에 의해 조립하였다. 플라스미드는 도 12b 내지 12c에 도시된 바와 같이 2 개의 TobiEPYC1 발현 카세트를 함유하였다. 하기 표 6은 TobiEPYC1 유전자 카세트를 사용한 식물 형질전환에 사용된 벡터에 대한 설명을 제공한다.

표 6: 식물 형질전환에 사용된 TobiEPYC1 벡터.

실시예 2에 기재된 바와 같이 플로럴 딥핑법을 이용하여 벡터의 A. 탈리아나로의 형질전환을 수행하였다. 표 6의 벡터 각각에 대해 적어도 3 개의 개별 식물 라인을 생성하였다.

TobiEPYC1::GFP 식물 라인에서 응집체의 검출

TobiEPYC1::GFP 트랜스제닉 식물 라인으로부터의 조직을 실시예 2에 기재된 바와 같이 공초점 현미경을 사용하여 영상화하였다. 공초점 이미지는 온전한 잎 조직(도 12d 내지 12f, 12l, 13a 내지 13b) 또는 잎 조직으로부터 추출된 중엽 원형질체(도 12g 내지 12k)로부터였다. 각각의 TobiEPYC1::GFP 변이체의 적어도 2 개의 개별 식물 라인으로부터 하나의 복제물(표 6에 나타냄)을 영상화하였다.

광표백 후 형광 회복(FRAP)에 의해 응집체 특징을 분석하였다. PMT 검출기와 함께 Leica SP8 공초점 현미경 및 63x 수침 대물 렌즈를 사용하여 FRAP를 수행하였다. 488 nm에서의 여기 및 504 내지 532 nm에서의 방출에 의해 GFP 형광을 영상화하였다. 표백 전 및 표백 후 이미지의 경우, 레이저 출력을 2%로 설정하고, 표백제 자체를 56% 레이저 출력으로 수행하였다. 표백 전 이미지를 189 ms 간격(총 6 개)으로 캡처하고, 표백 후 이미지를 400 ms 간격(총 150 개)으로 캡처하였다. 레이저를 하나의 엽록체 내의 TobiEPYC1::GFP 응집체 중 하나의 작은 영역으로 향하게 함으로써 잎 샘플에 대해 광-표백을 수행하였다. 광-표백 후 회복 시간을 표백되지 않은 영역 대비 표백된 영역에서 GFP 발현을 비교함으로써 계산하였다.

EPYC1 및 C. 레인하드티이 루비스코 SSU의 존재를 실시예 2에 기재된 바와 같이 면역블롯에 의해 확인하였다.

결과

고등 식물 대형 서브유닛(LSU) 및 고등 식물과 C. 레인하드티이 SSU 상의 혼합 집단을 함유하는 하이브리드 루비스코는 EPYC1를 분리한다

현재의 피레노이드 형성 모델은 액체형 상 분리를 촉진하는 특정의 약한 다가 상호작용을 기초로 한다(Hyman, et al., Annu. Rev. Cell Biol. (2014) 30: 39-58; Freeman Rosenzweig, et al., Cell (2017) 171: 148-162). 이러한 상호작용이 하이브리드 식물-유래 루비스코로 발생할 수 있는지 관찰하기 위해, S2_Cr로 보완된 A. 탈리아나 1a3b 돌연변이체로부터의 루비스코가 Wunder 등(Wunder, et al., Nature Commun. (2018) 9: 5076)이 개발한 시험관내 검정을 이용하여 EPYC1과의 액체-액체 상 분리를 용이하게 할 수 있었는 지의 여부를 조사하였다. C. 레인하드티이 루비스코와 유사하게, 하이브리드 식물 루비스코(S2_Cr 라인으로부터의)는 약간 더 높은 비율의 EPYC1: 루비스코에도 불구하고, EPYC1와 탈혼합할 수 있었고, 비슷한 크기의 액체-유사 액적을 형성시켰다(도 10a 내지 10b; 도 10c에 도시된 시간 경과). 대조적으로, 야생형 A. 탈리아나 루비스코는 유사한 조건 하에서 상 분리되지 않았는데, 이는 S2_Cr의 존재가 응집체에 중요했다는 것을 지시한다. C. 레인하드티이 또는 하이브리드 식물 루비스코를 함유하는 용액에서, 액적은 이들의 액체 성질을 시사하는 큰 균질한 액적(유합)으로 융합되었다(도 8c)(Hyman, et al., Annu. Rev. Cell Biol. (2014) 30: 39-58). SDS-폴리아크릴아미드 겔 전기영동(SDS-PAGE) 분석에 의한 분석은 EPYC1과 루비스코 둘 모두가 액적에 들어갔다는 것을 확인시켜 주었다(도 10d 내지 10e).

EPYC1은 고등 식물 엽록체에서 응집체를 형성하도록 조작될 수 있다

식물계에서 루비스코 응집체에 대한 EPYC1의 영향을 조사하기 위해, 최고 수준의 EPYC1(S2_Cr_EPYC1_1)을 발현하는 S2_Cr 보완된 A. 탈리아나 1a3b 돌연변이체의 엽록체에서 루비스코의 편재화를 조사하였다. 루비스코의 면역금 표지는 엽록체 전체에 걸쳐 TEM에 의해 시각화될 때, EPYC1을 발현하지 않은 S2_Cr 대조군과 유사한 금 입자의 균일한 분포를 나타냈다(도 11a 내지 11b). 이는 EPYC1 및 C. 레인하드티이 SSU의 공동-발현이 이들 형질전환체에서 루비스코의 검출 가능한 강성 응집체를 유도하지 않았다는 것을 지시하였다.

TobiEPYC1로 형질전환된 식물의 고등 식물 엽록체에서 구형 응집체가 관찰된다

초기에, 두 가지 버전의 EPYC1을 식물에서의 발현에 대하여 시험하였다. 이들 중 첫 번째는 N-말단에서 78 개의 잔기에 의해 트렁케이션되고(ChloroP 온라인 툴을 기반으로 하는 예측된 엽록체 전이 펩티드) A. 탈리아나 루비스코 SSU 1A(80 개 잔기, MASSMLSSATMVASPAQATMVAPFNGLKSSAAFPATRKANNDITSITSNGGRVNCMQVWPPIGKKKFETLSYLPDLTDSE(SEQ ID NO: 62))에 대한 엽록체 신호 펩티드의 긴 버전에 융합된 EPYC1이었다. 이들 중 두 번째는 A. 탈리아나 루비스코 SSU 1A(80 개 잔기; SEQ ID NO: 62)에 대한 엽록체 신호 펩티드의 긴 버전에 융합된 전장 EPYC1(317 개 잔기; SEQ ID NO:34)이었다. 이들 두 버전 중 어느 것도 야생형 식물 또는 C. 레인하드티이 SSU를 발현하는 안정한 트랜스제닉 A. 탈리아나 라인에서 응집체의 증거를 생성하지 않았다.

이들 2 개의 이전 버전과 비교하여, TobiEPYC1 작제물을 세 가지 방식으로 최적화하였다(TobiEPYC1 유전자 발현 카세트는 도 12a에 도시됨). 첫 번째로, EPYC1(26 개 잔기; SEQ ID NO: 40)의 새로운 N-말단 트렁케이션를 이용하였다. 두 번째로, 트렁케이션된 EPYC1를 A. 탈리아나 루비스코 SSU 1A(57 개 잔기; SEQ ID NO: 63)에 대한 더 짧은 엽록체 신호 펩티드에 융합하였다. 더 긴 전이 펩티드를 갖는 이전 버전은 성공적이지 않았는데, 이는 전이 펩티드의 길이가 중요할 수 있다는 것을 지시한다.

세 번째로, 발현 수준을 증가시키기 위한 목적으로 EPYC1 발현 카세트의 2 개의 카피를 이원 플라스미드에 포함시켰다. 추가로, 1 개의 카피는 2 개의 종결인자를 가졌으며(도 12b 참조), 전략은 보고된 바에 따르면 발현을 약 25 배 증가시켰다(Diamos and Mason, Plant Biotech. J. (2018) 16: 1971-1982). 더 낮은 수준의 GFP 발현이 있는 라인에서 응집체가 여전히 관찰되었지만, 이들 라인의 응집체는 더 작았는데, 이는 EPYC1 발현 카세트의 2 개 카피가 필요할 수 있다는 것을 지시한다. 이들 결과는 루비스코 SSU 및 EPYC1의 양이 응집체 관찰에 중요할 수 있다는 것을 지시하였다. C. 레인하드티이 SSU를 발현하기 위해 사용된 A. 탈리아나 1a3b 돌연변이체는 천연 SSU의 양을 감소시켰다(Izumi, et al., J. Exp Bot. (2012) 63(5): 2159-2170). 따라서, 이전에 트랜스제닉 라인은 50%의 천연 SSU 및 40%의 C. 레인하드티이 SSU를 발현한 것으로 추정되었다(Atkinson, et al., New Phytol. (2017) 214, 655-667). 60 mg m^-2의 C. 레인하드티이 SSU는 루비스코 함량 측정 및 면역블롯 분석에 기초하여 트랜스제닉 라인에 존재한 것으로 추정되었다(문헌[Atkinson, et al., New Phytol. (2017) 214, 655-667]에서 부록 표 S3). 16 kD 중량을 기준으로, 60 mg m^-2의 C. 레인하드티이 SSU는 3.75 μmol m^-2의 C. 레인하드티이 SSU와 동등했다. C. 레인하드티이에 보고된 EPYC1 대 루비스코의 비는 루비스코의 큰 서브유닛의 경우 1:6이고, 작은 서브유닛의 경우 1:1(Mackinder, et al., PNAS (2016) 113: 5958-5963) 내지 작은 서브유닛의 경우 1:8(Hammel, et al., Front. Plant Sci. (2018) 9: 1265)의 범위였다. Wunder 등의 문헌[Wunder, et a., Nat. Commun. (2018) 9: 5076]에서, 7.5 μM의 EPYC1은 루비스코 당 2 개의 EPYC1 분자의 비율에 상응하여 30 μM의 루비스코 활성 부위를 완전히 탈혼합할 수 있는 것으로 확인되었다. 식물계에서 최적이 될 EPYC1 대 루비스코의 정확한 비율은 아직 밝혀지지 않았다. 그러나, 상기 결과는 EPYC1의 2 개의 카피가 각각 단일 및 이중 종결인자를 갖는 항시적 프로모터 하에 발현되었을 때 총 SSU 풀에서 40% C. 레인하드티이 SSU 풀이 응집에 충분했다는 것을 지시하였다.

도 12d는 이득 25 및 레이저 2%에서 영상화된 N. 벤타미아나에서 EPYC1:: GFP의 일시적 발현을 보여주는 반면, 도 12e는 이득 10및 레이저 1%에서 영상화된 N. 벤타미아나에서 TobiEPYC1::GFP의 일시적인 발현을 보여주고 있다. 이들 이미지는 N. 벤타미아나에서 TobiEPYC1::GFP의 일시적 발현 수준이 매우 높다는 것을 보여준다. 도 12f는 A. 탈리아나 S2_Cr 라인에서 TobiEPYC1::GFP의 안정한 발현의 형광 현미경 이미지를 보여준다. 오버레이된 이미지는 TobiEPYC1::GFP가 엽록체에 응집되었다는 것을 명확하게 지시한다. 이들 응집체는 상 분리체를 지시한 매우 구형인 것으로 보였다. 도 12g 내지 12i는 A. 탈리아나 원형질체에서 TobiEPYC1::GFP의 안정한 발현의 형광 현미경 이미지를 보여준다. 도 12i는 TobiEPYC1 응집체(화살표로 표시됨)의 위치에서 더 낮은 엽록소가 관찰되었음을 보여준다. 이는 또한 GFP, 엽록소 및 명시야 이미지의 오버레이가 겹치는 형광 영역을 포함하지 않는 도 12j의 이미지(중간 행이 도 12i에서와 동일한 이미지임이 주지됨)에서 관찰되었다. 이들 결과는 엽록체 틸라코이드가 EPYC1 응집체에서 제외되었음을 시사한다. 도 12k에 도시된 이미지는 엽록체(화살표로 표시됨)에서 분리되는 EPYC1 응집체의 것이었다. 이들 엽록체-외부 EPYC1 응집체는 관찰 기간 동안 배지 내에 응집된 채로 남아 있었다. 도 12l에 나타낸 이미지는 TobiEPYC1::GFP를 안정적으로 발현하는 야생형 A. 탈리아나로부터의 원형질체의 형광 현미경 이미지이다. GFP 및 엽록소 자가형광 채널의 오버레이는 백색에서 겹치는 형광 영역을 보여주었다. 이는 A. 탈리아나 S2_Cr 라인과 달리, EPYC1이 야생형 A. 탈리아나 라인에서 응집체를 형성할 수 없었고, 그 대신에 엽록체 전체에만 걸쳐 확산 발현이 관찰되었음을 지시한다. 이들 결과는 C. 레인하드티이 SSU의 구조적 특징이 EPYC1 응집체를 관찰하는 데 필요하다는 것을 지시한다.

도 13a 내지 13d는 A. 탈리아나 조직에서 EPYC1::GFP 응집체를 특징화하기 위한 FRAP 이미징 시간 경과의 결과를 보여주는 것이다. 광표백 후 회복 시간은 Wunder 등의 문헌[Wunder, et al., Nat. Commun. (2018) 9: 5076]에서 시험관내 탈혼합된 액적에 대하여 관찰된 것과 유사했다. 도 13e에 나타낸 웨스턴 블롯 결과는 TobiEPYC1 유전자 발현 카세트가 여전히 식물계에서 여러 밴드를 생성하였음을 지시하였는데, 이는 N-말단 트렁케이션 및 더 높은 수준의 발현에도 불구하고 분해를 지시한다. 전반적으로, 이들 결과는 C. 레인하드티이 SSU의 구조적 특징을 발현하는 고등 식물(예를 들어, A. 탈리아나)에서 TobiEPYC1 유전자 발현 작제물의 발현이 고등 식물 엽록체에서 구형 응집체의 형성을 초래했음을 지시하였다.

실시예 4: EPYC1의 트렁케이션된 성숙한 형태의 증가된 발현은 고등 식물 엽록체에서 루비스코를 상-분리된 액체-유사 응축물 구조로 안정적으로 응집시킨다

하기 실시예는 식물-조류 하이브리드 루비스코와 함께 이원 발현 벡터로부터 고수준의 트렁케이션된 성숙한 형태의 EPYC1을 발현하는 아라비돕시스 탈리아나 식물 라인에서 EPYC1-루비스코 엽록체 응축물의 분자 및 세포 특징화를 기술한다. 또한, 이는 식물이 상이한 광 수준 하에서 성장할 때, 식물 대사에 대한 응축물의 영향을 기술한다.

이 실시예는 상기 실시예 3에서 "TobiEPYC1::GFP"로 언급된, 도 12c 및 도 12b의 두 번째 줄에 도시된 동일한 작제물을 사용한다. 그러나, 이 실시예 및 상응하는 도면은 작제물을 "TobiEPYC1::GFP"라기보다는 "EPYC1-dGFP"로 지칭한다.

재료 및 방법

식물 재료 및 성장 조건

아라비돕시스(아라비돕시스 탈리아나, Col-0 배경) 종자를 퇴비에 파종하고, 4℃에서 3 일 동안 층화시키고, 12 h 광, 12 h 암흑으로 차가운 백색 LED 조명(Percival SE-41AR3cLED, CLF PlantClimatics GmbH, 베르팅겐, 독일)에 의해 공급되는 200 또는 900 μmol 광자 m^-2 s^-1 하에서 20℃, 주위 CO₂ 및 70% 상대 습도에서 성장시켰다. 상이한 유전자형의 비교를 위해, 동일한 환경 조건에서 성장된 식물로부터 수확된, 동일한 연령 및 저장 이력의 종자로부터 식물을 성장시켰다.

S2_Cr A. 탈리아나 배경 라인(C. 레인하드티이로부터 SSU로 보완된 1a3b 루비스코 돌연변이체)은 Atkinson 등의 문헌[New Phytol 214, 655-667, doi:10.1111/nph.14414 (2017)]에 기재되어 있다. 1A_AtMOD A. 탈리아나 배경 라인은 Meyer 등의 문헌[PNAS, 109, 19474-19479, doi:10.1073/pnas.1210993109 (2012)] 및 Atkinson 등의 문헌[New Phytol 214, 655-667, doi:10.1111/nph.14414 (2017)]에 기재되어 있다.

작제물 설계 및 형질전환

EPYC1의 코딩 서열을 Atkinson 등의 문헌[J. Exp. Bot. 70, 5271-5285, doi:10.1093/jxb/erz275 (2019)]에서와 같이 고등 식물에서의 발현을 위해 코돈-최적화하였다. 트렁케이션된 성숙 EPYC1을 Plant MoClo 시스템의 레벨 0 억셉터 벡터 pAGM1299에 직접 클로닝하였다(Engler, C. et al. A Golden Gate Modular Cloning Toolbox for Plants. Acs Synth Biol 3, 839-843, doi:10.1021/sb4001504 (2014)). 융합 단백질을 생성하기 위해, 유전자 발현 작제물을 이원 수준 2 억셉터 벡터로 조립하였다. 실시예 2에 기재된 바와 같이 플로랄 딥핑에 의해 A. 탈리아나 식물에 안정한 삽입을 위해 수준 2 벡터를 아그로박테리움 투메파시엔스(AGL1)로 형질전환시켰다. PFAST-R 선택 카세트를 사용하여 T2 세대에서 동형접합 형질전환 및 무접합 라인을 확인하였다(Shimada, et al., Plant J. (2010) 61: 519-528).

이중 GFP 발현(EPYC1-dGFP)에 대한 이원 벡터의 개략도는 도 16에 나타나 있다. EPYC1 발현 카세트의 주석이 달린 전체 서열은 SEQ ID NO: 171에 제공된다.

단백질 분석

단백질 추출 완충액(17.4% 글리세롤, 2% Triton X-100 및 cOmplete Mini EDTA-비함유 프로테아제 억제제 칵테일(Roche, 바젤, 스위스)을 갖는 50 mM HEPES-KOH pH 7.5)에서 21 일령된 식물(6 번째 및 7 번째 잎)의 동결된 잎 물질로부터 가용성 단백질을 추출하였다. 샘플을 1 × Bolt LDS 샘플 완충액(ThermoFisher Scientific, UK) 및 200 mM DTT로 15 분 동안 70℃에서 가열하였다. 추출물을 원심분리하고, 상층액을 12%(w/v) 폴리아크릴아미드 겔 상에서 SDS-PAGE에 적용하고 니트로셀룰로스 막으로 옮겼다.

막을 1:10,000 희석으로 밀 루비스코에 대해 생성된 토끼 혈청(Howe, et al., PNAS (1982) 79: 6903-6907), 1:1,000 희석으로 C. 레인하드티이이(CrRbcS2)로부터의 SSU RbcS2에 대해 생성된 토끼 혈청(SSU의 C-말단 영역(KSARDWQPANKRSV (SEQ ID NO: 172)에 생성됨), 1:1000 희석의 항-액틴 항체(베타 항체 60008-1-Ig(Proteintech, UK)), 및/또는 1:2,000 희석의 항-EPYC1 항체(Mackinder, et al., PNAS (2016) 113: 5958-5963 doi:10.1073/pnas.1522866113), 및 이어서 1:10,000 희석의 IRDye 800CW 염소 항-토끼 IgG(LI-COR Biotechnology, 케임브리지, UK)로 탐침하고, Odyssey CLx 영상화 시스템(LI-COR Biotechnology)을 사용하여 시각화하였다.

응축물 추출

가용성 단백질을 "단백질 분석" 섹션에서 상술된 바와 같이 추출한 다음, 미라클로스(Merck Millipore, 벌링턴, 매사추세츠, USA)를 통해 여과하고, Mackinder 등의 문헌[PNAS 113: 5958-5963 (2016)]에서와 같이 4℃에서 3 분 동안 500 g으로 원심분리하였다. 펠렛을 폐기하고, 추출물을 다시 12 분 동안 원심분리하였다. 생성된 펠렛을 단백질 추출 완충액에서 1 회 세척한 다음, 소량의 완충액에 재현탁시키고, 5 분 동안 다시 원심분리하였다. 마지막으로, 펠렛을 25 μl의 추출 완충액에 재현탁시키고, 후술되는 바와 같이 공초점 분석 또는 SDS-PAGE 전기영동에 사용하였다.

성장 분석 및 광합성 측정

로제트 성장 속도를 Dobrescu 등의 문헌[Plant methods 13, 95 (2017)]에 기재된 영상화 시스템을 이용하여 정량화하였다. Hansatech Handy PEA 연속 여기 엽록소 형광계(Hansatech Instruments Ltd, King's 222 Lynn, UK)를 사용하여 32 일령된 식물에서 광계 II(PSII)의 최대 양자 수율(F_v/F_m)을 측정하였다(Maxwell and Johnson, J Exp Bot 412 51, 659-668 (2000)). Flexas 등의 문헌[New Phytologist 175, 501-511, doi:10.1111/j.1469-8137.2007.02111.x (2007)]에서와 같이 가스 교환 측정에 충분한 잎 면적을 생성하기 위해 200 μmol 광자 m^-2 s^-1 하에 큰 화분에서 성장된 35 내지 45 일령된 비-개화 로제트의 여섯 번째 또는 일곱 번째 잎에서 6400-40 잎 챔버로 LI-COR LI-6400(LI-COR, Lincoln, 네브래스카, USA) 휴대용 적외선 가스 분석기를 사용하여 가스 교환 및 엽록소 형광을 결정하였다. 세포 간 CO₂ 농도(C_i)에 대한 순 CO₂ 동화(A)의 반응을 포화 광 하에(1,500 μmol 광자 m^-2 s^-1) 50, 100, 150, 200, 250, 300, 350, 400, 600, 800, 1000, 및 1200 μmol mol^-1 CO₂에서 측정하였다. 모든 가스 교환 실험에 대해, 유량을 200 μmol mol^-1로 유지하고, 잎 온도를 25℃에서 제어하고, 약 70%의 상대 습도를 챔버 내부에서 유지하였다. 순 동화 및 기공 전도도가 정상 상태에 도달한 후에 측정을 수행하였다. 가스 교환 데이터를 Bellasio 등의 문헌[Plant Cell Environ 39, 1180-1197, doi:10.1111/pce.12560 (2015)]에서와 같이 측정 챔버로부터의 CO₂ 확산에 대해 보정하였다. 하기 표 7에 나타낸 평균±평균의 표준 오차(SEM)는 가스 교환 변수에 대한 7 개의 35 일 내지 45 일령된 로제트, 또는 F_v/F_m에 대한 12 개의 32 일령된 로제트에 대한 측정으로부터의 것이다. 하기 표 7에 나타낸 F_v/F_m 값은 형광 측정 전에 45 분 동안 암흑-적응한 부착된 잎에 대한 것이다.

루비스코 카르복실화의 최대 속도(V_cmax), 최대 전자 수송 속도(J_max), 루비스코로 정규화된 CO₂의 주변 농도에서 순 CO₂ 동화 속도(A_루비스코), CO₂ 보상점(Γ), 및 CO₂에 대한 중엽 전도도(세포간 공역에서 엽록체 기질로의 경로에 걸친 CO₂의 전도도; g_m)를 추정하기 위해, A/C_i 데이터를 야생형 25℃에서 A. 탈리아나 루비스코에 대한 촉매 파라미터 K_c ^공기 및 O₂에 대한 친화도(K_o) 값을 사용하여 Ethier 및 Livingston의 문헌[Plant Cell Environ 27, 137-153, doi:10.1111/j.1365-3040.2004.01140.x (2004)]에서와 같은 C₃ 광합성 모델 및 WT 및 S2Cr 라인의 루비스코 함량(Atkinson, N. et al. New Phytol 214, 655-667, doi:10.1111/nph.14414 (2017))에 핏팅하였다. g_m를 Ethier 및 Livingston의 문헌[Plant Cell Environ 27, 137-153, doi:10.1111/j.1365-3040.2004.01140.x (2004)] 및 Diamos 등의 문헌[Plant Biotech J 16, 1971-1982, doi:10.1111/pbi.12931 (2018)]에서와 같이 측정하였다.

공초점 레이저 스캐닝 및 초고해상도 이미지 현미경

Atkinson 등의 문헌[Plant Biotech J 14, 1302-1315, doi:10.1111/pbi.12497 (2016)]에서와 같이 Leica TCS SP8 레이저 스캐닝 공초점 현미경(Leica Microsystems, 밀턴 케인스, UK)으로 잎을 영상화하였다. 영상 처리를 Leica LAS AF Lite 소프트웨어로 수행하였다. 피지(ImageJ, v1.52n)를 사용하여 공초점 이미지로부터 응축물 및 엽록체 치수를 측정하였다(Schindelin et al., Nature Methods 9, 676-682, doi:10.1038/nmeth.2019 (2012)). 응축물 부피를 구형으로 계산하였다. 엽록체 부피를 깊이가 측정 폭의 25%로 추정되는 타원형으로 계산하였다. 엽록체 부피는 24 내지 102 μm³에서 다양했으며, 이는 A. 탈리아나 엽록체에 대한 예상 크기 범위 및 분포 내에 있었다(Crumpton-Taylor et al., Plant Phys 158, 905-916, doi:10.1104/pp.111.186957 (2012)). 비교 피레노이드 면적 측정을 Itakura 등의 문헌[PNAS 116, 18445-18454, doi:10.1073/pnas.1904587116 (2019)]에 기재된 바와 같이 WT C. 레인하드티이 세포(cMJ030)의 TEM 단면 이미지에서 피지를 사용하여 수행하였다.

구조화된 조명 현미경을 사용하여 초고해상도 이미지를 획득하였다. 고정밀 커버-글라스(Zeiss, 예나, 독일)에서 샘플을 제조하였다. 3D SIM 이미지를 100x 1.49NA 렌즈 및 굴절률 매칭 침지 오일(Nikon Instruments)을 사용하여 N-SIM(Nikon Instruments, UK)에서 획득하였다. 샘플을 Nikon Plan Apo TIRF 대물 렌즈(NA 1.49, 오일 침지) 및 488 nm 레이저 라인을 사용하는 Andor DU-897X-5254 카메라를 사용하여 영상화하였다. z 스택의 Z-스텝 크기를 제조업체의 소프트웨어에 의해 요구된 바와 같이 0.120 μm로 설정하였다. 각 초점면에 대해 15 개의 이미지(5 개 위상, 3 개 각도)를 NIS-Elements 소프트웨어로 캡처하였다. SIM 이미지 처리, 재구성 및 분석을 NIS-Element Advanced Research 소프트웨어의 N-SIM 모듈을 사용하여 수행하였다. 이미지를 SIMcheck 소프트웨어(http://www.micron.ox.ac.uk/software/SIMCheck.php)를 사용하여 인공물에 대하여 확인하였다. 이미지를 1 μm 이상의 광학 섹션으로 구성된 z 스택으로부터 NiS Elements 소프트웨어 v4.6(Nikon Instruments)을 사용하여 재구성하였다. 모든 SIM 이미지 재구성에서, Wiener 및 Apodization 필터 파라미터를 일정하게 유지하였다.

면역금 표지 및 전자 현미경

잎 샘플을 21 일령된 S2_Cr 식물 및 EPYC1-dGFP를 발현하는 S2_Cr 트랜스제닉 라인으로부터 취하고, 상기 실시예 3에 기재된 바와 같이 고정, 제조 및 절편화하였다. 차단된 그리드를 TBSTT에서 1:250 희석으로 항-루비스코 항체 또는 1:50 희석으로 항-CrRbcS2 항체와 함께 밤새 인큐베이션하고, 각각 TBSTT 및 물로 2 회 세척하였다. TBSTT에서 15 nm 금 입자-접합 염소 항-토끼 이차 항체(Abcam, 케임브리지, UK)와의 인큐베이션을 실시예 3에서 상술된 바와 같이 세척하기 전에 루비스코 표지의 경우 1:200 희석 또는 CrRbcS2 표지의 경우 1:10으로 1 시간 동안 수행하였다. 염색, 관찰 및 이미지 수집을 상기 실시예 3에 기재된 바와 같이 수행하였다.

통계 분석

결과를 분산 분석(ANOVA)으로 처리하여 샘플 그룹 간의 차이의 유의성을 결정하였다. ANOVA를 수행할 때, Tukey의 실제 유의성 차이(honestly significant difference; HSD) 사후 검정을 실시하여 개별 처리 간 차이를 결정하였다(IBM SPSS Statistics Ver. 26.0, 시카고, IL, USA).

결과

S2 _Cr 트랜스제닉 A. 탈리아나 식물에서 발현된 이중-GFP-태그 트렁케이션된 EPYC1은 더 적은 단백질 분해를 겪었다

EPYC1을 26 번(V) 잔기와 27 번(A) 잔기 사이의 예측된 전이 펩티드 절단 부위에 따라 트렁케이션하였다(Atkinson et al., J Exp Bot 70, 5271-5285, doi:10.1093/jxb/erz275 (2019)). 이중 GFP 발현 시스템(도 16)은 루비스코를 사용하여 고수준의 EPYC1 발현과 유리한 화학량론을 달성하기 위해 개발되었다. 이는 A. 탈리아나 엽록체 신호 펩티드로 트렁케이션된 EPYC1을 인코딩하고 재조합 사건의 변화를 줄이기 위해 상이한 버전의 GFP(turboGFP(tGFP) 또는 강화된 GFP(eGFP))에 융합된 2 개의 유전자 발현 카세트를 함유하는 이원 벡터로 이루어졌다. EPYC1 발현 카세트의 주석이 달린 전체 서열은 SEQ ID NO: 171에 제공된다.

이중 GFP 작제물(EPYC1-dGFP)을 C. 레인하드티이(S2_Cr)로부터의 루비스코 SSU로 보완된 A. 탈리아나 1a3b 루비스코 돌연변이체로 또는 WT 식물로 형질전환시켰다. 생성된 트랜스제닉 식물(각각 Ep1, Ep2및 Ep3로 지칭되는 3 개의 라인)은 EPYC1::eGFP와 EPYC1::tGFP 둘 모두를 발현하였고, 이 중 후자는 일반적으로 더 고도로 발현되었다(도 17).

상기 실시예 2 및 Atkinson 등의 문헌[J Exp Bot 70, 5271-5285, doi:10.1093/jxb/erz275 (2019)]에서, S2_Cr 또는 WT 식물에서 다른 작제물을 사용하여 발현된 전장 EPYC1에 대한 면역블롯은 단백질 분해를 지시하는 추가적인 저분자량 밴드를 나타냈다(도 8a). 대조적으로, 성숙 EPYC1의 발현은 EPYC1-dGFP 작제물이 WT 식물과 비교하여 S2_Cr에서 발현될 때 감소된 수준의 분해 생성물(더 낮은 중량 밴드에 의해 지시된 바와 같이)을 초래하였다(도 17).

S2 _Cr 및 1A _At MOD A. 탈리아나 배경에서 EPYC1-dGFP 발현은 엽록체 기질에서 응축물 형성을 초래하였다

WT 식물에서 EPYC1-dGFP에 대한 형광 신호는 엽록체 전체에 걸쳐 고르게 분포되었다(도 18a, 맨 윗줄; 도 19a, 좌측 패널). 대조적으로, 하이브리드 S2_Cr 식물에서 EPYC1-dGFP는 단일의 조밀한 엽록체 신호만을 나타냈다(도 18a, 중간 행; 도 19a, 중간 패널). 투과 전자 현미경은 엽록체 기질에서 단일의 두드러진 응축된 복합체의 존재를 확인시켜주었다(도 18b). 응축물은 형태가 구형이고, 천연 엽록소 자가형광(도 18c 내지 18e)을 대체하였는데, 이는 틸라코이드 막 기질이 응축물에서 제외되었음을 지시한다. 잎 엽육 세포의 원형질체에서, 각각의 엽록체에서 응축물이 보였고(도 18g), 응축물의 평균 크기는 EPYC1-dGFP의 발현 수준과 관련이 있었다(도 17, 18h, 18j 내지 18l).

응축물의 평균 직경은 1.6 ± 0.1 μm(n = 126; 3 개의 개별 S2_Cr 트랜스제닉 라인으로부터 각각 42)이었고(도 18f, 18j), 이는 C. 레인하드티이 피레노이드의 측정 크기 범위(1.4±0.1 μm; n=55)와 비슷했다(Itakura et al., PNAS 116, 18445-18454, doi:10.1073/pnas.1904587116 (2019)). 응축물의 예상 부피는 2.7 ± 0.2 μm³(엽록체 부피의 약 5%)이었다(도 18k 내지 18l). 개별 S2_Cr 트랜스제닉 Ep 라인 내의 응축물 부피의 변화는 엽록체 부피와 상관 관계가 없었으며(도 18k 내지 18l), 이는 응축물 형성 및 크기의 조절이 엽록체 형태와 거의 무관했음을 시사한다.

EPYC1-dGFP는 또한 C. 레인하드티이(1A_AtMOD)로부터의 루비스코 작은 서브유닛으로부터 피레노이드 형성에 필요한 2 개의 α-나선을 함유하도록 변형된 천연 A. 탈리아나 SSU로 보완된 A. 탈리아나 1a3b 루비스코 돌연변이체에서 발현된 것으로 관찰되었다(도 18a, 아랫줄). 그러나, 1A_AtMOD 배경의 응축물은 점상이 적었는데(도 19a, 우측 패널), 이는 효모 2-하이브리드 실험에서 관찰된 EPYC1에 대한 변형된 천연 루비스코 SSU의 더 낮은 친화성과 일치하였다(도 2a 내지 2c, 3c, 5e)(Atkinson et al., J Exp Bot 70, 5271-5285, doi:10.1093/jxb/erz275 (2019)). 하이브리드 루비스코의 촉매적 특징이 WT 루비스코의 촉매적 특징과 구별될 수 없는 1A_AtMOD 배경(도 18a, 19a)의 응축물 형성(Atkinson et al., New Phytol 214, 655-667, doi:10.1111/nph.14414 (2017))은 SSU가 상 분리, 루비스코 함량 및 성능을 최적화하도록 추가로 조작될 수 있음을 지시하였다.

또한, EPYC1::tGFP 또는 EPYC1::eGFP 발현 카세트가 S2_Cr A. 탈리아나 배경으로 개별적으로 형질전환될 때 가시적 응축물이 형성되었다(도 18i).

상기 실시예 2에서, A. 탈리아나 엽록체에서 EPYC1-dGFP의 전장(즉, 트렁케이션되지 않은) 변이체의 발현은 상 분리를 초래하지 않았는데(도 7c; 문헌[Atkinson et al., J Exp Bot 70, 5271-5285, doi:10.1093/jxb/erz275 (2019)]), 이는 EPYC1과 루비스코 사이에 저수준의 발현 및 비상용성 화학량론, 및 가능한 단백질 가수분해에 기인되었다. 대조적으로, 이 실시예의 결과는 응축물 형성이 그 자체로 EPYC1 발현 수준보다 성숙 EPYC1 변이체의 발현에 더 의존할 수 있음을 지시한다. 이 실시예는 또한 응축물 형성에 필요한 EPYC1과 루비스코 사이의 화학량론이 고등 식물에서 달성될 수 있음을 보여주었다. 또한, 이러한 실시예의 결과(도 17)에서 관찰된 EPYC1의 단백질 분해의 명백한 감소는 상-분리된 구획 내에서 EPYC1의 격리에 의해 야기될 수 있는데, 이는 이들 구획이 큰 프로테아제 복합체(van)에 덜 접근할 수 있는 것으로 가정되기 때문이다(van der Hoorn and Rivas, New Phytol 218, 879-881, doi:10.1111/nph.15156 (2018)).

응축액은 액체-유사 특징을 나타낸다

광표백 후 형광 회복(FRAP) 검정을 피레노이드의 액체-유사 거동과 일치하는 내부 혼합 특징의 존재를 시험하기 위해 EPYC1-dGFP를 발현하는 생 S2_Cr A. 탈리아나 잎 세포에서 응축물에 대해 수행하였다. 응축물은 광표백 후 20 내지 40초 후에 완전한 형광을 회복하였다(도 19b 내지 19c). 이는 A. 탈리아나에서 EPYC1-dGFP 분자가 이전의 시험관내(Wunder et al., Nat Commun 9, 5076, doi:10.1038/s41467-018-07624-w (2018)) 또는 조류(Freeman Rosenzweig et al., Cell 171, 148-162, doi:10.1016/j.cell.2017.08.008 (2017)) 보고와 비교하여 유사하거나 증가된 속도로 혼합된다는 것을 지시하였다. C. 레인하드티이 피레노이드에 비해 트렌스제닉 A. 탈리아나 응축물에서 더 빠른 교환은 C. 레인하드티이에서에 비해 S2_Cr 식물-조류 하이브리드 루비스코 배경에서 루비스코에 대한 EPYC1 결합 부위의 비교적 감소된 이용 가능성에 기인할 수 있는 것으로 사료된다(Mackinder, et al., PNAS (2016) 113: 5958-5963; Freeman Rosenzweig et al., Cell 171, 148-162, doi:10.1016/j.cell.2017.08.008 (2017)). 대조적으로, 포름알데히드와 화학적으로 가교된 잎 조직의 응축물은 광표백 후 회복되지 않았는데(도 19b 내지 19c), 이는 C. 레인하드티이 피레노이드에서 관찰된 것과 일치하였다(Freeman Rosenzweig et al., Cell 171, 148-162, doi:10.1016/j.cell.2017.08.008 (2017)).

또한, EPYC1-dGFP를 발현하는 S2_Cr A. 탈리아나 식물로부터 추출된 후 시험관내에서 재현탁된 응축물은 더 큰 액적으로 유합되었다(도 20c). 액적 형성은 시험관내 EPYC1-루비스코 상호작용과 관련된 것으로 알려진 액체-유사 거동이다(Wunder et al., Nat Commun 9, 5076, doi:10.1038/s41467-018-07624-w (2018)).

EPYC1-dGFP를 발현하는 A. 탈리아나 엽록체에서의 응축물은 EPYC1-dGFP 및 루비스코가 풍부하다

루비스코의 존재에 대하여 시험하기 위해, 약한 원심분리에 의해 A. 탈리아나 잎 조직로부터 응축물을 추출하고, 면역블롯에 의해 검사하였다. EPYC1-dGFP를 발현하는 S2_Cr A. 탈리아나 식물로부터 단리된 응축물(펠렛 분획)은 EPYC1-dGFP 및 루비스코의 큰 서브유닛과 작은 서브유닛 둘 모두가 풍부한 것으로 밝혀졌다(도 20a).

루비스코 SSU와 관련하여, 도 20a에 도시된 웨스턴은 천연 A. 탈리아나 SSU(즉, C. 레인하드티이 SSU(CrRbcS)의 증가 대 천연 A. 탈리아나 SSU(AtRbcS)의 감소)에 비해 단리된 응축물이 C. 레인하드티이 SSU가 풍부하다는 정성적 증거를 제공하였다. 변성된 겔-분리된 추출물의 후속 쿠마시 염색을 사용하여, 총 S2_Cr 가용성 단백질 추출물과 응축물 농축 펠렛 사이에 정량적 차이(백분율)를 생성하였다. 이는 초기 추출물에서 루비스코의 거의 절반(49%)이 C. 레인하드티이 SSU를 함유한 반면, 펠렛화된 응축물 중 루비스코의 82%가 C. 레인하드티이 SSU를 함유한다는 것을 나타냈다(도 20b).

쿠마시 염색과 일치하여, EPYC1-dGFP를 발현하는 S2_Cr로부터의 엽록체의 TEM 이미지의 면역금 분석(도 20d, 20f)은 루비스코의 대략 절반(54%)이 응축물에 편재되었음을 나타냈고(C. 레인하드티이 LSU 및 SSU의 경우보다 고등 식물 LSU 및 SSU 둘 모두에 대해 더 큰 특이성을 갖는 폴리클로날 루비스코 항체로 평가할 때), 반면에 C. 레인하드티이 SSU의 81%가 응축물에 편재되었다(도 20e). 따라서, 루비스코의 응축은 A. 탈리아나 S2_Cr 배경에서 루비스코 SSU 풀의 약 50%를 구성한 C. 레인하드티이 SSU를 지니는 루비스코 복합체와 밀접한 관련이 있었다(도 20a 내지 20b). 후자는 S2_Cr에서 식물-조류 하이브리드 루비스코의 예상 발현 수준과 일치하였다(Atkinson et al., New Phytol 214, 655-667, doi:10.1111/nph.14414 (2017)).

A. 탈리아나에서 EPYC1-dGFP 발현은 성장을 저해하지 않는다

응축물의 존재에 대해 스크리닝된 3 개의 개별 T2 EPYC1-dGFP S2_Cr 트랜스제닉 라인(Ep1-3) 및 이들 각각의 T2 무접합 분리개체 S2_Cr 라인(Az1-3)에서 성장 비교를 실시하였다. 성장을 2 개의 상이한 광 수준 하의 배양 후에 평가하였다: A. 탈리아나 성장에 전형적인 수준(200 μmol 광자 m^-2 s^-1)(도 21a 내지 21b, 21e 내지 21f), 및 전형적인 광 수준보다 높은 수준(900 μmol 광자 m^-2 s^-1)(도 21c 내지 21d, 21g). 이전 연구는 식물 성장이 200 μmol 광자 m^-2 s^-1 하에서보다 900 μmol 광자 m^-2 s^-1 하에서의 루비스코 활성에 의해 더 제한된다는 것을 보여주었다(Lauerer et al., Planta 190, 332-345, doi:10.1007/bf00196962 (1993)).

성장 조건에 관계없이, 로제트 확장 속도 또는 바이오 매스 축적은 S2_Cr 형질전환체와 이들의 분리개체 대조군 사이에 차이가 없었다(도 21a 내지 21g). 유사하게, T2 EPYC1-dGFP WT 식물(EpWT)은 T2 분리개체 라인(AzWT)에 비해 유의한 차이를 나타내지 않았다(도 21a 내지 21g). S2_Cr 라인의 성능은 WT 식물에 비해 약간 감소했는데(도 21a 내지 21e), 이는 S2_Cr 배경에서 루비스코 함량이 감소했기 때문인 것으로 사료된다(Atkinson et al., New Phytol 214, 655-667, doi:10.1111/nph.14414 (2017)). S2_Cr 및 WT 라인 사이에 관찰된 성장 차이는 EPYC1의 부재 하에 S2_Cr 및 WT 식물에 대해 이전에 보고된 것들과 일치하였다(Atkinson et al., New Phytol 214, 655-667, doi:10.1111/nph.14414 (2017)).

A. 탈리아나에서 EPYC1-dGFP 발현은 광합성을 저해하지 않는다

포화 광 하에서 세포간 CO₂ 농도에 대한 CO₂ 동화율의 반응 곡선으로부터 도출된 광합성 파라미터는 각각의 EPYC1-dGFP-발현 및 무접합 분리개체 라인 사이에 유사했다(도 21h 내지 21k; 하기 표 7). 응축물의 존재는 루비스코 카르복실화의 최대 달성 가능한 속도에 영향을 미치지 않았다(V_cmax; 도 21j; 하기 표 7).

표 7은 A. 탈리아나의 S2_Cr 및 WT 트랜스제닉 라인에 대한 가스 교환 및 형광 측정으로부터 도출된 광합성 파라미터를 보여준다. 평균 및 평균의 표준 오차(SEM)는 가스 교환 변수에 대한 7 개의 35 내지 45 일령된 로제트, 및 광계 II의 최대 잠재적 양자 효율에 대한 12 개의 32 일령된 로제트에 대해 나타나 있다(F_v/F_m). F_v/F_m은 형광 측정 전 45 분 동안 암흑-적응된 부착되어 있는 잎에 대해 나타나 있다. SEM 뒤의 문자는 ANOVA에 이어 Tukey의 HSD 검정에 의해 결정하는 경우 동일한 행(P <0.05)의 데이터 내에서 유의한 차이를 지시한다. 행 내에서 동일한 문자가 뒤에 오는 값은 통계적으로 서로 유의하게 상이하지 않다. 용어는 다음과 같이 약칭된다: V_cmax는 μmol CO₂ m^-2 s^-1로 측정된 루비스코 카르복실화의 최대 속도이고; J_max는 μmol e^-m^-2 s^-1로 측정된 최대 전자 수송 속도이고; Γ는 μmol CO₂ m^-2 s^-1로 측정되고 C_i-A로 계산된 CO₂ 보상점이고; g_s는 mol H₂O m^-2 s^-1로 측정된 수증기에 대한 기공 전도도이고; g_m은 mol CO₂ m^-2 s^-1로 측정된, CO₂에 대한 중엽 전도도(즉, 세포 간 공역에서 엽록체 기질로의 경로를 통한 CO₂의 전도도)이고; F_v/F_m은 광계 II의 최대 잠재적 양자 효율이고; ML은 중간 광(200 μmol 광자 m^-2 s^-1) 하에서 측정된 측정치를 나타내고; HL은 높은 광(900 μmol 광자 m^-2 s^-1) 하에서 측정된 측정치를 나타내고; Ep1, Ep2, 및 Ep3은 본 실시예의 다른 도면에 도시된 동일한 3 개의 T2 EPYC1-dGFP S2_Cr 트랜스제닉 라인이고; Az1, Az2, Az3은 각각 Ep1-3의 무접합 분리개체이고; EpWT는 EPYC1-dGFP WT 형질전환체이고; AzWT는 EpWT의 무접합성 분리개체이다.

표 7: EPYC1-dGFP 및 이의 무접합 분리개체를 발현하는 S2 _Cr 및 WTA A. 탈리아나 라인에 대한 광합성 파라미터.

특히, EPYC1-dGFP-발현 및 무접합 분리개체 라인에 대한 CO₂의 주변 농도에서 CO₂ 동화율은 루비스코 함량에 대해 정규화되었을 때 WT 라인과 유사했다(A_루비스코; 도 21i). 이는 WT 식물에 비해 S2_Cr에서 식물-조류 하이브리드 루비스코에 대한 루비스코 회전율(k_cat ^c) 및 특이성(S_C/O)의 알려진 적당한 감소가 광합성 CO₂ 동화의 효율에 경미한 영향만을 미쳤고, 관찰된 성장률의 차이가 S2_Cr 식물에서 루비스코의 감소된 수준과 더 관련이 있었다는 것을 시사하였다(Atkinson et al., New Phytol 214, 655-667, doi:10.1111/nph.14414 (2017)).

엽육 전도도(g_m) 수준은 또한 WT 식물에 비해 모든 S2_Cr 라인에서 감소되었는데(표 7), 이는 트랜스플라스토믹 담배에서 관찰된 gm에 대한 감소된 루비스코 함량의 영향과 일치하였다(Galmes et al., Photosynth Res 115, 153-166, doi:10.1007/s11120-013-9848-8 (2013)).

최대 전자 수송 속도(J_max) 및 광계 II의 최대 전위 양자 효율(F_v/F_m)의 측정은 또한 형질전환체와 분리개체 라인 사이에서 차이가 없었다(표 7). 따라서, 응축물에 의한 틸라코이드 막 기질의 겉보기 변위(도 18c)는 광합성의 광 반응의 효율에 분명한 영향을 미치지 않았다.

본 실시예에 기술된 결과는 EPYC1 및 SSU 상의 특정 잔류물이 루비스코를 단일 원형-피레노이드 응축물로 응집시키기에 충분했으며, 이러한 응축물이 식물 성장에 분명한 악영향을 미치지 않았음을 보여준다. S2_Cr 트랜스제닉 라인의 전반적인 광합성 성능은 응축액에 영향을 받지 않는 것으로 보여, 고등 식물 엽록체 내부의 조건이 피레노이드-타입 바디의 존재와 매우 양립 가능했다는 것을 시사하였다. 이러한 데이터는 "완전 조립된" 생물물리학적 CCM을 생성하기 위해 고등 식물에 조류 생물물리학적 탄소 농축 메커니즘(CCM)의 추가 구성요소를 추가하기 위한 플랫폼을 제공한다. 본원에 제시된 데이터는 거의 틀림없이, 작물 수확 잠재력을 >60%까지 증가시킬 수 있는 식물로의 피레노이드-기반 CCM 조립을 위한 핵심 단계이다(McGrath and Long, Plant Phys 164, 2247-2261, doi:10.1104/pp.113.232611 (2014); Long et al. in Sustaining Global Food Security: The Nexus of Science and Policy. (ed R. S. Zeigler) Ch. 9, (CSIRO Publishing, 2019); Price et al., Plant Phys 155, 20-26, doi:10.1104/pp.110.164681 (2011)). 시아노박테리아 카르복시좀-기반 CCM을 엔지니어링하기 위한 이전에 기술된 접근법은 엽록체-인코딩된 루비스코 큰 서브유닛의 조작을 필요로 하며, 밀 및 쌀과 같은 주요 곡식 작물에서 현재 실행 가능한 접근법은 없다(Long et al., Nat Commun 9, doi:Artn 3570 10.1038/S41467-018-06044-0 (2018)). 이러한 실시예의 결과는 루비스코의 응축이 핵-인코딩된 SSU의 변형을 통해 달성될 수 있음을 입증하였으며, 이는 유전적 변형에 훨씬 더 적합하다.

실시예 5: TobiEPYC1은 루비스코를 N. 벤타미아나 엽록체에서 피레노이드-유사 구조로 안정적으로 응집시킬 것이다

다음 실시예는 TobiEPYC1 N. 벤타미아나 라인에서 엽록체 EPYC1 응집체의 분자 성질의 특징화를 기술한다. 또한, 이는 식물이 상이한 광 수준 하에서 성장할 때, 식물 대사에 대한 EPYC1 응집물의 영향을 기술한다.

재료 및 방법

TobiEPYC1 N. 벤타미아나 라인을 특징화하기 위한 재료 및 방법

실시예 2, 3 및 4에 기재된 재료 및 방법을 사용하여 TobiEPYC1 N. 벤타미아나 라인을 특징화하였다.

TobiEPYC1 N. 벤타미아나 라인에서 EPYC1 응집체를 특징화하였다. 특히, 응집체에 존재하는 루비스코의 유형(즉, 천연 SSU에 대한 C. 레인하드티이 SSU의 비율)을 특징화하였다. 또한, 응집체의 액체-액체 유사 거동을 특징화하였다(예를 들어, FRAP 분석을 사용하여). 또한, 응집체의 물리적 성질(예를 들어, 모양/구조/밀도)을 특징화하였다(예를 들어, TEM/CryoEM에 의해). 또한, 응집체를 단리하고, 단리된 응집체에서 EPYC1을 절단/분해에 대해 특징화하고, 루비스코 함량 및 활성을 측정하였다. 실시예 2에 기술된 BiFC 실험을 또한 이용하여 TobiEPYC1 라인을 특징화하였다. 실시예 2에 사용된 BiFC 시스템 대신에, 3-부분 GFP(Liu et al., 2018 Plant Journal)에 기초한 보다 엄격한 시스템을 사용하였다.

EPYC1 응집체의 영향을 중간 광 수준 및 높은(즉, 루비스코-제한) 광 수준 하에 성장된 TobiEPYC1 N. 벤타미아나 라인의 식물에서 특징화하였다. 특히, 잎 면적, 신선 중량, 및 건조 중량을 측정하였다. 또한, 엽록소 함량, 단백질 함량, 및 총 루비스코 함량을 측정하였다. 또한, 광합성 파라미터를 형광(예를 들어, Fv/Fm) 및 가스 교환 분석(예를 들어, A:Ci 곡선)을 이용하여 측정하였다. 가스 교환 및 형광을 LICOR 6400으로 수행하였다.

결과

면역금 및/또는 형광 공동-편재화 데이터는 EPYC1 엽록체 응집체에서 루비스코의 존재를 보여줄 것이다.

면역금 및/또는 형광 공동-편재화 데이터는 기질 전체에 걸쳐 엽록체 대 루비스코 응집체에서 루비스코 응집체의 상대적 분포를 추정할 것이며, 엽록체에 더 많은 루비스코 응집체가 있음을 보여줄 것이다.

형광 편재화 데이터는 TobiEPYC1이 루비스코 SSU의 상이한 순열을 보유하는 고등 식물에서 발현될 때 응집체가 형성됨을 보여줄 것이다(예를 들어, 다음으로 보완된 A. 탈리아나 SSU 돌연변이 배경: 전체 C. 레인하드티이 RbcS2; C. 레인하드티이 α-나선을 보유하는 변형된 A. 탈리아나 SSU; C. 레인하드티이 α-나선 및 β-시트를 보유하는 변형된 A. 탈리아나 SSU; C. 레인하드티이 α-나선을 보유하는 변형된 A. 탈리아나 SSU, β-시트 및 βA-βB 루프 등).

면역블롯 데이터는 고등 식물에서 발현될 때 TobiEPYC1 및 TobiEPYC1::GFP가 안정하다는 것을 보여줄 것이다.

광표백 후 형광 회복(FRAP) 데이터는 형광-태그 EPYC1 및 루비스코가 고등 식물 엽록체의 응집체에서 액체-유사 혼합을 나타낸다는 것을 보여줄 것이다.

식물 성장 데이터(예를 들어, 신선 중량, 건조 중량, 로제트 면적 등)는 응집된 루비스코를 갖는 식물의 성장이 형질전환되지 않은 식물에 필적 가능할 것임을 보여줄 것이다. 엽록소 함량, 단백질 함량, 및 총 루비스코 함량은 또한 형질전환되지 않은 식물에 필적 가능할 것이다.

광합성 측정(예를 들어, F_v/F_m, A:Ci 곡선 등)은 응집된 루비스코를 갖는 식물이 비형질전환 식물과 비교하여 유사한 효율로 광합성을 수행함을 보여줄 것이다.

생화학적 데이터(예를 들어, 단리된 응집체로부터의)는 응집된 루비스코가 촉매적 활성이라는 것을 보여줄 것이다. 또한, 생화학적 데이터는 EPYC1이 응집체에 존재함을 입증할 것이고, 절단/분해를 위해 응집체에서 EPYC1을 특징화할 것이다.

TEM/cryo-EM 데이터는 EPYC1 응집체의 존재를 입증할 것이고, EPYC1 응집체의 물리적 성질을 특징화할 것이다.

실시예 6: 다양한 다른 고등 식물이 엽록체 기질에서 피레노이드-유사 EPYC1-루비스코 응집체를 발현하도록 조작될 것이다

하기 실시예는 TobiEPYC1 카우피, 대두, 카사바, 쌀, 밀, 및 담배 라인에서 엽록체 EPYC1 응집체의 분자 성질의 특징화를 기술한다. 또한, 하기 실시예는 TobiEPYC1 카우피, 대두, 카사바, 쌀, 밀, 및 담배 라인에서 엽록체 EPYC1 응집체의 분자 성질의 특징화를 기술한다.

재료 및 방법

EPYC1-루비스코 응집체로 작물 식물을 조작하기 위한 관련 재료 및 방법

실시예 3, 4, 및 5로부터의 가장 유망한 작제물을 카우피, 대두, 카사바, 쌀, 밀, 및 담배(N. 타바쿰, 페티테 하바나)에서 EPYC1의 발현을 위한 작제물을 설계하는 데 사용하였다. 엽록체 신호 펩티드의 종-특이적 최적화를 필요에 따라 수행하였다. 또한, 카우피, 대두, 카사바, 쌀, 밀 및 담배의 내인성 SSU가 감소되었다(예를 들어, CRISPR 녹아웃 접근법 이용). C. 레인하드티이 SSU 또는 C. 레인하드티이 SSU 모티프를 갖는 변형된 내인성 SSU를 도입하였다. 식물을 핵 형질전환 접근법을 사용하여 형질전환시켰다.

형질전환된 식물 라인을 실시예 3 내지 4에 기재된 바와 같이 특징화하였다.

결과

TobiEPYC1의 카우피, 대두, 카사바, 쌀, 밀 및 담배로의 형질전환 및 후속 면역블롯 데이터는 생성된 라인이 EPYC1을 안정적으로 발현할 수 있음을 보여줄 것이다.

상기 라인의 면역금 현미경/기타 응집체 검출 방법은 이들이 엽록체 기질에서 EPYC1 및 루비스코 응집체를 형성함을 보여줄 것이다.

식물 성장 데이터(예를 들어, 신선 중량, 건조 중량, 수확량 등)는 응집된 루비스코를 갖는 식물의 성장이 형질전환되지 않은 식물에 필적 가능할 것임을 보여줄 것이다. 엽록소 함량, 단백질 함량, 및 총 루비스코 함량은 또한 형질전환되지 않은 식물에 필적 가능할 것이다.

광합성 측정(예를 들어, F_v/F_m, A:Ci 곡선 등)은 응집된 루비스코를 갖는 식물이 형질전환되지 않은 식물과 비교하여 유사한 효율로 광합성을 수행함을 보여줄 것이다.

SEQUENCE LISTING <110> The University Court of The University of Edinburgh <120> PYRENOID-LIKE STRUCTURES <130> 79454-20008.41 <140> Not Yet Assigned <141> Concurrently Herewith <150> GB 1911068.3 <151> 2019-08-02 <160> 172 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 125 <212> PRT <213> Arabidopsis thaliana <400> 1 Met Gln Val Trp Pro Pro Ile Gly Lys Lys Lys Phe Glu Thr Leu Ser 1 5 10 15 Tyr Leu Pro Asp Leu Thr Asp Ser Glu Leu Ala Lys Glu Val Asp Tyr 20 25 30 Leu Ile Arg Asn Lys Trp Ile Pro Cys Val Glu Phe Glu Leu Glu His 35 40 45 Gly Phe Val Tyr Arg Glu His Gly Asn Ser Pro Gly Tyr Tyr Asp Gly 50 55 60 Arg Tyr Trp Thr Met Trp Lys Leu Pro Leu Phe Gly Cys Thr Asp Ser 65 70 75 80 Ala Gln Val Leu Lys Glu Val Glu Glu Cys Lys Lys Glu Tyr Pro Asn 85 90 95 Ala Phe Ile Arg Ile Ile Gly Phe Asp Asn Thr Arg Gln Val Gln Cys 100 105 110 Ile Ser Phe Ile Ala Tyr Lys Pro Pro Ser Phe Thr Gly 115 120 125 <210> 2 <211> 140 <212> PRT <213> Chlamydomonas reinhardtii <400> 2 Met Met Val Trp Thr Pro Val Asn Asn Lys Met Phe Glu Thr Phe Ser 1 5 10 15 Tyr Leu Pro Pro Leu Ser Asp Glu Gln Ile Ala Ala Gln Val Asp Tyr 20 25 30 Ile Val Ala Asn Gly Trp Ile Pro Cys Leu Glu Phe Ala Glu Ser Asp 35 40 45 Lys Ala Tyr Val Ser Asn Glu Ser Ala Ile Arg Phe Gly Ser Val Ser 50 55 60 Cys Leu Tyr Tyr Asp Asn Arg Tyr Trp Thr Met Trp Lys Leu Pro Met 65 70 75 80 Phe Gly Cys Arg Asp Pro Met Gln Val Leu Arg Glu Ile Val Ala Cys 85 90 95 Thr Lys Ala Phe Pro Asp Ala Tyr Val Arg Leu Val Ala Phe Asp Asn 100 105 110 Gln Lys Gln Val Gln Ile Met Gly Phe Leu Val Gln Arg Pro Lys Ser 115 120 125 Ala Arg Asp Trp Gln Pro Ala Asn Lys Arg Ser Val 130 135 140 <210> 3 <211> 13 <212> PRT <213> Arabidopsis thaliana <400> 3 Asp Ser Glu Leu Ala Lys Glu Val Asp Tyr Leu Ile Arg 1 5 10 <210> 4 <211> 14 <212> PRT <213> Arabidopsis thaliana <400> 4 Ser Ala Gln Val Leu Lys Glu Val Glu Glu Cys Lys Lys Glu 1 5 10 <210> 5 <211> 7 <212> PRT <213> Arabidopsis thaliana <400> 5 Ile Pro Cys Val Glu Phe Glu 1 5 <210> 6 <211> 3 <212> PRT <213> Arabidopsis thaliana <400> 6 Thr Met Trp 1 <210> 7 <211> 8 <212> PRT <213> Arabidopsis thaliana <400> 7 Phe Ile Arg Ile Ile Gly Phe Asp 1 5 <210> 8 <211> 9 <212> PRT <213> Arabidopsis thaliana <400> 8 Val Gln Cys Ile Ser Phe Ile Ala Tyr 1 5 <210> 9 <211> 22 <212> PRT <213> Arabidopsis thaliana <400> 9 Leu Glu His Gly Phe Val Tyr Arg Glu His Gly Asn Ser Pro Gly Tyr 1 5 10 15 Tyr Asp Gly Arg Tyr Trp 20 <210> 10 <211> 13 <212> PRT <213> Chlamydomonas reinhardtii <400> 10 Asp Glu Gln Ile Ala Ala Gln Val Asp Tyr Ile Val Ala 1 5 10 <210> 11 <211> 7 <212> PRT <213> Chlamydomonas reinhardtii <400> 11 Ile Pro Cys Leu Glu Phe Ala 1 5 <210> 12 <211> 14 <212> PRT <213> Chlamydomonas reinhardtii <400> 12 Pro Met Gln Val Leu Arg Glu Ile Val Ala Cys Thr Lys Ala 1 5 10 <210> 13 <211> 8 <212> PRT <213> Chlamydomonas reinhardtii <400> 13 Tyr Val Arg Leu Val Ala Phe Asp 1 5 <210> 14 <211> 9 <212> PRT <213> Chlamydomonas reinhardtii <400> 14 Val Gln Ile Met Gly Phe Leu Val Gln 1 5 <210> 15 <211> 28 <212> PRT <213> Chlamydomonas reinhardtii <400> 15 Glu Ser Asp Lys Ala Tyr Val Ser Asn Glu Ser Ala Ile Arg Phe Gly 1 5 10 15 Ser Val Ser Cys Leu Tyr Tyr Asp Asn Arg Tyr Trp 20 25 <210> 16 <211> 28 <212> PRT <213> Chlamydomonas reinhardtii <400> 16 Glu Ala Asp Lys Ala Tyr Val Ser Asn Glu Ser Ala Ile Arg Phe Gly 1 5 10 15 Ser Val Ser Cys Leu Tyr Tyr Asp Asn Arg Tyr Trp 20 25 <210> 17 <211> 55 <212> PRT <213> Arabidopsis thaliana <400> 17 Met Ala Ser Ser Met Leu Ser Ser Ala Ala Val Val Thr Ser Pro Ala 1 5 10 15 Gln Ala Thr Met Val Ala Pro Phe Thr Gly Leu Lys Ser Ser Ala Ser 20 25 30 Phe Pro Val Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser 35 40 45 Asn Gly Gly Arg Val Ser Cys 50 55 <210> 18 <211> 126 <212> PRT <213> Arabidopsis thaliana <400> 18 Met Lys Val Trp Pro Pro Ile Gly Lys Lys Lys Phe Glu Thr Leu Ser 1 5 10 15 Tyr Leu Pro Asp Leu Thr Asp Val Glu Leu Ala Lys Glu Val Asp Tyr 20 25 30 Leu Leu Arg Asn Lys Trp Ile Pro Cys Val Glu Phe Glu Leu Glu His 35 40 45 Gly Phe Val Tyr Arg Glu His Gly Asn Thr Pro Gly Tyr Tyr Asp Gly 50 55 60 Arg Tyr Trp Thr Met Trp Lys Leu Pro Leu Phe Gly Cys Thr Asp Ser 65 70 75 80 Ala Gln Val Leu Lys Glu Val Glu Glu Cys Lys Lys Glu Tyr Pro Gly 85 90 95 Ala Phe Ile Arg Ile Ile Gly Phe Asp Asn Thr Arg Gln Val Gln Cys 100 105 110 Ile Ser Phe Ile Ala Tyr Lys Pro Pro Ser Phe Thr Asp Ala 115 120 125 <210> 19 <211> 55 <212> PRT <213> Arabidopsis thaliana <400> 19 Met Ala Ser Ser Met Phe Ser Ser Thr Ala Val Val Thr Ser Pro Ala 1 5 10 15 Gln Ala Thr Met Val Ala Pro Phe Thr Gly Leu Lys Ser Ser Ala Ser 20 25 30 Phe Pro Val Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser 35 40 45 Asn Gly Gly Arg Val Ser Cys 50 55 <210> 20 <211> 55 <212> PRT <213> Arabidopsis thaliana <400> 20 Met Ala Ser Ser Met Leu Ser Ser Ala Ala Val Val Thr Ser Pro Ala 1 5 10 15 Gln Ala Thr Met Val Ala Pro Phe Thr Gly Leu Lys Ser Ser Ala Ala 20 25 30 Phe Pro Val Thr Arg Lys Thr Asn Lys Asp Ile Thr Ser Ile Ala Ser 35 40 45 Asn Gly Gly Arg Val Ser Cys 50 55 <210> 21 <211> 126 <212> PRT <213> Arabidopsis thaliana <400> 21 Met Lys Val Trp Pro Pro Ile Gly Lys Lys Lys Phe Glu Thr Leu Ser 1 5 10 15 Tyr Leu Pro Asp Leu Ser Asp Val Glu Leu Ala Lys Glu Val Asp Tyr 20 25 30 Leu Leu Arg Asn Lys Trp Ile Pro Cys Val Glu Phe Glu Leu Glu His 35 40 45 Gly Phe Val Tyr Arg Glu His Gly Asn Thr Pro Gly Tyr Tyr Asp Gly 50 55 60 Arg Tyr Trp Thr Met Trp Lys Leu Pro Leu Phe Gly Cys Thr Asp Ser 65 70 75 80 Ala Gln Val Leu Lys Glu Val Glu Glu Cys Lys Lys Glu Tyr Pro Gly 85 90 95 Ala Phe Ile Arg Ile Ile Gly Phe Asp Asn Thr Arg Gln Val Gln Cys 100 105 110 Ile Ser Phe Ile Ala Tyr Lys Pro Pro Ser Phe Thr Glu Ala 115 120 125 <210> 22 <211> 195 <212> PRT <213> Arabidopsis thaliana <400> 22 Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala 1 5 10 15 Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala 20 25 30 Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser 35 40 45 Asn Gly Gly Arg Val Asn Cys Met Met Val Trp Thr Pro Val Asn Asn 50 55 60 Lys Met Phe Glu Thr Phe Ser Tyr Leu Pro Pro Leu Ser Asp Glu Gln 65 70 75 80 Ile Ala Ala Gln Val Asp Tyr Ile Val Ala Asn Gly Trp Ile Pro Cys 85 90 95 Leu Glu Phe Ala Glu Ser Asp Lys Ala Tyr Val Ser Asn Glu Ser Ala 100 105 110 Ile Arg Phe Gly Ser Val Ser Cys Leu Tyr Tyr Asp Asn Arg Tyr Trp 115 120 125 Thr Met Trp Lys Leu Pro Met Phe Gly Cys Arg Asp Pro Met Gln Val 130 135 140 Leu Arg Glu Ile Val Ala Cys Thr Lys Ala Phe Pro Asp Ala Tyr Val 145 150 155 160 Arg Leu Val Ala Phe Asp Asn Gln Lys Gln Val Gln Ile Met Gly Phe 165 170 175 Leu Val Gln Arg Pro Lys Ser Ala Arg Asp Trp Gln Pro Ala Asn Lys 180 185 190 Arg Ser Val 195 <210> 23 <211> 125 <212> PRT <213> Arabidopsis thaliana <400> 23 Met Gln Val Trp Pro Pro Ile Gly Lys Lys Lys Phe Glu Thr Leu Ser 1 5 10 15 Tyr Leu Pro Asp Leu Thr Asp Ser Glu Leu Ala Lys Glu Val Asp Tyr 20 25 30 Leu Ile Arg Asn Lys Trp Ile Pro Cys Leu Glu Phe Ala Leu Glu His 35 40 45 Gly Phe Val Tyr Arg Glu His Gly Asn Ser Pro Gly Tyr Tyr Asp Gly 50 55 60 Arg Tyr Trp Thr Met Trp Lys Leu Pro Leu Phe Gly Cys Thr Asp Ser 65 70 75 80 Ala Gln Val Leu Lys Glu Val Glu Glu Cys Lys Lys Glu Tyr Pro Asn 85 90 95 Ala Tyr Val Arg Leu Val Ala Phe Asp Asn Thr Arg Gln Val Gln Ile 100 105 110 Met Gly Phe Leu Val Gln Lys Pro Pro Ser Phe Thr Gly 115 120 125 <210> 24 <211> 131 <212> PRT <213> Arabidopsis thaliana <400> 24 Met Gln Val Trp Pro Pro Ile Gly Lys Lys Lys Phe Glu Thr Leu Ser 1 5 10 15 Tyr Leu Pro Asp Leu Thr Asp Ser Glu Leu Ala Lys Glu Val Asp Tyr 20 25 30 Leu Ile Arg Asn Lys Trp Ile Pro Cys Val Glu Phe Glu Glu Ala Asp 35 40 45 Lys Ala Tyr Val Ser Asn Glu Ser Ala Ile Arg Phe Gly Ser Val Ser 50 55 60 Cys Leu Tyr Tyr Asp Asn Arg Tyr Trp Thr Met Trp Lys Leu Pro Leu 65 70 75 80 Phe Gly Cys Thr Asp Ser Ala Gln Val Leu Lys Glu Val Glu Glu Cys 85 90 95 Lys Lys Glu Tyr Pro Asn Ala Phe Ile Arg Ile Ile Gly Phe Asp Asn 100 105 110 Thr Arg Gln Val Gln Cys Ile Ser Phe Ile Ala Tyr Lys Pro Pro Ser 115 120 125 Phe Thr Gly 130 <210> 25 <211> 131 <212> PRT <213> Arabidopsis thaliana <400> 25 Met Gln Val Trp Pro Pro Ile Gly Lys Lys Lys Phe Glu Thr Leu Ser 1 5 10 15 Tyr Leu Pro Asp Leu Thr Asp Ser Glu Leu Ala Lys Glu Val Asp Tyr 20 25 30 Leu Ile Arg Asn Lys Trp Ile Pro Cys Leu Glu Phe Ala Glu Ala Asp 35 40 45 Lys Ala Tyr Val Ser Asn Glu Ser Ala Ile Arg Phe Gly Ser Val Ser 50 55 60 Cys Leu Tyr Tyr Asp Asn Arg Tyr Trp Thr Met Trp Lys Leu Pro Leu 65 70 75 80 Phe Gly Cys Thr Asp Ser Ala Gln Val Leu Lys Glu Val Glu Glu Cys 85 90 95 Lys Lys Glu Tyr Pro Asn Ala Tyr Val Arg Leu Val Ala Phe Asp Asn 100 105 110 Thr Arg Gln Val Gln Ile Met Gly Phe Leu Val Gln Lys Pro Pro Ser 115 120 125 Phe Thr Gly 130 <210> 26 <211> 125 <212> PRT <213> Arabidopsis thaliana <400> 26 Met Gln Val Trp Pro Pro Ile Gly Lys Lys Lys Phe Glu Thr Leu Ser 1 5 10 15 Tyr Leu Pro Asp Leu Thr Asp Glu Gln Ile Ala Ala Gln Val Asp Tyr 20 25 30 Ile Val Ala Asn Lys Trp Ile Pro Cys Val Glu Phe Glu Leu Glu His 35 40 45 Gly Phe Val Tyr Arg Glu His Gly Asn Ser Pro Gly Tyr Tyr Asp Gly 50 55 60 Arg Tyr Trp Thr Met Trp Lys Leu Pro Leu Phe Gly Cys Thr Asp Pro 65 70 75 80 Met Gln Val Leu Arg Glu Ile Val Ala Cys Thr Lys Ala Tyr Pro Asn 85 90 95 Ala Phe Ile Arg Ile Ile Gly Phe Asp Asn Thr Arg Gln Val Gln Cys 100 105 110 Ile Ser Phe Ile Ala Tyr Lys Pro Pro Ser Phe Thr Gly 115 120 125 <210> 27 <211> 125 <212> PRT <213> Arabidopsis thaliana <400> 27 Met Gln Val Trp Pro Pro Ile Gly Lys Lys Lys Phe Glu Thr Leu Ser 1 5 10 15 Tyr Leu Pro Asp Leu Thr Asp Glu Gln Ile Ala Ala Gln Val Asp Tyr 20 25 30 Ile Val Ala Asn Lys Trp Ile Pro Cys Leu Glu Phe Ala Leu Glu His 35 40 45 Gly Phe Val Tyr Arg Glu His Gly Asn Ser Pro Gly Tyr Tyr Asp Gly 50 55 60 Arg Tyr Trp Thr Met Trp Lys Leu Pro Leu Phe Gly Cys Thr Asp Pro 65 70 75 80 Met Gln Val Leu Arg Glu Ile Val Ala Cys Thr Lys Ala Tyr Pro Asn 85 90 95 Ala Tyr Val Arg Leu Val Ala Phe Asp Asn Thr Arg Gln Val Gln Ile 100 105 110 Met Gly Phe Leu Val Gln Lys Pro Pro Ser Phe Thr Gly 115 120 125 <210> 28 <211> 131 <212> PRT <213> Arabidopsis thaliana <400> 28 Met Gln Val Trp Pro Pro Ile Gly Lys Lys Lys Phe Glu Thr Leu Ser 1 5 10 15 Tyr Leu Pro Asp Leu Thr Asp Glu Gln Ile Ala Ala Gln Val Asp Tyr 20 25 30 Ile Val Ala Asn Lys Trp Ile Pro Cys Leu Glu Phe Ala Glu Ala Asp 35 40 45 Lys Ala Tyr Val Ser Asn Glu Ser Ala Ile Arg Phe Gly Ser Val Ser 50 55 60 Cys Leu Tyr Tyr Asp Asn Arg Tyr Trp Thr Met Trp Lys Leu Pro Leu 65 70 75 80 Phe Gly Cys Thr Asp Pro Met Gln Val Leu Arg Glu Ile Val Ala Cys 85 90 95 Thr Lys Ala Tyr Pro Asn Ala Tyr Val Arg Leu Val Ala Phe Asp Asn 100 105 110 Thr Arg Gln Val Gln Ile Met Gly Phe Leu Val Gln Lys Pro Pro Ser 115 120 125 Phe Thr Gly 130 <210> 29 <211> 45 <212> PRT <213> Chlamydomonas reinhardtii <400> 29 Met Ala Ala Val Ile Ala Lys Ser Ser Val Ser Ala Ala Val Ala Arg 1 5 10 15 Pro Ala Arg Ser Ser Val Arg Pro Met Ala Ala Leu Lys Pro Ala Val 20 25 30 Lys Ala Ala Pro Val Ala Ala Pro Ala Gln Ala Asn Gln 35 40 45 <210> 30 <211> 140 <212> PRT <213> Chlamydomonas reinhardtii <400> 30 Met Met Val Trp Thr Pro Val Asn Asn Lys Met Phe Glu Thr Phe Ser 1 5 10 15 Tyr Leu Pro Pro Leu Thr Asp Glu Gln Ile Ala Ala Gln Val Asp Tyr 20 25 30 Ile Val Ala Asn Gly Trp Ile Pro Cys Leu Glu Phe Ala Glu Ala Asp 35 40 45 Lys Ala Tyr Val Ser Asn Glu Ser Ala Ile Arg Phe Gly Ser Val Ser 50 55 60 Cys Leu Tyr Tyr Asp Asn Arg Tyr Trp Thr Met Trp Lys Leu Pro Met 65 70 75 80 Phe Gly Cys Arg Asp Pro Met Gln Val Leu Arg Glu Ile Val Ala Cys 85 90 95 Thr Lys Ala Phe Pro Asp Ala Tyr Val Arg Leu Val Ala Phe Asp Asn 100 105 110 Gln Lys Gln Val Gln Ile Met Gly Phe Leu Val Gln Arg Pro Lys Thr 115 120 125 Ala Arg Asp Phe Gln Pro Ala Asn Lys Arg Ser Val 130 135 140 <210> 31 <211> 184 <212> PRT <213> Chlamydomonas reinhardtii <400> 31 Met Ala Ala Val Ile Ala Lys Ser Ser Val Ser Ala Ala Val Ala Arg 1 5 10 15 Pro Ala Arg Ser Ser Val Arg Pro Met Ala Ala Leu Lys Pro Ala Val 20 25 30 Lys Ala Ala Pro Val Ala Ala Pro Ala Gln Ala Asn Gln Met Met Val 35 40 45 Trp Thr Pro Val Asn Asn Lys Met Phe Glu Thr Phe Ser Tyr Leu Pro 50 55 60 Pro Leu Thr Asp Glu Gln Ile Ala Ala Gln Val Asp Tyr Ile Val Ala 65 70 75 80 Asn Gly Trp Ile Pro Cys Leu Glu Phe Ala Glu Ala Asp Lys Ala Tyr 85 90 95 Val Ser Asn Glu Ser Ala Ile Arg Phe Gly Ser Val Ser Cys Leu Tyr 100 105 110 Tyr Asp Asn Arg Tyr Trp Thr Met Trp Lys Leu Pro Met Phe Gly Cys 115 120 125 Arg Asp Pro Met Gln Val Leu Arg Glu Ile Val Ala Cys Thr Lys Ala 130 135 140 Phe Pro Asp Ala Tyr Val Arg Leu Val Ala Phe Asp Asn Gln Lys Gln 145 150 155 160 Val Gln Ile Met Gly Phe Leu Val Gln Arg Pro Lys Thr Ala Arg Asp 165 170 175 Phe Gln Pro Ala Asn Lys Arg Ser 180 <210> 32 <211> 185 <212> PRT <213> Chlamydomonas reinhardtii <400> 32 Met Ala Ala Val Ile Ala Lys Ser Ser Val Ser Ala Ala Val Ala Arg 1 5 10 15 Pro Ala Arg Ser Ser Val Arg Pro Met Ala Ala Leu Lys Pro Ala Val 20 25 30 Lys Ala Ala Pro Val Ala Ala Pro Ala Gln Ala Asn Gln Met Met Val 35 40 45 Trp Thr Pro Val Asn Asn Lys Met Phe Glu Thr Phe Ser Tyr Leu Pro 50 55 60 Pro Leu Ser Asp Glu Gln Ile Ala Ala Gln Val Asp Tyr Ile Val Ala 65 70 75 80 Asn Gly Trp Ile Pro Cys Leu Glu Phe Ala Glu Ser Asp Lys Ala Tyr 85 90 95 Val Ser Asn Glu Ser Ala Ile Arg Phe Gly Ser Val Ser Cys Leu Tyr 100 105 110 Tyr Asp Asn Arg Tyr Trp Thr Met Trp Lys Leu Pro Met Phe Gly Cys 115 120 125 Arg Asp Pro Met Gln Val Leu Arg Glu Ile Val Ala Cys Thr Lys Ala 130 135 140 Phe Pro Asp Ala Tyr Val Arg Leu Val Ala Phe Asp Asn Gln Lys Gln 145 150 155 160 Val Gln Ile Met Gly Phe Leu Val Gln Arg Pro Lys Ser Ala Arg Asp 165 170 175 Trp Gln Pro Ala Asn Lys Arg Ser Val 180 185 <210> 33 <211> 180 <212> PRT <213> Arabidopsis thaliana <400> 33 Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala 1 5 10 15 Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala 20 25 30 Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser 35 40 45 Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Gly Lys 50 55 60 Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Glu Gln 65 70 75 80 Ile Ala Ala Gln Val Asp Tyr Ile Val Ala Asn Lys Trp Ile Pro Cys 85 90 95 Val Glu Phe Glu Leu Glu His Gly Phe Val Tyr Arg Glu His Gly Asn 100 105 110 Ser Pro Gly Tyr Tyr Asp Gly Arg Tyr Trp Thr Met Trp Lys Leu Pro 115 120 125 Leu Phe Gly Cys Thr Asp Pro Met Gln Val Leu Arg Glu Ile Val Ala 130 135 140 Cys Thr Lys Ala Tyr Pro Asn Ala Phe Ile Arg Ile Ile Gly Phe Asp 145 150 155 160 Asn Thr Arg Gln Val Gln Cys Ile Ser Phe Ile Ala Tyr Lys Pro Pro 165 170 175 Ser Phe Thr Gly 180 <210> 34 <211> 317 <212> PRT <213> Chlamydomonas reinhardtii <400> 34 Met Ala Thr Ile Ser Ser Met Arg Val Gly Ala Ala Ser Arg Val Val 1 5 10 15 Val Ser Gly Arg Val Lys Thr Val Lys Val Ala Ala Arg Gly Ser Trp 20 25 30 Arg Glu Ser Ser Thr Ala Thr Val Gln Ala Ser Arg Ala Ser Ser Ala 35 40 45 Thr Asn Arg Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg 50 55 60 Gln Glu Leu Glu Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala 65 70 75 80 Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp 85 90 95 Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys 100 105 110 Lys Ala Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln 115 120 125 Glu Leu Glu Ser Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala 130 135 140 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 145 150 155 160 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ser Lys Lys Ala Val Thr 165 170 175 Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser 180 185 190 Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala 195 200 205 Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala 210 215 220 Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Thr Pro Ser Arg 225 230 235 240 Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser Leu Arg Ser 245 250 255 Asn Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser 260 265 270 Ser Ala Ser Trp Arg Asp Ala Pro Ala Ser Ser Ser Ser Ser Ser Ala 275 280 285 Asp Lys Ala Gly Thr Asn Pro Trp Thr Gly Lys Ser Lys Pro Glu Ile 290 295 300 Lys Arg Thr Ala Leu Pro Ala Asp Trp Arg Lys Gly Leu 305 310 315 <210> 35 <211> 291 <212> PRT <213> Chlamydomonas reinhardtii <400> 35 Ala Ala Arg Gly Ser Trp Arg Glu Ser Ser Thr Ala Thr Val Gln Ala 1 5 10 15 Ser Arg Ala Ser Ser Ala Thr Asn Arg Val Ser Pro Thr Arg Ser Val 20 25 30 Leu Pro Ala Asn Trp Arg Gln Glu Leu Glu Ser Leu Arg Asn Gly Asn 35 40 45 Gly Ser Ser Ser Ala Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser 50 55 60 Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg 65 70 75 80 Ser Ser Ser Ala Ser Lys Lys Ala Val Thr Pro Ser Arg Ser Ala Leu 85 90 95 Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser Leu Arg Ser Ser Ser Pro 100 105 110 Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser 115 120 125 Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser 130 135 140 Ser Lys Lys Ala Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp 145 150 155 160 Lys Gln Glu Leu Glu Ser Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser 165 170 175 Ser Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala 180 185 190 Ala Pro Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys 195 200 205 Ala Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu 210 215 220 Leu Glu Ser Leu Arg Ser Asn Ser Pro Ala Pro Ala Ser Ser Ala Pro 225 230 235 240 Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Pro Ala Ser 245 250 255 Ser Ser Ser Ser Ser Ala Asp Lys Ala Gly Thr Asn Pro Trp Thr Gly 260 265 270 Lys Ser Lys Pro Glu Ile Lys Arg Thr Ala Leu Pro Ala Asp Trp Arg 275 280 285 Lys Gly Leu 290 <210> 36 <211> 63 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 36 Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu 1 5 10 15 Glu Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala 20 25 30 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 35 40 45 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala 50 55 60 <210> 37 <211> 126 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 37 Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu 1 5 10 15 Glu Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala 20 25 30 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 35 40 45 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val 50 55 60 Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu Glu 65 70 75 80 Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala Pro 85 90 95 Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala 100 105 110 Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala 115 120 125 <210> 38 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 38 Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu 1 5 10 15 Glu Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala 20 25 30 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 35 40 45 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val 50 55 60 Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu Glu 65 70 75 80 Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala Pro 85 90 95 Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala 100 105 110 Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Ser 115 120 125 Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu Glu Ser 130 135 140 Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala Pro Ala 145 150 155 160 Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser 165 170 175 Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Ser Pro 180 185 190 Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu Glu Ser Leu 195 200 205 Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala Pro Ala Pro 210 215 220 Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser 225 230 235 240 Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala 245 250 <210> 39 <211> 504 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 39 Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu 1 5 10 15 Glu Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala 20 25 30 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 35 40 45 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val 50 55 60 Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu Glu 65 70 75 80 Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala Pro 85 90 95 Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala 100 105 110 Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Ser 115 120 125 Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu Glu Ser 130 135 140 Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala Pro Ala 145 150 155 160 Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser 165 170 175 Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Ser Pro 180 185 190 Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu Glu Ser Leu 195 200 205 Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala Pro Ala Pro 210 215 220 Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser 225 230 235 240 Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Ser Pro Thr 245 250 255 Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu Glu Ser Leu Arg 260 265 270 Asn Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala Pro Ala Pro Ala 275 280 285 Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala 290 295 300 Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Ser Pro Thr Arg 305 310 315 320 Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu Glu Ser Leu Arg Asn 325 330 335 Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala Pro Ala Pro Ala Arg 340 345 350 Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala Pro 355 360 365 Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Ser Pro Thr Arg Ser 370 375 380 Val Leu Pro Ala Asn Trp Arg Gln Glu Leu Glu Ser Leu Arg Asn Gly 385 390 395 400 Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser 405 410 415 Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala Pro Ala 420 425 430 Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Ser Pro Thr Arg Ser Val 435 440 445 Leu Pro Ala Asn Trp Arg Gln Glu Leu Glu Ser Leu Arg Asn Gly Asn 450 455 460 Gly Ser Ser Ser Ala Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser 465 470 475 480 Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg 485 490 495 Ser Ser Ser Ala Ser Lys Lys Ala 500 <210> 40 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 40 Ala Ala Arg Gly Ser Trp Arg Glu Ser Ser Thr Ala Thr Val Gln Ala 1 5 10 15 Ser Arg Ala Ser Ser Ala Thr Asn Arg 20 25 <210> 41 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 41 Gly Thr Asn Pro Trp Thr Gly Lys Ser Lys Pro Glu Ile Lys Arg Thr 1 5 10 15 Ala Leu Pro Ala Asp Trp Arg Lys Gly Leu 20 25 <210> 42 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 42 Met Ala Thr Ile Ser Ser Met Arg Val Gly Ala Ala Ser Arg Val Val 1 5 10 15 Val Ser Gly Arg Val Lys Thr Val Lys Val 20 25 <210> 43 <211> 114 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 43 Met Ala Thr Ile Ser Ser Met Arg Val Gly Ala Ala Ser Arg Val Val 1 5 10 15 Val Ser Gly Arg Val Lys Thr Val Lys Val Ala Ala Arg Gly Ser Trp 20 25 30 Arg Glu Ser Ser Thr Ala Thr Val Gln Ala Ser Arg Ala Ser Ser Ala 35 40 45 Thr Asn Arg Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg 50 55 60 Gln Glu Leu Glu Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala 65 70 75 80 Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp 85 90 95 Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys 100 105 110 Lys Ala <210> 44 <211> 174 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 44 Met Ala Thr Ile Ser Ser Met Arg Val Gly Ala Ala Ser Arg Val Val 1 5 10 15 Val Ser Gly Arg Val Lys Thr Val Lys Val Ala Ala Arg Gly Ser Trp 20 25 30 Arg Glu Ser Ser Thr Ala Thr Val Gln Ala Ser Arg Ala Ser Ser Ala 35 40 45 Thr Asn Arg Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg 50 55 60 Gln Glu Leu Glu Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala 65 70 75 80 Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp 85 90 95 Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys 100 105 110 Lys Ala Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln 115 120 125 Glu Leu Glu Ser Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala 130 135 140 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 145 150 155 160 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ser Lys Lys Ala 165 170 <210> 45 <211> 235 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 45 Met Ala Thr Ile Ser Ser Met Arg Val Gly Ala Ala Ser Arg Val Val 1 5 10 15 Val Ser Gly Arg Val Lys Thr Val Lys Val Ala Ala Arg Gly Ser Trp 20 25 30 Arg Glu Ser Ser Thr Ala Thr Val Gln Ala Ser Arg Ala Ser Ser Ala 35 40 45 Thr Asn Arg Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg 50 55 60 Gln Glu Leu Glu Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala 65 70 75 80 Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp 85 90 95 Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys 100 105 110 Lys Ala Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln 115 120 125 Glu Leu Glu Ser Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala 130 135 140 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 145 150 155 160 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ser Lys Lys Ala Val Thr 165 170 175 Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser 180 185 190 Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala 195 200 205 Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala 210 215 220 Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala 225 230 235 <210> 46 <211> 291 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 46 Met Ala Thr Ile Ser Ser Met Arg Val Gly Ala Ala Ser Arg Val Val 1 5 10 15 Val Ser Gly Arg Val Lys Thr Val Lys Val Ala Ala Arg Gly Ser Trp 20 25 30 Arg Glu Ser Ser Thr Ala Thr Val Gln Ala Ser Arg Ala Ser Ser Ala 35 40 45 Thr Asn Arg Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg 50 55 60 Gln Glu Leu Glu Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala 65 70 75 80 Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp 85 90 95 Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys 100 105 110 Lys Ala Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln 115 120 125 Glu Leu Glu Ser Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala 130 135 140 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 145 150 155 160 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ser Lys Lys Ala Val Thr 165 170 175 Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser 180 185 190 Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala 195 200 205 Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala 210 215 220 Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Thr Pro Ser Arg 225 230 235 240 Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser Leu Arg Ser 245 250 255 Asn Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser 260 265 270 Ser Ala Ser Trp Arg Asp Ala Pro Ala Ser Ser Ser Ser Ser Ser Ala 275 280 285 Asp Lys Ala 290 <210> 47 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 47 Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu 1 5 10 15 Glu Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala 20 25 30 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 35 40 45 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val 50 55 60 Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu Glu 65 70 75 80 Ser Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro 85 90 95 Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser 100 105 110 Ala Pro Ala Arg Ser Ser Ser Ser Lys Lys Ala Val Thr Pro Ser Arg 115 120 125 Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser Leu Arg Ser 130 135 140 Ser Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser 145 150 155 160 Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg 165 170 175 Ser Ser Ser Ala Ser Lys Lys Ala Val Thr Pro Ser Arg Ser Ala Leu 180 185 190 Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser Leu Arg Ser Asn Ser Pro 195 200 205 Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser 210 215 220 Trp Arg Asp Ala Pro Ala Ser Ser Ser Ser Ser Ser Ala Asp Lys Ala 225 230 235 240 Gly Thr Asn Pro Trp Thr Gly Lys Ser Lys Pro Glu Ile Lys Arg Thr 245 250 255 Ala Leu Pro Ala Asp Trp Arg Lys Gly Leu 260 265 <210> 48 <211> 203 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 48 Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu 1 5 10 15 Glu Ser Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala 20 25 30 Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser 35 40 45 Ser Ala Pro Ala Arg Ser Ser Ser Ser Lys Lys Ala Val Thr Pro Ser 50 55 60 Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser Leu Arg 65 70 75 80 Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser 85 90 95 Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala Pro Ala 100 105 110 Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Thr Pro Ser Arg Ser Ala 115 120 125 Leu Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser Leu Arg Ser Asn Ser 130 135 140 Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala 145 150 155 160 Ser Trp Arg Asp Ala Pro Ala Ser Ser Ser Ser Ser Ser Ala Asp Lys 165 170 175 Ala Gly Thr Asn Pro Trp Thr Gly Lys Ser Lys Pro Glu Ile Lys Arg 180 185 190 Thr Ala Leu Pro Ala Asp Trp Arg Lys Gly Leu 195 200 <210> 49 <211> 143 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 49 Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu 1 5 10 15 Glu Ser Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala 20 25 30 Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser 35 40 45 Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Thr Pro 50 55 60 Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser Leu 65 70 75 80 Arg Ser Asn Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala Arg 85 90 95 Ser Ser Ser Ala Ser Trp Arg Asp Ala Pro Ala Ser Ser Ser Ser Ser 100 105 110 Ser Ala Asp Lys Ala Gly Thr Asn Pro Trp Thr Gly Lys Ser Lys Pro 115 120 125 Glu Ile Lys Arg Thr Ala Leu Pro Ala Asp Trp Arg Lys Gly Leu 130 135 140 <210> 50 <211> 82 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 50 Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu 1 5 10 15 Glu Ser Leu Arg Ser Asn Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala 20 25 30 Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Pro Ala Ser Ser 35 40 45 Ser Ser Ser Ser Ala Asp Lys Ala Gly Thr Asn Pro Trp Thr Gly Lys 50 55 60 Ser Lys Pro Glu Ile Lys Arg Thr Ala Leu Pro Ala Asp Trp Arg Lys 65 70 75 80 Gly Leu <210> 51 <211> 317 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 51 Met Ala Thr Ile Ser Ser Met Arg Val Gly Ala Ala Ser Arg Val Val 1 5 10 15 Val Ser Gly Arg Val Lys Thr Val Lys Val Ala Ala Arg Gly Ser Trp 20 25 30 Arg Glu Ser Ser Thr Ala Thr Val Gln Ala Ser Arg Ala Ser Ser Ala 35 40 45 Thr Asn Arg Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Ala 50 55 60 Ala Ala Ala Ala Ala Ala Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala 65 70 75 80 Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp 85 90 95 Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys 100 105 110 Lys Ala Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln 115 120 125 Glu Leu Glu Ser Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala 130 135 140 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 145 150 155 160 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ser Lys Lys Ala Val Thr 165 170 175 Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser 180 185 190 Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala 195 200 205 Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala 210 215 220 Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Thr Pro Ser Arg 225 230 235 240 Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser Leu Arg Ser 245 250 255 Asn Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser 260 265 270 Ser Ala Ser Trp Arg Asp Ala Pro Ala Ser Ser Ser Ser Ser Ser Ala 275 280 285 Asp Lys Ala Gly Thr Asn Pro Trp Thr Gly Lys Ser Lys Pro Glu Ile 290 295 300 Lys Arg Thr Ala Leu Pro Ala Asp Trp Arg Lys Gly Leu 305 310 315 <210> 52 <211> 317 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 52 Met Ala Thr Ile Ser Ser Met Arg Val Gly Ala Ala Ser Arg Val Val 1 5 10 15 Val Ser Gly Arg Val Lys Thr Val Lys Val Ala Ala Arg Gly Ser Trp 20 25 30 Arg Glu Ser Ser Thr Ala Thr Val Gln Ala Ser Arg Ala Ser Ser Ala 35 40 45 Thr Asn Arg Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Ala 50 55 60 Ala Ala Ala Ala Ala Ala Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala 65 70 75 80 Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp 85 90 95 Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys 100 105 110 Lys Ala Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Ala Ala 115 120 125 Ala Ala Ala Ala Ala Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala 130 135 140 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 145 150 155 160 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ser Lys Lys Ala Val Thr 165 170 175 Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser 180 185 190 Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala 195 200 205 Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala 210 215 220 Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Thr Pro Ser Arg 225 230 235 240 Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser Leu Arg Ser 245 250 255 Asn Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser 260 265 270 Ser Ala Ser Trp Arg Asp Ala Pro Ala Ser Ser Ser Ser Ser Ser Ala 275 280 285 Asp Lys Ala Gly Thr Asn Pro Trp Thr Gly Lys Ser Lys Pro Glu Ile 290 295 300 Lys Arg Thr Ala Leu Pro Ala Asp Trp Arg Lys Gly Leu 305 310 315 <210> 53 <211> 317 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 53 Met Ala Thr Ile Ser Ser Met Arg Val Gly Ala Ala Ser Arg Val Val 1 5 10 15 Val Ser Gly Arg Val Lys Thr Val Lys Val Ala Ala Arg Gly Ser Trp 20 25 30 Arg Glu Ser Ser Thr Ala Thr Val Gln Ala Ser Arg Ala Ser Ser Ala 35 40 45 Thr Asn Arg Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Ala 50 55 60 Ala Ala Ala Ala Ala Ala Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala 65 70 75 80 Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp 85 90 95 Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys 100 105 110 Lys Ala Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Ala Ala 115 120 125 Ala Ala Ala Ala Ala Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala 130 135 140 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 145 150 155 160 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ser Lys Lys Ala Val Thr 165 170 175 Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Ala Ala Ala Ala Ala Ala 180 185 190 Ala Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala 195 200 205 Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala 210 215 220 Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Thr Pro Ser Arg 225 230 235 240 Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser Leu Arg Ser 245 250 255 Asn Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser 260 265 270 Ser Ala Ser Trp Arg Asp Ala Pro Ala Ser Ser Ser Ser Ser Ser Ala 275 280 285 Asp Lys Ala Gly Thr Asn Pro Trp Thr Gly Lys Ser Lys Pro Glu Ile 290 295 300 Lys Arg Thr Ala Leu Pro Ala Asp Trp Arg Lys Gly Leu 305 310 315 <210> 54 <211> 317 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 54 Met Ala Thr Ile Ser Ser Met Arg Val Gly Ala Ala Ser Arg Val Val 1 5 10 15 Val Ser Gly Arg Val Lys Thr Val Lys Val Ala Ala Arg Gly Ser Trp 20 25 30 Arg Glu Ser Ser Thr Ala Thr Val Gln Ala Ser Arg Ala Ser Ser Ala 35 40 45 Thr Asn Arg Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Ala 50 55 60 Ala Ala Ala Ala Ala Ala Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala 65 70 75 80 Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp 85 90 95 Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys 100 105 110 Lys Ala Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Ala Ala 115 120 125 Ala Ala Ala Ala Ala Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala 130 135 140 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 145 150 155 160 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ser Lys Lys Ala Val Thr 165 170 175 Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Ala Ala Ala Ala Ala Ala 180 185 190 Ala Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala 195 200 205 Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala 210 215 220 Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Thr Pro Ser Arg 225 230 235 240 Ser Ala Leu Pro Ser Asn Trp Ala Ala Ala Ala Ala Ala Ala Arg Ser 245 250 255 Asn Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser 260 265 270 Ser Ala Ser Trp Arg Asp Ala Pro Ala Ser Ser Ser Ser Ser Ser Ala 275 280 285 Asp Lys Ala Gly Thr Asn Pro Trp Thr Gly Lys Ser Lys Pro Glu Ile 290 295 300 Lys Arg Thr Ala Leu Pro Ala Asp Trp Arg Lys Gly Leu 305 310 315 <210> 55 <211> 317 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 55 Met Ala Thr Ile Ser Ser Met Arg Val Gly Ala Ala Ser Arg Val Val 1 5 10 15 Val Ser Gly Arg Val Lys Thr Val Lys Val Ala Ala Arg Gly Ser Trp 20 25 30 Arg Glu Ser Ser Thr Ala Thr Val Gln Ala Ser Arg Ala Ser Ser Ala 35 40 45 Thr Asn Arg Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg 50 55 60 Gln Glu Leu Glu Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala 65 70 75 80 Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp 85 90 95 Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys 100 105 110 Lys Ala Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln 115 120 125 Glu Leu Glu Ser Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala 130 135 140 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 145 150 155 160 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ser Lys Lys Ala Val Thr 165 170 175 Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Ala Ala Ala Ala Ala Ala 180 185 190 Ala Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala 195 200 205 Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala 210 215 220 Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Thr Pro Ser Arg 225 230 235 240 Ser Ala Leu Pro Ser Asn Trp Ala Ala Ala Ala Ala Ala Ala Arg Ser 245 250 255 Asn Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser 260 265 270 Ser Ala Ser Trp Arg Asp Ala Pro Ala Ser Ser Ser Ser Ser Ser Ala 275 280 285 Asp Lys Ala Gly Thr Asn Pro Trp Thr Gly Lys Ser Lys Pro Glu Ile 290 295 300 Lys Arg Thr Ala Leu Pro Ala Asp Trp Arg Lys Gly Leu 305 310 315 <210> 56 <211> 317 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 56 Met Ala Thr Ile Ser Ser Met Arg Val Gly Ala Ala Ser Arg Val Val 1 5 10 15 Val Ser Gly Arg Val Lys Thr Val Lys Val Ala Ala Arg Gly Ser Trp 20 25 30 Arg Glu Ser Ser Thr Ala Thr Val Gln Ala Ser Arg Ala Ser Ser Ala 35 40 45 Thr Asn Arg Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg 50 55 60 Gln Glu Leu Glu Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala 65 70 75 80 Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp 85 90 95 Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys 100 105 110 Lys Ala Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln 115 120 125 Glu Leu Glu Ser Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala 130 135 140 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 145 150 155 160 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ser Lys Lys Ala Val Thr 165 170 175 Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu Glu Ser 180 185 190 Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala 195 200 205 Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala 210 215 220 Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Thr Pro Ser Arg 225 230 235 240 Ser Ala Leu Pro Ser Asn Trp Ala Ala Ala Ala Ala Ala Ala Arg Ser 245 250 255 Asn Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser 260 265 270 Ser Ala Ser Trp Arg Asp Ala Pro Ala Ser Ser Ser Ser Ser Ser Ala 275 280 285 Asp Lys Ala Gly Thr Asn Pro Trp Thr Gly Lys Ser Lys Pro Glu Ile 290 295 300 Lys Arg Thr Ala Leu Pro Ala Asp Trp Arg Lys Gly Leu 305 310 315 <210> 57 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 57 Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu 1 5 10 15 Glu Ser Leu Arg Asn Asn Trp Arg Gln Glu Leu Glu Ser Leu Arg Asn 20 25 30 Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala Pro Ala Pro Ala Arg 35 40 45 Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala Pro 50 55 60 Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala 65 70 <210> 58 <211> 296 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 58 Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu 1 5 10 15 Glu Ser Leu Arg Asn Asn Trp Arg Gln Glu Leu Glu Ser Leu Arg Asn 20 25 30 Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala Pro Ala Pro Ala Arg 35 40 45 Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala Pro 50 55 60 Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Ser Pro Thr Arg Ser 65 70 75 80 Val Leu Pro Ala Asn Trp Arg Gln Glu Leu Glu Ser Leu Arg Asn Asn 85 90 95 Trp Arg Gln Glu Leu Glu Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser 100 105 110 Ala Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp 115 120 125 Arg Asp Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala 130 135 140 Ser Lys Lys Ala Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp 145 150 155 160 Arg Gln Glu Leu Glu Ser Leu Arg Asn Asn Trp Arg Gln Glu Leu Glu 165 170 175 Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala Pro 180 185 190 Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala 195 200 205 Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala Val Ser 210 215 220 Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu Glu Ser 225 230 235 240 Leu Arg Asn Asn Trp Arg Gln Glu Leu Glu Ser Leu Arg Asn Gly Asn 245 250 255 Gly Ser Ser Ser Ala Ala Ser Ser Ala Pro Ala Pro Ala Arg Ser Ser 260 265 270 Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser Ser Ala Pro Ala Arg 275 280 285 Ser Ser Ser Ala Ser Lys Lys Ala 290 295 <210> 59 <211> 63 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 59 Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu 1 5 10 15 Glu Ser Leu Arg Asn Gln Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala 20 25 30 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 35 40 45 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala 50 55 60 <210> 60 <211> 63 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 60 Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu 1 5 10 15 Glu Ser Arg Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala 20 25 30 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 35 40 45 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala 50 55 60 <210> 61 <211> 63 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 61 Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Trp Leu 1 5 10 15 Glu Ser Leu Arg Asn Gly Asn Gly Ser Ser Ser Ala Ala Ser Ser Ala 20 25 30 Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro 35 40 45 Ala Ser Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala 50 55 60 <210> 62 <211> 80 <212> PRT <213> Arabidopsis thaliana <400> 62 Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala 1 5 10 15 Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala 20 25 30 Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser 35 40 45 Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Gly Lys 50 55 60 Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser Glu 65 70 75 80 <210> 63 <211> 57 <212> PRT <213> Arabidopsis thaliana <400> 63 Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala 1 5 10 15 Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala 20 25 30 Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser 35 40 45 Asn Gly Gly Arg Val Asn Cys Gly Gly 50 55 <210> 64 <211> 55 <212> PRT <213> Arabidopsis thaliana <400> 64 Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala 1 5 10 15 Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala 20 25 30 Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser 35 40 45 Asn Gly Gly Arg Val Asn Cys 50 55 <210> 65 <211> 1745 <212> DNA <213> Chlamydomonas reinhardtii <400> 65 ggcaagcact cgcagccgct ccatctgtag cgtcgacctt tcagaaccac tccaaaacaa 60 tggccactat ctcgtcgatg cgcgttggcg ctgcttcccg cgtggtcgtc tctggccgcg 120 tgaagaccgt gaaggtcgcc gcccgcggca gctggcgcga gtcttccact gccaccgtgc 180 aggccagccg cgcctcgtcg gccaccaacc gcgtgagccc cacccgctcc gtcctgcccg 240 ccaactggcg ccaggagctg gagagcctgc gcaacggcaa cggctcctcc tcggctgcct 300 cgtcggcccc cgccccggcc cgctcctcgt cggccagctg gcgcgacgcc gccccggcct 360 cgtcggcccc tgcccgctcc agctctgcct ccaagaaggc cgtgaccccg tcgcgcagcg 420 ccctgccctc caactggaag caggagctgg agagcctgcg cagcagctcc cccgcccccg 480 cctcgtcggc ccccgccccg gcccgctcct cgtcggccag ctggcgtgat gccgccccgg 540 cctcgtcggc ccccgcccgc tccagctcct ccaagaaggc tgtgaccccg tcgcgcagcg 600 ccctgccctc caactggaag caggagctgg agagcctgcg cagcagctcc cccgcccccg 660 cctcgtcggc ccctgccccg gcccgctcct cgtcggccag ctggcgtgac gccgccccgg 720 cctcgtcggc ccctgcccgc tccagctctg cctccaagaa ggccgtgacc ccgtcgcgca 780 gcgccctgcc ctccaactgg aagcaggagc tggagagcct gcgcagcaac tcccctgccc 840 ccgcctcgtc ggcccctgcc ccggcccgct cctcgtcggc cagctggcgt gacgcccccg 900 cctcgagctc cagctcgagc gccgacaagg ccggcaccaa cccctggact ggcaagtcca 960 agcccgagat caagcgcacc gccctgcccg ctgactggcg caagggcctg taagcagctt 1020 gcctaaccag cagctggctt aaagcatgat gccttggtac gcgtgtgtta tgtacaacac 1080 taatgtacat cactagagcg cgttaactag cggcgtgggt tcatgttgga gagagaagag 1140 actgtgcagc aggagggtcg ggggaaccgc gggtacctgt gcggcatgtt agcgccgggt 1200 cttcagtttt tgttgcgttc cgtgggtgtt tgcgtggtgc atgccacaca gatgtgagtt 1260 cgtgagttct gatatgtctg gttgcaaacc tgaggtgcgg aggaacacat gcgttccata 1320 ctcgccctca aattttggtt gagacgtgag agggtgcctg cagagcgtgc gggtgcctaa 1380 tccggagcgg cgcagcagag ccctgccgcc gcgcacttca ttcagtggag tgactaactt 1440 gcacgactgc ttttgggagc gcgggcaagg agggcttaga gaggagagaa caagtagcac 1500 tgccgatagg tgatggatgt acacaagcat tagaggatgg atcaatcgaa cgatgcaaaa 1560 agaggtgctg cggctgtcaa ccggcacagc gctcgaaaac cctcgtgtgt aagcaacgag 1620 cgagactttc tgtggctctg gcagtgtctc atgcccatga tgcactgcgt ctgtatggct 1680 tgtcagcagg tgttggctcg atcttggtct cgatcaggtt atcagtccac tataaatttc 1740 tgcat 1745 <210> 66 <211> 2258 <212> DNA <213> Chlamydomonas reinhardtii <400> 66 ggcaagcact cgcagccgct ccatctgtag cgtcgacctt tcagaaccac tccaaaacaa 60 tggccactat ctcgtcgatg cgcgttggcg ctgcttcccg cgtggtcgtc tctggccgcg 120 tgaaggtgag gcacttgatc gcacttcttc ttcagtagtg tcaaggcggc aggttcatgg 180 cgcggcttga taggcgacca gagcgacttg caagcttggc ctcggcgcaa atgccgttac 240 acgaccgcgc ttgcttggct tcgcgcgccg agcagcgcag ctgcatggca atggttgtta 300 tgatcatagt ctccaccacg ccttgctctt cagcctttct gatgcgactg ttactgtcct 360 tcgcgcgccc ttgcagaccg tgaaggtcgc cgcccgcggc agctggcgcg agtcttccac 420 tgccaccgtg caggccaggt gagcacactt ctgcagctat gagatgcatc tgggtccagc 480 ttaaagcggc tcgcgttgtg tggcgcgccg cgatccctta tccgctcgcc tgccagccgg 540 gccttttcgc acttgtttcc taagtcaagt tcgaacctgc agctggctgt gcatatcttg 600 ctaagtgata gcgcggttgt acgcggtttg agtacgctgc tcaactggtg tactgacacg 660 tttgcttgcc gtttcccctg gtgccccttc gcccctgcag ccgcgcctcg tcggccacca 720 accgcgtgag ccccacccgc tccgtcctgc ccgccaactg gcgccaggag ctggagagcc 780 tgcgcaacgg caacggctcc tcctcggctg cctcgtcggc ccccgccccg gcccgctcct 840 cgtcggccag ctggcgcgac gccgccccgg cctcgtcggc ccctgcccgc tccagctctg 900 cctccaagaa ggccgtgacc ccgtcgcgca gcgccctgcc ctccaactgg aagcaggagc 960 tggagagcct gcgcagcagc tcccccgccc ccgcctcgtc ggcccccgcc ccggcccgct 1020 cctcgtcggc cagctggcgt gatgccgccc cggcctcgtc ggcccccgcc cgctccagct 1080 cctccaagaa ggctgtgacc ccgtcgcgca gcgccctgcc ctccaactgg aagcaggagc 1140 tggagagcct gcgcagcagc tcccccgccc ccgcctcgtc ggcccctgcc ccggcccgct 1200 cctcgtcggc cagctggcgt gacgccgccc cggcctcgtc ggcccctgcc cgctccagct 1260 ctgcctccaa gaaggccgtg accccgtcgc gcagcgccct gccctccaac tggaagcagg 1320 agctggagag cctgcgcagc aactcccctg cccccgcctc gtcggcccct gccccggccc 1380 gctcctcgtc ggccagctgg cgtgacgccc ccgcctcgag ctccagctcg agcgccgaca 1440 aggccggcac caacccctgg actggcaagt ccaagcccga gatcaagcgc accgccctgc 1500 ccgctgactg gcgcaagggc ctgtaagcag cttgcctaac cagcagctgg cttaaagcat 1560 gatgccttgg tacgcgtgtg ttatgtacaa cactaatgta catcactaga gcgcgttaac 1620 tagcggcgtg ggttcatgtt ggagagagaa gagactgtgc agcaggaggg tcgggggaac 1680 cgcgggtacc tgtgcggcat gttagcgccg ggtcttcagt ttttgttgcg ttccgtgggt 1740 gtttgcgtgg tgcatgccac acagatgtga gttcgtgagt tctgatatgt ctggttgcaa 1800 acctgaggtg cggaggaaca catgcgttcc atactcgccc tcaaattttg gttgagacgt 1860 gagagggtgc ctgcagagcg tgcgggtgcc taatccggag cggcgcagca gagccctgcc 1920 gccgcgcact tcattcagtg gagtgactaa cttgcacgac tgcttttggg agcgcgggca 1980 aggagggctt agagaggaga gaacaagtag cactgccgat aggtgatgga tgtacacaag 2040 cattagagga tggatcaatc gaacgatgca aaaagaggtg ctgcggctgt caaccggcac 2100 agcgctcgaa aaccctcgtg tgtaagcaac gagcgagact ttctgtggct ctggcagtgt 2160 ctcatgccca tgatgcactg cgtctgtatg gcttgtcagc aggtgttggc tcgatcttgg 2220 tctcgatcag gttatcagtc cactataaat ttctgcat 2258 <210> 67 <211> 9447 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 67 cacgaagtga tccgtttaaa ctatcagtgt ttgacaggat atattggcgg gtaaacctaa 60 gagaaaagag cgtttattag aataatcgga tatttaaaag ggcgtgaaaa ggtttatccg 120 ttcgtccatt tgtatgtgcc agccgccttt gcgacgctca ccgggctggt tgccctcgcc 180 gctgggctgg cggccgtcta tggccctgca aacgcgccag aaacgccgtc gaagccgtgt 240 gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg aaaacttggc cctcactgac 300 agatgagggg cggacgttga cacttgaggg gccgactcac ccggcgcggc gttgacagat 360 gaggggcagg ctcgatttcg gccggcgacg tggagctggc cagcctcgca aatcggcgaa 420 aacgcctgat tttacgcgag tttcccacag atgatgtgga caagcctggg gataagtgcc 480 ctgcggtatt gacacttgag gggcgcgact actgacagat gaggggcgcg atccttgaca 540 cttgaggggc agagtgctga cagatgaggg gcgcacctat tgacatttga ggggctgtcc 600 acaggcagaa aatccagcat ttgcaagggt ttccgcccgt ttttcggcca ccgctaacct 660 gtcttttaac ctgcttttaa accaatattt ataaaccttg tttttaacca gggctgcgcc 720 ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc cttctcgaac cctcccggcc 780 cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc tcggccgcga acggcctcac 840 cccaaaaatg gcagcgctgg ccaattcccg aggcacgaac ccagtggaca taagcctgtt 900 cggttcgtaa gctgtaatgc aagtagcgta tgcgctcacg caactggtcc agaaccttga 960 ccgaacgcag cggtggtaac ggcgcagtgg cggttttcat ggcttgttat gactgttttt 1020 ttggggtaca gtctatgcct cgggcatcca agcagcaagc gcgttacgcc gtgggtcgat 1080 gtttgatgtt atggagcagc aacgatgtta cgcagcaggg cagtcgccct aaaacaaagt 1140 taaacatcat gggggaagcg gtgatcgccg aagtatcgac tcaactatca gaggtagttg 1200 gcgtcatcga gcgccatctc gaaccgacgt tgctggccgt acatttgtac ggctccgcag 1260 tggatggcgg cctgaagcca cacagcgata ttgatttgct ggttacggtg accgtaaggc 1320 ttgatgaaac aacgcggcga gctttgatca acgacctttt ggaaacttcg gcttcccctg 1380 gagagagcga gattctccgc gctgtagaag tcaccattgt tgtgcacgac gacatcattc 1440 cgtggcgtta tccagctaag cgcgaactgc aatttggaga atggcagcgc aatgacattc 1500 ttgcaggtat cttcgagcca gccacgatcg acattgatct ggctatcttg ctgacaaaag 1560 caagagaaca tagcgttgcc ttggtaggtc cagcggcgga ggaactcttt gatccggttc 1620 ctgaacagga tctatttgag gcgctaaatg aaaccttaac gctatggaac tcgccgcccg 1680 actgggctgg cgatgagcga aatgtagtgc ttacgttgtc ccgcatttgg tacagcgcag 1740 taaccggcaa aatcgcgccg aaggatgtcg ctgccgactg ggcaatggag cgcctgccgg 1800 cccagtatca gcccgtcata cttgaagcta gacaggctta tcttggacaa gaagaagatc 1860 gcttggcctc gcgcgcagat cagttggaag aatttgtcca ttacgtgaaa ggcgagatca 1920 ccaaggtagt cggcaaataa tgtctagcta gaaattcgtt caagccgacg ccgcttcgcg 1980 gcgcggctta actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc 2040 aggtcaagtc tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag 2100 atatatcatg ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca 2160 tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc 2220 ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 2280 ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 2340 agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 2400 cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 2460 caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 2520 tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 2580 ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 2640 ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 2700 gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 2760 gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 2820 tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 2880 cgcggccttt ttacggttcc tggcagatcc tagatgtggc gcaacgatgc cggcgacaag 2940 caggagcgca ccgacttctt ccgcatcaag tgttttggct ctcaggccga ggcccacggc 3000 aagtatttgg gcaaggggtc gctggtattc gtgcagggca agattcggaa taccaagtac 3060 gagaaggacg gccagacggt ctacgggacc gacttcattg ccgataaggt ggattatctg 3120 gacaccaagg caccaggcgg gtcaaatcag gaataagggc acattgcccc ggcgtgagtc 3180 ggggcaatcc cgcaaggagg gtgaatgaat cggacgtttg accggaaggc atacaggcaa 3240 gaactgatcg acgcggggtt ttccgccgag gatgccgaaa ccatcgcaag ccgcaccgtc 3300 atgcgtgcgc cccgcgaaac cttccagtcc gtcggctcga tggtccagca agctacggcc 3360 aagatcgagc gcgacagcgt gcaactggct ccccctgccc tgcccgcgcc atcggccgcc 3420 gtggagcgtt cgcgtcgtct tgaacaggag gcggcaggtt tggcgaagtc gatgaccatc 3480 gacacgcgag gaactatgac gaccaagaag cgaaaaaccg ccggcgagga cctggcaaaa 3540 caggtcagcg aggccaagca ggccgcgttg ctgaaacaca cgaagcagca gatcaaggaa 3600 atgcagcttt ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac 3660 gacacggccc gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg 3720 caaaacaagg tcattttcca cgtcaacaag gacgtgaaga tcacctacac cggcgtcgag 3780 ctgcgggccg acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc 3840 cctatcggcg agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg 3900 atcaatggcc ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg 3960 atgggcttca cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc 4020 cgcgtcctgg accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc 4080 gtcgtgctgt ttgctggcga ccactacacg aaattcatat gggagaagta ccgcaagctg 4140 tcgccgacgg cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc 4200 aagctggaaa ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc 4260 gagcaggtcg gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg 4320 gtcaatgatg acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg 4380 ggttcagcag cccctgctcg gatctgttgg accggacagt agtcatggtt gatgggctgc 4440 ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg ctggctggtg 4500 gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac acattgcgga 4560 cgtttttaat gtactggggt tgaacactct gtgggtctca tgccgatgta tcacctctcg 4620 caagaattca agcttggagg tcaacatggt ggagcacgac actctggtct actccaaaaa 4680 tgtcaaagat acagtctcag aagatcaaag ggctattgag acttttcaac aaaggataat 4740 ttcgggaaac ctcctcggat tccattgccc agctatctgt cacttcatcg aaaggacagt 4800 agaaaaggaa ggtggctcct acaaatgcca tcattgcgat aaaggaaagg ctatcattca 4860 agatctctct gccgacagtg gtcccaaaga tggaccccca cccacgagga gcatcgtgga 4920 aaaagaagag gttccaacca cgtctacaaa gcaagtggat tgatgtgaca tctccactga 4980 cgtaagggat gacgcacaat cccactatcc ttcgcaagac ccttcctcta tataaggaag 5040 ttcatttcat ttggagagga cacgctcgag tataagagct catttttaca acaattacca 5100 acaacaacaa acaacaaaca acattacaat tacatttaca attatcgata caatggcttc 5160 ctctatgctc tcttccgcta ctatggttgc ctctccggct caggccacta tggtcgctcc 5220 tttcaacgga cttaagtcct ccgctgcctt cccagccacc cgcaaggcta acaacgacat 5280 tacttccatc acaagcaacg gcggaagagt taactgcatg caggtgtggc ctccgattgg 5340 aaagaagaag tttgagactc tctcttacct tcctgacctt accgattccg aaggtatggc 5400 tacgatcagt tctatgagag ttggagctgc gtctagggtc gttgtttcag gaagagttaa 5460 aaccgtgaag gtagcagcaa gaggatcttg gagagagtca tctactgcta cagttcaagc 5520 ctcaagagct agtagtgcaa cgaacagagt gagcccaaca agaagcgttc tcccagctaa 5580 ttggaggcaa gaacttgaat cactcagaaa tggtaacggc agctcgtcgg cggcgtcctc 5640 tgctcctgct cctgcgagat cgagcagcgc atcgtggcga gacgccgctc ctgcatcatc 5700 agcgcctgcc agaagtagct cagcttcaaa gaaggccgtt actccttcaa gaagtgcctt 5760 gccttcaaat tggaagcagg aattggagtc attgagaagc tccagccctg caccggcttc 5820 atcagcgcca gctccggcca gaagtagttc tgcctcatgg agggacgcag cgcctgcatc 5880 tagcgctcca gctaggagtt cttccagcaa gaaggccgtc actccgtctc gttcagctct 5940 gccttctaac tggaaacagg aacttgaatc ccttcgatca agcagtccag caccagcttc 6000 tagcgcgcca gcaccagcta ggtcatcctc agctagttgg agggatgcag ctcctgcttc 6060 ttccgcccca gctcgtagct catcggcgag caaaaaagca gtcaccccta gtagatcggc 6120 ccttccaagt aattggaaac aggagttgga gtcactccga tccaacagtc ccgcacctgc 6180 aagcagtgcc cctgcacctg ctagatcatc atccgcttcc tggagagacg ctcccgcttc 6240 gtcatctagt tcctccgctg acaaagccgg aactaatcct tggacaggta aaagcaagcc 6300 agaaattaag agaacggctc tccctgcaga ctggagaaag ggcctttgag cttgtcctgc 6360 tttaatgaga tatgcgagaa gcctatgatc gcatgatatt tgctttcaat tctgttgtgc 6420 acgttgtaaa aaacctgagc atgtgtagct cagatcctta ccgccggttt cggttcattc 6480 taatgaatat atcacccgtt actatcgtat ttttatgaat aatattctcc gttcaattta 6540 ctgattgtac cctactactt atatgtacaa tattaaaatg aaaacaatat attgtgctga 6600 ataggtttat agcgacatct atgatagagc gccacaataa caaacaattg cgttttatta 6660 ttacaaatcc aattttaaaa aaagcggcag aaccggtcaa acctaaaaga ctgattacat 6720 aaatcttatt caaatttcaa aagtgcccca ggggctagta tctacgacac accgagcggc 6780 gaactaataa cgctcactga agggaactcc ggttccccgc cggcgcgcat gggtgagatt 6840 ccttgaagtt gagtattggc cgtccgctct accgaaagtt acgggcacca ttcaacccgg 6900 tccagcacgg cggccgggta accgacttgc tgccccgaga attatgcagc atttttttgg 6960 tgtatgtggg ccccaaatga agtgcaggtc aaaccttgac agtgacgaca aatcgttggg 7020 cgggtccagg gcgaattttg cgacaacatg tcgaggctca gcaggaccgc tactagaatt 7080 cgagctcgga gttctagaat gtcgcggaac aaattttaaa actaaatcct aaatttttct 7140 aattttgttg ccaatagtgg atatgtgggc cgtatagaag gaatctattg aaggcccaaa 7200 cccatactga cgagcccaaa ggttcgtttt gcgttttatg tttcggttcg atgccaacgc 7260 cacattctga gctaggcaaa aaacaaacgt gtctttgaat agactcctct cgttaacaca 7320 tgcagcggct gcatggtgac gccattaaca cgtggcctac aattgcatga tgtctccatt 7380 gacacgtgac ttctcgtctc ctttcttaat atatctaaca aacactccta cctcttccaa 7440 aatatataca catctttttg atcaatctct cattcaaaat ctcattctct ctagtaaaca 7500 agaacaaaaa aatggcggat acagctagag gaacccatca cgatatcatc ggcagagatc 7560 agtacccgat gatgggccga gatcgtgacc agtaccagat gtccggacga ggatctgact 7620 actccaagtc taggcagatt gctaaagctg caactgctgt cacagctggt ggttccctcc 7680 ttgttctctc cagccttacc cttgttggaa ctgtcatagc tttgactgtt gcaacacctc 7740 tgctcgttat cttcagccca atccttgtcc cggctctcat cacagttgca ctcctcatca 7800 ccggttttct ttcctctgga gggtttggca ttgccgctat aaccgttttc tcttggattt 7860 acaagtaagc acacatttat catcttactt cataattttg tgcaatatgt gcatgcatgt 7920 gttgagccag tagctttgga tcaatttttt tggtcgaata acaaatgtaa caataagaaa 7980 ttgcaaattc tagggaacat ttggttaact aaatacgaaa tttgacctag ctagcttgaa 8040 tgtgtctgtg tatatcatct atataggtaa aatgcttggt atgataccta ttgattgtga 8100 ataggtacgc aacgggagag cacccacagg gatcagacaa gttggacagt gcaaggatga 8160 agttgggaag caaagctcag gatctgaaag acagagctca gtactacgga cagcaacata 8220 ctggtgggga acatgaccgt gaccgtactc gtggtggcca gcacactact atgagcgagc 8280 tgattaagga gaacatgcac atgaagctgt acatggaggg caccgtgaac aaccaccact 8340 tcaagtgcac atccgagggc gaaggcaagc cctacgaggg cacccagacc atgagaatca 8400 aggtggtcga gggcggccct ctccccttcg ccttcgacat cctggctacc agcttcatgt 8460 acggcagcag aaccttcatc aaccacaccc agggcatccc cgacttcttt aagcagtcct 8520 tccctgaggg cttcacatgg gagagagtca ccacatacga agatgggggc gtgctgaccg 8580 ctacccagga caccagcctc caggacggct gcctcatcta caacgtcaag atcagagggg 8640 tgaacttccc atccaacggc cctgtgatgc agaagaaaac actcggctgg gaggccaaca 8700 ccgagatgct gtaccccgct gacggcggcc tggaaggcag aagcgacatg gccctgaagc 8760 tcgtgggcgg gggccacctg atctgcaact tcaagaccac atacagatcc aagaaacccg 8820 ctaagaacct caagatgccc ggcgtctact atgtggacca cagactggaa agaatcaagg 8880 aggccgacaa agaaacctac gtcgagcagc acgaggtggc tgtggccaga tactgcgacc 8940 tccctagcaa actggggcac aagtgagctt accccactga tgtcatcgtc atagtccaat 9000 aactccaatg tcggggagtt agtttatgag gaataaagtg tttagaattt gatcaggggg 9060 agataataaa agccgagttt gaatcttttt gttataagta atgtttatgt gtgtttctat 9120 atgttgtcaa atggtaccat gttttttttc ctctcttttt gtaacttgca agtgttgtgt 9180 tgtactttat ttggcttctt tgtaagttgg taacggtggt ctatatatgg aaaaggtctt 9240 gttttgttaa acttatgtta gttaactgga ttcgtcttta accacaaaaa gttttcaata 9300 agctacaaat ttagacacgc aagccgatgc agtcattagt acatatattt attgcaagtg 9360 attacatggc aacccaaact tcaaaaacag taggttgctc catttagtcg ctttactgag 9420 accgaggatg cacatgtgac cgaggga 9447 <210> 68 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 68 Met Ala Thr Ile Ser Ser Met Arg Val Gly Ala Ala Ser Arg Val Val 1 5 10 15 Val Ser Gly Arg Val Lys Thr Val Lys Val Ala Ala Arg Gly Ser Trp 20 25 30 Arg Glu Ser Ser Thr Ala Thr Val Gln Ala Ser Arg Ala Ser Ser Ala 35 40 45 Thr Asn Arg 50 <210> 69 <211> 60 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 69 Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu 1 5 10 15 Glu Ser Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala 20 25 30 Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser 35 40 45 Ser Ala Pro Ala Arg Ser Ser Ser Ser Lys Lys Ala 50 55 60 <210> 70 <211> 61 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 70 Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu 1 5 10 15 Glu Ser Leu Arg Ser Ser Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala 20 25 30 Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Ala Pro Ala Ser 35 40 45 Ser Ala Pro Ala Arg Ser Ser Ser Ala Ser Lys Lys Ala 50 55 60 <210> 71 <211> 56 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 71 Val Thr Pro Ser Arg Ser Ala Leu Pro Ser Asn Trp Lys Gln Glu Leu 1 5 10 15 Glu Ser Leu Arg Ser Asn Ser Pro Ala Pro Ala Ser Ser Ala Pro Ala 20 25 30 Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Asp Ala Pro Ala Ser Ser 35 40 45 Ser Ser Ser Ser Ala Asp Lys Ala 50 55 <210> 72 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 72 ttttgaattc atggctacga tcagttctat gagagt 36 <210> 73 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 73 ataggatcct caaaggccct ttctccagtc tg 32 <210> 74 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 74 aaaagaattc gtgtggacac cggtgaacaa caag 34 <210> 75 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 75 atacccggga cgtttgttgg ctggttggaa atc 33 <210> 76 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 76 tatcccggga cgtttgttgg ctggttgc 28 <210> 77 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 77 aaacccgggc atgcaggtgt ggcctccg 28 <210> 78 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 78 aaaggatcct taaccggtga agcttggtgg c 31 <210> 79 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 79 atatgaattc atggttccac aaacagaaac taaagca 37 <210> 80 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 80 cccggatcct taaagtttgt caatagtatc aaattcga 38 <210> 81 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 81 tttggatcct ctgttcgttg cactactagc tctt 34 <210> 82 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 82 tttggatccg gccttctttg aagctgagct actt 34 <210> 83 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 83 aatggatccg gccttcttgc tggaagaact ccta 34 <210> 84 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 84 tttggatcct gcttttttgc tcgccgatga gctacg 36 <210> 85 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 85 ataggatccg gctttgtcag cggaggaact agatgac 37 <210> 86 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 86 ttttgaattc gtgagcccaa caagaagcgt tctc 34 <210> 87 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 87 ttttgaattc gttactcctt caagaagtgc cttgc 35 <210> 88 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 88 ttttgaattc gtcactccgt ctcgttcagc tc 32 <210> 89 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 89 ttttgaattc gtcaccccta gtagatcggc c 31 <210> 90 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 90 aaaagaattc ggaactaatc cttggacagg taaaagc 37 <210> 91 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 91 acgtaccggt ctccacatcc cgggggtgag cccaacaaga agcg 44 <210> 92 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 92 acgtaccggt ctccacaagg atccggcctt ctttgaagct gag 43 <210> 93 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 93 acgtaccggt ctcctgtaag cccaacaaga agcgttc 37 <210> 94 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 94 acgtaccggt ctcctacagc cttctttgaa gctgag 36 <210> 95 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 95 acgtaccggt ctccggttag cccaacaaga agcgttc 37 <210> 96 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 96 acgtaccggt ctccaaccgc cttctttgaa gctgag 36 <210> 97 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 97 acgtaccggt ctcccgtcag cccaacaaga agcgttc 37 <210> 98 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 98 acgtaccggt ctccgacggc cttctttgaa gctgag 36 <210> 99 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 99 acgtaccggt ctccacatcc cgggggtgag 30 <210> 100 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 100 gccacttggt ctcgacaagg atccggcctt c 31 <210> 101 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 101 ctctgtgaag acaggtctcg agtgagccca ac 32 <210> 102 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 102 cttcgtgaag ggtctcacac tgccttcttt g 31 <210> 103 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 103 ttgaatcact cagaaataat tggaggcaag aacttg 36 <210> 104 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 104 caagttcttg cctccaatta tttctgagtg attcaa 36 <210> 105 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 105 acgtaccggt ctcatcagaa cggcagctcg tcg 33 <210> 106 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 106 acgtaccggt ctctctgatt tctgagtgat tcaagttc 38 <210> 107 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 107 acgtaccggt ctccgtagaa atggtaacgg cagc 34 <210> 108 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 108 acgtaccggt ctccctacgt gattcaagtt cttg 34 <210> 109 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 109 acgtaccggt ctcatggctt gaatcactca gaaatg 36 <210> 110 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 110 acgtaccggt ctcagccatt gcctccaatt agctg 35 <210> 111 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 111 atacatatgc aagcagcatc aacagcggtt gc 32 <210> 112 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 112 atacccgggg ttttttggtg cttcaaatga cgggtg 36 <210> 113 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 113 tatcccgggt agtcaagctc tcactgttag ccaa 34 <210> 114 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 114 tatggatccg ttcatattag ctagctcggg aga 33 <210> 115 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 115 atttgaattc cgaagcgcag ttcttcagag ag 32 <210> 116 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 116 ttaggatcct cagagctcat actccacaag tcta 34 <210> 117 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 117 ttttgaattc ggtccggtcc atttgaacaa ttcg 34 <210> 118 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 118 tttcccgggg cactcgttgg tctcaggatt gtc 33 <210> 119 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 119 Arg Gln Glu Leu Glu Ser Leu 1 5 <210> 120 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 120 Lys Gln Glu Leu Glu Ser Leu 1 5 <210> 121 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 121 Ser Val Leu Pro Ala Asn Trp Arg Gln Glu Leu Glu Ser Leu Arg Asn 1 5 10 15 Asn Trp Arg Gln Glu Leu Glu Ser Leu Arg Asn Gly Asn Gly Ser Ser 20 25 30 <210> 122 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 122 Trp Arg Gln Glu Leu Glu Ser Leu Arg Asn Gln 1 5 10 <210> 123 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 123 Trp Arg Gln Glu Leu Glu Ser Arg Arg Asn Gly 1 5 10 <210> 124 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 124 Trp Arg Gln Trp Leu Glu Ser Leu Arg Asn Gly 1 5 10 <210> 125 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 125 tacggtcgaa gacgaaggta tggctacgat cagttctatg 40 <210> 126 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 126 tacggtcgaa gacgagatga ctctctccaa gatcctct 38 <210> 127 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 127 acgtaccgaa gaccacatct actgctacag ttcaagc 37 <210> 128 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 128 acgtaccgaa gaccatgacc tagctggtgc tggcg 35 <210> 129 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 129 acgtaccgaa gacaggtcat cctcagctag ttggag 36 <210> 130 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 130 acgtaccgaa gacagaagct caaaggccct ttctcca 37 <210> 131 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 131 tgcactcgaa gacagaatgg cttcctctat gctc 34 <210> 132 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 132 tgcactcgaa gacagacctt cggaatcggt aag 33 <210> 133 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 133 caactttgta caaaaaagca ggctccgaat tcgcccttat ggcttcctct atg 53 <210> 134 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 134 agcgtaatct ggaacatcgt atgggtacat accggtgaag cttggtggct tg 52 <210> 135 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 135 atcctcctca gaaatcaact tttgctccat accggtgaag cttggtggct tg 52 <210> 136 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 136 agcgtaatct ggaacatcgt atgggtacat aacactacgt ttgttggctg g 51 <210> 137 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 137 gatcctcctc agaaatcaac ttttgctcca taacactacg tttgttggct gg 52 <210> 138 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 138 agcgtaatct ggaacatcgt atgggtacat aaggcccttt ctccagtctg 50 <210> 139 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 139 aagatcctcc tcagaaatca acttttgctc cataaggccc tttctccagt ctg 53 <210> 140 <211> 180 <212> PRT <213> Nicotiana benthamiana <400> 140 Met Ala Ser Ser Val Leu Ser Ser Ala Ala Val Ala Thr Arg Ser Asn 1 5 10 15 Val Ala Gln Ala Asn Met Val Ala Pro Phe Thr Gly Leu Lys Ser Ala 20 25 30 Ala Ser Phe Pro Val Ser Arg Lys Gln Asn Leu Asp Ile Thr Ser Ile 35 40 45 Ala Ser Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp Pro Pro Ile 50 55 60 Asn Lys Lys Lys Tyr Glu Thr Leu Ser Tyr Leu Pro Asp Leu Ser Val 65 70 75 80 Glu Gln Leu Leu Ser Glu Ile Glu Tyr Leu Leu Lys Asn Gly Trp Val 85 90 95 Pro Cys Leu Glu Phe Glu Thr Glu His Gly Phe Val Tyr Arg Glu His 100 105 110 His Lys Ser Pro Gly Tyr Tyr Asp Gly Arg Tyr Trp Thr Met Trp Lys 115 120 125 Leu Pro Met Phe Gly Cys Thr Asp Ala Thr Gln Val Leu Ala Glu Val 130 135 140 Glu Glu Ala Lys Lys Ala Tyr Pro Gln Ala Trp Ile Arg Ile Ile Gly 145 150 155 160 Phe Asp Asn Val Arg Gln Val Gln Cys Ile Ser Phe Ile Ala Tyr Lys 165 170 175 Pro Glu Gly Tyr 180 <210> 141 <211> 180 <212> PRT <213> Nicotiana benthamiana <400> 141 Met Ala Ser Ser Val Leu Ser Ser Ala Ala Val Ala Thr Arg Ser Asn 1 5 10 15 Val Ala Gln Ala Asn Met Val Ala Pro Phe Thr Gly Leu Lys Ser Ala 20 25 30 Ala Ser Phe Pro Val Ser Arg Lys Gln Asn Leu Asp Ile Thr Ser Ile 35 40 45 Ala Ser Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp Pro Pro Ile 50 55 60 Asn Lys Lys Lys Tyr Glu Thr Leu Ser Tyr Leu Pro Asp Leu Ser Val 65 70 75 80 Glu Gln Leu Leu Ser Glu Ile Glu Tyr Leu Leu Lys Asn Gly Trp Val 85 90 95 Pro Cys Leu Glu Phe Glu Thr Glu Arg Gly Phe Val Tyr Arg Glu His 100 105 110 His Lys Ser Pro Gly Tyr Tyr Asp Gly Arg Tyr Trp Thr Met Trp Lys 115 120 125 Leu Pro Met Phe Gly Cys Thr Asp Ala Thr Gln Val Leu Ala Glu Val 130 135 140 Glu Glu Ala Lys Lys Ala Tyr Pro Gln Ala Trp Ile Arg Ile Ile Gly 145 150 155 160 Phe Asp Asn Val Arg Gln Val Gln Cys Ile Ser Phe Ile Ala Tyr Lys 165 170 175 Pro Glu Gly Tyr 180 <210> 142 <211> 180 <212> PRT <213> Vigna unguiculata <400> 142 Met Ala Ser Ser Met Ile Ser Ser Pro Ala Val Thr Thr Val Asn Arg 1 5 10 15 Ala Gly Ala Gly Ala Gly Met Val Ala Pro Phe Thr Gly Leu Lys Ser 20 25 30 Leu Gly Gly Phe Pro Thr Arg Lys Thr Asn Asn Asp Ile Thr Ser Val 35 40 45 Ala Asn Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp Pro Thr Thr 50 55 60 Gly Lys Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Glu 65 70 75 80 Glu Gln Leu Leu Lys Glu Ile Asp Tyr Leu Leu Arg Asn Gly Trp Ile 85 90 95 Pro Cys Leu Glu Phe Thr Leu Gln Asp Pro Phe Pro Tyr Arg Glu Gln 100 105 110 Asn Arg Ser Pro Gly Tyr Tyr Asp Gly Arg Tyr Trp Thr Met Trp Lys 115 120 125 Leu Pro Met Phe Gly Cys Thr Asp Ala Thr Gln Val Leu Gln Glu Val 130 135 140 Val Glu Ala Arg Thr Ala His Pro Asn Gly Phe Val Arg Ile Ile Gly 145 150 155 160 Phe Asp Asn Val Arg Gln Val Gln Cys Ile Ser Phe Ile Ala Tyr Lys 165 170 175 Ala Pro Gly Phe 180 <210> 143 <211> 169 <212> PRT <213> Vigna unguiculata <400> 143 Met Ser Ala Ala Thr Phe Ser Ala Gln Val Ala Gly Ala Gly Phe Val 1 5 10 15 Gly Leu Lys Ser Asn Ser Ser Ser Leu Cys Gln Ile Ser Gly Ser Ile 20 25 30 Thr Trp Lys Arg Lys Ile Ala Ser Asn Ser Ser Lys Thr Tyr Cys Met 35 40 45 Lys Thr Trp Asn Pro Ile Asn Asn Lys Lys Phe Glu Thr Leu Ser Tyr 50 55 60 Leu Pro Pro Leu Ser Asp Glu Ser Ile Ala Lys Glu Ile Asp Tyr Met 65 70 75 80 Ile Lys Lys Gly Trp Ile Pro Cys Leu Glu Phe Asp Glu Leu Gly Cys 85 90 95 Ile Arg Arg Glu Asn Ser His Met Pro Gly Tyr Tyr Asp Gly Arg Tyr 100 105 110 Trp Thr Leu Trp Lys Leu Pro Met Phe Gly Cys Ser Glu Ser Ser Gln 115 120 125 Val Leu Asn Glu Ile His Glu Cys Arg Lys Ala Tyr Pro Asn Ala Tyr 130 135 140 Ile Arg Cys Leu Ala Phe Asp Asn Lys Arg His Met Gln Ser Met Ala 145 150 155 160 Phe Ile Ile His Thr Pro Ser Thr Thr 165 <210> 144 <211> 173 <212> PRT <213> Vigna unguiculata <400> 144 Met Ser Ala Ala Thr Phe Ser Ala Gln Val Ala Gly Ala Gly Phe Val 1 5 10 15 Gly Leu Lys Ser Asn Ser Ser Ser Leu Cys Gln Ile Ser Gly Ser Ile 20 25 30 Thr Trp Lys Arg Lys Ile Ala Ser Asn Ser Ser Lys Thr Tyr Cys Met 35 40 45 Lys Asn Leu Phe Gln Thr Trp Asn Pro Ile Asn Asn Lys Lys Phe Glu 50 55 60 Thr Leu Ser Tyr Leu Pro Pro Leu Ser Asp Glu Ser Ile Ala Lys Glu 65 70 75 80 Ile Asp Tyr Met Ile Lys Lys Gly Trp Ile Pro Cys Leu Glu Phe Asp 85 90 95 Glu Leu Gly Cys Ile Arg Arg Glu Asn Ser His Met Pro Gly Tyr Tyr 100 105 110 Asp Gly Arg Tyr Trp Thr Leu Trp Lys Leu Pro Met Phe Gly Cys Ser 115 120 125 Glu Ser Ser Gln Val Leu Asn Glu Ile His Glu Cys Arg Lys Ala Tyr 130 135 140 Pro Asn Ala Tyr Ile Arg Cys Leu Ala Phe Asp Asn Lys Arg His Met 145 150 155 160 Gln Ser Met Ala Phe Ile Ile His Thr Pro Ser Thr Thr 165 170 <210> 145 <211> 178 <212> PRT <213> Glycine max <400> 145 Met Ala Ser Ser Met Ile Ser Ser Pro Ala Val Thr Thr Val Asn Arg 1 5 10 15 Ala Gly Ala Gly Met Val Ala Pro Phe Thr Gly Leu Lys Ser Met Ala 20 25 30 Gly Phe Pro Thr Arg Lys Thr Asn Asn Asp Ile Thr Ser Ile Ala Ser 35 40 45 Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp Pro Pro Val Gly Lys 50 55 60 Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Asp Asp Ala Gln 65 70 75 80 Leu Ala Lys Glu Val Glu Tyr Leu Leu Arg Lys Gly Trp Ile Pro Cys 85 90 95 Leu Glu Phe Glu Leu Glu His Gly Phe Val Tyr Arg Glu His Asn Arg 100 105 110 Ser Pro Gly Tyr Tyr Asp Gly Arg Tyr Trp Thr Met Trp Lys Leu Pro 115 120 125 Met Phe Gly Cys Thr Asp Ala Ser Gln Val Leu Lys Glu Leu Gln Glu 130 135 140 Ala Lys Thr Ala Tyr Pro Asn Gly Phe Ile Arg Ile Ile Gly Phe Asp 145 150 155 160 Asn Val Arg Gln Val Gln Cys Ile Ser Phe Ile Ala Tyr Lys Pro Pro 165 170 175 Gly Phe <210> 146 <211> 178 <212> PRT <213> Glycine max <400> 146 Met Ala Ser Ser Met Ile Ser Ser Pro Ala Val Thr Thr Val Asn Arg 1 5 10 15 Ala Gly Ala Gly Met Val Ala Pro Phe Thr Gly Leu Lys Ser Met Ala 20 25 30 Gly Leu Pro Thr Arg Lys Thr Asn Asn Asp Ile Thr Ser Ile Ala Ser 35 40 45 Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp Pro Pro Val Gly Lys 50 55 60 Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Asp Asp Ala Gln 65 70 75 80 Leu Ala Lys Glu Val Glu Tyr Leu Leu Arg Lys Gly Trp Ile Pro Cys 85 90 95 Leu Glu Phe Glu Leu Glu His Gly Phe Val Tyr Arg Glu His Asn Arg 100 105 110 Ser Leu Gly Tyr Tyr Asp Gly Arg Tyr Trp Thr Met Trp Lys Leu Pro 115 120 125 Met Phe Gly Cys Thr Asp Ala Ser Gln Val Leu Lys Glu Leu Gln Glu 130 135 140 Ala Lys Thr Ala Tyr Pro Asn Gly Phe Ile Arg Ile Ile Gly Phe Asp 145 150 155 160 Asn Val Arg Gln Val Gln Cys Ile Ser Phe Ile Ala Tyr Lys Pro Pro 165 170 175 Ser Phe <210> 147 <211> 172 <212> PRT <213> Glycine max <400> 147 Met Ser Ala Ala Thr Phe Ala Ala His Ile Ala Gly Ala Gly Phe Val 1 5 10 15 Gly Leu Lys Ser Asn Ser Ser Asn Leu Cys Pro Ser Thr Gly Ser Ile 20 25 30 Gly Trp Lys Arg Lys Ile Val Ser Asn Gly Ser Lys Thr Tyr Cys Met 35 40 45 Lys Thr Trp Asn Pro Ile Asn Asn Lys Lys Phe Glu Thr Leu Ser Tyr 50 55 60 Leu Pro Pro Leu Ser Asp Glu Ser Ile Ala Lys Glu Ile Asp Tyr Met 65 70 75 80 Leu Lys Lys Gly Trp Ile Pro Cys Leu Glu Phe Asp Glu Leu Gly Cys 85 90 95 Val Arg Arg Glu Asn Ser His Met Pro Gly Tyr Tyr Asp Gly Arg Tyr 100 105 110 Trp Thr Leu Trp Lys Leu Pro Met Phe Ala Cys Ser Asp Ser Ser Gln 115 120 125 Val Leu Lys Glu Ile His Glu Cys Arg Arg Val Tyr Pro Asn Ala Tyr 130 135 140 Ile Arg Cys Leu Ala Phe Asp Asn Gln Arg His Met Gln Ser Met Ala 145 150 155 160 Phe Ile Val His Lys Pro Asp Ile Thr Thr Thr Thr 165 170 <210> 148 <211> 171 <212> PRT <213> Manihot esculenta <400> 148 Met Ser Thr Ala Gly Ile Phe Thr Ala Pro Ile Ile Gly Ser Gly Tyr 1 5 10 15 Gln Gly Leu Lys Ala Lys Ser Thr Asn Glu Leu Phe Pro Ala Lys Asp 20 25 30 Ser Ile Ala Trp Ser Arg Lys Thr Ile Thr Asn Gly Ser Arg Ile His 35 40 45 Cys Met Lys Thr Trp Asn Pro Ile Asn Asn Lys Lys Phe Glu Thr Leu 50 55 60 Ser Tyr Leu Pro Pro Leu Ser Asp Glu Ser Ile Ala Lys Glu Ile Asp 65 70 75 80 Tyr Met Met Gln Lys Gly Trp Ile Pro Cys Leu Glu Phe Asp Gln Val 85 90 95 Gly His Val Arg Arg Glu Asn Ser Gln Thr Pro Gly Tyr Tyr Asp Gly 100 105 110 Arg Tyr Trp Thr Met Trp Lys Leu Pro Met Phe Gly Cys Asn Asp Ser 115 120 125 Ser Gln Val Leu Asn Glu Ile His Glu Cys Lys Gln Ala Tyr Pro Asn 130 135 140 Ala Tyr Ile Arg Cys Leu Ala Phe Asp Asn Lys His Gln Gly Gln Cys 145 150 155 160 Met Ala Phe Ile Ile Gln Lys Pro Asn Thr Pro 165 170 <210> 149 <211> 182 <212> PRT <213> Manihot esculenta <400> 149 Met Ala Ser Ser Met Leu Ser Thr Ala Thr Val Ala Ser Ile Asn Arg 1 5 10 15 Val Ser Pro Ala Gln Ala Thr Met Val Ala Pro Phe Thr Gly Leu Lys 20 25 30 Ser Thr Pro Val Phe Pro Thr Thr Arg Lys Thr Asn Ser Asp Ile Thr 35 40 45 Ser Ile Thr Ser Asn Gly Gly Lys Val Gln Cys Met Lys Val Trp Pro 50 55 60 Thr Leu Gly Met Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Pro Leu 65 70 75 80 Thr Arg Glu Gln Leu Ala Ser Glu Val Glu Tyr Leu Leu Arg Ser Gly 85 90 95 Trp Ile Pro Cys Leu Glu Phe Glu Leu Glu His Gly Leu Val Tyr Arg 100 105 110 Glu His Ala Arg Val Pro Gly Tyr Tyr Asp Gly Arg Tyr Trp Thr Met 115 120 125 Trp Lys Leu Pro Met Phe Gly Cys Thr Asp Ala Ala Gln Val Leu Lys 130 135 140 Glu Leu Asp Glu Leu Ile Lys His His Pro Asp Gly Tyr Ala Arg Ile 145 150 155 160 Ile Gly Phe Asp Asn Val Arg Gln Val Gln Cys Ile Ser Phe Leu Ala 165 170 175 Tyr Lys Pro Pro Gly Ala 180 <210> 150 <211> 184 <212> PRT <213> Manihot esculenta <400> 150 Met Ala Thr Ser Met Leu Ser Thr Ala Thr Val Ala Ser Ile Asn Arg 1 5 10 15 Ala Ser Pro Ala Gln Ala Ser Met Val Ala Pro Phe Thr Gly Leu Lys 20 25 30 Ser Thr Ser Ala Phe Pro Ala Thr Thr Lys Thr Ser Ala Asp Ile Thr 35 40 45 Ser Leu Ala Ser Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp Pro 50 55 60 Thr Arg Gly Lys Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Pro Leu 65 70 75 80 Ser Arg Glu Gln Leu Ala Ser Glu Ile Asp Tyr Leu Leu Arg Ser Gly 85 90 95 Trp Ile Pro Cys Leu Glu Phe Glu Leu Glu His Gly Phe Val Tyr Arg 100 105 110 Ala His Gly Ser Leu Pro Gly Tyr Tyr Asp Gly Arg Tyr Trp Thr Met 115 120 125 Trp Lys Leu Pro Met Phe Gly Cys Thr Asp Ser Ser Gln Val Leu Lys 130 135 140 Glu Leu Asp Glu Leu Ile Lys Ala His Pro Asp Gly Phe Ala Arg Ile 145 150 155 160 Ile Gly Phe Asp Asn Val Arg Gln Val Gln Cys Ile Ser Phe Ile Ala 165 170 175 Tyr Lys Pro Pro Gly Thr Asp Tyr 180 <210> 151 <211> 175 <212> PRT <213> Oryza sativa <400> 151 Met Ala Pro Thr Val Met Ala Ser Ser Ala Thr Ser Val Ala Pro Phe 1 5 10 15 Gln Gly Leu Lys Ser Thr Ala Gly Leu Pro Val Ser Arg Arg Ser Thr 20 25 30 Asn Ser Gly Phe Gly Asn Val Ser Asn Gly Gly Arg Ile Lys Cys Met 35 40 45 Gln Val Trp Pro Ile Glu Gly Ile Lys Lys Phe Glu Thr Leu Ser Tyr 50 55 60 Leu Pro Pro Leu Thr Val Glu Asp Leu Leu Lys Gln Ile Glu Tyr Leu 65 70 75 80 Leu Arg Ser Lys Trp Val Pro Cys Leu Glu Phe Ser Lys Val Gly Phe 85 90 95 Val Tyr Arg Glu Asn His Arg Ser Pro Gly Tyr Tyr Asp Gly Arg Tyr 100 105 110 Trp Thr Met Trp Lys Leu Pro Met Phe Gly Cys Thr Asp Ala Thr Gln 115 120 125 Val Leu Lys Glu Leu Glu Glu Ala Lys Lys Ala Tyr Pro Asp Ala Phe 130 135 140 Val Arg Ile Ile Gly Phe Asp Asn Val Arg Gln Val Gln Leu Ile Ser 145 150 155 160 Phe Ile Ala Tyr Lys Pro Pro Gly Cys Glu Glu Ser Gly Gly Asn 165 170 175 <210> 152 <211> 175 <212> PRT <213> Oryza sativa <400> 152 Met Ala Pro Ser Val Met Ala Ser Ser Ala Thr Ser Val Ala Pro Phe 1 5 10 15 Gln Gly Leu Lys Ser Thr Ala Gly Leu Pro Val Asn Arg Arg Ser Ser 20 25 30 Ser Ser Ser Phe Gly Asn Val Ser Asn Gly Gly Arg Ile Arg Cys Met 35 40 45 Gln Val Trp Pro Ile Glu Gly Ile Lys Lys Phe Glu Thr Leu Ser Tyr 50 55 60 Leu Pro Pro Leu Thr Val Glu Asp Leu Leu Lys Gln Ile Glu Tyr Leu 65 70 75 80 Leu Arg Ser Lys Trp Val Pro Cys Leu Glu Phe Ser Lys Val Gly Phe 85 90 95 Val Tyr Arg Glu Asn His Arg Ser Pro Gly Tyr Tyr Asp Gly Arg Tyr 100 105 110 Trp Thr Met Trp Lys Leu Pro Met Phe Gly Cys Thr Asp Ala Thr Gln 115 120 125 Val Leu Lys Glu Leu Glu Glu Ala Lys Lys Ala Tyr Pro Asp Ala Phe 130 135 140 Val Arg Ile Ile Gly Phe Asp Asn Val Arg Gln Val Gln Leu Ile Ser 145 150 155 160 Phe Ile Ala Tyr Lys Pro Pro Gly Cys Glu Glu Ser Gly Gly Asn 165 170 175 <210> 153 <211> 234 <212> PRT <213> Oryza sativa <400> 153 Met Pro Met Pro Leu Pro Ser Gln Val His Arg Cys His Leu Leu Pro 1 5 10 15 Ala Pro Pro His Ser Pro Ser Leu Val Thr Leu Leu Tyr Ser Pro Leu 20 25 30 Leu Asn Leu Phe Thr Pro Pro Pro Ala Thr Thr Thr Thr Leu Tyr Ser 35 40 45 Gly Asp Ile Met Phe Ile Asn Thr Ala Ser Phe Val Ala Gly Ala Val 50 55 60 Val Ala Ser Pro Glu Gln Pro Ala Lys Leu Val Arg Asp Gln Arg Arg 65 70 75 80 Val Val Pro Gly Ser Cys Arg Ala Arg Arg Gly Ala Ala Ser Asn Gly 85 90 95 Phe Arg Thr Tyr Cys Met Gln Thr Trp Asn Pro Phe Thr Asn Arg Arg 100 105 110 Tyr Glu Ala Met Ser Tyr Leu Pro Pro Leu Ser Ala Lys Ser Ile Ser 115 120 125 Lys Glu Ile Glu Phe Ile Met Ser Lys Gly Trp Val Pro Cys Leu Glu 130 135 140 Phe Asp Lys Glu Gly Glu Ile His Arg Ser Asn Ser Arg Met Pro Gly 145 150 155 160 Tyr Tyr Asp Gly Arg Tyr Trp Thr Leu Trp Lys Leu Pro Met Phe Gly 165 170 175 Cys Ser Asp Ala Ala Ala Val Leu Arg Glu Val Glu Glu Cys Arg Arg 180 185 190 Glu Tyr Pro Asp Ala Phe Ile Arg Leu Ile Ala Phe Asp Ser Ser Arg 195 200 205 Gln Cys Gln Cys Met Ser Phe Val Val His Lys Pro Pro Ser Ala Ala 210 215 220 Ala Ser Pro Ala Thr Val Ala Gly Ala Glu 225 230 <210> 154 <211> 175 <212> PRT <213> Triticum aestivum <400> 154 Met Ala Pro Ala Val Met Ala Ser Ser Ala Thr Ser Val Ala Pro Phe 1 5 10 15 Gln Gly Leu Lys Ser Thr Ala Gly Leu Pro Val Ser Arg Arg Ser Asn 20 25 30 Gly Ala Ser Leu Gly Ser Val Ser Asn Gly Gly Arg Ile Arg Arg Met 35 40 45 Gln Val Trp Pro Ile Glu Gly Ile Lys Lys Phe Glu Thr Leu Ser Tyr 50 55 60 Leu Pro Pro Leu Ser Thr Glu Ala Leu Leu Lys Gln Val Asp Tyr Leu 65 70 75 80 Ile Arg Ser Lys Trp Val Pro Cys Leu Glu Phe Ser Lys Val Gly Phe 85 90 95 Ile Phe Arg Glu His Asn Ala Ser Pro Gly Tyr Tyr Asp Gly Arg Tyr 100 105 110 Trp Thr Met Trp Lys Leu Pro Met Phe Gly Cys Thr Asp Ala Thr Gln 115 120 125 Val Ile Asn Glu Val Glu Glu Val Lys Lys Glu Tyr Pro Asp Ala Tyr 130 135 140 Val Arg Ile Ile Gly Phe Asp Asn Met Arg Gln Val Gln Cys Val Ser 145 150 155 160 Phe Ile Ala Phe Lys Pro Pro Gly Cys Glu Glu Ser Gly Lys Ala 165 170 175 <210> 155 <211> 175 <212> PRT <213> Triticum aestivum <400> 155 Met Ala Pro Ala Val Met Ala Ser Ser Ala Thr Ser Val Ala Pro Phe 1 5 10 15 Gln Gly Leu Lys Ser Thr Ala Gly Leu Pro Val Ser Arg Arg Ser Ser 20 25 30 Ser Ala Gly Leu Ser Ser Val Ser Asn Gly Gly Arg Ile Arg Cys Met 35 40 45 Gln Val Trp Pro Ile Glu Gly Ile Lys Lys Phe Glu Thr Leu Ser Tyr 50 55 60 Leu Pro Pro Leu Ser Thr Glu Ala Leu Leu Lys Gln Val Asp Tyr Leu 65 70 75 80 Ile Arg Ser Lys Trp Val Pro Cys Leu Glu Phe Ser Lys Val Gly Phe 85 90 95 Val Phe Arg Glu His Asn Ser Ser Pro Gly Tyr Tyr Asp Gly Arg Tyr 100 105 110 Trp Thr Met Trp Lys Leu Pro Met Phe Gly Cys Thr Asp Ala Thr Gln 115 120 125 Val Leu Asn Glu Val Glu Glu Val Lys Lys Glu Tyr Pro Asp Ala Tyr 130 135 140 Val Arg Val Ile Gly Phe Asp Asn Leu Arg Gln Val Gln Cys Val Ser 145 150 155 160 Phe Ile Ala Phe Arg Pro Pro Gly Cys Glu Glu Ser Gly Lys Ala 165 170 175 <210> 156 <211> 174 <212> PRT <213> Triticum aestivum <400> 156 Met Ala Pro Ala Val Met Ala Ser Ser Ala Thr Thr Val Ala Pro Phe 1 5 10 15 Gln Gly Leu Lys Ser Thr Ala Gly Leu Pro Val Ser Arg Arg Ser Ser 20 25 30 Gly Ser Leu Gly Arg Val Ser Asn Gly Gly Arg Ile Arg Cys Met Gln 35 40 45 Val Trp Pro Ile Glu Gly Ile Lys Lys Phe Glu Thr Leu Ser Tyr Leu 50 55 60 Pro Pro Leu Ser Thr Glu Ala Leu Leu Lys Gln Val Asp Tyr Leu Ile 65 70 75 80 Arg Ser Lys Trp Val Pro Cys Leu Glu Phe Ser Lys Val Gly Phe Val 85 90 95 Phe Arg Glu His Asn Ser Ser Ser Gly Tyr Tyr Asp Gly Arg Tyr Trp 100 105 110 Thr Met Trp Lys Leu Pro Met Phe Gly Cys Thr Asp Ala Thr Gln Val 115 120 125 Leu Asn Glu Val Glu Glu Val Lys Lys Glu Tyr Pro Asp Ala Tyr Val 130 135 140 Arg Val Ile Gly Phe Asp Asn Leu Arg Gln Val Gln Cys Val Ser Phe 145 150 155 160 Ile Ala Phe Arg Pro Pro Gly Cys Glu Glu Ser Gly Lys Ala 165 170 <210> 157 <211> 211 <212> PRT <213> Volvox carteri f. nagariensis <400> 157 Met Ala Ala Met Val Met Lys Ser Ser Val Ala Thr Ala Val Val Arg 1 5 10 15 Pro Ala Arg Ser Ser Val Arg Pro Cys Ala Val Leu Lys Pro Ala Val 20 25 30 Lys Ala Ala Thr Val Thr Ala Pro Ala Gln Ala Asn Lys Met Met Val 35 40 45 Trp Thr Pro Val Asn Asn Lys Ala Ser Met Tyr His Thr Asp Leu Leu 50 55 60 His Leu Pro Cys Tyr Asn Thr Lys Asn Pro Cys Phe Phe Gln Ser Gly 65 70 75 80 Arg Gly Phe Arg Asn Pro His Gly Ile Arg Phe Leu Thr Ala Arg Trp 85 90 95 Leu Arg Trp Phe Ala Ala Cys Lys Arg Pro Pro Gly Trp Ile Pro Cys 100 105 110 Leu Glu Phe Ala Glu Ala Asp Lys Ala Tyr Val Ser Asn Glu Ser Thr 115 120 125 Val Arg Phe Gly Pro Val Ser Cys Leu Tyr Tyr Asp Asn Arg Tyr Trp 130 135 140 Thr Met Trp Lys Leu Pro Met Phe Gly Cys Arg Asp Pro Met Gln Val 145 150 155 160 Leu Arg Glu Ile Val Ala Cys Thr Lys Ala Phe Pro Asp Ala Tyr Val 165 170 175 Arg Leu Val Ala Phe Asp Asn Val Lys Gln Val Gln Ile Met Gly Phe 180 185 190 Leu Val Gln Arg Pro Lys Ser Ala Arg Asp Trp Gln Pro Ala Asn Lys 195 200 205 Arg Ser Val 210 <210> 158 <211> 185 <212> PRT <213> Volvox carteri f. nagariensis <400> 158 Met Ala Ala Val Ile Ala Lys Ser Ser Val Ala Thr Ala Val Ala Arg 1 5 10 15 Pro Ala Arg Ser Gly Val Arg Pro Val Ala Val Leu Lys Pro Ser Val 20 25 30 Arg Ala Thr Pro Val Ala Thr Pro Thr Gln Ala Asn Lys Met Met Val 35 40 45 Trp Thr Pro Val Asn Asn Lys Met Phe Glu Thr Phe Ser Tyr Leu Pro 50 55 60 Pro Leu Ser Asp Glu Gln Ile Ala Ala Gln Val Asp Tyr Ile Val Ala 65 70 75 80 Asn Gly Trp Ile Pro Cys Leu Glu Phe Ala Glu Ala Asp Lys Ala Tyr 85 90 95 Val Ser Asn Glu Ser Thr Val Arg Phe Gly Pro Val Ser Cys Leu Tyr 100 105 110 Tyr Asp Asn Arg Tyr Trp Thr Met Trp Lys Leu Pro Met Phe Gly Cys 115 120 125 Arg Asp Pro Met Gln Val Leu Arg Glu Ile Val Ala Cys Thr Lys Ala 130 135 140 Phe Pro Asp Ala Tyr Val Arg Leu Val Ala Phe Asp Asn Val Lys Gln 145 150 155 160 Val Gln Ile Met Gly Phe Leu Val Gln Arg Pro Lys Ser Ala Arg Asp 165 170 175 Trp Gln Pro Ala Asn Lys Arg Ser Val 180 185 <210> 159 <211> 284 <212> PRT <213> Volvox carteri f. nagariensis <400> 159 Met Gln Leu Gly Gly Trp Gly Glu Phe Arg Arg Val Leu Asp Gly Ala 1 5 10 15 Ser Leu Arg Val Pro Val Ser Leu Ile Leu His Gly Pro Leu Arg Cys 20 25 30 Arg Phe Asp Leu Glu Gln Glu Gly Phe Arg Val Arg Asp Glu Thr Leu 35 40 45 Ala Lys Ala Leu Glu Lys Leu Gly Arg Ala Pro Tyr His Gly Gln Glu 50 55 60 Thr Pro Pro Tyr Val Asp Ala Ala Val Trp Arg Trp Ser Cys Leu Trp 65 70 75 80 Ile Ala Val Lys Val Ile Thr Leu Asp Ser Leu Val Arg Ile Ser Tyr 85 90 95 Phe Leu Arg Val Pro Gly Val Tyr Val Val Leu Gly Leu Thr Thr Gln 100 105 110 Thr Ala Asn Gly Ser Ser Arg Ser Val Arg Pro Cys Ala Val Leu Lys 115 120 125 Pro Ala Val Lys Ala Ala Thr Val Ala Ala Pro Ala Gln Ala Asn Lys 130 135 140 Met Met Val Trp Thr Pro Val Asn Asn Lys Met Phe Glu Thr Phe Ser 145 150 155 160 Tyr Leu Pro Pro Leu Thr Asp Glu Gln Ile Ala Ala Gln Val Asp Tyr 165 170 175 Ile Val Ala Asn Gly Trp Ile Pro Cys Leu Glu Phe Ala Glu Ala Asp 180 185 190 Lys Ala Tyr Val Ser Asn Glu Ser Thr Val Arg Phe Gly Pro Val Ser 195 200 205 Cys Leu Tyr Tyr Asp Asn Arg Tyr Trp Thr Met Trp Lys Leu Pro Met 210 215 220 Phe Gly Cys Arg Asp Pro Met Gln Val Leu Arg Glu Ile Val Ala Cys 225 230 235 240 Thr Lys Ala Phe Pro Asp Ala Tyr Val Arg Leu Val Ala Phe Asp Asn 245 250 255 Val Lys Gln Val Gln Ile Met Gly Phe Leu Val Gln Arg Pro Lys Ser 260 265 270 Ala Arg Asp Trp Gln Pro Ala Asn Lys Arg Ser Val 275 280 <210> 160 <211> 186 <212> PRT <213> Volvox carteri f. nagariensis <400> 160 Met Ala Ala Ile Val Ala Lys Ser Ser Val Ala Ser Ala Val Ala Arg 1 5 10 15 Pro Ser Arg Asn Ser Val Gln Arg Ser Val Ala Ala Leu Lys Pro Ala 20 25 30 Val Lys Ala Ala Pro Val Thr Ala Pro Ala Gln Ala Asn Lys Met Met 35 40 45 Val Trp Thr Pro Val Asn Asn Lys Met Phe Glu Thr Phe Ser Tyr Leu 50 55 60 Pro Pro Leu Thr Asp Glu Gln Ile Ala Ala Gln Val Asp Tyr Ile Val 65 70 75 80 Ala Asn Gly Trp Ile Pro Cys Leu Glu Phe Ala Glu Ala Asp Lys Ala 85 90 95 Tyr Val Ser Asn Glu Ser Thr Val Arg Phe Gly Pro Val Ser Cys Leu 100 105 110 Tyr Tyr Asp Asn Arg Tyr Trp Thr Met Trp Lys Leu Pro Met Phe Gly 115 120 125 Cys Arg Asp Pro Met Gln Val Leu Arg Glu Ile Val Ala Cys Thr Lys 130 135 140 Ala Phe Pro Asp Ala Tyr Val Arg Leu Val Ala Phe Asp Asn Val Lys 145 150 155 160 Gln Val Gln Ile Met Gly Phe Leu Val Gln Arg Pro Lys Ser Ala Arg 165 170 175 Asp Trp Gln Pro Ala Asn Lys Arg Ser Val 180 185 <210> 161 <211> 185 <212> PRT <213> Volvox carteri f. nagariensis <400> 161 Met Ala Ala Leu Leu Ala Lys Ser Ser Val Ala Ala Ala Val Ala Arg 1 5 10 15 Pro Gln Arg Ser Ser Val Arg Pro Cys Ala Ala Leu Lys Pro Ala Val 20 25 30 Lys Ala Ala Pro Val Ala Thr Pro Ala Gln Ala Asn Lys Met Met Val 35 40 45 Trp Thr Pro Val Asn Asn Lys Met Phe Glu Thr Phe Ser Tyr Leu Pro 50 55 60 Pro Leu Thr Asp Glu Gln Ile Ala Ala Gln Val Asp Tyr Ile Val Ala 65 70 75 80 Asn Gly Trp Ile Pro Cys Leu Glu Phe Ala Glu Ala Asp Lys Ala Tyr 85 90 95 Val Ser Asn Glu Ser Thr Val Arg Phe Gly Pro Val Ser Cys Leu Tyr 100 105 110 Tyr Asp Asn Arg Tyr Trp Thr Met Trp Lys Leu Pro Met Phe Gly Cys 115 120 125 Arg Asp Pro Met Gln Val Leu Arg Glu Ile Val Ala Cys Thr Lys Ala 130 135 140 Phe Pro Asp Ala Tyr Val Arg Leu Val Ala Phe Asp Asn Val Lys Gln 145 150 155 160 Val Gln Ile Met Gly Phe Leu Val Gln Arg Pro Lys Ser Ala Arg Asp 165 170 175 Trp Gln Pro Ala Asn Lys Arg Ser Val 180 185 <210> 162 <211> 185 <212> PRT <213> Volvox carteri f. nagariensis <400> 162 Met Ala Ala Ile Val Ala Lys Ser Ser Val Ala Ala Val Val Ala Arg 1 5 10 15 Pro Ala Arg Ser Ser Val Arg Pro Val Ala Gly Leu Lys Pro Ala Val 20 25 30 Lys Ala Ala Pro Val Ala Ala Pro Ala Gln Ala Asn Lys Met Met Val 35 40 45 Trp Thr Pro Val Asn Asn Lys Met Phe Glu Thr Phe Ser Tyr Leu Pro 50 55 60 Pro Leu Thr Asp Glu Gln Ile Ala Ala Gln Val Asp Tyr Ile Val Ala 65 70 75 80 Asn Gly Trp Ile Pro Cys Leu Glu Phe Ala Glu Ala Asp Lys Ala Tyr 85 90 95 Val Ser Asn Glu Ser Thr Val Arg Phe Gly Pro Val Ser Cys Leu Tyr 100 105 110 Tyr Asp Asn Arg Tyr Trp Thr Met Trp Lys Leu Pro Met Phe Gly Cys 115 120 125 Arg Asp Pro Met Gln Val Leu Arg Glu Ile Val Ala Cys Thr Lys Ala 130 135 140 Phe Pro Asp Ala Tyr Val Arg Leu Val Ala Phe Asp Asn Val Lys Gln 145 150 155 160 Val Gln Ile Met Gly Phe Leu Val Gln Arg Pro Lys Ser Ala Arg Asp 165 170 175 Trp Gln Pro Ala Asn Lys Arg Ser Val 180 185 <210> 163 <211> 185 <212> PRT <213> Volvox carteri f. nagariensis <400> 163 Met Ala Ala Ile Val Ala Lys Ser Ser Val Ala Thr Ala Val Val Arg 1 5 10 15 Pro Ala Arg Ser Ser Val Arg Pro Val Ala Val Leu Lys Pro Ala Ile 20 25 30 Lys Ala Ala Pro Val Ala Ser Pro Ala Gln Ala Asn Lys Met Met Val 35 40 45 Trp Thr Pro Val Asn Asn Lys Met Phe Glu Thr Phe Ser Tyr Leu Pro 50 55 60 Pro Leu Thr Asp Glu Gln Ile Ala Ala Gln Val Asp Tyr Ile Val Ala 65 70 75 80 Asn Gly Trp Ile Pro Cys Leu Glu Phe Ala Glu Ala Asp Lys Ala Tyr 85 90 95 Val Ser Asn Glu Ser Thr Val Arg Phe Gly Pro Val Ser Cys Leu Tyr 100 105 110 Tyr Asp Asn Arg Tyr Trp Thr Met Trp Lys Leu Pro Met Phe Gly Cys 115 120 125 Arg Asp Pro Met Gln Val Leu Arg Glu Ile Val Ala Cys Thr Lys Ala 130 135 140 Phe Pro Asp Ala Tyr Val Arg Leu Val Ala Phe Asp Asn Val Lys Gln 145 150 155 160 Val Gln Ile Met Gly Phe Leu Val Gln Arg Pro Lys Ser Ala Arg Asp 165 170 175 Trp Gln Pro Ala Asn Lys Arg Ser Val 180 185 <210> 164 <211> 185 <212> PRT <213> Gonium pectorale <400> 164 Met Ala Ala Met Ile Ala Lys Ser Ser Val Ser Ala Ala Val Ala Arg 1 5 10 15 Pro Ala Arg Ser Ser Ala Arg Val Ser Ala Val Leu Lys Pro Ala Val 20 25 30 Lys Ala Ala Pro Val Ala Ala Pro Ser Ser Ala Asn Lys Met Met Val 35 40 45 Trp Thr Pro Val Asn Asn Lys Met Phe Glu Thr Phe Ser Tyr Leu Pro 50 55 60 Pro Leu Ser Asp Glu Gln Ile Ala Ala Gln Val Asp Tyr Ile Val Ala 65 70 75 80 Asn Gly Trp Ile Pro Cys Leu Glu Phe Ala Glu Ala Asp Lys Ala Tyr 85 90 95 Val Ser Asn Glu Ser Thr Val Arg Phe Gly Pro Val Ser Val Leu Tyr 100 105 110 Tyr Asp Asn Arg Tyr Trp Thr Met Trp Lys Leu Pro Met Phe Gly Cys 115 120 125 Arg Asp Pro Met Gln Val Leu Arg Glu Ile Val Ala Cys Thr Lys Ala 130 135 140 Phe Pro Asp Ala Tyr Val Arg Leu Val Ala Phe Asp Asn Val Lys Gln 145 150 155 160 Val Gln Ile Met Gly Phe Leu Val Gln Arg Pro Lys Ser Ala Arg Asp 165 170 175 Trp Gln Pro Ala Asn Lys Arg Ser Val 180 185 <210> 165 <211> 200 <212> PRT <213> Tetrabaena socialis <400> 165 Met Ala Thr Leu Ser Ser Met Arg Ile Gly Ala Ala Pro Arg Val Ala 1 5 10 15 Val Ala Arg Thr Gln Arg Ala Ser Thr Val Lys Val Val Ala Lys Gly 20 25 30 Ser Trp Arg Asp Ala Pro Thr Val Thr Ala Gln Pro Gly Arg Ala Ala 35 40 45 Ser Ser Ala Lys Pro Thr Ser Pro Thr Arg Ser Val Leu Pro Ala Asn 50 55 60 Trp Arg Gln Glu Leu Glu Ser Leu Arg Gly Gly Asn Gly Asn Gly Ala 65 70 75 80 Ala Ala Ala Pro Ala Ala Ala Ala Pro Arg Ala Gln Ser Ala Gly Trp 85 90 95 Arg Asp Ala Pro Ala Ser Ala Pro Ala Ala Ser Ala Pro Met Lys Lys 100 105 110 Thr Ala Thr Pro Ala Arg Thr Ala Leu Pro Ala Asn Trp Lys Gln Glu 115 120 125 Leu Glu Ser Leu Arg Ser Ser Ser Thr Gly Gly Ala Ser Ala Ala Pro 130 135 140 Ala Ala Ala Pro Ala Arg Ala Ser Ser Ala Ser Trp Arg Asp Ala Pro 145 150 155 160 Ala Ala Ala Pro Ala Ser Lys Ser Ser Ser Pro Ala Pro Ala Gly Thr 165 170 175 Asn Pro Trp Thr Gly Lys Ser Lys Ile Glu Ile Lys Arg Thr Ala Leu 180 185 190 Pro Ala Asp Trp Arg Lys Gly Leu 195 200 <210> 166 <211> 298 <212> PRT <213> Volvox carteri f. nagariensis <400> 166 Met Ala Met Ser Thr Met Arg Val Gly Ala Ala Pro Arg Val Ala Val 1 5 10 15 Ala Arg Ser Gln Ser Val Lys Val Val Ala Arg Gly Ser Trp Arg Glu 20 25 30 Ser Ala Thr Val Thr Ala Gln Pro Ala Gly Arg Ala Ser Ser Ser Asn 35 40 45 Arg Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln Glu 50 55 60 Leu Glu Ser Leu Arg Asn Gly Asn Gly Asn Gly Ala Ala Ala Ala Pro 65 70 75 80 Ala Pro Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Ser 85 90 95 Glu Ser Ser Ala Ala Pro Ala Ala Ala Ser Thr Pro Ser Arg Ser Thr 100 105 110 Lys Lys Pro Val Thr Pro Thr Arg Thr Ser Leu Pro Ala Asn Trp Lys 115 120 125 Gln Glu Leu Glu Ser Leu Arg Gly Ser Ser Ser Ser Ser Pro Ala Ala 130 135 140 Ala Ala Pro Ala Pro Ala Arg Ser Ser Ser Ser Pro Lys Lys Ala Val 145 150 155 160 Thr Pro Thr Arg Ser Ser Leu Pro Ala Asn Trp Lys Gln Glu Leu Glu 165 170 175 Ser Leu Arg Gly Gly Ser Ser Ser Ala Ala Ser Ala Pro Ala Ala Ala 180 185 190 Ala Ala Pro Ala Ala Ala Ser Ala Pro Ser Arg Ser Pro Lys Lys Ala 195 200 205 Val Thr Pro Thr Arg Ser Ser Leu Pro Ala Asn Trp Lys Gln Glu Leu 210 215 220 Glu Ser Leu Arg Gly Gly Ser Ser Ser Ser Ser Ser Ala Pro Ala Pro 225 230 235 240 Ala Ala Ala Pro Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Thr 245 250 255 Glu Ser Pro Ala Pro Ala Asn Glu Ser Ser Ser Ala Ala Ala Lys Ala 260 265 270 Gly Thr Asn Pro Trp Thr Gly Lys Ala Lys Ile Glu Ile Lys Arg Thr 275 280 285 Thr Leu Pro Ala Asp Trp Arg Arg Gln Leu 290 295 <210> 167 <211> 245 <212> PRT <213> Gonium pectorale <400> 167 Met Ala Leu Ser Ala Met Arg Val Gly Ala Ala Pro Arg Ala Ala Val 1 5 10 15 Ser Arg Pro Gln Thr Val Gln Val Val Ala Arg Gly Ser Trp Arg Glu 20 25 30 Ser Ser Thr Val Thr Ala Thr Pro Ala Gly Arg Ser Ser Ser Ala Ala 35 40 45 Asn Arg Val Ser Pro Thr Arg Ser Val Leu Pro Ala Asn Trp Arg Gln 50 55 60 Glu Leu Glu Ser Leu Arg Asn Gly Asn Gly Asn Gly Ser Ser Ala Ala 65 70 75 80 Ala Ala Pro Ala Pro Ala Pro Ala Arg Ser Ala Ser Ala Ser Trp Arg 85 90 95 Asp Ala Pro Ala Ala Ala Ala Pro Ala Arg Pro Ser Ser Ser Pro Lys 100 105 110 Lys Ala Val Thr Pro Ser Arg Ser Ser Leu Pro Ala Asn Trp Lys Gln 115 120 125 Glu Leu Glu Ala Leu Arg Gly Gly Ser Ser Ser Ser Ser Ala Ser Trp 130 135 140 Arg Thr Glu Ser Ala Pro Ala Ala Ala Pro Ala Arg Ser Gly Ser Lys 145 150 155 160 Lys Ala Val Thr Pro Ser Arg Ser Ser Leu Pro Ala Asn Trp Lys Gln 165 170 175 Glu Leu Glu Ser Met Arg Ser Ala Ser Pro Ala Pro Ser Ser Ala Pro 180 185 190 Ala Ala Pro Ala Arg Ser Ser Ser Ala Ser Trp Arg Ser Glu Ser Gly 195 200 205 Ser Ser Ser Ser Ser Ala Ala Ala Asp Lys Ala Gly Thr Asn Pro Trp 210 215 220 Thr Gly Lys Ala Lys Val Glu Ile Lys Arg Thr Ala Leu Pro Ala Asp 225 230 235 240 Trp Arg Lys Gly Leu 245 <210> 168 <211> 13441 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 168 gaacactctg tgccgaattc ggatccagcg gtcctgctga gcctcgacat gttgtcgcaa 60 aattcgccct ggacccgccc aacgatttgt cgtcactgtc aaggtttgac ctgcacttca 120 tttggggccc acatacacca aaaaaatgct gcataattct cggggcagca agtcggttac 180 ccggccgccg tgctggaccg ggttgaatgg tgcccgtaac tttcggtaga gcggacggcc 240 aatactcaac ttcaaggaat ctcacccatg cgcgccggcg gggaaccgga gttcccttca 300 gtgagcgtta ttagttcgcc gctcggtgtg tcgtagatac tagcccctgg ggcacttttg 360 aaatttgaat aagatttatg taatcagtct tttaggtttg accggttctg ccgctttttt 420 taaaattgga tttgtaataa taaaacgcaa ttgtttgtta ttgtggcgct ctatcataga 480 tgtcgctata aacctattca gcacaatata ttgttttcat tttaatattg tacatataag 540 tagtagggta caatcagtaa attgaacgga gaatattatt cataaaaata cgatagtaac 600 gggtgatata ttcattagaa tgaaccgaaa ccggcggtaa ggatctgagc tacacatgct 660 caggtttttt acaacgtgca caacagaatt gaaagcaaat atcatgcgat cataggcttc 720 tcgcatatct cattaaagca ggacaagctt atcattcctc accagcatca gcatcagggg 780 tcttgaaagc atgttggtac tcaacgattc caagctcggt gttagagtga tcttcctcaa 840 ctcttctgaa agcgaacata ggtccaccgt tttgaaggat agaagggtgg atagcagact 900 tgaagtgcat gtgagaatcc accacagaag agtagtaacc accatctcta agtgagaagg 960 ttctggtgaa agatccatcg agatcgttat ctcccatagg atgaagatgc tcaacagtag 1020 cgttagacct gatgatcttg tcggtgaaga taacagaatc ctcagggaat ccagttccca 1080 taacctgcac atcaacaaat tttggtcata tattagaaaa gttataaatt aaaatataca 1140 cacttataaa ctacagaaaa gcaattgcta tatactacat tcttttattt tgaaaaaaat 1200 atttgaaata ttatattact actaattaat gataattatt atatatatat caaaggtaga 1260 agcagaaact taccttgaaa tctccgatca ctcttccagc ctcgtatctg taagagaagc 1320 taacgtgaag aacaccacca tcctcgtact tctcgatcct agtgttggtg tatccaccgt 1380 tgttgatagc atgaaggaaa gggttctcgt atccagatgg gtaagttccg aagtggtaga 1440 atccgtatcc cataacgtga gaaagaaggt atggagagaa ggtaagagca cccttggtag 1500 acttcatctt gttagtcatt cttccctgct caggagttcc ctcaccacct ccaacaagct 1560 cgaactcaac accgttaagg gttccagtga ttctacactc gatttccata gcaggaagtc 1620 cagactcatc agactcagat ccagatcctc tcgaaaggcc ctttctccag tctgcaggga 1680 gagccgttct cttaatttct ggcttgcttt tacctgtcca aggattagtt ccggctttgt 1740 cagcggagga actagatgac gaagcgggag cgtctctcca ggaagcggat gatgatctag 1800 caggtgcagg ggcactgctt gcaggtgcgg gactgttgga tcggagtgac tccaactcct 1860 gtttccaatt acttggaagg gccgatctac taggggtgac tgcttttttg ctcgccgatg 1920 agctacgagc tggggcggaa gaagcaggag ctgcatccct ccaactagct gaggatgacc 1980 tagctggtgc tggcgcgcta gaagctggtg ctggactgct tgatcgaagg gattcaagtt 2040 cctgtttcca gttagaaggc agagctgaac gagacggagt gacggccttc ttgctggaag 2100 aactcctagc tggagcgcta gatgcaggcg ctgcgtccct ccatgaggca gaactacttc 2160 tggccggagc tggcgctgat gaagccggtg cagggctgga gcttctcaat gactccaatt 2220 cctgcttcca atttgaaggc aaggcacttc ttgaaggagt aacggccttc tttgaagctg 2280 agctacttct ggcaggcgct gatgatgcag gagcggcgtc tcgccacgat gcgctgctcg 2340 atctcgcagg agcaggagca gaggacgccg ccgacgagct gccgttacca tttctgagtg 2400 attcaagttc ttgcctccaa ttagctggga gaacgcttct tgttgggctc actctgttcg 2460 ttgcactact agctcttgag gcttgaactg tagcagtaga tgactctctc caagatcctc 2520 ttgctgcacc tccgcagtta actcttccgc cgttgcttgt gatggaagta atgtcgttgt 2580 tagccttgcg ggtggctggg aaggcagcgg aggacttaag tccgttgaaa ggagcgacca 2640 tagtggcctg agccggagag gcaaccatag tagcggaaga gagcatagag gaagccattg 2700 tatcgataat tgtaaatgta attgtaatgt tgtttgttgt ttgttgttgt tggtaattgt 2760 tgtaaaaatg agctcttata ctcgagcgtg tcctctccaa atgaaatgaa cttccttata 2820 tagaggaagg gtcttgcgaa ggatagtggg attgtgcgtc atcccttacg tcagtggaga 2880 tgtcacatca atccacttgc tttgtagacg tggttggaac ctcttctttt tccacgatgc 2940 tcctcgtggg tgggggtcca tctttgggac cactgtcggc agagagatct tgaatgatag 3000 cctttccttt atcgcaatga tggcatttgt aggagccacc ttccttttct actgtccttt 3060 cgatgaagtg acagatagct gggcaatgga atccgaggag gtttcccgaa attatccttt 3120 gttgaaaagt ctcaatagcc ctttgatctt ctgagactgt atctttgaca tttttggagt 3180 agaccagagt gtcgtgctcc accatgttga cctccgcaag aattcaagct tggagccaga 3240 aggtaattat ccaagatgta gcatcaagaa tccaatgttt acgggaaaaa ctatggaagt 3300 attatgtaag ctcagcaaga agcagatcaa tatgcggcac atatgcaacc tatgttcaaa 3360 aatgaagaat gtacagatac aagatcctat actgccagaa tacgaagaag aatacgtaga 3420 aattgaaaaa gaagaaccag gcgaagaaaa gaatcttgat gacgtaagca ctgacgacaa 3480 caatgaaaag aagaagataa ggtcggtgat tgtgaaagag acatagagga cacatgtaag 3540 gtggaaaatg taagggcgga aagtaacctt atcacaaagg aatcttatcc cccactactt 3600 atccttttat atttttccgt gtcatttttg cccttgagtt ttcctatata aggaaccaag 3660 ttcggcattt gtgaaaacaa gaaaaaattt ggtgtaagct attttctttg aagtactgag 3720 gatacaactt cagagaaatt tgtaagtttg taatggcttc ctctatgctc tcttccgcta 3780 ctatggttgc ctctccggct caggccacta tggtcgctcc tttcaacgga cttaagtcct 3840 ccgctgcctt cccagccacc cgcaaggcta acaacgacat tacttccatc acaagcaacg 3900 gcggaagagt taactgcgga ggtgcagcaa gaggatcttg gagagagtca tctactgcta 3960 cagttcaagc ctcaagagct agtagtgcaa cgaacagagt gagcccaaca agaagcgttc 4020 tcccagctaa ttggaggcaa gaacttgaat cactcagaaa tggtaacggc agctcgtcgg 4080 cggcgtcctc tgctcctgct cctgcgagat cgagcagcgc atcgtggcga gacgccgctc 4140 ctgcatcatc agcgcctgcc agaagtagct cagcttcaaa gaaggccgtt actccttcaa 4200 gaagtgcctt gccttcaaat tggaagcagg aattggagtc attgagaagc tccagccctg 4260 caccggcttc atcagcgcca gctccggcca gaagtagttc tgcctcatgg agggacgcag 4320 cgcctgcatc tagcgctcca gctaggagtt cttccagcaa gaaggccgtc actccgtctc 4380 gttcagctct gccttctaac tggaaacagg aacttgaatc ccttcgatca agcagtccag 4440 caccagcttc tagcgcgcca gcaccagcta ggtcatcctc agctagttgg agggatgcag 4500 ctcctgcttc ttccgcccca gctcgtagct catcggcgag caaaaaagca gtcaccccta 4560 gtagatcggc ccttccaagt aattggaaac aggagttgga gtcactccga tccaacagtc 4620 ccgcacctgc aagcagtgcc cctgcacctg ctagatcatc atccgcttcc tggagagacg 4680 ctcccgcttc gtcatctagt tcctccgctg acaaagccgg aactaatcct tggacaggta 4740 aaagcaagcc agaaattaag agaacggctc tccctgcaga ctggagaaag ggcctttcgt 4800 acccatacga tgttcctgac tatgcgggct atccctatga cgtcccggac tatgcaggat 4860 tgtatccata tgacgttcca gattacgcca ctagagctgc ttacccatac gatgttcctg 4920 actatgcggg ctatccctat gacgtcccgg actatgcagg attgtatcca tatgacgttc 4980 cagattacgc cgtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 5040 agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 5100 ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct 5160 ggcccaccct cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc taccccgacc 5220 acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca 5280 ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg 5340 acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc 5400 tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcatg gccgacaagc 5460 agaagaacgg catcaaggtg aacttcaaga tccgccacaa catcgaggac ggcagcgtgc 5520 agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg 5580 acaaccacta cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc 5640 acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt 5700 acaagtaagc ttatatgaag atgaagatga aatatttggt gtgtcaaata aaaagcttgt 5760 gtgcttaagt ttgtgttttt ttcttggctt gttgtgttat gaatttgtgg ctttttctaa 5820 tattaaatga atgtaagatc tcattataat gaataaacaa atgtttctat aatccattgt 5880 gaatgttttg ttggatctct tctgcagcat ataactactg tatgtgctat ggtatggact 5940 atggaatatg attaaagata agagatgtca agcagatcgt tcaaacattt ggcaataaag 6000 tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt atcatataat ttctgttgaa 6060 ttacgttaag catgtaataa ttaacatgta atgcatgacg ttatttatga gatgggtttt 6120 tatgattaga gtcccgcaat tatacattta atacgcgata gaaaacaaaa tatagcgcgc 6180 aaactaggat aaattatcgc gcgcggtgtc atctatgtta ctagatcgac gctactagaa 6240 ttcgagctcg gagttctaga atgtcgcgga acaaatttta aaactaaatc ctaaattttt 6300 ctaattttgt tgccaatagt ggatatgtgg gccgtataga aggaatctat tgaaggccca 6360 aacccatact gacgagccca aaggttcgtt ttgcgtttta tgtttcggtt cgatgccaac 6420 gccacattct gagctaggca aaaaacaaac gtgtctttga atagactcct ctcgttaaca 6480 catgcagcgg ctgcatggtg acgccattaa cacgtggcct acaattgcat gatgtctcca 6540 ttgacacgtg acttctcgtc tcctttctta atatatctaa caaacactcc tacctcttcc 6600 aaaatatata cacatctttt tgatcaatct ctcattcaaa atctcattct ctctagtaaa 6660 caagaacaaa aaaatggcgg atacagctag aggaacccat cacgatatca tcggcagaga 6720 tcagtacccg atgatgggcc gagatcgtga ccagtaccag atgtccggac gaggatctga 6780 ctactccaag tctaggcaga ttgctaaagc tgcaactgct gtcacagctg gtggttccct 6840 ccttgttctc tccagcctta cccttgttgg aactgtcata gctttgactg ttgcaacacc 6900 tctgctcgtt atcttcagcc caatccttgt cccggctctc atcacagttg cactcctcat 6960 caccggtttt ctttcctctg gagggtttgg cattgccgct ataaccgttt tctcttggat 7020 ttacaagtaa gcacacattt atcatcttac ttcataattt tgtgcaatat gtgcatgcat 7080 gtgttgagcc agtagctttg gatcaatttt tttggtcgaa taacaaatgt aacaataaga 7140 aattgcaaat tctagggaac atttggttaa ctaaatacga aatttgacct agctagcttg 7200 aatgtgtctg tgtatatcat ctatataggt aaaatgcttg gtatgatacc tattgattgt 7260 gaataggtac gcaacgggag agcacccaca gggatcagac aagttggaca gtgcaaggat 7320 gaagttggga agcaaagctc aggatctgaa agacagagct cagtactacg gacagcaaca 7380 tactggtggg gaacatgacc gtgaccgtac tcgtggtggc cagcacacta ctatgagcga 7440 gctgattaag gagaacatgc acatgaagct gtacatggag ggcaccgtga acaaccacca 7500 cttcaagtgc acatccgagg gcgaaggcaa gccctacgag ggcacccaga ccatgagaat 7560 caaggtggtc gagggcggcc ctctcccctt cgccttcgac atcctggcta ccagcttcat 7620 gtacggcagc agaaccttca tcaaccacac ccagggcatc cccgacttct ttaagcagtc 7680 cttccctgag ggcttcacat gggagagagt caccacatac gaagatgggg gcgtgctgac 7740 cgctacccag gacaccagcc tccaggacgg ctgcctcatc tacaacgtca agatcagagg 7800 ggtgaacttc ccatccaacg gccctgtgat gcagaagaaa acactcggct gggaggccaa 7860 caccgagatg ctgtaccccg ctgacggcgg cctggaaggc agaagcgaca tggccctgaa 7920 gctcgtgggc gggggccacc tgatctgcaa cttcaagacc acatacagat ccaagaaacc 7980 cgctaagaac ctcaagatgc ccggcgtcta ctatgtggac cacagactgg aaagaatcaa 8040 ggaggccgac aaagaaacct acgtcgagca gcacgaggtg gctgtggcca gatactgcga 8100 cctccctagc aaactggggc acaagtgagc ttaccccact gatgtcatcg tcatagtcca 8160 ataactccaa tgtcggggag ttagtttatg aggaataaag tgtttagaat ttgatcaggg 8220 ggagataata aaagccgagt ttgaatcttt ttgttataag taatgtttat gtgtgtttct 8280 atatgttgtc aaatggtacc atgttttttt tcctctcttt ttgtaacttg caagtgttgt 8340 gttgtacttt atttggcttc tttgtaagtt ggtaacggtg gtctatatat ggaaaaggtc 8400 ttgttttgtt aaacttatgt tagttaactg gattcgtctt taaccacaaa aagttttcaa 8460 taagctacaa atttagacac gcaagccgat gcagtcatta gtacatatat ttattgcaag 8520 tgattacatg gcaacccaaa cttcaaaaac agtaggttgc tccatttagt cgctttacga 8580 ggatgcacat gtgaccgagg gacacgaagt gatccgttta aactatcagt gtttgacagg 8640 atatattggc gggtaaacct aagagaaaag agcgtttatt agaataatcg gatatttaaa 8700 agggcgtgaa aaggtttatc cgttcgtcca tttgtatgtg catgccaacc acagggttcc 8760 cctcgggagt cagccgtgcg gctgcatgaa atcctggccg gtttgtctga tgccaagctg 8820 gcggcctggc cggccagctt ggccgctgaa gaaaccgagc gccgccgtct aaaaaggtga 8880 tgtgtatttg agtaaaacag cttgcgtcat gcggtcgctg cgtatatgat gcgatgagta 8940 aataaacaaa tacgcaaggg gaacgcatga aggttatcgc tgtacttaac cagaaaggcg 9000 ggtcaggcaa gacgaccatc gcaacccatc tagcccgcgc cctgcaactc gccggggccg 9060 atgttctgtt agtcgattcc gatccccagg gcagtgcccg cgattgggcg gccgtgcggg 9120 aagatcaacc gctaaccgtt gtcggcatcg accgcccgac gattgaccgc gacgtgaagg 9180 ccatcggccg gcgcgacttc gtagtgatcg acggagcgcc ccaggcggcg gacttggctg 9240 tgtccgcgat caaggcagcc gacttcgtgc tgattccggt gcagccaagc ccttacgaca 9300 tatgggccac cgccgacctg gtggagctgg ttaagcagcg cattgaggtc acggatggaa 9360 ggctacaagc ggcctttgtc gtgtcgcggg cgatcaaagg cacgcgcatc ggcggtgagg 9420 ttgccgaggc gctggccggg tacgagctgc ccattcttga gtcccgtatc acgcagcgcg 9480 tgagctaccc aggcactgcc gccgccggca caaccgttct tgaatcagaa cccgagggcg 9540 acgctgcccg cgaggtccag gcgctggccg ctgaaattaa atcaaaactc atttgagtta 9600 atgaggtaaa gagaaaatga gcaaaagcac aaacacgcta agtgccggcc gtccgagcgc 9660 acgcagcagc aaggctgcaa cgttggccag cctggcagac acgccagcca tgaagcgggt 9720 caactttcag ttgccggcgg aggatcacac caagctgaag atgtacgcgg tacgccaagg 9780 caagaccatt accgagctgc tatctgaata catcgcgcag ctaccagagt aaatgagcaa 9840 atgaataaat gagtagatga attttagcgg ctaaaggagg cggcatggaa aatcaagaac 9900 aaccaggcac cgacgccgtg gaatgcccca tgtgtggagg aacgggcggt tggccaggcg 9960 taagcggctg ggttgtctgc cggccctgca atggcactgg aacccccaag cccgaggaat 10020 cggcgtgacg gtcgcaaacc atccggcccg gtacaaatcg gcgcggcgct gggtgatgac 10080 ctggtggaga agttgaaggc cgcgcaggcc gcccagcggc aacgcatcga ggcagaagca 10140 cgccccggtg aatcgtggca agcggccgct gatcgaatcc gcaaagaatc ccggcaaccg 10200 ccggcagccg gtgcgccgtc gattaggaag ccgcccaagg gcgacgagca accagatttt 10260 ttcgttccga tgctctatga cgtgggcacc cgcgatagtc gcagcatcat ggacgtggcc 10320 gttttccgtc tgtcgaagcg tgaccgacga gctggcgagg tgatccgcta cgagcttcca 10380 gacgggcacg tagaggtttc cgcagggccg gccggcatgg ccagtgtgtg ggattacgac 10440 ctggtactga tggcggtttc ccatctaacc gaatccatga accgataccg ggaagggaag 10500 ggagacaagc ccggccgcgt gttccgtcca cacgttgcgg acgtactcaa gttctgccgg 10560 cgagccgatg gcggaaagca gaaagacgac ctggtagaaa cctgcattcg gttaaacacc 10620 acgcacgttg ccatgcagcg tacgaagaag gccaagaacg gccgcctggt gacggtatcc 10680 gagggtgaag ccttgattag ccgctacaag atcgtaaaga gcgaaaccgg gcggccggag 10740 tacatcgaga tcgagctagc tgattggatg taccgcgaga tcacagaagg caagaacccg 10800 gacgtgctga cggttcaccc cgattacttt ttgatcgatc ccggcatcgg ccgttttctc 10860 taccgcctgg cacgccgcgc cgcaggcaag gcagaagcca gatggttgtt caagacgatc 10920 tacgaacgca gtggcagcgc cggagagttc aagaagttct gtttcaccgt gcgcaagctg 10980 atcgggtcaa atgacctgcc ggagtacgat ttgaaggagg aggcggggca ggctggcccg 11040 atcctagtca tgcgctaccg caacctgatc gagggcgaag catccgccgg ttcctaatgt 11100 acggagcaga tgctagggca aattgcccta gcaggggaaa aaggtcgaaa aagcttcttt 11160 cctgtggata gcacgtacat tgggaaccca aagccgtaca ttgggaaccg gaacccgtac 11220 attgggaacc caaagccgta cattgggaac cggtcacaca tgtaagtgac tgatataaaa 11280 gagaaaaaag gcgatttttc cgcctaaaac tctttaaaac ttattaaaac tcttaaaacc 11340 cgcctggcct gtgcataact gtctggccag cgcacagccg aacagctgca aaaagcgcct 11400 acccttcggt cgctgcgctc cctacgcccc gccgcttcgc gtcggcctat cgcggccgct 11460 ggccgctcaa aaatggctgg cctacggcca ggcaatctac cagggcgcgg acaagccgcg 11520 ccgtcgccac tcgaccgccg gcgcccacat caaggctccg agtgcgcgga acccctattt 11580 gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa ccctgataaa 11640 tgcttcaata atattgaaaa aggaagagta tggctaaaat gagaatatca ccggaattga 11700 aaaaactgat cgaaaaatac cgctgcgtaa aagatacgga aggaatgtct cctgctaagg 11760 tatataagct ggtgggagaa aatgaaaacc tatatttaaa aatgacggac agccggtata 11820 aagggaccac ctatgatgtg gaacgggaaa aggacatgat gctatggctg gaaggaaagc 11880 tgcctgttcc aaaggtcctg cactttgaac ggcatgatgg ctggagcaat ctgctcatga 11940 gtgaggccga tggcgtcctt tgctcggaag agtatgaaga tgaacaaagc cctgaaaaga 12000 ttatcgagct gtatgcggag tgcatcaggc tctttcactc catcgacata tcggattgtc 12060 cctatacgaa tagcttagac agccgcttag ccgaattgga ttacttactg aataacgatc 12120 tggccgatgt ggattgcgaa aactgggaag aggacactcc atttaaagat ccgcgcgagc 12180 tgtatgattt tttaaagacg gaaaagcccg aagaggaact tgtcttttcc cacggcgacc 12240 tgggagacag caacatcttt gtgaaagatg gcaaagtaag tggctttatt gatcttggga 12300 gaagcggcag ggcggacaag tggtatgaca ttgccttctg cgtccggtcg ctcagggagg 12360 atatcgggga agaacagtat gtcgagctat tttttgactt actggggatc aagcctgatt 12420 gggagaaaat aaaatattat attttactgg atgaattgtt ttagctgtca gaccaagttt 12480 actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga 12540 agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag 12600 cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa 12660 tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag 12720 agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg 12780 ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat 12840 acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta 12900 ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg 12960 gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc 13020 gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa 13080 gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc 13140 tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt 13200 caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctgctcg 13260 gatctgttgg accggacagt agtcatggtt gatgggctgc ctgtatcgag tggtgatttt 13320 gtgccgagct gccggtcggg gagctgttgg ctggctggtg gcaggatata ttgtggtgta 13380 aacaaattga cgcttagaca acttaataac acattgcgga cgtttttaat gtactggggt 13440 t 13441 <210> 169 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 169 Trp Arg Gln Glu Leu Glu Ser Leu Arg Asn 1 5 10 <210> 170 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 170 Trp Lys Gln Glu Leu Glu Ser Leu Arg Ser 1 5 10 <210> 171 <211> 6199 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(718) <223> ocs terminator <220> <221> misc_feature <222> (715)..(718) <223> MoClo overhang in ocs terminator <220> <221> misc_feature <222> (719)..(1624) <223> turbo GFP (Pontellina pluma) <220> <221> misc_feature <222> (1622)..(1624) <223> MoClo overhang in turbo GFP (Pontellina pluma) <220> <221> misc_feature <222> (1625)..(2497) <223> mature EPYC1 <220> <221> misc_feature <222> 1625 <223> MoClo overhang in mature EPYC1 <220> <221> misc_feature <222> (2498)..(2669) <223> Rbcs1A transit peptide <220> <221> misc_feature <222> (2498)..(2501), (2666)..(2669) <223> MoClo overhang in Rbcs1A transit peptide <220> <221> misc_feature <222> (2670)..(3181) <223> 35S promoter <220> <221> misc_feature <222> (3182)..(3205) <223> linking region <220> <221> misc_feature <222> (3182)..(3185), (3202)..(3205) <223> MoClo overhang in linking region <220> <221> misc_feature <222> (3206)..(3722) <223> CSVMV promoter <220> <221> misc_feature <222> 3722 <223> MoClo overhang in CSVMV promoter <220> <221> misc_feature <222> (3723)..(3893) <223> Rbcs1A transit peptide <220> <221> misc_feature <222> (3723)..(3725), (3890)..(3893) <223> MoClo overhang in Rbcs1A transit peptide <220> <221> misc_feature <222> (3894)..(4766) <223> mature EPYC1 <220> <221> misc_feature <222> 4766 <223> MoClo overhang in mature EPYC1 <220> <221> misc_feature <222> (4767)..(5678) <223> eGFP (with N-terminal HA-tag) <220> <221> misc_feature <222> (4767)..(4769) <223> MoClo overhang in eGFP (with N-terminal HA-tag) <220> <221> misc_feature <222> (5679)..(5932) <223> HSP terminator <220> <221> misc_feature <222> (5679)..(5682) <223> MoClo overhang in HSP terminator <220> <221> misc_feature <222> (5933)..(6199) <223> nos terminator <220> <221> misc_feature <222> (5933)..(5936) <223> MoClo overhang in nos terminator <400> 171 gtcctgctga gcctcgacat gttgtcgcaa aattcgccct ggacccgccc aacgatttgt 60 cgtcactgtc aaggtttgac ctgcacttca tttggggccc acatacacca aaaaaatgct 120 gcataattct cggggcagca agtcggttac ccggccgccg tgctggaccg ggttgaatgg 180 tgcccgtaac tttcggtaga gcggacggcc aatactcaac ttcaaggaat ctcacccatg 240 cgcgccggcg gggaaccgga gttcccttca gtgagcgtta ttagttcgcc gctcggtgtg 300 tcgtagatac tagcccctgg ggcacttttg aaatttgaat aagatttatg taatcagtct 360 tttaggtttg accggttctg ccgctttttt taaaattgga tttgtaataa taaaacgcaa 420 ttgtttgtta ttgtggcgct ctatcataga tgtcgctata aacctattca gcacaatata 480 ttgttttcat tttaatattg tacatataag tagtagggta caatcagtaa attgaacgga 540 gaatattatt cataaaaata cgatagtaac gggtgatata ttcattagaa tgaaccgaaa 600 ccggcggtaa ggatctgagc tacacatgct caggtttttt acaacgtgca caacagaatt 660 gaaagcaaat atcatgcgat cataggcttc tcgcatatct cattaaagca ggacaagctt 720 atcattcctc accagcatca gcatcagggg tcttgaaagc atgttggtac tcaacgattc 780 caagctcggt gttagagtga tcttcctcaa ctcttctgaa agcgaacata ggtccaccgt 840 tttgaaggat agaagggtgg atagcagact tgaagtgcat gtgagaatcc accacagaag 900 agtagtaacc accatctcta agtgagaagg ttctggtgaa agatccatcg agatcgttat 960 ctcccatagg atgaagatgc tcaacagtag cgttagacct gatgatcttg tcggtgaaga 1020 taacagaatc ctcagggaat ccagttccca taacctgcac atcaacaaat tttggtcata 1080 tattagaaaa gttataaatt aaaatataca cacttataaa ctacagaaaa gcaattgcta 1140 tatactacat tcttttattt tgaaaaaaat atttgaaata ttatattact actaattaat 1200 gataattatt atatatatat caaaggtaga agcagaaact taccttgaaa tctccgatca 1260 ctcttccagc ctcgtatctg taagagaagc taacgtgaag aacaccacca tcctcgtact 1320 tctcgatcct agtgttggtg tatccaccgt tgttgatagc atgaaggaaa gggttctcgt 1380 atccagatgg gtaagttccg aagtggtaga atccgtatcc cataacgtga gaaagaaggt 1440 atggagagaa ggtaagagca cccttggtag acttcatctt gttagtcatt cttccctgct 1500 caggagttcc ctcaccacct ccaacaagct cgaactcaac accgttaagg gttccagtga 1560 ttctacactc gatttccata gcaggaagtc cagactcatc agactcagat ccagatcctc 1620 tcgaaaggcc ctttctccag tctgcaggga gagccgttct cttaatttct ggcttgcttt 1680 tacctgtcca aggattagtt ccggctttgt cagcggagga actagatgac gaagcgggag 1740 cgtctctcca ggaagcggat gatgatctag caggtgcagg ggcactgctt gcaggtgcgg 1800 gactgttgga tcggagtgac tccaactcct gtttccaatt acttggaagg gccgatctac 1860 taggggtgac tgcttttttg ctcgccgatg agctacgagc tggggcggaa gaagcaggag 1920 ctgcatccct ccaactagct gaggatgacc tagctggtgc tggcgcgcta gaagctggtg 1980 ctggactgct tgatcgaagg gattcaagtt cctgtttcca gttagaaggc agagctgaac 2040 gagacggagt gacggccttc ttgctggaag aactcctagc tggagcgcta gatgcaggcg 2100 ctgcgtccct ccatgaggca gaactacttc tggccggagc tggcgctgat gaagccggtg 2160 cagggctgga gcttctcaat gactccaatt cctgcttcca atttgaaggc aaggcacttc 2220 ttgaaggagt aacggccttc tttgaagctg agctacttct ggcaggcgct gatgatgcag 2280 gagcggcgtc tcgccacgat gcgctgctcg atctcgcagg agcaggagca gaggacgccg 2340 ccgacgagct gccgttacca tttctgagtg attcaagttc ttgcctccaa ttagctggga 2400 gaacgcttct tgttgggctc actctgttcg ttgcactact agctcttgag gcttgaactg 2460 tagcagtaga tgactctctc caagatcctc ttgctgcacc tccgcagtta actcttccgc 2520 cgttgcttgt gatggaagta atgtcgttgt tagccttgcg ggtggctggg aaggcagcgg 2580 aggacttaag tccgttgaaa ggagcgacca tagtggcctg agccggagag gcaaccatag 2640 tagcggaaga gagcatagag gaagccattg tatcgataat tgtaaatgta attgtaatgt 2700 tgtttgttgt ttgttgttgt tggtaattgt tgtaaaaatg agctcttata ctcgagcgtg 2760 tcctctccaa atgaaatgaa cttccttata tagaggaagg gtcttgcgaa ggatagtggg 2820 attgtgcgtc atcccttacg tcagtggaga tgtcacatca atccacttgc tttgtagacg 2880 tggttggaac ctcttctttt tccacgatgc tcctcgtggg tgggggtcca tctttgggac 2940 cactgtcggc agagagatct tgaatgatag cctttccttt atcgcaatga tggcatttgt 3000 aggagccacc ttccttttct actgtccttt cgatgaagtg acagatagct gggcaatgga 3060 atccgaggag gtttcccgaa attatccttt gttgaaaagt ctcaatagcc ctttgatctt 3120 ctgagactgt atctttgaca tttttggagt agaccagagt gtcgtgctcc accatgttga 3180 ccctcgcaag aattcaagct tggagccaga aggtaattat ccaagatgta gcatcaagaa 3240 tccaatgttt acgggaaaaa ctatggaagt attatgtaag ctcagcaaga agcagatcaa 3300 tatgcggcac atatgcaacc tatgttcaaa aatgaagaat gtacagatac aagatcctat 3360 actgccagaa tacgaagaag aatacgtaga aattgaaaaa gaagaaccag gcgaagaaaa 3420 gaatcttgat gacgtaagca ctgacgacaa caatgaaaag aagaagataa ggtcggtgat 3480 tgtgaaagag acatagagga cacatgtaag gtggaaaatg taagggcgga aagtaacctt 3540 atcacaaagg aatcttatcc cccactactt atccttttat atttttccgt gtcatttttg 3600 cccttgagtt ttcctatata aggaaccaag ttcggcattt gtgaaaacaa gaaaaaattt 3660 ggtgtaagct attttctttg aagtactgag gatacaactt cagagaaatt tgtaagtttg 3720 taatggcttc ctctatgctc tcttccgcta ctatggttgc ctctccggct caggccacta 3780 tggtcgctcc tttcaacgga cttaagtcct ccgctgcctt cccagccacc cgcaaggcta 3840 acaacgacat tacttccatc acaagcaacg gcggaagagt taactgcgga ggtgcagcaa 3900 gaggatcttg gagagagtca tctactgcta cagttcaagc ctcaagagct agtagtgcaa 3960 cgaacagagt gagcccaaca agaagcgttc tcccagctaa ttggaggcaa gaacttgaat 4020 cactcagaaa tggtaacggc agctcgtcgg cggcgtcctc tgctcctgct cctgcgagat 4080 cgagcagcgc atcgtggcga gacgccgctc ctgcatcatc agcgcctgcc agaagtagct 4140 cagcttcaaa gaaggccgtt actccttcaa gaagtgcctt gccttcaaat tggaagcagg 4200 aattggagtc attgagaagc tccagccctg caccggcttc atcagcgcca gctccggcca 4260 gaagtagttc tgcctcatgg agggacgcag cgcctgcatc tagcgctcca gctaggagtt 4320 cttccagcaa gaaggccgtc actccgtctc gttcagctct gccttctaac tggaaacagg 4380 aacttgaatc ccttcgatca agcagtccag caccagcttc tagcgcgcca gcaccagcta 4440 ggtcatcctc agctagttgg agggatgcag ctcctgcttc ttccgcccca gctcgtagct 4500 catcggcgag caaaaaagca gtcaccccta gtagatcggc ccttccaagt aattggaaac 4560 aggagttgga gtcactccga tccaacagtc ccgcacctgc aagcagtgcc cctgcacctg 4620 ctagatcatc atccgcttcc tggagagacg ctcccgcttc gtcatctagt tcctccgctg 4680 acaaagccgg aactaatcct tggacaggta aaagcaagcc agaaattaag agaacggctc 4740 tccctgcaga ctggagaaag ggcctttcgt acccatacga tgttcctgac tatgcgggct 4800 atccctatga cgtcccggac tatgcaggat tgtatccata tgacgttcca gattacgcca 4860 ctagagctgc ttacccatac gatgttcctg actatgcggg ctatccctat gacgtcccgg 4920 actatgcagg attgtatcca tatgacgttc cagattacgc cgtgagcaag ggcgaggagc 4980 tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac ggccacaagt 5040 tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc ctgaagttca 5100 tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc ctgacctacg 5160 gcgtgcagtg cttcagccgc taccccgacc acatgaagca gcacgacttc ttcaagtccg 5220 ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac ggcaactaca 5280 agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc gagctgaagg 5340 gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac aactacaaca 5400 gccacaacgt ctatatcatg gccgacaagc agaagaacgg catcaaggtg aacttcaaga 5460 tccgccacaa catcgaggac ggcagcgtgc agctcgccga ccactaccag cagaacaccc 5520 ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagcacc cagtccgccc 5580 tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc gtgaccgccg 5640 ccgggatcac tctcggcatg gacgagctgt acaagtaagc ttatatgaag atgaagatga 5700 aatatttggt gtgtcaaata aaaagcttgt gtgcttaagt ttgtgttttt ttcttggctt 5760 gttgtgttat gaatttgtgg ctttttctaa tattaaatga atgtaagatc tcattataat 5820 gaataaacaa atgtttctat aatccattgt gaatgttttg ttggatctct tctgcagcat 5880 ataactactg tatgtgctat ggtatggact atggaatatg attaaagata agagatgtca 5940 agcagatcgt tcaaacattt ggcaataaag tttcttaaga ttgaatcctg ttgccggtct 6000 tgcgatgatt atcatataat ttctgttgaa ttacgttaag catgtaataa ttaacatgta 6060 atgcatgacg ttatttatga gatgggtttt tatgattaga gtcccgcaat tatacattta 6120 atacgcgata gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc 6180 atctatgtta ctagatcga 6199 <210> 172 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 172 Lys Ser Ala Arg Asp Trp Gln Pro Ala Asn Lys Arg Ser Val 1 5 10

Claims

필수 피레노이드 성분 1(Essential Pyrenoid Component 1)(EPYC1) 폴리펩티드 및 변형된 루비스코(Rubisco)의 응집체를 형성하기 위한 변형된 루비스코를 포함하는, 유전적으로 변경된 고등 식물 또는 이의 일부로서, 상기 변형된 루비스코가 조류 루비스코 작은 서브유닛(SSU) 폴리펩티드 또는 변형된 고등 식물 루비스코 SSU 폴리펩티드를 포함하고, 여기서 상기 고등 식물 루비스코 SSU 폴리펩티드의 적어도 일부가 조류 루비스코 SSU 폴리펩티드의 적어도 일부로 대체된, 식물 또는 이의 일부.
제1항에 있어서, EPYC1 폴리펩티드 및 응집체를 추가로 포함하는, 식물 또는 이의 일부.
제1항에 있어서, 조류 루비스코 SSU 폴리펩티드를 포함하는 변형된 루비스코가 변형되지 않은 루비스코와 비교하여 EPYC1 폴리펩티드에 대해 증가된 친화성을 갖는, 식물 또는 이의 일부.
제1항에 있어서, 변형된 고등 식물 루비스코 SSU 폴리펩티드가 하나 이상의 고등 식물 루비스코 SSU α-나선을 하나 이상의 조류 루비스코 SSU α-나선으로 대체하고/하거나; 하나 이상의 고등 식물 루비스코 SSU β-가닥을 하나 이상의 조류 루비스코 SSU β-가닥으로 대체하고/하거나; 고등 식물 루비스코 SSU βA-βB 루프를 조류 루비스코 SSU βA-βB 루프로 대체함으로써 변형된, 식물 또는 이의 일부.
제1항에 있어서, 변형된 고등 식물 루비스코 SSU 폴리펩티드가 변형이 없는 고등 식물 루비스코 SSU 폴리펩티드와 비교하여 EPYC1 폴리펩티드에 대해 증가된 친화성을 갖는, 식물 또는 이의 일부.
EPYC1 폴리펩티드 및 변형된 루비스코의 응집체를 형성하기 위한 EPYC1 폴리펩티드를 포함하는, 유전적으로 변경된 고등 식물 또는 이의 일부.
제6항에 있어서, EPYC1 폴리펩티드가 조류 EPYC1 폴리펩티드 또는 제1 조류 EPYC1 반복 영역의 1개 이상, 2개 이상, 4개 이상 또는 8개의 직렬 카피를 포함하는 변형된 EPYC1 폴리펩티드인, 식물 또는 이의 일부.
제7항에 있어서, 조류 EPYC1 폴리펩티드가 트렁케이션된 성숙 EPYC1 폴리펩티드인, 식물 또는 이의 일부.
제8항에 있어서, 트렁케이션된 성숙 EPYC1 폴리펩티드가 트렁케이션되지 않은 EPYC1 폴리펩티드와 비교하여 변형된 루비스코에 대해 증가된 친화성을 갖는, 식물 또는 이의 일부.
제7항에 있어서, 변형된 EPYC1 폴리펩티드가 천연 EPYC1 선도 서열 없이 발현되고/되거나 C-말단 캡을 포함하는, 식물 또는 이의 일부.
제10항에 있어서, 변형된 EPYC1 폴리펩티드가 상응하는 변형되지 않은 EPYC1 폴리펩티드와 비교하여 변형된 루비스코에 대해 증가된 친화성을 갖는, 식물 또는 이의 일부.
제6항에 있어서, 응집체가 식물 세포의 적어도 하나의 엽록체의 엽록체 기질에 국한되고, 상기 식물 세포가 잎 엽육 세포인, 식물 또는 이의 일부.
EPYC1 폴리펩티드를 인코딩하는 제1 핵산 서열 및 변형된 루비스코 폴리펩티드를 인코딩하는 제2 핵산 서열을 포함하는, 유전적으로 변경된 고등 식물 또는 이의 일부.
제13항에 있어서, 제1 핵산 서열이 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1 핵산 서열이 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않으며, 제2 핵산 서열이 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제4 핵산 서열에 작동 가능하게 연결되고, 상기 제2 핵산 서열이 천연 조류 SSU 선도 서열을 인코딩하지 않고 천연 조류 SSU 선도 서열을 인코딩하는 핵산 서열에 작동 가능하게 연결되지 않는, 식물 또는 이의 일부.
제13항에 있어서, EPYC1 폴리펩티드가 트렁케이션된 성숙 EPYC1 폴리펩티드 또는 제1 조류 EPYC1 반복 영역의 1개 이상, 2개 이상, 4개 이상 또는 8개의 직렬 카피를 포함하는 변형된 EPYC1 폴리펩티드인, 식물 또는 이의 일부.
제13항에 있어서, 변형된 루비스코 폴리펩티드가 조류 루비스코 작은 서브유닛(SSU) 폴리펩티드 또는 변형된 고등 식물 루비스코 SSU 폴리펩티드를 포함하고, 여기서 상기 고등 식물 루비스코 SSU 폴리펩티드의 적어도 일부가 조류 루비스코 SSU 폴리펩티드의 적어도 일부로 대체된, 식물 또는 이의 일부.
제13항에 있어서, 식물 또는 이의 일부가 변형된 루비스코 폴리펩티드 및 EPYC1 폴리펩티드의 응집체를 추가로 포함하는 식물 또는 이의 일부.
제1항의 유전적으로 변경된 고등 식물을 생산하는 방법으로서,
a) EPYC1 폴리펩티드를 인코딩하는 제1 핵산 서열을 식물 세포, 조직 또는 다른 체외이식편에 도입하는 단계;
b) 상기 식물 세포, 조직 또는 다른 체외이식편을 유전적으로 변경된 소식물체로 재생시키는 단계; 및
c) 상기 유전적으로 변경된 소식물체를 상기 EPYC1 폴리펩티드를 인코딩하는 상기 제1 핵산을 갖는 유전적으로 변경된 식물로 성장시키는 단계를 포함하는 방법.
제18항에 있어서, 변형된 루비스코 SSU 폴리펩티드를 인코딩하는 제2 핵산 서열을 단계 (a) 이전에 또는 단계 (a)와 동시에 식물 세포, 조직 또는 다른 체외이식편에 도입하는 단계를 추가로 포함하고, 여기서 단계 (c)의 유전적으로 변경된 식물이 변형된 상기 루비스코 SSU 폴리펩티드를 인코딩하는 상기 제2 핵산을 추가로 포함하는 방법.
제18항에 있어서, 제1 핵산 서열이 제1 벡터와 함께 도입되고, 상기 제1 벡터가 상기 제1 핵산 서열의 제1 카피를 포함하고, 여기서 상기 제1 핵산 서열이 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않으며, 상기 제1 핵산 서열이 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1 핵산 서열이 제1 프로모터에 작동 가능하게 연결되고, 상기 제1 핵산 서열이 1개의 종결인자에 작동 가능하게 연결되며; 상기 제1 벡터가 상기 제1 핵산 서열의 제2 카피를 추가로 포함하고, 여기서 상기 제1 핵산 서열이 천연 EPYC1 선도 서열을 포함하지 않고 천연 EPYC1 선도 서열에 작동 가능하게 연결되지 않으며, 상기 제1 핵산 서열이 고등 식물 세포에서 기능하는 엽록체의 전이 펩티드를 인코딩하는 제3 핵산 서열에 작동 가능하게 연결되고, 상기 제1 핵산 서열이 제3 프로모터에 작동 가능하게 연결되고, 상기 제1 핵산 서열이 2개의 종결인자에 작동 가능하게 연결되는 방법.