KR20130113967A

KR20130113967A - 단백질체 유도 폴리펩티드 서열

Info

Publication number: KR20130113967A
Application number: KR1020127034217A
Authority: KR
Inventors: 빠블로 마르자발 루나; 엠에이 인마쿨라다 욥; 마리아 돌로레스 루데비드 무히카; 블란카 롬파르트 로요; 조세프 미누; 마르가리타 토렌트 구에트글라스; 미리암 바스티나 비르히리
Original assignee: 에라 바이오테크, 에스.에이.
Priority date: 2010-05-28
Filing date: 2011-05-30
Publication date: 2013-10-16
Also published as: DK2576797T3; US9637751B2; US20110305718A1; EP2576797B1; EP2576797A1; EP3184640A2; JP6087277B2; EP2418284A1; ES2623147T3; WO2011147995A1; JP2013532960A; EP3184640A3; CA2800852A1

Abstract

재조합 단백질체를 유도하는 폴리펩티드 서열이 기재된다. 이 서열은 일측 말단 위의 두 시스테인 잔기들 사이에 폴리프롤린 II(PPII) 구조를 포함하고, ER 신호 서열 재조합 단백질체는 많은 양의 재조합 단백질의 간단하고 효율적인 정제를 가능하게 하기 때문에 단백질 생산에 유용하다. 아울러, 예를 들어, 백신에서 재조합 단백질체를 사용하는 다른 방법들도 기재되어 있다.

Description

단백질체 유도 폴리펩티드 서열{PROTEIN BODY-INDUCING POLYPEPTIDE SEQUENCES}

본 발명은 진핵 세포에서 재조합 단백질체 유사 조립체(RPBLA)의 형성을 유도할 수 있는 펩티드들을 고려한다. 아울러, 재조합 단백질체 유사 조립체(RPBLA)의 유도를 중재하는 서열에 융합되는 이종 폴리펩티드들은 안정적으로 발현되어 숙주계에 축적된다.

수십년 전에, 프롤라민은 곡류의 배젖에서 천연 단백질체(PB)의 형성에 관련된 매우 특별한 저장 단백질로 기재되어 있다((Sherry et al., 1990, Biochem . J. 267:1-12). 그럼에도 불구하고, 오늘날까지, 이러한 유형의 세포기관을 유도하는 기작 및 요구에 관해서는 거의 알려지지 않고 있다.

배젖은 단백질을 조직 및 세포 형태들 이외의 단백질체(PB)으로 정렬시키는 큰 경향을 갖는 것으로 나타나는 특별한 식물 조직이다. 이는 단백질이 프롤라민으로 융합되지 않을 때에도 사실이다. 예를 들어, 쌀잎 세포로부터 분비되는 재조합 피타아제 단백질은 배젖에서 발현시 단백질체(PB) 내에서 유지된다. (Drakakaki et al., 2006, Plant Physiology, 141, 578-586). 유사하게, 인간 시토메갈로바이러스(Wright et al., 2001, Transgenic Research 10: 177-181) 및 리소자임(Yang et al., 2003, Planta 216: 597-603)의 주 당단백질(gB)은 프롤라민에 융합되지 않을 때에도 쌍떡잎 식물 및 외떡잎 식물 배젖에서 단백질체에 축적된다. 흥미롭게도, 리소자임이 비-프롤라민 신호 펩티드에 융합되어 비-프롤라민 촉진제(푸로인돌린 b)의 제어 하에서 발현될 때에도, 쌀 배젖의 단백질체에 축적된다. (Hennegan et al., 2005, Transgenic Reserch 14:583-592). 이들 데이터는 단백질체에서 단백질의 축적은 배젖의 특별하게 된 저장 환경을 요구할 수 있다는 것을 제시한다.

단백질이 배젖 내로 정렬되는 경향의 증가는 KDEL (서열번호 110)-태그가 붙은 재조합 단백질을 이용한 실험에 의해서도 나타난다. KDEL 태그는 소포체(ER)에서 단백질 유지를 돕기 때문에 "ER 유지신호"로서 알려져 있다. 이처럼, 인간 혈청 알부민이 KDEL 태그에 융합될 때, 잎 세포에서 ER 루멘에 국소화된다. 그러나, 배젖에서 발현시, KDEL-태그가 붙은 인간 혈청 알부민은 액포 내 프롤라민 응집체에 침전된다. 아울러, 잎의 소포체에 효율적으로 보유되는 KDEL-태그가 붙은 단일클론 항체는 분비되어 종자에서 단백질 저장 액포에 부분적으로 정렬된다(Petruccelli et al, 2006, Plant Biotechnol J. 4:511-27).

그러므로, 곡물 배젖 세포 내에서 단백질 전달은 소포체(ER)-유래 및 액포 단백질체의 풍부를 포함하는 배젖 특이 환경에 영향을 받는다. 따라서, 배젖에서 단백질체들로 정렬된 단백질은 다른 세포들 또는 조직에서는 거기에 정렬되지 않을 수 있고, 배젖에서 단백질체의 형성을 유도하기에 충분한 서열 및 구조는 다른 세포 또는 조직에서 단백질체의 형성을 위해 필요충분조건이 아닐 수도 있다.

또한, 단백질체의 형성을 유도하기에 충분한 특이 서열 및 구조는 확인되지 않았다. 사실상, 단백질체의 형성에 관련된 모든 단백질을 비교시, 서열, 구조, 또는 물리적 및 화학적 특성들에서 분명한 상동성은 분명하지 않다.

감마 제인(zein)은 옥수수(maize)에서 단백질체의 주요한 구성 성분이다(Ludevid et al., 1984, Plant Mol . Biol . 3, 227-234). 감마 제인의 N-말단 도메인은 프로-X 영역(P-X) 및 ER에서 감마 제인의 정렬(Geli, et al . Plant Cell 6:1911(1994)) 및 단백질체의 형성을 위해 필요한 반복성이 높은 서열 (PPPVHL)₈(서열번호 27) (RD)을 포함한다 (미국 공개출원번호 제2007/0243198호 참조). pH 5인 물에서 서열 (VHLPPP)n(서열번호 28)(n=3, 5, 8)의 합성 펩티드 시리즈의 원편광 이색성 연구는 이들 펩티드가 폴리프롤린 II(PPII) 나선(Rabanal, Biopolymers 33: 1019-28(1993))을 채택하였다는 것을 보여주었다. 감마 제인은 또한 안정한 PB들의 형성을 요구받는 것으로 나타난 여러 시스테인을 포함한다(Pompa, Plant Cell 18: 2608-2621 (2006)).

감마 제인의 RD의 PPII 나선은 두드러진 양친매성 특성을 가진다. 이전의 연구들은 PPII 나선의 양친매성 성질이 안정한 PB들의 형성에 중요하고 양친매성 PPII 나선 (VHLPPP)₈ (서열번호 27)의 계면활성제 성질들이 몇 가지 접근법들에서 나타났다는 것을 제시하였다(Kogan et al., 2001, J. Mol . Biol . 312, 907-913003; Kogan et al., 2002, BiolBiophysical Journal . Volume 83. 1194-1204). 예를 들어, 합성 옥타머 펩티드 (VHLPPP)₈은 크게는 수용성 상으로부터 떨어져서 배향된 소수성 모이어티와 함께 양친매성 물질의 공기-물 계면으로의 흡착으로 인해 물이 표면 장력을 낮출 수 있었던 것으로 나타났다(Ludevid et al., 1984, Plant Mol . Biol. 3, 227-234). 또한 이 양친매성 펩티드는 대두의 포스파티딜콜린 리포좀과 상호작용하여 합쳐져서 막에 대해 연장된 도메인을 형성하여 안정성과 투과성을 높이는 것으로 나타났다(Kogan et al., 2004, Biopolymers, Vol. 73, 258~268). 막 상에서 (VHLPPP)₈ (서열번호 27)의 자발적 양친매성 조립체는 옥수수 단백질체들 내 감마-제인 침적의 기작을 제시한다. 감마-제인 RD의 양친매성 특성을 근거로, 이 단백질은 PB 유도의 기작에서 주요 요소일 수 있는 내부 코팅을 유도하는 ER 막의 내부면과 상호작용한다고 제안되었다(Ludevid et al., 1984, Plant Mol . Biol . 3, 227~234). 이 코팅은 이후 감마 제인의 반복 서열을 양 옆에 둔 시스테인 잔기들을 포함하는 분자 내 디설파이드 교차결합을 통해 공유결합적으로 안정화될 수 있다.

감마-제인 단백질의 특징들 중 일부가 특징화되었을 때, 이전에는 이들 특징들 중 어느 것 또는 특징들의 조합이 단백질체 형성을 위해 적합했던 것으로 이해되지 않았었다. 더욱이, 다른 단백질체 유도 서열은 감마-제인과 구조적 또는 서열 유사성을 거의 또는 전혀 포함하지 않는다. 아래에서 더욱 상세히 기재되듯이, 단백질체를 유도할 수 있는 최소 서열이 확인되었다. 또한, 재조합 단백질체 유사 조립체(RPBLA)들을 형성하는 향상된 능력 및 개선된 특성을 가진 RPBLA들을 형성하는 능력의 향상과 같은 개선된 성질들을 갖는 재조합 단백질체 유도 서열들이 확인되었다.

해결하려는 과제

일 양태에서, 본 발명은 길이가 최소 36개의 아미노산들인 폴리프롤린 II(PPII) 구조를 포함하는 재조합 단백질체 유도 폴리펩티드 서열(PBIS)에 관한 것으로서;

상기 PPII 구조는 N-말단에서 최소 두 시스테인들 사이 및 C-말단에서 최소 두 시스테인들 사이에 위치되고;

상기 PPII 구조 내 단지 10%의 아미노산들은 리신 또는 아르기닌이고;

상기 PPII 구조는 서열 (PPPVHL)₆. (서열번호 29)을 포함하지 않는다.

다른 양태에서, 본 발명은 길이가 최소 36개의 아미노산들인 프롤린 풍부 서열을 포함하는 재조합 단백질체 유도 폴리펩티드 서열(PBIS)에 관한 것으로서;

상기 프롤린 풍부 서열은 N-말단에서 최소 두 시스테인들 사이 및 C-말단에서 최소 두 시스테인들 사이에 위치되고;

상기 프롤린 풍부 서열 내 단지 10%의 아미노산들은 리신 또는 아르기닌이고;

상기 프롤린 풍부 서열은 서열 (PPPVHL)₆.(서열번호 29)을 포함하지 않는다.

또 다른 양태에서, 본 발명은 본 발명에 따른 재조합 PBIS 및 이종 단백질을 포함하는 융합 단백질에 관한 것이다.

또 다른 양태에서, 본 발명은 본 발명에 따른 재조합 PBIS 또는 본 발명에 따른 융합 단백질을 인코딩하는 서열을 포함하는 핵산 분자 및 본 발명의 핵산을 포함하는 벡터에 관한 것이다.

또 다른 양태에서, 본 발명은 본 발명에 따른 재조합 PBIS 또는 본 발명에 따른 융합 단백질을 포함하는 RPBLA에 관한 것이다. 또 다른 양태에서, 본 발명은 본 발명의 재조합 PBIS, 본 발명에 따른 융합 단백질, 본 발명에 따른 핵산, 본 발명에 따른 벡터 또는 본 발명에 따른 RPBLA를 포함하는 숙주 세포에 관한 것이다.

또 다른 양태에서, 본 발명은 본 발명에 따른 RPBLA를 생산 및 정제하기 위한 방법 및 본 발명에 따른 RPBLA의 일부를 형성하는 융합 단백질을 정제하고 본 발명에 따른 RPBLA의 일부를 형성하는 융합 단백질의 일부를 형성하는 단백질을 정제하기 위한 방법에 관한 것이다.

또 다른 양태에서, 본 발명은 치료적으로 유효한 양의 본 발명의 RPBLA를 포함하는 약제학적 조성물, 면역학적으로 유효한 양의 본 발명의 RPBLA를 포함하는 백신, 및 본 발명에 따른 RPBLA를 포함하는 식품에 관한 것이다.

발명의 효과

도 1. (A) 리포터 형광 단백질에 융합되고 담배잎에서 아그로인필트레이션(agroinfiltration) 에 의해 형질전환된 RX3 펩티드들의 다른 이형들로부터 반복 도메인(RD)의 도식. PPII 나선을 따라 비-프롤린 아미노산의 상대적 위치는 삼각형으로 표시된다. 친수성 측(상부)으로부터 소수성 측(하부)을 분리하는 점선은 양친매성 나선을 가진 이형들에서 보여진다. 와일드 타입 RX3 반복 도메인은 중앙(회색 박스)에 보여진다. 히스티딘 잔기들이 알라닌 또는 류신(각각 RX3(A) 및 RX3(L))으로 치환된 완전 소수성 이종들은 우측에 보여진다. 히스티딘 잔기들이 아르기닌 또는 리신(각각 RX3(R) 및 RX3(K))으로 치환된 양친매성의 양으로 대전된 이형들은 좌측에 보여진다. (B) 항-GFP 항체로 탐색된, RX3-GFP, RX3(R)-GFP, RX3-ECFP, 및 RX3(K)-ECFP를 발현하는 담배 잎 균질현탁액들의 등가량들의 웨스턴 블롯 분석. 흰색 화살표는 융합 단백질을 표시하고, 흑색 화살표는 부분적으로 퇴화된 형광 단백질을 나타낸다. (C) GFP (RX3-GFP)에게 융합된 와일드 타입 RX3 펩티드, 또는 RX3 펩티드의 몇몇 이형들을 발현하는 담배 잎 세포들의 공초점 현미경 영상들로서, 여기서 반복 도메인으로부터 히스티딘 잔기들은 알라닌, 류신, 아르기닌 또는 리신으로 돌연변이되었다(각각 RX3(A)-GFP, RX3(L)-GFP, RX3(R)-GFP 및 RX3(K)-ECFP)). 화살표는 분비된 단백질에 대응하는 형광을 표시한다. 흰 화살촉은 ER 유도 RPBLA들을, 흑색 화살촉은 엽록체들을 표시한다. 막대는 5 마이크로미터에 해당한다.
도 2. (A) 담배 잎에서 발현된 몇몇 융합 단백질(RX3-GFP, RX3(A)-GFP, 및 RX3(L)-GFP)에 대해 항-GFP 항체를 사용하여 웨스턴 블롯에 의해 분석된 단계 밀도 구배 결과들의 사진. (B) 단계별 밀도 구배 후 RX3(A)-GFP의 풍부를 보여주는 쿠마시 블루 염색. 밀도 구배의 다른 분획물들((H) 균질화액, (S) 상청액, (f) 해당 Optiprep™ 쿠션 위 경계면)이 표시되어 있다.
도 3. (A) 저속 원심분리에 의한 RPBLA 회수. 좌측 패널은 담배 잎에서 발현된 RX3-GFP 및 RX3(A)-GFP RPBLA들의 분리 후 SDS-PAGE 실버 염색을 보여준다. 우측 패널은 온순 조건(50mM 붕산염 pH10, 10 mM bME)에서 세척된 RX3-GFP 및 RX3(A)-GFP RPBLA들의 SDS-PAGE 실버 염색을 보여준다. (B) 쿠마시 블루 염색(좌측) 및 웨스턴 블롯(우측, 항 GFP 항체)은 RX3(L)-GFP의 발현에 의해 담배 식물에서 유도된 RPBLA들의 저속 원심분리에 의한 회수를 보여준다 (H0) 맑게 되기 전 균질화액, (H1) 여과에 의해 맑게 된 균질화액, (SN) 원심분리에 의한 RPBLA 회수 후 상청액, (Ws) 세척 단계 상청액, (wPB) 세척 단계후 원심분리에 의해 회수된 RPBLA들, (sPB) wPB로부터 가용화된 융합 단백질, 및 (iPB) 가용화 단계 후 불용 부분. 화살표는 해당 단량체의 융합 단백질들을 나타낸다. 별표는 융합 단백질의 다중결합 형태들을 나타낸다.
도 4. (A)는 도 1에 기재된 것처럼 RX3(A3)으로부터 반복 도메인(RD)의 도식적 표시. (B)는 RX3(A3)-ECFP 발현 벡터로 3일 및 6일 후 침투(dpi) 담배 잎 세포들의 공초점 현미경 영상들. RPBLA는 화살표로 표시된다. 막대는 2 마이크로미터에 해당한다.
도 5. (A) 도 1에 대해 기재된 것처럼 RX3 펩티드들(RX3(E) 및 RX3(D))의 양친매성의 음으로 대전된 이형들로부터 반복 도메인의 도식적 표시. (B)는 RX3-GFP, RX3(E)-GFP, RX3-ECFP, 및 RX3(D)-ECFP를 발현하는 담배 잎들로부터 균질화액의 등가량에 대한 항-GFP 웨스턴 블롯. (C) RX3(E)-GFP(좌측), 및 RX3(D)-ECFP(우측)를 발현하는 담배 잎 세포들의 공초점 현미경 영상. RPBLA는 화살표로 표시된다. 막대는 2 마이크로미터에 해당한다.
도 6. (A) 도 1에 대해 기재된 것처럼 RX3 펩티드들(RX3(T), RX3(N), 및 RX3(Q))의 극성 비대전된 이형들로부터 반복 도메인의 도식적 표시. (B) 3일 및 6일 후 아그로인필트레이션(dpi) ECFP에 융합된 조립체 펩티드들의 발현에 의해 유도된 RPBLA 영상들. 3 및 6 dpi 영상들에 도시된 바(bar)는 각각 5 및 2 마이크로미터에 해당한다.
도 7. (A)는 성인 RX3, PP, 및 PA 조립체 펩티드들의 서열 정렬. 세 펩티드들 간 동일성은 굵게 표시되고, 시스테인 잔기는 회색 박스로 표시된다. SP는 신호 펩티드를 나타낸다. (B)는 PP-ECFP, PA-ECFP, 및 RX3-ECFP를 발현하는 담배 잎들의 균질화액들의 등가량들의 항-GFP 웨스턴 블롯. 화살표는 융합 단백질을 표시한다. (C) RX3-ECFP, PP-ECFP, 및 PA-ECFP를 발현하는 담배 잎 세포들의 공초점 현미경 영상. RPBLA는 화살표로 표시된다.
도 8. (A) ECFP에 융합된 RX3 조립체 펩티드에서 시스테인 잔기들의 위치들을 보여주는 도식. (B) 담배 잎들의 총 단백질 분석을 보여주는 SDS-PAGE/쿠마시 블루 염색(상측 패널) 및 항-GFP 면역블롯(하측 패널): 형질전환되지 않은 담배(레인 1); RX3-ECFP 발현 담배(레인 2); RX3 Cys7 발현 담배(레인 3); RX3 Cys9 발현 담배(레인 4); RX3 Cys64 발현 담배(레인 5); RX3 Cys82 발현 담배(레인 6); RX3 Cys84 발현 담배(레인 7); RX3 Cys92 발현 담배(레인 8); RX3 Cys7-Cys9 발현 담배(레인 9); 및 RX3 Cys82- Cys84- Cys92 발현 담배(레인 10). 화살표는 RX3-ECFP 및 RX3-ECFP Cys 돌연변이체들이 전기영동 밴드를 나타내고, 화살촉은 추가적인 면역활성 밴드를 나타낸다. (C-K) ECFP에 융합된 RX3-Cys 돌연변이체로 형질전환된 상피세포들의 형광 패턴을 보여주는 공초점 영상들. C-H의 바는 10 μm에 해당한다. I-K의 바는 20 μm에 해당한다.
도 9. (A) 성숙한 PP 및 PP2의 서열 정렬. 두 펩티드들 간 동일성은 굵게 표시되고, 시스테인 잔기는 회색 박스로 표시된다. SP는 신호 펩티드를 나타낸다. (B) PP 및 PP2로부터 PPII 나선의 도식 표시. 시스테인 잔기들이 표시되어 있다. (C) PP2-GFP를 발현하는 담배 잎 세포들의 공초점 현미경 영상. 좌측 패널은 우측 패널의 확대도이다.
도 10. (A) RD에서 단위들 수의 점진적 감소를 제공하는 ECFP에 융합된 RX3 펩티드의 버전들의 도식 표시. 단위들은 번호가 매겨진 회색 박스들로 도시되어 있고, 시스테인 잔기들은 별표로 표시되어 있다. SP는 감마 제인으로부터 신호 펩티드를 나타낸다. PX는 프로-X 도메인을 나타낸다. N1 및 N2는 비반복성 서열들을 나타낸다. (B) RX3-, R8(4C)-, R7(4C)-, R6(4C)- 및 R4(4C)-ECFP 융합 단백질(화살표)을 발현하는 담배 잎들로부터 등가량의 균질화액들의 단백질 패턴을 보여주는 쿠마시 블루로 염색된 SDS-PAGE 겔. (C) R8(4C)-, R6(4C)- 및 R4(4C)-ECFP를 발현하는 담배 잎 세포들의 공초점 현미경 영상. 삽입도 내 화살표는 RPBLA를 표시한다. 바는 전체 영상에서 20 마이크로미터에, 그리고 삽입도 내에서 5 마이크로미터에 해당한다.
도 11. (A, B, 및 C) RX3, RX3(A), 및 RX3(E) 펩티드(각각, A, B 및 C)에 융합된 mCherry 형광 단백질을 발현하는 담배 잎 세포들의 공초점 현미경 영상. (A', B', 및 C') RPBLA(화살촉)를 강조하기 위한 A, B 및 C 영상의 고배율 영상. 화살표는 분비된 RX3-mCherry를 보여준다. 막대는 5 마이크로미터에 해당한다.
도 12. (A) RX3-, RX3(E)- 및 RX3(A)-EGF의 발현으로 유도된 RPBLA의 저속 원심분리에 의한 회수를 비교하는 웨스턴 블롯. 맑게 된 균질화액(레인 1), 원심분리에 의한 RPBLA 회수 후 상청액(레인 2), 세척 단계 상청액(레인 3), 및 세척 단계 후 원심분리로 회수된 RPBLA(레인 4)가 도시되어 있다. (B) 온순 조건들에서 인큐베이션 후 가용화된 RX3(E)-EGF(레인 1), RX3(A)-EGF(레인 2), 및 RX3-EGF(레인 3)를 보여주는 웨스턴 블롯. 해당 용융 단백질의 가용화되지 않은 부분은 10’ 동안 16000 x g로 원심분리에 의해 회수되었고, 레인 4, 5, 및 6에 각각 도시되어 있다. (C) PP-, PA-, RX3(E)-, 및 RX3-EGF를 발현하는 담배 잎들로부터 등가량의 균질화액들의 웨스턴 블롯 분석. (D) 저속 원심분리에 의해 분리된 해당 RPBLA(각각 레인 1, 4 및 7)로부터 가용화된 RX3(E)-EGF(레인 2), PP-EGF(레인 5), 및 PA-EGF(레인 8) 융합 단백질을 보여주는 웨스턴 블롯. 나머지 가용화되지 않은 융합 단백질은 레인 3, 6, 및 9에 도시되어 있다.
도 13. (A) 저속 원심분리에 의한 RPBLA 분리에서부터 FXa 소화에 의한 융합 단백질 분절까지 RX3(E)-EGF 다운스트림 과정의 SDS-PAGE 실버 염색: 분자 마커(레인 1); 맑게 되기 전 균질화액(레인 2); 여과에 의해 맑게 된 균질화액(레인 3); 원심분리에 의한 RPBLA 회수 후 상청액(레인 4); 세척 단계 상청액(레인 5, 6); 세척 단계 후 원심분리에 의해 회수된 RPBLA(레인 7); 가용화 단계 후 불용 부분(레인 8); wPB로부터 가용화된 융용 단백질(레인 9); 및 분할된 RX3(E)-EGF 융합 단백질(레인 10). (B) 역 상 FPLC에 의한 EGF 정제의 크로마토그램. 화살표는 30%의 아세토니트릴에 해당하는 EGF 피크를 나타낸다. (C) RF-FPLC 입력(레인 1) 및 순수한 EGF를 함유하고 (B)에서 화살표로 나타낸 피크에 해당하는 두 부분(레인 2 및 3)을 보여주는 쿠마시 블루 염색.
도 14. (A) SDS-PAGE 쿠마시 블루 염색(좌측) 및 웨스턴 블롯(우측)은 분리된 RX3(A)-hGH RPBLA를 보여준다. (B) RX3-hGH 및 RX3(A)-hGH의 가용화 효율을 보여주는 항-hGH 웨스턴 블롯. (H0) 맑게 되기전 균질현탁액; (H1) 여과에 의해 맑게 된 균질현탁액, (SN) 원심분리에 의한 RPBLA 회수 후 상청액; (Ws) 세척 단계 상청액; (wPB) 세척 단계후 원심분리에 의해 회수된 RPBLA들; (sPB) wPB로부터 가용화된 융합 단백질; 및 (iPB) 가용화 단계 후 불용 부분.
도 15. (A 및 B) 단백질체 유도 서열(PBIS), 5 글리신 링커((Gly)5), 분절 부위(CS), 뉴 잉글랜드 바이오랩사의 인테인 MxeGyrA (I), 및 목적 단백질(POI)을 나타내는 융합 단백질들의 도식적 표시. CS는 엔테로키나아제 분절 부위(EK) 및 FXa 분절 부위(FXa)이다. POI는 인간 성장 호르몬(hGH), 상피 성장 인자(EGF), 향상된 시안 형광 단백질(ECFP), 엔테로키나아제 프로테아제(EKp), 크실라나아제(Xyl) 및 그린 형광 단백질(GFP)이다. Zera(Adh) 융합 단백질들은 PPII 나선을 형성하는 부착소(adhesion) 절편으로부터 유래된 다음 PBIS에 기반한 융합 단백질이다: Z(Adh), Z(Adh2), Z(Adh)Px 및 Z(Adh2)Px. Zera(Col) 융합 단백질은 PPII 나선을 형성하는 콜라겐 절편으로부터 유래된 다음 PBIS에 기반한 융합 단백질이다: Z(Col), Z(Col 2), Z(Col)Px 및 Z(Col 2)Px.
도 16. (A) 상측 패널은 RX3ΔCys64,82,84,92-ECFP-KDEL (레인 1), RX3-ECFP (레인 2), 및 SP-ECFP-KDEL (레인3)을 발현하는 담배 잎들이 맑게 되기 전 균질화액으로부터 전체 단백질 중 20 마이크로그램의 쿠마시 블루 염색. 하측 패널은 항-GFP 항체에 의한 동일 균질화액의 웨스턴 블롯. 화살표는 융합 단백질을 나타낸다. (B) 침투 3일 및 7일 후 RX3ΔCys64,82,84,92-ECFP-KDEL을 발현하는 담배 잎들의 공초점 현미경 영상. 흰 막대는 5 마이크로미터에 해당한다. (C) 단계별 밀도 구배에 의한 RX3-ECFP (좌측) 및 RX3ΔCys64,82,84,92-ECFP-KDEL (우측)의 밀도 판단. 회수된 부분들의 등가량들은 쿠마시 블루 염색(상측 패널)과 항-GFP 항체를 사용한 웨스턴 블롯(하측 패널)으로 분석되었다. 레인들은 (1) Optiprep^TM 밀도 구배 상에 로딩된 시료, (2) 18% Optiprep^TM 쿠션 이상으로부터 회수된 상청액, (3) 18~30% 사이의 부분, (4) 30~34% 사이의 부분, (5) 34~38% 사이의 부분, (6) 38~42% 사이의 부분, (7) 42~46% 사이의 부분, 및 (8) 펠릿으로 회수된 부분을 보여준다.
도 17. (A) Z(Adh) (서열번호 98), Z(Adh)Px (서열번호 94), Z(Col) (서열번호 100), 및 Z(Col)Px (서열번호 96) 조립자 펩티드들의 서열 정렬. 신호 펩티드(모든 경우들에서 27KDa 감마 제인으로부터)는 보이지 않는다. 밑줄 친 아미노산들(Adh - 서열번호 128; Col- 서열번호 129)은 부착소 또는 콜라겐 유전자들로부터 단백질 절편들에 해당한다. 흑색 바는 PPII 구조를 채택한 높은 성향을 가진 절편들을 나타낸다. (B) Z(Adh)Px-GFP, Z(Col)Px-GFP, Z(Adh)-GFP 및 Z(Col)-GFP (각각, 레인 1 내지 4)를 발현하는 담배 잎들의 등가량(총 단백질 중 20 마이크로그램)으로부터 생긴, 맑아지기 전 균질화액들의 쿠마시 블루 염색. 화살표는 융합 단백질을 표시한다. (C) 좌측에서 우측으로, Z(Adh)-GFP, Z(Col)-GFP, Z(Adh)Px-GFP, 및 Z(Col)Px-GFP를 발현하는 담배 잎들의 공초점 현미경 영상. 흰 막대는 5 마이크로미터에 해당한다. (D) 쿠마시 블루 염색에 의해 분석된 1500 xg의 저속 원심분리에 의해 RPBLA 회수의 다운스트림 과정. 맑아지기 전 균질화액(레인 1)은 1500 xg로 원심분리되었고, 상청액(레인 2)은 버려졌다. 3 라운드의 세척 단계(레인 3~5) 후, RPBLA 부분(레인 6)에 해당하는 펠릿이 얻어졌다. Z(Adh)-GFP (D1), Z(Col)-GFP (D2), Z(Adh)Px-GFP (D3) 및 Z(Col)Px-GFP (D4)를 발현하는 담배 잎들의 등가량에 대하여 수행된 과정이 도시되어 있다.
도 18. (A) 성숙 어셈블러 펩티드들의 도식적 표시: (i) RX3 및 (ii) 역위 RX3 (iRX3). 다른 도메인들의 방위: (N)-말단 절편, (RD, 회색) 반복 도메인 및 (PX) 프로-X 도메인은 화살표로 표시된다. 시스테인 잔기들의 위치가 또한 도시되어 있다. (B) RX3-ECFP, ECFP-RX3, iRX3-ECFP 및 ECFP-iRX3를 발현하는 담배 잎 세포들의 공초점 현미경 영상. RPBLA는 화살표로 표시된다. 막대는 5 마이크로미터에 해당한다. (C) RX3-ECFP, ECFP-RX3, iRX3-ECFP 또는 ECFP-iRX3를 발현하는 담배 식물들의 RPLBA 밀도 판단. 균질화액(레인 1)은 다단 Optiprep 밀도 구배의 상단 위에 로딩되었고, 다음 부분들은 80,000xg로 원심분리 후 회수되었다. (레인 2) 상청액, (레인 3) 1,117 g/cm³ 초과 상간 쿠션, (레인 4) 1.175 g/cm³ 초과 상간 쿠션, (레인 5) 1.21 g/cm³ 초과 상간 쿠션, (레인 6) 1.233 g/cm³ 초과 상간 쿠션, (레인 7) 1.26 g/cm³ 초과 상간 쿠션, 및 (레인 8) 튜브의 하단에서 펠릿. 각 부분의 등가 용적 양들을 항-RX3 항체에 의해 웨스턴 블롯으로 분석하였다.
도 19. (A) CHO 세포들에서 RPBLA로 hGH-iRX3의 축적. 좌측 패널은 CHO 세포들에서 hGH-iRX3 발현에 의해 유도된 RPBLA 밀도의 판단을 보여준다. 균질화액(H)은 다단 수크로오스 밀도 구배로 로딩되었고, 다음 부분들은 80,000xg로 원심분리 후 회수되었다. (S) 상청액, (F27) 27% 초과 상간 수크로오스 쿠션, (F35) 35% 초과 상간 수크로오스 쿠션, (F42) 42% 초과 상간 수크로오스 쿠션, (F56) 56% 초과 상간 수크로오스 쿠션, 및 (P) 튜브의 하단에서 펠릿. 분자 마커들은 좌측에 kDa로 표시되고, hGH-iRX3 융합 단백질의 예상 위치 및 hGH는 우측에 화살촉으로 표시된다. 웨스턴 블롯에서 사용된 항체는 항-hGH에 해당한다. 우측 패널은 포유동물 CHO 세포들에서 hGH-iRX3 융합 단백질의 면역조직화학을 보여준다. 항-hGH 항체로 인큐베이션되었던 hGH-iRX3을 발현하는 CHO 세포들의 공초점 현미경 영상들은 세포내 RPBLA에서 융합 단백질의 축적(화살표)을 보여준다. (B) 포유동물 CHO 세포들에서 EK-RX3 및 DsRED-iRX3 융합 단백질들의 면역조직화학. 좌측 패널은 항체 항-RX3(αR8)로 인큐베이션된 EK-RX3을 발현하는 CHO 세포들의 공초점 현미경 영상들을 보여준다. 우측 패널은 RPBLA들이 DsRED-iRX3고유 형광에 의해 직접 관찰될 수 있다는 것을 보여준다. DsRED-iRX3 융합 단백질을 함유하는 세포내 RPBLA들은 화살표로 표시되어 있다. N은 세포핵에 해당한다. (C) Sf9 곤충 세포들에서 hGH-iRX3의 발현에 의한 RPBLA의 유도. 좌측 패널은 hGH-iRX3을 발현하고 항-hGH 항체로 인큐베이션된 곤충 세포들의 공초점 현미경 영상들을 보여준다. 상측 영상은 백그라운드 라벨링을 보여주는 미감염 Sf9 세포들에 해당한다. 하측 영상은 RPBLA에서 hGH-iRX3 융합 단백질을 발현하는 Sf9 세포(화살표)를 보여준다. 우측 패널은 저속 원심분리에 의한 RPBLA 회수를 보여준다. hGH-I-RX3(레인 1)을 발현하는 Sf9 곤충 세포들의 맑아지기 전 균질화액이 5000Xg로 원심분리되었다. 상청액(레인 2)은 버려졌고 RPBLA(레인 3)를 포함하는 해당 펠릿이 여러 세척 단계(레인 3)에서 얻어졌다. 화살촉은 hGH-I-RX3 융합 단백질의 위치를 나타낸다.

다음은 재조합 단백질체 유사 조립체(RPBLA)의 형성을 위해 유용한 재조합 단백질체 유도 서열(PBIS)들의 기재를 제공한다. 재조합 PBIS는 목적 단백질에 융합될 수 있고, 세포들에서 융합 단백질의 발현에 의해 형성된 RPBLA는 많은 양의 목적 단백질을 단순화하고 효율적으로 정제하기 위해 사용될 수 있다. 아울러, RPBLA는 백신접종과 같은 치료학에서 사용될 수 있다.

본원에서 사용된 섹션 주제들은 단지 구조적 목적을 위한 것으로서 기재된 요지를 한정하는 식으로 해석되지 말아야 한다.

I. 정의

달리 표현적으로 정의되지 않으면, 본원에서 사용된 용어들은 이 기술에서 그 용어들의 통상적 의미에 따라 이해될 것이다. 달리 특정되지 않거나 본문에서 나타내지 않으면, 단수형으로 사용되거나 부정관사(“a”, 또는 “an”)가 달린 용어들은 복수 형태를 포함하고, 그 역도 가능하다. 표준 기술 및 절차들이 본 문서를 통하여 제공되는 이 기술의 종래 방법들 및 다양한 일반적 참증(일반적으로 본원에 참조로 결합된 Sambrook 등, Molecular Cloning: A Laboratory Manual, 2nd ed. (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.을 참조)에 따라 일반적으로 수행된다.

"폴리펩티드", "펩티드", 및 "단백질"이란 용어들은 본원에서 임의 길이의 아미노산들의 고분자들을 지칭하기 위해서 상호 교환적으로 사용된다. 고분자는 선형 또는 분지쇄일 수 있고, 변형된 아미노산들을 포함할 수 있으며, 비아미노산들에 의해 차단될 수 있다. 용어들은 천연적으로 변형되었거나 개입, 예를 들어, 이황화물 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화, 또는 라벨링 성분과의 콘쥬게이션과 같은 임의의 기타 조작 또는 변형에 의해 변형된 아미노산 고분자를 포함한다. 또한, 예를 들어, 이 기술에서 공지된 기타 변형들뿐만 아니라 (예를 들어, 비천연 아미노산 등을 포함하는) 하나 이상의 아미노산 유사체를 포함하는 폴리펩티드가 본 정의 내에 포함된다. 본 발명의 폴리펩티드들은 항체들에 기반하기 때문에, 어떤 실시예들에서, 폴리펩티드들은 단쇄 또는 연관쇄로서 발생할 수 있다고 이해된다.

"융합 폴리펩티드" 또는 "융합 단백질"은 최소 두 개의 폴리펩티드 및 선택적으로 상기 두 개의 폴리펩티드를 하나의 연속적인 폴리펩티드로 작용적으로 연결하는 연결 서열로 구성되는 폴리펩티드이다. 융합 폴리펩티드로 연결된 두 개의 폴리펩티드는 전형적으로는 두 개의 독립적 소스로부터 유래되므로, 융합 폴리펩티드는 정상적으로는 천연적으로 연결되는 것으로 발견되지 않는 두 개의 연결된 폴리펩티드를 포함한다. 두 개의 폴리펩티드는 펩티드 결합에 의해 직접 작용적으로 부착될 수 있고, 혹은 본원에서 설명되거나 그렇지 않으면 이 기술에서 알려져 있는 링커를 통해 간접적으로 연결될 수 있다.

"핵산", "폴리뉴클레오티드", 또는 "핵산 분자"는 뉴클레오티드로 불리는 공유결합된 아단위(subunit)들로 구성되는 고분자 화합물이다. 핵산은 단일 가닥 또는 이중 가닥일 수 있는 폴리리보핵산(RNA) 및 폴리디옥시리보핵산(DNA)을 포함한다. DNA는 cDNA, 유전체 DNA, 합성 DNA, 및 반-합성 DNA를 포함한다.

본문에서 둘 이상의 핵산 또는 폴리펩티드들의 "동일한(identical)" 또는 백분율 "동일성(identity)"이란 용어는 동일하거나, 서열 동일성의 일부로서 임의의 보존적 아미노산 치환을 고려하지 않고서, 최대 일치 (필요하면, 갭을 도입)를 위해 비교 및 정렬시 동일한 뉴클레오티드 또는 아미노산 잔기들의 특정 백분율을 갖는 둘 이상의 서열 또는 아서열을 말한다. 백분율 동일성은 서열 비교 소프트웨어 또는 알고리즘을 사용하거나 시각적 검사에 의해 측정될 수 있다. 아미노산 또는 뉴클레오티드 서열들의 정렬을 얻기 위해 사용될 수 있는 다양한 알고리즘 및 소프트웨어가 이 기술에 공지되어 있다. 서열 정렬 알고리즘의 비제한적 한 가지 예는 Karlin 등, 1990, Proc. Natl. Acad. Sci., 87:2264-2268에 기재되어 있고, Karlin 등, 1993, Proc. Natl. Acad. Sci., 90:5873-5877에서 변형되었으며, NBLAST 및 XBLAST 프로그램 (Altschul et al., 1991, Nucleic Acids Res., 25:3389-3402)에 통합된 알고리즘이다. 어떤 실시예에서, Gapped BLAST가 Altschul et al., 1997, Nucleic Acids Res. 25:3389-3402에 기재된 것처럼 사용될 수 있다. BLAST-2, WU-BLAST-2 (Altschul et al., 1996, Methods in Enzymology, 266:460-480), ALIGN, ALIGN-2 (Genentech, South San Francisco, California) 또는 Megalign(DNASTAR)은 서열들을 정렬하기 위해 사용될 수 있는 추가적인 공용 소프트웨어 프로그램이다. 어떤 실시예에서, 두 개의 뉴클레오티드 서열들 간 백분율 동일성은 GCG 소프트웨어에서 GAP 프로그램을 사용하여 결정된다(예를 들어, NWSgapdna.CMP 매트릭스, 40, 50, 60, 70, 또는 90의 갭 중량, 및 1, 2, 3, 4, 5, 또는 6의 길이 중량). 어떤 대안적 실시예에서, Needleman 및 Wunsch (J. Mol. Biol. 48:444-453 (1970))의 알고리즘을 포함하는 GCG 소프트웨어 패키지에서 GAP 프로그램은 (예를 들어, Blossum 62 matrix 또는 PAM250 matrix 중 어느 하나, 및 16, 14, 12, 10, 8, 6, 또는 4의 갭 중량 및 1, 2, 3, 4, 5의 길이 중량을 이용하여) 두 아미노산 서열들 간 백분율 동일성을 판단하기 위해 사용될 수 있다. 대안적으로, 어떤 실시예에서, 뉴클레오티드 또는 아미노산 서열들 간 백분율 동일성은 Myers 및 Miller (CABIOS, 4:11-17 (1989))의 알고리즘을 사용하여 판단된다. 예를 들어, 백분율 동일성은 ALIGN 프로그램(버전 2.0) 및 잔기 테이블, 12의 갭 길이 페널티, 및 4의 갭 페널티를 가진 PAM120을 이용하여 판단될 수 있다. 특별한 정렬 소프트웨어에 의한 최대 정렬을 위한 적절한 패러미터들은 이 기술에서 통상의 지식을 가진 자에 의해 판단될 수 있다. 어떤 실시예에서, 정렬 소프트웨어의 디폴트 패러미터들이 사용된다. 어떤 실시예에서, 제2 아미노산 서열에 대한 제1 아미노산 서열의 백분율 동일성 "X"는 100 x (Y/Z)로서 계산되고, 여기서 Y는 (시각적 검사 또는 특별한 서열 정렬 프로그램에 의한 정렬시) 제1, 제2 서열들의 정렬에서 동일 대응으로 기록된 아미노산 잔기들의 수이고, Z는 제2 서열에서 잔기들의 총 수이다. 제1 서열의 길이가 제2 서열보다 길면, 제2 서열에 대한 제1 서열의 백분율 동일성은 제1 서열에 대한 제2 서열의 백분율 동일성보다 길 것이다.

비제한적 예로서, 임의의 특별한 폴리펩티드가 기준 서열에 대해 소정의 백분율 서열 동일성(예를 들어, 최소 80% 동일, 최소 85% 동일, 최소 90% 동일, 및 일부 실시예에서 최소 95%, 96%, 97%, 98%, 또는 99% 동일)을 가지는, 어떤 실시예에서, Bestfit 프로그램(Wisconsin Sequence Analysis Package, Version 8 for Unix, Genetics Computer Group, University Research Park, 575 Science Drive, Madison, WI 53711)을 사용하여 판단될 수 있다. Bestfit은 Smith and Waterman의 Advances in Applied Mathematics 2: 482-489 (1981)의 국소 상동성 알고리즘을 사용하여, 두 서열들 간 최적의 상동성 단편을 찾아낸다. 특별한 서열이, 본 발명에 따른 기준 서열과, 예를 들어, 95% 동일한 지를 판단하기 위해 Bestfit 또는 임의의 기타 서열 정렬 프로그램을 사용할 때, 패러미터들은 동일성의 백분율이 기준 뉴클레오티드 서열의 전체 길이에 대해 계산되도록 그리고 기준 서열에서 뉴클레오티드들의 총 수의 5%에 이르는 상동성 갭이 허용되도록 설정된다.

일부 실시예에서, 본 발명의 두 핵산들 또는 폴리펩티드들은, 최대 일치를 위해 비교 및 정렬되어, 서열 비교 알고리즘을 사용하여 또는 시각적 조사에 의해 측정될 때, 이들이 최소 70%, 최소 75%, 최소 80%, 최소 85%, 최소 90%를, 그리고 일부 실시예에서 최소 95%, 96%, 97%, 98%, 99% 뉴클레오티드 또는 아미노산 잔기 동일성을 가진다는 점에서 실질적으로 동일하다. 동일성은 최소 약 10, 약 20, 약 40~60개 길이인 잔기들 또는 그 사이의 임의 필수 값인 서열들의 영역에 대해 존재할 수 있고, 60~80 잔기들보다 더 긴, 예를 들어 90~100 잔기들의 영역에 대해 존재할 수 있고, 일부 실시예에서, 서열들은, 예를 들어 뉴클레오티드 서열의 코딩 영역과 같이, 서열들이 비교되는 전체 길이에 대해 실질적으로 동일하다.

"벡터"라는 용어는 숙주 세포에서 관심이 있는 하나 이상의 유전자(들) 또는 서열(들)을 전달, 및 선택적으로 발현할 수 있는 컨스트럭트를 의미한다. 벡터의 예는, 이들에 한정되지는 않지만, 바이러스 벡터, 네이키드 DNA 또는 RNA 발현 벡터, 플라스미드, 코스미드 또는 파지 벡터, 양이온 축합제와 관련된 DNA 또는 RNA 발현 벡터, 리포좀 내에 캡슐화된 DNA 또는 RNA 발현 벡터, 및 프로듀서 세포와 같은 소정 진핵세포가 있다. 벡터는 안정할 수 있고 자기 복제가능하다. "발현 벡터"는 사용 가능하게 관련된 유전자들의 발현을 안내할 수 있는 벡터이다.

"프로모터"는 코딩 서열 또는 기능성 RNA의 발현을 조절할 수 있는 DNA 절편을 말한다. 일반적으로, 코딩 영역은 프로모터에 대해 3'에 위치된다. 프로모터들은 전부 재래종 유전자로부터 유래될 수 있고, 혹은 자연에서 발견되는 다른 프로모터들로부터 유래된 다른 요소들로 구성되거나, 심지어 합성 DNA 절편들로 구성될 수 있다. 다른 프로모터들은 유전자의 발현을 다른 조직 또는 세포 타입으로, 혹은 다른 발전 단계로, 또는 다른 환경 또는 생리학적 조건들에 대한 반응으로 안내할 수 있다는 것을 이해한다. 대부분의 세포 유형들에서 대부분의 시간에 유전자가 발현되도록 하는 프로모터는 공통적으로 "항시성 프로모터(constitutive promoter)"라 부른다. 대부분의 경우, 조절 순서의 정확한 경계는 완전히 정의되지 않았기 때문에, 다른 길이이 DNA 절편들은 동일한 프로모터 활성을 가질 수도 있다고 추가로 인식된다. 프로모터는 일반적으로 전사 시작 부위에 의해 그의 3' 말단에 결속되고 업스트림(5' 방향)로 연장되어 최소 수의 염기들 또는 배경을 넘어서 검출가능한 레벨에서 전사를 시작하기 위해 필요한 요소들을 포함한다. 프로모터 내에서 RNA 폴리머라제의 결속에 대한 책임이 있는 단백질 결합 도메인(공통서열)뿐만 아니라 전사 시작 부위(편리하게는 예를 들어 뉴클레아제 S1과 맵핑에 의해 정의됨)가 발견될 것이다.

본원에서 사용된 것처럼, "이종(heterologous)의"라는 용어는 내생 소스 이외의 소스로부터 유래된 벡터, 플라스미드 또는 숙주 세포의 요소를 말한다. 그러므로, 예를 들어, 이종 서열은 동일 숙주로부터, 숙주 세포의 다른 종으로부터, 또는 다른 분류 군(예를 들어, 계, 문, 강, 목, 과, 속 또는 종, 또는 이들 분류들 중 하나 이내의 아군)의 유기체로부터 다른 유전자 또는 플라스미드로부터 유래된 서열일 수 있다. "이종의"라는 용어는 또한 본원에서 "외생의(exogenous)"라는 용어와 유사하게 사용된다.

DNA 또는 RNA "코딩 영역"은 적절한 조절 서열들의 제어 하에 놓여 있을 때 생체 외 또는 생체 내 세포의 폴리펩티드로 전사되고/거나 번역되는 DNA 또는 RNA 분자이다. "적합한 조절 영역"은 코딩 영역 내 코딩 영역의 업스트림(5' 비-코딩 서열) 또는 다운스트림(3' 비-코딩 서열)에 위치되고, 전사, RNA 가공 또는 안정화, 또는 관련 코딩 영역의 번역에 영향을 미치는 핵산 영역을 말한다. 조절 영역은 프로모터, 번역 리더 서열, RNA 가공 부위, 효과기 결합 부위 및 줄기-루프 구조를 포함할 수 있다. 코딩 영역의 경계는 5’ (아미노) 말단에서 시작 코돈 및 3' (카복실) 말단에서 번역 중단 코돈에 의해 결정된다. 코딩 영역은, 이에 한정되지는 않지만, 원핵 영역, mRNA로부터 cDNA, 게놈 DNA 분자, 합성 DNA 분자, 또는 RNA 분자들을 포함할 수 있다. 코딩 영역이 진핵 세포 내에서 발현을 위해 의도되면, 폴리아데닐화 신호 및 전사 종료 서열은 보통 코딩 영역에 대해 3'에 위치될 것이다.

"오픈 리딩 프레임(Open reading frame)"은 약어로 ORF이고, 번역 시작 신호 또는 시작 코돈, 예를 들어 ATG 또는 AUG, 및 종료 코돈을 포함하며, 잠재적으로 폴리펩티드 서열로 번역될 수 있는 DNA, cDNA, 또는 RNA 중 하나인 핵산의 길이를 의미한다.

코딩 영역은, RNA 폴리머라아제가 코딩 영역을 mRNA (이는 이후 (코딩 영역이 인트론들을 포함하면) 트랜스-RNA로 끝이 붙어서 코딩 영역에 의해 인코딩된 단백질로 번역됨)로 전사할 때, 세포 내 전사 및 번역 조절 요소들의 "조절 하"에 있다.

"전사 및 번역 조절 영역"은 프로모터, 인핸서(enhancer), 종결신호 등과 같이, 숙주 세포에서 코딩 영역의 발현을 가능하게 하는 DNA 조절 영역이다. 진핵 세포들에서, 폴리아데닐화 신호는 조절 영역이다.

"작동가능하게 관련된(operably associated)" 및 "작동가능하게 연결된(operably linked)"은 두 개의 분자들 중 하나의 기능이 다른 것에 영향을 받게 되는 두 분자들의 관련성을 말한다. 예를 들어, 프로모터가 코딩 영역의 발현에 영향을 미칠 수 있을 때(즉, 코딩 영역이 프로모터의 전사조절 하에 있을 때), 프로모터는 코딩 영역과 작동가능하게 관련된다. 코딩 영역은 센서 방위 또는 안티센서 방위에서 조절 영역에 작동가능하게 관련될 수 있다. 직접(예를 들어, 융합 단백질) 부착되는지 아니면 간접(예를 들어, 링커를 경유) 부착되던지, 두 개의 분자들은 "작동가능하게 연결"되어 있다.

본원에서 사용된 것처럼, "발현"이란 용어는 핵산 템플릿으로부터 RNA(예: mRNA)의 전사 및/또는 mRNA의 폴리펩티드로의 번역을 말한다. "발현의 증가"라는 용어는 증가된 mRAN 생산의 레벨로 그리고/또는 폴리펩티드 발현의 레벨로 유전자 발현의 변화를 포함하도록 한 것으로서, 유전자 생성물 또는 단백질의 양의 증가로 이어진다. 일부 예에서, "발현의 증가"는 "과발현" 또는 "과발현된"이라는 용어와 상호 교환적으로 사용된다.

"선택가능한 마커"는 그의 발현이 검출가능한 표현형을 생성하고 선택가능한 마커를 갖는 플라스미드를 포함하는 숙주 세포들의 검출을 쉽게 하는 유전자이다. 선택가능한 마커들의 비제한적 예들은 약물 저항성 유전자 및 영양성 마커들을 포함한다. 예를 들어, 선택가능한 마커는 암피실린, 카나마이신, 에리트로마이신, 클로람페니콜, 젠타마이신, 카수가마이신, 리팜피신, 스펙티노마이신, D-시클로세린, 날리딕스산, 스트렙토마이신, 또는 테트라시클린으로 구성되는 군으로부터 선택된 항생체에 대한 저항성을 부여하는 유전자일 수 있다. 선택 마커의 기타 비제한적 예들은 아데노신 데아미나아제, 아미노글리코시드, 포스포트란스페라아제, 디하이드로폴레이트 리덕타아제, 하이그로마이신-B-포스포트란스페라아제, 티미딘 키나아제, 및 크산틴-구아닌 포스포리보실트란스페라아제를 포함한다. 단일 플라스미드는 하나 이상의 선택가능한 마커를 포함할 수 있다.

본원에서 사용된 것처럼, "처치하다(treat)" 또는 "처치(treatment)"라는 용어는 치료적 처치 및 예방적 조치들을 말하고, 여기서 목적은 암의 생성 및 전파와 같은 원치않는 생리학적 변화 또는 장애를 예방 또는 늦추기(경감하기) 위한 것이다. 이익이 되거나 원하는 임상 결과는, 이에 한정되지는 않지만, 검출 가능하든 검출 불가능하든 징후의 완화, 질병 정도의 감소, 질병의 안정된 상태(즉, 악화되지 않음), 질병 진행의 지연 또는 감속, 질병 상태의 개선 또는 완화, 및 (부분적이든 전체적이든) 차도를 포함한다. "처치"는 또한 처치를 받지 않았을 때의 예상 생존에 비해 더 긴 생존을 의미할 수 있다. 처치가 필요한 사람들은 병적 상태 또는 장애를 갖기 쉬운 사람들 또는 병적상태 또는 장애가 예방될 사람들뿐만 아니라 이미 병적상태 또는 장애를 가진 사람들을 포함한다.

"대상(subject)" 또는 "개인(individual)" 또는 "동물" 또는 "환자" 또는 "포유류"는 임의 대상, 특히 진단, 예후, 또는 치료가 요구되는 포유류 대상을 의미한다. 포유류 대상들은 인간, 개, 고양이, 기니 피그, 토끼, 쥐, 마우스, 말, 소, 젖소 등과 같은 가축, 농경용 동물, 및 동물원, 스포츠 또는 애완 동물을 포함한다.

II . 재조합 단백질체 유도 서열( PBIS )

단백질체 유도 서열(PBIS)은 배젖 조직 이외로부터의 세포에서 단백질체 또는 RPBLA의 형성을 중재할 수 있는 폴리펩티드 서열로서, 이는 아래에 더욱 상세히 기재되어 있다. RPBLA의 형성을 중재하는 후보자 PBIS의 능력은 (i) 본 발명의 실시예 1에 기재된 것처럼, 식물 세포에서 후보자 PBIS의 융합 단백질 및 형광 단백질을 발현함에 의한 형광 집합체의 검출; (ii) 본 발명의 실시예 2에 기재된 것처럼, 밀도 구배에서 후보자 PBIS를 발현하는 식물 추출물의 분할에 의해 약 1.175 내지 약 1.194의 밀도를 갖는 집합체의 검출; (iii) 본 발명의 실시예 3에 기재된 것처럼, 저속 원심분리(전형적으로 4°C에서 30분간 10,000 x g) 후 침전물에서 웨스턴 블롯에 의한 후보자 PBIS의 확인과 같이, 통상의 지식을 가진 자에게 이용가능한 기술을 이용하여 결정될 수 있다.

천연 발생 PBIS는 옥수수 단백질 감마-제인에서 확인되었고 미국특허 제7,575,898호, 미국 공개출원번호 제2006/0121573호, 미국 공개출원번호 제2006/0123509, 및 미국 공개출원번호 제2007/0243198호에 상세히 기재되어 있으며, 이들 각각은 전체가 참조로서 포함된다.

놀랍게도, 개선된 성질을 갖는 재조합 단백질체 유사 조립체(RPBLA)의 형성을 중재하는 재조합 PBIS는 확인되었고 본원에 기재되어 있다. 일부 실시예에서, 재조합 PBIS는 폴리프롤린 II(PPII) 구조를 포함한다. 일부 실시예에서, 재조합 PBIS는 프롤린 풍부 서열을 포함한다.

제1 양태에서, 본 발명은 길이가 최소 36개의 아미노산들인 폴리프롤린 II(PPII) 구조를 포함하는 재조합 단백질체 유도 폴리펩티드 서열(PBIS)에 관한 것으로서;

상기 PPII 구조는 서열 (PPPVHL)₆. (서열번호 1)을 포함하지 않는다.

바람직한 실시예에서, PPII 구조는 WO2004003207에 기재된 바와 같이 P4 서열로 구성되지 않고 서열 QPPPPVHLPPPPCHYPTQPPRPQPHPQPHP (서열번호 130)을 가진다.

바람직한 실시예에서, PPII 구조는 서열 (PPPVHL)₆PPPVHVPPPVHL (서열번호 2)로 구성되지 않거나, 서열 (PPPVHL)₆PPPVHVPPPVHLPPPPCH (서열번호 3)을 포함하지 않는다.

바람직한 실시예에서, PPII 구조는 최소 37, 최소 38, 최소 39 또는 최소 40개의 아미노산들을 갖는다. 다른 실시예에서, PPII 구조는 시스테인 잔기들을 포함하지 않는다. 또 다른 실시예에서, PPII 구조는 단지 10%의 히스티딘 잔기들을 포함한다.

제2 양태에서, 본 발명은 길이가 최소 36개의 아미노산들인 프롤린 풍부 서열을 포함하는 재조합 단백질체 유도 폴리펩티드 서열(PBIS)에 관한 것으로서;

상기 프롤린 풍부 서열에서 단지 10%의 아미노산들은 리신 또는 아르기닌이고, 상기 프롤린 풍부 서열은 서열 (PPPVHL)₆ (서열번호 1)을 포함하지 않는다.

바람직한 실시예에서, 상기 프롤린 풍부 서열은 WO2004003207에 기재된 바와 같이 P4 서열의 PBIS로 구성되지 않고 서열 QPPPPVHLPPPPCHYPTQPPRPQPHPQPHP (서열번호 130)을 가진다.

바람직한 실시예에서, 상기 프롤린 풍부 영역은 서열 (PPPVHL)₆PPPVHVPPPVHL (서열번호 2)를 포함하지 않거나, 서열 (PPPVHL)₆PPPVHVPPPVHLPPPPCH (서열번호 3)을 포함하지 않는다.

바람직한 실시예에서, 상기 프롤린 풍부 서열은 최소 37, 최소 38, 최소 39 또는 최소 40개의 아미노산들을 갖는다. 또 다른 바람직한 실시예에서, 프롤린 풍부 영역은 시스테인 잔기들을 포함하지 않는다. 또 다른 실시예에서, 상기 프롤린 풍부 영역은 단지 10%의 히스티딘 잔기들을 포함한다.

혹은 WO2004003207에 기재된 바와 같이 P4 서열로 구성되지 않고 서열 QPPPPVHLPPPPCHYPTQPPRPQPHPQPHP (서열번호 130)을 가진다.

일부 실시예에서, 상기 재조합 PBIS는 N 말단 상 최소 두 개의 시스테인 및 C 말단 상 최소 두 개의 시스테인 사이에 PPII 구조를 포함하고, 상기 PPII 구조 및 상기 두 개의 C-말단 시스테인 사이에 추가 시스테인 및 프롤린 풍부 서열을 더 포함한다.

일부 실시예에서, 상기 재조합 PBIS는 N 말단 상 최소 두 개의 시스테인 및 C 말단 상 최소 두 개의 시스테인 사이에 제1 프롤린 풍부 서열을 포함하고, 상기 제1 프롤린 풍부 서열 및 상기 두 개의 C-말단 시스테인 사이에 추가 시스테인 및 제2 프롤린 풍부 서열을 더 포함한다.

일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열에서 아미노산들 중 단지 약 10%가 리신 또는 아르기닌이다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열 내 아미노산의 약 9%, 약 8%, 약 7%, 약 6%, 약 5%, 약 4%, 약 3%, 약 2% 또는 약 1%만이 리신 또는 아르기닌이다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 리신을 함유하지 않는다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 아르기닌을 함유하지 않는다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 리신 또는 아르기닌을 함유하지 않는다.

일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열에서 아미노산들 중 단지 약 15%가 히스티딘이다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열 내 아미노산의 약 14%, 약 13%, 약 12%, 약 11%, 약 10%, 약 9%, 약 8%, 약 7%, 약 6%, 약 5%, 약 4%, 약 3%, 약 2% 또는 약 1%만이 히스티딘이다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 히스티딘을 함유하지 않는다.

일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 서열 (PPPVHL)₆PPPVHVPPPVHL (서열번호 2)을 포함하지 않는다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 서열 (PPPVHL)₆PPPVHVPPPPVHLPCH (서열번호 3)을 포함하지 않는다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 서열 PPPVHL (서열번호 4)을 포함하지 않는다.

일부 실시예에서, 상기 재조합 PBIS는 특별한 최소 농도로 발현시 RPBLA의 형성을 중재할 수 있다. 이처럼, 일부 실시예에서, 상기 재조합 PBIS는 약 0.5 그램/kg의 담배 잎 생중량에서 발현시 RPBLA의 형성을 중재할 수 있다.

PBIS로 작용하는 재조합 서열의 능력은 본원에 기재된 방법 또는 이 기술에 공지된 기타 방법에 따라 검사될 수 있다.

III . 폴리프롤린 II 구조 및 프롤린 풍부 서열

위에서 기재된 것처럼, 본원에서 사용된 재조합 PBIS는 폴리프롤린 타입 II (PPII) 구조를 포함할 수 있다.

본원에서 사용된 바와 같이, “폴리프롤린 II" 또는 "PPII"라는 용어는 나선형 2차 단백질 구조의 한 유형이다. 예시적인 PPII 구조의 특별한 특징들은, 예를 들어, Eisenberg 등, J. Mol. Biol. 179: 125-142 (1984), Bicudo 등, (2008, Biopolymers, 89:175-178) Fernandez-Carneado, J. Mol. Biol. 372: 708-22 (2004); Bochicchio and Tamburro, Chirality 14:782-92 (2002); Knighton 등. Science 253: 414-420 (1991); 및 Caldwell 등. Biopolymers 10:1891-1904 (1984)에 기재되어 있고, 이들 각각은 전체내용이 본원에 참조로 포함되어 있다.

PPII 나선은 2차 단백질 구조이다. 이는 전체 형상이 삼각 프리즈을 닮은 좌선성 나선 구조이다. 이는 회전당 9.3 Å의 나선 피치, 회전당 3 잔기, 및 각각 -75° 및 145°를 중심으로 Φ각 및 ψ각을 갖고서 꽤 연장될 수 있다.

PPII 구조는 문헌에 기재되어 있다(예를 들어, 전체가 본원에 참조로 포함되어 있는 Eisenberg D, et al. J. Mol. Biol. 179:125-142 (1984) 참조). 프롤린 잔기는 PPII 나선에서 매우 선호된다. 글리신 및 티로신은 일반적으로 선호되지 않지만, 콜라겐과 같은 일부 PPII 구조에서 발견된다. 감마 제인의 히스티딘이 Ala, Glu, 및 Lys로 치환된 반복 서열의 합성 펩티드의 배좌해석은 이들 펩티드 모두가 PPII 타입 구조를 채택하였다는 것을 나타낸다. 그러므로, PPII 구조는 대전된 아미노산(Lys 또는 Glu) 및 대전되거나 대전되지 않은 잔기(Ala)에 대해 대전 부호 양자에 무관하게 채택된다(Dalcol, J. Org. Chem 61: 6775-6782 (1996) 참조). 반복 서열의 길이, 산성 pH, 및 높은 펩티드 농도는 PPII 함량을 증가시켰다. 히스티딘이 글루탐산으로 치환되었을 때를 제외하고, pH 7에서보다 pH 3.0에서 PPII 함량은 더 많다. 이 경우, PPII의 불안성은 아마도 pH 3에서 글루탐산의 카르복실 기들의 양성자 첨가 및 수소 결합에 의한 측쇄들간 후속 상호작용에 기인한다.

PPII 구조는 단백질의 동적 특징이다. Bicudo 등(2008, Biopolymers, 89:175-178)은, 환원제를 이용하거나 이용하지 않고서 물, SDS 및 2-프로판올에 가용화될 때 원평광 이색성에 의해 옥수수 PB들로부터 정제된 감마 제인의 2차 구조를 분석하였다. PPII 구조는 SDS에서 단지 1%, 프로판올에서 4%, 그리고 물에서 약 7%였다. RD가 전체 감마-제인 서열의 22%을 나타낸다는 것을 고려하면, 이들 결과들은 이 도메인의 최소 30%가 물에서 PPII 구조를 채택할 것이라는 것을 나타낸다(Fernandez-Carneado, J. Mol. Biol. 372: 708-22 (2004); Bicudo, 2007). 또한, PPII의 크기는 단백질 조립체 및 PB들의 형성을 이끄는 제인-제인 상호작용에 의해 크게 증가될 수 있다. 그러므로, 폴리펩티드들은 그들이 PPII 구조를 형성하는 경향을 가지면 PPII 구조를 갖는 것으로 생각된다.

서열이 PPII 구조를 형성하는 지를 판단하는 방법들 또한 알려져 있다. 예를 들어, 원편광 이색성(CD), 진동 원편광 이색성(VCD), 및 라만 광학 활성(ROA)과 같은 광학 활성에 기반한 분광학이 사용될 수 있다. 전체가 본원에 참고로 포함된 Bochicchio and Tamburro, Chirality 14:782-92 (2002)를 참조. 아울러, 결정화된 단백질에서 PPII 구조는 X-ray 분석으로 판단될 수 있다. Knighton et al. Science 253: 414-420 (1991); Caldwell et al. Biopolymers 10:1891-1904 (1984). CD는 2차 구조에 매우 민감하다. 그래서, 일부 실시예에서, PPII 구조를 판단하는 방법은 CD이다. 길이가 약 30 내지 100 아미노산인 펩티드의 CD 스펙트럼은 약 pH 7 및 약 5℃에서 판단될 수 있다. PPII 구조의 존재는 약 λ=202 nm에서 최소값을 그리고 약 λ=228 nm에서 최대값을 갖는 CD 패턴을 특징으로 한다. 시료 펩티드에서 PPII 구조의 백분율은 H-(Pro)n-OH 기준 펩티드에 대한 시료 펩티드의 [θmax]M (최대 약 λ=228 nm에서 몰 타원율) 크기의 비로 결정될 것이다. 시료 펩티드와 유사한 길이를 갖는 기준 펩티드는 100% PPII 구조를 갖는 것으로 생각될 수 있다. PPII 구조를 판단하기 위한 CD 스펙트럼 기반의 방법에 대한 더욱 자세한 기재는 Dalcol 등. Org. Chem. 61: 6675-6782 (1996)에 나타나 있다.

예를 들어, 폴리-프롤린 펩티드 (H-(Pro)n-OH)는 기준으로 간주될 수 있고 100% PPII 나선을 형성하는 것으로 간주될 수 있다. 일부 실시에에서, PPII 구조의 [θ max]M 은 기준 폴리펩티드((H-(Pro)n-OH)의 최소 약 25%, 최소 약 30%, 최소 약 40%, 최소 약 55%, 최소 약 60%, 최소 약 65%, 최소 약 70%, 최소 약 75%, 최소 약 80%, 최소 약 85%, 최소 약 90%, 최소 약 95%, 또는 [θ max]M의 100%이다.

위에서 기재된 바와 같이, 재조합 PBIS는 프롤린 풍부 서열을 포함할 수 있다. 일부 실시예에서, PPII 구조는 프롤린 풍부 서열을 포함한다. 일부 실시예에서, 재조합 PBIS는 PPII 구조 및 PPII 나선을 형성하는 경향을 갖지 않는 프롤린 풍부 서열을 포함한다. 일부 실시예에서, 프롤린 풍부 서열은 PPII 구조를 형성할 수 있다.

본원에서 사용된 "프롤린 풍부 영역(proline-rich region)"이란 용어는 상대적으로 높은 프롤린 비율을 포함하는 폴리펩티드 서열을 말한다. 일부 실시예에서, 상기 프롤린 풍부 영역은 최소 40%, 최소 50%, 최소 60%, 최소 70%, 최소 80%, 최소 90%, 최소 95%, 최소 96%, 최소 97%, 최소 98%, 최소 99%, 또는 100% 프롤린을 포함한다.

일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 길이가 30 아미노산이다. 일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 길이가 최소 32, 최소 34, 최소 36, 최소 38, 최소 40, 최소 42, 최소 44, 최소 46, 또는 최소 48 아미노산이다.

일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 길이가 100 이하, 98이하, 96 이하, 94 이하, 92 이하, 90 이하, 88 이하, 86 이하, 84 이하, 82 이하, 80 이하, 78 이하, 76 이하, 74 이하, 72 이하, 70 이하, 68 이하, 66 이하, 64 이하, 62 이하, 60 이하, 58 이하, 56 이하, 54 이하, 또는 52 이하 아미노산이다.

일부 실시에에서, PPII 구조 또는 프롤린 풍부 서열은 길이가 약 36 내지 약 100 아미노산, 약 36 내지 약 90 아미노산, 약 36 내지 약 80 아미노산, 또는 약 36 내지 약 70 아미노산이다. 일부 실시에에서, PPII 구조 또는 프롤린 풍부 서열은 길이가 약 42 내지 약 100 아미노산, 약 42 내지 약 90 아미노산, 약 42 내지 약 80 아미노산, 또는 약 42 내지 약 70 아미노산이다. 일부 실시에에서, PPII 구조 또는 프롤린 풍부 서열은 길이가 약 48 내지 약 100 아미노산, 약 48 내지 약 90 아미노산, 약 48 내지 약 80 아미노산, 또는 약 48 내지 약 48 아미노산이다.

일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15 PX 반복(repeat)을 포함한다. 일부 실시예에서, PX 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 연속 반복이다. 일부 실시예에서, PX 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 동가 동의(homomeric)이다. 일부 실시예에서, PX 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 이가 동의(heteromeric)이다.

일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15개의 3-아미노산 반복(예를 들어, PPX, PXP, XPP, 또는 PXX)을 포함한다. 일부 실시예에서, 3-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 연속 반복이다. 일부 실시예에서, 3-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 동가 동의이다. 일부 실시예에서, 3-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 이가 동의이다.

일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15개의 4-아미노산 반복(예를 들어, PPPX (서열번호 119), PPXX (서열번호 117), PXXX (서열번호 137), PPXP (서열번호 138), PXPP (서열번호 139))을 포함한다. 일부 실시예에서, 4-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 연속 반복이다. 일부 실시예에서, 4-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 동가 동의이다. 일부 실시예에서, 4-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 이가 동의이다.

일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15개의 5-아미노산 반복(예를 들어, PPPXX(서열번호 140))을 포함한다. 일부 실시예에서, 5-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 연속 반복이다. 일부 실시예에서, 3-아미노산 반복 5-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 동가 동의이다. 일부 실시예에서, 5-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 이가 동의이다.

일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15개의 6-아미노산 반복(예를 들어, PPPXX(서열번호 116) 또는 PPPXPX (서열번호 141))을 포함한다. 일부 실시예에서, 6-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 연속 반복이다. 일부 실시예에서, 6-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 동가 동의이다. 일부 실시예에서, 6-아미노산 반복의 최소 2, 최소 3, 최소 4, 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 11, 최소 12, 최소 13, 최소 14, 또는 최소 15가 이가 동의이다.

일부 실시예에서, PPI 구조 또는 프롤린 풍부 영역은 양친매성 분자들이다.

양친매성 분자는 그 영역과 비교해 볼 때 소수성인 나머지 분자에 비해 상당히 더 높은 소수성 특성을 갖는 영역을 가진 분자이다. 분자 또는 그의 영역의 소수성 또는 친수성 특성은 주변 매질에 대한 그의 거동에 대해 중요한 효과를 가진다. 소수성 표면은 수용성 매질과 상호작용을 피하려는 경향이 있고, 반면에 친수성 표면은 상호작용에 의해 안정화된다. 단백질은 3차원 구조이므로, 그의 아미노산 잔기들 중 일부가 매질에 노출된다. 그 결과, 표면에 위치되어서 매질에 노출된 아미노산들만이 단백질 또는 단백질 영역의 특성이 소수성, 친수성, 또는 양친매성인지를 판단함에 있어서 고려되어야 한다.

본원에서 언급된 바와 같이, PPII 구조는 회전당 세 개의 아미노산을 가진 연장된 좌선성 나선이다. 각 1회전은 시계방향 순서로 삼각형의 꼭지점들 중 하나에 위치된 회전에서 3 아미노산들 중 각 하나를 가진 삼각형(예: 도 1A)으로 표시될 수 있다. 그 결과, PPII 구조의 연속적 삼각형들(회전들)의 적층은 단백질 또는 단백질 영역의 전체 구조를 나타내는 삼각형 프리즘을 생성할 것이다. PPII 나선에서, 삼각형 프리즘의 에지에 놓인 아미노산들은 매질에 노출되어 모두 소수성/친수성 판단에서 고려되어야 한다. 삼각 프리즘의 에지들 중 하나가 독립적이라고 여져지는 나머지 두 에지들에 대해 상당히 다른 소수성 특성을 가질 때, PPII 구조는 양매성으로 여겨질 수 있다.

아미노산들의 소수성/친수성 특성은 그의 측쇄의 성질에 의해 판단된다. Kyte-Doolittle 소수성 스케일(Kyte J., Doolittle R.F., J. Mol. Biol. 157:105-132(1982))은 아미노산 측쇄들의 물리화학적 성질들로부터 유래되고, 공통적으로 사용되며 잘 수용된다. 아미노산들은 Kyte-Doolittle 값에 따라 세 가지 군으로 분류될 것이다: (i) 비극성 또는 소수성으로 여겨질 4,5 내지 1,8 범위의 아미노산 (I, V, L F C, M 및 A), (ii) 부분적 극성 또는 부분적 친수성으로 여겨질 -0,4 내지 -1,6 범위의 아미노산 (G, S, T, W, Y 및 P), 그리고 극성이자 친수성으로 여겨질 -3,2 내지 -4,5 범위의 아미노산 (R, H, D, E, N, Q 및 K). 극성인 군의 아미노산들 중에서, 양으로 대전(R, H, 및 K), 음으로 대전(D 및 E), 미대전된(Q 및 N) 아미노산들을 찾을 수 있다. PPII 나선의 소수성의 계산을 간략화하기 위해, 이 분류를 고려한 공통 극성 값을 할당받았다: (i) 비극성 아미노산의 경우 0, (ii) 부분 극성 아미노산의 경우 0,5, 및 (iii) 극성 아미노산의 경우 1.

PPII 구조의 양친매성 특성은 삼각 프리즘에서 공간 아미노산 분포의 맥락에서 본원에 기재된 아미노산 분류를 고려하여 계산될 수 있다. 친수성 아미노산들의 백분율은 각 에지(edge 1: i, i+4, i+7 …; edge 2: i+1, i+5, i+8…; edge 3:i+2, i+6, i+9 …)에 대해 계산될 수 있고, 에지들 중 하나의 백분율 차이가 독립적으로 여겨지는 두 에지들에 대하여 최소 약 35일 때, PPII 구조는 양친매성으로 여겨질 수 있다.

이처럼, PPII 구조에서 모든 제3 잔기는 나선의 일측을 따라서 정렬되므로, 나선의 일측을 따라 위치된 잔기들의 소수성이 나선의 타측을 따라 위치된 잔기들의 소수성과 다르면, PPII 나선은 양친매성일 것이다. 감마 제인의 RD의 PPII 나선은 두드러진 양친매성 특성을 가진다. 회전당 3.0 잔기들을 갖고서, 감마 제인의 발린 및 류신 잔기들은 나선의 동일 측(각각, 에지 1 및 2) 위에 정렬되고, 반면에 극성 히스티딘 잔기들은 반대 측(에지 3) 위에 정렬된다. 이 양친매성은 직전에 언급된 계산에 의해 분명히 지적되었고, 여기서 친수성 아미노산들의 백분율은 에지 1, 2, 및 3에서 각각 29.4, 29.4, 그리고 78.1이다 (표 1 참조).

본 발명에 따른 PBIS의 양친매성 값

PPII 군	PBIS	잔기 *	%프롤린	%동일성	에지극성 ***	에지 극성 차이****	순 전하
양으로 대전된 양친매성	RX3	11-63	54,7	100	(29,4/29,4/78,1)	(0/48,7/48,7)	+8
	RX3(K)	11-63	54,7	84,9	(29,4/29,4/78,1)	(0/48,7/48,7)	+8
	RX3(R)	11-63	54,7	84,9	(29,4/29,4/78,1)	(0/48,7/48,7)	+8
음으로 대전된 양친매성	RX3(D)	11-63	54,7	84,9	(29,4/29,4/78,1)	(0/48,7/48,7)	-8
음으로 대전된 양친매성	RX3(E)	11-63	54,7	84,9	(29,4/29,4/78,1)	(0/48,7/48,7)	-8
비 대전된 양친매성	RX3(N)	11-63	54,7	84,9	(29,4/29,4/78,1)	(0/48,7/48,7)	0
비 대전된 양친매성	RX3(Q)	11-63	54,7	84,9	(29,4/29,4/78,1)	(0/48,7/48,7)	0
비- 양친매성	RX3(A)	11-63	54,7	86,8	(29,4/29,4/34,4)	(0/5/5)	+1
	RX3(A)2	11-63	54,7	84,9	(29,4/29,4/28,1)	(0/1,3/1,3)	0
	RX3(A3)	11-63	54,7	54,7	(29,4/29,4/28,1)	(0/1,3/1,3)	0
	RX3(L)	11-63	54,7	84,9	(29,4/29,4/28,1)	(0/1,3/1,3)	0
	RX3(V)	11-63	54,7	84,9	(29,4/29,4/28,1)	(0/1,3/1,3)	0
	RX3(T)	11-63	54,7	84,9	(29,4/29,4/53,1)	(0/23,7/23,7)	0
	PP	11-63	96,2	58,5	(50/52,9/56,3)	(0/1,3/1,3)	+1
	PP3	11-63	100	54,7	(50/50/50)	(0/0/0)	0
	PA	11-63	66	58,5	(29,4/29,4/56,7)	(0/27,3/27,3)	+1
	PA2	11-63	67,9	54,7	(29,4/29,4/53,1)	(0/23,7/23,7)	0
	Z(Col)	11-63	39,6	38,6	(52,9/52,9/56,3)	(0/3,4/3,4)	+1
	Z(Col2)	11-56	36,9	27,8	(50/50/50)	(0/0/0)	0
	Z(Adh)	11-63	39,6	35,8	(64,7/61,8/50)	(2,9/14,7/11,8)	-5
	Z(Adh2)	11-56	39,6	27,8	(68,8/65,6/46,7)	(4,4/22,1/18,9)	-6
* 분석에 사용된 잔기(성숙 단백질의 N-말단에 대한 상대적 위치
** RX3을 기준으로 취한 동일 아미노산들의 %
*** PPII 구조의 삼각형 프리즘 표시의 에지 1, 2, 및 3에서 극성 아미노산들의 백분율
**** PPII 구조의 삼각형 프리즘 표시의 에지들을 따른 극성 아미노산들의 백분율 차이 (에지 1 대 에지 2, 에지 1 대 에지 3, 그리고 에지 2 대 에지 3)

일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 양친매성 이고 음으로 대전된다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 양친매성 이고 대전되지 않는다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 비양친매성이다.

일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열의 길이를 따라 위치된 프롤린의 백분율은 일정하다. 그러므로, 예를 들어, 일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열의 길이를 가로지르는 10-아미노산 윈도우들은 프롤린 백분율이 단지 약 50%, 약 45%, 약 35%, 약 30%, 약 25%, 약 20%, 약 15%, 약 10%, 또는 약 5%만큼 다르다.

일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열에 존재하는 프롤린 아미노산들은 하이드록실화 되게 하는 하이드로프롤린(예를 들어, (2S,4R)-4-Hydroxyproline, 또는 L-hydroxyproline (C₅H₉O₃N))일 수 있다. 이는 프롤린의 감마 카본 원자에 부착된 히드록실(OH) 기의 존재만이 다른 프롤린의 공통적인 번역후 변형이다. 히드록시프롤린은 콜라겐과 같이 프롤린 풍부 서열들에 존재한다. 예를 들어, 기본 GXY 트라이어드(triad) (여기서 X와 Y는 독립적인 임의 아미노산)에서, Yaa 위치를 차지하는 프롤린은 히드록시화될 수 있다. 히드록시프롤린은 PPII 나선 형성과 간섭하지 않는다.

일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 콜라겐 관련 서열을 포함하지 않는다. 이처럼, 일부 실시예에서, 상기 PPII 구조 또는 프롤린 풍부 서열은 서열 (GXY)n을 포함하고, 여기서 n은 최소 5, 최소 6, 최소 7, 최소 8, 최소 9, 최소 10, 최소 12, 최소 14, 최소 16, 최소 18, 또는 최소 20이다. 일부 실시예에서, (GXY)n을 포함하는 서열은 최소 약 30%의 프롤린을 포함한다.

상기 PPII 구조 또는 프롤린 풍부 서열은 길이가 최소 30 아미노산이다. 재조합 PBIS는 PPII 구조 또는 프롤린 풍부 서열의 아미노 말단(N-말단)에 최소 두 개의 시스테인을 포함한다(즉, PPI 구조 또는 프롤린 풍부 영역의 두 시스테인 업스트림). 재조합 PBIS는 PPII 구조 또는 프롤린 풍부 서열의 카복시 말단(C-말단)에 최소 두 개의 시스테인을 포함한다(즉, PPI 구조 또는 프롤린 풍부 영역의 두 시스테인 다운스트림).

일부 실시예에서, PBIS의 최소 약95%, 약 90%, 약 85%, 약 80%, 약 75%, 약 70%, 약 65%, 약 60%, 약 55%, 또는 약 50%는 폴리프롤린 II 구조를 보여준다.

위에서 기재된 바와 같이, 재조합 PBIS는 프롤린 풍부 서열을 포함할 수 있다. 일부 실시예에서, PPII 구조는 프롤린 풍부 서열을 포함한다. 일부 실시예에서, 재조합 PBIS는 PPII 구조 및 PPII 나선을 형성하는 경향을 갖지 않는 프롤린 풍부 서열을 포함한다.

PPII 구조에서 모든 제3 잔기는 나선의 일측을 따라서 정렬되므로, 나선의 일측을 따라 위치된 잔기들의 소수성이 나선의 다른 일측을 따라 위치된 잔기들의 소수성과 다르면, PPII 나선은 양친매성일 것이다. 감마 제인의 RD의 PPII 나선은 두드러진 양친매성 특성을 가진다. 회전당 3 잔기들을 갖고서, 감마 제인의 발린 및 류신 잔기들은 나선의 동일 측 위에 정렬되고, 반면에 pH에 따라 대전된 극성 히스티딘 잔기들은 반대 측 위에 정렬된다.

일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 프롤린 풍부 반복을 포함한다. 기재된 바와 같이, 프롤린 풍부 반복은 프롤린을 함유하는 서열의 최소 2 카피를 포함하는 서열이다. 반복은 최소 길이가 2 아미노산 (예: PX), 최소 길이가 3 아미노산 (예: PPX, PXP, XPP, 또는 PXX), 최소 길이가 4 아미노산 (예: PPPX (서열번호 5), PPXX (서열번호 6), PXXX (서열번호 7), PPXP (서열번호 8), PXPP (서열번호 65), 최소 길이가 5 아미노산 (예: PPPXX (서열번호 9)), 최소 길이가 6 아미노산 (예: PPPXXX (서열번호 10) 또는 PPPXPX (서열번호 11)), 최소 길이가 7 아미노산, 최소 길이가 8 아미노산, 최소 길이가 9 아미노산, 또는 최소 길이가 10 아미노산일 수 있다. 여기서 나열된 반복들은 다지 예시로서 제공된다.

프롤린 풍부 반복은 프롤린을 포함하는 서열의 최소 두 개의 카피, 최소 세 개의 카피, 최소 네 개의 카피, 최소 다섯 개의 카피, 최소 여섯 개의 카피, 최소 일곱 개의 카피, 최소 여덟 개의 카피, 최소 아홉 개의 카피, 최소 열 개의 카피를 포함할 수 있다. 프롤린 풍부 반복은 동일 반복(즉, 동가 동의 프롤린 풍부 반복)의 모든 카피들을 포함할 수 있거나, 프롤린 풍부 반복들의 조합(즉, 이가 동의 프롤린 풍부 반복)을 포함할 수 있다. 예시로서, 서열 PPPAAAPPPAAAPPPAAA (서열번호 12)은 동일한 PPPAAA (서열번호 13) 반복을 포함하는 세 개의 카피들을 포함하는 동가 동의 프롤린 풍부 반복이고, 서열 PPPAAAPPPAAAPPAPPPPPAPPP (서열번호 14)은 한 서열 PPPAAA (서열번호 13)의 2 카피와 다른 서열 PPAPPP (서열번호 15)의 2 카피를 포함하는 이종 동의 프롤린 풍부 반복이다.

일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 (i) 프롤린, (ii) 발린, (iii) 류신, 및 (iv) 알라닌으로 구성되는 군으로부터 선택된 아미노산들로 필수적으로 구성된다. 일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 (i) 프롤린, (ii) 발린, (iii) 류신, (iv) 아스파트산, 및 (v) 글루타민으로 구성되는 군으로부터 선택된 아미노산들로 필수적으로 구성된다. 일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 (i) 프롤린, (ii) 발린, (iii) 류신, (iv) 트레오닌, (v) 아스파라긴, 및 (vi) 글루타민으로 구성되는 군으로부터 선택된 아미노산들로 필수적으로 구성된다. 일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 (i) 프롤린, (ii) 음으로 대전된 아미노산들 (즉, D 및 E), (iii) 극성의 대전된 측쇄들을 가진 아미노산들(즉. N, 및 Q), (iv) 부분 극성의 대전되지 않은 측쇄들을 가진 아미노산들(즉, S, T, W, Y 및 G) 또는 부분 극성의 대전되지 않은 측쇄들을 가진 아미노산들(즉, S, T, 및 G), (v) 소수성 측쇄들을 가진 아미노산들(즉, A, I, L, M, F, 및 V) 또는 소수성 측쇄들을 가진 아미노산들(즉, A, I, L, M 및 V)로 구성되는 군으로부터 선택된 아미노산들로 필수 구성된다. 일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열은 (i) 프롤린, 및 (ii) 아날린으로 구성되는 군으로부터 선택된 아미노산들로 필수적으로 구성된다.

일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열에서 아미노산들 중 최소 약 40%가 프롤린이다. 일부 실시예에서, PPII 구조 또는 프롤린 풍부 서열에서 아미노산들의 최소 약 45%, 최소 약 50%, 최소 약 55%, 최소 약 60%, 최소 약 65%, 최소 약 70%, 최소 약 75%, 최소 약 80%, 최소 약 85%, 최소 약 90%, 최소 약 95% 또는 100%가 프롤린이다.

일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열 내 아미노산의 약 95%, 약 90%, 약 85%, 약 80%, 약 75%, 약 70%, 약 65%, 약 60%, 약 55%, 또는 약 50%만이 프롤린이다.

일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 비양친매성 이다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 양친매성이고 음으로 대전된다. 일부 실시예에서, 상기 PPII 구조 또는 상기 프롤린 풍부 서열은 양친매성이고 대전되지 않는다.

일 실시예에서, 상기 재조합 PPII 구조 또는 상기 프롤린 풍부 영역은 음으로 대전된 양친매성 서열을 포함한다. "음으로 대전된 양친매성 서열"이란 용어는 위에서 설명되었고, 위에서 정의된 방법을 이용하여 계산된 음의 순전하를 보여주는 PPII 구조들 또는 프롤린 풍부 영역들을 언급하기 위해 사용된다. 또 다른 바람직한 실시예에서, 상기 음으로 대전된 양친매성 서열은 PPPVDL (서열번호 19) 및 PPPVEL (서열번호 18)로 구성되는 군으로부터 독립적으로 선택되는 최소 하나의 반복을 포함한다. 바람직한 실시예에서, 상기 양친매성 서열은 (PPPVEL)n, (서열번호 18) 및 (PPPVDL)n, (서열번호 19)로부터 선택된 서열을 포함하고, 여기서 n은 4, 5, 6, 7, 또는 8이다.

또 다른 실시예에서, 상기 음으로 대전된 양친매성 서열은 아래에 정의된 바와 같은 서열로 필수 구성된다:

PPPVELPPP VELPPPVELP PPVELPPPVE LPPPVELPPP VEVPPPVELPPPP (서열번호 30),

PPPVELPPP VELPPPVELP PPVELPPPVE LPPPVELPPP VELPPPVELPPPP (서열번호 123).

PPPVDLPPP VDLPPPVDLP PPVDLPPPVD LPPPVDLPPP VDVPPPVDLPPPP (서열번호 124), 및

PPPVDLPPP VDLPPPVDLP PPVDLPPPVD LPPPVDLPPP VDLPPPVDLPPPP (서열번호 31).

또 다른 실시예에서, 본 발명에 따라 PBIS의 일부를 형성하는 상기 PPII 구조 또는 상기 프롤린 풍부 영역은 대전되지 않은 양친매성 서열이다. "대전되지 않은 양친매성 서열"이란 용어는 0의 순전하를 갖는 서열을 말하고, PPII 구조의 삼각형 프리즘 표시의 에지 2에서의 잔기들은 Asn과 Gln으로 구성되는 군으로부터 선택된다. 또 다른 더 바람직한 실시예에서, 상기 음으로 대전된 양친매성 서열은 PPPVDL (서열번호 21) 및 PPPVEL (서열번호 22)로 구성되는 군으로부터 독립적으로 선택되는 최소 하나의 반복을 포함한다. 또 다른 더 바람직한 실시예에서, 상기 음으로 대전된 양친매성 서열은 최소 6개의 반복을 포함하고, 각 반복은 PPPVNL (서열번호 21) 및 PPPVQL (서열번호 22)로 구성되는 군으로부터 독립적으로 선택된다. 바람직한 실시예에서, 상기 PBIS는 (PPPVNL)n, (서열번호 21) 및 (PPPVQL)n, (서열번호 22)로부터 선택된 서열을 포함하고, 여기서 n은 4, 5, 6, 7, 또는 8이다.

바람직한 실시예에서, 본 발명에 따라 PPII 구조의 일부를 형성하는 상기 대전되지 않은 양친매성 서열 또는 PBIS의 일부를 형성하는 상기 프롤린 풍부 영역은 하기에 정의된 바와 같은 서열로부터 독립적으로 선택된다:

PPPVNLPPP VNLPPPVNLP PPVNLPPPVN LPPPVNLPPP VNVPPPVNLPPPP (서열번호 32),

PPPVNLPPP VNLPPPVNLP PPVNLPPPVN LPPPVNLPPP VNLPPPVNLPPPP (서열번호 33),

PPPVQLPPP VQLPPPVQLP PPVQLPPPVQ LPPPVQLPPP VQVPPPVQLPPPP (서열번호 34), 및

PPPVQLPPP VQLPPPVQLP PPVQLPPPVQ LPPPVQLPPP VQLPPPVQLPPPP (서열번호 35).

또 다른 실시예에서, 본 발명에 따라 PBIS의 일부를 형성하는 상기 PPII 구조 또는 상기 프롤린 풍부 영역은 비양친매성 서열이다. "비양친매성 서열(non-amphipathic sequence)"이란 용어는 0의 순전하를 갖는 서열을 말하고, PPII 구조의 삼각형 프리즘 표시의 에지 2에서의 잔기들은 Ala, Leu, Val, Thr 및 Ser로 구성되는 군으로부터 선택된다. 또 다른 더 바람직한 실시예에서, 비양친매성 서열은 PPPVAL (서열번호 16), PPPVTL (서열번호 20), PPPVSL (서열번호 36), PPPVVL, (서열번호 37) 및 PPPVLL (서열번호 17)로 구성되는 군으로부터 독립적으로 선택된 최소 하나의 반복을 포함한다. 바람직한 실시예에서, 상기 PBIS는 PPPVAL)n, (서열번호 16), (PPPVTL)n, (서열번호 20), (PPPVSL)n, (서열번호 36), (PPPVVL)n, (서열번호 37) 및 (PPPVLL)n, (서열번호 17)로부터 선택된 서열을 포함하고, 여기서 n은 4, 5, 6, 7, 또는 8이다.

또 다른 바람직한 실시예에서, 상기 비양친매성 서열은 하기의 서열들로 구성되는 군으로부터 선택된다:

PPPVALPPP VALPPPVALP PPVALPPPVA LPPPVALPPP VAVPPPVALPPPP (서열번호 38),

PPPVALPPP VALPPPVALP PPVALPPPVA LPPPVALPPP VALPPPVALPPPP (서열번호 39),

PPPVALPPP VALPPPVALP PPVALPPPVA LPPPVALPPP VAVPPPVHLPPPP (서열번호 40),

PPPVALPPP VALPPPVALP PPVALPPPVA LPPPVALPPP VALPPPVHLPPPP (서열번호 41),

PPPVLLPPP VLLPPPVLLP PPVLLPPPVL LPPPVLLPPP VLVPPPVLLPPPP (서열번호 42),

PPPVLLPPP VLLPPPVLLP PPVLLPPPVL LPPPVLLPPP VLLPPPVLLPPPP (서열번호 43),

PPPVVLPPP VVLPPPVVLP PPVVLPPPVV LPPPVVLPPP VVVPPPVVLPPPP (서열번호 44),

PPPVVLPPP VVLPPPVVLP PPVVLPPPVV LPPPVVLPPP VVLPPPVVLPPPP (서열번호 45),

PPPVTLPPP VTLPPPVTLP PPVTLPPPVT LPPPVTLPPP VTVPPPVTLPPPP (서열번호 46),

PPPVTLPPP VTLPPPVTLP PPVTLPPPVT LPPPVTLPPP VTLPPPVTLPPPP (서열번호 47),

PPPVSLPPP VSLPPPVSLP PPVSLPPPVS LPPPVSLPPP VSVPPPVSLPPPP (서열번호 48), 및

PPPVSLPPP VSLPPPVSLP PPVSLPPPVS LPPPVSLPPP VSLPPPVSLPPPP (서열번호 49)

또 다른 실시예에서, 상기 재조합의 비양친매성 서열은 프롤린과 알라닌으로 구성되는 군으로부터 선택된 아미노산들로 필수 구성된다. 바람직한 실시예에서, 프롤린과 알라닌으로 구성되는 군으로부터 선택된 아미노산들로 필수 구성되는 상기 서열은 PPPAAA (서열번호 13), PPPAPA (서열번호 23) 및 PPPPPP (서열번호 24)로 구성되는 군으로부터 선택된 최소 하나의 반복을 포함한다. 바람직한 실시예에서, 상기 양친매성 서열은 (PPPAAA)n, (서열번호 13), (PPPAPA)n (서열번호 23) 및 PPPPPP)n (서열번호 24)로부터 선택된 서열을 포함하고, 여기서 n은 4, 5, 6, 7, 또는 8이다.

또 다른 바람직한 실시예에서, 프롤린과 알라닌으로 구성되는 군으로부터 선택된 아미노산들로 필수 구성되는 상기 서열은 하기 서열들로 구성되는 군으로부터 선택된다:

PPPAAAPPP AAAPPPAAAP PPAAAPPPAA APPPAAAPPP AAAPPPAAAPPPP (서열번호 50),

PPPAAAPPP AAAPPPAAAP PPAAAPPPAA APPPAAAPPP AAAPPPVHLPPPP (서열번호 51),

PPPPPPPPP PPPPPPPPPP PPPPPPPPPP PPPPPPPPPP PPPPPPPPPPPPPPP (서열번호 52),

PPPPPPPP PPPPPPPPPP PPPPPPPPPP PPPPPPPPPP PPPPPPPPVHLPPPP (서열번호 53),

PPPAPAPPP APAPPPAPAP PPAPAPPPAP APPPAPAPPP APAPPPVHLPPPP (서열번호 54), 및

PPPAPAPPP APAPPPAPAP PPAPAPPPAP APPPAPAPPP APAPPPAPAPPPP (서열번호 55).

또 다른 실시예에서, 상기 비양친매성 서열은 서열 (GXY)n으로 필수 구성되고, 여기서 X 및 Y는 독립적인 임의 아미노 산이고, n은 1 내지 20의 정수이며, (GXY)n을 포함하는 상기 서열은 최소 30% 프롤린을 포함한다. 또 다른 실시예에서, 상기 비양친매성 서열은 유전자은행 등록번호 CAA34683의 아미노산 135 내지 179와 최소 70% 동일성을 보이는 아미노산들로 구성되는 군으로부터 선택된 아미노산들로 필수 구성된다. 또 다른 실시예에서, 상기 비양친매성 서열은 하기 서열들로 필수 구성된다:

GPMGPRGPPG PAGAPGPQGF QGNPGEPGEP GVSGPMGPRG PPGPPPVHL (서열번호 56) 및

GPMGPRGPPG PAGAPGPQGF QGNPGEPGEP GVSGPMGPRG PPGPP (서열번호 68)

또 다른 실시예에서, 상기 양친매성 서열은 표면 부착분자 AgI/II (Streptococcus mutans변종 NG8, 유전자은행: GQ456171)으로부터 아미노산 884 내지 927과 최소 70% 동일성을 보이는 아미노산들로 필수 구성된다. 바람직한 실시예에서, 상기 비양친매성 서열은 하기 서열들로 구성되는 군으로부터 선택된 아미노산들로 필수 구성된다:

PPTPPTYETE KPLEPAPVEP SYEAEPTPPT RAPDQAEPNK PTPPTPVHLP PPP (서열번호 69) 및

PPTPPTYETE KPLEPAPVEP SYEAEPTPPT RAPDQAEPNK PTPPTP (서열번호 70).

일부 실시예에서, PPII/Pro-풍부 서열은 C-말단에서 네 개의 프롤린 잔기들을 포함한다. 이 PPPP 서열은 C-말단 시스테인들의 업스트림, 즉 PPII/Pro-풍부 서열의 C-말단과 C-말단 시스테인들 사이에서 발견된다.

IV . 시스테인 잔기

달리 특정하게 기재되지 않으면, 시스테인 잔기들의 위치는 PPII 구조의 N- 또는 C-말단, 폴리프롤린 풍부 서열 또는 PPII 구조 및 프롤린 풍부 서열 양자에 대하여 상대적이다.

위에 기재된 바와 같이, 재조합 PBIS는 N-말단에서 최소 두 개의 시스테인들 및 C-말단에서 최소 두 개의 시스테인들 사이의 PPII 구조, 폴리프롤린 풍부 서열 또는 PPII 구조 및 프롤린 풍부 서열 양자를 포함할 수 있다. 일부 실시예에서, 상기 재조합 PBIS는 C-말단에서 최소 세 개의 시스테인, 또는 최소 네 개의 시스테인들을 포함한다.

일부 실시예에서, 상기 재조합 PBIS는 다수의 PPII 구조들 및/또는 추가 시스테인에 의해 분리된 프롤린 풍부 서열들을 포함한다. 단지 예시로서, 상기 재조합 PBIS는 N-말단부터 C-말단까지 두 개의 시스테인 잔기, PPII 구조, 시스테인 잔기, 프롤린 풍부 서열, 및 두 개의 시스테인 잔기들을 포함할 수 있다. 또다른 실시예에서, 상기 재조합 PBIS는 N-말단부터 C-말단까지 두 개의 시스테인 잔기, 제1 프롤린 풍부 서열, 시스테인 잔기, 제2 프롤린 풍부 서열, 및 두 개의 시스테인 잔기들을 포함할 수 있다.

일부 실시예에서, C-말단에서 두 개의 시스테인들 사이의 아미노산들의 수는 0 내지 20의 정수이고/이거나 N-말단에서 두 개의 시스테인들 사이의 아미노산들의 수는 0 내지 20의 정수이다. 바람직하게, N-말단에서 두 개의 시스테인들은 최소 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개의 아미노산에 의해 분리될 수 있고, 혹은 인접할 수도 있다. 바람직하게, C-말단에서 두 개의 시스테인들은 최소 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개의 아미노산에 의해 분리될 수 있고, 혹은 인접할 수도 있다. 바람직한 실시예에서, N-말단에서 최소 두 개의 시스테인들은 하나의 아미노산(즉, CXC)에 의해, 두 개의 아미노산들(즉, CXXC(서열번호 57))에 의해 분리된다.

일부 실시예에서, PPII 서열 또는 프롤린 풍부 영역과 PPII 서열 또는 프롤린 풍부의 N-말단에서 두 개의 시스테인들은 약 0 내지 40개의 아미노산들(두 개의 시스테인들의 최대 C-말단과 폴리프롤린 II 또는 프롤린 풍부 영역의 N-말단 아미노산 사이의 아미노산들의 수로 측정시)에 의해 분리된다. 일부 실시예에서, PPII 서열 또는 프롤린 풍부 영역과 PPII 서열 또는 프롤린 풍부의 N-말단에서 두 개의 시스테인들은 최소 40, 최소 35, 최소 30, 최소 25, 최소 20, 최소 15, 최소 10, 최소 5개의 아미노산들에 의해 분리된다.

일부 실시에에서, PPII 서열 또는 프롤린 풍부 영역과 PPII 서열 또는 프롤린 풍부의 C-말단에서 두 개의 시스테인들은 약 0 내지 40개의 아미노산들(두 개의 시스테인들의 가장 N-말단과 폴리프롤린 II 또는 프롤린 풍부 영역의 C-말단 아미노산 사이의 아미노산들의 수로 측정시)에 의해 분리된다. 일부 실시예에서, PPII 서열 또는 프롤린 풍부 영역과 PPII 서열 또는 프롤린 풍부의 C-말단에서 두 개의 시스테인들은 최소 40, 최소 35, 최소 30, 최소 25, 최소 20, 최소 15, 최소 10, 최소 5개의 아미노산들에 의해 분리된다.

일부 실시예에서, N-말단에서 최소 두 개의 시스테인들은 구형 도메인 내에 있지 않다. 일부 실시예에서, C-말단에서 최소 두 개의 시스테인들은 구형 도메인 내에 있지 않다. 일부 실시예에서, 재조합 PBIS는 구형 도메인 내에 시스테인을 포함하지 않는다. 바람직한 실시예에서, PBIS가 이종 단백질에게 융합 단백질로 제공될 때, 시스테인은 이종 단백질의 일부를 형성하지 않는다.

V. ProX 도메인

또 다른 바람직한 실시예에서, PBIS는 이전 단락에서 정의된 바와 같은 서열을 포함하고, PPII 구조 또는 프롤린 풍부 도메인을 옆에 두는 시스테인들은 N1과 N2로 알려져 있는 추가 서열들 내에서 발견된다. 이들 N1과 N2 서열은 PPII 또는 프롤린 풍부 영역 옆에 위치한다. 본 발명에서 사용될 수 있는 전형적인 N1 및 N2 서열들은 제한없이 포함한다.

적합한 N1 서열들은 THTSGGCGCQ (서열번호 25), THPPPPCPCP (서열번호 26) 또는 QCPSPHPQQCPCPHPQPHPQPRPPQTPYHC (서열번호 126)를 포함한다. 일 실시예에서, N1 서열은 PPII 또는 프롤린 풍부 영역의 업스트림으로 나타난다.

N2 서열은 프롤린 풍부 영역일 수 있다. "프롤린 풍부 영역(proline-rich region)"이란 용어는 프롤린이 두드러지게 형성되는 서열로 위에서 정의되었다. 바람직한 실시예에서, 프롤린 풍부 영역은 프롤린들이 두드러지게 형성되고, 서열을 따라서 모두 균일하게 분포된 프롤린들을 가진다. 그러므로, 예를 들어, 일부 실시예에서, 10-아미노산 윈도우들이 PPII 구조 또는 프롤린 풍부 서열의 길이를 가로질러 추출되면, 각 윈도우는 나머지 윈도우들에 대해 프롤린 백분율이 단지 약 50%, 약 45%, 약 35%, 약 30%, 약 25%, 약 20%, 약 15%, 약 10%, 또는 약 5%만큼 다르다. 또 다른 바람직한 실시예에서, 프롤린 풍부 영역은 프롤린이 두드러지게 형성되는 서열로서, 상기 프롤린은 그 서열을 따라서 모두 균일하게 분포되고, 취급하기 힘든 측쇄(Trp, Tyr 및/또는 Phe)를 갖는 아미노산들의 백분율은 그 서열의 전체 길이에 대해 10% 이하이다.

본 발명에서 사용될 수 있는 적합한 프롤린 풍부 영역들은 g-제인 HYPYQPPRPQPHPQPHPCPC (서열번호 71) 또는 다음의 서열들로 구성되는 군으로부터 선택된 변형 서열에서 발견되는 ProX 도메인을 포함한다:

CHYPTQPPRPQPHPQPHPCPCQQPHPS (서열번호 72),

CPPPPPPPPPPPPPPPPPCPCPPPPPPPCP (서열번호 73),

CPPPPPPPPPPPPPPPPPCPPCPPPPPCPP (서열번호 74),

CPPPAPAPPPAPAPPPAPCPCPAPAPP (서열번호 75),

CHYPPAPAPPAPAPPAPACPCAAPAPSPCQ　(서열번호 76 ) 및

CHYPTAPARPAPAPAPAPCPCAAPAPSPCQ (서열번호 127)

N2 서열은 PPII 영역 또는 프롤린 풍부 영역의 다운스트림 또는 업스트림으로 발견될 수 있다. 바람직한 실시예에서, N2 서열은 PPII 영역의 다운스트림으로 발견된다.

그러므로, 바람직한 실시예에서, 본 발명에 따르는 PBIS는 다음의 서열들로 구성되는 군으로부터 선택된 서열을 포함한다:

THTSGGCGCQP(PPPVEL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 107),

THTSGGCGCQP(PPPVDL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 108),

THTSGGCGCQP(PPPVNL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 109),

THTSGGCGCQP(PPPVQL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 111),

THTSGGCGCQP(PPPVAL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 112),

THTSGGCGCQP(PPPVTL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 113),

THTSGGCGCQP(PPPVSL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 114),

THTSGGCGCQP(PPPVLL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 115),

THTSGGCGCQP(PPPVVL)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 116),

THTSGGCGCQP(PPPAAA)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 117),

THTSGGCGCQP(PPPAAA)nPPPAPAPPPAPAPPPAPCPCPAPAPPPCP (서열번호 118),

THTSGGCGCQP(PPPPPP)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 119),

THTSGGCGCQP(PPPPPP)nPPPCPPPPPPPPPPPPPPPPPCPCPPPPPPPCP (서열번호 120),

THTSGGCGCQP(PPPAPA)nPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ (서열번호 121), 및

THTSGGCGCAP(PPPAAA)nPPPPCHYPPAPAPPAPAPPAPACPCAAPAPSPCQ　 (서열번호 122)

여기서 n은 4, 5, 6, 7 또는 8이다. 바람직한 실시예에서, n은 8이다.

또 다른 실시예에서, 본 발명에 따른 PBIS는 표 2에서 언급된 서열들로 필수 구성된다.

N1, PPII/프롤린-풍부 서열 및 제2 Pro-풍부 서열을 나타내는 본 발명의 예시적 PBIS의 요약 (제2 프롤린 풍부 서열을 갖지 않는 그러한 PBIS는 CPPC 테트라펩티드로서 PPII/프롤린 풍부 영역에 연결된 두 개의 C-말단 시스테인들을 포함한다.)

PBIS	서열번호	PBIS
THTSGGCGCQP(PPPVEL)₆PPPVEVPPPVELPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ	77	RX3(E)
THTSGGCGCQPPPPVDL)₆PPPVDVPPPVDLPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ	78	RX3(D)
THTSGGCGCQP(PPPVNL)₆PPPVNVPPPVNLPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ	79	RX3(N)
THTSGGCGCQP(PPPVQL)₆PPPVQVPPPVQLPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ	80	RX3(Q)
THTSGGCGCQP(PPPVAL)₆PPPVAVPPPVHLPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ	81	RX3(A)
THTSGGCGCQP(PPPVAL)₆PPPVAVPPPVALPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ	82	RX3(A)2
THTSGGCGCQP(PPPVTL)₆PPPVTVPPPVTLPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ	85	RX3(T)
THTSGGCGCQP(PPPVSL)₆PPPVSVPPPVSLPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ	86	RX3(S)
THTSGGCGCQP(PPPVLL)₆PPPVLVPPPVLLPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ	83	RX3(L)
THTSGGCGCQP(PPPVVL)₆PPPVVVPPPVVLPPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ	84	RX3(V)
THTSGGCGCQP ( PPPAAA ) ₈ PPPPCHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ	87	RX3(A3)
THTSGGCGCQP(PPPPPP)₇PPPHLPPPP ₇PPPPHLPPPPCPPPPPPPPPPPPPPPPPCPCPPPPPPPCP	88	PP
THPPPPCPPCP(PPPPPP)₇PPPHLPPPP ₇PPPPHLPPPPCPPPPPPPPPPPPPPPPPCPPCPPPPPCPP	125	PP2
THTSGGCGCQ(PPPPPP)₈ PPPPCPPPPPPPPPPPPPPPPPCPCPPPPPPPCP	89	PP3
THTSGGCGCQP(PPPAPA)₇PPPAHLPPPPCPPPAPAPPPAPAPPPAPCPCPAPAPPPCP	90	PA
THTSGGCGCQP(PPPAPA)₈PPPPCPPPAPAPPPAPAPPPAPCPCPAPAPPPCP	91	PA2
THPPPPCPCPP ( PPPPPP ) ₇ PPPHLPPPPCPPPPPPPPPPPPPPPPPCPCPPPPPPPCP	92	NPP
THPPPPCPCPP ( PPPAPA)₇ PPPAHLPPPPCPPPAPAPPPAPAPPPAPCPCPAPAPPPCP	93	NPA
THTSGGCGCQPPPTPPTYETE KPLEPAPVEP SYEAEPTPPT RAPDQAEPNK PTPPTPVHLP PPPPPTPPTYETEKPLEPAPVEPSYEAEPTPPTRAPDQAEPNKPTPPTPVHLPPPP CHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ	94	Z(Adh)Px
THTSGGCGCQPPPTPPTYETE KPLEPAPVEP SYEAEPTPPT RAPDQAEPNK PTPPTP CHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ	95	Z(Adh2)Px
THTSGGCGCQPGPMGPRGPPGPAGAPGPQGFQGNPGEPGEPGVSGPMGPRGPPGPPPVHLPPPP CHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ	96	Z(col)Px
THTSGGCGCQPGPMGPRGPPGPAGAPGPQGFQGNPGEPGEPGVSGPMGPRGPPGPP CHYPTQPPRPQPHPQPHPCPCQQPHPSPCQ	97	Z(col2)Px
THTSGGCGCQPPTPPTYETEKPLEPAPVEPSYEAEPTPPTRAPDQAEPNKPTPPTPVHLPPPPCPPCPTPPTYETEKPLEPAPVEPSYEAEPTPPTRAPDQAEPNKPTPPTPVHLPPPPCPPC	98	Z(Adh)
THTSGGCGCQPPTPPTYETEKPLEPAPVEPSYEAEPTPPTRAPDQAEPNKPTPPTPCPPCPTPPTYETEKPLEPAPVEPSYEAEPTPPTRAPDQAEPNKPTPPTPCPPC	99	Z(Adh)2
THTSGGCGCQPGPMGPRGPPGPAGAPGPQGFQGNPGEPGEPGVSGPMGPRGPPGPPPVHLCPPCGPMGPRGPPGPAGAPGPQGFQGNPGEPGEPGVSGPMGPRGPPGPPPVHLCPPC	100	Z(col)
THTSGGCGCQ PGPMGPRGPPGPAGAPGPQGFQGNPGEPGEPGVSGPMGPRGPPGPPCPPCGPMGPRGPPGPAGAPGPQGFQGNPGEPGEPGVSGPMGPRGPPGPPCPPC	101	Z(col2)

또 다른 양태에서, 본 발명은 N1 영역(두 개의 N-말단 시스테인들을 포함) 및 RX3 PPII의 전부 또는 일부를 포함하는 PPII/pro-풍부 영역을 포함하지만, 제2 프롤린 풍부 영역이 부족한 PBIS에 관한 것이다. 필요한 C-말단 시스테인들을 제공하기 위해, 이들 PBIS는 PPII 영역의 C-말단에 직접 연결된 CPPC 테트라펩티드를 형성하는 두 개의 시스테인들을 포함한다. 이처럼, 또 다른 양태에서, 본 발명은 다음 서열로 구성되는 군으로부터 선택된 서열을 포함하는 PBIS에 관한 것이다:

R8(4C) (서열번호 102):

THTSGGCGCQ PPPPVHLPPP VHLPPPVHLP PPVHLPPPVH LPPPVHLPPP

VHVPPPVHLC PPC

R7(4C) (서열번호 103):

THTSGGCGCQ PPPPVHLPPP VHLPPPVHLP PPVHLPPPVH LPPPVHLPPP

VHVCPPC

R6(4C) (서열번호 104):

THTSGGCGCQ PPPPVHLPPP VHLPPPVHLP PPVHLPPPVH LPPPVHLCPP C

R4(4C) (서열번호 105):

THTSGGCGCQ PPPPVHLPPP VHLPPPVHLP PPVHLPPPVH LCPPC

또 다른 양태에서, 본 발명은 N1 영역(두 개의 N-말단 시스테인들을 포함), RX3 PPII의 전부 또는 일부를 포함하는 PPII/pro-풍부 영역, N2 영역을 포함하지만, N1 영역은 역방위로 RX3에서 발견되는 ProX 도메인의 아미노산을 포함하고, N2 영역은 역방위로 RX3의 N1 영역에서 발견되는 아미노산들을 포함하는 PBIS에 관한 것이다 이처럼, 또 다른 양태에서, 본 발명은 다음 서열로 구성되는 군으로부터 선택된 서열을 포함하는 PBIS에 관한 것이다:

iRX3 (서열번호 106)

QCPSPHPQQC PCPHPQPHPQ PRPPQTPYHC PPPPVHLPPP VHLPPPVHLP PPVHLPPPVH LPPPVHLPPP VHLPPPVHLP PPPQCGCGGS THT

VI . PBIS 융합 단백질

본원에 기재된 바와 같이, 재조합 PBIS는 관심이 있는 임의 생성물과 융합될 수 있다. 그러므로, 또 다른 양태에서, 본 발명은 본 발명의 재조합 PBIS 및 이종 단백질을 포함하는 융합 단백질에 관한 것이다. "이종 단백질(heterologous protein)"이란 용어는 본원에서 "관심이 있는 생성물(product of interest)" 또는 "POI"와 상호 교환적으로 사용되고, 예를 들어, 단백질 또는 펩티드일 수 있다. 재조합 PBIS는 목적 단백질 또는 펩티드의 N 또는 C 말단에 융합될 수 있다. 아울러, 재조합 PBIS는 목적 단백질 또는 펩티드에 직접 융합될 수 있고, 혹은 간접적, 예를 들어, 스페이서를 통하여, 목적 단백질 또는 펩티드에게 융합될 수 있다.

이처럼, 재조합 PBIS는, 예를 들어, 효소, 칼시토닌, 에리트로포이에틴, 트롬보포이에틴, 사람 성장 호르몬, 상피 성장 인자 등과 같은 호르몬, 인터페론, 또는 사이토킨에 융합될 수 있다. 목적 단백질 또는 펩티드의 다른 예들은 치료적, 기능식품의, 농업의, 또는 산업의 용도를 갖는 임의 단백질을 포함한다. 예를 들어, 일부 실시예에서, 재조합 PBIS는 필수 아미노산이 풍부한 펩티드에 융합될 수 있다. 이러한 기타 단백질들의 예시적 활성들은 (a) 녹색 형광 단백질(GFP)에 의한 제공시 광 포획 및 방출, 향상된 시안 형광 단백질(ECFP), 적색 형광 단백질(DsRed) 등, (b) 엔테로키나아제, 베타-글루쿠로니다아제 (GUS), 피타아제, 탄산 탈수 효소, 및 공업용 효소(하이드로라아제, 글리코시다아제, 셀룰라아제, 옥시도-리덕타아제 등)로 예시되는 1차 및 2차 세포내 시그널링 및 대사 경로와 관련될 수 있는 효소 활성, (c) 예를 들어, 항체(IgG, IgM, IgA 등과 같은 mAbs) 및 그의 절편, 호르몬(칼시토닌, 인간 성장 호르몬(hGH), 상피 성장 인자(EGF) 등), 프로테아제 억제제, 항생제, 항균제, HIV 엔트리 억제제(Ryser 등, 2005 Drug Discov Today. 10:1085-1094), 콜라겐, 인간 락토페린, 및 사이토킨과 같은 단백질-단백질, 단백질-수용체, 및 단백질-리간드 상호작용, (d) 백신용 단백질 및 펩티드 (인체 면역 결핍 바이러스, HIV; 헤파티티스 B 표면 이전(pre-surface), 표면 및 코어 항원, 발 및 구강 질환 바이러스(FMDV) 구조적 다단백질 유전자 P1 (Dus Santos 등, 2005 Vaccine.23:1838-1843), 미국특허 제4,882,145호의 T 세포 자극 펩티드, 위장염 코로나 바이러스, 인간 유두종 바이러스 등); (e) 피토헤마글루티닌(PHA), 리신 톡신 아단위 B(RTB) 및 기타 렉틴과 같은 단백질-비단백질 상호작용을 포함한다.

본원에 기재된 바와 같이, 재조합 PBIS로의 융합으로서 발현시 또는 RPBLA로부터 정제시, 관심이 있는 생성물은 그의 기능적 활성을 유지할 수 있다. 이렇게 발현된 폴리펩티드들의 생물학적 활성에 대한 평가는 이 기술에 잘 알려져 있고, 하나 이상의 공보들에서 이용가능하다. 예를 들어, ECFP 활성은 단백질이 458 nm에서 방출되었을 때 470~530 nm에서 방출되는 형광을 수량화함으로써 측정될 수 있다. (Richards 등, 2003 Plant Cell Rep. 22:117-121. 예를 들어, 엔테로키나아제(EK)의 효소 활성은 두 가지 다른 접근법으로 측정될 수 있다. 활성은 Invitrogen Life Technologies 카탈로그(E180-01과 E180-2)에서 논의된 바와 같이, 웨스턴 블롯으로 엔테로키나아제 특이 분할 부위를 포함하는 융합 단백질의 분할을 분석하고, 또한 EK(Sigma G-5261, CAS RN 70023-02-8)에 대한 형광 펩티드 기질을 사용하여 EK 활성을 수치화함으로써 판단될 수 있고, 효소 활성은 시간에 따라 펩티드로부터 β-나프틸아민의 방출에 의해 야기되는 형광(337nm에서 여기, 420nm에서 방출)의 증가에 의해 측정된다. (LaVallie 등, 1993 J. Biol . Chem . 268:23311-23317 참조). 효소 베타-글루쿠로니다아제(GUS)의 활성은 기질 MUG(4-메틸 움벨리페릴 글루쿠로니데)를 생성물 MU로 전환함으로써 측정될 수 있다. 이 생성물은 분광 형광계에서 365 nm에서 여기와 455 nm에서 방출로 형광을 측정함으로써 수치화될 수 있다. (Pai-Hsiang 등, 2001 J. Plant Physiol 158:247-254; and Jefferson 등, 1987 EMBO J. 6:3901-3907 참조). 피타아제 평가는 아세톤, 5.0 N 황산, 및 10 mM 암모늄 몰리브덴산염으로 구성되는 AAM 시약으로부터 해리된 무기 오르쏘 인산염들의 수량화로 수행된다. (Ullah 등, 1999 Biochem . Biophys . Res . Commun . 264:201-206 참조).

유사한 평가가 다른 생물학적 단백질에 대해서 이용될 수 있다. RTB 활성 평가는 Reed 등, 2005 Plant Cell Rep . 24:15-24에서 기재된 바와 같이, 아시아로페투인, 락토오스 및 갈락토오스에 대한 RTB의 결합을 측정함으로써 수행될 수 있다. EGF는 섬유아페소 증식에 관련된 성장 인자이다. EGF 활성은 세포 증식 ELISA 키트를 사용하여 티미딘 대신 피리미딘 유사 5-브로모-2'-데옥시우리딘(BrdU)을 증식하는 세포들의 DNA 로 결합시킴으로써 측정되는 DNA 합성의 유도의 수량화에 의해 평가될 수 있다. (Oliver, 등, 2004 Am . J. Physiol . Cell Physiol . 286:1118-1129; Catalog no. 1647229, Roche Diagnostics, 만하임, 독일 참조).

광 포획 및 방출은 별도의 그리고 특별한 유형의 "생물학적 활성", 즉 발광 활성을 구성한다는 것에 주목해야 한다. 이들 단백질은, 예를 들어, 생물학적으로 중요한 분자들의 분석 또는 발견에서 사용되는 많은 형태의 평가 또는 스크린에서 리포터 분자로서 유용하고, 이들의 발광 활성은 올바른 2차 및 3차 단백질 구조의 존재를 요구한다.

일부 실시예에서, 재조합 PBIS 융합 단백질은 스페이서 아미노산 서열을 포함한다. 스페이서 아미노산 서열은 효소 또는 화학적 수단에 의해 분할가능하거나 분할되지 않는 아미노산일 수 있다. "분할할 수 없는"이란 용어는 생물학적 활성 폴리펩티드의 일부 또는 전부의 파괴 없이는 스페이서의 분할이 일어나지 않는다는 것을 의미한다.

스페이서는 재조합 PBIS와 생물학적으로 활성인 폴리펩티드 사이에 놓일 수 있다. 예시적 스페이서는 엔테로키나아제, Arg-C 엔도프로테아제, Glu-C 엔도프로테아제, Lys-C 엔도프로테아제, 인자 Xa, SUMO 프로테아제(Tauseef 등, 2005 Protein Expr . Purif. 43:1-9) 등과 같은 프로테아제에 의해 분할되는 아미노산 서열이다. 스페이서는 또한 New England Biolabs 및 다른 곳에서 상업적으로 구매할 수 있는, FMDV 바이러스 오토-프로세싱 2A 서열, Ssp DNAb 인테인과 같은 단백질 인트론(inteins)과 같은 자동 분할가능한 서열에 해당할 수 있다. 인테인 링커의 사용은 이러한 서열이 선택적으로 유도되어 단백질 스플라이싱을 일으키고 그리하여 자신들을 발현 및 회수된 단백질로부터 제거하기 때문에 유리할 수 있다. 인테인은 특히 흥미로운데, 이는 이들이 목적 단백질로부터 재조합 PBIS를 분할하기 위해 이들의 표적 부위에 도착하는 큰 단백질 효소를 요구하기 않기 때문이다. 이러한 성질은 관심이 있는 단백질을 온전한 RPBLA로부터 직접 분리하는데 특히 유용할 수 있다. 대안적으로, 스페이서는, 메티오닌 잔기에서 분할하는 시아노겐 브로마이드와 같은 화학적 시약에 의해 특별히 분할될 수 있는 아미노산 서열일 수 있다.

바람직한 실시예에서, 스페이서는 펜타글리신 펩티드를 포함한다. 더욱 바람직한 실시예에서, 스페이서는 프로테아제 분할 부위 앞에 펜타글리신 펩티드를 포함한다. 더욱 더 바람직한 실시예에서, 프로테아제 분할 부위는 엔테로키나아제 분할 부위(D-D-D-D-K, K 잔기 뒤에서 분할) 및 인자 Xa 분할 부위(I-D/E-G-R, R 잔기 뒤에서 분할)로 구성되는 군으로부터 선택된다.

VII . 재조합 PBIS 및 재조합 PBIS 융합 단백질을 인코딩하는 핵산

재조합 PBIS를 인코딩하는 폴리뉴클레오티드들 또한 본원에 기재되어 있다. 유사하게, 재조합 PBIS를 포함하는 융합 단백질을 인코딩하는 폴리펩티드들도 기재되어 있다. 본 발명의 폴리펩티드들은 RNA의 형태 또는 DNA의 형태로 있을 수 있다. DNA는 cDNA, 유전체 DNA, 및 합성 DNA를 포함하고, 이중 가닥 또는 단일 가닥일 수 있고, 단일 가닥이면, 암호 가닥 또는 비암호(안티-센스) 가닥일 수 있다. 어떤 실시예에서, 폴리뉴클레오티드는 분리된다. 어떤 실시예에서, 폴리뉴클레오티드는 실질적으로 순수하다. 어떤 실시예에서, 폴리뉴클레오티드는 숙주에 최적화된 코돈이고, 여기서 RPBLA들이 발현된다.

본 발명에 따른 폴리뉴클레오티드는 PBIS 또는 융합 단백질을 소포체로 안내하는 신호 서열을 인코딩하는 서열을 더 포함할 수 있고, 여기서 상기 신호 서열은 동일한 개방 리딩 프레임 내에 PBIS 또는 융합 단백질로서 존재한다.

위에서 기재된 바와 같이, 재조합 PBIS는 재조합 PBIS를 세포 내 특별한 위치로 안내하는 신호를 포함한다. 예를 들어, 재조합 PBIS는 신호 펩티드를 통하여 소포체(ER)의 루멘으로 안내될 수 있다.

신호는 재조합 PBIS를 ER로 안내하는 임의 도메인일 수 있다. 단지 예시로서, ER-신호전달 도메인은 감마-제인 또는 알파-제인과 같은 제인 단백질, 알파-글리아딘 또는 감마-글리아딘과 같은 글리아딘 단백질, 또는 PR10 클래스 25의 감염특이적 단백질로부터 유래된 ER-신호전달 펩티드일 수 있다. 바람직한 실시예에서, 신호 서열은 서열 MRVLLVALALLALAASATS (서열번호 58)을 포함한다. 대안적으로, 신호 서열은 감염특이적 유전자, 특히 PR-10 유전자, 그리고 가장 바람직하게는 담배 PR-2 유전자로부터 유래될 수 있다(Veroverd 등, Plant Physiol., 1995, 109:1199-1205). 바람직한 실시예에서, 신호 서열은 서열 MFLKSPFYAFLCFGQYFVAVTHA (서열번호 59)을 포함한다.

단백질을 ER에 안내하는 책임이 있는 신호 펩티드들의 특징들은 광범위하게 연구되었다(von Heijne 등, 2001 Biochim . Biophys . Acta 1541:114-119). 신호 펩티드들은 1차 구조에서 상동성을 공유하지 않지만, 공통적으로 세 갈래 구조를 가진다: 중앙의 소수성 h-영역 및 친수성 N- 및 C-말단 양측부 영역. 이들 유사성, 및 단백질들이 분명히 공통적 경로를 이용하여 ER 멤브레인을 통해 위치변화된다는 사실은 다른 단백질들 간 또는 심지어 다른 문(phyla)에 속하는 다른 유기체들로부터 신호 펩티드들의 상호교환을 허용한다. (Martoglio 등, 1998 Trends Cell Biol . 8: 410-415 참조).

신호 펩티드는 재조합 PBIS가 적절한 세포의 위치, 예를 들어, ER에 도달하면, 일단 분할될 수 있다. 대부분의 진핵생물에서, 신호 펩티드는 공-번역적으로 분할되므로, 세포내막부(예를 들어, ER, 골지, 액포)에서 발견되는 단백질의 대다수는 성숙 단백질, 즉 신호 펩티드가 없는 단백질이다. 결과적으로, 성숙 단백질은 RPBLA의 유도에 책임이 있다. 바람직한 실시예에서, 신호 서열은 서열 MRVLLVALALLALAASATS (서열번호 58)을 갖는 감마 제인 신호 펩티드이다.

이러한 폴리뉴클레오티드들은, 예를 들어, 세포 내에서 재조합 PBIS 또는 재조합 PBIS를 포함하는 융합 단백질을 생산하기 위해 발현 벡터에 포함된다. 발현 벡터는 재조합 PBIS 또는 재조합 PBIS를 포함하는 융합 단백질을 인코딩하고, 적합한 전사 또는 번역 조절 요소들에 작동적으로 연결된 합성 또는 cDNA-유래 DNA 절편을 갖는 복제가능한 DNA 컨스트럭트이다. 전사 또는 번역 조절 요소들은, 예를 들어, 포유류, 미생물, 바이러스, 곤충, 또는 유전자로부터 유래될 수 있다. 전사 단위는 하기에서 상세히 기재된 바와 같이, 일반적으로 (1) 유전자 발현에서 조절 역할을 하는 유전자 요소 또는 요소들, 예를 들어 프로모터 또는 인핸서, (2) mRNA로 전사되어 단백질로 번역되는 구조적 또는 코딩 서열, 및 (3) 적절한 전사 및 번역 시작 및 종결 서열의 조립체를 포함한다. 이러한 조절 요소들은 전사를 조절하는 오퍼레이터 서열을 포함할 수 있다. 보통 복제의 기원에 의해 부여받은, 숙주에서 복제 능력, 및 형질전환주들의 인식을 쉽게하는 선택 유전자가 추가로 결합될 수 있다. 기능적으로 서로 관련이 있으면, DNA 영역들은 작동적으로 연결된다. 예를 들어, 신호 펩티드를 위한 DNA가 폴리펩티드의 분비에 참여하는 전구체로서 발현되면, 폴리펩티드를 위한 DNA에 작동적으로 연결되고, 프로모터가 서열의 전사를 조절하면, 그 프로모터는 코딩 서열에 작동적으로 연결되고, 또는 리보솜 결합 부위가 번역을 허용하기 위해 위치되면, 그 리보솜 결합 부위는 코딩 서열에 작동적으로 연결된다.

발현 조절 서열 및 발현 벡터의 선택은 숙주의 선택에 따를 것이다. 광범위한 발현 숙주/벡터 조합들이 채용될 수 있다. 진핵세포 숙주를 위한 유용한 발현 벡터는, 예를 들어, SV40, 소유두종 바이러스, 아데노바이러스 및 시토메갈로바이러스로부터 발현 조절 서열들을 포함하는 벡터들을 포함한다. 박테리아 숙주를 위해 유용한 발현 벡터들은, pCR 1, pBR322, pMB9 및 이들의 유도체들을 포함하는 Esherichia coli 유래 플라스미드와 같은 공지된 박테리아 플라스미드, M13과 같은 더 넓은 숙주 범위의 플라스미드, 및 사상 단일가닥 DNA 파지를 포함한다.

일부 실시예에서, 재조합 PBIS를 인코딩하는 폴리뉴클레오티드를 포함하는 벡터는 다수의 클로닝 부위를 더 포함한다. 다수의 클로닝 부위는 하나 이상의 고유한 제한 부위들을 포함하는 폴리뉴클레오티드 서열이다. 제한 부위들의 비제한적 예들은 EcoRI, SacI, KpnI, SmaI, XmaI, BamHI, XbaI, HincII, PstI, SphI, HindIII, AvaI, 또는 이들의 임의 조합을 포함한다.

벡터는 재조합 PBIS 및 단백질 또는 관심있는 펩티드를 포함하는 융합 단백질을 발현하기 위해 사용될 수 있도록, 다수의 클로닝 부위들은 재조합 PBIS를 인코딩하는 폴리뉴클레오티드를 포함하는 벡터에서 사용되어 단백질 또는 관심있는 펩티드를 인코딩하는 폴리펩티드를 벡터에 결합하는 것을 단순화할 수 있다. 일부 실시예에서, 재조합 PBIS를 인코딩하는 폴리뉴클레오티드는 다수의 클로닝 부위에 대해 5'이다. 일부 실시예에서, 재조합 PBIS를 인코딩하는 폴리뉴클레오티드는 다수의 클로닝 부위에 대해 3'이다.

벡터는 최소 하나의 프로모터를 포함할 수 있다. 프로모터는 재조합 PBIS 또는 재조합 PBIS를 포함하는 융합 단백질의 발현을 구동하기에 적합한 임의 서열일 수 있다. 특별한 일 실시예에서, 프로모터는 담배 잎에서 발현을 구동한다.

다른 숙주들은 종종 특별한 아미노산 잔기를 인코딩하기 위해 사용될 특별한 코돈에 대한 선호를 가진다. 이러한 코돈 선호는 잘 알려져 있고 원하는 융합 단백질 서열을 인코딩하는 DNA 서열은 예를 들어 시험관 내 돌연변이 생성을 이용하여 변경될 수 있고, 그 결과 숙주가 선호하는 코돈은 융합 단백질이 발현될 특별한 숙주를 위해 이용될 수 있다.

고려된 융합 단백질을 인코딩하는 유전자를 정의하는 외인성 핵산 단편(예를 들어, DNA 단편 또는 서열)에 작동적으로 연결된 호환성 진핵 숙주 세포에서 유전자의 발현을 구동하기에 적합한 프로모터와 같은 하나 이상의 조절 서열(조절 요소)을 포함하는 유전자 벡터 또는 컨스트럭트를 포함하는, DNA-분자와 같은 재조합 핵산 분자가 또한 고려된다. 보다 특별하게, 관심있는 폴리펩티드에 연결된 단백질체 유도 서열(PBIS)을 인코딩하는 유전자를 정의하는 DNA 단편에 작동적으로 연결된 숙주 유기체 세포들에서 융합 단백질의 발현을 구동하기 위한 프로모터를 포함하는 유전자 벡터를 포함하는 재조합 DNA 분자가 또한 고려된다. 숙주 진핵 세포에서 적합한 형질주입 및 발현시 이 재조합 DNA 분자는 고려된 융합 단백질을 RPBLA로서 제공한다.

이 기술에서 잘 알려진 것처럼, 필요한 핵산, 예시적으로 DNA 서열이 존재하기만 하면(시작 및 멈춤 신호를 포함), 추가적인 염기쌍들은 보통 DNA 단편의 어느 한쪽 끝에 존재할 수 있고, 그 단편은 여전히 단백질을 발현하기 위해 이용될 수 있다. 물론, 이는 발현을 억제하는, 발현되기를 원하는 융합 단백질을 소비하는 추가적인 생성물을 발현하는, 바라는 그 융합 단백질에 의해 생성된 원하는 반응 생성물을 소비하는 생성물을 발현하는, 그렇지 않으면, DNA 단편의 유전자의 발현과 간섭하는 작동적으로 연결된 DNA 서열의 단편의 부재를 추정한다.

이처럼, DNA 단편이 이러한 간섭 DNA 서열이 없는 한, 본 발명의 DNA 단편은 그 길이가 약 500 내지 약 15,000 염기쌍일 수 있다. 필요시 복제 및 발현을 위해 필요한 최소 DNA 서열들 모두가 존재하면, 재조합 DNA 분자, 특히 발현 벡터의 최대 크기는 대부분 숙주 세포에 의해 수용될 수 있는 편의성과 벡터 크기에 의해 결정된다. 최소 벡터 크기는 잘 알려져 잇다.

앞서 기재된 융합 단백질을 인코딩하는 DNA 단편은 화학적 기술, 예를 들어, Matteucci 등, 1981 J. Am. Chem. Soc., 103:3185의 포스포트리에스테르 방법에 의해 합성될 수 있다. 물론, 코딩 서열을 화학적으로 합성함으로써, 임의의 원하는 변형들이 재래종(native) 아미노산 잔기를 인코딩하는 것들 대신 적절한 염기들을 치환함으로써 간단하게 만들어질 수 있다.

융합 단백질을 인코딩하는 유전자를 포함하는 DNA 단편들은 그 유전자를 포함하는 재조합 DNA 분자들(플라스미드 벡터들)로부터 얻어질 수 있다.

숙주 세포에서 융합 단백질 유전자의 발현을 안내하는 벡터는 본원에서는 "발현 벡터"라고 말한다. 발현 벡터는 프로모터를 포함하는 발현 조절 요소들을 포함한다. 융합 단백질-암호화 유전자는 발현 벡터에 작동적으로 연결되어 프로모터 서열이 융합 단백직-인코딩 유전자의 RNA 폴리머라아제 결합 및 발현을 안내하도록 한다. Paszkowski 등, 1989 EMBO J., 3:2719 and Odell 등, 1985 Nature, 313:810에 의해 기재된 바와 같이 유도가능하고, 바이러스성이고, 합성이고, 구성적이고, 그리고 일시적으로 조절되고, 공간적으로 조절되고, 그리고 Chua 등, 1989 Science, 244:174-181에서 제공된 바와 같이, 시공간적으로 조절되는 프로모터들은 폴리펩티드 암호화 유전자를 발현함에 있어 유용하다.

포유류, 조류 또는 곤충 등의 세포와 양립할 수 있는 것들과 같은, 진핵세포와 양립할 수 있는 발현 벡터들이 본원에서 고려된다. 이러한 발현 벡터들은 본 발명의 재조합 DNA 분자들을 형성하기 위해 사용될 수도 있다. 진핵세포 발현 벡터는 이 기술에 잘 알려져 있고 몇몇 상업적 소스로부터 이용가능하다. 정상적으로, 이러한 벡터는 원하는 DNA 단편 및 프로모터 서열의 삽입을 위한 하나 이상의 편리한 제한 부위를 포함한다. 선택적으로, 이러한 벡터는 진핵세포에서의 사용을 위해 특이적인 선택가능한 마커를 포함한다.

융합 단백질 인코딩 유전자가 작동적으로 어느 발현 벡터 및 궁극적으로 어느 프로모터에 연결되는 가에 대한 선택은 원하는 기능적 성질, 예를 들어, 단백질 발현의 위치 및 타이밍, 그리고 형질전환될 숙주 세포에 직접 달려 있다. 이들은 재조합 DNA 분자를 구성하는 기술에서 고유한 잘 알려져 있는 제한들이다. 그러나, 본 발명을 구현함에 유용한 벡터는 복사를 안내하고, 바람직하게는 작용적으로 연결되는 DNA 단편에 포함된 융합 단백질의 (발현 벡터를 위한) 발현을 안내할 수 있다.

고등 식물 및 고등 포유동물의 세포에서 유전자의 발현을 위해 유용한 전형적인 벡터들은 이 기술에 잘 알려져 있고, Rogers 등이 (1987) Meth in Enzymol., 153:253-277에서 기재한 아그로박테리움 투메파키엔스의 종양-유도(Ti) 플라스미드로부터 유래된 식물 벡터, 위의 포유동물 발현 벡터 pKSV-10, 및 pCI-neo (Promega Corp., #E1841, Madison, Wis.)를 포함한다. 그러나, 몇몇 다른 발현 벡터 시스템들은 Fromm 등(1985)이 Proc . Natl . Acad . Sci. USA, 82:58-24에 기재한 pCaMVCN 전이 조절 벡터를 포함하는 식물들에서 기능하는 것으로 알려져 있다. (Pharmacia사(Piscataway, N.J.)로부터 구입가능한) 플라스미드 pCaMVCN은 꽃양배추 모자이크 바이러스 CaMV 35S 프로모터를 포함한다.

VIII . 재조합 단백질체 유사 조립체(RPBLA), 숙주 세포, 및 재조합 단백질체 유사 조립체(RPBLA) 생산 방법

천연 단백질체는 곡류의 배젖에서 만들어진다. 이들은 프롤라민 및 글루테린의 발현에 의해 유도된다. 단백질체는 조립된 단백질(예를 들어, 프롤라민 및 글루테린)이 매우 풍부하고 ER 또는 액포로부터 유래될 수 있는 막으로 둘러싸인 세포기관이다. 대부분의 단백질체들은 약 0.5 내지 약 3.0 마이크론의 직경을 갖는 둥근 형태(대략 구형) 구조이다.

재조합 단백질체 유사 조립체(RPBLA)는 세포 내에서 재조합 PBIS의 발현에 의해 형성될 수 있다. PBIS가 매우 풍부한 세포기관인 천연 단백질체과 유사하게, RPBLA는 PBIS가 매우 풍부한 재조합 세포기관이다. 세포기관에서 조립된 PBIS 또는 재조합 PBIS는 막으로 둘러싸인다. 세포에서, RPBLA는 통상적으로 세포의 세포질에서 발견되므로, 추가적인 막(원형질 막)으로 둘러싸인다. 이들 막들(원형질막 및 세포기관막)은 RPBLA 회수 과정동안 제거될 수 있고, 세포기관은 여전히 RPBLA로 여겨진다.

동물 세포들에서 발현시, RPBLA는 대개 구형이고, 약 0.5 내지 약 3 마이크론의 직경을 가지며, 주위 막을 가진다. 식물세포에서 발현된 RPBLA도 대개 구형이고, 약 0.5 내지 2 마이크론의 직경을 가지며, 막으로 둘러싸인다. 그러나, RPBLA는 때때로 형태가 비정형이고 불균일한 크기를 가질 수 있다.

일부 실시예에서, RPBLA는 최소 약 0.3, 최소 약 0.4, 또는 최소 약 0.5 마이크로미터이다. 일부 실시예에서, RPBLA는 약 3 마이크로미터 이하, 약 2.5 마이크로미터 이하, 또는 약 2 마이크로미터 이하이다. 일부 실시예에서, RPBLA는 약 0.3 내지 약 3.0 마이크로미터, 약 0.3 내지 약 2.5 마이크로미터, 또는 약 0.3 내지 약 2 마이크로미터이다. 일부 실시예에서, RPBLA는 약 0.5 내지 약 3.0 마이크로미터, 약 0.5 내지 약 2.5 마이크로미터, 또는 약 0.5 내지 약 2 마이크로미터이다.

일부 실시예에서, RPBLA는 다른 융합 단백질들 중에서 다를 수 있는 밀도를 가지지만, 제조된 특정 융합 단백질에 대해서는 숙주를 가로 질러서 예측될 수 있다. RPBLA의 소정 밀도는 통상적으로는 균질화액에 존재하는 실질적으로 내생 숙주 세포 단백질 전부의 밀도보다 높고, 통상적으로 약 1.1 내지 약 1.4 g/ml이다. RPBLA의 높은 밀도는 자기 조립되고 막과 관련된 규칙적인 응집체로 축적되는 재조합 융합 단백질들의 일반적 능력에 기인한다.

일부 실시예에서, RPBLA는 최소 약 1.0 g/ml의 밀도를 가진다. 일부 실시예에서, RPBLA는 약 1.1 내지 약 1.4 g/ml, 약 1.15 내지 약 1.35 g/ml, 또는 약 1.0 내지 약 1.3 g/ml의 밀도를 가진다. 일부 실시예에서, RPBLA는 단지 약 1.4 g/ml인 밀도를 가진다.

고려된 RPBLA는 위에서 언급된 밀도, 및 이들의 크기 및 형상을 특징으로 한다. 실시예, 물질 및 방법들에서 기재된 스텝-쿠션 이오딕사놀(Optiprep®) 밀도 구배는 주어진 RPBLA의 밀도를 판단하는 유용한 방법이다. RPBLA의 밀도를 판단하기 위해 사용될 수 있는 다른 보완적 또는 적합한 방법은 수크로오스, 글리세롤, 및 퍼콜과 같은 다른 밀도-제공 용질에 기반한 스텝-쿠션 밀도 구배를 포함한다.

또 다른 양태에서, 본 발명은

(i) 식물 숙주 시스템을 핵산 또는 본 발명에 따른 벡터로 형질전환하는 단계;

(ii) 상기 형질전환된 식물 숙주 시스템으로부터 식물을 생성하는 단계; 및

(iii) RPBLA 형성에 적합한 조건으로 상기 식물을 성장시키는 단계를 포함하는 RPBLA 생산 방법에 관한 것이다.

일부 실시예에서, RPBLA는 진핵세포에서 생산된다. 예를 들어, RPBLA는 식물, 동물, 곤충 또는 균류에서 생산될 수 있다. RPBLA의 생산을 위해 적합한 숙주 세포들은, 예로서, 고등 식물(예: 토마토, 담배, 아라비도프시스, 알팔파), 포유동물 세포(예: CHO, COS, 및 293T 세포), 사상균류(예: 트리코더마 리세이 및 아스퍼질럼 sp.), 곤충 세포를 포함한다. 본원에 참조로 포함되고, 본원에서 언급된 바와 같이 RPBLA를 생산하기 위해 사용될 수 있는 다른 예시적 숙주 세포들을 기재한 미국특허 제7,575,898 및 미국 공개출원 번호 제2006/0121573호를 참조하라. 일부 실시예에서, RPBLA는 담배 식물 세포에서 발현된다.

또 다른 실시예에서, 숙주 세포는 고등 진핵 세포이다. 고등 진핵세포는 포유동물 기원의 확립된 세포주를 포함한다. RPBLA를 발현하기 위해 다양한 포유동물 세포 배양 시스템이 유리하게 채용되는데, 이는 단백질이 대개는 올바르게 접혀지고, 적절하게 변형되고 완전히 기능적이기 때문이다. 적합한 포유동물 숙주 세포주의 예는 Gluzman(Cell 23:175, 1981)에 의해 기재된 원숭이 신장 세포의 COS-7 라인, 및 예를 들어, L 세포, C127, 3T3, 중국 햄스터 난소(CHO), HeLa 및 BHK 세포주를 포함하는 적합한 벡터를 발현할 수 있는 기타 세포주를 포함한다. 곤충 세포에서 이종 단백질을 생산하기 위한 바큐로바이러스 시스템이 Luckow and Summers에 의해 Bio / Technology 6:47 (1988)에서 검토되었다.

RPBLA는 잎, 곡물, 뿌리 및 떡잎과 같은 다른 조직에서 생산될 수 있다. 일부 실시예에서, RPBLA는 담배 잎 세포에서 발현된다.

아래에 더욱 상세히 기재된 바와 같이, RPBLA는 재조합 PBIS 또는 재조합 PBIS를 포함하는 융합 단백질을 인코딩하는 폴리뉴클레오티드를 포함하는 숙주 세포를 RPBLA 형성을 위한 적합한 조건에서 배양함으로써 생산될 수 있다. 예를 들어, RPBLA는 식물 숙주 세포를 재조합 PBIS 또는 재조합 PBIS를 포함하는 융합 단백질을 인코딩하는 서열을 포함하는 폴리뉴클레오티드로 형질전환하여, 숙주 세포로부터 형질전환된 식물을 생성하고, 그 식물을 RPBLA 형성에 적합한 조건에서 성장시킴으로써 식물 숙주 세포에서 생산될 수 있다.

RPBLA 형성을 위해 적합한 특정 조건은 실시예에 기재되어 있다. RPBLA 형성에 적합한 다른 조건은, 본원에 기재된 바와 같이 재조합 PBIS를 발현하고 이러한 공지된 재조합 PBIS의 능력에 접근하여 시험된 조건에서 RPBLA를 형성함으로써, 이 기술에서 통상의 지식을 가진 자에 의해 판단될 수 있다.

IX . 재조합 PBIS 를 포함하는 융합 단백질 및 목적 단백질의 RPBLA 의 정제

본 발명에 따른 RPBLA는 알려져 있는 방법을 사용하여 정제될 수 있다. 특히, RPBLA는 숙주 세포에 존재하는 다른 단백질들에 비해 상대적으로 더 조밀하기 때문에, RPBLA는 특히 세포의 균질화액의 원심분리에 의해 수집됨에 있어 수정가능하다.

그러므로, 또 다른 양태에서, 본 발명은 (i) 본 발명에 따른 숙주 세포를 RPBLA 형성을 위한 적합한 조건에서 배양하는 단계; 및 (ii) 재조합 단백질체를 정제하는 단계를 포함하는 RPBLA 정제 방법에 관한 것이다. 또 다른 양태에서, RPBLA 생산 방법은

(ii) 상기 형질전환된 식물 숙주 시스템으로부터 식물을 생성하는 단계;

(iii) RPBLA 형성에 적합한 조건으로 상기 식물을 성장시키는 단계; 및

(iv) 상기 RPBLA를 정제하는 단계를 더 포함한다.

이처럼, 바람직한 실시예에서, 상기 RPBLA의 정제는

(i) 수용성 세포 균질화액을 제조하는 단계;

(ii) 상기 수용성 세포 균질화액에 다른 밀도 영역들을 형성하여 RPBLA의 농도 증가를 포함하는 영역과 상기 RPBLA 농도 감소를 포함하는 영역을 제공하는 단계;

(iii) 상기 RPBLA-감소된 영역을 상대적으로 증가된 농도의 RPBLA 영역으로부터 분리하여 RPBLA를 정제하는 단계를 포함한다.

이처럼, 상이한 밀도의 영역들은 균질화액 내에 형성되어 상대적으로 증가된 농도의 RPBLA를 포함하는 영역과 상대적으로 감소된 농도의 RPBLA를 포함하는 영역을 제공한다. RPBLA-감소된 영역은 상대적으로 증가된 농도의 RPBLA 영역으로부터 분리되어 상기 RPBLA를 정제한다.

RPBLA가 일단 정제되면, 채집된 RPBLA는, RPBLA가 경구 백신으로서 사용된 곳에서처럼, 융합 단백질을 분리할 필요없이, 현재 그대로 사용된다. 그러나, RPBLA의 농도가 상대적으로 증가된 영역은 이후 모아지거나, 하나 이상의 시약으로 처치되거나, 혹은 거기에서 RPBLA 또는 융합 단백질의 분리에 앞서 하나 이상의 절차를 받을 수 있다. 이처럼, 또 다른 양태에서, 본 발명은

(i) 막으로 둘러싸인 본 발명에 따른 융합 단백질을 포함하는 RPBLA를 제공하는 단계;

(ii) 상기 RPBLA를 막 분해할 수 있는 양의 계면활성제 및/또는 환원제를 포함하는 수용성 완충제와 접촉시키는 단계;

(iii) 상기 막을 분리하기에 충분한 시간 동안 상기 융합 단백질을 변성시키지 않는 온도에서 상기 접촉을 유지하여 상기 막을 상기 융합 단백질로부터 분리하는 단계; 및

(iv) 상기 분리된 융합 단백질을 채집하는 단계를 포함하는 융합 단백질 정제방법에 관한 것이다.

생물학적으로 활성인 폴리펩티드를 포함하는 융합 단백질은 세제 및/또는 환원제를 포함하는 수용성 완충제에서 주위 막을 용해시킴으로써 채집된 RPBLA로부터 얻어질 수 있다. 예시적인 환원제는, 단백질 분리 방법에 앞서, 2-머캅토에탄올, 티오글리콜산 및 티오클리콘산염, 디티오트레이톨(DTT), 설파이트 또는 바이설파이트 이온을 포함한다. 다른 이온성(데옥시콜레이트, N-라우로일사르코신 등), 비이온성(트윈 20, Nonidet P-40, 옥틸 글루코시드 등), 및 양성이온(CHAPS, Zwittergent.TM. 3-X serie 등) 계면활성제가 사용될 수 있지만, 소듐 도데실 설페이트(SDS)는 바람직한 세제이다. 융합 단백질을 용해시키거나 분산시키는 최소량의 계면활성제가 사용된다.

재조합 PBIS 또는 재조합 PBIS를 포함하는 융합 단백질이 임의의 다른 적합한 방법에 따라 정제될 수 있다. 단백질 정제를 위한 표준 방법은 크로마토그라피(예: 이온 교환, 친화도 및 사이징 컬럼 크로마토그라피), 원심분리, 용해도 차이법, 또는 임의의 다른 표준 기술을 포함한다. 헥사히스티딘, 말토오스 결합 도메인, 인플루엔자 코트 서열 및 글루타티온-S-트란스페라제와 같은 친화성 태그들이 단백질에 부착되어 적절한 친화성 컬럼 위로 통과시 정제를 쉽게 할 수 있다.

분리된 단백질들은 단백질 가수분해, 핵 자기 공명 및 x-선 결정학과 같은 공지된 기술들을 이용하여 물리적 특징이 분석될 수 있다.

또 다른 양태에서, 본 발명은

(ii) 상기 RPBLA를 막 분해할 수 있는 양의 계면활성제를 포함하는 수용성 완충제와 접촉시키는 단계;

(iii) 상기 막을 분리하기에 충분한 시간 동안 상기 융합 단백질을 변성시키지 않는 온도에서 상기 접촉을 유지하여 상기 막을 상기 융합 단백질로부터 분리하는 단계;

(iv) 상기 분리된 융합 단백질을 채집하는 단계; 및

(v) 상기 재조합 PBIS 및 이종 단백질 사이의 분할 부위를 분할하는 단계를 포함하는 융합 단백질 정제방법에 관한 것이다.

융합 단백질은 동물, 동물 세포 배양액, 식물 또는 식물 세포 배양액, 균류 배양액, 곤충 세포 배양액 또는 조류 배양액과 같은 진핵 숙주 세포계를 (i) 재조합 PBIS를 인코딩하며 제 2 핵산에 작동적으로 연결된 제 1 핵산, 및 (ii) 생물학적으로 활성인 관심있는 폴리펩티드 생성물을 인코딩하는 제 2 핵산 서열을 포함하는 핵산 서열(DNA 또는 RNA)로 형질전환하는 단계를 포함하는 방법에 따라 제조될 수 있다. 바이러스성 형질도입 또는 감염을 통하는 것과 같이 DNA를 도입하는 간접 수단의 사용이 또한 고려되고, 형질주입과 같은 직접 DNA 전달 방법과 상호교환적으로 사용될 것이다.

형질전환된 숙주 세포 또는 개체(entity)는 소정 시간 동안 융합 단백질의 발현 및 발현된 융합 단백질의 RPBLA로의 조립에 적합한 배양 조건에서 유지된다. 발현시, 결과적인 융합 단백질은 형질전환된 숙주계에 RPBLA로서 축적된다. 첨가된 영양소 또는 보충제를 함유하는 동물 식품의 경우, 융합 단백질은 이후 숙주 세포로부터 회수되거나 융합 단백질을 포함하는 숙주 세포가 원하면 사용될 수 있다. 융합 단백질은 RPBLA의 일부로서 분리될 수 있고 혹은 RPBLA 없이 분리될 수 있다.

융합 단백질의 발현에 적합한 배양 조건들은 통상적으로는 숙주 개체 또는 숙주 세포의 각 유형에 대해 다르다. 그러나, 이러한 조건들은 통상의 지식을 가진 자들에게 알려져 있고 쉽게 판단된다. 유사하게, 유지 지속시간은 숙주 세포마다 그리고 제조를 원하는 융합 단백질의 양에 따라 다를 수 있다. 다시, 이러한 조건들은 잘 알려져 있고 특정 상황들에서 쉽게 판단될 수 있다. 추가로, 특이적 배양 조건들은 본원에서 인용문헌 및 실시예들로부터 얻어질 수 있다.

또 다른 특별한 실시예에서, 융합 단백질은 동물, 동물 세포 배양액, 식물, 식물 세포 배양액, 균류 또는 조류를 앞서 언급한 핵산 서열 (i)과 (ii) 외에, 스페이서 아미노산 서열에 대해 암호화하는 인 프레임 핵산 서열 (iii)으로 형질전환하는 단계를 포함하는 방법에 따라 제조된다. 스페이서 아미노산 서열은 앞서 언급된 바와 같이, 효소 또는 화학적 수단에 의해 분할가능한 아미노산 서열이거나 분할되지 않는 아미노산 서열일 수 있다. 특별한 일 실시예에서, 핵산 서열 (iii)은 상기 핵산 서열 (i)과 (ii) 사이에 놓인다. 예를 들어, 제3 핵산 서열 (iii)의 3' 말단은 제2 핵산 서열 (ii)의 5' 말단에 연결된다. 또 다른 실시예에서, 제3 핵산 서열 (iii)의 5' 말단은 제2 핵산 서열 (ii)의 3' 말단에 연결된다.

곤충 세포계도 고려된 융합 단백질을 발현하기 위해 사용될 수 있다. 예를 들어, 이러한 하나의 계에서, 오토그라파 캘리포니아 핵 다면체(Autographa californica nuclear polyhedrosis) 바이러스(AcNPV) 또는 바큐로바이러스는 스포돕테라 프루기페르다(Spodoptera frugiperda) 세포 또는 트리촙루시아 라배(Trichoplusia larvae)로 외래 유전자를 발현하기 위한 벡터로서 사용된다. 융합 단백질을 인코딩하는 서열들은 폴리헤드린 유전자와 같이 바이러스의 비필수 영역으로 복제될 수 있고, 폴리헤드린 프로모터의 조절 하에 놓일 수 있다. 융합 단백질 서열의 성공적인 삽입으로 폴리헤드린 유전자가 비활성이 되고 코트 단백질이 부족한 재조합 바이러스가 생산된다. 이후 재조합 바이러스들은, 예를 들어, Engelhard et al.(1994) Proc. Natl. Acad. Sci., USA, 91:3224-3227; 및 V. Luckow, "Insect Cell Expression Technology", pages 183-218, in Protein Engineering: Principles and Practice, J. L. Cleland et al. eds., Wiley-Liss, Inc. 1996에 기재된 바와 같이 예를 들어, 융합 단백질이 발현될 수 있는 S. Frugiperda 세포 또는 Trichoplusia larvae를 감염시키기 위해 사용될 수 있다. 오토그라파 캘리포니아 핵 다면체 바이러스의 폴리헤드린 프로모터의 조절 하에 놓인 이종유전자들은 종종 감염의 늦은 단계 동안 높은 레벨로 발현된다

융합 단백질 유전자를 포함하는 재조합 바큐로바이러스들은 Bac-To-Bac.TM. 바쿠로바이러스 발현계(Life Technologies)로서 상업적으로 판매되는 바큐로바이러스 셔틀 벡터계를 이용하여 구성된다(Luckow et al., 1993 J. Virol., 67:4566-4579). 재조합 바이러스들의 군체들이 제조되고 재조합 단백질의 발현은 표준 프로토콜에 의해 탐지된다(O'Reilly et al., Baculovirus Expression Vectors: A Laboratory Manual, W.H. Freeman and Company, New York, 1992; 및 King et al., The Baculovirus Expression System: A Laboratory Guide, Chapman & Hall, London, 1992). 이 기술에 통상의 지식을 가진 자에게 알려진 바와 같이 T. Kost 및 공동연구자들(예를 들어, Merrihew 등, 2004 Methods Mol . Biol . 246:355-365 참조)에 의해 기재된 'BacMam' 시스템과 같이, 포유동물 세포들에서 바큐로바이러스 또는 다른 전달 벡터들의 사용이 현재의 발명에서 또한 고려된다.

통상적으로 식물 발현계는 삽입된 이식유전자의 계통적 또는 구성적 발현을 제공한다. 계통적 발현은 식물의 대부분 또는 전부가 RPBLA 및 그의 융합 단백질의 소스로서 사용되는 경우 유용할 수 있다. 그러나, RPBLA와 그의 융합 단백질 함량을 입자들이 더 쉽게 분리 또는 섭취될 수 있는 뿌리, 씨앗, 또는 과일과 같은 식물 저장 기관에서 발현시키는 것이 더 효과적일 수 있다.

저장 기관 발현을 성취하는 한 가지 방식은 하나 이상의 미리 선택되거나 미리 결정된 비광합성 식물 기관에서 그의 조절된 유전자를 발현하는 프로모터를 사용하는 것이다. 뿌리, 씨앗 또는 과일 대 잎 또는 줄기와 같이 하나 이상의 미리 선택된 저장 기관들에서의 발현은 거의 없고, 다른 기관에서 전혀 발현이 없는 발현을 본원에서는 향상된 또는 우선적 발현이라고 한다. 하나의 저장 기관에서만 실질적으로 발현이 있고 다른 저장 기관에서는 실질적으로 발현이 없는 것을 기관-특이적 발현이라고 하고, 즉 약 100:1 이상의 다른 저장 기관에 대한 어떤 저장 기관의 발현 생성물 비는 기관 특이성을 나타낸다. 그러므로, 저장 기관-특이적 프로모터들은 저장 기관-향상 프로모터들의 클래스의 멤버들이다.

예시적인 식물 저장 기관들은 당근, 토란 또는 카사바(manioc), 감자 덩이줄기의 뿌리들, 및 붉은 구아바, 시계꽃 열매, 망고, 파파야, 토마토, 아보카도, 체리, 탄제린, 만다린, 야자, 멜론 써치 칸탈루프 및 워터멜론과 같은 과육 및 호박, 오이, 망고, 살구, 복숭아와 같은 기타 육과, 그리고 옥수수 씨, 대두, 쌀, 지방 종자 평지 등을 포함한다.

아그로박테리아 투메파시엔스를 이용한 식물 세포들의 형질주입은 통상적으로 쌍떡잎 식물에서 가장 잘 수행된다. 외떡잎식물들은 보통 원형질체들의 소위 직접 유전자 전이에 의해 가장 쉽게 형질전환된다. 직접 유전자 전이는 보통 전기천공법에 의해, 폴리에틸렌 글리콜-중재 전이에 의해, 또는 필요한 DNA를 나르는 마이크로프로젝타일에 의한 세포 충돌에 의해 수행된다. 이들 형질주입의 방법들은 이 기술에서 잘 알려져 있고 본원에서 더 논의될 필요는 없다. 식물 조직으로부터 원하는 단백질을 얻기 위한 기술로서 형질주입된 세포들 및 원형질체들로부터 전체 식물들을 재생하는 방법들은 잘 알려져 있다. (미국특허 제5,618,988호 및 제5,679,880호 및 거기에 있는 인용들을 참조)．

아그로박테리아 형질전환, 전기천공법 또는 다른 방법들을 이용하여 형성된 이식유전자를 가진 식물은 통상적으로 하나의 염색체에 대해 하나의 유전자를 포함한다. 이식유전자를 가진 식물은 또한 추가된 구조적 유전자에 대해 동형접합(homozygous), 즉 두 개의 추가된 유전자들을 포함하고, 염색체 쌍의 각 염색체 위의 동일 장소에서 하나의 유전자를 포함하는 이식유전자를 가진 식물일 수 있다. 동형접합의 이식유전자를 가진 식물은 하나의 추가된 유전자를 포함하는 독립적인 분리개체의 이식유전자를 가진 식물을 교배(자가수정)하고, 생산된 씨앗의 일부를 싹트게 하고 대조군(재래종, 이식유전자를 갖지 않은) 또는 독립적인 분리개체 이식유전자를 가진 식물에 상대적인 향상된 키머(chimer) 입자 축적을 위해 생산된 결과적인 식물들을 분석함으로써 얻어질 수 있다. 동형접합의, 이식유전자를 가진 식물은 고유한, 이식유전자를 갖지 않은 식물 및 독립적인 분리개체의 이식유전자를 가진 식물 양자와 비교시 향상된 키머 입자 축적을 보여준다.

이 기술에 통상의 지식을 가진 자는 기재된 바와 같이 본 발명을 이용하여 생산될 수 있는 단백질 또는 펩티드의 선택은 크고 가변적이라는 것을 이해할 것이다. 이들은, 예를 들어 산업 효소, 항원, 사이토카인, 수용체, 작용제, 기능식품 단백질, 부가 생성물, 약학적으로 활성 단백질 등일 수 있다. 이는 제한없이 16ESH, CTB, Gb, Les, TB, PAP, Cap, E2, NP, Her, 글루코사 옥시다아제, 글루코스 이소메라제, 페록시다아제, 대안적 옥시다아제, GOOX, 베타-갈락토시다아제, 글루코스 아밀라아제, 리파아제, 다용도 리파아제, 클로로페록시다아제, 크실로오스(Xylose) 이소메라제, Mn 페록시다아제, 카탈라아제, 포름산염 디하이드로게나아제, 알코올 디하이드로게나아제, 알파1 안티트립신, 디펜신, 인간 성장 호르몬, GM-CSF, EGF, 헤파토사이트 성장 인자 를 포함한다. 이 목록은 결코 철저하지 않다는 것이 이해될 것이다.

X. 약으로서 RPBLA 들의 용도

본원에서 기재된 바와 같이, RPBLA들의 형성은 재조합 PBIS를 포함하는 융합 단백질들이 매우 간단한 기술들을 이용하여 정제될 수 있도록 한다. 그러므로, 재조합 PBIS 및 목적 단백질을 포함하는 융합 단백질들은 쉽게 발현되어 정제될 수 있다. 일부 실시예에서, 목적 단백질은 치료 단백질이다. 그와 같이, 치료제는 재조합 PBIS 및 목적 단백질을 포함하는 융합 단백질을 정제하고 본원에 기재되거나 이 기술에 공지된 방법들을 사용하여 재조합 PBIS를 선택적으로 제거함으로써 제형화될 수 있다. 이후 분리된 목적 단백질은 공지된 기술들에 따라서 약제학적 용도로 제형화될 수 있다.

이처럼, 일부 실시예에서, 본원에 기재된 방법들에 의해 얻어지는 융합 단백질 또는 목적 단백질은 "약제학적으로 허용가능한(pharmaceutically acceptable)" 형태로 제형화된다. "약제학적으로 허용가능한"이란 말은 타당한 치료적 판단의 범위 내에서, 타당한 이익/위험 비와 어울리는 과도한 독성 또는 기타 합병증 없이 인간 및 동물들의 조직과 접촉을 위해 적합할 수 있는 생물학적 생성물을 말한다.

본원에 기재된 방법들에 의해 얻어진 융합 단백질 또는 목적 단백질은 인간을 포함하는 포유동물에게 투여하기 위한 약제학적 조성물로 제형화될 수 있다. 본 발명의 방법들에서 사용된 약제학적 조성물들은, 예를 들어, 이온 교환제, 알루미나, 알루미늄 스테아레이트, 레시틴, 인간 혈청 알부민과 같은 혈청 단백질, 인산염, 글리신, 소르브산, 소르브산염 칼륨, 포화 식물성 지방산의 부분 글리세라이드 혼합물, 물, 프로타민 설페이트, 인산수소이나트륨, 인산수소칼륨, 염화칼륨, 아연염, 콜로이드성 실리카, 마그네슘 트리실리케이트, 폴리비닐 피롤리돈, 셀룰로오스계 물질들, 폴리에틸렌 글리콜, 소듐 카복시메틸셀룰로오스, 폴리아크릴레이트, 왁스, 폴리에틸렌-폴리옥시프로필렌-블록 고분자, 폴리에틸렌 글리콜 및 양모지와 같은 염 또는 전해질를 포함하는 약제학적으로 허용가능한 운반제를 포함한다.

본 발명의 방법들에서 사용된 조성물들은 임의의 적합한 방법, 예를 들어, 비경구적으로, 심실내로, 경구적으로, 흡입 스프레이로, 국소적으로, 직장으로, 비강으로, 구강으로, 질 동맥으로, 또는 주입된 저장기관을 통하여 투여될 수 있다. 본원에서 사용된 바와 같이 "비경구적(parenteral)"이란 용어는 피하의, 정맥내의, 근육내의, 관절 내의, 윤활액 분비 관절 내의, 흉골 내의, 척추 강내의, 담관 내의, 병소 내의, 및 두개 내의 주사 또는 주입 기술들을 포함한다.

임의의 특정 환자를 위한 특정 복용량 및 치료 계획은 사용된 특별 항체, 환자의 나이, 체중, 일반적 건강, 성별, 및 다이어트를 포함하는 다양한 인자들에 달려 있으며, 투여 시간, 분비율, 약 조합, 및 치료될 특정 질환의 심각성을 포함하는 다양한 인자들에 달려있을 것이다. 의료진들에 의한 이러한 인자들의 판단은 이 기술에서 통상의 범위 내이다. 양은 치료될 개별 환자, 투약 경로, 제형의 종류, 사용된 화합물의 특징들, 질병의 심각성, 및 원하는 효과에 의존할 것이다. 사용되는 양은 이 기술에 잘 알려져 있는 약물학 및 약물동력학 원리들에 의해 판단될 수 있다.

또한, RPBLA들은 자체적으로 치료적으로 사용될 수 있다. 예를 들어, 백신 및 접종물에서 RPBLA들의 사용은 전체가 본원에 참조로서 결합되어 있는 미국 공개출원번호 제2007/0243198호에 앞서 기재되었다.

RPBLA들은 인간 환자 또는 침판지, 마우스, 쥐, 말, 양, 소, 개, 고양이 등과 같은 다른 적합한 동물 숙주에서 접종원 또는 백신의 면역원으로서 사용될 수 있다. 접종원은 면역원 에피토우프 또는 항체 결정인자와 면역반응하는 항체들의 생산과 같은 B 세포 또는 T 세포 반응(자극), 또는 이러한 에피토우프에 대한 T 세포 활성화를 유도할 수 있고, 반면에 백신은 면역원이 B 세포 또는 T 세포 반응 중 하나 또는 양자를 통해 유도되었던 개체에 대항하는 보호를 제공한다.

고려된 백신 또는 접종원의 RPBLA들은 RPBLA들을 둘러싸고 그들의 양을 처리하는 수지상 세포들 및 단핵 백혈구/대식세포와 가은 항원 제공 세포(APC)들에 작용할 수 있다. 이러한 세포 유형들에 작용시, RPBLA들은 항원 제공 세포들에게 항원 전달을 개선할 수 있다. 이러한 RPBLA들은 또한 항원 제공 세포들에 대한 항원 처리 및 제공을 개선할 수 있다.

이처럼, 백신 또는 접종원은 약제학적으로 허용가능한 희석제에서 면역성의, 효과적인 양의 재조합 단백질체(RPBLA)들을 용해하거나 분산시킴으로써 생산될 수 있다. RPBLA들은 재조합 융합 단백질을 포함할 수 있고, 상기 재조합 융합 단백질 자체는 서로 연결된 두 개의 서열을 포함한다: 한 서열은 재조합 PBIS이고, 나머지 서열은 면역반응이 상기 백신 또는 접종원에 의해 유도되는 생물학적 활성 폴리펩티드이다.

T 세포 활성화는 다양한 기술에 의해 측정될 수 있다. 실제로는, 숙주 동물은 고려된 RPBLA 백신 또는 접종원으로 접종되고, 말초혈액 단핵구 세포(PMBC)는 이후 수집된다. 이들 PMBC는 이후 약 3 내지 5일 동안 생물학적으로 활성인 폴리펩티드(T 세포 면역원)의 존재 하에서 시험관 내에서 배양된다. 배양된 PMBC는 이후 IL-2, IFN-감마의 GM-CSF와 같은 사이토킨의 증식 또는 분비를 위해 분석된다. T 세포 활성화에 대한 분석은 이 기술에 잘 알려져 있다(예를 들어, 미국특허 제5,478,726호 및 거기에 인용된 기술을 참조).

고려된 접종원 또는 백신은 통상적으로는 물 또한 함유하는 약제학적으로 허용가능한 희석제 조성물에 용해되거나 분산되는 면역학적으로 효과적인 양의 RPBLA들을 포함한다. 생물학적으로 활성인 폴리펩티드에 대한 면역 반응이 면역을 필요로 하는 숙주 동물과 같은 백신 또는 접종원에 의해 유도되거나 항체들이 유도되기를 바라는 포유동물(예를 들어, 마우스, 개, 염소, 양, 말, 소, 원숭이, 유인원 또는 인간) 또는 새(예를 들어, 닭, 칠면조, 오리 또는 거위)와 같은 숙주 동물에 투여시, 접종원은 표적이 되는 생물학적으로 활성인 폴리펩티드의 하나 이상의 항원 결정인자와 면역반응하는 항체들을 유도한다.

각 면역에서 사용된 RPBLA 면역원의 양은 면역학적 유효량이라고 하고, 넓게는 그 중에서도 RPBLA 면역원, 면역된 환자, 및 백신에서 보조제의 존재에 의존한다. (i) 백신 및 (ii) 접종원에 대한 면역학적 유효량들은 앞서 논의된 (i) 보호 또는 (ii) 항체 또는 T 세포 활성을 각각 제공한다.

백신 또는 접종원들은 통상적으로 접종 당 약 1 마이크로그램 내지 약 1 밀리그램(단위 투여량), 바람직하게는 약 10 마이크로그램 내지 약 50 마이크로그램의 RPBLA 면역원 농도를 포함한다. "단위 투여량"이란 용어는, 본 발명의 백신 또는 접종원에 관한 것일 때, 동물들을 위한 단위 복용량으로서 적합한 물리적으로 이산적인 단위들을 말하고, 각 단위는 원하는 희석제, 즉, 운반제 또는 이송제와 관련하여 원하는 면역원 효과를 개별적으로 또는 집합적으로 생성하기 위해 계산된 활성 물질의 소정 양을 포함한다.

백신 또는 접종원들은 전형적으로는 생리학적으로 타당한(허용가능한) 희석제 이송제, 예를 들어 물, 식염수, 인산염-완충 식염수(PBS), 아세트산염-완충 식염수(ABS), 링거액, 등에 면역원을 특별한 형태로 분산시켜서 수용액 조성물을 형성함으로써 회수된 RPBLA 면역원으로부터 제조된다. 희석제 이송체는 이하에서 논의되는 바와 같이 또한 땅콩유, 스쿠알란, 또는 스쿠알렌을 포함할 수 있다.

단백질성 물질을 활성 성분으로서 포함하는 접종원 및 백신의 제조는 이 기술에서 잘 이해된다. 통상적으로, 이러한 접종원 또는 백신들은 액체 용액 또는 현탁액 중 어느 하나로서 비경구제로서 제조되고; 주사 전 액체로 있는 용액 또는 현탁액을 위한 고체 형태들이 제조될 수 있다. 제조품은 에멀션화될 수도 있는데, 이것이 특히 바람직하다.

면역적으로 활성인 RPBLA들은 약제학적으로 허용가능하고 활성 성분과 양립할 수 있는 부형제들과 종종 혼합된다. 적합한 부형제들은, 예를 들어, 물, 식염수, 덱스트로스, 글리세롤, 에탄올 등 및 이들의 조합들이다. 아울러, 원하면, 접종원 또는 백신은 조성물의 면역성 효과를 향상시키는 미량의 보조 물질들, 예를 들어 습식 또는 에멀션화제, pH 완충제를 포함할 수 있다.

XI . 식품으로서 RPBLA 들의 용도

또한 RPBLA는 음식물의 영양가를 증대시키기 위하여 이용될 수도 있다. 예를 들어, 융합 단백질은 재조합 PBIS 및 영양가 있는 단백질이나 펩티드(예컨대, 필수 아미노산 내에 풍부한 펩티드)를 포함하며 식품으로 발현될 수 있다. 이러한 융합 단백질은 일부 실시예에서, 와일드 타입 PBIS 보다 덜 알레르기성인 재조합 PBIS를 포함한다. 본 발명의 저자들은 본 발명에 따른 PBIS가, 비변형된 제인 PBIS와 비교시, 예상되는 알레르기의 감소를 나타낸다는 것을 관찰하였다. 또한, 이러한 관찰을 기초로 본 발명의 저자들은 감소된 알레르기를 나타내는 신규 PBIS(이하에서 RX3-LA1 및 RX3-LA2로 칭함)를 또한 개발하였다.

따라서, 다른 양태에서, 본 발명은 PBIS의 비 알레르기성 버전에 관한 것으로, 상기 PBIS는 RX3-LA1 (서열번호 60) 및 RX3-LA2 (서열번호 61)로 이루어진 군에서 선택된다.

RX3-LA1 (서열번호 60)

THTSGGCGCA PPPPAAAPPP AAAPPPAAAP PPAAAPPPAA APPPAAAPPP AAAPPPAAAP PPPCHYPTAP ARPAPAPAPA PCPCAAPAPS PCQ

RX3-LA2 (서열번호 61)

THTSGGCGCA PPPPAAAPPP AAAPPPAAAP PPAAAPPPAA APPPAAAPPP AAAPPPAAAP PPPCHYPPAP APPAPAPPAP ACPCAAPAPS PCQ

일부 실시예에서, 재조합 PBIS는 와일드 타입 PBIS, 예컨데, 옥수수 감마-제인의 PBIS 보다 알레르기성이 덜하다.

알레르기는 본원에서 설명된 방법 또는 당업계에서 알려진 다른 방법들에 따라 판단될 수 있다. 예를 들어, 아미노산 서열 상동성이 알레르기 포텐셜을 평가하는 데 사용되었다. 서열 상동성 비교는 신규 발현되거나 식별된 단백질이 공지의 알레르기와 구조가 어느 정도 유사한지를 결정하는 데 사용될 수 있다. 이러한 정보로 그 단백질이 알레르기 포텐셜을 갖는지를 예측할 수 있다. 이러한 비교는 FASTA 또는 BLASTP와 같은 다양한 알고리즘을 이용하여 수행되어 전체적인 구조적 유사성을 예측할 수 있다. 신규 발현되거나 식별된 단백질과 공지의 알레르겐 사이의 IgE 교차 반응성은 80 이상의 아미노산의 단편에서 35 퍼센트 이상의 동일성이 있는 경우 가능성 있는 것으로 간주될 수 있다(유엔 식량농업기구 및 세계보건기구, 2001). 또한 기타 과학적으로 정당한 기준이 IgE 교차 반응성을 예측하는 데 사용될 수 있다.

일부 실시예에서, 재조합 PBIS의 식품알레르기는 FARRP(Food Allergy Research and Resource Program)이 개발한 알레르겐 온라인 데이터베이스(Allergen Online Database)(버전 10.0, 2010년 1월; http://www.allergenonline.com)를 이용하여 결정된다. 따라서, 일부 실시예에서, 재조합 PBIS는 알레르겐 온라인 데이터베이스를 이용하면 옥수수 감마-제인의 PBIS보다 알레르기성 펩티드에 대한 35%초과의 동일성을 가지는 결과(hit)들은 많지 않다.

일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 9개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 8개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 7개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 6개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 5개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 4개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 3개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 2개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 1개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 35%의 동일성을 가진 결과들을 아무것도 포함하지 않는다.

일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 9개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 8개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 7개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 6개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 5개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 4개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 3개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 2개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 1개 이하의 결과들을 포함한다. 일부 실시예에서, 재조합 PBIS는 공지의 알레르기성 펩티드와 최소 30%의 동일성을 가진 결과들을 어느 것도 포함하지 않는다.

여러 기술들이 알레르기의 투여 후 발생하는 알레르기성 반응을 판단하기 위해 발전되어 왔다. 일례로, IgE의 존재, 알레르기와 관련된 면역 글로불린이 ELISA 검정 및 ELISA 비교 시험에 의해 판단될 수 있다. Kim 등의 Yonsei Medical Journal 47: 505-12 (2006) 및 Fritsche의 Toxicology letters 140-141:303-309 (2003), 양자 모두가 그 전체가 본원에 참고로 포함된다. 일부 실시예에서, 재조합 PBIS는 옥수수 감마-제인의 PBIS과 비교시 생체 내에서 감소된 IgE 항체 응답을 일으킨다. 일부 실시예에서, 재조합 PBIS는 옥수수 감마-제인의 PBIS와 비교시 알레르기 피부단자 시험에서 감소된 응답을 일으킨다.

또한, 펩신 소화에 대한 저항성이 몇몇 음식 알레르겐에서 관찰되었다. 따라서, 펩신에 의한 소화 저항성과 알레르기 포텐셜 간에는 상관관계가 존재한다. 미국 약전(United States Pharmacopoeia)(1995)에 개략 서술된 방법이 상관관계를 수립하는 데 사용되었다. 그 전체가 참조로 본원에 포함된 Astwood 등의 Nat Biotechnol 14:1269-73 (1996). 따라서, 적절한 조건에서 펩신의 존재 하에서의 단백질의 분해 저항성은 단백질이 알레르기성 포텐셜을 가질 수 있음을 나타낸다. 일부 실시예에서, 재조합 PBIS는 옥수수 감마-제인의 PBIS 보다 펩신의 존재 하에서 단백질 분해에 대한 저항성이 덜하다.

신규 발현되거나 식별된 단백질의 알레르기성 포텐셜의 가능성을 판단하기 위해 추가 분석이 수행될 수 있다. 생체 외 과정도 또한 세포나 조직 배양을 이용하여 알레르기성에 대한 시험으로 기술되었다. 유전자 변형 식품의 알레르기성에 대한 평가: 바이오기술에서 유래된 식품의 알레르기성에 대한 FAO/WHO 공동 전문가 상담 보고서(Report of Joint FAO/WHO Expert Consultation on Allergenicity of Foods Derived from Biotechnology); 유엔 식량농업기구; 이태리, 로마(2001)). 이러한 기술들 중 하나는 알레르기 유발 항원요소의 능력을 촉발하는 IgE 중재된 비만 세포가 생체내 기능성 검정을 이용하여 측정될 수 있다는 사실에 기초한다. 수동적으로 특정 쥐 IgE에 민감하며 3H-용액으로 표지화된 복막 쥐 비만 세포에 기초하여, 세포가 알레르겐의 표준 희석에 의해 매개체의 유리를 위해 촉발된다. Fritsche의 Toxicology letters 140-141:303-309 (2003). 따라서, 일부 실시예에서 재조합 PBIS는 옥수수 감마-제인의 PBIS와 비교 시 감소된 매개체 유리를 일으킨다.

IgE 의존성 알레르기 반응은 2단계로 이루어진다. 제1 단계는 유도 단계로 숙주의 면역계가 알레르겐에 의해 민감하게 되는 단계이다. 그 결과, 특정 IgE 항-알레르겐 항체가 생성된 후 항체가 표적 기관의 비만 세포에 고정된다. 제2 단계는 알레르겐이 이러한 IgE 항체에 결합하여 비만 세포로부터 매개체(히스타민) 유리를 촉진함으로서 매개되는 촉발 단계이다. 항원의 알레르기성을 평가하기 위해, 기본적으로 그 전체가 본원에 참조로 포함된 Fritsche의 Toxicology letters 140-141:303-309 (2003)에 기술된 것과 같은 적절한 생체 내 시험에 의해 조사될 수 있다. 따라서, 예를 들어, 일부 실시예에서 재조합 PBIS는 옥수수 감마-제인의 PBIS와 비교시 감소된 IgE 항체 생산을 일으킨다. 일부 실시예에서, 재조합 PBIS는 옥수수 감마-제인의 PBIS와 비교시 비만 세포로부터의 감소된 매개체 유리를 일으킨다.

다른 양태에서, 본 발명은 본 발명에 따른 RPBLA 또는 상기 RPBLA를 포함하는 숙주 세포 또는 유기체로부터 유래된 물질을 함유하는 식품, 보조 식품, 화장 제재, 영양 제재를 제공한다. RPBLA는 RPBLA를 포함하는 융합 단백질과 같은 PBIS에 의해 또는 그러한 융합 단백질에 의해 형성될 수 있다. 바람직한 실시예에서, 식품의 일부를 구성하는 RPBLA는 PA, RX3(A3), R8(4C), RX3-LA1, RX3-LA2 및 이들의 조합의 군으로부터 선택된 PBIS를 포함하는 융합 단백질의 조립체에 의해 형성된다.

본원에서 사용되는 "식품"이라는 용어는 인간 및/또는 동물이 소비하기 적합한 물질 또는 조성물을 말한다. 본원에서 사용되는 "식품"이라는 용어는 소비되기 쉬운 형태의 식품을 의미할 수 있다. 하지만, 대안적으로 또는 추가적으로, 본원에서 사용되는 식품이라는 용어는 식품 제조에 사용되는 하나 이상의 식재료를 의미할 수 있다. 단지 예로서 식품이라는 용어는 밀가루 반죽으로부터 만들어진 구워진 제품 뿐만 아니라 상기 구워진 제품의 제조에 사용되는 밀가루 반죽을 포함한다.

본 발명에 따른 식품은 본 발명에 따른 RBPLA를 발현시키는 재조합 유기체의 전체 또는 일부로부터 유래할 수 있다. 예를 들어, 식품은 RBPLA을 발현하는 배젖으로부터 유래할 수 있다. 본 발명의 번식물질 또는 그 일부를 함유하는 식품 및 보조 식품은 곡류계 음식, 예컨대, 조식용 시리얼, 곡물가루, 이러한 곡물가루를 포함하는 식품(예컨대, 빵, 빵 부스러기, 반죽, 케이크, 페이스트리, 비스켓, 베이커리 제품 및 파스타)을 포함할 수 있다. 또한, 괴경 또는 얌과 같은 야채류의 번식물질 또는 그 일부를 함유하는 식품 및 보조 식품도 제공된다. 예를 들어, 식품은 (a) 유아 음식 또는 유동식; 또는 (b) 베이커리 제품(예컨대 빵, 효모 제품 또는 케이크); (c) 베이커리 공급품(예컨대, 커스타드 또는 베이커리 필링(filling) 또는 토핑(topping)); (d) 빵 부스러기; 또는 (e) 브레딩; 또는 (f) 시리얼; 또는 (g) 제과; 또는 (h) 가루 또는 음료수 유제; (i) 과일 필링; 또는 (j) 그레이비(gravy),수프, 소스 또는 식품 점증제(food thickner); 또는 (k) 곡물 또는 곡물 성분; 또는 (l) 육류 제품; 또는 (m) 애완 동물 먹이; (n) 약 또는 기능 식품; 또는 (o) 감자 또는 얌 제품; 또는 (p) 유제품(예컨대, 디저트나 요거트); 또는 (q) 샐러드 드레싱; 또는 (r) 스낵 또는 크래커; 또는 (s) 스프레드; 또는 (t) 파스타 제품(예컨대, 국수)에서 선택될 수 있다.

이상에서 기술한 본 발명의 형질전환 식물은 가축류, 가금류, 애완동물 및 기타 동물뿐만 아니라 사람에게도 적용가능하다.

본 발명은 다음의 예로써 보다 상세히 기재되는데, 이 예들은 단지 예시적일 뿐 본 발명의 범주를 제한하는 것으로 해석해서는 안 된다.

실시예

재료 및 방법

식물 형질전환을 위한 플라스미드 구성

모든 플라스미드 컨스트럭트들은 동일 제한 효소들에 의해 열려진 pC2300 벡터(AF234315)로 SalI/BamHI 소화에 의해 도 15a 및 15b에 도시된 융합 단백질을 암호화하는 DNA 절편을 복제함으로써 구성되었다.

식물 물질

담배(Nicotiana benthamiana) 식물들을 24~26℃에서 16 시간의 광주기로 시험관 내 성장 챔버에서 성장시켰다. 18~28℃ 사이의 그린하우스에서 성인 식물들을 성장시켰다. 평균 16시간의 광주기와 함께 습도를 55%와 65% 사이에서 유지하였다.

아그로인필트레이션(Vaquero et al., 1999 Proc. Natl. Acad. Sci., USA 96(20):11128-11133; Kapila et al., 1997 Plant Sci. 122:101-108)를 위한 묘목들을 위에서 기재된 시험관 내 조건으로 종자로부터 4~6주 동안 성장시켰다.

진공에 의한 담배 아그로인필트레이션

원하는 컨스트럭트를 포함하는 투메페이션스 변종 EHA 105를 카나마이신(50 mg/l) 및 리팜피신(100 mg/l)으로 보충된 LB 배지(Triptone 10 g/l, 효소 추출물 5 g/l, NaCl 10 g/l)에서 28℃로 밤새(약 18시간) 교반(250 rpm)하면서 성장시켰다. 이후 아그로박테리아를 카나마이신(50 mg/l) 및 리팜피신(100 mg/l)으로 보충된 30 ml의 LB에 접종하였다. 28℃에서 밤새(약 18시간) 배양 후, 아그로박테리아 세포들을 3,000 x g로 10분 동안 원심분리에 의해 채집하여 MES (Sigma Chemical) 4.9 g/l 및 수크로오스 30 g/l으로 pH 5.8에서 10 ml의 액체 MS 배지에 재현탁하였다. 박테리아 배양을 아그로인필트레이션 동안 0.1의 최종 OD600으로 조절하였다. 이후, 세포 배양액을 0.2 mM의 최종 농도까지 아세토시린곤으로 보충하였고 28℃에서 90분 동안 인큐베이션하였다(Torrent, M., Llop-Tous, I., and Ludevid, M.D. (2009) In Recombinant Proteins from plants. Methods in Molecular Biology. Vol 483. Ed by Gomord V and Faye L, Springer Verlag, Humana Press, Heidelberg; pp 193-208; Voinnet, O., Rivas, S., Mestre, P., and Baulcombe, D. (2003) Plant J. 33, 949-956 참조). RX3 컨스트럭트들과 HC-Pro 사일런싱 억제 컨스트럭트(Goytia et al.,2006)을 나르는 개별적인 아그로박테리아 배양액들을 함께 혼합하였다. 식물들을 현탁액으로 완전히 덮었고, 5~6초 동안 진공을 적용하였다(100 KPa). 현탁액을 제거하였고 식물들을 온실에서 유지하였다. 식물 재료를 회수하여 적당한 항체를 이용하는 면역블롯으로 총 단백질 추출물을 분석하였다.

주사에 의한 담배 아그로인필트레이션

아그로박테리아 투메페이션스 변종 EHA 105를 50 μg mL^-1 카나마이신 및 50μg mL-1 리팜피신으로 보충된 L-브로스에서 정지상으로 성장시켰다. 실온에서 5000 x g로 15분 동안 원심분리하여 박테리아를 침전시켰고 10mM MES 완충액 pH 5.6, 10 mM MgCl₂ 및 200 μM 아세토시린곤에 0.2의 최종 OD600까지 재현탁하였다. 세포들을 이 배지에 실온에서 3시간 동안 남겨두었다. RX3 컨스트럭트와 HC-Pro 사일런싱 억제 컨스트럭트(Goytia et al., 2006)를 나르는 개별적인 아그로박테리아 배양액들을 함께 혼합하여 생후 24주의 니코티아나 벤타미아나 식물들의 잎들의 배축면으로 침투시켰다.

단백질 추출 및 총 단백질 또는 면역블롯 분석

형질전환된 잎들로부터 총 가용성 단백질(TSPs)을 100 mM NaCl, 0.5% SDS 및 200 mM DTT를 함유하는 100 mM Tris-HCl 완충액 pH 7.5에서 실온에서 1시간 동안 추출하였다. 결과적인 추출물들을 10,000 x g로 30분 동안 4℃에서 원심분리하였고 TSP들을 SDS-폴리아크릴아미드 겔 상에 분리하였다. 쿠마시 블루로 염색 또는 실버 염색 또는 항-R8 항혈청(Torrent, M., Llompart, B., Lasserre-Ramassamy, S., Llop-Tous, I., Bastida, M., Marzabal, P., Westerholm-Pavinen, A., Saloheimo, M., Heifetz, P. B., and Ludevid, M.D. (2009) BMC Biology 7, 5), 항-GFP, 또는 대장균(E.Coli) 세포로부터 발현되고 정제된 재조합 GFP 또는 hGH 단백질을 주사받은 토끼에서 높아진 항-hGH, 및 상업적 항-EGF(Abcam)를 사용하는 면역 블롯에 의해 단백질을 검출하였다.

초원심세포 분획법 및 RPBLA 밀도 판단.

아그로인필트레이션된 담배 잎 조직을 HB 균질화 완충액(Tris 10 mM pH 8.0, 0.25 M 수크로오스 및 프로테아제 억제제)에서 0℃로 모르타르로 연마하였다. 균질화액을 2층의 미라클로스(22-24 micrometers, Calbiochem)로 여과하여 50 x g로 4℃에서 5분 동안 원심분리하기 전에 조직 파편을 제거하였다. 다양한 조직들로부터 얻은 맑게 된 균질화액들을 HB 완충액으로 완충된 다단 이오딕사놀(Optiprep, Sigma) 밀도 기반 구배(밀도 계산을 위한 바람직한 단계: 1.11, 1.17, 1.19, 1.21, 1.23 및 1.25 g/cm³)로 로딩하였다.구배들을 Beckman SW40 Ti 로터에서 80,000 x g로 2시간 동안 4°C에서 원심분리하였다. 상청액, 계면 분획물, 및 펠릿의 등가 약수들을 특정 항체들을 이용하여 SDS-PAGE 및 면역블롯으로 분석하였다.

위에 나타낸 바와 같이, 이 기술은 RPBLA들의 밀도를 판단하기에 적합한 기술이다. 다음 표는 주어진 쿠션에서의 이오딕사놀 %(w/v) 및 해당 밀도 사이의 상세한 비율을 제공한다:

주어진 쿠션에서 이오딕사놀%(w/v) 및 해당 밀도 사이의 비율

퍼센트 이오딕사놀 (w/v)	밀도(g/mL)	백분율 이오딕사놀 (w/v)	밀도(g/mL)
8	1.069	30	1.175
10	1.079	32	1.185
12	1.088	34	1.194
14	1.098	36	1.204
16	1.107	38	1.214
18	1.117	40	1.223
20	1.127	42	1.233
22	1.136	44	1.243
24	1.146	46	1.252
26	1.156	48	1.262
28	1.165	50	1.272

면역세포화학 및 영상화: 공초점 현미경.

형광 유도 서열로 형질전환된 잎 담배 조직의 단편들을 직접 공초점 관찰을 위하여 물에 넣었다. 공초점 레이저 스캐닝 현미경 라이카 TCS SP(Heidelberg, Germany)를 사용하여 현미경 사진을 얻었다. 530~630 nm의 방출창을 사용한 515 nm 여기 후 녹색 형광 영상을 수집하였다. 458 nm 여기 및 470~530 nm 방출창에서 시안 형광 영상을 수집하였다. 495~535 nm 에서 세팅된 방출창을 이용하여 488 nm 여기에서 아르곤 이온 레이저로 녹색 형광 단백질 영상을 수집하였다. HeNe 레이저 및 550~600 nm 방출창으로 543 nm 여기 후 적색 형광 영상을 수집하였다. 광학 섹션들(optical sections)은 0.5 ㎛ 두께였다. 디지털 영상 및 투사 영상을 공초점 현미경 소프트웨어를 사용하여 기록하였다. 현미경 사진으로 제공된 영상들은 최소 5가지 독립적인 실험들을 나타낸다.

공초점 현미경에 의한 RPBLA 들의 수 및 크기 판단

시간에 따른 PB들의 크기(상대적 백분율)에 의한 분포를 시점 (2, 4, 7, 및 10 dpi) 당 약 500 PB들의 겉보기 직경을 측정하여 판단하였다. 세 가지 독립적인 형질전환 식물들을 시점 마다 분석하였고 OLympus fluoview v. 1.6a 소프트웨어를 사용하여 FV1000 Olympus 공초점 현미경으로 관찰된 형광 PB들을 측정하였다. PB 수 판단을 위해, 10⁵ μm³ (70 x 70 x 20) 의 형질전환된 조직에 대응하는 공초점 투사를 사용하였다. 8 가지 독립적인 형질전환 식물로부터 40개의 공초점 영상을 시점 마다 분석하였다. 일방향 ANOVA(Analysis of Variance) 및 Bonferroni Multiple Comparisions 검사(p < 0.05 는 상당히 다르게 여겨짐)로 결과를 분석하였다.

저속 스밈 원심분리법에서( low seep centrifugation ) RPBLA 분리

약 1그램의 아그로인필트레이션된 담배 잎 조직을 5 mL의 PB3 균질화 완충액(Tris 100 mM pH 8.0, 50 mM KCl, 6 mM MgCl2, 10 mM EDTA 및 0.5 M NaCl)에서 0℃로 모르타르에서 분쇄하였다. 균질화액(H0)을 1층 미라클로스(22~24 micrometers, Calbiochem)를 통해 여과하였다. 미리 맑게 처리된 균질화액으로부터 결과적으로 맑게 된 균질화액을 저속(1,500 x g)로 10분간 원심분리하였고, 결과적인 펠릿과 상청액(SN)을 분석하였다. 저속 원심분리 펠릿을 3~5 mL의 세정 완충액(0.5% Triton® X-100)에서 약한 초음파파쇄(사이클 50%, 출력 조절 3, 10 초, Brandson sonifier 250)로 재현탁하였고 마지막으로 실온에서 15~60분 동안 인큐베이션하였다. 제2 저속 원심분리 후, 동일량의 결과적인 펠릿(wPB) 및 상청액(Ws)을 분석하였다.

EGF 정제

80그램(신선한 중량)의 Zera(E)-EGF 아그로인필트레이션된 담배 식물 잎에서 얻은 wPB분획물을 위에서처럼 가용화하였고 2 mM CaCl₂의 존재하에서 37℃로 30마이크로리터의 FXa(Quiagen)으로 분할하였다. 50 mM EDTA를 첨가하고 3시간 후에 반응이 멈췄다. 이후 시료를 완충액 A에서 5배 희석하였다. Amersham의 3 mL 리소스 역상 컬럼으로 EGF를 정제하였다. 완충액 A(10 mM 아세트산염 pH4, 2 mM bME 및 5% 아세토니트릴) 및 완충액 B(10mM 아세트산염 pH4, 2 mM bME 및 75% 아세토니트릴)를 이용하여 20 가지 컬럼 용적으로 아세토니트릴 구배를 수행하였다. 약 40%의 아세토니트릴에서 순수한 EGF 두 분획물을 회수하여 50 mM Tris pH8, 2 mM bME 및 100 mM NaCl에 대해 3.5 kDA 투석막에서 4°C로 밤새 투석하였다.

EGF 활성 분석

EGF 수용체를 과발현하는 인간 상피조직의 암종 세포주 세포(A431)를 0.5x10⁵ 세포/플레이트로 플레이트들(P-35)에 심었다. 성장 배지(MEMx1, 2 mM 글루타민, 1% 의 비필수 아미노산) 및 10% FBS(소태아혈청)에서 48시간 동안 세포들을 인큐베이션 하였다. 이 후, 그 세포들을 FBS 없이 성장 배지에서 밤새 굶겼다. 이후, 프로메가로부터의 표준 EGF(0 내지 100 ng EGF/mL)와 대응 시료들(가용화된 RX3(E)-EGF 및 EGF)을 동일 범위의 농도로 첨가하였고 세포들을 9분 동안 인큐베이션 하였다. 이후, 세포들을 찬 PBS로 2회 세척하였고 액체 질소(N₂)에서 냉각시켜 세포대사를 멈추었다. EGF 수용체의 인산화를 분석하기 위해, 세포들을 긁어내어 동일양의 총 단백질을 제조자가 기재한 바와 같이 PathScan® Phospho-EGF Receptor (Tyr1068) sandwich ELISA kit로 분석하였다.

실시예 1: 형질전환된 담배 식물들의 RPBLA 들에서 RX3 - GFP , RX3 (R)- GFP , RX3(K)-ECFP, RX3 (A)- GFP 및 RX3 (L)- GFP 의 축적

RX3의 반복 도메인의 양친매성은 자기 조립체 및 RPBLA 형성에 있어서 필수적인 것으로 기재되어 있다(Ludevid et al., Plant Mol. Biol. (1984) 3:277-234; Kogan et al., J. Mol. Biol. (2001) 312:907-913). RPBLA들 유도 용량에 대한 양친매성의 중요성을 특징화하기 위해, 리포터 형광 단백질(GFP 또는 ECFP)에 융합된 RX3 태그 세트를 분석하였다(도 1A): 히스티딘 (PPPVHL)₈ (서열번호 62) [RX3]을 갖는 재래종 RX3, 히스티딘의 아르기닌 (PPPVRL)₈ (서열번호 63) [RX3(R)] 및 리신 (PPPVKL)₈ (서열번호 64) [RX3(K)]에 의한 치환에 의해 얻어지는 향상된 양친매성 특성을 갖는 두 개의 RX3 이형, 및 히스티딘들이 아날린 (PPPVAL)₈ (서열번호 66) [RX3(A)] 및 류신 (PPPVLL)₈ (서열번호 67) [RX3(L)]으로 치환된 경우 완전 소수성 RD를 갖는 두 개의 RX3 이형.

예상한 바와 같이, RX3-GFP로 형질전환된 담배 식물들은 세포 내에 약 1 마이크로미터 직경의 수많은 둥근 형상의 형광 RPBLA들을 축적하였다. 놀랍게도, 양친매성 RD가 없음에도 불구하고, 융합 단백질 RX3(A)-GFP 및 RX3(L)-GFP는 세포의 소포체(ER) 내에 유지되었고 RPBLA들을 형성하였다(도 1C).

RX3(A)-GFP 융합 단백질은 RX3-GFP의 발현으로부터 얻어지는 RPBLA보다 약간 더 큰 대형 RPBLA에 축적되었다. RX3(L)-GFP RPBLA들은 약 0.5 마이크로미터로 측정되었다. 세포 표면에서 형광은 관찰되지 않았는데, 이는 RPBLA들에 단백질이 효율적으로 축적되었으며 분비되지 않았음을 나타낸다. 이들 연구들은 또한 완전히 소수성인 RD를 갖는 RX3 태그들은 식물에서 RPBLA들의 형성을 조립 및 유도할 수 있다는 것을 나타낸다.

소수성 RD를 포함하는 RX3 태그들로 얻어진 놀라운 결과들을 근거로, 히스티딘 전부가 아르기닌 [RX3(R)] 또는 리신 [RX3(K)]으로 치환되는 양친매성 RX3의 축적을 분석함으로써 RX3 태그들의 RD 양친매성의 중요성을 더욱 특징화하는 것이 결정되었다. 아르기닌 및 리신은 히스티딘에 비해 높은 pKa(각각 12 및 10.5)를 가진다. 이처럼, 이들 치환은 소포체 pH 값이 더 높은 양의 순전하, 증가된 순 양전하 및 증가된 RD의 양친매성을 갖는 RD로 귀결된다. 놀랍게도, 공초점 현미경 분석은 이들 컨스트럭트들을 사용한 경우 매우 낮은 형광을 보여주었다. 다른 RX3 이형들을 위해 사용된 동일 조건들이 RX3(R)-GFP 및 RX3(K)-ECFP에 적용되었을 때, 상당한 신호는 관찰되지 않았다. 유사하게, RX3(R)-GFP 및 RX3(K)-ECFP 융합 단백질의 낮은 축적이 항-GFP 항체를 이용한 웨스턴 블롯으로 관찰되었다. 도 1B에 도시된 바와 같이, RX3(R)-GFP는 RX3-GFP에 비해 축적이 빈약하였고, RX3(K)-ECFP 융합 단백질은 관찰되지 않았다. 흥미롭게도, RX3(K)-ECFP를 발현하는 균질화액에서, 항-GFP 항체와 면역반응성인 더 높은 이동도 밴드만이 관찰되었다. 이 밴드는 아마도 부분 퇴화된 ECFP(도 1B, 레인 4, 흑색 화살촉)에 해당한다. pRX3(R)-GFP 또는 pRX3(K)-ECFP로 아그로박테리아 침투된 담배 잎의 장시간 노출 영상들은 단백질이 ER 유래 RPBLA에 효율적으로 유지되지 않는다는 것을 보여주었다. RX3(R)-GFP의 발현은 다수의 융합 단백질의 분비 및 세포 내에 아주 작은 수의 매우 작은 크기의 RPBLA들만 축적되는 결과를 낳았다 (도 1C). RX3(K)-ECFP의 경우, 결과는 심지어 더욱 놀라웠는데, 이는 RPBLA가 전혀 관찰되지 않았고 형광이 엽록체 및 분비와 관련이 있었기 때문이었다(도 1C, 박스내). 이 실험 및 융합 단백질 대부분이 퇴화되는 것처럼 보인다는 사실을 근거로, 염색체와 관련된 형광은 부분 퇴화된 ECFP에 기인하는 것이 가능하다. RX3(K)-ECFP는 이 세포기관으로 분류되지 않을 것 같다.

점증적으로, 이들 결과들은 문헌에서 제시된 것과는 반대로, RX3의 양친매성이 단백질 조립 및 RPBLA 유도에 필요한 주요 요소는 아니다. 더욱이, 히스티딘을 아르기닌 또는 리신으로 치환함에 의한 RD의 양친매성의 향상은 RPBLA의 형성을 유도하는 이들 펩티드들의 능력을 상당히 감소시킨다.

실시예 2: 담배 식물들에서 RX3 - GFP , RX3 (A)- GFP , 및 RX3 (L)- GFP 에 의해 유도된 RPBLA 들의 밀도 특성화

RPBLA들의 한 가지 특징은 단계별 밀도 구배(Torrent, BMC Biology 2009, 7:5)로 판단될 수 있는 이들의 높은 밀도이다. 본 연구에서, Optiprep^TM 구배들은 하기 Optiprep^TM 단계 쿠션들 하에서 여과된 식물 균질화액들을 로딩함으로써 수행되었다:

Optiprep 농도(%) 및 밀도(g/mL)의 대응 표

Optiprep^TM	밀도 (g/mL)
18	1.117
30	1.175
34	1.194
38	1.214
42	1.233
46	1.252

마이크로솜들(ER, 골지 등)은 18%의 Optiprep^TM을 갖는 저밀도 쿠션 위의 상간(interphase)인 분획물 fl8로 침전되었다. 통상적으로, RPBLA들은 마이크로솜들보다 더 조밀하고 26~28%의 Optiprep^TM보다 더 고밀도의 분획물들로부터 회수된다.

도 2에 도시된 바와 같이, 융합 단백질 RX3-GFP를 발현하는 담배 식물의 균질화액이 예상과 같이 주어진 단계 밀도 구배로 초원심분리되었을 때, 단백질 대부분은 고밀도 분획물들 f34 및 f38에 회수되었다. 이 결과는 융합 단백질이 ER 내부에 단단하게 조립되어 RPBLA들을 형성한다는 것을 나타낸다. 일부 RX3-GFP 또한 마이크로솜들에 대응하는 저밀도 분획물 f18에서 관찰되지만, 이는 아마도 고밀도 구조로 완전히 형성되지 않은 새로 합성된 융합 단백질을 나타낸다.

위에서 언급된 바와 같이, 분석된 컨스트럭트들 중 두 개는 완전히 소수성인 RD(RX3(A)-GFP 및 RX3(L)-GFP)를 가졌고, 둘 모두 세포 내부에서 RPBLA들의 형성을 유도하였다. RX3(A)-GFP를 밀도 구배로 분석하였을 때, 융합 단백질 대부분은 고밀도 분획물들(f30 및 f34)에 축적되었고, RX3(A)-GFP는 고밀도 RPBLA들에 축적된다는 것을 확인하였다. RX3(L)-GFP로 형질전환된 담배 잎들로부터 얻은 맑은 균질화액들을 분석하였을 때 유사한 결과들을 얻었다. 이 경우, RPBLA들이 RX3(A)-GFP의 발현에 의해 유도된 것들보다 심지어 덜 조밀하였음에도, 이들 중 상당한 부분은 고밀도 분획물들(도 2B; f30 및 f34)에서 회수되었다.

이들 데이터는 양친매성 RD가 없음에도 불구하고, RX3(A)-GFP 및 어느 정도까지 RX3(L)-GFP는 세포 오염물들 대부분으로부터 분리되기에 충분한 고밀도의 RPBLA들에서 효율적으로 자기조립될 수 있다는 것을 보여준다. RX3(A)-GFP 균질화액으로 로딩된 밀도 구배로부터 회수된 동일 용적의 분획물들의 쿠마시 블루 염색에 의한 분석이 도 2B에 도시되어 있다. 세포 오염물들 대부분이 분획물 S 에서 회수되지만, f18, f30, 및 f34는 RX3(A)-GFP의 매우 순수한 분획물을 포함하였다는 것을 알 수 있다.

실시예 3: 담배 식물들로부터 저속 원심분리에 의한 RPBLA 들의 분리를 위한 다운스트림 과정

밀도 구배 원심분리는 RPBLA 밀도 측정을 위해 적합한 분석적 과정이지만, 이들 세포기관들을 큰 스케일로 정제하기에는 적합치 않다. 저속에서 간단한 원심분리 및 회수된 침전물(실험 과정 참조)의 일부 세척에 기반한 다운스트림 과정은 깨끗한 RPBLA 분획물의 회수를 허용하도록 개발되었다.

이 간단한 다운스트림 과정은 RX3-GFP 및 RX3(A)-GFP로 형질전환된 담배 잎들에 적용되고, 이 과정의 다른 단계들의 동일 양들을 쿠마시 블루로 염색된 웨스턴 및 SDS-PAGE로 분석하였다. 도 3A에 도시된 바와 같이, 해당 균질화액들(H0)에 존재하는 융합 단백질 거의 모두가 RPBLA 분획물(wPB)에서 회수되었다. 양 경우들에서 수율은 유사했고 상청액(SN)과 세척 단계(Ws)에서 융합 단백질이 손실되지 않을 만큼 매우 높았다. 이 관찰은 웨스턴 블롯으로 확인되었다. 처리된 동일한 양의 바이오매스로부터 얻은 RX3-GFP(도 3A, wPB 분획물을 비교)보다 더 많은 RX3(A)-GFP 융합 단백질이 회수된다는 사실은 더 나은 회수율을 반영하는게 아니라, 담배 잎에서 RX3(A)-GFP의 더 높은 축적율을 반영한다. RX3(A)-GFP RPBLA들이 RX3-GFP보다 덜 조밀한 경우 유효한 회수는 아주 놀라운 결과이다.

이 과정에서 달성된 풍부함은 매우 높다. 균질화액(H0)에 존재하는 오염물 대부분은 그 과정 동안에 제거되고, 세척된 RPBLA들(wPB)에 해당하는 분획물은 거의 융합 단백질만을 포함하였다. 몇몇 밴드들이 wPB 분획물에서 관찰되지만, 이들은 단백질 불순물에 해당하는 것이 아니라 동일 융합 단백질의 몇몇 올리고머화 상태들에 해당한다.

RX3(L)-GFP의 RPBLA들의 다운스트림 회수는, 이 융합 단백질을 포함하는 작고 덜 조밀한 세포기관들을 더 효율적으로 회수하기 위해, 더 높은 속도(4,000~5,000 x g)로 해당 균질화액을 원심분리함으로써 맞추어졌다 (도 2). 놀랍게도, RX3(L)-GFP의 경우, 도 3B(우측 패널)에서 관찰될 수 있듯이, 수율은 매우 효율적이었고 융합 단백질 대부분은 RPBLA 분획물(wPB)에서 회수되었다. RPBLA들을 포함하는 RX3(L)-GFP를 회수하기 위해 더 고속이 필요하다는 사실은 쿠마시 블루(도 3B, 좌측 패널)로 염색된 SDS-PAGE 겔들로 나타낸 것처럼 과정의 농축에 상당한 영향을 미치지는 않는다. 이들 결과들은 완전히 소수성인 RD를 갖는 RX3 태그들이 RPBLA 분리를 통한 단백질 생산 및 정제를 위해 적합하다는 것을 확인한다.

실시예 4: RX3 융합 단백질들의 가용화

RPBLA 분획물로부터 얻은 RX3-기반 융합 단백질들의 가용화는 RPBLA 다운스트림 처리에서 주요한 단계들 중 하나이다. 실시예 3에 도시된 바와 같이 필수적으로 저속 원심분리에 의해 회수된 RPBLA 분획물들은 RX3-GFP 및 RX3(A)-GFP의 용해도를 비교하기 위해 사용되었다. 단백질의 전체 극성이 감소되기 때문에 RD의 히스티딘을 알라닌으로 치환하는 것은 수용액에서 융합 단백질들의 용해도를 감소시킬 것으로 예상되었지만, 놀랍게도 RX3(A)-GFP는 각 검사 조건에서 훨씬 많이 용해될 수 있었다.

도 3A에서 예로서, 깨끗하게 된 RPBLA 분획물(wPB)을 약한 완충액(50 mM Tris pH 8, 5 mM TCEP 및 10 mM 2bME)에서 4시간 동안 인큐베이션 한 후, 가용화된 분획물(sPB)과 가용화되지 않은 분획물(uPB)을 비교한다. 가용화 단계 직후, 시료를 16,000 x g로 10분 동안 원심분리하였고 sPB를 상청액으로 회수하였다. uPB는 펠릿으로 회수하였다.

예상된 바와 같이, RX3-GFP는 부분적으로만 가용화되었다. 단량체 형태의 융합 단백질 대부분은 주어진 조건(도 3A, sPB 대 uPB들의 비교, 화살촉)에서 가용화되지만, 많은 양의 단단하게 응집된 다중결합 형태의 융합 단백질은 가용화되지 않은 분획물로 남아 있다(도 3A, 별표). 대비적으로, 동일한 가용화 조건들에서, RX3(A)-GFP 단백질 모두는 응집 형태와 무관하게 실질적으로 가용화되었다. 세척된 RPBLA들로부터 융합 단백질의 회수에서 매우 높은 수율을 허용하는 이 놀라운 결과는 아래에 도시된 바와 같이 몇몇 단백질에 융합된, 완전히 소수성인 조립체 펩티드의 넓은 스펙트럼으로 확인되었다.

실시예 5: 형질전환된 담배 식물들의 RPBLA 들에서 RX3 (A3)- ECFP 의 축적

이전 실험들에서, 새로운 RX3 이형들 모두는 RD에 존재하는 히스티딘의 단일 변종들로 구성되어서, 히스티딘 전, 후의 발린 및 류신 잔기들의 역할은 여전히 분석되지 않았다. 그렇게 하기 위해, RD를 따라 존재하는 발린, 히스티딘, 및 류신 모두는 새로운 RX3 비-양친매성 이형(RX3(A3))에서 알라닌으로 치환되었다(도 4A). 담배 잎들은 ECFP에 융합된 RX3(A3) 펩티드를 발현하는 벡터로 형질전환되었고, RPBLA 형성은 인필트레이션(dpi) 후 3일 및 6일째에 공초점 현미경으로 분석되었다. 심지어 인필트레이션 후 첫 번째 날(3 dpi)에, 다수의 작은 RPBLA들의 존재가 관찰되었는데, 이는 RX3(A3) 이형이 매우 효율적이라는 것을 제시한다. 이러한 관찰은 6 dpi에서 클러스터에서 조직화된 굉장히 많은 큰 RPBLA들의 존재에 의해 확인되었는데 (도 4B), 이는 새로운 조립자(assembler) 펩티드가 와일드 타입 RX3보다 예상밖으로 더 효율적이라는 것을 나타낸다.

식물들에서 RX3(A3)-ECFP 발현의 분석은 RD에 존재하는 발린 및 류신 잔기들이 단백질 조립 및 RPBLA 형성에 필요치 않다는 것을 나타낸다. 이러한 결론의 명백한 결과는 RD 구조가 접혀지지 않으면, RD에 존재하는 발린, 히스티딘, 및 류신이 임의의 다른 소수성 아미노산으로 치환될 수 있다는 것이다. 다음의 실험들은 이들 잔기들이 극성의 비대전되거나 음으로 대전된 아미노산들로 치환될 수 있다는 것을 나타낸다.

실시예 6: 형질전환된 담배 식물들의 RPBLA 들에서 RX3 (E)- GFP and RX3 (D)-ECFP의 축적

위에서 언급된 바와 같이, RD에서 히스티딘 잔기들을 리신 또는 아르기닌으로 치환하는 것은 순 전하를 증가시켜 결과적으로 이 도메인의 양친매성을 증가시킨다. 놀랍게도, 이는 RPBLA 형성과 총 단백질 축적의 측면에서 조립자 펩티드의 효율을 극적으로 또한 감소시킨다. 이들 잔기들의 첨가 또한 RD의 순 전하를 증가시켜서 양친매성을 증가시키기 때문에, 이들 결과들을 근거로, 히스티딘을 아스파트산 및 글루탐산으로 치환하는 것 또한 RPBLA 내 축적의 감소로 귀결되리라 예상되었다. 그러나, 도 5B에 도시된 바와 같이, RX3(E)-GFP, RX3(D)-ECFP 및 대응하는 대조군들 (각각 RX3-GFP 및 RX3-ECFP)로 형질전환된 담배 식물들로부터 얻은 총 단백질 추출물들의 웨스턴 블롯은 산성 아미노산을 갖는 융합 단백질이 대조군들보다 약간 더 좋게 축적되었다는 것을 나타내었다. RX3(E)-GFP 및 RX3(D)-ECFP의 더 낮은 이동도는, 다른 단백질들의 경우 앞서 보고되었던 바와 같이, 산성 아미노산들의 함량이 더 높은 것으로 설명될 수 있다.

더욱이, RX3(E)-GFP 및 RX3(D)-ECFP로 형질전환된 담배 식물들은 클러스터들에서 조직화된, 다수의 크고 둥근 형상의 형광 RPBLA들의 형성을 유도하였다(도 5C). 사실, 1 내지 2 마이크로미터의 큰 RPBLA들은 형질전환된 세포들 대부분에서 빈번하게 존재한다. 흥미롭게도, 이들 RPBLA들의 평균 크기는 GFP 또는 RX3에 융합된 ECFP의 발현으로 유도된 것들의 평균 크기보다 상당히 더 컸다.

실시예 7: 담배 식물들의 RPBLA 들에서 RX3 (T)- ECFP , RX3 (N)- ECFP , 및 RX3(Q)-ECFP의 축적

위의 결과들은 히스티딘을 소수성 또는 산성 아미노산으로 치환하는 것이 RPBLA들을 유도하는 조립자 펩티드의 용량을 높였다는 것을 나타낸다. 아울러, 히스티딘을 염기성 아미노산으로 치환함으로써 RD의 양전하를 증가시키는 부정적 효과가 관찰되었다. 그러나, 조립자 펩티드의 기능성에 대한 극성의 비-대전된 아미노산들의 효과가 여전히 알려져 있지 않았다. 그러므로, RD의 히스티딘들 모두가 트레오닌, 아스파라긴, 및 글루타민 잔기로 치환되었고 ECFP (각각 RX3(T)-ECFP, RX3(N)-ECFP, 및 RX3(Q)-ECFP)에 융합된 세 개의 새로운 컨스트럭트들이 생성되었다. 이들 아미노산들의 첨가는 양친매성이지만, 순 전하가 없는 RD로 귀결된다(도 6A).

이들 모든 컨스트럭트들을 발현하는 담배 잎들은 침투 후 3일 및 6일 (dpi)에 공초점 현미경으로 분석되었다. 3 dpi에서, 다수의 작은 RPBLA들이 관찰되었는데, 이는 이들 RX3 이형들 모두가 매우 효율적이었다는 것을 나타낸다. 이 관찰은 클러스터들에 조직화된 많고, 큰 RPBLA들의 존재에 의해 6 dpi에서 확인되었다(도 4B).

이들 결과들은 극성의 비대전된 아미노산들을 갖는 RX3 이종들의 식물들에서 발현이 RPBLA 형성으로 귀결된다는 것을 나타낸다.

실시예 8: 형질전환된 담배 식물의 RPBLA 들에서 PP - ECFP 및 PA - ECFP 의 축적

RX3의 두 주요 도메인들(RD 및 PX)은 둘 다 통상적으로 PPII 구조를 채택하는 프롤린 풍부 서열들이다. 원편광 이색성 (circular dichroism)에 의한 합성 RD의 연구는 수용액에서 이 도메인 내에 PPII 나선의 존재를 확인하였다(Dalcol, J. Org. Chem., 1996, 61 (20), pp 6775?6782). PPII 도메인들을 갖는 단백질들은 식물 및 다른 유기체에 풍부하다. 그러나, 이들은 대개는 RPBLA들의 형성을 유도하는 능력을 갖지 않는다. 예를 들어, 콜라겐(Caldwell JW, Applequist J.,. Biopolymers 1984;10:1891-1904), 알파-카제인 밀크 단백질(Syme CD. et al., Eur J Biochem 2002;269:148-156.), 및 PKA (Knighton D.R. et al., Science 1991;253:414-420)는 PPII 나선을 갖지만, RPBLA를 유도하는 능력을 갖지 않는 단백질들의 예들이다. 그 결과, PPII 구조 서열 외에, RX3에 있는 다른 요소들이 RPBLA의 형성을 유도하기 위해 필요할 것으로 예상되었다.

RX3 서열을 따라 이러한 요소들을 식별하기 위해, RD 및 PX 도메인들은 RX3에 비 상동인 프롤린계 서열로 치환되었다. PPII 구조는 유지되었고 시스테인 잔기의 수 및 상대적 위치는 변경되지 않았다(PP; 도 7A). 추가로, 유사하지만, 더욱 소수성 펩티드가 합성되었는데, 여기서 RD 및 PX 도메인들은 이 서열을 따라서 모두 반복되는 헥사펩티드 PPPAPA로 치환되었다(PA; 도 7A). 이들 두 펩티드들은 RX3으로 반드시 동일한 PPII 구조를 가지지만, 높은 프롤린 함량 및 시스테인들의 수 및 위치 이외는 1차 상동성을 공유하지 않는다.

RX3-ECFP, PP-ECFP 또는 PA-ECFP를 과발현하는 담배 잎들의 웨스턴 블롯 분석은 놀랍게도 ECFP에 융합된 두 개의 합성 펩티드들이 천연 RX3보다 더 높은 효율로 축적되었다는 것을 보여주었다(도 7B; 레인 1과 2 대 3을 비교). PP-ECFP, 및 정도가 덜하지만 PA-ECFP는, 심지어 세 개의 모든 융합 단백질들이 동일한 수의 아미노산들을 가짐에도 불구하고, RX3-ECFP보다 SDS-PAGE 겔에서 더 낮은 이동도를 보여주었다. 이는, 심지어 웨스턴 블롯 조건들에서 PP 및 PA는 RX3보다 더 안정한 PPII 연장 나선을 제공한다는 것을 제시한다. 결과적으로, 이들 합성 펩티드들의 조립이 선호될 것이고, 단백질은 웨스턴 블롯으로 판단된 것처럼 축적의 증가를 보일 것이다. 이 가설은 RX3-, PP-, 및 PA-ECFP 융합 단백질들을 발현하는 벡터로 형질전환 후 6일 째에 공초점 현미경으로 담배 잎들의 관찰로 확인되었다. 도 7C는 RX3-ECFP를 발현하는 잎들에 비해 많은 수의 RPBLA들을 제공하는, PP-ECFP 및 PA-ECFP로 형질전환된 잎들의 공초점 영상들을 표시한다. 게다가, PP- 및 PA-ECFP 발현으로 유도된 RPBLA들의 평균 크기는 RX3-ECFP RPBLA들의 평균 크기보다 2배 더 컸다.

이들 3가지 단백질체 유도 서열들(도 7A)의 서열 비교는 이들 중 상동성의 단독 영역이 신호 펩티드 (THTSGGCGCQ) (서열번호 25) 다음의 첫 번째 10개의 아미노산들임을 밝혀냈다. 이 서열이 단백질 조립체에서 특정 역할을 하지 않는다는 것을 확인하기 위해, 이 서열은 합성 프롤린계 서열 (THPPPPCPCP) (서열번호 26)로 치환되었다. 프롤린계 서열은 PA-ECFP 컨스트럭트들의 컨텍스트에서 시스테인들의 위치들을 유지하였다. 이 컨스트럭트(NPA-ECFP)는 RPBLA 유도에서 PA-ECFP만큼 효율적이었다.

추가로, RX3으로부터 감마-제인의 신호 펩티드 또한 PR-S로도 알려져 있는 PR10 신호 펩티드로 치환되었다(Veroverd et al., Plant Physiol., 1995, 109:1199-1205). 이 결과적 컨스트럭트는 GFP(RX3(PR10)-GFP)에 융합되었다. 신호 펩티드는 ER에 대한 단백질의 입구에서 동시번역으로(cotranslationaly) 분할되기 때문에 RPBLA에 영향을 줄 것 같지 않고, 예상된 것처럼, RPBLA들의 축적율 및 유도는 사용된 신호 펩티드와 완전히 무관하다.

PP, PA, NPP, 및 NPA 펩티드가 RX3과 1차 서열 상동성을 공유하지 않는다는 사실은, 예상외로 RPBLA들을 조립하고 유도하는 능력이 RX3의 서열이 아니라 그의 3차원 구조에 의존한다는 것을 나타낸다. RX3, PP, PA 펩티드, 및 이들의 이형들에 존재하는 연장된 PPII 나선은 RPBLA 유도에 책임이 있는 주요 특징이다.

복제 이유들 때문에, PP 및 PA 펩티드는 RX3 반복 도메인의 마지막 반복의 부분을 유지한다. RD로부터 마지막 RX3 반복 단위가 RPBLA를 형성하도록 요구받는 것을 버리기 위해, 이 반복이 없는(PP3과 PA2) 새로운 컨스트럭트의 집합이 수행된다. 이들 두 컨스트럭트들은 RPBLA들을 형성하는 능력을 유지한다.

실시예 9: 형질전환된 담배 식물들에서 RPBLA 들의 유도 또는 안정화에 관련된 RX3 의 시스테인 잔기들의 판단

여기에 제시된 작업은 RX의 다량체화 및 RPBLA 형성을 가능하게 하는 RX3의 특이적 특성에 대한 주요 통찰력을 제공한다. 적절하지만, 독특하지는 않은 특성은 RX3 분자들 간 디설파이드간 결합에 참여할 수 있는 시스테인 잔기들의 존재이다.

6개의 시스테인들 각각의 점 돌연변이는 RX3 중합에서 디설파이드 결합의 역할을 판단하는 간단한 방안으로서 사용되었다. C7 또는 C9이 결여된 RX3-ECFP(RX3C7G-ECFP 및 RX3C9G-ECFP)의 과발현은 융합 단백질의 다량체화 과정을 분명히 방해하였다: 양 변종들은 많이 분비되었다(도 8C~D). 사실, 개별적인 C7 또는 C9 돌연변이로 형질변경된 상피 세포들의 세포마다의 영상 분석에서, 융합 단백질들이 주로 분비되었고 몇몇 고형광의 단일 세포들은 형광 RPBLA 유사 스폿을 표시하였다. 이 관찰은 ER에서 재조합 단백질의 고 발현율은, 와일드 타입 RX3에 비해 더 높은 임계 단백질 농도가 단백질 응집을 위해 필요하다는 것을 나타내는 응집 효율의 증가로 귀결됨을 제시한다(도 8C~D 박스 내). 예상한 바와 같이, 양 시스테인 잔기들이 동일 시점에 돌연변이 되었을 때(도 8I; RX3C7, 9G-ECFP), RPBLA들의 축적은 관찰되지 않았다. 이들 결과들은 RX3 도메인의 N-말단 부근의 두 개의 시스테인 잔기들의 존재는 단백질을 ER에 유지하여 RPBLA들의 형성을 유도하기 위해 필요하다는 것을 나타낸다. 그러나, 첫 번째 두 시스테인들을 배타적으로 유지하는 다중 돌연변이 RX3C64,82,84,92G-ECFP는 C7 및 C9이 ER에서 융합 단백질을 유지하기에 충분치 않고 RPBLA들이 형성되도록 한다는 것을 나타낸다(도 8K). 이처럼, RX3 펩티드에 존재하는 다른 시스테인들의 일부는 그의 적절한 단백질 조립체에서 중요한 역할을 한다.

RX3 도메인(C64)의 중간에 국부화된 시스테인 잔기의 돌연변이는 올리고머화 과정 및 RPBLA들에 축적된 단백질에 대해 상당한 효과를 갖지 못하였다(도 8E; RX3C64G-ECFP). 게다가, RX3의 C-말단에 위치된 상기 세 시스테인 잔기들(C82, C84, 또는 C92)의 개별적 돌연변이들은 RPBLA들에 축적되는 능력에 상당한 영향을 갖지는 못했다(도 8F~H; 각각 RX3C82G-ECFP, RX3C84G-ECFP 또는 RX3C92G-ECFP). 이들 단일 돌연변이들의 정상적인 응집 능력은 이들 잔기들 중 어느 것도 홀로 RPBLA들을 유도 및 안정화하도록 요구받지 않는다는 가설을 지원한다. 그러나, 다중 C-말단 Cys 돌연변이(도 8J; RX3C82,84,92G-ECFP)는 RPBLA 생물발생과 함께 진행될 수 없기 때문에, RX3은 또한 RPBLA들을 형성하기 위해 C-말단 부근에 최소 두 개의 시스테인 잔기들을 요구한다는 것이 분명하다.

아울러, 단백질 농도는 자기조립 펩티드들의 응집을 조절하는 주요 매개변수인 것으로 알려져 있다(Wetzel, R. (1999) In Methods in Enzymology, vol. 309, Academic Press, San Diego, California). 그러나, RX3-ECFP 및 RX3 Cys 돌연변이들의 발현은 SDS-PAGE 쿠마시 블루 염색 겔들에서 분명히 가시화되었고, RPBLA들을 형성했던 단백질들과 분비되어 응집되지 않았던 단백질들 사이에서 단백질 레벨의 상당한 차이는 관찰되지 않았다(도 8B). 그러므로, 검사된 RX3 돌연변이의 단백질 다량체화 차이들은 응집 능력에 영향을 미치는 그들의 내인성 성질들에서의 차이와 관련이 있다. RX3 서열의 변형들은 응집 능력을 손상시키거나 올리고머화를 위해 필요한 단백질 임계 농도를 높일 수 있었다.

조립자 펩티드가 RPBLA의 효율적 유도를 허용하기 위해 필요한 시스테인들이 최소 수의 판단은 대단히 중요하다. 우선, 주로 이 단백질이 또한 시스테인 잔기들을 포함할 때, 조립자 펩티드에서 시스테인 잔기들은, 목적 단백질의 적절한 폴딩, 이런 이유로 그의 활성에 부정적 영향을 끼칠 수 있다. 그러나, 조립자 펩티드에서 시스테인들의 존재는 디설파이드 결합 형성에 의한 융합 단백질의 교차결합을 확실하게 한다. 이 교차결합은 RPBLA들의 안정화 및 강력화로 귀결된다. 이들 특징들은 이 세포기관의 분리를 쉽게 하기 때문에 바람직하다. 또한, RPBLA 세포기관이 사용되는 임의의 산업적 응용은 디설파이드 결합 형성에 의한 교차결합에 의존할 것이다. 도입부에 기재된 바와 같이, 프롤라민 외의 PBIS는 단백질의 C-말단에서 KDEL의 추가에 의해 RPBLA들의 형성을 유도할 수 있다. 심지어 이러한 접근법이 RPBLA들의 형성을 허용함에도 불구하고, 이들 세포기관들의 분리는 그들의 안정성 감소로 인하여 어려울 것이다.

실시예 10: 시스테인 잔기들의 방위는 형질전환된 담배 식물들에서 PP 펩티드가 RPBLA 들에 축적되는 능력에 영향을 미치지 않는다.

단백질 조립체 및 RPBLA 유도에서 시스테인 잔기들의 중요성은 실시예 9에서 이들 잔기들의 단일 및 다수의 돌연변이들에 의해 나타내어졌다. 그러나, 이들 잔기들의 방위의 영향은 탐구될 여지가 있다. 방위의 영향을 탐구하기 위해, 새로운 조립자 펩티드(PP2)를 합성하였다. PP2는 시스테인 잔기 일부 위치를 제외하고 PP와 상동이다(도 9A; C9→10, C84→85 및 C92→91).

프롤린이 매우 풍부한 펩티드들은 도 9B에 도시된 것처럼 회전 당 세 개의 아미노산들을 갖는 것을 특징으로 하는 PPII 나선을 형성한다(Brochicchio, 2002, Chirality, 14: 782-92). 천연 RX3에서, 시스테인 잔기들은 나선의 세 측부들 각각을 향하여 배향된다. 이 방위는 천연 및 RPBLA들이 디설파이드 브릿지들에 의해 조립되고 안정화된 단백질들로 가득찬 통상의 크고(3 마이크로미터까지) 둥근 형상의 세포기관들을 형성하도록 하는 세 개의 모든 치수들에서 조립 및 안정화를 촉진하기 위해 중요할 수 있다는 것이 가설이었다. 이처럼, PP2는 모든 시스테인 잔기들이 나선의 동일한 측부를 향하여 배향되도록 설계되었다. 예상외로, GFP에 융합된 PP2는 PP-GFP만큼 많이 축적될 수 없었고, 심지어 놀랍게도 큰 RPBLA들의 형성을 유도할 수 없었다(도 9C).

실시예 11: 형질전환된 담배 식물들의 RPBLA 들에서 R8 (4C)- ECFP , R7 (4C)-ECFP, R6 (4C)- ECFP , 및 R4 (4C)- ECFP 의 축적

RPBLA 생물학적 발생을 위해 필요한 PPII의 최소 길이가 또한 측정되었다. 그렇게 하기 위해, 최소 RX3-ECFP 유래 단백질, R8(C4)-ECFP가 RX3의 PX 서열을 삭제하고 추가적인 최소 서열을 첨가함으로써 생성되었다. 이처럼, R8(C4)-ECFP는 C82, C84, 및 C92가 부족하지만, 쇄간 디설파이드 브릿지를 강화하기 위해 두 개의 프롤린에 의해 C64에 연결된 추가적인 새로운 시스테인 잔기를 포함한다(도 10A). N. benthamiana 잎들에서 발현시 R8(C4)-ECFP 단백질의 분포 패턴은, 고배율에서, 작은 RPBLA들로서 보이는 분명한 구형의 형광 스폿들에 축적되었다(도 10C). RX3-ECFP에 의해 유도된 RPBLA는 4 dpi에서 1.4 μm의 입자 평균에 도달하였고 7 dpi에서 2 μm에 도달하기까지 점진적으로 증가된 반면, R8(C4)-ECFP에 의해 유도된 형광 스폿들은 7 dpi에서 1 μm의 직경에 거의 도달하지 못하였다(하기 표 참조). 그러므로, 앞서 제시된 바와 같이, PPII 나선(R8(C4)의 컨텍스트에서 RD)의 각 측부에서 시스테인 쌍은 RPBLA들로 진화될 단백질 응집체들을 핵생성하기에 충분하다. RX3-ECFP가 R8(C4)-ECFP보다 큰 RPBLA들을 형성하는 더 강한 경향을 가지는 관찰은 RX3-ECFP 올리고머들이 그의 6개의 시스테인 잔기들에 의해서 쇄간 교차결합을 증가시킴으로써 더 높은 성장확률을 가진다는 사실에 기인할 수 있다.

그러므로, 중합이 PPII의 길이에 관련되는 정도가 또한 조사되었다. 이들 실험들은 RD를 점진적으로 단축함으로써 수행되었다. 세 개 이상의 컨스트럭트들이 R8(C4)-ECFP로부터 생성되었다. 반복 도메인이 7, 6 및 4 PPPVHL 단위까지 짧아졌다(도 10A). 도 10C에 도시된 바와 같이, 6개 또는 4개의 반복 단위(각각, R6(C4)-ECFP 및 R4(C4)-ECFP)를 포함하는 과발현된 단백질들은 여전히 작은 응집체들을 형성할 수 있지만, 분비는 반복 도메인의 단축에 따라 증가한다(도 10B 삽도). R7(C4)-EGF는 R8(C4)-EGF와 유사한 결과를 낳았다.

RX3-끝이 잘린 단백질들을 과발현하는 잎들로부터 추출된 총 단백질들의 쿠마시 블루 염색 분석(도 10B)은 재조합 단백질들의 농도가 모든 경우들에서 유사하였다는 것을 보여주었다. 이는 융합 단백질들 각각이 안정하고 좋은 발현 레벨은 RPBLA들이 효율적으로 형성될 것이라는 증거가 아니라는 것을 나타낸다. 즉, 돌연별이에서 더 낮은 응집 효율은 단백질 발현 레벨에 관련되지 않았다. 이들 결과들은 최적의 RX3 펩티드 상호작용을 선호하고 PB 형성 효율을 판단하는 임계 크기가 있다는 것을 제시한다.

식물 형질전환으로부터 4일과 7일 후 RPBLA들 크기

융합 단백질	크기 범위 (μm)
융합 단백질	4 dpi	7 dpi
RX3-ECFP	1.1~1.85	1.1~1.85
R8(4C)-ECFP	0.4~0.7	0.9~1.3
R7(4C)-ECFP	0.4~0.75	0.78~1.3
R6(4C)-ECFP	0.3~0.6	1~1.4
R4(4C)-ECFP	0.2~0.4	0.75~1

나머지 컨스트럭트들에 비해 R4(C4)-ECFP의 융합 단백질 분비에서 상당한 증가를 근거로, R4(C4)는 효율적인 조립자 펩티드의 최소 길이를 표시한다. 이들 결과들은 PPII 나선을 채택하고 각 말단에서 한쌍의 시스테인 잔기들을 옆에 둔 24개의 아미노산들(R4(C4) 반복 도메인의 길이)보다 긴 펩티드들이 ER 내에 보유되고 RPBLA들의 형성을 유도하기에 충분하다는 것을 나타낸다.

실시예 12: 형질전환된 담배 식물들의 RPBLA 들에서 RX3 (A)- mCherry RX3 (E)-mCherry의 축적

RX3에 융합시, 형광 단백질 mCherry는 가용성이 높아서 RPBLA들에 축적되지 않는다. RX3-mCherry를 발현하는 벡터로 형질전환된 담배 잎들의 공초점 현미경 분석은, 도 11A에 도시된 바와 같이, 관찰된 적색 형광의 대부분이 세포의 주변에 국소화된 분명한 분비 패턴을 보여주었다. 흥미롭게도, 담배 잎들이 RX3(A)-mCherry로 형질전환되었을 때, 형광의 대부분은 세포 내부에서 관찰되었는데, 이는 융합 단백질이 세포 내에 효율적으로 유지되었다는 것을 나타낸다.

게다가, 분명한 미립자 패턴이 관찰되었는데(도 11B 및 11B'), 이는 융합 단백질이 RPBLA에 축적되었음을 나타낸다. 이들 재조합 단백질체의 크기(약 1 마이크로미터 직경)는 몇몇 융합 단백질들로 형질전환된 식물들에서 앞서 특징으로 한 RPBLA들과 매치된다(미국특허번호 제7,575,898호; 및 미국특허공개번호 제20060123509호, 제20060121573호, 및 제20070243198호 참조).

이 결과는 최소 두 가지 이유 때문에 예상 밖이었다. 첫째, 천연 발생 반복 도메인을 포함하는 미변형 프롤라민 유래 RX3에 비해 mCherry가 RX3(A)에 융합되었을 때 RPBLA 형성 효율이 증가되었다. 추가로, RX3의 반복 도메인의 양친매성은 단백질체 형성에 중요하고(Kogan et al ., 2001, J. Mol. Biol. 312:907-913), RX3(A)은 완전히 소수성인 반복 도메인을 가지도록 돌연변이된다(실시예 1 참조)라고 기재되어 있다.

위에서 나타낸 바와 같이, mCherry의 높은 용해도는 RPBLA들을 형성하기 위해 천연 RX3과 mCherry의 융합 능력을 감소시키는 주요 인자들 중 하나일 수 있었다. RX3(A)의 더 높은 성능이 RD(소수성 알라닌에 대한 히스티딘(양으로 대전된 아미노산)의 치환)의 소수성 함량의 단순한 증가에 기인하는지를 판단하기 위해, RX3(E)에 대한 mCherry의 융합이 발현되었다. 도 11C에 도시된 바와 같이, RX3(E)-mCherry는 세포 내에 효율적으로 보유되었고, 아울러, RX3(A)-mCherry의 발현으로 유도된 것들보다 심지어 더 큰 RPBLA들에 축적되었다.

양친매성의 대전된 RD를 갖는 RX3(E)가 mCherry에 융합시 RPBLA들의 형성을 유도할 수도 있다는 사실은 RX3에 비해 RX3(A)의 성능 증가는 펩티드의 소수성 특징의 불특정 증가에 기인하지 않지만, 조립 능력의 증가에 기인하고, 따라서 이들 두 개의 합성 RX3 유래 펩티드들의 단백질체 유도 능력에 기인한다는 것을 제시한다.

실시예 13: 형질전환된 담배 식물들에서 RX3 , RX3 (A), RX3 (E), PP 및 PA 조립자 펩티드들에 융합된 EGF 의 축적

담배 아그로인필터된 식물들에서 RX3에 융합된 상피 성장 인자(EGF)의 생산 및 정제가 앞서 보고되었다(WO2006056484). 저속 원심분리, 가용화, 및 RX3-EGF 융합 단백질의 분할에 의한 RPBLA 분리방법 및 역상(RF) FPLC에 의한 EGF의 후속 정제가 WO2007096192에서 발전되었다. 새로운 조립자 펩티드의 효능을 검사하기 위해, EGF는 RX3(A) 및 RX3(E)에 융합되었고 동일한 다운스트림 방법이 수행되었다. RX3(A)-EGF 및 RX3(E)-EGF의 발현에 의해 유도된 RPBLA들은 RX3-EGF의 발현에 의해 유도된 대조 RPBLA만큼 효율적으로 저속 원심분리에 의해 회수되었다(도 12A). 세 가지 모든 경우에서, 상청액(도 12A, 레인 2) 및 세척 단계(도 12A, 레인 3)에서의 단지 사소한 손실이 있었지만 융합 단백질 거의 전부가 wPB 분획물(도 12A, 레인 4)에서 회수되었다. 이들 결과들로부터, 융합 단백질은 거의 전부가 RPBLA 세포기관에 강하게 조립되고 wPB 분획물에서 쉽게 회수된다는 것은 분명하다.

다운스트림에서 요점은 RPBLA들로부터 얻은 융합 단백질의 가용화이다. 온순 조건(25℃에서 4 시간 동안 pH 10의 50 mM 붕산염 완충액 및 10 mM의 bME)에서 RX3-EGF RPBLA 가용화 후, 융합 단백질의 작은 백분율만이 가용화되었다. 사실, RX3-EGF 단량체의 50%만이 가용화되었다 (도 12B; 레인 3(sPB)을 레인 6(iPB)과 비교). 놀랍게도, RX3(A)-EGF 또는 RX3(E)-EGF를 포함하는 RPBLA들의 가용화가 훨씬 더 효율적이었다. RX3(A)-EGF의 거의 모든 단량체 형태는 가용화되었고, 사용된 조건들에서 RX3(A)-EGF가 가용화 되지 않고서 남아 있는 것은 거의 없어 보였다(도 12B; 레인 1(sPB)을 레인 4(iPB)와 비교).

다운스트림 처리에 대한 PP-EGF 및 PA-EGF의 효과들 또한 조사되었다. 도 12C는 이들 두 가지 융합 단백질들이 담배 아그로인필터된 잎들에서 RX3-EGF 및 RX3(E)-EGF와 동일 레벨로 축적된다는 것을 보여준다. 아울러, 저속 원심분리에 의한 RPBLA들의 회수 후, PP-EGF 및 PA-EGF는 위에서 기재된 온순 조건들에서 RX3(E)-EGF와 유사하게 매우 효율적으로 가용화되었다(도 12D). 앞서 언급된 바와 같이, 이들 모든 융합 단백질들 사이의 전기영동 이동도 차이는 단백질 크기 차이에 관련되는 것이 아니라 심지어 SDS-PAGE 조건들 하에서 단백질 형태의 약간의 차이들에 기인한다.

예상 외로, 새로운 조립자 펩티드들 RX3(A), RX3(E), PP 및 PA 모두 RPBLA들의 형성을 조립하고 유도하는 그들의 능력에 영향을 주지 않고서 융합 단백질의 용해도를 크게 증가시킨다. 이들 펩티드가 그 방법의 총 수율을 극적으로 증가시키기 때문에, 이 눈에 띄는 결과는 RPBLA 다운스트림 처리에서 매우 중요하다(RX3(A)의 경우 최소 2배, 그리고 RX3(E), PP, 및 PA의 경우 최소 10배).

이들 새로운 조립자 펩티드에 의해 생산된 EGF의 형태에 접근하기 위해, 이 융합 단백질로부터 FXa에 의해 분할되어 RF-FPLC에 의해 정제된 EGF뿐만 아니라 가용화된 RX3(E)-EGF의 활성을 검사하였다. 도 13A는 맑게 되지 않은 균질화액에서부터 분할 단계까지 모든 다운스트림 단계들과 함께 실버 염색된 겔을 보여준다. 부위 특이적 프로테아제 FXa로 분할 후, RF-FPLC에 의한 재료 및 방법들에서 기재된 바와 같이 자유롭게 된 EGF는 정제되었다. 도 13B에서 화살표로 표시된 날카로운 피크에 해당하는 단지 두 분획물들에서 EGF 단백질이 30%의 아세토니트릴로 회수되었다. 회수된 두 분획물들의 혼합물의 순도(도 13C)는 HPLC에 의해 92% 이상으로 추정되었다. EGF 활성은 RX3(E)-EGF 및 EGF의 증가량으로 인큐베이션된 A431 세포들의 EGF 수용체 인산화의 분석에 의해 생체 외에서 측정되었다. 부대조군 (negative control)로서 이들 세포들을 RX3과 병렬로 인큐베이션하였다. 세 가지 독립적 실험들은 Promega(GS02A)의 상업적 EGF에 비해 RX3(E)-EGF 및 EGF가 각각 50% 및 100% 활성이었다는 것을 나타내었다.

실시예 14: 형질전환된 담배 식물들에서 RX3 및 RX3 (A) 조립자 펩티드에 융합된 hGH 의 축적

인간 성장 호르몬이 다운스트림 과정을 향상시키는 RX3 이형들의 능력을 체크하기 위한 추가적 예로서 선택되었다. RX3(A)-hGH 융합 단백질을 발현하는 담배 식물들을 균질화액으로 만들었고 유도된 RPBLA들을 저속 원심분리로 분리하였다. 도 14A(좌측 패널)에 도시된 바와 같이, RPBLA들의 매우 순수한 분획물(wPB)을 균질화액(H0)으로부터 얻었다. 그의 올리고머 형태가 다른 융합 단백질 RX3(A)-hGH는 쿠마시 염색법으로 분석시 이 분획물에서 관찰되는 유일한 단백질이다. 흥미롭게도, 공정 수율을 웨스턴 블롯으로 분석시, 대부분의 융합 단백질은 안정하고 단단하게 조립된 RPBLA들에 축적되었는데, 이는 원심분리에 의해 회수될 수 있고, 그의 단지 소량만이 대응하는 상청액에서 손실된다(도 14A, 좌측 패널).

RX3(A)-hGH을 함유하는 RPBLA들이 이러한 간단한 원심분리 방법에 의해 얻어졌으면, 이들은 온순 가용화 완충액(실온에서 50 mM 붕산염 pH10, 10 mM 베타-머캅토에탄올(bME))에서 3시간 동안 인큐베이션되었다. 참고로서, RX3-hGH를 함유하는 동일량의 RPBLA들을 동일 조건으로 인큐베이션하였고 항-hGH 항체들을 이용하는 웨스턴 블롯으로 병렬적으로 분석하였다. 놀랍게도, RPBLA 회수의 높은 수율이 이들 두 융합 단백질들 중 어느 하나의 발현으로 유도된 세포기관들 둘 모두 안정하고 단단하게 조립됨을 제시함에도 불구하고, RX3(A)-hGH 융합 단백질은 RX3-hGH보다 훨씬 더 많이 용해될 수 있었다. 물 용해도의 증가는 RX3 히스티딘 잔기를 RX3(a)에서 알라닌으로 치환이 조립자 펩티드의 소수성을 증가시킨다는 사실을 고려하면 놀라운 것이다(Eisenberg, 1984, J. Mol . Biol . 179: 125-142).

실시예 15: 형질전환된 담배 식물들에서 고밀도 RPBLA 생물발생에 대한 Cys 잔기들의 의존

위에서 언급된 바와 같이, 고밀도 RPBLA 형성에서 PBIS의 필수적 요소들 중 하나는 폴리프롤린 타입 II 도메인의 각 말단에서 최소 2개의 시스테인 잔기들의 존재이다. 그럼에도 불구하고, KDEL 서열에 융합시, 심지어 디설파이드 브릿지 형성이 없음에도, ER 내에 유지되고 소포 유사 구조들 내에 축적되는 다른 조립자 펩티드들(예를 들어, 하이드로포빈, ELP)이 있다. 어떤 조립자 단백질들의 C-말단에서 KDEL의 존재는 ER 내에 이 분자를 보유하기에 충분하고, 단백질의 조립자 능력은 소포 구조들의 형성으로 이어진다.

RX3 조립자 펩티드의 말단에서 ER 보유 서열의 추가가 Cys 잔기들의 필요성을 대체할 수 있었는지를 판단하기 위해, RPBLA들을 유도할 수 없었고 실시예 9에 도시된 바와 같이 분비되었던 RX3 이형(RX3ΔCys₆₄ _,82,84,92-ECFP)을 KDEL을 갖는 ECFP에 융합하였다(RX3ΔCys₆₄ _,82,84,92-ECFP-KDEL).

쿠마시 염색법 및 웨스턴 블롯(도 16A)로 RX3-ECFP 및 RX3ΔCys₆₄ _,82,84,92-ECFP-KDEL을 과발현하는 담배 잎 분석은 두 RX3 기반 융합 단백질들이 유사한 레벨로 축적되었다는 것을 보여주었다. RX3ΔCys₆₄ _,82,84,92-ECFP-KDEL이 RPBLA에 축적되는지를 판단하기 위해, 이 융합 단백질을 발현하는 잎들을 침투 후 3일 및 7일 (dpi)에 공초점 현미경으로 분석하였다. 앞서 RX3-ECFP 발현 담배 잎에서 관찰된 것처럼, RX3ΔCys₆₄ _,82,84,92-ECFP-KDEL의 발현에 의해 유도된 약 1 마이크로미터의 둥근 형상의 소포들이 3 dpi에서만 관찰되었다(도 16B). 이러한 관찰은 ECFP의 C-말단에 부착된 KDEL 서열이 세포 내에 융합 단백질의 효율적인 보유를 허용한다는 것을 나타낸다. 추가적으로, 이는 RX3계 펩티드의 조립자 능력이 자동 조립 및 소포 구조들의 유도를 허용한다는 것을 또한 보여준다. 이들 소포 구조들은 3 dpi 후 성장을 계속하고, 흥미롭게는 7 dpi에서 불규칙하고 큰 소포 구조체들이 (일부가 5 마이크로미터를 넘는) 관찰되었다(도 16B). 이러한 크기의 RPBLA들은 대조 RX3-ECFP 융합 단백질을 과발현하는 담배 잎들에서는 관찰되지 않았는데, 이는 RX3-ECFP가 RPBLA들로 자동조립되는 기작이 RX3ΔCys₆₄ _,82,84,92-ECFP-KDEL 소포들의 조립 기작과 같지 않다는 것을 제시한다.

소포 구조체들 내에서 융합 단백질 조립체의 단단함을 간접적인 특징으로 하는 기술적 접근법은 단계별 쿠션 Optiprep^TM 구배에 의한 소포 구조체들의 밀도의 판단이다. 그러므로, 담배 식물에서 RX3ΔCys₆₄ _,82,84,92-ECFP-KDEL (또는 RX3-ECFP) 발현으로 유도된 소포 구조체들은 다음의 Optiprep^TM 단계 쿠션들의 상단에 여과된 식물 균질화액을 로딩함으로써 수행되었다. 각 단계 쿠션의 밀도는 위에서 정의된 것처럼 표 4에 있다.

RX3-ECFP 구배로 예시된 것처럼, 고밀도 RPBLA들은 내생 단백질의 대부분이 없는, 약 1.2 g/mL의 밀도를 갖는 분획물들(도 16C, 좌측, 레인 5 및 6)로부터 회수된다. 사실, 이미 미국 공개출원번호 제2006/0123509호에 기재된 바와 같이, RPBLA 분리에서 RPBLA들의 밀도 및 인성은 매우 중요하다. RX3ΔCys₆₄ _,82,84,92-ECFP-KDEL 소포 구조체들을 동일 수단으로 분석하였을 때, 놀랍게도 거의 모든 융합 단백질이 상청액 분획물에서 회수되었다(도 16C, 우측). 이 결과는 RX3ΔCys₆₄ _,82,84,92-ECFP-KDEL 융합 단백질들이 진실한 RPBLA로 여길 수 없는 소포체 유사 구조로 축적된다는 것을 분명히 나타낸다. 예를 들어, ER 또는 골지체로부터 유래된 세포내 기관들은 통상적으로는 18%와 30%의 Optiprep 쿠션들 사이에서 침전되고, 조직 균질화 과정 동안, 마이크로솜들의 루멘에 존재하는 가용성 단백질들의 많은 비율이 자유롭게 되어 상청액에서 회수될 것이다. 그러므로, RX3ΔCys₆₄ _,82,84,92-ECFP-KDEL 융합 단백질은 ER 내에 보유되지만, 조립되지 않거나 약하게 조립되고, 고밀도 RPBLA들은 형성되지 않는다고 결론지을 수 있다.

실시예 16: 형질전환된 담배 식물들의 RPBLA 들에서 Z( Adh )- GFP , Z( Adh )Px-Gfp, Z( Col )- Gfp , Z( Col )Px- Gfp 의 축적

RX3과 낮은 서열 상동성을 가진 PBIS는 RPBLA들을 생성할 수 있는 것으로 나타났다. PP 및 PA는 C9와 C64 잔기 사이에서 RX3 서열에 대해 60% 미만의 동일성을 공유한다. 반면에, PP 및 PA 서열이 높은 프롤린 퍼센트(각각 96.2 및 67.9 퍼센트) (와일드 타입 RX3(54,7%)보다 상당히 높은)를 가진다는 것을 지적하는 것은 중요하다. PPII 구조를 채택한 다른 단백질 서열들의 RPBLA 유도 능력을 평가하였다. 서열들은 다음 임계치를 충족하였다: (i) RX3에 대해 40% 미만이고 (ii) 40% 프롤린 함량 미만. 아미노산 135 내지 179 (AccN: CAA34683)을 포함하는 인간 콜라겐 COL2A1의 단편, 및 표면 부착소 AgI/II (Streptococcus mutans strain NG8; GeneBank: GQ456171. AccN: ACV69919)로부터 얻은 884 내지 927 단편이 선택되었다. 도 17A에 도시된 바와 같이, 이러한 서열들은 R8(C4) (Z(Adh) 및 Z(Col)) 또는 RX3 (Z(Adh)Px 및 Z(Col)Px) 조립자 펩티드들에 대한 RD를 치환하기 위해 사용되었다.

GFP에 융합된 이들 조립자 펩티드들은 담배 잎에서 높은 레벨로 축적되었고 쿠마시로 염색된 이들 잎들로부터 미리 맑게 만든 균질화액들에서 주요한 밴드로서 나타났다 (도 17B). 각각 37.7 kDa 및 34.6 kDa의 예상 MW를 가진 Z(Adh)-Gfp 및 Z(Adh)Px-Gfp는 SDS-PAGE 겔에서 더 낮은 이동도를 가진다. 위에서 기재된 PPII 구조를 채택한 조립자 펩티드(예를 들어, PP, RX3(E) 등)의 대부분에서 또한 관찰되는 이동 시프트는 이러한 2차 구조의 강한 안정성 때문일 수 있다.

Z(Adh)-GFP, Z(Adh)Px-GFP, Z(Col)-GFP 및 Z(Col)Px-GFP를 발현하는 담배 잎들의 공초점 현미경에 의한 분석은 이들 융합 단백질들이 약 1 마이크로미터 직경의 둥근 형상의 형광 RPBLA들에서 세포 내에 축적되는 것을 보여주었다. RX3에 대한 낮은 상동성 백분율 및 낮은 프롤린 함량에도 불구하고, 융합 단백질들은 소포체(ER) 내에 보유되었고, 이들의 조립체는 RPBLA들의 형성을 효율적으로 유도하였다(도 17C).

ELP, 하이드로포빈 또는 RX3ΔCys₆₄ _,82,84,92-ECFP-KDEL에 의해 생산된 단백질체들과는 달리, RPBLA들의 중요한 특징은 고밀도 세포기관들 내에 있는 단백질의 단단한 패킹이다. 이 특징은 원심분리에 의한 RPBLA 분리를 허용한다. 그러므로, Z(Adh)-GFP, Z(Adh)Px-GFP, Z(Col)-GFP 및 Z(Col)Px-GFP가 1500 xg(도 17D)로 원심분리 후 펠릿(RPBLA 분획물)으로 회수된다는 관찰은 이들 융합 단백질들이 고밀도 RPBLA들의 형성을 유도한다는 것을 나타낸다. Px 도메인의 존재로 인한 Cys 잔기(4 내지 6)의 수의 증가 및 피롤린 풍부 서열에 의한 조립자 펩티드의 확대는 조립자의 단단함이 상당히 증가하고 RPBLA의 더 높은 효율적 회수로 나타났다(도 17에서 Z(Adh)-GFP 대 Z(Adh)Px-GFP 및 Z(Col)-GFP 대 Z(Col)Px-GFP 비교). 밀도 구배 및 FRAP 실험들은 이 데이터를 지원한다.

Z(Adh)-GFP, Z(Adh)Px-GFP, Z(Col)-GFP 및 Z(Col)Px-GFP의 서열 비교 (도 17A)로부터 관찰될 수 있듯이, RX3 반복 도메인의 마지막 반복은 복제 이유때문에 모든 경우들에서 유지되었다. RPBLA를 형성하기 위해 Adh 및 Col PPII가 RD로부터 마지막 RX3 반복 단위를 필요로 한다는 것을 버리기 위해, 이 반복이 없는(Z(Adh2)-GFP, Z(Adh2)Px-GFP, Z(Col2)-GFP 및 Z(Col2)Px-GFP) 새로운 컨스트럭트의 집합이 수행된다. 이들 새로운 모든 컨스트럭트들은 RPBLA를 유도하는 능력을 유지하였다.

실시예 17: 형질전환된 담배 식물들에서 RX3 - Xyl , RX3 (L)- Xyl , RX3 (E)- Xyl , RX3(A)-Xyl PP - Xyl 및 PA - Xyl 의 발현에 의해 유도된 RPBLA 에 대한 크실라나아제 활성의 판단

앞서(WO2007/096192A1) 기재된 바와 같이, 와일드 타입 RX3-유래 융합 단백질들의 발현에 의해 유도된 RPBLA들은 이러한 PBIS에 융합된 목적 단백질(POI)의 활성을 유지하는 능력을 가진다.

본원에 기재된 조립자 펩티드들이 이들에 융합된 단백질들의 활성에 어떻게 영향을 미치는지를 판단하기 위해, 비-양친매성(PP, PA, RX3(A) 및 RX3(L)) 및 음으로 대전된 양친매성(RX3(E)) 조립자 펩티드들을 연구하였다. 크실라나아제(xylanase) 효소(DQ465452)가 리포터 POI로서 선택되었고 와일드 타입 RX3뿐만 아니라 이들 모든 조립자 펩티드들에 대해 5개의 글리신을 기준으로 포함하는 링커를 통해 융합되었다.

PP-Xyl, PA-Xyl, RX3(E)-Xyl, RX3(L)-Xyl, RX3(A)-Xyl 및 RX3-Xyl을 과발현하는 담배 잎을, 불일치 및 가변성을 감소시키기 위해 괴저성 조직을 회피하면서, 아그로인필트레이션 6일 후 수확하였다. 저속 원심분리에 의한 다운스트림 처리를 각 컨스트럭트에 대해 수행하였고, RPBLA가 풍부한 분획물을 쿠마시 블루 염색에 의해 SDS-PAGE로 분석하였다. 모든 경우들에서, RPBLA 분획물은 분획물 내에서 가장 풍부한 단백질인 융합 단백질이 매우 풍부했다. 단백질 함량은 EZQ 단백질 수량화 키트(Invitrogen, Molecular Probes)로 측정되었고, 각 시료와 관련된 크실라나아제 활성은 2분 마다 해당하는 형광 생성물을 측정(파장: 여기 360/40 nm, 방출 460/40 nm)하면서 합성 기질(DiFMUX2)을 이용하여 수량화되었다.

예상 외로, 분석된 모든 시료들 중에서, 가장 낮은 특이적 활성(11.7 nmols/(분*단백질 마이크로그램))을 갖는 RPBLA 분획물이 RX3-Xyl 융합 단백질에 해당하였다. 이 융합 단백질을 기준으로 하여, RX3(A)-Xyl은 거의 두 배의 특이적 활성을 보여주었고; RX3(E)-Xyl 및 RX3(L)-Xyl은 약 3배의 증가를 보여주었으며; 그리고 PP-Xyl 및 PA-Xyl은 기준보다 7배 이상 높은 특이적 활성을 보여주었다(표 4 참조). 동일량의 융합 단백질을 사용하여 활성이 측정되었고, RX3에 비해 이들 조립자 펩티드들의 특이적 활성 증가는 다른 RPBLA 성질들에 관련될 수 있었다. 이 관찰은 높은 특이적 활성이 효소 응용들에서 유용한 속성이라는 것을 고려하면 매우 중요하다.

다른 조립자 펩티드들의 발현에 의해 유도된 RPBLA들의 특이적 활성

	nmols/ min/μg prot	Std.Dev	FOLD	Std.Dev.Rel
RX3-Xyl	11.7	0.63	1.0	0.05
PA-Xyl	84.7	0.57	7.3	0.05
PP-Xyl	84.4	4.51	7.2	0.50
RX3(A)-Xyl	21	0.5	1.8	0.05
RX3(E)-Xyl	33.5	2.89	2.9	0.25
RX3(L)-Xyl	41.2	4.00	3.5	0.34

실시예 18: 담배 식물들에서 RPBLA 들을 유도하는 능력에서 시스테인 잔기들에 대한 그리고 관심있는 폴리펩티드에 대한 RX3 반복 도메인의 방위의 비 의존성

와일드 타입 RX3으로부터 얻은 반복 도메인(RD)은 각각 N-말단 및 C-말단에 위치된 2개 및 4개의 시스테인 잔기들을 옆에 갖고 있다. 이러한 비대칭 분포는 RPBLA 유도에서 조립체 능력 및/또는 효율에 관해 약간 중요할 수 있다. 이를 검사하기 위해, 새로운 컨스트럭트(iRX3)가 RD의 옆에 있는 영역들이 역방위에서 스웹 및 복제되도록 생성되었다 (도 18A). 담배 잎들이 ECFP(iRX3-ECFP)에 융합된 역위 RX3 조립자 펩티드를 암호화하는 컨스트럭트로 아그로인필트레이션될 때, 크고 둥근 형상의 RPBLA들일 관찰되었다. 놀랍게도, 유도된 RPBLA들의 크기는 기준으로 사용된 RX3-ECFP 융합 단백질의 발현으로 수득된 대응하는 RPBLA들보다 상당히 더 컸다 (도 18B). RX3-ECFP 및 iRX3-ECFP의 평균 크기는 각각 약 1 마이크로미터와 약 2.5 마이크로미터였다.

RPBLA들의 높은 밀도와 단단함은 세포의 기관들 및 가용성 단백질의 나머지로부터 원심분리에 의한 효율적 분리를 허용하여(미국 공개출원번호 제2006/0123509호), iRX3-ECFP RPBLA의 밀도는 다단계 Optiprep 밀도 구배에 의해 판단되었다. iRX3-ECFP 및 RX3-ECFP의 발현에 의해 유도된 밀도 구배를 따라서 RPBLA들 분포 비교는 유의미한 차이가 없음을 보여주었다. 두 경우들에서, 대다수의 RPBLA들은 아그로인필트레이션 6일 후 형성되었고 1.175 g/cm³ 내지 1.26 g/cm³ 범위의 고밀도 분획물들로부터 회수되었다(도 18C; 레인 4 내지 7). 이 분획물들은 또한 내생 세포 단백질 대부분을 갖고 있지 않는다.

목적 단백질(ECFP)에 대해 조립자 펩티드(RX3 및 iRX3)의 상대적 위치의 중요성을 또한 분석하였다. 두 개의 추가적인 컨스트럭트들은 ECFP의 C-말단에서 RX3 또는 iRX3 조립자 펩티드를 복제함으로써 생성되었다(도 18; ECFP-RX3 및 ECFP-iRX3) 이들 융합 단백질들을 발현하는 담배 잎들은 대응하는 N-말단 융합 단백질들(RX3-ECFP 및 iRX3-ECFP)보다 덜 효율적이지만, RPBLA들을 유도할 수 있었다. 도 18B에서, 공초점 영상들은 ECFP-RX3 및 ECFP-iRX3이, 대부분 약 0.5 마이크로미터인 수많은 작은 RPBLA들을 유도한다는 것을 보여준다. 흥미롭게도, 감소된 크기에도 불구하고, 일부 RPBLA들은 세포 오염물들 대부분이 없는 1.175 g/cm³ 및 1.21 g/cm³의 고밀도 분획물들 (도 18C, 레인 4 및 5)에서 회수되었다. 더 낮은 밀도(도 18C, 레인 2 및 3)를 갖는 분획물들에서 일부 융합 단백질의 존재는 아마도 더 느린 조립 동력학으로 인해 완전한 RPBLA들로 조립되지 못한 융합 단백질을 나타낼 수 있다. 목적 단백질의 C-말단에 연결된 조립자 펩티드를 갖는 융합 단백질들의 발현에 의해 유도된 RPBLA들은 원심분리에 의해 분리될 수 있다고 결론지을 수 있다.

실시예 19: CHO 세포들에서 hGH -I- RX3 , DsRED -I- RX3 및 EK - RX3 의 RPBLA 들에서 축적

POI의 C-말단에서 융합된 PBIS가 CHO 세포들에서 RPBLA들의 형성을 유도할 수 있다는 것을 나타내기 위해, 다음 융합 단백질들 (i) hGH-I-RX3, (ii) EK-RX3, 및 (iii) DsRED-I-RX3을 발현하는 세 컨스트럭트들이 생성되었다 (도 19 참조). 세 가지 모든 경우에서, CHO 세포 형질주입 후, 세포내 스폿들의 특징적 패턴의 관찰은 해당 융합 단백질들이 RPBLA들에서 세포들 내에 유지되었다는 것을 나타내었다(도 19A 및 B). 도 19A에서 명확하게 관찰될 수 있는 RPBLA 크기의 비균질성은 RPBLA 형성의 다른 단계들 또는 형질주입 효율 차이 및 융합 단백질 발현 레벨의 결과적 차이와 관련될 수 있다.

단백질체 내에서 융합 단백질 조립체의 단단함을 간접적인 특징으로 하는 기술적 접근법은 단계별 쿠션 수크로오스 구배에 의한 RPBLA 밀도의 판단이다. 그러므로, CHO 세포들에서 hGH-I-RX3의 발현으로 유도된 RPBLA들은 다음 수크로오스 단계벌 쿠션들 구배의 상단 위에 로딩되었다:

수크로오스 농도(%) 및 밀도(g/mL)

% 수크로오스	밀도 (g/mL)
20	1.08
27	1.12
35	1.16
42	1.2
56	1.28

웨스턴 블롯에 의한 밀도 구배로부터 회수된 다른 분획물들의 동일한 용적들의 분석은 로딩된 융합 단백질(도 19A, 레인 H) 대부분이 고밀도 분획물들(도 19A, 레인 F42 및 F56)에서 회수되었다는 것을 보여주었다. 조립되지 않은 소량의 융합 단백질 또한 S 및 F27 분획물들에서 관찰되었는데, 이는 아마도 더 느린 조립 동력학에 기인한다. 조밀성이 높은 RPBLA들은 통상적으로 약 1.2 g/mL의 밀도를 갖는 분획물들로부터 회수되므로, RPBLA들은 단백질의 C-말단에서 RX3 도메인을 갖는 융합 단백질에 의해 유도될 수 있다고 결론지을 수 있다.

실시예 20: SF9 곤충 세포들에서 hGH -I- RX3 의 RPBLA 들에서의 축적

단백질의 C-말단에서 RX3 조립자 펩티드를 갖는 융합 단백질들이 곤충 세포들에서 RPBLA들을 유도할 수 있다는 표시는 hGH-I-RX3으로 수행되었다. hGH-I-RX3을 발현하는 pBacPAK8 재조합 바이러스로 감염된 곤충 세포들은 RPBLA 축적의 면역형광 패턴 특징을 보여주었다(도 19C). 세포를 따라서 균일하게 분포된 스폿들은 RPBLA들에 해당하고 융합 단백질이 ER 내에 효율적으로 유지된다는 것을 나타내었다. hGH-I-RX3을 발현하는 SF9 세포들이 균질화액으로 만들어져서 저속(3000xg)으로 원심분리되었을 때, 많은 비율의 융합 단백질은 RPBLA 분획물에서 회수되었다(도 19C, 우측 패널, 레인 3). N-말단 RX3 융합 단백질들(미국특허 공개번호 제2006/0123509호)에서 관찰된 바와 같이, RX3:RX3 상호작용에 의해 유도된 고밀도 세포기관들(RPBLA들)에서 단단한 조립은 RPBLA들이 매우 풍부하게 있는 분획물의 효율적인 회수를 허용한다.

실시예 21: 포유동물 세포들에서 RPBLA 들의 축적

다음 단백질들을 인코딩하는 서열들은 크실라나아제를 인코딩하는 서열들에 융합되고 포유동물 세포들에서 발현을 위한 벡터 pcDNA 3.1 (Invitrogen)로 복제되었다: RX3, RX3(A), RX3(L), RX3(A3), RX3(E), RX3(D), RX3(T), RX3(N), RX3(Q), PP, PA, RX3C64G, RX3C82G, RX3C84G, RX3C92G, PP2, R8(C4), R7(C4), R6(C4), R4(C4), Z(Adh), Z(Adh)Px, Z(Col), Z(Col)Px, 및 iRX3. 결과적인 벡터들은 리포펙타민계 형질주입 방법(Invitrogen)을 이용하여 293T, Cos1, 및 CHO 세포로 도입된다.

형질주입된 세포들의 웨스턴 블롯은 융합 단백질 모두의 축적을 보여준다. 아울러, 면역세포화학에 의한 융합 단백질의 국소화는 융합 단백질들이 약 0.5 내지 약 3 마이크론의 직경을 갖는 구형 RPBLA들에 축적된다는 것을 나타낸다. RPBLA들의 밀도는 수크로오스 단계별-쿠션들 상의 로딩에 의해 판단되고 약 1.1 내지 약 1.4 g/mL이다. RPBLA들은 저속 원심분리(약 5000xg 미만)를 사용하여 정제되고, 회수된 RPBLA들은 최소 약 95% 순수하다. RPBLA들은 온순 완충액(50 mM Tris pH 8, 5 mM TCEP 및 10 mM 2bME)에서 약 4시간 동안 인큐베이팅하고 이후 약 16,000xg로 약 10분 동안 원심분리함으로써 가용화된다. 가용화된 부분에서 단백질이 고 수율로 회수된다. 크실라나아제 활성은 합성 기질(DiFMUX2)을 사용하여 측정되고 높은 활성 레벨이 관찰된다.

실시예 22: 곤충 세포들에서 RPBLA 들의 축적

다음 단백질들을 인코딩하는 서열들은 크실라나아제를 인코딩하는 서열들에 융합되고 pFastBAck 바큐로바이러스 발현 벡터계(Invitrogen)로 복제되었다: RX3, RX3(A), RX3(L), RX3(A3), RX3(E), RX3(D), RX3(T), RX3(N), RX3(Q), PP, PA, RX3C64G, RX3C82G, RX3C84G, RX3C92G, PP2, R8(C4), R7(C4), R6(C4), R4(C4), Z(Adh), Z(Adh)Px, Z(Col), Z(Col)Px, 및 iRX3. 재조합 바이러스는 BaculoGold 형질주입 키트(PharMingen, San Diego, California, USA)를 사용하여 생산되었다. Sf9 세포들은 배양액 접시들의 바닥에 부착되도록 허용되었고 15분 내지 1시간 인큐베이션 후, 바이러스 군체가 습한 공기에서 27℃로 약 30 내지 약 36시간 동안 유지되는 배지들에 첨가된다.

감염된 세포들의 웨스턴 블롯은 융합 단백질 모두의 축적을 보여준다. 아울러, 면역세포화학에 의한 융합 단백질의 국소화는 융합 단백질들이 약 0.5 내지 약 3 마이크론의 직경을 갖는 구형 RPBLA들에 축적된다는 것을 나타낸다. RPBLA들의 밀도는 수크로오스 단계별-쿠션들 상에 로딩에 의해 판단되고 약 1.1 내지 약 1.4 g/mL이다. RPBLA들은 저속 원심분리(약 5000xg 미만)를 사용하여 정제되고, 회수된 RPBLA들은 최소 약 95% 순수하다. RPBLA들은 온순 완충액(50 mM Tris pH 8, 5 mM TCEP 및 10 mM 2bME)에서 약 4시간 동안 인큐베이팅하고 이후 약 16,000xg로 약 10분 동안 원심분리함으로써 가용화된다. 가용화된 부분에서 단백질이 고 수율로 회수된다. 크실라나아제 활성은 합성 기질(DiFMUX2)을 사용하여 측정되고 높은 활성 레벨이 관찰된다.

실시예 23: 사상균류 세포들에서 RPBLA 들의 축적

[Penttila M, Nevalainen H, Ratto M, Salminen E, Knowles J: A versatile transformation system for the cellulolytic filamentous fungus Trichoderma reesei. Gene 1987, 61:155-164]에 기재된 것처럼, 다음 단백질들을 인코딩하는 서열들이 크실라나아제를 인코딩하는 서열들에 융합되고 T. reesei 변종 RutC-30[Montenecourt BS, Eveleigh DE: Selective screening methods for the isolation of high yielding cellulase mutants of Trichoderma reesei . Adv Chem Ser 1979, 181:289-301.]으로 도입된 Trichoderma reesei 발현 벡터들로 복제된다: RX3, RX3(A), RX3(L), RX3(A3), RX3(E), RX3(D), RX3(T), RX3(N), RX3(Q), PP, PA, RX3C64G, RX3C82G, RX3C84G, RX3C92G, PP2, R8(C4), R7(C4), R6(C4), R4(C4), Z(Adh), Z(Adh)Px, Z(Col), Z(Col)Px, 및 iRX3. 형질전환주들은 125 μg/ml의 하이그로마이신 B를 포함하는 플레이트들 위에 선택된다. 이 형질전환주들은 유도된 발현을 위해 락토오스를 포함하는 선택적 배지 위에 줄무늬가 만들어지고 형광 현미경으로 스크린된다. 가장 많은 양의 융합 단백질들을 생산하는 형질전환주로부터 균류들이 여과로 수집되었다.

형질전환된 균류들의 웨스턴 블롯은 융합 단백질 모두의 축적을 보여준다. 아울러, 면역세포화학에 의한 융합 단백질의 국소화는 융합 단백질들이 약 0.5 내지 약 3 마이크론의 직경을 갖는 구형 RPBLA들에 축적된다는 것을 나타낸다. RPBLA들의 밀도는 Optiprep 단계별-쿠션들 상에 로딩에 의해 판단되고 약 1.1 내지 약 1.4 g/mL이다. RPBLA들은 저속 원심분리(약 5000xg 미만)를 사용하여 정제되고, 회수된 RPBLA들은 최소 약 95% 순수하다. RPBLA들은 온순 완충액(50 mM Tris pH 8, 5 mM TCEP 및 10 mM 2bME)에서 약 4시간 동안 인큐베이팅하고 이후 약 16,000xg로 약 10분 동안 원심분리함으로써 가용화된다. 가용화된 부분에서 단백질이 고 수율로 회수된다. 크실라나아제 활성은 합성 기질(DiFMUX2)을 사용하여 측정되고 높은 활성 레벨이 관찰된다.

실시예 24: 본 발명에 따라 PBIS 를 사용하여 얻어진 RPBLA 들의 성질들의 요약

RX3, RX3(E), RX3(D), RX3(Q), RX3(N), RX3(T), RX3(A), RX3(A3), RX3(L), PA, PP 및 iRX3 PBIS 및 ECFP (iRX3 PBIS 사용시, 융합 단백질들은 ECFP에 대해 PBIS의 양 방위들을 갖고서 구성되었다)의 융합 단백질들을 발현하는 해당 컨스트럭트들로 아그로인필터된 담배 식물들로부터 제조된 RPBLA들의 직경 및 밀도가 위에서 설명된 바와 같이 판단되었다. 결과들은 표 9에 제시되어 있다.

본 발명에 따라 다른 컨스트럭트들을 사용하여 얻어진 RPBLA들의 직경 및 밀도

융합 단백질	직경 * (μm)	RPBLA* 밀도 (g/mL)
RX3-ECFP	1<d<2	1.21~1.26
RX3(E)-ECFP	1<d<5	1.166~1.185
RX3(D)-ECFP	1<d<2	nd
RX3(Q)-ECFP	0.5<d<2	약 1.17
RX3(N)-ECFP	0.5<d<1	nd
RX3(T)-ECFP	0.5<d<1	nd
RX3(A)-ECFP	1<d<2	1.194~1.204
RX3(A3)-ECFP	1<d<2	약 1.17
RX3(L)-ECFP	약 0.5	1.160~1.204
PA-ECFP	0.5<d<1	1.175~1.204
PP-ECFP	0.5<d<1	1.175~1.204
ECFP-iRX3	0.5<d<1	1.11~1.17
iRX3-ECFP	1<d<3	1.21~1.23

실시예 25: 비 알레르기성 PBIS 의 구성

프롤라민으로부터 유도된 프롤라민 단백질 및 펩티드는 알레르기성일 수 있다. 흥미롭게도 RX3 펩티드의 추정 알레르기원성을 FARRP(Food Allergy Research and Resource Program)이 개발한 AllergenOnline Database (버전 10.0, 2010년 1월; http://www.allergenonline.com)로 분석했을 때, 알레르기성 펩티드들과 35%를 넘는 동일성을 가진 10개의 결과들이 발견되었다. 이 결과는 와일드-타입 RX3이 알레르기성 포텐셜을 가진다는 것을 제시한다. 이 펩티드의 낮은 알레르기성 또는 비 알레르기성 버전은 몇몇 애플리케이션들에서 유용하다(즉, 영양). 그러므로, 본 출원에 기재된 RX3 펩티드들의 다른 이형들로 동일한 분석이 수행되었고, PA 및 RX3(A3)은 와일드 타입 RX3보다 상당히 덜 알레르기성이라는 결과가 나타났다. AllergenOnline Database에서 PA 및 RX3(A3)의 서열 분석은 알레르기성 펩티드들과 35%를 넘는 동일성을 가진 세 개 및 두 개 결과들만 각각 보여주었다. 이들 관찰을 근거로, RX3 조립자 펩티드의 몇몇 새로운 비알레르기성 버전들이 합성되었다: RX3(LA1) (서열번호 110) 및 RX3(LA2) (서열번호 111). 이들 두 펩티드들은 알레르기성 펩티드와 35%를 넘는 동일성을 가진 결과들을 갖지 않고, 이는 이들이 알레르기성이 아니라는 것을 나타낸다. GFP 및 ECFP에 대한 RX3(LA1) 및 RX3(LA2)의 융합 단백질들이 담배 잎들에서 발현되었고, RPBLA 유도를 위한 이들의 능력은 영향을 받지 않는다.

RX3-LA1 (서열번호 60)

RX3-LA2 (서열번호 61)

특히, R8(4C)는 알레르기성 펩티드들과 35%를 넘는 동일성을 가진 결과를 갖지 않는데, 이는 R8(4C)가 결코 알레르기성이 아니라는 것을 나타낸다. 이 결과는 RX3의 알레르기가 Pro-X 도메인에서의 아미노산 서열에 주로 기인한다는 것을 나타낸다. 조립자 펩티드에서 추정되는 알레르기성 효과들을 회피하기 위해, 몇몇 비알레르기성 R8(C4) 이형들이 합성되었고 담배 잎들에서 RPBLA 유도에 대해 성공적으로 검사되었다.

* * *

요약(Summary) 및 요약서(Abstract) 부분이 아니라 상세한 설명 부분이 청구항들을 해석하기 위해 사용되도록 한 것이라는 것이 잘 이해될 것이다. 요약 및 요약서 부분은 하나 이상을 기재하지만 발명자(들)가 심사숙고한 본 발명의 모든 예시적 실시예들을 기재하지 않을 수 있으므로, 이들 부분들은 어떠한 식으로든 본 발명 및 첨부된 청구항들을 한정하고자 하는 것은 아니다.

본 발명이 그의 특정된 기능들 및 관계들의 구현을 예시하는 기능적 빌딩 블록들의 도움으로 위에서 기재되었다. 이들 기능적 빌딩 블록들의 경계는 본원에서 설명의 편의를 위해 임의로 정의되었다. 그의 특정된 기능들 및 관계들이 적절하게 수행되기만 하면 대안적 경계들이 정의될 수 있다.

특정 실시예들의 상기한 기재는 본 발명의 일반적인 성질을 매우 충분히 보여서, 지식을 적용함으로써, 이 기술에 통상의 지식을 가진 자들은 지나친 실험 없이, 본 발명의 일반적 개념으로부터 벗어남이 없이도, 다양한 응용을 위해 이러한 특정 실시예들을 쉽게 변경 및/또는 변형할 수 있다. 그러므로, 이러한 변형 및 변경은, 본원에서 제시된 교시 및 안내를 근거로, 개시된 실시예들의 등가물들의 의미 및 범위 내이고자 한다. 본 명세서의 용어 또는 어구가 교시 및 안내의 견지에서 통상인에 의해 해석되도록, 본원에서 사용된 어구 또는 용어는 제한이 아니라 설명의 기재의 목적을 위한 것이라는 사실이 이해될 것이다.

본 발명의 폭 및 범주는 위에서 기재된 예시적 실시예들 중 어느 것에 의해서도 제한되어서는 안되며, 다음 청구항들 및 그들의 등가물들에 따라서만 정의되어야 한다.

본 출원의 청구항들은 모 출원 또는 기타 관련 출원들의 청구항들과 다르다. 따라서, 출원인은 현재의 출원과 관련하여 모출원 또는 임의의 선출원에서 작성된 청구 범위의 어떠한 디스클레이머를 취하한다. 따라서, 심사관은 회피 목적으로 행해진 이와 같은 어떠한 앞선 디스클레이머 및 인용 참증들이 다시 논의될 필요가 있을 수도 있다는 것을 알아야 한다. 또한, 심사관은 현재의 출원에서 이루어진 어떤 디스클레이머가 모 출원으로 이해되거나 모 출원에 반하는 것으로 이해되어서는 안된다는 것을 기억해야 한다.

SEQUENCE LISTING <110> ERA BIOTECH, S.A. <120> PROTEIN BODY-INDUCING POLYPEPTIDE SEQUENCES <130> F12-6742-ES <150> US 61/349655 <151> 2010-05-28 <150> EP10382231.8 <151> 2010-08-13 <160> 130 <170> PatentIn version 3.5 <210> 1 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> PPVHLx6 <400> 1 Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val 1 5 10 15 His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro 20 25 30 Pro Val His Leu 35 <210> 2 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> (PPPVHL)x6 - PPPVHVPPPVHL <400> 2 Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val 1 5 10 15 His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro 20 25 30 Pro Val His Leu Pro Pro Pro Val His Val Pro Pro Pro Val His Leu 35 40 45 <210> 3 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> (PPPVHL)x6 - PPPVHVPPPVHLPPPPCH <400> 3 Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val 1 5 10 15 His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro 20 25 30 Pro Val His Leu Pro Pro Pro Val His Val Pro Pro Pro Val His Leu 35 40 45 Pro Pro Pro Pro Cys His 50 <210> 4 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PPPVHL <400> 4 Pro Pro Pro Val His Leu 1 5 <210> 5 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> PPPX <220> <221> misc_feature <222> (4)..(4) <223> Xaa can be any naturally occurring amino acid <400> 5 Pro Pro Pro Xaa 1 <210> 6 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> PPXX <220> <221> misc_feature <222> (3)..(4) <223> Xaa can be any naturally occurring amino acid <400> 6 Pro Pro Xaa Xaa 1 <210> 7 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> PXXX <220> <221> misc_feature <222> (2)..(4) <223> Xaa can be any naturally occurring amino acid <400> 7 Pro Xaa Xaa Xaa 1 <210> 8 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> PPXP <220> <221> misc_feature <222> (3)..(3) <223> Xaa can be any naturally occurring amino acid <400> 8 Pro Pro Xaa Pro 1 <210> 9 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> PPPXX <220> <221> misc_feature <222> (4)..(5) <223> Xaa can be any naturally occurring amino acid <400> 9 Pro Pro Pro Xaa Xaa 1 5 <210> 10 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PPPXXX <220> <221> misc_feature <222> (4)..(6) <223> Xaa can be any naturally occurring amino acid <400> 10 Pro Pro Pro Xaa Xaa Xaa 1 5 <210> 11 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PPPXPX <220> <221> misc_feature <222> (4)..(4) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (6)..(6) <223> Xaa can be any naturally occurring amino acid <400> 11 Pro Pro Pro Xaa Pro Xaa 1 5 <210> 12 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> PPPAAAPPPAAAPPPAAA <400> 12 Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala 1 5 10 15 Ala Ala <210> 13 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PPPAAA <400> 13 Pro Pro Pro Ala Ala Ala 1 5 <210> 14 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> PPPAAAPPPAAAPPAPPPPPAPPP <400> 14 Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Ala Pro 1 5 10 15 Pro Pro Pro Pro Ala Pro Pro Pro 20 <210> 15 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PPAPPP <400> 15 Pro Pro Ala Pro Pro Pro 1 5 <210> 16 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PPPVAL <400> 16 Pro Pro Pro Val Ala Leu 1 5 <210> 17 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PPPVLL <400> 17 Pro Pro Pro Val Leu Leu 1 5 <210> 18 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PPPVEL <400> 18 Pro Pro Pro Val Glu Leu 1 5 <210> 19 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PPPVDL <400> 19 Pro Pro Pro Val Asp Leu 1 5 <210> 20 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PPPVTL <400> 20 Pro Pro Pro Val Thr Leu 1 5 <210> 21 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PPPVNL <400> 21 Pro Pro Pro Val Asn Leu 1 5 <210> 22 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PPPVQL <400> 22 Pro Pro Pro Val Gln Leu 1 5 <210> 23 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PPPAPA <400> 23 Pro Pro Pro Ala Pro Ala 1 5 <210> 24 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PPPPPP <400> 24 Pro Pro Pro Pro Pro Pro 1 5 <210> 25 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> THTSGGCGCQ <400> 25 Thr His Thr Ser Gly Gly Cys Gly Cys Gln 1 5 10 <210> 26 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> THPPPPCPCP <400> 26 Thr His Pro Pro Pro Pro Cys Pro Cys Pro 1 5 10 <210> 27 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> (PPPVHL) x 8 <400> 27 Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val 1 5 10 15 His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro 20 25 30 Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu 35 40 45 <210> 28 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> VHLPPP <400> 28 Val His Leu Pro Pro Pro 1 5 <210> 29 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> (PPPVHL) x 6 <400> 29 Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val 1 5 10 15 His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro 20 25 30 Pro Val His Leu 35 <210> 30 <211> 52 <212> PRT <213> Artificial Sequence <220> <223> PPPVELPPP VELPPPVELP PPVELPPPVE LPPPVELPPP VEVPPPVELPPPP <400> 30 Pro Pro Pro Val Glu Leu Pro Pro Pro Val Glu Leu Pro Pro Pro Val 1 5 10 15 Glu Leu Pro Pro Pro Val Glu Leu Pro Pro Pro Val Glu Leu Pro Pro 20 25 30 Pro Val Glu Leu Pro Pro Pro Val Glu Val Pro Pro Pro Val Glu Leu 35 40 45 Pro Pro Pro Pro 50 <210> 31 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVDLPPP VDLPPPVDLP PPVDLPPPVD LPPPVDLPPP VDLPPPVDL <400> 31 Pro Pro Pro Val Asp Leu Pro Pro Pro Val Asp Leu Pro Pro Pro Val 1 5 10 15 Asp Leu Pro Pro Pro Val Asp Leu Pro Pro Pro Val Asp Leu Pro Pro 20 25 30 Pro Val Asp Leu Pro Pro Pro Val Asp Leu Pro Pro Pro Val Asp Leu 35 40 45 <210> 32 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVNLPPP VNLPPPVNLP PPVNLPPPVN LPPPVNLPPP VNVPPPVNL <400> 32 Pro Pro Pro Val Asn Leu Pro Pro Pro Val Asn Leu Pro Pro Pro Val 1 5 10 15 Asn Leu Pro Pro Pro Val Asn Leu Pro Pro Pro Val Asn Leu Pro Pro 20 25 30 Pro Val Asn Leu Pro Pro Pro Val Asn Val Pro Pro Pro Val Asn Leu 35 40 45 <210> 33 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVNLPPPV NLPPPVNLPP PVNLPPPVNL PPPVNLPPPV NLPPPVNL <400> 33 Pro Pro Pro Val Asn Leu Pro Pro Pro Val Asn Leu Pro Pro Pro Val 1 5 10 15 Asn Leu Pro Pro Pro Val Asn Leu Pro Pro Pro Val Asn Leu Pro Pro 20 25 30 Pro Val Asn Leu Pro Pro Pro Val Asn Leu Pro Pro Pro Val Asn Leu 35 40 45 <210> 34 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVQLPPP VQLPPPVQLP PPVQLPPPVQ LPPPVQLPPP VQVPPPVQL <400> 34 Pro Pro Pro Val Gln Leu Pro Pro Pro Val Gln Leu Pro Pro Pro Val 1 5 10 15 Gln Leu Pro Pro Pro Val Gln Leu Pro Pro Pro Val Gln Leu Pro Pro 20 25 30 Pro Val Gln Leu Pro Pro Pro Val Gln Val Pro Pro Pro Val Gln Leu 35 40 45 <210> 35 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVQLPPP VQLPPPVQLP PPVQLPPPVQ LPPPVQLPPP VQLPPPVQL <400> 35 Pro Pro Pro Val Gln Leu Pro Pro Pro Val Gln Leu Pro Pro Pro Val 1 5 10 15 Gln Leu Pro Pro Pro Val Gln Leu Pro Pro Pro Val Gln Leu Pro Pro 20 25 30 Pro Val Gln Leu Pro Pro Pro Val Gln Leu Pro Pro Pro Val Gln Leu 35 40 45 <210> 36 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PPPVSL <400> 36 Pro Pro Pro Val Ser Leu 1 5 <210> 37 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PPPVVL <400> 37 Pro Pro Pro Val Val Leu 1 5 <210> 38 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVALPPP VALPPPVALP PPVALPPPVA LPPPVALPPP VAVPPPVAL <400> 38 Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val 1 5 10 15 Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro 20 25 30 Pro Val Ala Leu Pro Pro Pro Val Ala Val Pro Pro Pro Val Ala Leu 35 40 45 <210> 39 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVALPPP VALPPPVALP PPVALPPPVA LPPPVALPPP VALPPPVAL <400> 39 Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val 1 5 10 15 Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro 20 25 30 Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu 35 40 45 <210> 40 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVALPPP VALPPPVALP PPVALPPPVA LPPPVALPPP VAVPPPVHL <400> 40 Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val 1 5 10 15 Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro 20 25 30 Pro Val Ala Leu Pro Pro Pro Val Ala Val Pro Pro Pro Val His Leu 35 40 45 <210> 41 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVALPPP VALPPPVALP PPVALPPPVA LPPPVALPPP VALPPPVHL <400> 41 Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val 1 5 10 15 Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro 20 25 30 Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val His Leu 35 40 45 <210> 42 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVLLPPP VLLPPPVLLP PPVLLPPPVL LPPPVLLPPP VLVPPPVLL <400> 42 Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val 1 5 10 15 Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro 20 25 30 Pro Val Leu Leu Pro Pro Pro Val Leu Val Pro Pro Pro Val Leu Leu 35 40 45 <210> 43 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVLLPPP VLLPPPVLLP PPVLLPPPVL LPPPVLLPPP VLLPPPVLL <400> 43 Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val 1 5 10 15 Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro 20 25 30 Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu 35 40 45 <210> 44 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVVLPPP VVLPPPVVLP PPVVLPPPVV LPPPVVLPPP VVVPPPVVL <400> 44 Pro Pro Pro Val Val Leu Pro Pro Pro Val Val Leu Pro Pro Pro Val 1 5 10 15 Val Leu Pro Pro Pro Val Val Leu Pro Pro Pro Val Val Leu Pro Pro 20 25 30 Pro Val Val Leu Pro Pro Pro Val Val Val Pro Pro Pro Val Val Leu 35 40 45 <210> 45 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVVLPPP VVLPPPVVLP PPVVLPPPVV LPPPVVLPPP VVLPPPVVL <400> 45 Pro Pro Pro Val Val Leu Pro Pro Pro Val Val Leu Pro Pro Pro Val 1 5 10 15 Val Leu Pro Pro Pro Val Val Leu Pro Pro Pro Val Val Leu Pro Pro 20 25 30 Pro Val Val Leu Pro Pro Pro Val Val Leu Pro Pro Pro Val Val Leu 35 40 45 <210> 46 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVTLPPP VTLPPPVTLP PPVTLPPPVT LPPPVTLPPP VTVPPPVTL <400> 46 Pro Pro Pro Val Thr Leu Pro Pro Pro Val Thr Leu Pro Pro Pro Val 1 5 10 15 Thr Leu Pro Pro Pro Val Thr Leu Pro Pro Pro Val Thr Leu Pro Pro 20 25 30 Pro Val Thr Leu Pro Pro Pro Val Thr Val Pro Pro Pro Val Thr Leu 35 40 45 <210> 47 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVTLPPPV TLPPPVTLPP PVTLPPPVTL PPPVTLPPPV TLPPPVTL <400> 47 Pro Pro Pro Val Thr Leu Pro Pro Pro Val Thr Leu Pro Pro Pro Val 1 5 10 15 Thr Leu Pro Pro Pro Val Thr Leu Pro Pro Pro Val Thr Leu Pro Pro 20 25 30 Pro Val Thr Leu Pro Pro Pro Val Thr Leu Pro Pro Pro Val Thr Leu 35 40 45 <210> 48 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVSLPPP VSLPPPVSLP PPVSLPPPVS LPPPVSLPPP VSVPPPVSL <400> 48 Pro Pro Pro Val Ser Leu Pro Pro Pro Val Ser Leu Pro Pro Pro Val 1 5 10 15 Ser Leu Pro Pro Pro Val Ser Leu Pro Pro Pro Val Ser Leu Pro Pro 20 25 30 Pro Val Ser Leu Pro Pro Pro Val Ser Val Pro Pro Pro Val Ser Leu 35 40 45 <210> 49 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPVSLPPP VSLPPPVSLP PPVSLPPPVS LPPPVSLPPP VSLPPPVSL <400> 49 Pro Pro Pro Val Ser Leu Pro Pro Pro Val Ser Leu Pro Pro Pro Val 1 5 10 15 Ser Leu Pro Pro Pro Val Ser Leu Pro Pro Pro Val Ser Leu Pro Pro 20 25 30 Pro Val Ser Leu Pro Pro Pro Val Ser Leu Pro Pro Pro Val Ser Leu 35 40 45 <210> 50 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPAAAPPP AAAPPPAAAP PPAAAPPPAA APPPAAAPPP AAAPPPAAA <400> 50 Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala 1 5 10 15 Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro 20 25 30 Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala 35 40 45 <210> 51 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPAAAPPP AAAPPPAAAP PPAAAPPPAA APPPAAAPPP AAAPPPVHL <400> 51 Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala 1 5 10 15 Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro 20 25 30 Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Val His Leu 35 40 45 <210> 52 <211> 50 <212> PRT <213> Artificial Sequence <220> <223> PPPPPPPPP PPPPPPPPPP PPPPPPPPPP PPPPPPPPPP PPPPPPPPPPP <400> 52 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 1 5 10 15 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 20 25 30 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 35 40 45 Pro Pro 50 <210> 53 <211> 49 <212> PRT <213> Artificial Sequence <220> <223> PPPPPPPP PPPPPPPPPP PPPPPPPPPP PPPPPPPPPP PPPPPPPPVHL <400> 53 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 1 5 10 15 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 20 25 30 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Val His 35 40 45 Leu <210> 54 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPAPAPPP APAPPPAPAP PPAPAPPPAP APPPAPAPPP APAPPPVHL <400> 54 Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala 1 5 10 15 Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro 20 25 30 Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Val His Leu 35 40 45 <210> 55 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> PPPAPAPPP APAPPPAPAP PPAPAPPPAP APPPAPAPPP APAPPPAPA <400> 55 Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala 1 5 10 15 Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro 20 25 30 Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala 35 40 45 <210> 56 <211> 49 <212> PRT <213> Artificial Sequence <220> <223> GPMGPRGPPG PAGAPGPQGF QGNPGEPGEP GVSGPMGPRG PPGPPPVHL <400> 56 Gly Pro Met Gly Pro Arg Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly 1 5 10 15 Pro Gln Gly Phe Gln Gly Asn Pro Gly Glu Pro Gly Glu Pro Gly Val 20 25 30 Ser Gly Pro Met Gly Pro Arg Gly Pro Pro Gly Pro Pro Pro Val His 35 40 45 Leu <210> 57 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> CXXC <220> <221> misc_feature <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <400> 57 Cys Xaa Xaa Cys 1 <210> 58 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Signal sequence <400> 58 Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser 1 5 10 15 Ala Thr Ser <210> 59 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Signal sequence <400> 59 Met Phe Leu Lys Ser Pro Phe Tyr Ala Phe Leu Cys Phe Gly Gln Tyr 1 5 10 15 Phe Val Ala Val Thr His Ala 20 <210> 60 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> RX3-LA1 <400> 60 Thr His Thr Ser Gly Gly Cys Gly Cys Ala Pro Pro Pro Pro Ala Ala 1 5 10 15 Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro 20 25 30 Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro 35 40 45 Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Pro Cys 50 55 60 His Tyr Pro Thr Ala Pro Ala Arg Pro Ala Pro Ala Pro Ala Pro Ala 65 70 75 80 Pro Cys Pro Cys Ala Ala Pro Ala Pro Ser Pro Cys Gln 85 90 <210> 61 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> RX3-LA2 <400> 61 Thr His Thr Ser Gly Gly Cys Gly Cys Ala Pro Pro Pro Pro Ala Ala 1 5 10 15 Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro 20 25 30 Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro 35 40 45 Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Pro Cys 50 55 60 His Tyr Pro Pro Ala Pro Ala Pro Pro Ala Pro Ala Pro Pro Ala Pro 65 70 75 80 Ala Cys Pro Cys Ala Ala Pro Ala Pro Ser Pro Cys Gln 85 90 <210> 62 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> RX3 <400> 62 Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val 1 5 10 15 His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro 20 25 30 Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu 35 40 45 <210> 63 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> RX3(R) <400> 63 Pro Pro Pro Val Arg Leu Pro Pro Pro Val Arg Leu Pro Pro Pro Val 1 5 10 15 Arg Leu Pro Pro Pro Val Arg Leu Pro Pro Pro Val Arg Leu Pro Pro 20 25 30 Pro Val Arg Leu Pro Pro Pro Val Arg Leu Pro Pro Pro Val Arg Leu 35 40 45 <210> 64 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> RX3(K) <400> 64 Pro Pro Pro Val Lys Leu Pro Pro Pro Val Lys Leu Pro Pro Pro Val 1 5 10 15 Lys Leu Pro Pro Pro Val Lys Leu Pro Pro Pro Val Lys Leu Pro Pro 20 25 30 Pro Val Lys Leu Pro Pro Pro Val Lys Leu Pro Pro Pro Val Lys Leu 35 40 45 <210> 65 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> PXPP <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <400> 65 Pro Xaa Pro Pro 1 <210> 66 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> RX3(A) <400> 66 Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val 1 5 10 15 Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro 20 25 30 Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu 35 40 45 <210> 67 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> RX3(L) <400> 67 Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val 1 5 10 15 Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro 20 25 30 Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu 35 40 45 <210> 68 <211> 45 <212> PRT <213> Artificial Sequence <220> <223> GPMGPRGPPG PAGAPGPQGF QGNPGEPGEP GVSGPMGPRG PPGPP <400> 68 Gly Pro Met Gly Pro Arg Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly 1 5 10 15 Pro Gln Gly Phe Gln Gly Asn Pro Gly Glu Pro Gly Glu Pro Gly Val 20 25 30 Ser Gly Pro Met Gly Pro Arg Gly Pro Pro Gly Pro Pro 35 40 45 <210> 69 <211> 53 <212> PRT <213> Artificial Sequence <220> <223> PPTPPTYETE KPLEPAPVEP SYEAEPTPPT RAPDQAEPNK PTPPTPVHLP PPP <400> 69 Pro Pro Thr Pro Pro Thr Tyr Glu Thr Glu Lys Pro Leu Glu Pro Ala 1 5 10 15 Pro Val Glu Pro Ser Tyr Glu Ala Glu Pro Thr Pro Pro Thr Arg Ala 20 25 30 Pro Asp Gln Ala Glu Pro Asn Lys Pro Thr Pro Pro Thr Pro Val His 35 40 45 Leu Pro Pro Pro Pro 50 <210> 70 <211> 46 <212> PRT <213> Artificial Sequence <220> <223> PPTPPTYETE KPLEPAPVEP SYEAEPTPPT RAPDQAEPNK PTPPTP <400> 70 Pro Pro Thr Pro Pro Thr Tyr Glu Thr Glu Lys Pro Leu Glu Pro Ala 1 5 10 15 Pro Val Glu Pro Ser Tyr Glu Ala Glu Pro Thr Pro Pro Thr Arg Ala 20 25 30 Pro Asp Gln Ala Glu Pro Asn Lys Pro Thr Pro Pro Thr Pro 35 40 45 <210> 71 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> ProX domain of gamma-zein <400> 71 His Tyr Pro Tyr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His 1 5 10 15 Pro Cys Pro Cys 20 <210> 72 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> CHYPTQPPRPQPHPQPHPCPCQQPHPS <400> 72 Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro 1 5 10 15 His Pro Cys Pro Cys Gln Gln Pro His Pro Ser 20 25 <210> 73 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> CPPPPPPPPPPPPPPPPPCPCPPPPPPPCP <400> 73 Cys Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 1 5 10 15 Pro Pro Cys Pro Cys Pro Pro Pro Pro Pro Pro Pro Cys Pro 20 25 30 <210> 74 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> CPPPPPPPPPPPPPPPPPCPPCPPPPPCPP <400> 74 Cys Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 1 5 10 15 Pro Pro Cys Pro Pro Cys Pro Pro Pro Pro Pro Cys Pro Pro 20 25 30 <210> 75 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> CPPPAPAPPPAPAPPPAPCPCPAPAPP <400> 75 Cys Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro 1 5 10 15 Ala Pro Cys Pro Cys Pro Ala Pro Ala Pro Pro 20 25 <210> 76 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> CHYPPAPAPPAPAPPAPACPCAAPAPSPCQ <400> 76 Cys His Tyr Pro Pro Ala Pro Ala Pro Pro Ala Pro Ala Pro Pro Ala 1 5 10 15 Pro Ala Cys Pro Cys Ala Ala Pro Ala Pro Ser Pro Cys Gln 20 25 30 <210> 77 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> RX3(E) <400> 77 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Glu 1 5 10 15 Leu Pro Pro Pro Val Glu Leu Pro Pro Pro Val Glu Leu Pro Pro Pro 20 25 30 Val Glu Leu Pro Pro Pro Val Glu Leu Pro Pro Pro Val Glu Leu Pro 35 40 45 Pro Pro Val Glu Leu Pro Pro Pro Val Glu Leu Pro Pro Pro Pro Cys 50 55 60 His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His 65 70 75 80 Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln 85 90 <210> 78 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> RX3(D) <400> 78 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Asp 1 5 10 15 Leu Pro Pro Pro Val Asp Leu Pro Pro Pro Val Asp Leu Pro Pro Pro 20 25 30 Val Asp Leu Pro Pro Pro Val Asp Leu Pro Pro Pro Val Asp Leu Pro 35 40 45 Pro Pro Val Asp Leu Pro Pro Pro Val Asp Leu Pro Pro Pro Pro Cys 50 55 60 His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His 65 70 75 80 Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln 85 90 <210> 79 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> RX3(N) <400> 79 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Asn 1 5 10 15 Leu Pro Pro Pro Val Asn Leu Pro Pro Pro Val Asn Leu Pro Pro Pro 20 25 30 Val Asn Leu Pro Pro Pro Val Asn Leu Pro Pro Pro Val Asn Leu Pro 35 40 45 Pro Pro Val Asn Leu Pro Pro Pro Val Asn Leu Pro Pro Pro Pro Cys 50 55 60 His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His 65 70 75 80 Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln 85 90 <210> 80 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> RX3(Q) <400> 80 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Gln 1 5 10 15 Leu Pro Pro Pro Val Gln Leu Pro Pro Pro Val Gln Leu Pro Pro Pro 20 25 30 Val Gln Leu Pro Pro Pro Val Gln Leu Pro Pro Pro Val Gln Leu Pro 35 40 45 Pro Pro Val Gln Leu Pro Pro Pro Val Gln Leu Pro Pro Pro Pro Cys 50 55 60 His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His 65 70 75 80 Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln 85 90 <210> 81 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> RX3(A) <400> 81 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Ala 1 5 10 15 Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro 20 25 30 Val Ala Leu Pro Pro Pro Val Ala Leu Pro Pro Pro Val Ala Leu Pro 35 40 45 Pro Pro Val Ala Leu Pro Pro Pro Val His Leu Pro Pro Pro Pro Cys 50 55 60 His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His 65 70 75 80 Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln 85 90 <210> 82 <211> 98 <212> PRT <213> Artificial Sequence <220> <223> RX3(A)2 <400> 82 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Ala 1 5 10 15 Leu Pro Pro Pro Pro Val Ala Leu Pro Pro Pro Pro Val Ala Leu Pro 20 25 30 Pro Pro Pro Val Ala Leu Pro Pro Pro Pro Val Ala Leu Pro Pro Pro 35 40 45 Pro Val Ala Leu Pro Pro Pro Val Ala Val Pro Pro Pro Val His Leu 50 55 60 Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro 65 70 75 80 His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro 85 90 95 Cys Gln <210> 83 <211> 86 <212> PRT <213> Artificial Sequence <220> <223> RX3(L) <400> 83 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Leu 1 5 10 15 Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro 20 25 30 Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro 35 40 45 Pro Pro Val Leu Leu Pro Pro Pro Val Leu Leu Pro Pro Pro Pro Cys 50 55 60 His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His 65 70 75 80 Pro Cys Pro Cys Gln Gln 85 <210> 84 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> RX3(V) <400> 84 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Val 1 5 10 15 Leu Pro Pro Pro Val Val Leu Pro Pro Pro Val Val Leu Pro Pro Pro 20 25 30 Val Val Leu Pro Pro Pro Val Val Leu Pro Pro Pro Val Val Leu Pro 35 40 45 Pro Pro Val Val Leu Pro Pro Pro Val Val Leu Pro Pro Pro Pro Cys 50 55 60 His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His 65 70 75 80 Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln 85 90 <210> 85 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> RX3(T) <400> 85 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Thr 1 5 10 15 Leu Pro Pro Pro Val Thr Leu Pro Pro Pro Val Thr Leu Pro Pro Pro 20 25 30 Val Thr Leu Pro Pro Pro Val Thr Leu Pro Pro Pro Val Thr Leu Pro 35 40 45 Pro Pro Val Thr Leu Pro Pro Pro Val Thr Leu Pro Pro Pro Pro Cys 50 55 60 His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His 65 70 75 80 Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln 85 90 <210> 86 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> RX3(S) <400> 86 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Ser 1 5 10 15 Leu Pro Pro Pro Val Ser Leu Pro Pro Pro Val Ser Leu Pro Pro Pro 20 25 30 Val Ser Leu Pro Pro Pro Val Ser Leu Pro Pro Pro Val Ser Leu Pro 35 40 45 Pro Pro Val Ser Leu Pro Pro Pro Val Ser Leu Pro Pro Pro Pro Cys 50 55 60 His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His 65 70 75 80 Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln 85 90 <210> 87 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> RX3(A3) <400> 87 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Ala Ala 1 5 10 15 Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro 20 25 30 Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro 35 40 45 Pro Pro Ala Ala Ala Pro Pro Pro Ala Ala Ala Pro Pro Pro Pro Cys 50 55 60 His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His 65 70 75 80 Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln 85 90 <210> 88 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> PP <400> 88 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Pro Pro 1 5 10 15 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 20 25 30 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 35 40 45 Pro Pro Pro Pro Pro Pro Pro Pro Pro His Leu Pro Pro Pro Pro Cys 50 55 60 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 65 70 75 80 Pro Cys Pro Cys Pro Pro Pro Pro Pro Pro Pro Cys Pro 85 90 <210> 89 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> PP3 <400> 89 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Pro Pro 1 5 10 15 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 20 25 30 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 35 40 45 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Cys 50 55 60 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 65 70 75 80 Pro Cys Pro Cys Pro Pro Pro Pro Pro Pro Pro Cys Pro 85 90 <210> 90 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> PA <400> 90 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Ala Pro 1 5 10 15 Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro 20 25 30 Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro 35 40 45 Pro Pro Ala Pro Ala Pro Pro Pro Ala His Leu Pro Pro Pro Pro Cys 50 55 60 Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala 65 70 75 80 Pro Cys Pro Cys Pro Ala Pro Ala Pro Pro Pro Cys Pro 85 90 <210> 91 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> PA2 <400> 91 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Ala Pro 1 5 10 15 Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro 20 25 30 Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro 35 40 45 Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Pro Cys 50 55 60 Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala 65 70 75 80 Pro Cys Pro Cys Pro Ala Pro Ala Pro Pro Pro Cys Pro 85 90 <210> 92 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> NPP <400> 92 Thr His Pro Pro Pro Pro Cys Pro Cys Pro Pro Pro Pro Pro Pro Pro 1 5 10 15 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 20 25 30 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 35 40 45 Pro Pro Pro Pro Pro Pro Pro Pro Pro His Leu Pro Pro Pro Pro Cys 50 55 60 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 65 70 75 80 Pro Cys Pro Cys Pro Pro Pro Pro Pro Pro Pro Cys Pro 85 90 <210> 93 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> NPA <400> 93 Thr His Pro Pro Pro Pro Cys Pro Cys Pro Pro Pro Pro Pro Ala Pro 1 5 10 15 Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro 20 25 30 Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro 35 40 45 Pro Pro Ala Pro Ala Pro Pro Pro Ala His Leu Pro Pro Pro Pro Cys 50 55 60 Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala 65 70 75 80 Pro Cys Pro Cys Pro Ala Pro Ala Pro Pro Pro Cys Pro 85 90 <210> 94 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> Z(Adh)Px <400> 94 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Thr Pro Pro Thr 1 5 10 15 Tyr Glu Thr Glu Lys Pro Leu Glu Pro Ala Pro Val Glu Pro Ser Tyr 20 25 30 Glu Ala Glu Pro Thr Pro Pro Thr Arg Ala Pro Asp Gln Ala Glu Pro 35 40 45 Asn Lys Pro Thr Pro Pro Thr Pro Val His Leu Pro Pro Pro Pro Cys 50 55 60 His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His 65 70 75 80 Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln 85 90 <210> 95 <211> 86 <212> PRT <213> Artificial Sequence <220> <223> Z(Adh2)Px <400> 95 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Thr Pro Pro Thr 1 5 10 15 Tyr Glu Thr Glu Lys Pro Leu Glu Pro Ala Pro Val Glu Pro Ser Tyr 20 25 30 Glu Ala Glu Pro Thr Pro Pro Thr Arg Ala Pro Asp Gln Ala Glu Pro 35 40 45 Asn Lys Pro Thr Pro Pro Thr Pro Cys His Tyr Pro Thr Gln Pro Pro 50 55 60 Arg Pro Gln Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro 65 70 75 80 His Pro Ser Pro Cys Gln 85 <210> 96 <211> 94 <212> PRT <213> Artificial Sequence <220> <223> Z(col)Px <400> 96 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Gly Pro Met Gly Pro 1 5 10 15 Arg Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly Pro Gln Gly Phe Gln 20 25 30 Gly Asn Pro Gly Glu Pro Gly Glu Pro Gly Val Ser Gly Pro Met Gly 35 40 45 Pro Arg Gly Pro Pro Gly Pro Pro Pro Val His Leu Pro Pro Pro Pro 50 55 60 Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro 65 70 75 80 His Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln 85 90 <210> 97 <211> 86 <212> PRT <213> Artificial Sequence <220> <223> Z(col2)Px <400> 97 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Gly Pro Met Gly Pro 1 5 10 15 Arg Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly Pro Gln Gly Phe Gln 20 25 30 Gly Asn Pro Gly Glu Pro Gly Glu Pro Gly Val Ser Gly Pro Met Gly 35 40 45 Pro Arg Gly Pro Pro Gly Pro Pro Cys His Tyr Pro Thr Gln Pro Pro 50 55 60 Arg Pro Gln Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro 65 70 75 80 His Pro Ser Pro Cys Gln 85 <210> 98 <211> 67 <212> PRT <213> Artificial Sequence <220> <223> Z(Adh) <400> 98 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Thr Pro Pro Thr 1 5 10 15 Tyr Glu Thr Glu Lys Pro Leu Glu Pro Ala Pro Val Glu Pro Ser Tyr 20 25 30 Glu Ala Glu Pro Thr Pro Pro Thr Arg Ala Pro Asp Gln Ala Glu Pro 35 40 45 Asn Lys Pro Thr Pro Pro Thr Pro Val His Leu Pro Pro Pro Pro Cys 50 55 60 Pro Pro Cys 65 <210> 99 <211> 60 <212> PRT <213> Artificial Sequence <220> <223> Z(Adh2) <400> 99 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Thr Pro Pro Thr 1 5 10 15 Tyr Glu Thr Glu Lys Pro Leu Glu Pro Ala Pro Val Glu Pro Ser Tyr 20 25 30 Glu Ala Glu Pro Thr Pro Pro Thr Arg Ala Pro Asp Gln Ala Glu Pro 35 40 45 Asn Lys Pro Thr Pro Pro Thr Pro Cys Pro Pro Cys 50 55 60 <210> 100 <211> 64 <212> PRT <213> Artificial Sequence <220> <223> Z(col) <400> 100 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Gly Pro Met Gly Pro 1 5 10 15 Arg Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly Pro Gln Gly Phe Gln 20 25 30 Gly Asn Pro Gly Glu Pro Gly Glu Pro Gly Val Ser Gly Pro Met Gly 35 40 45 Pro Arg Gly Pro Pro Gly Pro Pro Pro Val His Leu Cys Pro Pro Cys 50 55 60 <210> 101 <211> 60 <212> PRT <213> Artificial Sequence <220> <223> Z(col2) <400> 101 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Gly Pro Met Gly Pro 1 5 10 15 Arg Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly Pro Gln Gly Phe Gln 20 25 30 Gly Asn Pro Gly Glu Pro Gly Glu Pro Gly Val Ser Gly Pro Met Gly 35 40 45 Pro Arg Gly Pro Pro Gly Pro Pro Cys Pro Pro Cys 50 55 60 <210> 102 <211> 63 <212> PRT <213> Artificial Sequence <220> <223> R8(4C) <400> 102 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val His 1 5 10 15 Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro 20 25 30 Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro 35 40 45 Pro Pro Val His Val Pro Pro Pro Val His Leu Cys Pro Pro Cys 50 55 60 <210> 103 <211> 57 <212> PRT <213> Artificial Sequence <220> <223> R7(4C) <400> 103 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val His 1 5 10 15 Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro 20 25 30 Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro 35 40 45 Pro Pro Val His Val Cys Pro Pro Cys 50 55 <210> 104 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> R6(4C) <400> 104 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val His 1 5 10 15 Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro 20 25 30 Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Cys 35 40 45 Pro Pro Cys 50 <210> 105 <211> 45 <212> PRT <213> Artificial Sequence <220> <223> R4(4C) <400> 105 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val His 1 5 10 15 Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro 20 25 30 Val His Leu Pro Pro Pro Val His Leu Cys Pro Pro Cys 35 40 45 <210> 106 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> iRX3 <400> 106 Gln Cys Pro Ser Pro His Pro Gln Gln Cys Pro Cys Pro His Pro Gln 1 5 10 15 Pro His Pro Gln Pro Arg Pro Pro Gln Thr Pro Tyr His Cys Pro Pro 20 25 30 Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His 35 40 45 Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro 50 55 60 Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro 65 70 75 80 Pro Pro Pro Gln Cys Gly Cys Gly Gly Ser Thr His Thr 85 90 <210> 107 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> PBIS <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated n times <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated 4, 5, 6, 7 or 8 times <400> 107 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Glu 1 5 10 15 Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln 20 25 30 Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser 35 40 45 Pro Cys Gln 50 <210> 108 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> PBIS <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated n times <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated 4, 5, 6, 7 or 8 times <400> 108 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Asp 1 5 10 15 Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln 20 25 30 Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser 35 40 45 Pro Cys Gln 50 <210> 109 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> PBIS <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated n times <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated 4, 5, 6, 7 or 8 times <400> 109 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Asn 1 5 10 15 Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln 20 25 30 Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser 35 40 45 Pro Cys Gln 50 <210> 110 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> KDEL <400> 110 Lys Asp Glu Leu 1 <210> 111 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> PBIS <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated n times <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated 4, 5, 6, 7 or 8 times <400> 111 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Gln 1 5 10 15 Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln 20 25 30 Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser 35 40 45 Pro Cys Gln 50 <210> 112 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> PBIS <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated n times <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated 4, 5, 6, 7 or 8 times <400> 112 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Ala 1 5 10 15 Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln 20 25 30 Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser 35 40 45 Pro Cys Gln 50 <210> 113 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> PBIS <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated n times <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated 4, 5, 6, 7 or 8 times <400> 113 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Thr 1 5 10 15 Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln 20 25 30 Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser 35 40 45 Pro Cys Gln 50 <210> 114 <211> 50 <212> PRT <213> Artificial Sequence <220> <223> PBIS <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated n times <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated 4, 5, 6, 7 or 8 times <400> 114 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Ser 1 5 10 15 Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln 20 25 30 Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser 35 40 45 Pro Cys 50 <210> 115 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> PBIS <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated n times <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated 4, 5, 6, 7 or 8 times <400> 115 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Leu 1 5 10 15 Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln 20 25 30 Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser 35 40 45 Pro Cys Gln 50 <210> 116 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> PBIS <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated n times <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated 4, 5, 6, 7 or 8 times <400> 116 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Val Val 1 5 10 15 Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln 20 25 30 Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser 35 40 45 Pro Cys Gln 50 <210> 117 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> PBIS <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated n times <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated 4, 5, 6, 7 or 8 times <400> 117 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Ala Ala 1 5 10 15 Ala Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln 20 25 30 Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser 35 40 45 Pro Cys Gln 50 <210> 118 <211> 46 <212> PRT <213> Artificial Sequence <220> <223> PBIS <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated n timed <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated 4, 5, 6, 7 or 8 times <400> 118 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Ala Ala 1 5 10 15 Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro Ala Pro Ala Pro Pro Pro 20 25 30 Ala Pro Cys Pro Cys Pro Ala Pro Ala Pro Pro Pro Cys Pro 35 40 45 <210> 119 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> PBIS <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated n times <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated 4, 5, 6, 7 or 8 times <400> 119 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Pro Pro 1 5 10 15 Pro Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln 20 25 30 Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser 35 40 45 Pro Cys Gln 50 <210> 120 <211> 50 <212> PRT <213> Artificial Sequence <220> <223> PBIS <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated n times <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated 4, 5, 6, 7 or 8 times <400> 120 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Pro Pro 1 5 10 15 Pro Pro Pro Pro Cys Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 20 25 30 Pro Pro Pro Pro Pro Pro Cys Pro Cys Pro Pro Pro Pro Pro Pro Pro 35 40 45 Cys Pro 50 <210> 121 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> PBIS <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated n times <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated 4, 5, 6, 7 or 8 times <400> 121 Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro Pro Ala Pro 1 5 10 15 Ala Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln 20 25 30 Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser 35 40 45 Pro Cys Gln 50 <210> 122 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> PBIS <220> <221> REPEAT <222> (12)..(17) <223> The sequence may be repeated 4, 5, 6, 7 or 8 times <400> 122 Thr His Thr Ser Gly Gly Cys Gly Cys Ala Pro Pro Pro Pro Ala Ala 1 5 10 15 Ala Pro Pro Pro Pro Cys His Tyr Pro Pro Ala Pro Ala Pro Pro Ala 20 25 30 Pro Ala Pro Pro Ala Pro Ala Cys Pro Cys Ala Ala Pro Ala Pro Ser 35 40 45 Pro Cys Gln 50 <210> 123 <211> 52 <212> PRT <213> Artificial Sequence <220> <223> PPPVELPPPV ELPPPVELPP PVELPPPVEL PPPVELPPPV ELPPPVELPP PP <400> 123 Pro Pro Pro Val Glu Leu Pro Pro Pro Val Glu Leu Pro Pro Pro Val 1 5 10 15 Glu Leu Pro Pro Pro Val Glu Leu Pro Pro Pro Val Glu Leu Pro Pro 20 25 30 Pro Val Glu Leu Pro Pro Pro Val Glu Leu Pro Pro Pro Val Glu Leu 35 40 45 Pro Pro Pro Pro 50 <210> 124 <211> 52 <212> PRT <213> Artificial Sequence <220> <223> PPPVDLPPPV DLPPPVDLPP PVDLPPPVDL PPPVDLPPPV DVPPPVDLPP PP <400> 124 Pro Pro Pro Val Asp Leu Pro Pro Pro Val Asp Leu Pro Pro Pro Val 1 5 10 15 Asp Leu Pro Pro Pro Val Asp Leu Pro Pro Pro Val Asp Leu Pro Pro 20 25 30 Pro Val Asp Leu Pro Pro Pro Val Asp Val Pro Pro Pro Val Asp Leu 35 40 45 Pro Pro Pro Pro 50 <210> 125 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> PP2 <400> 125 Thr His Pro Pro Pro Pro Cys Pro Pro Cys Pro Pro Pro Pro Pro Pro 1 5 10 15 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 20 25 30 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 35 40 45 Pro Pro Pro Pro Pro Pro Pro Pro Pro His Leu Pro Pro Pro Pro Cys 50 55 60 Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro 65 70 75 80 Pro Cys Pro Pro Cys Pro Pro Pro Pro Pro Cys Pro Pro 85 90 <210> 126 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> QCPSPHPQQCPCPHPQPHPQPRPPQTPYHC <400> 126 Gln Cys Pro Ser Pro His Pro Gln Gln Cys Pro Cys Pro His Pro Gln 1 5 10 15 Pro His Pro Gln Pro Arg Pro Pro Gln Thr Pro Tyr His Cys 20 25 30 <210> 127 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> CHYPTAPARPAPAPAPAPCPCAAPAPSPCQ <400> 127 Cys His Tyr Pro Thr Ala Pro Ala Arg Pro Ala Pro Ala Pro Ala Pro 1 5 10 15 Ala Pro Cys Pro Cys Ala Ala Pro Ala Pro Ser Pro Cys Gln 20 25 30 <210> 128 <211> 46 <212> PRT <213> Artificial Sequence <220> <223> Adh <400> 128 Pro Pro Thr Pro Pro Thr Tyr Glu Thr Glu Lys Pro Leu Glu Pro Ala 1 5 10 15 Pro Val Glu Pro Ser Tyr Glu Ala Glu Pro Thr Pro Pro Thr Arg Ala 20 25 30 Pro Asp Gln Ala Glu Pro Asn Lys Pro Thr Pro Pro Thr Pro 35 40 45 <210> 129 <211> 47 <212> PRT <213> Artificial Sequence <220> <223> Col <400> 129 Pro Gly Pro Met Gly Pro Arg Gly Pro Pro Gly Pro Ala Gly Ala Pro 1 5 10 15 Gly Pro Gln Gly Phe Gln Gly Asn Pro Gly Glu Pro Gly Glu Pro Gly 20 25 30 Val Ser Gly Pro Met Gly Pro Arg Gly Pro Pro Gly Pro Pro Pro 35 40 45 <210> 130 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> QPPPPVHLPPPPCHYPTQPPRPQPHPQPHP <400> 130 Gln Pro Pro Pro Pro Val His Leu Pro Pro Pro Pro Cys His Tyr Pro 1 5 10 15 Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His Pro 20 25 30

Claims

길이가 최소 36개의 아미노산들인 폴리프롤린 II(PPII) 구조를 포함하는 재조합 단백질체 유도 폴리펩티드 서열(PBIS)로서;
상기 PPII 구조는 N-말단에서 최소 두 시스테인들 사이 및 C-말단에서 최소 두 시스테인들 사이에 위치되고;
상기 PPII 구조 내 단지 10%의 아미노산들은 리신 또는 아르기닌이고;
상기 PPII 구조는 서열 (PPPVHL)₆.(서열번호 29)을 포함하지 않는 재조합 단백질체 유도 폴리펩티드 서열.
길이가 최소 36개의 아미노산들인 프롤린 풍부 서열을 포함하는 재조합 단백질체 유도 폴리펩티드 서열(PBIS)로서;
상기 프롤린 풍부 서열은 N-말단에서 최소 두 시스테인들 사이 및 C-말단에서 최소 두 시스테인들 사이에 위치되고;
상기 프롤린 풍부 서열 내 단지 10%의 아미노산들은 리신 또는 아르기닌이고;
상기 프롤린 풍부 서열은 서열 (PPPVHL)₆.(서열번호 29)을 포함하지 않는 재조합 단백질체 유도 폴리펩티드 서열.
제1항 또는 제2항에 있어서,
상기 PPII 구조 또는 상기 프롤린 풍부 영역은 적어도 5개의 프롤린 풍부 반복들을 포함하는 재조합 단백질체 유도 폴리펩티드 서열.
제3항에 있어서,
상기 프롤린 풍부 반복들의 각각은 PPPXXX (서열번호 10), PPXX (서열번호 6), PX, PPPXX (서열번호 9), PPPX (서열번호 5), PPX 및 PPPXPX (서열번호 11)로 구성되는 군으로부터 독립적으로 선택되고, 여기서 X는 임의의 아미노산인 재조합 단백질체 유도 폴리펩티드 서열.
제1항 내지 제4항 중 어느 한 항에 있어서,
상기 PPII 구조 또는 상기 프롤린 풍부 영역의 길이는 약 40 내지 60개의 아미노산들인 재조합 단백질체 유도 폴리펩티드 서열.
제1항 내지 제5항 중 어느 한 항에 있어서,
상기 PPII 구조 또는 상기 프롤린 풍부 영역은 비양친매성 PPII 구조, 양매성 및 음으로 대전된 PPII 구조 및 양매성 및 비대전된 PPII 구조로 구성되는 군으로부터 선택되는 재조합 단백질체 유도 폴리펩티드 서열.
제6항에 있어서,
상기 PPII 구조 또는 상기 프롤린 풍부 영역은 음으로 대전된 양친매성 서열을 포함하는 재조합 단백질체 유도 폴리펩티드 서열.
제7항에 있어서,
상기 음으로 대전된 양친매성 서열은 PPPVDL (서열번호 19) 및 PPPVEL (서열번호 18)로 구성되는 군으로부터 독립적으로 선택되는 적어도 하나의 반복을 포함하는 재조합 단백질체 유도 폴리펩티드 서열.
제8항에 있어서,
상기 음으로 대전된 양친매성 서열은 서열번호 30, 서열번호 31, 서열번호 123 및 서열번호 124로 구성되는 군으로부터 독립적으로 선택되는 재조합 단백질체 유도 폴리펩티드 서열.
제9항에 있어서,
상기 PPII 구조 또는 상기 프롤린 풍부 영역은 비대전된 양친매성 서열을 포함하는 재조합 단백질체 유도 폴리펩티드 서열.
제10항에 있어서,
상기 비대전된 양친매성 서열은 PPPVNL (서열번호 21) 및 PPPVQL (서열번호 22)로 구성되는 군으로부터 독립적으로 선택되는 적어도 하나의 반복을 포함하는 재조합 단백질체 유도 폴리펩티드 서열.
제11항에 있어서, 상기 비대전된 양친매성 서열은 서열번호 32, 서열번호 33, 서열번호 34 및 서열번호 35로 구성되는 군으로부터 독립적으로 선택되는 재조합 단백질체 유도 폴리펩티드 서열.
제6항에 있어서,
상기 PPII 구조 또는 상기 프롤린 풍부 영역은 비양친매성 서열인 재조합 단백질체 유도 폴리펩티드 서열.
제13항에 있어서,
상기 비양친매성 서열은 PPPVAL (서열번호 16), PPPVTL (서열번호 20), PPPVSL (서열번호 36), PPPVVL, (서열번호 37) 및 PPPVLL (서열번호 17)로 구성되는 군으로부터 독립적으로 선택되는 적어도 하나의 반복을 포함하는 재조합 단백질체 유도 폴리펩티드.
제14항에 있어서,
상기 비양친매성 서열은 서열번호 38, 서열번호 39, 서열번호 40, 서열번호 41, 서열번호 42, 서열번호 43, 서열번호 44, 서열번호 45, 서열번호 46, 서열번호 47, 서열번호 48 및 서열번호 49로 구성되는 군으로부터 독립적으로 선택되는 재조합 단백질체 유도 폴리펩티드 서열.
제15항에 있어서,
상기 비양친매성 서열은 프롤린 및 알라닌으로 구성되는 군으로부터 선택된 아미노산들로 필수 구성되는 재조합 단백질체 유도 폴리펩티드 서열.
제16항에 있어서,
프롤린 및 알라닌으로 구성되는 군으로부터 선택된 아미노산들로 필수 구성되는 상기 서열은 PPPAAA (서열번호 13), PPPAPA (서열번호 23) 및 PPPPPP (서열번호 24)로 구성되는 군으로부터 선택된 적어도 하나의 반복을 포함하는 재조합 단백질체 유도 폴리펩티드 서열.
제17항에 있어서,
프롤린 및 알라닌으로 구성되는 군으로부터 선택된 아미노산들로 필수 구성되는 상기 서열은 서열번호 50, 서열번호 51, 서열번호 52, 서열번호 53, 서열번호 54, 서열번호 55, 서열번호 60 및 서열번호 61로 구성되는 군으로부터 독립적으로 선택되는 재조합 단백질체 유도 폴리펩티드 서열.
제13항에 있어서,
상기 비양친매성 서열은 서열 (GXY)n 으로 필수 구성되고, 여기서 X 및 Y는 독립적인 임의의 아미노산이고, n은 5 내지 20의 정수이며, (GXY)n 을 포함하는 상기 서열은 최소 30% 프롤린들을 포함하는 재조합 단백질체 유도 폴리펩티드 서열.
제19항에 있어서,
상기 비양친매성 서열은 유전자은행 등록번호 (GenBank accession number) CAA34683.1의 아미노산 135 내지 179와 최소 70% 동일성을 보이는 아미노산들로 구성되는 군으로부터 선택된 아미노산들로 필수 구성되는 재조합 단백질체 유도 폴리펩티드 서열.
제20항에 있어서,
상기 비양친매성 서열은 서열번호 56 및 서열번호 68로 구성되는 군으로부터 선택되는 아미노산들로 필수 구성되는 재조합 단백질체 유도 폴리펩티드 서열.
제13항에 있어서,
상기 비양친매성 서열은 표면 부착소 AgI/II (Streptococcus mutans 변종 NG8; GeneBank: GQ456171)로부터 얻은 아미노산 884 내지 927과 최소 70% 동일성을 보이는 아미노산들로 필수 구성되는 재조합 단백질체 유도 폴리펩티드 서열.
제22항에 있어서,
상기 비양친매성 서열은 서열번호 69 및 서열번호 70로 구성되는 군으로부터 선택되는 아미노산들로 필수 구성되는 재조합 단백질체 유도 폴리펩티드 서열.
제1항 내지 제23항 중 어느 한 항에 있어서,
C-말단에서 상기 두 시스테인들 사이의 아미노산들의 수는 0 내지 20까지의 정수이고/이거나 N-말단에서 상기 두 시스테인들 사이의 아미노산의 수는 0 내지 20까지의 정수인 재조합 단백질체 유도 폴리펩티드 서열.
제1항 내지 제24항 중 어느 한 항에 있어서,
상기 N-말단에서 상기 C-말단 시스테인과 상기 PPII 구조의 N-말단 사이 또는 상기 C-말단에서 상기 N-말단 시스테인과 상기 PPII 구조의 상기 C-말단 사이의 아미노산들의 수는 약 1 내지 30까지에서 독립적으로 선택된 정수인 재조합 단백질체 유도 폴리펩티드 서열.
제1항 내지 제25항 중 어느 한 항에 있어서,
상기 N-말단에서 상기 두 시스테인들 또는 상기 C-말단에서 상기 두 시스테인들은 제2 프롤린 풍부 영역 내에서 발견되는 재조합 단백질체 유도 폴리펩티드 서열.
제26항에 있어서,
상기 제2 프롤린 풍부 서열은 서열 (PX)_n으로 필수 구성되고, n은 0과 20 사이의 정수인 재조합 단백질체 유도 폴리펩티드 서열.
제27항에 있어서,
상기 제2 프롤린 풍부 서열은 서열번호 71, 서열번호 72, SEQ ID NO; 73, 서열번호 74, 서열번호 75, 서열번호 76, 및 서열번호 127로 구성되는 군으로부터 선택되는 재조합 단백질체 유도 폴리펩티드 서열.
제28항에 있어서,
상기 PBIS는 서열번호 77, 서열번호 78, 서열번호 79, 서열번호 80, 서열번호 81, 서열번호 82, 서열번호 85, 서열번호 86, 서열번호 83, 서열번호 84, 서열번호 87, 서열번호 88, 서열번호 125, 서열번호 89, 서열번호 90, 서열번호 91, 서열번호 92, 서열번호 93, 서열번호 94, 서열번호 95, 서열번호 96, 서열번호 97, 서열번호 98, 서열번호 99, 서열번호 100 및 서열번호 101로 구성되는 군으로부터 선택되는 재조합 단백질체 유도 폴리펩티드 서열.
제1항 내지 제29항 중 어느 한 항의 재조합 PBIS 및 이종 단백질을 포함하는 융합 단백질.
제30항에 있어서, 상기 이종 단백질은 재조합 PBIS에 대한 C-말단인 융합 단백질.
제 31항에 있어서, 상기 이종 단백질은 재조합 PBIS에 대한 N-말단인 융합 단백질.
제30 항 내지 제32항 중 어느 한 항에 있어서,
상기 PBIS 및 상기 이종 단백질은 링커에 의해 연결되는 융합 단백질.
제33항에 있어서,
상기 링커는 화학적으로 단백질 분해 시약의 효소에 대한 표적 부위인 융합 단백질.
제34항에 있어서,
효소적 단백질 분해 시약에 대한 상기 표적 부위는 엔테로키나아제 표적 부위, 인자 Xa 표적 부위 및 인테인으로 구성되는 군으로부터 선택되는 융합 단백질.
제1항 내지 제29항 중 어느 한 항의 재조합 PBIS 또는 제30항 내지 제35항 중 어느 한 항의 융합 단백질을 인코딩하는 서열을 포함하는 핵산 분자.
제36항에 있어서,
상기 PBIS 또는 상기 융합 단백질을 소포체로 안내하는 신호 서열을 인코딩하는 서열을 더 포함하고, 상기 신호 서열은 상기 PBIS 또는 상기 융합 단백질로서 동일 오픈 리딩 프레임 내에 있는 핵산 분자.
제37항에 있어서,
상기 신호 서열은 감마 제인 신호 펩티드 (gamma zein signal peptide)인 핵산 분자.
제36항 내지 제38항 중 어느 한 항에 있어서,
프로모터를 더 포함하는 핵산 분자.
제39항에 있어서,
상기 프로모터는 담배 세포, 포유동물 세포, 균류 세포, 곤충 세포 또는 조류 세포로 구성되는 군으로부터 선택되는 세포에서 기능적인 핵산 분자.
제37항 내지 제40항 중 어느 한 항의 핵산을 포함하는 벡터.
제1항 내지 제29항 중 어느 한 항의 재조합 PBIS 또는 제30항 내지 제33항의 융합 단백질을 포함하는 RPBLA.
제1항 내지 제29항 중 어느 한 항의 재조합 PBIS, 제30항 내지 제35항 중 어느 한 항의 융합 단백질, 제36항 내지 제40항 중 어느 한 항의 핵산, 제41항의 벡터, 및 제42항의 RPBLA를 포함하는 숙주 세포.
제43항에 있어서,
상기 세포는 고등식물세포, 사상균류 세포, 곤충세포, 포유동물 세포, 또는 조류 세포인 숙주.
RPBLA 형성을 위한 적합한 조건들 하에서 제43항 또는 제44항 중 어느 한 항의 세포를 배양하는 것을 포함하는 RPBLA 생산방법.
(i) RPBLA 형성을 위한 적합한 조건들 하에서 양태 43 또는 44 중 어느 하나의 세포를 배양하고;
(ii) 상기 재조합 단백질체를 정제하는 것
을 포함하는 RPBLA 정제방법.
(i) 제36항 내지 제40 항 중 어느 한 항의 핵산 또는 제41항의 벡터로 식물 숙주계를 형질전환하는 단계;
(ii) 상기 형질전환된 식물 숙주계로부터 식물을 생성하는 단계; 및
(iii) RPBLA 형성에 적합한 조건들 하에서 상기 식물을 성장시키는 단계
를 포함하는 RPBLA 생산방법.
(i) 제36항 내지 제40 항 중 어느 한 항의 핵산 또는 제41항의 벡터로 식물 숙주계를 형질전환하는 단계;
(ii) 상기 형질전환된 식물 숙주계로부터 식물을 생성하는 단계;
(iii) RPBLA 형성에 적합한 조건들 하에서 상기 식물을 성장시키는 단계; 및
(iv) 상기 RPBLA를 정제하는 단계
를 포함하는 RPBLA 생산방법.
제48항에 있어서,
상기 RPBLA 정제단계는,
(i) 수용성 세포 균질화액을 제조하는 단계;
(ii) 상기 수용성 세포 균질화액에 다른 밀도 영역들을 형성하여 RPBLA의 농도 증가를 포함하는 영역과 상기 RPBLA 농도 감소를 포함하는 영역을 제공하는 단계; 및
(iii) 상기 RPBLA-감소된 영역을 상대적으로 증가된 농도의 RPBLA 영역으로부터 분리하여 RPBLA를 정제하는 단계
를 포함하는 RPBLA 생산방법.
(i) 막으로 둘러싸인 융합 단백질을 포함하는 RPBLA를 제공하는 단계로서, 상기 융합 단백질은 제30항 내지 제35항 중 어느 한 항의 융합 단백질임;
(ii) 상기 RPBLA를 막 분해할 수 있는 양의 계면활성제를 포함하는 수용성 완충제와 접촉시키는 단계;
(iii) 상기 막을 분해하기에 충분한 시간 동안 상기 융합 단백질을 변성시키지 않는 온도에서 상기 접촉을 유지하여 상기 막을 상기 융합 단백질로부터 분리하는 단계; 및
(iv) 상기 분리된 융합 단백질을 채집하는 단계
를 포함하는 융합 단백질 정제방법.
(i) 막으로 둘러싸인 융합 단백질을 포함하는 RPBLA를 제공하는 단계로서, 상기 융합 단백질은 양태 30 내지 35 중 어느 한 항의 융합 단백질임;
(ii) 상기 RPBLA를 막 분해할 수 있는 양의 계면활성제를 포함하는 수용성 완충제와 접촉시키는 단계;
(iii) 상기 막을 분해하기에 충분한 시간 동안 상기 융합 단백질을 변성시키지 않는 온도에서 상기 접촉을 유지하여 상기 막을 상기 융합 단백질로부터 분리하는 단계;
(iv) 상기 분리된 융합 단백질을 채집하는 단계; 및
(v) 상기 재조합 PBIS 및 이종 단백질 사이의 분할 부위를 분할하는 단계
를 포함하는 융합 단백질 정제방법.
제42항의 RPBLA의 치료적으로 유효량을 포함하는 약제학적 조성물.
제42항의 RPBLA의 면역학적으로 유효량을 포함하는 백신.
약제학적으로 허용가능한 희석제를 추가로 포함하는 제52항의 약제학적 조성물 또는 제53항의 백신.
제42항의 RPBLA를 포함하는 식품.