KR20090079258A

KR20090079258A - 타겟팅 발현 및 재조합 폴리펩타이드의 번역 후 변형 조절을 위한 서열 세트

Info

Publication number: KR20090079258A
Application number: KR1020097011735A
Authority: KR
Inventors: 베로니크 고모르드; 클라우드 셍트-요르-듀파스; 아우렐리아 보우라프로스; 마리아-크리스틴 키에페르-메이에르; 로익 파예
Original assignee: 상뜨르 나쇼날 드 라 러쉐르쉬 샹띠피끄 (쎄엔알에스)
Priority date: 2006-11-08
Filing date: 2007-11-08
Publication date: 2009-07-21
Also published as: WO2008056265A3; IL198659A0; MX2009004985A; JP2010508839A; AU2007318926A1; IL198659A; EP2089526A2; EP2089526B1; AU2007318926B2; CN101622354A; RU2481399C2; CA2669455A1; WO2008056265A2; BRPI0716711A2; US20110195452A1; JP5568702B2; RU2009120298A

Abstract

본 발명은 재조합 폴리펩타이드의 번역 후 변형을 조절하기 유용한 새로운 도구를 제공한다. 이러한 도구는 호스트 세포에서 그들이 합성되는 동안 재조합 폴리펩타이드를 특정 서브-세포 구획으로 타겟팅하고, 상기 서브-세포 구획 내에서 상기 재조합 폴리펩타이드의 특정한 설계를 가능하게 하는 특정한 신호 펩타이드이다. 이러한 신호 펩타이드는 본 명세서에서 서열 번호 1 내지 서열 확인 31로 개시되어 있다. 본 발명은 유리하게, 예를 들어, 재조합 폴리펩타이드의 생산 수득률을 증가시키고, 재조합 폴리펩타이드의 면역원성을 막고, 그들의 천연 대응물의 정확한 복사본인 치료적 활성 재조합 폴리펩타이드를 얻도록 한다. 본 발명은 구체적으로 식물 제조 약물의 재적응 분야와 관련한다.

소포체, 골지체, 번역 후 변형, 재조합 단백질

Description

타겟팅 발현 및 재조합 폴리펩타이드의 번역 후 변형 조절을 위한 서열 세트{A SET OF SEQUENCES FOR TARGETING EXPRESSION AND CONTROL OF THE POST-TRANSLATIONNAL MODIFICATIONS OF A RECOMBINANT POLYPEPTIDE}

본 발명은 재조합 단백질 생산 분야와 관련 있고 더욱 구체적으로는 소포체(ER) 및/또는 골지체(GA)에서 번역 후 변형된 재조합 폴리펩타이드를 생산하는 방법과 관련된 것이다. 본 발명은 재조합 폴리펩타이드의 번역 후 변형을 조절하는데 유용한 도구를 제공하고 더 일반적으로 식물 유전적 변형을 위한 DNA 조작 도구를 제공한다. 본 발명은 또한 이러한 도구와 관련한 재조합 폴리펩타이드의 생산 과정을 제공한다.

본 발명의 도구는 호스트 세포에서 특정 서브-세포 구획으로 재조합 단백질이 합성되는 동안 그들의 구분을 이끌고 또한 상기 서브-세포 구획 내에서 상기 재조합 폴리펩타이드의 특정 설계도 이끄는 타겟팅 신호를 포함한다. 본 발명은, 유리하게, 예를 들어 재조합 폴리펩타이드의 생산 수득률을 증가시키고, 재조합 폴리펩타이드의 면역원성을 제한하거나 막으며, 그들의 천연 대응물과 완전한 복사물인 치료적으로 활성 있는 재조합 폴리펩타이드를 얻도록 한다.

본 발명은 구체적으로 식물 제조 약물(PMPs)의 재적응(reorientation) 분야 와 관련한다.

본 발명은 또한 타겟팅 신호에 융합된 단일 사슬 가변성 절편(ScFv)과 단백질의 상호작용을 이용한 식물 제조 약물의 면역 타겟팅(targeting) 분야와도 관련한다.

본 발명은 또한 식물 제조 약물의 번역 후 변형과 관계되는 식물 효소의 재적응 분야와도 관련한다.

본 발명은 또한 식물 제조 약물의 번역 후 변형과 관계되는 이종 효소의 재적응 분야와도 관련한다.

재조합 DNA 기술은 호스트 시스템에서 이종 재조합 단백질의 생산을 가능하게 해 왔다. 초기 작업의 대다수는 원핵 세포 호스트, 주로 대장균(Edcherichia coli.)에서 재조합 약제용 단백질의 발현을 향해 진행되었다. 생산 시스템으로 원핵 세포의 장점은 그들의 유전적 조작의 용이성, 그들의 빠른 성장 및 재조합 단백질의 높은 발현 수준 그리고 대-규모 발효의 가능성이다.

그러나 신호 펩타이드 절단(cleavage), 프로펩타이드(propeptide) 처리, 단백질 접힘(folding), 디설파이드 결합 형성 및 글리코실화를 포함하는 몇몇 번역 후 변형(PTMs)은 원핵생물에서 수행될 수 없었다. 그 결과, 원핵생물에서 생산된 복합체 약제용 단백질은 생물학적 활성의 의도한 정도를 제공하기 위해 항상 적절히 접히거나 처리되지는 않았다. 결론적으로, 미생물 발현 시스템은 일반적으로 인 슐린, 인터페론 또는 인간 성장 호르몬과 같이 상대적으로 단순한 약제용 단백질의 발현에만 사용되었고, 이는 생물학적 활성을 가지기 위해 접히거나 광범위한 번역 후 처리를 요하지 않는다.

약제용 단백질 생산을 위한 원핵 생물의 한계로 인하여, 바이오기술 산업은 포유동물 세포 배양물, 이스트, 균(fungi), 곤충 세포 및 트랜스제닉 동물과 같은 진핵 생물 호스트로 향한 노력을 해 왔다. 이러한 생산 시스템은 감내할 수 있기는 하지만, 다른 단점이 있다; 고가의 발효, 낮은 수득률, 분비 문제, 높은 작동 비용, 많은 양으로 하기에 어려움 및 바이러스나 프리온에 의한 잠재적 오염과 같은 것이다(Gomord et al. 2004(참조 23)).

식물 세포와 식물 서스펜션-배양된 세포는 우수한 대안이 될 수 있다: 유리한 비용, 인간에 대한 병원성 오염이 없음(Gomord et al. 2004(참조 23)).

그러나 모든 진핵 생물 세포의 주요한 문제점 중 하나는 적절하지 않은 번역 후 변형이다(PTMs).

실제로, 약제용 단백질의 많은 대다수는 몇몇 번역 후 변형을 겪고, 이는 유전자의 유전 정보가 기능성 유전자 산물의 형성을 지시하는 마지막 단계이다.

본 명세서에서, 용어 "번역 후 변형(PTM)"은, 예를 들어 글리코실화, 인산화, 메틸화, ADP-리보실화, 산화 및 글리케이션(glycation)과 같은 개별 아미노산 잔기의 유도체를 얻는 공유결합 변형을 포괄하고; 폴리펩타이드 백본(backbone)과 관련된 반응에 의한 단백질 가수분해 처리; 및 탈아미드화, 라세미화 및 단백질 구조에서의 임의적 변화와 같은 비-효소적 변형을 들 수 있다.

번역 후 변형의 대부분은 진핵 세포에서 내막 시스템의 존재에 의존한다. 분비 통로는 첨부 도면 1에 나타난 것 같이, 소포체(ER), 골지체(GA), 토노플라스트(tonoplast), 리소조말 구획, 원형질 막 및 세포외 매개물로 구성된다. 최근 연구는 초반 구획(ER 및 GA)이 막 연속체로 구성될 가능성이 있다는 것을 보여준다(도 1을 보라). 그러나, ER 내, ER과 GA 사이 및 골지 내 단백질 이동에 대한 상세한 연구는 단백질이 식물 세포 내에서 효소적으로 구별되는 4개의 도메인 안에 서브구획화되어 있다는 것을 보여 준다(도 1을 보라: 도메인 파란색, 노란색, 녹색 및 오렌지색).

혈액 단백질, 시토카인, 면역글로불린, 구조 단백질, (성장)호르몬, 백신, 효소 및 리소조말 단백질을 포함하는 대부분의 약제용 단백질은 ER의 루멘 내로 번역되면서 삽입되고, 이후 GA를 거쳐 리소조말 구획, 세포외 매트릭스 또는 혈액으로 이동된다. 대부분의 약제용 단백질 변형은 분비 통로에서 일어나나 구체적으로 그것의 초반 구획에서 일어난다(ER과 GA, Gomord와 Faye, 2004(참조 21).

예를 들어, 응고 인자 Ⅸ는 ER에서 461 아미노산의 전구체 분자로서 합성되는 비타민 K-의존 글리코단백질이다. 생물학적으로 활성인 인자 Ⅸ를 얻기 위해서, 본 전구체는 ER 및 GA에서 광범위한 번역 후 변형을 겪고, 이는 신호 펩타이드와 프로펩타이드의 절단, 디설파이드 연결 형성, 처음 12 글루탐산 잔기의 γ-카르복실화, 아스파테이트 64의 부분적 β-하이드록실화, 아스파라긴(Asn) 157과 Asn 167에 N-링크된 글리코실화, 세린(Ser) 63, Ser 61, 트레오닌(Thr) 159, Thr 169, Thr 172 및 Thr 179에 O-링크된 글리코실화, 티로신(Tyr) 155의 설페이션(sulfation), 및 Ser 158의 인산화를 포함한다. 이는 관찰된 약제용 단백질의 매우 복합적인 성숙 중 하나이다.

더욱 일반적으로, 대부분 약제용 단백질은 그들의 생물활성, 약물동력학, 안정성, 용해성을 위해 최소한 단백질 가수 분해적 절단 및 글리코실화를 필요로 한다.

진핵 세포는 이러한 변형의 대부분을 달성할 수 있다. 그러나, 더욱 일반적으로, 이러한 성숙은 호스트 시스템에 특이적이다. 게다가, 번역 후 변형이 포유 동물 세포와 식물 세포에서 다르다. 다른 진핵 세포에서처럼, 식물에서는 N-글리코실화가 ER에서 시작되고 올리고당 전구체(Glc3Man9GlcNAc2)가 잠재적인 N-글리코실화 서열인 Asn-X-Ser/Thr의 특정 아스파라긴 잔기에 공번역적으로 부가된다. 일단 초기 단백질 상으로 이동되면, 분비된 글리코단백질이 분비 통로를 통해 이동되는 동안, 올리고당 전구체는, 첨부 도면 2에서 도식적으로 나타난 바와 같이, ER과 GA 내에서 당 잔기의 제거나 부가와 관련된 몇몇 성숙을 겪는다. 식물과 포유 동물 N-글리칸 성숙이 상이한 것은 후반 GA에서 뿐이고, 이는 식물 제조 약물의 N-글리칸에 알파-(1,6)-링크된 푸코즈(fucose), 베타(1,4)-링크된 갈락토즈 및 시알릭 산(sialic acid)이 존재하지 않고 이등분 베타-(1,2)-자일로즈 및 코어 알파-(1,3)-푸코즈가 존재하기 때문이다(첨부 도면 2를 보라).

본문 중, 이종 발현 시스템에서 번역 중 및 번역 후 성숙을 조절할 수 있다는 것은 매우 중요하다.

식물 ER-존재 단백질의 구조적인 분석은 그들이 주로 높은-만노즈-유형 N-글 리칸을 가지고 있다는 것을 보여준다(Navazio et al., 1997(참조 41), 1998(참조 42); Pagny et al., 2000(참조 49)). 이러한 올리고당 구조는 식물과 포유동물에 공통적이므로, 면역원성이지 않다. 본 관찰은 베타-(1,2)-자일로즈 또는 알파-(1,3)-푸코즈와 같은 면역원성 잔기가 식물-제조 약물(PMPs) N-글리칸에 연결되는 것을 막기 위한 전략을 제시한다. 본 전략은 ER 내, 즉, 면역원성 글리코-에피톱이 식물 N-글리칸 복합체에 부가되는 골지 시스터나의 위쪽에, 재조합 단백질을 저장하는 것으로 구성된다. 재조합 용해성 단백질의 C-말단 끝에 H/KDEL 서열이 부가되는 것이 식물 ER 내 그것의 체류에 충분하다는 것이 처음 보여졌다(Gomord et al., 1997(참조 24), 1999(참조 22), Saint-Jore-Dupas et al., 2004(참조 57)).

동일한 전략을 사용하여, 우리는 두 개의 다른 항체의 중쇄 및 경쇄에 H/KDEL-ER 체류 서열을 융합하였다. 이러한 항체는 독점적으로 비 면역원성의 높은-만노즈-유형 N-글리칸을 나타내고(Sriraman et al., 2004(참조 59); Petrucelli et al., 2006(참조 51)), 이것은 알파-만노시다제 Ⅰ과 같은 ER 및 시스-골지에 위치한 효소에 제한된 글리칸 성숙에 기초한 매우 효과적인 재순환을 가리킨다(Nebenfuhr et al., 1999(참조 43)). 그러므로, ER 체류 신호에 융합하는 것을 통하여 면역원성 N-글리칸이 식물-제조 약물과 관련되는 것을 막는 것이 가능하다.

반대로, 식물 ER에서 막-결합 단백질을 유지하는 원인이 되는 분자 신호에 관해 알려진 것은 거의 극히 드물다.

실제로, 오직 극소수의 연구만이 C-말단 디-라이신 모티브(Barrieu와 Chrispeel, 1999(참조 3); Benghezal et al, 2000(참조 4); McCartney et al., 2004(참조 35); Reyer et al, 2006(참조 53)), 트랜스-막 도메인(TMD)의 길이(Brandizzi et al., 2002a(참조 9)) 또는 방향족 아미노산-풍부한 ER 복귀 신호(McCartney et al., 2004(참조 35))의 역할을 제공하였다. 알파-글루코시다제 Ⅰ은, 초기 글루코단백질에서 그것의 "엔 블록(En block)" 이동 직후 올리고당 전구체로부터 특이적으로 말단 알파-(1,2)-링크된 글루코즈 잔기를 제거함에 의해 N-링크된 올리고당 잔기를 성숙 시키는 것과 관련되는 제 1 효소이다(첨부 도면 2를 보라). ER에서 본 유형 Ⅱ 막 단백질의 기능 및 결론적으로 위치는 중요하다. 실제로, 포유동물 세포에서, 신생아 때의 결함은 생후 74일경에 치명적인 결과를 낳는 심각한 일반화된 저혈압 및 변형 특징을 유도한다(De Praeter et al., 2000(참조 14)).

글리코실화와 더불어, 분비 통로 아래쪽으로 단백질의 이동은 타겟팅 신호 및 조절 펩타이드 절단과 같은 특정 단백질 가수분해 과정을 전형적으로 겪는다. N-글리코실화의 경우, 문헌에서의 최근 증거는 분비 통로에서 단백질 가수 분해 성숙은 식물과 포유동물 세포에서 유사하다는 것을 나타낸다. 이러한 성숙은 내생적 및 재조합 단백질 모두의 처리에 필수적이나, 그들은 또한 안정하고 완전한 폴리펩타이드의 높은-수득률 생산을 어려운 과제로 만든다. 이러한 단백질 가수분해 성숙은 또한 단백질이 축적되는 서브세포 구획에도 의존한다(Faye et al., 2005(참조 17)).

분비 통로를 통해 이동된 많은 식물 단백질은 전-프로단백질(pre-propretein)로서 먼저 합성되고(하기 설명에서는 "번역 후 변형되지 않은"으로도 불림), 이는 소포체로 초기 폴리펩타이드 사슬을 인도하는 N-말단 절단가능한 신호 펩타이드-또는 전-지역-, 및 그것의 최종 세포 목적지로의 전좌(translocation) 및 처리 전에 성숙 단백질의 안정화, 타겟팅, 저해 및/또는 접힙과 관련되는 조절자 프로(폴리)펩타이드-또는 프로-지역-을 포함한다. 신호 펩티다제에 의해 그들의 신호 펩타이드가 제거된 후, 단백질은 적절히 모이고 접혀지기 위해 ER 루멘 내로 분비되고, 이후 GA로 전좌 되며, 결국 분비 시스템의 다른 구획을 향해 아래쪽으로 더 간다.

많은 식물 단백질들은, 프로단백질로서 ER을 떠나고, 프로지역(proregion)은 분비 통로를 통해 그들의 루트를 따라 아래쪽에서 단백질 가수 분해적으로 절단된다. C- 또는 N-말단 절단 가능한 구분 신호를 가지는 많은 액포 단백질의 경우, 이는 특정 프로테아제에 의해 액포로 이동하는 동안 또는 이후에 제거된다. 액포와 세포벽에서 발견되는 Asn-특정 시스테인 단백질 분해제는, 구체적으로, 몇몇 분비된 단백질의 처리에 관련될 것이고, 이는 2S 알부민 및 11S 글로불린과 같은 종자 저장 단백질 및 병원성-관련된 단백질, 키티나제(chitinases), 글루카나제(glucanases), 렉틴(lectin) 및 상처-유도되는 단백질 분해제 저해제와 같은 항미생물 또는 항해충제/항다이제스티브(antidigestive) 활성을 가진 단백질을 포함한다. 포유 동물 세포에서, 수많은 분비 단백질은 먼저 비활성 프로단백질 전구체로서 합성되고, 이는 이후 분비 통로를 통해 이동하는 동안, 용해성- 또는 막 결합 프로테아제에 의해 번역 후 처리된다.

많은 경우에서, 제한된 단백질 가수 분해에 의한 단백질 전구체의 활성은 박 테리아 서브틸리신 및 이스트 켁신(kexin)과 구조적으로 유사한 효소족인 서브틸리신(subtilisin)-유사 프로단백질 전환효소(convertase)에 의해 수행된다. 포유동물 프로단백질 전환효소는, 특히 푸린(furin)과 디베이직-특정 켁신-유사 프로테아제를 포함하고, 컨센서스(consensus) 서열 (Arg/Lys)-Xn-(Arg/Lys)에서 단백질 전구체를 전형적으로 절단하며, 여기서 X는 Cys를 제외한 어떤 아미노산도 가능하고, n=0, 2, 4 또는 6이다. 생체 내에서, 일반적으로 트랜스-골지 내에서 발견되는 이러한 효소들은 단백질을 성숙시키기 위해 다양한 단백질 전구체를 전환하고, 그리하여 직접 혹은 간접적으로 지모겐(zymogen) 활성, 유전자 발현, 세포 주기, 프로그램된 세포 죽음, 세포 내 단백질 타겟팅, 및 내분비/신경계 기능과 같은 중요한 과정의 미세한 조절에 기여한다.

실제로, 몇몇 실시예는 식물에서 동물 프로단백질을 그들의 생물학적으로 활성인 형태로 올바르게 처리하는 것을 설명하기 위해 제공되었다. 흥미로운 실시예는 인간 프로콜라겐에 대해 제공된 것이고, 그것의 C- 및 N-말단 프로펩티데인(propeptidein) 토바코 세포의 절단 후에 성숙 단백질로 전환되는 것을 보여준다(Lienard et al., 2006(참조 32)).

솔라나시애(Solanaceae)의 단백질 처리 효소에 대한 최근의 연구에 나타난 바에 따르면, 포유동물 처리 전환 효소의 기능적 상동체는 식물 세포의 분비 통로를 따른 단백질 성숙에 연관된다. 트랜스제닉 토바코 라인에서 발생하는 것으로 보여진 kex2p-유사 프로테아제 활성은 바이러스성 항균, KP6 킬러 프로톡신을 올바르게 처리할 수 있다. 본 골지-존재, kex2p-유사 전환효소는 이후 이스트 kex2p의 기 질 특이성 특성을 나타내는 것으로 보여졌고, 토마토로부터의 세포외 프로단백질 전환효소인 LeSBT1와 대조를 이루며, 처리 효소의 동일한 서브 집단에 속하는 포유동물 전환 효소 SKI-1과 같이, 구별적인 특이성을 나타낸다(Jansik et al, 2000(참조 31); Rautengarden et al., 2005(참조 52)).

더욱 최근에, 이스트와 포유동물의, C-말단 테트라펩타이드, 지질 변형을 겪은 단백질의 CAAX 모티브를 처리하는 CAAX 프로테아제의 기능성 상동체가 아라비도프시스에서 발견되었고, 다시 진핵세포의 분비 통로를 따라 잘 보존된 단백질 가수분해 처리의 발생이 확인되었다(Bracha et al, 2002(참조 7)).

실질적인 관점에서, 세포 수준에서 이러한 보존된 처리는, 전체적으로 보존된 N-글리코실화의 특성과 함께, 발현 및 복합적인 번역 후 변형을 요구하는 생물학적 또는 치료적으로 관련된 올바른 처리의 다양한 단백질을 위한 식물 시스템의 잠재성을 강력하게 지적한다.

식물에서, 알파-글루코시다제 Ⅰ은 아라비도프시스 탈리아나 배 발달 기간 동안 저장 단백질의 축적, 단백질체의 형성, 세포 분화 및 세포벽 분열에 있어서 기본적이다. 알파-글루코시다제 Ⅰ 활성 없이 아라비도프시스 탈리아나 종자 발달은 중앙 단계에서 차단되고(Boisson et al., 2001(참조 6)) 세포벽 생합성이 강하게 영향 받는다(Gillmor et al., 2002(참조 19)).

구체적으로 진핵 호스트에서, 구체적으로 식물 세포에서, 설계되거나 공학적으로 전사 후 변형된 재조합 단백질을 생산하기 위해, 예를 들어 호스트에서 실질적으로 그들의 천연 대응체와 동일하고, 가능한 적은 면역원성 특성을 가져 구체적 으로 인간에서, 치료적 물질로 사용할 수 있게 하는 이종 단백질이 발현되도록 하기 위해, 유전자 재조합으로 단백질을 생산할 수단이 당업계에서 여전히 필요하다.

본 발명의 발명자들은 아라비도프시스 탈리아나 글루코시다제 Ⅰ 상 ER에 존재하게 하는 2가지 독립적인 유형의 신호를 확인하였다. GFP에 융합된 본 글루코시다제의 다양한 제거와 변이를 사용하여, 그들은 아라비도프시스 탈라아나 알파-클루코시다제 Ⅰ(본 명세서에서 GCSI라고 명명)의 전체길이가 ER에 완전히 축적되고, ER로의 타겟팅 리포터를 위해 충분하며 시토졸 꼬리에 위치한 Arg-기초 모티프를 포함한다는 것을 보인다. 그러나, 이러한 기능성 Arg-기초 신호는 본 구획에 전체-길이 GCSI를 위치하기 위해 필요하지 않고 제 2 신호는 본 막 결합 ER 효소의 줄기에서 확인되었다.

발명의 발명자들은 아라비도프시스 탈리아나 글리코실트랜스퍼라제 상 GA에 존재하게 하는 3가지 유형의 독립적인 신호를 확인하였다.

본 발명의 목적은 본 필요에 따른 효과적인 도구를 정확하게 제공하고자 하는 것이다. 본 발명의 도구는 타겟팅(targeting) 또는 체류(retention) 신호 및 이러한 타겟팅 신호와 관련한 과정의 형태이다. 본 발명은 일반적으로 이러한 타겟팅 또는 체류 신호를 사용하는 다른 방법에 의한 재조합 폴리펩타이드의 번역 후 성숙(maturation)의 변형에 관한 것이다.

글리코시다제(glycosidases)와 글리코실트랜즈퍼라제(glycosyltransferases)와 같은 식물이나 인간 효소의 수송과 배치에 관한 그들의 수많은 연구에 기초하여, 본 발명자는 특히 식물 세포에서, ER와 GA 사이의 막 단백질 배치와 특정하게 관련된 다른 펩타이드 신호를 확인하였다.

따라서, 본 발명의 첫 번째 측면은 특히 식물세포에서, 특정 세포 서브-구획에 재조합 폴리 펩타이드를 체류하게 하는 특정한 펩타이드 신호를 제공하는 것이다. 이러한 펩타이드 신호의 서열과 구조는 아래 설명 되어진다. 본 발명의 펩타이드 신호는 서열 번호 1에서부터 서열 번호 31로 목록화 되어 있는 첨부된 서열에도 목록화 되어 있다. 앞으로, 이러한 펩타이드 신호는 "체류 신호 서열" 또는 "신호 서열" 또는 "타겟팅 신호" 또는 "펩타이드 신호"라고 언급될 수 있을 것이다. 본 발명의 범위에서 바람직한 서열은 표 1에 개시된 서열이다.

본 발명의 체류 신호 서열은 특히 식물 세포에서, 재조합 폴리펩타이드를 ER 및/또는 GA 구획 막으로 특정하게 타겟(target) 한다. 이러한 서열은 ER 및/또는 GA의 다른 서브 구획에서 또는 ER 및/또는 GA의 다른 서브-구획에서 막 결합 형태로 재조합 폴리펩타이드를 체류하게 한다. "타겟 하다" 또는 "타겟팅"은 본 발명의 펩타이드 신호와 융합된 폴리펩타이드가, 이 펩타이드화 신호 때문에 ER 및/또는 GA에 배치, 즉 갇히게 될 것이라는 것을 의미한다.

재조합 폴리펩타이드의 성숙과 안정성은 폴리펩타이드가 축적된 구획에 직접적으로 의존한다. 예를 들어, 본 발명자는 ER 내 재조합 폴리펩타이드의 체류는 그들의 안정성을 증가시키고 그들의 N-글리칸(glycan) 성숙을 막는다는 것을 보였다. 본 발명자들은 용해성 재조합 폴리펩타이드를 막 폴리펩타이드로서 발현시키는 것 또한 그것의 안정성을 증가시킨다는 것도 보였다. 마지막으로, 본 발명자들은 분비 통로의 초반 구획에서 재조합 폴리펩타이드의 체류는 상기 재조합 폴리펩타이드의 생산 수율을 증가시키고 글리칸 성숙에 기인하는 면역원성(immunogenecity)을 막을 수 있다는 것을 보였다.

본 발명자들은 이하에서 개시되는 다른 목표들을 위해 다른 재조합 폴리펩타이드들에 본 발명의 적절한 신호를 융합했다. 따라서, 본 발명의 다른 측면은 본 발명에 따른 펩타이드 신호를 포함하는 재조합 폴리펩타이드를 제공하는 것이고, 상기 펩타이드 신호가 상기 폴리펩타이드에 융합되어져 있는 폴리펩타이드를 제공하는 것이다. 본 발명의 펩타이드 신호의 융합은 폴리펩타이드의 C-말단 또는 N-말단 끝에서 될 수 있다. 즉, 상기 펩타이드 신호는 폴리펩타이드나 단백질의 C-말단 또는 N-말단 끝에 연결될 수 있다.

본 발명에 따라, 재조합 폴리펩타이드는 제약이나 농업-식품 산업에 이익이 되는 어떤 재조합 폴리펩타이드라도 될 수 있다. "재조합 폴리펩타이드"는 본 명세서에서 "재조합 단백질" 또는 "펩타이드 X" 또는 "타겟 단백질"이라고도 불리워질 수 있다. 그러나, 본 발명에 따른 방법으로 개시된 때에는, 예를 들어 약물적 용도로,생산되는 재조합 폴리펩타이드의 경우 "재조합 폴리펩타이드"로 쓰는 것이 바람직하고; 재조합 폴리펩타이드의 성숙 과정, 즉 번역 후 변형과 관련된(아래 방법 상세한 설명 중 설명을 보라) 단백질의 경우 "재조합 단백질"로 쓰는 것이 바람직하다.

본 발명에 따르면, 본 명세서에서 "타겟 폴리펩타이드"라고도 불리워지는 폴리펩타이드는 모든 막 치료적 폴리펩타이드, 막 단백질이거나 아닌 것으로 발현될 수 있는 모든 용해성 치료적 폴리펩타이드, 모든 항체 및 이의 부분이 될 수 있다.

예를 들어, 재조합 폴리펩타이드는 효소, 항체 또는 그의 부분, 리포터 단백질, 뉴클레오타이드 운반체 및 치료적 활성 폴리펩타이드를 포함하는 그룹으로부터 선택되어질 수 있다. 바람직하게, 상기 재조합 폴리펩타이드는 용해성 폴리펩타이드이거나 단백질이다.

본 발명으로 생산될 수 있는 치료적 활성 단백질의 예는: 백신, 알러겐(allergens), 효소, 혈액 단백질, 호르몬, 항체, 항체-유도된 부분이 있다. 바람직하게, 치료적 활성 폴리펩타이드는 용해성이다. "치료적 폴리펩타이드" 또는 "치료적 활성 폴리펩타이드"는 본 상세한 설명 및 청구범위에서 동일한 의미를 갖는다[또는 막 결합 단백질의 용해성 부분].

본 발명에 따르면, 재조합 폴리펩타이드가 효소일 때, 상기 효소는 식물 또는 동물의 효소일 수 있다. 본 발명에 따르면, 상기 효소는 예를 들어, 글리코시다제(glycosidase), 글리코실트랜스퍼라제(glycosyltransferase), 프로테아제(protease), 키나제(kinase), 디카르복실라제(decarboxylase), 에피머라제(epimerase), 뉴클레오타이드-당 운반체, 예를 들어 UDP-당 운반체, GDP-당 운반체 또는 CMP-당 운반체, 아미드화 효소 및 더욱 일반적으로 호스트 세포, 예를 들어 식물 세포,의 ER 및/또는 GA에 존재하거나 존재하지 않는 모든 성숙 효소를 포함하는 그룹으로부터 선택되어질 수 있다. 글리코시다제는 예를 들어 N- 또는 O- 글리코실화와 관련된 것일 수 있다. 글리코실트랜스퍼라제는 예를 들어 N- 또는 O-글리코실화와 관련된 것일 수 있다. 효소의 예는 하기 표에 나타내어진다.

N-글리코실화	인간 베타(1,4) 갈락토실레이션 이스트 만노실트랜스퍼라제 OCH1p 인간 GNT Ⅲ
O-글리코실화	N-아세틸글루코사미닐 트랜스퍼라제 갈락토실트랜스퍼라제
단백질 가수분해 절단(Proteolytic cleavage)	세린 프로테아제 시스테인 프로테아제
아미드화	옥시게나제 리아제(lyase)
인산화	포스포릴라제
감마-카르복실화	감마 카르복실라제
프로테오글리칸(proteoglycan) 변형	글리코트랜스퍼라제 글리코시다제
설패이션(sulfation)	설파타제
하이드록실화	하이드록실라제
아세틸화	아세틸라제
세포벽 다당류 변형	글리코트랜스퍼라제 글리코시다제

상기 표는 효소에 관한 것이다.

"성숙 효소"는 호스트 세포에서 재조합 단백질의 성숙에 참여하는 모든 효소를 의미한다.

본 발명에 따르면, 단백질이 무엇이건 간에, 저장 단백질 또는 단백질체에 저장된 단백질, 예를 들어 ZERA®에 융합된 단백질과 융합될 수 있다. 이는 호스트 세포에서의 생산 후 재조합 폴리펩타이드의 회수에 흥미롭다. 이 점은 아래 본 발명의 처리 설명으로 논의되어진다.

본 발명의 또다른 측면은 본 발명의 펩타이드 신호를 인코딩하는 핵산 서열을 제공하는 것이다. 서열 번호 1-31를 인코딩하는 핵산 서열의 실시예는 서열 번호: 102-132 참조번호 아래 부가된 서열 목록에 주어진다. 유전 코드의 동의성(degenerescence)로 인해, 당업자는 서열 번호:1-31을 역시 인코딩하는 다른 적절한 핵산 서열을 용이하게 추론할 것이다.

본 발명의 또다른 측면은 본 발명에 따른 재조합 폴리펩타이드를 인코딩하는 핵산 서열을 제공하는 것이다.

본 발명의 나아간 측면은 본 발명에 따른 핵산 서열을 포함하는 핵산 벡터를 제공하는 것이다. 본 발명의 핵산 벡터는 본 발명의 펩타이드 신호를 코딩하는 핵산 서열을 포함하고, 상기 핵산은 상기 폴리펩타이드의 하나(혹은 두 개)의 끝(끝들)에 "체류 신호 서열"을 포함하는 재조합 폴리펩타이드나 단백질을 생산하기 위하여 폴리펩타이드나 단백질을 코딩하는 핵산 서열과 프레임을 맞추어(in frame) 벡터로 도입된다.

모든 알려지고 적절한 방법이 이러한 핵산과 핵산 벡터를 만들기 위해 사용될 수 있다. 예를 들어, 개시된 방법(Gomord et al., 1997(참조 24) 및 1998(참조 25), Pagny et al, 2000(참조 49) 및 2003(참조 50), Saint-Jore-Dupas et al 2006(참조 58))이 유용하게 사용될 수 있다.

본 발명의 또다른 측면은 본 발명의 하나 이상의 펩타이드 신호 및/또는 본 발명의 하나 이상의 재조합 폴리펩타이드(즉, 본 발명의 펩타이드 신호를 포함하는) 및/또는 본 발명의 재조합 폴리펩타이드를 인코딩하는 하나 이상의 핵산 서열 및/또는 본 발명의 하나 이상의 핵산 벡터를 포함하는 식물세포를 제공하는 것이다. 본 발명에 따라, 상기 재조합 폴리펩타이드는 동종 또는 이종 폴리펩타이드일 수 있다. 재조합 폴리펩타이드는 상기 정의한 바와 같을 것이다.

모든 알려지고 적절한 방법이 상기 식물 세포를 획득하는데 사용될 수 있다. 예를 들어, Gomord et al., 1997(참조 24) 및 1998(참조 25), Pagny et al, 2000(참조 49) 및 2003(참조 50), Saint-Jore-Dupas et al 2006(참조 58), Saint-Jore et al., 2002(참조 56)에 개시된 방법은 유용하게 사용될 수 있다.

본 발명의 또다른 측면은 본 발명의 하나 이상의 펩타이드 신호 및/또는 본 발명의 하나 이상의 재조합 단백질(즉, 본 발명의 펩타이드 신호를 포함하는) 및/또는 본 발명의 재조합 단백질을 인코딩하는 하나 이상의 핵산 서열 및/또는 본 발명의 하나 이상의 핵산 벡터를 포함하는 식물을 제공하는 것이다. 본 발명에 따라, 상기 재조합 단백질은 동종 또는 이종 단백질일 수 있다. 재조합 단백질은 상기 정의한 바와 같다.

모든 알려지고 적절한 방법이 상기 식물을 획득하는데 사용될 수 있다. 예를 들어, Saint-Jore-Dupas et al 2006(참조 58), Saint-Jore et al., 2002(참조 56)에 개시된 방법이 유용하게 사용될 수 있다.

본 발명에 따라, 상기 식물은 재조합 단백질의 생산이 가능한 적절한 모든 식물이라도 될 수 있다. 예를 들어, 상기 식물은 알팔파, 아라비도스프시스 탈리아나(Arabidospsis thaliana), 니코티아나 타바쿰(Nicotiana tabacum), 글라이신 맥스(Glycine max), 리코펄시콘 에스컬렌툼(Lycopersicon esculentum), 솔라넘 투베로숨(Solanum tubersum) 오리자 사티바(oriza sativa), 지 마이즈(zea maize), 이끼(피스코미트렐라 패텐스)(physcomitrella patens), 렘나 마이너(Lemna minor), 조류(오스테오코커스 타우리, 패로닥틸럼)(osteococcus tauri, phaelodactylum), 크라미도모나스 레인할드티(shlamydomonas reinhardtii)를 포함하는 그룹으로부터 선택될 수 있다.

본 발명에 따라, 상기 식물 세포는 이러한 식물 중 어떤 것으로부터도 유래되거나 유도된 것일 수 있다.

본 발명자들은 나아가 상기 재조합 폴리펩타이드의 타겟 발현을 위하여 설계된 벡터로 형질전환 되어진 호스트 세포에서 번역 후 변형된 이종 폴리펩타이드를 생산하는 제 1 방법을 제공한다. 본 제 1 방법은 첨부된 도 3, (A)줄에 도식적으로 나타나 있다.

번역 후 변형된 재조합 폴리펩타이드를 생산하는 본 제 1 방법은 다음의 단계를 포함한다:

- 본 발명에 따른 하나 이상의 핵산 벡터로 세포를 트랜스펙팅(transfecting)시키거나 형질전환(transforming)시키는 단계로서, 상기 벡터는 번역 후 변형되지 않은 때의 폴리펩타이드인 재조합 단백질을 인코딩하는 단계;

- 트랜스펙팅된 세포를 키우는 단계; 및

- 번역 후 변형된 폴리펩타이드를 수확하는 단계.

본 발명에 따르면, 상기 과정은 트랜스펙팅되고 형질전환된 세포를 키우는 단계 이전에 세포를 스크리닝하는 단계를 더 포함할 수 있다. 당업자에게 알려진 어떠한 스크리닝 방법이라도 사용될 수 있다. 예를 들어, 현미경을 사용한 직접 선택, 전기 영동 SPS 페이지(page), 면역탐지(immunodetection), 막 전이(membrane tranfert) 등에 의할 수 있다. 스크리닝을 수행하기에 유용한 방법의 예는 예를 들어 문서 Gomord et al. 1997(참조 24)에 개시되어 있다. 본 스크리닝 단계는 본 발명에 따라 트랜스펙팅되거나 형질전환되어진 세포를 선택하도록 한다. 본 단계는 변형된 폴리펩타이드와 관련하여 더 높은 수득율을 유도한다.

상기 발명의 과정에 대한 명세서에 있어서, 상기 언급한 바와 같이, 예를 들어 약물적 용도로, 생산되는 재조합 폴리펩타이드를 지정하기 위해서는 "재조합 폴리펩타이드"로 쓰는 것이 바람직하고; 재조합 폴리펩타이드의 성숙 과정, 즉 번역 후 변형,과 관련된(아래 제 2 방법 상세한 설명 중 설명을 보라) 단백질의 경우 "재조합 단백질"로 쓰는 것이 바람직하다.

본 방법에 의하면, 재조합 폴리펩타이드와 융합된 본 발명의 펩타이드 신호를 인코딩하는 상기 핵산 벡터의 사용은 재조합 폴리펩타이드가 ER 및/또는 GA의 다른 서브-구획에서 자유롭게 또는 막 결합된 형태로 체류하도록 한다. 선행 기술 방법에서 재조합 폴리펩타이드에서 관찰된 이질성 부분은 골지를 통해 운반되고 성숙되는 동안 발생한다. 본 발명의 펩타이드 신호의 사용에 의한 ER 또는 ER-유도된 단백질체 또는 초반 골지 구획에서의 재조합 폴리펩타이드 체류는 본 이질성을 감소시킬 수 있다.

주요 난제는 천연 대응물을 그대로 복사한 재조합 단백질을 생산하는 것이다. 폴리펩타이드 번역 후 성숙은 발현 시스템간에 다른 것뿐만 아니라 동일한 발현 시스템에서 기관간에 다르고 동일한 기관의 세포 구성에서 서브-세포 구획간에도 다르다.

본 발명의 제 1 방법에 따라 특정 구획에로의 PMP를 타겟하기 위한 펩타이드 신호의 부가는 이 난제를 해결할 수 있을 것이나, 본 재조합 단백질의 구조적 변형은 물론 비-고유한 단백질에로의 과정을 유도한다. 유리하게, 본 발명의 상기 펩타이드 신호는 호스트 세포의 ER 및 GA 매개물을 공학 또는 설계하는 것에 의해, 재조합 폴리펩타이드의 성숙을 조절할 수 있는 실제 도구이다. 본 조절은 호스트 세포 내에서 보다 안정한 재조합 폴리펩타이드의 생산을 이끌고, 이는 보다 적은 면역원성을 가지고 그들의 천연 대응물의 정확한 복사물에 도달한다. 이는 사람을 치료하는데 사용될 수 있는 치료적 활성 단백질의 생산, 특히 식물에 의한 생산을 위해 매우 중요하다.

본 발명은 ER과 GA 환경을 설계하기 위한 몇 가지 해결책을 제공한다. 이러한 해결책은 단독으로 또는 함께(조합하여) 사용될 수 있다. 이러한 해결책의 예는 첨부된 도 3, (B)와 (C)줄에 도식적으로 나타나있다. 이러한 해결책 모두에 있어, 호스트 세포는 하기 것들로 트랜스펙팅되거나 형질전환된다:

-생산될 재조합 폴리펩타이드와 다른 재조합 단백질과 융합된 본 발명의 펩타이드 신호를 인코딩하는 하나 이상의 벡터 및

-상기 재조합 폴리펩타이드를 인코딩하는 하나 이상의 핵산 벡터

따라서, 본 발명의 또다른 측면은 다음의 단계를 포함하는 번역 후 변형된 재조합 폴리펩타이드를 생산하는 제 2 방법을 제공한다:

-세포를 본 발명에 따른 하나 이상의 핵산 벡터로 트랜스펙팅시키거나 형질전환시키고, 상기 벡터는 상기 폴리펩타이드와 다른 재조합 단백질을 인코딩하는 단계;

-상기 폴리펩타이드를 인코딩하는 하나 이상의 핵산 벡터로 상기 세포를 트랜스펙팅시키거나 형질전환하는 단계;

- 트랜스펙팅된 세포를 키우는 단계; 및

- 번역 후 변형된 폴리펩타이드를 수확하는 단계

본 발명에 따라, 상기 과정은 트랜스펙팅되거나 형질전환된 세포를 키우는 단계 전에 세포를 스크리닝하는 단계를 더 포함할 수 있다. 스크리닝 방법은 당업자에게 알려진 어떠한 방법이라도 사용될 수 있다. 스크리닝 방법은 상기 개시된 것일 수 있다. 본 스크리닝 단계는 본 발명에 따라 트랜스펙팅되거나 형질전환된 세포를 선택하도록 한다. 본 단계는 변형된 폴리펩타이드와 관련하여 더 높은 수득을 가능하게 한다.

본 두 번째 방법에서, 호스트 세포에서 번역된 재조합 단백질은 본 발명의 펩타이드 신호를 포함하고 본 재조합 단백질은 생산되는 폴리펩타이드와 다르다.

본 두 번째 방법에서, 상기 재조합 단백질은 생산되는 재조합 폴리펩타이드의 번역 후 변형 중 조정에서 역할을 하는데, 즉, 재조합 폴리펩타이드의 성숙 과정에 관여하는 것, 즉 상기 재조합 단백질의 번역 후 변형에 관여한다.

본 역할은 선택된 재조합 단백질의 성질에 의존한다. 당업자는 본 발명의 상세한 설명 및 실시예를 이해함으로써 본 발명을 사용하여 달성하기 원하는 것을 달성하기 위해 재조합 단백질을 어떻게 선택할 것인지 쉽게 이해할 수 있을 것이다.

본 발명에 따라서, 본 재조합 단백질은, 예를 들어 효소 및/또는 항체 또는 그의 부분이 될 수 있다.

본 발명의 두 번째 방법에 따라서, 재조합 단백질이 항체 또는 그의 부분인 경우, 생산되는 폴리펩타이드를 특정하게 인지하거나 결합하는 것 및/또는 상기 폴리펩타이드의 번역 후 변형과 관계된 효소를 특정하게 인지하거나 결합하는 항체 또는 그의 부분 같은 것이 될 수 있다.

본 방법에 의해, 본 발명의 펩타이드 신호와 융합된 항체 또는 그의 부분은 호스트 세포의 ER 및/또는 GA에 위치될 것이다. 여기에서 재조합 단백질의 역할은 ER 및/또는 GA에서 재조합 폴리펩타이드를 잡는 것이다. 그래서 상기 예시적인 발명은 발현 벡터로 형질전환된 호스트 세포에서 항체 또는 항체 절편을 발현함에 의해 번역 후 변형된 이종 폴리펩타이드를 생산하는 방법을 제공하고, 상기 발현 벡터는 다음을 인코딩하는 핵산 서열을 포함한다.

-ER/GA를 타겟으로 하는 항체 또는 항체 절편 및

-생산되는 폴리펩타이드.

생산되는 상기 폴리펩타이드를 특정하게 인지하고 결합하는 항체 또는 그의 부분에 대한 내용에서, 본 발명은 본 발명에 따른 펩타이드 신호와 상기 항체 또는 그의 절편을 융합함으로써, 이 구획 중 하나 내에 체류된 특정 항체 또는 항체 절편에 결합시킴으로써, 호스트 세포의 ER 및/또는 GA 내에 변형되지 않은(본 발명의 펩타이드 신호로 구성된 태그 추가에 의해 변형되지 않은) 재조합 단백질을 체류시킬 수 있게 한다. 본 목적을 위해, 본 발명에 따른 ER 및/또는 GA 체류 펩타이드 신호는 재조합 폴리펩타이드에 특정한 친화성을 가진 항체에 융합되었고, 이의 최종 목적은 재조합 단백질의 성숙을 조절하거나 조정하는 것이다.

상기 폴리펩타이드의 번역 후 변형과 관련한 효소와 특정하게 결합하고 인지하는 항체 또는 그의 부분에 대한 내용에서, 상기 항체 또는 그의 부분은 바람직하게 상기 효소를 조정한다. 여기서, 본 발명의 응용은 ER 및/또는 GA로 비활성화 항체를 특정하게 사용하여 이 구획에 위치된 특정 효소를 비활성화시키는 것이다. 본 목적을 위해서, 본 발명에 따른 ER 및/또는 GA 체류 펩타이드 신호는 ER 또는 GA 효소의 카탈리틱 도메인(catalytic domain)에 특정한 친화성을 가진 항체에 융합되었고, 이는 재조합 단백질의 성숙을 조절하거나 조정하기 위하여 내생적 효소를 비활성화하는 것이 최종 목적이다. 여기에서 재조합 단백질의 역할은 재조합 폴리펩타이드의 성숙과 관련된 효소를 잡는 것이다. 그러므로 본 발명은 호스트 세포 내에서 내생적 효소를 "면역-조정"하도록 한다.

본 발명에 따라서, 제 2 방법은 나아가 다음을 위해 사용될 수 있다:

1) 본 발명의 펩타이드 신호에 융합된 이종 효소를 인코딩하는 본 발명에 따른 하나 이상의 벡터를 사용함으로써 호스트 세포를 이종 효소로 보완하기 위함. 및/또는

2) 본 발명의 펩타이드 신호에 융합된 상기 내생적 효소를 인코딩하는 본 발명에 따른 하나 이상의 벡터를 사용함으로써 호스트 세포의 생산 능력을 최적화하기 위해 내생적 효소를 재배치하기 위함.

재조합 단백질의 성숙을 조정하는 이종 혹은 동종 효소의 능력은 세포 내에서의 그것의 배치에 의존할 것이다. 이때, 호스트 세포의 효소적 준비를 조정하기 위해서 "좋은" 구획으로 적절한 효소를 타겟으로 하는 것이 바람직하다. 그래서 본 발명은 발현벡터로 형질전환된 호스트 세포에서 성숙 효소를 발현함으로써 번역 후 변형된 이종 폴리펩타이드를 생산하는 방법을 제공하고, 발현벡터는 다음을 인코딩하는 핵산 서열을 포함한다:

1) 타겟팅된 성숙 효소인 재조합 단백질, 즉 본 발명의 펩타이드 신호와 융합된 성숙 효소, 및

2) 생산되는 재조합 폴리펩타이드.

따라서, 상기 재조합 단백질은 상기 폴리펩타이드의 번역 후 변형과 관련된 내생적 혹은 이종 효소일 수 있다. 본 실시예에서, 본 발명은 특히 식물 세포에서, 호스트 세포 내 ER 및/또는 GA의 효소적 준비를 조정할 수 있도록 하고, 이는 두 가지로 분리되지만 병렬될 수 있는 다음의 전략에 따른다: (a) ER 및/또는 GA로 내생적 효소를 다시 위치시키는 것에 의함, 및 (b) 이종 효소를 ER/GA로 타겟팅 하여 다른 서브-세포 구획에 위치하게 할 수 있는 것에 의함. 호스트 세포 내의 ER 및/또는 GA의 효소적 준비의 조정은 재조합 폴리펩타이드의 번역 후 성숙을 조정(즉, 설계)할 수 있도록 하는 도구이다. 예를 들어, 본 조정은 안정성을 향상시키는 것 및/또는 생산된 재조합 폴리펩타이드의 면역원성을 조절하는 것을 가능하게 해 준다. 여기에서 재조합 단백질의 역할은 ER 및/또는 GA에서 재조합 폴리펩타이드의 성숙과 관련된 동종 또는 이종 효소를 잡는 것이다.

그러므로 본 발명은 유리하게 비-면역원성 글리코단백질(glycoprotein)인 재조합 폴리펩타이드는 물론이고 동종 글리코단백질인 재조합 단백질을 얻을 수 있도록 한다.

본 발명에 따라서, 상기 폴리펩타이드는 특히 식물 세포 또는 전체 식물에서, 유전적 재조합으로 생산되는 것이 필요한 어떤 폴리펩타이드라도 될 수 있다. 본 발명으로 생산된 수 있는 폴리펩타이드는, 예를 들어 본 발명의 상기 재조합 폴리펩타이드의 개시에서 언급한 것들이다.

본 발명에 따라, 제 1 방법 및 제 2 방법은 동시에 사용될 수 있다. 이러한 경우, 제 2 방법에서, 상기 폴리펩타이드를 인코딩하는 핵산 벡터도 또한 본 발명에 따른 핵산 벡터, 즉, 본 발명의 펩타이드 신호와 융합된 폴리펩타이드를 인코딩하는 벡터이다. 본 발명의 이 실시예를 가지고, 혹자는 재조합 단백질을 ER 및/또는 GA로 위치하도록 하기 위한 성숙을 위하여 타겟팅 할 수 있고, 동시에 성숙을 위해 ER 및/또는 GA를 설계할 수 있으며, 즉, 재조합 단백질의 번역 후 변형을 할 수 있다. 상기 폴리펩타이드는 상기 정의한 바와 같을 수 있다. 예를 들어, 이는 치료적 활성 단백질일 수 있다.

본 명세서에서 개시한 바와 같이, 본 발명에 따라, 폴리펩타이드의 번역 후 변형은 유리하게 ER 및/또는 GA 구획 막에서 수행된다.

본 발명은 특히 식물 세포에서, 호스트 세포 내에서 설계된 재조합 폴리펩타이드를 생산하는 매우 강력한 도구를 제공하는 가장 우선하는 발명이다.

사용되는 본 발명의 방법이 무엇이든지 간에(제 1 방법 및/또는 제 2 방법), 상기 폴리펩타이드는 저장 단백질과 함께-발현될 수 있다. 이 저장 단백질은 ZERA® 또는 어떤 다른 적합한 단백질에 융합된 단백질을 예로 들 수 있다. 첨부된 도 3 의, (D)줄은 ZERA®-재조합 단백질 융합체의 골지로의 타겟팅을 도식적으로 나타낸다. 예를 들어, 단백질체는 호스트 세포에서의 ZERA®-재조합 단백질 발현에 의해 ER 막으로부터 개시될 수 있다(첨부된 도 5A를 보라). ER에 축적된 재조합 글리코단백질(아래 실시예를 보라)은 독점적으로 높은 만노즈(mannose) 유형 N-글리칸을 가진다. 본 발명은 ER 동종성 및 글리칸 변형의 조합을 유리하게 가능하도록 하는 펩타이드 신호를 제공하는데, 예를 들어 약제학적 글리코단백질의 경우, ER 체류 신호와 융합된 후 ER 내에 저장된다.

본 발명의 방법에 사용되는 벡터를 얻기 위해 이용 가능한 방법은 상기 개시되어 있다.

특히 식물 세포에서, 세포를 트랜스펙팅하거나 형질전환하기 위해 이용 가능한 방법은, 상기 개시되어 있다.

본 발명에 따라, 상기 세포는 바람직하게 식물 세포이고, 예를 들어 상기 정의한 바와 같은, 예를 들어 식물 세포는 메디카고 사티바(Medicago sativa), 아라비도스프시스 탈리아나(Arabidospsis thaliana), 니코티아나 타바쿰(Nicotiana tabacum), 글라이신 맥스(Glycine max), 리코펄시콘 에스컬렌툼(Lycopersicon esculentum), 솔라넘 투버로숨(Solanum tuberosum) 오리자 사티바(Oriza sativa), 지 매이스(Zwa mays), 피스코미트렐라 패텐스(Physcomitrella patens), 렘나 마이너(Lemna minor), 오스트레오코쿠스 타우리(Ostreococcus tauri), 패로닥티룸(Phaelodactylum)을 포함하는 그룹으로부터 선택된 식물로부터 유래된 세포이다.

트랜스펙팅된 세포 또는 그로부터 얻은 식물을 키우고, 번역 후 변형된 폴리펩타이드를 수확하기 위해 이용 가능한 방법은 당업계의 통상의 기술자에게 알려져 있다. 예를 들어, lienard et al., 2006(참조 32)에 개시된 방법은 유리하게 사용될 수 있다.

다른 이점은 첨부된 도면에 의해 설명된 하기 제한되지 않는 실시예로부터 당업계의 통상의 기술자에게 명백할 수 있다.

도 1은 식물 세포의 분비 통로의 도식적인 표현이다. ER과 골지 연속체의 도메인은 다음과 같이 표시된다.

ER

ER/시스 골지

중앙 골지

후반 골지

도 2는 식물과 포유동물의 소포체와 골지체 내에서, 단백질 위의 N-링크된 글리칸의 전이 및 처리를 나타낸다. 지질 운반체(carrier) 위에 모인 전구체 올리고당은 초기 폴리펩타이드의 특정 Asn 잔기 위에 전이된다. N-글리칸은 이후 글루코실과 대부분의 만노실(mannosyl) 잔기의 제거로 정리된다. 식물과 포유동물의 복합적인 N-글리칸의 처리 중 차이점은 후반 골지 성숙 과정이다. ER과 골지 도메인은 도 1에 기재된 것처럼 주요 화살표 상으로 나타난다.

도 3은 재조합 단백질(A줄), 항체 또는 그의 부분(ScFv)(B줄), 효소(C줄) 또 는 ZERA®-융합(D줄)의 타겟팅에서 다른 신호(어두운 부분)의 잠재적 응용을 보여준다.

도 4는 분석된 융합 단백질의 도식적인 표현이다.

- GCSI-GFP: GFP에 융합된 아라비도프시스 탈리아나 GCSI의 전체 길이,

- GCS90-GFP: GFP에 융합된 GCSI의 처음 90 N-말단 aa,

- △13GCS90-GFP: GCS90-GFP에서 처음 13 N-말단 aa를 뺀 것,

- ManI-GFP: GFP에 융합된 글라이신 맥스 ManI의 전체 길이,

- △19CTMan-GFP: ManI-GFP에서 처음 19 N-말단 aa를 뺀 것,

- Man99-GFP와 Man49-GFP: 각각 GFP에 융합된 ManI의 처음 99와 49 aa,

- △19CTMan49-GFP: Man49-GFP에서 처음 19 N-말단 aa를 뺀 것,

- △CTMan49-GFP: Man49-GFP에서 전체 CT를 제거한 것,

- MAAAMan49-GFP: Man49-GFP의 CT가 3 Ala 잔기를 포함하는 인공 CT로 대체된 것,

- ManTMD23-GFP와 Man99TMD23-GFP: 각각 ManI-GFP와 Man99-GFP로, TMD가 16에서 23 aa로 연장된 것,

- GNTI-GFP: GFP에 융합된 니코티아나 타바쿰 GNTI의 전체 길이,

- GNT38-GFP: GFP에 융합된 GNTI의 처음 38 N-말단 aa,

- XylT-GFP: GFP에 융합된 아라비도프시스 탈리아나 XylT의 전체 길이,

- XylT35-GFP: GFP에 융합된 XylT의 처음 35 aa,

- ST52-mRFP: mRFP에 융합된 쥐 α-2,6-시알릴트랜스퍼라 제(sialytransferase)의 처음 52 aa,

- GFP-HDEL: 스폴아민(sporamine) 신호 펩타이드와 C-말단 HDEL ER 체류 서열을 포함하는 GFP 버전.

도 5는 토바코(tobacco) BY-2 세포들의 안정한 발현(3-4일) 후에, N-글리칸 처리 수단의 4개의 다른 구성원(α-글루코시다제 Ⅰ, 만노시다제 Ⅰ, N-아세틸글루코사미닐트랜스퍼라제 Ⅰ, β-1,2-자일로실트랜스퍼라제, 도 4) 및 C-말단 HDEL ER 체류 서열에의 GFP 융합체 시리즈가 골지 및/또는 ER 내에 위치된 것을, 공초점 레이저 스캐닝 현미경(confocal laser scanning microscopy)을 사용하여 보여준다.

(A,B) ManI-GFP,

(C) ManI-GFP(단백질 합성 저해제 사이클로헥시미드로 2시간 처리한 후),

(D,E) GFP-HDEL,

(F) ManI-GFP[BFA(50mg/mL)로 2시간 처리한 후],

(G) GCSI-GFP,

(H) GNTI-GFP

(I) XylT-GFP,

모든 바 = 8μm.

도 6은 토바코(tobacco) BY-2 세포들에서의 안정한 발현(3-4일)이나 잎 침투(leaf infiltration)에 의한 토바코(tobacco) 잎 상피 세포에서의 임시 발현(5일) 후에, N-글리칸 처리 수단의 잘려진 구성원들(Man99, Man49, GNT38, XylT35, 도 4)에 융합된 일련의 GFP 융합체가 골지 및/또는 ER 내로 배치된 것을, 공초점 레이저 스캐닝 현미경을 사용하여 보여준다.

(A,B) BY-2 서스펜션(suspension) 배양된 세포에서의 Man99-GFP의 발현,

(C) BY-2 서스펜션(suspension) 배양된 세포에서의 Man99-GFP의 발현(단백질 합성 저해제 사이클로헥시미드로 2시간 처리 후),

(D) BY-2 서스펜션(suspension) 배양된 세포에서의 Man49-GFP의 발현,

(E-F) 니코티아나 잎 상피 세포에서의 각각 Man99-GFP와 Man49-GFP의 발현,

(G) BY-2 서스펜션(suspension) 배양된 세포에서의 GNT39-GFP(G)의 발현

(H) 니코티아나 잎 상피 세포에서의 GNT38-GFP, 및

(I) 니코티아나 잎 상피 세포에서의 XylT35-GFP의 발현.

모든 바 = 8μm.

도 7은 이러한 GFP 융합체 중 하나 또는 다른 것과 ST52-mRFP의 토바코 BY-2 세포들에서의 안정한 공-발현(3-4일) 후에, ManI, Man99, Man49 또는 GNT38(도 4)에 융합된 일련의 GFP 융합체 및 트랜스 골지 마커 ST52-mRFP가 골지 스택(stack)으로 위치된 것을, 공초점 레이저 스캐닝 현미경을 사용하여 보여준다.

(A-C) BY-2 서스펜션-배양된 토바코 세포에서 ManI-GFP (A)와 ST52-mRFP (B)의 공-발현,

(D-F) BY-2 서스펜션-배양된 토바코 세포에서 Man99-GFP (D)와 ST52-mRFP (E)의 공-발현,

(G-I) BY-2 서스펜션-배양된 토바코 세포에서 Man49-GFP (G)와 ST52-mRFP (H)의 공-발현,

(J-L) BY-2 서스펜션-배양된 토바코 세포에서 GNT38-GFP (J)와 ST52-mRFP(K)의 공-발현, 및

(C, F, I 및 L) GFP 융합체 + ST52-mRFP에 대응하는 병합된 발현.

삽입: 선택된 골지 스택의 확대(X2,2)

스택들은 종종 한 쪽의 GFP 융합체(녹색), 다른 쪽의 ST52-RFP(빨강색) 및 그들 사이의 겹쳐진 부분(노란색)이라는 "3개의 색"(F와 I의 화살표)을 나타낸다.

A-I: 바 = 8μm; J-L: 바 = 16μm.

도 8은 식물 N-글리코실레이션 효소의 시토졸(cytosol) 꼬리와 TMD 길이를 비교하여 나타낸다:

(A) 식물 세포의 소포체(ER)과 골지체에서 N-링크된 글리칸의 처리.

(B) 다른 식물 종으로부터 클론된 N-글리칸 처리 효소의 시토졸 꼬리와 트랜스막(transmembrane) 도메인 길이. 접근 번호는 각 도식적 표현의 오른쪽에 나타난다.

각 막 단백질에 대한, 트랜스막 도메인의 위치와 크기는 TmHMM_v2 소프트웨어(http://www.cbsdtu.dk/services/TMHMM/)로 측정되었다.

몇몇 단백질에 대해, TMD의 위치를 정의할 가능성은 50% 미만이다(//).

굵은 선으로 표시된 박스는 공초점 및/또는 전자 현미경을 사용하여 세포 내 배치가 최근까지 연구되어 온 N-글리칸 처리 효소에 대응한다.

GCSI: 글루코시다제 I, α1,2 ManI: α1,2-만노시다제 I, β1,2 GNTI: , β1,2-N-아세틸글루코사미닐트랜스퍼라제 I, α1,3 ManⅡ: α1,3-만노시다제 Ⅱ, β 1,2 GNTⅡ: β1,2-아세틸글루코사미닐트랜스퍼라제 Ⅱ, β1,2 XylosylT: β1,2-자이로실트랜스퍼라제, α1,3 FucT: α1,3-푸코실트랜스퍼라제, α1,4 FucT: α1,4-푸코트랜스퍼라제, α2,6 sialylT: α2,6-시알릴트랜스퍼라제.

도 9는 토바코(tobacco) BY-2 세포들에서의 안정한 발현(3-4일)이나 잎 침투(leaf infiltration)에 의한 토바코(tobacco) 잎 상피 세포에서의 임시 발현(5일) 후에, ManI의 잘려진 형태(△19Man, △19Man49, 도 3) 및 MAAAMan49에 융합된 일련의 GFP 융합체가 골지 및/또는 ER 내에 위치된 것을, 공초점 레이저 스캐닝 현미경을 사용하여 보여준다.

(A) BY-2 서스펜션 배양된 세포에서의 △19Man-GFP의 발현,

(B,C) BY-2 서스펜션 배양된 세포에서의 △19Man49-GFP의 발현,

(D) 잎 상피 세포에서의 △19Man49-GFP의 발현,

(E) 잎 상피 세포에서의 MAAAMan49-GFP의 발현.

A-C: 바 = 16μm, D,E = 8μm

도 10은 이러한 GFP 융합체 중 하나 또는 다른 것 및 ST52-mRFP의 토바코 BY-2 세포들에서 안정한 공-발현(3-4일) 후에, ManTMD23, Man99TMD23, XylT35(도 3)에 융합된 일련의 GFP 융합체 및 트랜스 골지 마커 ST52-mRFP가 골지 구획으로 위치된 것을, 공초점 레이저 스캐닝 현미경을 사용하여 보여준다.

(A-C) BY-2 서스펜션-배양된 토바코 세포에서 ManTMD23-GFP (A)와 ST52-mRFP (B)의 공-발현,

(D-F), (G-I) BY-2 서스펜션-배양된 토바코 세포에서 Man99TMD23-GFP (D,G) 와 ST52-mRFP (E, H)의 공-발현,

(J-L) BY-2 서스펜션-배양된 토바코 세포에서 XylT35-GFP (J)와 ST52-mRFP (K)의 공-발현,

(C, F, I 및 L) GFP 융합 + ST52-mRFP에 대응하는 병합된 발현.

삽입: 확대(X2,2)

모든 바 = 8μm.

도 11은 서스펜션-배양된 BY2 토바코 세포로부터 폴리클로날 항-GFP 항체를 이용한 면역금-라벨링과 커플된 전자 현미경을 사용하여, Man99 및 Man99TMD23에 융합된 GFP 융합체가 골지체 내로 위치된 것을 보여준다.

(A) 야생형 BY2 토바코 세포,

(B) Man99-GFP를 발현한 BY2 세포,

(C) Man99TMD23-GFP를 발현한 BY2 세포,

(D) 두 도메인으로 나눠진 골지를 가진 후 시스-사이드 및 트랜스-사이드 상 금 입자를 계수하여 다른 세포에서 분석된 15개 각각 개별 스택에서 관찰된 라벨의 퍼센트로서 골지 내에서 융합 단백질 분배의 발현.

SV= 분비 소포

도 12는 잎 침투에 의한 잎 상피 세포에서 임시 발현(5일) 후에, N-글리칸 처리 수단(ManI, XylT), 이들의 잘려진 형태(Man99TMD23, Man99,, 도 4) 종류에 융합된 일련의 GFP 융합체가 골지 및 ER 내로 위치된 것을, 공초점 레이저 스캐닝 현미경을 사용하여 보여준다.

(A) 글라이신 맥스 잎 상피 세포에서의 Man99-GFP의 발현,

(B) 글라이신 맥스 잎 상피 세포에서의 Man99TMD23-GFP의 발현,

(C) 리코펄시쿰 에스쿨렌툼 잎 상피 세포에서의 Man99-GFP의 발현,

(D) 리코펄시쿰 에스쿨렌툼 잎 상피 세포에서의 Man99TMD23-GFP의 발현,

모든 바 = 16μm.

도 13은 용해성 ER 마커(GFP-HDEL, A-B), 막 ER 마커(Glu90-GFP, C-D), ER과 초반 골지 마커(△19Man49-GFP, E-F), 중앙 골지 마커(XylT35-GFP, G-H), 또는 후반 골지 마커(Man99TMD23-GFP, ST52-mRFP, I-L)를 발현한 BY-2 세포 내에서 ER 및/또는 골지 단백질에 BFA를 2시간 처리한 효과를, 공초점 레이저 스캐닝 현미경을 사용하여 보여준다.

모든 경우에서, ER 네트워크는 종종 작은 구멍이 있는 형광의 시트로 전환된다.

모든 바 = 8μm.

도 14는 ER 및 골지 클러스터 내로 초반 및 후반 골지 마커 양자 모두의 동시 재분배에 대한 BFA(50mg/mL)로 2시간 처리한 것의 효과를, 공초점 레이저 스캐닝 현미경을 사용하여 보여준다:

(A-F) 각각 BFA가 존재하거나 없는 상태에서 BY-2 서스펜션 배양된 토바코 세포에서의 HDEL-GFP (A,B)와 ST52-mRFP (B,E)의 공-발현,

(G,L) 각각 BFA가 존재하거나 없는 상태에서 BY-2 서스펜션 배양된 토바코 세포에서의 △19Man49-GFP (G,J)와 ST52-mRFP (H,K)의 공-발현,

(M-R) 각각 BFA가 존재하거나 없는 상태에서 BY-2 서스펜션 배양된 토바코 세포에서의 Man99TMD23-GFP (M,P)와 ST52-mRFP (N,Q)의 공-발현,

(C,F,I,L,O,R) BFA가 존재하거나 없는 상태에서 GFP 융합 + ST-mRFP에 대응하는 병합 발현.

도 15는 본 연구에서 우리가 사용한 구조물의 도식적인 표현이다: GCSI: GFP에 융합된 전체 길이 아라비도프시스 탈리아나 α-글루코시다제 Ⅰ/ GSC150: GCSI의 처음 150개 아미노산이 GFP에 융합된 것/ GCS90: GCSI의 처음 90개 아미노산이 GFP에 융합된 것/ △13GCS150: GCS 150으로부터 처음 13개 N-말단 아미노산(MTGASRRSARGRI-서열 번호 1)이 제거된 것/ △13GCS90: 처음 13개 N-말단 아미노산이 GCS90으로부터 제거된 것/ Hs10-△13GCS90: 호모 사피엔스(Homo sapiens) GCSI의 처음 10개 N-말단 아미노산(MARGERRRRA- 서열 번호 2)이 △13GCS90의 N-말단에 융합된 것/ XYLT35: 아라비도프시스 탈리아나 β-1,2-자일로실트랜스퍼라제의 처음 35개의 아미노산이 GFP에 융합된 것/ XYLT35-GCS(91-150):GFP에 융합된 GCSI의 루미날(luminal) 도메인의 처음 60개 아미노산(a.a. 91에서 150)에, XYLT의 처음 35개 아미노산이 융합된 것/ XYLT35-GCS(70-150):GFP에 융합된 GCSI의 루미날(luminal) 도메인의 처음 80개 아미노산(a.a. 70에서 150)에, XYLT의 처음 35개 아미노산이 융합된 것/ GCS13-XYLT35: XYLT35에 GCSI의 처음 13개 N-말단 아미노산이 융합된 것/ CNX11-XYLT35: XYLT35의 N-말단에 아라비도프시스 탈리아나 칼넥신(calnexin)(CNX)의 마지막 11개 아미노산(NDRRPQRKRPA-서열 번호 3)이 융합된 것/ ST52-GFP/mRFP: GFP 또는 mRFP에 쥐 α-2,6-시알릴트랜스퍼라제(ST)의 처음 52개 아미노산이 융합된 것/ GFP/mRFP-HDEL: 스폴아민 신호 펩타이드 및 HDEL ER 체류 서열의 제어 하의 GFP 또는 mRFP CT: 시토졸 꼬리; TMD:트랜스막 도메인; CD: 카탈리틱 도메인.

도 16은 GCSI가 ER 내에 완전하게 축적하는 것을 보여준다: 트랜스제닉(transgenic) BY-2 세포 라인은 서브-배양 후 3-4일에 관찰된다. 피질(A,C)과 중앙 옵티칼 단면(B,D)은 GCSI가 ER(A,B)내에 위치한다는 것과 패턴 염색이 GFP-HDEL(C,D)의 그것과 유사하다는 것을 보여준다.

바 = 8μm

도 17은 GCSI 구조물 전체 길이와 같이, N-말단 도메인이 ER에 GSCI를 위치시키기에 충분하다는 것을 보여준다(GCS 150과 GCS 90이 BY-2 세포의 ER에 축적된다)(각각 A, B와 D, E). 그들의 타겟팅은 니코티아나 타바쿰 잎 상피 세포에서 동일하다(각각 C와 F). 바 = 8μm

도 18은 13개 아미노산의 N-말단 서열이 ER 위치 정보를 포함한다는 것을 보여준다. 한편 GCS90은 BY-2 세포 내 ER에 축적되는(A,B) 반면, △13GCS90은 골지에 위치한다(C,D). XYLT35는 골지 단백질인(E,F) 반면, GCS13-XYLT35는 ER과 골지에서 발견된다(G,H).

바 = 8μm

도 19는 Arg 풍부한 ER 서열이 △13GCS90, XYLT35, GCS13-XYLT35, Hs10-GCS90 또는 CNX11-XYT35 단독으로(A,D,G,J,M), 또는 mRFP-HDEL과 함께(B,E,H,K,N), 또는 ST52-mRFP와 함께(C,F,I,L,O) 발현하는 니코티아나 타바쿰 잎 상피 세포계 사 이에서 보존된다는 것을 보여준다. BY-2 세포에서처럼(도 4), △13GCS90(A-C)는 골지에서 독점적인 반면 GCS90은 ER에서 있고 △13GCS90은 완벽하게 ST-mRFP와 함께 공-위치된다(C,F). △13GCS90(A-C)를 XYLT35(D-F)와 비교하는 경우 현미경 사진은 동일하다. GCS13-XYLT35(G)는 mRFP-HDEL과 공-발현될 때, ER은 노란색으로 나타나며 골지는 녹색으로 남아 있는(H) 반면 ST52-mRFP와 함께인 경우 골지는 노란색이고 ER은 녹색인 것은, GCS13-XYLT35가 ER과 골지에 이원적으로 위치된다는 것을 보여준다. 흥미롭게도, GCS90의 처음 13aa.는 인간 GCSI(J-I)의 처음 10 aa.로 대체될 수 있다: Hs10-GCS90 키메릭(chimeric) 단백질은 오직 ER 내에만 있고(J) mRFP-HDEL와 함께 위치되나(K) ST52-mRFP와는 함께 위치되지 않는다(L). 이는 신호가 계 사이에서 보존되는 것을 나타낸다. 동일한 방법으로, CNX11-XYLT35(M)가 mRFP-HDEL과 공-발현되는 경우, ER은 노란색으로 나타나고 골지는 녹색으로 남아 있는(N) 반면 ST52-mRFP와 함께인 경우 골지는 노란색이고 ER은 녹색인 것은, GCS13-XYLT35 역시 ER과 골지에 이원적으로 위치된다는 것을 보여준다.

바 = 8μm

도 20은 GFP 융합체 단독으로(왼쪽 패널), 또는 mRFP-HDEL과 함께(중간 패널) 또는 ST52-mRFP와 함께(오른쪽 패널) 발현되는 니코티아나 타바쿰 잎 상피 세포에서의 N-말단 알기닌이 ER 위치 정보를 포함한다는 것을 보여준다. GCS90(A)는 완벽하게 mRFP-HDEL과 공-위치되나(B, 노란색의 ER) ST52-mRFP와는 공-위치되지 않는다(C, 녹색의 ER, 빨간색의 골지). 6,7,10 및 12 위치의 4개 Arg가 Ala(D-F) 또는 Leu(G-I)으로 치환되는 경우, 전자 현미경 사진 F와 I에서 관찰되는 노란 점으 로 설명되는 것처럼 R/LGCS90 또는 R/AGCS90은 독점적으로 골지에 축적된다. Arg가 쌍으로 돌연변이되는 경우, R/L6-7GCS90(J-L) 또는 R/L10-12GCS90(M-O) 또는 R/L6-L12(P-R)은 ER에 위치되고 ER 용해성 단백질 mRFP-HDEL을 포함하지 않는 작은-점으로 위치되며(K,N,Q) 골지 스택과 근접하게 결합하나(L,O,R) 독립적으로 남아 있다. 이러한 데이터는 N-말단에서의 RR, RXR 또는 RXXR 모티프는 GCS90이 ER로 타겟팅되게 한다는 것을 보여준다.

바 = 8μm

도 21은 R/L6-7이 골지와 근접하게 결합한다는 것을 보여준다. R/L6-7GCS90은 mRFP-HDEL 및 ST52-mRFP와 공-발현되고, 형광 구조가 노란색으로 나타난다는 것은 그들이 골지와 매우 가까이 결합한다는 것을 보여준다.

바 = 8μm

도 22는 Sar1p-mRFP와 GFP-융합체(패널 B,E 및 K) 또는 Sar1p-GTP-mRFP(패널 H와 N)을 발현하는 니코티아나 타바쿰 잎 상피 세포를 보여준다. Arg가 쌍으로 변이되는 경우, R/L6-7GCS90(A-C) 또는 GCS90(D-I)는 변이되거나 변이되지 않은 Sar1p와 공-발현되고, 라벨링 변형은 GFP-융합체에서 관찰되지 않는다. 반대로, Sar1p와의 공-발현이 R/LGCS90의 패턴을 변형하지 않는 반면, Sar1p-GTP(M-O)와 R/LGCS90의 공-발현은 ER에 R/LGCS90의 이동을 막는다.

바 = 8μm

도 23은 N-말단 알기닌 모티프가 AtGCSI의 ER 체류의 주요 결정요소가 아니라는 것을 보여준다. ER은 임시 GCS150-GFP(A), GCS90-GFP(B), 및 △13GCS150- GFP(C) 형질전환된 니코티아나 타바쿰 잎 상피 세포, 피질 단면에서 시각화된다. △13GCS150-GFP의 ER 위치는 피층 단면에서 mRFP-HDEL(E)와 ST52-mRFP(G)의 공-발현으로 확인된다. 본 유형 Ⅱ 막 단백질의 처음 13 aa는 디-알기닌 모티프임에도 불구하고 GCS150-GFP ER 타겟팅과 연관되지 않은 것처럼 보인다. (D) (F) (H)골지는 피층 단면에서 임시 △13GCS90-GFP 형질전환된 니코티아나 타바쿰 잎 상피 세포(D)에서, mRFP-HDEL를 공발현하는(F) 또는 ST52-mRFP를 공발현하는 것에서(H) 시각화된다. ER로 타겟팅 함에 있어 GCS150-GFP와 반대로 GCS90-GFP의 경우 처음 13 aa가 필수적이다. 루미날 도메인 옆의 아미노산은 ER 타겟팅 정보를 포함할 수 있다. 바:8μm

도 24는 루미날 타겟팅을 결정인자는 ER 내에 XYLT35를 보유하는 것에 충분하다는 것을 보여준다.

(A) 골지는 임시 XYLT35-GFP 형질전환된 니코티아나 타바쿰 잎 상피 세포, 피층 단면에서 시각화된다.

(B) (C) ER과 골지는 임시적으로 ST520mRFP과 XYLT35-GCS60(B) XYLT35-GCS80(C)을 공-발현하는 니코티아나 타바쿰 잎 상피 세포, 피층 단면에서 시각화된다. AtGCSI의 루미날 도메인은 ER에서 XYLT35의 대다수를 재위치하게 한다.

바=8μm

도 25는 BY-2 세포 내 GFP 융합체의 공초점 현미경을 사용한 위치 분석을 보여준다; 피층의 (A) 또는 횡단면의 (B) 보기. 우리 그룹에서 최근 확인된 신호는 GFP에 융합되었고 재조합 단백질의 위치는 BY-2 토바코 세포 내 안정한 발현 후에 분석되었다. GFP와 신호 1, 2, 3 또는 4 간의 융합체는 GFP-HDEL 융합체와 같이 ER을 가장 밝게 했다(패널 A-F). GFP와 신호 5, 6, 7, 8, 또는 9 사이의 융합체는 ManI-GFP 대조군처럼, ER뿐만 아니라 골지 클러스터로 융화한 집합체를 밝게 했다(패널 G-L). GFP와 신호 11-12 사이의 융합체는, XylT35-GFP와 D13Glu90-GFP 대조군처럼, 오직 골지 클러스터로 융합하는 집합체만 밝게 했다(패널 M-O). 마지막으로, GFP와 신호 사이의 융합체는 골지 클러스터로 융합하는 집합체뿐만 아니라 리소조말 구획도 밝게 했다(패널 R).

도 26은 디-알기닌 모티프를 포함하는 재조합 단백질의 위치를 보여준다. 하나 또는 두 개의 디-알기닌 모티프를 포함하는 재조합 단백질은 mRFP-HDEL ER 마커와 함께 공-위치되는(A-C; G-R) 반면 알기닌의 변이는 재조합 단백질이 ST52-mRFP 골지 마커와 함께 공-위치되는 원인이 된다.

도 27은 유형 Ⅰ 또는 유형 Ⅱ 막 단백질 상 타겟팅 신호의 위치를 보여준다.

도 28은, 막 단백질에 특정하고 본 명세서에서 설명된 타겟팅 서열 중 하나와 융합된 항체 또는 항체 절편이 분비 통로의 다른 구획에서 막 단백질을 타겟팅 하는 능력을 가지는 것을 설명한다. 여기에서 골지에 위치된 GFP가 예시로 사용된다. 플라스미드 구조 및 scFv의 타겟팅 발현에 사용되는 몇몇 플라스미드의 예가 패널 A와 B에 나타난다. 여기(패널C)에서 단독으로 발현된 경우 골지로 위치되는 막 단백질(GFP-골지)이, 서열 번호:33과 융합된 GFP-특정 scFv와 동일한 식물 세포에서 공-발현된 경우 ER-골지 구획으로 재위치된다.

도 29는 이종 효소가, 여기에서는 인간 베타 1,4 갈락토실트랜스퍼라제, 본 명세서에 설명된 타겟팅 신호 중 하나와 융합된 후 식물 분비 통로의 다른 구획만으로 타겟될 수 있다는 것을 설명한다. 예를 들어, 패널 B는 식물 세포에서 서열 번호:8, 33, 36, 또는 38과 인간 β1,4 갈락토실트랜스퍼라제의 융합체의 발현에 사용되는 플라스미드를 설명한다.

도 30은 서열 번호: 36과 본 글리코실트랜스퍼라제 카탈리틱 도메인의 융합 후 인간 베타 1,4-갈락토실트랜스퍼라제의 타겟팅 발현은, 동일한 글리코실트랜스퍼라제가 그것 고유의 인간 타겟팅 서열에 의해 식물 분비 통로에서 타겟되는 경우 얻는 글리코실화 패턴(패널 A)과 비교할 때 본 이종 글리코실트랜스퍼라제의 효율을 매우 높인다는 것(패널 B)을 설명한다.

도 31은 ZERA® 펩타이드에 의해 생산된 단백질체에 글리칸 성숙 효소를 축적하기 위해 제조된 플라스미드 중 하나를 나타낸다. 본 명세서에서 상세화된 상기 플라스미드는 식물 세포에서 ZERA®와 융합된 만노시다제의 발현을 이끈다.

실시예 A: ER 및/또는 GA로 위치하는 단백질(첨부 도면 3A)

실시예 1: 타겟팅 신호의 동정

1. 초반 골지 유형 Ⅱ 막 단백질의 배치

초반 골지 구획에 N-글리칸 처리 효소의 선택적인 체류를 가능하게 하는 메카니즘을 더 잘 이해하기 위해, 4개의 다른 종류의 N-글리칸 처리 수단(a-글루코시 다제 Ⅰ, 만노시다제 Ⅰ, N-아세틸글루코사미닐트랜스퍼라제 Ⅰ 및 b-1,2-자일로실트랜스퍼라제, 첨부 도면 4)에 융합된 일련의 GFP 융합체의 위치가 토바코 BY-2 세포에서 안정한 발현 후에 연구되었다.

GFP 융합 단백질의 발현을 위한 구조물은 Saint-Jore-Dupas et al, 2006(참조 58)에 개시된 것과 같이 제조되었다. 모든 만노시다제 Ⅰ 융합 구조물은, 본래 Nebenfuhr et al.(1999)(참조 43)에 설명된 GFP 융합 전체 길이(여기서는 ManI-GFP)로부터 유래되었다.

먼저, Aatll 제한 사이트를 포함하는 링커가 ManI와 GFP 코딩 지역 사이에 도입되었다. 예상된 줄기(stem) 지역의 끝과 가까운 본래의 Aatll 지역과 조합되어 이는 Man99-GFP를 얻기 위하여 카탈리틱 도메인의 간단한 제거를 가능하게 하였다.

두 번째로, N-말단 지역의 특정 단편을 용이하게 제거하기 위해, 3개의 새로운 제한 사이트가 PCR 돌연변이 생성에 의해 도입되었다: 하나의 Nhrl 사이트가 시작 코돈 뒤에 바로, 다른 하나의 Spel 사이트가 코돈 21과 22에, 그리고 다른 하나의 Aatll 사이트가 코돈 50과 51에 도입되었다. 변형된 구조물의 완전함은 서열분석에 의해 확인되었다. 본 새로운 구조물에서, 세포질 꼬리는 △19CTManIGFP를 주면서 Nhrl과 Spel로 제거될 수 있고, 동시에 Aatll 자르기는 Man49-GFP를 생산하면서 ManI의 전체 루메날 부분을 제거할 것이다. 두 과정의 조합은 △19CTMan9-GFP를 낳는다. 마지막으로, 시작 코돈과 함께 TMD 도메인의 18 aa를 인코딩하는 포워드 (5'-GATCCTTGGGAATGCTTGCTCTGCTCTTCATCGTTTTCGTTTGTGTCTCTTTCGTTTTCTGGGACCGTCAAA-3'(서열 번호 40)) 및 리버스 (5'-CTAGTTTGACGGTCCCAGAAAACGAAAGAGACACAAACGAAAACGATGAAGAGCAGAGCAAGCATTCCCAAG-3'(서열 번호 41)) 올리고뉴클레타이드가 합성되고, 융합되고, 어떠한 시작 코돈도 없이 GFP를 포함하는 pBLTI121 바이너리 벡터(binary vector) 내로 서브클론 되어(Kiefer-Meyer et al., 간행되지 않은 데이터) DCTMan49-GFP를 만든다. 동일한 전략이 포워드 (5'-GATCCTTGGGAATGGCTGCTGCTCTTGCTCTGCTCTTCATCGTTTTCGTTTGTGTCTCTTTCGTTTTCTGGGACCGTCAAA-3'(서열 번호 42))와 리버스 (5'-CTAGTTTGACGGTCCCAGAAAACGAAAGAGACACAAACGAAAACGATGAAGAGCAGAGCAAGAGCAGCAGCCATTCCCAAG-3' 서열 번호 43) 프라이머를 사용하여 MAAMan49-GFP를 생산하기 위해 사용되었다.

세 번째로, 더 긴 TMD 지역이 상기 설명된 변형 ManI의 두-단계 PCR 돌연변이 생성에서 도입되었다. 제 1 단계에서, 상기 TMD를 뒤따르는 Aatll 사이트가 BspEl 사이트로 대체되었다. 제 2 단계에서 긴 PCR 프라이머가 ManTMD23-GFP를 얻기 위해 예상되는 TMD의 마지막 7개 aa를 복제하는데 사용되었다. 마지막으로, 본 구조물의 카탈리틱 도메인은 Man99TMD23-GFP를 만들기 위해 Aatll로 제거되었다.

상기 설명된 모든 클로닝 단계는 pBluescript에서 수행되었다. 완료된 발현 카세트(이중 35S 프로모터와 Nos 터미네이터를 포함)는 이후 pBIN20으로 이동되었다.

ST-mRFP를 인코딩하는 식물 바이너리 벡터를 얻기 위해, GFP는 pVKH18EnST-GFP에서 단량체 RFP(로저 시엔에 의해 제공됨)로 대체되었다(Saint-Jore et al., 2002(참조 56). ST-mRFP 발현은 6x 직렬-반복된 CaMV 35S 프로모터의 조절 하에 있다.

GNTI-GFP, GNT38-GFP는 템플릿(template)으로서 N-아세틸글루코사미닐트랜스퍼라제를 인코딩하는 니코티아나 타마쿰 cDNA를 사용하는 PCR에 의해 증폭되었다(Strasser et al, 1999(참조 60)). 리버스 프라이머 5'-GGTCACTAGTATCTTCATTTCCGAGTTG-3'(서열 번호 44)와 5'-GGTCACTAGTGCGATCTGCATATTCTGACTG-3'(서열 번호 45)가 포워드 5'-AACGTCTAGAATGAGAGGGTACAAGTTTTGC-3'(서열 번호 46) 프라이머와 함께 PCR을 위해 사용되어 GNTI 및 GNTI의 N-말단 38aa 끝을 증폭하고 각각 GNTI-GFP 및 GNT38-GFP를 얻었다. GCSI-GFP를 발현하기 위해 총 cDNA가 Boisson et al, 2001에서 클론된 아라비도스프시스 탈리아나 cDNA를 사용하는 PCR에 의해 증폭되었고, GFP N-말단 끝에서 융합되었으며 pBLAI121에서 서브-클론되었다(Pagny et al., 2003(참조 50)). 이후, GCS90-GFP를 만들기 위해 처음 90aa가 포워드 (5'-CGGGGTACCCCATGACCGGAGCTAGCCGT-3'(서열 번호 48))과 리버스 (5'-GACTAGAAAAGGAGTGATAACCCT-3'(서열 번호 49)) 프라이머와 함께 PCR에 의해 증폭되었고, pBLTI121 바이너리 벡터에 포함된 GFP의 5' 끝에 위치한 Spe I 제한 사이트에서 서브클론 되었다. 동일한 방법으로, D13GCS90-GFP를 만들기 위해 처음 13 aa가 제거된 90 aa가 포워드 (5'-CGGGGTACCCCATGAAATCATCATCATTATCTCCC-3'(서열 번호 49)) 및 상기와 동일한 리버스 프라이머와 함께 PCR에 의해 증폭되었다.

ManI-GFP 융합 구조물 전체 길이의 형광성은 다른 독립적 셀 라인에서 본 구 조물에 대해 앞서 설명한 바와 같이 세포질을 통해 이동한 작은 바디로 공초점 레이저 스캐닝 현미경에 의해 탐지되었다(첨부 도면 5A와 5B)(Nebenfuhr et al., 1999(참조 43)).

더욱이, 실질적인 형광성 신호는 GFP-HDEL 구조물에 의해 염색된 ER 네트워크와 구별할 수 없는, 세포질 전체적인 망상 네트워크에서 관찰되었다(첨부 도면 5D와 5E). ER 라벨링이 재조합 단백질의 과도 발현에 기인하는지 여부를 점검하기 위해, ManI-GFP를 발현하는 BY-2 세포가 단백질 합성 저해제 사이클로헥시미드와 배양되었다. 2시간 동안의 처리 후에, 타겟팅 패턴이 변하지 않은 채로 남아 있었고, 이는 ManI-GFP의 안정된 상태 위치가 골지와 ER이라는 것을 보여준다(첨부 도면 5C와 5B의 비교).

형광성 점이 골지 스택이라는 것을 확인하기 위해, 세포는 브레펠딘 A(brefeldin A)(BFA) 50mg/mL로 2시간 동안 처리되었다. 토바코 잎 상피와 BY-2 서스펜션 배양된 세포에서 발현되고 골지-위치된 GFP 융합 단백질 중 몇몇에 대해 앞서 설명한 것과 같이, 본 BFA 처리는 녹색 점을 사라지게 하고 피층과 도관 경유(transvascular) ER을 더욱 형광성이 되도록 한다(첨부 도면 5F와 첨부 도면 5B 및 5E를 비교)(Saint-Jore et al., 2002(참조 56); Ritzenthaler et al., 2002(참조 54)).

분비 통로에서 ManI의 위치와 다른 식물 N-글루코실화 효소 중 하나의 비교는 ManI 전, ManI 바로 뒤 또는 훨씬 후에 작용하는 N-글리칸 성숙 효소의 서브-세포 위치의 동일한 조건 아래 분석되었다. 연구된 첫 번째 효소는 아라비도프시스의 α-글루코시다제 I(GSCI)이었다. 본 유형 Ⅱ 막 단백질은 초기 글리코단백질에의 부착 후에 즉시 ER에서 올리고당 전구체로부터 첫 번째 당 잔기를 자른다(첨부 도면 2B의 식물 N-글리칸 성숙에 대한 도식적인 표현을 보라). 단백질 전체 길이(Boisson et al., 2001(참조 6))가 GFP에 융합되었고, COS 세포에서 인간 GCSI에서 보여지는 것과 일치하며(Hardt et al., 2003(참조 28)), 융합 단백질은 BY-2 세포 내 ER에 독점적으로 위치된다(첨부 도면 5G).

두 번째 조사된 후보는 니코티아나 타마쿰의 GNTI였다(Strasser et al., 1999(참조 60)). 본 글리코실트랜스퍼라제는 ManI가 a-1,2-만노즈를 제거한 후 바로 N-글리칸 상 첫 번째 N-아세틸글루코사민 잔기를 부가한다(첨부 도면 2B). 단백질 전체 길이는 GFP에 융합되었고 GNTI-GFP는 토바코 BY-2 서스펜션-배양된 세포에서 발현되었다. 흥미롭게도, 융합체의 안정한 상태 위치는 골지와 ER였고(첨부 도면 5H), 이는 ManI-GFP와 매우 유사한 패턴(첨부 도면 5H와 5B의 비교)이었다. 이러한 데이터는 ManI와 GNTI와 같이 골지체에서 매우 초반에 작용하는 것으로 생각되는 N-글리칸 처리 효소가 골지로 타겟팅 되지만, 타바코 BY-2 서스펜션 배양된 세포에서는 ER로도 타겟팅된다는 것을 강하게 암시한다.

마지막으로, 세 번째 후보인 아라비도프시스의 b-1,2-자일로실트랜스퍼라제(XylT)는, 오직 골지에만 위치되고(첨부 도면 5), 본 효소의 N-말단 끝이 골지 스택의 시스터나 중간 작은 부분으로 GFP를 타겟팅하는 것을 설명한 Pagny et al.(2003)(참조 50)의 결과를 확인한다.

단백질 발현 레벨이 우리 융합 단백질의 위치를 변화시킬 수 있는지 여부를 확인하기 위해, 이러한 결과를 융합 단백질을 발현하는 다른 안정하게 독립적인 세포 라인에서 확인하였다. 세포의 이미지화는 항상 우리의 배양 조건 아래 최적의 성장 단계에 상응하는 서브-배양 후 3일째 또는 4일째 날에 수행되었다. ER 라벨링이 융합체의 과도-발현에 기인하지 않는다는 것을 더 확인하기 위하여, 각 융합체에서의 라벨링 패턴은 사이클로헥시미드로 2시간 처리한 후에 변하지 않았다는 것을 증명함으로써 조절되었다.

항-GFP 항체와 ECL 염색으로 나타나는 웨스턴 블랏은 재조합 단백질에 대하여 배경 대비 매우 낮은 신호를 보여주고, 이는 본 연구에서 모든 융합 단백질의 낮은 발현 레벨을 가리킨다(데이터 없음). 기능성 불 포화된 분비 통로와 양립 가능한 융합 단백질 발현 레벨에 대한 추가 증거는 동일한 세포에서 ManI-GFP가 ER과 골지에 모두 위치하는 동안 골지 마커(ST52-mRFP)는 독점적으로 골지에서만 발견되는(첨부 도면 7A-C) 공-발현 실험으로부터 얻을 수 있었다.

모두 함께, 이렇게 주의 깊게 조절된 조건 하에 얻어진 결과는 N-글리코실화 효소가 특정하게 ER(GCSI)로 또는 골지로(XYLT) 독점적으로 타겟팅되는 것을 명백하게 보여주나, 몇몇 효소는 ManI와 GNTI 및 프롤일 4-하이드록실라제(Yuasa et al., 2005(참조 65))와 ERD2(Boevink et al., 1998(참조 5); Saint-Jore et al., 2002(참조 56))와 같은 다른 막 단백질의 경우에서처럼 양 기관 모두에서 이중 안정한 상태 위치를 가진다.

다음 단계에서, 이중의 안정한 상태의 골지/ER 분배를 나타내는 글리코실화 효소 집단의 타겟팅의 원인이 되는 신호를 조사하였다.

2. 루미날 도메인이 ManI와 GNTI의 골지 및 ER 타겟팅에 필수적이지 않다는 것을 나타내는 실험

3가지 식물 글리코실화 효소인 GNTI, XylT 및 아라비도프시스 ManI(첨부 도면 2)의 특정 골지 체류와 관련해서 그들의 특정 타겟팅은 세포질 꼬리, TMD 및 GNTI를 위한 줄기(Essl et al., 1999(참조 16), Dirnberger et al., 2002(참조 15); Pagny et al., 2003(참조 50); Strasser et al., 2006(참조 61))를 포함하는 그들의 N-말단 부분에 포함된 신호에 의해 매개 된다는 것을 가리킨다. 본 실험은 ManI 및 GNTI의 타겟팅에서 루미날 도메인의 역할을 조사한다.

골지 루멘에 위치한 ManI의 부분이 골지 및 ER 막으로의 본 글리코시다제의 타겟팅에 역할을 하는지 여부를 결정하기 위해, ManI의 처음 99 aa(CT+TMD+S) 또는 처음 49 aa(CT+TMD)가 GFP에 융합되었고 해당 키메릭 단백질이 각각 Man99-GFP와 Man49-GFP로 이름붙여졌다(첨부 도면 4). Man99-GFP와 Man49-GFP는 BY-2 서스펜션 배양된 세포에서 안정적으로 발현 또는 잎 침투에 의하여 토바코 잎 상피 세포에서 임시적으로 발현되었다. Man99-GFP와 Man49-GFP 키메릭 단백질 양자 모두는 전체 길이 구조물에 대하여 앞서 관찰된 것과 마찬가지로(첨부 도면 5A와 5B) 모든 발현 시스템에서 골지와 ER에서 관찰된다(각각 첨부 도면 6A, 6B, 6E 및 6D, 6F).

이러한 잘려진 융합체가 토바코 잎에서 임시적으로 발현되는 경우, ER 라벨링은 과도한 발현 레벨이 이미 급격히 감소하는(첨부 도면 6F) 형질전환 5일 후에도 여전히 관찰되었고, 반면에 XylT35는 오직 골지에만 위치되었다는 것에 주목하 는 것이 중요하다(Pagny et al., 2003(참조 50); 첨부 도면 6I). 이는 나아가 ER 내 ManI-융합체가 부분적으로 위치됨이 키메릭 단백질의 과도-발현에 기인하지 않는다는 것을 확인한다. 더욱이, Man99-GFP를 발현하는 BY-2 세포를 단백질 합성 저해제 사이클로헥시미드로 2시간 동안 처리한 경우, ER 라벨링은 전체 길이 융합체에서 관찰되었던 것처럼(첨부 도면 5C와 비교) 사라지지 않았다(첨부 도면 6C).

융합 단백질이 골지 스택 내 위치되는 곳을 더 잘 이해하기 위해, ManI-GFP는, GFP를 단량체 빨강 형광 단백질(mRFP, Cambell et al., 2002(참조 11))로 대체함에 의해 ST52-GFP로부터 유래된 트랜스 골지 마커 ST52-mRFP(Saint-Jore et al., 2002(참조 56); Runions et al., 2006(참조 55)와 공-발현되었다. 두 개의 키메릭 단백질이 BY-2 세포에서 동시적으로 발현되는 경우, ManI-GFP와 반대로, ST52-mRFP는 ER에서 탐지되지 않았고 2개의 형광 신호는 골지체에서 발견되었지만 완벽하게 공-위치하지는 않았다(첨부 도면 7A-C). 이러한 결과는 다음을 설명하는 선행 연구와 일치한다.

1) ManI-GFP 융합체가 BY-2 세포 내 골지의 시스-하프에 위치된다(Nebenfuhr et al., 1999(참조 43)) 및

2) 쥐의 a-2,6-시알릴트랜스퍼라제의 52 아미노-말단 아미노산은 리포터 단백질이 골지 스택의 트랜스-하프로 탁월하게 타겟팅하기에 충분하다(Boevink et al., 1998(참조 5)).

그러므로, 공초점 현미경은 ManI-GFP와 ST52-mRFP가 골지체 내 시스터나의 다른 작은 부분에 축적된다는 것을 설명하기에 충분했다. 마지막으로, Man99-GFP 또는 Man49-GFP가 트랜스-골지 마커인 ST52-mRFP와 공-발현될 때, 두 개의 플루오포어(fluophore)가 단지 부분적으로 겹쳐진다는 것은(각각, 첨부 도면 7D-F 및 7G-I) 잘려진 융합 단백질의 인트라-골지 위치가 ManI-GFP 전체 길이 융합체의 그것과 동일하다는 것을 나타낸다.

CT, TMD 및 줄기를 포함하는, 토바코 GNTI의 처음 77 N-말단 aa는, 본 글리코실트랜스퍼라제의 골지 체류를 유지하기 위해 요구되는 정보를 포함하는 것으로 앞서 설명되었다(Essel et al., 1999(참조 16)). GFP에 융합된 본 폴리펩타이드 도메인은 바람직하게 골지에 위치되나, 키메릭 단백질은 본 명세서에서 전체길이 구조물에 대해 관찰된 것과 같이 ER 내에서도 역시 탐지된다는 것이 보여졌다(첨부 도면 5H). 골지 루멘에 남은 서열이 GNTI의 골지 및 ER 타겟팅에 관련 있는지 여부를 결정하기 위해, 루메날 부분(39 aa)가 제거되었고 본 글리코실트랜스퍼라제의 남은 처음 38N-말단 aa(CT=TMD)은 GFP에 융합되었다(첨부 도면 4). 상기 융합 단백질은 GNT38-GFP로 명명되었고 BY-2 서스펜션 배양된 세포에서 안정하게 발현되거나 토바코 잎 상피 세포에서 임시적으로 발현되었다.

양 발현 시스템에서, GNT38-GFP는 전체 길이 구조물에서 앞서 관찰된 것(GNTI-GFP, 첨부 도면 5H)과 마찬가지로 골지와 ER 내에 위치되었다(첨부 도면 6G와 6H). 더욱이, GNT38-GFP가 ST52-mRFP와 BY-2 세포 내에서 안정하게 공-발현될 때, Man99-GFP와 Man49-GFP에서 이전에 관찰된 것과 마찬가지로, 두 개의 형광 점이 겹쳐졌지만, 몇몇 빨간 형광은 노란색으로부터 구별가능하였고, 이는 ManI에서 앞서 관찰된 것과 마찬가지로 GNT38-GFP가 트랜스-골지 내에 있지 않다는 것을 의 미한다(첨부 도면 7 J-L).

이러한 결과로부터 세포질 꼬리 및 ManI와 GNTI 양자의 TMD가 ER 및 초반 골지 구획 내인 안정한 상태의 위치로 글리코실화 효소를 타겟팅하기에 충분하다는 것이 명백하다. 반대로, 동일한 도메인(CT+TMD)는 BY-2 세포(pagny et al., 2003(참조 50)와 니코티아나 잎 상피 세포(첨부 도면 6I) 양자 모두에서 골지로만 XylT35-GFP를 타겟팅한다.

3. 세포질 꼬리가 분비 통로의 초반 구획 내 ManI의 체류에 필수적이지 않다는 것을 보여 주는 실험.

포유동물 및 이스트 ER 및/또는 골지체 내에 존재하는 많은 막 결합 단백질의 N-말단 세포질 지역은 골지 뒤로부터 ER로의 그들의 복귀(Teasdale과 Jackson, 1996(참조 62); Zerangue et al., 1999(참조 66)) 또는 ER에서부터 골지로의 그들의 배출(Giraudo와 Maccioni, 2003(참조 20))중 하나를 용이하게 하는 신호를 포함한다. 식물에서, 세포질 꼬리의 길이는 다른 글리코시다제와 글리코실트랜스퍼라제 간에 널리 다양할 수 있다(첨부 도면 8). 예를 들어, GCSI와 ManI는 긴 세포질 꼬리를 포함한다(각각 51/29 aa). 이와 비교할 때, GNTI와 XylT의 CT들은 오직 11 aa로만 구성된다.

ManI의 타겟팅 신호를 더욱 정밀하게 정의하고 본 타겟팅에서 본 글리코시다제의 상대적으로 긴 세포질 도메인(29 aa)의 역할을 조사하기 위해, 두 개의 융합 단백질 D19Man-GFP와 D19Man49-GFP가 생성되었다. 후자의 두 단백질에서, 19 아미 노산은 제거되었기에 CT는 XylT와 GNTI의 CT들과 같이, 10 아미노산으로 짧아졌다. 비록 다른 잠재적인 ER-배출 신호가 남아 있지만, 본 자르기는 ER에서 골지로의 이동에 기능을 할 수 있는 잠재적 2염기성 모티프(KxR)을 제거하였다(Giraudo와 Maccioni, 2003(참조 20)). CT의 완전한 제거가 시도되었지만(DCTMan49-GFP, 첨부 도면 4) 토바코 세포에서 본 융합 단백질의 발현을 얻는 것은 불가능하였다. CT의 남은 10 aa에서 타겟팅 결정요소를 찾기 위해, CT 서열은 인공 서열 MAAA로 대체되었다(MAAAMan49-GFP, 첨부 도면 4). 본 인공 서열은 어떠한 알려진 타겟팅 서열도 포함하지 않고 소수성 트랜스막 도메인의 길이에 영향을 주지 않는다.

3가지 구조물, MAAAMan49-GFP, D19Man-GFP 및 D19Man49-GFP는 토바코 세포에서 발현되었다. 두 개의 후자의 라벨된 ER과 골지는(첨부 도면 9A-D) 그들이 유래된 본래 구조물과 같다(각각 첨부 도면 5A, 5B 및 6D, 6F). 더욱이, 인공 MAAA CT를 포함하는 융합 단백질은 동일한 구획 내에 위치하였고(첨부 도면 9E), 이는 N-말단 시토졸 지역이 ManI 타겟팅에 필수적이지 않고 결과적으로 안정된 상태에서 ER 및 골지체 양자에 위치되기에 요구되는 모든 정보는 MAAAMan49-GFP 구조물의 20 aa 내에, 즉 TMD와 C- 말단 측면에 있는 아미노산 내에 포함된다는 것을 나타낸다.

4. 트랜스 막 도메인(TDM) 길이가 ManI의 골지 타겟팅과 서브-구획화에 중요한 역할을 한다는 것을 보여 주는 실험

포유동물 세포에 있어, 유형 Ⅱ 막 단백질이 골지 내에서 어떻게 다른 레벨로 유지되는지를 설명하기 위해 몇몇 모델이 제안되었다.

제 1 모델에 따라, "킨(kin)-인지" 모델(Nilsson et al., 1993b(참조 45)), 상동/이종-올리고머화에 의한 N-글리칸 성숙 효소의 집합은 생성되는 큰 복합체가 분비 소포로의 전달 및 분비 통로에서 계속되는 아래 방향으로의 정방향 이동되는 것을 막을 것이다.

본 유형의 연합에 대하여 첫 번째로 보고된 사례 중 하나는 중앙-골지에 위치되고 포유동물 N-글리칸 성숙에 연속적으로 작용하는 a-만노시다제 Ⅱ, 및 GNTI, 두 개의 글리코실화 효소와 관련된다(Nilsson et al., 1994(참조 46)). 본 모델이 안정한 골지 시스터나의 존재와 소포성 셔틀을 통한 분비 화물의 진행성 흐름을 원래부터 가정하고 있다는 것에 주목해야 할 것이다(Nilsson et al., 1993(참조 45)). 시스터나 진행/성숙 개념에 맞도록, 상기 "킨-인지" 모델은, 올리고머 복합체가 바람직하게 되돌아가는 소포 내로 포장될 수 있게 하기 위해 변형될 필요가 있을 것이다(Fullekrug와 Nilsson, 1998(참조 18)).

제 2 모델, 지질 이중층 모델(Bretscher와 Munro, 1993(참조 10))은 글리칸 성숙 효소의 TMD 길이와 각 기관 막의 지질 이중층 두께 간을 맞추는 것이 위치를 결정한다고 제안하는데, 각 기관은 그것의 특정한 막 지질 구성을 가지고 결과적으로 그것 고유의 두께를 가지기 때문이다(Hartmann과 Benveniste, 1987(참조 29); Lynch, 1993(참조 33); Moreau et al., 1998(참조 36); Morre와 Mollenhauer, 1974(참조 37)).

막 두께 모델에 따르면, 분비 통로에서 N-글리칸 성숙 효소의 분배는 그들의 TMD들의 길이에 기초한다(Betscher과 Munro, 1993(참조 10)). 분비 통로 기관의 막 은 ER에서부터 원형질 막에 이르기까지 두께에서 증가한다. ER과 시스-골지 막의 두께는 단지 4-5 nm인 반면 트랜스-골지, 분비 소포 및 원형질 막의 두께는 8-9.5 nm이다(Grove et al., 1968(참조 26); Morre와 Mollenhauer, 1974(참조 37)). 게다가, TMD 길이와 관련된 타겟팅은 동물 시스템에서 그들의 TMD의 길이를 다양하게 한 후 리포터 단백질의 위치(Munro 1991, 1995a, 1995b(참조 38))를 연구하고 식물 세포에서는 또한 유형 I 단백질에 대해(Brandizzi et al., 2002a(참조 9)) 연구함에 의해 앞서 설명되었다. 이는, 특정 구획의 막이 오직 매칭되는 길이의 소수성 TMD들만을 수용할 수 있다는 것을 함축한다.

비교는, 골지 단백질 TMD의 길이가 원형질 막 단백질의 그것보다 평균 5 aa 짧다는 것을 나타내었다(Masibay et al., 1993(참조 41); Munro, 1995a(참조 48)). 몇 가지 실시예는 본 모델을 뒷받침한다. 쥐 a-2,6-시알릴트랜스퍼라제와 소 b-1,4-갈락토실트랜스퍼라제의 TMD 길이의 증가는 글리코실트랜스퍼라제의 골지 체류를 감소시켰다. 게다가, 17개의 류신으로 만들어진 합성 유형 I TMD는 림포사이트 표면 항원 CD8 세포외 도메인의 골지 체류를 야기하는 반면 23개의 류신 TMD는 세포 표면에서 증가된 양으로 발견되었다(Masibay et al., 1993(참조 41); Munro, 1991(참조 47), 1995(참조 49)). 더욱이, 1-9 소수성 아미노산의 삽입으로 인한 18개의 아미노산의 a-2,6-시알릴트랜스퍼라제 TMD 길이의 점진적인 증가는 또한 유사 a-2,6-시알릴트랜스퍼라제-리소짐 키메라(chimera)의 증가된 세표 표면 발현 결과를 낳고, 원형질 막 단백질 TMD 길이의 감소는 골지 내 그것의 체류를 증가시킨다(Munro, 1995b(참조 49)).

식물 세포에서, TMD 길이와 관련된 내막 시스템을 따른 막 단백질의 서브구획화를 지지하는 예비 데이터는 GFP와 융합된 두 개의 유형 Ⅰ막 단백질에서 TMD들의 길이를 다양하게 하는 것에 의해 얻어졌다(Brandizzi et al., 2002a(참조 9)).

먼저, 23 aa TMD를 포함하는 인간 리소조말 막 단백질 LAMP1은 GFP에 융합되었고 토바코 잎에서 발현되었다. 상기 융합체는 원형질 막에 위치되었다. 그에 반하여, TMD가 20과 17 aa로 줄어드는 경우, GFP 키메라는 각각 골지와 ER 막에 위치되었다. 둘째로, 액포 분류 수용체 BP80의 19 aa 길이 TMD는 GFP를 골지로 타겟팅하는 반면 22 aa로 길어진 TMD는 GFP를 원형질막으로 타겟팅한다.

유형 Ⅱ 막 단백질 ManI의 TMD 길이는 이것이 어떻게 골지 내 서브 구획화에 영향을 주는지를 알기 위해서 조사되었다. 구체적으로, TMD 길이는 본 도메인의 7개 마지막 aa를 두 배로 하여 16에서 23 aa로 증가 되었다. ER과 골지체의 시스-하프 내에 위치되는 16 aa TMD를 포함하는 그들의 동종체와 달리, 23 aa TMD를 가진 키메릭 단백질은 독점적으로 골지로만 위치되고 더욱 정확하게는 골지 스택의 트랜스-하프 내에 위치된다.

본 실시예에서, ManI 타겟팅에 요구되는 정보는 16 aa TMD를 포함하는 20개의 아미노산(aa) 서열 내에 포함된다. TMD의 길이가 초반 식물 분비 통로에서 본 유형 Ⅱ 막 단백질의 타겟팅에 중요한 역할을 하는지 여부를 조사하기 위해서, 두 개의 융합 단백질, ManTMD23-GFP와 Man99TMD23-GFP가 설계 되었고, ManI의 TMD가 그것의 마지막 7개의 aa을 두 배로 함에 의해 16에서부터 23 aa로 늘어났다(첨부 도면 4). ManTMD23-GFP와 Man99TMD23-GFP는 BY-2 서스펜션 배양된 세포와 토바코 잎 상피 세포에서 발현되었다. 양 식물 발현 시스템에서, ManTMD23-GFP와 Man99TMD23-GFP는 밝은 점으로 독점적으로 위치되었고(첨부 도면 10 A, 10B, 10D), 곰팡이 독 브레펠딘 A에 민감하였다(50μg/mL, 2시간, 첨부 도면 11C). ManTMD23-GFP와 Man99TMD23-GFP의 발현 패턴은 XylT-GFP 융합체(첨부 도면 10), 또는 ST52-mRFP 융합체(첨부 도면 10)에 유사하고, 양자는 BY-2 서스펜션 배양된 세포와 토바코 잎 상피 세포 내 골지에 독점적으로 위치되며, 이는 전자 현미경에 의해 이미 확인된 바 있다(Boevink et al., 1998(참조 7); Pagny et al., 2003(참조 63)).

ManTMD23-GFP와 Man99TMD23-GFP의 서브-구획화를 더 조사하기 위해, 이러한 GFP 융합체 중 하나 또는 다른 것과 ST52-mRFP를 공-발현한 안정한 BY-2 서스펜션 배양된 세포가 만들어졌다. 병합된 이미지에서, 빨간 점으로부터 녹색 점을 분리하는 것은 불가능한데, 이는 23 aa TMD를 포함하는 GFP-융합체가 골지 내에서 트랜스-면을 향해 앞으로 이동하였고 그래서 그들이 공초점 레벨에서 ST52-mRFP와 공-위치한다는 것을 나타낸다(첨부 도면 10 비교). 흥미롭게도, 점 패턴은 횡단면과 비교(첨부 도면 10 G-I)했을 때 피층 이미지(첨부 도면 8D-F)에서 유사하였고, 이는 더 긴 TMD를 가진 Man-GFP 융합체와 트랜스-골지 마커 ST52-mRFP가 완벽하게 공-위치된다는 가정을 강화하였다. 반대로, 중앙 골지 마커(XylT35-GFP)와 트랜스 골지 마커(ST52-mRFP)는 병합 이미지에서 완벽하게 겹쳐지지 않는 형광 점 결과를 낳았다(첨부 도면 10 J-L).

폴리클로날 항-GFP 항체를 가진 면역금-라벨링에 커플된 전자 현미경은 우리에게 이러한 융합 단백질의 더욱 정확한 인트라-골지 위치를 결정할 수 있도록 하 였다. 첨부 도면 11에서 기재한 바와 같이, Man99-GFP 융합체는 골지의 시스-쪽에 주로 축적된(첨부 도면 11B) 반면, Man99TMD23-GFP 융합체는 골지의 트랜스-쪽에 주로 위치되었다(첨부 도면 11C).

유사한 결과가 ManI-GFP와 ManTMD23-GFP(데이터는 나타나지 않음)에서도 얻어졌다. 전(pre)-면역 세럼이나 야생형 토바코 BY-2 서스펜션-배양된 세포를 사용한 대조군 실험에서는 비특정 골지 라벨링이 없거나 매우 거의 나타나지 않았다(첨부 도면 11A).

본 결과는 TMD가 전체 길이 단백질 ManI와 동일한 배치를 가져다 주기에 충분한 것을 나타내고, 상기 데이터는 TMD의 길이가 골지 스택과 ER 내에서 본 유형 Ⅱ 막 단백질의 정확한 위치 선정에 중요한 요소라는 것을 나타낸다. 그러므로, 단백질-지질 상호 작용은 분비 시스템 내에서 ManI의 타겟팅에 주요 역할을 하는 것으로 예상된다.

흥미롭게도, 이러한 결과는 또한 식물 분비 시스템에 있어서, 유형 Ⅰ과 유형 Ⅱ 막 단백질의 타겟팅에서 TMD 길이 필요 정도의 차이를 명확하게 지적한다. 실제로 XylT의 23 aa TMD(Dirnberger et al, 2002(참조 15); Pagny et al., 2003(참조 50) 또는 ManI의 22 aa TMD(Strasser et al., 2006(참조 60))는 오직 골지로만 GFP를 타겟한다. 게다가, 본 실시예에서, 연장된 TMD(23 aa)를 가진 ManI 또한 독점적으로 골지에서 탐지되었다. 반대로 유형 Ⅰ 막 단백질의 23 aa TMD와 BP 80의 연장된 22 aa TMD는 원형질 막 내로 GFP를 타겟 한다(Brandizzi et al., 2002a(참조 8)).

막 단백질이 주어진 두께를 가진 막에 머물기 위한 TMD 길이 필요 정도는 단백질의 토폴로지(topology)에 의존할 수 있다(유형 Ⅰ 또는 유형 Ⅱ).

이러한 실험이 ManI 단백질 타겟팅에서 TMD 길이의 역할을 명백하게 나타내는 반면, 다른 실험은 다른 효소들이 적절한 배치를 위해 다른 신호를 필요로 한다는 것을 보여준다. 예를 들어, 골지의 후반부에서 TMD들의 더 길어지는 경향과 모순되게, 23 aa TMD를 가진 XylT35-GFP 융합체(Pagny et al., 2003(참조 50)) 보다는 18 aa TMD를 가진 ST52-GFP 융합체가 트랜스 골지 내 더 아래쪽 부분에서 발견되었다(Boevink et al., 1998(참조 5); Wee et al., 1999(참조 63)).

임시 발현을 위해 사용된 다른 식물 시스템에서 유사한 결과가 얻어졌다. 실제로, Man99-GFP는 콩(첨부 도면 12A)이나 토마토(첨부 도면 12C)의 골지와 ER에 위치된 반면, Man99TMD23-GFP는 양 발현 시스템의 골지에서 거의 독점적으로 발견되었다(첨부 도면 12B 및 12D).

그 TMD가 식물 글리코실화 효소에서 지금까지 가장 짧은 것으로 확인된 것 중 하나이고 ER 내 위치를 유도한다고 GSCI로 본 명세서에서 설명된 상황에조차, 상기 실험은 CT에 포함된 부가적인 정보가 적절한 타겟팅에 필요하다는 것을 보여준다. 그러므로, GCSI상 수행된 가상 실험(in silico) 분석 및 돌연변이 생성 연구는 식물 분비 시스템에서 글리코실화 효소의 구획을 위한 유일한 신호로서 TMD 길이와 일치하지 않는다.

즉, TMD 길이가 ER과 시스-골지 내 ManI 타겟팅에 주요한 역할을 하는 한편, GCSI로 얻은 결과는 ER 또는 골지 막에서 몇몇 막 단백질의 특정 위치는 단백질 지 질(TMD 경유) 및 단백질-단백질(특정 분류 모티프) 상호 작용 모두에 역시 의존할 수 있다는 것을 설명한다. 골지 매트릭스 단백질이나 세포질 조절자와 같은 시토졸 파트너의 확인은, 식물 분비 통로를 따른 N-글리칸 성숙 효소의 구획화를 위한 본 제 2 모델과 관련된 메카니즘을 설명하도록 한다.

골지 내 다른 레벨로 위치하는 효소의 큰 집합은, 골지 스택 내의 모든 시스터나가 곰팡이 독 브레펠딘 A(BFA)로 처리되는 것에 대응해서 ER과 융합될 수 있는지 여부에 대한 질문을 테스트하도록 한다. 실제로 16 또는 23 aa TMD 중 하나를 포함하는 Man-GFP 융합체와 ST52-mRFP는 BFA와 함께 한 2시간 넘는 코스의 실험에서 모두 ER이나 골지 클러스터 내로 다시 이동했다. 이러한 결론은 예전에 공개된 결과와 일치한다(첨부 도면 12)(NebenFuhr et al., 2002(참조 43); Ritzenthaler et al., 2002(참조 54))

결론적으로, 이러한 결과는 모두 TMD 길이가 ER 및 시스-골지 구획으로 ManI를 타겟팅하는데 주요한 역할을 한다는 것과 16에서 23 aa로의 TMD 길이의 증가는 본 유형 Ⅱ 막 단백질을 골지의 트랜스-면을 향해 더 아래쪽으로 재배치하게 한다는 점(첨부 도면 11D)을 가리킨다.

5. 브레펠딘 A(BFA)의 존재 하에서 후반 및 초반 골지 단백질이 ER 내에서 재분배된다는 것을 보여주는 실험.

본 연구 동안 생성된 골지 마커 중 큰 패널을 이용하여, 다른 골지 서브 구획에 위치된 골지 단백질이 BFA 처리 후에 다르게 행동할 가능성이 조사되었다.

ER 용해성 또는 막 마커(GFP-HDEL 또는 Glu90-GFP, 첨부 도면 13A-D), ER/초반 골지 마커(D19Man49-GFP, 첨부 도면 13E-F), 중앙 골지 마커(XylT35-GFP, 첨부 도면 13G-H), 또는 후반 골지 마커(Man99TMD23-GFP 또는 ST52-mRFP, 첨부 도면 13I-L)을 발현하는 세포가 2시간 동안 BFA(50mg/mL)로 처리되었다. BFA 처리 마지막에, 모든 융합 단백질이 밝은 집합체 및 ER(첨부 도면 13E-L)에 축적되었고, 예외적으로 ER 마커는 집합체에서 발견되지 않았다(첨부 도면 13A-D). 모든 마커는 BFA 존재 하에 ER에 재배치되었다.

ST52-mRFP를 가진 ER/초반 골지 또는 후반 골지 단백질을 공발현하는 세포에서, BFA가 ER 및 골지 집합체 내로 양 마커의 재분배를 유도하고(첨부 도면 14), 예외적으로 GFP-HDEL(첨부 도면 14A-F)와 Glu90-GFP(첨부 도면 14D)는 집합체에서 발견되지 않았다. 몇몇 경우, 시간의 미묘한 차이는 있었지만, 사소하지 않아 탐지되었고 인트라-골지 위치와 관련하여 정보성도 없었다. 게다가, 용해성(GFP-HDEL) 또는 막 단백질(Glu90-GFP) 마커 중 어느 하나를 발현한 세포의 BFA 처리 후에 관찰된 형광 패턴에서 어떠한 유의할만한 차이점도 관찰되지 않았다(첨부 도면 14A-D).

6. TMD 길이 모델이 모든 유형 Ⅱ 막 단백질에 적용되지 않는다는 것을 보여주는 실험

TMD 길이만이 식물 분비 시스템에 따른 모든 글리코시다제와 글리코실트랜스퍼라제의 서브구획화를 이끄는 유일한 골지 분류 결정요소가 될 수 있는지 여부를 결정하기 위해, 특성화된 글리코실화 효소의 N-말단 서열이 비교되었다(첨부 도면 14).

본 분석은 단일 식물 시스템에서 TMD 길이 및 막 두께를 관련시키는 더욱 더 적은 숫자의 전자 현미경 데이터뿐만 아니라, 클론되고 단일 종으로부터 기능적으로 특성화된 적은 숫자의 다른 효소들의 서열에 의해 저해되었다. 지금까지 클론된 모든 식물 글리코실화 효소의 N-말단 서열(CT + TMD)의 가상 실험 분석은 골지 스택에서 가장 아래쪽에 위치된 단백질이 더 긴 TMD를 갖는 경향을 명확하게 보여준다(첨부 도면 14). 예를 들어, a-1,3-푸코실트랜스퍼라제 및 a-1,4,-푸코실트랜스퍼라제와 같이 후반 골지에 위치되는 것으로 여겨지는 효소 중 어떤 것도 20 aa보다 짧은 TMD를 갖는 것은 없다는 것을 주목하는 것은 흥미롭다. 이러한 결과는 TMD 길이 예상에 사용되는 MENSAT_V1,8, PHOBIUS 또는 PRED_TMR 프로그램 (http://bioinf.cs.ucl.ac.uk/psipred/psiform.html 및 http://biophysics.biol.uoa.gr/PRED-TMR/input.html)로 확인되었다. 그러나 이 일반적 경향의 예외가 다른 종의 유사한 글리코실화 효소와 비교했을 때 발견될 수 있고, 예를 들어 ManI TMD들은 16 aa(콩) 내지 20 aa(아라비도프시스)의 범위에 있다.

ER 막에서 이의 위치를 설명하기 위한 지질 이중층 모델에 완벽하게 맞을 수 있는 짧은 18 aa TMD에 기초하여, GluI는 본 모델의 일반적 적용 가능성을 검토하기 위해 선택될 수 있다. GluI의 TMD가 ER 내 타겟팅과 체류에 충분한지 여부를 정의하기 위해, 본 글리코시다제의 대부분의 루미날 부분이 삭제되었고(카탈리틱 도 메인 포함) GFP에 그것의 처음 N-말단 90 aa(CT+TMD+S)가 융합되어 융합 단백질 Glu90-GFP를 얻었다(첨부 도면 4). 본 융합이 토바코 세포에서 발현되었을 때, ER은 전체 길이 구조물 Glu-GFP 및 GFP-HDEL 구조물에서 얻어진 것과 매우 유사한 패턴으로 강조된다(첨부 도면 15A 및 15B)(마이크로그래프 14A 및 14B를 4G에 및 4D, 4E 및 12C에 비교).

본 결과는 ER로 GluⅠ 타겟팅 하는 것은 CT, TMD 및/또는 본 잘려진 단백질에 남아 있는 21 루미날 aa 내 위치된 신호에 의존한다는 것을 명백하게 보여준다.

ER 내 GluI의 배치에 요구되는 최소한 단백질 서열을 정의하기 위한 또 다른 시도에서, Glu90-GFP 구조물의 처음 N-말단 13 aa는 D13Glu90-GFP를 얻기 위해 제거되었다(첨부 도면 4). 본 융합이 토바코 서스펜션 배양된 또는 잎 상피 세포에서 발현되었을 때, 키메릭 단백질은 XylT-GFP(첨부 도면 6I 및 9E)와 ST52-GFP(첨부 도면 15F)에서 관찰되는 것과 같이 골지-같은 점에 독점적으로 위치되었다(첨부 도면 15D 및 15E).

결론적으로, GluI의 18 aa 길이 TMD는 ER 막에 글리코시다제를 타겟팅하는데 충분하지 않고 CT의 처음 13 aa에 포함된 부가적인 정보가 분비 시스템에서 본 글리코실화 효소의 정상적인 배치에 필요하다.

본 결과는 TMD 길이 외의 다른 요소가 초반 분비 통로에서 글리코실화 효소의 위치 선정에 영향을 준다는 실험적 증거를 제공한다.

7. 아라비도프시스 탈리아나 GCSI 유형 Ⅱ 막 단백질의 위치

GCSI는 완전히 토바코 소포체 내 축적한다.

아라비도프시스 탈리아나 GCSI는 유형 Ⅱ 막 단백질이고, 51 아미노산 시토졸 꼬리, 약 18 잔기의 트랜스막 도메인 및 루멘을 향해 있는 큰 카탈리틱 도메인으로 구성된다(Boisson et al., 2001(참조 6)). 본 글리코시다제의 위치를 조사하기 위하여 전체 길이 GCSI와 GFP 융합체의 위치가(첨부 도면 15) 토바코 BY-2 세포 내 안정한 발현 후에 연구되었다(첨부 도면 16A 및 16B; 첨부 도면 17A 및 17B). 전체-길이 GCSI-GFP 융합체 구조물의 형광성이 공초점 레이저 스캐닝 현미경에 의해, GFP-HDEL 구조물에 의해 염색된 ER 네트워크로부터 구별될 수 없었던 세포질 전체적인 소포체 네트워크에서 독점적으로 탐지되었다(첨부 도면 16C 및 16D).

본 결과는 초기 글리코단백질에 부착한 후 즉시 ER 내 전구체 올리고당의 처음 당 잔기를 자르는 것과 일치하고, COS 세포들 내 인간 GluI에서 보여지는 것과 일치한다.(Hardt et al., 2003(참조 28)). 더욱이, 용해성(GFP-HDEL) 또는 막 단백질(GCSI-GFP) 마커 중 하나를 발현하는 세포의 형광 패턴에서 관찰되는 것과 유의성 있는 차이가 없다(첨부 도면 16A 내지 D).

8. GCSI의 처음 90개 아미노산은 ER 내 GFP를 보유하기에 충분하다는 것을 보여주는 실험.

ER 내 GCSI의 선택적인 체류를 이끄는 메카니즘을 이해하기 위해서, GCSI 타겟팅에서 루미날 도메인의 역할이 먼저 조사되었다. ER 루멘에 위치된 GCSI 부분이 ER로의 본 글리코시다제의 타겟팅에 역할을 하는지 여부를 결정하기 위해서, GCSI 의 처음 150개 아미노산(aa)(CT+TMD+줄기 81aa) 또는 처음 90 aa(CT+TMD+줄기 21aa)이 GFP에 융합되었고 해당하는 키메릭 단백질이 각각 GCS150과 GCS90으로 명명되었다(첨부 도면 15). GCS 150과 GCS 90은 BY-2 서스펜션 배양된 세포에서 안정하게 발현되거나 토바코 잎 상피 세포에서 아그로-침투(Agro-infiltration)에 의해 임시적으로 발현되었고 양 발현 시스템의 ER에서 양자가 관찰되었으며(각각 첨부 도면 17 A,C,E 및 17 B,D,F), 전체 길이 구조물에서 예전에 관찰된 것과 정확히 같다(첨부 도면 16 A,B). 이러한 잘려진 융합체가 토바코 잎 상피 세포에서 임시적으로 발현되는 경우, ER 라벨링은 전체적인 발현 수준이 이미 급격하기 감소하는 형질전환 후 5일 째에 여전히 관찰되는 반면, 같은 조건에서 분석된 골지 융합체는 골지에서 독점적으로 위치된다(Saint-Jore-Dupas et al., 2006; 데이터는 나타나지 않음)는 것을 아는 것이 중요하다. 본 데이터는 글루코시다제 Ⅰ의 카탈리틱 루미날 도메인이 효소의 ER 배치에 필요하지 않고 GCSI의 처음 90개 아미노산이 ER 내 GFP를 보유하기에 충분하다는 것을 보여준다.

9. 세포질 꼬리가 ER 체류 서열을 포함하는 것을 보여주는 실험

포유 동물 및 이스트 ER에 존재하는 많은 막 단백질의 N-말단 시토졸 지역은 정확한 체류(Nilsson et al., 1994(참조 46); Opat et al., 2000(참조 48); Hardt et al., 2003(참조 28); Ciczora et al., 2005(참조 12), 또는 골지 뒤에서부터 ER까지 그들의 복귀(Teasdale과 Jackson, 1996(참조 62); Zerangue et al., 1999(참조 66))를 용이하게 하는 신호를 포함하는 반면, 몇몇 다른 것들은 ER에서부터 골 지로 배출시키는 것을 촉진한다(Giraudo와 Maccioni, 2003(참조 20)). 식물에서, 오직 일부 연구만이 막 단백질의 CT 내 ER의 배출 서열의 존재를 설명하고(Contreras et al., 2004(참조 13); Yuasa etal., 2005(참조 65); Hanton etal., 2005b(참조 27)) 막 단백질 ER 체류의 원인이 되는 시토졸 모티프의 특성화를 언급한다(Benghezal et al., 2000(참조 4; McCartney et al., 2004(참조 35)).

GCSI N-말단에서 ER 타겟팅 정보를 포함하는 서열을 더욱 정확하게 정의하기 위해서, GCS90의 N-말단 끝에 위치된 처음 13 아미노산을 먼저 제거하였고 상기 결과 생성된 키메릭 단백질을 D13GCS90으로 명명하였다(첨부 도면 15). 본 자르기는, 다른 잠재적 ER-체류 신호(RR 또는 KXK)가 본 융합 단백질의 CT 내에 남아 있음에도 불구하고, ER 체류에 작용할 수 있는 두 개의 잠재적 디-베이직 모티프 RR 또는 RXR을 제거하였다. 병행하여, GCSI의 처음 13 N-말단 아미노산 펩타이드는 이전에 중앙 골지에 위치된 골지 리포터 단백질(XYLT35, 첨부 도면 15)에 융합되었다(Pagny et al., 2003(참조 50)). 상기 실험 조건에서, 본 연구에 사용된, XYLT35는 도 18 G 내지 H에 설명된 것과 같이, BY-2 토바코 세포의 골지체에 독점적으로 축적되는 것이 확인되었다.

두 개의 구조물(D13GCS90과 13GCS-XYLT35) 또한 BY-2 세포에서 안정하게 발현된다. 시토졸 꼬리 중 처음 13개 아미노산의 제거는 골지 마커 XYLT35를 이용하여 관찰된 것(도 18E-F)과 유사하게 GCS90 단백질을 밝은 점 내로 재배치하였다(첨부 도면 18C-D, 도 19A). 게다가, 상기 D13GCS90은 토바코 잎 상피 세포 내 임시적 발현 후에 ER 마커 mRFP-HDEL와 공위치 되지 않았으나(도 19B), ST-mRFP 골지 마커 와 완전하게 공위치되었다(도 19C). 흥미롭게도, XYLT35 골지 마커에의 GCSI의 13 N-말단 아미노산의 융합은 리포터 단백질이 ER 내에 있는 것을 막았다(도 18G-H; 도 19G). GCS13-XYLT35 융합 단백질은 GCS90 구조물과 같이 ER를 라벨하였고(도 18A-D) mRFP-HDEL ER 마커와 공위치되었다(도 19H). 강한 ER 라벨링에 부가하여, GCS13-XYLT35가 토바코 잎 상피 세포에서 발현된 경우 적은 밝은 점이 역시 관찰되었다. 이러한 점은 이동하여 ST-mRFP 골지 마커와 공위치한다(도 19I).

결론적으로, GCSI의 처음 13 아미노산은 ER 내 GCS90 융합 단백질을 보유하게 하는데 필수적이고 ER 내 골지 마커를 재배치하는데 충분하다.

10. 시토졸릭 알기닌-풍부한 서열은 식물에서 ER 체류 신호라는 것을 보여 주는 실험

알기닌 잔기가 AtGCSI의 13 N-말단 아미노산에서 ER 체류에 필수적인지 여부를 더 조사하기 위해, 인간 동족체 AtGCSI의 N-말단 끝에 위치된 알기닌 풍부 도메인이나 유형Ⅰ식물 ER 존재 막 단백질인 아라비도스프시스 탈리아나 칼넥신의 시토졸 C-말단 끝에 위치된 알기닌 풍부 도메인 중 어느 하나의 펩타이드가 변경되었다.

인간 GCSI의 N-말단 끝에 위치된 알기닌-풍부 펩타이드가 식물 세포에서 인지되는 가능성을 조사하기 위해, GCS90의 처음 N-말단 13 아미노산이 인간 GCSI의 처음 N-말단 10개 아미노산에 의해 대체되었다(Hs10-GCS90, 도 15). 토바코 잎 상피 세포에서 임시적으로 발현되는 경우, Hs10-GCS90은 ER에 위치되고 이는 N-말단 시토졸 지역이 완전하게 식물 분비 시스템에 의해 인지된다는 것을 가리킨다(도 17J 내지 L).

두 번째로, 유형 Ⅰ 막 단백질에 의해 수행되는 유사한 알기닌-풍부 모티프가 ER 내 유형 Ⅱ 단백질의 타겟팅을 매개할 수 있는지 여부를 조사하기 위해, 아라비도스프시스 탈리아나 칼넥신의 C-말단 끝에 위치한 마지막 11개 아미노산이 골지 마커 XYLT35의 N-말단 끝에 융합되었다(CNX11-XYLT35, 도 15, 표 1). CNX11-XYLT35는 토바코 잎 상피 세포에서 임시적으로 발현되었다. 도 19M 내지 O에서 설명한 바와 같이, 유형 Ⅰ 막 단백질의 알기닌 풍부한 C-말단 펩타이드는 ER 내 유형 Ⅱ XYLT 35 골지 마커를 보유하기에 충분하다(도 19M 내지 N). 동일한 골지 라벨링(도 19 O)이 GCS13-XYLT35 융합체에서(도 19 I)와 같이 또한 탐지된다.

11. GCSI 시토졸 꼬리의 알기닌 잔기가 ER 위치 정보를 포함한다는 것을 보여주는 실험.

GCSI의 13개 처음 아미노산 내에서 4개의 알기닌 잔기의 역할을 보다 정확하게 정의하기 위해서, 이러한 잔기를 PCR 위치 지정(site-directed)된 돌연변이 생성(상세한 구조는 표 1을 보라)을 사용하여 류신이나 알라닌 잔기 중 하나로 대체하였고 상기 결과 융합 단백질이 토바코 세포에서 발현되었다.

GCS90이 ER에 독점적으로 위치되고 완전하게 ER 마커 mRFP-HDEL과 공-위치되지만(도 20 A,B), 골지 마커 ST-52-mRFP와는 그렇지 않은(도 20 C) 반면, Arg-6, Arg-7, Arg-10 및 Arg-12가 알라닌 잔기로 대체하는 경우, R/LGCS90은 독점적으로 밝은 점을 강조 했다(도 20 D). 이러한 점은 골지 마커 ST-mRFP와 공위치되는 것으로부터 설명된 것처럼 골지체에 대응한다(도 20F). 어떠한 ER 라벨링도 탐지되지 않았다(도 20 E). 서브-세포 위치에 대한 동일한 효과가 4개의 류신 잔기에 의한 4개의 알기닌 잔기의 치환 후에 관찰되었다(도 20 G-I). 이러한 관찰은 N-말단의 6-7-10 및 12 위치에 위치된 4개의 알기닌이 GCS90의 ER 존재의 원인이 되는 구조적 정보를 인코딩할 수 있다는 것을 가리킨다.

두 번째 단계로, (RR)과 (RXR)이 두 개의 독립적인 신호로 작용하는지 여부를 정의하기 위해, Arg-6와 Arg-7 또는 Arg-10과 Arg-12가 류신 잔기로 치환되었다. RR 모티프(구조물 R/L₁₀ _-12GCS90의 Arg-6과 Arg-7) 또는 RXR 모티프(구조물 R/L₆ _-7GCS90의 Arg-10과 Arg-12) 중 어느 하나의 존재뿐만 아니라 RXXR 모티프(구조물 R/L_6-12GCS90의 Arg-7과 Arg-10)의 존재도 융합 단백질의 ER 체류에 충분하였다(도 20J 내지 L 및 M 내지 O). 그러나, ER 라벨링에 덧붙여 이러한 3 가지 경우에서, 골지 스택과 구별되는 형광 점이 관찰되었다(도 20 L 및 20 O).

12. RR, RXR 또는 RXXR 모티프를 가지는 융합 단백질이 ER 및 골지와 관련된 형광 점에 축적된다는 것을 보여 주는 실험

다음 단계는 R/L₆ _-7GCS90, R/L₁₀ _-12GCS90, 및 R/L₆ _-12GCS90 키메릭 융합 단백질에 의하여 형광 점으로 라벨된 구조를 확인하기 위한 것이었다. R/L₆ _-7GCS90 단백질에서 설명한 바와 같이, GFP 형광은 ER 및 골지 스택보다 더 작은 형광성 구조에 축적되었다(도 20 J 내지 L 및 도 21 A 내지 B).세포에서 이러한 구조의 위치를 더 정확하게 정의하기 위해, mRFP-HDEL ER 마커, ST52-mRFP 골지 마커 및 R/L₆ _-7GCS90, R/L_10-12GCS90, 또는 R/L₆ _-12GCS90 융합 단백질 중 하나가 동시에 발현되었다.

상기 결과는 도 21A-B에서 설명되고 작은 형광 점이 골지 스택과 가까이 관련되지만 구별된다는 것을 보여준다. 하나의 골지체와 하나의 점의 연관에 의해 형성된 단위는 ER을 따라 함께 이동하고 그들은 분리되지 않는다.

이러한 결과를 고려할 때, R/L₆ _-7GCS90, R/L₁₀ _-12GCS90, 및 R/L₆ _-12GCS90 융합 단백질은 ER과 골지 사이에 위치한 작은 중간 도메인 내 ER에 축적되었고, 그로부터 ER 존재 용해성 단백질로부터 차단되었다(도 20K 및 20N). 이러한 도메인은 골지와 강하게 연관되어 있고 ER 피층 네트워크를 따라 골지 스택과 함께 이동하며, 그래서 이러한 도메인은 Yang et al., 2005에 설명된 ER-출구-사이트(ERES)가 될 수 있다. 입증하기 위해 본 R/L₆ _-7GCS90, R/L₁₀ _-12GCS90, 및 R/L₆ _-12GCS90 융합 단백질가 토바코 잎 상피 세포에서 Sar1p-mRFP와 공-발현되었다.

불행하게도, 형광 점에서 Sar1p-mRFP의 보충은 보이지 않았다(도 22 A 내지C). 그럼에도 불구하고, Sar1p는 GCS90의 돌연변이된 형태의 이동과 관련되는 것으로 보여진다. 실제로, 도 22 J 내지 L에 설명된 것처럼, R/LGCS90은 Sar1p/GTP-mRFP와 공-발현되었고, Sar1p는 ER 및 형광점에 축적되었다(도 22 K).

반대로, 단독 발현된 Sar1p-mRFP가 ER 내에 있는 것처럼(데이터는 나타나지 않음) GCS90은 Sar1p-mRFP를 보충하지 않았고 Sar1p-RFP와 GCS의 공-발현은 GCS 라벨링을 변형하지 않았다(도 22D 내지 I). 더욱이, 돌연변이된 형태 Sar1p/GTP-mRFP의 발현은 ER 내 골지 R/LGCS90의 체류를 이끌었다.

결론적으로, R/LGCS90의 이동은 시토졸 단백질 Sar1p에 의해 조절된다. 그러나, 비록 그들이 ER과 골지 구획 사이에 위치되지만, 하나의 RR, RXR 또는 RXXR 모티프를 가지는 융합 단백질로 라벨된 작은 도메인은 Sar1p-mRFP와 연관되지 않는다.

13. AtGCSI의 ER 체류는 N-말단 알기닌 모티프에만 의존하지 않는다는 것을 보여 주는 실험

본 실시예에서 골지 리포터 단백질에 융합된 GCSI 알기닌-모티프는 ER로 그것을 위치시킨다. 그러나, 이러한 신호가 전체 길이 GCSI의 ER 위치와 관련 있는 주요 체류 신호라는 증거는 없다.

류신 또는 알라닌에 의해 Arg-6, Arg-7, Arg-10 및 Arg-12의 치환이 GCS90 구조물에 대한 ER-배치 정보의 방해를 야기한다는 관찰에 기초하여, 야생형 효소(D13GCSI, 도 15)의 ER 타겟팅에서 상기 모티프(RXR과 RR)의 중요성을 평가하기 위하여 N-말단 13 aa는 GCSI의 전체-길이 서열로부터 제거되었다. 게다가, GCS150 잘려진 형태가 N-말단 끝에 아미노산 잔기 1-13이 부족하게 합성되었다(D13GCS150. 도 15). 융합 단백질은 이후 잎 상피 세포에서 임시적으로 발현되었다. 골지체에 축적된 D13GCS90과 달리, D13GCSI과 D13GCS150 양자는 ER에 독점적으로 위치되었다(도 23 D-E). 게다가, 키메릭 단백질이 토바코 세포에서 ER-마커(mRFP-HDEL)와 동시에 발현되는 경우, GCS90과 달리, D13GCSI와 D13GCS150 양자는 골지에서 탐지되지 않고 양 형광 신호는 ER에서 관찰되었으며, 완벽하게 m-RFP-HDEL과 공-위치된다(도 23 G-L). 이러한 결과는 인간 GCSI가 전체 길이 효소를 배치하는데 필요하지 않은 기능성 알기닌-기초 신호를 포함한다는 것을 설명하는 Hardt et al.,(2003)(참조 28)의 예전 연구와 일치한다. GCS90(도 23F, 23I 및 23L), GCSI(도 23D, 23G 및 23J) 및 GCS150(도 23E, 23H 및 23K) 사이에서 관찰된 라벨링의 차이는 ER 위치를 결정하는 주요 정보는 GCSI의 루미날 폴리펩타이드 사슬에, 더욱 가능성 있게는 줄기 도메인에, 아미노산 잔기 70-150 사이에 포함될 것이라는 것을 나타냈다.

본 가정을 증명하기 위해, 81개의 아미노산 잔기 70-150 또는 61개의 아미노산 90-150이 중앙 골지 마커 XYLT35의 루미날 도메인에 융합되었고(도 24 A) 토바코 잎 상피 세포에서 이러한 새 단백질(XYLT35-GCS81과 XYLT35-GCS60, 도 24 B,C)을 임시적으로 발현되었다. GFP 라벨링의 대부분은 ER에서 발견되었고, "잔여물"이 골지에 있었다.

포유 동물 세포에서 ER 배치는, 그들의 트랜스막 및/또는 루메날 도메인을 경유하여 큰 올리고머 복합체를 만드는 단백질 서브단위의 연관과 관계된 직접적 체류에 의해 달성될 수 있다는 것이 보여졌고, 이는 골지 위치된 막 단백질에 대한 킨-인지 모델에서 예전에 설명된 바 있다(Nilsson et al., 1994(참조 46); Opat et al., 2000(참조 48)). 이러한 큰 단백질 올리고머는 이동 소포 내로 포장되고 그 결과 상기 기관으로부터 배출되는 것을 막는 것을 벗어난다고 가정되었다. 본 유형의 메카니즘은 헤테로-올리고머 올리고당트랜스퍼라제 복합체의 서브 단위 구성요소의 ER 체류에 기능할 수 있으나 아직 식물에서는 기재되지 않았다.

결론적으로, 시토졸 꼬리와 AtGCSI의 루미날 도메인 양자는 ER 타겟팅 결정 요소를 포함하고 상기 결정요소는 그것의 특이성과 일치하고 다른 진핵 시스템에서 이루어진 관찰과 완전하게 일치하며, 상기 결과들은 AtGCSI가 식물 ER 및 본 구획에 독점적으로 위치된다는 것을 나타낸다. N-아세틸글루코사미닐트랜스퍼라제 Ⅰ(GNTⅠ)과 a1,2 만노시다제(ManⅠ)와 같은 식물 N-글리칸 성숙에 초기 작용하는 다른 글리코실화 효소는 ER 및 시스-골지 모두에 위치되는 것으로 보여졌다. GNTI와 ManI, ER과 시스-골지는 시토졸 꼬리에 존재하는 타겟팅 정보를 포함하는 것으로 보여진 반면, GCSI 시토졸 꼬리의 처음 13 N-말단 아미노산은 ER 타겟팅 정보를 포함하는 것으로 보여진다. 본 실시예는 무엇이 ER 타겟팅과 관련된 시토졸 꼬리의 주요 아미노산인지 보여주고 또한 알기닌-풍부한 시토졸 꼬리가 전체 단백질 서열에서 유일한 ER 타겟팅 결정요소가 아니라는 것도 나타낸다.

실제로, GCS150으로부터 알기닌-풍부한 서열의 제거는 골지와 같이 더 후반 구획으로 ER의 배출을 허용하지 않고 D13GCS90은 여전히 ER에 독점적으로 위치된다.

이러한 결과들은 모두, 적어도 2개의 도메인은 골지 유형 Ⅱ 막 단백질이 ER 체류를 하게 하는데 충분하고 GCSI 서열에 공존하는 것을 가리킨다. GCSI의 루미날 도메인의 제거는 ER 체류를 위한 정보가 GCSI 서열에서 아미노산 90과 150 사이에 위치된 60개 아미노산 펩타이드에 포함된다는 것을 가리킨다.

루미날 ER 타겟팅 신호의 존재와 관련되어 인간 글루코시다제 Ⅰ에서 동등한 결과가 얻어졌으나, 현재까지 관련된 루미날 서열은 아직 특성화되지 않았다(Hardt et al., 2003(참조 28)). 상기 언급한 바와 같이, 골지 리포터 단백질 XYLT35와 연관될 때, 식물 루미날 펩타이드는 ER로 XYLT35를 재배치하는데 충분하다. GCSI의 루미날 도메인은 AtGCSI와 용해성 및/또는 막 결합 ER 존재 단백질 사이에 복합체 형성을 용이하게 할 수 있었다. 그러나, 킨-인지 모델과 모순되게, 몇몇 큰 단백질 복합체는 원형질막에 위치되고 ER 밖으로 이동되기 위해서 완전하게 모여져야만 한다는 것이 보여졌다.

사실, 이러한 복합체의 크기를 고려하는 것은 체류를 설명하는데 필요하지 않은 것처럼 보인다. 실제로, ER 루멘 내 단백질의 매우 높은 농도 때문에, 아마도 단백질-단백질 복합체를 형성하는 능력을 가지는 단백질에 대하여 안에 머무는 것보다 ER를 떠나는 것이 더 어려울 것이다. BiP와 관련된 다른 ER 샤페론(chaperon) 시스템에서 예전에 설명된 바와 같이, 우리는 초기 글리코단백질의 폴딩 수단이 식물 ER 내 GCSⅠ, 글루코시다제 Ⅱ, 칼넥신, 칼레티쿨린(calreticulin) 및 ERp57로 이루어진 큰 복합 단백질 복합체를 형성할 수 있는지 여부를 현재 조사하고 있다.

14. GCSI의 시토졸 꼬리는 ER 체류에 독립적으로 충분한 3개의 디-알기닌 신호를 포함한다

알기닌-풍부한 서열(MTAGASRRSARGRI(서열 번호 1)은 ER 내 골지 마커 XYLT35를 타겟하기에 충분하다는 것이 보여졌다. 포유 동물 세포의 분비 통로에서 막 단백질 타겟팅에 대한 예전 연구에 기초하여, 본 실시예는 4개의 알기닌 잔기가 ER 체류 정보를 포함하는지 여부를 확인하기 위해 만들어졌다. 알라닌 또는 류신 잔기로 4개의 알기닌을 돌연변이한 것은, L/GGCS90이 골지에서 발견되는 것과 같이, 본 서열의 ER 체류 능력을 완전하게 없앴고, 그 결과 ER 체류에 있어서 알기닌 잔기의 중요한 역할을 확인하였다.

본 알기닌-풍부한 서열의 지정된 돌연변이 생성에 기초한 또 다른 분석은, 사실 두 개의 알기닌 잔기가(RR, RXR, 또는 RXXR 서열 번호 70) GCS90이 ER 체류를 하도록 하기 충분하고, 결과적으로 GCSI의 시토졸 꼬리에 공존하는 ER 체류에 충분한 13 aa 펩타이드가 3개의 구별되는 디-알기닌 모티프를 포함한다는 것을 보여주었다. 흥미롭게도, 이러한 3개의 디-알기닌 모티프 중 오직 하나만이 GCS90의 시토졸 꼬리에 존재하는 경우, 형광이 ER에서 뿐만 아니라 골지 스택과 연관되고 ER 트랙을 따라 골지 스택과 함께 이동하는 작은 점에서도 탐지된다.

게다가, 용해성 ER 마커 단백질 GFP-HDEL은 이러한 작은 점으로부터 구분된다. 상기 가정은 R/L₆ _-7GCS90, R/L₆ _-12GCS90 및 R/L₁₀ _-12GCS90이 탐지되는 이러한 작은 점이 ER 표면에 위치되고 ER과 골지체 사이의 물질 교환을 중개하는 분비 단위(ERES)와 대응한다는 것이다(Runion et al., 2006(참조 55)). 본 가정을 증명하는 또 다른 조사는 골지체에 연결되고 ER 표면에서 골지체와 이동하는 단일 분비 단위에 기초한 ER/골지 이동 모델을 지지할 것이다. 그러나, 미니-점들은 Sar1p와 공위치하지 않는다, 디-알기닌 모티프는 포유동물 막 단백질에서 광범위하게 연구되어 왔으나 그들의 식물 상동체에서는 본 연구 전에 특성화 되어지지 않았다. 흥미롭게도 예전에 인간 GCSI에서 확인된 디-알기닌 모티프는 식물 세포에서 ER 체류를 중개하는 것으로 나타났다(Hardt et al., 2003(참조 28)).

그러나 AtGCSI에서 확인된 디-알기닌 모티프는 그들의 인간 상동체보다 더욱 유연해 보인다. 실제로 인간 글루코시다제 Ⅰ의 디-알기닌 모티프는 위치 +7과 +8에 존재하는 두 개의 알기닌 잔기 및 위치 +9의 염기성 아미노산으로 이루어져 있다. AtGCSI에서 두 알기닌 사이의 거리는 더욱 유연해 보이나 우수한 효과를 위해 두 아미노산을 초과할 수 없다. 더욱이 본 모티프는 단백질의 N-말단 끝에 가까이 근접해야만 한다. 실제로, GCSI에서 위치 +23과 +24의 디-알기닌 모티프 RR은 융합 단백질 D13GCS90-GFP에 여전히 존재하나 ER 체류를 허여하기에는 충분하지 않다.

마지막으로 이용 가능한 GCSI 서열의 비교는 이러한 ER 존재 단백질의 말단 끝에서 디-알기닌 모티프가 높게 유지된다는 것을 보여 준다(표 2, Boisson et al., 2001(참조 6); Hong et al., 2004(참조 30)).

실시예 2: 서열 확인에 대한 설명

앞선 실시예에서 본 것처럼, 표 3에 목록화된 각 신호는 녹색 형광 단백질과 같은 리포터 단백질을 ER 및/또는 골지체로 타겟하는데 충분하다(첨부 도면 25A와 25B를 보라).

위치= 신호와 융합되었을 때 리포터 단백질의 위치(cf 첨부 도면 1)

앞서 개시한 것처럼, 서열 번호 1 내지 3은 ER로의 막 단백질 타겟팅을 위한 앵커(anchor)서열 세트를 나타낸다. 이러한 서열은 C- 또는 N-말단 끝에 위치된 막 단백질의 시토졸 꼬리에 위치된다.

서열 번호 1: MTAGASRRSARGRI

서열 번호 2: MARGERRRRA

서열 번호 3: MNDRRPQRKRPA

이러한 시토졸 꼬리에 존재하는 하기 디-알기닌 모티프(들) 서열은(서열 번호 1 내지 3) ER 내에 리포터 막 단백질을 보유시키기에 충분하다고 보여졌다:

모티프 서열:

	서열 번호		서열 번호		서열 번호
RR		RRXXRXR	76	RRRK	88
RXR		RKXXRXR	77	RRKK	89
RXXR	70	RRXXRXK	78	RKKR	90
RXXXR	71	RRXXKXR	79	KKRR	91
RK		KRXXRXR	80
RKX		KKXXRXR	81
RXXK	72	RRXXKXK	82
RXXXK	73	RKXXKXR	83
KR		RKXXRXK	84
KXR		RRRR	85
KXXR	74	RKRR	86
KXXXR	75	RRKR	87

도 25에서 설명한 것처럼, 이러한 디-알기닌 모티프는 각각 유형 Ⅱ 또는 유형 Ⅰ 막 단백질의 N- 또는 C-말단 부분에 위치될 수 있다.

다른 하기 서열은 다음에 따라 테스트되었다:

서열 번호 4 내지 7은 ER 내 재조합 막 폴리펩타이드의 완전한 체류의 이유가 된다. 이러한 서열은 ER 루멘에 위치된다.

서열 번호 4:

FQGEHKESLYWGTYRPHVYFGVRARTPLSLVAGLMWLGVKDEMYVMRHFC

서열 번호 5:

FQGDHKESLYWGTYRPNVYLGIRARTPLSLIAGIMWIGAKNGQYFLRHVC

서열 번호 6:

ESDASLLWGTYRPQIYFGLRPRLPGSLLTGLAWFGLQDYSDFQHIRHQC

서열 번호 7:

ERSNRLFWGTYRPGIYFGMKHRSPISLLFGVMWTVQDAENFAFRHSC

본 발명의 서열 번호 4와 70% 이상의 상동 관계를 가지는 모든 서열은 본 발명의 타겟팅 신호와 동일한 효과를 가지는 것으로 추정된다.

도 26에서, 줄기(S3)에 위치한 서열 번호 4 내지 7은 ER 내 막 단백질의 완전한 체류에 원인이 된다. S3는 트랜스막 도메인 근처에 위치한 서열이다.

ER 내 재조합 폴리펩타이드의 완전한 체류는(도 26을 보라) 서열 번호 8에 설명된 것처럼, 디-알기닌 모티프를 포함하는 서열 번호 1 내지 3 중 하나와 서열 번호 4 내지 7 중 하나의 연결에 의해 행해지고, 막 단백질의 ER 내 완전한 체류 및 재조합 단백질의 안정화의 원인이 된다.

16 내지 23 아미노산의 트랜스막 도메인(GS2)은 골지로 단백질을 보내는데 충분한 것으로 보여졌다. 본 도메인의 사용은 재조합 단백질 또는 골지 막의 효소를 고정하는데 충분하다. 본 발명의 펩타이드 신호에 포함되는 테스트된 트랜스막 도메인(GS2)의 실시예는 다음과 같다:

골지 효소로부터 시토졸 꼬리(GS1), 트랜스막 도메인(GS2) 및 줄기(GS3) 간의 배열은 시스, 중앙 또는 트랜스 골지 내 막 단백질의 체류의 원인이 된다(첨부 도면 26, 아래 도식도를 보라). 본 배열은 골지체 내 효소 또는 재조합 단백질이 서브구획화 되도록 한다, 본 발명에 따른 이러한 펩타이드 신호 서열의 실시예는 다음과 같다:

GS1

서열 번호 17: MARGSRSVGSSSSKWRYCNPSYYLKRPKR

서열 번호 18: MGVFSNLRGPRAGATHDEFPATNGSPSSSSSPSSSIKRK

서열 번호 19: MRGYKFCCDFR

서열 번호 20: MGVFSNLRGPKIGLTHEELPVVANGSTSSSSSPSSFKRK

서열 번호 21: MLVMPQPPKPFN

서열 번호 22: MARGSRSVGSSSSKWRYCNPSYYLKRPKR

서열 번호 23: MANLWKKQRLRDTGLCR

GS3 도메인으로부터 나온 펩타이드 신호의 실시예는 다음과 같다:

이러한 신호는 임시적 또는 안정한 형질전환 후에 토바코, 콩, 토마토 또는 무 세포의 몇몇 막 단백질의 발현을 타겟팅 하는데 사용되었다. 이러한 신호는 막 단백질의 N-말단(유형 Ⅱ 막 단백질) 또는 C-말단 끝(유형 Ⅰ 막 단백질) 중 하나에, 동일한 타겟팅 효율 및 특정성을 가지고 부가될 수 있다(상기 신호는 유형 Ⅲ 또는 Ⅳ 막 단백질에도 역시 부가될 수 있는 것으로 보여진다).

GS1/GS2/GS3 간 배열의 예

실시예 3: 타겟팅 서열을 사용하여 초반 분비 통로 구획 내에 재조합 단백질을 저장함으로써 N-글리칸 상 면역원성 잔기의 부가의 방지.

식물 ER-존재 단백질의 구조적 분석은 그들이 높은-만노즈-유형 N-글리칸을 독점적으로 가진다는 것을 보여준다(Navazio et al., 1997(참조 41); 1998(참조 42); Pagny et al., 2000(참조 49)). 이러한 올리고당 구조는 식물과 포유 동물에 공통적이고 그러므로 면역원성이 아니다. 본 관찰은 식물-제조 약물(PMPs) N-글리칸에 베타 1,2 자일로즈 또는 알파 1,3 푸코즈와 같은 면역원성 잔기의 연결을 막는 전략을 제시한다. 본 전략은 ER 내, 즉, 면역원성 글리코-에피톱(epitope)이 성숙한 식물 N-글리칸에 부가되는 골지 시스터나의 위쪽,에 재조합 단백질을 저장하는 것에 있다. 재조합 용해성 단백질의 C-말단 끝에 H/KDEL 아미노산 서열의 부가는 식물 ER에 그것을 체류하게 하는데 충분하다는 것이 처음 보여졌다(Gomord et al., 1997(참조 24), 1999(참조 22).

본 실시예에서, 동일한 전략을 사용하여, KDEL-ER 신호 서열이 두 개의 다른 항체들의 중쇄 및 경쇄 모두에 융합되었다.

서열 번호 1 내지 8의 서열은 ER로 항체의 중쇄 및 경쇄를 타겟 하는데 사용되었다.

서열 번호 32 내지 36의 서열은 ER과 GA로 항체의 중쇄 및 경쇄를 타겟 하는데 사용되었다.

이러한 항체는 비 면역원성 높은-만노즈-유형 N-글리칸을 독점적으로 나타내고(Sriraman et al., 2004(참조 59); Petrucelli et al., 2006(참조 51)), 이는 a-만노시다제 Ⅰ과 같이, ER 및 시스-골지에 위치된 효소에 제한되는 글리칸 성숙에 기초한 매우 효율적인 재순환을 가리킨다(Nebenfuhr et al., 1999(참조 43)). 그러므로 ER 체류 신호에의 융합을 통해 면역원성 N-글리칸이 PMPs에 연결되는 것을 막는 것이 가능하다.

실시예 B: ER 및/또는 GA 내 항체 또는 항체 절편의 발현(첨부 도면 15, B줄)

ER 및/또는 GA 내 항체 또는 항체 절편의 발현은 재조합 단백질 생산을 향상하기 위한 다른 전략을 제공한다. 예를 들어 이는 비 변형된(변이된) 약제용 단백질을 ER 및/또는 골지체로 타겟하는 것을 이끌 수 있다.

식물에서 기능성 발현 항체의 원 설명 이후 두 개의 주요 연구 지침이 성립되었다. 첫 번째는 약제용 항체 또는 항체 절편의 대-규모 생산을 위하여 바이오-반응기로서 식물을 사용하는 것이다. 두 번째는, 항체 또는 항체 절편이 면역조정(immunomodulation)이라고 명명된 메카니즘에 의해 생리적 과정에 영향을 주기 위해 호스트 세포에서 발현된다. 상기 잠재적 면역 조정은 제초제 특이적인 항체의 발현이 in planta 저항성을 주는 것으로 보여졌을 때 최근 설명되었다(Almquist KC et al., 2004(참조 1)와 첨부 도면 27을 보라).

실시예 C: 식물 세포의 ER 및/또는 GA 내 동종 또는 이종 효소의 발현 및 상기 세포 내 재조합 단백질의 발현:

실시예 1 포유동물 글리코실트랜스퍼라제를 식물 세포의 ER/GA 내로 이동시킴에 의한 식물 세포 내 N-글리코실화의 인간화(첨부 도면 15, C줄).

식물에서, 다른 진핵세포에서처럼, N-글리코실화는 초기 폴리펩타이드 상의 특정 아스파라긴 잔기에 올리고당 전구체(Glc3Man9GlcNAc2)를 번역과 동시에 부가하면서 ER에서 시작한다. 일단 단백질로 전이되면, 분비된 글리코단백질이 분비 통로를 따라 이동되는 동안, 올리고당은 복잡한 N-글리칸을 야기하는 몇몇 성숙을 겪는다. 면역 반응의 야기(triggering)와 같은 그들의 작용자(effector) 기능을 위해 사용되는 항체를 포함하는 많은 약제들은(Wright와 Morrison, 1994(참조 64)), 그들의 생체 내 활성 및 안정성을 위하여 글리코실화가 필요하다. 재조합 항체의 생산을 위해 잠재적 식물이 제공할 수 있는 용도, "인간화"된 비-면역원성 N-글리칸을 얻기 위해서 이러한 식물-특정 성숙을 저해하는 것이 필요하게 되는 이유이다.

식물 N-글리칸을 인간화 하기 위한 매력적인 전략은 식물에서 포유 동물 글리코실트랜스퍼라제를 발현하는 것이고, 이는 식물 골지체에서 N-글리칸 성숙의 내생적 수단을 완성(혹은 함께 경쟁)할 것이다. 이러한 합식(complementation) 전략에 기초하여, 인간 베타(1,4)-갈락토실트랜스퍼라제의 발현은, 식물 세포 골지 내에서, 식물 N-글리칸의 부분적 인간화를 이끌고, 어쩌면, 베타(1,2)-자일로즈와 알파(1,3)-푸코즈의 부가와 경쟁한다.

알팔파나 토바코 식물에서 인간 베타(1,4)-갈락토실트랜스퍼라제의 발현은 식물 N-글리칸의 말단 N-아세틸글루코사민 잔기 상에 갈락토즈 잔기를 이동시킨다. 그러나 오직, 본 인간 갈락토실트랜스퍼라제를 발현하는 토바코나 알팔파 식물에서 생산된 글리코단백질에 의해 수행된 30 내지 40%의 N-글리칸만이, 포유동물 유형의 말단 N-아세틸락토사민 서열을 가진다(Bakker et al., 2001(참조 2)).

인간 베타(1,4)-갈락토실트랜스퍼라제는 골지 타겟팅 신호와 융합되었다.

hGalT와 GNTIhGalT 발현을 위한 플라스미드는 pBLTI121로부터 모였다(Pagny et al., 2003 참조 50). CaMV 35S 프로모터는 HindⅢ-Xbal 사이트에서 알팔파 플라스토시아닌(plastocyanin) 프로모터로 치환되었다. 인간 β(1,4)-갈락토실트랜스퍼라제(hGalT) 유전자(UDP 갈락토즈: β-N-아세틸글루코사미니드: β(1,4)-갈락토실트랜스퍼라제; EC2.4.1.22)는 EcoRI 자르기로 pUC19-hGalT로부터 분리되었다. 크레노우(klenow) 처리 후에, 1.2kb hGalT 절편이 Smal 사이트에서 pBLTI221로 클론되었다. 플래그 태그가 이후 FGalT 포워드 (5'-GACTCTAGAGCGGGAAGATGAGGCTTCGGGAGCCGCTC-3' 서열 번호 92)와 리버스 RGalTFlagStu (5'-AAGGCCTACGCTACTTGTCATCGTCATCTTTGTAGTCGCACGGTGTCCCGAAGTCCAC-3' 서열 번호 93) 프라이머를 사용한 PCR에 의해 코딩 지역의 C-말단 끝에 융합되었다. R622는 이후 플라스토(Plasto) 프로모터와 Nos 터미네이터의 조절 하에 바이너리 벡터 pBLTI121 내로 본 Xbal-Stul 절편을 클로닝함에 의해 생산되었다.

트랜스막 도메인에 상응하는 니코티아나 타바쿰 N-아세틸글루코사미닐트랜스퍼라제 Ⅰ(GNTI)의 처음 N-말단 38 aa가 포워드 FGNT(5'-ATCGAAATCGCACGATGAGAGGGTACAAGTTTTGC-3' 서열 번호 94)와 리버스 RGNTspe(5'-CCCATGATGCGATCTGCATATTCTGACTGTGTCGC-3' 서열 번호 95) 프라이머를 사용한 PCR에 의해 증폭되었고, 연속해서 Apal/BamHl에 의해 pGEM-T 벡터 및 pBLTI221로 클론되었다. GNTI와 hGalT 사이의 융합을 위해, 그것 자체의 TMD를 제거하고 Spel과 Stul 사이트를 만들기 위하여 PCR 증폭이 pUC19-hGalT로부터 행해졌다. 포워드 FGalTspe (5'-GGACTAGTGCACTGTCGCTGCCCGCCTGC-3' 서열 번호 96)과 리버스 RgalFlagStu (5'-AAGGCCTACGCTACTTGTCATCGTCATCTTTGTAGTCGCACGGTGTCCCGAAGTCCAC-3' 서열 번호 97)이 Spel/Stul hGalT 절편을 증폭시키는데 사용되었다.

본 절편은 이후 pBLTI221-GNTI로 클론되었다. 마지막으로, 주위 사이트 Xbal/Stul에 의한 자르기는 1030 bp 절편을 분리할 수 있도록 하였고 R 622는 이후 바이너리 벡터 pBLTI121-플라스토로 본 1030 스트레치를 클로닝하여 생산되었다.

알팔파 식물의 형질전환은 하기와 같이 행해졌다.

알팔파(메디카고 사티바 엘.)(Medicago sativa L.), 에코타입 R2336은 아그로박테리움 투메파시엔(Agrobacterium tumefaciens) AGL1을 사용하여 형질전환되었고 다음과 같이 변형되었다: 잎 꼭지(petiole), 줄기 및 잎 외식편이 5 내지 7일 동안 아그로박테리움과 함께 배양되었다. 상기 함께 배양하는 단계는 SH2K 배지의 0.8 내지 1 OD와 3% 수크로즈(1.5% 수크로즈 대신)에서 아그로박테리움의 희석되지 않은 배양액으로 수행되었다. 반응성 외식편의 배 발달 결과로 잘-성립된(Well-established) 식물이 온실 내 흙으로 이동되었고 잎이 분석되었다.

야생형 및 GalT 또는 GNTI/GalT-형질전환된 알팔파 식물로부터 분리된 N-링크된 글리칸의 분석이 다음과 같이 행해졌다.

단백질이 5mL 추출 완충액(0.7M 사카로즈, 0.5M 트리스, 30mM HCl, 0.1M KCl, 2% 베타-멀캅토에탄올) 속에서 신선한 알팔파 잎 500mg으로부터 4℃에서 30분 동안 추출되었다. 불용해성 물질이 4℃에서, 5000g, 10분 동안의 원심분리에 의해 제거되었다. 상기 결과 상청액이 4℃에서 30분 동안 물 포화된 페놀 1 부피를 부가함에 의해 처리되었다. 이후, 페놀성 분획에 포함된 단백질과 글리코단백질이 밤새, 20℃에서 PB(메탄올에 용해된 0.1M 암모늄 아세테이트) 5 부피에 의해 침전되었다. 5mL PB로 펠렛을 세척한 후에, 단백질과 글리코단백질이 Bakker et al., 2001에서 이전에 설명된 것과 같이 펩신과 PNGase A로 연속 처리됨에 의해 잘려졌다. 이후, N-글리칸이 2-아미노 벤즈아미드(2-AB)에 의해 형광 라벨되었다.

이러한 유도된 N-글리칸의 MALDI-TOF 질량 스펙트럼들이 337-nm 질소 레이저를 구비한 보야져(Voyager) DE-Pro MALDI-TOF 장비(미국, Applied Biosystems)에서 획득되었다. 질량 스펙트럼들은 반사기에서 수행되었고, 매트릭스로서, 2,5-디하이드록시벤조산(Sima-Aldrich)을 사용한 지연화 추출 모드에서 수행되었다.

70:30% 아세토니트릴/0.1% TFA 5mg/mL에 방금 용해된, 상기 매트릭스가 1:1(V/V)의 비율로 용해된 올리고당과 혼합되었다. 이러한 스펙트럼들은 양성 모드에서 기록되었고, 100ns 지연 시간과 함께 20,000V의 가속 전압을 사용하였다. 이들은 일단 진정되고 상업적으로 이용 가능한 펩타이드와 단백질 혼합물(Applied Biosystems)을 사용하여 외부적으로 조정되었다. 본 연구에서, 상기 스펙트럼들은 des-Arg¹-Bradykinin(904.4681 Da), 안지오텐신(Angiotensin) Ⅰ (1296.6853), Glu¹-Fibrinopeptide B(1570.6774 Da), ACTH 클립 18-39(2465.1989)와 소(bovine) 인슐린(5730.6087)을 사용하여 조정되었다. 레이저 샷이 허용 가능한 신호 대 잡음비를 얻기 위해 각 스펙트럼에 대하여 축적되었다.

앞서 개시한 것과 같이, 본 발명은 큰 패널 신호를 제공하는데, 이는 서브세포 구획 및 서브도메인 내에 오직 글리코실트랜스퍼라제 활성만을 타겟하기 위해서 사용된다, 이는 호스트 발현 시스템에서 N- 및 O-글리코실화의 효율을 향상시키고 표 4에 나타난 효소와 공-발현함에 의해 이종 단백질의 번역 후 변형을 최적화하기 위해 큰 패널을 제공한다.

N-글리코실화	인간 베타(1,4) 갈락토실레이션 이스트 만노실트랜스퍼라제 OCH1p 인간 GNT Ⅲ
O-글리코실화	N-아세틸글루코사미닐 트랜스퍼라제 갈락토실트랜스퍼라제
단백질 가수분해 절단(Proteolytic cleavage)	세린 프로테아제 시스테인 프로테아제
아미드화	옥시게나제 리아제(lyase)
포스포릴화	포스포릴라제
감마-카르복실화	감마 카르복실라제
프로테오글리칸 변형	글리코트랜스퍼라제 글리코시다제
설패이션(sulfation)	설파타제
하이드록실화	하이드록실라제
아세틸화	아세틸라제
세포벽 다당류 변형	글리코트랜스퍼라제 글리코시다제

표 4는 본 발명의 서열과 융합된 효소를 나타낸다.

앞선 실시예에서 개시한 것처럼, 본 발명은 단백질을 생산하고, 식물 세포의 서브구획에서 단백질을 발현하는 것을 변형하며, 식물 세포의 ER 및/또는 골지체 내에 이종 단백질을 발현하는 방법을 제공한다. 상기 발명은 또한 번역 후 변형된 단백질을 제공한다.

실시예 D: 신호 서열과 융합된 ZERA® 단백질의 발현.

본 실시예에서, ZERA®와 서열 신호((서열 번호 8) 및 만노시다제 Ⅰ을 포함하는 융합된 단백질이 단백질체에 막 단백질로서 글리코시다제를 축적하기 위해 만들어졌다, 타겟팅 신호(서열 번호 8)가 막 ER 내 효소를 축적하기 위해 사용되었고 ZERA 펩타이드를 통하여 집합체를 형성함에 의해 단백질체의 생산을 가능하게 했다.

상기 목적은 단백질체에서, N-글리칸을 가진 글리코단백질(Man5GlcNac2)를 축적하는 것이었다.

플라스미드 구조물: 인간 만노시다제 Ⅰ에 융합된 ZERA를 인코딩하는 ADNc(접근 넘버 Q9UKM7)가 PCR에 의해 증폭되었고 SPel와 Sacl 엔도뉴클레아제(endonuclease) 사이트에 타겟팅 신호(서열 번호 8)를 포함하는 pBLTI121 내 서브클론되었다.

아그로박테리움-중개 토바코 BY-2 세포 형질전환

pVKH18En6-mRFP, PBLTI121-GFP 및 pBIN20-GFP-융합체는 열 충격에 의해 아그로박테리움 투메파시엔(품종 GV3101 pMP90, Koncz와 Schell, 1986)내로 이동되었다. 트랜스제닉 아그로박테리움이 카나마이신(kanamycin)(100mg/mL)와 젠타마이신(gentamycin)(10mg/mL)을 포함하는 YEB 배지(리터당, 비프 추출물 5g, 이스트 추출물 1g, 수크로즈 5g, MgSO₄-7H₂O 0.5g) 상에서 선택되었고 Gomord et al., 1998에 설명된 것과 같이, 니코티아나 타바쿰(c.v. 밝은 노랑-2) BY-2 세포를 형질전환하는데 사용되었다. 형질전환된 토바코 세포는 PBLTI121-GFP와 pBIN20-GFP-융합체를 위해서 카나마이신(100mg/mL) 존재 하에서 선택되었고, 또는 pVKH18En-mRFP를 위해서 하이그로마이신(hygrpmycin) 및 세포탁심(cefotaxime)(250 mg/mL)의 존재 하에서 선택되었다. GFP와 mRFP 융합체를 공발현하는 이중 형질전환주를 위해, 마이크로캘러스들(microcalli)이 카나마이신 플레이트 상에서 먼저 선택되었고, 이후 하이그로마이신 플레이트 상에 이동되었다. 스크리닝 후에, GFP 및/또는 mRFP-융합체를 발현하는 캘러스들(calli)이 트랜스제닉 세포의 서스펜션 배양을 시작하기 위해 사용되었다. 3-4일 된 BY-2 서스펜션-배양된 세포가 실험을 위해 사용되었다.

본 실시예에서 만들어진 융합된 단백질은 형질전환된 세포 내에서 발현되었고 막 ER에 효소를 축적하였으며 ZERA 펩타이드를 통해 집합체를 형성함에 의해 단백질체를 생산하도록 하였다.

앞선 실시예에 개시한 바와 같이, 본 발명은 세포의 특정 도메인에 단백질을 타겟하고, 재조합 폴리펩타이드의 생산 수득률을 높이며, 재조합 폴리펩타이드의 면역원성을 막고, 그들의 천연 대응물의 정확한 복사체인, 치료적으로 활성있는 재조합 폴리펩타이드를 얻도록 한다. 이는 역시 번역 후 변형된 단백질을 생산하는 것을 가능하게도 한다.

[참조 문헌]

참조 1

알므퀴스트, 쿠르트 씨. 용퀸 니우, 마이클 디. 맥린, 프랭크 엘. 메나, 케른 와이. 에프, 야우, 키르크 브라운, 짐 이. 브랜들, 제이. 크리스토퍼 할(2004) 식물에서 해충제 저항성을 부여하는 면역조정. 식물 바이오테크놀로지 저널 2(3), 189-197.

참조 2

배컬 한스, 뮤리엘 발돌, 조스 더블유. 몰토프, 베로니크 고몰드, 잉그리드 엘버, 루카스 에이치. 스티븐스, 윌코 조르디, 아르젠 로멘, 로익 파예, 패트리스 레로우제, 및 디르크 보쉬(2001) 트랜스제닉 식물에 의해 생산되는 갈락토즈-확장 글리칸 항체. PNAS 2001년 2월 27일 98권 넘버5 2899-2904

참조 3

바리에우 프란코스 및 마르텐 제이. 크리스필(1999) 막 앵커를 경유한 액포로 분비된 용해성 단백질의 전달. 식물 생리학(1999) 120:961-968

참조 4

벵헤잘, 엠., 와스테니스, 지., 오., 및 존스, 디. 에이. 2000. 식물에서 C-말단 딜리신 모티프에 의한 유형 Ⅰ 막 단백질의 소포체로의 위치. 식물 세포 12:1179-1201

참조 5

보에빙크, 피., 오파르카, 케이., 산타 크루즈, 에스., 마틴, 비., 베테리즈, 에이. 및 하웨스, 씨.(1998). 경로 상 스택: 식물 골지체의 액틴/ER 네트워크상 이동. 식물 저널. 15. 441-447.

참조 6

보이슨, 엠., 고몰드, 브이., 아우드란, 씨., 버걸, 엔., 두브레우크, 비., 그라니엘, 에프., 레우즈, 피., 파예, 엘., 카보쉬, 엠. 및 레피니엑, 엘.(2001). 배 발달에서 아라비도프시스 글루코시다제 Ⅰ변이가 나타내는 N-글리칸 자르기의 중요한 역할. EMBO 저널. 20, 1010-1019.

참조 7

브라차 케이, 래비 엠, 얄로브스키 에스. 넓은 기질 특이성을 가진 CAAX 프로테아제인 아라비도프시스 AtSTE24. 저널 바이올로지 케미스트리. 2002년 8월 16일;277(33):29856-64

참조 8

브란디지, 에프., 프랑느, 엔., 마르트-마틴, 에스., 하웨스, 씨., 네우하우스, 제이-엠. 및 파리스, 엔.(2002a). 소수성 도메인의 길이에 의해 넓게 영향을 받는 단일-통과 막 단백질의 목적. 플랜트 셀, 14, 1077-1092.

참조 9

브란디지, 에프., 스냅, 이., 로버트, 에이., 리핀코트-스왈츠, 제이. 및 하웨스, 씨.(2002b). 에너지에 의존적이나 세포골격에는 독립적인 토바코 잎에서의 ER과 골지 사이 막 단백질 이동: 선택적인 사진탈색의 증거. 식물 세포 14, 1293-1309.

참조 10

브레츠컬, 엠.에스. 및 문로, 에스.(1993). 콜레스테롤과 골지체. 사이언스 261,1280-1281.

참조 11

캠벨, 알. 이., 투어, 오., 팔머, 에이. 이., 스텐바흐, 피.에이., 바일드, 지. 에스., 자카리아스, 디.에이. 및 시엔, 알. 와이.(2002). 모노머 붉은 형광 단백질. Proc. Natl. Acad. Sci. 미국 99, 7877-7882.

참조 12

킥조라 얀 ¹, 나탈리 칼렌스¹, 크레어 몬트펠리에¹, 비르케 바르토쉬², 프란퀴스-로익 코셋², 앤 오프 드 빅¹, 및 진 두부이슨¹ 간염 C 바이러스 글리코단백질 E2 트랜스막 도메인의 대전된 잔기의 E1E2 헤테로다이머 기능에 대한 기여. 저널 Gen Virol 86(2005), 2793-2798;

참조 13

콘트레라스, 엘레나 오르티즈-자패털, 페르난도 아니엔토(2004) 식물 ARF1 및 코오토머의 상호작용과 관련된 막 단백질 시토졸 꼬리의 구분 신호. 식물 저널 38(4), 685-698

참조 14

드 프래털, 씨. 엠., 게르윙, 지. 제이., 바우스, 이., 누이팅크, 엘. 케이., 브리에젠타르트, 제이. 에프., 브레우얼, 더블유., 카메르링, 제이. 피., 에스필, 엠. 에프., 마틴, 제이. 제이., 드 패페, 에이. 엠., 등(2000). 글루코시다제 Ⅰ 결핍에 기인한 N-링크된 올리고당의 불완전한 생합성으로 야기된 새로운 무질서. 미국 저널 인간 유전학 66, 1744-1756.

참조 15

디른버걸, 디, 벤커, 피, 마흐, 엘. 및 스테인켈널, 에이치.(2002). 식물 세포에서 아라비도프시스 탈리아나 베타 1,2-자일로실트랜스퍼라제의 골지 국지화는 원형질 및 트랜스막 서열에 의존, 식물 분자생물학 50, 273-281.

참조 16

에슬, 디., 디른벌걸, 디., 고몰드, 브이., 스트라설, 알., 파예, 엘., 글로슬, 제이 및 스테인켈너, 에이치.(1999). 토바코 N-아세틸글루코사미닐트랜스퍼라제 Ⅰ의 N-말단 77 아미노산은 니코티아나 벤타미아나 세포의 골지체에서 리포터 단백질을 보유하기에 충분함. FEBS Lett. 453, 169-173.

참조 17

파예 로익, 아우렐리아 보우라플라우스, 메리엠 벤카반, 베로니크 고몰드^a 및 도미니크 미카우드 식물 분비 통로에서 단백질 변형: 분자 파밍에서의 현 상태 및 실제 관련성 23권, 15판, 2005년 3월 7일, 1770-1778

참조 18

풀레크러그, 제이. 및 닐슨, 티.(1998). 골지 복합체에서의 단백질 구획. 생화학. 생리학. Acta 1404, 77-84.

참조 19

길모르, 씨. 에스., 포인덱스터, 피., 로리에아우, 제이., 팔식, 엠. 엠., 및 소머르빌, 씨.(2002). 알파-글루코시다제 Ⅰ은 아라비도프시스의 셀룰로스 생합성 및 발생에 필요하다. 저널 세포 생물학 156, 1003-1013.

참조 20

기라우도, 씨.디. 및 미시오니, 에이치.제이. 에프.(2003). Sar1과 원형질 디베이직 모티프의 상호작용에 의존하는 글리코실트랜스퍼라제의 소포체 배출. 분자 생물학 세포 14, 3753-3766.

참조 21

고몰드, 브이., 및 파예, 엘.(2004). 식물에서 치료적 단백질의 번역 후 변형. 현재 의견 식물 생물학 7, 171-181.

참조 22

고몰드, 브이, 위 이. 및 파예 엘.(1999). 소포체와 골지체에서의 단백질 체류와 국지화. 생화학, 81, 607-618.

참조 23

고몰드 브이, 소우로우일 씨., 피쉐트 에이. 씨., 발보르 엠. 패그니 에스., 레우즈 피., 및 파예 엘.(2004) 식물 제조 약물의 생산과 글리코실화: 도전과제로서의 항체. 식물 바이오테크놀로지., 2, 83-100.

참조 24

고몰드 브이., 덴마트 엘.에이., 피쉐트-래인 에이.씨., 새티아트-제운네마이트리, 하웨스 씨. 및 파예 엘.(1997). 분비 단백질 체류에 충분하나 소포체에서 배출되는 단백질의 액포 타켓팅을 촉진하는 C-말단 HDEL 서열. 식물 저널, 11, 313-326

참조 25

고몰드, 브이., 피쉐트, 에이.씨., 덴마트, 엘.에이., 미샤우드, 디. 및 파예, 엘.(1998). 토바코 세포 서스펜션 배양에서 외부 단백질의 생산. 분자 바이오테크놀로지의 방법 3권(커닝햄 씨. 및 포터 에이.제이.알.에즈.)토토와: 휴마나 출판 주식회사 155-164.

참조 26

그로브, 에스.엔., 브레커, 씨.이. 및 모레, 디.제이.(1968). 소포체-골지체-기관 복합체의 세포막 차이. 사이언스 161, 171-173.

참조 27

한톤 에스엘, 레나 엘, 볼토로티 엘이, 샤트레 엘, 스테파노 지, 브란디지 에프.(2005). 식물 세포에서 소포체로부터 트랜스막 단백질의 배출에 영향을 주는 디애시드 모티프. 식물 세포학 2005 17, 3081-3093.

참조 28

하르드트, 비., 칼즈-풀러, 비., 아파리시오, 알., 볼커, 씨. 및 바우스, 이(2003). ER 타겟팅 정보를 포함하나 절대적으로 ER 위치화를 요구하는 것은 아닌 글루코시다제 Ⅰ의 N-말단 도메인 내의 (Arg)3. 글리코생물학, 13, 159-168.

참조 29

하트만, 엠.에이. 및 벤베니스테, 피.(1987). 식물 막 스테롤: 분리, 확인 및 생합성. 방법 효소학. 148:632-650.

참조 30

홍, 와이., 순다람, 에스., 신, 디.-제이., 및 스탠리, 피.(2004). 글리코실화 IIb(CDG IIb)에 선천적인 혼란을 주는 {알파}-글리코시다제 Ⅰ의 불완전한 변이에 민감한 호스트인 Lec23 중국 햄스터 난소 변이 10.1074/jbc.M41010121200. 저널 생화학 279, 49894-49901.

참조 31

잔지크 아이, 마케룩스 피, 암레인 엔, 스찰러 LeSBT1, 토마토 식물의 서브틸라제. 곤충 세포에서의 과도발현, 정화, 및 특성화. 저널 생화학. 2000년 2월 18일;275(7):5193-9

참조 32

리에나르드 디., 트란 딘 오., 이. 반 오르트, 엘, 반 오베르트벨트, 씨. 본네우, 이. 왐브레, 엠. 발도르, 피. 코세트, 에이. 디디엘-라우렌트, 에프. 돌학 드 보른, 알. 델론, 알. 반 리, 피. 모인게온, 엘. 파예 및 브이. 고몰드(2007) 서스펜션-배양된 BY-2 토바코 세포에서 생산 및 성숙하는 면역학적으로 활성인 집 먼지 진드기 항원....^* DL 및 OTD가 본 작업에 동등한 기여를 함, 식물 바이오테크놀로지 저널 5, 93-108

참조 33

린크, 디. 브이.(1993). 스핑고지질. 식물에서 지질 대사(모르 티.에스. 에드.) 보카 라톤, 에프엘:씨알씨 출판, 285-308.

참조 34

마시베이, 에이.에스., 바라지, 피.브이., 보에게만, 이.이. 및 콰스바, 피.케이.(1993). 보빈 b-1,4-갈락토실트랜스퍼라제의 골지 체류 신호의 변이적 분석. 저널 생화학. 268, 9908-9916.

참조 35

맥카트니, 에이. 더블유., 드예르, 제이. 엠., 다노아, 피. 케이., 킴, 피. 케이., 앤드류, 디. 더블유., 맥뉴, 제이. 에이., 및 뮬렌, 알. 티.(2004). 막-결합 지방산 탈포화효소는 ER 내로 공-번역되며 삽입되고 그것의 카르복시 말단에 다른 ER 복구 모티프를 포함함. 식물 저널 37, 156-173.

참조 36

모레우, 피., 하트만, 엠.에이., 페렛, 에이.엠., 스털보이스-발세르작, 비. 및 카산, 씨.(1998). 릭 묘목의 원형질 막으로의 스테롤 운반. 식물 생리학. 117, 931-937.

참조 37

모레, 디.제이. 및 모렌하우어, 에이치.에이치.(1974). 내막 개념: 소포체와 골지체의 기능적 융합. 식물 울트라구조의 다이나믹한 측면(로발드 에이. 더블유.에드.) 런던: 맥그로우-힐 북, 84-137.

참조 38

문로, 에스.(1991). 골지 체류에 특이한 b-2,6-시알릴트랜스퍼라제의 트랜스막 단편 내 및 근접한 서열. EMBO 저널 10, 3577-2588. 문로, 에스(1995a). 골지와 세포질 막 단백질의 트랜스막 도메인의 비교. 생화학. Soc. Trans. 23, 527-530.

참조 39

문로, 에스.(1995b). 골지 단백질 체류의 트랜스막 도메인의 역할 조사. EMBO 저널 14, 4695-4704.

참조 40

문로, 에스.(1998). 골지체에 단백질의 국지화. 세포 생물학 경향 8, 11-15.

참조 41

나바지오 엘., 스폰가 엘., 다메세 피., 피쉐트-레인 에이-씨., 파예 엘., 발단 비. 및 마리아니 피.(1997). 리리오덴드론 툴리피페라 엘의 꽃가루 내 칼슘 결합 단백질 칼레티쿨린. 식물 과학, 131, 35-42

참조 42

나바지오 엘., 나르디 씨., 판칼두 씨., 다네스 피., 발단 비., 피쉐트-래인 에이.씨., 파예 엘., 메집 에프., 마틴 더블유. 및 마리아니 피.(1998). 유글레나 그라시리스 내 칼레티쿨린의 기능적 보존. 저널 Euk. 미생물학, 45, 307-313.

참조 43

네벤풀, 에이., 갈라걸, 엘.에이., 두나해이, 티.지., 프로릭, 제이.에이., 마줄키윅즈, 에이.엠., 밀, 제이.비. 및 스태헬린, 엘.에이.(1999). 액토미오신 시스템에 의해 중개되는 식물 골지 스택의 자주 멈추는 이동. 식물 생리학 121, 1127-1142.

참조 44

닐슨, 티., 피팰트, 엠., 호, 엠.에이치., 스루사레윅즈, 피., 버걸, 이.지. 및 와렌, 지.(1993a). 헬라 세포의 골지체 내 2개의 글루코실트랜스퍼라제의 겹쳐지는 분배. 저널 세포 생물학 120, 5-13.

참조 45

닐슨, 티., 슬루사레윅즈, 피., 호, 엠.에이치. 및 와렌, 지(1993b). 킨 인지: 골지 효소 체류의 모델. FEBS Lett. 330, 1-4.

참조 46

닐슨, 티., 호, 엠.에이치., 스루사레윅즈, 피., 라보울리, 씨., 왓슨, 알., 헌트, 에프., 왓젤, 지., 버걸, 이.지. 및 와렌, 지.(1994). 헬라 세포에서 중앙 골지 효소 사이의 킨 인지. EMBO 저널 13, 562-574.

참조 47

닐슨, 티., 라보울리, 씨., 후이, 엔., 왓슨, 알. 및 와렌, 지.(1996). 체류에서 막 스패닐 도메인 및 N-아세틸글루코사미닐트랜스퍼라제 Ⅰ의 줄기 지역의 역할, 헬라 세포에서 킨 인지 및 골지체의 구조적 유지. 저널 세포 사이언스 109, 1975-1989.

참조 48

오파트, 에이.에스., 호우톤, 에프. 및 글리슨, 피.에이.(2000). 높은 몰 중량 복합체로 존재하는, 후반 골지가 아닌 중앙 골지 글리코실트랜스퍼라제. 저널 바이올로지 케미스트리 275, 11836-11845.

참조 49

패그니 에스., 카반스-마쉐티우 엠., 길리킨 제이.더블유.,; 레볼느-캐스텔 엔., 레루즈 피., 보스톤 알. 파예 엘. 및 고몰드 브이.(2000). 식물에서 골지체에서부터 소포체까지의 단백질 재순환 및 칼레티쿨린 체류에 대한 그것의 작은 기여. 식물 세포, 12, 739-755

참조 50

페그니, 에스., 보우소니, 에프., 살칼, 엠., 폴렛-구예, 엠.엘., 드리오우이치, 에이., 스차크터, 에이치., 파예, 엘. 및 고몰드, 브이.(2003). 아라비도프시스 b-1,2-자일로실트랜스퍼라제 활성 및 골지에 타겟팅을 위한 구조적 요구. 식물 저널 33, 189-203.

참조 51

페트루셀리 에스., 오테구이 엠에스., 라레우 에프., 트랜딘탄리엔 오., 페쉬트 에이씨., 키르코스타 에이., 럼보 엠., 발도르 엠., 칼카모 알., 고몰드 브이. 및 비치 알엔. 잎의 소포체에 효과적으로 보유되었지만 종자에서 단백질 저장 액포로 양자 모두 부분적으로 분비되고 구분된 KDEL 태그된 모노클로날 항체. 식물 바이오테크놀로지 저널, 4, 511-527

참조 52

라우텐가르텐 씨, 스테인하우설 디, 부시스 디, 스틴치 에이, 스칼러 에이, 코프카 제이, 알트만 티 유전자의 기능성 관계의 추론 가정: 아라비도프시스 탈라이나 서브틸라제 유전자족의 분석. PLoS 컴퓨터 바이올로지 2005년 9월;1(4):e40.Epub 2005년 9월 2일

참조 53

레이스, 에프., 말찬트, 엘., 노람부에나, 엘., 닐로, 알., 실바, 에이치., 및 오렐라나, 에이.(2006). 소포체에 위치하고 접히지 않은 단백질 반응에 의해 업-조절되는 AtITr1, 알라비도프시스 탈리아나의 UDP-글루코즈/UDP-갈락토즈 운반체. 저널 바이올로지 케미스트리 281, 9145-9151.

참조 54

리트젠탈러, 씨., 네벤풀, 에이., 모바페기, 에이., 스투시-가라우드, 씨., 베니아, 엘., 핌플, 피., 스태헬린, 엘.에이. 및 로빈슨, 디.지.(2002). 골지-타켓된 녹색 형광 단백질 및 COPI 항혈청을 발현하는 토바코 밝은 노랑 2 세포를 사용한 식물 세포 상 브레펠딘 A 효과의 재평가, 식물 세포학 14, 237-261.

참조 55

루니온스 제이., 브라흐 티., 쿨널 에스 및 하웨스 씨.(2006). 소포체 막 내에 단백질 동력을 나타내는 GFP 광활성. 저널 Exp. Bot. 57, 43-50.

참조 56

세인트-조르, 씨.엠., 에빈스, 제이., 바토코, 에이치., 브란디지, 에프., 모르, 아이. 및 하웨스, 씨.(2002). 식물에서 골지체와 소포체 간의 막 단백질 재분배가 가역적이고 세포골격 네트워크에 의존적이지 않음. 식물 저널 29, 661-678.

참조 57

세인트-조르-듀파스 씨., 고몰드 브이. 및 패리스 엔.(2004). 골지체와 트랜스-골지 네트워크의 단백질 국지화. 세포 분자 생활 과학, 61, 159-171.

참조 58

세인트-조르-듀파스 씨., 네벤풀 에이., 폴렛-규예 엠엘., 보우라플로우스 에이., 하웨스 씨., 드리오우이치 에이., 파예 엘. 및 고몰드 브이.,(2006) 분비 통로를 따라 N-글리칸 성숙 효소의 절단 및 초반-골비 타겟팅에서 트랜스막 도메인 길이의 주요 역할. 식물 세포 18, 3182-3200

참조 59

스리라만 알., 바르도르 엠., 삭 엠., 바퀘로 씨., 파예 엘., 피숴 알., 핀네른 알, 레루오게 피.(2004) 코어-자일로즈 및 코어-알파(1,3)-푸코즈가 부족한 형질전환된 식물의 소포체에 보유된 재조합 항-hCG 항체. 식물 바이오테크놀로지; 2, 279-287

참조 60

스트라설, 알., 무차, 제이., 스위라, 에이치., 알트만, 에프., 그로슬, 제이. 및 스테인켈널, 에이치.(1999). 니코티아나 타바쿰의 b-1,2-N-아세틸글루코사미닐트랜스퍼라제 Ⅰ(GlcNAc-TI)를 코딩하는 cDNA의 분자 클로닝과 특성. 글리코바이올로지 9, 779-785.

참조 61

스트라설, 알., 쇼베르얼 제이., 진 씨., 무차, 제이., 글로슬, 제이., 마흐 엘. 및 스텐켈널, 에이치.(2006). 식물에서 복합 N-글리칸 형성의 주요 효소인 아라비도프시스 탈라이나 골지 a-만노시다제 Ⅱ의 분자 클로닝과 특성. 식물 저널 45, 789-803.

참조 62

태스달, 알.디. 및 잭슨, 엠.알,.(1996). 소포체와 골지체 사이 막 단백질의 신호-중개된 구분. Ann.리뷰 세포 발달 생물학 12, 27-54.

참조 63

위, 이.지.티., 쉐리어, 제이., 프라임, 티. 및 두프리, 피.(1998). 식물 골치체에 활성 시알릴트랜스퍼라제의 타겟팅. 식물 세포 10, 1759-1768.

참조 64

라이트 에이, 모리슨 에스엘. 기능적 특성상 CH2-연관된 탄수화물 구조 및 키메릭 쥐-인간 면역글로불린 G1의 생체 내 운명. 저널 Exp Med. 1994년 9월 1일;180(3):1087-96

참조 65

유아사, 케이., 토유카, 케이., 푸쿠다, 에이치. 및 매트수오카, 케이.(2005). 소포체로부터 배출 신호를 가진 막-앵커된 프로일 하이드록시라제. 식물 저널 41, 81-94.

참조 66

제란구, 엔., 스와파크, 비., 잰, 와이.엔. 및 잰, 엘.와이.(1999). 원형질막 K(ATP) 채널의 서브단위 화학양론을 조절하는 새로운 ER 통행 신호. 뉴론 22, 537-548.

SEQUENCE LISTING <110> CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS) <120> A SET OF SEQUENCES FOR TARGETING EXPRESSION AND CONTROL OF THE POST-TRANSLATIONNAL MODIFICATIONS OF A RECOMBINANT POLYPEPTIDE <130> IF09P037FR <150> US 60/857,524 <151> 2006-11-08 <160> 132 <170> PatentIn version 3.2 <210> 1 <211> 14 <212> PRT <213> Artificial <220> <223> peptidic signal (S1) <400> 1 Met Thr Ala Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile 1 5 10 <210> 2 <211> 10 <212> PRT <213> Artificial <220> <223> peptidic signal (S1) <400> 2 Met Ala Arg Gly Glu Arg Arg Arg Arg Ala 1 5 10 <210> 3 <211> 12 <212> PRT <213> Artificial <220> <223> peptidic signal (S1) <400> 3 Met Asn Asp Arg Arg Pro Gln Arg Lys Arg Pro Ala 1 5 10 <210> 4 <211> 50 <212> PRT <213> Artificial <220> <223> stem sequence S3 <400> 4 Phe Gln Gly Glu His Lys Glu Ser Leu Tyr Trp Gly Thr Tyr Arg Pro 1 5 10 15 His Val Tyr Phe Gly Val Arg Ala Arg Thr Pro Leu Ser Leu Val Ala 20 25 30 Gly Leu Met Trp Leu Gly Val Lys Asp Glu Met Tyr Val Met Arg His 35 40 45 Phe Cys 50 <210> 5 <211> 50 <212> PRT <213> Artificial <220> <223> stem sequence S3 <400> 5 Phe Gln Gly Asp His Lys Glu Ser Leu Tyr Trp Gly Thr Tyr Arg Pro 1 5 10 15 Asn Val Tyr Leu Gly Ile Arg Ala Arg Thr Pro Leu Ser Leu Ile Ala 20 25 30 Gly Ile Met Trp Ile Gly Ala Lys Asn Gly Gln Tyr Phe Leu Arg His 35 40 45 Val Cys 50 <210> 6 <211> 49 <212> PRT <213> Artificial <220> <223> stem sequence S3 <400> 6 Glu Ser Asp Ala Ser Leu Leu Trp Gly Thr Tyr Arg Pro Gln Ile Tyr 1 5 10 15 Phe Gly Leu Arg Pro Arg Leu Pro Gly Ser Leu Leu Thr Gly Leu Ala 20 25 30 Trp Phe Gly Leu Gln Asp Tyr Ser Asp Phe Gln His Ile Arg His Gln 35 40 45 Cys <210> 7 <211> 47 <212> PRT <213> Artificial <220> <223> stem sequence S3 <400> 7 Glu Arg Ser Asn Arg Leu Phe Trp Gly Thr Tyr Arg Pro Gly Ile Tyr 1 5 10 15 Phe Gly Met Lys His Arg Ser Pro Ile Ser Leu Leu Phe Gly Val Met 20 25 30 Trp Thr Val Gln Asp Ala Glu Asn Phe Ala Phe Arg His Ser Cys 35 40 45 <210> 8 <211> 150 <212> PRT <213> Artificial <220> <223> conjonction S1 and S3 <400> 8 Met Thr Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile Lys Ser Ser 1 5 10 15 Ser Leu Ser Pro Gly Ser Asp Glu Gly Ser Ala Tyr Pro Pro Ser Ile 20 25 30 Arg Arg Gly Lys Gly Lys Glu Leu Val Ser Ile Gly Ala Phe Lys Thr 35 40 45 Asn Leu Lys Ile Leu Val Gly Leu Ile Ile Leu Gly Ile Ile Val Ile 50 55 60 Tyr Phe Val Ile Asn Arg Leu Val Arg His Gly Leu Leu Phe Asp Glu 65 70 75 80 Ser Gln Lys Pro Arg Val Ile Thr Pro Phe Pro Ala Pro Lys Val Met 85 90 95 Asp Leu Ser Met Phe Gln Gly Glu His Lys Glu Ser Leu Tyr Trp Gly 100 105 110 Thr Tyr Arg Pro His Val Tyr Phe Gly Val Arg Ala Arg Thr Pro Leu 115 120 125 Ser Leu Val Ala Gly Leu Met Trp Leu Gly Val Lys Asp Glu Met Tyr 130 135 140 Val Met Arg His Phe Cys 145 150 <210> 9 <211> 21 <212> PRT <213> Artificial <220> <223> transmembrane domain GS2 <220> <221> MISC_FEATURE <222> (1)..(3) <223> Xaa can be any naturally occurring amino acid <400> 9 Xaa Xaa Xaa Leu Ala Leu Leu Phe Ile Val Phe Val Cys Val Ser Phe 1 5 10 15 Val Phe Trp Asp Arg 20 <210> 10 <211> 25 <212> PRT <213> Artificial <220> <223> transmembrane domain GS2 <220> <221> MISC_FEATURE <222> (1)..(2) <223> Xaa can be any naturally occurring amino acid <400> 10 Xaa Xaa Arg Tyr Leu Leu Ile Leu Ala Ala Val Ala Phe Ile Tyr Ile 1 5 10 15 Gln Met Arg Leu Phe Ala Thr Gln Ser 20 25 <210> 11 <211> 24 <212> PRT <213> Artificial <220> <223> transmembrane domain GS2 <220> <221> MISC_FEATURE <222> (1)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (22)..(24) <223> Xaa can be any naturally occurring amino acid <400> 11 Xaa Xaa Xaa Leu Gly Ile Leu Phe Ala Val Thr Leu Ser Ile Val Leu 1 5 10 15 Met Leu Val Ser Val Xaa Xaa Xaa 20 <210> 12 <211> 23 <212> PRT <213> Artificial <220> <223> transmembrane domain GS2 <220> <221> MISC_FEATURE <222> (1)..(2) <223> Xaa can be any naturally occurring amino acid <400> 12 Xaa Xaa Lys Ile Phe Leu Tyr Met Leu Leu Leu Asn Ser Leu Phe Leu 1 5 10 15 Ile Ile Tyr Phe Val Phe His 20 <210> 13 <211> 26 <212> PRT <213> Artificial <220> <223> transmembrane domain GS2 <220> <221> MISC_FEATURE <222> (1)..(3) <223> Xaa can be any naturally occurring amino acid <400> 13 Xaa Xaa Xaa Arg Lys Leu Ser Asn Leu Leu Pro Leu Cys Val Ala Leu 1 5 10 15 Val Val Ile Ala Glu Ile Gly Phe Leu Gly 20 25 <210> 14 <211> 26 <212> PRT <213> Artificial <220> <223> transmembrane domain GS2 <220> <221> MISC_FEATURE <222> (1)..(3) <223> Xaa can be any naturally occurring amino acid <400> 14 Xaa Xaa Xaa Arg Lys Val Ser Thr Phe Leu Pro Ile Cys Val Ala Leu 1 5 10 15 Val Val Ile Ile Glu Ile Gly Phe Leu Cys 20 25 <210> 15 <211> 29 <212> PRT <213> Artificial <220> <223> transmembrane domain GS2 <220> <221> MISC_FEATURE <222> (1)..(2) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (28)..(29) <223> Xaa can be any naturally occurring amino acid <400> 15 Xaa Xaa Phe Asn Thr Ile Thr Ile Thr Ile Met Ile Ala Phe Thr Phe 1 5 10 15 Phe Leu Leu Phe Leu Thr Gly Phe Leu Gln Phe Xaa Xaa 20 25 <210> 16 <211> 29 <212> PRT <213> Artificial <220> <223> transmembrane domain GS2 <220> <221> MISC_FEATURE <222> (1)..(2) <223> Xaa can be any naturally occurring amino acid <400> 16 Xaa Xaa Lys Arg Leu Ala Leu Leu Phe Ile Val Phe Val Cys Val Ser 1 5 10 15 Phe Val Phe Trp Cys Val Ser Phe Val Phe Trp Asp Arg 20 25 <210> 17 <211> 29 <212> PRT <213> Artificial <220> <223> cytosolic tail GS1 <400> 17 Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg 1 5 10 15 Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg 20 25 <210> 18 <211> 39 <212> PRT <213> Artificial <220> <223> cytosolic tail GS1 <400> 18 Met Gly Val Phe Ser Asn Leu Arg Gly Pro Arg Ala Gly Ala Thr His 1 5 10 15 Asp Glu Phe Pro Ala Thr Asn Gly Ser Pro Ser Ser Ser Ser Ser Pro 20 25 30 Ser Ser Ser Ile Lys Arg Lys 35 <210> 19 <211> 11 <212> PRT <213> Artificial <220> <223> cytosolic tail GS1 <400> 19 Met Arg Gly Tyr Lys Phe Cys Cys Asp Phe Arg 1 5 10 <210> 20 <211> 39 <212> PRT <213> Artificial <220> <223> cytosolic tail GS1 <400> 20 Met Gly Val Phe Ser Asn Leu Arg Gly Pro Lys Ile Gly Leu Thr His 1 5 10 15 Glu Glu Leu Pro Val Val Ala Asn Gly Ser Thr Ser Ser Ser Ser Ser 20 25 30 Pro Ser Ser Phe Lys Arg Lys 35 <210> 21 <211> 12 <212> PRT <213> Artificial <220> <223> cytosolic tail GS1 <400> 21 Met Leu Val Met Pro Gln Pro Pro Lys Pro Phe Asn 1 5 10 <210> 22 <211> 29 <212> PRT <213> Artificial <220> <223> cytosolic tail GS1 <400> 22 Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg 1 5 10 15 Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg 20 25 <210> 23 <211> 17 <212> PRT <213> Artificial <220> <223> cytosolic tail GS1 <400> 23 Met Ala Asn Leu Trp Lys Lys Gln Arg Leu Arg Asp Thr Gly Leu Cys 1 5 10 15 Arg <210> 24 <211> 166 <212> PRT <213> Artificial <220> <223> stem sequence GS3 <400> 24 Arg Ile Asn Leu Ala Arg Glu His Glu Val Glu Val Phe Lys Leu Asn 1 5 10 15 Glu Glu Val Ser Arg Leu Glu Gln Met Leu Glu Glu Leu Asn Gly Gly 20 25 30 Val Gly Asn Lys Pro Leu Lys Thr Leu Lys Asp Ala Pro Glu Asp Pro 35 40 45 Val Asp Lys Gln Arg Arg Gln Lys Val Lys Glu Ala Met Ile His Ala 50 55 60 Trp Ser Ser Tyr Glu Lys Tyr Ala Trp Gly Lys Asp Glu Leu Gln Pro 65 70 75 80 Arg Thr Lys Asp Gly Thr Asp Ser Phe Gly Gly Leu Gly Ala Thr Met 85 90 95 Val Asp Ser Leu Asp Thr Leu Tyr Ile Met Gly Leu Asp Glu Gln Phe 100 105 110 Gln Lys Ala Arg Glu Trp Val Ala Ser Ser Leu Asp Phe Asp Lys Asp 115 120 125 Tyr Asp Ala Ser Met Phe Glu Thr Thr Ile Arg Val Val Gly Gly Leu 130 135 140 Leu Ser Ala Tyr Asp Leu Ser Gly Asp Lys Met Phe Leu Glu Lys Ala 145 150 155 160 Lys Asp Ile Ala Asp Arg 165 <210> 25 <211> 280 <212> PRT <213> Artificial <220> <223> stem sequence GS3 <400> 25 Thr Leu Phe His Phe Gly Val Pro Gly Pro Ile Ser Ser Arg Phe Leu 1 5 10 15 Thr Ser Arg Ser Asn Arg Ile Val Lys Pro Arg Lys Asn Ile Asn Arg 20 25 30 Arg Pro Leu Asn Asp Ser Asn Ser Gly Ala Val Val Asp Ile Thr Thr 35 40 45 Lys Asp Leu Tyr Asp Arg Ile Glu Phe Leu Asp Thr Asp Gly Gly Pro 50 55 60 Trp Lys Gln Gly Trp Arg Val Thr Tyr Lys Asp Asp Glu Trp Glu Lys 65 70 75 80 Glu Lys Leu Lys Ile Phe Val Val Pro His Ser His Asn Asp Pro Gly 85 90 95 Trp Lys Leu Thr Val Glu Glu Tyr Tyr Gln Arg Gln Ser Arg His Ile 100 105 110 Leu Asp Thr Ile Val Glu Thr Leu Ser Lys Asp Ser Arg Arg Lys Phe 115 120 125 Ile Trp Glu Glu Met Ser Tyr Leu Glu Arg Trp Trp Arg Asp Ala Ser 130 135 140 Pro Asn Lys Gln Glu Ala Leu Thr Lys Leu Val Lys Asp Gly Gln Leu 145 150 155 160 Glu Ile Val Gly Gly Gly Trp Val Met Asn Asp Glu Ala Asn Ser His 165 170 175 Tyr Phe Ala Ile Ile Glu Gln Ile Ala Glu Gly Asn Met Trp Leu Asn 180 185 190 Asp Thr Ile Gly Val Ile Pro Lys Asn Ser Trp Ala Ile Asp Pro Phe 195 200 205 Gly Tyr Ser Ser Thr Met Ala Tyr Leu Leu Arg Arg Met Gly Phe Glu 210 215 220 Asn Met Leu Ile Gln Arg Thr His Tyr Glu Leu Lys Lys Asp Leu Ala 225 230 235 240 Gln His Lys Asn Leu Glu Tyr Ile Trp Arg Gln Ser Trp Asp Ala Met 245 250 255 Glu Thr Thr Asp Ile Phe Val His Met Met Pro Phe Tyr Ser Tyr Asp 260 265 270 Ile Pro His Thr Cys Gly Pro Glu 275 280 <210> 26 <211> 183 <212> PRT <213> Artificial <220> <223> stem sequence GS3 <400> 26 Gln Thr Gln Ser Gln Tyr Ala Asp Arg Leu Ser Ser Ala Ile Glu Ser 1 5 10 15 Glu Asn His Cys Thr Ser Gln Met Arg Gly Leu Ile Asp Glu Val Ser 20 25 30 Ile Lys Gln Ser Arg Ile Val Ala Leu Glu Asp Met Lys Asn Arg Gln 35 40 45 Asp Glu Glu Leu Val Gln Leu Lys Asp Leu Ile Gln Thr Phe Glu Ser 50 55 60 Ala Leu Leu Ser Pro Met Pro Val Ala Ala Val Val Val Met Ala Cys 65 70 75 80 Ser Arg Ala Asp Tyr Leu Glu Arg Thr Val Lys Ser Val Leu Thr Tyr 85 90 95 Gln Thr Pro Val Ala Ser Lys Tyr Pro Leu Phe Ile Ser Gln Asp Gly 100 105 110 Ser Asp Gln Ala Val Lys Ser Lys Ser Leu Ser Tyr Asn Gln Leu Thr 115 120 125 Tyr Met Gln Ile Asn Glu Asp Glu Gly Ser Phe Ser Pro Phe Gln His 130 135 140 Leu Asp Phe Glu Pro Val Val Thr Glu Arg Pro Gly Glu Leu Thr Ala 145 150 155 160 Tyr Tyr Lys Ile Ala Arg Lys Asp Trp Phe Leu Phe Ser Leu Arg Pro 165 170 175 Ser Ser Ser Ile Thr Glu Thr 180 <210> 27 <211> 174 <212> PRT <213> Artificial <220> <223> stem sequence GS3 <400> 27 Arg Thr Ala Leu Asn Gly Ser Ser Ile Asp Asp Asp Leu Asp Gly Leu 1 5 10 15 Asp Lys Asp Leu Glu Ala Lys Leu Asn Ala Ser Leu Leu Ser Val Ala 20 25 30 Arg Gly Asn Arg Met Ser Leu Arg Leu His Arg Arg Asn His Phe Ser 35 40 45 Pro Arg Asn Thr Asp Leu Phe Pro Asp Leu Ala Lys Asp Arg Val Val 50 55 60 Ile Val Leu Tyr Val His Asn Arg Ala Gln Tyr Phe Arg Val Thr Val 65 70 75 80 Glu Ser Leu Ser Lys Val Lys Gly Ile Ser Glu Thr Leu Leu Ile Val 85 90 95 Ser His Asp Gly Tyr Phe Glu Glu Met Asn Arg Ile Val Glu Ser Ile 100 105 110 Lys Phe Cys Gln Val Lys Gln Ile Phe Ser Pro Tyr Ser Pro His Ile 115 120 125 Tyr Arg Thr Ser Phe Pro Gly Val Thr Leu Asn Asp Cys Lys Asn Lys 130 135 140 Gly Asp Glu Ala Lys Gly His Cys Glu Gly Asn Pro Asp Gln Tyr Gly 145 150 155 160 Asn His Arg Ser Pro Lys Ile Val Ser Leu Lys His His Trp 165 170 <210> 28 <211> 181 <212> PRT <213> Artificial <220> <223> stem sequence GS3 <400> 28 His Ser Ser Ser Phe Ser Pro Glu Gln Ser Gln Pro Pro His Ile Tyr 1 5 10 15 His Val Ser Val Asn Asn Gln Ser Ala Ile Gln Lys Pro Trp Pro Ile 20 25 30 Leu Pro Ser Tyr Leu Pro Trp Thr Pro Pro Gln Arg Asn Leu Pro Thr 35 40 45 Gly Ser Cys Glu Gly Tyr Phe Gly Asn Gly Phe Thr Lys Arg Val Asp 50 55 60 Phe Leu Lys Pro Arg Ile Gly Gly Gly Gly Glu Gly Ser Trp Phe Arg 65 70 75 80 Cys Phe Tyr Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Arg Asn 85 90 95 Leu Arg Met Val Pro Asp Arg Ile Val Met Ser Arg Gly Gly Glu Lys 100 105 110 Leu Glu Glu Val Met Gly Arg Lys Glu Glu Glu Glu Leu Pro Ala Phe 115 120 125 Arg Gln Gly Ala Phe Glu Val Ala Glu Glu Val Ser Ser Arg Leu Gly 130 135 140 Phe Lys Arg His Arg Arg Phe Gly Gly Gly Glu Gly Gly Ser Ala Val 145 150 155 160 Ser Arg Arg Leu Val Asn Asp Glu Met Leu Asn Glu Tyr Met Gln Glu 165 170 175 Gly Gly Ile Asp Arg 180 <210> 29 <211> 150 <212> PRT <213> Artificial <220> <223> stem sequence GS3 <400> 29 Arg Leu Asp Asn Ala Ser Leu Val Asp Thr Leu Thr His Phe Phe Thr 1 5 10 15 Lys Ser Ser Ser Asp Leu Lys Val Gly Ser Gly Ile Glu Lys Cys Gln 20 25 30 Glu Trp Leu Glu Arg Val Asp Ser Val Thr Tyr Ser Arg Asp Phe Thr 35 40 45 Lys Asp Pro Ile Phe Ile Ser Gly Ser Asn Lys Asp Phe Lys Ser Cys 50 55 60 Ser Val Asp Cys Val Met Gly Phe Thr Ser Asp Lys Lys Pro Asp Ala 65 70 75 80 Ala Phe Gly Leu Ser His Gln Pro Gly Thr Leu Ser Ile Ile Arg Ser 85 90 95 Met Glu Ser Ala Gln Tyr Tyr Gln Glu Asn Asn Leu Ala Gln Ala Arg 100 105 110 Arg Lys Gly Tyr Asp Ile Val Met Thr Thr Ser Leu Ser Ser Asp Val 115 120 125 Pro Val Gly Tyr Phe Ser Trp Ala Glu Tyr Asp Ile Met Ala Pro Val 130 135 140 Gln Pro Lys Thr Glu Lys 145 150 <210> 30 <211> 205 <212> PRT <213> Artificial <220> <223> stem sequence GS3 <400> 30 Leu Glu Phe Pro Ser Ala Ser Thr Ser Met Glu His Ser Ile Asp Pro 1 5 10 15 Glu Pro Lys Leu Ser Asp Ser Thr Ser Asp Pro Phe Ser Asp Val Leu 20 25 30 Val Ala Tyr Lys Lys Trp Asp Phe Glu Val Gly Cys Ala Arg Phe Arg 35 40 45 Glu Asn His Lys Asp Ala Ile Leu Gly Asn Val Ser Ser Gly Ser Leu 50 55 60 Gln Glu Phe Gly Cys Gly Lys Leu Lys Met Lys His Val Lys Val Leu 65 70 75 80 Val Lys Gly Trp Thr Trp Ile Pro Asp Asn Leu Glu Asn Leu Tyr Ser 85 90 95 Cys Arg Cys Gly Met Thr Cys Leu Trp Thr Lys Ser Ser Val Leu Ala 100 105 110 Asp Ser Pro Asp Ala Leu Leu Phe Glu Thr Thr Thr Pro Pro Leu Gln 115 120 125 Arg Arg Val Gly Asp Pro Leu Arg Val Tyr Met Glu Leu Glu Ala Gly 130 135 140 Arg Lys Arg Ser Gly Arg Glu Asp Ile Phe Ile Ser Tyr His Ala Lys 145 150 155 160 Asp Asp Val Gln Thr Thr Tyr Ala Gly Ser Leu Phe His Asn Asn Arg 165 170 175 Asn Tyr His Ile Ser Pro His Lys Asn Asn Asp Val Leu Val Tyr Trp 180 185 190 Ser Ser Ser Arg Cys Leu Pro His Arg Asp Arg Leu Ala 195 200 205 <210> 31 <211> 150 <212> PRT <213> Artificial <220> <223> stem sequence GS3 <400> 31 Arg Leu Asp Lys Val Ala Leu Val Asp Thr Leu Thr Asp Phe Phe Thr 1 5 10 15 Gln Ser Pro Ser Leu Ser Gln Ser Pro Pro Ala Arg Ser Asp Arg Lys 20 25 30 Lys Ile Gly Leu Phe Thr Asp Arg Ser Cys Glu Glu Trp Leu Met Arg 35 40 45 Glu Asp Ser Val Thr Tyr Ser Arg Asp Phe Thr Lys Asp Pro Ile Phe 50 55 60 Ile Ser Gly Gly Glu Lys Asp Phe Gln Trp Cys Ser Val Asp Cys Thr 65 70 75 80 Phe Gly Asp Ser Ser Gly Lys Thr Pro Asp Ala Ala Phe Gly Leu Gly 85 90 95 Gln Lys Pro Gly Thr Leu Ser Ile Ile Arg Ser Met Glu Ser Ala Gln 100 105 110 Tyr Tyr Pro Glu Asn Asp Leu Ala Gln Ala Arg Arg Arg Gly Tyr Asp 115 120 125 Ile Val Met Thr Thr Ser Leu Ser Ser Asp Val Pro Val Gly Tyr Phe 130 135 140 Ser Trp Ala Glu Tyr Asp 145 150 <210> 32 <211> 49 <212> PRT <213> Artificial <220> <223> GS1-GS2-GS3 <400> 32 Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg 1 5 10 15 Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg Leu Ala Leu 20 25 30 Leu Phe Ile Val Phe Val Cys Val Ser Phe Val Phe Trp Asp Arg Gln 35 40 45 Thr <210> 33 <211> 99 <212> PRT <213> Artificial <220> <223> GS1-GS2-GS3 <400> 33 Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg 1 5 10 15 Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg Leu Ala Leu 20 25 30 Leu Phe Ile Val Phe Val Cys Val Ser Phe Val Phe Trp Asp Arg Gln 35 40 45 Thr Leu Val Arg Glu His Gln Val Glu Ile Ser Glu Leu Gln Lys Glu 50 55 60 Val Thr Asp Leu Lys Asn Leu Val Asp Asp Leu Asn Asn Lys Gln Gly 65 70 75 80 Gly Thr Ser Gly Lys Thr Asp Leu Gly Arg Lys Ala Thr Lys Ser Ser 85 90 95 Lys Asp Val <210> 34 <211> 22 <212> PRT <213> Artificial <220> <223> GS1-GS2-GS3 <400> 34 Met Ala Ala Ala Leu Ala Leu Leu Phe Ile Val Phe Val Cys Val Ser 1 5 10 15 Phe Val Phe Trp Asp Arg 20 <210> 35 <211> 68 <212> PRT <213> Artificial <220> <223> GS1-GS2-GS3 <400> 35 Met Gly Val Phe Ser Asn Leu Arg Gly Pro Arg Ala Gly Ala Thr His 1 5 10 15 Asp Glu Phe Pro Ala Thr Asn Gly Ser Pro Ser Ser Ser Ser Ser Pro 20 25 30 Ser Ser Ser Ile Lys Arg Lys Leu Ser Asn Leu Leu Pro Leu Cys Val 35 40 45 Ala Leu Val Val Ile Ala Glu Ile Gly Phe Leu Gly Arg Leu Asp Lys 50 55 60 Val Ala Thr Ser 65 <210> 36 <211> 38 <212> PRT <213> Artificial <220> <223> GS1-GS2-GS3 <400> 36 Met Arg Gly Tyr Lys Phe Cys Cys Asp Phe Arg Tyr Leu Leu Ile Leu 1 5 10 15 Ala Ala Val Ala Phe Ile Tyr Ile Gln Met Arg Leu Phe Ala Thr Gln 20 25 30 Ser Glu Tyr Ala Asp Arg 35 <210> 37 <211> 68 <212> PRT <213> Artificial <220> <223> GS1-GS2-GS3 <400> 37 Met Gly Val Phe Ser Asn Leu Arg Gly Pro Lys Ile Gly Leu Thr His 1 5 10 15 Glu Glu Leu Pro Val Val Ala Asn Gly Ser Thr Ser Ser Ser Ser Ser 20 25 30 Pro Ser Ser Phe Lys Arg Lys Val Ser Thr Phe Leu Pro Ile Cys Val 35 40 45 Ala Leu Val Val Ile Ile Glu Ile Gly Phe Leu Cys Arg Leu Asp Asn 50 55 60 Ala Ser Thr Ser 65 <210> 38 <211> 41 <212> PRT <213> Artificial <220> <223> GS1-GS2-GS3 <400> 38 Met Leu Val Met Pro Gln Pro Pro Lys Pro Phe Asn Thr Ile Thr Ile 1 5 10 15 Thr Ile Met Ile Ala Phe Thr Phe Phe Leu Leu Phe Leu Thr Gly Phe 20 25 30 Leu Gln Phe Pro Ser Ile Ser Pro Ser 35 40 <210> 39 <211> 106 <212> PRT <213> Artificial <220> <223> GS1-GS2-GS3 <400> 39 Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg 1 5 10 15 Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg Leu Ala Leu 20 25 30 Leu Phe Ile Val Phe Val Cys Val Ser Phe Val Phe Trp Cys Val Ser 35 40 45 Phe Val Phe Trp Asp Arg Gln Thr Leu Val Arg Glu His Gln Val Glu 50 55 60 Ile Ser Glu Leu Gln Lys Glu Val Thr Asp Leu Lys Asn Leu Val Asp 65 70 75 80 Asp Leu Asn Asn Lys Gln Gly Gly Thr Ser Gly Lys Thr Asp Leu Gly 85 90 95 Arg Lys Ala Thr Lys Ser Ser Lys Asp Val 100 105 <210> 40 <211> 72 <212> DNA <213> Artificial <220> <223> primer <400> 40 gatccttggg aatgcttgct ctgctcttca tcgttttcgt ttgtgtctct ttcgttttct 60 gggaccgtca aa 72 <210> 41 <211> 72 <212> DNA <213> Artificial <220> <223> primer <400> 41 ctagtttgac ggtcccagaa aacgaaagag acacaaacga aaacgatgaa gagcagagca 60 agcattccca ag 72 <210> 42 <211> 81 <212> DNA <213> Artificial <220> <223> primer <400> 42 gatccttggg aatggctgct gctcttgctc tgctcttcat cgttttcgtt tgtgtctctt 60 tcgttttctg ggaccgtcaa a 81 <210> 43 <211> 81 <212> DNA <213> Artificial <220> <223> primer <400> 43 ctagtttgac ggtcccagaa aacgaaagag acacaaacga aaacgatgaa gagcagagca 60 agagcagcag ccattcccaa g 81 <210> 44 <211> 28 <212> DNA <213> Artificial <220> <223> primer <400> 44 ggtcactagt atcttcattt ccgagttg 28 <210> 45 <211> 31 <212> DNA <213> Artificial <220> <223> primer <400> 45 ggtcactagt gcgatctgca tattctgact g 31 <210> 46 <211> 31 <212> DNA <213> Artificial <220> <223> primer <400> 46 aacgtctaga atgagagggt acaagttttg c 31 <210> 47 <211> 29 <212> DNA <213> Artificial <220> <223> primer <400> 47 cggggtaccc catgaccgga gctagccgt 29 <210> 48 <211> 24 <212> DNA <213> Artificial <220> <223> primer <400> 48 gactagaaaa ggagtgataa ccct 24 <210> 49 <211> 35 <212> DNA <213> Artificial <220> <223> primer <400> 49 cggggtaccc catgaaatca tcatcattat ctccc 35 <210> 50 <211> 51 <212> PRT <213> Artificial <220> <223> cytosolic tail sequence (GCSI ER signal) <400> 50 Met Thr Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile Lys Ser Ser 1 5 10 15 Ser Leu Ser Pro Gly Ser Asp Glu Gly Ser Ala Tyr Pro Pro Ser Ile 20 25 30 Arg Arg Gly Lys Gly Lys Glu Leu Val Ser Ile Gly Ala Phe Lys Thr 35 40 45 Asn Leu Lys 50 <210> 51 <211> 41 <212> PRT <213> Artificial <220> <223> cytosolic tail sequence (human GCSI ER targeting) <400> 51 Met Ala Arg Gly Glu Arg Arg Arg Arg Ala Val Pro Ala Glu Gly Val 1 5 10 15 Arg Thr Ala Glu Arg Ala Ala Arg Gly Gly Pro Gly Arg Arg Asp Gly 20 25 30 Arg Gly Gly Gly Pro Arg Ser Thr Ala 35 40 <210> 52 <211> 39 <212> PRT <213> Artificial <220> <223> cytosolic tail sequence <400> 52 Met Ala Arg Gly Glu Arg Arg Arg Arg Ala Ala Ala Ala Glu Gly Ala 1 5 10 15 Arg Pro Leu Glu Arg Ala Arg Ala Ala Gly Arg Arg Asp Gly Arg Ala 20 25 30 Gly Gly Ala Arg Gly Ser Ala 35 <210> 53 <211> 36 <212> PRT <213> Artificial <220> <223> cytosolic tail sequence <400> 53 Met Ala Arg Gly Glu Arg Arg Arg Arg Gly Ala Pro Val Asp Gly Ala 1 5 10 15 Arg Thr Ala Glu Arg Ala Ala Arg Gly Gly Pro Ala Arg Arg Gly Gly 20 25 30 Glu Ala Arg Gly 35 <210> 54 <211> 42 <212> PRT <213> Artificial <220> <223> cytosolic tail sequence <400> 54 Met Ala Ala Arg Thr Arg Ile Ala Asp Ser Gly Gly Gly Ala Arg Ser 1 5 10 15 Arg Glu Thr Lys Thr Lys Pro Lys Ser Gly Asn Gly Ala Gln Ser Arg 20 25 30 Asn Asn Glu Thr Gln Ser Ser Ser Lys Asn 35 40 <210> 55 <211> 39 <212> PRT <213> Artificial <220> <223> cytosolic tail sequence <400> 55 Met Gly Arg Arg Arg Lys Arg Val Ala Thr Gly Asp Gly Val Pro Ser 1 5 10 15 Pro Arg Lys Glu Glu Lys Ala Pro Ala Pro Pro Arg Lys Glu Lys Lys 20 25 30 Lys Lys Thr Asp Ile Gly Lys 35 <210> 56 <211> 37 <212> PRT <213> Artificial <220> <223> cytosolic tail sequence <400> 56 Met Ala Arg Gln Arg Arg Thr Gln Gly Ala Ala Asp Pro Asn Lys Gly 1 5 10 15 Thr Asn Ser Ser Ser Ser Asn Gly Ser Asn Ser Thr Asn Asn Arg Ser 20 25 30 Ser Lys Ser Thr Ser 35 <210> 57 <211> 51 <212> PRT <213> Artificial <220> <223> cytosolic tail sequence <400> 57 Met Ala Lys Lys Lys Val Pro Arg Glu Lys Asn His Ser Gly Gly Thr 1 5 10 15 Thr Arg Arg Thr Ser Glu Ser Ser Ser Asn Asn His Ala Asp Ser Lys 20 25 30 Arg Gln Ile Arg Ile Lys Leu Asn Glu Lys Arg Lys Arg Gln Glu Pro 35 40 45 Gly Ser Lys 50 <210> 58 <211> 46 <212> PRT <213> Artificial <220> <223> cytosolic tail sequence <400> 58 Met His Arg Glu His Glu Glu Met His Gln Pro Ser Arg Arg Arg Arg 1 5 10 15 Pro Pro Arg Glu Val Glu Arg Pro Ser Ala Thr Ile Arg Tyr Glu Pro 20 25 30 Val Ala Glu Pro Glu Pro Trp Cys Ser Phe Cys Ser Trp Asp 35 40 45 <210> 59 <211> 62 <212> PRT <213> Artificial <220> <223> cytosolic tail sequence <400> 59 Met Ser Gly Gly Gly Gly Ser Ser Ser Val Arg Arg Pro Val Ala Ala 1 5 10 15 Ala Arg Ser Arg Ser Gly Pro Glu Pro Asp Ala Arg Arg Ala Ala Ala 20 25 30 Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Arg Arg Arg Gly Arg Gly 35 40 45 Asp His Gly Pro Leu Arg Leu Met Glu Val Ser Pro Arg Asn 50 55 60 <210> 60 <211> 11 <212> PRT <213> Artificial <220> <223> cytosolic tail sequence <400> 60 Met Ala Pro Pro Pro Pro Arg Gln Pro Arg Gln 1 5 10 <210> 61 <211> 42 <212> PRT <213> Artificial <220> <223> cytosolic tail sequence <400> 61 Met Ser Ile Leu Asn Ile Ser Ile Thr Val Leu Cys Ile Ala Ile Ala 1 5 10 15 Thr Trp Phe Ser Tyr Lys Gly Tyr Leu Glu Thr Arg Val Asn Thr Pro 20 25 30 Tyr Asp Ile Lys Lys Leu Val Thr Ile Ser 35 40 <210> 62 <211> 18 <212> PRT <213> Artificial <220> <223> cytosolic domain <400> 62 Met Thr Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile Lys Ser Ser 1 5 10 15 Ser Leu <210> 63 <211> 7 <212> PRT <213> Artificial <220> <223> cytosolic domain - SEQ ID NO: 64 - SEQ ID NO: 2 <400> 63 Met Ile Lys Ser Ser Ser Leu 1 5 <210> 64 <211> 16 <212> PRT <213> Artificial <220> <223> elongated cytosolic domain - SEQ ID NO: 2 <400> 64 Met Ala Arg Gly Glu Arg Arg Arg Arg Ala Ile Lys Ser Ser Ser Leu 1 5 10 15 <210> 65 <211> 14 <212> PRT <213> Artificial <220> <223> cytosolic domain <400> 65 Met Thr Ala Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile 1 5 10 <210> 66 <211> 18 <212> PRT <213> Artificial <220> <223> cytosolic domain <400> 66 Met Thr Gly Ala Ser Ala Ala Ser Ala Ala Gly Ala Ile Lys Ser Ser 1 5 10 15 Ser Leu <210> 67 <211> 18 <212> PRT <213> Artificial <220> <223> cytosolic domain <400> 67 Met Thr Gly Ala Ser Leu Leu Ser Ala Leu Gly Leu Ile Lys Ser Ser 1 5 10 15 Ser Leu <210> 68 <211> 18 <212> PRT <213> Artificial <220> <223> cytosolic domain <400> 68 Met Thr Gly Ala Ser Leu Leu Ser Ala Arg Gly Arg Ile Lys Ser Ser 1 5 10 15 Ser Leu <210> 69 <211> 18 <212> PRT <213> Artificial <220> <223> cytosolic domain <400> 69 Met Thr Gly Ala Ser Arg Arg Ser Ala Leu Gly Leu Ile Lys Ser Ser 1 5 10 15 Ser Leu <210> 70 <211> 4 <212> PRT <213> Artificial <220> <223> arginine motif sequence <220> <221> MISC_FEATURE <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <400> 70 Arg Xaa Xaa Arg 1 <210> 71 <211> 5 <212> PRT <213> Unknown <220> <223> arginine motif sequence <220> <221> MISC_FEATURE <222> (2)..(4) <223> Xaa can be any naturally occurring amino acid <400> 71 Arg Xaa Xaa Xaa Arg 1 5 <210> 72 <211> 4 <212> PRT <213> Artificial <220> <223> arginine motif sequence <220> <221> MISC_FEATURE <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <400> 72 Arg Xaa Xaa Lys 1 <210> 73 <211> 5 <212> PRT <213> Artificial <220> <223> arginine motif sequence <220> <221> MISC_FEATURE <222> (2)..(4) <223> Xaa can be any naturally occurring amino acid <400> 73 Arg Xaa Xaa Xaa Lys 1 5 <210> 74 <211> 4 <212> PRT <213> Artificial <220> <223> arginine motif sequence <220> <221> MISC_FEATURE <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <400> 74 Lys Xaa Xaa Arg 1 <210> 75 <211> 5 <212> PRT <213> Artificial <220> <223> arginine motif sequence <220> <221> MISC_FEATURE <222> (2)..(4) <223> Xaa can be any naturally occurring amino acid <400> 75 Lys Xaa Xaa Xaa Arg 1 5 <210> 76 <211> 7 <212> PRT <213> Artificial <220> <223> arginine motif sequence <220> <221> MISC_FEATURE <222> (3)..(4) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa can be any naturally occurring amino acid <400> 76 Arg Arg Xaa Xaa Arg Xaa Arg 1 5 <210> 77 <211> 7 <212> PRT <213> Artificial <220> <223> arginine motif sequence <220> <221> MISC_FEATURE <222> (3)..(4) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa can be any naturally occurring amino acid <400> 77 Arg Lys Xaa Xaa Arg Xaa Arg 1 5 <210> 78 <211> 7 <212> PRT <213> Artificial <220> <223> arginine motif sequence <220> <221> MISC_FEATURE <222> (3)..(4) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa can be any naturally occurring amino acid <400> 78 Arg Arg Xaa Xaa Arg Xaa Lys 1 5 <210> 79 <211> 7 <212> PRT <213> Artificial <220> <223> arginine motif sequence <220> <221> MISC_FEATURE <222> (3)..(4) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa can be any naturally occurring amino acid <400> 79 Arg Arg Xaa Xaa Lys Xaa Arg 1 5 <210> 80 <211> 7 <212> PRT <213> Artificial <220> <223> arginine motif sequence <220> <221> MISC_FEATURE <222> (3)..(4) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa can be any naturally occurring amino acid <400> 80 Lys Arg Xaa Xaa Arg Xaa Arg 1 5 <210> 81 <211> 7 <212> PRT <213> Artificial <220> <223> arginine motif sequence <220> <221> MISC_FEATURE <222> (3)..(4) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa can be any naturally occurring amino acid <400> 81 Lys Lys Xaa Xaa Arg Xaa Arg 1 5 <210> 82 <211> 7 <212> PRT <213> Artificial <220> <223> arginine motif sequence <220> <221> MISC_FEATURE <222> (3)..(4) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa can be any naturally occurring amino acid <400> 82 Arg Arg Xaa Xaa Lys Xaa Lys 1 5 <210> 83 <211> 7 <212> PRT <213> Artificial <220> <223> arginine motif sequence <220> <221> MISC_FEATURE <222> (3)..(4) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa can be any naturally occurring amino acid <400> 83 Arg Lys Xaa Xaa Lys Xaa Arg 1 5 <210> 84 <211> 7 <212> PRT <213> Artificial <220> <223> arginine motif sequence <220> <221> MISC_FEATURE <222> (3)..(4) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa can be any naturally occurring amino acid <400> 84 Arg Lys Xaa Xaa Arg Xaa Lys 1 5 <210> 85 <211> 4 <212> PRT <213> Artificial <220> <223> arginine motif sequence <400> 85 Arg Arg Arg Arg 1 <210> 86 <211> 4 <212> PRT <213> Artificial <220> <223> arginine motif sequence <400> 86 Arg Lys Arg Arg 1 <210> 87 <211> 4 <212> PRT <213> Artificial <220> <223> arginine motif sequence <400> 87 Arg Arg Lys Arg 1 <210> 88 <211> 4 <212> PRT <213> Artificial <220> <223> arginine motif sequence <400> 88 Arg Arg Arg Lys 1 <210> 89 <211> 4 <212> PRT <213> Artificial <220> <223> arginine motif sequence <400> 89 Arg Arg Lys Lys 1 <210> 90 <211> 4 <212> PRT <213> Artificial <220> <223> arginine motif sequence <400> 90 Arg Lys Lys Arg 1 <210> 91 <211> 4 <212> PRT <213> Artificial <220> <223> arginine motif sequence <400> 91 Lys Lys Arg Arg 1 <210> 92 <211> 38 <212> DNA <213> Artificial <220> <223> primer <400> 92 gactctagag cgggaagatg aggcttcggg agccgctc 38 <210> 93 <211> 58 <212> DNA <213> Artificial <220> <223> primer <400> 93 aaggcctacg ctacttgtca tcgtcatctt tgtagtcgca cggtgtcccg aagtccac 58 <210> 94 <211> 35 <212> DNA <213> Artificial <220> <223> primer <400> 94 atcgaaatcg cacgatgaga gggtacaagt tttgc 35 <210> 95 <211> 35 <212> DNA <213> Artificial <220> <223> primer <400> 95 cccatgatgc gatctgcata ttctgactgt gtcgc 35 <210> 96 <211> 29 <212> DNA <213> Artificial <220> <223> primer <400> 96 ggactagtgc actgtcgctg cccgcctgc 29 <210> 97 <211> 58 <212> DNA <213> Artificial <220> <223> primer <400> 97 aaggcctacg ctacttgtca tcgtcatctt tgtagtcgca cggtgtcccg aagtccac 58 <210> 98 <211> 18 <212> PRT <213> Artificial <220> <223> cytosolic domain <400> 98 Met Thr Gly Ala Ser Leu Arg Ser Ala Arg Gly Leu Ile Lys Ser Ser 1 5 10 15 Ser Leu <210> 99 <211> 18 <212> PRT <213> Artificial <220> <223> cytosolic domain <400> 99 Met Thr Gly Ala Ser Leu Arg Ser Ala Leu Gly Arg Ile Lys Ser Ser 1 5 10 15 Ser Leu <210> 100 <211> 18 <212> PRT <213> Artificial <220> <223> cytosolic domain <400> 100 Met Thr Gly Ala Ser Arg Leu Ser Ala Arg Gly Leu Ile Lys Ser Ser 1 5 10 15 Ser Leu <210> 101 <211> 18 <212> PRT <213> Artificial <220> <223> cytosolic domain <400> 101 Met Thr Gly Ala Ser Arg Leu Ser Ala Leu Gly Arg Ile Lys Ser Ser 1 5 10 15 Ser Leu <210> 102 <211> 39 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 1 <400> 102 atgaccggag ctagccgtcg gagcgcgcgt ggtcgaatc 39 <210> 103 <211> 30 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 2 <400> 103 atggctcggg gcgagcggcg gcgccgcgca 30 <210> 104 <211> 36 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 3 <400> 104 atgaatgatc gtagaccgca aaggaaacgc ccagca 36 <210> 105 <211> 147 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 4 <400> 105 tttcagggcg agcacaaaga gagcttatac tggggaactt atcgtcctca tgtttatttt 60 ggagttcgag ctagaactcc attgtccttg gtagctggct tgatgtggct tggtgtcaaa 120 gatgagatgt atgttatgcg gcatttc 147 <210> 106 <211> 150 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 5 <400> 106 ttccaaggag atcacaagga aagcttgtat tggggtacct acaggccgaa tgtatatctt 60 ggaattcgtg caagaacccc gttgtctcta attgctggga taatgtggat tggtgcaaag 120 aatgggcaat actttcttcg tcatgtttgc 150 <210> 107 <211> 148 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 6 <400> 107 tgaatctgac gcatcgctgc tctggggaac ataccgtcca caaatttact ttggccttcg 60 tcctcgtctt cccggatccc tcttaaccgg cctcgcttgg tttggcctac aagattacag 120 cgactttcag catattcgac atcagtgc 148 <210> 108 <211> 142 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 7 <400> 108 agaacgatct aatcgtctct tctggggtac ttatcgtcct ggaatttatt tcggtatgaa 60 acacagaagt cccatatctc ttttgtttgg agttatgtgg acagttcaag acgcagaaaa 120 ctttgccttc cgtcactcat gt 142 <210> 109 <211> 480 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 8 <400> 109 atgaccggag ctagccgtcg gagcgcgcgt ggtcgaatca aatcatcatc attatctccc 60 ggctccgatg aaggaagcgc ttatcctccg agtatccgcc gcggcaaagg caaggaactt 120 gtatcgatcg gtgctttcaa gacgaatctc aagatattgg ttgggttaat catattaggg 180 attatagtaa tctacttcgt aatcaatcgg ctagttcgtc acgggttgtt gtttgatgag 240 tcccagaagc ctagggttat cactcctttt cctgctccga aagtcatgga tttgtcaatg 300 tttcagggcg agcacaaaga gagcttatac tggggaactt atcgtcctca tgtttatttt 360 ggagttcgag ctagaactcc attgtccttg gtagctggct tgatgtggct tggtgtcaaa 420 gatgagatgt atgttatgcg gcatttctgt gaaaactctg atgatttaag tacatttggc 480 <210> 110 <211> 54 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 9 <400> 110 cttgctctgc tcttcatcgt tttcgtttgt gtctctttcg ttttctggga ccgt 54 <210> 111 <211> 69 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO:10 <400> 111 cggtacctcc tcatcttggc tgctgtcgcc ttcatctaca tacagatgcg gctttttgcg 60 acacagtca 69 <210> 112 <211> 54 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 11 <400> 112 ttagggattc tatttgctgt tactttgtct atagttctga tgttggtgtc tgta 54 <210> 113 <211> 60 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 12 <400> 113 atttttctgt atatgttact tctcaactct ctctttctca tcatctactt cgtttttcac 60 <210> 114 <211> 69 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 13 <400> 114 cgaaaattat cgaatttgtt accactctgc gttgctctgg tagttatcgc tgagatcggg 60 tttctgggt 69 <210> 115 <211> 69 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 14 <400> 115 cgtaaagtct cgaccttttt gccaatctgc gtggctcttg tcgtcattat cgagatcggg 60 ttcctctgt 69 <210> 116 <211> 75 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 15 <400> 116 ttcaacacaa tcaccatcac aatcatgata gctttcacct tcttcctcct cttcctcacc 60 ggtttcctcc aattc 75 <210> 117 <211> 60 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 16 <400> 117 aagcgtcttg ctctgctctt catcgttttc gtttgtgtct ctttcgtttt ctgggaccgt 60 <210> 118 <211> 87 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 17 <400> 118 atggcgagag ggagcagatc agtgggtagc agcagcagca aatggaggta ctgcaaccct 60 tcctattact tgaagcgccc aaagcgt 87 <210> 119 <211> 117 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 18 <400> 119 atgggtgttt tctcgaatct tcgaggaccc agagccggag ctacccacga tgaatttccg 60 gcgaccaatg gctctccttc gtcttcttct tctccatctt catcaatcaa gcgaaaa 117 <210> 120 <211> 32 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 19 <400> 120 atgagagggt acaagttttg ctgtgatttc cg 32 <210> 121 <211> 117 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 20 <400> 121 atgggtgttt tctccaatct tcgaggtcct aaaattggat tgacccatga agaattgcct 60 gtagtagcca atggctctac ttcttcttct tcgtctcctt cctctttcaa gcgtaaa 117 <210> 122 <211> 35 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 21 <400> 122 atgcttgtaa tgccacagcc acccaaaccc ttcaa 35 <210> 123 <211> 87 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 22 <400> 123 atggcgagag ggagcagatc agtgggtagc agcagcagca aatggaggta ctgcaaccct 60 tcctattact tgaagcgccc aaagcgt 87 <210> 124 <211> 50 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 23 <400> 124 atggcaaatc tttggaagaa gcagagattg agagatacag gtttatgtcg 50 <210> 125 <211> 499 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 24 <400> 125 tcgtattaat cttgcccgag aacatgaggt tgaagttttt aagctaaatg aagaagtttc 60 acggttggag cagatgttag aagagcttaa tggtggtgtt ggcaataagc ctttgaagac 120 tctgaaggat gccccagaag atccagttga taaacagcga aggcagaaag taaaagaggc 180 aatgatccat gcttggagct cttatgaaaa gtatgcatgg gggaaagatg agcttcagcc 240 tcggacaaaa gatggcactg atagctttgg tggccttgga gcaactatgg tagattcttt 300 agatacactc tatataatgg gtctagatga gcagtttcaa aaagccagag agtgggttgc 360 aagctcattg gatttcgaca aggattatga cgccagtatg tttgagacaa ccataagagt 420 tgtaggcgga cttcttagtg cgtatgatct ttctggggac aaaatgttcc ttgaaaaggc 480 taaggatatt gcagacaga 499 <210> 126 <211> 837 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 25 <400> 126 actctcttcc acttcggcgt accaggaccg atctcctcac gattccttac ctccagatcc 60 aatcggatcg tcaagccacg gaagaatatt aatcgccgac ccttaaacga ttccaattca 120 ggcgccgtcg ttgatatcac aactaaagat ctatacgata ggattgagtt tcttgataca 180 gatggtggtc catggaaaca aggttggaga gttacgtata aagacgatga gtgggagaaa 240 gagaagctca aaatcttcgt tgttcctcat tctcataacg atcctggttg gaaattgact 300 gtagaggagt attatcagag acaatccaga catattcttg acaccattgt tgagacttta 360 tctaaggatt caagaagaaa gtttatatgg gaggagatgt catatctgga gagatggtgg 420 agagacgctt cacctaataa acaagaagct ttgactaaat tggttaagga tgggcagcta 480 gagattgttg gaggtggctg ggttatgaat gatgaggcta attcacatta ttttgccata 540 attgaacaga tagcagaggg taatatgtgg ctgaatgaca caattggggt tattcctaag 600 aattcttggg ctatagatcc ctttggctat tcatcaacca tggcttatct tctccggcgt 660 atgggttttg aaaacatgct tattcaaagg actcattacg agctcaagaa agaccttgcc 720 cagcataaga atcttgaata tatttggcgt cagagctggg atgctatgga aaccacagat 780 atctttgttc atatgatgcc gttttattca tacgatatcc cacacacttg tggacca 837 <210> 127 <211> 550 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 26 <400> 127 ccagacgcaa tcacagtatg cagatcgcct cagttccgct atcgaatctg agaaccattg 60 cactagtcaa atgcgaggcc tcatagatga agttagcatc aaacagtcgc ggattgttgc 120 cctcgaagat atgaagaacc gccaggacga agaacttgtg cagcttaagg atctaatcca 180 gacgtttgaa agtgccttac tatcacctat gcctgtggct gctgtagtgg ttatggcctg 240 cagtcgtgca gactatcttg aaaggactgt taaatcagtt ttaacatatc aaactcccgt 300 tgcttcaaaa tatcctctat ttatatctca ggatggatct gatcaagctg tcaagagcaa 360 gtcattgagc tataatcaat taacatatat gcagataaat gaggatgaag gctcgttttc 420 cccttttcag cacttggatt ttgaaccagt ggtcactgaa aggcctggcg aactgactgc 480 gtactacaag attgcacgta aggactggtt tctcttttct ctgcgtccct ccagctccat 540 tactgaaaca 550 <210> 128 <211> 523 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 27 <400> 128 tagaactgct ttgaatggtt cttctattga cgatgatttg gatggtttag ataaagattt 60 ggaagctaag cttaatgctt cattgctaag tgtagctaga ggtaatagaa tgtctctaag 120 gttgcataga aggaaccatt tttcgcctag aaatacggat ctgttcccgg atttggcaaa 180 agatcgtgtg gttatcgtct tgtatgtgca taatcgggct cagtattttc gagtcacagt 240 ggaaagtttg tcgaaggtta aaggtataag tgagacattg ttgattgtta gtcatgatgg 300 ttactttgaa gagatgaata ggattgtgga gagtattaag ttttgtcaag tgaaacagat 360 tttctcgcct tattcgcctc atatatatcg tactagcttc ccgggtgtga ccctgaatga 420 ttgtaagaac aagggtgatg aggcaaaggg gcattgtgaa ggtaatcctg atcagtatgg 480 gaatcatcgg tctccgaaga ttgtatcttt gaagcatcac tgg 523 <210> 129 <211> 544 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 28 <400> 129 tcactcatcg tcgttttcac cggagcagtc acagcctcct catatatacc acgtttcagt 60 gaataaccaa tcggcgattc agaaaccgtg gccgatctta ccttcttacc tcccatggac 120 gccgccgcag aggaatctac caactggctc ctgcgaaggt tacttcggga atggatttac 180 aaagagagtt gacttcctta agccgaggat tggaggagga ggagaaggaa gctggttccg 240 atgtttttac agtgagacat tacagagttc gatttgtgaa ggaaggaatc tgagaatggt 300 tccggatcgg attgttatgt cgagaggagg tgagaagtta gaggaagtta tggggaggaa 360 agaggaggag gagcttcctg cgtttcgaca aggtgcgttt gaggtagcgg aagaggtttc 420 ttcacggtta ggttttaaga gacaccgtcg ttttggtgga ggagaaggag gtagtgcggt 480 ttctcggcgg ctggtgaatg atgagatgtt gaatgaatat atgcaagaag gtggaattga 540 taga 544 <210> 130 <211> 450 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 29 <400> 130 cggctcgata acgcttcttt ggtcgatacg ttaacccatt ttttcaccaa gtcgtcgtcc 60 gatttgaaag ttgggtcagg aatagagaaa tgccaggagt ggttagagag agtggattca 120 gttacttatt ctagagattt cactaaagat ccgattttta tctctggtag taacaaggac 180 ttcaaatcgt gctctgttga ttgtgtaatg ggattcactt cagataagaa acctgatgcg 240 gcttttggat taagtcatca acctggaaca ctcagtataa tccgttccat ggaatcagca 300 cagtattacc aagagaataa tcttgctcaa gcacgacgga aaggttatga tattgtgatg 360 acaactagtc tgtcatcaga tgttcctgtt gggtattttt catgggcgga atatgatatt 420 atggctccag tgcaaccaaa aacagagaaa 450 <210> 131 <211> 616 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 30 <400> 131 tttagaattc ccatctgctt caacttcgat ggagcattca atagacccgg aaccgaaatt 60 gtctgattca acatcggatc cattcagtga tgttcttgta gcttataaaa aatgggactt 120 tgaagtgggt tgtgctcggt ttagggagaa tcataaagat gcgattttgg gtaatgttag 180 ttcgggttct ttacaagaat ttggttgtgg taagcttaag atgaagcatg ttaaggtatt 240 ggttaaaggg tggacttgga ttccggataa tttggaaaat ttgtattctt gtcgttgtgg 300 gatgacttgt ttgtggacta aatcatcggt tttggctgat tcacctgatg ctttgttgtt 360 cgagacaaca actcctccac tacagagacg tgttggagat ccgctccgtg tgtacatgga 420 gctagaggcc ggaagaaaac gctcaggccg tgaagatata ttcatcagct accatgcgaa 480 agacgatgtc caaacaactt acgccggttc gctctttcat aataacagaa actatcacat 540 ctctccacat aaaaacaatg atgttctggt gtattggtct tcctcaagat gcctccctca 600 cagagatcgt ctagca 616 <210> 132 <211> 450 <212> DNA <213> Artificial <220> <223> nucleic sequence encoding SEQ ID NO: 31 <400> 132 cggctcgata aagtcgcttt ggttgatacg ttgactgatt tcttcaccca gtctccgtca 60 ctctcgcagt ctccaccggc gagatccgat cggaagaaga tcggattatt tactgatagg 120 agctgcgagg agtggttgat gagagaagat tcagttactt actctagaga ttttactaaa 180 gatccaattt ttatctctgg tggtgaaaag gactttcaat ggtgttctgt ggattgtaca 240 tttggagata gttcagggaa aacaccagat gctgcgtttg gattaggtca gaaacctgga 300 actcttagta taatacgttc catggaatca gcacagtatt atccagaaaa tgatcttgca 360 caggcacgac ggagaggtta tgatatagtg atgaccacta gtctatcatc agatgttcct 420 gttggatatt tttcgtgggc ggagtatgat 450

Claims

서열 번호 1 내지 서열 번호 31로 구성된 그룹으로부터 선택된 아미노산 서열.
제1항의 아미노산 서열 및 단백질을 포함하는 재조합 단백질로서,

상기 아미노산 서열은 상기 단백질의 C-말단 또는 N-말단 끝에 융합된 것임을 특징으로 하는 재조합 단백질.
제2항에 있어서,

상기 단백질은 효소, 항체 또는 그의 부분, 리포터 단백질, 재조합 단백질, 치료적 활성 단백질을 포함하는 그룹으로부터 선택되는 것을 특징으로 하는 재조합 단백질.
제2항에 있어서,

상기 단백질은 효소이고,

상기 효소는 글리코시다제(glycosidase), 글리코실 트랜스퍼라제(glycosyl transferases), 프로테아제(protease), 키나제(kinase), 디카르복실라제(decarboxylase), 에피머라제(epimerase), 뉴클레오티드-당 운반체를 포함하는 그룹으로부터 선택되는 것을 특징으로 하는 재조합 단백질.
제1항의 아미노산 서열 또는 제3항 또는 제4항의 재조합 단백질을 인코딩하는 핵산 서열.
제5항의 핵산 서열을 포함하는 핵산 벡터.
제1항에 따른 하나 이상의 아미노산 서열 및/또는 제3항 또는 제4항에 따른 하나 이상의 재조합 단백질 및/또는 제6항에 따른 하나 이상의 핵산 벡터를 포함하는 식물 세포.
제7항에 있어서,

상기 식물 세포는 제3항 또는 제4항에 따른 하나 이상의 단백질을 포함하고, 상기 단백질은 이종(heterologous) 단백질인 것을 특징으로 하는 식물 세포.
제1항에 따른 하나 이상의 아미노산 서열 및/또는 제3항 또는 제4항에 따른 하나 이상의 재조합 단백질 및/또는 제6항에 따른 하나 이상의 핵산 벡터를 포함하는 식물.
제9항에 있어서,

상기 식물은 제3항 또는 제4항에 따른 하나 이상의 단백질을 포함하고, 상기 단백질은 이종 단백질인 것을 특징으로 하는 식물.
제9항 또는 제10항에 있어서,

상기 식물은 알팔파(Alfalfa), 아라비도스프시스 탈리아나(Arabidospsis thaliana), 니코티아나 타바쿰(Nicotiana tabacum), 글라이신 맥스(Glycine max), 리코펄시콘 에스컬렌툼(Lycopersicon esculentum), 솔라넘 리코펄시쿰(Solanum lycopersicum)을 포함하는 그룹으로부터 선택되는 것을 특징으로 하는 식물.
번역 후 변형된 폴리펩타이드를 생산하는 방법으로서,

- 제6항에 따른 하나 이상의 핵산 벡터로 세포를 트랜스펙팅(transfecting)시키거나 형질전환 시키는 단계로서, 상기 벡터는 번역 후 변형되기 전 폴리펩타이드인 재조합 단백질 또는 상기 폴리펩타이드와 다른 재조합 단백질을 인코딩하는 단계;

- 트랜스펙팅된 세포를 키우는 단계; 및

- 번역 후 변형된 폴리펩타이드를 수확하는 단계를 포함하며;

상기 재조합 단백질이 상기 폴리펩타이드와 다른 경우 상기 방법은, 상기 폴리펩타이드를 인코딩하는 하나 이상의 핵산 벡터로 상기 세포를 트랜스펙팅하는 단계를 더 포함하는 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
제12항에 있어서,

상기 재조합 단백질은 번역 후 변형되기 전 폴리펩타이드인 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
제12항에 있어서,

상기 재조합 단백질은 상기 폴리펩타이드와 다르고, 상기 재조합 단백질은 상기 폴리펩타이드를 특정하게 인지하고 결합하는 항체 또는 그의 부분인 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
제12항에 있어서,

상기 재조합 단백질은 상기 폴리펩타이드와 다르고, 상기 재조합 단백질은 상기 폴리펩타이드의 번역 후 변형과 관련된 내생적(endogenous) 또는 이종 효소인 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
제12항에 있어서,

상기 재조합 단백질은 상기 폴리펩타이드와 다르고, 상기 재조합 단백질은 상기 폴리펩타이드의 번역 후 변형과 관련된 효소를 조정하는 항체 또는 그의 부분인 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
제12항 내지 제16항 중 어느 한 항에 있어서,

폴리펩타이드는 저장 단백질과 함께 공-발현(co-expressed)되는 것임을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
제12항 내지 제17항 중 어느 한 항에 있어서,

상기 펩타이드의 번역 후 변형은 소포체(ER) 및/또는 골지체(GA) 구획 막에서 수행되는 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
제12항 내지 제18항 중 어느 한 항에 있어서,

상기 번역 후 변형된 폴리펩타이드는 치료적 활성 단백질인 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
제12항 내지 제19항 중 어느 한 항에 있어서, 상기 세포는 식물 세포인 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.
제12항 내지 제20항 중 어느 한 항에 있어서,

상기 식물 세포는 메디카고 사티바(Medicago sativa), 아라비도스프시스 탈리아나(Arabidospsis thaliana), 니코티아나 타바쿰(Nicotiana tabacum), 글라이신 맥스(Glycine max), 리코펄시콘 에스컬렌툼(Lycopersicon esculentum), 솔라넘 리코펄시쿰(Solanum lycopersicum)을 포함하는 그룹으로부터 선택된 식물에 속하는 세포인 것을 특징으로 하는 번역 후 변형된 폴리펩타이드 생산 방법.