KR20070091156A

KR20070091156A - 단백질 제조

Info

Publication number: KR20070091156A
Application number: KR1020077014382A
Authority: KR
Inventors: 마리아 돌로레스 루데비드 무히카; 미리암 바스티다 비르히리; 블란카 롬파르트 로요; 파블로 마르사발 루나; 마르가리타 토렌트 쿠에트글라스
Original assignee: 에라 바이오테크, 에스.에이.
Priority date: 2004-11-29
Filing date: 2005-11-29
Publication date: 2007-09-07
Also published as: EP1819725A1; GB0426160D0; RU2429243C2; CA2589164A1; CA2589164C; CN101098886A; CN101098886B; US20060121573A1; KR101430081B1; US8822181B2; WO2006056483A1; AU2005308921B2; RU2007124369A; BRPI0517121A; EP1819725B1; JP2008521391A; AU2005308921A1; AR051837A1

Abstract

숙주 시스템들로서 고등 식물 외의 숙주 진핵 세포들 및 유기체들에서 재조합 단백질체 유사 조립체로서 발현되는 융합 단백질을 형성하는 방법이 개시된다. 특히, 펩티드들 및 단백질들이 재조합 단백질체 유사 조립체(RPBLA) 형성의 유도를 매개하는 단백질 서열들에 융합되어, 적절한 벡터로 형질 전환 후 이들 숙주 세포들에서 안정되게 발현 및 축적된다. 융합 단백질의 제조 방법들도 개시된다.

Description

단백질 제조{PRODUCTION OF PROTEINS}

본 발명은 숙주 시스템들로서 고등 식물 외의 진핵 세포들 및 유기체들에서 재조합 펩티드들 및 단백질들의 제조를 고려한 것이다. 보다 구체적으로, 펩티드들 및 단백질들이, 단백질체 유사 조립체 (recombinant protein body-like assemblies: RPBLA) 형성의 유도를 매개하는 단백질 서열에 융합되어, 적절한 벡터로 형질 전환 후 이들 숙주 시스템들에서 안정하게 발현 및 축적된다.

치료, 준의약식품 (nutraceutical) 또는 산업적 용도를 위한 재조합 단백질들의 제조는 지난 십 년간에 걸쳐 큰 성공을 누려왔다. 상이한 진핵 세포들 및 유기체들은 유효 단백질-기재의 치료제를 생산할 수 있는 것으로 나타났다. 유감스럽게도, 낮은 재조합 단백질 생산 수준 및/또는 단백질 단리 및 정제 절차들로 인해 종종 유발되는 높은 비용은 이들의 산업적 적용을 실효시킬 수 있다. 상이한 접근 방법들에 의하여, 제조 수준 및 정제 절차들을 모두 개선시키기 위한 연구가 활발히 이루어졌다.

식물 종자 저장 단백질 도메인(domain)과 관심 대상이 되는 단백질과의 융합에 기초한 신규 기술 (WO 2004/003207)이, 재조합 단백질들의 고등 식물들에서의 안정화 및 축적을 증가시키기 위해 개발되었다. 이들 저장 단백질들은 식물 종자 들에 특이적인 것으로, 이들은 단백질 체들에 안정하게 축적된다 (Galili 등, 1993, Trends Cell Biol 3:437-442).

저장 단백질들은 신호 펩티드를 거쳐 소포체 (ER)의 내강(lumen) 내로 삽입되고, ER-유도된 단백질체들 (ER-PBs)로 불리는 특이적 세포 소기관들을 발생시키는 그 소포체 내에서 또는 단백질 저장 액포 (PSV)에서 조립된다 (Okita 및 Rogers 1996 Annu. Rev. Plant Physiol Mol. Biol. 47: 327-50; Herman 및 Larkins 1999 Plant Cell 11:601-613; Sanderfoot 및 Raikel 1999 Plant Cell 11:629-642).

재조합 저장 단백질들은, 제노푸스 오오사이트들 (Xenopus oocytes) 및 효모와 같은 비-식물성 숙주 계들에서, PB-유사 세포 소기관들 내에서 조립되는 것으로도 기재되었다.

곡물 프롤라민들 (가장 많은 곡물 저장 단백질)의 발현이, 대응 mRNA들의 주입 후 제노푸스 오오사이트들에서 기재되었다. 이 계는 이들 저장 단백질들의 표적화(targeting) 성질들의 연구 (Simon 등, 1990, Plant Cell 2:941-950; Altschuler 등, 1993, Plant Cell 5:443-450; Torrent 등, 1994, Planta 192:512-518) 및 19 kDa α-제인, 즉 옥수수 프롤라민의 개질 가능성을, 필수 아미노산들인 리신 및 트립토판을 그의 안정성을 변경하지 않으면서 그 서열 내로 도입함에 의해 시험(Wallace 등, 1988, Science 240:662-664)하기 위한 모델로서 사용되어 왔다.

제인류, 즉 옥수수 프롤라민들의 복합군은, 각종 목적으로 효모에서도 제조되어 왔다. Coraggio 등 (1988, Eur J Cell Biol 47:165-172)은 이 단백질의 표적화 결정 인자들을 연구하기 위하여 효모에서 천연 및 개질된 α-제인들을 발현시켰 다. Kim 등 (2002, Plant Cell 14: 655-672)은 단백질체 형성을 이끄는 가능한 α-, β-, γ- 및 δ-제인 상호작용들을 연구하였다. 이러한 문제를 다루기 위해, 그들은 효모 세포들을 이들 단백질들을 암호화하는 cDNA들로 형질 전환하였다. 추가적으로, 이들 저자들은, 효모 세포들 중에서 제인 단백질들의 세포내 분포 위치(sucellular loclization)를 결정하기 위하여 제인-GFP 융합 단백질들을 구축하였다. 상기 효모 세포들은, 그 후 제인의 성질들을 연구하기 위한 모델 발현 시스템으로서 사용되었다. Kim 등(2002, Plant Cell 14: 655-672)이, 제인류 혼자서는 형질 전환된 효모 내에서 잘 축적되지 않기 때문에, 효모가 제인 상호작용을 연구하는데 양호한 모델이 아니라고 결정한 것에 유의할 필요가 있다. 효모 세포들은, 글리아딘이라고 하는 밀 저장 단백질들의 운반 및 단백질체 침적을 제어하는 메커니즘들을 연구하기 위한 모델로서도 사용되었다 (Rosenberg 등, 1993, Plant Physiol 102:61-69).

이제 본 발명자들은 재조합 단백질체 유사 조립체들(RPBLAs)의 유도를 매개하는 단백질 서열의 융합, 예로서 프롤라민 또는 프롤라민 도메인들과 관심 대상의 (표적) 펩티드 또는 단백질과의 융합이 진균 (효모 포함), 조류 및 동물과 같은 유기체들의 세포들 중에서 그러한 RPBLA들의 축적을 매개한다는 것을 보여준다. 흥미롭게도, 이들 융합 단백질들은 동물 세포들내에, 단백질체 유사 세포 소기관 구조들 내부에서 안정하게 축적된다.

발명의 개요

본 발명은 단백질체 유도 서열 (PBIS) 및 관심 대상의 펩티드 또는 단백질 (종종 집합적으로 여기에서 폴리펩티드로서 언급됨)을 함유하는 융합 단백질을, 고등 식물들 외의 진핵 세포들 중에서, 예로서 동물, 진균 및 조류에서 및 배양된 동물성, 진균 및 조류 세포들에서 제조하기 위한 계 및 방법을 제공하며, 여기에서 관심 대상의 펩티드 또는 단백질을 함유하는 융합 단백질들은 재조합 단백질체 유사 조립체들 (RPBLAs)로서 안정하게 축적된다. 상기 PBIS는 이들 세포 소기관들 내에서, RPBLA 형성 및 단백질, 예로서 관심 대상의 펩티드 또는 단백질 (표적들)을 갖는 천연 또는 개질된 저장 단백질 서열들의 도입 및/또는 축적의 유도를 매개할 수 있다.

본 발명은, 다른 것들 중, 관심 대상의 생성물을 융합 단백질의 형태로, PBIS를 코딩하는 핵산 부분 및 관심 대상의 폴리펩티드 생성물을 암호화하는 핵산 부분을 함유하는 핵산 서열로 형질 전환된 숙주 시스템으로서 고등 식물 외의 진핵 세포들 중에서 제조하는 방법을 제공한다.

특정 구현예에서, 형질 전환을 위해 사용된 상기 핵산 서열은 (i) PBIS를 코딩하는 핵산 서열, 및 (ii) 관심 대상의 생성물을 코딩하는 뉴클레오티드 서열을 함유하는 핵산 서열을 함유한다. 한 구현예에서, 핵산 서열 (i)의 3' 말단은 상기 핵산 서열 (ii)의 5' 말단에 연결된다. 또 다른 구현예에서, 핵산 서열 (i)의 5' 말단은 핵산 서열 (ii)의 3' 말단에 연결된다. 따라서, PBIS 서열은 융합 단백질의 N-말단 또는 C- 말단에 존재할 수 있다.

또 다른 특정 구현예에서, 형질 전환에 사용된 핵산 서열은, 상기 언급된 핵산 서열들 (i) 및 (ii)에 추가하여, 스페이서(spacer) 아미노산 서열을 코딩하는 뉴클레오티드 서열을 함유하는 핵산 서열을 함유한다. 상기 스페이서 아미노산 서열은, 효소적 또는 화학적 수단에 의해, 분할가능한 또는 분할가능하지 않은 아미노산 서열일 수 있다. 특정 구현예에서, 상기 핵산 서열 (iii)은 핵산 서열들 (i) 및 (ii) 사이에 위치되며, 예로서 핵산 서열 (iii)의 3' 말단은 상기 핵산 서열 (ii)의 5' 말단에 연결된다. 또 다른 구현예에서, 상기 핵산 서열 (iii)의 5' 말단은 핵산 서열 (ii)의 3' 말단에 연결된다.

또한, 특정 구현예에서, 형질 전환 목적을 위해 사용된 핵산 서열은 특이적으로 분할가능한 서열을 암호화하고, 이는 본 출원과 공동명의의(co-assigned) 특허 출원 WO 2004003207 에 따라 정의된 바와 같다. 또한, 다른 구현예에서, 상기 핵산은 특허 출원 WO 2004003207에 일치하며, 여기에서 상기 효소적 또는 화학적 수단에 의해 특이적으로 분할가능한 아미노산 서열을 코딩하는 핵산 서열은 부재한다. 다른 구현예에서, 상기 융합 단백질들은 PBIS와 관심 대상의 펩티드 또는 단백질 간의 직접 융합일 수 있다.

다른 구현예에서, 본 발명의 방법은 융합 단백질의 단리 및 정제를 더 포함한다.

또 다른 구현예에서, 관심 대상의 단백질은 천연 또는 개질된 저장 단백질, 예로서 천연 또는 개질된 프롤라민류 또는 프롤라민 도메인들에 융합된다. 관심 대상의 단백질들의 예들은 치료, 준의약적, 생체제어 또는 산업적 용도를 갖는 임의의 단백질을 포함한다. 예시적인 단백질들 및 펩티드들은, 예로서 칼시토닌, 성장 호르몬 등과 같은 호르몬, 단일 클론성 항체 및 그의 단편들과 같은 항체들, 인 간 면역결핍 바이러스 (HIV)에 대한 백신들에 유용한 것들과 같은 항원들; 간염 B 표면 또는 중심 단백질들, 위장염, 코로나 바이러스, 등, 프로테아제 억제제, 항생제, 콜라겐, 인간 락토페린, 사이토킨, 산업용 효소들 예로서 가수분해효소 (hydrolases), 글리코시다제 (glycosidases), 옥시도-리덕타제 (oxido-reductases) 등을 포함한다.

도면들은, 본 개시의 일부를 형성한다.

도 1은, 감마-제인-유도된 RX3 단백질체 유도 서열에 연결된, 관심 대상의 개별적인 단백질들로서 칼시토닌 (Ct), 인간 성장 호르몬 (hGH) 및 표피 성장 인자 (EGF)를 포함하는 융합 단백질들의, 형질 감염된 포유류 세포들 중에서의 축적을 나타내는 SDS/PAGE 분석 사진이다. 형질 감염된 293T, CHO 및 Cos1 배양된 포유류 세포들 중에서 축적된 융합 단백질들 RX3-Ct, RX3-hGH 및 RX3-EGF를 나타내었다. 동량의 형질 감염된 포유류 세포들을 형질 감염 후 44 시간 후 추출하고, 대응하는 총 가용성 단백질들을 전기영동 및 항-감마-제인 항체를 사용한 웨스턴 블롯 (western blot)에 의해 분석하였다. RX3-Ct, RX3-hGH 및 RX3-EGF 융합 단백질들을 코딩하는 구축물들의 개략적 표현들도 포함되어 있다. "c" = 세포들; "RX3" = 단일 펩티드가 없는 N-말단 프롤린-풍부 감마-제인 서열; "m" = 매질. 분자량 마커들 (kDa 단위)을 왼쪽에 나타내었다.

도 2는 형질 감염된 세포들 내의 RPBLAs 중의 융합 단백질들의 분포 위치를 나타내는 6 개의 패널들 (A-F)의 사진이다. 동일 초점 현미경법을 사용하여 RX3- CT 를 발현하는 Cos1 세포들 (도 2A), RX3-Ct (도 2B) 및 RX3-EGF (Fig. 2C)를 발현하는 CHO 세포들, 및 RX3-Ct 및 DsRed2-ER 마커 단백질을 공동 발현하는 293T 세포들(도 2D, 도 2E 및 도 2F)을 나타내었다. RX3-유도된 융합 단백질들은, 단백질체 유사 구조물들 (도 2A-2D) 중 및 소포체 (도 2A에서 화살표 참조) 중에서 항-감마-제인 혈청을 사용하여 면역위치확인되었다(immunolocalized). 도 2E 는 적색 형광 DsRed2-ER 단백질 마커를 사용하여 염색된 ER을 나타낸다. 도 2F 는 ER 및 PBLS 중에서 DsRed2 를 사용하여 RX3-Ct의 공동-분포 위치를 나타내는 도 2D 및 도 2E를 겹쳐놓은 것을 보여준다. 도 2A 및 2C에서의 삽입 사진은 PBLS의 고배율 이미지를 나타낸다. 막대 표시: 1 미크론.

두 개의 패널들로 (A 및 B) 나타낸 도 3은 형질 전환된 효모 세포들 중에서 융합 단백질들의 축적을 예시한다. 도 3A 는 형질 전환된 사카로마이세스(Saccharomyces) 중에서 RX3-EGF (c117 래인) 및 RX3-hGH (c118 래인) 융합 단백질들의 축적을 나타낸다. 세포들 및 매질들로부터의 동량의 총 단백질 추출물들을 특이적 항체들을 사용하여 면역블롯에 의해 분석하였다. 삽입 없이 pYX243 플라스미드로 형질 전환된 세포들을 대조군 (C)로서 사용하였다. 각 패널의 밑에 RX3-hGH 및 RX3-EGF 융합 단백질들을 코딩하는 구축물들의 개략적인 표시를 나타내었다.

도 3B는, 두 개의 상이한 신호 펩티드들을 사용함에 의한 피키아 파스토리스(Pichia pastoris) 중에서 hGH 및 RX3-hGH 함유 융합 단백질들의 축적을 예시한다. 형질 전환된 세포들 및 매질들로부터 동량의 총 단백질 추출물들을, 특이적 항체들을 사용하여 면역블롯에 의해 분석하였다. C1 및 C2 는, 대조군들로서 사용된 pPIC9 및 pPIC3.5K 플라스미드들로 각각 형질 전환된 세포들을 나타낸다. RX3-hGH 융합 단백질을 코딩하는 구축물들 c135 및 c121 및 hGH 를 코딩하는 구축물 c136의 개략적 표시들을 패널들의 밑에 나타내었다. 도의 왼편에 분자량 마커들 (kDa)을 나타내었다. "y" = 효모 세포들; "m" = 매질; "SPg" = 감마-제인으로부터의 단일 펩티드; "RX3" = 단일 펩티드 없는 N-말단 프롤린-풍부 감마-제인 서열; "EGF" = 표피 성장 인자; "hGH" = 인간 성장 호르몬; "Afprepro" = 알파 인자 프리프로 펩티드 (alfa factor prepro peptide).

본 발명은 몇 가지 잇점 및 장점들을 갖는다.

한 잇점은 이의 사용으로, 선택된 비-고등 식물 진핵 세포 중에서, 원하는 재조합 단백질의 상대적으로 간단하고 신속한 발현이 가능하다는 것이다.

본 발명의 한 장점은, RPBLAs 중에서의 발현으로 인해, 쉽게 수득가능하고 정제가능한 재조합 단백질원이 제공된다는 것이다.

추가의 잇점 및 장점들은 다음의 설명으로부터 당업자에게 명백할 것이다.

고려된 재조합 단백질들은 그를 발현하는 숙주 세포 중에서 재조합 단백질체 유사 조립체들 (RPBLAs)을 형성하는 융합 단백질들이다. 상기 RPBLA 형성은 세포들 내에서 고밀도 침적물들을 형성하는 저장 단백질 도메인들에 의해 유도된다. 이들 밀집된 침적물들은 세포질, 내막계 세포 소기관들, 미토콘드리아, 플라티즈(platids) 중에서 축적 또는 분비될 수 있다. 상기 재조합 단백질체 유사 조립체들은 상이한 융합 단백질들마다 상이할 수 있지만, 제조되는 특정 융합 단백질에 대해 알려진 예정된 밀도를 갖는다. RPBLAs 의 예정된 밀도는 전형적으로, 균질액 중에 존재하는 실질적으로 모든 내생의 숙주 세포 단백질들의 밀도보다 크며, 전형적으로 약 1.1 내지 약 1.35 g/ml 이다. 신규 RPBLAs 의 높은 밀도는 멀티머들(multimers)로서 조립 및 축적하는 재조합 융합 단백질들의 일반적 능력에 기인한다. 고려되는 RPBLAs는 비-고등 식물 진핵 생물들 중에서 발현되고, 상기 나타낸 것과 같이 그들의 밀도에 의해 전형적으로 특징화된다. 동물 세포들에서 발현될 때, RPBLAs 는 전형적으로 구형의 형태이며, 약 1 미크론 (μ)의 직경을 갖고 둘레의 막을 갖는다.

이들 융합 단백질들은 펩티드 결합에 의해 직접적으로 또는 간접적으로 함께 연결된 두 개의 폴리펩티드 서열들을 함유하며, 여기에서 하나의 서열은 관심 대상의 폴리펩티드 생성물 (예로서 펩티드 또는 단백질) (타겟)에 연결된 단백질체 유도 서열 (PBIS)의 서열이다. PBIS 는 세포 소기관들 중에서 RPBLA 형성의 유도 및 백질 도입 및/또는 축적의 유도를 매개하는 단백질 또는 펩티드 아미노산 서열들이다. PBIS 및 숙주 세포는 바람직하게는 상이한 생물학적 문(phyla)에 속한다. 즉, PBIS 는 전형적으로 고등 식물, 종자 식물로부터 유래하는 한편, 숙주 세포는 종자 식물을 제외하고, 동물 세포, 예로서 포유류 또는 곤충 세포들, 진균/효모, 또는 조류 세포일 수 있는 진핵 세포이고, 이들 모두는 종자 식물과 상이한 문이다. 예시적이고 비제한적인 PBIS의 예들은 저장 단백질들 또는 개질된 저장 단백질들, 예로서 프롤라민류 또는 개질 프롤라민류, 프롤라민 도메인들 또는 개질 프롤라민 도메인들을 포함한다. 프롤라민류는 Shewry 등, 2002 J. Exp . Bot . 53(370):947-958에서 검토되었다. 바람직한 PBIS 는 하기 나타낸 감마-제인, 알파-제인 또는 쌀 프롤라민과 같은 프롤라민 화합물들의 것들이다.

감마-제인, 즉 옥수수 저장 단백질은 (그의 DNA 및 아미노산 잔기 서열들을 이하에 나타내었음), 네 개의 옥수수 프롤라민들 중의 하나로, 옥수수 배유 중의 총 단백질의 10-15 퍼센트에 상당하다. 기타 곡물 프롤라민들로서, 알파- 및 감마-제인들이 조면 소포체의 세포질 쪽에서 막-결합된 폴리리보솜에서 생합성되고, 내강 내에서 조립된 후 소포체-유도된 단백질체들 내로 격리된다 (Herman 등, 1999 Plant Cell 11:601-613; Ludevid 등, 1984 Plant Mol . Biol . 3:277-234; Torrent 등, 1986 Plant Mol . Biol . 7:93-403).

감마-제인은 네 개의 특징적인 도메인들로 구성된다: i) 19 개의 아미노산들의 한 펩티드 신호; ii) 헥사펩티드 PPPVHL (서열 번호 1)의 8 단위를 함유하는 반복 도메인 (53aa), iii) 프롤린 잔기들이 다른 아미노산들과 번갈아 존재하는 ProX 도메인 (29aa) 및 iv) 소수성의 시스테인 풍부 C-말단 도메인 (111aa).

감마-제인의 소포체-유도된 RPBLAs 중에서 조합되는 능력은 종자들에 제한되지 않는다. 실제로, 감마-제인-유전자가 유전자이식된 (transgenic) 아기장대 (Arabidopsis) 식물들에서 구조적으로 발현되었을 때, 상기 저장 단백질은 잎 옆육 세포들에서 소포체-유도된 PBLS 내에 축적되었다 (Geli 등, 1994 Plant Cell 6:1911-1922). 소포체-유도된 단백질체들 내로의 감마-제인 침적의 원인이 되는 신호를 찾고자(프롤라민들은 KDEL 신호를 갖지 않는다), 세로 (tandem) 반복 도메인을 포함하는 프롤린 풍부한 N-말단 도메인이 ER 보유에 필요하다는 것과, C 말단 도메인이 단백질체들 형성에 연루되었다는 것이 증명되어 왔다. 그러나, 이들 도메인들이 단백질체 조립을 촉진하는 메카니즘은 여전히 알려지지 않았다.

단백질체들은 종자들에서만 그러한 명칭으로 불리는 것이 적절하기 때문에, 다른 식물 기관들 및 비-고등 식물들에서 제조된 유사 구조물들은 일반적으로 재조합 단백질체 유사 조립체들 (RPBLAs)로서 언급된다.

예시적인 기타 유용한 프롤라민-유형 서열들을 그들의 GenBank 표시와 함께 아래 표에 나타내었다.

단백질 명	GenBank ID
α-제인 (22kD)	M86591
알부민 (32kD)	X70153
β-제인 (14kD)	M13507
γ-제인 (27kD)	X53514
γ-제인 (50kd)	AF371263
δ-제인 (18kD)	AF371265
δ-제인 (10kD)	U25674
7S 글로불린 또는 비실린(Vicilin)형	NM 113163
11S 글로불린 또는 레규민(Legumin)형	DQ256294
프롤라민 13kD	AB016504
프롤라민 16kD	AY427574
프롤라민 10kD	AF294580

Altschul 등, 1997 Nucleic Acids Res. 25:3389-3402에 기재된 것과 같은, 모든 비-중복된 GenBank CDS 번역+PDB+SwissProt+PIR+PRF (환경 시료들 제외) 데이타베이스에서, 하기 나타낸 것들과 같은 질문(query)을 사용하여 BLAST 검색을 실시하여 추가의 유용한 서열들을 수득한다:

RX3 질문 서열 번호 2; 알파-제인 서열 번호 3 및 쌀 프롤라민 질문 서열 번호 4.

한 예시적인 개질 프롤라민은 (a) 신호 펩티드 서열, (b) 단백질 감마-제인의 반복 도메인 헥사펩티드 PPPVHL (서열 번호 1)의 하나 이상의 복제물들의 서열, (전체 도메인은 8 개의 헥사펩티드 단위들을 함유); 및 (c) 감마-제인의 ProX 도메인의 전체 또는 일부 서열을 포함한다. 예시적인 특정 개질 프롤라민들은, R3, RX3 및 P4 로서 하기에 나타낸 폴리펩티드들을 포함하며, 그의 DNA 및 아미노산 잔기 서열들도 하기에 나타내었다.

특히 바람직한 프롤라민들은 공개 출원 WO2004003207 호에 개시된 것과 같은 감마-제인 및 그의 성분 부분들, 즉 쌀 rP13 단백질 및 22 kDa 옥수수 알파-제인 및 그의 N-말단 단편을 포함한다. 감마-제인 (27kD), 쌀 및 알파-제인 단백질들의 DNA 및 아미노산 잔기 서열들을 서열 번호 5 (DNA 서열) 및 서열 번호 6 (단백질 서열); 서열 번호 7 (RX3 DNA 서열) 및 서열 번호 8 (단백질 서열); 서열 번호 9 (R3 DNA 서열) 및 서열 번호 10 (단백질 서열); 서열 번호 11 (P4 DNA 서열) 및 서열 번호 12 (단백질 서열); 서열 번호 13 (X10 DNA 서열) 및 서열 번호 14 (단백질 서열)에 나타내었다.

rP13: (단백질 서열, 서열 번호 15 및 DNA 서열, 서열 번호 16) - 클론에 상동성인 13kD 쌀 프롤라민 - AB016504 Sha 등, 1996 Biosci. Biotechnol. Biochem. 60(2):335-337; Wen 등, 1993 Plant Physiol. 101(3):1115-1116; Kawagoe 등, 2005 Plant Cell 17(4):1141-1153; Mullins 등, 2004 J. Agric. Food Chem . 52(8):2242-2246; Mitsukawa 등, 1999 Biosci . Biotechnol . Biochem . 63(11):1851-1858.

22kD 의 22aZt (단백질 서열 전체 길이, 서열 번호 17 및 DNA 서열 전체 길이, 서열 번호 18) 옥수수 알파-제인의 N-말단 단편 - V01475 Kim 등, 2002 Plant Cell 14(3):655-672; Woo 등, 2001 Plant Cell 13(10):2297-2317; Matsushima 등, 1997 Biochim. Biophys. Acta 1339(1):14-22; Thompson 등, 1992 Plant Mol. Biol. 18(4):827-833.

관심 대상의 단백질들의 예들은 치료, 준의약식품, 생체제어 또는 산업용 용도를 갖는 임의의 단백질을 포함하며, 예로서 단일클론성 항체들 (IgG, IgM, IgA, 등과 같은 mAbs) 및 그의 단편들, 백신에 대한 항원들 (인간 면역 결핍 바이러스, HIV; 간염 B 전-표면 (pre-surface), 표면 및 중심 항원들, 위장염 코로나 바이러스 등), 호르몬 (칼시토닌, 성장 호르몬 등), 프로테아제 저해제, 항생제, 콜라겐, 인간 락토페린, 시토카인, 산업용 효소들 (가수분해효소, 글리코시다제, 옥시도-리덕타제 등)이 있다. 예시적인 관심 대상의 단백질들에 대한 예시적인 DNA 및 아미노산 잔기 서열들이 제공된다: 연어 칼시토닌 BAC57417 (단백질 서열, 서열 번호 19 및 DNA 서열, 서열 번호 20).

hEGF - 신호 펩티드 없는 AAF85790 에 기초한 구축 (단백질 서열, 서열번호 21 및 DNA 서열, 서열 번호 22).

hGH - 신호 단백질 없는 P01241 에 기초한 구축 (단백질 서열, 서열 번호 23 및 DNA 서열, 서열 번호 24).

또 다른 구현예에서, 재조합 융합 단백질은, PBIS 및 관심 대상의 생성물의 서열들에 추가하여, 스페이서 아미노산 서열을 더 함유한다. 상기 스페이서 아미노산 서열은 효소적 또는 화학적 수단에 의해 분할가능하거나 또는 분할가능하지 않은 아미노산 서열이다. 특정 구현예에서, 스페이서 아미노산 서열은 PBIS 및 관심 대상의 생성물 사이에 위치된다. 예시적인 아미노산 서열은 엔테로키나아제(enterokinase), Arg--C 엔도프로테아제 (endoprotease), Glu--C 엔도프로테아제, Lys--C 엔도프로테아제, Xa 인자 등과 같은 프로테아제에 의해 분할가능하다. 선택적으로, 아미노산 서열은 화학 시약에 의해 특이적으로 분할가능하게 암호화되어 있으며, 예로서 시아노겐 브로마이드는 메티오닌 잔기들에서 분할시킨다.

추가의 구현예에서, 형질 전환 목적에 사용되는 핵산 서열은 공동 명의의 특허 출원 WO 2004003207 에 개시된 바와 같다. 또한, 다른 구현예에서, 핵산 서열은 특허 출원 WO 2004003207에 개시된 바와 같지만, 분할가능한 아미노산 서열을 코딩하는 핵산 서열이 부재이다.

바람직한 구현예에서, 융합 단백질들은 동물, 동물 세포 배양물, 진균/효모, 곤충 또는 조류와 같은 비-고등 식물 진핵 숙주 세포계를 하기를 함유하는 핵산 (DNA 또는 RNA) 서열로 형질 전환하는 것을 포함하는 방법에 따라 제조된다: (i) 프레임 상에서 (ii)에 작동적으로 연결된 PBIS 를 코딩하는 제 1 핵산, (ii) 관심 대상의 폴리펩티드 생성물을 코딩하는 뉴클레오티드 서열을 함유하는 제 2 핵산 서열; 즉, PBIS 를 암호화하는 상기 핵산 서열은, 관심 대상의 폴리펩티드를 암호화하는 서열에 화학적으로 결합되어 (펩티드 결합), 두 폴리펩티드들 모두가 그들의 적절한 리딩 프레임들 (reading frames)로부터 발현되도록 한다. 숙주 세포는 일정 시간 동안 융합 단백질의 발현 및 그 발현된 융합 단백질의 재조합 단백질체 유사 조립체들 (RPBLAs) 내로의 조립에 적합한 배양 조건 하에서 유지된다. 발현시, 생성되는 융합 단백질은 형질 전환된 숙주계 내에서 고밀도 재조합 단백질체 유사 조립체들로서 축적된다. 융합 단백질은 그 후 숙주 세포들로부터 회수될 수 있거나, 또는 그 융합 단백질을 함유하는 숙주 세포들은 원하는 대로, 예로서 부가 영양분 또는 보충물을 함유하는 동물성 식품으로서 사용될 수 있다. 융합 단백질은 RPBLAs 의 일부로서 단리될 수 있거나 또는 RPBLAs 가 없을 수 있다.

융합 단백질의 발현에 적합한 배양 조건들은 전형적으로 숙주 세포의 각 유형에 따라 상이하다. 그러나, 그러한 조건들은 숙련된 작업자들에 의해 알려져 있으며, 쉽게 결정된다. 유사하게, 유지 기간은 숙주 세포들 및 제조하고자 하는 융합 단백질의 양에 따라 상이할 수 있다. 또한, 그러한 조건들은 공지이며, 특정 상황들에서 쉽게 결정될 수 있다. 추가적으로, 특정 배양 조건들은 여기에서 예시한 인용문헌들로부터 얻을 수 있다.

한 구현예에서, 제 1 핵산 서열 (i)의 3' 말단은 제 2 핵산 서열 (ii)의 5' 말단에 연결 (결합)된다. 다른 구현예에서, 제 1 핵산 서열 (i)의 5' 말단은 제 2 핵산 서열 (ii)의 3' 말단에 연결 (결합)된다. 또 다른 구현예에서, 상기 PBIS 는 저장 단백질 또는 개질된 저장 단백질, 그의 단편 또는 개질 단편을 함유한다.

또 다른 특정 구현예에서, 융합 단백질은, 동물, 동물 세포 배양물, 진균/효모 또는 조류와 같은 숙주 세포계를, 앞서 언급된 핵산 서열들 (i) 및 (ii)에 추가하여, 스페이서 아미노산 서열을 코딩하는 프레임 중 핵산 서열 (iii)을 함유하는 핵산 서열로 형질 전환하는 것을 포함하는 방법에 따라 제조된다. 상기 스페이서 아미노산은, 상기 언급된 것과 같이, 효소적 또는 화학적 수단에 의해 분할가능하거나 또는 분할가능하지 않은 아미노산 서열일 수 있다. 한 특정 구현예에서, 상기 핵산 서열 (iii)은 상기 핵산 서열들 (i)과 (ii)의 사이에 위치되며, 예로서, 제 3 의 핵산 서열 (iii)의 3' 말단이 제 2 핵산 서열 (ii)의 5' 말단에 연결된다. 또 다른 구현예에서, 상기 제 3 핵산 서열 (iii)의 5' 말단이 제 2 핵산 서열 (ii)의 3' 말단에 연결된다.

이전에 언급된 융합 단백질 분자를 암호화하는 핵산 서열 (절편) 또는 그 코딩 서열의 상보물 또한 본 명세서에서 고려된다. 그러한 핵산 절편은 일부 바람직한 구현예들에서 단리 및 정제된 형태로 존재한다.

살아있는 유기체에서, 단백질 또는 폴리펩티드의 아미노산 서열은 유전적 코드를 거쳐 그 단백질을 코딩하는 유전자의 데옥시리보핵산 (DNA) 서열에 직접 관련된다. 따라서, 유전적 코드의 공지된 퇴화(degeneracy)를 통해, 부가적인 DNA들 및 대응 RNA 서열들 (핵산들)은 바람직한 경우 동일한 융합 단백질 아미노산 잔기 서열들을 암호화하도록 제조될 수 있지만, 상기 두 개의 서열들을 높은 수준의 엄격함(stringency)으로 혼성화하는 것이 아니라 중간 수준의 엄격함으로 혼성화하는 상기 논의된 유전자 서열과 충분히 상이하다.

높은 수준의 엄격한 조건은 6XSSC 에서 약 50-55℃의 온도에서의 혼성화 및 1-3XSSC 에서 68℃의 온도에서의 최종 세척을 포함하는 것으로서 정의될 수 있다. 중간 수준의 엄격한 조건은 0.2 내지 0.3 M NaCl 에서 약 50 ∼ 약 65℃ 의 온도에서의 혼성화에 이어, 0.2X SSC, 0.1% SDS (소듐 도데실 설페이트 ) 에서 약 50-약 55℃에서의 세척을 포함한다.

(1) 그 자체가 또는 그의 상보물이 단백질체 유도 서열 (PBIS) 및 관심 대상의 폴리펩티드를 함유하는 융합 단백질을 암호화하는 핵산 서열 (DNA 서열 또는 RNA 서열)도 본 명세서에서 고려된다. 공지된 바와 같이, 고려되는 핵산 서열과 같은 핵산 서열은, 본 명세서 중에서 논의된 것과 같이 적절한 발현 시스템 중에서 적절한 프로모터에 작동적으로 연결된 경우 발현된다.

상이한 숙주들은 종종, 특정 아미노산 잔기를 암호화하는데 사용되는 특정 코돈에 대한 선호를 갖는다. 그러한 코돈 선호성은 공지이며, 바람직한 융합 단백질 서열을 암호화하는 DNA 서열은, 시험관 내 돌연변이 유발을 사용하여, 예로서 숙주-선호된 코돈들이, 융합 단백질이 발현되어지는 특정 숙주에 대해 사용되도록 변경될 수 있다.

상기 논의된 것과 같이, 고려되는 융합 단백질을 암호화하는 유전자를 규정하는 외생의 핵산 절편 (예로서 DNA 절편 또는 서열)에 작동적으로 연결된 적합성(compatible) 진핵 숙주 세포 유기체에서 유전자의 발현을 유도하는데 적합한 프로모터와 같은, 하나 이상의 조절 서열들 (제어 성분들)을 함유하는 벡터를 포함하는, DNA 분자와 같은 재조합 핵산 분자도 본 발명에서 고려된다. 보다 구체적으로, 관심 대상의 폴리펩티드에 연결된 단백질체 유도 서열 (PBIS)를 암호화하는 유전자를 규정하는 DNA 절편에 작동적으로 연결된 숙주 유기체 세포들에서 융합 단백질의 발현을 유도하기 위한 프로모터를 함유하는 벡터를 포함하는 재조합 DNA 분자도 고려된다. 상기 재조합 DNA 분자는, 적합한 형질 감염 및 숙주 진핵 세포에서의 발현시, 고려되는 융합 단백질을 RPBLAs로서 제공한다.

당 기술 분야에서 공지된 바와 같이, 필요한 핵산, 예시적으로 DNA 서열이 존재하는 한 (출발 및 정지 신호 포함), 추가적인 염기쌍들은 일반적으로 DNA 절편의 각 말단 중 하나에 존재할 수 있으며, 그 절편은 단백질을 발현하는데 여전히 사용될 수 있다. 이는 물론, 발현을 억제하거나, 발현시키고자 하는 융합 단백질을 소비하는 추가의 생성물을 발현하거나, 그 원하는 융합 단백질에 의해 생성된 원하는 반응 생성물을 소비하는 생성물을 발현하거나, 또는 그렇지 않으면 DNA 절편의 유전자의 발현을 방해하는, 작동적으로 연결된 DNA 서열의 절편의 부재를 가정한 것이다.

따라서, 상기 DNA 절편이 그러한 방해 DNA 서열들을 갖지 않는 한, 본 발명의 DNA 절편은 길이가 약 500 내지 약 15,000 염기쌍일 수 있다. 재조합 DNA 분자, 특히 발현 벡터의 최대 크기는, 대개 편의성에 의해 좌우되고, 복제 및 발현에 요구되는 최소 DNA 서열들의 전부가, 바람직한 경우, 존재하는 경우, 숙주 세포에 의해 수용될 수 있는 벡터 크기에 의해 좌우된다. 최소 벡터 크기는 공지이다. 그러한 긴 DNA 절편들은 바람직하지 않지만, 사용될 수 있다.

상기 기재된 융합 단백질을 암호화하는 DNA 절편은 화학적 기술들, 예로서 Matteucci 등 ((1981) J. Am. Chem. Soc., 103:3185)의 포스포트리에스테르 (phosphotriester)법에 의해 합성될 수 있다. 물론, 코딩 서열을 화학적으로 합성함에 의해, 천연 아미노산 잔기 서열을 암호화하는 것들을 적절한 염기들로 치환함에 의해 임의의 바람직한 변경을 간단히 이룰 수 있다. 그러나, 여기에서 특이적으로 논의된 서열들을 포함하는 DNA 절편들이 바람직하다.

융합 단백질을 암호화하는 유전자를 함유하는 DNA 절편들은 바람직하게는 그 유전자를 함유하는 재조합 DNA 분자들 (플라스미드 벡터들)로부터 수득된다. 융합 단백질 유전자의 숙주 세포에서의 발현을 지휘하는 벡터를, 여기에서 "발현 벡터"로서 언급된다.

발현 벡터는 프로모터를 포함하는 발현 제어 요소들을 함유한다. 융합 단백질-코딩 유전자는 상기 발현 벡터에 작동적으로 연결되어 그 프로모터 서열이 RNA 중합효소 결합 및 융합 단백질 암호화 유전자의 발현을 지휘하도록 한다. 폴리펩티드 코딩 유전자를 발현하는데에는, Poszkowski 등 (1989) EMBO J., 3:2719 및 Odell 등 (1985) Nature , 313:810에 의해 기재된 것과 같은 유도성, 바이러스성, 합성, 구조적인 프로모터들, 및 Chua 등 (1989) Science, 244:174-181 에서 제시된 것과 같은, 시간적으로 조절되고, 공간적으로 조절되고, 시공간적으로 조절되는 프로모터들이 유용하다.

진핵 세포들에 적합성인 발현 벡터들, 예로서 효모 세포들에 적합성인 것들 또는 포유류, 조류 또는 곤충들 등의 세포들에 적합성인 것들이 본 명세서에서 고려된다. 그러한 발현 벡터들은 본 발명의 재조합 DNA 분자들을 형성하는데 사용될 수도 있다. 사카로마이세스 세레비시에 (Saccharomyces cerevisiae) 또는 피키아 파스토리스와 같은 효모들에서의 사용에 적합한 벡터들은 공지된 바와 같은, 에피좀성(episomal) 또는 통합성 (integrating)일 수 있다. 진핵 세포 발현 벡터들은 당 기술 분야에서 공지이며, 몇몇 상업적 공급원들로부터 구입가능하다. 정상적으로, 그러한 벡터들은 바람직한 DNA 절편 및 프로모터 서열들의 삽입을 위해 하나 이상의 편리한 제한효소 부위들을 함유한다. 임의로, 그러한 벡터들은 진핵 세포들에서의 사용에 특이적인 선택가능한 마커를 함유한다. 사카로마이세스 세레비시 에에서의 사용을 위한 예시적인 프로모터들은 사카로마이세스 세레비시에 포스포글리세르산 키나아제 (phosphoglyceric acid kinase: PGK) 프로모터 및 분기성 프로모터들 GAL 10 및 GAL 1을 포함하며, 한편 알코올 옥시다제 유전자 (AOX1)는 피키 아 파스토리스에 대해 유용한 프로모터이다. 사카로마이세스 세레비시에 및 피키아 파스토리스에서의 융합 단백질의 예시적인 발현을 이하에 나타내었다.

포유류 세포들에서의 재조합 DNA 발현에 의한 융합 단백질의 제조를, 중국 햄스터 난자 (Chinese hamster ovary: CHO) 숙주 세포들, Cos1 원숭이 숙주 및 인간 293T 숙주 세포들에서 상기 융합 단백질을 발현하는 재조합 DNA 벡터를 사용하여, 이하에서 설명한다. 이는 당 기술 분야에서 공지되고, Sambrook 등, Molecular Cloning : A Laboratory Manual, 2 판, Cold Spring Harbor Laboratories (1989)에서 보다 상세히 기재된 절차들을 사용하여 실시하였다.

곤충 세포계도 고려되는 융합 단백질을 발현하는데 사용될 수 있다. 예로서, 그러한 한 계에서 오토그래파 캘리포니카 핵 다각체 바이러스 (Autographa californica nuclear polyhedrosis virus: AcNPV) 또는 배큘로바이러스(baculovirus)가, 나비목 해충 (Spodoptera frugiperda) 세포들에서 또는 나방 (Trichoplusia) 애벌레에서 외래 유전자들을 발현시키기 위한 벡터로서 사용된다. 융합 단백질을 암호화하는 서열들은 예로서 다각성 (polyhedrin) 유전자와 같이, 상기 바이러스의 비-필수 영역 내로 클론될 수 있으며, 상기 다각성 프로모터의 제어 하에 배치될 수 있다. 융합 단백질 서열의 성공적인 삽입은 그 다각성 유전자를 불활성으로 하여 코트(coat) 단백질이 없는 재조합 바이러스를 제조한다. 상기 재조합 바이러스들은 그 후 예로서, 나비목 해충 세포들 또는 나방 애벌레를 감염시키는데 사용될 수 있으며, 여기에서 상기 융합 단백질이 발현될 수 있다. E. Engelhard 등 (1994) Proc. Natl. Acad. Sci., USA, 91:3224-3227; 및 V. Luckow, Insect Cell Expression Technology, pp. 183-218, Protein Engineering: Principles and Practice, J.L. Cleland 등, eds., Wiley Liss, Inc, 1996. 상기 오토그래파 캘리포니카 핵 다각체 바이러스 (AcNPV)의 다각성 프로모터의 제어 하에 위치된 이종성 유전자들은 종종, 감염의 후반 단계들 동안 높은 수준으로 발현된다.

융합 단백질 유전자를 함유하는 재조합 배큘로바이러스들은 배큘로바이러스 셔틀 벡터계 (Luckow 등 (1993) J. Virol ., 67:4566-4579)를 사용하여 구축되며, Bac-To-Bac 배큘로바이러스 발현계 (Life Technologies)로서 상업적으로 판매된다. 재조합 바이러스들의 군체들을 제조하고, 그 재조합 단백질의 발현을 표준 프로토콜에 의해 모니터링 한다 (O'Reilly 등, Baculovirus Expression Vectors : A Laboratory Manual, W.H. Freeman and Company, New York, 1992; 및 King 등, The Baculovirus Expression System: A Laboratory Guide, Chapman & Hall, London, 1992).

궁극적으로 융합 단백질 암호화 유전자가 작동적으로 연결되는, 발현 벡터 및 프로모터의 선택은 바람직한 기능적 성질들, 예로서 단백질 발현의 위치 및 타이밍, 및 형질 전환되는 숙주 세포에 직접적으로 의존한다. 이들은 재조합 DNA 분자들을 구축하는 기술에 고유한 공지된 제한요소들이다. 그러나, 본 발명을 실시하는데 유용한 벡터는, 그 융합 단백질이 작동적으로 연결되는 DNA 절편에 포함된 상기 융합 단백질의 복제 및 바람직하게는 발현 (발현 벡터의 경우)을 지휘할 수 있다.

발현된 RPBLAs 및 그들의 융합 단백질들은 생화학 또는 생물학적 회수에서 사용되는 일반적인 방법들에 의해 발현 숙주 세포들로부터 수득될 수 있다. RPBLAs 는 숙주 세포들에 존재하는 다른 단백질들에 비해 밀집되어 있기 때문에, 상기 RPBLAs 는 특히 세포 균질액의 원심 분리에 의해 수집되어 분석될 수 있다. 상기 융합 단백질들은, 2-머캡토에탄올과 같은 환원제를 함유하는 버퍼 중에서 그 둘러싼 막을 용해함에 의해 수집된 RPBLAs 로부터 수득될 수 있다.

더 이상의 설명 없이도, 본 기술분야의 당업자라면, 상기 설명 및 하기의 상세한 실시예들을 사용하여, 본 발명을 완전히 이용할 수 있을 것으로 생각된다. 하기 바람직한 특정 구현예들은, 따라서, 단순히 예시적인 것으로 해석되어야 하며, 본 개시의 나머지 부분을 어떤 방식으로도 제한하지 않는다.

실시예

실시예 1: 형질 감염된 포유류 세포들에서 융합 단백질들의 축적

성숙 칼시토닌 (Ct) 및 EGF 서열들에 대응하는 합성 유전자들 및 hGH 서열을 암호화하는 cDNA 를, N-말단 감마-제인 코딩 서열 RX3 (WO2004003207)에 융합하고, pcDNA3.1 (Invitrogen) 벡터 내로 도입하여 구축물 p3.1RX3Ct, p3.1RX3EGF 및 p3.1RX3hGH 을 수득하였다. 융합 단백질들 RX3-Ct, RX3-EGF 및 RX3-hGH를 코딩하는 이들 구축물들을, 리포펙타민에 기초한 형질 감염 방법에 의해 (Invitrogen) 293T, Cos1 및 CHO 포유류 배양 세포들 내로 도입하였다. 개선된 시안 형광 개질 GFP의 유전자 서열을 함유하는 플라스미드 pECFP-N1 (Clontech)로 형질 감염된 293T 및 Cos1 세포들을 대조군으로서 사용하였다.

일시적으로 형질 감염된 세포들 중에서 융합 단백질들의 축적은, 감마-제인에 대해 발생된 항체들을 사용하여, 웨스턴 블롯에 의해 분석하였다. 44 시간의 형질 감염 후, 총 가용성 단백질들을 버퍼 A (100 mM Tris-HCl pH 8.0, 150 mM NaCl, 5mM EDTA, 0.5% SDS, 0.5% 트리톤 X-100, 2% 2-머캡토에탄올 및 프로테아제 저해제들)로 추출하였다. 세포 인큐베이션 매질의 분액을 침전시키고, -20℃ 에서 저장하였다. 동량의 형질 감염된 세포들로부터 추출된 단백질들을 SDS 폴리아크릴아미드 겔 전기영동에 의해 분리하고, 니트로셀룰로오스 시트들(sheets)로 이동시켰다.

도 1 에 나타낸 결과들로부터 알 수 있는 바와 같이, 분석된 세 개의 융합 단백질들 RX3-Ct, RX3-EGF 및 RX3-hGH은, 발현을 위해 선택된 배양 세포 유형에 무관하게 매우 효율적으로 축적되었다: 293T 및 CHO 배양된 세포들 모두에서 축적된 RX3-hGH 의 패턴, 및 CHO 및 Cos1 세포들에서의 RX3-EGF 의 패턴 비교. 상기 융합 단백질들을, 형질 감염된 세포들 (c 래인)에 대응하는 단백질 추출물 중에서 관찰하였으며, 세포 배양 매질 (m 래인)에서는 어떤 면역반응성 밴드도 탐지되지 않았다. 이러한 관찰 결과는 RX3 도메인이 내막 구역에서 상기 융합 단백질들을 조립 및 유지할 수 있다는 것을 나타낸다.

이들 결과들은 RX3-유도된 융합 단백질들이 어떻게 내막계 중에서, 분석된 세 가지 유형의 포유류 세포들 (인간 293T 세포들, 원숭이 Cos1 세포들 및 햄스터 CHO 세포들)에서 조립되고 축적되는지를 설명하여주며, 이는 바람직한 단백질의 효율적인 축적이 RX3 도메인을 사용한 융합을 통해, 선택된 어떤 포유류 세포 또는 유기체에서도 달성될 수 있음을 나타낸다.

실시예 2: 형질 감염된 포유류 세포들에서, 융합 단백질들의 세포내 분포 위치

N-말단 감마-제인 서열 RX3 이 포유류 세포들에서 재조합 단백질체 유사 조립체들을 유도할 수 있는지의 여부를 결정하는데 있어서, RX3-Ct 및 RX3-EGF 융합 단백질들의 분포 위치를, 동일 초점 현미경법을 사용하여 면역 세포 화학에 의해 분석하였다. 형질 감염된 세포들을 10 분 동안 3.7 % 파라포름알데히드 중에서 고정시키고, 인산염 완충액으로 세척 후, 감마-제인 항혈청 (1/700 희석)과 함께 1 시간 동안 인큐베이션하였다. 비-면역성 혈청을 대조군으로서 사용하였다. 일차 항체들을, Alexa Fluor 488 또는 Alexa Fluor 555 염료에 결합된 항-토끼 항체들을 사용하여 검출하였다 (분자 탐침자).

형질 감염된 세포들로부터의 현미경 사진들을, 방출 대역 파장 선택을 위한 분광 광도계가 장착된 동일 초점 레이저 스캐닝 현미경 (Leica TCS SP, 하이델베르그, 독일)을 사용하여 수득하였다. 495-535 nm로 세팅된 방출 범위를 사용함에 의해, 아르곤 이온 레이저를 사용한 488nm 여기(excitation)에서 초록색 형광 이미지들이 수집되었다. HeNe 레이저 및 방출 범위 550-600 를 사용하여 543 nm 여기 후, 적색 형광 이미지들이 수집되었다. 광학 구역들은 0.5 ㎛ 두께였다. 디지털 이미지들 및 투영 영상들(projections)은, 동일 초점 현미경 소프트웨어를 사용하여 기록되었다.

도 2 는 p3.1Ct- 및 p3.1RX3EGF-형질 감염된 세포들의 동일 초점 투영 영상들을 나타낸다. 상기 도에 나타난 바와 같이, 대응 융합 단백질들, RX3-Ct 및 RX3EGF 이, 소포체 (ER) 내에서 검출되었으며 (도 2A 의 화살표), 이는 감마-제인 신호 펩티드가, 상기 융합 단백질의 ER 내로의 전위(translocation)를 매개하는 포유류 세포들 중에서 기능적임을 나타낸다. 대조군으로서 사용된 상기 비-면역성 혈청과 함께 인큐베이션된 시료들은 어떤 현저한 형광도 나타내지 않았다 (미도시).

놀랍게도 상기 융합 단백질들이, 외관 상으로 막에 의해 둘러싸인 큰 지점들에서 우선적으로 축적되는 것이 보인다는 것에 주의하는 것이 중요하다 (도 2A의 삽입 사진 참조). 비-형질 감염된 세포들이 없는, 이들 구조물들은 약 1 미크론의 직경을 갖는 식물 단백질체들의 크기에 비교할만 하다 (A 및 C의 삽입 사진들). 이러한 결과는, 동물 세포들이 식물에서 설명된 PB 저장 세포 소기관을 재생할 수 있다는 사실 뿐만 아니라, 모든 형질 감염된 세포들에서 관찰되는 많은 수의 RPBLAs 에 의해서도 놀라운 것이며, 이는 이들 세포들의 효율적인 축적능을 나타내는 것이다. 또한, 상이한 형질 감염된 세포 유형들이 융합 단백질들의 비교할만한 위치 분포 및 축적 패턴들을 나타내었으며 (도 2A, 2B 및 2D 참조), 이 패턴은 PBIS 에 융합된 표적물에 무관한 것으로 보인다 (도 2B 및 2C).

세포들을, 유도된 PBLS 의 세포내(subcellular) 기원을 분석하기 위하여 ER 마커로서 사용된 형광 단백질에 대한 서열을 함유하는 플라스미드 pDsRed2-ER (Clontech)로 공동형질 감염시켰다. 흥미롭게도, 도 2D, 2E 및 2F 에서 알 수 있는 바와 같이, RX3-Ct 및 ER 마커 모두 ER 및 PB-유사 조립체들 중에서 공동 분포 위치되며(colocalize), 이는 포유류 세포들에서 유도된 RPBLAs 들의 ER 기원이 식물 세포들에서 일어난 것과 같음을 나타낸다.

실시예 3: 형질 전환된 효모 세포들에서의 융합 단백질들의 축적

EGF 및 hGH를 암호화하는 서열들을 N-말단 감마-제인 코딩 서열 RX3 (WO2004003207)에 융합시키고, 벡터 pYX243 (R&D systems) 내로 도입시켜 구축물들 c117 및 c118 을 수득하였다. 융합 단백질들 RX3-EGF 및 RX-hGH를 코딩하는 이들 구축물들을 사카로마이세스 세레비시에 내로 도입시켰다.

상기 형질 전환체들을 갈락토오스 함유 매질에서 배양함에 의해 발현 분석을 실시하고, 동량의 세포들 및 매질을 SDS-PAGE 및 재조합 발현된 단백질들에 대한 특정 항체들을 사용함에 의한 면역 블롯에 의해 분석하였다. 도 3A 에서 알 수 있는 것과 같이, RX3-EGF (c117 래인들) 및 RX3-hGH (c118 래인들) 융합 단백질들이 상기 효모 세포들 중에 축적되었으며, 매질에서는 단백질의 흔적이 검출되지 않았다.

hGH 및 hGH-유도된 융합물들의 축적은 구축물들 c135 및 c121 (융합 RX3-hGH 단백질을 코딩) 및 c136 (hGH 단백질을 코딩, 도 3B의 개략적 표시 참조)로 형질 전환된 피키아 파스토리스 효모에서도 연구되었다. 가장 높은 수준의 재조합 단백질들을 축적하는 형질 전환체들이 선택되었다.

두 개의 상이한 신호 펩티드들을 사용하여 융합 단백질, 감마-제인 신호 펩티드 (도 3B, SPg) 및 효모 알파 인자 프리프로 펩티드 (도 3B, Afprepro)를 발현하였다. 또한, hGH에 직접 융합된 효모 알파 인자 프리프로 펩티드를 사용함에 의해 분비의 제어도 분석하였다 (도 3B, c136). 세포들 및 매질로부터의 총 단백질들을, 토끼에서 발생된 hGH 에 대한 특정 항체들을 사용함에 의해 웨스턴 블롯으로 분석하였다.

예측된 것과 같이, Afprepro 펩티드가 사용된 경우 hGH 가 매질 내로 분비되었다 (도 3B, c136/m 래인). 대조적으로, 융합 단백질 RX3-hGH 는 사용된 신호 펩티드에 무관하게 효모 세포들 내에 축적되었다. 도 3B 에서 알 수 있는 것과 같이, 융합 단백질은, 효모 Afprepro 펩티드 (c135/y 래인)를 사용할 때 및 감마-제인 신호 펩티드 (c121/y 래인)를 사용할 때의 두 경우들 모두에서 세포들 내부에 존재하였으며, 매질에서는 단백질의 흔적이 검출되지 않았다 (미도시). 따라서, 감마-제인의 N-말단 프롤린 풍부 도메인은 효모 세포들의 내막 구역에서, 보다 구체적으로 원심 분리에 의해 분리될 수 있는 PB 유사 구조물들에 대응하는 밀집한 분획으로 단백질 보유를 매개하기에 충분하였다.

사카로마이세스 세레비시에 및 피키아 파스토리스에서 수득된 결과들은, 종자 저장 단백질을 함유하는 융합 단백질들이 PB 유사 구조물들로 효율적으로 조립 및 축적되어지는, 식물 및 동물계들과 상이한 기타 진핵 유기체의 예들이다.

실험 절차들

포유류 형질 감염을 위한 플라스미드 구축물들

성숙 칼시토닌 서열 (Ct)에 대응하는 합성 유전자를 (특허 출원 WO2004003207)에 기재된 바와 같이 수득하였다.

활성 hEGF 의 53 개의 아미노산들을 암호화하는 합성 유전자를, 약 60 개의 염기들의 4 개의 올리고뉴클레오티드를 사용하여, 20 개의 중복 염기들로, 프라이머 중복 연장 PCR 법에 의해 수득하였다. 합성 hEGF cDNA는 Xa 인자 특이적 분할 부위에 대응하는 5' 링커 서열을 포함하였다. 올리고뉴클레오티드들 (EGF1 서열 번호 25; EGF2, 서열 번호 26; EGF3, 서열 번호 27; EGF4, 서열 번호 28)을 폴리아크릴아미드 변성 겔에 의해 정제하였다.

인간 성장 호르몬 (hGH)의 191 개 아미노산들을 암호화하는 cDNA 서열을 인간 뇌하수체의 cDNA (Clontech, BDBiosciences)로부터, 엔테로키나아제 분할 부위에 대응하는 서열을 포함한 올리고뉴클레오티드 GH5 (서열 번호 29) 및 GH3 (서열 번호 30)를 사용하여 수득하였다.

성숙 칼시토닌 (Ct, WO2004003207) 및 hEGF 서열들에 대응하는 합성 유전자들 및 hGH 를 암호화하는 cDNA를 RX3 N-말단 감마-제인 코딩 서열 (특허 WO2004003207)에 융합시키고, pUC18 내로 도입시켰다. RX3-Ct, RX3-EGF 및 RX3-hGH 서열들을 함유하는, pUC18 유도된 플라스미드들 pUC18RX3Ct, pUC18RX3EGF 및 pUC18RX3gHG 로부터의 SalI-BamHI 제한 단편들을 Xho I-Bam HI 로 제한된 벡터 pcDNA3.1- (Invitrogen) 내에 도입시켰다. p3.1RX3CT, p3.1RX3EGF 및 p3.1RX3hGH 로 명명된 결과의 구축물들에서, 융합 단백질 서열들은 CMV 프로모터 및 종료기 pA BGH 하에 존재하였다.

효모 형질 전환을 위한 플라스미드 구축물들

숙주 균주들 및 벡터들:

사카로마이세스 세레비시에 균주 (유전형 Mata his3 leu2 met15 ura3 bar1::URA3)를 벡터 pYX243 (GAL 프로모터, LEU2 , AmpR, R&D Systems) 유도된 구축물들을 사용함에 의해 형질 전환하였다. 피키아 파스토리스 균주 GS115 (his4) 및 벡터들 pPIC9 및 pPIC3.5K (AOX1 프로모터, HIS4 , AmpR)를 Invitrogen life tech 로부터 수득하였다.

플라스미드 구축물들:

대응 융합 단백질 RX3-EGF 및 RX3-hGH 서열들을 함유하는, 상기 기재된 pUC18-유도된 플라스미드들 pUC18RX3EGF 및 pUC18RX3hGH 로부터의 SalI(블런트(blunt) 말단 처리됨)-BamHI 제한 단편들을, EcoRI (블런트 말단 처리됨)-Bam HI 제한된 벡터 pYX243 (R&D Systems) 내로 도입하였다. 각각 c117 및 c118로 명명된 결과의 구축물들에서, 융합 단백질 서열들은 유도성 GAL 프로모터 하에 존재하였다.

pUC18 유도된 플라스미드들 pUC18RX3EGF 및 pUC18RX3hGH로부터의 제한 단편들, SalI(블런트 말단 처리됨)-BamHI (블런트 말단 처리됨)을 NotI (블런트 말단 처리됨)-EcoRI (블런트 말단 처리됨)으로 제한된 벡터 pPIC3.5K (Invitrogen) 내로 도입하여, 피키아 파스토리스를 형질 전환하기 위한 플라스미드들 c120 및 c121을 수득하였다.

플라스미드 pPIC9 (Invitrogen)을 사용하여, 효모 신호 펩티드인, 사카로마 이세스의 알파 프리프로 펩티드를 사용하는 융합 단백질 발현을 분석하였다. RX3-hGH 및 hGH 단백질들을 코딩하는 XhoI-NotI 측면(flanked) 서열들을, pUC18RX3hGH을 주형으로서 사용하고, 올리고뉴클레오티드들 af06 (서열 번호 31), afRX (서열 번호 32) 및 06Not (서열 번호 33)를 사용하여 PCR에 의해 수득하였다.

이들 서열들은 알파 프리프로 펩티드의 효율적인 분할에 필요한 KEX2 부위를 코딩하는 서열을 함유하였다 (Invitrogen, 피키아 발현 키트). 상기 PCR 생성물들을 XhoI-NotI 로 제한된 pPIC9 내로 클로닝하여, 상기 알파 인자 프리프로 펩티드에 융합된 RX3-hGH 및 hGH 단백질 서열들을 각각 함유하는 플라스미드 c135 및 c136 을 제공하였다.

효모 형질 전환

사카로마이세스 세레비시에 균주 (leu2)를 LiAc 법 (Ito 등 1983, J. Bacteriol. 153:163-168)에 의해 플라스미드 구축물들 c117 및 c118로 형질 전환하고, 형질 전환체들을 Leu- 플레이트들 상에서 선발하였다. 갈락토오스 함유 매질(demanar composicio.) 중에서 형질 전환체들을 성장시켜 발현 분석들을 수행하였다.

피키아 파스토리스 균주 GS115 (his4)를 Pichia EasyComp 키트 (Invitrogen life tech.)에 의해, SacI 선형화된 c120 및 c121 플라스미드들을 사용하여 형질 전환시키고, RDB His^-매질 상에 플레이팅하였다 (plated). Mut 표현형들은, 상기 콜로니들을 MD 및 MM 한천 플레이트들 상에서 스트리킹하여(streaking) 결정하였다. 상기 형질 전환체들을 YPD 매질 중에서 이틀 동안 성장시킴에 의해 발현 실험들을 수행하였다. 그 후, 세포들을 침전시키고, MM 매질에 또 다른 48 시간 동안 현탁하였으며, 메탄올을 매 24 시간 마다 0.5% 의 최종 농도로 첨가하였다. 가장 높은 수준의 재조합 단백질을 축적하는 형질 전환체들을 선발하였다. 매질 제조 방법들은 Invitrogen 에 의해 기재된 바와 같다 (피키아 발현 키트).

효모 단백질들 추출 및 웨스턴 블롯

사카로마이세스 세레비시에 및 피키아 파스토리스 발현 재조합 융합 단백질들을 펠렛화하였다. 각 인큐베이션 매질의 분액들을 침전시키고, 분석을 위해 -20℃에서 저장하였다. 세포 펠렛들도 냉동시키고, 해동 후, 유리 비즈(beads) 및 매질 H (50 mM HCl-Tris pH 8.0, 150 mM NaCl, 5 mM EDTA, 200 mM DTT 및 프로테아제 저해제들)를 사용하여 표준 방법에 의해 세포들을 파쇄하였다. 세포들 및 매질들을 모두 동량으로 하여, SDS-PAGE 및 재조합 발현된 단백질들에 대한 특정 항체들을 사용함에 의해 면역 블롯하여 분석하였다.

여기 언급된 특허들 및 논문들은 각각 참조로서 포함된다. 단수 ( 관사 "a" 또는 "an")의 사용은 하나 또는 그 이상을 포함하고자 하는 의도이다.

상기 기재 및 실시예들은 예시적인 것으로 의도된 것이지, 제한적인 것으로 받아들여져서는 안된다. 본 발명의 기술 사상 및 범주에 속하는 여전히 다른 변경들이 가능하며, 당업자들에게는 그러한 변경들이 쉽게 제시될 수 있을 것이다.

<110> ERA BIOTECH S.A. <120> Production of proteins <130> F07-5448-ES <150> 0426160.8 <151> 2004-11-29 <160> 33 <170> KopatentIn 1.71 <210> 1 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> repeat domain hexapeptide <400> 1 Pro Pro Pro Val His Leu 1 5 <210> 2 <211> 53 <212> PRT <213> Artificial Sequence <220> <223> RX3 query aa sequence <400> 2 Pro Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro 1 5 10 15 Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro 20 25 30 Pro Pro Val His Leu Pro Pro Pro Val His Val Pro Pro Pro Val His 35 40 45 Leu Pro Pro Pro Pro 50 <210> 3 <211> 65 <212> PRT <213> Artificial Sequence <220> <223> Alpha zein aa sequence <400> 3 Gln Gln Gln Gln Gln Phe Leu Pro Ala Leu Ser Gln Leu Asp Val Val 1 5 10 15 Asn Pro Val Ala Tyr Leu Gln Gln Gln Leu Leu Ala Ser Asn Pro Leu 20 25 30 Ala Leu Ala Asn Val Ala Ala Tyr Gln Gln Gln Gln Gln Leu Gln Gln 35 40 45 Phe Leu Pro Ala Leu Ser Gln Leu Ala Met Val Asn Pro Ala Ala Tyr 50 55 60 Leu 65 <210> 4 <211> 70 <212> PRT <213> Artificial Sequence <220> <223> rice prolamin query aa sequence <400> 4 Gln Gln Val Leu Ser Pro Tyr Asn Glu Phe Val Arg Gln Gln Tyr Gly 1 5 10 15 Ile Ala Ala Ser Pro Phe Leu Gln Ser Ala Thr Phe Gln Leu Arg Asn 20 25 30 Asn Gln Val Trp Gln Gln Leu Ala Leu Val Ala Gln Gln Ser His Cys 35 40 45 Gln Asp Ile Asn Ile Val Gln Ala Ile Ala Gln Gln Leu Gln Leu Gln 50 55 60 Gln Phe Gly Asp Leu Tyr 65 70 <210> 5 <211> 672 <212> DNA <213> Maize <400> 5 atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccacg 60 catacaagcg gcggctgcgg ctgccagcca ccgccgccgg ttcatctacc gccgccggtg 120 catctgccac ctccggttca cctgccacct ccggtgcatc tcccaccgcc ggtccacctg 180 ccgccgccgg tccacctgcc accgccggtc catgtgccgc cgccggttca tctgccgccg 240 ccaccatgcc actaccctac tcaaccgccc cggcctcagc ctcatcccca gccacaccca 300 tgcccgtgcc aacagccgca tccaagcccg tgccagctgc agggaacctg cggcgttggc 360 agcaccccga tcctgggcca gtgcgtcgag tttctgaggc atcagtgcag cccgacggcg 420 acgccctact gctcgcctca gtgccagtcg ttgcggcagc agtgttgcca gcagctcagg 480 caggtggagc cgcagcaccg gtaccaggcg atcttcggct tggtcctcca gtccatcctg 540 cagcagcagc cgcaaagcgg ccaggtcgcg gggctgttgg cggcgcagat agcgcagcaa 600 ctgacggcga tgtgcggcct gcagcagccg actccatgcc cctacgctgc tgccggcggt 660 gtcccccacg cc 672 <210> 6 <211> 224 <212> PRT <213> Maize <400> 6 Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser 1 5 10 15 Ala Thr Ser Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro 20 25 30 Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu 35 40 45 Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val 50 55 60 His Leu Pro Pro Pro Val His Val Pro Pro Pro Val His Leu Pro Pro 65 70 75 80 Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro 85 90 95 Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln 100 105 110 Leu Gln Gly Thr Cys Gly Val Gly Ser Thr Pro Ile Leu Gly Gln Cys 115 120 125 Val Glu Phe Leu Arg His Gln Cys Ser Pro Thr Ala Thr Pro Tyr Cys 130 135 140 Ser Pro Gln Cys Gln Ser Leu Arg Gln Gln Cys Cys Gln Gln Leu Arg 145 150 155 160 Gln Val Glu Pro Gln His Arg Tyr Gln Ala Ile Phe Gly Leu Val Leu 165 170 175 Gln Ser Ile Leu Gln Gln Gln Pro Gln Ser Gly Gln Val Ala Gly Leu 180 185 190 Leu Ala Ala Gln Ile Ala Gln Gln Leu Thr Ala Met Cys Gly Leu Gln 195 200 205 Gln Pro Thr Pro Cys Pro Tyr Ala Ala Ala Gly Gly Val Pro His Ala 210 215 220 <210> 7 <211> 339 <212> DNA <213> Artificial Sequence <220> <223> RX3 DNA sequence <400> 7 atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccacg 60 catacaagcg gcggctgcgg ctgccagcca ccgccgccgg ttcatctacc gccgccggtg 120 catctgccac ctccggttca cctgccacct ccggtgcatc tcccaccgcc ggtccacctg 180 ccgccgccgg tccacctgcc accgccggtc catgtgccgc cgccggttca tctgccgccg 240 ccaccatgcc actaccctac tcaaccgccc cggcctcagc ctcatcccca gccacaccca 300 tgcccgtgcc aacagccgca tccaagcccg tgccagacc 339 <210> 8 <211> 113 <212> PRT <213> Artificial Sequence <220> <223> RX3 aa <400> 8 Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser 1 5 10 15 Ala Thr Ser Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro 20 25 30 Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu 35 40 45 Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val 50 55 60 His Leu Pro Pro Pro Val His Val Pro Pro Pro Val His Leu Pro Pro 65 70 75 80 Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro 85 90 95 Gln Pro His Pro Cys Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln 100 105 110 Tyr <210> 9 <211> 240 <212> DNA <213> Artificial Sequence <220> <223> R3 DNA <400> 9 atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccacg 60 catacaagcg gcggctgcgg ctgccagcca ccgccgccgg ttcatctacc gccgccggtg 120 catctgccac ctccggttca cctgccacct ccggtgcatc tcccaccgcc ggtccacctg 180 ccgccgccgg tccacctgcc accgccggtc catgtgccgc cgccggttca tctgccgccg 240 240 <210> 10 <211> 92 <212> PRT <213> Artificial Sequence <220> <223> Artificial sequence <400> 10 Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser 1 5 10 15 Ala Thr Ser Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro 20 25 30 Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu 35 40 45 Pro Pro Pro Val His Leu Pro Pro Pro Val His Leu Pro Pro Pro Val 50 55 60 His Leu Pro Pro Pro Val His Val Pro Pro Pro Val His Leu Pro Pro 65 70 75 80 Pro Pro Cys His Tyr Pro Thr Gln Pro Pro Arg Tyr 85 90 <210> 11 <211> 213 <212> DNA <213> Artificial Sequence <220> <223> Artificial sequence <400> 11 atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccacg 60 catacaagcg gcggctgcgg ctgccagcca ccgccgccgg ttcatctgcc gccgccacca 120 tgccactacc ctacacaacc gccccggcct cagcctcatc cccagccaca cccatgcccg 180 tgccaacagc cgcatccaag cccgtgccag acc 213 <210> 12 <211> 71 <212> PRT <213> Artificial Sequence <220> <223> Artificial sequence <400> 12 Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser 1 5 10 15 Ala Thr Ser Thr His Thr Ser Gly Gly Cys Gly Cys Gln Pro Pro Pro 20 25 30 Pro Val His Leu Pro Pro Pro Pro Cys His Tyr Pro Thr Gln Pro Pro 35 40 45 Arg Pro Gln Pro His Pro Gln Pro His Pro Cys Pro Cys Gln Gln Pro 50 55 60 His Pro Ser Pro Cys Gln Tyr 65 70 <210> 13 <211> 180 <212> DNA <213> Artificial Sequence <220> <223> Artificial sequence <400> 13 atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc cacctccacg 60 catacaagcg gcggctgcgg ctgccaatgc cactacccta ctcaaccgcc ccggcctcag 120 cctcatcccc agccacaccc atgcccgtgc caacagccgc atccaagccc gtgccagacc 180 180 <210> 14 <211> 60 <212> PRT <213> Artificial Sequence <220> <223> Artificial sequence <400> 14 Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser 1 5 10 15 Ala Thr Ser Thr His Thr Ser Gly Gly Cys Gly Cys Gln Cys His Tyr 20 25 30 Pro Thr Gln Pro Pro Arg Pro Gln Pro His Pro Gln Pro His Pro Cys 35 40 45 Pro Cys Gln Gln Pro His Pro Ser Pro Cys Gln Tyr 50 55 60 <210> 15 <211> 150 <212> PRT <213> Artificial Sequence <220> <223> Artificial sequence <400> 15 Met Lys Ile Ile Phe Val Phe Ala Leu Leu Ala Ile Ala Ala Cys Ser 1 5 10 15 Ala Ser Ala Gln Phe Asp Val Leu Gly Gln Ser Tyr Arg Gln Tyr Gln 20 25 30 Leu Gln Ser Pro Val Leu Leu Gln Gln Gln Val Leu Ser Pro Tyr Asn 35 40 45 Glu Phe Val Arg Gln Gln Tyr Gly Ile Ala Ala Ser Pro Phe Leu Gln 50 55 60 Ser Ala Thr Phe Gln Leu Arg Asn Asn Gln Val Trp Gln Gln Leu Ala 65 70 75 80 Leu Val Ala Gln Gln Ser His Cys Gln Asp Ile Asn Ile Val Gln Ala 85 90 95 Ile Ala Gln Gln Leu Gln Leu Gln Gln Phe Gly Asp Leu Tyr Phe Asp 100 105 110 Arg Asn Leu Ala Gln Ala Gln Ala Leu Leu Ala Phe Asn Val Pro Ser 115 120 125 Arg Tyr Gly Ile Tyr Pro Arg Tyr Tyr Gly Ala Pro Ser Thr Ile Thr 130 135 140 Thr Leu Gly Gly Val Leu 145 150 <210> 16 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> Artificial sequence <400> 16 atgaagatca ttttcgtctt tgctctcctt gctattgctg catgcagcgc ctctgcgcag 60 tttgatgttt taggtcaaag ttataggcaa tatcagctgc agtcgcctgt cctgctacag 120 caacaggtgc ttagcccata taatgagttc gtaaggcagc agtatggcat agcggcaagc 180 cccttcttgc aatcagctac gtttcaactg agaaacaacc aagtctggca acagctcgcg 240 ctggtggcgc aacaatctca ctgtcaggac attaacattg ttcaggccat agcgcagcag 300 ctacaactcc agcagtttgg tgatctctac tttgatcgga atctggctca agctcaagct 360 ctgttggctt ttaacgtgcc atctagatat ggtatctacc ctaggtacta tggtgcaccc 420 agtaccatta ccacccttgg cggtgtcttg 450 <210> 17 <211> 144 <212> PRT <213> Artificial Sequence <220> <223> Artificial sequence <400> 17 Met Ala Thr Lys Ile Leu Ala Leu Leu Ala Leu Leu Ala Leu Phe Val 1 5 10 15 Ser Ala Thr Asn Ala Phe Ile Ile Pro Gln Cys Ser Leu Ala Pro Ser 20 25 30 Ala Ile Ile Pro Gln Phe Leu Pro Pro Val Thr Ser Met Gly Phe Glu 35 40 45 His Leu Ala Val Gln Ala Tyr Arg Leu Gln Gln Ala Leu Ala Ala Ser 50 55 60 Val Leu Gln Gln Pro Ile Asn Gln Leu Gln Gln Gln Ser Leu Ala His 65 70 75 80 Leu Thr Ile Gln Thr Ile Ala Thr Gln Gln Gln Gln Gln Phe Leu Pro 85 90 95 Ala Leu Ser Gln Leu Asp Val Val Asn Pro Val Ala Tyr Leu Gln Gln 100 105 110 Gln Leu Leu Ala Ser Asn Pro Leu Ala Leu Ala Asn Val Ala Ala Tyr 115 120 125 Gln Gln Gln Gln Gln Leu Gln Gln Phe Leu Pro Ala Leu Ser Gln Leu 130 135 140 <210> 18 <211> 432 <212> DNA <213> Artificial Sequence <220> <223> Artificial sequence <400> 18 atggctacca agatattagc cctccttgcg cttcttgccc tttttgtgag cgcaacaaat 60 gcgttcatta ttccacaatg ctcacttgct cctagtgcca ttataccaca gttcctccca 120 ccagttactt caatgggctt cgaacaccta gctgtgcaag cctacaggct acaacaagcg 180 cttgcggcaa gcgtcttaca acaaccaatt aaccaattgc aacaacaatc cttggcacat 240 ctaaccatac aaaccatcgc aacgcaacag caacaacagt tcctaccagc actgagccaa 300 ctagatgtgg tgaaccctgt cgcctacttg caacagcagc tgcttgcatc caacccactt 360 gctctggcaa acgtagctgc ataccaacaa caacaacaat tgcagcagtt tctgccagcg 420 ctcagtcaac ta 432 <210> 19 <211> 34 <212> PRT <213> Salmon <400> 19 Lys Cys Ser Asn Leu Ser Thr Cys Val Leu Gly Lys Leu Ser Gln Glu 1 5 10 15 Leu His Lys Leu Gln Thr Tyr Pro Arg Thr Asn Thr Gly Ser Gly Thr 20 25 30 Pro Gly <210> 20 <211> 102 <212> DNA <213> Salmon <400> 20 aagtgctcca acctctctac ctgcgttctt ggtaagctct ctcaggagct tcacaagctc 60 cagacttacc ctagaaccaa cactggttcc ggtacccctg gt 102 <210> 21 <211> 53 <212> PRT <213> Artificial Sequence <220> <223> Artificial sequence <400> 21 Asn Ser Asp Ser Glu Cys Pro Leu Ser His Asp Gly Tyr Cys Leu His 1 5 10 15 Asp Gly Val Cys Met Tyr Ile Glu Ala Leu Asp Lys Tyr Ala Cys Asn 20 25 30 Cys Val Val Gly Tyr Ile Gly Glu Arg Cys Gln Tyr Arg Asp Leu Lys 35 40 45 Trp Trp Glu Leu Arg 50 <210> 22 <211> 162 <212> DNA <213> Artificial Sequence <220> <223> Artificial sequence <400> 22 aactctgatt cagaatgccc actcagtcac gacggatatt gtcttcacga tggggtatgc 60 atgtacatcg aggccttgga caagtacgca tgtaattgtg tagtgggata cattggtgaa 120 cgctgtcagt atcgagactt gaaatggtgg gagcttaggt ga 162 <210> 23 <211> 191 <212> PRT <213> Artificial Sequence <220> <223> hGH protein <400> 23 Phe Pro Thr Ile Pro Leu Ser Arg Leu Phe Asp Asn Ala Met Leu Arg 1 5 10 15 Ala His Arg Leu His Gln Leu Ala Phe Asp Thr Tyr Gln Glu Phe Glu 20 25 30 Glu Ala Tyr Ile Pro Lys Glu Gln Lys Tyr Ser Phe Leu Gln Asn Pro 35 40 45 Gln Thr Ser Leu Cys Phe Ser Glu Ser Ile Pro Thr Pro Ser Asn Arg 50 55 60 Glu Glu Thr Gln Gln Lys Ser Asn Leu Glu Leu Leu Arg Ile Ser Leu 65 70 75 80 Leu Leu Ile Gln Ser Trp Leu Glu Pro Val Gln Phe Leu Arg Ser Val 85 90 95 Phe Ala Asn Ser Leu Val Tyr Gly Ala Ser Asp Ser Asn Val Tyr Asp 100 105 110 Leu Leu Lys Asp Leu Glu Glu Gly Ile Gln Thr Leu Met Gly Arg Leu 115 120 125 Glu Asp Gly Ser Pro Arg Thr Gly Gln Ile Phe Lys Gln Thr Tyr Ser 130 135 140 Lys Phe Asp Thr Asn Ser His Asn Asp Asp Ala Leu Leu Lys Asn Tyr 145 150 155 160 Gly Leu Leu Tyr Cys Phe Arg Lys Asp Met Asp Lys Val Glu Thr Phe 165 170 175 Leu Arg Ile Val Gln Cys Arg Ser Val Glu Gly Ser Cys Gly Phe 180 185 190 <210> 24 <211> 576 <212> DNA <213> Artificial Sequence <220> <223> Artificial sequence <400> 24 ttcccaacca ttcccttatc caggcttttt gacaacgcta tgctccgcgc ccatcgtctg 60 caccagctgg cctttgacac ctaccaggag tttgaagaag cctatatccc aaaggaacag 120 aagtattcat tcctgcagaa cccccagacc tccctctgtt tctcagagtc tattccgaca 180 ccctccaaca gggaggaaac acaacagaaa tccaacctag agctgctccg catctccctg 240 ctgctcatcc agtcgtggct ggagcccgtg cagttcctca ggagtgtctt cgccaacagc 300 ctggtgtacg gcgcctctga cagcaacgtc tatgacctcc taaaggacct agaggaaggc 360 atccaaacgc tgatggggag gctggaagat ggcagccccc ggactgggca gatcttcaag 420 cagacctaca gcaagttcga cacaaactca cacaacgatg acgcactact caagaactac 480 gggctgctct actgcttcag gaaggacatg gacaaggtcg agacattcct gcgcatcgtg 540 cagtgccgct ctgtggaggg cagctgtggc ttctga 576 <210> 25 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> EFG1 DNA sequence <400> 25 catgccatgg gaattgaggg taggaactct gattcagaat gcccactcag tcacgacgga 60 tatt 64 <210> 26 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> artificial sequence <400> 26 acttgtccaa ggcctcgatg tacatgcata ccccatcgtg aagacaatat ccgtcgtgac 60 tgagt 65 <210> 27 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial sequence <400> 27 catcgaggcc ttggacaagt acgcatgtaa ttgtgtagtg ggatacattg gtgaacgctg 60 tcagt 65 <210> 28 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Artificial sequence <400> 28 tcaggatcct tatcacctaa gctcccacca tttcaagtct cgatactgac agcgttcacc 60 aatgt 65 <210> 29 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Artificial sequence <400> 29 gtccatggac gacgatgata agttcccaac cattccctta tcca 44 <210> 30 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Artificial sequence <400> 30 tcaggatcct tatcagaagc cacagctgcc ctcca 35 <210> 31 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Artificial sequence <400> 31 gctctcgaga aaagattccc aaccattccc ttatcc 36 <210> 32 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Artificial sequence <400> 32 gctctcgaga aaagaacgca tacaagcggc ggctgc 36 <210> 33 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Artificial sequence <400> 33 cttcgcggcc gcttatcaga agccacagct gcc 33

Claims

재조합 단백질체 유사 조립체들 (RPBLAs) 내에 재조합 융합 단백질을 함유하고, 상기 융합 단백질은 함께 연결된 두 개의 서열들을 함유하며, 여기에서 한 서열은 숙주 세포에 대해 이종성인 단백질체 유도 서열이고 다른 한 서열은 관심 대상의 생성물의 서열인, 비-고등 식물 진핵 숙주 세포.
제 1 항에 있어서, RPBLAs의 밀도가 약 1.1 내지 약 1.35 g/ml 인 숙주 세포.
제 1 항에 있어서, 상기 융합 단백질이 단백질체 유도 서열 및 관심 대상의 생성물의 서열 간의 링커(linker) 서열을 더 포함하는 숙주 세포.
제 1 항에 있어서, 단백질체 유도 서열이 프롤라민(prolamiin) 또는 개질 프롤라민을 함유하는 숙주 세포.
제 4 항에 있어서, 상기 단백질체 유도 서열이 프롤라민 서열인 숙주 세포.
제 5 항에 있어서, 프롤라민 서열이 감마-제인(zein), 알파-제인 또는 쌀 프롤라민인 숙주 세포.
다음 단계들을 함유하는 융합 단백질의 제조방법:

(a) (i) 프레임 내에서 하기 (ii)에 작동적으로 연결된 단백질체 유도 서열 (PBIS)을 코딩하는 제 1 핵산, 및 (ii) 관심 대상의 폴리펩티드 생성물을 코딩하는 제 2 핵산 서열을 함유하는 핵산 서열을 사용하여, 비-고등 식물 진핵 숙주 세포들을 형질 전환시키는 단계;

(b) 상기 형질 전환된 숙주 세포들을 일정 시간 동안, 융합 단백질의 발현 및 발현된 융합 단백질의 재조합 단백질체 유사 조립체들(RPBLAs)로의 조립에 적합한 배양 조건 하에서 유지시키는 단계.
제 7 항에 있어서, 제 1 핵산 서열 (i)의 3' 말단이 제 2 핵산 서열 (ii)의 5' 말단에 연결되는 제조 방법.
제 7 항에 있어서, 상기 핵산이 PBIS 및 관심 대상의 폴리펩티드 생성물 사이의 링커 서열을 암호화하는 제조 방법.
제 7 항에 있어서, 상기 숙주 세포들이 진균 세포들, 특히 효모 세포들인 제조 방법.
제 7 항에 있어서, 숙주 세포들이 조류(algal) 세포들인 제조 방법.
제 7 항에 있어서, 상기 숙주 세포들이 동물 세포들, 특히 포유류 세포들인 제조 방법.
제 7 항에 있어서, 발현된 융합 단백질을 회수하는 단계를 더 포함하는 제조 방법.
제 7 항에 있어서, 상기 단백질체 유도 서열이 프롤라민 또는 개질 프롤라민을 함유하는 제조 방법.
제 14 항에 있어서, 프롤라민 서열이, 하기를 포함하는 개질 프롤라민인 제조 방법: (a) 신호 펩티드 서열, (b) 단백질 감마-제인의 반복 도메인 헥사펩티드 PPPVHL (서열번호 1)의 하나 이상의 복제물들의 서열, 및 (c) 감마-제인의 ProX 도메인 전부 또는 일부의 서열.
제 14 항에 있어서, 프롤라민 서열이 감마-제인, 알파-제인 또는 쌀 프롤라민인 방법.
제 7 항에 있어서, 숙주 세포들을 형질 전환하는데 사용된 핵산 서열이 하나 이상의 조절 서열들을 포함하는 발현 벡터에 존재하는 제조 방법.
제 17 항에 있어서, 상기 하나 이상의 조절 서열들이 프로모터를 포함하는 제조 방법.
(i) 하기 (ii)에 연결된 단백질체 유도 서열 및 (ii) 관심 대상의 폴리펩티드 생성물을 함유하는 융합 단백질을 암호화하는 유전자를 규정하는, 외생의 핵산 절편에 작동적으로 연결된 하나 이상의 조절 서열들을 함유하는 벡터를 포함하는 재조합 핵산 분자.
제 19 항에 있어서, 상기 벡터의 하나 이상의 조절 서열들이, 적합성(compatible) 진핵 숙주 세포에서 상기 유전자의 발현을 유도하는데 적합한 프로모터를 포함하는 핵산.