KR20070083870A

KR20070083870A - 콜라겐 생산성 식물 및 그 생성 및 사용방법

Info

Publication number: KR20070083870A
Application number: KR1020077009817A
Authority: KR
Inventors: 오데드 슈즈요브; 하난 스타인
Original assignee: 콜플랜트 리미티드
Priority date: 2004-09-29
Filing date: 2005-09-28
Publication date: 2007-08-24
Also published as: JP2008514225A; CA2582051C; ATE479762T1; DE602005023332D1; IL182320A0; CN101065491A; JP2012085644A; HK1114405A1; JP5100386B2; JP5517309B2; EP3312282A1; EP1809751A2; HK1251611B; MX2007003767A; ZA200703369B; EP2816117A3; EP3088528A1; BRPI0516303A; CN101065491B; NZ554787A

Abstract

식물에서 콜라겐을 생산하는 방법 및 콜라겐을 생성하는 식물이 제공된다. 본 방법은 내인성(endogenous) P4H 활성이 없는 세포내 컴파트먼트(subcellular compartment)에 콜라겐 알파 사슬을 축적할 수 있는 방식으로, 식물에서 적어도 한 형태의 콜라겐 알파 사슬을 발현하여 식물에서 콜라겐을 생산함으로써 수행된다.

Description

식물에서 생산된 재조합 콜라겐{Recombinant collagen produced in plant}

본 발명은 콜라겐 생산성 식물, 및 이를 생성 및 사용하는 방법에 관한 것이다. 더욱 특히, 본 발명은 천연의 삼중나선 구조의 I형 콜라겐 섬유를 형성할 수 있는 하이드록실화 콜라겐을 고수준으로 생성할 수 있는 식물을 생산하기 위한 신규한 접근법에 관한 것이다.

콜라겐은 척추동물 및 다른 많은 다세포 생물의 구조적 완전성에 관여하는 주된 구조 단백질이다. I형 콜라겐은 전형적인 섬유상 콜라겐을 대표하며, 대부분의 조직에 존재하는 주된 콜라겐 형태이다.

I형 콜라겐은 뼈와 힘줄의 주요 콜라겐 성분이며, 피부, 대동맥 및 폐에 다량 존재한다. I형 콜라겐 섬유는 우수한 신장강도(tensile strength) 및 제한된 확장능(limited extensibility)을 제공한다. I형 콜라겐의 가장 풍부한 분자형은 두 개의 상이한 알파 사슬 [알파 1(I)]₂ 및 알파 2(1)로 구성된 헤테로트리머이다(Inkinen, 2003). 모든 섬유상 콜라겐 분자는 반복 Gly-X-Y 트리플렛(triplet)(여기서, X 및 Y는 임의의 아미노산이나 종종 이미노산 프롤린 및 하이드록시프롤린이다)으로 구축된 세 개의 폴리펩티드 사슬을 가진다.

섬유 형성성 콜라겐은 구상 N- 및 C-말단 확장 펩티드를 가진 전구체 프로콜라겐으로서 합성된다. 프로콜라겐의 생합성은 프롤린과 리신의 하이드록실화, N-결합과 O-결합의 글리코실화 및 사슬내 및 사슬간 모두의 디설파이드-결합 형성을 비롯한 다수의 상이한 번역후수식을 포함하는 복잡한 공정이다. 이들 수식을 수행하는 효소는 상황에 맞게 정확히 정렬되고 열적으로 안정한 삼중-나선형 분자를 폴딩(folding) 및 집합(assembly)하도록 작용한다.

각각의 프로콜라겐 분자는 세 가지 성분의 폴리펩티드 사슬로부터 조면소포체내에 집합한다. 폴리펩티드 사슬은 소포체막에 걸쳐 번역과 동시에 전위되기 때문에, 프롤린과 리신 잔기의 하이드록실화는 Gly-X-Y 반복 영역내에서 일어난다. 폴리펩티드 사슬이 소포체 내강내로 완전히 전위되면, C-프로펩티드는 폴딩된다. 이어, 세 개의 프로-알파 사슬은 그의 C-프로펩티드를 통해 결합하여, Gly-X-Y 반복 영역으로 하여금 그의 C-말단부에서 핵형성점(nucleation point)을 형성하게 하는 트리머 분자를 형성하여, 사슬을 정확하게 정렬시킨다. 그후, Gly-X-Y 영역은 C-에서-N 방향으로 폴딩되어 삼중나선구조를 형성한다.

프롤린의 하이드록실화는 체온에서 삼중나선구조의 안정성을 확보하는데 필요하며, 일단 형성되면 삼중나선구조는 더 이상 하이드록실화 효소에 대한 기질로서의 역할을 하지 않으므로, 폴리펩티드 사슬 수식과 삼중나선형 형성 사이의 시간적 관계는 중요하다. C-프로펩티드(및 보다 적은 정도로 N-프로펩티드)는 세포를 통과하는 동안 프로콜라겐의 가용성을 유지한다(Bulleid et al., 2000). 프로콜라겐 분자를 세포외기질내로 분비하는 동안 또는 분비한 후, 프로펩티드는 프로콜라 겐 N- 및 C-프로티네이즈에 의해 제거되고, 이로 인해 섬유내로 콜라겐 분자의 특발성 자기집합(spontaneous self-assembly)이 유발된다(Hulmes, 2002). 프로콜라겐 N- 및 C-프로티네이즈에 의한 프로펩티드의 제거는 프로콜라겐의 용해도를 >10000-배까지 낮추며, 섬유내로의 콜라겐의 자기-집합을 개시하는데 필요충분하다. 삼중-나선형 도메인의 말단에 텔로펩티드라 불리는 짧은 비-삼중나선형 펩티드는 이러한 집합 공정에 있어서 중요한데, 이는 섬유상 구조내에 콜라겐 분자를 정확한 등록(registration)시키고 자기집합에 대한 임계농도를 낮춘다(Bulleid et al., 2000). 본래, 효소 프롤릴-4-하이드록실레이즈(P4H)에 의해 프롤린을 하이드록실화하여 콜라겐 사슬내에 하이드록시프롤린의 잔기를 형성하기 위해서는 콜라겐의 삼중-나선형 구조의 안정성이 필요하다.

콜라겐 사슬을 발현하는 식물은 당업계에 공지되어 있다[참조예, 미국 특허 제 6,617,431 호 및 (Merle et al., 2002, Ruggiero et al., 2000)]. 식물은 하이드록시프롤린-함유 단백질을 합성할 수 있지만, 식물 세포에서 하이드록시프롤린의 합성을 담당하는 프롤릴 하이드록실레이즈는 포유동물 P4H에 비해 비교적 느슨한 기질 서열 특이성을 나타내며, 이로써 Gly-X-Y 트리플렛의 Y 위치에만 하이드록시프롤린을 함유하는 콜라겐을 생산하는 것이 콜라겐 및 P4H 유전자의 식물 동시-발현에 필요하다(Olsen et al, 2003).

식물에 본래 존재하는 하이드록실화 기구에 의존하는 인간 콜라겐의 생산법에 의해서는 프롤린 하이드록실화가 불량한 콜라겐이 생성되었다(Merle et al., 2002). 이러한 콜라겐은 30℃ 이하의 온도에서 그의 삼중-나선형 구조가 용융되거 나 느슨해진다. 콜라겐과 프롤릴-하이드록실레이즈의 동시-발현은 체온에서 적용하기에 생물학적으로 적합한 안정한 하이드록실화 콜라겐과 함께 생성된다(Merle et al., 2002).

리실 하이드록실레이즈(LH,EC 1.14.11.4), 갈락토실트랜스페라제(EC 2.4.1.50) 및 글루코실트랜스페라제(EC 2.4.1.66)는 콜라겐의 번역후수식에 관여하는 효소이다. 이들은 하이드록시리실, 갈락토실하이드록시리실 및 글루코실갈락토실 하이드록시리실 잔기에 특이적인 위치에서 리실 잔기를 순차적으로 수식시킨다. 이들 구조는 콜라겐의 특유한 성질이며, 그의 작용성에 필수적이다(Wang et al, 2002). 단일 인간 효소인 리실 하이드록실레이즈 3(LH3)은 하이드록시리신 결합 탄수화물을 형성하는 연속적인 세 단계 모두를 촉매할 수 있다(Wang et al, 2002).

담배(tobacco)에서 발현된 인간 콜라겐의 하이드록시리신은 소 콜라겐에서 발견된 2%의 하이드록시리신 보다 적게 형성된다(잔기의 0.04%/잔기의 1.88%). 이는 식물 내인성 리실 하이드록실레이즈가 콜라겐에서 리신을 충분히 하이드록시화할 수 없음을 제시한다.

본 발명을 실시하는 동안, 본 발명자들은 콜라겐 사슬의 효율적인 하이드록실화가 이러한 폴리펩티드를 정확히 수식할 수 있는 효소와 함께 콜라겐 사슬의 고립화(sequestering)에 의존한다는 것을 밝혀내었다.

발명의 요약

본 발명의 하나의 일면에 따라, 내인성(endogenous) P4H 활성이 없는 세포내 컴파트먼트(subcellular compartment)에 적어도 한 형태의 콜라겐 알파 사슬 및 외인성 P4H를 축적할 수 있는 방식으로, 식물 또는 단리된 식물 세포에서 적어도 한 형태의 콜라겐 알파 사슬 및 외인성 P4H를 발현하여 식물에서 콜라겐을 생성하는 것을 포함하여, 식물 또는 단리된(isolated) 식물 세포에서 콜라겐을 생산하는 방법이 제공된다.

이하 기술되는 본 발명의 바람직한 일례에서 추가의 특징에 따라, 내인성 P4H 활성이 없는 세포내 컴파트먼트에서 외인성 LH3를 발현하는 것을 추가로 포함하는 방법이 제공된다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 적어도 한 형태의 콜라겐 알파 사슬은 아포플라스트(apoplast) 또는 액포를 표적화하기 위한 시그널 펩티드를 포함한다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 적어도 한 형태의 콜라겐 알파 사슬은 ER 표적화 또는 보유(retention) 서열을 가지지 않는다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 적어도 한 형태의 콜라겐 알파 사슬은 식물의 DNA-함유 세포기관(organelle)에서 발현된다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 외인성 P4H는 아포플라스트 또는 액포를 표적화하기 위한 시그널 펩티드(signal peptide)를 포함한다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 외인성 P4H는 ER 표적화 또는 보유 서열을 가지지 않는다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 외인성 P4H는 식물의 DNA-함유 세포기관에서 발현된다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 적어도 한 형태의 콜라겐 알파 사슬은 알파 1 사슬이다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 적어도 한 형태의 콜라겐 알파 사슬은 알파 2 사슬이다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 적어도 한 형태의 콜라겐 알파 사슬은 C-말단 및/또는 N-말단 프로펩티드를 포함한다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 식물은 담배(Tobacco), 옥수수(Maize), 자주개자리(Alfalfa), 벼(Rice), 감자(Potato), 대두(Soybean), 토마토(Tomato), 밀(Wheat), 보리(Barley), 캐놀라(Canola) 및 목화(Cotton)로 구성된 그룹중에서 선택된다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 적어도 한 형태의 콜라겐 알파 사슬 또는 외인성 P4H는 식물의 부분에서만 발현된다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 식물의 부분은 잎, 종자, 뿌리, 덩이줄기 또는 줄기이다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 외인성 P4H는 적어도 한 형태의 콜라겐 알파 사슬의 Gly-X-Y 트리플렛의 Y 위치를 특이적으로 하이드록실화할 수 있다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 외인성 P4H는 인간 P4H이다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 식물은 스트레스 조건(stress condition)에 적용된다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 스트레스 조건은 건조(drought), 염분(salinity), 손상(injury), 저온(cold) 및 스트레스 유발 화합물의 분무(spraying)로 구성된 그룹중에서 선택된다.

본 발명의 또 다른 일면에 따라, 콜라겐 알파 사슬이 인간 세포에서 발현할 때 생산된 것과 동일한 하이드록실화 패턴을 가진 콜라겐 알파 사슬을 축적할 수 있는 유전자 조작(genetically modified) 식물 또는 단리된 식물 세포가 제공된다.

본 발명의 또 따른 일면에 따라, 내인성 P4H 활성이 없는 세포내 컴파트먼트에 콜라겐 알파 사슬을 축적할 수 있는 유전자 조작 식물 또는 단리된 식물 세포가 제공된다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 유전자 조작 식물은 외인성 P4H를 추가로 포함한다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 적어도 한 형태의 콜라겐 알파 사슬은 ER 표적화 또는 보유 서열을 가지지 않는다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 적어도 한 형태의 콜라겐 알파 사슬은 식물의 DNA-함유 세포기관에서 발현된다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 외인성 P4H는 아포플라스트 또는 액포를 표적화하기 위한 시그널 펩티드를 포함한다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 콜라겐 알파 사슬은 알파 1 사슬이다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 콜라겐 알파 사슬은 알파 2 사슬이다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 콜라겐 알파 사슬은 C-말단 및/또는 N-말단 프로펩티드를 포함한다.

본 발명의 또 다른 일면에 따라, 콜라겐 알파 1 사슬을 축적할 수 있는 제 1 유전자 조작 식물 및 콜라겐 알파 2 사슬을 축적할 수 있는 제 2 유전자 조작 식물을 포함하는 식물 시스템이 제공된다.

본 발명의 또 다른 일면에 따라, 콜라겐 알파 1 사슬 및 콜라겐 알파 2 사슬을 축적할 수 있는 제 1 유전자 조작 식물 및 P4H를 축적할 수 있는 제 2 유전자 조작 식물을 포함하는 식물 시스템이 제공된다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 제 1 유전자 조작 식물 및 제 2 유전자 조작 식물 중 적어도 하나는 외인성 외인성 P4H를 추가로 포함한다.

본 발명의 또 다른 일면에 따라, (a) 제 1 식물에서 콜라겐 알파 1 사슬을 발현하고; (b) 제 2 식물에서 콜라겐 알파 2 사슬을 발현하며, 여기서 제 1 식물 및 제 2 식물에서의 발현은 콜라겐 알파 1 사슬 및 콜라겐 알파 2 사슬이 각각 내인성 P4H 활성이 없는 세포내 컴파트먼트에 축적될 수 있도록 설정되고; (c) 제 1 식물 및 제 2 식물을 교배하고 콜라겐 알파 1 사슬 및 콜라겐 알파 2 사슬을 발현하는 후손을 선별하여 섬유상 콜라겐을 생산하는 것을 포함하여 섬유상 콜라겐을 생산하는 방법이 제공된다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 상기 방법은 제 1 식물 및 제 2 식물 각각에서 외인성 P4H를 발현시키는 것을 추가로 포함한다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 각각의 콜라겐 알파 1 사슬 및 콜라겐 알파 2 사슬은 아포플라스트 또는 액포를 표적화하기 위한 시그널 펩티드를 포함한다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 각각의 콜라겐 알파 1 사슬 및 콜라겐 알파 2 사슬은 ER 표적화 또는 보유 서열을 가지지 않는다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 단계 (a) 및 (b)는 식물의 DNA-함유 세포기관에서 발현을 통해 수행된다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 각각의 콜라겐 알파 1 사슬 및 콜라겐 알파 2 사슬은 C-말단 및/또는 N-말단 프로펩티드를 포함한다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 제 1 식물 및 제 2 식물은 스트레스 조건에 적용된다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 스트레스 조건은 건조, 염분, 손상, 중금속 독성 및 저온 스트레스로 구성된 그룹 중에서 선택된다.

본 발명의 또 다른 일면에 따라, (a) 제 1 식물에서, 콜라겐 알파 1 사슬 및 콜라겐 알파 2 사슬을 발현하며, 여기서 제 1 식물에서의 발현은 콜라겐 알파 1 사슬 및 콜라겐 알파 2 사슬이 각각 내인성 P4H 활성이 없는 세포내 컴파트먼트에 축적될 수 있도록 설정되고; (b) 제 2 식물에서, 내인성 P4H 활성이 없는 세포내 컴파트먼트에 축적될 수 있는 외인성 P4H를 발현하며; (c) 제 1 식물 및 제 2 식물을 교배하고 콜라겐 알파 1 사슬, 콜라겐 알파 2 사슬 및 P4H를 발현하는 후손을 선별하여 섬유상 콜라겐을 생산하는 것을 포함하여, 섬유상 콜라겐을 생산하는 방법이 제공된다.

본 발명의 또 다른 일면에 따라, 식물에서 작용하는 프로모터의 전사 제어하에 위치된 인간 P4H를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 작제물이 제공된다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 상기 프로모터는 CaMV 35S 프로모터, 유비퀴틴(Ubiquitin) 프로모터, rbcS 프로모터 및 SVBV 프로모터로 구성된 그룹 중에서 선택된다.

본 발명의 또 다른 일면에 따라, 콜라겐 알파 1 사슬, 콜라겐 알파 2 사슬, P4H, LH3 및 프로테아제 C 및/또는 프로테아제 N을 발현할 수 있는 유전자 조작 식물 또는 단리된 식물 세포가 제공된다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 콜라겐 알파 1 사슬 및 콜라겐 알파 2 사슬은 각각 내인성 식물 P4H 활성이 없는 세포내 컴파트먼트에 축적될 수 있다.

본 발명의 또 다른 일면에 따라, 포유동물 콜라겐의 것과 동일한 온도 안정성을 가진 콜라겐을 축적할 수 있는 유전자 조작 식물 또는 단리된 식물 세포가 제공된다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 콜라겐은 I형 콜라겐이다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 포유동물 콜라겐은 인간 콜라겐이다.

본 발명의 또 다른 일면에 따라, 식물에서 발현하기 위해 최적화된 콜라겐-코딩 서열이 제공된다.

기술된 바람직한 일례에서 또 다른 추가의 특징에 따라, 콜라겐-코딩 서열은 서열번호: 1로 정의된 것과 같다.

본 발명은 인간 콜라겐의 것과 유사한 특성을 가진 콜라겐으로 집합가능한 정확히 하이드록실화된 콜라겐 사슬을 발현할 수 있는 식물을 제공함으로써, 현재 공지된 결점을 성공적으로 극복한다.

달리 정의되지 않는 한, 본 명세서에 사용된 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야에 있는 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에 기술된 것과 유사 또는 동등한 방법 및 물질이 본 발명의 실시 또는 시험에 사용될 수 있지만, 적합한 방법 및 물질은 아래 기술된다. 불일치한 경우에, 정의를 비롯한 특허 명세서는 조절될 것이다. 또한, 물질, 방법 및 실시예는 설명을 위한 것일 뿐, 제한하고자 의도된 것이 아니다.

본 발명은 첨부된 도면과 관련하여 단지 일례로서 여기에 기술된다. 도면과 관련하여 상세하게는 도시한 도면은 일례로서, 단지 본 발명의 바람직한 실시예를 예시적으로 설명하기 위한 것이며, 본 발명의 원리 및 개념적 양상을 가장 유용하고 쉽게 이해할 수 있게 설명하도록 하기 위해 나타낸다. 이 점에서, 본 발명을 근본적으로 이해하는데 필요한 설명보다 더 상세하게 본 발명을 구조적으로 설명하고자 하는 시도는 이루어지지 않았지만, 도면에 의한 설명은 본 발명의 일부 형태가 실제로 어떻게 구체화될 수 있는지를 당업자들에게 명백하게 한다.

도면에서:

도 1a-d는 시험 식물을 형질전환하는데 사용된 각종 발현 카세트 및 벡터의 작제(construction)를 설명한다. 본 연구의 일부로서 합성된 모든 코딩 서열은 담배에서 발현하기 위해 최적화되었다.

도 2는 각종 동시-형질전환 접근법을 설명한다. 각각의 발현 카세트는 코딩 서열의 축약명으로 나타내었다. 코딩 서열을 표 1에 명시하였다. 각각의 동시-형질전환은 두 개의 pBINPLUS 바이너리 벡터(binary vector)에 의해 수행되었다. 각각의 직사각형은 한 개, 두 개 또는 세 개의 발현 카세트를 운반하는 단일 pBINPLUS 벡터를 나타낸다. 프로모터 및 터미네이터는 실시예 1에 명시되어 있다.

도 3은 콜라겐 알파 1 (324bp 단편) 또는 콜라겐 알파 2 (537bp 단편) 또는 둘 다에 대해 양성적인 식물을 나타내는 형질전환주의 다중 PCR 스크리닝이다.

도 4는 동시-형질전환 2, 3 및 4에 의해 생성된 유전자이식 식물의 웨스턴 블롯 분석이다. 총 가용성 단백질은 담배 동시-형질전환주 2, 3 및 4로부터 추출하였고, 항 -콜라겐 I 항체(케미콘 인코포레이션(Chemicon Inc.)로부터의 #AB745)를 가지고 시험하였다. 사이즈 마커(size marker)는 페르멘타스 인코포레이션(Fermentas Inc.)으로부터의 #SM0671이었다. W.T.는 야생형 담배이다. 콜라겐 I형 알파 1 또는 알파 2 또는 둘 다에 대해 PCR 양성인 양성 콜라겐 밴드는 식물에 서 볼 수 있다. 인간 태반(펩신 분해에 의해 인간 태반으로부터 추출된 케미콘 인코포레이션의 #CC050)으로부터의 500 ng 콜라겐 I형의 양성 대조군 밴드는 유전자이식 식물 샘플에서의 총 가용 단백질(약 150 ㎍)의 약 0.3%를 나타낸다. 인간 콜라겐 샘플에서 약 140 kDa의 더 큰 밴드는, 콜라겐 I형 항체(케미콘 인코포레이션으로부터의 #MAB1913)의 항 카복시-말단 프로펩티드에 의해 검출된 바, 그의 C-프로펩티드를 가진 프로콜라겐이다. 인간 콜라겐 샘플에서 약 120 kDa의 더 작은 밴드는 프로펩티드를 갖지 않는 콜라겐이다. 그의 통상적인 조성에 기인하여, 프롤린 풍부 단백질(콜라겐 포함)은 기대한 것보다 큰 분자량을 가진 밴드로서 폴리아크릴아미드 겔상에서 일관되게 이동한다. 따라서, 약 95 kDa의 분자량을 가진 프로펩티드를 갖지 않는 콜라겐 사슬은 약 120 kDa의 밴드로서 이동한다.

도 5는 동시-형질전환 8번(콜라겐 사슬에 번역과 동시에 융합된 아포플라스트 시그널을 운반함)에 의해 생성된 유전자이식 식물의 웨스턴 블롯 분석이다. 총 가용 단백질은 유전자이식 담배 잎으로부터 추출하였고, 항-콜라겐 I형 항체(케미콘 인코포레이션으로부터의 #AB745)를 가지고 시험하였다. 양성 콜라겐 알파 2 밴드는 식물 8-141에서 볼 수 있다. 인간 태반으로부터의 콜라겐 I형(케미콘 인코포레이션으로부터의 #CC050)은 대조군으로 작용하였다.

도 6a-b는 열처리 및 트립신 또는 펩신 분해에 의해 정량화된 콜라겐의 삼중나선형 집합 및 열안정성을 나타낸다. 도 6a에서 - 담배 2-9(콜라겐 알파 1만 발현하고 P4H는 발현하지 않음) 및 3-5(콜라겐 알파 1+2 및 인간 P4H 알파 및 베타 서브유닛 둘 다를 발현함)로부터의 총 가용 단백질을 열처리(38℃ 또는 43℃에서 15분)한 다음 트립신 분해(실온에서 20분)하고, 웨스턴 블롯법으로 항-콜라겐 I형 항체를 가지고 시험하였다. 양성 대조군은 500 ng 인간 콜라겐 I형 + 야생형 담배의 총 가용 단백질의 샘플이었다. 도 6b에서 - 총 가용 단백질을 유전자이식 담배 13-6[콜라겐 I형 알파 1 및 알파 2 사슬(화살표로 표시함), 인간 P4H 알파 및 베타 서브유닛 및 인간 LH3를 발현함)로부터 추출하고, 열처리(33℃, 38℃ 또는 42℃에서 20분)한 다음, 즉시 얼음상에서 냉각하여 삼중-나선형의 재집합을 방지하고, 실온(약 22℃)에서 30분간 펩신과 배양한 다음, 항-콜라겐 I형 항체(케미콘 인코포레이션으로부터의 #AB745)을 가지고 표준 웨스턴 블롯법으로 시험하였다. 양성 대조군은 야생형 담배로부터 추출된 총 가용 단백질에 추가된 약 50 ng 인간 콜라겐 I형(펩신 분해에 의해 인간 태반으로부터 추출된 케미콘 인코포레이션으로부터의 #CC050)의 샘플이었다.

도 7은 야생형 담배상에서 수행된 노던(Northern) 블롯 분석을 나타낸다. 블롯은 담배 P4H cDNA를 가지고 프로브하였다(probed).

도 8은 동시-형질전환 2, 3 및 13에 의해 생성된 유전자이식 식물의 웨스턴 블롯 분석이다. 총 가용 단백질은 담배 동시-형질전환주로부터 추출하였고, 항 인간 P4H 알파 및 베타, 및 항-콜라겐 I형 항체를 가지고 시험하였다.

바람직한 일례의 설명

본 발명은 포유동물 콜라겐의 특징을 보이는 콜라겐 및 콜라겐 섬유를 생산하는데 사용될 수 있는 콜라겐을 발현 및 축적하는 식물에 관한 것이다.

본 발명의 원리 및 조작은 도면 및 첨부되는 발명의 상세한 설명에 의해 더욱 이해될 수 있다.

본 발명의 적어도 하나의 구체예를 상세히 설명하기에 앞서, 본 발명은 이후의 발명의 상세한 설명에 나타내었거나 도면에 나타낸 구성요소의 상세 구조 및 배열로 그의 적용이 제한되는 것이 아님을 이해하여야 한다. 본 발명은 그 외에도 구체화할 수 있거나 다양한 방법으로 실행 또는 수행될 수 있다. 또한, 여기에 사용하는 표현 및 용어는 설명을 위한 것이지 제한하는 것으로서 간주되어서는 안되는 것으로 이해하여야 한다.

콜라겐 생산성 식물은 당업계에 공지되어 있다. 이러한 식물은 콜라겐 뿐만 아니라 콜라겐 사슬을 생산하는데 사용될 수 있지만, 이러한 사슬은 부정확하게 하이드록실화되고, 이로써 식물 또는 식물아닌 곳에서의 자기집합은 본질적으로 불안정한 콜라겐으로 이르게 한다.

본 발명을 수행하는 동안, 본 발명자들은 콜라겐 사슬을 정확하게 하이드록실화함으로써 인간 I형 콜라겐의 특징(예, 온도 안정성)과 거의 유사한 콜라겐을 식물에서 생산할 수 있는 식물 발현 접근법을 발명하였다.

즉, 본 발명의 하나의 일면에 따라, 적어도 한 형태의 콜라겐 알파 사슬을 발현할 수 있고, 이를 내인성 P4H 활성이 없는 세포내 컴파트먼트에 축적할 수 있는 유전자 조작 식물이 제공된다.

본 명세서에 사용된 어구 "유전자 조작 식물"은 외인성 폴리뉴클레오티드 서열에 의해 안정하거나 일과적으로(transiently) 형질전환되는 임의의 하등(예, 이 끼) 또는 고등(관다발) 식물 또는 조직 또는 그의 단리 세포를 의미한다. 식물의 예로는 담배, 옥수수, 자주개자리, 벼, 감자, 대두, 토마토, 밀, 보리, 캐놀라, 목화, 당근, 및 이끼와 같은 하등 식물이 포함된다.

본 명세서에 사용된 어구 "콜라겐 사슬"은 콜라겐 섬유, 바람직하게는 I형 콜라겐 섬유의 알파 1 또는 2 사슬과 같은 콜라겐 서브유닛을 말한다. 본 명세서에 사용된 어구 "콜라겐"은 I형 콜라겐의 경우 두 개의 알파 1 사슬 및 하나의 알파 2 사슬을 포함하는 집합(assembled) 콜라겐 트리머를 말한다. 콜라겐 섬유는 말단 프로펩티드 C 및 N이 없는 콜라겐이다.

본 명세서에 사용된 어구 "내인성 P4H가 없는 세포내 컴파트먼트"는 식물 P4H, 또는 식물-유사 P4H 활성을 가진 효소를 포함하지 않는 세포의 임의의 구획화된 영역을 말한다. 이러한 세포내 컴파트먼트의 예로는 엽록체, 미토콘드리아 등과 같은 세포기관 뿐만 아니라 액포, 아포플라스트 및 세포질이 포함된다.

임의 형태의 콜라겐 사슬은 본 발명의 유전자 조작 식물에 의해 발현될 수 있다. 예로서 섬유-형성성 콜라겐(I형, II형, III형, V형 및 XI형), 망-형성성 콜라겐(IV형, VIII형 및 X형), 섬유 표면과 연관된 콜라겐(IX형, XII형 및 XIV형), 막횡단 단백질로서 생기는 콜라겐(XIII형 및 XVII형) 또는 11-nm 주기 주상 필라멘트(periodic beaded filament)를 형성하는 콜라겐(VI형)이 포함된다. 추가의 설명은 문헌[Hulmes, 2002]을 참조하기 바란다.

바람직하게도, 발현된 콜라겐 사슬은 I형 콜라겐의 알파 1 및/또는 2 사슬이다. 발현된 콜라겐 알파 사슬은 임의의 동물로부터 유래된 임의의 폴리뉴클레오티 드 서열에 의해 코딩될 수 있다. 바람직하게도 콜라겐 알파 사슬을 코딩하는 서열은 인간이고，서열번호: 1 및 4로 정의된다.

전형적으로, 식물에서 발현된 알파 콜라겐 사슬은 그의 말단 프로펩티드(즉, 프로펩티드 C 및 프로펩티드 N)를 포함할 수도 있고 포함하지 않을 수도 있다.

루기에로(Ruggiero) 등(2000)은 식물 단백질분해 활성에 의한 프로콜라겐의 프로세싱이 인간에서의 정상적 프로세싱과는 상이하며, 절단 부위는 알려지지 않았지만 프로펩티드 C가 식물 단백질분해 활성에 의해 제거된다는 것을 언급하였다. C 프로펩티드의 절단은 트리머의 집합 이전에 프로콜라겐 펩티드상에서 일어날 수 있다(세 개의 C-프로펩티드의 회합(association)인 트리머의 집합을 개시하는데 있어서 필수적임).

식물 단백질분해 활성에 의한 N-프로펩티드 절단은 미발육식물(plantlet)에서가 아니라 완전히 자란 식물에서 일어난다. 이러한 절단은 N 텔로펩티드로부터 2 개의 아미노산을 제거한다(17 개중 2 개)

C-프로펩티드(및 보다 적은 정도로 N-프로펩티드)는 동물 세포를 통과하는 동안 프로콜라겐의 가용성을 유지하며(Bulleid et al., 2000), 식물 세포에서 유사한 효과를 가지는 것으로 기대된다. 프로콜라겐 분자를 세포외기질내로 분비하는 동안 또는 분비한 후, 프로펩티드는 프로콜라겐 N- 및 C-프로티네이즈에 의해 제거되고, 이로 인해 섬유내로 콜라겐 분자의 특발성 자기집합을 유발시킨다(Hulmes, 2002). 프로콜라겐 N- 및 C-프로티네이즈에 의한 프로펩티드의 제거는 프로콜라겐의 용해도를 >10000-배까지 낮추며, 섬유내로의 콜라겐의 자기-집합을 개시하는데 필요충분하다. 섬유상 구조내에 콜라겐 분자를 정확히 등록하고 자기집합에 대한 임계농도를 낮추는, 삼중-나선형 도메인의 말단에 텔로펩티드라 불리는 짧은 비-삼중나선형 펩티드는 이러한 집합 공정에 있어서 중요하다(Bulleid et al., 2000). 선행기술에는 콜라겐을 생산하는 동안 프로펩티드를 절단하기 위한 펩신의 용도가 개시되어 있다(Bulleid et al., 2000). 그러나, 펩신은 텔로펩티드를 손상시켜, 결과적으로 펩신-추출 콜라겐은 정연된(ordered) 섬유상 구조를 형성할 수 없다(Bulleid et al 2000).

인간 P4H의 베타 서브유닛을 형성하는 단백질 디설파이드 이소메라제(PDI, protein disulfide isomerase)는 트리머 집합 이전에 C-프로펩티드와 결합함으로써 사슬 집합 동안 분자 샤페론(chaperone)으로서 작용하는 것으로 나타났다(Ruggiero et al, 2000). 상이한 식물에서 발현된 인간 프로콜라겐 I형 N-프로티네이즈 및 프로콜라겐 C-프로티네이즈의 사용에 의해, 천연 인간 콜라겐과 더욱 유사하며 정연된 섬유상 구조를 형성할 수 있는 콜라겐을 생성할 수 있다.

발현된 콜라겐 사슬에 N 또는 C 프로펩티드 또는 둘 모두가 포함된 경우, 본 발명의 유전자 조작 식물은 또한 각각의 프로테아제(즉, C 또는 N 또는 둘 다)를 발현한다. 이러한 프로테아제를 코딩하는 폴리뉴클레오티드 서열은 서열번호: 18(프로테아제 C) 및 20(프로테아제 N)에 의해 예시된다. 이러한 프로테아제는 이들이 콜라겐 사슬로서 동일한 세포내 컴파트먼트에 축적되도록 발현될 수 있다.

내인성 P4H 활성이 없는 세포내 컴파트먼트에 발현 콜라겐 사슬의 축적은 몇몇 접근법 중 어느 하나를 통해 수행될 수 있다.

예를 들어, 발현된 콜라겐 사슬은 아포플라스트 또는 세포기관(예, 엽록체)과 같은 세포내 컴파트먼트에 발현 단백질을 표적화시키기 위한 시그널 서열을 포함할 수 있다. 적합한 시그널 서열의 예로는 엽록체 수송 펩티드(Swiss-Prot entry P07689에 포함됨, 아미노산 1-57) 및 미토콘드리아 수송 펩티드(Swiss-Prot entry P46643에 포함됨, 아미노산 1-28)가 포함된다. 다음에 오는 실시부는 적합한 시그널 서열의 추가적인 예 및 식물 세포에서 콜라겐 사슬의 발현시 이러한 시그널 서열을 사용하기 위한 가이드라인을 제공한다.

또한, 콜라겐 사슬의 서열은 식물에서 발현시 콜라겐의 세포 국재화(cellular localization)를 변경하는 방식으로 수식될 수 있다.

상기 언급된 바와 같이, 식물의 ER은 콜라겐 사슬을 정확하게 하이드록실화할 수 없는 P4H를 포함한다. 콜라겐 알파 사슬은 본래 번역후수식되는(부정확한 하이드록실화 포함) ER내로 발현 콜라겐을 보내는 ER 표적화 서열을 포함한다. 즉, ER 표적화 서열의 제거는 임의의 하이드록실화를 비롯한 번역후수식이 없는 콜라겐 사슬의 세포질 축적을 유발할 것이다.

다음에 오는 실시부의 실시예 1은 ER 서열이 없는 콜라겐 서열의 생성을 설명한다.

또한, 콜라겐 사슬은 엽록체 또는 미토콘드리아와 같은 DNA 함유 세포기관에서 발현 및 축적될 수 있다. 엽록체 발현의 추가적인 설명이 이하에 제공된다.

상기 언급된 바와 같이, 알파 사슬의 하이드록실화는 안정한 I형 콜라겐의 집합에 필요하다. 본 발명의 유전자 조작 식물에 의해 발현된 알파 사슬은 내인성 P4H 활성이 없는 컴파트먼트에 축적되기 때문에, 이러한 사슬은 식물, 식물 조직 또는 세포로부터 분리되어 시험관내에서 하이드록실화되어야 한다. 이러한 하이드록실화는 Turpeenniemi-Hujanen 및 Myllyla(Concomitant hydroxylation of proline and lysine residues in collagen using purified enzymes in vitro. Biochim Biophys Acta. 1984 Jul 16;800(l):59-65)에 의해 기술된 방법에 의해 달성될 수 있다.

이러한 시험관내 하이드록실화는 콜라겐 사슬을 정확하게 하이드록실화시킬 수 있지만, 이는 달성하기 어렵고 비용이 많이 들 수 있다.

시험관내 하이드록실화의 제한점을 극복하기 위해, 본 발명의 유전자 조작 식물은 또한 바람직하게도 콜라겐 알파 사슬(들)을 정확히 하이드록실화[즉, Gly-X-Y 트리플렛의 프롤린 (Y) 위치만 하이드록실화]할 수 있는 P4H를 동시-발현한다. P4H는 두 개의 서브 유닛 알파 및 베타로 구성된 효소이다. 베타 서브유닛은 또한 샤페론 작용성을 가지지만, 둘 모두 활성 효소를 형성하는데 필요하다.

본 발명의 유전자 조작 식물에 의해 발현된 P4H는 바람직하게는 예를 들어 서열번호: 12 및 14에 의해 코딩되는 인간 P4H이다. 또한, 기질 특이성을 향상시키는 P4H 돌연변이주 또는 P4H 동족체가 또한 사용될 수 있다.

적합한 P4H 동족체가 NCBI 수납(accession) NP_179363에 의해 확인된 아라비돕시스 옥시도리덕타제(Arabidopsis oxidoreductase)에 의해 예시된다. 본 발명자들에 의해 수행된 인간 P4H 알파 서브유닛과 이러한 단백질 서열의 쌍정렬(pairwise alignment)은 식물의 임의의 공지된 P4H 동족체의 기능적 도메인간에 가장 높은 상동성을 나타내었다.

P4H는 발현 콜라겐 사슬과 함께 동시-축적하는데 필요하기 때문에, 따라서 그의 코딩 서열은 바람직하게 변형된다(ER 표적화 등을 방지할 수 있는 결손, 시그널 서열의 첨가).

포유동물 세포에서, 콜라겐은 또한 리실 하이드록실레이즈, 갈락토실트랜스페라제 및 글푸코실트랜스페라제에 의해 수식된다. 이들 효소는 하이드록시리실, 갈락토실하이드록시리실 및 글루코실갈락토실하이드록시리실 잔기에 대한 특이적 위치에서 리실 잔기를 순차적으로 수식시킨다. 단일 인간 효소인 리실 하이드록실레이즈 3(LH3)은 하이드록시리신 결합 탄수화물을 형성하는 연속적인 세 단계 모두를 촉매할 수 있다.

즉, 본 발명의 유전자 조작 식물은 또한 바람직하게도 포유동물 LH3을 발현한다. 서열번호: 22로 정의된 것과 같은 서열을 코딩하는 LH3는 이러한 목적을 위해 사용될 수 있다.

위에 기술된 콜라겐 사슬(들) 및 수식 효소(modifying enzyme)는 식물 작용성 프로모터의 전사 제어(transcriptional control)하에 위치된 알파 사슬 및/또는 수식 효소(예, P4H 및 LH3)를 코딩하는 폴리뉴클레오티드 서열을 포함하는 안정하게 통합되거나(stably integrated) 일과적으로 발현된 핵산 작제물로부터 발현될 수 있다. 이러한 핵산 작제물(본 명세서에서 발현 작제물로서 또한 명명됨)은 전체 식물, 한정된 식물 조직 또는 한정된 식물 세포에 걸쳐 또는 식물의 한정된 성장 단계에 발현하도록 형성될 수 있다. 이러한 작제물은 또한 박테리아 복제에 대 한 복제 기원, 인핸서 요서(enhancer element) 및 선택 마커(예, 항생제 내성)를 포함할 수 있다.

두 개의 발현가능한 삽입물(예, 두 개의 알파 사슬 형태, 또는 알파 사슬과 P4H)을 포함하는 작제물은 바람직하게는 각각의 삽입물에 대한 개개의 프로모터(프로모터)를 포함하거나, 다르게는 이러한 작제물은 단일 프로모터로부터의 삽입 서열 모두를 포함하는 단일 전사 키메라(transcript chimera)를 발현할 수 있다. 이와 같은 경우에, 키메라 전사는 하향 삽입이 그로부터 번역될 수 있도록 두 개의 삽입 서열사이에 IRES 서열을 포함한다.

조직 특이적, 성장 특이적, 구성적 또는 유도가능적일 수 있는 다수의 식물 작용성 발현 프로모터 및 인핸서가 본 발명의 작제물에 의해 사용될 수 있고, 일부의 예가 아래에 제공된다.

본 명세서 및 다음에 오는 청구범위 부분에서 사용된 어구 "식물 프로모터" 또는 "프로모터"는 식물　세포(DNA 함유 세포기관 포함)에서 유전자를 발현하게 할 수 있는 프로모터를 포함한다. 이러한 프로모터는 식물, 박테리아, 바이러스, 진균 또는 동물 기원으로부터 유래될 수 있다. 이러한 프로모터는 구성적(즉, 복수의 식물 조직에서 고수준으로 유전자를 발현가능), 조직 특이적(즉, 복수의 식물 조직 또는 조직들에서 유전자를 발현가능), 유도가능적(즉, 자극하에 유전자를 발현가능) 또는 키메라적(즉, 적어도 두 개의 상이한 프로모터의 부분의 형성)일 수 있다.

따라서, 사용된 식물 프로모터는 구성적 프로모터, 조직 특이적 프로모터, 유도가능적 프로모터 또는 키메라 프로모터일 수 있다.

구성적 식물 프로모터의 예로는 CaMV35S 및 CaMV19S 프로모터, FMV34S 프로모터, 슈가케인 바실리폼 바드나바이러스(sugarcane bacilliform badnavirus) 프로모터, CsVMV 프로모터, 아라비돕시스(Arabidopsis) ACT2/ACT8 악틴(actin) 프로모터, 아라비돕시스(Arabidopsis) 유비퀴틴 UBQ1 프로모터, 보리 잎 티오닌 BTH6 프로모터, 및 라이스 악틴 프로모터 등이 포함되나 이들에 한정되지 않는다.

조직 특이적 프로모터의 예로는 빈 파세올린(bean phaseolin) 저장 단백질 프로모터, DLEC 프로모터, PHS 프로모터, 제인(zein) 저장 단백질 프로모터, 대두로부터의 콘글루틴 감마(conglutin gamma) 프로모터, AT2S1 유전자 프로모터, 아라비돕시스(Arabidopsis)로부터의 ACT11 악틴 프로모터, 브라시카 나푸스(Brassica napus)로부터의 nap A 프로모터 및 포테이토 파타틴(potato patatin) 유전자 프로모터가 포함되나 이들에 한정되지 않는다.

유도가능적 프로모터는 예를 들어, 광선, 온도, 화학물질, 건조, 고염, 삼투압 충격을 포함하는 스트레스 조건, 산화 조건 또는 병원성의 경우에서와 같이 특이적 자극에 의해 유도되는 프로모터로서, 완두 rbcS 유전자로부터 유래된 광선-유도가능 프로모터, 자주개자리 rbcS 유전자로부터 유래된 프로모터, 건조에 활성적인 프로모터 DRE, MYC 및 MYB; 고염 및 삼투압 스트레스에 활성적인 프로모터 INT, INPS, prxEa, Ha hsp17.7G4 및 RD21, 및 병원성 스트레스에 활성적인 프로모터 hsr203J 및 str246C가 포함되나 이들에 한정되지 않는다.

바람직하게도, 작제 삽입물의 발현 내내 다음의 식물 형질전환을 수행하기 위해 본 발명에 의해 사용되는 프로모터는 강력한 구성적 프로모터이다.

본 발명에 사용되는 작제물 형태는 각각의 작제물 형태에서 동일하거나 상이한 선택 마커를 사용하여 동일한 식물내로 동시-형질전환될 수 있음이 인지될 것이다. 다르게는, 제 2 작제물 형태는 제 2 동종 식물내로 도입될 수 있는 반면, 제 1 작제물 형태는 제 1 식물내에 도입될 수 있고, 이어 그로부터의 유전자이식 식물 생성물은 교배되며, 이중 형질전환주를 위해 후손이 선택될 수 있다. 이와 같은 후손의 자가-교배(self-cross)는 두 작제물에 대해 상동성을 가진 라인을 생성하는데 사용될 수 있다.

단자엽 및 쌍자엽 식물 모두에 핵산 작제물을 도입하는 여러 방법이 존재한다[Potrykus, I., Annu. Rev. Plant. Physiol., Plant. Mol. Biol. (1991) 42:205-225; Shimamoto et al., Nature (1989) 338:274-276)]. 이러한 방법은 식물 게놈내로의 핵산 작제물 또는 그의 일부의 안정한 통합 또는 핵산 작제물의 일과적 발현에 의존하며, 이 경우에 이들 서열은 식물의 후손에게 유전되지 않는다.

또한, 핵산 작제물은 엽록체와 같은 DNA 함유 세포기관의 DNA내로 직접 도입될 수 있음이 몇몇 방법에 나타나있다.

본 발명의 핵산 작제물내에 포함된 것과 같은 외인성 서열을 식물 게놈내로 안정하게 게놈 통합하는 두 가지의 주된 방법이 있다:

(i) 아그로박테리움(Agrobacterium)-매개 유전자 전달:[참조예: Klee et al. (1987). Annu. Rev. Plant Physiol. 38:467-486; Klee and Rogers in Cell Culture and Somatic Cell Genetics of Plants, Vol. 6, Molecular Biology of Plant Nuclear Genes, eds. Schell, J., and Vasil, L. K., Academic Publishers, San Diego, Calif. (1989) p. 2-25; Gatenby, in Plant Biotechnology, eds. Kung, S and Arntzen, C. J., Butterworth Publishers, Boston, Mass. (1989) p. 93-112].

(ii) 직접 DNA 흡수:[참조예: Paszkowski et al., in Cell Culture and Somatic Cell Genetics of Plants, Vol. 6, Molecular Biology of Plant Nuclear Genes eds. Schell, J., and Vasil, L. K., Academic Publishers, San Diego, Calif. (1989) p. 52-68; including methods for direct uptake of DNA into protoplasts, Toriyama, K. et al (1988) Bio/Technology 6:1072-1074. DNA uptake induced by brief electric shock of plant cells: Zhang et al. Plant Cell Rep. (1988) 7:379-384. Fromm et al. Nature (1986) 319:791-793. DNA injection into plant cells or tissues by particle bombardment, Klein et al. Bio/Technology (1988) 6:559-563; McCabe et al. Bio/Technology (1988) 6:923-926; Sanford, Physiol. Plant. (1990) 79:206-209; by the use of micropipette systems: Neuhaus et al, Theor. Appl. Genet. (1987) 75:30-36; Neuhaus and Spangenberg, Physiol. Plant. (1990) 79:213-217; or by the direct incubation of DNA with germinating pollen, DeWet et al. in Experimental Manipulation of Ovule Tissue, eds. Chapman, G. P. and Mantell, S. H. and Daniels, W. Longman, London, (1985) p. 197-209; and Ohta, Proc. Natl. Acad. Sci. USA (1986) 83:715-719].

아그로박테리움(Agrobacterium) 시스템은 식물 게놈 DNA내로 통합된 한 정(defined) DNA 세그먼트를 가진 플라스미드 벡터의 사용을 포함한다. 식물 조직의 접종 방법은 식물 종 및 아그로박테리움(Agrobacterium) 전달 시스템에 따라 달라진다. 널리 사용되는 접근법은 전체-식물 분화의 개시에 대한 우수한 소스(source)를 제공하는 임의의 조직 외식편으로 수행될 수 있는 리프-디스크(leaf-dic) 방법이다[Horsch et al. in Plant Molecular Biology Manual A5, Kluwer Academic Publishers, Dordrecht (1988) p. 1-9]. 추가적인 접근법은 진공 침투와 함께 아그로박테리움 (Agrobacterium) 전달 시스템을 사용한다. 아그로박테리움(Agrobacterium) 시스템은 유전자이식 쌍자엽 식물의 발생에 특히 유용하다.

식물 세포내로 직접 DNA를 전달하는 여러 방법이 존재한다. 일렉트로포레이션(electroporation)의 경우, 원형질체는 강한 전기장에 쉽게 노출된다. 마이크로인젝션(microinjection)의 경우, DNA는 매우 작은 마이크로피펫을 사용하여 기계적으로 세포내로 직접 주입된다. 마이크로입자 타격법(microparticle bombardment)에서, DNA는 마그네슘 설페이트 크리스탈, 텅스텐 입자 또는 금 입자와 같은 마이크로프로젝틸(microprojectile)상에 흡착되며, 이 마이크로프로젝틸은 세포 또는 식물 조직내로 물리적으로 가속된다.

형질전환후, 이어 식물을 번식시킨다. 식물 번식의 가장 통상적인 방법은 종자에 의한 것이다. 그러나, 종자는 멘델 규칙에 의해 지배되는 유전 분산(genetic variance)에 따라 식물에 의해 생성되므로, 종자 번식에 의한 재생의 단점은 이형접합성에 기인한 작물의 균일성 결핍이다. 원래, 각각의 종자는 유전학적으로 상이하며, 자신의 특별한 특성을 가지고 성장할 것이다. 따라서, 재생 식물의 특성과 특징이 모 유전자이식 식물과 동일하도록 형질전환 식물을 생산하는 것이 바람직하다. 따라서, 형질전환 식물은 형질전환 식물을 신속하고 일관되게 생산하는 미세증식(micropropagation)에 의해 재생되는 것이 바람직하다.

본 발명의 핵산 작제물에 포함되는 단리된 핵산을 일과적으로 발현하는데 사용될 수 있는 일과적 발현 방법으로는, 일과성 발현을 촉진하는 조건하에서가 아니라 상술한 바와 같은 마이크로인젝션 및 타격법, 및 핵산 작제물을 포함하는 팩킹되거나 팩킹되지 않은 재조합 바이러스 벡터가, 그 안에 확립된 증식 재조합 바이러스가 비-바이러스성 핵산 서열을 발현하도록 식물 조직 또는 세포를 감염시키는데 사용되는 바이러스-매개 발현법이 포함되나 이들에 한정되지 않는다.

식물 숙주의 형질전환에 유용한 것으로 제시된 바이러스로는 CaMV, TWV 및 BV가 포함된다. 식물 바이러스를 사용하는 식물의 형질전환에 대하여 예를 들어 미국 특허 제 4,855,237 호(BGMV); EPA 67,553 (TMV); 일본 특허공개 제 63-14693 호(TMV); EPA 194,809 (BV); EPA 278,667 (BV); 및 문헌[Gluzman, Y. et al. (1988). Communications in Molecular Biology: Viral Vectors, Cold Spring Harbor Laboratory, New York, pp. 172-189 (1988)]에 기술되어 있다. 식물을 비롯한 많은 숙주에서 외래 DNA를 발현하는데 사용하기 위한 가성바이러스(pseudovirus) 입자가 WO 87/06261에 개시되어 있다.

식물에서의 비-바이러스성 외인 핵산 서열의 도입 및 발현을 위한 식물 RNA 바이러스의 작제는 상기한 문헌 및 문헌[Dawson, W. O. et al. (1989) 172:285-292; Takamatsu et al. EMBO J. (1987) 6:307-311; French, R. et al. Science (1986) 231:1294-1297; and Takamatsu et al. FEBS Letters (1990) 269:73-76]에 의해 입증된다.

바이러스가 DNA 바이러스인 경우, 작제물은 바이러스　자체로 만들어질 수 있다．　또한，외래 DNA와의 목적하는 바이러스 벡터의 작제를 용이하게 하기 위해, 바이러스는 먼저 박테리아 플라스미드내로 클로닝될 수 있다. 이어, 바이러스는 플라스미드로부터 잘라내어질 수 있다. 바이러스가 DNA 바이러스인 경우, 박테리아 복제기점이 바이러스 DNA에 부착된 다음 박테리아에 의해 복제될 수 있다. DNA의 전사 및 번역은 바이러스 DNA를 둘러싸는 외피 단백질을 생산하게 될 것이다. 바이러스가 RNA 바이러스인 경우, 이 바이러스는 일반적으로 cDNA로서 클로닝되고 플라스미드내로 삽입된다. 이어, 이 플라스미드를 사용하여 대부분의 작제물을 제조한다. 그후, RNA 바이러스는 플라스미드의 바이러스 서열을 전사하고, 바이러스 유전자의 번역에 의해 바이러스 RNA를 둘러싸게 될 외피 단백질(들)을 생산한다.

식물에서의 비-바이러스성 외인 핵산 서열의 도입 및 발현을 위한 식물 RNA 바이러스의 작제는 본 발명의 작제물에 포함되는 것들과 같이, 상기 문헌 및 미국 특허 제 5,316,931 호에 입증되어 있다.

제 1 일례로, 바이러스성 핵산으로부터 천연(native) 외피 단백질 코딩 서열은 결손시키고, 식물 숙주에서 발현가능하고, 재조합 식물 바이러스성 핵산의 패키징(packaging) 및 재조합 식물 바이러스성 핵산으로 숙주를 전신적으로 감염시킬 수 있는, 비-천연(non-native) 식물 바이러스 외피 단백질 코딩 서열 및 비-천연 프로모터, 바람직하게는 비-천연 외피 단백질 코딩 서열의 서브게놈(subgenomic) 프로모터는 삽입한 식물 바이러스성 핵산이 제공된다. 또한, 단백질이 형성되도록, 외피 단백질 유전자는 그 안에 비-천연 핵산 서열의 삽입에 의해 비활성화될 수 있다. 재조합 식물 바이러스 핵산 작제물은 하나 이상의 추가적인 비-천연 서브게놈 프로모터를 가질 수 있다. 각각의 비-천연 서브게놈 프로모터는 식물 숙주에서 인접 유전자(adjacent gene) 또는 핵산 서열을 전사하거나 발현할 수 있고, 서로 함께 및 천연 서브게놈 프로모터와 함께 재조합될 수 없다. 하나 보다 많은 핵산 서열이 포함될 경우, 비-천연(외래) 핵산 서열은 천연 식물 바이러스성 서브게놈 프로모터 또는 천연 및 비-천연 식물 바이러스성 서브게놈 프로모터에 인접하게 삽입될 수 있다. 비-천연 핵산 서열은 서브게놈 프로모터의 제어하에 숙주 식물에서 전사되거나 발현되어 목적하는 산물을 생산한다.

제 2 일례로, 재조합 식물 바이러스성 핵산 작제물은, 천연 외피 단백질 코딩 서열이 비-천연 외피 단백질 코딩 서열에 인접하는 대신 비-천연 외피 단백질 서브게놈 프로모터중 하나에 인접하게 배치되는 것을 제외하고는 제 1 일례에서와 같이 제공된다.

제 3 일례로, 천연 외피 단백질 유전자는 그의 서브게놈 프로모터에 인접하고, 하나 이상의 비-천연 서브게놈 프로모터는 바이러스성 핵산에 삽입된 재조합 식물 바이러스성 핵산이 제공된다. 삽입된 비-천연 서브게놈 프로모터는 식물 숙주에서 인접 유전자를 전사 또는 발현할 수 있고, 서로 함께 및 천연 서브게놈 프로모터와 함께 재조합될 수 없다. 비-천연 핵산 서열은, 서브게놈 프로모터의 제 어하에 숙주 식물에서 전사되거나 발현되어 목적하는 산물을 생산할 수 있도록 비-천연 서브게놈 식물 바이러스성 프로모터에 인접하게 삽입될 수 있다.

제 4 일례로, 재조합 식물 바이러스성 핵산은 천연 외피 단백질 코딩 서열이 비-천연 외피 단백질 코딩 서열에 의해 대체되는 것을 제외하고는 제 3 일례에서와 같이 제공된다.

바이러스 벡터는 재조합 식물 바이러스성 핵산에 의해 코딩된 외피 단백질에 의해 감싸져 재조합 식물 바이러스를 생산한다. 재조합 식물 바이러스성 핵산 또는 재조합 식물 바이러스는 적합한 숙주 식물을 감염시키는데 사용된다. 재조합 식물 바이러스성 핵산은 숙주안에서 전신적으로 분포하도록 숙주내에서 복제될 수 있고, 숙주내에서 외래 유전자(들)(단리된 핵산)를 전사 또는 발현하여 목적하는 단백질을 생산할 수 있다.

엽록체 게놈에 외인성 핵산 서열을 도입하는 기술은 공지되어 있다. 이 기술은 다음의 과정을 포함한다. 첫째, 세포당 엽록체의 수가 대략 하나로 줄도록 식물 세포를 화학적으로 처리한다. 이어, 적어도 하나의 외인성 핵산 분자를 엽록체내 도입하기 위해, 외인성 핵산을 입자 충격(particle bombardment)을 통해 세포내로 도입한다. 그후, 엽록체에 대한 고유의 효소에 의해 쉽게 수행될 수 있는 상동 조합(homologous recombination)을 통해 엽록체 게놈내로 통합가능하도록 외인성 핵산을 선택한다. 그 때문에, 외인성 핵산은 관심의 대상이 되는 유전자 이외에 엽록체 게놈으로부터 유래된 적어도 하나의 핵산 스트레치(stretch)를 포함한다. 또한, 외인성 핵산은 순차적인 선택 방법에 의해, 선택후 모든 또는 실질적으 로 모든 엽록체 게놈의 복사(copy)가 외인성 핵산을 포함한다는 것을 확인할 수 있게 하는 선택가능 마커를 포함한다. 이러한 기술에 관한 더욱 상세한 설명은 참고로 본 명세서에 포함되는 미국 특허 제 4,945,050 호 및 제 5,693,507 호에 있다. 따라서, 폴리펩티드는 엽록체의 단백질 발현 시스템에 의해 생산되어, 엽록체의 내막에 통합될 수 있다.

상술한 형질전환 접근법은 임의 종의 식물, 또는 식물 조직 또는 그로부터 유래된 단리된 식물 세포에서 집합 콜라겐(프로펩티드 함유 또는 비함유) 뿐만 아니라 콜라겐 사슬 및/또는 수식 효소를 생산하는데 사용될 수 있다.

바람직한 식물은 콜라겐 사슬, 콜라겐 및/또는 본 명세서에 설명된 처리 효소를 대량으로 축적할 수 있는 것들이다. 이러한 식물은 또한 발현 성분 또는 집합 콜라겐이 추출될 수 있는 용이성 및 스트레스 조건에 대한 그의 내성에 따라 선택될 수 있다. 바람직한 식물의 예로는 담배, 옥수수, 자주개자리, 벼, 감자, 대두, 토마토, 밀, 보리, 캐놀라 및 목화가 포함된다.

콜라겐 섬유는 식품 및 화장품 산업에 광범위하게 사용된다. 따라서, 식물에 의해 발현된 콜라겐 섬유 성분(알파 사슬) 및 수식 효소는 콜라겐의 공업적 합성에 있어서 유용하지만, 단순성 및 비용 효율성을 위해서는 식물에서의 완전한 콜라겐 생산이 바람직하다.

몇몇 접근법은 식물에서 I형 콜라겐을 생성하는데 사용될 수 있다. 예를 들어, 콜라겐 알파 1 사슬은 콜라겐 알파 1 및 P4H (및 임의로 LH3)를 발현하는 식물로부터 단리되고, 콜라겐 알파 2 및 P4H (및 임의로 LH3 및 프로테아제 C 및/또는 N)를 발현하는 식물로부터 단리된 콜라겐 알파 2 사슬과 혼합될 수 있다. 콜라겐 알파 1 사슬은 자동적으로 삼중 나선형으로 자기집합하기 때문에, 콜라겐 알파 2 사슬과 혼합 및 재생하기 전에 이러한 호모-트리머를 변성시킬 필요가 있을 수 있다.

바람직하게도, 콜라겐 알파 1 및 P4H (및 임의로 LH3 및 프로테아제 C 및/또는 N)를 발현하는 제 1 식물은 콜라겐 알파 2를 발현하는 제 2 (및 바람직하게는 동종) 식물과 교배될 수 있거나, 다르게는 알파 사슬 둘 다를 발현하는 제 1 식물은 P4H 및 임의로 LH3 및 프로테아제 C 및/또는 N을 발현하는 제 2 식물과 교배될 수 있다.

상술한 식물 개량 접근법은 두 가지의 개별적인 형질전환 식물을 사용하지만, 각각 하나 또는 두 성분을 발현하는 세 가지 이상의 개별적인 형질전환 식물을 사용하는 접근법이 또한 사용될 수 있음을 주목해야 한다.

당업자들은 다양한 식물 개량 기술을 잘 알고 있으며, 이러한 기술에 대한 추가의 설명은 본 명세서에 제공되지 않는다.

식물 개량 접근법이 바람직하지만, 콜라겐 알파 1 및 2, P4H 및 LH3 (및 임의로 프로테아제 C 및/또는 N)을 발현하는 단일 식물은, 하나 이상의 발현가능 성분을 세포내로 도입하기 위해 각각 설계된 몇몇 형질전환 단계를 통해 생성될 수 있음을 주목해야 한다. 이러한 경우, 각각의 형질전환 단계의 안정성은 특정의 선택 마커를 사용하여 입증될 수 있다.

여하튼, 형질전환 및 식물 개량 접근법은 여러가지 성분을 발현하는 임의의 식물을 생성하는데 사용될 수 있다. 현재, 콜라겐 알파 1 및 2 사슬, P4H, LH3 및 적어도 하나의 프로테아제(예, 프로테아제 C 및/또는 N)를 발현하는 식물이 바람직하다. 다음에 오는 실시부에 추가로 설명된 바, 이러한 식물은 42℃ 이하의 온도에서 안정성을 보이는 콜라겐을 축적한다.

개량 또는 다르게는 다중-형질전환된 식물로부터 생성된 후손은 핵산 또는 단백질 프로브(예, 항체)를 사용하여 외인성 mRNA 및/또는 폴리펩티드의 존재를 입증함으로써 선택될 수 있다. 발현된 폴리펩티드 성분의 국재화(예를 들어 분획 식물 추출액을 프로브하는 것에 의해)를 가능케 하고, 이로써 또한 정확한 프로세싱 및 집합에 대한 가능성을 입증할 수 있기 때문에, 후자의 접근법이 바람직하다. 적합한 프로브의 예가 다음에 오는 실시부에 제공되어 있다.

콜라겐-발현 후손이 확인되면, 이러한 식물은 콜라겐 사슬 및 수식 효소의 발현을 극대화하는 조건하에서 추가로 재배된다.

유리 프롤린 축적은 본 발명의 유전자 조작 식물에 의해 발현된 콜라겐 사슬을 비롯한 상이한 프롤린-풍부 단백질들의 생산을 촉진할 수 있기 때문에, 바람직한 재배 조건은 재배 식물에 유리 프롤린 축적을 증가시키는 조건이다.

물 부족, 염류화(salinization), 저온, 고온, 병원체 감염, 중금속 독성, 혐기생활(anaerobiosis), 영양결핍, 대기오염 및 UV-조사를 비롯한 광범위한 환경 스트레스에 대한 반응으로 각종 식물에 유리 프롤린이 축적된다(Hare and Cress, 1997).

유리 프롤린은 또한 ABA와 같은 화합물 또는 구리염, 파라쿠아 트(paraquate), 살리실산 등과 같은 스트레스 유도 화합물에 의한 식물 또는 토양의 처리에 대한 반응으로 축적될 수 있다.

즉, 콜라겐-발현 후손은 상이한 스트레스 조건(예, 5O mM 내지 25O mM 범위의 NaCl의 상이한 농도)하에 성장될 수 있다. 콜라겐 생산을 더욱 향상시킬 수 있도록, 콜라겐 발현에 대한 각종 스트레스 조건의 영향을 조사하여 식물 생존능, 생체량(biomass) 및 콜라겐 축적에 관해 최적화할 것이다.

식물 조직/세포는 바람직하게는 완전 발달기에 수확되고, 콜라겐 섬유는 널리 공지된 선행 추출법을 사용하여 단리되며, 이러한 방법중 하나가 이하에 상술된다.

유전자이식 식물의 잎은 액체 질소하에 분쇄하여 분말화하고, 균질액을 0.2M NaCl을 함유하는 0.5 M 아세트산에서 4℃에서 60 시간동안 추출한다. 불용성 물질을 원심분리에 의해 제거한다. 재조합 콜라겐을 함유하는 상청액을 0.4 M 및 0.7 M NaCl에서 염분별한다(salt-fractionated). 재조합 헤테로트리머 콜라겐을 함유하는 0.7 M NaCl 침전물을 0.1 M 아세트산에 용해 및 투석한 다음, -20℃에서 저장한다(Ruggiero et al., 2000).

본 발명의 추가의 목적, 장점 및 신규한 특징은 비한정적인 하기 실시예의 실험을 통해 당업자들에게 자명할 것이다. 또한 상기 설명되고 이하 청구 범위에서 청구하는 본 발명의 다양한 일례 및 일면은 하기 실시예를 통해 실험적으로 입증될 것이다.

실시예

상기한 설명과 함께 하기 실시예를 참고하여 본 발명을 비한정적으로 설명한다.

일반적으로, 본 명세서에 사용된 명명법 및 본 발명에 사용된 실험 과정은 분자적, 생화학적, 미생물학적 및 재조합 DNA 기술을 포함한다. 이러한 기술은 문헌에 충분히 설명되어 있다[참조예, "Molecular Cloning: A laboratory Manual" Sambrook et al., (1989); "Current Protocols in Molecular Biology" Volumes I-III Ausubel, R.M., ed. (1994); Ausubel et al., "Current Protocols in Molecular Biology", John Wiley and Sons, Baltimore, Maryland (1989); Perbal, "A Practical Guide to Molecular Cloning", John Wiley & Sons, New York (1988); Watson et al., "Recombinant DNA", Scientific American Books, New York; Birren et al., (eds) "Genome Analysis: A laboratory Manual Series", Vols. 1-4, Cold Spring Harbor laboratory Press, New York (1998); 미국특허 제 4,666,828호; 제 4,683,202호; 제 4,801,531호; 제 5,192,659호 및 제 5,272,057호에 설명된 방법; "Cell Biology: A laboratory Handbook", Volumes I-III Cellis, J.E., ed. (1994); "Current Protocols in Immunology" Volumes I-III Coligan J.E., ed. (1994); Stites et al., (eds), "Basic and Clinical Immunology" (8th Edition), Appleton & Lange, Norwalk, CT (1994); Mishell and Shiigi (eds), "Selected Methods in Cellular Immunology", W.H. Freeman and Co., New York (1980)]; 이용가능한 면역분석법은 특허 및 과학 문헌에 널리 기술되어 있다[참조예, 미국특허 제 3,791,932호; 제 3,839,153호; 제 3,850,752호; 제 3,850,578호; 제 3,853,987호; 제 3,867,517호; 제 3,879,262호; 제 3,901,654호; 제 3,935,074호; 제 3,984,533호; 제 3,996,345호; 제 4,034,074호; 제 4,098,876호; 제 4,879,219호; 제 5,011,771호 및 제 5,281,521호; "Oligonucleotide Synthesis" Gait, M.J., ed. (1984); "Nucleic Acid Hybridization" Hames, B.D., and Higgins S.J., eds. (1985); "Transcription and Translation" Hames, B.D., and Higgins S.J., Eds. (1984); "Animal Cell Culture" Freshney, R.I., ed. (1986); "Immobilized Cells and Enzymes" IRL Press, (1986); "A Practical Guide to Molecular Cloning" Perbal, B., (1984) and "Methods in Enzymology" Vol. 1-317, Academic Press; "PCR Protocols: A Guide To Methods And Applications", Academic Press, San Diego, CA (1990); Marshak et al., "Strategies for Protein Purification and Characterization - A laboratory Course Manual" CSHL Press (1996)](본원에 충분히 설명된 바와 같이 언급된 모든 참고문헌은 참고로서 본원에 포함된다). 이 문서 전체를 통해 다른 일반 문헌이 제공된다. 방법은 본 분야에 잘 공지되어 있고 독자의 용이를 위해 제공된다. 이에 포함된 모든 정보는 본 명세서에서 참고적으로 인용된다.

실시예 1

작제 및 형질전환 개요

본 작업에서 사용된 발현 카세트 및 벡터의 작제를 도 1a-d에 나타내었다. 본 작업에서의 모든 코딩 서열을 담배에서의 발현을 위해 최적화하였고 목적하는 인접영역(flanking region)과 화학적으로 합성하였다(서열번호: 1, 4, 7, 12, 14, 16, 18, 20, 22). 도 1a - 액포 시그널 또는 아포플라스트 시그널(서열번호: 7에 의해 코딩됨)에 융합되거나 시그널이 없는 Col1 및 Col2(서열번호: 1, 4)에 대한 합성 유전자 코딩을 크리산세뭄(Chrysanthemum) rbcS1 프로모터와 5'UTR (서열번호: 10) 및 크리산세뭄 rbcS1 3'UTR과 터미네이터(서열번호: 11)로 구성된 발현 카세트에서 클로닝하였다. 완전 발현 카세트를 pBINPLUS 식물 형질전환 벡터의 다중 클로닝 부위에서 클로닝하였다(van Engelen et al., 1995, Transgenic Res 4: 288-290). 도 1b - 액포 시그널 또는 아포플라스트 시그널(서열번호: 7에 의해 코딩됨)에 융합되거나 시그널이 없는 P4H 베타-인간, P4H 알파-인간 및 P4H-식물(서열번호: 12, 14 및 16)에 대한 합성 유전자 코딩을 CaMV 35S 프로모터 및 TMV 오메가 서열, 및 벡터 pJD330에 의해 운반되는 아그로박테리움 노팔린 신테타제(Agrobacterium Nopaline synthetase, NOS) 터미네이터로 구성된 발현 카세트에서 클로닝하였다(Galili et al., 1987, Nucleic Acids Res 15: 3257-3273). 완전 발현 카세트를 Col1 또는 Col2의 발현 카세트를 운반하는 pBINPLUS 벡터의 다중 클로닝 부위에서 클로닝하였다. 도 1c - 액포 시그널 또는 아포플라스트 시그널(서열번호: 7에 의해 코딩됨)에 융합된 프로티네이즈 C 및 프로티네이즈 N (서열번호: 18, 20)에 대한 합성 유전자 코딩을 크리산세뭄 rbcS1 프로모터와 5'UTR (서열번호: 10) 및 크리산세뭄 rbcS1 3'UTR과 터미네이터(서열번호: 11)로 구성된 발현 카세트에서 클로닝하였다. 완전 발현 카세트를 pBINPLUS 식물 형질전환 벡터의 다중 클로닝 부위에서 클로닝하였다. 도 1d - 액포 시그널 또는 아포플라스트 시그널(서열번호: 7에 의해 코딩됨)에 융합되거나 시그널이 없는, 아그로박테리움 옥토파인 신타제(Agrobacterium octopin synthase, OCS) 터미네이터(NCBI accession Z37515 REGION: 1344..1538 version Z37515.1 GL886843)로 종결되고 인접 스트로베리 베인 밴딩 바이러스(Strawberry vein banding virus, SVBV) 프로모터(NCBI accession AF331666 REGION: 623..950 version AF331666.1 GI:13345788)를 가진 LH3(서열번호: 22)에 대한 합성 유전자 코딩을 Col1 및 P4H 베타의 발현 카세트를 운반하는 pBINPLUS 벡터의 다중 클로닝 부위에서 클로닝하였다.

숙주 식물내로의 도 1에 기술된 발현 카세트를 사용하는 동시-형질전환의 개요를 도 2에 나타내었다. 각각의 발현 카세트 삽입물은 코딩 서열의 축약명으로 나타내었다. 코딩 서열 및 관련 서열번호를 표 1에 기술하였다. 각각의 동시-형질전환을 두 개의 pBINPLUS 바이너리 벡터에 의해 수행하였다. 각각의 직사각형은 한 개, 두 개 또는 세 개의 발현 카세트를 운반하는 단일 pBINPLUS 벡터를 나타낸다. 프로모터 및 터미네이터를 도 1에 명기하였다.

실시예 2

식물 콜라겐 발현

아래 표 1에 기술된 단백질을 코딩하는 합성 폴리뉴클레오티드 서열을 담배 식물에서 발현하기 위해 설계 및 최적화하였다.

표 1 - 발현 단백질의 리스트

이름	SwissProt accession	아미노산	스플라이싱 이소형	결손	이름	하기 서열번호에 포함	하기 서열번호에 의해 코딩
콜라겐 알파 1(I) 사슬[전구체]	p02452	1442	1회전	ER 시그널	Col1	3	1
콜라겐 알파 2(I) 사슬[전구체]	p08123 p08123에 행해진 2회 변화: D549A 및 N249I	1342	1회전	ER 시그널	Col2	6	4
프롤릴 4-하이드록실레이즈 베타 서브유닛	p07237	487	1회전	ER 시그널, KDEL	P4H 베타 인간	13	12
프롤릴 4-하이드록실레이즈 알파-1 서브유닛	p13674	517	P13674-1	ER 시그널	P4H 알파 인간	15	14
프롤릴 4-하이드록실레이즈 식물	SwissProt.에 등록무 NCBI accession: gi:15227885	252	1회전	aa1-39로서 예기된 미토콘드리아 시그널	P4H 식물	17	16
프로콜라겐 C-프로티네이즈	p13497	866	P13497-1 BMP1-3	ER 시그널, 프로펩티드	프로티네이즈 C	19	18
프로콜라겐 I N-프로티네이즈	o95450	958	O95450-1 LpNPI	ER 시그널, 프로펩티드	프로티네이즈 N	21	20
리실 하이그록실레이즈 3	o60568	714	1회전	ER 시그널	LH3	23	22

시그널 펩티드

(i) 티올 프로테아제 알레우레인(Thiol protease aleurain) 전구체에 대한 보리 유전자의 액포 시그널 서열(NCBI accession P05167 GI:113603)

MAHARVLLLALAVLATAAVAVASSSSFADSNPIRPVTDRAASTLA (서열번호: 24).

(ii) 아라비돕시스 탈리아나 엔도-1,4-베타-글푸카네이즈의 아포플라스트 시그널(Cel1, NCBI accession CAA67156.1 GI:2440033); 서열번호 9, 서열번호 7에 의 해 코딩됨.

플라스미드의 작제

식물 발현 벡터를 실시예 1에 교시된 바와 같이 작제하고, 각각의 작제된 발현 벡터의 조성을 제한 분석 및 서열화를 통해 확인하였다.

다음의 발현 카세트를 포함하는 발현 벡터를 작제하였다:

1. 콜라겐 알파 1

2. 콜라겐 알파 1 + 인간 P4H 베타 서브유닛

3. 콜라겐 알파 1 + 인간 P4H 베타 서브유닛 + 인간 LH3

4. 콜라겐 알파 2

5. 콜라겐 알파 2 + 인간 P4H 알파 서브유닛

6. 콜라겐 알파 2 + 아라비돕시스 P4H

7. 인간 P4H 베타 서브유닛 + 인간 LH3

8. 인간 P4H 알파 서브유닛

각각의 상술한 코딩 서열은 번역과 동시에 액포 전위 펩티드 또는 아포플라스트 전위 펩티드에 융합되었고, 임의의 전위 펩티드 서열을 가지지 않았으며, 각 경우의 세포질 축적이 기대된다.

식물 형질전환 및 PCR 스크리닝

담배 식물(니코티아나 타바쿰(Nicotiana tabacum), Samsun NN)을 도 2에 교시된 형질전환 개요에 따라 상술한 발현 벡터를 가지고 형질전환하였다.

생성된 유전자이식 식물을, 콜라겐 알파 1의 324bp 단편 및 콜라겐 알파 2의 537bp 단편을 증폭할 수 있도록 디자인된 4 개의 프라이머를 사용하여 다중 PCR을 통해 스크리닝하였다(표 2). 도 3은 하나의 다중 PCR 스크린의 결과를 나타낸다.

표 2 - 콜라겐 알파 1의 324bp 단편 및 콜라겐 알파 2의 537bp 단편의 증폭을 위한 다중 PCR에 대한 프라이머의 기술

Col1 포워드 프라이머 (24-mer)	5' ATCACCAGGAGAACAGGGACCATC 3'	서열번호: 25
Col1 리버스 프라이머 (29-mer)	5' TCCACTTCCAAATCTCTATCCCTAACAAC 3'	서열번호: 26
Col2 포워드 프라이머 (23-mer)	5' AGGCATTAGAGGCGATAAGGGAG 3'	서열번호: 27
Col2 리버스 프라이머 (27-mer)	5' TCAATCCAATAATAGCCACTTGACCAC 3'	서열번호: 28

실시예 3

유전자이식 담배 식물에서 인간 콜라겐의 검출

"완전" 프로테아제 억제제 칵테일(로쉐 디아그노스틱스 게엠베하(Roche Diagnostics GmbH)로부터의 제품 #1836145, 50 ㎖ 버퍼당 1 정)을 함유하는 0.5 ㎖ 50 mM Tris-HCl pH=7.5에서 500 mg의 잎을 분쇄하여 담배 형질전환주 2, 3 및 4로부터 총 가용 단백질을 추출하였다. 조 추출물을 10% 베타-머캅토-에탄올 및 8% SDS를 함유하는 250 ㎕ 4X 샘플 어플리케이션 버퍼(Sample application buffer)와 혼합하고, 이 샘플을 7 분간 비등시킨 다음 13000 rpm으로 8 분간 원심분리하였다. 20 ㎕의 상청액을 10% 폴라아크릴아미드 겔에 부하하고, 항-콜라겐 I (변성) 항체 (케미콘 인코포레이션으로부터 #AB745)를 가지고 표준 웨스턴 블롯법으로 시험하였다(도 4). W.T.는 야생형 담배이다. 콜라겐 I형 알파 1 또는 알파 2, 또는 둘 다에 대해 PCR 양성인 양성 콜라겐 밴드를 식물에서 볼 수 있다. 인간 태반(케미콘 인코포레이션으로부터의 #CC050)으로부터의 500 ng 콜라겐 I형의 양성 대조군 밴드는 유전자이식 식물 샘플에서의 총 가용 단백질(약 150 ㎍)의 약 0.3%를 나타낸다.

콜라겐이 액포에 표적되는 경우, 총 가용 단백질의 약 1% 이하의 분자량 예측치에서 콜라겐을 발현하는 식물이 검출되었다(도 4). 아포플라스트에 대한 전장(full length) 콜라겐의 세포내 표적화가 성공적으로 달성되었다(도 5). 세포질(즉, 펩티드를 표적화하지 않음)에서 콜라겐을 발현하는 식물에서는 검출가능한 수준으로 콜라겐이 축적되지 않았는데, 이는 식물에서의 콜라겐의 세포내 표적화가 성공에 결정적임을 나타낸다.

또한, 루기에로(Ruggiero et al. 2000) 및 머를(Merle et al. 2002)의 연구와는 반대로, 세포내 컴파트먼트에 고수준으로 축적된 C-프로펩티드 및 N-프로펩티드를 가진 전장 콜라겐 단백질을 사용하는 경우, N-프로펩티드가 부족한 콜라겐이 유의적으로 단백질분해되는 경향이 있음을 나타내었다.

또한 각 사슬 형태의 최적 수준을 발현하는 식물을 선택하고, 이어 이 식물을 교배하여 목적하는 콜라겐 생산성 식물을 달성할 수 있다는 점에서, 각 상이한 콜라겐 사슬 형태를 발현하는 두 개의 식물 세포를 교배하는 것이 유리하다는 것이 본 데이터에 의해 명확히 나타난다.

본 발명의 식물에 의해 생산된 콜라겐은 천연 프로펩티드를 포함하며, 따라 서 단백질분해에 의해 정제된 인간 대조군보다 큰 단백질을 형성할 것으로 기대된다. 하이드록실화 또는 글리코실화되지 않은 콜라겐 알파 1 및 알파 2 사슬의 분자량 계산치는 다음과 같다: 프로펩티드 함유 Col1 - 136kDa, 프로펩티드 무함유 Col1 - 95kDa, 프로펩티드 함유 Col2 - 127kDa, 프로펩티드 무함유 Col2 - 92kDa.

도 4에서 알 수 있는 바, 형질전환주 3-5 및 3-49에서 Col1 밴드는 다른 식물에서의 Col1 밴드보다 크게 나타났다. 이는 이들 식물에서 동시발현되고 인간 콜라겐 사슬과 동일한 세포내 컴파트먼트(예, 액포)에 표적화되는 알파 및 베타 서브유닛으로 구성된 인간 프롤린-4-하이드록실레이즈 완전 효소에 의한 콜라겐 사슬에서의 프롤린 하이드록실화를 나타낸다.

실시예 4

유전자이식 식물에서의 콜라겐 삼중나선형 집합 및 열적 안정성

유전자이식 식물의 총 조 단백질 추출액의 열변성, 이어 트립신 또는 펩신 분해에 의해 유전자이식 식물에서의 콜라겐 삼중나선형의 집합 및 나선형의 열적 안정성을 시험하였다(도 6a-b).

첫 번째 실험에서, 0.5 ㎖의 50 mM Tris-HCl pH=7.5에서 500 mg의 잎을 분쇄하고, 13000 rpm으로 10 분간 원심분리한 다음 상청액을 수집하여 담배 2-9 (콜라겐 알파만을 발현하고 P4H는 발현하지 않음) 및 3-5 (콜라겐 알파 1+2 및 P4H 모두를 발현함)로부터 총 가용 단백질을 추출하였다. 이 상청액 50 ㎕를 열처리(33℃ 또는 43℃에서 15분)한 다음 즉시 얼음상에 배치하였다. 각 샘플에 50 mM Tris- HCl pH=7.5중의 1 ㎎/㎖ 트립신 6㎕을 첨가하여 트립신 분해를 개시하였다. 샘플을 실온(약 22℃)에서 20분간 배양하였다. 10% 베타-머캅토-에탄올 및 8% SDS를 함유하는 20 ㎕ 4X 샘플 어플리케이션 버퍼의 첨가에 의해 분해를 종결시키고, 이 샘플을 7 분간 비등시킨 다음 13000 rpm으로 7 분간 원심분리하였다. 50 ㎕의 상청액을 10% 폴라아크릴아미드 겔에 부하하고, 항-콜라겐 I (변성) 항체(케미콘 인코포레이션으로부터 #AB745)를 가지고 표준 웨스턴 블롯법으로 시험하였다. 양성 대조군은 W.T. 담배로부터 추출한 총 가용 단백질 50 ㎕에 첨가된 약 500 ng의 인간 콜라겐 I형(펩신 분해에 의해 인간 태반으로부터 추출된 케미콘 인코포레이션의 #CC050)의 샘플이었다.

도 6a에 도시된 바와 같이, 대조군 인간 콜라겐 및 식물 #3-5에서 형성된 콜라겐 삼중나선은 33℃에서 변성에 대해 내성적이었다. 반대로, 식물 #2-9에 의해 형성된 콜라겐은 33℃에서 변성되었다. 이와 같은 열 안정성의 차이는 콜라겐 알파 1 및 콜라겐 알파 2 모두와 P4H 베타 및 알파 서브유닛을 발현하는 형질전환주 #3-5에서의 성공적인 삼중나선형 집합 및 번역후 프롤린 하이드록실화를 나타낸다.

형질전환주 #2-9에서의 두 개의 밴드는 SDS 및 머캅토에탄올과 함께 7분 비등시킨 후에도 안정한 다이머 또는 트리머를 나타낼 수 있다. 인간 콜라겐(상부 패널) 및 형질전환주 #3-5에서 유사한 밴드를 볼 수 있다. 리신 옥시다제에 의한 두 리신의 산화적 탈아미노반응 이후 형성된 상이한 삼중나선에서의 두 펩티드간의 공유결합(가교결합)이 가능한 설명이다.

두 번째 실험에서, 0.5 ㎖의 100 mM Tris-HCl pH=7.5 및 300 mM NaCl에서 500 mg의 잎을 분쇄하고, 10000 rpm으로 7 분간 원심분리한 다음 상청액을 수집하여 유전자이식 담배 13-6 (콜라겐 I형 알파 1 및 알파 2 사슬(화살표로 표시), 인간 P4H 알파 및 베타 서브유닛, 및 인간 LH3를 발현함)으로부터 총 가용 단백질을 추출하였다. 이 상청액 50 ㎕를 열처리(33℃, 38℃ 또는 42℃에서 20분)한 다음 즉시 얼음상에 배치하였다. 각 샘플에 0.1 M HCl 4.5 ㎕ 및 10 mM 아세트산중 2.5 ㎎/㎖ 펩신 4㎕을 첨가하여 펩신 분해를 개시하였다. 샘플을 실온(약 22℃)에서 30분간 배양하였다. 완충되지 않은 1M Tris 5㎕를 첨가하여 분해를 종결시켰다. 각 샘플을 10% 베타-머캅토-에탄올 및 8% SDS를 함유하는 22 ㎕ 4X 샘플 어플리케이션 버퍼와 혼합하고, 7 분간 비등시킨 다음 13000 rpm으로 7 분간 원심분리하였다. 40 ㎕의 상청액을 10% 폴라아크릴아미드 겔에 부하하고, 항-콜라겐 I (변성) 항체(케미콘 인코포레이션으로부터 #AB745)를 가지고 표준 웨스턴 블롯법으로 시험하였다. 양성 대조군은 W.T. 담배로부터 추출한 총 가용 단백질에 첨가된 약 50 ng의 인간 콜라겐 I형(펩신 분해에 의해 인간 태반으로부터 추출된 케미콘 인코포레이션의 #CC050)의 샘플이었다.

도 6b에 도시된 바와 같이, 식물 #13-6에서 형성된 콜라겐 삼중나선은 42℃에서 변성에 대해 내성적이었다. 프로펩티드의 절단은 33℃에서 먼저 볼 수 있으며, 온도가 38℃ 및 다시 42℃로 상승될 때 효율이 점차 증가한다. 절단된 콜라겐 삼중나선형 도메인은 펩신 처리된 인간 콜라겐의 이동(migration)과 유사한 겔상에서의 이동을 보인다. 본 실험에 사용된 인간 콜라겐은 펩신 단백질분해에 의해 인간 태반으로부터 추출하였고, 따라서 프로펩티드 및 텔로펩티드의 일부가 결손되어 있다.

실시예 5

식물 P4H 발현

천연 식물 P4H의 유도

담배 P4H cDNA를　클로닝하고　내인성 P4H 발현을　유도하는　조건　및　처리법을　결정하기　위한　프로브로서　사용하였다． 생장점에서는 비교적 고수준으로 발현되었고 잎에서는 낮은 수준으로 발현되었음이 노던 블롯 분석법(도 7)에 의해 명확히 나타났다. P4H 수준은 연마(abrasion) 처리(하부 패널이 "훼손됨(wounded)")하고 4 시간된 입에서 두드러지게 유도되었다. 다른 스트레스 조건을 사용하는 경우 유사한 결과가 달성되었다(미도시).

유전자이식 담배 식물에서 인간 P4H 알파 및 베타 서브유닛 및 콜라겐 알파 1 및 알파 2 사슬의 검출

항-인간 P4H 알파 서브유닛 항체(바이오메디칼스 인코포레이션(ICN Biomedicals Inc.)의 #63-163), 항-인간 P4H 베타 서브유닛 항체(케미콘 인코포레이션의 #MAB2701) 및 항-콜라겐 I형 항체(케미콘 인코포레이션의 #AB745)를 사용하여, 유전자이식 담배 식물에서 인간 P4H 알파 및 베타 서브유닛 및 콜라겐 I형 알파 1 및 알파 2 사슬을 검출하였다. 이들 항체와 프로브된 웨스턴 블롯의 결과를 도 8에 도시하였다.

P4H 알파, P4H 베타 및 콜라겐 I형 알파 1 및 알파 2 밴드의 발현은 식물 13-6(또한 인간 LH3로도 형질전환됨)에서 확인되었다. 액포 시그널 펩티드를 포함하는 P4H 알파 및 베타의 분자량 계산치는 각각 65.5 kDa 및 53.4 kDa이었다. 프로펩티드를 가지나 하이드록실화 또는 글리코실화되지 않은 콜라겐 알파 1 및 알파 2 사슬의 분자량 계산치는 각각 136 kDa 및 127 kDa이었다.

명확하게 하기 위해 별도의 구체예의 문맥에 기술된 본 발명의 특성은 또한 하나의 구체예에 함께 제공될 수 있음이 인지될 것이다. 반대로, 요약하여 하나의 구체예의 문맥에 기술된 본 발명의 다양한 특성은 또한 별도로 또는 임의의 적합한 서브컴비네이션에 제공될 수 있다.

본 발명은 그의 특정 구체예와 함께 기술되었지만 다양한 대안, 수정 및 변형도 본 분야의 기술자에게 자명할 것이라는 것은 명백하다. 따라서, 첨부되는 청구범위의 정신 및 광범위한 범위내에 포함되는 모든 대안, 수정 및 변형도 포함시키고자 한다. 본 명세서에서 언급된 모든 공개 문헌, 특허 및 특허 출원 및 GenBank 기탁번호는 이들 각각의 공개 문헌, 특허 및 특허 출원 및 GenBank 기탁번호가 구체적이고 개별적으로 이들 본 명세서에서 전체적으로 참고문헌으로서 인용되는 것까지도 본 명세서에서 전체적으로 참고문헌으로서 포함된다. 추가로, 본 명세서에서 참고 문헌의 인용 또는 확인은 상기 문헌이 본 발명의 선행 기술로서 이용가능하다는 것을 허가하는 것으로 이해되어서는 안된다.

번호로 표시한 참고문헌

(기타 참고문헌은 본 서류에 인용된다)

SEQUENCE LISTING <110> CollPlant Ltd. <120> COLLAGEN PRODUCING PLANTS AND METHODS OF GENERATING AND USING SAME <130> <160> 28 <170> PatentIn version 3.3 <210> 1 <211> 4662 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence containing the coding regions of the vascular signal sequence of barley gene for Thiol protease aleurain precursor fused to the human Collagen alpha 1(I) chain and flanking regions <400> 1 gcgatgcatg taatgtcatg agccacatga tccaatggcc acaggaacgt aagaatgtag 60 atagatttga ttttgtccgt tagatagcaa acaacattat aaaaggtgtg tatcaatacg 120 aactaattca ctcattggat tcatagaagt ccattcctcc taagtatcta aaccatggct 180 cacgctcgtg ttctcctcct cgctctcgct gttttggcaa cagctgctgt ggctgtggct 240 tctagttctt cttttgctga ttcaaaccct attagacctg ttactgatag agcagcttcc 300 actttggctc aattgcaaga ggagggccag gttgagggcc aagatgagga tatccctcca 360 attacatgcg tgcaaaatgg cttgcgttac cacgataggg atgtgtggaa acctgaacct 420 tgtcgtatct gtgtgtgtga taacggcaag gtgctctgcg atgatgttat ctgcgatgag 480 acaaaaaatt gccctggcgc tgaagttcct gagggcgagt gttgccctgt gtgccctgat 540 ggttccgagt ccccaactga tcaggaaact actggcgtgg agggcccaaa aggagatact 600 ggtccacgtg gtcctagggg tccagcaggt cctccaggta gagatggtat tccaggccag 660 cctggattgc caggaccacc aggcccacct ggcccaccag gacctcctgg tcttggtgga 720 aatttcgctc cacaactctc ttatggctat gatgagaagt caacaggtgg tatttccgtt 780 ccaggtccta tgggaccatc cggaccaaga ggtctcccag gtcctccagg tgctcctgga 840 cctcaaggct ttcaaggacc tccaggcgaa ccaggagaac caggcgcttc tggaccaatg 900 ggcccaaggg gaccacctgg cccaccagga aaaaatggcg atgatggcga agctggaaag 960 cctggtcgtc ctggagagag aggtcctcct ggcccacagg gtgcaagagg cttgccagga 1020 actgctggct tgcctggaat gaagggacat aggggcttct ccggcctcga tggcgctaag 1080 ggtgatgctg gccctgctgg accaaagggc gagccaggtt cccctggaga aaacggtgct 1140 cctggacaaa tgggtcctcg tggacttcca ggagaaaggg gtcgtccagg cgctccagga 1200 ccagcaggtg ctaggggaaa cgatggtgca acaggcgctg ctggccctcc tggcccaact 1260 ggtcctgctg gccctccagg attcccaggc gcagttggag ctaaaggaga agcaggacca 1320 cagggcccta ggggttctga aggacctcag ggtgttagag gtgaaccagg tcctccaggc 1380 ccagctggag cagctggtcc agcaggaaat ccaggtgctg atggtcaacc tggagctaag 1440 ggcgctaatg gcgcaccagg tatcgcaggc gcaccaggtt ttcctggcgc tagaggccca 1500 agtggtcctc aaggaccagg tggaccacca ggtccaaaag gcaattctgg cgaacctggc 1560 gctccaggtt ctaaaggaga tactggtgct aaaggcgaac caggacctgt tggtgttcag 1620 ggtcctcctg gtcctgctgg agaagaagga aaaagaggtg ctcgtggaga accaggacca 1680 actggacttc ctggacctcc tggtgaacgt ggcggacctg gctcaagggg tttccctgga 1740 gctgatggag tggcaggtcc aaaaggccct gctggagaga gaggttcacc aggtccagct 1800 ggtcctaagg gctcccctgg tgaagcaggt agaccaggcg aagcaggatt gccaggcgca 1860 aagggattga caggctctcc tggtagtcct ggcccagatg gaaaaacagg cccaccaggt 1920 ccagcaggac aagatggacg tccaggccca ccaggtcctc ctggagcaag gggacaagct 1980 ggcgttatgg gttttccagg acctaaaggt gctgctggag agccaggaaa ggcaggtgaa 2040 agaggagttc ctggtccacc aggagcagtg ggtcctgctg gcaaagatgg tgaagctgga 2100 gcacagggcc ctccaggccc tgctggccca gctggcgaac gtggagaaca aggcccagct 2160 ggtagtccag gatttcaagg attgcctggc cctgctggcc ctccaggaga agcaggaaaa 2220 cctggagaac aaggagttcc tggtgatttg ggagcacctg gaccttcagg agcacgtggt 2280 gaaagaggct tccctggcga gaggggtgtt caaggtccac caggtccagc aggacctaga 2340 ggtgctaatg gcgctcctgg caacgatgga gcaaaaggtg atgctggtgc tcctggcgca 2400 cctggaagtc agggtgctcc tggattgcaa ggaatgcctg gagagagggg tgctgctggc 2460 ttgccaggcc caaagggcga taggggtgat gctggaccaa aaggtgctga tggatcccca 2520 ggaaaagatg gagttcgtgg tcttactggc ccaatcggac ctccaggccc tgctggcgct 2580 ccaggtgata agggcgaaag tggcccaagt ggacctgctg gacctactgg tgctagaggt 2640 gcacctggtg ataggggtga acctggacca cctggtccag ctggttttgc tggtcctcct 2700 ggagctgatg gacaacctgg cgcaaagggt gaaccaggtg atgctggcgc aaagggagat 2760 gctggtccac ctggacctgc tggtccagca ggcccccctg ggccaatcgg taatgttgga 2820 gcaccaggtg ctaagggagc taggggttcc gctggtccac ctggagcaac aggatttcca 2880 ggcgctgctg gtagagttgg cccaccaggc ccatccggaa acgcaggccc tcctggtcct 2940 ccaggtcctg ctggcaagga gggtggcaaa ggaccaaggg gcgaaactgg ccctgctggt 3000 agacctggcg aagttggccc tcctggacca ccaggtccag caggagaaaa aggttcccca 3060 ggagctgatg gcccagctgg tgctccagga actccaggcc ctcaaggtat tgctggacag 3120 agaggcgttg tgggactccc tggtcaaagg ggagagagag gatttccagg cttgccagga 3180 cctagtggag aacctggaaa acaaggccca tcaggcgcta gtggagagcg tggacctcct 3240 ggccctatgg gacctcctgg attggctggc ccacctggcg aatcaggtcg tgaaggcgca 3300 ccaggcgcag aaggatcacc tggaagagat ggatcccctg gtgctaaagg cgatcgtgga 3360 gaaactggtc cagcaggccc accaggcgca ccaggtgcac ctggcgctcc aggacctgtg 3420 ggaccagctg gaaaatccgg agataggggc gagacaggcc cagcaggacc agctggacct 3480 gttggccctg ctggcgctcg tggaccagca ggacctcaag gaccaagggg agataaggga 3540 gaaacaggcg aacaaggcga taggggcatt aagggtcata ggggttttag tggcctccag 3600 ggtcctcctg gcccacctgg atcaccagga gaacagggac catctggtgc ttccggccca 3660 gctggtccaa gaggacctcc aggatcagct ggtgcacctg gaaaagatgg tcttaacggt 3720 ctcccaggac caatcggccc tccaggacct agaggaagaa caggagatgc tggccctgtt 3780 ggccctccag gacctcctgg tccaccaggt ccacctggtc ctccatcagc tggattcgat 3840 ttttcatttc ttccacagcc accacaagag aaagctcacg atggcggcag atattaccgt 3900 gctgatgatg ctaacgttgt tagggataga gatttggaag tggatacaac tttgaaatcc 3960 ctctcccagc aaattgaaaa cattagatct ccagaaggtt cacgtaaaaa cccagctaga 4020 acatgtcgtg atttgaaaat gtgtcactcc gattggaaaa gtggtgaata ctggattgat 4080 ccaaatcagg gctgtaatct cgatgctatc aaagttttct gtaacatgga aacaggcgaa 4140 acatgcgttt atcctactca accttccgtg gctcagaaaa attggtacat ctcaaaaaat 4200 cctaaagata agaggcacgt ttggttcggt gaaagtatga ctgatggatt tcaatttgag 4260 tacggcggtc aaggtagtga tccagctgat gtggctattc aactcacatt tttgcgtctt 4320 atgtccacag aggcatcaca aaacatcact taccactgca aaaacagtgt ggcttatatg 4380 gatcaacaaa caggaaacct taagaaggct cttcttttga agggctcaaa cgagattgag 4440 attagagcag agggcaactc aaggtttact tattcagtta ctgttgatgg ctgcacttca 4500 catactggcg cttggggtaa aacagttatc gagtataaga ctacaaaaac atcaagactc 4560 ccaatcattg atgttgctcc tctcgatgtt ggcgctcctg atcaagagtt cggttttgat 4620 gtgggcccag tttgtttcct ctaatgagct cgcggccgca tc 4662 <210> 2 <211> 4662 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence of the vascular signal sequence of barley gene for Thiol protease aleurain precursor fused to the human Collagen alpha 1(I) chain and flanking regions <220> <221> CDS <222> (175)..(4644) <400> 2 gcgatgcatg taatgtcatg agccacatga tccaatggcc acaggaacgt aagaatgtag 60 atagatttga ttttgtccgt tagatagcaa acaacattat aaaaggtgtg tatcaatacg 120 aactaattca ctcattggat tcatagaagt ccattcctcc taagtatcta aacc atg 177 Met 1 gct cac gct cgt gtt ctc ctc ctc gct ctc gct gtt ttg gca aca gct 225 Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr Ala 5 10 15 gct gtg gct gtg gct tct agt tct tct ttt gct gat tca aac cct att 273 Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro Ile 20 25 30 aga cct gtt act gat aga gca gct tcc act ttg gct caa ttg caa gag 321 Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala Gln Leu Gln Glu 35 40 45 gag ggc cag gtt gag ggc caa gat gag gat atc cct cca att aca tgc 369 Glu Gly Gln Val Glu Gly Gln Asp Glu Asp Ile Pro Pro Ile Thr Cys 50 55 60 65 gtg caa aat ggc ttg cgt tac cac gat agg gat gtg tgg aaa cct gaa 417 Val Gln Asn Gly Leu Arg Tyr His Asp Arg Asp Val Trp Lys Pro Glu 70 75 80 cct tgt cgt atc tgt gtg tgt gat aac ggc aag gtg ctc tgc gat gat 465 Pro Cys Arg Ile Cys Val Cys Asp Asn Gly Lys Val Leu Cys Asp Asp 85 90 95 gtt atc tgc gat gag aca aaa aat tgc cct ggc gct gaa gtt cct gag 513 Val Ile Cys Asp Glu Thr Lys Asn Cys Pro Gly Ala Glu Val Pro Glu 100 105 110 ggc gag tgt tgc cct gtg tgc cct gat ggt tcc gag tcc cca act gat 561 Gly Glu Cys Cys Pro Val Cys Pro Asp Gly Ser Glu Ser Pro Thr Asp 115 120 125 cag gaa act act ggc gtg gag ggc cca aaa gga gat act ggt cca cgt 609 Gln Glu Thr Thr Gly Val Glu Gly Pro Lys Gly Asp Thr Gly Pro Arg 130 135 140 145 ggt cct agg ggt cca gca ggt cct cca ggt aga gat ggt att cca ggc 657 Gly Pro Arg Gly Pro Ala Gly Pro Pro Gly Arg Asp Gly Ile Pro Gly 150 155 160 cag cct gga ttg cca gga cca cca ggc cca cct ggc cca cca gga cct 705 Gln Pro Gly Leu Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro 165 170 175 cct ggt ctt ggt gga aat ttc gct cca caa ctc tct tat ggc tat gat 753 Pro Gly Leu Gly Gly Asn Phe Ala Pro Gln Leu Ser Tyr Gly Tyr Asp 180 185 190 gag aag tca aca ggt ggt att tcc gtt cca ggt cct atg gga cca tcc 801 Glu Lys Ser Thr Gly Gly Ile Ser Val Pro Gly Pro Met Gly Pro Ser 195 200 205 gga cca aga ggt ctc cca ggt cct cca ggt gct cct gga cct caa ggc 849 Gly Pro Arg Gly Leu Pro Gly Pro Pro Gly Ala Pro Gly Pro Gln Gly 210 215 220 225 ttt caa gga cct cca ggc gaa cca gga gaa cca ggc gct tct gga cca 897 Phe Gln Gly Pro Pro Gly Glu Pro Gly Glu Pro Gly Ala Ser Gly Pro 230 235 240 atg ggc cca agg gga cca cct ggc cca cca gga aaa aat ggc gat gat 945 Met Gly Pro Arg Gly Pro Pro Gly Pro Pro Gly Lys Asn Gly Asp Asp 245 250 255 ggc gaa gct gga aag cct ggt cgt cct gga gag aga ggt cct cct ggc 993 Gly Glu Ala Gly Lys Pro Gly Arg Pro Gly Glu Arg Gly Pro Pro Gly 260 265 270 cca cag ggt gca aga ggc ttg cca gga act gct ggc ttg cct gga atg 1041 Pro Gln Gly Ala Arg Gly Leu Pro Gly Thr Ala Gly Leu Pro Gly Met 275 280 285 aag gga cat agg ggc ttc tcc ggc ctc gat ggc gct aag ggt gat gct 1089 Lys Gly His Arg Gly Phe Ser Gly Leu Asp Gly Ala Lys Gly Asp Ala 290 295 300 305 ggc cct gct gga cca aag ggc gag cca ggt tcc cct gga gaa aac ggt 1137 Gly Pro Ala Gly Pro Lys Gly Glu Pro Gly Ser Pro Gly Glu Asn Gly 310 315 320 gct cct gga caa atg ggt cct cgt gga ctt cca gga gaa agg ggt cgt 1185 Ala Pro Gly Gln Met Gly Pro Arg Gly Leu Pro Gly Glu Arg Gly Arg 325 330 335 cca ggc gct cca gga cca gca ggt gct agg gga aac gat ggt gca aca 1233 Pro Gly Ala Pro Gly Pro Ala Gly Ala Arg Gly Asn Asp Gly Ala Thr 340 345 350 ggc gct gct ggc cct cct ggc cca act ggt cct gct ggc cct cca gga 1281 Gly Ala Ala Gly Pro Pro Gly Pro Thr Gly Pro Ala Gly Pro Pro Gly 355 360 365 ttc cca ggc gca gtt gga gct aaa gga gaa gca gga cca cag ggc cct 1329 Phe Pro Gly Ala Val Gly Ala Lys Gly Glu Ala Gly Pro Gln Gly Pro 370 375 380 385 agg ggt tct gaa gga cct cag ggt gtt aga ggt gaa cca ggt cct cca 1377 Arg Gly Ser Glu Gly Pro Gln Gly Val Arg Gly Glu Pro Gly Pro Pro 390 395 400 ggc cca gct gga gca gct ggt cca gca gga aat cca ggt gct gat ggt 1425 Gly Pro Ala Gly Ala Ala Gly Pro Ala Gly Asn Pro Gly Ala Asp Gly 405 410 415 caa cct gga gct aag ggc gct aat ggc gca cca ggt atc gca ggc gca 1473 Gln Pro Gly Ala Lys Gly Ala Asn Gly Ala Pro Gly Ile Ala Gly Ala 420 425 430 cca ggt ttt cct ggc gct aga ggc cca agt ggt cct caa gga cca ggt 1521 Pro Gly Phe Pro Gly Ala Arg Gly Pro Ser Gly Pro Gln Gly Pro Gly 435 440 445 gga cca cca ggt cca aaa ggc aat tct ggc gaa cct ggc gct cca ggt 1569 Gly Pro Pro Gly Pro Lys Gly Asn Ser Gly Glu Pro Gly Ala Pro Gly 450 455 460 465 tct aaa gga gat act ggt gct aaa ggc gaa cca gga cct gtt ggt gtt 1617 Ser Lys Gly Asp Thr Gly Ala Lys Gly Glu Pro Gly Pro Val Gly Val 470 475 480 cag ggt cct cct ggt cct gct gga gaa gaa gga aaa aga ggt gct cgt 1665 Gln Gly Pro Pro Gly Pro Ala Gly Glu Glu Gly Lys Arg Gly Ala Arg 485 490 495 gga gaa cca gga cca act gga ctt cct gga cct cct ggt gaa cgt ggc 1713 Gly Glu Pro Gly Pro Thr Gly Leu Pro Gly Pro Pro Gly Glu Arg Gly 500 505 510 gga cct ggc tca agg ggt ttc cct gga gct gat gga gtg gca ggt cca 1761 Gly Pro Gly Ser Arg Gly Phe Pro Gly Ala Asp Gly Val Ala Gly Pro 515 520 525 aaa ggc cct gct gga gag aga ggt tca cca ggt cca gct ggt cct aag 1809 Lys Gly Pro Ala Gly Glu Arg Gly Ser Pro Gly Pro Ala Gly Pro Lys 530 535 540 545 ggc tcc cct ggt gaa gca ggt aga cca ggc gaa gca gga ttg cca ggc 1857 Gly Ser Pro Gly Glu Ala Gly Arg Pro Gly Glu Ala Gly Leu Pro Gly 550 555 560 gca aag gga ttg aca ggc tct cct ggt agt cct ggc cca gat gga aaa 1905 Ala Lys Gly Leu Thr Gly Ser Pro Gly Ser Pro Gly Pro Asp Gly Lys 565 570 575 aca ggc cca cca ggt cca gca gga caa gat gga cgt cca ggc cca cca 1953 Thr Gly Pro Pro Gly Pro Ala Gly Gln Asp Gly Arg Pro Gly Pro Pro 580 585 590 ggt cct cct gga gca agg gga caa gct ggc gtt atg ggt ttt cca gga 2001 Gly Pro Pro Gly Ala Arg Gly Gln Ala Gly Val Met Gly Phe Pro Gly 595 600 605 cct aaa ggt gct gct gga gag cca gga aag gca ggt gaa aga gga gtt 2049 Pro Lys Gly Ala Ala Gly Glu Pro Gly Lys Ala Gly Glu Arg Gly Val 610 615 620 625 cct ggt cca cca gga gca gtg ggt cct gct ggc aaa gat ggt gaa gct 2097 Pro Gly Pro Pro Gly Ala Val Gly Pro Ala Gly Lys Asp Gly Glu Ala 630 635 640 gga gca cag ggc cct cca ggc cct gct ggc cca gct ggc gaa cgt gga 2145 Gly Ala Gln Gly Pro Pro Gly Pro Ala Gly Pro Ala Gly Glu Arg Gly 645 650 655 gaa caa ggc cca gct ggt agt cca gga ttt caa gga ttg cct ggc cct 2193 Glu Gln Gly Pro Ala Gly Ser Pro Gly Phe Gln Gly Leu Pro Gly Pro 660 665 670 gct ggc cct cca gga gaa gca gga aaa cct gga gaa caa gga gtt cct 2241 Ala Gly Pro Pro Gly Glu Ala Gly Lys Pro Gly Glu Gln Gly Val Pro 675 680 685 ggt gat ttg gga gca cct gga cct tca gga gca cgt ggt gaa aga ggc 2289 Gly Asp Leu Gly Ala Pro Gly Pro Ser Gly Ala Arg Gly Glu Arg Gly 690 695 700 705 ttc cct ggc gag agg ggt gtt caa ggt cca cca ggt cca gca gga cct 2337 Phe Pro Gly Glu Arg Gly Val Gln Gly Pro Pro Gly Pro Ala Gly Pro 710 715 720 aga ggt gct aat ggc gct cct ggc aac gat gga gca aaa ggt gat gct 2385 Arg Gly Ala Asn Gly Ala Pro Gly Asn Asp Gly Ala Lys Gly Asp Ala 725 730 735 ggt gct cct ggc gca cct gga agt cag ggt gct cct gga ttg caa gga 2433 Gly Ala Pro Gly Ala Pro Gly Ser Gln Gly Ala Pro Gly Leu Gln Gly 740 745 750 atg cct gga gag agg ggt gct gct ggc ttg cca ggc cca aag ggc gat 2481 Met Pro Gly Glu Arg Gly Ala Ala Gly Leu Pro Gly Pro Lys Gly Asp 755 760 765 agg ggt gat gct gga cca aaa ggt gct gat gga tcc cca gga aaa gat 2529 Arg Gly Asp Ala Gly Pro Lys Gly Ala Asp Gly Ser Pro Gly Lys Asp 770 775 780 785 gga gtt cgt ggt ctt act ggc cca atc gga cct cca ggc cct gct ggc 2577 Gly Val Arg Gly Leu Thr Gly Pro Ile Gly Pro Pro Gly Pro Ala Gly 790 795 800 gct cca ggt gat aag ggc gaa agt ggc cca agt gga cct gct gga cct 2625 Ala Pro Gly Asp Lys Gly Glu Ser Gly Pro Ser Gly Pro Ala Gly Pro 805 810 815 act ggt gct aga ggt gca cct ggt gat agg ggt gaa cct gga cca cct 2673 Thr Gly Ala Arg Gly Ala Pro Gly Asp Arg Gly Glu Pro Gly Pro Pro 820 825 830 ggt cca gct ggt ttt gct ggt cct cct gga gct gat gga caa cct ggc 2721 Gly Pro Ala Gly Phe Ala Gly Pro Pro Gly Ala Asp Gly Gln Pro Gly 835 840 845 gca aag ggt gaa cca ggt gat gct ggc gca aag gga gat gct ggt cca 2769 Ala Lys Gly Glu Pro Gly Asp Ala Gly Ala Lys Gly Asp Ala Gly Pro 850 855 860 865 cct gga cct gct ggt cca gca ggc ccc cct ggg cca atc ggt aat gtt 2817 Pro Gly Pro Ala Gly Pro Ala Gly Pro Pro Gly Pro Ile Gly Asn Val 870 875 880 gga gca cca ggt gct aag gga gct agg ggt tcc gct ggt cca cct gga 2865 Gly Ala Pro Gly Ala Lys Gly Ala Arg Gly Ser Ala Gly Pro Pro Gly 885 890 895 gca aca gga ttt cca ggc gct gct ggt aga gtt ggc cca cca ggc cca 2913 Ala Thr Gly Phe Pro Gly Ala Ala Gly Arg Val Gly Pro Pro Gly Pro 900 905 910 tcc gga aac gca ggc cct cct ggt cct cca ggt cct gct ggc aag gag 2961 Ser Gly Asn Ala Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Lys Glu 915 920 925 ggt ggc aaa gga cca agg ggc gaa act ggc cct gct ggt aga cct ggc 3009 Gly Gly Lys Gly Pro Arg Gly Glu Thr Gly Pro Ala Gly Arg Pro Gly 930 935 940 945 gaa gtt ggc cct cct gga cca cca ggt cca gca gga gaa aaa ggt tcc 3057 Glu Val Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Glu Lys Gly Ser 950 955 960 cca gga gct gat ggc cca gct ggt gct cca gga act cca ggc cct caa 3105 Pro Gly Ala Asp Gly Pro Ala Gly Ala Pro Gly Thr Pro Gly Pro Gln 965 970 975 ggt att gct gga cag aga ggc gtt gtg gga ctc cct ggt caa agg gga 3153 Gly Ile Ala Gly Gln Arg Gly Val Val Gly Leu Pro Gly Gln Arg Gly 980 985 990 gag aga gga ttt cca ggc ttg cca gga cct agt gga gaa cct gga aaa 3201 Glu Arg Gly Phe Pro Gly Leu Pro Gly Pro Ser Gly Glu Pro Gly Lys 995 1000 1005 caa ggc cca tca ggc gct agt gga gag cgt gga cct cct ggc cct 3246 Gln Gly Pro Ser Gly Ala Ser Gly Glu Arg Gly Pro Pro Gly Pro 1010 1015 1020 atg gga cct cct gga ttg gct ggc cca cct ggc gaa tca ggt cgt 3291 Met Gly Pro Pro Gly Leu Ala Gly Pro Pro Gly Glu Ser Gly Arg 1025 1030 1035 gaa ggc gca cca ggc gca gaa gga tca cct gga aga gat gga tcc 3336 Glu Gly Ala Pro Gly Ala Glu Gly Ser Pro Gly Arg Asp Gly Ser 1040 1045 1050 cct ggt gct aaa ggc gat cgt gga gaa act ggt cca gca ggc cca 3381 Pro Gly Ala Lys Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly Pro 1055 1060 1065 cca ggc gca cca ggt gca cct ggc gct cca gga cct gtg gga cca 3426 Pro Gly Ala Pro Gly Ala Pro Gly Ala Pro Gly Pro Val Gly Pro 1070 1075 1080 gct gga aaa tcc gga gat agg ggc gag aca ggc cca gca gga cca 3471 Ala Gly Lys Ser Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly Pro 1085 1090 1095 gct gga cct gtt ggc cct gct ggc gct cgt gga cca gca gga cct 3516 Ala Gly Pro Val Gly Pro Ala Gly Ala Arg Gly Pro Ala Gly Pro 1100 1105 1110 caa gga cca agg gga gat aag gga gaa aca ggc gaa caa ggc gat 3561 Gln Gly Pro Arg Gly Asp Lys Gly Glu Thr Gly Glu Gln Gly Asp 1115 1120 1125 agg ggc att aag ggt cat agg ggt ttt agt ggc ctc cag ggt cct 3606 Arg Gly Ile Lys Gly His Arg Gly Phe Ser Gly Leu Gln Gly Pro 1130 1135 1140 cct ggc cca cct gga tca cca gga gaa cag gga cca tct ggt gct 3651 Pro Gly Pro Pro Gly Ser Pro Gly Glu Gln Gly Pro Ser Gly Ala 1145 1150 1155 tcc ggc cca gct ggt cca aga gga cct cca gga tca gct ggt gca 3696 Ser Gly Pro Ala Gly Pro Arg Gly Pro Pro Gly Ser Ala Gly Ala 1160 1165 1170 cct gga aaa gat ggt ctt aac ggt ctc cca gga cca atc ggc cct 3741 Pro Gly Lys Asp Gly Leu Asn Gly Leu Pro Gly Pro Ile Gly Pro 1175 1180 1185 cca gga cct aga gga aga aca gga gat gct ggc cct gtt ggc cct 3786 Pro Gly Pro Arg Gly Arg Thr Gly Asp Ala Gly Pro Val Gly Pro 1190 1195 1200 cca gga cct cct ggt cca cca ggt cca cct ggt cct cca tca gct 3831 Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Ser Ala 1205 1210 1215 gga ttc gat ttt tca ttt ctt cca cag cca cca caa gag aaa gct 3876 Gly Phe Asp Phe Ser Phe Leu Pro Gln Pro Pro Gln Glu Lys Ala 1220 1225 1230 cac gat ggc ggc aga tat tac cgt gct gat gat gct aac gtt gtt 3921 His Asp Gly Gly Arg Tyr Tyr Arg Ala Asp Asp Ala Asn Val Val 1235 1240 1245 agg gat aga gat ttg gaa gtg gat aca act ttg aaa tcc ctc tcc 3966 Arg Asp Arg Asp Leu Glu Val Asp Thr Thr Leu Lys Ser Leu Ser 1250 1255 1260 cag caa att gaa aac att aga tct cca gaa ggt tca cgt aaa aac 4011 Gln Gln Ile Glu Asn Ile Arg Ser Pro Glu Gly Ser Arg Lys Asn 1265 1270 1275 cca gct aga aca tgt cgt gat ttg aaa atg tgt cac tcc gat tgg 4056 Pro Ala Arg Thr Cys Arg Asp Leu Lys Met Cys His Ser Asp Trp 1280 1285 1290 aaa agt ggt gaa tac tgg att gat cca aat cag ggc tgt aat ctc 4101 Lys Ser Gly Glu Tyr Trp Ile Asp Pro Asn Gln Gly Cys Asn Leu 1295 1300 1305 gat gct atc aaa gtt ttc tgt aac atg gaa aca ggc gaa aca tgc 4146 Asp Ala Ile Lys Val Phe Cys Asn Met Glu Thr Gly Glu Thr Cys 1310 1315 1320 gtt tat cct act caa cct tcc gtg gct cag aaa aat tgg tac atc 4191 Val Tyr Pro Thr Gln Pro Ser Val Ala Gln Lys Asn Trp Tyr Ile 1325 1330 1335 tca aaa aat cct aaa gat aag agg cac gtt tgg ttc ggt gaa agt 4236 Ser Lys Asn Pro Lys Asp Lys Arg His Val Trp Phe Gly Glu Ser 1340 1345 1350 atg act gat gga ttt caa ttt gag tac ggc ggt caa ggt agt gat 4281 Met Thr Asp Gly Phe Gln Phe Glu Tyr Gly Gly Gln Gly Ser Asp 1355 1360 1365 cca gct gat gtg gct att caa ctc aca ttt ttg cgt ctt atg tcc 4326 Pro Ala Asp Val Ala Ile Gln Leu Thr Phe Leu Arg Leu Met Ser 1370 1375 1380 aca gag gca tca caa aac atc act tac cac tgc aaa aac agt gtg 4371 Thr Glu Ala Ser Gln Asn Ile Thr Tyr His Cys Lys Asn Ser Val 1385 1390 1395 gct tat atg gat caa caa aca gga aac ctt aag aag gct ctt ctt 4416 Ala Tyr Met Asp Gln Gln Thr Gly Asn Leu Lys Lys Ala Leu Leu 1400 1405 1410 ttg aag ggc tca aac gag att gag att aga gca gag ggc aac tca 4461 Leu Lys Gly Ser Asn Glu Ile Glu Ile Arg Ala Glu Gly Asn Ser 1415 1420 1425 agg ttt act tat tca gtt act gtt gat ggc tgc act tca cat act 4506 Arg Phe Thr Tyr Ser Val Thr Val Asp Gly Cys Thr Ser His Thr 1430 1435 1440 ggc gct tgg ggt aaa aca gtt atc gag tat aag act aca aaa aca 4551 Gly Ala Trp Gly Lys Thr Val Ile Glu Tyr Lys Thr Thr Lys Thr 1445 1450 1455 tca aga ctc cca atc att gat gtt gct cct ctc gat gtt ggc gct 4596 Ser Arg Leu Pro Ile Ile Asp Val Ala Pro Leu Asp Val Gly Ala 1460 1465 1470 cct gat caa gag ttc ggt ttt gat gtg ggc cca gtt tgt ttc ctc 4641 Pro Asp Gln Glu Phe Gly Phe Asp Val Gly Pro Val Cys Phe Leu 1475 1480 1485 taa tgagctcgcg gccgcatc 4662 <210> 3 <211> 1489 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence of the vascular signal sequence of barley gene for Thiol protease aleurain precursor fused to the human Collagen alpha 1(I) chain and flanking regions <400> 3 Met Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr 1 5 10 15 Ala Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro 20 25 30 Ile Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala Gln Leu Gln 35 40 45 Glu Glu Gly Gln Val Glu Gly Gln Asp Glu Asp Ile Pro Pro Ile Thr 50 55 60 Cys Val Gln Asn Gly Leu Arg Tyr His Asp Arg Asp Val Trp Lys Pro 65 70 75 80 Glu Pro Cys Arg Ile Cys Val Cys Asp Asn Gly Lys Val Leu Cys Asp 85 90 95 Asp Val Ile Cys Asp Glu Thr Lys Asn Cys Pro Gly Ala Glu Val Pro 100 105 110 Glu Gly Glu Cys Cys Pro Val Cys Pro Asp Gly Ser Glu Ser Pro Thr 115 120 125 Asp Gln Glu Thr Thr Gly Val Glu Gly Pro Lys Gly Asp Thr Gly Pro 130 135 140 Arg Gly Pro Arg Gly Pro Ala Gly Pro Pro Gly Arg Asp Gly Ile Pro 145 150 155 160 Gly Gln Pro Gly Leu Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly 165 170 175 Pro Pro Gly Leu Gly Gly Asn Phe Ala Pro Gln Leu Ser Tyr Gly Tyr 180 185 190 Asp Glu Lys Ser Thr Gly Gly Ile Ser Val Pro Gly Pro Met Gly Pro 195 200 205 Ser Gly Pro Arg Gly Leu Pro Gly Pro Pro Gly Ala Pro Gly Pro Gln 210 215 220 Gly Phe Gln Gly Pro Pro Gly Glu Pro Gly Glu Pro Gly Ala Ser Gly 225 230 235 240 Pro Met Gly Pro Arg Gly Pro Pro Gly Pro Pro Gly Lys Asn Gly Asp 245 250 255 Asp Gly Glu Ala Gly Lys Pro Gly Arg Pro Gly Glu Arg Gly Pro Pro 260 265 270 Gly Pro Gln Gly Ala Arg Gly Leu Pro Gly Thr Ala Gly Leu Pro Gly 275 280 285 Met Lys Gly His Arg Gly Phe Ser Gly Leu Asp Gly Ala Lys Gly Asp 290 295 300 Ala Gly Pro Ala Gly Pro Lys Gly Glu Pro Gly Ser Pro Gly Glu Asn 305 310 315 320 Gly Ala Pro Gly Gln Met Gly Pro Arg Gly Leu Pro Gly Glu Arg Gly 325 330 335 Arg Pro Gly Ala Pro Gly Pro Ala Gly Ala Arg Gly Asn Asp Gly Ala 340 345 350 Thr Gly Ala Ala Gly Pro Pro Gly Pro Thr Gly Pro Ala Gly Pro Pro 355 360 365 Gly Phe Pro Gly Ala Val Gly Ala Lys Gly Glu Ala Gly Pro Gln Gly 370 375 380 Pro Arg Gly Ser Glu Gly Pro Gln Gly Val Arg Gly Glu Pro Gly Pro 385 390 395 400 Pro Gly Pro Ala Gly Ala Ala Gly Pro Ala Gly Asn Pro Gly Ala Asp 405 410 415 Gly Gln Pro Gly Ala Lys Gly Ala Asn Gly Ala Pro Gly Ile Ala Gly 420 425 430 Ala Pro Gly Phe Pro Gly Ala Arg Gly Pro Ser Gly Pro Gln Gly Pro 435 440 445 Gly Gly Pro Pro Gly Pro Lys Gly Asn Ser Gly Glu Pro Gly Ala Pro 450 455 460 Gly Ser Lys Gly Asp Thr Gly Ala Lys Gly Glu Pro Gly Pro Val Gly 465 470 475 480 Val Gln Gly Pro Pro Gly Pro Ala Gly Glu Glu Gly Lys Arg Gly Ala 485 490 495 Arg Gly Glu Pro Gly Pro Thr Gly Leu Pro Gly Pro Pro Gly Glu Arg 500 505 510 Gly Gly Pro Gly Ser Arg Gly Phe Pro Gly Ala Asp Gly Val Ala Gly 515 520 525 Pro Lys Gly Pro Ala Gly Glu Arg Gly Ser Pro Gly Pro Ala Gly Pro 530 535 540 Lys Gly Ser Pro Gly Glu Ala Gly Arg Pro Gly Glu Ala Gly Leu Pro 545 550 555 560 Gly Ala Lys Gly Leu Thr Gly Ser Pro Gly Ser Pro Gly Pro Asp Gly 565 570 575 Lys Thr Gly Pro Pro Gly Pro Ala Gly Gln Asp Gly Arg Pro Gly Pro 580 585 590 Pro Gly Pro Pro Gly Ala Arg Gly Gln Ala Gly Val Met Gly Phe Pro 595 600 605 Gly Pro Lys Gly Ala Ala Gly Glu Pro Gly Lys Ala Gly Glu Arg Gly 610 615 620 Val Pro Gly Pro Pro Gly Ala Val Gly Pro Ala Gly Lys Asp Gly Glu 625 630 635 640 Ala Gly Ala Gln Gly Pro Pro Gly Pro Ala Gly Pro Ala Gly Glu Arg 645 650 655 Gly Glu Gln Gly Pro Ala Gly Ser Pro Gly Phe Gln Gly Leu Pro Gly 660 665 670 Pro Ala Gly Pro Pro Gly Glu Ala Gly Lys Pro Gly Glu Gln Gly Val 675 680 685 Pro Gly Asp Leu Gly Ala Pro Gly Pro Ser Gly Ala Arg Gly Glu Arg 690 695 700 Gly Phe Pro Gly Glu Arg Gly Val Gln Gly Pro Pro Gly Pro Ala Gly 705 710 715 720 Pro Arg Gly Ala Asn Gly Ala Pro Gly Asn Asp Gly Ala Lys Gly Asp 725 730 735 Ala Gly Ala Pro Gly Ala Pro Gly Ser Gln Gly Ala Pro Gly Leu Gln 740 745 750 Gly Met Pro Gly Glu Arg Gly Ala Ala Gly Leu Pro Gly Pro Lys Gly 755 760 765 Asp Arg Gly Asp Ala Gly Pro Lys Gly Ala Asp Gly Ser Pro Gly Lys 770 775 780 Asp Gly Val Arg Gly Leu Thr Gly Pro Ile Gly Pro Pro Gly Pro Ala 785 790 795 800 Gly Ala Pro Gly Asp Lys Gly Glu Ser Gly Pro Ser Gly Pro Ala Gly 805 810 815 Pro Thr Gly Ala Arg Gly Ala Pro Gly Asp Arg Gly Glu Pro Gly Pro 820 825 830 Pro Gly Pro Ala Gly Phe Ala Gly Pro Pro Gly Ala Asp Gly Gln Pro 835 840 845 Gly Ala Lys Gly Glu Pro Gly Asp Ala Gly Ala Lys Gly Asp Ala Gly 850 855 860 Pro Pro Gly Pro Ala Gly Pro Ala Gly Pro Pro Gly Pro Ile Gly Asn 865 870 875 880 Val Gly Ala Pro Gly Ala Lys Gly Ala Arg Gly Ser Ala Gly Pro Pro 885 890 895 Gly Ala Thr Gly Phe Pro Gly Ala Ala Gly Arg Val Gly Pro Pro Gly 900 905 910 Pro Ser Gly Asn Ala Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Lys 915 920 925 Glu Gly Gly Lys Gly Pro Arg Gly Glu Thr Gly Pro Ala Gly Arg Pro 930 935 940 Gly Glu Val Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Glu Lys Gly 945 950 955 960 Ser Pro Gly Ala Asp Gly Pro Ala Gly Ala Pro Gly Thr Pro Gly Pro 965 970 975 Gln Gly Ile Ala Gly Gln Arg Gly Val Val Gly Leu Pro Gly Gln Arg 980 985 990 Gly Glu Arg Gly Phe Pro Gly Leu Pro Gly Pro Ser Gly Glu Pro Gly 995 1000 1005 Lys Gln Gly Pro Ser Gly Ala Ser Gly Glu Arg Gly Pro Pro Gly 1010 1015 1020 Pro Met Gly Pro Pro Gly Leu Ala Gly Pro Pro Gly Glu Ser Gly 1025 1030 1035 Arg Glu Gly Ala Pro Gly Ala Glu Gly Ser Pro Gly Arg Asp Gly 1040 1045 1050 Ser Pro Gly Ala Lys Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly 1055 1060 1065 Pro Pro Gly Ala Pro Gly Ala Pro Gly Ala Pro Gly Pro Val Gly 1070 1075 1080 Pro Ala Gly Lys Ser Gly Asp Arg Gly Glu Thr Gly Pro Ala Gly 1085 1090 1095 Pro Ala Gly Pro Val Gly Pro Ala Gly Ala Arg Gly Pro Ala Gly 1100 1105 1110 Pro Gln Gly Pro Arg Gly Asp Lys Gly Glu Thr Gly Glu Gln Gly 1115 1120 1125 Asp Arg Gly Ile Lys Gly His Arg Gly Phe Ser Gly Leu Gln Gly 1130 1135 1140 Pro Pro Gly Pro Pro Gly Ser Pro Gly Glu Gln Gly Pro Ser Gly 1145 1150 1155 Ala Ser Gly Pro Ala Gly Pro Arg Gly Pro Pro Gly Ser Ala Gly 1160 1165 1170 Ala Pro Gly Lys Asp Gly Leu Asn Gly Leu Pro Gly Pro Ile Gly 1175 1180 1185 Pro Pro Gly Pro Arg Gly Arg Thr Gly Asp Ala Gly Pro Val Gly 1190 1195 1200 Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Ser 1205 1210 1215 Ala Gly Phe Asp Phe Ser Phe Leu Pro Gln Pro Pro Gln Glu Lys 1220 1225 1230 Ala His Asp Gly Gly Arg Tyr Tyr Arg Ala Asp Asp Ala Asn Val 1235 1240 1245 Val Arg Asp Arg Asp Leu Glu Val Asp Thr Thr Leu Lys Ser Leu 1250 1255 1260 Ser Gln Gln Ile Glu Asn Ile Arg Ser Pro Glu Gly Ser Arg Lys 1265 1270 1275 Asn Pro Ala Arg Thr Cys Arg Asp Leu Lys Met Cys His Ser Asp 1280 1285 1290 Trp Lys Ser Gly Glu Tyr Trp Ile Asp Pro Asn Gln Gly Cys Asn 1295 1300 1305 Leu Asp Ala Ile Lys Val Phe Cys Asn Met Glu Thr Gly Glu Thr 1310 1315 1320 Cys Val Tyr Pro Thr Gln Pro Ser Val Ala Gln Lys Asn Trp Tyr 1325 1330 1335 Ile Ser Lys Asn Pro Lys Asp Lys Arg His Val Trp Phe Gly Glu 1340 1345 1350 Ser Met Thr Asp Gly Phe Gln Phe Glu Tyr Gly Gly Gln Gly Ser 1355 1360 1365 Asp Pro Ala Asp Val Ala Ile Gln Leu Thr Phe Leu Arg Leu Met 1370 1375 1380 Ser Thr Glu Ala Ser Gln Asn Ile Thr Tyr His Cys Lys Asn Ser 1385 1390 1395 Val Ala Tyr Met Asp Gln Gln Thr Gly Asn Leu Lys Lys Ala Leu 1400 1405 1410 Leu Leu Lys Gly Ser Asn Glu Ile Glu Ile Arg Ala Glu Gly Asn 1415 1420 1425 Ser Arg Phe Thr Tyr Ser Val Thr Val Asp Gly Cys Thr Ser His 1430 1435 1440 Thr Gly Ala Trp Gly Lys Thr Val Ile Glu Tyr Lys Thr Thr Lys 1445 1450 1455 Thr Ser Arg Leu Pro Ile Ile Asp Val Ala Pro Leu Asp Val Gly 1460 1465 1470 Ala Pro Asp Gln Glu Phe Gly Phe Asp Val Gly Pro Val Cys Phe 1475 1480 1485 Leu <210> 4 <211> 4362 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence containing the coding regions of the vascular signal sequence of barley gene for Thiol protease aleurain precursor fused to the human Collagen alpha 2(I) chain and flanking regions <400> 4 gcgatgcatg taatgtcatg agccacatga tccaatggcc acaggaacgt aagaatgtag 60 atagatttga ttttgtccgt tagatagcaa acaacattat aaaaggtgtg tatcaatacg 120 aactaattca ctcattggat tcatagaagt ccattcctcc taagtatcta aaccatggct 180 cacgctcgtg ttctcctcct cgctctcgct gttttggcaa cagctgctgt ggctgtggct 240 tcaagttcta gttttgctga ttccaaccca attcgtccag ttactgatag agcagcttcc 300 actttggctc aattgcttca agaagaaact gtgaggaagg gccctgctgg cgataggggc 360 cctaggggcg aaaggggtcc accaggacct ccaggcaggg atggcgaaga tggtccaact 420 ggccctcctg gacctcctgg ccctccaggg ccacccggct tgggcggaaa cttcgcagct 480 caatacgatg gcaagggtgt tggtcttggt cctggtccta tgggcttgat gggacctaga 540 ggcccacctg gtgctgctgg tgctcctgga ccacagggtt ttcagggacc agctggcgag 600 ccaggagagc caggccaaac aggaccagct ggtgcaaggg gacctgctgg acctcctgga 660 aaagctggtg aagatggtca cccaggcaaa ccaggacgtc ctggcgaaag aggtgttgtt 720 ggaccacaag gcgctagggg atttccaggt acacctggat tgccaggttt taagggcatt 780 cgtggtcata acggcctcga tggattgaag ggacagcctg gcgcacctgg cgttaagggt 840 gaacctggag caccaggtga aaacggtact cctggccaga ctggtgcaag aggactccca 900 ggtgaaaggg gtagagttgg tgctcctgga cctgctggag ctaggggtag tgatggtagt 960 gttggtcctg tgggccctgc tggtccaatc ggttccgctg gcccacctgg attcccaggc 1020 gctccaggac ctaaaggaga aatcggtgct gtgggtaacg caggtcctac tggtccagca 1080 ggtcctcgtg gagaagtggg attgccagga ctttctggtc cagtgggccc tccaggcaac 1140 cctggagcta acggcttgac aggagctaaa ggcgcagcag gactccctgg agtggctggc 1200 gcaccaggat tgcctggtcc aaggggtatc ccaggccctg ttggcgcagc tggagctact 1260 ggtgcacgtg gacttgttgg cgaaccaggc cctgctggat caaaaggcga gtctggaaat 1320 aagggagaac ctggttctgc tggacctcaa ggtcctcctg gaccttctgg agaagaagga 1380 aaaaggggac caaatggcga ggctggatca gcaggtccac caggaccacc tggacttcgt 1440 ggatcccctg gtagtagagg acttccaggc gctgatggta gagcaggcgt tatgggacca 1500 ccaggaagta gaggagcatc cggtccagca ggagttaggg gtcctaacgg agatgctggt 1560 agaccaggtg aaccaggtct tatgggccca aggggcctcc caggtagtcc aggaaatatc 1620 ggccctgctg gaaaagaagg ccctgttgga cttccaggta ttgatggacg tcctggccct 1680 attggcccag caggtgcaag aggagaacct ggcaatattg gatttccagg accaaagggt 1740 ccaacaggcg atcctggaaa aaatggagat aagggtcatg ctggattggc aggcgcaagg 1800 ggcgctcctg gtccagatgg aaacaacggc gcacagggtc cacctggccc tcagggtgtt 1860 caaggcggaa aaggcgaaca aggcccagct ggaccaccag gctttcaagg cttgccagga 1920 ccaagtggtc cagcaggtga agttggcaag ccaggcgagc gtggacttca tggcgagttt 1980 ggactccctg gaccagcagg accaaggggt gaaagaggcc ctcctggaga gagtggcgct 2040 gctggaccaa caggcccaat cggtagtaga ggtcctagtg gacctccagg cccagatgga 2100 aataagggtg aaccaggagt tgtgggcgct gttggaacag ctggtccttc aggaccatca 2160 ggactcccag gcgagagagg cgctgctggc attcctggag gaaaaggtga aaaaggcgaa 2220 cctggcctcc gtggcgaaat cggaaatcct ggacgtgatg gtgctcgtgg tgcacacggc 2280 gctgtgggcg ctccaggccc tgctggtgct actggtgata gaggagaggc tggcgcagct 2340 ggcccagcag gtcctgctgg cccaaggggt agtcctggtg aaagaggcga agttggacct 2400 gctggcccta acggctttgc tggccctgct ggagcagcag gtcaacctgg cgctaaaggt 2460 gaaaggggcg gaaagggccc aaaaggtgaa aatggcgttg tgggaccaac tggtccagtg 2520 ggcgcagctg gacctgctgg tccaaatgga ccaccaggac cagcaggtag tagaggagat 2580 ggtggacctc caggaatgac aggttttcca ggtgctgctg gtagaacagg acctcctggt 2640 cctagtggta tttctggtcc accaggacca ccaggtcctg ctggaaaaga aggattgagg 2700 ggtccacgtg gtgatcaagg accagtgggc agaactggtg aagttggcgc agtgggacca 2760 cctggttttg ctggagaaaa gggcccttct ggagaggcag gaacagctgg tcctcctggt 2820 acacctggac ctcaaggact tttgggtgca cctggtattc tcggattgcc aggaagtagg 2880 ggcgaacgtg gacttcctgg cgtggcagga gcagttggag aacctggccc tctcggaatc 2940 gcaggcccac caggcgcaag aggaccacca ggagctgttg gatcaccagg cgtgaatggt 3000 gcacctggcg aggctggtcg tgatggaaac ccaggaaatg atggcccacc aggaagagat 3060 ggtcaacctg gacacaaagg cgagaggggc tacccaggaa atattggccc agttggtgct 3120 gctggcgcac caggcccaca cggtccagtt ggaccagcag gaaaacacgg taatcgtggc 3180 gaaacaggcc cttcaggccc agtgggacct gctggtgctg ttggcccaag aggaccatct 3240 ggacctcaag gcattagagg cgataaggga gagcctggcg aaaaaggacc tagaggcttg 3300 cctggtttta aaggacacaa cggtctccaa ggacttccag gtatcgctgg tcatcatgga 3360 gatcagggtg ctcctggatc agtgggtcca gcaggtccta gaggcccagc aggcccttcc 3420 ggtccagcag gaaaggatgg acgtactggc caccctggaa ctgtgggccc tgctggaatt 3480 agaggtcctc aaggtcatca gggccctgct ggccctccag gtccaccagg tcctccaggc 3540 ccaccaggag tttcaggtgg tggttacgat tttggttacg atggtgattt ttaccgtgct 3600 gatcaaccta gaagtgctcc ttctctccgt cctaaagatt atgaagttga tgctactttg 3660 aaatcactta acaaccagat tgagactctt ctcacacctg agggatcaag aaagaatcca 3720 gcacgtacat gccgtgatct cagacttagt cacccagagt ggtcaagtgg ctattattgg 3780 attgatccta atcagggttg tacaatggag gctatcaaag tttactgtga ttttccaact 3840 ggagagacat gtattagggc acaacctgag aacattccag ctaaaaattg gtatcgttcc 3900 tctaaagata agaaacatgt ttggctcgga gagactatta acgctggttc tcagttcgag 3960 tataatgttg agggcgttac ttctaaagag atggcaactc agctcgcttt tatgagattg 4020 ctcgctaact acgcatccca aaacatcact tatcactgca aaaattccat tgcatatatg 4080 gatgaggaga caggaaattt gaagaaagca gttattctcc aaggtagtaa cgatgttgag 4140 cttgtggctg agggaaatag tagattcact tacacagttt tggtggatgg atgctcaaag 4200 aaaactaatg agtggggcaa gacaatcatt gagtacaaga caaataagcc ttctaggctc 4260 ccatttctcg atattgcacc tcttgatatc ggaggagctg atcacgagtt ttttgttgat 4320 atcggacctg tttgttttaa gtaatgagct cgcggccgca tc 4362 <210> 5 <211> 4362 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence of the vascular signal sequence of barley gene for Thiol protease aleurain precursor fused to the human Collagen alpha 2(I) chain and flanking regions <220> <221> CDS <222> (175)..(4344) <400> 5 gcgatgcatg taatgtcatg agccacatga tccaatggcc acaggaacgt aagaatgtag 60 atagatttga ttttgtccgt tagatagcaa acaacattat aaaaggtgtg tatcaatacg 120 aactaattca ctcattggat tcatagaagt ccattcctcc taagtatcta aacc atg 177 Met 1 gct cac gct cgt gtt ctc ctc ctc gct ctc gct gtt ttg gca aca gct 225 Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr Ala 5 10 15 gct gtg gct gtg gct tca agt tct agt ttt gct gat tcc aac cca att 273 Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro Ile 20 25 30 cgt cca gtt act gat aga gca gct tcc act ttg gct caa ttg ctt caa 321 Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala Gln Leu Leu Gln 35 40 45 gaa gaa act gtg agg aag ggc cct gct ggc gat agg ggc cct agg ggc 369 Glu Glu Thr Val Arg Lys Gly Pro Ala Gly Asp Arg Gly Pro Arg Gly 50 55 60 65 gaa agg ggt cca cca gga cct cca ggc agg gat ggc gaa gat ggt cca 417 Glu Arg Gly Pro Pro Gly Pro Pro Gly Arg Asp Gly Glu Asp Gly Pro 70 75 80 act ggc cct cct gga cct cct ggc cct cca ggg cca ccc ggc ttg ggc 465 Thr Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Leu Gly 85 90 95 gga aac ttc gca gct caa tac gat ggc aag ggt gtt ggt ctt ggt cct 513 Gly Asn Phe Ala Ala Gln Tyr Asp Gly Lys Gly Val Gly Leu Gly Pro 100 105 110 ggt cct atg ggc ttg atg gga cct aga ggc cca cct ggt gct gct ggt 561 Gly Pro Met Gly Leu Met Gly Pro Arg Gly Pro Pro Gly Ala Ala Gly 115 120 125 gct cct gga cca cag ggt ttt cag gga cca gct ggc gag cca gga gag 609 Ala Pro Gly Pro Gln Gly Phe Gln Gly Pro Ala Gly Glu Pro Gly Glu 130 135 140 145 cca ggc caa aca gga cca gct ggt gca agg gga cct gct gga cct cct 657 Pro Gly Gln Thr Gly Pro Ala Gly Ala Arg Gly Pro Ala Gly Pro Pro 150 155 160 gga aaa gct ggt gaa gat ggt cac cca ggc aaa cca gga cgt cct ggc 705 Gly Lys Ala Gly Glu Asp Gly His Pro Gly Lys Pro Gly Arg Pro Gly 165 170 175 gaa aga ggt gtt gtt gga cca caa ggc gct agg gga ttt cca ggt aca 753 Glu Arg Gly Val Val Gly Pro Gln Gly Ala Arg Gly Phe Pro Gly Thr 180 185 190 cct gga ttg cca ggt ttt aag ggc att cgt ggt cat aac ggc ctc gat 801 Pro Gly Leu Pro Gly Phe Lys Gly Ile Arg Gly His Asn Gly Leu Asp 195 200 205 gga ttg aag gga cag cct ggc gca cct ggc gtt aag ggt gaa cct gga 849 Gly Leu Lys Gly Gln Pro Gly Ala Pro Gly Val Lys Gly Glu Pro Gly 210 215 220 225 gca cca ggt gaa aac ggt act cct ggc cag act ggt gca aga gga ctc 897 Ala Pro Gly Glu Asn Gly Thr Pro Gly Gln Thr Gly Ala Arg Gly Leu 230 235 240 cca ggt gaa agg ggt aga gtt ggt gct cct gga cct gct gga gct agg 945 Pro Gly Glu Arg Gly Arg Val Gly Ala Pro Gly Pro Ala Gly Ala Arg 245 250 255 ggt agt gat ggt agt gtt ggt cct gtg ggc cct gct ggt cca atc ggt 993 Gly Ser Asp Gly Ser Val Gly Pro Val Gly Pro Ala Gly Pro Ile Gly 260 265 270 tcc gct ggc cca cct gga ttc cca ggc gct cca gga cct aaa gga gaa 1041 Ser Ala Gly Pro Pro Gly Phe Pro Gly Ala Pro Gly Pro Lys Gly Glu 275 280 285 atc ggt gct gtg ggt aac gca ggt cct act ggt cca gca ggt cct cgt 1089 Ile Gly Ala Val Gly Asn Ala Gly Pro Thr Gly Pro Ala Gly Pro Arg 290 295 300 305 gga gaa gtg gga ttg cca gga ctt tct ggt cca gtg ggc cct cca ggc 1137 Gly Glu Val Gly Leu Pro Gly Leu Ser Gly Pro Val Gly Pro Pro Gly 310 315 320 aac cct gga gct aac ggc ttg aca gga gct aaa ggc gca gca gga ctc 1185 Asn Pro Gly Ala Asn Gly Leu Thr Gly Ala Lys Gly Ala Ala Gly Leu 325 330 335 cct gga gtg gct ggc gca cca gga ttg cct ggt cca agg ggt atc cca 1233 Pro Gly Val Ala Gly Ala Pro Gly Leu Pro Gly Pro Arg Gly Ile Pro 340 345 350 ggc cct gtt ggc gca gct gga gct act ggt gca cgt gga ctt gtt ggc 1281 Gly Pro Val Gly Ala Ala Gly Ala Thr Gly Ala Arg Gly Leu Val Gly 355 360 365 gaa cca ggc cct gct gga tca aaa ggc gag tct gga aat aag gga gaa 1329 Glu Pro Gly Pro Ala Gly Ser Lys Gly Glu Ser Gly Asn Lys Gly Glu 370 375 380 385 cct ggt tct gct gga cct caa ggt cct cct gga cct tct gga gaa gaa 1377 Pro Gly Ser Ala Gly Pro Gln Gly Pro Pro Gly Pro Ser Gly Glu Glu 390 395 400 gga aaa agg gga cca aat ggc gag gct gga tca gca ggt cca cca gga 1425 Gly Lys Arg Gly Pro Asn Gly Glu Ala Gly Ser Ala Gly Pro Pro Gly 405 410 415 cca cct gga ctt cgt gga tcc cct ggt agt aga gga ctt cca ggc gct 1473 Pro Pro Gly Leu Arg Gly Ser Pro Gly Ser Arg Gly Leu Pro Gly Ala 420 425 430 gat ggt aga gca ggc gtt atg gga cca cca gga agt aga gga gca tcc 1521 Asp Gly Arg Ala Gly Val Met Gly Pro Pro Gly Ser Arg Gly Ala Ser 435 440 445 ggt cca gca gga gtt agg ggt cct aac gga gat gct ggt aga cca ggt 1569 Gly Pro Ala Gly Val Arg Gly Pro Asn Gly Asp Ala Gly Arg Pro Gly 450 455 460 465 gaa cca ggt ctt atg ggc cca agg ggc ctc cca ggt agt cca gga aat 1617 Glu Pro Gly Leu Met Gly Pro Arg Gly Leu Pro Gly Ser Pro Gly Asn 470 475 480 atc ggc cct gct gga aaa gaa ggc cct gtt gga ctt cca ggt att gat 1665 Ile Gly Pro Ala Gly Lys Glu Gly Pro Val Gly Leu Pro Gly Ile Asp 485 490 495 gga cgt cct ggc cct att ggc cca gca ggt gca aga gga gaa cct ggc 1713 Gly Arg Pro Gly Pro Ile Gly Pro Ala Gly Ala Arg Gly Glu Pro Gly 500 505 510 aat att gga ttt cca gga cca aag ggt cca aca ggc gat cct gga aaa 1761 Asn Ile Gly Phe Pro Gly Pro Lys Gly Pro Thr Gly Asp Pro Gly Lys 515 520 525 aat gga gat aag ggt cat gct gga ttg gca ggc gca agg ggc gct cct 1809 Asn Gly Asp Lys Gly His Ala Gly Leu Ala Gly Ala Arg Gly Ala Pro 530 535 540 545 ggt cca gat gga aac aac ggc gca cag ggt cca cct ggc cct cag ggt 1857 Gly Pro Asp Gly Asn Asn Gly Ala Gln Gly Pro Pro Gly Pro Gln Gly 550 555 560 gtt caa ggc gga aaa ggc gaa caa ggc cca gct gga cca cca ggc ttt 1905 Val Gln Gly Gly Lys Gly Glu Gln Gly Pro Ala Gly Pro Pro Gly Phe 565 570 575 caa ggc ttg cca gga cca agt ggt cca gca ggt gaa gtt ggc aag cca 1953 Gln Gly Leu Pro Gly Pro Ser Gly Pro Ala Gly Glu Val Gly Lys Pro 580 585 590 ggc gag cgt gga ctt cat ggc gag ttt gga ctc cct gga cca gca gga 2001 Gly Glu Arg Gly Leu His Gly Glu Phe Gly Leu Pro Gly Pro Ala Gly 595 600 605 cca agg ggt gaa aga ggc cct cct gga gag agt ggc gct gct gga cca 2049 Pro Arg Gly Glu Arg Gly Pro Pro Gly Glu Ser Gly Ala Ala Gly Pro 610 615 620 625 aca ggc cca atc ggt agt aga ggt cct agt gga cct cca ggc cca gat 2097 Thr Gly Pro Ile Gly Ser Arg Gly Pro Ser Gly Pro Pro Gly Pro Asp 630 635 640 gga aat aag ggt gaa cca gga gtt gtg ggc gct gtt gga aca gct ggt 2145 Gly Asn Lys Gly Glu Pro Gly Val Val Gly Ala Val Gly Thr Ala Gly 645 650 655 cct tca gga cca tca gga ctc cca ggc gag aga ggc gct gct ggc att 2193 Pro Ser Gly Pro Ser Gly Leu Pro Gly Glu Arg Gly Ala Ala Gly Ile 660 665 670 cct gga gga aaa ggt gaa aaa ggc gaa cct ggc ctc cgt ggc gaa atc 2241 Pro Gly Gly Lys Gly Glu Lys Gly Glu Pro Gly Leu Arg Gly Glu Ile 675 680 685 gga aat cct gga cgt gat ggt gct cgt ggt gca cac ggc gct gtg ggc 2289 Gly Asn Pro Gly Arg Asp Gly Ala Arg Gly Ala His Gly Ala Val Gly 690 695 700 705 gct cca ggc cct gct ggt gct act ggt gat aga gga gag gct ggc gca 2337 Ala Pro Gly Pro Ala Gly Ala Thr Gly Asp Arg Gly Glu Ala Gly Ala 710 715 720 gct ggc cca gca ggt cct gct ggc cca agg ggt agt cct ggt gaa aga 2385 Ala Gly Pro Ala Gly Pro Ala Gly Pro Arg Gly Ser Pro Gly Glu Arg 725 730 735 ggc gaa gtt gga cct gct ggc cct aac ggc ttt gct ggc cct gct gga 2433 Gly Glu Val Gly Pro Ala Gly Pro Asn Gly Phe Ala Gly Pro Ala Gly 740 745 750 gca gca ggt caa cct ggc gct aaa ggt gaa agg ggc gga aag ggc cca 2481 Ala Ala Gly Gln Pro Gly Ala Lys Gly Glu Arg Gly Gly Lys Gly Pro 755 760 765 aaa ggt gaa aat ggc gtt gtg gga cca act ggt cca gtg ggc gca gct 2529 Lys Gly Glu Asn Gly Val Val Gly Pro Thr Gly Pro Val Gly Ala Ala 770 775 780 785 gga cct gct ggt cca aat gga cca cca gga cca gca ggt agt aga gga 2577 Gly Pro Ala Gly Pro Asn Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly 790 795 800 gat ggt gga cct cca gga atg aca ggt ttt cca ggt gct gct ggt aga 2625 Asp Gly Gly Pro Pro Gly Met Thr Gly Phe Pro Gly Ala Ala Gly Arg 805 810 815 aca gga cct cct ggt cct agt ggt att tct ggt cca cca gga cca cca 2673 Thr Gly Pro Pro Gly Pro Ser Gly Ile Ser Gly Pro Pro Gly Pro Pro 820 825 830 ggt cct gct gga aaa gaa gga ttg agg ggt cca cgt ggt gat caa gga 2721 Gly Pro Ala Gly Lys Glu Gly Leu Arg Gly Pro Arg Gly Asp Gln Gly 835 840 845 cca gtg ggc aga act ggt gaa gtt ggc gca gtg gga cca cct ggt ttt 2769 Pro Val Gly Arg Thr Gly Glu Val Gly Ala Val Gly Pro Pro Gly Phe 850 855 860 865 gct gga gaa aag ggc cct tct gga gag gca gga aca gct ggt cct cct 2817 Ala Gly Glu Lys Gly Pro Ser Gly Glu Ala Gly Thr Ala Gly Pro Pro 870 875 880 ggt aca cct gga cct caa gga ctt ttg ggt gca cct ggt att ctc gga 2865 Gly Thr Pro Gly Pro Gln Gly Leu Leu Gly Ala Pro Gly Ile Leu Gly 885 890 895 ttg cca gga agt agg ggc gaa cgt gga ctt cct ggc gtg gca gga gca 2913 Leu Pro Gly Ser Arg Gly Glu Arg Gly Leu Pro Gly Val Ala Gly Ala 900 905 910 gtt gga gaa cct ggc cct ctc gga atc gca ggc cca cca ggc gca aga 2961 Val Gly Glu Pro Gly Pro Leu Gly Ile Ala Gly Pro Pro Gly Ala Arg 915 920 925 gga cca cca gga gct gtt gga tca cca ggc gtg aat ggt gca cct ggc 3009 Gly Pro Pro Gly Ala Val Gly Ser Pro Gly Val Asn Gly Ala Pro Gly 930 935 940 945 gag gct ggt cgt gat gga aac cca gga aat gat ggc cca cca gga aga 3057 Glu Ala Gly Arg Asp Gly Asn Pro Gly Asn Asp Gly Pro Pro Gly Arg 950 955 960 gat ggt caa cct gga cac aaa ggc gag agg ggc tac cca gga aat att 3105 Asp Gly Gln Pro Gly His Lys Gly Glu Arg Gly Tyr Pro Gly Asn Ile 965 970 975 ggc cca gtt ggt gct gct ggc gca cca ggc cca cac ggt cca gtt gga 3153 Gly Pro Val Gly Ala Ala Gly Ala Pro Gly Pro His Gly Pro Val Gly 980 985 990 cca gca gga aaa cac ggt aat cgt ggc gaa aca ggc cct tca ggc cca 3201 Pro Ala Gly Lys His Gly Asn Arg Gly Glu Thr Gly Pro Ser Gly Pro 995 1000 1005 gtg gga cct gct ggt gct gtt ggc cca aga gga cca tct gga cct 3246 Val Gly Pro Ala Gly Ala Val Gly Pro Arg Gly Pro Ser Gly Pro 1010 1015 1020 caa ggc att aga ggc gat aag gga gag cct ggc gaa aaa gga cct 3291 Gln Gly Ile Arg Gly Asp Lys Gly Glu Pro Gly Glu Lys Gly Pro 1025 1030 1035 aga ggc ttg cct ggt ttt aaa gga cac aac ggt ctc caa gga ctt 3336 Arg Gly Leu Pro Gly Phe Lys Gly His Asn Gly Leu Gln Gly Leu 1040 1045 1050 cca ggt atc gct ggt cat cat gga gat cag ggt gct cct gga tca 3381 Pro Gly Ile Ala Gly His His Gly Asp Gln Gly Ala Pro Gly Ser 1055 1060 1065 gtg ggt cca gca ggt cct aga ggc cca gca ggc cct tcc ggt cca 3426 Val Gly Pro Ala Gly Pro Arg Gly Pro Ala Gly Pro Ser Gly Pro 1070 1075 1080 gca gga aag gat gga cgt act ggc cac cct gga act gtg ggc cct 3471 Ala Gly Lys Asp Gly Arg Thr Gly His Pro Gly Thr Val Gly Pro 1085 1090 1095 gct gga att aga ggt cct caa ggt cat cag ggc cct gct ggc cct 3516 Ala Gly Ile Arg Gly Pro Gln Gly His Gln Gly Pro Ala Gly Pro 1100 1105 1110 cca ggt cca cca ggt cct cca ggc cca cca gga gtt tca ggt ggt 3561 Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Val Ser Gly Gly 1115 1120 1125 ggt tac gat ttt ggt tac gat ggt gat ttt tac cgt gct gat caa 3606 Gly Tyr Asp Phe Gly Tyr Asp Gly Asp Phe Tyr Arg Ala Asp Gln 1130 1135 1140 cct aga agt gct cct tct ctc cgt cct aaa gat tat gaa gtt gat 3651 Pro Arg Ser Ala Pro Ser Leu Arg Pro Lys Asp Tyr Glu Val Asp 1145 1150 1155 gct act ttg aaa tca ctt aac aac cag att gag act ctt ctc aca 3696 Ala Thr Leu Lys Ser Leu Asn Asn Gln Ile Glu Thr Leu Leu Thr 1160 1165 1170 cct gag gga tca aga aag aat cca gca cgt aca tgc cgt gat ctc 3741 Pro Glu Gly Ser Arg Lys Asn Pro Ala Arg Thr Cys Arg Asp Leu 1175 1180 1185 aga ctt agt cac cca gag tgg tca agt ggc tat tat tgg att gat 3786 Arg Leu Ser His Pro Glu Trp Ser Ser Gly Tyr Tyr Trp Ile Asp 1190 1195 1200 cct aat cag ggt tgt aca atg gag gct atc aaa gtt tac tgt gat 3831 Pro Asn Gln Gly Cys Thr Met Glu Ala Ile Lys Val Tyr Cys Asp 1205 1210 1215 ttt cca act gga gag aca tgt att agg gca caa cct gag aac att 3876 Phe Pro Thr Gly Glu Thr Cys Ile Arg Ala Gln Pro Glu Asn Ile 1220 1225 1230 cca gct aaa aat tgg tat cgt tcc tct aaa gat aag aaa cat gtt 3921 Pro Ala Lys Asn Trp Tyr Arg Ser Ser Lys Asp Lys Lys His Val 1235 1240 1245 tgg ctc gga gag act att aac gct ggt tct cag ttc gag tat aat 3966 Trp Leu Gly Glu Thr Ile Asn Ala Gly Ser Gln Phe Glu Tyr Asn 1250 1255 1260 gtt gag ggc gtt act tct aaa gag atg gca act cag ctc gct ttt 4011 Val Glu Gly Val Thr Ser Lys Glu Met Ala Thr Gln Leu Ala Phe 1265 1270 1275 atg aga ttg ctc gct aac tac gca tcc caa aac atc act tat cac 4056 Met Arg Leu Leu Ala Asn Tyr Ala Ser Gln Asn Ile Thr Tyr His 1280 1285 1290 tgc aaa aat tcc att gca tat atg gat gag gag aca gga aat ttg 4101 Cys Lys Asn Ser Ile Ala Tyr Met Asp Glu Glu Thr Gly Asn Leu 1295 1300 1305 aag aaa gca gtt att ctc caa ggt agt aac gat gtt gag ctt gtg 4146 Lys Lys Ala Val Ile Leu Gln Gly Ser Asn Asp Val Glu Leu Val 1310 1315 1320 gct gag gga aat agt aga ttc act tac aca gtt ttg gtg gat gga 4191 Ala Glu Gly Asn Ser Arg Phe Thr Tyr Thr Val Leu Val Asp Gly 1325 1330 1335 tgc tca aag aaa act aat gag tgg ggc aag aca atc att gag tac 4236 Cys Ser Lys Lys Thr Asn Glu Trp Gly Lys Thr Ile Ile Glu Tyr 1340 1345 1350 aag aca aat aag cct tct agg ctc cca ttt ctc gat att gca cct 4281 Lys Thr Asn Lys Pro Ser Arg Leu Pro Phe Leu Asp Ile Ala Pro 1355 1360 1365 ctt gat atc gga gga gct gat cac gag ttt ttt gtt gat atc gga 4326 Leu Asp Ile Gly Gly Ala Asp His Glu Phe Phe Val Asp Ile Gly 1370 1375 1380 cct gtt tgt ttt aag taa tgagctcgcg gccgcatc 4362 Pro Val Cys Phe Lys 1385 <210> 6 <211> 1389 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence containing the coding regions of the vascular signal sequence of barley gene for Thiol protease aleurain precursor fused to the human Collagen alpha 2(I) chain and flanking regions <400> 6 Met Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr 1 5 10 15 Ala Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro 20 25 30 Ile Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala Gln Leu Leu 35 40 45 Gln Glu Glu Thr Val Arg Lys Gly Pro Ala Gly Asp Arg Gly Pro Arg 50 55 60 Gly Glu Arg Gly Pro Pro Gly Pro Pro Gly Arg Asp Gly Glu Asp Gly 65 70 75 80 Pro Thr Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Leu 85 90 95 Gly Gly Asn Phe Ala Ala Gln Tyr Asp Gly Lys Gly Val Gly Leu Gly 100 105 110 Pro Gly Pro Met Gly Leu Met Gly Pro Arg Gly Pro Pro Gly Ala Ala 115 120 125 Gly Ala Pro Gly Pro Gln Gly Phe Gln Gly Pro Ala Gly Glu Pro Gly 130 135 140 Glu Pro Gly Gln Thr Gly Pro Ala Gly Ala Arg Gly Pro Ala Gly Pro 145 150 155 160 Pro Gly Lys Ala Gly Glu Asp Gly His Pro Gly Lys Pro Gly Arg Pro 165 170 175 Gly Glu Arg Gly Val Val Gly Pro Gln Gly Ala Arg Gly Phe Pro Gly 180 185 190 Thr Pro Gly Leu Pro Gly Phe Lys Gly Ile Arg Gly His Asn Gly Leu 195 200 205 Asp Gly Leu Lys Gly Gln Pro Gly Ala Pro Gly Val Lys Gly Glu Pro 210 215 220 Gly Ala Pro Gly Glu Asn Gly Thr Pro Gly Gln Thr Gly Ala Arg Gly 225 230 235 240 Leu Pro Gly Glu Arg Gly Arg Val Gly Ala Pro Gly Pro Ala Gly Ala 245 250 255 Arg Gly Ser Asp Gly Ser Val Gly Pro Val Gly Pro Ala Gly Pro Ile 260 265 270 Gly Ser Ala Gly Pro Pro Gly Phe Pro Gly Ala Pro Gly Pro Lys Gly 275 280 285 Glu Ile Gly Ala Val Gly Asn Ala Gly Pro Thr Gly Pro Ala Gly Pro 290 295 300 Arg Gly Glu Val Gly Leu Pro Gly Leu Ser Gly Pro Val Gly Pro Pro 305 310 315 320 Gly Asn Pro Gly Ala Asn Gly Leu Thr Gly Ala Lys Gly Ala Ala Gly 325 330 335 Leu Pro Gly Val Ala Gly Ala Pro Gly Leu Pro Gly Pro Arg Gly Ile 340 345 350 Pro Gly Pro Val Gly Ala Ala Gly Ala Thr Gly Ala Arg Gly Leu Val 355 360 365 Gly Glu Pro Gly Pro Ala Gly Ser Lys Gly Glu Ser Gly Asn Lys Gly 370 375 380 Glu Pro Gly Ser Ala Gly Pro Gln Gly Pro Pro Gly Pro Ser Gly Glu 385 390 395 400 Glu Gly Lys Arg Gly Pro Asn Gly Glu Ala Gly Ser Ala Gly Pro Pro 405 410 415 Gly Pro Pro Gly Leu Arg Gly Ser Pro Gly Ser Arg Gly Leu Pro Gly 420 425 430 Ala Asp Gly Arg Ala Gly Val Met Gly Pro Pro Gly Ser Arg Gly Ala 435 440 445 Ser Gly Pro Ala Gly Val Arg Gly Pro Asn Gly Asp Ala Gly Arg Pro 450 455 460 Gly Glu Pro Gly Leu Met Gly Pro Arg Gly Leu Pro Gly Ser Pro Gly 465 470 475 480 Asn Ile Gly Pro Ala Gly Lys Glu Gly Pro Val Gly Leu Pro Gly Ile 485 490 495 Asp Gly Arg Pro Gly Pro Ile Gly Pro Ala Gly Ala Arg Gly Glu Pro 500 505 510 Gly Asn Ile Gly Phe Pro Gly Pro Lys Gly Pro Thr Gly Asp Pro Gly 515 520 525 Lys Asn Gly Asp Lys Gly His Ala Gly Leu Ala Gly Ala Arg Gly Ala 530 535 540 Pro Gly Pro Asp Gly Asn Asn Gly Ala Gln Gly Pro Pro Gly Pro Gln 545 550 555 560 Gly Val Gln Gly Gly Lys Gly Glu Gln Gly Pro Ala Gly Pro Pro Gly 565 570 575 Phe Gln Gly Leu Pro Gly Pro Ser Gly Pro Ala Gly Glu Val Gly Lys 580 585 590 Pro Gly Glu Arg Gly Leu His Gly Glu Phe Gly Leu Pro Gly Pro Ala 595 600 605 Gly Pro Arg Gly Glu Arg Gly Pro Pro Gly Glu Ser Gly Ala Ala Gly 610 615 620 Pro Thr Gly Pro Ile Gly Ser Arg Gly Pro Ser Gly Pro Pro Gly Pro 625 630 635 640 Asp Gly Asn Lys Gly Glu Pro Gly Val Val Gly Ala Val Gly Thr Ala 645 650 655 Gly Pro Ser Gly Pro Ser Gly Leu Pro Gly Glu Arg Gly Ala Ala Gly 660 665 670 Ile Pro Gly Gly Lys Gly Glu Lys Gly Glu Pro Gly Leu Arg Gly Glu 675 680 685 Ile Gly Asn Pro Gly Arg Asp Gly Ala Arg Gly Ala His Gly Ala Val 690 695 700 Gly Ala Pro Gly Pro Ala Gly Ala Thr Gly Asp Arg Gly Glu Ala Gly 705 710 715 720 Ala Ala Gly Pro Ala Gly Pro Ala Gly Pro Arg Gly Ser Pro Gly Glu 725 730 735 Arg Gly Glu Val Gly Pro Ala Gly Pro Asn Gly Phe Ala Gly Pro Ala 740 745 750 Gly Ala Ala Gly Gln Pro Gly Ala Lys Gly Glu Arg Gly Gly Lys Gly 755 760 765 Pro Lys Gly Glu Asn Gly Val Val Gly Pro Thr Gly Pro Val Gly Ala 770 775 780 Ala Gly Pro Ala Gly Pro Asn Gly Pro Pro Gly Pro Ala Gly Ser Arg 785 790 795 800 Gly Asp Gly Gly Pro Pro Gly Met Thr Gly Phe Pro Gly Ala Ala Gly 805 810 815 Arg Thr Gly Pro Pro Gly Pro Ser Gly Ile Ser Gly Pro Pro Gly Pro 820 825 830 Pro Gly Pro Ala Gly Lys Glu Gly Leu Arg Gly Pro Arg Gly Asp Gln 835 840 845 Gly Pro Val Gly Arg Thr Gly Glu Val Gly Ala Val Gly Pro Pro Gly 850 855 860 Phe Ala Gly Glu Lys Gly Pro Ser Gly Glu Ala Gly Thr Ala Gly Pro 865 870 875 880 Pro Gly Thr Pro Gly Pro Gln Gly Leu Leu Gly Ala Pro Gly Ile Leu 885 890 895 Gly Leu Pro Gly Ser Arg Gly Glu Arg Gly Leu Pro Gly Val Ala Gly 900 905 910 Ala Val Gly Glu Pro Gly Pro Leu Gly Ile Ala Gly Pro Pro Gly Ala 915 920 925 Arg Gly Pro Pro Gly Ala Val Gly Ser Pro Gly Val Asn Gly Ala Pro 930 935 940 Gly Glu Ala Gly Arg Asp Gly Asn Pro Gly Asn Asp Gly Pro Pro Gly 945 950 955 960 Arg Asp Gly Gln Pro Gly His Lys Gly Glu Arg Gly Tyr Pro Gly Asn 965 970 975 Ile Gly Pro Val Gly Ala Ala Gly Ala Pro Gly Pro His Gly Pro Val 980 985 990 Gly Pro Ala Gly Lys His Gly Asn Arg Gly Glu Thr Gly Pro Ser Gly 995 1000 1005 Pro Val Gly Pro Ala Gly Ala Val Gly Pro Arg Gly Pro Ser Gly 1010 1015 1020 Pro Gln Gly Ile Arg Gly Asp Lys Gly Glu Pro Gly Glu Lys Gly 1025 1030 1035 Pro Arg Gly Leu Pro Gly Phe Lys Gly His Asn Gly Leu Gln Gly 1040 1045 1050 Leu Pro Gly Ile Ala Gly His His Gly Asp Gln Gly Ala Pro Gly 1055 1060 1065 Ser Val Gly Pro Ala Gly Pro Arg Gly Pro Ala Gly Pro Ser Gly 1070 1075 1080 Pro Ala Gly Lys Asp Gly Arg Thr Gly His Pro Gly Thr Val Gly 1085 1090 1095 Pro Ala Gly Ile Arg Gly Pro Gln Gly His Gln Gly Pro Ala Gly 1100 1105 1110 Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Val Ser Gly 1115 1120 1125 Gly Gly Tyr Asp Phe Gly Tyr Asp Gly Asp Phe Tyr Arg Ala Asp 1130 1135 1140 Gln Pro Arg Ser Ala Pro Ser Leu Arg Pro Lys Asp Tyr Glu Val 1145 1150 1155 Asp Ala Thr Leu Lys Ser Leu Asn Asn Gln Ile Glu Thr Leu Leu 1160 1165 1170 Thr Pro Glu Gly Ser Arg Lys Asn Pro Ala Arg Thr Cys Arg Asp 1175 1180 1185 Leu Arg Leu Ser His Pro Glu Trp Ser Ser Gly Tyr Tyr Trp Ile 1190 1195 1200 Asp Pro Asn Gln Gly Cys Thr Met Glu Ala Ile Lys Val Tyr Cys 1205 1210 1215 Asp Phe Pro Thr Gly Glu Thr Cys Ile Arg Ala Gln Pro Glu Asn 1220 1225 1230 Ile Pro Ala Lys Asn Trp Tyr Arg Ser Ser Lys Asp Lys Lys His 1235 1240 1245 Val Trp Leu Gly Glu Thr Ile Asn Ala Gly Ser Gln Phe Glu Tyr 1250 1255 1260 Asn Val Glu Gly Val Thr Ser Lys Glu Met Ala Thr Gln Leu Ala 1265 1270 1275 Phe Met Arg Leu Leu Ala Asn Tyr Ala Ser Gln Asn Ile Thr Tyr 1280 1285 1290 His Cys Lys Asn Ser Ile Ala Tyr Met Asp Glu Glu Thr Gly Asn 1295 1300 1305 Leu Lys Lys Ala Val Ile Leu Gln Gly Ser Asn Asp Val Glu Leu 1310 1315 1320 Val Ala Glu Gly Asn Ser Arg Phe Thr Tyr Thr Val Leu Val Asp 1325 1330 1335 Gly Cys Ser Lys Lys Thr Asn Glu Trp Gly Lys Thr Ile Ile Glu 1340 1345 1350 Tyr Lys Thr Asn Lys Pro Ser Arg Leu Pro Phe Leu Asp Ile Ala 1355 1360 1365 Pro Leu Asp Ile Gly Gly Ala Asp His Glu Phe Phe Val Asp Ile 1370 1375 1380 Gly Pro Val Cys Phe Lys 1385 <210> 7 <211> 127 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence containing the coding region of the appoplast signal of Arabidopsis thaliana endo-1,4-beta-glucanase and flanking regions <400> 7 gccatggcta ggaagtcttt gattttccca gtgattcttc ttgctgtgct tcttttctct 60 ccacctattt actctgctgg acacgattat agggatgctc ttaggaagtc atctatggct 120 caattgc 127 <210> 8 <211> 127 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence of the appoplast signal of Arabidopsis thaliana endo-1,4-beta-glucanase and flanking regions <220> <221> CDS <222> (10)..(120) <400> 8 gccatggct agg aag tct ttg att ttc cca gtg att ctt ctt gct gtg ctt 51 Arg Lys Ser Leu Ile Phe Pro Val Ile Leu Leu Ala Val Leu 1 5 10 ctt ttc tct cca cct att tac tct gct gga cac gat tat agg gat gct 99 Leu Phe Ser Pro Pro Ile Tyr Ser Ala Gly His Asp Tyr Arg Asp Ala 15 20 25 30 ctt agg aag tca tct atg gct caattgc 127 Leu Arg Lys Ser Ser Met Ala 35 <210> 9 <211> 37 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence of the appoplast signal of Arabidopsis thaliana endo-1,4-beta-glucanase and flanking regions <400> 9 Arg Lys Ser Leu Ile Phe Pro Val Ile Leu Leu Ala Val Leu Leu Phe 1 5 10 15 Ser Pro Pro Ile Tyr Ser Ala Gly His Asp Tyr Arg Asp Ala Leu Arg 20 25 30 Lys Ser Ser Met Ala 35 <210> 10 <211> 1037 <212> DNA <213> Artificial sequence <220> <223> Chrysanthemum rbcS1 promoter and 5' UTR <400> 10 aaatggcgcg ccaagcttag acaaacaccc cttgttatac aaagaatttc gctttacaaa 60 atcaaattcg agaaaataat atatgcacta aataagatca ttcggatcca atctaaccaa 120 ttacgatacg ctttgggtac acttgatttt tgtttcagta gttacatata tcttgtttta 180 tatgctatct ttaaggatct tcactcaaag actatttgtt gatgttcttg atggggctcg 240 gaagatttga tatgatacac tctaatcttt aggagatacc agccaggatt atattcagta 300 agacaatcaa attttacgtg ttcaaactcg ttatcttttc atttaatgga tgagccagaa 360 tctctataga atgattgcaa tcgagaatat gttcggccga tatccctttg ttggcttcaa 420 tattctacat atcacacaag aatcgaccgt attgtaccct ctttccataa aggaacacac 480 agtatgcaga tgcttttttc ccacatgcag taacataggt attcaaaaat ggctaaaaga 540 agttggataa caaattgaca actatttcca tttctgttat ataaatttca caacacacaa 600 aagcccgtaa tcaagagtct gcccatgtac gaaataactt ctattatttg gtattgggcc 660 taagcccagc tcagagtacg tgggggtacc acatatagga aggtaacaaa atactgcaag 720 atagccccat aacgtaccag cctctcctta ccacgaagag ataagatata agacccaccc 780 tgccacgtgt cacatcgtca tggtggttaa tgataaggga ttacatcctt ctatgtttgt 840 ggacatgatg catgtaatgt catgagccac atgatccaat ggccacagga acgtaagaat 900 gtagatagat ttgattttgt ccgttagata gcaaacaaca ttataaaagg tgtgtatcaa 960 tacgaactaa ttcactcatt ggattcatag aagtccattc ctcctaagta tctaaacata 1020 tgcaattgtc gactaaa 1037 <210> 11 <211> 975 <212> DNA <213> Artificial sequence <220> <223> Chrysanthemum rbcS1 3'UTR and terminator <400> 11 aaaaggatcc gcggccgcat aagttttact atttaccaag acttttgaat attaaccttc 60 ttgtaacgag tcggttaaat ttgattgttt agggttttgt attatttttt tttggtcttt 120 taattcatca ctttaattcc ctaattgtct gttcatttcg ttgtttgttt ccggatcgat 180 aatgaaatgt aagagatatc atatataaat aataaattgt cgtttcatat ttgcaatctt 240 tttttacaaa cctttaatta attgtatgta tgacattttc ttcttgttat attaggggga 300 aataatgtta aataaaagta caaaataaac tacagtacat cgtactgaat aaattaccta 360 gccaaaaagt acacctttcc atatacttcc tacatgaagg cattttcaac attttcaaat 420 aaggaatgct acaaccgcat aataacatcc acaaattttt ttataaaata acatgtcaga 480 cagtgattga aagattttat tatagtttcg ttatcttctt ttctcattaa gcgaatcact 540 acctaacacg tcattttgtg aaatattttt tgaatgtttt tatatagttg tagcattcct 600 cttttcaaat tagggtttgt ttgagatagc atttcagccg gttcatacaa cttaaaagca 660 tactctaatg ctggaaaaaa gactaaaaaa tcttgtaagt tagcgcagaa tattgaccca 720 aattatatac acacatgacc ccatatagag actaattaca cttttaacca ctaataatta 780 ttactgtatt ataacatcta ctaattaaac ttgtgagttt ttgctagaat tattatcata 840 tatactaaaa ggcaggaacg caaacattgc cccggtactg tagcaactac ggtagacgca 900 ttaattgtct atagtggacg cattaattaa ccaaaaccgc ctctttcccc ttcttcttga 960 agcttgagct ctttt 975 <210> 12 <211> 1633 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence containing the coding regions of the vascular signal sequence of barley gene for Thiol protease aleurain precursor fused to the human Prolyl 4-hydroxylase beta subunit and flanking regions <400> 12 ctcgagtaaa ccatggctca tgctagggtt ttgcttttgg ctcttgctgt tcttgctact 60 gctgctgttg ctgtggcttc ttcttcatct ttcgctgatt ctaacccaat taggccagtg 120 actgatagag ctgcttctac tcttgctcaa ttggtcgaca tggatgctcc agaagaggag 180 gatcacgttc ttgtgcttag gaagtctaac ttcgctgaag ctcttgctgc tcacaagtac 240 cttcttgtgg agttttatgc tccttggtgc ggacattgca aagctcttgc tccagagtat 300 gctaaggctg ctggaaagtt gaaggctgag ggatctgaaa ttaggcttgc taaagtggat 360 gctactgagg agtctgatct tgctcaacag tacggagtta ggggataccc aactattaag 420 ttcttcagga acggagatac tgcttctcca aaggagtata ctgctggaag ggaggctgat 480 gatattgtga actggcttaa gaagagaact ggaccagctg ctactactct tccagatgga 540 gctgctgctg aatctcttgt ggagtcatct gaggtggcag tgattggatt cttcaaggat 600 gtggagtctg attctgctaa gcagttcctt caagctgctg aggctattga tgatattcca 660 ttcggaatta cttctaactc tgatgtgttc tctaagtacc agcttgataa ggatggagtg 720 gtgcttttca agaaattcga tgagggaagg aacaatttcg agggagaggt gacaaaggag 780 aaccttcttg atttcattaa gcacaaccag cttccacttg tgattgagtt cactgagcag 840 actgctccaa agattttcgg aggagagatt aagactcaca ttcttctttt ccttccaaag 900 tctgtgtctg attacgatgg aaagttgtct aacttcaaga ctgctgctga gtctttcaag 960 ggaaagattc ttttcatttt cattgattct gatcacactg ataaccagag gattcttgag 1020 ttcttcggac ttaagaagga agagtgccca gctgttaggc ttattactct tgaggaggag 1080 atgactaagt acaagccaga gtctgaagaa cttactgctg agaggattac tgagttctgc 1140 cacagattcc ttgagggaaa gattaagcca caccttatgt ctcaagagct tccagaggat 1200 tgggataagc agccagttaa ggtgttggtg ggtaaaaact tcgaggatgt ggctttcgat 1260 gagaagaaga acgtgttcgt ggagttctac gcaccttggt gtggtcactg taagcagctt 1320 gctccaattt gggataagtt gggagagact tacaaggatc acgagaacat tgtgattgct 1380 aagatggatt ctactgctaa cgaggtggag gctgttaagg ttcactcttt cccaactttg 1440 aagttcttcc cagcttctgc tgataggact gtgattgatt acaacggaga aaggactctt 1500 gatggattca agaagttcct tgagtctgga ggacaagatg gagctggaga tgatgatgat 1560 cttgaggatt tggaagaagc tgaggagcca gatatggagg aggatgatga tcagaaggct 1620 gtgtgatgag ctc 1633 <210> 13 <211> 537 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence containing the vascular signal sequence of barley gene for Thiol protease aleurain precursor fused to the human Prolyl 4-hydroxylase beta subunit and flanking regions <400> 13 Met Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr 1 5 10 15 Ala Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro 20 25 30 Ile Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala Gln Leu Val 35 40 45 Asp Met Asp Ala Pro Glu Glu Glu Asp His Val Leu Val Leu Arg Lys 50 55 60 Ser Asn Phe Ala Glu Ala Leu Ala Ala His Lys Tyr Leu Leu Val Glu 65 70 75 80 Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Ala Leu Ala Pro Glu Tyr 85 90 95 Ala Lys Ala Ala Gly Lys Leu Lys Ala Glu Gly Ser Glu Ile Arg Leu 100 105 110 Ala Lys Val Asp Ala Thr Glu Glu Ser Asp Leu Ala Gln Gln Tyr Gly 115 120 125 Val Arg Gly Tyr Pro Thr Ile Lys Phe Phe Arg Asn Gly Asp Thr Ala 130 135 140 Ser Pro Lys Glu Tyr Thr Ala Gly Arg Glu Ala Asp Asp Ile Val Asn 145 150 155 160 Trp Leu Lys Lys Arg Thr Gly Pro Ala Ala Thr Thr Leu Pro Asp Gly 165 170 175 Ala Ala Ala Glu Ser Leu Val Glu Ser Ser Glu Val Ala Val Ile Gly 180 185 190 Phe Phe Lys Asp Val Glu Ser Asp Ser Ala Lys Gln Phe Leu Gln Ala 195 200 205 Ala Glu Ala Ile Asp Asp Ile Pro Phe Gly Ile Thr Ser Asn Ser Asp 210 215 220 Val Phe Ser Lys Tyr Gln Leu Asp Lys Asp Gly Val Val Leu Phe Lys 225 230 235 240 Lys Phe Asp Glu Gly Arg Asn Asn Phe Glu Gly Glu Val Thr Lys Glu 245 250 255 Asn Leu Leu Asp Phe Ile Lys His Asn Gln Leu Pro Leu Val Ile Glu 260 265 270 Phe Thr Glu Gln Thr Ala Pro Lys Ile Phe Gly Gly Glu Ile Lys Thr 275 280 285 His Ile Leu Leu Phe Leu Pro Lys Ser Val Ser Asp Tyr Asp Gly Lys 290 295 300 Leu Ser Asn Phe Lys Thr Ala Ala Glu Ser Phe Lys Gly Lys Ile Leu 305 310 315 320 Phe Ile Phe Ile Asp Ser Asp His Thr Asp Asn Gln Arg Ile Leu Glu 325 330 335 Phe Phe Gly Leu Lys Lys Glu Glu Cys Pro Ala Val Arg Leu Ile Thr 340 345 350 Leu Glu Glu Glu Met Thr Lys Tyr Lys Pro Glu Ser Glu Glu Leu Thr 355 360 365 Ala Glu Arg Ile Thr Glu Phe Cys His Arg Phe Leu Glu Gly Lys Ile 370 375 380 Lys Pro His Leu Met Ser Gln Glu Leu Pro Glu Asp Trp Asp Lys Gln 385 390 395 400 Pro Val Lys Val Leu Val Gly Lys Asn Phe Glu Asp Val Ala Phe Asp 405 410 415 Glu Lys Lys Asn Val Phe Val Glu Phe Tyr Ala Pro Trp Cys Gly His 420 425 430 Cys Lys Gln Leu Ala Pro Ile Trp Asp Lys Leu Gly Glu Thr Tyr Lys 435 440 445 Asp His Glu Asn Ile Val Ile Ala Lys Met Asp Ser Thr Ala Asn Glu 450 455 460 Val Glu Ala Val Lys Val His Ser Phe Pro Thr Leu Lys Phe Phe Pro 465 470 475 480 Ala Ser Ala Asp Arg Thr Val Ile Asp Tyr Asn Gly Glu Arg Thr Leu 485 490 495 Asp Gly Phe Lys Lys Phe Leu Glu Ser Gly Gly Gln Asp Gly Ala Gly 500 505 510 Asp Asp Asp Asp Leu Glu Asp Leu Glu Glu Ala Glu Glu Pro Asp Met 515 520 525 Glu Glu Asp Asp Asp Gln Lys Ala Val 530 535 <210> 14 <211> 1723 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence containing the coding regions of the vascular signal sequence of barley gene for Thiol protease aleurain precursor fused to the human Prolyl 4-hydroxylase alpha-1 subunit and flanking regions <400> 14 ctcgagtaaa ccatggctca tgctagggtt ttgcttttgg ctcttgctgt tcttgctact 60 gctgctgttg ctgtggcttc ttcttcatct ttcgctgatt ctaacccaat taggccagtg 120 actgatagag ctgcttctac tcttgctcaa ttggtcgaca tgcacccagg attcttcact 180 tctattggac agatgactga tcttattcac actgagaagg atcttgtgac ttctcttaag 240 gattacatta aggctgagga ggataagttg gagcagatta agaagtgggc tgagaagttg 300 gataggctta cttctactgc tacaaaagat ccagagggat tcgttggtca tccagtgaac 360 gctttcaagt tgatgaagag gcttaacact gagtggagtg agcttgagaa ccttgtgctt 420 aaggatatgt ctgatggatt catttctaac cttactattc agaggcagta cttcccaaat 480 gatgaggatc aagtgggagc tgctaaggct cttcttaggc ttcaggatac ttacaacctt 540 gatactgata caatttctaa gggaaacctt ccaggagtta agcacaagtc tttccttact 600 gctgaggatt gcttcgagct tggaaaggtt gcatacactg aggctgatta ctaccacact 660 gagctttgga tggaacaagc tcttaggcaa cttgatgagg gagagatttc tactattgat 720 aaggtgtcag tgcttgatta cctttcttac gctgtgtacc agcagggtga tcttgataag 780 gctcttttgc ttactaagaa gttgcttgag cttgatccag aacatcagag ggctaacgga 840 aaccttaagt acttcgagta cattatggct aaggaaaagg atgtgaacaa gtctgcttct 900 gatgatcagt ctgatcaaaa gactactcca aagaagaagg gagtggctgt tgattatctt 960 cctgagaggc agaagtatga gatgttgtgt aggggagagg gtattaagat gactccaagg 1020 aggcagaaga agttgttctg caggtatcac gatggaaaca ggaacccaaa gttcattctt 1080 gctccagcta agcaagaaga tgagtgggat aagccaagga ttattaggtt ccacgatatt 1140 atttctgatg ctgagattga gattgtgaag gatcttgcta agccaagact taggagggct 1200 actatttcta accctattac tggtgatctt gagactgtgc actacaggat ttctaagtct 1260 gcttggcttt ctggatacga gaacccagtg gtgtctagga ttaacatgag gattcaggat 1320 cttactggac ttgatgtgtc tactgctgag gagcttcaag ttgctaacta cggagttgga 1380 ggacaatatg agccacactt cgatttcgct aggaaggatg agccagatgc ttttaaggag 1440 cttggaactg gaaacaggat tgctacttgg cttttctaca tgtctgatgt ttctgctgga 1500 ggagctactg ttttcccaga agtgggagct tctgtttggc caaagaaggg aactgctgtg 1560 ttctggtaca accttttcgc ttctggagag ggagattact ctactaggca tgctgcttgc 1620 ccagttcttg ttggaaacaa gtgggtgtca aacaagtggc ttcatgagag gggacaagag 1680 tttagaaggc catgcactct ttctgagctt gagtgatgag ctc 1723 <210> 15 <211> 567 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence containing the vascular signal sequence of barley gene for Thiol protease aleurain precursor fused to the human Prolyl 4-hydroxylase alpha-1 subunit and flanking regions <400> 15 Met Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr 1 5 10 15 Ala Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro 20 25 30 Ile Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala Gln Leu Val 35 40 45 Asp Met His Pro Gly Phe Phe Thr Ser Ile Gly Gln Met Thr Asp Leu 50 55 60 Ile His Thr Glu Lys Asp Leu Val Thr Ser Leu Lys Asp Tyr Ile Lys 65 70 75 80 Ala Glu Glu Asp Lys Leu Glu Gln Ile Lys Lys Trp Ala Glu Lys Leu 85 90 95 Asp Arg Leu Thr Ser Thr Ala Thr Lys Asp Pro Glu Gly Phe Val Gly 100 105 110 His Pro Val Asn Ala Phe Lys Leu Met Lys Arg Leu Asn Thr Glu Trp 115 120 125 Ser Glu Leu Glu Asn Leu Val Leu Lys Asp Met Ser Asp Gly Phe Ile 130 135 140 Ser Asn Leu Thr Ile Gln Arg Gln Tyr Phe Pro Asn Asp Glu Asp Gln 145 150 155 160 Val Gly Ala Ala Lys Ala Leu Leu Arg Leu Gln Asp Thr Tyr Asn Leu 165 170 175 Asp Thr Asp Thr Ile Ser Lys Gly Asn Leu Pro Gly Val Lys His Lys 180 185 190 Ser Phe Leu Thr Ala Glu Asp Cys Phe Glu Leu Gly Lys Val Ala Tyr 195 200 205 Thr Glu Ala Asp Tyr Tyr His Thr Glu Leu Trp Met Glu Gln Ala Leu 210 215 220 Arg Gln Leu Asp Glu Gly Glu Ile Ser Thr Ile Asp Lys Val Ser Val 225 230 235 240 Leu Asp Tyr Leu Ser Tyr Ala Val Tyr Gln Gln Gly Asp Leu Asp Lys 245 250 255 Ala Leu Leu Leu Thr Lys Lys Leu Leu Glu Leu Asp Pro Glu His Gln 260 265 270 Arg Ala Asn Gly Asn Leu Lys Tyr Phe Glu Tyr Ile Met Ala Lys Glu 275 280 285 Lys Asp Val Asn Lys Ser Ala Ser Asp Asp Gln Ser Asp Gln Lys Thr 290 295 300 Thr Pro Lys Lys Lys Gly Val Ala Val Asp Tyr Leu Pro Glu Arg Gln 305 310 315 320 Lys Tyr Glu Met Leu Cys Arg Gly Glu Gly Ile Lys Met Thr Pro Arg 325 330 335 Arg Gln Lys Lys Leu Phe Cys Arg Tyr His Asp Gly Asn Arg Asn Pro 340 345 350 Lys Phe Ile Leu Ala Pro Ala Lys Gln Glu Asp Glu Trp Asp Lys Pro 355 360 365 Arg Ile Ile Arg Phe His Asp Ile Ile Ser Asp Ala Glu Ile Glu Ile 370 375 380 Val Lys Asp Leu Ala Lys Pro Arg Leu Arg Arg Ala Thr Ile Ser Asn 385 390 395 400 Pro Ile Thr Gly Asp Leu Glu Thr Val His Tyr Arg Ile Ser Lys Ser 405 410 415 Ala Trp Leu Ser Gly Tyr Glu Asn Pro Val Val Ser Arg Ile Asn Met 420 425 430 Arg Ile Gln Asp Leu Thr Gly Leu Asp Val Ser Thr Ala Glu Glu Leu 435 440 445 Gln Val Ala Asn Tyr Gly Val Gly Gly Gln Tyr Glu Pro His Phe Asp 450 455 460 Phe Ala Arg Lys Asp Glu Pro Asp Ala Phe Lys Glu Leu Gly Thr Gly 465 470 475 480 Asn Arg Ile Ala Thr Trp Leu Phe Tyr Met Ser Asp Val Ser Ala Gly 485 490 495 Gly Ala Thr Val Phe Pro Glu Val Gly Ala Ser Val Trp Pro Lys Lys 500 505 510 Gly Thr Ala Val Phe Trp Tyr Asn Leu Phe Ala Ser Gly Glu Gly Asp 515 520 525 Tyr Ser Thr Arg His Ala Ala Cys Pro Val Leu Val Gly Asn Lys Trp 530 535 540 Val Ser Asn Lys Trp Leu His Glu Arg Gly Gln Glu Phe Arg Arg Pro 545 550 555 560 Cys Thr Leu Ser Glu Leu Glu 565 <210> 16 <211> 928 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence containing the coding regions of the vascular signal sequence of barley gene for Thiol protease aleurain precursor fused to the plant Prolyl 4-hydroxylase Plant and flanking regions <400> 16 ctcgagtaaa ccatggctca tgctagggtt ttgcttttgg ctcttgctgt tcttgctact 60 gctgctgttg ctgtggcttc ttcttcatct ttcgctgatt ctaacccaat taggccagtg 120 actgatagag ctgcttctac tcttgctcaa ttggtcgaca tgcttggtat tctttctctt 180 ccaaacgcta acaggaactc ttctaagact aacgatctta ctaacattgt gaggaagtct 240 gagacttctt ctggagatga ggagggaaat ggagaaagat gggtggaagt gatttcttgg 300 gagccaaggg ctgttgttta ccacaacttc cttactaatg aggagtgcga gcaccttatt 360 tctcttgcta agccatctat ggtgaagtct actgtggtgg atgagaaaac tggaggatct 420 aaggattcaa gagtgaggac ttcatctggt actttcctta ggaggggaca tgatgaagtt 480 gtggaagtta ttgagaagag gatttctgat ttcactttca ttccagtgga gaacggagaa 540 ggacttcaag ttcttcacta ccaagtggga caaaagtacg agccacacta cgattacttc 600 cttgatgagt tcaacactaa gaacggagga cagaggattg ctactgtgct tatgtacctt 660 tctgatgtgg atgatggagg agagactgtt tttccagctg ctaggggaaa catttctgct 720 gttccttggt ggaacgagct ttctaagtgt ggaaaggagg gactttctgt gcttccaaag 780 aaaagggatg ctcttctttt ctggaacatg aggccagatg cttctcttga tccatcttct 840 cttcatggag gatgcccagt tgttaaggga aacaagtggt catctactaa gtggttccac 900 gtgcacgagt tcaaggtgta atgagctc 928 <210> 17 <211> 302 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence containing the vascular signal sequence of barley gene for Thiol protease aleurain precursor fused to the plant Prolyl 4-hydroxylase Plant and flanking regions <400> 17 Met Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr 1 5 10 15 Ala Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro 20 25 30 Ile Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala Gln Leu Val 35 40 45 Asp Met Leu Gly Ile Leu Ser Leu Pro Asn Ala Asn Arg Asn Ser Ser 50 55 60 Lys Thr Asn Asp Leu Thr Asn Ile Val Arg Lys Ser Glu Thr Ser Ser 65 70 75 80 Gly Asp Glu Glu Gly Asn Gly Glu Arg Trp Val Glu Val Ile Ser Trp 85 90 95 Glu Pro Arg Ala Val Val Tyr His Asn Phe Leu Thr Asn Glu Glu Cys 100 105 110 Glu His Leu Ile Ser Leu Ala Lys Pro Ser Met Val Lys Ser Thr Val 115 120 125 Val Asp Glu Lys Thr Gly Gly Ser Lys Asp Ser Arg Val Arg Thr Ser 130 135 140 Ser Gly Thr Phe Leu Arg Arg Gly His Asp Glu Val Val Glu Val Ile 145 150 155 160 Glu Lys Arg Ile Ser Asp Phe Thr Phe Ile Pro Val Glu Asn Gly Glu 165 170 175 Gly Leu Gln Val Leu His Tyr Gln Val Gly Gln Lys Tyr Glu Pro His 180 185 190 Tyr Asp Tyr Phe Leu Asp Glu Phe Asn Thr Lys Asn Gly Gly Gln Arg 195 200 205 Ile Ala Thr Val Leu Met Tyr Leu Ser Asp Val Asp Asp Gly Gly Glu 210 215 220 Thr Val Phe Pro Ala Ala Arg Gly Asn Ile Ser Ala Val Pro Trp Trp 225 230 235 240 Asn Glu Leu Ser Lys Cys Gly Lys Glu Gly Leu Ser Val Leu Pro Lys 245 250 255 Lys Arg Asp Ala Leu Leu Phe Trp Asn Met Arg Pro Asp Ala Ser Leu 260 265 270 Asp Pro Ser Ser Leu His Gly Gly Cys Pro Val Val Lys Gly Asn Lys 275 280 285 Trp Ser Ser Thr Lys Trp Phe His Val His Glu Phe Lys Val 290 295 300 <210> 18 <211> 2689 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence containing the coding regions of the human Procollagen C-proteinase and flanking regions <400> 18 agatctatcg atgcatgcca tggtaccgcg ccatggctca attggctgca acatcaaggc 60 ctgaaagagt ttggccagat ggtgttattc ctttcgttat tggtggaaac tttactggat 120 ctcagagagc agtttttaga caagctatga gacattggga aaagcacact tgtgtgacat 180 tccttgaaag gactgatgaa gattcttata ttgtgttcac ataccgtcca tgtggatgct 240 gctcatatgt tggtagaagg ggaggaggtc cacaagcaat ttctattgga aaaaactgcg 300 ataagttcgg aattgtggtg catgaattgg gacatgttgt tggtttctgg cacgaacaca 360 caaggccaga tagggatagg cacgtgtcta ttgtgaggga aaacattcag ccaggtcaag 420 agtacaattt tcttaagatg gaacctcaag aggtggaatc tctcggagag acttacgact 480 tcgactccat catgcactac gcaaggaata ctttcagcag gggcatcttc ttggatacca 540 ttgtgcctaa gtacgaggtg aacggcgtta agccacctat tggtcaaagg actaggctct 600 ctaagggtga tattgcacag gctaggaagc tctacaaatg tccagcatgc ggagaaactc 660 ttcaggattc cactggcaac ttctcatctc cagagtaccc aaacggatac tctgctcata 720 tgcactgtgt ttggaggatc tcagtgactc ctggagagaa gatcatcctc aacttcactt 780 ccctcgatct ctatcgttct aggctctgtt ggtacgacta tgtggaagtg agagatggct 840 tctggagaaa ggctccactt agaggaaggt tctgcggatc taaacttcct gagccaatcg 900 tgtctactga ttccagattg tgggtggagt tcaggtcctc ttctaattgg gttggcaagg 960 gcttttttgc tgtgtacgag gctatttgtg gcggcgacgt gaaaaaggac tacggacata 1020 ttcaaagtcc aaattaccca gatgattacc gtccttcaaa agtgtgtatt tggaggattc 1080 aagtgagtga gggtttccat gttggattga cattccaatc tttcgaaatt gagagacacg 1140 attcatgcgc atacgattat ttggaagtga gagatggaca ctctgaatct tctacactta 1200 ttggaaggta ctgcggttat gagaaacctg atgatattaa gtctacttct agtaggttgt 1260 ggcttaaatt tgtgtcagat ggttctatta acaaggctgg tttcgcagtg aacttcttca 1320 aggaagtgga tgaatgctca agacctaaca gaggaggatg tgagcaaaga tgccttaaca 1380 ctttgggaag ttacaagtgt tcttgcgatc ctggatacga gttggctcct gataagagaa 1440 gatgcgaagc tgcttgcggt ggttttttga caaaattgaa cggatctatt acttctcctg 1500 gatggccaaa agagtaccca cctaataaga attgcatttg gcagcttgtt gcacctactc 1560 agtaccgtat ttcattgcaa ttcgattttt tcgagactga gggtaatgat gtgtgcaagt 1620 acgatttcgt ggaagtgaga tcaggtctta ctgctgatag taaattgcac ggaaagttct 1680 gcggatctga aaaaccagaa gtgattacat cacagtacaa caatatgagg gtggagttca 1740 aatctgataa tactgtttct aaaaaaggtt ttaaggcaca tttcttttct gataaggacg 1800 agtgctctaa agataatggt ggttgccagc aggattgcgt gaacacattc ggttcatatg 1860 agtgccaatg ccgtagtgga tttgttcttc acgataacaa acatgattgc aaagaggcag 1920 gttgcgatca caaggtgaca tctacttcag gtactatcac atctccaaac tggcctgata 1980 agtatccttc aaaaaaagaa tgtacatggg caatttcttc tacaccaggt catagggtta 2040 agttgacatt catggagatg gatattgaga gtcaaccaga gtgcgcttat gatcatcttg 2100 aggtgttcga tggaagggat gctaaggctc ctgttcttgg tagattctgt ggtagtaaaa 2160 agccagaacc agtgcttgca acaggatcta ggatgttcct tagattctac tctgataact 2220 cagttcagag gaaaggattc caagctagtc acgcaactga atgcggtgga caagttagag 2280 cagatgttaa gactaaggat ctttactcac acgcacagtt cggagataac aactaccctg 2340 gaggagttga ttgcgagtgg gttattgtgg ctgaagaggg atacggagtt gagcttgttt 2400 tccagacatt cgaggtggag gaggaaactg attgcggtta cgattatatg gaactttttg 2460 atggatacga tagtactgct ccaagacttg gaaggtattg tggtagtggt ccaccagaag 2520 aggtgtactc agctggagat agtgttcttg ttaagttcca cagtgatgat acaattacta 2580 agaagggatt ccatcttaga tatacttcaa ctaagtttca ggatactctt cattctagga 2640 agtaatgagc tcgcggccgc atccaagctt ctgcagacgc gtcgacgtc 2689 <210> 19 <211> 870 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence containing the human Procollagen C-proteinase and flanking regions <400> 19 Met Ala Gln Leu Ala Ala Thr Ser Arg Pro Glu Arg Val Trp Pro Asp 1 5 10 15 Gly Val Ile Pro Phe Val Ile Gly Gly Asn Phe Thr Gly Ser Gln Arg 20 25 30 Ala Val Phe Arg Gln Ala Met Arg His Trp Glu Lys His Thr Cys Val 35 40 45 Thr Phe Leu Glu Arg Thr Asp Glu Asp Ser Tyr Ile Val Phe Thr Tyr 50 55 60 Arg Pro Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Gly Gly Pro 65 70 75 80 Gln Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val Val 85 90 95 His Glu Leu Gly His Val Val Gly Phe Trp His Glu His Thr Arg Pro 100 105 110 Asp Arg Asp Arg His Val Ser Ile Val Arg Glu Asn Ile Gln Pro Gly 115 120 125 Gln Glu Tyr Asn Phe Leu Lys Met Glu Pro Gln Glu Val Glu Ser Leu 130 135 140 Gly Glu Thr Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn Thr 145 150 155 160 Phe Ser Arg Gly Ile Phe Leu Asp Thr Ile Val Pro Lys Tyr Glu Val 165 170 175 Asn Gly Val Lys Pro Pro Ile Gly Gln Arg Thr Arg Leu Ser Lys Gly 180 185 190 Asp Ile Ala Gln Ala Arg Lys Leu Tyr Lys Cys Pro Ala Cys Gly Glu 195 200 205 Thr Leu Gln Asp Ser Thr Gly Asn Phe Ser Ser Pro Glu Tyr Pro Asn 210 215 220 Gly Tyr Ser Ala His Met His Cys Val Trp Arg Ile Ser Val Thr Pro 225 230 235 240 Gly Glu Lys Ile Ile Leu Asn Phe Thr Ser Leu Asp Leu Tyr Arg Ser 245 250 255 Arg Leu Cys Trp Tyr Asp Tyr Val Glu Val Arg Asp Gly Phe Trp Arg 260 265 270 Lys Ala Pro Leu Arg Gly Arg Phe Cys Gly Ser Lys Leu Pro Glu Pro 275 280 285 Ile Val Ser Thr Asp Ser Arg Leu Trp Val Glu Phe Arg Ser Ser Ser 290 295 300 Asn Trp Val Gly Lys Gly Phe Phe Ala Val Tyr Glu Ala Ile Cys Gly 305 310 315 320 Gly Asp Val Lys Lys Asp Tyr Gly His Ile Gln Ser Pro Asn Tyr Pro 325 330 335 Asp Asp Tyr Arg Pro Ser Lys Val Cys Ile Trp Arg Ile Gln Val Ser 340 345 350 Glu Gly Phe His Val Gly Leu Thr Phe Gln Ser Phe Glu Ile Glu Arg 355 360 365 His Asp Ser Cys Ala Tyr Asp Tyr Leu Glu Val Arg Asp Gly His Ser 370 375 380 Glu Ser Ser Thr Leu Ile Gly Arg Tyr Cys Gly Tyr Glu Lys Pro Asp 385 390 395 400 Asp Ile Lys Ser Thr Ser Ser Arg Leu Trp Leu Lys Phe Val Ser Asp 405 410 415 Gly Ser Ile Asn Lys Ala Gly Phe Ala Val Asn Phe Phe Lys Glu Val 420 425 430 Asp Glu Cys Ser Arg Pro Asn Arg Gly Gly Cys Glu Gln Arg Cys Leu 435 440 445 Asn Thr Leu Gly Ser Tyr Lys Cys Ser Cys Asp Pro Gly Tyr Glu Leu 450 455 460 Ala Pro Asp Lys Arg Arg Cys Glu Ala Ala Cys Gly Gly Phe Leu Thr 465 470 475 480 Lys Leu Asn Gly Ser Ile Thr Ser Pro Gly Trp Pro Lys Glu Tyr Pro 485 490 495 Pro Asn Lys Asn Cys Ile Trp Gln Leu Val Ala Pro Thr Gln Tyr Arg 500 505 510 Ile Ser Leu Gln Phe Asp Phe Phe Glu Thr Glu Gly Asn Asp Val Cys 515 520 525 Lys Tyr Asp Phe Val Glu Val Arg Ser Gly Leu Thr Ala Asp Ser Lys 530 535 540 Leu His Gly Lys Phe Cys Gly Ser Glu Lys Pro Glu Val Ile Thr Ser 545 550 555 560 Gln Tyr Asn Asn Met Arg Val Glu Phe Lys Ser Asp Asn Thr Val Ser 565 570 575 Lys Lys Gly Phe Lys Ala His Phe Phe Ser Asp Lys Asp Glu Cys Ser 580 585 590 Lys Asp Asn Gly Gly Cys Gln Gln Asp Cys Val Asn Thr Phe Gly Ser 595 600 605 Tyr Glu Cys Gln Cys Arg Ser Gly Phe Val Leu His Asp Asn Lys His 610 615 620 Asp Cys Lys Glu Ala Gly Cys Asp His Lys Val Thr Ser Thr Ser Gly 625 630 635 640 Thr Ile Thr Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Lys Lys Glu 645 650 655 Cys Thr Trp Ala Ile Ser Ser Thr Pro Gly His Arg Val Lys Leu Thr 660 665 670 Phe Met Glu Met Asp Ile Glu Ser Gln Pro Glu Cys Ala Tyr Asp His 675 680 685 Leu Glu Val Phe Asp Gly Arg Asp Ala Lys Ala Pro Val Leu Gly Arg 690 695 700 Phe Cys Gly Ser Lys Lys Pro Glu Pro Val Leu Ala Thr Gly Ser Arg 705 710 715 720 Met Phe Leu Arg Phe Tyr Ser Asp Asn Ser Val Gln Arg Lys Gly Phe 725 730 735 Gln Ala Ser His Ala Thr Glu Cys Gly Gly Gln Val Arg Ala Asp Val 740 745 750 Lys Thr Lys Asp Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn Tyr 755 760 765 Pro Gly Gly Val Asp Cys Glu Trp Val Ile Val Ala Glu Glu Gly Tyr 770 775 780 Gly Val Glu Leu Val Phe Gln Thr Phe Glu Val Glu Glu Glu Thr Asp 785 790 795 800 Cys Gly Tyr Asp Tyr Met Glu Leu Phe Asp Gly Tyr Asp Ser Thr Ala 805 810 815 Pro Arg Leu Gly Arg Tyr Cys Gly Ser Gly Pro Pro Glu Glu Val Tyr 820 825 830 Ser Ala Gly Asp Ser Val Leu Val Lys Phe His Ser Asp Asp Thr Ile 835 840 845 Thr Lys Lys Gly Phe His Leu Arg Tyr Thr Ser Thr Lys Phe Gln Asp 850 855 860 Thr Leu His Ser Arg Lys 865 870 <210> 20 <211> 2912 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence containing the coding regions of the human Procollagen I N-proteinase and flanking regions <400> 20 gcgccatggc tcaattgagg agaagggcta ggagacacgc agctgatgat gattacaaca 60 ttgaagtttt gcttggtgtt gatgatagtg tggtgcaatt ccacggaaaa gagcatgttc 120 agaaatatct tttgacactt atgaatattg tgaacgaaat ctaccatgat gagtctttgg 180 gagcacacat taacgtggtt cttgtgagga ttattcttct ttcatacggt aaatctatgt 240 cacttattga gattggaaac ccttctcagt ctcttgagaa tgtgtgcaga tgggcatacc 300 ttcaacagaa gcctgatact ggacacgatg agtatcacga tcacgctatt ttccttacaa 360 ggcaggattt cggtccaagt ggaatgcaag gatatgctcc tgttactggt atgtgccacc 420 ctgttaggtc ttgtacactt aaccacgagg atggtttttc atctgctttc gtggtggctc 480 atgagacagg tcatgttttg ggaatggaac atgatggaca gggtaataga tgtggagatg 540 aagtgagact tggttcaatt atggctcctc ttgttcaagc tgcttttcat aggttccact 600 ggagtaggtg ttcacagcaa gagttgagta gataccttca ttcttacgat tgcttgcttg 660 atgatccatt tgctcatgat tggccagctt tgcctcaact tcctggattg cactactcta 720 tgaacgagca gtgcagattt gatttcggtc ttggttacat gatgtgcaca gctttcagga 780 ctttcgatcc atgcaaacag ttgtggtgtt cacacccaga taacccatat ttctgtaaaa 840 caaaaaaagg tccaccactt gatggtacta tgtgcgcacc tggaaagcac tgcttcaagg 900 gacactgcat ttggcttact cctgatattc ttaaaaggga tggatcatgg ggagcttggt 960 ctccattcgg aagttgctca agaacttgcg gaacaggtgt taagtttaga actaggcagt 1020 gcgataatcc acaccctgct aatggtggta gaacttgctc tggacttgct tacgattttc 1080 agttgtgttc taggcaagat tgccctgata gtcttgctga ttttagagaa gagcaatgta 1140 gacagtggga tctttacttt gagcacggcg acgctcagca ccactggctt ccacacgagc 1200 atagagatgc aaaagaaagg tgtcaccttt attgcgagag tagagagact ggagaggtgg 1260 tgtcaatgaa gagaatggtg cacgatggta caaggtgttc ttataaggat gcattctctt 1320 tgtgtgtgag gggagattgc aggaaagtgg gttgtgatgg agtgattgga tctagtaagc 1380 aagaagataa gtgcggagtg tgcggaggag ataactctca ttgcaaggtt gtgaaaggaa 1440 cttttacaag atcaccaaaa aaacacggtt acattaagat gttcgaaatt cctgctggag 1500 caaggcattt gcttattcag gaagtggatg caacatctca ccacttggca gtgaaaaacc 1560 ttgagactgg aaaattcatt ttgaacgagg agaacgatgt tgatgcatct agtaagactt 1620 tcattgcaat gggtgttgaa tgggagtata gggatgagga tggaagggaa acacttcaaa 1680 caatgggtcc tcttcatgga acaattactg tgttggtgat tccagtggga gatacaaggg 1740 tgtcattgac atacaagtat atgattcacg aggatagtct taacgttgat gataacaacg 1800 ttttggaaga agattctgtg gtttacgagt gggctcttaa gaaatggtca ccttgctcta 1860 agccatgtgg tggaggaagt cagttcacta agtatggttg taggaggagg cttgatcata 1920 agatggttca taggggattt tgcgcagcac ttagtaagcc aaaggcaatt aggagggctt 1980 gtaaccctca agaatgctca caaccagttt gggtgacagg agagtgggag ccatgttcac 2040 aaacatgcgg aagaactgga atgcaagtta gatcagttag atgcattcaa cctcttcatg 2100 ataacactac aagaagtgtg cacgcaaaac actgtaacga tgctaggcca gagagtagaa 2160 gagcttgctc tagggaactt tgccctggta gatggagggc aggaccttgg agtcagtgct 2220 ctgtgacatg tggaaacggt actcaggaaa gacctgttcc atgtagaact gctgatgata 2280 gtttcggaat ttgtcaggag gaaaggccag aaacagctag gacttgtaga cttggacctt 2340 gtcctaggaa tatttctgat cctagtaaaa aatcatacgt ggtgcaatgg ttgagtaggc 2400 cagatccaga ttcaccaatt aggaagattt cttcaaaagg acactgccag ggtgataaga 2460 gtattttctg cagaatggaa gttcttagta ggtactgttc tattccaggt tataacaaac 2520 tttcttgtaa gagttgcaac ttgtataaca atcttactaa cgtggagggt agaattgaac 2580 ctccaccagg aaagcacaac gatattgatg tgtttatgcc tactcttcct gtgccaacag 2640 ttgcaatgga agttagacct tctccatcta ctccacttga ggtgccactt aatgcatcaa 2700 gtactaacgc tactgaggat cacccagaga ctaacgcagt tgatgagcct tataagattc 2760 acggacttga ggatgaggtt cagccaccaa accttattcc taggaggcca agtccttacg 2820 aaaaaactag aaatcagagg attcaggagc ttattgatga gatgaggaaa aaggagatgc 2880 ttggaaagtt ctaatgagct cgcggccgca tc 2912 <210> 21 <211> 962 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence containing the human Procollagen I N-proteinase and flanking regions <400> 21 Met Ala Gln Leu Arg Arg Arg Ala Arg Arg His Ala Ala Asp Asp Asp 1 5 10 15 Tyr Asn Ile Glu Val Leu Leu Gly Val Asp Asp Ser Val Val Gln Phe 20 25 30 His Gly Lys Glu His Val Gln Lys Tyr Leu Leu Thr Leu Met Asn Ile 35 40 45 Val Asn Glu Ile Tyr His Asp Glu Ser Leu Gly Ala His Ile Asn Val 50 55 60 Val Leu Val Arg Ile Ile Leu Leu Ser Tyr Gly Lys Ser Met Ser Leu 65 70 75 80 Ile Glu Ile Gly Asn Pro Ser Gln Ser Leu Glu Asn Val Cys Arg Trp 85 90 95 Ala Tyr Leu Gln Gln Lys Pro Asp Thr Gly His Asp Glu Tyr His Asp 100 105 110 His Ala Ile Phe Leu Thr Arg Gln Asp Phe Gly Pro Ser Gly Met Gln 115 120 125 Gly Tyr Ala Pro Val Thr Gly Met Cys His Pro Val Arg Ser Cys Thr 130 135 140 Leu Asn His Glu Asp Gly Phe Ser Ser Ala Phe Val Val Ala His Glu 145 150 155 160 Thr Gly His Val Leu Gly Met Glu His Asp Gly Gln Gly Asn Arg Cys 165 170 175 Gly Asp Glu Val Arg Leu Gly Ser Ile Met Ala Pro Leu Val Gln Ala 180 185 190 Ala Phe His Arg Phe His Trp Ser Arg Cys Ser Gln Gln Glu Leu Ser 195 200 205 Arg Tyr Leu His Ser Tyr Asp Cys Leu Leu Asp Asp Pro Phe Ala His 210 215 220 Asp Trp Pro Ala Leu Pro Gln Leu Pro Gly Leu His Tyr Ser Met Asn 225 230 235 240 Glu Gln Cys Arg Phe Asp Phe Gly Leu Gly Tyr Met Met Cys Thr Ala 245 250 255 Phe Arg Thr Phe Asp Pro Cys Lys Gln Leu Trp Cys Ser His Pro Asp 260 265 270 Asn Pro Tyr Phe Cys Lys Thr Lys Lys Gly Pro Pro Leu Asp Gly Thr 275 280 285 Met Cys Ala Pro Gly Lys His Cys Phe Lys Gly His Cys Ile Trp Leu 290 295 300 Thr Pro Asp Ile Leu Lys Arg Asp Gly Ser Trp Gly Ala Trp Ser Pro 305 310 315 320 Phe Gly Ser Cys Ser Arg Thr Cys Gly Thr Gly Val Lys Phe Arg Thr 325 330 335 Arg Gln Cys Asp Asn Pro His Pro Ala Asn Gly Gly Arg Thr Cys Ser 340 345 350 Gly Leu Ala Tyr Asp Phe Gln Leu Cys Ser Arg Gln Asp Cys Pro Asp 355 360 365 Ser Leu Ala Asp Phe Arg Glu Glu Gln Cys Arg Gln Trp Asp Leu Tyr 370 375 380 Phe Glu His Gly Asp Ala Gln His His Trp Leu Pro His Glu His Arg 385 390 395 400 Asp Ala Lys Glu Arg Cys His Leu Tyr Cys Glu Ser Arg Glu Thr Gly 405 410 415 Glu Val Val Ser Met Lys Arg Met Val His Asp Gly Thr Arg Cys Ser 420 425 430 Tyr Lys Asp Ala Phe Ser Leu Cys Val Arg Gly Asp Cys Arg Lys Val 435 440 445 Gly Cys Asp Gly Val Ile Gly Ser Ser Lys Gln Glu Asp Lys Cys Gly 450 455 460 Val Cys Gly Gly Asp Asn Ser His Cys Lys Val Val Lys Gly Thr Phe 465 470 475 480 Thr Arg Ser Pro Lys Lys His Gly Tyr Ile Lys Met Phe Glu Ile Pro 485 490 495 Ala Gly Ala Arg His Leu Leu Ile Gln Glu Val Asp Ala Thr Ser His 500 505 510 His Leu Ala Val Lys Asn Leu Glu Thr Gly Lys Phe Ile Leu Asn Glu 515 520 525 Glu Asn Asp Val Asp Ala Ser Ser Lys Thr Phe Ile Ala Met Gly Val 530 535 540 Glu Trp Glu Tyr Arg Asp Glu Asp Gly Arg Glu Thr Leu Gln Thr Met 545 550 555 560 Gly Pro Leu His Gly Thr Ile Thr Val Leu Val Ile Pro Val Gly Asp 565 570 575 Thr Arg Val Ser Leu Thr Tyr Lys Tyr Met Ile His Glu Asp Ser Leu 580 585 590 Asn Val Asp Asp Asn Asn Val Leu Glu Glu Asp Ser Val Val Tyr Glu 595 600 605 Trp Ala Leu Lys Lys Trp Ser Pro Cys Ser Lys Pro Cys Gly Gly Gly 610 615 620 Ser Gln Phe Thr Lys Tyr Gly Cys Arg Arg Arg Leu Asp His Lys Met 625 630 635 640 Val His Arg Gly Phe Cys Ala Ala Leu Ser Lys Pro Lys Ala Ile Arg 645 650 655 Arg Ala Cys Asn Pro Gln Glu Cys Ser Gln Pro Val Trp Val Thr Gly 660 665 670 Glu Trp Glu Pro Cys Ser Gln Thr Cys Gly Arg Thr Gly Met Gln Val 675 680 685 Arg Ser Val Arg Cys Ile Gln Pro Leu His Asp Asn Thr Thr Arg Ser 690 695 700 Val His Ala Lys His Cys Asn Asp Ala Arg Pro Glu Ser Arg Arg Ala 705 710 715 720 Cys Ser Arg Glu Leu Cys Pro Gly Arg Trp Arg Ala Gly Pro Trp Ser 725 730 735 Gln Cys Ser Val Thr Cys Gly Asn Gly Thr Gln Glu Arg Pro Val Pro 740 745 750 Cys Arg Thr Ala Asp Asp Ser Phe Gly Ile Cys Gln Glu Glu Arg Pro 755 760 765 Glu Thr Ala Arg Thr Cys Arg Leu Gly Pro Cys Pro Arg Asn Ile Ser 770 775 780 Asp Pro Ser Lys Lys Ser Tyr Val Val Gln Trp Leu Ser Arg Pro Asp 785 790 795 800 Pro Asp Ser Pro Ile Arg Lys Ile Ser Ser Lys Gly His Cys Gln Gly 805 810 815 Asp Lys Ser Ile Phe Cys Arg Met Glu Val Leu Ser Arg Tyr Cys Ser 820 825 830 Ile Pro Gly Tyr Asn Lys Leu Ser Cys Lys Ser Cys Asn Leu Tyr Asn 835 840 845 Asn Leu Thr Asn Val Glu Gly Arg Ile Glu Pro Pro Pro Gly Lys His 850 855 860 Asn Asp Ile Asp Val Phe Met Pro Thr Leu Pro Val Pro Thr Val Ala 865 870 875 880 Met Glu Val Arg Pro Ser Pro Ser Thr Pro Leu Glu Val Pro Leu Asn 885 890 895 Ala Ser Ser Thr Asn Ala Thr Glu Asp His Pro Glu Thr Asn Ala Val 900 905 910 Asp Glu Pro Tyr Lys Ile His Gly Leu Glu Asp Glu Val Gln Pro Pro 915 920 925 Asn Leu Ile Pro Arg Arg Pro Ser Pro Tyr Glu Lys Thr Arg Asn Gln 930 935 940 Arg Ile Gln Glu Leu Ile Asp Glu Met Arg Lys Lys Glu Met Leu Gly 945 950 955 960 Lys Phe <210> 22 <211> 2888 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence containing the coding regions of the vascular signal sequence of barley gene for Thiol protease aleurain precursor fused to the human Lysyl hydroxylase 3 and flanking regions <400> 22 gcgaattcgc tagctatcac tgaaaagaca gcaagacaat ggtgtctcga tgcaccagaa 60 ccacatcttt gcagcagatg tgaagcagcc agagtggtcc acaagacgca ctcagaaaag 120 gcatcttcta ccgacacaga aaaagacaac cacagctcat catccaacat gtagactgtc 180 gttatgcgtc ggctgaagat aagactgacc ccaggccagc actaaagaag aaataatgca 240 agtggtccta gctccacttt agctttaata attatgtttc attattattc tctgcttttg 300 ctctctatat aaagagcttg tattttcatt tgaaggcaga ggcgaacaca cacacagaac 360 ctccctgctt acaaaccaga tcttaaacca tggctcacgc tagggttttg cttcttgctc 420 ttgctgttct tgctactgct gctgttgctg tggcttcttc aagttctttc gctgattcta 480 acccaattag gccagtgact gatagagctg cttctactct tgctcaattg agatctatgt 540 ctgatagacc aaggggaagg gatccagtta atccagagaa gttgcttgtg attactgtgg 600 ctactgctga gactgaagga taccttagat tccttaggag tgctgagttc ttcaactaca 660 ctgtgaggac tcttggactt ggagaagaat ggaggggagg agatgttgct agaactgttg 720 gaggaggaca gaaagtgaga tggcttaaga aagagatgga gaagtacgct gatagggagg 780 atatgattat tatgttcgtg gattcttacg atgtgattct tgctggatct ccaactgagc 840 ttttgaagaa attcgttcag tctggatcta ggcttctttt ctctgctgag tctttttgtt 900 ggccagaatg gggacttgct gagcaatatc cagaagtggg aactggaaag agattcctta 960 actctggagg attcattgga ttcgctacta ctattcacca gattgtgagg cagtggaagt 1020 acaaggatga cgatgatgat cagcttttct acactaggct ttaccttgat ccaggactta 1080 gggagaagtt gtctcttaac cttgatcaca agtctaggat tttccagaac cttaacggtg 1140 ctcttgatga ggttgtgctt aagttcgata ggaacagagt gaggattagg aacgtggctt 1200 acgatactct tcctattgtg gtgcatggaa acggaccaac aaaactccag cttaactacc 1260 ttggaaacta cgttccaaac ggatggactc cagaaggagg atgtggattc tgcaatcagg 1320 ataggagaac tcttccagga ggacaaccac caccaagagt tttccttgct gtgttcgttg 1380 aacagccaac tccattcctt ccaagattcc ttcagaggct tcttcttttg gattacccac 1440 cagatagggt gacacttttc cttcacaaca acgaggtttt ccacgagcca cacattgctg 1500 attcttggcc acagcttcag gatcatttct ctgctgtgaa gttggttggt ccagaagaag 1560 ctctttctcc aggagaagct agggatatgg ctatggattt gtgcaggcag gatccagagt 1620 gcgagttcta cttctctctt gatgctgatg ctgtgcttac taaccttcag actcttagga 1680 ttcttattga ggagaacagg aaagtgattg ctccaatgct ttctaggcac ggaaagttgt 1740 ggtctaattt ctggggtgct ctttctcctg atgagtacta cgctagatca gaggactacg 1800 tggagcttgt tcagagaaag agagtgggag tttggaacgt tccttatatt tctcaggctt 1860 acgtgattag gggagatact cttaggatgg agcttccaca gagggatgtt ttctctggat 1920 ctgatactga tccagatatg gctttctgca agtctttcag ggataaggga attttccttc 1980 acctttctaa ccagcatgag ttcggaagat tgcttgctac ttcaagatac gatactgagc 2040 accttcatcc tgatctttgg cagattttcg ataacccagt ggattggaag gagcagtaca 2100 ttcacgagaa ctactctagg gctcttgaag gagaaggaat tgtggagcaa ccatgcccag 2160 atgtttactg gttcccactt ctttctgagc aaatgtgcga tgagcttgtt gctgagatgg 2220 agcattacgg acaatggagt ggaggtagac atgaggattc taggcttgct ggaggatacg 2280 agaacgttcc aactgtggat attcacatga agcaagtggg atacgaggat caatggcttc 2340 agcttcttag gacttatgtg ggaccaatga ctgagtctct tttcccagga taccacacta 2400 aggctagggc tgttatgaac ttcgttgtga ggtatcgtcc agatgagcaa ccatctctta 2460 ggccacacca cgattcttct actttcactc ttaacgtggc tcttaaccac aagggacttg 2520 attatgaggg aggaggatgc cgtttcctta gatacgattg cgtgatttct tcaccaagaa 2580 agggatgggc tcttcttcat ccaggaaggc ttactcatta ccacgaggga cttccaacta 2640 cttggggaac tagatatatt atggtgtctt tcgtggatcc atgactgctt taatgagata 2700 tgcgagacgc ctatgatcgc atgatatttg ctttcaattc tgttgtgcac gttgtaaaaa 2760 acctgagcat gtgtagctca gatccttacc gccggtttcg gttcattcta atgaatatat 2820 cacccgttac tatcgtattt ttatgaataa tattctccgt tcaatttact gattgtccag 2880 aattcgcg 2888 <210> 23 <211> 764 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence containing the vascular signal sequence of barley gene for Thiol protease aleurain precursor fused to the human Lysyl hydroxylase 3 and flanking regions <400> 23 Met Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr 1 5 10 15 Ala Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro 20 25 30 Ile Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala Gln Leu Arg 35 40 45 Ser Met Ser Asp Arg Pro Arg Gly Arg Asp Pro Val Asn Pro Glu Lys 50 55 60 Leu Leu Val Ile Thr Val Ala Thr Ala Glu Thr Glu Gly Tyr Leu Arg 65 70 75 80 Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr Thr Val Arg Thr Leu Gly 85 90 95 Leu Gly Glu Glu Trp Arg Gly Gly Asp Val Ala Arg Thr Val Gly Gly 100 105 110 Gly Gln Lys Val Arg Trp Leu Lys Lys Glu Met Glu Lys Tyr Ala Asp 115 120 125 Arg Glu Asp Met Ile Ile Met Phe Val Asp Ser Tyr Asp Val Ile Leu 130 135 140 Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys Phe Val Gln Ser Gly Ser 145 150 155 160 Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys Trp Pro Glu Trp Gly Leu 165 170 175 Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly Lys Arg Phe Leu Asn Ser 180 185 190 Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile His Gln Ile Val Arg Gln 195 200 205 Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln Leu Phe Tyr Thr Arg Leu 210 215 220 Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu Ser Leu Asn Leu Asp His 225 230 235 240 Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly Ala Leu Asp Glu Val Val 245 250 255 Leu Lys Phe Asp Arg Asn Arg Val Arg Ile Arg Asn Val Ala Tyr Asp 260 265 270 Thr Leu Pro Ile Val Val His Gly Asn Gly Pro Thr Lys Leu Gln Leu 275 280 285 Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly Trp Thr Pro Glu Gly Gly 290 295 300 Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr Leu Pro Gly Gly Gln Pro 305 310 315 320 Pro Pro Arg Val Phe Leu Ala Val Phe Val Glu Gln Pro Thr Pro Phe 325 330 335 Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu Leu Asp Tyr Pro Pro Asp 340 345 350 Arg Val Thr Leu Phe Leu His Asn Asn Glu Val Phe His Glu Pro His 355 360 365 Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp His Phe Ser Ala Val Lys 370 375 380 Leu Val Gly Pro Glu Glu Ala Leu Ser Pro Gly Glu Ala Arg Asp Met 385 390 395 400 Ala Met Asp Leu Cys Arg Gln Asp Pro Glu Cys Glu Phe Tyr Phe Ser 405 410 415 Leu Asp Ala Asp Ala Val Leu Thr Asn Leu Gln Thr Leu Arg Ile Leu 420 425 430 Ile Glu Glu Asn Arg Lys Val Ile Ala Pro Met Leu Ser Arg His Gly 435 440 445 Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu Ser Pro Asp Glu Tyr Tyr 450 455 460 Ala Arg Ser Glu Asp Tyr Val Glu Leu Val Gln Arg Lys Arg Val Gly 465 470 475 480 Val Trp Asn Val Pro Tyr Ile Ser Gln Ala Tyr Val Ile Arg Gly Asp 485 490 495 Thr Leu Arg Met Glu Leu Pro Gln Arg Asp Val Phe Ser Gly Ser Asp 500 505 510 Thr Asp Pro Asp Met Ala Phe Cys Lys Ser Phe Arg Asp Lys Gly Ile 515 520 525 Phe Leu His Leu Ser Asn Gln His Glu Phe Gly Arg Leu Leu Ala Thr 530 535 540 Ser Arg Tyr Asp Thr Glu His Leu His Pro Asp Leu Trp Gln Ile Phe 545 550 555 560 Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr Ile His Glu Asn Tyr Ser 565 570 575 Arg Ala Leu Glu Gly Glu Gly Ile Val Glu Gln Pro Cys Pro Asp Val 580 585 590 Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met Cys Asp Glu Leu Val Ala 595 600 605 Glu Met Glu His Tyr Gly Gln Trp Ser Gly Gly Arg His Glu Asp Ser 610 615 620 Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro Thr Val Asp Ile His Met 625 630 635 640 Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu Gln Leu Leu Arg Thr Tyr 645 650 655 Val Gly Pro Met Thr Glu Ser Leu Phe Pro Gly Tyr His Thr Lys Ala 660 665 670 Arg Ala Val Met Asn Phe Val Val Arg Tyr Arg Pro Asp Glu Gln Pro 675 680 685 Ser Leu Arg Pro His His Asp Ser Ser Thr Phe Thr Leu Asn Val Ala 690 695 700 Leu Asn His Lys Gly Leu Asp Tyr Glu Gly Gly Gly Cys Arg Phe Leu 705 710 715 720 Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg Lys Gly Trp Ala Leu Leu 725 730 735 His Pro Gly Arg Leu Thr His Tyr His Glu Gly Leu Pro Thr Thr Trp 740 745 750 Gly Thr Arg Tyr Ile Met Val Ser Phe Val Asp Pro 755 760 <210> 24 <211> 45 <212> PRT <213> Artificial sequence <220> <223> Vacuole signal sequence of barley gene for Thiol protease aleurain precursor <400> 24 Met Ala His Ala Arg Val Leu Leu Leu Ala Leu Ala Val Leu Ala Thr 1 5 10 15 Ala Ala Val Ala Val Ala Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro 20 25 30 Ile Arg Pro Val Thr Asp Arg Ala Ala Ser Thr Leu Ala 35 40 45 <210> 25 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 25 atcaccagga gaacagggac catc 24 <210> 26 <211> 29 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 26 tccacttcca aatctctatc cctaacaac 29 <210> 27 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 27 aggcattaga ggcgataagg gag 23 <210> 28 <211> 27 <212> DNA <213> Artificial sequence <220> <223> Single strand DNA oligonucleotide <400> 28 tcaatccaat aatagccact tgaccac 27

Claims

내인성(endogenous) P4H 활성이 없는 세포내 컴파트먼트(subcellular compartment)에 적어도 한 형태의 콜라겐 알파 사슬 및 외인성 P4H를 축적할 수 있는 방식으로, 식물 또는 단리된 식물 세포에서 적어도 한 형태의 콜라겐 알파 사슬 및 외인성 P4H를 발현하여 식물에서 콜라겐을 생성하는 것을 포함하여, 식물 또는 단리된(isolated) 식물 세포에서 콜라겐을 생산하는 방법.
제 1 항에 있어서, 내인성 P4H 활성이 없는 세포내 컴파트먼트에서 외인성 LH3를 발현하는 것을 추가로 포함하는 방법.
제 1 항에 있어서, 상기 적어도 한 형태의 콜라겐 알파 사슬이 아포플라스트(apoplast) 또는 액포를 표적화하기 위한 시그널 펩티드(signal peptide)를 포함하는 방법.
제 1 항에 있어서, 상기 적어도 한 형태의 콜라겐 알파 사슬이 ER 표적화 또는 보유(retention) 서열을 가지지 않는 방법.
제 1 항에 있어서, 상기 적어도 한 형태의 콜라겐 알파 사슬이 식물의 DNA-함유 세포기관(organelle)에서 발현되는 방법.
제 1 항에 있어서, 상기 외인성 P4H가 아포플라스트 또는 액포를 표적화하기 위한 시그널 펩티드를 포함하는 방법.
제 1 항에 있어서, 상기 외인성 P4H가 ER 표적화 또는 보유 서열을 가지지 않는 방법.
제 1 항에 있어서, 상기 외인성 P4H가 식물의 DNA-함유 세포기관에서 발현되는 방법.
제 1 항에 있어서, 상기 적어도 한 형태의 콜라겐 알파 사슬이 알파 1 사슬인 방법.
제 1 항에 있어서, 상기 적어도 한 형태의 콜라겐 알파 사슬이 알파 2 사슬인 방법.
제 1 항에 있어서, 상기 적어도 한 형태의 콜라겐 알파 사슬이 C-말단 및/또는 N-말단 프로펩티드를 포함하는 방법.
제 1 항에 있어서, 상기 식물이 담배(Tobacco), 옥수수(Maize), 자주개자 리(Alfalfa), 벼(Rice), 감자(Potato), 대두(Soybean), 토마토(Tomato), 밀(Wheat), 보리(Barley), 캐놀라(Canola), 당근(Carrot) 및 목화(Cotton)로 구성된 그룹중에서 선택되는 방법.
제 1 항에 있어서, 상기 적어도 한 형태의 콜라겐 알파 사슬 또는 외인성 P4H가 식물의 부분에서만 발현되는 방법.
제 13 항에 있어서, 상기 식물의 부분이 잎, 종자, 뿌리, 덩이줄기 또는 줄기인 방법.
제 1 항에 있어서, 상기 외인성 P4H가 적어도 한 형태의 콜라겐 알파 사슬의 Gly-X-Y 트리플렛의 Y 위치를 특이적으로 하이드록실화할 수 있는 방법.
제 14 항에 있어서, 상기 외인성 P4H가 인간 P4H인 방법.
제 1 항에 있어서, 상기 식물이 스트레스 조건(stress condition)에 적용되는 방법.
제 17 항에 있어서, 상기 스트레스 조건이 건조(drought), 염분(salinity), 손상(injury), 저온(cold) 및 스트레스 유발 화합물의 분무(spraying)로 구성된 그 룹중에서 선택되는 방법.
콜라겐 알파 사슬이 인간 세포에서 발현할 때 생산된 것과 동일한 하이드록실화 패턴을 가진 콜라겐 알파 사슬을 축적할 수 있는 유전자 조작(genetically modified) 식물 또는 단리된 식물 세포.
내인성 P4H 활성이 없는 세포내 컴파트먼트에 콜라겐 알파 사슬을 축적할 수 있는 유전자 조작 식물 또는 단리된 식물 세포.
제 19 항 또는 제 20 항에 있어서, 외인성 P4H를 추가로 포함하는 유전자 조작 식물.
제 20 항에 있어서, 상기 적어도 한 형태의 콜라겐 알파 사슬이 아포플라스트 또는 액포를 표적화하기 위한 시그널 펩티드를 포함하는 유전자 조작 식물.
제 19 항 또는 제 20 항에 있어서, 상기 적어도 한 형태의 콜라겐 알파 사슬이 ER 표적화 또는 보유 서열을 가지지 않는 유전자 조작 식물.
제 19 항 또는 제 20 항에 있어서, 상기 적어도 한 형태의 콜라겐 알파 사슬이 식물의 DNA-함유 세포기관에서 발현되는 유전자 조작 식물.
제 21 항에 있어서, 상기 외인성 P4H가 아포플라스트 또는 액포를 표적화하기 위한 시그널 펩티드를 포함하는 유전자 조작 식물.
제 21 항에 있어서, 상기 외인성 P4H가 ER 표적화 또는 보유 서열을 가지지 않는 유전자 조작 식물.
제 21 항에 있어서, 상기 외인성 P4H가 식물의 DNA-함유 세포기관에서 발현되는 유전자 조작 식물.
제 19 항 또는 제 20 항에 있어서, 상기 콜라겐 알파 사슬이 알파 1 사슬인 유전자 조작 식물.
제 19 항 또는 제 20 항에 있어서, 상기 콜라겐 알파 사슬이 알파 2 사슬인 유전자 조작 식물.
제 19 항 또는 제 20 항에 있어서, 상기 콜라겐 알파 사슬이 C-말단 및/또는 N-말단 프로펩티드를 포함하는 유전자 조작 식물.
콜라겐 알파 1 사슬을 축적할 수 있는 제 1 유전자 조작 식물 및 콜라겐 알 파 2 사슬을 축적할 수 있는 제 2 유전자 조작 식물을 포함하는 식물 시스템.
제 31 항에 있어서, 상기 제 1 유전자 조작 식물 및 상기 제 2 유전자 조작 식물 중 적어도 하나는 외인성 P4H를 추가로 포함하는 식물 시스템.
(a) 제 1 식물에서 콜라겐 알파 1 사슬을 발현하고;

(b) 제 2 식물에서 콜라겐 알파 2 사슬을 발현하며, 여기서 제 1 식물 및 제 2 식물에서의 발현은 콜라겐 알파 1 사슬 및 콜라겐 알파 2 사슬이 각각 내인성 P4H 활성이 없는 세포내 컴파트먼트에 축적될 수 있도록 설정되고;

(c) 상기 제 1 식물 및 상기 제 2 식물을 교배하고 콜라겐 알파 1 사슬 및 콜라겐 알파 2 사슬을 발현하는 후손을 선택하여 섬유상 콜라겐을 생산하는 것을 포함하여, 섬유상 콜라겐을 생산하는 방법.
제 30 항에 있어서, 상기 제 1 식물 및 상기 제 2 식물 각각에서 외인성 P4H를 발현하는 것을 추가로 포함하는 방법.
제 33 항에 있어서, 각각의 상기 콜라겐 알파 1 사슬 및 상기 콜라겐 알파 2 사슬이 아포플라스트 또는 액포를 표적화하기 위한 시그널 펩티드를 포함하는 방법.
제 1 항에 있어서, 각각의 상기 콜라겐 알파 1 사슬 및 상기 콜라겐 알파 2 사슬이 ER 표적화 또는 보유 서열을 가지지 않는 방법.
제 1 항에 있어서, 상기 단계 (a) 및 (b)가 식물의 DNA-함유 세포기관에서 발현을 통해 수행되는 방법.
제 34 항에 있어서, 상기 외인성 P4H가 아포플라스트 또는 액포를 표적화하기 위한 시그널 펩티드를 포함하는 방법.
제 34 항에 있어서, 상기 외인성 P4H가 ER 표적화 또는 보유 서열을 가지지 않는 방법.
제 34 항에 있어서, 상기 외인성 P4H가 식물의 DNA-함유 세포기관에서 발현되는 방법.
제 1 항에 있어서, 각각의 상기 콜라겐 알파 1 사슬 및 상기 콜라겐 알파 2 사슬이 C-말단 및/또는 N-말단 프로펩티드를 포함하는 방법.
제 34 항에 있어서, 상기 외인성 P4H가 적어도 한 형태의 상기 콜라겐 알파 사슬의 Gly-X-Y 트리플렛의 Y 위치를 특이적으로 하이드록실화할 수 있는 방법.
제 34 항에 있어서, 상기 외인성 P4H가 인간 P4H인 방법.
제 1 항에 있어서, 상기 제 1 식물 및 상기 제 2 식물이 스트레스 조건에 적용되는 방법.
제 44 항에 있어서, 상기 스트레스 조건이 건조, 염분, 손상, 중금속 독성 및 저온 스트레스로 구성된 그룹 중에서 선택되는 방법.
(a) 제 1 식물에서, 콜라겐 알파 1 사슬 및 콜라겐 알파 2 사슬을 발현하며, 여기서 상기 제 1 식물에서의 발현은 상기 콜라겐 알파 1 사슬 및 상기 콜라겐 알파 2 사슬이 각각 내인성 P4H 활성이 없는 세포내 컴파트먼트에 축적될 수 있도록 설정되고;

(b) 제 2 식물에서, 내인성 P4H 활성이 없는 상기 세포내 컴파트먼트에 축적될 수 있는 외인성 P4H를 발현하며;

(c) 상기 제 1 식물 및 상기 제 2 식물을 교배하고, 상기 콜라겐 알파 1 사슬, 상기 콜라겐 알파 2 사슬 및 상기 P4H를 발현하는 후손을 선택하여 섬유상 콜라겐을 생산하는 것을 포함하여, 섬유상 콜라겐을 생산하는 방법.
식물 세포에 작용하는 프로모터의 전사 제어하에 위치된 인간 P4H를 코딩하 는 폴리뉴클레오티드를 포함하는 핵산 작제물.
제 47 항에 있어서, 상기 프로모터가 CaMV 35S 프로모터, 유비퀴틴(Ubiquitin) 프로모터, rbcS 프로모터 및 SVBV 프로모터로 구성된 그룹 중에서 선택되는 핵산 작제물.
콜라겐 알파 1 사슬, 콜라겐 알파 2 사슬, P4H, LH3 및 프로테아제 C 및/또는 프로테아제 N을 발현할 수 있는 유전자 조작 식물 또는 단리된 식물 세포.
제 49 항에 있어서, 상기 콜라겐 알파 1 사슬 및 상기 콜라겐 알파 2 사슬이 각각 내인성 식물 P4H 활성이 없는 세포내 컴파트먼트에 축적될 수 있는 유전자 조작 식물 또는 단리된 식물 세포.
포유동물 콜라겐의 것과 동일한 온도 안정성 특징을 가진 콜라겐을 축적할 수 있는 유전자 조작 식물 또는 단리된 식물 세포.
제 51 항에 있어서, 상기 콜라겐이 I형 콜라겐인 유전자 조작 식물 또는 단리된 식물 세포.
제 51 항에 있어서, 상기 포유동물 콜라겐이 인간 콜라겐인 유전자 조작 식 물 또는 단리된 식물 세포.