KR101426667B1

KR101426667B1 - 비-포유동물 글리코실트랜스퍼라제의 발현에 의한 식물에서의 포유동물형 글리코실화

Info

Publication number: KR101426667B1
Application number: KR1020137020324A
Authority: KR
Inventors: 게라르트 요한 아돌프 로우웬달; 디오니시우스 엘리사베트 안토니우스 플로라크; 헨드리크 얀 보스흐
Original assignee: 스티칭 디엔스트 랜드보위쿤디그 온데조에크
Priority date: 2007-04-17
Filing date: 2008-04-17
Publication date: 2014-08-06
Also published as: CN101702919A; DK2147108T3; IL229861A; JP5485869B2; HK1142092A1; MX2009011109A; WO2008125972A3; KR101460953B1; EP2147108B1; WO2008125972A2; NZ593203A; ZA200907301B; US9745594B2; US20120210466A9; KR20100033960A; US8829276B2; EP2147108A2; CN104195166A; CA2684370A1; CN101702919B

Abstract

본 발명은 야생형 또는 변형된 형태로 사용될 수 있는 비-포유동물 β-1,4-갈락토실트랜스퍼라제에 관한 것이다. 본 발명은 또한 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현하는 형질전환된 식물 및 식물 세포, 및 변경된 및 바람직하게는 포유동물형 글리코실화를 갖는 당단백질을 생산하는 방법에 관한 것이다. 본 발명은 추가로 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 핵산 분자 및 발현 벡터를 제공한다.

Description

비-포유동물 글리코실트랜스퍼라제의 발현에 의한 식물에서의 포유동물형 글리코실화{MAMMALIAN-TYPE GLYCOSYLATION IN PLANTS BY EXPRESSION OF NON-MAMMALIAN GLYCOSYLTRANSFERASES}

본 발명은 트랜스제닉 식물에서, 특히 재조합 생물의약용 단백질의 생산을 위해 사용되는 식물에서 당단백질 처리 분야에 관한 것이다.

재조합 단백질 생산은 트랜스제닉 식물의 중요한 용도를 구성한다. 재조합 단백질의 논밭 생산의 수확량과 유리한 비용에 추가로, 트랜스제닉 식물은 다른 생산 시스템, 예를 들어 세균, 효모 및 동물 세포에 비해 특정 잇점을 제공한다. 실제로, 식물에는 인간에 감염성인 물질이 없고, 관심있는 단백질을 저장 조직, 예를 들어 종자 또는 덩이줄기에 축적할 수 있다. 이는 후속적인 추출 가능성을 제공하면서 주변 온도에서 그의 취급, 수송 및 저장을 용이하게 한다. 또한, 트랜스제닉 식물 또는 그의 일부분의 몇몇은 의약 또는 백신의 벡터로서 이용될 수 있다.

단백질성 물질의 공장으로서 식물의 잇점은 대부분 생물의약의 측면에서 설명되지만, 식물은 또한 예를 들어 보다 큰 안정성을 생성시키는 그들의 글리코실화 능력으로 인해 다른 단백질, 예를 들어, 산업용 효소 등의 생산을 위해 유용하다. 오늘날, 치료 및 다른 용도를 위한 이종 당단백질의 생산을 위한 식물의 활용이 대두, 담배, 감자, 벼 및 유채 (rapeseed)에서 조사되었고, 여기서 생산된 당단백질은 모노클로날 항체, 호르몬, 백신 항원, 효소 및 혈액 단백질을 포함한다. 상기 단백질의 일부는 인간에서 그 효능이 이미 입증되었다.

식물에서 당단백질 생산의 단점은 식물에서 생산된 당단백질의 글리코실화 패턴에 관련된다. 다른 이종 발현 시스템과는 달리, 식물은 포유동물에 비해 상이한 글리코실화 프로필을 나타낸다. N-연결된 글리칸을 갖지 않는 세균 및 고 만노스형 (high mannose type)의 N-연결된 글리칸만을 갖는 효모와 대조적으로, 식물은 복합형 (complex type)의 N-연결된 글리칸을 갖는 단백질을 생산할 수 있다. 그러나, 식물 당단백질은 포유동물에서 발견되지 않는 β-1,2-자일로스 및 α-1,3-푸코스 잔기를 함유하는 복합형 N-연결된 글리칸을 갖는다. 또한, 식물 당단백질은 포유동물에서 발견되는 특징적인 갈락토스-함유 복합형 N-글리칸이 결여된다.

짧게 설명하면, 식물로부터의 당단백질의 분석에서는 유사성이 존재하지만 식물 및 포유동물의 글리코실화 경로에서, 특히 복합형 글리칸의 합성에서 몇몇 단계가 상이함을 나타낸다. 식물의 복합형 글리칸은 일반적으로 훨씬 더 작고, Man₃(GlcNAc)₂ 코어에 부착된 베타-1,2 자일로스 또는 알파-1,3 푸코스 잔기를 함유한다. 당단백질 상의 그러한 잔기는 면역원성인 것으로 알려져 있고, 이는 이들 당을 보유하는 재조합 단백질의 특정 용도에 대해 문제를 일으킨다.

도 1은 다양한 포유동물 (인간, 마우스, 소) 및 비-포유동물 (닭, 제브라피시, 개구리) 기원의 β-1,4-갈락토실트랜스퍼라제의 서열 정렬 (Clustal W)을 도시한 것이다. "포유동물 연장부"는 β-1,4-갈락토실트랜스퍼라제의 비-포유동물 동족체 (ortholog)에서 발견되지 않는, 포유동물에 특이적인 아미노-말단 구역이다 (상자표시, 실선). "TM"은 막횡단 구역을 표시한다 (상자표시, 점선).
도 2는 닭 유전자를 발현하는 트랜스제닉 식물로부터 정제된 N-글리칸의 Maldi-TOF 분석의 결과를 도시한 것이다. 상단으로부터 저변으로, 정상 닭 유전자 (닭 GalT), 13개 아미노산의 N-말단 인간 GalT-닭 GalT, 및 SialT-CTS-닭 GalT.
도 3은 제브라피시 GalT 유전자 서열을 발현하는 트랜스제닉 식물로부터 정제된 N-글리칸의 Maldi-TOF 분석의 결과를 도시한 것이다. 상단으로부터 저변으로, 정상 제브라피시 유전자 (제브라피시 GalT, 2개의 식물), 13개 아미노산의 N-말단 인간 GalT-제브라피시 GalT, 및 SialT-CTS-제브라피시 GalT.
도 4는 2-안테나형 "야생형" 식물 N-글리칸 (GlcNAc2-Man3-Xyl-Fuc-GlcNAc2-Asn), 하나의 갈락토스를 갖는 (자일로스 및 푸코스가 결여되는) 하이브리드형 N-글리칸, 및 2개의 갈락토스를 갖는 2-안테나형 (상단으로부터 저변으로)에 대하여, 인간, 제브라피시 및 닭 GalT로부터의 결과를 요약하는 막대 그래프를 도시한 것이다.
도 5는 Dgal (SEQ Dgal, 서열 14)와 공개된 추정 제브라피시 β-1,4-GalT1 (Machingo et al, Dev Biol 297, 471-82, 2006; NM_001017730)과의 아미노산 서열 비교를 도시한 것이다.

<발명의 개요>

당단백질의 생산을 위한 일부 식물 기반 시스템이 제안되었거나 사용되고 있지만, 인간화 단백질의 생산을 위한 개선된 식물 기반 시스템이 필요하다. 특정 실시태양에서, 본 발명은 그러한 개선된 식물 기반 시스템을 제공한다.

예를 들어, WO01/31045 (전체 내용이 본원에 포함된다)에 기재된 것과 같은 이전에 제안된 식물 기반 시스템에서는 인간화 단백질의 생산을 위해 포유동물 β-1,4-갈락토실트랜스퍼라제를 사용하였다.

현재, 특성이 결정된 포유동물 β-1,4-갈락토실트랜스퍼라제의 특정한 일부에 상동성을 보이는 비-포유동물, 닭 및 제브라피시 (zebrafish)로부터 유래된 것과 같은 몇몇의 이전에 특성이 결정되지 않은 글리코실트랜스퍼라제가 인간화 단백질의 생산에 있어서 선행 기술 방법에 비해 예기치 않은 개선을 보여주는 것으로 밝혀졌다.

본 발명의 한 측면에 따르면, N-연결된 글리칸에 β-1,4-연결로 갈락토스 잔기를 부가할 수 있는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하는 방법을 제공한다. 상기 방법은 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 코딩하는 핵산 분자를 식물 또는 식물 세포 내로 삽입하고, 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 코딩하는 핵산 분자를 흡수하고 핵산 분자를 발현하는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 선택하여, N-연결된 글리칸에 갈락토스 잔기를 β-1,4-연결로 부가할 수 있는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하는 것을 포함한다. 특정 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 닭 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 1을 포함한다. 특정 실시태양에서, 닭 β-1,4-갈락토실트랜스퍼라제 1은 서열 2를 포함하는 한편, 제브라피시 β-1,4-갈락토실트랜스퍼라제 1은 서열 14를 포함한다. 일부 실시태양에서, 닭 또는 제브라피시의 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 골지체 내에 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 국재화 (localization)를 지시할 수 있는 아미노산 서열로 연장된다. 일부 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 N-말단에서 포유동물 β-1,4-갈락토실트랜스퍼라제 1의 N-말단 아미노산 서열에 대응하는 아미노산 서열로 연장된다. 특정 실시태양에서, N-말단 아미노산 서열은 처음 10개의 N-말단 아미노산 내에 적어도 서열 [K/R]-X-[K/R]을 포함하고, 여기서 [K/R]은 라이신 또는 아르기닌 잔기를 나타내고, X는 임의의 아미노산일 수 있다. 특정 실시태양에서, N-말단 아미노산 서열은 MRLREPLLSGSAA (서열 21)이다. 일부 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 세포질-막횡단-스템 (stem) 구역 (CTS)은 또다른 골지체에 국재화된 (Golgi-localized) 단백질의 CTS로 교체된다. 일부 실시태양에서, CTS는 포유동물 또는 식물의 골지체에 국재화된 단백질로부터 유래된다. 일부 실시태양에서, CTS는 포유동물 시알릴트랜스퍼라제로부터 유래된다. 특정 실시태양에서, CTS는 래트 α-2,6-시알릴트랜스퍼라제로부터 유래된다.

본 발명의 다른 측면에 따르면, 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 코딩하는 핵산 분자 및 이종 당단백질을 코딩하는 핵산 분자를 식물 또는 식물 세포 내로 삽입하여, 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하고, 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 핵산 분자의 발현에 적절한 조건 하에 유지시켜 하나 이상의 갈락토실화된 N-연결된 글리칸을 포함하는 이종 당단백질을 생산하는 것을 포함하는, 하나 이상의 갈락토실화된 N-연결된 글리칸을 포함하는 이종 당단백질을 생산하는 방법을 제공한다.

특정 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 닭 β-1,4-갈락토실트랜스퍼라제 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제이다. 특정 실시태양에서, 닭 β-1,4-갈락토실트랜스퍼라제 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제는 N-말단에서 포유동물 β-1,4-갈락토실트랜스퍼라제 1의 N-말단 아미노산 서열에 대응하는 아미노산 서열로 연장된다. 특정 실시태양에서, 닭 β-1,4-갈락토실트랜스퍼라제 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제의 CTS는 또다른 골지체에 국재화된 단백질의 CTS로 교체된다.

특정 실시태양에서, 방법은 이종 당단백질을 트랜스제닉 식물 또는 트랜스제닉 식물 세포로부터 적어도 부분적으로 단리하는 것을 추가로 포함한다. 특정 실시태양에서, 당단백질은 하나 이상의 N-글리칸 상에 하나 이상의 갈락토스 잔기를 포함한다. 일부 실시태양에서, 당단백질의 N-글리칸에는 본질적으로 자일로스, 푸코스, 또는 자일로스와 푸코스 잔기가 모두 없다. 특정 실시태양에서, 이종 당단백질을 코딩하는 핵산 분자는 호르몬; 사이토킨; 백신; 부착 분자, 또는 항체 또는 그의 기능적 단편을 코딩한다.

특정 실시태양에서, 식물 또는 식물 세포는 식물 또는 식물 세포 내에서 발현가능한 적어도 하나의 선택 마커를 코딩하는 핵산 분자를 추가로 포함한다. 특정 실시태양에서, 식물 또는 식물 세포는 니코티아나 (Nicotiana) 종이거나 그로부터 유래된다. 일부 실시태양에서, 핵산 분자는 미세주사, PEG 형질전환, 아그로박테리움 (Agrobacterium) 매개 형질전환, 전기천공, 탄도 (ballistic) 입자 폭격, 직접 유전자 전달, 리포좀 융합, 식물체내 (in planta) 형질전환, 인산칼슘 침전, 애그로필트레이션 (agrofiltration), 또는 바이러스 감염을 통해 삽입된다.

본 발명의 다른 측면에 따르면, N-연결된 글리칸에 갈락토스 잔기를 β-1,4-연결로 부가할 수 있는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하는 방법을 제공하고, 여기서 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 닭 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 1) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 13)과 적어도 85% 동일한 핵산에 의해 코딩된다. 다른 실시태양에서, 핵산은 닭 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 1) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 13)과 적어도 90%, 95%, 또는 98% 동일하다.

본 발명의 다른 측면에 따르면, N-연결된 글리칸에 갈락토스 잔기를 β-1,4-연결로 부가할 수 있는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하는 방법을 제공하고, 여기서 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 효소 활성 도메인의 아미노산 서열은 닭 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 2) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)와 적어도 85% 동일하다. 다른 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 효소 활성 도메인의 아미노산 서열은 닭 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 2) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)와 적어도 90%, 95%, 또는 98% 동일하다. 특정 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 아미노산 서열은 포유동물 연장부를 추가로 포함한다. 일부 실시태양에서, 포유동물 연장부는 MRLREPLLSGSAA (서열 21)이다. 특정 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 CTS는 또다른 골지체에 국재화된 단백질로부터의 CTS로 교체되고, 여기서 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 효소 활성 도메인의 아미노산 서열은 닭 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 2) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)와 적어도 85% 동일하다. 다른 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 효소 활성 도메인의 아미노산 서열은 닭 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 2) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)와 적어도 90%, 95%, 또는 98% 동일하다. 특정 실시태양에서, 또다른 골지체에 국재화된 단백질로부터의 CTS는 래트 α-2,6-시알릴트랜스퍼라제로부터의 CTS이다.

본 발명의 또다른 측면에 따르면, N-연결된 글리칸에 갈락토스 잔기를 β-1,4-연결로 부가할 수 있는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하는 방법을 제공하고, 여기서 식물 또는 식물 세포는 β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드 (hybrid)형 N-연결된 글리칸을 포함하는 당단백질을 생산한다. 특정 실시태양에서, β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸의 생산량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물에 의한 생산량의 2배이다. 다른 실시태양에서, β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸의 생산량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물의 생산량의 5배, 10배, 또는 50배이다. 특정 실시태양에서, 식물 또는 식물 세포는 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 (bi-antennary) N-글리칸을 포함하는 당단백질을 생산한다. 상기 실시태양에서, 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸의 생산량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물의 생산량의 2배, 5배, 10배, 또는 50배이다.

본 발명의 또다른 측면에 따르면, 본원에 기재된 방법에 따라 생산된 당단백질을 제공한다.

본 발명의 다른 측면에 따르면, 본원에 기재된 방법에 따라 생산된 식물, 또는 상기 식물의 일부분을 제공한다. 특정 실시태양에서, 식물은 종자, 배, 유합 (callus) 조직, 잎, 뿌리, 싹, 화분 및 소포자로 이루어지는 군 중에서 선택되는 식물의 일부분이다.

본 발명의 다른 측면에 따르면, 본원에 기재된 방법에 따라 생산된 식물 세포를 제공한다. 특정 실시태양에서, 식물 세포는 현탁 배양으로 성장된다. 특정 실시태양에서, 현탁 배양으로 성장되는 식물 세포는 엔. 타바쿰 (N. tabacum; 담배) BY2, 다우쿠스 카로타 (Daucus carota; 당근) 및 아라비돕시스 탈리아나 (Arabidopsis thaliana; 애기장대) 세포 현탁액으로 이루어지는 군 중에서 선택된다. 특정 실시태양에서, 식물 세포는 브리오피타에아 (Bryophytaea), 피스코미트렐라 파텐스 (Physcomitrella patens), 푸나리아 히그로메트리카 (Funaria hygrometrica; 표주박이끼), 및 케라토돈 푸르푸레우스 (Ceratodon purpureus)로 이루어지는 군 중에서 선택된 이끼의 일부분이다.

본 발명의 다른 측면에 따르면, 닭 β-1,4-갈락토실트랜스퍼라제 1 (서열 2) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 1 (서열 14)의 아미노산 서열 및 그의 N-말단에서의 연장부를 포함하는 폴리펩티드를 코딩하는 핵산을 제공하고, 여기서 연장부는 포유동물 β-1,4-갈락토실트랜스퍼라제 1의 N-말단 아미노산 서열에 대응하는 아미노산 서열이고, 여기서 N-말단 아미노산 서열은 처음 10개의 N-말단 아미노산 내에 적어도 서열 [K/R]-X-[K/R]을 포함하고, 여기서 [K/R]은 라이신 또는 아르기닌 잔기를 나타내고, X는 임의의 아미노산일 수 있다. 특정 실시태양에서, 아미노산 서열은 MRLREPLLSGSAA (서열 21)이다. 특정 실시태양에서, 아미노산 서열은 서열 8 또는 서열 15를 포함한다. 특정 실시태양에서, 닭 β-1,4-갈락토실트랜스퍼라제 1 (서열 2) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 1 (서열 14)의 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 핵산을 제공하고, 여기서 닭 β-1,4-갈락토실트랜스퍼라제 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제의 CTS는 또다른 골지체에 국재화된 단백질의 CTS로 교체된다. 특정 실시태양에서, CTS는 포유동물 또는 식물의 골지체에 국재화된 단백질로부터 유래된다. 특정 실시태양에서, CTS는 포유동물 시알릴트랜스퍼라제로부터 유래된다. 특정 실시태양에서, CTS는 래트 α-2,6-시알릴트랜스퍼라제로부터 유래된다. 특정 실시태양에서, 아미노산 서열은 서열 11 또는 서열 18을 포함한다.

본 발명의 또다른 측면에 따르면, 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 아미노산 서열 (여기서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제의 효소 활성 도메인의 아미노산 서열은 닭 β-1,4-갈락토실트랜스퍼라제 1 (서열 2) 또는 제브라피시 β-1,4-갈락토실트랜스퍼라제 1 (서열 14)의 대응 서열에 적어도 90% 동일함) 및 그의 N-말단에서의 연장부 (여기서, 연장부는 포유동물 β-1,4-갈락토실트랜스퍼라제 1의 N-말단 아미노산 서열에 대응하는 아미노산 서열임)를 포함하는 폴리펩티드를 코딩하는 핵산을 제공하고, 여기서 N-말단 아미노산 서열은 처음 10개의 N-말단 아미노산 내에 적어도 서열 [K/R]-X-[K/R]을 포함하고, 여기서 [K/R]은 라이신 또는 아르기닌 잔기를 나타내고, X는 임의의 아미노산일 수 있다. 다른 실시태양에서, 서열 동일성은 적어도 95% 또는 98%이다.

본 발명의 또다른 측면에 따르면, 본원에 기재된 핵산 분자를 포함하는 발현 벡터를 제공한다. 일부 실시태양에서, 핵산 분자는 진핵 또는 원핵 세포에서 핵산 분자의 전사에 충분한 조절 요소에 연결된다.

본 발명의 다른 측면에 따르면, 식물 세포에서 전사에 충분한 이종 조절 요소에 연결되는 본원에 기재된 핵산 분자를 포함하거나, 본원에 기재된 벡터를 포함하는 숙주 세포를 제공한다.

[발명의 상세한 설명]

골지체 (Golgi apparatus)는 복합형 글리칸 형성이 일어나는 소기관이고, 글리코실화 기구의 부위이다. 글리코실화의 핵심 매개체는 글리코실트랜스퍼라제이다. 가장 잘 연구된 골지-연관된 글리코실트랜스퍼라제 중 하나는 β-1,4-갈락토실트랜스퍼라제 1 (GalT)이다. β-1,4-갈락토실트랜스퍼라제 1은 세포기질 테일 (tail), 막횡단 도메인 (TMD) 및 촉매 도메인으로 이루어진다. 포유동물의 글리코실트랜스퍼라제의 수많은 유전자가 이미 클로닝되었다. 식물 시스템의 형질전환의 용이성으로 인해 연구자들은 식물이 생산하는 당단백질의 글리칸을 "인간화" 또는 "포유동물화"하기 위해 포유동물로부터의 글리코실트랜스퍼라제에 의해 식물의 골지체를 "보완"할 수 있다.

식물에서 포유동물화 또는 인간화 당단백질의 생산을 위한 비-포유동물 β-1,4-갈락토실트랜스퍼라제 (GalT)의 용도는 지금까지 보고되지 않았다.

현재, 닭 및 제브라피시로부터 유래된 것과 같은 몇몇의 이전에 특성이 결정되지 않은 비-포유동물 β-1,4-갈락토실트랜스퍼라제가 식물에서 N-연결된 당단백질의 말단 갈락토실화를 위해 이용될 수 있고, 이들 비-포유동물 β-1,4-갈락토실트랜스퍼라제가 인간화 단백질의 생산에 있어서 선행 기술 방법에 비해 예기치 않은 개선을 보여주는 것으로 밝혀졌다. 예를 들어, 닭 β-1,4-갈락토실트랜스퍼라제는 β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸을 주로 생산한다.

닭 및 제브라피시로부터의 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 포유동물 β-1,4-갈락토실트랜스퍼라제보다 더 짧고, 포유동물 β-1,4-갈락토실트랜스퍼라제 내에 존재하는 아미노-말단 구역이 결여되는 것이 추가로 밝혀졌다. 이들 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 아미노-말단에서 포유동물 β-1,4-갈락토실트랜스퍼라제의 아미노-말단에 대응하는 아미노산 서열로 연장될 수 있다 ("포유동물 연장부"). 이들 변형된 버전의 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 특정 N-연결된 글리칸을 인간 β-1,4-갈락토실트랜스퍼라제에 비해 더 높은 정도로 생산한다. 예를 들어, 그의 아미노-말단이 래트 시알릴트랜스퍼라제의 CTS 구역으로 치환된 제브라피시 GalT는 주로 2-안테나형의 이중 갈락토실화된 N-글리칸을 생산한다.

본 발명은 일부 실시태양에서, 식물에서 포유동물화된 당단백질을 생산하기 위해 사용되는 닭 및 물고기로부터의 변형되지 않은 또는 변형된 비-포유동물 GalT를 제공한다. 특정 실시태양에서, 상기 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 또는 식물 세포에서 생산된 포유동물화된 당단백질을 또한 제공한다.

정의

본원에서 사용될 때, 용어 "핵산"은 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중합체, 즉, 폴리뉴클레오티드 (단일가닥 또는 이중가닥 형태의)에 대한 언급을 포함하고, 달리 제한하지 않으면, 자연 발생 뉴클레오티드 (예를 들어, 펩티드 핵산)와 유사한 방식으로 단일가닥 핵산에 혼성화한다는 점에서 천연 뉴클레오티드의 필수 성질을 갖는 공지의 유사체를 포함한다. 폴리뉴클레오티드는 천연 또는 이종성 구조 또는 조절 유전자의 전장 또는 하위서열일 수 있다. 달리 지시하지 않으면, 상기 용어는 명시된 서열뿐만 아니라 그의 상보성 서열에 대한 언급을 포함한다. 따라서, 안정성 또는 다른 이유로 인해 백본 (backbone)이 변형된 DNA 또는 RNA는 본원에서 의도하는 것과 같은 "폴리뉴클레오티드"이다. 또한, 단지 2개의, 예를 들어 이노신과 같은 이상 (unusual) 염기, 또는 트리틸화 염기와 같은 변형 염기를 포함하는 DNA 또는 RNA는 본원에서 사용되는 것과 같은 폴리뉴클레오티드이다. 당업자에게 공지된 많은 유용한 목적을 만족시키는 매우 다양한 변형이 DNA 및 RNA에 대해 이루어질 수 있음이 이해될 것이다. 용어 폴리뉴클레오티드는 본원에서 사용될 때 그러한 화학적, 효소적 또는 대사적으로 변형된 형태의 폴리뉴클레오티드, 및 특히 단순 및 복합형 세포를 포함하는 세포 및 바이러스의 DNA 및 RNA 특징의 화학적 형태를 포함한다.

본원에서 사용될 때, "~를 코딩하는 핵산 분자" 또는 "~ 코딩 핵산 분자"는 개별적인 또는 별개의 분자, 예를 들어 별개의 엔티티 (entity)로서 핵산 분자에 제한되지 않고 (여기서 각각의 엔티티는 하나의 핵산 분자를 포함한다), 하나 이상의 핵산 분자가 임의의 개재하는 서열에 의해 분리될 수 있는 하나의 연속 서열 내에 연결될 수 있는 것을 포함한다. 하나의 연속 서열 내의 핵산 분자의 순서 및 배향은 임의의 구체적인 입체형상으로 제한되지 않고, 예를 들어 핵산 분자는 동일한 프로모터 또는 상이한 프로모터에 연결될 수 있고, 1방향성 또는 2방향성일 수 있고, 직접 인접하거나 개재하는 서열에 의해 분리될 수 있다. 다양한 그러한 입체형상이 당업계에 공지되어 있다. 추가의 핵산 분자가 하나의 연속 서열 내에 조합될 수 있거나, 별개의 엔티티로서 제공될 수 있다. 예를 들어, 특정 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제, 이종성 당단백질 및 하나 이상의 선택 마커를 포함하는 핵산 분자를 포함하는 식물 또는 식물 세포를 제공한다. 이들 핵산 분자는 본원에 기재된 바와 같이 1, 2, 3개 이상의 벡터 형태로 제공될 수 있다.

용어 "폴리펩티드", "펩티드" 및 "단백질"은 본원에서 아미노산 잔기들의 중합체를 나타내도록 상호 교환가능하게 사용된다. 상기 용어는 하나 이상의 아미노산 잔기가 대응하는 자연 발생 아미노산의 인공적인 화학 유사체인 아미노산 중합체뿐만 아니라 자연 발생 아미노산 중합체에도 적용된다. 자연 발생 아미노산의 그러한 유사체의 필수 성질은 단백질 내로 포함될 때, 단백질이 동일하지만 전적으로 자연 발생 아미노산으로 이루어지는 단백질에 대해 유도된 항체에 대해 특이적으로 반응성인 것이다. 용어 "폴리펩티드", "펩티드" 및 "단백질"은 또한 글리코실화, 지질 부착, 황산화, 글루탐산 잔기의 감마-카르복실화, 수산화 및 ADP-리보실화를 포함하지만 이로 제한되지 않는 변형을 포함한다.

"코딩" 또는 "코딩하는" 서열은 단백질의 아미노산 서열, 또는 기능적 RNA, 예를 들어 tRNA 또는 rRNA를 코딩하는 유전자의 일부분이고, 구체적으로 핵산 서열이 명시된 단백질로의 번역을 위한 정보를 포함한다는 사실을 나타낸다. 단백질을 코딩하는 핵산은 핵산의 번역된 구역 내에 비-번역된 서열 (예를 들어, 인트론)을 포함할 수 있거나, 상기 개재하는 비-번역된 서열이 결여될 수 있다 (예를 들어, cDNA에서와 같이). 그에 의해 단백질이 코딩되는 정보는 코돈의 사용에 의해 구체화된다. 전형적으로, 아미노산 서열은 "보편적 (universal)" 유전자 코드를 이용하여 핵산에 의해 코딩된다. 그러나, 핵산이 그 내부에서 발현될 때 일부 식물, 동물 및 진균 미토콘드리아, 세균 미코플라스마 카프리콜럼 (Mycoplasma capricolum), 또는 섬모충 대핵에 존재하는 것과 같은 보편적 코드의 변이체가 사용될 수 있다. 핵산이 합성 방식으로 제조되거나 변경될 때, 핵산을 발현시킬 의도된 숙주의 공지의 코돈 선호도가 이용될 수 있다. 예를 들어, 본 발명의 핵산 서열은 외떡잎 및 쌍떡잎 식물 종 모두에서 발현될 수 있지만, 서열은 선호도가 상이한 것으로 나타났기 때문에 외떡잎 식물 및 쌍떡잎 식물의 특이적 코돈 선호도 및 GC 함량 선호도에 대해 변형될 수 있다.

"발현"은 구조적 RNA (rRNA, tRNA) 또는 단백질로 후속적으로 번역되는 메신저 RNA (mRNA)로의 유전자의 전사를 나타낸다.

단백질 또는 핵산에 관련하여 용어 "비-포유동물"은 예를 들어, 비-포유동물 척추동물, 예를 들어 새 (예를 들어, 닭 또는 오리) 또는 물고기, 및 비-포유동물 무척추동물을 포함하는 비-포유동물로부터 유래된 상기 화합물을 나타낸다. 비-포유동물 β-1,4-갈락토실트랜스퍼라제 (및 코딩 서열)의 매우 적합한 공급원은 닭 및 물고기이다.

단백질 또는 핵산에 관련하여 용어 "포유동물"은 포유동물, 예를 들어, 인간, 비-인간 영장류, 마우스, 돼지, 소, 염소, 고양이, 토끼, 래트, 기니아 피그, 햄스터, 말, 원숭이, 양, 왈라비, 오리너구리 또는 다른 비-인간 포유동물로부터 유래된 상기 화합물을 나타낸다.

용어 "β-1,4-갈락토실트랜스퍼라제"는 N-연결된 글리칸 상에 널리 나타나는 타입 2 사슬로부터 백본 구조의 생합성 (Galβ1 → 4GlcNAc)을 위해 요구되는 글리코실트랜스퍼라제 EC 2.4.1.38 (β-1,4-GalT1)을 나타내고, 즉, 상기 효소는 i.a. N-연결된 글리칸 상에 갈락토실화 활성을 갖는다. 각각 면역계 및 초기 배발생에서 일정 역할을 하는 시알릴 루이스 x 및 SSEA-1의 합성에서 타입 2 사슬이 특히 중요하다. 포유동물 β-1,4-갈락토실트랜스퍼라제 (예를 들어, 인간, 마우스, 래트로부터), 및 비-포유동물 종, 예를 들어 닭 및 물고기로부터의 β-1,4-갈락토실트랜스퍼라제의 동족체가 본원에서 제공된다.

본원에서 사용될 때 용어 "서열 동일성"은 2개 이상의 폴리뉴클레오티드 사이에 또는 2개 이상의 폴리펩티드 사이에 동일성의 존재를 나타낸다. 폴리뉴클레오티드 또는 폴리펩티드는 하나의 폴리뉴클레오티드 또는 폴리펩티드의 뉴클레오티드 또는 아미노산의 서열이 각각 다른 폴리뉴클레오티드 또는 폴리펩티드에 최대 대응성을 갖도록 정렬될 때 동일하면 "동일한" 서열을 갖는다. 2개 이상의 폴리뉴클레오티드 또는 폴리펩티드 사이의 서열 비교는 일반적으로 서열 유사성의 국소 구역을 확인하고 비교하기 위해 비교창 위에서 2개의 서열의 일부를 비교함으로써 수행된다. 비교창은 일반적으로 약 20 내지 200개의 연속 뉴클레오티드 또는 약 7 내지 70개의 연속 아미노산이다. 폴리뉴클레오티드 또는 폴리펩티드에 대한 "서열 동일성의 백분율", 예를 들어 50, 60, 70, 80, 90, 95, 98, 99 또는 100% 서열 동일성은 2개의 최적으로 정렬된 서열을 비교창 위에서 비교함으로써 결정할 수 있고, 여기서 비교창 내의 폴리뉴클레오티드 또는 폴리펩티드 서열의 일부는 2개의 서열의 최적 정렬을 위해 참조 서열 (부가 또는 결실을 포함하지 않는)에 비해 부가 또는 결실 (즉, 갭 (gap))을 포함할 수 있다. 백분율은 (a) 두 서열 모두에서 동일한 핵산 염기 또는 아미노산 잔기가 발생하는 위치의 수를 결정하여 매칭된 위치의 수를 얻고; (b) 매칭된 위치의 수를 비교창 내의 위치의 총수로 나누고; (c) 결과에 100을 곱하여 서열 상동성의 백분율을 얻음으로써 계산한다. 비교를 위한 서열의 최적 정렬은 공지의 알고리즘의 컴퓨터 구현에 의해, 또는 정밀검사에 의해 수행될 수 있다. 서열 상동성 또는 동일성의 비교 및 계산을 위해 서열을 정렬하기 위해 적합한 알고리즘 및 소프트웨어는 당업자에게 잘 알려져 있다. 그러한 툴 (tool)의 중요한 예는 피어슨 및 립만 (Pearson and Lipman) 탐색 기반 FASTA 및 BLAST 프로그램이고, 그의 상세내용은 문헌 ([Altschul et al (1997), Nucleic Acid Res. 25:3389-3402]; [Altschul et al (1990), J. Mol. Biol. 215: 403-10]; [Pearson and Lipman (1988), Proc. Natl. Acad. Sci. USA 85:2444-8]; [Lipman and Pearson (1985), Science 227:1435-41])에서 찾을 수 있다. 다른 적합한 프로그램은 현재 액셀리스 인크. (Accelrys Inc)를 통해 제공되는 유니버시티 오브 위스콘신 제네틱스 컴퓨터 그룹 (University of Wisconsin Genetics Computer Group, 미국 위스콘신주 매디슨)의 GCG® Wisconsin Package® 내의 PILEUP, LINEUP, GAP, BESTFIT 및 FASTA 프로그램을 포함한다. 상기 프로그램의 상세내용은 'http://www.ncbi.nlm.nih.gov/BLAST' 또는 미러 사이트 (mirror site) 및 "http://www.accelrys.com/products/gcg_wisconsin_package"를 통해 인터넷에서 이용가능하다. 따라서, 그러한 상동성 및 동일성 백분율은 공용 또는 시판 소프트웨어 패키지를 사용하여 또는 인터넷에서 컴퓨터 서버에 의해 확인할 수 있다. 용어 "동일성"은 서열이 최고 백분율의 아미노산 또는 염기의 정렬을 허용하는 갭의 도입을 요구하는 특정 위치에서 결실 또는 부가를 가질 수 있다는 사실에도 불구하고 서열들이 최적으로 정렬될 때 언급된 백분율의 목적하는 아미노산 서열 또는 핵산 서열이 참조 서열의 동일한 상대적인 위치에서 발견될 것임을 의미한다. 바람직하게는, 서열은 10 이하의 갭을 사용하여 정렬되고, 즉, 2개의 서열 내로 도입된 갭의 총수는 함께 첨가될 때 10 이하이다. 그러한 갭의 길이는 특히 중요하지 않지만, 일반적으로 10개 이하, 바람직하게는 5개 이하의 아미노산, 또는 30개, 바람직하게는 15개 이하의 염기일 것이다.

용어 "유전자 코드의 다의성 (degeneracy)"은 다수의 기능적으로 동일한 핵산이 임의의 주어진 단백질을 코딩하는 사실을 의미한다. 예를 들어, 코돈 GCA, GCC, GCG 및 GCU는 모두 아미노산 알라닌을 코딩한다. 따라서, 알라닌이 코돈에 의해 명시되는 모든 위치에서, 코돈은 코딩되는 폴리펩티드를 변경시키지 않으면서 기재된 임의의 대응하는 코돈으로 변경될 수 있다. 그러한 핵산 변이는 "침묵 변이"이다. 유전자 코드에 관련하여, 폴리펩티드를 코딩하는 본원의 모든 핵산 서열은 또한 핵산의 모든 가능한 침묵 변이를 설명한다.

"상보성 스트랜드"에서 용어 "상보성"은 핵산 스트랜드가 와슨-크릭 (Watson-Crick) 염기쌍 형성 규칙에 따라 다른 서열의 뉴클레오티드와 수소-결합된 이중체를 형성하는 뉴클레오티드의 서열을 갖는 것을 의미한다. 예를 들어, 5'-AAGGCT-3'에 대한 상보성 염기 서열은 3'-TTCCGA-5'이다.

용어 "갈락토실화된 N-연결된 글리칸"은 당단백질 내의 N-연결된 올리고당 단위의 공통 코어 (core)가 적어도 3개의 만노스 및 적어도 하나의 N-아세틸글루코사민 잔기와 함께 키토비오스 코어로 이루어지고, 비환원 단부에서 N-아세틸글루코사민 상의 적어도 하나의 갈락토스 잔기가 추가로 연장되는 것을 의미한다.

용어 "항체"는 항원 결합 형태의 항체 (예를 들어, Fab, F(ab)2)에 대한 언급을 포함한다. 용어 "항체"는 종종 분석물 (항원)을 특이적으로 결합하고 인식하는, 면역글로불린 유전자(들)에 의해 실질적으로 코딩되는 폴리펩티드 또는 그의 단편을 나타낸다. 그러나, 다양한 항체 단편이 무손상 항체의 소화의 측면에서 정의될 수 있지만, 당업자는 그러한 단편이 화학적으로 또는 재조합 DNA 방법을 이용함으로써 드 노보 (de novo) 합성될 수 있음을 이해할 것이다. 따라서, 본원에서 사용될 때, 용어 항체는 또한 항체 단편, 예를 들어 단일쇄 Fv, 키메라 항체 (즉, 상이한 종들로부터의 불변 및 가변 구역을 포함함), 인간화 항체 (즉, 비-인간 공급원으로부터의 상보성 결정 구역 (CDR)을 포함함) 및 이종컨쥬게이트 항체 (예를 들어, 이중특이적 항체)를 포함한다.

용어 "항체 중쇄 또는 경쇄"는 당업계에서 인정되는 의미로 사용된다.

용어 "기능적 단편"은 기능적 변이체 또는 기능적 유도체인 단백질의 짧아진 버전을 나타낸다. 단백질의 "기능적 변이체" 또는 "기능적 유도체"는 그의 아미노산 서열이 아미노산 서열의 변화에도 불구하고, 기능적 변이체가 당업자에게 검출가능한 원래의 단백질의 적어도 하나의 생물학적 활성의 적어도 일부를 보유하는 방식으로 하나 이상의 아미노산 잔기의 치환, 결실 및/또는 부가에 의해 원래의 단백질의 아미노산 서열로부터 유래될 수 있는 단백질이다. 기능적 변이체는 일반적으로 그가 유래되는 단백질에 적어도 50% 상동성 (바람직하게는, 아미노산 서열은 적어도 50% 동일성임), 적어도 70% 상동성 또는 적어도 90% 상동성이다. 기능적 변이체는 또한 단백질의 임의의 기능적 일부일 수 있다. 특정 실시태양에서, 기능은 갈락토실트랜스퍼라제 활성이다. 일부 실시태양에서, 아미노산 서열은 서열 2 (닭 갈락토실트랜스퍼라제의 단백질 서열) 또는 서열 14 (제브라피시 갈락토실트랜스퍼라제의 단백질 서열)와 주로 또는 단지 보존적 치환에 의해 상이하다. 일부 실시태양에서, 단백질은 서열 2 또는 서열 14와 65% 이상, 75% 이상, 85% 이상, 90% 이상, 또는 95% 이상의 서열 동일성, 특정 실시태양에서 이들 서열과 100% 동일성을 갖는 아미노산 서열을 포함한다. 본원에서 사용될 때, "기능적"은 또한 식물에서 기능적임을 포함한다.

아미노산에 관하여 사용될 때 표현 "보존적 치환"은 유사한 생화학적 특징을 갖는 아미노산에 의한 주어진 아미노산의 치환을 나타낸다. 따라서, 일부 실시태양에서, 서열 2 또는 서열 14의 서열의 아미노산이 소수성기를 갖는 경우에, 보존적 치환은 이를 또한 소수성기를 갖는 다른 아미노산으로 교체하고; 다른 그러한 생화학적 유사성은 특징적인 기가 친수성, 양이온성, 음이온성이거나 티올 또는 티오에테르를 함유하는 경우이다. 그러한 치환은 당업자에게 잘 알려져 있다 (즉, 미국 특허 5,380,712 참조). 보존적 아미노산 치환은 예를 들어 지방족 비-극성 아미노산의 집단 (Gly, Ala, Pro, Ile, Leu, Val), 극성 비하전된 아미노산 (Cys, Ser, Thr, Met, Asn, Gln)의 집단, 극성 하전된 아미노산 (Asp, Glu, Lys, Arg)의 집단 또는 방향족 아미노산 (His, Phe, Tyr, Trp)의 집단 내에서 이루어질 수 있다.

용어 "선택 마커"는 트랜스제닉 및 비-트랜스제닉 유기체의 분리를 허용하는 대사 형질을 코딩하는 폴리뉴클레오티드 서열을 나타내고, 항생제 내성의 제공을 나타낼 수 있다. 선택가능 마커는 예를 들어 aphL1 코딩된 카나마이신 내성 마커, nptII 유전자, 히그로마이신 내성을 코딩하는 유전자이다. 다른 내성 마커는 당업계에 잘 공지되어 있다. 다른 선택 마커는 예를 들어 리포터 (reporter) 유전자, 예를 들어 클로람페니콜 아세틸 트랜스퍼라제, β-갈락토시다제, 루시퍼라제 및 초록 형광 단백질이다. 리포터 유전자의 산물에 대한 확인 방법은 효소 분석 및 형광측정 분석을 포함하고 이로 제한되지 않는다. 리포터 유전자 및 그의 산물을 검출하기 위한 분석은 당업계에 공지되어 있고, 예를 들어 문헌 [Current Protocols in Molecular Biology, eds. Ausubel et al, Greene Publishing and Wiley-Interscience: New York (1987)] 및 주기적 업데이트에 설명되어 있다.

본원에서 사용될 때, 용어 "벡터"는 숙주 세포의 형질감염에서 사용되고, 그 내부로 폴리뉴클레오티드가 삽입될 수 있는 핵산에 대한 언급을 포함한다. 벡터는 종종 레플리콘 (replicon)이다. 발현 벡터는 내부에 삽입된 핵산의 전사를 허용한다.

본원에서 사용될 때, 용어 "작동가능하게 연결된"은 기재된 성분들이 그들의 의도된 방식으로 기능하는 것을 허용하는 관계로 존재하는 기능적 연결 또는 병렬 (juxtaposition)을 나타낸다. 다른 제어 서열에 및/또는 코딩 서열에 "작동가능하게 연결된" 제어 서열은 코딩 서열의 전사 및/또는 발현이 제어 서열과 상호적합한 조건 하에 달성되도록 하는 방식으로 라이게이팅된다. 일반적으로, 작동가능하게 연결된은 연결되는 핵산 서열들이 연속적이고, 2개의 단백질 코딩 구역을 연결하는 것이 필요한 경우에는 연속적이고 동일한 판독 프레임 내에 존재하는 것을 의미한다.

"숙주 세포"는 벡터를 함유하고, 벡터의 복제 및/또는 발현을 지지하는 세포를 의미한다. 숙주 세포는 원핵 세포, 예를 들어 이. 콜라이 (E. coli), 또는 진핵 세포, 예를 들어 식물, 효모, 곤충, 양서류 또는 포유동물 세포일 수 있다.

본원에서 사용될 때, 핵산에 관련하여 "이종성"은 외래종으로부터 기원하거나, 동일한 종의 것인 경우에 개입에 의해 조성 및/또는 게놈 로커스에서 그의 천연 형태로부터 변형되는 핵산을 의미한다. 예를 들어, 이종 구조 유전자에 작동가능하게 연결된 프로모터는 구조 유전자가 유래된 것과 상이한 종으로부터의 것이거나, 동일한 종의 것인 경우에, 하나 또는 둘 모두 그들의 원래의 형태로부터 변형된다. 이종 단백질은 외래종으로부터 기원할 수 있거나, 동일한 종의 것인 경우에 개입에 의해 그의 원래의 형태로부터 변형된다.

용어 "조절 서열" 또는 "제어 서열"은 코딩 서열의 발현을 위해 필요하거나 유리한 임의의 성분을 포함하도록 본원에서 사용된다. 조절 서열은 코딩 서열에 대해 천연이거나 외래일 수 있다. 그러한 조절 서열은 리더 (leader), 폴리아데닐화 서열, 프로펩티드 (propeptide) 서열, 프로모터, 신호 서열, 및 전사 터미네이터를 포함하나 이로 제한되지 않는다. 그러한 서열은 당업계에 잘 공지되어 있다. 최소한으로, 조절 서열은 프로모터, 또는 특정 프로모터 요소 및 전사 및 번역 중지 신호를 포함한다. 조절 서열에는 조절 서열과 폴리펩티드를 코딩하는 핵산 서열의 코딩 구역의 라이게이션을 용이하게 하는 특이적 제한 부위를 도입하기 위한 목적의 링커가 제공될 수 있다.

용어 "프로모터"는 RNA 폴리머라제의 결합 및 전사의 개시를 위한 DNA 서열을 함유하는 유전자의 부분을 나타내도록 당업계에서 인정되는 의미로 본원에서 사용된다. 프로모터 서열은 항상은 아니지만 일반적으로 유전자의 5' 비-코딩 구역에서 발견된다. "식물 프로모터"는 그의 기원이 식물 세포이든 아니든 식물 세포에서 전사를 개시할 수 있는 프로모터이다. 예시적인 식물 프로모터는 식물 세포에서 발현된 유전자를 포함하는 식물, 식물 바이러스 및 세균, 예를 들어 아그로박테리움 또는 리조븀 (Rhizobium)으로부터 얻은 것을 포함한다. 적합한 프로모터의 예는 콜리플라워 모자이크 바이러스의 35S 프로모터 및 그의 유도체, 페레독신 프로모터, 노팔린 합성효소 (nos), 만노핀 합성효소 (mas) 및 옥토핀 합성효소 (ocs) 프로모터 (EP 0 122 791, EP 0 126 546, EP 0 145 338), 유비퀴틴 프로모터 (EP 0 342 926), 카사바 베인 (cassava vein) 모자이크 바이러스 프로모터 및 루비스코 (Rubisco)의 짧은 하위단위에 대한 국화 (chrysanthemum) 프로모터이다.

용어 "트랜스제닉 식물 또는 식물 세포"는 그의 게놈 내에 이종 폴리뉴클레오티드를 포함하는 식물 또는 식물 세포에 대한 언급을 포함한다. 일반적으로, 이종 폴리뉴클레오티드는 게놈 내에 안정하게 통합되어, 폴리뉴클레오티드가 다음 세대로 전달된다. 이종 폴리뉴클레오티드는 게놈 내로 단독으로 또는 재조합 발현 카세트의 일부로서 통합될 수 있다. 또한, 이종 폴리뉴클레오티드가 형질전환된 식물의 게놈 내에 안정하게 통합되지 않는 것도 가능하다. 그러한 경우에, 유전자는 '일시적으로' 발현될 수 있고, 이는 발현이 주어진 시간 동안 일어나고, 그 후에 도입된 폴리뉴클레오티드가 세포로부터 상실되는 것을 의미한다. 본 발명의 목적에서, 트랜스제닉 식물 또는 식물 세포는 또한 이종 폴리펩티드를 일시적으로 발현하는 식물 또는 식물 세포를 포함한다. "트랜스제닉"은 초기에 이렇게 변경된 트랜스제닉 및 초기 트랜스제닉으로부터 유성 교배 또는 무성 증식에 의해 생성된 것을 포함하는, 그의 유전자형이 이종 핵산의 존재에 의해 변경된 임의의 세포, 세포주, 유합 조직, 식물 일부분 또는 식물을 포함하도록 본원에서 사용된다. 본원에서 사용될 때, 용어 "트랜스제닉"은 종래의 식물 육종 방법에 의한 또는 자연 발생 사건, 예를 들어 무작위 타가-수정, 비-재조합 바이러스 감염, 비-재조합 세균 형질전환, 비-재조합 전위 (transposition), 또는 자발적 돌연변이에 의한 게놈 (염색체 또는 염색체외)의 변경을 포함하지 않는다.

핵산을 세포 내로 도입시키는 문맥에서 용어 "삽입"은 "형질감염" 또는 "형질전환" 또는 "형질도입"을 의미하고, 진핵 또는 원핵 세포 내로 핵산의 포함에 대한 언급을 포함하고, 여기서 핵산은 세포의 게놈 (예를 들어, 염색체, 플라스미드, 플라스티드 또는 미토콘드리아 DNA) 내로 포함되거나, 자가 레플리콘으로 전환되거나, 일시적으로 발현될 수 있다 (예를 들어, 형질감염된 mRNA).

본원에서 사용될 때, 용어 "식물"은 전체 식물, 식물 기관 (예를 들어, 잎, 줄기, 뿌리 등), 종자 및 식물 세포 및 그의 자손체를 (이들에 대한 언급을) 포함한다. 본원에서 사용될 때, 식물 세포(들)은 종자, 배, 분열 조직 구역, 유합 조직, 잎, 뿌리, 싹, 배우체, 포자체, 화분 및 소포자를 포함하고 이로 제한되지 않는다. 일부 실시태양에서, 식물 세포는 현탁 배양으로 성장된다. 일부 실시태양에서, 식물 세포는 전체 식물을 재생할 수 있다. 본 발명의 방법에서 사용될 수 있는 식물의 종류는 일반적으로 외떡잎 및 쌍떡잎 식물을 모두 포함하는, 형질전환 기술에 적용가능한 고등 식물의 종류만큼 넓다. 식물을 언급하여 본원에서 사용될 때, 달리 명시하지 않으면 조류로부터 나무까지 전체 범위의 식물이 의도된다 . 바람직한 식물은 니코티아나 종, 바람직하게는 엔. 타바쿰 또는 엔. 벤타미아나 (N. benthamiana)이다.

용어 "특이적으로 인식하는"은 항체와 항체의 항원 결합 부위에 의해 인식되는 에피토프를 갖는 단백질 사이의 결합 반응에 대한 언급을 포함한다. 상기 결합 반응은 단백질 및 다른 생물학제의 이종 집단의 존재 사이에서 인식된 에피토프를 갖는 단백질의 존재를 결정한다. 따라서, 지정된 면역분석 조건 하에, 명시된 항체는 샘플 내에 존재하는 에피토프가 결핍되는 실질적으로 모든 분석물에 대해서보다 실질적으로 더 큰 정도 (예를 들어, 배경에 비해 적어도 2배)로 인식된 에피토프를 갖는 분석물에 결합한다. 그러한 조건 하에 항체에 대한 특이적 결합은 특정 항원에 대한 그의 특이성에 대해 선택되는 항체를 필요로 할 수 있다. 예를 들어, 본원에 기재된 폴리펩티드, 예를 들어, 서열 2, 4, 7, 9, 11, 14, 16, 18 및 20에 대해 생성된 항체가 이들 폴리펩티드를 특이적으로 인식하는 항체를 얻기 위해 선택될 수 있다. 면역원으로서 사용되는 단백질 또는 폴리펩티드는 천연 입체형태로 존재하거나 선형 에피토프를 제공하도록 변성될 수 있다. 특정 단백질 (또는 다른 분석물)을 특이적으로 인식하는 항체를 선택하기 위해 다양한 면역분석 형식이 이용될 수 있다. 예를 들어, 고체상 ELISA 면역분석이 단백질과 특이적 면역반응성인 모노클로날 항체를 선택하기 위해 일상적으로 사용된다. 선택적 반응성을 결정하기 위해 사용될 수 있는 면역분석 형식 및 조건의 설명에 대해서는 문헌 [Harlow 및 Lane, Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, New York (1988)]을 참조한다.

핵산 분자 및 세포성 발현 시스템

본원에 기재된 폴리펩티드를 코딩하는 핵산 분자는 임의의 세포성 발현 시스템, 예를 들어 식물, 효모, 세균, 비-포유동물 및 포유동물 세포성 발현 시스템 내에서 발현될 수 있지만, 핵산 분자는 바람직하게는 현탁액에서 성장될 수 있는 식물 또는 식물 세포 내에서 발현된다.

일부 실시태양에서, 본 발명은 N-글리칸 생합성을 제공하는 기능적 단백질을 포함하는 식물 또는 식물 세포를 제공하고, 여기서 단백질은 예를 들어, 닭 또는 물고기 기원으로부터의 비-포유동물 β-1,4-갈락토실트랜스퍼라제이다. 다른 실시태양에서, 상기 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 N-말단에서 효소의 의도된 기능을 가능하게 하도록 골지 기관에 관한 국재화를 용이하게 하는 N-말단 연장부 서열로 연장된다. N-말단 연장부 서열은 일반적으로 골지-국재화 신호 서열을 포함하는 세포기질 테일 및 막횡단 도메인으로 이루어진다. 그러한 N-말단 서열 ("CTS"로서 지정함)은 포유동물 β-1,4-갈락토실트랜스퍼라제로부터, 포유동물 시알릴트랜스퍼라제로부터, 또는 임의의 다른 골지체에 국재화된 단백질로부터 유래되고, 예를 들어, 닭 또는 물고기 기원으로부터의 비-포유동물 GalT의 촉매 도메인에 융합되고, 식물 세포 또는 식물 내에서 발현될 수 있다.

글리코실트랜스퍼라제의 N-말단 세포질, 막횡단 구역 (본원에서 CTS 구역으로서 칭함)은 ER 또는 골지 막에 효소의 국재화를 결정한다. 천연 또는 바람직한 글리코실화를 제공하기 위해, 글리코실트랜스퍼라제는 포유동물에서 발생하는 것과 마찬가지로 식물 내에서 발현될 수 있지만, 또한 2개의 상이한 글리코실트랜스퍼라제, 또는 2개의 상이한 글리코실트랜스퍼라제의 일부분 사이의 융합 단백질로서 발현될 수 있다. 그러한 경우에, 국재화는 하나의 효소에 의해 결정되고, 촉매 활성은 제2 효소에 의해 결정된다. 예로서, 래트 시알릴트랜스퍼라제의 세포질, 막횡단 및 스템 구역과, 예를 들어 서열 10 및 서열 17에 제공된 것과 같은 포유동물 갈락토실트랜스퍼라제의 촉매 도메인 사이의 융합은 갈락토실트랜스퍼라제 활성 및 시알릴트랜스퍼라제의 국재화를 갖는 효소를 제공한다.

포유동물 GalT 효소의 이용가능한 N-말단 연장부는 길이가 약 10-20개의 아미노산이고, 세포기질 테일 서열의 처음 10개의 아미노-말단 아미노산 내에 모티프 [K/R]-X-[K/R] (여기서, K/R은 라이신 또는 아르기닌 잔기를 의미하고, X는 임의의 아미노산일 수 있다)을 함유하는 것을 특징으로 한다.

특정 실시태양에서, N-말단 아미노산 서열 연장부는 인간 β-1,4-갈락토실트랜스퍼라제 폴리펩티드 1 서열의 처음 13개의 아미노산 잔기, 즉, MRLREPLLSGSAA (서열 21)를 포함한다 (도 1 참조). 다른 실시태양에서, 비-포유동물 GalT의 CTS는 또다른 골지체에 국재화된 단백질로부터의 CTS로 교체되고; 교체부는 예를 들어 래트 α-2,6-시알릴트랜스퍼라제 (Genbank 기탁 번호 M18769)로부터의 CTS로부터 유래될 수 있다.

특정 실시태양에서, 식물 세포 또는 식물은 닭 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 1)와 적어도 85% 동일한 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현한다. 다른 실시태양에서, 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 닭 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 1)에 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일하다.

특정 실시태양에서, 닭 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 1)에 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 핵산 및 그의 벡터가 제공된다.

특정 실시태양에서, 식물 세포 또는 식물은 닭 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 2)와 적어도 65% 동일한 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현한다. 다른 실시태양에서, 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 닭 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 2)에 75%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일하다.

특정 실시태양에서, 식물 세포 또는 식물은 닭 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 2)와 적어도 65% 동일하고 포유동물 연장부를 포함하는 변형된 N-말단을 포함하는 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현한다. 포유동물 연장부는 예를 들어, 인간 β-1,4-갈락토실트랜스퍼라제 폴리펩티드 1 서열의 처음 13개의 아미노산 잔기, 즉, MRLREPLLSGSAA (서열 21)를 포함할 수 있거나, 비-포유동물 GalT의 CTS는 또다른 골지체에 국재화된 단백질로부터의 CTS로 교체되고; 교체부는 예를 들어 래트 α-2,6-시알릴트랜스퍼라제 (Genbank 기탁 번호 M18769)로부터의 CTS로부터 유래될 수 있다. 다른 실시태양에서, 포유동물 연장부를 포함하는 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 닭 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 2)에 75%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일하다.

특정 실시태양에서, 닭 β-1,4-갈락토실트랜스퍼라제 핵산 서열에 관해서만, 닭 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 1)에 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한, 상기 설명된 바와 같은 포유동물 연장부 또는 변경된 CTS 구역을 포함하는 핵산 및 그의 벡터를 제공하고; 즉, 서열 동일성은 포유동물 연장부 또는 변경된 CTS 구역에 대해서는 확립되지 않는다.

특정 실시태양에서, 식물 세포 또는 식물은 제브라피시 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 13)과 적어도 85% 동일한 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현한다. 다른 실시태양에서, 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 제브라피시 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 13)에 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일하다.

특정 실시태양에서, 제브라피시 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 13)에 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 핵산 및 그의 벡터가 제공된다.

특정 실시태양에서, 식물 세포 또는 식물은 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)와 적어도 65% 동일한 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현한다. 다른 실시태양에서, 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)에 75%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일하다.

특정 실시태양에서, 식물 세포 또는 식물은 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)와 적어도 65% 동일하고 포유동물 연장부를 포함하는 변형된 N-말단을 포함하는 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 포함한다. 다른 실시태양에서, 포유동물 연장부를 포함하는 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)에 75%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일하다.

특정 실시태양에서, 식물 세포 또는 식물은 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)와 적어도 65% 동일한 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현하고, 여기서 제브라피시 β-1,4-갈락토실트랜스퍼라제의 CTS는 또다른 골지체에 국재화된 단백질로부터의 CTS로 교체된다. 다른 실시태양에서, 포유동물 연장부를 포함하는 기능적 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 제브라피시 β-1,4-갈락토실트랜스퍼라제 아미노산 서열 (서열 14)에 75%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일하다.

특정 실시태양에서, 제브라피시 β-1,4-갈락토실트랜스퍼라제 핵산 서열에 관해서만, 제브라피시 β-1,4-갈락토실트랜스퍼라제 핵산 서열 (서열 13)에 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한, 상기 설명된 바와 같은 포유동물 연장부 또는 변경된 CTS 구역을 포함하는 핵산 및 그의 벡터를 제공하고; 즉, 서열 동일성은 포유동물 연장부 또는 변경된 CTS 구역에 대해서는 확립되지 않는다.

일부 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제는 닭 또는 물고기 β-1,4-갈락토실트랜스퍼라제인 한편, N-말단 연장부는 인간 β-1,4-갈락토실트랜스퍼라제 유전자로부터 유래되거나, CTS는 래트 시알릴트랜스퍼라제로부터 유래된다. 특정 실시태양에서, 닭 β-1,4-갈락토실트랜스퍼라제는 서열 2의 아미노산 서열을 갖고, 물고기 β-1,4-갈락토실트랜스퍼라제는 제브라피시 (다니오 레리오 (Danio rerio))로부터 유래되고 서열 14의 아미노산 서열을 갖는다. 특정 실시태양에서, 효소는 각각 서열 1 및 서열 13의 핵산에 의해 코딩된다.

일부 실시태양에서, 닭 및 물고기로부터 유래된 것과 같은 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물이 제공된다. 특정 실시태양에서, 식물 세포 또는 식물은 기능적 야생형 닭 β-1,4-갈락토실트랜스퍼라제 (서열 2)를 발현한다. 일부 실시태양에서, 상기 언급된 식물 세포 또는 식물은 β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸 (즉, N-글리칸의 α-1,3-아암 (arm) 상의 비환원 단부에서 적어도 트리만노스화 키토비오스 코어, 하나의 추가의 만노스 및 갈락토실화된 GlcNAc 잔기를 포함하는 N-글리칸)을 적어도 생산한다. 특정 실시태양에서, β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸의 총량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물의 생산량보다 2배 증가된다. 다른 실시태양에서, 상기 양은 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 15배, 20배, 50배, 100배, 250배, 500배, 1000배, 또는 10,000배 증가된다.

다른 실시태양에서, 식물 세포 또는 식물은 N-말단에서 13개의 아미노산 연장부를 포함하는 닭 β-1,4-갈락토실트랜스퍼라제 (서열 9)를 발현한다. 일부 실시태양에서, 상기 언급된 식물 세포 또는 식물은 β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸을 적어도 생산한다. 특정 실시태양에서, β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸의 총량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물의 생산량보다 2배 증가된다. 다른 실시태양에서, 상기 양은 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 15배, 20배, 50배, 100배, 250배, 500배, 1000배, 또는 10,000배 증가된다.

다른 실시태양에서, 식물 세포 또는 식물은 N-말단에서 시알릴트랜스퍼라제 CTS 연장부를 포함하는 닭 β-1,4-갈락토실트랜스퍼라제 (서열 11)를 발현한다. 일부 실시태양에서, 상기 언급된 식물 세포 또는 식물은 β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸, 및 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸 (즉, 트리만노스화 키토비오스 코어에 추가로 비-환원 단부에서 적어도 하나의 갈락토실화된 GlcNAc 잔기를 갖는 N-글리칸)을 적어도 생산한다. 특정 실시태양에서, β-1,2-자일로스 및 α-1,3-푸코스 잔기가 둘다 결여되는 하이브리드형의 N-연결된 글리칸 및/또는 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸의 총량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물의 생산량보다 2배 증가된다. 다른 실시태양에서, 상기 양은 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 15배, 20배, 50배, 100배, 250배, 500배, 1000배, 또는 10,000배 증가된다.

특정 실시태양에서, 식물 세포 또는 식물은 야생형 제브라피시 β-1,4-갈락토실트랜스퍼라제 (서열 14)를 발현한다. 일부 실시태양에서, 상기 언급된 식물 세포 또는 식물은 2-안테나형 N-연결된 글리칸, 및 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸을 적어도 생산한다. 특정 실시태양에서, 2-안테나형 N-연결된 글리칸 및/또는 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸의 총량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물의 생산량보다 2배 증가된다. 다른 실시태양에서, 상기 양은 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 15배, 20배, 50배, 100배, 250배, 500배, 1000배, 또는 10,000배 증가된다.

다른 실시태양에서, 식물 세포 또는 식물은 N-말단에서 13개의 아미노산 연장부를 포함하는 제브라피시 β-1,4-갈락토실트랜스퍼라제 (서열 16)를 발현한다. 일부 실시태양에서, 상기 언급된 식물 세포 또는 식물은 2-안테나형 N-연결된 글리칸, 및 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸을 적어도 생산한다. 특정 실시태양에서, 2-안테나형 N-연결된 글리칸 및/또는 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸의 총량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물의 생산량보다 2배 증가된다. 다른 실시태양에서, 상기 양은 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 15배, 20배, 50배, 100배, 250배, 500배, 1000배, 또는 10,000배 증가된다.

다른 실시태양에서, 식물 세포 또는 식물은 N-말단에서 시알릴트랜스퍼라제 CTS 연장부를 포함하는 제브라피시 β-1,4-갈락토실트랜스퍼라제 (서열 18)를 발현한다. 일부 실시태양에서, 상기 언급된 식물 세포 또는 식물은 2-안테나형 N-연결된 글리칸, 및 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸을 적어도 생산한다. 특정 실시태양에서, 2-안테나형 N-연결된 글리칸 및/또는 적어도 하나의 갈락토실화된 GlcNAc 잔기를 포함하는 2-안테나형 N-글리칸의 총량은 야생형 인간 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물의 생산량보다 2배 증가된다. 다른 실시태양에서, 상기 양은 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 15배, 20배, 50배, 100배, 250배, 500배, 1000배, 또는 10,000배 증가된다.

특정 실시태양에서, 본원에 설명된, N-말단에서 포유동물 β-1,4-갈락토실트랜스퍼라제 1의 N-말단으로부터 유래되는 서열로 또는 포유동물 β-1,4-갈락토실트랜스퍼라제 또는 시알릴트랜스퍼라제로부터의 N-말단 CTS 서열로 연장되는 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 코딩하는 핵산은 별법으로 식물, 동물 또는 진균의 골지체에 국재화된 단백질로부터의 임의의 다른 CTS 서열로 연장될 수 있어서, 그가 C-말단에서 융합되는 비-포유동물 GalT 촉매 도메인의 트랜스 (trans)-골지 국재화된 발현을 일으킨다. 상기 핵산을 본 발명에서 제공한다.

특정 실시태양에서, 식물 세포 또는 식물은 본원에 설명된 비-포유동물 β-1,4-갈락토실트랜스퍼라제에 추가로, 제2 단백질, 바람직하게는 갈락토실화된 N-연결된 글리칸이 제공된 포유동물 단백질을 발현하여 이종 당단백질을 생산하고, 그 중 그의 N-글리칸의 β-1,4-갈락토실화, 2-안테나형 또는 별법으로 하이브리드 형태가 중요하다. 또한, 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물에서 생산되는 상기 당단백질도 본 발명에서 제공된다.

특정 실시태양에서, 상기 제2 단백질은 항체 중쇄 및/또는 경쇄 또는 그의 기능적 단편을 코딩하는 핵산으로부터 발현된다.

당업자는 전체 식물을 생성할 수 있는, 예를 들어 식물 세포와 같은 세포성 발현 시스템에서 재조합 핵산의 발현을 잘 이해한다. 세포성 발현 시스템에서 재조합 핵산의 발현을 위해 발현 벡터가 사용될 수 있다. 특정 실시태양에서, 그러한 벡터는 임의로 N-연결된 글리칸 상에 갈락토실화 활성을 갖도록 하는 방식으로 N-말단에서 연장되거나 그 자신의 CTS가 또다른 골지체에 국재화된 단백질로부터의 N-말단 CTS 서열로 교체되는 비-포유동물 β-1,4-갈락토실트랜스퍼라제 또는 그의 효소 활성 유도체 또는 일부분을 코딩하는 DNA를 포함할 것이다. 적합한 벡터는 조절 요소, 예를 들어 프로모터, 및 임의로 상기 세포성 발현 시스템 내에서 발현가능한 적어도 하나의 선택 마커를 추가로 포함할 수 있다. 발현 벡터는 글리코실화될 수 있는 포유동물 당단백질을 코딩하는 적어도 하나의 추가의 DNA를 추가로 코딩할 수 있다.

특정 실시태양에서, 정상적으로 식물 내에 존재하지 않는 N-글리칸 생합성을 제공하여, 예를 들어, N-연결된 글리칸을 갈락토스의 부가에 의해 연장하는 능력을 제공하는 기능적 비-포유동물 효소 (임의로 포유동물 GalT로부터 유래된 N-말단 연장부를 갖거나, 그 내부에서 내인성 CTS가 식물의 골지체에 국재화된 단백질로부터의 또다른 CTS로 교체된다)가 제공된 식물 또는 식물 세포를 제공한다. 특정 실시태양에서 발현은 일시적이지만, 다른 실시태양에서 비-포유동물 β-1,4-갈락토실트랜스퍼라제 또는 그의 효소 활성 유도체 또는 일부분, 및 임의로 글리코실화될 수 있는 추가의 이종 단백질의 발현이 안정적인 식물 또는 식물 세포가 제공된다. 특정 실시태양에서, 식물 세포 또는 식물에 의해 제3 단백질이 추가로 발현된다. 그러한 제3 단백질은 상기 갈락토실화된 제2 단백질의 글리코실화를 추가로 처리하는 효소일 수 있다. 특정 실시태양에서, 식물 세포 또는 식물은 이량체 또는 다량체 단백질의 단량체를 코딩하는 2개의 핵산을 포함할 수 있다. 특정 실시태양에서, 항체 경쇄 및 중쇄 또는 그의 기능적 단편 모두에 대해 또는 임의의 다른 관심있는 이량체 또는 다량체 단백질에 대해 별개의 핵산이 제공된다. 물론, 전체 단백질이 발현되는 것이 필요하지는 않다. 특정 실시태양에서, 본 발명에 따른 식물 세포 또는 식물은 상기 제2 포유동물 당단백질의 단편, 바람직하게는 기능적 단편만을 발현하고, 여기서 상기 단편은 전체 단백질의 적어도 하나의 활성을 갖고, 추가로 예를 들어 끝이 잘린 (truncated) 폴리펩티드 사슬, 또는 완전히 연장되지 않은 글리칸, 예를 들어 갈락토스만으로 연장된 글리칸을 특징으로 한다. 그러한 당단백질 또는 그의 단편은 또한 본원에서 제공된다.

식물에서 생산된 당단백질에 식물-특이적 잔기, 예를 들어 β-1,2-자일로스 및 α-1,3-푸코스 잔기를 부가하면 포유동물에서 β-1,2-자일로스 및 α-1,3-푸코스 잔기의 바람직하지 않은 항원성 및 면역원성 특징 때문에 상기 당단백질은 제약 용도에 덜 적합하게 된다. 식물에서 생산된 당단백질 상의 β-1,2-자일로스 및 α-1,3-푸코스 잔기의 수를 실질적으로 제한하기 위해 또는 이들 잔기의 완전한 결여를 달성하기 위해, 합성된 당단백질이 인간화 또는 포유동물화 특징을 나타내도록 하는 방식으로 식물 세포의 게놈을 변형시키는 전략이 요구된다.

특정 실시태양에서, 제2 단백질, 및 바람직하게는 제2 포유동물 단백질 또는 그의 기능적 단편이 자일로스 및/또는 푸코스가 없는 연장된 N-연결된 글리칸을 포함하는 식물 세포 또는 식물을 제공한다. 식물-유래 갈락토실화된 당단백질은 여전히 자일로스 및 푸코스 잔기를 함유할 수 있다. 따라서, 특정 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제 또는 본원에서 설명된 그의 변형된 형태는 효소가 골지체 내에서 천연 기질에 대해 작용하도록, 즉, N-아세틸글루코사미닐트랜스퍼라제 I, 골지-만노시다제 II 및 N-아세틸글루코사미닐트랜스퍼라제 II의 작용에 후속적으로, 및 식물에서 이들 효소가 다른 방식으로 억제되지 않으면 자일로실트랜스퍼라제 및 푸코실트랜스퍼라제의 작용에 후속적으로 또는 그의 작용 동안 작용하도록 하는 방식으로 식물에서 발현된다. 식물로부터 얻은 갈락토실화된 단백질은 본원에서 식물-유래로서 칭한다. 그러한 식물-유래 갈락토실화된 단백질도 본원에서 제공한다.

식물에서 맞춤 (tailored) 생산된 당단백질의 생산을 위한 식물의 글리코실화를 포유동물화하기 위해, 자일로실트랜스퍼라제 및 푸코실트랜스퍼라제는 녹-아웃 (knock out)되거나 침묵될 수 있고, 몇몇 포유동물 글리코실트랜스퍼라제 중 적어도 하나가 발현되어야 한다. 예를 들어, N-아세틸글루코사미닐트랜스퍼라제 I을 코딩하는 유전자에서 돌연변이된 아라비돕시스 탈리아나 돌연변이체가 완전히 생육가능하였기 때문에, 자일로실트랜스퍼라제 및 푸코실트랜스퍼라제 녹-아웃을 제공하고, 그에 의해 식물의 원치 않는 글리코실화 가능성을 감소시키는 것은 실행가능한 선택사항이다. N-아세틸글루코사미닐트랜스퍼라제 I은 복합형 글리칸의 형성을 개시하는 효소이므로, 상기 식물에는 자일로스 및 푸코스 잔기 함유 복합형 글리칸이 완전히 결여된다.

특정 실시태양에서, 비-포유동물 β-1,4-갈락토실트랜스퍼라제 또는 그의 효소 활성 유도체 또는 일부분, 글리코실화될 수 있는 추가의 이종 단백질, 및 임의로 추가로 추가의 N-글리칸 생합성을 제공하는 제3 단백질이 발현되고, 자일로스 및/또는 푸코스 부가를 담당하는 효소를 코딩하는 유전자가 녹-아웃되거나, 안티센스 또는 RNAi 기술을 이용하여 이들 유전자의 발현을 침묵시킨 식물 또는 식물 세포를 제공한다. 식물에서 유전자 녹-아웃을 위한 방법 또는 RNAi를 통한 유전자 침묵은 당업계에 잘 공지되어 있다.

RNA 간섭 (RNAi)은 번역 단계에서 또는 특이적 유전자의 전사를 방해함으로써 유전자 발현을 억제하는 메카니즘이다. 작은 간섭 RNA 스트랜드 (siRNA)는 RNAi 과정에 핵심적이고, 표적 RNA 스트랜드에 상보성인 뉴클레오티드 서열을 갖는다. 특이적 RNAi 경로 단백질, 예를 들어 다이서 (dicer) (RISC)가 siRNA에 의해 표적 메신저 RNA (mRNA)로 안내되고, 여기서 이들은 표적을 더 이상 단백질로 번역될 수 없는 보다 작은 부분으로 절단한다. RNA 간섭은 특히 식물에서 바이러스 및 다른 외래 유전 물질에 대한 면역 반응의 중요한 부분이다.

RNA 간섭은 식물 생물공학에서의 적용을 위해, 예를 들어 보다 낮은 수준의 천연 식물 독소를 생산하는 식품 식물의 공학처리에서, 토마토 식물에서 알레르겐의 수준을 감소시키도록, 및 토마토에서 식물을 식이 항산화제로 강화시키기 위해 사용되었다 ([Sunilkumar G. et al. (2006) Proc Natl Acad Sci USA 103(48): 18054-9]; [Siritunga D, Sayre R (2003) Planta 217(3): 367-73]; [Le L. et al. (2006) Plant Biotechnol J 4(2): 231-42]; [Niggeweg R. et al. (2004) Nat Biotechnol 22(6): 746-54]). 상기 기술은 식물체에서 안정하고 유전가능한 RNAi 표현형을 이용한다.

다른 실시태양에서, 자일로스 및/또는 푸코스가 없는 연장된 N-연결된 글리칸을 포함하는 당단백질을 특이적으로 분리하고 정제하는 방법을 제공한다. 요구되는 정제를 매개하기 위해 (면역) 친화도 정제 또는 크기-배제 크로마토그래피 또는 전기영동과 같은 몇몇 종류의 분리 기술이 존재한다. 그러한 방법은 당업계에 잘 공지되어 있다 (예를 들어, US 2008/0003680 참조).

당업자는 본 발명이 식물 또는 식물 세포에 제한되는 것이 아니라, 본 발명에 따른 당단백질 (본질적으로 비시알릴화된) (여기서 상기 N-연결된 글리칸은 갈락토스를 포함한다)을 생산하는 능력을 가진 동물, 진균 또는 효모와 같은 다른 유기체, 또는 포유동물 세포주 또는 곤충 세포주와 같은 세포주를 제공함을 이해할 것이다.

상업적으로 중요한 맞춤형 당단백질을 생산하는 일시적으로 또는 안정적으로 형질전환된 식물을 생성하는 것은 일부 실시태양에서, 본원에 기재된 바와 같은 N-글리코실화 변형 효소를 코딩하는 뉴클레오티드 서열 및 상업적으로 중요한 이종 당단백질을 코딩하는 유전자를 모두 포함하는 (2원) 벡터를 함유하는 아그로박테리움 균주를 식물 세포 또는 조직에 접종함으로써 확립될 수 있다. 별법으로, 일부 실시태양에서, 상업적으로 중요한 맞춤형 당단백질을 생산하는 일시적으로 또는 안정적으로 형질전환된 식물은 각각 N-글리코실화 변형 효소를 코딩하는 뉴클레오티드 서열 또는 상업적으로 중요한 이종 당단백질을 코딩하는 뉴클레오티드 서열을 포함하는 벡터를 보유하는 2개 이상의 아그로박테리움 균주의 동시 접종 (동시-형질전환)에 의해 생성될 수 있다. 별법으로, 일부 실시태양에서, 상업적으로 중요한 맞춤형 당단백질을 생산하는 일시적으로 또는 안정적으로 형질전환된 식물은 변형된 N-글리코실화를 가진 식물과 상업적으로 중요한 단백질을 코딩하는 폴리뉴클레오티드를 발현하는 식물의 (다수) 교배(들)에 의해 생성될 수 있다. 이들 모든 절차에서, 벡터는 또한 선택제에 대한 내성을 부여하는 핵산 서열을 포함할 수 있다.

N-글리코실화에 관여된 단백질, 및 상업적으로 중요한 당단백질 또는 폴리펩티드를 만족스럽게 발현시키기 위해, 뉴클레오티드 서열을 당업자에게 공지된 바와 같이 숙주 식물의 특이적 전사 및 번역 기구에 적응시킬 수 있다. 예를 들어, 코돈 사용 빈도를 개선하기 위해 코딩 구역에서 침묵 돌연변이를 도입시킬 수 있고, 관련 식물 조직에서 상기 유전자의 발현을 진행시키기 위해 특이적 프로모터를 사용할 수 있다. 적절한 시간에, 예를 들어, 식물 조직이 논밭으로부터 수확되어 제어된 조건에 놓인 후에만 발현을 보장하기 위해 발생상 조절되거나 의도한 바와 같이 도입될 수 있는 프로모터를 사용할 수 있다. 이들 모든 경우에, 글리코실화 변형 단백질 및 상업적으로 중요한 당단백질의 발현 카세트의 선택은 당단백질에 대한 목적하는 번역후 변형을 허용하도록 동일한 세포 내에서 발현되도록 하는 것이어야 한다.

특정 실시태양에서, 담배 식물, 또는 니코티아나속의 종, 바람직하게는 엔. 타바쿰 또는 엔. 벤타미아나에 관련된 식물을 제공한다. 다른 실시태양에서, 다른 비교적 용이하게 형질전환가능한 식물, 예를 들어 아라비돕시스 탈리아나, 또는 제아 메이즈 (Zea mays), 또는 그에 관련된 식물을 사용할 수 있다. 재조합 당단백질의 생산을 위해서, 개구리밥을 사용하는 것이 특정한 잇점을 제공한다. 이 식물은 일반적으로 작고, 영양 출아 (vegetative budding)를 통해 무성 방식으로 번식한다. 대부분의 개구리밥 종은 뿌리, 줄기, 꽃, 종자 및 엽상체를 포함한 훨씬 더 큰 식물의 모든 조직 및 기관을 갖는다. 개구리밥은 쉽게 수확할 수 있는 완전 용기 (full containment) 내에서 간단한 액체 용액의 표면에서 부유 식물로서 저렴하고 매우 빠르게 성장시킬 수 있다. 특정 실시태양에서, 개구리밥에는 본원에 기재된 비-포유동물 β-1,4-갈락토실트랜스퍼라제 또는 그의 변형된 버전 및/또는 상업적으로 중요한 이종 당단백질을 코딩하는 유전자가 재조합 방식으로 제공된다. 개구리밥 식물은 예를 들어 스피로델라 (Spirodella) 속, 울피아 (Wolffia) 속, 울피엘라 (Wolffiella) 속, 또는 렘나 (Lemna) 속, 렘나 마이너 (Lemna minor), 렘나 미니스쿨라 (Lemna miniscula) 및 렘나 깁바 (Lemna gibba)를 포함할 수 있다.

특정 실시태양에서, 토마토 열매에서의 발현을 제공한다. 토마토는 온실 내에서 억제되고 제어된 조건 하에 쉽게 성장시킬 수 있고, 토마토 열매 생물량은 1년 내내 막대한 양으로 연속적으로 수확할 수 있다. 관심있는 당단백질을 함유하는 수질 분획은 나머지 토마토 열매로부터 쉽게 분리할 수 있고, 이는 당단백질의 용이한 정제를 가능하게 한다. 특정 실시태양에서, 비제한적으로 옥수수의 낟알, 감자의 덩이줄기, 및 유채 또는 해바라기의 종자를 포함하는 다른 작물의 저장 기관 내에서의 발현을 제공하고, 이는 수확 및 처리 기술이 쉽게 이용가능한 기관 내에 막대한 생물량을 제공하는 매력적인 대안이다.

일부 실시태양에서, 트랜스제닉 식물을 적어도 하나의, 임의로 기능적인 비-포유동물 단백질, 예를 들어, 정상적으로 식물 내에 존재하지 않는 N-글리칸 생합성을 제공하는 효소 또는 트랜스포터 (transporter)를 포함하는 식물과 교배시키고, 상기 교잡으로부터 자손체를 수확하고, 상기 재조합 단백질을 발현하고 정상적으로 식물 내에 존재하지 않는 포유동물-유사 N-글리칸 생합성에 관여하는 기능적 비-포유동물 효소를 발현하는 목적하는 자손체 식물을 선택하는 것을 포함하는, N-연결된 글리칸을 갈락토스로 연장시키는 능력을 가진, 재조합 단백질을 발현할 수 있는 트랜스제닉 식물, 예를 들어 트랜스제닉 니코티아나 종, 바람직하게는 엔. 타바쿰 또는 엔. 벤타미아나, 아라비돕시스 탈리아나, 또는 옥수수, 감자, 토마토, 또는 개구리밥을 제공하기 위한 방법을 제공한다. 한 실시태양에서, 상기 방법은 적어도 갈락토스를 포함하는 연장된 N-연결된 글리칸을 포함하는 상기 재조합 단백질을 발현하는 목적하는 자손체 식물을 선택하는 것을 추가로 포함할 수 있다.

일부 실시태양에서, N-연결된 글리칸을 포함하는 상기 재조합 당단백질을 발현하고 포유동물-유사 N-글리칸 생합성에 관여하는 비-포유동물 효소를 발현하는 식물을 제공한다. 추가의 실시태양에서, 본 발명은 또한 목적하는 당단백질 또는 그의 기능적 단편을 생산하기 위한 트랜스제닉 식물의 용도를 제공하고, 특히, 상기 당단백질 또는 그의 기능적 단편은 적어도 갈락토스를 포함하는 연장된 N-연결된 글리칸을 포함한다.

일부 실시태양에서, N-연결된 글리칸을 갈락토스로 연장시키는 능력을 가진, 재조합 단백질을 발현할 수 있는 트랜스제닉 식물 세포의 현탁 배양액, 예를 들어 트랜스제닉 니코티아나 종, 바람직하게는 엔. 타바쿰 BY2, 다우쿠스 카로타 또는 아라비돕시스 탈리아나 세포 현탁액을 제공하기 위한 방법을 제공한다.

일부 실시태양에서, N-연결된 글리칸을 갈락토스로 연장시키는 능력을 가진, 재조합 단백질을 발현할 수 있는 트랜스제닉 이끼, 예를 들어 트랜스제닉 브리오피타에아, 바람직하게는 피스코미트렐라 파텐스, 또는 푸나리아 히그로메트리카, 케라토돈 푸르푸레우스를 제공하기 위한 방법을 제공한다.

일부 실시태양에서, 예를 들어 적어도 갈락토스를 포함하는 연장된 N-연결된 글리칸을 포함하는 목적하는 당단백질 또는 그의 기능적 단편을 얻는 방법을 제공한다. 상기 방법은 본원에 기재된 바와 같은 식물을 상기 식물이 수확가능 단계에 도달할 때까지, 예를 들어 수익성 높은 수확을 허용하기 위해 충분한 생물량이 성장될 때까지 재배한 후, 당업계에 공지된 확립된 기술로 상기 식물을 수확하고, 당업계에 공지된 확립된 기술로 상기 식물을 분별하여 분별된 식물 물질을 얻고, 상기 분별된 식물 물질로부터 상기 당단백질을 적어도 부분적으로 단리하는 것을 포함한다.

일부 실시태양에서, 예를 들어 상기 설명된 방법에 의해 수득되는 적어도 갈락토스를 포함하는 연장된 N-연결된 글리칸을 포함하는 식물-유래 당단백질 또는 그의 기능적 단편을 제공한다. 적어도 갈락토스를 포함하는 연장된 글리칸을 갖는 상기 식물-유래 당단백질은 본질적으로 식물에서 발현될 수 있는 임의의 목적하는 당단백질일 수 있다. 예를 들어, 항체, 백신, 사이토킨, FSH, TSH 및 다른 호르몬 당단백질, EPO와 같은 다른 호르몬, 안티트립신 또는 리파제와 같은 효소, NCAM과 같은 세포 부착 분자 또는 콜라겐이 식물 내에서 생산되고, 본질적으로 포유동물 글리코실화 패턴이 제공될 수 있다.

일부 실시태양에서, 본 발명은 예를 들어 항체, 호르몬, 사이토킨, 백신 항원, 효소 등을 사용한 환자 치료용의 제약 조성물의 생산을 위한, 본원에 기재된 바와 같은 상기 식물-유래 당단백질 또는 그의 기능적 단편의 용도를 제공한다. 또한, 당단백질 또는 그의 기능적 단편을 포함하는 상기 제약 조성물도 제공한다.

식물 형질전환

예를 들어 N-글리칸 생합성을 제공하는 비-포유동물 효소, 및 당단백질, 예를 들어 항체, 사이토킨, 백신, 호르몬 등과 같은 단백질의 발현은 당업계에 공지된 방법을 이용하여, 예를 들어, 아그로박테리움 매개 형질전환, 전기천공 또는 입자 폭격을 통한 안정한 발현에 의해, 또는 예를 들어 PVX와 같은 바이러스 벡터, 또는 애그로필트레이션을 이용하는 일시적 발현에 의해, 또는 당업계에 공지된 다른 방법에 의해 수행할 수 있다. 글리칸 생합성, 및/또는 글리코실화를 겪는 당단백질을 제공할 수 있는 본 발명의 글리코실트랜스퍼라제는 특정 조직 또는 기관에서의 발현을 용이하게 하기 위해 특이적 프로모터의 제어 하에 발현될 수 있다. 비-포유동물 글리코실트랜스퍼라제 및/또는 본원에 기재된 당단백질의 목적하는 폴리펩티드를 코딩하는 DNA 서열, 예를 들어 전장 단백질을 코딩하는 게놈 서열 또는 cDNA가 목적하는 식물 내로 도입될 수 있는 재조합 발현 카세트를 구성하기 위해 사용될 수 있다.

예를 들어, 서열 1, 8, 10, 13, 15 및 17과 같은 서열을 포함하는 본원에 기재된 바와 같은 단리된 핵산은 당업계에 공지된 기술에 따라 식물 내로 도입될 수 있다. 일반적으로, 식물 세포의 형질전환에 적합한 상기 설명된 바와 같은 재조합 발현 카세트가 제조된다. 이어서, 본원에 기재된 단리된 핵산은 형질전환을 위해 사용될 수 있다. 상기 방식으로, 유전자 변형 식물, 식물 세포, 식물 조직, 종자 등을 얻을 수 있다.

형질전환 프로토콜은 형질전환을 위해 표적으로 하는 식물 세포의 종류, 즉, 외떡잎식물 또는 쌍떡잎식물에 따라 변할 수 있다. 식물 세포를 형질전환시키기 위한 적합한 방법은 미세주사 (Crossway et al. (1986) Biotechniques 4:320-334), 전기천공 (Riggs et al. (1986) Proc. Natl. Acad. Sci. USA 83: 5602-5606), 아그로박테리움-매개 형질전환 (예를 들어, 미국 특허 5,981,840 (Zhao et al.); [Hinchee et al. (1988) Biotechnology 6: 915-921] 참조), 직접 유전자 전달 (Paszkowski et al. (1984) EMBO J. 3:2717-2722], 및 탄도 (ballistic) 입자 가속 (예를 들어, 미국 특허 4,945,050 (Sanford et al); [Tomes et al. (1995) "Direct DNA Transfer into Intact Plant Cells via Microprojectile Bombardment" In Gamborg and Phillips (Eds.) Plant Cell, Tissue and Organ Culture: Fundamental Methods, Springer-Verlag, Berlin (1995)]; 및 [McCabe et al. (1988) Biotechnology 6:923-926])을 포함한다.

형질전환된 세포는 종래의 방법에 따라 식물로 성장시킬 수 있다 (예를 들어, [McCormick et al. (1986) Plant Cell Reports, 5: 81-84] 참조). 이어서, 이들 식물을 성장시키고, 동일한 형질전환된 품종 또는 상이한 품종으로 수분시킬 수 있고, 목적하는 표현형 특징을 갖는 생성되는 하이브리드를 확인할 수 있다. 대상 표현형 특징이 안정적으로 유지되고 유전되는지 보장하기 위해 2개 이상의 세대를 성장시킬 수 있고, 이어서 목적하는 표현형 또는 다른 특성이 달성되는지 보장하기 위해 종자를 수확할 수 있다.

트랜스제닉 식물 재생

식물 발현 벡터를 사용하여 형질전환된 식물 세포는 표준 식물 조직 배양 기술에 따라 예를 들어, 단일 세포, 유합 조직 또는 엽 절편 (leaf disc)으로부터 재생시킬 수 있다. 거의 모든 식물로부터의 다양한 세포, 조직 및 기관이 전체 식물을 재생하기 위해 성공적으로 배양될 수 있음이 당업계에 잘 공지되어 있다. 배양된 원형질체로부터 식물의 재생은 문헌 ([Evans et al., Protoplasts Isolation and Culture, Handbook of Plant Cell Culture, Macmillan Publishing Company, New York, pp. 124-176 (1983)]; 및 [Binding, Regeneration of Plants, Plant Protoplasts, CRC Press, Boca Raton, pp. 21-73 (1985)]에 기재되어 있다.

잎 절편체 (explant)로부터 아그로박테리움에 의해 도입된 외래 유전자를 함유하는 식물의 재생은 문헌 [Horsch et al., Science, 227: 1229-1231 (1985)]에 기재된 바와 같이 달성할 수 있다. 상기 절차에서, 형질전환체는 선택제의 존재 하에 및 문헌 [Fraley et al., Proc. Natl. Acad. Sci. (U.S.A.) 80: 4803 (1983)]에 기재된 바와 같이 형질전환되는 식물 종에서 싹의 재생을 유도하는 배지 내에서 성장시킨다. 상기 절차는 전형적으로 2 내지 4주 내에 싹을 생산시키고, 이어서, 이들 형질전환체 싹을 선택제 및 세균 성장을 억제하기 위해 항생제를 함유하는 적절한 뿌리-유도 배지로 전달한다. 본 발명의 트랜스제닉 식물은 생식가능하거나 불임성일 수 있다.

재생은 또한 식물 유합 조직, 절편체, 기관 또는 그의 일부분으로부터 얻을 수 있다. 상기 재생 기술은 일반적으로 문헌 [Klee et al., Annu Rev Plant Phys. 38: 467-486 (1987)]에 기재되어 있다. 단일 식물 원형질체 또는 다양한 절편체로부터 식물의 재생은 당업계에 잘 공지되어 있다 (예를 들어, [Methods for Plant Molecular Biology, A. Weissbach and H. Weissbach, eds., Academic Press, Inc., San Diego, Calif. (1988)] 참조). 상기 재생 및 성장 과정은 형질전환체 세포 및 싹의 선택, 형질전환체 싹의 발근, 토양에서 모종의 성장의 단계를 포함한다. 옥수수 세포 배양 및 재생에 관해서는, 일반적으로 문헌 [The Maize Handbook, Freeling and Walbot, Eds., Springer, New York (1994)]; [Com and Corn Improvement, 3rd edition, Sprague and Dudley Eds., American Society of Agronomy, Madison, Wisconsin (1988)]을 참조한다.

재조합 발현 카세트는 트랜스제닉 식물 내에 안정적으로 포함되고 작동가능한 것이 확인된 후, 유성 교배에 의해 다른 식물 내로 도입될 수 있음을 당업자는 알 것이다. 교배시킬 종에 따라 임의의 많은 표준 육종 기술이 사용될 수 있다. 영양 번식되는 작물에서, 성숙한 트랜스제닉 식물은 삽목 (cutting)을 취함으로써 또는 다수의 동일한 식물을 생산하기 위해 조직 배양 기술에 의해 번식시킬 수 있다.

바람직한 트랜스제닉 식물의 선택의 이루어지고, 새로운 변종을 얻고 바람직하게는 상업적인 용도를 위해 영양 번식시킨다. 종자 번식되는 작물에서, 성숙한 트랜스제닉 식물은 자가 교배되어 동종접합성 순계 (inbred) 식물을 생산할 수 있다. 순계 식물은 새로 도입된 이종 핵산을 함유하는 종자를 생산한다. 이들 종자는 성장되어 선택된 표현형을 생성할 식물을 생산할 수 있다.

재생된 식물, 예를 들어 꽃, 종자, 잎, 가지, 열매 등으로부터 얻은 일부분은 이들 일부분이 본원에 기재된 단리된 핵산을 포함하는 세포를 포함한다면 본 발명에 포함된다. 재생된 식물의 자손체와 변이체 및 돌연변이체가 또한 이들 일부분이 도입된 핵산 서열을 포함한다면 본 발명의 범위 내에 포함된다.

선택가능 마커를 발현하는 트랜스제닉 식물을 예를 들어, 표준 면역블롯 및 DNA 검출 기술에 의해 본원에 기재된 핵산의 전달에 대해 스크리닝할 수 있다. 트랜스제닉 주는 또한 전형적으로 이종 핵산의 발현 수준에 대해 평가된다. 발현-양성 식물을 확인하고 정량하기 위해 RNA 수준에서 발현을 초기에 결정할 수 있다. RNA 분석을 위한 표준 기술을 사용할 수 있고, 이종 RNA 템플레이트만을 증폭시키기 위해 설계된 올리고뉴클레오티드 프라이머를 사용하는 PCR 증폭 분석 및 이종 핵산-특이적 프로브를 사용하는 용액 혼성화 분석을 포함한다. 이어서, RNA 양성 식물을 본원에 기재된 특이적 반응성 항체를 사용하는 웨스턴 (Western) 면역블롯 분석에 의해 단백질 발현에 대해 분석할 수 있다. 또한, 트랜스제닉 조직 내에서 발현의 부위를 국재화하기 위해 각각 이종 핵산 특이적 폴리뉴클레오티드 프로브 및 항체를 사용하여 표준 프로토콜에 따른 계내 (in situ) 혼성화 및 면역세포화학을 수행할 수 있다. 일반적으로, 가장 적절한 발현 프로필을 갖는 식물을 확인하고 선택하기 위해 도입된 핵산에 대해 많은 트랜스제닉 주가 스크리닝된다.

특정 실시태양에서, 부가된 이종 핵산에 대해 동종접합성인 트랜스제닉 식물; 즉, 2개의 부가된 핵산 서열 (염색체 쌍의 각각의 염색체 상의 동일한 로커스에서 하나의 유전자)을 함유하는 트랜스제닉 식물을 제공한다. 동종접합성 트랜스제닉 식물은 단일 첨가된 이종 핵산을 함유하는 이종접합성 트랜스제닉 식물을 유성 교배시키고 (자가수분시키고), 생산된 종자의 일부를 발아시키고, 생산된 생성되는 식물을 대조 식물 (즉, 천연, 비-트랜스제닉)에 비해 본원에 기재된 폴리뉴클레오티드의 변경된 발현에 대해 분석함으로써 얻을 수 있다. 모 식물에 대한 역교배 및 비-트랜스제닉 식물과의 이종교배가 또한 고려된다.

특정 실시태양에서, (a) 식물 또는 식물 세포의 게놈 내로 DNA의 삽입 (상기 DNA는 본원에 기재된 바와 같이 임의로 포유동물 N-말단 서열로 연장된, 비-포유동물 β-1,4-갈락토실트랜스퍼라제를 코딩하는 핵산 서열을 포함하거나, 그의 CTS가 본원에 기재된 바와 같이 또다른 골지체에 국재화된 단백질의 것으로 교체된 GalT 또는 그의 효소 활성 유도체 또는 일부분을 코딩하고, 바람직하게는 그의 N-연결된 글리칸의 갈락토실화를 요구하는 적어도 하나의 포유동물 단백질에 추가로 상기 DNA는 상기 식물 또는 상기 식물 세포 내에서 발현가능한 적어도 하나의 선택 마커를 추가로 코딩한다), (b) (a)에 따른 상기 DNA를 흡수한 트랜스제닉 식물 또는 식물 세포의 선택; 및 (c) 적합한 배양 배지 내에서 목적하는 트랜스제닉 식물 또는 목적하는 트랜스제닉 식물 세포의 배양을 포함하는, 트랜스제닉 식물 또는 트랜스제닉 식물 세포의 생산 방법을 제공한다. 당업자는 상기 단백질을 코딩하는 핵산 분자에 관련하여 용어 "갈락토실화된 N-연결된 글리칸을 포함하는 단백질"은 단지 폴리펩티드를 코딩하는 반면, 갈락토실화된 N-연결된 글리칸은 골지에서 단백질의 처리 결과임을 이해할 것이다.

일부 실시태양에서, 재조합 GalT 단백질, 및 갈락토실화된 N-연결된 글리칸을 포함하는 단백질을 발현하는 트랜스제닉 식물을 생산하기 위한 추가의 방법을 제공한다. 상기 방법은 예를 들어, 본원에 기재된 트랜스제닉 식물을 다른 식물과 교배시키고, 상기 교잡으로부터 자손체를 수확하고, 재조합 GalT 단백질을 발현하고 재조합 포유동물 당단백질, 특히 갈락토실화된 N-글리칸, 또는 그의 기능적 단편을 포함하는 단백질을 발현하는 목적하는 자손체 식물을 선택하는 것을 포함할 수 있다.

단백질의 정제

특정 실시태양에서, 목적하는 당단백질 또는 그의 기능적 단편을 얻기 위한 방법은 본원에 기재된 식물을 상기 식물이 수확가능 단계에 도달할 때까지 재배하고, 식물을 수확 및 분별하여 분별된 식물 물질을 얻고, 상기 당단백질을 상기 분별된 식물 물질로부터 적어도 부분적으로 단리하는 것을 포함한다. 특정 실시태양에서, 목적하는 당단백질 또는 그의 기능적 단편을 얻기 위한 방법은 식물 세포를 발효기 내에서 세포 배양액 내에서, 상기 세포 배양액이 수확가능 단계에 도달하거나 목적하는 당단백질이 배지로부터 수집될 수 있을 때까지 성장시키는 것을 포함한다. 예를 들어, 항체, 백신, 사이토킨 및 호르몬과 같은 본원에 기재된 당단백질은 당업자에게 잘 공지된 표준 기술에 의해 정제할 수 있다. 상기 재조합 방식으로 생산된 단백질은 직접 발현되거나 융합 단백질로서 발현될 수 있다. 재조합 단백질은 세포 용해 (예를 들어, 초음파 처리, 세포파쇄기 (French press)) 및 친화도 크로마토그래피 또는 다른 친화도-기반 방법의 조합에 의해 정제된다. 융합 생성물에 대해, 적절한 단백분해 효소를 사용하는 융합 단백질의 후속적인 소화로 목적하는 재조합 단백질을 방출시킨다.

본원에 기재된 단백질 (재조합 또는 합성)은 세제 가용화, 황산암모늄과 같은 물질을 사용한 선택적인 침전, 칼럼 크로마토그래피, 면역정제 방법 등을 포함한 당업계에 잘 공지된 표준 기술에 의해 실질적인 순도로 정제될 수 있다 (예를 들어, 문헌 [R. Scopes, Protein Purification: Principles and Practice, Springer-Verlag: New York (1982)]; [Deutscher, Guide to Protein Purification, Academic Press (1990)] 참조). 예를 들어, 항체는 본원에 기재된 바와 같은 단백질에 대해 생성될 수 있다. 이. 콜라이로부터의 정제는 미국 특허 4,511,503에 기재된 절차에 따라 수행할 수 있다. 이어서, 단백질은 단백질을 발현하는 세포로부터 단리되고, 본원에 기재된 바와 같은 표준 단백질 화학 기술에 의해 추가로 정제될 수 있다. 발현된 단백질의 검출은 당업계에 공지된 방법에 의해 달성되고, 예를 들어, 방사성 면역분석, 웨스턴 블로팅 기술 또는 면역침전을 포함한다.

[실시예]

실시예 1:

추정 비-포유동물 β1,4 GalT의 확인

β-1,4-갈락토실트랜스퍼라제 (GalT)의 패밀리는 적어도 7개의 멤버를 포함하고, 그 중 몇몇은 클로닝되었지만 단지 소수만이 특성이 결정되었다. 인간 및 소 기원의 β-1,4-갈락토실트랜스퍼라제가 가장 잘 특성이 결정되었고, N-글리칸 상의 말단 GlcNAc 잔기에 갈락토스 잔기를 β-1,4-연결로 부가할 수 있는 것으로 보였다. 상동성에 기반한 비-포유동물 종 유전자 서열 사이에서 N-글리코실화에 관여하는 추정 GalT 유전자가 확인되었다. 도 1은 포유동물 GalT 유전자 서열 (인간, 마우스 및 소) 및 비-포유동물 추정 GalT 유전자 서열 (닭, 제브라피시 및 개구리)의 Clustal W 정렬을 보여준다. 특히, 세포기질성이고 막횡단 구역 (TM, 상자표시, 점선)에 인접하고, 골지-국재화에 관여하는 것으로 추정되는 포유동물 아미노 말단 (상자표시, 실선)은 예를 들어 닭 및 제브라피시와 같은 비-포유동물 기원으로부터의 GalT 동족체 내에 보존되지 않는다 (도 1 참조).

골지-국재화는 GalT 활성에 중요한 것으로 생각되고, 이는 '후기' (아마도 트랜스-골지)일 수 있고, 이는 GalT 촉매 활성이 식물에서 예를 들어, Man-I, GnT-I, Man-II, GnT-II, XyIT 및 FucT와 같은 다른 글리코실트랜스퍼라제의 작용 후에 일어나 2-안테나형 N-글리칸을 생산하는 것을 의미하거나, GalT 촉매 활성은 Man-II, XyIT 및 FucT의 활성 전인 '초기' (시스 (cis)/메디알 (medial)-골지)에 일어나서 이들 효소의 활성을 방지하여, 푸코스 및 자일로스가 결여되는 식물 하이브리드형 N-글리칸을 생산할 수 있다.

예를 들어 닭 및 제브라피시로부터 유래된 비-포유동물 GalT 동족체는 특히 식물에서 외인성으로 발현될 때 N-글리칸 상의 말단 GlcNAc 잔기에 갈락토스 잔기를 β-1,4-연결로 부가하는 그들의 능력에 대해 이전에 특성이 결정되지 않았다. 2-안테나형 또는 하이브리드형 N-글리칸의 생산에 대한 상이한 포유동물 아미노 말단의 영향 (세포내 국재화에 영향을 줄 수 있는) 및 식물에서 비-포유동물 GalT 동족체에 융합되어 발현될 때 식물-특이적 푸코스 및 자일로스 잔기를 N-글리칸에 부가하는 것에 대한 효과도 조사되지 않았다.

각각의 닭 및 제브라피시에 대한 3개의 GalT 구성체를 클로닝하고, N-글리코실화 활성에 대해 시험하였다: a) 야생형의 비-포유동물 닭 및 제브라피시 β-1,4-GalT1; b) 비-포유동물 닭 및 제브라피시 β-1,4-GalT1에 대한 13개 아미노산의 보존된 포유동물 (인간) 아미노 말단 (도 1 참조) 연장부의 융합 단백질; 및 c) 닭 및 제브라피시 β-1,4-GalT1의 아미노 말단을 래트 시알릴트랜스퍼라제의 CTS로 교체한, 비-포유동물 닭 및 제브라피시 β-1,4-GalT1에 대한 래트 시알릴트랜스퍼라제 유전자로부터 유래된 포유동물 세포기질 테일 및 막횡단 도메인 (CTS)의 융합 단백질 (실시예 2 및 3 참조).

실시예 2:

전장 닭 β-1,4-GalT1 효소를 코딩하는 유전자 및 그의 변이체의 클로닝 및 발현.

추정되는 닭 β-1,4-GalT1 (GGal; GenBank 기탁 번호 U19890; SEQ Ggal, 서열 2)은 일찍이 클로닝되었지만, N-글리칸을 갈락토실화할 수 있는 것으로 밝혀지지 않았다 (Shaper et al., J Biol Chem 272, 31389-31399, 1997). 본 발명자들의 실험실에서, 잔기 114 내지 362를 포함하는 cDNA 단편 (SEQ GgGal114-362, 서열 3)을 프라이머 GgalLEEVAST 및 GgGaldw (표 1 참조)를 사용하는 RT-PCR을 이용하여 닭 비장 총 RNA로부터 증폭시켰다. C-말단을 함유하는 생성되는 단편을 Xho I 및 Bam HI로 소화시킨 후, 플라스미드 pCASeco 내로 클로닝하였고, 상기 플라스미드는 다중 클로닝 부위에 측면이 접하는 Hin dIII 및 Eco RI 부위가 사용되어 백본에서 이들 2개의 부위 및 Eco 31I-부위를 동시에 제거하면서 서열 SEQ CASeco를 삽입시킨 pUC19 유도체이다. 상기 플라스미드 pCASeco를 C-말단 GGal 단편을 수용하도록 Xho I 및 Bam HI로 소화시켜 클론 GgGalC를 생성하였다.

GGal의 N-말단을 함유하고 잔기 1 내지 113을 포함하는 cDNA 단편을 긴 올리고로부터 PCR-기반 방법을 이용하여 합성 방식으로 생산하였다. 천연 cDNA 단편의 GC-풍부 특성은 간단한 RT-PCR 클로닝을 제한하였고, 야생형 서열에 비해 아미노산 변경이 없는 상기 단편의 코돈 최적화된 버전 (SEQ GgGalsyn, 서열 6)을 야생형 GGal 아미노산 서열 (SEQ Ggal, 서열 2)를 코딩하는 유전자 (SEQ GgGalhybr, 서열 1)를 생성하도록 하는 방식으로 SEQ GgGal114-362를 코딩하는 클론 GgGalC와 조합시켰다. 이어서, SEQ GgGalhybr 하에 설명된 유전자를 출발 물질로서 사용하여 2개의 변이체를 생성하였다 (하나에서는 그의 N-말단이 전장 인간 β-1,4-GalT1 (GenBank 기탁 번호 NM_001497)의 13개의 아미노산 잔기를 코딩하는 서열로 연장되고, 다른 하나에서는 GGal의 촉매 도메인을 포함하는 잔기 40 내지 362를 코딩하는 단편이 잔기 1 내지 53을 포함하는 래트 α-2,6-시알릴트랜스퍼라제 (SialT; GenBank 기탁 번호 M18769) N-말단 도메인의 C-말단에 융합되어, 세포기질 테일, 막횡단 도메인, 및 스템 구역의 일부분을 포함한다). 래트 SialT-유래 서열은 야생형 서열에 비해 하나의 침묵 돌연변이를 함유한다.

13개의 아미노산 N-말단 연장부를 갖는 GGal을 GGal을 코딩하는 하이브리드 클론 (SEQ GgGalhybr, 서열 1)으로부터 올리고 HsGgGalstart 및 M13 정방향 프라이머 (표 1)를 사용하는 PCR을 이용하여 제조하였다. 생성되는 PCR 단편을 Bpi I 및 Xba I로 소화시키고, 마찬가지로 소화시킨 GGal 클론 내로 클로닝하였다. 생성되는 클론은 SEQ HsGGal (서열 8)을 갖는 유전자를 함유한다.

래트 SialT N-말단 도메인을 갖는 변이체는 완전 GGal을 코딩하는 클론 (SEQ GgGalhybr, 서열 1)으로부터 올리고 GgGal142 및 M13 정방향 프라이머 (표 1)를 사용하는 PCR을 이용하여 제조하였다. 생성되는 단편을 Eco 31I 및 Bam HI로 소화시키고, Nco I 및 Bam HI로 소화시킨 래트 서열을 함유하는 pCASeco 플라스미드 내로 클로닝하였다. 생성되는 클론은 SEQ sialGGal (서열 10)를 갖는 유전자를 함유한다.

3개의 상이한 GGal 유전자를 함유하는 식물 형질전환 벡터는 먼저 Eco 31I 및 Bam HI로 소화시킨 유전자를 Nco I 및 Bam HI로 소화시킨 벡터 pRAP40 내로 클로닝시켜, 유전자가 향상된 CaMV 35S 프로모터 및 AMV 번역 인핸서의 하류에 존재하도록 함으로써 제조하였다. pRAP40은 향상된 CaMV 35S 프로모터, 및 프로모터의 상류에서 Asc I 부위와 터미네이터의 하류에서 Pac I 부위와 측면이 접하는 nos 터미네이터를 함유하는 pUC19 유도체이고; 측면이 접하는 제한 부위를 포함하는 전체 카세트는 SEQ RAP40 (서열 12) 아래에 설명된다. 이어서, 프로모터, 3개의 유전자 중 하나 및 터미네이터를 포함하는 3개의 카세트의 각각을 다중 클로닝 부위의 Eco RI 및 Hin dIII 부위가 각각 Pac I 및 Asc I로 교체된 2원 벡터 pMOG22의 변형된 버전에 따로 전달하였다 (Goddijn et al., 1993, Plant J 4:863-873). 이를 위해, pRAP-유래 클론을 Pac I 및 Asc I로 소화시킨 후, Asc-Pac 소화시킨 2원 벡터 내로 클로닝시켜, 식물 형질전환을 위해 준비된 3개의 상이한 벡터를 제공하였다. 니코티아나 타바쿰의 아그로박테리움 투메파시엔스 (Agrobacterium tumefaciens)-매개 형질전환 후에, GGal 또는 그의 변이체를 발현하는 트랜스제닉 식물은 예를 들어 바커 (Bakker) 등에 의해 이전에 설명된 방법 ([Proc Natl Acad Sci U S A 98:2899-904, 2001] 및 [Proc Natl Acad Sci U S A 103:7577-82, 2006])을 사용하여 형질전환체에 의해 합성된 N-글리칸을 분석함으로써 선택하였다.

닭 유전자를 발현하는 트랜스제닉 식물로부터 정제된 N-글리칸의 MALDI-TOF 분석의 결과 (도 2를 참조하고, 도 4의 우측 칼럼 및 표 3에 요약됨)는 13개의 아미노산 연장부 (HsGGal, 서열 8) 또는 SialT-CTS (sialGGal, 서열 10) 발현을 갖는 닭 유전자 서열만이 갈락토스 잔기를 갖는 전체 2-안테나형 N-글리칸을 생산함을 보여준다. 야생형 닭 GalT 유전자의 발현은 하이브리드형 N-글리칸만을 생성시킨다. 13개 아미노산의 연장부 (HsGGal, 서열 8) 또는 SialT-CTS (sialGGal, 서열 10) 모두의 닭 GalT는 일부 하이브리드형 갈락토실화된 N-글리칸을 또한 갖는다.

특히, 3개의 상이한 GGal 유전자의 발현은 2개의 GlcNAc 잔기로 끝나는 2-안테나형 N-글리칸의 거의 완전한 결여를 일으키고 (표 3 및 도 4, 상부 패널, 우측 칼럼 참조), 대신에 하나의 갈락토스를 갖고 자일로스 및 푸코스가 둘다 결여되는 하이브리드형 갈락토실화된 N-글리칸이 특히 야생형 닭 GalT의 발현을 위해 우세하다 (도 4, 중간 패널, 우측 칼럼 참조). 상기 N-글리칸 생산의 패턴은 인간 GalT 또는 제브라피시로부터의 GalT로 형질전환된 식물에서 얻은 것과 현저하게 상이하다 (각각 표 3 및 도 4의 좌측 및 중간 칼럼 참조 및 아래 참조).

β-1,2-자일로스 및 β1,3-푸코스 잔기는 포유동물의 당단백질에 부착되지 않고, 알레르겐으로서 작용하므로, 식물-특이적 자일로스 및 푸코스 잔기의 감소, 또는 야생형 닭 GalT가 식물에서 발현될 때 하이브리드형 갈락토실화된 N-글리칸에서 보이는 것과 같은 그의 완전 결여가 예를 들어 외인성 치료 당단백질을 생산할 때 바람직하다.

실시예 3:

전장 제브라피시 β-1,4-GalT1 효소 및 그의 변이체를 코딩하는 유전자의 클로닝 및 발현.

추정 제브라피시 β-1,4-GalT1 ([Machingo et al, Dev Biol 297, 471-82, 2006]; NM_001017730)은 확인되었지만 그의 기능은 입증되지 않았고, 본 발명자들은 그러한 확인이 부정확한 것으로 생각한다. 전체 제브라피시 총 RNA로부터 출발하여, 전장 DGal 유전자 (SEQ Dgal, 서열 13)를 프라이머 DrGalup 및 DrGaldw (표 2 참조)를 사용하는 RT-PCR을 이용하여 증폭시켰다. 생성되는 단편을 Xba I 및 Bam HI로 소화시킨 후, 마찬가지로 소화시킨 플라스미드 pCASeco (상기 참조) 내로 클로닝하였다. 서열 결정 결과, 이것이 여기에 보인 바와 같은 3개의 돌연변이 (+1에서 출발하고, 비-침묵 돌연변이에 밑줄을 침), 즉 T126C, T230G, G862C에도 불구하고 비확인된 Genbank 기탁 번호 NM_001077259와 실질적으로 동일함을 보여주었다. Dgal (SEQ Dgal, 서열 14)를 공개된 추정 제브라피시 β-1,4-GalT1 ([Machingo et al, Dev Biol 297, 471-82, 2006]; NM_0017730)과 아미노산 서열 비교하면, 특히 N-말단 (골지-국재화에 관여되는 것으로 생각됨) 및 C-말단 (본 발명의 클론이 유의하게 더 길다)에서 아미노산 수준에서의 서열 상동성이 거의 없음을 보여주었다 (도 5 참조).

13개 아미노산의 N-말단 연장부를 갖는 DGal를 올리고 HsDrup 및 DrGaldw (표 2)를 사용하는 PCR을 이용하여 DGal (SEQ Dgal, 서열 13)을 코딩하는 클론으로부터 제조하였다. 생성되는 PCR 단편을 Ace I 및 Bpi I로 소화시키고, 마찬가지로 소화시킨 DGal 클론 내로 클로닝하였다. 생성되는 클론은 SEQ HsDGal (서열 15)를 갖는 유전자를 함유한다.

래트 SialT N-말단 도메인을 갖는 변이체를 완전 DGal (SEQ Dgal, 서열 13)을 코딩하는 클론으로부터 올리고 DrGal160 및 DrGaldw (표 2)를 사용하는 PCR을 이용하여 제조하였다. 생성되는 단편을 Bpi I 및 Bam HI로 소화시키고, Nco I 및 Bam HI로 소화시킨 래트 서열을 함유하는 pCASeco 플라스미드 내로 클로닝하였다. 생성되는 클론은 래트 SialT 유전자 (SEQ sialDGal, 서열 17)의 N-말단에 융합된 DGal 촉매 도메인을 함유한다.

3개의 상이한 DGal 유전자를 함유하는 식물 형질전환 벡터는 먼저 Eco 311 및 Bam HI로 소화시킨 유전자를 Nco I 및 Bam HI로 소화시킨 벡터 pRAP40 내로 클로닝시켜 유전자가 향상된 CaMV 35S 프로모터의 하류에 존재하도록 함으로써 제조하였다. 이어서, 프로모터, 3개의 유전자 중 하나 및 터미네이터를 포함하는 3개의 카세트의 각각을 다중 클로닝 부위의 Eco RI 및 Hin dIII 부위가 각각 Pac I 및 Asc I로 교체된 2원 벡터 pMOG22의 변형된 버전에 따로 전달하였다 (Goddijn et al., 1993, Plant J 4:863-873). 이를 위해, pRAP-유래 클론을 Pac I 및 Asc I로 소화시킨 후, Asc-Pac 소화시킨 2원 벡터 내로 클로닝시켜, 식물 형질전환을 위해 준비된 3개의 상이한 벡터를 제공하였다. 니코티아나 타바쿰의 아그로박테리움 투메파시엔스-매개 형질전환 후에, DGal 또는 그의 변이체를 발현하는 트랜스제닉 식물을 예를 들어 바커 등에 의해 이전에 설명된 방법 ([Proc Natl Acad Sci U S A 98:2899-904, 2001] 및 [Proc Natl Acad Sci U S A 103:7577-82, 2006])을 사용하여 형질전환체에 의해 합성된 N-글리칸을 분석함으로써 선택하였다.

제브라피시 GalT 유전자 서열을 발현하는 트랜스제닉 식물로부터 정제된 N-글리칸의 MALDI-TOF 분석 결과 (도 3을 참조하고, 도 4의 중간 칼럼 및 표 3에 요약됨)는 야생형 제브라피시 GalT 유전자 서열의 발현이 일부 하이브리드형 갈락토실화된 N-글리칸뿐만 아니라 또한 2개의 갈락토스를 갖는 완전 2-안테나형 N-글리칸을 생성시킴을 보여준다. 식물에 따라, 일부 식물은 제브라피시 야생형 GalT 유전자 서열의 발현 시에 갈락토실화된 2-안테나형 N-글리칸만을 갖는다 (도 3, 최상부 대 상부 패널로부터 2번째 참조). 이중 갈락토실화된 2-안테나형 N-글리칸의 양은 13개 아미노산의 N-말단 인간 GalT (HsDGal, 서열 15) 또는 SialT-CTS-GalT (sialDGal, 서열 17)에 의해 유의하게 증가할 수 있고, 후자는 최고량의 갈락토실화된 2-안테나형 N-글리칸을 갖는다 (표 3과 도 4의 하부 패널, 중간 칼럼 참조).

특히, 담배에서 Sial-CTS-제브라피시 GalT의 발현을 통해 얻은 이중-갈락토실화된 2-안테나형 N-글리칸의 갈락토실화는 SialT-CTS-인간 GalT에 비해 SialT-CTS-제브라피시 GalT에서 50% 증가한다 (각각 표 3과 도 4의 하부 패널, 중간 칼럼 및 좌측 칼럼 참조). Sial-CTS-제브라피시 GalT는 45%까지의 하나 이상의 갈락토스 잔기를 갖는 총 N-글리칸을 생산한다 (표 3 참조).

Sial-CTS-제브라피시 GalT가 식물에서 발현될 때 2-안테나형 N-글리칸에서 보이는 것과 같은 하나 이상의 갈락토스 잔기를 갖는 총 N-글리칸의 높은 수율은 예를 들어, 외인성 치료 당단백질을 생산할 때 바람직하다. 표 1은 실시예 1에서 사용된 올리고뉴클레오티드 (5'에서 3'으로)를 보여준다.

SEQ GgGalhybr (서열 1):

SEQ Ggal (서열 2):

SEQ GgGal114-362 (서열 3):

SEQ GgGal114-362 (서열 4):

SEQ CASeco (서열 5):

SEQ GgGalsyn (서열 6):

SEQ GgGalsyn (서열 7):

SEQ HsGGal (서열 8):

SEQ HsGgGal (서열 9):

SEQ sialGGal (서열 10):

SEQ sialGGal (서열 11):

SEQ RAP40 (서열 12):

SEQ Dgal (서열 13):

SEQ Dgal (서열 14):

SEQ HsDGal (서열 15):

SEQ HsDGal (서열 16):

SEO sialDGal (서열 17):

SEQ sialDGal (서열 18):

SEQ CTS sialT (서열 19):

SEQ CTS sialT (서열 20):

N-말단의 13개 아미노산 잔기, 인간 β-1,4-갈락토실트랜스퍼라제 1 (서열 21)

MRLREPLLSGSAA

SEQUENCE LISTING P0850.70007WO00 <110> Plant Research International B.V. <120> Mammalian-type glycosylation in plants by expression of non-mammalian glycosyltransferases <130> P80213EP00 <140> EP 07106337.4 <141> 2007-04-17 <160> 29 <170> PatentIn version 3.3 <210> 1 <211> 1089 <212> DNA <213> Gallus domesticus <220> <221> CDS <222> (1)..(1089) <400> 1 atg aag gag cca gcc ctc cca ggt aca tca ctt cag agg gct tgc agg 48 Met Lys Glu Pro Ala Leu Pro Gly Thr Ser Leu Gln Arg Ala Cys Arg 1 5 10 15 ctc ctc gtc gct ttc tgt gca ctt cac ctc tct gca act ctg ctc tac 96 Leu Leu Val Ala Phe Cys Ala Leu His Leu Ser Ala Thr Leu Leu Tyr 20 25 30 tac ctc gca ggt agt tct ctc acg cca cct aga agt cct gaa cct cca 144 Tyr Leu Ala Gly Ser Ser Leu Thr Pro Pro Arg Ser Pro Glu Pro Pro 35 40 45 cct aga cga cca cct cca gct aac ctc tct ctt cca cca tct aga cca 192 Pro Arg Arg Pro Pro Pro Ala Asn Leu Ser Leu Pro Pro Ser Arg Pro 50 55 60 cct cct cca cct gct gca cgt cca cga cct gga cct gtt tca gca caa 240 Pro Pro Pro Pro Ala Ala Arg Pro Arg Pro Gly Pro Val Ser Ala Gln 65 70 75 80 cca cgt aac ctc cca gac tct gct cca tct gga ctt tgt cct gac cct 288 Pro Arg Asn Leu Pro Asp Ser Ala Pro Ser Gly Leu Cys Pro Asp Pro 85 90 95 tct cca ctt ctc gtc gga cca ctt aga gtt gag ttc tct cag cct gtg 336 Ser Pro Leu Leu Val Gly Pro Leu Arg Val Glu Phe Ser Gln Pro Val 100 105 110 aac ctc gag gag gtg gcg agc aca aac cct gag gtc agg gag gga ggt 384 Asn Leu Glu Glu Val Ala Ser Thr Asn Pro Glu Val Arg Glu Gly Gly 115 120 125 cgt ttt gct cca aag gac tgc aag gcg ctg cag aaa gta gca atc atc 432 Arg Phe Ala Pro Lys Asp Cys Lys Ala Leu Gln Lys Val Ala Ile Ile 130 135 140 atc ccg ttc cga aac cga gag gag cat ctg aag tac tgg ctc tat tac 480 Ile Pro Phe Arg Asn Arg Glu Glu His Leu Lys Tyr Trp Leu Tyr Tyr 145 150 155 160 atg cac cca att ctt caa agg cag cag cta gat tat gga gtg tat gtc 528 Met His Pro Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val 165 170 175 atc aac cag gat gga gac gaa gaa ttt aac cgt gct aaa ctg ctg aat 576 Ile Asn Gln Asp Gly Asp Glu Glu Phe Asn Arg Ala Lys Leu Leu Asn 180 185 190 gta gga ttc acg gaa gct ttg aag gag tat gac tat gac tgc ttt gtg 624 Val Gly Phe Thr Glu Ala Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val 195 200 205 ttt agt gat gta gac ctg atc cca atg gat gac agg aac acc tac aag 672 Phe Ser Asp Val Asp Leu Ile Pro Met Asp Asp Arg Asn Thr Tyr Lys 210 215 220 tgc tac agc caa cca agg cac ctt tct gtc tcc atg gat aaa ttc gga 720 Cys Tyr Ser Gln Pro Arg His Leu Ser Val Ser Met Asp Lys Phe Gly 225 230 235 240 ttt cgg tta ccc tac aat cag tat ttt gga ggt gtg tct gcc ttg agc 768 Phe Arg Leu Pro Tyr Asn Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser 245 250 255 aaa gaa caa ttc acg aag atc aat ggg ttc cca aac aat tac tgg ggc 816 Lys Glu Gln Phe Thr Lys Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly 260 265 270 tgg gga ggc gaa gat gat gac atc tac aac agg ctg gtg ttc aaa ggc 864 Trp Gly Gly Glu Asp Asp Asp Ile Tyr Asn Arg Leu Val Phe Lys Gly 275 280 285 atg ggc ata tct cgg cca gat gct gtc att ggg aaa tgc aga atg att 912 Met Gly Ile Ser Arg Pro Asp Ala Val Ile Gly Lys Cys Arg Met Ile 290 295 300 cgc cac tcg cgt gat cgg aag aac gag ccc aac ccg gag agg ttt gac 960 Arg His Ser Arg Asp Arg Lys Asn Glu Pro Asn Pro Glu Arg Phe Asp 305 310 315 320 cgt att gct cac acc agg gag acg atg agc tct gat ggc ttg aac tcg 1008 Arg Ile Ala His Thr Arg Glu Thr Met Ser Ser Asp Gly Leu Asn Ser 325 330 335 ctc tcc tac gag gtg cta agg act gac agg ttc cct ctg tac acg agg 1056 Leu Ser Tyr Glu Val Leu Arg Thr Asp Arg Phe Pro Leu Tyr Thr Arg 340 345 350 atc aca gtg gat atc gga gcg ccc ggc agc tga 1089 Ile Thr Val Asp Ile Gly Ala Pro Gly Ser 355 360 <210> 2 <211> 362 <212> PRT <213> Gallus domesticus <400> 2 Met Lys Glu Pro Ala Leu Pro Gly Thr Ser Leu Gln Arg Ala Cys Arg 1 5 10 15 Leu Leu Val Ala Phe Cys Ala Leu His Leu Ser Ala Thr Leu Leu Tyr 20 25 30 Tyr Leu Ala Gly Ser Ser Leu Thr Pro Pro Arg Ser Pro Glu Pro Pro 35 40 45 Pro Arg Arg Pro Pro Pro Ala Asn Leu Ser Leu Pro Pro Ser Arg Pro 50 55 60 Pro Pro Pro Pro Ala Ala Arg Pro Arg Pro Gly Pro Val Ser Ala Gln 65 70 75 80 Pro Arg Asn Leu Pro Asp Ser Ala Pro Ser Gly Leu Cys Pro Asp Pro 85 90 95 Ser Pro Leu Leu Val Gly Pro Leu Arg Val Glu Phe Ser Gln Pro Val 100 105 110 Asn Leu Glu Glu Val Ala Ser Thr Asn Pro Glu Val Arg Glu Gly Gly 115 120 125 Arg Phe Ala Pro Lys Asp Cys Lys Ala Leu Gln Lys Val Ala Ile Ile 130 135 140 Ile Pro Phe Arg Asn Arg Glu Glu His Leu Lys Tyr Trp Leu Tyr Tyr 145 150 155 160 Met His Pro Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val 165 170 175 Ile Asn Gln Asp Gly Asp Glu Glu Phe Asn Arg Ala Lys Leu Leu Asn 180 185 190 Val Gly Phe Thr Glu Ala Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val 195 200 205 Phe Ser Asp Val Asp Leu Ile Pro Met Asp Asp Arg Asn Thr Tyr Lys 210 215 220 Cys Tyr Ser Gln Pro Arg His Leu Ser Val Ser Met Asp Lys Phe Gly 225 230 235 240 Phe Arg Leu Pro Tyr Asn Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser 245 250 255 Lys Glu Gln Phe Thr Lys Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly 260 265 270 Trp Gly Gly Glu Asp Asp Asp Ile Tyr Asn Arg Leu Val Phe Lys Gly 275 280 285 Met Gly Ile Ser Arg Pro Asp Ala Val Ile Gly Lys Cys Arg Met Ile 290 295 300 Arg His Ser Arg Asp Arg Lys Asn Glu Pro Asn Pro Glu Arg Phe Asp 305 310 315 320 Arg Ile Ala His Thr Arg Glu Thr Met Ser Ser Asp Gly Leu Asn Ser 325 330 335 Leu Ser Tyr Glu Val Leu Arg Thr Asp Arg Phe Pro Leu Tyr Thr Arg 340 345 350 Ile Thr Val Asp Ile Gly Ala Pro Gly Ser 355 360 <210> 3 <211> 750 <212> DNA <213> Gallus domesticus <220> <221> CDS <222> (1)..(750) <400> 3 ctc gag gag gtg gcg agc aca aac cct gag gtc agg gag gga ggt cgt 48 Leu Glu Glu Val Ala Ser Thr Asn Pro Glu Val Arg Glu Gly Gly Arg 1 5 10 15 ttt gct cca aag gac tgc aag gcg ctg cag aaa gta gca atc atc atc 96 Phe Ala Pro Lys Asp Cys Lys Ala Leu Gln Lys Val Ala Ile Ile Ile 20 25 30 ccg ttc cga aac cga gag gag cat ctg aag tac tgg ctc tat tac atg 144 Pro Phe Arg Asn Arg Glu Glu His Leu Lys Tyr Trp Leu Tyr Tyr Met 35 40 45 cac cca att ctt caa agg cag cag cta gat tat gga gtg tat gtc atc 192 His Pro Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val Ile 50 55 60 aac cag gat gga gac gaa gaa ttt aac cgt gct aaa ctg ctg aat gta 240 Asn Gln Asp Gly Asp Glu Glu Phe Asn Arg Ala Lys Leu Leu Asn Val 65 70 75 80 gga ttc acg gaa gct ttg aag gag tat gac tat gac tgc ttt gtg ttt 288 Gly Phe Thr Glu Ala Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val Phe 85 90 95 agt gat gta gac ctg atc cca atg gat gac agg aac acc tac aag tgc 336 Ser Asp Val Asp Leu Ile Pro Met Asp Asp Arg Asn Thr Tyr Lys Cys 100 105 110 tac agc caa cca agg cac ctt tct gtc tcc atg gat aaa ttc gga ttt 384 Tyr Ser Gln Pro Arg His Leu Ser Val Ser Met Asp Lys Phe Gly Phe 115 120 125 cgg tta ccc tac aat cag tat ttt gga ggt gtg tct gcc ttg agc aaa 432 Arg Leu Pro Tyr Asn Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys 130 135 140 gaa caa ttc acg aag atc aat ggg ttt cca aac aat tac tgg ggc tgg 480 Glu Gln Phe Thr Lys Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp 145 150 155 160 gga ggc gaa gat gat gac atc tac aac agg ctg gtg ttc aaa ggc atg 528 Gly Gly Glu Asp Asp Asp Ile Tyr Asn Arg Leu Val Phe Lys Gly Met 165 170 175 ggc ata tct cgg cca gat gct gtc att ggg aaa tgc aga atg att cgc 576 Gly Ile Ser Arg Pro Asp Ala Val Ile Gly Lys Cys Arg Met Ile Arg 180 185 190 cac tcg cgt gat cgg aag aac gag ccc aac ccg gag agg ttt gac cgt 624 His Ser Arg Asp Arg Lys Asn Glu Pro Asn Pro Glu Arg Phe Asp Arg 195 200 205 att gct cac acc agg gag acg atg agc tct gat ggc ttg aac tcg ctc 672 Ile Ala His Thr Arg Glu Thr Met Ser Ser Asp Gly Leu Asn Ser Leu 210 215 220 tcc tac gag gtg cta agg act gac agg ttc cct ctg tac acg agg atc 720 Ser Tyr Glu Val Leu Arg Thr Asp Arg Phe Pro Leu Tyr Thr Arg Ile 225 230 235 240 aca gtg gat atc gga gcg ccc ggc agc tga 750 Thr Val Asp Ile Gly Ala Pro Gly Ser 245 <210> 4 <211> 249 <212> PRT <213> Gallus domesticus <400> 4 Leu Glu Glu Val Ala Ser Thr Asn Pro Glu Val Arg Glu Gly Gly Arg 1 5 10 15 Phe Ala Pro Lys Asp Cys Lys Ala Leu Gln Lys Val Ala Ile Ile Ile 20 25 30 Pro Phe Arg Asn Arg Glu Glu His Leu Lys Tyr Trp Leu Tyr Tyr Met 35 40 45 His Pro Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val Ile 50 55 60 Asn Gln Asp Gly Asp Glu Glu Phe Asn Arg Ala Lys Leu Leu Asn Val 65 70 75 80 Gly Phe Thr Glu Ala Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val Phe 85 90 95 Ser Asp Val Asp Leu Ile Pro Met Asp Asp Arg Asn Thr Tyr Lys Cys 100 105 110 Tyr Ser Gln Pro Arg His Leu Ser Val Ser Met Asp Lys Phe Gly Phe 115 120 125 Arg Leu Pro Tyr Asn Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys 130 135 140 Glu Gln Phe Thr Lys Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp 145 150 155 160 Gly Gly Glu Asp Asp Asp Ile Tyr Asn Arg Leu Val Phe Lys Gly Met 165 170 175 Gly Ile Ser Arg Pro Asp Ala Val Ile Gly Lys Cys Arg Met Ile Arg 180 185 190 His Ser Arg Asp Arg Lys Asn Glu Pro Asn Pro Glu Arg Phe Asp Arg 195 200 205 Ile Ala His Thr Arg Glu Thr Met Ser Ser Asp Gly Leu Asn Ser Leu 210 215 220 Ser Tyr Glu Val Leu Arg Thr Asp Arg Phe Pro Leu Tyr Thr Arg Ile 225 230 235 240 Thr Val Asp Ile Gly Ala Pro Gly Ser 245 <210> 5 <211> 121 <212> DNA <213> Artificial <220> <223> CASeco <400> 5 ggcgcgcctc gaggcgatcg cagatctatc gatgcatgcc atggtacccg ggagctcgaa 60 ttctagaagc ttctgcagac gcgtcgacgt catatggatc cgcgagagac ctcttaatta 120 a 121 <210> 6 <211> 366 <212> DNA <213> artificial <220> <223> GGal N-terminus <220> <221> CDS <222> (22)..(366) <400> 6 ctcgaggaga ccgaagacaa c atg aag gag cca gcc ctc cca ggt aca tca 51 Met Lys Glu Pro Ala Leu Pro Gly Thr Ser 1 5 10 ctt cag agg gct tgc agg ctc ctc gtc gct ttc tgt gca ctt cac ctc 99 Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Phe Cys Ala Leu His Leu 15 20 25 tct gca act ctg ctc tac tac ctc gca ggt agt tct ctc acg cca cct 147 Ser Ala Thr Leu Leu Tyr Tyr Leu Ala Gly Ser Ser Leu Thr Pro Pro 30 35 40 aga agt cct gaa cct cca cct aga cga cca cct cca gct aac ctc tct 195 Arg Ser Pro Glu Pro Pro Pro Arg Arg Pro Pro Pro Ala Asn Leu Ser 45 50 55 ctt cca cca tct aga cca cct cct cca cct gct gca cgt cca cga cct 243 Leu Pro Pro Ser Arg Pro Pro Pro Pro Pro Ala Ala Arg Pro Arg Pro 60 65 70 gga cct gtt tca gca caa cca cgt aac ctc cca gac tct gct cca tct 291 Gly Pro Val Ser Ala Gln Pro Arg Asn Leu Pro Asp Ser Ala Pro Ser 75 80 85 90 gga ctt tgt cct gac cct tct cca ctt ctc gtc gga cca ctt aga gtt 339 Gly Leu Cys Pro Asp Pro Ser Pro Leu Leu Val Gly Pro Leu Arg Val 95 100 105 gag ttc tct cag cct gtg aac ctc gag 366 Glu Phe Ser Gln Pro Val Asn Leu Glu 110 115 <210> 7 <211> 115 <212> PRT <213> artificial <220> <223> Synthetic Construct <400> 7 Met Lys Glu Pro Ala Leu Pro Gly Thr Ser Leu Gln Arg Ala Cys Arg 1 5 10 15 Leu Leu Val Ala Phe Cys Ala Leu His Leu Ser Ala Thr Leu Leu Tyr 20 25 30 Tyr Leu Ala Gly Ser Ser Leu Thr Pro Pro Arg Ser Pro Glu Pro Pro 35 40 45 Pro Arg Arg Pro Pro Pro Ala Asn Leu Ser Leu Pro Pro Ser Arg Pro 50 55 60 Pro Pro Pro Pro Ala Ala Arg Pro Arg Pro Gly Pro Val Ser Ala Gln 65 70 75 80 Pro Arg Asn Leu Pro Asp Ser Ala Pro Ser Gly Leu Cys Pro Asp Pro 85 90 95 Ser Pro Leu Leu Val Gly Pro Leu Arg Val Glu Phe Ser Gln Pro Val 100 105 110 Asn Leu Glu 115 <210> 8 <211> 1128 <212> DNA <213> Artificial <220> <223> HsGGal <220> <221> CDS <222> (1)..(1128) <400> 8 atg agg ctt cgg gag cct ctc ctc agc ggc agc gcc gct atg aag gag 48 Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala Ala Met Lys Glu 1 5 10 15 cca gcc ctc cca ggt aca tca ctt cag agg gct tgc agg ctc ctc gtc 96 Pro Ala Leu Pro Gly Thr Ser Leu Gln Arg Ala Cys Arg Leu Leu Val 20 25 30 gct ttc tgt gca ctt cac ctc tct gca act ctg ctc tac tac ctc gca 144 Ala Phe Cys Ala Leu His Leu Ser Ala Thr Leu Leu Tyr Tyr Leu Ala 35 40 45 ggt agt tct ctc acg cca cct aga agt cct gaa cct cca cct aga cga 192 Gly Ser Ser Leu Thr Pro Pro Arg Ser Pro Glu Pro Pro Pro Arg Arg 50 55 60 cca cct cca gct aac ctc tct ctt cca cca tct aga cca cct cct cca 240 Pro Pro Pro Ala Asn Leu Ser Leu Pro Pro Ser Arg Pro Pro Pro Pro 65 70 75 80 cct gct gca cgt cca cga cct gga cct gtt tca gca caa cca cgt aac 288 Pro Ala Ala Arg Pro Arg Pro Gly Pro Val Ser Ala Gln Pro Arg Asn 85 90 95 ctc cca gac tct gct cca tct gga ctt tgt cct gac cct tct cca ctt 336 Leu Pro Asp Ser Ala Pro Ser Gly Leu Cys Pro Asp Pro Ser Pro Leu 100 105 110 ctc gtc gga cca ctt aga gtt gag ttc tct cag cct gtg aac ctc gag 384 Leu Val Gly Pro Leu Arg Val Glu Phe Ser Gln Pro Val Asn Leu Glu 115 120 125 gag gtg gcg agc aca aac cct gag gtc agg gag gga ggt cgt ttt gct 432 Glu Val Ala Ser Thr Asn Pro Glu Val Arg Glu Gly Gly Arg Phe Ala 130 135 140 cca aag gac tgc aag gcg ctg cag aaa gta gca atc atc atc ccg ttc 480 Pro Lys Asp Cys Lys Ala Leu Gln Lys Val Ala Ile Ile Ile Pro Phe 145 150 155 160 cga aac cga gag gag cat ctg aag tac tgg ctc tat tac atg cac cca 528 Arg Asn Arg Glu Glu His Leu Lys Tyr Trp Leu Tyr Tyr Met His Pro 165 170 175 att ctt caa agg cag cag cta gat tat gga gtg tat gtc atc aac cag 576 Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val Ile Asn Gln 180 185 190 gat gga gac gaa gaa ttt aac cgt gct aaa ctg ctg aat gta gga ttc 624 Asp Gly Asp Glu Glu Phe Asn Arg Ala Lys Leu Leu Asn Val Gly Phe 195 200 205 acg gaa gct ttg aag gag tat gac tat gac tgc ttt gtg ttt agt gat 672 Thr Glu Ala Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val Phe Ser Asp 210 215 220 gta gac ctg atc cca atg gat gac agg aac acc tac aag tgc tac agc 720 Val Asp Leu Ile Pro Met Asp Asp Arg Asn Thr Tyr Lys Cys Tyr Ser 225 230 235 240 caa cca agg cac ctt tct gtc tcc atg gat aaa ttc gga ttt cgg tta 768 Gln Pro Arg His Leu Ser Val Ser Met Asp Lys Phe Gly Phe Arg Leu 245 250 255 ccc tac aat cag tat ttt gga ggt gtg tct gcc ttg agc aaa gaa caa 816 Pro Tyr Asn Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys Glu Gln 260 265 270 ttc acg aag atc aat ggg ttc cca aac aat tac tgg ggc tgg gga ggc 864 Phe Thr Lys Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly 275 280 285 gaa gat gat gac atc tac aac agg ctg gtg ttc aaa ggc atg ggc ata 912 Glu Asp Asp Asp Ile Tyr Asn Arg Leu Val Phe Lys Gly Met Gly Ile 290 295 300 tct cgg cca gat gct gtc att ggg aaa tgc aga atg att cgc cac tcg 960 Ser Arg Pro Asp Ala Val Ile Gly Lys Cys Arg Met Ile Arg His Ser 305 310 315 320 cgt gat cgg aag aac gag ccc aac ccg gag agg ttt gac cgt att gct 1008 Arg Asp Arg Lys Asn Glu Pro Asn Pro Glu Arg Phe Asp Arg Ile Ala 325 330 335 cac acc agg gag acg atg agc tct gat ggc ttg aac tcg ctc tcc tac 1056 His Thr Arg Glu Thr Met Ser Ser Asp Gly Leu Asn Ser Leu Ser Tyr 340 345 350 gag gtg cta agg act gac agg ttc cct ctg tac acg agg atc aca gtg 1104 Glu Val Leu Arg Thr Asp Arg Phe Pro Leu Tyr Thr Arg Ile Thr Val 355 360 365 gat atc gga gcg ccc ggc agc tga 1128 Asp Ile Gly Ala Pro Gly Ser 370 375 <210> 9 <211> 375 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 9 Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala Ala Met Lys Glu 1 5 10 15 Pro Ala Leu Pro Gly Thr Ser Leu Gln Arg Ala Cys Arg Leu Leu Val 20 25 30 Ala Phe Cys Ala Leu His Leu Ser Ala Thr Leu Leu Tyr Tyr Leu Ala 35 40 45 Gly Ser Ser Leu Thr Pro Pro Arg Ser Pro Glu Pro Pro Pro Arg Arg 50 55 60 Pro Pro Pro Ala Asn Leu Ser Leu Pro Pro Ser Arg Pro Pro Pro Pro 65 70 75 80 Pro Ala Ala Arg Pro Arg Pro Gly Pro Val Ser Ala Gln Pro Arg Asn 85 90 95 Leu Pro Asp Ser Ala Pro Ser Gly Leu Cys Pro Asp Pro Ser Pro Leu 100 105 110 Leu Val Gly Pro Leu Arg Val Glu Phe Ser Gln Pro Val Asn Leu Glu 115 120 125 Glu Val Ala Ser Thr Asn Pro Glu Val Arg Glu Gly Gly Arg Phe Ala 130 135 140 Pro Lys Asp Cys Lys Ala Leu Gln Lys Val Ala Ile Ile Ile Pro Phe 145 150 155 160 Arg Asn Arg Glu Glu His Leu Lys Tyr Trp Leu Tyr Tyr Met His Pro 165 170 175 Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val Ile Asn Gln 180 185 190 Asp Gly Asp Glu Glu Phe Asn Arg Ala Lys Leu Leu Asn Val Gly Phe 195 200 205 Thr Glu Ala Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val Phe Ser Asp 210 215 220 Val Asp Leu Ile Pro Met Asp Asp Arg Asn Thr Tyr Lys Cys Tyr Ser 225 230 235 240 Gln Pro Arg His Leu Ser Val Ser Met Asp Lys Phe Gly Phe Arg Leu 245 250 255 Pro Tyr Asn Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys Glu Gln 260 265 270 Phe Thr Lys Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly 275 280 285 Glu Asp Asp Asp Ile Tyr Asn Arg Leu Val Phe Lys Gly Met Gly Ile 290 295 300 Ser Arg Pro Asp Ala Val Ile Gly Lys Cys Arg Met Ile Arg His Ser 305 310 315 320 Arg Asp Arg Lys Asn Glu Pro Asn Pro Glu Arg Phe Asp Arg Ile Ala 325 330 335 His Thr Arg Glu Thr Met Ser Ser Asp Gly Leu Asn Ser Leu Ser Tyr 340 345 350 Glu Val Leu Arg Thr Asp Arg Phe Pro Leu Tyr Thr Arg Ile Thr Val 355 360 365 Asp Ile Gly Ala Pro Gly Ser 370 375 <210> 10 <211> 1131 <212> DNA <213> Artificial <220> <223> sialGGal <220> <221> CDS <222> (1)..(1131) <400> 10 atg att cat acc aac ttg aag aaa aag ttc agc ctc ttc atc ctg gtc 48 Met Ile His Thr Asn Leu Lys Lys Lys Phe Ser Leu Phe Ile Leu Val 1 5 10 15 ttt ctc ctg ttc gca gtc atc tgt gtt tgg aag aaa ggg agc gac tat 96 Phe Leu Leu Phe Ala Val Ile Cys Val Trp Lys Lys Gly Ser Asp Tyr 20 25 30 gag gcc ctt aca ctg caa gcc aag gag ttc cag atg ccc aag agc cag 144 Glu Ala Leu Thr Leu Gln Ala Lys Glu Phe Gln Met Pro Lys Ser Gln 35 40 45 gag aaa gtg gcc atg acg cca cct aga agt cct gaa cct cca cct aga 192 Glu Lys Val Ala Met Thr Pro Pro Arg Ser Pro Glu Pro Pro Pro Arg 50 55 60 cga cca cct cca gct aac ctc tct ctt cca cca tct aga cca cct cct 240 Arg Pro Pro Pro Ala Asn Leu Ser Leu Pro Pro Ser Arg Pro Pro Pro 65 70 75 80 cca cct gct gca cgt cca cga cct gga cct gtt tca gca caa cca cgt 288 Pro Pro Ala Ala Arg Pro Arg Pro Gly Pro Val Ser Ala Gln Pro Arg 85 90 95 aac ctc cca gac tct gct cca tct gga ctt tgt cct gac cct tct cca 336 Asn Leu Pro Asp Ser Ala Pro Ser Gly Leu Cys Pro Asp Pro Ser Pro 100 105 110 ctt ctc gtc gga cca ctt aga gtt gag ttc tct cag cct gtg aac ctc 384 Leu Leu Val Gly Pro Leu Arg Val Glu Phe Ser Gln Pro Val Asn Leu 115 120 125 gag gag gtg gcg agc aca aac cct gag gtc agg gag gga ggt cgt ttt 432 Glu Glu Val Ala Ser Thr Asn Pro Glu Val Arg Glu Gly Gly Arg Phe 130 135 140 gct cca aag gac tgc aag gcg ctg cag aaa gta gca atc atc atc ccg 480 Ala Pro Lys Asp Cys Lys Ala Leu Gln Lys Val Ala Ile Ile Ile Pro 145 150 155 160 ttc cga aac cga gag gag cat ctg aag tac tgg ctc tat tac atg cac 528 Phe Arg Asn Arg Glu Glu His Leu Lys Tyr Trp Leu Tyr Tyr Met His 165 170 175 cca att ctt caa agg cag cag cta gat tat gga gtg tat gtc atc aac 576 Pro Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val Ile Asn 180 185 190 cag gat gga gac gaa gaa ttt aac cgt gct aaa ctg ctg aat gta gga 624 Gln Asp Gly Asp Glu Glu Phe Asn Arg Ala Lys Leu Leu Asn Val Gly 195 200 205 ttc acg gaa gct ttg aag gag tat gac tat gac tgc ttt gtg ttt agt 672 Phe Thr Glu Ala Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val Phe Ser 210 215 220 gat gta gac ctg atc cca atg gat gac agg aac acc tac aag tgc tac 720 Asp Val Asp Leu Ile Pro Met Asp Asp Arg Asn Thr Tyr Lys Cys Tyr 225 230 235 240 agc caa cca agg cac ctt tct gtc tcc atg gat aaa ttc gga ttt cgg 768 Ser Gln Pro Arg His Leu Ser Val Ser Met Asp Lys Phe Gly Phe Arg 245 250 255 tta ccc tac aat cag tat ttt gga ggt gtg tct gcc ttg agc aaa gaa 816 Leu Pro Tyr Asn Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys Glu 260 265 270 caa ttc acg aag atc aat ggg ttt cca aac aat tac tgg ggc tgg gga 864 Gln Phe Thr Lys Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly 275 280 285 ggc gaa gat gat gac atc tac aac agg ctg gtg ttc aaa ggc atg ggc 912 Gly Glu Asp Asp Asp Ile Tyr Asn Arg Leu Val Phe Lys Gly Met Gly 290 295 300 ata tct cgg cca gat gct gtc att ggg aaa tgc aga atg att cgc cac 960 Ile Ser Arg Pro Asp Ala Val Ile Gly Lys Cys Arg Met Ile Arg His 305 310 315 320 tcg cgt gat cgg aag aac gag ccc aac ccg gag agg ttt gac cgt att 1008 Ser Arg Asp Arg Lys Asn Glu Pro Asn Pro Glu Arg Phe Asp Arg Ile 325 330 335 gct cac acc agg gag acg atg agc tct gat ggc ttg aac tcg ctc tcc 1056 Ala His Thr Arg Glu Thr Met Ser Ser Asp Gly Leu Asn Ser Leu Ser 340 345 350 tac gag gtg cta agg act gac agg ttc cct ctg tac acg agg atc aca 1104 Tyr Glu Val Leu Arg Thr Asp Arg Phe Pro Leu Tyr Thr Arg Ile Thr 355 360 365 gtg gat atc gga gcg ccc ggc agc tga 1131 Val Asp Ile Gly Ala Pro Gly Ser 370 375 <210> 11 <211> 376 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 11 Met Ile His Thr Asn Leu Lys Lys Lys Phe Ser Leu Phe Ile Leu Val 1 5 10 15 Phe Leu Leu Phe Ala Val Ile Cys Val Trp Lys Lys Gly Ser Asp Tyr 20 25 30 Glu Ala Leu Thr Leu Gln Ala Lys Glu Phe Gln Met Pro Lys Ser Gln 35 40 45 Glu Lys Val Ala Met Thr Pro Pro Arg Ser Pro Glu Pro Pro Pro Arg 50 55 60 Arg Pro Pro Pro Ala Asn Leu Ser Leu Pro Pro Ser Arg Pro Pro Pro 65 70 75 80 Pro Pro Ala Ala Arg Pro Arg Pro Gly Pro Val Ser Ala Gln Pro Arg 85 90 95 Asn Leu Pro Asp Ser Ala Pro Ser Gly Leu Cys Pro Asp Pro Ser Pro 100 105 110 Leu Leu Val Gly Pro Leu Arg Val Glu Phe Ser Gln Pro Val Asn Leu 115 120 125 Glu Glu Val Ala Ser Thr Asn Pro Glu Val Arg Glu Gly Gly Arg Phe 130 135 140 Ala Pro Lys Asp Cys Lys Ala Leu Gln Lys Val Ala Ile Ile Ile Pro 145 150 155 160 Phe Arg Asn Arg Glu Glu His Leu Lys Tyr Trp Leu Tyr Tyr Met His 165 170 175 Pro Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val Ile Asn 180 185 190 Gln Asp Gly Asp Glu Glu Phe Asn Arg Ala Lys Leu Leu Asn Val Gly 195 200 205 Phe Thr Glu Ala Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val Phe Ser 210 215 220 Asp Val Asp Leu Ile Pro Met Asp Asp Arg Asn Thr Tyr Lys Cys Tyr 225 230 235 240 Ser Gln Pro Arg His Leu Ser Val Ser Met Asp Lys Phe Gly Phe Arg 245 250 255 Leu Pro Tyr Asn Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys Glu 260 265 270 Gln Phe Thr Lys Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly 275 280 285 Gly Glu Asp Asp Asp Ile Tyr Asn Arg Leu Val Phe Lys Gly Met Gly 290 295 300 Ile Ser Arg Pro Asp Ala Val Ile Gly Lys Cys Arg Met Ile Arg His 305 310 315 320 Ser Arg Asp Arg Lys Asn Glu Pro Asn Pro Glu Arg Phe Asp Arg Ile 325 330 335 Ala His Thr Arg Glu Thr Met Ser Ser Asp Gly Leu Asn Ser Leu Ser 340 345 350 Tyr Glu Val Leu Arg Thr Asp Arg Phe Pro Leu Tyr Thr Arg Ile Thr 355 360 365 Val Asp Ile Gly Ala Pro Gly Ser 370 375 <210> 12 <211> 1229 <212> DNA <213> Artificial <220> <223> cassette RAP40 <400> 12 ggcgcgccaa gcttgaatta attctactcc aaaaatatca aagatacagt ctcagaagac 60 caaagggcaa ttgagacttt tcaacaaagg gtaatatccg gaaacctcct cggattccat 120 tgcccagcta tctgtcactt tattgtgaag atagtggaaa aggaaggtgg ctcctacaaa 180 tgccatcatt gcgataaagg aaaggccatc gttgaagatg cctctgccga cagtggtccc 240 aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc aaccacgtct 300 tcaaagcaag tggattgatg tgataattcc gcatggagtc aaagattcaa atagaggacc 360 taacagaact cgccgtaaag actggcgaac agttcataca gagtctctta cgactcaatg 420 acaagaagaa aatcttcgtc aacatggtgg agcacgacac acttgtctac tccaaaaata 480 tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa agggtaatat 540 ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg aagatagtgg 600 aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc atcgttgaag 660 atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc atcgtggaaa 720 aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc tccactgacg 780 taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata taaggaagtt 840 catttcattt ggagagggtt tttattttta attttctttc aaatacttcc accatgggcg 900 agctcggtac ccggggatcc ccgggtaccg agctcgaatt tccccgatcg ttcaaacatt 960 tggcaataaa gtttcttaag attgaatcct gttgccggtc ttgcgatgat tatcatataa 1020 tttctgttga attacgttaa gcatgtaata attaacatgt aatgcatgac gttatttatg 1080 agatgggttt ttatgattag agtcccgcaa ttatacattt aatacgcgat agaaaacaaa 1140 atatagcgcg caaactagga taaattatcg cgcgcggtgt catctatgtt actagatcgg 1200 gaattccaga tctgcggccg cttaattaa 1229 <210> 13 <211> 1066 <212> DNA <213> Danio rerio <220> <221> CDS <222> (14)..(1066) <400> 13 tctagaagac aac atg ccg gac tcc acc ggg aac ttc agc ctc ctg cag 49 Met Pro Asp Ser Thr Gly Asn Phe Ser Leu Leu Gln 1 5 10 cgg acc tgc tct ctg gtg gtg ctg ctg tgc ttc tta cac atc ttt gtc 97 Arg Thr Cys Ser Leu Val Val Leu Leu Cys Phe Leu His Ile Phe Val 15 20 25 acc gtc att tac tac atg agg aac tcg gac tct cgg cca gcc ttc gcc 145 Thr Val Ile Tyr Tyr Met Arg Asn Ser Asp Ser Arg Pro Ala Phe Ala 30 35 40 cag aac cag cag cag aga ccg acg ata cac agg aaa ctg gcg gag cag 193 Gln Asn Gln Gln Gln Arg Pro Thr Ile His Arg Lys Leu Ala Glu Gln 45 50 55 60 agg ggc acc act gag gac agc aga ccc gcg gcc aac gcc tcg agc aac 241 Arg Gly Thr Thr Glu Asp Ser Arg Pro Ala Ala Asn Ala Ser Ser Asn 65 70 75 ggc cag gag ctg cag atc tgc cca gag gag ccg ccg cgc ctg gtg ggt 289 Gly Gln Glu Leu Gln Ile Cys Pro Glu Glu Pro Pro Arg Leu Val Gly 80 85 90 cct ctg cgt gtg gag ttc tca gac ccg atc acg tta gaa atg gtg cgg 337 Pro Leu Arg Val Glu Phe Ser Asp Pro Ile Thr Leu Glu Met Val Arg 95 100 105 aca gag aac agt gtt ctg caa gag ggc gga cgc ttc aga ccc cca gac 385 Thr Glu Asn Ser Val Leu Gln Glu Gly Gly Arg Phe Arg Pro Pro Asp 110 115 120 tgc ata gct cgg cag aag gtg gcc atg atc atc ccc ttc cgg aac cga 433 Cys Ile Ala Arg Gln Lys Val Ala Met Ile Ile Pro Phe Arg Asn Arg 125 130 135 140 gac gag cac ctg aag ttc tgg ctc tat tac ctg cac ccc atc ctg cag 481 Asp Glu His Leu Lys Phe Trp Leu Tyr Tyr Leu His Pro Ile Leu Gln 145 150 155 cgc caa cag ctc gac tac ggc gtc tac gtc atc aac cag gat ggc gag 529 Arg Gln Gln Leu Asp Tyr Gly Val Tyr Val Ile Asn Gln Asp Gly Glu 160 165 170 gac acg ttt aat cga gct aaa ctc ctg aac atc ggc tat gcg gag gcg 577 Asp Thr Phe Asn Arg Ala Lys Leu Leu Asn Ile Gly Tyr Ala Glu Ala 175 180 185 ctg aag gag tac gat tac gac tgt ttt gtg ttc agc gac gtg gac ctg 625 Leu Lys Glu Tyr Asp Tyr Asp Cys Phe Val Phe Ser Asp Val Asp Leu 190 195 200 atc ccg atg gat gac cgc aac atc tac aag tgc tac aat cag ccc aga 673 Ile Pro Met Asp Asp Arg Asn Ile Tyr Lys Cys Tyr Asn Gln Pro Arg 205 210 215 220 cac ctg gcc gtc tcc atg gac aag ttc ggc ttc agg ctg ccg tac aca 721 His Leu Ala Val Ser Met Asp Lys Phe Gly Phe Arg Leu Pro Tyr Thr 225 230 235 cag tat ttc ggt ggc gtt tcg tcg ctc agc aaa gag cag ttc ctg aag 769 Gln Tyr Phe Gly Gly Val Ser Ser Leu Ser Lys Glu Gln Phe Leu Lys 240 245 250 atc aac gga ttc ccc aac aac tac tgg ggc tgg ggc gga gag gac gac 817 Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp 255 260 265 gac atc ttc aac agg atc tcc tcc aga ggg atg tcg ata tct agg cct 865 Asp Ile Phe Asn Arg Ile Ser Ser Arg Gly Met Ser Ile Ser Arg Pro 270 275 280 gac gga ctc ctg ggt cgc tgt agg atg atc cgg cat gag aga gac aag 913 Asp Gly Leu Leu Gly Arg Cys Arg Met Ile Arg His Glu Arg Asp Lys 285 290 295 300 cag aac gac cca aac cct caa aga ttt gac cga atc gcg cac aca agg 961 Gln Asn Asp Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Arg 305 310 315 gaa acc atg gca act gat ggg atc aat tcg cta aaa tat aac gtg gta 1009 Glu Thr Met Ala Thr Asp Gly Ile Asn Ser Leu Lys Tyr Asn Val Val 320 325 330 aaa atc gag aaa gac ctg ctc ttc acc aaa atc aca gtg gac gtg ggc 1057 Lys Ile Glu Lys Asp Leu Leu Phe Thr Lys Ile Thr Val Asp Val Gly 335 340 345 aaa ccc tga 1066 Lys Pro 350 <210> 14 <211> 350 <212> PRT <213> Danio rerio <400> 14 Met Pro Asp Ser Thr Gly Asn Phe Ser Leu Leu Gln Arg Thr Cys Ser 1 5 10 15 Leu Val Val Leu Leu Cys Phe Leu His Ile Phe Val Thr Val Ile Tyr 20 25 30 Tyr Met Arg Asn Ser Asp Ser Arg Pro Ala Phe Ala Gln Asn Gln Gln 35 40 45 Gln Arg Pro Thr Ile His Arg Lys Leu Ala Glu Gln Arg Gly Thr Thr 50 55 60 Glu Asp Ser Arg Pro Ala Ala Asn Ala Ser Ser Asn Gly Gln Glu Leu 65 70 75 80 Gln Ile Cys Pro Glu Glu Pro Pro Arg Leu Val Gly Pro Leu Arg Val 85 90 95 Glu Phe Ser Asp Pro Ile Thr Leu Glu Met Val Arg Thr Glu Asn Ser 100 105 110 Val Leu Gln Glu Gly Gly Arg Phe Arg Pro Pro Asp Cys Ile Ala Arg 115 120 125 Gln Lys Val Ala Met Ile Ile Pro Phe Arg Asn Arg Asp Glu His Leu 130 135 140 Lys Phe Trp Leu Tyr Tyr Leu His Pro Ile Leu Gln Arg Gln Gln Leu 145 150 155 160 Asp Tyr Gly Val Tyr Val Ile Asn Gln Asp Gly Glu Asp Thr Phe Asn 165 170 175 Arg Ala Lys Leu Leu Asn Ile Gly Tyr Ala Glu Ala Leu Lys Glu Tyr 180 185 190 Asp Tyr Asp Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asp 195 200 205 Asp Arg Asn Ile Tyr Lys Cys Tyr Asn Gln Pro Arg His Leu Ala Val 210 215 220 Ser Met Asp Lys Phe Gly Phe Arg Leu Pro Tyr Thr Gln Tyr Phe Gly 225 230 235 240 Gly Val Ser Ser Leu Ser Lys Glu Gln Phe Leu Lys Ile Asn Gly Phe 245 250 255 Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn 260 265 270 Arg Ile Ser Ser Arg Gly Met Ser Ile Ser Arg Pro Asp Gly Leu Leu 275 280 285 Gly Arg Cys Arg Met Ile Arg His Glu Arg Asp Lys Gln Asn Asp Pro 290 295 300 Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Arg Glu Thr Met Ala 305 310 315 320 Thr Asp Gly Ile Asn Ser Leu Lys Tyr Asn Val Val Lys Ile Glu Lys 325 330 335 Asp Leu Leu Phe Thr Lys Ile Thr Val Asp Val Gly Lys Pro 340 345 350 <210> 15 <211> 1105 <212> DNA <213> Artificial <220> <223> HsDGal <220> <221> CDS <222> (14)..(1105) <400> 15 tctagaagac aac atg agg ctt cgg gag ccg ctc ctg agc ggc agc gcc 49 Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala 1 5 10 gcg atg ccg gac tcc acc ggg aac ttc agc ctc ctg cag cgg acc tgc 97 Ala Met Pro Asp Ser Thr Gly Asn Phe Ser Leu Leu Gln Arg Thr Cys 15 20 25 tct ctg gtg gtg ctg ctg tgc ttc tta cac atc ttt gtc acc gtc att 145 Ser Leu Val Val Leu Leu Cys Phe Leu His Ile Phe Val Thr Val Ile 30 35 40 tac tac atg agg aac tcg gac tct cgg cca gcc ttc gcc cag aac cag 193 Tyr Tyr Met Arg Asn Ser Asp Ser Arg Pro Ala Phe Ala Gln Asn Gln 45 50 55 60 cag cag aga ccg acg ata cac agg aaa ctg gcg gag cag agg ggc acc 241 Gln Gln Arg Pro Thr Ile His Arg Lys Leu Ala Glu Gln Arg Gly Thr 65 70 75 act gag gac agc aga ccc gcg gcc aac gcc tcg agc aac ggc cag gag 289 Thr Glu Asp Ser Arg Pro Ala Ala Asn Ala Ser Ser Asn Gly Gln Glu 80 85 90 ctg cag atc tgc cca gag gag ccg ccg cgc ctg gtg ggt cct ctg cgt 337 Leu Gln Ile Cys Pro Glu Glu Pro Pro Arg Leu Val Gly Pro Leu Arg 95 100 105 gtg gag ttc tca gac ccg atc acg tta gaa atg gtg cgg aca gag aac 385 Val Glu Phe Ser Asp Pro Ile Thr Leu Glu Met Val Arg Thr Glu Asn 110 115 120 agt gtt ctg caa gag ggc gga cgc ttc aga ccc cca gac tgc ata gct 433 Ser Val Leu Gln Glu Gly Gly Arg Phe Arg Pro Pro Asp Cys Ile Ala 125 130 135 140 cgg cag aag gtg gcc atg atc atc ccc ttc cgg aac cga gac gag cac 481 Arg Gln Lys Val Ala Met Ile Ile Pro Phe Arg Asn Arg Asp Glu His 145 150 155 ctg aag ttc tgg ctc tat tac ctg cac ccc atc ctg cag cgc caa cag 529 Leu Lys Phe Trp Leu Tyr Tyr Leu His Pro Ile Leu Gln Arg Gln Gln 160 165 170 ctc gac tac ggc gtc tac gtc atc aac cag gat ggc gag gac acg ttt 577 Leu Asp Tyr Gly Val Tyr Val Ile Asn Gln Asp Gly Glu Asp Thr Phe 175 180 185 aat cga gct aaa ctc ctg aac atc ggc tat gcg gag gcg ctg aag gag 625 Asn Arg Ala Lys Leu Leu Asn Ile Gly Tyr Ala Glu Ala Leu Lys Glu 190 195 200 tac gat tac gac tgt ttt gtg ttc agc gac gtg gac ctg atc ccg atg 673 Tyr Asp Tyr Asp Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met 205 210 215 220 gat gac cgc aac atc tac aag tgc tac aat cag ccc aga cac ctg gcc 721 Asp Asp Arg Asn Ile Tyr Lys Cys Tyr Asn Gln Pro Arg His Leu Ala 225 230 235 gtc tcc atg gac aag ttc ggc ttc agg ctg ccg tac aca cag tat ttc 769 Val Ser Met Asp Lys Phe Gly Phe Arg Leu Pro Tyr Thr Gln Tyr Phe 240 245 250 ggt ggc gtt tcg tcg ctc agc aaa gag cag ttc ctg aag atc aac gga 817 Gly Gly Val Ser Ser Leu Ser Lys Glu Gln Phe Leu Lys Ile Asn Gly 255 260 265 ttc ccc aac aac tac tgg ggc tgg ggc gga gag gac gac gac atc ttc 865 Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe 270 275 280 aac agg atc tcc tcc aga ggg atg tcg ata tct agg cct gac gga ctc 913 Asn Arg Ile Ser Ser Arg Gly Met Ser Ile Ser Arg Pro Asp Gly Leu 285 290 295 300 ctg ggt cgc tgt agg atg atc cgg cat gag aga gac aag cag aac gac 961 Leu Gly Arg Cys Arg Met Ile Arg His Glu Arg Asp Lys Gln Asn Asp 305 310 315 cca aac cct caa aga ttt gac cga atc gcg cac aca agg gaa acc atg 1009 Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Arg Glu Thr Met 320 325 330 gca act gat ggg atc aat tcg cta aaa tat aac gtg gta aaa atc gag 1057 Ala Thr Asp Gly Ile Asn Ser Leu Lys Tyr Asn Val Val Lys Ile Glu 335 340 345 aaa gac ctg ctc ttc acc aaa atc aca gtg gac gtg ggc aaa ccc tga 1105 Lys Asp Leu Leu Phe Thr Lys Ile Thr Val Asp Val Gly Lys Pro 350 355 360 <210> 16 <211> 363 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 16 Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala Ala Met Pro Asp 1 5 10 15 Ser Thr Gly Asn Phe Ser Leu Leu Gln Arg Thr Cys Ser Leu Val Val 20 25 30 Leu Leu Cys Phe Leu His Ile Phe Val Thr Val Ile Tyr Tyr Met Arg 35 40 45 Asn Ser Asp Ser Arg Pro Ala Phe Ala Gln Asn Gln Gln Gln Arg Pro 50 55 60 Thr Ile His Arg Lys Leu Ala Glu Gln Arg Gly Thr Thr Glu Asp Ser 65 70 75 80 Arg Pro Ala Ala Asn Ala Ser Ser Asn Gly Gln Glu Leu Gln Ile Cys 85 90 95 Pro Glu Glu Pro Pro Arg Leu Val Gly Pro Leu Arg Val Glu Phe Ser 100 105 110 Asp Pro Ile Thr Leu Glu Met Val Arg Thr Glu Asn Ser Val Leu Gln 115 120 125 Glu Gly Gly Arg Phe Arg Pro Pro Asp Cys Ile Ala Arg Gln Lys Val 130 135 140 Ala Met Ile Ile Pro Phe Arg Asn Arg Asp Glu His Leu Lys Phe Trp 145 150 155 160 Leu Tyr Tyr Leu His Pro Ile Leu Gln Arg Gln Gln Leu Asp Tyr Gly 165 170 175 Val Tyr Val Ile Asn Gln Asp Gly Glu Asp Thr Phe Asn Arg Ala Lys 180 185 190 Leu Leu Asn Ile Gly Tyr Ala Glu Ala Leu Lys Glu Tyr Asp Tyr Asp 195 200 205 Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asp Asp Arg Asn 210 215 220 Ile Tyr Lys Cys Tyr Asn Gln Pro Arg His Leu Ala Val Ser Met Asp 225 230 235 240 Lys Phe Gly Phe Arg Leu Pro Tyr Thr Gln Tyr Phe Gly Gly Val Ser 245 250 255 Ser Leu Ser Lys Glu Gln Phe Leu Lys Ile Asn Gly Phe Pro Asn Asn 260 265 270 Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn Arg Ile Ser 275 280 285 Ser Arg Gly Met Ser Ile Ser Arg Pro Asp Gly Leu Leu Gly Arg Cys 290 295 300 Arg Met Ile Arg His Glu Arg Asp Lys Gln Asn Asp Pro Asn Pro Gln 305 310 315 320 Arg Phe Asp Arg Ile Ala His Thr Arg Glu Thr Met Ala Thr Asp Gly 325 330 335 Ile Asn Ser Leu Lys Tyr Asn Val Val Lys Ile Glu Lys Asp Leu Leu 340 345 350 Phe Thr Lys Ile Thr Val Asp Val Gly Lys Pro 355 360 <210> 17 <211> 1053 <212> DNA <213> Artificial <220> <223> sialDGal <220> <221> CDS <222> (1)..(1053) <400> 17 atg att cat acc aac ttg aag aaa aag ttc agc ctc ttc atc ctg gtc 48 Met Ile His Thr Asn Leu Lys Lys Lys Phe Ser Leu Phe Ile Leu Val 1 5 10 15 ttt ctc ctg ttc gca gtc atc tgt gtt tgg aag aaa ggg agc gac tat 96 Phe Leu Leu Phe Ala Val Ile Cys Val Trp Lys Lys Gly Ser Asp Tyr 20 25 30 gag gcc ctt aca ctg caa gcc aag gag ttc cag atg ccc aag agc cag 144 Glu Ala Leu Thr Leu Gln Ala Lys Glu Phe Gln Met Pro Lys Ser Gln 35 40 45 gag aaa gtg gcc atg cac agg aaa ctg gcg gag cag agg ggc acc act 192 Glu Lys Val Ala Met His Arg Lys Leu Ala Glu Gln Arg Gly Thr Thr 50 55 60 gag gac agc aga ccc gcg gcc aac gcc tcg agc aac ggc cag gag ctg 240 Glu Asp Ser Arg Pro Ala Ala Asn Ala Ser Ser Asn Gly Gln Glu Leu 65 70 75 80 cag atc tgc cca gag gag ccg ccg cgc ctg gtg ggt cct ctg cgt gtg 288 Gln Ile Cys Pro Glu Glu Pro Pro Arg Leu Val Gly Pro Leu Arg Val 85 90 95 gag ttc tca gac ccg atc acg tta gaa atg gtg cgg aca gag aac agt 336 Glu Phe Ser Asp Pro Ile Thr Leu Glu Met Val Arg Thr Glu Asn Ser 100 105 110 gtt ctg caa gag ggc gga cgc ttc aga ccc cca gac tgc ata gct cgg 384 Val Leu Gln Glu Gly Gly Arg Phe Arg Pro Pro Asp Cys Ile Ala Arg 115 120 125 cag aag gtg gcc atg atc atc ccc ttc cgg aac cga gac gag cac ctg 432 Gln Lys Val Ala Met Ile Ile Pro Phe Arg Asn Arg Asp Glu His Leu 130 135 140 aag ttc tgg ctc tat tac ctg cac ccc atc ctg cag cgc caa cag ctc 480 Lys Phe Trp Leu Tyr Tyr Leu His Pro Ile Leu Gln Arg Gln Gln Leu 145 150 155 160 gac tac ggc gtc tac gtc atc aac cag gat ggc gag gac acg ttt aat 528 Asp Tyr Gly Val Tyr Val Ile Asn Gln Asp Gly Glu Asp Thr Phe Asn 165 170 175 cga gct aaa ctc ctg aac atc ggc tat gcg gag gcg ctg aag gag tac 576 Arg Ala Lys Leu Leu Asn Ile Gly Tyr Ala Glu Ala Leu Lys Glu Tyr 180 185 190 gat tac gac tgt ttt gtg ttc agc gac gtg gac ctg atc ccg atg gat 624 Asp Tyr Asp Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asp 195 200 205 gac cgc aac atc tac aag tgc tac aat cag ccc aga cac ctg gcc gtc 672 Asp Arg Asn Ile Tyr Lys Cys Tyr Asn Gln Pro Arg His Leu Ala Val 210 215 220 tcc atg gac aag ttc ggc ttc agg ctg ccg tac aca cag tat ttc ggt 720 Ser Met Asp Lys Phe Gly Phe Arg Leu Pro Tyr Thr Gln Tyr Phe Gly 225 230 235 240 ggc gtt tcg tcg ctc agc aaa gag cag ttc ctg aag atc aac gga ttc 768 Gly Val Ser Ser Leu Ser Lys Glu Gln Phe Leu Lys Ile Asn Gly Phe 245 250 255 ccc aac aac tac tgg ggc tgg ggc gga gag gac gac gac atc ttc aac 816 Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn 260 265 270 agg atc tcc tcc aga ggg atg tcg ata tct agg cct gac gga ctc ctg 864 Arg Ile Ser Ser Arg Gly Met Ser Ile Ser Arg Pro Asp Gly Leu Leu 275 280 285 ggt cgc tgt agg atg atc cgg cat gag aga gac aag cag aac gac cca 912 Gly Arg Cys Arg Met Ile Arg His Glu Arg Asp Lys Gln Asn Asp Pro 290 295 300 aac cct caa aga ttt gac cga atc gcg cac aca agg gaa acc atg gca 960 Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Arg Glu Thr Met Ala 305 310 315 320 act gat ggg atc aat tcg cta aaa tat aac gtg gta aaa atc gag aaa 1008 Thr Asp Gly Ile Asn Ser Leu Lys Tyr Asn Val Val Lys Ile Glu Lys 325 330 335 gac ctg ctc ttc acc aaa atc aca gtg gac gtg ggc aaa ccc tga 1053 Asp Leu Leu Phe Thr Lys Ile Thr Val Asp Val Gly Lys Pro 340 345 350 <210> 18 <211> 350 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 18 Met Ile His Thr Asn Leu Lys Lys Lys Phe Ser Leu Phe Ile Leu Val 1 5 10 15 Phe Leu Leu Phe Ala Val Ile Cys Val Trp Lys Lys Gly Ser Asp Tyr 20 25 30 Glu Ala Leu Thr Leu Gln Ala Lys Glu Phe Gln Met Pro Lys Ser Gln 35 40 45 Glu Lys Val Ala Met His Arg Lys Leu Ala Glu Gln Arg Gly Thr Thr 50 55 60 Glu Asp Ser Arg Pro Ala Ala Asn Ala Ser Ser Asn Gly Gln Glu Leu 65 70 75 80 Gln Ile Cys Pro Glu Glu Pro Pro Arg Leu Val Gly Pro Leu Arg Val 85 90 95 Glu Phe Ser Asp Pro Ile Thr Leu Glu Met Val Arg Thr Glu Asn Ser 100 105 110 Val Leu Gln Glu Gly Gly Arg Phe Arg Pro Pro Asp Cys Ile Ala Arg 115 120 125 Gln Lys Val Ala Met Ile Ile Pro Phe Arg Asn Arg Asp Glu His Leu 130 135 140 Lys Phe Trp Leu Tyr Tyr Leu His Pro Ile Leu Gln Arg Gln Gln Leu 145 150 155 160 Asp Tyr Gly Val Tyr Val Ile Asn Gln Asp Gly Glu Asp Thr Phe Asn 165 170 175 Arg Ala Lys Leu Leu Asn Ile Gly Tyr Ala Glu Ala Leu Lys Glu Tyr 180 185 190 Asp Tyr Asp Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asp 195 200 205 Asp Arg Asn Ile Tyr Lys Cys Tyr Asn Gln Pro Arg His Leu Ala Val 210 215 220 Ser Met Asp Lys Phe Gly Phe Arg Leu Pro Tyr Thr Gln Tyr Phe Gly 225 230 235 240 Gly Val Ser Ser Leu Ser Lys Glu Gln Phe Leu Lys Ile Asn Gly Phe 245 250 255 Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn 260 265 270 Arg Ile Ser Ser Arg Gly Met Ser Ile Ser Arg Pro Asp Gly Leu Leu 275 280 285 Gly Arg Cys Arg Met Ile Arg His Glu Arg Asp Lys Gln Asn Asp Pro 290 295 300 Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Arg Glu Thr Met Ala 305 310 315 320 Thr Asp Gly Ile Asn Ser Leu Lys Tyr Asn Val Val Lys Ile Glu Lys 325 330 335 Asp Leu Leu Phe Thr Lys Ile Thr Val Asp Val Gly Lys Pro 340 345 350 <210> 19 <211> 159 <212> DNA <213> Artificial <220> <223> CTSsialT <220> <221> CDS <222> (1)..(159) <400> 19 atg att cat acc aac ttg aag aaa aag ttc agc ctc ttc atc ctg gtc 48 Met Ile His Thr Asn Leu Lys Lys Lys Phe Ser Leu Phe Ile Leu Val 1 5 10 15 ttt ctc ctg ttc gca gtc atc tgt gtt tgg aag aaa ggg agc gac tat 96 Phe Leu Leu Phe Ala Val Ile Cys Val Trp Lys Lys Gly Ser Asp Tyr 20 25 30 gag gcc ctt aca ctg caa gcc aag gaa ttc cag atg ccc aag agc cag 144 Glu Ala Leu Thr Leu Gln Ala Lys Glu Phe Gln Met Pro Lys Ser Gln 35 40 45 gag aaa gtg gcc atg 159 Glu Lys Val Ala Met 50 <210> 20 <211> 53 <212> PRT <213> Artificial <220> <223> Synthetic Construct <400> 20 Met Ile His Thr Asn Leu Lys Lys Lys Phe Ser Leu Phe Ile Leu Val 1 5 10 15 Phe Leu Leu Phe Ala Val Ile Cys Val Trp Lys Lys Gly Ser Asp Tyr 20 25 30 Glu Ala Leu Thr Leu Gln Ala Lys Glu Phe Gln Met Pro Lys Ser Gln 35 40 45 Glu Lys Val Ala Met 50 <210> 21 <211> 13 <212> PRT <213> Artificial <220> <223> synthetic <400> 21 Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala Ala 1 5 10 <210> 22 <211> 30 <212> DNA <213> Artificial <220> <223> primer <400> 22 gtgacctcga ggaggtggcg agcacaaacc 30 <210> 23 <211> 34 <212> DNA <213> Artificial <220> <223> primer <400> 23 gtgacggatc cttcagctgc cgggcgctcc gata 34 <210> 24 <211> 76 <212> DNA <213> Artificial <220> <223> primer <400> 24 gtcaggtcga cgaagacaac atgaggcttc gggagcctct cctcagcggc agcgccgcta 60 tgaaggagcc agccct 76 <210> 25 <211> 36 <212> DNA <213> Artificial <220> <223> primer <400> 25 gtgacggtct cacatgacgc cacctagaag tcctga 36 <210> 26 <211> 40 <212> DNA <213> Artificial <220> <223> primer <400> 26 gtgactctag aagacaacat gccggactcc accgggaact 40 <210> 27 <211> 32 <212> DNA <213> Artificial <220> <223> primer <400> 27 gtgacggatc cttcagggtt tgcccacgtc ca 32 <210> 28 <211> 36 <212> DNA <213> Artificial <220> <223> primer <400> 28 gtgacgaaga caacatgcac aggaaactgg cggagc 36 <210> 29 <211> 73 <212> DNA <213> Artificial <220> <223> primer <400> 29 gtgactctag aagacaacat gaggcttcgg gagccgctcc tgagcggcag cgccgcgatg 60 ccggactcca ccg 73

Claims

(a) 서열 14의 제브라피시 β1,4-갈락토실트랜스퍼라제 활성 도메인을 포함하는 β1,4-갈락토실트랜스퍼라제를 코딩하는 핵산 분자를 식물 또는 식물 세포 내로 삽입하고;
(b) β1,4-갈락토실트랜스퍼라제를 발현하는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 선택하여, N-연결된 글리칸에 갈락토스 잔기를 β1,4-연결로 부가할 수 있는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하는 것
을 포함하는, N-연결된 글리칸에 갈락토스 잔기를 β1,4-연결로 부가할 수 있는 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하는 방법.
제1항에 있어서, 핵산 분자가 서열 14, 서열 16, 또는 서열 18을 코딩하는 것인 방법.
제1항에 있어서, β1,4-갈락토실트랜스퍼라제가 N-말단에 포유동물 β1,4-갈락토실트랜스퍼라제 1의 N-말단 아미노산 서열에 대응하는 아미노산 10-20개 길이의 아미노산 서열 단편을 포함하는 것인 방법.
제3항에 있어서, N-말단 아미노산 서열이 처음 10개의 N-말단 아미노산 내에 적어도 서열 [K/R]-X-[K/R]을 포함하고, 여기서 [K/R]은 라이신 또는 아르기닌 잔기를 나타내고, X는 임의의 아미노산일 수 있는 것인 방법.
제4항에 있어서, 아미노산 서열이 MRLREPLLSGSAA (서열 21)인 방법.
제1항에 있어서, β1,4-갈락토실트랜스퍼라제가 포유동물 시알릴트랜스퍼라제 또는 식물 골지체에 국재화된 단백질의 세포질-막횡단-스템 구역 (CTS)을 포함하는 것인 방법.
제1항에 있어서, 트랜스제닉 식물 또는 트랜스제닉 식물 세포가, β1,2-자일로스 잔기, α1,3-푸코스 잔기, 또는 β1,2-자일로스 잔기 및 α1,3-푸코스 잔기가 둘다 결여된 하이브리드형의 N-연결된 글리칸을 포함하는 당단백질을 생산하는 것인 방법.
제7항에 있어서, β1,2-자일로스 및 α1,3-푸코스 잔기가 둘다 결여된 하이브리드형의 N-연결된 글리칸의 생산량이 야생형 인간 β1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물에 의한 생산량의 2배 이상인 방법.
제1항 내지 제8항 중 어느 한 항의 방법에 따라 생산된 트랜스제닉 식물 또는 상기 식물의 일부분.
제1항 내지 제8항 중 어느 한 항의 방법에 따라 생산된 트랜스제닉 식물 세포.
제10항에 있어서, 현탁 배양으로 성장된 트랜스제닉 식물 세포.
(a) 서열 14의 제브라피시 β1,4-갈락토실트랜스퍼라제 활성 도메인을 포함하는 β1,4-갈락토실트랜스퍼라제를 코딩하는 핵산 분자, 및 이종 당단백질을 코딩하는 핵산 분자를 식물 또는 식물 세포 내로 삽입하여 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 생산하고,
(b) 트랜스제닉 식물 또는 트랜스제닉 식물 세포를 핵산 분자의 발현에 적절한 조건 하에 유지시켜, 하나 이상의 하이브리드형의 갈락토실화된 N-연결된 글리칸을 포함하는 이종 당단백질을 생산하는 것을 포함하는,
하나 이상의 하이브리드형의 갈락토실화된 N-연결된 글리칸을 포함하는 이종 당단백질을 생산하는 방법.
제12항에 있어서, 이종 당단백질을 트랜스제닉 식물 또는 트랜스제닉 식물 세포로부터 단리하는 것을 추가로 포함하는 방법.
제12항 또는 제13항에 있어서, β1,4-갈락토실트랜스퍼라제가 N-말단에 (i) 포유동물 β1,4-갈락토실트랜스퍼라제 1의 N-말단 아미노산 서열에 대응하는 아미노산 10-20개 길이의 아미노산 서열인 단편, 또는 (ii) 포유동물 시알릴트랜스퍼라제 또는 식물 골지체에 국재화된 단백질의 세포질-막횡단-스템 구역 (CTS)인 단편을 포함하는 것인 방법.
제12항에 있어서, 핵산 분자가 서열 14, 서열 16, 또는 서열 18을 코딩하는 것인 방법.
제12항, 제13항 및 제15항 중 어느 한 항에 있어서, 상기 당단백질의 N-글리칸에 자일로스, 푸코스, 또는 이들 모두가 없는 것인 방법.
삭제
삭제
삭제
당단백질 상의 β1,2-자일로스 및 α1,3-푸코스 잔기가 둘다 결여된 하이브리드형의 N-연결된 글리칸의 생산량이 야생형 인간 β1,4-갈락토실트랜스퍼라제를 발현하는 식물 세포 또는 식물에 의한 생산량의 2배 이상이며, 서열 14의 제브라피시 β1,4-갈락토실트랜스퍼라제 활성 도메인을 포함하는 β1,4-갈락토실트랜스퍼라제를 코딩하는 핵산 분자를 포함하고, β1,2-자일로스 및 α1,3-푸코스 잔기가 둘다 결여된 하이브리드형의 N-연결된 글리칸을 갖는 당단백질을 생산할 수 있는 트랜스제닉 식물 또는 트랜스제닉 식물 세포.
제20항에 있어서, 핵산 분자가 서열 14, 서열 16, 또는 서열 18을 코딩하는 것인 트랜스제닉 식물 또는 트랜스제닉 식물 세포.
제20항 또는 제21항에 있어서, 이종 당단백질을 코딩하는 핵산 분자를 추가로 포함하는 트랜스제닉 식물 또는 트랜스제닉 식물 세포.