KR20110122134A

KR20110122134A - 글리코공학처리된 효모 피키아 파스토리스에서 갈락토스 동화 경로의 대사 공학

Info

Publication number: KR20110122134A
Application number: KR1020117019623A
Authority: KR
Inventors: 로버트 씨. 데이빗슨; 피오트르 보브로윅즈; 동징 자
Original assignee: 머크 샤프 앤드 돔 코포레이션
Priority date: 2009-02-25
Filing date: 2010-02-24
Publication date: 2011-11-09
Also published as: SG173796A1; WO2010099153A2; CN102333872A; CA2751730A1; JP2012518419A; EP2401378A2; AU2010218139B2; WO2010099153A3; US20120003695A1; EP2401378B1; EP2546347A2; EP2546347A3; AU2010218139A1; CN102333872B; MX2011008913A

Abstract

본원에는 정상적으로는 탄소원으로서 갈락토스를 사용할 수 없지만 단독 탄소원으로서 갈락토스를 사용하도록 본원의 방법에 따라서 유전적으로 공학처리시킨 저급 진핵 세포, 예컨대 피키아 파스토리스 (Pichia pastoris)가 기재되어 있다. 상기 세포는 를루아르 (Leloir) 경로를 포함한 몇 가지 효소를 발현하도록 유전적으로 공학처리시킨다. 특히, 상기 세포는 갈락토키나제, UDP-갈락토스-C4-에피머라제 및 갈락토스-1-포스페이트 우리딜트랜스퍼라제, 및 임의로 갈락토스 퍼미아제 (permease)를 발현하도록 유전적으로 공학처리시킨다. 또한, 상기 세포를 갈락토키나제, UDP-갈락토스-C4-에피머라제 및 갈락토스-1-포스페이트 우리딜트랜스퍼라제를 암호화하는 하나 이상의 핵산 분자로 형질전환시키는 단계를 포함하는, 갈락토스 잔기를 갖는 N-글리칸을 수반한 당단백질을 생성하도록 유전적으로 공학처리시켰지만 정상적으로는 를루아르 경로를 포함하는 효소들이 결여된 세포에서 갈락토스-말단화 또는 갈락토스-함유 N-글리칸을 갖는 당단백질의 수율을 개선시키는 방법이 제공된다. 본원에 기재된 방법 및 숙주 세포는 재조합 세포를 만들기 위한 선별 방법으로서 갈락토스를 동화시킬 수 있는 능력이 존재하게 하거나 결여되게 할 수 있다. 이러한 방법 및 숙주 세포가 갈락토스-말단화 또는 갈락토스-함유 N-글리칸을 갖는 면역글로불린 등을 제조하는 데에 특히 유용한 것으로 본원에서 밝혀졌다.

Description

글리코공학처리된 효모 피키아 파스토리스에서 갈락토스 동화 경로의 대사 공학 {METABOLIC ENGINEERING OF A GALACTOSE ASSIMILATION PATHWAY IN THE GLYCOENGINEERED YEAST PICHIA PASTORIS}

본 발명은 정상적으로는 탄소원으로서 갈락토스를 사용할 수 없지만 를루아르 (Leloir) 경로를 포함한 몇 가지 효소를 발현하도록 세포를 유전적으로 공학처리시킴으로써 단독 탄소원으로서 갈락토스를 사용할 수 있도록 만든 저급 진핵 세포, 예컨대 피키아 파스토리스 (Pichia pastoris)에 관한 것이다. 특히, 상기 세포는 갈락토키나제, UDP-갈락토스-C4-에피머라제 및 갈락토스-1-포스페이트 우리딜트랜스퍼라제, 및 임의로 갈락토스 퍼미아제 (permease)를 발현하도록 유전적으로 공학처리시킨다. 또한, 본 발명은 추가로, 저급 진핵 생물을 갈락토키나제, UDP-갈락토스-C4-에피머라제 및 갈락토스-1-포스페이트 우리딜트랜스퍼라제를 암호화하는 하나 이상의 핵산 분자로 형질전환시키는 단계를 포함하는, 갈락토스 잔기를 갖는 N-글리칸을 수반한 당단백질을 생산하도록 유전적으로 공학처리시켰지만 정상적으로는 를루아르 경로를 포함한 효소가 결여된 저급 진핵 생물에서 갈락토스-말단화 또는 갈락토스-함유 N-글리칸을 갖는 당단백질의 수율을 개선시키는 방법에 관한 것이다.

단백질에 의거한 치료제는 신약 개발에 있어 가장 활동적인 분야 중의 하나를 차지하고, 이는 향후 10여 년간 새로운 치료적 화합물의 주요 공급원이 될 것으로 예상된다 (문헌 [Walsh, Nat . Biotechnol. 18(8): 831-3 (2000)] 참조). 그의 천연 상태에서는 글리코실화되지 않는 치료용 단백질은 에스케리챠 콜라이 (Escherichia coli)와 같은 글리코실화 기구가 결여된 숙주에서 발현될 수 있다. 그러나, 대부분의 치료용 단백질은 적절한 폴딩을 보장하고 인간 혈청에서의 후속 안정성을 보장하기 위해 글리칸을 상기 단백질의 특이적 아스파라긴 잔기에 해독 후 부가하는 것을 요구하는 당단백질이다 (문헌 [Helenius and Aebi, Science 291 :2364-9 (2001)] 참조). 특정 경우에는, 치료용 단백질의 효능이 부가의 글리코실화 부위를 공학 처리시킴으로써 개선되었다. 한 가지 예는 인간 에리트로포이에틴 (erythropoietin)인데, 이에 2개의 부가 글리코실화 부위를 부가하면 3배나 더 긴 생체내 반감기가 나타난 것으로 입증되었다 (문헌 [Macdougall et al., J. Am. Soc. Nephrol. 10; 2392-2395 (1999)] 참조). 인간에게 치료적 용도로 사용되는 대부분의 당단백질은 N-글리코실화를 필요로 하므로, 인간 당단백질 프로세싱과 유사한 포유류 세포주, 예를 들어 중국산 햄스터 난소 (CHO) 세포가 현재 치료용 당단백질 생산에 가장 자주 사용된다. 그러나, 이들 세포주는 유전적 취급 용이성이 불량하고, 발효 시간이 길며, 글리코실화가 불균질하고 지속적인 바이러스성 오염 논쟁을 포함하여 심각한 단점을 지니고 있다 (문헌 [Birch and Racher, Adv. Drug Deliv. Rev. 58: 671-85 (2006)]; [Kalyanpur, Mol. Biotechnol. 22: 87-98(2002)] 참조).

많은 산업적 단백질 발현 시스템은 화학적으로 규정된 배지에서 고 세포 밀도로 성장할 수 있고 일반적으로 상기 언급된 한계로 인해 고통받지 않는 효모 균주에 의거한다 (문헌 [Cereghino and Cregg FEMS Microbiol. Rev. 24: 45-66 (2000)]; [Hollenberg and Gellisen, Curr. Opin. Biotechnol. 8: 554-560 (1997)]; [Muller, Yeast 14: 1267-1283 (1998)] 참조). 효모가 아글리코실화 치료용 단백질, 예컨대 인슐린을 생성하는 데에 사용되어 왔지만, 당단백질 생성에는 사용되지 않았는데, 이는 효모가 비-인간, 고 만노스-유형 N-글리칸을 수반한 당단백질 (도 1 참조)을 생성하고, 이로 인해 생체내 반감기가 단축된 당단백질이 산출되고 고등 포유류에서 면역원성이 될 가능성이 있기 때문이다 (문헌 [Tanner et al., Biochim. Biophys. Acta. 906: 81-99 (1987)] 참조).

이 문제를 해결하기 위해, 본 발명자 등은 각종 상이한 효모 및 섬유상 진균에서 글리코실화 경로를 다시 공학처리시켜 이들 단백질 발현 숙주로부터 인간-유사 당단백질을 수득하는 것에 초점을 맞춰왔다. 예를 들어, 게른그로스 (Gerngross) 등의 미국 공개 특허공보 제2004/0018590호 (그의 개시내용은 본원에 참고로 포함된다)는 효모 및 섬유상 진균 특유의 고 만노스-유형 N-글리칸의 생성을 없애기 위해 유전적으로 공학처리시켰고, 포유류 세포로부터 생성된 당단백질의 보다 특유의 하이브리드 또는 복합 N-글리칸을 수반한 당단백질을 생성하는 글리코실화 기구를 숙주 세포에게 제공하기 위해 유전적으로 공학처리시킨 효모 피키아 파스토리스의 세포를 제공한다.

상기 게른그로스 등은 상당 비율의 N-글리칸 상에 갈락토스 잔기를 함유하는 재조합 당단백질을 생성시킬 수 있는 재조합 효모 균주, 즉 올리고사카라이드 구조 GalGlcNAc₂Man₃GlcNAc₂ (G1) 또는 Gal₂GlcNAc₂Man₃GlcNAc₂ (G2)를 우세적으로 갖고 이보다 적은 양의 올리고사카라이드 구조 GlcNAc₂Man₃GlcNAc₂ (G0)를 갖는 N-글리칸을 생산하는 효모 균주을 기술하고 있다. 70 내지 85% 수율의 G2가 수득되었다. 그러나, 면역글로불린 및 면역부착인자와 같은 일부 당단백질이 이들 세포에서 생성되는데, GO:G1/G2 비가 약 2:1로 감소된 것으로 밝혀졌다 (예를 들어, 문헌 [Li et al., Nature Biotechnol. 24: 210-215 (2006)]참조; 여기서는 이들 세포로부터의 갈락토스-말단화 N-글리칸의 수율이 상기 당단백질을 시험관 내에서 갈락토스 및 가용성 형태의 β-1,4-갈락토실트랜스퍼라제로 처리함으로써 개선되었다). 이와는 달리, CHO 세포와 같은 포유류 세포에서 생성된 면역글로불린은 GO:G1/G2 비가 약 1:1이다. 따라서, GO:G1/G2 비가 2:1 미만인 재조합 당단백질을 생체 내에서 생산할 수 있는 재조합 효모 숙주 세포를 제공하는 것이 바람직할 것이다.

피키아 파스토리스는 생존을 위해 제한된 수의 탄소원 만을 사용할 수 있다. 현재, 이들 탄소원은 글리세롤, 글루코스, 메탄올 및 아마도, 람노스 및 만노스이지만, 갈락토스는 아니다. 상기 열거된 것 이외의 탄소원을 사용할 수 있는 피키아 파스토리스 균주를 제공하는 것이 바람직할 것이다.

<발명의 간단한 개요>

본 발명은 상기 확인된 문제점을 해결해준다. 본 발명은 탄소원으로서 갈락토스를 동화시킬 수 있는 능력이 결여된 숙주 세포로부터, 에너지원으로서 갈락토스를 사용할 수 있는 능력을 지닌 재조합 숙주 세포를 생성시키기 위한 방법 및 물질을 제공한다. 이러한 재조합 숙주 세포를 추가로 유전적으로 공학처리하여 갈락토스-말단화 또는 갈락토스-함유 N-글리칸을 갖는 당단백질을 생성시키는 경우, 상기 숙주 세포는 GO:G1/G2 비가 2:1 미만이거나, GO:G1/G2 비가 약 1:1 또는 그 미만이거나, 또는 GO:G1/G2 비가 약 1:2 또는 그 미만인 항체와 같은 재조합 당단백질을 생산할 수 있다. 일반적으로, 상기 방법은 를루아르 경로 효소, 즉 갈락토키나제, UDP-갈락토스-C4-에피머라제 및 갈락토스-1-포스페이트 우리딜트랜스퍼라제, 및 임의로 갈락토스 퍼미아제를 암호화하는 핵산 분자를 숙주 세포 내로 도입하는 단계를 포함한다. 따라서, 본원의 방법 및 물질은 탄소원으로서 갈락토스를 함유하는 배지 상에서 세포를 단순히 성장시킴으로써 형질전환시킨 숙주 세포를 확인하기 위해 사용될 수 있는 선별 시스템을 제공하고, 고 수준의 갈락토스-말단화 또는 갈락토스-함유 N-글리칸을 갖는 면역글로불린과 같은 당단백질을 생성하는 방법을 제공한다.

탄소원으로서 갈락토스를 활용할 수 있는 능력은 사용되는 발현 시스템의 선택에 관한 유연성과 경제성을 제공해 준다. 예를 들어, 말단 갈락토스 또는 말단 시알릴화를 수반한 재조합 당단백질을 발현하기 위해 설계된 시스템에서는, 갈락토스를 배지에 부가할 수 있는데, 여기서는 갈락토스가 해당 세포에 의해 흡수되고, 에너지원으로서 세포에 의해 사용되며, 재조합 당단백질 상에서 합성되는 N-글리칸 내로 혼입하기 위한 갈락토스 잔기를 제공하기 위해 세포에 의해 사용된다. 본 발명의 이점은 재조합 당단백질의 유도 및/또는 발효 동안 갈락토스를 부가하거나 또는 배지에 존재하는 갈락토스를 가짐으로써, 재조합 단백질 생성으로 인해 고 수준의 갈락토실화 또는 시알릴화 당단백질이 생성될 수 있다는 것이다. 따라서, 정상적으로는 를루아르 경로가 결여된 효모 종인 피키아 파스토리스를 이용하여 입증된 바와 같이, 본원에 기재된 방식으로 피키아 파스토리스를 유전적으로 공학처리하면, 단독 탄소원으로서 갈락토스를 사용할 수 있는 재조합 피키아 파스토리스 세포주가 생성된다. 또한, 세포가 갈락토스-말단화 또는 갈락토스-함유 N-글리칸을 갖는 당단백질을 만들 수 있도록 하는 데에 필요한 효소 및 를루아르 경로 효소를 포함하도록 피키아 파스토리스 세포주를 유전적으로 공학처리하면, 갈락토스-말단화 또는 갈락토스-함유 N-글리칸의 수율이, 상기 세포주에게 를루아르 경로 효소가 결여된 경우 보다 더 큰 재조합 세포주가 생성된다. 따라서, 본 발명으로 인해, 갈락토실화 또는 시알릴화 당단백질을 생성하도록 유전적으로 공학처리시킨 피키아 파스토리스 세포주에서의 생산성이 증가된다.

특히, 본 발명은 생체 내에서 고 수준의 갈락토스 또는 시알산을 수반하는 항체를 생성시키는 데에 유용한 방법 및 물질을 제공한다. 이러한 본 발명의 방법 및 물질을 사용하여, 갈락토스를 세포 성장 배지에 가하여 (a) 당 공급원으로서 갈락토스를 사용할 수 있는 숙주 세포를 선별하는 것; (b) 숙주 세포의 성장을 위해 탄소원을 제공하는 것; 및 (c) N-글리칸 내의 말단 갈락토스 잔기로서 또는 말단 시알산 잔기를 N-글리칸에 후속 부가하기 위한 기질을 제공하기 위해, N-글리칸 내로 혼입시키기 위한 갈락토스 잔기의 공급원을 제공하는 것을 포함한 다중 목적을 달성한다. 따라서, 본 발명은 하전된 갈락토스 및 가용성 갈락토실 트랜스퍼라제 효소를, 정제되긴 하지만 부분적으로 갈락토실화된 재조합 당단백질을 함유하는 배지 또는 용액에 가하는 덜 효율적이면서도 비용이 더 많이 드는 시험관내 반응을 사용하는 것이 아니라, 생체내 공정을 통하여 갈락토실화 수준을 증가시킬 수 있는 방법 및 물질을 제공한다.

본 발명의 한 가지 실시양태는 갈락토스가 단독 탄소원으로서 존재하는 배지 상에서 생존할 수 있는 피키아 파스토리스 숙주 세포를 개발하는 것이다. 본 발명의 물질 및 방법을 사용하여, 당업자는 형질전환된 숙주 세포를 선별하고 유지하기 위한 탄소원으로서 갈락토스를 사용하여 본원에 기재된 형질전환된 숙주 세포로부터 재조합 당단백질을 생성시킬 수 있다. 추가로, 세포 배양 배지에 갈락토스를 공급함으로써, 본 발명은 갈락토실화 또는 시알릴화 N-글리칸을 생성하도록 숙주 세포를 유전적으로 공학처리시킨 경우에 세포로부터 생성되는 갈락토실화 또는 시알릴화 당단백질의 수준을 증가시키기 위해 사용할 수 있다.

따라서, 갈락토키나제 활성, UDP-갈락토스-4-에피머라제 활성, 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 활성, 및 임의로 갈락토스 퍼미아제 활성을 발현하도록 유전적으로 공학처리시킨 피키아 파스토리스 숙주 세포가 제공되는데, 이러한 숙주 세포는 단독 탄소 에너지원으로서 갈락토스를 사용할 수 있다.

특별한 측면에서, 피키아 파스토리스 숙주 세포는 갈락토스 잔기를 포함하는 하이브리드 또는 복합 N-글리칸을 갖는 재조합 당단백질을 생성할 수 있도록 추가로 유전적으로 공학처리시켰다. 특별한 실시양태에서는, UDP-갈락토스-4-에피머라제 활성이 갈락토실트랜스퍼라제의 촉매적 도메인 및 UDP-갈락토스-4-에피머라제의 촉매적 도메인을 포함하는 융합 단백질에 제공된다.

일반적으로, 상기 숙주 세포는 GO:G1/G2 비가 2:1 미만인 복합 N-글리칸을 갖는 당단백질을 생성할 수 있다.

특별한 실시양태에서, 상기 세포에서 생성된 당단백질은 GalGlcNAcMan₅GlcNAc₂; NANAGalGlcNAcMan₅GlcNAc₂; GalGlcNAcMan₃GlcNAc₂; NANAGalGlcNAcMan₃GlcNAc₂; GalGlcNAc₂Man₃GlcNAc₂; Gal₂GlcNAc₂Man₃GlcNAc₂; NANAGal₂GlcNAc₂Man₃GlcNAc₂; 및 NANA₂Gal₂GlcNAc₂Man₃GlcNAc₂로 이루어진 군으로부터 선택된 N-글리칸을 우세적으로 갖는다.

추가의 실시양태에서, N-글리칸은 GalGlcNAcMan₅GlcNAc₂; Gal₂GlcNAc₂Man₃GlcNAc₂; 및 Gal₂GlcNAc₂Man₃GlcNAc₂로 이루어진 군으로부터 선택된 갈락토스-말단화 N-글리칸이다. 기타 실시양태에서, N-글리칸은 갈락토스-말단화 하이브리드 N-글리칸이고, 추가의 실시양태에서, N-글리칸은 NANAGalGlcNAcMan₅GlcNAc₂; NANAGal₂GlcNAc₂Man₃GlcNAc₂; 및 NANA₂Gal₂GlcNAc₂Man₃GlcNAc₂로 이루어진 군으로부터 선택된 시알릴화 N-글리칸이다.

추가로, a) (i) 숙주 세포가 갈락토스 잔기를 포함하는 하이브리드 또는 복합 N-글리칸을 갖는 재조합 당단백질을 생성할 수 있도록 하는 글리코실화 경로; (ii) 갈락토키나제 활성, UDP-갈락토스-4-에피머라제 활성, 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 활성, 및 임의로 갈락토스 퍼미아제 활성; 및 (iii) 재조합 당단백질을 발현하도록 유전적으로 공학처리된 재조합 숙주 세포를 제공하는 단계; 및 b) 이러한 숙주 세포를 갈락토스 함유 배지에서 배양하여, 갈락토스 잔기를 갖는 하나 이상의 N-글리칸을 갖는 재조합 당단백질을 생성시키는 단계를 포함하는, 갈락토스 잔기를 갖는 N-글리칸을 수반하는 재조합 당단백질을 피키아 파스토리스 숙주에서 생성하는 방법이 제공된다.

상기 방법의 추가 측면에서는, UDP-갈락토스-4-에피머라제 활성이 갈락토실트랜스퍼라제의 촉매적 도메인 및 UDP-갈락토스-4-에피머라제의 촉매적 도메인을 포함하는 융합 단백질에 제공된다.

본 발명은 추가로, 이종 단백질을 발현하는 재조합 숙주 세포를 선별하는 방법을 제공한다. 전부가 아닌 1개 또는 2개의 를루아르 경로 효소 활성을 발현하는 재조합 숙주 세포는 이러한 재조합 숙주 세포에 존재하지 않는 를루아르 경로 효소 및 이종 단백질을 암호화하는 하나 이상의 핵산 분자로 형질전환시킨다. 이와 같이 형질전환된 재조합 숙주 세포는 완전한 를루아르 경로를 함유하기 때문에, 비-형질전환된 세포로부터 이종 단백질을 발현하는 형질전환된 재조합 숙주 세포를 선별하는 것은, 갈락토스가 단독 탄소원인 배지에서 상기 형질전환된 재조합 숙주 세포를 배양함으로써 달성할 수 있다. 따라서, (a) 갈락토키나제, UDP-갈락토스-4-에피머라제 및 갈락토스-1-포스페이트 우리딜 트랜스퍼라제로 이루어진 군으로부터 선택된 1개 또는 2개 효소를 발현하도록 유전적으로 공학처리된 숙주 세포를 제공하는 단계; (b) 이러한 숙주 세포를, 단계 (a)의 숙주 세포에서는 발현되지 않는 단계 (a) 내의 군으로부터의 효소(들) 및 이종 단백질을 암호화하는 하나 이상의 핵산 분자로 형질전환시키는 단계; 및 (c) 숙주 세포를 단독 탄소원으로서 갈락토스를 함유하는 배지에서 배양하여 이종 단백질을 발현하는 재조합 피키아 파스토리스 숙주 세포를 제공하는 단계를 포함하는, 이종 단백질을 발현하는 재조합 숙주 세포를 생성시키는 방법이 추가로 제공된다.

상기 방법의 추가의 측면에서, 숙주 세포는 갈락토스 퍼미아제를 발현하도록 추가로 유전적으로 공학처리시킨다. 또한 추가의 측면에서, 숙주 세포는 갈락토스를 포함하는 하나 이상의 N-글리칸을 갖는 당단백질을 생성하도록 유전적으로 변형시킨다.

추가로, a) 피키아 파스토리스 숙주 세포를 제공하는 단계; b) 이러한 숙주 세포를, 갈락토키나제, UDP-갈락토스-4-에피머라제, 갈락토스-1-포스페이트 우리딜 트랜스퍼라제, 및 임의로 갈락토스 퍼미아제를 암호화하는 하나 이상의 핵산 분자로 형질전환시키는 단계; c) 이와 같이 형질전환된 숙주 세포를, 단독 탄소원으로서 갈락토스를 함유하는 배지 상에서 배양하는 단계; 및 d) 단독 탄소원으로서 갈락토스를 함유하는 배지 상에서 성장할 수 있는 숙주 세포를 선별하는 단계를 포함하는, 단독 탄소원으로서 갈락토스를 사용할 수 있는 피키아 파스토리스 숙주 세포를 생성 및 선별하는 방법이 제공된다.

본원의 숙주 세포 및 방법은 제약상 허용되는 담체 중의, G0:G1/G2 글리코형태 비가 2:1 미만인 재조합 당단백질을 포함하는 조성물을 생성시킬 수 있다. 특별한 실시양태에서, 재조합 당단백질은 에리트로포이에틴 (EPO); 시토카인, 예컨대 인터페론 α, 인터페론 β, 인터페론 γ, 및 인터페론 ω; 및 과립구-콜로니 자극 인자 (GCSF); GM-CSF; 응고 인자, 예컨대 인자 VIII, 인자 IX, 및 인간 단백질 C; 항트롬빈 III; 트롬빈; 가용성 IgE 수용체 α-쇄; 면역글로불린, 예컨대 IgG, IgG 단편, IgG 융합물, 및 IgM; 면역부착인자 및 기타 Fc 융합 단백질, 예컨대 가용성 TNF 수용체-Fc 융합 단백질; RAGE-Fc 융합 단백질; 인터루킨; 유로키나제; 키마제 (chymase); 및 우레아 트립신 억제제; IGF-결합성 단백질; 표피 성장 인자; 성장 호르몬-방출 인자; 아넥신 V 융합 단백질; 안지오스타틴 (angiostatin); 혈관 내피 성장 인자-2; 골수 전구세포 억제 인자-1; 오스테오프로테게린 (osteoprotegerin); α-1-항트립신; α-태아 단백질; DNase II; 인간 플라스미노겐의 크링글 (kringle) 3; 글루코세레브로시다제; TNF 결합성 단백질 1; 난포 자극 호르몬; 세포독성 T 림프구 관련 항원 4 - Ig; 막관통 (transmembrane) 활성화제 및 칼슘 조정제 및 시클로필린 (cyclophilin) 리간드; 글루카곤 유사 단백질 1; 및 IL-2 수용체 효능제로 이루어진 군으로부터 선택된다.

추가의 실시양태에서, 당단백질은 항체, 특히 인간화, 키메라 또는 인간 항체이다. 특별한 실시양태에서, 항체는 항-Her2 항체, 항-RSV (호흡기 합포체 바이러스) 항체, 항-TNFα 항체, 항-VEGF 항체, 항-CD3 수용체 항체, 항-CD41 7E3 항체, 항-CD25 항체, 항-CD52 항체, 항-CD33 항체, 항-IgE 항체, 항-CD11a 항체, 항-EGF 수용체 항체, 및 항-CD20 항체, 및 그의 변이체로 이루어진 군으로부터 선택된다. 항체의 예에는 무로모나브 (Muromonab)-CD3, 아브식시마브 (Abciximab), 리툭시마브 (Rituximab), 다클리주마브 (Daclizumab), 바실릭시마브 (Basiliximab), 팔리비주마브 (Palivizumab), 인플릭시마브 (Infliximab), 트라스투주마브 (Trastuzumab), 젬투주마브 오조가미신 (Gemtuzumab ozogamicin), 알렘투주마브 (Alemtuzumab), 이브리투모마브 티욱세텐 (Ibritumomab tiuxeten), 아달리무마브 (Adalimumab), 오말리주마브 (Omalizumab), 토시투모마브 (Tositumomab)-¹³¹I, 에팔리주마브 (Efalizumab), 세툭시마브 (Cetuximab), 골리무마브 (Golimumab), 및 베바시주마브 (Bevacizumab)가 포함된다.

또한 추가의 실시양태에서, 당단백질은 Fc 융합 단백질, 예를 들어 에타네르셉트 (etanercept)이다.

피키아 파스토리스가 본원에 기재된 바와 같이 변형될 수 있는 숙주 세포의 한 예로서 제공되긴 하지만, 본 발명의 방법 및 숙주 세포는 피키아 파스토리스로 제한되지 않는다. 본원의 방법을 사용하여, 정상적으로는 를루아르 경호 효소를 발현하지 못하므로 탄소원으로서 갈락토스를 사용할 수 없는 기타 저급 진핵 생물 종으로부터 재조합 숙주 세포를 생성시킬 수 있다. 따라서, 추가 실시양태에서, 숙주 세포는 정상적으로 를루아르 경로 효소를 발현하지 못하는 모든 저급 진핵 생물 종이다.

정의

달리 정의되지 않는 한, 본원에서 사용된 모든 기술적 및 과학적 용어는 본 발명이 속하는 분야에서 통상의 지식을 가진 사람에 의해 흔히 이해되는 바와 동일한 의미를 갖는다. 추가로, 달리 맥락상 요구되지 않는 한, 단수 용어에는 복수가 포함되어야 하고, 복수 용어에는 단수가 포함되어야 한다. 일반적으로, 본원에 기재된 생화학, 효소학, 분자 및 세포 생물학, 미생물학, 유전학 및 단백질 및 핵산 화학 및 혼성화의 기술, 및 이와 연관되어 사용된 명칭은 당해 분야에 널리 공지되어 있고 흔히 사용되는 것이다. 본 발명의 방법 및 기술은 일반적으로, 당해 분야에 널리 공지되어 있고, 달리 표시되지 않는 한 본 명세서 전반에 걸쳐 논의되고 인용되는 각종 일반적 및 보다 구체적 참조 문헌에 기재된 바와 같은 통상적인 방법에 따라서 수행한다 (예를 들어, 문헌 [Sambrook et al. Molecular Cloning : A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y. (1989)]; [Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Associates (1992, and Supplements to 2002)]; [Harlow and Lane, Antibodies : A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1990)]; [Taylor and Drickamer, Introduction to Glycobiology, Oxford Univ. Press (2003)]; [Worthington Enzyme Manual, Worthington Biochemical Corp., Freehold, NJ]; [Handbook of Biochemistry: Section A Proteins, Vol I, CRC Press (1976)]; [Handbook of Biochemistry: Section A Proteins, Vol II, CRC Press (1976)]; [Essentials of Glycobiology, Cold Spring Harbor Laboratory Press (1999)] 참조). 예시적인 방법 및 물질이 다음에 기재되긴 하지만, 본원에 기재된 바와 유사하거나 등가의 방법 및 물질을 본 발명의 실시에 사용할 수도 있고, 이는 당업자에게 명백할 것이다. 본원에 언급된 모든 공개 문헌 및 기타 참조 문헌은 이들이 인용되는 개시내용을 위해 그의 전문이 본원에 참고로 포함된다. 상반되는 경우, 정의를 포함한 본 명세서가 제어할 것이다. 물질, 방법 및 예는 단지 예시적이고, 어떠한 방식으로든지 제한되지 않는다.

다음 용어는 달리 표시되지 않는 한, 다음 의미를 갖는 것으로 이해되어야 한다:

본원에 사용된 바와 같은 용어 "인간화된", "인간화" 및 "인간-유사"는 상호 교환적으로 사용되고, 이는 공학 처리시킨 세포가, 동일한 종의 비-공학 처리시킨 야생형 비-인간 세포에 의해 생성된 당단백질 보다 포유류 글리코실화 패턴에 보다 근접하게 유사한 글리코실화를 갖는 단백질, 특히 당단백질을 생성할 수 있는 능력을 갖도록 하는 방식으로 비-인간 세포, 예컨대 저급 진핵 숙주 세포를 공학 처리시키는 과정을 지칭한다. 인간화는 N-글리코실화, O-글리코실화, 또는 둘 다를 기준으로 하여 수행할 수 있다. 예를 들어, 야생형 피키아 파스토리스 및 기타 저급 진핵 세포는 전형적으로, N-글리코실화 부위에 과만노실화 단백질을 생성시킨다. 본 발명의 바람직한 실시양태에서, 본 발명의 "인간화된" 숙주 세포는 하이브리드 및/또는 복합 N-글리칸을 수반하는 당단백질, 즉 "인간-유사 N-글리코실화"를 생성시킬 수 있다. 인간화 숙주 세포로부터 생성된 당단백질 상에 우세적으로 존재하는 특이적 "인간-유사" 글리칸은 수행되는 구체적인 인간화 단계에 좌우될 것이다.

본원에 사용된 바와 같은 용어 "N-글리칸" 및 "글리코형태"는 상호 교환적으로 사용되고, 이는 N-연결된 올리고사카라이드, 예를 들어 아스파라긴-N-아세틸글루코사민 연쇄에 의해 폴리펩티드의 아스파라긴 잔기에 부착되는 것을 지칭한다. N-연결된 당단백질은 단백질 내의 아스파라긴 잔기의 아미드 질소에 연결된 N-아세틸글루코사민 잔기를 함유한다. 당단백질 상에서 발견된 우세 당은 글루코스, 갈락토스, 만노스, 푸코스, N-아세틸갈락토사민 (GalNAc), N-아세틸글루코사민 (GlcNAc) 및 시알산 [예를 들어, N-아세틸-뉴라민산 (NANA)]이다. 상기 당 기의 프로세싱은 ER의 내강에서 해독과 동시에 일어나고, N-연결된 당단백질에 대한 골지체 (Golgi apparatus)에서 지속된다.

N-글리칸은 Man₃GlcNAc₂의 공통 펜타사카라이드 코어를 갖는다 (여기서, "Man"은 만노스를 지칭하고; "Glc"는 글루코스를 지칭하며; "NAc"는 N-아세틸을 지칭하고; GlcNAc는 N-아세틸글루코사민을 지칭한다). N-글리칸은 "트리만노스 코어", "펜타사카라이드 코어" 또는 "소수-만노스 코어"로서 지칭되기도 하는 Man₃GlcNAc₂ ("Man3") 코어 구조에 부가되는 말초 당 (예: GlcNAc, 갈락토스, 푸코스 및 시알산)을 포함하는 분지물 (안테나) 수 측면에서 상이하다. N-글리칸은 그의 분지된 구성분에 따라서 분류된다 (예를 들어, 고 만노스, 복합 또는 하이브리드). "고 만노스" 유형 N-글리칸은 5개 또는 그 초과의 만노스 잔기를 갖는다. "복합" 유형 N-글리칸은 전형적으로, 1,3-만노스 지류 (arm)에 부착된 하나 이상의 GlcNAc 및 "트리만노스 코어"의 1,6 만노스 지류에 부착된 하나 이상의 GlcNAc를 갖는다. 복합 N-글리칸은 또한, 시알산 또는 유도체 (예를 들어, "NANA" 또는 "NeuAc"; 여기서, "Neu"는 뉴라민산을 지칭하고, "Ac"는 아세틸을 지칭한다)를 이용하여 임의로 변형시킨 갈락토스 ("Gal") 또는 N-아세틸갈락토사민 ("GalNAc") 잔기를 가질 수 있다. 복합 N-글리칸은 또한, "이등분" GlcNAc 및 코어 푸코스 ("Fuc")를 포함하는 쇄내 치환물을 가질 수 있다. 복합 N-글리칸은 또한, "트리만노스 코어" 상에 다중 안테나를 가질 수 있다 (이는 종종, "다중 안테나 글리칸"으로서 지칭된다). "하이브리드" N-글리칸은 트리만노스 코어의 1,3-만노스 지류의 말단 상에 하나 이상의 GlcNAc을 갖고, 트리만노스 코어의 1,6-만노스 지류 상에 0개 또는 그 초과의 만노스를 갖는다. 각종 N-글리칸은 "글리코형태"로서 지칭되기도 한다. 도 2에는 포유류-유사 N-글리칸을 생성하도록 유전적으로 공학처리시킨 피키아 파스토리스에서 생성된 각종 고 만노스, 하이브리드 및 복합 N-글리칸이 도시되어 있다.

본원에 사용된 바와 같은 용어 "O-글리칸" 및 "글리코형태"는 상호 교환적으로 사용되고, 이는 O-연결된 올리고사카라이드, 예를 들어 세린 또는 트레오닌 잔기의 히드록실 기를 통하여 펩티드 쇄에 부착되는 글리칸을 지칭한다. 진균 세포에서는, 천연 O-글리코실화가 돌리콜 모노포스페이트 만노스 (Dol-P-Man)로부터 내형질 세망 중의 단백질로 전이된 제1 만노실 잔기의 부착을 통하여 일어나고, 부가의 만노실 잔기는 골지체 내의 GPD-Man으로부터의 전이를 통하여 부착될 수 있다. 고등 진핵 세포, 예컨대 인간 또는 포유류 세포는 N-아세틸-갈락토사민 (GlcNac)을 세린 또는 트레오닌 잔기로 공유적으로 부착시킴으로써 O-글리코실화를 진행한다.

본원에 사용된 바와 같은 용어 "인간-유사 O-글리코실화"는 진균-특이적 인산화 만노스 구조가 감소되거나 제거되어 전하 및 베타-만노스 구조가 감소되거나 제거된다는 사실, 또는 당단백질 상에 존재하거나 당단백질의 조성물에 존재하는 우세 O-글리칸 종이 GlcNac; Gal, 또는 NANA (또는 Sia)로부터 선택된 말단 잔기로 캡핑된 글리칸을 포함한다는 사실을 의미한다는 것을 인지해야 할 것이다. 이러한 방식으로, 인간-유사 O-글리코실화를 우세적으로 보유하는 재조합 당단백질은 그것이 천연적으로 생성된 당단백질인 것처럼 인간 또는 포유류 세포에 의해 인식되어, 재조합 당단백질의 치료적 특성이 개선될 수 있다.

본원에 사용된 약어는 당해 분야에서 통상적으로 활용되는 것이다 (예를 들어, 상기 당에 관한 약어 참조). 기타 통상의 약어에는 "PNGase", 또는 "글리카나제" 또는 "글루코시다제"가 포함되는데, 이들 모두는 펩티드 N-글리코시다제 F (EC 3.2.2.18)를 지칭한다.

본원에 사용된 바와 같은 용어 "항체", "면역글로불린(들)" 및 "면역글로불린 분자"는 상호 교환적으로 사용된다. 각 면역글로불린 분자는 이것이 그의 특이적 항원과 결합할 수 있도록 하는 독특한 구조를 갖고 있지만, 모든 면역글로불린은 본원에 기재된 바와 동일한 전반적 구조를 갖는다. 기본 면역글로불린 구조적 단위는 소단위체의 사량체를 포함하는 것으로 공지되어 있다. 각 사량체는 2개의 동일한 폴리펩티드 쇄 쌍을 갖고 있는데, 각 쌍은 1개의 "경쇄" (LC) (약 25 kDa) 및 1개의 "중쇄" (HC) (약 50 내지 70 kDa)를 갖는다. 각 쇄의 아미노-말단 부분에는 항원 인식에 대해 주로 책임이 있는 약 100개 내지 110개 또는 그 초과 아미노산의 가변 영역이 포함된다. 각 쇄의 카르복시-말단 부분은 효과기 기능에 대해 주로 책임이 있는 불변 영역을 규정한다. 경쇄 (LC)는 카파 또는 람다로서 분류된다. 중쇄 (HC)는 감마, 뮤, 알파, 델타 또는 엡실론으로서 분류되고, 항체의 이소형을 각각 IgG, IgM, IgA, IgD 및 IgE로서 규정한다.

경쇄 및 중쇄는 가변 영역 및 불변 영역으로 세분된다 (문헌 [Fundamental Immunology (Paul, W., ed., 2nd ed. Raven Press, N.Y., 1989), Ch. 7] 참조). 각 경쇄/중쇄 쌍의 가변 영역은 항체 결합 부위를 형성한다. 따라서, 온전한 항체는 2개의 결합 부위를 갖는다. 이관능성 또는 이중-특이적 항체의 경우를 제외하고는, 2개의 결합 부위는 동일하다. 이들 쇄 모두는 상보성 결정 영역 또는 CDR로 지칭되기도 하는 3개의 초가변 영역에 의해 연결된, 비교적 보존된 골격 영역 (FR)의 동일한 일반적 구조를 나타낸다. 각 쌍의 2개 쇄로부터의 CDR은 골격 영역에 의해 정렬되어, 특이적 에피토프와 결합할 수 있다. 상기 용어에는 천연 발생적 형태 뿐만 아니라 단편 및 유도체가 포함된다. 상기 용어의 범위 내에는 일정 부류의 면역글로불린 (Ig), 즉 IgG, IgA, IgE, IgM, 및 IgD가 포함된다. 또한, 상기 용어의 범위 내에는 IgG의 아유형, 즉 IgG1, IgG2, IgG3 및 IgG4가 포함된다. 상기 용어는 가장 광범위한 의미로 사용되고, 이에는 단일 모노클로날 항체 (효능제 및 길항제 항체 포함) 뿐만 아니라 다중 에피토프 또는 항원과 결합될 항체 조성물이 포함된다. 상기 용어는 구체적으로, 모노클로날 항체 (완전한 길이의 모노클로날 항체 포함), 폴리클로날 항체, 다중-특이적 항체 (예를 들어, 이중-특이적 항체), 및 항체 단편 (단, 이것이 C_H2 도메인의 N-연결된 글리코실화 부위를 포함하는 중쇄 면역글로불린 불변 영역의 C_H2 도메인의 적어도 일부를 함유하거나 또는 함유하도록 변형되어야 한다), 또는 그의 변이체를 포괄한다. 상기 용어에는 Fc 영역 만을 포함하는 분자, 예컨대 면역부착인자 (미국 공개 특허공보 제20040136986호), Fc 융합물, 및 항체-유사 분자가 포함된다. 또 다른 한편, 이들 용어는 N-연결된 글리코실화 부위를 적어도 함유하는 적어도 Fab 영역의 항체 단편을 지칭할 수 있다.

용어 "Fc" 단편은 C_H2 및 C_H3 도메인을 함유하는 항체의 '단편 결정화된' C-말단 영역을 지칭한다. 용어 "Fab" 단편은 V_H, C_H1, V_L 및 C_L 도메인을 함유하는 항체의 '단편 항원 결합성' 영역을 지칭한다.

본원에 사용된 바와 같은 용어 "모노클로날 항체" (mAb)는 실질적으로 동질적 항체 집단, 즉 집단을 차지하고 있는 개개의 항체가 미량으로 존재할 수도 있는 가능한 천연 발생적 돌연변이를 제외하고는 동일한 집단으로부터 수득한 항체를 지칭한다. 모노클로날 항체는 고도로 특이적이어서, 단일 항원 부위에 대항하여 유도된다. 더우기, 전형적으로 상이한 결정기 (에피토프)에 대항하여 유도된 상이한 항체를 포함하는 통상적인 (폴리클로날) 항체 제제와는 달리, 각 mAb는 항원 상의 단일 결정기에 대항하여 유도된다. 모노클로날 항체는 그의 특이성 이외에도, 기타 면역글로불린에 의해 오염되지 않은 채로, 하이브리도마 배양에 의해 합성될 수 있다는 점에서 유리하다. 용어 "모노클로날"은 실질적으로 동질적 항체 집단으로부터 수득되는 바와 같은 항체의 형질을 표시하고, 어떠한 특별한 방법에 의한 항체의 생성을 요구하는 것으로 추론되지 않는다. 예를 들어, 본 발명에 따라서 사용하고자 하는 모노클로날 항체는 문헌 ([Kohler et al., (1975) Nature, 256: 495] 참조)에 최초로 기재된 하이브리도마 방법에 의해 만들 수 있거나, 또는 재조합 DNA 방법 (예를 들어, 미국 특허 제4,816,567호 (Cabilly et al.) 참조)에 의해 만들 수 있다.

용어 "항체" 또는 "면역글로불린"의 범위 내에서의 용어 "단편"에는 각종 프로테아제를 이용한 분해에 의해 생성된 것, 화학적 절단 및/또는 화학적 해리에 의해 생성된 것, 및 재조합적으로 생성된 것이 포함되는데, 단 이러한 단편은 표적 분자와 특이적으로 결합할 수 있어야 한다. 특히 이러한 단편은 Fc, Fab, Fab', Fv, F(ab')₂ 및 단일 쇄 Fv (scFv) 단편이다. 이후부터는, 용어 "면역글로불린"에 용어 "단편"이 또한 포함되기도 한다.

면역글로불린에는 추가로, 서열상 변형되었지만, 여전히 표적 분자와 특이적으로 결합할 수 있는 면역글로불린 또는 단편이 포함되고, 이에는 종간 키메라 및 인간화 항체; 항체 융합물; 헤테로메릭 (heteromeric) 항체 복합체 및 항체 융합물, 예컨대 디아보디 (diabody) (이중-특이적 항체), 단일 쇄 디아보디, 및 인트라보디 (intrabody)가 포함된다 (예를 들어, 문헌 [Intracellular Antibodies: Research and Disease Applications, (Marasco, ed., Springer-Verlag New York, Inc., 1998)] 참조).

용어 "촉매적 항체"는 생화학적 반응을 촉매할 수 있는 면역글로불린 분자를 지칭한다. 촉매적 항체는 당해 분야에 널리 공지되어 있고, 미국 특허 제7,205,136호; 제4,888,281호; 및 제5,037,750호 (Schochetman et al.), 미국 특허 제5,733,757호; 제5,985,626호; 및 제6,368,839호 (Barbas, III et al.)에 기재되었다.

본원에 사용된 바와 같은 용어 "벡터"는 이와 연결된 또 다른 핵산을 수송할 수 있는 핵산 분자를 지칭하고자 한다. 한 가지 유형의 벡터가 "플라스미드"인데, 이는 부가의 DNA 절편을 연결시킬 수 있는 환상 이중 가닥 DNA 루프를 지칭한다. 기타 벡터에는 코스미드 (cosmid), 세균성 인공 염색체 (BAC) 및 효모 인공 염색체 (YAC)가 포함된다. 또 다른 유형의 벡터는 바이러스성 벡터인데, 여기서는 부가의 DNA 절편을 바이러스성 게놈에 연결시킬 수 있다 (다음에 보다 상세히 논의된다). 특정의 벡터는 이들이 도입되는 숙주 세포에서 자기 복제할 수 있다 (예를 들어, 숙주 세포에서 작용하는 복제 기점을 갖는 벡터). 기타 벡터는 숙주 세포 내로의 도입시 이러한 숙주 세포의 게놈 내로 통합됨으로써, 숙주 게놈을 따라 복제된다. 더우기, 특정의 바람직한 벡터는 이와 작동적으로 연결되는 유전자의 발현을 지시할 수 있다. 이러한 벡터는 본원에서 "재조합 발현 벡터" (또는 간단히 "발현 벡터")로서 지칭된다.

본원에 사용된 바와 같은 용어 "관심 있는 서열" 또는 "관심 있는 유전자"는 숙주 세포에서는 정상적으로 생성되지 않는 단백질을 전형적으로 암호화하는 핵산 서열을 지칭한다. 본원에 기재된 방법으로, 숙주 세포 게놈 내로 안정적으로 통합된 관심 있는 유전자 또는 관심 있는 하나 이상의 서열을 효율적으로 발현시킬 수 있다. 관심 있는 서열의 비-제한적 예에는 효소적 활성을 지닌 하나 이상의 폴리펩티드, 예를 들어 숙주에서 N-글리칸 합성에 영향을 미치는 효소, 예컨대 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, UDP-N-아세틸글루코사민 수송인자, 갈락토실트랜스퍼라제, UDP-N-아세틸갈락토실트랜스퍼라제, 시알릴트랜스퍼라제 및 푸코실트랜스퍼라제를 암호화하는 서열이 포함된다.

용어 "마커 서열" 또는 "마커 유전자"는 숙주 세포 내에서의 서열의 존재 또는 부재에 대한 양성 또는 음성 선별을 허용해 주는 활성을 발현할 수 있는 핵산 서열을 지칭한다. 예를 들어, 피. 파스토리스 (P. pastoris) URA 5 유전자가 마커 유전자인데, 이는 그의 존재가 우라실의 부재 하에서 성장할 수 있는 상기 유전자 함유 세포의 능력에 의해 선별될 수 있기 때문이다. 그의 존재는 또한, 5-FOA의 존재 하에서는 상기 유전자 함유 세포가 성장할 수 없다는 것에 의해 선별될 수 있다. 마커 서열 또는 유전자가 반드시 양성 및 음성 선별성 둘 다를 표시할 필요는 없다. 피. 파스토리스로부터의 마커 서열 또는 유전자의 비-제한적 예에는 ADE1, ARG4, HIS4 및 URA 3이 포함된다. 항생제 내성 마커 유전자의 경우에는, 카나마이신, 네오마이신, 제네티신 (또는 G418), 파로모마이신 (paromomycin) 및 히그로마이신 (hygromycin) 내성 유전자가 흔히 사용되어, 이들 항생제의 존재 하에서의 성장을 고려한다.

용어 "작동적으로 연결된" 발현 제어 서열은 이러한 발현 제어 서열이 관심 있는 유전자와 연속되어 관심 있는 유전자를 제어하는 연쇄 뿐만 아니라 관심 있는 유전자를 제어하기 위해 일정 거리에서 또는 트랜스로 작용하는 발현 제어 서열을 지칭한다.

용어 "발현 제어 서열" 또는 "조절 서열"은 상호 교환적으로 사용되고, 본원에 사용된 바와 같이, 이들과 작동적으로 연결되는 암호화 서열의 발현에 영향을 미치는 데에 필요한 폴리뉴클레오티드 서열을 지칭한다. 발현 제어 서열은 핵산 서열의 전사, 해독 후 사건 및 해독을 제어하는 서열이다. 발현 제어 서열에는 적당한 전사 개시, 종결, 프로모터 및 증강인자 서열; 효율적인 RNA 프로세싱 신호, 예컨대 스플라이싱 및 폴리아데닐화 신호; 세포질성 mRNA를 안정화시키는 서열; 해독 효율을 증강시키는 서열 (예: 리보솜 결합 부위); 단백질 안정성을 증강시키는 서열; 및 경우에 따라, 단백질 분비를 증강시키는 서열이 포함된다. 이러한 제어 서열의 성질은 숙주 유기체에 따라서 상이한데, 원핵 생물에서는 이러한 제어 서열에 일반적으로, 프로모터, 리보솜 결합 부위 및 전사 종결 서열이 포함된다. 용어 "제어 서열"에는 그의 존재가 발현에 필수적인 모든 성분이 최소한 포함되고, 그의 존재가 유리한 부가 성분, 예를 들어 리더 서열 및 융합 파트너 서열이 포함될 수도 있다.

본원에 사용된 바와 같은 용어 "재조합 숙주 세포" ("발현 숙주 세포", "발현 숙주 시스템", "발현 시스템" 또는 간단히 "숙주 세포")는 재조합 벡터를 도입시킨 세포를 지칭한다. 이러한 용어는 특별한 대상체 세포 뿐만 아니라 이러한 세포의 자손을 지칭한다는 것을 인지해야 한다. 돌연변이 또는 환경 상의 영향으로 인해 다음 세대에서 특정의 변형이 일어날 수도 있기 때문에, 이러한 자손은 사실상 모 세포와 동일하지 않을 수 있지만, 여전히 본원에 사용된 바와 같은 용어 "숙주 세포"의 범위 내에 포함된다. 재조합 숙주 세포는 배양하여 성장시킨 단리된 세포 또는 세포주일 수 있거나 또는 살아있는 조직 또는 유기체 내에 살고 있는 세포일 수 있다.

용어 "진핵"은 핵형성된 세포 또는 유기체를 지칭하고, 이에는 곤충 세포, 식물 세포, 포유류 세포, 동물 세포 및 저급 진핵 세포가 포함된다.

용어 "저급 진핵 세포"에는 효모, 진균, 깃-편모충 (collar-flagellate), 미포자충 (microsporidia), 벌집모양체 (alveolate) (예: 와편모충), 스트라메노파일 (stramenopile) (예: 갈색 해조류, 프로토조아), 홍조 식물 (rhodophyta) (예: 적색 해조류), 식물 (예: 녹색 해조류, 식물 세포, 이끼) 및 기타 원생생물이 포함된다. 효모 및 섬유상 진균에는 피키아 파스토리스, 피키아 핀란디카 (Pichia finlandica), 피키아 트레할로필라 (Pichia trehalophila), 피키아 콕클라매 (Pichia koclamae), 피키아 멤브라내파시엔스 (Pichia membranaefaciens), 피키아 미누타 (Pichia minuta) [오가타에아 미누타 (Ogataea minuta), 피키아 린드네리 (Pichia lindneri)], 피키아 오푼타아에 (Pichia opuntiae), 피키아 더모톨레란스 (Pichia thermotolerans), 피키아 살릭타리아 (Pichia salictaria), 피키아 귀에르쿰 (Pichia guercuum), 피키아 피예페리 (Pichia pijperi), 피키아 스팁티스 (Pichia stiptis), 피키아 메타놀리카 (Pichia methanolica), 피키아 종 (Pichia sp.), 사카로미세스 세레비지아에 (Saccharomyces cerevisiae), 사카로미세스 종 (Saccharomyces sp .), 한세눌라 폴리모르파 (Hansenula polymorpha), 클루이베로미세스 종 (Kluyveromyces sp .), 클루이베로미세스 락티스 (Kluyveromyces lactis), 칸디다 알비칸스 (Candida albicans), 아스페르길루스 니둘란스 (Aspergillus nidulans), 아스페르길루스 니거 (Aspergillus niger), 아스페르길루스 오리재 (Aspergillus oryzae), 트리코데르마 레에세이 (Trichoderma reesei), 크리소스포륨 루크노웬세 (Chrysosporium lucknowense), 푸사륨 종 (Fusarium sp.), 푸사륨 그라미네움 (Fusarium gramineum), 푸사륨 베네나툼 (Fusarium venenatum), 피스코미트렐라 파텐스 (Physcomitrella patens) 및 뉴로스포라 크라사 (Neurospora crassa)가 포함되지만, 이에 제한되지 않는다.

본원에 사용된 바와 같은 용어 "펩티드"는 짧은 폴리펩티드, 예를 들어 전형적으로 길이가 약 50개 미만 아미노산, 보다 전형적으로 길이가 약 30개 미만 아미노산인 폴리펩티드를 지칭한다. 본원에 사용된 바와 같은 상기 용어는 구조적 기능을 모방하므로 생물학적 기능을 모방하는 유사체 및 유사작용제를 포괄한다.

용어 "폴리펩티드"는 천연 발생적 및 비-천연 발생적 단백질, 및 그의 단편, 돌연변이체, 유도체 및 유사체 모두를 포괄한다. 폴리펩티드는 단량체성 또는 중합체성일 수 있다. 추가로, 폴리펩티드는 각각 하나 이상의 별개의 활성을 지닌 수많은 상이한 도메인을 포함할 수 있다.

용어 "단리된 단백질" 또는 "단리된 폴리펩티드"는 그의 기원 또는 유도체화 공급원을 통하여, (1) 그의 천연 상태로 수반되는 천연상 연관된 성분과 관련이 없거나, (2) 천연 상태에서는 발견되지 않는 순도로 존재는데, 이러한 순도는 기타 세포성 물질의 존재 측면에서 결정될 수 있거나 (예를 들어, 동일한 종으로부터의 기타 단백질이 없다), (3) 상이한 종으로부터의 세포에 의해 발현되거나, 또는 (4) 천연 상태에서는 존재하지 않는 단백질 또는 폴리펩티드이다 (예를 들어, 이는 천연 상태에서 발견되는 폴리펩티드의 단편이거나 이에는 천연 상태에서는 발견되지 않는 아미노산 유사체 또는 유도체, 또는 표준 펩티드 결합 이외의 연쇄가 포함된다). 따라서, 천연상 유래되는 세포와 상이한 세포성 시스템에서 합성되거나 화학적으로 합성되는 폴리펩티드는 그의 천연상 연관된 성분으로부터 "단리될" 것이다. 폴리펩티드 또는 단백질은 또한, 당해 분야에 널리 공지된 단백질 정제 기술을 이용하여, 단리에 의해 천연상 연관된 성분이 실질적으로 없게 만들 수 있다. 따라서, 정의된 바와 같은 "단리된"은 이와 같이 언급된 단백질, 폴리펩티드, 펩티드 또는 올리고펩티드를 반드시 그의 천연 환경으로부터 물리적으로 제거시켜야 하는 것을 요구하지는 않는다.

본원에 사용된 바와 같은 용어 "폴리펩티드 단편"은 완전한 길이의 폴리펩티드와 비교해서 결실이 있는, 예를 들어 아미노-말단 및/또는 카르복시-말단 결실이 있는 폴리펩티드를 지칭한다. 바람직한 실시양태에서, 폴리펩티드 단편은 이러한 단편의 아미노산 서열이 천연 발생적 서열 내의 상응하는 위치와 동일한 연속되는 서열이다. 단편은 전형적으로, 길이가 5, 6, 7, 8, 9 또는 10개 이상 아미노산, 바람직하게 길이가 12, 14, 16 또는 18개 이상 아미노산, 보다 바람직하게 길이가 20개 이상 아미노산, 보다 바람직하게 25, 30, 35, 40 또는 45개 이상 아미노산, 보다 더 바람직하게 길이가 50 또는 60개 이상 아미노산, 보다 더 바람직하게 길이가 70개 이상 아미노산이다.

"변형된 유도체"는 일차 구조적 서열에 있어서는 실질적으로 상동성이지만, 예를 들어 생체내 또는 시험관내 화학적 및 생화학적 변형이 포함되거나 또는 천연 폴리펩티드에서는 발견되지 않는 아미노산이 혼입되는 폴리펩티드 또는 그의 단편을 지칭한다. 이러한 변형에는, 예를 들어 당업자에 의해 용이하게 인지되는 바와 같은 아세틸화, 카르복실화, 인산화, 글리코실화, 유비퀴틴화, 표지화, 예를 들어 방사성 핵종으로의 표지화, 및 각종 효소적 변형이 포함된다. 폴리펩티드를 표지화시키는 각종 방법, 및 이러한 목적에 유용한 각종 치환기 또는 표지는 당해 분야에 널리 공지되어 있고, 이에는 방사성 동위원소, 예컨대 ¹²⁵I, ³²P, ³⁵S 및 ³H, 표지된 항-리간드와 결합하는 리간드 (예: 항체), 형광단, 화학발광제, 효소, 및 표지된 리간드에 대한 특이적 결합성 쌍 구성원으로서 제공될 수 있는 항-리간드가 포함된다. 표지의 선택은 요구되는 민감도, 프라이머와의 접합 용이성, 안정성 요구 사항, 및 이용 가능한 수단에 좌우된다. 폴리펩티드를 표지화하는 방법은 당해 분야에 널리 공지되어 있다 (예를 들어, 문헌 [Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Associates (1992, and Supplements to 2002)] (본원에 참고로 포함된다) 참조).

용어 "키메라 유전자" 또는 "키메라 뉴클레오티드 서열"은 이종 뉴클레오티드 서열와 커플링된 뉴클레오티드 서열 또는 단편을 포함하는 뉴클레오티드 서열을 지칭한다. 키메라 서열은 융합 단백질의 발현에 유용하다. 키메라 유전자 또는 키메라 뉴클레오티드 서열은 의도한 숙주 세포에 대해 이종이고, 이종 재조합 단백질을 생성하는 데에 유익한 특성을 지닐 수 있는 하나 이상의 단편 또는 도메인을 포함할 수도 있다. 일반적으로, 키메라 뉴클레오티드 서열은 유전자로부터 30개 이상의 연속되는 뉴클레오티드를 포함하고, 보다 바람직하게는 적어도 60 또는 90개 또는 그 초과의 뉴클레오티드을 포함한다. 의도한 숙주 세포에 대해 이종이긴 하지만, 의도한 재조합 단백질과는 상동성인 하나 이상의 단편 또는 도메인을 갖는 키메라 뉴클레오티드 서열은 본 발명에서 특별한 용도를 지니고 있다. 예를 들어, 재조합 인간 당단백질을 발현하기 위해 피. 파스토리스 숙주 세포를 이용한 발현 시스템에서 사용하고자 하는 키메라 유전자는 바람직하게, 인간 기원의 하나 이상의 단편 또는 도메인, 예를 들어 잠재적으로 치료적 가치가 있는 인간 단백질을 암호화하는 서열을 가질 것이지만, 나머지 키메라 유전자, 예를 들어 숙주 세포가 키메라 유전자를 프로세싱하고 발현시키게 해 줄 조절 서열은 바람직하게, 피. 파스토리스 기원일 것이다. 경우에 따라, 인간 기원의 단편은 또한, 숙주 세포에서의 발현을 위해 코돈-최적화시킬 수 있다 (예를 들어, 본원에 참고로 포함되는 미국 특허 제6,884,602호 참조).

용어 "융합 단백질" 또는 "키메라 단백질"은 이종 아미노산 서열과 커플링된 폴리펩티드 또는 단편을 포함하는 폴리펩티드를 지칭한다. 융합 단백질이 유용한데, 이는 이들이 2가지 이상의 상이한 단백질로부터 2가지 이상의 목적하는 기능적 요소를 함유하도록 구축될 수 있기 때문이다. 융합 단백질은 관심 있는 폴리펩티드로부터 10개 이상의 연속되는 아미노산, 보다 바람직하게 20 또는 30개 이상의 아미노산, 보다 더 바람직하게 40, 50 또는 60개 이상의 아미노산, 보다 더 바람직하게 75, 100 또는 125개 이상의 아미노산을 포함한다. 본 발명의 단백질 전체를 포함하는 융합물은 특별한 용도를 갖는다. 본 발명의 융합 단백질 내에 포함된 이종 폴리펩티드는 길이가 6개 이상의 아미노산, 종종 길이가 8개 이상의 아미노산, 유용하게는 길이가 15, 20 및 25개 이상의 아미노산이다. 융합물에는 또한, 보다 큰 폴리펩티드, 또는 심지어 전체 단백질, 예컨대 특별한 용도를 지닌 그린 형광성 단백질 ("GFP") 발색단-함유 단백질이 포함된다. 융합 단백질은 상이한 단백질 또는 펩티드를 암호화하는 핵산 서열과의 동일 프레임 내에서 폴리펩티드 또는 그의 단편을 암호화하는 핵산 서열을 구축한 다음, 융합 단백질을 발현시킴으로써 재조합적으로 생성시킬 수 있다. 또 다른 한편, 융합 단백질은 폴리펩티드 또는 그의 단편을 또 다른 단백질과 가교 결합시킴으로써 화학적으로 생성시킬 수 있다.

용어 "비-펩티드 유사체"는 기준 폴리펩티드와 유사한 특성을 지닌 화합물을 지칭한다. 비-펩티드 화합물은 또한, "펩티드 유사작용제"로 지칭될 수 있다 (예를 들어, 문헌 [Jones, Amino Acid and Peptide Synthesis, Oxford University Press (1992)]; [Jung, Combinatorial Peptide and Nonpeptide Libraries : A Handbook, John Wiley (1997)]; [Bodanszky et al., Peptide Chemistry-- A Practical Textbook, Springer Verlag (1993)]; [Synthetic Peptides : A Users Guide, (Grant, ed., W. H. Freeman and Co., 1992)]; [Evans et al., J. Med . Chem . 30:1229 (1987)]; [Fauchere, J. Adv . Drug Res . 15: 29 (1986)]; [Veber and Freidinger, Trends Neurosci., 8: 392-396 (1985)]; 및 [상기 각각에 인용된 참고 문헌] (본원에 참고로 포함된다) 참조). 이러한 화합물은 종종, 컴퓨터를 이용한 분자 모델링의 도움으로 개발된다. 본 발명의 유용한 펩티드와 구조상 유사한 펩티드 유사작용제를 사용하여 등가 효과를 유발시킬 수 있으므로, 본 발명의 일부인 것으로 고려된다.

본원에 사용된 바와 같은 용어 "영역"은 생체 분자의 일차 구조의 물리적으로 연속되는 부분을 지칭한다. 단백질의 경우, 영역은 해당 단백질의 아미노산 서열의 연속되는 부분으로써 규정된다.

본원에 사용된 바와 같은 용어 "도메인은 생체 분자의 공지되거나 추정되는 기능에 기여하는 생체 분자의 구조를 지칭한다. 도메인은 그의 영역 또는 일부와 함께 공동-확장될 수 있고; 도메인에는 생체 분자의 별개의 비-연속된 영역이 포함될 수도 있다.

본원에 사용된 바와 같은 용어 "분자"는 소분자, 펩티드, 단백질, 당, 뉴클레오티드, 핵산, 지질 등을 포함하지만, 그에 제한되지 않는 모든 화합물을 의미하고, 이러한 화합물은 천연 또는 합성일 수 있다.

본원에 사용된 바와 같은 용어 "포함하는" 또는 그의 변수들은 언급된 정수 또는 정수 군을 포함하시키는 것을 의미하지만, 기타 어떠한 정수 또는 정수 군을 배제하지 않는 다는 것을 인지해야 할 것이다.

본원에 사용된 바와 같은 "우세적으로" 또는 그의 변수들, 예컨대 "우세" 또는 "우세한"은 당단백질을 효소로 처리하고 방출된 글리칸을 질량 분광법, 예를 들어 MALDI-TOF MS에 의해 분석한 후 총 O-글리칸 또는 N-글리칸의 가장 높은 몰 %를 갖는 글리칸 종을 의미한다는 것을 인지해야 할 것이다. 달리 언급하면, "우세적으로"는 특이적 "우세" 글리코형태가 기타 어떠한 개별적 실체 보다 더 많은 몰 %로 존재하는 개별적 실체로서 정의된다. 예를 들어, 조성물이 종 A 40 몰%, 종 B 35 몰% 및 종 C 25 몰%로 이루어진 경우, 이러한 조성물은 종 A를 우세적으로 포함한다.

도 1은 인간 및 피. 파스토리스에서의 N-글리코실화 경로를 예시한 것이다. ER에서의 초기 사건이 고도로 보존되는데, 이에는 글루코시다제 I 및 II에 의한 3개 글루코스 잔기의 제거, 및 동일한 코어 구조인 Man₈GlcNAc₂ (Man8B)를 유발시키는 ER 만노시다제에 의한 단일 특이적 α-1,2-연결된 만노스 잔기의 트리밍 (trimming)이 포함된다. 그러나, 프로세싱 사건은 골지에서 갈라진다. Mns, α-1,2-만노시다제; MnsII, 만노시다제 II; GnT I, α-1,2-N-아세틸글루코사미닐트랜스퍼라제 I; GnT II, α-1,2-N-아세틸글루코사미닐트랜스퍼라제 II; MnT, 만노실트랜스퍼라제. 2개의 코어 GlcNAc 잔기가 모든 경우에 존재하긴 하지만, 명칭에서는 생략하였다.
도 2는 N-글리코실화에서의 주요 중간 단계 뿐만 아니라 각각의 글리칸 구조 (GS)를 생산하는 유전적으로 공학처리시킨 피키아 파스토리스 균주를 지칭하는 약칭을 예시한 것이다.
도 3은 N-글리코시다제 F 방출된 N-글리칸의 MALDI-TOF 질량 분광법 (MS) 분석을 예시한 것이다. K3 (인간 플라스미노겐의 크링글 3 도메인)이 피. 파스토리스 균주 GS115-유래된 야생형 대조군 (공급처: Invitrogen, Carlsbad, CA), YSH44, YSH71, RDP52, 및 RDP80에서 생성되었고, 이를 Ni-친화 크로마토그래피에 의해 배양 상등액으로부터 정제하였다. N-글리칸을 N-글리코시다제 F 처리에 의해 방출시켰고, 이를 대상으로 하여 MALDI-TOF MS 분석 (양성 모드; 도 3g는 예외적으로 음성 모드이다)을 수행하였는데, 이는 나트륨 또는 칼륨 부가물인 것으로 여겨진다. 2개의 코어 GlcNAc 잔기가 존재하긴 하지만, 본 명칭에서 생략되었다. GN, GlcNAc; M, 만노스.
도 3a: GS115-유래된 야생형 대조군 균주에서 생성된 N-글리칸;
도 3b: 균주 YSH44 내의 K3 상에서 생성된 N-글리칸;
도 3c: 균주 YSH71 (hGalTI를 발현하는 YSH44) 내의 K3 상에서 생성된 N-글리칸;
도 (3d) 균주 RDP52 (hGalTI 및 SpGALE를 발현하는 YSH44) 내의 K3 상에서 생성된 N-글리칸;
도 (3e) 균주 RDP80 (hGalTI, SpGALE 및 DmUGT를 발현하는 YSH44) 내의 K3 상에서 생성된 N-글리칸;
도 (3f) 시험관 내에서 α-갈락토시다제 처리 후 RDP80으로부터의 글리칸; 및
도 (3g) α-2,6-(N)-시알릴트랜스퍼라제를 이용한 처리 후 음성 모드의 RDP80으로부터의 글리칸.
도 4는 를루아르 갈락토스 활용 경로를 예시한 것이다. 세포외 갈락토스는 갈락토스 퍼미아제를 통하여 유입된다. 갈락토스는 효소 갈락토키나제, 갈락토스-1-포스페이트 우리딜트랜스퍼라제 및 UDP-갈락토스 C4-에미퍼라제의 작용에 의해 글루코스-6-포스페이트로 전환된다. 에스. 세레비지아에 (S. cerevisiae)로부터의 단백질 명칭이 괄호 안에 있다.
도 5는 피. 파스토리스 글리코-공학처리시킨 균주 YGLY578-1의 구축을 도시한 것이다. 골지 글리코실트랜스퍼라제를 암호화하는 피. 파스토리스 유전자 OCH1 , MNN4 , PNO1 , MNN4L1, 및 BMT2를 녹아웃 (knock-out)시킨 다음, 12개 이종 유전자를 녹인 (knock-in)하였는데, 이에는 분비된 hK3에 대한 발현 카세트가 포함된다. YGLY578-1은 Gal₂GlcNAc₂Man₃GlcNAc₂ N-글리칸을 갖는 당단백질을 생성할 수 있다. CS, 역선별.
도 6은 플라스미드 pRCD977b의 특징 다이아그램을 도시한 것이다. 이러한 플라스미드는 선별성 마커로서 PpHIS1 유전자를 이용하는 동안 피. 파스토리스 ARG1 유전자 내로 통합되어 이를 결실시키고, 각각 PpOCH1 , PpGAPDH , PpPMA1, 및 PpTEF 프로모터의 제어 하에 완전한 길이의 디. 멜라노가스터 (D. melanogaster) 골지 UDP-갈락토스 수송인자 (DmUGT), 완전한 길이의 에스. 세레비지아에 갈락토키나제 (ScGAL1), 완전한 길이의 에스. 세레비지아에 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 (ScGAL7), 및 에스. 세레비지아에 갈락토스 퍼미아제 (ScGAL2)를 암호화하는 발현 카세트를 함유하는 arg1 :: HIS1 녹아웃 플라스미드이다. TT는 전사 종결 서열을 지칭한다.
도 7은 에스. 세레비지아에 GAL1 , GAL2 및 GAL7 유전자를 발현하는 글리코-공학처리시킨 피. 파스토리스 균주는 단독 탄소원으로서 갈락토스 상에서 성장할 수 있는 반면, 모 균주는 그럴 수 없다는 것을 도시하고 있다. ScGAL10 및 hGalTIβ를 발현하는 글리코-공학처리시킨 균주 YGLY578-1을, ScGAL1, ScGAL7 및 ScGAL2를 암호화하는 발현 카세트를 함유하는 플라스미드 pRCD977b로 형질전환시켰다. 균주를 효모 질소 기재, 바이오틴, 및 탄소원으로서 3% 갈락토스 또는 2% 글루코스를 함유하거나 어느 것도 함유하지 않는 한정 배지 상에서 배양하였다.
도 8은 피. 파스토리스 글리코-공학처리시킨 균주 YGLY317-36의 구축을 도시한 것이다. 피. 파스토리스 균주 YGLY16-3은 5개 효모 글리코실트랜스퍼라제를 녹아웃시킴으로써 생성시켰다. 8개 이종 유전자를 후속 녹인시키면, 인간 N-글리칸 Gal₂GlcNAc₂Man₃GlcNAc₂를 분비된 단백질로 전이시킬 수 있는 균주 RDP696-2가 산출되었다. CSTR 배양을 통하여 원기 왕성한 클론을 선별하고 분비된 인간 Fc를 발현하는 플라스미드를 도입하면, 균주 YGLY317-36이 산출되었다. CS, 역선별.
도 9는 플라스미드 pGLY954의 특징 다이아그램을 도시한 것이다. 이 플라스미드는 피. 파스토리스 TRP1 유전자를 결실시키지 않으면서 이러한 유전자 자리 내로 통합되는 KINKO 플라스미드이다. 이 플라스미드는 각각 PpHHT1 및 PpPMA1 프로모터의 제어 하에 완전한 길이의 에스. 세레비지아에 갈락토키나제 (ScGAL1), 및 완전한 길이의 에스. 세레비지아에 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 (ScGAL7)를 암호화하는 발현 카세트를 함유한다. 상기 플라스미드는 또한, PpGAPDH 프로모터의 제어 하에 인간 갈락토실 트랜스퍼라제 I 촉매적 도메인의 N-말단과 융합된 ScMnt1 (ScKre2) 리더 펩티드 (33)를 포함하는 분비성 경로 표적화 융합 단백질 (CO hGalTI)을 암호화하는 발현 카세트를 함유한다. TT는 전사 종결 서열을 지칭한다.
도 10은 BMMY 배지 단독에서 유도되거나 또는 글루코스 또는 갈락토스를 함유하는 배지에서 유도된 균주 PBP317-36 및 RDP783에서 생성된 인간 Fc 단편 상에서 N-글리칸을 MALDI-TOF MS 분석한 것을 도시한 것이다. 균주를 포화된 시드 배양물로부터 약 1 OD가 되도록 접종하였고, 800 ml의 BMGY에서 72시간 동안 배양한 다음, 분할시키고, 배양 육즙의 100 ml 분취액을 원심분리시키며, 25 ml의 BMMY, 25 ml의 BMMY + 0.5% 글루코스, 또는 25 ml의 BMMY + 0.5% 갈락토스에서 24시간 동안 유도시켰다. 단백질 A 정제된 단백질을 대상으로 하여 단백질 N-글리코시다제 F 분해시키고, 방출된 N-글리칸을 MALDI-TOF MS에 의해 분석하였다. 도 A-C, 균주 PBP317-36에서 생성된 인간 Fc 상의 N-글리칸; 도 D-E, 균주 RDP783에서 생성된 인간 Fc 상의 N-글리칸.
도 11은 피. 파스토리스 글리코-공학처리시킨 균주 YDX477의 구축을 도시한 것이다. 피. 파스토리스 균주 YGLY16-3 (Δ och1 , Δ pno1 , Δ bmt2 , Δ mnn4a , Δm nn 4b)은 5개 효모 글리코실트랜스퍼라제를 녹아웃시킴으로써 생성시켰다. 8개 이종 유전자를 후속 녹인시키면, 인간 N-글리칸 Gal₂GlcNAc₂Man₃GlcNAc₂를 분비된 단백질로 전이시킬 수 있는 균주 RDP697-1이 산출되었다. 분비된 항체를 발현하는 플라스미드 및 트리코데르마 레에세이 MNS1의 분비된 형태를 발현하는 플라스미드를 도입하면, 균주 YDX477이 산출되었다. CS, 역선별.
도 12는 플라스미드 pGLY1418의 특징 다이아그램을 도시한 것이다. 이 플라스미드는 피. 파스토리스 TRP1 유전자를 결실시키지 않으면서 이러한 유전자 자리 내로 통합되는 KINKO 플라스미드이다. 이 플라스미드는 각각 PpHHT1 및 PpPMA1 프로모터의 제어 하에 완전한 길이의 ScGAL1 및 ScGAL7을 암호화하는 발현 카세트를 함유한다. 상기 플라스미드는 또한, PpGAPDH 프로모터의 제어 하에 인간 갈락토실 트랜스퍼라제 I 촉매적 도메인의 N-말단과 융합된 ScMnt1 (ScKre2) 리더 펩티드를 포함하는 분비성 경로 표적화 융합 단백질 (hGalTI)을 암호화하는 발현 카세트를 함유한다. TT는 전사 종결 서열을 지칭한다.
도 13a-f는 BMMY 배지 단독에서 유도되거나 또는 갈락토스를 함유하는 배지에서 유도된 균주 YDX477 및 RDP968-1에서 생성된 항-Her2 항체 상에서 N-글리칸을 MALDI-TOF MS 분석한 것을 도시한 것이다. 균주를 150 ml의 BMGY에서 72시간 동안 배양한 다음, 분할시키고, 배양 육즙의 50 ml 분취액을 원심분리시키며, 25 ml의 BMMY, 25 ml의 BMMY + 0.1% 갈락토스, 또는 25 ml의 BMMY + 0.5% 갈락토스에서 24시간 동안 유도시켰다. 단백질 A 정제된 단백질을 대상으로 하여 단백질 N-글리코시다제 F 분해시키고, 방출된 N-글리칸을 MALDI-TOF MS에 의해 분석하였다. 도 13a-c, 균주 YDX477에서 생성된 항체 상의 N-글리칸; 도 13d-f, 균주 RDP968-1에서 생성된 항체 상의 N-글리칸.
도 14는 플라스미드 pAS24의 특징 다이아그램을 도시한 것이다. 이러한 플라스미드는 PpURA3 선별성 마커를 함유하고, PpOCH1 프로모터의 제어 하에 완전한 길이의 마우스 골지 UDP-GlcNAc 수송인자 (MmSLC35A3)를 암호화하는 발현 카세트를 함유하는 피. 파스토리스 bmt2 녹아웃 플라스미드이다. TT는 전사 종결 서열을 지칭한다.
도 15는 플라스미드 pRCD742b의 특징 다이아그램을 도시한 것이다. 이 플라스미드는 PpURA5 선별성 마커를 함유할 뿐만 아니라 PpGAPDH 프로모터의 제어 하에 마우스 만노시다제 I 촉매적 도메인의 N-말단과 융합된 ScSec12 리더 펩티드를 포함하는 분비성 경로 표적화 융합 단백질 (FB8 MannI)을 암호화하는 발현 카세트, PpPMA1 프로모터의 제어 하에 인간 GlcNAc 트랜스퍼라제 I (GnT I) 촉매적 도메인의 N-말단과 융합된 PpSec12 리더 펩티드를 포함하는 분비성 경로 표적화 융합 단백질 (CONA10)을 암호화하는 발현 카세트, 및 PpSEC4 프로모터의 제어 하에 마우스 골지 UDP-GlcNAc 수송인자 (MmSLC35A3)를 암호화하는 완전한 길이의 유전자를 함유하는 KINKO 플라스미드이다. TT는 전사 종결 서열을 지칭한다.
도 16은 플라스미드 pDMG47의 특징 다이아그램을 도시한 것이다. 이 플라스미드는 PpGAPDH 프로모터의 제어 하에 드로소필라 멜라노가스터 (Drosophila melanogaster) 만노시다제 II 촉매적 도메인의 N-말단과 융합된 ScMnn2 리더 펩티드를 포함하는 분비성 경로 표적화 융합 단백질 (KD53)을 암호화하는 발현 카세트를 포함한다. 이 플라스미드는 또한, PpPMA1 프로모터의 제어 하에 래트 GlcNAc 트랜스퍼라제 II (GnT II) 촉매적 도메인의 N-말단과 융합된 ScMnn2 리더 펩티드를 포함하는 분비성 경로 표적화 융합 단백질 (TC54)을 암호화하는 발현 카세트를 함유한다. TT는 전사 종결 서열을 지칭한다.
도 17은 플라스미드 pRCD823b의 특징 다이아그램을 도시한 것이다. 이 플라스미드는 피. 파스토리스 HIS4 유전자를 결실시키지 않으면서 이러한 유전자 자리 내로 통합되고 PpURA5 선별성 마커를 함유하는 KINKO 플라스미드이다. 이 플라스미드는 PpGAPDH 프로모터의 제어 하에 래트 GlcNAc 트랜스퍼라제 II (GnT II) 촉매적 도메인의 N-말단과 융합된 ScMnn2 리더 펩티드를 포함하는 분비성 경로 표적화 융합 단백질 (TA54)을 암호화하는 발현 카세트, 및 각각 PpOCH1 및 PpPMA1 프로모터의 제어 하에 완전한 길이의 디. 멜라노가스터 골지 UDP-갈락토스 수송인자 (DmUGT) 및 에스. 세레비지아에 UDP-갈락토스 C4-에피머라제 (ScGAL10)를 암호화하는 발현 카세트를 포함한다. TT는 전사 종결 서열을 지칭한다.
도 18은 플라스미드 pGLY893a의 특징 다이아그램을 도시한 것이다. 이 플라스미드는 PpARG4 선별성 마커를 함유하는 피. 파스토리스 his1 녹아웃 플라스미드이다. 이 플라스미드는 PpPMA1 프로모터의 제어 하에 드로소필라 멜라노가스터 만노시다제 II 촉매적 도메인의 N-말단과 융합된 PpSEC12 리더 펩티드를 포함하는 분비성 경로 표적화 융합 단백질 (KD10)을 암호화하는 발현 카세트, PpTEF 프로모터의 제어 하에 래트 GlcNAc 트랜스퍼라제 II (GnT II) 촉매적 도메인의 N-말단과 융합된 ScMnt1 (ScKre2) 리더 펩티드를 포함하는 분비성 경로 표적화 융합 단백질 (TA33)을 암호화하는 발현 카세트, 및 PpGAPDH 프로모터의 제어 하에 인간 갈락토실 트랜스퍼라제 I 촉매적 도메인의 N-말단과 융합된 ScMnn2 리더 펩티드를 포함하는 분비성 경로 표적화 융합 단백질을 암호화하는 발현 카세트를 함유한다. TT는 전사 종결 서열을 지칭한다.
도 19는 플라스미드 pRCD742a의 특징 다이아그램을 도시한 것이다. 이 플라스미드는 피. 파스토리스 ADE1 유전자를 결실시키지 않으면서 이러한 유전자 자리 내로 통합되고 PpURA5 선별성 마커를 함유하는 KINKO 플라스미드이다. 이 플라스미드는 PpGAPDH 프로모터의 제어 하에 마우스 만노시다제 I 촉매적 도메인의 N-말단과 융합된 ScSEC12 리더 펩티드를 포함하는 분비성 경로 표적화 융합 단백질 (FB8 MannI)을 암호화하는 발현 카세트, PpPMA1 프로모터의 제어 하에 인간 GlcNAc 트랜스퍼라제 I (GnT I) 촉매적 도메인의 N-말단과 융합된 PpSEC12 리더 펩티드를 포함하는 분비성 경로 표적화 융합 단백질 (CONA10)을 암호화하는 발현 카세트, 및 PpSEC4 프로모터의 제어 하에 완전한 길이의 마우스 골지 UDP-GlcNAc 수송인자 (MmSLC35A3)를 암호화하는 발현 카세트를 함유한다. TT는 전사 종결 서열을 지칭한다.
도 20은 플라스미드 pRCD1006의 특징 다이아그램을 도시한 것이다. 이 플라스미는 선별성 마커로서 PpURA5 유전자를 함유하는 피. 파스토리스 his1 녹아웃 플라스미드이다. 이 플라스미드는 PpGAPDH 프로모터의 제어 하에 인간 갈락토실 트랜스퍼라제 I 촉매적 도메인의 N-말단과 융합된 ScMnt1 (ScKre2) 리더 펩티드를 포함하는 분비성 경로 표적화 융합 단백질 (XB33)을 암호화하는 발현 카세트, 및 각각 PpOCH1 및 PpPMA1 프로모터의 제어 하에 완전한 길이의 디. 멜라노가스터 골지 UDP-갈락토스 수송인자 (DmUGT) 및 에스. 폼베 (S. pombe) UDP-갈락토스 C4-에피머라제 (SpGALE)를 암호화하는 발현 카세트를 함유한다. TT는 전사 종결 서열을 지칭한다.
도 21은 플라스미드 pGLY167b의 특징 다이아그램을 도시한 것이다. 이 플라스미드는 PpURA3 선별성 마커를 함유하고, PpGAPDH 프로모터의 제어 하에 드로소필라 멜라노가스터 만노시다제 II 촉매적 도메인의 N-말단과 융합된 ScMNN2 리더 펩티드를 포함하는 분비성 경로 표적화 융합 단백질 (CO-KD53)을 암호화하는 발현 카세트, 및 PpPMA1 프로모터의 제어 하에 래트 GlcNAc 트랜스퍼라제 II (GnT II) 촉매적 도메인의 N-말단과 융합된 ScMnn2 리더 펩티드를 포함하는 분비성 경로 표적화 융합 단백질 (CO-TC54)을 암호화하는 발현 카세트를 함유하는 피. 파스토리스 arg1 녹아웃 플라스미드이다. TT는 전사 종결 서열을 지칭한다.
도 22는 플라스미드 pBK138의 특징 다이아그램을 도시한 것이다. 이 플라스미드는 피. 파스토리스 AOX1 프로모터를 중복시키면서 이러한 프로모터 내로 통합되는 롤인 (roll-in) 플라스미드이다. 이 플라스미드는 인간 Fc 항체 단편 (인간 IgG1 H 쇄의 C-말단 233-aa)의 N-말단과 융합된 에스. 세레비지아에 알파 교배 인자 프리-신호 서열을 포함하는 융합 단백질을 암호화하는 발현 카세트를 함유한다. TT는 전사 종결 서열을 지칭한다.
도 23은 플라스미드 pGLY510의 특징 다이아그램을 도시한 것이다. 이 플라스미드는 피. 파스토리스 TRP2 유전자를 중복시키면서 이러한 유전자 내로 통합되고 AOX1 프로모터-ScCYC1 종결인자 발현 카세트 뿐만 아니라 PpARG1 선별성 마커를 함유하는 롤인 플라스미드이다. TT는 전사 종결 서열을 지칭한다.
도 24는 플라스미드 pDX459-1의 특징 다이아그램을 도시한 것이다. 이 플라스미드는 피. 파스토리스 AOX2 프로모터를 중복시키면서 이러한 프로모터를 표적으로 하여 이 내로 통합되고 Zeo^R을 함유하는 롤인 플라스미드이다. 이 플라스미드는 각각 아스페르길루스 니거 알파-아밀라제 신호 서열과 N-말단에서 융합되고 피. 파스토리스 AOX1 프로모터의 제어 하에 항-HER2 항체 중쇄 및 항-HER2 항체 경쇄를 암호화하는 별개의 발현 카세ㅌ를 함유한다. TT는 전사 종결 서열을 지칭한다.
도 25는 플라스미드 pGLY1138의 특징 다이아그램을 도시한 것이다. 이 플라스미드는 피. 파스토리스 ADE1 유전자를 중복시키면서 이러한 유전자 자리 내로 통합되고, 아비산염 내성을 부여해 주는 ScARR3 선별성 마커 유전자 카세트를 함유할 뿐만 아니라 PpAOX1 프로모터의 제어 하에 그의 N-말단에서 에스. 세레비지아에 알파 인자 프리-신호 서열과 융합된 MNS1 촉매적 도메인을 포함하는 분비된 트리코데르마 레에세이 MNS1을 암호화하는 발현 카세트를 함유하는 롤인 플라스미드이다. TT는 전사 종결 서열을 지칭한다.

<발명의 상세한 설명>

효모는 세포내 및 분비된 둘 다의 재조합 단백질을 성공적으로 생산하여 왔다 (예를 들어, 문헌 [Cereghino Cregg FEMS Microbiology Reviews 24(1): 45-66 (2000)]; [Harkki, et al. Bio-Technology 7(6): 596 (1989)]; [Berka, et al. Abstr.Papers Amer. Chem.Soc.203: 121-BIOT (1992)]; [Svetina, et al. J. Biotechnol. 76(2-3): 245-251 (2000)] 참조). 각종 효모, 예컨대 케이. 락티스 (K. lactis), 피키아 파스토리스, 피키아 메타놀리카 (Pichia methanolica), 및 한세눌라 폴리모르파 (Hansenula polymorpha)는 재조합 단백질을 생성하기 위한 진핵 발현 시스템으로서 특히 중요한 역할을 하였는데, 이는 이들 효모가 고 세포 밀도로 성장할 수 있고 다량의 재조합 단백질을 분비할 수 있기 때문이다. 그러나, 이들 진핵 미생물 중의 어떠한 것에서도 발현된 당단백질은 포유류에서 생성된 것과 N-글리칸 구조 면에서 실질적으로 상이하다. 이러한 글리코실화 상의 차이로 인해, 효모 또는 섬유상 진균은 많은 치료용 당단백질을 생성하기 위한 숙주로서 사용되지 못하였다.

효모를 치료용 당단백질 생성에 사용할 수 있게 하기 위해, 효모를 유전적으로 공학처리시켜 하이브리드 또는 복합 N-글리칸을 갖는 당단백질을 생성시켜 왔다. 특별한 하이브리드 또는 복합 N-글리칸을 포함하는 조성물을 생산할 수 있는 재조합 효모가, 예를 들어 미국 특허 제7,029,872호 및 미국 특허 제7,449,308호에 기재되었다. 또한, 문헌 [Hamilton et al., Science 313:1441-1443 (2006)] 및 미국 공개 특허공보 제2006/0286637호에는 효모 피키아 파스토리스에서의 글리코실화경로의 인간화 및 말단 시알산과의 복합 N-글리코실화를 수반한 재조합 인간 당단백질의 분비가 보고되었다. 올리고사카라이드 구조 Gal₂GlcNAc₂Man₃GlcNAc₂ (G2)를 갖는 말단 시알산에 대한 전구체 N-글리칸은 인간 혈청으로부터 단리된 몇 가지 단백질, 예를 들어 난포 자극 호르몬 (FSH), 아시알로트랜스페린 상에 우세한 N-글리칸으로서 발견되고, 가장 특히는, 인간 면역글로불린 (항체) 상에 상이한 양으로 발견되는 구조이다. 데이비드슨 (Davidson) 등의 미국 공개 특허공보 제2006/0040353호는 갈락토스 말단화 N-글리칸을 생성시키기 위해 유전적으로 공학처리시킨 효모 세포를 이용하여 갈락토실화 당단백질을 수득하기 위한 효율적인 공정을 교시하고 있다. 이들 숙주 세포는 다양한 양의 G0 올리고사카라이드 구조를 수반하는 G2 또는 G1 (GalGlcNAc₂Man₃GlcNAc₂) 올리고사카라이드 구조의 각종 혼합물을 갖는 당단백질 조성물을 생산할 수 있다. G0는 GlcNAc₂Man₃GlcNAc₂인데, 이는 갈락토실트랜스퍼라제에 대한 기질이다. 그러나, 특정의 당단백질, 특히 항체 및 Fc 단편의 경우에는, 갈락토스 전이 공정 효율이 최적에 미치지 못한 것으로 밝혀졌다. 항체 및 Fc 단편의 경우, 세포내 프로세싱 동안 항체 또는 Fc 단편 상의 글리코실화 부위의 위치 및 접근 가능성은 이러한 항체 또는 Fc 단편의 N-글리칸 상으로의 효율적인 갈락토스 전이를 억제시키는 것으로 여겨진다. 따라서, 갈락토스를 함유하는 올리고사카라이드의 양은 크링글 3 단백질과 같은 기타 당단백질에 대해 관찰된 것 보다 적다. 이러한 문제점을 극복하기 위해, 본 발명은 항체 또는 Fc 단편의 N-글리칸 상으로의 갈락토스 전이 양을 증가시킴으로써, G0 함유 항체 또는 Fc 단편에 비해 G1 및 G2 함유 항체 또는 Fc 단편의 양을 증가시키기 위한 수단을 제공한다.

피키아 파스토리스는 생존을 위해 제한된 수의 탄소원 만을 사용할 수 있다. 현재, 이들 탄소원은 글리세롤, 글루코스, 메탄올, 및 아마도, 람노스 및 만노스인 것으로 공지되어 있지만, 갈락토스는 아니다. 피키아 파스토리스를 이용하는 많은 상업적 생산 공정에서, 재조합 단백질의 발현은 메탄올의 존재 하에서는 활성이지만 글리세롤의 존재 하에서는 억제되는 AOX 프로모터의 제어 하에 있다. 따라서, 피키아 파스토리스는 통상적으로, 세포의 농도가 목적 수준에 도달할 때까지 글리세롤 또는 글리세롤/메탄올을 함유하는 배지에서 성장시키는데, 이때 재조합 단백질의 발현은 이러한 배지를 탄소원으로서 메탄올 만을 함유하는 배지로 대체시킴으로써 이루어진다. 그러나, 상기 세포는 저 에너지 상태로 있는데, 이는 메탄올이 1개의 탄소 만을 함유하는 불량한 탄소원이기 때문이다. 따라서, 피키아 파스토리스가 갈락토스와 같은 보다 고 에너지원을 사용할 수 있는 생산 공정을 갖는 것이 요망될 것이다. 본 발명은 단독 탄소원으로서 갈락토스를 사용할 수 있는, 유전적으로 공학처리시킨 피키아 파스토리스를 제공함으로써 상기 문제점을 또한 해결해 준다.

따라서, 본 발명은 상기 확인된 문제점 둘 다를 해결시켰다. 본 발명은 N-글리칸 상의 말단 갈락토스의 수준이 본원에 교시된 바와 같이 유전적으로 공학처리시키지 않은 세포와 비교해서 증가되는, 항체 또는 Fc 단편과 같은 당단백질을 생성시키기 위해 글리코-공학처리시킨 재조합 저급 진핵 세포, 특히 효모 및 진균성 세포를 제공한다. 유전적으로 공학처리된 숙주 세포는 갈락토스를 함유하는 N-글리칸을 갖는 당단백질을 제조하는 방법에 사용할 수 있는데, 이러한 N-글리칸 내의 갈락토스 양은 본원에 교시된 바와 같이 유전적으로 공학처리시키지 않은 숙주 세포에서 수득 가능한 양 보다 더 많다. 본 발명은 또한, 정상적으로는 단독 탄소원으로서 갈락토스를 사용할 수 없는 숙주 세포를 본원에 교시된 바와 같이 유전적으로 공학처리시켜 단독 탄소원으로서 갈락토스를 사용할 수 있도록 한, 유전적으로 공학처리된 숙주 세포를 제공한다. 숙주 세포가 단독 탄소원으로서 갈락토스를 사용할 수 있도록 만드는 방법은 한 모델로서 피키아 파스토리스를 사용하였다. 본원의 방법을 사용하여, 정상적으로는 탄소원으로서 갈락토스를 사용할 수 없는 기타 효모 또는 진균 종이 탄소원으로서 갈락토스를 사용할 수 있도록 만들 수 있다.

양 문제점을 해결하기 위해, 갈락토스-말단화 N-글리칸을 생성할 수 있도록 유전적으로 공학처리시킨, 유전적으로 공학처리된 숙주 세포가 를루아르 경로 효소, 즉 갈락토키나제 (EC 2.7.1.6), UDP-갈락토스-4-에피머라제 (EC 5.1.3.2), 및 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 (EC 2.7.7.12)를 발현하도록 이를 추가로 유전적으로 공학처리시킨다. 임의로는, 숙주 세포가 갈락토스 퍼미아제를 추가로 발현할 수 있다. 이로써, 숙주 세포는 탄소원으로서 갈락토스를 사용할 수 있게 되고, 갈락토스 잔기를 포함하는 N-글리칸의 합성에 관여하는 갈락토스 트랜스퍼라제에 대한 기질로서 궁극적으로 제공되는 UDP-갈락토스 풀 (pool)을 생성할 수 있게 된다. 따라서, 본원의 숙주 세포 및 방법은 갈락토스-말단화 N-글리칸의 비율이 글리코-공학처리시킨 저급 진핵 생물 세포에서 수득 가능한 양 보다 더 많은 당단백질 조성물, 특히 항체 및 Fc 단편 조성물을 생성할 수 있다. 재조합 숙주 세포는 GO:G1/G2 비가 2:1 미만이거나, GO:G1/G2 비가 약 1:1 또는 그 미만이거나, 또는 GO:G1/G2 비가 약 1:2 또는 그 미만인 항체 및 융합 단백질과 같은 재조합 당단백질을 생산할 수 있다.

본원에 기재된 숙주 세포 및 방법은 갈락토스 잔기로 말단화되는 N-글리칸을 갖는 항체 및 Fc 단편 함유 융합 단백질을 생성시키는 데에 특히 유용하다. 항체 또는 항체 단편의 중쇄의 Asn-297에서의 N-글리칸이 항체의 구조 및 기능에 있어 중요하다. 이들 기능에는 Fc 감마 수용체 결합성, 보체를 활성화시킬 수 있는 능력, 세포독성 T 세포를 활성화시킬 수 있는 능력 (ADCC), 및 혈청 안정성이 포함된다. 그러나, 현재의 효모 또는 포유류 세포에서의 항체 생성은 일반적으로, 특히 중쇄의 불변 또는 Fc 영역의 Asn-297에서 일어나는 N-글리코실화에 비해 제어가 결여된다는 문제점이 있는데, 특히 N-글리칸 상의 말단 갈락토스 수준을 제어할 수 있는 능력이 결여된다는 점에서 문제가 된다. 일반적으로, N-글리칸에 갈락토스 잔기를 포함하는 당단백질을 생성하기 위해 유전적으로 공학처리시킨 효모 세포가 갈락토스를 효율적으로 함유하는 N-글리칸을 수반한 많은 당단백질을 생산할 수 있지만, 갈락토스를 함유하는 N-글리칸을 수반한 항체를 생산할 수 있는 상기 세포의 능력은 효율적이지 않은 것으로 밝혀졌다. 본원에 제시된 바와 같이, 본원의 숙주 세포 및 방법은 본원에 교시된 바와 같이 유전적으로 공학처리시키지 않은 세포에서 보다 고 수준의 항체가 갈락토스 함유 N-글리칸을 갖고 있는 항체를 생산할 수 있는 숙주 세포를 제공한다.

말단 갈락토스 잔기를 갖지 않는 N-글리칸 상의 말단 갈락토스 수준을, 하전된 갈락토스 잔기를 N-글리칸의 말단에 부가하기 위해 가용성 갈락토실트랜스퍼라제를 이용하는 반응으로 시험관내 증가시킬 수는 있지만, 이러한 시험관내 공정은 비용이 많이 들고, 성가시며 일정 양의 당단백질을 생성시키기에 용이하게 측정 가능하지 않다. 따라서, 본원에 기재되고 생체 내에서 증가된 수준의 말단 갈락토스를 갖는 N-글리칸을 수반한 분비된 당단백질 (항체 또는 항체 단편 포함)을 생산할 수 있는 숙주 세포는 증가된 수준의 갈락토스-함유 N-글리칸을 수반하는 항체 조성물을 생성하기 위한 보다 바람직한 수단을 제공한다. 따라서, 본 발명은 항체 생성에 있어 상당한 발전이고, 특별한 항체 특징, 예를 들어 N-글리칸 내의 갈락토스의 수준을 제어할 수 있는 능력, 및 특히, 기능적 특징이 개선된 재조합 당단백질을 생성할 수 있는 능력을 처음으로 제공한다.

또한, 본원의 방법을, 시알릴화 N-글리칸을 갖는 당단백질을 만들기 위해 유전적으로 공학처리된 숙주 세포와 함께 사용하는 경우, 갈락토스 말단화 N-글리칸이 시알릴트랜스퍼라제에 대한 기질이다. 따라서, 시알릴화 N-글리칸의 양은 부분적으로, 시알릴화에 이용 가능한 갈락토스-말단화 N-글리칸의 양의 함수이다. 본원의 숙주 세포 및 방법은 갈락토스-말단화 또는 갈락토스-함유 N-글리칸의 양을 증가시키기 위한 수단을 제공하는데, 시알릴화 N-글리칸을 만들기 위해 유전적으로 공학처리된 숙주 세포에서 생산되는 경우에, 본원에 교시된 바와 같이 유전적으로 공학처리시키지 않은 숙주 세포와 비교해서 증가된 양의 시알릴화 N-글리칸을 만드는 숙주 세포가 생성된다.

본 발명이 갈락토스-말단화 또는 갈락토스-함유 N-글리칸을 포함하는 당단백질을 생성시키는 데에 유용하긴 하지만, 본 발명은 또한, 모든 유형의 이종 단백질, 당단백질을 발현하거나 발현하지 않는 재조합 숙주 세포를 선별하기 위한 선별 방법으로서 유용하다. 를루아르 경로 효소 활성 전부는 아니지만, 이들 중의 1개 또는 2개를 발현하는 재조합 숙주 세포는 이러한 재조합 숙주 세포에 존재하지 않는 를루아르 경로 효소 및 이종 단백질을 암호화하는 하나 이상의 핵산 분자로 형질전환시킨다. 이와 같이 형질전환된 재조합 숙주 세포는 완전한 를루아르 경로를 함유하기 때문에, 비-형질전환된 세포로부터 이종 단백질을 발현하는 형질전환된 재조합 숙주 세포를 선별하는 것은 갈락토스가 단독 탄소원인 배지에서 상기 형질전환된 재조합 숙주 세포를 배양함으로써 달성할 수 있다. 따라서, 다음 단계를 포함하는, 이종 단백질을 발현하는 재조합 숙주 세포의 생성 방법이 제공된다: 갈락토키나제, UDP-갈락토스-4-에피머라제 및 갈락토스-1-포스페이트 우리딜 트랜스퍼라제로 이루어진 군으로부터 선택된 1개 또는 2개의 를루아르 경로 효소를 발현하도록 유전적으로 공학처리된 숙주 세포를 제공하는 단계. 일부 실시양태에서, 숙주 세포는 인간-유사 N-글리칸을 갖는 당단백질을 만들 수 있고, 기타 실시양태에서, 숙주 세포는 인간-유사 N-글리칸을 갖는 당단백질을 만들지 않는데, 이는 이러한 숙주 세포에서 발현되어야 할 이종 단백질이 N-글리칸을 갖고 있지 않기 때문이다. 숙주 세포를 상기 제공된 재조합 숙주 세포에서 발현되지 않는 를루아르 경로 효소(들) 및 이종 단백질을 암호화하는 하나 이상의 핵산 분자로 형질전환시킨다. 이와 같이 형질전환시킨 숙주 세포를, 단독 탄소원으로서 갈락토스를 함유하는 배지에서 배양하여 이종 단백질을 발현하는 재조합 숙주 세포를 제공한다. 임의로는, 숙주 세포가 갈락토스 퍼미아제를 암호화하는 핵산 분자를 추가로 포함할 수 있다. 특별한 실시양태에서는, 숙주 세포가 O-글리코실화를 제어하거나 O-글리코실화를 제어하는 조건 하에 성장시키거나, 또는 이들 둘 다를 하도록 유전적으로 공학처리시킨다. 추가 실시양태에서는, 숙주 세포를 추가로 변형시켜 포스포만노실트랜스퍼라제 및/또는 베타-만노실트랜스퍼라제 활성을 저하시켰다.

저급 진핵 생물에서 글리코실화 경로를 유전적으로 공학처리시킴

대부분의 진핵 생물에서의 N-글리코실화는 내형질 세망 (ER)에서 시작하는데, 지질-연결된 Glc₃Man₉GlcNAc₂ 올리고사카라이드 구조가 신생 폴리펩티드의 특이적 Asn 잔기 상으로 전이된다 (문헌 [Lehle and Tanner, Biochim. Biophys. Acta 399: 364-74 (1975)]; [Kornfeld and Kornfeld, Annu. Rev. Biochem 54: 631-64 (1985)]; [Burda and Aebi, Biochim. Biophys. Acta-General Subjects 1426: 239-257 (1999)] 참조). 상기 N-연결된 올리고사카라이드로부터의 단일 특이적 만노스 당 및 3가지 모든 글루코스 부분을 트리밍하면 Man₈GlcNAc₂ (도 1 참조)가 생성되는데, 이는 상기 당단백질을 추가의 올리고사카라이드 프로세싱이 일어나는 골지체로 전위시켜 준다 (문헌 [Herscovics, Biochim. Biophys. Acta 1426: 275-285 (1999)]; [Moremen et al., Glycobiology 4: 113-125 (1994)] 참조). 포유류 N-글리칸 프로세싱이 효모 및 기타 많은 진핵 생물 (식물 및 곤충 포함)로부터 갈라지는 곳이 골지체 내에서이다. 포유류는 3개 말단 α-1,2-만노스 당을 올리고사카라이드로부터 제거한 후, GlcNAc를 가하여 하이브리드 중간체 N-글리칸 GlcNAcMan₅GlcNAc₂를 형성시키는 것을 포함한 특이적 반응 순서로 N-글리칸을 프로세싱한다 (문헌 [Schachter, Glycoconj. J. 17: 465-483 (2000)] 참조) (도 1 참조). 이러한 하이브리드 구조는 올리고사카라이드 상의 말단 α-1,3- 및 α-1,6-만노스 당을 제거시켜 N-글리칸 GlcNAcMan₃GlcNAc₂를 산출시키는 만노시다제 II에 대한 기질이다 (문헌 [Moremen, Biochim. Biophys. Acta 1573(3): 225-235 (1994)] 참조). 최종적으로, 도 1에 도시된 바와 같이, 복합 N-글리칸은 하나 이상의 GlcNAc 잔기를 부가한 다음, 갈락토스 및 시알산 잔기를 부가함으로써 생성되긴 하지만 (문헌 [Schachter, (2000), 상기] 참조), 시알산은 IgG를 포함한 특정 인간 단백질 상에 종종 존재하지 않는다 (문헌 [Keusch et al., Clin. Chim. Acta 252: 147-158 (1996)]; [Creus et al., Clin. Endocrinol. (Oxf) 44: 181-189 (1996)] 참조).

사카로미세스 세레비지아에에서는, N-글리칸 프로세싱이 올리고사카라이드가 전체 골지체 전반에 걸쳐 통과됨에 따라 이러한 올리고사카라이드에 만노스 당을 부가하는 것을 포함하는데, 이로써 종종 100개 이상의 만노스 잔기를 갖는 과만노실화 글리칸이 유발된다 (문헌 [Trimble and Verostek, Trends Glycosci. Glycotechnol. 7: 1-30 (1995)]; [Dean, Biochim. Biophys. Acta-General Subjects 1426: 309-322 (1999)] 참조) (도 1 참조). 제1 α-1,6-만노스를 α-1,6-만노실트랜스퍼라제 (Och1p)에 의해 Man₈GlcNAc₂에 부가한 후, 부가의 만노실트랜스퍼라제는 α-1,2-, α-1,6-, 및 말단 α-1,3-연결된 만노스 뿐만 아니라 만노실포스페이트를 이용하여 Man₉GlcNAc₂ 글리칸을 연장시킨다. 피키아 파스토리스는 에스. 세레비지아에에서와 유사한 글리코실화 기구를 갖는, 이종 단백질의 발현에 자주 사용되고 있는 메틸로트로픽 (methylotrophic) 효모이다 (문헌 [Bretthauer and Castellino, Biotechnol. Appl. Biochem.30: 193-200 (1999)]; [Cereghino and Cregg, Fems Microbiol. Rev.24: 45-66 (2000)]; [Verostek and Trimble, Glycobiol. 5: 671-681 (1995)] 참조). 그러나, N-글리코실화의 복잡성과 일관되게, 피. 파스토리스에서의 글리코실화는 말단 α-1,3-연결된 만노스를 부가할 수 있는 능력이 결여되지만, 대신 포스포만노스 및 β-연결된 만노스를 포함한 기타 만노스 잔기를 부가한다는 점에서 에스. 세레비지아에에서와 상이하다 (문헌 [Miura et al., Gene 324: 129-137 (2004)]; [Blanchard et al., Glycoconj. J. 24: 33-47 (2007)]; [Mille et al., J. Biol. Chem. 283: 9724-9736 (2008)] 참조).

기존의 작업에서, 본 발명자들은 피. 파스토리스의 och1 돌연변이체에 효모-유형 외부 쇄 형성을 개시시킬 수 있는 능력이 결여되었으므로, N-글리칸을 과만노실화할 수 없었다는 사실을 입증하였다 (문헌 [Choi et al., Proc. Natl. Acad. Sci. USA 100: 5022-5027 (2003)] 참조). 더우기, 본 발명자들은 β-만노스 전이에 대해 책임이 있는 골지-거주 효소를 암호화하는 신규 유전자 계열을 확인하였고, 이러한 계열의 각종 구성원을 결실시키면 면역원성 β-만노스 전이가 저하되거나 없어진다는 사실을 입증하였다 (미국 공개 특허공보 제US2006/0211085호 참조). 5개 별개의 글리코실화 효소를 후속 도입하면, 분비된 모델 단백질 상에 복합 인간 N-글리칸을 생성한 균주가 산출되었다 (도 3a 대 도 3b 참조)(문헌 [Choi et al., Proc. Natl. Acad. Sci. USA 100: 5022-5027 (2003)]; [Hamilton et al. Science 310: 1244-1246 (2003)]; 미국 특허 제7,029,872호; 미국 공개 특허공보 제2004/0018590호; 미국 공개 특허공보 제2004/023004호; 미국 공개 특허공보 제2005/0208617호; 미국 공개 특허공보 제2004/0171826호; 미국 공개 특허공보 제2005/0208617호; 미국 공개 특허공보 제2005/0170452호; 및 미국 공개 특허공보 제2006/0040353호 참조). 보다 최근에는, 효모 균주에 의해 생성된 분비된 단백질 상에 완전히 시알릴화된 N-글리칸을 생산할 수 있는 재조합 효모 균주를 구축하는 것이 미국 공개 특허공보 제2005/0260729호 및 제2006/0286637호 및 문헌 [Hamilton et al., Science 313: 1441-1443 (2006)]에 기재되었다.

복합 N-글리칸의 성숙화는 갈락토스를 말단 GlcNAc 부분에 부가하는 것을 포함하는데, 이는 몇 가지 갈락토실트랜스퍼라제 (GalT)에 의해 촉매될 수 있는 반응이다. 인간에서는, GalT의 7개 이소형 (I-VII)이 존재하는데, 이중 적어도 4개는 시험관 내에서 UDP-갈락토스의 존재하에 갈락토스를 말단 GlcNAc로 전이시키는 것으로 밝혀졌다 (문헌 [Guo, et al., Glycobiol. 11:813-820 (2001)] 참조). 확인된 첫 번째 효소 (GalTI로서 공지됨)는 일반적으로, N-글리칸 상에서 작용하는 주요 효소로서 간주되는데, 이는 시험관내 실험, 마우스 녹아웃 연구 및 조직 분포도 분석에 의해 뒷받침된다 (문헌 [Berger and Rohrer, Biochimie 85: 261-74 (2003)]; [Furukawa and Sato, Biochim. Biophys. Acta 1473: 54-66 (1999)] 참조). 본원에 제시된 바와 같이, 숙주 세포의 골지체 내에 적절히 국재된 경우의 인간 GalTI의 발현은, 말단 GlcNAc-함유 전구체를 생성할 수 있는 글리코-공학처리시킨 효모 균주에서 갈락토스를 복합 N-글리칸 상으로 전이시킬 수 있다. 더우기, 기질을 골지로 이동시키기 위한 UDP-갈락토스 수송인자 및 UDP-갈락토스의 풀을 생성시키기 위해 UDP-갈락토스 4-에피머라제를 발현시키면, 말단 GlcNAc 전구체를 생성할 수 있는 균주에서 β-1,4-갈락토스가 N-글리칸 상으로 거의 정량적으로 전이된다. 국재화 서브-라이브러리를 반복적으로 스크리닝하면, 아마도 중간체 N-글리칸 기질에 대한 갈락토실트랜스퍼라제 및 GlcNAc 간의 분리 및 이들 간의 경쟁 감소를 통하여 하이브리드 N-글리칸 구조에 비해 복합 N-글리칸 구조의 생성이 개선되었다.

기존에는, 인간 GalTI이 코어 또는 소수 만노스를 성장하고 있는 N-글리칸 전구체 분자로 전이시켜 주는 Alg1p 효소의 돌연변이체를 먼저 생성시키는 것을 요구하고 있는 우아한 실험 세트에서 β-1,4-갈락토스를 말단 GlcNAc로 전이시키는 데에 있어서 활성인 것으로 밝혀졌다 (문헌 [Schwientek et al., J. of Biol. Chem 271: 3398-3405 (1996)] 참조). 이러한 돌연변이로 인해, GlcNAc2 절단된 N-글리칸이 단백질로 부분적으로 전이되어 말단 GlcNAc이 산출된다. 이 후, 상기 저자는 인간 GalTI가 β-1,4-연쇄 내의 갈락토스를 상기 인공적 말단 GlcNAc 구조로 전이시킬 수 있다는 것을 발견하였다. 중요하게는, 인간 GalTI가 효모의 골지에서 활성 형태로 발현될 수 있는 것으로 나타난다.

상기 내용을 기준으로 하여, 본 발명은 숙주 세포의 골지체를 표적으로 한 인간 GalTI-리더 펩티드 융합 단백질의 발현을 이용하여 처음 시험하였다. 인간 GalTII, GalTIII, GalTIV, GalTV, 소 (bovine) GalTI, 및 한 쌍의 추정상의 씨. 엘레간스 (C. elegans) GalT를 후속 스크리닝한 후, 인간 GalTI가 상기 이종 시스템에서 갈락토스를 복합 이분지의 N-글리칸으로 전이시키는 데에 있어서 가장 활성인 효소인 것으로 밝혀졌다. 이는 hGalTI가 상기 기질로 가장 잘 전이시킬 수 있는 효소이거나 (이분지의 복합 N-글리칸) 또는 hGalTI가 단순히 시험된 GalTI 효소 중에서 가장 안정적이면서도 활성일 수 있다는 것을 나타낼 수 있거나 이러한 사실 둘 다를 나타낼 수 있다. 흥미롭게도, 만노시다제 II 및 GnT II 촉매적 도메인-리더 융합 단백질을 골지체로 국재시키기 위해 사용된 바와 동일한 리더 펩티드를 사용하여 GalTI를 골지체로 국재시킨 경우에는, 상당한 비율의 하이브리드 N-글리칸 구조 (20% 이하)로 인해 말단 갈락토스가 α-1,3 지류 상에 존재하게 되었다. 만노시다제 II 및 GnT II 활성 발현 상의 증가가 이러한 현상을 상당히 저하시키지는 못하였다. 그러나, 효모 유형 II 분비성 경로 국재화 리더 펩티드 (ER, 골지 또는 트랜스 골지 네트워크와 같은 분비성 경로의 목적하는 세포 소기관에 국재되는 펩티드)의 라이브러리를 스크리닝하면, 숙주 세포 내로 형질전환되는 경우에 하이브리드 N-글리칸 구조 수준이 상당히 감소되고 복합 N-글리칸 구조가 증가되는 수개의 활성 GalT-리더 펩티드 융합 단백질이 산출되었다. 기존에는, 이등분 GlcNAc 전이가 푸코스의 전이 방지를 포함하여, 골지에서의 N-글리칸의 성숙화에 있어서 후속 당 전이를 위한 정지 신호인 것으로 보고되었다 (문헌 [Umana et al., Nature Biotechnol. 17: 176-180 (1999)] 참조). 이 문헌에서의 데이터는 갈락토스를 α-1,3 지류로 전이시키면, 만노시다제 II 및 GnT II에 의한 α-1,6 지류의 성숙화를 방지시키는 유사한 정지 신호가 발생한다는 것을 제안하고 있다.

상기 결과는 재조합 숙주 세포에서 생성된 갈락토스-말단화 또는 갈락토스-함유 하이브리드 N-글리칸 대 갈락토스-말단화 또는 갈락토스-함유 복합 N-글리칸의 비가, 만노시다제 II 및 GnT II가 국재되는 장소를 기준으로 하여 GalTI가 골지체에 국재되는 장소에 따른 산물이라는 사실과, 3개 효소가 국재되는 장소를 조작함으로써, 하이브리드 N-글리칸 대 복합 N-글리칸의 비를 조작할 수 있다는 사실을 제안하고 있다. 갈락토스-말단화 또는 갈락토스-함유 하이브리드 N-글리칸의 수율을 증가시키기 위해서는, 예를 들어 3개 효소 활성 모두를 표적화하기 위한 동일한 분비성 경로 표적화 리더 펩티드를 사용함으로써, 3개 효소 활성 모두가 골지체의 동일한 영역을 표적으로 해야만 한다. 또 다른 한편으론, GalT-리더 펩티드 융합 단백질의 라이브러리를 스크리닝하여, 다른 2개 효소가 작용할 수 있기 전에 N-글리칸 기질 상에서 더 잘 작용하는 것으로 예상되는 골지체 내의 특정 위치에 GalT 활성을 놓아두는 융합 단백질을 확인한다. 이는 갈락토스-말단화 또는 갈락토스-함유 복합 N-글리칸과 비교해서 갈락토스-말단화 또는 갈락토스-함유 하이브리드 N-글리칸의 수율을 증가시킨다. 역으로 말하면, 갈락토스-말단화 또는 갈락토스-함유 하이브리드 N-글리칸의 수율을 감소시키기 위해서는, 다른 2개 효소 활성을 이용하여 사용되는 분비성 경로 표적화 리더 펩티드와는 상이한 분비성 경로 표적화 리더 펩티드를 사용하여 GalT 활성을 국재시켜야 한다. 이는 GalT-리더 펩티드 융합 단백질 라이브러리를 스크리닝함으로써 달성하여, 갈락토스-말단화 또는 갈락토스-함유 복합 N-글리칸의 수율이 갈락토스-말단화 또는 갈락토스-함유 하이브리드 N-글리칸의 수율과 비교해서 증가되는 숙주 세포를 생성시키는 GalT-리더 펩티드 융합 단백질 조합물을 확인할 수 있다.

상기 결과는 문헌 [Choi et al., Proc. Natl. Acad. Sci. USA 100: 5022-5027 (2003)]에 의해 기존에 예시되고 미국 특허 제 7,029,872호 및 제7,449,308호에 기재된 개념인, 이종 숙주 시스템에서 키메라 글리코실화 효소를 발현시키는 경우에 양 촉매적 도메인과 분비성 경로 국재화 리더 펩티드의 라이브러리를 스크리닝하는 가치를 추가로 강조하고 있다. 완전 게놈 서열, 보다 복잡한 PCR 및 클로닝 기술, 및 보다 고차원의 처리능력 분석 기술 (예를 들어, 질량 분광법)을 이용할 수 있는 경우에는, 수 백개, 심지어 수 천개의 조합물을 스크리닝하는 것이 가능하다. 중요하게는, 이러한 유형의 조합 스크리닝이 효소 활성을 탐지하는 것과 단계별 반응을 구동시키는 것 간의 차이 (이전의 생성물에 따라서 각각을 완료한다)인 것으로 입증되었다. 본원에서는, UDP-갈락토스 4-에피머라제의 경우에, 스크리닝된 수 개의 효소가 UDP-갈락토스 풀을 생성시킬 수 있는 비교적 동등한 능력을 지닌 것으로 여겨지지만, 시험된 4개의 UDP-갈락토스 수송인자 중의 단지 1개 만이, 놀랍게도 동료 효모 (에스. 폼베)로부터의 1개의 불활성 수송인자를 포함한 이종 숙주에서 활성인 것으로 입증되었다. 추가로, 한 다스의 분비성 경로 국재화 리더 펩티드 (이들 중의 상당 수가 활성 효소 조합물을 생성하였다)를 스크리닝하면, 단지 3개 만이 이분지의 말단 갈락토스 (G2)를 수반한 고도의 균일한 복합 N-글리칸 (>85%)을 산출한 것으로 밝혀졌다. 고 만노스 및 하이브리드 중간체 구조가 감소하는 것은 이러한 이종 발현 시스템을 치료용 당단백질의 생성에 사용하는 데에 따른 중요한 결과인데, 이는 고 만노스 구조가 강력하게 면역원성인 것으로 밝혀졌기 때문이고, 최근의 명백한 증거는 간 독성이 과다한 하이브리드 N-글리칸으로부터 비롯될 수 있다는 것을 제안하고 있다.

따라서, 미국 공개 특허공보 제2006/0286637호에는 정상적으로는 갈락토스를 함유하는 당단백질을 생성하지 못하는 숙주 세포에서 갈락토스 전이를 달성하기 위해서는, 다음 3가지 조건을 극복해야만 한다고 교시되어 있다: (1) 골지에서 내인성 갈락토실트랜스퍼라제 (GalT)의 부재, (2) 골지 내로의 내인성 UDP-Gal 수송 부재, 및 (3) 낮은 내인성 시토졸 UDP-Gal 풀. UDP-Gal 수송인자의 부재 하에서는, 갈락토스를 N-글리칸 상의 말단 GlcNAc 잔기로 전이시키는 것이 약 55 내지 60%였다. UDP-글루코스-4-에피머라제의 부재 하에서는, 갈락토스를 N-글리칸 상의 말단 GlcNAc 잔기로 전이시키는 것이 약 10 내지 15%였다.

갈락토실화 N-글리칸을 만들 수 있는 숙주 세포를 생성하기 위한 상기 변형 모두는 인간에게서 전형적으로 시알릴화되는 노출된 N-글리칸을 수반한 리포터 단백질 (인간 플라스미노겐의 K3 도메인)을 이용하여 만들었고, 이는 미국 공개 특허공보 제20060040353호에 보고되었다. 그러나, 포유류 세포와 거의 동등한 방식으로, 이들 글리코-공학처리시킨 효모 균주는 항체의 Fc 글리칸 상으로 단지 부분적인 갈락토스 전이 만을 가져다주어, 이로써 말단 GlcNAc를 수반한 복합 N-글리칸을 위해서 10% 미만 G2 및 25% 미만 G1 구조를 갖는 N-글리칸 풀이 생성된다. 이는 항체 (IgG Fc Asn 297) N-글리칸이 감소된 양의 말단 갈락토스를 함유하는 포유류 세포주와 유사하다.

갈락토스 잔기를 N-글리칸 상으로 전이시키기 위해서는, 활성화된 갈락토스 (UDP-Gal) 풀이 요구된다. 저급 진핵 생물에게서 내인성 수준 이상의 상기 풀을 생성시키는 한 가지 방식은 상기 언급된 바와 같이 UDP-갈락토스 4-에피머라제를 발현시키는 것인데, 이는 미국 공개 특허공보 제2006/0040353호에 제시되어 있다. 또 다른 방식은 상기 세포를 포함하는 본 발명인데, 여기서는 숙주 세포를 적어도 다음 3가지 를루아르 경로 효소를 암호화하는 핵산 분자로 형질전환시킨다: 갈락토키나제 (EC 2.7.1.6), 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 (EC 2.7.7.12), 및 UDP-갈락토스 4-에피머라제 (EC 5.1.3.2). 갈락토키나제는 갈락토스 대사의 제1 단계, 즉 갈락토스를 인산화하여 갈락토스-1-포스페이트를 수득하는 단계를 촉매하는 효소이다. 갈락토스-1-포스페이트 우리딜 트랜스퍼라제는 갈락토스 대사의 제2 단계, 즉 UDP-글루코스 및 갈락토스-1-포스페이트를 UDP-갈락토스 및 글루코스-1-포스페이트로 전환시키는 단계를 촉매한다. 임의로는, 혈장 막 갈락토스 퍼미아제를 암호화하는 핵산 분자가 추가로 포함될 수 있다. 갈락토스 퍼미아제는 갈락토스를 외인성 공급원으로부터 유입시키는 혈장 막 헥소스 수송인자이다. 를루아르 경로가 도 4에 도시되어 있다.

본원에 제시된 바와 같이, 효모 외인성 갈락토스를 상기 효모 내로 공급하는 것과 함께, 갈락토키나제 활성, UDP-갈락토스-4-에피머라제 활성, 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 활성 및 임의로 갈락토스 퍼미아제 활성을 암호화하는 유전자를 세포 내로 도입하고 항체 발현을 유도시키는 경우, 항체의 Fc N-글리칸 상의 말단 갈락토스의 수준은 실질적으로 증가되는데, 이로써 생성되는 G2 N-글리칸의 양도 증가되며; N-글리칸은 50% 초과의 N-글리칸이 G2인 인간 Fc 상에서 수득할 수 있었다. 퍼미아제는 임의적인데, 이는 세포 내의 내인성 퍼미아제가 갈락토스를 세포 내로 유입할 수 있었던 것으로 밝혀졌기 때문이다. 따라서, 사용된 경우 갈락토스 퍼미아제는 세포 막을 가로질러 갈락토스를 수송할 수 있는 모든 혈장 막 헥소스 수송인자, 예를 들어 에스. 세레비지아에로부터의 GAL2 갈락토스 퍼미아제일 수 있다 (유전자은행: M81879 참조). 갈락토키나제는 갈락토스를 인산화하여 갈락토스-1-포스페이트를 수득하는 것을 촉매시켜 줄 수 있는 모든 효소, 예를 들어 에스. 세레비지아에로부터의 GAL1 유전자일 수 있다 (유전자은행: X76078 참조). 갈락토스-1-포스페이트 우리딜 트랜스퍼라제는 UDP-글루코스 및 갈락토스-1-포스페이트를 UDP-갈락토스 및 글루코스-1-포스페이트로 전환시키는 것을 촉매하는 모든 효소, 예를 들어 에스. 세레비지아에의 GAL7일 수 있다 (유전자은행: M12348 참조). UDP-갈락토스 4 에피머라제는 UDP-글루코스를 UDP-갈락토스로 전환시키는 것을 촉매하는 모든 효소, 예를 들어 에스. 세레비지아에의 GAL10 (유전자은행: NC_001134), 에스. 폼베의 GALE (유전자은행 NC_003423), 및 인간의 hGALE (유전자은행 NM_000403 참조)일 수 있다. 에피머라제는 또한, 이러한 에피머라제의 촉매적 도메인을 갈락토실트랜스퍼라제의 촉매적 도메인과 융합시킨 융합 단백질로서 제공될 수 있다 (미국 공개 특허공보 제US2006/0040353호 참조).

상기 를루아르 경로 효소를 피. 파스토리스 균주 내로 도입하면, 환경적 갈락토스를 동화시킬 수 있었던 재조합 세포가 생성되었다. 추가로, 상기 를루아르 경로 효소를, 갈락토스를 함유하는 N-글리칸을 수반한 당단백질을 생성할 수 있는 세포 내로 도입하는 경우에는, 이로써 생성되는 재조합 세포가 이와 같이 공학처리시키지 않았던 세포에서 생성된 당단백질 보다 고 수준의 β-1,4-갈락토스를 복합 N-글리칸 상에 갖는 당단백질을 생성시킬 수 있었다. 따라서, 이들 공학처리 단계들의 조합으로 인해, 항체 및 Fc-융합 단백질과 같은 당단백질의 N-글리칸의 글리코실화에 비해 증가된 제어를 위해 대사적으로 공학처리시키고 특이적으로 글리코-공학처리시킨 숙주 세포가 산출되었다. 따라서, 이들 글리코-공학처리시킨 효모 세포주는 N-글리칸 프로세싱에 비해 제어를 허용해 주면서도 재조합 항체 및 Fc 융합 단백질을 효율적으로 생성시킬 수 있게 해준다.

발현 벡터

일반적으로, 갈락토키나제, UDP-갈락토스-4-에피머라제, 및 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 (및 임의로 갈락토스 퍼미아제)는 발현 벡터로부터 발현 카세트의 구성분으로서 발현된다. 추가 측면에서, 관심 있는 재조합 단백질을 암호화하는 발현 벡터가 숙주 세포에 추가로 포함되고, 특별한 실시양태에서는 숙주 세포로부터의 재조합 단백질의 분비를 촉진시켜 주는 서열이 추가로 포함된다. 각 를루아르 경로 효소 및 관심 있는 재조합 단백질의 경우, 이를 암호화하는 발현 벡터는 상기 를루아르 경로 효소 또는 재조합 단백질을 암호화하는 핵산 서열의 발현에 영향을 미치는 서열을 최소한 함유한다. 이러한 서열은 를루아르 경로 효소 또는 재조합 단백질을 암호화하는 핵산 분자와 작동적으로 연결된다. 이러한 발현 벡터는 또한, 복제 기점, 선별성 마커, 전사 또는 종결 신호, 중심절, 자기 복제 서열 등과 같은 부가의 요소를 함유할 수 있다.

본 발명에 따르면, 관심 있는 재조합 단백질 및 상기 를루아르 경로 효소를 각각 암호화하는 핵산 분자를 발현 벡터 내에 놓아두어 과발현된 관심 있는 재조합 단백질 및 상기 를루아르 경로 효소의 발현을 조절할 수 있다. 이러한 재조합 단백질 및 상기 를루아르 경로 효소를 동일한 발현 벡터에서 암호화시킬 수 있긴 하지만, 상기 를루아르 경로 효소는 재조합 단백질을 암호화하는 벡터와 별개의 발현 벡터에서 암호화되는 것이 바람직하다. 상기 를루아르 경로 효소 및 재조합 단백질을 암호화하는 핵산 분자를 별개의 발현 벡터에 배치시키는 것이 생성되는 재조합 단백질의 양을 증가시킬 수 있다.

본원에 사용된 바와 같은 발현 벡터는 복제 가능하거나 복제 가능하지 않는 발현 벡터일 수 있다. 복제 가능한 발현 벡터는 숙주 세포 염색체성 DNA와 무관하게 복제할 수 있거나 또는 이러한 벡터가 숙주 세포 염색체성 DNA 내로 통합되었기 때문에 복제될 수 있다. 숙주 세포 염색체성 DNA 내로의 통합시, 상기 발현 벡터는 일부 구조적 요소를 상실할 수 있지만, 재조합 단백질 또는 상기 를루아르 경로 효소를 암호화하는 핵산 효소 및 이러한 재조합 단백질 또는 상기 를루아르 경로 효소의 발현에 영향을 미칠 수 있는 절편은 유지하고 있다. 따라서, 본 발명의 발현 벡터는 염색체로 통합되거나 염색체로 통합되지 않는 발현 벡터일 수 있다.

상기 를루아르 경로 효소 및 재조합 단백질을 암호화하는 핵산 분자를 도입한 후, 재조합 단백질을 암호화하는 핵산의 발현을 유도시킴으로써 재조합 단백질을 과발현시킨다. 또 다른 실시양태에서는, 상기 를루아르 경로 효소를 구성적 또는 유도적으로 발현하는 세포주를 확립한다. 과발현될 재조합 단백질을 암호화하는 발현 벡터를 이러한 세포주 내로 도입하여 재조합 단백질의 생성 증가를 달성한다. 특별한 실시양태에서는, 상기 를루아르 경로 효소를 암호화하는 핵산 분자를 구성적 프로모터에 작동적으로 연결시킨다.

본 발명의 발현 벡터는 한 가지 숙주 세포 유형, 예를 들어 에스케리챠 콜라이에서 복제 가능하고, 또 다른 숙주 세포 유형, 예를 들어 진핵 숙주 세포에서는 거의 또는 전혀 복제되지 않는데, 단 발현 벡터는 상기 를루아르 경로 효소 또는 과발현된 재조합 단백질의 발현을 허용함으로써, 상기 재조합 단백질이 선택된 숙주 세포 유형에서 분비되는 것을 촉진시켜야 한다.

본원에 기재된 바와 같은 발현 벡터에는 목적하는 유전자, 즉 상기 를루아르 경로 효소 또는 재조합 단백질을 암호화하는 유전자의 발현 제어를 위해 공학처리시킨 DNA 또는 RNA 분자가 포함된다. 이러한 벡터는 또한, 본 발명의 상기 를루아르 경로 효소 또는 재조합 단백질을 암호화하는 핵산 분자와 작동적으로 연결되는 핵산 분자 절편을 암호화한다. 이러한 맥락에서 작동적으로 연결된이란 해당 절편이 상기 를루아르 경로 효소 또는 재조합 단백질을 암호화하는 핵산 분자를 발현시킬 수 있다는 것을 의미한다. 이들 핵산 서열에는 프로모터, 증강인자, 상류 제어 요소, 전사 인자 또는 억제인자 결합 부위, 종결 신호, 및 고려된 숙주 세포에서 유전자 발현을 제어할 수 있는 기타 요소가 포함된다. 바람직하게, 벡터는 벡터, 박테리오파지, 코스미드 또는 바이러스이다.

본 발명의 발현 벡터는 효모 또는 포유류 세포에서 기능한다. 효모 벡터에는 효모 2μ 서클 (circle) 및 그의 유도체, 효모 자기 복제 서열을 암호화하는 효모 벡터, 효모 미니염색체, 모든 효모 통합 벡터 등이 포함될 수 있다. 많은 유형의 효모 벡터의 포괄적 목록이 다음 문헌에 제공되어 있다 (문헌 [Parent et al., Yeast 1: 83-138 (1985)] 참조).

유전자 생성물을 발현시킬 수 있는 요소 또는 핵산 서열에는 프로모터, 증강인자 요소, 상류 활성화 서열, 전사 종결 신호 및 폴리아데닐화 부위가 포함된다. 이러한 프로모터 및 전사 조절성 요소 모두는 단독으로 또는 조합해서, 본 발명의 발현 벡터에 사용되는 것으로 고려된다. 더우기, 유전적으로 공학처리시킨 서열 및 돌연변이된 조절 서열이 또한, 본원에 고려된다.

프로모터는 유전자 발현을 제어하기 위한 DNA 서열 요소이다. 특히, 프로모터는 전사 개시 부위를 구체화하고, 이에는 TATA 박스 및 상류 프로모터 요소가 포함될 수 있다. 선택된 프로모터는 선택된 특별한 숙주 시스템에서 작동 가능할 것으로 예상되는 것이다. 예를 들어, 효모 숙주 세포, 예컨대 사카로미세스 세레비지아에, 클루이베로미세스 락티스 또는 피키아 파스토리스를 사용하는 경우에는 효모 프로모터가 본 발명의 발현 벡터에 사용되는 반면, 아스페르길루스 니거, 뉴로스포라 크라사 또는 트리코데르마 레에세이와 같은 숙주 세포의 경우에는 진균성 프로모터가 사용될 것이다. 효모 프로모터의 예에는 GAPDH , AOX1 , SEC4 , HH1 , PMA1, OCH1 , GAL1 , PGK , GAP , TP1 , CYC1 , ADH2 , PHO5 , CUP1 , MF α1, FLD1 , PMA1 , PDI, TEF, 및 GUT1 프로모터가 포함되지만, 이에 제한되지 않는다. 문헌 [Romanos et al. (Yeast 8: 423-488 (1992)]은 효모 프로모터 및 발현 벡터에 관한 고찰을 제공한다. 문헌 [Hartner et al., Nucl. Acid Res. 36: e76 (pub on-line 6 June 2008)]에는 피키아 파스토리스에서 이종 단백질의 미세 조정된 발현을 위한 프로모터의 라이브러리가 기재되어 있다.

본원에 기재된 핵산 분자와 작동적으로 연결되는 프로모터는 구성적 프로모터 또는 유도성 프로모터일 수 있다. 유도성 프로모터는 전사 인자의 결합시 증가된 속도 또는 감소된 속도로 전사를 지시하는 프로모터이다. 본원에 사용된 바와 같은 전사 인자에는 프로모터의 조절성 또는 제어 영역과 결합할 수 있으므로, 전사에 영향을 미치는 모든 인자가 포함된다. 숙주 세포 내에서의 전사 인자의 합성 또는 프로모터 결합 능력은 숙주를 유도인자에 노출시키거나 또는 유도인자를 숙주 세포 배지로부터 제거함으로써 제어할 수 있다. 따라서, 유도성 프로모터의 발현을 조절하기 위하여, 유도인자를 숙주 세포의 성장 배지에 가하거나 이로부터 제거한다. 이러한 유도인자에는 당, 인산염, 알콜, 금속 이온, 호르몬, 열, 냉기 등이 포함될 수 있다. 예를 들어, 효모에서 흔히 사용되는 유도인자는 글루코스, 갈락토스 등이다.

선택되는 전사 종결 서열은 선택된 특별한 숙주 세포에서 작동 가능한 것이다. 예를 들어, 효모 숙주 세포, 예컨대 사카로미세스 세레비지아에, 클루이베로미세스 락티스 또는 피키아 파스토리스를 사용하는 경우에는 효모 전사 종결 서열이 본 발명의 발현 벡터에 사용되는 반면, 아스페르길루스 니거, 뉴로스포라 크라사 또는 트리코데르마 레에세이와 같은 숙주 세포의 경우에는 진균성 전사 종결 서열이 사용될 것이다. 전사 종결 서열에는 사카로미세스 세레비지아에 CYC 전사 종결 서열 (ScCYC TT), 피키아 파스토리스 ALG3 전사 종결 서열 (ALG3 TT), 피키아 파스토리스 ALG6 전사 종결 서열 (ALG6 TT), 피키아 파스토리스 ALG12 전사 종결 서열 (ALG12 TT), 피키아 파스토리스 AOX1 전사 종결 서열 (AOX1 TT), 피키아 파스토리스 OCH1 전사 종결 서열 (OCH1 TT) 및 피키아 파스토리스 PMA1 전사 종결 서열 (PMA1 TT)이 포함되지만, 이에 제한되지 않는다.

본 발명의 발현 벡터는 선별성 마커를 암호화할 수도 있다. 선별성 마커는 숙주 세포 상에 식별 가능한 특징을 부여해 주는 유전적 기능이므로, 이러한 선별성 마커를 수반하는 벡터로 형질전환시킨 세포는 비-형질전환된 세포와 구별될 수 있다. 선별성 마커를 벡터 내로 봉입시키는 것은 또한, 이러한 마커와 연결된 유전적 기능이 숙주 세포 집단에서 유지될 수 있도록 하기 위해 사용할 수 있다. 이러한 선별성 마커는 용이하게 확인된 모든 우성 특징, 예를 들어 약물 내성, 세포성 영양분을 합성하거나 대사시킬 수 있는 능력 등을 부여할 수 있다.

효모 선별성 마커에는 약물 내성 마커, 및 효모 숙주 세포가 필수 세포성 영양분, 예를 들어 아미노산을 합성할 수 있도록 하는 유전적 기능이 포함된다. 효모에서 흔히 사용되는 약물 내성 마커에는 클로람페니콜, 카나마이신, 메토트렉세이트, G418 (제네티신), 제오신 등이 포함된다. 효모 숙주 세포가 필수 세포성 영양분을 합성할 수 있도록 하는 유전적 기능을, 상응하는 게놈 기능에 있어서 영양요구성 돌연변이를 갖는 입수 가능한 효모 균주에 사용한다. 통상의 효모 선별성 마커는 루이신 (LEU2), 트립토판 (TRP1 및 TRP2), 우라실 (URA3 , URA5 , URA6), 히스티딘 (HIS3), 리신 (LYS2), 아데닌 (ADE1 또는 ADE2) 등을 합성하기 위한 유전적 기능을 제공해준다. 기타 효모 선별성 마커에는 아비산염의 존재 하에 성장되는 효모 세포에 아비산염 내성을 부여하는, 에스. 세레비지아에로부터의 ARR3 유전자가 포함된다 (문헌 [Bobrowicz et al., Yeast, 13:819-828 (1997)]; [Wysocki et al., J. Biol. Chem. 272:30061-30066 (1997)] 참조). 수많은 적합한 통합 부위에는 미국 공개 특허공보 제2007/0072262호에 열거된 것들이 포함되고, 사카로미세스 세레비지아에 및 기타 효모 또는 진균에 대해 공지된 유전자 자리에 대한 동족체가 포함된다. 벡터를 효모 내로 통합시키는 방법은 널리 공지되어 있다 (예를 들어, WO2007136865 참조).

따라서, 본 발명의 발현 벡터는 배양물에 존재하는 세포 집단 내의 벡터-함유 숙주 세포를 확인하고 이를 유지시키는 데에 유용한 선별성 마커를 암호화할 수 있다. 일부 상황 하에서는, 선별성 마커를 사용하여 발현 벡터의 카피 수를 증폭시킬 수도 있다. 본 발명의 발현 벡터로부터 전사를 유도시켜 과발현된 재조합 단백질 또는 를루아르 경로 효소를 암호화하는 RNA를 생성시킨 후, 이러한 RNA를 세포성 인자에 의해 해독하여 재조합 단백질 또는 를루아르 경로 효소를 생성시킨다.

효모 및 기타 진핵 생물에서는, 메신저 RNA (mRNA)의 해독이, 이러한 mRNA의 5' 캡에 리보솜을 결합시키고 mRNA를 따라 폴리펩티드 합성이 시작될 수 있는 첫 번째 AUG 출발 코돈으로 리보솜을 이동시킴으로써 개시된다. 효모 및 포유류 세포에서의 발현은 일반적으로, 원핵성 발현 시스템에서 종종 요구되는 바와 같은 리보솜-결합 부위와 개시 코돈 사이에 구체적인 수의 뉴클레오티드를 요구하지 않는다. 그러나, 효모 또는 포유류 숙주 세포에서 발현하는 경우에는, mRNA 내의 첫 번째 AUG 코돈이 바람직하게 목적하는 해독 출발 코돈이다.

더우기, 효모 숙주 세포에서 발현을 수행하는 경우, 장 비해독 리더 서열, 예를 들어 50 내지 100개 초과 뉴클레오티드가 존재하는 것이 mRNA의 해독을 축소시킬 수 있다. 효모 mRNA 리더 서열은 평균 길이가 약 50개 뉴클레오티드이고, 아데닌이 풍부하며, 2차 구조는 거의 갖지 않고, 개시를 위해 첫 번째 AUG를 거의 항상 사용한다. 이들 특징을 지니지 않는 리더 서열은 단백질 해독 효율을 저하시킬 수 있기 때문에, 효모 리더 서열은 바람직하게, 효모 숙주 세포 내의 샤프롱 (chaperone) 단백질 또는 과발현된 유전자 생성물의 발현에 사용된다. 많은 효모 리더 서열이 공지되어 있고, 이는 예를 들어, 문헌 [Cigan et al. (Gene 59: 1-18 (1987)]을 참조로 하여 당업자에게 이용 가능하다.

프로모터, 리보솜-결합 부위 및 출발 코돈의 위치 이외에도, 수득되는 발현 수준에 영향을 미칠 수 있는 인자에는 복제 가능한 발현 벡터의 카피 수가 포함된다. 벡터의 카피 수는 일반적으로, 벡터의 복제 기점 및 이와 연관된 모든 시스-작용성 제어 요소에 의해 결정된다. 예를 들어, 조절된 중심절을 암호화하는 효모 에피솜성 벡터의 카피 수 증가는 이러한 중심절과 밀접하게 병렬되는 프로모터로부터 전사를 유도시킴으로써 달성할 수 있다. 더우기, 효모 벡터에서 효모 FLP 기능을 암호화하는 것이 또한 벡터의 카피 수를 증가시킬 수 있다.

당업자는 또한, 이용 가능한 벡터로부터 DNA 단편을 합하거나, 이러한 조절성 요소를 암호화하는 핵산 분자를 합성하거나 또는 새로운 조절성 요소를 본 발명의 벡터 내로 클로닝 및 배치시킴으로써 상기 언급된 서열을 포함하는 발현 벡터를 용이하게 설계 및 제조할 수 있다. 발현 벡터를 제조하는 방법은 널리 공지되어 있다. 과발현된 DNA 방법이 유전 공학에 관한 무수한 표준 실험실 매뉴얼에서 발견된다.

본 발명의 발현 벡터는 상기 를루아르 경로 효소 및 재조합 단백질에 대한 암호화 영역을 적당한 배향으로, 유전자 발현을 제어하기 위해 사용되는 프로모터 및 기타 서열 요소에 연결시킴으로써 만들 수 있다. 본 발명의 발현 벡터를 구축한 후, 이러한 벡터를 과발현된 재조합 단백질 및 를루아르 경로 효소가 발현될 수 있는 숙주 세포 내로 형질전환시킨다. 효모 및 기타 저급 진핵 세포를 발현 벡터로 형질전환시키는 방법은 널리 공지되어 있고, 당업자에게 용이하게 이용 가능하다. 예를 들어, 발현 벡터는 리튬 아세테이트, 스페로플라스트 (spheroplast), 전기천공 및 유사한 과정을 포함한 여러 가지 과정에 의해 효모 세포 내로 형질전환시킬 수 있다.

숙주 세포

피키아 파스토리스, 피키아 메타놀리카, 및 한세눌라 폴리모르파와 같은 효모는 세포 배양에 유용한데, 이는 이들이 고 세포 밀도로 성장할 수 있고 다량의 재조합 단백질을 분비할 수 있기 때문이다. 마찬가지로, 아스페르길루스 니거, 푸사륨 종, 뉴로스포라 크라사 등과 같은 섬유상 진균을 이용하여 본 발명의 당단백질을 산업적 규모로 생산할 수 있다. 일반적으로, 본원의 방법을 실시하는 데에 유용한 저급 진핵 생물에는 정상적으로는 탄소원으로서 갈락토스를 사용할 수 없는 효모 및 진균이 포함된다. 탄소원으로서 갈락토스를 사용할 수 없는 효모의 예에는 피키아 속의 메틸로트로픽 효모, 예를 들어 피키아 파스토리스, 및 효모, 예컨대 에스. 쿠드리아브제비이 (S. kudriavzevii), 씨. 글라브라타 (C. glabrata), 케이. 왈티이 (K. waltii), 및 이. 고시피이 (E. gossypii)가 포함되지만, 이에 제한되지 않는다. 효모가 당단백질의 발현에 유용한데, 이는 효모가 경제적으로 배양될 수 있고, 고 수율을 제공하며, 적당하게 변형된 경우에 적합한 글리코실화할 수 있기 때문이다. 효모는 특히, 신속한 형질전환, 시험된 단백질 국재화 전략 및 용이한 유전자 녹아웃 기술을 허용해 주는 확립된 유전학을 부여해 준다. 적합한 벡터는 경우에 따라, 발현 제어 서열, 예컨대 프로모터 (3-포스포글리세레이트 키나제 또는 기타 당분해 효소 포함), 및 복제 기점, 종결 서열 등을 갖는다. 따라서, 정상적으로는 탄소원으로서 갈락토스를 사용할 수 없는 상기 숙주 세포를 유전적으로 공학처리하여 갈락토키나제 활성, UDP-갈락토스-4-에피머라제 활성, 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 활성 및 임의로 갈락토스 퍼미아제 활성을 발현시키는데, 이로써 숙주 세포는 탄소원으로서 갈락토스를 사용할 수 있게 된다.

저급 진핵 생물, 특히 효모는 글리코실화 패턴이 인간-유사 또는 인간화되는 당단백질을 발현하도록 이를 유전적으로 변형시킬 수도 있다. 이는 선별된 내인성 글리코실화 효소를 제거하고/하거나 문헌 [Gerngross et al., 미국 공개 특허공보 제2004/0018590호]에 기재된 바와 같은 외인성 효소를 공급함으로써 달성할 수 있다. 예를 들어, 숙주 세포는 1,6-만노실 트랜스퍼라제 활성이 고갈되도록 공학처리시키거나 선별될 수 있는데, 그렇치 않으면 당단백질 상의 N-글리칸 상으로 만노스 잔기가 부가될 것이다.

한 실시양태에서는, 본원에 기재된 바와 같이 탄소원으로서 환경적 갈락토스를 동화시키도록 유전적으로 공학처리된 숙주 세포를 또한, 다음에 기재되는 바와 같이 복합 N-글리칸을 만들도록 유전적으로 공학처리시킨다. 이러한 숙주 세포는 정상적으로는 촉매적 도메인과 연합되지 않는 세포성 표적화 신호 펩티드와 융합되고 α-1,2-만노시다제 활성이 숙주 세포의 ER 또는 골지체를 표적으로 하도록 선별된 α-1,2-만노시다제 촉매적 도메인을 추가로 포함한다. 숙주 세포의 ER 또는 골지체를 통하여 재조합 당단백질을 통과시키면, Man₅GlcNAc₂ 글리코형태를 포함하는 재조합 당단백질, 예를 들어 Man₅GlcNAc₂ 글리코형태를 우세적으로 포함하는 재조합 당단백질 조성물이 생성된다. 예를 들어, 미국 특허 제7,029,872호 및 미국 공개 특허공보 제2004/0018590호 및 제2005/0170452호에는 Man₅GlcNAc₂ 글리코형태를 포함하는 당단백질을 생산할 수 있는 저급 진핵 생물 숙주 세포가 기재되어 있다. 본원에 교시된 바와 같이 갈락토키나제 활성, UDP-갈락토스-4-에피머라제 활성, 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 활성 및 임의로 갈락토스 퍼미아제 활성을 발현하도록 추가로 유전적으로 공학처리시킨 이들 숙주 세포는 탄소원으로서 갈락토스를 사용할 수 있다.

바로 앞의 숙주 세포는 정상적으로는 GlcNAc 트랜스퍼라제 I (GnT I) 촉매적 도메인과 연합되지 않는 세포성 표적화 신호 펩티드와 융합되고 GlcNAc 트랜스퍼라제 I 활성이 숙주 세포의 ER 또는 골지체를 표적으로 하도록 선별된 GlcNAc 트랜스퍼라제 I (GnT I) 촉매적 도메인을 추가로 포함한다. 숙주 세포의 ER 또는 골지체 내로 재조합 당단백질을 통과시키면, GlcNAcMan₅GlcNAc₂ 글리코형태를 포함하는 재조합 당단백질, 예를 들어 GlcNAcMan₅GlcNAc₂ 글리코형태를 우세적으로 포함하는 재조합 당단백질 조성물이 생성된다. 미국 특허 제7,029,872호 및 미국 공개 특허공보 제2004/0018590호 및 제2005/0170452호에는 GlcNAcMan₅GlcNAc₂ 글리코형태를 포함하는 당단백질을 생산할 수 있는 저급 진핵 생물 숙주 세포가 기재되어 있다. 상기 세포에서 생성된 당단백질은 헥사미니다제를 이용하여 시험관 내에서 처리하여 Man₅GlcNAc₂ 글리코형태를 포함하는 재조합 당단백질을 생성시킬 수 있다. 본원에 교시된 바와 같이 갈락토키나제 활성, UDP-갈락토스-4-에피머라제 활성, 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 활성 및 임의로 갈락토스 퍼미아제 활성을 발현하도록 추가로 유전적으로 공학처리시킨 이들 숙주 세포는 탄소원으로서 갈락토스를 사용할 수 있다.

이어서, 바로 앞의 숙주 세포는 정상적으로는 만노시다제 II 촉매적 도메인과 연합되지 않는 세포성 표적화 신호 펩티드와 융합되고 만노시다제 II 활성이 숙주 세포의 ER 또는 골지체를 표적으로 하도록 선별된 만노시다제 II 촉매적 도메인을 추가로 포함한다. 숙주 세포의 ER 또는 골지체 내로 재조합 당단백질을 통과시키면, GlcNAcMan₃GlcNAc₂ 글리코형태를 포함하는 재조합 당단백질, 예를 들어 GlcNAcMan₃GlcNAc₂ 글리코형태를 우세적으로 포함하는 재조합 당단백질 조성물이 생성된다. 미국 특허 제7,029,872호 및 미국 공개 특허공보 제2004/0230042호에는 만노시다제 II 효소를 발현하고 GlcNAc₂Man₃GlcNAc₂ 글리코형태를 우세적으로 갖는 당단백질을 생산할 수 있는 저급 진핵 생물 숙주 세포가 기재되어 있다. 상기 세포에서 생성된 당단백질은 헥사미니다제를 이용하여 시험관 내에서 처리하여 Man₃GlcNAc₂ 글리코형태를 포함하는 재조합 당단백질을 생성시킬 수 있다. 본원에 교시된 바와 같이 갈락토키나제 활성, UDP-갈락토스-4-에피머라제 활성, 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 활성 및 임의로 갈락토스 퍼미아제 활성을 발현하도록 추가로 유전적으로 공학처리시킨 이들 숙주 세포는 탄소원으로서 갈락토스를 사용할 수 있다.

이어서, 바로 앞의 숙주 세포는 정상적으로는 GlcNAc 트랜스퍼라제 II (GnT II) 촉매적 도메인과 연합되지 않는 세포성 표적화 신호 펩티드와 융합되고 GlcNAc 트랜스퍼라제 II 활성이 숙주 세포의 ER 또는 골지체를 표적으로 하도록 선별된 GlcNAc 트랜스퍼라제 II (GnT II) 촉매적 도메인을 추가로 포함한다. 숙주 세포의 ER 또는 골지체 내로 재조합 당단백질을 통과시키면, GlcNAc₂Man₃GlcNAc₂ (G0) 글리코형태를 포함하는 재조합 당단백질, 예를 들어 GlcNAc₂Man₃GlcNAc₂ 글리코형태를 우세적으로 포함하는 재조합 당단백질 조성물이 생성된다. 미국 특허 제7,029,872호 및 미국 공개 특허공보 제2004/0018590호 및 제2005/0170452호에는 GlcNAc₂Man₃GlcNAc₂ 글리코형태를 포함하는 당단백질을 생산할 수 있는 저급 진핵 생물 숙주 세포가 기재되어 있다. 상기 세포에서 생성된 당단백질은 헥사미니다제를 이용하여 시험관 내에서 처리하여 Man₃GlcNAc₂ 글리코형태를 포함하는 재조합 당단백질을 생성시킬 수 있다. 본원에 교시된 바와 같이 갈락토키나제 활성, UDP-갈락토스-4-에피머라제 활성, 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 활성 및 임의로 갈락토스 퍼미아제 활성을 발현하도록 추가로 유전적으로 공학처리시킨 이들 숙주 세포는 탄소원으로서 갈락토스를 사용할 수 있다.

최종적으로, 바로 앞의 숙주 세포는 정상적으로는 갈락토실트랜스퍼라제 촉매적 도메인과 연합되지 않는 세포성 표적화 신호 펩티드와 융합되고 갈락토실트랜스퍼라제 활성이 숙주 세포의 ER 또는 골지체를 표적으로 하도록 선별된 갈락토실트랜스퍼라제 촉매적 도메인을 추가로 포함한다. 숙주 세포의 ER 또는 골지체 내로 재조합 당단백질을 통과시키면, GalGlcNAc₂Man₃GlcNAc₂ (G1) 또는 Gal₂GlcNAc₂Man₃GlcNAc₂ (G2) 글리코형태, 또는 그의 혼합물을 포함하는 재조합 당단백질, 예를 들어 GalGlcNAc₂Man₃GlcNAc₂ (G1) 글리코형태 또는 Gal₂GlcNAc₂Man₃GlcNAc₂ (G2) 글리코형태, 또는 그의 혼합물을 우세적으로 포함하는 재조합 당단백질 조성물이 생성된다. 미국 특허 제7,029,872호 및 미국 공개 특허공보 제2006/0040353호에는 Gal₂GlcNAc₂Man₃GlcNAc₂ 글리코형태를 포함하는 당단백질을 생산할 수 있는 저급 진핵 생물 숙주 세포가 기재되어 있다. 상기 세포에서 생성된 당단백질은 갈락토시다제를 이용하여 시험관 내에서 처리하여 GlcNAc₂Man₃GlcNAc₂ 글리코형태를 포함하는 재조합 당단백질, 예를 들어 GlcNAc₂Man₃GlcNAc₂ 글리코형태를 우세적으로 포함하는 재조합 당단백질 조성물을 생성시킬 수 있다. 본원에 교시된 바와 같이 갈락토키나제 활성, UDP-갈락토스-4-에피머라제 활성, 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 활성 및 임의로 갈락토스 퍼미아제 활성을 발현하도록 추가로 유전적으로 공학처리시킨 이들 숙주 세포는 탄소원으로서 갈락토스를 사용할 수 있고, 갈락토스를 함유하는 N-글리칸의 비율이 상기 언급된 를루아르 경로 효소를 포함하도록 유전적으로 공학처리시키지 않은 숙주 세포에서 보다 더 큰 당단백질을 생성할 수 있다.

추가의 실시양태에서, 갈락토스로 말단화된 복합 N-글리칸을 만들 수 있고 본원에 기재된 바와 같이 탄소원으로서 갈락토스를 동화시킬 수 있는 바로 앞의 숙주 세포는 정상적으로는 시알릴트랜스퍼라제 촉매적 도메인과 연합되지 않는 세포성 표적화 신호 펩티드와 융합되고 시알릴트랜스퍼라제 활성이 숙주 세포의 ER 또는 골지체를 표적으로 하도록 선별된 시알릴트랜스퍼라제 촉매적 도메인을 추가로 포함할 수 있다. 숙주 세포의 ER 또는 골지체 내로 재조합 당단백질을 통과시키면, NANA₂Gal₂GlcNAc₂Man₃GlcNAc₂ 또는 NANAGal₂GlcNAc₂Man₃GlcNAc₂ 글리코형태, 또는 그의 혼합물을 우세적으로 포함하는 재조합 당단백질이 생성된다. 효모 및 섬유상 진균과 같은 저급 진핵 생물 숙주 세포의 경우에는, 이러한 숙주 세포가 N-글리칸으로 전이시키기 위한 CMP-시알산을 제공하는 수단을 추가로 포함하는 것이 유용하다. 미국 공개 특허공보 제2005/0260729호에는 CMP-시알산 합성 경로를 갖도록 저급 진핵 생물을 유전적으로 공학처리시키는 방법이 기재되어 있고, 미국 공개 특허공보 제2006/0286637호에는 시알릴화 당단백질을 생성하도록 저급 진핵 생물을 유전적으로 공학처리시키는 방법이 기재되어 있다. 본원에 교시된 바와 같이 갈락토키나제 활성, UDP-갈락토스-4-에피머라제 활성, 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 활성 및 임의로 갈락토스 퍼미아제 활성을 발현하도록 추가로 유전적으로 공학처리시킨 이들 숙주 세포는 탄소원으로서 갈락토스를 사용할 수 있고, 갈락토스를 함유하는 N-글리칸의 비율이 상기 언급된 를루아르 경로 효소를 포함하도록 유전적으로 공학처리시키지 않은 숙주 세포에서 보다 더 큰 당단백질을 생성할 수 있다.

또 다른 실시양태에서, GlcNAcMan₅GlcNAc₂ N-글리칸을 우세적으로 갖는 당단백질을 생성하는 숙주 세포는 정상적으로는 갈락토실트랜스퍼라제 촉매적 도메인과 연합되지 않는 세포성 표적화 신호 펩티드와 융합되고 갈락토실트랜스퍼라제 활성이 숙주 세포의 ER 또는 골지체를 표적으로 하도록 선별된 갈락토실트랜스퍼라제 촉매적 도메인을 추가로 포함한다. 숙주 세포의 ER 또는 골지체 내로 재조합 당단백질을 통과시키면, GalGlcNAcMan₅GlcNAc₂ 글리코형태를 우세적으로 포함하는 재조합 당단백질이 생성된다. 본원에 교시된 바와 같이 갈락토키나제 활성, UDP-갈락토스-4-에피머라제 활성, 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 활성 및 임의로 갈락토스 퍼미아제 활성을 발현하도록 추가로 유전적으로 공학처리시킨 이들 숙주 세포는 탄소원으로서 갈락토스를 사용할 수 있다.

추가의 실시양태에서, 갈락토스로 말단화된 하이브리드 N-글리칸을 만들 수 있고 본원에 기재된 바와 같이 탄소원으로서 갈락토스를 동화시킬 수 있는 바로 앞의 숙주 세포는 정상적으로는 시알릴트랜스퍼라제 촉매적 도메인과 연합되지 않는 세포성 표적화 신호 펩티드와 융합되고 시알릴트랜스퍼라제 활성이 숙주 세포의 ER 또는 골지체를 표적으로 하도록 선별된 시알릴트랜스퍼라제 촉매적 도메인을 추가로 포함할 수 있다. 숙주 세포의 ER 또는 골지체 내로 재조합 당단백질을 통과시키면, NANAGalGlcNAcMan₅GlcNAc₂ 글리코형태를 포함하는 재조합 당단백질이 생성된다. 본원에 교시된 바와 같이 갈락토키나제 활성, UDP-갈락토스-4-에피머라제 활성, 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 활성 및 임의로 갈락토스 퍼미아제 활성을 발현하도록 추가로 유전적으로 공학처리시킨 이들 숙주 세포는 탄소원으로서 갈락토스를 사용할 수 있다.

각종 앞의 숙주 세포는 하나 이상의 당 수송인자, 예컨대 UDP-GlcNAc 수송인자 [예를 들어, 클루이베로미세스 락티스 및 무스 무스쿨루스 (Mus musculus) UDP-GlcNAc 수송인자], UDP-갈락토스 수송인자 (예를 들어, 드로소필라 멜라노가스터 UDP-갈락토스 수송인자), 및 CMP-시알산 수송인자 (예를 들어, 인간 시알산 수송인자)를 추가로 포함한다. 저급 진핵 생물 숙주 세포, 예컨대 효모 및 섬유상 진균에는 상기 수송인자가 결여되기 때문에, 효모 및 섬유상 진균과 같은 저급 진핵 생물 숙주 세포가 상기 수송인자를 포함하도록 이를 유전적으로 공학처리시키는 것이 바람직하다.

숙주 세포에는 β-만노실트랜스퍼라제 유전자 (예를 들어, BMT1 , BMT2 , BMT3, 및 BMT4) (미국 공개 특허공보 제2006/0211085호 참조) 중의 하나 이상을 결실 또는 붕괴시킴으로써 α-만노시다제-저항성 N-글리칸을 갖는 당단백질 및 포스포만노실 트랜스퍼라제 유전자 PNO1 및 MNN4B (예를 들어, 미국 특허 제7,198,921호 및 제7,259,007호 참조) 중의 어느 하나 또는 둘 다를 결실 또는 붕괴시킴으로써 (추가의 측면에서는, MNN4A 유전자를 결실 또는 붕괴시키는 것이 포함될 수도 있다) 포스포만노스 잔기를 갖는 당단백질을 제거하도록 유전적으로 공학처리시킨 세포가 추가로 포함된다. 붕괴에는 특별한 효소를 암호화하는 개방 판독 프레임을 붕괴시키는 것, 또는 개방 판독 프레임의 발현을 붕괴시키는 것, 또는 간섭 RNA, 안티센스 RNA 등을 이용하여 β-만노실트랜스퍼라제 및/또는 포스포만노실트랜스퍼라제 중의 하나 이상을 암호화하는 RNA의 해독을 폐기하는 것이 포함된다. 숙주 세포에는 특별한 N-글리칸 구조를 생성하도록 변형시킨 상기 언급된 숙주 세포 중의 어느 하나가 추가로 포함될 수 있다.

숙주 세포에는 단백질 O-만노실트랜스퍼라제 (Dol-P-Man:단백질 (Ser/Thr) 만노실 트랜스퍼라제 유전자) (PMT) (미국 특허 제5,714,377호 참조) 중의 하나 이상을 결실 또는 붕괴시킴으로써 당단백질의 O-글리코실화를 제어하도록 유전적으로 변형시키거나 또는 국제 공개공보 WO 2007061631에 기재된 바와 같은 알파-만노시다제 및/또는 Pmtp 억제제의 존재 하에 성장시키거나, 또는 둘 다를 수행한 저급 진핵 생물 세포 (예를 들어, 피키아 파스토리스와 같은 효모)가 추가로 포함된다. 붕괴에는 Pmtp를 암호화하는 개방 판독 프레임을 붕괴시키는 것, 또는 개방 판독 프레임의 발현을 붕괴시키는 것, 또는 간섭 RNA, 안티센스 RNA 등을 이용하여 Pmtp 중의 하나 이상을 암호화하는 RNA의 해독을 폐기하는 것이 포함된다. 숙주 세포에는 특별한 N-글리칸 구조를 생성하도록 변형시킨 상기 언급된 숙주 세포 중의 어느 하나가 추가로 포함될 수 있다.

Pmtp 억제제에는 벤질리덴 티아졸리딘디온이 포함되지만, 이에 제한되지 않는다. 사용될 수 있는 벤질리덴 티아졸리딘디온의 예는 5-[[3,4-비스(페닐메톡시)페닐]메틸렌]-4-옥소-2-티옥소-3-티아졸리딘아세트산; 5-[[3-(1-페닐에톡시)-4-(2-페닐에톡시)]페닐]메틸렌]-4-옥소-2-티옥소-3-티아졸리딘아세트산; 및 5-[[3-(1-페닐-2-히드록시)에톡시)-4-(2-페닐에톡시)]페닐]메틸렌]-4-옥소-2-티옥소-3-티아졸리딘아세트산이다.

특별한 실시양태에서는, 하나 이상의 내인성 PMT 유전자의 기능 또는 발현을 저하, 붕괴 또는 결실시킨다. 예를 들어, 특별한 실시양태에서는, PMT1, PMT2, PMT3 및 PMT4 유전자로 이루어진 군으로부터 선택된 하나 이상의 내인성 PMT 유전자의 기능 또는 발현을 저하, 붕괴 또는 결실시키거나; 숙주 세포를 하나 이상의 PMT 억제제의 존재 하에 배양한다. 추가의 실시양태에서는, 숙주 세포가 하나 이상의 PMT 유전자 결실 또는 붕괴를 포함하고, 숙주 세포를 하나 이상의 Pmtp 억제제의 존재 하에 배양한다. 이들 실시양태의 특별한 측면에서는, 숙주 세포가 또한, 분비된 알파-1,2-만노시다제를 발현한다.

PMT 결실 또는 붕괴 및/또는 Pmtp 억제제는 O-글리코실화 점유율을 저하시킴으로써, 즉 글리코실화되는 당단백질 상의 O-글리코실화 부위의 총 수를 감소시킴으로써 O-글리코실화를 제어한다. 세포에 의해 분비되는 알파-1,2-만노시다제를 추가로 부가하는 것이, 당단백질 상에 있는 O-글리칸의 만노스 쇄 길이를 감소시킴으로써 O-글리코실화를 제어한다. 따라서, PMT 결실 또는 붕괴 및/또는 Pmtp 억제제를 분비된 알파-1,2-만노시다제의 발현과 조합하는 것이, 점유율 및 쇄 길이를 감소시킴으로써 O-글리코실화를 제어한다. 특별한 상황 하에서는, PMT 결실 또는 붕괴, Pmtp 억제제 및 알파-1,2-만노시다제의 특별한 조합이 실험적으로 결정되는데, 이는 특별한 이종 당단백질 (예를 들어, Fab 및 항체)이 발현되고 상이한 효율 정도로 골지체를 통하여 수송됨으로써 PMT 결실 또는 붕괴, Pmtp 억제제 및 알파-1,2-만노시다제의 특별한 조합을 요구할 수 있기 때문이다. 또 다른 측면에서는, 하나 이상의 내인성 만노실트랜스퍼라제 효소를 암호화하는 유전자를 결실시킨다. 이러한 결실(들)은 분비된 알파-1,2-만노시다제 및/또는 PMT 억제제를 제공하는 것과 병용될 수 있거나 또는 분비된 알파-1,2-만노시다제 및/또는 PMT 억제제를 제공하는 것 대신일 수 있다.

따라서, O-글리코실화를 제어하는 것이, 본원에 기재된 숙주 세포에서 특별한 당단백질을 보다 우수한 총 수율 또는 적당하게 어셈블리된 당단백질의 수율로 생성시키는 데에 유용할 수 있다. O-글리코실화를 감소 또는 제거하는 것이 완전 항체 및 Fab 단편의 어셈블리 및 수송에 유리한 효과를 나타내는 것으로 여겨지는데, 이는 이들이 분비성 경로를 횡단하여 세포 표면으로 수송되기 때문이다. 따라서, O-글리코실화가 제어되는 세포에서는, 적당하게 어셈블리된 항체 또는 Fab 단편의 수율이, O-글리코실화가 제어되지 않은 숙주 세포에서 수득된 수율에 비해 증가된다.

따라서, 그 위에 존재하는 우세한 N-글리칸에 Man₈GlcNAc₂, Man₇GlcNAc₂, Man₆GlcNAc₂, Man₅GlcNAc₂, GlcNAcMan₅GlcNAc₂, GalGlcNAcMan₅GlcNAc₂, NANAGalGlcNAcMan₅GlcNAc₂, Man₃GlcNAc₂, GlcNAc_(1-4)Man₃GlcNAc₂, Gal_(1-4)GlcNAc_(1-4)Man₃GlcNAc₂, NANA_(1-4)Gal_(1-4)GlcNAc_(1-4)Man₃GlcNAc₂이 포함되지만, 이에 제한되지 않는 당단백질을 생성하도록 유전적으로 변형된 숙주 세포가 고려된다. 추가로, 전술된 N-글리칸의 특별한 혼합물을 갖는 당단백질을 생성하는 숙주 세포가 포함된다.

본원의 숙주 세포 및 방법은 광범위한 재조합 단백질 및 당단백질을 생성시키는 데에 유용하다. 본원에 기재된 숙주 세포에서 생성될 수 있는 재조합 단백질 및 당단백질의 예에는 에리트로포이에틴 (EPO); 시토카인, 예컨대 인터페론 α, 인터페론 β, 인터페론 γ, 및 인터페론 ω; 및 과립구-콜로니 자극 인자 (GCSF); GM-CSF; 응고 인자, 예컨대 인자 VIII, 인자 IX, 및 인간 단백질 C; 항트롬빈 III; 트롬빈; 가용성 IgE 수용체 α-쇄; 면역글로불린, 예컨대 IgG, IgG 단편, IgG 융합물, 및 IgM; 면역부착인자 및 기타 Fc 융합 단백질, 예컨대 가용성 TNF 수용체-Fc 융합 단백질; RAGE-Fc 융합 단백질; 인터루킨; 유로키나제; 키마제; 및 우레아 트립신 억제제; IGF-결합성 단백질; 표피 성장 인자; 성장 호르몬-방출 인자; 아넥신 V 융합 단백질; 안지오스타틴; 혈관 내피 성장 인자-2; 골수 전구세포 억제 인자-1; 오스테오프로테게린; α-1-항트립신; α-태아 단백질; DNase II; 인간 플라스미노겐의 크링글 3; 글루코세레브로시다제; TNF 결합성 단백질 1; 난포 자극 호르몬; 세포독성 T 림프구 관련 항원 4 - Ig; 막관통 활성화제 및 칼슘 조정제 및 시클로필린 리간드; 글루카곤 유사 단백질 1; 및 IL-2 수용체 효능제가 포함되지만, 이에 제한되지 않는다.

본원에 기재된 본 발명의 재조합 숙주 세포는 본원에 교시된 바와 같이 변형시키기 전에 숙주 세포에서 수득할 수 있는 갈락토스 비율 (%)과 비교해서 갈락토스-함유 N-글리칸의 비율이 증가되는 항체 조성물을 제공하는 것이 바람직한 경우에, 항체, Fc 융합 단백질 등을 생성시키는 데에 특히 유용하다. 일반적으로, 숙주 세포는 GO:G1/G2 글리코형태의 비가 2:1 미만이 되는 항체 조성물이 생성될 수 있게 해준다. 본원의 숙주 세포에서 만들어질 수 있고 GO:G1/G2의 비가 2:1 미만인 항체의 예에는 인간 항체, 인간화 항체, 키메라 항체, 중쇄 항체 (예: 카멜 또는 라마)가 포함되지만, 이에 제한되지 않는다. 구체적인 항체에는 그의 일반 명칭 (표적) 하에 인용된 다음 항체가 포함되지만, 그에 제한되지 않는다: 무로모나브-CD3 (항-CD3 수용체 항체), 아브식시마브 (항-CD41 7E3 항체), 리툭시마브 (항-CD20 항체), 다클리주마브 (항-CD25 항체), 바실릭시마브 (항-CD25 항체), 팔리비주마브 (항-RSV (호흡기 합포체 바이러스) 항체), 인플릭시마브 (항-TNFα 항체), 트라스투주마브 (항-Her2 항체), 젬투주마브 오조가미신 (항-CD33 항체), 알렘투주마브 (항-CD52 항체), 이브리투모마브 티욱세텐 (항-CD20 항체), 아달리무마브 (항-TNFα 항체), 오말리주마브 (항-IgE 항체), 토시투모마브-¹³¹I (항-CD20 항체의 요오드화 유도체), 에팔리주마브 (항-CD11a 항체), 세툭시마브 (항-EGF 수용체 항체), 골리무마브 (항-TNFα 항체), 베바시주마브 (항 VEGF-A 항체), 및 그의 유도체. 본원에 기재된 숙주 세포에서 만들 수 있는 Fc-융합 단백질의 예에는 에탄세르셉트 (etancercept) (TNFR-Fc 융합 단백질), FGF-21-Fc 융합 단백질, GLP-1-Fc 융합 단백질, RAGE-Fc 융합 단백질, EPO-Fc 융합 단백질, ActRIIA-Fc 융합 단백질, ActRIIB-Fc 융합 단백질, 글루카곤-Fc 융합물, 옥신토모둘린 (oxyntomodulin)-Fc-융합물, 및 그의 유사체 및 변이체가 포함되지만, 이에 제한되지 않는다.

본원에 기재된 재조합 세포를 이용하여, 이종 펩티드 또는 약물 분자와 화학적으로 접합시키는 데에 적합한 항체 및 Fc 단편을 생성시킬 수 있다. 예를 들어, WO2005047334, WO2005047336, WO2005047337, 및 WO2006107124에는 펩티드 또는 약물 분자를 Fc 단편과 화학적으로 접합시키는 것이 기재되어 있다. EP1180121, EP1105409, 및 US6593295에는 펩티드 등을, 완전 항체를 포함한 혈액 성분과 화학적으로 접합시키는 것이 기재되어 있다.

본원에 교시된 바와 같은 를루아르 경로 효소의 각종 조합물을 암호화하는 플라스미드 벡터 및/또는 숙주 세포는 이종 단백질을 발현하는 재조합 피키아 파스토리스를 만들기 위한 선별 시스템을 제공해 주는 키트로서 제공될 수 있다. 피키아 파스토리스 숙주 세포는 갈락토키나제, UDP-갈락토스-4-에피머라제, 및 갈락토스-1-포스페이트 우리딜 트랜스퍼라제로 이루어진 군으로부터 선택된 를루아르 경로 효소 중의 1개 또는 2개를 발현하도록 유전적으로 공학처리시킨다. 임의로, 숙주 세포는 갈락토스 퍼미아제를 또한 발현할 수 있다. 클로닝 벡터는 다중 클로닝 부위, 및 제공된 숙주 세포에서는 존재하지 않는 를루아르 경로 효소(들)를 암호화하는 발현 카세트를 포함한다. 벡터는 다중 클로닝 부위를 플랭킹하는 전사 종결 서열 및 피키아 파스토리스 작동 가능한 프로모터를 추가로 포함할 수 있고, 벡터가 숙주 세포 게놈 내의 특별한 위치를 표적으로 하도록 표적화 서열을 추가로 포함할 수 있다. 일부 실시양태에서, 상기 키트는 3가지 룰루아르 경로 효소 모두 (갈락토키나제, UDP-갈락토스-4-에피머라제, 및 갈락토스-1-포스페이트 우리딜 트랜스퍼라제)를 암호화하고 다중 클로닝 부위를 포함하는 벡터, 및 이러한 3가지 를루아르 경로 효소가 결여된 숙주 세포를 제공한다. 상기 키트는 지시 사항, 벡터 지도 등을 추가로 포함할 것이다.

다음 실시예는 본 발명의 추가 이해를 증진시키기 위한 것이다.

실시예 1

본 실시예에서는, 갈락토스-함유 N-글리칸을 생성할 수 있는 피키아 파스토리스 숙주 세포를, 데이비드슨 등의 미국 공개 특허공보 제2006/0040353호에 기재된 방법에 따라서 일반적으로 구축하였다. 본원의 방법을 사용하여, 정상적으로는 탄소원으로서 갈락토스를 사용할 수 없는 기타 종의 재조합 숙주 세포를, 단독 탄소원으로서 갈락토스를 사용할 수 있는 재조합 숙주 세포로 만들 수 있다.

갈락토실트랜스퍼라제 I 키메라 효소. 호모 사피엔스 (Homo sapiens) β-1,4-갈락토실트랜스퍼라제 I 유전자 (hGalTI, 유전자은행 AH003575)를, PCR 프라이머 RCD192

및 RCD186

을 이용하여 인간 신장 cDNA (공급처: Clontech)로부터 PCR 증폭시켰다. 이러한 PCR 생성물을 pCR2.1 벡터 (공급처: Invitrogen) 내로 클로닝하고 서열 분석하였다. 이러한 클론으로부터, 다음 3가지 목적을 위해 PCR 중복 돌연변이 유발을 수행하였다: 1) 야생형 단백질 서열은 유지시키면서 개방 판독 프레임 내의 NotI 부위를 제거하고, 2) 촉매적 도메인 만을 제공하기 위해 내인성 막관통 도메인의 바로 하류에 있는 단백질을 절단시키며, 3) 모듈 클로닝을 위해, 5' 및 3' 말단에 각각 AscI 및 PacI 부위를 도입하기 위함. 이를 위하여, NotI 부위까지의 유전자의 5' 말단은 PCR 프라이머 RCD198

및 RCD201

을 이용하여 PCR 증폭시켰고, 3' 말단은 PCR 프라이머 RCD200

및 RCD199

를 이용하여 PCR 증폭시켰다. 생성물을 프라이머 RCD198 및 RCD199와 함께 복제시켜, NotI 부위를 제거시키면서 야생형 아미노산 서열을 수반한 갈락토실트랜스퍼라제를 암호화하는 절단된 개방 판독 프레임 (ORF)을 재합성하였다. 새로운 hGalTI β PCR 촉매적 도메인 생성물을 pCR2.1 벡터 (공급처: Invitrogen, Carlsbad, CA) 내로 클로닝하고 서열 분석하였다. 도입된 AscI 및 PacI 부위를 그들의 인식성 제한 효소로 절단시켰고, DNA 단편을 PpGAPDH 프로모터의 하류에서 플라스미드 pRCD259 내로 서브클로닝하여 플라스미드 pRCD260을 창출시켰다. hGalTI43 촉매적 도메인을 암호화하는 뉴클레오티드 서열 (첫 번째 43개 아미노산이 결여됨; 서열 50)이 서열 49에 제시된다.

이어서, 단백질이 골지 내의 각종 위치를 표적으로 하도록 하는, 에스. 세레비지아에, 피. 파스토리스 및 케이. 락티스로부터의 효모 리더 서열의 라이브러리를 NotI 부위와 AscI 부위 사이에서 상기 벡터에 연결시켜, hGalTI β43 촉매적 도메인을 암호화하는 개방 판독 프레임과 동일 프레임 내에서 이들 리더 암호화 서열을 융합시켰다. 상기 언급된 GalT 융합 단백질의 조합 라이브러리를 YSH44에서 발현시켰고, 이로써 생성되는 형질전환체를 대상으로 하여, 정제된 K3으로부터의 N-글리칸을 각 형질전환체로부터 방출시키고 MALDI-TOF MS에 의해 그들 각각의 분자량을 결정함으로써 분석하였다. 피. 파스토리스 균주 YSH44는 이분지의 말단 GlcNAc 잔기를 수반한 거의 균일한 복합 글리코형태로서 인간 플라스미노겐의 크링글 3 도메인 (K3)을 발현한다 (GlcNAc₂Man₃GlcNAc₂, 도 1 참조). 활성 구축물 중의 하나가 Mnn2-hGalTIβ43이었는데, 이는 hGalTI β43 촉매적 도메인 (아미노산 44-398; 서열 50)의 N-말단과 융합된 에스. 세레비지아에 Mnn2 표적화 펩티드 (아미노산 1-36 (53); 서열 20)의 N-말단을 포함하는 융합 단백질을 암호화하였다. 리더 서열은 에스. 세레비지아에 MNN2 유전자의 첫 번째 108 bp를 함유하였고, 이는 플라스미드 pXB53을 창출시키기 위해 pRCD260의 NotI 부위와 AscI 부위 사이에 삽입시킨 서열이었다. 플라스미드 pXB53을 XbaI로 선형화시켰고, 이를 효모 균주 YSH44 내로 형질전환시켜 균주 YSH71을 생성시켰다. 균주 YSH44는 미국 공개 특허공보 제20070037248호, 제20060040353호, 제20050208617호 및 제20040230042에 기재되었고, 균주 YSH71은 미국 공개 특허공보 제20060040353호에 기재되었다.

도 3c에 도시된 바와 같이, 균주 YSH71에 의해 생성된 N-글리칸의 소수 (약 10%)는 GalGlcNAc₂Man₃GlcNAc₂ (G1) N-글리칸을 만들기 위해 K3 상의 GlcNAc₂Man₃GlcNAc₂ (G0) N-글리칸 기질에 단일 갈락토스 당을 부가한 것과 일치되는 질량인 반면, 나머지 N-글리칸은 모 균주 YSH44에서 생성된 N-글리칸과 동일하다 (도 3b). 도 3a는 야생형 효모에서 생성된 N-글리칸을 도시한 것이다.

본 발명자들은 불완전한 갈락토스 전이에 대한 몇 가지 설명을 고려하였다. 이러한 설명으로는 UDP-갈락토스 수송이 불량하거나, UDP-갈락토스의 내인성 수준이 낮거나, 또는 최적 이하의 GalT 활성을 들 수 있다. 갈락토스를 N-글리칸 상으로 전이시키는 것은 낮을 수도 있는데, 이는 상기 균주가 UDP-갈락토스를 시토졸로부터 골지체로 전위시키기 위해서는 수송인자를 요구할 수도 있기 때문인 것으로 여겨진다 (문헌 [Ishida et al., J. Biochem. 120: 1074-1078 (1996)]; [Miura et al., J. Biochem (Tokyo) 120: 236-241 (1996)]; [Tabuchi et al., Biochem. Biophys. Res. Com. 232: 121-125 (1997)]; [Segawa et al., FEBS Letts. 451: 295-298 (1999)] 참조). 수송인자는 이종 숙주에서는 적절하게 국재될 수 없는 다중 막관통 도메인을 수반한 복합 단백질이다. 그러나, UDP-갈락토스 수송인자를 포함한 몇 가지 당 뉴클레오티드 수송인자가 이종 시스템에서 활동적으로 발현되었다 (문헌 [Sun-Wada et al., J, Biochem. (Tokyo) 123: 912-917 (1998)]; [Segawa et al., Eur. J. Biochem. 269: 128-138 (2002)]; [Kainuma et al., Glycobiol. 9: 133-141 (1999)]; [Choi et al., Proc Natl Acad Sci USA 100(9): 5022-5027 (2003)] 참조). UDP-갈락토스를 골지 내로 효율적으로 수송하기 위해서는, UDP-갈락토스 수송인자를 암호화하는 드로소필라 멜라노가스터 유전자 DmUGT (유전자은행 승인 번호 AB055493)를 클로닝하고, 이러한 클론을 다음과 같이 MNN2 - hGalTI β43 구축물을 발현하는 균주 YSH71 내로 형질전환시켰다.

UDP -갈락토스 수송인자의 클로닝. DmUGT로서 지칭된, UDP-갈락토스 수송인자를 암호화하는 디. 멜라노가스터 유전자 (유전자은행 AB055493)를, PCR 프라이머 DmUGT-5'

및 DmUGT-3'

을 이용하여 디. 멜라노가스터 cDNA 라이브러리 (UC 버클리 드로소필라 게놈 프로젝트, 난소 λ-ZAP 라이브러리 GM)로부터 PCR 증폭시켰고, 이와 같이 PCR 증폭시킨 DNA 단편을 pCR2.1 (공급처: Invitrogen, Carlsbad, CA) 내로 클로닝하며 서열 분석하였다. 이어서, NotI 및 PacI 부위를 사용하여 상기 개방 판독 프레임을, NotI 부위와 PacI 부위 사이의 PpOCH1 프로모터의 하류에서 플라스미드 pRCD393 내로 서브클로닝하여 플라스미드 pSH263을 창출시켰다. DmUGT를 암호화하는 뉴클레오티드 서열이 서열 37에 제시되었고, DmUGT의 아미노산 서열은 서열 38에 제시되었다. 이 플라스미드를 AgeI로 선형화시켰고, 이를 균주 YSH71 내로 형질전환시켜 균주 YSH80을 창출시켰다. 그러나, DmUGT를 암호화하는 플라스미드를 YSH71 내로 형질전환시킨 경우에는 K3의 N-글리칸 프로파일 상의 중요한 변화가 없는 것으로 밝혀졌다. 따라서, 본 발명자들은 UDP-갈락토스의 세포내 풀을 증강시키는 데에 노력을 집중하기로 결정하였다.

피. 파스토리스는 탄소원으로서 갈락토스를 동화할 수 없기 때문에 (문헌 [Kurtzman Pichia. The Yeasts: A Taxonomic Study. C. P. a. F. Kurtzman, J. W. Amsterdam, Elsevier Science Publ.: 273-352 (1998)] 참조), 본 발명자들은 상기 균주 내에서의 UDP-갈락토스 풀이 충분하지 않을 수도 있다고 추측하였다. 갈락토스 동화성 유기체 (세균 및 포유류 포함) 간에 보존되는 효소 UDP-갈락토스 4-에피머라제는 를루아르 경로의 제3 단계를 촉매한다. 이 효소는 진핵 생물의 시토졸에 전형적으로 국재되고, UDP-글루코스 및 UDP-갈락토스의 가역적 전환에 대해 책임이 있다 (문헌 [Allard et al., Cell. Mol. Life Sci. 58: 1650-1665 (2001)] 참조). 본 발명자들은 이종 UDP-갈락토스 4-에피머라제의 발현으로 인해, 골지 내로의 수송시 갈락토스 트랜스퍼라제가 갈락토스를 N-글리칸 상으로 전이시켜 줄 수 있는 시토졸성 UDP-갈락토스 풀을 생성시킬 수 있다고 추론하였다.

UDP -갈락토스 4- 에피머라제의 클로닝. 공지된 UDP-갈락토스 4-에피머라제와 상당히 동일한 단백질을 암호화하는, 기존에 성상 확인되지 않은 유전자를 다음과 같이 효모 쉬조사카로미세스 폼베 (Schizosaccharomyces pombe)로부터 클로닝하였다 (SpGALE로 명명됨). 예상된 UDP-갈락토스 4-에피머라제를 암호화하는 1.1 Kb 에스. 폼베 (S. pombe) 유전자 (유전자은행 NC_003423) (SpGALE로서 지칭됨)을, PCR 프라이머 GALE2-L

및 GALE2-R

을 이용하여 에스. 폼베 (ATCC24843) 게놈 DNA로부터 PCR 증폭시켰다. 이와 같이 PCR 증폭시킨 생성물을 pCR2.1 (공급처: Invitrogen, Carlsbad, CA) 내로 클로닝하고 서열 분석하였다. 서열 분석 결과, +66 위치에 인트론 (175 bp)이 존재하는 것으로 밝혀졌다. 이러한 인트론을 제거하기 위해, 상류 PCR 프라이머 GD1

(이는 NotI 부위, 인트론의 상류에 66개 염기, 그 다음 인트론 앞에 20개 염기를 갖는다) 및 하류 PCR 프라이머 GD2

(이는 PacI 부위를 갖는다)를 설계하였다. 프라이머 GD1 및 GD2를 사용하여 pCR2.1 서브클론으로부터 SpGALE 인트론-결여 유전자를 증폭시켰고, 이 생성물을 pCR2.1 내로 다시 클로닝하고 서열 분석하였다. 이어서, SpGALE를 NotI 부위와 PacI 부위 사이에서 플라스미드 pRCD402 및 pRCD403 내로 서브클로닝하여 플라스미드 pRCD406 (P _OCH1 -SpGALE-CYC1TT) 및 pRCD407 (P _SEC4 - SpGALE - CYC1TT)을 각각 창출시켰다. 이들 플라스미드는 기존에 미국 공개 특허공보 제20060040353에 기재되었다. 인트론을 수반하지 않는 SpGALE를 암호화하는 뉴클레오티드 서열이 서열 35에 제시되었고, 아미노산 서열은 서열 36에 제시되었다.

인간 UDP-갈락토스-4-에피머라제 (hGalE)는 서열 48에 제시된 아미노산 서열을 갖고 있고, 이는 서열 47에 제시된 뉴클레오티드 서열에 의해 암호화된다. hGalE가 SpGALE 대신 사용될 수 있다.

이중 GalT /갈락토스-4- 에피머라제 구축물의 구축. ScMNN2-hGalTIβ43 융합 유전자를 함유하는 플라스미드 pXB53을 XhoI로 선형화시켰고, T4 DNA 중합효소를 이용하여 평활하게 만들었다. 이어서, P _PpOCH1 - SpGALE - CYC1TT 카세트를, XhoI 및 SphI로 플라스미드 pRCD406으로부터 제거하고, T4 DNA 중합효소를 이용하여 말단을 평활하게 만들며, 단편을 상기 pXB53 플라스미드 내로 삽입하여 플라스미드 pRCD425를 창출시켰다. 이 플라스미드를 XbaI로 선형화시켰고, 균주 YSH44 내로 형질전환시켜 균주 RDP52를 생성시켰는데, 이는 미국 공개 특허공보 제20060040353호에 이미 기재되었다. 몇 가지 형질전환체로부터 단리된 정제된 K3 상의 N-글리칸을 MALDI-TOF MS에 의해 분석하였다. 도 3d에 도시된 바와 같이, 상당한 비율의 N-글리칸이 2개 (약 20% G2: Gal₂GlcNAc₂Man₃GlcNAc₂) 또는 단일 갈락토스 부분 (약 40% G1: Gal₁GlcNAc₂Man₃GlcNAc₂)을 GO (GlcNAc₂Man₃GlcNAc₂) 기질 상으로 부가한 것과 일치하는 질량을 획득한 반면, 나머지 N-글리칸은 YSH44 모 균주 (도 3e)에서 발견된 것 (즉, G0)과 변하지 않은 채로 유지된 것으로 밝혀졌다.

삼중 GalT /갈락토스-4- 에피머라제 / UDP 갈락토스 수송인자 구축물의 구축. P _OCH1 -DmUGT-CYC1TT를 함유하는 G418^R 플라스미드, 즉 pSH263은, SacI로 분해시키고 T4 DNA 중합효소를 이용하여 말단을 평활하게 만듦으로써 선형화시켰다. P _SEC4 -SpGALE-CYC1TT 카세트는 XhoI 및 SphI로 분해시키고 T4 DNA 중합효소를 이용하여 말단을 평활하게 만듦으로써 플라스미드 pRCD407로부터 제거하였다. 이어서, 평활-말단시킨 SpGALE 단편을 상기 pSH263 내로 삽입하여 플라스미드 pRCD446을 창출시켰다. P _GAPDH ScMNN2-hGalTI β43- CYC1TT 카세트는, BglII/BamHI로 분해시킴으로써 플라스미드 pXB53으로부터 방출시키고, T4 DNA 중합효소를 이용하여 말단을 평활하게 만들었다. 이어서, 이와 같이 평활-말단된 hGalTI -53을 pRCD446의 평활한 EcoRI 부위 내로 삽입하여 플라스미드 pRCD465를 창출시켰는데, 이는 hGalTI -53, SpGALE, 및 DmUGT를 함유하는 삼중 G418^R 플라스미드이다. 플라스미드 pRCD465를 AgeI로 선형화시켰고, 이를 균주 YSH44 내로 형질전환시켜 균주 RDP80을 창출시켰는데, 이는 미국 공개 특허공보 제20060040353호에 기재된 바와 같다. 상기 균주에 의해 생성된 분비된 K3으로부터 방출된 N-글리칸을 MALDI-TOF MS에 의해 분석하였다. 이러한 N-글리칸은 2개의 갈락토스 잔기를 G0 기질에 정량적으로 부가하여 인간 갈락토실화 이분지의 복합 N-글리칸 G2 (Gal₂GlcNAc₂Man₃GlcNAc₂)를 산출하는 것과 일치하는 질량인 것으로 밝혀졌다 (도 3e). 이러한 N-글리칸을 시험관 내에서 β-갈락토시다제 분해시키면, 2개의 갈락토스 잔기를 제거시켜 G0 (GlcNAc₂Man₃GlcNAc₂)를 산출시키는 것에 상응하는 질량 감소가 일어났다 (도 3f).

또한, 균주 RDP80으로부터의 정제된 K3을 CMP-시알산의 존재 하에 래트 α-2,6-N-시알릴트랜스퍼라제로 시험관내 처리하면, 거의 균일하게 NANA₂Gal₂GlcNAc₂Man₃GlcNAc₂로 전환되었다 (도 3g). 이러한 결과는 피. 파스토리스에서 생성된 복합 N-글리칸의 고도로 효율적인 연장이 (1) 충분한 세포내 UDP-갈락토스 풀의 대사 공학, (2) 활동적이고 적절하게 국재된 GalT의 발현, 및 (3) 활성 UDP-갈락토스 수송인자에 의한 UDP-갈락토스의 골지체 내로의 전위를 통하여 달성 가능하다는 것을 나타낸다. 그러나, 갈락토스 전이 효율은 를루아르 경로 효소를 실시예 2에 제시된 바와 같이 숙주 세포 내로 추가로 포함시킴으로써 개선되었다.

균주 및 배지. 이. 콜라이 균주 TOP1O 또는 DH5α를 재조합 DNA 작업에 사용하였다. 균주 JC308 (공급처: J. Cregg, Claremont, CA)로부터 유래된 피. 파스토리스 균주 YSH44 (문헌 [Hamilton et al., Science 301: 1244-1246 (2003)] 참조)가 각종 효모 균주의 발생에 사용되었다. 효모 균주의 형질전환은 기존에 보고된 바와 같이 전기천공에 의해 수행하였다 (문헌 [Cregg, et al., Mol. Biotechnol. 16: 23-52 (2000)] 참조). 단백질 발현은 성장 배지로서 1% 효모 추출물, 2% 펩톤, 100 mM 인산칼륨 완충제, pH 6.0, 1.34% 효모 질소 기재, 4 X 10^-5% 바이오틴 및 1% 글리세롤로 이루어진 완충 글리세롤-복합 배지 (BMGY); 및 유도 배지로서 BMGY 중의 글리세롤 대신 1% 메탄올로 이루어진 완충 메탄올-복합 배지 (BMMY)를 이용하여, 실온 하에 96-웰 판 포맷 (생물 반응기 실험은 제외된다)으로 수행하였다. YPD는 1% 효모 추출물, 2% 펩톤, 2% 덱스트로스 및 2% 한천이다.

제한 및 변형 효소는 뉴 잉글랜드 바이오랩스 (New England BioLabs; Beverly, MA)로부터 수득하였다. 올리고뉴클레오티드는 인터그레티드 DNA 테크놀로지 (Integrated DNA Technologies; Coralville, IA)로부터 수득하였다. β-갈락토시다제 효소는 QA 바이오 (San Mateo, CA)로부터 수득하였다. 96-웰 용해물-청정 판은 프로메가 (Promega; Madison, WI)로부터 수득하였다. 단백질-결합성 96-웰 판은 밀리포어 (Millipore; Bedford, MA)로부터 수득하였다. 염 및 완충제는 시그마 (Sigma; St. Louis, MO)로부터 수득하였다. MALDI 매트릭스는 알드리히 (Aldrich; Milwaukee, WI)로부터 수득하였다.

단백질 정제 및 N- 글리칸 분석. K3의 정제는 기존에 보고되었다 (문헌 [Choi et al., Proc. Natl. Acad. Sci. U.S.A. 100: 5022-5027 (2003)] 참조). N-글리칸은 기존에 보고된 바와 같이 (문헌 [Choi et al., 동일 문헌] 참조) 뉴 잉글랜드 바이오랩스 (Beverly, MA)로부터 수득한 효소 N-글리코시다제 F를 이용하여 K3으로부터 방출시켰다. 글리칸의 분자량은 기존에 보고된 바와 같이 (문헌 [Choi et al., 동일 문헌] 참조) 어플라이드 바이오시스템즈 (Applied Biosystems; Foster City, CA)로부터의 보야거 (Voyager) DE PRO 선형 MALDI-TOF 질량 분광계를 이용하여 결정하였다.

생물 반응기 배양. 150 ml의 BMGY 배지를 수반한 500 ml용의 조절막이 있는 용적 플라스크에 1 ml의 시드 배양물을 접종하였다 (플라스크 배양 참조). 이 접종물을 24℃에서 OD₆₀₀ 4 내지 6이 되도록 성장시켰다 (대략 18시간). 이어서, 접종물 배양으로부터의 세포를 원심분리시키고, 50 ml의 발효 배지 내로 재현탁시켰다 (배지 1리터당: CaSO₄·2H₂O 0.30 g, K₂SO₄ 6.00 g, MgSO₄·7H₂O 5.00 g, 글리세롤 40.0 g, PTM₁ 염 2.0 ml, 바이오틴 4x10^-3 g, H₃PO₄ (85%) 30 ml, PTM₁ 염 (1 리터당): CuSO₄·H₂O 6.00 g, NaI 0.08 g, MnSO₄·7H₂O 3.00 g, NaMoO₄·2H₂O 0.20 g, H₃BO₃ 0.02 g, CoCl₂·6H₂O 0.50 g, ZnCl₂ 20.0 g, FeSO₄·7H₂O 65.0 g, 바이오틴 0.20 g, H₂SO₄ (98%) 5.00 ml).

발효를 3-리터 디쉬 바닥 (1.5 리터 초기 충전 용적) 애플리콘 (Applikon) 생물 반응기에서 수행하였다. 발효기를 24℃에서 공급-배치식으로 수행하였고, 30% 수산화암모늄을 이용하여 pH를 4.5 ±0.1로 제어하였다. 진탕 속도 (450-900 rpm) 및 순수 산소 공급량을 조정함으로써 1 atm 하에 공기를 이용한 포화를 기준으로 하여 용해 산소량을 40% 이상으로 유지시켰다. 공기 유속을 1 vvm으로 유지시켰다. 배치 상 중의 초기 글리세롤 (40 g/L)이 고갈되는 경우 (이는 DO의 증가로써 표시된다), 12 ml/L의 PTM₁ 염을 함유하는 50% 글리세롤 용액을, 목적하는 바이오매스 농도에 도달할 때까지 12 ml/L/h의 공급 속도로 공급하였다. 30분 고갈 상 후, 메탄올 공급 (12 ml/L의 PTM₁을 수반한 100% 메탄올)을 개시하였다. 메탄올 공급 속도는 발효기 내의 메탄올 농도를 0.2 내지 0.5%로 제어하기 위해 사용된다. 메탄올 농도는 발효기로부터 오프가스에 위치한 TGS 가스 센서 ((Figaro Engineering Inc.로부터의 TGS822)를 이용하여 온라인으로 측정한다. 발효기를 8시간 마다 샘플링하여, 바이오매스 (OD₆₀₀, 습윤 세포 중량 및 세포 계수치), 잔류 탄소원 수준 [아미넥스 (Aminex) 87H을 이용한 HPLC에 의한 글리세롤 및 메탄올] 및 세포외 단백질 함량 (SDS page, 및 바이오-래드 단백질 검정에 의함)에 관하여 분석하였다.

시험관내 β- 갈락토시다제 분해. RDP80으로부터의 N-글리칸을 37℃ 하에 16 내지 20시간 동안 50 mM NH₄HCO₃, pH 6.0 중의 β1,4-갈락토시다제 (공급처: QA bio, San Mateo, CA)와 함께 항온 배양하였다.

시험관내 시알산 전이. 균주 RDP80으로부터 정제된 K3을 시알산 전이를 위한 기질로서 사용하였다. 이러한 단백질 중에서, 200 ㎍을 37℃ 하에 16 내지 20시간 동안 50 mM NH₄HCO₃, pH 6.0 중의 50 ㎍ CMP-시알산 및 15 mU 래트 재조합 α-(2,6)-(N)-시알릴트랜스퍼라제 (공급처: EMD Biosciences; San Diego, CA, 기존명: Calbiochem)과 함께 항온 배양하였다. 이어서, N-글리칸을 PNGaseF 분해에 의해 방출시키고 MALDI-TOF MS에 의해 탐지하였다.

실시예 2

효소 UDP-갈락토스 4-에피머라제는 를루아르 경로의 제3 단계를 촉매한다 (도 4). 실시예 1에 제시된 바와 같이, 이러한 효소를 암호화하는 유전자를 피. 파스토리스의 글리코-공학처리시킨 균주에서 이종 발현시키면, 이러한 이종 유전자를 발현하는 균주에서 갈락토스 전이가 현저하게 증가됨으로써 입증된 바와 같이, UDP-갈락토스의 세포내 풀이 생성되었다. 그러나, 또한 제시된 바와 같이, 이러한 효소를 단독으로 부가하면, 단독 탄소원으로서 갈락토스 상에서 성장할 수 있는 능력이 피. 파스토리스 균주 상에 부여되지 못하였다 (도 7, 균주 RDP578-1 참조). 따라서, 에스. 세레비지아에 내에서의 나머지 를루아르 경로를 실시예 1의 각종 균주 내로 도입하였다. 따라서, 본 실시예에서는 단독 탄소원으로서 갈락토스를 사용할 수 있는 피키아 파스토리스 숙주 세포를 구축하였다. 본원의 방법을 사용하여, 정상적으로는 탄소원으로서 갈락토스를 사용할 수 없는 기타 종의 재조합 숙주 세포를, 단독 탄소원으로서 갈락토스를 사용할 수 있는 재조합 숙주 세포로 만들 수 있다.

에스 . 세레비지아에 GAL1 의 클로닝. 갈락토키나제를 암호화하는 에스. 세레비지아에 유전자 (유전자은행 NP_009576) (ScGAL1로서 지칭됨)는 PCR 프라이머 PB158

및 PB159

를 이용하여 에스. 세레비지아에 게놈 DNA (균주 W3O3, 표준 스매쉬 앤 그랩 (smash and grab) 게놈 DNA 제제)로부터 PCR 증폭시켰고, 이와 같이 PCR 증폭시킨 DNA 단편을 pCR2.1 (공급처: Invitrogen, Carlsbad, CA) 내로 클로닝한 다음, 서열 분석하였다. 이로써 생성된 플라스미드는 pRCD917로 명명되었다. 갈락토키나제를 암호화하는 DNA 단편을, NotI 및 PacI를 이용하여 상기 플라스미드로부터 방출시키고, DNA 단편을 NotI 부위와 PacI 부위 사이의 피. 파스토리스 HHT1 강력한 구성적 프로모터의 하류에서 플라스미드 pGLY894 내로 서브클로닝하여 플라스미드 pGLY939를 창출시켰다. 갈락토키나제는 서열 40에 제시된 아미노산 서열을 갖고 있고, 서열 39에 제시된 뉴클레오티드 서열에 의해 암호화된다.

에스. 세레비지아에 GAL2의 클로닝. 갈락토스 퍼미아제를 암호화하는 에스. 세레비지아에 유전자 (유전자은행 NP_013182) (ScGAL2로서 지칭됨)는 PCR 프라이머 PB156

및 PB157

을 이용하여 에스. 세레비지아에 게놈 DNA (균주 W3O3, 표준 "스매쉬 앤 그랩" 게놈 DNA 제제)로부터 PCR 증폭시켰고, 이와 같이 PCR 증폭시킨 DNA 단편을 pCR2.1 (공급처: Invitrogen, Carlsbad, CA) 내로 서브클로닝한 다음, 서열 분석하였다. 이로써 생성된 플라스미드는 pPB290으로 명명되었다. 갈락토스 퍼미아제를 암호화하는 DNA 단편을, NotI 및 PacI를 이용하여 상기 플라스미드로부터 방출시키고, DNA 단편을 NotI 부위와 PacI 부위 사이의 PpPMA1 프로모터의 하류에서 플라스미드 pJIN664 내로 서브클로닝하여 플라스미드 pPB292를 창출시켰다. 갈락토스 퍼미아제는 서열 44에 제시된 아미노산 서열을 갖고 있고, 서열 43에 제시된 뉴클레오티드 서열에 의해 암호화된다.

에스. 세레비지아에 GAL7의 클로닝. 갈락토스-1-포스페이트 우리딜 트랜스퍼라제를 암호화하는 에스. 세레비지아에 유전자 (유전자은행 NP_009574) (ScGAL7로서 지칭됨)는 PCR 프라이머 PB160

및 PB161

을 이용하여 에스. 세레비지아에 게놈 DNA (균주 W3O3, 표준 스매쉬 앤 그랩 게놈 DNA 제제)로부터 PCR 증폭시켰고, 이와 같이 PCR 증폭시킨 DNA 단편을 pCR2.1 (공급처: Invitrogen, Carlsbad, CA) 내로 클로닝한 다음, 서열 분석하였다. 이로써 생성된 플라스미드는 pRCD918로 명명되었다. 갈락토스-1-포스페이트 우리딜 트랜스퍼라제를 암호화하는 DNA 단편을, NotI 및 PacI를 이용하여 상기 플라스미드로부터 방출시키고, DNA 단편을 NotI/PacI 하의 PpPMA1 강력한 구성적 프로모터의 하류에서 플라스미드 pGLY143 내로 서브클로닝하여 플라스미드 pGLY940을 창출시켰다. 별개로, NotI 및 PacI 부위를 또한 사용하여, 상기 ORF를 NotI/PacI 하의 피. 파스토리스 TEF1 강력한 구성적 프로모터의 하류에서 플라스미드 pRCD830 내로 서브클로닝하여 플라스미드 pRCD929를 창출시켰다. 갈락토스-1-포스페이트 우리딜 트랜스퍼라제는 서열 42에 제시된 아미노산 서열을 갖고 있고, 서열 41에 제시된 뉴클레오티드 서열에 의해 암호화된다.

삼중 ScGAL1/ScGAL7/ScGAL2 구축물의 구축. pGLY917로부터의 ScGAL1 개방 판독 프레임을, 피. 파스토리스 ARG1 선별성 마커 (his1::ARG1, 미국 특허 제7,479,389호 참조)를 수반하고 또한 P _GAPDH -프로모터 카세트를 함유하는 피. 파스토리스 his1 녹아웃 벡터인 pJN702 내로 서브클로닝하였고, P _GAPDH -ScGAL1 융합물을 함유하는 상기 신규 벡터는 pRCD928로 명명하였다. pGLY929로부터의 P _TEF1 - ScGAL7 카세트를 pGLY928 내로 서브클로닝하였고, 이러한 신규 벡터를 pGLY946a로 명명하였다. 이어서, pRCD634로부터의 P _OCH1 -DmUGT (골지 UDP-갈락토스 수송인자) 카세트를 pGLY946a 내로 서브클로닝하여 pGLY956b를 창출시켰다. 최종적으로, pPB292로부터의 P _GAPDH -ScGAL2 카세트를 pRCD956b 내로 서브클로닝하여 플라스미드 pRCD977b를 생성하였다 (도 6 참조). 플라스미드 pRCD977b는 ARG1 우성 선별성 마커 카세트와 함께, DmUGT, ScGAL1, ScGAL7 및 ScGAL2 발현 카세트를 함유한다.

이중 ScGAL1/ScGAL7 구축물의 구축. pGLY939로부터의 P _TEF1 -ScGAL1 카세트를 피. 파스토리스 ARG1 선별성 마커, TRP1 유전자 자리 녹인 영역, 및 P _GAPDH -hGalTIβ43 카세트를 함유하는 녹인 벡터인 pGLY941 내로 서브클로닝하였고, 이러한 신규 벡터를 pGLY952로 명명하였다. pGLY940으로부터의 P _PMA1 -ScGAL7 카세트를 pGLY952 내로 서브클로닝하였고, 이러한 신규 벡터를 pGLY955로 명명하였다. 최종적으로, 노우르세오트리신 (Nourseothricin) 내성 카세트 (NAT^R)를 pGLY597 (공급처 (EROSCARF, Scientific Research and Development GmbH, Daimlerstrasse 13a, D- 61352 Bad Homburg, Germany)로부터의 pAG25로부터 유래됨; 문헌 [Goldstein et al., 1999, Yeast 15: 1541] 참조)로부터 pGLY952 내로 서브클로닝하여 플라스미드 pGLY1418 (도 12 참조)을 생성하였는데, 이는 NAT^R 우성 선별성 마커 카세트와 함께, hGalTIβ, ScGAL1, 및 ScGAL7 발현 카세트를 함유하고 있다.

3가지 유전자 모두를 정착시킨 단일 통합 플라스미드 pRCD977b (도 6)를 피. 파스토리스 균주 RDP578-1 내로 형질전환시켜 균주 RDP635-1, -2, 및 -3을 생성하였다. 균주 RDP578-1은 말단 β-1,4-갈락토스 잔기를 함유하는 인간 N-글리칸을 생성하기 위한 유전자 녹아웃물 및 이종 유전자를 이미 함유하였다 (구축에 관해서는 실시예 3 및 도 5 참조). 균주 RDP578-1은 또한, 사카로미세스 세레비지아에 UDP-갈락토스 4-에피머라제 암호화 유전자 ScGAL1O를 암호화하는 발현 카세트를 포함하고, 시험 단백질 인간 크링글 3을 발현한다. 이로써 생성되는 균주 RDP635-1, -2, 및 -3은 DmUGT 갈락토스 수송인자의 2개 카피를 갖고 있다.

모 균주 RDP578-1, 및 ScGAL1 , ScGAL2, ScGAL7, 및 ScGAL1O 유전자를 수반한 형질전환체 (RDP635-1, -2, 및 -3)를, 글루코스, 갈락토스를 함유하거나 탄소원을 함유하지 않는 최소 배지 상에서 5일 동안 성장시킨 다음, 사진을 찍었다. 흥미롭게도, 갈락토스-말단화 N-글리칸을 수반한 단백질을 분비할 수 있는 능력이 있음에도 불구하고, RDP578-1은 야생형 피. 파스토리스에 대해 예상되는 바와 같이 정상적으로 글루코스 상에서 성장하면서도 갈락토스를 동화시킬 수 있는 능력을 나타내지 못하였다. 그러나, ScGAL1, ScGAL2, 및 ScGAL7 유전자를 발현하는 형질전환체는 도 7에 도시된 바와 같이 갈락토스를 동화할 수 있었다. 예상된 바와 같이, 탄소원이 결여된 판 상에서는 최소 성장이 관찰되었다. 이들 결과는 를루아르 갈락토스 동화 경로의 기본 구조적 (조절성이 아님) 요소로 재구성시킨 경우에 탄소원으로서 갈락토스를 동화시킬 수 있는 재조합 피. 파스토리스가 구축될 수 있다는 사실을 나타낸다.

글리코-공학처리시킨 피. 파스토리스에서 발현된 Fc의 Asn 잔기 297에서의 N-글리칸의 결정. 인간 IgG의 Fc 부분은, 전형적으로 기타 분비된 인간 단백질과는 별개의 N-글리칸 프로파일을 함유하는 중쇄 이량체 (Asn₂₉₇, 카바트 (Kabat) 넘버링) 당 단일 N-글리칸 부위를 함유한다. 일반적으로, 천연 발생적 인간 항체는 말단 GlcNAc를 수반한 N-글리칸 및 각종 인자를 기준으로 하여 상이할 수 있는 양의 말단 갈락토스를 함유하고, 또한, 상당 량의 말단 시알산은 거의 함유하지 않는다. N-글리칸에 대한 고 수준의 말단 β-1,4-갈락토스를 입증한 후, 본 발명자들은 이러한 글리-공학처리시킨 효모 균주에서 생성된 항체 상에서 관찰되는 N-글리칸의 프로파일을 결정하고자 하였다. 따라서, 말단 갈락토스를 수반한 N-글리칸을 생성하기 위해 유전적으로 공학처리시킨 피. 파스토리스 균주 (YGB02; 도 8 및 실시예 4 참조)를, AOX1 프로모터의 제어 하에 인간 면역글로불린 G1 (IgG1) 중쇄의 Fc 도메인 또는 C-말단 절반을 암호화하는 플라스미드 (pBK138)로 형질전환시켰다. PCR에 의해 확인된 것으로 선별된 양성 클론은 PBP317-36으로 명명되었다 (도 8 및 실시예 4). 이 균주를 진탕 플라스크에서 성장시키고, 단독 탄소원으로서 메탄올로 유도시켰다. 상등액을 원심분리에 의해 수거하고, 단백질 A 친화 크로마토그래피에 의해 정제시켰다. 정제된 단백질을 SDS-PAGE 상에서 분리시키고, 쿠마시 (coomassie) 염색하였다. 예상된 크기의 표지된 밴드가 관찰되었다. 이어서, 정제된 단백질을 대상으로 하여 PNGase 분해시키고, 방출된 N-글리칸을 MALDI-TOF MS에 의해 분석하였다. 이로써 생성되는 N-글리칸 (도 10a)은 말단 GlcNAc를 수반한 복합 인간 코어 구조 (G0: GlcNAc₂Man₃GlcNAc₂)를 우세적으로 갖고, 단일 말단 갈락토스를 수반한 종 (G1: GalGlcNAc₂Man₃GlcNAc₂)를 보다 적은 양으로 포함하며, 복합 종의 양 지류를 갈락토스로 캡핑한 종 (G2: Gal₂GlcNAc₂Man₃GlcNAc₂)을 소수 포함하는 것으로 밝혀졌다. 이들 종의 질량은 단일 푸코스 잔기의 결여로 인해 당해 분야의 문헌에 보고된 표준 값과는 예측 가능한 수준으로 상이하였다. 글리코-공학처리시킨 효모 균주는 내인성 푸코실트랜스퍼라제를 함유하지 않으므로, 푸코스를 코어 인간 N-글리칸 구조에 부가할 수 있는 고유의 능력이 결여되어 있다. Man₅GlcNAc₂와 일치하는 또 다른 소수 종이 또한 관찰되었다.

이어서, 말단 갈락토스를 수반한 인간-유사 N-글리칸을 어셈블리시키기 위해서 글리코실화 활성을 발현하였고, 또한 SpGALE (UDP-갈락토스 4-에피머라제)를 발현한 상기 균주 PBP317-36을 유전적으로 공학처리시켜 탄소원으로서 외인성 갈락토스를 사용할 수 있게 하였고, 대사 공학처리시킨 방식으로 N-글리코실화를 제어할 수 있게 하였다. 구성적 프로모터의 제어 하에 ScGAL1 및 ScGAL7 둘 다를 발현하는 통합 플라스미드 pGLY954를 구축하였고 (도 9), 이를 이. 파스토리스 균주 PBP317-36 내로 형질전환시켰다. 플라스미드 pGLY954는 균주 PBP317-36 (SpGALE UDP-갈락토스 에피머라제를 이미 함유하고 있었다; 도 8 참조)에 단독 탄소원으로서 갈락토스 상에서 성장할 수 있는 능력을 부여하였다. 이러한 gal+ 균주는 RDP783으로 명명되었다. 상기 세포는 본 발명자들이 심지어 갈락토스 퍼미아제를 도입하지 않았음에도 불구하고 탄소원으로서 갈락토스를 사용할 수 있었기 때문에, 본 발명자들은 피. 파스토리스에 대해 내인성인 일반적 헥소스 수송인자가 세포막을 가로질러 갈락토스를 충분히 수송할 수 있다고 결론지었다.

피. 파스토리스 균주 PBP317-36 및 RDP783 둘 다는 메탄올-유도성 AOX1 프로모터의 제어 하에 분비된 리포터 단백질로서 인간 Fc 도메인을 암호화하는 통합된 플라스미드 구축물을 정착시킨다. 균주 PBP317-36 및 RDP783을 글리세롤 함유 표준 배지에서 진탕 플라스크 내에서 성장시키고, 단독 탄소원으로서 메탄올의 존재 하에 유도시키거나 또는 상이한 농도로 글루코스 또는 갈락토스와 조합된 메탄올로 유도시켰다. 수거된 상등액 단백질을 단백질 A에 의해 친화 정제하고, PNGase 분해시킨 다음, MALDI-TOF MS에 의해 분석하였다. 균주 RDP783으로부터의 인간 Fc로부터 방출된 N-글리칸은 메탄올 유도 단독시 또는 글루코스 또는 만노스의 존재 하에 PBP317-36을 이용하여 관찰된 프로파일과 유사한 N-글리칸을 산출시켰는데, 우세한 글리코형태는 GO (GlcNAc₂Man₃GlcNAc₂)였다 (도 10). 그러나, 외인성 갈락토스 공급시, 균주 RDP783 (모 균주 PBP317-36은 아니다)은 인간 Fc 상에서 갈락토스-함유 N-글리칸을 용량-의존적으로 증가시켰는데, 우세한 글리코형태가 지금 G1 (GalGlcNAc₂Man₃GlcNAc₂)로 이동하였고, 이와 동시에 완전한 β-1,4-갈락토스 캡핑된 글리코형태 G2 (Gal₂GlcNAc₂Man₃GlcNAc₂)가 증가하였다 (도 10).

최종적으로, 인간 Fc를 이용하여 관찰된 외인성 갈락토스를 사용하여 글리코실화를 제어할 수 있는 능력이 완전한 길이의 모노클로날 항체에 적용될 수 있었다는 것을 입증하기 위하여, 항-Her2 모노클로날 항체를 발현하는 글리코-공학처리시킨 효모 균주 YDX477 (도 11, 실시예 5)을 생성시켰다. 이러한 균주를 또한 공학처리하여, 분비된 당단백질 상의 형태 G2 (Gal₂GlcNAc₂Man₃GlcNAc₂)의 인간 N-글리칸을 전이시켰다. mAb-A의 발현 후에 N-글리칸을 방출시키면, G0 (GlcNAc₂Man₃GlcNAc₂)에 따르는 우세한 피크, G1 (GalGlcNAc₂Man₃GlcNAc₂)에 따르는 덜 우세한 피크 뿐만 아니라 G2 (Gal₂GlcNAc₂Man₃GlcNAc₂) 및 M5 (Man₅GlcNAc₂)의 소수 피크로 이루어진 N-글리칸 패턴 (도 13a)이 나타났다. 이러한 데이터는 인간 IgG1의 절단된 Fc 부분에 대해 관찰되었고 예상된 바와 유사한데, 이들 둘 다가 동일한 잔기 (Asn-297)에서 N-글리코실화되었기 때문이다. ScGAL1 및 ScGAL7을 정착시킨 통합 플라스미드 pGLY1418을 구축하고 (도 12), 이를 피. 파스토리스 균주 YDX477 내로 형질전환시켜 균주 RDP968-1을 수득하였다. 이 플라스미드는 균주 YDX477 (SpGALE UDP-갈락토스 에피머라제를 이미 함유하고 있다; 도 11 참조)에 단독 탄소원으로서 갈락토스 상에서 성장할 수 있는 능력을 부여하였다.

균주 YDX477 및 RDP968-1을 글리세롤 함유 표준 배지에서 진탕 플라스크 내에서 성장시키고, 단독 탄소원으로서 메탄올의 존재 하에 유도시키거나 또는 상이한 농도로 갈락토스와 조합된 메탄올로 유도시켰다. 수거된 상등액 단백질을 단백질 A에 의해 친화 정제하고, PNGase 분해시킨 다음, MALDI-TOF MS에 의해 분석하였다. 양 균주는 메탄올 유도 단독시 또는 글루코스 또는 만노스의 존재 하에 PBP317-36을 이용하여 기존에 관찰된 프로파일과 유사한 N-글리칸을 산출시켰는데, 우세한 글리코형태는 GO (GlcNAc₂Man₃GlcNAc₂)였다 (도 10a 대 도 13a 및 13d). 그러나, 외인성 갈락토스 공급시, 균주 RDP968-1 (모 균주 YDX477은 아니다)은 항체 상에서 갈락토스-함유 N-글리칸을 용량-의존적으로 증가시켰는데, 우세한 글리코형태가 지금 G1 (GalGlcNAc₂Man₃GlcNAc₂)로 이동하였고, 이와 동시에 완전한 β-1,4-갈락토스 캡핑된 글리코형태 G2 (Gal₂GlcNAc₂Man₃GlcNAc₂)가 증가하였다 (도 13e 및 f).

실시예 3

균주 RDP578-1의 구축이 도 5에 도시되어 있고, 이는 다음 단계를 포함하였다. 균주 JC308이 출발 균주였다. 이 균주는 문헌 [Choi et al., Proc. Natl. Acad. Sci. USA 100: 5022-5027 (2003)]에 기재되었지만, 간략하게 언급하면 상기 균주는 ura3 , ade1 , arg4, his4이다. 이러한 균주는 플라스미드 pJN329를 이용하고 문헌 [Choi et al. (상기 참조)] 및 미국 특허 제7,449,308호에 기재된 과정에 따라서 OCH1 유전자를 붕괴시킴으로써 알파-1,6-만노실트랜스퍼라제 활성이 결여되도록 만들어 균주 YJN153을 생성시켰다. 플라스미드 pJN329는 PpURA3 우성 선별 마커를 수반하는데, ura-활성에 대해 역선별한 후에, 생성되는 균주 YJN156은 미국 특허 제7,259,007호에 기재된 과정에 따라서 플라스미드 벡터 pJN5O3b 및 pAS19를 이용하여 PNO1, MNN4A, 및 MNN4B 유전자를 붕괴시킴으로써 포스포만노실트랜스퍼라제 활성이 결여되도록 만들어 균주 YAS180-2를 생성시켰다. 본원의 융합 단백질을 포함하는 분비성 경로 표적화 리더 펩티드는 이것이 ER, 골지 또는 트랜스 골지 네트워크에 융합되는 촉매적 도메인을 국재시킨다.

ura-활성에 대해 역선별한 후에, 생성되는 균주 YAS187-2는 플라스미드 pAS24 (도 14 참조)를 이용하여 미국 특허 제7,465,577호에 일반적으로 기재된 바와 같이 베타-만노실트랜스퍼라제 활성이 결여되도록 만들어 균주 YAS218-2를 생성시켰다. 플라스미드 pAS24는 PpURA3 선별성 마커를 함유하고, PpOCH1 프로모터의 하류에서 완전한 길이의 마우스 골지 UDP-GlcNAc 수송인자 (MmSLC35A3)를 암호화하는 발현 카세트를 함유하는 피. 파스토리스 BMT2 녹아웃 플라스미드이다. MmSLC35A3은 서열 34에 제시된 아미노산 서열을 갖고, 서열 33에 제시된 뉴클레오티드 서열에 의해 암호화된다. bmt2p에 기인된 베타-만노실트랜스퍼라제 활성을 제거하기 위한 5' 및 3' BMT2 플랭킹 서열은 미국 특허 제7,465,577호에 제시된 바와 같이 수득할 수 있다. ura-활성에 대해 균주 YAS218-2를 역선별한 후, 이로써 생성되는 균주 YAS269-2는 ura-이고, BMT2 유전자 내로 삽입된 마우스 골지 UDP-GlcNAc 수송인자를 갖고 있다.

이어서, 균주 YAS269-2를, 키메라 마우스 알파-1,2-만노실트랜스퍼라제 I (FB8 MannI), 키메라 인간 GlcNAc 트랜스퍼라제 I (CONA1O), 및 마우스 골지 UDP-GlcNAc 수송인자 (MmSLC35A3)를 암호화하는 완전한 길이의 유전자를 암호화하는 발현 카세트를 포함하고 ADE1 유전자 자리 (PCT/US2008/13719 참조)를 표적으로 하는 플라스미드 pRCD742b (도 15 참조)로 형질전환시켰다. 플라스미드 pRCD742b는 WO2007/136865 및 WO2007136752에 기재된 녹인 녹아웃 (KINKO) 플라스미드이다. 이 플라스미드는 Ade1p를 암호화하는 개방 판독 프레임을 결실시키지 않으면서 피. 파스토리스 ADE1 유전자 내로 통합된다. 이 플라스미드는 또한, PpURA5 선별성 마커를 함유한다. 분비성 경로 표적화 융합 단백질 (FB8 MannI)을 암호화하는 발현 카세트는 PpGAPDH 프로모터의 제어 하에 마우스 알파-1,2-만노실트랜스퍼라제 I 촉매적 도메인 (FB MannI: 서열 54)의 N-말단과 융합된 ScSec12 리더 펩티드 (ScSec12 (8)의 첫 번째 103개 아미노산: 서열 32)를 포함한다. 분비성 경로 표적화 융합 단백질 CONA10을 암호화하는 발현 카세트는 PpPMA1 프로모터의 제어 하에 인간 GlcNAc 트랜스퍼라제 I (GnT I) 촉매적 도메인 (서열 52)의 N-말단과 융합된 PpSec12 리더 펩티드 (PpSec1 2 (10)의 첫 번째 29개 아미노산: 서열 28)을 포함한다. 이 플라스미드는 PpSEC4 프로모터의 제어 하에 완전한 길이의 마우스 골지 UDP-GlcNAc 수송인자 (MmSLC35A3)를 암호화하는 발현 카세트를 추가로 포함하였다. 플라스미드 pRCD742b를 균주 YAS269-2 내로 형질감염시키면 균주 RDP307이 생성되었다. 이러한 균주는 GlcNAcMan₅GlcNAc₂ N-글리칸을 갖는 당단백질을 만들 수 있다. 서열 53 및 51은 마우스 알파-1,2-만노실트랜스퍼라제 I 및 인간 GlcNAc 트랜스퍼라제 I (GnT I) 촉매적 도메인을 각각 암호화하는 뉴클레오티드 서열이다. 인간 GnT I을 암호화하는 뉴클레오티드 서열은 피키아 파스토리스에서의 발현을 위해 코돈-최적화시켰다. 서열 27 및 31은 PpSEC12 (10) 및 ScSEC12 (8)을 각각 암호화하는 뉴클레오티드 서열이다.

균주 RDP361은 균주 RDP307을 플라스미드 pDMG47로 형질전환시켜 균주 RDP361을 생성함으로써 구축하였다. 플라스미드 pDMG47 (도 16 참고)은 Trp1p를 암호화하는 개방 판독 프레임을 결실시키지 않으면서 피. 파스토리스 TRP1 유전자 자리 내로 통합되는 KINKO 플라스미드이다. 이러한 플라스미드는 또한, PpURA3 선별 마커를 함유하고, PpGAPDH 프로모터의 제어 하에 드로소필라 멜라노가스터 만노시다제 II (KD: 서열 63)의 촉매적 도메인의 N-말단과 융합된 ScMnn2 리더 표적화 펩티드 (ScMnn2 (53)의 첫 번째 36개 아미노산: 서열 19)를 포함하는 분비성 경로 표적화 융합 단백질 (KD53)을 암호화하는 발현 카세트를 포함한다. 상기 플라스미드는 또한, PpPMA1 프로모터의 제어 하에 래트 GlcNAc 트랜스퍼라제 II (TC: 서열 58)의 촉매적 도메인의 N-말단과 융합된 ScMnn2 리더 표적화 펩티드 (ScMnn2 (54)의 첫 번째 97개 아미노산: 서열 22)를 포함하는 분비성 경로 표적화 융합 단백질 (TC54)을 암호화하는 발현 카세트를 함유한다. ScMnn2 리더 53 및 54의 핵산 서열이 서열 19 및 21에 각각 제시되어 있다. 드로소필라 멜라노가스터 만노시다제 II 및 래트 GlcNAc 트랜스퍼라제 II (GnT II)의 촉매적 도메인을 암호화하는 핵산 서열은 서열 62 및 57에 각각 제시되어 있다.

상기 균주 RDP361을 플라스미드 pRCD823b로 형질전환시켜 균주 RDP415-1을 생성하였다. 플라스미드 pRCD823b (도 17 참조)는 His4p를 암호화하는 개방 판독 프레임을 결실시키지 않으면서 피. 파스토리스 HIS4 유전자 자리 (미국 특허 제7,479,389호 참조) 내로 통합되고, PpURA5 선별성 마커 (미국 공개 특허공보 제20040229306호 참조)를 함유할 뿐만 아니라 PpGAPDH 프로모터의 제어 하에 상기와 같은 ScMnn2 (54)의 첫 번째 97개 아미노산과 그의 N-말단에서 융합된 래트 GlcNAc 트랜스퍼라제 II 촉매적 도메인 (TA: 서열 61)을 포함하는 분비성 경로 표적화 융합 단백질 (TA54)을 암호화하는 발현 카세트를 함유한다. 상기 플라스미드는 또한, PpOCH1 프로모터의 제어 하에 완전한 길이의 디. 멜라노가스터 골지 UDP-갈락토스 수송인자 (DmUGT) 및 PpPMA1 프로모터의 제어 하에 완전한 길이의 에스. 세레비지아에 UDP-갈락토스 4-에피머라제 (ScGAL1O)를 암호화하는 발현 카세트를 함유한다. ScGAL1O은 서열 46에 제시된 아미노산 서열을 갖고, 이는 서열 45에 제시된 뉴클레오티드 서열에 의해 암호화된다. 래트 GlcNAc 트랜스퍼라제 II (TA)의 뉴클레오티드 서열이 서열 60에 제시되었다.

상기 균주 RDP415-1을 플라스미드 pRCD893a로 형질전환시켜 균주 RDP523-1을 생성하였다. 플라스미드 pGLY893a (도 18 참조)는 PpARG4 선별성 마커를 함유하는 피. 파스토리스 his1 녹아웃 플라스미드이다 (미국 특허 제7,479,389호 참조). 이 플라스미드는 PpPMA1 프로모터의 제어 하에 드로소필라 멜라노가스터 만노시다제 II (KD: 서열 63)의 촉매적 도메인의 N-말단과 융합된 PpSEC12 리더 표적화 펩티드 (PpSEC12 (10)의 첫 번째 29개 아미노산: 서열 28)를 포함하는 분비성 경로 표적화 융합 단백질 (KD10)을 암호화하는 발현 카세트를 포함한다. 상기 플라스미드는 또한, PpTEF1 프로모터의 제어 하에 래트 GlcNAc 트랜스퍼라제 II (TA: 서열 61)의 촉매적 도메인의 N-말단과 융합된 ScMntIp (ScKre2p) 리더 표적화 펩티드 (ScMntIp (ScKre2p) (33)의 첫 번째 53개 아미노산: 서열 30)를 포함하는 분비성 경로 표적화 융합 단백질 (TA33)을 암호화하는 발현 카세트를 함유한다. 상기 플라스미드는 또한, 인간 갈락토실 트랜스퍼라제 I (hGalTIβ43; 서열 50)의 촉매적 도메인의 N-말단과 융합된 ScMnn2p 리더 서열 펩티드 (53)의 첫 번째 36개 아미노산을 포함하는 분비성 경로 표적화 융합 단백질 (XB53)을 암호화하는 발현 카세트를 함유한다. PpSEC12 및 ScMNTI ( ScKRE2) 리더의 핵산 서열이 서열 27 및 29에 각각 제시되어 있다. 드로소필라 멜라노가스터 만노시다제 II, 래트 GlcNAc 트랜스퍼라제 II (GnT II) 및 인간 GalTI의 촉매적 도메인을 암호화하는 핵산 서열이 서열 62, 60, 및 49에 각각 제시되어 있다. 이러한 균주는 말단 갈락토스 잔기를 갖는 N-글리칸을 갖는 당단백질을 만들 수 있다. 상기 균주는 드로소필라 멜라노가스터 만노시다제 II 촉매적 도에밍의 2개 카피 및 래트 GnT II 촉매적 도메인의 3개 카피를 암호화한다.

최종적으로, 상기 균주 RDP523-1을 플라스미드 pBK64로 형질전환시켜 균주 RDP578-1을 생성하였다. 플라스미드 pBK64는 인간 크링글3 시험 단백질을 암호화하고 문헌 [Choi et al., Proc. Natl. Acad. Sci. USA 100: 5022-5027 (2003)]에 기재되었다.

실시예 4

균주 PBP317-36의 구축이 도 8에 도시되어 있다. 출발 균주는 YGLY16-3이었다. 이는 OCH1 , PNO1 , MNN4A , MNN4B, 및 BMT2 유전자를 결실시킨 ura- 균주이고, 실시예 3에서 사용된 공정에 따라서 만들 수 있다. 균주 YGLY16-3은 또한, WO2007136752에 기재되었다.

균주 YGLY16-3을 플라스미드 pRCD742a (도 19 참조)로 형질전환시켜 균주 RDP616-2를 만들었다. 플라스미드 pRCD742a (도 19 참조)는 Ade1p를 암호화하는 개방 판독 프레임을 결실시키지 않으면서 피. 파스토리스 ADE1 유전자 내로 통합되는 KINKO 플라스미드이다. 이 플라스미드는 또한, PpURA5 선별성 마커를 함유하고, 키메라 마우스 알파-1,2-만노실트랜스퍼라제 (FB8 MannI), 키메라 인간 GlcNAc 트랜스퍼라제 I (CONA1O), 및 완전한 길이의 마우스 골지 UDP-GlcNAc 수송인자 (MmSLC35A3)를 암호화하는 발현 카세트를 포함한다. 이 플라스미드는 키메라 인간 GlcNAc 트랜스퍼라제 I을 암호화하는 발현 카세트의 배향이 반대 배향인 것을 제외하고는 플라스미드 pRCD742b와 동일하다. 플라스미드 pRCD742a를 균주 YGLY16-3 내로 형질감염시키면 균주 RDP616-2가 생성되었다. 이러한 균주는 GlcNAcMan₅GlcNAc₂ N-글리칸을 갖는 당단백질을 만들 수 있다.

ura- 균주 RDP641-3을 생성하기 위해 균주 RDP616-2를 역선별한 후, 플라스미드 pRCD1006을 상기 균주 내로 형질전환시켜 균주 RDP666을 만들었다. 플라스미드 pRCD1006 (도 20 참조)은 선별성 마커로서 PpURA5 유전자를 함유하는 피. 파스토리스 his1 녹아웃 플라스미드이다. 이 플라스미드는 PpGAPDH 프로모터의 제어 하에 인간 갈락토실 트랜스퍼라제 I 촉매적 도메인 (hGalTI β43)의 N-말단과 융합된 ScMnt1p (ScKre2p) (33)의 첫 번째 58개 아미노산을 포함하는 분비성 경로 표적화 융합 단백질 (XB33)을 암호화하는 발현 카세트; PpOCH1 프로모터의 제어 하에 완전한 길이의 디. 멜라노가스터 골지 UDP-갈락토스 수송인자 (DmUGT)를 암호화하는 발현 카세트; 및 PpPMA1 프로모터의 제어 하에 에스. 폼베 UDP-갈락토스 4-에피머라제 (ScGALE)를 암호화하는 발현 카세트를 함유한다.

균주 RDP666을 플라스미드 pGLY167b로 형질전환시켜 균주 RDP696-2를 만들었다. 플라스미드 pGLY167b (도 21 참조)는 PpURA3 선별성 마커를 함유하는 피. 파스토리스 arg1 녹아웃 플라스미드이다. 이 플라스미드는 PpGAPDH 프로모터의 제어 하에 드로소필라 멜라노가스터 만노시다제 II 촉매적 도메인 (KD)의 N-말단과 융합된 ScMnn2p (53)의 첫 번째 36개 아미노산을 포함하는 분비성 경로 표적화 융합 단백질 (CO-KD53)을 암호화하는 발현 카세트; 및 PpPMA1 프로모터의 제어 하에 래트 GlcNAc 트랜스퍼라제 II 촉매적 도메인 (TC)의 N-말단과 융합된 ScMnn2p (54)의 첫 번째 97개 아미노산을 포함하는 분비성 경로 표적화 융합 단백질 (CO-TC54)을 암호화하는 발현 카세트를 함유한다. 이로써 생성되는 균주 RDP696-2를 대상으로 하여 화학물질 환경 조절 장치 (chemostat) 선별을 수행하였다 (화학물질 환경 조절 장치 선별의 고찰에 관해서는 문헌 [Dykhuizen and Hartl. Microbiol. Revs. 47: 150-168 (1983)]을 참조할 수 있다). 화학물질 환경 조절 장치 선별로 인해 균주 YGB02가 생성되었다. 균주 YGB02는 말단 갈락토스 잔기를 갖는 N-글리칸을 갖는 당단백질을 만들 수 있다. 이러한 균주에서는 만노시다제 II 촉매적 도메인 (KD) 및 GnT II (TC)가 피키아 파스토리스에서의 발현을 위해 코돈-최적화시킨 핵산 분자에 의해 암호화되었다 (각각 서열 64 및 59).

균주 YGB02를 플라스미드 pBK138로 형질감염시켜 균주 PBP317-36을 생성하였다. 플라스미드 pBK138 (도 22 참조)은 피. 파스토리스 AOX1 프로모터를 복제하면서 이러한 프로모터 내로 통합되는 롤인 플라스미드이다. 이 플라스미드는 인간 Fc 항체 단편 (인간 IgG1 중쇄의 C-말단 233-aa; 서열 66)의 N-말단과 융합된 에스. 세레비지아에 알파 교배 인자 프리-신호 서열 (서열 24)을 포함하는 융합 단백질을 암호화하는 발현 카세트를 함유한다. 에스. 세레비지아에 알파 교배 인자 프리-신호 서열을 암호화하는 핵산 서열이 서열 23에 제시되어 있고, 인간 IgG1 중쇄의 C-말단 233-aa를 암호화하는 핵산 서열은 서열 65에 제시되어 있다.

실시예 5

균주 YDX477의 구축이 도 11에 도시되어 있다. 출발 균주는 YGLY16-3이었다. 균주 YGLY16-3을 플라스미드 pRCD742a (도 19 참조)로 형질전환시켜 균주 RDP616-2를 만들었다. 플라스미드 pRCD742a (도 19 참조)는 ade1p를 암호화하는 개방 판독 프레임을 결실시키지 않으면서 피. 파스토리스 ADE1 유전자 내로 통합되는 KINKO 플라스미드이다. 이 플라스미드는 또한, PpURA5 선별성 마커를 함유하고, 키메라 마우스 알파-1,2-만노실트랜스퍼라제 (FB8 MannI), 키메라 인간 GlcNAc 트랜스퍼라제 I (CONA1O), 및 완전한 길이의 마우스 골지 UDP-GlcNAc 수송인자 (MmSLC35A3)를 암호화하는 발현 카세트를 포함한다. 이 플라스미드는 키메라 인간 GlcNAc 트랜스퍼라제 I을 암호화하는 발현 카세트의 배향이 반대 배향인 것을 제외하고는 플라스미드 pRCD742b와 동일하다. 플라스미드 pRCD742a를 균주 YGLY16-3 내로 형질감염시키면 균주 RDP616-2가 생성되었다. 이러한 균주는 GlcNAcMan₅GlcNAc₂ N-글리칸을 갖는 당단백질을 만들 수 있다.

ura- 균주 RDP641-4를 생성하기 위해 균주 RDP616-2를 역선별한 후, 플라스미드 pRCD1006을 상기 균주 내로 형질전환시켜 균주 RDP667-1을 만들었다. 플라스미드 pRCD1006 (도 20 참조)은 선별성 마커로서 PpURA5 유전자를 함유하는 피. 파스토리스 his1 녹아웃 플라스미드이다. 이 플라스미드는 PpGAPDH 프로모터의 제어 하에 인간 갈락토실 트랜스퍼라제 I 촉매적 도메인 (hGalTIβ43)의 N-말단과 융합된 ScMnt1p (ScKre2p) (33)의 첫 번째 58개 아미노산을 포함하는 분비성 경로 표적화 융합 단백질 (XB33)을 암호화하는 발현 카세트; PpOCH1 프로모터의 제어 하에 완전한 길이의 디. 멜라노가스터 골지 UDP-갈락토스 수송인자 (DmUGT)를 암호화하는 발현 카세트; 및 PpPMA1 프로모터의 제어 하에 완전한 길이의 에스. 폼베 UDP-갈락토스 4-에피머라제 (ScGALE)를 암호화하는 발현 카세트를 함유한다.

균주 RDP667-1을 플라스미드 pGLY167b로 형질전환시켜 균주 RDP697-1을 만들었다. 플라스미드 pGLY167b (도 21 참조)는 PpURA3 선별성 마커를 함유하는 피. 파스토리스 arg1 녹아웃 플라스미드이다. 이 플라스미드는 PpGAPDH 프로모터의 제어 하에 드로소필라 멜라노가스터 만노시다제 II 촉매적 도메인 (KD)의 N-말단과 융합된 ScMnn2p (53)의 첫 번째 36개 아미노산을 포함하는 분비성 경로 표적화 융합 단백질 (CO-KD53)을 암호화하는 발현 카세트; 및 PpPMA1 프로모터의 제어 하에 래트 GlcNAc 트랜스퍼라제 II 촉매적 도메인의 N-말단과 융합된 ScMnn2p (54)의 첫 번째 97개 아미노산을 포함하는 분비성 경로 표적화 융합 단백질 (CO-TC54)을 암호화하는 발현 카세트를 함유한다. 만노시다제 II 및 GnT II 촉매적 도메인을 암호화하는 핵산 분자를 피키아 파스토리스에서의 발현을 위해 코돈-최적화시켰다 (각각 서열 64 및 59). 이 균주는 말단 갈락토스 잔기를 갖는 N-글리칸을 갖는 당단백질을 만들 수 있다.

균주 RDP697-1을 플라스미드 pGLY510으로 형질전환시켜 균주 YDX414를 만들었다. 플라스미드 pGLY51O (도 23 참조)은 피. 파스토리스 TRP2 유전자를 복제시키면서 이러한 유전자 자리 내로 통합되고, AOX1 프로모터-ScCYC1 종결인자 발현 카세트 뿐만 아니라 PpARG1 선별성 마커를 함유하는 롤인 플라스미드이다.

균주 YDX414를 플라스미드 pDX459-1 (mAb-A)로 형질전환시켜 균주 YDX458을 만들었다. 플라스미드 pDX459-1 (도 24 참조)은 피. 파스토리스 AOX2 프로모터를 표적으로 하고 이 내로 통합되며, 이러한 프로모터를 복제하면서 ZeoR을 함유하는 롤인 플라스미드이다. 이 플라스미드는 각각 아스페르길루스 니거 알파-아밀라제 신호 서열 (서열 26)과 N-말단에서 융합되고 피. 파스토리스 AOX1 프로모터에 의해 제어되는, 항-HER2 항체 중쇄 및 항-HER2 항체 경쇄 (각각 서열 68 및 70)를 암호화하는 별개의 발현 카세트를 함유한다. 이러한 중쇄 및 경쇄를 암호화하는 핵산 서열이 서열 67 및 69에 각각 제시되어 있고, 아스페르길루스 니거 알파-아밀라제 신호 서열을 암호화하는 핵산 서열은 서열 25에 제시되어 있다.

균주 YDX458을 플라스미드 pGLY1138로 형질전환시켜 균주 YDX477을 만들었다. 플라스미드 pGLY1138 (도 25 참조)은 피. 파스토리스 ADE1 유전자를 복제하면서 이러한 유전자 자리 내로 통합되는 롤인 플라스미드이다. 이 플라스미드는 ScARR3 선별성 마커 유전자 카세트를 함유한다. 에스. 세레비지아에로부터의 ARR3 유전자는 아비산염의 존재 하에 성장되는 세포에 아비산염 내성을 부여해준다 (문헌 [Bobrowicz et al., Yeast, 13:819-828 (1997)]; [Wysocki et al., J. Biol. Chem. 272:30061-30066 (1997)] 참조). 상기 플라스미드는 PpAOX1 프로모터의 제어 하에 트리코데르마 레에세이 (MNS1) 촉매적 도메인 (서열 55의 뉴클레오티드 서열에 의해 암호화된 서열 56)의 N-말단과 융합된 에스. 세레비지아에 알파 인자 프리-신호 서열 (서열 24)을 포함하는 분비된 융합 단백질을 암호화하는 발현 카세트를 함유한다. 이러한 융합 단백질은 배양 배지 내로 분비된다.

본 발명이 예시된 실시양태를 기준으로 하여 본원에 기재되었지만, 본 발명이 이에 제한되지 않는다는 것을 인지해야 한다. 당업자 및 본원의 교시에 접근한 자는 본 발명의 범위 내에 있는 부가의 변형 및 실시양태를 인식할 것이다. 따라서, 본 발명은 본원에 첨부된 특허청구범위에 의해서만 제한된다.

SEQUENCE LISTING <110> DAVIDSON, Robert C. BOBROWICZ, Piotr <120> METABOLIC ENGINEERING OF A GALACTOSE ASSIMILATION PATHWAY IN THE GLYCOENGINEERED YEAST PICHIA PASTORIS <130> GFI-MIS-00006 <150> 61/208,582 <151> 2009-02-25 <160> 70 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> PCR primer RCD192 <400> 1 gccgcgacct gagccgcctg ccccaac 27 <210> 2 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> PCR primer RCD186 <400> 2 ctagctcggt gtcccgatgt ccactgt 27 <210> 3 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> PCR primer RCD198 <400> 3 cttaggcgcg ccggccgcga cctgagccgc ctgccc 36 <210> 4 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> PCR primer RCD201 <400> 4 ggggcatatc tgccgcccat c 21 <210> 5 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> PCR primer RCD200 <400> 5 gatgggcggc agatatgccc c 21 <210> 6 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> PCR primer RCD199 <400> 6 cttcttaatt aactagctcg gtgtcccgat gtccac 36 <210> 7 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> PCR primer DmUGT-5' <400> 7 ggctcgagcg gccgccacca tgaatagcat acacatgaac gccaatacg 49 <210> 8 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> PCR primer DmUGT-3' <400> 8 ccctcgagtt aattaactag acgcgcggca gcagcttctc ctcatcg 47 <210> 9 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> PCR primer GALE2-L <400> 9 atgactggtg ttcatgaagg g 21 <210> 10 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> PCR primer GALE2-R <400> 10 ttacttatat gtcttggtat g 21 <210> 11 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> PCR primer GD1 <400> 11 gcggccgcat gactggtgtt catgaaggga ctgtgttggt tactggcggc gctggttata 60 taggttctca tacgtgcgtt gttttgttag aaaa 94 <210> 12 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> PCR primer GD2 <400> 12 ttaattaatt acttatatgt cttggtatg 29 <210> 13 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> PCR primer PB158 <400> 13 ttagcggccg caggaatgac taaatctcat tca 33 <210> 14 <211> 33 <212> DNA <213> artficial <220> <223> PCR primer PB159 <400> 14 aacttaatta agcttataat tcatatagac agc 33 <210> 15 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> PCR primer PB156 <400> 15 ttagcggccg c 11 <210> 16 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> PCR primer PB157 <400> 16 aacttaatta a 11 <210> 17 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> PCR primer PB160 <400> 17 ttagcggccg caggaatgac tgctgaagaa tt 32 <210> 18 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> PCR primer PB161 <400> 18 aacttaatta agcttacagt ctttgtagat aatc 34 <210> 19 <211> 108 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes Mnn2 leader (53) <400> 19 atgctgctta ccaaaaggtt ttcaaagctg ttcaagctga cgttcatagt tttgatattg 60 tgcgggctgt tcgtcattac aaacaaatac atggatgaga acacgtcg 108 <210> 20 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> Mnn2 leader (53) <400> 20 Met Leu Leu Thr Lys Arg Phe Ser Lys Leu Phe Lys Leu Thr Phe Ile 1 5 10 15 Val Leu Ile Leu Cys Gly Leu Phe Val Ile Thr Asn Lys Tyr Met Asp 20 25 30 Glu Asn Thr Ser 35 <210> 21 <211> 300 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes Mnn2 leader (54) <400> 21 atgctgctta ccaaaaggtt ttcaaagctg ttcaagctga cgttcatagt tttgatattg 60 tgcgggctgt tcgtcattac aaacaaatac atggatgaga acacgtcggt caaggagtac 120 aaggagtact tagacagata tgtccagagt tactccaata agtattcatc ttcctcagac 180 gccgccagcg ctgacgattc aaccccattg agggacaatg atgaggcagg caatgaaaag 240 ttgaaaagct tctacaacaa cgttttcaac tttctaatgg ttgattcgcc cgggcgcgcc 300 <210> 22 <211> 100 <212> PRT <213> Artificial Sequence <220> <223> Mnn2 leader (54) <400> 22 Met Leu Leu Thr Lys Arg Phe Ser Lys Leu Phe Lys Leu Thr Phe Ile 1 5 10 15 Val Leu Ile Leu Cys Gly Leu Phe Val Ile Thr Asn Lys Tyr Met Asp 20 25 30 Glu Asn Thr Ser Val Lys Glu Tyr Lys Glu Tyr Leu Asp Arg Tyr Val 35 40 45 Gln Ser Tyr Ser Asn Lys Tyr Ser Ser Ser Ser Asp Ala Ala Ser Ala 50 55 60 Asp Asp Ser Thr Pro Leu Arg Asp Asn Asp Glu Ala Gly Asn Glu Lys 65 70 75 80 Leu Lys Ser Phe Tyr Asn Asn Val Phe Asn Phe Leu Met Val Asp Ser 85 90 95 Pro Gly Arg Ala 100 <210> 23 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes S. cerevisiae Mating Factor pre signal sequence <400> 23 atgagattcc catccatctt cactgctgtt ttgttcgctg cttcttctgc tttggct 57 <210> 24 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> S. cerevisiae Mating Factor pre signal sequence <400> 24 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala <210> 25 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes alpha amylase signal sequence (from Aspergillus niger -amylase) <400> 25 atggttgctt ggtggtcctt gttcttgtac ggattgcaag ttgctgctcc agctttggct 60 <210> 26 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> alpha amylase signal sequence (from Aspergillus niger -amylase) <400> 26 Met Val Ala Trp Trp Ser Leu Phe Leu Tyr Gly Leu Gln Val Ala Ala 1 5 10 15 Pro Ala Leu Ala 20 <210> 27 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes Pp SEC12 (10) leader <400> 27 atgcccagaa aaatatttaa ctacttcatt ttgactgtat tcatggcaat tcttgctatt 60 gttttacaat ggtctataga gaatggacat gggcgcgcc 99 <210> 28 <211> 33 <212> PRT <213> Artificial Sequence <220> <223> Pp SEC12 (10) leader <400> 28 Met Pro Arg Lys Ile Phe Asn Tyr Phe Ile Leu Thr Val Phe Met Ala 1 5 10 15 Ile Leu Ala Ile Val Leu Gln Trp Ser Ile Glu Asn Gly His Gly Arg 20 25 30 Ala <210> 29 <211> 183 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes ScMnt1 (Kre2) (33) leader <400> 29 atggccctct ttctcagtaa gagactgttg agatttaccg tcattgcagg tgcggttatt 60 gttctcctcc taacattgaa ttccaacagt agaactcagc aatatattcc gagttccatc 120 tccgctgcat ttgattttac ctcaggatct atatcccctg aacaacaagt catcgggcgc 180 gcc 183 <210> 30 <211> 61 <212> PRT <213> Artificial Sequence <220> <223> ScMnt1 (Kre2) (33) leader <400> 30 Met Ala Leu Phe Leu Ser Lys Arg Leu Leu Arg Phe Thr Val Ile Ala 1 5 10 15 Gly Ala Val Ile Val Leu Leu Leu Thr Leu Asn Ser Asn Ser Arg Thr 20 25 30 Gln Gln Tyr Ile Pro Ser Ser Ile Ser Ala Ala Phe Asp Phe Thr Ser 35 40 45 Gly Ser Ile Ser Pro Glu Gln Gln Val Ile Gly Arg Ala 50 55 60 <210> 31 <211> 318 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes ScSEC12 (8) leader <400> 31 atgaacacta tccacataat aaaattaccg cttaactacg ccaactacac ctcaatgaaa 60 caaaaaatct ctaaattttt caccaacttc atccttattg tgctgctttc ttacatttta 120 cagttctcct ataagcacaa tttgcattcc atgcttttca attacgcgaa ggacaatttt 180 ctaacgaaaa gagacaccat ctcttcgccc tacgtagttg atgaagactt acatcaaaca 240 actttgtttg gcaaccacgg tacaaaaaca tctgtaccta gcgtagattc cataaaagtg 300 catggcgtgg ggcgcgcc 318 <210> 32 <211> 106 <212> PRT <213> Artificial Sequence <220> <223> ScSEC12 (8) leader <400> 32 Met Asn Thr Ile His Ile Ile Lys Leu Pro Leu Asn Tyr Ala Asn Tyr 1 5 10 15 Thr Ser Met Lys Gln Lys Ile Ser Lys Phe Phe Thr Asn Phe Ile Leu 20 25 30 Ile Val Leu Leu Ser Tyr Ile Leu Gln Phe Ser Tyr Lys His Asn Leu 35 40 45 His Ser Met Leu Phe Asn Tyr Ala Lys Asp Asn Phe Leu Thr Lys Arg 50 55 60 Asp Thr Ile Ser Ser Pro Tyr Val Val Asp Glu Asp Leu His Gln Thr 65 70 75 80 Thr Leu Phe Gly Asn His Gly Thr Lys Thr Ser Val Pro Ser Val Asp 85 90 95 Ser Ile Lys Val His Gly Val Gly Arg Ala 100 105 <210> 33 <211> 981 <212> DNA <213> Mus musculus <220> <221> CDS <222> (1)...(981) <223> MmSLC35A3 UDP-GlcNAc transporter <400> 33 atg tct gcc aac cta aaa tat ctt tcc ttg gga att ttg gtg ttt cag 48 Met Ser Ala Asn Leu Lys Tyr Leu Ser Leu Gly Ile Leu Val Phe Gln 1 5 10 15 act acc agt ctg gtt cta acg atg cgg tat tct agg act tta aaa gag 96 Thr Thr Ser Leu Val Leu Thr Met Arg Tyr Ser Arg Thr Leu Lys Glu 20 25 30 gag ggg cct cgt tat ctg tct tct aca gca gtg gtt gtg gct gaa ttt 144 Glu Gly Pro Arg Tyr Leu Ser Ser Thr Ala Val Val Val Ala Glu Phe 35 40 45 ttg aag ata atg gcc tgc atc ttt tta gtc tac aaa gac agt aag tgt 192 Leu Lys Ile Met Ala Cys Ile Phe Leu Val Tyr Lys Asp Ser Lys Cys 50 55 60 agt gtg aga gca ctg aat aga gta ctg cat gat gaa att ctt aat aag 240 Ser Val Arg Ala Leu Asn Arg Val Leu His Asp Glu Ile Leu Asn Lys 65 70 75 80 ccc atg gaa acc ctg aag ctc gct atc ccg tca ggg ata tat act ctt 288 Pro Met Glu Thr Leu Lys Leu Ala Ile Pro Ser Gly Ile Tyr Thr Leu 85 90 95 cag aac aac tta ctc tat gtg gca ctg tca aac cta gat gca gcc act 336 Gln Asn Asn Leu Leu Tyr Val Ala Leu Ser Asn Leu Asp Ala Ala Thr 100 105 110 tac cag gtt aca tat cag ttg aaa ata ctt aca aca gca tta ttt tct 384 Tyr Gln Val Thr Tyr Gln Leu Lys Ile Leu Thr Thr Ala Leu Phe Ser 115 120 125 gtg tct atg ctt ggt aaa aaa tta ggt gtg tac cag tgg ctc tcc cta 432 Val Ser Met Leu Gly Lys Lys Leu Gly Val Tyr Gln Trp Leu Ser Leu 130 135 140 gta att ctg atg gca gga gtt gct ttt gta cag tgg cct tca gat tct 480 Val Ile Leu Met Ala Gly Val Ala Phe Val Gln Trp Pro Ser Asp Ser 145 150 155 160 caa gag ctg aac tct aag gac ctt tca aca ggc tca cag ttt gta ggc 528 Gln Glu Leu Asn Ser Lys Asp Leu Ser Thr Gly Ser Gln Phe Val Gly 165 170 175 ctc atg gca gtt ctc aca gcc tgt ttt tca agt ggc ttt gct gga gtt 576 Leu Met Ala Val Leu Thr Ala Cys Phe Ser Ser Gly Phe Ala Gly Val 180 185 190 tat ttt gag aaa atc tta aaa gaa aca aaa cag tca gta tgg ata agg 624 Tyr Phe Glu Lys Ile Leu Lys Glu Thr Lys Gln Ser Val Trp Ile Arg 195 200 205 aac att caa ctt ggt ttc ttt gga agt ata ttt gga tta atg ggt gta 672 Asn Ile Gln Leu Gly Phe Phe Gly Ser Ile Phe Gly Leu Met Gly Val 210 215 220 tac gtt tat gat gga gaa ttg gtc tca aag aat gga ttt ttt cag gga 720 Tyr Val Tyr Asp Gly Glu Leu Val Ser Lys Asn Gly Phe Phe Gln Gly 225 230 235 240 tat aat caa ctg acg tgg ata gtt gtt gct ctg cag gca ctt gga ggc 768 Tyr Asn Gln Leu Thr Trp Ile Val Val Ala Leu Gln Ala Leu Gly Gly 245 250 255 ctt gta ata gct gct gtc atc aaa tat gca gat aac att tta aaa gga 816 Leu Val Ile Ala Ala Val Ile Lys Tyr Ala Asp Asn Ile Leu Lys Gly 260 265 270 ttt gcg acc tcc tta tcc ata ata ttg tca aca ata ata tct tat ttt 864 Phe Ala Thr Ser Leu Ser Ile Ile Leu Ser Thr Ile Ile Ser Tyr Phe 275 280 285 tgg ttg caa gat ttt gtg cca acc agt gtc ttt ttc ctt gga gcc atc 912 Trp Leu Gln Asp Phe Val Pro Thr Ser Val Phe Phe Leu Gly Ala Ile 290 295 300 ctt gta ata gca gct act ttc ttg tat ggt tac gat ccc aaa cct gca 960 Leu Val Ile Ala Ala Thr Phe Leu Tyr Gly Tyr Asp Pro Lys Pro Ala 305 310 315 320 gga aat ccc act aaa gca tag 981 Gly Asn Pro Thr Lys Ala * 325 <210> 34 <211> 326 <212> PRT <213> Mus musculus <400> 34 Met Ser Ala Asn Leu Lys Tyr Leu Ser Leu Gly Ile Leu Val Phe Gln 1 5 10 15 Thr Thr Ser Leu Val Leu Thr Met Arg Tyr Ser Arg Thr Leu Lys Glu 20 25 30 Glu Gly Pro Arg Tyr Leu Ser Ser Thr Ala Val Val Val Ala Glu Phe 35 40 45 Leu Lys Ile Met Ala Cys Ile Phe Leu Val Tyr Lys Asp Ser Lys Cys 50 55 60 Ser Val Arg Ala Leu Asn Arg Val Leu His Asp Glu Ile Leu Asn Lys 65 70 75 80 Pro Met Glu Thr Leu Lys Leu Ala Ile Pro Ser Gly Ile Tyr Thr Leu 85 90 95 Gln Asn Asn Leu Leu Tyr Val Ala Leu Ser Asn Leu Asp Ala Ala Thr 100 105 110 Tyr Gln Val Thr Tyr Gln Leu Lys Ile Leu Thr Thr Ala Leu Phe Ser 115 120 125 Val Ser Met Leu Gly Lys Lys Leu Gly Val Tyr Gln Trp Leu Ser Leu 130 135 140 Val Ile Leu Met Ala Gly Val Ala Phe Val Gln Trp Pro Ser Asp Ser 145 150 155 160 Gln Glu Leu Asn Ser Lys Asp Leu Ser Thr Gly Ser Gln Phe Val Gly 165 170 175 Leu Met Ala Val Leu Thr Ala Cys Phe Ser Ser Gly Phe Ala Gly Val 180 185 190 Tyr Phe Glu Lys Ile Leu Lys Glu Thr Lys Gln Ser Val Trp Ile Arg 195 200 205 Asn Ile Gln Leu Gly Phe Phe Gly Ser Ile Phe Gly Leu Met Gly Val 210 215 220 Tyr Val Tyr Asp Gly Glu Leu Val Ser Lys Asn Gly Phe Phe Gln Gly 225 230 235 240 Tyr Asn Gln Leu Thr Trp Ile Val Val Ala Leu Gln Ala Leu Gly Gly 245 250 255 Leu Val Ile Ala Ala Val Ile Lys Tyr Ala Asp Asn Ile Leu Lys Gly 260 265 270 Phe Ala Thr Ser Leu Ser Ile Ile Leu Ser Thr Ile Ile Ser Tyr Phe 275 280 285 Trp Leu Gln Asp Phe Val Pro Thr Ser Val Phe Phe Leu Gly Ala Ile 290 295 300 Leu Val Ile Ala Ala Thr Phe Leu Tyr Gly Tyr Asp Pro Lys Pro Ala 305 310 315 320 Gly Asn Pro Thr Lys Ala 325 <210> 35 <211> 1068 <212> DNA <213> Saccharomyces pombe <220> <221> CDS <222> (1)...(1068) <223> DNA encodes SpGALE <400> 35 atg act ggt gtt cat gaa ggg act gtg ttg gtt act ggc ggc gct ggt 48 Met Thr Gly Val His Glu Gly Thr Val Leu Val Thr Gly Gly Ala Gly 1 5 10 15 tat ata ggt tct cat acg tgc gtt gtt ttg tta gaa aaa gga tat gat 96 Tyr Ile Gly Ser His Thr Cys Val Val Leu Leu Glu Lys Gly Tyr Asp 20 25 30 gtt gta att gtc gat aat tta tgc aat tct cgc gtt gaa gcc gtg cac 144 Val Val Ile Val Asp Asn Leu Cys Asn Ser Arg Val Glu Ala Val His 35 40 45 cgc att gaa aaa ctc act ggg aaa aaa gtc ata ttc cac cag gtg gat 192 Arg Ile Glu Lys Leu Thr Gly Lys Lys Val Ile Phe His Gln Val Asp 50 55 60 ttg ctt gat gag cca gct ttg gac aag gtc ttc gca aat caa aac ata 240 Leu Leu Asp Glu Pro Ala Leu Asp Lys Val Phe Ala Asn Gln Asn Ile 65 70 75 80 tct gct gtc att cat ttt gct ggt ctc aaa gca gtt ggt gaa tct gta 288 Ser Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly Glu Ser Val 85 90 95 cag gtt cct ttg agt tat tac aaa aat aac att tcc ggt acc att aat 336 Gln Val Pro Leu Ser Tyr Tyr Lys Asn Asn Ile Ser Gly Thr Ile Asn 100 105 110 tta ata gag tgc atg aag aag tat aat gta cgt gac ttc gtc ttt tct 384 Leu Ile Glu Cys Met Lys Lys Tyr Asn Val Arg Asp Phe Val Phe Ser 115 120 125 tca tct gct acc gtg tat ggc gat cct act aga cct ggt ggt acc att 432 Ser Ser Ala Thr Val Tyr Gly Asp Pro Thr Arg Pro Gly Gly Thr Ile 130 135 140 cct att cca gag tca tgc cct cgt gaa ggt aca agc cca tat ggt cgc 480 Pro Ile Pro Glu Ser Cys Pro Arg Glu Gly Thr Ser Pro Tyr Gly Arg 145 150 155 160 aca aag ctt ttc att gaa aat atc att gag gat gag acc aag gtg aac 528 Thr Lys Leu Phe Ile Glu Asn Ile Ile Glu Asp Glu Thr Lys Val Asn 165 170 175 aaa tcg ctt aat gca gct tta tta cgc tat ttt aat ccc gga ggt gct 576 Lys Ser Leu Asn Ala Ala Leu Leu Arg Tyr Phe Asn Pro Gly Gly Ala 180 185 190 cat ccc tct ggt gaa ctc ggt gaa gat cct ctt ggc atc cct aat aac 624 His Pro Ser Gly Glu Leu Gly Glu Asp Pro Leu Gly Ile Pro Asn Asn 195 200 205 ttg ctt cct tat atc gcg caa gtt gct gta gga aga ttg gat cat ttg 672 Leu Leu Pro Tyr Ile Ala Gln Val Ala Val Gly Arg Leu Asp His Leu 210 215 220 aat gta ttt ggc gac gat tat ccc aca tct gac ggt act cca att cgt 720 Asn Val Phe Gly Asp Asp Tyr Pro Thr Ser Asp Gly Thr Pro Ile Arg 225 230 235 240 gac tac att cac gta tgc gat ttg gca gag gct cat gtt gct gct ctc 768 Asp Tyr Ile His Val Cys Asp Leu Ala Glu Ala His Val Ala Ala Leu 245 250 255 gat tac ctg cgc caa cat ttt gtt agt tgc cgc cct tgg aat ttg gga 816 Asp Tyr Leu Arg Gln His Phe Val Ser Cys Arg Pro Trp Asn Leu Gly 260 265 270 tca gga act ggt agt act gtt ttt cag gtg ctc aat gcg ttt tcg aaa 864 Ser Gly Thr Gly Ser Thr Val Phe Gln Val Leu Asn Ala Phe Ser Lys 275 280 285 gct gtt gga aga gat ctt cct tat aag gtc acc cct aga aga gca ggg 912 Ala Val Gly Arg Asp Leu Pro Tyr Lys Val Thr Pro Arg Arg Ala Gly 290 295 300 gac gtt gtt aac cta acc gcc aac ccc act cgc gct aac gag gag tta 960 Asp Val Val Asn Leu Thr Ala Asn Pro Thr Arg Ala Asn Glu Glu Leu 305 310 315 320 aaa tgg aaa acc agt cgt agc att tat gaa att tgc gtt gac act tgg 1008 Lys Trp Lys Thr Ser Arg Ser Ile Tyr Glu Ile Cys Val Asp Thr Trp 325 330 335 aga tgg caa cag aag tat ccc tat ggc ttt gac ctg acc cat acc aag 1056 Arg Trp Gln Gln Lys Tyr Pro Tyr Gly Phe Asp Leu Thr His Thr Lys 340 345 350 aca tat aag taa 1068 Thr Tyr Lys * 355 <210> 36 <211> 355 <212> PRT <213> Saccharomyces pombe <400> 36 Met Thr Gly Val His Glu Gly Thr Val Leu Val Thr Gly Gly Ala Gly 1 5 10 15 Tyr Ile Gly Ser His Thr Cys Val Val Leu Leu Glu Lys Gly Tyr Asp 20 25 30 Val Val Ile Val Asp Asn Leu Cys Asn Ser Arg Val Glu Ala Val His 35 40 45 Arg Ile Glu Lys Leu Thr Gly Lys Lys Val Ile Phe His Gln Val Asp 50 55 60 Leu Leu Asp Glu Pro Ala Leu Asp Lys Val Phe Ala Asn Gln Asn Ile 65 70 75 80 Ser Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly Glu Ser Val 85 90 95 Gln Val Pro Leu Ser Tyr Tyr Lys Asn Asn Ile Ser Gly Thr Ile Asn 100 105 110 Leu Ile Glu Cys Met Lys Lys Tyr Asn Val Arg Asp Phe Val Phe Ser 115 120 125 Ser Ser Ala Thr Val Tyr Gly Asp Pro Thr Arg Pro Gly Gly Thr Ile 130 135 140 Pro Ile Pro Glu Ser Cys Pro Arg Glu Gly Thr Ser Pro Tyr Gly Arg 145 150 155 160 Thr Lys Leu Phe Ile Glu Asn Ile Ile Glu Asp Glu Thr Lys Val Asn 165 170 175 Lys Ser Leu Asn Ala Ala Leu Leu Arg Tyr Phe Asn Pro Gly Gly Ala 180 185 190 His Pro Ser Gly Glu Leu Gly Glu Asp Pro Leu Gly Ile Pro Asn Asn 195 200 205 Leu Leu Pro Tyr Ile Ala Gln Val Ala Val Gly Arg Leu Asp His Leu 210 215 220 Asn Val Phe Gly Asp Asp Tyr Pro Thr Ser Asp Gly Thr Pro Ile Arg 225 230 235 240 Asp Tyr Ile His Val Cys Asp Leu Ala Glu Ala His Val Ala Ala Leu 245 250 255 Asp Tyr Leu Arg Gln His Phe Val Ser Cys Arg Pro Trp Asn Leu Gly 260 265 270 Ser Gly Thr Gly Ser Thr Val Phe Gln Val Leu Asn Ala Phe Ser Lys 275 280 285 Ala Val Gly Arg Asp Leu Pro Tyr Lys Val Thr Pro Arg Arg Ala Gly 290 295 300 Asp Val Val Asn Leu Thr Ala Asn Pro Thr Arg Ala Asn Glu Glu Leu 305 310 315 320 Lys Trp Lys Thr Ser Arg Ser Ile Tyr Glu Ile Cys Val Asp Thr Trp 325 330 335 Arg Trp Gln Gln Lys Tyr Pro Tyr Gly Phe Asp Leu Thr His Thr Lys 340 345 350 Thr Tyr Lys 355 <210> 37 <211> 1074 <212> DNA <213> Drosophila melangaster <220> <221> CDS <222> (1)...(1074) <223> DNA encodes DmUGT <400> 37 atg aat agc ata cac atg aac gcc aat acg ctg aag tac atc agc ctg 48 Met Asn Ser Ile His Met Asn Ala Asn Thr Leu Lys Tyr Ile Ser Leu 1 5 10 15 ctg acg ctg acc ctg cag aat gcc atc ctg ggc ctc agc atg cgc tac 96 Leu Thr Leu Thr Leu Gln Asn Ala Ile Leu Gly Leu Ser Met Arg Tyr 20 25 30 gcc cgc acc cgg cca ggc gac atc ttc ctc agc tcc acg gcc gta ctc 144 Ala Arg Thr Arg Pro Gly Asp Ile Phe Leu Ser Ser Thr Ala Val Leu 35 40 45 atg gca gag ttc gcc aaa ctg atc acg tgc ctg ttc ctg gtc ttc aac 192 Met Ala Glu Phe Ala Lys Leu Ile Thr Cys Leu Phe Leu Val Phe Asn 50 55 60 gag gag ggc aag gat gcc cag aag ttt gta cgc tcg ctg cac aag acc 240 Glu Glu Gly Lys Asp Ala Gln Lys Phe Val Arg Ser Leu His Lys Thr 65 70 75 80 atc att gcg aat ccc atg gac acg ctg aag gtg tgc gtc ccc tcg ctg 288 Ile Ile Ala Asn Pro Met Asp Thr Leu Lys Val Cys Val Pro Ser Leu 85 90 95 gtc tat atc gtt caa aac aat ctg ctg tac gtc tct gcc tcc cat ttg 336 Val Tyr Ile Val Gln Asn Asn Leu Leu Tyr Val Ser Ala Ser His Leu 100 105 110 gat gcg gcc acc tac cag gtg acg tac cag ctg aag att ctc acc acg 384 Asp Ala Ala Thr Tyr Gln Val Thr Tyr Gln Leu Lys Ile Leu Thr Thr 115 120 125 gcc atg ttc gcg gtt gtc att ctg cgc cgc aag ctg ctg aac acg cag 432 Ala Met Phe Ala Val Val Ile Leu Arg Arg Lys Leu Leu Asn Thr Gln 130 135 140 tgg ggt gcg ctg ctg ctc ctg gtg atg ggc atc gtc ctg gtg cag ttg 480 Trp Gly Ala Leu Leu Leu Leu Val Met Gly Ile Val Leu Val Gln Leu 145 150 155 160 gcc caa acg gag ggt ccg acg agt ggc tca gcc ggt ggt gcc gca gct 528 Ala Gln Thr Glu Gly Pro Thr Ser Gly Ser Ala Gly Gly Ala Ala Ala 165 170 175 gca gcc acg gcc gcc tcc tct ggc ggt gct ccc gag cag aac agg atg 576 Ala Ala Thr Ala Ala Ser Ser Gly Gly Ala Pro Glu Gln Asn Arg Met 180 185 190 ctc gga ctg tgg gcc gca ctg ggc gcc tgc ttc ctc tcc gga ttc gcg 624 Leu Gly Leu Trp Ala Ala Leu Gly Ala Cys Phe Leu Ser Gly Phe Ala 195 200 205 ggc atc tac ttt gag aag atc ctc aag ggt gcc gag atc tcc gtg tgg 672 Gly Ile Tyr Phe Glu Lys Ile Leu Lys Gly Ala Glu Ile Ser Val Trp 210 215 220 atg cgg aat gtg cag ttg agt ctg ctc agc att ccc ttc ggc ctg ctc 720 Met Arg Asn Val Gln Leu Ser Leu Leu Ser Ile Pro Phe Gly Leu Leu 225 230 235 240 acc tgt ttc gtt aac gac ggc agt agg atc ttc gac cag gga ttc ttc 768 Thr Cys Phe Val Asn Asp Gly Ser Arg Ile Phe Asp Gln Gly Phe Phe 245 250 255 aag ggc tac gat ctg ttt gtc tgg tac ctg gtc ctg ctg cag gcc ggc 816 Lys Gly Tyr Asp Leu Phe Val Trp Tyr Leu Val Leu Leu Gln Ala Gly 260 265 270 ggt gga ttg atc gtt gcc gtg gtg gtc aag tac gcg gat aac att ctc 864 Gly Gly Leu Ile Val Ala Val Val Val Lys Tyr Ala Asp Asn Ile Leu 275 280 285 aag ggc ttc gcc acc tcg ctg gcc atc atc atc tcg tgc gtg gcc tcc 912 Lys Gly Phe Ala Thr Ser Leu Ala Ile Ile Ile Ser Cys Val Ala Ser 290 295 300 ata tac atc ttc gac ttc aat ctc acg ctg cag ttc agc ttc gga gct 960 Ile Tyr Ile Phe Asp Phe Asn Leu Thr Leu Gln Phe Ser Phe Gly Ala 305 310 315 320 ggc ctg gtc atc gcc tcc ata ttt ctc tac ggc tac gat ccg gcc agg 1008 Gly Leu Val Ile Ala Ser Ile Phe Leu Tyr Gly Tyr Asp Pro Ala Arg 325 330 335 tcg gcg ccg aag cca act atg cat ggt cct ggc ggc gat gag gag aag 1056 Ser Ala Pro Lys Pro Thr Met His Gly Pro Gly Gly Asp Glu Glu Lys 340 345 350 ctg ctg ccg cgc gtc tag 1074 Leu Leu Pro Arg Val * 355 <210> 38 <211> 357 <212> PRT <213> Drosophila melangaster <400> 38 Met Asn Ser Ile His Met Asn Ala Asn Thr Leu Lys Tyr Ile Ser Leu 1 5 10 15 Leu Thr Leu Thr Leu Gln Asn Ala Ile Leu Gly Leu Ser Met Arg Tyr 20 25 30 Ala Arg Thr Arg Pro Gly Asp Ile Phe Leu Ser Ser Thr Ala Val Leu 35 40 45 Met Ala Glu Phe Ala Lys Leu Ile Thr Cys Leu Phe Leu Val Phe Asn 50 55 60 Glu Glu Gly Lys Asp Ala Gln Lys Phe Val Arg Ser Leu His Lys Thr 65 70 75 80 Ile Ile Ala Asn Pro Met Asp Thr Leu Lys Val Cys Val Pro Ser Leu 85 90 95 Val Tyr Ile Val Gln Asn Asn Leu Leu Tyr Val Ser Ala Ser His Leu 100 105 110 Asp Ala Ala Thr Tyr Gln Val Thr Tyr Gln Leu Lys Ile Leu Thr Thr 115 120 125 Ala Met Phe Ala Val Val Ile Leu Arg Arg Lys Leu Leu Asn Thr Gln 130 135 140 Trp Gly Ala Leu Leu Leu Leu Val Met Gly Ile Val Leu Val Gln Leu 145 150 155 160 Ala Gln Thr Glu Gly Pro Thr Ser Gly Ser Ala Gly Gly Ala Ala Ala 165 170 175 Ala Ala Thr Ala Ala Ser Ser Gly Gly Ala Pro Glu Gln Asn Arg Met 180 185 190 Leu Gly Leu Trp Ala Ala Leu Gly Ala Cys Phe Leu Ser Gly Phe Ala 195 200 205 Gly Ile Tyr Phe Glu Lys Ile Leu Lys Gly Ala Glu Ile Ser Val Trp 210 215 220 Met Arg Asn Val Gln Leu Ser Leu Leu Ser Ile Pro Phe Gly Leu Leu 225 230 235 240 Thr Cys Phe Val Asn Asp Gly Ser Arg Ile Phe Asp Gln Gly Phe Phe 245 250 255 Lys Gly Tyr Asp Leu Phe Val Trp Tyr Leu Val Leu Leu Gln Ala Gly 260 265 270 Gly Gly Leu Ile Val Ala Val Val Val Lys Tyr Ala Asp Asn Ile Leu 275 280 285 Lys Gly Phe Ala Thr Ser Leu Ala Ile Ile Ile Ser Cys Val Ala Ser 290 295 300 Ile Tyr Ile Phe Asp Phe Asn Leu Thr Leu Gln Phe Ser Phe Gly Ala 305 310 315 320 Gly Leu Val Ile Ala Ser Ile Phe Leu Tyr Gly Tyr Asp Pro Ala Arg 325 330 335 Ser Ala Pro Lys Pro Thr Met His Gly Pro Gly Gly Asp Glu Glu Lys 340 345 350 Leu Leu Pro Arg Val 355 <210> 39 <211> 1587 <212> DNA <213> Saccharomyces cerevisiae <220> <221> CDS <222> (1)...(1587) <223> DNA encodes ScGAL1 <400> 39 atg act aaa tct cat tca gaa gaa gtg att gta cct gag ttc aat tct 48 Met Thr Lys Ser His Ser Glu Glu Val Ile Val Pro Glu Phe Asn Ser 1 5 10 15 agc gca aag gaa tta cca aga cca ttg gcc gaa aag tgc ccg agc ata 96 Ser Ala Lys Glu Leu Pro Arg Pro Leu Ala Glu Lys Cys Pro Ser Ile 20 25 30 att aag aaa ttt ata agc gct tat gat gct aaa ccg gat ttt gtt gct 144 Ile Lys Lys Phe Ile Ser Ala Tyr Asp Ala Lys Pro Asp Phe Val Ala 35 40 45 aga tcg cct ggt aga gtc aat cta att ggt gaa cat att gat tat tgt 192 Arg Ser Pro Gly Arg Val Asn Leu Ile Gly Glu His Ile Asp Tyr Cys 50 55 60 gac ttc tcg gtt tta cct tta gct att gat ttt gat atg ctt tgc gcc 240 Asp Phe Ser Val Leu Pro Leu Ala Ile Asp Phe Asp Met Leu Cys Ala 65 70 75 80 gtc aaa gtt ttg aac gag aaa aat cca tcc att acc tta ata aat gct 288 Val Lys Val Leu Asn Glu Lys Asn Pro Ser Ile Thr Leu Ile Asn Ala 85 90 95 gat ccc aaa ttt gct caa agg aag ttc gat ttg ccg ttg gac ggt tct 336 Asp Pro Lys Phe Ala Gln Arg Lys Phe Asp Leu Pro Leu Asp Gly Ser 100 105 110 tat gtc aca att gat cct tct gtg tcg gac tgg tct aat tac ttt aaa 384 Tyr Val Thr Ile Asp Pro Ser Val Ser Asp Trp Ser Asn Tyr Phe Lys 115 120 125 tgt ggt ctc cat gtt gct cac tct ttt cta aag aaa ctt gca ccg gaa 432 Cys Gly Leu His Val Ala His Ser Phe Leu Lys Lys Leu Ala Pro Glu 130 135 140 agg ttt gcc agt gct cct ctg gcc ggg ctg caa gtc ttc tgt gag ggt 480 Arg Phe Ala Ser Ala Pro Leu Ala Gly Leu Gln Val Phe Cys Glu Gly 145 150 155 160 gat gta cca act ggc agt gga ttg tct tct tcg gcc gca ttc att tgt 528 Asp Val Pro Thr Gly Ser Gly Leu Ser Ser Ser Ala Ala Phe Ile Cys 165 170 175 gcc gtt gct tta gct gtt gtt aaa gcg aat atg ggc cct ggt tat cat 576 Ala Val Ala Leu Ala Val Val Lys Ala Asn Met Gly Pro Gly Tyr His 180 185 190 atg tcc aag caa aat tta atg cgt att acg gtc gtt gca gaa cat tat 624 Met Ser Lys Gln Asn Leu Met Arg Ile Thr Val Val Ala Glu His Tyr 195 200 205 gtt ggt gtt aac aat ggc ggt atg gat cag gct gcc tct gtt tgc ggt 672 Val Gly Val Asn Asn Gly Gly Met Asp Gln Ala Ala Ser Val Cys Gly 210 215 220 gag gaa gat cat gct cta tac gtt gag ttc aaa ccg cag ttg aag gct 720 Glu Glu Asp His Ala Leu Tyr Val Glu Phe Lys Pro Gln Leu Lys Ala 225 230 235 240 act ccg ttt aaa ttt ccg caa tta aaa aac cat gaa att agc ttt gtt 768 Thr Pro Phe Lys Phe Pro Gln Leu Lys Asn His Glu Ile Ser Phe Val 245 250 255 att gcg aac acc ctt gtt gta tct aac aag ttt gaa acc gcc cca acc 816 Ile Ala Asn Thr Leu Val Val Ser Asn Lys Phe Glu Thr Ala Pro Thr 260 265 270 aac tat aat tta aga gtg gta gaa gtc act aca gct gca aat gtt tta 864 Asn Tyr Asn Leu Arg Val Val Glu Val Thr Thr Ala Ala Asn Val Leu 275 280 285 gct gcc acg tac ggt gtt gtt tta ctt tct gga aaa gaa gga tcg agc 912 Ala Ala Thr Tyr Gly Val Val Leu Leu Ser Gly Lys Glu Gly Ser Ser 290 295 300 acg aat aaa ggt aat cta aga gat ttc atg aac gtt tat tat gcc aga 960 Thr Asn Lys Gly Asn Leu Arg Asp Phe Met Asn Val Tyr Tyr Ala Arg 305 310 315 320 tat cac aac att tcc aca ccc tgg aac ggc gat att gaa tcc ggc atc 1008 Tyr His Asn Ile Ser Thr Pro Trp Asn Gly Asp Ile Glu Ser Gly Ile 325 330 335 gaa cgg tta aca aag atg cta gta cta gtt gaa gag tct ctc gcc aat 1056 Glu Arg Leu Thr Lys Met Leu Val Leu Val Glu Glu Ser Leu Ala Asn 340 345 350 aag aaa cag ggc ttt agt gtt gac gat gtc gca caa tcc ttg aat tgt 1104 Lys Lys Gln Gly Phe Ser Val Asp Asp Val Ala Gln Ser Leu Asn Cys 355 360 365 tct cgc gaa gaa ttc aca aga gac tac tta aca aca tct cca gtg aga 1152 Ser Arg Glu Glu Phe Thr Arg Asp Tyr Leu Thr Thr Ser Pro Val Arg 370 375 380 ttt caa gtc tta aag cta tat cag agg gct aag cat gtg tat tct gaa 1200 Phe Gln Val Leu Lys Leu Tyr Gln Arg Ala Lys His Val Tyr Ser Glu 385 390 395 400 tct tta aga gtc ttg aag gct gtg aaa tta atg act aca gcg agc ttt 1248 Ser Leu Arg Val Leu Lys Ala Val Lys Leu Met Thr Thr Ala Ser Phe 405 410 415 act gcc gac gaa gac ttt ttc aag caa ttt ggt gcc ttg atg aac gag 1296 Thr Ala Asp Glu Asp Phe Phe Lys Gln Phe Gly Ala Leu Met Asn Glu 420 425 430 tct caa gct tct tgc gat aaa ctt tac gaa tgt tct tgt cca gag att 1344 Ser Gln Ala Ser Cys Asp Lys Leu Tyr Glu Cys Ser Cys Pro Glu Ile 435 440 445 gac aaa att tgt tcc att gct ttg tca aat gga tca tat ggt tcc cgt 1392 Asp Lys Ile Cys Ser Ile Ala Leu Ser Asn Gly Ser Tyr Gly Ser Arg 450 455 460 ttg acc gga gct ggc tgg ggt ggt tgt act gtt cac ttg gtt cca ggg 1440 Leu Thr Gly Ala Gly Trp Gly Gly Cys Thr Val His Leu Val Pro Gly 465 470 475 480 ggc cca aat ggc aac ata gaa aag gta aaa gaa gcc ctt gcc aat gag 1488 Gly Pro Asn Gly Asn Ile Glu Lys Val Lys Glu Ala Leu Ala Asn Glu 485 490 495 ttc tac aag gtc aag tac cct aag atc act gat gct gag cta gaa aat 1536 Phe Tyr Lys Val Lys Tyr Pro Lys Ile Thr Asp Ala Glu Leu Glu Asn 500 505 510 gct atc atc gtc tct aaa cca gca ttg ggc agc tgt cta tat gaa tta 1584 Ala Ile Ile Val Ser Lys Pro Ala Leu Gly Ser Cys Leu Tyr Glu Leu 515 520 525 taa 1587 * <210> 40 <211> 528 <212> PRT <213> Saccharomyces cerevisiea <400> 40 Met Thr Lys Ser His Ser Glu Glu Val Ile Val Pro Glu Phe Asn Ser 1 5 10 15 Ser Ala Lys Glu Leu Pro Arg Pro Leu Ala Glu Lys Cys Pro Ser Ile 20 25 30 Ile Lys Lys Phe Ile Ser Ala Tyr Asp Ala Lys Pro Asp Phe Val Ala 35 40 45 Arg Ser Pro Gly Arg Val Asn Leu Ile Gly Glu His Ile Asp Tyr Cys 50 55 60 Asp Phe Ser Val Leu Pro Leu Ala Ile Asp Phe Asp Met Leu Cys Ala 65 70 75 80 Val Lys Val Leu Asn Glu Lys Asn Pro Ser Ile Thr Leu Ile Asn Ala 85 90 95 Asp Pro Lys Phe Ala Gln Arg Lys Phe Asp Leu Pro Leu Asp Gly Ser 100 105 110 Tyr Val Thr Ile Asp Pro Ser Val Ser Asp Trp Ser Asn Tyr Phe Lys 115 120 125 Cys Gly Leu His Val Ala His Ser Phe Leu Lys Lys Leu Ala Pro Glu 130 135 140 Arg Phe Ala Ser Ala Pro Leu Ala Gly Leu Gln Val Phe Cys Glu Gly 145 150 155 160 Asp Val Pro Thr Gly Ser Gly Leu Ser Ser Ser Ala Ala Phe Ile Cys 165 170 175 Ala Val Ala Leu Ala Val Val Lys Ala Asn Met Gly Pro Gly Tyr His 180 185 190 Met Ser Lys Gln Asn Leu Met Arg Ile Thr Val Val Ala Glu His Tyr 195 200 205 Val Gly Val Asn Asn Gly Gly Met Asp Gln Ala Ala Ser Val Cys Gly 210 215 220 Glu Glu Asp His Ala Leu Tyr Val Glu Phe Lys Pro Gln Leu Lys Ala 225 230 235 240 Thr Pro Phe Lys Phe Pro Gln Leu Lys Asn His Glu Ile Ser Phe Val 245 250 255 Ile Ala Asn Thr Leu Val Val Ser Asn Lys Phe Glu Thr Ala Pro Thr 260 265 270 Asn Tyr Asn Leu Arg Val Val Glu Val Thr Thr Ala Ala Asn Val Leu 275 280 285 Ala Ala Thr Tyr Gly Val Val Leu Leu Ser Gly Lys Glu Gly Ser Ser 290 295 300 Thr Asn Lys Gly Asn Leu Arg Asp Phe Met Asn Val Tyr Tyr Ala Arg 305 310 315 320 Tyr His Asn Ile Ser Thr Pro Trp Asn Gly Asp Ile Glu Ser Gly Ile 325 330 335 Glu Arg Leu Thr Lys Met Leu Val Leu Val Glu Glu Ser Leu Ala Asn 340 345 350 Lys Lys Gln Gly Phe Ser Val Asp Asp Val Ala Gln Ser Leu Asn Cys 355 360 365 Ser Arg Glu Glu Phe Thr Arg Asp Tyr Leu Thr Thr Ser Pro Val Arg 370 375 380 Phe Gln Val Leu Lys Leu Tyr Gln Arg Ala Lys His Val Tyr Ser Glu 385 390 395 400 Ser Leu Arg Val Leu Lys Ala Val Lys Leu Met Thr Thr Ala Ser Phe 405 410 415 Thr Ala Asp Glu Asp Phe Phe Lys Gln Phe Gly Ala Leu Met Asn Glu 420 425 430 Ser Gln Ala Ser Cys Asp Lys Leu Tyr Glu Cys Ser Cys Pro Glu Ile 435 440 445 Asp Lys Ile Cys Ser Ile Ala Leu Ser Asn Gly Ser Tyr Gly Ser Arg 450 455 460 Leu Thr Gly Ala Gly Trp Gly Gly Cys Thr Val His Leu Val Pro Gly 465 470 475 480 Gly Pro Asn Gly Asn Ile Glu Lys Val Lys Glu Ala Leu Ala Asn Glu 485 490 495 Phe Tyr Lys Val Lys Tyr Pro Lys Ile Thr Asp Ala Glu Leu Glu Asn 500 505 510 Ala Ile Ile Val Ser Lys Pro Ala Leu Gly Ser Cys Leu Tyr Glu Leu 515 520 525 <210> 41 <211> 1098 <212> DNA <213> Saccharomyces cerevisiae <220> <221> CDS <222> (1)...(1098) <223> DNA encodes ScGAL7 <400> 41 atg act gct gaa gaa ttt gat ttt tct agc cat tcc cat aga cgt tac 48 Met Thr Ala Glu Glu Phe Asp Phe Ser Ser His Ser His Arg Arg Tyr 1 5 10 15 aat cca cta acc gat tca tgg atc tta gtt tct cca cac aga gct aaa 96 Asn Pro Leu Thr Asp Ser Trp Ile Leu Val Ser Pro His Arg Ala Lys 20 25 30 aga cct tgg tta ggt caa cag gag gct gct tac aag ccc aca gct cct 144 Arg Pro Trp Leu Gly Gln Gln Glu Ala Ala Tyr Lys Pro Thr Ala Pro 35 40 45 ttg tat gat cca aaa tgc tat cta tgt cct ggt aac aaa aga gct act 192 Leu Tyr Asp Pro Lys Cys Tyr Leu Cys Pro Gly Asn Lys Arg Ala Thr 50 55 60 ggt aac cta aac cca aga tat gaa tca acg tat att ttc ccc aat gat 240 Gly Asn Leu Asn Pro Arg Tyr Glu Ser Thr Tyr Ile Phe Pro Asn Asp 65 70 75 80 tat gct gcc gtt agc gat caa cct att tta cca cag aat gat tcc aat 288 Tyr Ala Ala Val Ser Asp Gln Pro Ile Leu Pro Gln Asn Asp Ser Asn 85 90 95 gag gat aat ctt aaa aat agg ctg ctt aaa gtg caa tct gtg aga ggc 336 Glu Asp Asn Leu Lys Asn Arg Leu Leu Lys Val Gln Ser Val Arg Gly 100 105 110 aat tgt ttc gtc ata tgt ttt agc ccc aat cat aat cta acc att cca 384 Asn Cys Phe Val Ile Cys Phe Ser Pro Asn His Asn Leu Thr Ile Pro 115 120 125 caa atg aaa caa tca gat ctg gtt cat att gtt aat tct tgg caa gca 432 Gln Met Lys Gln Ser Asp Leu Val His Ile Val Asn Ser Trp Gln Ala 130 135 140 ttg act gac gat ctc tcc aga gaa gca aga gaa aat cat aag cct ttc 480 Leu Thr Asp Asp Leu Ser Arg Glu Ala Arg Glu Asn His Lys Pro Phe 145 150 155 160 aaa tat gtc caa ata ttt gaa aac aaa ggt aca gcc atg ggt tgt tcc 528 Lys Tyr Val Gln Ile Phe Glu Asn Lys Gly Thr Ala Met Gly Cys Ser 165 170 175 aac tta cat cca cat ggc caa gct tgg tgc tta gaa tcc atc cct agt 576 Asn Leu His Pro His Gly Gln Ala Trp Cys Leu Glu Ser Ile Pro Ser 180 185 190 gaa gtt tcg caa gaa ttg aaa tct ttt gat aaa tat aaa cgt gaa cac 624 Glu Val Ser Gln Glu Leu Lys Ser Phe Asp Lys Tyr Lys Arg Glu His 195 200 205 aat act gat ttg ttt gcc gat tac gtc aaa tta gaa tca aga gag aag 672 Asn Thr Asp Leu Phe Ala Asp Tyr Val Lys Leu Glu Ser Arg Glu Lys 210 215 220 tca aga gtc gta gtg gag aat gaa tcc ttt att gtt gtt gtt cca tac 720 Ser Arg Val Val Val Glu Asn Glu Ser Phe Ile Val Val Val Pro Tyr 225 230 235 240 tgg gcc atc tgg cca ttt gag acc ttg gtc att tca aag aag aag ctt 768 Trp Ala Ile Trp Pro Phe Glu Thr Leu Val Ile Ser Lys Lys Lys Leu 245 250 255 gcc tca att agc caa ttt aac caa atg gcg aag gag gac ctc gcc tcg 816 Ala Ser Ile Ser Gln Phe Asn Gln Met Ala Lys Glu Asp Leu Ala Ser 260 265 270 att tta aag caa cta act att aag tat gat aat tta ttt gaa acg agt 864 Ile Leu Lys Gln Leu Thr Ile Lys Tyr Asp Asn Leu Phe Glu Thr Ser 275 280 285 ttc cca tac tca atg ggt atc cat cag gct cct ttg aat gcg act ggt 912 Phe Pro Tyr Ser Met Gly Ile His Gln Ala Pro Leu Asn Ala Thr Gly 290 295 300 gat gaa ttg agt aat agt tgg ttt cac atg cat ttc tac cca cct tta 960 Asp Glu Leu Ser Asn Ser Trp Phe His Met His Phe Tyr Pro Pro Leu 305 310 315 320 ctg aga tca gct act gtt cgg aaa ttc ttg gtt ggt ttt gaa ttg tta 1008 Leu Arg Ser Ala Thr Val Arg Lys Phe Leu Val Gly Phe Glu Leu Leu 325 330 335 ggt gag cct caa aga gat tta att tcg gaa caa gct gct gaa aaa cta 1056 Gly Glu Pro Gln Arg Asp Leu Ile Ser Glu Gln Ala Ala Glu Lys Leu 340 345 350 aga aat tta gat ggt cag att cat tat cta caa aga cta taa 1098 Arg Asn Leu Asp Gly Gln Ile His Tyr Leu Gln Arg Leu * 355 360 365 <210> 42 <211> 365 <212> PRT <213> Saccharomyces cerevisiae <400> 42 Met Thr Ala Glu Glu Phe Asp Phe Ser Ser His Ser His Arg Arg Tyr 1 5 10 15 Asn Pro Leu Thr Asp Ser Trp Ile Leu Val Ser Pro His Arg Ala Lys 20 25 30 Arg Pro Trp Leu Gly Gln Gln Glu Ala Ala Tyr Lys Pro Thr Ala Pro 35 40 45 Leu Tyr Asp Pro Lys Cys Tyr Leu Cys Pro Gly Asn Lys Arg Ala Thr 50 55 60 Gly Asn Leu Asn Pro Arg Tyr Glu Ser Thr Tyr Ile Phe Pro Asn Asp 65 70 75 80 Tyr Ala Ala Val Ser Asp Gln Pro Ile Leu Pro Gln Asn Asp Ser Asn 85 90 95 Glu Asp Asn Leu Lys Asn Arg Leu Leu Lys Val Gln Ser Val Arg Gly 100 105 110 Asn Cys Phe Val Ile Cys Phe Ser Pro Asn His Asn Leu Thr Ile Pro 115 120 125 Gln Met Lys Gln Ser Asp Leu Val His Ile Val Asn Ser Trp Gln Ala 130 135 140 Leu Thr Asp Asp Leu Ser Arg Glu Ala Arg Glu Asn His Lys Pro Phe 145 150 155 160 Lys Tyr Val Gln Ile Phe Glu Asn Lys Gly Thr Ala Met Gly Cys Ser 165 170 175 Asn Leu His Pro His Gly Gln Ala Trp Cys Leu Glu Ser Ile Pro Ser 180 185 190 Glu Val Ser Gln Glu Leu Lys Ser Phe Asp Lys Tyr Lys Arg Glu His 195 200 205 Asn Thr Asp Leu Phe Ala Asp Tyr Val Lys Leu Glu Ser Arg Glu Lys 210 215 220 Ser Arg Val Val Val Glu Asn Glu Ser Phe Ile Val Val Val Pro Tyr 225 230 235 240 Trp Ala Ile Trp Pro Phe Glu Thr Leu Val Ile Ser Lys Lys Lys Leu 245 250 255 Ala Ser Ile Ser Gln Phe Asn Gln Met Ala Lys Glu Asp Leu Ala Ser 260 265 270 Ile Leu Lys Gln Leu Thr Ile Lys Tyr Asp Asn Leu Phe Glu Thr Ser 275 280 285 Phe Pro Tyr Ser Met Gly Ile His Gln Ala Pro Leu Asn Ala Thr Gly 290 295 300 Asp Glu Leu Ser Asn Ser Trp Phe His Met His Phe Tyr Pro Pro Leu 305 310 315 320 Leu Arg Ser Ala Thr Val Arg Lys Phe Leu Val Gly Phe Glu Leu Leu 325 330 335 Gly Glu Pro Gln Arg Asp Leu Ile Ser Glu Gln Ala Ala Glu Lys Leu 340 345 350 Arg Asn Leu Asp Gly Gln Ile His Tyr Leu Gln Arg Leu 355 360 365 <210> 43 <211> 1725 <212> DNA <213> Saccharomyces cerevisiae <220> <221> CDS <222> (1)...(1725) <223> DNA encodes ScGal permease <400> 43 atg gca gtt gag gag aac aat gtg cct gtt gtt tca cag caa ccc caa 48 Met Ala Val Glu Glu Asn Asn Val Pro Val Val Ser Gln Gln Pro Gln 1 5 10 15 gct ggt gaa gac gtg atc tct tca ctc agt aaa gat tcc cat tta agc 96 Ala Gly Glu Asp Val Ile Ser Ser Leu Ser Lys Asp Ser His Leu Ser 20 25 30 gca caa tct caa aag tat tcc aat gat gaa ttg aaa gcc ggt gag tca 144 Ala Gln Ser Gln Lys Tyr Ser Asn Asp Glu Leu Lys Ala Gly Glu Ser 35 40 45 ggg cct gaa ggc tcc caa agt gtt cct ata gag ata ccc aag aag ccc 192 Gly Pro Glu Gly Ser Gln Ser Val Pro Ile Glu Ile Pro Lys Lys Pro 50 55 60 atg tct gaa tat gtt acc gtt tcc ttg ctt tgt ttg tgt gtt gcc ttc 240 Met Ser Glu Tyr Val Thr Val Ser Leu Leu Cys Leu Cys Val Ala Phe 65 70 75 80 ggc ggc ttc atg ttt ggc tgg gat acc agt act att tct ggg ttt gtt 288 Gly Gly Phe Met Phe Gly Trp Asp Thr Ser Thr Ile Ser Gly Phe Val 85 90 95 gtc caa aca gac ttt ttg aga agg ttt ggt atg aaa cat aag gat ggt 336 Val Gln Thr Asp Phe Leu Arg Arg Phe Gly Met Lys His Lys Asp Gly 100 105 110 acc cac tat ttg tca aac gtc aga aca ggt tta atc gtc gcc att ttc 384 Thr His Tyr Leu Ser Asn Val Arg Thr Gly Leu Ile Val Ala Ile Phe 115 120 125 aat att ggc tgt gcc ttt ggt ggt att ata ctt tcc aaa ggt gga gat 432 Asn Ile Gly Cys Ala Phe Gly Gly Ile Ile Leu Ser Lys Gly Gly Asp 130 135 140 atg tat ggc cgt aaa aag ggt ctt tcg att gtc gtc tcg gtt tat ata 480 Met Tyr Gly Arg Lys Lys Gly Leu Ser Ile Val Val Ser Val Tyr Ile 145 150 155 160 gtt ggt att atc att caa att gcc tct atc aac aag tgg tac caa tat 528 Val Gly Ile Ile Ile Gln Ile Ala Ser Ile Asn Lys Trp Tyr Gln Tyr 165 170 175 ttc att ggt aga atc ata tct ggt ttg ggt gtc ggc ggc atc gct gtc 576 Phe Ile Gly Arg Ile Ile Ser Gly Leu Gly Val Gly Gly Ile Ala Val 180 185 190 tta tgt cct atg ttg atc tct gaa att gct cca aag cac ttg aga ggc 624 Leu Cys Pro Met Leu Ile Ser Glu Ile Ala Pro Lys His Leu Arg Gly 195 200 205 aca cta gtt tct tgt tat cag ctg atg att act gca ggt atc ttt ttg 672 Thr Leu Val Ser Cys Tyr Gln Leu Met Ile Thr Ala Gly Ile Phe Leu 210 215 220 ggc tac tgt act aat tac ggt aca aag agc tat tcg aac tca gtt caa 720 Gly Tyr Cys Thr Asn Tyr Gly Thr Lys Ser Tyr Ser Asn Ser Val Gln 225 230 235 240 tgg aga gtt cca tta ggg cta tgt ttc gct tgg tca tta ttt atg att 768 Trp Arg Val Pro Leu Gly Leu Cys Phe Ala Trp Ser Leu Phe Met Ile 245 250 255 ggc gct ttg acg tta gtt cct gaa tcc cca cgt tat tta tgt gag gtg 816 Gly Ala Leu Thr Leu Val Pro Glu Ser Pro Arg Tyr Leu Cys Glu Val 260 265 270 aat aag gta gaa gac gcc aag cgt tcc att gct aag tct aac aag gtg 864 Asn Lys Val Glu Asp Ala Lys Arg Ser Ile Ala Lys Ser Asn Lys Val 275 280 285 tca cca gag gat cct gcc gtc cag gcc gag tta gat ctg atc atg gcc 912 Ser Pro Glu Asp Pro Ala Val Gln Ala Glu Leu Asp Leu Ile Met Ala 290 295 300 ggt ata gaa gct gaa aaa ctg gct ggc aat gcg tcc tgg ggg gaa tta 960 Gly Ile Glu Ala Glu Lys Leu Ala Gly Asn Ala Ser Trp Gly Glu Leu 305 310 315 320 ttt tcc acc aag acc aaa gta ttt caa cgt ttg ttg atg ggt gtg ttt 1008 Phe Ser Thr Lys Thr Lys Val Phe Gln Arg Leu Leu Met Gly Val Phe 325 330 335 gtt caa atg ttc caa caa tta acc ggt aac aat tat ttt ttc tac tac 1056 Val Gln Met Phe Gln Gln Leu Thr Gly Asn Asn Tyr Phe Phe Tyr Tyr 340 345 350 ggt acc gtt att ttc aag tca gtt ggc ctg gat gat tcc ttt gaa aca 1104 Gly Thr Val Ile Phe Lys Ser Val Gly Leu Asp Asp Ser Phe Glu Thr 355 360 365 tcc att gtc att ggt gta gtc aac ttt gcc tcc act ttc ttt agt ttg 1152 Ser Ile Val Ile Gly Val Val Asn Phe Ala Ser Thr Phe Phe Ser Leu 370 375 380 tgg act gtc gaa aac ttg ggg cgt cgt aaa tgt tta ctt ttg ggc gct 1200 Trp Thr Val Glu Asn Leu Gly Arg Arg Lys Cys Leu Leu Leu Gly Ala 385 390 395 400 gcc act atg atg gct tgt atg gtc atc tac gcc tct gtt ggt gtt act 1248 Ala Thr Met Met Ala Cys Met Val Ile Tyr Ala Ser Val Gly Val Thr 405 410 415 aga tta tat cct cac ggt aaa agc cag cca tct tct aaa ggt gcc ggt 1296 Arg Leu Tyr Pro His Gly Lys Ser Gln Pro Ser Ser Lys Gly Ala Gly 420 425 430 aac tgt atg att gtc ttt acc tgt ttt tat att ttc tgt tat gcc aca 1344 Asn Cys Met Ile Val Phe Thr Cys Phe Tyr Ile Phe Cys Tyr Ala Thr 435 440 445 acc tgg gcg cca gtt gcc tgg gtc atc aca gca gaa tca ttc cca ctg 1392 Thr Trp Ala Pro Val Ala Trp Val Ile Thr Ala Glu Ser Phe Pro Leu 450 455 460 aga gtc aag tcg aaa tgt atg gcg ttg gcc tct gct tcc aat tgg gta 1440 Arg Val Lys Ser Lys Cys Met Ala Leu Ala Ser Ala Ser Asn Trp Val 465 470 475 480 tgg ggg ttc ttg att gca ttt ttc acc cca ttc atc aca tct gcc att 1488 Trp Gly Phe Leu Ile Ala Phe Phe Thr Pro Phe Ile Thr Ser Ala Ile 485 490 495 aac ttc tac tac ggt tat gtc ttc atg ggc tgt ttg gtt gcc atg ttt 1536 Asn Phe Tyr Tyr Gly Tyr Val Phe Met Gly Cys Leu Val Ala Met Phe 500 505 510 ttt tat gtc ttt ttc ttt gtt cca gaa act aaa ggc cta tcg tta gaa 1584 Phe Tyr Val Phe Phe Phe Val Pro Glu Thr Lys Gly Leu Ser Leu Glu 515 520 525 gaa att caa gaa tta tgg gaa gaa ggt gtt tta cct tgg aaa tct gaa 1632 Glu Ile Gln Glu Leu Trp Glu Glu Gly Val Leu Pro Trp Lys Ser Glu 530 535 540 ggc tgg att cct tca tcc aga aga ggt aat aat tac gat tta gag gat 1680 Gly Trp Ile Pro Ser Ser Arg Arg Gly Asn Asn Tyr Asp Leu Glu Asp 545 550 555 560 tta caa cat gac gac aaa ccg tgg tac aag gcc atg cta gaa taa 1725 Leu Gln His Asp Asp Lys Pro Trp Tyr Lys Ala Met Leu Glu * 565 570 <210> 44 <211> 574 <212> PRT <213> Saccharomyces cerevisiae <400> 44 Met Ala Val Glu Glu Asn Asn Val Pro Val Val Ser Gln Gln Pro Gln 1 5 10 15 Ala Gly Glu Asp Val Ile Ser Ser Leu Ser Lys Asp Ser His Leu Ser 20 25 30 Ala Gln Ser Gln Lys Tyr Ser Asn Asp Glu Leu Lys Ala Gly Glu Ser 35 40 45 Gly Pro Glu Gly Ser Gln Ser Val Pro Ile Glu Ile Pro Lys Lys Pro 50 55 60 Met Ser Glu Tyr Val Thr Val Ser Leu Leu Cys Leu Cys Val Ala Phe 65 70 75 80 Gly Gly Phe Met Phe Gly Trp Asp Thr Ser Thr Ile Ser Gly Phe Val 85 90 95 Val Gln Thr Asp Phe Leu Arg Arg Phe Gly Met Lys His Lys Asp Gly 100 105 110 Thr His Tyr Leu Ser Asn Val Arg Thr Gly Leu Ile Val Ala Ile Phe 115 120 125 Asn Ile Gly Cys Ala Phe Gly Gly Ile Ile Leu Ser Lys Gly Gly Asp 130 135 140 Met Tyr Gly Arg Lys Lys Gly Leu Ser Ile Val Val Ser Val Tyr Ile 145 150 155 160 Val Gly Ile Ile Ile Gln Ile Ala Ser Ile Asn Lys Trp Tyr Gln Tyr 165 170 175 Phe Ile Gly Arg Ile Ile Ser Gly Leu Gly Val Gly Gly Ile Ala Val 180 185 190 Leu Cys Pro Met Leu Ile Ser Glu Ile Ala Pro Lys His Leu Arg Gly 195 200 205 Thr Leu Val Ser Cys Tyr Gln Leu Met Ile Thr Ala Gly Ile Phe Leu 210 215 220 Gly Tyr Cys Thr Asn Tyr Gly Thr Lys Ser Tyr Ser Asn Ser Val Gln 225 230 235 240 Trp Arg Val Pro Leu Gly Leu Cys Phe Ala Trp Ser Leu Phe Met Ile 245 250 255 Gly Ala Leu Thr Leu Val Pro Glu Ser Pro Arg Tyr Leu Cys Glu Val 260 265 270 Asn Lys Val Glu Asp Ala Lys Arg Ser Ile Ala Lys Ser Asn Lys Val 275 280 285 Ser Pro Glu Asp Pro Ala Val Gln Ala Glu Leu Asp Leu Ile Met Ala 290 295 300 Gly Ile Glu Ala Glu Lys Leu Ala Gly Asn Ala Ser Trp Gly Glu Leu 305 310 315 320 Phe Ser Thr Lys Thr Lys Val Phe Gln Arg Leu Leu Met Gly Val Phe 325 330 335 Val Gln Met Phe Gln Gln Leu Thr Gly Asn Asn Tyr Phe Phe Tyr Tyr 340 345 350 Gly Thr Val Ile Phe Lys Ser Val Gly Leu Asp Asp Ser Phe Glu Thr 355 360 365 Ser Ile Val Ile Gly Val Val Asn Phe Ala Ser Thr Phe Phe Ser Leu 370 375 380 Trp Thr Val Glu Asn Leu Gly Arg Arg Lys Cys Leu Leu Leu Gly Ala 385 390 395 400 Ala Thr Met Met Ala Cys Met Val Ile Tyr Ala Ser Val Gly Val Thr 405 410 415 Arg Leu Tyr Pro His Gly Lys Ser Gln Pro Ser Ser Lys Gly Ala Gly 420 425 430 Asn Cys Met Ile Val Phe Thr Cys Phe Tyr Ile Phe Cys Tyr Ala Thr 435 440 445 Thr Trp Ala Pro Val Ala Trp Val Ile Thr Ala Glu Ser Phe Pro Leu 450 455 460 Arg Val Lys Ser Lys Cys Met Ala Leu Ala Ser Ala Ser Asn Trp Val 465 470 475 480 Trp Gly Phe Leu Ile Ala Phe Phe Thr Pro Phe Ile Thr Ser Ala Ile 485 490 495 Asn Phe Tyr Tyr Gly Tyr Val Phe Met Gly Cys Leu Val Ala Met Phe 500 505 510 Phe Tyr Val Phe Phe Phe Val Pro Glu Thr Lys Gly Leu Ser Leu Glu 515 520 525 Glu Ile Gln Glu Leu Trp Glu Glu Gly Val Leu Pro Trp Lys Ser Glu 530 535 540 Gly Trp Ile Pro Ser Ser Arg Arg Gly Asn Asn Tyr Asp Leu Glu Asp 545 550 555 560 Leu Gln His Asp Asp Lys Pro Trp Tyr Lys Ala Met Leu Glu 565 570 <210> 45 <211> 2100 <212> DNA <213> Saccharomyces cerevisiae <220> <221> CDS <222> (1)...(2100) <223> DNA encodes ScGAL10 <400> 45 atg aca gct cag tta caa agt gaa agt act tct aaa att gtt ttg gtt 48 Met Thr Ala Gln Leu Gln Ser Glu Ser Thr Ser Lys Ile Val Leu Val 1 5 10 15 aca ggt ggt gct gga tac att ggt tca cac act gtg gta gag cta att 96 Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Thr Val Val Glu Leu Ile 20 25 30 gag aat gga tat gac tgt gtt gtt gct gat aac ctg tcg aat tca act 144 Glu Asn Gly Tyr Asp Cys Val Val Ala Asp Asn Leu Ser Asn Ser Thr 35 40 45 tat gat tct gta gcc agg tta gag gtc ttg acc aag cat cac att ccc 192 Tyr Asp Ser Val Ala Arg Leu Glu Val Leu Thr Lys His His Ile Pro 50 55 60 ttc tat gag gtt gat ttg tgt gac cga aaa ggt ctg gaa aag gtt ttc 240 Phe Tyr Glu Val Asp Leu Cys Asp Arg Lys Gly Leu Glu Lys Val Phe 65 70 75 80 aaa gaa tat aaa att gat tcg gta att cac ttt gct ggt tta aag gct 288 Lys Glu Tyr Lys Ile Asp Ser Val Ile His Phe Ala Gly Leu Lys Ala 85 90 95 gta ggt gaa tct aca caa atc ccg ctg aga tac tat cac aat aac att 336 Val Gly Glu Ser Thr Gln Ile Pro Leu Arg Tyr Tyr His Asn Asn Ile 100 105 110 ttg gga act gtc gtt tta tta gag tta atg caa caa tac aac gtt tcc 384 Leu Gly Thr Val Val Leu Leu Glu Leu Met Gln Gln Tyr Asn Val Ser 115 120 125 aaa ttt gtt ttt tca tct tct gct act gtc tat ggt gat gct acg aga 432 Lys Phe Val Phe Ser Ser Ser Ala Thr Val Tyr Gly Asp Ala Thr Arg 130 135 140 ttc cca aat atg att cct atc cca gaa gaa tgt ccc tta ggg cct act 480 Phe Pro Asn Met Ile Pro Ile Pro Glu Glu Cys Pro Leu Gly Pro Thr 145 150 155 160 aat ccg tat ggt cat acg aaa tac gcc att gag aat atc ttg aat gat 528 Asn Pro Tyr Gly His Thr Lys Tyr Ala Ile Glu Asn Ile Leu Asn Asp 165 170 175 ctt tac aat agc gac aaa aaa agt tgg aag ttt gct atc ttg cgt tat 576 Leu Tyr Asn Ser Asp Lys Lys Ser Trp Lys Phe Ala Ile Leu Arg Tyr 180 185 190 ttt aac cca att ggc gca cat ccc tct gga tta atc gga gaa gat ccg 624 Phe Asn Pro Ile Gly Ala His Pro Ser Gly Leu Ile Gly Glu Asp Pro 195 200 205 cta ggt ata cca aac aat ttg ttg cca tat atg gct caa gta gct gtt 672 Leu Gly Ile Pro Asn Asn Leu Leu Pro Tyr Met Ala Gln Val Ala Val 210 215 220 ggt agg cgc gag aag ctt tac atc ttc gga gac gat tat gat tcc aga 720 Gly Arg Arg Glu Lys Leu Tyr Ile Phe Gly Asp Asp Tyr Asp Ser Arg 225 230 235 240 gat ggt acc ccg atc agg gat tat atc cac gta gtt gat cta gca aaa 768 Asp Gly Thr Pro Ile Arg Asp Tyr Ile His Val Val Asp Leu Ala Lys 245 250 255 ggt cat att gca gcc ctg caa tac cta gag gcc tac aat gaa aat gaa 816 Gly His Ile Ala Ala Leu Gln Tyr Leu Glu Ala Tyr Asn Glu Asn Glu 260 265 270 ggt ttg tgt cgt gag tgg aac ttg ggt tcc ggt aaa ggt tct aca gtt 864 Gly Leu Cys Arg Glu Trp Asn Leu Gly Ser Gly Lys Gly Ser Thr Val 275 280 285 ttt gaa gtt tat cat gca ttc tgc aaa gct tct ggt att gat ctt cca 912 Phe Glu Val Tyr His Ala Phe Cys Lys Ala Ser Gly Ile Asp Leu Pro 290 295 300 tac aaa gtt acg ggc aga aga gca ggt gat gtt ttg aac ttg acg gct 960 Tyr Lys Val Thr Gly Arg Arg Ala Gly Asp Val Leu Asn Leu Thr Ala 305 310 315 320 aaa cca gat agg gcc aaa cgc gaa ctg aaa tgg cag acc gag ttg cag 1008 Lys Pro Asp Arg Ala Lys Arg Glu Leu Lys Trp Gln Thr Glu Leu Gln 325 330 335 gtt gaa gac tcc tgc aag gat tta tgg aaa tgg act act gag aat cct 1056 Val Glu Asp Ser Cys Lys Asp Leu Trp Lys Trp Thr Thr Glu Asn Pro 340 345 350 ttt ggt tac cag tta agg ggt gtc gag gcc aga ttt tcc gct gaa gat 1104 Phe Gly Tyr Gln Leu Arg Gly Val Glu Ala Arg Phe Ser Ala Glu Asp 355 360 365 atg cgt tat gac gca aga ttt gtg act att ggt gcc ggc acc aga ttt 1152 Met Arg Tyr Asp Ala Arg Phe Val Thr Ile Gly Ala Gly Thr Arg Phe 370 375 380 caa gcc acg ttt gcc aat ttg ggc gcc agc att gtt gac ctg aaa gtg 1200 Gln Ala Thr Phe Ala Asn Leu Gly Ala Ser Ile Val Asp Leu Lys Val 385 390 395 400 aac gga caa tca gtt gtt ctt ggc tat gaa aat gag gaa ggg tat ttg 1248 Asn Gly Gln Ser Val Val Leu Gly Tyr Glu Asn Glu Glu Gly Tyr Leu 405 410 415 aat cct gat agt gct tat ata ggc gcc acg atc ggc agg tat gct aat 1296 Asn Pro Asp Ser Ala Tyr Ile Gly Ala Thr Ile Gly Arg Tyr Ala Asn 420 425 430 cgt att tcg aag ggt aag ttt agt tta tgc aac aaa gac tat cag tta 1344 Arg Ile Ser Lys Gly Lys Phe Ser Leu Cys Asn Lys Asp Tyr Gln Leu 435 440 445 acc gtt aat aac ggc gtt aat gcg aat cat agt agt atc ggt tct ttc 1392 Thr Val Asn Asn Gly Val Asn Ala Asn His Ser Ser Ile Gly Ser Phe 450 455 460 cac aga aaa aga ttt ttg gga ccc atc att caa aat cct tca aag gat 1440 His Arg Lys Arg Phe Leu Gly Pro Ile Ile Gln Asn Pro Ser Lys Asp 465 470 475 480 gtt ttt acc gcc gag tac atg ctg ata gat aat gag aag gac acc gaa 1488 Val Phe Thr Ala Glu Tyr Met Leu Ile Asp Asn Glu Lys Asp Thr Glu 485 490 495 ttt cca ggt gat cta ttg gta acc ata cag tat act gtg aac gtt gcc 1536 Phe Pro Gly Asp Leu Leu Val Thr Ile Gln Tyr Thr Val Asn Val Ala 500 505 510 caa aaa agt ttg gaa atg gta tat aaa ggt aaa ttg act gct ggt gaa 1584 Gln Lys Ser Leu Glu Met Val Tyr Lys Gly Lys Leu Thr Ala Gly Glu 515 520 525 gcg acg cca ata aat tta aca aat cat agt tat ttc aat ctg aac aag 1632 Ala Thr Pro Ile Asn Leu Thr Asn His Ser Tyr Phe Asn Leu Asn Lys 530 535 540 cca tat gga gac act att gag ggt acg gag att atg gtg cgt tca aaa 1680 Pro Tyr Gly Asp Thr Ile Glu Gly Thr Glu Ile Met Val Arg Ser Lys 545 550 555 560 aaa tct gtt gat gtc gac aaa aac atg att cct acg ggt aat atc gtc 1728 Lys Ser Val Asp Val Asp Lys Asn Met Ile Pro Thr Gly Asn Ile Val 565 570 575 gat aga gaa att gct acc ttt aac tct aca aag cca acg gtc tta ggc 1776 Asp Arg Glu Ile Ala Thr Phe Asn Ser Thr Lys Pro Thr Val Leu Gly 580 585 590 ccc aaa aat ccc cag ttt gat tgt tgt ttt gtg gtg gat gaa aat gct 1824 Pro Lys Asn Pro Gln Phe Asp Cys Cys Phe Val Val Asp Glu Asn Ala 595 600 605 aag cca agt caa atc aat act cta aac aat gaa ttg acg ctt att gtc 1872 Lys Pro Ser Gln Ile Asn Thr Leu Asn Asn Glu Leu Thr Leu Ile Val 610 615 620 aag gct ttt cat ccc gat tcc aat att aca tta gaa gtt tta agt aca 1920 Lys Ala Phe His Pro Asp Ser Asn Ile Thr Leu Glu Val Leu Ser Thr 625 630 635 640 gag cca act tat caa ttt tat acc ggt gat ttc ttg tct gct ggt tac 1968 Glu Pro Thr Tyr Gln Phe Tyr Thr Gly Asp Phe Leu Ser Ala Gly Tyr 645 650 655 gaa gca aga caa ggt ttt gca att gag cct ggt aga tac att gat gct 2016 Glu Ala Arg Gln Gly Phe Ala Ile Glu Pro Gly Arg Tyr Ile Asp Ala 660 665 670 atc aat caa gag aac tgg aaa gat tgt gta acc ttg aaa aac ggt gaa 2064 Ile Asn Gln Glu Asn Trp Lys Asp Cys Val Thr Leu Lys Asn Gly Glu 675 680 685 act tac ggg tcc aag att gtc tac aga ttt tcc tga 2100 Thr Tyr Gly Ser Lys Ile Val Tyr Arg Phe Ser * 690 695 <210> 46 <211> 699 <212> PRT <213> Saccharomyces cerevisiae <400> 46 Met Thr Ala Gln Leu Gln Ser Glu Ser Thr Ser Lys Ile Val Leu Val 1 5 10 15 Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Thr Val Val Glu Leu Ile 20 25 30 Glu Asn Gly Tyr Asp Cys Val Val Ala Asp Asn Leu Ser Asn Ser Thr 35 40 45 Tyr Asp Ser Val Ala Arg Leu Glu Val Leu Thr Lys His His Ile Pro 50 55 60 Phe Tyr Glu Val Asp Leu Cys Asp Arg Lys Gly Leu Glu Lys Val Phe 65 70 75 80 Lys Glu Tyr Lys Ile Asp Ser Val Ile His Phe Ala Gly Leu Lys Ala 85 90 95 Val Gly Glu Ser Thr Gln Ile Pro Leu Arg Tyr Tyr His Asn Asn Ile 100 105 110 Leu Gly Thr Val Val Leu Leu Glu Leu Met Gln Gln Tyr Asn Val Ser 115 120 125 Lys Phe Val Phe Ser Ser Ser Ala Thr Val Tyr Gly Asp Ala Thr Arg 130 135 140 Phe Pro Asn Met Ile Pro Ile Pro Glu Glu Cys Pro Leu Gly Pro Thr 145 150 155 160 Asn Pro Tyr Gly His Thr Lys Tyr Ala Ile Glu Asn Ile Leu Asn Asp 165 170 175 Leu Tyr Asn Ser Asp Lys Lys Ser Trp Lys Phe Ala Ile Leu Arg Tyr 180 185 190 Phe Asn Pro Ile Gly Ala His Pro Ser Gly Leu Ile Gly Glu Asp Pro 195 200 205 Leu Gly Ile Pro Asn Asn Leu Leu Pro Tyr Met Ala Gln Val Ala Val 210 215 220 Gly Arg Arg Glu Lys Leu Tyr Ile Phe Gly Asp Asp Tyr Asp Ser Arg 225 230 235 240 Asp Gly Thr Pro Ile Arg Asp Tyr Ile His Val Val Asp Leu Ala Lys 245 250 255 Gly His Ile Ala Ala Leu Gln Tyr Leu Glu Ala Tyr Asn Glu Asn Glu 260 265 270 Gly Leu Cys Arg Glu Trp Asn Leu Gly Ser Gly Lys Gly Ser Thr Val 275 280 285 Phe Glu Val Tyr His Ala Phe Cys Lys Ala Ser Gly Ile Asp Leu Pro 290 295 300 Tyr Lys Val Thr Gly Arg Arg Ala Gly Asp Val Leu Asn Leu Thr Ala 305 310 315 320 Lys Pro Asp Arg Ala Lys Arg Glu Leu Lys Trp Gln Thr Glu Leu Gln 325 330 335 Val Glu Asp Ser Cys Lys Asp Leu Trp Lys Trp Thr Thr Glu Asn Pro 340 345 350 Phe Gly Tyr Gln Leu Arg Gly Val Glu Ala Arg Phe Ser Ala Glu Asp 355 360 365 Met Arg Tyr Asp Ala Arg Phe Val Thr Ile Gly Ala Gly Thr Arg Phe 370 375 380 Gln Ala Thr Phe Ala Asn Leu Gly Ala Ser Ile Val Asp Leu Lys Val 385 390 395 400 Asn Gly Gln Ser Val Val Leu Gly Tyr Glu Asn Glu Glu Gly Tyr Leu 405 410 415 Asn Pro Asp Ser Ala Tyr Ile Gly Ala Thr Ile Gly Arg Tyr Ala Asn 420 425 430 Arg Ile Ser Lys Gly Lys Phe Ser Leu Cys Asn Lys Asp Tyr Gln Leu 435 440 445 Thr Val Asn Asn Gly Val Asn Ala Asn His Ser Ser Ile Gly Ser Phe 450 455 460 His Arg Lys Arg Phe Leu Gly Pro Ile Ile Gln Asn Pro Ser Lys Asp 465 470 475 480 Val Phe Thr Ala Glu Tyr Met Leu Ile Asp Asn Glu Lys Asp Thr Glu 485 490 495 Phe Pro Gly Asp Leu Leu Val Thr Ile Gln Tyr Thr Val Asn Val Ala 500 505 510 Gln Lys Ser Leu Glu Met Val Tyr Lys Gly Lys Leu Thr Ala Gly Glu 515 520 525 Ala Thr Pro Ile Asn Leu Thr Asn His Ser Tyr Phe Asn Leu Asn Lys 530 535 540 Pro Tyr Gly Asp Thr Ile Glu Gly Thr Glu Ile Met Val Arg Ser Lys 545 550 555 560 Lys Ser Val Asp Val Asp Lys Asn Met Ile Pro Thr Gly Asn Ile Val 565 570 575 Asp Arg Glu Ile Ala Thr Phe Asn Ser Thr Lys Pro Thr Val Leu Gly 580 585 590 Pro Lys Asn Pro Gln Phe Asp Cys Cys Phe Val Val Asp Glu Asn Ala 595 600 605 Lys Pro Ser Gln Ile Asn Thr Leu Asn Asn Glu Leu Thr Leu Ile Val 610 615 620 Lys Ala Phe His Pro Asp Ser Asn Ile Thr Leu Glu Val Leu Ser Thr 625 630 635 640 Glu Pro Thr Tyr Gln Phe Tyr Thr Gly Asp Phe Leu Ser Ala Gly Tyr 645 650 655 Glu Ala Arg Gln Gly Phe Ala Ile Glu Pro Gly Arg Tyr Ile Asp Ala 660 665 670 Ile Asn Gln Glu Asn Trp Lys Asp Cys Val Thr Leu Lys Asn Gly Glu 675 680 685 Thr Tyr Gly Ser Lys Ile Val Tyr Arg Phe Ser 690 695 <210> 47 <211> 1047 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (1)...(1047) <223> DNA encodes human GalE <400> 47 atg gca gag aag gtg ctg gta aca ggt ggg gct ggc tac att ggc agc 48 Met Ala Glu Lys Val Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser 1 5 10 15 cac acg gtg ctg gag ctg ctg gag gct ggc tac ttg cct gtg gtc atc 96 His Thr Val Leu Glu Leu Leu Glu Ala Gly Tyr Leu Pro Val Val Ile 20 25 30 gat aac ttc cat aat gcc ttc cgt gga ggg ggc tcc ctg cct gag agc 144 Asp Asn Phe His Asn Ala Phe Arg Gly Gly Gly Ser Leu Pro Glu Ser 35 40 45 ctg cgg cgg gtc cag gag ctg aca ggc cgc tct gtg gag ttt gag gag 192 Leu Arg Arg Val Gln Glu Leu Thr Gly Arg Ser Val Glu Phe Glu Glu 50 55 60 atg gac att ttg gac cag gga gcc cta cag cgt ctc ttc aaa aag tac 240 Met Asp Ile Leu Asp Gln Gly Ala Leu Gln Arg Leu Phe Lys Lys Tyr 65 70 75 80 agc ttt atg gcg gtc atc cac ttt gcg ggg ctc aag gcc gtg ggc gag 288 Ser Phe Met Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly Glu 85 90 95 tcg gtg cag aag cct ctg gat tat tac aga gtt aac ctg acc ggg acc 336 Ser Val Gln Lys Pro Leu Asp Tyr Tyr Arg Val Asn Leu Thr Gly Thr 100 105 110 atc cag ctt ctg gag atc atg aag gcc cac ggg gtg aag aac ctg gtg 384 Ile Gln Leu Leu Glu Ile Met Lys Ala His Gly Val Lys Asn Leu Val 115 120 125 ttc agc agc tca gcc act gtg tac ggg aac ccc cag tac ctg ccc ctt 432 Phe Ser Ser Ser Ala Thr Val Tyr Gly Asn Pro Gln Tyr Leu Pro Leu 130 135 140 gat gag gcc cac ccc acg ggt ggt tgt acc aac cct tac ggc aag tcc 480 Asp Glu Ala His Pro Thr Gly Gly Cys Thr Asn Pro Tyr Gly Lys Ser 145 150 155 160 aag ttc ttc atc gag gaa atg atc cgg gac ctg tgc cag gca gac aag 528 Lys Phe Phe Ile Glu Glu Met Ile Arg Asp Leu Cys Gln Ala Asp Lys 165 170 175 act tgg aac gca gtg ctg ctg cgc tat ttc aac ccc aca ggt gcc cat 576 Thr Trp Asn Ala Val Leu Leu Arg Tyr Phe Asn Pro Thr Gly Ala His 180 185 190 gcc tct ggc tgc att ggt gag gat ccc cag ggc ata ccc aac aac ctc 624 Ala Ser Gly Cys Ile Gly Glu Asp Pro Gln Gly Ile Pro Asn Asn Leu 195 200 205 atg cct tat gtc tcc cag gtg gcg atc ggg cga cgg gag gcc ctg aat 672 Met Pro Tyr Val Ser Gln Val Ala Ile Gly Arg Arg Glu Ala Leu Asn 210 215 220 gtc ttt ggc aat gac tat gac aca gag gat ggc aca ggt gtc cgg gat 720 Val Phe Gly Asn Asp Tyr Asp Thr Glu Asp Gly Thr Gly Val Arg Asp 225 230 235 240 tac atc cat gtc gtg gat ctg gcc aag ggc cac att gca gcc tta agg 768 Tyr Ile His Val Val Asp Leu Ala Lys Gly His Ile Ala Ala Leu Arg 245 250 255 aag ctg aaa gaa cag tgt ggc tgc cgg atc tac aac ctg ggc acg ggc 816 Lys Leu Lys Glu Gln Cys Gly Cys Arg Ile Tyr Asn Leu Gly Thr Gly 260 265 270 aca ggc tat tca gtg ctg cag atg gtc cag gct atg gag aag gcc tct 864 Thr Gly Tyr Ser Val Leu Gln Met Val Gln Ala Met Glu Lys Ala Ser 275 280 285 ggg aag aag atc ccg tac aag gtg gtg gca cgg cgg gaa ggt gat gtg 912 Gly Lys Lys Ile Pro Tyr Lys Val Val Ala Arg Arg Glu Gly Asp Val 290 295 300 gca gcc tgt tac gcc aac ccc agc ctg gcc caa gag gag ctg ggg tgg 960 Ala Ala Cys Tyr Ala Asn Pro Ser Leu Ala Gln Glu Glu Leu Gly Trp 305 310 315 320 aca gca gcc tta ggg ctg gac agg atg tgt gag gat ctc tgg cgc tgg 1008 Thr Ala Ala Leu Gly Leu Asp Arg Met Cys Glu Asp Leu Trp Arg Trp 325 330 335 cag aag cag aat cct tca ggc ttt ggc acg caa gcc tga 1047 Gln Lys Gln Asn Pro Ser Gly Phe Gly Thr Gln Ala * 340 345 <210> 48 <211> 348 <212> PRT <213> Homo sapiens <400> 48 Met Ala Glu Lys Val Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser 1 5 10 15 His Thr Val Leu Glu Leu Leu Glu Ala Gly Tyr Leu Pro Val Val Ile 20 25 30 Asp Asn Phe His Asn Ala Phe Arg Gly Gly Gly Ser Leu Pro Glu Ser 35 40 45 Leu Arg Arg Val Gln Glu Leu Thr Gly Arg Ser Val Glu Phe Glu Glu 50 55 60 Met Asp Ile Leu Asp Gln Gly Ala Leu Gln Arg Leu Phe Lys Lys Tyr 65 70 75 80 Ser Phe Met Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly Glu 85 90 95 Ser Val Gln Lys Pro Leu Asp Tyr Tyr Arg Val Asn Leu Thr Gly Thr 100 105 110 Ile Gln Leu Leu Glu Ile Met Lys Ala His Gly Val Lys Asn Leu Val 115 120 125 Phe Ser Ser Ser Ala Thr Val Tyr Gly Asn Pro Gln Tyr Leu Pro Leu 130 135 140 Asp Glu Ala His Pro Thr Gly Gly Cys Thr Asn Pro Tyr Gly Lys Ser 145 150 155 160 Lys Phe Phe Ile Glu Glu Met Ile Arg Asp Leu Cys Gln Ala Asp Lys 165 170 175 Thr Trp Asn Ala Val Leu Leu Arg Tyr Phe Asn Pro Thr Gly Ala His 180 185 190 Ala Ser Gly Cys Ile Gly Glu Asp Pro Gln Gly Ile Pro Asn Asn Leu 195 200 205 Met Pro Tyr Val Ser Gln Val Ala Ile Gly Arg Arg Glu Ala Leu Asn 210 215 220 Val Phe Gly Asn Asp Tyr Asp Thr Glu Asp Gly Thr Gly Val Arg Asp 225 230 235 240 Tyr Ile His Val Val Asp Leu Ala Lys Gly His Ile Ala Ala Leu Arg 245 250 255 Lys Leu Lys Glu Gln Cys Gly Cys Arg Ile Tyr Asn Leu Gly Thr Gly 260 265 270 Thr Gly Tyr Ser Val Leu Gln Met Val Gln Ala Met Glu Lys Ala Ser 275 280 285 Gly Lys Lys Ile Pro Tyr Lys Val Val Ala Arg Arg Glu Gly Asp Val 290 295 300 Ala Ala Cys Tyr Ala Asn Pro Ser Leu Ala Gln Glu Glu Leu Gly Trp 305 310 315 320 Thr Ala Ala Leu Gly Leu Asp Arg Met Cys Glu Asp Leu Trp Arg Trp 325 330 335 Gln Lys Gln Asn Pro Ser Gly Phe Gly Thr Gln Ala 340 345 <210> 49 <211> 1068 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes hGalT I catalytic domain <220> <221> CDS <222> (1)...(1068) <223> hGalT catalytic domain <400> 49 ggc cgc gac ctg agc cgc ctg ccc caa ctg gtc gga gtc tcc aca ccg 48 Gly Arg Asp Leu Ser Arg Leu Pro Gln Leu Val Gly Val Ser Thr Pro 1 5 10 15 ctg cag ggc ggc tcg aac agt gcc gcc gcc atc ggg cag tcc tcc ggg 96 Leu Gln Gly Gly Ser Asn Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly 20 25 30 gag ctc cgg acc gga ggg gcc cgg ccg ccg cct cct cta ggc gcc tcc 144 Glu Leu Arg Thr Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser 35 40 45 tcc cag ccg cgc ccg ggt ggc gac tcc agc cca gtc gtg gat tct ggc 192 Ser Gln Pro Arg Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly 50 55 60 cct ggc ccc gct agc aac ttg acc tcg gtc cca gtg ccc cac acc acc 240 Pro Gly Pro Ala Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr 65 70 75 80 gca ctg tcg ctg ccc gcc tgc cct gag gag tcc ccg ctg ctt gtg ggc 288 Ala Leu Ser Leu Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly 85 90 95 ccc atg ctg att gag ttt aac atg cct gtg gac ctg gag ctc gtg gca 336 Pro Met Leu Ile Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala 100 105 110 aag cag aac cca aat gtg aag atg ggc ggc cgc tat gcc ccc agg gac 384 Lys Gln Asn Pro Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp 115 120 125 tgc gtc tct cct cac aag gtg gcc atc atc att cca ttc cgc aac cgg 432 Cys Val Ser Pro His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg 130 135 140 cag gag cac ctc aag tac tgg cta tat tat ttg cac cca gtc ctg cag 480 Gln Glu His Leu Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln 145 150 155 160 cgc cag cag ctg gac tat ggc atc tat gtt atc aac cag gcg gga gac 528 Arg Gln Gln Leu Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp 165 170 175 act ata ttc aat cgt gct aag ctc ctc aat gtt ggc ttt caa gaa gcc 576 Thr Ile Phe Asn Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala 180 185 190 ttg aag gac tat gac tac acc tgc ttt gtg ttt agt gac gtg gac ctc 624 Leu Lys Asp Tyr Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu 195 200 205 att cca atg aat gac cat aat gcg tac agg tgt ttt tca cag cca cgg 672 Ile Pro Met Asn Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg 210 215 220 cac att tcc gtt gca atg gat aag ttt gga ttc agc cta cct tat gtt 720 His Ile Ser Val Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val 225 230 235 240 cag tat ttt gga ggt gtc tct gct cta agt aaa caa cag ttt cta acc 768 Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr 245 250 255 atc aat gga ttt cct aat aat tat tgg ggc tgg gga gga gaa gat gat 816 Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp 260 265 270 gac att ttt aac aga tta gtt ttt aga ggc atg tct ata tct cgc cca 864 Asp Ile Phe Asn Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro 275 280 285 aat gct gtg gtc ggg agg tgt cgc atg atc cgc cac tca aga gac aag 912 Asn Ala Val Val Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys 290 295 300 aaa aat gaa ccc aat cct cag agg ttt gac cga att gca cac aca aag 960 Lys Asn Glu Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys 305 310 315 320 gag aca atg ctc tct gat ggt ttg aac tca ctc acc tac cag gtg ctg 1008 Glu Thr Met Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu 325 330 335 gat gta cag aga tac cca ttg tat acc caa atc aca gtg gac atc ggg 1056 Asp Val Gln Arg Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly 340 345 350 aca ccg agc tag 1068 Thr Pro Ser * 355 <210> 50 <211> 355 <212> PRT <213> Artificial Sequence <400> 50 Gly Arg Asp Leu Ser Arg Leu Pro Gln Leu Val Gly Val Ser Thr Pro 1 5 10 15 Leu Gln Gly Gly Ser Asn Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly 20 25 30 Glu Leu Arg Thr Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser 35 40 45 Ser Gln Pro Arg Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly 50 55 60 Pro Gly Pro Ala Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr 65 70 75 80 Ala Leu Ser Leu Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly 85 90 95 Pro Met Leu Ile Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala 100 105 110 Lys Gln Asn Pro Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp 115 120 125 Cys Val Ser Pro His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg 130 135 140 Gln Glu His Leu Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln 145 150 155 160 Arg Gln Gln Leu Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp 165 170 175 Thr Ile Phe Asn Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala 180 185 190 Leu Lys Asp Tyr Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu 195 200 205 Ile Pro Met Asn Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg 210 215 220 His Ile Ser Val Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val 225 230 235 240 Gln Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr 245 250 255 Ile Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp 260 265 270 Asp Ile Phe Asn Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro 275 280 285 Asn Ala Val Val Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys 290 295 300 Lys Asn Glu Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys 305 310 315 320 Glu Thr Met Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu 325 330 335 Asp Val Gln Arg Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly 340 345 350 Thr Pro Ser 355 <210> 51 <211> 1224 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes hGnT I catalytic domain codon-optimized <220> <221> CDS <222> (1)...(1224) <223> hGnT I catalytic domain <400> 51 tca gtc agt gct ctt gat ggt gac cca gca agt ttg acc aga gaa gtg 48 Ser Val Ser Ala Leu Asp Gly Asp Pro Ala Ser Leu Thr Arg Glu Val 1 5 10 15 att aga ttg gcc caa gac gca gag gtg gag ttg gag aga caa cgt gga 96 Ile Arg Leu Ala Gln Asp Ala Glu Val Glu Leu Glu Arg Gln Arg Gly 20 25 30 ctg ctg cag caa atc gga gat gca ttg tct agt caa aga ggt agg gtg 144 Leu Leu Gln Gln Ile Gly Asp Ala Leu Ser Ser Gln Arg Gly Arg Val 35 40 45 cct acc gca gct cct cca gca cag cct aga gtg cat gtg acc cct gca 192 Pro Thr Ala Ala Pro Pro Ala Gln Pro Arg Val His Val Thr Pro Ala 50 55 60 cca gct gtg att cct atc ttg gtc atc gcc tgt gac aga tct act gtt 240 Pro Ala Val Ile Pro Ile Leu Val Ile Ala Cys Asp Arg Ser Thr Val 65 70 75 80 aga aga tgt ctg gac aag ctg ttg cat tac aga cca tct gct gag ttg 288 Arg Arg Cys Leu Asp Lys Leu Leu His Tyr Arg Pro Ser Ala Glu Leu 85 90 95 ttc cct atc atc gtt agt caa gac tgt ggt cac gag gag act gcc caa 336 Phe Pro Ile Ile Val Ser Gln Asp Cys Gly His Glu Glu Thr Ala Gln 100 105 110 gcc atc gcc tcc tac gga tct gct gtc act cac atc aga cag cct gac 384 Ala Ile Ala Ser Tyr Gly Ser Ala Val Thr His Ile Arg Gln Pro Asp 115 120 125 ctg tca tct att gct gtg cca cca gac cac aga aag ttc caa ggt tac 432 Leu Ser Ser Ile Ala Val Pro Pro Asp His Arg Lys Phe Gln Gly Tyr 130 135 140 tac aag atc gct aga cac tac aga tgg gca ttg ggt caa gtc ttc aga 480 Tyr Lys Ile Ala Arg His Tyr Arg Trp Ala Leu Gly Gln Val Phe Arg 145 150 155 160 cag ttt aga ttc cct gct gct gtg gtg gtg gag gat gac ttg gag gtg 528 Gln Phe Arg Phe Pro Ala Ala Val Val Val Glu Asp Asp Leu Glu Val 165 170 175 gct cct gac ttc ttt gag tac ttt aga gca acc tat cca ttg ctg aag 576 Ala Pro Asp Phe Phe Glu Tyr Phe Arg Ala Thr Tyr Pro Leu Leu Lys 180 185 190 gca gac cca tcc ctg tgg tgt gtc tct gcc tgg aat gac aac ggt aag 624 Ala Asp Pro Ser Leu Trp Cys Val Ser Ala Trp Asn Asp Asn Gly Lys 195 200 205 gag caa atg gtg gac gct tct agg cct gag ctg ttg tac aga acc gac 672 Glu Gln Met Val Asp Ala Ser Arg Pro Glu Leu Leu Tyr Arg Thr Asp 210 215 220 ttc ttt cct ggt ctg gga tgg ttg ctg ttg gct gag ttg tgg gct gag 720 Phe Phe Pro Gly Leu Gly Trp Leu Leu Leu Ala Glu Leu Trp Ala Glu 225 230 235 240 ttg gag cct aag tgg cca aag gca ttc tgg gac gac tgg atg aga aga 768 Leu Glu Pro Lys Trp Pro Lys Ala Phe Trp Asp Asp Trp Met Arg Arg 245 250 255 cct gag caa aga cag ggt aga gcc tgt atc aga cct gag atc tca aga 816 Pro Glu Gln Arg Gln Gly Arg Ala Cys Ile Arg Pro Glu Ile Ser Arg 260 265 270 acc atg acc ttt ggt aga aag gga gtg tct cac ggt caa ttc ttt gac 864 Thr Met Thr Phe Gly Arg Lys Gly Val Ser His Gly Gln Phe Phe Asp 275 280 285 caa cac ttg aag ttt atc aag ctg aac cag caa ttt gtg cac ttc acc 912 Gln His Leu Lys Phe Ile Lys Leu Asn Gln Gln Phe Val His Phe Thr 290 295 300 caa ctg gac ctg tct tac ttg cag aga gag gcc tat gac aga gat ttc 960 Gln Leu Asp Leu Ser Tyr Leu Gln Arg Glu Ala Tyr Asp Arg Asp Phe 305 310 315 320 cta gct aga gtc tac gga gct cct caa ctg caa gtg gag aaa gtg agg 1008 Leu Ala Arg Val Tyr Gly Ala Pro Gln Leu Gln Val Glu Lys Val Arg 325 330 335 acc aat gac aga aag gag ttg gga gag gtg aga gtg cag tac act ggt 1056 Thr Asn Asp Arg Lys Glu Leu Gly Glu Val Arg Val Gln Tyr Thr Gly 340 345 350 agg gac tcc ttt aag gct ttc gct aag gct ctg ggt gtc atg gat gac 1104 Arg Asp Ser Phe Lys Ala Phe Ala Lys Ala Leu Gly Val Met Asp Asp 355 360 365 ctt aag tct gga gtt cct aga gct ggt tac aga ggt att gtc acc ttt 1152 Leu Lys Ser Gly Val Pro Arg Ala Gly Tyr Arg Gly Ile Val Thr Phe 370 375 380 caa ttc aga ggt aga aga gtc cac ttg gct cct cca cct act tgg gag 1200 Gln Phe Arg Gly Arg Arg Val His Leu Ala Pro Pro Pro Thr Trp Glu 385 390 395 400 ggt tat gat cct tct tgg aat tag 1224 Gly Tyr Asp Pro Ser Trp Asn * 405 <210> 52 <211> 407 <212> PRT <213> Artificial Sequence <400> 52 Ser Val Ser Ala Leu Asp Gly Asp Pro Ala Ser Leu Thr Arg Glu Val 1 5 10 15 Ile Arg Leu Ala Gln Asp Ala Glu Val Glu Leu Glu Arg Gln Arg Gly 20 25 30 Leu Leu Gln Gln Ile Gly Asp Ala Leu Ser Ser Gln Arg Gly Arg Val 35 40 45 Pro Thr Ala Ala Pro Pro Ala Gln Pro Arg Val His Val Thr Pro Ala 50 55 60 Pro Ala Val Ile Pro Ile Leu Val Ile Ala Cys Asp Arg Ser Thr Val 65 70 75 80 Arg Arg Cys Leu Asp Lys Leu Leu His Tyr Arg Pro Ser Ala Glu Leu 85 90 95 Phe Pro Ile Ile Val Ser Gln Asp Cys Gly His Glu Glu Thr Ala Gln 100 105 110 Ala Ile Ala Ser Tyr Gly Ser Ala Val Thr His Ile Arg Gln Pro Asp 115 120 125 Leu Ser Ser Ile Ala Val Pro Pro Asp His Arg Lys Phe Gln Gly Tyr 130 135 140 Tyr Lys Ile Ala Arg His Tyr Arg Trp Ala Leu Gly Gln Val Phe Arg 145 150 155 160 Gln Phe Arg Phe Pro Ala Ala Val Val Val Glu Asp Asp Leu Glu Val 165 170 175 Ala Pro Asp Phe Phe Glu Tyr Phe Arg Ala Thr Tyr Pro Leu Leu Lys 180 185 190 Ala Asp Pro Ser Leu Trp Cys Val Ser Ala Trp Asn Asp Asn Gly Lys 195 200 205 Glu Gln Met Val Asp Ala Ser Arg Pro Glu Leu Leu Tyr Arg Thr Asp 210 215 220 Phe Phe Pro Gly Leu Gly Trp Leu Leu Leu Ala Glu Leu Trp Ala Glu 225 230 235 240 Leu Glu Pro Lys Trp Pro Lys Ala Phe Trp Asp Asp Trp Met Arg Arg 245 250 255 Pro Glu Gln Arg Gln Gly Arg Ala Cys Ile Arg Pro Glu Ile Ser Arg 260 265 270 Thr Met Thr Phe Gly Arg Lys Gly Val Ser His Gly Gln Phe Phe Asp 275 280 285 Gln His Leu Lys Phe Ile Lys Leu Asn Gln Gln Phe Val His Phe Thr 290 295 300 Gln Leu Asp Leu Ser Tyr Leu Gln Arg Glu Ala Tyr Asp Arg Asp Phe 305 310 315 320 Leu Ala Arg Val Tyr Gly Ala Pro Gln Leu Gln Val Glu Lys Val Arg 325 330 335 Thr Asn Asp Arg Lys Glu Leu Gly Glu Val Arg Val Gln Tyr Thr Gly 340 345 350 Arg Asp Ser Phe Lys Ala Phe Ala Lys Ala Leu Gly Val Met Asp Asp 355 360 365 Leu Lys Ser Gly Val Pro Arg Ala Gly Tyr Arg Gly Ile Val Thr Phe 370 375 380 Gln Phe Arg Gly Arg Arg Val His Leu Ala Pro Pro Pro Thr Trp Glu 385 390 395 400 Gly Tyr Asp Pro Ser Trp Asn 405 <210> 53 <211> 1407 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes Mm ManI catalytic domain <220> <221> CDS <222> (1)...(1407) <223> Mm ManI catalytic domain <400> 53 gag ccc gct gac gcc acc atc cgt gag aag agg gca aag atc aaa gag 48 Glu Pro Ala Asp Ala Thr Ile Arg Glu Lys Arg Ala Lys Ile Lys Glu 1 5 10 15 atg atg acc cat gct tgg aat aat tat aaa cgc tat gcg tgg ggc ttg 96 Met Met Thr His Ala Trp Asn Asn Tyr Lys Arg Tyr Ala Trp Gly Leu 20 25 30 aac gaa ctg aaa cct ata tca aaa gaa ggc cat tca agc agt ttg ttt 144 Asn Glu Leu Lys Pro Ile Ser Lys Glu Gly His Ser Ser Ser Leu Phe 35 40 45 ggc aac atc aaa gga gct aca ata gta gat gcc ctg gat acc ctt ttc 192 Gly Asn Ile Lys Gly Ala Thr Ile Val Asp Ala Leu Asp Thr Leu Phe 50 55 60 att atg ggc atg aag act gaa ttt caa gaa gct aaa tcg tgg att aaa 240 Ile Met Gly Met Lys Thr Glu Phe Gln Glu Ala Lys Ser Trp Ile Lys 65 70 75 80 aaa tat tta gat ttt aat gtg aat gct gaa gtt tct gtt ttt gaa gtc 288 Lys Tyr Leu Asp Phe Asn Val Asn Ala Glu Val Ser Val Phe Glu Val 85 90 95 aac ata cgc ttc gtc ggt gga ctg ctg tca gcc tac tat ttg tcc gga 336 Asn Ile Arg Phe Val Gly Gly Leu Leu Ser Ala Tyr Tyr Leu Ser Gly 100 105 110 gag gag ata ttt cga aag aaa gca gtg gaa ctt ggg gta aaa ttg cta 384 Glu Glu Ile Phe Arg Lys Lys Ala Val Glu Leu Gly Val Lys Leu Leu 115 120 125 cct gca ttt cat act ccc tct gga ata cct tgg gca ttg ctg aat atg 432 Pro Ala Phe His Thr Pro Ser Gly Ile Pro Trp Ala Leu Leu Asn Met 130 135 140 aaa agt ggg atc ggg cgg aac tgg ccc tgg gcc tct gga ggc agc agt 480 Lys Ser Gly Ile Gly Arg Asn Trp Pro Trp Ala Ser Gly Gly Ser Ser 145 150 155 160 atc ctg gcc gaa ttt gga act ctg cat tta gag ttt atg cac ttg tcc 528 Ile Leu Ala Glu Phe Gly Thr Leu His Leu Glu Phe Met His Leu Ser 165 170 175 cac tta tca gga gac cca gtc ttt gcc gaa aag gtt atg aaa att cga 576 His Leu Ser Gly Asp Pro Val Phe Ala Glu Lys Val Met Lys Ile Arg 180 185 190 aca gtg ttg aac aaa ctg gac aaa cca gaa ggc ctt tat cct aac tat 624 Thr Val Leu Asn Lys Leu Asp Lys Pro Glu Gly Leu Tyr Pro Asn Tyr 195 200 205 ctg aac ccc agt agt gga cag tgg ggt caa cat cat gtg tcg gtt gga 672 Leu Asn Pro Ser Ser Gly Gln Trp Gly Gln His His Val Ser Val Gly 210 215 220 gga ctt gga gac agc ttt tat gaa tat ttg ctt aag gcg tgg tta atg 720 Gly Leu Gly Asp Ser Phe Tyr Glu Tyr Leu Leu Lys Ala Trp Leu Met 225 230 235 240 tct gac aag aca gat ctc gaa gcc aag aag atg tat ttt gat gct gtt 768 Ser Asp Lys Thr Asp Leu Glu Ala Lys Lys Met Tyr Phe Asp Ala Val 245 250 255 cag gcc atc gag act cac ttg atc cgc aag tca agt ggg gga cta acg 816 Gln Ala Ile Glu Thr His Leu Ile Arg Lys Ser Ser Gly Gly Leu Thr 260 265 270 tac atc gca gag tgg aag ggg ggc ctc ctg gaa cac aag atg ggc cac 864 Tyr Ile Ala Glu Trp Lys Gly Gly Leu Leu Glu His Lys Met Gly His 275 280 285 ctg acg tgc ttt gca gga ggc atg ttt gca ctt ggg gca gat gga gct 912 Leu Thr Cys Phe Ala Gly Gly Met Phe Ala Leu Gly Ala Asp Gly Ala 290 295 300 ccg gaa gcc cgg gcc caa cac tac ctt gaa ctc gga gct gaa att gcc 960 Pro Glu Ala Arg Ala Gln His Tyr Leu Glu Leu Gly Ala Glu Ile Ala 305 310 315 320 cgc act tgt cat gaa tct tat aat cgt aca tat gtg aag ttg gga ccg 1008 Arg Thr Cys His Glu Ser Tyr Asn Arg Thr Tyr Val Lys Leu Gly Pro 325 330 335 gaa gcg ttt cga ttt gat ggc ggt gtg gaa gct att gcc acg agg caa 1056 Glu Ala Phe Arg Phe Asp Gly Gly Val Glu Ala Ile Ala Thr Arg Gln 340 345 350 aat gaa aag tat tac atc tta cgg ccc gag gtc atc gag aca tac atg 1104 Asn Glu Lys Tyr Tyr Ile Leu Arg Pro Glu Val Ile Glu Thr Tyr Met 355 360 365 tac atg tgg cga ctg act cac gac ccc aag tac agg acc tgg gcc tgg 1152 Tyr Met Trp Arg Leu Thr His Asp Pro Lys Tyr Arg Thr Trp Ala Trp 370 375 380 gaa gcc gtg gag gct cta gaa agt cac tgc aga gtg aac gga ggc tac 1200 Glu Ala Val Glu Ala Leu Glu Ser His Cys Arg Val Asn Gly Gly Tyr 385 390 395 400 tca ggc tta cgg gat gtt tac att gcc cgt gag agt tat gac gat gtc 1248 Ser Gly Leu Arg Asp Val Tyr Ile Ala Arg Glu Ser Tyr Asp Asp Val 405 410 415 cag caa agt ttc ttc ctg gca gag aca ctg aag tat ttg tac ttg ata 1296 Gln Gln Ser Phe Phe Leu Ala Glu Thr Leu Lys Tyr Leu Tyr Leu Ile 420 425 430 ttt tcc gat gat gac ctt ctt cca cta gaa cac tgg atc ttc aac acc 1344 Phe Ser Asp Asp Asp Leu Leu Pro Leu Glu His Trp Ile Phe Asn Thr 435 440 445 gag gct cat cct ttc cct ata ctc cgt gaa cag aag aag gaa att gat 1392 Glu Ala His Pro Phe Pro Ile Leu Arg Glu Gln Lys Lys Glu Ile Asp 450 455 460 ggc aaa gag aaa tga 1407 Gly Lys Glu Lys * 465 <210> 54 <211> 468 <212> PRT <213> Artificial Sequence <400> 54 Glu Pro Ala Asp Ala Thr Ile Arg Glu Lys Arg Ala Lys Ile Lys Glu 1 5 10 15 Met Met Thr His Ala Trp Asn Asn Tyr Lys Arg Tyr Ala Trp Gly Leu 20 25 30 Asn Glu Leu Lys Pro Ile Ser Lys Glu Gly His Ser Ser Ser Leu Phe 35 40 45 Gly Asn Ile Lys Gly Ala Thr Ile Val Asp Ala Leu Asp Thr Leu Phe 50 55 60 Ile Met Gly Met Lys Thr Glu Phe Gln Glu Ala Lys Ser Trp Ile Lys 65 70 75 80 Lys Tyr Leu Asp Phe Asn Val Asn Ala Glu Val Ser Val Phe Glu Val 85 90 95 Asn Ile Arg Phe Val Gly Gly Leu Leu Ser Ala Tyr Tyr Leu Ser Gly 100 105 110 Glu Glu Ile Phe Arg Lys Lys Ala Val Glu Leu Gly Val Lys Leu Leu 115 120 125 Pro Ala Phe His Thr Pro Ser Gly Ile Pro Trp Ala Leu Leu Asn Met 130 135 140 Lys Ser Gly Ile Gly Arg Asn Trp Pro Trp Ala Ser Gly Gly Ser Ser 145 150 155 160 Ile Leu Ala Glu Phe Gly Thr Leu His Leu Glu Phe Met His Leu Ser 165 170 175 His Leu Ser Gly Asp Pro Val Phe Ala Glu Lys Val Met Lys Ile Arg 180 185 190 Thr Val Leu Asn Lys Leu Asp Lys Pro Glu Gly Leu Tyr Pro Asn Tyr 195 200 205 Leu Asn Pro Ser Ser Gly Gln Trp Gly Gln His His Val Ser Val Gly 210 215 220 Gly Leu Gly Asp Ser Phe Tyr Glu Tyr Leu Leu Lys Ala Trp Leu Met 225 230 235 240 Ser Asp Lys Thr Asp Leu Glu Ala Lys Lys Met Tyr Phe Asp Ala Val 245 250 255 Gln Ala Ile Glu Thr His Leu Ile Arg Lys Ser Ser Gly Gly Leu Thr 260 265 270 Tyr Ile Ala Glu Trp Lys Gly Gly Leu Leu Glu His Lys Met Gly His 275 280 285 Leu Thr Cys Phe Ala Gly Gly Met Phe Ala Leu Gly Ala Asp Gly Ala 290 295 300 Pro Glu Ala Arg Ala Gln His Tyr Leu Glu Leu Gly Ala Glu Ile Ala 305 310 315 320 Arg Thr Cys His Glu Ser Tyr Asn Arg Thr Tyr Val Lys Leu Gly Pro 325 330 335 Glu Ala Phe Arg Phe Asp Gly Gly Val Glu Ala Ile Ala Thr Arg Gln 340 345 350 Asn Glu Lys Tyr Tyr Ile Leu Arg Pro Glu Val Ile Glu Thr Tyr Met 355 360 365 Tyr Met Trp Arg Leu Thr His Asp Pro Lys Tyr Arg Thr Trp Ala Trp 370 375 380 Glu Ala Val Glu Ala Leu Glu Ser His Cys Arg Val Asn Gly Gly Tyr 385 390 395 400 Ser Gly Leu Arg Asp Val Tyr Ile Ala Arg Glu Ser Tyr Asp Asp Val 405 410 415 Gln Gln Ser Phe Phe Leu Ala Glu Thr Leu Lys Tyr Leu Tyr Leu Ile 420 425 430 Phe Ser Asp Asp Asp Leu Leu Pro Leu Glu His Trp Ile Phe Asn Thr 435 440 445 Glu Ala His Pro Phe Pro Ile Leu Arg Glu Gln Lys Lys Glu Ile Asp 450 455 460 Gly Lys Glu Lys 465 <210> 55 <211> 1494 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes Tr ManI catalytic domain <220> <221> CDS <222> (1)...(1494) <223> Tr ManI catalytic domain <400> 55 cgc gcc gga tct ccc aac cct acg agg gcg gca gca gtc aag gcc gca 48 Arg Ala Gly Ser Pro Asn Pro Thr Arg Ala Ala Ala Val Lys Ala Ala 1 5 10 15 ttc cag acg tcg tgg aac gct tac cac cat ttt gcc ttt ccc cat gac 96 Phe Gln Thr Ser Trp Asn Ala Tyr His His Phe Ala Phe Pro His Asp 20 25 30 gac ctc cac ccg gtc agc aac agc ttt gat gat gag aga aac ggc tgg 144 Asp Leu His Pro Val Ser Asn Ser Phe Asp Asp Glu Arg Asn Gly Trp 35 40 45 ggc tcg tcg gca atc gat ggc ttg gac acg gct atc ctc atg ggg gat 192 Gly Ser Ser Ala Ile Asp Gly Leu Asp Thr Ala Ile Leu Met Gly Asp 50 55 60 gcc gac att gtg aac acg atc ctt cag tat gta ccg cag atc aac ttc 240 Ala Asp Ile Val Asn Thr Ile Leu Gln Tyr Val Pro Gln Ile Asn Phe 65 70 75 80 acc acg act gcg gtt gcc aac caa ggc atc tcc gtg ttc gag acc aac 288 Thr Thr Thr Ala Val Ala Asn Gln Gly Ile Ser Val Phe Glu Thr Asn 85 90 95 att cgg tac ctc ggt ggc ctg ctt tct gcc tat gac ctg ttg cga ggt 336 Ile Arg Tyr Leu Gly Gly Leu Leu Ser Ala Tyr Asp Leu Leu Arg Gly 100 105 110 cct ttc agc tcc ttg gcg aca aac cag acc ctg gta aac agc ctt ctg 384 Pro Phe Ser Ser Leu Ala Thr Asn Gln Thr Leu Val Asn Ser Leu Leu 115 120 125 agg cag gct caa aca ctg gcc aac ggc ctc aag gtt gcg ttc acc act 432 Arg Gln Ala Gln Thr Leu Ala Asn Gly Leu Lys Val Ala Phe Thr Thr 130 135 140 ccc agc ggt gtc ccg gac cct acc gtc ttc ttc aac cct act gtc cgg 480 Pro Ser Gly Val Pro Asp Pro Thr Val Phe Phe Asn Pro Thr Val Arg 145 150 155 160 aga agt ggt gca tct agc aac aac gtc gct gaa att gga agc ctg gtg 528 Arg Ser Gly Ala Ser Ser Asn Asn Val Ala Glu Ile Gly Ser Leu Val 165 170 175 ctc gag tgg aca cgg ttg agc gac ctg acg gga aac ccg cag tat gcc 576 Leu Glu Trp Thr Arg Leu Ser Asp Leu Thr Gly Asn Pro Gln Tyr Ala 180 185 190 cag ctt gcg cag aag ggc gag tcg tat ctc ctg aat cca aag gga agc 624 Gln Leu Ala Gln Lys Gly Glu Ser Tyr Leu Leu Asn Pro Lys Gly Ser 195 200 205 ccg gag gca tgg cct ggc ctg att gga acg ttt gtc agc acg agc aac 672 Pro Glu Ala Trp Pro Gly Leu Ile Gly Thr Phe Val Ser Thr Ser Asn 210 215 220 ggt acc ttt cag gat agc agc ggc agc tgg tcc ggc ctc atg gac agc 720 Gly Thr Phe Gln Asp Ser Ser Gly Ser Trp Ser Gly Leu Met Asp Ser 225 230 235 240 ttc tac gag tac ctg atc aag atg tac ctg tac gac ccg gtt gcg ttt 768 Phe Tyr Glu Tyr Leu Ile Lys Met Tyr Leu Tyr Asp Pro Val Ala Phe 245 250 255 gca cac tac aag gat cgc tgg gtc ctt gct gcc gac tcg acc att gcg 816 Ala His Tyr Lys Asp Arg Trp Val Leu Ala Ala Asp Ser Thr Ile Ala 260 265 270 cat ctc gcc tct cac ccg tcg acg cgc aag gac ttg acc ttt ttg tct 864 His Leu Ala Ser His Pro Ser Thr Arg Lys Asp Leu Thr Phe Leu Ser 275 280 285 tcg tac aac gga cag tct acg tcg cca aac tca gga cat ttg gcc agt 912 Ser Tyr Asn Gly Gln Ser Thr Ser Pro Asn Ser Gly His Leu Ala Ser 290 295 300 ttt gcc ggt ggc aac ttc atc ttg gga ggc att ctc ctg aac gag caa 960 Phe Ala Gly Gly Asn Phe Ile Leu Gly Gly Ile Leu Leu Asn Glu Gln 305 310 315 320 aag tac att gac ttt gga atc aag ctt gcc agc tcg tac ttt gcc acg 1008 Lys Tyr Ile Asp Phe Gly Ile Lys Leu Ala Ser Ser Tyr Phe Ala Thr 325 330 335 tac aac cag acg gct tct gga atc ggc ccc gaa ggc ttc gcg tgg gtg 1056 Tyr Asn Gln Thr Ala Ser Gly Ile Gly Pro Glu Gly Phe Ala Trp Val 340 345 350 gac agc gtg acg ggc gcc ggc ggc tcg ccg ccc tcg tcc cag tcc ggg 1104 Asp Ser Val Thr Gly Ala Gly Gly Ser Pro Pro Ser Ser Gln Ser Gly 355 360 365 ttc tac tcg tcg gca gga ttc tgg gtg acg gca ccg tat tac atc ctg 1152 Phe Tyr Ser Ser Ala Gly Phe Trp Val Thr Ala Pro Tyr Tyr Ile Leu 370 375 380 cgg ccg gag acg ctg gag agc ttg tac tac gca tac cgc gtc acg ggc 1200 Arg Pro Glu Thr Leu Glu Ser Leu Tyr Tyr Ala Tyr Arg Val Thr Gly 385 390 395 400 gac tcc aag tgg cag gac ctg gcg tgg gaa gcg ttc agt gcc att gag 1248 Asp Ser Lys Trp Gln Asp Leu Ala Trp Glu Ala Phe Ser Ala Ile Glu 405 410 415 gac gca tgc cgc gcc ggc agc gcg tac tcg tcc atc aac gac gtg acg 1296 Asp Ala Cys Arg Ala Gly Ser Ala Tyr Ser Ser Ile Asn Asp Val Thr 420 425 430 cag gcc aac ggc ggg ggt gcc tct gac gat atg gag agc ttc tgg ttt 1344 Gln Ala Asn Gly Gly Gly Ala Ser Asp Asp Met Glu Ser Phe Trp Phe 435 440 445 gcc gag gcg ctc aag tat gcg tac ctg atc ttt gcg gag gag tcg gat 1392 Ala Glu Ala Leu Lys Tyr Ala Tyr Leu Ile Phe Ala Glu Glu Ser Asp 450 455 460 gtg cag gtg cag gcc aac ggc ggg aac aaa ttt gtc ttt aac acg gag 1440 Val Gln Val Gln Ala Asn Gly Gly Asn Lys Phe Val Phe Asn Thr Glu 465 470 475 480 gcg cac ccc ttt agc atc cgt tca tca tca cga cgg ggc ggc cac ctt 1488 Ala His Pro Phe Ser Ile Arg Ser Ser Ser Arg Arg Gly Gly His Leu 485 490 495 gct taa 1494 Ala * <210> 56 <211> 497 <212> PRT <213> Artificial Sequence <400> 56 Arg Ala Gly Ser Pro Asn Pro Thr Arg Ala Ala Ala Val Lys Ala Ala 1 5 10 15 Phe Gln Thr Ser Trp Asn Ala Tyr His His Phe Ala Phe Pro His Asp 20 25 30 Asp Leu His Pro Val Ser Asn Ser Phe Asp Asp Glu Arg Asn Gly Trp 35 40 45 Gly Ser Ser Ala Ile Asp Gly Leu Asp Thr Ala Ile Leu Met Gly Asp 50 55 60 Ala Asp Ile Val Asn Thr Ile Leu Gln Tyr Val Pro Gln Ile Asn Phe 65 70 75 80 Thr Thr Thr Ala Val Ala Asn Gln Gly Ile Ser Val Phe Glu Thr Asn 85 90 95 Ile Arg Tyr Leu Gly Gly Leu Leu Ser Ala Tyr Asp Leu Leu Arg Gly 100 105 110 Pro Phe Ser Ser Leu Ala Thr Asn Gln Thr Leu Val Asn Ser Leu Leu 115 120 125 Arg Gln Ala Gln Thr Leu Ala Asn Gly Leu Lys Val Ala Phe Thr Thr 130 135 140 Pro Ser Gly Val Pro Asp Pro Thr Val Phe Phe Asn Pro Thr Val Arg 145 150 155 160 Arg Ser Gly Ala Ser Ser Asn Asn Val Ala Glu Ile Gly Ser Leu Val 165 170 175 Leu Glu Trp Thr Arg Leu Ser Asp Leu Thr Gly Asn Pro Gln Tyr Ala 180 185 190 Gln Leu Ala Gln Lys Gly Glu Ser Tyr Leu Leu Asn Pro Lys Gly Ser 195 200 205 Pro Glu Ala Trp Pro Gly Leu Ile Gly Thr Phe Val Ser Thr Ser Asn 210 215 220 Gly Thr Phe Gln Asp Ser Ser Gly Ser Trp Ser Gly Leu Met Asp Ser 225 230 235 240 Phe Tyr Glu Tyr Leu Ile Lys Met Tyr Leu Tyr Asp Pro Val Ala Phe 245 250 255 Ala His Tyr Lys Asp Arg Trp Val Leu Ala Ala Asp Ser Thr Ile Ala 260 265 270 His Leu Ala Ser His Pro Ser Thr Arg Lys Asp Leu Thr Phe Leu Ser 275 280 285 Ser Tyr Asn Gly Gln Ser Thr Ser Pro Asn Ser Gly His Leu Ala Ser 290 295 300 Phe Ala Gly Gly Asn Phe Ile Leu Gly Gly Ile Leu Leu Asn Glu Gln 305 310 315 320 Lys Tyr Ile Asp Phe Gly Ile Lys Leu Ala Ser Ser Tyr Phe Ala Thr 325 330 335 Tyr Asn Gln Thr Ala Ser Gly Ile Gly Pro Glu Gly Phe Ala Trp Val 340 345 350 Asp Ser Val Thr Gly Ala Gly Gly Ser Pro Pro Ser Ser Gln Ser Gly 355 360 365 Phe Tyr Ser Ser Ala Gly Phe Trp Val Thr Ala Pro Tyr Tyr Ile Leu 370 375 380 Arg Pro Glu Thr Leu Glu Ser Leu Tyr Tyr Ala Tyr Arg Val Thr Gly 385 390 395 400 Asp Ser Lys Trp Gln Asp Leu Ala Trp Glu Ala Phe Ser Ala Ile Glu 405 410 415 Asp Ala Cys Arg Ala Gly Ser Ala Tyr Ser Ser Ile Asn Asp Val Thr 420 425 430 Gln Ala Asn Gly Gly Gly Ala Ser Asp Asp Met Glu Ser Phe Trp Phe 435 440 445 Ala Glu Ala Leu Lys Tyr Ala Tyr Leu Ile Phe Ala Glu Glu Ser Asp 450 455 460 Val Gln Val Gln Ala Asn Gly Gly Asn Lys Phe Val Phe Asn Thr Glu 465 470 475 480 Ala His Pro Phe Ser Ile Arg Ser Ser Ser Arg Arg Gly Gly His Leu 485 490 495 Ala <210> 57 <211> 1068 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes rat GnTII catalytic domain (TC) <220> <221> CDS <222> (1)...(1068) <223> rat GnTII catalytic domain <400> 57 tcc cta gtg tac cag ttg aac ttt gat cag atg ctg agg aat gtc gat 48 Ser Leu Val Tyr Gln Leu Asn Phe Asp Gln Met Leu Arg Asn Val Asp 1 5 10 15 aaa gac ggc acc tgg agt ccg ggg gag ctg gtg ctg gtg gtc caa gtg 96 Lys Asp Gly Thr Trp Ser Pro Gly Glu Leu Val Leu Val Val Gln Val 20 25 30 cat aac agg ccg gaa tac ctc agg ctg ctg ata gac tcg ctt cga aaa 144 His Asn Arg Pro Glu Tyr Leu Arg Leu Leu Ile Asp Ser Leu Arg Lys 35 40 45 gcc cag ggt att cgc gaa gtc cta gtc atc ttt agc cat gac ttc tgg 192 Ala Gln Gly Ile Arg Glu Val Leu Val Ile Phe Ser His Asp Phe Trp 50 55 60 tcg gca gag atc aac agt ctg atc tct agt gtg gac ttc tgt ccg gtt 240 Ser Ala Glu Ile Asn Ser Leu Ile Ser Ser Val Asp Phe Cys Pro Val 65 70 75 80 ctg caa gtg ttc ttt ccg ttc agc att cag ctg tac ccg agt gag ttt 288 Leu Gln Val Phe Phe Pro Phe Ser Ile Gln Leu Tyr Pro Ser Glu Phe 85 90 95 ccg ggt agt gat ccc aga gat tgc ccc aga gac ctg aag aag aat gca 336 Pro Gly Ser Asp Pro Arg Asp Cys Pro Arg Asp Leu Lys Lys Asn Ala 100 105 110 gct ctc aag ttg ggg tgc atc aat gcc gaa tac cca gac tcc ttc ggc 384 Ala Leu Lys Leu Gly Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly 115 120 125 cat tac aga gag gcc aaa ttc tcg caa acc aaa cat cac tgg tgg tgg 432 His Tyr Arg Glu Ala Lys Phe Ser Gln Thr Lys His His Trp Trp Trp 130 135 140 aag ctg cat ttt gta tgg gaa aga gtc aaa gtt ctt caa gat tac act 480 Lys Leu His Phe Val Trp Glu Arg Val Lys Val Leu Gln Asp Tyr Thr 145 150 155 160 ggc ctt ata ctt ttc ctg gaa gag gac cac tac tta gcc cca gac ttt 528 Gly Leu Ile Leu Phe Leu Glu Glu Asp His Tyr Leu Ala Pro Asp Phe 165 170 175 tac cat gtc ttc aaa aag atg tgg aaa ttg aag cag cag gag tgt cct 576 Tyr His Val Phe Lys Lys Met Trp Lys Leu Lys Gln Gln Glu Cys Pro 180 185 190 ggg tgt gac gtc ctc tct cta ggg acc tac acc acc att cgg agt ttc 624 Gly Cys Asp Val Leu Ser Leu Gly Thr Tyr Thr Thr Ile Arg Ser Phe 195 200 205 tat ggt att gct gac aaa gta gat gtg aaa act tgg aaa tcg aca gag 672 Tyr Gly Ile Ala Asp Lys Val Asp Val Lys Thr Trp Lys Ser Thr Glu 210 215 220 cac aat atg ggg cta gcc ttg acc cga gat gca tat cag aag ctt atc 720 His Asn Met Gly Leu Ala Leu Thr Arg Asp Ala Tyr Gln Lys Leu Ile 225 230 235 240 gag tgc acg gac act ttc tgt act tac gat gat tat aac tgg gac tgg 768 Glu Cys Thr Asp Thr Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp 245 250 255 act ctt caa tat ttg act cta gct tgt ctt cct aaa gtc tgg aaa gtc 816 Thr Leu Gln Tyr Leu Thr Leu Ala Cys Leu Pro Lys Val Trp Lys Val 260 265 270 tta gtt cct caa gct cct agg att ttt cat gct gga gac tgt ggt atg 864 Leu Val Pro Gln Ala Pro Arg Ile Phe His Ala Gly Asp Cys Gly Met 275 280 285 cat cac aag aaa aca tgt agg cca tcc acc cag agt gcc caa att gag 912 His His Lys Lys Thr Cys Arg Pro Ser Thr Gln Ser Ala Gln Ile Glu 290 295 300 tca tta tta aat aat aat aaa cag tac ctg ttt cca gaa act cta gtt 960 Ser Leu Leu Asn Asn Asn Lys Gln Tyr Leu Phe Pro Glu Thr Leu Val 305 310 315 320 atc ggt gag aag ttt cct atg gca gcc att tcc cca cct agg aaa aat 1008 Ile Gly Glu Lys Phe Pro Met Ala Ala Ile Ser Pro Pro Arg Lys Asn 325 330 335 gga ggg tgg gga gat att agg gac cat gaa ctc tgt aaa agt tat aga 1056 Gly Gly Trp Gly Asp Ile Arg Asp His Glu Leu Cys Lys Ser Tyr Arg 340 345 350 aga ctg cag tga 1068 Arg Leu Gln * 355 <210> 58 <211> 355 <212> PRT <213> Artificial Sequence <400> 58 Ser Leu Val Tyr Gln Leu Asn Phe Asp Gln Met Leu Arg Asn Val Asp 1 5 10 15 Lys Asp Gly Thr Trp Ser Pro Gly Glu Leu Val Leu Val Val Gln Val 20 25 30 His Asn Arg Pro Glu Tyr Leu Arg Leu Leu Ile Asp Ser Leu Arg Lys 35 40 45 Ala Gln Gly Ile Arg Glu Val Leu Val Ile Phe Ser His Asp Phe Trp 50 55 60 Ser Ala Glu Ile Asn Ser Leu Ile Ser Ser Val Asp Phe Cys Pro Val 65 70 75 80 Leu Gln Val Phe Phe Pro Phe Ser Ile Gln Leu Tyr Pro Ser Glu Phe 85 90 95 Pro Gly Ser Asp Pro Arg Asp Cys Pro Arg Asp Leu Lys Lys Asn Ala 100 105 110 Ala Leu Lys Leu Gly Cys Ile Asn Ala Glu Tyr Pro Asp Ser Phe Gly 115 120 125 His Tyr Arg Glu Ala Lys Phe Ser Gln Thr Lys His His Trp Trp Trp 130 135 140 Lys Leu His Phe Val Trp Glu Arg Val Lys Val Leu Gln Asp Tyr Thr 145 150 155 160 Gly Leu Ile Leu Phe Leu Glu Glu Asp His Tyr Leu Ala Pro Asp Phe 165 170 175 Tyr His Val Phe Lys Lys Met Trp Lys Leu Lys Gln Gln Glu Cys Pro 180 185 190 Gly Cys Asp Val Leu Ser Leu Gly Thr Tyr Thr Thr Ile Arg Ser Phe 195 200 205 Tyr Gly Ile Ala Asp Lys Val Asp Val Lys Thr Trp Lys Ser Thr Glu 210 215 220 His Asn Met Gly Leu Ala Leu Thr Arg Asp Ala Tyr Gln Lys Leu Ile 225 230 235 240 Glu Cys Thr Asp Thr Phe Cys Thr Tyr Asp Asp Tyr Asn Trp Asp Trp 245 250 255 Thr Leu Gln Tyr Leu Thr Leu Ala Cys Leu Pro Lys Val Trp Lys Val 260 265 270 Leu Val Pro Gln Ala Pro Arg Ile Phe His Ala Gly Asp Cys Gly Met 275 280 285 His His Lys Lys Thr Cys Arg Pro Ser Thr Gln Ser Ala Gln Ile Glu 290 295 300 Ser Leu Leu Asn Asn Asn Lys Gln Tyr Leu Phe Pro Glu Thr Leu Val 305 310 315 320 Ile Gly Glu Lys Phe Pro Met Ala Ala Ile Ser Pro Pro Arg Lys Asn 325 330 335 Gly Gly Trp Gly Asp Ile Arg Asp His Glu Leu Cys Lys Ser Tyr Arg 340 345 350 Arg Leu Gln 355 <210> 59 <211> 1068 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes rat GnTII catalytic domain (TC) codon-optimized <400> 59 tccttggttt accaattgaa cttcgaccag atgttgagaa acgttgacaa ggacggtact 60 tggtctcctg gtgagttggt tttggttgtt caggttcaca acagaccaga gtacttgaga 120 ttgttgatcg actccttgag aaaggctcaa ggtatcagag aggttttggt tatcttctcc 180 cacgatttct ggtctgctga gatcaactcc ttgatctcct ccgttgactt ctgtccagtt 240 ttgcaggttt tcttcccatt ctccatccaa ttgtacccat ctgagttccc aggttctgat 300 ccaagagact gtccaagaga cttgaagaag aacgctgctt tgaagttggg ttgtatcaac 360 gctgaatacc cagattcttt cggtcactac agagaggcta agttctccca aactaagcat 420 cattggtggt ggaagttgca ctttgtttgg gagagagtta aggttttgca ggactacact 480 ggattgatct tgttcttgga ggaggatcat tacttggctc cagacttcta ccacgttttc 540 aagaagatgt ggaagttgaa gcaacaagag tgtccaggtt gtgacgtttt gtccttggga 600 acttacacta ctatcagatc cttctacggt atcgctgaca aggttgacgt taagacttgg 660 aagtccactg aacacaacat gggattggct ttgactagag atgcttacca gaagttgatc 720 gagtgtactg acactttctg tacttacgac gactacaact gggactggac tttgcagtac 780 ttgactttgg cttgtttgcc aaaagtttgg aaggttttgg ttccacaggc tccaagaatt 840 ttccacgctg gtgactgtgg aatgcaccac aagaaaactt gtagaccatc cactcagtcc 900 gctcaaattg agtccttgtt gaacaacaac aagcagtact tgttcccaga gactttggtt 960 atcggagaga agtttccaat ggctgctatt tccccaccaa gaaagaatgg tggatggggt 1020 gatattagag accacgagtt gtgtaaatcc tacagaagat tgcagtag 1068 <210> 60 <211> 1240 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes rat GnTII catalytic domain (TA) <220> <221> CDS <222> (1)...(1240) <223> rat GnTII catalytic domain (TA) <400> 60 agg aag aac gac gcc ctt gcc ccg ccg ctg ctg gac tcg gag ccc cta 48 Arg Lys Asn Asp Ala Leu Ala Pro Pro Leu Leu Asp Ser Glu Pro Leu 1 5 10 15 cgg ggt gcg ggc cat ttc gcc gcg tcc gta ggc atc cgc agg gtt tct 96 Arg Gly Ala Gly His Phe Ala Ala Ser Val Gly Ile Arg Arg Val Ser 20 25 30 aac gac tcg gcc gct cct ctg gtt ccc gcg gtc ccg cgg ccg gag gtg 144 Asn Asp Ser Ala Ala Pro Leu Val Pro Ala Val Pro Arg Pro Glu Val 35 40 45 gac aac cta acg ctg cgg tac cgg tcc cta gtg tac cag ttg aac ttt 192 Asp Asn Leu Thr Leu Arg Tyr Arg Ser Leu Val Tyr Gln Leu Asn Phe 50 55 60 gat cag atg ctg agg aat gtc gat aaa gac ggc acc tgg agt ccg ggg 240 Asp Gln Met Leu Arg Asn Val Asp Lys Asp Gly Thr Trp Ser Pro Gly 65 70 75 80 gag ctg gtg ctg gtg gtc caa gtg cat aac agg ccg gaa tac ctc agg 288 Glu Leu Val Leu Val Val Gln Val His Asn Arg Pro Glu Tyr Leu Arg 85 90 95 ctg ctg ata gac tcg ctt cga aaa gcc cag ggt att cgc gaa gtc cta 336 Leu Leu Ile Asp Ser Leu Arg Lys Ala Gln Gly Ile Arg Glu Val Leu 100 105 110 gtc atc ttt agc cat gac ttc tgg tcg gca gag atc aac agt ctg atc 384 Val Ile Phe Ser His Asp Phe Trp Ser Ala Glu Ile Asn Ser Leu Ile 115 120 125 tct agt gtg gac ttc tgt ccg gtt ctg caa gtg ttc ttt ccg ttc agc 432 Ser Ser Val Asp Phe Cys Pro Val Leu Gln Val Phe Phe Pro Phe Ser 130 135 140 att cag ctg tac ccg agt gag ttt ccg ggt agt gat ccc aga gat tgc 480 Ile Gln Leu Tyr Pro Ser Glu Phe Pro Gly Ser Asp Pro Arg Asp Cys 145 150 155 160 ccc aga gac ctg aag aag aat gca gct ctc aag ttg ggg tgc atc aat 528 Pro Arg Asp Leu Lys Lys Asn Ala Ala Leu Lys Leu Gly Cys Ile Asn 165 170 175 gcc gaa tac cca gac tcc ttc ggc cat tac aga gag gcc aaa ttc tcg 576 Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu Ala Lys Phe Ser 180 185 190 caa acc aaa cat cac tgg tgg tgg aag ctg cat ttt gta tgg gaa aga 624 Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe Val Trp Glu Arg 195 200 205 gtc aaa gtt ctt caa gat tac act ggc ctt ata ctt ttc ctg gaa gag 672 Val Lys Val Leu Gln Asp Tyr Thr Gly Leu Ile Leu Phe Leu Glu Glu 210 215 220 gac cac tac tta gcc cca gac ttt tac cat gtc ttc aaa aag atg tgg 720 Asp His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe Lys Lys Met Trp 225 230 235 240 aaa ttg aag cag cag gag tgt cct ggg tgt gac gtc ctc tct cta ggg 768 Lys Leu Lys Gln Gln Glu Cys Pro Gly Cys Asp Val Leu Ser Leu Gly 245 250 255 acc tac acc acc att cgg agt ttc tat ggt att gct gac aaa gta gat 816 Thr Tyr Thr Thr Ile Arg Ser Phe Tyr Gly Ile Ala Asp Lys Val Asp 260 265 270 gtg aaa act tgg aaa tcg aca gag cac aat atg ggg cta gcc ttg acc 864 Val Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly Leu Ala Leu Thr 275 280 285 cga gat gca tat cag aag ctt atc gag tgc acg gac act ttc tgt act 912 Arg Asp Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp Thr Phe Cys Thr 290 295 300 tac gat gat tat aac tgg gac tgg act ctt caa tat ttg act cta gct 960 Tyr Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr Leu Thr Leu Ala 305 310 315 320 tgt ctt cct aaa gtc tgg aaa gtc tta gtt cct caa gct cct agg att 1008 Cys Leu Pro Lys Val Trp Lys Val Leu Val Pro Gln Ala Pro Arg Ile 325 330 335 ttt cat gct gga gac tgt ggt atg cat cac aag aaa aca tgt agg cca 1056 Phe His Ala Gly Asp Cys Gly Met His His Lys Lys Thr Cys Arg Pro 340 345 350 tcc acc cag agt gcc caa att gag tca tta tta aat aat aat aaa cag 1104 Ser Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn Asn Asn Lys Gln 355 360 365 tac ctg ttt cca gaa act cta gtt atc ggt gag aag ttt cct atg gca 1152 Tyr Leu Phe Pro Glu Thr Leu Val Ile Gly Glu Lys Phe Pro Met Ala 370 375 380 gcc att tcc cca cct agg aaa aat gga ggg tgg gga gat att agg gac 1200 Ala Ile Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly Asp Ile Arg Asp 385 390 395 400 cat gaa ctc tgt aaa agt tat aga aga ctg cag tga gtt a 1240 His Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln * Val 405 410 <210> 61 <211> 412 <212> PRT <213> Artificial Sequence <400> 61 Arg Lys Asn Asp Ala Leu Ala Pro Pro Leu Leu Asp Ser Glu Pro Leu 1 5 10 15 Arg Gly Ala Gly His Phe Ala Ala Ser Val Gly Ile Arg Arg Val Ser 20 25 30 Asn Asp Ser Ala Ala Pro Leu Val Pro Ala Val Pro Arg Pro Glu Val 35 40 45 Asp Asn Leu Thr Leu Arg Tyr Arg Ser Leu Val Tyr Gln Leu Asn Phe 50 55 60 Asp Gln Met Leu Arg Asn Val Asp Lys Asp Gly Thr Trp Ser Pro Gly 65 70 75 80 Glu Leu Val Leu Val Val Gln Val His Asn Arg Pro Glu Tyr Leu Arg 85 90 95 Leu Leu Ile Asp Ser Leu Arg Lys Ala Gln Gly Ile Arg Glu Val Leu 100 105 110 Val Ile Phe Ser His Asp Phe Trp Ser Ala Glu Ile Asn Ser Leu Ile 115 120 125 Ser Ser Val Asp Phe Cys Pro Val Leu Gln Val Phe Phe Pro Phe Ser 130 135 140 Ile Gln Leu Tyr Pro Ser Glu Phe Pro Gly Ser Asp Pro Arg Asp Cys 145 150 155 160 Pro Arg Asp Leu Lys Lys Asn Ala Ala Leu Lys Leu Gly Cys Ile Asn 165 170 175 Ala Glu Tyr Pro Asp Ser Phe Gly His Tyr Arg Glu Ala Lys Phe Ser 180 185 190 Gln Thr Lys His His Trp Trp Trp Lys Leu His Phe Val Trp Glu Arg 195 200 205 Val Lys Val Leu Gln Asp Tyr Thr Gly Leu Ile Leu Phe Leu Glu Glu 210 215 220 Asp His Tyr Leu Ala Pro Asp Phe Tyr His Val Phe Lys Lys Met Trp 225 230 235 240 Lys Leu Lys Gln Gln Glu Cys Pro Gly Cys Asp Val Leu Ser Leu Gly 245 250 255 Thr Tyr Thr Thr Ile Arg Ser Phe Tyr Gly Ile Ala Asp Lys Val Asp 260 265 270 Val Lys Thr Trp Lys Ser Thr Glu His Asn Met Gly Leu Ala Leu Thr 275 280 285 Arg Asp Ala Tyr Gln Lys Leu Ile Glu Cys Thr Asp Thr Phe Cys Thr 290 295 300 Tyr Asp Asp Tyr Asn Trp Asp Trp Thr Leu Gln Tyr Leu Thr Leu Ala 305 310 315 320 Cys Leu Pro Lys Val Trp Lys Val Leu Val Pro Gln Ala Pro Arg Ile 325 330 335 Phe His Ala Gly Asp Cys Gly Met His His Lys Lys Thr Cys Arg Pro 340 345 350 Ser Thr Gln Ser Ala Gln Ile Glu Ser Leu Leu Asn Asn Asn Lys Gln 355 360 365 Tyr Leu Phe Pro Glu Thr Leu Val Ile Gly Glu Lys Phe Pro Met Ala 370 375 380 Ala Ile Ser Pro Pro Arg Lys Asn Gly Gly Trp Gly Asp Ile Arg Asp 385 390 395 400 His Glu Leu Cys Lys Ser Tyr Arg Arg Leu Gln Val 405 410 <210> 62 <211> 3105 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes Dm ManII catalytic domain (KD) <220> <221> CDS <222> (1)...(3105) <223> Dm ManII catalytic domain <400> 62 cgc gac gat cca ata aga cct cca ctt aaa gtg gct cgt tcc ccg agg 48 Arg Asp Asp Pro Ile Arg Pro Pro Leu Lys Val Ala Arg Ser Pro Arg 1 5 10 15 cca ggg caa tgc caa gat gtg gtc caa gac gtg ccc aat gtg gat gta 96 Pro Gly Gln Cys Gln Asp Val Val Gln Asp Val Pro Asn Val Asp Val 20 25 30 cag atg ctg gag cta tac gat cgc atg tcc ttc aag gac ata gat gga 144 Gln Met Leu Glu Leu Tyr Asp Arg Met Ser Phe Lys Asp Ile Asp Gly 35 40 45 ggc gtg tgg aaa cag ggc tgg aac att aag tac gat cca ctg aag tac 192 Gly Val Trp Lys Gln Gly Trp Asn Ile Lys Tyr Asp Pro Leu Lys Tyr 50 55 60 aac gcc cat cac aaa cta aaa gtc ttc gtt gtg ccg cac tcg cac aac 240 Asn Ala His His Lys Leu Lys Val Phe Val Val Pro His Ser His Asn 65 70 75 80 gat cct gga tgg att cag acg ttt gag gaa tac tac cag cac gac acc 288 Asp Pro Gly Trp Ile Gln Thr Phe Glu Glu Tyr Tyr Gln His Asp Thr 85 90 95 aag cac atc ctg tcc aat gca cta cgg cat ctg cac gac aat ccc gag 336 Lys His Ile Leu Ser Asn Ala Leu Arg His Leu His Asp Asn Pro Glu 100 105 110 atg aag ttc atc tgg gcg gaa atc tcc tac ttt gct cgg ttc tat cac 384 Met Lys Phe Ile Trp Ala Glu Ile Ser Tyr Phe Ala Arg Phe Tyr His 115 120 125 gat ttg gga gag aac aaa aag ctg cag atg aag tcc att gta aag aat 432 Asp Leu Gly Glu Asn Lys Lys Leu Gln Met Lys Ser Ile Val Lys Asn 130 135 140 gga cag ttg gaa ttt gtg act gga gga tgg gta atg ccg gac gag gcc 480 Gly Gln Leu Glu Phe Val Thr Gly Gly Trp Val Met Pro Asp Glu Ala 145 150 155 160 aac tcc cac tgg cga aac gta ctg ctg cag ctg acc gaa ggg caa aca 528 Asn Ser His Trp Arg Asn Val Leu Leu Gln Leu Thr Glu Gly Gln Thr 165 170 175 tgg ttg aag caa ttc atg aat gtc aca ccc act gct tcc tgg gcc atc 576 Trp Leu Lys Gln Phe Met Asn Val Thr Pro Thr Ala Ser Trp Ala Ile 180 185 190 gat ccc ttc gga cac agt ccc act atg ccg tac att ttg cag aag agt 624 Asp Pro Phe Gly His Ser Pro Thr Met Pro Tyr Ile Leu Gln Lys Ser 195 200 205 ggt ttc aag aat atg ctt atc caa agg acg cac tat tcg gtt aag aag 672 Gly Phe Lys Asn Met Leu Ile Gln Arg Thr His Tyr Ser Val Lys Lys 210 215 220 gaa ctg gcc caa cag cga cag ctt gag ttc ctg tgg cgc cag atc tgg 720 Glu Leu Ala Gln Gln Arg Gln Leu Glu Phe Leu Trp Arg Gln Ile Trp 225 230 235 240 gac aac aaa ggg gac aca gct ctc ttc acc cac atg atg ccc ttc tac 768 Asp Asn Lys Gly Asp Thr Ala Leu Phe Thr His Met Met Pro Phe Tyr 245 250 255 tcg tac gac att cct cat acc tgt ggt cca gat ccc aag gtt tgc tgt 816 Ser Tyr Asp Ile Pro His Thr Cys Gly Pro Asp Pro Lys Val Cys Cys 260 265 270 cag ttc gat ttc aaa cga atg ggc tcc ttc ggt ttg agt tgt cca tgg 864 Gln Phe Asp Phe Lys Arg Met Gly Ser Phe Gly Leu Ser Cys Pro Trp 275 280 285 aag gtg ccg ccg cgt aca atc agt gat caa aat gtg gca gca cgc tca 912 Lys Val Pro Pro Arg Thr Ile Ser Asp Gln Asn Val Ala Ala Arg Ser 290 295 300 gat ctg ctg gtt gat cag tgg aag aag aag gcc gag ctg tat cgc aca 960 Asp Leu Leu Val Asp Gln Trp Lys Lys Lys Ala Glu Leu Tyr Arg Thr 305 310 315 320 aac gtg ctg ctg att ccg ttg ggt gac gac ttc cgc ttc aag cag aac 1008 Asn Val Leu Leu Ile Pro Leu Gly Asp Asp Phe Arg Phe Lys Gln Asn 325 330 335 acc gag tgg gat gtg cag cgc gtg aac tac gaa agg ctg ttc gaa cac 1056 Thr Glu Trp Asp Val Gln Arg Val Asn Tyr Glu Arg Leu Phe Glu His 340 345 350 atc aac agc cag gcc cac ttc aat gtc cag gcg cag ttc ggc aca ctg 1104 Ile Asn Ser Gln Ala His Phe Asn Val Gln Ala Gln Phe Gly Thr Leu 355 360 365 cag gaa tac ttt gat gca gtg cac cag gcg gaa agg gcg gga caa gcc 1152 Gln Glu Tyr Phe Asp Ala Val His Gln Ala Glu Arg Ala Gly Gln Ala 370 375 380 gag ttt ccc acg cta agc ggt gac ttt ttc aca tac gcc gat cga tcg 1200 Glu Phe Pro Thr Leu Ser Gly Asp Phe Phe Thr Tyr Ala Asp Arg Ser 385 390 395 400 gat aac tat tgg agt ggc tac tac aca tcc cgc ccg tat cat aag cgc 1248 Asp Asn Tyr Trp Ser Gly Tyr Tyr Thr Ser Arg Pro Tyr His Lys Arg 405 410 415 atg gac cgc gtc ctg atg cac tat gta cgt gca gca gaa atg ctt tcc 1296 Met Asp Arg Val Leu Met His Tyr Val Arg Ala Ala Glu Met Leu Ser 420 425 430 gcc tgg cac tcc tgg gac ggt atg gcc cgc atc gag gaa cgt ctg gag 1344 Ala Trp His Ser Trp Asp Gly Met Ala Arg Ile Glu Glu Arg Leu Glu 435 440 445 cag gcc cgc agg gag ctg tca ttg ttc cag cac cac gac ggt ata act 1392 Gln Ala Arg Arg Glu Leu Ser Leu Phe Gln His His Asp Gly Ile Thr 450 455 460 ggc aca gca aaa acg cac gta gtc gtc gac tac gag caa cgc atg cag 1440 Gly Thr Ala Lys Thr His Val Val Val Asp Tyr Glu Gln Arg Met Gln 465 470 475 480 gaa gct tta aaa gcc tgt caa atg gta atg caa cag tcg gtc tac cga 1488 Glu Ala Leu Lys Ala Cys Gln Met Val Met Gln Gln Ser Val Tyr Arg 485 490 495 ttg ctg aca aag ccc tcc atc tac agt ccg gac ttc agt ttc tcg tac 1536 Leu Leu Thr Lys Pro Ser Ile Tyr Ser Pro Asp Phe Ser Phe Ser Tyr 500 505 510 ttt acg ctc gac gac tcc cgc tgg cca gga tct ggt gtg gag gac agt 1584 Phe Thr Leu Asp Asp Ser Arg Trp Pro Gly Ser Gly Val Glu Asp Ser 515 520 525 cga acc acc ata ata ctg ggc gag gat ata ctg ccc tcc aag cat gtg 1632 Arg Thr Thr Ile Ile Leu Gly Glu Asp Ile Leu Pro Ser Lys His Val 530 535 540 gtg atg cac aac acc ctg ccc cac tgg cgg gag cag ctg gtg gac ttt 1680 Val Met His Asn Thr Leu Pro His Trp Arg Glu Gln Leu Val Asp Phe 545 550 555 560 tat gta tcc agt ccg ttt gta agc gtt acc gac ttg gca aac aat ccg 1728 Tyr Val Ser Ser Pro Phe Val Ser Val Thr Asp Leu Ala Asn Asn Pro 565 570 575 gtg gag gct cag gtg tcc ccg gtg tgg agc tgg cac cac gac aca ctc 1776 Val Glu Ala Gln Val Ser Pro Val Trp Ser Trp His His Asp Thr Leu 580 585 590 aca aag act atc cac cca caa ggc tcc acc acc aag tac cgc atc atc 1824 Thr Lys Thr Ile His Pro Gln Gly Ser Thr Thr Lys Tyr Arg Ile Ile 595 600 605 ttc aag gct cgg gtg ccg ccc atg ggc ttg gcc acc tac gtt tta acc 1872 Phe Lys Ala Arg Val Pro Pro Met Gly Leu Ala Thr Tyr Val Leu Thr 610 615 620 atc tcc gat tcc aag cca gag cac acc tcg tat gca tcg aat ctc ttg 1920 Ile Ser Asp Ser Lys Pro Glu His Thr Ser Tyr Ala Ser Asn Leu Leu 625 630 635 640 ctc cgt aaa aac ccg act tcg tta cca ttg ggc caa tat ccg gag gat 1968 Leu Arg Lys Asn Pro Thr Ser Leu Pro Leu Gly Gln Tyr Pro Glu Asp 645 650 655 gtg aag ttt ggc gat cct cga gag atc tca ttg cgg gtt ggt aac gga 2016 Val Lys Phe Gly Asp Pro Arg Glu Ile Ser Leu Arg Val Gly Asn Gly 660 665 670 ccc acc ttg gcc ttt tcg gag cag ggt ctc ctt aag tcc att cag ctt 2064 Pro Thr Leu Ala Phe Ser Glu Gln Gly Leu Leu Lys Ser Ile Gln Leu 675 680 685 act cag gat agc cca cat gta ccg gtg cac ttc aag ttc ctc aag tat 2112 Thr Gln Asp Ser Pro His Val Pro Val His Phe Lys Phe Leu Lys Tyr 690 695 700 ggc gtt cga tcg cat ggc gat aga tcc ggt gcc tat ctg ttc ctg ccc 2160 Gly Val Arg Ser His Gly Asp Arg Ser Gly Ala Tyr Leu Phe Leu Pro 705 710 715 720 aat gga cca gct tcg cca gtc gag ctt ggc cag cca gtg gtc ctg gtg 2208 Asn Gly Pro Ala Ser Pro Val Glu Leu Gly Gln Pro Val Val Leu Val 725 730 735 act aag ggc aaa ctg gag tcg tcc gtg agc gtg gga ctt ccg agc gtg 2256 Thr Lys Gly Lys Leu Glu Ser Ser Val Ser Val Gly Leu Pro Ser Val 740 745 750 gtg cac cag acg ata atg cgc ggt ggt gca cct gag att cgc aat ctg 2304 Val His Gln Thr Ile Met Arg Gly Gly Ala Pro Glu Ile Arg Asn Leu 755 760 765 gtg gat ata ggc tca ctg gac aac acg gag atc gtg atg cgc ttg gag 2352 Val Asp Ile Gly Ser Leu Asp Asn Thr Glu Ile Val Met Arg Leu Glu 770 775 780 acg cat atc gac agc ggc gat atc ttc tac acg gat ctc aat gga ttg 2400 Thr His Ile Asp Ser Gly Asp Ile Phe Tyr Thr Asp Leu Asn Gly Leu 785 790 795 800 caa ttt atc aag agg cgg cgt ttg gac aaa tta cct ttg cag gcc aac 2448 Gln Phe Ile Lys Arg Arg Arg Leu Asp Lys Leu Pro Leu Gln Ala Asn 805 810 815 tat tat ccc ata cct tct ggt atg ttc att gag gat gcc aat acg cga 2496 Tyr Tyr Pro Ile Pro Ser Gly Met Phe Ile Glu Asp Ala Asn Thr Arg 820 825 830 ctc act ctc ctc acg ggt caa ccg ctg ggt gga tct tct ctg gcc tcg 2544 Leu Thr Leu Leu Thr Gly Gln Pro Leu Gly Gly Ser Ser Leu Ala Ser 835 840 845 ggc gag cta gag att atg caa gat cgt cgc ctg gcc agc gat gat gaa 2592 Gly Glu Leu Glu Ile Met Gln Asp Arg Arg Leu Ala Ser Asp Asp Glu 850 855 860 cgc ggc ctg gga cag ggt gtt ttg gac aac aag ccg gtg ctg cat att 2640 Arg Gly Leu Gly Gln Gly Val Leu Asp Asn Lys Pro Val Leu His Ile 865 870 875 880 tat cgg ctg gtg ctg gag aag gtt aac aac tgt gtc cga ccg tca aag 2688 Tyr Arg Leu Val Leu Glu Lys Val Asn Asn Cys Val Arg Pro Ser Lys 885 890 895 ctt cat cct gcc ggc tat ttg aca agt gcc gca cac aaa gca tcg cag 2736 Leu His Pro Ala Gly Tyr Leu Thr Ser Ala Ala His Lys Ala Ser Gln 900 905 910 tca ctg ctg gat cca ctg gac aag ttt ata ttc gct gaa aat gag tgg 2784 Ser Leu Leu Asp Pro Leu Asp Lys Phe Ile Phe Ala Glu Asn Glu Trp 915 920 925 atc ggg gca cag ggg caa ttt ggt ggc gat cat cct tcg gct cgt gag 2832 Ile Gly Ala Gln Gly Gln Phe Gly Gly Asp His Pro Ser Ala Arg Glu 930 935 940 gat ctc gat gtg tcg gtg atg aga cgc tta acc aag agc tcg gcc aaa 2880 Asp Leu Asp Val Ser Val Met Arg Arg Leu Thr Lys Ser Ser Ala Lys 945 950 955 960 acc cag cga gta ggc tac gtt ctg cac cgc acc aat ctg atg caa tgc 2928 Thr Gln Arg Val Gly Tyr Val Leu His Arg Thr Asn Leu Met Gln Cys 965 970 975 ggc act cca gag gag cat aca cag aag ctg gat gtg tgc cac cta ctg 2976 Gly Thr Pro Glu Glu His Thr Gln Lys Leu Asp Val Cys His Leu Leu 980 985 990 ccg aat gtg gcg aga tgc gag cgc acg acg ctg act ttc ctg cag aat 3024 Pro Asn Val Ala Arg Cys Glu Arg Thr Thr Leu Thr Phe Leu Gln Asn 995 1000 1005 ttg gag cac ttg gat ggc atg gtg gcg ccg gaa gtg tgc ccc atg gaa 3072 Leu Glu His Leu Asp Gly Met Val Ala Pro Glu Val Cys Pro Met Glu 1010 1015 1020 acc gcc gct tat gtg agc agt cac tca agc tga 3105 Thr Ala Ala Tyr Val Ser Ser His Ser Ser * 1025 1030 <210> 63 <211> 1034 <212> PRT <213> Artificial Sequence <400> 63 Arg Asp Asp Pro Ile Arg Pro Pro Leu Lys Val Ala Arg Ser Pro Arg 1 5 10 15 Pro Gly Gln Cys Gln Asp Val Val Gln Asp Val Pro Asn Val Asp Val 20 25 30 Gln Met Leu Glu Leu Tyr Asp Arg Met Ser Phe Lys Asp Ile Asp Gly 35 40 45 Gly Val Trp Lys Gln Gly Trp Asn Ile Lys Tyr Asp Pro Leu Lys Tyr 50 55 60 Asn Ala His His Lys Leu Lys Val Phe Val Val Pro His Ser His Asn 65 70 75 80 Asp Pro Gly Trp Ile Gln Thr Phe Glu Glu Tyr Tyr Gln His Asp Thr 85 90 95 Lys His Ile Leu Ser Asn Ala Leu Arg His Leu His Asp Asn Pro Glu 100 105 110 Met Lys Phe Ile Trp Ala Glu Ile Ser Tyr Phe Ala Arg Phe Tyr His 115 120 125 Asp Leu Gly Glu Asn Lys Lys Leu Gln Met Lys Ser Ile Val Lys Asn 130 135 140 Gly Gln Leu Glu Phe Val Thr Gly Gly Trp Val Met Pro Asp Glu Ala 145 150 155 160 Asn Ser His Trp Arg Asn Val Leu Leu Gln Leu Thr Glu Gly Gln Thr 165 170 175 Trp Leu Lys Gln Phe Met Asn Val Thr Pro Thr Ala Ser Trp Ala Ile 180 185 190 Asp Pro Phe Gly His Ser Pro Thr Met Pro Tyr Ile Leu Gln Lys Ser 195 200 205 Gly Phe Lys Asn Met Leu Ile Gln Arg Thr His Tyr Ser Val Lys Lys 210 215 220 Glu Leu Ala Gln Gln Arg Gln Leu Glu Phe Leu Trp Arg Gln Ile Trp 225 230 235 240 Asp Asn Lys Gly Asp Thr Ala Leu Phe Thr His Met Met Pro Phe Tyr 245 250 255 Ser Tyr Asp Ile Pro His Thr Cys Gly Pro Asp Pro Lys Val Cys Cys 260 265 270 Gln Phe Asp Phe Lys Arg Met Gly Ser Phe Gly Leu Ser Cys Pro Trp 275 280 285 Lys Val Pro Pro Arg Thr Ile Ser Asp Gln Asn Val Ala Ala Arg Ser 290 295 300 Asp Leu Leu Val Asp Gln Trp Lys Lys Lys Ala Glu Leu Tyr Arg Thr 305 310 315 320 Asn Val Leu Leu Ile Pro Leu Gly Asp Asp Phe Arg Phe Lys Gln Asn 325 330 335 Thr Glu Trp Asp Val Gln Arg Val Asn Tyr Glu Arg Leu Phe Glu His 340 345 350 Ile Asn Ser Gln Ala His Phe Asn Val Gln Ala Gln Phe Gly Thr Leu 355 360 365 Gln Glu Tyr Phe Asp Ala Val His Gln Ala Glu Arg Ala Gly Gln Ala 370 375 380 Glu Phe Pro Thr Leu Ser Gly Asp Phe Phe Thr Tyr Ala Asp Arg Ser 385 390 395 400 Asp Asn Tyr Trp Ser Gly Tyr Tyr Thr Ser Arg Pro Tyr His Lys Arg 405 410 415 Met Asp Arg Val Leu Met His Tyr Val Arg Ala Ala Glu Met Leu Ser 420 425 430 Ala Trp His Ser Trp Asp Gly Met Ala Arg Ile Glu Glu Arg Leu Glu 435 440 445 Gln Ala Arg Arg Glu Leu Ser Leu Phe Gln His His Asp Gly Ile Thr 450 455 460 Gly Thr Ala Lys Thr His Val Val Val Asp Tyr Glu Gln Arg Met Gln 465 470 475 480 Glu Ala Leu Lys Ala Cys Gln Met Val Met Gln Gln Ser Val Tyr Arg 485 490 495 Leu Leu Thr Lys Pro Ser Ile Tyr Ser Pro Asp Phe Ser Phe Ser Tyr 500 505 510 Phe Thr Leu Asp Asp Ser Arg Trp Pro Gly Ser Gly Val Glu Asp Ser 515 520 525 Arg Thr Thr Ile Ile Leu Gly Glu Asp Ile Leu Pro Ser Lys His Val 530 535 540 Val Met His Asn Thr Leu Pro His Trp Arg Glu Gln Leu Val Asp Phe 545 550 555 560 Tyr Val Ser Ser Pro Phe Val Ser Val Thr Asp Leu Ala Asn Asn Pro 565 570 575 Val Glu Ala Gln Val Ser Pro Val Trp Ser Trp His His Asp Thr Leu 580 585 590 Thr Lys Thr Ile His Pro Gln Gly Ser Thr Thr Lys Tyr Arg Ile Ile 595 600 605 Phe Lys Ala Arg Val Pro Pro Met Gly Leu Ala Thr Tyr Val Leu Thr 610 615 620 Ile Ser Asp Ser Lys Pro Glu His Thr Ser Tyr Ala Ser Asn Leu Leu 625 630 635 640 Leu Arg Lys Asn Pro Thr Ser Leu Pro Leu Gly Gln Tyr Pro Glu Asp 645 650 655 Val Lys Phe Gly Asp Pro Arg Glu Ile Ser Leu Arg Val Gly Asn Gly 660 665 670 Pro Thr Leu Ala Phe Ser Glu Gln Gly Leu Leu Lys Ser Ile Gln Leu 675 680 685 Thr Gln Asp Ser Pro His Val Pro Val His Phe Lys Phe Leu Lys Tyr 690 695 700 Gly Val Arg Ser His Gly Asp Arg Ser Gly Ala Tyr Leu Phe Leu Pro 705 710 715 720 Asn Gly Pro Ala Ser Pro Val Glu Leu Gly Gln Pro Val Val Leu Val 725 730 735 Thr Lys Gly Lys Leu Glu Ser Ser Val Ser Val Gly Leu Pro Ser Val 740 745 750 Val His Gln Thr Ile Met Arg Gly Gly Ala Pro Glu Ile Arg Asn Leu 755 760 765 Val Asp Ile Gly Ser Leu Asp Asn Thr Glu Ile Val Met Arg Leu Glu 770 775 780 Thr His Ile Asp Ser Gly Asp Ile Phe Tyr Thr Asp Leu Asn Gly Leu 785 790 795 800 Gln Phe Ile Lys Arg Arg Arg Leu Asp Lys Leu Pro Leu Gln Ala Asn 805 810 815 Tyr Tyr Pro Ile Pro Ser Gly Met Phe Ile Glu Asp Ala Asn Thr Arg 820 825 830 Leu Thr Leu Leu Thr Gly Gln Pro Leu Gly Gly Ser Ser Leu Ala Ser 835 840 845 Gly Glu Leu Glu Ile Met Gln Asp Arg Arg Leu Ala Ser Asp Asp Glu 850 855 860 Arg Gly Leu Gly Gln Gly Val Leu Asp Asn Lys Pro Val Leu His Ile 865 870 875 880 Tyr Arg Leu Val Leu Glu Lys Val Asn Asn Cys Val Arg Pro Ser Lys 885 890 895 Leu His Pro Ala Gly Tyr Leu Thr Ser Ala Ala His Lys Ala Ser Gln 900 905 910 Ser Leu Leu Asp Pro Leu Asp Lys Phe Ile Phe Ala Glu Asn Glu Trp 915 920 925 Ile Gly Ala Gln Gly Gln Phe Gly Gly Asp His Pro Ser Ala Arg Glu 930 935 940 Asp Leu Asp Val Ser Val Met Arg Arg Leu Thr Lys Ser Ser Ala Lys 945 950 955 960 Thr Gln Arg Val Gly Tyr Val Leu His Arg Thr Asn Leu Met Gln Cys 965 970 975 Gly Thr Pro Glu Glu His Thr Gln Lys Leu Asp Val Cys His Leu Leu 980 985 990 Pro Asn Val Ala Arg Cys Glu Arg Thr Thr Leu Thr Phe Leu Gln Asn 995 1000 1005 Leu Glu His Leu Asp Gly Met Val Ala Pro Glu Val Cys Pro Met Glu 1010 1015 1020 Thr Ala Ala Tyr Val Ser Ser His Ser Ser 1025 1030 <210> 64 <211> 3105 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes Dm ManII catalytic domain (KD) codon-optimized <400> 64 agagacgatc caattagacc tccattgaag gttgctagat ccccaagacc aggtcaatgt 60 caagatgttg ttcaggacgt cccaaacgtt gatgtccaga tgttggagtt gtacgataga 120 atgtccttca aggacattga tggtggtgtt tggaagcagg gttggaacat taagtacgat 180 ccattgaagt acaacgctca tcacaagttg aaggtcttcg ttgtcccaca ctcccacaac 240 gatcctggtt ggattcagac cttcgaggaa tactaccagc acgacaccaa gcacatcttg 300 tccaacgctt tgagacattt gcacgacaac ccagagatga agttcatctg ggctgaaatc 360 tcctacttcg ctagattcta ccacgatttg ggtgagaaca agaagttgca gatgaagtcc 420 atcgtcaaga acggtcagtt ggaattcgtc actggtggat gggtcatgcc agacgaggct 480 aactcccact ggagaaacgt tttgttgcag ttgaccgaag gtcaaacttg gttgaagcaa 540 ttcatgaacg tcactccaac tgcttcctgg gctatcgatc cattcggaca ctctccaact 600 atgccataca ttttgcagaa gtctggtttc aagaatatgt tgatccagag aacccactac 660 tccgttaaga aggagttggc tcaacagaga cagttggagt tcttgtggag acagatctgg 720 gacaacaaag gtgacactgc tttgttcacc cacatgatgc cattctactc ttacgacatt 780 cctcatacct gtggtccaga tccaaaggtt tgttgtcagt tcgatttcaa aagaatgggt 840 tccttcggtt tgtcttgtcc atggaaggtt ccacctagaa ctatctctga tcaaaatgtt 900 gctgctagat ccgatttgtt ggttgatcag tggaagaaga aggctgagtt gtacagaacc 960 aacgtcttgt tgattccatt gggtgacgac ttcagattca agcagaacac cgagtgggat 1020 gttcagagag tcaactacga aagattgttc gaacacatca actctcaggc tcacttcaat 1080 gtccaggctc agttcggtac tttgcaggaa tacttcgatg ctgttcacca ggctgaaaga 1140 gctggacaag ctgagttccc aaccttgtct ggtgacttct tcacttacgc tgatagatct 1200 gataactact ggtctggtta ctacacttcc agaccatacc ataagagaat ggacagagtc 1260 ttgatgcact acgttagagc tgctgaaatg ttgtccgctt ggcactcctg ggacggtatg 1320 gctagaatcg aggaaagatt ggagcaggct agaagagagt tgtccttgtt ccagcaccac 1380 gacggtatta ctggtactgc taaaactcac gttgtcgtcg actacgagca aagaatgcag 1440 gaagctttga aagcttgtca aatggtcatg caacagtctg tctacagatt gttgactaag 1500 ccatccatct actctccaga cttctccttc tcctacttca ctttggacga ctccagatgg 1560 ccaggttctg gtgttgagga ctctagaact accatcatct tgggtgagga tatcttgcca 1620 tccaagcatg ttgtcatgca caacaccttg ccacactgga gagagcagtt ggttgacttc 1680 tacgtctcct ctccattcgt ttctgttacc gacttggcta acaatccagt tgaggctcag 1740 gtttctccag tttggtcttg gcaccacgac actttgacta agactatcca cccacaaggt 1800 tccaccacca agtacagaat catcttcaag gctagagttc caccaatggg tttggctacc 1860 tacgttttga ccatctccga ttccaagcca gagcacacct cctacgcttc caatttgttg 1920 cttagaaaga acccaacttc cttgccattg ggtcaatacc cagaggatgt caagttcggt 1980 gatccaagag agatctcctt gagagttggt aacggtccaa ccttggcttt ctctgagcag 2040 ggtttgttga agtccattca gttgactcag gattctccac atgttccagt tcacttcaag 2100 ttcttgaagt acggtgttag atctcatggt gatagatctg gtgcttactt gttcttgcca 2160 aatggtccag cttctccagt cgagttgggt cagccagttg tcttggtcac taagggtaaa 2220 ttggagtctt ccgtttctgt tggtttgcca tctgtcgttc accagaccat catgagaggt 2280 ggtgctccag agattagaaa tttggtcgat attggttctt tggacaacac tgagatcgtc 2340 atgagattgg agactcatat cgactctggt gatatcttct acactgattt gaatggattg 2400 caattcatca agaggagaag attggacaag ttgccattgc aggctaacta ctacccaatt 2460 ccatctggta tgttcattga ggatgctaat accagattga ctttgttgac cggtcaacca 2520 ttgggtggat cttctttggc ttctggtgag ttggagatta tgcaagatag aagattggct 2580 tctgatgatg aaagaggttt gggtcagggt gttttggaca acaagccagt tttgcatatt 2640 tacagattgg tcttggagaa ggttaacaac tgtgtcagac catctaagtt gcatccagct 2700 ggttacttga cttctgctgc tcacaaagct tctcagtctt tgttggatcc attggacaag 2760 ttcatcttcg ctgaaaatga gtggatcggt gctcagggtc aattcggtgg tgatcatcca 2820 tctgctagag aggatttgga tgtctctgtc atgagaagat tgaccaagtc ttctgctaaa 2880 acccagagag ttggttacgt tttgcacaga accaatttga tgcaatgtgg tactccagag 2940 gagcatactc agaagttgga tgtctgtcac ttgttgccaa atgttgctag atgtgagaga 3000 actaccttga ctttcttgca gaatttggag cacttggatg gtatggttgc tccagaagtt 3060 tgtccaatgg aaaccgctgc ttacgtctct tctcactctt cttga 3105 <210> 65 <211> 702 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes human Fc <220> <221> CDS <222> (1)...(702) <223> human Fc <400> 65 gct gaa cca aaa tct tgt gat aaa act cat aca tgt cca cca tgt cca 48 Ala Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro 1 5 10 15 gct cct gaa ctt ctg ggt gga cca tca gtt ttc ttg ttc cca cca aaa 96 Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys 20 25 30 cca aag gat acc ctt atg att tct aga act cct gaa gtc aca tgt gtt 144 Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val 35 40 45 gtt gtt gat gtt tct cat gaa gat cct gaa gtc aag ttc aac tgg tac 192 Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr 50 55 60 gtt gat ggt gtt gaa gtt cat aat gct aag aca aag cca aga gaa gaa 240 Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu 65 70 75 80 caa tac aac tct act tac aga gtt gtc tct gtt ctt act gtt ctg cat 288 Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His 85 90 95 caa gat tgg ctg aat ggt aag gaa tac aag tgt aag gtc tcc aac aaa 336 Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys 100 105 110 gct ctt cca gct cca att gag aaa acc att tcc aaa gct aaa ggt caa 384 Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln 115 120 125 cca aga gaa cca caa gtt tac acc ttg cca cca tcc aga gat gaa ctg 432 Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu 130 135 140 act aag aac caa gtc tct ctg act tgt ctg gtt aaa ggt ttc tat cca 480 Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro 145 150 155 160 tct gat att gct gtt gaa tgg gag tct aat ggt caa cca gaa aac aac 528 Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn 165 170 175 tac aag act act cct cct gtt ctg gat tct gat ggt tcc ttc ttc ctt 576 Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu 180 185 190 tac tct aag ctt act gtt gat aag tcc aga tgg caa caa ggt aac gtc 624 Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val 195 200 205 ttc tca tgt tcc gtt atg cat gaa gct ttg cat aac cat tac act cag 672 Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln 210 215 220 aag tct ctt tcc ctg tct cca ggt aaa taa 702 Lys Ser Leu Ser Leu Ser Pro Gly Lys * 225 230 <210> 66 <211> 233 <212> PRT <213> Artificial Sequence <400> 66 Ala Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro 1 5 10 15 Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys 20 25 30 Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val 35 40 45 Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr 50 55 60 Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu 65 70 75 80 Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His 85 90 95 Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys 100 105 110 Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln 115 120 125 Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu 130 135 140 Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro 145 150 155 160 Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn 165 170 175 Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu 180 185 190 Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val 195 200 205 Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln 210 215 220 Lys Ser Leu Ser Leu Ser Pro Gly Lys 225 230 <210> 67 <211> 1353 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes anti-Her2 HC <220> <221> CDS <222> (1)...(1353) <223> anti-Her2 HC <400> 67 gag gtc caa ttg gtt gaa tct ggt gga ggt ttg gtc caa cca ggt gga 48 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 tct ctg aga ctt tct tgt gct gcc tct ggt ttc aac att aag gat act 96 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn Ile Lys Asp Thr 20 25 30 tac atc cac tgg gtt aga cag gct cca ggt aag ggt ttg gag tgg gtt 144 Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 gct aga atc tac cca acc aac ggt tac acc aga tac gct gat tcc gtt 192 Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr Ala Asp Ser Val 50 55 60 aag ggt aga ttc acc att tcc gct gac act tcc aag aac act gct tac 240 Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys Asn Thr Ala Tyr 65 70 75 80 ttg caa atg aac tct ttg aga gct gag gac act gcc gtc tac tac tgt 288 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 tcc aga tgg ggt ggt gac ggt ttc tac gcc atg gac tac tgg ggt caa 336 Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp Tyr Trp Gly Gln 100 105 110 ggt acc ttg gtt act gtc tct tcc gct tct act aag gga cca tcc gtt 384 Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val 115 120 125 ttt cca ttg gct cca tcc tct aag tct act tcc ggt ggt act gct gct 432 Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala 130 135 140 ttg gga tgt ttg gtt aag gac tac ttc cca gag cct gtt act gtt tct 480 Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser 145 150 155 160 tgg aac tcc ggt gct ttg act tct ggt gtt cac act ttc cca gct gtt 528 Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val 165 170 175 ttg caa tct tcc ggt ttg tac tcc ttg tcc tcc gtt gtt act gtt cca 576 Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro 180 185 190 tcc tct tcc ttg ggt act cag act tac atc tgt aac gtt aac cac aag 624 Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys 195 200 205 cca tcc aac act aag gtt gac aag aag gtt gag cca aag tcc tgt gac 672 Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp 210 215 220 aag aca cat act tgt cca cca tgt cca gct cca gaa ttg ttg ggt ggt 720 Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly 225 230 235 240 cca tcc gtt ttc ttg ttc cca cca aag cca aag gac act ttg atg atc 768 Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile 245 250 255 tcc aga act cca gag gtt aca tgt gtt gtt gtt gac gtt tct cac gag 816 Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu 260 265 270 gac cca gag gtt aag ttc aac tgg tac gtt gac ggt gtt gaa gtt cac 864 Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His 275 280 285 aac gct aag act aag cca aga gag gag cag tac aac tcc act tac aga 912 Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg 290 295 300 gtt gtt tcc gtt ttg act gtt ttg cac cag gat tgg ttg aac gga aag 960 Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys 305 310 315 320 gag tac aag tgt aag gtt tcc aac aag gct ttg cca gct cca atc gaa 1008 Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu 325 330 335 aag act atc tcc aag gct aag ggt caa cca aga gag cca cag gtt tac 1056 Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr 340 345 350 act ttg cca cca tcc aga gat gag ttg act aag aac cag gtt tcc ttg 1104 Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu 355 360 365 act tgt ttg gtt aaa gga ttc tac cca tcc gac att gct gtt gag tgg 1152 Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp 370 375 380 gaa tct aac ggt caa cca gag aac aac tac aag act act cca cca gtt 1200 Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val 385 390 395 400 ttg gat tct gac ggt tcc ttc ttc ttg tac tcc aag ttg act gtt gac 1248 Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp 405 410 415 aag tcc aga tgg caa cag ggt aac gtt ttc tcc tgt tcc gtt atg cat 1296 Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His 420 425 430 gag gct ttg cac aac cac tac act caa aag tcc ttg tct ttg tcc cca 1344 Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro 435 440 445 ggt aag taa 1353 Gly Lys * 450 <210> 68 <211> 450 <212> PRT <213> Artificial Sequence <400> 68 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn Ile Lys Asp Thr 20 25 30 Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys Asn Thr Ala Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp Tyr Trp Gly Gln 100 105 110 Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val 115 120 125 Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala 130 135 140 Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser 145 150 155 160 Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val 165 170 175 Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro 180 185 190 Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys 195 200 205 Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp 210 215 220 Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly 225 230 235 240 Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile 245 250 255 Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu 260 265 270 Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His 275 280 285 Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg 290 295 300 Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys 305 310 315 320 Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu 325 330 335 Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr 340 345 350 Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu 355 360 365 Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp 370 375 380 Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val 385 390 395 400 Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp 405 410 415 Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His 420 425 430 Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro 435 440 445 Gly Lys 450 <210> 69 <211> 645 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes anti-Her2 LC <220> <221> CDS <222> (1)...(645) <223> anti-Her2 LC <400> 69 gac att cag atg aca cag tct cca tct tct ttg tcc gct tcc gtc ggt 48 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 gat aga gtt act atc acc tgt aga gct tcc caa gac gtc aac acc gct 96 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Val Asn Thr Ala 20 25 30 gtc gcc tgg tac caa cag aag cca ggt aag gct cca aaa ctt ttg atc 144 Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 tac tct gcc tct ttc ttg tac tcc ggt gtt cca tcc aga ttt tct ggt 192 Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 tct aga tcc ggt acc gac ttc acc ttg acc atc tct tcc ttg caa cca 240 Ser Arg Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 gaa gac ttc gct acc tac tac tgt caa caa cac tac act act cct cca 288 Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln His Tyr Thr Thr Pro Pro 85 90 95 act ttc ggt caa gga act aag gtt gag att aag aga act gtt gct gct 336 Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala 100 105 110 cca tcc gtt ttc att ttc cca cca tcc gac gaa caa ttg aag tct ggt 384 Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly 115 120 125 aca gct tcc gtt gtt tgt ttg ttg aac aac ttc tac cca aga gag gct 432 Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala 130 135 140 aag gtt cag tgg aag gtt gac aac gct ttg caa tcc ggt aac tcc caa 480 Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln 145 150 155 160 gaa tcc gtt act gag cag gat tct aag gat tcc act tac tcc ttg tcc 528 Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser 165 170 175 tcc act ttg act ttg tcc aag gct gat tac gag aag cac aag gtt tac 576 Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr 180 185 190 gct tgt gag gtt aca cat cag ggt ttg tcc tcc cca gtt act aag tcc 624 Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser 195 200 205 ttc aac aga gga gag tgt taa 645 Phe Asn Arg Gly Glu Cys * 210 <210> 70 <211> 214 <212> PRT <213> Artificial Sequence <400> 70 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Val Asn Thr Ala 20 25 30 Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Arg Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln His Tyr Thr Thr Pro Pro 85 90 95 Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala 100 105 110 Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly 115 120 125 Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala 130 135 140 Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln 145 150 155 160 Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser 165 170 175 Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr 180 185 190 Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser 195 200 205 Phe Asn Arg Gly Glu Cys 210

Claims

갈락토키나제 활성, UDP-갈락토스-4-에피머라제 활성, 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 활성, 및 임의로 갈락토스 퍼미아제 활성을 발현하도록 유전적으로 공학처리시킨, 단독 탄소 에너지원으로서 갈락토스를 사용할 수 있는 피키아 파스토리스 (Pichia pastoris) 숙주 세포.
제1항에 있어서, 갈락토스 잔기를 포함하는 하이브리드 또는 복합 N-글리칸을 갖는 재조합 당단백질을 생성할 수 있도록 추가로 공학처리시킨 숙주 세포.
제2항에 있어서, UDP-갈락토스-4-에피머라제 활성이 갈락토실트랜스퍼라제의 촉매적 도메인 및 UDP-갈락토스-4-에피머라제의 촉매적 도메인을 포함하는 융합 단백질에 제공되는 숙주 세포.
제2항에 있어서, GO:G1/G2 비가 2:1 미만인 복합 N-글리칸을 갖는 당단백질을 생성하는 숙주 세포.
제2항에 있어서, GalGlcNAcMan₅GlcNAc₂; NANAGalGlcNAcMan₅GlcNAc₂; GalGlcNAcMan₃GlcNAc₂; NANAGalGlcNAcMan₃GlcNAc₂; GalGlcNAc₂Man₃GlcNAc₂; Gal₂GlcNAc₂Man₃GlcNAc₂; NANAGal₂GlcNAc₂Man₃GlcNAc₂; 및 NANA₂Gal₂GlcNAc₂Man₃GlcNAc₂로 이루어진 군으로부터 선택된 N-글리칸을 우세적으로 갖는 당단백질을 생성하는 숙주 세포.
제2항에 있어서, N-글리칸이 GalGlcNAcMan₅GlcNAc₂; Gal₂GlcNAc₂Man₃GlcNAc₂; 및 Gal₂GlcNAc₂Man₃GlcNAc₂로 이루어진 군으로부터 선택된 갈락토스-말단화 N-글리칸인 숙주 세포.
제2항에 있어서, N-글리칸이 갈락토스-말단화 하이브리드 N-글리칸인 숙주 세포.
제2항에 있어서, N-글리칸이 NANAGalGlcNAcMan₅GlcNAc₂; NANAGal₂GlcNAc₂Man₃GlcNAc₂; 및 NANA₂Gal₂GlcNAc₂Man₃GlcNAc₂로 이루어진 군으로부터 선택된 시알릴화 N-글리칸인 숙주 세포.
제2항에 있어서, 재조합 당단백질이 에리트로포이에틴 (EPO); 시토카인, 예컨대 인터페론 α, 인터페론 β, 인터페론 γ, 및 인터페론 ω; 및 과립구-콜로니 자극 인자 (GCSF); GM-CSF; 응고 인자, 예컨대 인자 VIII, 인자 IX, 및 인간 단백질 C; 항트롬빈 III; 트롬빈; 가용성 IgE 수용체 α-쇄; 면역글로불린, 예컨대 IgG, IgG 단편, IgG 융합물, 및 IgM; 면역부착인자 및 기타 Fc 융합 단백질, 예컨대 가용성 TNF 수용체-Fc 융합 단백질; RAGE-Fc 융합 단백질; 인터루킨; 유로키나제; 키마제 (chymase); 및 우레아 트립신 억제제; IGF-결합성 단백질; 표피 성장 인자; 성장 호르몬-방출 인자; 아넥신 V 융합 단백질; 안지오스타틴 (angiostatin); 혈관 내피 성장 인자-2; 골수 전구세포 억제 인자-1; 오스테오프로테게린 (osteoprotegerin); α-1-항트립신; α-태아 단백질; DNase II; 인간 플라스미노겐의 크링글 (kringle) 3; 글루코세레브로시다제; TNF 결합성 단백질 1; 난포 자극 호르몬; 세포독성 T 림프구 관련 항원 4 - Ig; 막관통 (transmembrane) 활성화제 및 칼슘 조정제 및 시클로필린 (cyclophilin) 리간드; 글루카곤 유사 단백질 1; 및 IL-2 수용체 효능제로 이루어진 군으로부터 선택되는 것인 숙주 세포.
a) (i) 숙주 세포가 갈락토스 잔기를 포함하는 하이브리드 또는 복합 N-글리칸을 갖는 재조합 당단백질을 생성할 수 있도록 하는 글리코실화 경로;
(ii) 갈락토키나제 활성, UDP-갈락토스-4-에피머라제 활성, 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 활성, 및 임의로 갈락토스 퍼미아제 활성; 및
(iii) 재조합 당단백질
을 발현하도록 유전적으로 공학처리된 재조합 숙주 세포를 제공하는 단계; 및
b) 이러한 숙주 세포를 갈락토스 함유 배지에서 배양하여, 갈락토스 잔기를 갖는 하나 이상의 N-글리칸을 갖는 재조합 당단백질을 생성시키는 단계
를 포함하는, 갈락토스 잔기를 갖는 N-글리칸을 수반하는 재조합 당단백질을 피키아 파스토리스 숙주에서 생성하는 방법.
제10항에 있어서, UDP-갈락토스-4-에피머라제 활성이 갈락토실트랜스퍼라제의 촉매적 도메인 및 UDP-갈락토스-4-에피머라제의 촉매적 도메인을 포함하는 융합 단백질에 제공되는 방법.
제10항에 있어서, N-글리칸의 G0:G1/G2 비가 2:1 미만인 방법.
제10항에 있어서, 재조합 당단백질이 GalGlcNAcMan₅GlcNAc₂; NANAGalGlcNAcMan₅GlcNAc₂; GalGlcNAcMan₃GlcNAc₂; NANAGalGlcNAcMan₃GlcNAc₂; GalGlcNAc₂Man₃GlcNAc₂; Gal₂GlcNAc₂Man₃GlcNAc₂; NANAGal₂GlcNAc₂Man₃GlcNAc₂; 및 NANA₂Gal₂GlcNAc₂Man₃GlcNAc₂로 이루어진 군으로부터 선택된 N-글리칸을 우세적으로 갖는 방법.
제10항에 있어서, N-글리칸이 GalGlcNAcMan₅GlcNAc₂; Gal₂GlcNAc₂Man₃ GlcNAc₂; 및 Gal₂GlcNAc₂Man₃GlcNAc₂로 이루어진 군으로부터 선택된 갈락토스-말단화 N-글리칸인 방법.
제10항에 있어서, N-글리칸이 갈락토스-말단화 하이브리드 N-글리칸인 방법.
제10항에 있어서, N-글리칸이 NANAGalGlcNAcMan₅GlcNAc₂; NANAGal₂GlcNAc₂Man₃GlcNAc₂; 및 NANA₂Gal₂GlcNAc₂Man₃GlcNAc₂로 이루어진 군으로부터 선택된 시알릴화 N-글리칸인 방법.
제10항에 있어서, 재조합 당단백질이 에리트로포이에틴 (EPO); 시토카인, 예컨대 인터페론 α, 인터페론 β, 인터페론 γ, 및 인터페론 ω; 및 과립구-콜로니 자극 인자 (GCSF); GM-CSF; 응고 인자, 예컨대 인자 VIII, 인자 IX, 및 인간 단백질 C; 항트롬빈 III; 트롬빈; 가용성 IgE 수용체 α-쇄; 면역글로불린, 예컨대 IgG, IgG 단편, IgG 융합물, 및 IgM; 면역부착인자 및 기타 Fc 융합 단백질, 예컨대 가용성 TNF 수용체-Fc 융합 단백질; RAGE-Fc 융합 단백질; 인터루킨; 유로키나제; 키마제; 및 우레아 트립신 억제제; IGF-결합성 단백질; 표피 성장 인자; 성장 호르몬-방출 인자; 아넥신 V 융합 단백질; 안지오스타틴; 혈관 내피 성장 인자-2; 골수 전구세포 억제 인자-1; 오스테오프로테게린; α-1-항트립신; α-태아 단백질; DNase II; 인간 플라스미노겐의 크링글 3; 글루코세레브로시다제; TNF 결합성 단백질 1; 난포 자극 호르몬; 세포독성 T 림프구 관련 항원 4 - Ig; 막관통 활성화제 및 칼슘 조정제 및 시클로필린 리간드; 글루카곤 유사 단백질 1; 및 IL-2 수용체 효능제로 이루어진 군으로부터 선택되는 것인 방법.
(a) 갈락토키나제 활성, UDP-갈락토스-4-에피머라제 활성 및 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 활성으로 이루어진 군으로부터 선택된 1개 또는 2개 효소 활성을 발현하도록 유전적으로 공학처리된 숙주 세포를 제공하는 단계;
(b) 이러한 숙주 세포를, 단계 (a)의 숙주 세포에서는 발현되지 않는 단계 (a) 내의 군으로부터의 효소(들) 및 이종 단백질을 암호화하는 하나 이상의 핵산 분자로 형질전환시키는 단계; 및
(c) 숙주 세포를 단독 탄소원으로서 갈락토스를 함유하는 배지에서 배양하여 이종 단백질을 발현하는 재조합 피키아 파스토리스 숙주 세포를 제공하는 단계
를 포함하는, 이종 단백질을 발현하는 재조합 피키아 파스토리스 숙주 세포를 생성시키는 방법.
제18항에 있어서, 숙주 세포가 갈락토스 퍼미아제를 발현하도록 추가로 유전적으로 공학처리된 것인 방법.
제18항에 있어서, 숙주 세포가, 갈락토스를 포함하는 하나 이상의 N-글리칸을 갖는 당단백질을 생성하도록 유전적으로 변형된 것인 방법.
a) 피키아 파스토리스 숙주 세포를 제공하는 단계;
b) 이러한 숙주 세포를, 갈락토키나제 활성, UDP-갈락토스-4-에피머라제 활성, 갈락토스-1-포스페이트 우리딜 트랜스퍼라제 활성, 및 임의로 갈락토스 퍼미아제 활성을 암호화하는 하나 이상의 핵산 분자로 형질전환시키는 단계;
c) 이와 같이 형질전환시킨 숙주 세포를, 단독 탄소원으로서 갈락토스를 함유하는 배지 상에서 배양하는 단계; 및
d) 단독 탄소원으로서 갈락토스를 함유하는 배지 상에서 성장할 수 있는 숙주 세포를 선별하는 단계
를 포함하는, 단독 탄소원으로서 갈락토스를 사용할 수 있는 피키아 파스토리스 숙주 세포를 생성 및 선별하는 방법.
제약상 허용되는 담체 중의, G0:G1/G2 글리코형태의 비가 2:1 미만인 당단백질을 포함하는 조성물.
제22항에 있어서, 당단백질이 항-Her2 항체, 항-RSV (호흡기 합포체 바이러스) 항체, 항-TNFα 항체, 항-VEGF 항체, 항-CD3 수용체 항체, 항-CD41 7E3 항체, 항-CD25 항체, 항-CD52 항체, 항-CD33 항체, 항-IgE 항체, 항-CD11a 항체, 항-EGF 수용체 항체, 및 항-CD20 항체, 및 그의 변이체로 이루어진 군으로부터 선택된 항체인 당단백질 조성물.
제22항에 있어서, 당단백질이 Fc 융합 단백질인 당단백질 조성물.
제24항에 있어서, Fc 융합 단백질이 에타네르셉트 (etanercept)인 당단백질 조성물.
재조합 피키아 파스토리스 균주 YDX477의 유전자형과 동일한 유전자형을 갖는 재조합 피키아 파스토리스 숙주 세포.