KR101930961B1

KR101930961B1 - 피키아 파스토리스에서 생산된 치료 당단백질 상의 ｎ-글리코실화 부위 점유를 증가시키는 방법

Info

Publication number: KR101930961B1
Application number: KR1020127022052A
Authority: KR
Inventors: 나타라잔 세투라만; 병-권 최; 비안카 프린즈; 마이클 밀; 테란스 에이. 스타데임
Original assignee: 머크 샤프 앤드 돔 코포레이션
Priority date: 2010-02-24
Filing date: 2011-02-23
Publication date: 2018-12-19
Also published as: EP2539430A4; US8715963B2; US20120328626A1; WO2011106389A1; AU2011220878A1; JP2013520205A; EP2539430B1; JP5976549B2; RU2012140429A; US20140227290A1; KR20120134116A; CA2788992A1; CN102858949A; CN102858949B; BR112012020882A2; EP2539430A1; MX2012009802A

Abstract

본원에 기술된 바와 같이 변형되지 않은 재조합 숙주 세포에서 생산된 치료 당단백질의 N-글리코실화 부위 점유와 비교하여, 본원에 기술된 바와 같이 변형되고 치료 당단백질을 발현하도록 유전자 조작된 재조합 숙주 세포에서 생산된 치료 당단백질의 N-글리코실화 부위 점유를 증가시키는 방법이 기술된다. 특히, 이러한 방법은 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제(oligosaccharyltransferase)를 과다발현하는 재조합 숙주 세포를 제공하고, 특정 실시양태에서 이러한 올리고사카릴트랜스퍼라제는 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 코딩하는 숙주 세포 유전자의 발현의 존재 하에 효모 OTase 복합체의 하나 이상의 필수 단백질, 예를 들어, 리슈마니아 메이저(Leishmania major) STT3D 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있다. 이러한 방법은 저급 진핵생물 세포 예컨대 효모 및 사상 진균 및 고급 진핵생물 세포 예컨대 식물 및 곤충 세포 및 포유동물 세포 모두에서 N-글리코실화 부위 점유가 증가된 치료 당단백질을 생산하는데 유용하다.

Description

피키아 파스토리스에서 생산된 치료 당단백질 상의 Ｎ-글리코실화 부위 점유를 증가시키는 방법{METHOD FOR INCREASING N-GLYCOSYLATION SITE OCCUPANCY ON THERAPEUTIC GLYCOPROTEINS PRODUCED IN PICHIA PASTORIS}

관련 출원에 대한 교차 참조

전자 제출된 서열 목록에 대한 참조

발명의 배경

(1) 발명의 분야

본 발명은 본 발명에 따라 변형되지 않은 재조합 숙주 세포에서 생산된 치료 당단백질의 N-글리코실화 부위 점유와 비교하여, 본 발명에 따라 변형되고 이종성 당단백질을 발현하도록 유전자 조작된 재조합 숙주 세포에서 생산된 이종성 당단백질의 N-글리코실화 부위 점유를 증가시키는 방법에 관한 것이다. 특히, 본 발명은 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제(oligosaccharyltransferase) (특정 실시양태에서 숙주 세포의 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체의 존재 하에 효모 OTase 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있음)를 과다발현하는 재조합 숙주 세포, 및 이러한 숙주 세포를 사용하여 이종성 당단백질을 생산하는 방법을 제공한다.

(2) 관련 기술의 설명

재조합 인간 단백질을 생산하는 능력은 인간 건강 관리에서의 큰 진전으로 이어졌고, 여전히 활발한 약물 개발 분야이다. 다수의 치료 단백질이 적합한 구조-기능 활성 및 이어지는 인간 혈청에서의 안정성을 확실히 하기 위해 단백질의 특정 아스파라긴 잔기에 번역 후에 글리칸이 부가되는 것 (N-글리코실화)을 필요로 한다. 인간에서의 치료적 용도를 위해, 당단백질은 인간-유사 N-글리코실화를 필요로 한다. 인간-유사 당단백질 프로세싱을 모방할 수 있는 포유동물 세포주 (예를 들어, 차이니즈 햄스터 난소 (CHO) 세포, 인간 망막 세포)는 낮은 단백질 역가, 긴 발효 시간, 비균질성 생성물 및 지속적인 바이러스 봉쇄가 포함되는 몇몇 단점이 있다. 따라서, 짧은 발효 시간으로 높은 단백질 역가를 생산할 뿐만 아니라, 인간-유사 당단백질을 또한 생산할 수 있는 발현 시스템을 사용하는 것이 바람직하다.

진균 숙주 예컨대 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 또는 메틸이용성(methylotrophic) 효모 예컨대 피키아 파스토리스(Pichia pastoris)는 치료 단백질 발현에 대한 뚜렷한 장점이 있고, 예를 들어, 이는 다량의 내인성 단백질을 분비하지 않고, 이종성 단백질을 생산하기 위한 강한 유도성 프로모터가 이용가능하며, 규정된 화학 배지에서 동물 혈청을 사용하지 않으면서 성장될 수 있고, 높은 역가의 재조합 단백질을 생산할 수 있다 (문헌 [Cregg et al., FEMS Microbiol. Rev. 24: 45-66 (2000)]). 그러나, 효모에서 발현된 글리코실화 단백질은 "고-만노스" 글리칸을 초래하는 추가적인 만노스 당을 일반적으로 함유한다. 고-만노스 N-글리칸은 특정 개체에 투여되었을 때 불리한 반응을 초래할 수 있기 때문에, 일반적으로 효모는 인간 용도에 의도되는 치료 당단백질을 생산하는데 사용되지 않았다. 그러나, 인간-유사 N-글리칸을 생산하도록 효모를 유전자 조작하는 방법들이 미국 출원 공개 번호 20040230042, 20050208617, 20040171826, 20050208617, 및 20060286637에 기술된 방법들과 함께 미국 특허 번호 7,029,872 및 7,449,308에 기술되어 있다. 이러한 방법들은 효모 유형 N-글리칸 대신에 인간-유사 복합 또는 하이브리드(hybrid) N-글리칸을 우세하게 갖는 치료 당단백질을 생산할 수 있는 재조합 효모를 구축하는데 사용되었다.

유전자 조작된 효모가 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질을 생산할 수 있는 한편, 당단백질 상의 N-글리칸 부착 부위의 점유가 광범위하게 다르고, 포유동물 세포에서 생산된 당단백질 내의 동일한 부위의 점유보다 일반적으로 더 낮다는 것이 발견되었다. 이는 피키아 파스토리스에서 생산된 다양한 재조합 항체에 대해 관찰되었다. 그러나, N-글리칸 부착 부위 점유의 다양성이 포유동물 세포에서도 마찬가지로 관찰되었다. 예를 들어, 문헌 [Gawlitzek et al., Identification of cell culture conditions to control N-glycosylation site-occupancy of recombinant glycoproteins expressed in CHO cells, Biotechnol. Bioengin. 103: 1164-1175 (2009)]에서, N-글리코실화 부위 점유가 CHO 세포에서 생산된 특정 당단백질들에 대한 특정 부위들에 대해 다르고, 이러한 부위들에서의 점유를 제어하기 위해 성장 조건에서의 변형이 이루어질 수 있다는 것이 개시되었다. 국제 출원 공개 번호 WO 2006107990에는 돌리콜-연결 올리고사카라이드 합성 경로를 사용하여 진핵생물 세포의 단백질 N-글리코실화를 개선하는 방법이 개시되어 있다. N-글리코실화 부위 점유의 제어가 문헌 [Jones et al., Biochim. Biophys. Acta. 1726: 121-137 (2005)]에서 리뷰되었다. 그러나, 재조합 숙주 세포에서 생산된 치료 단백질의 N-글리코실화 부위 점유를 증가시키는 방법이 여전히 요구된다.

발명의 개요

본 발명은 본원에 개시된 바와 같이 변형된 숙주 세포에서 생산된 당단백질의 N-글리코실화 부위 점유가 본원에 개시된 바와 같이 변형되지 않은 숙주 세포에서 생산된 동일한 당단백질의 N-글리코실화 부위 점유에 비해 증가된, 본원에 개시된 바와 같이 변형된 재조합 숙주 세포에서 치료 당단백질을 생산하는 방법을 제공한다. 예를 들어, 본원에 개시된 바와 같이 변형된 효모 숙주 세포에서, 본원에서 생산된 당단백질의 N-글리코실화 부위 점유가 재조합 포유동물 또는 인간 세포에서 생산된 동일한 당단백질의 N-글리코실화 부위 점유와 동일하거나 또는 이와 더욱 유사할 것이다.

재조합 숙주 세포에 생산된 당단백질 상의 N-글리코실화 부위 점유를 증가시키기 위해, 하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 (OTase)가 숙주 세포에서의 당단백질의 발현 전에 또는 발현과 동시에 재조합 숙주 세포에서 과다발현된다. 특정 측면에서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 중 하나 이상이 숙주 세포의 내인성 헤테로올리고머성(hetero-oligomeric) 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 하나 이상의 필수 서브유닛의 치사성 돌연변이를 기능적으로 보완할 수 있다. 리슈마니아 메이저(Leishmania major) STT3D 단백질이 사카로미세스 세레비지아에서 STT3 유전자좌 및 WBP1, OST1, SWP1 및 OST2로부터 선택된 하나 이상의 유전자좌에서의 치사성 돌연변이를 억제하는 것으로 나타난 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제의 예이다 (문헌 [Naseb et al., Molec. Biol. Cell 19: 3758-3768 (2008)]). 일반적으로, 하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제가 숙주 세포의 내인성 STT3 단백질이 포함되는, 숙주 세포의 내인성 OTase 복합체를 구성하는 단백질의 존재 하에 구성적으로 또는 유도성으로 과다발현된다. 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 유전자를 코딩하는 발현 카세트들은 숙주 세포 게놈 내의 임의의 부위 내로 통합될 수 있거나, 또는 숙주 세포의 염색체외 공간 내에 위치할 수 있고, 즉 플라스미드, 바이러스, 2 ㎛ 플라스미드, 미니염색체 등과 같은 자율적으로 복제되는 유전 요소일 수 있다.

특정 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제 중 하나 이상이 리슈마니아(Leishmania) 종의 STT3A 단백질, STT3B 단백질, STT3C 단백질, STT3D 단백질, 또는 그의 조합이다. 특정 실시양태에서, 하나 이상의 단일-서브유닛 올리고사카릴트랜스퍼라제가 리슈마니아 메이저 STT3A 단백질, STT3B 단백질, STT3C 단백질, STT3D 단백질, 또는 그의 조합이다. 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 핵산 분자는 숙주 세포 STT3 단백질이 포함되는, 숙주 세포의 OTase 복합체를 구성하는 단백질을 코딩하는 내인성 유전자의 발현을 대신하여 과다발현되지 않는다. 그보다는, 숙주 세포의 STT3를 코딩하는 내인성 유전자의 발현을 포함하는, 숙주 세포의 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 유전자의 발현의 존재 하에 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 핵산 분자가 구성적으로 또는 유도성으로 과다발현된다. 단일-서브유닛 OTase를 코딩하는 각각의 발현 카세트는 숙주 세포 게놈 내의 임의의 부위 내로 통합될 수 있거나, 또는 숙주 세포의 염색체외 공간 내에 위치할 수 있고, 즉 플라스미드, 바이러스, 2 ㎛ 플라스미드, 미니염색체 등과 같은 자율적으로 복제되는 유전 요소일 수 있다.

포유동물- 또는 인간-유사 복합 N-글리칸을 생산하도록 유전자 조작된 피키아 파스토리스 숙주 세포를 사용하여 본원에서 본 발명이 예시되었다; 그러나, 본 발명이 다른 효모 또는 사상 진균 숙주 세포, 특히 포유동물- 또는 인간-유사 복합 또는 하이브리드 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 진균에 적용되어 이러한 효모 또는 사상 진균 숙주 세포에서 생산된 당단백질의 전체적인 N-글리코실화 부위 점유를 개선시킬 수 있다. 추가적인 측면에서, 숙주 세포는 야생형 또는 내인성 숙주 세포 N-글리코실화 패턴, 예를 들어, 과만노실화(hypermannosylated) 또는 고-만노스 N-글리칸을 갖는 재조합 이종성 단백질을 생산하는 효모 또는 사상 진균이다. 추가적인 측면에서, 숙주 세포는 알파-1,6-만노실트랜스퍼라제(mannosyltransferase) 활성 (예를 들어, 사카로미세스 세레비지아에 또는 피키아 파스토리스와 같은, 그러나 이에 한정되지 않는 다양한 효모 균주의 경우의 och1p 활성)이 결여되어 고-만노스 N-글리칸을 갖는 재조합 이종성 단백질을 생산하는 효모 또는 사상 진균이다. 추가로, 본 발명은 식물 또는 포유동물 발현 시스템에서 생산된 당단백질, 특히 2개를 초과하는 N-연결 글리코실화 부위가 있는 당단백질의 전체적인 N-글리코실화 부위 점유를 개선하기 위해 식물 및 포유동물 발현 시스템에 또한 적용될 수 있다.

따라서, 상기의 한 측면에서, 하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자 및 이종성 당단백질을 코딩하는 핵산 분자를 포함하는 재조합 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 재조합 숙주 세포에서 이종성 당단백질을 생산하는 방법이 제공된다.

상기의 추가적인 측면에서, 하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자 및 이종성 당단백질을 코딩하는 핵산분자를 포함하는 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 숙주 세포에서 포유동물- 또는 인간-유사 복합 또는 하이브리드 N-글리칸을 갖는 이종성 당단백질을 생산하는 방법이 제공된다.

일반적으로, 상기 측면들에서, 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현된다.

상기 방법의 추가적인 측면에서, 숙주 세포는 피키아 파스토리스, 피키아 핀란디카(Pichia finlandica), 피키아 트레할로필라(Pichia trehalophila), 피키아 코클라마에(Pichia koclamae), 피키아 멤브라나에파시엔스(Pichia membranaefaciens), 피키아 오푼티아에(Pichia opuntiae), 피키아 써모톨레란스 (Pichia thermotolerans), 피키아 살릭타리아(Pichia salictaria), 피키아 구에르쿠움(Pichia guercuum), 피키아 페이페리(Pichia pijperi), 피키아 스팁티스(Pichia stiptis), 피키아 메타놀리카(Pichia methanolica), 피키아 미누타(Pichia minuta) (오가타에아 미누타(Ogataea minuta), 피키아 린드네리(Pichia lindneri)), 피키아(Pichia) 종, 사카로미세스 세레비지아에, 사카로미세스(Saccharomyces) 종, 한세눌라 폴리모르파(Hansenula polymorpha), 클루이베로미세스(Kluyveromyces) 종, 클루이베로미세스 락티스(Kluyveromyces lactis), 칸디다 알비칸스(Candida albicans), 아스페르길루스 니둘란스(Aspergillus nidulans), 아스페르길루스 니게르(Aspergillus niger), 아스페르길루스 오리자에(Aspergillus oryzae), 트리코더마 레에세이(Trichoderma reesei), 크리소스포리움 루크노웬세(Chrysosporium lucknowense), 푸사리움(Fusarium) 종, 푸사리움 그라미네움(Fusarium gramineum), 푸사리움 베네나툼(Fusarium venenatum), 및 뉴로스포라 크라사(Neurospora crassa)로 이루어진 군으로부터 선택된다. 또 다른 측면에서, 숙주 세포는 곤충, 식물 또는 포유동물 숙주 세포이다.

상기의 추가적인 측면에서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자 및 이종성 당단백질을 코딩하는 핵산분자를 포함하고, 이때 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 재조합 저급 진핵생물 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 저급 진핵생물 숙주 세포에서 이종성 당단백질을 생산하는 방법이 제공된다.

상기 방법의 추가적인 측면에서, 저급 진핵생물 숙주 세포는 피키아 파스토리스, 피키아 핀란디카, 피키아 트레할로필라, 피키아 코클라마에, 피키아 멤브라나에파시엔스, 피키아 오푼티아에, 피키아 써모톨레란스, 피키아 살릭타리아, 피키아 구에르쿠움, 피키아 페이페리, 피키아 스팁티스, 피키아 메타놀리카, 피키아 미누타 (오가타에아 미누타, 피키아 린드네리), 피키아 종, 사카로미세스 세레비지아에, 사카로미세스 종, 한세눌라 폴리모르파, 클루이베로미세스 종, 클루이베로미세스 락티스, 칸디다 알비칸스, 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리자에, 트리코더마 레에세이, 크리소스포리움 루크노웬세, 푸사리움 종, 푸사리움 그라미네움, 푸사리움 베네나툼, 및 뉴로스포라 크라사로 이루어진 군으로부터 선택된다.

상기의 추가적인 측면에서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자 및 이종성 당단백질을 코딩하는 핵산분자를 포함하고, 이때 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 재조합 효모 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 재조합 효모 숙주 세포에서 이종성 당단백질을 생산하는 방법이 제공된다.

상기 방법들에서, 재조합 효모 숙주 세포가 효모 N-글리칸 패턴의 당단백질을 생산하거나, 또는 과만노실화가 결여되었지만 고-만노스 N-글리칸을 생산하는 효모 패턴의 당단백질을 생산하도록 효모가 유전자 조작되었다. 예를 들어, α1,6-만노실트랜스퍼라제 활성, 예를 들어, Och1p 활성이 결여되도록 효모가 유전자 조작될 수 있다. 추가적인 측면에서, 포유동물 또는 인간-유사 N-글리칸을 갖는 당단백질을 생산하도록 효모가 유전자 조작된다.

특정 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 리슈마니아 종 STT3A 단백질, STT3B 단백질, STT3C 단백질, STT3D 단백질, 또는 그의 조합이다. 특정 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 리슈마니아 메이저 STT3A 단백질, STT3B 단백질, STT3C 단백질, STT3D 단백질, 또는 그의 조합이다. 추가적인 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 OTase 복합체, 예를 들어, 효모 OTase 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있다. 추가적인 측면에서, OTase 복합체의 필수 단백질은 사카로미세스 세레비지아에 및/또는 피키아 파스토리스 STT3 유전자좌, WBP1 유전자좌, OST1 유전자좌, SWP1 유전자좌, 또는 OST2 유전자좌, 또는 이들의 상동체에 의해 코딩된다. 예를 들어, 추가적인 측면에서, 예를 들어 단일-서브유닛 올리고사카릴트랜스퍼라제는 사카로미세스 세레비지아에 OTase 복합체의 하나 이상의 필수 단백질의 치사성 표현형을 기능적으로 억제 (또는 구조 또는 보완)할 수 있는 리슈마니아 메이저 STT3D 단백질이다.

상기 방법의 추가적인 측면에서, 효모 숙주 세포는 피키아 파스토리스, 피키아 핀란디카, 피키아 트레할로필라, 피키아 코클라마에, 피키아 멤브라나에파시엔스, 피키아 오푼티아에, 피키아 써모톨레란스, 피키아 살릭타리아, 피키아 구에르쿠움, 피키아 페이페리, 피키아 스팁티스, 피키아 메타놀리카, 피키아 미누타 (오가타에아 미누타, 피키아 린드네리), 피키아 종, 사카로미세스 세레비지아에, 사카로미세스 종, 한세눌라 폴리모르파, 클루이베로미세스 종, 클루이베로미세스 락티스, 및 칸디다 알비칸스로 이루어진 군으로부터 선택된다.

상기의 추가적인 측면에서, 효모 올리고사카릴트랜스퍼라제 (OTase) 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있는 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자 및 이종성 당단백질을 코딩하는 핵산분자를 포함하고, 이때 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 재조합 효모 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 재조합 효모 숙주 세포에서 이종성 당단백질을 생산하는 방법이 제공된다.

상기 방법들에서, 재조합 효모 숙주 세포가 효모 N-글리칸 패턴의 당단백질을 생산하거나, 또는 고-만노스 N-글리칸을 포함하지만 과만노실화가 결여된 효모 패턴의 당단백질을 생산하도록 효모가 유전자 조작되었다. 예를 들어, α1,6-만노실트랜스퍼라제 활성, 예를 들어, Och1p 활성이 결여되도록 효모가 유전자 조작될 수 있다. 추가적인 측면에서, 포유동물 또는 인간-유사 N-글리칸을 갖는 당단백질을 생산하도록 효모가 유전자 조작된다.

특정 실시양태에서, 숙주 세포는 리슈마니아 종 STT3A 단백질, STT3B 단백질, STT3C 단백질, STT3D 단백질, 또는 그의 조합을 코딩하는 하나 이상의 핵산 분자를 추가로 포함한다. 특정 실시양태에서, 숙주 세포는 리슈마니아 메이저 STT3A 단백질, STT3B 단백질, STT3C 단백질, 또는 그의 조합을 코딩하는 하나 이상의 핵산을 추가로 포함한다.

상기의 추가적인 측면에서, 단일-서브유닛 이종성 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자 및 이종성 당단백질을 코딩하는 핵산분자를 포함하고, 이때 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 사상 진균 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 사상 진균 숙주 세포에서 이종성 당단백질을 생산하는 방법이 제공된다. 사상 진균 숙주 세포는 N-글리칸이 사상 진균 패턴을 갖는 당단백질을 생산하거나, 또는 포유동물 또는 인간-유사 N-글리칸을 갖는 당단백질을 생산하도록 유전자 조작된다.

특정 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 리슈마니아 종 STT3A 단백질, STT3B 단백질, STT3C 단백질, STT3D 단백질, 또는 그의 조합이다. 특정 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 리슈마니아 메이저 STT3A 단백질, STT3B 단백질, STT3C 단백질, STT3D 단백질 또는 그의 조합이다. 추가적인 실시양태에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 OTase 복합체, 예를 들어, 효모 OTase 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있다. 추가적인 측면에서, OTase 복합체의 필수 단백질은 사카로미세스 세레비지아에 및/또는 피키아 파스토리스 STT3 유전자좌, WBP1 유전자좌, OST1 유전자좌, SWP1 유전자좌, 또는 OST2 유전자좌, 또는 이들의 상동체에 의해 코딩된다. 예를 들어, 추가적인 측면에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 사카로미세스 세레비지아에 OTase 복합체의 하나 이상의 필수 단백질의 치사성 표현형을 기능적으로 억제 (또는 구조 또는 보완)할 수 있는 리슈마니아 메이저 STT3D 단백질이다.

상기의 추가적인 측면에서, 사상 진균 숙주 세포는 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리자에, 트리코더마 레에세이, 크리소스포리움 루크노웬세, 푸사리움 종, 푸사리움 그라미네움, 푸사리움 베네나툼, 및 뉴로스포라 크라사로 이루어진 군으로부터 선택된다.

상기 방법들 중 어느 하나의 추가적인 실시양태에서, G0, G1, G2, A1, 또는 A2로부터 선택된 하나 이상의 포유동물- 또는 인간-유사 복합 N-글리칸을 포함하는 당단백질을 생산하도록 숙주 세포가 유전자 조작된다. 추가적인 실시양태에서, 양분화(bisected) N-글리칸을 갖거나 다중안테나성(multiantennary) N-글리칸을 갖는 하나 이상의 포유동물- 또는 인간-유사 복합 N-글리칸을 포함하는 당단백질을 생산하도록 숙주 세포가 유전자 조작된다. 다른 실시양태에서, GlcNAcMan₃GlcNAc₂; GalGlcNAcMan₃GlcNAc₂; NANAGalGlcNAcMan₃GlcNAc₂; Man₅GlcNAc₂, GlcNAcMan₅GlcNAc₂, GalGlcNAcMan₅GlcNAc₂, 및 NANAGalGlcNAcMan₅GlcNAc₂로부터 선택된 하나 이상의 포유동물- 또는 인간-유사 하이브리드 N-글리칸을 포함하는 당단백질을 생산하도록 숙주 세포가 유전자 조작된다. 추가적인 실시양태에서, N-글리칸 구조가 G-2 구조 Man₃GlcNAc₂로 이루어진다.

상기 방법들 중 어느 하나의 특정 실시양태에서, 이종성 당단백질은, 예를 들어, 에리트로포이에틴 (EPO); 인터페론 α, 인터페론 β, 인터페론 γ 및 인터페론 ω와 같은 시토카인; 및 과립구-콜로니 자극 인자 (GCSF); 과립구 대식세포-콜로니 자극 인자 (GM-CSF); 인자 VIII, 인자 IX 및 인간 단백질 C와 같은 응고 인자; 항트롬빈 III; 트롬빈; 가용성 IgE 수용체 α-사슬; IgG, IgG 단편, IgG 융합물 및 IgM과 같은 이뮤노글로불린; 가용성 TNF 수용체-Fc 융합 단백질과 같은 이뮤노어드헤신 및 기타 Fc 융합 단백질; RAGE-Fc 융합 단백질; 인터류킨; 유로키나제(urokinase); 키마제(chymase); 우레아 트립신 억제제; IGF-결합 단백질; 표피 성장 인자; 성장 호르몬-방출 인자; 아넥신 V 융합 단백질; 안지오스타틴; 혈관 내피 성장 인자-2; 골수성 전구세포 억제 인자-1; 오스테오프로테게린; α-1-항트립신; α-태아 단백질; DNase II; 인간 플라스미노겐의 크링글(kringle) 3; 글루코세레브로시다제(glucocerebrosidase); TNF 결합 단백질 1; 여포 자극 호르몬; 세포독성 T 림프구 관련 항원 4 - Ig; 막횡단 활성화제 및 칼슘 조정제 및 시클로필린 리간드; 글루카곤 유사 단백질 1; 또는 IL-2 수용체 효능제이다.

상기 방법들 중 어느 하나의 추가적인 실시양태에서, 이종성 단백질은 항체이고, 이의 예로는 항-Her2 항체, 항-RSV (호흡기 세포융합 바이러스) 항체, 항-TNFα 항체, 항-VEGF 항체, 항-CD3 수용체 항체, 항-CD41 7E3 항체, 항-CD25 항체, 항-CD52 항체, 항-CD33 항체, 항-IgE 항체, 항-CD11a 항체, 항-EGF 수용체 항체, 또는 항-CD20 항체가 포함되지만 이에 한정되지는 않는다.

상기 방법들 중 어느 하나의 특정 측면에서, 숙주 세포는 글리코시다제(glycosidase), 만노시다제(mannosidase), 또는 글리코실트랜스퍼라제(glycosyltransferase) 활성 (UDP-GlcNAc 트랜스퍼라제 (GnT) I, GnT II, GnT III, GnT IV, GnT V, GnT VI, UDP-갈락토실트랜스퍼라제(galactosyltransferase) (GalT), 푸코실트랜스퍼라제(fucosyltransferase), 및 시알릴트랜스퍼라제(sialyltransferase)로 이루어진 군의 구성원으로부터 유래됨)의 하나 이상의 촉매 도메인을 코딩하는 하나 이상의 핵산 분자를 포함한다. 특정 실시양태에서, 만노시다제는 카에노랍디티스 엘레간스(C. elegans) 만노시다제 IA, 카에노랍디티스 엘레간스 만노시다제 IB, 드로소필라 멜라노가스터(D . melanogaster) 만노시다제 IA, 호모 사피엔스(H . sapiens) 만노시다제 IB, 페니실리움 시트리눔(P . citrinum) 만노시다제 I, 마우스 만노시다제 IA, 마우스 만노시다제 IB, 아스페르길루스 니둘란스 만노시다제 IA, 아스페르길루스 니둘란스 만노시다제 IB, 아스페르길루스 니둘란스 만노시다제 IC, 마우스 만노시다제 II, 카에노랍디티스 엘레간스 만노시다제 II, 호모 사피엔스 만노시다제 II, 및 만노시다제 III으로 이루어진 군으로부터 선택된다.

상기 방법들 중 어느 하나의 특정 측면에서, 촉매 도메인 및 세포성 표적화 신호 펩티드를 포함하는 융합 단백질을 형성함으로써 하나 이상의 촉매 도메인이 국소화된다. 세포성 표적화 신호 펩티드를 코딩하는 DNA 단편과 효소 활성이 있는 촉매 도메인을 코딩하는 DNA 단편의 인-프레임(in-frame) 결찰에 의해 형성된 하나 이상의 유전자 구축물에 의해 융합 단백질이 코딩될 수 있다. 표적화 신호 펩티드의 예로는 ER 또는 골지의 막-결합 단백질, 복구 신호, 제II형 막 단백질, 제I형 막 단백질, 막-스패닝(spanning) 뉴클레오티드 당 수송체, 만노시다제, 시알릴트랜스퍼라제, 글루코시다제(glucosidase), 만노실트랜스퍼라제, 및 포스포-만노실트랜스퍼라제가 포함되지만, 이에 한정되지는 않는다.

상기 방법들 중 어느 하나의 특정 측면에서, 숙주 세포는 UDP-GlcNAc 수송체, UDP-갈락토스 수송체, GDP-푸코스 수송체, CMP-시알산 수송체, 및 뉴클레오티드 디포스파타제(diphosphatase)로 이루어진 군으로부터 선택된 하나 이상의 효소를 코딩하는 하나 이상의 핵산 분자를 추가로 포함한다.

상기 방법들 중 어느 하나의 추가적인 측면에서, 숙주 세포는 α1,2-만노시다제 활성, UDP-GlcNAc 트랜스퍼라제 (GnT) I 활성, 만노시다제 II 활성, 및 GnT II 활성을 코딩하는 하나 이상의 핵산 분자를 포함한다.

상기 방법들 중 어느 하나의 추가적인 측면에서, 숙주 세포는 α1,2-만노시다제 활성, UDP-GlcNAc 트랜스퍼라제 (GnT) I 활성, 만노시다제 II 활성, GnT II 활성, 및 UDP-갈락토실트랜스퍼라제 (GalT) 활성을 코딩하는 하나 이상의 핵산 분자를 포함한다.

상기 방법들 중 어느 하나의 추가적인 측면에서, 숙주 세포는 만노실트랜스퍼라제 및 포스포만노실트랜스퍼라제로 이루어진 군으로부터 선택된 하나 이상의 효소의 활성이 결핍된다. 추가적인 측면에서, 숙주 세포는 1,6 만노실트랜스퍼라제, 1,3 만노실트랜스퍼라제, 및 1,2 만노실트랜스퍼라제로 이루어진 군으로부터 선택된 효소를 발현하지 않는다.

상기 방법들 중 어느 하나의 특정 측면에서, 숙주 세포는 피키아 파스토리스의 och1 돌연변이체이다.

(a) 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자, 및 (b) 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 내인성 숙주 세포 STT3 유전자의 발현을 포함하여 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 숙주 세포가 추가로 제공된다.

(a) 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자, 및 (b) 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 저급 진핵생물 숙주 세포가 추가로 제공된다.

(a) 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자, 및 (b) 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 효모 숙주 세포가 추가로 제공된다.

(a) 효모 올리고사카릴트랜스퍼라제 (OTase) 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있는 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자, 및 (b) 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 효모 숙주 세포가 추가로 제공된다.

(a) 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자, 및 (b) 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 사상 진균 숙주 세포가 추가로 제공된다.

(a) 효모 또는 사상 진균 올리고사카릴트랜스퍼라제 (OTase) 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있는 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자, 및 (b) 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 사상 진균 숙주 세포가 추가로 제공된다.

추가적인 측면에서, 상기 숙주 세포는 리슈마니아 종 STT3A 단백질, STT3B 단백질, STT3C 단백질, 또는 그의 조합을 코딩하는 하나 이상의 핵산 분자를 추가로 포함한다.

상기 숙주 세포들 중 어느 하나의 추가적인 실시양태에서, G0, G1, G2, A1, 또는 A2로부터 선택된 하나 이상의 포유동물- 또는 인간-유사 복합 N-글리칸을 포함하는 당단백질을 생산하도록 숙주 세포가 유전자 조작된다. 추가적인 실시양태에서, 양분화 N-글리칸을 갖거나 다중안테나성 N-글리칸을 갖는 하나 이상의 인간-유사 복합 N-글리칸을 포함하는 당단백질을 생산하도록 숙주 세포가 유전자 조작된다. 다른 실시양태에서, GlcNAcMan₃GlcNAc₂; GalGlcNAcMan₃GlcNAc₂; NANAGalGlcNAcMan₃GlcNAc₂; Man₅GlcNAc₂, GlcNAcMan₅GlcNAc₂, GalGlcNAcMan₅GlcNAc₂, 및 NANAGalGlcNAcMan₅GlcNAc₂로부터 선택된 하나 이상의 포유동물- 또는 인간-유사 하이브리드 N-글리칸을 포함하는 당단백질을 생산하도록 숙주 세포가 유전자 조작된다. 추가적인 실시양태에서, N-글리칸 구조가 G-2 구조 Man₃GlcNAc₂로 이루어진다.

상기 숙주 세포들 중 어느 하나의 특정 실시양태에서, 이종성 당단백질은, 예를 들어, 에리트로포이에틴 (EPO); 인터페론 α, 인터페론 β, 인터페론 γ 및 인터페론 ω와 같은 시토카인; 및 과립구-콜로니 자극 인자 (GCSF); 과립구 대식세포-콜로니 자극 인자 (GM-CSF); 인자 VIII, 인자 IX 및 인간 단백질 C와 같은 응고 인자; 항트롬빈 III; 트롬빈; 가용성 IgE 수용체 α-사슬; IgG, IgG 단편, IgG 융합물 및 IgM과 같은 이뮤노글로불린; 가용성 TNF 수용체-Fc 융합 단백질과 같은 이뮤노어드헤신 및 기타 Fc 융합 단백질; RAGE-Fc 융합 단백질; 인터류킨; 유로키나제; 키마제; 우레아 트립신 억제제; IGF-결합 단백질; 표피 성장 인자; 성장 호르몬-방출 인자; 아넥신 V 융합 단백질; 안지오스타틴; 혈관 내피 성장 인자-2; 골수성 전구세포 억제 인자-1; 오스테오프로테게린; α-1-항트립신; α-태아 단백질; DNase II; 인간 플라스미노겐의 크링글 3; 글루코세레브로시다제; TNF 결합 단백질 1; 여포 자극 호르몬; 세포독성 T 림프구 관련 항원 4 - Ig; 막횡단 활성화제 및 칼슘 조정제 및 시클로필린 리간드; 글루카곤 유사 단백질 1; 및 IL-2 수용체 효능제로 이루어진 군으로부터 선택될 수 있다.

상기 숙주 세포들 중 어느 하나의 추가적인 실시양태에서, 이종성 단백질은 항체이고, 이의 예로는 항-Her2 항체, 항-RSV (호흡기 세포융합 바이러스) 항체, 항-TNFα 항체, 항-VEGF 항체, 항-CD3 수용체 항체, 항-CD41 7E3 항체, 항-CD25 항체, 항-CD52 항체, 항-CD33 항체, 항-IgE 항체, 항-CD11a 항체, 항-EGF 수용체 항체, 또는 항-CD20 항체가 포함되지만 이에 한정되지는 않는다.

상기 숙주 세포들의 특정 측면에서, 숙주 세포는 글리코시다제, 만노시다제, 또는 글리코실트랜스퍼라제 활성 (UDP-GlcNAc 트랜스퍼라제 (GnT) I, GnT II, GnT III, GnT IV, GnT V, GnT VI, UDP-갈락토실트랜스퍼라제 (GalT), 푸코실트랜스퍼라제, 및 시알릴트랜스퍼라제로 이루어진 군의 구성원으로부터 유래됨)의 하나 이상의 촉매 도메인을 코딩하는 하나 이상의 핵산 분자를 포함한다. 특정 실시양태에서, 만노시다제는 카에노랍디티스 엘레간스 만노시다제 IA, 카에노랍디티스 엘레간스 만노시다제 IB, 드로소필라 멜라노가스터 만노시다제 IA, 호모 사피엔스 만노시다제 IB, 페니실리움 시트리눔 만노시다제 I, 마우스 만노시다제 IA, 마우스 만노시다제 IB, 아스페르길루스 니둘란스 만노시다제 IA, 아스페르길루스 니둘란스 만노시다제 IB, 아스페르길루스 니둘란스 만노시다제 IC, 마우스 만노시다제 II, 카에노랍디티스 엘레간스 만노시다제 II, 호모 사피엔스 만노시다제 II, 및 만노시다제 III으로 이루어진 군으로부터 선택된다.

상기 숙주 세포들 중 어느 하나의 특정 측면에서, 촉매 도메인 및 세포성 표적화 신호 펩티드를 포함하는 융합 단백질을 형성함으로써 하나 이상의 촉매 도메인이 국소화된다. 세포성 표적화 신호 펩티드를 코딩하는 DNA 단편과 효소 활성이 있는 촉매 도메인을 코딩하는 DNA 단편의 인-프레임 결찰에 의해 형성된 하나 이상의 유전자 구축물에 의해 융합 단백질이 코딩될 수 있다. 표적화 신호 펩티드의 예로는 ER 또는 골지의 막-결합 단백질, 복구 신호 예컨대 HDEL 또는 KDEL, 제II형 막 단백질, 제I형 막 단백질, 막-스패닝 뉴클레오티드 당 수송체, 만노시다제, 시알릴트랜스퍼라제, 글루코시다제, 만노실트랜스퍼라제, 및 포스포-만노실트랜스퍼라제에 대한 것들이 포함되지만, 이에 한정되지는 않는다.

상기 숙주 세포들 중 어느 하나의 특정 측면에서, 숙주 세포는 UDP-GlcNAc 수송체, UDP-갈락토스 수송체, GDP-푸코스 수송체, CMP-시알산 수송체, 및 뉴클레오티드 디포스파타제로 이루어진 군으로부터 선택된 하나 이상의 효소를 코딩하는 하나 이상의 핵산 분자를 추가로 포함한다.

상기 숙주 세포들 중 어느 하나의 추가적인 측면에서, 숙주 세포는 α1,2-만노시다제 활성, UDP-GlcNAc 트랜스퍼라제 (GnT) I 활성, 만노시다제 II 활성, 및 GnT II 활성을 코딩하는 하나 이상의 핵산 분자를 포함한다.

상기 숙주 세포들 중 어느 하나의 추가적인 측면에서, 숙주 세포는 α1,2-만노시다제 활성, UDP-GlcNAc 트랜스퍼라제 (GnT) I 활성, 만노시다제 II 활성, GnT II 활성, 및 UDP-갈락토실트랜스퍼라제 (GalT) 활성을 코딩하는 하나 이상의 핵산 분자를 포함한다.

상기 숙주 세포들 중 어느 하나의 추가적인 측면에서, 숙주 세포는 피키아 파스토리스, 피키아 핀란디카, 피키아 트레할로필라, 피키아 코클라마에, 피키아 멤브라나에파시엔스, 피키아 오푼티아에, 피키아 써모톨레란스, 피키아 살릭타리아, 피키아 구에르쿠움, 피키아 페이페리, 피키아 스팁티스, 피키아 메타놀리카, 피키아 종, 사카로미세스 세레비지아에, 사카로미세스 종, 한세눌라 폴리모르파, 클루이베로미세스 종, 클루이베로미세스 락티스, 칸디다 알비칸스, 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리자에, 트리코더마 레에세이, 크리소스포리움 루크노웬세, 푸사리움 종, 푸사리움 그라미네움, 푸사리움 베네나툼, 뉴로스포라 크라사, 식물 세포, 곤충 세포, 및 포유동물 세포로 이루어진 군으로부터 선택된다.

상기 숙주 세포들 중 어느 하나의 추가적인 측면에서, 숙주 세포는 만노실트랜스퍼라제 및 포스포만노실트랜스퍼라제로 이루어진 군으로부터 선택된 하나 이상의 효소의 활성이 결핍된다. 추가적인 측면에서, 숙주 세포는 1,6 만노실트랜스퍼라제, 1,3 만노실트랜스퍼라제, 및 1,2 만노실트랜스퍼라제로 이루어진 군으로부터 선택된 효소를 발현하지 않는다.

상기 숙주 세포들 중 어느 하나의 특정 측면에서, 숙주 세포는 피키아 파스토리스이다. 추가적인 측면에서, 숙주 세포는 피키아 파스토리스의 och1 돌연변이체이다.

본원에서의 방법 및 숙주 세포는 조성물 내의 당단백질의 N-글리코실화 부위의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상이 점유된 당단백질 조성물을 생산하는데 사용될 수 있다.

추가로, 본원에서의 방법 및 숙주 세포가 조성물 내의 당단백질의 N-글리코실화 부위의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상이 점유되고 추가적인 측면에서는 푸코스가 결여된 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질 조성물을 생산하는데 사용될 수 있다.

추가로, 포유동물-유사 또는 인간-유사 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 진균 숙주 세포 또는 방법이 조성물 내의 당단백질의 N-글리코실화 부위의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상이 점유되고 추가적인 측면에서는 푸코스가 결여된 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질 조성물을 생산하는데 사용될 수 있다.

일부 측면에서, 푸코실화 포유동물- 또는 인간-유사 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 숙주 세포가 조성물 내의 당단백질의 N-글리코실화 부위의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상이 점유되고 추가적인 측면에서는 푸코스를 갖는 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질 조성물을 생산하는데 사용될 수 있다.

본원에서의 방법 및 숙주 세포는 조성물 내의 항체 분자의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상에서 두 N-글리코실화 부위 모두가 점유된 항체 조성물을 생산하는데 사용될 수 있다.

추가로, 본원에서의 방법 및 숙주 세포가 조성물 내의 항체 분자의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸에 푸코스가 결여된 항체 조성물을 생산하는데 사용될 수 있다.

추가로, 본원에서의 방법 및 효모 또는 사상 진균 숙주 세포가 조성물 내의 항체 분자의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸에 푸코스가 결여된 항체 조성물을 생산하는데 사용될 수 있다.

추가로, 포유동물-유사 또는 인간-유사 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 진균 숙주 세포 또는 방법이 조성물 내의 항체 분자의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상에서 두 N-글리코실화 부위 모두가 점유되고 항체가 푸코스가 결여된 포유동물- 또는 인간-유사 N-글리칸을 갖는 항체 조성물을 생산하는데 사용될 수 있다. 일부 측면에서, 푸코실화 포유동물- 또는 인간-유사 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 숙주 세포가 조성물 내의 항체 분자의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상에서 두 N-글리코실화 부위 모두가 점유되고 항체가 푸코스가 있는 포유동물- 또는 인간-유사 N-글리칸을 갖는 항체 조성물을 생산하는데 사용될 수 있다.

조성물 내의 무손상 항체 분자의 약 70％ 내지 약 99％에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 50-70 몰％가 G0 구조이고, N-글리칸의 15-25 몰％가 G1 구조이고, N-글리칸의 4-12 몰％가 G2 구조이고, N-글리칸의 5-17 몰％가 Man5 구조이며, N-글리칸의 3-15 몰％가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다.

조성물 내의 무손상 항체 분자의 약 70％ 내지 99％에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰％가 G0 구조이고, N-글리칸의 20-22 몰％가 G1 구조이며, N-글리칸의 약 16 내지 18 몰％가 Man₅GlcNAc₂ 코어(core) 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다.

특정 실시양태에서, 항체는 항-Her2 항체, 항-RSV (호흡기 세포융합 바이러스) 항체, 항-TNFα 항체, 항-VEGF 항체, 항-CD3 수용체 항체, 항-CD41 7E3 항체, 항-CD25 항체, 항-CD52 항체, 항-CD33 항체, 항-IgE 항체, 항-CD11a 항체, 항-EGF 수용체 항체, 및 항-CD20 항체로 이루어진 군으로부터 선택된 항체를 포함한다.

본원에 기술된 숙주 세포 및 방법에 의해 생산된 하나 이상의 당단백질을 포함하는 조성물이 추가로 제공된다.

특정 실시양태에서, 본원에서 제공되는 당단백질 조성물은 GlcNAc_(1-4)Man₃GlcNAc₂; Gal_(1-4)GlcNAc_(1-4)Man₃GlcNAc₂; NANA_(1-4)Gal_(1-4)GlcNAc_(1-4)Man₃GlcNAc₂와 같은 N-글리칸이 포함되지만 이에 한정되지 않는, 푸코실화 및 비-푸코실화 하이브리드 및 복합 N-글리칸 (양분화 및 다중안테나성 종 포함)을 갖는 당단백질을 포함한다.

특정 실시양태에서, 본원에서 제공되는 당단백질 조성물은 GlcNAcMan₃GlcNAc₂; GalGlcNAcMan₃GlcNAc₂; NANAGalGlcNAcMan₃GlcNAc₂; GlcNAcMan₅GlcNAc₂; GalGlcNAcMan₅GlcNAc₂; 및 NANAGalGlcNAcMan₅GlcNAc₂로 이루어진 군으로부터 선택된 하나 이상의 하이브리드 N-글리칸을 갖는 당단백질을 포함한다. 특정 측면에서, 이러한 하이브리드 N-글리칸이 조성물 내의 우세한 N-글리칸 종이다. 추가적인 측면에서, 이러한 하이브리드 N-글리칸은 조성물 내의 하이브리드 N-글리칸의 약 30％, 40％, 50％, 60％, 70％, 80％, 90％, 95％, 97％, 98％, 99％, 또는 100％를 이루는 특정 N-글리칸 종이다.

특정 실시양태에서, 본원에서 제공되는 당단백질 조성물은 GlcNAc₂Man₃GlcNAc₂; GalGlcNAc₂Man₃GlcNAc₂; Gal₂GlcNAc₂Man₃GlcNAc₂; NANAGal₂GlcNAc₂Man₃GlcNAc₂; 및 NANA₂Gal₂GlcNAc₂Man₃GlcNAc₂로 이루어진 군으로부터 선택된 하나 이상의 복합 N-글리칸을 갖는 당단백질을 포함한다. 특정 측면에서, 이러한 복합 N-글리칸이 조성물 내의 우세한 N-글리칸 종이다. 추가적인 측면에서, 이러한 복합 하이브리드 N-글리칸은 조성물 내의 복합 N-글리칸의 약 30％, 40％, 50％, 60％, 70％, 80％, 90％, 95％, 97％, 98％, 99％, 또는 100％를 이루는 특정 N-글리칸 종이다.

특정 실시양태에서, N-글리칸이 푸코실화된다. 일반적으로, 푸코스는 N-글리칸의 환원 끝부분에서의 GlcNAc와의 α1,3-연결, N-글리칸의 환원 끝부분에서의 GlcNAc와의 α1,6-연결, N-글리칸의 비-환원 끝부분에서의 Gal과의 α1,2-연결, N-글리칸의 비-환원 끝부분에서의 GlcNac와의 α1,3-연결, 또는 N-글리칸의 비-환원 끝부분에서의 GlcNAc와의 α1,4-연결로 존재한다.

따라서, 상기 당단백질 조성물들의 특정 측면에서, 당형(glycoform)은 GlcNAcMan₅GlcNAc₂(Fuc), GlcNAcMan₃GlcNAc₂(Fuc), GlcNAc₂Man₃GlcNAc₂(Fuc), GalGlcNAc₂Man₃GlcNAc₂(Fuc), Gal₂GlcNAc₂Man₃GlcNAc₂(Fuc), NANAGal₂GlcNAc₂Man₃GlcNAc₂(Fuc), 및 NANA₂Gal₂GlcNAc₂Man₃GlcNAc₂(Fuc)로 이루어진 군으로부터 선택된 당형이 생산되는 α1,3-연결 또는 α1,6-연결 푸코스; GlcNAc(Fuc)Man₅GlcNAc₂, GlcNAc(Fuc)Man₃GlcNAc₂, GlcNAc₂(Fuc₁ _-2)Man₃GlcNAc₂, GalGlcNAc₂(Fuc_1-2)Man₃GlcNAc₂, Gal₂GlcNAc₂(Fuc₁ _-2)Man₃GlcNAc₂, NANAGal₂GlcNAc₂(Fuc₁ _-2)Man₃GlcNAc₂, 및 NANA₂Gal₂GlcNAc₂(Fuc₁ _-2)Man₃GlcNAc₂로 이루어진 군으로부터 선택된 당형이 생산되는 α1,3-연결 또는 α1,4-연결 푸코스; 또는 Gal(Fuc)GlcNAc₂Man₃GlcNAc₂, Gal₂(Fuc₁ _-2)GlcNAc₂Man₃GlcNAc₂, NANAGal₂(Fuc₁ _-2)GlcNAc₂Man₃GlcNAc₂, 및 NANA₂Gal₂(Fuc₁ _-2)GlcNAc₂Man₃GlcNAc₂로 이루어진 군으로부터 선택된 당형이 생산되는 α1,2-연결 푸코스로 존재한다.

상기의 추가적인 측면에서, 복합 N-글리칸은 푸코실화 및 비-푸코실화 양분화 및 다중안테나성 종을 추가로 포함한다.

추가적인 측면에서, 당단백질은 Man₃GlcNAc₂ N-글리칸 구조로 이루어진 N-글리칸, 또는 Man₅GlcNAc₂를 포함하지만 이에 한정되지 않는 고-만노스 N-글리칸을 포함한다.

정의

본원에서 사용되는 경우에, 용어 "N-글리칸" 및 "당형"은 상호교환가능하게 사용되고, N-연결 올리고사카라이드, 예를 들어, 아스파라긴-N-아세틸글루코사민 연결에 의해 폴리펩티드의 아스파라긴 잔기에 부착된 올리고사카라이드를 지칭한다. N-연결 당단백질은 단백질 내의 아스파라긴 잔기의 아미드 질소에 연결된 N-아세틸글루코사민 잔기를 함유한다. 당단백질 상에서 발견되는 우세한 당은 글루코스, 갈락토스, 만노스, 푸코스, N-아세틸갈락토사민 (GalNAc), N-아세틸글루코사민 (GlcNAc) 및 시알산 (예를 들어, N-아세틸-뉴라민산 (NANA))이다. 이러한 당 기의 프로세싱은 ER의 내강에서 번역과 동시에 발생하고, N-연결 당단백질에 대해 골지체에서 번역 후에 계속된다.

N-글리칸에는 Man₃GlcNAc₂ ("Man"은 만노스를 지칭하고, "Glc"는 글루코스를 지칭하며, "NAc"는 N-아세틸을 지칭하고, GlcNAc는 N-아세틸글루코사민을 지칭한다)의 통상적인 5당류 코어가 있다. 일반적으로, N-글리칸 구조는 비-환원 끝부분을 왼쪽으로, 환원 끝부분을 오른쪽으로 하여 제시된다. N-글리칸의 환원 끝부분은 단백질 상의 글리코실화 부위를 이루는 Asn 잔기에 부착되는 끝부분이다. Man₃GlcNAc₂ ("Man3") 코어 구조 ("트리만노스 코어", "5당류 코어" 또는 "포시만노스(paucimannose) 코어"로 또한 지칭됨)에 부가되는 말초 당 (예를 들어, GlcNAc, 갈락토스, 푸코스 및 시알산)을 포함하는 분지 (안테나)의 개수와 관련하여 N-글리칸들이 상이하다. N-글리칸은 이의 분지 구성성분에 따라 분류된다 (예를 들어, 고-만노스, 복합 또는 하이브리드). "고-만노스" 유형 N-글리칸은 5개 이상의 만노스 잔기를 갖는다. "복합" 유형 N-글리칸은 전형적으로 "트리만노스" 코어의 1,3 만노스 팔(arm)에 부착된 하나 이상의 GlcNAc 및 1,6 만노스 팔에 부착된 하나 이상의 GlcNAc를 갖는다. 복합 N-글리칸은 시알산 또는 유도체 (예를 들어, "NANA" 또는 "NeuAc" [식중, "Neu"는 뉴라민산을 지칭하고 "Ac"는 아세틸을 지칭한다])로 임의적으로 변형된 갈락토스 ("Gal") 또는 N-아세틸갈락토사민 ("GalNAc") 잔기를 또한 가질 수 있다. 복합 N-글리칸은 "양분성(bisecting)" GlcNAc 및 코어 푸코스 ("Fuc")를 포함하는 사슬내 치환을 또한 가질 수 있다. 복합 N-글리칸은 "트리만노스 코어" 상의 다중 안테나를 또한 가질 수 있고, "다중 안테나성 글리칸"으로 종종 지칭된다. "하이브리드" N-글리칸은 트리만노스 코어의 1,3 만노스 팔의 말단 상의 하나 이상의 GlcNAc, 및 트리만노스 코어의 1,6 만노스 팔 상의 0개 이상의 만노스를 갖는다. 다양한 N-글리칸이 "당형"으로 또한 지칭된다.

복합 N-글리칸과 관련하여, 용어 "G-2", "G-1", "G0", "G1", "G2", "A1", 및 "A2"는 하기를 의미한다. "G-2"는 Man₃GlcNAc₂로 특징화될 수 있는 N-글리칸 구조를 지칭하고; 용어 "G-1"은 GlcNAcMan₃GlcNAc₂로 특징화될 수 있는 N-글리칸 구조를 지칭하고; 용어 "G0"은 GlcNAc₂Man₃GlcNAc₂로 특징화될 수 있는 N-글리칸 구조를 지칭하고; 용어 "G1"은 GalGlcNAc₂Man₃GlcNAc₂로 특징화될 수 있는 N-글리칸 구조를 지칭하고; 용어 "G2"는 Gal₂GlcNAc₂Man₃GlcNAc₂로 특징화될 수 있는 N-글리칸 구조를 지칭하고; 용어 "A1"은 NANAGal₂GlcNAc₂Man₃GlcNAc₂로 특징화될 수 있는 N-글리칸 구조를 지칭하며; 용어 "A2"는 NANA₂Gal₂GlcNAc₂Man₃GlcNAc₂로 특징화될 수 있는 N-글리칸 구조를 지칭한다. 달리 지시되지 않는 한, 용어 "G-2", "G-1", "G0", "G1", "G2", "A1", 및 "A2"는 N-글리칸의 환원 끝부분에서의 GlcNAc 잔기에 부착된 푸코스가 결여된 N-글리칸 종을 지칭한다. 이러한 용어가 "F"를 포함하는 경우, "F"는 N-글리칸 종이 N-글리칸의 환원 끝부분에서의 GlcNAc 잔기 상에 푸코스 잔기를 포함한다는 것을 가리킨다. 예를 들어, G0F, G1F, G2F, A1F, 및 A2F는 모두 N-글리칸이 N-글리칸의 환원 끝부분에서의 GlcNAc 잔기에 부착된 푸코스 잔기를 추가로 포함한다는 것을 가리킨다. 저급 진핵생물 예컨대 효모 및 사상 진균은 정상적으로는 푸코스를 생산하는 N-글리칸을 생산하지 않는다.

다중안테나성 N-글리칸과 관련하여, 용어 "다중안테나성 N-글리칸"은 N-글리칸의 1,6 팔 또는 1,3 팔의 비-환원 끝부분을 이루는 만노스 잔기 상의 GlcNAc 잔기, 또는 N-글리칸의 1,6 팔 및 1,3 팔의 비-환원 끝부분을 이루는 만노스 잔기 각각 상의 GlcNAc 잔기를 추가로 포함하는 N-글리칸을 지칭한다. 따라서, 다중안테나성 N-글리칸은 화학식 GlcNAc_(2-4)Man₃GlcNAc₂, Gal_(1-4)GlcNAc_(2-4)Man₃GlcNAc₂, 또는 NANA_(1-4)Gal_(1-4)GlcNAc_(2-4)Man₃GlcNAc₂를 특징으로 할 수 있다. 용어 "1-4"는 잔기 1개, 2개, 3개 또는 4개를 지칭한다.

양분화 N-글리칸과 관련하여, 용어 "양분화 N-글리칸"은 GlcNAc 잔기가 N-글리칸의 환원 끝부분에서의 만노스 잔기에 연결된 N-글리칸을 지칭한다. 양분화 N-글리칸은 화학식 GlcNAc₃Man₃GlcNAc₂를 특징으로 할 수 있고, 이때 각각의 만노스 잔기가 이의 비-환원 끝부분에서 GlcNAc 잔기에 연결된다. 대조적으로, 다중안테나성 N-글리칸이 GlcNAc₃Man₃GlcNAc₂로 특징화되는 경우, 이러한 화학식은 2개의 GlcNAc 잔기가 N-글리칸의 2개의 팔 중 하나의 비-환원 끝부분에서의 만노스 잔기에 연결되고, 1개의 GlcNAc 잔기가 N-글리칸의 나머지 팔의 비-환원 끝부분에서의 만노스 잔기에 연결되는 것을 가리킨다.

본원에서 사용된 약어는 당업계에서의 통상적인 용법의 약어이고, 예를 들어, 상기의 당 약어를 참조한다. 기타 통상적인 약어에는 "PNGase", 또는 "글리카나제(glycanase)" 또는 "글루코시다제"가 포함되고, 이들은 모두 펩티드 N-글리코시다제 F (EC 3.2.2.18)를 지칭한다.

본원에서 사용되는 경우에, 용어 "당단백질"은 하나 이상의 N-글리칸이 부착되어 있는 임의의 단백질을 지칭한다. 따라서, 이러한 용어는 당업계에서 일반적으로 당단백질로 인지되는 단백질, 및 하나 이상의 N-연결 글리코실화 부위를 함유하도록 유전자 조작된 단백질 둘 모두를 지칭한다.

본원에서 사용되는 경우에, "인간화 당단백질" 또는 "인간-유사 당단백질"은 4개 미만의 만노스 잔기를 갖는 N-글리칸이 부착되어 있는 단백질, 및 5개 이상의 만노스 잔기를 갖는 합성 당단백질 중간체 (또한 유용하고, 추가로 시험관내에서 또는 생체 내에서 조작될 수 있음)을 별법적으로 지칭한다. 바람직하게는, 본 발명에 따라 생산된 당단백질은, 적어도 일시적으로, 30 몰％ 이상, 바람직하게는 40 몰％ 이상, 더욱 바람직하게는 50, 60, 70, 80, 90, 또는 심지어 100 몰％의 Man₅GlcNAc₂ 중간체를 함유한다. 이는, 예를 들어, "더 양호한", 즉 더 효율적인 글리코실화 효소를 발현하도록 본 발명의 숙주 세포를 조작함으로써 달성될 수 있다. 예를 들어, 단백질이 글리코실화되는 숙주 세포 내의 부위에 존재하는 조건 하에서 최적의 활성을 갖도록 만노시다제가 선택되고, 바람직하게는 활성이 요망되는 숙주 세포 기관으로 효소를 표적화하는 것에 의해, 숙주 세포 내로 도입된다

용어 "재조합 숙주 세포" ("발현 숙주 세포", "발현 숙주 시스템", "발현 시스템" 또는 간단히 "숙주 세포")는, 본원에서 사용되는 경우에, 재조합 벡터가 도입된 세포를 지칭하도록 의도된다. 이같은 용어는 특정 대상 세포뿐만 아니라 이같은 세포의 자손을 또한 지칭하도록 의도되는 것으로 이해되어야 한다. 돌연변이 또는 환경적인 영향으로 인해 후속 세대에서 특정한 변형이 발생할 수 있기 때문에, 이같은 자손은 실제로는 모 세포와 동일하지 않을 수 있지만, 본원에서 사용되는 경우의 용어 "숙주 세포"의 범주 내에 여전히 포함된다. 재조합 숙주 세포는 배양에서 성장된 단리된 세포 또는 세포주일 수 있거나, 또는 살아 있는 조직 또는 생물 내에 존재하는 세포일 수 있다. 바람직한 숙주 세포는 효모 및 진균이다.

당단백질 제제 내에 존재하는 글리칸의 "몰％"를 지칭할 때, 이러한 용어는 단백질 제제가 PNGase로 처리될 때 방출된 후, 당형 조성에 영향을 받지 않는 방법 (예를 들어, PNGase에 의해 방출된 글리칸 풀(pool)을 형광 태그(tag) 예컨대 2-아미노벤즈아미드로 표지한 후, 고성능 액체 크로마토그래피 또는 모세관 전기영동으로 분리하고 나서, 형광 강도에 의해 글리칸을 정량함)에 의해 정량된 N-연결 올리고사카라이드들의 풀 내에 존재하는 특정 글리칸의 몰％를 의미한다. 예를 들어, 50 몰％ GlcNAc₂Man₃GlcNAc₂Gal₂NANA₂는 방출된 글리칸의 50％가 GlcNAc₂Man₃GlcNAc₂Gal₂NANA₂이고 나머지 50％는 다른 N-연결 올리고사카라이드로 구성된다는 것을 의미한다. 실시양태에서, 당단백질 제제 내의 특정 글리칸의 몰％는 20％ 내지 100％, 바람직하게는 25％, 30％, 35％, 40％ 또는 45％ 초과, 더욱 바람직하게는 50％, 55％, 60％, 65％ 또는 70％ 초과, 가장 바람직하게는 75％, 80％ 85％, 90％ 또는 95％ 초과일 것이다.

용어 "작동가능하게 연결된" 발현 제어 서열은 발현 제어 서열이 관심 유전자와 연속적이어서 관심 유전자를 제어하는 연결, 뿐만 아니라 트랜스(trans)로 또는 거리를 두고 작용하여 관심 유전자를 제어하는 발현 제어 서열을 지칭한다.

용어 "발현 제어 서열" 또는 "조절 서열"은 상호교환가능하게 사용되고, 본원에서 사용되는 경우에, 자신이 작동가능하게 연결된 코딩 서열의 발현에 영향을 미치는데 필요한 폴리뉴클레오티드 서열을 지칭한다. 발현 제어 서열은 핵산 서열의 전사, 전사후 이벤트 및 번역을 제어하는 서열이다. 발현 제어 서열에는 적합한 전사 개시, 종결, 프로모터 및 인핸서 서열; 효율적인 RNA 프로세싱 신호 예컨대 스플라이싱(splicing) 및 폴리아데닐화 신호; 세포질 mRNA를 안정화시키는 서열; 번역 효율을 강화시키는 서열 (예를 들어, 리보솜 결합 부위); 단백질 안정성을 강화시키는 서열; 및 원하는 경우, 단백질 분비를 강화시키는 서열이 포함된다. 이같은 제어 서열의 성질은 숙주 생물에 따라 다르고, 진핵생물에서는, 이같은 제어 서열에는 일반적으로 프로모터, 리보솜 결합 부위, 및 전사 종결 서열이 포함된다. 용어 "제어 서열"은, 최소한, 이의 존재가 발현에 필수적인 모든 성분을 포함하도록 의도되고, 이의 존재가 유리한 추가적인 성분, 예를 들어, 리더 서열 및 융합 파트너 서열을 또한 포함할 수 있다.

용어 "형질감염시키다", "형질감염", "형질감염시키는" 등은 진핵생물 세포 (고급 및 저급 진핵생물 세포 둘 모두) 내로의 이종성 핵산 도입을 지칭한다. 전통적으로, 용어 "형질전환"이 효모 또는 진균 세포 내로의 핵산 도입을 기술하도록 사용되었다; 그러나, 본원에서는 용어 "형질감염"이 효모 및 진균 세포가 포함되는 임의의 진핵생물 세포 내로의 핵산 도입을 지칭하도록 사용된다.

용어 "진핵생물"은 유핵 세포 또는 생물을 지칭하고, 곤충 세포, 식물 세포, 포유동물 세포, 동물 세포 및 저급 진핵생물 세포를 포함한다.

용어 "저급 진핵생물 세포"에는 효모 및 사상 진균이 포함된다. 효모 및 사상 진균에는 피키아 파스토리스, 피키아 핀란디카, 피키아 트레할로필라, 피키아 코클라마에, 피키아 멤브라나에파시엔스, 피키아 미누타 (오가타에아 미누타, 피키아 린드네리), 피키아 오푼티아에, 피키아 써모톨레란스, 피키아 살릭타리아, 피키아 구에르쿠움, 피키아 페이페리, 피키아 스팁티스, 피키아 메타놀리카, 피키아 종, 사카로미세스 세레비지아에, 사카로미세스 종, 한세눌라 폴리모르파, 클루이베로미세스 종, 클루이베로미세스 락티스, 칸디다 알비칸스, 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리자에, 트리코더마 레에세이, 크리소스포리움 루크노웬세, 푸사리움 종, 푸사리움 그라미네움, 푸사리움 베네나툼, 피스코미트렐라 파텐스(Physcomitrella patens) 및 뉴로스포라 크라사가 포함되지만 이에 한정되지는 않는다. 피키아 종, 임의의 사카로미세스 종, 한세눌라 폴리모르파, 임의의 클루이베로미세스 종, 칸디다 알비칸스, 임의의 아스페르길루스 종, 트리코더마 레에세이, 크리소스포리움 루크노웬세, 임의의 푸사리움 종 및 뉴로스포라 크라사.

본원에서 사용되는 경우에, 용어 "항체", "이뮤노글로불린", "이뮤노글로불린들" 및 "이뮤노글로불린 분자"는 상호교환가능하게 사용된다. 각각의 이뮤노글로불린 분자는 이를 이의 특이적 항원에 결합하게 하는 독특한 구조를 갖지만, 모든 이뮤노글로불린은 본원에 기술된 바와 같이 전체적인 구조가 동일하다. 기본적인 이뮤노글로불린 구조 단위는 서브유닛들의 사량체를 포함하는 것으로 공지되어 있다. 각각의 사량체에는 2개의 동일한 폴리펩티드 사슬 쌍이 있고, 각각의 쌍에는 1개의 "경쇄" (약 25 kDa) 및 1개의 "중쇄" (약 50-70 kDa)가 있다. 각각의 사슬의 아미노-말단 부분은 항원 인식을 주로 담당하는 아미노산 약 100개 내지 110개 또는 이를 초과하는 개수의 가변 영역을 포함한다. 각각의 사슬의 카르복시-말단은 이펙터 기능을 주로 담당하는 불변 영역을 규정한다. 경쇄는 카파 또는 람다로 분류된다. 중쇄는 감마, 뮤, 알파, 델타 또는 엡실론으로 분류되고, 항체의 이소형(isotype)을 각각 IgG, IgM, IgA, IgD, 및 IgE로 규정한다.

경쇄 및 중쇄는 가변 영역 및 불변 영역으로 세분된다 (일반적으로, 문헌 [Fundamental Immunology (Paul, W., ed., 2nd ed. Raven Press, N.Y., 1989), Ch. 7] 참조). 각각의 경쇄/중쇄 쌍의 가변 영역이 항체 결합 부위를 형성한다. 따라서, 무손상 항체에는 2개의 결합 부위가 있다. 이관능성 또는 이중특이적 항체의 경우를 제외하고, 2개의 결합 부위가 동일하다. 사슬들 모두는 비교적 보존된 프레임워크 영역 (FR)이 3개의 초가변 영역 (상보성 결정 영역 또는 CDR로 또한 칭해짐)에 의해 연결된 동일한 일반 구조를 나타낸다. 각각의 쌍의 2개의 사슬로부터의 CDR이 프레임워크 영역에 의해 정렬되어, 특이적 에피토프에 대한 결합을 가능하게 한다. 이러한 용어들은 천연 발생 형태, 뿐만 아니라 단편 및 유도체를 포함한다. 이뮤노글로불린 (Ig) 클래스, 즉, IgG, IgA, IgE, IgM, 및 IgD가 이러한 용어의 범주 내에 포함된다. IgG의 서브타입, 즉, IgG1, IgG2, IgG3, 및 IgG4가 이러한 용어의 범주 내에 또한 포함된다. 이러한 용어는 가장 넓은 의미로 사용되고, 단일 모노클로날 항체 (효능제 및 길항제 항체 포함), 뿐만 아니라 다중 에피토프 또는 항원에 결합할 항체 조성물을 포함한다. 이러한 용어는 모노클로날 항체 (전장 모노클로날 항체 포함), 폴리클로날 항체, 다중특이적 항체 (예를 들어, 이중특이적 항체), 및 항체 단편 (단, CH2 도메인의 N-연결 글리코실화 부위를 포함하는 중쇄 이뮤노글로불린 불변 영역의 CH2 도메인의 적어도 일부분을 함유하거나 이를 함유하도록 변형됨), 또는 이들의 변이체를 구체적으로 포괄한다. Fc 영역만 포함하는 분자, 예컨대 이뮤노어드헤신 (미국 특허 출원 공개 번호 2004/0136986 (이의 개시내용은 참고로 본원에 포함됨)), Fc 융합물, 및 항체-유사 분자가 이러한 용어 내에 포함된다.

용어 "Fc 단편"은 CH2 및 CH3 도메인을 함유하는 항체의 C-말단의 '결정화 단편(fragment crystallized)' 영역을 지칭한다. 용어 "Fab 단편"은 VH, CH1, VL 및 CL 도메인을 함유하는 항체의 '항원 결합 단편(fragment antigen binding)' 영역을 지칭한다.

용어 "모노클로날 항체" (mAb)는, 본원에서 사용되는 경우에, 실질적으로 균질한 항체들의 집단으로부터 수득된 항체를 지칭하고, 즉, 집단을 이루는 개별적인 항체들이 미량으로 존재할 수 있는 가능한 천연 발생 돌연변이를 제외하고는 동일하다. 모노클로날 항체는 고도로 특이적이어서, 단일 항원 부위에 대해 지시된다. 또한, 상이한 결정인자 (에피토프)들에 대해 지시된 상이한 항체들을 전형적으로 포함하는 통상적인 (폴리클로날) 항체 제제와 대조적으로, 각각의 mAb는 항원 상의 단일 결정인자에 대해 지시된다. 이의 특이성에 더하여, 모노클로날 항체는, 예를 들어, 하이브리도마 배양에 의해, 다른 이뮤노글로불린에 의해 오염되지 않고 생산될 수 있다는 점에서 유리하다. 용어 "모노클로날"은 실질적으로 균질한 항체 집단으로부터 수득된다는 항체의 특성을 가리키는 것이며, 임의의 특정한 방법에 의한 항체 생산을 요구하는 것으로 간주되지 않아야 한다. 예를 들어, 본 발명에 따라 사용될 모노클로날 항체를 문헌 [Kohler et al., (1975) Nature, 256:495]에 최초로 기술된 하이브리도마 방법에 의해 제조할 수 있거나, 또는 재조합 DNA 방법 (예를 들어, 미국 특허 번호 4,816,567 (이의 개시내용은 참고로 본원에 포함됨) 참조)에 의해 제조할 수 있다.

용어 "항체" 또는 "이뮤노글로불린"의 범주 내에서의 용어 "단편"은, 이러한 단편이 여전히 표적 분자에 특이적으로 결합할 수 있는 한, 다양한 프로테아제(protease)로의 소화에 의해 생산된 것, 화학적 절단 및/또는 화학적 해리에 의해 생산된 것, 및 재조합에 의해 생산된 것을 포함한다. 이같은 단편에는 Fc, Fab, Fab', Fv, F(ab')2, 및 단일쇄 Fv (scFv) 단편이 있다. 이후, 용어 "이뮤노글로불린"은 용어 "단편"을 또한 포함한다.

이뮤노글로불린은 서열 면에서 변형되었지만 여전히 표적 분자에 특이적으로 결합할 수 있는 이뮤노글로불린 또는 단편을 추가로 포함하고, 이에는 종간 키메라 및 인간화 항체; 항체 융합물; 헤테로머(heteromer) 항체 복합체 및 항체 융합물, 예컨대 디아바디(diabody) (이중특이적 항체), 단일쇄 디아바디, 및 인트라바디(intrabody)가 포함된다 (예를 들어, 문헌 [Intracellular Antibodies: Research and Disease Applications, (Marasco, ed., Springer-Verlag New York, Inc., 1998)] 참조).

용어 "촉매적 항체"는 생화학적 반응을 촉매할 수 있는 이뮤노글로불린 분자를 지칭한다. 촉매적 항체는 당업계에 주지되어 있고, 미국 특허 출원 번호 7,205,136; 4,888,281; 5,037,750 (스코케트만(Schochetman) 등), 미국 특허 출원 번호 5,733,757; 5,985,626; 및 6,368,839 (바바스(Barbas) III 등)에 기술되어 있다 (이들의 개시내용은 모두 본원에 참고로 포함된다).

항체 및 항체-항원 복합체와 면역계 세포의 상호작용 및 반응의 다양성 (항체-의존적 세포-매개 세포독성 (ADCC) 및 보체-의존적 세포독성 (CDC) 포함), 면역복합체의 소거 (포식작용), B 세포에 의한 항체 생산 및 IgG 혈청 반감기가 각각 하기에서 정의되어 있다: 문헌 [Daeron et al., Annu. Rev. Immunol. 15: 203-234 (1997)]; [Ward and Ghetie, Therapeutic Immunol. 2:77-94 (1995)]; [Cox and Greenberg, Semin. Immunol. 13: 339-345 (2001)]; [Heyman, Immunol. Lett. 88:157-161 (2003)]; 및 [Ravetch, Curr. Opin. Immunol. 9: 121-125 (1997)].

본원에서 사용되는 경우에, "~로 본질적으로 이루어지는"이라는 용어는 언급된 정수에 실질적으로 영향을 미치거나 이를 변경시킬 변형 또는 다른 정수를 배제하면서 언급된 정수 또는 정수 군의 포함을 의미하는 것으로 이해될 것이다. N-글리칸의 종과 관련하여, 언급된 N-글리칸"으로 본질적으로 이루어지는"이라는 용어는 이러한 N-글리칸이 당단백질의 아스파라긴 잔기에 직접적으로 연결되는 N-아세틸글루코사민 (GlcNAc)에서 푸코실화되는지 여부와 관계없이 이러한 N-글리칸을 포함하는 것으로 이해될 것이다.

본원에서 사용되는 경우에, 용어 "우세하게" 또는 이의 변형 예컨대 "우세물" 또는 "우세한"은 당단백질을 PNGase로 처리하고, 방출된 글리칸들을 질량 분광법, 예를 들어, MALDI-TOF MS 또는 HPLC에 의해 분석한 후에 전체 천연 N-글리칸 중 몰 백분율 (％)이 가장 높은 글리칸 종을 의미하는 것으로 이해될 것이다. 달리 말하면, "우세하게"라는 구절은 개별물, 예컨대 특정 당형이 다른 어떤 개별물보다도 큰 몰％로 존재하는 것으로 정의된다. 예를 들어, 조성물이 40 몰％의 A종, 35 몰％의 B종 및 25 몰％의 C종으로 이루어진다면, 조성물은 A종을 우세하게 포함하고, B종이 다음으로 가장 우세한 종일 것이다. 일부 숙주 세포는 중성 N-글리칸 및 전하를 띤 N-글리칸 예컨대 만노실포스페이트를 포함하는 조성물을 생산할 수 있다. 따라서, 당단백질의 조성물이 다수의 전하를 띤 N-글리칸 및 전하를 띠지 않은 또는 중성인 N-글리칸을 포함할 수 있다. 본 발명에서, 조성물 내의 전체적인 다수의 중성 N-글리칸의 맥락에서 우세한 N-글리칸이 결정된다. 따라서, 본원에서 사용되는 경우에, "우세한 N-글리칸"은 조성물 내의 전체적인 다수의 중성 N-글리칸 중에서, 우세한 N-글리칸이 특정 구조의 것임을 의미한다.

본원에서 사용되는 경우에, 특정 당 잔기, 예컨대 푸코스, 또는 갈락토스 등"이 본질적으로 없는"이라는 용어는 당단백질 조성물에 이같은 잔기를 함유하는 N-글리칸이 실질적으로 없다는 것을 가리키도록 사용된다. 순도 관점에서 표현될 때, 본질적으로 없음은 이같은 당 잔기를 함유하는 N-글리칸 구조의 양이 10％를 초과하지 않고, 바람직하게는 5％ 미만, 더욱 바람직하게는 1％ 미만, 가장 바람직하게는 0.5％ 미만임을 의미하고, 이때 백분율은 중량 기준 또는 몰％ 기준이다. 따라서, 본 발명에 따른 당단백질 조성물 내의 실질적으로 모든 N-글리칸 구조가 예를 들어 푸코스 또는 갈락토스 또는 둘 모두가 없다.

본원에서 사용되는 경우에, 검출가능한 양의 특정 당 잔기, 예컨대 푸코스 또는 갈락토스가 임의의 시점에 N-글리칸 구조 상에 존재하지 않을 때, 당단백질 조성물에 이같은 잔기가 "결여되거나" 또는 "결여되어 있다". 예를 들어, 본 발명의 바람직한 실시양태에서, 당단백질 조성물이 효모 (예를 들어, 피키아 종; 사카로미세스 종; 클루이베로미세스 종; 아스페르길루스 종)가 포함되는 상기 정의된 바와 같은 저급 진핵생물에 의해 생산되고, "푸코스가 결여될" 것인데, 이는 이러한 생물의 세포에 푸코실화 N-글리칸 구조를 생산하는데 필요한 효소가 없기 때문이다. 따라서, 용어 "본질적으로 푸코스가 없는"은 용어 "푸코스가 결여된"을 포함한다. 그러나, 상기 기술된 바와 같이, 조성물이 한 시점에 푸코실화 N-글리칸 구조를 함유하였거나 또는 제한된, 그러나 검출가능한 양의 푸코실화 N-글리칸 구조를 함유하더라도, 조성물에 "푸코스가 본질적으로 없을" 수 있다.

도 1a - 1h는 야생형 균주 NRRL - Y11430 (도 1a)에서 시작하는 피키아 파스토리스 균주 YGLY13992 (도 1f) 및 균주 YGLY14401 (도 1g)의 계도를 나타낸다.
도 2는 피키아 파스토리스 알콜 옥시다제(oxidase) I (AOX1) 프로모터 및 사카로미세스 세레비지아에 CYC 전사 종결 서열의 제어 하의 LmSTT3D ORF를 코딩하는 플라스미드 pGLY6301의 지도를 나타내다. 이러한 플라스미드는 URA6 유전자좌를 표적으로 하는 롤-인(roll-in) 벡터이다. 형질전환체의 선택은 피키아 파스토리스 RPL10 프로모터 및 사카로미세스 세레비지아에 CYC 전사 종결 서열의 제어 하의 사카로미세스 세레비지아에 ARR3 ORF에 의해 코딩되는 비소 저항성을 사용한다.
도 3은 피키아 파스토리스 GAPDH 프로모터 및 사카로미세스 세레비지아에 CYC 전사 종결 서열의 제어 하의 LmSTT3D ORF를 코딩하는 플라스미드 pGLY6294의 지도를 나타낸다. 이러한 플라스미드는 TRP1 유전자좌를 표적으로 하는 KINKO 벡터이다: TRP1 ORF의 3' 끝부분이 피키아 파스토리스 ALG3 전사 종결 서열에 인접한다. 형질전환체의 선택은 아시비아 고시피이(Ashbya gossypii) TEF1 프로모터 (PTEF) 및 아시비아 고시피이 TEF1 종결 서열 (TTEF)의 제어 하의 스트렙토미세스 노우르세이(Streptomyces noursei) 노르세오트리신(nourseothricin) 아세틸트랜스퍼라제 (NAT) ORF에 의해 코딩되는 노르세오트리신 저항성을 사용한다.
도 4는 플라스미드 pGLY6의 지도를 나타낸다. 플라스미드 pGLY6은 URA5 유전자좌를 표적으로 하고, 피키아 파스토리스 URA5 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (PpURA5-5')을 포함하는 핵산 분자가 한쪽 측면에, 피키아 파스토리스 URA5 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (PpURA5-3')을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹(flanking)된 사카로미세스 세레비지아에 인버타제(invertase) 유전자 또는 전사 단위 (ScSUC2)를 포함하는 핵산 분자를 함유하는 통합 벡터이다.
도 5는 플라스미드 pGLY40의 지도를 나타낸다. 플라스미드 pGLY40은 OCH1 유전자좌를 표적으로 하고, lacZ 반복물 (lacZ 반복물)을 포함하는 핵산 분자들이 플랭킹되고, 그 다음에 OCH1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (PpOCH1-5')을 포함하는 핵산 분자가 한쪽 측면에, OCH1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (PpOCH1-3')을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 핵산 분자를 함유하는 통합 벡터이다.
도 6은 플라스미드 pGLY43a의 지도를 나타낸다. 플라스미드 pGLY43a는 BMT2 유전자좌를 표적으로 하고, lacZ 반복물 (lacZ 반복물)을 포함하는 핵산 분자들이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 핵산 분자에 인접한 클루이베로미세스 락티스 UDP-N-아세틸글루코사민 (UDP-GlcNAc) 수송체 유전자 또는 전사 단위 (KlGlcNAc 수송체)를 포함하는 핵산 분자를 함유하는 통합 벡터이다. 이러한 인접한 유전자들에 BMT2 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (PpPBS2-5')을 포함하는 핵산 분자가 한쪽 측면에, BMT2 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (PpPBS2-3')을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다.
도 7은 플라스미드 pGLY48의 지도를 나타낸다. 플라스미드 pGLY48은 MNN4L1 유전자좌를 표적으로 하고, lacZ 반복물들 (lacZ 반복물)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 핵산 분자에 인접한, 피키아 파스토리스 GAPDH 프로모터 (PpGAPDH 프로모터)를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 종결 서열 (ScCYC TT)을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된 UDP-GlcNAc 수송체의 마우스 상동체 (MmGlcNAc 수송체) 오픈 리딩 프레임 (ORF)을 코딩하는 핵산 분자를 포함하는 발현 카세트를 함유하며, 이때 전체적인 발현 카세트들에 피키아 파스토리스 MNN4L1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (PpMNN4L1-5')을 포함하는 핵산 분자가 한쪽 측면에, MNN4L1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (PpMNN4L1-3')을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 통합 벡터이다.
도 8은 플라스미드 pGLY45의 지도를 나타낸다. 플라스미드 pGLY45는 PNO1/MNN4 유전자좌를 표적으로 하고, lacZ 반복물 (lacZ 반복물)을 포함하는 핵산 분자들이 플랭킹되고, 그 다음에 PNO1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (PpPNO1-5')을 포함하는 핵산 분자가 한쪽 측면에, MNN4 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (PpMNN4-3')을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 핵산 분자를 함유하는 통합 벡터이다.
도 9는 플라스미드 pGLY1430의 지도를 나타낸다. 플라스미드 pGLY1430은 ADE1 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하고, (1) N-말단에서 피키아 파스토리스 SEC12 리더 펩티드에 융합된 인간 GlcNAc 트랜스퍼라제 I 촉매 도메인 (코돈-최적화됨) (CO-NA10), (2) UDP-GlcNAc 수송체의 마우스 상동체 (MmTr), (3) N-말단에서 사카로미세스 세레비지아에 SEC12 리더 펩티드에 융합된 마우스 만노시다제 IA 촉매 도메인 (FB) (FB8), 및 (4) lacZ 반복물들 (lacZ)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 코딩하는 4개의 발현 카세트를 일렬로 함유하는 KINKO 통합 벡터이다. 이들 전체에 ADE1 유전자의 5' 영역 및 ORF (ADE1 5' 및 ORF) 및 ADE1 유전자의 3' 영역 (PpADE1-3')이 플랭킹된다. PpPMA1 프로모터는 피키아 파스토리스 PMA1 프로모터이고, PpPMA1 TT는 피키아 파스토리스 PMA1 종결 서열이고, SEC4는 피키아 파스토리스 SEC4 프로모터이고, OCH1 TT는 피키아 파스토리스 OCH1 종결 서열이고, ScCYC TT는 사카로미세스 세레비지아에 CYC 종결 서열이고, PpOCH1 프로모터는 피키아 파스토리스 OCH1 프로모터이고, PpALG3 TT는 피키아 파스토리스 ALG3 종결 서열이며, PpGAPDH는 피키아 파스토리스 GADPH 프로모터이다.
도 10은 플라스미드 pGLY582의 지도를 나타낸다. 플라스미드 pGLY582는 HIS1 유전자좌를 표적으로 하고, (1) 사카로미세스 세레비지아에 UDP-글루코스 에피머라제(epimerase) (ScGAL10), (2) N-말단에서 사카로미세스 세레비지아에 KRE2-s 리더 펩티드 (33)에 융합된 인간 갈락토실트랜스퍼라제 I (hGalT) 촉매 도메인, (3) lacZ 반복물들 (lacZ 반복물)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5), 및 (4) 드로소필라 멜라노가스터 UDP-갈락토스 수송체 (DmUGT)를 코딩하는 4개의 발현 카세트를 일렬로 함유하는 통합 벡터이다. 이들 전체에 HIS1 유전자의 5' 영역 (PpHIS1-5') 및 HIS1 유전자의 3' 영역 (PpHIS1-3')이 플랭킹된다. PMA1은 피키아 파스토리스 PMA1 프로모터이고, PpPMA1 TT는 피키아 파스토리스 PMA1 종결 서열이고, GAPDH는 피키아 파스토리스 GADPH 프로모터이고, ScCYC TT는 사카로미세스 세레비지아에 CYC 종결 서열이고, PpOCH1 프로모터는 피키아 파스토리스 OCH1 프로모터이며, PpALG12 TT는 피키아 파스토리스 ALG12 종결 서열이다.
도 11은 플라스미드 pGLY167b의 지도를 나타낸다. 플라스미드 pGLY167b는 ARG1 유전자좌를 표적으로 하고, (1) N-말단에서 사카로미세스 세레비지아에 MNN2 리더 펩티드에 융합된 드로소필라 멜라노가스터 만노시다제 II 촉매 도메인 (코돈-최적화됨) (CO-KD53), (2) 피키아 파스토리스 HIS1 유전자 또는 전사 단위, 및 (3) N-말단에서 사카로미세스 세레비지아에 MNN2 리더 펩티드에 융합된 래트 N-아세틸글루코사민 (GlcNAc) 트랜스퍼라제 II 촉매 도메인 (코돈-최적화됨) (CO-TC54)를 코딩하는 3개의 발현 카세트를 일렬로 함유하는 통합 벡터이다. 이들 전체에 ARG1 유전자의 5' 영역 (PpARG1-5') 및 ARG1 유전자의 3' 영역 (PpARG1-3')이 플랭킹된다. PpPMA1 프로모터는 피키아 파스토리스 PMA1 프로모터이고, PpPMA1 TT는 피키아 파스토리스 PMA1 종결 서열이고, PpGAPDH는 피키아 파스토리스 GADPH 프로모터이고, ScCYC TT는 사카로미세스 세레비지아에 CYC 종결 서열이고, PpOCH1 프로모터는 피키아 파스토리스 OCH1 프로모터이며, PpALG12 TT는 피키아 파스토리스 ALG12 종결 서열이다.
도 12는 플라스미드 pGLY3411 (pSH1092)의 지도를 나타낸다. 플라스미드 pGLY3411 (pSH1092)은 피키아 파스토리스 BMT4 유전자의 5' 뉴클레오티드 서열 (PpPBS4 5')이 한쪽 측면에, 피키아 파스토리스 BMT4 유전자의 3' 뉴클레오티드 서열 (PpPBS4 3')이 다른 쪽 측면에 플랭킹된, lacZ 반복물들 (lacZ 반복물)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 발현 카세트를 함유하는 통합 벡터이다.
도 13은 플라스미드 pGLY3419 (pSH1110)의 지도를 나타낸다. 플라스미드 pGLY3430 (pSH1115)은 피키아 파스토리스 BMT1 유전자의 5' 뉴클레오티드 서열 (PpPBS1 5')이 한쪽 측면에, 피키아 파스토리스 BMT1 유전자의 3' 뉴클레오티드 서열 (PpPBS1 3')이 다른 쪽 측면에 플랭킹된, lacZ 반복물들 (lacZ 반복물)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 발현 카세트를 함유하는 통합 벡터이다.
도 14는 플라스미드 pGLY3421 (pSH1106)의 지도를 나타낸다. 플라스미드 pGLY4472 (pSH1186)는 피키아 파스토리스 BMT3 유전자의 5' 뉴클레오티드 서열 (PpPBS3 5')이 한쪽 측면에, 피키아 파스토리스 BMT3 유전자의 3' 뉴클레오티드 서열 (PpPBS3 3')이 다른 쪽 측면에 플랭킹된, lacZ 반복물들 (lacZ 반복물)이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (PpURA5)를 포함하는 발현 카세트를 함유한다.
도 15는 플라스미드 pGLY3673의 지도를 나타낸다. 플라스미드 pGLY3673은 PRO1 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하고, N-말단에서 키메라 단백질을 분비 경로 및 세포로부터의 분비에 표적화하기 위한 사카로미세스 세레비지아에 αMATpre 신호 펩티드에 융합된 트리코더마 레에세이 α-1,2-만노시다제 촉매 도메인 (aMATTrMan)을 코딩하는 발현 카세트를 함유하는 KINKO 통합 벡터이다.
도 16은 항-Her2 항체의 경쇄 및 중쇄를 코딩하는 pGLY6833의 지도를 나타낸다. 이러한 플라스미드는 TRP2 유전자좌를 표적으로 하는 롤-인 벡터이다. 경쇄 및 중쇄를 코딩하는 ORF는 피키아 파스토리스 AOX1 프로모터 및 피키아 파스토리스 CIT1 3UTR 전사 종결 서열의 제어 하에 있다. 형질전환체의 선택은 피키아 파스토리스 TEF1 프로모터 및 사카로미세스 세레비지아에 CYC 종결 서열의 제어 하의 제오신 저항성 단백질 (제오신^R) ORF에 의해 코딩되는 제오신 저항성을 사용한다.
도 17은 항-RSV 항체의 경쇄 및 중쇄를 코딩하는 pGLY6564의 지도를 나타낸다. 이러한 플라스미드는 TRP2 유전자좌를 표적으로 하는 롤-인 벡터이다. 중쇄를 코딩하는 ORF는 피키아 파스토리스 AOX1 프로모터 및 사카로미세스 세레비지아에 CYC 전사 종결 서열의 제어 하에 있다. 경쇄를 코딩하는 ORF는 피키아 파스토리스 AOX1 프로모터 및 피키아 파스토리스 AOX1 전사 종결 서열의 제어 하에 있다. 형질전환체의 선택은 피키아 파스토리스 TEF1 프로모터 및 사카로미세스 세레비지아에 CYC 종결 서열의 제어 하의 제오신 저항성 단백질 (제오신^R) ORF에 의해 코딩되는 제오신 저항성을 사용한다.
도 18은 대조군 균주 대 LmSTT3D가 구성적으로 (GAPDH 프로모터) 또는 유도에 의해 (AOX1 프로모터) 발현되는 균주에서 생산된 항-Her2 및 항-RSV 항체의 N-글리코실화 부위 점유 백분율을 나타낸다.
도 19는 CHO 세포에서 생산된 상업적으로 입수가능한 항-Her2 항체 (헤르셉틴(HERCEPTIN))의 N-글리코실화 부위 점유에 비교된 균주 YGLY13992 및 균주 YGLY17351에서 생산된 항-Her2 항체의 N-글리코실화 부위 점유의 비교를 나타낸다. 균주 YGLY13992는 LmSTT3D를 코딩하는 발현 카세트를 포함하지 않는 반면, 균주 YGLY17351은 유도성 PpAOX1 프로모터의 제어 하의 LmSTT3을 코딩하는 발현 카세트를 포함한다.
도 20은 다양한 생물반응기에서 성장된 균주 YGLY17351에서 생산된 항-Her2 항체의 N-글리코실화 부위 점유 백분율이 생물반응기 규모와 관계없이 일관적이었음을 나타낸다.
도 21은 시판 항-Her2 항체 로트 (헤르셉틴)의 CE 및 Q-TOF 분석 결과를 나타낸다.
도 22는 도 21에 대해 사용된 것과 동일하지만 일정 기간 동안 PNGase F로 처리된 후의 시판 로트에 대한 CE 및 Q-TOF 분석 결과를 나타낸다.
도 23a - 23d는 YGLY7961에서 시작하는 피키아 파스토리스 균주 YGLY12900의 계도를 나타낸다.
도 24는 플라스미드 pGLY2456의 지도를 나타낸다. 플라스미드 pGLY2456은 TRP2 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하고, (1) 코돈-최적화 마우스 CMP-시알산 수송체 (CO mCMP-Sia 수송체), (2) 코돈-최적화 인간 UDP-GlcNAc 2-에피머라제/N-아세틸만노사민 키나제(kinase) (CO hGNE), (3) 피키아 파스토리스 ARG1 유전자 또는 전사 단위, (4) 코돈-최적화 인간 CMP-시알산 신타제(synthase) (CO hCMP-NANA S), (5) 코돈-최적화 인간 N-아세틸뉴라미네이트-9-포스페이트 신타제 (CO hSIAP S), 및 (6) N-말단에서 사카로미세스 세레비지아에 KRE2 리더 펩티드에 융합된 코돈-최적화 마우스 a-2,6-시알릴트랜스퍼라제 촉매 도메인 (comST6-33)을 코딩하는 6개의 발현 카세트를 함유하는 KINKO 통합 벡터이다. 이들 전체에 TRP2 유전자의 5' 영역 및 ORF (PpTRP2 5') 및 TRP2 유전자의 3' 영역 (PpTRP2-3')이 플랭킹된다. PpPMA1 프로모터는 피키아 파스토리스 PMA1 프로모터이고, PpPMA1 TT는 피키아 파스토리스 PMA1 종결 서열이고, CYC TT는 사카로미세스 세레비지아에 CYC 종결 서열이고, PpTEF 프로모터는 피키아 파스토리스 TEF1 프로모터이고, PpTEF TT는 피키아 파스토리스 TEF1 종결 서열이고, PpALG3 TT는 피키아 파스토리스 ALG3 종결 서열이며, pGAP는 피키아 파스토리스 GAPDH 프로모터이다.
도 25는 플라스미드 pGLY5048의 지도를 나타낸다. 플라스미드 pGLY5048은 STE13 유전자좌를 표적으로 하고, (1) N-말단에서 키메라 단백질을 분비 경로 및 세포로부터의 분비에 표적화하기 위한 사카로미세스 세레비지아에 αMATpre 신호 펩티드에 융합된 트리코더마 레에세이 α-1,2-만노시다제 촉매 도메인 (aMATTrMan) 및 (2) 피키아 파스토리스 URA5 유전자 또는 전사 단위를 코딩하는 발현 카세트들을 함유하는 통합 벡터이다.
도 26은 플라스미드 pGLY5019의 지도를 나타낸다. 플라스미드 pGLY5019는 DAP2 유전자좌를 표적으로 하고, 피키아 파스토리스 DAP2 유전자의 5' 뉴클레오티드 서열이 한쪽 측면에, 피키아 파스토리스 DAP2 유전자의 3' 뉴클레오티드 서열이 다른 쪽 측면에 플랭킹된, 아시비아 고시피이 TEF1 프로모터 및 아시비아 고시피이 TEF1 종결 서열에 작동가능하게 연결된 노르세오트리신 저항성 (NAT^R) ORF를 코딩하는 핵산 분자를 포함하는 발현 카세트를 함유하는 통합 벡터이다.
도 27은 pGLY5085의 플라스미드 지도를 나타낸다. 플라스미드 pGLY5085는 시알릴화 N-글리칸을 생산하는데 수반되는 제2 유전자 세트를 피키아 파스토리스 내로 도입하기 위한 KINKO 플라스미드이다. 피키아 파스토리스 ARG1 유전자가 히그로마이신 저항성을 코딩하는 발현 카세트 (HygR)로 교체되었고 플라스미드가 피키아 파스토리스 TRP5 유전자좌를 표적으로 한다는 것을 제외하고는, 이러한 플라스미드는 플라스미드 YGLY2456과 유사하다. 일렬의 6개의 카세트에 정지 코돈에서 끝나는 TRP5 유전자의 5' 영역 및 ORF로부터의 뉴클레오티드 서열에 이어지는 피키아 파스토리스 ALG3 종결 서열을 포함하는 핵산 분자가 한쪽 측면에, TRP5 유전자의 3' 영역으로부터의 뉴클레오티드 서열을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다.
도 28은 pGLY7240의 플라스미드 지도를 나타낸다. 이러한 플라스미드는 TRP2 유전자좌를 표적으로 하고, 피키아 파스토리스 TEF1 프로모터 및 사카로미세스 세레비지아에 CYC 종결 서열의 제어 하의 제오신 저항성 단백질 (제오신^R)을 코딩하는 ORF를 함유하는 통합 벡터이다. 이러한 플라스미드는 피키아 파스토리스 AOX1 프로모터에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열에 3' 끝부분에서 작동가능하게 연결된 GM-CSF/CWP1 융합 단백질을 코딩한다.
도 29는 GM-CSF가 1개의 부위로 우세하게 N-글리코실화되고 소수의 부분이 2개의 N 부위 및 비-글리코실화인 대조군 균주 (YGLY15560, 레인 9)와 대조적으로, 대다수의 GM-CSF (레인 2-8)가 2N-연결 부위로 글리코실화된 균주 YGLY16349 (LmSTT3D를 공동-발현함)에서 생산된 GM-CSF의 웨스턴 블롯(Western blot)을 나타낸다.
도 30은 각각 YGLY15560 (a) 및 YGLY16349 (b)로부터 발현된 GM-CSF의 Q-TOP 분석을 나타낸다. 비-글리코실화 GM-CSF는 검출되지 않았다.

발명의 상세한 설명

본 발명은 당단백질의 N-글리코실화 부위 점유가 본원에 개시된 바와 같이 변형되지 않은 숙주 세포에서 생산된 동일한 당단백질의 N-글리코실화 부위 점유에 비해 증가된 숙주 세포에서 치료 당단백질을 생산하는 방법을 제공한다. 본 발명이 저급 진핵생물 숙주 세포, 예를 들어, 효모 숙주 세포 또는 사상 진균 숙주 세포에서 실행되는 경우, 숙주 세포에서 생산된 재조합 당단백질의 N-글리코실화 부위 점유가 포유동물 또는 인간 숙주 세포에서 생산된 동일한 재조합 당단백질의 N-글리코실화 부위 점유와 동일하거나 또는 이와 더욱 유사하다.

재조합 숙주 세포에 생산된 당단백질 상의 N-글리코실화 부위 점유를 증가시키기 위해, 하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 (특정 실시양태에서, 하나 이상이 숙주 세포의 내인성 헤테로올리고머성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 이루는 하나 이상의 필수 서브유닛의 치사성 돌연변이를 기능적으로 억제할 수 있음)를 코딩하는 하나 이상의 핵산 분자가 숙주 세포에서의 당단백질의 발현 전에 또는 발현과 동시에 재조합 숙주 세포에서 과다발현된다.

리슈마니아 메이저 STT3A 단백질, 리슈마니아 메이저 STT3B 단백질, 및 리슈마니아 메이저 STT3D 단백질은 사카로미세스 세레비지아에에서 STT3 유전자좌의 결실의 치사성 표현형을 억제하는 것으로 나타난 단일-서브유닛 올리고사카릴트랜스퍼라제이다 (문헌 [Naseb et al., Molec. Biol. Cell 19: 3758-3768 (2008)]). 나셉(Naseb) 등 (동일 문헌)은 리슈마니아 메이저 STT3D 단백질이 WBP1, OST1, SWP1 또는 OST2 유전자좌의 결실의 치사성 표현형을 억제할 수 있음을 추가로 나타냈다. 문헌 [Hese et al., Glycobiology 19: 160-171 (2009)]에서는 리슈마니아 메이저 STT3A (STT3-1), STT3B (STT3-2), 및 STT3D (STT3-4) 단백질이 OST2, SWP1, 및 WBP1 유전자좌의 결실을 기능적으로 보완할 수 있음이 교시되었다. 리슈마니아 메이저 STT3D (LmSTT3D) 단백질은 숙주 세포에 의해 생산된 이종성 당단백질, 예를 들어 항체의 N-글리코실화 부위 점유를 강화시킬 수 있는 것으로 본원에서의 실시예에서 나타난, Δ stt3 돌연변이의 치사성 표현형 및 Δ wbp1, Δ ost1, Δ swp1 및 Δo s t2 돌연변이의 하나 이상의 치사성 표현형을 억제할 수 있는 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제이다.

숙주 세포의 STT3 단백질이 포함되는, 숙주 세포의 내인성 OTase 복합체를 구성하는 단백질의 존재 하에 하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제가 구성적으로 또는 유도성으로 과다발현된다. 각각의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 유전자를 코딩하는 발현 카세트는 숙주 세포 게놈 내의 임의의 부위 내로 통합될 수 있거나, 또는 숙주 세포의 염색체외 공간 내에 위치할 수 있고, 즉 플라스미드, 바이러스, 2 ㎛ 플라스미드, 미니염색체 등과 같은 자율적으로 복제되는 유전 요소일 수 있다. 일반적으로, 이종성 구성적 또는 유도성 프로모터 및 특정 숙주 세포 내에서 이종성 단백질을 발현시키는데 적절한 기타 이종성 전사 또는 번역 조절 요소에 작동가능하게 연결된 단일-서브유닛 올리고사카릴트랜스퍼라제 오픈 리딩 프레임 (ORF)을 코딩하는 핵산 분자를 각각 포함하는 발현 카세트 내에서 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제가 숙주 세포에 제공된다. 각각의 발현 카세트의 하나 이상의 카피가 통합을 위한 특정 유전자좌의 부위-특이적 표적화에 의해 또는 발현 카세트를 게놈 내로 무작위로 통합시키는 것에 의해 숙주 세포 게놈 내의 하나 이상의 위치 내로 통합된다. 표적화된 통합을 위한 유전자좌는 발현 카세트 내의 단일-서브유닛 올리고사카릴트랜스퍼라제의 이소성 구성적 또는 유도성 발현을 위한 유전자좌의 적절성을 기초로 선택될 수 있다. 단일- 및 이중-교차 상동 재조합 등과 같은 기술에 의해 이종성 핵산 분자를 숙주 세포 게놈 내로 통합시키는 방법이 당업계에 주지되어 있다 (예를 들어, 미국 출원 공개 번호 20090124000 및 국제 출원 공개 번호 WO2009085135 (이들의 개시내용은 참고로 본원에 포함됨) 참조). 별법적으로, 또는 발현 카세트의 하나 이상의 카피를 숙주 세포 게놈 내로 통합시키는 것에 더하여, 2μ 플라스미드, 바이러스 벡터, 미니염색체, 또는 자율적으로 복제되는 기타 유전자 벡터를 사용하여 발현 카세트의 하나 이상의 카피가 숙주 세포의 염색체외 공간 내에 위치한다.

본 발명이 복합 N-글리칸을 포함하는 포유동물 또는 인간-유사 글리코실화 패턴을 생산하도록 유전자 조작된 피키아 파스토리스 숙주 세포로 본원에서 예시되었지만, 단일-서브유닛 올리고사카릴트랜스퍼라제 유전자를 발현하도록 본원에 개시된 바와 같이 변형되지 않은 숙주에서 생산된 당단백질의 것과 비교하여 숙주 세포에서 생산된 당단백질의 전체적인 N-글리코실화 부위 점유량을 증가시키기 위한 본 발명은 포유동물 또는 인간 글리코실화 패턴을 갖는 당단백질을 생산하도록 유전자 조작되지 않고, 대신 내인성 또는 야생형 글리코실화 패턴, 예를 들어 과만노실화 N-글리코실화 또는 숙주 세포에 알파-1,6-만노실트랜스퍼라제 (och1p) 활성이 결여된 경우의 고-만노스 N-글리코실화를 갖는 당단백질을 발현하는 피키아 파스토리스 숙주 세포에 또한 적용될 수 있다. 본 발명은 단일-서브유닛 올리고사카릴트랜스퍼라제 유전자를 발현하도록 본원에 개시된 바와 같이 변형되지 않은 숙주에서 생산된 당단백질의 것과 비교하여 숙주 세포에서 생산된 당단백질의 전체적인 N-글리코실화 부위 점유량을 증가시키기 위해, 내인성 또는 야생형 글리코실화 패턴, 예를 들어 과만노실화 N-글리코실화 또는 숙주 세포에 알파-1,6-만노실트랜스퍼라제 (och1p) 활성이 결여된 경우의 고-만노스 N-글리코실화를 갖는 당단백질을 발현하거나 또는 포유동물 또는 인간-유사 복합 또는 하이브리드 N-글리칸을 생산하도록 유전자 조작된 기타 효모 또는 사상 진균 또는 식물 또는 조류 숙주 세포에 또한 적용될 수 있다. 본 발명은 단일-서브유닛 올리고사카릴트랜스퍼라제 유전자를 발현하도록 본원에 개시된 바와 같이 변형되지 않은 숙주 세포에서 생산된 당단백질의 것과 비교하여 2개를 초과하는 N-연결 부위가 있는 당단백질의 전체적인 N-글리코실화 부위 점유를 증가시키기 위해 포유동물 발현 시스템에 또한 적용될 수 있다.

동물, 식물 및 진균의 OTase 복합체는 헤테로올리고머성 단백질 복합체이다. 잘 연구되어 있는 모델 생물인 사카로미세스 세레비지아에에서, 현재 OTase 복합체는 8개 이상의 상이한 서브유닛으로 이루어지는 것으로 보인다: Ost1p, Ost2p, Wbp1, Stt3p, Swp1p, Ost4p, Ost5p, 및 Ost3p/Ost6p (문헌 [Silberstein & Gilmore, FASEB J. 10: 849-858 (1996)]; [Knauer & Lehle, Biochim. Biophys. Acta. 1426: 259-273 (1999)]; [Dempski & Imperiali, Curr. Opin. Chem. Biol.6: 844-850 (2002)]; [Yan & Lennarz, J. Biol. Chem. 277: 47692-47700 (2005)]; [Kelleher & Gilmore, Glycobiol. 16:47R-62R (2006)]; [Weerapana & Imperiali, Glycobiol. 16: 91R-101R (2006)]). 피키아 파스토리스에서, OTase 복합체는 적어도 Ost1p, Ost2p, Ost3p, Ost4p, Ost6p, Wbp1, Swp1p, 및 Stt3p를 포함하는 것으로 보인다 (문헌 [Shutter et al., Nat. Biotechnol. 27: 561-566 (2009)] 참조).

STT3 단백질이 OTase 복합체 내의 촉매 서브유닛인 것으로 가정되었다 (문헌 [Yan & Lennarz, J. Biol. Chem. 277: 47692-47700 (2002)]; [Kelleher et al., Mol. Cell. 12: 101-111 (2003)]; [Nilsson et al., J. Cell Biol. 161: 715-725 (2003)]). 이러한 가정이 효모 Stt3p의 원핵생물 상동체가 어떠한 다른 부속 단백질의 부재 하에서도 활성 올리고사카릴트랜스퍼라제임을 나타내는 실험으로부터 지지되었다 (문헌 [Wacker et al., Science. 298: 1790-1793 (2002)]; [Kowarik et al., Science 314: 1148-1150 (2006)]). 효모 Stt3p에 대해 상동성인 단백질들이 거의 모든 진핵생물 게놈에서 코딩된다 (문헌 [Kelleher & Gilmore, Glycobiol. 16:47R-62R (2006)]). 그러나, 비교 게놈 분석은 OTase의 조성이 진핵생물의 진화적 분기 동안 점점 더 복잡해졌음을 시사한다.

단일-서브유닛 올리고사카릴트랜스퍼라제가 지아디아(Giardia) 및 키네토플라스티드(kinetoplastid) 내에 존재하는 한편, STT3, OST1, OST2 및 WBP1 상동체로 이루어지는 4-서브유닛 올리고사카릴트랜스퍼라제가 디플로모나드(diplomonad), 엔트아메바(entamoeba) 및 아피콤플렉산(apicomplexan) 종에서 발견된다. 추가적으로, 여러 형태의 추정 STT3 단백질이 트리파노소마티드(trypanosomatid) 게놈에서 코딩될 수 있다: 3가지 STT3 상동체가 트리파노소마 브루세이(Trypanosoma brucei)에서, 4가지가 리슈마니아 메이저에서 발견된다 (문헌 [McConville et al., Microbiol. Mol. Biol. Rev. 66: 122-154 (2002)]; [Berriman et al., Science. 309: 416-422 (2005)]; [Ivens et al., Science. 309: 436-442 (2005)]; [Samuelson et al., Proc. Natl. Acad. Sci. USA 102: 1548-1553 (2005)]; [Kelleher & Gilmore, Glycobiol. 16:47R-62R (2006)]).

트리파노소마티드 기생충에서, N-연결 글리코실화는 주로 진균 또는 동물 세포에 대해 기술된 경로를 따르지만, 상이한 올리고사카라이드 구조가 단백질에 전달된다 (문헌 [Parodi, Glycobiology 3: 193-199 (1993)]; [McConville et al., Microbiol. Mol. Biol. Rev. 66: 122-154 (2002)]). 종에 따라, Man₆GlcNAc₂ 또는 Man₇GlcNAc₂가 리슈마니아 속에서 단백질로 전달되는 가장 큰 글리칸인 것으로 나타났다 (문헌 [Parodi, Glycobiology 3: 193-199 (1993)]). 가급적이면 Glc₃Man₉GlcNAc₂를 사용하는 효모 및 포유동물 올리고사카릴트랜스퍼라제와 달리, 트리파노솜(trypanosome) 올리고사카릴트랜스퍼라제는 선택적이지 않고, 상이한 지질-연결 올리고사카라이드들을 동일한 속도로 전달한다 (문헌 [Bosch et al., J. Biol. Chem. 263:17360-17365 (1988)]). 따라서, 가장 간단한 진핵생물 올리고사카릴트랜스퍼라제는 박테리아 N-글리코실화 시스템에서 발견되는 올리고사카릴트랜스퍼라제와 유사한 단일 서브유닛 STT3 단백질이다. 문헌 [Nasab et al., Molecular Biology of the Cell 19: 3758-3768 (2008)]에서, 사카로미세스 세레비지아에에서 4개의 리슈마니아 메이저 STT3 단백질 각각이 개별적으로 발현되었고, 이들 중 3개 (LmSTT3A 단백질, LmSTT3B 단백질, 및 LmSTT3D 단백질)가 효모 STT3 유전자좌의 결실을 보완할 수 있는 것으로 발견되었다. 또한, LmSTT3D 발현은 다양한 필수 OTase 서브유닛을 코딩하는 유전자들에서의 단일 및 이중 결실의 치사성 표현형을 억제하였다. LmSTT3 단백질은 효모 OTase 복합체 내로 혼입되지 않았지만, 대신 효모 세포의 내인성 다량체성 효소를 교체할 수 있는 동종이량체성 효소를 형성하였다. 이러한 결과는 이러한 단일-서브유닛 올리고사카릴트랜스퍼라제들이 원핵생물 효소와 유사할 수 있는 한편, 진핵생물 글리코실화에 전형적인 기질, 즉 N-X-S/T N-글리코실화 인식 부위 및 돌리콜피로포스페이트-연결 고-만노스 올리고사카라이드를 사용한다는 것을 가리킨다.

효모에서의 N-글리코실화 부위 점유가, 예를 들어, 문헌 [Schultz and Aebi, Molec. Cell. Proteomics 8: 357-364 (2009)]; [Hese et al., 상기 문헌] 및 [Nasab et al., 상기 문헌]에 의해, 보고서에서 또한 논의되었다. 사카로미세스 세레비지아에에서의 톡소플라스마 곤디이(Toxoplasma gondii) 또는 트리파노소마 크루지(Trypanosoma cruzi) STT3 단백질의 발현이 stt3 결실의 치사성 표현형을 보완하는 것으로 나타났고 (문헌 [Shams-Eldin et al., Mol. Biochem. Parasitol. 143: 6-11 (2005)]; [Castro et al., Proc. Natl. Acad. Sci. USA 103: 14756-14760 (2006)]), 트리파노소마 크루지 STT3 단백질은 효모 OTase 복합체 내로 통합되는 한편, 리슈마니아 메이저 STT3 단백질은 대신 동종이량체를 형성하는 것으로 보인다 ([Nasab et al., 상기 문헌]). 그러나, 이러한 보고서들에서는, LmSTT3D 단백질이 내인성 단백질의 N-글리코실화 부위 점유를 측정한 연구에서 내인성 효모 STT3 유전자좌 및 효모 OTase 복합체의 기타 필수 성분의 치사성 돌연변이의 기능적 억제에 대해 시험되었다. 또한, 연구에서 사용된 효모 균주들이 하이브리드 또는 복합 N-글리칸을 포함하는 포유동물 또는 인간-유사 글리코실화 패턴이 아니라 효모 글리코실화 패턴을 갖는 당단백질을 생산하였다.

상기 보고서들과 대조적으로, 본 발명에서는 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 단백질을 코딩하는 오픈 리딩 프레임 (본원에서, LmSTT3D를 코딩하는 오픈 리딩 프레임으로 예시됨)이 숙주 세포가 내인성 숙주 세포 STT3 유전자의 발현을 포함하여 숙주 세포 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 유전자를 추가로 발현하는 재조합 숙주 세포에서 구성적으로 또는 유도성으로 과다발현된다. 따라서, 숙주 세포가 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제, 및 내인성 숙주 세포 SST3 단백질이 포함되는 내인성 숙주 세포 OTase 복합체 둘 모두를 발현한다. 추가로, 재조합 효모, 사상 진균, 조류, 또는 식물 숙주 세포와 관련하여, 숙주 세포의 내인성 글리코실화 패턴을 갖는 당단백질이 아니라 복합 및/또는 하이브리드 N-글리칸을 포함하는 포유동물 또는 인간-유사 글리코실화 패턴을 포함하는 당단백질을 생산하도록 숙주 세포가 추가로 유전자 조작될 수 있다.

포유동물- 또는 인간-유사 복합 N-글리칸을 생산하도록 유전자 조작된 피키아 파스토리스 숙주 세포를 사용하여 본원에서 본 발명이 예시되었다; 그러나, 본 발명은 숙주 세포에서 생산된 당단백질의 전체적인 N-글리코실화 부위 점유를 개선시키기 위해 효모 또는 진균 N-글리칸 (과만노실화 N-글리칸 또는 고-만노스 N-글리칸)을 갖는 당단백질을 생산하거나 또는 포유동물- 또는 인간-유사 고-만노스, 복합, 또는 하이브리드 N-글리칸을 갖는 당단백질을 생산하도록 유전자 조작된 기타 효모 숙주 세포 (사카로미세스 세레비지아에, 스키조사카로미세스 폼베(Schizosaccharomyces pombe), 오가타에아 미누타, 및 피키아 파스토리스를 포함하지만 이에 한정되지는 않음) 또는 사상 진균 (트리코더마 레에세이를 포함하지만 이에 한정되지는 않음)에 또한 적용될 수 있다. 추가로, 본 발명은 식물 또는 포유동물 발현 시스템에서 생산된 당단백질, 특히 2개를 초과하는 N-연결 글리코실화 부위를 갖는 당단백질의 전체적인 N-글리코실화 부위 점유를 개선하기 위해 식물 및 포유동물 발현 시스템에 또한 적용될 수 있다.

따라서, 상기의 한 측면에서, 하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 핵산 분자 및 이종성 당단백질을 코딩하는 핵산 분자를 포함하고, 이때 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 숙주 세포에서 이종성 당단백질을 생산하는 방법이 제공된다.

상기의 추가적인 측면에서, 인간-유사 N-글리칸을 갖는 당단백질을 생산하도록 유전자 조작되고, 하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자 및 이종성 당단백질을 코딩하는 핵산분자를 포함하며, 이때 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 숙주 세포에서 포유동물- 또는 인간-유사 복합 또는 하이브리드 N-글리칸이 있는 이종성 당단백질을 생산하는 방법이 제공된다.

올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자의 발현은 내인성 STT3 단백질 또는 상동체를 코딩하는 내인성 숙주 세포 유전자의 발현을 포함한다. 효모 숙주 세포의 경우에, 내인성 STT3 유전자의 발현을 포함하여, OTase 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현된다. 현재, 사카로미세스 세레비지아에 OTase 복합체를 구성하는 단백질을 코딩하는 유전자에 OST1, OST2, OST3, OST4, OST5, OST6, WBP1, SWP1, 및 STT3가 포함되는 것으로 공지되어 있고 (예를 들어, 문헌 [Spirig et al., Molec. Gen. Genet. 256: 628-637 (1997)] 참조), 피키아 파스토리스에서는, OTase 복합체가 적어도 Ost1p, Ost2p, Ost3p, Ost4p, Ost6p, Wbp1, Swp1p, 및 Stt3p를 포함하는 것으로 보인다 ([Shutter et al., 상기 문헌] 참조).

일반적으로, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제는 OTase 복합체, 예를 들어, 효모 OTase 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있다. 따라서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제가 OTase 복합체의 하나 이상의 필수 단백질의 치사성 돌연변이를 기능적으로 보완하거나 구조할 수 있다. 추가적인 측면에서, OTase 복합체의 필수 단백질은 사카로미세스 세레비지아에 및/또는 피키아 파스토리스 STT3 유전자좌, WBP1 유전자좌, OST1 유전자좌, SWP1 유전자좌, 또는 OST2 유전자좌, 또는 이들의 상동체에 의해 코딩된다. 일반적으로, N-글리코실화 부위 점유를 증가시키기 위한 본원에서의 방법에서 사용될 수 있는 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제는 특정 실시양태에서 사카로미세스 세레비지아에 및/또는 피키아 파스토리스 OTase 복합체의 하나 이상의 필수 단백질의 치사성 표현형을 기능적으로 억제 (또는 구조 또는 보완)할 수 있는 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제이다. 예를 들어, 추가적인 측면에서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제는 사카로미세스 세레비지아에 또는 피키아 파스토리스 OTase 복합체의 하나 이상의 필수 단백질의 치사성 표현형을 기능적으로 억제 (또는 구조 또는 보완)할 수 있는 리슈마니아 메이저 STT3D 단백질이다. 따라서, 특정 숙주 세포에 대해, 특정 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제가 특정 숙주 세포에서의 발현에 대해 적절하고, 단, 이러한 단일-서브유닛 이종성 올리고사카릴트랜스퍼라제는 효모 OTase 복합체의 하나 이상의 필수 단백질의 치사성 표현형을 억제할 수 있다. 추가 측면에서, 이종성 단일-서브유닛 이종성 올리고사카릴트랜스퍼라제가 특정 숙주 세포에서의 발현에 대해 선택되고, 단 이러한 단일-서브유닛 이종성 올리고사카릴트랜스퍼라제는 사카로미세스 세레비지아에 및/또는 피키아 파스토리스 OTase 복합체의 하나 이상의 필수 단백질의 치사성 표현형을 억제할 수 있다. 필수 단백질에는 OST1, OST2, WBP1, SWP1, 및 STT3이 포함된다.

본원에서 사용되는 경우에, 치사성 돌연변이에는 OTase 복합체의 필수 단백질을 코딩하는 유전자의 결실 또는 파괴, 또는 필수 단백질을 기능성이지 않게 하는 코딩 서열에서의 돌연변이가 포함된다. 이러한 용어는 shRNA 또는 RNAi를 사용하여 기능성 필수 단백질의 생산이 폐지되는 녹-다운(knock-down) 돌연변이를 추가로 포함할 수 있다.

하나 이상의 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자, 및 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 숙주 세포가 숙주 세포 STT3 단백질을 코딩하는 내인성 숙주 세포 유전자 (효모에서 STT3 유전자임)를 발현시키는 것을 포함하여, 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 자신의 내인성 유전자를 발현하는 숙주 세포가 추가로 제공된다. 효모 숙주 세포의 추가적인 측면에서, 숙주 세포는 OTase 복합체를 구성하는 단백질을 코딩하는 내인성 유전자를 발현한다.

상기 중 어느 하나의 특정 측면에서, 숙주 세포는 단일-서브유닛 또는 다량체성 올리고사카릴트랜스퍼라제가 포함될 수 있는 추가적인 이종성 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자를 추가로 포함한다. 예를 들어, 숙주 세포가 LmSTT3A 단백질, LmSTT3B 단백질 및 LmSTT3D 단백질로 이루어진 군으로부터 선택된 하나 이상의 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자를 포함할 수 있다. 추가적인 측면에서, 숙주 세포가 LmSTT3C 단백질을 코딩하는 핵산 분자를 추가로 포함할 수 있다. 상기 중 어느 하나의 추가적인 측면에서, 숙주 세포가 톡소플라스마 곤디이 STT3 단백질, 트리파노소마 크루지 STT3 단백질, 트리파노소마 브루세이 STT3 단백질, 및 카에노랍디티스 엘레간스 STT3 단백질로 이루어진 군으로부터 선택된 하나 이상의 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자를 포함할 수 있다. 상기 중 어느 하나의 추가적인 측면에서, 숙주 세포가 피키아 파스토리스 STT3 단백질을 코딩하는 핵산 분자를 추가로 포함할 수 있다.

저급 진핵생물 예컨대 효모 또는 사상 진균이 재조합 당단백질의 발현에 종종 사용되는데, 이는 이들이 경제적으로 배양될 수 있고, 고수율을 제공하며, 적합하게 변형되는 경우 적절한 글리코실화가 가능하기 때문이다. 특히 효모는 확립된 유전학을 제공하여, 신속한 형질감염, 시험된 단백질 국소화 전략 및 수월한 유전자 녹-아웃(knock-out) 기술을 허용한다. 적절한 벡터에는 원한다면 발현 제어 서열, 예컨대 프로모터 (3-포스포글리세레이트 키나제 또는 기타 당분해 효소 포함), 및 복제 기점, 종결 서열 등이 있다.

유용한 저급 진핵생물 숙주 세포에는 피키아 파스토리스, 피키아 핀란디카, 피키아 트레할로필라, 피키아 코클라마에, 피키아 멤브라나에파시엔스, 피키아 미누타 (오가타에아 미누타, 피키아 린드네리), 피키아 오푼티아에, 피키아 써모톨레란스, 피키아 살릭타리아, 피키아 구에르쿠움, 피키아 페이페리, 피키아 스팁티스, 피키아 메타놀리카, 피키아 종, 사카로미세스 세레비지아에, 사카로미세스 종, 한세눌라 폴리모르파, 클루이베로미세스 종, 클루이베로미세스 락티스, 칸디다 알비칸스, 아스페르길루스 니둘란스, 아스페르길루스 니게르, 아스페르길루스 오리자에, 트리코더마 레에세이, 크리소스포리움 루크노웬세, 푸사리움 종, 푸사리움 그라미네움, 푸사리움 베네나툼 및 뉴로스포라 크라사가 포함되지만, 이에 한정되지는 않는다. 다양한 효모, 예컨대 클루이베로미세스 락티스, 피키아 파스토리스, 피키아 메타놀리카, 및 한세눌라 폴리모르파가 세포 배양에 특히 적절한데, 이는 이들이 높은 세포 밀도로 성장할 수 있고, 다량의 재조합 단백질을 분비하기 때문이다. 유사하게, 사상 진균, 예컨대 아스페르길루스 니게르, 푸사리움 종, 뉴로스포라 크라사 등이 산업적 규모로 본 발명의 당단백질을 생산하는데 사용될 수 있다. 저급 진핵생물의 경우, 세포들이 일상적으로 약 1.5일 내지 3일 동안 성장된다.

따라서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 핵산 분자 및 이종성 당단백질을 코딩하는 핵산 분자를 포함하는 저급 진핵생물 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 저급 진핵생물 숙주 세포에서 이종성 당단백질을 생산하는 방법이 제공된다.

이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자; 및 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 이때 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 저급 진핵생물 숙주 세포가 추가로 제공된다.

이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자, 및 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 이때 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 효모 또는 사상 진균 숙주 세포가 추가로 제공된다. 이는 내인성 STT3 유전자의 발현을 포함하고, 이러한 유전자는 효모에서 STT3 유전자이다.

특정 측면에서, 상기 효모 또는 사상 진균 숙주 세포는 효모-유사 또는 사상 진균-유사 글리코실화 패턴을 갖는 당단백질을 생산하는 숙주 세포일 수 있다. 효모 글리코실화 패턴은 과만노실화 N-글리칸을 포함할 수 있거나, 또는 효모가 α1,6-만노실트랜스퍼라제 활성이 결여되도록 유전자 조작될 수 있고, 즉 효모 숙주가 och1p 활성이 결여되도록 유전자 조작되며, 이러한 경우, 효모는 추가로 과만노실화되지 않는 고-만노스 N-글리칸을 갖는 당단백질을 생산한다.

상기 방법 및 숙주 세포의 특정 실시양태에서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제는 OTase 복합체의 하나 이상의 필수 단백질의 돌연변이의 치사성 표현형을 기능적으로 억제할 수 있다. 추가적인 측면에서, OTase 복합체의 필수 단백질은 STT3 유전자좌, WBP1 유전자좌, OST1 유전자좌, SWP1 유전자좌, 또는 OST2 유전자좌, 또는 이들의 상동체에 의해 코딩된다. 추가적인 측면에서, 예를 들어 단일-서브유닛 올리고사카릴트랜스퍼라제는 리슈마니아 메이저 STT3D 단백질이다.

본원에서의 방법 및 숙주 세포는 이종성 당단백질의 조성물의 N-글리코실화 부위 점유가 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 및 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자를 발현하도록 본원에 기술된 바와 같이 변형되지 않은 숙주 세포에서 생산된 이종성 당단백질에 대한 N-글리코실화 부위 점유보다 큰 숙주 세포에서 이종성 당단백질을 생산하는 수단을 제공한다. 효모와 같은 저급 진핵생물 숙주 세포에 대해, 이종성 당단백질의 N-글리코실화 부위 점유가 포유동물 또는 인간 세포에서 생산되었을 때 이종성 당단백질에 대해 수득되는 것보다 낮은 경우, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 및 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자를 발현하는 숙주 세포에서 당단백질을 생산함으로써, 숙주 세포에서 생산된 당단백질의 N-글리코실화 부위 점유를 포유동물 또는 인간 세포에서의 당단백질의 N-글리코실화 부위 점유와 동일하게 또는 더욱 유사하게 만들 수 있다. 실시예에서 제시된 바와 같이, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 및 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자를 발현하는 피키아 파스토리스 숙주 세포가 항체의 N-글리코실화 부위 점유가 차이니즈 햄스터 난소 (CHO) 세포에서 생산된 항체의 것과 유사한 항체를 생산할 수 있다 (도 19를 또한 참조한다).

N-글리코실화 부위 점유를 측정하는 방법은 글리코실화 단백질과 비-글리코실화 단백질을 분리하고, 이들의 양을 측정하여, 하기 식을 사용하여 N-글리코실화 부위 점유를 결정하는 것이다:

(글리코실화 단백질의 몰) / (글리코실화 단백질의 몰 + 비-글리코실화 단백질의 몰) × 100 = N-글리코실화 부위 점유 ％

항체 조성물 내의 항체의 N-글리코실화 부위 점유를 측정할 때, 조성물 내의 항체를 환원시키고, 글리코실화 및 비-글리코실화 중쇄의 몰을 결정한다. 각각의 중쇄는 Asn-297에 1개의 N-글리코실화 부위가 있다. N-글리코실화 부위 점유 ％는 방출된 N-글리칸의 총 몰 및 항체 중쇄의 총 몰을 기초로 결정된다. 예를 들어, 94％의 N-글리코실화 부위 점유는 조성물 내의 중쇄의 94％가 Asn-297에 N-글리칸을 갖고, 중쇄의 6％는 N-글리칸이 결여될 것임을 가리킬 것이다. 항체는 2개의 중쇄 및 2개의 경쇄로 구성된다. 상기 예에서, 조성물 내의 항체에서, 두 중쇄 모두가 N-글리칸에 연결되거나, 2개의 중쇄 중 1개에 N-글리칸이 있거나, 또는 어느 사슬에도 N-글리칸이 없을 수 있다. 따라서, 중쇄의 94％ N-글리코실화 부위 점유는 조성물 내의 항체의 약 88％에서 두 중쇄 모두가 N-글리코실화되었을 것이고 항체의 11.4％에서 2개의 중쇄 중 하나만 N-글리코실화되었을 것임을 시사할 것이다. 상기가 정확하다는 정성적인 지시를 얻기 위해, 전체 항체를 Q-TOF (하이브리드 4중극자 비행 시간 질량 분광측정계 + MS/MS 기능)와 같은 방법에 의해 분석한다.

항체의 N-글리코실화 부위 점유를 측정하기 위한 일반적인 방법은 실시예 3에 예시된 하기의 방법을 사용할 수 있다. 항체를 중쇄 (HC) 및 경쇄 (LC)로 환원시키고, 글리코실화 중쇄 (GHC) 및 비-글리코실화 중쇄 (NGHC)의 양을 모세관 전기영동과 같은 방법에 의해 결정한다. 하기의 식을 사용하여 N-글리코실화 부위 점유를 결정한다:

(GHC의 몰) / (GHC의 몰 + NGHC의 몰) × 100 = N-글리코실화 부위 HC 점유 ％

임의의 N-글리코실화 부위에 대해, 이러한 부위가 점유되거나 점유되지 않는다. 따라서, 100％의 N-글리칸 점유는 1:1 (N-글리칸 1몰 / N-글리코실화 부위, 예를 들어, 환원된 항체로부터의 중쇄 1몰) 또는 2:1 (N-글리칸 2몰 / 2개의 N-글리코실화 부위가 있는 단백질, 예를 들어, 환원되지 않은 항체 1몰)의 비율과 등가일 것이다. 80％의 N-글리칸 점유는 0.8:1 (N-글리칸 0.8몰 / N-글리코실화 부위, 예를 들어, 환원된 항체로부터의 중쇄 1몰) 또는 1.6:1 (N-글리칸 1.6몰 / 2개의 N-글리코실화 부위가 있는 단백질, 예를 들어, 환원되지 않은 항체 1몰)의 비율과 등가일 것이다.

두 중쇄 모두가 글리코실화된 전체 항체의 비율의 추정값을 식 (GHC 분획)² × 100 = 완전히 점유된 항체 (두 N-글리코실화 부위 모두가 점유된, 환원되지 않은 전체 항체)에 의해 개산할 수 있다. 실시예 3은 본원에서의 방법이 조성물 내의 환원되지 않은 전체 항체 분자의 약 70％ 내지 약 98％에서 두 N-글리코실화 부위 모두가 점유된 항체 조성물의 생산을 가능하게 한다는 것을 나타낸다. N-글리코실화 부위 점유의 측정이 환원된 항체 분자를 사용하여 결정되었기 때문에, 본원에서의 결과는 단일 글리코실화 부위를 함유하는 당단백질 분자를 포함하는 조성물에 대해, 당단백질 분자의 84％ 초과 내지 99％ 이상이 N-글리코실화되었음을 나타낸다. 따라서, 본원에서의 방법 및 숙주 세포는 조성물 내의 당단백질의 N-글리코실화 부위의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상이 점유된 당단백질 조성물의 생산을 가능하게 한다.

당단백질 조성물 내의 당단백질의 N-글리코실화 부위 점유를 측정하는 또 다른 방법은 조성물 내의 당단백질로부터 N-글리칸을 방출시키고, 방출된 N-글리칸의 몰량, 및 당단백질의 몰량 × 당단백질 상의 글리코실화 부위의 개수를 측정함으로써 달성될 수 있다. 하기의 식을 사용할 수 있다:

( N - 글리칸의 총 몰)/(당단백질의 총 몰 × 부위의 개수) × 100 = N-글리코실화 부위 점유 ％.

상기의 식은 점유된 전체 N-글리코실화 부위의 ％를 제공할 것이다.

저급 진핵생물, 특히 효모를 글리코실화 패턴이 포유동물 또는 인간-유사 패턴이거나 인간화된 당단백질을 발현하도록 유전자 조작할 수 있다. 이러한 방식으로, 특정한 원하는 당형이 조성물에서 우세한 당단백질 조성물이 생산될 수 있다. 이는 미국 출원 공개 번호 2004/0018590 (이의 개시내용은 참고로 본원에 포함됨)에 기술된 바와 같이 선택된 내인성 글리코실화 효소를 제거하고/하거나 숙주 세포를 유전자 조작하고/하거나 외인성 효소를 공급하여 포유동물 글리코실화 경로 전체 또는 이의 일부분을 모방하도록 함으로써 달성될 수 있다. 원한다면, 코어 푸코실화와 함께 또는 코어 푸코실화 없이 당단백질이 생산될 수 있도록, 글리코실화의 추가적인 유전자 조작이 수행될 수 있다.

저급 진핵생물 예컨대 효모를 글리코실화 패턴이 포유동물-유사 또는 인간-유사 패턴이거나 인간화된 당단백질을 발현하도록 유전자 조작할 수 있다. 이는 전그로스(Gerngross) 등의 미국 특허 번호 7,449,308 (이의 개시내용은 참고로 본원에 포함됨)에 기술된 바와 같이 선택된 내인성 글리코실화 효소를 제거하고/하거나 외인성 효소를 공급함으로써 달성될 수 있다. 따라서, 본 발명의 특정 측면에서, 숙주 세포는 효모, 예를 들어, 메틸이용성 효모 예컨대 피키아 파스토리스 또는 오가타에아 미누타 및 이의 돌연변이체 및 이의 유전자 조작 변이체이다. 이러한 방식으로, 특정한 원하는 당형이 조성물에서 우세한 당단백질 조성물이 생산될 수 있다. 이는 미국 특허 번호 7,449,308 (이의 개시내용은 참고로 본원에 포함됨)에 기술된 바와 같이 선택된 내인성 글리코실화 효소를 제거하고/하거나 숙주 세포를 유전자 조작하고/하거나 외인성 효소를 공급하여 포유동물 글리코실화 경로 전체 또는 이의 일부분을 모방하도록 함으로써 달성될 수 있다. 원한다면, 코어 푸코실화와 함께 또는 코어 푸코실화 없이 당단백질이 생산될 수 있도록, 글리코실화의 추가적인 유전자 조작이 수행될 수 있다. 저급 진핵생물 숙주 세포 예컨대 효모의 사용은 이러한 세포가 당단백질의 우세한 당형이 조성물 내의 당단백질의 30 몰％ 초과로 존재할 수 있도록 당단백질의 비교적 균질한 조성물을 생산할 수 있다는 점에서 추가로 유리하다. 특정 측면에서, 우세한 당형이 조성물 내에 존재하는 당단백질의 40 몰％, 50 몰％, 60 몰％, 70 몰％를 초과하여, 가장 바람직하게는 80 몰％를 초과하여 존재할 수 있다. 이는 전그로스 등의 미국 특허 번호 7,029,872 및 미국 특허 번호 7,449,308 (이들의 개시내용은 참고로 본원에 포함됨) 에 기술된 바와 같이 선택된 내인성 글리코실화 효소를 제거하고/하거나 외인성 효소를 공급함으로써 달성될 수 있다. 예를 들어, 고갈되지 않으면 만노스 잔기를 당단백질 상의 N-글리칸 상에 부가할 1,6-만노실 트랜스퍼라제 활성이 고갈되도록 숙주 세포가 선택 또는 조작될 수 있다.

한 실시양태에서, 숙주 세포는 α1,2-만노시다제 촉매 도메인과 일반적으로는 회합되지 않고 α1,2-만노시다제 활성을 숙주 세포의 ER 또는 골지체에 표적화하기 위해 선택된 세포성 표적화 신호 펩티드에 융합된 α1,2-만노시다제 촉매 도메인을 추가로 포함한다. 재조합 당단백질이 숙주 세포의 ER 또는 골지체를 통과하면 Man₅GlcNAc₂ 당형을 포함하는 재조합 당단백질, 예를 들어, Man₅GlcNAc₂ 당형을 우세하게 포함하는 재조합 당단백질 조성물이 생산된다. 예를 들어, 미국 특허 번호 7,029,872, 미국 특허 번호 7,449,308 및 미국 특허 출원 공개 번호 2005/0170452 (이들의 개시내용은 모두 참고로 본원에 포함됨)에 Man₅GlcNAc₂ 당형을 포함하는 당단백질을 생산할 수 있는 저급 진핵생물 숙주 세포가 개시되어 있다.

추가적인 실시양태에서, 바로 전의 숙주 세포가 N-아세틸글루코사미닐트랜스퍼라제(acetylglucosaminyltransferase) I (GlcNAc 트랜스퍼라제 I 또는 GnT I) 촉매 도메인과 일반적으로는 회합되지 않고 GlcNAc 트랜스퍼라제 I 활성을 숙주 세포의 ER 또는 골지체에 표적화하기 위해 선택된 세포성 표적화 신호 펩티드에 융합된 GlcNAc 트랜스퍼라제 I 촉매 도메인을 추가로 포함한다. 재조합 당단백질이 숙주 세포의 ER 또는 골지체를 통과하면 GlcNAcMan₅GlcNAc₂ 당형을 포함하는 재조합 당단백질, 예를 들어 GlcNAcMan₅GlcNAc₂ 당형을 우세하게 포함하는 재조합 당단백질 조성물이 생산된다. 미국 특허 번호 7,029,872, 미국 특허 번호 7,449,308, 및 미국 특허 출원 공개 번호 2005/0170452 (이들의 개시내용은 모두 참고로 본원에 포함됨)에 GlcNAcMan₅GlcNAc₂ 당형을 포함하는 당단백질을 생산할 수 있는 저급 진핵생물 숙주 세포가 개시되어 있다. 상기 세포에서 생산된 당단백질이 Man₅GlcNAc₂ 당형을 포함하는 재조합 당단백질이 생산되도록 시험관내에서 헥사미니다제(hexaminidase)로 처리될 수 있다.

추가적인 실시양태에서, 바로 전의 숙주 세포가 만노시다제 II 촉매 도메인과 일반적으로는 회합되지 않고 만노시다제 II 활성을 숙주 세포의 ER 또는 골지체에 표적화하기 위해 선택된 세포성 표적화 신호 펩티드에 융합된 만노시다제 II 촉매 도메인을 추가로 포함한다. 재조합 당단백질이 숙주 세포의 ER 또는 골지체를 통과하면 GlcNAcMan₃GlcNAc₂ 당형을 포함하는 재조합 당단백질, 예를 들어 GlcNAcMan₃GlcNAc₂ 당형을 우세하게 포함하는 재조합 당단백질 조성물이 생산된다. 미국 특허 번호 7,029,872 및 미국 특허 번호 7,625,756 (이들의 개시내용은 모두 참고로 본원에 포함됨)에 만노시다제 II 효소를 발현하고 GlcNAc₂Man₃GlcNAc₂ 당형이 우세하게 있는 당단백질을 생산할 수 있는 저급 진핵생물 숙주 세포가 개시되어 있다. 상기 세포에서 생산된 당단백질이 Man₃GlcNAc₂ 당형을 포함하는 재조합 당단백질이 생산되도록 시험관내에서 헥사미니다제로 처리될 수 있다.

추가적인 실시양태에서, 바로 전의 숙주 세포가 N-아세틸글루코사미닐트랜스퍼라제 II (GlcNAc 트랜스퍼라제 II 또는 GnT II) 촉매 도메인과 일반적으로는 회합되지 않고 GlcNAc 트랜스퍼라제 II 활성을 숙주 세포의 ER 또는 골지체에 표적화하기 위해 선택된 세포성 표적화 신호 펩티드에 융합된 GlcNAc 트랜스퍼라제 II 촉매 도메인을 추가로 포함한다. 재조합 당단백질이 숙주 세포의 ER 또는 골지체를 통과하면 GlcNAc₂Man₃GlcNAc₂ 당형을 포함하는 재조합 당단백질, 예를 들어 GlcNAc₂Man₃GlcNAc₂ 당형을 우세하게 포함하는 재조합 당단백질 조성물이 생산된다. 미국 특허 번호 7,029,872 및 7,449,308 및 미국 특허 출원 공개 번호 2005/0170452 (이들의 개시내용은 모두 참고로 본원에 포함됨)에 GlcNAc₂Man₃GlcNAc₂ 당형을 포함하는 당단백질을 생산할 수 있는 저급 진핵생물 숙주 세포가 개시되어 있다. 상기 세포에서 생산된 당단백질이 Man₃GlcNAc₂ 당형을 포함하는 재조합 당단백질이 생산되도록 시험관내에서 헥사미니다제로 처리될 수 있다.

추가적인 실시양태에서, 바로 전의 숙주 세포가 갈락토실트랜스퍼라제 촉매 도메인과 일반적으로는 회합되지 않고 갈락토실트랜스퍼라제 활성을 숙주 세포의 ER 또는 골지체에 표적화하기 위해 선택된 세포성 표적화 신호 펩티드에 융합된 갈락토실트랜스퍼라제 촉매 도메인을 추가로 포함한다. 재조합 당단백질이 숙주 세포의 ER 또는 골지체를 통과하면 GalGlcNAc₂Man₃GlcNAc₂ 또는 Gal₂GlcNAc₂Man₃GlcNAc₂ 당형 또는 이들의 혼합물을 포함하는 재조합 당단백질, 예를 들어 GalGlcNAc₂Man₃GlcNAc₂ 당형 또는 Gal₂GlcNAc₂Man₃GlcNAc₂ 당형 또는 이들의 혼합물을 우세하게 포함하는 재조합 당단백질 조성물이 생산된다. 미국 특허 번호 7,029,872 및 미국 특허 출원 공개 번호 2006/0040353 (이들의 개시내용은 모두 참고로 본원에 포함됨)에 Gal₂GlcNAc₂Man₃GlcNAc₂ 당형을 포함하는 당단백질을 생산할 수 있는 저급 진핵생물 숙주 세포가 개시되어 있다. 상기 세포에서 생산된 당단백질이 GlcNAc₂Man₃GlcNAc₂ 당형을 포함하는 재조합 당단백질, 예를 들어 GlcNAc₂Man₃GlcNAc₂ 당형을 우세하게 포함하는 재조합 당단백질 조성물이 생산되도록 시험관내에서 갈락토시다제(galactosidase)로 처리될 수 있다.

추가적인 실시양태에서, 바로 전의 숙주 세포가 시알릴트랜스퍼라제 촉매 도메인과 일반적으로는 회합되지 않고 시알릴트랜스퍼라제 활성을 숙주 세포의 ER 또는 골지체에 표적화하기 위해 선택된 세포성 표적화 신호 펩티드에 융합된 시알릴트랜스퍼라제 촉매 도메인을 추가로 포함한다. 재조합 당단백질이 숙주 세포의 ER 또는 골지체를 통과하면 NANA₂Gal₂GlcNAc₂Man₃GlcNAc₂ 당형 또는 NANAGal₂GlcNAc₂Man₃GlcNAc₂ 당형 또는 이들의 혼합물을 우세하게 포함하는 재조합 당단백질이 생산된다. 효모 및 사상 진균과 같은 저급 진핵생물 숙주 세포에 대해, 숙주 세포가 N-글리칸으로의 전달을 위해 CMP-시알산을 제공하는 수단을 추가로 포함하는 것이 유용하다. 미국 특허 출원 공개 번호 2005/0260729 (이의 개시내용은 참고로 본원에 포함됨)에 CMP-시알산 합성 경로가 있도록 저급 진핵생물을 유전자 조작하는 방법이 개시되어 있고, 미국 특허 출원 공개 번호 2006/0286637 (이의 개시내용은 참고로 본원에 포함됨)에 시알릴화 당단백질을 생산하도록 저급 진핵생물을 유전자 조작하는 방법이 개시되어 있다. 상기 세포에서 생산된 당단백질이 Gal₂GlcNAc₂Man₃GlcNAc₂ 당형 또는 GalGlcNAc₂Man₃GlcNAc₂ 당형 또는 이들의 혼합물을 우세하게 포함하는 재조합 당단백질이 생산되도록 시험관내에서 뉴라미니다제(neuraminidase)로 처리될 수 있다.

상기 숙주 세포들 중 어느 하나가 미국 특허 번호 7,598,055 및 미국 특허 출원 공개 번호 2007/0037248 (이들의 개시내용은 모두 참고로 본원에 포함됨)에 개시된 바와 같이 양분화 (GnT III) 및/또는 다중안테나성 (GnT IV, V, VI, 및 IX) N-글리칸 구조를 갖는 당단백질이 생산되도록 GnT III, GnT IV, GnT V, GnT VI, 및 GnT IX로 이루어진 군으로부터 선택된 하나 이상의 GlcNAc 트랜스퍼라제를 추가로 포함할 수 있다.

추가적인 실시양태에서, GlcNAcMan₅GlcNAc₂ N-글리칸을 우세하게 갖는 당단백질을 생산하는 숙주 세포가 갈락토실트랜스퍼라제 촉매 도메인과 일반적으로는 회합되지 않고 갈락토실트랜스퍼라제 활성을 숙주 세포의 ER 또는 골지체에 표적화하기 위해 선택된 세포성 표적화 신호 펩티드에 융합된 갈락토실트랜스퍼라제 촉매 도메인을 추가로 포함한다. 재조합 당단백질이 숙주 세포의 ER 또는 골지체를 통과하면 GalGlcNAcMan₅GlcNAc₂ 당형을 우세하게 포함하는 재조합 당단백질이 생산된다.

추가적인 실시양태에서, GalGlcNAcMan₅GlcNAc₂ N-글리칸을 우세하게 갖는 당단백질을 생산한 바로 전의 숙주 세포가 시알릴트랜스퍼라제 촉매 도메인과 일반적으로는 회합되지 않고 시알릴트랜스퍼라제 활성을 숙주 세포의 ER 또는 골지체에 표적화하기 위해 선택된 세포성 표적화 신호 펩티드에 융합된 시알릴트랜스퍼라제 촉매 도메인을 추가로 포함한다. 재조합 당단백질이 숙주 세포의 ER 또는 골지체를 통과하면 NANAGalGlcNAcMan₅GlcNAc₂ 당형을 포함하는 재조합 당단백질이 생산된다.

추가적인 측면에서, 상기 언급된 숙주 세포들 중 어느 하나에서, 숙주 세포가 푸코실트랜스퍼라제, 및 푸코스를 생산하고 푸코스를 ER 또는 골지로 수송하기 위한 경로를 포함하도록 추가로 변형된다. 당단백질 상의 N-글리칸 중 하나 이상이 푸코실화된 당단백질을 생산할 수 있도록 피키아 파스토리스를 변형시키는 방법의 예가 국제 출원 공개 번호 WO 2008112092 (이의 개시내용은 참고로 본원에 포함됨)에 개시되어 있다. 본 발명의 특정 측면에서, GDP-만노스-4,6-데히드라타제(dehydratase), GDP-케토-데옥시-만노스-에피머라제/GDP-케토-데옥시-갈락토스-리덕타제(reductase), GDP-푸코스 수송체, 및 푸코실트랜스퍼라제를 포함하는 푸코실화 경로를 포함하도록 피키아 파스토리스 숙주 세포가 추가로 변형된다. 특정 측면에서, α1,2-푸코실트랜스퍼라제, α1,3-푸코실트랜스퍼라제, α1,4-푸코실트랜스퍼라제, 및 α1,6-푸코실트랜스퍼라제로 이루어진 군으로부터 푸코실트랜스퍼라제가 선택된다.

다양한 상기 숙주 세포들이 하나 이상의 당 수송체 예컨대 UDP-GlcNAc 수송체 (예를 들어, 클루이베로미세스 락티스 및 무스 무스쿨로스(Mus musculus) UDP-GlcNAc 수송체), UDP-갈락토스 수송체 (예를 들어, 드로소필라 멜라노가스터 UDP-갈락토스 수송체), 및 CMP-시알산 수송체 (예를 들어, 인간 시알산 수송체)를 추가로 포함한다. 효모 및 사상 진균과 같은 저급 진핵생물 숙주 세포에서는 상기 수송체들이 결여되기 때문에, 효모 및 사상 진균과 같은 저급 진핵생물 숙주 세포가 상기 수송체들을 포함하도록 유전자 조작되는 것이 바람직하다.

숙주 세포는 포스포만노실트랜스퍼라제 유전자인 PNO1 및 MNN4B (예를 들어, 미국 특허 번호 7,198,921 및 7,259,007 (이들의 개시내용은 모두 본원에 참조로 포함됨) 참조) 중 하나 또는 둘 모두를 결실시키거나 파괴함으로써 포스포만노스 잔기를 갖는 당단백질을 제거하도록 유전자 조작된 피키아 파스토리스를 추가로 포함하고, 이는 추가적인 측면에서 MNN4A 유전자를 결실시키거나 파괴하는 것을 또한 포함할 수 있다. 파괴는 특정 효소를 코딩하는 오픈 리딩 프레임을 파괴하는 것, 또는 오픈 리딩 프레임의 발현을 파괴하는 것, 또는 간섭 RNA, 안티센스 RNA 등을 사용하여 β-만노실트랜스퍼라제 및/또는 포스포만노실트랜스퍼라제 중 하나 이상을 코딩하는 RNA의 번역을 폐지하는 것을 포함한다. 숙주 세포는 특정 N-글리칸 구조를 생산하도록 변형된 상기 언급된 숙주 세포들 중 어느 하나를 추가로 포함할 수 있다.

숙주 세포는 단백질 O-만노실트랜스퍼라제 (Dol-P-Man:단백질 (Ser/Thr) 만노실 트랜스퍼라제 유전자) (PMT) 중 하나 이상을 파괴하거나 결실시킴으로써 당단백질의 O-글리코실화를 제어하도록 유전자 변형되거나 (미국 특허 번호 5,714,377 (이의 개시내용은 본원에 참조로 포함됨) 참조), 또는 국제 출원 공개 번호 WO 2007061631 (이의 개시내용은 본원에 참조로 포함됨)에 개시된 바와 같이 Pmtp 억제제 및/또는 α1,2 만노시다제의 존재 하에 성장되거나, 또는 이렇게 유전자-변형 및 성장된 저급 진핵생물 세포 (예를 들어, 피키아 파스토리스와 같은 효모)를 추가로 포함한다. 파괴는 Pmtp를 코딩하는 오픈 리딩 프레임을 파괴하는 것, 또는 오픈 리딩 프레임의 발현을 파괴하는 것, 또는 간섭 RNA, 안티센스 RNA 등을 사용하여 Pmtp들 중 하나 이상을 코딩하는 RNA의 번역을 폐지하는 것을 포함한다. 숙주 세포는 특정 N-글리칸 구조를 생산하도록 변형된 상기 언급된 숙주 세포들 중 어느 하나를 추가로 포함할 수 있다.

Pmtp 억제제에는 벤질리덴 티아졸리딘디온이 포함되지만, 이에 한정되지는 않는다. 사용될 수 있는 벤질리덴 티아졸리딘디온의 예는 5-[[3,4-비스(페닐메톡시)페닐]메틸렌]-4-옥소-2-티옥소-3-티아졸리딘아세트산; 5-[[3-(1-페닐에톡시)-4-(2-페닐에톡시)]페닐]메틸렌]-4-옥소-2-티옥소-3-티아졸리딘아세트산; 및 5-[[3-(1-페닐-2-히드록시)에톡시)-4-(2-페닐에톡시)]페닐]메틸렌]-4-옥소-2-티옥소-3-티아졸리딘아세트산이다.

특정 실시양태에서, 하나 이상의 내인성 PMT 유전자의 기능 또는 발현이 감소, 파괴 또는 결실된다. 예를 들어, 특정 실시양태에서, PMT1, PMT2, PMT3, 및 PMT4 유전자로 이루어진 군으로부터 선택된 하나 이상의 내인성 PMT 유전자의 기능 또는 발현이 감소, 파괴 또는 결실되거나, 또는 숙주 세포가 하나 이상의 PMT 억제제의 존재 하에 배양된다. 추가적인 실시양태에서, 숙주 세포가 하나 이상의 PMT 유전자 결실 또는 파괴를 포함하고, 숙주 세포가 하나 이상의 Pmtp 억제제의 존재 하에 배양된다. 이러한 실시양태들의 특정 측면에서, 숙주 세포는 분비형 α-1,2-만노시다제를 또한 발현한다.

PMT 결실 또는 파괴 및/또는 Pmtp 억제제는 O-글리코실화 점유를 감소시킴으로써, 즉 글리코실화되는 당단백질 상의 O-글리코실화 부위의 총수를 감소시킴으로써 O-글리코실화를 제어한다. 세포에 의해 분비되는 α-1,2-만노시다제의 추가적인 부가는 당단백질 상에 있는 O-글리칸의 만노스 사슬 길이를 감소시킴으로써 O-글리코실화를 제어한다. 따라서, PMT 결실 또는 파괴 및/또는 Pmtp 억제제를 분비형 α-1,2-만노시다제와 조합하는 것은 점유 및 사슬 길이를 감소시킴으로써 O-글리코실화를 제어한다. 특정한 상황에서, PMT 결실 또는 파괴, Pmtp 억제제 및 α-1,2-만노시다제의 특정한 조합이 실험적으로 결정되는데, 이는 특정한 이종성 당단백질 (예를 들어, 항체)들이 상이한 효율 정도로 발현되어 골지체로 수송될 수 있고, 따라서 PMT 결실 또는 파괴, Pmtp 억제제 및 α-1,2-만노시다제의 특정한 조합을 필요로 할 수 있기 때문이다. 또 다른 측면에서, 하나 이상의 내인성 만노실트랜스퍼라제 효소를 코딩하는 유전자가 결실된다. 이러한 결실(들)은 분비형 α-1,2-만노시다제 및/또는 PMT 억제제를 제공하는 것과 조합될 수 있거나, 또는 분비형 α-1,2-만노시다제 및/또는 PMT 억제제를 제공하는 것을 대신할 수 있다.

따라서, O-글리코실화의 제어가 본원에 개시된 숙주 세포에서 더 양호한 총 수율로 또는 적합하게 어셈블리된 당단백질의 산출로 특정 당단백질을 생산하는데 유용할 수 있다. O-글리코실화의 감소 또는 제거는 당단백질 예컨대 전체 항체가 분비 경로를 횡단하여 세포 표면으로 수송될 때 이들의 어셈블리 및 수송에 이로운 효과가 있는 것으로 보인다. 따라서, O-글리코실화가 제어된 세포에서, 적합하게 어셈블리된 당단백질 예컨대 항체 단편의 수율이 O-글리코실화가 제어되지 않은 숙주 세포에서 수득되는 수율에 비해 증가된다.

α-만노시다제에 저항성인 β-연결 만노스 잔기가 있는 N-글리칸 및 O-글리칸의 가능성을 감소시키거나 제거하기 위해, β-만노실트랜스퍼라제 유전자 (예를 들어, BMT1, BMT2, BMT3, 및 BMT4) 중 하나 이상을 결실시키거나 파괴함으로써 α-만노시다제-저항성 N-글리칸을 갖는 당단백질을 제거하도록 재조합 당-조작(glycoengineered) 피키아 파스토리스 숙주 세포가 유전자 조작된다 (미국 특허 번호 7,465,577 및 미국 특허 번호 7,713,719 참조). BMT2, 및 BMT1, BMT3 및 BMT4 중 하나 이상의 결실 또는 파괴는 숙주 세포 단백질에 대한 항체에 대한 검출가능한 교차 반응성을 또한 감소시키거나 제거한다.

포유동물 또는 인간 샤페론(chaperone) 단백질을 코딩하는 핵산 분자를 과다발현시킴으로써 또는 하나 이상의 내인성 샤페론 단백질을 코딩하는 유전자를 하나 이상의 포유동물 또는 인간 샤페론 단백질을 코딩하는 핵산 분자로 교체함으로써 일부 경우에 당단백질의 수율이 개선될 수 있다. 게다가, 숙주 세포에서의 포유동물 또는 인간 샤페론 단백질의 발현이 세포에서의 O-글리코실화를 또한 제어하는 것으로 보인다. 따라서, 샤페론 단백질을 코딩하는 하나 이상의 내인성 유전자의 기능이 감소 또는 제거되고, 이러한 샤페론 단백질의 하나 이상의 포유동물 또는 인간 상동체를 코딩하는 벡터가 숙주 세포 내에서 발현되는 본원의 숙주 세포가 추가로 포함된다. 내인성 숙주 세포 샤페론 및 포유동물 또는 인간 샤페론 단백질이 발현되는 숙주 세포가 또한 포함된다. 추가적인 측면에서, 이러한 저급 진핵생물 숙주 세포는 효모 또는 사상 진균 숙주 세포이다. 재조합 단백질의 수율을 개선하고 이의 O-글리코실화를 감소시키거나 제어하기 위해 인간 샤페론 단백질이 도입된 숙주 세포의 샤페론 사용의 예가 국제 출원 공개 번호 WO 2009105357 및 WO2010019487 (이들의 개시내용은 본원에 참고로 포함됨)에 개시되어 있다. 상기와 유사하게, 상기 기술된 바와 같이 내인성 샤페론 단백질 중 하나 이상을 코딩하는 유전자를 하나 이상의 포유동물 또는 인간 샤페론 단백질을 코딩하는 핵산 분자로 교체하는 것 또는 하나 이상의 포유동물 또는 인간 샤페론 단백질을 과다발현시키는 것에 더하여, 단백질 O-만노실트랜스퍼라제 (PMT) 단백질을 코딩하는 하나 이상의 내인성 유전자의 기능 또는 발현이 감소, 파괴 또는 결실된 저급 진핵생물 숙주 세포가 추가로 포함된다. 특정 실시양태에서, PMT1, PMT2, PMT3, 및 PMT4 유전자로 이루어진 군으로부터 선택된 하나 이상의 내인성 PMT 유전자의 기능이 감소, 파괴 또는 결실된다.

따라서, 본원에 개시된 방법은 우세한 N-글리칸이 복합 N-글리칸, 하이브리드 N-글리칸, 및 고-만노스 N-글리칸으로 이루어진 군으로부터 선택되는 당단백질을 생산하도록 유전자 변형된 임의의 숙주 세포를 사용할 수 있고, 이때 복합 N-글리칸은 GlcNAc_(2-4)Man₃GlcNAc₂, Gal_(1-4)GlcNAc_(2-4)Man₃GlcNAc₂, 및 NANA_(1-4)Gal_(1-4)GlcNAc_(2-4)Man₃GlcNAc₂로 이루어진 군으로부터 선택될 수 있고; 하이브리드 N-글리칸은 GlcNAcMan₃GlcNAc₂; GalGlcNAcMan₃GlcNAc₂; NANAGalGlcNAcMan₃GlcNAc₂ GlcNAcMan₅GlcNAc₂, GalGlcNAcMan₅GlcNAc₂, 및 NANAGalGlcNAcMan₅GlcNAc₂로 이루어진 군으로부터 선택될 수 있으며; 고-만노스 N-글리칸은 Man₅GlcNAc₂, Man₆GlcNAc₂, Man₇GlcNAc₂, Man₈GlcNAc₂, 및 Man₉GlcNAc₂로 이루어진 군으로부터 선택될 수 있다. 예를 들어, 미국 출원 공개 번호 20050170452에 제시된 바와 같이, N-글리칸 구조 Man₃GlcNAc₂로 이루어진 N-글리칸을 갖는 당단백질이 추가로 포함된다.

따라서, 인간-유사 N-글리칸을 갖는 당단백질을 생산하도록 유전자 조작되고, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 핵산 분자 및 이종성 당단백질을 코딩하는 핵산분자를 포함하는 저급 진핵생물 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 저급 진핵생물 숙주 세포에서 포유동물- 또는 인간-유사 복합 또는 하이브리드 N-글리칸이 있는 이종성 당단백질을 생산하는 방법이 제공된다.

상기의 추가적인 측면에서, 인간-유사 N-글리칸을 갖는 당단백질을 생산하도록 유전자 조작되고, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 핵산 분자 및 이종성 당단백질을 코딩하는 핵산분자를 포함하는 효모 또는 사상 진균 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 효모 또는 사상 진균 숙주 세포에서 포유동물- 또는 인간-유사 복합 또는 하이브리드 N-글리칸이 있는 이종성 당단백질을 생산하는 방법이 제공된다.

이종성 단일-서브유닛 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자 및 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 이때 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는, 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질을 생산하도록 유전자 조작된 효모 또는 사상 진균 숙주 세포가 추가로 제공된다. 이는 내인성 STT3 유전자의 발현을 포함하며, 상기 유전자는 효모에서 STT3 유전자이다.

일반적으로, 상기 방법 및 숙주 세포에서, 단일-서브유닛 올리고사카릴트랜스퍼라제는 OTase 복합체의 하나 이상의 필수 단백질의 돌여변이의 치사성 표현형을 기능적으로 억제할 수 있다. 추가적인 측면에서, OTase 복합체의 필수 단백질은 STT3 유전자좌, WBP1 유전자좌, OST1 유전자좌, SWP1 유전자좌, 또는 OST2 유전자좌, 또는 이들의 상동체에 의해 코딩된다. 추가적인 측면에서, 예를 들어 단일-서브유닛 올리고사카릴트랜스퍼라제는 리슈마니아 메이저 STT3D 단백질이다.

프로모터는 유전자 발현을 제어하기 위한 DNA 서열 요소이다. 특히, 프로모터는 전사 개시 부위를 상술하고, TATA 박스 및 상류 프로모터 요소를 포함할 수 있다. 선택된 프로모터는 선택된 특정 숙주 시스템에서 작동가능할 것으로 예상되는 것들이다. 예를 들어, 효모 예컨대 사카로미세스 세레비지아에, 클루이베로미세스 락티스, 오가타에아 미누타, 또는 피키아 파스토리스가 숙주 세포인 경우에는 효모 프로모터가 사용되는 반면, 아스페르길루스 니게르, 뉴로스포라 크라사, 또는 트리코더마 레에세이와 같은 숙주 세포에서는 진균 프로모터가 사용될 것이다. 효모 프로모터의 예로는 GAPDH, AOX1, SEC4, HH1, PMA1, OCH1, GAL1, PGK, GAP, TPI, CYC1, ADH2, PHO5, CUP1, MF α1, FLD1, PMA1, PDI, TEF, RPL10 및 GUT1 프로모터가 포함되지만, 이에 한정되지는 않는다. 문헌 [Romanos et al., Yeast 8: 423-488 (1992)]에서 효모 프로모터 및 발현 벡터의 리뷰가 제공된다. 문헌 [Hartner et al., Nucl. Acid Res. 36: e76 (pub on-line 6 June 2008)]에 피키아 파스토리스에서의 이종성 단백질의 미세-조정 발현을 위한 프로모터들의 라이브러리가 기술되어 있다.

본원에 개시된 핵산 분자에 작동가능하게 연결된 프로모터는 구성적 프로모터 또는 유도성 프로모터일 수 있다. 유도성 프로모터, 예를 들어 AOX1 프로모터는 유도제에 반응하여 전사 인자에 결합 시 증가된 속도 또는 감소된 속도로 전사를 지시하는 프로모터이다. 본원에서 사용되는 경우의 전사 인자에는 프로모터의 조절 또는 제어 영역에 결합하여 전사에 영향을 미칠 수 있는 임의의 인자가 포함된다. 숙주를 유도제에 노출시킴으로써 또는 유도제를 숙주 세포 배지로부터 제거함으로써 숙주 세포 내에서의 전사 인자의 RNA 합성 또는 프로모터 결합 능력을 제어할 수 있다. 따라서, 유도성 프로모터의 발현을 조절하기 위해, 유도제가 숙주 세포의 배양 배지에 첨가되거나 또는 이로부터 제거된다. 이같은 유도제에는 당, 포스페이트, 알콜, 금속 이온, 호르몬, 열, 냉기 등이 포함될 수 있다. 예를 들어, 효모에서 통상적으로 사용되는 유도제는 글루코스, 갈락토스, 알콜 등이다.

선택되는 전사 종결 서열은 선택된 특정 숙주 세포에서 작동가능한 것들이다. 예를 들어, 효모 숙주 세포 예컨대 사카로미세스 세레비지아에, 클루이베로미세스 락티스, 또는 피키아 파스토리스가 숙주 세포인 경우에는 효모 전사 종결 서열이 발현 벡터에서 사용되는 반면, 아스페르길루스 니게르, 뉴로스포라 크라사, 또는 트리코더마 레에세이와 같은 숙주 세포에서는 진균 전사 종결 서열이 사용될 것이다. 전사 종결 서열에는 사카로미세스 세레비지아에 CYC 전사 종결 서열 (ScCYC TT), 피키아 파스토리스 ALG3 전사 종결 서열 (ALG3 TT), 피키아 파스토리스 ALG6 전사 종결 서열 (ALG6 TT), 피키아 파스토리스 ALG12 전사 종결 서열 (ALG12 TT), 피키아 파스토리스 AOX1 전사 종결 서열 (AOX1 TT), 피키아 파스토리스 OCH1 전사 종결 서열 (OCH1 TT) 및 피키아 파스토리스 PMA1 전사 종결 서열 (PMA1 TT)이 포함되지만, 이에 한정되지는 않는다. 기타 전사 종결 서열을 실시예 및 당업계에서 확인할 수 있다.

효모를 유전자 조작하기 위해, 재조합 숙주 세포를 구축하는데 사용될 수 있는 선택 마커에는 약물 저항성 마커, 및 효모 숙주 세포가 필수적인 세포 영양물, 예를 들어 아미노산을 합성하도록 하는 유전적 기능이 포함된다. 효모에서 통상적으로 사용되는 약물 저항성 마커에는 클로람페니콜, 카나마이신, 메토트렉세이트, G418 (제네티신), 제오신 등이 포함된다. 효모 숙주 세포가 필수적인 세포 영양물을 합성하도록 하는 유전적 기능은 상응하는 게놈 기능에 영양요구성(auxotrophic) 돌연변이가 있는 이용가능한 효모 균주와 함께 사용된다. 통상적인 효모 선택 마커는 류신 (LEU2), 트립토판 (TRP1 및 TRP2), 프롤린 (PRO1), 우라실 (URA3, URA5, URA6), 히스티딘 (HIS3), 라이신 (LYS2), 아데닌 (ADE1 또는 ADE2) 등을 합성하기 위한 유전적 기능을 제공한다. 기타 효모 선택 마커에는 사카로미세스 세레비지아에로부터의 ARR3 유전자가 포함되고, 이는 아비산염의 존재 하에 성장되는 효모 세포에 아비산염에 대한 저항성을 부여한다 (문헌 [Bobrowicz et al., Yeast, 13:819-828 (1997)]; [Wysocki et al., J. Biol. Chem. 272:30061-30066 (1997)]). 다수의 적절한 통합 부위에는 미국 특허 번호 7,479,389 (이의 개시내용은 본원에 참고로 포함됨)에 열거된 것들이 포함되고, 사카로미세스 세레비지아에 및 기타 효모 또는 진균에 대해 공지된 유전자좌에 대한 상동체가 포함된다. 벡터를 효모 내로 통합시키는 방법이 주지되어 있다 (예를 들어, 미국 특허 번호 7,479,389, 미국 특허 번호 7,514,253, 미국 출원 공개 번호 2009012400, 및 WO2009/085135 (이들의 개시내용은 모두 본원에 참고로 포함됨) 참조). 삽입 부위의 예로는 피키아 ADE 유전자; 피키아 TRP (TRP1 내지 TRP2 포함) 유전자; 피키아 MCA 유전자; 피키아 CYM 유전자; 피키아 PEP 유전자; 피키아 PRB 유전자; 및 피키아 LEU 유전자가 포함되지만 이에 한정되지는 않는다. 피키아 ADE1 및 ARG4 유전자는 문헌 [Lin Cereghino et al., Gene 263:159-169 (2001)] 및 미국 특허 번호 4,818,700 (이의 개시내용은 본원에 참고로 포함됨)에 기술되어 있고, HIS3 및 TRP1 유전자는 문헌 [Cosano et al., Yeast 14:861-867 (1998)]에 기술되어 있으며, HIS4는 진뱅크(GenBank) 접속 번호 X56180에 기술되어 있다.

본원에 개시된 방법이 포유동물, 식물, 및 곤충 세포에서의 사용을 위해 개조될 수 있다. 동물 세포의 예로는 SC-I 세포, LLC-MK 세포, CV-I 세포, CHO 세포, COS 세포, 뮤린(murine) 세포, 인간 세포, HeLa 세포, 293 세포, VERO 세포, MDBK 세포, MDCK 세포, MDOK 세포, CRFK 세포, RAF 세포, TCMK 세포, LLC-PK 세포, PK15 세포, WI-38 세포, MRC-5 세포, T-FLY 세포, BHK 세포, SP2/0, NSO 세포, 및 이들의 유도체가 포함되지만, 이에 한정되지는 않는다. 곤충 세포에는 드로소필라 멜라노가스터 기원의 세포가 포함된다. 세포가 특정한 N-글리칸을 갖거나 또는 특정한 N-글리칸을 우세하게 갖는 이뮤노글로불린을 제조할 수 있게 하도록 이러한 세포들이 유전자 조작될 수 있다. 예를 들어, 미국 특허 번호 6,949,372에는 곤충 세포에서 시알릴화된 당단백질을 제조하는 방법이 개시되어 있다. 문헌 [Yamane-Ohnuki et al. Biotechnol. Bioeng. 87: 614-622 (2004)], [Kanda et al., Biotechnol. Bioeng. 94: 680-688 (2006)], [Kanda et al., Glycobiol. 17: 104-118 (2006)], 및 미국 출원 공개 번호 2005/0216958 및 2007/0020260 (이들의 개시내용은 본원에 참고로 포함됨)에는 이뮤노글로불린 상의 N-글리칸에 푸코스가 결여되었거나 또는 이뮤노글로불린 상의 N-글리칸에서 푸코스가 감소된 이뮤노글로불린을 생산할 수 있는 포유동물 세포가 개시되어 있다. 미국 특허 출원 공개 번호 2005/0074843 (이의 개시내용은 본원에 참고로 포함됨)에는 포유동물 세포에서 양분화 N-글리칸을 갖는 항체를 제조하는 것이 개시되어 있다.

포유동물, 곤충 또는 식물 세포에서의 발현 카세트의 발현을 조절하기 위해 선택된 조절성 프로모터는 선택된 세포 유형에서의 기능성에 대해 선택되어야 한다. 적절한 조절성 프로모터의 예로는 테트라사이클린-조절성 프로모터 (예를 들어, 문헌 [Berens & Hillen, Eur. J. Biochem. 270: 3109-3121 (2003)] 참조), RU 486-유도성 프로모터, 엑디손-유도성 프로모터, 및 카나마이신-조절성 시스템이 포함되지만, 이에 한정되지는 않는다. 이러한 프로모터들은 실시예에 기술된 발현 카세트에서 예시된 프로모터들을 대체할 수 있다. 포획 모이어티(capture moiety)가 선택된 세포 유형에서의 사용에 적절한 세포 표면 고정(anchoring) 단백질에 융합될 수 있다. GPI 단백질이 포함되는 세포 표면 고정 단백질이 포유동물, 곤충 및 식물 세포에 대해 주지되어 있다. GPI에 고정된 융합 단백질이 문헌 [Kennard et al., Methods Biotechnol. Vo. 8: Animal Cell Biotechnology (Ed. Jenkins. Human Press, Inc., Totowa, NJ) pp. 187-200 (1999])에 기술되어 있다. 적절한 재조합체를 제조하기 위해 발현 카세트를 숙주 세포 게놈 내로 통합시키기 위한 게놈 표적화 서열이 실시예에서 예시된 게놈 표적화 및 통합 서열을 대체할 수 있다. 안정적이고 일시적으로 형질감염된 포유동물, 곤충 및 식물 숙주 세포를 제조하기 위한 형질감염 방법이 당업계에 주지되어 있다. 형질감염된 숙주 세포가 본원에 개시된 바와 같이 구축되었으면, 세포를 본원에 개시된 바와 같이 관심 이뮤노글로불린의 발현에 대해 스크리닝하고 선택할 수 있다.

따라서, 상기의 추가적인 측면에서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 (예를 들어, 리슈마니아 메이저 STT3 단백질)를 코딩하는 핵산 분자 및 이종성 당단백질을 코딩하는 핵산 분자를 포함하는 포유동물 또는 곤충 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 포유동물 또는 곤충 숙주 세포에서 이종성 당단백질을 생산하는 방법이 제공된다. 추가적인 측면에서, 이러한 숙주 세포가 인간-유사 N-글리칸 또는 숙주 세포에 대해 일반적으로 내인성이지 않은 N-글리칸이 있는 당단백질을 생산하도록 유전자 조작된다.

상기의 추가적인 측면에서, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 (예를 들어, 리슈마니아 메이저 STT3 단백질)를 코딩하는 핵산 분자 및 이종성 당단백질을 코딩하는 핵산 분자를 포함하는 포유동물 또는 곤충 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여, 이종성 당단백질의 N-글리코실화 부위 점유가 83％를 초과하는 이종성 당단백질을 생산하는 단계를 포함하는, 포유동물 또는 곤충 숙주 세포에서 이종성 당단백질의 N-글리코실화 부위 점유가 83％를 초과하는 이종성 당단백질을 생산하는 방법이 제공된다. 추가적인 측면에서, 이러한 숙주 세포가 인간-유사 N-글리칸 또는 숙주 세포에 대해 일반적으로 내인성이지 않은 N-글리칸이 있는 당단백질을 생산하도록 유전자 조작된다.

상기 방법들의 추가적인 실시양태에서, 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현된다.

상기 방법들의 특정 실시양태에서, N-글리코실화 부위 점유가 94％ 이상이다. 추가적인 실시양태에서, N-글리코실화 부위 점유가 99％ 이상이다.

이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 (예를 들어, 리슈마니아 메이저 STT3D 단백질)를 코딩하는 제1 핵산 분자, 및 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 이때 내인성 숙주 세포 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 포유동물 또는 곤충 숙주 세포가 추가로 제공된다.

특정 실시양태에서, 고급 진핵생물 세포, 조직 또는 생물이 또한 식물계, 예를 들어, 밀, 벼, 옥수수, 담배 등으로부터의 것일 수 있다. 별법적으로, 선태류 세포가, 예를 들어, 피스코미트렐라(Physcomitrella), 푸나리아(Funaria), 스파그눔(Sphagnum), 세라토돈(Ceratodon), 마르찬티아(Marchantia), 및 스파에로카르포스(Sphaerocarpos) 속의 종으로부터 선택될 수 있다. 예시적인 식물 세포는 WO 2004/057002 및 WO2008/006554 (이들의 개시내용은 모두 본원에 참고로 포함됨)에 개시된 피스코미트렐라 파텐스의 선태류 세포이다. 식물 세포를 사용하는 발현 시스템이 세포가 특정 N-글리칸을 우세하게 갖는 이뮤노글로불린을 생산할 수 있게 하기 위해 글리코실화 경로가 변경되도록 추가로 조작될 수 있다. 예를 들어, 세포가 코어 푸코실트랜스퍼라제가 기능장애성이거나 없도록, 및/또는 자일로실트랜스퍼라제(xylosyltransferase)가 기능장애성이거나 없도록, 및/또는 β1,4-갈락토실트랜스퍼라제 기능장애성이거나 없도록 유전자 조작될 수 있다. 별법적으로, 갈락토스, 푸코스 및/또는 자일로스가 이러한 잔기들을 제거하는 효소로의 처리에 의해 이뮤노글로불린으로부터 제거될 수 있다. 당업계에 공지되어 있는 N-글리칸으로부터의 갈락토스, 푸코스 및/또는 자일로스 잔기의 제거를 초래하는 임의의 효소, 예를 들어 α-갈락토시다제, β-자일로시다제(xylosidase), 및 α-푸코시다제(fucosidase)를 사용할 수 있다. 별법적으로, 1,3-푸코실트랜스퍼라제 및/또는 1,2-자일로실트랜스퍼라제, 및/또는 1,4-갈락토실트랜스퍼라제가 기질로 사용할 수 없는 변형된 N-글리칸을 합성하는 발현 시스템을 사용할 수 있다. 식물 세포에서의 글리코실화 경로를 변형시키는 방법이 미국 특허 번호 7,449,308, 6,998,267 및 7,388,081 (이들의 개시내용은 본원에 참고로 포함됨)에 개시되어 있고, 이들은 인간-유사 N-글리칸을 갖는 재조합 당단백질을 제조하도록 식물을 유전자 조작하는 방법을 개시한다. WO 2008006554 (이의 개시내용은 본원에 참고로 포함됨)에는 자일로스 또는 푸코스가 없는 당단백질을 제조하도록 유전자 조작된 식물에서 당단백질 예컨대 항체를 제조하는 방법이 개시되어 있다. WO 2007006570 (이의 개시내용은 본원에 참고로 포함됨)에는 동물 또는 인간-유사 글리코실화 패턴을 갖는 당단백질을 제조하도록 선태류, 섬모충, 조류 및 효모를 유전자 조작하는 방법이 개시되어 있다.

따라서, 상기의 추가적인 측면에서, 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질을 생산하도록 유전자 조작되고, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 (예를 들어, 리슈마니아 메이저 STT3D 단백질)를 코딩하는 핵산 분자 및 이종성 당단백질을 코딩하는 핵산 분자를 포함하는 식물 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계를 포함하는, 식물 숙주 세포에서 포유동물- 또는 인간-유사 복합 또는 하이브리드 N-글리칸이 있는 이종성 당단백질을 생산하는 방법이 제공된다.

상기의 추가적인 측면에서, 포유동물- 또는 인간-유사 N-글리칸이 있는 당단백질을 생산하도록 유전자 조작되고, 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 (예를 들어, 리슈마니아 메이저 STT3D 단백질)를 코딩하는 핵산 분자 및 이종성 당단백질을 코딩하는 핵산 분자를 포함하는 식물 숙주 세포를 제공하는 단계, 및 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여, 이종성 당단백질의 N-글리코실화 부위 점유가 83％를 초과하는 포유동물- 또는 인간-유사 N-글리칸이 있는 이종성 당단백질을 생산하는 단계를 포함하는, 식물 숙주 세포에서 이종성 당단백질의 N-글리코실화 부위 점유가 83％를 초과하는 포유동물- 또는 인간-유사 복합 또는 하이브리드 N-글리칸이 있는 이종성 당단백질을 생산하는 방법이 제공된다.

상기 방법들의 추가적인 실시양태에서, 내인성 숙주 세포 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현된다.

이종성 단일-서브유닛 올리고사카릴트랜스퍼라제 (예를 들어, 리슈마니아 메이저 STT3D 단백질)를 코딩하는 제1 핵산 분자, 및 이종성 당단백질을 코딩하는 제2 핵산 분자를 포함하고, 이때 내인성 숙주 세포 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 내인성 숙주 세포 유전자가 발현되는 식물 숙주 세포가 추가로 제공된다.

본원에서의 숙주 세포 및 방법은 광범위한 재조합 단백질 및 당단백질을 생산하는데 유용하다. 본원에 개시된 숙주 세포에서 생산될 수 있는 재조합 단백질 및 당단백질의 예로는 에리트로포이에틴 (EPO); 인터페론 α, 인터페론 β, 인터페론 γ 및 인터페론 ω와 같은 시토카인; 및 과립구-콜로니 자극 인자 (GCSF); 과립구 대식세포-콜로니 자극 인자 (GM-CSF); 인자 VIII, 인자 IX 및 인간 단백질 C와 같은 응고 인자; 항트롬빈 III; 트롬빈; 가용성 IgE 수용체 α-사슬; IgG, IgG 단편, IgG 융합물 및 IgM과 같은 이뮤노글로불린; 가용성 TNF 수용체-Fc 융합 단백질과 같은 이뮤노어드헤신 및 기타 Fc 융합 단백질; RAGE-Fc 융합 단백질; 인터류킨; 유로키나제; 키마제; 우레아 트립신 억제제; IGF-결합 단백질; 표피 성장 인자; 성장 호르몬-방출 인자; 아넥신 V 융합 단백질; 안지오스타틴; 혈관 내피 성장 인자-2; 골수성 전구세포 억제 인자-1; 오스테오프로테게린; α-1-항트립신; α-태아 단백질; DNase II; 인간 플라스미노겐의 크링글 3; 글루코세레브로시다제; TNF 결합 단백질 1; 여포 자극 호르몬; 세포독성 T 림프구 관련 항원 4 - Ig; 막횡단 활성화제 및 칼슘 조정제 및 시클로필린 리간드; 글루카곤 유사 단백질 1; 및 IL-2 수용체 효능제가 포함되지만, 이에 한정되지는 않는다.

본원에 개시된 재조합 숙주 세포 및 방법은 갈락토스-함유 N-글리칸 백분율이 본원에 교시된 바와 같은 변형 이전의 숙주 세포에서 수득될 수 있는 갈락토스 백분율과 비교하여 증가된 항체 또는 Fc 융합 단백질 조성물을 제공하는 것이 바람직한 경우에 항체, Fc 융합 단백질 등을 생산하는데 특히 유용하다. 본원에서의 숙주 세포에서 제조될 수 있는 항체의 예로는 인간 항체, 인간화 항체, 키메라 항체, 중쇄 항체 (예를 들어, 낙타 또는 라마)가 포함되지만, 이에 한정되지는 않는다. 구체적인 항체에는 일반명 (표적) 하에 열거된 하기의 항체들이 포함되지만, 이에 한정되지는 않는다: 무로모납(Muromonab)-CD3 (항-CD3 수용체 항체), 압식시맙(Abciximab) (항-CD41 7E3 항체), 리툭시맙(Rituximab) (항-CD20 항체), 다클리주맙(Daclizumab) (항-CD25 항체), 바실릭시맙(Basiliximab) (항-CD25 항체), 팔리비주맙(Palivizumab) (항-RSV (호흡기 세포융합 바이러스) 항체), 인플릭시맙(Infliximab) (항-TNFα 항체), 트라스투주맙(Trastuzumab) (항-Her2 항체), 젬투주맙 오조가마니신(Gemtuzumab ozogamicin) (항-CD33 항체), 알렘투주맙(Alemtuzumab) (항-CD52 항체), 이브리튜모맙 티욱세텐(Ibritumomab tiuxeten) (항-CD20 항체), 아달리무맙(Adalimumab) (항-TNFα 항체), 오말리주맙(Omalizumab) (항-IgE 항체), 토시투모맙(Tositumomab)-¹³¹I (항-CD20 항체의 요오드화 유도체), 에팔리주맙(Efalizumab) (항-CD11a 항체), 세툭시맙(Cetuximab) (항-EGF 수용체 항체), 골리무맙(Golimumab) (항-TNFα 항체), 베바시주맙(Bevacizumab) (항 VEGF-A 항체), 및 이들의 변형물. 본원에 개시된 숙주 세포에서 제조될 수 있는 Fc-융합 단백질의 예로는 에타네르셉트(etanercept) (TNFR-Fc 융합 단백질), FGF-21-Fc 융합 단백질, GLP-1-Fc 융합 단백질, RAGE-Fc 융합 단백질, EPO-Fc 융합 단백질, ActRIIA-Fc 융합 단백질, ActRIIB-Fc 융합 단백질, 글루카곤-Fc 융합물, 옥신토모듈린-Fc-융합물, 및 이들의 유사체 및 변형물이 포함되지만, 이에 한정되지는 않는다.

따라서, 본원에서의 방법 및 숙주 세포는 조성물 내의 당단백질의 N-글리코실화 부위의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상이 점유되고 당단백질이 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질 조성물을 생산하는데 사용될 수 있다.

추가로, 본원에서의 방법 및 숙주 세포는 조성물 내의 당단백질의 N-글리코실화 부위의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상이 점유되고 당단백질이 푸코스가 결여된 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질 조성물을 생산하는데 사용될 수 있다.

추가로, 포유동물-유사 또는 인간-유사 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 진균 숙주 세포 및 방법이 조성물 내의 당단백질의 N-글리코실화 부위의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상이 점유되고 당단백질이 푸코스가 결여된 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질 조성물을 생산하는데 사용될 수 있다.

일부 측면에서, 푸코실화 포유동물- 또는 인간-유사 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 숙주 세포가 조성물 내의 당단백질의 N-글리코실화 부위의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상이 점유되고 당단백질이 푸코스를 갖는 포유동물- 또는 인간-유사 N-글리칸을 갖는 당단백질 조성물을 생산하는데 사용될 수 있다.

본원에 개시된 재조합 세포는 이종성 펩티드 또는 약물 분자에 화학적으로 접합시키기에 적절한 항체 및 Fc 단편을 생산하는데 사용될 수 있다. 예를 들어, WO2005047334, WO2005047336, WO2005047337, 및 WO2006107124 (이들의 개시내용은 본원에 참고로 포함됨)에 펩티드 또는 약물 분자를 Fc 단편에 화학적으로 접합시키는 것이 개시되어 있다. EP1180121, EP1105409, 및 US 6,593,295 (이들의 개시내용은 본원에 참고로 포함됨)에는 펩티드 등을 혈액 성분에 화학적으로 접합시키는 것이 개시되어 있고, 이는 전체 항체를 포함한다.

따라서, 본원에서의 방법 및 숙주 세포는 조성물 내의 항체 분자의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상에서 두 N-글리코실화 부위 모두가 점유되고 항체가 포유동물- 또는 인간-유사 N-글리칸을 갖는 항체 조성물을 생산하는데 사용될 수 있다.

추가로, 본원에서의 방법 및 숙주 세포는 조성물 내의 항체 분자의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상에서 두 N-글리코실화 부위 모두가 점유되고 항체가 푸코스가 결여된 포유동물- 또는 인간-유사 N-글리칸을 갖는 항체 조성물을 생산하는데 사용될 수 있다.

추가로, 포유동물-유사 또는 인간-유사 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 진균 숙주 세포 및 방법이 조성물 내의 항체 분자의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상에서 두 N-글리코실화 부위 모두가 점유되고 항체가 푸코스가 결여된 포유동물- 또는 인간-유사 N-글리칸을 갖는 항체 조성물을 생산하는데 사용될 수 있다.

일부 측면에서, 푸코실화 포유동물- 또는 인간-유사 N-글리칸을 생산하도록 유전자 조작된 효모 또는 사상 숙주 세포가 조성물 내의 항체 분자의 70％, 75％, 80％, 85％, 90％, 95％, 98％, 또는 99％ 이상에서 두 N-글리코실화 부위 모두가 점유되고 항체가 푸코스를 갖는 포유동물- 또는 인간-유사 N-글리칸을 갖는 항체 조성물을 생산하는데 사용될 수 있다.

실시예 3에서 제시된 바와 같이, 갈락토스-말단 N-글리칸을 제조하도록 유전자 조작된 피키아 파스토리스 균주에서 생산된 항체의 N-글리코실화 조성이 약 50-60 몰％ G0, 18-24 몰％ G1, 3-8％ 몰％ G2, 12-17 몰％ Man5, 및 3-6 몰％ 하이브리드 범위인 것으로 보인다.

따라서, 조성물 내의 항체 분자의 70％ 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸의 약 50-70 몰％가 G0 구조이고, N-글리칸의 15-25 몰％가 G1 구조이고, N-글리칸의 4-12 몰％가 G2 구조이고, N-글리칸의 5-17 몰％가 Man5 구조이며, N-글리칸의 5-15 몰％가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 제공된다. 조성물 내의 항체 분자의 70％ 이상에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰％가 G0 구조이고, N-글리칸의 20-22 몰％가 G1 구조이며, N-글리칸의 약 16 내지 18 몰％가 Man₅GlcNAc₂ 코어 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다. 상기의 추가적인 측면에서, N-글리칸이 추가로 푸코스를 포함한다.

따라서, 조성물 내의 항체 분자의 75％ 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸의 약 50-70 몰％가 G0 구조이고, N-글리칸의 15-25 몰％가 G1 구조이고, N-글리칸의 4-12 몰％가 G2 구조이고, N-글리칸의 5-17 몰％가 Man5 구조이며, N-글리칸의 5-15 몰％가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 제공된다. 조성물 내의 항체 분자의 75％ 이상에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰％가 G0 구조이고, N-글리칸의 20-22 몰％가 G1 구조이며, N-글리칸의 약 16 내지 18 몰％가 Man₅GlcNAc₂ 코어 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다. 상기의 추가적인 측면에서, N-글리칸이 추가로 푸코스를 포함한다.

추가로, 조성물 내의 항체 분자의 80％ 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸의 약 50-70 몰％가 G0 구조이고, N-글리칸의 15-25 몰％가 G1 구조이고, N-글리칸의 4-12 몰％가 G2 구조이고, N-글리칸의 5-17 몰％가 Man5 구조이며, N-글리칸의 5-15 몰％가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 제공된다. 조성물 내의 항체 분자의 80％ 이상에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰％가 G0 구조이고, N-글리칸의 20-22 몰％가 G1 구조이며, N-글리칸의 약 16 내지 18 몰％가 Man₅GlcNAc₂ 코어 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다. 상기의 추가적인 측면에서, N-글리칸이 추가로 푸코스를 포함한다.

따라서, 조성물 내의 항체 분자의 85％ 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸의 약 50-70 몰％가 G0 구조이고, N-글리칸의 15-25 몰％가 G1 구조이고, N-글리칸의 4-12 몰％가 G2 구조이고, N-글리칸의 5-17 몰％가 Man5 구조이며, N-글리칸의 5-15 몰％가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 제공된다. 조성물 내의 항체 분자의 85％ 이상에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰％가 G0 구조이고, N-글리칸의 20-22 몰％가 G1 구조이며, N-글리칸의 약 16 내지 18 몰％가 Man₅GlcNAc₂ 코어 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다. 상기의 추가적인 측면에서, N-글리칸이 추가로 푸코스를 포함한다.

추가로, 조성물 내의 항체 분자의 90％ 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸의 약 50-70 몰％가 G0 구조이고, N-글리칸의 15-25 몰％가 G1 구조이고, N-글리칸의 4-12 몰％가 G2 구조이고, N-글리칸의 5-17 몰％가 Man5 구조이며, N-글리칸의 5-15 몰％가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 제공된다. 조성물 내의 항체 분자의 90％ 이상에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰％가 G0 구조이고, N-글리칸의 20-22 몰％가 G1 구조이며, N-글리칸의 약 16 내지 18 몰％가 Man₅GlcNAc₂ 코어 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다. 상기의 추가적인 측면에서, N-글리칸이 추가로 푸코스를 포함한다.

따라서, 조성물 내의 항체 분자의 95％ 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸의 약 50-70 몰％가 G0 구조이고, N-글리칸의 15-25 몰％가 G1 구조이고, N-글리칸의 4-12 몰％가 G2 구조이고, N-글리칸의 5-17 몰％가 Man5 구조이며, N-글리칸의 5-15 몰％가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 제공된다. 조성물 내의 항체 분자의 95％ 이상에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰％가 G0 구조이고, N-글리칸의 20-22 몰％가 G1 구조이며, N-글리칸의 약 16 내지 18 몰％가 Man₅GlcNAc₂ 코어 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다. 상기의 추가적인 측면에서, N-글리칸이 추가로 푸코스를 포함한다.

추가로, 조성물 내의 항체 분자의 98％ 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸의 약 50-70 몰％가 G0 구조이고, N-글리칸의 15-25 몰％가 G1 구조이고, N-글리칸의 4-12 몰％가 G2 구조이고, N-글리칸의 5-17 몰％가 Man5 구조이며, N-글리칸의 5-15 몰％가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 제공된다. 조성물 내의 항체 분자의 98％ 이상에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰％가 G0 구조이고, N-글리칸의 20-22 몰％가 G1 구조이며, N-글리칸의 약 16 내지 18 몰％가 Man₅GlcNAc₂ 코어 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다. 상기의 추가적인 측면에서, N-글리칸이 추가로 푸코스를 포함한다.

따라서, 조성물 내의 항체 분자의 99％ 이상에서 두 N-글리코실화 부위 모두가 점유되고 N-글리칸의 약 50-70 몰％가 G0 구조이고, N-글리칸의 15-25 몰％가 G1 구조이고, N-글리칸의 4-12 몰％가 G2 구조이고, N-글리칸의 5-17 몰％가 Man5 구조이며, N-글리칸의 5-15 몰％가 하이브리드 구조인 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 제공된다. 조성물 내의 항체 분자의 99％ 이상에서 두 N-글리코실화 부위 모두가 점유되고, N-글리칸의 약 53 내지 58 몰％가 G0 구조이고, N-글리칸의 20-22 몰％가 G1 구조이며, N-글리칸의 약 16 내지 18 몰％가 Man₅GlcNAc₂ 코어 구조를 포함하는 다수의 항체, 및 제약상 허용되는 담체를 포함하는 당단백질 조성물이 추가로 제공된다. 상기의 추가적인 측면에서, N-글리칸이 추가로 푸코스를 포함한다.

본원에서 참조 또는 언급된 모든 특허 및 간행물은 본 발명이 속하는 분야의 당업자의 기술 수준을 나타내고, 각각의 이같은 참조된 특허 또는 간행물은 이의 전문이 개별적으로 참고로 포함되거나 이의 전문이 본원에 기재된 것과 동일한 정도로 참고로 본원에 포함된다.

하기의 실시예들은 본 발명의 추가적인 이해를 촉진하도록 의도된다.

실시예 1

유도성 또는 구성적 프로모터에 작동가능하게 연결된 리슈마니아 메이저 STT3D (LmSTT3D) 오픈 리딩 프레임 (ORF)을 코딩하는 발현 카세트를 포함하는 플라스미드를 하기와 같이 구축하였다.

LmSTT3D (서열 12)를 코딩하는 오픈 리딩 프레임이 피키아 파스토리스에서의 최적의 발현을 위해 코돈-최적화되었고, 진아트 아게(GeneArt AG) (독일 브란덴부르크)에 의해 합성되었다. LmSTT3D를 코딩하는 코돈-최적화 핵산 분자가 pGLY6287로 지정되었고, 이의 뉴클레오티드 서열이 서열 11에서 제시된다.

플라스미드 pGLY6301 (도 2)는 피키아 파스토리스 내의 URA6 유전자좌를 표적으로 하는 롤-인 통합 플라스미드이다. LmSTT3D를 코딩하는 발현 카세트는 유도성 피키아 파스토리스 AOX1 프로모터 서열 (서열 23)을 갖는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열 (서열 24)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된 피키아 파스토리스에서의 효과적인 발현을 위해 코돈-최적화된 LmSTT3D ORF를 코딩하는 핵산 분자를 포함한다. 형질전환체를 선택하기 위해, 이러한 플라스미드는 사카로미세스 세레비지아에 ARR3 ORF를 코딩하는 핵산 분자 (서열 32)가 피키아 파스토리스 RPL10 프로모터 서열 (서열 25)을 갖는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열 (서열 24)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결되어 있는, 사카로미세스 세레비지아에 ARR3 ORF를 코딩하는 발현 카세트를 포함한다. 이러한 플라스미드는 URA6 유전자좌 (서열 33)를 표적으로 하는 핵산 분자를 추가로 포함한다. EcoRI 부위가 5' 끝부분에, FseI 부위가 3' 끝부분에 플랭킹된 코돈-최적화 LmSTT3D ORF (pGLY6287)를 코딩하는 DNA 단편을 EcoRI 및 FseI로 소화된 플라스미드 pGFI30t 내로 클로닝함으로써, 플라스미드 pGLY6301이 구축되었다.

플라스미드 pGLY6294 (도 3)는 피키아 파스토리스 내의 TRP1 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하는 KINKO 통합 벡터이다. KINKO (녹-아웃이 거의 또는 전혀 없는 녹-인(knock-in): Knock-In with little or No Knock-Out) 통합 벡터는 표적화된 유전자좌에서 유전자의 발현을 파괴하지 않으면서 표적화된 유전자좌 내로의 이종성 DNA의 삽입을 가능하게 하고, 미국 출원 공개 번호 20090124000에 기술되어 있다. LmSTT3D를 코딩하는 발현 카세트는 구성적 피키아 파스토리스 GAPDH 프로모터 서열 (서열 26)을 갖는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열 (서열 24)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된 LmSTT3D ORF를 코딩하는 핵산 분자를 포함한다. 형질전환체를 선택하기 위해, 이러한 플라스미드는 노르세오트리신 저항성 (NAT^R) ORF (EROSCARF로부터의 pAG25로부터 유래됨, 사이언티픽 리서치 앤드 디벨롭먼트 게엠베하(Scientific Research and Development GmbH) (독일 D-61352 바트 홈부르크 다임러스트라쎄 13a), 문헌 [Goldstein et al., Yeast 15: 1541 (1999)] 참조)를 코딩하는 핵산 분자 (서열 34)가 아시비아 고시피이 TEF1 프로모터 서열 (서열 86)을 갖는 핵산 분자에 5' 끝부분에서, 아시비아 고시피이 TEF1 종결 서열 (서열 87)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결되어 있는, 노르세오트리신 저항성 (NAT^R) ORF를 코딩하는 발현 카세트를 포함한다. 이러한 2개의 발현 카세트에 피키아 파스토리스 ALG3 종결 서열 (서열 29)을 갖는 핵산 분자에 연결된 정지 코돈에서 끝나는 Trp1p를 코딩하는 ORF의 5' 영역으로부터의 뉴클레오티드 서열 (서열 30)을 포함하는 핵산 분자가 한쪽 측면에, TRP1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 31)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. NotI 부위가 5' 끝부분에, PacI 부위가 3' 끝부분에 플랭킹된 코돈-최적화 LmSTT3D ORF (pGLY6287)를 코딩하는 DNA 단편을 NotI 및 PacI로 소화된 플라스미드 pGLY597 내로 클로닝함으로써, 플라스미드 pGLY6294가 구축되었다. 아시비아 고시피이 TEF1 프로모터 (PTEF) 및 아시비아 고시피이 TEF1 종결 서열 (TTEF)에 작동가능하게 연결된 노르세오트리신 저항성 ORF (NAT)를 코딩하는 핵산 분자를 포함하는 발현 카세트.

상기 플라스미드들을 하기 실시예에서 제시된 바와 같이 내부에서 생산된 당단백질 상의 N-글리코실화 부위 점유를 증가시키기 위해 피키아 파스토리스 내로 LmSTT3D 발현 카세트를 도입하는데 사용할 수 있다.

실시예 2

유전자 조작된 피키아 파스토리스 균주 YGLY13992는 재조합 인간 항-Her2 항체를 생산하는 균주이고, 피키아 파스토리스 균주 YGLY14401은 재조합 인간 항-RSV 항체를 생산하는 균주이다. 이러한 균주들의 구축이 도 1a-1h에서 도식적으로 도해된다. 간략하게, 이러한 균주들을 하기와 같이 구축하였다.

앞서 기술된 방법을 사용하여 야생형 피키아 파스토리스 균주 NRRL -Y 11430으로부터 균주 YGLY8316을 구축하였다 (예를 들어, 미국 특허 번호 7,449,308; 미국 특허 번호 7,479,389; 미국 출원 공개 번호 20090124000; PCT 출원 공개 번호 WO2009085135; 문헌 [Nett and Gerngross, Yeast 20:1279 (2003)]; [Choi et al., Proc. Natl. Acad. Sci. USA 100:5022 (2003)]; [Hamilton et al., Science 301:1244 (2003)] 참조). 모든 플라스미드는 표준 분자 생물학 절차를 사용하여 pUC19 플라스미드에서 제조되었다. 피키아 파스토리스에서의 발현에 최적화된 뉴클레오티드 서열을 위해, 천연 뉴클레오티드 서열을 진옵티마이저(GENEOPTIMIZER) 소프트웨어 (진아트(GeneArt), 독일 레겐스부르크)에 의해 분석하였고, 결과를 사용하여, 코돈이 피키아 파스토리스 발현에 대해 최적화된 뉴클레오티드 서열을 생성시켰다. 전기천공에 의해 (전기천공기의 제조사인 바이오래드(BioRad)가 권장하는 바와 같은 표준 기술을 사용하여) 효모 균주를 형질전환시켰다.

플라스미드 pGLY6 (도 4)은 URA5 유전자좌를 표적으로 하는 통합 벡터이다. 이는 피키아 파스토리스 URA5 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (서열 39)을 포함하는 핵산 분자가 한쪽 측면에, 피키아 파스토리스 URA5 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 40)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 사카로미세스 세레비지아에 인버타제 유전자 또는 전사 단위 (ScSUC2: 서열 38)를 포함하는 핵산 분자를 함유한다. 플라스미드 pGLY6을 선형화하고, 선형화된 플라스미드를 야생형 균주 NRRL -Y 11430 내로 형질전환시켜, ScSUC2 유전자가 이중-교차 상동 재조합에 의해 URA5 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY1 -3을 선택하였고, 이는 우라실에 대해 영양요구성이다.

플라스미드 pGLY40 (도 5)은 OCH1 유전자좌를 표적으로 하고, lacZ 반복물 (서열 42)을 포함하는 핵산 분자들이 플랭킹되고, 그 다음에 OCH1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (서열 43)을 포함하는 핵산 분자가 한쪽 측면에, OCH1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 44)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위 (서열 41)를 포함하는 핵산 분자를 함유하는 통합 벡터이다. 플라스미드 pGLY40을 SfiI로 선형화시키고, 선형화된 플라스미드를 균주 YGLY1 -3 내로 형질전환시켜, lacZ 반복물들이 플랭킹된 URA5 유전자가 이중-교차 상동 재조합에 의해 OCH1 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY2 -3을 선택하였고, 이는 URA5에 대해 원영양성(prototrophic)이다. 균주 YGLY2 -3을 5-플루오로오로트산 (5-FOA)의 존재 하에 역선별(counterselecting)하여, URA5 유전자는 상실되었고 lacZ 반복물들만 OCH1 유전자좌 내에 잔존하는 다수의 균주를 생산하였다. 이는 균주를 우라실에 대해 영양요구성이게 한다. 균주 YGLY4 -3을 선택하였다.

플라스미드 pGLY43a (도 6)는 BMT2 유전자좌를 표적으로 하고, lacZ 반복물을 포함하는 핵산 분자들이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위를 포함하는 핵산 분자에 인접한 클루이베로미세스 락티스 UDP-N-아세틸글루코사민 (UDP-GlcNAc) 수송체 유전자 또는 전사 단위 (KlMNN2 -2, 서열 45)를 포함하는 핵산 분자를 함유하는 통합 벡터이다. 이러한 인접한 유전자들에 BMT2 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (서열 46)을 포함하는 핵산 분자가 한쪽 측면에, BMT2 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 47)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. 플라스미드 pGLY43a를 SfiI로 선형화시키고, 선형화된 플라스미드를 균주 YGLY4 -3 내로 형질전환시켜, KlMNN2 -2 유전자 및 lacZ 반복물들이 플랭킹된 URA5 유전자가 이중-교차 상동 재조합에 의해 BMT2 유전자좌 내로 삽입된 다수의 균주를 생산하였다. BMT2 유전자는 문헌 [Mille et al., J. Biol. Chem. 283: 9724-9736 (2008)] 및 미국 특허 번호 7,465,557에 개시되어 있다. 생산된 균주들로부터 균주 YGLY6 -3을 선택하였고, 이는 우라실에 대해 원영양성이다. 균주 YGLY6 -3을 5-FOA의 존재 하에 역선별하여, URA5 유전자는 상실되었고 lacZ 반복물들만 잔존하는 다수의 균주를 생산하였다. 이는 균주를 우라실에 대해 영양요구성이게 한다. 균주 YGLY8 -3을 선택하였다.

플라스미드 pGLY48 (도 7)는 MNN4L1 유전자좌를 표적으로 하고, lacZ 반복물들이 플랭킹된 피키아 파스토리스 URA5 유전자를 포함하는 핵산 분자에 인접한, 피키아 파스토리스 GAPDH 프로모터 (서열 26)를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 종결 서열 (서열 24)을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된 UDP-GlcNAc 수송체의 마우스 상동체 (서열 48) 오픈 리딩 프레임 (ORF)을 코딩하는 핵산 분자를 포함하는 발현 카세트를 함유하며, 이때 전체적인 발현 카세트들에 피키아 파스토리스 MNN4L1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (서열 49)을 포함하는 핵산 분자가 한쪽 측면에, MNN4L1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 50)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 통합 벡터이다. 플라스미드 pGLY48을 SfiI로 선형화시키고, 선형화된 플라스미드를 균주 YGLY8 -3 내로 형질전환시켜, 마우스 UDP-GlcNAc 수송체를 코딩하는 발현 카세트 및 URA5 유전자가 이중-교차 상동 재조합에 의해 MNN4L1 유전자좌 내로 삽입된 다수의 균주를 생산하였다. MNN4L1 유전자 (MNN4B로 또한 지칭됨)는 미국 특허 번호 7,259,007에 개시되어 있다. 생산된 균주들로부터 균주 YGLY10 -3을 선택한 후, 5-FOA의 존재 하에 역선별하여, URA5 유전자는 상실되었고 lacZ 반복물들만 잔존하는 다수의 균주를 생산하였다. 균주 YGLY12-3을 선택하였다.

플라스미드 pGLY45 (도 8)는 PNO1 / MNN4 유전자좌를 표적으로 하고, lacZ 반복물을 포함하는 핵산 분자들이 플랭킹되고, 그 다음에 PNO1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (서열 51)을 포함하는 핵산 분자가 한쪽 측면에, MNN4 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 52)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위를 포함하는 핵산 분자를 함유하는 통합 벡터이다. 플라스미드 pGLY45를 SfiI로 선형화시키고, 선형화된 플라스미드를 균주 YGLY12 -3 내로 형질전환시켜, lacZ 반복물들이 플랭킹된 URA5 유전자가 이중-교차 상동 재조합에 의해 PNO1 / MNN4 유전자좌 내로 삽입된 다수의 균주를 생산하였다. PNO1 유전자는 미국 특허 번호 7,198,921에 개시되어 있고, MNN4 유전자 (MNN4B로 또한 지칭됨)는 미국 특허 번호 7,259,007에 개시되어 있다. 생산된 균주들로부터 균주 YGLY14 -3을 선택한 후, 5-FOA의 존재 하에 역선별하여, URA5 유전자는 상실되었고 lacZ 반복물들만 잔존하는 다수의 균주를 생산하였다. 균주 YGLY16 -3을 선택하였다.

플라스미드 pGLY1430 (도 9)은 ADE1 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하고, (1) N-말단에서 키메라 효소를 ER 또는 골지에 표적화하기 위한 피키아 파스토리스 SEC12 리더 펩티드 (10)에 융합된 인간 GlcNAc 트랜스퍼라제 I 촉매 도메인 (NA), (2) UDP-GlcNAc 수송체의 마우스 상동체 (MmTr), (3) N-말단에서 키메라 효소를 ER 또는 골지에 표적화하기 위한 사카로미세스 세레비지아에 SEC12 리더 펩티드 (8)에 융합된 마우스 만노시다제 IA 촉매 도메인 (FB), 및 (4) 피키아 파스토리스 URA5 유전자 또는 전사 단위를 코딩하는 4개의 발현 카세트를 일렬로 함유하는 KINKO 통합 벡터이다. KINKO (녹-아웃이 거의 또는 전혀 없는 녹-인: Knock-In with little or No Knock-Out) 통합 벡터는 표적화된 유전자좌에서 유전자의 발현을 파괴하지 않으면서 표적화된 유전자좌 내로의 이종성 DNA의 삽입을 가능하게 하고, 미국 출원 공개 번호 20090124000에 기술되어 있다. NA10을 코딩하는 발현 카세트는 5' 끝부분에서 SEC12 리더 10을 코딩하는 핵산 분자 (서열 54)에 융합된, 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 인간 GlcNAc 트랜스퍼라제 I 촉매 도메인을 코딩하는 핵산 분자 (서열 53)를 포함하고, 이는 피키아 파스토리스 PMA1 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 피키아 파스토리스 PMA1 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. MmTr을 코딩하는 발현 카세트는 피키아 파스토리스 SEC4 프로모터 (서열 55)를 포함하는 핵산 분자에 5' 끝부분에서, 피키아 파스토리스 OCH1 종결 서열 (서열 56)을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된, UDP-GlcNAc 수송체의 마우스 상동체 ORF를 코딩하는 핵산 분자를 포함한다. FB8을 코딩하는 발현 카세트는 5' 끝부분에서 SEC12 -m 리더 8을 코딩하는 핵산 분자 (서열 58)에 융합된, 마우스 만노시다제 IA 촉매 도메인을 코딩하는 핵산 분자 (서열 57)를 포함하고, 이는 피키아 파스토리스 GAPDH 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. URA5 발현 카세트는 lacZ 반복물을 포함하는 핵산 분자들이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위를 포함하는 핵산 분자를 포함한다. 일렬의 4개의 카세트에 ADE1 유전자의 5' 영역 및 완전한 ORF로부터의 뉴클레오티드 서열 (서열 59)에 이어지는 피키아 파스토리스 ALG3 종결 서열 (서열 29)을 포함하는 핵산 분자가 한쪽 측면에, ADE1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 60)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. 플라스미드 pGLY1430을 SfiI로 선형화시키고, 선형화된 플라스미드를 균주 YGLY16 -3 내로 형질전환시켜, 일렬의 4개의 발현 카세트가 이중-교차 상동 재조합에 의해 ADE1 ORF에 바로 이어져서 ADE1 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY2798을 선택하였고, 이는 아르기닌에 대해 영양요구성이고, 이제 우리딘, 히스티딘, 및 아데닌에 대해 원영양성이다. 그 후, 균주를 5-FOA의 존재 하에 역선별하여, 이제 우리딘에 대해 영양요구성인 다수의 균주를 생산하였다. 균주 YGLY3794를 선택하였고, 이는 갈락토스 말단 N-글리칸을 우세하게 갖는 당단백질을 제조할 수 있다.

플라스미드 pGLY582 (도 10)는 HIS1 유전자좌를 표적으로 하고, (1) 사카로미세스 세레비지아에 UDP-글루코스 에피머라제 (ScGAL10), (2) N-말단에서 키메라 효소를 ER 또는 골지에 표적화하기 위한 사카로미세스 세레비지아에 KRE2 -s 리더 펩티드 (33)에 융합된 인간 갈락토실트랜스퍼라제 I (hGalT) 촉매 도메인, (3) lacZ 반복물들이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위, 및 (4) 드로소필라 멜라노가스터 UDP-갈락토스 수송체 (DmUGT)를 코딩하는 4개의 발현 카세트를 일렬로 함유하는 통합 벡터이다. ScGAL10을 코딩하는 발현 카세트는 피키아 파스토리스 PMA1 프로모터 (서열 88)를 포함하는 핵산 분자에 5' 끝부분에서 작동가능하게 연결되고, 피키아 파스토리스 PMA1 전사 종결 서열 (서열 62)을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된, ScGAL10 ORF를 코딩하는 핵산 분자 (서열 61)를 포함한다. 키메라 갈락토실트랜스퍼라제 I를 코딩하는 발현 카세트는 5' 끝부분에서 KRE2 -s 리더 33을 코딩하는 핵산 분자 (서열 64)에 융합된, 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 hGalT 촉매 도메인을 코딩하는 핵산 분자 (서열 63)를 포함하고, 이는 피키아 파스토리스 GAPDH 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. URA5 발현 카세트는 lacZ 반복물을 포함하는 핵산 분자들이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위를 포함하는 핵산 분자를 포함한다. DmUGT를 코딩하는 발현 카세트는 피키아 파스토리스 OCH1 프로모터 (서열 66)를 포함하는 핵산 분자에 5' 끝부분에서 작동가능하게 연결되고, 피키아 파스토리스 ALG12 전사 종결 서열 (서열 67)을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된, DmUGT ORF를 코딩하는 핵산 분자 (서열 65)를 포함한다. 일렬의 4개의 카세트에 HIS1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (서열 68)을 포함하는 핵산 분자가 한쪽 측면에, HIS1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 69)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. 플라스미드 pGLY582를 선형화시키고, 선형화된 플라스미드를 균주 YGLY3794 내로 형질전환시켜, 일렬의 4개의 발현 카세트가 상동 재조합에 의해 HIS1 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 균주 YGLY3853을 선택하였고, 이는 히스티딘에 대해 영양요구성이고, 우리딘에 대해 원영양성이다.

플라스미드 pGLY167b (도 11)은 ARG1 유전자좌를 표적으로 하고, (1) N-말단에서 키메라 효소를 ER 또는 골지에 표적화하기 위한 사카로미세스 세레비지아에 MNN2 리더 펩티드 (53)에 융합된 드로소필라 멜라노가스터 만노시다제 II 촉매 도메인 (KD), (2) 피키아 파스토리스 HIS1 유전자 또는 전사 단위, 및 (3) N-말단에서 키메라 효소를 ER 또는 골지에 표적화하기 위한 사카로미세스 세레비지아에 MNN2 리더 펩티드 (54)에 융합된 래트 N-아세틸글루코사민 (GlcNAc) 트랜스퍼라제 II 촉매 도메인 (TC)을 코딩하는 3개의 발현 카세트를 일렬로 함유하는 통합 벡터이다. KD53을 코딩하는 발현 카세트는 5' 끝부분에서 MNN2 리더 53을 코딩하는 핵산 분자 (서열 71)에 융합된, 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 드로소필라 멜라노가스터 만노시다제 II 촉매 도메인을 코딩하는 핵산 분자 (서열 70)를 포함하고, 이는 피키아 파스토리스 GAPDH 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. HIS1 발현 카세트는 피키아 파스토리스 HIS1 유전자 또는 전사 단위 (서열 72)를 포함하는 핵산 분자를 포함한다. TC54를 코딩하는 발현 카세트는 5' 끝부분에서 MNN2 리더 54를 코딩하는 핵산 분자 (서열 74)에 융합된, 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 래트 GlcNAc 트랜스퍼라제 II 촉매 도메인을 코딩하는 핵산 분자 (서열 73)를 포함하고, 이는 피키아 파스토리스 PMA1 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 피키아 파스토리스 PMA1 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. 일렬의 3개의 카세트에 ARG1 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (서열 75)을 포함하는 핵산 분자가 한쪽 측면에, ARG1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 76)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. 플라스미드 pGLY167b를 SfiI로 선형화시키고, 선형화된 플라스미드를 균주 YGLY3853 내로 형질전환시켜, 일렬의 3개의 발현 카세트가 이중-교차 상동 재조합에 의해 ARG1 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY4754를 선택하였고, 이는 아르기닌에 대해 영양요구성이고, 우리딘 및 히스티딘에 대해 원영양성이다. 그 후, 균주를 5-FOA의 존재 하에 역선별하여, 이제 우리딘에 대해 영양요구성인 다수의 균주를 생산하였다. 균주 YGLY4799를 선택하였다.

플라스미드 pGLY3411 (도 12)은 피키아 파스토리스 BMT4 유전자의 5' 뉴클레오티드 서열 (서열 77)이 한쪽 측면에, 피키아 파스토리스 BMT4 유전자의 3' 뉴클레오티드 서열 (서열 78)이 다른 쪽 측면에 플랭킹된, lacZ 반복물들이 플랭킹된 피키아 파스토리스 URA5 유전자를 포함하는 발현 카세트를 함유하는 통합 벡터이다. 플라스미드 pGLY3411을 선형화시키고, 선형화된 플라스미드를 YGLY4799 내로 형질전환시켜, URA5 발현 카세트가 이중-교차 상동 재조합에 의해 BMT4 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY6903을 선택하였고, 이는 우라실, 아데닌, 히스티딘, 프롤린, 아르기닌, 및 트립토판에 대해 원영양성이다. 그 후, 균주를 5-FOA의 존재 하에 역선별하여, 이제 우리딘에 대해 영양요구성인 다수의 균주를 생산하였다. 균주 YGLY7432 및 YGLY7433을 선택하였다.

플라스미드 pGLY3419 (도 13)는 피키아 파스토리스 BMT1 유전자의 5' 뉴클레오티드 서열 (서열 79)이 한쪽 측면에, 피키아 파스토리스 BMT1 유전자의 3' 뉴클레오티드 서열 (서열 80)이 다른 쪽 측면에 플랭킹된, lacZ 반복물들이 플랭킹된 피키아 파스토리스 URA5 유전자를 포함하는 발현 카세트를 함유하는 통합 벡터이다. 플라스미드 pGLY3419를 선형화하고, 선형화된 플라스미드를 균주 YGLY7432 및 YGLY7433 내로 형질전환시켜, URA5 발현 카세트가 이중-교차 상동 재조합에 의해 BMT1 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY7656 및 YGLY7651을 선택하였고, 이들은 우라실, 아데닌, 히스티딘, 프롤린, 아르기닌, 및 트립토판에 대해 원영양성이다. 그 후, 균주를 5-FOA의 존재 하에 역선별하여, 이제 우리딘에 대해 영양요구성인 다수의 균주를 생산하였다. 균주 YGLY7930 및 YGLY7940을 선택하였다.

플라스미드 pGLY3421 (도 14)은 피키아 파스토리스 BMT3 유전자의 5' 뉴클레오티드 서열 (서열 81)이 한쪽 측면에, 피키아 파스토리스 BMT3 유전자의 3' 뉴클레오티드 서열 (서열 82)이 다른 쪽 측면에 플랭킹된, lacZ 반복물들이 플랭킹된 피키아 파스토리스 URA5 유전자를 포함하는 발현 카세트를 함유하는 통합 벡터이다. 플라스미드 pGLY3419를 선형화하고, 선형화된 플라스미드를 균주 YGLY7930 및 YGLY7940 내로 형질전환시켜, URA5 발현 카세트가 이중-교차 상동 재조합에 의해 BMT1 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY7965 및 YGLY7961을 선택하였고, 이들은 우라실, 아데닌, 히스티딘, 프롤린, 아르기닌, 및 트립토판에 대해 원영양성이다.

플라스미드 pGLY3673 (도 15)는 PRO1 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하고, N-말단에서 키메라 단백질을 분비 경로 및 세포로부터의 분비에 표적화하기 위한 사카로미세스 세레비지아에 αMATpre 신호 펩티드에 융합된 트리코더마 레에세이 α-1,2-만노시다제 촉매 도메인 (aMATTrMan)을 함유하는 KINKO 통합 벡터이다. aMATTrMan을 코딩하는 발현 카세트는 5' 끝부분에서 사카로미세스 세레비지아에 αMATpre 신호 펩티드를 코딩하는 핵산 분자 (서열 13)에 융합된, 트리코더마 레에세이 촉매 도메인을 코딩하는 핵산 분자 (서열 83)를 포함하고, 이는 피키아 파스토리스 AOX1 프로모터 (서열 23)를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열 (서열 24)을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. 이러한 카세트에 PRO1 유전자의 5' 영역 및 완전한 ORF로부터의 뉴클레오티드 서열 (서열 89)에 이어지는 피키아 파스토리스 ALG3 종결 서열을 포함하는 핵산 분자가 한쪽 측면에, PRO1 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 90)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. 이러한 플라스미드는 PpARG1 유전자를 함유한다. 플라스미드 pGLY3673을 균주 YGLY7965 및 YGLY7961 내로 형질전환시켜 다수의 균주를 생산하였고, 생산된 균주들로부터 균주 YGLY78316 및 YGLY8323을 선택하였다.

플라스미드 pGLY6833 (도 16)은 피키아 파스토리스 내의 TRP2 유전자좌를 표적으로 하는, 항-Her2 항체의 경쇄 및 중쇄를 코딩하는 롤-인 통합 벡터이다. 항-Her2 중쇄를 코딩하는 발현 카세트는 사카로미세스 세레비지아에 메이팅(mating) 인자 전(pre)-신호 서열 (서열 14)을 코딩하는 핵산 분자 (차례로 이의 N-말단에서 유도성 피키아 파스토리스 AOX1 프로모터 서열 (서열 23)을 갖는 핵산 분자에 융합됨)에 5' 끝부분에서, 피키아 파스토리스 CIT1 전사 종결 서열 (서열 85)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된, 피키아 파스토리스에서의 효과적인 발현에 대해 코돈-최적화된 중쇄 ORF를 코딩하는 핵산 분자 (서열 15)를 포함한다. 항-Her2 경쇄를 코딩하는 발현 카세트는 사카로미세스 세레비지아에 메이팅 인자 전-신호 서열 (서열 14)을 코딩하는 핵산 분자 (차례로 이의 N-말단에서 유도성 피키아 파스토리스 AOX1 프로모터 서열 (서열 23)을 갖는 핵산 분자에 융합됨)에 5' 끝부분에서, 피키아 파스토리스 CIT1 전사 종결 서열 (서열 85)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된, 피키아 파스토리스에서의 효과적인 발현에 대해 코돈-최적화된 경쇄 ORF를 코딩하는 핵산 분자 (서열 17)를 포함한다. 형질전환체를 선택하기 위해, 이러한 플라스미드는 제오신 ORF를 코딩하는 핵산 분자 (서열 35)가 사카로미세스 세레비지아에 TEF 프로모터 서열 (서열 37)을 갖는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열 (서열 24)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결되어 있는, 제오신 ORF를 코딩하는 발현 카세트를 포함한다. 이러한 플라스미드는 TRP2 유전자좌 (서열 91)를 표적화하는 핵산 분자를 추가로 포함한다.

플라스미드 pGLY6564 (도 17)은 피키아 파스토리스 내의 TRP2 유전자좌를 표적으로 하는, 항-RSV 항체의 경쇄 및 중쇄를 코딩하는 롤-인 통합 벡터이다. 항-RSV 중쇄를 코딩하는 발현 카세트는 사카로미세스 세레비지아에 메이팅 인자 전-신호 서열 (서열 14)을 코딩하는 핵산 분자 (차례로 이의 N-말단에서 유도성 피키아 파스토리스 AOX1 프로모터 서열 (서열 23)을 갖는 핵산 분자에 융합됨)에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열 (서열 24)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된, 피키아 파스토리스에서의 효과적인 발현에 대해 코돈-최적화된 중쇄 ORF를 코딩하는 핵산 분자 (서열 19)를 포함한다. 항-RSV 경쇄를 코딩하는 발현 카세트는 사카로미세스 세레비지아에 메이팅 인자 전-신호 서열 (서열 14)을 코딩하는 핵산 분자 (차례로 이의 N-말단에서 유도성 피키아 파스토리스 AOX1 프로모터 서열 (서열 23)을 갖는 핵산 분자에 융합됨)에 5' 끝부분에서, 피키아 파스토리스 AOX1 전사 종결 서열 (서열 36)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된, 피키아 파스토리스에서의 효과적인 발현에 대해 코돈-최적화된 경쇄 ORF를 코딩하는 핵산 분자 (서열 21)를 포함한다. 형질전환체를 선택하기 위해, 이러한 플라스미드는 제오신 ORF를 코딩하는 핵산 분자 (서열 35)가 사카로미세스 세레비지아에 TEF 프로모터 서열 (서열 37)을 갖는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열 (서열 24)을 갖는 핵산 분자에 3' 끝부분에서 작동가능하게 연결되어 있는, 제오신 ORF를 코딩하는 발현 카세트를 포함한다. 이러한 플라스미드는 TRP2 유전자좌 (서열 91)를 표적화하는 핵산 분자를 추가로 포함한다.

항-Her2 항체를 코딩하는 pGLY6833을 YGLY8316 내로 형질전환시킴으로써 균주 YGLY13992를 생성시켰다. 생산된 균주들로부터 균주 YGLY13992를 선택하였다. 이러한 균주에서, 항-Her2 중쇄 및 경쇄를 코딩하는 발현 카세트가 피키아 파스토리스 TRP2 유전자좌 (PpTRP2)를 표적으로 한다. 이러한 균주는 LmSTT3D 발현 카세트를 포함하지 않는다. 항-RSV 항체를 코딩하는 pGLY6564를 YGLY8323 내로 형질전환시킴으로써 균주 YGLY14401을 생성시켰다. 생산된 균주들로부터 균주 YGLY14401을 선택하였다. 이러한 균주에서, 항-RSV 중쇄 및 경쇄를 코딩하는 발현 카세트가 피키아 파스토리스 TRP2 유전자좌 (PpTRP2)를 표적으로 한다. 이러한 균주는 LmSTT3D 발현 카세트를 포함하지 않는다.

본원에 개시된 적합한 균주의 상기 LmSTT3D 발현/통합 플라스미드 벡터로의 형질전환을 본질적으로 하기와 같이 수행하였다. 적합한 피키아 파스토리스 균주를 50 ㎖ YPD 배지 (효모 추출물 (1％), 펩톤 (2％), 및 덱스트로스 (2％))에서 밤새 약 0.2 내지 6의 OD로 성장시켰다. 얼음 상에서 30분 동안 인큐베이션한 후, 세포를 2500-3000 rpm에서 5분 동안의 원심분리에 의해 펠릿화시켰다. 배지를 제거하고, 세포를 멸균 빙냉 1 M 소르비톨로 3회 세척한 후, 0.5 ㎖의 멸균 빙냉 1 M 소르비톨에 재현탁시켰다. 10 ㎕의 선형화된 DNA (5-20 ㎍) 및 100 ㎕ 세포 현탁액을 전기천공 큐벳에서 합치고, 5분 동안 얼음 상에서 인큐베이션하였다. 바이오-래드의 진펄서 엑스셀(GenePulser Xcell)에서 미리 설정된 피키아 파스토리스 프로토콜 (2 kV, 25 μF, 200 Ω)에 따라 전기천공을 수행하고, 바로 이어서 1 ㎖ YPDS 회수 배지 (YPD 배지 + 1 M 소르비톨)를 첨가하였다. 형질전환된 세포를 실온 (24℃)에서 4시간 내지 밤새 회복시킨 후, 세포를 선택 배지 상에 플레이팅하였다.

그 후, 균주 YGLY13992 및 YGLY14401 각각을 상기 기술된 바와 같은 유도성 AOX1 프로모터의 제어 하에 LmSTT3D를 코딩하는 pGLY6301 또는 구성적 GAPDH 프로모터의 제어 하에 LmSTT3D를 코딩하는 pGLY6294로 형질전환시켜, 실시예 3에 기술된 균주들을 생산하였다.

실시예 3

통합/발현 플라스미드 pGLY6301 (LmSTT3D를 코딩하는 ORF가 유도성 PpAOX1 프로모터에 작동가능하게 연결되어 있는 발현 카세트를 포함함), 또는 pGLY6294 (LmSTT3D를 코딩하는 ORF가 구성적 PpGAPDH 프로모터에 작동가능하게 연결되어 있는 발현 카세트를 포함함)를 각각 SpeI 또는 SfiI로 선형화시키고, 선형화된 플라스미드를 피키아 파스토리스 균주 YGLY13992 또는 YGLY14401 내로 형질전환시켜, 표 1에 제시된 균주 YGLY17351, YGLY17368, YGLY17319, 및 YGLY17354를 생산하였다. 본질적으로 실시예 2에 기술된 바와 같이 형질전환을 수행하였다.

URA6 유전자좌에서의 pGLY6301의 게놈 통합을 프라이머 PpURA6out/UP (5'-CTGAGGAGTCAGATATCAGCTCAATCTCCAT-3'; 서열 1) 및 Puc19/LP (5'- TCCGGCTCGTATGTTGTGTGGAATTGT-3'; 서열 2) 또는 ScARR3/UP (5'- GGCAATAGTCGCGAGAATCCTTAAACCAT-3'; 서열 3) 및 PpURA6out/LP (5- CTGGATGTTTGATGGGTTCAGTTTCAGCTGGA-3'; 서열 4)를 사용하여 콜로니 PCR (cPCR)에 의해 확인하였다.

TRP1 유전자좌에서의 pGLY6294의 게놈 통합을 프라이머 PpTRP-5'out/UP (5'- CCTCGTAAAGATCTGCGGTTTGCAAAGT-3'; 서열 5) 및 PpALG3TT/LP (5'-CCTCCCACTGGAACCGATGATATGGAA-3'; 서열 6) 또는 PpTEFTT/UP (5'-GATGCGAAGTTAAGTGCGCAGAAAGTAATATCA-3'; 서열 7) 및 PpTRP1-3'out/LP (5'-CGTGTGTACCTTGAAACGTCAATGATACTTTGA-3'; 서열 8)를 사용하여 cPCR에 의해 확인하였다. LmSTT3D를 코딩하는 발현 카세트의 게놈 내로의 통합을 cPCR 프라이머 LmSTT3D/iUP (5'-GCGACTGGTTCCAATTGACAAGCTT-3' (서열 9) 및 LmSTT3D/iLP (5'- CAACAGTAGAACCAGAAGCCTCGTAAGTACAG-3' (서열 10)를 사용하여 확인하였다. PCR 조건은 95℃에서 2분의 사이클 1회, 95℃에서 20초, 55℃에서 20초 및 72℃에서 1분의 사이클 35회, 이어서 72℃에서 10분의 사이클 1회였다.

균주들을 식스포스(SixFors) 발효기에서 배양하여, N-글리코실화 부위 점유 분석을 위한 항체를 생산하였다. 항체 생산을 위한 형질전환된 균주의 세포 성장 조건은 일반적으로 하기와 같았다.

형질전환된 효모 균주의 단백질 발현을 1％ 효모 추출물, 2％ 펩톤, 100 mM 인산칼륨 완충제 (pH 6.0), 1.34％ 효모 질소 베이스, 4×10^-5％ 비오틴 및 1％ 글리세롤로 이루어진 완충된 글리세롤-복합 배지 (BMGY)를 사용하여 24℃에서 진탕 플라스크에서 수행하였다. 단백질 발현을 위한 유도 배지는 BMGY 내의 글리세롤 대신 1％ 메탄올로 구성된 완충된 메탄올-복합 배지 (BMMY)였다. 유도 배지를 첨가한 시점에 메탄올 내의 Pmt 억제제 Pmti-3를 성장 배지에 18.3 μM의 최종 농도로 첨가하였다. 세포를 수확하고, 2,000 rpm에서 5분 동안 원심분리하였다.

식스포스 발효기 스크리닝 프로토콜은 표 2에 제시된 파라미터를 따랐다.

접종 후 약 18시간의 시점에, 350 ㎖의 배지 A (하기 표 3 참조) + 4％ 글리세롤을 함유하는 식스포스 용기에 관심 균주를 접종하였다. 소량 (0.3 ㎖의 100％ 메탄올 내의 0.2 ㎎/㎖)의 Pmti-3 (5-[[3-(1-페닐-2-히드록시)에톡시)-4-(2-페닐엑톡시)]페닐]메틸렌]-4-옥소-2-티옥소-3-티아졸리딘아세트산) (국제 출원 공개 번호 WO 2007061631 참조)을 접종물과 함께 첨가하였다. 약 20시간의 시점에, 17 ㎖ 50％ 글리세롤 용액 (글리세롤 유가식(Fed-Batch) 공급물, 하기 표 4 참조) + 더 많은 용량 (0.3 ㎖의 4 ㎎/㎖)의 Pmti-3의 볼루스를 용기마다 첨가하였다. 약 26시간의 시점에, 용존 산소 (DO) 농도에서의 양성 스파이크에 의해 지시되는 바와 같이 글리세롤이 소비되었을 때, 메탄올 공급물 (하기 표 5 참조)을 0.7 ㎖/hr로 지속적으로 시작하였다. 동시에, 또 다른 용량의 Pmti-3 (0.3 ㎖의 4 ㎎/㎖ 스톡(stock))을 용기마다 첨가하였다. 약 48시간의 시점에, 또 다른 용량 (0.3 ㎖의 4 ㎎/㎖)의 Pmti-3을 용기마다 첨가하였다. 접종 후 약 60시간의 시점에 배양물을 수확하고 프로세싱하였다.

항-Her2 또는 항-RSV 항체 상의 N-글리칸의 점유를 하기와 같이 모세관 전기영동 (CE)을 사용하여 결정하였다. 세포 배양 배지로부터 항체를 회수하고, 단백질 A 칼럼 크로마토그래피에 의해 정제하였다. 단백질 A로 정제된 샘플 (100-200 ㎍)을 약 100 ㎕로 농축한 후, 완충제를 100 mM 트리스(Tris)-HCl pH 9.0 + 1％ SDS로 교체하였다. 그 후, 베크만(Beckman)이 제공한 10 kDa 내부 표준물 2 ㎕와 함께 샘플을 5 ㎕ β-메르캅토에탄올 첨가에 의해 환원시키고, 5분 동안 비등시켰다. 그 후, 약 20 ㎕의 환원된 샘플을 베크만 쿨터(Beckman Coulter)가 권장하는 방법에 따라 베어-퓨즈드(bare-fused) 실리카 모세관 (약 70 ㎜, 50 ㎛ I.D.) 상에서 분석하였다.

도 18은 CE 분석으로부터의 중쇄의 N-글리코실화 부위 점유를 나타낸다. 이러한 도면은 두 항체 모두에 대해, N-연결 중쇄 종의 양이 약 80％에서 LmSTT3D가 구성적으로 발현되었을 때는 약 94％로, 항체 발현 유도와 동시에 LmSTT3D의 발현이 유도되었을 때는 약 99％로 증가하였음을 나타낸다.

표 7은 내인성 올리고사카릴트랜스퍼라제 (OST) 복합체의 존재 하에 LmSTT3D가 과다발현된 숙주 세포로부터 항체가 수득된 조성물에 대해 항-HER2 및 항-RSV 항체의 N-글리코실화 부위 점유가 증가되었음을 나타낸다. N-글리코실화 부위 점유를 결정하기 위해, 항체들을 환원시키고, 중쇄의 N-글리칸 점유를 결정하였다. 이러한 표는 일반적으로, 유도성 프로모터의 제어 하의 LmSTT3D의 과다발현이 시험된 두 항체 모두에 대해 약 82-83％에서 약 99％로 N-글리코실화 부위 점유 증가를 일으켰음을 나타낸다 (LmSTT3D 과다발현의 부재 하에서의 N-글리코실화 부위 점유에 비해 약 19％ 증가). LmSTT3D 및 항체의 발현은 동일한 유도성 프로모터의 제어 하에 있었다. LmSTT3D의 과다발현이 구성적 프로모터의 제어 하에 있었을 때, N-글리코실화 부위 점유가 시험된 두 항체 모두에 대해 약 94％로 증가되었다 (LmSTT3D 과다발현의 부재 하에서의 N-글리코실화 부위 점유에 비해 약 13％ 증가).

표 8은 환원된 항체 제제로부터의 개별적인 중쇄들의 N-글리코실화 부위 점유의 결정을 기초로 하는 내인성 올리고사카릴트랜스퍼라제 (OST) 복합체의 존재 하에 LmSTT3D가 과다발현된 숙주 세포로부터 수득된 전체 항체를 포함하는 조성물에 대한 N-글리코실화 부위 점유를 나타낸다. 식 (GHC 분획)² × 100은 N-글리코실화된 중쇄 분획의 결정을 기초로 하는 완전히 점유된 항체 ％의 추정값 또는 근삿값을 제공할 것이다.

Q-TOF 분석

사용된 고성능 액체 크로마토그래피 (HPLC) 시스템은 자동주입기가 장착된 애질런트(Agilent) 1200, 칼럼-가열 구획 및 210 및 280 nm에서 검출하는 UV 검출기로 이루어졌다. 이러한 시스템으로 수행된 모든 LC-MS 실험은 1 ㎖/분으로 러닝(running)되었다. MS 검출을 위해 유속이 분할되지 않았다. 질량 분광측정 분석을 양이온 방식으로 애큐러트-매스(Accurate-Mass) Q-TOF LC/MS 6520 (애질런트 테크놀러지(Agilent technology)) 상에서 수행하였다. 이중 ESI 소스의 온도를 350℃로 설정하였다. 질소 기체 유속은 콘(cone)에 대한 13 ℓ/h 및 350 ℓ/h로 설정하였고, 분무기는 45 psig로 설정하였으며, 이때 4500 볼트가 모세관에 적용되었다. 질량 검정 및 단백질 질량 측정치에 대해 API-TOF 기준 질량 용액 키트에 따라 HP-0921로부터 922.009의 기준 질량이 제조되었다. 300-3000 m/z의 이온 스펙트럼 범위에 대한 데이터를 취득하였고, 애질런트의 매스헌터(Masshunter)를 사용하여 프로세싱하였다.

샘플 제조는 하기와 같았다. 무손상 항체 샘플 (50 ㎍)을 50 ㎕의 25 mM NH₄HCO₃, pH 7.8에서 제조하였다. 탈글리코실화 항체에 대해, 무손상 항체 샘플의 50 ㎕ 분취량을 PNGase F (10 유닛)로 18시간 동안 37℃에서 처리하였다. 1 M DTT를 10 mM의 최종 농도로 무손상 항체 또는 탈글리코실화 항체의 분취량에 첨가함으로써 환원된 항체를 제조하고, 30분 동안 37℃에서 인큐베이션하였다.

3 ㎍의 무손상 또는 탈글리코실화 항체 샘플을 70℃에서 유지된 포로쉘(Poroshell) 300SB-C3 칼럼 (2.1 ㎜ × 75 ㎜, 5 ㎛) (애질런트 테크놀러지즈(Agilent Technologies)) 상에 로딩하였다. 먼저 단백질을 카트리지 상에서 1분 동안 90％ 용매 A (0.1％ HCOOH), 5％ 용매 B (0.1％ HCOOH 내의 90％ 아세토니트릴)로 헹궜다. 그 후, 26분에 걸친 5-100％의 B의 구배에 이어지는 100％ B에서의 3분 재생 및 5％ B에서의 10분의 최종 평형 기간을 사용하여 용리를 수행하였다.

환원된 항체에 대해, 3 ㎍ 샘플을 40℃에서 유지된 포로쉘 300SB-C3 칼럼 (2.1 mm × 75 ㎜, 5 ㎛) (애질런트 테크놀러지즈) 상에 로딩하였다. 먼저 단백질을 카트리지 상에서 3분 동안 90％ 용매 A, 5％ 용매 B로 헹궜다. 그 후, 20분에 걸친 5-80％의 B의 구배에 이어지는 80％ B에서의 7분 재생 및 5％ B에서의 10분의 최종 평형 기간을 사용하여 용리를 수행하였다.

도 19는 YGLY17351에서 생산된 환원되지 않은 항-Her2 항체의 N-글리코실화 부위 점유가 CHO 세포에서 생산된 환원되지 않은 시판 항-Her2 항체 (헤르셉틴)의 N-글리코실화 부위 점유에 비교된 Q-TOF 분석 결과를 나타낸다. 이러한 도면은 YGLY17351에서 생산된 항-Her2 항체의 N-글리코실화 부위 점유가 CHO 세포에서 제조된 항-Her2 항체의 N-글리코실화 부위 점유와 비슷하다는 것을 나타낸다. 이러한 도면은 항체가 균주 YGLY17351에 의해 생산되었을 때, 1개의 N-글리코실화 부위만 점유된 항체의 양이 감소하였고, 두 N-글리코실화 부위 모두가 점유된 항체의 양이 증가하였음을 나타낸다. YGLY17351에서 생산된 항-Her2 항체에 대해 제시된 결과는 표 8에서 제시된 점유 근사값과 일치하였다.

도 20은 YGLY17351에서 생산된 항-Her2 항체의 N-글리코실화 부위 점유의 확장성을 나타낸다. N-글리칸 점유의 확장성을 평가하기 위해, 5 ㎖ 내지 40 ℓ 범위의 생물반응기에서 YGLY17351을 시험하였다. 일반적으로, 당-조작 피키아 파스토리스에서의 당단백질의 N-글리코실화 부위 점유는 당단백질을 생산하는데 사용된 공정 조건에 따라 변하는 것으로 관찰되었다. 그러나, LmSTT3D 과다발현 균주는 생물반응기의 규모 및 공정 조건과 관계없이 매우 일관적인 N-글리코실화 부위 점유 (99％)를 나타냈다. 따라서, 본 발명은 소규모 조건 하에 성장된 당-조작 피키아 파스토리스에서의 당단백질의 N-글리코실화 부위 점유가 대규모 조건 하에서 성장될 때 유지되는 방법을 제공한다.

도 21 및 22는 설명적인 목적을 위해 제공된다. 도 21은 CHO 세포에서 생산된 시판 항-Her2 항체 로트 (헤르셉틴)에 대한 CE 및 Q-TOF 분석 결과를 나타낸다. 도 22는 일정 기간 동안 PNGase F로 처리된 후의 동일한 시판 항-Her2 항체 로트에 대한 CE 및 Q-TOF 분석 결과를 나타낸다. PNGase F 처리 후, CE는 비-글리코실화 중쇄의 증가를 나타내고, Q-TOF는 비-글리코실화 항체의 존재를 나타낸다 (도 21 대 도 22 비교).

표 9는 LmSTT3D를 과다발현하지 않는 균주에 비교된 LmSTT3D를 과다발현하는 균주에서 생산된 항-Her2 및 항-RSV 항체의 N-글리칸 조성을 나타낸다. 이러한 도면에서 LmSTT3D 과다발현 균주로부터의 항체의 N-글리칸의 품질이 LmSTT3D를 과다발현하지 않는 균주로부터의 것에 필적한다는 것이 확인된다. 식스포스 (0.5 ℓ 생물반응기)로부터 항체를 생산하였고, 단백질 A로 정제된 항체로부터의 N-글리칸을 2AB 표지로 분석하였다. 전반적으로, LmSTT3D의 과다발현이 항체의 N-글리칸 조성에 유의하게 영향을 미치지 않는 것으로 보였다. 글리코실화 조성은 발효 조건의 함수로서 변할 수 있고, 따라서, 피키아 파스토리스 균주에서 생산된 항체의 글리코실화 조성은 약 50-70 몰％ G0, 15-25 몰％ G1, 4-12％ 몰％ G2, 5-17 몰％ Man5, 및 3-15 몰％ 하이브리드 범위일 수 있다.

표 10은 CHO 세포에서 생산되고 상표명 시나지스(SYNAGIS) 하에 팔리비주맙(palivizumab)으로 판매되는 여러 시판 항-RSV 항체 로트에 비교된 균주 YGLY14401에서 생산된 항-RSV 항체의 글리코실화 패턴의 비교를 나타낸다.

이러한 실시예는 본 발명이 포유동물 발현 시스템 예컨대 CHO 세포에서 생산된 재조합 당단백질의 N-글리코실화 부위 점유에 필적하는 재조합 당단백질의 N-글리코실화 부위 점유를 갖는 피키아 파스토리스에서의 재조합 당단백질 생산을 가능하게 한다는 것을 나타낸다.

실시예 4

리슈마니아 메이저 STT3A 단백질, 리슈마니아 메이저 STT3B 단백질, 및 리슈마니아 메이저 STT3D 단백질은 모두 사카로미세스 세레비지아에에서 STT3 유전자좌의 결실의 치사성 표현형을 억제하는 것으로 나타난 이종성 단일-서브유닛 올리고사카릴트랜스퍼라제의 예이다 (문헌 [Naseb et al., Molec. Biol. Cell 19: 3758-3768 (2008)]). 나셉 등 (동일 문헌)은 리슈마니아 메이저 STT3D 단백질이 사카로미세스 세레비지아에에서 WBP1, OST1, SWP1 또는 OST2 유전자좌의 돌연변이의 치사성 표현형을 억제할 수 있음을 추가로 나타냈다. 문헌 [Hese et al., Glycobiology 19: 160-171 (2009)]는 리슈마니아 메이저 STT3A, STT3B, 및 STT3D 단백질이 WBP1, OST1, SWP1 및 OST2 유전자좌의 돌연변이를 기능적으로 보관할 수 있음을 시사하는 데이터를 제공한다. 기타 단일-서브유닛 이종성 올리고사카릴트랜스퍼라제에는 단일-서브유닛 지아디아 또는 키네토플라스티드 STT3 단백질, 예를 들어, 카에노랍디티스 엘레간스 STT3 단백질, 트리파노소마 브루세이 STT3 단백질, 트리파노소마 크루지 STT3 단백질, 및 톡소플라스마 곤디이 STT3 단백질이 포함되지만, 이에 한정되지는 않는다. 나셉 등이 사카로미세스 세레비지아에 OTase 복합체 내로 혼입되지 않는다고 교시한 리슈마니아 메이저 STT3D 단백질과 대조적으로, 문헌 [Castro et al., Proc. Natl. Acad. Sci. USA 103: 14756-14760 (2006)]에서 트리파노소마 크루지 STT3은 사카로미세스 세레비지아에 OTase 복합체 내로 통합되는 것으로 보인다고 교시되었다.

이러한 실시예에서, 이전의 실시예에서의 숙주 세포와 유사하게 구축된 숙주 세포를 AOX1 프로모터에 작동가능하게 연결된 카에노랍디티스 엘레간스, 트리파노소마 크루지, 및 리슈마니아 메이저 STT3C으로부터의 STT3 단백질을 코딩하는 발현 카세트를 함유하는 플라스미드 벡터로 형질전환시켰다. 피키아 파스토리스 Stt3p을 코딩하는 발현 카세트를 함유하는 벡터가 실험에 포함되었다. 표 11에 제시된 바와 같이, 항-Her2 항체의 발현과 동시에 다양한 STT3 단백질이 발현되는 것이 N-글리코실화 부위 점유에서의 증가를 초래하는 것으로 보이지 않았다. 그러나, 다양한 STT3 단백질이 기질 특이성을 나타낼 수 있다. 예를 들어, 리슈마니아 메이저 STT3A, B, C, 및 D 단백질은 글리코실화 수준에서 기질 특이성 면에서 상이하고, 이는 필수적인 N-X-S/T 부착 부위에 더하여 추가적인 기질 특색이 특정 부착 부위에서의 N-연결 글리코실화에 영향을 미칠 수 있음을 시사한다 ([Naseb et al., 상기 문헌]). 표 9에 제시된 결과는 항-Her2 항체를 기질로 사용하였다. 항체의 각각의 중쇄의 C_H2 도메인이 N-연결 글리코실화를 위한 단일 부위를 함유한다: 이는 일반적으로 아스파라긴 잔기 297 (Asn-297)에 있다 (문헌 [Kabat et al., Sequences of proteins of immunological interest, Fifth Ed., U.S. Department of Health and Human Services, NIH Publication No. 91-3242]). 따라서, 표 9에 제시된 결과는 N-글리코실화 부위 점유 ％가 사용되는 특정 단일-서브유닛 올리고사카릴트랜스퍼라제의 기질 특이성에 영향을 받을 수 있음을 시사한다.

실시예 5

시알릴화 N-글리칸을 생산할 수 있는 균주를 하기와 같이 구축하였다. 균주를 인간 GM-CSF를 코딩하는 플라스미드 벡터 및 리슈마니아 메이저 STT3D를 코딩하는 플라스미드 벡터로 형질감염시켰다. 균주 구축이 도 23a-23d에서 개략적으로 도해된다. 간략하게, 하기와 같이 균주를 구축하였다.

플라스미드 pGLY2456 (도 24)은 TRP2 유전자좌를 이러한 유전자좌의 발현을 파괴하지 않으면서 표적으로 하고, (1) 마우스 CMP-시알산 수송체 (mCMP-Sia 수송체), (2) 인간 UDP-GlcNAc 2-에피머라제/N-아세틸만노사민 키나제 (hGNE), (3) 피키아 파스토리스 ARG1 유전자 또는 전사 단위, (4) 인간 CMP-시알산 신타제 (hCMP-NANA), (5) 인간 N-아세틸뉴라미네이트-9-포스페이트 신타제 (hSPS), (6) N-말단에서 키메라 효소를 ER 또는 골지에 표적화하기 위한 사카로미세스 세레비지아에 KRE2 리더 펩티드 (33)에 융합된 마우스 α-2,6-시알릴트랜스퍼라제 촉매 도메인 (mST6), 및 피키아 파스토리스 ARG1 유전자 또는 전사 단위를 코딩하는 6개의 발현 카세트를 함유하는 KINKO 통합 벡터이다. 마우스 CMP-시알산 수송체를 코딩하는 발현 카세트는 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 mCMP Sia 수송체 ORF 코돈을 코딩하는 핵산 분자 (서열 92)를 포함하고, 이는 피키아 파스토리스 PMA1 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 피키아 파스토리스 PMA1 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. 인간 UDP-GlcNAc 2-에피머라제/N-아세틸만노사민 키나제를 코딩하는 발현 카세트는 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 hGNE ORF를 코딩하는 핵산 분자 (서열 93)를 포함하고, 이는 피키아 파스토리스 GAPDH 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. 피키아 파스토리스 ARG1 유전자를 코딩하는 발현 카세트는 (서열 94)을 포함한다. 인간 CMP-시알산 신타제를 코딩하는 발현 카세트는 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 hCSS ORF를 코딩하는 핵산 분자 (서열 95)를 포함하고, 이는 피키아 파스토리스 GAPDH 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. 인간 N-아세틸뉴라미네이트-9-포스페이트 신타제를 코딩하는 발현 카세트는 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 hSIAP S ORF를 코딩하는 핵산 분자 (서열 96)를 포함하고, 이는 피키아 파스토리스 PMA1 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 피키아 파스토리스 PMA1 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. 키메라 마우스 α-2,6-시알릴트랜스퍼라제를 코딩하는 발현 카세트는 5' 끝부분에서 사카로미세스 세레비지아에 KRE2 신호 펩티드를 코딩하는 핵산 분자에 융합된, 피키아 파스토리스에서의 발현에 대해 코돈-최적화된 mST6 촉매 도메인을 코딩하는 핵산 분자 (서열 97)를 포함하고, 이는 피키아 파스토리스 TEF 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 피키아 파스토리스 TEF 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. 일렬의 6개의 카세트에 정지 코돈에서 종결되는 Trp2p 유전자의 5' 영역 및 ORF로부터의 뉴클레오티드 서열 (서열 98)에 이어지는 피키아 파스토리스 ALG3 종결 서열을 포함하는 핵산 분자가 한쪽 측면에, TRP2 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 99)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. 플라스미드 pGLY2456을 SfiI로 선형화시키고, 선형화된 플라스미드를 균주 YGLY7961 내로 형질전환시켜, 6개의 발현 카세트가 이중-교차 상동 재조합에 의해 TRP2 ORF에 바로 이어져서 TRP2 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY8146을 선택하였다. 그 후, 균주를 5-FOA의 존재 하에 역선별하여, 이제 우리딘에 대해 영양요구성인 다수의 균주를 생산하였다. 균주 YGLY9296을 선택하였다.

플라스미드 pGLY5048 (도 25)은 STE13 유전자좌를 표적으로 하고, (1) N-말단에서 키메라 단백질을 분비 경로 및 세포로부터의 분비에 표적화하기 위한 사카로미세스 세레비지아에 αMATpre 신호 펩티드에 융합된 트리코더마 레에세이 α-1,2-만노시다제 촉매 도메인 (aMATTrMan) 및 (2) 피키아 파스토리스 URA5 유전자 또는 전사 단위를 코딩하는 발현 카세트들을 함유하는 통합 벡터이다. aMATTrMan을 코딩하는 발현 카세트는 5' 끝부분에서 사카로미세스 세레비지아에 αMATpre 신호 펩티드를 코딩하는 핵산 분자 (서열 13)에 융합된, 트리코더마 레에세이 촉매 도메인을 코딩하는 핵산 분자 (서열 83)를 포함하고, 이는 피키아 파스토리스 AOX1 프로모터를 포함하는 핵산 분자에 5' 끝부분에서, 사카로미세스 세레비지아에 CYC 전사 종결 서열을 포함하는 핵산 분자에 3' 끝부분에서 작동가능하게 연결된다. URA5 발현 카세트는 lacZ 반복물을 포함하는 핵산 분자들이 플랭킹된 피키아 파스토리스 URA5 유전자 또는 전사 단위를 포함하는 핵산 분자를 포함한다. 일렬의 2개의 카세트에 STE13 유전자의 5' 영역으로부터의 뉴클레오티드 서열 (서열 100)을 포함하는 핵산 분자가 한쪽 측면에, STE13 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 101)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. 플라스미드 pGLY5048을 SfiI로 선형화시키고, 선형화된 플라스미드를 균주 YGLY9296 내로 형질전환시켜 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY9469를 선택하였다. 이러한 균주는 단일-만노스 O-글리코실화를 갖는 당단백질을 생산할 수 있다 (미국 출원 공개 번호 20090170159 참조).

플라스미드 pGLY5019 (도 26)는 DAP2 유전자좌를 표적으로 하고, 노르세오트리신 저항성 (NATR) 발현 카세트 (EROSCARF로부터의 pAG25로부터 유래됨, 사이언티픽 리서치 앤드 디벨롭먼트 게엠베하 (독일 D-61352 바트 홈부르크 다임러스트라쎄 13a), 문헌 [Goldstein et al., Yeast 15: 1541 (1999)] 참조)를 코딩하는 핵산 분자를 포함하는 발현 카세트를 함유하는 통합 벡터이다. NAT^R 발현 카세트 (서열 34)가 아시비아 고시피이 TEF1 프로모터 및 아시비아 고시피이 TEF1 종결 서열에 작동가능하게 연결되고, 여기에 피키아 파스토리스 DAP2 유전자의 5' 뉴클레오티드 서열 (서열 102)이 한쪽 측면에, 피키아 파스토리스 DAP2 유전자의 3' 뉴클레오티드 서열 (서열 103)이 다른 쪽 측면에 플랭킹된다. 플라스미드 pGLY5019를 선형화시키고, 선형화된 플라스미드를 균주 YGLY9469 내로 형질전환시켜, NATR 발현 카세트가 이중-교차 상동 재조합에 의해 DAP2 유전자좌 내로 삽입된 다수의 균주를 생산하였다. 생산된 균주들로부터 균주 YGLY9797을 선택하였다.

플라스미드 pGLY5085 (도 27)은 시알릴화 N-글리칸을 생산하는데 수반되는 제2 유전자 세트를 피키아 파스토리스 내로 도입하기 위한 KINKO 플라스미드이다. 피키아 파스토리스 ARG1 유전자가 히그로마이신 저항성을 코딩하는 발현 카세트 (HygR)로 교체되었고 플라스미드가 피키아 파스토리스 TRP5 유전자좌를 표적으로 한다는 것을 제외하고는, 이러한 플라스미드는 플라스미드 YGLY2456과 유사하다. HYG^R 저항성 카세트는 서열 104이다. HYG^R 발현 카세트 (서열 104)가 아시비아 고시피이 TEF1 프로모터 및 아시비아 고시피이 TEF1 종결 서열에 작동가능하게 연결된다 (문헌 [Goldstein et al., Yeast 15: 1541 (1999)] 참조). 일렬의 6개의 카세트에 정지 코돈에서 끝나는 TRP5 유전자의 5' 영역 및 ORF로부터의 뉴클레오티드 서열 (서열 105)에 이어지는 피키아 파스토리스 ALG3 종결 서열을 포함하는 핵산 분자가 한쪽 측면에, TRP5 유전자의 3' 영역으로부터의 뉴클레오티드 서열 (서열 106)을 포함하는 핵산 분자가 다른 쪽 측면에 플랭킹된다. 플라스미드 pGLY5085를 균주 YGLY9797 내로 형질전환시켜 다수의 균주를 생산하였고, 이로부터 균주 YGLY1200을 선택하였다.

피키아 파스토리스 TRP2 유전자좌 (PpTRP2)를 표적으로 하는 플라스미드 pGLY7240 (도 28)은 Kex2 절단 부위를 함유하는 링커를 통해 피키아 파스토리스 CWP1 단백질에 융합된 인간 GM-CSF를 포함하는 융합 단백질을 코딩한다. CWP1 단백질이 후기 골지에서 Kex2 엔도프로테아제(endoprotease)에 의해 GM-CSF로부터 제거되어, 유리 GM-CSF가 발효 상청액 내로 분비된다. 인간 GM-CSF의 아미노산 서열이 서열 108에서 제시되고, 이는 서열 108에 제시된 뉴클레오티드 서열에 의해 코딩된다. 융합 단백질 (서열 109)은 서열 110에 제시된 뉴클레오티드 서열에 의해 코딩된다. CWP1 신호 서열은 아미노산 1-18이고, CWP1 아미노산 서열은 아미노산 19-289이며, GGGSLVKR Kex2 링커 아미노산 서열 (서열 111)은 아미노산 290-297이고, GM-CSF 아미노산 서열은 아미노산 298-424이다. 융합 단백질의 발현이 Pp AOX1 프로모터 및 ScCYC 종결 서열에 작동가능하게 연결된다. 플라스미드 pGLY7240을 균주 YGLY12900 내로 형질전환시켜 다수의 균주를 생산하였고, 이로부터 균주 YGLY15660을 선택하였다. 균주 YGLY15660을 플라스미드 pGLY6301 (리슈마니아 메이저 STT3D를 코딩함)로 형질전환시켜 다수의 균주를 생산하였고, 이로부터 YGLY16349를 선택하였다.

도 29는 LmSTT3D가 비-항체 당단백질인 GM-CSF의 N-글리칸 점유를 또한 개선시켰음을 나타낸다. GM-CSF는 2개의 N-연결 부위를 함유하고, 야생형 피키아에서는 GM-CSF 상의 1개의 N-연결 부위가 우세하게 글리코실화된다. GM-CSF의 N-글리칸 점유에 대한 LmSTT3D의 영향을 연구하기 위해, 메탄올-유도성 LmSTT3D를 GM-CSF 생산 균주인 yGLY15560에서 과다발현시켰다. 마이크로24(Micro24) 생물반응기 (M24)를 사용하여 N-글리칸 점유를 평가하였다. M24로부터의 무세포 상청액을 웨스턴 블롯 및 15％ SDS-PAGE를 사용하여 N-글리칸 점유에 대해 분석하였다. GM-CSF 특이적 항체로 검출된 웨스턴 블롯에 나타난 바와 같이, GM-CSF가 1개의 부위로 우세하게 N-글리코실화되고 소수의 부분이 2개의 N 부위 및 비-글리코실화인 대조군 균주 (yGLY15560, 레인 9)와 대조적으로, 대다수의 GM-CSF (레인 2-8)가 2N-연결 부위로 글리코실화된다. 총괄적으로, 이는 LmSTT3D가 다중 N-연결 부위를 보유하는 당단백질의 N-글리칸 점유를 개선시킬 수 있음을 가리킨다.

도 30은 각각 yGLY15560 (a) 및 yGLY16349 (b)로부터 발현된 GM-CSF의 Q-TOP 분석을 나타낸다. 이러한 분석에서 도 29에서 제시된 바와 같이 LmSTT3D의 존재 하에 대다수의 GM-CSF가 2N-연결 부위로 글리코실화된다는 것이 확인된다. 비-글리코실화 GM-CSF가 검출되지 않았다.

LC-ESI-TOF

이러한 연구에서 사용된 고성능 액체 크로마토그래피 (HPLC) 시스템은 자동주입기가 장착된 애질런트 1200, 칼럼-가열 구획 및 210 및 280 nm에서 검출하는 UV 검출기로 구성되었다. 이러한 시스템으로 수행된 모든 LC-MS 실험은 1 ㎖/분으로 러닝되었다. MS 검출을 위해 유속이 분할되지 않았다. 질량 분광측정 분석을 양이온 방식으로 애큐러트-매스 Q-TOF LC/MS 6520 (애질런트 테크놀러지) 상에서 수행하였다. 이중 ESI 소스의 온도를 350℃로 설정하였다. 질소 기체 유속은 콘에 대한 13 ℓ/h 및 350 ℓ/h로 설정하였고, 분무기는 45 psig로 설정하였으며, 이때 4500 볼트가 모세관에 적용되었다. 질량 검정 및 단백질 질량 측정치에 대해 API-TOF 기준 질량 용액 키트에 따라 HP-0921로부터 922.009의 기준 질량이 제조되었다. 300-3000 m/z의 이온 스펙트럼 범위에 대한 데이터를 취득하였고, 애질런트의 매스헌터를 사용하여 프로세싱하였다.

샘플 제조

무손상 항체 샘플 (50 ㎍)을 50 ㎕의 25 mM NH₄HCO₃, pH 7.8에서 제조하였다. 탈글리코실화 항체에 대해, 무손상 항체 샘플의 50 ㎕ 분취량을 PNGase F (10 유닛)로 18시간 동안 37℃에서 처리하였다. 1 M DTT를 10 mM의 최종 농도로 무손상 항체 또는 탈글리코실화 항체의 분취량에 첨가함으로써 환원된 항체를 제조하고, 30분 동안 37℃에서 인큐베이션하였다.

3 ㎍의 무손상 또는 탈글리코실화 항체 샘플을 70℃에서 유지된 포로쉘 300SB-C3 칼럼 (2.1 ㎜ × 75 ㎜, 5 ㎛) (애질런트 테크놀러지즈) 상에 로딩하였다. 먼저 단백질을 카트리지 상에서 1분 동안 90％ 용매 A (0.1％ HCOOH), 5％ 용매 B (0.1％ HCOOH 내의 90％ 아세토니트릴)로 헹궜다. 그 후, 26분에 걸친 5-100％의 B의 구배에 이어지는 100％ B에서의 3분 재생 및 5％ B에서의 10분의 최종 평형 기간을 사용하여 용리를 수행하였다.

서열

실시예 1-4에 개시된 균주들 중 일부를 생산하는데 사용된 서열들이 표 12에서 제공된다.

설명된 실시양태들을 참조로 본 발명이 본원에서 기술되었지만, 본 발명이 이에 한정되지 않는다는 것을 이해하여야 한다. 본원의 교시 내용을 입수할 수 있는 당업자는 본 발명의 범주 내의 추가적인 변형 및 실시양태를 인지할 것이다. 따라서, 본 발명은 본원에 첨부된 청구항에 의해서만 제한된다.

SEQUENCE LISTING <110> SETHURAMAN, Natarajan CHOI, Byung-Kwon PRINZ, Bianka <120> METHOD FOR INCREASING N-GLYCOSYLATION SITE OCCUPANCY ON THERAPEUTIC GLYCOPROTEINS PRODUCED IN PICHIA PASTORIS <130> GFI-MIS-00010 <150> 61/307,642 <151> 2010-02-24 <160> 111 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> PCR primer PpURA6out/UP <400> 1 ctgaggagtc agatatcagc tcaatctcca t 31 <210> 2 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> PCR primer Puc19/LP <400> 2 tccggctcgt atgttgtgtg gaattgt 27 <210> 3 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> PCR primer PpURA6out/LP <400> 3 ctggatgttt gatgggttca gtttcagctg ga 32 <210> 4 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> PCR primer ScARR3/UP <400> 4 ggcaatagtc gcgagaatcc ttaaaccat 29 <210> 5 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> PCR primer PpTRP1-5'out/UP <400> 5 cctcgtaaag atctgcggtt tgcaaagt 28 <210> 6 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> PCR primer PpALG3TT/LP <400> 6 cctcccactg gaaccgatga tatggaa 27 <210> 7 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> PCR primer PpTEFTT/UP <400> 7 gatgcgaagt taagtgcgca gaaagtaata tca 33 <210> 8 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> PCR primer PpTRP-3'1out/LP <400> 8 cgtgtgtacc ttgaaacgtc aatgatactt tga 33 <210> 9 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> PCR primer LmSTT3D/iUP <400> 9 cagactaaga ctgcttctcc acctgctaag 30 <210> 10 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> PCR primer LmSTT3D/iLP <400> 10 caacagtaga accagaagcc tcgtaagtac ag 32 <210> 11 <211> 2577 <212> DNA <213> Leishmania major <400> 11 atgggtaaaa gaaagggaaa ctccttggga gattctggtt ctgctgctac tgcttccaga 60 gaggcttctg ctcaagctga agatgctgct tcccagacta agactgcttc tccacctgct 120 aaggttatct tgttgccaaa gactttgact gacgagaagg acttcatcgg tatcttccca 180 tttccattct ggccagttca cttcgttttg actgttgttg ctttgttcgt tttggctgct 240 tcctgtttcc aggctttcac tgttagaatg atctccgttc aaatctacgg ttacttgatc 300 cacgaatttg acccatggtt caactacaga gctgctgagt acatgtctac tcacggatgg 360 agtgcttttt tctcctggtt cgattacatg tcctggtatc cattgggtag accagttggt 420 tctactactt acccaggatt gcagttgact gctgttgcta tccatagagc tttggctgct 480 gctggaatgc caatgtcctt gaacaatgtt tgtgttttga tgccagcttg gtttggtgct 540 atcgctactg ctactttggc tttctgtact tacgaggctt ctggttctac tgttgctgct 600 gctgcagctg ctttgtcctt ctccattatc cctgctcact tgatgagatc catggctggt 660 gagttcgaca acgagtgtat tgctgttgct gctatgttgt tgactttcta ctgttgggtt 720 cgttccttga gaactagatc ctcctggcca atcggtgttt tgacaggtgt tgcttacggt 780 tacatggctg ctgcttgggg aggttacatc ttcgttttga acatggttgc tatgcacgct 840 ggtatctctt ctatggttga ctgggctaga aacacttaca acccatcctt gttgagagct 900 tacactttgt tctacgttgt tggtactgct atcgctgttt gtgttccacc agttggaatg 960 tctccattca agtccttgga gcagttggga gctttgttgg ttttggtttt cttgtgtgga 1020 ttgcaagttt gtgaggtttt gagagctaga gctggtgttg aagttagatc cagagctaat 1080 ttcaagatca gagttagagt tttctccgtt atggctggtg ttgctgcttt ggctatctct 1140 gttttggctc caactggtta ctttggtcca ttgtctgtta gagttagagc tttgtttgtt 1200 gagcacacta gaactggtaa cccattggtt gactccgttg ctgaacatca accagcttct 1260 ccagaggcta tgtgggcttt cttgcatgtt tgtggtgtta cttggggatt gggttccatt 1320 gttttggctg tttccacttt cgttcactac tccccatcta aggttttctg gttgttgaac 1380 tccggtgctg tttactactt ctccactaga atggctagat tgttgttgtt gtccggtcca 1440 gctgcttgtt tgtccactgg tatcttcgtt ggtactatct tggaggctgc tgttcaattg 1500 tctttctggg actccgatgc tactaaggct aagaagcagc aaaagcaggc tcaaagacac 1560 caaagaggtg ctggtaaagg ttctggtaga gatgacgcta agaacgctac tactgctaga 1620 gctttctgtg acgttttcgc tggttcttct ttggcttggg gtcacagaat ggttttgtcc 1680 attgctatgt gggctttggt tactactact gctgtttcct tcttctcctc cgaatttgct 1740 tctcactcca ctaagttcgc tgaacaatcc tccaacccaa tgatcgtttt cgctgctgtt 1800 gttcagaaca gagctactgg aaagccaatg aacttgttgg ttgacgacta cttgaaggct 1860 tacgagtggt tgagagactc tactccagag gacgctagag ttttggcttg gtgggactac 1920 ggttaccaaa tcactggtat cggtaacaga acttccttgg ctgatggtaa cacttggaac 1980 cacgagcaca ttgctactat cggaaagatg ttgacttccc cagttgttga agctcactcc 2040 cttgttagac acatggctga ctacgttttg atttgggctg gtcaatctgg tgacttgatg 2100 aagtctccac acatggctag aatcggtaac tctgtttacc acgacatttg tccagatgac 2160 ccattgtgtc agcaattcgg tttccacaga aacgattact ccagaccaac tccaatgatg 2220 agagcttcct tgttgtacaa cttgcacgag gctggaaaaa gaaagggtgt taaggttaac 2280 ccatctttgt tccaagaggt ttactcctcc aagtacggac ttgttagaat cttcaaggtt 2340 atgaacgttt ccgctgagtc taagaagtgg gttgcagacc cagctaacag agtttgtcac 2400 ccacctggtt cttggatttg tcctggtcaa tacccacctg ctaaagaaat ccaagagatg 2460 ttggctcaca gagttccatt cgaccaggtt acaaacgctg acagaaagaa caatgttggt 2520 tcctaccaag aggaatacat gagaagaatg agagagtccg agaacagaag ataatag 2577 <210> 12 <211> 857 <212> PRT <213> Leishmania major <400> 12 Met Gly Lys Arg Lys Gly Asn Ser Leu Gly Asp Ser Gly Ser Ala Ala 1 5 10 15 Thr Ala Ser Arg Glu Ala Ser Ala Gln Ala Glu Asp Ala Ala Ser Gln 20 25 30 Thr Lys Thr Ala Ser Pro Pro Ala Lys Val Ile Leu Leu Pro Lys Thr 35 40 45 Leu Thr Asp Glu Lys Asp Phe Ile Gly Ile Phe Pro Phe Pro Phe Trp 50 55 60 Pro Val His Phe Val Leu Thr Val Val Ala Leu Phe Val Leu Ala Ala 65 70 75 80 Ser Cys Phe Gln Ala Phe Thr Val Arg Met Ile Ser Val Gln Ile Tyr 85 90 95 Gly Tyr Leu Ile His Glu Phe Asp Pro Trp Phe Asn Tyr Arg Ala Ala 100 105 110 Glu Tyr Met Ser Thr His Gly Trp Ser Ala Phe Phe Ser Trp Phe Asp 115 120 125 Tyr Met Ser Trp Tyr Pro Leu Gly Arg Pro Val Gly Ser Thr Thr Tyr 130 135 140 Pro Gly Leu Gln Leu Thr Ala Val Ala Ile His Arg Ala Leu Ala Ala 145 150 155 160 Ala Gly Met Pro Met Ser Leu Asn Asn Val Cys Val Leu Met Pro Ala 165 170 175 Trp Phe Gly Ala Ile Ala Thr Ala Thr Leu Ala Phe Cys Thr Tyr Glu 180 185 190 Ala Ser Gly Ser Thr Val Ala Ala Ala Ala Ala Ala Leu Ser Phe Ser 195 200 205 Ile Ile Pro Ala His Leu Met Arg Ser Met Ala Gly Glu Phe Asp Asn 210 215 220 Glu Cys Ile Ala Val Ala Ala Met Leu Leu Thr Phe Tyr Cys Trp Val 225 230 235 240 Arg Ser Leu Arg Thr Arg Ser Ser Trp Pro Ile Gly Val Leu Thr Gly 245 250 255 Val Ala Tyr Gly Tyr Met Ala Ala Ala Trp Gly Gly Tyr Ile Phe Val 260 265 270 Leu Asn Met Val Ala Met His Ala Gly Ile Ser Ser Met Val Asp Trp 275 280 285 Ala Arg Asn Thr Tyr Asn Pro Ser Leu Leu Arg Ala Tyr Thr Leu Phe 290 295 300 Tyr Val Val Gly Thr Ala Ile Ala Val Cys Val Pro Pro Val Gly Met 305 310 315 320 Ser Pro Phe Lys Ser Leu Glu Gln Leu Gly Ala Leu Leu Val Leu Val 325 330 335 Phe Leu Cys Gly Leu Gln Val Cys Glu Val Leu Arg Ala Arg Ala Gly 340 345 350 Val Glu Val Arg Ser Arg Ala Asn Phe Lys Ile Arg Val Arg Val Phe 355 360 365 Ser Val Met Ala Gly Val Ala Ala Leu Ala Ile Ser Val Leu Ala Pro 370 375 380 Thr Gly Tyr Phe Gly Pro Leu Ser Val Arg Val Arg Ala Leu Phe Val 385 390 395 400 Glu His Thr Arg Thr Gly Asn Pro Leu Val Asp Ser Val Ala Glu His 405 410 415 Gln Pro Ala Ser Pro Glu Ala Met Trp Ala Phe Leu His Val Cys Gly 420 425 430 Val Thr Trp Gly Leu Gly Ser Ile Val Leu Ala Val Ser Thr Phe Val 435 440 445 His Tyr Ser Pro Ser Lys Val Phe Trp Leu Leu Asn Ser Gly Ala Val 450 455 460 Tyr Tyr Phe Ser Thr Arg Met Ala Arg Leu Leu Leu Leu Ser Gly Pro 465 470 475 480 Ala Ala Cys Leu Ser Thr Gly Ile Phe Val Gly Thr Ile Leu Glu Ala 485 490 495 Ala Val Gln Leu Ser Phe Trp Asp Ser Asp Ala Thr Lys Ala Lys Lys 500 505 510 Gln Gln Lys Gln Ala Gln Arg His Gln Arg Gly Ala Gly Lys Gly Ser 515 520 525 Gly Arg Asp Asp Ala Lys Asn Ala Thr Thr Ala Arg Ala Phe Cys Asp 530 535 540 Val Phe Ala Gly Ser Ser Leu Ala Trp Gly His Arg Met Val Leu Ser 545 550 555 560 Ile Ala Met Trp Ala Leu Val Thr Thr Thr Ala Val Ser Phe Phe Ser 565 570 575 Ser Glu Phe Ala Ser His Ser Thr Lys Phe Ala Glu Gln Ser Ser Asn 580 585 590 Pro Met Ile Val Phe Ala Ala Val Val Gln Asn Arg Ala Thr Gly Lys 595 600 605 Pro Met Asn Leu Leu Val Asp Asp Tyr Leu Lys Ala Tyr Glu Trp Leu 610 615 620 Arg Asp Ser Thr Pro Glu Asp Ala Arg Val Leu Ala Trp Trp Asp Tyr 625 630 635 640 Gly Tyr Gln Ile Thr Gly Ile Gly Asn Arg Thr Ser Leu Ala Asp Gly 645 650 655 Asn Thr Trp Asn His Glu His Ile Ala Thr Ile Gly Lys Met Leu Thr 660 665 670 Ser Pro Val Val Glu Ala His Ser Leu Val Arg His Met Ala Asp Tyr 675 680 685 Val Leu Ile Trp Ala Gly Gln Ser Gly Asp Leu Met Lys Ser Pro His 690 695 700 Met Ala Arg Ile Gly Asn Ser Val Tyr His Asp Ile Cys Pro Asp Asp 705 710 715 720 Pro Leu Cys Gln Gln Phe Gly Phe His Arg Asn Asp Tyr Ser Arg Pro 725 730 735 Thr Pro Met Met Arg Ala Ser Leu Leu Tyr Asn Leu His Glu Ala Gly 740 745 750 Lys Arg Lys Gly Val Lys Val Asn Pro Ser Leu Phe Gln Glu Val Tyr 755 760 765 Ser Ser Lys Tyr Gly Leu Val Arg Ile Phe Lys Val Met Asn Val Ser 770 775 780 Ala Glu Ser Lys Lys Trp Val Ala Asp Pro Ala Asn Arg Val Cys His 785 790 795 800 Pro Pro Gly Ser Trp Ile Cys Pro Gly Gln Tyr Pro Pro Ala Lys Glu 805 810 815 Ile Gln Glu Met Leu Ala His Arg Val Pro Phe Asp Gln Val Thr Asn 820 825 830 Ala Asp Arg Lys Asn Asn Val Gly Ser Tyr Gln Glu Glu Tyr Met Arg 835 840 845 Arg Met Arg Glu Ser Glu Asn Arg Arg 850 855 <210> 13 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Saccharomyces cerevisiae mating factor pre-signal peptide (DNA) <400> 13 atgagattcc catccatctt cactgctgtt ttgttcgctg cttcttctgc tttggct 57 <210> 14 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Saccharomyces cerevisiae mating factor pre-signal peptide <400> 14 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala <210> 15 <211> 1350 <212> DNA <213> Artificial Sequence <220> <223> Anti-Her2 Heavy chain (VH + IgG1 constant region) (DNA) <400> 15 gaggttcagt tggttgaatc tggaggagga ttggttcaac ctggtggttc tttgagattg 60 tcctgtgctg cttccggttt caacatcaag gacacttaca tccactgggt tagacaagct 120 ccaggaaagg gattggagtg ggttgctaga atctacccaa ctaacggtta cacaagatac 180 gctgactccg ttaagggaag attcactatc tctgctgaca cttccaagaa cactgcttac 240 ttgcagatga actccttgag agctgaggat actgctgttt actactgttc cagatggggt 300 ggtgatggtt tctacgctat ggactactgg ggtcaaggaa ctttggttac tgtttcctcc 360 gcttctacta agggaccatc tgttttccca ttggctccat cttctaagtc tacttccggt 420 ggtactgctg ctttgggatg tttggttaaa gactacttcc cagagccagt tactgtttct 480 tggaactccg gtgctttgac ttctggtgtt cacactttcc cagctgtttt gcaatcttcc 540 ggtttgtact ctttgtcctc cgttgttact gttccatcct cttccttggg tactcagact 600 tacatctgta acgttaacca caagccatcc aacactaagg ttgacaagaa ggttgagcca 660 aagtcctgtg acaagacaca tacttgtcca ccatgtccag ctccagaatt gttgggtggt 720 ccatccgttt tcttgttccc accaaagcca aaggacactt tgatgatctc cagaactcca 780 gaggttacat gtgttgttgt tgacgtttct cacgaggacc cagaggttaa gttcaactgg 840 tacgttgacg gtgttgaagt tcacaacgct aagactaagc caagagaaga gcagtacaac 900 tccacttaca gagttgtttc cgttttgact gttttgcacc aggactggtt gaacggtaaa 960 gaatacaagt gtaaggtttc caacaaggct ttgccagctc caatcgaaaa gactatctcc 1020 aaggctaagg gtcaaccaag agagccacag gtttacactt tgccaccatc cagagaagag 1080 atgactaaga accaggtttc cttgacttgt ttggttaaag gattctaccc atccgacatt 1140 gctgttgagt gggaatctaa cggtcaacca gagaacaact acaagactac tccaccagtt 1200 ttggattctg atggttcctt cttcttgtac tccaagttga ctgttgacaa gtccagatgg 1260 caacagggta acgttttctc ctgttccgtt atgcatgagg ctttgcacaa ccactacact 1320 caaaagtcct tgtctttgtc ccctggttaa 1350 <210> 16 <211> 449 <212> PRT <213> Artificial Sequence <220> <223> Anti-Her2 Heavy chain (VH + IgG1 constant region) <400> 16 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn Ile Lys Asp Thr 20 25 30 Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys Asn Thr Ala Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp Tyr Trp Gly Gln 100 105 110 Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val 115 120 125 Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala 130 135 140 Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser 145 150 155 160 Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val 165 170 175 Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro 180 185 190 Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys 195 200 205 Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp 210 215 220 Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly 225 230 235 240 Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile 245 250 255 Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu 260 265 270 Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His 275 280 285 Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg 290 295 300 Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys 305 310 315 320 Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu 325 330 335 Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr 340 345 350 Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu 355 360 365 Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp 370 375 380 Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val 385 390 395 400 Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp 405 410 415 Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His 420 425 430 Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro 435 440 445 Gly <210> 17 <211> 645 <212> DNA <213> Artificial Sequence <220> <223> Anti-Her2 light chain (VL + Kappa constant region) (DNA) <400> 17 gacatccaaa tgactcaatc cccatcttct ttgtctgctt ccgttggtga cagagttact 60 atcacttgta gagcttccca ggacgttaat actgctgttg cttggtatca acagaagcca 120 ggaaaggctc caaagttgtt gatctactcc gcttccttct tgtactctgg tgttccatcc 180 agattctctg gttccagatc cggtactgac ttcactttga ctatctcctc cttgcaacca 240 gaagatttcg ctacttacta ctgtcagcag cactacacta ctccaccaac tttcggacag 300 ggtactaagg ttgagatcaa gagaactgtt gctgctccat ccgttttcat tttcccacca 360 tccgacgaac agttgaagtc tggtacagct tccgttgttt gtttgttgaa caacttctac 420 ccaagagagg ctaaggttca gtggaaggtt gacaacgctt tgcaatccgg taactcccaa 480 gaatccgtta ctgagcaaga ctctaaggac tccacttact ccttgtcctc cactttgact 540 ttgtccaagg ctgattacga gaagcacaag gtttacgctt gtgaggttac acatcagggt 600 ttgtcctccc cagttactaa gtccttcaac agaggagagt gttaa 645 <210> 18 <211> 214 <212> PRT <213> Artificial Sequence <220> <223> Anti-Her2 light chain (VL + Kappa constant region) <400> 18 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Val Asn Thr Ala 20 25 30 Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Arg Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln His Tyr Thr Thr Pro Pro 85 90 95 Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala 100 105 110 Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly 115 120 125 Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala 130 135 140 Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln 145 150 155 160 Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser 165 170 175 Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr 180 185 190 Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser 195 200 205 Phe Asn Arg Gly Glu Cys 210 <210> 19 <211> 1350 <212> DNA <213> Artificial Sequence <220> <223> Anti-RSV Heavy chain (VH + IgG1 constant region) (DNA) <400> 19 caggttacat tgagagaatc cggtccagct ttggttaagc caactcagac tttgactttg 60 acttgtactt tctccggttt ctccttgtct acttccggaa tgtctgttgg atggatcaga 120 caaccacctg gaaaggcttt ggaatggctt gctgacattt ggtgggatga caagaaggac 180 tacaacccat ccttgaagtc cagattgact atctccaagg acacttccaa gaatcaagtt 240 gttttgaagg ttacaaacat ggacccagct gacactgcta cttactactg tgctagatcc 300 atgatcacta actggtactt cgatgtttgg ggtgctggta ctactgttac tgtctcgagt 360 gcttctacta agggaccatc cgtttttcca ttggctccat cctctaagtc tacttccggt 420 ggaaccgctg ctttgggatg tttggttaaa gactacttcc cagagccagt tactgtttct 480 tggaactccg gtgctttgac ttctggtgtt cacactttcc cagctgtttt gcaatcttcc 540 ggtttgtact ctttgtcctc cgttgttact gttccatcct cttccttggg tactcagact 600 tacatctgta acgttaacca caagccatcc aacactaagg ttgacaagag agttgagcca 660 aagtcctgtg acaagacaca tacttgtcca ccatgtccag ctccagaatt gttgggtggt 720 ccatccgttt tcttgttccc accaaagcca aaggacactt tgatgatctc cagaactcca 780 gaggttacat gtgttgttgt tgacgtttct cacgaggacc cagaggttaa gttcaactgg 840 tacgttgacg gtgttgaagt tcacaacgct aagactaagc caagagaaga gcagtacaac 900 tccacttaca gagttgtttc cgttttgact gttttgcacc aggactggtt gaacggtaaa 960 gaatacaagt gtaaggtttc caacaaggct ttgccagctc caatcgaaaa gactatctcc 1020 aaggctaagg gtcaaccaag agagccacag gtttacactt tgccaccatc cagagaagag 1080 atgactaaga accaggtttc cttgacttgt ttggttaaag gattctaccc atccgacatt 1140 gctgttgagt gggaatctaa cggtcaacca gagaacaact acaagactac tccaccagtt 1200 ttggattctg atggttcctt cttcttgtac tccaagttga ctgttgacaa gtccagatgg 1260 caacagggta acgttttctc ctgttccgtt atgcatgagg ctttgcacaa ccactacact 1320 caaaagtcct tgtctttgtc ccctggttaa 1350 <210> 20 <211> 449 <212> PRT <213> Artificial Sequence <220> <223> Anti-RSV Heavy chain (VH + IgG1 constant region) <400> 20 Gln Val Thr Leu Arg Glu Ser Gly Pro Ala Leu Val Lys Pro Thr Gln 1 5 10 15 Thr Leu Thr Leu Thr Cys Thr Phe Ser Gly Phe Ser Leu Ser Thr Ser 20 25 30 Gly Met Ser Val Gly Trp Ile Arg Gln Pro Pro Gly Lys Ala Leu Glu 35 40 45 Trp Leu Ala Asp Ile Trp Trp Asp Asp Lys Lys Asp Tyr Asn Pro Ser 50 55 60 Leu Lys Ser Arg Leu Thr Ile Ser Lys Asp Thr Ser Lys Asn Gln Val 65 70 75 80 Val Leu Lys Val Thr Asn Met Asp Pro Ala Asp Thr Ala Thr Tyr Tyr 85 90 95 Cys Ala Arg Ser Met Ile Thr Asn Trp Tyr Phe Asp Val Trp Gly Ala 100 105 110 Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val 115 120 125 Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala 130 135 140 Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser 145 150 155 160 Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val 165 170 175 Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro 180 185 190 Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys 195 200 205 Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Pro Lys Ser Cys Asp 210 215 220 Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly 225 230 235 240 Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile 245 250 255 Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu 260 265 270 Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His 275 280 285 Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg 290 295 300 Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys 305 310 315 320 Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu 325 330 335 Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr 340 345 350 Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu 355 360 365 Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp 370 375 380 Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val 385 390 395 400 Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp 405 410 415 Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His 420 425 430 Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro 435 440 445 Gly <210> 21 <211> 699 <212> DNA <213> Artificial Sequence <220> <223> Anti-RSV light chain (VL + Kappa constant region (DNA) <400> 21 atgagattcc catccatctt cactgctgtt ttgttcgctg cttcttctgc tttggctgac 60 attcagatga cacagtcccc atctactttg tctgcttccg ttggtgacag agttactatc 120 acttgtaagt gtcagttgtc cgttggttac atgcactggt atcagcaaaa gccaggaaag 180 gctccaaagt tgttgatcta cgacacttcc aagttggctt ccggtgttcc atctagattc 240 tctggttccg gttctggtac tgagttcact ttgactatct cttccttgca accagatgac 300 ttcgctactt actactgttt ccagggttct ggttacccat tcactttcgg tggtggtact 360 aagttggaga tcaagagaac tgttgctgct ccatccgttt tcattttccc accatccgac 420 gaacaattga agtccggtac cgcttccgtt gtttgtttgt tgaacaactt ctacccacgt 480 gaggctaagg ttcagtggaa ggttgacaac gctttgcaat ccggtaactc ccaagaatcc 540 gttactgagc aggattctaa ggattccact tactcattgt cctccacttt gactttgtcc 600 aaggctgatt acgagaagca caaggtttac gcttgcgagg ttacacatca gggtttgtcc 660 tccccagtta ctaagtcctt caacagagga gagtgttaa 699 <210> 22 <211> 213 <212> PRT <213> Artificial Sequence <220> <223> Anti-RSV light chain (VL + Kappa constant region <400> 22 Asp Ile Gln Met Thr Gln Ser Pro Ser Thr Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Lys Cys Gln Leu Ser Val Gly Tyr Met 20 25 30 His Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile Tyr 35 40 45 Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Ser Arg Phe Ser Gly Ser 50 55 60 Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Asp 65 70 75 80 Asp Phe Ala Thr Tyr Tyr Cys Phe Gln Gly Ser Gly Tyr Pro Phe Thr 85 90 95 Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg Thr Val Ala Ala Pro 100 105 110 Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr 115 120 125 Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys 130 135 140 Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu 145 150 155 160 Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser 165 170 175 Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala 180 185 190 Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe 195 200 205 Asn Arg Gly Glu Cys 210 <210> 23 <211> 934 <212> DNA <213> Artificial Sequence <220> <223> Pp AOX1 promoter <400> 23 aacatccaaa gacgaaaggt tgaatgaaac ctttttgcca tccgacatcc acaggtccat 60 tctcacacat aagtgccaaa cgcaacagga ggggatacac tagcagcaga ccgttgcaaa 120 cgcaggacct ccactcctct tctcctcaac acccactttt gccatcgaaa aaccagccca 180 gttattgggc ttgattggag ctcgctcatt ccaattcctt ctattaggct actaacacca 240 tgactttatt agcctgtcta tcctggcccc cctggcgagg ttcatgtttg tttatttccg 300 aatgcaacaa gctccgcatt acacccgaac atcactccag atgagggctt tctgagtgtg 360 gggtcaaata gtttcatgtt ccccaaatgg cccaaaactg acagtttaaa cgctgtcttg 420 gaacctaata tgacaaaagc gtgatctcat ccaagatgaa ctaagtttgg ttcgttgaaa 480 tgctaacggc cagttggtca aaaagaaact tccaaaagtc ggcataccgt ttgtcttgtt 540 tggtattgat tgacgaatgc tcaaaaataa tctcattaat gcttagcgca gtctctctat 600 cgcttctgaa ccccggtgca cctgtgccga aacgcaaatg gggaaacacc cgctttttgg 660 atgattatgc attgtctcca cattgtatgc ttccaagatt ctggtgggaa tactgctgat 720 agcctaacgt tcatgatcaa aatttaactg ttctaacccc tacttgacag caatatataa 780 acagaaggaa gctgccctgt cttaaacctt tttttttatc atcattatta gcttactttc 840 ataattgcga ctggttccaa ttgacaagct tttgatttta acgactttta acgacaactt 900 gagaagatca aaaaacaact aattattcga aacg 934 <210> 24 <211> 293 <212> DNA <213> Artificial Sequence <220> <223> ScCYC TT <400> 24 acaggcccct tttcctttgt cgatatcatg taattagtta tgtcacgctt acattcacgc 60 cctcctccca catccgctct aaccgaaaag gaaggagtta gacaacctga agtctaggtc 120 cctatttatt ttttttaata gttatgttag tattaagaac gttatttata tttcaaattt 180 ttcttttttt tctgtacaaa cgcgtgtacg catgtaacat tatactgaaa accttgcttg 240 agaaggtttt gggacgctcg aaggctttaa tttgcaagct gccggctctt aag 293 <210> 25 <211> 600 <212> DNA <213> Artificial Sequence <220> <223> PpRPL10 promoter <400> 25 gttcttcgct tggtcttgta tctccttaca ctgtatcttc ccatttgcgt ttaggtggtt 60 atcaaaaact aaaaggaaaa atttcagatg tttatctcta aggttttttc tttttacagt 120 ataacacgtg atgcgtcacg tggtactaga ttacgtaagt tattttggtc cggtgggtaa 180 gtgggtaaga atagaaagca tgaaggttta caaaaacgca gtcacgaatt attgctactt 240 cgagcttgga accaccccaa agattatatt gtactgatgc actaccttct cgattttgct 300 cctccaagaa cctacgaaaa acatttcttg agccttttca acctagacta cacatcaagt 360 tatttaaggt atgttccgtt aacatgtaag aaaaggagag gatagatcgt ttatggggta 420 cgtcgcctga ttcaagcgtg accattcgaa gaataggcct tcgaaagctg aataaagcaa 480 atgtcagttg cgattggtat gctgacaaat tagcataaaa agcaatagac tttctaacca 540 cctgtttttt tccttttact ttatttatat tttgccaccg tactaacaag ttcagacaaa 600 <210> 26 <211> 486 <212> DNA <213> Artificial Sequence <220> <223> PpGAPDH promoter <400> 26 tttttgtaga aatgtcttgg tgtcctcgtc caatcaggta gccatctctg aaatatctgg 60 ctccgttgca actccgaacg acctgctggc aacgtaaaat tctccggggt aaaacttaaa 120 tgtggagtaa tggaaccaga aacgtctctt cccttctctc tccttccacc gcccgttacc 180 gtccctagga aattttactc tgctggagag cttcttctac ggcccccttg cagcaatgct 240 cttcccagca ttacgttgcg ggtaaaacgg aggtcgtgta cccgacctag cagcccaggg 300 atggaaaagt cccggccgtc gctggcaata atagcgggcg gacgcatgtc atgagattat 360 tggaaaccac cagaatcgaa tataaaaggc gaacaccttt cccaattttg gtttctcctg 420 acccaaagac tttaaattta atttatttgt ccctatttca atcaattgaa caactatcaa 480 aacaca 486 <210> 27 <211> 600 <212> DNA <213> Artificial Sequence <220> <223> PpTEF1 promoter <400> 27 ttaaggtttg gaacaacact aaactacctt gcggtactac cattgacact acacatcctt 60 aattccaatc ctgtctggcc tccttcacct tttaaccatc ttgcccattc caactcgtgt 120 cagattgcgt atcaagtgaa aaaaaaaaaa ttttaaatct ttaacccaat caggtaataa 180 ctgtcgcctc ttttatctgc cgcactgcat gaggtgtccc cttagtggga aagagtactg 240 agccaaccct ggaggacagc aagggaaaaa tacctacaac ttgcttcata atggtcgtaa 300 aaacaatcct tgtcggatat aagtgttgta gactgtccct tatcctctgc gatgttcttc 360 ctctcaaagt ttgcgatttc tctctatcag aattgccatc aagagactca ggactaattt 420 cgcagtccca cacgcactcg tacatgattg gctgaaattt ccctaaagaa tttctttttc 480 acgaaaattt tttttttaca caagattttc agcagatata aaatggagag caggacctcc 540 gctgtgactc ttcttttttt tcttttattc tcactacata cattttagtt attcgccaac 600 <210> 28 <211> 301 <212> DNA <213> Artificial Sequence <220> <223> PpTEF1 TT <400> 28 attgcttgaa gctttaattt attttattaa cataataata atacaagcat gatatatttg 60 tattttgttc gttaacattg atgttttctt catttactgt tattgtttgt aactttgatc 120 gatttatctt ttctacttta ctgtaatatg gctggcgggt gagccttgaa ctccctgtat 180 tactttacct tgctattact taatctattg actagcagcg acctcttcaa ccgaagggca 240 agtacacagc aagttcatgt ctccgtaagt gtcatcaacc ctggaaacag tgggccatgt 300 c 301 <210> 29 <211> 376 <212> DNA <213> Artificial Sequence <220> <223> PpALG3 TT <400> 29 atttacaatt agtaatatta aggtggtaaa aacattcgta gaattgaaat gaattaatat 60 agtatgacaa tggttcatgt ctataaatct ccggcttcgg taccttctcc ccaattgaat 120 acattgtcaa aatgaatggt tgaactatta ggttcgccag tttcgttatt aagaaaactg 180 ttaaaatcaa attccatatc atcggttcca gtgggaggac cagttccatc gccaaaatcc 240 tgtaagaatc cattgtcaga acctgtaaag tcagtttgag atgaaatttt tccggtcttt 300 gttgacttgg aagcttcgtt aaggttaggt gaaacagttt gatcaaccag cggctcccgt 360 tttcgtcgct tagtag 376 <210> 30 <211> 672 <212> DNA <213> Artificial Sequence <220> <223> PpTRP1 5' region and ORF <400> 30 gcggaaacgg cagtaaacaa tggagcttca ttagtgggtg ttattatggt ccctggccgg 60 gaacgaacgg tgaaacaaga ggttgcgagg gaaatttcgc agatggtgcg ggaaaagaga 120 atttcaaagg gctcaaaata cttggattcc agacaactga ggaaagagtg ggacgactgt 180 cctctggaag actggtttga gtacaacgtg aaagaaataa acagcagtgg tccattttta 240 gttggagttt ttcgtaatca aagtatagat gaaatccagc aagctatcca cactcatggt 300 ttggatttcg tccaactaca tgggtctgag gattttgatt cgtatatacg caatatccca 360 gttcctgtga ttaccagata cacagataat gccgtcgatg gtcttaccgg agaagacctc 420 gctataaata gggccctggt gctactggac agcgagcaag gaggtgaagg aaaaaccatc 480 gattgggctc gtgcacaaaa atttggagaa cgtagaggaa aatatttact agccggaggt 540 ttgacacctg ataatgttgc tcatgctcga tctcatactg gctgtattgg tgttgacgtc 600 tctggtgggg tagaaacaaa tgcctcaaaa gatatggaca agatcacaca atttatcaga 660 aacgctacat aa 672 <210> 31 <211> 834 <212> DNA <213> Artificial Sequence <220> <223> PpTRP1 3' region <400> 31 aagtcaatta aatacacgct tgaaaggaca ttacatagct ttcgatttaa gcagaaccag 60 aaatgtagaa ccacttgtca atagattggt caatcttagc aggagcggct gggctagcag 120 ttggaacagc agaggttgct gaaggtgaga aggatggagt ggattgcaaa gtggtgttgg 180 ttaagtcaat ctcaccaggg ctggttttgc caaaaatcaa cttctcccag gcttcacggc 240 attcttgaat gacctcttct gcatacttct tgttcttgca ttcaccagag aaagcaaact 300 ggttctcagg ttttccatca gggatcttgt aaattctgaa ccattcgttg gtagctctca 360 acaagcccgg catgtgcttt tcaacatcct cgatgtcatt gagcttagga gccaatgggt 420 cgttgatgtc gatgacgatg accttccagt cagtctctcc ctcatccaac aaagccataa 480 caccgaggac cttgacttgc ttgacctgtc cagtgtaacc tacggcttca ccaatttcgc 540 aaacgtccaa tggatcattg tcacccttgg ccttggtctc tggatgagtg acgttagggt 600 cttcccatgt ctgagggaag gcaccgtagt tgtgaatgta tccgtggtga gggaaacagt 660 tacgaacgaa acgaagtttt cccttctttg tgtcctgaag aattgggttc agtttctcct 720 ccttggaaat ctccaacttg gcgttggtcc aacgggggac ttcaacaacc atgttgagaa 780 ccttcttgga ttcgtcagca taaagtggga tgtcgtggaa aggagatacg actt 834 <210> 32 <211> 1215 <212> DNA <213> Artificial Sequence <220> <223> ScARR3 ORF <400> 32 atgtcagaag atcaaaaaag tgaaaattcc gtaccttcta aggttaatat ggtgaatcgc 60 accgatatac tgactacgat caagtcattg tcatggcttg acttgatgtt gccatttact 120 ataattctct ccataatcat tgcagtaata atttctgtct atgtgccttc ttcccgtcac 180 acttttgacg ctgaaggtca tcccaatcta atgggagtgt ccattccttt gactgttggt 240 atgattgtaa tgatgattcc cccgatctgc aaagtttcct gggagtctat tcacaagtac 300 ttctacagga gctatataag gaagcaacta gccctctcgt tatttttgaa ttgggtcatc 360 ggtcctttgt tgatgacagc attggcgtgg atggcgctat tcgattataa ggaataccgt 420 caaggcatta ttatgatcgg agtagctaga tgcattgcca tggtgctaat ttggaatcag 480 attgctggag gagacaatga tctctgcgtc gtgcttgtta ttacaaactc gcttttacag 540 atggtattat atgcaccatt gcagatattt tactgttatg ttatttctca tgaccacctg 600 aatacttcaa atagggtatt attcgaagag gttgcaaagt ctgtcggagt ttttctcggc 660 ataccactgg gaattggcat tatcatacgt ttgggaagtc ttaccatagc tggtaaaagt 720 aattatgaaa aatacatttt gagatttatt tctccatggg caatgatcgg atttcattac 780 actttatttg ttatttttat tagtagaggt tatcaattta tccacgaaat tggttctgca 840 atattgtgct ttgtcccatt ggtgctttac ttctttattg catggttttt gaccttcgca 900 ttaatgaggt acttatcaat atctaggagt gatacacaaa gagaatgtag ctgtgaccaa 960 gaactacttt taaagagggt ctggggaaga aagtcttgtg aagctagctt ttctattacg 1020 atgacgcaat gtttcactat ggcttcaaat aattttgaac tatccctggc aattgctatt 1080 tccttatatg gtaacaatag caagcaagca atagctgcaa catttgggcc gttgctagaa 1140 gttccaattt tattgatttt ggcaatagtc gcgagaatcc ttaaaccata ttatatatgg 1200 aacaatagaa attaa 1215 <210> 33 <211> 1144 <212> DNA <213> Artificial Sequence <220> <223> URA6 region <400> 33 caaatgcaag aggacattag aaatgtgttt ggtaagaaca tgaagccgga ggcatacaaa 60 cgattcacag atttgaagga ggaaaacaaa ctgcatccac cggaagtgcc agcagccgtg 120 tatgccaacc ttgctctcaa aggcattcct acggatctga gtgggaaata tctgagattc 180 acagacccac tattggaaca gtaccaaacc tagtttggcc gatccatgat tatgtaatgc 240 atatagtttt tgtcgatgct cacccgtttc gagtctgtct cgtatcgtct tacgtataag 300 ttcaagcatg tttaccaggt ctgttagaaa ctcctttgtg agggcaggac ctattcgtct 360 cggtcccgtt gtttctaaga gactgtacag ccaagcgcag aatggtggca ttaaccataa 420 gaggattctg atcggacttg gtctattggc tattggaacc accctttacg ggacaaccaa 480 ccctaccaag actcctattg catttgtgga accagccacg gaaagagcgt ttaaggacgg 540 agacgtctct gtgatttttg ttctcggagg tccaggagct ggaaaaggta cccaatgtgc 600 caaactagtg agtaattacg gatttgttca cctgtcagct ggagacttgt tacgtgcaga 660 acagaagagg gaggggtcta agtatggaga gatgatttcc cagtatatca gagatggact 720 gatagtacct caagaggtca ccattgcgct cttggagcag gccatgaagg aaaacttcga 780 gaaagggaag acacggttct tgattgatgg attccctcgt aagatggacc aggccaaaac 840 ttttgaggaa aaagtcgcaa agtccaaggt gacacttttc tttgattgtc ccgaatcagt 900 gctccttgag agattactta aaagaggaca gacaagcgga agagaggatg ataatgcgga 960 gagtatcaaa aaaagattca aaacattcgt ggaaacttcg atgcctgtgg tggactattt 1020 cgggaagcaa ggacgcgttt tgaaggtatc ttgtgaccac cctgtggatc aagtgtattc 1080 acaggttgtg tcggtgctaa aagagaaggg gatctttgcc gataacgaga cggagaataa 1140 ataa 1144 <210> 34 <211> 582 <212> DNA <213> Artificial Sequence <220> <223> NatR ORF <400> 34 atgggtacca ctcttgacga cacggcttac cggtaccgca ccagtgtccc gggggacgcc 60 gaggccatcg aggcactgga tgggtccttc accaccgaca ccgtcttccg cgtcaccgcc 120 accggggacg gcttcaccct gcgggaggtg ccggtggacc cgcccctgac caaggtgttc 180 cccgacgacg aatcggacga cgaatcggac gacggggagg acggcgaccc ggactcccgg 240 acgttcgtcg cgtacgggga cgacggcgac ctggcgggct tcgtggtcgt ctcgtactcc 300 ggctggaacc gccggctgac cgtcgaggac atcgaggtcg ccccggagca ccgggggcac 360 ggggtcgggc gcgcgttgat ggggctcgcg acggagttcg cccgcgagcg gggcgccggg 420 cacctctggc tggaggtcac caacgtcaac gcaccggcga tccacgcgta ccggcggatg 480 gggttcaccc tctgcggcct ggacaccgcc ctgtacgacg gcaccgcctc ggacggcgag 540 caggcgctct acatgagcat gccctgcccc taatcagtac tg 582 <210> 35 <211> 375 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the Sh ble ORF (Zeocin resistance marker): <400> 35 atggccaagt tgaccagtgc cgttccggtg ctcaccgcgc gcgacgtcgc cggagcggtc 60 gagttctgga ccgaccggct cgggttctcc cgggacttcg tggaggacga cttcgccggt 120 gtggtccggg acgacgtgac cctgttcatc agcgcggtcc aggaccaggt ggtgccggac 180 aacaccctgg cctgggtgtg ggtgcgcggc ctggacgagc tgtacgccga gtggtcggag 240 gtcgtgtcca cgaacttccg ggacgcctcc gggccggcca tgaccgagat cggcgagcag 300 ccgtgggggc gggagttcgc cctgcgcgac ccggccggca actgcgtgca cttcgtggcc 360 gaggagcagg actga 375 <210> 36 <211> 260 <212> DNA <213> Artificial Sequence <220> <223> PpAOX1 TT <400> 36 tcaagaggat gtcagaatgc catttgcctg agagatgcag gcttcatttt gatacttttt 60 tatttgtaac ctatatagta taggattttt tttgtcattt tgtttcttct cgtacgagct 120 tgctcctgat cagcctatct cgcagctgat gaatatcttg tggtaggggt ttgggaaaat 180 cattcgagtt tgatgttttt cttggtattt cccactcctc ttcagagtac agaagattaa 240 gtgagacgtt cgtttgtgca 260 <210> 37 <211> 427 <212> DNA <213> Artificial Sequence <220> <223> ScTEF1 promoter <400> 37 gatcccccac acaccatagc ttcaaaatgt ttctactcct tttttactct tccagatttt 60 ctcggactcc gcgcatcgcc gtaccacttc aaaacaccca agcacagcat actaaatttc 120 ccctctttct tcctctaggg tgtcgttaat tacccgtact aaaggtttgg aaaagaaaaa 180 agagaccgcc tcgtttcttt ttcttcgtcg aaaaaggcaa taaaaatttt tatcacgttt 240 ctttttcttg aaaatttttt tttttgattt ttttctcttt cgatgacctc ccattgatat 300 ttaagttaat aaacggtctt caatttctca agtttcagtt tcatttttct tgttctatta 360 caactttttt tacttcttgc tcattagaaa gaaagcatag caatctaatc taagttttaa 420 ttacaaa 427 <210> 38 <211> 3029 <212> DNA <213> Saccharomyces cerevisiea <400> 38 aggcctcgca acaacctata attgagttaa gtgcctttcc aagctaaaaa gtttgaggtt 60 ataggggctt agcatccaca cgtcacaatc tcgggtatcg agtatagtat gtagaattac 120 ggcaggaggt ttcccaatga acaaaggaca ggggcacggt gagctgtcga aggtatccat 180 tttatcatgt ttcgtttgta caagcacgac atactaagac atttaccgta tgggagttgt 240 tgtcctagcg tagttctcgc tcccccagca aagctcaaaa aagtacgtca tttagaatag 300 tttgtgagca aattaccagt cggtatgcta cgttagaaag gcccacagta ttcttctacc 360 aaaggcgtgc ctttgttgaa ctcgatccat tatgagggct tccattattc cccgcatttt 420 tattactctg aacaggaata aaaagaaaaa acccagttta ggaaattatc cgggggcgaa 480 gaaatacgcg tagcgttaat cgaccccacg tccagggttt ttccatggag gtttctggaa 540 aaactgacga ggaatgtgat tataaatccc tttatgtgat gtctaagact tttaaggtac 600 gcccgatgtt tgcctattac catcatagag acgtttcttt tcgaggaatg cttaaacgac 660 tttgtttgac aaaaatgttg cctaagggct ctatagtaaa ccatttggaa gaaagatttg 720 acgacttttt ttttttggat ttcgatccta taatccttcc tcctgaaaag aaacatataa 780 atagatatgt attattcttc aaaacattct cttgttcttg tgcttttttt ttaccatata 840 tcttactttt ttttttctct cagagaaaca agcaaaacaa aaagcttttc ttttcactaa 900 cgtatatgat gcttttgcaa gctttccttt tccttttggc tggttttgca gccaaaatat 960 ctgcatcaat gacaaacgaa actagcgata gacctttggt ccacttcaca cccaacaagg 1020 gctggatgaa tgacccaaat gggttgtggt acgatgaaaa agatgccaaa tggcatctgt 1080 actttcaata caacccaaat gacaccgtat ggggtacgcc attgttttgg ggccatgcta 1140 cttccgatga tttgactaat tgggaagatc aacccattgc tatcgctccc aagcgtaacg 1200 attcaggtgc tttctctggc tccatggtgg ttgattacaa caacacgagt gggtttttca 1260 atgatactat tgatccaaga caaagatgcg ttgcgatttg gacttataac actcctgaaa 1320 gtgaagagca atacattagc tattctcttg atggtggtta cacttttact gaataccaaa 1380 agaaccctgt tttagctgcc aactccactc aattcagaga tccaaaggtg ttctggtatg 1440 aaccttctca aaaatggatt atgacggctg ccaaatcaca agactacaaa attgaaattt 1500 actcctctga tgacttgaag tcctggaagc tagaatctgc atttgccaat gaaggtttct 1560 taggctacca atacgaatgt ccaggtttga ttgaagtccc aactgagcaa gatccttcca 1620 aatcttattg ggtcatgttt atttctatca acccaggtgc acctgctggc ggttccttca 1680 accaatattt tgttggatcc ttcaatggta ctcattttga agcgtttgac aatcaatcta 1740 gagtggtaga ttttggtaag gactactatg ccttgcaaac tttcttcaac actgacccaa 1800 cctacggttc agcattaggt attgcctggg cttcaaactg ggagtacagt gcctttgtcc 1860 caactaaccc atggagatca tccatgtctt tggtccgcaa gttttctttg aacactgaat 1920 atcaagctaa tccagagact gaattgatca atttgaaagc cgaaccaata ttgaacatta 1980 gtaatgctgg tccctggtct cgttttgcta ctaacacaac tctaactaag gccaattctt 2040 acaatgtcga tttgagcaac tcgactggta ccctagagtt tgagttggtt tacgctgtta 2100 acaccacaca aaccatatcc aaatccgtct ttgccgactt atcactttgg ttcaagggtt 2160 tagaagatcc tgaagaatat ttgagaatgg gttttgaagt cagtgcttct tccttctttt 2220 tggaccgtgg taactctaag gtcaagtttg tcaaggagaa cccatatttc acaaacagaa 2280 tgtctgtcaa caaccaacca ttcaagtctg agaacgacct aagttactat aaagtgtacg 2340 gcctactgga tcaaaacatc ttggaattgt acttcaacga tggagatgtg gtttctacaa 2400 atacctactt catgaccacc ggtaacgctc taggatctgt gaacatgacc actggtgtcg 2460 ataatttgtt ctacattgac aagttccaag taagggaagt aaaatagagg ttataaaact 2520 tattgtcttt tttatttttt tcaaaagcca ttctaaaggg ctttagctaa cgagtgacga 2580 atgtaaaact ttatgatttc aaagaatacc tccaaaccat tgaaaatgta tttttatttt 2640 tattttctcc cgaccccagt tacctggaat ttgttcttta tgtactttat ataagtataa 2700 ttctcttaaa aatttttact actttgcaat agacatcatt ttttcacgta ataaacccac 2760 aatcgtaatg tagttgcctt acactactag gatggacctt tttgccttta tctgttttgt 2820 tactgacaca atgaaaccgg gtaaagtatt agttatgtga aaatttaaaa gcattaagta 2880 gaagtatacc atattgtaaa aaaaaaaagc gttgtcttct acgtaaaagt gttctcaaaa 2940 agaagtagtg agggaaatgg ataccaagct atctgtaaca ggagctaaaa aatctcaggg 3000 aaaagcttct ggtttgggaa acggtcgac 3029 <210> 39 <211> 898 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 5'-Region used for knock out of PpURA5: <400> 39 atcggccttt gttgatgcaa gttttacgtg gatcatggac taaggagttt tatttggacc 60 aagttcatcg tcctagacat tacggaaagg gttctgctcc tctttttgga aactttttgg 120 aacctctgag tatgacagct tggtggattg tacccatggt atggcttcct gtgaatttct 180 attttttcta cattggattc accaatcaaa acaaattagt cgccatggct ttttggcttt 240 tgggtctatt tgtttggacc ttcttggaat atgctttgca tagatttttg ttccacttgg 300 actactatct tccagagaat caaattgcat ttaccattca tttcttattg catgggatac 360 accactattt accaatggat aaatacagat tggtgatgcc acctacactt ttcattgtac 420 tttgctaccc aatcaagacg ctcgtctttt ctgttctacc atattacatg gcttgttctg 480 gatttgcagg tggattcctg ggctatatca tgtatgatgt cactcattac gttctgcatc 540 actccaagct gcctcgttat ttccaagagt tgaagaaata tcatttggaa catcactaca 600 agaattacga gttaggcttt ggtgtcactt ccaaattctg ggacaaagtc tttgggactt 660 atctgggtcc agacgatgtg tatcaaaaga caaattagag tatttataaa gttatgtaag 720 caaatagggg ctaataggga aagaaaaatt ttggttcttt atcagagctg gctcgcgcgc 780 agtgtttttc gtgctccttt gtaatagtca tttttgacta ctgttcagat tgaaatcaca 840 ttgaagatgt cactcgaggg gtaccaaaaa aggtttttgg atgctgcagt ggcttcgc 898 <210> 40 <211> 1060 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 3'-Region used for knock out of PpURA5: <400> 40 ggtcttttca acaaagctcc attagtgagt cagctggctg aatcttatgc acaggccatc 60 attaacagca acctggagat agacgttgta tttggaccag cttataaagg tattcctttg 120 gctgctatta ccgtgttgaa gttgtacgag ctcggcggca aaaaatacga aaatgtcgga 180 tatgcgttca atagaaaaga aaagaaagac cacggagaag gtggaagcat cgttggagaa 240 agtctaaaga ataaaagagt actgattatc gatgatgtga tgactgcagg tactgctatc 300 aacgaagcat ttgctataat tggagctgaa ggtgggagag ttgaaggtag tattattgcc 360 ctagatagaa tggagactac aggagatgac tcaaatacca gtgctaccca ggctgttagt 420 cagagatatg gtacccctgt cttgagtata gtgacattgg accatattgt ggcccatttg 480 ggcgaaactt tcacagcaga cgagaaatct caaatggaaa cgtatagaaa aaagtatttg 540 cccaaataag tatgaatctg cttcgaatga atgaattaat ccaattatct tctcaccatt 600 attttcttct gtttcggagc tttgggcacg gcggcgggtg gtgcgggctc aggttccctt 660 tcataaacag atttagtact tggatgctta atagtgaatg gcgaatgcaa aggaacaatt 720 tcgttcatct ttaacccttt cactcggggt acacgttctg gaatgtaccc gccctgttgc 780 aactcaggtg gaccgggcaa ttcttgaact ttctgtaacg ttgttggatg ttcaaccaga 840 aattgtccta ccaactgtat tagtttcctt ttggtcttat attgttcatc gagatacttc 900 ccactctcct tgatagccac tctcactctt cctggattac caaaatcttg aggatgagtc 960 ttttcaggct ccaggatgca aggtatatcc aagtacctgc aagcatctaa tattgtcttt 1020 gccagggggt tctccacacc atactccttt tggcgcatgc 1060 <210> 41 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the PpURA5 auxotrophic marker <400> 41 tctagaggga cttatctggg tccagacgat gtgtatcaaa agacaaatta gagtatttat 60 aaagttatgt aagcaaatag gggctaatag ggaaagaaaa attttggttc tttatcagag 120 ctggctcgcg cgcagtgttt ttcgtgctcc tttgtaatag tcatttttga ctactgttca 180 gattgaaatc acattgaaga tgtcactgga ggggtaccaa aaaaggtttt tggatgctgc 240 agtggcttcg caggccttga agtttggaac tttcaccttg aaaagtggaa gacagtctcc 300 atacttcttt aacatgggtc ttttcaacaa agctccatta gtgagtcagc tggctgaatc 360 ttatgctcag gccatcatta acagcaacct ggagatagac gttgtatttg gaccagctta 420 taaaggtatt cctttggctg ctattaccgt gttgaagttg tacgagctgg gcggcaaaaa 480 atacgaaaat gtcggatatg cgttcaatag aaaagaaaag aaagaccacg gagaaggtgg 540 aagcatcgtt ggagaaagtc taaagaataa aagagtactg attatcgatg atgtgatgac 600 tgcaggtact gctatcaacg aagcatttgc tataattgga gctgaaggtg ggagagttga 660 aggttgtatt attgccctag atagaatgga gactacagga gatgactcaa ataccagtgc 720 tacccaggct gttagtcaga gatatggtac ccctgtcttg agtatagtga cattggacca 780 tattgtggcc catttgggcg aaactttcac agcagacgag aaatctcaaa tggaaacgta 840 tagaaaaaag tatttgccca aataagtatg aatctgcttc gaatgaatga attaatccaa 900 ttatcttctc accattattt tcttctgttt cggagctttg ggcacggcgg cggatcc 957 <210> 42 <211> 709 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the part of the Ec lacZ gene that was used to construct the PpURA5 blaster (recyclable auxotrophic marker) <400> 42 cctgcactgg atggtggcgc tggatggtaa gccgctggca agcggtgaag tgcctctgga 60 tgtcgctcca caaggtaaac agttgattga actgcctgaa ctaccgcagc cggagagcgc 120 cgggcaactc tggctcacag tacgcgtagt gcaaccgaac gcgaccgcat ggtcagaagc 180 cgggcacatc agcgcctggc agcagtggcg tctggcggaa aacctcagtg tgacgctccc 240 cgccgcgtcc cacgccatcc cgcatctgac caccagcgaa atggattttt gcatcgagct 300 gggtaataag cgttggcaat ttaaccgcca gtcaggcttt ctttcacaga tgtggattgg 360 cgataaaaaa caactgctga cgccgctgcg cgatcagttc acccgtgcac cgctggataa 420 cgacattggc gtaagtgaag cgacccgcat tgaccctaac gcctgggtcg aacgctggaa 480 ggcggcgggc cattaccagg ccgaagcagc gttgttgcag tgcacggcag atacacttgc 540 tgatgcggtg ctgattacga ccgctcacgc gtggcagcat caggggaaaa ccttatttat 600 cagccggaaa acctaccgga ttgatggtag tggtcaaatg gcgattaccg ttgatgttga 660 agtggcgagc gatacaccgc atccggcgcg gattggcctg aactgccag 709 <210> 43 <211> 2875 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 5'-Region used for knock out of PpOCH1 <400> 43 aaaacctttt ttcctattca aacacaaggc attgcttcaa cacgtgtgcg tatccttaac 60 acagatactc catacttcta ataatgtgat agacgaatac aaagatgttc actctgtgtt 120 gtgtctacaa gcatttctta ttctgattgg ggatattcta gttacagcac taaacaactg 180 gcgatacaaa cttaaattaa ataatccgaa tctagaaaat gaacttttgg atggtccgcc 240 tgttggttgg ataaatcaat accgattaaa tggattctat tccaatgaga gagtaatcca 300 agacactctg atgtcaataa tcatttgctt gcaacaacaa acccgtcatc taatcaaagg 360 gtttgatgag gcttaccttc aattgcagat aaactcattg ctgtccactg ctgtattatg 420 tgagaatatg ggtgatgaat ctggtcttct ccactcagct aacatggctg tttgggcaaa 480 ggtggtacaa ttatacggag atcaggcaat agtgaaattg ttgaatatgg ctactggacg 540 atgcttcaag gatgtacgtc tagtaggagc cgtgggaaga ttgctggcag aaccagttgg 600 cacgtcgcaa caatccccaa gaaatgaaat aagtgaaaac gtaacgtcaa agacagcaat 660 ggagtcaata ttgataacac cactggcaga gcggttcgta cgtcgttttg gagccgatat 720 gaggctcagc gtgctaacag cacgattgac aagaagactc tcgagtgaca gtaggttgag 780 taaagtattc gcttagattc ccaaccttcg ttttattctt tcgtagacaa agaagctgca 840 tgcgaacata gggacaactt ttataaatcc aattgtcaaa ccaacgtaaa accctctggc 900 accattttca acatatattt gtgaagcagt acgcaatatc gataaatact caccgttgtt 960 tgtaacagcc ccaacttgca tacgccttct aatgacctca aatggataag ccgcagcttg 1020 tgctaacata ccagcagcac cgcccgcggt cagctgcgcc cacacatata aaggcaatct 1080 acgatcatgg gaggaattag ttttgaccgt caggtcttca agagttttga actcttcttc 1140 ttgaactgtg taacctttta aatgacggga tctaaatacg tcatggatga gatcatgtgt 1200 gtaaaaactg actccagcat atggaatcat tccaaagatt gtaggagcga acccacgata 1260 aaagtttccc aaccttgcca aagtgtctaa tgctgtgact tgaaatctgg gttcctcgtt 1320 gaagaccctg cgtactatgc ccaaaaactt tcctccacga gccctattaa cttctctatg 1380 agtttcaaat gccaaacgga cacggattag gtccaatggg taagtgaaaa acacagagca 1440 aaccccagct aatgagccgg ccagtaaccg tcttggagct gtttcataag agtcattagg 1500 gatcaataac gttctaatct gttcataaca tacaaatttt atggctgcat agggaaaaat 1560 tctcaacagg gtagccgaat gaccctgata tagacctgcg acaccatcat acccatagat 1620 ctgcctgaca gccttaaaga gcccgctaaa agacccggaa aaccgagaga actctggatt 1680 agcagtctga aaaagaatct tcactctgtc tagtggagca attaatgtct tagcggcact 1740 tcctgctact ccgccagcta ctcctgaata gatcacatac tgcaaagact gcttgtcgat 1800 gaccttgggg ttatttagct tcaagggcaa tttttgggac attttggaca caggagactc 1860 agaaacagac acagagcgtt ctgagtcctg gtgctcctga cgtaggccta gaacaggaat 1920 tattggcttt atttgtttgt ccatttcata ggcttggggt aatagataga tgacagagaa 1980 atagagaaga cctaatattt tttgttcatg gcaaatcgcg ggttcgcggt cgggtcacac 2040 acggagaagt aatgagaaga gctggtaatc tggggtaaaa gggttcaaaa gaaggtcgcc 2100 tggtagggat gcaatacaag gttgtcttgg agtttacatt gaccagatga tttggctttt 2160 tctctgttca attcacattt ttcagcgaga atcggattga cggagaaatg gcggggtgtg 2220 gggtggatag atggcagaaa tgctcgcaat caccgcgaaa gaaagacttt atggaataga 2280 actactgggt ggtgtaagga ttacatagct agtccaatgg agtccgttgg aaaggtaaga 2340 agaagctaaa accggctaag taactaggga agaatgatca gactttgatt tgatgaggtc 2400 tgaaaatact ctgctgcttt ttcagttgct ttttccctgc aacctatcat tttccttttc 2460 ataagcctgc cttttctgtt ttcacttata tgagttccgc cgagacttcc ccaaattctc 2520 tcctggaaca ttctctatcg ctctccttcc aagttgcgcc ccctggcact gcctagtaat 2580 attaccacgc gacttatatt cagttccaca atttccagtg ttcgtagcaa atatcatcag 2640 ccatggcgaa ggcagatggc agtttgctct actataatcc tcacaatcca cccagaaggt 2700 attacttcta catggctata ttcgccgttt ctgtcatttg cgttttgtac ggaccctcac 2760 aacaattatc atctccaaaa atagactatg atccattgac gctccgatca cttgatttga 2820 agactttgga agctccttca cagttgagtc caggcaccgt agaagataat cttcg 2875 <210> 44 <211> 997 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 3'-Region used for knock out of PpOCH1 <400> 44 aaagctagag taaaatagat atagcgagat tagagaatga ataccttctt ctaagcgatc 60 gtccgtcatc atagaatatc atggactgta tagttttttt tttgtacata taatgattaa 120 acggtcatcc aacatctcgt tgacagatct ctcagtacgc gaaatccctg actatcaaag 180 caagaaccga tgaagaaaaa aacaacagta acccaaacac cacaacaaac actttatctt 240 ctccccccca acaccaatca tcaaagagat gtcggaacca aacaccaaga agcaaaaact 300 aaccccatat aaaaacatcc tggtagataa tgctggtaac ccgctctcct tccatattct 360 gggctacttc acgaagtctg accggtctca gttgatcaac atgatcctcg aaatgggtgg 420 caagatcgtt ccagacctgc ctcctctggt agatggagtg ttgtttttga caggggatta 480 caagtctatt gatgaagata ccctaaagca actgggggac gttccaatat acagagactc 540 cttcatctac cagtgttttg tgcacaagac atctcttccc attgacactt tccgaattga 600 caagaacgtc gacttggctc aagatttgat caatagggcc cttcaagagt ctgtggatca 660 tgtcacttct gccagcacag ctgcagctgc tgctgttgtt gtcgctacca acggcctgtc 720 ttctaaacca gacgctcgta ctagcaaaat acagttcact cccgaagaag atcgttttat 780 tcttgacttt gttaggagaa atcctaaacg aagaaacaca catcaactgt acactgagct 840 cgctcagcac atgaaaaacc atacgaatca ttctatccgc cacagatttc gtcgtaatct 900 ttccgctcaa cttgattggg tttatgatat cgatccattg accaaccaac ctcgaaaaga 960 tgaaaacggg aactacatca aggtacaagg ccttcca 997 <210> 45 <211> 2159 <212> DNA <213> Kluyveromyces lactis <400> 45 aaacgtaacg cctggcactc tattttctca aacttctggg acggaagagc taaatattgt 60 gttgcttgaa caaacccaaa aaaacaaaaa aatgaacaaa ctaaaactac acctaaataa 120 accgtgtgta aaacgtagta ccatattact agaaaagatc acaagtgtat cacacatgtg 180 catctcatat tacatctttt atccaatcca ttctctctat cccgtctgtt cctgtcagat 240 tctttttcca taaaaagaag aagaccccga atctcaccgg tacaatgcaa aactgctgaa 300 aaaaaaagaa agttcactgg atacgggaac agtgccagta ggcttcacca catggacaaa 360 acaattgacg ataaaataag caggtgagct tctttttcaa gtcacgatcc ctttatgtct 420 cagaaacaat atatacaagc taaacccttt tgaaccagtt ctctcttcat agttatgttc 480 acataaattg cgggaacaag actccgctgg ctgtcaggta cacgttgtaa cgttttcgtc 540 cgcccaatta ttagcacaac attggcaaaa agaaaaactg ctcgttttct ctacaggtaa 600 attacaattt ttttcagtaa ttttcgctga aaaatttaaa gggcaggaaa aaaagacgat 660 ctcgactttg catagatgca agaactgtgg tcaaaacttg aaatagtaat tttgctgtgc 720 gtgaactaat aaatatatat atatatatat atatatattt gtgtattttg tatatgtaat 780 tgtgcacgtc ttggctattg gatataagat tttcgcgggt tgatgacata gagcgtgtac 840 tactgtaata gttgtatatt caaaagctgc tgcgtggaga aagactaaaa tagataaaaa 900 gcacacattt tgacttcggt accgtcaact tagtgggaca gtcttttata tttggtgtaa 960 gctcatttct ggtactattc gaaacagaac agtgttttct gtattaccgt ccaatcgttt 1020 gtcatgagtt ttgtattgat tttgtcgtta gtgttcggag gatgttgttc caatgtgatt 1080 agtttcgagc acatggtgca aggcagcaat ataaatttgg gaaatattgt tacattcact 1140 caattcgtgt ctgtgacgct aattcagttg cccaatgctt tggacttctc tcactttccg 1200 tttaggttgc gacctagaca cattcctctt aagatccata tgttagctgt gtttttgttc 1260 tttaccagtt cagtcgccaa taacagtgtg tttaaatttg acatttccgt tccgattcat 1320 attatcatta gattttcagg taccactttg acgatgataa taggttgggc tgtttgtaat 1380 aagaggtact ccaaacttca ggtgcaatct gccatcatta tgacgcttgg tgcgattgtc 1440 gcatcattat accgtgacaa agaattttca atggacagtt taaagttgaa tacggattca 1500 gtgggtatga cccaaaaatc tatgtttggt atctttgttg tgctagtggc cactgccttg 1560 atgtcattgt tgtcgttgct caacgaatgg acgtataaca agtacgggaa acattggaaa 1620 gaaactttgt tctattcgca tttcttggct ctaccgttgt ttatgttggg gtacacaagg 1680 ctcagagacg aattcagaga cctcttaatt tcctcagact caatggatat tcctattgtt 1740 aaattaccaa ttgctacgaa acttttcatg ctaatagcaa ataacgtgac ccagttcatt 1800 tgtatcaaag gtgttaacat gctagctagt aacacggatg ctttgacact ttctgtcgtg 1860 cttctagtgc gtaaatttgt tagtctttta ctcagtgtct acatctacaa gaacgtccta 1920 tccgtgactg catacctagg gaccatcacc gtgttcctgg gagctggttt gtattcatat 1980 ggttcggtca aaactgcact gcctcgctga aacaatccac gtctgtatga tactcgtttc 2040 agaatttttt tgattttctg ccggatatgg tttctcatct ttacaatcgc attcttaatt 2100 ataccagaac gtaattcaat gatcccagtg actcgtaact cttatatgtc aatttaagc 2159 <210> 46 <211> 870 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 5'-Region used for knock out of PpBMT2 <400> 46 ggccgagcgg gcctagattt tcactacaaa tttcaaaact acgcggattt attgtctcag 60 agagcaattt ggcatttctg agcgtagcag gaggcttcat aagattgtat aggaccgtac 120 caacaaattg ccgaggcaca acacggtatg ctgtgcactt atgtggctac ttccctacaa 180 cggaatgaaa ccttcctctt tccgcttaaa cgagaaagtg tgtcgcaatt gaatgcaggt 240 gcctgtgcgc cttggtgtat tgtttttgag ggcccaattt atcaggcgcc ttttttcttg 300 gttgttttcc cttagcctca agcaaggttg gtctatttca tctccgcttc tataccgtgc 360 ctgatactgt tggatgagaa cacgactcaa cttcctgctg ctctgtattg ccagtgtttt 420 gtctgtgatt tggatcggag tcctccttac ttggaatgat aataatcttg gcggaatctc 480 cctaaacgga ggcaaggatt ctgcctatga tgatctgcta tcattgggaa gcttcaacga 540 catggaggtc gactcctatg tcaccaacat ctacgacaat gctccagtgc taggatgtac 600 ggatttgtct tatcatggat tgttgaaagt caccccaaag catgacttag cttgcgattt 660 ggagttcata agagctcaga ttttggacat tgacgtttac tccgccataa aagacttaga 720 agataaagcc ttgactgtaa aacaaaaggt tgaaaaacac tggtttacgt tttatggtag 780 ttcagtcttt ctgcccgaac acgatgtgca ttacctggtt agacgagtca tcttttcggc 840 tgaaggaaag gcgaactctc cagtaacatc 870 <210> 47 <211> 1733 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 3'-Region used for knock out of PpBMT2 <400> 47 ccatatgatg ggtgtttgct cactcgtatg gatcaaaatt ccatggtttc ttctgtacaa 60 cttgtacact tatttggact tttctaacgg tttttctggt gatttgagaa gtccttattt 120 tggtgttcgc agcttatccg tgattgaacc atcagaaata ctgcagctcg ttatctagtt 180 tcagaatgtg ttgtagaata caatcaattc tgagtctagt ttgggtgggt cttggcgacg 240 ggaccgttat atgcatctat gcagtgttaa ggtacataga atgaaaatgt aggggttaat 300 cgaaagcatc gttaatttca gtagaacgta gttctattcc ctacccaaat aatttgccaa 360 gaatgcttcg tatccacata cgcagtggac gtagcaaatt tcactttgga ctgtgacctc 420 aagtcgttat cttctacttg gacattgatg gtcattacgt aatccacaaa gaattggata 480 gcctctcgtt ttatctagtg cacagcctaa tagcacttaa gtaagagcaa tggacaaatt 540 tgcatagaca ttgagctaga tacgtaactc agatcttgtt cactcatggt gtactcgaag 600 tactgctgga accgttacct cttatcattt cgctactggc tcgtgaaact actggatgaa 660 aaaaaaaaaa gagctgaaag cgagatcatc ccattttgtc atcatacaaa ttcacgcttg 720 cagttttgct tcgttaacaa gacaagatgt ctttatcaaa gacccgtttt ttcttcttga 780 agaatacttc cctgttgagc acatgcaaac catatttatc tcagatttca ctcaacttgg 840 gtgcttccaa gagaagtaaa attcttccca ctgcatcaac ttccaagaaa cccgtagacc 900 agtttctctt cagccaaaag aagttgctcg ccgatcaccg cggtaacaga ggagtcagaa 960 ggtttcacac ccttccatcc cgatttcaaa gtcaaagtgc tgcgttgaac caaggttttc 1020 aggttgccaa agcccagtct gcaaaaacta gttccaaatg gcctattaat tcccataaaa 1080 gtgttggcta cgtatgtatc ggtacctcca ttctggtatt tgctattgtt gtcgttggtg 1140 ggttgactag actgaccgaa tccggtcttt ccataacgga gtggaaacct atcactggtt 1200 cggttccccc actgactgag gaagactgga agttggaatt tgaaaaatac aaacaaagcc 1260 ctgagtttca ggaactaaat tctcacataa cattggaaga gttcaagttt atattttcca 1320 tggaatgggg acatagattg ttgggaaggg tcatcggcct gtcgtttgtt cttcccacgt 1380 tttacttcat tgcccgtcga aagtgttcca aagatgttgc attgaaactg cttgcaatat 1440 gctctatgat aggattccaa ggtttcatcg gctggtggat ggtgtattcc ggattggaca 1500 aacagcaatt ggctgaacgt aactccaaac caactgtgtc tccatatcgc ttaactaccc 1560 atcttggaac tgcatttgtt atttactgtt acatgattta cacagggctt caagttttga 1620 agaactataa gatcatgaaa cagcctgaag cgtatgttca aattttcaag caaattgcgt 1680 ctccaaaatt gaaaactttc aagagactct cttcagttct attaggcctg gtg 1733 <210> 48 <211> 981 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes MmSLC35A3 UDP-GlcNAc transporter <400> 48 atgtctgcca acctaaaata tctttccttg ggaattttgg tgtttcagac taccagtctg 60 gttctaacga tgcggtattc taggacttta aaagaggagg ggcctcgtta tctgtcttct 120 acagcagtgg ttgtggctga atttttgaag ataatggcct gcatcttttt agtctacaaa 180 gacagtaagt gtagtgtgag agcactgaat agagtactgc atgatgaaat tcttaataag 240 cccatggaaa ccctgaagct cgctatcccg tcagggatat atactcttca gaacaactta 300 ctctatgtgg cactgtcaaa cctagatgca gccacttacc aggttacata tcagttgaaa 360 atacttacaa cagcattatt ttctgtgtct atgcttggta aaaaattagg tgtgtaccag 420 tggctctccc tagtaattct gatggcagga gttgcttttg tacagtggcc ttcagattct 480 caagagctga actctaagga cctttcaaca ggctcacagt ttgtaggcct catggcagtt 540 ctcacagcct gtttttcaag tggctttgct ggagtttatt ttgagaaaat cttaaaagaa 600 acaaaacagt cagtatggat aaggaacatt caacttggtt tctttggaag tatatttgga 660 ttaatgggtg tatacgttta tgatggagaa ttggtctcaa agaatggatt ttttcaggga 720 tataatcaac tgacgtggat agttgttgct ctgcaggcac ttggaggcct tgtaatagct 780 gctgtcatca aatatgcaga taacatttta aaaggatttg cgacctcctt atccataata 840 ttgtcaacaa taatatctta tttttggttg caagattttg tgccaaccag tgtctttttc 900 cttggagcca tccttgtaat agcagctact ttcttgtatg gttacgatcc caaacctgca 960 ggaaatccca ctaaagcata g 981 <210> 49 <211> 1128 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 5'-Region used for knock out of PpMNN4L1 <400> 49 gatctggcca ttgtgaaact tgacactaaa gacaaaactc ttagagtttc caatcactta 60 ggagacgatg tttcctacaa cgagtacgat ccctcattga tcatgagcaa tttgtatgtg 120 aaaaaagtca tcgaccttga caccttggat aaaagggctg gaggaggtgg aaccacctgt 180 gcaggcggtc tgaaagtgtt caagtacgga tctactacca aatatacatc tggtaacctg 240 aacggcgtca ggttagtata ctggaacgaa ggaaagttgc aaagctccaa atttgtggtt 300 cgatcctcta attactctca aaagcttgga ggaaacagca acgccgaatc aattgacaac 360 aatggtgtgg gttttgcctc agctggagac tcaggcgcat ggattctttc caagctacaa 420 gatgttaggg agtaccagtc attcactgaa aagctaggtg aagctacgat gagcattttc 480 gatttccacg gtcttaaaca ggagacttct actacagggc ttggggtagt tggtatgatt 540 cattcttacg acggtgagtt caaacagttt ggtttgttca ctccaatgac atctattcta 600 caaagacttc aacgagtgac caatgtagaa tggtgtgtag cgggttgcga agatggggat 660 gtggacactg aaggagaaca cgaattgagt gatttggaac aactgcatat gcatagtgat 720 tccgactagt caggcaagag agagccctca aatttacctc tctgcccctc ctcactcctt 780 ttggtacgca taattgcagt ataaagaact tgctgccagc cagtaatctt atttcatacg 840 cagttctata tagcacataa tcttgcttgt atgtatgaaa tttaccgcgt tttagttgaa 900 attgtttatg ttgtgtgcct tgcatgaaat ctctcgttag ccctatcctt acatttaact 960 ggtctcaaaa cctctaccaa ttccattgct gtacaacaat atgaggcggc attactgtag 1020 ggttggaaaa aaattgtcat tccagctaga gatcacacga cttcatcacg cttattgctc 1080 ctcattgcta aatcatttac tcttgacttc gacccagaaa agttcgcc 1128 <210> 50 <211> 1231 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 3'-Region used for knock out of PpMNN4L1 <400> 50 gcatgtcaaa cttgaacaca acgactagat agttgttttt tctatataaa acgaaacgtt 60 atcatcttta ataatcattg aggtttaccc ttatagttcc gtattttcgt ttccaaactt 120 agtaatcttt tggaaatatc atcaaagctg gtgccaatct tcttgtttga agtttcaaac 180 tgctccacca agctacttag agactgttct aggtctgaag caacttcgaa cacagagaca 240 gctgccgccg attgttcttt tttgtgtttt tcttctggaa gaggggcatc atcttgtatg 300 tccaatgccc gtatcctttc tgagttgtcc gacacattgt ccttcgaaga gtttcctgac 360 attgggcttc ttctatccgt gtattaattt tgggttaagt tcctcgtttg catagcagtg 420 gatacctcga tttttttggc tcctatttac ctgacataat attctactat aatccaactt 480 ggacgcgtca tctatgataa ctaggctctc ctttgttcaa aggggacgtc ttcataatcc 540 actggcacga agtaagtctg caacgaggcg gcttttgcaa cagaacgata gtgtcgtttc 600 gtacttggac tatgctaaac aaaaggatct gtcaaacatt tcaaccgtgt ttcaaggcac 660 tctttacgaa ttatcgacca agaccttcct agacgaacat ttcaacatat ccaggctact 720 gcttcaaggt ggtgcaaatg ataaaggtat agatattaga tgtgtttggg acctaaaaca 780 gttcttgcct gaagattccc ttgagcaaca ggcttcaata gccaagttag agaagcagta 840 ccaaatcggt aacaaaaggg ggaagcatat aaaaccttta ctattgcgac aaaatccatc 900 cttgaaagta aagctgtttg ttcaatgtaa agcatacgaa acgaaggagg tagatcctaa 960 gatggttaga gaacttaacg ggacatactc cagctgcatc ccatattacg atcgctggaa 1020 gacttttttc atgtacgtat cgcccaccaa cctttcaaag caagctaggt atgattttga 1080 cagttctcac aatccattgg ttttcatgca acttgaaaaa acccaactca aacttcatgg 1140 ggatccatac aatgtaaatc attacgagag ggcgaggttg aaaagtttcc attgcaatca 1200 cgtcgcatca tggctactga aaggccttaa c 1231 <210> 51 <211> 937 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 5'-Region used for knock out of PpPNO1 and PpMNN4 <400> 51 tcattctata tgttcaagaa aagggtagtg aaaggaaaga aaaggcatat aggcgaggga 60 gagttagcta gcatacaaga taatgaagga tcaatagcgg tagttaaagt gcacaagaaa 120 agagcacctg ttgaggctga tgataaagct ccaattacat tgccacagag aaacacagta 180 acagaaatag gaggggatgc accacgagaa gagcattcag tgaacaactt tgccaaattc 240 ataaccccaa gcgctaataa gccaatgtca aagtcggcta ctaacattaa tagtacaaca 300 actatcgatt ttcaaccaga tgtttgcaag gactacaaac agacaggtta ctgcggatat 360 ggtgacactt gtaagttttt gcacctgagg gatgatttca aacagggatg gaaattagat 420 agggagtggg aaaatgtcca aaagaagaag cataatactc tcaaaggggt taaggagatc 480 caaatgttta atgaagatga gctcaaagat atcccgttta aatgcattat atgcaaagga 540 gattacaaat cacccgtgaa aacttcttgc aatcattatt tttgcgaaca atgtttcctg 600 caacggtcaa gaagaaaacc aaattgtatt atatgtggca gagacacttt aggagttgct 660 ttaccagcaa agaagttgtc ccaatttctg gctaagatac ataataatga aagtaataaa 720 gtttagtaat tgcattgcgt tgactattga ttgcattgat gtcgtgtgat actttcaccg 780 aaaaaaaaca cgaagcgcaa taggagcggt tgcatattag tccccaaagc tatttaattg 840 tgcctgaaac tgttttttaa gctcatcaag cataattgta tgcattgcga cgtaaccaac 900 gtttaggcgc agtttaatca tagcccactg ctaagcc 937 <210> 52 <211> 1906 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 3'-Region used for knock out of PpPNO1 and PpMNN4 <400> 52 cggaggaatg caaataataa tctccttaat tacccactga taagctcaag agacgcggtt 60 tgaaaacgat ataatgaatc atttggattt tataataaac cctgacagtt tttccactgt 120 attgttttaa cactcattgg aagctgtatt gattctaaga agctagaaat caatacggcc 180 atacaaaaga tgacattgaa taagcaccgg cttttttgat tagcatatac cttaaagcat 240 gcattcatgg ctacatagtt gttaaagggc ttcttccatt atcagtataa tgaattacat 300 aatcatgcac ttatatttgc ccatctctgt tctctcactc ttgcctgggt atattctatg 360 aaattgcgta tagcgtgtct ccagttgaac cccaagcttg gcgagtttga agagaatgct 420 aaccttgcgt attccttgct tcaggaaaca ttcaaggaga aacaggtcaa gaagccaaac 480 attttgatcc ttcccgagtt agcattgact ggctacaatt ttcaaagcca gcagcggata 540 gagccttttt tggaggaaac aaccaaggga gctagtaccc aatgggctca aaaagtatcc 600 aagacgtggg attgctttac tttaatagga tacccagaaa aaagtttaga gagccctccc 660 cgtatttaca acagtgcggt acttgtatcg cctcagggaa aagtaatgaa caactacaga 720 aagtccttct tgtatgaagc tgatgaacat tggggatgtt cggaatcttc tgatgggttt 780 caaacagtag atttattaat tgaaggaaag actgtaaaga catcatttgg aatttgcatg 840 gatttgaatc cttataaatt tgaagctcca ttcacagact tcgagttcag tggccattgc 900 ttgaaaaccg gtacaagact cattttgtgc ccaatggcct ggttgtcccc tctatcgcct 960 tccattaaaa aggatcttag tgatatagag aaaagcagac ttcaaaagtt ctaccttgaa 1020 aaaatagata ccccggaatt tgacgttaat tacgaattga aaaaagatga agtattgccc 1080 acccgtatga atgaaacgtt ggaaacaatt gactttgagc cttcaaaacc ggactactct 1140 aatataaatt attggatact aaggtttttt ccctttctga ctcatgtcta taaacgagat 1200 gtgctcaaag agaatgcagt tgcagtctta tgcaaccgag ttggcattga gagtgatgtc 1260 ttgtacggag gatcaaccac gattctaaac ttcaatggta agttagcatc gacacaagag 1320 gagctggagt tgtacgggca gactaatagt ctcaacccca gtgtggaagt attgggggcc 1380 cttggcatgg gtcaacaggg aattctagta cgagacattg aattaacata atatacaata 1440 tacaataaac acaaataaag aatacaagcc tgacaaaaat tcacaaatta ttgcctagac 1500 ttgtcgttat cagcagcgac ctttttccaa tgctcaattt cacgatatgc cttttctagc 1560 tctgctttaa gcttctcatt ggaattggct aactcgttga ctgcttggtc agtgatgagt 1620 ttctccaagg tccatttctc gatgttgttg ttttcgtttt cctttaatct cttgatataa 1680 tcaacagcct tctttaatat ctgagccttg ttcgagtccc ctgttggcaa cagagcggcc 1740 agttccttta ttccgtggtt tatattttct cttctacgcc tttctacttc tttgtgattc 1800 tctttacgca tcttatgcca ttcttcagaa ccagtggctg gcttaaccga atagccagag 1860 cctgaagaag ccgcactaga agaagcagtg gcattgttga ctatgg 1906 <210> 53 <211> 1224 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes human GnTI catalytic domain (NA) Codon-optimized <400> 53 tcagtcagtg ctcttgatgg tgacccagca agtttgacca gagaagtgat tagattggcc 60 caagacgcag aggtggagtt ggagagacaa cgtggactgc tgcagcaaat cggagatgca 120 ttgtctagtc aaagaggtag ggtgcctacc gcagctcctc cagcacagcc tagagtgcat 180 gtgacccctg caccagctgt gattcctatc ttggtcatcg cctgtgacag atctactgtt 240 agaagatgtc tggacaagct gttgcattac agaccatctg ctgagttgtt ccctatcatc 300 gttagtcaag actgtggtca cgaggagact gcccaagcca tcgcctccta cggatctgct 360 gtcactcaca tcagacagcc tgacctgtca tctattgctg tgccaccaga ccacagaaag 420 ttccaaggtt actacaagat cgctagacac tacagatggg cattgggtca agtcttcaga 480 cagtttagat tccctgctgc tgtggtggtg gaggatgact tggaggtggc tcctgacttc 540 tttgagtact ttagagcaac ctatccattg ctgaaggcag acccatccct gtggtgtgtc 600 tctgcctgga atgacaacgg taaggagcaa atggtggacg cttctaggcc tgagctgttg 660 tacagaaccg acttctttcc tggtctggga tggttgctgt tggctgagtt gtgggctgag 720 ttggagccta agtggccaaa ggcattctgg gacgactgga tgagaagacc tgagcaaaga 780 cagggtagag cctgtatcag acctgagatc tcaagaacca tgacctttgg tagaaaggga 840 gtgtctcacg gtcaattctt tgaccaacac ttgaagttta tcaagctgaa ccagcaattt 900 gtgcacttca cccaactgga cctgtcttac ttgcagagag aggcctatga cagagatttc 960 ctagctagag tctacggagc tcctcaactg caagtggaga aagtgaggac caatgacaga 1020 aaggagttgg gagaggtgag agtgcagtac actggtaggg actcctttaa ggctttcgct 1080 aaggctctgg gtgtcatgga tgaccttaag tctggagttc ctagagctgg ttacagaggt 1140 attgtcacct ttcaattcag aggtagaaga gtccacttgg ctcctccacc tacttgggag 1200 ggttatgatc cttcttggaa ttag 1224 <210> 54 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes Pp SEC12 (10) <400> 54 atgcccagaa aaatatttaa ctacttcatt ttgactgtat tcatggcaat tcttgctatt 60 gttttacaat ggtctataga gaatggacat gggcgcgcc 99 <210> 55 <211> 435 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the PpSEC4 promoter <400> 55 gaagtaaagt tggcgaaact ttgggaacct ttggttaaaa ctttgtaatt tttgtcgcta 60 cccattaggc agaatctgca tcttgggagg gggatgtggt ggcgttctga gatgtacgcg 120 aagaatgaag agccagtggt aacaacaggc ctagagagat acgggcataa tgggtataac 180 ctacaagtta agaatgtagc agccctggaa accagattga aacgaaaaac gaaatcattt 240 aaactgtagg atgttttggc tcattgtctg gaaggctggc tgtttattgc cctgttcttt 300 gcatgggaat aagctattat atccctcaca taatcccaga aaatagattg aagcaacgcg 360 aaatccttac gtatcgaagt agccttctta cacattcacg ttgtacggat aagaaaacta 420 ctcaaacgaa caatc 435 <210> 56 <211> 404 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the PpOCH1 terminator <400> 56 aatagatata gcgagattag agaatgaata ccttcttcta agcgatcgtc cgtcatcata 60 gaatatcatg gactgtatag tttttttttt gtacatataa tgattaaacg gtcatccaac 120 atctcgttga cagatctctc agtacgcgaa atccctgact atcaaagcaa gaaccgatga 180 agaaaaaaac aacagtaacc caaacaccac aacaaacact ttatcttctc ccccccaaca 240 ccaatcatca aagagatgtc ggaacacaaa caccaagaag caaaaactaa ccccatataa 300 aaacatcctg gtagataatg ctggtaaccc gctctccttc catattctgg gctacttcac 360 gaagtctgac cggtctcagt tgatcaacat gatcctcgaa atgg 404 <210> 57 <211> 1407 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes Mm ManI catalytic domain (FB) <400> 57 gagcccgctg acgccaccat ccgtgagaag agggcaaaga tcaaagagat gatgacccat 60 gcttggaata attataaacg ctatgcgtgg ggcttgaacg aactgaaacc tatatcaaaa 120 gaaggccatt caagcagttt gtttggcaac atcaaaggag ctacaatagt agatgccctg 180 gatacccttt tcattatggg catgaagact gaatttcaag aagctaaatc gtggattaaa 240 aaatatttag attttaatgt gaatgctgaa gtttctgttt ttgaagtcaa catacgcttc 300 gtcggtggac tgctgtcagc ctactatttg tccggagagg agatatttcg aaagaaagca 360 gtggaacttg gggtaaaatt gctacctgca tttcatactc cctctggaat accttgggca 420 ttgctgaata tgaaaagtgg gatcgggcgg aactggccct gggcctctgg aggcagcagt 480 atcctggccg aatttggaac tctgcattta gagtttatgc acttgtccca cttatcagga 540 gacccagtct ttgccgaaaa ggttatgaaa attcgaacag tgttgaacaa actggacaaa 600 ccagaaggcc tttatcctaa ctatctgaac cccagtagtg gacagtgggg tcaacatcat 660 gtgtcggttg gaggacttgg agacagcttt tatgaatatt tgcttaaggc gtggttaatg 720 tctgacaaga cagatctcga agccaagaag atgtattttg atgctgttca ggccatcgag 780 actcacttga tccgcaagtc aagtggggga ctaacgtaca tcgcagagtg gaaggggggc 840 ctcctggaac acaagatggg ccacctgacg tgctttgcag gaggcatgtt tgcacttggg 900 gcagatggag ctccggaagc ccgggcccaa cactaccttg aactcggagc tgaaattgcc 960 cgcacttgtc atgaatctta taatcgtaca tatgtgaagt tgggaccgga agcgtttcga 1020 tttgatggcg gtgtggaagc tattgccacg aggcaaaatg aaaagtatta catcttacgg 1080 cccgaggtca tcgagacata catgtacatg tggcgactga ctcacgaccc caagtacagg 1140 acctgggcct gggaagccgt ggaggctcta gaaagtcact gcagagtgaa cggaggctac 1200 tcaggcttac gggatgttta cattgcccgt gagagttatg acgatgtcca gcaaagtttc 1260 ttcctggcag agacactgaa gtatttgtac ttgatatttt ccgatgatga ccttcttcca 1320 ctagaacact ggatcttcaa caccgaggct catcctttcc ctatactccg tgaacagaag 1380 aaggaaattg atggcaaaga gaaatga 1407 <210> 58 <211> 318 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes ScSEC12 (8) <400> 58 atgaacacta tccacataat aaaattaccg cttaactacg ccaactacac ctcaatgaaa 60 caaaaaatct ctaaattttt caccaacttc atccttattg tgctgctttc ttacatttta 120 cagttctcct ataagcacaa tttgcattcc atgcttttca attacgcgaa ggacaatttt 180 ctaacgaaaa gagacaccat ctcttcgccc tacgtagttg atgaagactt acatcaaaca 240 actttgtttg gcaaccacgg tacaaaaaca tctgtaccta gcgtagattc cataaaagtg 300 catggcgtgg ggcgcgcc 318 <210> 59 <211> 1250 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 5'-region that was used to knock into the PpADE1 locus <400> 59 gagtcggcca agagatgata actgttacta agcttctccg taattagtgg tattttgtaa 60 cttttaccaa taatcgttta tgaatacgga tatttttcga ccttatccag tgccaaatca 120 cgtaacttaa tcatggttta aatactccac ttgaacgatt cattattcag aaaaaagtca 180 ggttggcaga aacacttggg cgctttgaag agtataagag tattaagcat taaacatctg 240 aactttcacc gccccaatat actactctag gaaactcgaa aaattccttt ccatgtgtca 300 tcgcttccaa cacactttgc tgtatccttc caagtatgtc cattgtgaac actgatctgg 360 acggaatcct acctttaatc gccaaaggaa aggttagaga catttatgca gtcgatgaga 420 acaacttgct gttcgtcgca actgaccgta tctccgctta cgatgtgatt atgacaaacg 480 gtattcctga taagggaaag attttgactc agctctcagt tttctggttt gattttttgg 540 caccctacat aaagaatcat ttggttgctt ctaatgacaa ggaagtcttt gctttactac 600 catcaaaact gtctgaagaa aaatacaaat ctcaattaga gggacgatcc ttgatagtaa 660 aaaagcacag actgatacct ttggaagcca ttgtcagagg ttacatcact ggaagtgcat 720 ggaaagagta caagaactca aaaactgtcc atggagtcaa ggttgaaaac gagaaccttc 780 aagagagcga cgcctttcca actccgattt tcacaccttc aacgaaagct gaacagggtg 840 aacacgatga aaacatctct attgaacaag ctgctgagat tgtaggtaaa gacatttgtg 900 agaaggtcgc tgtcaaggcg gtcgagttgt attctgctgc aaaaaacctc gcccttttga 960 aggggatcat tattgctgat acgaaattcg aatttggact ggacgaaaac aatgaattgg 1020 tactagtaga tgaagtttta actccagatt cttctagatt ttggaatcaa aagacttacc 1080 aagtgggtaa atcgcaagag agttacgata agcagtttct cagagattgg ttgacggcca 1140 acggattgaa tggcaaagag ggcgtagcca tggatgcaga aattgctatc aagagtaaag 1200 aaaagtatat tgaagcttat gaagcaatta ctggcaagaa atgggcttga 1250 <210> 60 <211> 882 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 3'-region that was used to knock into the PpADE1 locus <400> 60 atgattagta ccctcctcgc ctttttcaga catctgaaat ttcccttatt cttccaattc 60 catataaaat cctatttagg taattagtaa acaatgatca taaagtgaaa tcattcaagt 120 aaccattccg tttatcgttg atttaaaatc aataacgaat gaatgtcggt ctgagtagtc 180 aatttgttgc cttggagctc attggcaggg ggtcttttgg ctcagtatgg aaggttgaaa 240 ggaaaacaga tggaaagtgg ttcgtcagaa aagaggtatc ctacatgaag atgaatgcca 300 aagagatatc tcaagtgata gctgagttca gaattcttag tgagttaagc catcccaaca 360 ttgtgaagta ccttcatcac gaacatattt ctgagaataa aactgtcaat ttatacatgg 420 aatactgtga tggtggagat ctctccaagc tgattcgaac acatagaagg aacaaagagt 480 acatttcaga agaaaaaata tggagtattt ttacgcaggt tttattagca ttgtatcgtt 540 gtcattatgg aactgatttc acggcttcaa aggagtttga atcgctcaat aaaggtaata 600 gacgaaccca gaatccttcg tgggtagact cgacaagagt tattattcac agggatataa 660 aacccgacaa catctttctg atgaacaatt caaaccttgt caaactggga gattttggat 720 tagcaaaaat tctggaccaa gaaaacgatt ttgccaaaac atacgtcggt acgccgtatt 780 acatgtctcc tgaagtgctg ttggaccaac cctactcacc attatgtgat atatggtctc 840 ttgggtgcgt catgtatgag ctatgtgcat tgaggcctcc tt 882 <210> 61 <211> 2100 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes ScGAL10 <400> 61 atgacagctc agttacaaag tgaaagtact tctaaaattg ttttggttac aggtggtgct 60 ggatacattg gttcacacac tgtggtagag ctaattgaga atggatatga ctgtgttgtt 120 gctgataacc tgtcgaattc aacttatgat tctgtagcca ggttagaggt cttgaccaag 180 catcacattc ccttctatga ggttgatttg tgtgaccgaa aaggtctgga aaaggttttc 240 aaagaatata aaattgattc ggtaattcac tttgctggtt taaaggctgt aggtgaatct 300 acacaaatcc cgctgagata ctatcacaat aacattttgg gaactgtcgt tttattagag 360 ttaatgcaac aatacaacgt ttccaaattt gttttttcat cttctgctac tgtctatggt 420 gatgctacga gattcccaaa tatgattcct atcccagaag aatgtccctt agggcctact 480 aatccgtatg gtcatacgaa atacgccatt gagaatatct tgaatgatct ttacaatagc 540 gacaaaaaaa gttggaagtt tgctatcttg cgttatttta acccaattgg cgcacatccc 600 tctggattaa tcggagaaga tccgctaggt ataccaaaca atttgttgcc atatatggct 660 caagtagctg ttggtaggcg cgagaagctt tacatcttcg gagacgatta tgattccaga 720 gatggtaccc cgatcaggga ttatatccac gtagttgatc tagcaaaagg tcatattgca 780 gccctgcaat acctagaggc ctacaatgaa aatgaaggtt tgtgtcgtga gtggaacttg 840 ggttccggta aaggttctac agtttttgaa gtttatcatg cattctgcaa agcttctggt 900 attgatcttc catacaaagt tacgggcaga agagcaggtg atgttttgaa cttgacggct 960 aaaccagata gggccaaacg cgaactgaaa tggcagaccg agttgcaggt tgaagactcc 1020 tgcaaggatt tatggaaatg gactactgag aatccttttg gttaccagtt aaggggtgtc 1080 gaggccagat tttccgctga agatatgcgt tatgacgcaa gatttgtgac tattggtgcc 1140 ggcaccagat ttcaagccac gtttgccaat ttgggcgcca gcattgttga cctgaaagtg 1200 aacggacaat cagttgttct tggctatgaa aatgaggaag ggtatttgaa tcctgatagt 1260 gcttatatag gcgccacgat cggcaggtat gctaatcgta tttcgaaggg taagtttagt 1320 ttatgcaaca aagactatca gttaaccgtt aataacggcg ttaatgcgaa tcatagtagt 1380 atcggttctt tccacagaaa aagatttttg ggacccatca ttcaaaatcc ttcaaaggat 1440 gtttttaccg ccgagtacat gctgatagat aatgagaagg acaccgaatt tccaggtgat 1500 ctattggtaa ccatacagta tactgtgaac gttgcccaaa aaagtttgga aatggtatat 1560 aaaggtaaat tgactgctgg tgaagcgacg ccaataaatt taacaaatca tagttatttc 1620 aatctgaaca agccatatgg agacactatt gagggtacgg agattatggt gcgttcaaaa 1680 aaatctgttg atgtcgacaa aaacatgatt cctacgggta atatcgtcga tagagaaatt 1740 gctaccttta actctacaaa gccaacggtc ttaggcccca aaaatcccca gtttgattgt 1800 tgttttgtgg tggatgaaaa tgctaagcca agtcaaatca atactctaaa caatgaattg 1860 acgcttattg tcaaggcttt tcatcccgat tccaatatta cattagaagt tttaagtaca 1920 gagccaactt atcaatttta taccggtgat ttcttgtctg ctggttacga agcaagacaa 1980 ggttttgcaa ttgagcctgg tagatacatt gatgctatca atcaagagaa ctggaaagat 2040 tgtgtaacct tgaaaaacgg tgaaacttac gggtccaaga ttgtctacag attttcctga 2100 <210> 62 <211> 512 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the PpPMA1 terminator <400> 62 taagcttcac gatttgtgtt ccagtttatc ccccctttat ataccgttaa ccctttccct 60 gttgagctga ctgttgttgt attaccgcaa tttttccaag tttgccatgc ttttcgtgtt 120 atttgaccga tgtctttttt cccaaatcaa actatatttg ttaccattta aaccaagtta 180 tcttttgtat taagagtcta agtttgttcc caggcttcat gtgagagtga taaccatcca 240 gactatgatt cttgtttttt attgggtttg tttgtgtgat acatctgagt tgtgattcgt 300 aaagtatgtc agtctatcta gatttttaat agttaattgg taatcaatga cttgtttgtt 360 ttaactttta aattgtgggt cgtatccacg cgtttagtat agctgttcat ggctgttaga 420 ggagggcgat gtttatatac agaggacaag aatgaggagg cggcgtgtat ttttaaaatg 480 gagacgcgac tcctgtacac cttatcggtt gg 512 <210> 63 <211> 1068 <212> DNA <213> Artificial Sequence <220> <223> hGalT codon optimized (XB) <400> 63 ggtagagatt tgtctagatt gccacagttg gttggtgttt ccactccatt gcaaggaggt 60 tctaactctg ctgctgctat tggtcaatct tccggtgagt tgagaactgg tggagctaga 120 ccacctccac cattgggagc ttcctctcaa ccaagaccag gtggtgattc ttctccagtt 180 gttgactctg gtccaggtcc agcttctaac ttgacttccg ttccagttcc acacactact 240 gctttgtcct tgccagcttg tccagaagaa tccccattgt tggttggtcc aatgttgatc 300 gagttcaaca tgccagttga cttggagttg gttgctaagc agaacccaaa cgttaagatg 360 ggtggtagat acgctccaag agactgtgtt tccccacaca aagttgctat catcatccca 420 ttcagaaaca gacaggagca cttgaagtac tggttgtact acttgcaccc agttttgcaa 480 agacagcagt tggactacgg tatctacgtt atcaaccagg ctggtgacac tattttcaac 540 agagctaagt tgttgaatgt tggtttccag gaggctttga aggattacga ctacacttgt 600 ttcgttttct ccgacgttga cttgattcca atgaacgacc acaacgctta cagatgtttc 660 tcccagccaa gacacatttc tgttgctatg gacaagttcg gtttctcctt gccatacgtt 720 caatacttcg gtggtgtttc cgctttgtcc aagcagcagt tcttgactat caacggtttc 780 ccaaacaatt actggggatg gggtggtgaa gatgacgaca tctttaacag attggttttc 840 agaggaatgt ccatctctag accaaacgct gttgttggta gatgtagaat gatcagacac 900 tccagagaca agaagaacga gccaaaccca caaagattcg acagaatcgc tcacactaag 960 gaaactatgt tgtccgacgg attgaactcc ttgacttacc aggttttgga cgttcagaga 1020 tacccattgt acactcagat cactgttgac atcggtactc catcctag 1068 <210> 64 <211> 183 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes ScMnt1 (Kre2) (33) <400> 64 atggccctct ttctcagtaa gagactgttg agatttaccg tcattgcagg tgcggttatt 60 gttctcctcc taacattgaa ttccaacagt agaactcagc aatatattcc gagttccatc 120 tccgctgcat ttgattttac ctcaggatct atatcccctg aacaacaagt catcgggcgc 180 gcc 183 <210> 65 <211> 1074 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes DmUGT <400> 65 atgaatagca tacacatgaa cgccaatacg ctgaagtaca tcagcctgct gacgctgacc 60 ctgcagaatg ccatcctggg cctcagcatg cgctacgccc gcacccggcc aggcgacatc 120 ttcctcagct ccacggccgt actcatggca gagttcgcca aactgatcac gtgcctgttc 180 ctggtcttca acgaggaggg caaggatgcc cagaagtttg tacgctcgct gcacaagacc 240 atcattgcga atcccatgga cacgctgaag gtgtgcgtcc cctcgctggt ctatatcgtt 300 caaaacaatc tgctgtacgt ctctgcctcc catttggatg cggccaccta ccaggtgacg 360 taccagctga agattctcac cacggccatg ttcgcggttg tcattctgcg ccgcaagctg 420 ctgaacacgc agtggggtgc gctgctgctc ctggtgatgg gcatcgtcct ggtgcagttg 480 gcccaaacgg agggtccgac gagtggctca gccggtggtg ccgcagctgc agccacggcc 540 gcctcctctg gcggtgctcc cgagcagaac aggatgctcg gactgtgggc cgcactgggc 600 gcctgcttcc tctccggatt cgcgggcatc tactttgaga agatcctcaa gggtgccgag 660 atctccgtgt ggatgcggaa tgtgcagttg agtctgctca gcattccctt cggcctgctc 720 acctgtttcg ttaacgacgg cagtaggatc ttcgaccagg gattcttcaa gggctacgat 780 ctgtttgtct ggtacctggt cctgctgcag gccggcggtg gattgatcgt tgccgtggtg 840 gtcaagtacg cggataacat tctcaagggc ttcgccacct cgctggccat catcatctcg 900 tgcgtggcct ccatatacat cttcgacttc aatctcacgc tgcagttcag cttcggagct 960 ggcctggtca tcgcctccat atttctctac ggctacgatc cggccaggtc ggcgccgaag 1020 ccaactatgc atggtcctgg cggcgatgag gagaagctgc tgccgcgcgt ctag 1074 <210> 66 <211> 798 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the PpOCH1 promoter <400> 66 tggacacagg agactcagaa acagacacag agcgttctga gtcctggtgc tcctgacgta 60 ggcctagaac aggaattatt ggctttattt gtttgtccat ttcataggct tggggtaata 120 gatagatgac agagaaatag agaagaccta atattttttg ttcatggcaa atcgcgggtt 180 cgcggtcggg tcacacacgg agaagtaatg agaagagctg gtaatctggg gtaaaagggt 240 tcaaaagaag gtcgcctggt agggatgcaa tacaaggttg tcttggagtt tacattgacc 300 agatgatttg gctttttctc tgttcaattc acatttttca gcgagaatcg gattgacgga 360 gaaatggcgg ggtgtggggt ggatagatgg cagaaatgct cgcaatcacc gcgaaagaaa 420 gactttatgg aatagaacta ctgggtggtg taaggattac atagctagtc caatggagtc 480 cgttggaaag gtaagaagaa gctaaaaccg gctaagtaac tagggaagaa tgatcagact 540 ttgatttgat gaggtctgaa aatactctgc tgctttttca gttgcttttt ccctgcaacc 600 tatcattttc cttttcataa gcctgccttt tctgttttca cttatatgag ttccgccgag 660 acttccccaa attctctcct ggaacattct ctatcgctct ccttccaagt tgcgccccct 720 ggcactgcct agtaatatta ccacgcgact tatattcagt tccacaattt ccagtgttcg 780 tagcaaatat catcagcc 798 <210> 67 <211> 302 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the PpALG12 terminator <400> 67 aatatatacc tcatttgttc aatttggtgt aaagagtgtg gcggatagac ttcttgtaaa 60 tcaggaaagc tacaattcca attgctgcaa aaaataccaa tgcccataaa ccagtatgag 120 cggtgccttc gacggattgc ttactttccg accctttgtc gtttgattct tctgcctttg 180 gtgagtcagt ttgtttcgac tttatatctg actcatcaac ttcctttacg gttgcgtttt 240 taatcataat tttagccgtt ggcttattat cccttgagtt ggtaggagtt ttgatgatgc 300 tg 302 <210> 68 <211> 461 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 5'-Region used for knock out of PpHIS1 <400> 68 taactggccc tttgacgttt ctgacaatag ttctagagga gtcgtccaaa aactcaactc 60 tgacttgggt gacaccacca cgggatccgg ttcttccgag gaccttgatg accttggcta 120 atgtaactgg agttttagta tccattttaa gatgtgtgtt tctgtaggtt ctgggttgga 180 aaaaaatttt agacaccaga agagaggagt gaactggttt gcgtgggttt agactgtgta 240 aggcactact ctgtcgaagt tttagatagg ggttacccgc tccgatgcat gggaagcgat 300 tagcccggct gttgcccgtt tggtttttga agggtaattt tcaatatctc tgtttgagtc 360 atcaatttca tattcaaaga ttcaaaaaca aaatctggtc caaggagcgc atttaggatt 420 atggagttgg cgaatcactt gaacgataga ctattatttg c 461 <210> 69 <211> 1841 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 3'-Region used for knock out of PpHIS1 <400> 69 gtgacattct tgtctttgag atcagtaatt gtagagcata gatagaataa tattcaagac 60 caacggcttc tcttcggaag ctccaagtag cttatagtga tgagtaccgg catatattta 120 taggcttaaa atttcgaggg ttcactatat tcgtttagtg ggaagagttc ctttcactct 180 tgttatctat attgtcagcg tggactgttt ataactgtac caacttagtt tctttcaact 240 ccaggttaag agacataaat gtcctttgat gctgacaata atcagtggaa ttcaaggaag 300 gacaatcccg acctcaatct gttcattaat gaagagttcg aatcgtcctt aaatcaagcg 360 ctagactcaa ttgtcaatga gaaccctttc tttgaccaag aaactataaa tagatcgaat 420 gacaaagttg gaaatgagtc cattagctta catgatattg agcaggcaga ccaaaataaa 480 ccgtcctttg agagcgatat tgatggttcg gcgccgttga taagagacga caaattgcca 540 aagaaacaaa gctgggggct gagcaatttt ttttcaagaa gaaatagcat atgtttacca 600 ctacatgaaa atgattcaag tgttgttaag accgaaagat ctattgcagt gggaacaccc 660 catcttcaat actgcttcaa tggaatctcc aatgccaagt acaatgcatt tacctttttc 720 ccagtcatcc tatacgagca attcaaattt tttttcaatt tatactttac tttagtggct 780 ctctctcaag cgataccgca acttcgcatt ggatatcttt cttcgtatgt cgtcccactt 840 ttgtttgtac tcatagtgac catgtcaaaa gaggcgatgg atgatattca acgccgaaga 900 agggatagag aacagaacaa tgaaccatat gaggttctgt ccagcccatc accagttttg 960 tccaaaaact taaaatgtgg tcacttggtt cgattgcata agggaatgag agtgcccgca 1020 gatatggttc ttgtccagtc aagcgaatcc accggagagt catttatcaa gacagatcag 1080 ctggatggtg agactgattg gaagcttcgg attgtttctc cagttacaca atcgttacca 1140 atgactgaac ttcaaaatgt cgccatcact gcaagcgcac cctcaaaatc aattcactcc 1200 tttcttggaa gattgaccta caatgggcaa tcatatggtc ttacgataga caacacaatg 1260 tggtgtaata ctgtattagc ttctggttca gcaattggtt gtataattta cacaggtaaa 1320 gatactcgac aatcgatgaa cacaactcag cccaaactga aaacgggctt gttagaactg 1380 gaaatcaata gtttgtccaa gatcttatgt gtttgtgtgt ttgcattatc tgtcatctta 1440 gtgctattcc aaggaatagc tgatgattgg tacgtcgata tcatgcggtt tctcattcta 1500 ttctccacta ttatcccagt gtctctgaga gttaaccttg atcttggaaa gtcagtccat 1560 gctcatcaaa tagaaactga tagctcaata cctgaaaccg ttgttagaac tagtacaata 1620 ccggaagacc tgggaagaat tgaataccta ttaagtgaca aaactggaac tcttactcaa 1680 aatgatatgg aaatgaaaaa actacaccta ggaacagtct cttatgctgg tgataccatg 1740 gatattattt ctgatcatgt taaaggtctt aataacgcta aaacatcgag gaaagatctt 1800 ggtatgagaa taagagattt ggttacaact ctggccatct g 1841 <210> 70 <211> 3105 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes Drosophila melanogaster ManII codon-optimized (KD) <400> 70 agagacgatc caattagacc tccattgaag gttgctagat ccccaagacc aggtcaatgt 60 caagatgttg ttcaggacgt cccaaacgtt gatgtccaga tgttggagtt gtacgataga 120 atgtccttca aggacattga tggtggtgtt tggaagcagg gttggaacat taagtacgat 180 ccattgaagt acaacgctca tcacaagttg aaggtcttcg ttgtcccaca ctcccacaac 240 gatcctggtt ggattcagac cttcgaggaa tactaccagc acgacaccaa gcacatcttg 300 tccaacgctt tgagacattt gcacgacaac ccagagatga agttcatctg ggctgaaatc 360 tcctacttcg ctagattcta ccacgatttg ggtgagaaca agaagttgca gatgaagtcc 420 atcgtcaaga acggtcagtt ggaattcgtc actggtggat gggtcatgcc agacgaggct 480 aactcccact ggagaaacgt tttgttgcag ttgaccgaag gtcaaacttg gttgaagcaa 540 ttcatgaacg tcactccaac tgcttcctgg gctatcgatc cattcggaca ctctccaact 600 atgccataca ttttgcagaa gtctggtttc aagaatatgt tgatccagag aacccactac 660 tccgttaaga aggagttggc tcaacagaga cagttggagt tcttgtggag acagatctgg 720 gacaacaaag gtgacactgc tttgttcacc cacatgatgc cattctactc ttacgacatt 780 cctcatacct gtggtccaga tccaaaggtt tgttgtcagt tcgatttcaa aagaatgggt 840 tccttcggtt tgtcttgtcc atggaaggtt ccacctagaa ctatctctga tcaaaatgtt 900 gctgctagat ccgatttgtt ggttgatcag tggaagaaga aggctgagtt gtacagaacc 960 aacgtcttgt tgattccatt gggtgacgac ttcagattca agcagaacac cgagtgggat 1020 gttcagagag tcaactacga aagattgttc gaacacatca actctcaggc tcacttcaat 1080 gtccaggctc agttcggtac tttgcaggaa tacttcgatg ctgttcacca ggctgaaaga 1140 gctggacaag ctgagttccc aaccttgtct ggtgacttct tcacttacgc tgatagatct 1200 gataactact ggtctggtta ctacacttcc agaccatacc ataagagaat ggacagagtc 1260 ttgatgcact acgttagagc tgctgaaatg ttgtccgctt ggcactcctg ggacggtatg 1320 gctagaatcg aggaaagatt ggagcaggct agaagagagt tgtccttgtt ccagcaccac 1380 gacggtatta ctggtactgc taaaactcac gttgtcgtcg actacgagca aagaatgcag 1440 gaagctttga aagcttgtca aatggtcatg caacagtctg tctacagatt gttgactaag 1500 ccatccatct actctccaga cttctccttc tcctacttca ctttggacga ctccagatgg 1560 ccaggttctg gtgttgagga ctctagaact accatcatct tgggtgagga tatcttgcca 1620 tccaagcatg ttgtcatgca caacaccttg ccacactgga gagagcagtt ggttgacttc 1680 tacgtctcct ctccattcgt ttctgttacc gacttggcta acaatccagt tgaggctcag 1740 gtttctccag tttggtcttg gcaccacgac actttgacta agactatcca cccacaaggt 1800 tccaccacca agtacagaat catcttcaag gctagagttc caccaatggg tttggctacc 1860 tacgttttga ccatctccga ttccaagcca gagcacacct cctacgcttc caatttgttg 1920 cttagaaaga acccaacttc cttgccattg ggtcaatacc cagaggatgt caagttcggt 1980 gatccaagag agatctcctt gagagttggt aacggtccaa ccttggcttt ctctgagcag 2040 ggtttgttga agtccattca gttgactcag gattctccac atgttccagt tcacttcaag 2100 ttcttgaagt acggtgttag atctcatggt gatagatctg gtgcttactt gttcttgcca 2160 aatggtccag cttctccagt cgagttgggt cagccagttg tcttggtcac taagggtaaa 2220 ttggagtctt ccgtttctgt tggtttgcca tctgtcgttc accagaccat catgagaggt 2280 ggtgctccag agattagaaa tttggtcgat attggttctt tggacaacac tgagatcgtc 2340 atgagattgg agactcatat cgactctggt gatatcttct acactgattt gaatggattg 2400 caattcatca agaggagaag attggacaag ttgccattgc aggctaacta ctacccaatt 2460 ccatctggta tgttcattga ggatgctaat accagattga ctttgttgac cggtcaacca 2520 ttgggtggat cttctttggc ttctggtgag ttggagatta tgcaagatag aagattggct 2580 tctgatgatg aaagaggttt gggtcagggt gttttggaca acaagccagt tttgcatatt 2640 tacagattgg tcttggagaa ggttaacaac tgtgtcagac catctaagtt gcatccagct 2700 ggttacttga cttctgctgc tcacaaagct tctcagtctt tgttggatcc attggacaag 2760 ttcatcttcg ctgaaaatga gtggatcggt gctcagggtc aattcggtgg tgatcatcca 2820 tctgctagag aggatttgga tgtctctgtc atgagaagat tgaccaagtc ttctgctaaa 2880 acccagagag ttggttacgt tttgcacaga accaatttga tgcaatgtgg tactccagag 2940 gagcatactc agaagttgga tgtctgtcac ttgttgccaa atgttgctag atgtgagaga 3000 actaccttga ctttcttgca gaatttggag cacttggatg gtatggttgc tccagaagtt 3060 tgtccaatgg aaaccgctgc ttacgtctct tctcactctt cttga 3105 <210> 71 <211> 108 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes Mnn2 leader (53) <400> 71 atgctgctta ccaaaaggtt ttcaaagctg ttcaagctga cgttcatagt tttgatattg 60 tgcgggctgt tcgtcattac aaacaaatac atggatgaga acacgtcg 108 <210> 72 <211> 1729 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the PpHIS1 auxotrophic marker <400> 72 caagttgcgt ccggtatacg taacgtctca cgatgatcaa agataatact taatcttcat 60 ggtctactga ataactcatt taaacaattg actaattgta cattatattg aacttatgca 120 tcctattaac gtaatcttct ggcttctctc tcagactcca tcagacacag aatatcgttc 180 tctctaactg gtcctttgac gtttctgaca atagttctag aggagtcgtc caaaaactca 240 actctgactt gggtgacacc accacgggat ccggttcttc cgaggacctt gatgaccttg 300 gctaatgtaa ctggagtttt agtatccatt ttaagatgtg tgtttctgta ggttctgggt 360 tggaaaaaaa ttttagacac cagaagagag gagtgaactg gtttgcgtgg gtttagactg 420 tgtaaggcac tactctgtcg aagttttaga taggggttac ccgctccgat gcatgggaag 480 cgattagccc ggctgttgcc cgtttggttt ttgaagggta attttcaata tctctgtttg 540 agtcatcaat ttcatattca aagattcaaa aacaaaatct ggtccaagga gcgcatttag 600 gattatggag ttggcgaatc acttgaacga tagactatta tttgctgttc ctaaagaggg 660 cagattgtat gagaaatgcg ttgaattact taggggatca gatattcagt ttcgaagatc 720 cagtagattg gatatagctt tgtgcactaa cctgcccctg gcattggttt tccttccagc 780 tgctgacatt cccacgtttg taggagaggg taaatgtgat ttgggtataa ctggtattga 840 ccaggttcag gaaagtgacg tagatgtcat acctttatta gacttgaatt tcggtaagtg 900 caagttgcag attcaagttc ccgagaatgg tgacttgaaa gaacctaaac agctaattgg 960 taaagaaatt gtttcctcct ttactagctt aaccaccagg tactttgaac aactggaagg 1020 agttaagcct ggtgagccac taaagacaaa aatcaaatat gttggagggt ctgttgaggc 1080 ctcttgtgcc ctaggagttg ccgatgctat tgtggatctt gttgagagtg gagaaaccat 1140 gaaagcggca gggctgatcg atattgaaac tgttctttct acttccgctt acctgatctc 1200 ttcgaagcat cctcaacacc cagaactgat ggatactatc aaggagagaa ttgaaggtgt 1260 actgactgct cagaagtatg tcttgtgtaa ttacaacgca cctagaggta accttcctca 1320 gctgctaaaa ctgactccag gcaagagagc tgctaccgtt tctccattag atgaagaaga 1380 ttgggtggga gtgtcctcga tggtagagaa gaaagatgtt ggaagaatca tggacgaatt 1440 aaagaaacaa ggtgccagtg acattcttgt ctttgagatc agtaattgta gagcatagat 1500 agaataatat tcaagaccaa cggcttctct tcggaagctc caagtagctt atagtgatga 1560 gtaccggcat atatttatag gcttaaaatt tcgagggttc actatattcg tttagtggga 1620 agagttcctt tcactcttgt tatctatatt gtcagcgtgg actgtttata actgtaccaa 1680 cttagtttct ttcaactcca ggttaagaga cataaatgtc ctttgatgc 1729 <210> 73 <211> 1068 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes Rat GnT II (TC) Codon-optimized <400> 73 tccttggttt accaattgaa cttcgaccag atgttgagaa acgttgacaa ggacggtact 60 tggtctcctg gtgagttggt tttggttgtt caggttcaca acagaccaga gtacttgaga 120 ttgttgatcg actccttgag aaaggctcaa ggtatcagag aggttttggt tatcttctcc 180 cacgatttct ggtctgctga gatcaactcc ttgatctcct ccgttgactt ctgtccagtt 240 ttgcaggttt tcttcccatt ctccatccaa ttgtacccat ctgagttccc aggttctgat 300 ccaagagact gtccaagaga cttgaagaag aacgctgctt tgaagttggg ttgtatcaac 360 gctgaatacc cagattcttt cggtcactac agagaggcta agttctccca aactaagcat 420 cattggtggt ggaagttgca ctttgtttgg gagagagtta aggttttgca ggactacact 480 ggattgatct tgttcttgga ggaggatcat tacttggctc cagacttcta ccacgttttc 540 aagaagatgt ggaagttgaa gcaacaagag tgtccaggtt gtgacgtttt gtccttggga 600 acttacacta ctatcagatc cttctacggt atcgctgaca aggttgacgt taagacttgg 660 aagtccactg aacacaacat gggattggct ttgactagag atgcttacca gaagttgatc 720 gagtgtactg acactttctg tacttacgac gactacaact gggactggac tttgcagtac 780 ttgactttgg cttgtttgcc aaaagtttgg aaggttttgg ttccacaggc tccaagaatt 840 ttccacgctg gtgactgtgg aatgcaccac aagaaaactt gtagaccatc cactcagtcc 900 gctcaaattg agtccttgtt gaacaacaac aagcagtact tgttcccaga gactttggtt 960 atcggagaga agtttccaat ggctgctatt tccccaccaa gaaagaatgg tggatggggt 1020 gatattagag accacgagtt gtgtaaatcc tacagaagat tgcagtag 1068 <210> 74 <211> 300 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes Mnn2 leader (54) <400> 74 atgctgctta ccaaaaggtt ttcaaagctg ttcaagctga cgttcatagt tttgatattg 60 tgcgggctgt tcgtcattac aaacaaatac atggatgaga acacgtcggt caaggagtac 120 aaggagtact tagacagata tgtccagagt tactccaata agtattcatc ttcctcagac 180 gccgccagcg ctgacgattc aaccccattg agggacaatg atgaggcagg caatgaaaag 240 ttgaaaagct tctacaacaa cgttttcaac tttctaatgg ttgattcgcc cgggcgcgcc 300 <210> 75 <211> 1373 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 5'-Region used for knock out of PpARG1 <400> 75 gatctggcct tccctgaatt tttacgtcca gctatacgat ccgttgtgac tgtatttcct 60 gaaatgaagt ttcaacctaa agttttggtt gtacttgctc cacctaccac ggaaactaat 120 atcgaaacca atgaaaaagt agaactggaa tcgtcaatcg aaattcgcaa ccaagtggaa 180 cccaaagact tgaatctttc taaagtctat tctagtgaca ctaatggcaa cagaagattt 240 gagctgactt ttcaaatgaa tctcaataat gcaatatcaa catcagacaa tcaatgggct 300 ttgtctagtg acacaggatc aattatagta gtgtcttctg caggaagaat aacttccccg 360 atcctagaag tcggggcatc cgtctgtgtc ttaagatcgt acaacgaaca ccttttggca 420 ataacttgtg aaggaacatg cttttcatgg aatttaaaga agcaagaatg tgttctaaac 480 agcatttcat tagcacctat agtcaattca cacatgctag ttaagaaagt tggagatgca 540 aggaactatt ctattgtatc tgccgaagga gacaacaatc cgttacccca gattctagac 600 tgcgaacttt ccaaaaatgg cgctccaatt gtggctctta gcacgaaaga catctactct 660 tattcaaaga aaatgaaatg ctggatccat ttgattgatt cgaaatactt tgaattgttg 720 ggtgctgaca atgcactgtt tgagtgtgtg gaagcgctag aaggtccaat tggaatgcta 780 attcatagat tggtagatga gttcttccat gaaaacactg ccggtaaaaa actcaaactt 840 tacaacaagc gagtactgga ggacctttca aattcacttg aagaactagg tgaaaatgcg 900 tctcaattaa gagagaaact tgacaaactc tatggtgatg aggttgaggc ttcttgacct 960 cttctctcta tctgcgtttc tttttttttt tttttttttt tttttttcag ttgagccaga 1020 ccgcgctaaa cgcataccaa ttgccaaatc aggcaattgt gagacagtgg taaaaaagat 1080 gcctgcaaag ttagattcac acagtaagag agatcctact cataaatgag gcgcttattt 1140 agtagctagt gatagccact gcggttctgc tttatgctat ttgttgtatg ccttactatc 1200 tttgtttggc tcctttttct tgacgttttc cgttggaggg actccctatt ctgagtcatg 1260 agccgcacag attatcgccc aaaattgaca aaatcttctg gcgaaaaaag tataaaagga 1320 gaaaaaagct cacccttttc cagcgtagaa agtatatatc agtcattgaa gac 1373 <210> 76 <211> 1470 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 3'-Region used for knock out of PpARG1 <400> 76 gggactttaa ctcaagtaaa aggatagttg tacaattata tatacgaaga ataaatcatt 60 acaaaaagta ttcgtttctt tgattcttaa caggattcat tttctgggtg tcatcaggta 120 cagcgctgaa tatcttgaag ttaacatcga gctcatcatc gacgttcatc acactagcca 180 cgtttccgca acggtagcaa taattaggag cggaccacac agtgacgaca tctttctctt 240 tgaaatggta tctgaagcct tccatgacca attgatgggc tctagcgatg agttgcaagt 300 tattaatgtg gttgaactca cgtgctactc gagcaccgaa taaccagcca gctccacgag 360 gagaaacagc ccaactgtcg acttcatctg ggtcagacca aaccaagtca caaaatcctc 420 cttcatgagg gacctcttgc gctcggctga gaactctgat ttgatctaac atgcgaatat 480 cgggagagag accaccatgg atacataata ttttaccatc aatgatggca ctaagggtta 540 aaaagtcgaa cacctggcaa cagtacttcc agacagtggt ggaaccatat ttattgagac 600 attcctcata aaatccataa acctgagtga tctgtctgga ttcatgattt ccccttacca 660 atgtgatatg ttgaggaaac ttaattttta aaatcatgag taacgtgaac gtctccaacg 720 agaaatagcc tctatccaca tagtctccta ggaagatata gttctgtttt attccattag 780 aggaggatcc gggaaaccca ccactaatct tgaaaagttc cagtagatcg tgaaattggc 840 cgtgaatatc tccgcatact gtcactggac tctgcactgg ctgtatattg gattcctcca 900 tcagcaaatc cttcacccgt tcgcaaagat gcttcatatc attttcactt aaagccttgc 960 agcttttgac ttcttcaaac cactgatctg gtcctctttc tggcatgatt aaggtctata 1020 atatttctga gctgagatgt aaaaaaaaat aataaaaatg gggagtgaaa aagtgtgtag 1080 cttttaggag tttgggattg ataccccaaa atgatcttta tgagaattaa aaggtagata 1140 cgcttttaat aagaacacct atctatagta ctttgtggtc ttgagtaatt gagatgttca 1200 gcttctgagg tttgccgtta ttctgggata gtagtgcgcg accaaacaac ccgccaggca 1260 aagtgtgttg tgctcgaaga cgattgccag aagagtaagt ccgtcctgcc tcagatgtta 1320 cacactttct tccctagaca gtcgatgcat catcggattt aaacctgaaa ctttgatgcc 1380 atgatacgcc tagtcacgtc gactgagatt ttagataagc cccgatccct ttagtacatt 1440 cctgttatcc atggatggaa tggcctgata 1470 <210> 77 <211> 1043 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 5'-Region used for knock out of BMT4 <400> 77 aagcttgttc accgttggga cttttccgtg gacaatgttg actactccag gagggattcc 60 agctttctct actagctcag caataatcaa tgcagcccca ggcgcccgtt ctgatggctt 120 gatgaccgtt gtattgcctg tcactatagc caggggtagg gtccataaag gaatcatagc 180 agggaaatta aaagggcata ttgatgcaat cactcccaat ggctctcttg ccattgaagt 240 ctccatatca gcactaactt ccaagaagga ccccttcaag tctgacgtga tagagcacgc 300 ttgctctgcc acctgtagtc ctctcaaaac gtcaccttgt gcatcagcaa agactttacc 360 ttgctccaat actatgacgg aggcaattct gtcaaaattc tctctcagca attcaaccaa 420 cttgaaagca aattgctgtc tcttgatgat ggagactttt ttccaagatt gaaatgcaat 480 gtgggacgac tcaattgctt cttccagctc ctcttcggtt gattgaggaa cttttgaaac 540 cacaaaattg gtcgttgggt catgtacatc aaaccattct gtagatttag attcgacgaa 600 agcgttgttg atgaaggaaa aggttggata cggtttgtcg gtctctttgg tatggccggt 660 ggggtatgca attgcagtag aagataattg gacagccatt gttgaaggta gagaaaaggt 720 cagggaactt gggggttatt tataccattt taccccacaa ataacaactg aaaagtaccc 780 attccatagt gagaggtaac cgacggaaaa agacgggccc atgttctggg accaatagaa 840 ctgtgtaatc cattgggact aatcaacaga cgattggcaa tataatgaaa tagttcgttg 900 aaaagccacg tcagctgtct tttcattaac tttggtcgga cacaacattt tctactgttg 960 tatctgtcct actttgctta tcatctgcca cagggcaagt ggatttcctt ctcgcgcggc 1020 tgggtgaaaa cggttaacgt gaa 1043 <210> 78 <211> 695 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 3'-Region used for knock out of BMT4 <400> 78 gccttggggg acttcaagtc tttgctagaa actagatgag gtcaggccct cttatggttg 60 tgtcccaatt gggcaatttc actcacctaa aaagcatgac aattatttag cgaaataggt 120 agtatatttt ccctcatctc ccaagcagtt tcgtttttgc atccatatct ctcaaatgag 180 cagctacgac tcattagaac cagagtcaag taggggtgag ctcagtcatc agccttcgtt 240 tctaaaacga ttgagttctt ttgttgctac aggaagcgcc ctagggaact ttcgcacttt 300 ggaaatagat tttgatgacc aagagcggga gttgatatta gagaggctgt ccaaagtaca 360 tgggatcagg ccggccaaat tgattggtgt gactaaacca ttgtgtactt ggacactcta 420 ttacaaaagc gaagatgatt tgaagtatta caagtcccga agtgttagag gattctatcg 480 agcccagaat gaaatcatca accgttatca gcagattgat aaactcttgg aaagcggtat 540 cccattttca ttattgaaga actacgataa tgaagatgtg agagacggcg accctctgaa 600 cgtagacgaa gaaacaaatc tacttttggg gtacaataga gaaagtgaat caagggaggt 660 atttgtggcc ataatactca actctatcat taatg 695 <210> 79 <211> 1103 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 5'-Region used for knock out of BMT1 <400> 79 catatggtga gagccgttct gcacaactag atgttttcga gcttcgcatt gtttcctgca 60 gctcgactat tgaattaaga tttccggata tctccaatct cacaaaaact tatgttgacc 120 acgtgctttc ctgaggcgag gtgttttata tgcaagctgc caaaaatgga aaacgaatgg 180 ccatttttcg cccaggcaaa ttattcgatt actgctgtca taaagacagt gttgcaaggc 240 tcacattttt ttttaggatc cgagataaag tgaatacagg acagcttatc tctatatctt 300 gtaccattcg tgaatcttaa gagttcggtt agggggactc tagttgaggg ttggcactca 360 cgtatggctg ggcgcagaaa taaaattcag gcgcagcagc acttatcgat ggaattcaca 420 gttataaata aaaacaaaaa ctcaaaaagt ttgggctcca caaaataact taatttaaat 480 ttttgtctaa taaatgaatg taattccaag attatgtgat gcaagcacag tatgcttcag 540 ccctatgcag ctactaatgt caatctcgcc tgcgagcggg cctagatttt cactacaaat 600 ttcaaaacta cgcggattta ttgtctcaga gagcaatttg gcatttctga gcgtagcagg 660 aggcttcata agattgtata ggaccgtacc aacaaattgc cgaggcacaa cacggtatgc 720 tgtgcactta tgtggctact tccctacaac ggaatgaaac cttcctcttt ccgcttaaac 780 gagaaagtgt gtcgcaattg aatgcaggtg cctgtgcgcc ttggtgtatt gtttttgagg 840 gcccaattta tcaggcgcct tttttcttgg ttgttttccc ttagcctcaa gcaaggttgg 900 tctatttcat ctccgcttct ataccgtgcc tgatactgtt ggatgagaac acgactcaac 960 ttcctgctgc tctgtattgc cagtgttttg tctgtgattt ggatcggagt cctccttact 1020 tggaatgata ataatcttgg cggaatctcc ctaaacggag gcaaggattc tgcctatgat 1080 gatctgctat cattgggaag ctt 1103 <210> 80 <211> 692 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 3'-Region used for knock out of BMT1 <400> 80 gaattcacag ttataaataa aaacaaaaac tcaaaaagtt tgggctccac aaaataactt 60 aatttaaatt tttgtctaat aaatgaatgt aattccaaga ttatgtgatg caagcacagt 120 atgcttcagc cctatgcagc tactaatgtc aatctcgcct gcgagcgggc ctagattttc 180 actacaaatt tcaaaactac gcggatttat tgtctcagag agcaatttgg catttctgag 240 cgtagcagga ggcttcataa gattgtatag gaccgtacca acaaattgcc gaggcacaac 300 acggtatgct gtgcacttat gtggctactt ccctacaacg gaatgaaacc ttcctctttc 360 cgcttaaacg agaaagtgtg tcgcaattga atgcaggtgc ctgtgcgcct tggtgtattg 420 tttttgaggg cccaatttat caggcgcctt ttttcttggt tgttttccct tagcctcaag 480 caaggttggt ctatttcatc tccgcttcta taccgtgcct gatactgttg gatgagaaca 540 cgactcaact tcctgctgct ctgtattgcc agtgttttgt ctgtgatttg gatcggagtc 600 ctccttactt ggaatgataa taatcttggc ggaatctccc taaacggagg caaggattct 660 gcctatgatg atctgctatc attgggaagc tt 692 <210> 81 <211> 546 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 5'-Region used for knock out of BMT3 <400> 81 gatatctccc tggggacaat atgtgttgca actgttcgtt gttggtgccc cagtccccca 60 accggtacta atcggtctat gttcccgtaa ctcatattcg gttagaacta gaacaataag 120 tgcatcattg ttcaacattg tggttcaatt gtcgaacatt gctggtgctt atatctacag 180 ggaagacgat aagcctttgt acaagagagg taacagacag ttaattggta tttctttggg 240 agtcgttgcc ctctacgttg tctccaagac atactacatt ctgagaaaca gatggaagac 300 tcaaaaatgg gagaagctta gtgaagaaga gaaagttgcc tacttggaca gagctgagaa 360 ggagaacctg ggttctaaga ggctggactt tttgttcgag agttaaactg cataattttt 420 tctaagtaaa tttcatagtt atgaaatttc tgcagcttag tgtttactgc atcgtttact 480 gcatcaccct gtaaataatg tgagcttttt tccttccatt gcttggtatc ttccttgctg 540 ctgttt 546 <210> 82 <211> 378 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 3'-Region used for knock out of BMT3 <400> 82 acaaaacagt catgtacaga actaacgcct ttaagatgca gaccactgaa aagaattggg 60 tcccattttt cttgaaagac gaccaggaat ctgtccattt tgtttactcg ttcaatcctc 120 tgagagtact caactgcagt cttgataacg gtgcatgtga tgttctattt gagttaccac 180 atgattttgg catgtcttcc gagctacgtg gtgccactcc tatgctcaat cttcctcagg 240 caatcccgat ggcagacgac aaagaaattt gggtttcatt cccaagaacg agaatatcag 300 attgcgggtg ttctgaaaca atgtacaggc caatgttaat gctttttgtt agagaaggaa 360 caaacttttt tgctgagc 378 <210> 83 <211> 1494 <212> DNA <213> Artificial Sequence <220> <223> DNA encodes Tr ManI catalytic domain <400> 83 cgcgccggat ctcccaaccc tacgagggcg gcagcagtca aggccgcatt ccagacgtcg 60 tggaacgctt accaccattt tgcctttccc catgacgacc tccacccggt cagcaacagc 120 tttgatgatg agagaaacgg ctggggctcg tcggcaatcg atggcttgga cacggctatc 180 ctcatggggg atgccgacat tgtgaacacg atccttcagt atgtaccgca gatcaacttc 240 accacgactg cggttgccaa ccaaggcatc tccgtgttcg agaccaacat tcggtacctc 300 ggtggcctgc tttctgccta tgacctgttg cgaggtcctt tcagctcctt ggcgacaaac 360 cagaccctgg taaacagcct tctgaggcag gctcaaacac tggccaacgg cctcaaggtt 420 gcgttcacca ctcccagcgg tgtcccggac cctaccgtct tcttcaaccc tactgtccgg 480 agaagtggtg catctagcaa caacgtcgct gaaattggaa gcctggtgct cgagtggaca 540 cggttgagcg acctgacggg aaacccgcag tatgcccagc ttgcgcagaa gggcgagtcg 600 tatctcctga atccaaaggg aagcccggag gcatggcctg gcctgattgg aacgtttgtc 660 agcacgagca acggtacctt tcaggatagc agcggcagct ggtccggcct catggacagc 720 ttctacgagt acctgatcaa gatgtacctg tacgacccgg ttgcgtttgc acactacaag 780 gatcgctggg tccttgctgc cgactcgacc attgcgcatc tcgcctctca cccgtcgacg 840 cgcaaggact tgaccttttt gtcttcgtac aacggacagt ctacgtcgcc aaactcagga 900 catttggcca gttttgccgg tggcaacttc atcttgggag gcattctcct gaacgagcaa 960 aagtacattg actttggaat caagcttgcc agctcgtact ttgccacgta caaccagacg 1020 gcttctggaa tcggccccga aggcttcgcg tgggtggaca gcgtgacggg cgccggcggc 1080 tcgccgccct cgtcccagtc cgggttctac tcgtcggcag gattctgggt gacggcaccg 1140 tattacatcc tgcggccgga gacgctggag agcttgtact acgcataccg cgtcacgggc 1200 gactccaagt ggcaggacct ggcgtgggaa gcgttcagtg ccattgagga cgcatgccgc 1260 gccggcagcg cgtactcgtc catcaacgac gtgacgcagg ccaacggcgg gggtgcctct 1320 gacgatatgg agagcttctg gtttgccgag gcgctcaagt atgcgtacct gatctttgcg 1380 gaggagtcgg atgtgcaggt gcaggccaac ggcgggaaca aatttgtctt taacacggag 1440 gcgcacccct ttagcatccg ttcatcatca cgacggggcg gccaccttgc ttaa 1494 <210> 84 <211> 1792 <212> DNA <213> Artificial Sequence <220> <223> 5'ARG1 and ORF <400> 84 taccaattgc caaatcaggc aattgtgaga cagtggtaaa aaagatgcct gcaaagttag 60 attcacacag taagagagat cctactcata aatgaggcgc ttatttagta gctagtgata 120 gccactgcgg ttctgcttta tgctatttgt tgtatgcctt actatctttg tttggctcct 180 ttttcttgac gttttccgtt ggagggactc cctattctga gtcatgagcc gcacagatta 240 tcgcccaaaa ttgacaaaat cttctggcga aaaaagtata aaaggagaaa aaagctcacc 300 cttttccagc gtagaaagta tatatcagtc attgaagact attatttaaa taacacaatg 360 tctaaaggaa aagtttgttt ggcctactcc ggtggtttgg atacctccat catcctagct 420 tggttgttgg agcagggata cgaagtcgtt gcctttttag ccaacattgg tcaagaggaa 480 gactttgagg ctgctagaga gaaagctctg aagatcggtg ctaccaagtt tatcgtcagt 540 gacgttagga aggaatttgt tgaggaagtt ttgttcccag cagtccaagt taacgctatc 600 tacgagaacg tctacttact gggtacctct ttggccagac cagtcattgc caaggcccaa 660 atagaggttg ctgaacaaga aggttgtttt gctgttgccc acggttgtac cggaaagggt 720 aacgatcagg ttagatttga gctttccttt tatgctctga agcctgacgt tgtctgtatc 780 gccccatgga gagacccaga attcttcgaa agattcgctg gtagaaatga cttgctgaat 840 tacgctgctg agaaggatat tccagttgct cagactaaag ccaagccatg gtctactgat 900 gagaacatgg ctcacatctc cttcgaggct ggtattctag aagatccaaa cactactcct 960 ccaaaggaca tgtggaagct cactgttgac ccagaagatg caccagacaa gccagagttc 1020 tttgacgtcc actttgagaa gggtaagcca gttaaattag ttctcgagaa caaaactgag 1080 gtcaccgatc cggttgagat ctttttgact gctaacgcca ttgctagaag aaacggtgtt 1140 ggtagaattg acattgtcga gaacagattc atcggaatca agtccagagg ttgttatgaa 1200 actccaggtt tgactctact gagaaccact cacatcgact tggaaggtct taccgttgac 1260 cgtgaagtta gatcgatcag agacactttt gttaccccaa cctactctaa gttgttatac 1320 aacgggttgt actttacccc agaaggtgag tacgtcagaa ctatgattca gccttctcaa 1380 aacaccgtca acggtgttgt tagagccaag gcctacaaag gtaatgtgta taacctagga 1440 agatactctg aaaccgagaa attgtacgat gctaccgaat cttccatgga tgagttgacc 1500 ggattccacc ctcaagaagc tggaggattt atcacaacac aagccatcag aatcaagaag 1560 tacggagaaa gtgtcagaga gaagggaaag tttttgggac tttaactcaa gtaaaaggat 1620 agttgtacaa ttatatatac gaagaataaa tcattacaaa aagtattcgt ttctttgatt 1680 cttaacagga ttcattttct gggtgtcatc aggtacagcg ctgaatatct tgaagttaac 1740 atcgagctca tcatcgacgt tcatcacact agccacgttt ccgcaacggt ag 1792 <210> 85 <211> 414 <212> DNA <213> Artificial Sequence <220> <223> PpCITI TT <400> 85 ccggccattt aaatatgtga cgactgggtg atccgggtta gtgagttgtt ctcccatctg 60 tatatttttc atttacgatg aatacgaaat gagtattaag aaatcaggcg tagcaatatg 120 ggcagtgttc agtcctgtca tagatggcaa gcactggcac atccttaata ggttagagaa 180 aatcattgaa tcatttgggt ggtgaaaaaa aattgatgta aacaagccac ccacgctggg 240 agtcgaaccc agaatctttt gattagaagt caaacgcgtt aaccattacg ctacgcaggc 300 atgtttcacg tccatttttg attgctttct atcataatct aaagatgtga actcaattag 360 ttgcaatttg accaattctt ccattacaag tcgtgcttcc tccgttgatg caac 414 <210> 86 <211> 388 <212> DNA <213> Artificial Sequence <220> <223> Ashbya gossypii TEF1 promoter <400> 86 gatctgttta gcttgcctcg tccccgccgg gtcacccggc cagcgacatg gaggcccaga 60 ataccctcct tgacagtctt gacgtgcgca gctcaggggc atgatgtgac tgtcgcccgt 120 acatttagcc catacatccc catgtataat catttgcatc catacatttt gatggccgca 180 cggcgcgaag caaaaattac ggctcctcgc tgcagacctg cgagcaggga aacgctcccc 240 tcacagacgc gttgaattgt ccccacgccg cgcccctgta gagaaatata aaaggttagg 300 atttgccact gaggttcttc tttcatatac ttccttttaa aatcttgcta ggatacagtt 360 ctcacatcac atccgaacat aaacaacc 388 <210> 87 <211> 247 <212> DNA <213> Artificial Sequence <220> <223> Ashbya gossypii TEF1 termination sequence <400> 87 taatcagtac tgacaataaa aagattcttg ttttcaagaa cttgtcattt gtatagtttt 60 tttatattgt agttgttcta ttttaatcaa atgttagcgt gatttatatt ttttttcgcc 120 tcgacatcat ctgcccagat gcgaagttaa gtgcgcagaa agtaatatca tgcgtcaatc 180 gtatgtgaat gctggtcgct atactgctgt cgattcgata ctaacgccgc catccagtgt 240 cgaaaac 247 <210> 88 <211> 1037 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the PpPMA1 promoter <400> 88 aaatgcgtac ctcttctacg agattcaagc gaatgagaat aatgtaatat gcaagatcag 60 aaagaatgaa aggagttgaa aaaaaaaacc gttgcgtttt gaccttgaat ggggtggagg 120 tttccattca aagtaaagcc tgtgtcttgg tattttcggc ggcacaagaa atcgtaattt 180 tcatcttcta aacgatgaag atcgcagccc aacctgtatg tagttaaccg gtcggaatta 240 taagaaagat tttcgatcaa caaaccctag caaatagaaa gcagggttac aactttaaac 300 cgaagtcaca aacgataaac cactcagctc ccacccaaat tcattcccac tagcagaaag 360 gaattattta atccctcagg aaacctcgat gattctcccg ttcttccatg ggcgggtatc 420 gcaaaatgag gaatttttca aatttctcta ttgtcaagac tgtttattat ctaagaaata 480 gcccaatccg aagctcagtt ttgaaaaaat cacttccgcg tttctttttt acagcccgat 540 gaatatccaa atttggaata tggattactc tatcgggact gcagataata tgacaacaac 600 gcagattaca ttttaggtaa ggcataaaca ccagccagaa atgaaacgcc cactagccat 660 ggtcgaatag tccaatgaat tcagatagct atggtctaaa agctgatgtt ttttattggg 720 taatggcgaa gagtccagta cgacttccag cagagctgag atggccattt ttgggggtat 780 tagtaacttt ttgagctctt ttcacttcga tgaagtgtcc cattcgggat ataatcggat 840 cgcgtcgttt tctcgaaaat acagcttagc gtcgtccgct tgttgtaaaa gcagcaccac 900 attcctaatc tcttatataa acaaaacaac ccaaattatc agtgctgttt tcccaccaga 960 tataagtttc ttttctcttc cgctttttga ttttttatct ctttccttta aaaacttctt 1020 taccttaaag ggcggcc 1037 <210> 89 <211> 1231 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 5'-region that was used to knock into the PpPRO1 locus <400> 89 gaagggccat cgaattgtca tcgtctcctc aggtgccatc gctgtgggca tgaagagagt 60 caacatgaag cggaaaccaa aaaagttaca gcaagtgcag gcattggctg ctataggaca 120 aggccgtttg ataggacttt gggacgacct tttccgtcag ttgaatcagc ctattgcgca 180 gattttactg actagaacgg atttggtcga ttacacccag tttaagaacg ctgaaaatac 240 attggaacag cttattaaaa tgggtattat tcctattgtc aatgagaatg acaccctatc 300 cattcaagaa atcaaatttg gtgacaatga caccttatcc gccataacag ctggtatgtg 360 tcatgcagac tacctgtttt tggtgactga tgtggactgt ctttacacgg ataaccctcg 420 tacgaatccg gacgctgagc caatcgtgtt agttagaaat atgaggaatc taaacgtcaa 480 taccgaaagt ggaggttccg ccgtaggaac aggaggaatg acaactaaat tgatcgcagc 540 tgatttgggt gtatctgcag gtgttacaac gattatttgc aaaagtgaac atcccgagca 600 gattttggac attgtagagt acagtatccg tgctgataga gtcgaaaatg aggctaaata 660 tctggtcatc aacgaagagg aaactgtgga acaatttcaa gagatcaatc ggtcagaact 720 gagggagttg aacaagctgg acattccttt gcatacacgt ttcgttggcc acagttttaa 780 tgctgttaat aacaaagagt tttggttact ccatggacta aaggccaacg gagccattat 840 cattgatcca ggttgttata aggctatcac tagaaaaaac aaagctggta ttcttccagc 900 tggaattatt tccgtagagg gtaatttcca tgaatacgag tgtgttgatg ttaaggtagg 960 actaagagat ccagatgacc cacattcact agaccccaat gaagaacttt acgtcgttgg 1020 ccgtgcccgt tgtaattacc ccagcaatca aatcaacaaa attaagggtc tacaaagctc 1080 gcagatcgag caggttctag gttacgctga cggtgagtat gttgttcaca gggacaactt 1140 ggctttccca gtatttgccg atccagaact gttggatgtt gttgagagta ccctgtctga 1200 acaggagaga gaatccaaac caaataaata g 1231 <210> 90 <211> 1425 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the 3'-region that was used to knock into the PpPRO1 locus <400> 90 aatttcacat atgctgcttg attatgtaat tataccttgc gttcgatggc atcgatttcc 60 tcttctgtca atcgcgcatc gcattaaaag tatacttttt tttttttcct atagtactat 120 tcgccttatt ataaactttg ctagtatgag ttctaccccc aagaaagagc ctgatttgac 180 tcctaagaag agtcagcctc caaagaatag tctcggtggg ggtaaaggct ttagtgagga 240 gggtttctcc caaggggact tcagcgctaa gcatatacta aatcgtcgcc ctaacaccga 300 aggctcttct gtggcttcga acgtcatcag ttcgtcatca ttgcaaaggt taccatcctc 360 tggatctgga agcgttgctg tgggaagtgt gttgggatct tcgccattaa ctctttctgg 420 agggttccac gggcttgatc caaccaagaa taaaatagac gttccaaagt cgaaacagtc 480 aaggagacaa agtgttcttt ctgacatgat ttccacttct catgcagcta gaaatgatca 540 ctcagagcag cagttacaaa ctggacaaca atcagaacaa aaagaagaag atggtagtcg 600 atcttctttt tctgtttctt cccccgcaag agatatccgg cacccagatg tactgaaaac 660 tgtcgagaaa catcttgcca atgacagcga gatcgactca tctttacaac ttcaaggtgg 720 agatgtcact agaggcattt atcaatgggt aactggagaa agtagtcaaa aagataaccc 780 gcctttgaaa cgagcaaata gttttaatga tttttcttct gtgcatggtg acgaggtagg 840 caaggcagat gctgaccacg atcgtgaaag cgtattcgac gaggatgata tctccattga 900 tgatatcaaa gttccgggag ggatgcgtcg aagtttttta ttacaaaagc atagagacca 960 acaactttct ggactgaata aaacggctca ccaaccaaaa caacttacta aacctaattt 1020 cttcacgaac aactttatag agtttttggc attgtatggg cattttgcag gtgaagattt 1080 ggaggaagac gaagatgaag atttagacag tggttccgaa tcagtcgcag tcagtgatag 1140 tgagggagaa ttcagtgagg ctgacaacaa tttgttgtat gatgaagagt ctctcctatt 1200 agcacctagt acctccaact atgcgagatc aagaatagga agtattcgta ctcctactta 1260 tggatctttc agttcaaatg ttggttcttc gtctattcat cagcagttaa tgaaaagtca 1320 aatcccgaag ctgaagaaac gtggacagca caagcataaa acacaatcaa aaatacgctc 1380 gaagaagcaa actaccaccg taaaagcagt gttgctgcta ttaaa 1425 <210> 91 <211> 1793 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the PpTRP2 gene integration locus <400> 91 ggtttctcaa ttactatata ctactaacca tttacctgta gcgtatttct tttccctctt 60 cgcgaaagct caagggcatc ttcttgactc atgaaaaata tctggatttc ttctgacaga 120 tcatcaccct tgagcccaac tctctagcct atgagtgtaa gtgatagtca tcttgcaaca 180 gattattttg gaacgcaact aacaaagcag atacaccctt cagcagaatc ctttctggat 240 attgtgaaga atgatcgcca aagtcacagt cctgagacag ttcctaatct ttaccccatt 300 tacaagttca tccaatcaga cttcttaacg cctcatctgg cttatatcaa gcttaccaac 360 agttcagaaa ctcccagtcc aagtttcttg cttgaaagtg cgaagaatgg tgacaccgtt 420 gacaggtaca cctttatggg acattccccc agaaaaataa tcaagactgg gcctttagag 480 ggtgctgaag ttgacccctt ggtgcttctg gaaaaagaac tgaagggcac cagacaagcg 540 caacttcctg gtattcctcg tctaagtggt ggtgccatag gatacatctc gtacgattgt 600 attaagtact ttgaaccaaa aactgaaaga aaactgaaag atgttttgca acttccggaa 660 gcagctttga tgttgttcga cacgatcgtg gcttttgaca atgtttatca aagattccag 720 gtaattggaa acgtttctct atccgttgat gactcggacg aagctattct tgagaaatat 780 tataagacaa gagaagaagt ggaaaagatc agtaaagtgg tatttgacaa taaaactgtt 840 ccctactatg aacagaaaga tattattcaa ggccaaacgt tcacctctaa tattggtcag 900 gaagggtatg aaaaccatgt tcgcaagctg aaagaacata ttctgaaagg agacatcttc 960 caagctgttc cctctcaaag ggtagccagg ccgacctcat tgcacccttt caacatctat 1020 cgtcatttga gaactgtcaa tccttctcca tacatgttct atattgacta tctagacttc 1080 caagttgttg gtgcttcacc tgaattacta gttaaatccg acaacaacaa caaaatcatc 1140 acacatccta ttgctggaac tcttcccaga ggtaaaacta tcgaagagga cgacaattat 1200 gctaagcaat tgaagtcgtc tttgaaagac agggccgagc acgtcatgct ggtagatttg 1260 gccagaaatg atattaaccg tgtgtgtgag cccaccagta ccacggttga tcgtttattg 1320 actgtggaga gattttctca tgtgatgcat cttgtgtcag aagtcagtgg aacattgaga 1380 ccaaacaaga ctcgcttcga tgctttcaga tccattttcc cagcaggaac cgtctccggt 1440 gctccgaagg taagagcaat gcaactcata ggagaattgg aaggagaaaa gagaggtgtt 1500 tatgcggggg ccgtaggaca ctggtcgtac gatggaaaat cgatggacac atgtattgcc 1560 ttaagaacaa tggtcgtcaa ggacggtgtc gcttaccttc aagccggagg tggaattgtc 1620 tacgattctg acccctatga cgagtacatc gaaaccatga acaaaatgag atccaacaat 1680 aacaccatct tggaggctga gaaaatctgg accgataggt tggccagaga cgagaatcaa 1740 agtgaatccg aagaaaacga tcaatgaacg gaggacgtaa gtaggaattt atg 1793 <210> 92 <211> 2172 <212> DNA <213> Artificial Sequence <220> <223> Human UDP-GlcNAc 2-epimerase/N-acetylmannosamine kinase (HsGNE) codon opitimized <400> 92 atggaaaaga acggtaacaa cagaaagttg agagtttgtg ttgctacttg taacagagct 60 gactactcca agttggctcc aatcatgttc ggtatcaaga ctgagccaga gttcttcgag 120 ttggacgttg ttgttttggg ttcccacttg attgatgact acggtaacac ttacagaatg 180 atcgagcagg acgacttcga catcaacact agattgcaca ctattgttag aggagaggac 240 gaagctgcta tggttgaatc tgttggattg gctttggtta agttgccaga cgttttgaac 300 agattgaagc cagacatcat gattgttcac ggtgacagat tcgatgcttt ggctttggct 360 acttccgctg ctttgatgaa cattagaatc ttgcacatcg agggtggtga agtttctggt 420 actatcgacg actccatcag acacgctatc actaagttgg ctcactacca tgtttgttgt 480 actagatccg ctgagcaaca cttgatttcc atgtgtgagg accacgacag aattttgttg 540 gctggttgtc catcttacga caagttgttg tccgctaaga acaaggacta catgtccatc 600 atcagaatgt ggttgggtga cgacgttaag tctaaggact acatcgttgc tttgcagcac 660 ccagttacta ctgacatcaa gcactccatc aagatgttcg agttgacttt ggacgctttg 720 atctccttca acaagagaac tttggttttg ttcccaaaca ttgacgctgg ttccaaagag 780 atggttagag ttatgagaaa gaagggtatc gaacaccacc caaacttcag agctgttaag 840 cacgttccat tcgaccaatt catccagttg gttgctcatg ctggttgtat gatcggtaac 900 tcctcctgtg gtgttagaga agttggtgct ttcggtactc cagttatcaa cttgggtact 960 agacagatcg gtagagagac tggagaaaac gttttgcatg ttagagatgc tgacactcag 1020 gacaagattt tgcaggcttt gcacttgcaa ttcggaaagc agtacccatg ttccaaaatc 1080 tacggtgacg gtaacgctgt tccaagaatc ttgaagtttt tgaagtccat cgacttgcaa 1140 gagccattgc agaagaagtt ctgtttccca ccagttaagg agaacatctc ccaggacatt 1200 gaccacatct tggagacatt gtccgctttg gctgttgatt tgggtggaac taacttgaga 1260 gttgctatcg tttccatgaa gggagagatc gttaagaagt acactcagtt caacccaaag 1320 acttacgagg agagaatcaa cttgatcttg cagatgtgtg ttgaagctgc tgctgaggct 1380 gttaagttga actgtagaat cttgggtgtt ggtatctcta ctggtggtag agttaatcca 1440 agagagggta tcgttttgca ctccactaag ttgattcagg agtggaactc cgttgatttg 1500 agaactccat tgtccgacac attgcacttg ccagtttggg ttgacaacga cggtaattgt 1560 gctgctttgg ctgagagaaa gttcggtcaa ggaaagggat tggagaactt cgttactttg 1620 atcactggta ctggtattgg tggtggtatc attcaccagc acgagttgat tcacggttct 1680 tccttctgtg ctgctgaatt gggacacttg gttgtttctt tggacggtcc agactgttct 1740 tgtggttccc acggttgtat tgaagcttac gcatcaggaa tggcattgca gagagaggct 1800 aagaagttgc acgacgagga cttgttgttg gttgagggaa tgtctgttcc aaaggacgag 1860 gctgttggtg ctttgcattt gatccaggct gctaagttgg gtaatgctaa ggctcagtcc 1920 atcttgagaa ctgctggtac tgctttggga ttgggtgttg ttaatatctt gcacactatg 1980 aacccatcct tggttatctt gtccggtgtt ttggcttctc actacatcca catcgttaag 2040 gacgttatca gacagcaagc tttgtcctcc gttcaagacg ttgatgttgt tgtttccgac 2100 ttggttgacc cagctttgtt gggtgctgct tccatggttt tggactacac tactagaaga 2160 atctactaat ag 2172 <210> 93 <211> 1854 <212> DNA <213> Artificial Sequence <220> <223> Sequence of the PpARG1 auxotrophic marker: <400> 93 cagttgagcc agaccgcgct aaacgcatac caattgccaa atcaggcaat tgtgagacag 60 tggtaaaaaa gatgcctgca aagttagatt cacacagtaa gagagatcct actcataaat 120 gaggcgctta tttagtagct agtgatagcc actgcggttc tgctttatgc tatttgttgt 180 atgccttact atctttgttt ggctcctttt tcttgacgtt ttccgttgga gggactccct 240 attctgagtc atgagccgca cagattatcg cccaaaattg acaaaatctt ctggcgaaaa 300 aagtataaaa ggagaaaaaa gctcaccctt ttccagcgta gaaagtatat atcagtcatt 360 gaagactatt atttaaataa cacaatgtct aaaggaaaag tttgtttggc ctactccggt 420 ggtttggata cctccatcat cctagcttgg ttgttggagc agggatacga agtcgttgcc 480 tttttagcca acattggtca agaggaagac tttgaggctg ctagagagaa agctctgaag 540 atcggtgcta ccaagtttat cgtcagtgac gttaggaagg aatttgttga ggaagttttg 600 ttcccagcag tccaagttaa cgctatctac gagaacgtct acttactggg tacctctttg 660 gccagaccag tcattgccaa ggcccaaata gaggttgctg aacaagaagg ttgttttgct 720 gttgcccacg gttgtaccgg aaagggtaac gatcaggtta gatttgagct ttccttttat 780 gctctgaagc ctgacgttgt ctgtatcgcc ccatggagag acccagaatt cttcgaaaga 840 ttcgctggta gaaatgactt gctgaattac gctgctgaga aggatattcc agttgctcag 900 actaaagcca agccatggtc tactgatgag aacatggctc acatctcctt cgaggctggt 960 attctagaag atccaaacac tactcctcca aaggacatgt ggaagctcac tgttgaccca 1020 gaagatgcac cagacaagcc agagttcttt gacgtccact ttgagaaggg taagccagtt 1080 aaattagttc tcgagaacaa aactgaggtc accgatccgg ttgagatctt tttgactgct 1140 aacgccattg ctagaagaaa cggtgttggt agaattgaca ttgtcgagaa cagattcatc 1200 ggaatcaagt ccagaggttg ttatgaaact ccaggtttga ctctactgag aaccactcac 1260 atcgacttgg aaggtcttac cgttgaccgt gaagttagat cgatcagaga cacttttgtt 1320 accccaacct actctaagtt gttatacaac gggttgtact ttaccccaga aggtgagtac 1380 gtcagaacta tgattcagcc ttctcaaaac accgtcaacg gtgttgttag agccaaggcc 1440 tacaaaggta atgtgtataa cctaggaaga tactctgaaa ccgagaaatt gtacgatgct 1500 accgaatctt ccatggatga gttgaccgga ttccaccctc aagaagctgg aggatttatc 1560 acaacacaag ccatcagaat caagaagtac ggagaaagtg tcagagagaa gggaaagttt 1620 ttgggacttt aactcaagta aaaggatagt tgtacaatta tatatacgaa gaataaatca 1680 ttacaaaaag tattcgtttc tttgattctt aacaggattc attttctggg tgtcatcagg 1740 tacagcgctg aatatcttga agttaacatc gagctcatca tcgacgttca tcacactagc 1800 cacgtttccg caacggtagc aataattagg agcggaccac acagtgacga catc 1854 <210> 94 <211> 1308 <212> DNA <213> Artificial Sequence <220> <223> Encodes human CMP-sialic acid synthase (HsCSS) codon optimized <400> 94 atggactctg ttgaaaaggg tgctgctact tctgtttcca acccaagagg tagaccatcc 60 agaggtagac ctcctaagtt gcagagaaac tccagaggtg gtcaaggtag aggtgttgaa 120 aagccaccac acttggctgc tttgatcttg gctagaggag gttctaaggg tatcccattg 180 aagaacatca agcacttggc tggtgttcca ttgattggat gggttttgag agctgctttg 240 gactctggtg ctttccaatc tgtttgggtt tccactgacc acgacgagat tgagaacgtt 300 gctaagcaat tcggtgctca ggttcacaga agatcctctg aggtttccaa ggactcttct 360 acttccttgg acgctatcat cgagttcttg aactaccaca acgaggttga catcgttggt 420 aacatccaag ctacttcccc atgtttgcac ccaactgact tgcaaaaagt tgctgagatg 480 atcagagaag agggttacga ctccgttttc tccgttgtta gaaggcacca gttcagatgg 540 tccgagattc agaagggtgt tagagaggtt acagagccat tgaacttgaa cccagctaaa 600 agaccaagaa ggcaggattg ggacggtgaa ttgtacgaaa acggttcctt ctacttcgct 660 aagagacact tgatcgagat gggatacttg caaggtggaa agatggctta ctacgagatg 720 agagctgaac actccgttga catcgacgtt gatatcgact ggccaattgc tgagcagaga 780 gttttgagat acggttactt cggaaaggag aagttgaagg agatcaagtt gttggtttgt 840 aacatcgacg gttgtttgac taacggtcac atctacgttt ctggtgacca gaaggagatt 900 atctcctacg acgttaagga cgctattggt atctccttgt tgaagaagtc cggtatcgaa 960 gttagattga tctccgagag agcttgttcc aagcaaacat tgtcctcttt gaagttggac 1020 tgtaagatgg aggtttccgt ttctgacaag ttggctgttg ttgacgaatg gagaaaggag 1080 atgggtttgt gttggaagga agttgcttac ttgggtaacg aagtttctga cgaggagtgt 1140 ttgaagagag ttggtttgtc tggtgctcca gctgatgctt gttccactgc tcaaaaggct 1200 gttggttaca tctgtaagtg taacggtggt agaggtgcta ttagagagtt cgctgagcac 1260 atctgtttgt tgatggagaa agttaataac tcctgtcaga agtagtag 1308 <210> 95 <211> 1080 <212> DNA <213> Artificial Sequence <220> <223> Encodes human N-acetylneuraminate-9-phosphate synthase (HsSPS) codon optimized <400> 95 atgccattgg aattggagtt gtgtcctggt agatgggttg gtggtcaaca cccatgtttc 60 atcatcgctg agatcggtca aaaccaccaa ggagacttgg acgttgctaa gagaatgatc 120 agaatggcta aggaatgtgg tgctgactgt gctaagttcc agaagtccga gttggagttc 180 aagttcaaca gaaaggcttt ggaaagacca tacacttcca agcactcttg gggaaagact 240 tacggagaac acaagagaca cttggagttc tctcacgacc aatacagaga gttgcagaga 300 tacgctgagg aagttggtat cttcttcact gcttctggaa tggacgaaat ggctgttgag 360 ttcttgcacg agttgaacgt tccattcttc aaagttggtt ccggtgacac taacaacttc 420 ccatacttgg aaaagactgc taagaaaggt agaccaatgg ttatctcctc tggaatgcag 480 tctatggaca ctatgaagca ggtttaccag atcgttaagc cattgaaccc aaacttttgt 540 ttcttgcagt gtacttccgc ttacccattg caaccagagg acgttaattt gagagttatc 600 tccgagtacc agaagttgtt cccagacatc ccaattggtt actctggtca cgagactggt 660 attgctattt ccgttgctgc tgttgctttg ggtgctaagg ttttggagag acacatcact 720 ttggacaaga cttggaaggg ttctgatcac tctgcttctt tggaacctgg tgagttggct 780 gaacttgtta gatcagttag attggttgag agagctttgg gttccccaac taagcaattg 840 ttgccatgtg agatggcttg taacgagaag ttgggaaagt ccgttgttgc taaggttaag 900 atcccagagg gtactatctt gactatggac atgttgactg ttaaagttgg agagccaaag 960 ggttacccac cagaggacat ctttaacttg gttggtaaaa aggttttggt tactgttgag 1020 gaggacgaca ctattatgga ggagttggtt gacaaccacg gaaagaagat caagtcctag 1080 <210> 96 <211> 1092 <212> DNA <213> Artificial Sequence <220> <223> Encodes mouse alpha-2,6-sialyl transferase catalytic domain (MmmST6) (codon optimized) <400> 96 gtttttcaaa tgccaaagtc ccaggagaaa gttgctgttg gtccagctcc acaagctgtt 60 ttctccaact ccaagcaaga tccaaaggag ggtgttcaaa tcttgtccta cccaagagtt 120 actgctaagg ttaagccaca accatccttg caagtttggg acaaggactc cacttactcc 180 aagttgaacc caagattgtt gaagatttgg agaaactact tgaacatgaa caagtacaag 240 gtttcctaca agggtccagg tccaggtgtt aagttctccg ttgaggcttt gagatgtcac 300 ttgagagacc acgttaacgt ttccatgatc gaggctactg acttcccatt caacactact 360 gaatgggagg gatacttgcc aaaggagaac ttcagaacta aggctggtcc atggcataag 420 tgtgctgttg tttcttctgc tggttccttg aagaactccc agttgggtag agaaattgac 480 aaccacgacg ctgttttgag attcaacggt gctccaactg acaacttcca gcaggatgtt 540 ggtactaaga ctactatcag attggttaac tcccaattgg ttactactga gaagagattc 600 ttgaaggact ccttgtacac tgagggaatc ttgattttgt gggacccatc tgtttaccac 660 gctgacattc cacaatggta tcagaagcca gactacaact tcttcgagac ttacaagtcc 720 tacagaagat tgcacccatc ccagccattc tacatcttga agccacaaat gccatgggaa 780 ttgtgggaca tcatccagga aatttcccca gacttgatcc aaccaaaccc accatcttct 840 ggaatgttgg gtatcatcat catgatgact ttgtgtgacc aggttgacat ctacgagttc 900 ttgccatcca agagaaagac tgatgtttgt tactaccacc agaagttctt cgactccgct 960 tgtactatgg gagcttacca cccattgttg ttcgagaaga acatggttaa gcacttgaac 1020 gaaggtactg acgaggacat ctacttgttc ggaaaggcta ctttgtccgg tttcagaaac 1080 aacagatgtt ag 1092 <210> 97 <211> 2172 <212> DNA <213> Artificial Sequence <220> <223> Encodes human UDP-GlcNAc 2-epimerase/N-acetylmannosamine kinase (HsGNE) (codon optimized) <400> 97 atggaaaaga acggtaacaa cagaaagttg agagtttgtg ttgctacttg taacagagct 60 gactactcca agttggctcc aatcatgttc ggtatcaaga ctgagccaga gttcttcgag 120 ttggacgttg ttgttttggg ttcccacttg attgatgact acggtaacac ttacagaatg 180 atcgagcagg acgacttcga catcaacact agattgcaca ctattgttag aggagaggac 240 gaagctgcta tggttgaatc tgttggattg gctttggtta agttgccaga cgttttgaac 300 agattgaagc cagacatcat gattgttcac ggtgacagat tcgatgcttt ggctttggct 360 acttccgctg ctttgatgaa cattagaatc ttgcacatcg agggtggtga agtttctggt 420 actatcgacg actccatcag acacgctatc actaagttgg ctcactacca tgtttgttgt 480 actagatccg ctgagcaaca cttgatttcc atgtgtgagg accacgacag aattttgttg 540 gctggttgtc catcttacga caagttgttg tccgctaaga acaaggacta catgtccatc 600 atcagaatgt ggttgggtga cgacgttaag tctaaggact acatcgttgc tttgcagcac 660 ccagttacta ctgacatcaa gcactccatc aagatgttcg agttgacttt ggacgctttg 720 atctccttca acaagagaac tttggttttg ttcccaaaca ttgacgctgg ttccaaagag 780 atggttagag ttatgagaaa gaagggtatc gaacaccacc caaacttcag agctgttaag 840 cacgttccat tcgaccaatt catccagttg gttgctcatg ctggttgtat gatcggtaac 900 tcctcctgtg gtgttagaga agttggtgct ttcggtactc cagttatcaa cttgggtact 960 agacagatcg gtagagagac tggagaaaac gttttgcatg ttagagatgc tgacactcag 1020 gacaagattt tgcaggcttt gcacttgcaa ttcggaaagc agtacccatg ttccaaaatc 1080 tacggtgacg gtaacgctgt tccaagaatc ttgaagtttt tgaagtccat cgacttgcaa 1140 gagccattgc agaagaagtt ctgtttccca ccagttaagg agaacatctc ccaggacatt 1200 gaccacatct tggagacatt gtccgctttg gctgttgatt tgggtggaac taacttgaga 1260 gttgctatcg tttccatgaa gggagagatc gttaagaagt acactcagtt caacccaaag 1320 acttacgagg agagaatcaa cttgatcttg cagatgtgtg ttgaagctgc tgctgaggct 1380 gttaagttga actgtagaat cttgggtgtt ggtatctcta ctggtggtag agttaatcca 1440 agagagggta tcgttttgca ctccactaag ttgattcagg agtggaactc cgttgatttg 1500 agaactccat tgtccgacac attgcacttg ccagtttggg ttgacaacga cggtaattgt 1560 gctgctttgg ctgagagaaa gttcggtcaa ggaaagggat tggagaactt cgttactttg 1620 atcactggta ctggtattgg tggtggtatc attcaccagc acgagttgat tcacggttct 1680 tccttctgtg ctgctgaatt gggacacttg gttgtttctt tggacggtcc agactgttct 1740 tgtggttccc acggttgtat tgaagcttac gcatcaggaa tggcattgca gagagaggct 1800 aagaagttgc acgacgagga cttgttgttg gttgagggaa tgtctgttcc aaaggacgag 1860 gctgttggtg ctttgcattt gatccaggct gctaagttgg gtaatgctaa ggctcagtcc 1920 atcttgagaa ctgctggtac tgctttggga ttgggtgttg ttaatatctt gcacactatg 1980 aacccatcct tggttatctt gtccggtgtt ttggcttctc actacatcca catcgttaag 2040 gacgttatca gacagcaagc tttgtcctcc gttcaagacg ttgatgttgt tgtttccgac 2100 ttggttgacc cagctttgtt gggtgctgct tccatggttt tggactacac tactagaaga 2160 atctactaat ag 2172 <210> 98 <211> 1302 <212> DNA <213> Artificial Sequence <220> <223> Pichia pastoris TRP2: 5' and ORF <400> 98 actgggcctt tagagggtgc tgaagttgac cccttggtgc ttctggaaaa agaactgaag 60 ggcaccagac aagcgcaact tcctggtatt cctcgtctaa gtggtggtgc cataggatac 120 atctcgtacg attgtattaa gtactttgaa ccaaaaactg aaagaaaact gaaagatgtt 180 ttgcaacttc cggaagcagc tttgatgttg ttcgacacga tcgtggcttt tgacaatgtt 240 tatcaaagat tccaggtaat tggaaacgtt tctctatccg ttgatgactc ggacgaagct 300 attcttgaga aatattataa gacaagagaa gaagtggaaa agatcagtaa agtggtattt 360 gacaataaaa ctgttcccta ctatgaacag aaagatatta ttcaaggcca aacgttcacc 420 tctaatattg gtcaggaagg gtatgaaaac catgttcgca agctgaaaga acatattctg 480 aaaggagaca tcttccaagc tgttccctct caaagggtag ccaggccgac ctcattgcac 540 cctttcaaca tctatcgtca tttgagaact gtcaatcctt ctccatacat gttctatatt 600 gactatctag acttccaagt tgttggtgct tcacctgaat tactagttaa atccgacaac 660 aacaacaaaa tcatcacaca tcctattgct ggaactcttc ccagaggtaa aactatcgaa 720 gaggacgaca attatgctaa gcaattgaag tcgtctttga aagacagggc cgagcacgtc 780 atgctggtag atttggccag aaatgatatt aaccgtgtgt gtgagcccac cagtaccacg 840 gttgatcgtt tattgactgt ggagagattt tctcatgtga tgcatcttgt gtcagaagtc 900 agtggaacat tgagaccaaa caagactcgc ttcgatgctt tcagatccat tttcccagca 960 ggtaccgtct ccggtgctcc gaaggtaaga gcaatgcaac tcataggaga attggaagga 1020 gaaaagagag gtgtttatgc gggggccgta ggacactggt cgtacgatgg aaaatcgatg 1080 gacacatgta ttgccttaag aacaatggtc gtcaaggacg gtgtcgctta ccttcaagcc 1140 ggaggtggaa ttgtctacga ttctgacccc tatgacgagt acatcgaaac catgaacaaa 1200 atgagatcca acaataacac catcttggag gctgagaaaa tctggaccga taggttggcc 1260 agagacgaga atcaaagtga atccgaagaa aacgatcaat ga 1302 <210> 99 <211> 1085 <212> DNA <213> Artificial Sequence <220> <223> Pichia pastoris TRP2 3' region <400> 99 acggaggacg taagtaggaa tttatgtaat catgccaata catctttaga tttcttcctc 60 ttctttttaa cgaaagacct ccagttttgc actctcgact ctctagtatc ttcccatttc 120 tgttgctgca acctcttgcc ttctgtttcc ttcaattgtt cttctttctt ctgttgcact 180 tggccttctt cctccatctt tcgttttttt tcaagccttt tcagcagttc ttcttccaag 240 agcagttctt tgattttctc tctccaatcc accaaaaaac tggatgaatt caaccgggca 300 tcatcaatgt tccactttct ttctcttatc aataatctac gtgcttcggc atacgaggaa 360 tccagttgct ccctaatcga gtcatccaca aggttagcat gggccttttt cagggtgtca 420 aaagcatctg gagctcgttt attcggagtc ttgtctggat ggatcagcaa agactttttg 480 cggaaagtct ttcttatatc ttccggagaa caacctggtt tcaaatccaa gatggcatag 540 ctgtccaatt tgaaagtgga aagaatcctg ccaatttcct tctctcgtgt cagctcgttc 600 tcctcctttt gcaacaggtc cacttcatct ggcatttttc tttatgttaa ctttaattat 660 tattaattat aaagttgatt atcgttatca aaataatcat attcgagaaa taatccgtcc 720 atgcaatata taaataagaa ttcataataa tgtaatgata acagtacctc tgatgacctt 780 tgatgaaccg caattttctt tccaatgaca agacatccct ataatacaat tatacagttt 840 atatatcaca aataatcacc tttttataag aaaaccgtcc tctccgtaac agaacttatt 900 atccgcacgt tatggttaac acactactaa taccgatata gtgtatgaag tcgctacgag 960 atagccatcc aggaaactta ccaattcatc agcactttca tgatccgatt gttggcttta 1020 ttctttgcga gacagatact tgccaatgaa ataactgatc ccacagatga gaatccggtg 1080 ctcgt 1085 <210> 100 <211> 747 <212> DNA <213> Artificial Sequence <220> <223> 5'-Region of STE13 <400> 100 ttgggggcct ccaggacttg ctgaaatttg ctgactcatc ttcgccatcc aaggataatg 60 agttagctaa tgtgacagtt aatgagtcgt cttgactaac ggggaacatt tcattattta 120 tatccagagt caatttgata gcagagtttg tggttgaaat acctatgatt cgggagactt 180 tgttgtaacg accattatcc acagtttgga ccgtgaaaat gtcatcgaag agagcagacg 240 acatattatc tattgtggta agtgatagtt ggaagtccga ctaaggcatg aaaatgagaa 300 gactgaaaat ttaaagtttt tgaaaacact aatcgggtaa taacttggaa attacgttta 360 cgtgccttta gctcttgtcc ttacccctga taatctatcc atttcccgag agacaatgac 420 atctcggaca gctgagaacc cgttcgatat agagcttcaa gagaatctaa gtccacgttc 480 ttccaattcg tccatattgg aaaacattaa tgagtatgct agaagacatc gcaatgattc 540 gctttcccaa gaatgtgata atgaagatga gaacgaaaat ctcaattata ctgataactt 600 ggccaagttt tcaaagtctg gagtatcaag aaagagctgt atgctaatat ttggtatttg 660 ctttgttatc tggctgtttc tctttgcctt gtatgcgagg gacaatcgat tttccaattt 720 gaacgagtac gttccagatt caaacag 747 <210> 101 <211> 924 <212> DNA <213> Artificial Sequence <220> <223> 3'-Region of STE13 <400> 101 ctactgggaa ccacgagaca tcactgcagt agtttccaag tggatttcag atcactcatt 60 tgtgaatcct gacaaaactg cgatatgggg gtggtcttac ggtgggttca ctacgcttaa 120 gacattggaa tatgattctg gagaggtttt caaatatggt atggctgttg ctccagtaac 180 taattggctt ttgtatgact ccatctacac tgaaagatac atgaaccttc caaaggacaa 240 tgttgaaggc tacagtgaac acagcgtcat taagaaggtt tccaatttta agaatgtaaa 300 ccgattcttg gtttgtcacg ggactactga tgataacgtg cattttcaga acacactaac 360 cttactggac cagttcaata ttaatggtgt tgtgaattac gatcttcagg tgtatcccga 420 cagtgaacat agcattgccc atcacaacgc aaataaagtg atctacgaga ggttattcaa 480 gtggttagag cgggcattta acgatagatt tttgtaacat tccgtacttc atgccatact 540 atatatcctg caaggtttcc ctttcagaca caataattgc tttgcaattt tacataccac 600 caattggcaa aaataatctc ttcagtaagt tgaatgcttt tcaagccagc accgtgagaa 660 attgctacag cgcgcattct aacatcactt taaaattccc tcgccggtgc tcactggagt 720 ttccaaccct tagcttatca aaatcgggtg ataactctga gttttttttt tcacttctat 780 tcctaaacct tcgcccaatg ctaccacctc caatcaacat cccgaaatgg atagaagaga 840 atggacatct cttgcaacct ccggttaata attactgtct ccacagagga ggatttacgg 900 taatgattgt aggtgggcct aatg 924 <210> 102 <211> 980 <212> DNA <213> Artificial Sequence <220> <223> 5'-Region of DAP2 <400> 102 cacctgggcc tgttgctgct ggtactgctg ttggaactgt tggtattgtt gctgatctaa 60 ggccgcctgt tccacaccgt gtgtatcgaa tgcttgggca aaatcatcgc ctgccggagg 120 ccccactacc gcttgttcct cctgctcttg tttgttttgc tcattgatga tatcggcgtc 180 aatgaattga tcctcaatcg tgtggtggtg gtgtcgtgat tcctcttctt tcttgagtgc 240 cttatccata ttcctatctt agtgtaccaa taattttgtt aaacacacgc tgttgtttat 300 gaaaagtcgt caaaaggtta aaaattctac ttggtgtgtg tcagagaaag tagtgcagac 360 ccccagtttg ttgactagtt gagaaggcgg ctcactattg cgcgaatagc atgagaaatt 420 tgcaaacatc tggcaaagtg gtcaatacct gccaacctgc caatcttcgc gacggaggct 480 gttaagcggg ttgggttccc aaagtgaatg gatattacgg gcaggaaaaa cagccccttc 540 cacactagtc tttgctactg acatcttccc tctcatgtat cccgaacaca agtatcggga 600 gtatcaacgg agggtgccct tatggcagta ctccctgttg gtgattgtac tgctatacgg 660 gtctcatttg cttatcagca ccatcaactt gatacactat aaccacaaaa attatcatgc 720 acacccagtc aatagtggta tcgttcttaa tgagtttgct gatgacgatt cattctcttt 780 gaatggcact ctgaacttgg agaactggag aaatggtacc ttttccccta aatttcattc 840 cattcagtgg accgaaatag gtcaggaaga tgaccaggga tattacattc tctcttccaa 900 ttcctcttac atagtaaagt ctttatccga cccagacttt gaatctgttc tattcaacga 960 gtctacaatc acttacaacg 980 <210> 103 <211> 1117 <212> DNA <213> Artificial Sequence <220> <223> 3'-Region of DAP2 <400> 103 ggcagcaaag ccttacgttg atgagaatag actggccatt tggggttggt cttatggagg 60 ttacatgacg ctaaaggttt tagaacagga taaaggtgaa acattcaaat atggaatgtc 120 tgttgcccct gtgacgaatt ggaaattcta tgattctatc tacacagaaa gatacatgca 180 cactcctcag gacaatccaa actattataa ttcgtcaatc catgagattg ataatttgaa 240 gggagtgaag aggttcttgc taatgcacgg aactggtgac gacaatgttc acttccaaaa 300 tacactcaaa gttctagatt tatttgattt acatggtctt gaaaactatg atatccacgt 360 gttccctgat agtgatcaca gtattagata tcacaacggt aatgttatag tgtatgataa 420 gctattccat tggattaggc gtgcattcaa ggctggcaaa taaataggtg caaaaatatt 480 attagacttt ttttttcgtt cgcaagttat tactgtgtac cataccgatc caatccgtat 540 tgtaattcat gttctagatc caaaatttgg gactctaatt catgaggtct aggaagatga 600 tcatctctat agttttcagc ggggggctcg atttgcggtt ggtcaaagct aacatcaaaa 660 tgtttgtcag gttcagtgaa tggtaactgc tgctcttgaa ttggtcgtct gacaaattct 720 ctaagtgata gcacttcatc tacaatcatt tgcttcatcg tttctatatc gtccacgacc 780 tcaaacgaga aatcgaattt ggaagaacag acgggctcat cgttaggatc atgccaaacc 840 ttgagatatg gatgctctaa agcctcagta actgtaattc tgtgagtggg atctaccgtg 900 agcattcgat ccagtaagtc tatcgcttca gggttggcac cgggaaataa ctggctgaat 960 gggatcttgg gcatgaatgg cagggagcga acataatcct gggcacgctc tgatctgata 1020 gactgaagtg tctcttccga aacagtaccc agcgtactca aaatcaagtt caattgatcc 1080 acatagtctc ttcctctaaa aatgggtcgg ccaccta 1117 <210> 104 <211> 1666 <212> DNA <213> Artificial Sequence <220> <223> HYGR resistance cassette <400> 104 gatctgttta gcttgcctcg tccccgccgg gtcacccggc cagcgacatg gaggcccaga 60 ataccctcct tgacagtctt gacgtgcgca gctcaggggc atgatgtgac tgtcgcccgt 120 acatttagcc catacatccc catgtataat catttgcatc catacatttt gatggccgca 180 cggcgcgaag caaaaattac ggctcctcgc tgcggacctg cgagcaggga aacgctcccc 240 tcacagacgc gttgaattgt ccccacgccg cgcccctgta gagaaatata aaaggttagg 300 atttgccact gaggttcttc tttcatatac ttccttttaa aatcttgcta ggatacagtt 360 ctcacatcac atccgaacat aaacaaccat gggtaaaaag cctgaactca ccgcgacgtc 420 tgtcgagaag tttctgatcg aaaagttcga cagcgtctcc gacctgatgc agctctcgga 480 gggcgaagaa tctcgtgctt tcagcttcga tgtaggaggg cgtggatatg tcctgcgggt 540 aaatagctgc gccgatggtt tctacaaaga tcgttatgtt tatcggcact ttgcatcggc 600 cgcgctcccg attccggaag tgcttgacat tggggaattc agcgagagcc tgacctattg 660 catctcccgc cgtgcacagg gtgtcacgtt gcaagacctg cctgaaaccg aactgcccgc 720 tgttctgcag ccggtcgcgg aggccatgga tgcgatcgct gcggccgatc ttagccagac 780 gagcgggttc ggcccattcg gaccgcaagg aatcggtcaa tacactacat ggcgtgattt 840 catatgcgcg attgctgatc cccatgtgta tcactggcaa actgtgatgg acgacaccgt 900 cagtgcgtcc gtcgcgcagg ctctcgatga gctgatgctt tgggccgagg actgccccga 960 agtccggcac ctcgtgcacg cggatttcgg ctccaacaat gtcctgacgg acaatggccg 1020 cataacagcg gtcattgact ggagcgaggc gatgttcggg gattcccaat acgaggtcgc 1080 caacatcttc ttctggaggc cgtggttggc ttgtatggag cagcagacgc gctacttcga 1140 gcggaggcat ccggagcttg caggatcgcc gcggctccgg gcgtatatgc tccgcattgg 1200 tcttgaccaa ctctatcaga gcttggttga cggcaatttc gatgatgcag cttgggcgca 1260 gggtcgatgc gacgcaatcg tccgatccgg agccgggact gtcgggcgta cacaaatcgc 1320 ccgcagaagc gcggccgtct ggaccgatgg ctgtgtagaa gtactcgccg atagtggaaa 1380 ccgacgcccc agcactcgtc cgagggcaaa ggaataatca gtactgacaa taaaaagatt 1440 cttgttttca agaacttgtc atttgtatag tttttttata ttgtagttgt tctattttaa 1500 tcaaatgtta gcgtgattta tatttttttt cgcctcgaca tcatctgccc agatgcgaag 1560 ttaagtgcgc agaaagtaat atcatgcgtc aatcgtatgt gaatgctggt cgctatactg 1620 ctgtcgattc gatactaacg ccgccatcca gtgtcgaaaa cgagct 1666 <210> 105 <211> 365 <212> DNA <213> Artificial Sequence <220> <223> Sequence of Pichia pastoris TRP5 5' integration fragment <400> 105 acgacggcca aattcatgat acacactctg tttcagctgg tttggactac cctggagttg 60 gtcctgaatt ggctgcctgg aaagcaaatg gtagagccca attttccgct gtaactgatg 120 cccaagcatt agagggattc aaaatcctgt ctcaattgga agggatcatt ccagcactag 180 agtctagtca tgcaatctac ggcgcattgc aaattgcaaa gactatgtct tcggaccagt 240 ccttagttat taatgtatct ggaaggggtg ataaggacgt ccagagtgta gctgagattt 300 tacctaaatt gggacctcaa attggatggg atttgcgttt cagcgaagac attactaaag 360 agtga 365 <210> 106 <211> 613 <212> DNA <213> Artificial Sequence <220> <223> Sequence of Pichia pastoris TRP5 3' integration fragment <400> 106 tcgatagcac aatattcaac ttgactgggt gttaagaact aagagctctg ggaaactttg 60 tatttattac taccaacaca gtcaaattat tggatgtgtt tttttttcca gtacatttca 120 ctgagcagtt tgttatactc ggtctttaat ctccatatac atgcagattg taatacagat 180 ctgaacagtt tgattctgat tgatcttgcc accaatattc tatttttgta tcaagtaaca 240 gagtcaatga tcattggtaa cgtaacggtt ttcgtgtata gtagttagag cccatcttgt 300 aacctcattt cctcccatat taaagtatca gtgattcgct ggaacgatta actaagaaaa 360 aaaaaatatc tgcacatact catcagtctg taaatctaag tcaaaactgc tgtatccaat 420 agaaatcggg atatacctgg atgttttttc cacataaaca aacgggagtt cagcttactt 480 atggtgttga tgcaattcag tatgatccta ccaataaaac gaaactttgg gattttggct 540 gtttgaggga tcaaaagctg cacctttaca agattgacgg atcgaccatt agaccaaagc 600 aaatggccac caa 613 <210> 107 <211> 384 <212> DNA <213> Artificial Sequence <220> <223> Encodes human GM-CSF <400> 107 ccagctagat ctccatctcc atccactcaa ccatgggaac acgttaacgc tatccaagag 60 gctttgagat tgttgaactt gtccagagac actgctgctg aaatgaacga gactgttgag 120 gttatctccg agatgttcga cttgcaagag ccaacttgtt tgcagactag attggagttg 180 tacaagcagg gattgagagg atccttgact aagttgaagg gaccattgac tatgatggct 240 tcccactaca agcaacactg tccaccaact ccagaaacat cctgtgctac tcagatcatc 300 actttcgagt ccttcaaaga gaacttgaag gacttcttgt tggttatccc attcgactgt 360 tgggaaccag ttcaagaata ataa 384 <210> 108 <211> 126 <212> PRT <213> Homo sapiens <400> 108 Pro Ala Arg Ser Pro Ser Pro Ser Thr Gln Pro Trp Glu His Val Asn 1 5 10 15 Ala Ile Gln Glu Ala Leu Arg Leu Leu Asn Leu Ser Arg Asp Thr Ala 20 25 30 Ala Glu Met Asn Glu Thr Val Glu Val Ile Ser Glu Met Phe Asp Leu 35 40 45 Gln Glu Pro Thr Cys Leu Gln Thr Arg Leu Glu Leu Tyr Lys Gln Gly 50 55 60 Leu Arg Gly Ser Leu Thr Lys Leu Lys Gly Pro Leu Thr Met Met Ala 65 70 75 80 Ser His Tyr Lys Gln His Cys Pro Pro Thr Pro Glu Thr Ser Cys Ala 85 90 95 Thr Gln Ile Ile Thr Phe Glu Ser Phe Lys Glu Asn Leu Lys Asp Phe 100 105 110 Leu Leu Val Ile Pro Phe Asp Cys Trp Glu Pro Val Gln Glu 115 120 125 <210> 109 <211> 1275 <212> DNA <213> Artificial Sequence <220> <223> Encodes CWP1-GMCSF fusion protein <400> 109 atgttcaacc tgaaaactat tctcatctca acacttgcat cgatcgctgt tgccgaccaa 60 accttcggtg tccttctaat ccggagtgga tccccatatc actattcgac tctcactaat 120 agagacgaaa agattgttgc tggaggtggc aacaaaaaag tgaccctcac agatgaggga 180 gctctgaagt atgatggtgg taaatggata ggtcttgatg atgatggcta tgcggtacag 240 accgacaaac cagttacagg ttggagcact aacggtggat acctctattt tgaccaaggc 300 ttaattgttt gcacggagga ctatatcgga tatgtgaaga aacatggtga atgcaaaggt 360 gacagctatg gtatggcttg gaaggtactc ccagccgacg atgacaagga tgatgacaag 420 gatgatgata aagatgatga caaggattat gacgatgaca atgaccacgg tgatggtgat 480 tactattgct cgatcacagg aacctatgcc atcaaatcca aaggcagtaa gcatcaatac 540 gaggccatca aaaaagttga tgcacatcct catgtcttct ctgtaggagg agatcaggga 600 aacgatctga ttgtgacttt ccaaaaggat tgttcgctgg tagatcaaga taacagaggc 660 gtatatgttg accctaattc tggagaagtc ggaaacgttg acccttgggg agaactcacg 720 ccatctgtta aatgggatat tgacgacgga tacctgatct ttaatggtga gtccaatttc 780 aggtcatgtc catctggtaa tggatattca ttgtctatca aggattgtgt tgggggaact 840 gacattggcc ttaaagtatg ggagaaaggt ggaggttctt tggttaagag ggctccagct 900 agatctccat ctccatccac tcaaccatgg gaacacgtta acgctatcca agaggctttg 960 agattgttga acttgtccag agacactgct gctgaaatga acgagactgt tgaggttatc 1020 tccgagatgt tcgacttgca agagccaact tgtttgcaga ctagattgga gttgtacaag 1080 cagggattga gaggatcctt gactaagttg aagggaccat tgactatgat ggcttcccac 1140 tacaagcaac actgtccacc aactccagaa acatcctgtg ctactcagat catcactttc 1200 gagtccttca aagagaactt gaaggacttc ttgttggtta tcccattcga ctgttgggaa 1260 ccagttcaag aataa 1275 <210> 110 <211> 424 <212> PRT <213> Artificial Sequence <220> <223> CWP1-GMCSF fusion protein <400> 110 Met Phe Asn Leu Lys Thr Ile Leu Ile Ser Thr Leu Ala Ser Ile Ala 1 5 10 15 Val Ala Asp Gln Thr Phe Gly Val Leu Leu Ile Arg Ser Gly Ser Pro 20 25 30 Tyr His Tyr Ser Thr Leu Thr Asn Arg Asp Glu Lys Ile Val Ala Gly 35 40 45 Gly Gly Asn Lys Lys Val Thr Leu Thr Asp Glu Gly Ala Leu Lys Tyr 50 55 60 Asp Gly Gly Lys Trp Ile Gly Leu Asp Asp Asp Gly Tyr Ala Val Gln 65 70 75 80 Thr Asp Lys Pro Val Thr Gly Trp Ser Thr Asn Gly Gly Tyr Leu Tyr 85 90 95 Phe Asp Gln Gly Leu Ile Val Cys Thr Glu Asp Tyr Ile Gly Tyr Val 100 105 110 Lys Lys His Gly Glu Cys Lys Gly Asp Ser Tyr Gly Met Ala Trp Lys 115 120 125 Val Leu Pro Ala Asp Asp Asp Lys Asp Asp Asp Lys Asp Asp Asp Lys 130 135 140 Asp Asp Asp Lys Asp Tyr Asp Asp Asp Asn Asp His Gly Asp Gly Asp 145 150 155 160 Tyr Tyr Cys Ser Ile Thr Gly Thr Tyr Ala Ile Lys Ser Lys Gly Ser 165 170 175 Lys His Gln Tyr Glu Ala Ile Lys Lys Val Asp Ala His Pro His Val 180 185 190 Phe Ser Val Gly Gly Asp Gln Gly Asn Asp Leu Ile Val Thr Phe Gln 195 200 205 Lys Asp Cys Ser Leu Val Asp Gln Asp Asn Arg Gly Val Tyr Val Asp 210 215 220 Pro Asn Ser Gly Glu Val Gly Asn Val Asp Pro Trp Gly Glu Leu Thr 225 230 235 240 Pro Ser Val Lys Trp Asp Ile Asp Asp Gly Tyr Leu Ile Phe Asn Gly 245 250 255 Glu Ser Asn Phe Arg Ser Cys Pro Ser Gly Asn Gly Tyr Ser Leu Ser 260 265 270 Ile Lys Asp Cys Val Gly Gly Thr Asp Ile Gly Leu Lys Val Trp Glu 275 280 285 Lys Gly Gly Gly Ser Leu Val Lys Arg Ala Pro Ala Arg Ser Pro Ser 290 295 300 Pro Ser Thr Gln Pro Trp Glu His Val Asn Ala Ile Gln Glu Ala Leu 305 310 315 320 Arg Leu Leu Asn Leu Ser Arg Asp Thr Ala Ala Glu Met Asn Glu Thr 325 330 335 Val Glu Val Ile Ser Glu Met Phe Asp Leu Gln Glu Pro Thr Cys Leu 340 345 350 Gln Thr Arg Leu Glu Leu Tyr Lys Gln Gly Leu Arg Gly Ser Leu Thr 355 360 365 Lys Leu Lys Gly Pro Leu Thr Met Met Ala Ser His Tyr Lys Gln His 370 375 380 Cys Pro Pro Thr Pro Glu Thr Ser Cys Ala Thr Gln Ile Ile Thr Phe 385 390 395 400 Glu Ser Phe Lys Glu Asn Leu Lys Asp Phe Leu Leu Val Ile Pro Phe 405 410 415 Asp Cys Trp Glu Pro Val Gln Glu 420 <210> 111 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> KEX2 linker <400> 111 Gly Gly Gly Ser Leu Val Lys Arg 1 5

Claims

(a) 이종성 단일-서브유닛 리슈마니아 메이저(Leishmania major) STT3D 단백질 올리고사카릴트랜스퍼라제(oligosaccharyltransferase)를 코딩하는 하나 이상의 핵산 분자 및 이종성 당단백질을 코딩하는 핵산 분자를 포함하고, 이때 내인성 OTase 복합체를 구성하는 단백질을 코딩하는 내인성 피키아 파스토리스(Pichia pastoris) 숙주 세포 유전자가 발현되는 것인 피키아 파스토리스 숙주 세포를 제공하는 단계, 및
(b) 피키아 파스토리스 숙주 세포를 이종성 당단백질을 발현시키기 위한 조건 하에 배양하여 이종성 당단백질을 생산하는 단계
를 포함하는, 피키아 파스토리스 숙주 세포에서 이종성 당단백질을 생산하는 방법.
삭제
삭제
제1항에 있어서, 피키아 파스토리스 숙주 세포에 의해 생산된 이종성 당단백질의 70％ 이상이, 완전히 점유된 N-글리코실화 부위를 갖는 것인 방법.
제1항에 있어서, 피키아 파스토리스 숙주 세포가 GlcNAcMan₃GlcNAc₂, GalGlcNAcMan₃GlcNAc₂, NANAGalGlcNAcMan₃GlcNAc₂, Man₅GlcNAc₂, GlcNAcMan₅GlcNAc₂, GalGlcNAcMan₅GlcNAc₂, 및 NANAGalGlcNAcMan₅GlcNAc₂로부터 선택된 하나 이상의 N-글리칸을 포함하는 당단백질을 생산하도록 유전자 조작된 것인 방법.
제1항에 있어서, 이종성 당단백질이 에리트로포이에틴 (EPO), 시토카인, 인터페론 α, 인터페론 β, 인터페론 γ, 인터페론 ω, 과립구-콜로니 자극 인자 (GCSF), 과립구 대식세포-콜로니 자극 인자 (GM-CSF), 응고 인자 VIII, 응고 인자 IX, 응고 인자 인간 단백질 C, 항트롬빈 III, 트롬빈, 가용성 IgE 수용체 α-사슬, IgG, IgG 단편, IgG 융합물, IgM, 이뮤노어드헤신, Fc 융합 단백질, 가용성 TNF 수용체-Fc 융합 단백질, RAGE-Fc 융합 단백질, 인터류킨, 유로키나제(urokinase), 키마제(chymase), 우레아 트립신 억제제, IGF-결합 단백질, 표피 성장 인자, 성장 호르몬-방출 인자, 아넥신 V 융합 단백질, 안지오스타틴, 혈관 내피 성장 인자-2, 골수성 전구세포 억제 인자-1, 오스테오프로테게린, α-1-항트립신, α-태아 단백질, DNase II, 인간 플라스미노겐의 크링글(kringle) 3, 글루코세레브로시다제(glucocerebrosidase), TNF 결합 단백질 1, 여포 자극 호르몬, 세포독성 T 림프구 관련 항원 4 - Ig, 막횡단 활성화제 및 칼슘 조정제, 시클로필린 리간드, 글루카곤 유사 단백질 1, 또는 IL-2 수용체 효능제인 방법.
제1항에 있어서, 이종성 당단백질이 항-Her2 항체, 항-RSV (호흡기 세포융합 바이러스) 항체, 항-TNFα 항체, 항-VEGF 항체, 항-CD3 수용체 항체, 항-CD41 7E3 항체, 항-CD25 항체, 항-CD52 항체, 항-CD33 항체, 항-IgE 항체, 항-CD11a 항체, 항-EGF 수용체 항체, 또는 항-CD20 항체인 방법.
삭제
제1항에 있어서, 피키아 파스토리스가 알파-1,6-만노실트랜스퍼라제 활성을 결여한 och1 돌연변이체가 되도록 유전자 조작된 것인 방법.
(a) 이종성 단일-서브유닛 리슈마니아 메이저 STT3D 단백질 올리고사카릴트랜스퍼라제를 코딩하는 하나 이상의 핵산 분자 및 당단백질을 코딩하는 핵산 분자를 포함하고, 이때 내인성 OTase 복합체를 코딩하는 재조합 피키아 파스토리스 숙주 세포 유전자가 발현되는 것인 재조합 피키아 파스토리스 숙주 세포를 제공하는 단계, 및
(b) 재조합 피키아 파스토리스 숙주 세포를 당단백질을 발현시키기 위한 조건 하에 배양하여 조성물 내의 당단백질 상의 N-글리코실화 부위의 70％ 이상이 N-글리칸으로 점유된 조성물을 생산하는 단계
를 포함하는, 조성물 내의 당단백질 상의 N-글리코실화 부위의 70％ 이상이 N-글리칸으로 점유된 당단백질 조성물을 생산하는 방법.
삭제
삭제
(a) 이종성 단일-서브유닛 리슈마니아 메이저 STT3D 단백질 올리고사카릴트랜스퍼라제를 코딩하는 제1 핵산 분자; 및
(b) 이종성 당단백질을 코딩하는 제2 핵산 분자
를 포함하고, 내인성 올리고사카릴트랜스퍼라제 (OTase) 복합체를 구성하는 단백질을 코딩하는 유전자를 발현하는 피키아 파스토리스 숙주 세포.
삭제
삭제
제13항에 있어서, GlcNAcMan₃GlcNAc₂, GalGlcNAcMan₃GlcNAc₂, NANAGalGlcNAcMan₃GlcNAc₂, Man₅GlcNAc₂, GlcNAcMan₅GlcNAc₂, GalGlcNAcMan₅GlcNAc₂, 및 NANAGalGlcNAcMan₅GlcNAc₂로부터 선택된 하나 이상의 포유동물- 또는 인간-유사 N-글리칸을 포함하는 당단백질을 생산하도록 유전자 조작된 피키아 파스토리스 숙주 세포.
제13항에 있어서, 이종성 당단백질이 에리트로포이에틴 (EPO), 시토카인, 인터페론 α, 인터페론 β, 인터페론 γ, 인터페론 ω, 과립구-콜로니 자극 인자 (GCSF), 과립구 대식세포-콜로니 자극 인자 (GM-CSF), 응고 인자 VIII, 응고 인자 IX, 응고 인자 인간 단백질 C, 항트롬빈 III, 트롬빈, 가용성 IgE 수용체 α-사슬, IgG, IgG 단편, IgG 융합물, IgM, 이뮤노어드헤신, Fc 융합 단백질, 가용성 TNF 수용체-Fc 융합 단백질, RAGE-Fc 융합 단백질, 인터류킨, 유로키나제(urokinase), 키마제(chymase), 우레아 트립신 억제제, IGF-결합 단백질, 표피 성장 인자, 성장 호르몬-방출 인자, 아넥신 V 융합 단백질, 안지오스타틴, 혈관 내피 성장 인자-2, 골수성 전구세포 억제 인자-1, 오스테오프로테게린, α-1-항트립신, α-태아 단백질, DNase II, 인간 플라스미노겐의 크링글(kringle) 3, 글루코세레브로시다제(glucocerebrosidase), TNF 결합 단백질 1, 여포 자극 호르몬, 세포독성 T 림프구 관련 항원 4 - Ig, 막횡단 활성화제 및 칼슘 조정제, 시클로필린 리간드, 글루카곤 유사 단백질 1, 또는 IL-2 수용체 효능제인 피키아 파스토리스 숙주 세포.
제13항에 있어서, 이종성 당단백질이 항-Her2 항체, 항-RSV (호흡기 세포융합 바이러스) 항체, 항-TNFα 항체, 항-VEGF 항체, 항-CD3 수용체 항체, 항-CD41 7E3 항체, 항-CD25 항체, 항-CD52 항체, 항-CD33 항체, 항-IgE 항체, 항-CD11a 항체, 항-EGF 수용체 항체, 또는 항-CD20 항체인 피키아 파스토리스 숙주 세포.
삭제
제13항에 있어서, 피키아 파스토리스가 알파-1,6-만노실트랜스퍼라제 활성을 결여한 och1 돌연변이체가 되도록 유전자 조작된 것인 피키아 파스토리스 숙주 세포.
삭제
삭제
삭제
삭제
삭제
삭제