피히아 파스토리스에서의 단백질 글리코실화 변형{PROTEIN GLYCOSYLATION MODIFICATION IN PICHIA PASTORIS}
본 발명은 글리코실화가 감소된 당단백질을 생산하기 위하여 메탄올 자화(methylotrophic) 효모 균주의 글리코실화 과정을 유전적으로 변형시키는데 유용한 벡터 및 방법에 관한 것이다. 본 발명은 또한 본 발명의 방법 및 벡터를 사용하여 생성된 메탄올 자화효모 균주와 이러한 유전적으로 변형된 균주로부터 생산된 당단백질에 관한 것이다.
피히아 파스토리스(Pichia Pastoris)를 포함하는 메탄올 자화효모는 상업적 또는 의약적으로 중요한 재조합 단백질을 생산하기 위하여 광범위하게 사용되고 있다. 그러나, 몇 몇 치료적 당단백질의 생산 및 의약적 적용은 이들 효모와 포유 동물과 같은 표적 생물 사이의 단백질 결합(protein-linked) 탄수화물 생분해에 있어서의 차이점들에 의하여 제한될 수 있다.
단백질 N-글리코실화는 돌리콜(dolichol, 지질 담체 중간체) 상에 조립된 N-결합 올리고사카라이드(Glc3Man9GlcNAc2)가 발생기 단백질(nascent protein)의 적절한 아스파라긴(Asn)에 전달되는 장소인 소포체(endoplasmic reticulum, ER)에서 유 래한다. 이는 모든 진핵 생물 N-결합 당단백질에 공통적인 현상이다. ER 내의 특정 글루코시다아제 및 α-1,2-결합 만노시다제에 의하여 3 개의 글루코스 잔기 및 하나의 특정 α-1,2-결합 만노스 잔기가 제거되어, 중심(core) 올리고사카라이드 구조, Man8GIcNAc2가 된다. 이러한 중심 당 구조가 당 부분이 다양한 변형을 거치는 골지체로 운반된다. 효모와 고등 진핵 생물 간의 골지체 내 당 사슬의 변형에 있어서 상당한 차이점이 있다.
표유류 세포에 있어서, 당 사슬의 변형은 그것이 첨가될 단백질 부분에 따라 3 가지의 다른 경로를 거쳐서 진행된다. 즉, (1) 중심 당 사슬을 변형시키지 않거나; (2) UDP-N-아세틸글루코사민(UDP-GlcNAc) 내의 N-아세틸글루코사민-1-포스페이트 부분(GlcNAc-1-P)을 중심 당 사슬 내 만노스의 6-위치에 첨가하여 중심 당 사슬을 변형시킨 후, GIcNAc 부분을 제거하여, 당 단백질 내에 산성 당 사슬을 형성시키거나; 또는 (3) 우선 만노시다제 I로 3 개의 만노스 잔기를 제거하여 중심 당 사슬이 Man5GlcNAc2로 전환시키고; GIcNAc를 첨가하고 2 개의 만노스 잔기를 추가적으로 제거한 후, GIcNAc, 칼락토오스(Gal) 및 N-아세틸뉴라민산((NeuNAc, 시알산이라고도 불림)을 연속적으로 첨가하여 다양한 혼성(hybrid) 또는 복합(complex) 당 사슬을 형성함으로써 Man5GlcNAc2를 추가적으로 변형시킨다(R. Kornfeld and S. Kornfeld, Ann. Rev. Biochem. 54: 631-664,1985; ChibaetalJ. Biol. Chem. 273: 26298-26304,1998).
효모에 있어서, 골지체 내에서의 당 사슬의 변형은 상이한 만노실트랜스퍼라 제(mannosyltransferases)에 의한 일련의 만노스 잔기의 추가를 수반한다("외부 사슬(outer chain)" 글리코실화). 외부 사슬 글리코실화의 구조는 생물에 따라 특유하여, S. cerevisiae에서는 전형적으로 50 개 이상의 만노스 잔기를 가지며, Pichia pastoris에서는 가장 일반적으로 Manl4GlcNAc2보다 작은 구조를 갖는다. 이러한 고 만노스 타입의 효모-특이적 외부 사슬 글리코실화는 또한 과글리코실화(hyperglycosylation)를 나타낸다.
과글리코실화는 탄수화물 조성과 분자량 모두에 있어서 재조합 단백질 산물의 이질성을 초래하여 단백질 정제를 복잡하게 할 것이기 때문에 종종 바람직하지 못하다. 과글리코실화된 효소의 특유한 활성(유니트/중량)이 탄수화물의 증가된 부분에 의하여 감소될 수 있다.
또한, 외부 사슬 글리코실화는 강력한 면역성이어서 치료적 적용에 바람직하지 못하다. 게다가, 많은 외부 사슬 당은 치료적 단백질의 면역성 결정자(determinant)를 마스킹(mask) 할 수 있다. 예컨대, 피. 파스토리스(P. pastoris)에서 발현되는 인플루엔자 뉴라미니다아제(influenza neuraminidase, NA)는 만노오스 잔기를 30-40개 까지 포함하는 N-클리칸으로 글리코실화된다. 과글리코실화된 NA는, NA 분자 위에 가변성의 면역우성 표면 루프가 N-글리칸에 의하여 마스킹되어 있어서, 쥐에서 감소된 면역원성(immunogenicity)을 갖는다(Martinet et al. Eur J. Biochem. 247: 332-338,1997).
따라서, 단백질의 글리코실화가 조절될 수 있고, 많은 N-글리칸 측쇄들에 의하여 구조 또는 기능이 손상되지 않은 재조합 단백질이 생성될 수 있는 메탄올 자화효모 균주를 유전적으로 조작하는 것이 바람직하다.
발명의 요약
본 발명은 메탄올 자화효모 균주에서의 글리코실화 과정을 유전적으로 변형시켜 글리코실화가 감소된 당단백질을 제조하기 위하여 사용되는 방법 및 벡터에 관한 것이다. 또한, 본 발명은 본 발명의 방법 및 벡터를 사용하여 생성된 메탄올 자화효모 균주 및 이러한 유전적으로 변형된 균주로부터 생산되는 당단백질을 제공한다.
한 가지 구체예에 있어서, 본 발명은 글리코실화가 감소된 당단백질을 생산할 수 있는 유전적으로 조작된 메탄올 자화효모 균주를 제조하는데 유용한 벡터를 제공한다.
한 가지 측면에 있어서, 본 발명은 메탄올 자화효모 균주에 의하여 생산되는 당단백질에서의 글리코실화의 감소를 초래하는 효소활성을 갖는 하나 또는 그 이상의 단백질을 메탄올 자화효모균주에서 발현시킬 수 있는 녹-인(knock-in) 벡터를 제공한다.
바람직한 구체예에 있어서, 본 발명의 녹-인 벡터는 α-1,2-만노시다제 또는 그것의 기능적 부분을 코딩하는 뉴클레오타이드 서열을 포함하며, α-1,2-만노시다제 또는 그것의 기능적 부분을 메탄올 자화효모 균주 내에서 발현시킬 수 있다. 바람직한 뉴클레오타이드 서열은 진균류(fungal species)의 α-1,2-만노시다제를 코딩하는 뉴클레오타이드 서열이며, 보다 바람직하게는, 트리코데르마 레세이(Trichoderma reesei)의 α-1,2-만노시다제를 코딩하는 뉴클레오타이드 서열이다. 바람직하게, α-1,2-만노시다제 발현 벡터는 벡터로부터 발현되는 α-1,2-만노시다제 또는 그것의 기능적 부분이 ER-체류 신호(ER-retention signal)를 포함하도록 조작된다. 바람직한 ER-체류 신호는 HDEL이다. α-1,2-만노시다제 코딩 서열은 구성성(constitutive) 또는 유도성(inducible) 프로모터, 및 3' 종결 서열과 작동가능하게 연결되어 있다. 벡터는 통합성(integrative) 벡터 또는 복제성(replicative) 벡터일 수 있다. 특히, α-1,2-만노시다제 발현 벡터는 pGAPZMFManHDEL, pGAPZMFManMycHDEL, pPICZBMFManMycHDEL, pGAPZmManHDEL, pGAPZmMycManHDEL, pPIC9mMycManHDEL 및 pGAPZmMycManHDEL를 포함하는 것이 바람직하다.
또 다른 바람직한 구체예에 있어서, 본 발명의 녹-인 벡터는 글루코시다제 II 또는 그것의 기능적 부분을 코딩하는 서열을 포함하고, 메탄올 자화효모 균주에서 글루코시다제 II 또는 그것의 기능적 부분을 발현시킬 수 있다. 바람직한 뉴클레오타이드 서열은 진균류의 글루코시다제 II를 코딩하는 뉴클레오타이드 서열이며, 보다 바람직하게는, 사카로마이세스 세레비시애(Saccharomyces cerevisiae)의 글루코시다제 II를 코딩하는 뉴클레오타이드 서열이다. 바람직하게, 글루코시다제 II 발현 벡터는 벡터로부터 발현된 글루코시다제 II 또는 그것의 기능적 부분이 ER-체류 신호를 포함하도록 조작된다. 바람직한 ER-체류 신호는 HDEL이다. 글루코시다제 II 코딩 서열은 구성성 또는 유도성 프로모터, 및 3' 종결 서열과 작동가능하게 연결된다. 벡터는 통합성(integrative) 벡터 또는 복제성(replicative) 벡터일 수 있다. 특히 바람직한 글루코시다제 II 발현벡터는 pGAPZAGLSII, pPICZAGLSII, pAOX2ZAGLSII, pYPTIZAGLSII, pGAPADEglsII, pPICADEglsII, pAOX2ADEglsII, pYPTIADEglsII, pGAPZAgIsIIHDEL 및 pGAPADEglsIIHDEL를 포함한다.
또한, 본 발명은 α-1,2-만노시다제 발현 단위와 글루코시다제 II 발현 단위를 모두 포함하는 발현벡터를 제공한다.
또 다른 측면에 있어서, 본 발명은, 메탄올 자화효모 균주 내로 도입되었을 때, 유전자를 불활성화시키거나 파괴하고, 이에 의하여 메탄올 자화효모 균주에서 생산된 당단백질의 글리코실화의 감소를 용이하게 하는, 녹-아웃(Knock-out) 벡터를 제공한다.
한 가지 구체예에 있어서, 본 발명은 메탄올 자화효모 균주 내로 도입되었을 때, Och1 유전자를 불활성화시키거나 파괴시키는 녹-아웃 벡터를 제공한다. 바람직한 Och1 녹-아웃 벡터는 pBLURA5'PpOCHl이다.
본 발명의 또 다른 구체예는 녹-인 단위와 녹-아웃 단위를 모두 포함하는 벡터를 제공한다.
게다가, 본 발명의 모든 녹-인 또는 녹아웃 벡터는 메탄올 자화효모에 있어서 중요한 이종 단백질을 발현시킬 수 있는 뉴클레오타이드 서열을 또한 포함할 수 있다.
본 발명의 또 다른 구체예는 효모를 하나 이상의 본 발명에 따른 벡터로 형질전환시킴으로써, 메탄올 자화효모에서의 글리코실화를 변형시키는 방법을 제공한다.
본 발명의 방법을 사용하여 변형될 수 있는 메탄올 자화효모 균주는, 칸디다속(genus Candida), 한세눌라속(genus Hansenula), 토룰롭시스속(genus Torulopsis), 및 피히아속(genus Pichia)효모와 같이, 메탄올에서 성장할 수 있는 효모 균주들을 포함하지만, 이에 한정되지는 않는다. 바람직한 메탄올 자화효모는 피히아속(genus Pichia)이다. 특히 바람직한 균주는 피히아 파스토리스(Pichia pastoris) 균주 GS115(NRRL Y-15851), GS190(NRRL Y-18014), PPFI(NRRL Y18017), PPY120H, yGC4, 및 이들로부터 유래되는 균주이다. 본 발명의 방법에 의하여 변형된 메탄올 자화효모 균주는 하나 이상의 중요한 이종 단백질을 발현시키도록 조작된 이들 메탄올 자화효모 균주들을 또한 포함한다. 미리 유전적으로 조작된 이들 균주들로부터 발현되는 이종 단백질 상에서의 글리코실화는 이러한 균주들을 하나 이상의 본 발명에 따른 벡터로 형질전환시킴으로써 감소될 수 있다.
본 발명의 또 다른 구체예는 본 발명의 방법의 수행으로 변형된 메탄올 자화효모 균주를 제공한다.
본 발명의 또 다른 측면은 글리코실화가 감소된 당단백질을 생산하는 방법에 관한 것이다.
이러한 방법에 따른면, 당단백질을 발현시킬 수 있는 뉴클레오타이드 서열을 하나 이상의 본 발명에 따른 벡터를 이용하여 미리 형질전환시킨 메탄올 자화효모 균주 내로 도입시킬 수 있다. 또한, 당단백질을 발현하도록 유전적으로 조작된 메탄올 자화효모 균주를 하나 이상의 본 발명에 따른 벡터를 이용하여 형질전환시킬 수 있다. 게다가, 메탄올 자화효모 균주가 발현시키고자 하는 당단백질을 코딩하는 뉴클레오타이드 서열 또는 본 발명에 따른 벡터 중 어떤 것을 사용하여서도 형질전환되지 않았다면, 이러한 효모 균주를, 당단백질을 발현시킬 수 있는 뉴클레오타이드 서열과 하나 이상의 본 발명에 따른 벡터 모두를 사용하여, 연속적으로 또는 동시에, 형질전환시킬 수 있다. 또한, 메탄올 자화효모 균주에서 당단백질을 발현시킬 수 있는 뉴클레오타이드 서열을 또한 포함하는 하나 이상의 본 발명의 녹-인 및/또는 녹-아웃 벡터를 사용하여 형질전환시킬 수 있다.
본 발명에 따른 방법을 사용하여 생산된 당단백질 산물, 즉, N-글리코실화가 감소된 당단백질 또한 본 발명의 일부분이다.
본 발명은 하나 이상의 본 발명에 따른 벡터, 글리코실화가 감소된 당단백질을 생산하도록 변형된 하나 이상의 균주를 포함하는 키트도 또한 제공한다.
피히아속(Pichia)의 소포체(ER)에서 운반되는 당단백질 상의 N-글리칸의 대부분은 중심 Man8GlcNAc2 올리고사카라이드 구조를 갖는다는 것이 확립되어 있다. 단백질이 소포체에서 골지체로 운반된 후, 서로 다른 만노실트랜스퍼라제(mannosyltransferases)에 의하여 추가적인 만노스 잔기가 이들 중심 당 부분에 첨가되어 많은 만노스 측쇄를 갖는 당단백질을 만든다. 이러한 재조합 당단백질의 과글리코실화는 많은 경우에 있어서 바람직하지 못하다. 따라서, 본 발명은 글리코실화가 감소된 당단백질을 생산하도록 메탄올 자화효모 균주를 유전적으로 변형시키기 위한 방법 및 벡터를 제공한다. 또한, 본 발명은 본 발명의 방법과 벡터들을 사용하여 생성된 메탄올 자화효모 뿐만 아니라, 이러한 유전적으로 변형된 균주로부터 생산되는 당단백질을 제공한다.
한 구체예에 있어서, 본 발명은 글리코실화가 감소된 당단백질을 생산하도록 메탄올 자화효모 균주를 유전적으로 변형시키는데 유용한 벡터를 제공한다.
하나의 측면에 있어서, 본 발명은 메탄올 자화효모 균주에서 이 메탄올 자화효모 균주에 의하여 생산되는 당단백질의 글리코실화의 감소를 초래하는 효소활성을 갖는 하나 이상의 단백질을 발현시킬 수 있는 "녹-인(knock-in)" 벡터를 제공한다. 본 발명에 따르면, 이러한 단백질은, 예컨대, α-1,2-만노시다제, 글루코시다제 II 또는 이들의 기능적 부분들을 포함한다.
바람직한 구체예에 있어서, 본 발명의 벡터는 α-1,2-만노시다제 또는 이들의 기능적 부분을 코딩하는 서열을 포함하며, 메탄올 자화효모 균주에서 α-1,2-만노시다제 또는 그 기능적 부분을 발현시킬 수 있다.
α-1,2-만노시다제는 Man8GlcNAc2의 비-환원(non-reducing) 말단의 α-1,2-결합 만노스 잔기를 절단하고, 이러한 당단백질 상의 중심 올리고사카라이드를 Man5GlcNAc2로 변환시킨다. 생체외에서, Man5GlcNAc2는 모든 피히아(Pichia) 골지 만노실트랜스퍼라제에 대하여 매우 열등한 기질이다. 즉, 만노스 잔기는 이러한 당 구조에 첨가될 수 없다. 이에 반해서, Man5GlcNAc2는 포유류 N-아세틸글루코사미닐-트랜스퍼라제 I에 대한 수용체 기질이며 포유류 당단백질의 혼성(hybrid)- 및 복합(complex)-형태 당 사슬 특성을 위한 중간체이다. 따라서, α-1,2-만노시다제를 피히아속과 같은 메탄올 자화효모 내로 도입시킴으로써, 감소된 만노스 함량을 갖는 당단백질을 생산할 수 있다.
본 발명에 따르면, 본 발명의 발현벡터에 사용되기 위한 α-1,2-만노시다제를 코딩하는 뉴클레오타이드 서열은 모든 종에서 유래할 수 있다. 예컨대, 아스퍼질루스(Aspergillus) α-1,2-만노시다제(msdS gene), 트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제(Maras et al. J. Biotechnol. 77: 255-263,2000), 또는 사카로마이세스 세레비시애(Saccharomyces cerevisiae) α-1,2-만노시다제를 코딩하는 진균류 유전자 뿐만 아니라, 예컨대, 쥐의 α-1,2-만노시다제(Herscovics et al. J. Biol. Chem. 269: 9864-9871,1994), 토끼의 α-1,2-만노시다제(Lal et al. J Biol. Chem. 269: 9872-9881,1994) 또는 인간 α-1,2-만노시다제(Tremblay et al. Glycobiology 8: 585-595,1998)를 코딩하는 포유류 유전자를 포함하는, 많은 α-1,2-만노시다제 유전자가 클로닝되었고, 본 발명이 속하는 기술분야의 통상의 지식을 가진자가 입수 가능하다. 단백질 서열 분석은 지금까지 동정된 진핵동물의 α-1,2-만노시다제 서열들이 고도로 보존적이라는 것을 나타낸다.
바람직하게, 본 발명의 벡터에 사용되는 뉴클레오타이드 서열은 진균류 α-1,2-만노시다제, 보다 바람직하게는 트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제, 더욱 바람직하게는 "Maras et al. J. Biotechnol. 77: 255-63 (2000)"에 기재된 트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제를 코딩한다.
본 발명에 따르면, 상기 뉴클레오타이드 서열은 또한 α-1,2-만노시다제의 기능적 부분만을 코딩할 수 있다.
"기능적 부분(functional part)"는 전장 단백질(full-length protein)의 효소적 활성을 실질적으로 보유하는 α-1,2-만노시다제의 폴리펩타이드 단편을 의미하는 것이다. "실질적으로(substantially)"는 전장 α-1,2-만노시다제 효소활성의 적어도 약 40%, 또는, 바람직하게는, 적어도 50% 또는 그 이상이 보유되는 것을 의미한다. 예컨대, 본 발명에 설명된 바와 같이, 쥐의 α-1,2-만노시다제 IB의 효소활성 도메인(catalytic domain)이 쥐의 α-1,2-만노시다제 IB의 "기능적 부분"을 구성한다. 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 이 기술분야에 공지된 기술들을 조합하여 α-1,2-만노시다제의 기능적 부분을 용이하게 동정하고 제조할 수 있다. 효소 활성의 부여에 필수적이거나 충분한 α-1,2-만노시다제의 부분은 단백질 서열 분석에 기초하여 예측할 수 있다. 적절한 발현 시스템으로부터 발현되고 정제되는 얻고자 하는 α-1,2-만노시다제 일부분의 활성은 하기에 설명된 생체외(in vitro) 또는 생체내(in vivo) 분석을 사용하여 검증될 수 있다.
본 발명에 따르면, 메탄올 자화효모 균주에서 발현되는 α-1,2-만노시다제 또는 이들의 기능적 부분은, Man8GIcNAc2(α-1,2-만노시다제의 기질)이 이미 당단백질 상에 생성되어 있지만 추가적인 만노스 잔기를 사용하여 당 사슬을 신장시키는 골지 글리코실트랜스퍼라제(Golgi glycosyltransferase)에는 도달하지 않은, 분비 경로 내의 한 부위에 표적화되는 것이 바람직하다.
따라서, 본 발명의 한 바람직한 구체예에 있어서, α-1,2-만노시다제 발현 벡터는 그 벡터로부터 발현되는 α-1,2-만노시다제 또는 이들의 기능적 부분이 ER-체류(ER-retention) 신호를 포함하도록 조작된다.
"ER 체류 신호"는 이러한 펩타이드 서열을 포함하는 단백질이 소포체(ER)로 운반되고 머무르게하는 단백질 서열을 의미한다. 이러한 ER 체류 서열은 종종 ER 내에서 존재하고 작용하는 단백질에서 발견할 수 있다.
예컨대, 에스. 세레비시애(S. cerevisiae) ER 단백질 MNS1의 처음 21개의 아미노산 잔기들(Martinet et al. Biotechnology Letters 20: 1171-1177,1998)과 같은, ER 체류 신호의 다양한 선정은 이 발명이 속하는 기술분야의 통상의 지식을 가진 자에게 가능하다. 본 발명에 사용되기 위하여 바람직한 ER 체류 신호는 펩타이드 HDEL(SEQ ID NO: 1)이다. 많은 효모 단백질의 C-말단에서 발견되는 HDEL 펩타이드 서열은 ER에 대한 체류/회복(retention/retrieval) 신호로서 작용한다(Pelham EMBO J. 7: 913-918,1988). HDEL 서열을 포함하는 단백질은 멤브레인-결합 수용체(Erd2p)에 의하여 결합되고, 그리고 나서, 골지체로부터 ER로 되돌아오기 위한 역방향 수송 경로(retrograde transport pathway)에 진입한다.
본 발명에 따르면, ER 체류 신호는 α-1,2-만노시다제의 단백질 서열 중 어디에도 위치할 수 있지만, α-1,2-만노시다제의 C-말단에 위치하는 것이 바람직하다.
본 발명에 사용되는 α-1,2-만노시다제는, 예컨대, 기술분야에 공지된 Myc, HA, FLAG 및 His6 택(tags)과 같은 에피토프 택을 항체가 이용가능한 위치로 삽입 시키는 것과 같이, 추가적으로 변형될 수 있다. 에피토프 표지된(epitope-tagged) α-1,2-만노시다제는 간편하게 정제할 수 있고, 발현과 세포내 위치화(localization) 모두에 대하여 간편하게 모니터링할 수 있다.
ER 체류 신호 및 에피토프 택은, 이 발명이 속하는 기술분야에 알려진 모든 분자생물학 기술을 사용하여, 이러한 신호 또는 택을 코딩하는 뉴클레오타이드 서열을 원하는 단백질을 코딩하는 뉴클레오타이드 서열내로 삽입시킴으로써, 원하는 단백질 내로 용이하게 도입시킬 수 있다. .
또 다른 바람직한 구체예에 있어서, 본 발명에 따른 벡터는 글루코시다제 II 또는 이들의 기능적 부분을 코딩하는 서열을 포함하고, 메탄올 자화효모 균주에서 글루코시다제 II 또는 그 기능적 부분을 발현시킬 수 있다.
ER 내에서 단백질 상으로 전달되는 개시 N-결합 올리고사카라이드 (Glc3Man9GlcNAc2)는 ER 내에서 특정 글루코시다제에 의하여 절단되어 글루코스 잔기가 제거되고, 만노시다제에 의하여 절단되어 특정 α-1,2-결합 만노스가 제거된다는 것이 입증되어 있다. 본 발명자들은 피히아속(Pichia)에서 발현되는 몇 몇 재조합 단백질이, 이러한 단백질이 ER을 떠나서 골지체로 이동할 때, 잔여의 글루코스 잔기를 당 부분(moiety) 상에 가지고 있다는 것을 관찰하였다. 당 구조 상에 존재하는 잔여 글루코스는 α-1,2-만노시다제에 의한 당 부분의 완전한 분해를 방해하며, 외인성(exogenous) 글루코시다제의 도입에 의하여 이러한 글루코스 잔기들이 용이하게 제거될 수 있다.
본 발명에 있어서, 글루코시다제 II를 코딩하는 뉴클레오타이드 서열은 모든 종(species)로부터 유래할 수 있다. 글루코시다제 II 유전자는 래트, 마우스, 돼지 및 인간을 포함하여 많은 포유류 종들로부터 클로닝되어 왔다. 이들 포유류 종들로부터 얻은 글루코시다제 II 단백질은 알파 및 베타 서브유니트(subunit)로 구성되어 있다. 알파 서브유니트는 약 110 kDa이고 효소의 촉매 활성을 가지고 있는 반면, 베타 서브유니트는 C-말단 HDEL ER-체류 서열을 포함하고 있으며 효소의 ER 위치화에 중요한 역할을 할 것으로 생각되어 진다. 에스. 세레비시애(S. cerevisiae)로부터 얻은 글루코시다제 II 유전자 또한 클로닝되어 있다(ORF YBR229c, 염색체 II 상에 위치). 이 유전자는 약 110 kDa이고, 포유류 알파 서브유니트와 고도의 상동성을 보인다.
본 발명의 벡터로 사용되기 위하여 바람직한 글루코시다제 II는 피히아 파스토리스(Pichia pastoris) 및 에스. 세레비시애(S. cerevisiae)와 같은 진균류로부터 유래한 것이다. 진균 글루코시다제 II 유전자의 일례로서 에스. 세레비시애(S. cerevisiae) 글루코시다제 II 알파 서브유니트 유전자를 들 수 있다.
본 발명에 있어서, 뉴클레오타이드 서열은 또한 글루코시다제 II의 기능적 부분만을 코딩할 수 있다. "기능적 부분"은 전장 단백질의 효소 활성을 실질적으로 보유하고 있는 폴리펩타이드 단편을 의미한다. "실질적으로"는 전장 글루코시다제 효소 활성의 적어도 약 40%, 또는 적어도 50% 또는 그 이상이 보유되는 것을 의미한다. 글루코시다제 II의 기능적 부분은 이 발명이 속하는 기술분야에 알려진 다양한 기술을 사용하여 기술분야의 통상의 지식을 가진자에 의하여 동정되고 제조될 수 있다.
본 발명의 바람직한 구체예에 있어서, 글루코시다제 II 단백질을 ER 체류 신호를 포함하도록 조작하여 메탄올 자화효모 균주에서 발현되는 단백질이 ER로 표적화시키고 거기에서 기능을 유지하도록 할 수 있다. 예컨대, HDEL 펩타이드 서열과 같은, ER 체류 신호를 아래에 기재하였다.
본 발명에 사용되는 글루코시다제 II는, 예컨대, 기술분야에 잘 알려진 Myc, HA, FLAG, 및 His6 택과 같은 에피토프 택을 항체가 사용가능한 곳에 삽입하는 것과 같이, 추가적으로 변형시킬 수 있다.
본 발명에 따른면, "녹-인" 벡터가 α-1,2-만노시다제 코딩 서열 및 글루코시다제 II 코딩 서열 중 어느 하나 또는 이들 모두를 포함할 수 있다.
또한, 본 발명에 있어서, 발현될 효소(예컨대, α-1,2-만노시다제 또는 이의 기능적 부분, 또는 글루코시다제 II 또는 이의 기능적 부분)를 코딩하는 뉴클레오타이드 서열은 프로모터와 3' 종결 서열과의 작동가능하게 연결될 수 있다.
메탄올 자화효모에서의 단백질 발현을 위하여 적합한 프로모터는 구성성 프로모터 및 유도성 프로모터 모두를 포함할 수 있다. 구성성 프로모터는, 예컨대, 피히아 파스토리스(Pichia pastoris) 글리세르알데히드-3-포스페이트 탈수소효소 프로모터("GAP 프로모터")를 포함할 수 있다. 유도성 프로모터의 예는 피히아 파스토리스(Pichia pastoris) 옥시다제 I 프로모터("AOXI 프로모터")(미국특허 제4,855,231호), 또는 피히아 파스토리스(Pichia pastoris) 포름알데히드 탈수소효소 프로모터("FLD 프로모터")(Shen et al. Gene 216: 93-102,1998)를 포함한다.
3' 종결 서열은, 폴리아데닐화를 유도하는 서열과 같이, 서열이 작동가능하게 연결되어 있는 유전자의 mRNA 전사 산물을 안정화시키는 작용을 하는 구조 유전자의 종결 코돈까지의 3' 서열들이다. 3' 종결 서열은 피히아속 또는 다른 메탄올 자화효모로부터 얻을 수 있다. 본 발명의 수행에 유용한 피히아 파스토리스(Pichia pastoris) 3' 종결 서열의 예는 AOX1 유전자, p40 유전자, HIS4 유전자 및 FLD1 유전자를 포함한다.
본 발명의 벡터는 선별 마커(selectable marker) 유전자를 포함하는 것이 바람직하다. 선별 마커는 메탄올 자화효모 균주에 선별적인 표현형을 부여하고 형질전환된 세포가 형질전환되지 않은 세포들로부터 동정되고 선별될 수 있도록 하는 모든 유전자일 수 있다. 선별 마커 시스템은 숙주의 결함을 보완하는 야생형 유전자 및 영양요구(auxotrophic) 변이체 메탄올 자화효모 균주 유전자를 포함할 수 있다. 이러한 시스템의 예는 his4 피히아(Pichia) 균주를 보완하기 위하여 사용되는 사카로마이세스 세레비시애(Saccharomyces cerevisiae) 또는 피히아 파스토리스(Pichia pastoris) HIS4 유전자, 또는 피히아 파스토리스(Pichia pastoris) arg 변이체를 보완하기 위하여 사용되는 에스. 세레비시애(S. cerevisiae) 또는 피히아 파스토리스(Pichia pastoris) ARG4 유전자를 포함한다. 피히아 파스토리스(Pichia pastoris)에서 작용하는 다른 선별마커들은 ZeoR 유전자, G418R 유전자 등을 포함한다.
또한, 본 발명의 벡터는 자기 복제 서열(autonomous replication sequence, ARS)을 포함할 수 있다. 예컨대, 미국특허 제4,837,148호는 피히아 파스토리스(Pichia pastoris) 내에 플라스미드를 보존시키기 위한 적절한 수단을 제공하는 자기 복제 서열을 개시하고 있다. 상기 미국특허 제4,837,148호의 기재는 여기에 참조로서 포함된다.
벡터는 또한 박테리아에서의 복제 및 염색체외 보존을 담당하는 서열 뿐 아니라, 박테리아에서 작용하는 선별마커 유전자를 포함할 수 있다. 박테리아 선별 마커 유전자의 예는 암피실린 저항 유전자 (Amp
R ), 테트라사이클린 저항 유전자(Tet
R ), 네오마이신 저항 유전자, 히그로마이신 저항 유전자 및 제오신 저항 유전자(Zeo
R )를 포함한다.
본 발명에 따르면, 메탄올 자화효모에서 발현될 단백질을 코딩하는 뉴클레오타이드 서열은 통합성 벡터 또는 복제성 벡터(예컨대, 복제 원형 플라스미드) 내에 위치할 수 있다.
통합성 벡터는, 예컨대, 여기에 참조로서 포함된 미국특허 제4,882,279호에 개시되어 있다. 통합성 벡터는 일반적으로 적어도 첫 번째 삽입가능 DNA 단편, 선별 마커 유전자 및 두 번째 삽입가능 DNA 단편이 연속적으로 배열된 서열을 포함한다. 첫 번째 및 두 번째 삽입가능 DNA 단편은 길이에 있어서 각각 약 200 뉴클레오타이드이며, 형질전환될 종의 게놈 DNA의 일부분과 상동인 뉴클레오타이드 서열을 갖는다. 발현에 있어서 중요한 구조 유전자를 포함하는 뉴클레오타이드 서열을 벡터 내 선별마커 앞 뒤 상관없이 첫 번째 및 두 번째 삽입가능 DNA 단편 사이에 삽 입한다. 통합성 벡터는 숙주 세포 게놈 내로 원하는 뉴클레오타이드 서열을 용이하게 통합시키기 위하여 효모 형질전환에 앞서 선형화될 수 있다.
α-1,2-만노시다제 코딩 서열 또는 글루코시다제 II 코딩 서열 중 어느 하나 또는 이들 모두를 운반하는 복제성 벡터 및 통합성 벡터는 본 발명이 속하는 기술분야의 통상의 지식을 가진 자에게 공지된 표준적인 기술에 의하여 제작될 수 있고, 예컨대, "Sambrook et al. (1989) in Molecular Cloning: A Laboratory Manual" 또는 널리 입수가능한 재조합 DNA 기술에 대한 모든 수 많은 실험 매뉴얼에서 찾아볼 수 있다.
본 발명의 α-1,2-만노시다제 발현 서열을 운반하는 바람직한 벡터는, 하기의 실시예에 보다 상세히 설명되어 있는, pGAPZMFManHDEL, pGAPZMFManMycHDEL, pPICZBMFManMycHDEL, pGAPZmManHDEL, pGAPZmMycManHDEL, pPIC9mMycManHDEL 및 pGAPZmMycManHDEL를 포함한다.
본 발명의 글루코시다제 II 발현 서열을 운반하는 바람직한 벡터는, 하기의 실시예에서 보다 상세히 설명되어 있는 pGAPZAGLSII, pPICZAGLSII, pAOX2ZAGLSII, pYPTIZAGLSII, pGAPADEIglsII, pPICADElglsII, pAOX2ADElglsII, pYPTIADElglsII, pGAPZAglsIIHDEL 및 pGAPADElglsIIHDEL을 포함한다.
또 다른 측면에 있어서, 본 발명은 메탄올 자화효모 균주 내로 도입되었을 때 유전자를 불활성화시키거나 파괴시켜서 메탄올 자화효모 균주에서 생산되는 당단백질의 글리코실화를 용이하게 감소시킬 수 있는 "녹-아웃" 벡터를 제공한다.
한 가지 구체예에 있어서, 본 발명은 메탄올 자화효모 균주 내에 도입되었을 때 Och1 유전자를 불활성화시키거나 파괴시키는 "녹-아웃" 벡터를 제공한다.
에스. 세레비시애(S. cerevisiae) OCH1 유전자가 클로닝되어 있다(Nakayama et al. EMBO J. 11 : 2511-2519,1992). 이는 초기 골지 복합체에 위치하고 N-결합 중심 올리고사카라이드(Man5GlcNAc2 및 Man8GlcNAc2)에의 α-1,6-폴리만노스 외부 사슬의 첨가를 개시하는 작용을 하는 막 결합 α-1,6-만노실트랜스퍼라제를 코딩한다(Nakanishi-Shindo et al. J. Biol. Chem. 268: 26338-26345,1993).
일본특허출원 제07145005호에 어떤 피히아(Pichia) 서열은 에스. 세레비시애(S. cerevisiae) OCH1과 고도로 상동인 단백질을 코딩한다고 기재되어 있다. 본 발명을 위하여, 여기서는 이러한 서열을 "피히아(Pichia) OCH1 유전자"라고 나타내었다. 본 발명이 속하는 기술분야의 통상의 지식을 가진 자들은 기술분야에 잘 알려진 기술들을 사용하여 OCH1 유전자를 다른 메탄올 자화효모로부터 분리해낼 수 있다.
본 발명에 따르면, 메탄올 자화효모의 OCH1 유전자 내의 파괴는 불활성 단백질 산물의 생산 또는 이들을 생산하지 못하게 되는 결과를 초래할 수 있다. 이러한 파괴는 이종 DNA 서열의 코딩 서열 내로의 삽입 및/또는 코딩 서열 중 일부 또는 모두의 결실의 형태로 나타날 수 있다. 유전자 파괴는, Rothstein (in Methods in Enzymology, Wu et al., eds., vol 101 : 202-211,1983)에 기재된 바와 같이, 본래 상동성 재조합(homologous recombination)에 의하여 생성될 수 있다.
상동성 재조합에 의하여 Ochl 유전자를 피괴시키기 위하여, Ochl 녹-아웃 벡터를 선별마커 유전자를 포함하도록 하여 제작할 수 있다. 선별마커 유전자는 상동성 재조합을 매개하기 위한 충분한 길이의 Ochl 유전자 부위의 5' 및 3' 말단 모두에 작동 가능하게 연결되어 있다. 선별마커는, URA3, LEU2 및 HIS3 유전자를 포함하여, 항생제 저항성을 제공하거나 숙주세포 영양요구성을 보완하는 모든 많은 유전자 중 하나일 수 있다. 다른 적절한 선별마커는 효모 세포에 클로람페니콜 저항성을 부여하는 CAT 유전자, 또는 활성 β-갈락토시다제의 발현에 기인하는 푸른색 콜로니가 생기게 하는 lacZ 유전자를 포함한다. 그리고 나서, 이 발명이 속하는 기술분야에 잘 알려진 방법을 사용하여 Och1 녹-아웃 벡터의 선형화된 DNA 단편을 숙주 메탄올 자화효모 내로 도입시킨다. 선형 단현의 게놈 내로의 통합 및 Och1 유전자의 파괴 여부는 선별마커에 기초하여 측정될 수 있으며, 예컨대, 서던 블라트 분석에 의하여 검증될 수 있다.
선택적으로, Ochl 녹-아웃 벡터는 파괴될 Och1 유전자 부위를 포함하도록 하여 제작될 수 있는데, 상기 부위는 어떠한 Och1 프로모터 서열도 포함하지 않고 Och1 단백질의 불활성 단편을 코딩하거나 아무것도 코딩하지 않는 부위이다. "불활성 단편(inactive fragment)"은 전장 OCH1 단백질의 바람직하게는 약 10%보다 적은, 가장 바람직하게는 약 0%의, 활성을 갖는 Och1 단백질의 단편을 의미한다. OCH1 유전자의 이러한 부위를, OCH1 서열에 어떠한 공지의 프로모터도 작동가능하게 연결시키지 않고, Och1 유전자의 상기 부위에 종료 코돈과 전사 종결 서열을 작동가능하게 연결시켜서 벡터 내로 삽입할 수 있다. 그리고 나서, 이러한 벡터를 OCH1의 상기 부위에서 선형화시키고 기술분야에 알려진 어떠한 방법이든 사용하여 메탄올 자화효모 균주 내로 형질전환시킬 수 있다. 그리고 나서, 단일 상동성 재조합(single homologous recombination)을 위하여, 이와 같이 선형화된 벡터를 OCH1 유전자 내로 통합시킨다. 단일 상동성 재조합의 결과로서 두 개의 Ochl 서열이 염색체 내에 생성된다. 첫 번째 Och1 서열은 벡터로부터 유래하는 Och1 유전자 부위이며, 이는 지금은 숙주 메탄올 자화효모의 OCH1 프로모터의 조절하에 있고, 상기한 바와 같이, OCH1 단백질의 불활성 단편을 코딩하거나 OCH1 단백질을 코딩하지 않는 Och1 서열과 같이 아직 활성 OCH1 단백질을 제조할 수 없다. 두 번째 Ochl 서열은 전체 OCH1 코딩 서열이며, 어떠한 공지된 프로모터 서열과도 작동가능하게 연결되어 있지 아니하여, 활성 OCH1 단백질 합성을 위한 어떠한 활성 메신저의 생성도 기대할 수 없다. 바람직하게, 불활성화 돌연변이를 OCH1 서열 내, 벡터의 선형화 자리의 5' 말단 및 OCH1의 번역 개시 코돈의 3' 말단 위치에 도입할 수 있다. "불활성화 돌연변이(inactivating mutation)"는 종결 코돈, 프레임쉬프트(frameshift) 돌연변이 또는 리딩 프레임의 파괴를 야기하는 다른 모든 돌연변이를 도입시키는 돌연변이를 의미한다. 이러한 돌연변이는 이 발명이 속하는 기술분야에 공지된 모든 부위 특이적 돌연변이유발 방법을 사용하여 Och1 서열 내로 도입될 수 있다. 이러한 불활성화 돌연변이는, 녹-아웃 벡터 내 Och1 서열의 5' 위치에 몇 몇 프로모터 서열이 존재하는 경우라도, 어떠한 기능적 OCH1 단백질도 생성될 수 없다는 것을 보장한다.
본 발명의 바람직한 Och1 녹-아웃 벡터는 pBLURA5'PpOCHl이다.
원하는 경우, 만노시다제 발현 서열 및 글루코시다제 발현 서열 중 어느 하나 또는 이들 모두를 OCH1 유전자를 파괴하여 "녹-인 및 녹-아웃" 벡터를 생성시키는데 사용되는 동일한 플라스미드 상에서 운반할 수 있다.
또한, 상기한 모든 벡터들은 메탄올 자화효모 균주에서 원하는 당단백질을 발현시킬 수 있는 뉴클레오타이드 서열을 추가적으로 포함할 수 있다.
본 발명의 또 다른 측면은 메탄올 자화효모 균주에 의하여 생산되는 단백질 상에서의 글리코실화를 감소시키기 위하여 메탄올 자화효모 균주를 변형시키는 방법에 관한 것이다. 본 발명의 방법에 따르면, 하나 이상의, 즉 적어도 하나의, 상기한 바와 같은 본 발명의 녹-인 및/또는 녹-아웃 벡터를 사용하여 메탄올 자화효모 균주내로 형질전환시킴으로써 메탄올 자화효모 균주를 변형시킨다.
본 발명의 방법을 사용하여 변형될 수 있는 메탄올 자화효모 균주는 칸디다속(genus Candida), 한세눌라속(genus Hansenula), 토룰롭시스속(genus Torulopsis) 및 피히아속(genus Pichia)과 같이 메탄올 상에서 자랄 수 있는 효모를 포함하지만 이에 한정되지는 않는다. 이러한 부류의 효모의 대표적인 종의 목록이 "C. Anthony (1982), The Biochemistry of Methylotrophs, 269"에 나타나 있다. 본 발명의 수행에 필요한 메탄올 자화효모의 예로서, 피히아 파스토리스(Pichia pastoris), 피히아 메탄올리카(Pichia methanolica), 피히아 아노몰라(Pichia anomola), 한세눌라 폴리모르파(Hansenula polymorpha) 및 칸디다 보이디니(Candida boidinii)를 들 수 있다. 피하아 파스토리스(Pichia pastoris) 균주 GS115 (NRRL Y-15851); 미국특허 제4,818,700호에 개시된 GS190 (NRRL Y-18014); 미국특허 제4,812,405호에 개시된 PPF1 (NRR1 Y-18017); PPY120H, yGC4 또는 이들로부터 유래된 균주들이 특히 바람직하다.
본 발명의 방법을 사용하여 변형될 수 있는 메탄올 자화효모 균주는 또한 원하는 이종 당단백질을 하나 이상 발현시킬 수 있도록 유전적으로 조작된 이들 메탄올 자화효모 균주를 포함할 수 있다. 미리 조작된 이들 균주로부터 발현되는 이종 당단백질 상의 글리코실화는 하나 이상의 본 발명의 벡터를 사용하여 이러한 균주들을 형질전환시킴으로써 감소시킬 수 있다.
본 발명의 벡터는, "Cregg et al. 1985"에 기재된 바와 같은 스페로플라스트 기술(spheroplast technique), 또는 유럽특허 제312,934호에 기재된 바와 같이 피히아속(Pichia)에서의 사용을 위하여 변형된, "Ito et al. Agric. Biol. Chem. 48 : 341"의 전-세포 리튬 클로라이드 효모 형질전환 시스템과 같은 공지의 방법을 사용하여, 메탄올 자화효모 균주 세포 내로 도입될 수 있다. 플라스미드 또는 선형 벡터의 형질전환에 유용한 다른 공개된 방법들은 미국특허 제4,929,555호; "Hinnen et al. Proc. Nat. Acad. Sci. USA 75: 1929 (1978)"; "Ito et al. J. Bacteriol. 153: 163 (1983)"; 미국특허 제4,879,231호; "Sreekrishna et al. Gene 59: 115 (1987)"에 기재된 방법들을 포함한다. 일렉트로포레이션(electroporation) 및 PEG1000 전세포 형질전환 공정 또한 사용될 수 있다(Cregg and Russel Methods in Molecular Biology: Pichia Protocols, Chapter 3, Humana Press, Totowa, N. J., pp. 2739 (1998)).
형질전환된 효모 세포는, (세포의 영양요구성 때문에) 요구되는 생화학 산물의 부재하에서의 형질전환, 새로운 표현형에 대한 선별 및 검출 후 영양요구성 세 포를 배양하거나, 형질전환체 내 포함된 저항 유전자가 부재하는 효모에 대하여 독성이 있는 항생제의 존재하에서 배양시키는 것을 포함하지만 이에 한정되지는 않는 적절한 기술을 이용함으로써, 선별될 수 있다. 형질전환체는 또한, 예컨대, 서던 블라트 또는 PCR 분석에 의하여 평가될 수 있는, 발현 카세트의 게놈 내로의 통합에 의하여 선별 및/또는 검증될 수 있다.
한 구체예에 있어서, 메탄올 자화효모 균주를 α-1,2-만노시다제 또는 이의 기능적 부분을 코딩하는 뉴클레오타이드 서열을 포함하는 벡터를 사용하여 형질전환시킨다. 상기 뉴클레오타이드 서열은 메탄올 자화효모 균주 내에서 α-1,2-만노시다제 또는 이의 기능적 부분을 발현시킬 수 있으며, 바람직하게는, 메탄올 자화효모 균주 게놈 내로 통합시킬 수 있다.
메탄올 자화효모 균주 내로 도입된 α-1,2-만노시다제의 발현을 mRNA 수준 및 단백질 수준 모두의 측면에서 검사할 수 있는데, mRNA 수준은, 예컨대, 노던 블라트 분석에 의하며, 단백질 수준은, 예컨대, 웨스턴 블라트 분석에 의한다. 단백질의 세포내 위치화는, 세포 하부의 분획화(fractionation) 및 면역형광 실험을 포함하여, 다양한 기술들을 사용하여 분석할 수 있다. 세포 하부 분획화 실험에 있어서, 공지된 ER 정주 단백질(예컨대, 단백질 디설파이드 이소머라제)과 함께 이들 효소를 공-침강시킴으로써, α-1,2-만노시다제의 ER 위치화를 측정할 수 있다. ER 위치화는 또한, 전형적으로는 핵주위 염색 패턴인, ER의 면역형광 염색 패턴 특성에 의하여 측정할 수 있다.
메탄올 자화효모 균주에서 발현되는 α-1,2-만노시다제 또는 이의 기능적 부분이 기대되는 만노스-트리밍(trimming) 활성을 갖는다는 것을 확인하기 위하여, 생체외 및 생체내 분석을 모두 사용할 수 있다. 전형적으로, 생체외 분석은, 예컨대, Man8GlcNAc2와 같은 생체외 합성 기질을 메탄올 자화효모 균주로부터 발현되고 정제된 효소를 사용하여 분해시키는 것과 Man8GlcNAc2를 예컨대 Man5GIcNAc2로 트리밍하는 이러한 효소 활성을 검사하는 것을 수반한다. 생체내 분석에 있어서, α-1,2-만노시다제 또는 그의 부분은 메탄올 자화효모 내 말단 α-1,2-결합 만노스 잔기를 포함하여 N-글리칸으로 글리코실화되는 것으로 알려진 당단백질과 함께 메탄올 자화효모에서 공동 발현된다. 생체외 및 생체내 분석 모두에 있어서, 탄수화물기의 조성은 기술분야에 잘 알려진 기술을 사용하여 측정되고, 하기되는 실시예들에 의하여 설명될 수 있다.
또 다른 구체예에 있어서, 글루코시다제 II 또는 이의 기능적 부분을 코딩하는 뉴클레오타이드 서열을 포함하는 벡터를 사용하여 메탄올 자화효모 균주를 형질변환시킨다. 상기 뉴클레오타이드 서열은 메탄올 자화효모 균주 내에서 글루코시다제 II 또는 기능적 부분을 발현시킬 수 있으며, 바람직하게는, 메탄올 자화효모 균주의 게놈 내로 통합된다.
형질전환된 메탄올 자화효모 균주에서 발현되는 글루코시다제 II 또는 이의 기능적 부분의 효소 활성을 다양한 분석을 사용하여 검사할 수 있다. 예컨대, 글루코시다제 II 및 이의 일부분을 코딩하는 서열로 형질전환된 메탄올 자화효모 세포를, 예컨대, 5-브로모-4-클로로-3-인돌일-α-D-글루코피라노시드(5-bromo-4-chloro-3-indolyl-α-D-glucopyranoside) 또는 4-MU-α-D-Glc와 같은, 글루코시다제의 기질을 포함하는 고형 배지 상에서 키울수 있다. 상기 효소가 피히아(Pichia)에 의하여 발현되고 세포외 분비될 때, 상기 효소는, 예컨대, 푸른색 또는 형광빛과 같이 콜로니 주위에 탐지 가능한 신호를 발생시키면서, 기질에 작용한다. 선택적으로, 발현된 단백질 분자를 포함하는 액체 배양액을 수집하여, 예컨대, p-니트로페닐-α-D-글루코피라노시드(p-nitrophenyl-α-D-glucopyranoside)와 같은 기질과 함께 시험관 안에서 배양할 수 있다. 방출되는 특정 산물을 측정함으로써 효소 활성을 측정할 수 있다. 게다가, 예컨대, 인플루엔자 뉴라미니다제와 같은 글루코시다제 II가 글루코스 잔기로 N-글리코실화되는 것으로 알려진 당단백질과 함께 효모내에서 공동 발현되는 경우, 생체내 분석을 사용할 수 있다. 글루코시다제 II의 효소 활성은 당단백질의 당 사슬(들) 내의 글루코스 함량의 감소에 기초하여 측정할 수 있다.
본 발명의 또 다른 구체예에 있어서, 메탄올 자화효모 균주를 Och1 벡터를 사용하여 형질전환시킨다. 형질전환 및 상기 벡터의 통합의 결과로, 효모 균주 내 게놈 Och1 유전자가 파괴된다.
본 발명의 또 다른 구체예에 있어서, α-만노시다제 발현 벡터, 글루코시다제 II 발현 벡터 및 Och1 녹-아웃 벡터의 모든 조합을 사용하여 메탄올 자화효모 균주를 형질전환시킬 수 있다. 이러한 변형은 한 번에 하나의 벡터를 도입시키는 일련의 연속적인 형질전환, 또는, 선택적으로, 벡터들을 동시에 도입시키는 동시-형질전환(co-transformation)에 의하여 성취될 수 있다.
상기된 변형 메탄올 자화효모 균주를, 원한다면, 추가적으로 변형시킬 수 있다. 예컨대, 다른 어떤 피히아(Pichia) 만노실트랜스퍼라제를 코딩하는 유전자를 추가적으로 파괴시킬 수 있다. 또한, 원한다면, 표유류 효소를 코딩하는 유전자를 도입시켜 혼성형 또는 복합형 N-글리칸을 갖는 당단백질을 생산하도록 할 수 있다.
본 발명의 또 다른 구체예는, 본 발명의 방법을 사용하여, 예컨대, 하나 이상의 본 발명에 따른 벡터를 사용하여 형질전환시킴으로써, 변형된 메탄올 자화효모 균주에 관한 것이다.
본 발명의 어떤 측면, 특히 세포내 발현되는 α-1,2-만노시다제 활성의 도입은, O-결합 글리칸이 주로 α-1,2-결합 만노스 잔기들로 구성되어 있다고 기술분야에 공지된 바와 같이, 메탄올 자화효모 내에서 생산되는 당단백질 상의 O-결합 글리칸의 글리코실화를 감소시키는데 또한 유용하다는 것을 이해하여야 한다. 여기서 사용되는 0-결합 글리칸은 당단백질의 세린 또는 트레오닌에 결합된 탄수화물 구조를 의미한다
본 발명의 또 다른 측면은 글리코실화가 감소된 당단백질, 특히 메탄올 자화효모에 대하여 이종(heterologous) 당단백질을 메탄올 자화효모 내에서 생산하는 방법에 관한 것이다.
여기에서 사용된 "당단백질(glycoprotein)"은, 메탄올 자화효모 내에서, 하나 이상의 아스파라긴 잔기 또는 하나 이상의 세린 또는 트레오닌 잔기 상에서 글리코실화되거나, 아스파라긴 및 세린 또는 트레오닌 잔기 상에서 글리코실화된 단백질을 의미한다.
"글리코실화가 감소된(reduced glycosylation)"이라는 표현은, 본 발명에 따라서 변형된 메탄올 자화효모 균주 내에서 당단백질이 발현될 때, 변형되지 않은 야생형의 메탄올 자화효모와 비교하여, 당단백질 상에서의 탄수화물 부분의 감소된 크기, 특히 보다 적은 만노스 잔기를 갖는 것을 의미한다..
본 발명에 따르면, 많은 방법으로 글리코실화가 감소된 원하는 당단백질을 생산할 수 있다. 당단백질을 발현시킬 수 있는 뉴클레오타이드 서열을 본 발명에 따라서 미리 변형된 메탄올 자화효모 균주, 예컨대, 하나 이상의 본 발명의 벡터를 사용하여 변형되고 글리코실화가 감소된 당단백질을 생산할 수 있는 균주 내로 도입시킬 수 있다. 선택적으로, 당단백질을 발현하도록 미리 유전적으로 조작된 메탄올 자화효모 균주를 하나 이상의 본 발명에 따른 벡터를 사용하여 형질전환시킬 수 있다. 이와 달리, 메탄올 자화효모 균주가 원하는 당단백질을 발현시키지 않거나, 본 발명의 벡터 중 어느 것으로도 형질전환되지 않은 균주인 경우, 당단백질을 발현시킬 수 있는 뉴클레오타이드 서열 및 하나 이상의 본 발명의 벡터를 모두 사용하여, 연속적으로 또는 동시에, 이러한 효모 균주를 형질전환시킬 수 있다. 또한, 메탄올 자화효모 균주 내에서 당단백질을 발현시킬 수 있는 뉴클레오타이드 서열을 포함하는 하나 이상의 본 발명의 녹-인 및/또는 녹-아웃 벡터를 사용하여 메탄올 자화효모 균주를 형질전환시킬 수 있다.
메탄올 자화효모 내에서 당단백질을 발현시킬 수 있는 뉴클레오타이드 서열이 5' 에서 3'까지, 프로모터, 당단백질을 코딩하는 서열 및 3' 종결 서열을 포함하도록 제작할 수 있다. 당단백질의 발현에 적절한 프로모터와 3' 종결 서열은 상기한 모든 프로모터와 3' 종결 서열들을 포함할 수 있다.
당단백질을 발현시키기 위한 뉴클레오타이드 서열은, 단백질 산물의 분비를 원하는 경우, 예컨대, 통과 펩타이드(transit peptide)를 코딩하는 신호 서열과 같은 추가적인 서열을 포함할 수 있다. 이러한 서열은 널리 알려져 있으며, 용이하게 입수가능하고, 사카로마이세스 세레비시애(Saccharomyces cerevisiae) 알파 교배 인자 프리프로(αmf prepro), 피히아 파스토리스(Pichia pastoris) 산성 포스파타제 (PHO1) 신호 서열 등을 포함한다.
당단백질의 발현을 위한 뉴클레오타이드 서열은 복제성 벡터 또는 통합성 벡터 상에 위치할 수 있다. 이러한 벡터의 선택 및 구조는 상기한 바와 같다.
당단백질을 발현시킬 수 있는 뉴클레오타이드 서열은 플라스미드-포함 α-1,2-만노시다제 또는 글루코시다제 II 발현 단위와 같이 동일한 복제성 플라스미드 상에서 운반될 수 있다. 선택적으로, 당단백질 코딩 서열을 포함하는 뉴클레오타이드 서열은 별개의 플라스미드 상에서 운반되거나 숙주 게놈 내로 통합된다.
생산된 당단백질은 통상적인 방법에 의하여 정제될 수 있다. 정제될 특정 단백질의 본질에 의하여 정제 프로토콜을 결정한다. 이러한 결정은 이 발명이 속하는 기술분야의 기술의 통상적인 수준 내이다. 예컨대, 침전, 면역흡착(immunoadsorption), 분획화 또는 다양한 크로마토그래피법과 같은 전형적인 분리 기술에 의하여, 세포로부터 세포 배양액을 분리하고, 세포로부터 분비된 단백질을 배지로부터 분리해 낼 수 있다.
본 발명의 방법에 의하여 생산될 수 있는 당단백질은, 예컨대, 바실러스 아밀로리퀘파시엔스 α-아밀라제(Bacillus amyloliquefaciens α-amylase), 에스. 세레비시애 인버타제(S. cerevisiae invertase), 티파노소마 크루지 트랜스-시알리다제(Typanosoma cruzi trans-sialidase), HIV 외피 단백질(HIV envelope protein), 인플루엔자 바이러스 A 적혈구 응집소(influenza virus A haemagglutinin), 인플루엔자 뉴라미니다제(influenza neuraminidase), 소의 포진 바이러스 타입-1 당단백질 D(Bovine herpes virus type-1 glycoprotein D), 인간 안지오스타틴(human angiostatin), 인간 B7-1, B7-2 및 B-7 수용체 CTLA-4, 인간 조직 인자(human tissue factor), 성장 인자(예컨대, 혈소판-유래 성장 인자), 조직 플라즈미노겐 활성화인자(tissue plasminogen activator), 프라즈미노겐 활성화인자 억제인자-I(plasminogen activator inhibitor-I), 우로키나제(urokinase), α-갈락토시다제(α-galactosidase)와 같은 인간 라이소좀 단백질, 플라즈미노겐, 트롬빈, 인자 XIII 및 면역글로불린(immunoglobulins)을 포함한다. 유전적으로 조작된 본 발명의 피히아(Pichia) 균주에서 발현될 수 있는 유용한 다른 당단백질이 "Bretthauer and Castellino, Biotechnol. Appl. Biochem. 30: 193-200 (1999)" 및 "Kukuruzinska et al. Ann Rev. Biochem. 56: 915-44 (1987)"에 나타나 있다.
본 발명의 방법을 사용하여 생산된 당단백질, 즉, 글라이코실화가 감소된 당단백질 또한 본 발명의 일부분이다.
본 발명의 또 다른 측면은 상기된 본 발명의 녹-인 벡터, 녹-아웃 벡터, 또는 녹-인 및 녹-아웃(knock-in-and-knock-out) 벡터를 한 가지 이상 포함하는 키트를 제공한다. 보다 상세하게, 본 발명의 키트는 메탄올 자화효모에서 α-만노시다제를 발현시킬 수 있는 벡터, 메탄올 자화효모에서 글루코시다제 II를 발현시킬 수 있는 벡터, 메탄올 자화효모 내 Och1 유전자를 파괴시킬 수 있는 벡터, 글루코시다제 및 α-만노시다제 모두를 발현시킬 수 있는 벡터, Och1 유전자를 파괴시킬 수 있고 글루코시다제 II, α-만노시다제 또는 이들의 조합 중 어느 하나 또는 이들 모두를 발현시킬 수 있는 벡터를 한 가지 이상 포함한다..
상기 키트는 또한 원하는 이종 단백질을 코딩하고 발현시킬 수 있는 뉴클레오타이드 서열을 포함한다. 이러한 뉴클레오타이드 서열은 상기한 바와 같이 노킹-인(knocking-in) 또는 노킹-아웃(knocking-out)을 위한 서열을 포함하는, 동일한 벡터 또는 별개의 벡터 내에서 제공될 수 있다.
또한, 상기 키트는 원하는 이종 단백질을 코딩하는 뉴클레오타이드 서열이 연속적으로 삽입되어 메탄올 자화효모를 형질전환시키고 이를 메탄올 자화효모에서 발현시킬 수 있는 플라스미드를 포함할 수 있다. 선택적으로, 키트 내의 녹-인 또는 녹-아웃 벡터는 원하는 이종 단백질을 코딩하는 뉴클레오타이드 서열의 삽입을 위한 간편한 클로닝 사이트를 갖는다.
상기 키트는 또한 상기된 녹-인 벡터, 녹-아웃 벡터, 또는 녹-인-및-녹-아웃 벡터 중 어느 것을 사용하여 연속적으로 형질전환된 메탄올 자화효모 균주를 포함할 수 있다. 또한, 상기 키트는 상기된 본 발명의 녹-인 벡터 또는 녹-아웃 벡터를 한 가지 이상 사용하여 형질전환된 메탄올 자화효모 균주를 포함할 수 있다. 게다가, 상기 키트는 원하는 이종 당단백질을 코딩하고 발현시킬 수 있는 뉴클레오타이드 서열을 사용하여 형질전환된 메탄올 자화효모 균주를 포함할 수 있다.
도 1은 HDEL-표지된 트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제 발현 카세트를 운반하는 벡터를 나타내고, 이들 벡터를 이 발명이 속하는 기술분야에 공지된 방법에 따라서 제작하는 방법을 설명하는 것이다. 구조 개략도에 사용된 약어는 다음과 같다: 5'AOX1 또는 AOX1 P: 피히아 파스토리스(Pichia pastoris) AOX1 프로모터 서열; Amp R: 암피실린 저항 유전자; ColEl: ColEl의 복제기원(origin of replication); 3'AOX1: 피히아 파스토리스(Pichia pastoris) AOX1 유전자의 3' 서열; HIS4: 피히아 파스토리스의 HIS4 유전자; AOX TT: 피히아 파스토리스(Pichia pastoris) AOX1 유전자의 전자 종결 서열; ORF:오픈 리딩 프레임; S: 분비 신호; P TEF1: 사카로마이세스 세레비시애(Saccharomyces cerevisiae) 전사 연장 인자 1 유전자의 프로모터 서열; P EM7: 합성 구성성 원핵생물 프로모터 EM7; 제오신(Zeocin): 제오신 저항 유전자; CYC1 TT: 에스. 세레비시애(S. cerevisiae) CYC1 유전자의 3' 말단; GAP: 피히아 파스토리스(Pichia pastoris) 글리세르알데하이드-3-포스페이트 탈수소효소 유전자의 프로모터 서열; PpURA3: 피히아 파스토리스(Pichia pastoris) URA3 유전자. 이 그림에서 알 수 있는 바와 같이, 트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제가 에스. 세레비시애(S. cerevisiae) α-교배 인자(α-mating factor) 분비 신호 서열을 코딩하는 서열에 작동가능하게 연결되어 있고, HDEL 펩타이드의 코딩 서열과도 또한 코딩 서열의 3' 말단 위치에서 작동가능하게 연결되어 있다. 전체적인 융합 구조가 피. 파스토리스(P. pastoris) AOX1 프로모터(pPIC9MFManHDEL 내) 또는 피. 파스토리스(P. pastoris) GAP 프로모터(pGAPZMFManHDEL 내)에 작동가능하게 연결되어 있다.
도 2는 HDEL-표지된 무스 무스큘러스(Mus musculus) α-1,2-만노시다제 IB 발현 카세트를 운반하는 벡터를 나타내고, 이들 벡터를 이 발명이 속하는 기술 분야에 공지된 방법에 따라서 제작하는 방법을 설명하고 있다. 이 그림에서 알 수 있는 바와 같이, 무스 무스큘러스(Mus musculus) α-1,2-만노시다제 IB의 촉매활성 도메인이 에스. 세레비시애(S. cerevisiae) α-교배 인자 분비 신호 서열을 코딩하는 서열에 작동가능하게 연결되어 있고, HDEL 펩타이드의 코딩 서열에도 또한 코딩 서열의 3' 말단 위치에서 작동가능하게 연결되어 있다. 전체적인 융합 구조물이 피. 파스토리스(P. pastoris) AOX1 프로모터(pPIC9mManHDEL 내) 또는 피. 파스토리스(P. pastoris) GAP 프로모터(pGAPZmManHDEL 내)에 작동가능하게 연결되어 있다. 또한, cMyc 에피토프 표지(tag)가 에스. 세레비시애(S. cerevisiae) α-교배 인자 분비 신호 서열의 코딩 서열 및 무스 무스큘러스(Mus musculus) α-1,2-만노시다제 IB의 촉매활성 도메인 사이에 삽입되어 있는 발현 카세트의 변이체들이 만들어졌다. 이러한 발현 카세트는 또한 피. 파스토리스(P. pastoris) AOX1 프로모터(pPIC9mMycManHDEL 내) 또는 피. 파스토리스(P. pastoris) GAP 프로모터(pGAPZmMycManHDEL 내)에 작동가능하게 연결되어 있다.
도 3은 MycHDEL 표지된 트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제를 운반하는 벡터 및 이들 벡터를 얻기위한 방법을 나타낸 것이다. 얻어진 융합 구조물은 다시 한번 피. 파스토리스(P. pastoris) AOX1 프로모터(pPICZBMFManMycHDEL 내) 또는 피. 파스토리스(P. pastoris) GAP 프로모터(pGAPZMFManMycHDEL 내)와 작동가능하게 연결되어 있다.
도 4는 MycHDEL 표지된 트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제의 세포내 위치(localization)를 보여주고, 면역형광 분석에 의한 ER-표적화를 나다낸 것이다. 패널 A 웨스턴 블라팅; 효모 균주를 10 ml YPG 컬쳐에서 OD600 = 10이 될 때까지 배양하고, 5배 희석시키고, YPG에서 48 시간동안 성장시켰다. 배양액의 1/50 및 세포의 1/65를 마우스 모노클로날 9E10 항-Myc 항체를 이용하여 SDS-PAGE 및 웨스턴 블라팅으로 분석하였다. 분자량 마커(marker) 단백질을 화살표로 나타내었다. 레인 1-5: 세포 용해물. 1,2: pGAPZMFManMycHDEL 형질전환체. 3: 형질전환되지 않은 PPY120H (음성 대조군). 4,5: pPICZBMFManMycHDEL 형질전환체. 레인 6-10: 배양액. 6: 형질전환되지 않은 PPY120H (음성 대조군). 7,8: pGAPZMKFManMycHDEL 형질전환체. 9,10: pPICZBMFManMycHDEL 형질전환체. 패널 B 면역형광 현미경법; 1: 피. 파스토리스(P. pastoris) 세포(pGAPZMFManHDEL로 형질전환된 균주 PPY120H)의 x1000 배율의 위상차 상(phase contrast image). 핵은 세포 사분면의 오른쪽 아래에 타원형으로 보인다. 2: 1과 동일한 세포를 티. 레세이(T. reesei) 만노시다제-Myc-HDEL 단백질의 위치를 나타내기 위하여 형광 현미경 모드로 나타낸 것이다. 단백질은 주로 핵 주위(핵막(nuclear envelope))에 원형 분포로 위치하며, 이는 소포체 정상적(steady-state) 분포에 있어서 전형적인 형태이다. 3: 피. 파스토리스(P. pastoris) 세포(pGAPZMFManHDEL로 형질전환된 균주 PPY120H)의 x1000 배율의 위상차 상. 4: 동일한 세포를 피. 파스토리스(P. pastoris) 균주 PPY120H 내의 골지 마커 단백질 OCH1-HA의 위치를 나타내기 위하여 형광 현미경법으로 나타낸 것이다. 세포질 전체에 걸쳐서, 세포당 3-4 개의 점이 분포하는 점상(dot-like) 분포는 피. 파스토리스(P. pastoris) 내 시스-골지 분포에 있어서 전형적인 것이다.
도 5는 수크로스 밀도 구배 원심분리에 있어서 단백질 디설파이드 이소머라제(Protein Disulfide Isomerase)를 이용한 만노시다제-MycHDEL의 공-침강(co-sedimentation)을 나타낸 것이다. 가장 위의 패널은 상이한 수크로스 구배 구획들에서의 OCH1-HA 골지 마커 단백질의 분포를 보여주는 것이다. 중간 패널은 단백질 디설파이드 이소머라제 소포체 마커 단백질에 대한 이러한 분포를 보여주는 것이다. 마지막으로, 가장 아래 패널은 동일한 구획들에서의 MycHDEL-표지된 트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제의 분포를 보여주는 것이다. 이것은 만노시다제-MycHDEL이 대부분 정확하게 ER 마커 PDI 분포에 부합하고, 따라서, 피히아 파스토리스(Pichia pastoris) 효모 세포의 ER에 주로 분포한다는 것을 보여주는 것이라 할 수 있다.
도 6은 트리코데르마 레세이(Trichoderma reesei) 만노시다제-HDEL와 공동발현되는 트리파노소마 크루지(Trypanosoma cruzi) 트랜스-시알리다제의 N-글리칸 분석을 나타낸 것이다. 패널 A: 말토-올리고사카라이드 크기 기준 래더(ladder). 글리칸의 크기는 이들의 전기영동 이동도를 말토-올리고사카라이드의 이동도와 비교하여 글루코스 단위(GU)로 나타내었다. 패널 B: 피히아 파스토리스(Pichia pastoris)에서 발현된 재조합 트리파노소마 크루지(Trypanosoma cruzi) 트랜스-시알리다제로부터 유래하는 N-글리칸. GU=9.2에서의 피크는 Man8GlcNAc2에 해당한다. 패널 C: 나중에 3 U/ml의 정제된 재조합 티. 레세이(T. reesei) α-1,2-만노시다제로 하룻밤동안 처리된 것을 제외하고 패널 2와 동일한 분석물. 패널 D: 피히아 파스토리스(Pichia pastoris)에서 티. 레세이(T. reesei) 만노시다제-HDEL와 (GAP 프로모터으 조절 하에서) 공동 발현되는 재조합 트랜스-시알리다제로부터 유래하는 N-글리칸. GU=7.6에서의 피크는 RNase B의 분석도(패널 F)에서의 Man5GIcNAc2 피크에 해당한다. 패널 E: 나중에 3 U/ml의 정제된 재조합 티. 레세이(T. reesei) α-1,2-만노시다제로 하룻밤동안 처리된 것을 제외하고 패널 D와 동일한 분석물. 패널 F: 소의 RNase B로부터 유래하는 N-글리칸. 이들 글리칸은 Man5GIcNAc2 내지 Man8GIcNAc2로 구성되어 있다. Man7GlcNAc2에 대한 피크의 숫자를 설명하면서, 상이한 이소머들을 분석하였다.
도 7은 HDEL-표지된 트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제 및 쥐의 α-1,2-만노시다제 IB의 HDEL-표지된 촉매활성 도메인에 의한 인플루엔자 적혈구 응집소(influenza haemagglutinin) N-글리칸의 프로세싱을 나타낸 것이다. 이 분석에 있어서, Man5GlcNAc2 기준 올리고사카라이드는 스캔 1850 지점에서 나타난다(도시하지 않음). 패널 1: 말토-올리고사카라이드 크기 기준 래더. 패널 2: 피히아 파스토리스(Pichia pastoris)에서 발현된 재조합 인플루엔자 적혈구응집소로부터 유래하는 N-글리칸. 스캔 2250에서의 피크는 Man9GlcNAc2에 해당한다. 패널 3: 피히아 파스토리스(Pichia pastoris)에서 티. 레세이(T. reesei)만노시다제-HDEL과 함께 (GAP 프로모터의 조절하에서) 공동발현되는 재조합 적혈구 응집소로부터 유래하는 N-글리칸. 스캔 1950에서의 피크는 Man6GlcNAc2에 해당한다. 패널 4: 나중에 30 mU의 정제된 재조합 티. 레세이(T. reesei) α-1,2-만노시다제로 하룻밤동안 처리된 것을 제외하고 패널 3과 동일한 분석물. 패널 5: 피히아 파스토리스(Pichia pastoris)에서 마우스 만노시다제 IB-HDEL과 함께 (GAP 프로모터의 조절하에서) 공동 발현되는 재조합 적혈구 응집소로부터 유래하는 N-글리칸. 패널 6: 나중에 30 mU의 정제된 재조합 티. 레세이(T. reesei) α-1,2-만노시다제로 하룻밤동안 처리된 것을 제외하고 패널 5와 동일한 분석물.
도 8은 벡터 pBLURA5'PpOCH1과 그것의 제작방법을 도식적으로 나타낸 것이다.
도 9는 pBLURA5'PpOCHl를 사용하여 단일 상동성 재조합(single homologous recombination)에 의하여 피히아 파스토리스(Pichia pastoris) OCH1 유전자를 파괴시키는 것을 보여주는 개략도이다.
도 10은 Ochl-불활성화된 클론 및 pGAPZMFManHDEL를 사용하는 형질전환에 의한 이들 Och1-불활성화된 클론으로부터 유래하는 3 개의 클론의 세포벽 당단백질 N-글리칸 분석을 나타낸 것이다. 패널 1은 말토-올리고사카라이드 혼합물의 분석을 나타낸 것으로, 그것의 중합도가 그림의 바로 위에 숫자로 주어져 있다. 이 분석은 다른 패널들을 위한 크기 기준으로서 사용된다. 모든 패널의 세로축 상에, 상대적 형광 단위에서의 피크 강도가 주어진다. 패널 2-6: 다음의 균주의 세포벽 당단백질 N-글리칸의 분석: 패널 2는 조작되지 않은 피. 파스토리스(P. pastoris) 균주 yGC4; 패널 3은 pBLURA5'PpOch1를 사용하여 형질전환된 yGC4; 패널 4-6은 pGAPZMFManHDEL를 사용하여 추가적으로 형질전환된 패널 3의 3 가지 클론. 패널 7: Man5-9GlcNAc2 혼합물로 구성되는, 소의 RNaseB로부터 유래되는 N-글리칸. 패널 2와 3의 비교 및 패널 7로부터 알 수 있는 바와 같이, pBLURA5'PpOchl를 사용하는 형질전환은 강력하게 증가된 많은 OCHlp의 Man8GlcNAc2 기질 N-글리칸 (패널 2에서 피크 1로 표시됨)을 초래한다. 피크 2는 OCHlp의 Man9GlcNAc2 산물을 나타내는 것이다. 또한, pGAPZMFManHDEL의 추가적인 형질전환시에, 3 개의 독립적인 클론의 세포벽 당단백질 상의 주된 글리칸은 Man8GlcNAc2 기질의 티. 레세이(T. reesei) α-1,2-만노시다제 분해(digestion)의 Man5GlcNAc2 최종 산물(패널 4의 피크 3)이다.
도 11은 나중에 pH=5.0인 소듐 아세테이트 20 mM 내에서 3 mU/ml의 정제된 트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제를 사용하여 하룻밤동안 생체외(in vitro) 분해시키는 것을 제외하고, 도 10에서의 글리칸 혼합물과 완전히 동일한 분석을 나타낸 것이다. 축의 할당은 도 10과 동일하다. 모 균주(parent strain, 패널 2)에서 보다 pBLURA5'PpOchl 형질전환 균주(패널 3)에서 더 많은 Man5GlcNAc2이 생성되었다. 모든 패널에서의 스캔 3900 이전의 피크는 오염물질에 기인하는 것이며, 본 분석에서 고려되지 않아야 한다.
도 12는 발현벡터 pGAPZAGLSII(SEQ ID NO: 18)를 나타낸 것이다. P TEF1: 에스. 세레비시애(S. cerevisiae) 전사 연장 인자 유전자의 프로모터. P Em7: 합성 원핵생물 프로모터. Zeocin : 제오신 저항 마커 유전자. CYC1 TT: 에스. 세레비시애(S. cerevisiae) 시토크롬 C1 유전자의 전사 종결서열. Col El: 박테리아의 복제기원. GAP: 피. 파스토리스(P. pastoris) GAP 유전자의 프로모터. GLS2: 에스. 세레비시애(S. cerevisiae) 글루코시다제 II 유전자. AOX1 TT: 피. 파스토리스(P. pastoris) AOX1 유전자의 전사 종결서열.
도 13은 발현벡터 pAOX2ZAGLSII(SEQ ID NO: 16)를 나타낸 것이다. P TEF1: 에스. 세레비시애(S. cerevisiae) 전사 연장 인자 유전자의 프로모터. P Em7: 합성 원핵생물 프로모터. Zeocin: 제오신 저항 마커 유전자. CYC1 TT: 에스. 세레비시애(S. cerevisiae) 시토크롬 C1 유전자의 전사 종결서열. Col El: 박테리아의 복제기원. AOX2 P: 피. 파스토리스(P. pastoris) AOX2 유전자의 프로모터. GLS2: 에스. 세레비시애(S. cerevisiae) 글루코시다제 II 유전자. AOX1 TT: 피. 파스토리스(P. pastoris) AOX1 유전자의 전사 종결서열.
도 14는 발현벡터 pPICZAGLSII(SEQ ID NO: 20)를 나타낸 것이다. P TEF1: 에스. 세레비시애(S. cerevisiae) 전사 연장 인자 유전자의 프로모터. P Em7: 합성 원핵생물 프로모터. Zeocin: 제오신 저항 마커 유전자. CYC1 TT: 에스. 세레비시애(S. cerevisiae) 시토크롬 C1 유전자의 전사 종결서열. Col El: 박테리아의 복제기원. AOX1 P: 피. 파스토리스(P. pastoris) AOX1 유전자의 프로모터. GLS2: 에스. 세레비시애(S. cerevisiae) 글루코시다제 II 유전자. AOX1 TT: 피. 파스토리스(P. pastoris) AOX1 유전자의 전사 종결서열.
도 15는 발현벡터 pYPTlZAGLSII (SEQ ID NO: 22)를 나타낸 것이다. P TEF1: 에스. 세레비시애(S. cerevisiae) 전사 연장 인자 유전자의 프로모터. P Em7: 합성 원핵생물 프로모터. Zeocin: 제오신 저항 마커 유전자. CYC1 TT: 에스. 세레비시애(S. cerevisiae) 시토크롬 C1 유전자의 전사 종결서열. Col El: 박테리아의 복제기원. P YPT1: 피. 파스토리스(P. pastoris) YPT1 유전자의 프로모터. GLS2: 에스. 세레비시애(S. cerevisiae) 글루코시다제 II 유전자. AOX1 TT: 피. 파스토리스(P. pastoris) AOX1 유전자의 전사 종결서열.
도 16은 발현벡터 pGAPADElglsII(SEQ ID NO: 19)를 난타낸 것이다. Amp R: 암피실린 저항 마커 유전자. ADE1: 피. 파스토리스(P. pastoris) ADE1 선별 마커 유전자. GAP: 피. 파스토리스(P. pastoris) GAP 유전자의 프로모터. GLS2: 에스. 세레비시애(S. cerevisiae) 글루코시다제 II 유전자. AOX1 TT: 피. 파스토리스(P. pastoris) AOX1 유전자의 전사 종결서열.
도 17은 발현벡터 pAOX2ADElglsII(SEQ ID NO: 17)를 나타낸 것이다. Amp R: 암피실린 저항 마커 유전자. ADE1: 피. 파스토리스(P. pastoris) ADE1 선별 마커 유전자. AOX2 P: 피. 파스토리스(P. pastoris) AOX2 유전자의 프로모터. GLS2: 에스. 세레비시애(S. cerevisiae) 글루코시다제 II 유전자. AOX1 TT: 피. 파스토리스(P. pastoris) AOX1 유전자의 전사 종결서열.
도 18은 발현벡터 pPICADElglsII(SEQ ID NO: 21)를 나타낸 것이다. Amp R: 암피실린 저항 마커 유전자. ADE1: 피. 파스토리스(P. pastoris) ADE1 선별 마커 유전자. AOX1 P: 피. 파스토리스(P. pastoris) AOX1 유전자의 프로모터. GLS2: 에스. 세레비시애(S. cerevisiae) 글루코시다제 II 유전자. AOX1 TT: 피. 파스토리스(P. pastoris) AOX1 유전자의 전사 종결서열.
도 19는 발현벡터 pYPT1ADE1glsII (SEQ ID NO: 23)를 나타낸 것이다. Amp R: 암피실린 저항 마커 유전자. ADE1: 피. 파스토리스(P. pastoris) ADE1 선별 마커 유전자. P YPT1: 피. 파스토리스(P. pastoris) YPT1 유전자의 프로모터. GLS2: 에스. 세레비시애(S. cerevisiae) 글루코시다제 II 유전자. AOX1 TT: 피. 파스토리스(P. pastoris) AOX1 유전자의 전사 종결서열.
도 20은 발현벡터 pGAPZAglsIIHDEL(SEQ ID NO: 24)를 나타낸 것이다. Amp R: 암피실린 저항 마커 유전자. ADE1: 피. 파스토리스(P. pastoris) ADE1 선별 마커 유전자. GAP: 피. 파스토리스(P. pastoris) GAP 유전자의 프로모터. GLS2: 에스. 세레비시애(S. cerevisiae) 글루코시다제 II 유전자. AOX1 TT: 피. 파스토리스(P. pastoris) AOX1 유전자의 전사 종결서열.
도 21은 발현벡터 pGAPADElglsIIHDEL(SEQ ID NO: 25)를 나타낸 것이다. P TEF1: 에스. 세레비시애(S. cerevisiae) 전사 연장 인자 유전자의 프로모터. P Em7: 합성 원핵생물 프로모터. Zeocin: 제오신 저항 마커 유전자. CYC1 TT: 에스. 세레비시애(S. cerevisiae) 시토크롬 C1 유전자의 전사 종결서열. Col E1: 박테리아의 복제기원. GAP: 피. 파스토리스(P. pastoris) GAP 유전자의 프로모터. GLS2: 에스. 세레비시애(S. cerevisiae) 글루코시다제 II 유전자. AOX1 TT: 피. 파스토리스(P. pastoris) AOX1 유전자의 전사 종결서열.
도 22는 상업적으로 입수가능한 효모 알파-글루코시다제(Sigma사: Cat. No. G-5003)를 사용하는 GLSII 활성 분석 테스트를 나타낸 것이다. 이 분석 혼합물은 pH 6.8의 포스페이트-시트레이트 버퍼, 만노스, 2-데옥시-D-글루코스, 기질 4-메틸움벨리페릴-알파-D-글루코피라노시드 및 알파-글루코시다제(4-methylumbellyferyl-alpha-D-glucopyranoside and alpha-glucosidase, Sigma사)를 포함한다. 1: 37℃에서 하룻밤 동안 배양시킨 후 자외선을 조사한 분석 혼합물; 2: 알파-글루코시다제를 포함하고 있지 않는 것을 제외하고 1과 동일한 분석 혼합물; 3: 기질을 포함하고 있지 않은 것을 제외하고 1과 동일한 분석 혼합물.
도 23은 피히아 파스토리스(Pichia pastoris)로부터 재조합적으로 발현되는 GLSII의 활성 결과를 나타낸 것이다. 모든 분석 혼합물을 37℃에서 하룻밤 동안 배양시키고 나서, 자외선을 조사하였다. 1: 효모 알파-글루코시다제(Sigma: Cat. No. G-5003)를 사용한 분석; 2: 균주 18(pGAPZAGLSII로 형질전환된 PPY12-OH)의 정제된 배양액; 3: WT PPY12-OH 균주의 정제된 배양액; 4: 균주 H3 (pGAPZAglsIIHDEL로 형질전환된 PPY12-OH)의 정제된 배양액.
본 발명은 하기의 실시예들에 의하여 보다 상세히 설명한다.
실시예 1
ER-골지 경계(ER-Golgi Border)로의 α-1,2-만노시다제의 도입
1.1 플라스미드
플라스미드 |
프로모터 |
효소 |
택(tag) |
pGAPZMFManHDEL |
GAP |
티. 레세이(T. reesei) α-1,2-만노시다제 |
-- |
pGAPZMFManMycHDEL |
GAP |
티. 레세이(T. reesei) α-1,2-만노시다제 |
Myc |
pPICZBMFManMycHDEL |
AOX1 |
티. 레세이(T. reesei) α-1,2-만노시다제 |
Myc |
pGAPZMFmManHDEL |
GAP |
마우스 만노시다제 IB 촉매활성 도메인 |
-- |
pGAPZMFmMycManHDEL |
GAP |
마우스 만노시다제 IB 촉매활성 도메인 |
Myc |
트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제 유전자가 Maras et al.에 의하여 분리되고 설명되었다(J. Biotechnol. 77 ; 255-263,2000). 이 유전자의 서열은 NCBI Genbank에서 입수 가능하다(Accession No. AF212153). pPIC9MFmanase 플라스미드(Maras et al. (2000)에 기재된 pPPlMFmdsl과 동일)를 주형으로 사용하고 다음의 올리고뉴클레오타이드 프라이머를 사용하는 PCR에 의하여 구조물 단편을 생성하였다: 5'-GACTGGTTCCAATTGACAAGC-3'(SEQ ID NO:2) 및 5'-AGTCTAGATTACAACTCGTCGTGAGCAAGGTGGCCGCCCCGTCG-3'(SEQ ID N0:3). 얻어진 산물은 피히아 파스토리스(Pichia pastoris) AOXI 프로모터의 3' 말단, 에스. 세레비시애(S. cerevisiae) α-교배 인자의 프리프로-신호 서열(prepro-signal sequence), 신호 서열과 함께 프레임 내에서 클로닝된 트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제의 오픈 리딩 프레임, HDEL의 코딩 서열, 종결 코돈 및 Xba I 절단 부위를 포함하였다. 이러한 단편을 Eco RI and Xba I으로 분해시켜, 만노시다제 ORF까지의 5' 서열을 제거한 후, Eco RI 및 Xba I로 처리한 벡터 pGAPZαA (Invitrogen, Baarn, The Netherlands) 내로 클로닝시켜, 에스. 세레비시애(S. cerevisiae) α-교배 인자 신호 서열과의 융합을 회복시켰다. 얻어진 플라스미드를 pGAPZMFManHDEL이라 명명하고, 도 1에 도식적으로 나타내었다. pGAPZMFManHDEL 내의 MFManHDEL 융합의 ORF 서열을 SEQ ID NO: 14에 나타내었다.
c-Myc 택을 코딩하는 서열을 촉매활성 도메인과 HDEL-신호 사이에 도입하기 위하여, 티. 레세이(T. reesei) α-1,2-만노시다제의 오픈 리딩 프레임(ORF)의 3' 말단을 센스 프라이머 5' CCATTGAGGACGCATGCCGCGCC-3'(SEQ ID NO: 4) (Sph I 절단 부위를 포함함) 및 안티센스 프라이머 GTATCTAGATTACAACTCGTCGTGCAGATCCTCTTCT GAGATGAGTTTTTGTTCAGCAAGGTGGCCGCCCCGTCGTGATGATGAA(SEQ ID NO: 5) (c-Myc 택 및 HDEL 신호의 코딩 서열, 그 다음에 종결코돈 및 Xba I 절단부위를 포함함)를 사용하여 PCR-증폭시켰다. 얻어진 PCR 산물을 Sph I 및 Xba I로 처리하고, 아가로스 겔 전기영동에 의하여 정제하고, 동일한 제한 효소로 절단된 pGAPZMFManHDEL 내로 삽입하여, 플라스미드 pGAPZMFManMycHDEL를 얻었다. pGAPZMFManMycHDEL의 ORF을 유도성 AOXI 프로모터 조절하에 놓이게 하기 위하여, 완전한 ORF을 Bst BI 및 Xba I으로 pGAPZMFManMycHDEL로부터 유리시키고, pPICZB(Invitrogen, Baarn, The Netherlands) 내로 클로닝하여, pPICZBMFManMycHDEL을 얻었다.
PCR를 이용하여 마우스 cDNA 라이브러리(시클로헥시마이드(cycloheximide) 및 마우스 종양 네크로시스 인자(mouse Tumor Necrosis Factor)로 유도된 L929 세포주로부터 분리한 mRNA. cDNA 라이브러리의 평균 삽입 길이는 2000 bp임) 상에서 C-말단 HDEL-택의 코딩 서열의 첨가를 수반하는 마우스 만노시다제 IB 촉매활성 도메인의 클로닝을 수행하였다. 사용된 PCR 올리고뉴클레오타이드 프라이머는 다음과 같다: 5'AACTCGAGATGGACTCTTCAAAACACAAACGC3'(SEQ ID NO: 6) 및 5'TTGCGGCCGCTTACAACTCGTCGTGTCGGACAGCAGGATTACCTGA3'(SEQ ID NO: 7). 얻어진 산물은 5' Xho I 부위 및 C-말단 HDEL-부위의 코딩서열, 그 다음에 3' 말단 쪽에 종결 코돈 및 Not I 부위를 포함하였다. 이 산물을 PCR 산물 및 벡터 내의 Xho I/Not I 부위를 통하여 pGAPZαA 내로 클로닝시키고, 에스. 세레비시애(S. cerevisiae) α-교배 인자 신호 서열을 갖는 마우스 만노시다제 효소활성 도메인의 프레임 융합을 얻었다. 생성된 완전한 오픈 리딩 프레임의 서열을 SEQ ID NO: 15에 나타내었다.
1.2 효모 형질전환 및 게놈 통합
모 균주(Parental strain) |
형질전환된 DNA |
GS 115 (his4) |
pGAPZMFManHDEL |
pPIC9MFManHDEL |
pPIC9mManHDEL |
pPIC9mMycManHDEL |
pGAPZmManHDEL |
pGAPZmMycManHDEL |
GS 115 (pPIC9InfluenzaHA에 의하여 보완된 his4) |
pGAPZMFManHDEL |
pGAPZmManHDEL |
pGAPZmMycManHDEL |
PPY120H (pPIC9sOCH1에 의하여 보완된 his4) |
pGAPZMFManMycHDEL |
pPICZBMFManMycHDEL |
yGC4 (pBLURA5'PpOCHl에 의하여 보완된 his4 argl ade2 ura3) |
pPIC9InfluenzaNeuraminidase |
pGAPZMFManHDEL |
pPIC9Glucoseoxidase |
피히아 파스토리스(Pichia pastoris)에 대한 모든 형질전환은 일렉트로포레이션으로 Invitrogen의 사용법에 따라서 수행하였다. 100 ㎍/ml의 제오신(Invitrogen, Baarn, the Netherlands) 및 1 M의 소르비톨을 포함하는 YPD 상에서 제오신(Zeocin) 저항 유전자를 운반하는 벡터의 형질전환체를 선별하였다. pPIC9 유도체의 형질전환체의 선별을 히스티딘이 결핍되고 1 M의 소르비톨을 포함하는 최소배지 상에서 수행하였다. 효모 미니프렙법(Yeast Miniprep method, Nucleon)을 이용하여 피히아(Pichia) 균주로부터 정제된 게놈 DNA 상에서 PCR을 이용하여 발현 카세트의 게놈 통합을 검증하였다. 트리코데르마 레세이(Trichoderma reesei) 유전자 융합과 관련된 모든 경우에 있어서, 사용된 프라이머는 다음과 같다: 만노시다제 ORF의 3' 절반 부분에 대하여 아닐링된(annealed) 센스 프라이머 5'-CCATTGAGGACGCATGCCGCGCC-3' (SEQ ID NO: 8), 및 본 발명의 모든 발현 구조물들에 존재하는 AOXI 종결 서열에 대하여 아닐링된 안티센스 프라이머 3' AOXI 5'-GCAAATGGCATTCTGACATCCT-3' (SEQ ID NO: 9). 마우스 만노시다제 트랜스유전자(transgenes)의 게놈 통합을 조절하기 위하여, 다음과 같은 프라미어를 사용하여 PCR 하였다: 센스 프라이머 5'GAP 5'GTCCCTATTTCAATCAATTGAA3' (SEQ ID NO: 10, GAP 프로모터에 대하여 아닐링됨) 또는 5'AOXI 5'GACTGGTTCCAATTGACAAGC3' (SEQ ID NO : 11, AOXI 프로모터에 대하여 아닐링됨) 및 상기한 안티센스 프라이머 3'AOXI. Myc 표지된 트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제 발현 유니트를 포함하는 발현 구조물에 대하여, 게놈 통합에 대한 추가적인 증거를 프로브로서 완전한 MFManMycHDEL ORF (HighPrime을 이용하여 32P 표지됨, Boehringer Mannheim)를 사용하는 서던 블라팅에 의하여 얻었다.
1.3 α-1,2-만노시다제의 발현
인플루엔자 바이러스 적혈구 응집소를 발현시키는 GS115 균주에서의 α-1,2-만노시다제의 발현을 정성적 노던 블라트를 사용하여 검증하였다. PPY120H 균주에서의 α-1,2-만노시다제의 발현은 항-Myc 웨스턴 블라트에 의하여 검증하였다.
정성적 노던 블라트(Qualitative Northern Blot) -- 피히아(Pichia) 균주로부터 전체 RNA를 정제하고 수율을 분광광도측정으로 측정하였다. 노던 블라팅은 표준적 절차에 의하여 수행하였으며, 부하된 RNA의 양은 블라트를 메틸렌 블루 염색하여 rRNA 밴드를 가시화시킴으로써 측정하였다. HighPrime(Boehringer Mannheim)을 사용하여 32P 표지된 만노시다제의 Clal/NarI 단편으로 블라트를 검사하였다.
SDS PAGE 및 웨스턴 블라팅 -- 세포를 PBS로 두 번 세척한 후, 2x 농축 Laemmli 로딩 버퍼 1 volume 에서 5분 동안 가열함으로써 전체 효모 세포 용해물을 얻었다. 겔 로딩시키기 전에 상기 용해물을 미량원심분리기(microcentrifuge)에서 잠시동안 회전시킨 후 상청액만을 로딩시켰다. 성장 배지 내로 분비된 단백질의 분석을 위하여, 표준 절차에 따라서 데스옥시콜레이트/트리클로로아세트산(desoxycholate/trichloroacetic acid)을 사용하여 이들 배지 200 ㎕로부터 단백질을 침전시켰다. 펠렛을 2x 농축 Laemmli 로딩 버퍼에 재용해시키고, Tris를 사용하여 상기 용액을 pH 보정하였다. SDS-PAGE를 수행하고 나서, 니트로셀룰로오스 멤브레인으로 반건조 일렉트로블라팅시켰다. 웨스턴 블라팅을 위하여, 9E10 항-Myc 및 항-HA 마우스 모노클로날(Boehringer Mannheim)을 1 ㎍/㎖의 농도로 사용하고, 래빗 항-PDI 항혈청(Stressgen)을 1/500 희석하여 사용하였다. 이차 항체는 모노클로날에 대한 알칼라인 포스파타제에 콘쥬게이트된 염소 항-마우스 IgG 및 폴리클로날(Sigma로부터 입수한 이차 항체)에 대한 페록시다제에 콘쥬게이트된 염소 항-래빗 IgG 이었다. 알칼라인 포스파타제에 대해서는 NBT/BCIP 시스템을 사용하고 페록시다제에 대해서는 Renaissance 기질(NENBiosciences)을 사용하여 검출하였다. 루미라거 이미지화 장치(Lumilager imaging device, Boehringer Mannheim) 상에서 후자의 블라트 결과를 이미지화하였다.
도 4에 나타난 결과는, 강력한 구성성 GAP 프로모터로부터 발현되거나 강력한 유도성 AOXI 프로모터로부터 발현되는 경우 모두에 있어서, 대부분의 HDEL-표지된 단백질이 세포내에 남아있다는 것을 보여준다..
1.4 α-1,2-만노시다제의 위치화
수크로스 등밀도 구배 원심법(Isopycnic sucrose density gradient centrifugation) -- HDEL-표지 만노시다제의 위치화를 측정하기 위하여, 강력한 구성성 GAP 프로모터로부터 만노시다제-Myc-HDEL를 발현시키는 세포를 사용하여 세포 하부 분획화를 수행하였다.
간단히 말해서, 습윤 중량 0.5 g의 효모 세포를 1 ml 용해-버퍼(0.6 M 소르비톨, 10 mM β-메르캅토에탄올 및 5 mM MgCl2을 포함하는 50 mM Tris-HCL pH 7.5)에서 4.5 g 글래스 비드로 4 x 1 min 볼텍싱하여 용해시켰다. 볼텍싱 주기 사이에, 상기 혼합물을 얼음위에 5분동안 놓아두었다. 상청액을 취하고 글래스 비드를 용해-버퍼로 세척하고, 이러한 세척 단계의 상청액을 상기 첫 번째 상청액에 첨가하였다. 이러한 용해물에 대하여 서로 다른 원심분리 절차를 수행하였다. 용해 버퍼에서 P10000 펠렛을 60% 수크로스 용액 0.5 ml에 용해시켰다. 이 용액을 14 x 89 mm 울트라클리어 초원심분리관(Ultraclear ultracentrifuge tube, Beckman)의 바닥에 넣었다. 이어서, 각각 1.5 ml의 55%, 50%, 45%, 42.5%, 40% 및 37.5%의 수크로스 용액을 서로 층을 이루도록 조심스럽게 넣었다. 관의 나머지를 35% 수크로스로 채웠다. Beckman 모델 L8-70 예비 초원심분리기 내의 Beckman SW 41 회전통 내에서 180,000g으로 14 시간동안 수크로스 등밀도 구배 원심분리를 수행하였다. 다 마친 후, 윗부분에서 l ml 분획물을 취하고, 과량의 수크로스로부터 부분적으로 투석시키고, 진공 원심분리기에서 건조해질 때까지 증발시켰다. 펠렛을 Laemmli 버퍼에 재용해시킨 후, 시료를 3중으로 SDS-PAGE 수행하고, 웨스턴 블라트를 각각 항-HA, 항-Myc 또는 항-PDI(단백질 디설파이드 이소머라제를 위한 "PDI")로 처리하였다.
결과는 MFManMycHDEL가 단백질 디설파이드 이소머라제 마커 단백질(또한 HDEL 신호 서열과 함께 표적화됨)과 거의 정확하게 공-침강한다는 것을 보여준다(도 5). 동일한 분석에 있어서, HA-표지된 OCH1가, 만노시다제 및 PDI를 포함하는 분획물의 밀도 보다 낮은 밀도를 갖는 분획 내 가장 많은 양으로, 전체 구배에 걸쳐서 분포하였다. 이러한 결과는 HDEL 신호를 첨가함으로써 만노시다제가 원하는 위치(ER-골지 경계부분)로 표적화되었다는 것을 나타낸다. 이와 반대로, 유도성 알코올 옥시다제 I 프로모터(GAP 프로모터에 유사하게 강력함)로부터 발현되는, HDEL을 갖지 않는 만노시다제가 약 20 mg/l의 높은 수준으로 분비된다.
면역형광 현미경법(Immunofluorescence microscopy) -- 만노시다제-Myc-HDEL이 정확하게 표적화되었는지 확인하기 위하여, 면역형광 현미경 실험을 수행하였다.
간단히 말해서, 효모 배양물을 YDP(pGAPZMFManMycHDEL의 경우) 또는 pPICZBMFManMycHDEL의 YPGlycerol 증식기 이후에는 YMP에서 OD600까지 성장시켰다. 포름알데히드를 최종 농도 4%가 되게 하여 배양물에 첨가하고 실온에서 10분 동안 배양하였다. 세포들을 펠레팅시키고, 1mM MgCl2 및 4% 포름알데히드를 함유하는 50 mM 포타슘 포스페이트 버퍼 pH 6.5에 재현탁시키고, 실온에서 2 시간동안 배양하였다. 펠레팅 후, 세포들을 1mM MgCl2 및 무-EDTA 컴플리트TM 프로테아제 억제제 칵테일(EDTA-free CompleteTM protease inhibitor cocktail, Boehringer Mannheim)를 함유하는 100 mM 포타슘 포스페이트 버퍼 pH 7.5에 OD600=10이 될 때까지 재현탁시켰다. 100 ㎕의 세포 현탁액에 0.6 ㎕의 β-메르캅토에탄올 및 20 ㎕의 20,000 U/ml 자이몰리아제(Zymolyase) 100T(ICN)을 첨가하고, 이어서 부드럽게 흔들면서 25분 동안 배양하였다. 이들 세포를 인큐베이션 버퍼에서 2 번 세척하고, 폴리-라이신 코팅된 커버 슬립(이들은 종이에서의 천공(perforation)을 강화하기 위하여 일반적으로 사용되는 점착성 링을 사용하여 제조됨)에 첨가하였다. 과량의 액체를 면봉으로 빨아들이고 이들 세포를 20 ℃에서 건조시켰다. 모든 블로킹, 항체 배양 및 세척 단계를 0.05% 소 혈청 알부민을 함유하는 PBS 내에서 수행하였다. 1차 항체를 2㎍/㎕ 사용하고, 플루로포어(flurophores, 분자 프루브)와 콘쥬게이트된 이차 항체를 5 ㎍/㎕ 사용하였다. 핵을 핵산 염료 HOECHST 33258로 염색하였다. 고정시킨 후, 세포벽 투과성(permeabilization), 효모 세포 형태의 보전을 위상차 현미경법으로 체크하고, 면역염색(immunostaining) 후, 코닥 디지털 카메라를 갖춘 Zeiss Axiophot 형광 현미경 하에서 슬라이드를 검사하였다. 상을 Macprobe 4.0 소프트웨어를 사용하여 처리하고, 코렐 포토페인트(Corel Photopaint) 9.0으로 제작하였다.
골지 마커 단백질 OCH1-HA은 문헌에 기재된 전형적인 골지 염색 패턴(반점 모양(speckle-like) 염색)을 나타내었다. 9E10 모노클로날 항-Myc 항체를 사용하는 염색은 만노시다제-Myc-HDEL를 인지하여 세포질 내에서 몇 몇 이질적인 염색 패턴을 갖는 핵주위 염색 패턴을 보였고, 이는 ER 표적화를 매우 잘 나타내는 것이다(도 4).
상기한 실험들에 기초하여, 트리코데르마 레세이(Trichoderma reesei) 만노시다제-Myc-HDEL이 ER-골지 경계 부분으로 표적화되었다고 결론지을 수 있다.
실시예 2
재조합 당단백질과 만노시다제-HDEL의 공동 발현
트리파노소마 크루지 트랜스-시알리다제(
Trypanosoma cruzi trans
-Sialidase)와 만노시다제-HDEL의 공동 발현
C-말단 반복 도메인을 갖지 않는 활성 트랜스 시알리다제 구성원을 코딩하는 트리파노소마 크루지(Trypanosoma cruzi) 트랜스-시알리다제 유전자가 여기에 참조로서 포함되어 있는 Laroy et al.(Protein Expression and Purification 20: 389, 2000)에 기재되어 있다. 이러한 트리파노소마 크루지(Trypanosoma cruzi) 트랜스-시알리다제 유전자는 NCBI Genbank를 통하여 입수가능하다(Accession No. AJ276679). 피. 파스토리스(P. pastoris)에서 발현시키기 위하여, 전체 유전자를 pHILD2 (Invitrogen, San Diego, CA)에서 클로닝하여, pHILD2-TS를 제조하였다. 보다 잘 분비되게 하기 위하여, 트랜스-시알리다제가 효모 α-교배 인자의 프리프로 분비 신호와 결합되어 있는 pPIC9-TS를 제작하였다. 트랜스-시알리다제의 C-말단에 에피토프 E-택이 첨가되어 있어서 탐지 및 정제가 용이한 플라스미드 pPIC9-TSE 및 pCAGGS-프리프로-TSE를 제작하였다. pHILD2-TS, pPIC9-TSE 및 pCAGGS-프리프로-TSE의 구조는 여기에 참조로서 포함되어 있는 Laroy et al. (2000)에 기재되어 있다. 상기 제작에 사용된 벡터 중 pCAGGS는 http://www.belspo.be/bccm/lmbp.htm#main (No. LMBP 2453)을 통하여, pHILD2 및 pPIC9는 Invitrogen, San Diego, CA를 통하여, pCANTAB-5E는 Pharmacia Biotech를 통하여 입수가능하다.
플라스미드 pPIC9-TSE를 SstI로 선형화시키고 제조자의 사용설명서(Invitrogen)에 따른 일렉트로포레이션에 의하여 피. 파스토리스(P. pastoris) GS115 (his4) 균주 내로 형질전환시켰다. 형질전환체 중 하나를 플라스미드 pGAPZMFManHDEL로 추가적으로 형질전환시켜서, 만노시다제-HDEL 및 트리파노소마 크루지(Tiypanosoma cruzi) 트랜스-시알리다제를 공동 발현시키는 균주를 제작하였다.
발효 및 단백질 정제는 "Laroy et al. (2000)"에 기재된 바에 따랐다.
정제된 트랜스-시알리다제를 "Callewaert et al., Glycobiology 11, 4, 275- 281, 2001"에 따라 탄수화물 분석하였다. 간단하게 말해서, 96-웰 플레이트의 벽에서 당단백질을 PVDF 멤브레인에 결합시키고, 환원시키고, 알킬화시키고 펩타이드-N-글루코시다제 F 탈글리코실화(peptide-N-glycosidase F deglycosylation) 시켰다. 환원성 아미노화에 의하여 글리칸이 8-아미-1,3,6-파이렌트리술폰산과 함께 유도되었다. 이어서, 과량의 유리 표지(label)을 세파덱스 G10-packed 스핀 컬럼을 사용하여 제거하고, 클리칸을 ABI 377A DNA-시퀀서 상의 36 cm 시퀀싱 겔 상에서의 일렉트로포레이션에 의하여 분석하고 빌트-인 아르곤 레이저를 사용하여 검출하였다. 20 mM 소듐 아세테이트 pH=5.0에서 3 mU/ml의 정제된 티. 레세이(T. reesei) α-1,2-만노시다제(Maras et al., J. Biotechnol. 77, 255-63,2000에 기재됨)를 사용하여 분해하였다. 1 ㎍의 정제된 재조합 당단백질로부터 유래한 글리칸을 기질로 사용하였다. α-1,2-만노시다제 1U를 37 ℃ 및 pH=5.0에서 1 분당 빵 효모 만난으로부터 1 μmol의 만노스를 방출하는 효소의 양으로 정의하였다.
도 6에서 볼 수 있는 바와 같이, 패널 B, 트랜스-시알리다제 상의 주요한 N-글리칸은 Man8GlcNAc2 (소의 RNAseB의 N-글리칸 분석을 나타낸 패널 F와 비교. 이 분석표의 하나의 마지막 피크가 Man8GlcNAc2이며, 첫 번째 피크가 Man5GlcNAc2임) 이었다. 생체 외에서, 이러한 글리칸은 α-1,2-만노시다제에 의하여 Man5GlcNAc2로 분해가능하였다(도 6, 패널 C). 만노시다제-HDEL와 공동 발현된 트랜스-시알리다제의 N-글리칸 분석표에 있어서, 주된 피크는 Man5GIcNAc2에 해당한다(도 6, 패널 D).
인플루엔자 A 바이러스 적혈구 응집소와 만노시다제-HDEL의 공동 발현
인플루엔자 A 바이러스 적혈구 응집소는 피히아 파스토리스(Pichia pastoris)에서 9 내지 12 개의 만노스 잔기를 포함하는 고(high) 만노스 N-글리칸으로 글리코실화된다고 알려져 있다(Saelens et al. Eur. J. Biochem. 260: 166-175,1999). 적혈구 응집소의 N-글리칸 상에서 공동발현된 만노시다제의 효과를 하기되는 N-글리칸 프로파일링(profiling)법으로 검사하였다. 또한, 트리코데르마(Trichoderma) 효소(최적온도 60 ℃)의 효능을 최적온도 37 ℃인 포유류 만노시다제와 비교하기 위하여, 마우스 cDNA-라이브러리로부터 얻은 마우스 만노시다제 IB를 클로닝하고, PCR 증폭을 이용하여 HDEL 신호로 표지하였다. 이러한 ORF을 GAP 프로모터 조절하의 에스. 세레비시애(S. cerevisiae) α-교배 인자의 프리프로(prepro)-신호 서열 다음에 클로닝하였다. mRNA 수준에서의 만노시다제-HDEL 트랜스유전자의 발현을 정성적 노던 블라팅에 의하여 확인하였다.
적혈구 응집소를 발현시키고 만노시다제를 발현시키지 않는 대조군 균주 및 "Kulakosky et al. Glycobiology 8: 741-745 (1998)"에 기재된 절차에 따라서 트리코데르마 레세이(Trichoderma reesei) 만노시다제-HDEL 또는 마우스 만노시다제 IB-HDEL를 공동 발현시키는 균주로부터 정제하였다. 정제된 적혈구 응집소를 "Saelens et al. Eur. J, Biochem. 260 : 166-175,1999"에 기재된 바와 같이 PNGase F 분해하였다. 단백질과 글리칸을 냉각(ice-cold) 아세톤 3 volumes으로 침전시키고, 60% 메탄올로 펠렛으로부터 글리칸을 추출하였다. 진공 증발 후, 1.2M 시트르산 내 20 mM APTS 및 DMSO 내 1M NaCNBH3의 1:1 혼합물 1 ㎕를 첨가하고 37 ℃의 250 ㎕ PCR-튜브의 바닥에서 16 시간동안 배양함으로써 글리칸을 8-아미노-1,3,6 파이렌트리술폰산으로 라벨링하였다. 10 ㎕의 탈이온수를 첨가하여 반응을 종결시키고, 혼합물을 진동 버킷 회전기 내에서 원심분리하여 마이크로스핀-컬럼 내 건조상태로 패킹된 1.2 cm 세파덱스 G10 베드 상에 로딩시켜서, 평평한 레진(resin) 표면을 제공하였다. 로딩 후, 50 ㎕의 탈이온수를 조심스럽게 레진 베드에 첨가하고 스핀 컬럼을 테이블탑 원심분리기에서 750g으로 5초동안 간단하게 원심분리시켰다. 이러한 용리 공정을 두 번 반복하고 모든 용리액을 모아서 Speedvac 진공 원심분리기(Savant)에서 건조상태가 될 때까지 증발시켰다. 내부적 참조 기준으로 소용이 있는, 로다민(rhodamine, Perkin Elmer Bioscience)으로 라벨링된, 50% 포름아미드 및 0.5㎕ Genescan 500TM을 포함하는 겔 로딩 버퍼 1.5 ㎕에서 상기 라벨링된 글리칸을 재구성하였다. 이러한 혼합물을 아크릴아미드:바이사크릴아미드(Biorad, Hercules, CA, USA)가 19:1인 혼합물 10%를 포함하고 표준 DNA-시퀀싱 버퍼(89 mM Tris, 89 mM 보레이트, 2.2 mM EDTA)로 제조된 DNA-시퀀싱 겔 상에 로딩시켰다. 물 내의 10% 암모노늄퍼설페이트(ammononiumpersulfate) 용액 200 ㎕와 TEMED 20 ㎕를 첨가함으로써 겔의 중합화를 촉진하였다. 상기 겔은 표준 36 cm well-to-read 길이였고, Applied Biosystems Model 373A DNA-시퀀싱 장치상에 런닝시켰다. 상기 겔의 프리런닝(prerunning)을 1000 V에서 15분 동안 수행하고, 로딩 후, 상기 겔을 가열하지 않고 1250 V에서 8시간 동안 전기영동하였다. 이러한 방법은 피크당 10 fmol의 검출 제한을 나타냈다. 상기 데이타를 Genescan 3.0 소프트웨어로 분석하였다.
도 7에서 알 수 있는 바와 같이, 트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제는 N-글리칸 상에 존재하는 α-1,2-만노스의 수에 있어서 가장 완벽한 감소한 것을 나타내고 있다. 마우스 만노시다제 IB-HDEL에 의한 N-글리칸 처리는 트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제보다 덜 효과적이었다.
적혈구 응집소의 N-글리칸으로부터의 효율적인 α-1,2-만노스 제거에도 불구하고, Man5GIcNAc2는 얻어지지 않았다. N-글리칸을 정제된 트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제 3mU로 분해한 다음에도, 가장 작은 당 사슬로서 오직 Man6GlcNAc2만이 얻어졌다. 이러한 결과는 잔존하는 잔기들이 개시 OCH1 α-1,6-만노실트랜스퍼라제 효소 활성에서 유래하는, α-1,6-결합 만노스일 가능성을 나타낸다. OCH1는 골지의 매우 앞부분에 위치화하고, 만노시다제-HDEL에 의하여 Man8GIcNAc2 전구체가 Man5GlcNAc2로 완전하게 분해되기 전에 적혈구 응집소의 N-글리칸에 작용할 수 있다는 것이 관찰되었다. 따라서, 글리칸이 α-1,6-만노실트랜스퍼라제에 의하여 유효하게 변형된 단백질에 있어서, 트랜스퍼라제를 코딩하는 OCH1 유전자의 불활성화는 Man5GlcNAc2을 갖는 단백질을 얻기 위하여 바람직할 것이다.
실시예 3
피히아(
Pichia
) Och1 유전자의 불활성화:
피히아 파스토리스(Pichia pastoris)의 한 서열을 GenBank(Accession No. E12456)에서 찾을 수 있으며, 여기에 참조로서 포함되어 있는 일본특허출원 제07145005호에 개시되어 있다. 이 서열은 α-1,6-만노실트랜스퍼라제의 모든 특성을 보여주고, 에스. 세레비시애(S. cerevisiae) OCH1과 가장 상동성이 있어서, 여기서는 피히아 파스토리스(Pichia pastoris) Och1 유전자라 칭한다.
우선, 피히아 파스토리스(Pichia pastoris) Och1 유전자의 전체 ORF을 pUC 18 내에서 PCR 클로닝하여 플라스미드 pUC18pOchl를 얻었다. pUC18pOchl를 HindIII로 절단하고, T4 폴리머라제로 블런트 말단을 형성하고, 그리고 나서 XbaI로 절단하여, 피히아 파스토리스(Pichia pastoris) Och1 유전자의 5' 부분을 포함하는 단편을 방출시켰다. 이러한 단편을, Eco RI으로 절단되고 T4 폴리머라제로 블런트 말단이 형성되고 나서 Nhe I으로 절단된 벡터 pBLURA IX(Keck Graduate Institute, Dr. James Cregg, http://www.kgi.edu/html/noncore/faculty/cregg/cregg.htm로부터 입수가능)내로 연결시켰다. 도 8에 나타난 바와 같이, 이러한 연결에 의하여 pBLURA5'PpPCHl이 생성되었다.
이러한 피히아(Pichia) 게놈 내에서의 피히아(Pichia) Och1 유전자의 파괴는, 도 9에 나타낸 바와 같이, pBLURA5'PpOCHl을 사용하는 단일 상동성 재조합(single homologous recombination)에 의하여 달성될 수 있다. 단일 상동성 재조합의 결과, 피히아(Pichia) 염색체 상의 Ochl 유전자를 2 개의 Ochl 서열로 대체시킬 수 있다: 하나는 단지 전체 Ochl ORF의 처음 약 1/3으로 구성되며, 다음 하나는 Ochl 프로모터 없이 전체 Ochl ORF로 구성된다. 단일 상동성 재조합은 다음과 같이 수행한다. 피히아(Pichia) 균주 yGC4의 세포들을 단일 커터 Bst BI로 선형화된 pBLURA5'PpOCHl을 사용하여 일렉트로포레이션시킴으로써 형질전환시켰다. 약 500 개의 형질전환체를 1M 소르비톨, 비오틴, 아르기닌, 아데닌 및 히스티딘을 포함하는 최소 배지 상에서 얻어서 27 ℃에서 배양하였다. 이들 형질전환체 중 32개를 골라서 동일한 조건 하에서 재선별하였다. 카세트의 정확한 게놈 통합을 위하여 PCR로 12 개의 클론을 추가적으로 분석하였다. 12 개의 URA 독립영양 클론 중 7개가 정확한 자리에 카세트를 포함하고 있었다.
Ochl-불활성화된 클론 중 하나를 또한 pGAPZMFManHDEL를 사용하여 추가적으로 형질전환시켜서 "초형질전환체(supertransformants)"를 제조하였다. ManHDEL를 또한 발현시키는 3 개의 초형질전환체 및 Ochl-불활성화된 클론 모두 다음과 같은 세포벽 글리칸 분석에서 평가하였다. 효모 세포를 10 ml YPD에서 OD600=2까지 성장시키고, 효모 세포를 120 ℃, 20 mM 소듐 시트레이트 버퍼 pH 7에서 90 분동안 오토클레이빙하고 원심분리 후 상청액을 회수하여 만노단백질(mannoproteins)을 제조하였다. 찬 메탄올 3 volumes을 사용하여 단백질을 상기 상청액으로부터 침전시켰다. 이러한 방법으로 얻어진 단백질 표본을 "Callewaert et al. (2001) Glycobiology 11, 275-281"에 기재된 바와 같이 DSA-FACE를 사용하는 N-글리칸 분석에 사용하였다. 도 10에 나타낸 바와 같이, 모 균주 yGC4와 비교하여, Ochl-불활성화된 클론에서 Man8GIcNAc2 글리칸의 양이 증가하였으며, 이는 Och1 효소의 활성이 감소하였음을 나타낸다. HDEL-표지된 α-1,2-만노시다제를 또한 발현시키는 3 개의 초형질전환체에 있어서, Man5GlcNAc2의 생산이 관찰되었다. 게다가, 정제된 재조합 트리코데르마 레세이(Trichoderma reesei) α-1,2-만노시다제 3 mU/ml를 이용한 동일한 글 리칸 혼합물의 분해에 있어서, 모 균주보다 pBLURA5'PpOCH1로 형질전환된 균주에서 보다 많은 Man5GlcNAc2가 생성되었다(도 11, 패널 2와 3 비교).
이러한 결과는 α-1,2-만노시다제를 발현시키는 세포들로부터 얻은 적혈구 응집소와 같이 재조합적으로 생산된 단백질 상에서의 Man5 글리칸의 생산의 결여는 Och1 단백질의 활성에 기인한다는 것을 확인시키는 것이다. 또한. 이러한 결과는 Man5 글리칸을 갖는 당단백질의 생산이 Och1 유전자의 불활성화에 의하여 촉진된다는 것을 나타낸다.
실시예 4
피히아 파스토리스(
Pichia pastoris
)에서의 글루코시다제 II의 발현
4.1 에스. 세레비시애(
S. cerevisiae
)로부터 GLSII 알파-서브유니트 ORF의 증폭
Nucleon 키트(Amersham)를 사용하여 에스. 세레비시애(S. cerevisiae) 균주 INVS(α, leu2-3, 112 his3Δl, trpl-289, ura3-52)로부터 게놈 DNA를 제작하였다. 상기 게놈 DNA를 주형으로 사용하고 LA TaKaRa 폴리머라제(ImTec Diagnostics)를 사용하여 터치-다운 PCR 반응을 수행하였다. PCR 프라이머의 서열은 공지된 에스. 세레비시애(S. cerevisiae) GLSII ORF 서열을 기초로 하였다:
4.2 피히아 파스토리스(
Pichia pastoris
) 발현 벡터 내로의 에스. 세레비시애(
S. cerevisiae
) 글루코시다제 II ORF의 클로닝
글루코시다제 II 발현 벡터의 제작 -- 상기 PCR 단편을 Xho I/Apa I로 분해시키고 pGAPZA 벡터(Invitrogen) 내로 연결시킴으로써, OFR을 GAP 프로모터의 전사 조절 하에 위치시켰다. 이러한 방법을 사용하여, myc 및 His6 택(tag)을 글루코시다제 II에 대한 프레임 내에 위치시키고, pGAPZAGLSII를 생성시켰다. 그리고 나서, pGAPZAGLSII의 완전한 ORF을 시퀀싱하여 PCR 반응 중에 돌연변이가 발생하지 않았음을 확인하였다. 벡터 pGAPZAGLSII의 서열을 SEQ ID NO: 18에 나타내었다. pGAPZAGLSII 벡터의 GLSII ORF을 벡터 pPICZA(Invitrogen) 내로 클로닝하여 pPICZAGLSII를 제조함으로써, ORF을 AOXI 프로모터의 전사 조절 하에 위치시켰다. pGAPZAGLSII 벡터의 GLSII ORF 벡터 pAOX2ZA 내로 클로닝함으로써, ORF을 AOX2 프로모터의 전사 조절 하에 위치시켰다. 이 벡터는 pAOX2ZB 벡터의 멀티 클로닝 사이트를 pPICZA의 멀티 클로닝 사이트로 대체시켜서 제조하였다. AOX2 유전자의 AOX2 프로모터 부위에 의하여 pPICZB의 AOX1 프로모터를 대체시킴으로써 벡터 pAOX2ZB를 만들었다(Martinet et al., Biotechnology Letters 21). AOX2 프로모터 부위를 피히아(Pichia) 게놈 DNA 상에서 센스 프라이머 5'GACGAGATCTTTTTTTCAGACCATATGACCGG 3' (SEQ ID NO: 26) 및 안티센스 프라이머 5'GCGGAATTCTTTTCTCAGTTGATTTGTTTGT 3' (SEQ ID NO: 27)를 사용하는 PCR에 의하여 생성시켰다. pGAPZGLSII 벡터의 GLSII ORF를 벡터 pYPTlZA 내로 클로닝하여 pYPTIZAGLSII를 생성시킴으로써, ORF을 YPT1 프로모터의 전사 조절 하에 위치시켰다. pPICZA의 AOX1 프로모터를 플라스미드 pIB3 (GenBank accession number AF027960) 상에 존재하는 YPT1 프로모터로 대체시킴으로써 벡터 pYPTZA를 제조하였다(Sears et al., Yeast 14, pg 783790,1998). 모든 구조체는 플레오마이신(phleomycin) 저항 유전자를 포함한다. 얻어진 최종 발현 벡터(pGAPZAGLSII, pAOX2ZAGLSII, pPICZAGLSII 및 pYPTIZAGLSII)를 도 12 내지 15에 나타내었다.
암피실린 저항 마커 및 피히아(Pichia) ADE1 선별 마커를 운반하는, 유사한 발현 벡터를 제작하였다. 원칙적으로, 플라스미드 pAOX2ZAGLSII, pGAPZAGLSII 및 pYPTIZAGLSII의 제오신(Zeosin) 저항 발현 카세트를 벡터 pBLADE IX (Cregg, J. M.)의 암피실린 및 피히아(Pichia) ADE1 카세트로 대체하여, 벡터 pAOX2ADElglsII, pGAPADElglsII 및 pYPTlADElglsII을 얻었다. 글루코시다제 II 오픈 리딩 프레임을 벡터 pBLADE IX (Cregg, J. M.)의 멀티플 클로닝 사이트 내로 삽입시킴으로써 벡터 pPICADElglsII를 얻었다. 얻어진 최종 발현 벡터(pGAPADElglsII, pAOX2ADElglsII, pPICADElglsII 및 pYPTlADElglsII)를 도 16 내지 20에 나타내었다.
글루코시다제 II 발현 벡터에 ER 체류 택 HDEL의 첨가 -- 다음과 같은 프라이머를 HDEL-포함 PCR 단편의 제작에 사용하였다:
프라이머 1: 5'GCG GGT CGA C/CA C/GA C/GA A/CT G/TG A/GT TTT AGC CTT
Sal I H D E L stop
AGA CAT GAC 3' (SEQ ID NO : 28)
프라이머 2: 5'CAG GAG CAAA GCT CGT ACG AG 3' (SEQ ID NO : 29)
Spl I
60 ℃에서 Taq pol.을 사용하여 pGAPZAGLSII 상에서 PCR을 수행하였다. 225 bp의 PCR 단편을 Sal I/Spl I으로 절단하고 Sal I/Spl I 개방 pGAPZAGLSII 벡터 내로 연결시켜서, 플라스미드 pGAPZAglsIIHDEL를 제작하였다. 플라스미드 pGAPZAglsIIHDEL의 서열을 SEQ ID NO: 24에 나타내었다. 제작 방법 및 얻어진 최종 발현 벡터(pGAPZAglsIIHDEL 및 pGAPADElglsIIHDEL)를 도 20 내지 21에 나타내었다.
4.3 피히아 파스토리스(
Pichia pastoris
) 균주의 형질전환
Invitrogen에 기재된 바와 같은, 통상적인 일렉트로포레이션 기술을 사용하여 형질전환을 수행하였다. 피히아 파스토리스(Pichia pastoris) 균주 PPY12-OH의 세포들을 단일 커터 Avr II로 절단된 pGAPZGLSII를 사용하여 형질전환시켰다. 형질전환체들을 그들의 제오신 저항성에 기초하여 선별하였다.
형질전환체의 게놈 분석 -- 몇 몇 제오신 저항성 피히아(Pichia) 형질전환체로부터 게놈 DNA를 제조하였다. 글루코시다제 II 유전자가 효모 게놈 내로 통합되었는지 아닌지를 결정하기 위하여 게놈 DNA 상에서 PCR 반응을 수행하였다. Taq DNA 폴리머라제(Boehinger)(2.5 mM MgCl2, 55 ℃ 에서 아닐링)를 사용하여 PCR을 수행하였다. 에스. 세레비시애(S. cerevisiae) 게놈 DNA 상의 ORF의 증폭에 사용하였던 것과 동일한 프라이머를 사용하였다. 글루코시다제 II ORF을 나타내는 특정 PCR 산물의 존재에 의하여 pGAPZAGLSII 형질전환체를 확인하였다.
4.4 피히아 파스토리스(
Pichia pastoris
)에서의 에스. 세레비시애(
S. cerevisiae
) 글루코시다제 II 알파 서브유니트의 발현 및 분비
전사 수준의 분석 -- 게놈 분석 후 양성으로 평가된 형질전환체로부터 RNA를 제조하였다. RNA는 페놀을 사용하여 제조하였다. 각각의 시료로부터, 15 ㎍의 RNA를 포름알데히드 아가로스 겔 상에 로딩시켰다. 전기영동 후, RNA를 Hybond N 멤브레인 상에 빨아들였다. 글루코시다제 II ORF의 3' 부위에 해당하는 344bp 글루코시다제 II 특이적 단편으로 구성된 방사성 프로브를 사용하여 상기 멤브레인을 혼성화시켰다. 형질전환체에 대해서는 뚜렷한 신호가 관찰되었지만, 형질전환되지 않은 대조군 균주에서는 신호가 검출되지 않았다.
이중 멤브레인 에세이를 사용하는 단백질 수준 분석 -- 니트로셀룰로오스 멤브레인을 완충된 덱스트로스 메디아(BMDY) 상에 올려놓았다. 이 니트로셀룰로오스 멤브레인 위에 셀룰로오스 아세테이트 멤브레인을 놓았다. pGAPZAGLSII의 피히아(Pichia) 형질전환체를 셀룰로오스 아세테이트 상에 도말(streaked)하고, 몇일 정도 배양하였다. 분비된 단백질은 이 멤브레인을 통과했지만, 효모 세포는 셀룰로오스 아세테이트 상에 남아있었다. 이와 같이, 분비된 단백질을 니트로셀룰로오스 멤브레인 상에 모았다. 며칠 후, 효모 콜로니를 포함하는 셀룰로오스 아세테이트를 제거하였다. 항-myc 항체를 이용하여 니트로셀룰로오스 멤브레인에 글루코시다제 II가 존재하는지를 분석하였다. 형질전환되지 않은 균주, WT에서 희미하고 거의 보이지 않는 신호가 나타난 것과 비교하여, 대부분의 형질전환체에서는 뚜렷한 신호가 나타났다.
세포외 발현 - 구조물 pGAPZAGLSII(mychis6) (균주 12,14 및 18)의 PPY12-OH 형질전환체 및 구조물 pGAPZAGLSII(myc)HDEL (균주 H1, H2 및 H3)의 형질전환체를 2x10 ml BMDY 배지 상에서 2 일동안 배양하였다. 이들 6 개의 형질전환체는 게놈 수준(gDNA 상에서의 PCR) 및 RNA 수준(노던 블라트) 모두에 있어서 양성으로 측정되었다. 원심분리하여 배양액을 취하고, Vivaspin 컬럼으로 약 1 ml까지 농축하였다. 이러한 농축물로부터 얻은 단백질을 TCA로 침전시키고, Laemmli 버퍼에서 재현탁시키고 SDS-PAGE 분석을 위하여 로딩시켰다. 단백질을 니트로셀룰로오스 멤브레인으로 블라팅하였다. 블라트를 항-myc Ab와 함께 하룻밤동안 배양하였다. 이차 Ab를 페록시다제에 결합시켰다. Renaissance luminiscence 검출 키트(NEN) 및 감광 필름(light sensitive film, Kodak)을 사용하여, 형질전환체 12, 14 및 18에 대하여 약 110 kDa에서 강한 밴드를 관찰하였으며, 이는 GLSII가 이들 형질전환체로부터 발현되고 분비된다는 것을 나타낸다. 형질전환체 H1-3에서는 신호가 관찰되지 않았으며, 이는 GLSII ORF의 C-말단에 첨가된 HDEL 택이 단백질의 ER 위치화를 초래하여 GLSII가 성장 배지로 분비되는 것을 억제한다는 것을 나타낸다.
세포내 발현 - 상기 6 개의 형질전환체 및 WT 균주를 500 ml의 BMDY에서 2 일동안 배양하였다. 세포를 원심분리하여 수집하고, 세척하고, 최소 부피(50 mM Tris. HCl pH 7.5,5% 글리세롤)에 재현탁시키고, 글래스 비드를 사용하여 파쇄하였다. 몇 가지 원심분리 단계(저속 원심분리(2000 내지 3000g))를 통하여 세포 파편들을 제거하였다. 초원심분리를 통한 상청액으로부터 멤브레인을 얻었다. 펠렛을 Laemmli 버퍼에 재현탁시키고, SDS-PAGE 분석을 위하여 로딩시켰다. 단백질을 니트로셀룰로오스 멤브레인 상에서 블라팅하였다. 항-myc Ab와 이차 Ab와 콘쥬게이트된 페록시다제를 사용하여 세포내 GLSII 발현을 체크하였다. 발광 검출 후, GLSIIHDEL 형질전환체(H1 및 H3, H2에 대해서는 희미한 신호)에 대하여 약 110 kDa에서 밴드가 관찰되었지만, WT 및 GLSII 발현 균주에서는 관찰되지 않았다. 이러한 결과는 C-말단 HDEL 택과 함께 발현 시, 재조합 GLSII의 세포내 존재를 분명하게 나타낸다. 이러한 택이 존재하지 않을 때 GLSII는 세포내에서 검출되지 않았다.
4.5 재조합 글루코시다제 II 알파 서브유니트의 정제 및 활성 분석
GLSII를 다음과 같이 분석하고 양성 대조로서 상업적으로 입수가능한 효모 알파-글루코시다제(Sigma)를 사용하여 테스트하였다.
조성: 70 ㎕의 80 mM 포스페이트-시트레이트 버퍼 pH 6.8, 7 ㎕의 250 mM 만노스, 3.5 ㎕의 250 mM 2-데옥시-D-글루코스, 0.8 ㎕의 4-MeUmbelliferyl-알파-D- 글루코피라노시드(l μM). 3 가지 분석을 수행하였다: 한 가지는 1 단위의 상업적으로 입수가능한 효소를 사용하고, 한 가지는 효소를 사용하지 않고, 또 한 가지는 효소는 사용하지만 기질은 사용하지 않는다. 분석 혼합물을 30 ℃에서 하룻밤동안 배양하였다. 자외선 조사 시, 효소와 기질을 모두 포함하는 반응 혼합물만이 형광을 나타내었다(도 22). 이는 상기 분석이 알파-글루코시다제의 활성 검출에 있어서 매우 특이적이라는 것을 나타낸다.
WT PPY12-OH, 균주 18 및 균주 H3를 2 일동안 2x10 ml 성장 배지에서 배양하였다. 세포를 회전시키고 배지를 300 mM NaCl 및 10 mM 이미다졸로 조정하고 Vivaspin 컬럼으로 0.5-l ml까지 농축시켰다. 배지를 Ni-NTA 회전 컬럼(Qiagen) 상에 로딩시키고 제조자 사용법에 따라서 정제를 수행하였다. 2x100 ㎕ 용리 버퍼(50 mM NaH2PO4, 300 mM NaCl, 250 mM 이미다졸 pH 8.0)에서 컬럼으로부터 단백질을 용리시켰다. 각각의 용리액으부터, 20 ㎕를 취하여 글루코시다제 II 활성을 검사하였다. 20 ㎕의 용리 버퍼 내에서 희석된 상업적으로 입수가능한 효소 0.33 유니트를 양성 대조군으로 사용하였다. 양성 대조군 및 효소를 성장 배지로 분비하는 균주 18의 용리액에서 형광이 관찰되었다. 이러한 결과는 피히아 파스토리스(Pichia pastoris)에 의하여 분비되는 재조합 에스. 세레비시애(S. cerevisiae) GLSII 알파 서브유니트가 기능적으로 활성인 효소라는 것을 보여준다. GLSII가 세포내 발현되었기 때문에 이러한 활성은 WT(형질전환되지 않음) 균주, 및 균주 H3 모두에서 나타나지 않았다(도 23). 이러한 결과는 또한 베타 서브유니트가 단백질의 알파 부분의 작용(functionality)에 필요하지 않다는 것을 보여준다.
실시예 5
글루코시다제 II 및 만노시다제를 모두 발현시키는 피히아(
Pichia
) 균주의 제작
균주 GS115를 pGAPZGLSII와 pGAPZglsIIHDEL로 형질전환시켰다. 형질전환체를 YPDSzeo 상에서 선별하였다.
균주 yGC4를 다음의 구조물들로 각각 형질전환시켰다:
(1) pGAPADEglslI 및 pGAPADEglsIIHDEL, 아데닌을 포함하지 않는 합성 소르비톨 배지 상에서 선별;
(2) pGAPZMFManHDEL: YPDSzeo 상에서 선별; 및
(3) pGAPZMFManHDEL/pGAPADEglsIIHDEL: 아데닌을 포함하지 않고 제오신을 포함하는 합성 소르비톨 배지 상에서 선별.
OCH1 녹-인(knock-in)을 포함하고 MFmannosidaseHDEL를 발현시키는 균주 yGC4를 pGAPADEglsII 및 pGAPADEglsIIHDEL로 형질전환시켰다. 아데닌과 우라실을 포함하는 합성 소르비톨 배지 상에서 형질전환체를 선별하였다.
모든 형질전환에 대하여, 콜로니를 얻었다. PCR에 의하여 결정되고, 게놈 내로 통합된 발현 벡터(들)을 포함하는 형질전환체를 얻었다. 이들 형질전환체 중 몇몇으로부터 GLSII 발현이 관찰되었다.
<110> Research Corporation Technologies, Inc.
<120> PROTEIN GLYCOSYLATION MODIFICATION IN PICHIA PASTORIS
<130> 13748
<140> PCT/IB01/01514
<141> 2001-06-29
<160> 29
<170> PatentIn Ver. 2.1
<210> 1
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:synthetic peptide representing
the ER-retention signal.
<400> 1
His Asp Glu Leu
1
<210> 2
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 2
gactggttcc aattgacaag c 21
<210> 3
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 3
agtctagatt acaactcgtc gtgagcaagg tggccgcccc gtcg 44
<210> 4
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 4
ccattgagga cgcatgccgc gcc 23
<210> 5
<211> 85
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 5
gtatctagat tacaactcgt cgtgcagatc ctcttctgag atgagttttt gttcagcaag 60
gtggccgccc cgtcgtgatg atgaa 85
<210> 6
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 6
aactcgagat ggactcttca aaacacaaac gc 32
<210> 7
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 7
ttgcggccgc ttacaactcg tcgtgtcgga cagcaggatt acctga 46
<210> 8
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 8
ccattgagga cgcatgccgc gcc 23
<210> 9
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 9
gcaaatggca ttctgacatc ct 22
<210> 10
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 10
gtccctattt caatcaattg aa 22
<210> 11
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 11
gactggttcc aattgacaag c 21
<210> 12
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 12
ccgctcgaga tggtcctttt gaaatggctc 30
<210> 13
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 13
ccgggcccaa aaataacttc ccaatcttca g 31
<210> 14
<211> 1785
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:The ORF sequence of the
MFManHDEL fusion in pGAPZMFManHDEL.
<400> 14
atgagatttc cttcaatttt tactgctgtt ttattcgcag catcctccgc attagctgct 60
ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120
tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180
aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240
tctctcgaga aaagagaggc tgaagctgaa ttcgccacaa aacgtggatc tcccaaccct 300
acgagggcgg cagcagtcaa ggccgcattc cagacgtcgt ggaacgctta ccaccatttt 360
gcctttcccc atgacgacct ccacccggtc agcaacagct ttgatgatga gagaaacggc 420
tggggctcgt cggcaatcga tggcttggac acggctatcc tcatggggga tgccgacatt 480
gtgaacacga tccttcagta tgtaccgcag atcaacttca ccacgactgc ggttgccaac 540
caaggatcct ccgtgttcga gaccaacatt cggtacctcg gtggcctgct ttctgcctat 600
gacctgttgc gaggtccttt cagctccttg gcgacaaacc agaccctggt aaacagcctt 660
ctgaggcagg ctcaaacact ggccaacggc ctcaaggttg cgttcaccac tcccagcggt 720
gtcccggacc ctaccgtctt cttcaaccct actgtccgga gaagtggtgc atctagcaac 780
aacgtcgctg aaattggaag cctggtgctc gagtggacac ggttgagcga cctgacggga 840
aacccgcagt atgcccagct tgcgcagaag ggcgagtcgt atctcctgaa tccaaaggga 900
agcccggagg catggcctgg cctgattgga acgtttgtca gcacgagcaa cggtaccttt 960
caggatagca gcggcagctg gtccggcctc atggacagct tctacgagta cctgatcaag 1020
atgtacctgt acgacccggt tgcgtttgca cactacaagg atcgctgggt ccttggtgcc 1080
gactcgacca ttgggcatct cggctctcac ccgtcgacgc gcaaggactt gacctttttg 1140
tcttcgtaca acggacagtc tacgtcgcca aactcaggac atttggccag ttttggcggt 1200
ggcaacttca tcttgggagg cattctcctg aacgagcaaa agtacattga ctttggaatc 1260
aagcttgcca gctcgtactt tggcacgtac acccagacgg cttctggaat cggccccgaa 1320
ggcttcgcgt gggtggacag cgtgacgggc gccggcggct cgccgccctc gtcccagtcc 1380
gggttctact cgtcggcagg attctgggtg acggcaccgt attacatcct gcggccggag 1440
acgctggaga gcttgtacta cgcataccgc gtcacgggcg actccaagtg gcaggacctg 1500
gcgtgggaag cgttgagtgc cattgaggac gcatgccgcg ccggcagcgc gtactcgtcc 1560
atcaacgacg tgacgcaggc caacggcggg ggtgcctctg acgatatgga gagcttctgg 1620
tttgccgagg cgctcaagta tgcgtacctg atctttgcgg aggagtcgga tgtgcaggtg 1680
caggccaccg gcgggaacaa atttgtcttt aacacggagg cgcacccctt tagcatccgt 1740
tcatcatcac gacggggcgg ccaccttgct cacgacgagt tgtaa 1785
<210> 15
<211> 2016
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:The ORF sequence of the
MFmManHDEL fusion in pGAPZMFmManHDEL.
<400> 15
atgagatttc cttcaatttt tactgctgtt ttattcgcag catcctccgc attagctgct 60
ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120
tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180
aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240
tctctcgaga tggactcttc aaaacacaaa cgctttgatc tgggcttaga agatgtgtta 300
attcctcacg tagatgccgg caaaggagct aaaaaccccg gcgtcttcct gatccatgga 360
cccgacgaac acagacacag ggaagaagaa gagcgtctga gaaataagat tagagctgac 420
catgagaaag ccctggaaga agcaaaagaa aaattaagaa agtcaagaga ggaaatccgt 480
gcagaaattc agacagagaa aaacaaagta gcccaagcaa tgaagacaaa agagaccagg 540
gtactgccgc ctgtccctgt cccacaacgt gtaggggtca gtggtgggga tccagaagac 600
atggagatca agaagaaaag agacaaaatt aaagagatga tgaaacatgc ctgggataat 660
tacagaacat acggatgggg acataatgaa ctaaggccta ttgcaaggaa aggccattcc 720
actaacatat tcggaagctc acagatgggt gccaccatag tggatgcttt ggataccctt 780
tatatcatgg ggcttcatga tgaattcatg gatgggcaaa gatggattga agaaaacctt 840
gatttcagtg tgaattcaga agtgtctgtc tttgaagtta acattcgctt tattggaggg 900
ctcctcgctg catattacct gtcaggagag gaaatattca agactaaagc agtgcagttg 960
gctgagaaac tccttcctgc ctttaacaca cctactggga ttccctgggc aatggtgaac 1020
ctgaaaagtg gagtaggtcg aaactggggc tgggcgtctg caggcagcag catcctggct 1080
gagttcggca ccctgcacat ggagtttgtg cacctcagct acttgaccgg tgacttgact 1140
tactataata aggtcatgca cattcggaaa ctactgcaga aaatggaacg cccaaatggt 1200
ctttatccaa attatttaaa cccaagaaca gggcgctggg gtcagtatca cacatcagtt 1260
ggtggtctgg gagatagttt ttatgaatac ttactgaaag catggctgac gtcagataaa 1320
acagaccacg aggcaagaag gatgtatgac gatgctgttg aggctataga aaaacatctt 1380
attaagaagt cccgaggagg tctggttttt attggagaat ggaagaatgg acacttggaa 1440
aggaagatgg ggcacttggc ctgctttgct gggggaatgc ttgcccttgg agcagatggt 1500
tccagaaagg ataaagctgg ccactactta gaactagggg cagaaattgc acgaacatgt 1560
catgagtcat atgacagaac tgcattgaaa ctaggtccgg agtcattcaa gtttgatggt 1620
gcagtggaag ccgtggctgt gcggcaggct gaaaagtatt acatccttcg tccagaagta 1680
attgaaacct attggtatct atggcgattt acccacgacc caagatacag gcagtggggc 1740
tgggaagcag cactggctat tgagaagtcg tgccgggtca gcggtgggtt ttctggtgtc 1800
aaggatgtat acgccccgac ccctgtgcat gacgacgtgc agcagagctt ttctcttgct 1860
gaaacattaa aatacttgta cctgctgttc tctggcgatg accttctacc tttagaccac 1920
tgggtgttta acacagaggc gcaccctctg ccggtgttgc gcttagccaa cagcactctt 1980
tcaggtaatc ctgctgtccg acacgacgag ttgtaa 2016
<210> 16
<211> 6757
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Sequence of plasmid
pAOX2ZAGLSII.
<400> 16
catggccaag ttgaccagtg ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt 60
cgagttctgg accgaccggc tcgggttctc ccgggacttc gtggaggacg acttcgccgg 120
tgtggtccgg gacgacgtga ccctgttcat cagcgcggtc caggaccagg tggtgccgga 180
caacaccctg gcctgggtgt gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga 240
ggtcgtgtcc acgaacttcc gggacgcctc cgggccggcc atgaccgaga tcggcgagca 300
gccgtggggg cgggagttcg ccctgcgcga cccggccggc aactgcgtgc acttcgtggc 360
cgaggagcag gactgacacg tccgacggcg gcccacgggt cccaggcctc ggagatccgt 420
cccccttttc ctttgtcgat atcatgtaat tagttatgtc acgcttacat tcacgccctc 480
cccccacatc cgctctaacc gaaaaggaag gagttagaca acctgaagtc taggtcccta 540
tttatttttt tatagttatg ttagtattaa gaacgttatt tatatttcaa atttttcttt 600
tttttctgta cagacgcgtg tacgcatgta acattatact gaaaaccttg cttgagaagg 660
ttttgggacg ctcgaaggct ttaatttgca agctggagac caacatgtga gcaaaaggcc 720
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 780
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 840
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 900
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat 960
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 1020
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 1080
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 1140
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 1200
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 1260
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 1320
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 1380
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga tcagatcttt 1440
ttttcagacc atatgaccgg tccatcttct acggggggat tatctatgct ttgacctcta 1500
tcttgattct tttatgattc aaatcacttt tacgttattt attacttact ggttatttac 1560
ttagcgcctt ttctgaaaaa catttactaa aaatcataca tcggcactct caaacacgac 1620
agattgtgat caagaagcag agacaatcac cactaaggtt gcacatttga gccagtaggc 1680
tcctaataga ggttcgatac ttattttgat aatacgacat attgtcttac ctctgaatgt 1740
gtcaatactc tctcgttctt cgtctcgtca gctaaaaata taacacttcg agtaagatac 1800
gcccaattga aggctacgag ataccagact atcactagta gaactttgac atctgctaaa 1860
gcagatcaaa tatccattta tccagaatca attaccttcc tttagcttgt cgaaggcatg 1920
aaaaagctac atgaaaatcc ccatccttga agttttgtca gcttaaagga ctccatttcc 1980
taaaatttca agcagtcctc tcaactaaat ttttttccat tcctctgcac ccagccctct 2040
tcatcaaccg tccagccttc tcaaaagtcc aatgtaagta gcctgcaaat tcaggttaca 2100
acccctcaat tttccatcca agggcgatcc ttacaaagtt aatatcgaac agcagagact 2160
aagcgagtca tcatcaccac ccaacgatgg tgaaaaactt taagcataga ttgatggagg 2220
gtgtatggca cttggcggct gcattagagt ttgaaactat ggggtaatac atcacatccg 2280
gaactgatcc gactccgaga tcatatgcaa agcacgtgat gtaccccgta aactgctcgg 2340
attatcgttg caattcatcg tcttaaacag tacaagaaac tttattcatg ggtcattgga 2400
ctctgatgag gggcacattt ccccaatgat tttttgggaa agaaagccgt aagaggacag 2460
ttaagcgaaa gagacaagac aacgaacagc aaaagtgaca gctgtcagct acctagtgga 2520
cagttgggag tttccaattg gttggttttg aatttttacc catgttgagt tgtccttgct 2580
tctccttgca aacaatgcaa gttgataaga catcaccttc caagataggc tatttttgtc 2640
gcataaattt ttgtctcgga gtgaaaaccc cttttatgtg aacagattac agaagcgtcc 2700
tacccttcac cggttgagat ggggagaaaa ttaagcgatg aggagacgat tattggtata 2760
aaagaagcaa ccaaaatccc ttattgtcct tttctgatca gcatcaaaga atattgtctt 2820
aaaacgggct tttaactaca ttgttcttac acattgcaaa cctcttcctt ctatttcgga 2880
tcaactgtat tgactacatt gatctttttt aacgaagttt acgacttact aaatccccac 2940
aaacaaatca actgagaaaa gaattcacgt ggcccagccg gccgtctcgg atcggtacct 3000
cgagatggtc cttttgaaat ggctcgtatg ccaattggtc ttctttaccg ctttttcgca 3060
tgcgtttacc gactatctat taaagaagtg tgcgcaatct gggttttgcc atagaaacag 3120
ggtttatgca gaaaatattg ccaaatctca tcactgctat tacaaagtgg acgccgagtc 3180
tattgcacac gatcctttag agaatgtgct tcatgctacc ataattaaaa ctataccaag 3240
attggagggc gatgatatag ccgttcagtt cccattctct ctctcttttt tacaggatca 3300
ctcagtaagg ttcactataa atgagaaaga gagaatgcca accaacagca gcggtttgtt 3360
gatctcttca caacggttca atgagacctg gaagtacgca ttcgacaaga aatttcaaga 3420
ggaggcgaac aggaccagta ttccacaatt ccacttcctt aagcaaaaac aaactgtgaa 3480
ctcattctgg tcgaaaatat cttcattttt gtcactttca aactccactg cagacacatt 3540
tcatcttcga aacggtgatg tatccgtaga aatctttgct gaaccttttc aattgaaagt 3600
ttactggcaa aatgcgctga aacttattgt aaacgagcaa aatttcctga acattgaaca 3660
tcatagaact aagcaggaaa acttcgcaca cgtgctgcca gaagaaacaa ctttcaacat 3720
gtttaaggac aatttcttgt attcaaagca tgactctatg cctttggggc ctgaatcggt 3780
tgcgctagat ttctctttca tgggttctac taatgtctac ggtataccgg aacatgcgac 3840
gtcgctaagg ctgatggaca cttcaggtgg aaaggaaccc tacaggcttt tcaacgttga 3900
tgtctttgag tacaacatcg gtaccagcca accaatgtac ggttcgatcc cattcatgtt 3960
ttcatcttcg tccacatcta tcttttgggt caatgcagct gacacttggg tagacataaa 4020
gtatgacacc agtaaaaata aaacgatgac tcattggatc tccgaaaatg gtgtcataga 4080
tgtagtcatg tccctggggc cagatattcc aactatcatt gacaaattta ccgatttgac 4140
tggtagaccc tttttaccgc ccatttcctc tatagggtac catcaatgta gatggaatta 4200
taatgatgag atggacgttc tcacagtgga ctctcagatg gatgctcata tgattcctta 4260
cgattttatt tggttggact tggagtatac gaacgacaaa aaatatttta cttggaagca 4320
gcactccttt cccaatccaa aaaggctgtt atccaaatta aaaaagttgg gtagaaatct 4380
tgtcgtacta atcgatcctc atttaaagaa agattatgaa atcagtgaca gggtaattaa 4440
tgaaaatgta gcagtcaagg atcacaatgg aaatgactat gtaggtcatt gctggccagg 4500
taattctata tggattgata ccataagcaa atatggccaa aagatttgga agtccttttt 4560
cgaacggttt atggatctgc cggctgattt aactaattta ttcatttgga atgatatgaa 4620
cgagccttcg attttcgatg gcccagagac cacagctcca aaagatttga ttcacgacaa 4680
ttacattgag gaaagatccg tccataacat atatggtcta tcagtgcatg aagctactta 4740
cgacgcaata aaatcgattt attcaccatc cgataagcgt cctttccttc taacaagggc 4800
tttttttgcc ggctctcaac gtactgctgc cacatggact ggtgacaatg tggccaattg 4860
ggattactta aagatttcca ttcctatggt tctgtcaaac aacattgctg gtatgccatt 4920
tataggagcc gacatagctg gctttgctga ggatcctaca cctgaattga ttgcacgttg 4980
gtaccaagcg ggcttatggt acccattttt tagagcacac gcccatatag acaccaagag 5040
aagagaacca tacttattca atgaaccttt gaagtcgata gtacgtgata ttatccaatt 5100
gagatatttc ctgctaccta ccttatacac catgtttcat aaatcaagtg tcactggatt 5160
tccgataatg aatccaatgt ttattgaaca ccctgaattt gctgaattgt atcatatcga 5220
taaccaattt tactggagta attcaggtct attagtcaaa cctgtcacgg agcctggtca 5280
atcagaaacg gaaatggttt tcccacccgg tatattctat gaattcgcat ctttacactc 5340
ttttataaac aatggtactg atttgataga aaagaatatt tctgcaccat tggataaaat 5400
tccattattt attgaaggcg gtcacattat cactatgaaa gataagtata gaagatcttc 5460
aatgttaatg aaaaacgatc catatgtaat agttatagcc cctgataccg agggacgagc 5520
cgttggagat ctttatgttg atgatggaga aacttttggc taccaaagag gtgagtacgt 5580
agaaactcag ttcattttcg aaaacaatac cttaaaaaat gttcgaagtc atattcccga 5640
gaatttgaca ggcattcacc acaatacttt gaggaatacc aatattgaaa aaatcattat 5700
cgcaaagaat aatttacaac acaacataac gttgaaagac agtattaaag tcaaaaaaaa 5760
tggcgaagaa agttcattgc cgactagatc gtcatatgag aatgataata agatcaccat 5820
tcttaaccta tcgcttgaca taactgaaga ttgggaagtt atttttgggc ccgaacaaaa 5880
actcatctca gaagaggatc tgaatagcgc cgtcgaccat catcatcatc atcattgagt 5940
tttagcctta gacatgactg ttcctcagtt caagttgggc acttacgaga agaccggtct 6000
tgctagattc taatcaagag gatgtcagaa tgccatttgc ctgagagatg caggcttcat 6060
ttttgatact tttttatttg taacctatat agtataggat tttttttgtc attttgtttc 6120
ttctcgtacg agcttgctcc tgatcagcct atctcgcagc tgatgaatat cttgtggtag 6180
gggtttggga aaatcattcg agtttgatgt ttttcttggt atttcccact cctcttcaga 6240
gtacagaaga ttaagtgaga ccttcgtttg tgcggatccc ccacacacca tagcttcaaa 6300
atgtttctac tcctttttta ctcttccaga ttttctcgga ctccgcgcat cgccgtacca 6360
cttcaaaaca cccaagcaca gcatactaaa ttttccctct ttcttcctct agggtgtcgt 6420
taattacccg tactaaaggt ttggaaaaga aaaaagagac cgcctcgttt ctttttcttc 6480
gtcgaaaaag gcaataaaaa tttttatcac gtttcttttt cttgaaattt ttttttttag 6540
tttttttctc tttcagtgac ctccattgat atttaagtta ataaacggtc ttcaatttct 6600
caagtttcag tttcattttt cttgttctat tacaactttt tttacttctt gttcattaga 6660
aagaaagcat agcaatctaa tctaagggcg gtgttgacaa ttaatcatcg gcatagtata 6720
tcggcatagt ataatacgac aaggtgagga actaaac 6757
<210> 17
<211> 8272
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Sequence of plasmid
pAOX2ADE1glsII.
<400> 17
tcgaccggct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 60
gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 120
tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 180
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 240
cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 300
ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 360
tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 420
gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 480
gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 540
gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 600
ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 660
ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag 720
ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 780
gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 840
ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 900
tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 960
ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 1020
gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 1080
tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 1140
cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 1200
ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 1260
gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta 1320
caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 1380
gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 1440
ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 1500
tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 1560
caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 1620
tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 1680
cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 1740
ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 1800
aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 1860
tcatactctt cctttttcaa tagctccaag gcaacaaatt gactactcag accgacattc 1920
attcgttatt gattttaaat caacgataaa cggaatggtt acttgaatga tttcacttta 1980
tgatcattgt ttactaatta cctaaatagg attttatatg gaattggaag aataagggaa 2040
atttcagatg tctgaaaaag gcgaggaggg tactaatcat tcaagcccat ttcttgccag 2100
taattgcttc ataagcttca atatactttt ctttactctt gatagcaatt tctgcatcca 2160
tggctacgcc ctctttgcca ttcaatccgt tggccgtcaa ccaatctctg agaaactgct 2220
tatcgtaact ctcttgcgat ttacccactt ggtaagtctt ttgattccaa aatctagaag 2280
aatctggagt taaaacttca tctactagta ccaattcatt gttttcgtcc agtccaaatt 2340
cgaatttcgt atcagcaata atgatcccct tcaaaagggc gaagtttttt gcagcagaat 2400
acaactcgac cgccttgaca gcgaccttct cacaaatgtc tttacctaca atctcagcag 2460
cttgttcaat agagatgttt tcatcgtgtt caccctgttc agctttcgtt gaaggtgtga 2520
aaatcggagt tggaaaggcg tcgctctctt gaaggttctc gttttcaacc ttgactccat 2580
ggacagtttt tgagttcttg tactctttcc atgcacttcc agtgatgtaa cctctgacaa 2640
tggcttccaa aggtatcagt ctgtgctttt ttactatcaa ggatcgtccc tctaattgag 2700
atttgtattt ttcttcagac agttttgatg gtagtaaagc aaagacttcc ttgtcattag 2760
aagcaaccaa atgattcttt atgtagggtg ccaaaaaatc aaaccagaaa actgagagct 2820
gagtcaaaat ctttccctta tcaggaatac cgtttgtcat aatcacatcg taagcggaga 2880
tacggtcagt tgcgacgaac agcaagttgt tctcatcgac tgcataaatg tctctaacct 2940
ttcctttggc gattaaaggt aggattccgt ccagatcagt gttcacaatg gacatacttg 3000
gaaggataca gcaaagtgtg ttggaagcga tgacacatgg aaaggaattt ttcgagtttc 3060
ctagagtagt atattggggc ggtgaaagtt cagatgttta atgcttaata ctcttatact 3120
cttcaaagcg cccaagtgtt tctgccaacc tgactttttt ctgaataatg aatcgttcaa 3180
gtggagtatt taaaccatga ttaagttacg tgatttggca ctggataagg tcgaaaaata 3240
tccgtattca taaacgatta ttggtaaaag ttacaaaata ccactaatta cggagaagct 3300
tagtaacagt tatcatctct tggtcgatta acgcttacaa tttccattcg ccattcaggc 3360
tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagggcctcg 3420
aggcacaaac gaacgtctca cttaatcttc tgtactctga agaggagtgg gaaataccaa 3480
gaaaaacatc aaactcgaat gattttccca aacccctacc acaagatatt catcagctgc 3540
gagataggct gatcaggagc aagctcgtac gagaagaaac aaaatgacaa aaaaaatcct 3600
atactatata ggttacaaat aaaaaagtat caaaaatgaa gcctgcatct ctcaggcaaa 3660
tggcattctg acatcctctt gattagaatc tagcaagacc ggtcttctcg taagtgccca 3720
acttgaactg aggaacagtc atgtctaagg ctaaaactca atgatgatga tgatgatggt 3780
cgacggcgct attcagatcc tcttctgaga tgagtttttg ttcgggccca aaaataactt 3840
cccaatcttc agttatgtca agcgataggt taagaatggt gatcttatta tcattctcat 3900
atgacgatct agtcggcaat gaactttctt cgccattttt tttgacttta atactgtctt 3960
tcaacgttat gttgtgttgt aaattattct ttgcgataat gattttttca atattggtat 4020
tcctcaaagt attgtggtga atgcctgtca aattctcggg aatatgactt cgaacatttt 4080
ttaaggtatt gttttcgaaa atgaactgag tttctacgta ctcacctctt tggtagccaa 4140
aagtttctcc atcatcaaca taaagatctc caacggctcg tccctcggta tcaggggcta 4200
taactattac atatggatcg tttttcatta acattgaaga tcttctatac ttatctttca 4260
tagtgataat gtgaccgcct tcaataaata atggaatttt atccaatggt gcagaaatat 4320
tcttttctat caaatcagta ccattgttta taaaagagtg taaagatgcg aattcataga 4380
atataccggg tgggaaaacc atttccgttt ctgattgacc aggctccgtg acaggtttga 4440
ctaatagacc tgaattactc cagtaaaatt ggttatcgat atgatacaat tcagcaaatt 4500
cagggtgttc aataaacatt ggattcatta tcggaaatcc agtgacactt gatttatgaa 4560
acatggtgta taaggtaggt agcaggaaat atctcaattg gataatatca cgtactatcg 4620
acttcaaagg ttcattgaat aagtatggtt ctcttctctt ggtgtctata tgggcgtgtg 4680
ctctaaaaaa tgggtaccat aagcccgctt ggtaccaacg tgcaatcaat tcaggtgtag 4740
gatcctcagc aaagccagct atgtcggctc ctataaatgg cataccagca atgttgtttg 4800
acagaaccat aggaatggaa atctttaagt aatcccaatt ggccacattg tcaccagtcc 4860
atgtggcagc agtacgttga gagccggcaa aaaaagccct tgttagaagg aaaggacgct 4920
tatcggatgg tgaataaatc gattttattg cgtcgtaagt agcttcatgc actgatagac 4980
catatatgtt atggacggat ctttcctcaa tgtaattgtc gtgaatcaaa tcttttggag 5040
ctgtggtctc tgggccatcg aaaatcgaag gctcgttcat atcattccaa atgaataaat 5100
tagttaaatc agccggcaga tccataaacc gttcgaaaaa ggacttccaa atcttttggc 5160
catatttgct tatggtatca atccatatag aattacctgg ccagcaatga cctacatagt 5220
catttccatt gtgatccttg actgctacat tttcattaat taccctgtca ctgatttcat 5280
aatctttctt taaatgagga tcgattagta cgacaagatt tctacccaac ttttttaatt 5340
tggataacag cctttttgga ttgggaaagg agtgctgctt ccaagtaaaa tattttttgt 5400
cgttcgtata ctccaagtcc aaccaaataa aatcgtaagg aatcatatga gcatccatct 5460
gagagtccac tgtgagaacg tccatctcat cattataatt ccatctacat tgatggtacc 5520
ctatagagga aatgggcggt aaaaagggtc taccagtcaa atcggtaaat ttgtcaatga 5580
tagttggaat atctggcccc agggacatga ctacatctat gacaccattt tcggagatcc 5640
aatgagtcat cgttttattt ttactggtgt catactttat gtctacccaa gtgtcagctg 5700
cattgaccca aaagatagat gtggacgaag atgaaaacat gaatgggatc gaaccgtaca 5760
ttggttggct ggtaccgatg ttgtactcaa agacatcaac gttgaaaagc ctgtagggtt 5820
cctttccacc tgaagtgtcc atcagcctta gcgacgtcgc atgttccggt ataccgtaga 5880
cattagtaga acccatgaaa gagaaatcta gcgcaaccga ttcaggcccc aaaggcatag 5940
agtcatgctt tgaatacaag aaattgtcct taaacatgtt gaaagttgtt tcttctggca 6000
gcacgtgtgc gaagttttcc tgcttagttc tatgatgttc aatgttcagg aaattttgct 6060
cgtttacaat aagtttcagc gcattttgcc agtaaacttt caattgaaaa ggttcagcaa 6120
agatttctac ggatacatca ccgtttcgaa gatgaaatgt gtctgcagtg gagtttgaaa 6180
gtgacaaaaa tgaagatatt ttcgaccaga atgagttcac agtttgtttt tgcttaagga 6240
agtggaattg tggaatactg gtcctgttcg cctcctcttg aaatttcttg tcgaatgcgt 6300
acttccaggt ctcattgaac cgttgtgaag agatcaacaa accgctgctg ttggttggca 6360
ttctctcttt ctcatttata gtgaacctta ctgagtgatc ctgtaaaaaa gagagagaga 6420
atgggaactg aacggctata tcatcgccct ccaatcttgg tatagtttta attatggtag 6480
catgaagcac attctctaaa ggatcgtgtg caatagactc ggcgtccact ttgtaatagc 6540
agtgatgaga tttggcaata ttttctgcat aaaccctgtt tctatggcaa aacccagatt 6600
gcgcacactt ctttaataga tagtcggtaa acgcatgcga aaaagcggta aagaagacca 6660
attggcatac gagccatttc aaaaggacca tctcgaggta ccgatccgag acggccggct 6720
gggccacgtg aattcttttc tcagttgatt tgtttgtggg gatttagtaa gtcgtaaact 6780
tcgttaaaaa agatcaatgt agtcaataca gttgatccga aatagaagga agaggtttgc 6840
aatgtgtaag aacaatgtag ttaaaagccc gttttaagac aatattcttt gatgctgatc 6900
agaaaaggac aataagggat tttggttgct tcttttatac caataatcgt ctcctcatcg 6960
cttaattttc tccccatctc aaccggtgaa gggtaggacg cttctgtaat ctgttcacat 7020
aaaaggggtt ttcactccga gacaaaaatt tatgcgacaa aaatagccta tcttggaagg 7080
tgatgtctta tcaacttgca ttgtttgcaa ggagaagcaa ggacaactca acatgggtaa 7140
aaattcaaaa ccaaccaatt ggaaactccc aactgtccac taggtagctg acagctgtca 7200
cttttgctgt tcgttgtctt gtctctttcg cttaactgtc ctcttacggc tttctttccc 7260
aaaaaatcat tggggaaatg tgcccctcat cagagtccaa tgacccatga ataaagtttc 7320
ttgtactgtt taagacgatg aattgcaacg ataatccgag cagtttacgg ggtacatcac 7380
gtgctttgca tatgatctcg gagtcggatc agttccggat gtgatgtatt accccatagt 7440
ttcaaactct aatgcagccg ccaagtgcca tacaccctcc atcaatctat gcttaaagtt 7500
tttcaccatc gttgggtggt gatgatgact cgcttagtct ctgctgttcg atattaactt 7560
tgtaaggatc gcccttggat ggaaaattga ggggttgtaa cctgaatttg caggctactt 7620
acattggact tttgagaagg ctggacggtt gatgaagagg gctgggtgca gaggaatgga 7680
aaaaaattta gttgagagga ctgcttgaaa ttttaggaaa tggagtcctt taagctgaca 7740
aaacttcaag gatggggatt ttcatgtagc tttttcatgc cttcgacaag ctaaaggaag 7800
gtaattgatt ctggataaat ggatatttga tctgctttag cagatgtcaa agttctacta 7860
gtgatagtct ggtatctcgt agccttcaat tgggcgtatc ttactcgaag tgttatattt 7920
ttagctgacg agacgaagaa cgagagagta ttgacacatt cagaggtaag acaatatgtc 7980
gtattatcaa aataagtatc gaacctctat taggagccta ctggctcaaa tgtgcaacct 8040
tagtggtgat tgtctctgct tcttgatcac aatctgtcgt gtttgagagt gccgatgtat 8100
gatttttagt aaatgttttt cagaaaaggc gctaagtaaa taaccagtaa gtaataaata 8160
acgtaaaagt gatttgaatc ataaaagaat caagatagag gtcaaagcat agataatccc 8220
cccgtagaag atggaccggt catatggtct gaaaaaaaga tctgatctca tg 8272
<210> 18
<211> 5727
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Sequence of plasmid
pGAPZAGLSII.
<400> 18
tcgagatggt ccttttgaaa tggctcgtat gccaattggt cttctttacc gctttttcgc 60
atgcgtttac cgactatcta ttaaagaagt gtgcgcaatc tgggttttgc catagaaaca 120
gggtttatgc agaaaatatt gccaaatctc atcactgcta ttacaaagtg gacgccgagt 180
ctattgcaca cgatccttta gagaatgtgc ttcatgctac cataattaaa actataccaa 240
gattggaggg cgatgatata gccgttcagt tcccattctc tctctctttt ttacaggatc 300
actcagtaag gttcactata aatgagaaag agagaatgcc aaccaacagc agcggtttgt 360
tgatctcttc acaacggttc aatgagacct ggaagtacgc attcgacaag aaatttcaag 420
aggaggcgaa caggaccagt attccacaat tccacttcct taagcaaaaa caaactgtga 480
actcattctg gtcgaaaata tcttcatttt tgtcactttc aaactccact gcagacacat 540
ttcatcttcg aaacggtgat gtatccgtag aaatctttgc tgaacctttt caattgaaag 600
tttactggca aaatgcgctg aaacttattg taaacgagca aaatttcctg aacattgaac 660
atcatagaac taagcaggaa aacttcgcac acgtgctgcc agaagaaaca actttcaaca 720
tgtttaagga caatttcttg tattcaaagc atgactctat gcctttgggg cctgaatcgg 780
ttgcgctaga tttctctttc atgggttcta ctaatgtcta cggtataccg gaacatgcga 840
cgtcgctaag gctgatggac acttcaggtg gaaaggaacc ctacaggctt ttcaacgttg 900
atgtctttga gtacaacatc ggtaccagcc aaccaatgta cggttcgatc ccattcatgt 960
tttcatcttc gtccacatct atcttttggg tcaatgcagc tgacacttgg gtagacataa 1020
agtatgacac cagtaaaaat aaaacgatga ctcattggat ctccgaaaat ggtgtcatag 1080
atgtagtcat gtccctgggg ccagatattc caactatcat tgacaaattt accgatttga 1140
ctggtagacc ctttttaccg cccatttcct ctatagggta ccatcaatgt agatggaatt 1200
ataatgatga gatggacgtt ctcacagtgg actctcagat ggatgctcat atgattcctt 1260
acgattttat ttggttggac ttggagtata cgaacgacaa aaaatatttt acttggaagc 1320
agcactcctt tcccaatcca aaaaggctgt tatccaaatt aaaaaagttg ggtagaaatc 1380
ttgtcgtact aatcgatcct catttaaaga aagattatga aatcagtgac agggtaatta 1440
atgaaaatgt agcagtcaag gatcacaatg gaaatgacta tgtaggtcat tgctggccag 1500
gtaattctat atggattgat accataagca aatatggcca aaagatttgg aagtcctttt 1560
tcgaacggtt tatggatctg ccggctgatt taactaattt attcatttgg aatgatatga 1620
acgagccttc gattttcgat ggcccagaga ccacagctcc aaaagatttg attcacgaca 1680
attacattga ggaaagatcc gtccataaca tatatggtct atcagtgcat gaagctactt 1740
acgacgcaat aaaatcgatt tattcaccat ccgataagcg tcctttcctt ctaacaaggg 1800
ctttttttgc cggctctcaa cgtactgctg ccacatggac tggtgacaat gtggccaatt 1860
gggattactt aaagatttcc attcctatgg ttctgtcaaa caacattgct ggtatgccat 1920
ttataggagc cgacatagct ggctttgctg aggatcctac acctgaattg attgcacgtt 1980
ggtaccaagc gggcttatgg tacccatttt ttagagcaca cgcccatata gacaccaaga 2040
gaagagaacc atacttattc aatgaacctt tgaagtcgat agtacgtgat attatccaat 2100
tgagatattt cctgctacct accttataca ccatgtttca taaatcaagt gtcactggat 2160
ttccgataat gaatccaatg tttattgaac accctgaatt tgctgaattg tatcatatcg 2220
ataaccaatt ttactggagt aattcaggtc tattagtcaa acctgtcacg gagcctggtc 2280
aatcagaaac ggaaatggtt ttcccacccg gtatattcta tgaattcgca tctttacact 2340
cttttataaa caatggtact gatttgatag aaaagaatat ttctgcacca ttggataaaa 2400
ttccattatt tattgaaggc ggtcacatta tcactatgaa agataagtat agaagatctt 2460
caatgttaat gaaaaacgat ccatatgtaa tagttatagc ccctgatacc gagggacgag 2520
ccgttggaga tctttatgtt gatgatggag aaacttttgg ctaccaaaga ggtgagtacg 2580
tagaaactca gttcattttc gaaaacaata ccttaaaaaa tgttcgaagt catattcccg 2640
agaatttgac aggcattcac cacaatactt tgaggaatac caatattgaa aaaatcatta 2700
tcgcaaagaa taatttacaa cacaacataa cgttgaaaga cagtattaaa gtcaaaaaaa 2760
atggcgaaga aagttcattg ccgactagat cgtcatatga gaatgataat aagatcacca 2820
ttcttaacct atcgcttgac ataactgaag attgggaagt tatttttggg cccgaacaaa 2880
aactcatctc agaagaggat ctgaatagcg ccgtcgacca tcatcatcat catcattgag 2940
ttttagcctt agacatgact gttcctcagt tcaagttggg cacttacgag aagaccggtc 3000
ttgctagatt ctaatcaaga ggatgtcaga atgccatttg cctgagagat gcaggcttca 3060
tttttgatac ttttttattt gtaacctata tagtatagga ttttttttgt cattttgttt 3120
cttctcgtac gagcttgctc ctgatcagcc tatctcgcag ctgatgaata tcttgtggta 3180
ggggtttggg aaaatcattc gagtttgatg tttttcttgg tatttcccac tcctcttcag 3240
agtacagaag attaagtgag accttcgttt gtgcggatcc cccacacacc atagcttcaa 3300
aatgtttcta ctcctttttt actcttccag attttctcgg actccgcgca tcgccgtacc 3360
acttcaaaac acccaagcac agcatactaa attttccctc tttcttcctc tagggtgtcg 3420
ttaattaccc gtactaaagg tttggaaaag aaaaaagaga ccgcctcgtt tctttttctt 3480
cgtcgaaaaa ggcaataaaa atttttatca cgtttctttt tcttgaaatt ttttttttta 3540
gtttttttct ctttcagtga cctccattga tatttaagtt aataaacggt cttcaatttc 3600
tcaagtttca gtttcatttt tcttgttcta ttacaacttt ttttacttct tgttcattag 3660
aaagaaagca tagcaatcta atctaagggc ggtgttgaca attaatcatc ggcatagtat 3720
atcggcatag tataatacga caaggtgagg aactaaacca tggccaagtt gaccagtgcc 3780
gttccggtgc tcaccgcgcg cgacgtcgcc ggagcggtcg agttctggac cgaccggctc 3840
gggttctccc gggacttcgt ggaggacgac ttcgccggtg tggtccggga cgacgtgacc 3900
ctgttcatca gcgcggtcca ggaccaggtg gtgccggaca acaccctggc ctgggtgtgg 3960
gtgcgcggcc tggacgagct gtacgccgag tggtcggagg tcgtgtccac gaacttccgg 4020
gacgcctccg ggccggccat gaccgagatc ggcgagcagc cgtgggggcg ggagttcgcc 4080
ctgcgcgacc cggccggcaa ctgcgtgcac ttcgtggccg aggagcagga ctgacacgtc 4140
cgacggcggc ccacgggtcc caggcctcgg agatccgtcc cccttttcct ttgtcgatat 4200
catgtaatta gttatgtcac gcttacattc acgccctccc cccacatccg ctctaaccga 4260
aaaggaagga gttagacaac ctgaagtcta ggtccctatt tattttttta tagttatgtt 4320
agtattaaga acgttattta tatttcaaat ttttcttttt tttctgtaca gacgcgtgta 4380
cgcatgtaac attatactga aaaccttgct tgagaaggtt ttgggacgct cgaaggcttt 4440
aatttgcaag ctggagacca acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 4500
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 4560
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 4620
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 4680
cgcctttctc ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag 4740
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 4800
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 4860
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 4920
agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 4980
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 5040
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 5100
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 5160
ctcacgttaa gggattttgg tcatgcatga gatcagatct tttttgtaga aatgtcttgg 5220
tgtcctcgtc caatcaggta gccatctctg aaatatctgg ctccgttgca actccgaacg 5280
acctgctggc aacgtaaaat tctccggggt aaaacttaaa tgtggagtaa tggaaccaga 5340
aacgtctctt cccttctctc tccttccacc gcccgttacc gtccctagga aattttactc 5400
tgctggagag cttcttctac ggcccccttg cagcaatgct cttcccagca ttacgttgcg 5460
ggtaaaacgg aggtcgtgta cccgacctag cagcccaggg atggaaaagt cccggccgtc 5520
gctggcaata atagcgggcg gacgcatgtc atgagattat tggaaaccac cagaatcgaa 5580
tataaaaggc gaacaccttt cccaattttg gtttctcctg acccaaagac tttaaattta 5640
atttatttgt ccctatttca atcaattgaa caactatttc gaaacgagga attcacgtgg 5700
cccagccggc cgtctcggat cggtacc 5727
<210> 19
<211> 7236
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Sequence of plasmid
pGAPADE1glsII.
<400> 19
tcgaccggct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 60
gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 120
tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 180
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 240
cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 300
ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 360
tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 420
gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 480
gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 540
gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 600
ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 660
ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag 720
ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 780
gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 840
ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 900
tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 960
ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 1020
gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 1080
tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 1140
cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 1200
ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 1260
gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta 1320
caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 1380
gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 1440
ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 1500
tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 1560
caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 1620
tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 1680
cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 1740
ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 1800
aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 1860
tcatactctt cctttttcaa tagctccaag gcaacaaatt gactactcag accgacattc 1920
attcgttatt gattttaaat caacgataaa cggaatggtt acttgaatga tttcacttta 1980
tgatcattgt ttactaatta cctaaatagg attttatatg gaattggaag aataagggaa 2040
atttcagatg tctgaaaaag gcgaggaggg tactaatcat tcaagcccat ttcttgccag 2100
taattgcttc ataagcttca atatactttt ctttactctt gatagcaatt tctgcatcca 2160
tggctacgcc ctctttgcca ttcaatccgt tggccgtcaa ccaatctctg agaaactgct 2220
tatcgtaact ctcttgcgat ttacccactt ggtaagtctt ttgattccaa aatctagaag 2280
aatctggagt taaaacttca tctactagta ccaattcatt gttttcgtcc agtccaaatt 2340
cgaatttcgt atcagcaata atgatcccct tcaaaagggc gaagtttttt gcagcagaat 2400
acaactcgac cgccttgaca gcgaccttct cacaaatgtc tttacctaca atctcagcag 2460
cttgttcaat agagatgttt tcatcgtgtt caccctgttc agctttcgtt gaaggtgtga 2520
aaatcggagt tggaaaggcg tcgctctctt gaaggttctc gttttcaacc ttgactccat 2580
ggacagtttt tgagttcttg tactctttcc atgcacttcc agtgatgtaa cctctgacaa 2640
tggcttccaa aggtatcagt ctgtgctttt ttactatcaa ggatcgtccc tctaattgag 2700
atttgtattt ttcttcagac agttttgatg gtagtaaagc aaagacttcc ttgtcattag 2760
aagcaaccaa atgattcttt atgtagggtg ccaaaaaatc aaaccagaaa actgagagct 2820
gagtcaaaat ctttccctta tcaggaatac cgtttgtcat aatcacatcg taagcggaga 2880
tacggtcagt tgcgacgaac agcaagttgt tctcatcgac tgcataaatg tctctaacct 2940
ttcctttggc gattaaaggt aggattccgt ccagatcagt gttcacaatg gacatacttg 3000
gaaggataca gcaaagtgtg ttggaagcga tgacacatgg aaaggaattt ttcgagtttc 3060
ctagagtagt atattggggc ggtgaaagtt cagatgttta atgcttaata ctcttatact 3120
cttcaaagcg cccaagtgtt tctgccaacc tgactttttt ctgaataatg aatcgttcaa 3180
gtggagtatt taaaccatga ttaagttacg tgatttggca ctggataagg tcgaaaaata 3240
tccgtattca taaacgatta ttggtaaaag ttacaaaata ccactaatta cggagaagct 3300
tagtaacagt tatcatctct tggtcgatta acgcttacaa tttccattcg ccattcaggc 3360
tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagggcctcg 3420
aggcacaaac gaacgtctca cttaatcttc tgtactctga agaggagtgg gaaataccaa 3480
gaaaaacatc aaactcgaat gattttccca aacccctacc acaagatatt catcagctgc 3540
gagataggct gatcaggagc aagctcgtac gagaagaaac aaaatgacaa aaaaaatcct 3600
atactatata ggttacaaat aaaaaagtat caaaaatgaa gcctgcatct ctcaggcaaa 3660
tggcattctg acatcctctt gattagaatc tagcaagacc ggtcttctcg taagtgccca 3720
acttgaactg aggaacagtc atgtctaagg ctaaaactca atgatgatga tgatgatggt 3780
cgacggcgct attcagatcc tcttctgaga tgagtttttg ttcgggccca aaaataactt 3840
cccaatcttc agttatgtca agcgataggt taagaatggt gatcttatta tcattctcat 3900
atgacgatct agtcggcaat gaactttctt cgccattttt tttgacttta atactgtctt 3960
tcaacgttat gttgtgttgt aaattattct ttgcgataat gattttttca atattggtat 4020
tcctcaaagt attgtggtga atgcctgtca aattctcggg aatatgactt cgaacatttt 4080
ttaaggtatt gttttcgaaa atgaactgag tttctacgta ctcacctctt tggtagccaa 4140
aagtttctcc atcatcaaca taaagatctc caacggctcg tccctcggta tcaggggcta 4200
taactattac atatggatcg tttttcatta acattgaaga tcttctatac ttatctttca 4260
tagtgataat gtgaccgcct tcaataaata atggaatttt atccaatggt gcagaaatat 4320
tcttttctat caaatcagta ccattgttta taaaagagtg taaagatgcg aattcataga 4380
atataccggg tgggaaaacc atttccgttt ctgattgacc aggctccgtg acaggtttga 4440
ctaatagacc tgaattactc cagtaaaatt ggttatcgat atgatacaat tcagcaaatt 4500
cagggtgttc aataaacatt ggattcatta tcggaaatcc agtgacactt gatttatgaa 4560
acatggtgta taaggtaggt agcaggaaat atctcaattg gataatatca cgtactatcg 4620
acttcaaagg ttcattgaat aagtatggtt ctcttctctt ggtgtctata tgggcgtgtg 4680
ctctaaaaaa tgggtaccat aagcccgctt ggtaccaacg tgcaatcaat tcaggtgtag 4740
gatcctcagc aaagccagct atgtcggctc ctataaatgg cataccagca atgttgtttg 4800
acagaaccat aggaatggaa atctttaagt aatcccaatt ggccacattg tcaccagtcc 4860
atgtggcagc agtacgttga gagccggcaa aaaaagccct tgttagaagg aaaggacgct 4920
tatcggatgg tgaataaatc gattttattg cgtcgtaagt agcttcatgc actgatagac 4980
catatatgtt atggacggat ctttcctcaa tgtaattgtc gtgaatcaaa tcttttggag 5040
ctgtggtctc tgggccatcg aaaatcgaag gctcgttcat atcattccaa atgaataaat 5100
tagttaaatc agccggcaga tccataaacc gttcgaaaaa ggacttccaa atcttttggc 5160
catatttgct tatggtatca atccatatag aattacctgg ccagcaatga cctacatagt 5220
catttccatt gtgatccttg actgctacat tttcattaat taccctgtca ctgatttcat 5280
aatctttctt taaatgagga tcgattagta cgacaagatt tctacccaac ttttttaatt 5340
tggataacag cctttttgga ttgggaaagg agtgctgctt ccaagtaaaa tattttttgt 5400
cgttcgtata ctccaagtcc aaccaaataa aatcgtaagg aatcatatga gcatccatct 5460
gagagtccac tgtgagaacg tccatctcat cattataatt ccatctacat tgatggtacc 5520
ctatagagga aatgggcggt aaaaagggtc taccagtcaa atcggtaaat ttgtcaatga 5580
tagttggaat atctggcccc agggacatga ctacatctat gacaccattt tcggagatcc 5640
aatgagtcat cgttttattt ttactggtgt catactttat gtctacccaa gtgtcagctg 5700
cattgaccca aaagatagat gtggacgaag atgaaaacat gaatgggatc gaaccgtaca 5760
ttggttggct ggtaccgatg ttgtactcaa agacatcaac gttgaaaagc ctgtagggtt 5820
cctttccacc tgaagtgtcc atcagcctta gcgacgtcgc atgttccggt ataccgtaga 5880
cattagtaga acccatgaaa gagaaatcta gcgcaaccga ttcaggcccc aaaggcatag 5940
agtcatgctt tgaatacaag aaattgtcct taaacatgtt gaaagttgtt tcttctggca 6000
gcacgtgtgc gaagttttcc tgcttagttc tatgatgttc aatgttcagg aaattttgct 6060
cgtttacaat aagtttcagc gcattttgcc agtaaacttt caattgaaaa ggttcagcaa 6120
agatttctac ggatacatca ccgtttcgaa gatgaaatgt gtctgcagtg gagtttgaaa 6180
gtgacaaaaa tgaagatatt ttcgaccaga atgagttcac agtttgtttt tgcttaagga 6240
agtggaattg tggaatactg gtcctgttcg cctcctcttg aaatttcttg tcgaatgcgt 6300
acttccaggt ctcattgaac cgttgtgaag agatcaacaa accgctgctg ttggttggca 6360
ttctctcttt ctcatttata gtgaacctta ctgagtgatc ctgtaaaaaa gagagagaga 6420
atgggaactg aacggctata tcatcgccct ccaatcttgg tatagtttta attatggtag 6480
catgaagcac attctctaaa ggatcgtgtg caatagactc ggcgtccact ttgtaatagc 6540
agtgatgaga tttggcaata ttttctgcat aaaccctgtt tctatggcaa aacccagatt 6600
gcgcacactt ctttaataga tagtcggtaa acgcatgcga aaaagcggta aagaagacca 6660
attggcatac gagccatttc aaaaggacca tctcgaggta ccgatccgag acggccggct 6720
gggccacgtg aattcctcgt ttcgaaatag ttgttcaatt gattgaaata gggacaaata 6780
aattaaattt aaagtctttg ggtcaggaga aaccaaaatt gggaaaggtg ttcgcctttt 6840
atattcgatt ctggtggttt ccaataatct catgacatgc gtccgcccgc tattattgcc 6900
agcgacggcc gggacttttc catccctggg ctgctaggtc gggtacacga cctccgtttt 6960
acccgcaacg taatgctggg aagagcattg ctgcaagggg gccgtagaag aagctctcca 7020
gcagagtaaa atttcctagg gacggtaacg ggcggtggaa ggagagagaa gggaagagac 7080
gtttctggtt ccattactcc acatttaagt tttaccccgg agaattttac gttgccagca 7140
ggtcgttcgg agttgcaacg gagccagata tttcagagat ggctacctga ttggacgagg 7200
acaccaagac atttctacaa aaaagatctg atctca 7236
<210> 20
<211> 6173
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Sequence of plasmid
pPICZAGLSII.
<400> 20
cgaacaaaaa ctcatctcag aagaggatct gaatagcgcc gtcgaccatc atcatcatca 60
tcattgagtt tgtagcctta gacatgactg ttcctcagtt caagttgggc acttacgaga 120
agaccggtct tgctagattc taatcaagag gatgtcagaa tgccatttgc ctgagagatg 180
caggcttcat ttttgatact tttttatttg taacctatat agtataggat tttttttgtc 240
attttgtttc ttctcgtacg agcttgctcc tgatcagcct atctcgcagc tgatgaatat 300
cttgtggtag gggtttggga aaatcattcg agtttgatgt ttttcttggt atttcccact 360
cctcttcaga gtacagaaga ttaagtgaga ccttcgtttg tgcggatccc ccacacacca 420
tagcttcaaa atgtttctac tcctttttta ctcttccaga ttttctcgga ctccgcgcat 480
cgccgtacca cttcaaaaca cccaagcaca gcatactaaa ttttccctct ttcttcctct 540
agggtgtcgt taattacccg tactaaaggt ttggaaaaga aaaaagagac cgcctcgttt 600
ctttttcttc gtcgaaaaag gcaataaaaa tttttatcac gtttcttttt cttgaaattt 660
ttttttttag tttttttctc tttcagtgac ctccattgat atttaagtta ataaacggtc 720
ttcaatttct caagtttcag tttcattttt cttgttctat tacaactttt tttacttctt 780
gttcattaga aagaaagcat agcaatctaa tctaaggggc ggtgttgaca attaatcatc 840
ggcatagtat atcggcatag tataatacga caaggtgagg aactaaacca tggccaagtt 900
gaccagtgcc gttccggtgc tcaccgcgcg cgacgtcgcc ggagcggtcg agttctggac 960
cgaccggctc gggttctccc gggacttcgt ggaggacgac ttcgccggtg tggtccggga 1020
cgacgtgacc ctgttcatca gcgcggtcca ggaccaggtg gtgccggaca acaccctggc 1080
ctgggtgtgg gtgcgcggcc tggacgagct gtacgccgag tggtcggagg tcgtgtccac 1140
gaacttccgg gacgcctccg ggccggccat gaccgagatc ggcgagcagc cgtgggggcg 1200
ggagttcgcc ctgcgcgacc cggccggcaa ctgcgtgcac ttcgtggccg aggagcagga 1260
ctgacacgtc cgacggcggc ccacgggtcc caggcctcgg agatccgtcc cccttttcct 1320
ttgtcgatat catgtaatta gttatgtcac gcttacattc acgccctccc cccacatccg 1380
ctctaaccga aaaggaagga gttagacaac ctgaagtcta ggtccctatt tattttttta 1440
tagttatgtt agtattaaga acgttattta tatttcaaat ttttcttttt tttctgtaca 1500
gacgcgtgta cgcatgtaac attatactga aaaccttgct tgagaaggtt ttgggacgct 1560
cgaaggcttt aatttgcaag ctggagacca acatgtgagc aaaaggccag caaaaggcca 1620
ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc 1680
atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc 1740
aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg 1800
gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta 1860
ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg 1920
ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac 1980
acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag 2040
gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat 2100
ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat 2160
ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc 2220
gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt 2280
ggaacgaaaa ctcacgttaa gggattttgg tcatgagatc agatctaaca tccaaagacg 2340
aaaggttgaa tgaaaccttt ttgccatccg acatccacag gtccattctc acacataagt 2400
gccaaacgca acaggagggg atacactagc agcagaccgt tgcaaacgca ggacctccac 2460
tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc agcccagtta ttgggcttga 2520
ttggagctcg ctcattccaa ttccttctat taggctacta acaccatgac tttattagcc 2580
tgtctatcct ggcccccctg gcgaggttca tgtttgttta tttccgaatg caacaagctc 2640
cgcattacac ccgaacatca ctccagatga gggctttctg agtgtggggt caaatagttt 2700
catgttcccc aaatggccca aaactgacag tttaaacgct gtcttggaac ctaatatgac 2760
aaaagcgtga tctcatccaa gatgaactaa gtttggttcg ttgaaatgct aacggccagt 2820
tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt cttgtttggt attgattgac 2880
gaatgctcaa aaataatctc attaatgctt agcgcagtct ctctatcgct tctgaacccc 2940
ggtgcacctg tgccgaaacg caaatgggga aacacccgct ttttggatga ttatgcattg 3000
tctccacatt gtatgcttcc aagattctgg tgggaatact gctgatagcc taacgttcat 3060
gatcaaaatt taactgttct aacccctact tgacagcaat atataaacag aaggaagctg 3120
ccctgtctta aacctttttt tttatcatca ttattagctt actttcataa ttgcgactgg 3180
ttccaattga caagcttttg attttaacga cttttaacga caacttgaga agatcaaaaa 3240
acaactaatt attcgaaacg aggaattcac gtggcccagc cggccgtctc ggatcggtac 3300
ctcgagatgg tccttttgaa atggctcgta tgccaattgg tcttctttac cgctttttcg 3360
catgcgttta ccgactatct attaaagaag tgtgcgcaat ctgggttttg ccatagaaac 3420
agggtttatg cagaaaatat tgccaaatct catcactgct attacaaagt ggacgccgag 3480
tctattgcac acgatccttt agagaatgtg cttcatgcta ccataattaa aactatacca 3540
agattggagg gcgatgatat agccgttcag ttcccattct ctctctcttt tttacaggat 3600
cactcagtaa ggttcactat aaatgagaaa gagagaatgc caaccaacag cagcggtttg 3660
ttgatctctt cacaacggtt caatgagacc tggaagtacg cattcgacaa gaaatttcaa 3720
gaggaggcga acaggaccag tattccacaa ttccacttcc ttaagcaaaa acaaactgtg 3780
aactcattct ggtcgaaaat atcttcattt ttgtcacttt caaactccac tgcagacaca 3840
tttcatcttc gaaacggtga tgtatccgta gaaatctttg ctgaaccttt tcaattgaaa 3900
gtttactggc aaaatgcgct gaaacttatt gtaaacgagc aaaatttcct gaacattgaa 3960
catcatagaa ctaagcagga aaacttcgca cacgtgctgc cagaagaaac aactttcaac 4020
atgtttaagg acaatttctt gtattcaaag catgactcta tgcctttggg gcctgaatcg 4080
gttgcgctag atttctcttt catgggttct actaatgtct acggtatacc ggaacatgcg 4140
acgtcgctaa ggctgatgga cacttcaggt ggaaaggaac cctacaggct tttcaacgtt 4200
gatgtctttg agtacaacat cggtaccagc caaccaatgt acggttcgat cccattcatg 4260
ttttcatctt cgtccacatc tatcttttgg gtcaatgcag ctgacacttg ggtagacata 4320
aagtatgaca ccagtaaaaa taaaacgatg actcattgga tctccgaaaa tggtgtcata 4380
gatgtagtca tgtccctggg gccagatatt ccaactatca ttgacaaatt taccgatttg 4440
actggtagac cctttttacc gcccatttcc tctatagggt accatcaatg tagatggaat 4500
tataatgatg agatggacgt tctcacagtg gactctcaga tggatgctca tatgattcct 4560
tacgatttta tttggttgga cttggagtat acgaacgaca aaaaatattt tacttggaag 4620
cagcactcct ttcccaatcc aaaaaggctg ttatccaaat taaaaaagtt gggtagaaat 4680
cttgtcgtac taatcgatcc tcatttaaag aaagattatg aaatcagtga cagggtaatt 4740
aatgaaaatg tagcagtcaa ggatcacaat ggaaatgact atgtaggtca ttgctggcca 4800
ggtaattcta tatggattga taccataagc aaatatggcc aaaagatttg gaagtccttt 4860
ttcgaacggt ttatggatct gccggctgat ttaactaatt tattcatttg gaatgatatg 4920
aacgagcctt cgattttcga tggcccagag accacagctc caaaagattt gattcacgac 4980
aattacattg aggaaagatc cgtccataac atatatggtc tatcagtgca tgaagctact 5040
tacgacgcaa taaaatcgat ttattcacca tccgataagc gtcctttcct tctaacaagg 5100
gctttttttg ccggctctca acgtactgct gccacatgga ctggtgacaa tgtggccaat 5160
tgggattact taaagatttc cattcctatg gttctgtcaa acaacattgc tggtatgcca 5220
tttataggag ccgacatagc tggctttgct gaggatccta cacctgaatt gattgcacgt 5280
tggtaccaag cgggcttatg gtacccattt tttagagcac acgcccatat agacaccaag 5340
agaagagaac catacttatt caatgaacct ttgaagtcga tagtacgtga tattatccaa 5400
ttgagatatt tcctgctacc taccttatac accatgtttc ataaatcaag tgtcactgga 5460
tttccgataa tgaatccaat gtttattgaa caccctgaat ttgctgaatt gtatcatatc 5520
gataaccaat tttactggag taattcaggt ctattagtca aacctgtcac ggagcctggt 5580
caatcagaaa cggaaatggt tttcccaccc ggtatattct atgaattcgc atctttacac 5640
tcttttataa acaatggtac tgatttgata gaaaagaata tttctgcacc attggataaa 5700
attccattat ttattgaagg cggtcacatt atcactatga aagataagta tagaagatct 5760
tcaatgttaa tgaaaaacga tccatatgta atagttatag cccctgatac cgagggacga 5820
gccgttggag atctttatgt tgatgatgga gaaacttttg gctaccaaag aggtgagtac 5880
gtagaaactc agttcatttt cgaaaacaat accttaaaaa atgttcgaag tcatattccc 5940
gagaatttga caggcattca ccacaatact ttgaggaata ccaatattga aaaaatcatt 6000
atcgcaaaga ataatttaca acacaacata acgttgaaag acagtattaa agtcaaaaaa 6060
aatggcgaag aaagttcatt gccgactaga tcgtcatatg agaatgataa taagatcacc 6120
attcttaacc tatcgcttga cataactgaa gattgggaag ttatttttgg gcc 6173
<210> 21
<211> 7639
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Sequence of plasmid
pPICADE1glsII.
<400> 21
aaattcctcg tttcgaataa ttagttgttt tttgatcttc tcaagttgtc gttaaaagtc 60
gttaaaatca aaagcttgtc aattggaacc agtcgcaatt atgaaagtaa gctaataatg 120
atgataaaaa aaaaggttta agacagggca gcttccttct gtttatatat tgctgtcaag 180
taggggttag aacagttaaa ttttgatcat gaacgttagg ctatcagcag tattcccacc 240
agaatcttgg aagcatacaa tgtggagaca atgcataatc atccaaaaag cgggtgtttc 300
cccatttgcg tttcggcaca ggtgcaccgg ggttcagaag cgatagagag actgcgctaa 360
gcattaatga gattattttt gagcattcgt caatcaatac caaacaagac aaacggtatg 420
ccgacttttg gaagtttctt tttgaccaac tggccgttag catttcaacg aaccaaactt 480
agttcatctt ggatgagatc acgcttttgt catattaggt tccaagacag cgtttaaact 540
gtcagttttg ggccatttgg ggaacatgaa actatttgac cccacactca gaaagccctc 600
atctggagtg atgttcgggt gtaatgcgga gcttgttgca ttcggaaata aacaaacatg 660
aacctcgcca ggggggccag gatagacagg ctaataaagt catggtgtta gtagcctaat 720
agaaggaatt ggaatgagcg agctccaatc aagcccaata actgggctgg tttttcgatg 780
gcaaaagtgg gtgttgagga gaagaggagt ggaggtcctg cgtttgcaac ggtctgctgc 840
tagtgtatcc cctcctgttg cgtttggcac ttatgtgtga gaatggacct gtggatgtcg 900
gatggcaaaa aggtttcatt caacctttcg tctttggatg ttgtcgaccg gctgcattaa 960
tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg 1020
ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 1080
gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 1140
ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 1200
cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 1260
ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 1320
accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 1380
catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 1440
gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 1500
tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 1560
agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 1620
actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 1680
gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 1740
aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 1800
gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 1860
aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 1920
atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 1980
gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 2040
atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca 2100
ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 2160
cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 2220
agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 2280
cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 2340
tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 2400
agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 2460
gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 2520
gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg 2580
ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 2640
tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 2700
tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 2760
gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 2820
caatagctcc aaggcaacaa attgactact cagaccgaca ttcattcgtt attgatttta 2880
aatcaacgat aaacggaatg gttacttgaa tgatttcact ttatgatcat tgtttactaa 2940
ttacctaaat aggattttat atggaattgg aagaataagg gaaatttcag atgtctgaaa 3000
aaggcgagga gggtactaat cattcaagcc catttcttgc cagtaattgc ttcataagct 3060
tcaatatact tttctttact cttgatagca atttctgcat ccatggctac gccctctttg 3120
ccattcaatc cgttggccgt caaccaatct ctgagaaact gcttatcgta actctcttgc 3180
gatttaccca cttggtaagt cttttgattc caaaatctag aagaatctgg agttaaaact 3240
tcatctacta gtaccaattc attgttttcg tccagtccaa attcgaattt cgtatcagca 3300
ataatgatcc ccttcaaaag ggcgaagttt tttgcagcag aatacaactc gaccgccttg 3360
acagcgacct tctcacaaat gtctttacct acaatctcag cagcttgttc aatagagatg 3420
ttttcatcgt gttcaccctg ttcagctttc gttgaaggtg tgaaaatcgg agttggaaag 3480
gcgtcgctct cttgaaggtt ctcgttttca accttgactc catggacagt ttttgagttc 3540
ttgtactctt tccatgcact tccagtgatg taacctctga caatggcttc caaaggtatc 3600
agtctgtgct tttttactat caaggatcgt ccctctaatt gagatttgta tttttcttca 3660
gacagttttg atggtagtaa agcaaagact tccttgtcat tagaagcaac caaatgattc 3720
tttatgtagg gtgccaaaaa atcaaaccag aaaactgaga gctgagtcaa aatctttccc 3780
ttatcaggaa taccgtttgt cataatcaca tcgtaagcgg agatacggtc agttgcgacg 3840
aacagcaagt tgttctcatc gactgcataa atgtctctaa cctttccttt ggcgattaaa 3900
ggtaggattc cgtccagatc agtgttcaca atggacatac ttggaaggat acagcaaagt 3960
gtgttggaag cgatgacaca tggaaaggaa tttttcgagt ttcctagagt agtatattgg 4020
ggcggtgaaa gttcagatgt ttaatgctta atactcttat actcttcaaa gcgcccaagt 4080
gtttctgcca acctgacttt tttctgaata atgaatcgtt caagtggagt atttaaacca 4140
tgattaagtt acgtgatttg gcactggata aggtcgaaaa atatccgtat tcataaacga 4200
ttattggtaa aagttacaaa ataccactaa ttacggagaa gcttagtaac agttatcatc 4260
tcttggtcga ttaacgctta caatttccat tcgccattca ggctgcgcaa ctgttgggaa 4320
gggcgatcgg tgcgggcctc ttcgctatta cgccagggcc tcgaggcaca aacgaacgtc 4380
tcacttaatc ttctgtactc tgaagaggag tgggaaatac caagaaaaac atcaaactcg 4440
aatgattttc ccaaacccct accacaagat attcatcagc tgcgagatag gctgatcagg 4500
agcaagctcg tacgagaaga aacaaaatga caaaaaaaat cctatactat ataggttaca 4560
aataaaaaag tatcaaaaat gaagcctgca tctctcaggc aaatggcatt ctgacatcct 4620
cttgattaga atctagcaag accggtcttc tcgtaagtgc ccaacttgaa ctgaggaaca 4680
gtcatgtcta aggctacaaa ctcaatgatg atgatgatga tggtcgacgg cgctattcag 4740
atcctcttct gagatgagtt tttgttcggg cccaaaaata acttcccaat cttcagttat 4800
gtcaagcgat aggttaagaa tggtgatctt attatcattc tcatatgacg atctagtcgg 4860
caatgaactt tcttcgccat tttttttgac tttaatactg tctttcaacg ttatgttgtg 4920
ttgtaaatta ttctttgcga taatgatttt ttcaatattg gtattcctca aagtattgtg 4980
gtgaatgcct gtcaaattct cgggaatatg acttcgaaca ttttttaagg tattgttttc 5040
gaaaatgaac tgagtttcta cgtactcacc tctttggtag ccaaaagttt ctccatcatc 5100
aacataaaga tctccaacgg ctcgtccctc ggtatcaggg gctataacta ttacatatgg 5160
atcgtttttc attaacattg aagatcttct atacttatct ttcatagtga taatgtgacc 5220
gccttcaata aataatggaa ttttatccaa tggtgcagaa atattctttt ctatcaaatc 5280
agtaccattg tttataaaag agtgtaaaga tgcgaattca tagaatatac cgggtgggaa 5340
aaccatttcc gtttctgatt gaccaggctc cgtgacaggt ttgactaata gacctgaatt 5400
actccagtaa aattggttat cgatatgata caattcagca aattcagggt gttcaataaa 5460
cattggattc attatcggaa atccagtgac acttgattta tgaaacatgg tgtataaggt 5520
aggtagcagg aaatatctca attggataat atcacgtact atcgacttca aaggttcatt 5580
gaataagtat ggttctcttc tcttggtgtc tatatgggcg tgtgctctaa aaaatgggta 5640
ccataagccc gcttggtacc aacgtgcaat caattcaggt gtaggatcct cagcaaagcc 5700
agctatgtcg gctcctataa atggcatacc agcaatgttg tttgacagaa ccataggaat 5760
ggaaatcttt aagtaatccc aattggccac attgtcacca gtccatgtgg cagcagtacg 5820
ttgagagccg gcaaaaaaag cccttgttag aaggaaagga cgcttatcgg atggtgaata 5880
aatcgatttt attgcgtcgt aagtagcttc atgcactgat agaccatata tgttatggac 5940
ggatctttcc tcaatgtaat tgtcgtgaat caaatctttt ggagctgtgg tctctgggcc 6000
atcgaaaatc gaaggctcgt tcatatcatt ccaaatgaat aaattagtta aatcagccgg 6060
cagatccata aaccgttcga aaaaggactt ccaaatcttt tggccatatt tgcttatggt 6120
atcaatccat atagaattac ctggccagca atgacctaca tagtcatttc cattgtgatc 6180
cttgactgct acattttcat taattaccct gtcactgatt tcataatctt tctttaaatg 6240
aggatcgatt agtacgacaa gatttctacc caactttttt aatttggata acagcctttt 6300
tggattggga aaggagtgct gcttccaagt aaaatatttt ttgtcgttcg tatactccaa 6360
gtccaaccaa ataaaatcgt aaggaatcat atgagcatcc atctgagagt ccactgtgag 6420
aacgtccatc tcatcattat aattccatct acattgatgg taccctatag aggaaatggg 6480
cggtaaaaag ggtctaccag tcaaatcggt aaatttgtca atgatagttg gaatatctgg 6540
ccccagggac atgactacat ctatgacacc attttcggag atccaatgag tcatcgtttt 6600
atttttactg gtgtcatact ttatgtctac ccaagtgtca gctgcattga cccaaaagat 6660
agatgtggac gaagatgaaa acatgaatgg gatcgaaccg tacattggtt ggctggtacc 6720
gatgttgtac tcaaagacat caacgttgaa aagcctgtag ggttcctttc cacctgaagt 6780
gtccatcagc cttagcgacg tcgcatgttc cggtataccg tagacattag tagaacccat 6840
gaaagagaaa tctagcgcaa ccgattcagg ccccaaaggc atagagtcat gctttgaata 6900
caagaaattg tccttaaaca tgttgaaagt tgtttcttct ggcagcacgt gtgcgaagtt 6960
ttcctgctta gttctatgat gttcaatgtt caggaaattt tgctcgttta caataagttt 7020
cagcgcattt tgccagtaaa ctttcaattg aaaaggttca gcaaagattt ctacggatac 7080
atcaccgttt cgaagatgaa atgtgtctgc agtggagttt gaaagtgaca aaaatgaaga 7140
tattttcgac cagaatgagt tcacagtttg tttttgctta aggaagtgga attgtggaat 7200
actggtcctg ttcgcctcct cttgaaattt cttgtcgaat gcgtacttcc aggtctcatt 7260
gaaccgttgt gaagagatca acaaaccgct gctgttggtt ggcattctct ctttctcatt 7320
tatagtgaac cttactgagt gatcctgtaa aaaagagaga gagaatggga actgaacggc 7380
tatatcatcg ccctccaatc ttggtatagt tttaattatg gtagcatgaa gcacattctc 7440
taaaggatcg tgtgcaatag actcggcgtc cactttgtaa tagcagtgat gagatttggc 7500
aatattttct gcataaaccc tgtttctatg gcaaaaccca gattgcgcac acttctttaa 7560
tagatagtcg gtaaacgcat gcgaaaaagc ggtaaagaag accaattggc atacgagcca 7620
tttcaaaagg accatctcg 7639
<210> 22
<211> 5742
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Sequence of plasmid
pYPTIZAGLSII.
<400> 22
cgaacaaaaa ctcatctcag aagaggatct gaatagcgcc gtcgaccatc atcatcatca 60
tcattgagtt tgtagcctta gacatgactg ttcctcagtt caagttgggc acttacgaga 120
agaccggtct tgctagattc taatcaagag gatgtcagaa tgccatttgc ctgagagatg 180
caggcttcat ttttgatact tttttatttg taacctatat agtataggat tttttttgtc 240
attttgtttc ttctcgtacg agcttgctcc tgatcagcct atctcgcagc tgatgaatat 300
cttgtggtag gggtttggga aaatcattcg agtttgatgt ttttcttggt atttcccact 360
cctcttcaga gtacagaaga ttaagtgaga ccttcgtttg tgcggatccc ccacacacca 420
tagcttcaaa atgtttctac tcctttttta ctcttccaga ttttctcgga ctccgcgcat 480
cgccgtacca cttcaaaaca cccaagcaca gcatactaaa ttttccctct ttcttcctct 540
agggtgtcgt taattacccg tactaaaggt ttggaaaaga aaaaagagac cgcctcgttt 600
ctttttcttc gtcgaaaaag gcaataaaaa tttttatcac gtttcttttt cttgaaattt 660
ttttttttag tttttttctc tttcagtgac ctccattgat atttaagtta ataaacggtc 720
ttcaatttct caagtttcag tttcattttt cttgttctat tacaactttt tttacttctt 780
gttcattaga aagaaagcat agcaatctaa tctaaggggc ggtgttgaca attaatcatc 840
ggcatagtat atcggcatag tataatacga caaggtgagg aactaaacca tggccaagtt 900
gaccagtgcc gttccggtgc tcaccgcgcg cgacgtcgcc ggagcggtcg agttctggac 960
cgaccggctc gggttctccc gggacttcgt ggaggacgac ttcgccggtg tggtccggga 1020
cgacgtgacc ctgttcatca gcgcggtcca ggaccaggtg gtgccggaca acaccctggc 1080
ctgggtgtgg gtgcgcggcc tggacgagct gtacgccgag tggtcggagg tcgtgtccac 1140
gaacttccgg gacgcctccg ggccggccat gaccgagatc ggcgagcagc cgtgggggcg 1200
ggagttcgcc ctgcgcgacc cggccggcaa ctgcgtgcac ttcgtggccg aggagcagga 1260
ctgacacgtc cgacggcggc ccacgggtcc caggcctcgg agatccgtcc cccttttcct 1320
ttgtcgatat catgtaatta gttatgtcac gcttacattc acgccctccc cccacatccg 1380
ctctaaccga aaaggaagga gttagacaac ctgaagtcta ggtccctatt tattttttta 1440
tagttatgtt agtattaaga acgttattta tatttcaaat ttttcttttt tttctgtaca 1500
gacgcgtgta cgcatgtaac attatactga aaaccttgct tgagaaggtt ttgggacgct 1560
cgaaggcttt aatttgcaag ctggagacca acatgtgagc aaaaggccag caaaaggcca 1620
ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc 1680
atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc 1740
aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg 1800
gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta 1860
ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg 1920
ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac 1980
acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag 2040
gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat 2100
ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat 2160
ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc 2220
gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt 2280
ggaacgaaaa ctcacgttaa gggattttgg tcatgagatc agatctatga tgagtcacaa 2340
tctgcttcca cagacgagta caaggacagg caaaaggaat tggaagaagt tgctaaccca 2400
ataatgagca agttctatgg agctgctggt ggagctcctg gtggagctcc tggtggcttc 2460
cctggaggtt tccctggcgg agctggcgca gctggcggtg ccccaggtgg tgctgcccca 2520
ggcggagaca gcggaccaac cgtggaagaa gtcgattaag caattcaacg gataaattct 2580
ggttaatata tataacgtga ataggaaatt aaggaaattt tggatctaat aatgtgctgt 2640
atgccgacat cgggcatcgt agattgtata gtatcgctga cactataata agccagccaa 2700
aacccctaaa ccagttgccc tccactaatt agtgtactac ccaatcttgc ctcttcgggt 2760
gtcttttata aggacagatt cacaagctct tgttgcccaa tacacacata cacacagaga 2820
taatagcagt cgaattcacg tggcccagcc ggccgtctcg gatcggtacc tcgagatggt 2880
ccttttgaaa tggctcgtat gccaattggt cttctttacc gctttttcgc atgcgtttac 2940
cgactatcta ttaaagaagt gtgcgcaatc tgggttttgc catagaaaca gggtttatgc 3000
agaaaatatt gccaaatctc atcactgcta ttacaaagtg gacgccgagt ctattgcaca 3060
cgatccttta gagaatgtgc ttcatgctac cataattaaa actataccaa gattggaggg 3120
cgatgatata gccgttcagt tcccattctc tctctctttt ttacaggatc actcagtaag 3180
gttcactata aatgagaaag agagaatgcc aaccaacagc agcggtttgt tgatctcttc 3240
acaacggttc aatgagacct ggaagtacgc attcgacaag aaatttcaag aggaggcgaa 3300
caggaccagt attccacaat tccacttcct taagcaaaaa caaactgtga actcattctg 3360
gtcgaaaata tcttcatttt tgtcactttc aaactccact gcagacacat ttcatcttcg 3420
aaacggtgat gtatccgtag aaatctttgc tgaacctttt caattgaaag tttactggca 3480
aaatgcgctg aaacttattg taaacgagca aaatttcctg aacattgaac atcatagaac 3540
taagcaggaa aacttcgcac acgtgctgcc agaagaaaca actttcaaca tgtttaagga 3600
caatttcttg tattcaaagc atgactctat gcctttgggg cctgaatcgg ttgcgctaga 3660
tttctctttc atgggttcta ctaatgtcta cggtataccg gaacatgcga cgtcgctaag 3720
gctgatggac acttcaggtg gaaaggaacc ctacaggctt ttcaacgttg atgtctttga 3780
gtacaacatc ggtaccagcc aaccaatgta cggttcgatc ccattcatgt tttcatcttc 3840
gtccacatct atcttttggg tcaatgcagc tgacacttgg gtagacataa agtatgacac 3900
cagtaaaaat aaaacgatga ctcattggat ctccgaaaat ggtgtcatag atgtagtcat 3960
gtccctgggg ccagatattc caactatcat tgacaaattt accgatttga ctggtagacc 4020
ctttttaccg cccatttcct ctatagggta ccatcaatgt agatggaatt ataatgatga 4080
gatggacgtt ctcacagtgg actctcagat ggatgctcat atgattcctt acgattttat 4140
ttggttggac ttggagtata cgaacgacaa aaaatatttt acttggaagc agcactcctt 4200
tcccaatcca aaaaggctgt tatccaaatt aaaaaagttg ggtagaaatc ttgtcgtact 4260
aatcgatcct catttaaaga aagattatga aatcagtgac agggtaatta atgaaaatgt 4320
agcagtcaag gatcacaatg gaaatgacta tgtaggtcat tgctggccag gtaattctat 4380
atggattgat accataagca aatatggcca aaagatttgg aagtcctttt tcgaacggtt 4440
tatggatctg ccggctgatt taactaattt attcatttgg aatgatatga acgagccttc 4500
gattttcgat ggcccagaga ccacagctcc aaaagatttg attcacgaca attacattga 4560
ggaaagatcc gtccataaca tatatggtct atcagtgcat gaagctactt acgacgcaat 4620
aaaatcgatt tattcaccat ccgataagcg tcctttcctt ctaacaaggg ctttttttgc 4680
cggctctcaa cgtactgctg ccacatggac tggtgacaat gtggccaatt gggattactt 4740
aaagatttcc attcctatgg ttctgtcaaa caacattgct ggtatgccat ttataggagc 4800
cgacatagct ggctttgctg aggatcctac acctgaattg attgcacgtt ggtaccaagc 4860
gggcttatgg tacccatttt ttagagcaca cgcccatata gacaccaaga gaagagaacc 4920
atacttattc aatgaacctt tgaagtcgat agtacgtgat attatccaat tgagatattt 4980
cctgctacct accttataca ccatgtttca taaatcaagt gtcactggat ttccgataat 5040
gaatccaatg tttattgaac accctgaatt tgctgaattg tatcatatcg ataaccaatt 5100
ttactggagt aattcaggtc tattagtcaa acctgtcacg gagcctggtc aatcagaaac 5160
ggaaatggtt ttcccacccg gtatattcta tgaattcgca tctttacact cttttataaa 5220
caatggtact gatttgatag aaaagaatat ttctgcacca ttggataaaa ttccattatt 5280
tattgaaggc ggtcacatta tcactatgaa agataagtat agaagatctt caatgttaat 5340
gaaaaacgat ccatatgtaa tagttatagc ccctgatacc gagggacgag ccgttggaga 5400
tctttatgtt gatgatggag aaacttttgg ctaccaaaga ggtgagtacg tagaaactca 5460
gttcattttc gaaaacaata ccttaaaaaa tgttcgaagt catattcccg agaatttgac 5520
aggcattcac cacaatactt tgaggaatac caatattgaa aaaatcatta tcgcaaagaa 5580
taatttacaa cacaacataa cgttgaaaga cagtattaaa gtcaaaaaaa atggcgaaga 5640
aagttcattg ccgactagat cgtcatatga gaatgataat aagatcacca ttcttaacct 5700
atcgcttgac ataactgaag attgggaagt tatttttggg cc 5742
<210> 23
<211> 7256
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Sequence of plasmid
pYPT1ADE1glsII.
<400> 23
gtcgaccggc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 60
cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 120
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 180
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 240
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 300
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 360
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 420
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 480
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 540
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 600
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 660
tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca 720
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 780
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 840
cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 900
ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 960
tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 1020
agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 1080
gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 1140
ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 1200
gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 1260
cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 1320
acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 1380
cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 1440
cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 1500
ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 1560
tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 1620
atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 1680
tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 1740
actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 1800
aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 1860
ctcatactct tcctttttca atagctccaa ggcaacaaat tgactactca gaccgacatt 1920
cattcgttat tgattttaaa tcaacgataa acggaatggt tacttgaatg atttcacttt 1980
atgatcattg tttactaatt acctaaatag gattttatat ggaattggaa gaataaggga 2040
aatttcagat gtctgaaaaa ggcgaggagg gtactaatca ttcaagccca tttcttgcca 2100
gtaattgctt cataagcttc aatatacttt tctttactct tgatagcaat ttctgcatcc 2160
atggctacgc cctctttgcc attcaatccg ttggccgtca accaatctct gagaaactgc 2220
ttatcgtaac tctcttgcga tttacccact tggtaagtct tttgattcca aaatctagaa 2280
gaatctggag ttaaaacttc atctactagt accaattcat tgttttcgtc cagtccaaat 2340
tcgaatttcg tatcagcaat aatgatcccc ttcaaaaggg cgaagttttt tgcagcagaa 2400
tacaactcga ccgccttgac agcgaccttc tcacaaatgt ctttacctac aatctcagca 2460
gcttgttcaa tagagatgtt ttcatcgtgt tcaccctgtt cagctttcgt tgaaggtgtg 2520
aaaatcggag ttggaaaggc gtcgctctct tgaaggttct cgttttcaac cttgactcca 2580
tggacagttt ttgagttctt gtactctttc catgcacttc cagtgatgta acctctgaca 2640
atggcttcca aaggtatcag tctgtgcttt tttactatca aggatcgtcc ctctaattga 2700
gatttgtatt tttcttcaga cagttttgat ggtagtaaag caaagacttc cttgtcatta 2760
gaagcaacca aatgattctt tatgtagggt gccaaaaaat caaaccagaa aactgagagc 2820
tgagtcaaaa tctttccctt atcaggaata ccgtttgtca taatcacatc gtaagcggag 2880
atacggtcag ttgcgacgaa cagcaagttg ttctcatcga ctgcataaat gtctctaacc 2940
tttcctttgg cgattaaagg taggattccg tccagatcag tgttcacaat ggacatactt 3000
ggaaggatac agcaaagtgt gttggaagcg atgacacatg gaaaggaatt tttcgagttt 3060
cctagagtag tatattgggg cggtgaaagt tcagatgttt aatgcttaat actcttatac 3120
tcttcaaagc gcccaagtgt ttctgccaac ctgacttttt tctgaataat gaatcgttca 3180
agtggagtat ttaaaccatg attaagttac gtgatttggc actggataag gtcgaaaaat 3240
atccgtattc ataaacgatt attggtaaaa gttacaaaat accactaatt acggagaagc 3300
ttagtaacag ttatcatctc ttggtcgatt aacgcttaca atttccattc gccattcagg 3360
ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagggcctc 3420
gaggcacaaa cgaacgtctc acttaatctt ctgtactctg aagaggagtg ggaaatacca 3480
agaaaaacat caaactcgaa tgattttccc aaacccctac cacaagatat tcatcagctg 3540
cgagataggc tgatcaggag caagctcgta cgagaagaaa caaaatgaca aaaaaaatcc 3600
tatactatat aggttacaaa taaaaaagta tcaaaaatga agcctgcatc tctcaggcaa 3660
atggcattct gacatcctct tgattagaat ctagcaagac cggtcttctc gtaagtgccc 3720
aacttgaact gaggaacagt catgtctaag gctacaaact caatgatgat gatgatgatg 3780
gtcgacggcg ctattcagat cctcttctga gatgagtttt tgttcgggcc caaaaataac 3840
ttcccaatct tcagttatgt caagcgatag gttaagaatg gtgatcttat tatcattctc 3900
atatgacgat ctagtcggca atgaactttc ttcgccattt tttttgactt taatactgtc 3960
tttcaacgtt atgttgtgtt gtaaattatt ctttgcgata atgatttttt caatattggt 4020
attcctcaaa gtattgtggt gaatgcctgt caaattctcg ggaatatgac ttcgaacatt 4080
ttttaaggta ttgttttcga aaatgaactg agtttctacg tactcacctc tttggtagcc 4140
aaaagtttct ccatcatcaa cataaagatc tccaacggct cgtccctcgg tatcaggggc 4200
tataactatt acatatggat cgtttttcat taacattgaa gatcttctat acttatcttt 4260
catagtgata atgtgaccgc cttcaataaa taatggaatt ttatccaatg gtgcagaaat 4320
attcttttct atcaaatcag taccattgtt tataaaagag tgtaaagatg cgaattcata 4380
gaatataccg ggtgggaaaa ccatttccgt ttctgattga ccaggctccg tgacaggttt 4440
gactaataga cctgaattac tccagtaaaa ttggttatcg atatgataca attcagcaaa 4500
ttcagggtgt tcaataaaca ttggattcat tatcggaaat ccagtgacac ttgatttatg 4560
aaacatggtg tataaggtag gtagcaggaa atatctcaat tggataatat cacgtactat 4620
cgacttcaaa ggttcattga ataagtatgg ttctcttctc ttggtgtcta tatgggcgtg 4680
tgctctaaaa aatgggtacc ataagcccgc ttggtaccaa cgtgcaatca attcaggtgt 4740
aggatcctca gcaaagccag ctatgtcggc tcctataaat ggcataccag caatgttgtt 4800
tgacagaacc ataggaatgg aaatctttaa gtaatcccaa ttggccacat tgtcaccagt 4860
ccatgtggca gcagtacgtt gagagccggc aaaaaaagcc cttgttagaa ggaaaggacg 4920
cttatcggat ggtgaataaa tcgattttat tgcgtcgtaa gtagcttcat gcactgatag 4980
accatatatg ttatggacgg atctttcctc aatgtaattg tcgtgaatca aatcttttgg 5040
agctgtggtc tctgggccat cgaaaatcga aggctcgttc atatcattcc aaatgaataa 5100
attagttaaa tcagccggca gatccataaa ccgttcgaaa aaggacttcc aaatcttttg 5160
gccatatttg cttatggtat caatccatat agaattacct ggccagcaat gacctacata 5220
gtcatttcca ttgtgatcct tgactgctac attttcatta attaccctgt cactgatttc 5280
ataatctttc tttaaatgag gatcgattag tacgacaaga tttctaccca acttttttaa 5340
tttggataac agcctttttg gattgggaaa ggagtgctgc ttccaagtaa aatatttttt 5400
gtcgttcgta tactccaagt ccaaccaaat aaaatcgtaa ggaatcatat gagcatccat 5460
ctgagagtcc actgtgagaa cgtccatctc atcattataa ttccatctac attgatggta 5520
ccctatagag gaaatgggcg gtaaaaaggg tctaccagtc aaatcggtaa atttgtcaat 5580
gatagttgga atatctggcc ccagggacat gactacatct atgacaccat tttcggagat 5640
ccaatgagtc atcgttttat ttttactggt gtcatacttt atgtctaccc aagtgtcagc 5700
tgcattgacc caaaagatag atgtggacga agatgaaaac atgaatggga tcgaaccgta 5760
cattggttgg ctggtaccga tgttgtactc aaagacatca acgttgaaaa gcctgtaggg 5820
ttcctttcca cctgaagtgt ccatcagcct tagcgacgtc gcatgttccg gtataccgta 5880
gacattagta gaacccatga aagagaaatc tagcgcaacc gattcaggcc ccaaaggcat 5940
agagtcatgc tttgaataca agaaattgtc cttaaacatg ttgaaagttg tttcttctgg 6000
cagcacgtgt gcgaagtttt cctgcttagt tctatgatgt tcaatgttca ggaaattttg 6060
ctcgtttaca ataagtttca gcgcattttg ccagtaaact ttcaattgaa aaggttcagc 6120
aaagatttct acggatacat caccgtttcg aagatgaaat gtgtctgcag tggagtttga 6180
aagtgacaaa aatgaagata ttttcgacca gaatgagttc acagtttgtt tttgcttaag 6240
gaagtggaat tgtggaatac tggtcctgtt cgcctcctct tgaaatttct tgtcgaatgc 6300
gtacttccag gtctcattga accgttgtga agagatcaac aaaccgctgc tgttggttgg 6360
cattctctct ttctcattta tagtgaacct tactgagtga tcctgtaaaa aagagagaga 6420
gaatgggaac tgaacggcta tatcatcgcc ctccaatctt ggtatagttt taattatggt 6480
agcatgaagc acattctcta aaggatcgtg tgcaatagac tcggcgtcca ctttgtaata 6540
gcagtgatga gatttggcaa tattttctgc ataaaccctg tttctatggc aaaacccaga 6600
ttgcgcacac ttctttaata gatagtcggt aaacgcatgc gaaaaagcgg taaagaagac 6660
caattggcat acgagccatt tcaaaaggac catctcgagg taccgatccg agacggccgg 6720
ctgggccacg tgaattcgac tgctattatc tctgtgtgta tgtgtgtatt gggcaacaag 6780
agcttgtgaa tctgtcctta taaaagacac ccgaagaggc aagattgggt agtacactaa 6840
ttagtggagg gcaactggtt taggggtttt ggctggctta ttatagtgtc agcgatacta 6900
tacaatctac gatgcccgat gtcggcatac agcacattat tagatccaaa atttccttaa 6960
tttcctattc acgttatata tattaaccag aatttatccg ttgaattgct taatcgactt 7020
cttccacggt tggtccgctg tctccgcctg gggcagcacc acctggggca ccgccagctg 7080
cgccagctcc gccagggaaa cctccaggga agccaccagg agctccacca ggagctccac 7140
cagcagctcc atagaacttg ctcattattg ggttagcaac ttcttccaat tccttttgcc 7200
tgtccttgta ctcgtctgtg gaagcagatt gtgactcatc atagatctga tctcat 7256
<210> 24
<211> 5721
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Sequence of plasmid
pGAPZAglsIIHDEL.
<400> 24
tcgagatggt ccttttgaaa tggctcgtat gccaattggt cttctttacc gctttttcgc 60
atgcgtttac cgactatcta ttaaagaagt gtgcgcaatc tgggttttgc catagaaaca 120
gggtttatgc agaaaatatt gccaaatctc atcactgcta ttacaaagtg gacgccgagt 180
ctattgcaca cgatccttta gagaatgtgc ttcatgctac cataattaaa actataccaa 240
gattggaggg cgatgatata gccgttcagt tcccattctc tctctctttt ttacaggatc 300
actcagtaag gttcactata aatgagaaag agagaatgcc aaccaacagc agcggtttgt 360
tgatctcttc acaacggttc aatgagacct ggaagtacgc attcgacaag aaatttcaag 420
aggaggcgaa caggaccagt attccacaat tccacttcct taagcaaaaa caaactgtga 480
actcattctg gtcgaaaata tcttcatttt tgtcactttc aaactccact gcagacacat 540
ttcatcttcg aaacggtgat gtatccgtag aaatctttgc tgaacctttt caattgaaag 600
tttactggca aaatgcgctg aaacttattg taaacgagca aaatttcctg aacattgaac 660
atcatagaac taagcaggaa aacttcgcac acgtgctgcc agaagaaaca actttcaaca 720
tgtttaagga caatttcttg tattcaaagc atgactctat gcctttgggg cctgaatcgg 780
ttgcgctaga tttctctttc atgggttcta ctaatgtcta cggtataccg gaacatgcga 840
cgtcgctaag gctgatggac acttcaggtg gaaaggaacc ctacaggctt ttcaacgttg 900
atgtctttga gtacaacatc ggtaccagcc aaccaatgta cggttcgatc ccattcatgt 960
tttcatcttc gtccacatct atcttttggg tcaatgcagc tgacacttgg gtagacataa 1020
agtatgacac cagtaaaaat aaaacgatga ctcattggat ctccgaaaat ggtgtcatag 1080
atgtagtcat gtccctgggg ccagatattc caactatcat tgacaaattt accgatttga 1140
ctggtagacc ctttttaccg cccatttcct ctatagggta ccatcaatgt agatggaatt 1200
ataatgatga gatggacgtt ctcacagtgg actctcagat ggatgctcat atgattcctt 1260
acgattttat ttggttggac ttggagtata cgaacgacaa aaaatatttt acttggaagc 1320
agcactcctt tcccaatcca aaaaggctgt tatccaaatt aaaaaagttg ggtagaaatc 1380
ttgtcgtact aatcgatcct catttaaaga aagattatga aatcagtgac agggtaatta 1440
atgaaaatgt agcagtcaag gatcacaatg gaaatgacta tgtaggtcat tgctggccag 1500
gtaattctat atggattgat accataagca aatatggcca aaagatttgg aagtcctttt 1560
tcgaacggtt tatggatctg ccggctgatt taactaattt attcatttgg aatgatatga 1620
acgagccttc gattttcgat ggcccagaga ccacagctcc aaaagatttg attcacgaca 1680
attacattga ggaaagatcc gtccataaca tatatggtct atcagtgcat gaagctactt 1740
acgacgcaat aaaatcgatt tattcaccat ccgataagcg tcctttcctt ctaacaaggg 1800
ctttttttgc cggctctcaa cgtactgctg ccacatggac tggtgacaat gtggccaatt 1860
gggattactt aaagatttcc attcctatgg ttctgtcaaa caacattgct ggtatgccat 1920
ttataggagc cgacatagct ggctttgctg aggatcctac acctgaattg attgcacgtt 1980
ggtaccaagc gggcttatgg tacccatttt ttagagcaca cgcccatata gacaccaaga 2040
gaagagaacc atacttattc aatgaacctt tgaagtcgat agtacgtgat attatccaat 2100
tgagatattt cctgctacct accttataca ccatgtttca taaatcaagt gtcactggat 2160
ttccgataat gaatccaatg tttattgaac accctgaatt tgctgaattg tatcatatcg 2220
ataaccaatt ttactggagt aattcaggtc tattagtcaa acctgtcacg gagcctggtc 2280
aatcagaaac ggaaatggtt ttcccacccg gtatattcta tgaattcgca tctttacact 2340
cttttataaa caatggtact gatttgatag aaaagaatat ttctgcacca ttggataaaa 2400
ttccattatt tattgaaggc ggtcacatta tcactatgaa agataagtat agaagatctt 2460
caatgttaat gaaaaacgat ccatatgtaa tagttatagc ccctgatacc gagggacgag 2520
ccgttggaga tctttatgtt gatgatggag aaacttttgg ctaccaaaga ggtgagtacg 2580
tagaaactca gttcattttc gaaaacaata ccttaaaaaa tgttcgaagt catattcccg 2640
agaatttgac aggcattcac cacaatactt tgaggaatac caatattgaa aaaatcatta 2700
tcgcaaagaa taatttacaa cacaacataa cgttgaaaga cagtattaaa gtcaaaaaaa 2760
atggcgaaga aagttcattg ccgactagat cgtcatatga gaatgataat aagatcacca 2820
ttcttaacct atcgcttgac ataactgaag attgggaagt tatttttggg cccgaacaaa 2880
aactcatctc agaagaggat ctgaatagcg ccgtcgacca cgacgaactg tgagttttag 2940
ccttagacat gactgttcct cagttcaagt tgggcactta cgagaagacc ggtcttgcta 3000
gattctaatc aagaggatgt cagaatgcca tttgcctgag agatgcaggc ttcatttttg 3060
atactttttt atttgtaacc tatatagtat aggatttttt ttgtcatttt gtttcttctc 3120
gtacgagctt gctcctgatc agcctatctc gcagctgatg aatatcttgt ggtaggggtt 3180
tgggaaaatc attcgagttt gatgtttttc ttggtatttc ccactcctct tcagagtaca 3240
gaagattaag tgagaccttc gtttgtgcgg atcccccaca caccatagct tcaaaatgtt 3300
tctactcctt ttttactctt ccagattttc tcggactccg cgcatcgccg taccacttca 3360
aaacacccaa gcacagcata ctaaattttc cctctttctt cctctagggt gtcgttaatt 3420
acccgtacta aaggtttgga aaagaaaaaa gagaccgcct cgtttctttt tcttcgtcga 3480
aaaaggcaat aaaaattttt atcacgtttc tttttcttga aatttttttt tttagttttt 3540
ttctctttca gtgacctcca ttgatattta agttaataaa cggtcttcaa tttctcaagt 3600
ttcagtttca tttttcttgt tctattacaa ctttttttac ttcttgttca ttagaaagaa 3660
agcatagcaa tctaatctaa gggcggtgtt gacaattaat catcggcata gtatatcggc 3720
atagtataat acgacaaggt gaggaactaa accatggcca agttgaccag tgccgttccg 3780
gtgctcaccg cgcgcgacgt cgccggagcg gtcgagttct ggaccgaccg gctcgggttc 3840
tcccgggact tcgtggagga cgacttcgcc ggtgtggtcc gggacgacgt gaccctgttc 3900
atcagcgcgg tccaggacca ggtggtgccg gacaacaccc tggcctgggt gtgggtgcgc 3960
ggcctggacg agctgtacgc cgagtggtcg gaggtcgtgt ccacgaactt ccgggacgcc 4020
tccgggccgg ccatgaccga gatcggcgag cagccgtggg ggcgggagtt cgccctgcgc 4080
gacccggccg gcaactgcgt gcacttcgtg gccgaggagc aggactgaca cgtccgacgg 4140
cggcccacgg gtcccaggcc tcggagatcc gtcccccttt tcctttgtcg atatcatgta 4200
attagttatg tcacgcttac attcacgccc tccccccaca tccgctctaa ccgaaaagga 4260
aggagttaga caacctgaag tctaggtccc tatttatttt tttatagtta tgttagtatt 4320
aagaacgtta tttatatttc aaatttttct tttttttctg tacagacgcg tgtacgcatg 4380
taacattata ctgaaaacct tgcttgagaa ggttttggga cgctcgaagg ctttaatttg 4440
caagctggag accaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 4500
cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 4560
ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 4620
aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 4680
tctcccttcg ggaagcgtgg cgctttctca atgctcacgc tgtaggtatc tcagttcggt 4740
gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 4800
cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 4860
ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 4920
cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct 4980
gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 5040
cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 5100
tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 5160
ttaagggatt ttggtcatgc atgagatcag atcttttttg tagaaatgtc ttggtgtcct 5220
cgtccaatca ggtagccatc tctgaaatat ctggctccgt tgcaactccg aacgacctgc 5280
tggcaacgta aaattctccg gggtaaaact taaatgtgga gtaatggaac cagaaacgtc 5340
tcttcccttc tctctccttc caccgcccgt taccgtccct aggaaatttt actctgctgg 5400
agagcttctt ctacggcccc cttgcagcaa tgctcttccc agcattacgt tgcgggtaaa 5460
acggaggtcg tgtacccgac ctagcagccc agggatggaa aagtcccggc cgtcgctggc 5520
aataatagcg ggcggacgca tgtcatgaga ttattggaaa ccaccagaat cgaatataaa 5580
aggcgaacac ctttcccaat tttggtttct cctgacccaa agactttaaa tttaatttat 5640
ttgtccctat ttcaatcaat tgaacaacta tttcgaaacg aggaattcac gtggcccagc 5700
cggccgtctc ggatcggtac c 5721
<210> 25
<211> 7230
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:Sequence of plasmid
pGAPADE1glsIIHDEL.
<400> 25
cgtactcacc tctttggtag ccaaaagttt ctccatcatc aacataaaga tctccaacgg 60
ctcgtccctc ggtatcaggg gctataacta ttacatatgg atcgtttttc attaacattg 120
aagatcttct atacttatct ttcatagtga taatgtgacc gccttcaata aataatggaa 180
ttttatccaa tggtgcagaa atattctttt ctatcaaatc agtaccattg tttataaaag 240
agtgtaaaga tgcgaattca tagaatatac cgggtgggaa aaccatttcc gtttctgatt 300
gaccaggctc cgtgacaggt ttgactaata gacctgaatt actccagtaa aattggttat 360
cgatatgata caattcagca aattcagggt gttcaataaa cattggattc attatcggaa 420
atccagtgac acttgattta tgaaacatgg tgtataaggt aggtagcagg aaatatctca 480
attggataat atcacgtact atcgacttca aaggttcatt gaataagtat ggttctcttc 540
tcttggtgtc tatatgggcg tgtgctctaa aaaatgggta ccataagccc gcttggtacc 600
aacgtgcaat caattcaggt gtaggatcct cagcaaagcc agctatgtcg gctcctataa 660
atggcatacc agcaatgttg tttgacagaa ccataggaat ggaaatcttt aagtaatccc 720
aattggccac attgtcacca gtccatgtgg cagcagtacg ttgagagccg gcaaaaaaag 780
cccttgttag aaggaaagga cgcttatcgg atggtgaata aatcgatttt attgcgtcgt 840
aagtagcttc atgcactgat agaccatata tgttatggac ggatctttcc tcaatgtaat 900
tgtcgtgaat caaatctttt ggagctgtgg tctctgggcc atcgaaaatc gaaggctcgt 960
tcatatcatt ccaaatgaat aaattagtta aatcagccgg cagatccata aaccgttcga 1020
aaaaggactt ccaaatcttt tggccatatt tgcttatggt atcaatccat atagaattac 1080
ctggccagca atgacctaca tagtcatttc cattgtgatc cttgactgct acattttcat 1140
taattaccct gtcactgatt tcataatctt tctttaaatg aggatcgatt agtacgacaa 1200
gatttctacc caactttttt aatttggata acagcctttt tggattggga aaggagtgct 1260
gcttccaagt aaaatatttt ttgtcgttcg tatactccaa gtccaaccaa ataaaatcgt 1320
aaggaatcat atgagcatcc atctgagagt ccactgtgag aacgtccatc tcatcattat 1380
aattccatct acattgatgg taccctatag aggaaatggg cggtaaaaag ggtctaccag 1440
tcaaatcggt aaatttgtca atgatagttg gaatatctgg ccccagggac atgactacat 1500
ctatgacacc attttcggag atccaatgag tcatcgtttt atttttactg gtgtcatact 1560
ttatgtctac ccaagtgtca gctgcattga cccaaaagat agatgtggac gaagatgaaa 1620
acatgaatgg gatcgaaccg tacattggtt ggctggtacc gatgttgtac tcaaagacat 1680
caacgttgaa aagcctgtag ggttcctttc cacctgaagt gtccatcagc cttagcgacg 1740
tcgcatgttc cggtataccg tagacattag tagaacccat gaaagagaaa tctagcgcaa 1800
ccgattcagg ccccaaaggc atagagtcat gctttgaata caagaaattg tccttaaaca 1860
tgttgaaagt tgtttcttct ggcagcacgt gtgcgaagtt ttcctgctta gttctatgat 1920
gttcaatgtt caggaaattt tgctcgttta caataagttt cagcgcattt tgccagtaaa 1980
ctttcaattg aaaaggttca gcaaagattt ctacggatac atcaccgttt cgaagatgaa 2040
atgtgtctgc agtggagttt gaaagtgaca aaaatgaaga tattttcgac cagaatgagt 2100
tcacagtttg tttttgctta aggaagtgga attgtggaat actggtcctg ttcgcctcct 2160
cttgaaattt cttgtcgaat gcgtacttcc aggtctcatt gaaccgttgt gaagagatca 2220
acaaaccgct gctgttggtt ggcattctct ctttctcatt tatagtgaac cttactgagt 2280
gatcctgtaa aaaagagaga gagaatggga actgaacggc tatatcatcg ccctccaatc 2340
ttggtatagt tttaattatg gtagcatgaa gcacattctc taaaggatcg tgtgcaatag 2400
actcggcgtc cactttgtaa tagcagtgat gagatttggc aatattttct gcataaaccc 2460
tgtttctatg gcaaaaccca gattgcgcac acttctttaa tagatagtcg gtaaacgcat 2520
gcgaaaaagc ggtaaagaag accaattggc atacgagcca tttcaaaagg accatctcga 2580
ggtaccgatc cgagacggcc ggctgggcca cgtgaattcc tcgtttcgaa atagttgttc 2640
aattgattga aatagggaca aataaattaa atttaaagtc tttgggtcag gagaaaccaa 2700
aattgggaaa ggtgttcgcc ttttatattc gattctggtg gtttccaata atctcatgac 2760
atgcgtccgc ccgctattat tgccagcgac ggccgggact tttccatccc tgggctgcta 2820
ggtcgggtac acgacctccg ttttacccgc aacgtaatgc tgggaagagc attgctgcaa 2880
gggggccgta gaagaagctc tccagcagag taaaatttcc tagggacggt aacgggcggt 2940
ggaaggagag agaagggaag agacgtttct ggttccatta ctccacattt aagttttacc 3000
ccggagaatt ttacgttgcc agcaggtcgt tcggagttgc aacggagcca gatatttcag 3060
agatggctac ctgattggac gaggacacca agacatttct acaaaaaaga tctgatctca 3120
tcgaccggct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 3180
gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 3240
tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 3300
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 3360
cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 3420
ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 3480
tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 3540
gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 3600
gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 3660
gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 3720
ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 3780
ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag 3840
ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 3900
gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 3960
ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 4020
tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 4080
ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 4140
gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 4200
tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 4260
cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 4320
ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 4380
gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta 4440
caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 4500
gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 4560
ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 4620
tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 4680
caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 4740
tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 4800
cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 4860
ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 4920
aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 4980
tcatactctt cctttttcaa tagctccaag gcaacaaatt gactactcag accgacattc 5040
attcgttatt gattttaaat caacgataaa cggaatggtt acttgaatga tttcacttta 5100
tgatcattgt ttactaatta cctaaatagg attttatatg gaattggaag aataagggaa 5160
atttcagatg tctgaaaaag gcgaggaggg tactaatcat tcaagcccat ttcttgccag 5220
taattgcttc ataagcttca atatactttt ctttactctt gatagcaatt tctgcatcca 5280
tggctacgcc ctctttgcca ttcaatccgt tggccgtcaa ccaatctctg agaaactgct 5340
tatcgtaact ctcttgcgat ttacccactt ggtaagtctt ttgattccaa aatctagaag 5400
aatctggagt taaaacttca tctactagta ccaattcatt gttttcgtcc agtccaaatt 5460
cgaatttcgt atcagcaata atgatcccct tcaaaagggc gaagtttttt gcagcagaat 5520
acaactcgac cgccttgaca gcgaccttct cacaaatgtc tttacctaca atctcagcag 5580
cttgttcaat agagatgttt tcatcgtgtt caccctgttc agctttcgtt gaaggtgtga 5640
aaatcggagt tggaaaggcg tcgctctctt gaaggttctc gttttcaacc ttgactccat 5700
ggacagtttt tgagttcttg tactctttcc atgcacttcc agtgatgtaa cctctgacaa 5760
tggcttccaa aggtatcagt ctgtgctttt ttactatcaa ggatcgtccc tctaattgag 5820
atttgtattt ttcttcagac agttttgatg gtagtaaagc aaagacttcc ttgtcattag 5880
aagcaaccaa atgattcttt atgtagggtg ccaaaaaatc aaaccagaaa actgagagct 5940
gagtcaaaat ctttccctta tcaggaatac cgtttgtcat aatcacatcg taagcggaga 6000
tacggtcagt tgcgacgaac agcaagttgt tctcatcgac tgcataaatg tctctaacct 6060
ttcctttggc gattaaaggt aggattccgt ccagatcagt gttcacaatg gacatacttg 6120
gaaggataca gcaaagtgtg ttggaagcga tgacacatgg aaaggaattt ttcgagtttc 6180
ctagagtagt atattggggc ggtgaaagtt cagatgttta atgcttaata ctcttatact 6240
cttcaaagcg cccaagtgtt tctgccaacc tgactttttt ctgaataatg aatcgttcaa 6300
gtggagtatt taaaccatga ttaagttacg tgatttggca ctggataagg tcgaaaaata 6360
tccgtattca taaacgatta ttggtaaaag ttacaaaata ccactaatta cggagaagct 6420
tagtaacagt tatcatctct tggtcgatta acgcttacaa tttccattcg ccattcaggc 6480
tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagggcctcg 6540
aggcacaaac gaacgtctca cttaatcttc tgtactctga agaggagtgg gaaataccaa 6600
gaaaaacatc aaactcgaat gattttccca aacccctacc acaagatatt catcagctgc 6660
gagataggct gatcaggagc aagctcgtac gagaagaaac aaaatgacaa aaaaaatcct 6720
atactatata ggttacaaat aaaaaagtat caaaaatgaa gcctgcatct ctcaggcaaa 6780
tggcattctg acatcctctt gattagaatc tagcaagacc ggtcttctcg taagtgccca 6840
acttgaactg aggaacagtc atgtctaagg ctaaaactca cagttcgtcg tggtcgacgg 6900
cgctattcag atcctcttct gagatgagtt tttgttcggg cccaaaaata acttcccaat 6960
cttcagttat gtcaagcgat aggttaagaa tggtgatctt attatcattc tcatatgacg 7020
atctagtcgg caatgaactt tcttcgccat tttttttgac tttaatactg tctttcaacg 7080
ttatgttgtg ttgtaaatta ttctttgcga taatgatttt ttcaatattg gtattcctca 7140
aagtattgtg gtgaatgcct gtcaaattct cgggaatatg acttcgaaca ttttttaagg 7200
tattgttttc gaaaatgaac tgagtttcta 7230
<210> 26
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 26
gacgagatct ttttttcaga ccatatgacc gg 32
<210> 27
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 27
gcggaattct tttctcagtt gatttgtttg t 31
<210> 28
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 28
gcgggtcgac cacgacgaac tgtgagtttt agccttagac atgac 45
<210> 29
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 29
caggagcaaa gctcgtacga g 21