KR20070004585A

KR20070004585A - 2-미크론 패밀리 플라스미드 및 이의 용도

Info

Publication number: KR20070004585A
Application number: KR1020067014724A
Authority: KR
Inventors: 다렐 슬립; 크리스토퍼 존 아더 휘니스
Original assignee: 노보자임스 델타 리미티드
Priority date: 2003-12-23
Filing date: 2004-12-23
Publication date: 2007-01-09
Also published as: CA2551496A1; CN101128587B; CN101128587A; GB0614610D0; NZ548154A; DE602004029503D1; CN1922326A; CN1922326B; JP4964596B2; KR101298157B1; US20080261861A1; AU2004303597A1; ATE483812T1; GB0329722D0; AU2004303597B2; ZA200605589B; DK1711602T3; AU2004303597C1; EP1711602B1; CA2551496C

Abstract

본 발명은 REP2 유전자 또는 FLP 유전자중 적어도 하나의 마지막 작용 코돈이후의 첫번째 염기와 상기 유전자에 인접한 역위 반복내의 FRT 사이트이전의 마지막 염기사이에 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 포함하는 2㎛-패밀리 플라스미드를 제공한다.

플라스미드, 유전자, 벡터, 형질변형, 이스트

Description

2-미크론 패밀리 플라스미드 및 이의 용도{2-MICRON FAMILY PLASMID AND USE THEREOF}

본 출원은 변형된 플라스미드 및 이의 용도에 관한 것이다.

버딩 이스트와 매우 근접한 특정 관련 종들은 자연적으로 발생하는 환형 이중 스트랜드 DNA 플라스미드를 함유하는 것으로 알려져 있다. 총괄하여 2㎛-패밀리 플라스미드라고 칭하여지는 이러한 플리스미드는 지고사카로미세스 로욱시(Zygosaccharomyces rouxii)(이전에는 지고사카로미세스 비스포러스(Zygosaccharomyces bisporus)로 분류됨))의 pSR1, pSB3 및 pSB4, 지고사카로미세스 베일리(Zygosaccharomyces bailii)의 플라스미드 pSB1 및 pSB2, 지고사카로미세스 퍼멘타티(Zygosaccharomyces fermentati)의 플라스미드 pSM1, 클루이베로미세스 드로스필라럼(Kluyveromyces drosphilarum)의 플라스미드 pKD1, 피치아 멤브라나에파시엔스(Pichia membranaefaciens)(이후 "pPM1"이라 칭함)의 무명의 플라스미드 및 사카로미세스 세레비지아에(Saccharomyces cerevisiae)(Volkert, et al., 1989, Microbiological Reviews, 53, 299; Painting, et al., 1984, J. Applied Bacteriology, 56, 331) 및 S. 칼스버제네시스(S. carlsbergenesis)와 같은 다른 사카로미세스종의 2㎛ 플라스미드 및 변이체(Scp1, Scp2 및 Scp3와 같은)를 포함한다. 플라스미드의 패밀리로서 이러한 분자들은 이들이 플라스미드의 반대편상에 두개의 역위 반복을 소유하며, 약 6-kbp(4757-6615-bp 범위)의 유사한 크기, 적어도 3개의 오픈 리딩 프래임(이중 하나는 사이트 스페시픽 리콤비나아제(2㎛의 FLP와 같은)를 암호함) 및 역위 반복의 한쪽 말단에 근접하게 위치한 복제 오리진(ori)으로도 알려진 자가 복제 서열(ARS)을 갖는 점에서 일련의 공통된 특징을 공유한다(Futcher, 1988, Yeast, 4, 27; Murray et al., 1988, J. Mol . Biol . 200, 601 및 Toh-e et al., 1986, Basic Life Sci . 40, 425). 식별가능한 DNA 서열 상동성의 결여에도 불구하고, 이들의 공유된 분자적 구조 및 오픈 리딩 프래임의 기능 보존성은 패밀리 멤버들 간의 공통 관련성을 입증한다.

2㎛ 플라스미드(도 1)는 반수체 게놈당 60-100카피에서 대부분의 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 스트레인에 내인성인 6,318-bp 이중-스트랜드 DNA 플라스미드이다. 2㎛ 플라스미드는 두개의 599-bp 역위 반복 서열에 의해 분리된 스몰 유니크(US) 리전 및 라지 유니크(UL) 리전을 포함한다. 역위 반복 서열의 자리-특이 재조합은 생체내에서(in vivo) 플라스미드의 A-형 및 B-형간의 인터-컨버전을 일으킨다(Volkert & Brach, 1986, Cell, 46, 541). 상기 두 형태의 2㎛는 이들의 독특한 리전의 상대적 방향만 다르다.

사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터 클로닝된 2㎛ 플라스미드(Scp1으로도 알려짐)의 DNA 시퀀싱 결과, 6,318-bp의 크기를 나타내나(Hartely 및 Doneloson, 1980, Nature, 286, 860), 2㎛, Scp2 및 Scp3의 다른 약간 보다 작은 변이체들은 125-bp 및 220-bp의 소 결실의 결과로 각각 STB로 알려진 리전에 존재하는 것으로 알려져 있다(Cameron et al., 1977, Nucl . Acids Res., 4, 1429: Kikuchi, 1983, Cell, 35, 487 및 Livingston & Hahne, 1979, Proc . Natl . Acad. Sci . USA, 76, 3727). 한 연구에서 전 세계의 약 80%의 자연 사카로미세스 스트레인이 2㎛에 대해 DNA 상동성을 가졌다(서던 블롯 분석시)(Hollenberg, 1982, Current Topics in Microbiology and Immunobiology, 96, 119). 또한, 변이(유전적 폴리모피즘)가 에스. 세레비지아에 및 에스. 칼스버제네시스에서 발견되는 2㎛ 플라스미드의 자연 집단내에서 발생하며, NCBI 서열(가입 번호 NC_001398)이 그 일 예이다.

2㎛ 플라스미드는 핵 국소화를 가지며 고수준의 유사분열 안정성을 나타낸다(Mead et al., 1986, Molecular & General Genetics, 205, 417). 2㎛ 플라스미드의 고유 안정성은 플라스미드-암호화 카피 수 증폭 및 키메릭 벡터의 발달도중 쉽게 손상되는 파티셔닝 메카니즘에 기인한다(Futcher & Cox, 1984, J. Bacteriol ., 157, 283; Bachmair & Ruis, 1984, Monatshefte fur Chemie, 115, 1229). 2㎛ 플라스미드를 함유하는 이스트 스트레인은 [cir⁺]로 알려져 있으며, 2㎛ 플라스미드를 함유하지 않는 이스트 스트레인은 [cir⁰]으로 알려져 있다.

US-리전은 REP2 및 FLP 유전자를 함유하며, UL-리전은 REP1 및 D(RAF로도 알려짐) 유전자, STB-로커스 및 복제 오리진을 함유한다(Broach & Hicks, 1980, Cell, 21, 501; Sutton & Broach, 1985, Mol . Cell. Biol ., 5, 2770). Flp 리콤비나아제는 역위 반복내의 FRT-사이트(Flp 인지 표적)에 바인딩하여 자리-특이 재조합을 매개하며, 이는 생체내에서 자연 플라스미드 증폭 및 플라스미드 복제수의 조절에 필수적이다(Senecoff et al, 1985, Proc . Natl . Acad . Sci . U.S.A., 82, 7270; Jayaram, 1985, Proc . Natl . Acad . Sci . U.S.A., 82, 5875). 2㎛-패밀리 플라스미드의 복제수는 Flp 리콤비나아제 활성의 변화에 의해 현저히 영향받을 수 있다(Sleep et al, 2001, Yeast, 18, 403; Rose & Broach, 1990, Methods Enzymol ., 185, 234). Rep1 및 Rep2 단백질은 플라스미드 분리를 매개하나 그 작용 모드는 불분명하다(Sengupta et al, 2001, J. Bacteriol ., 183, 2306). 이들은 또한 FLP 유전자의 전사를 억제한다(Reynolds et al, 1987, Mol . Cell. Biol ., 7, 3566).

FLP 및 REP2 유전자는 명확하게 이들간에 규정된 개재 서열없이 발산성 프로모터로부터 전사된다. FLP 및 REP2 전사는 이들의 번역 종결 코돈이후에 각각 24-bp 및 178-bp에서 모두 역위 반복 서열내의 동일한 서열 모티프에서 종결된다(Sutton & Broach, 1985, Mol . Cell. Biol ., 5, 2770).

FLP의 경우, C-말단 암호 서열이 또한 역위 반복 서열내에 놓여진다. 또한, 상기 두 역위 반복 서열은 599-bp에 걸쳐 매우 보존적이며, 이는 시험관내에서 FRT-사이트(65-bp미만)만이 자리-특이 재조합에 필수적임에도 불구하고 생체내에서 효율적인 플라스미드 복제 및 증폭에 유리한 것으로 간주되는 특징이다(Senecoff et al, 1985, Proc . Natl . Acad . Sci . U.S.A., 82, 7270; Jayaram, 1985, Proc . Natl . Acad . Sci . U.S.A., 82, 5875; Meyer-Leon et al, 1984, Cold spring Harbor Symposia On Quantitative Biology, 49, 797). Flp의 중요 촉매 잔기는 히스티딘-309 및 히스티딘 345에 의해 촉진되는 스트랜드-컷팅을 갖는 아르기닌-308 및 티로신-343(필수적임)이다(Prasad et al, 1987, Proc . Natl . Acad . Sci . U.S.A., 84, 2189; Chen et al, 1992, Cell, 69, 647; Grainge et al, 2001, J. Mol. Biol ., 314, 717).

두개의 작용 도메인이 Rep2에 표시된다. 잔기 15-58은 Rep1-바인딩 도메인을 형성하며, 잔기 59-296은 자가-결합 및 STB-바인딩 리전을 함유한다(Sengupta et al, 2001, J. Bacteriol ., 183, 2306).

2㎛ 플라스미드의 다수의 필수 작용 리전이 결여되어 있으나 작용성 cis 엘레멘트 ARS 및 STB를 보유하는 2㎛의 키메릭 혹은 대 결실 돌연변이 유도체는 세포분열시 모세포와 딸세포간의 분할을 효율적으로 할 수 없다. 이러한 플라스미드는 만일 이러한 작용이 트랜스로 제공되는 경우 예를 들어, 소위 [cir⁺] 숙주라고 불리우는 숙주내 작용성 2㎛ 플라스미드의 공급에 의해 역시 그러할 수 있다.

관심있는 유전자는 미리 2㎛ 플라스미드의 UL-리전내로 삽입된 바 있다. 예를 들어, EP 0 286 424의 플라스미드 pSAC3U1을 참조바란다. 그러나, US 리전과 UL 리전사이에 과도한 비대칭을 생성하지 않고 2㎛ 플라스미드의 UL-리전내로 유용하게 삽입될 수 있는 DNA의 양에는 한계가 있기 쉽다. 따라서, 2㎛ 플라스미드의 US-리전은 DNA 프레그먼트의 길이를 역위 반복의 한쪽 사이드와 동등하게 하는 경향이 있어 특히 부가적인 DNA 서열의 삽입에 매우 매력적이다.

이는 도 2에 나타낸 바와 같이, 플라스미드가 이미 이스트 선별 마커와 인접 DNA 서열의 도입에 의해 채워지는 발현 벡터용인 경우에 특히 그러하다. 예를 들어, 도 2에 나타낸 플라스미드는 β-락타마아제 유전자(앰피실린 저항성), LEU2 선별 마커 및 올리고뉴클레오타이드 링커를 포함하며, 여기서 후자 둘은 2㎛-패밀리 디스인테그레이션 벡터, pSAC3(참조 EP 0 286 424)의 UL-리전내의 유일한 SnaBI-사이트내로 삽입된다. 앰피실린 저항성 유전자를 함유하는 XbaI-사이트사이의 E. coli DNA는 이스트내로 형질변형된 후 도 2에 나타낸 바와 같은 플라스미드로부터 소실된다. 이는 Chinery & Hinchliffe, 1989, Curr . Genet., 16, 21 및 EP 0 286 424에 기술되어 있으며, 여기서 이러한 타입의 벡터는 "디스인테그레이션 벡터"로 명명된 다. 도 2에 나타낸 혼잡한 상태에서, 추가의 폴리뉴클레오타이드 삽입이 이루어질 수 있는지는 쉽게 식별되지 않는다. 링커내의 NotI-사이트는 부가적인 DNA 프레그먼트의 삽입용으로 사용되어 왔지만, 이는 UL 리전과 US 리전사이의 추가적인 비대칭에 기여한다(Sleep et al, 1991, Biotechnology(NY), 9, 183).

본 출원인은 이미 부가적인 DNA를 2㎛ 플라스미드내로 삽입하고 이의 높은 고유 플라스미드 안정성을 유지시키는 것을 시도하였다. 2㎛-패밀리 디스인테그레이션 플라스미드 pSAC300에서, URA3 유전자를 함유하는 1.1-kb DNA 프레그먼트는 URA3 유전자로부터의 전사가 REP2 전사와 같은 방향이 되는 식으로 US-리전내의 REP2와 FLP사이의 EagI-사이트내로 삽입되었다(참조 EP 0 286 424). S150-2B[cir⁰]은 pSAC300에 의해 우라실 독립영양성으로 형질변형되었으며, 이는 2㎛의 UL-리전내로 삽입된 URA3를 갖는 유사한 벡터보다 상당히 덜 안정적(30세대에서 50% 플라스미드 소실)인 것으로 나타났다(30세대에서 0-10% 플라스미드 소실)(Chinery & Hinchliffe, 1989, Curr . Genet., 16, 21; EP 0 286 424). 따라서, EagI 사이트에서의 삽입은 FLP 발현을 저해할 수 있으며, 삽입 위치는 그 결과물인 플라스미드의 안정성에 대한 깊은 영향을 미칠 수 있다는 결론이 얻어졌으며, 이는 Bijvoet et al., 1991, Yeast, 7, 347에 의해 확인된 결론이다.

2㎛-패밀리 플라스미드내로 추가 폴리뉴클레오타이드 서열을 삽입하는 것이 바람직하다. 예를 들어, 숙주 유래 단백질, 재조합 단백질, 또는 비-암호 안티센스 또는 RNA 저해(RNAi) 전사체를 암호하는 폴리뉴클레오타이드 서열의 삽입이 바람직할 수 있다. 더욱이, 2㎛-패밀리 플라스미드내로 다중의 추가 폴리뉴클레오타이드 서열을 도입하여, 이에 따라 예를 들어, 다중의 개별적으로 암호화된 다중-서브유니트 단백질, 동일한 대사 경로의 다른 멤버, 부가적인 선별 마커 또는 재조합 단백질(단일 또는 다중-서브유니트) 및 재조합 단백질의 발현을 돕는 샤프롱을 암호하는 플라스미드를 제공하는 것이 바람직하다.

그러나, 6,318-bp 2㎛ 플라스미드, 및 다른 2㎛-패밀리 플라스미드는 작용성 유전적 엘레멘트로 혼잡하게 되며(Sutton & Broach, 1985, Mol . Cell. Biol ., 5, 2770; Broach et al, 1979, Cell, 16, 827), 플라스미드 안정성에 수반된 손실없이 부가 DNA 서열의 삽입을 위해 존재하는 분명한 위치를 갖지 않는다. 실제로, 복제 오리진 및 D 유전자 로커스사이의 리전을 제외하고, 전체 2㎛ 플라스미드 게놈은 적어도 하나의 폴리(A)+ 종내로 전사되며, 종종 하나 이상의 폴리(A)+ 종내로 전사된다(Sutton & Broach, 1985, Mol . Cell. Biol ., 5, 2770). 결과적으로, 대부분의 삽입은 생체내에서 플라스미드 기능에 유해한 영향을 미칠 것으로 예측된다.

실제로, 당 기술분야의 숙련자는 2㎛-패밀리 플라스미드내로 이종성 폴리뉴클레오타이드 서열을 삽입하는 것에 대해 포기하였다.

Robinson et al, 1994, Bio/Technology, 12, 381-384는 사카로미세스 세레비지아에(Saccharomyces cerevisiae)에서 재조합 부가 PDI 유전자 복제물이 사람 혈소판 유래 성장 인자(PDGF) B 동종이량체의 재조합 발현을 10배 증가시키고 쉬조사카로미세스 폼베(Schizosacharomyces pombe) 산 포스파타아제의 발현을 4배 증가시키는데 사용될 수 있음을 보고하였다. Robinson은 부가적인 염색체 통합 PDI 유전자 복제물을 이용하여 PDGF 및 S. 폼베 산 포스파타아제의 발현이 증가되는 것을 관찰하였다. Robinson은 다중-복제 2㎛ 발현 벡터를 사용하여 PDI 단백질 수준을 증가시키려는 시도는 이종 단백질 분비에 유해한 영향을 미친다고 보고하였다.

Shusta et al, 1998, Nature Biotechnology, 16, 773-777은 사카로미세스 세레비지아에(Saccharomyces cerevisiae)에서 단일 사슬 항체 프레그먼트(scFv)의 재조합 발현을 기술하였다. Shusta는 이스트 시스템에서 숙주 염색제내로 트랜스유전자의 통합과 에피솜 발현 벡터의 사용간의 선택은 분비에 크게 영향을 줄 수 있다고 보고하였으며(Parekh & Wittrup, 1997, Biotechnol , Prog ., 13, 117-122), δ 통합 벡터를 이용한 scFv 유전자의 숙주 염색체내로의 안정한 통합은 2㎛-기초 발현 플라스미드의 사용에 비해 우수하였다. Parekh & Wittrup, op. cit.는 이미 우 췌장 트립신 저해제(BPTI)의 발현이 2㎛-기초 발현 플라스미드보다는 δ 통합 벡터를 이용하여 크기 순서로 증가 되었음을 가르친 바 있다. 2㎛-기초 발현 플라스미드는 이종성 분비 단백질의 생산에 반-생산적인 것으로 언급되었다.

Bao et al, 2000, Yeast, 16, 329-341은 KlPDI1 유전자가 다중-복제 플라스미드, pKan707상의 K. lactis내로 도입되었음을 보고하였으며, 상기 플라스미드의 존재는 상기 스트레인의 저조한 성장을 야기하였음을 보고하였다. Bao et al, 2000, Bao & Fukuhara, 2001, Gene, 272, 103-110의 초기 발견에 비추어 숙주 염색체상의 KlPDI1의 단일 복제물을 도입하는 것이 선택되었다.

따라서, 상기 기술은 숙련자에게 다중복제 벡터보다는 이스트 염색체내로 트랜스유전자를 통합하는 것을 가르치고 있다. 따라서, 이스트를 형질변형하는 다른 방법이 요구된다.

본 발명은 2㎛-패밀리 플라스미드의 재조합적으로 변형된 형태에 관한 것이다.

2㎛-패밀리 플라스미드는 환형, 이중 스트랜드 DNA 플라스미드이다. 이는 재조합적으로 삽입된 서열을 제외하고 전형적으로 3,000-10,000bp사이, 바람직하게 4,500-7,000bp와 같이 작다. 본 발명에 사용되는 바람직한 2㎛-패밀리 플라스미드는 지고사카로미세스 로욱시(Zygosaccharomyces rouxii))로부터 얻어지는 pSR1, pSB3 또는 pSB4, 지고사카로미세스 베일리(Zygosaccharomyces bailii)로부터 얻어지는 pSB1 또는 pSB2, 지고사카로미세스 퍼멘타티(Zygosaccharomyces fermentati)로부터 얻어지는 pSM1, 클루이베로미세스 드로스필라럼(Kluyveromyces drosphilarum)으로부터 얻어지는 pKD1, 피치아 멤브라나에파시엔스(Pichia membranaefaciens)로부터 얻어지는 pPM1 및 예를 들어, Volkert, et al., 1989, Microbiological Reviews, 53, 299; Painting, et al., 1984, J. Applied Bacteriology, 56, 331에 기재된 바와 같은 사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터 얻어지는 2㎛ 플라스미드 및 변이체(Scp1, Scp2 및 Scp3와 같은)를 포함한다.

2㎛-패밀리 플라스미드는 이스트군내에서의 안정한 다중복제 유지가 가능하나, 반드시 모든 2㎛-패밀리 플라스미드가 모든 타입의 이스트군내에서 다중복제 유지가 가능할 필요는 없다. 예를 들어, 2㎛-패밀리 플라스미드는 특히 사카로미세스 세레비지아에 및 사카로미세스 칼스버제네시스내에서 다중복제 유지가 가능하다.

"다중복제 유지"란 플라스미드가 각 이스트 세포내에서 다중 복제물로 존재하는 것을 의미한다. 2㎛-패밀리 플라스미드를 포함하는 이스트 세포는 [cir⁺]로 표시되며 2㎛-패밀리 플라스미드를 포함하지 않는 이스트 세포는 [cir⁰]로 표시된다. [cir⁺] 이스트 세포는 전형적으로 반수체 게놈당 20-90, 보다 전형적으로 30-80, 바람직하게 40-70, 보다 전형적으로 50-60카피와 같이 10-100카피의 2㎛-패밀리 플라스미드를 포함한다. 더욱이, 플라스미드 복제수는 반수체 게놈당 100이상으로 2㎛-유사 플라스미드의 플라스미드 복제수를 증가시킬 수 있는 숙주의 유전적 환경에 영향받을 수 있다(Gerbaud and Guerineau, 1980, Curr . Genetics, 1, 219, Holm, 1982, Cell, 29, 585, Sleep et al., 2001, Yeast, 18, 403 및 WO99/00504). 다중복제 안정성은 아래에 정의된다.

2㎛-패밀리 플라스미드는 전형적으로 다중복제 플라스미드로서 2㎛-패밀리 플라스미드의 안정한 유지에 작용하는 단백질을 각각 암호하는 적어도 3개의 오픈 리딩 프래임("ORFs")를 포함한다. 상기 3개의 ORFs에 의해 암호화된 단백질은 FLP, REP1 및 REP2로 표시될 수 있다. 2㎛-패밀리 플라스미드가 FLP, REP1 및 REP2를 암호하는 세가지 ORFs를 모두 포함하지 않는 경우에는 이러한 소실된 단백질을 암호하는 ORFs는 다른 플라스미드상에 또는 염색체 통합에 의해 트랜스로 제공되어야 한다.

"FLP" 단백질은 FLP에 의해 인지되는 역위 반복 서열간에 자리-특이 재조합을 촉진할 수 있는 단백질이다. 상기 역위 반복 서열은 FLP 재조합 표적(FRT) 사이트로 칭해지며 각각은 전형적으로 보다 큰 역위 반복의 일부로 존재한다(하기 참조). 바람직한 FLP 단백질은 예를 들어, Volkert et al, op. cit., Murray et al, op. cit 및 Painting et al, op. cit.에 기술된 바와 같은 플라스미드들, pSR1, pSB2, pSB3, pSB4, pSM1, pKD1, pPM1 및 2㎛ 플라스미드중 하나에 의해 암호화된 FLP 단백질의 서열을 포함한다. 이러한 FLP 단백질의 변이체 및 프레그먼트가 또한 본 발명에 포함된다. "프레그먼트" 및 "변이체"는 동일한 FRT 서열간의 자리-특이 재조합을 촉진하는 본래 단백질의 능력을 보유하는 것들이다. 이러한 변이체 및 프레그먼트는 일반적으로 플라스미드들, pSR1, pSB2, pSB3, pSB4, pSM1, pKD1, pPM1 및 2㎛ 플라스미드중 하나에 의해 암호화된 FLP 단백질과 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99%, 또는 그 이상의 상동성을 가질 것이다. 다른 FLP 단백질은 다른 FRT 서열 특이성을 가질 수 있다. 전형적인 FRT 사이트는 역위 반복 서열에 의해 플랭킹되는 코어 뉴클레오타이드 서열을 포함할 수 있다. 상기 2㎛ 플라스미드에서, FRT 코어 서열은 8뉴클레오타이드 길이이며 플랭킹 역위 반복 서열은 13뉴클레오타이드 길이이다(Volkert et al, op. cit.). 그러나 어느 주어진 FLP 단백질에 의해 인지되는 FRT 사이트는 2㎛ 플라스미드 FRT 사이트와 다를 수 있다.

REP1 및 REP2는 세포 분열도중 플라스미드 복제의 분할에 관여하며, 또한 FLP 발현 조절에 역할을 할 수 있다. 다른 2㎛-패밀리 플라스미드의 REP1 단백질사이에 상당한 서열 발산이 관찰되나, 이에 반해 다른 2㎛-패밀리 플라스미드로부터 유래된 REP2 단백질사이에 현재 가능한 서열 정렬은 존재하지 않는다. 바람직한 REP1 및 REP2 단백질은 예를 들어, Volkert et al, op. cit., Murray et al, op. cit 및 Painting et al, op. cit.에 기술된 바와 같은 플라스미드들, pSR1, pSB2, pSB3, pSB4, pSM1, pKD1, pPM1 및 2㎛ 플라스미드중 하나에 의해 암호화된 REP1 및 REP2 단백질의 서열을 포함한다. 이러한 REP1 및 REP2 단백질의 변이체 및 프레그먼트가 또한 본 발명에 포함된다. REP1 및 REP2의 "프레그먼트" 및 "변이체"는 본래의 ORF 대신 그 플라스미드에 의해 암호화되는 경우, 적절한 이스트군내에서 플라스미드의 안정한 다중복제 유지가 중단되지 않는 것들이다. REP1 및 REP2의 이러한 변이체 및 프레그먼트는 일반적으로 플라스미드들, pSR1, pSB2, pSB3, pSB4, pSM1, pKD1, pPM1 및 2㎛ 플라스미드중 하나에 의해 암호화된 REP1 및 REP2 단백질과 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 805, 90%, 95%, 98%, 99% 또는 그 이상의 상동성을 가질 것이다.

플라스미드상의 ORFs에 의해 암호화된 REP1 및 REP2 단백질은 양립할 수 있어야 한다. REP1 및 REP2는 플라스미드의 다른 작용 엘레멘트와 함께 사용시 이를 암호하는 플라스미드의 안정한 다중복제 유지에 기여하는 경우 양립할 수 있다. REP1 및 REP2 ORF가 이를 암호하는 플라스미드의 안정한 다중복제 유지에 기여하는지 여부는 각각의 REP1 및 REP2 ORFs가 특이적으로 붕괴되는 플라스미드의 돌연변이를 제조함으로써 검출될 수 있다. 만일 ORF의 붕괴가 플라스미드의 안정한 다중복제 유지에 기여하는 경우 그 ORF는 변이되지 않은 형태로 플라스미드의 안정한 다중복제 유지에 기여하는 것으로 결론지을 수 있다. REP1 및 REP2 단백질은 pSR1, pSB1, pSB2, pSB3, pSB4, pSM1, pKD1, pPM1 및 2㎛ 플라스미드, 또는 이들의 변이체나 프레그먼트와 같은 동일한 자연적으로 발생하는 2㎛-패밀리 플라스미드에 의해 암호화된 REP1 및 REP2 단백질의 서열을 갖는 것이 바람직하다.

2㎛-패밀리 플라스미드는 두개의 역위 반복 서열을 포함한다. 상기 역위 반복는 이들 각각이 FRT 사이트(상기 참조)를 함유하는 한 어떠한 크기일 수 있다. 상기 역위 반복는 전형적으로 고 상동성이다. 이들은 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5% 또는 그 이상의 서열 일치를 공유할 수 있다. 바람직한 구현으로 이들은 동일하다. 전형적으로 상기 역위 반복는 각각 200-1000bp 길이이다. 바람직한 역위 반복 서열은 각각 200-300bp, 300-400bp, 400-500bp, 500-600bp, 600-700bp, 700-800bp, 800-900bp, 또는 900-1000bp의 길이를 갖는 것일 수 있다. 특히 바람직한 역위 반복는 플라스미드 pSR1(959bp), pSB1(675bp), pSB2(477bp), pSB3(391bp), pSM1(352bp), pKD1(346bp), 2㎛ 플라스미드(599bp), pSB4 및 pPM1의 것이다.

상기 역위 반복의 서열은 달라질 수 있다. 그러나, 각 역위 반복에서 FRT 사이트의 서열은 암호화된 FLP 단백질이 플라스미드의 역위 반복 서열사이의 자리-특이 재조합을 촉진하도록 작용할 수 있게 플라스미드에 의해 암호화된 FLP 단백질의 특이성과 양립할 수 있어야 한다. 역위 반복 서열사이의 재조합 (및 이에 따른 FLP 단백질의 플라스미드를 통한 FRT 사이트 인지 능력)은 당 기술분야에 알려진 방법에 의해 검출될 수 있다. 예를 들어, FLP 발현에 호의적인 조건하에서 이스트 세포내에 있는 플라스미드는 플라스미드의 한 리전의 방향이 다른 플라스미드 리전에 대해 변화됨으로써 발생할 수 있는 플라스미드의 리스트릭션 프로필 변화에 대해 평가될 수 있다. 리스트릭션 프로필 변화의 검출은 FLP 단백질이 플라스미드내 FRT 사이트를 인지할 수 있으며, 따라서 각 역위 반복내 FRT 사이트는 플라스미드에 의해 암호화된 FLP 단백질의 특이성과 양립할 수 있음을 나타낸다.

특히 바람직한 구현으로, FRT 사이트를 포함하는 역위 반복의 서열은 pSR1, pSB1, pSB2, pSB3, pSB4, pSM1, pKD1, pPM1 또는 2㎛ 플라스미드와 같이 FLP 단백질을 암호하는 ORF와 동일한 2㎛-패밀리 플라스미드로부터 유래된다.

상기 역위 반복는 트랜스유전자와 같은 외생적으로 도입된 서열을 배제하고 전형적으로 (예, 2㎛ 플라스미드내에 UL 및 US와 같이 규정된 바와 같은) 역위 반복사이에 규정된 두 리전이 대략적으로 동일한 크기가 되도록 2㎛-패밀리 플라스미드내에 위치한다. 예를 들어, 두 리전중 하나는 다른 한 리전의 길이와 적어도 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 그 이상으로 최대 100%까지 동등한 길이를 가질 수 있다.

2㎛-패밀리 플라스미드는 FLP 및 하나의 역위 반복(다음 단락에 언급된 다른 역위 반복와 이를 구별하기위해 임의로 "IR1"이라 칭함)를 암호하는 ORF를 포함하며, 여기서 IR1은 예를 들어, 2㎛ 플라스미드에서 보여지는 바와 같이 어떠한 개재 암호 서열없이 FLP ORF의 원단(distal end)에 일어나는 방식으로 병렬된다. 이러한 정황에 있어서 "원단"이란 프로모터가 전사를 개시하는 말단에 반대하는 FLP ORF의 말단을 의미한다. 바람직한 구현으로, FLP ORF의 원단은 IR1과 겹쳐진다.

2㎛-패밀리 플라스미드는 REP2 및 다른 역위 반복(이전 단락에 언급된 IR1과 이를 구별하기위해 임의로 "IR2"라 칭함)를 암호하는 ORF를 포함하며, 여기서 IR2는 예를 들어, 2㎛ 플라스미드에서 보여지는 바와 같이 어떠한 개재 암호 서열없이 REP2 ORF의 원단에 일어나는 방식으로 병렬된다. 이러한 정황에 있어서 "원단"이란 프로모터가 전사를 개시하는 말단에 반대하는 REP2 ORF의 말단을 의미한다.

일 구현으로, REP2 및 FLP를 암호하는 ORFs는 2㎛-패밀리 플라스미드의 역위 반복사이에 규정된 두 리전의 동일한 리전상에 존재할 수 있으며, (만일 두 리전간에 크기가 같지않을 경우) 그 리전은 보다 크거나 작은 리전일 수 있다.

일 구현으로, REP2 및 FLP를 암호하는 ORFs는 발산성 프로모터로부터 전사될 수 있다.

전형적으로, 2㎛-패밀리 플라스미드의 역위 반복(예, 2㎛ 플라스미내에 UL 및 US로 규정된 바와 같이)사이에 규정된 리전은 다중복제 플라스미드로서 2㎛-패밀리 플라스미드의 안정한 유지시 작용하는 단백질을 암호하는 많아야 두개의 내생성 유전자를 포함한다. 따라서 바람직한 구현으로, 역위 반복사이에 규정된 플라스미드의 한 리전은 내생성 암호 서열로서 기껏해야 FLP 및 REP2; FLP 및 REP1; 또는 REP1 및 REP2를 암호하는 ORFs를 포함할 수 있다.

2㎛-패밀리 플라스미드는 전형적으로 양방향성인 복제 오리진(자가 복제 서열 - "ARS"라고도 알려짐)을 포함한다. 전형적인 이스트 염색체 복제 오리진의 일치 서열이 적합할 수 있다(Broach et al, 1982, Cold Spring Harbor Symp . Quant . Biol. 47, 1165-1174; Williamson, Yeast, 1985, 1, 1-14). 바람직한 ARSs는 pSR1, pSB1, pSB3, pSB4, pSM1, pKD1, pPM1 및 2㎛ 플라스미드로부터 분리된 것을 포함한다.

따라서, 2㎛-패밀리 플라스미드는 전형적으로 적어도 FLP 및 REP2를 암호하는 ORFs 및 각각 FLP 단백질과 양립가능한 FRT 사이트 및 ARS 서열을 포함하는 두개의 역위 반복 서열을 포함한다. 바람직하게 상기 플라스미드는 또한 REP1을 암호하는 ORF를 포함하나 이는 상기한 바와 같이 트랜스로 제공될 수 있다. 바람직하게 상기 FRT 사이트는 암호화된 FLP 단백질의 서열과 동일한 2㎛-패밀리 플라스미드로부터 유도된다. 바람직하게 암호화 REP1 및 REP2 단백질의 서열은 서로 동일한 2㎛-패밀리 플라스미드로부터 유도된다. 보다 바람직하게, 상기 FRT 사이트는 암호화 FLP, REP1 및 REP2 단백질의 서열과 동일한 2㎛-패밀리 플라스미드로부터 유도된다. 보다 바람직하게, FLP, REP1 및 REP2를 암호하는 ORFs의 서열 및 역위 반복의 서열(FRT 사이트 포함)은 동일한 2㎛-패밀리 플라스미드로부터 유도된다. 보다 바람직하게, ARS 사이트는 FLP, REP1 및 REP중 하나 또는 그 이상의 ORFs 및 역위 반복의 서열(FRT 사이트 포함)과 동일한 2㎛-패밀리 플라스미드로부터 획득된다. 바람직한 플라스미드는 지고사카로미세스 로욱시(Zygosaccharomyces rouxii)로부터 얻어지는 플라스미드 pSR1, pSB3 및 pSB4, 지고사카로미세스 베일리(Zygosaccharomyces bailli)로부터 얻어지는 pSB1 또는 pSB2, 지고사카로미세스 퍼멘타티(Zygosaccharomyces fermentati)로부터 얻어지는 pSM1, 클루이베로미세스 드로스필라럼(Kluyveromyces drosphilarum)으로부터 얻어지는 pKD1, 피치아 멤브라나에파시엔스(Pichia membranaefaciens)로부터 얻어지는 pPM1, 및 예를 들어, Volkert, et al., 1989, op. cit., Murray et al, op. cit. 및 Painting et al, op. cit.에 기재된 바와 같은 사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터 얻어지는 2㎛ 플라스미드를 포함한다.

임의로, 2㎛-패밀리 플라스미드는 Volkert et al, op. cit.에 정의된 바와 같이 2㎛ 플라스미드의 STB 리전(REP3로도 알려짐)과 동등한 리전을 포함할 수 있다. 본 발명의 2㎛-패밀리 플라스미드에서 STB 리전은 3, 4, 5 또는 그 이상과 같은 둘 또는 그 이상의 직렬 반복 서열을 포함할 수 있다. 택일적으로, 직렬 반복 서열이 존재하지 않을 수 있다. 상기 직렬 반복은 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 bp 또는 그 이상의 길이와 같이 어떠한 길이일 수 있다. 직렬 반복의 서열이 동일할 필요는 없다. 약간의 서열 변화가 허용될 수 있다. REP1 및 REP2 ORFs의 하나 또는 두가지 모두와 동일한 플라스미드로부터 STB 리전을 선택하는 것이 바람직할 수 있다. STB 리전은 시스-작용 요소인 것으로 여겨지며 바람직하게 전사되지 않는다.

임의로, 2㎛-패밀리 플라스미드는 다중복제 플라스미드로서 2㎛-패밀리 플라스미드의 안정한 유지시 작용하는 단백질을 암호하는 부가적인 ORF를 포함할 수 있다. 상기 부가적인 단백질은 RAF 또는 D로 표시될 수 있다. RAF 또는 D 유전자를 암호하는 ORFs는 예를 들어, 2㎛ 플라스미드 및 pSM1상에 나타날 수 있다. 따라서 RAF 또는 D ORF는 2㎛ 플라스미드 또는 pSM1에 의해 암호화된 RAF 또는 D 유전자 ORFs의 단백질 산물을 암호하기에 적절한 서열, 또는 그 변이체 및 프레그먼트을 포함할 수 있다. 따라서 2㎛ 플라스미드 또는 pSM1의 RAF 또는 D 유전자의 단백질 산물의 변이체 및 프레그먼트가 또한 본 발명에 포함된다. 2㎛ 플라스미드 또는 pSM1의 RAF 또는 D 유전자의 단백질 산물의 "프레그먼트" 및 "변이체"는 본래의 ORF 대신에 2㎛ 플라스미드 또는 pSM1에 의해 암호화되는 경우 적절한 이스트군내에서 플라스미드의 적절한 다중복제 유지를 붕괴시키지 않는 것들이다. 이러한 변이체 및 프레그먼트는 일반적으로 상기 2㎛ 플라스미드 또는 pSM1에 의해 암호화된 RAF 또는 D 유전자 ORFs의 단백질 산물과 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99% 또는 그 이상의 상동성을 갖는다.

본 발명은 REP2 유전자 또는 FLP 유전자중 적어도 하나의 마지막 작용 코돈이후의 첫번째 염기와 상기 유전자에 인접한 역위 반복내의 FRT 사이트이전의 마지막 염기사이에서의 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 포함하는 2㎛-패밀리 플라스미드를 제공한다.

폴리뉴클레오타이드 서열 삽입은 플라스미드내로 삽입되는 어느 부가적인 폴리뉴클레오타이드 서열이다. 바람직한 폴리뉴클레오타이드 서열 삽입이 하기에 기술된다. 결실은 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 또는 그 이상의 염기쌍에 이르는 제거와 같이 하나 또는 그 이상의 염기쌍의 제거이며, 이는 단일 인접 서열이거나 DNA 서열내에 리전으로부터 떨어진 것일 수 있다. 치환은 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 또는 그 이상의 염기쌍에 이르는 대체와 같이 하나 또는 그 이상의 염기쌍의 대체이며, 이는 단일 인접 서열이거나 DNA 서열내에 리전으로부터 떨어진 것일 수 있다. 리전은 삽입, 결실 또는 치환중 어느 둘, 또는 세가지 모두에 의해 변형될 수 있다.

REP2 유전자 또는 FLP 유전자중 마지막 작용 코돈은 그 유전자의 프로모터로부터 가장 먼 하위에 있는 유전자의 오픈 리딩 프래임내에 있는 코돈이며, 이의 정지 코돈으로의 대체는 Chinery & Hinchliffe(1989, Curr. Genet., 16, 21-25)에 정의된 바와 같은 시험에 의해 측정되는 경우 플라스미드의 다중복제 안정성의 수용불가능한 손실을 초래할 것이다. 예를 들어, 접종 또는 계대배양 기간에 변형을 도입함으로써 원하는 수의 세대에 걸쳐 지수적 로그 성장을 유지하기위해 Chinery & Hinchliffe에 의해 정의된 시험을 변형하는 것이 적절할 수 있다. 이는 Chinery & Hinchliffe에 의해 사용된 분석 및 에스. 세레비지아에 S150-2B하에서 숙주 스트레인간의 차이를 평가하고 그리고/또는 어세이하에서 플라스미드(들)의 개별적 특성에 대한 시험을 최적화하는데 도움이 될 수 있으며, 이는 2㎛-유사 플라스미드의 소 US-리전내에서 삽입 사이트, 그리고/또는 2㎛-유사 플라스미드내 삽입 서열의 크기 및 특성과 같이 2㎛-유사 플라스미드내에서의 다른 차이점들 및/또는 2㎛-유사 플라스미드내 어딘가의 삽입을 확인함으로써 검출될 수 있다. Chinery & Hinchliffe(1989, Curr. Genet., 16, 21-25)에 정의된 비-선별 배지에서 성장하지 않는 이스트에 있어서 다른 적절한 비-선별 배지가 사용될 수 있다. 적절한 택일적인 비-선별 배지는 전형적으로 원하는 수의 세대에 걸쳐 지수적 로그 성장을 허용한다. 예를 들어, 수크로즈 또는 글루코즈가 택일적인 탄소 공급원으로 사용될 수 있다. 플라스미드 안정성은 규정된 수의 세대이후에 선별가능한 마커에 대해 독립 영양성을 유지하는 퍼센트 세포로 정의될 수 있다. 세대수는 바람직하게 pSAC35 또는 pSAC310과 같은 대조 플라스미드간의 차이를 나타내기에 충분할 것이며 혹은 이러한 대조 플라스미드에 유사한 안정성을 나타내기에 충분할 것이다. 세대수는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 또는 그 이상일 수 있다. 보다 높은 수가 바람직하다. 수용가능한 플라스미드 안정성은 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.9% 또는 실질적으로 100%일 수 있다. 보다 높은 퍼센트가 바람직하다. 플라스미드가 비-선별 배지상에서 성장시 100%보다 작은 안정성을 가질 수 있으나 그러한 플라스미드는 여전히 선별 배지에서 배양시 사용될 수 있다는 것을 숙련자는 인식할 것이다. 예를 들어, 실시예에 기술된 플라스미드 pDB2711은 실시예 1에 따라 안정성 측정시 단지 10% 안정성을 나타내지만 선별 성장 조건하에서 쉐이크 플라스크 배양시 재조합 트랜스페린 생산성이 15배 증가한다.

따라서, 폴리뉴클레오타이드 서열 삽입, 결실 또는 치환을 도입함으로써 어느 유전자에서 마지막 작용 코돈의 어느 포인트 하위에서의 REP2 또는 FLP 유전자의 붕괴는 플라스미드의 다중복제 안정성의 수용불가능한 손실을 초래하지 않을 것이다. 본 발명자들은 각각 플라스미드의 다중복제 안정성의 수용불가능한 손실을 초래하지않고, 2㎛ 플라스미드의 REP2 유전자가 코돈 59이후에 붕괴될 수 있으며 2㎛ 플라스미드의 FLP 유전자가 코돈 344이후에 붕괴될 수 있음을 예기치 않게 발견하였다. 다른 2㎛-패밀리 플라스미드에서 동등한 유전자내의 마지막 작용 코돈은 상기한 바와 같이 관련 유전자의 변형 및 안정성 측정에 의해 통상적으로 검출될 수 있다. 전형적으로, 따라서, 본 발명의 변형된 플라스미드는 그 변형이 플라스미드의 다중복제 안정성의 수용불가능한 손실을 초래하지 않는 점에서 안정하다.

본 발명의 2㎛ 플라스미드내에 REP2 및 FLP 유전자는 각각 이들에 인접한 역위 반복를 갖는다. 상기 역위 반복는 동일한 플라스미드내의 다른 역위 반복의 서열과 (역변환되는 경우) 매치되기 때문에 확인가능하다. "인접한"이란 FLP 또는 REP2 유전자 및 이의 역위 반복가 예를 들어, 2㎛ 플라스미드에서 보여지는 바와 같이 어느 개재 암호 서열없이 상기 유전자의 원단(distal end)에 일어나는 방식으로 병렬되는 것을 의미한다. 이러한 정황에 있어서 "원단"이란 프로모터가 전사를 개시하는 말단에 반대하는 상기 유전자의 말단을 의미한다. 바람직한 구현으로, 상기 유전자의 원단은 역위 반복와 겹쳐진다.

본 발명의 제1 바람직한 견지로, 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 REP2 유전자의 마지막 작용 코돈이후의 첫번째 염기와 상기 유전자에 인접한 역위 반복내의 FRT 사이트이전의 마지막 염기사이에서 일어나며, 바람직하게 역위 반복의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이에, 보다 바람직하게 REP2 유전자의 번역 종결 코돈이후와 FRT 사이트이전의 마지막 염기이전의 포지션에서 일어난다.

이러한 정황에 있어서 상기 용어 "사이"는 규정된 외측 한계를 포함하며, 따라서 예를 들어, "REP2 유전자의 마지막 작용 코돈이후의 첫번째 염기와 상기 유전자에 인접한 역위 반복내의 FRT 사이트이전의 마지막 염기사이"의 삽입, 결실 및/또는 치환은 REP2 유전자의 마지막 작용코돈이후의 첫번째 염기에서의 삽입, 결실 및/또는 치환 및 FRT 사이트이전의 마지막 염기에서의 삽입, 결실 및/또는 치환을 포함한다.

본 발명의 제2 바람직한 견지로, 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 FLP 유전자의 마지막 작용 코돈이후의 첫번째 염기와 상기 유전자에 인접한 역위 반복내 FRT 사이트이전의 마지막 염기사이에 일어나며, 바람직하게 역위 반복의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이에 일어나며, 보다 바람직하게 FLP 암호 서열의 말단이후의 첫번째 염기에서와 같은 FLP 암호 서열의 말단이후의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이에 일어난다. 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 FLP의 말단이후의 마지막 염기와 역위 반복내 FspI-사이트에서 일어날 수 있으나, 임의로 FspI-사이트내에서는 일어나지 않을 수 있다.

일 구현으로, 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 FLP 유전자 및/또는 REP2 유전자는 자연적으로 일어나는 2㎛-패밀리 플라스미드로부터 각각 유래된 FLP 유전자 및/또는 REP2 유전자의 서열을 갖는다.

상기 용어 "로부터 유래된"이란 이들이 유래된 서열과 동일한 서열을 갖는 서열을 포함한다. 그러나, 상기 정의한 바와 같이 이들의 변이체 및 프레그먼트가 또한 포함된다. 예를 들어, 2㎛ 플라스미드의 FLP 유전자로부터 유래된 서열을 갖는 FLP 유전자는 자연적으로 발생하는 유전자와 비교하여 변형된 프로모터 또는 다른 조절 서열을 가질 수 있다. 택일적으로, 2㎛ 플라스미드의 FLP 유전자로부터 유래된 서열을 갖는 FLP 유전자는 자연적으로 발생하는 유전자와 동일한 단백질을 암호하거나 또는 변형된 FLP 단백질을 암호하는 오픈 리딩 프래임내에 변형된 뉴클레오타이드 서열을 가질 수 있다. 특정 공급원으로부터 유래된 서열을 갖는 REP2 유전자에 대해서 동일한 고려가 적용된다.

자연적으로 발생하는 2㎛-패밀리 플라스미드는 2㎛-패밀리 플라스미드에 대해 필수적인 특징으로 상기 정의된 특징을 갖는 어느 플라스미드이며, 이러한 플라스미드는 이스트에서 자연적으로 존재하는 것으로 발견되는 것으로, 즉 이종 서열을 포함하는 것으로 재조합적으로 변형되지 않은 것이다. 바람직하게 자연적으로 발생하는 2㎛-패밀리 플라스미드는 pSR1(등록번호 X02398), pSB3(등록번호 X02608) 또는 지고사카로미세스 로욱시(Zygosaccharomyces rouxii)로부터 얻어지는 플라스미드 pSB4, 지고사카로미세스 베일리(Zygosaccharomyces bailli)로부터 얻어지는 pSB1 또는 pSB2(등록번호 NC_002055 또는 M18274), 지고사카로미세스 퍼멘타티(Zygosaccharomyces fermentati)로부터 얻어지는 pSM1(등록번호 NC_002054), 클루이베로미세스 드로스필라럼(Kluyveromyces drosphilarum)으로부터 얻어지는 pKD1(등록번호 X03961), 피치아 멤브라나에파시엔스(Pichia membranaefaciens)로부터 얻어지는 pPM1으로부터 선택되거나, 혹은 가장 바람직하게 사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터 얻어지는 2㎛ 플라스미드(등록번호 NC_001398 또는 J01347)이다. 등록번호는 NCBI의 기탁번호를 칭한다.

바람직하게, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 FLP 및/또는 REP2 유전자에 인접한 역위 반복의 서열은 상기 유전자가 유래되는 서열과 동일한 자연 발생 2㎛-패밀리 플라스미드내의 이에 상응하는 역위 반복의 서열로부터 유래된다. 따라서, 예를 들어, 만일 FLP 유전자가 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드로부터 유래되는 경우, FLP 유전자에 인접한 역위 반복는 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드내의 FLP 유전자에 인접한 역위 반복로부터 유래된 서열을 갖는 것이 바람직하다. 만일 REP2 유전자가 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드로부터 유래되는 경우, REP2 유전자에 인접한 역위 반복는 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드내의 REP2 유전자에 인접한 역위 반복로부터 유래된 서열을 갖는 것이 바람직하다.

본 발명의 제1 바람직한 견지에서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 REP2 유전자 및 역위 반복 서열이 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드의 이에 상응하는 리전으로부터 유래된 서열을 갖는 경우, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 REP 유전자의 코돈 59의 첫번째 염기와 인접 역위 반복내 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나는 것이 바람직하며, 보다 바람직하게 역위 반복의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나며, 보다 바람직하게는 REP2 암호 서열의 마직막이후의 첫번째 염기에서와 같이 REP2 유전자의 번역 종결 코돈이후와 FRT 사이트이전의 마지막 염기이전의 포지션에서 일어난다.

상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 REP2 유전자 및 역위 반복 서열이 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드의 이에 상응하는 리전으로부터 유래된 서열을 갖는 경우, 일 구현으로 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에 상기 REP2 유전자 및 그 인접 역위 반복의 서열은 SEQ ID NO:1 또는 이의 변이체로 정의된 바와 같다. SEQ ID NO:1에서, REP2 유전자의 코돈 59의 첫번째 염기는 염기 번호 175로 표시되며 FRT 사이트이전의 마지막 염기는 염기 번호 1216으로 표시된다. 여기에 주어진 FRT 서열은 Sadowski et al, 1986, pp7-10, Mechanisms of Yeast Recombination(Current Communications in Molecular Biology) CSHL. Ed. Klar, A. Strathern, J. N.의 55-염기-쌍이다. SEQ ID NO:1에서, 역위 반복의 첫번째 염기는 염기 번호 887로 표시되며 REP2 유전자의 번역 종결 코돈은 염기 번호 892로 표시된다.

본 발명의 보다 바람직한 구현으로, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 REP2 유전자 및 역위 반복 서열이 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드의 이에 상응하는 리전으로부터 유래된 서열을 가지며, 저해의 부재하에서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 역위 반복내에 XcmI 사이트 또는 FspI 사이트를 포함하며 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 XcmI 사이트 또는 FspI 사이트에서 일어난다. SEQ ID NO:1에서, XcmI 사이트는 염기 번호 935-949로 표시되며 FspI 사이트는 염기 번호 1172-1177로 표시된다.

본 발명의 제2 바람직한 견지에서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 FLP 유전자 및 역위 반복 서열이 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드의 이에 상응하는 리전으로부터 유래된 서열을 갖는 경우, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 FLP 유전자의 코돈 344의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나는 것이 바람직하며, 보다 바람직하게 역위 반복의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나며, 보다 바람직하게는 FLP 암호 서열의 마직막이후의 첫번째 염기에서와 같이 FLP 암호 서열의 마지막이후의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어난다.

상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 FLP 유전자 및 역위 반복 서열이 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드의 이에 상응하는 리전으로부터 유래된 서열을 갖는 경우, 일 구현으로 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에 상기 FLP 유전자 및 상기 FLP 유전자에 후속하는 역위 반복의 서열은 SEQ ID NO:2 또는 이의 변이체로 정의된 바와 같다. SEQ ID NO:2에서, FLP 유전자의 코돈 344의 첫번째 염기는 염기 번호 1030으로 표시되며 FRT 사이트이전의 마지막 염기는 염기 번호 1419로 표시되며, 상기 역위 반복의 첫번째 염기는 염기 번호 1090으로 표시되며, 그리고 FLP 암호 서열의 마지막이후의 첫번째 염기는 염기 번호 1273으로 표시된다.

본 발명의 보다 바람직한 구현으로, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 FLP 유전자 및 인접 역위 반복 서열이 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드의 이에 상응하는 리전으로부터 유래된 서열을 가지며, 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환의 부재하에서, 역위 반복내에 HgaI 사이트 또는 FspI 사이트를 포함하며 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 HgaI 사이트상의 HgaI의 작용(HgaI은 이를 인지하는 5bp 서열을 절단함)에 의해 형성되는 컷에서 혹은 FspI에서 일어난다. SEQ ID NO:2에서, HgaI 사이트는 염기 번호 1262-1266으로 표시되며 FspI 사이트는 염기 번호 1375-1380으로 표시된다.

숙련자는 본 발명의 제1 및 제2 바람직한 견지에 의해 정의된 플라스미드의 특징이 상호 배타적이지 않음을 인식할 것이다. 따라서, 본 발명의 제3 바람직한 견지에 따른 플라스미드는 REP2 유전자 및 FLP 유전자 모두의 마지막 작용 코돈이후의 첫번째 염기와 상기 각 유전자에 인접한 역위 반복내 FRT 사이트이전의 마지막 염기사이의 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 포함할 수 있으며, 여기서 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 동일하거나 다를 수 있다. 예를 들어, 본 발명의 제3 견지에 따른 플라스미드는 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에 SEQ ID NO:1의 서열 또는 이의 변이체 및 SEQ ID NO:2의 서열 또는 이의 변이체를 포함할 수 있으며, 각각은 본 발명의 제1 및 제2 바람직한 견지에 대해 상기 언급한 바와 같은 포지션에서 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 각각 포함한다.

숙련자는 본 발명의 제1, 제2 및 제3 바람직한 견지의 특징이 또한 다른 서열 변형을 갖는 플라스미드의 가능성을 배제하지 않음을 인식할 것이다. 따라서, 예를 들어, 본 발명의 제1, 제2 및 제3 바람직한 견지의 2㎛-패밀리 플라스미드는 상기 정의된 바와 같은 포지션에 존재하지 않는 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 부가적으로 포함할 수 있다. 따라서, 상기 플라스미드는 본 발명의 삽입 사이트이외의 사이트에서 트랜스유전자를 부가적으로 운반할 수 있다.

2㎛ 플라스미드내에 택일적인 삽입 사이트는 당해 기술분야에 알려져 있으나 본 발명에 의해 정의된 삽입 사이트를 이용하는 경우의 유리함을 제공하지는 않는다. 그럼 에도 불구하고, 당해 기술분야에 알려진 사이트에서의 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 이미 포함하는 플라스미드는 본 발명의 제1, 제2 및 제3 바람직한 견지에 의해 정의된 하나 또는 그 이상의 사이트에서의 하나 또는 그 이상의 추가 변형을 제조함으로써 추가 변형될 수 있다. 숙련자는 본 출원서의 도입부에 언급된 바와 같이 본 발명의 제1 및 제2 견지에 의해 정의된 것 이외에 2㎛-패밀리 플라스미드의 사이트에서 트랜스유전자의 삽입시 걸리는 상당한 기술적 한계가 존재함을 인식할 것이다.

당해 기술분야에 알려진 전형적인 변형 2㎛ 플라스미드는 FLP내 EcoRI에 삽입시 이용되는 플라스미드 pCV19, pCV20, CV_neo, 삽입 사이트로서 D에서 EcoRI를 이용하는 플라스미드 pCV21, pGT41 및 pYE, 삽입 사이트로서 D에서 PstI을 이용하는 플라스미드 pHKB52, D에서 PstI 및 D에서 EcoRI을 이용하는 플라스미드 pJDB248, D에서 PstI 및 FLP에서 EcoRI을 삽입 사이트로 이용하는 플라스미드 pJDB219, FLP에서 ClaI을 삽입 사이트로 이용하는 플라스미드 pAB18, 삽입 사이트로서 D에서 PstI을 이용하는 플라스미드 pYT11, pYT14 및 pYT11-LEU, 및 삽입 사이트로서 FLP에서 EcoRI을 이용하는 플라스미드 PTY39와 같이 Rose & Broach(1990, Methods Enzymol ., 185, 234-279)에 기재된 것들을 포함한다. 다른 2㎛ 플라스미드는 pSAC3, pSAC3U1, pSAC3U2, pSAC300, pSAC310, pSAC3C1, pSAC3PL1, pSAC3SL4, 및 pSAC3SC1을 포함하며, 이들은 EP 0 286 424 및 Chinery & Hinchliffe(1989, Curr. Genet., 16, 21-25)에 기재되어 있으며, 적절한 2㎛ 삽입 사이트로서 PstI, EagI 또는 SnaBI으로 기재되어 있다. 또한 2㎛ 플라스미드는 pAYE255, pAYE316, pAYE443, pAYE522(Kerry-Williams et al, 1998, Yeast, 14, 161-169), pDB2244(WO00/44772) 및 pAYE329(Sleep et al, 2001, Yeast, 18, 403-421)를 포함한다.

일 바람직한 구현으로, 본 발명의 제1, 제2 및 제3 바람직한 견지에 의해 정의된 바와 같은 2㎛-유사 플라스미드는 ARS 서열주위의 전사되지 않은 리전내에서 일어나는 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 부가적으로 포함할 수 있다. 예를 들어, 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드에서, ARS 서열주위의 전사되지않은 리전은 ARS 서열에서 시작하여 D 유전자의 말단으로 연장된다. SnaBI내로의(복제 서열 ARS의 오리진 부근) 삽입은 Chinery & Hinchliffe, 1989, Curr . Genet., 16, 21-25에 기재되어 있다. 숙련자는 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 또한 Chinery & Hinchliffe에 의해 기술된 SnaBI 사이트에 이웃하는 포지션에서 전사되지 않은 리전내에서 일어날 수 있을 것으로 인식할 것이다.

본 발명의 제1, 제2 및 제3 견지중 어느 하나에 따른 플라스미드는 사카로미세스 세레비지아에(Saccharomyces cerevisiae), 사카로미세스 칼스버제네시스(Saccharomyces. carlsbergenesis), 클루이베로미세스 락티스(Kluyveromyces lactis), 피치아 파스트로리스(Pichia pastroris) 및 피치아 멤브라나에파시엔스(Pichia membranaefaciens), 지고사카로미세스 칼스버제네시스(ZygoSaccharomyces rouxii ), 지고사카로미세스 베일리( Zygosaccharomyces bailii), 지고사카로미세스 퍼멘타티( Zygosaccharomyces fermentati ), 또는 클루이베로미세스 드로스필라럼(Kluyveromyces drosphilarum)과 같은 사카로미세스(Saccharomyces), 클루이베로미세스(Kluyveromyces), 지고사카로미세스(Zygosaccharomyces), 또는 피치아(Pichia) 속의 멤버와 같이, 이스트에서 자가 복제가 가능한 플라스미드일 수 있다. 에스. 세레비지아에 및 에스. 칼스버제네시스는 모두 공지된 2㎛ 플라스미드의 자가 복제에 적절한 숙주 세포를 제공하는 것으로 여겨진다.

바람직한 구현으로, 본 발명의 2㎛-패밀리 플라스미드내에 포함되는 상기 또는 적어도 하나의 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 폴리뉴클레오타이드 서열 삽입니다. 플라스미드의 안정성에 수용불가능하게 유해하지 않는 한 어느 폴리뉴클레오타이드 서열 삽입이 이용될 수 있으며, 이는 상기 플라스미드가 변형되지 않은 플라스미드(100%의 안정성으로 지정됨)와 비교시 YEPD 배지와 같은 비-선별 배지에서 적어도 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.9% 또는 실질적으로 100% 안정한 것을 의미한다. 바람직하게, 상기 언급된 안정성 수준은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 또는 그 이상의 세대에 대해 배지에서 변형된 플라스미드 및 변형되지 않은 플라스미드를 포함하는 이스트 세포를 선별적으로 배양한 후 나타난다.

상기 플라스미드가 선별가능한 마커를 포함하는 경우, 배지는 숙주에 상기 플라스미드를 보유하려는 선별 압력을 줄 수 있기 때문에 형질변형체가 선별 조건하에서 성장되는 경우(예, 최소 배지에서) 보다 높은 수준의 안정성이 획득될 수 있다.

비-선별 및 선별(예, 최소)배지에서의 안정성은 상기 언급한 방법을 이용하여 검출될 수 있다. 선별 배지에서 안정성은 플라스미드가 이스트를 독립영양성으로 형질변형시키는데 사용될 수 있다는 관찰에 의해 입증될 수 있다.

전형적으로, 상기 폴리뉴클레오타이드 서열 삽입은 적어도 4, 6, 8, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500 또는 그 이상의 염기쌍 길이가 될 것이다. 일반적으로, 상기 폴리뉴클레오타이드 서열 삽입은 1kb, 2kb, 3kb, 4kb, 5kb, 6kb, 7kb, 8kb, 9kb, 10kb 또는 그 이상의 길이일 것이다. 숙련자는 본 발명의 2㎛ 플라스미드가 플라스미드내에 다른 사이트에서 다중 폴리뉴클레오타이드 서열 삽입을 포함할 수 있음을 인식할 것이다. 전형적으로, 폴리뉴클레오타이드 서열 삽입의 총 길이는 5kb, 10kb, 15kb, 20kb, 25kb 또는 30kb이하이나 보다 높은 총 길이가 가능하다.

상기 폴리뉴클레오타이드 서열은 새로운 제한 사이트를 도입하기위해 사용되는 링커 서열이거나 아닐 수 있다. 예를 들어, 합성 링커가 추가 제한 사이트(예, BamHI)을 도입하기위한 것과 같이 FLP 유전자이후의 FspI 사이트에 도입되거나 도입되지 않을 수 있다.

상기 폴리뉴클레오타이드 서열 삽입은 전사 리전을 함유할 수 있으며 또는 비 전사 리전을 함유할 수 있다. 전사 리전은 오픈 리딩 프래임을 암호하거나 또는 비-암호 리전일 수 있다. 상기 폴리뉴클레오타이드 서열 삽입은 전사 및 비 전사 리전 모두를 함유할 수 있다.

전사 리전은 RNA 폴리머라아제, 전형적으로 이스트 RNA 폴리머라아제에 의해 전사될 수 있는 DNA 리전이다. 전사 리전은 리보좀 또는 트랜스퍼 RNA와 같은 작용 RNA 분자 또는 또는 안티센스 또는 RNA 저해("RNAi") 분자와 같이 작용할 수 있는 RNA 분자를 암호할 수 있다. 택일적으로 전사 리전은 생체내에서 번역되어 단백질을 생산할 수 있는 오픈 리딩 프래임(ORF)을 함유할 수 있는 메신저 RNA 분자(mRNA)를 암호할 수 있다. 본 명세서에 사용된 용어 "단백질"은 모든 천연 및 비-천연 단백질, 폴리펩타이드 및 펩타이드를 포함한다. 바람직하게, 상기 ORF는 이종 단백질을 암호한다. "이종 단백질"이란 2㎛-패밀리 플라스미드에 의해 자연적으로 암호화되지 않는 단백질을 의미한다(즉, "비-2㎛-패밀리 플라스미드 단백질"). 편의상 용어 "이종 단백질" 및 "비-2㎛-패밀리 플라스미드 단백질"은 본 출원서에 걸쳐 동일한 의미로 사용된다. 따라서, 바람직하게 상기 이종 단백질은 Z. 로욱시로부터 얻어지는 pSR1, pSB3 또는 pSB4, 모두 Z. 베일리로부터 얻어지는 pSB1 또는 pSB2, Z. 퍼멘타티로부터 얻어지는 pSM1, K. 드로소필라럼으로부터 얻어지는 pKD1, P. 멤브라나에파시엔스로부터 얻어지는 pPM1 및 에스. 세레비지아에로부터 얻어지는 2㎛ 플라스미드중 어느 하나에 의해 암호화된 FLP, REP1, REP2, 또는 RAF/D 단백질이 아니다.

상기 폴리뉴클레오타이드 서열 삽입은 오픈 리딩 프래임을 암호하는 경우 오픈 리딩 프래임을 암호하지 않는 일부 폴리뉴클레오타이드 서열("비암호 리전"으로 불리움)을 부가적으로 포함할 수 있다.

폴리뉴클레오타이드 서열 삽입내의 비암호 리전은 오픈 리딩 프래임에 작동적으로 연결되어 오픈 리딩 프래임의 전사 및 그 결과물인 전사체의 번역을 가능케 하는 하나 또는 그 이상의 조절 서열을 함유할 수 있다.

용어 "조절 서열"은 작동적으로 연결된 오픈 리딩 프래임의 발현(즉, 전사 및/또는 번역)을 조절(즉, 촉진 혹은 감소)하는 서열을 칭한다. 조절 리전은 전형적으로 프로모터, 터미네이터, 리보좀 바인딩 사이트 등을 포함한다. 숙련자는 조절 리전의 선택이 의도된 발현 시스템에 따라 달라질 것임을 인식할 것이다. 예를 들어, 프로모터는 구성적이거나 유도성일 수 있으며 세포- 또는 조직-타입 특이적 또는 비특이적일 수 있다.

발현 시스템이 사카로미세스 세레비지아에(Saccharomyces cerevisiae)와 같은 이스트인 경우, 에스. 세레비지아에에 대한 적절한 프로모터는 PGK1 유전자, GAL1 또는 GAL10 유전자, TEF1 , TEF2 , PYK1 , PMA1 , CYC1 , PHO5 , TRP1 , ADH1 , ADH2 , 글리세르알데히드-3-포스페이트 디하이드로게나아제, 헥소키나아제, 피루베이트 디카르복실라아제, 포스포프룩토키나아제, 트리오즈 포스페이트 이소머라아제, 포스포글루코즈 이소머라아제, 글루코키나아제, α-메이팅 팩터 페로몬, PRB1 프로모터, PRA1 프로모터, GPD1 프로모터, 및 5'조절 리전부와 다른 프로모터의 5'조절 리전부 또는 상위 작용 사이트의 하이브리드를 포함하는 하이브리드 프로모터(예, EP-A-258 067의 프로모터)와 관련된 것들을 포함한다.

적절한 전사 종결 신호는 당 기술분야에 잘 알려져 있다. 숙주 세포가 진핵성인 경우, 전사 종결 신호는 바람직하게 전사 종결 및 폴리아데닐화에 적절한 신호를 갖는 진핵 유전자의 3' 측면 서열로부터 유래된다. 적절한 3' 측면 서열은 예를 들어 사용된 발현 조절 서열에 자연적으로 연결된 유전자의 것일 수 있는 것으로, 즉 프로모터에 상응할 수 있다. 택일적으로, 이들은 다를 수 있다. 이러한 경우 숙주가 이스트, 바람직하게 에스. 세레비지아에인 경우에 에스. 세레비지아에 ADH1, ADH2 , CYC1 또는 PGK1 유전자의 종결 신호가 바람직하다.

2㎛ 유전자와 같은 이웃하는 유전자내로의 전사 통독을 억제하기위해 전사 종결 서열이 프로모터 및 오픈 리딩 프래임의 상위 및 하위 모두에 위치하도록 샤프롱 PDI1의 프로모터 및 오픈 리딩 프래임과 같이 이종성 유전자의 프로모터 및 오픈 리딩 프래임이 전사 종결 서열에 의해 플랭킹되는 것이 유익할 수 있으며 그 반대도 그러하다.

일 구현으로, 사카로미세스 세레비지아에와 같은 이스트에서 호의적인 조절 서열은 EP 431 880에서 가르쳐진 이스트 프로모터(예, 사카로미세스 세레비지아에 PRB1 프로모터); 및 전사 종결자, 바람직하게 EP 60 057에서 가르쳐진 사카로미세스 ADH1의 종결자를 포함한다.

번역 통독을 최소화하여 연장된 비-천연 융합 단백질의 생산을 피하기 위해 비암호 리전은 UAA, UAG 또는 UGA와 같은 번역 정지 코돈을 암호하는 하나이상의 DNA 서열을 포함하는 것이 유익할 수 있다. 상기 번역 정지 코돈 UAA이 바람직하다. 바람직하게, 적어도 두개의 번역 정지 코돈이 포함된다.

용어 "작동적으로 연결된"이란 조절 리전이 의도된 방식으로 오픈 리딩 프래임에 영향을 미치도록 하는 오픈 리딩 프래임과 관계를 형성하는 것과 같이 어느 비암호 리전내에 조절 서열이 위치한다는 의미를 포함한다. 따라서 오픈 리딩 프래임에 "작동적으로 연결된" 조절 리전은 조절 리전이 조절 서열과 양립가능한 조건하에서 의도된 방식으로 오픈 리딩 프래임의 전사 및/또는 번역에 영향을 미칠 수 있는 방식으로 위치한다.

본 발명의 제1, 제2 또는 제3 견지에 의해 정의된 바와 같이 폴리뉴클레오타이드 서열 삽입이 단백질을 암호하는 오픈 리딩 프래임을 포함하는 경우, 암호화된 단백질은 분비되는 것이 유리할 수 있다. 이러한 경우, 분비 리더 서열을 암호하는 서열이 오픈 리딩 프래임에 포함될 수 있다.

이스트 사카로미세스 세레비지아에(Saccharomyces cerevisiae), 지고사카로미세스 종, 클루이베로미세스 락티스(Kluyveromyces lactis) 및 피치아 파스트로리스(Pichia pastroris)와 같은 진핵 종에서 단백질 생성에 있어서, 공지 리더 서열은 에스. 세레비지아에 액시드 포스파타아제 단백질(Pho5p)(참조 EP 366 400), 인버타아제 단백질(Suc2p)(참조 Smith et al.(1985) Science, 229, 1219-1224) 및 히트-쇼크 단백질-150(Hsp150p)(참조 WO 95/33833)의 리더 서열을 포함한다. 또한, 에스. 세레비지아에 메이팅 팩터 알파-1 단백질(MFα-1) 및 사람 리소자임 및 사람 혈청 알부민(HSA) 단백질의 리더 서열이 사용되며, 이에 한정하는 것은 아니나 후자가 사람 알부민 분비용으로 특히 사용된다. WO 90/01063에는 MFα-1 리더 서열의 사용에 비해 사람 알부민의 오염 프레그먼트의 생성을 유익하게 감소시키는 MFα-1과 HSA 리더 서열의 융합체가 개시되어 있다. 또한, 천연 프랜스페린 리더 서열은 트랜스페린 및 다른 이종 단백질의 분비를 지시하는데 사용될 수 있다.

택일적으로, 상기 암호 단백질은 세포내(intracellular)성일 수 있다.

일 바람직한 구현으로, 본 발명의 제1, 제2 또는 제3 견지에 의해 정의된 바와 같은 적어도 하나의 폴리뉴클레오타이드 서열 삽입은 이스트 단백질을 암호하는 서열을 포함하는 오픈 리딩 프래임을 포함한다. 다른 바람직한 구현으로, 본 발명의 제1, 제2 또는 제3 견지에 의해 정의된 바와 같은 적어도 하나의 폴리뉴클레오타이드 서열 삽입은 2㎛-유사 플라스미드가 유래되는 동일한 숙주의 이스트 단백질을 암호하는 서열을 포함하는 오픈 리딩 프래임을 포함한다.

다른 바람직한 구현으로, 본 발명의 제1, 제2 또는 제3 견지에 의해 정의된 바와 같은 적어도 하나의 폴리뉴클레오타이드 서열 삽입은 단백질 폴딩에 관련되는 단백질을 암호하거나 샤프롱 활성을 갖거나 폴딩되지 않은 단백질 반응에 관련되는 단백질을 암호하는 서열(Stanford Genome Database(SGD), http:://db.yeastgenome.org)을 포함하는 오픈 리딩 프래임을 포함한다. 바람직한 단백질은 AHA1 , CCT2 , CCT3 , CCT4 , CCT5 , CCT6 , CCT7 , CCT8 , CNS1 , CPR3 , CPR6 , ER01, EUG1 , HCH1 , HSP10 , HSP12 , HSP104 , HSP26 , HSP30 , HSP42 , HSP60 , HSP78 , HSP82, JEM1 , MDJ1 , MDJ2 , MPD1 , MPD2 , PD11 , PFD1 , ABC1 , APJ1 , ATP11 , ATP12 , BTT1, CDC37 , CNS1 , CPR6 , CPR7 , HSC82 , KAR2 , LHS1 , MGE1 , MRS11 , NOB1 , ECM10 , SSA1, SSA2 , SSA3 , SSA4 , SSC1 , SSE2 , SIL1 , SLS1 , ORM1 , UBI4 , ORM2 , PER1 , PTC2 , PSE1 및 HAC1 또는 절단된 무인트론 HAC1(Valkonen et al. 2003, Applied Environ. Micro. 69, 2065)에 의해 암호화된 단백질로부터 선택될 수 있다.

단백질 폴딩에 관련되는 바람직한 단백질, 또는 샤프롱 활성을 갖는 단백질 또는 폴딩되지 않은 단백질 반능에 관련되는 단백질은 다음과 같을 수 있다:

(SSA1 , SSA2 , SSA3 , SSA4 , SSB1 및 SSB2에 의해 암호화되는 단백질과 같은 Kar2p, SSA 및 SSB 단백질을 포함하는) hsp70 패밀리의 단백질 멤버인 단백질, HSP90-패밀리의 멤버인 단백질, 또는 HSP40-패밀리의 멤버인 단백질 또는 DNA-J 및 DNA-J-유사 단백질(예, Jem1p, Mdj2p)을 포함하는 조절시 관련되는 단백질과 같은 히트 쇼크 단백질;

예를 들어, PSE1에 의해 암호화되는 캐리오페린 베타 단백질과 같은 캐리오페린/임포틴의 알파 또는 베타 패밀리와 같은 캐리오페린/임포틴 패밀리의 멤버인 단백질;

Orm2p와 같은 Hjelmqvist et al, 2002, Genome Biology, 3(6), research0027.1-0027.16에 의해 기술된 ORMDL 패밀리의 멤버인 단백질.

소포체 또는 골지와 같은 분비 경로에서의 어느 곳에 자연적으로 위치하는 단백질. 예를 들어, 특히 PDI와 같은 분비 세포에서 소포체의 루멘에서 자연적으로 활동하는 단백질;

Hjelmqvist et al, 2002(상기 참조)에 의해 기술된 ORMDL 패밀리의 멤버(예, Orm2p)와 같이, ER에 부착된 트랜스멤브레인 단백질인 단백질;

예를 들어, SSA1 , SSA2 , SSA3 , SSA4 , SSB1 및 SSB2에 의해 암호화된 단백질과 같은 SSA 및 SSB 단백질을 포함하는 hsp 70 단백질과 같은 시토졸내에서 활동하는 단백질;

Pse1p와 같은 핵, 핵 엔벨로프 및/또는 세포질에서 활동하는 단백질;

PDI 또는 Pse1p와 같은 필수 캐리오페린 단백질과 같은 세포의 생존에 필수적인 단백질;

설피드릴 산화 또는 디설피드 결합 형성, 파괴 또는 이성질체화에 관련되는 단백질, 또는 단백질 디설피드 이소머라아제(예, Pdi1p, Mpd1p), 동종성(예, Eug1p) 및/또는 관련 단백질(예, Mpd2p, Fmo1p, Ero1p)과 같이 특히, 분비 및 세포 표면 단백질의 생합성도중 단백질에서 티올:디설피드 교환 반응을 촉진하는 단백질;

PDI 및 Ssa1p와 같은 단백질 합성, 어셈블리 또는 폴딩에 관련되는 단백질;

성숙 단백질보다는 예를 들어, SSA1 , SSA2 , SSA3 , SSA4 , SSB1 및 SSB2에 의해 암호화되는 단백질과 같이 SSA 및 SSB를 포함하는 hsp70 단백질과 같은 폴딩되지 않은 단백질에 우선적으로 혹은 배타적으로 결합하는 단백질;

예를 들어, SSA1 , SSA2 , SSA3 , SSA4 , SSB1 및 SSB2에 의해 암호화되는 단백질과 같이 SSA 및 SSB를 포함하는 hsp70 단백질과 같은 시토졸내에서 전구체 단백질의 응집을 저해하는 단백질.

예를 들어 Ssa1p와 같이 손상된 단백질에 결합하고 안정화하는 단백질;

폴딩되지 않은 단백질 반응에 관련되거나 혹은 Hjelmqvist et al, 2002(상기 참조)(예, Orm2p)에 의해 기술된 ORMDL 패밀리의 멤버와 같이 폴딩되지 않은 단백질 반응을 유도하는 제제(터니카마이신 및 디티오트레이톨과 같은)에 대한 증가된 저항성을 제공하는 단백질 또는 스트레스에 대한 반응과 관련된 단백질(예, Ubi4p);

코-샤프롱 및/또는 단백질 폴딩 및/또는 폴딩되지 않은 단백질 반응에 직접적으로 관련하는 단백질;

Pse1p와 같은 거대분자의 핵 세포질 운반에 관련된 단백질;

핵 위치 서열 및 핵 방출 서열을 인지하고 Pse1p와 같은 핵 포어 콤플렉스와 상호작용함으로써 핵막을 횡단하는 거대분자의 운반을 매개하는 단백질;

PDI와 같이, EP 0 746 611 및 Hillson et al, 1984, Methods Enzymol., 107, 281-292에 기술된 바와 같은 스크램블링된 리보뉴클레아제의 RNA에 대한 리보뉴클레아제 활성을 재활성화시킬 수 있는 단백질;

PDI와 같이 산성 pI(예, 4.0-4.5)를 갖는 단백질;

Ssa1p와 같이 Hsp 70 패밀리의 멤버이며, 그리고 바람직하게 N-말단 ATP-바인딩 도메인 및 C-말단 펩타이드-바인딩 도메인을 갖는 단백질.

펩티딜-프로필 시스-트랜스 이소머라아제인 단백질(예, Cpr3p, Cpr6p);

공지 샤프롱의 동족체인 단백질(예, Hsp10p);

미토콘드리아 샤프롱인 단백질(예, Cpr3p);

세포질 또는 핵 샤프롱인 단백질(예, Cns1p);

멤브레인-결합 샤프롱인 단백질(예, Orm2p, Fmo1p);

샤프롱 활성체 활성 또는 샤프롱 조절 활성을 갖는 단백질(예, Aha1p, Hac1p, Hch1p);

소포체(예, Lha1p) 또는 세포내 활성 사이트(예, PseIp)내로의 효율적인 변위에 필요한 단백질을 포함하는 적절한 폴딩 수송 및/또는 분비를 일으키기위해 미성숙 형태의 폴리펩타이드에 일시적으로 결합하는 단백질;

단백질 복합체 어셈블리 및/또는 리보좀 어셈블리에 관련되는 단백질(예, Atp11p, PseIp, Nob1p);

샤페로닌 T-복합체의 단백질(예, Cc2p); 또는

프리폴딩 복합체의 단백질(예, Pfd1p).

바람직한 샤프롱은 디설피드 이소머라아제(PDI) 또는 소포체의 루멘내에 디설피드 결합의 형성을 촉진하는 것과 동등한 능력을 갖는 이들의 프레그먼트 또는 변이체이다. "PDI"란 EP 0 746 611 및 Hillson et al, 1984, Methods Enzymol. 107, 281-292에 기술된 바와 같은 스크램블링된 리보뉴클라아제의 RNA에 대한 리보뉴클라아제 활성을 재활성화시키는 능력을 갖는 어느 단백질을 포함한다.

단백질 디설피드 이소머라아제는 전형적으로 티올:디설피드 상혹작용 반응을 촉진하는 효소이며, 그리고 분비 세포에서 E.R. 루멘의 주로 상주하는 단백질 성분이다. 이는 분비 단백질 생합성에서 역할을 하는 것으로 제시되으며(Freedman, 1984, Trends Biochem . Sci., 9, 438-41), 이는 원위치에서 직접적인 가교 시험에 의해 뒷받침되었다(Roth 및 Pierce, 1987, Biochemistry, 26, 4179-82). PDI에 결함이 있는 마이크로솜 멤브레인은 코트랜슬래이셔널 단백질 디설피드 형성시 특정 결함을 나타낸다는 발견(Bulleid 및 Freedman, 1988, Nature, 335, 649-51)은 그 효소가 분비 및 세포 표면 단백질의 생합성도중 본래의 디설피드 결합 형성의 촉매로서 작용함을 의미한다. 이 역할은 티올:디설피드 상호작용 반응을 촉진하여 네트 단백질 디설피드 형성, 파괴 또는 이성질체화를 이끌며, 그리고 단백질 폴딩 및 광범위하게 다양한 감소된, 폴딩되지 않은 단백질 기질에서 본래의 디설피드 결합의 형성을 촉진할 수 있다(Freeman et al., 1989, Biochem . Soc . symp ., 55, 167-192)는 시험관내에서 효소의 촉매 특성으로 알려진 것과 부합한다. PDI는 또한 이소머라아제 활성이 결여된 돌연변이 PDI가 단백질 폴딩을 촉진하기때문에 샤프롱으로 작용한다(Hayano et al., 1995, FEBS Letters, 377, 505-511). 최근, 디설피드 이성질체화가 아닌 설피드릴 산화는 에스. 세레비지아에에서 단백질 디설피드 이소머라아제의 중요한 기능인 것으로 보고되었다(Solovyov et al., 2004, J. Biol. Chem., 279(33)34095-34100). 상기 효소의 DNA 및 아미노산 서열은 여러 종에 대해 알려져 있으며(Scherens et al, 1991, Yeast, 7, 185-193; Farquhar et al, 1991, Gene, 108, 81-89; EP074661; EP0293793; EP0509841) 포유류 간으로부터 동종성에 대해 정제된 상기 효소의 작용 메카니즘에 대한 정보는 증가하고 있다(Creighton et al, 1980, J. Mol . Biol ., 142, 43-62; Freedman et al, 1988, Biochem . Soc . Trans., 16, 96-9; Gilbert, 1989, Biochemistry, 28, 7298-7305; Lundstrom 및 Holmgren, 1990, J. Biol . Chem ., 265, 9114-9120; Hawkins 및 Freedman, 1990, Biochem . J., 275, 335-339). 세포내에서 단백질 폴딩, 어셈블리 및 변위의 매개자로서 관련된 현재 다수의 단백질 팩터중에서(Rothman, 1989, Cell, 59, 591-601), PDI는 잘 정의된 촉매 활성을 갖는다.

숙주내에서 내생성 PDI 유전자의 결실 또는 불활성화는 생존불가능한 숙주의 생성을 일으킨다. 즉, 내생성 PDI 유전자는 "필수" 유전자이다.

PDI는 포유류 조직으로부터 용이하게 분리되며 그 동종 효소는 특질상 산성 pI(4.0-4.5)을 갖는 동종이량체(2x57kD)이다(Hillson et al, 1984, Methods Enzymol., 107, 281-292). 상기 효소는 또한 밀 및 조류 클라미도모나스 레인하디(Chlamydomonas reinhardii)(Kaska et al, 1990, Biochem . J., 268, 63-68), 래트(Edman et al, 1985, Nature, 317, 267-270), 소(Yamauchi et al, 1987, Biochem. Biophys . Res. Comm ., 146, 1485-1492), 사람(Pihlajaniemi et al, 1987, EMBO J., 6, 643-9), 이스트(Scherens et al, 상기 참조; Farquhar et al, 상기 참조) 및 병아리(Parkkonen et al, 1988, Biochem . J., 256, 1005-1011)로부터 정제된다. 이러한 척추동물 종으로부터 얻어지는 단백질은 전체적으로 고도의 서열 보존성을 나타내며 모두 래트 PDI 서열에 처음 주목된 여러 전체적 특징들을 보여준다(Edman et al., 1985, op. cit.).

이스트 단백질 디설피드 이소머라아제 전구체, PDI1은 Genbank 등록번호 CAA42373 또는 BAA00723으로 발견될 수 있다:

택일적인 PDI 서열은 Genbank 등록번호 CAA38402로 발견될 수 있다. 이는 다음과 같은 530 아미노산 서열을 갖는다.

상기 PDI 서열의 변이체 및 프레그먼트, 및 이외의 자연 발생 PDI 서열의 변이체가 또한 본 발명에 포함된다. 이러한 정황에 있어서, PDI의 "변이체"는 하나 또는 그 이상의 포지션에서 보존적 혹은 비-보존적인 아미노산 삽입, 결실, 또는 치환이 존재하나, 단, 이러한 변화가 단백질에 예를 들어, 효소 활성(타입 및 특정 활성), 열안정성, 특정 pH-범위에서의 활성(pH-안정성)과 같은 기본적 특성을 유의적으로 변화시키지 않는 단백질을 칭한다. 이러한 정황에서 "유의적으로"란 당 기술분야의 숙련자가 그 변이체의 특성이 여전히 다르지만 본래 단백질의 특성에 비해 명백하다고 말할 수 있음을 의미한다.

"보존적 치환"이란 Val, Ile, Leu, Ala, Met; Asp, Glu; Asn, Gln; Ser, Thr, Gly, Ala; Lys, Arg, His; 및 Phe, Tyr, Trp와 같은 의도된 조합이다. 바람직한 보존적 치환은 Gly, Ala; Val, Ile, Leu; Asp, Glu; Asn, Gln; Ser, Thr; Lys, Arg; 및 Phe, Tyr을 포함한다.

"변이체"는 전형적으로 이것이 유도된 폴리펩타이와 적어도 25%, 적어도 50%, 적어도 60%, 또는 적어도 70%, 바람직하게 적어도 80%, 보다 바람직하게 적어도 90%, 보다 바람직하게 적어도 95%, 보다 바람직하게 적어도 99%, 가장 바람직하게 99.5% 서열 동일성을 갖는다.

두 폴리펩타이드간의 퍼센트 서열 동일성은 하기에 언급된 바와 같이 적절한 컴퓨터 프로그램을 이용하여 검출될 수 있다. 이러한 변이체는 자연적이거나 혹은 당 기술분야에 잘 알려져 있는 바와 같은 단백질 합성 및 사이트-디렉티드 돌연변이 생성 방법을 이용하여 제조될 수 있다.

이러한 정황에 있어서 PDI의 "프레그먼트"는 하나 또는 그 이상의 포지션에서 결실을 갖는 단백질을 칭한다. 따라서 프레그먼트는 성숙 PDI 단백질의 완전 서열의 많아야 5, 10, 20, 30, 40 또는 50%, 전형적으로 최대 60%, 보다 전형적으로 최대 70%, 바람직하게 최대 80%, 보다 바람직하게 최대 90%, 보다 바람직하게 최대 95%, 보다 바람직하게 최대 99%를 포함한다. 특히 바람직한 PDI 단백질의 프레그먼트는 하나 또는 그 이상의 원하는 단백질의 전체 도메인을 포함한다.

PDI의 프레그먼트 또는 변이체는 에스. 세레비지아에와 같은 숙주 세포에서 재조합적으로 발현되는 경우 숙주 세포에서 내생적으로 암호화된 PDI 유전자의 결실을 보완할 수 있는 단백질일 수 있다. 예를 들어, 다른 이스트 또는 다른 균류, 또는 사람 또는 다른 척추동물과 같은 다른 진핵생물, 또는 동물 또는 식물과 같은 다른 유기체에 의해 암호화된 동족체와 같은 자연 발생 PDI 동족체일 수 있다.

다른 바람직한 샤프롱은 SSA1 또는 등가의 샤프롱-유사 활성을 갖는 이의 프레그먼트나 변이체이다. YG100으로도 알려진 SSA1은 에스. 세레비지아에의 염색체 1에 위치하며 크기는 1.93-kbp이다.

SSA1의 공개된 단백질 서열은 다음과 같다:

SSA1에 대한 공개된 암호 서열은 다음과 같지만 하기 서열은 동일한 단백질 산물을 암호하는 택일적인 뉴클레오타이드 서열을 얻기위해 디제너레이트 치환에 의해 변형될 수 있는 것으로 인식될 것이다.

단백질 Ssa1p는 Hsp70 단백질 패밀리에 속하며 세포질내에 상주한다. Hsp70s는 다수의 샤프롱 활성들 즉, 단백질 합성, 어셈블리 및 폴딩의 보조; 폴리펩타이드의 여러 세포내 위치로의 변위 매개, 및 단백질 응집물의 분해를 수행하는 능력을 갖는다(Becker & Craig, 1994, Eur . J. Biochem . 219, 11-23). Hsp70 유전자는 고 보존적이며, N-말단 ATP-바인딩 도메인 및 C-말단 펩타이드-바인딩 도메인을 갖는다. Hsp70 단백질은 주로 폴딩되지 않은 단백질의 펩타이드 백본과 상호작용한다. hsp70 단백질에 의한 펩타이드의 바인딩 및 방출은 ATP-의존적 프로세스이며 hsp70의 형태적 변화가 수반된다(Becker & Craig, 1994, 상기 참조).

세포질 hsp70 단백질은 특히 단백질의 합성, 폴딩 및 분비에 관련된다(Becker & Craig, 1994, 상기 참조). 에스. 세레비지아에에서 hsp70 단백질은 SSA(SSA 1-4) 및 SSB(SSB 1 및 2), 두 그룹으로 나뉘며, 이들은 서로 기능적으로 구별된다. SSA 패밀리는 그룹으로부터 적어도 하나의 단백질이 세포 생존능을 유지하기위해 활성적이어야 하는 점에서 필수적이다(Becker & Craig, 1994, 상기 참조). 세포질 hsp70 단백질은 우선적으로 폴딩되지 않은 미성숙 단백질에 우선적으로 결합한다. 이는 이들이 세포질내에 다중분자 복합체내로 집합되기전에 폴딩되지 않은 상태로 유지되고 여러 가지 세포기관으로의 전위를 촉진함으로써 전구체 단백질의 응집을 저해하는 것을 제시한다(Becker & Craig, 1994, 상기 참조). SSA 단백질은 특히 소포체 및 미토콘드리아내로의 전위를 위한 전구체의 번역후 생체내 합성 및 유지와 관련된다(Kim et al., 1998, Proc . Natl . Acad . Sci . USA. 95, 12860-12865; Ngosuwan et al., 2003, J. Biol . Chem . 278(9), 7034-7042). Ssa1p는 손상된 단백질에 바인딩하고, 이를 부분적으로 폴딩된 형태로 안정화하고 리폴딩 또는 분해가 일어나도록 하는 것으로 나타났다(Becker & Craig, 1994, 상기 참조; Glover & Lindquist, 1998, Cell. 94, 73-82).

SSA1의 변이체 및 프레그먼트가 또한 본 발명에 포함된다. 이러한 정황에 있어서 SSA1의 "변이체"는 하나 또는 그 이상의 포지션에서 보존적 혹은 비-보존적인 아미노산 삽입, 결실, 또는 치환이 존재하나, 단, 이러한 변화가 단백질에 예를 들어, 효소 활성(타입 및 특정 활성), 열안정성, 특정 pH-범위에서의 활성(pH-안정성)과 같은 기본적 특성을 유의적으로 변화시키지 않는 단백질을 칭한다. 이러한 정황에서 "유의적으로"란 당 기술분야의 숙련자가 그 변이체의 특성이 여전히 다르지만 본래 단백질의 특성에 비해 명백하다고 말할 수 있음을 의미한다.

SSA1의 "변이체"는 전형적으로 본래 SSA1의 서열과 적어도 25%, 적어도 50%, 적어도 60%, 또는 적어도 70%, 바람직하게 적어도 80%, 보다 바람직하게 적어도 90%, 보다 바람직하게 적어도 95%, 보다 바람직하게 적어도 99%, 가장 바람직하게 99.5% 서열 동일성을 갖는다.

이러한 정황에 있어서 SSA1의 "프레그먼트"는 본래 SSA1의 서열이외에 하나 또는 그 이상의 포지션에서 결실을 갖는 단백질을 칭한다. 따라서 프레그먼트는 전체 성숙 SSA1 단백질의 완전 서열의 많아야 5, 10, 20, 30, 40 또는 50%, 전형적으로 최대 60%, 보다 전형적으로 최대 70%, 바람직하게 최대 80%, 보다 바람직하게 최대 90%, 보다 바람직하게 최대 95%, 보다 바람직하게 최대 99%를 포함한다. 특히 바람직한 SSA1 단백질의 프레그먼트는 하나 또는 그 이상의 원하는 단백질의 전체 도메인을 포함한다.

SSA1의 프레그먼트 또는 변이체는 에스. 세레비지아에와 같은 숙주 세포에서 재조합적으로 발현되는 경우 숙주 세포에서 내생적으로 암호화된 SSA1 유전자의 결실을 보완할 수 있는 단백질일 수 있다. 예를 들어, 다른 이스트 또는 다른 균류, 또는 사람 또는 다른 척추동물과 같은 다른 진핵생물, 또는 동물 또는 식물과 같은 다른 유기체에 의해 암호화된 동족체와 같은 자연 발생 SSA1 동족체일 수 있다.

다른 바람직한 샤프롱은 PSE1 또는 등가의 샤프롱-유사 활성을 갖는 이의 프레그먼트나 변이체이다.

KAP121으로도 알려진 PSE1은 염색체 XIII에 위치하는 필수 유전자이다.

단백질 pse1p에 대한 공개된 단백질 서열은 다음과 같다:

공개된 PSE1의 뉴클레오타이드 암호 서열은 다음과 같지만 하기 서열은 동일한 단백질 산물을 암호하는 택일적인 뉴클레오타이드 서열을 얻기위해 디제너레이트 치환에 의해 변형될 수 있는 것으로 인식될 것이다.

PSE1 유전자는 3.25-kbp크기이다. Pse1p는 거대분자의 핵 세포질 운반에 관련된다(Seedorf & Silver, 1997, Proc . Natl . Acad . Sci . USA. 94, 8590-8595). 이 공정은 핵 엔벨로프에 매입되고 뉴클레오포린으로 구성된 핵 포어 콤플렉스(NPC)를 통해 일어난다(Ryan & Wente, 2000, Curr . Opin . Cell Biol . 12, 361-371). 단백질은 핵 이입, 핵 위치화 서열(NLS) 및 방출, 핵 방출 서열(NES)에 필요한 정보를 함유하는 특정 서열을 갖는다(Pemberton et al., 1998, Curr . Opin . Cell Biol . 10, 392-399). Pse1p는 단백질의 한 그룹인 캐리오페린/임포틴이며, 이는 α 및 β 패밀리로 나뉜다. 캐리오페린은 NLS 및 NES를 인지함으로써 핵막을 횡단하는 거대분자의 수송을 매개하고 NPC와 상호작용하는 가용성 운반 팩터이다(Seedorf & Silver, 1997, 상기 참조; Pemberton et al., 1998, 상기 참조; Ryan & Wente, 2000, 상기 참조). 핵 포어를 통한 전위는 소 GTP-바인딩 단백질, Ran에 의해 촉진된 GTP 가수분해에 의해 유도된다(Seedorf & Silver, 1997, 상기 참조). Pse1p는 캐리오페린 β로 확인된 바 있다. 14개의 캐리오페린 β 단백질이 에스. 세레비지아에에서 확인되어 있으며 그 중 4개만이 필수적이다. 이는 아마도 다중 캐리오페린이 단일 거대분자의 운반을 매개하기 때문인 것으로 여겨진다(Isoyama et al., 2001, J. Biol . Chem . 276(24), 21863-21869). Pse1p는 엔벨로프에 핵으로 그리고 세포질에 특정 범위로 위치화된다. 이는 운반 작용의 일부로서 단백질이 핵 내외로 이동함을 제시한다(Seedorf & Silver, 1997, 상기 참조). Pse1p는 전사 팩터(Isoyama et al., 2001, 상기 참조; Ueta et al., 2003, J. Biol . Chem . 278(50), 50120-50127), 히스톤(Mosammaparast et al., 2002, J. Biol . Chem . 277(1), 862-868), 및 리보좀내로 모이기전 리보좀 단백질(Pemberton et al., 1998, 상기 참조)의 핵 이입에 관련된다. 이는 또한 핵으로부터 mRNA의 방출을 매개한다. 캐리오페린은 RNA-바인딩 단백질상에서 발견되는 별개의 NES를 인지하고 바인딩하며, 이는 핵으로부터 방출되기 전에 RNA를 코팅한다(Seedorf & Silver, 1997, Pemberton et al., 1998, 상기 참조).

거대분자의 핵세포질 운반은 세포 주기에 걸친 적절한 프로그레션에 필수적이기 때문에, pse1p와 같은 핵 운반 팩터는 성장 조절에 새로운 후보 표적이다(Seedorf & Silver, 1997, 상기 참조).

에스. 세레비지아에에서 다중복제 플라스미드상의 Pse1p(단백질 분비 인핸서)의 과발현은 또한 생물학적으로 활성적인 단백질의 레퍼터리의 단백질 분비 수준을 증가시키는 것으로 나타났다(Chow et al., 1992; J. Cell. Sci . 101(3), 709-719).

PSE1의 변이체 및 프레그먼트가 또한 본 발명에 포함된다. 이러한 정황에 있어서 PSE1의 "변이체"는 하나 또는 그 이상의 포지션에서 보존적 혹은 비-보존적인 아미노산 삽입, 결실, 또는 치환이 존재하나, 단, 이러한 변화가 단백질에 예를 들어, 효소 활성(타입 및 특정 활성), 열안정성, 특정 pH-범위에서의 활성(pH-안정성)과 같은 기본적 특성을 유의적으로 변화시키지 않는 단백질을 칭한다. 이러한 정황에서 "유의적으로"란 당 기술분야의 숙련자가 그 변이체의 특성이 여전히 다르지만 본래 단백질의 특성에 비해 명백하다고 말할 수 있음을 의미한다.

PSE1의 "변이체"는 전형적으로 본래 PSE1의 서열과 적어도 25%, 적어도 50%, 적어도 60%, 또는 적어도 70%, 바람직하게 적어도 80%, 보다 바람직하게 적어도 90%, 보다 바람직하게 적어도 95%, 보다 바람직하게 적어도 99%, 가장 바람직하게 99.5% 서열 동일성을 갖는다.

이러한 정황에 있어서 PSE1의 "프레그먼트"는 본래 PSE1의 서열이외에 하나 또는 그 이상의 포지션에서 결실을 갖는 단백질을 칭한다. 따라서 프레그먼트는 전체 성숙 PSE1 단백질의 완전 서열의 많아야 5, 10, 20, 30, 40 또는 50%, 전형적으로 최대 60%, 보다 전형적으로 최대 70%, 바람직하게 최대 80%, 보다 바람직하게 최대 90%, 보다 바람직하게 최대 95%, 보다 바람직하게 최대 99%를 포함한다. 특히 바람직한 PSE1 단백질의 프레그먼트는 하나 또는 그 이상의 원하는 단백질의 전체 도메인을 포함한다.

PSE1의 프레그먼트 또는 변이체는 에스. 세레비지아에와 같은 숙주 세포에서 재조합적으로 발현되는 경우 숙주 세포에서 내생적으로 암호화된 PSE1 유전자의 결실을 보완할 수 있는 단백질일 수 있다. 예를 들어, 다른 이스트 또는 다른 균류, 또는 사람 또는 다른 척추동물과 같은 다른 진핵생물, 또는 동물 또는 식물과 같은 다른 유기체에 의해 암호화된 동족체와 같은 자연 발생 PSE1 동족체일 수 있다.

다른 바람직한 샤프롱은 ORM2 또는 등가의 샤프롱-유사 활성을 갖는 이의 프레그먼트나 변이체이다.

YLR350W으로도 알려진 ORM2는 에스. 세레비지아에 게놈의 염색체 XII(포지션 828729-829379)에 위치하며, 이스트 단백질 Orm1p과 유사한 진화적으로 보존된 단백질을 암호하는 유전자이다. Hjelmqvist et al, 2002, Genome Biology, 3(6), research0027.1-0027.16에는 ORM2가 3가지 사람 유전자(ORMDL1, ORMDL2 및 ORMDL3)를 포함하는 유전자 패밀리에 속하며 또한 마이크로스포리디아, 식물, 드로조필라(Drosophila), 유로코데이트 및 척추동물에서 동종성인 것으로 보고되어 있다. ORMDL 유전자는 단백질 소포체(ER)내에 부착된 트랜스멤브레인 단백질을 암호하는 것으로 보고되어 있다.

단백질 Orm2p는 폴딩되지 않은 단백질 반응을 유도하는 제제에 대한 저항성에 필요하다. Hjelmqvist et al, 2002(상기 참조)에는 두 에스. 세레비지아에 ORMDL 동족체(ORM1 및 ORM2)의 더블 넉아웃은 감소된 성장율 및 터니카마이신 및 디티오트레이톨에 대한 보다 큰 민감성을 일으키는 것으로 보고되어 있다.

Orm2p의 공개 서열은 다음과 같다:

상기 단백질은 하기와 같은 암호 뉴클레오타이드에 의해 에스. 세레비지아에에서 암호화되지만, 하기 서열은 동일한 단백질 산물을 암호하는 택일적인 뉴클레오타이드 서열을 얻기위해 디제너레이트 치환에 의해 변형될 수 있는 것으로 인식될 것이다.

ORM2의 변이체 및 프레그먼트가 또한 본 발명에 포함된다. 이러한 정황에 있어서 ORM2의 "변이체"는 하나 또는 그 이상의 포지션에서 보존적 혹은 비-보존적인 아미노산 삽입, 결실, 또는 치환이 존재하나, 단, 이러한 변화가 단백질에 예를 들어, 효소 활성(타입 및 특정 활성), 열안정성, 특정 pH-범위에서의 활성(pH-안정성)과 같은 기본적 특성을 유의적으로 변화시키지 않는 단백질을 칭한다. 이러한 정황에서 "유의적으로"란 당 기술분야의 숙련자가 그 변이체의 특성이 여전히 다르지만 본래 단백질의 특성에 비해 명백하다고 말할 수 있음을 의미한다.

ORM2의 "변이체"는 전형적으로 본래 ORM2의 서열과 적어도 25%, 적어도 50%, 적어도 60%, 또는 적어도 70%, 바람직하게 적어도 80%, 보다 바람직하게 적어도 90%, 보다 바람직하게 적어도 95%, 보다 바람직하게 적어도 99%, 가장 바람직하게 99.5% 서열 동일성을 갖는다.

이러한 정황에 있어서 ORM2의 "프레그먼트"는 본래 ORM2의 서열이외에 하나 또는 그 이상의 포지션에서 결실을 갖는 단백질을 칭한다. 따라서 프레그먼트는 전체 성숙 ORM2 단백질의 완전 서열의 많아야 5, 10, 20, 30, 40 또는 50%, 전형적으로 최대 60%, 보다 전형적으로 최대 70%, 바람직하게 최대 80%, 보다 바람직하게 최대 90%, 보다 바람직하게 최대 95%, 보다 바람직하게 최대 99%를 포함한다. 특히 바람직한 ORM2 단백질의 프레그먼트는 하나 또는 그 이상의 원하는 단백질의 전체 도메인을 포함한다.

ORM2의 프레그먼트 또는 변이체는 에스. 세레비지아에와 같은 숙주 세포에서 재조합적으로 발현되는 경우 숙주 세포에서 내생적으로 암호화된 ORM2 유전자의 결실을 보완할 수 있는 단백질일 수 있다. 예를 들어, 다른 이스트 또는 다른 균류, 또는 사람 또는 다른 척추동물과 같은 다른 진핵생물, 또는 동물 또는 식물과 같은 다른 유기체에 의해 암호화된 동족체와 같은 자연 발생 ORM2 동족체일 수 있다.

본 발명의 제1, 제2 또는 제3 견지에 따른 플라스미드는 폴리뉴클레오타이드 서열 삽입내에 또는 플라스미드의 어딘가 다른 곳에 알부민의 서열 또는 이의 프레그먼트나 변이체를 포함하는 단백질을 암호하는 오픈 리딩 프래임을 포함한다. 택일적으로, 플라스미드로 형질변형되는 숙주세포는 그 게놈내에 내생성 혹은 이종성 서열로서 알부민의 서열 또는 이의 프레그먼트나 변이체를 포함하는 단백질을 암호하는 오픈 리딩 프래임을 포함할 수 있다.

"알부민"이란 어느 공급원으로부터 얻어진 알부민 단백질의 서열을 갖는 단백질을 포함한다. 전형적으로 상기 공급원은 포유류이다. 바람직한 일 구현으로 상기 혈청 알부민은 사람 혈청 알부민("HSA")이다. 용어 "사람 혈청 알부민"은 사람에서 자연적으로 일어나는 아미노산 서열을 갖는 혈청 알부민 및 이의 변이체를 의미한다. 바람직하게 상기 알부민은 WO 90/13653에 개시된 아미노산 서열 또는 이의 변이체를 갖는다. HSA 암호 서열은 사람 유전자에 상응하는 cDNA를 분리하는 공지 방법에 의해 얻어질 수 있으며 예를 들어 EP 73 646 및 EP 286 424에 또한 개시되어 있다.

다른 바람직한 구현으로 "알부민"은 우 혈청 알부민의 서열을 갖는다. 용어 "우 혈청 알부민"은 예를 들어 Swissprot 등록번호 P02769로부터 취해지는 바와 같은, 소에서 자연적으로 발생하는 아미노산 서열 및 하기 정의된 바와 같은 이의 변이체를 갖는 혈청 알부민을 의미한다. 용어 "우 혈청 알부민"은 하기 정의된 바와 같이 전장 우 혈청 알부민의 프레그먼트 또는 이의 변이체를 의미하는 것을 포함한다.

다른 바람직한 구현으로, 상기 알부민은 개(예, 참조 Swissprot 등록번호 P49822), 돼지(예, 참조 Swissprot 등록번호 P08835), 염소(예, Sigma로부터 제품번호 A2514 또는 A4164로서 이용가능), 칠면조(예, 참조 Swissprot 등록번호 O73860), 개코원숭이(예, Sigma로부터 제품번호 A1516으로 이용가능), 고양이(예, 참조 Swissprot 등록번호 P49064), 닭(예, 참조 Swissprot 등록번호 P19121), 오발부민(예, 닭 오발부민)(예, 참조 Swissprot 등록번호 P01012), 당나귀(예, 참조 Swissprot 등록번호 P39090), 기니 돼지(예, Sigma로부터 제품번호 A3060, A2639, O5483 또는 A6539로 이용가능), 햄스터(예, Sigma로부터 제품번호 A5409로 이용가능), 말(예, 참조 Swissprot 등록번호 P35747), 붉은털원숭이(예, 참조 Swissprot 등록번호 Q28522), 마우스(예, 참조 참조 Swissprot 등록번호 O89020), 비둘기(예, Khan et al, 2002, Int. J. Biol. Macromol., 30(3-4), 171-8에 의해 정의된 바와 같은), 토끼(예, 참조 Swissprot 등록번호 P49065)로 부터 얻어지는 혈청 알부민 중에서 유래된 알부민이며 하기 정의된 바와 같이 이들의 변이체 및 프레그먼트를 포함한다.

다수의 자연적으로 발생하는 알부민의 돌여변이 형태가 알려져 있다. 다수가 Peters(1996, All About Albumin: Biochemistry, Genetics and Medical Applications, Academic Press, Inc., San Diego, California, p.170-181)에 기재되어 있다. 상기 정의된 바와 같은 변이체는 이러한 자연적으로 발생하는 돌연변이중 하나일 수 있다.

"변이체 알부민"은 하나 또는 그 이상의 포지션에서 보존적 혹은 비-보존적인 아미노산 삽입, 결실, 또는 치환이 존재하나, 단, 이러한 변화가 알부민 단백질에 예를 들어, 바인딩 활성(예, 비릴루빈에 대한 바인딩과 같은 타입 및 특정 활성), 삼투 몰농도(혈장 압력, 콜로이드 삼투압), 특정 pH-범위에서의 활성(pH-안정성)과 같은 기본적 특성을 유의적으로 변화시키지 않는 알부민 단백질을 칭한다. 이러한 정황에서 "유의적으로"란 당 기술분야의 숙련자가 그 변이체의 특성이 여전히 다르지만 본래 단백질의 특성에 비해 명백하다고 말할 수 있음을 의미한다.

"보존적 치환"이란 Gly, Ala; Val, Ile, Leu; Asp, Glu; Asn, Gln; Ser, Thr, Lys, Arg; 및 Phe, Tyr과 같은 의도된 조합이다. 이러한 변이체는 본 명세서에 참고문헌으로 편입된 미국 특허 제 4,302,386(Stevens, 1982, 11, 24 제출)에 기재된 바와 같은 사이트-디렉티드 돌연변이 생성 방법과 같이 당 기술분야에 잘 알려진 기술에 의해 제조될 수 있다.

전형적으로 알부민 변이체는 자연적으로 발생하는 알부민과 적어도 40%, 일반적으로 적어도 50%, 보다 전형적으로 적어도 60%, 바람직하게 적어도 70%, 보다 바람직하게 적어도 80%, 보다 바람직하게 적어도 90%, 보다 바람직하게 적어도 95%, 가장 바람직하게 적어도 98% 또는 그 이상의 서열 동일성을 갖는다. 두 폴리펩타이드간의 퍼센트 서열 동일성은 예를 들어 University of Wisconsin Genetic Computing Group의 GAP 프로그램과 같은 적절한 컴퓨터 프로그램을 이용하여 검출될 수 있으며 퍼센트 동일성은 폴리펩타이드의 서열을 적절히 정렬하여 그 관계로 계산된다. 정렬은 택일적으로 Clustal W 프로그램(Thompson et al., 1994)을 이용하여 수행될 수 있다. 사용되는 파라미터는 다음과 같다:

패스트 페어와이즈 파라미터: K-터플(워드) 크기; 1, 윈도우 크기; 5, 갭 페널티; 3, 탑 다이아고날 수; 5. 스코어링 방법: x 퍼센트. 다중 정렬 파라미터: 갭 오픈 페널티; 10, 갭 익스텐션 페널티; 0.05. 스코어링 매트릭스: BLOSUM.

상기 사용된 용어 "프레그먼트"는 예를 들어 바인딩 활성(예, 비릴루빈에 대한 바인딩과 같은 타입 및 특정 활성), 삼투 몰농도(혈장 압력, 콜로이드 삼투압), 특정 pH-범위에서의 활성(pH-안정성)과 같은 기본적 특성을 유의적으로 변화시키지 않는 한 전장 알부민의 어느 프레그먼트 또는 이의 변이체를 포함한다. 이러한 정황에서 "유의적으로"란 당 기술분야의 숙련자가 그 변이체의 특성이 여전히 다르지만 본래 단백질의 특성에 비해 명백하다고 말할 수 있음을 의미한다. 프레그먼ㅌ는 적어도 하나의 알부민의 전체 서브도메인을 포함할 수 있다. HSA의 도메인은 재조합 단백질로서 발현되며(Dockal, M. et al., 1999, J. Biol . Chem ., 274, 29303-29310), 여기서 도메인 I은 아미노산 1-197로 구성되는 것을 정의되었으며, 도메인 II는 아미노산 189-385로 구성되는 것으로 정의되었으며 그리고 도메인 III는 아미노산 381-585로 구성되는 것으로 정의되었다. 도메인 I과 II사이에 그리고 도메인 II와 III사이에 존재하는 연장된 α-헬릭스 구조(h10-h1) 때문에, 상기 도메인의 부분 오버랩이 일어난다(Peters, 1996, op. cit., Table 2-4). HSA는 또한 6개의 서브도메인(서브도메인 IA, IB, IIA, IIB, IIIA 및 IIIB)을 포함한다. 서브도메인 IA는 아미노산 6-105를 포함하며, 서브도메인 IB는 아미노산 120-177을 포함하며, 서브도메인 IIA는 아미노산 200-291을 포함하며, 서브도메인 IIB는 아미노산 316-369를 포함하며, 서브도메인 IIIA는 아미노산 392-491을 포함하며 그리고 서브도메인 IIIB는 아미노산 512-583을 포함한다. 프레그먼트는 상기 정의된 바와 같은 하나 또는 그 이상의 서브도메인 전체 또는 일부를 포함하거나 이들 도메인 및/또는 서브도메인의 어느 조합을 포함할 수 있다.

따라서 폴리뉴클레오타이드 삽입은 알부민을 암호하는 오픈 리딩 프래임 또는 이의 변이체나 프레그먼트를 포함할 수 있다.

택일적으로, 본 발명의 제1, 제2 또는 제3 견지에 따른 플라스미드는 폴리뉴클레오타이드 서열 삽입내에 또는 플라스미드의 어딘가 다른 곳에 트랜스페린의 서열 또는 이의 프레그먼트나 변이체를 포함하는 단백질을 암호하는 오픈 리딩 프래임을 포함한다. 택일적으로, 플라스미드로 형질변형되는 숙주세포는 그 게놈내에 내생성 혹은 이종성 서열로서 트랜스페린의 서열 또는 이의 프레그먼트나 변이체를 포함하는 단백질을 암호하는 오픈 리딩 프래임을 포함할 수 있다.

본 명세서에 사용된 용어 "트랜스페린"은 트랜스페린 패밀리의 모든 멤버(Testa, Prosteins of iron metabolism, CRC Press, 2002; Haris & Aisen , Iron carriers and iron proteins, Vol. 5, Physical Bioinorganic Chemistry, VCH, 1991) 및 트랜스레핀, 돌연변이 트랜스페린(Mason et al, 1993, Biochemistry, 32, 5472; Mason et al, 1998, Biochem . J., 330(1), 35), 트렁캐이티드 트랜스페린, 트랜스페린 로브(Mason et al, 1996, Protein Expr . Purif ., 8, 119; Mason et al, 1991, Protein Expr . Purif ., 2, 214), 락토페린, 돌연변이 락토페린, 트렁캐이티드 락토페린, 락토페린 로브와 같은 이의 유도체 또는 다른 펩타이드, 폴리펩타이드 또는 단백질과 상기 중 어느 하나의 융합체를 포함한다(Shin et al, 1995, Proc. Natl . Acad . Sci . USA, 92, 2820; Ali et al, 1999, J. Biol . Chem ., 274, 24066; Mason et al, 2002, Biochemistry, 41, 9448).

트랜스페린은 사람 트랜스페린일 수 있다. 용어 "사람 트랜스페린"은 사람으로부터 유래된 트랜스페린과 구별불가능한 물질 또는 이의 변이체나 프레그먼트를 칭하는 것으로 사용된다. "변이체"는 보존적 혹은 비-보존적인 삽입, 결실, 및 치환이 존재하나, 단, 이러한 변화가 트랜스페린의 유용한 리간드-바인딩 또는 면역유발성을 실질적으로 변화시키지 않는 것을 포함한다.

트랜스페린의 돌연변이가 본 발명에 포함된다. 이러한 돌연변이는 변화된 면역유발성을 가질 수 있다. 예를 들어, 트랜스페린 둘연변이는 변형된(예, 감소된) 글리코실화를 나타낼 수 있다. 트랜스페린 분자의 N-결합 글리코실화 패턴은 N, X, 또는 S/T의 어느 또는 모든 포지션에서 N-X-S/T와 같은 아미노산 글리코실화 일치 서열을 첨가/제거함으로써 변형될 수 있다. 트랜스페린 돌연변이는 금속 이온 및/또는 트랜스페린 수용체와 같은 다른 단백질에 대한 이들의 자연적인 바인딩이 달라질 수 있다. 이러한 방식으로 변형된 트랜스페린 돌연변이의 예는 다음과 같이 예시된다.

사람 트랜스페린 또는 사람 트랜스페린 유사체의 자연-발생 다형 변이체가 또한 포함된다. 일반적으로, 사람 트랜스페린의 변이체 또는 프레그먼트는 중량대 중량으로 사람 트랜스페린의 리간드 바인딩 활성(예를 들어 철-바인딩)의 적어도 50%(바람직하게 적어도 80%, 90% 또는 95%)를 갖는다. 트랜스페린 또는 시료의 철 바인딩 활성은 철이 없는 상태 및 완전히 철이 적재된 상태에서 470nm:280nm 흡광도에서 분광학적으로 측정될 수 있다. 제제는 달리 언급되지 않는 한 철이 없어야 한다. 철은 0.1M 시트레이트, 0.1M 아세테이트, 10mM EDTA pH4.5에서 투석에 의해 트랜스페린 또는 시료로부터 제거될 수 있다. 단백질은 100mM HEPES, 10mM NaHCO₃ pH8.0에서 약 20mg/mL이어야 한다. 280nm에서 흡광도가 정밀하게 분광학적으로 측정될 수 있도록 물에 희석된 아포-트랜스페린(Calbiochem, CN Biosciences, Nottingham, UK)의 470nm:280nm 흡광비를 측정한다(0% 철 바인딩). 2mL 1M NaOH내에 니트로트리아세트산 191mg을 용해한 다음 0.5M 페릭 클로라이드 2mL를 첨가함으로써 20mM 철-니트릴로트리아세테이트(FeNTA) 용액을 준비한다. 탈이온수로 50mL로 희석한다. 새로 준비한 충분한 초과량의 20mM FeNTA를 첨가함으로써 철과 함께 아포-트랜스페린을 적재한 다음(100% 철 바인딩), 100mM HEPES, 10mM NaHCO₃ pH8.0에서 홀로-트랜스페린 제조물을 완전히 투석하여 470nm:280nm에서 흡광비를 측정하기 전에 잔존하는 FeNTA를 제거한다. 시료를 이용하여 상기 방법을 반복하며, 이는 초기에 철이 없어야 하며 대조군과 최종 비율을 비교한다.

또한, 상기 어느 것을 포함하는 단일 또는 다중 이종성 융합체; 또는 알부민, 트랜스페린 또는 면역글로블빈이나 이들 어느 것의 변이체나 프레그먼트와의 단일 또는 다중 이종성 융합체가 사용될 수 있다. 이러한 융합체는 WO 01/79271에 예시된 바와 같은 알부민 N-말단 융합체, 알부민 C-말단 융합체 및 co-N-말단 및 C-말단 알부민 융합체, 및 트랜스페린 N-말단 융합체, 트랜스페린 C-말단 융합체, 및 co-N-말단 및 C-말단 트랜스페린 융합체를 포함한다.

숙련자는 또한 어느 다른 유전자 또는 변이체의 오픈 리딩 프래임 또는 그 일부가 본 발명과 함께 사용시 폴리뉴클레오타이드 서열을 형성하는 경우 오픈 리딩 프래임의 전체 또는 일부를 형성하기위해 사용될 수 있다는 것이 인식될 것이다. 예를 들어, 상기 오픈 리딩 프래임은 어느 서열을 포함하는 단백질을 암호할 수 있으며 이는 천연 단백질(효소원을 포함하는), 또는 천연 단백질의 변이체, 또는 프레그먼트(예를 들어, 도메인일 수 있음); 또는 완전 합성 단백질; 또는 다른 단백질(천연 또는 합성)의 단일 또는 다중 융합체일 수 있다. 이러한 단백질은 이에 한정하는 것은 아니나 WO 01/79258, WO 01/79271, WO 01/79442, WO 01/79443, WO 01/79444 및 WO 01/79480에 제공된 리스트, 또는 이의 변이체나 프레그먼트로부터 취해질 수 있다. 이러한 특허출원은 이러한 정황에서 알부민에 대한 융합체 파트너의 단백질 리스트는 나타내나, 본 발명은 이에 한정하는 것은 아니며, 본 발명의 목적상 이에 열거된 어느 단백질은 단독으로 혹은 알부민, 면역글로블린의 Fc 리전, 트랜스페린, 락토페린 또는 어느 다른 단백질 또는 원하는 폴리펩타이드와 같이 상기 어느 것을 포함하는 융합 단백질을 포함하는 상기 어느 것의 프레그먼트 또는 변이체에 대한 융합 파트너로 존재할 수 있다. 트랜스페린 융합체의 다른 예는 미국 특허 출원 US2003/0221201 및 US2003/0226155에 주어져 있다.

본 발명에 의한 발현을 위한 원하는 단백질의 바람직한 다른 예는 모노클로날 항체, 에토포시드, 혈청 단백질(혈 응고 인자와 같은), 안티스타신, 진드기 항응고 펩타이드, 트랜스페린, 락토페린, 엔도스타틴, 안지로스타틴, 콜라겐, 면역글로블린 또는 면역글로블린-기초 분자 또는 이의 프레그먼트(예, Small Modular ImmunoPharmaceutical^TM("SMIP") 또는 dAb, Fab'프래그먼트, F(ab')2, scAb, scFv 또는 scFv 프레그먼트), Kunitz 도메인 단백질(알부민 융합체를 함유하거나 함유하지 않은 WO 03/066824에 기재된 바와 같은 것들) 인터페론, 인터루킨, IL10, IL11, IL2, 인터페론 α 종 및 아종, 인터페론 β 종 및 아종, 인터페론 γ 종 및 아종, 렙틴, CNTF, CNTF_AX15, IL1- 수용체 안타고니스트, 에리트로포에틴(EPO) 및 EPO 모사물, 트롬보포에틴(TPO) 및 TPO 모사물, 프로샙타이드, 시아노비린-N, 5-헬릭스, T20 펩타이드, T1249 펩타이드, HIV gp41, HIV gp120, 유로키나아제, 프로유로키나아제, tPA(조직 플라스미노겐 활성제), 히루딘, 혈소판 유래 성장 인자, 파라티로이드 호르몬, 프로인슐린, 인슐린, 글루카곤, 글루카곤-유사 펩타이드, 인슐린-유사 성장 인자, 칼시토닌, 성장 호르몬, 형질변형 성장 인자 β, 종양 괴사 인자, G-CSF, GM-CSF, M-CSF, FGF, 프리 폼 및 활성 폼 모두를 포함하며 이에 한정하는 것은 아니나 플라스미노겐, 피브리노겐, 트롬빈, 프리-트롬빈, 프로-트롬빈, 폰 빌레브란트 인자, α₁-안티트립신, 플라스미노겐 활성제, 팩터 VII, 팩터 VIII, 팩터 IX, 팩터 X 및 팩터 XIII를 포함하는 응집 인자, 신경 성장 인자, LACI(리포프로틴 관련 응집 억제제, 조직 팩터 경로 억제제 또는 외래 경로 억제제로도 알려짐), 혈소판-유래 내피세포 성장 인자(PD-ECGF), 글루코즈 옥시다아제, 혈청 콜린에스테라아제, 아프로티닌, 아밀로이드 전구체, 인터-알파 트립신 억제제, 안티트롬빈 III, 아포-리포프로틴 종, 프로틴 C, 프로틴 S를 포함하는 서열, 상기 어느 것의 변이체나 프레그먼트 또는 융합 단백질을 포함한다. 상기 단백질은 히루딘이거나 아닐 수도 있다.

이러한 정황에서 상기 열거된 단백질의 "변이체"는 하나 또는 그 이상의 포지션에서 보존적 혹은 비-보존적인 아미노산 삽입, 결실, 또는 치환이 존재하나, 단, 이러한 변화가 알부민 단백질에 예를 들어, 효소 활성이나 수용체 바인딩(타입 및 특정 활성), 열안정성, 특정 pH-범위에서의 활성(pH-안정성)과 같은 기본적 특성을 유의적으로 변화시키지 않는 단백질을 칭한다. 이러한 정황에서 "유의적으로"란 당 기술분야의 숙련자가 그 변이체의 특성이 여전히 다르지만 본래 단백질의 특성에 비해 명백하다고 말할 수 있음을 의미한다.

두 폴리펩타이드간의 퍼센트 서열 동일성은 예를 들어 University of Wisconsin Genetic Computing Group의 GAP 프로그램과 같은 적절한 컴퓨터 프로그램을 이용하여 검출될 수 있으며 퍼센트 동일성은 폴리펩타이드의 서열을 적절히 정렬하여 그 관계로 계산된다.

정렬은 택일적으로 Clustal W 프로그램(Thompson et al., (1994) Nucleic Acids Res., 22(22), 4673-80)을 이용하여 수행될 수 있다. 사용되는 파라미터는 다음과 같다:

패스트 페어와이즈 정렬 파라미터: K-터플(워드) 크기; 1, 윈도우 크기; 5, 갭 페널티; 3, 탑 다이아고날 수; 5. 스코어링 방법: x 퍼센트.

다중 정렬 파라미터: 갭 오픈 페널티; 10, 갭 익스텐션 페널티; 0.05.

스코어링 매트릭스: BLOSUM.

이러한 변이체는 자연적이거나 혹은 당 기술분야에 잘 알려져 있는 바와 같은 단백질 합성 및 사이트-디렉티드 돌연변이 생성 방법을 이용하여 제조될 수 있다.

이러한 정황에 있어서 상기 언급된 단백질의 "프레그먼트"는 하나 또는 그 이상의 포지션에서 결실을 갖는 단백질을 칭한다. 따라서 프레그먼트는 전체 성숙 폴리펩타이드의 완전 서열의 많아야 5, 10, 20, 30, 40 또는 50%, 전형적으로 최대 60%, 보다 전형적으로 최대 70%, 바람직하게 최대 80%, 보다 바람직하게 최대 90%, 보다 바람직하게 최대 95%, 보다 바람직하게 최대 99%를 포함한다. 특히 바람직한 원하는 단백질의 바람직한 프레그먼트는 하나 또는 그 이상의 원하는 단백질의 전체 도메인을 포함한다.

본 발명의 제1, 제2 또는 제3 견지에 따른 플라스미드는 폴리뉴클레오타이드 서열 삽입내에 또는 플라스미드의 어딘가 다른 곳에 알부민의 서열 또는 이의 프레그먼트나 변이체를 포함하는 단백질, 또는 상기 실시예로부터 취해지는 어느 다른 단백질(융합 파트너에 융합되거나 융합되지 않은)을 암호하는 오픈 리딩 프래임 및 적어도 하나의 다른 이종성 서열을 포함하며, 여기서 상기 적어도 하나의 다른 이종성 서열은 오픈 리딩 프래임과 같은 전사 리전을 함유할 수 있다. 일 구현으로, 상기 오픈 리딩 프래임은 이스트 단백질의 서열을 포함하는 단백질을 암호할 수 있다. 다른 구현으로, 상기 오픈 리딩 프래임은 단백질 폴딩에 관련되는 단백질의 서열을 포함하거나, 혹은 샤프롱 활성을 갖거나 혹은 폴딩되지 않은 단백질 반응에 관련되는 단백질, 바람직하게는 단백질 디설피드 이소머라아제를 암호할 수 있다.

그 결과물인 플라스미드는 US과 UL 리전사이에 균형을 갖거나 갖지 않을 수 있다. 예를 들어, US과 UL 리전사이에 또는 UL과 US 리전사이에 1:1, 5:4, 5:3, 5:2, 5:1 또는 5:<1의 크기 비율이 이루어질 수 있다. 본 발명의 유용성은 균형이 유지되는 것에 의존하지 않는다.

본 발명은 또한 본 발명의 플라스미드를 제조하는 방법을 제공하며, 이는

(a) REP2 유전자 또는 FLP 유전자 및 상기 유전자에 인접한 역위 반복를 포함하는 2㎛-패밀리 플라스미드를 제공하는 단계;

(b) 폴리뉴클레오타이드 서열을 제공하고 상기 폴리뉴클레오타이드 서열을 상기 플라스미드내로 본 발명의 제1, 제2 또는 제3 바람직한 견지에 따른 포지션에 삽입하는 단계; 그리고/또는

(c) 단계 (b)에 부가적으로 혹은 택일적으로, 본 발명의 제1, 제2 또는 제3 바람직한 견지에 따른 포지션에서 상기 뉴클레오타이드 염기의 일부 또는 모두를 삭제하는 단계; 그리고/또는

(d) 단계 (b) 및 (c)중 어느 하나에 부가적으로 또는 택일적으로, 본 발명의 제1, 제2 또는 제3 바람직한 견지에 따른 포지션에서 상기 뉴클레오타이드 염기의 일부 또는 모두를 택일적인 뉴클레오타이드 염기로 치환하는 단계

를 포함한다.

단계 (b), (c) 및 (d)는 Sambrook et al., Molecular Cloning: A Laboratory Manual, 2001, 3rd edition에 기술된 바와 같은 클로닝 기술, 사이트-디렉티드 돌연변이 생성 방법 등을 포함하는 당 기술분야에 잘 알려진 기술을 이용하여 달성될 수 있다. 예를 들어, 이러한 한 방법은 코헤시브 말단을 통한 라이게이션을 포함한다. 친화성 코헤시브 말단은 적절한 제한효소의 작용에 의해 삽입을 위한 DNA 프레그먼트 및 플라스미드상에 생성될 수 있다. 이러한 말단은 상보적인 염기 쌍형성을 통해 신속히 어닐링되며 잔존하는 닉은 DNA 라이게이즈의 작용에 의해 폐쇄될 수 있다.

다른 방법은 합성 이중 스트랜드 올리고뉴클레오타이드 링커 및 어댑터를 사용한다. 블런트 말단을 갖는 DNA 프레그먼트는 튀어나온 3'말단을 제거하고 우묵 들어간 3'말단을 채우는 박테리오파지 T4 DNA 폴리머라아제 또는 E. coli DNA 폴리머라아제 I에 의해 생성된다. 규정된 제한효소에 대한 인지 서열을 함유하는 블러트-말단 이중 스트랜드 DNA의 합성 링커 및 조각들은 T4 DNA 라이게이즈에 의해 블런트-말단 DNA 프레그먼트에 라이게이션될 수 있다. 이들은 실질적으로 적절한 제한 효소로 절단되어 코헤시브 말단을 형성하고 친화적 말단을 갖는 발현벡터에 라이게이션된다. 또한 어댑터는 라이게이션에 사용되는 하나의 블런트 말단을 함유하나 하나의 이행된 코헤시브 말단을 또한 소유하는 화학적으로 합성된 DNA 프레그먼트이다. 택일적으로 DNA 프레그먼트 또는 DNA 프레그먼트들은 임의로 코헤시브 말단을 함유하는 하나 또는 그 이상의 합성 이중 스트랜드 올리고뉴클레오타이드의 존재 혹은 부재하에서 DNA 라이게이즈의 작용에 의해 함께 라이게이션될 수 있다.

여러 제한 엔도뉴클레아제 사이트를 함유하는 합성 링커는 Sigma-Genosys Ltd, London Road, Pampisford, Cambridge, United Kingom을 포함하는 여러 공급원으로부터 상업적으로 이용가능하다.

따라서, 본 발명은 또한 상기 방법에 의해 획득가능한 플라스미드를 제공한다.

본 발명은 또한 상기 정의된 바와 같은 플라스미드를 포함하는 숙주 세포를 제공한다. 상기 숙주 세포는 어느 타입의 세포일 수 있다. 박테리아 및 이스트 숙주 세포가 바람직하다. 박테리아 숙주 세포가 클로닝용으로 유용할 수 있다. 이스트 숙주 세포는 플라스미드에 존재하는 유전자의 발현에 유용할 수 있다.

일 구현으로 상기 숙주 세포는 플라스미드가 다중복제 플라스미드로서 안정한 세포이다. 한 이스트 타입으로 얻어지는 플라스미드가 다른 이스트 타입에서 유지될 수 있다(Irie et al, 1991, Gene, 108(1), 139-144; Irie et al, 1991, Mol. Gen. Genet., 225(2), 257-265). 예를 들어, 지고사카로미세스 로욱시(Zygosaccharomyces rouxii)의 pSR1은 사카로미세스 세레비지아에(Saccharomyces cerevisiae)에서 유지될 수 있다. 플라스미드가 pSR1, pSB3 또는 pSB4에 기초한 경우, 숙주 세포는 지고사카로미세스 로욱시일 수 있으며, 플라스미드가 pSB1 또는 pSB2인 경우, 숙주 세포는 지고사카로미세스 베일리(Zgosaccharomyces bailli)일 수 있으며, 플라스미드가 pPM1에 기초한 경우, 숙주 세포는 피치아 멤브라나에파시엔스(Pichia membranaefaciens)일 수 있으며, 플라스미드가 pSM1에 기초한 경우, 숙주 세포는 지고사카로미세스 퍼멘타티(Zygosaccharomyces fermentati)일 수 있으며, 플라스미드가 pKD1에 기초한 경우, 숙주 세포는 클루이베로미세스 드로소필라럼(Kluyeveromyces drosophilarum)일 수 있으며 그리고 플라스미드가 2㎛ 플라스미드에 기초한 경우 숙주 세포는 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 또는 사카로미세스 칼스버제네시스(Saccharomyces carlsbergenesis)일 수 있다. 본 발명의 2㎛-패밀리 플라스미드는 만일 자연적으로 발생하는 플라스미드로부터 유래된 서열을 갖는 유전자 FLP , REP1 및 REP2중에서 하나, 두개 또는 바람직하게 세개를 포함하는 경우 자연적으로 발생하는 플라스미드에 "기초한" 것으로 칭해질 수 있다.

상기 정의한 바와 같은 플라스미드는 표준 기술을 통해 숙주내로 도입될 수 있다. 원핵 숙주 세포의 형질변형에 대해서는 예를 들어, Cohen et al(1972) Proc . Natl. Acad . Sci . USA 69, 2110 및 Sambrook et al(2001) Molecular Cloning, A Laboratory Manual, 3^rd Ed. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY를 참조 바란다. 이스트 세포의 형질변형은 Sherman et al(1986) Methods in Yeast Genetics, A Laboratory Manual, Cold Spring Harbor, NY에 기술되어 있다. Beggs(1978) Nature 275, 104-109의 방법이 또한 유용하다. 에스. 세레비지아에의 형질변형 방법은 EP 251 744, EP 258 067 및 WO 90/01063에 일반적으로 가르쳐져 있다. 척추동물 세포와 관련하여, 예를 들어 칼슘 포스페이트 및 DEAE-덱스트란 또는 리포좀 배합물과 같이 이러한 세포를 트랜스펙팅하는데 유용한 시약은 Stratagene Cloning Systems, 또는 Life Technologies Inc., Gaithersburg, MD 20877, USA로부터 이용가능하다.

일렉트로포레이션이 또한 세포를 형질변형하는데 유용하며 이스트 세포, 박테리아 세포 및 척추동물 세포를 형질변형하는 기술분야에 잘 알려져 있다. 일렉트로포레이션에 의한 형질변형 방법은 Becker & Guarente(1990) Methods Enzymol. 194, 182에 기술되어 있다.

일반적으로, 상기 플라스미드는 모든 숙주를 형질변형시키지 않을 것이며, 따라서 형질변형된 숙주 세포를 선별할 필요가 있을 것이다. 따라서, 본 발명의 제1, 제2 또는 제3 견지중 어느 하나에 따른 플라스미드는 폴리뉴클레오타이드 서열 삽입, 또는 플라스미드상의 어딘가에 이에 한정하는 것은 아니나 박테리아 선별 마커 및/또는 이스트 선별 마커를 포함하는 선별 마커를 포함할 수 있다. 다수의 다른 선별 마커가 당 기술분야에 알려져 있으나 전형적인 박테리아 선별 마커는 β-락타마아제 유전자이다. 적절한 이스트 선별 마커는 LEU2(또는 β-락타마아제 말레이트 디하이드로게나아제의 활성을 갖는 단백질을 암호하는 등가 유전자), TRP1 , HIS3, HIS3 , URA3 , URA5 , SFA1 , ADE2 , MET15 , LYS5 , LYS2 , ILV2 , FBA1 , PSE1 , PDI1 및 PGK1을 포함한다. 이용가능한 다른 옵션의 견지로, 가장 적절한 선별 마커가 선택될 수 있다. 만일 그렇게 수행되는 것이 원하여 지는 경우 URA3 및/또는 LEU2가 회피될 수 있다. pgk1 이스트 스트레인에서 PGK1에 대해 입증된 바와 같이(Piper 및 Curran, 1990, Curr . Genet. 17, 119), 당 기술분야의 숙련자는 염색체 결실 또는 불활성화가 생존불가능한 숙주를 야기하는 어느 유전자, 소위 필수 유전자는 만일 작용 유전자가 플라스미드상에 제공되는 경우 선별 마커로 사용될 수 있다는 것을 인식할 것이다. 적절한 필수 유전자는 Stanford Genome Database(SGD)(http::db.yeastgenome.org)에서 발견될 수 있다.

또한, 본 발명의 제1, 제2 또는 제3 견지중 어느 하나에 따른 플라스미드는 폴리뉴클레오타이드 서열 삽입내에 또는 플라스미드상의 어딘가에 하나이상의 선별 마커를 포함할 수 있다.

한 선별 기술은 발현벡터내로 형질변형된 세포내에 선별가능한 형질을 암호하는 어느 필수 조절 엘리먼트를 갖는 DNA 서열 마커를 편입시키는 것을 포함한다. 이러한 마커는 디하이드로폴레이트 환원효소, G418 또는 진핵 세포 배양을 위한 네오마이신 저항성 유전자, 및 E. coli 및 다른 박테리아에서 배양을 위한 테트라사이클린, 카나마이신 또는 앰피실린(즉, β-락타마아제) 저항성 유전자를 포함한다. 택일적으로, 이러한 선별가능한 특성을 위한 유전자는 원하는 숙주 세포를 동시-형질변형시키는데 사용되는 다른 벡터에 사용될 수 있다.

형질변형된 세포를 성공적으로 확인하는 다른 방법은 임의로, 재조합 폴리펩타이드(즉, 플라스미드상의 폴리뉴클레오타이드 서열에 의해 암호화되고, 그 폴리뉴클레오타이드가 그 숙주에 의해 자연적으로 생성되지 않는 점에서 숙주 세포에 이종성인 폴리뉴클레오타이드)의 발현이 이루어지도록 본 발명의 플라스미드의 도입으로 얻어지는 세포를 성장시키는 것을 포함한다. 세포는 수거되고 용해될 수 있으며 이들의 DNA 또는 RNA 컨텐트를 Southern(1975) J. Mol . Biol . 98, 503 또는 Berent et al(1985) Biotech 3, 208, 또는 당 기술분야에 일반적인 다른 DNA 및 RNA 분석 방법에 의해 재조합 서열의 존재에 대해 조사한다. 택일적으로, 형질변형된 세포 배양물의 상층액내에 폴리펩타이드의 존재는 항체를 이용하여 검출될 수 있다.

재조합 DNA의 존재에 대해 직접적인 검출에 부가적으로, 성공적인 형질변형은 재조합 DNA가 단백질 발현을 지시할 수 있는 경우 잘 알려진 면역학적 방법에 의해 확인될 수 있다. 예를 들어, 발현 벡터로 성공적으로 형질변형된 세포는 적절한 항원성을 나타내는 단백질을 생성한다. 형질변형된 것으로 의심되는 세포 시료를 수거하고 적절한 항체를 이용하여 그 단백질에 대해 조사한다.

따라서, 형질변형된 숙주 세포에 부가적으로, 본 발명은 또한 이러한 세포의 배양물, 바람직하게 모노클로날(동종성으로 클로닝된) 배양물, 또는 배지에서 모노클로날 배양물로부터 유래된 배양물을 포함한다. 택일적으로, 형질변형된 세포는 그 자체로 산업적으로/상업적으로 또는 약학적으로 유용한 제품을 나타내며, 배양 배지로부터 정제될 수 있고 임의로 이의 의도된 산업적/상업적 또는 약학적 용도에 적절한 방식으로 담체 또는 희석제와 함께 배합될 수 있으며, 그리고 임의로 이의 사용에 적절한 방식으로 포장되고 주어질 수 있다. 예를 들어, 전체 세포(whole cell)를 고정할 수 있으며; 또는 세포 배양물을 공정, 작물 또는 다른 원하는 표적에 또는 그 안으로 직접 분사하는데 사용될 수 있다. 마찬가지로, 이스트 세포와 같은 전체 세포는 방향제, 향료 및 약제와 같은 상당히 다양한 적용처에 캡슐로 사용될 수 있다.

그 다음 형질변형된 숙주 세포는 플라스미드내에 하나 또는 그 이상의 폴리뉴클레오타이드 서열 삽입물내 어느 ORF(s)의 발현이 이루어지도록 충분한 시간동안 당 기술분야의 숙련자에게 알려진 적절한 조건하에서, 그리고 본 명세서에 기재된 가르침의 견지로 배양될 수 있다.

본 발명은 또한 (a) 상기 정의한 바와 같은 본 발명의 제1, 제2 또는 제3 견지에 따른 플라스미드를 제공하는 단계; (b) 적절한 숙주 세포를 제공하는 단계; (c) 상기 숙주 세포를 상기 플라스미드로 형질변형시키는 단계; 및 (d) 배양 배지에서 형질변형된 숙주 세포를 배양하여 이에 따라 그 단백질을 생성하는 단계를 포함하는 단백질 생성 방법을 제공한다.

박테리아(예, 이. 콜라이(E. coli) 및 바실러스 서브틸리스(Bacillus subtilis)), 이스트, 필라멘트성 균류(예, 아스퍼질러스(Aspergillus)), 식물 세포, 전체 식물, 동물 세포 및 곤충 세포를 포함하는 다수의 발현 시스템이 알려져 있다.

일 구현으로 바람직한 숙주 세포는 플라스미드가 안정한 다중복제 플라스미드로 유지될 수 있는 이스트이다. 이러한 이스트는 사카로미세스 세레비지아에(Saccharomyces cerevisiae), 클루이베로미세스 락티스(Kluyveromyces lactis), 피치아 파스트로리스(Pichia pastroris), 지고사카로미세스 로욱시(Zygosaccharomyces rouxii), 지고사카로미세스 베일리(Zygosaccharomyces bailii), 지고사카로미세스 퍼멘타티(Zygosaccharomyces fermentati), 및 클루이베로미세스 드로스필라럼(Kluyveromyces drosphilarum)을 포함한다.

만일 플라스미드가 선별가능한(예, LEU2) 마커를 함유하도록 변형되며 상기 마커의 소실에 의해 측정시, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 50, 60, 70, 80, 90, 100 또는 그 이상의 세대 이후에 적어도 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.9% 또는 실질적으로 100%의 안정성을 갖는 경우에 플라스미드는 숙주에서 안정한 다중복제 플라스미드로 유지될 수 있다. 마커의 소실은 Chinery & Hinchliffe(1989, Curr . Genet., 16, 21-25)를 참고로 상기한 바와 같이 평가될 수 있다.

예를 들어, 유전자 암호 서열의 붕괴에 의한 것과 같이 단백질의 O-글리코실화에 관련되는 하나 또는 그 이상의 만노실 트랜스퍼라아제가 결핍된 이스트를 사용하는 것이 특히 유리하다.

재조합적으로 발현되는 단백질은 숙주 세포에 의해 바람직하지 않은 번역후 변형이 일어날 수 있다. 예를 들어, 상기 알부민 단백질 서열은 N-결합 글리코실화를 위한 어느 사이트를 함유하지 않으며 그리고 O-결합 글리코실화에 의해 자연적으로 변형되는 것이 보고된 바 없다. 그러나, 다수의 이스트 종에서 생성되는 재조합 사람 알부민("rHA")은 일반적으로 만노즈와 관련된 O-결합 글리코실화에 의해 변형될 수 있는 것으로 발견되었다. 만노실화 알부민은 렉틴 콘카나발린 A에 바인딩할 수 있다. 이스트에 의해 생성되는 만노실화 알부민의 양은 하나 또는 그 이상의 PMT 유전자가 결핍된 이스트 스트레인을 이용하여 감소될 수 있다(WO 94/04687). 이를 달성하는 가장 편리한 방법은 Pmt 단백질중 하나를 감소된 수준으로 생성되도록 그 게놈내에 결핍된 이스트를 생성하는 것이다. 예를 들어, Pmt 단백질이 거의 혹은 전혀 생성되지 않도록 암호 서열 또는 조절 리전에서(또는 PMT 유전자중 하나의 발현을 조절하는 다른 유전자에서) 결실, 삽입 또는 전위가 있을 수 있다. 택일적으로, 상기 이스트는 항-Pmt 항체와 같은 항-Pmt 제제를 생성하도록 형질변형될 수 있다.

만일 에스. 세레비지아에 이외에 다른 이스트가 사용된다면, 예를 들어, 피치아 파스트로리스(Pichia pastroris) 및 클루이베로미세스 락티스(Kluyveromyces lactis)에서 에스. 세레비지아에의 PMT 유전자와 등가인 하나 또는 그 이상의 유전자의 붕괴가 또한 유리할 수 있다. 에스. 세레비지아에로부터 분리된 PMT1(또는 어느 다른 PMT 유전자)의 서열이 다른 균류 종에서 유사한 효소 활성을 암호하는 유전자의 확인 또는 붕괴에 사용될 수 있다. 클루이베로미세스 락티스(Kluyveromyces lactis)의 PMT1 동족체의 클로닝은 WO 94/04687에 기재되어 있다.

상기 이스트는 유리하게 WO 95/33833 및 WO 95/23857에 각각 가르쳐진 바와 같은 HSP150 및/또는 YAP3 유전자의 결실을 갖는다.

본 발명은 또한 상기 정의한 바와 같이 본 발명의 플라스미드를 포함하는 숙주 세포를 제공하는 단계 및 상기 숙주 세포를 배양 배지에서 배양하여 그 단백질을 생성하는 단계를 포함하는 단백질 생성 방법을 제공한다. 상기 배양 배지는 비-선별적이거나 플라스미드의 안정한 다중복제 유지시 선별적인 상태에 놓여질 수 있다.

본 발명의 플라스미드로부터 발현되는 단백질을 생성하는 방법은 바람직하게 배양된 숙주 세포 또는 배양 배지로부터 이에 따라 생성된 단백질을 분리하는 단계를 더욱 포함한다.

이에 따라 생성된 단백질은 세포내에 존재할 수 있으며, 또는 분비된 경우에는 배양 배지내에 및/또는 숙주 세포의 세포질 주변에 존재할 수 있다. 상기 단백질은 상기 세포 및/또는 배양 배지로부터 당 기술분야에 알려진 다수 방법에 의해 분리될 수 있다. 예를 들어, 재조합적으로 발현되는 알부민의 회수를 위한 정제 기술은 다음과 같이 기재되어 있다. WO 92/04367에는 매트릭스-유래 염료의 제거가 기재되어 있으며, EP 464 590에는 이스트-유래 착색제의 제거가 기재되어 있으며, EP 319 067에는 알칼린 침전 및 알부민의 친지질성 상으로의 후속적 적용이 기재되어 있으며, 그리고 WO 96/37515, US 5 728 553 및 WO 00/44772에는 전체 정제 공정이 기재되어 있다. 알부민 이외의 다른 단백질은 이러한 단백질을 정제하는데 유용한 것으로 발견된 어느 기술에 의해 배양 배지로부터 정제될 수 있다.

이러한 잘 알려진 방법은 암모늄 설페이트 또는 에탄올 침전, 산 또는 용매 추출, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀룰로오즈 크로마토그래피, 소수성 상호작용 크로마토그래피, 친화 크로마토그래피, 수산화인회석(hydroxylapatite) 크로마토그래피, 렉틴 크로마토그래피, 농축, 희석, pH 조정, 정용여과, 한외여과, 고성능 액체 크로마토그래피("HPLC"), 역상 HPLC, 전도성 조정 등을 포함한다.

일 구현으로, 이에 따라 분리된 단백질을 상업적으로 허용가능한 순도 수준으로 더욱 정제하는데 상기 언급된 기술 중 어느 하나이상이 사용될 수 있다. 상업적으로 허용가능한 수준의 순도는 적어도 0.01 g.L^-1, 0.02 g.L^-1, 0.03 g.L^-1, 0.04 g.L^-1, 0.05 g.L^-1, 0.06 g.L^-1, 0.07 g.L^-1, 0.08 g.L^-1, 0.09 g.L^-1, 0.1 g.L^-1, 0.2 g.L^-1, 0.3 g.L^-1, 0.4 g.L^-1, 0.5 g.L^-1, 0.6 g.L^-1, 0.7 g.L^-1, 0.8 g.L^-1, 0.9 g.L^-1, 1 g.L^-1, 2 g.L^-1, 3 g.L^-1, 4 g.L^-1, 5 g.L^-1, 6 g.L^-1, 7 g.L^-1, 8 g.L^-1, 9 g.L^-1, 10 g.L^-1, 15 g.L^-1, 20 g.L^-1, 25 g.L^-1, 30 g.L^-1, 40 g.L^-1, 50 g.L^-1, 60 g.L^-1, 70 g.L^-1, 80 g.L^-1, 90 g.L^-1, 100 g.L^-1,150 g.L^-1, 200 g.L^-1, 250 g.L^-1, 300 g.L^-1, 350 g.L^-1, 400 g.L^-1, 500 g.L^-1, 600 g.L^-1, 700 g.L^-1, 800 g.L^-1, 900 g.L^-1, 1000 g.L^-1, 또는 그 이상의 농도로 단백질을 공급하는 것을 포함한다.

이에 따라 정제된 단백질은 동결건조된다. 택일적으로 이는 담체 또는 희석제와 함께 배합될 수 있으며, 임의로 단위 형태로 존재할 수 있다.

단백질은 약학적으로 허용가능한 수준의 순도로 분리되는 것이 바람직하다. 만일 그 단백질이 본질적으로 발열원이 없으며 그 단백질의 활성과 관련되지 않은 의학적 영향을 일으키지 않고 약학적으로 효과적인 양으로 투여될 수 있다면, 약학적으로 허용가능한 수준의 순도를 갖는다.

그 결과물인 단백질은 알려진 어느 효용처에 사용될 수 있으며, 알부민의 경우 중증 화상, 쇼크 및 실혈을 치료하기위해 환자에게 i.v. 투여하는 것, 배양 배지를 보충하는 것, 그리고 다른 단백질의 배합물에 부형제로 보충하는 것을 포함한다.

본 발명의 방법에 의해 얻어진 치료적으로 유용한 원하는 단백질이 단독으로 투여될 수 있지만, 하나이상의 허용가능한 담체나 희석제와 함께 약학 배합물로서 제공되는 것이 바람직하다. 상기 담체(들) 또는 희석제(들)는 원하는 단백질과 친화적이며 이의 수용자에게는 유해하지않은 견지로 "허용가능"하여야 한다. 전형적으로, 상기 담체 또는 희석제는 멸균되고 발열원이 없는 물이나 염수가 될 것이다.

임의로, 이에 따라 배합된 단백질은 정제, 캡슐, 주사가능한 용액 등의 형태와 같은 단위 투여 형태로 제공될 것이다.

본 발명자들은 "필수" 단백질의 서열을 포함하는 단백질을 암호하는 플라스미드로 운반되는 유전자가 상기 플라스미드의 부재하에서 상기 필수 단백질을 생성하지 않는 숙주 세포에서 상기 플라스미드를 안정하게 유지하는데 사용될 수 있음을 또한 입증하였다. 바람직한 필수 단백질은 선별 마커로서 작용할 뿐만 아니라 플라스미드 안정성을 증가시켜주며, 이의 발현은 동시에 숙주 세포내에서 재조합 유전자에 의해 암호화되는 이종성 단백질의 발현을 증가시켜주는 추가적인 잇점을 제공할 수 있는 필수 샤프롱이다. 이 시스템은 사용자가 플라스미드에 의해 운반되는 것이 요구되는 재조합 유전자의 수를 최소화하는 것을 가능케 한다. 예를 들어, 전형적인 종래기술의 플라스미드는 숙주 세포 배양 공정도중에 플라스미드를 안정하게 유지되도록 하는 것을 가능케 하는 마커 유전자(상기한 바와 같이 기재된 것들)를 운반한다. 이러한 마커 유전자는 원하는 효과를 달성하는데 필요로 하는 어느 다른 유전자에 부가적으로 플라스미드상에 보유될 필요가 있다. 그러나, 외생성 DNA 서열을 편입하는 플라스미드의 능력은 제한되며, 이에 따라 원하는 효과를 달성하는데 필요한 서열 삽입의 수를 최소화하는 잇점이 있다. 더욱이, 일부 마커 유전자(영양 요구성 마커 유전자와 같은)는 그 마커 유전자의 효과를 얻기위해 특정 조건하에서 생성되어야 하는 배양 공정이 요구된다. 이러한 특정 조건은 세포 성장 또는 단백질 생성에 최적이 아닐 수 있으며, 또는 불충분하거나 과도하게 비용이 많이 드는 성장 시스템이 사용되는 것을 필요로 할 수 있다.

따라서, 플라스미드로 운반되는 유전자로서 "필수 단백질"의 서열을 포함하는 단백질을 재조합적으로 암호하는 유전자를 상기 플라스미드의 부재하에서 상기 "필수 단백질"을 생성하는 것이 불가능한 세포에서 플라스미드 안정성을 증가시키는데 사용하는 것이 가능하다.

상기 "필수 단백질"은 숙주 세포내에서 그 암호 유전자(들)이 결실되거나 불활성화되는 경우, 상기 숙주 세포가 영양 요구성(생합성) 요구를 발달시키지 않는 것이다. "영양 요구성(생합성) 요구"란 성장 배지에 첨가 또는 변형에 의해 보완될 수 있는 결핍을 포함한다. 따라서, 본 발명의 이러한 정황에서 "필수 단백질"을 암호하는 "필수 마커 유전자"는 숙주 세포에서 결실 또는 불활성화되는 경우에 성장 배지에 첨가 또는 변형에 의해 보완될 수 없는 결핍을 일으키는 것이다. 이러한 시스템의 잇점은 "필수 마커 유전자"가 플라스미드의 부재하에서 그 유전자 산물을 생성할 수 없는 숙주 세포에서 플라스미드상에 선별 마커로 사용되어 상기 세포를 특정 선별(예, 선별 배지) 조건하에서 배양할 필요가 있는 불리함없이 증가된 플라스미드 안정성을 달성할 수 있다는 것이다. 따라서, 상기 숙주 세포는 플라스미드 안정성을 잃지않고 어느 특정 마커 유전자에 적응될 필요 없는 조건하에서 배양될 수 있다. 예를 들어, 이러한 시스템을 이용하여 생성된 숙주 세포는 복합 또는 완전치 배지와 같은 비-선별 배지에서 배양될 수 있으며, 이는 영양 요구성 마커 유전자에 영향을 미치도록 통상적으로 사용되는 최소 배지보다 경제적일 수 있다.

예를 들어, 상기 세포는 결실되거나 아니면 불활성화된 내생성 유전자 똔느 유전자들을 가질 수 있다.

만일 상기 "필수 단백질"이 "필수" 샤프롱인 경우, 선별 성장 조건이 필요없이 플라스미드 안정성을 향상시키고 숙주 세포에서 내생적으로 암호화되거나 이종성인 단백질과 같은 단백질의 생성을 증가시키는 이중 잇점을 제공할 수 있으므로 특히 바람직하다. 만일 숙주 세포에 의해 단백질 생성을 증가시키는 필수 샤프롱의 과발현을 사용하는 것이 선택되는 경우에, 이 시스템은 또한 플라스미드에 의해 운반될 필요가 있는 재조합 유전자의 수를 최소화시키는 잇점을 갖는다.

본 발명의 이러한 견지에서 사용되는 바람직한 "필수 단백질"은 "필수" 샤프롱 PD11 및 PSE1, 및 단백질을 암호하는 내생성 유전자(들)이 숙주 세포에서 결실되거나 불활성화되는 경우에 숙주 세포가 영양 요구성(생합성) 요구를 발달시키지 않는 PGK1 또는 FBA1과 같은 다른 "필수" 유전자를 포함한다.

따라서, 제4 견지로 본 발명은 (본 발명의 제1, 제2 또는 제3 견지중 어느 하나에 따른 플라스미드와 같은) 플라스미드를 포함하는 숙주 세포를 또한 제공하며, 상기 플라스미드는 상기 플라스미드의 부재하에서 상기 숙주 세포가 샤프롱을 생성할 수 없는 필수 샤프롱을 암호하는 유전자를 포함한다. 바람직하게, 상기 플라스미드의 부재하에서 상기 숙주 세포는 생존 불가능하다. 상기 숙주 세포는 또한 본 발명의 앞서 언급된 견지와 관련하여 상술된 것들과 같이 이종성(또는 재조합 유전자가 숙주 세포에 의해 암호화된 단백질과 서열이 일치하는 단백질을 암호하는 점에서 동종성인) 단백질을 암호하는 재조합 유전자를 포함한다.

본 발명은 또한 제5 견지로 단독의 선별 마커로서 필수 샤프롱을 암호하는 유전자를 포함하는 플라스미드를 제공한다. 상기 플라스미드는 또한 이종성 단백질을 암호하는 유전자를 포함할 수 있다. 상기 플라스미드는 2㎛-패밀리 플라스미드일 수 있으며, 바람직하게는 본 발명의 제1, 제2 또는 제3 견지중 어느 하나에 따른 플라스미드이다.

본 발명은 또한 제6 견지로 플라스미드는 필수 샤프롱을 암호하는 유전자를 포함하며, 숙주 세포는 플라스미드의 부재하에서 샤프롱을 생성할 수 없으며 그리고 숙주 세포는 또한 이종성 단백질을 암호하는 재조합 유전자를 포함하는 플라스미드를 포함하는 숙주 세포를 제공하는 단계; 상기 필수 샤프롱 및 이종성 단백질의 발현이 이루어지는 조건하에서 배양 배지에서 숙주 세포를 배양하는 단계; 및 임의로 배양된 숙주 세포 또는 배양 배지로부터 이에 따라 발현된 이종성 단백질을 정제하는 단계; 및 추가적인 임의로 이에 따라 정제된 단백질을 동결건조하는 단계를 포함하는 이종성 단백질 생성 방법을 제공한다.

상기 방법은 또한 정제된 이종성 단백질을 담체 또는 희석제와 함께 배합하는 단계 및 임의로 이에 따라 정제된 단백질을 상기 언급한 방식으로 단위 투여 형태로 제공하는 단계를 포함할 수 있다. 비람직한 일 구현으로, 상기 방법은 완전 배지와 같은 비선별 배지에서 숙주 세포를 배양하는 것을 포함한다.

도 1은 2㎛ 플라스미드의 플라스미드 맵을 나타낸다.

도 2는 pSAC35의 플라스미드 맵을 나타낸다.

도 3은 일부 예시된 FLP 삽입 사이트를 나타낸다.

도 4-8, 10, 11, 13-32, 36-42, 44-46, 48-54 및 57-76은 여러가지 플라스미드의 맵을 나타낸다.

도 9는 PDII 유전자를 함유하는 pDB2429를 나타낸다.

도 12는 일부 예시된 REP2 삽입부를 나타낸다.

도 33은 실시예에 관련된 표 3을 나타낸다.

도 34는 SEQ ID NO: 1을 나타낸다.

도 35는 SEQ ID NO: 2를 나타낸다.

도 43은 PCR 프라미머 DS248 및 DS250이다.

도 47은 여러 가지 pSAC35-유래 플라스미드를 함유하는 에스. 세레비지아에에 대한 비선별 액체 배양물에서 세대 성장의 수가 증가되는 플라스미드 안정성을 보여준다.

도 55는 RIE의 결과를 나타낸다. 10mL YEPD 쉐이크 플라스크에 pDB3078로부터 분리된 1.41kb NotI/PstI pdi1 :: TRP1 디스럽핑 DNA 프레그먼트로 트립토판 프로토트로피에 대해 형질변형된 DXY1 trp1 Δ[pDB2976], DXY1 trp1 Δ[pDB2977], DXY1 trp1Δ[pDB2978], DXY1 trp1 Δ[pDB2979], DXY1 trp1 Δ[pDB2980] 또는 DXY1 trp1 Δ[pDB2981]를 접종하였다. 형질변형체를 30℃, 200rpm으로 4일간 성장시켰다. 로켓 면역전기영동 겔(Weeke, B. 1976. Rocket immunoelectrophoresis. In N. H. Azelsen, J. Kroll, 및 B. Weeke[eds.], A manual of quantitative immunoelectrophoresis. Methods and applications. Universitetsforlaget, Oslo, Norway)의 웰당 4μL 배양 상층액을 적재하였다. rHA 표준 농도는 ㎍/mL로 700μL 고트 항-HA(5mL 물에 재부유된 Sigma 제품 A-1151)/50mL 아가로즈이다. 프리시핀은 쿠마시 블루로 염색되었다. 계속되는 분석을 위해 선택된 분리물을 표시하였다(*).

도 56은 RIE의 결과를 나타낸다. 10mL YEPD 쉐이크 플라스크에 DXY1 [pDB2244], DXY1 [pDB2976], DXY1 trp1 Δ pdi1 :: TRP1 [pDB2976], DXY1 [pDB2978], DXY1 trp1 Δ pdi1 :: TRP1 [pDB2978], DXY1 [pDB2980], DXY1 trp1 Δ pdi1 :: TRP1 [pDB2980], DXY1 [pDB2977], DXY1 trp1 Δ pdi1 :: TRP1 [pDB2977], DXY1 [pDB2979] DXY1 trp1 Δ pdi1 :: TRP1 [pDB2979], DXY1 [pDB2981] 및 DXY1 trp1 Δ pdi1 :: TRP1 [pDB2981]를 접종하rh, 30℃, 200rpm으로 4일간 성장시켰다. 로켓 면역전기영동 겔의 웰당 4μL 배양 상층액을 적재하였다. rHA 표준 농도는 ㎍/mL로 800μL 고트 항-HA(5mL 물에 재부유된 Sigma 제품 A-1151)/50mL 아가로즈이다. 프리시핀은 쿠마시 블루로 염색되었다. 계속되는 분석을 위해 선택된 분리물을 표시하였다(*).

이러한 실시예는 β- 락타마아제 유전자(이스트내로 형질변형후 플라스미드로부터 소실되는 앰피실린 저항성을 위한), LEU2 선별 마커 및 올리고뉴클레오타이드 링커(이중 후자 둘은 2㎛-패밀리 디스인테그레이션 벡터, pSAC3(참조 EP 0 286 424)의 UL-리전내 유일한 SnaBI-사이트내로 삽입됨)를 포함하는 도 2에 나타낸 타입의 일반적으로 pSAC35로 명명되는 2㎛-패밀리 플라스미드의 US-리전내 제한 엔도뉴클레아제 사이트에 의해 규정된 다수의 포지션내로 부가적인 DNA 서열의 삽입을 설명한다. 선택된 사이트는 REP2 및 FLP 암호 리전의 3'-말단쪽을 향하거나 또는 그 하위 역위 반복 서열내이다. 짧은 합성 DNA 링커를 각 사이트내로 삽입하고 변형된 플라스미드의 상대적인 안정성을 비선별 배지에서 성장도중 비교하였다. DNA 삽입을 위한 바람직한 사이트가 확인되었다. "관심 대상의 유전자"을 함유하는 보다 긴 DNA 프레그먼트의 삽입은 PD11 유전자를 함유하는 DNA 프레그먼트를 REP2이 후의 XcmI-사이트내로 삽입함으로써 입증되었다.

실시예 1

pSAC35 의 스몰 유니크 리전내 XcmI - 사이트내로 합성 DNA 링커의 삽입

pSAC35의 US-리전내로 부가적인 DNA의 삽입을 위해 초기에 평가한 사이트는 599-bp 역위 반복내 XcmI-사이트이었다. 한 XcmI-사이트는 REP2 번역 종결 코돈이후 51-bp를 자르는데 반해, 다른 하나의 XcmI-사이트는 역위 반복와의 오버랩에 기인하여 FLP 암호 서열의 말단이전 127-bp를 자른다(참조 도 3).

삽입된 서열은 올리고뉴클레오타이드 CF86 및 CF87의 0.5mM 용액을 어닐링하여 제조된 52-bp 링커이었다. 이 DNA 링커는 암호화된 제한 사이트가 pSAC35에 없는 코어 리전 "SnaBI-PacI-FseI/SfiI-SmaI-SnaBI"을 함유하였다.

XcmI 링커(CF86+CF87)

플라스미드 pSAC35는 XcmI으로 부분 다이제스팅되고, 선형 11-kb 프레그먼트는 0.7%(w/v) 아가로즈 겔로 분리되고 CF86/CF87 XcmI 링커(그대로, 10^-1 및 10^-2 희석)로 라이게이션되고 E. coli DH5α내로 형질변형되었다. 앰피실린 저항성 형질변형체를 선별하고 SmaI 다이제스팅에 의해 선형화될 수 있는 플라스미드의 존재에 대해 스크리닝하였다. 제한 효소 분석으로 REP2이후의 XcmI-사이트내로 클로닝된 링커를 갖는 pDB2688(도 4)을 확인하였다. 올리고뉴클레오타이드 프라이머 CF88, CF98 및 CF99(표 1)를 이용한 DNA 시퀀싱으로 올바른 링커 서열이 함유된 삽입물을 확인하였다.

표 1: 올리고뉴클레오타이드 시퀀싱 프라이머:

제한 효소 분석으로 또한 FLP 유전자내 XcmI-사이트내로 클로닝된 링커를 갖는 pDB2689(도 5)를 확인하였다. 그러나, pDB2689내 링커는 프라이머 CF90 및 CF91을 이용한 DNA 시퀀싱에 의해 FseI/SfiI 사이트(CF86+CF87 링커내 굵게 표시된)내에 G:C 염기쌍 소실을 갖는 것으로 나타났다. 이는 번역 종결 코돈이전의 56개의 다른 아미노산으로 대체된 39 C-말단 아미노산 잔기를 갖는 돌연변이 Flp-단백질에 대한 암호 서열을 생성하였다.

pDB2689 링커 서열에서 염기쌍 소실은 pDB2786을 생성하도록 수정되었다(도 6). 이를 달성하기위해, 올리고뉴클레오타이드 CF104 및 CF105로부터 31-bp 5'-포스포릴레이티드 SnaBI-링커를 제조하였다. 이는 CIAP(calf intestinal alkaline phosphatase)로 미리 처리된 pDB2689의 SnaBI 사이트내로 라이게이션되었다. CF90, CF91, CF100 및 CF101을 이용한 DNA 시퀀싱으로 pDB2786내 올바른 DNA 링커 서열을 확인하였다. 이는 번역 종결이전 14개의 다른 잔기로 대체된 39 C-말단 잔기를 갖는 돌연변이 Flp-단백질에 대한 암호 서열을 생성하였다.

Sna BI 링커( CF104 + CF105 )

pDB2786에 반대 방향으로 SnaBI 링커의 라이게이션에 의해 부가적인 플라스미드, pDB2789(도 7)를 또한 제조하였다. pDB2798내에 링커 서열은 DNA 시퀀싱에 의해 확인되었다. 플라스미드 pDB2798은 전사 종결이전 8개의 다른 잔기로 대체된 39 C-말단 잔기를 갖는 돌연변이 Flp-단백질에 대해 암호하는 서열을 함유하였다.

또한 삽입 사이트에 Flp 단백질을 트렁캐이팅하기위해 FLP 유전자내 XcmI-사 이트내로 링커를 클로닝하였다. 사용된 링커는 올리고뉴클레오타이드 CF120 및 CF121로부터 제조된 45-bp 5'-포스포릴레이티드 XcmI-링커이었다.

Xcm I 링커( CF120 + CF121 )

이 CF120/CF121 XcmI 링커는 XcmI으로 부분 다이제스팅에 의해 생성된 11-kb pSAC35 프레그먼트로 라이게이션된 다음 CIAP로 처리되었다. 앰피실린 저항성 E. coli DH5α 형질변형체의 분석으로 pDB2823(도 8)을 함유하는 클론을 확인하였다. 프라이머 CF90, CF91, CF100 및 CF101을 이용한 DNA 시퀀싱으로 pDB2823내의 링커 서열을 확인하였다. 삽입된 링커내의 번역 종결은 41 C-말단 잔기가 결여된 Flp(1-382)의 생성을 일으킬 수 있다.

링커 서열의 pSAC35내 XcmI-사이트내로의 삽입으로부터 플라스미드 안정성에 대한 강도는 pDB2688 및 pDB2689에 대해 평가되었다. 플라스미드 안정성은 YEPS에서 비선별 배양 도중 LEU2 마커의 소실에 의해 에스. 세레비지아에에서 검출되었다. pSAC3와 구조적으로 유사하나 LEU2 선별 마커를 함유하는 SnaBI 사이트에 삽입 된 부가적인 DNA를 함유하는 pSAC35로 형질변형된 동일한 이스트 스트레인이 대조군으로 사용되었다(Chinery & Hinchliffe, 1989, Curr . Genet., 16. 21).

상기 이스트 스트레인은 변형 리튬 아세테이트 방법을 이용하여 루신 프로토트로피로 형질변형되었다(Sigma yeast transformation kit, YEAST-1, protocol 2; (Ito et al, 1983, J. Bacteriol ., 153, 163; Elble, 1992, Biotechniques, 13, 18)). 형질변형체는 BMMD-agar 플래이트상에서 선별되었으며 후속적으로 BMMD-agar 플래이트상에서 패치아웃 되었다. 저온 보존된 트리할로즈 스톡을 10mL BMMD 쉐이크 플라스크 배양물(24시간, 30℃, 200rpm)로부터 제조하였다.

YEPD 및 BMMD의 조성물은 Sleep et al., 2002, Yeast 18, 403에 기재되어 있다. YEPS 및 BMMS는 단독 초기 탄소 공급원으로서 2%(w/v) 글루코즈가 2%(w/v) 수크로즈로 대체된 것을 제외하고 YEPD 및 BMMD와 조성이 동일하다.

플라스미드 안정성을 조사하기위해 1mL 저온 보존된 스톡을 녹이고 250mL 코니컬 플라스크에 담긴 100mL YEPS(초기 OD₆₀₀

0.04-0.09)내로 접종하고 오비탈 쉐이커(200rpm, Innova 4300 인큐베이터 쉐이커, New Brunswick Scientific)에서 30℃로 약 72시간동안 배양하였다.

각 플라스크로부터 시료를 제거하고 YEPS-broth(10^-2 내지 10^-5 희석), 100μL 분액을 YEPS-아가 플래이트상에 이중으로 플래이팅하였다. 세포를 30℃에서 3-4일간 성장시켜 단일 콜로니를 형성시켰다. 각각의 이스트 스톡을 분석하기위해, 100개의 무작위 콜로니를 BMMS-아가 플래이트에 반복하여 패치한 다음 YEPS-아가 플래이트에서 마찬가지로 수행하였다. 30℃에서 3-4일간 성장시킨 후 BMMS-아가 플래이트 및 YEPS-아가 플래이트 모두에서 콜로니 성장의 퍼센트를 플라스미드 안정성 척도로 측정하였다.

형질변형체로부터 LEU2 마커의 소실을 측정한 상기 분석에서, pSAC35 및 pDB2688은 100% 안정한 것으로 나타났으며, pDB2689는 72% 안정한 것으로 나타났다. 나아가, 전사 서열을 변경시키고 599-bp 역위 반복간의 상동성을 분열시킴에도 불구하고 상기 링커를 REP2이후의 XcmI-사이트내로 삽입하는 것은 플라스미드 안정성에 명백한 영향을 주지 않았다. FLP내 XcmI 사이트로의 삽입 역시 역위 반복의 분열 및 Flp 단백질의 변이 모두에도 불구하고 예기치않게 안정한 플라스미드를 이끌었다.

실시예 2

PDI1 유전자의 pDB2688 의 XcmI 링커내로의 삽입

라지 DNA 프레그먼트의 2㎛-유사 벡터내로의 삽입은 에스. 세레비지아에 PDI1 유전자를 pDB2688의 XcmI 링커내로 클로닝함으로써 입증되었다. PD11 유전자(도 9)는 상기 PDI1 유전자를 함유하는 보다 큰 에스. 세레비지아에 SKQ2n 게노믹 DNA 프레그먼트의 1.9kb SacI-SpeI 프레그먼트(US 6,291,205에 기재되어 있으며 그리고 또한 Crouzet & Tuite, 1987, Mol . Gen. Genet., 210, 581-583 및 Farquhar et al, 1991(상기 참조)에서 Clone C7로 기재된 플라스미드 pMA3a:C7로 제공되는 바와 같은)상에서 클로닝되었으며, 이는 YIplac211(Gietz & Sugino, 1988, Gene, 74, 527-534)내로 클로닝되었으며 PDI1 유전자의 3' 비번역 리전내 유일한 Bsu36I-사이트에 삽입된 SacI 제한 사이트를 함유하는 합성 DNA 링커를 가졌다. 상기 1.9kb SacI-SpeI 프레그먼트는 T4 DNA 폴리머라아제로 처리하여 SpeI 5'-오버행을 채우고 SacI 3'-오버행을 제거하였다. 번역 개시 코돈의 PDI1 프로모터 상위의 212-bp 및 번역 종결 코돈의 148-bp 하위을 포함하였다. 이를 SmaI 선형화/CIAP 처리된 pDB2688로 라이게이션하여 PDI1 유전자가 REP2와 동일한 방향으로 전사되는 플라스미드 pDB2690(도 10)를 생성하였다. 에스. 세레비지아에 스트레인은 pDB2690을 이용하여 루신 프로토트로피로 형질변형되었다.

후속적으로 사람 트랜스페린 돌연변이(N413Q, N611Q)에 대한 발현 카세트를 pDB2690의 NotI-사이트내로 클로닝하여 pDB2711(도 11)을 생성하였다. pDB2711내 발현 카세트는 에스. 세레비지아에 PRB1 프로모터, HSA/MFα 융합 리더 서열(EP 387319; Sleep et al, 1990, Biotechnology(N.Y.), 8, 42)을 함유하며, 사람 트랜스페린 돌연변이(N413Q, N611Q)에 대한 암호 서열 및 에스. 세레비지아에 ADH1 종결자가 후속하였다. 플라스미드 pDB2536(도 36)은 pSAC35의 NotI-사이트내로 동일한 발현 벡터의 삽입에 의해 동일하게 구성되었다.

2μm-벡터의 US-리전내로 "관심 대상의 유전자"를 삽입하는 잇점은 pDB2536으로 형질변형된 동일한 이스트에 비해, pDB2711로 형질변형된 이스트의 발효도중 재조합 트랜스페린 N413Q, N611Q 분비를 약 7-배 증가시키는 것으로 입증되었다. 재조합 트랜스페린 N413Q, N611Q 분비가 약 15-배 증가하는 것이 쉐이크 플라스크 배양에서 관찰되었다(데이타로는 나타내지 않음).

플라스미드 pDB2688, pDB2690, pDB2711, pDB2563 및 pSAC35의 상대적인 안정성은 상기한 방법을 이용하여 YEPS 배지에서 성장된 동일한 이스트 스트레인에서 측정되었다(표 2).

이러한 분석에서, PDI1 삽입물이 없는 pDB2688에 대한 100% 안정성과 비교하여 pDB2690은 32% 안정성을 나타내었다. 이러한 플라스미드 안정성 감소는 pSAC35의 라지 유니크 리전내 NotI-사이트내로의 rTF(N413Q, N611Q) 발현 카세트의 삽입에 기인하여 pDB2536으로 관찰된 플라스미드 안정성 감소보다 낮았다(표 2).

또한, pDB2711로 형질변형된 동일한 이스트로부터의 rTF(N413Q, N611Q) 수율이 pDB2536으로 형질변형된 동일한 이스트로부터 달성되는 것과 비교하여 감소되지 않았으므로 고 세포밀도 발효도중 최소 배지에서의 선별적 성장은 YEPS 배지에서 관찰되는 PDI1 삽입에 기인하는 증가된 플라스미드 불안정성을 극복할 수 있다.

표 2: pSAC35의 스몰 유니크 리전내로 PDI1 삽입에 대한 플라스미드 안정성 데이타의 요약. YEPS-아가상에 플래이팅하기전 비선별 쉐이크 플라스크 배양으로 3일 성장시킨 것으로부터 얻어진 데이타.

플라스미드	삽입부 (들)	비고	상대 안정성
pSAC35	-	-	100%
pDB2688	XcmI	역위 반복내 링커	100%
pDB2690	XcmI	XcmI 링커내 PDI1	32%
pDB2711	XcmI, NotI	XcmI 링커내 PDI1, NotI에 rTf 카세트	10%
pDB2536	NotI	NotI에 rTf 카세트	17%

실시예 3

pSAC35 의 역위 반복 내 REP2 유전자 및 하위 서열내로 DNA 링커의 삽입

REP2 유전자 및 이의 역위 반복 하위내 서열내로 부가적인 DNA의 삽입에 유용한 한계를 규정짓기위해, 추가적인 링커가 pSAC35내로 삽입되었다. 도 12는 이러한 삽입에 사용된 제한 사이트 및 이러한 사이트에서 Rep2 단백질의 번역 종결에 미치는 영향을 나타낸다.

REP2내 XmnI-사이트에 삽입된 링커는 올리고뉴클레오타이드 CF108 및 CF109로부터 제조된 44-bp 서열이었다.

XmnI 링커(CF108+CF109)

pSAC35내에 다른 XmnI-사이트로 삽입되는 것을 방지하기 위해, REP2 및 FLP 유전자를 함유한 pSAC35의 3,076-bp XbaI 프레그먼트를 E. coli 클로닝 벡터 pDB2685(도 13)내로 일차 서브-클로닝하여 pDB2783(도 14)을 생성하였다.

플라스미드 pDB2685는 클렙시엘라 뉴모니아에(Klebsiella pneumoniae)의 아프라마이신 저항성 유전자(Rao et al, 1983, Antimicrob . Agents Chemother., 24, 689) 및 pMCS5의 다중 클로닝 사이트(Hoheisel, 1994, Biotechniques, 17, 456)를 함유하는 pCF17로부터 유래된 pUC18-유사 클로닝 벡터이다. pCF17은 pIJ8600(Sun et al., 1999, Microbiology, 145(9), 2221-7)으로부터 EcoRI, NheI 및 DNA 폴리머라아제 I의 Klenow 프레그먼트로 다이제스팅하고, 셀프-라이게이션한 다음 컴피턴트 E. coli DH5α 세포의 형질변형 및 아프라마이신 설페이트를 이용한 선별에 의 해 반응 산물로부터 분리하여 제조되었다. 플라스미드 pDB2685는 pMCS5의 439bp SspI-SwaI 프레그먼트를 pCF17내로 클로닝하고, 이를 MscI으로 커팅하고 CIAP로 처리하여 제조하였다. 블루/화이트 선별은 IPTG 유도에 의존하지 않는다.

플라스미드 pDB2783은 XmnI으로 선형화되고 CF108/CF109 XmnI-링커로 라이게이션되어 pDB2799(도 15) 및 pDB2780(나타내지 않음)으로 생성되었다. 플라스미드 pDB2799는 Rep2를 생성하기위한 삽입 사이트(1-244)에 번역 종결에 올바른 방향으로 CF108/CF109 XmnI 링커를 함유하였으며, 한편 pDB2780은 반대 방향으로 클로닝된 링커를 함유하였다. 프라이머 CF98 및 CF99를 이용하여 DNA 시퀀싱을 수행함으로써 올바른 링커 서열을 확인하였다.

pDB2799의 3,120bp XbaI 프레그먼트를 CIAP로 부분 XbaI 다이제스션 및 처리에 의해 생성된 7,961-bp pSAC35 프레그먼트로 후속적으로 라이게이션하여 플라스미드 pDB2817(B-형) 및 pDB2818(A-형) 디스인테그레이션 벡터(각각 도 16 및 17)를 생성하였다.

pSAC35내 ApaI-사이트에 링커의 삽입은 T4 DNA 폴리머라아제에 의한 3'-5' 엑소뉴클레아제 다이제스션을 이용하거나 이용하지않고 수행하였다. 이는 번역 종결전에 Rep2(1-271) 또는 Rep2(1-269)에 대한 암호 서열을 생성하였다. 하기 그림에서 대각선으로 표시된 서열 GGCC는 ApaI 다이제스션후 생성된 3'-오버행으로부터 제거하여 글리신-170(GGC) 및 프롤린-171에 대한 코돈의 뉴클레오타이드를 제거하였다.

엑소뉴클레아제 다이제스션없이 ApaI-사이트에 삽입된 링커는 올리고뉴클레오타이드 CF116 및 CF117로 부터 제조된 50-bp 5'-포스포릴레이티드 링커이었다.

Apa I -링커( CF116 + CF117 )

이는 ApaI으로 선형화되고 CIAP로 처리된 pSAC35로 라이게이션되어 pDB2788(도 18) 및 pDB2789(나타내지 않음)로 생성되었다. pDB2788내의 링커는 프롤린-271이후 번역 종결에 대해 올바른 방향이었으며, 한편 pDB2789내의 링커는 반 대 방향이었다.

T4 DNA 폴리머라아제에 의한 엑소뉴클레아제 다이제스션으로 ApaI-사이트에 삽입된 링커는 코어 종결 링커로 불리는 올리고뉴클레오타이드 CF106 및 CF107로부터 제조된 43-bp 5'-포스포릴레이티드 링커이었다.

코어 종결-링커( CF106 + CF107 )

상기 코어 종결 링커는 ApaI으로 선형화되고 T4 DNA 폴리머라아제로 다이제스션되고 CIAP로 처리된 pSAC35로 라이게이션되었다. 이 라이게이션은 글루타메이트-269이후에 번역 종결에 대하여 올바른 방향으로 클로닝된 링커를 갖는 pDB2787(도 19)을 생성하였다.

올바른 DNA 서열은 올리고뉴클레오타이드 프라이머 CF98 및 CF99를 이용하여 ApaI-링커를 함유하는 모든 클론에서 확인되었다.

코어 종결 링커(CF106+CF107)는 또한 pDB2783(도 14)의 FspI-사이트내로 삽입을 위해 사용되었다. 상기 코어 종결 링커(CF106+CF107)는 CIAP로 처리된 부분 FspI 다이제스션에 의해 선형화된 pDB2783내로 라이게이션되었다. 아프라마이신 저항성 E. coli DH5α 형질변형체로부터 분리된 플라스미드는 FspI을 이용한 다이제스션에 의해 스크리닝되고 선별된 클론은 M13 포워드 및 리버스 프라이머를 이용하여 시퀀싱되었다.

플라스미드 pDB2801(나타내지 않음)은 (REP2 유전자에 가장 근접한 PacI-사이트에 대해) 올바른 방향으로 클로닝된 두 링커 카피를 함유하는 것으로 확인되었다. 상기 링커 이외의 카피는 상기 다중 클로닝 사이트 리전으로부터 FseI-사이트를 함유하는 116-bp NruI-HpaI 프레그먼트를 일차 삭제하고 FseI으로 다이제스션하고 재라이게이션하여 pDB2802(도 20)을 생성함으로써 후속적으로 제거되었다. 올리고뉴클레오타이드 CF126을 이용한 DNA 시퀀싱으로 올바른 링커 서열을 확인하였다.

3,119-bp pDB2802 XbaI 프레그먼트는 후속적으로 부분 XbaI 다이제스션 및 CIAP 처리에 의해 생성된 7, 961-bp pSAC35 프레그먼트로 라이게이션되어 pDB2805(B-형) 및 pDB2806(A-형) 디스인테그레이션 벡터(각각 도 21 및 22)가 생성되었다.

실시예 4

pSAC35 의 역위 반복 내 FLP 유전자 및 하위 서열내로의 DNA 링커 삽입

역위 반복내 FLP 유전자 및 하위 서열내로의 부가적인 DNA의 삽입을 위한 유용한 한정을 규정짓기위해 DNA 링커를 pSAC35내로 삽입하였다. 도 3은 이러한 삽입에 사용된 제한 사이트 및 이러한 사이트에서 Flp 단백질의 번역 종결에 미치는 영향을 나타낸다.

BclI-사이트에 삽입된 링커는 올리고뉴클레오타이드 CF118 및 CF119로부터 제조된 49-bp 5'-포스포릴레이티드 링커이었다.

Bcl I 링커( CF118 + CF119 )

pSAC35내에 BclI-사이트의 Dam-메틸화에 기인하여, BclI-링커는 E. coli 스트레인 ET12567 pUZ8002(Macneil et al, 1992, Gene, 111, 61; Kieser et al, 2000, Practical Streptomyces Genetics, The John Innes Foundation, Norwich)으로부터 분리된 비-메틸화 pSAC35내로 클로닝되었다. 플라스미드 pSAC35는 BclI으로 선형화되고 CIAP로 처리되고 BclI-링커로 라이게이션되어 pDB2816(도 23)로 생성되었다. 올리고뉴클레오타이드 프라이머 CF91 및 CF100을 이용한 시퀀싱은 세개의 BclI-링커 카피가 pDB2816내에 존재하며, 이는 모두 히스티딘-353이후 Flp의 번역 종결 대해 올바른 방향이었음을 보여주었다.

PacI으로 pDB2816을 다이제스션하고 셀프-라이게이션을 수행하여 pDB2814 및 pDB2815(도 24 및 25)를 생성하였으며, 이는 각각 BclI-링커의 하나 및 두개의 카피를 함유하였다. 상기 링커의 DNA 서열은 프라이머 CF91 및 CF100을 이용하여 확인하였다. 에스. 세레비지아에에서, 트렁캐이티드 Flp(1-353) 단백질은 pDB2814, pDB2815 또는 pDB2816으로 형질변형된 이스트에 의해 생성될 것이다.

pDB2814에 반대 방향으로 BclI-링커의 단일 카피를 라이게이션하여 부가적인 플라스미드 pDB2846(데이타로 나타내지 않음)을 또한 생성하였다. 이는 번역 종결이전에 14개의 다른 잔기가 후속하는 Flp의 일차 352-잔기에 대한 암호 서열을 가졌다.

HgaI-사이트에 삽입된 링커는 올리고뉴클레오타이드 CF114 및 CF115로부터 제조된 47-bp 5'-포스포릴레이티드 링커이었다.

Hga I 링커( CF114 + CF115 )

HgaI 링커는 부분 HgaI 다이제스션에 의해 선형화되고 CIAP로 처리된 pDB2811로 라이게이션되어 pDB2811(도 26)을 생성하였다. 올리고뉴클레오타이드 CF90, CF91 및 CF100을 이용한 DNA 시퀀싱으로 올바른 링커 삽입을 확인하였다.

pDB2811의 3,123-bp XbaI 프레그먼트는 부분 XbaI 다이제스션 및 CIAP 처리에 의해 생성된 7,961-bp pSAC35 프레그먼트로 후속적으로 라이게이션되어 HgaI-사이트에 삽입된 DNA를 함유하는 pDB2812(B-형) 및 pDB2813(A-형) 디스인테그레이션 벡터(각각 도 27 및 28)를 생성하였다.

FLP이후 FspI 사이트에 삽입된 코어 종결 링커(CF106+CF107)를 갖는 플라스미드 pDB2803 및 pD2804(각각 도 29 및 30)가 pDB2801을 제작하는데 사용된 방법과 동일한 방법에 의해 분리되었다. 올바른 링커 삽입은 DNA 시퀀싱에 의해 확인되었다. 플라스미드 pDB2804는 (FLP 유전자에 가장 근접한 PacI-사이트에) 올바른 방향으로 삽입된 링커를 함유하였으며, 한편 pDB2803은 반대 방향으로 상기 링커를 함 유하였다.

pDB2804 3,119-bp XbaI 프레그먼트는 부분 XbaI 다이제스션 및 CIAP 처리에 의해 생성된 7,961-bp pSAC35 프레그먼트로 라이게이션되어 FLP이후 FspI-사이트에 삽입된 DNA를 함유하는 pDB2807(B-형) 및 pDB2808(A-형) 디스인테그레이션 벡터(각각 도 31 및 32)를 생성하였다.

실시예 5

스몰 유니크 리전 및 역위 반복 내로 삽입된 DNA 링커를 함유하는 pSAC35-유사 플라스미드로 형질변형된 이스트에서 LEU2 마커의 상대적 안정성

US-리전 및 역위 반복내로 삽입된 DNA 링커를 함유하는 pSAC35-유사 플라스미드로 에스. 세레비지아에 스트레인을 형질변형하였다. 플라스미드 안정성을 시험하기위해 저온보존된 트레할로즈 스톡을 제조하였다(표 3). 플라스미드 안정성은 pSAC35에 삽입된 링커에 대해 상기 언급한 바와 같이 분석하였다. 각 삽입 사이트 분석을 위해 두개의 플라스크를 셋팅하였다. 또한, 쉐이크 플래이크 배양 3일후 세포로부터 유도된 콜로니의 분석을 위해, 콜로니를 성장시키고 추가 4일 쉐이크 플라스크 배양된 세포를 분석하였다. 이를 위해, 100μL 시료를 매 3일된 플라스크로부터 수거하고 추가 약 96시간(94-98시간)동안 30.0℃에서 오비탈 쉐이커에서 100mL YEPS 브로스에서 계대 배양하였으며, 이후 단일 콜로니를 획득하고 LEU2 마커의 소실에 대해 분석하였다. 이러한 경우 분석은 선별된 스트레인의 단일 플라스크로 제한되었으며, 50 콜로니가 채집되었다. 전체 결과를 표 4에 요약하였다.

표 4: pSAC35내로 DNA 삽입에 대한 플라스미드 안정성 데이타의 요약

세트 1은 비-선별 쉐이크 플라스크 배양 3일로부터 얻어진 데이타를 나타낸다.

세트 2는 비-선별 쉐이크 플라스크 배양 7일로부터 얻어진 데이타를 나타낸다.

A) REP2 삽입 사이트

플라스미드(들)	삽입 사이트	비고	상대적 안정성
플라스미드(들)	삽입 사이트	비고	세트 1	세트 2
pSAC35	-	대조구	99%	100%
pDB2817 & pDB2818	XmnI	REP2(1-244)	39%	16%
pDB2787	ApaI/T4 pol.	REP2(1-269)	45%	0%
pDB2788	ApaI	REP2(1-271)	33%	0%
pDB2688	XcmI	역위 반복	100%	100%
pDB2805 & pDB2806	FspI	역위 반복	100%	100%

B) FLP 삽입 사이트

플라스미드(들)	삽입 사이트	비고	상대적 안정성
플라스미드(들)	삽입 사이트	비고	세트 1	세트 2
pDB2814	BclI	FLP(1-353)	67%	64%
pDB2823	XmnI	FLP(1-382)	64%	53%
pDB2812 & pDB2813	HgaI	역위 반복	100%	100%
pDB2808	FspI		100%	100%

변형 pSAC35 플라스미드 모두는 이스트를 루신 독립영양성으로 형질변형시킬 수 있으며, 이는 부가적인 DNA가 2㎛ DNA의 기능적으로 혼잡한 리전내에 삽입되었음에도 불구하고 모두 에스. 세레비지아에에서 복제 및 분할될 수 있음을 보여준다. 이는 2㎛ US-리전내 모든 사이트에 삽입된 43-52 염기쌍 링커 뿐만 아니라 PDI1 유전자를 함유하는 보다 큰 DNA 삽입으로 플라스미드에 적용되었다.

링커 삽입 사이트에 있어서, 데이타는 실험 및 반복 모두에서 재현가능하였다. REP2 또는 FLP 오픈 리딩 프래임의 외부이지만 역위 반복내에 있는 모든 사이트는 사용된 시험 조건하에서 100% 안정한 것으로 나타났다. 플라스미드 불안정성(즉, 플라스미드 소실)은 REP2 및 FLP 오픈 리딩 프래임내 사이트내로 삽입된 링커에서 관찰되었다. REP2 삽입의 관찰된 플라스미드 불안정성은 FLP 삽입에 대한 것보다 높았다. REP2 삽입에 있어서, LEU2 마커의 소실은 비-선별 배지에서 연장된 성장 기간동안 계속되었으며, 한편 FLP 삽입에 대하여 거의 차이가 없었다.

REP2 유전자내로의 삽입은 셀프-결합 및 2㎛의 STB-위치에 바인딩시 작용하는 것으로 알려진(Sengupta et al, 2001, J. Bacteriol ., 183, 2306) 리전내에 트렁캐이티드된 Rep2 폴리펩타이드를 생성하였다.

FLP 유전자내로의 삽입은 트렁캐이티드 Flp 단백질을 형성하였다. 모든 삽입 사이트는 Flp 단백질의 올바른 기능에 필수적인 C-말단 도메인내 티로신-343이후이 었다(Prasad et al, 1987, Proc . Natl . Acad . Sci . U.S.A., 84, 2189; Chen et al, 1992, Cell, 69, 647; Grainge et al, 2001, J. Mol . Biol ., 314, 717).

FLP XcmI-사이트내로 삽입시 또한 Flp 단백질 산물을 트렁캐이팅하는 경우를 제외하고, 역위 반복 리전내로 어떠한 삽입도 없는 경우 플라스미드 불안정성이 검출되는 것으로 나타났다. 역위 반복 리전내 FspI-사이트에 삽입은 플라스미드 복제에 중요한 FRT(Flp 인지 표적)에 가장 근접하였다.

pSAC35-유사 플라스미드는 REP2 오픈 리딩 프래임 또는 FLP 오픈 리딩 프래임 또는 역위 반복 서열내로 삽입된 43-52 염기쌍 DNA 링커로 구성되었다. 또한, PD11 유전자를 함유하는 1.9kb DNA 프레그먼트를 REP2이후 XcmI-사이트에 DNA 링커내로 삽입하였다.

삽입된 부가적인 DNA를 갖는 pSAC35-유사 벡터 모두 이스트를 루신 독립영양성으로 형질변형시킬 수 있었다. 따라서, DNA가 2㎛ DNA의 기능적으로 혼잡한 리전내에 삽입되었음에도 불구하고 플라스미드 복제 및 분할 기작은 파괴되지 않았다.

비-선별 배지에서 성장도중 LEU2 선별 마커의 소실을 측정함에 의한 플라스미드 안정성 검사는 DNA 링커를 역위 반복내로 삽입하는 것이 플라스미드를 불안정화시키지 않았으며, 한편 플라스미드 안정성은 REP2 및 FLP 오픈 리딩 프래임내로 삽입에 의해 감소되었음을 보여주었다. 그러나, 본 발명의 제1 및 제2 견지에 의해 정의된 일부 포지션에서 REP2 및 FLP 오픈 리딩 프래임내로 삽입이 이루어지는 경우 비-선별 배지 성장 조건하에서 플라스미드 안정성의 감소에도 불구하고, 그 결과물인 플라스미드는 선별 배지상에서 성장시 이스트에 사용되기에 충분히 높은 안정성을 갖는다.

실시예 6

pSAC35 의 스몰 유니크 리전내 REP2 유전자 직후 DNA 서열의 삽입

REP2 유전자 및 이의 역위 반복 하위내 서열내로 부가적인 DNA의 삽입에 유용한 제한을 더욱 규정짓기위해, 합성 DNA 링커를 REP2 번역 종결 코돈(TGA) 직후 pSAC35내로 삽입하였다. 2㎛(또는 pSAC35)내 REP2 암호 서열 직후에 알맞게 위치하는 자연적으로 발생하는 제한 엔도뉴클레아제 사이트가 없는 경우, SnaBI-사이트를 올리고뉴클레오타이드 디렉티드 돌연변이 생성 방법에 의해 이 포지션에 도입하였다. REP2의 하위에 인접한 유니크 SnaBI-사이트를 갖는 pSAC35 유도체는 pDB2938(도 37)로 명명되었다. pDB2938에서, 역위 반복의 말단은 SnaBI-사이트의 삽입에 의해 역위 반복의 나머지로 대체되었다. pDB2954(도 38)은 후속적으로 pDB2938의 유니크 SnaBI 사이트내로 삽입된 올리고뉴클레오타이드 CF104 및 CF105(상기 참조)로부터 제조된 SnaBI-링커와 동일한 31-bp 서열로 구성되었으며, REP2의 TGA 번역 종결 코돈 직후에 위치한 제한 엔도뉴클레아제 사이트의 순서는 SnaBI-PacI-FseI/SfiI-SmaI-SnaBI이었다.

pDB2938을 구성하기 위해, pDB2783(도 14)의 1,085-bp NcoI-BamHI 프레그먼트는 pMCS5(Hoheisel, 1994, Biotechniques, 17, 456)내로 일차 계대 배양되었으며, 이는 NcoI, BamHI 및 CIAP로 다이제스션되었다. 이는 pDB2809(도 39)를 생성하였으며, 후속적으로 올리고뉴클레오타이드 CF127 및 CF128을 이용하여 돌연변이되어 pDB2920(도 40)을 생성하였다.

51-bp 돌연변이발생 올리고뉴클레오타이드 CF127 및 CF128

SnaBI 인지 서열은 밑줄을 그었다.

올리고뉴클레오타이드 디렉티드 돌연변이 생성은 Stratagene의 QuickChange^TM Site-Directed Mutagenesis Kit의 지시 매뉴얼에 따라 수행되었다. 플라스미드 DNA의 SnaBI 및 HindIII 제한 다이제스션으로 pDB2920을 함유한 앰피실린 저항성 E.coli 형질변형체를 확인하였다. SnaBI 제한 사이트 및 전체 1,091-bp NcoI-BamHI 프레그먼트에 대한 올바른 DNA 서열의 삽입된 6-bp 서열은 올리고뉴클 레오타이드 프라이머 CF98, CF99, CF129, CF130 및 M13 포워드 및 리버스 프라이머(표 1)를 이용한 DNA 시퀀싱에 의해 pDB2920에서 확인되었다.

pDB2920의 1,091-bp NcoI-BamHI 프레그먼트는 아가로즈 겔 정제에 의해 분리되고 pDB2783의 약 4.7-kb NcoI-BamHI 프레그먼트로 라이게이션되어 pDB2936(도 41)을 생성하였다. pDB2783 4.7kb NcoI-BamHI 프레그먼트는 우선 NcoI으로 부분 다이제스션하여 선형화되고 아가로즈 겔 전기영동에 의해 정제된 pDB2783의 완전 BamHI 다이제스션에 의해 분리되었다. E. coli DH5α 세포는 그 라이게이션 산물에 의해 아프라마이신 저항성으로 형질변형되었다. pDB2936은 아프라마이신 저항성 클론으로부터 분리된 플라스미드 DNA의 SnaBI 다이제스션에 의해 확인되었다.

후속적으로 pDB2936의 3,082-bp XbaI 프레그먼트는 부분 XbaI 다이제스션 및 CIAP 처리에 의해 생성된 7,961-bp pSAC35 프레그먼트로 라이게이션되어 디스인테그레이션 벡터 pDB2938(2㎛ B-형, 도 37)를 생성하였다.

pDB2938은 SnaBI 및 CIAP로 다이제스션되고 pDB2939(도 42)의 약 2-kb SnaBI 프레그먼트로 라이게이션되었다. pDB2939는 에스. 세레비지아에 S288c 게노믹 DNA로부터 올리고뉴클레오타이드 프라이머 DS248 및 DS250(도 43)을 이용하여 PDI1 유전자를 PCR 증폭한 다음, PCR 산물을 EcoRI 및 BamHI으로 다이제스션하고 약 1.98-kb 프레그먼트를 EcoRI 및 BamHI으로 잘린 YIplac211(Gietz & Sugino, 1988, Gene, 74, 527-534)내로 클로닝하였다. pDB2939의 DNA 시퀀싱으로 도 43에 굵게 표시된 DS248 서열내에 'G' 소실을 확인하였다. pDB2939의 약 2-kb SnaBI 프레그먼트는 후속적으로 pDB2938의 유일한 SnaBI-사이트내로 클로닝되어 플라스미드 pDB2950(도 44)이 생성되었다. pDB2950내 PDI1 유전자는 REP2 유전자와 동일한 방향으로 전사된다.

pDB2950은 후속적으로 SmaI으로 다이제스션되고 약 11.1-kb DNA 프레그먼트는 환형화되어 S288c PDI1 서열이 제거되었다. 이는 REP2의 TGA 번역 종결 코돈 직후에 위치한 SnaBI-PacI-FseI/SfiI-SmaI-SnaBI 링커를 갖는 플라스미드 pDB2954(도 38)를 생성하였다.

pDB2938의 유일한 SnaBI-사이트내로 에스. 세레비지아에 S288c PDI1 유전자를 클로닝하는 것에 부가적으로, 에스. 세레비지아에 SKQ2n PDI1 유전자가 마찬가지로 이 사이트에 삽입되었다. 에스. 세레비지아에 SKQ2n PDI1 유전자 서열은 Clone C7(Crouzet & Tuite, 1987, 상기 참조; Farquhar et al, 1991, 상기 참조)으로도 알려진 pMA3a:C7(US 6,291,205)의 PDI1 유전자를 함유하는 플라스미드 DNA로부터 PCR 증폭되었다. SKQ2n PDI1 유전자는 올리고뉴클레오타이드 프라이머 DS248 및 DS250(도 43)을 이용하여 증폭되었다. 약 2-kb PCR 산물을 EcoRI 및 BamHI으로 다이제스션하고, EcoRI 및 BamHI으로 잘려진 YIplac211(Gietz & Sugino, 1988, Gene, 74, 527-534)내로 라이게이션하여 플라스미드 pDB2943(도 45)을 생성하였다. SKQ2n PDI1 서열의 5'말단은 EcoRI, SacI, SnaBI, PacI, FseI, SfiI 및 SmaI 사이트를 포함하도록 연장된 블런트-엔드 SpeI-사이트와 유사하고, 3'말단은 SmaI, SnaBI 및 BamHI 사이트를 포함하도록 연장된 블런트-엔드 Bsu36I 사이트와 유사한 사이트까지 연장되었다. PDI1 프로모터 길이는 약 210bp이다. 전체 DNA 서열은 PDI1 프레그먼트에 대해 조사되었으며 이는 에스. 세레비지아에 스트레인 SKQ2n 서열(NCBI 등록번호 CAA38402)의 PDI 단백질을 암호하나 포지션 114에 세린 잔기(아르기닌 잔기가 아닌)를 갖는 것으로 나타났다. pDB2939내 에스. 세레비지아에 S288c 서열과 마찬가지로, pDB2943은 도 43에서 굵게 표시된 DS248 서열내에서 'G' 소실이 있었다. pDB2943의 약 1,989-bp SnaBI 프레그먼트는 후속적으로 pDB2938내 유일한 SnaBI-사이트내로 클로닝되었다. 이는 플라스미드 pDB2952(도 46)를 생성하였며, 여기서 SKQ2n PDI1 유전자는 REP2와 동일한 방향으로 전사된다.

실시예 7

REP2 유전자 직후에 삽입된 DNA를 함유하는 pSAC35 -유사 플라스미드로 형질변형된 이스트에서 LEU2 마커의 상대적 안정성

pSAC35내 REP2 유전자 이후에 도입된 SnaBI-사이트에 링커 서열의 삽입이 플라스미드 안정성에 미치는 영향은 pDB2954에 대해 평가되었다. 이는 초기 실시예에 사용된 것과 동일한 에스. 세레비지아에 스트레인에서 YEPS에서 비-선별 성장도중 LEU2 마커의 소실로 조사되었다. pDB2954의 안정성은 실시예 1에 기재된 방법으로 pSAC35(대조구 플라스미드), pDB2688(XcmI-링커) 및 pDB2817(XmnI-링커)의 안정성과 비교되었다.

이스트 스트레인은 변형 리튬 아세테이트 방법(Sigma yeast transformation kit, YEAST-1, 프로토콜 2; (Ito et al, 1983, J. Bacteriol ., 153, 163; Elble, 1992, Biotechniques, 13, 18))을 이용하여 루신 독립영양성으로 형질변형되었다. 형질변형체는 BMMD-아가 플래이트에서 선별되었으며, 후속적으로 BMMD-아가 플래이트상에서 패치아웃되었다. 10mL BMMD 쉐이크 플라스크 배양물(24시간, 30℃, 200rpm)로부터 이와 동일한 양의 멸균 40%(w/v) 트레할로즈를 혼합하고 -80℃(즉, 영하 80℃)에서 분취량을 동결시켜 저온 보존된 트레할로즈 스톡을 제조하였다.

플라스미드 안정성 검사를 위해, 1mL 저온보존 스톡을 해동하고 250mL 코니컬 플라스크에 담긴 100mL YEPS(초기 OD₆₀₀

0.04-0.09)내에 접종하고 오비털 쉐이커(200rpm, Innova 4300 배양기, New Brunswick Scientific)에서 30℃에서 약 72시간(전형적으로 70-74시간) 배양하였다. 각 스트레인은 2회 분석되었다.

각 플라스크로부터 시료를 수거하고 YEPS-브로스에 희석하고(10^-2 내지 10^-5 희석) YEPS-아가 플래이트상에 이중으로 100μL 분취량을 플래이팅하였다. 세포를 30℃에서 3-4일간 배양하여 단일 콜로니가 발달하도록 하였다. 분석되는 각 이스트 스톡에 있어서, 100개의 무작위 콜로니를 이중으로 BMMS-아가 플래이트상에서 패치한 다음 YEPS-아가 플래이트상에서 패치하였다. 30℃에서 3-4일간 배양한 후, BMMS-아가 플래이트 및 YEPS-아가 플래이트 모두에서 콜로니 성장 퍼센트를 플라스미드 안정성의 척도로 측정하였다.

상기 분석 결과를 하기 표 5A에 나타내었다. 이러한 결과는 pDB2954가 본질적으로 pSAC35 대조구 및 pDB2688 만큼 안정함을 보여준다. 이러한 타입의 평가에서, 저 수준의 불안정성은 종종 pSAC35 대조구에서조차 검출될 수 있다(참조 표 4). 더욱이, REP2의 번역 종결 코돈 직후의 역위 반복 서열내로 인위적으로 도입된 SnaBI-사이트는 합성 링커 서열의 삽입을 위한 역위 반복내 XcmI-사이트와 동등한 것으로 나타났다. 그러나 XcmI-사이트는 PDI1 유전자를 함유하는 약 2-kb DNA 프레그먼트의 삽입을 위한 SnaBI-사이트에 바람직한 것으로 나타났다.

표 5A: 여러가지 DNA 삽입을 함유하는 pSAC35-기초 벡터의 상대적 안정성

플라스미드	US- 리전내 삽입 사이트	US- 리전내 삽입된 유전자	UL- 리전내 SnaBI/NotI-사이트에 삽입된 유전자(들)	상대적 안정성(%)
pSAC35	-	-	LEU2	100
pDB2688	XcmI	-	LEU2	99.5
pDB2954	SnaBI	-	LEU2	99
pDB2817	XmnI	-	LEU2	27
pDB2690	XmnI	PDI1(SKQ2n)	LEU2	39.5
pDB2952	SnaBI	PDI1(SKQ2n)	LEU2	0
pDB2950	SnaBI	PDI1(S288c)	LEU2	0

플라스미드 pDB2952 및 pDB2950에 대하여 이러한 평가의 "0 퍼센트 안정성"이 비-선별 배지에서 획득되었으며, 이는 상대적 플라스미드 안정성을 표시한다. 이 평가는 다른 링커 삽입물의 상대적 안정성을 비교하도록 최적화되었다. 선별 배지에서, SnaBI-사이트에 PDI1을 갖는 플라스미드는(플라스미드(하기 pDB2959 및 pDB2960과 같은)를 더욱 불안정하게 하는 것으로 알려진 NotI 사이트에 부가적인 트랜스페린 유전자를 포함하는 경우에도) 비-선별 YEPD-아가 및 항-트랜스페린 항체를 함유하는 선별 BMMD-아가 플래이트 모두에 분비 트랜스페린의 "프리시피틴 할로스"를 생성하였다. 분비된 트랜스페린의 프리시피틴 할로스는 SnaBI-사이트에 삽입된 PDI1 유전자가 없는 pDB2961로부터 관찰되지 않았다. 이러한 결과는 SnaBI-사이트가 이종 단백질의 분비를 증가시킬 수 있는 PDI1과 같은 대 유전자의 삽입에 유용함을 입증한다. 이러한 결과는 모두 대조구 스트레인에서 생성되었다. pDB2959 및 pDB2960을 함유하는 스트레인 A에 대해서도 증가가 발견되었으나, 이 경우 또한 (스트레인 A의 게놈내 엑스트라 PDI1 유전자에 기인하여)보다 낮은 수준의 분비가 pDB2961에서 관찰되었다. 대조구 스트레인으로부터의 결과는 하기 표 5B에 요약되었다. 25mL BMMD-아가 또는 YEPD-아가당 염소 폴리클로날 항-트랜스페린 항혈청(Callbiochem) 100μL를 함유한 항체 플래이트가 사용되었다. 스트레인들은 항체 플래이트상에 패치되고 30℃에서 48-72시간동안 배양되었으며, 이 후 프리시피틴 "할로스"는 고 수준의 재조합 트랜스페린을 분비하는 콜로니 주변의 아가에서 관찰되었다. 매우 낮은 수준의 트랜스페린 분비는 이 시험에서 관찰되지 않았다.

pDB2711(도 11)에서 발견되는 바와 같은 rTf(N413Q, N611Q)에 대한 3.27-kb NotI 카세트를 pDB2711과 동일한 방향으로 유일한 NotI-사이트내로 삽입함으로써, 플라스미드 pDB2959, pDB2960 및 pDB2961은 pDB2950(도 44), pDB2952(도 46) 및 pDB2954(도 38)로부터 각각 구성되었다.

표 5B: REP2 직후 사이트에 여러 가지 PDI1 유전자 삽입을 함유하는 pSAC35-기초 벡터로 형질변형된 대조구 스트레인로부터의 증가된 트랜스페린 분비

플라스미드	US- 리전내 삽입 사이트	US- 리전내 삽입된 유전자	UL- 리전내 SnaBI / NotI -사이트에 삽입된 유전자(들)	항- 트랜스페린 Ab - 플래이트에서 검출되는 트랜스페린 분비
플라스미드	US- 리전내 삽입 사이트	US- 리전내 삽입된 유전자	UL- 리전내 SnaBI / NotI -사이트에 삽입된 유전자(들)	BMMD-항 Tf	YEPD-항 Tf
pDB2960	SnaBI	PDI1(SKQ2n)	LEU2 + rTf	유	유
pDB2959	SnaBI	PDI1(S288c)	LEU2 + rTf	유	유
pDB2961	SnaBI	-	LEU2 + rTf	무	무

실시예 8

pSAC35 -유사 플라스미드로 형질변형된 이스트에서 비-선별 조건에서 성장 30세대에 걸쳐 조사된 LEU2 마커의 안정성

US-리전에 삽입된 DNA를 갖는 pSAC35-유사 플라스미드의 안정성은 Chinery & Hinchcliffe(1989, Curr . Genet., 16, 21-25)에 의해 정의된 것과 유사한 방법을 이용하여 조사되었다. 이는 앞선 실시예에서 사용된 것과 동일한 에스. 세레비지아에 스트레인에서 규정된 수의 세대에 걸쳐 비-선별 YEPS 배지상에 대수 성장도중 LEU2 마커의 소실로 검출되었다. 30 세대가 대조구 플라스미드, pSAC35간의 차이를 보여주기에 적절하였으며, 또는 상기 대조구 플라스미드에 상당한 안정성을 나타내기에 적적하였다. 본 시험에 의한 분석을 위해 선별된 플라스미드는 pSAC35(대조구), pDB2688(XcmI-링커), pDB2812(HgaI-링커), pDB2817(XmnI-링커), pDB2960(REP2이후 XcmI 사이트에 삽입된 PDI1 유전자) 및 pDB2711(REP2이후 XcmI 사이트에 삽입된 PDI1 유전자 및 UL-리전내 NotI-사이트에 삽입된 트랜스페린 발현 카세트)이었다.

스트레인들을 선별(BMMS) 배지 30℃에서 대수 단계로 성장시키고 250mL 코니컬 플라스크내에서 30℃로 미리 데워진 100mL 비-선별(YEPS) 배지에 접종하여 1.25x10⁵ 내지 5x10⁵cells/ml를 생성하였다. 각 플라스크에 접종된 세포수는 헤모사이토미터를 이용하여 적절히 측정하여 배양 시료에서 세포수를 계산하였다. 분취량을 또한 비-선별(YEPS) 아가에 플래이팅하고 30℃에서 3-4일간 배양하였으며, 이후 각 스톡을 분석하기위해 100개의 무작위 콜로니를 선별(BMMS) 아가 및 비-선별(YEPS) 아가에 이중으로 플래이팅하여 플라스미드를 보유하는 세포의 비율을 평가하였다. 30℃에서 3-4일간 배양한 후, BMMS 아가 및 YEPS 아가 플래이트 모두에서 성장하는 콜로니의 퍼센트를 플라스미드 안정성의 척도로 측정하였다.

비-선별 액체 배양물을 2000rpm으로 교반하면서 24시간동안 30℃에서 배양하여 헤모사이토미터 계산으로 측정시 약 1x10⁷cells/ml을 이루었다. 그 다음 배양물 을 새로운 미리 데워진 비-선별 배지에 재접종하여 1.25x10⁵ 내지 5x10⁵cells/ml을 생성하였다. 분취량을 다시 비-선별 아가에 플래이팅하고, 후속적으로 선별 아가 및 비-선별 아가에 이중으로 플래이팅하여 플라스미드의 보유를 평가하였다. 또한, 비-선별 액체 배지에서 세포 세대수를 계산하는 것이 가능하였다. 지수적 대수 성장은 액체 배양시 30 세대동안 유지되었으며, 이는 pSAC35와 같은 대조구 플라스미드에 상당한 안정성을 나타내기에 충분하였다. 플라스미드 안정성은 선별가능한 LEU2 마커를 유지하는 퍼센트 세포로 정의되었다.

비-선별 배지에서 성장을 통한 플라스미드-암호화된 표현형의 보유를 평가하는 상기 분석 결과를 표 6 및 도 47에 나타내었다.

표 6: 선별된 pSAC35-유사 플라스미드의 비-선별 배지에서 30 세대동안 성장된 에스. 세레비지아에 스트레인에서의 상대적 안정성

플라스미드	US- 리전내 링커 삽입 사이트	US- 리전내 삽입된 유전자	UL- 리전내 SnaBI/NotI-사이트에 삽입된 유전자(들)	30세대후 퍼센트 안정성(%)
pSAC35	-	-	LEU2	100
pDB2688	REP2이후 XcmI	-	LEU2	100
pDB2812	FLP이후 HgaI	-	LEU2	100
pDB2817	REP2이후 XmnI	-	LEU2	1
pDB2690	REP2이후 XcmI	PDI1(SKQ2n)	LEU2	33
pDB2711	REP2이후 XcmI	PDI1(SKQ2n)	LEU2 + rTf	2

도 47은 분석된 각 스트레인에 대해 비-선별 액체 배지에서 세대수 증가에 따른 LEU2 마커의 소실을 나타낸다.

대조구 플라스미드 pSAC35는 본 시험의 전체 30-세대에 걸쳐 100% 안정성을 보유하였다. 플라스미드 pBD2688 및 pDB2812 모두 pSAC35 만큼 안정한 것으로 나타났다. 따라서, 각각 REP2이후 XcmI-사이트 또는 FLP이후 HgaI-사이트내로 링커의 삽입은 플라스미드 안정성에 명백한 영향을 주지 않았다. 반대로, REP2 유전자내 XmnI-링커의 삽입은 감소된 플라스미드 안정성을 미치는 것으로 나타났다.

REP2이후 XcmI-링커내에 에스. 세레비지아에 PDI1 유전자를 함유하는 플라스미드 pDB2690는 30세대 성장후 약 33% 안정성을 가졌으며, 이는 2㎛-기초 벡터의 US-리전내로 이러한 대 DNA 프레그먼트의 삽입이 플라스미드 안정성 감소를 일으켰음을 나타낸다. 그러나, 이러한 안정성 감소는 pDB2711에서 관찰된 것보다 낮았으며, pSAC35의 라지 유니크 리전내 NotI-사이트내로 재조합 트랜스페린(N413Q, N611Q) 발현 카세트의 삽입은 플라스미드를 더욱 불안정화시키는 작용을 하였다. 이러한 관찰은 실시예 2의 결과와 일치한다(참조 표 2).

플라스미드 pDB2711의 안정성은 에스. 세레비지아에의 다른 스트레인에서 상기 방법에 의해 평가되었으며, 유사한 결과가 획득되었다(데이타로는 나타내지 않음). 이는 플라스미드의 안정성은 스트레인에 의존하지 않음을 보여준다.

실시예 9

2㎛-기초 플라스미드상에서 PDI1 유전자를 겸비한 PDI1 유전자 붕괴는 플라스미드 안정성을 증가시켰다.

표 7에 열거된 DNA 단일 스트랜드 올리고뉴클레오타이드 DNA 프라이머는 이스트 PDI1 암호 리전의 상위 리전 및 이스트 PDI1 암호 리전의 다른 하위 리전을 증폭시키도록 디자인되었다.

표 7: 올리고뉴클레오타이드 프라이머

프라이머	설명	서열
DS299	5' PDI1 프라이머, 38mer	5'-CGTAGCGGCCGCCTGAAAGGGGTTGACCGTCCGTCGGC-3'
DS300	5' PDI1 프라이머, 40mer	5'-CGTAAAGCTTCGCCGCCCGACAGGGTAACATATTATCAC-3'
DS301	3' PDI1 프라이머, 38mer	5'-CGTAAAGCTTGACCACGTAGTAATAATAAGTGCATGGC-3'
DS302	3' PDI1 프라이머, 41mer	5'-CGTACTGCAGATTGGATAGTGATTAGAGTGTATAGTCCCGG-3'
DS303	18mer	5'-GGAGCGACAAACCTTTCG-3'
DS304	20mer	5'-ACCGTAATAAAAGATGGCTG-3'
DS305	24mer	5'-CATCTTGTGTGTGAGTATGGTCGG-3'
DS306	14mer	5'-CCCAGGATAATTTTCAGG-3'

주형으로 게노믹 DNA 유래된 S288c를 이용하여 프라이머 DS299 및 DS300은 PCR에 의해 PDI1의 5'리전을 증폭하였으며, 프라이머 DS301 및 DS302는 PDI1의 3'리전을 증폭하였다. PCR 조건은 다음과 같았다: 1μL S288c 주형 DNA(0.01ng/μL, 0.1ng/μL, 1ng/μL, 10ng/μL 및 100ng/μL로), 5μL 10X버퍼(Fast Start Taq+Mg, (Roche)), 1μL 10mM dNTP's, 5μL 각 프라이머(2μM), 0.4μL Fast Start Taq, H₂O로 50μL까지 채움. PCRs은 Perkin-Elmer Thermal Cycler 9700을 이용하여 수행되었다. 조건은 다음과 같았다: 95℃에서 4분간 변성[고정], 그 다음 [사이클] 20사이클동안 95℃에서 30초간 변성, 45℃에서 30초간 어닐링, 72℃에서 45초간 연장, 그 다음 72℃에서 10분간 [고정], 그 다음 4℃ [고정]. 0.22kbp PDI1 5' PCR 산물은 NotI 및 HindIII로 잘려지고, 0.34kbp PDI1 3' PCR 산물은 HindIII 및 PstI으로 잘려졌다.

플라스미드 pMCS5(Hoheisel, 1994, Biotechniques 17, 456-460)(도 48)는 HindIII로 다이제스션되고 T4 DNA 폴리머라아제 + dNTPs로 블런트 엔딩되고 라이게이션되어 pDB2964(도 49)로 생성되었다.

플라스미드 pDB2964는 HindIII 다이제스션되고 CIAP로 처리되고 한편, NotI 및 HindIII로 다이제스션된 0.22kbp PDI1 5' PCR 산물 및 HindIII 및 PstI으로 다이제스션된 0.34kbp PDI1 3'PCR 산물과 라이게이션되어 pDB3069(도 50)으로 생성되었으며, 이는 포워드 및 리버스 유니버설 프라이머 및 DNA 시퀀싱 프라이머 DS303, DS304 및 DS306(표 7)을 이용하여 시퀀싱되었다.

프라이머 DS234 및 DS235(표 8)는 PCR 산물의 말단중 어느 하나에 HindIII 제한 사이트를 편입하는 YIplac204(Gietz & Sugino, 1988, Gene, 74, 527-534)의 변형 TRP1 마커 유전자를 증폭시키는데 사용되었다. PCR 조건은 다음과 같았다: 1μL 주형 YIplac204(0.01ng/μL, 0.1ng/μL, 1ng/μL, 10ng/μL 및 100ng/μL로), 5μL 10X버퍼(Fast Start Taq + Mg, (Roche)), 1μL 10mM dNTP's, 5μL 각 프라이머(2μM), 0.4μL Fast Start Taq, H₂O로 50μL까지 채움. PCRs은 Perkin-Elmer Thermal Cycler 9600을 이용하여 수행되었다. 조건은 다음과 같았다: 95℃에서 4분간 변성[고정], 그 다음 [사이클] 20사이클동안 95℃에서 30초간 변성, 45℃에서 45초간 어닐링, 72℃에서 90초간 연장, 그 다음 72℃에서 10분간 [고정], 그 다음 4℃ [고정]. 0.86kbp PCR 산물은 HindIII로 잘려지고 pMCS5의 HindIII 사이트내로 클로닝되어 pDB2778(도 51)로 생성되었다. 유니버설 포워드 및 리버스 프라이머 뿐만 아니라 DS236, DS237, DS238 및 DS239(표 8)를 이용한 제한 효소 다이제스션 및 시퀀싱으로 변형 TRP1 유전자의 시퀀스가 맞았음을 확인하였다.

표 8: 올리고뉴클레오타이드 프라이머

pDB2778로부터 HindIII 다이제스션에 의해 0.86kb TRP1 유전자가 분리되었으며 pDB3069의 HindIII 사이트내로 클로닝되어 pDB3078(도 52) 및 pDB3079(도 53)가 생성되었다. pDB3078 또는 pDB3079로부터 NotI/PstI 다이제스션에 의해 1.4kb pdi1::TRP1 디스럽팅 DNA 프레그먼트가 분리되었다.

TRP1 결핍된 이스트 스트레인(trp1 Δ)은 trpΔ가 생성되면 TRP1 마커 유전자(pDB2778)에 대한 상동성이 게놈내에 남아있지 않아 앞으로 존재하게 될 TRP1 함유 구조물과 TRP1 로커스 사이에 동종성 재조합을 저해할 수 있도록 구성되게 하였다. 선택된 숙주 스트레인의 게놈으로부터 본래 TRP1 서열을 완전 제거하기 위해, 올리고뉴클레오타이드는 통합 벡터 YIplac204(Gietz & Sugino, 1988, Gene, 74, 527-534)상에 존재하는 TRP1 마커 유전자 외부의 TRP1 유전자의 5'UTR과 3'UTR의 구역을 증폭시키도록 디자인되었다. YIplac204 TRP1 마커 유전자는 내부 HindIII, PstI 및 XbaI 사이트가 사이트 디렉티드 돌연변이 생성에 의해 제거된 점에서 본래/염색체 TRP1 유전자와 다르다(Gietz & Sugino, 1988, Gene, 74, 527-534). YIplac204 변형 TRP1 마커 유전자는 TRP1 유전자와 TRP1 프로모터의 102bp만 함유된 1.453kbp 블런트-엔드 게노믹 프레그먼트 EcoRI 프레그먼트(Gietz & Sugino, 1988, Gene, 74, 527-534)로부터 제작되었다. 이는 상대적으로 짧은 프로모터임에도 불구하고 trp1 영양요구성 돌연변이를 보완하기에 명확히 충분하였다(Gietz & Sugino, 1988, Gene, 74, 527-534). TRP1 ORF의 시작에서 102bp 5'에 위치한 EcoRI 사이트의 DNA 서열 상위만 5' TRP1 UTR을 생성하는데 사용되었다. 3'UTR의 선택은 이것이 기능 변형된 TRP1 마커의 3' 말단 외부에 존재하는 한 아주 중요하진 않았으며, 이는 번역 종결 코돈의 85bp 하위이 되도록 선택되었다.

단일 스트랜드 올리고뉴클레오타이드 DNA 프라이머는 PCR 증폭도중 제한 효소 사이트가 이후 클로닝 단계에 사용되는 PCR 산물의 말단에 더해지도록 TRP1 유전자의 5'UTR 및 3'UTR 리전을 증폭시키도록 디자인되고 구성되었다. 프라이머 DS230 및 DS231(표 8)은 PCR에 의해 TRP1의 5'리전을 증폭시켰으며, 프라이머 DS232 및 DS233(표 8)은 S288c 게노믹 DNA를 주형으로 이용하여 TRP1의 3'리전을 증폭시켰다. PCR 조건은 다음과 같았다: 1μL 주형 S288c 게노믹 DNA(0.01ng/μL, 0.1ng/μL, 1ng/μL, 10ng/μL 및 100ng/μL로), 5μL 10X버퍼(Fast Start Taq + Mg, (Roche)), 1μL 10mM dNTP's, 5μL 각 프라이머(2μM), 0.4μL Fast Start Taq, H₂O로 50μL까지 채움. PCRs은 Perkin-Elmer Thermal Cycler 9600을 이용하여 수행되었다. 조건은 다음과 같았다: 95℃에서 4분간 변성[고정], 그 다음 [사이클] 20사이클동안 95℃에서 30초간 변성, 45℃에서 45초간 어닐링, 72℃에서 90초간 연장, 그 다음 72℃에서 10분간 [고정], 그 다음 4℃ [고정].

0.19kbp TRP1 5'UTR PCR 산물은 EcoRI 및 HindIII로 잘려지고, 0.2kbp TRP1 3'UTR PCR 산물은 BamHI 및 HindIII로 잘려지고 BamHI/EcoRI으로 선형화된 pAYE505내로 라이게이션되어 플라스미드 pDB2777(도 54)가 생성되었다. pAYE505의 구성은 WO 95/33833에 기재되어 있다. 플라스미드 백본 및 클로닝된 삽입물 서열로부터 프라이밍하도록 디자인된 포워드 및 리버스 프라이머를 이용한 DNA 시퀀싱을 수행하여 모든 경우에 클로닝된 TRP1 유전자의 5' 및 3'UTR 서열이 예측한 DNA 서열을 가졌음을 확인하였다. 플라스미드 pDB2777은 TRP1의 5' 및 3'UTR로부터 유래된 서열 융합을 포함하는 TRP1 디스럽팅 프레그먼트를 함유하였다. 이 0.383kbp TRP1 디스럽팅 프레그먼트는 EcoRI을 이용한 완전 다이제스션에 의해 pDB2777로부터 제거되었다.

이스트 스트레인 DXY1(Kerry-Williams et al., 1988, Yeast, 14, 161-169)는 변형 리튬 아세테이트 방법(Sigma yeast transformation kit, YEAST-1, protocol 2; (Ito et al, 1983, J. Bacteriol ., 153, 163; Elble, 1992, Biotechniques, 13, 18)을 이용하여 알부민 발현 플라스미드 pDB2244를 가지고 루신 독립영양성으로 형질변형되어 이스트 스트레인 DXY1[pDB2244]을 생성하였다. 알부민 발현 플라스미드 pDB2244의 구성은 WO 00/44772에 기재되어 있다. 형질변형체는 BMMD-아가 플래이트상에서 선별되고, 후속적으로 BMMD-아가 플래이트상에서 패치아웃되었다. 저온보존된 트레할로스 스톡을 10mL BMMD 쉐이크 플라스크 배양물로부터 제조하였다(24시간, 30℃, 200rpm).

DXY[pDB2244]는 Toyn et al., (2000 Yeast 16, 553-560)에 기재된 바와 같은 역 선별 트립토판 유사체를 포함하는 영양 아가를 이용하여 pDB2777로부터 0.383kbp EcoRI TRP1 디스럽팅 DNA 프레그먼트를 가지고 트립토판 자가영양성으로 형질변형되었다. 5-FAA의 독성 영향에 저항적인 콜로니를 집어서 제2 라운드의 5-FAA 플래이트에 스트리킹하여 이들이 실제로 5-FAA에 저항적이었음을 확인하였고 어느 백그라운드 성장을 피하여 선택하였다. 성장된 콜로니들은 그 다음 BMMD 및 BMMD + 트립토판상에 재-패치되어 트립토판 자가영양성인지 확인하였다.

후속적으로 트립토판 자가영양성인 것으로 나타난 콜로니를 분리체가 trp1이었음을 확인하기위해 YCplac22(Gietz & Sugino, 1988, Gene, 74, 527-534)를 이용한 형질변형에 의한 추가 분석용으로 선택하였다.

TRP1 로커스를 지나는 PCR 증폭은 트립토판 자가영양성이 이 리전내 결실에 기인한 것임을 확인하기위해 사용되었다. 게노믹 DNA는 5-FAA에 저항적이며 트립토판 첨가없이 최소배지에서 성장이 불가능한 것으로 확인된 분리체로부터 준비되었다. 프라이머 CED005 및 CED006(표 8)을 이용한 게노믹 TRP1 로커스의 PCR 증폭은 다음과 같이 이루어졌다: 1μL 주형 게노믹 DNA, 5μL 10X버퍼(Fast Start Taq + Mg, (Roche)), 1μL 10mM dNTP's, 5μL 각 프라이머(2μM), 0.4μL Fast Start Taq, H₂O로 50μL까지 채움. PCRs은 Perkin-Elmer Thermal Cycler 9600을 이용하여 수행되었다. 조건은 다음과 같았다: 94℃에서 10분간 변성[고정], 그 다음 [사이클] 40사이클동안 94℃에서 30초간 변성, 55℃에서 30초간 어닐링, 72℃에서 120초간 연장, 그 다음 72℃에서 10분간 [고정], 그 다음 4℃ [고정]. 야생형 TRP1 로커스의 PCR 증폭은 1.34kbp 크기의 PCR 산물을 형성하였으며, 제거된 TRP1 리전을 지나는 증폭은 보다 0.50kbp 작은 0.84kbp PCR 산물을 형성하였다. PCR 분석으로 예측된 제거를 갖는 DXY1 유도 trp- 스트레인(trp1 Δ[pDB2244])를 확인하였다.

이스트 스트레인 DXY1 trp1 Δ[pDB2244]은 Sleep et al., 1991, Bio/Technology, 9, 183-187에 기술된 바와 같은 발현 플라스미드 pDB2244로 교정되었다. trp1 Δcir⁰은 변형 리튬 아세테이트 방법(Sigma yeast transformation kit, YEAST-1, protocol 2; (Ito et al, 1983, J. Bacteriol ., 153, 163; Elble, 1992, Biotechniques, 13, 18))을 이용하여 pDB2244, pDB2976, pDB2977, pDB2978, pDB2979, pDB2980 또는 pDB2981(pDB2976, pDB2977 및 pDB2980 또는 pDB2981의 생성을 실시예 10에 보다 상세히 언급된다.)를 가지고 루신 독립영양성으로 형질변형되었다. 형질변형체는 트립토판이 보충된 BMMD-아가 플래이트상에서 선별되어 후속적으로 트립토판이 보충된 BMMD-아가 플래이트상에서 패치아웃되었다. 저온보존된 트레할로스 스톡을 트립토판이 보충된 10mL BMMD 쉐이크 플라스크 배양물로부터 준비되었다(24시간, 30℃, 200 rpm).

이스트 스트레인 DXY1 trp1 Δ[pDB2976], DXY1 trp1 Δ[pDB2977], DXY1 trp1 Δ[pDB3078], DXY1 trp1 Δ[pDB3079], DXY1 trp1 Δ[pDB2980] 또는 DXY1 trp1 Δ[pDB2981]은 변형 리튬 아세테이트 방법(Sigma yeast transformation kit, YEAST-1, protocol 2; (Ito et al, 1983, J. Bacteriol ., 153, 163; Elble, 1992, Biotechniques, 13, 18))을 이용하여 트립토판 독립영양성으로 형질변형되었으며 1.41kb pdi1 :: TRP1 디스럽팅 DNA 프레그먼트가 NotI/PstI 다이제스션에 의해 pDB3078로부터 분리되었다. 형질변형체는 BMMD-아가 플래이트상에서 선별되어 후속적으로 BMMD-아가 플래이트상에서 패치아웃되었다.

각 스트레인의 6 형질변형체가 50mL 쉐이크 플라스크에 담긴 10mL YEPD내로 접종되었으며 오비털 쉐이커에서 30℃에서, 200rpm으로 4일간 배양되었다. 게노믹 DNA는 트립토판 독립영향성 및 DXY1[pDB2244]로 부터 준비되었다(Lee, 1992, Biotechniques, 12, 677). 프라이머 DS236 및 DS303(표 7 및 8)를 이용한 게노믹 PDI1 로커스의 PCR 증폭은 다음과 같이 이루어졌다: 1μL 주형 게노믹 DNA, 5μL 10X버퍼(Fast Start Taq + Mg, (Roche)), 1μL 10mM dNTP's, 5μL 각 프라이머(2μM), 0.4μL Fast Start Taq, H₂O로 50μL까지 채움. PCRs은 Perkin-Elmer Thermal Cycler 9700을 이용하여 수행되었다. 조건은 다음과 같았다: 94℃에서 4분간 변성[고정], 그 다음 [사이클] 30사이클동안 94℃에서 30초간 변성, 50℃에서 30초간 어닐링, 72℃에서 60초간 연장, 그 다음 72℃에서 10분간 [고정], 그 다음 4℃ [고정]. 야생형 PDI1 로커스의 PCR 증폭은 PCR 산물을 형성하지 않았으며, 제거된 PDI1 리전을 지나는 증폭은 보다 0.65kbp PCR 산물을 형성하였다. PCR 분석으로 시험된 모든 36 포텐셜 pdi1 :: TRP1 스트레인은 예측된 pdi1 :: TRP1 제거를 갖는 것을 확인하였다.

재조합 알부민 타이터는 로켓 면역전기영동으로 비교되었다(도 55). 각 그룹에서, DXY1 trp1 Δ[pDB2976], DXY1 trp1 Δ[pDB2978], DXY1 trp1 Δ[pDB2980], DXY1 trp1Δ[pDB2977], 및 DXY1 trp1 Δ[pDB2979]중 모든 6 pdi1 :: TRP1 분해물은 매우 유사한 rHA 생산능을 가졌다. DXY1 trp1 Δ[pDB2981]의 6 pdi1 :: TRP1 분해물만이 rHA 발현 타이터가 다양하였다. 도 55에 나타낸 6 pdi1 :: TRP1 분해물은 단일 콜로니를 분리하기위해 YEPD 아가상에 스프레딩한 다음 BMMD 아가상에 재패치하였다.

DXY1 [pDB2244], DXY1 [pDB2976], DXY1 [pDB2978], DXY1 [pDB2980], DXY1 [pDB2977], DXY1 [pDB2979] 및 DXY1 [pDB2981]과 함께 DXY1 trp1 Δ pdi1 :: TRP1 [pDB2976], DXY1 trp1 Δ pdi1 :: TRP1 [pDB2978], DXY1 trp1 Δ pdi1 :: TRP1 [pDB2980], DXY1 trp1 Δ pdi1 :: TRP1 [pDB2977], DXY1 trp1 Δ pdi1 :: TRP1 [pDB2979] 및 DXY1 trp1 Δ pdi1 :: TRP1 [pDB2981]의 3 단일 세포 분리물을 50mL 쉐이크 플라스크에 담긴 10mL YEPD내로 접종하고 30℃에서 200rpm으로 4일간 오비털 쉐이커에서 배양하였다. 배양 상층액을 수거하고 재조합 알부민 타이터를 로켓 면역전기영동으로 비교하였다(도 56). 도 56에 나타낸 30개의 야생형 PDI1 및 pdiI::TRP1 분해물은 단일 콜로니를 분리하기 위해 YEPD 아가상에 스프레딩되었다. 그 다음 각 스트레인으로부터 100개의 단일 세포 콜로니를 고트 항-HSA 항체(Sleep et al., 1991, Bio/Technology, 9, 183-187)를 함유하는 BMMD 아가 또는 YEPD 아가상에 재패치하여 재조합 알부민의 발현을 검출하였으며, 각 콜로니의 Leu+/rHA+, Leu-/rHA+ 또는 Leu-/rHA- 표현형을 기록하였다(표 9).

표 9:

이러한 데이타는 PDI1 유전자가 염색체 암호화된 PDI를 갖지 않는 숙주 스트레인에서 플라스미드상에 선별 마커로 사용되는 경우 이러한 완전 배지와 같은 비-선별 배지에서도 플라스미드 보유율이 증가됨을 나타낸다. 이는 "필수" 샤프롱(예, PDI1 또는 PSE1), 또는 제거 혹은 불활성화되는 경우 영양요구성(생합성) 요구를 형성하지 않는 어느 다른 어느 "필수" 유전자 산물(예, PGK1 또는 FBA1)이 세포가 특정 선별 조건하에서 배양되는 것을 필요로 하는 불리함없이 증가된 플라스미드 안정성을 달성하기위해 그 유전자 산물을 생산할 수 없는 플라스미드의 부재하에서 숙주 세포내 플라스미드상에 선별 마커로 사용될 수 있음을 보여준다. "영양요구성(생합성) 요구"란 성장 배지에 첨가 또는 변형에 의해 보완될 수 있는 결핍을 포함한다. 따라서, 본 발명의 이러한 정황에서 "필수 마커 유전자"는 숙주세포에서 제거 혹은 불활성화되는 경우 성장 배지에 첨가나 변형에 의해 보완될 수 없는 결핍을 일으키는 것이다.

실시예 10

동일한 2㎛-유사 플라스미드상에 여러가지 PDI1 유전자 및 여러가지 이종 단백질에 대한 발현 카세트를 함유하는 발현 벡터의 구성

PDI1 유전자의 PCR 증폭 및 YIplac211 내로의 클로닝

에스. 세레비지아에 S288c 및 에스. 세레비지아에 SKQ2n의 PDI1 유전자를 PCR에 의해 증폭하여 프로모터 서열을 함유하는 다른 길이의 5'-비번역 리전을 갖는 DNA 프레그먼트를 생성하였다. PCR 프라이머는 PCR 산물을 YIplac211(Gietz & Sugino, 1988, Gene, 74, 527-534)의 EcoRI 및 BamHI 사이트내로 삽입할 수 있도록 디자인되었다. 부가적인 제한 엔도뉴클레아제 사이트가 또한 후속적인 클로닝을 촉진하기 위해 PCR 프라이머에 편입되었다. 표 10은 구성된 플라스미드를 설명하며 표 11은 PDI1 유전자를 증폭하기 위해 사용된 PCR 프라이머 서열을 제공한다. 이러한 YIplac211-기초 플라스미드내에서 PDI1 프로모터 길이의 차이는 표 10에 나타내어진다.

에스. 세레비지아에 S288c 게노믹 DNA로부터 PDI1 유전자의 PCR 증폭하고, 그 다음 PCR 산물을 EcoRI 및 BamHI으로 다이제스션하고 이로부터 얻어진 약 1.98-kb 프레그먼트를 EcoRI 및 BamHI으로 잘려진 YIplac211(Gietz & Sugino, 1988, Gene, 74, 527-534)내로 클로닝하여 pDB2939(도 57)를 생성하였다. pDB2939의 DNA 시퀀싱으로 표 5에 굵게 표시된 DS248 서열내에서 'G' 소실을 확인하였다. PDI1 유전자를 시퀀싱하는데 사용된 올리고뉴클레오타이드 프라이머는 표 6에 열거되며, 공개된 S288c PDI1 유전자 서열(코디네이트 50221 내지 48653의 염색체 III상의 PDI1/YCL043C + 상위 서열의 1000 염기쌍 및 하위 서열의 1000 염기쌍(http://www.yeastgenome.org/Genebank Accession number NC001135))로 부터 디자인되었다.

표 10: PDI1 유전자를 함유하는 YIplac211-기초 플라스미드

표 11: 에스. 세레비지아에 PDI1 유전자의 PCR 증폭용 올리고뉴클레오타이드 프라이머

표 12: 에스. 세레비지아에 PDI1 유전자의 DNA 시퀀싱용 올리고뉴클레오타이드

플라스미드 pDB2941(도 58) 및 pDB2942(도 59)는 마찬가지로 표 10 및 11에 나타낸 PCR 프라이머를 이용하여 증폭하고 그 약 1.90-kb 및 1.85-kb EcoRI-BamHI 프레그먼트를 각각 YIplac211내로 클로닝함으로써 구성되었다. 올바른 DNA 서열을 pDB2941 및 pDB2942에서 PDI1 유전자에 대해 확인하였다.

에스. 세레비지아에 SKQ2n PDI1 유전자 서열은 Clone C7(Crouzet & Tuite, 1987, 상기 참조; Farquhar et al., 1991, 상기 참조)으로도 알려진 pMA3a:C7(US 6,291,205)의 PDI1 유전자를 함유하는 플라스미드 DNA로부터 증폭되었다. SKQ2n PDI1 유전자는 올리고뉴클레오타이드 프라이머 DS248 및 DS250(표 10 및 11)을 이용하여 증폭되었다. 이로부터 얻어진 약 2.01-kb PCR 산물은 EcoRI 및 BamHI으로 다이제스션되고 EcoRI 및 BamHI으로 잘려진 YIplac211(Gietz & Sugino, 1988, Gene, 74, 527-534)내로 라이게이션되어 플라스미드 pDB2943(도 60)을 생성하였다. SKQ2n PDI1 서열의 5'말단은 EcoRI, SacI, SnaBI, PacI, FseI, SfiI 및 SmaI 사이트를 포함하도록 연장된 블런트-엔드 SpeI-사이트와 유사하며, 3'말단은 SmaI, SnaBI 및 BamHI 사이트를 포함하도록 연장된 블런트-엔드 Bsu36I 사이트와 유사하다. PDI1 프로모터 길이는 약 210bp이다. 전체 DNA 서열은 표 12에 주어진 올리고뉴클레오타이드 프라이머를 이용하여 PDI1 프레그먼트에 대해 조사되었다. 이는 에스. 세레비지아에 스트레인 SKQ2n(NCBI 등록번호 CAA38402)의 PDI 단백질에 대한 암호 서열이 존재하나 포지션 114에 세린 잔기(앞서 공개된 바와 같이 아르기닌 잔기가 아닌)를 갖는 것으로 나타났다. 마찬가지로, pDB2939의 에스. 세레비지아에 S288c 서열에서와 같은 방식으로, 또한 pDB2943은 표 5에 굵게 표시된 DS248 서열내에 'G' 소실을 가졌다.

플라스미드 pDB2963(도 61) 및 pDB2945(도 62)는 마찬가지로 표 10 및 11에 기재된 PCR 프라이머를 이용하여 증폭되고 그 약 1.94-kb 및 1.87-kb EcoRI-BamHI 프레그먼트를 각각 YIplac211내로 클로닝함으로써 구성되었다. 예측된 DNA 서열을 pDB2963 및 pDB2945에서 PDI1 유전자에 대해 확인하였으며, 아미노산 114의 포지션 에 세린 코돈을 갖는 것으로 나타났다.

REP2 이후 XcmI-사이트에 삽입된 다른 PDI1 유전자를 갖는 pSAC35-기초 rHA 발현 플라스미드의 구성:

다른 PDI1 유전자와 함께 rHA의 동시-발현을 위한 pSAC35-기초 플라스미드를 제작하였다(표 13).

표 13: 다른 PDI1 유전자와 함께 rHA의 동시-발현을 위한 pSAC35-기초 플라스미드

pDB2243(도 63, WO 00/44772에 기재된 바와 같음)의 rHA 발현 카세트를 2,992-bp NotI 프레그먼트상에서 우선 분리하고, 후속적으로 pDB2688(도 4)의 NotI-사이트내로 클로닝하여 pDB2693(도 64)를 생성하였다. pDB2693은 SnaBI으로 다이제스션되고, CIAP로 처리된 다음, pDB2943, pDB2963, pDB2945, pDB2939, pDB2941 및 pDB2942의 PDI1 유전자를 함유하는 SnaBI 프레그먼트와 라이게이션되었다. 이는 플라스미드 pDB2976 - pDB2987(도 65 - 76)을 생성하였다. REP2와 동일한 방향으로 전사된 PDI1은 "방향 A"로 표시되었으며, REP2와 반대 방향으로 전사된 PDI1은 "방향 B"로 표시되었다(표 13).

<110> Delta Biotechnology Limited <120> 2-MICRON FAMILY PLASMID AND USE THEREOF <150> GB 0329722.3 <151> 2003-12-23 <160> 85 <170> KopatentIn 1.71 <210> 1 <211> 1485 <212> DNA <213> Saccharomyces cerevisiae REP2 gene and adjacent inverted repeat on 2um plasmid <400> 1 atggacgaca ttgaaacagc caagaatctg acggtaaaag cacgtacagc ttatagcgtc 60 tgggatgtat gtcggctgtt tattgaaatg attgctcctg atgtagatat tgatatagag 120 agtaaacgta agtctgatga gctactcttt ccaggatatg tcataaggcc catggaatct 180 ctcacaaccg gtaggccgta tggtcttgat tctagcgcag aagattccag cgtatcttct 240 gactccagtg ctgaggtaat tttgcctgct gcgaagatgg ttaaggaaag gtttgattcg 300 attggaaatg gtatgctctc ttcacaagaa gcaagtcagg ctgccataga tttgatgcta 360 cagaataaca agctgttaga caatagaaag caactataca aatctattgc tataataata 420 ggaagattgc ccgagaaaga caagaagaga gctaccgaaa tgctcatgag aaaaatggat 480 tgtacacagt tattagtccc accagctcca acggaagaag atgttatgaa gctcgtaagc 540 gtcgttaccc aattgcttac tttagttcca ccagatcgtc aagctgcttt aataggtgat 600 ttattcatcc cggaatctct aaaggatata ttcaatagtt tcaatgaact ggcggcagag 660 aatcgtttac agcaaaaaaa gagtgagttg gaaggaagga ctgaagtgaa ccatgctaat 720 acaaatgaag aagttccctc caggcgaaca agaagtagag acacaaatgc aagaggagca 780 tataaattac aaaacaccat cactgagggc cctaaagcgg ttcccacgaa aaaaaggaga 840 gtagcaacga gggtaagggg cagaaaatca cgtaatactt ctagggtatg atccaatatc 900 aaaggaaatg atagcattga aggatgagac taatccaatt gaggagtggc agcatataga 960 acagctaaag ggtagtgctg aaggaagcat acgatacccc gcatggaatg ggataatatc 1020 acaggaggta ctagactacc tttcatccta cataaataga cgcatataag tacgcattta 1080 agcataaaca cgcactatgc cgttcttctc atgtatatat atatacaggc aacacgcaga 1140 tataggtgcg acgtgaacag tgagctgtat gtgcgcagct cgcgttgcat tttcggaaac 1200 gctcgttttc ggaaacgctt tgaagttcct attccgaagt tcctattctc tagaaagtat 1260 aggaacttca gagcgctttt gaaaaccaaa agcgctctga agacgcactt tcaaaaaacc 1320 aaaaacgcac cggactgtaa cgagctacta aaatattgcg aataccgctt ccacaaacat 1380 tgctcaaaag tatctctttg ctatatatct ctgtgctata tccctatata acctacccat 1440 ccacctttcg ctccttgaac ttgcatctaa actcgacctc tacat 1485 <210> 2 <211> 1688 <212> DNA <213> Saccharomyces cerevisiae FLP gene and adjacent inverted repeat on 2um plasmid <400> 2 atgccacaat ttggtatatt atgtaaaaca ccacctaagg tgcttgttcg tcagtttgtg 60 gaaaggtttg aaagaccttc aggtgagaaa atagcattat gtgctgctga actaacctat 120 ttatgttgga tgattacaca taacggaaca gcaatcaaga gagccacatt catgagctat 180 aatactatca taagcaattc gctgagtttc gatattgtca ataaatcact ccagtttaaa 240 tacaagacgc aaaaagcaac aattctggaa gcctcattaa agaaattgat tcctgcttgg 300 gaatttacaa ttattcctta ctatggacaa aaacatcaat ctgatatcac tgatattgta 360 agtagtttgc aattacagtt cgaatcatcg gaagaagcag ataagggaaa tagccacagt 420 aaaaaaatgc ttaaagcact tctaagtgag ggtgaaagca tctgggagat cactgagaaa 480 atactaaatt cgtttgagta tacttcgaga tttacaaaaa caaaaacttt ataccaattc 540 ctcttcctag ctactttcat caattgtgga agattcagcg atattaagaa cgttgatccg 600 aaatcattta aattagtcca aaataagtat ctgggagtaa taatccagtg tttagtgaca 660 gagacaaaga caagcgttag taggcacata tacttcttta gcgcaagggg taggatcgat 720 ccacttgtat atttggatga atttttgagg aattctgaac cagtcctaaa acgagtaaat 780 aggaccggca attcttcaag caataaacag gaataccaat tattaaaaga taacttagtc 840 agatcgtaca ataaagcttt gaagaaaaat gcgccttatt caatctttgc tataaaaaat 900 ggcccaaaat ctcacattgg aagacatttg atgacctcat ttctttcaat gaagggccta 960 acggagttga ctaatgttgt gggaaattgg agcgataagc gtgcttctgc cgtggccagg 1020 acaacgtata ctcatcagat aacagcaata cctgatcact acttcgcact agtttctcgg 1080 tactatgcat atgatccaat atcaaaggaa atgatagcat tgaaggatga gactaatcca 1140 attgaggagt ggcagcatat agaacagcta aagggtagtg ctgaaggaag catacgatac 1200 cccgcatgga atgggataat atcacaggag gtactagact acctttcatc ctacataaat 1260 agacgcatat aagtacgcat ttaagcataa acacgcacta tgccgttctt ctcatgtata 1320 tatatataca ggcaacacgc agatataggt gcgacgtgaa cagtgagctg tatgtgcgca 1380 gctcgcgttg cattttcgga agcgctcgtt ttcggaaacg ctttgaagtt cctattccga 1440 agttcctatt ctctagaaag tataggaact tcagagcgct tttgaaaacc aaaagcgctc 1500 tgaagacgca ctttcaaaaa accaaaaacg caccggactg taacgagcta ctaaaatatt 1560 gcgaataccg cttccacaaa cattgctcaa aagtatctct ttgctatata tctctgtgct 1620 atatccctat ataacctacc catccacctt tcgctccttg aacttgcatc taaactcgac 1680 ctctacat 1688 <210> 3 <211> 522 <212> PRT <213> Saccharomyces cerevisiae PDI1 protein sequence <400> 3 Met Lys Phe Ser Ala Gly Ala Val Leu Ser Trp Ser Ser Leu Leu Leu 1 5 10 15 Ala Ser Ser Val Phe Ala Gln Gln Glu Ala Val Ala Pro Glu Asp Ser 20 25 30 Ala Val Val Lys Leu Ala Thr Asp Ser Phe Asn Glu Tyr Ile Gln Ser 35 40 45 His Asp Leu Val Leu Ala Glu Phe Phe Ala Pro Trp Cys Gly His Cys 50 55 60 Lys Asn Met Ala Pro Glu Tyr Val Lys Ala Ala Glu Thr Leu Val Glu 65 70 75 80 Lys Asn Ile Thr Leu Ala Gln Ile Asp Cys Thr Glu Asn Gln Asp Leu 85 90 95 Cys Met Glu His Asn Ile Pro Gly Phe Pro Ser Leu Lys Ile Phe Lys 100 105 110 Asn Ser Asp Val Asn Asn Ser Ile Asp Tyr Glu Gly Pro Arg Thr Ala 115 120 125 Glu Ala Ile Val Gln Phe Met Ile Lys Gln Ser Gln Pro Ala Val Ala 130 135 140 Val Val Ala Asp Leu Pro Ala Tyr Leu Ala Asn Glu Thr Phe Val Thr 145 150 155 160 Pro Val Ile Val Gln Ser Gly Lys Ile Asp Ala Asp Phe Asn Ala Thr 165 170 175 Phe Tyr Ser Met Ala Asn Lys His Phe Asn Asp Tyr Asp Phe Val Ser 180 185 190 Ala Glu Asn Ala Asp Asp Asp Phe Lys Leu Ser Ile Tyr Leu Pro Ser 195 200 205 Ala Met Asp Glu Pro Val Val Tyr Asn Gly Lys Lys Ala Asp Ile Ala 210 215 220 Asp Ala Asp Val Phe Glu Lys Trp Leu Gln Val Glu Ala Leu Pro Tyr 225 230 235 240 Phe Gly Glu Ile Asp Gly Ser Val Phe Ala Gln Tyr Val Glu Ser Gly 245 250 255 Leu Pro Leu Gly Tyr Leu Phe Tyr Asn Asp Glu Glu Glu Leu Glu Glu 260 265 270 Tyr Lys Pro Leu Phe Thr Glu Leu Ala Lys Lys Asn Arg Gly Leu Met 275 280 285 Asn Phe Val Ser Ile Asp Ala Arg Lys Phe Gly Arg His Ala Gly Asn 290 295 300 Leu Asn Met Lys Glu Gln Phe Pro Leu Phe Ala Ile His Asp Met Thr 305 310 315 320 Glu Asp Leu Lys Tyr Gly Leu Pro Gln Leu Ser Glu Glu Ala Phe Asp 325 330 335 Glu Leu Ser Asp Lys Ile Val Leu Glu Ser Lys Ala Ile Glu Ser Leu 340 345 350 Val Lys Asp Phe Leu Lys Gly Asp Ala Ser Pro Ile Val Lys Ser Gln 355 360 365 Glu Ile Phe Glu Asn Gln Asp Ser Ser Val Phe Gln Leu Val Gly Lys 370 375 380 Asn His Asp Glu Ile Val Asn Asp Pro Lys Lys Asp Val Leu Val Leu 385 390 395 400 Tyr Tyr Ala Pro Trp Cys Gly His Cys Lys Arg Leu Ala Pro Thr Tyr 405 410 415 Gln Glu Leu Ala Asp Thr Tyr Ala Asn Ala Thr Ser Asp Val Leu Ile 420 425 430 Ala Lys Leu Asp His Thr Glu Asn Asp Val Arg Gly Val Val Ile Glu 435 440 445 Gly Tyr Pro Thr Ile Val Leu Tyr Pro Gly Gly Lys Lys Ser Glu Ser 450 455 460 Val Val Tyr Gln Gly Ser Arg Ser Leu Asp Ser Leu Phe Asp Phe Ile 465 470 475 480 Lys Glu Asn Gly His Phe Asp Val Asp Gly Lys Ala Leu Tyr Glu Glu 485 490 495 Ala Gln Glu Lys Ala Ala Glu Glu Ala Asp Ala Asp Ala Glu Leu Ala 500 505 510 Asp Glu Glu Asp Ala Ile His Asp Glu Leu 515 520 <210> 4 <211> 530 <212> PRT <213> Saccharomyces cerevisiae alternative PDI1 protein sequence <400> 4 Met Lys Phe Ser Ala Gly Ala Val Leu Ser Trp Ser Ser Leu Leu Leu 1 5 10 15 Ala Ser Ser Val Phe Ala Gln Gln Glu Ala Val Ala Pro Glu Asp Ser 20 25 30 Ala Val Val Lys Leu Ala Thr Asp Ser Phe Asn Glu Tyr Ile Gln Ser 35 40 45 His Asp Leu Val Leu Ala Glu Phe Phe Ala Pro Trp Cys Gly His Cys 50 55 60 Lys Asn Met Ala Pro Glu Tyr Val Lys Ala Ala Glu Thr Leu Val Glu 65 70 75 80 Lys Asn Ile Thr Leu Ala Gln Ile Asp Cys Thr Glu Asn Gln Asp Leu 85 90 95 Cys Met Glu His Asn Ile Pro Gly Phe Pro Ser Leu Lys Ile Phe Lys 100 105 110 Asn Arg Asp Val Asn Asn Ser Ile Asp Tyr Glu Gly Pro Arg Thr Ala 115 120 125 Glu Ala Ile Val Gln Phe Met Ile Lys Gln Ser Gln Pro Ala Val Ala 130 135 140 Val Val Ala Asp Leu Pro Ala Tyr Leu Ala Asn Glu Thr Phe Val Thr 145 150 155 160 Pro Val Ile Val Gln Ser Gly Lys Ile Asp Ala Asp Phe Asn Ala Thr 165 170 175 Phe Tyr Ser Met Ala Asn Lys His Phe Asn Asp Tyr Asp Phe Val Ser 180 185 190 Ala Glu Asn Ala Asp Asp Asp Phe Lys Leu Ser Ile Tyr Leu Pro Ser 195 200 205 Ala Met Asp Glu Pro Val Val Tyr Asn Gly Lys Lys Ala Asp Ile Ala 210 215 220 Asp Ala Asp Val Phe Glu Lys Trp Leu Gln Val Glu Ala Leu Pro Tyr 225 230 235 240 Phe Gly Glu Ile Asp Gly Ser Val Phe Ala Gln Tyr Val Glu Ser Gly 245 250 255 Leu Pro Leu Gly Tyr Leu Phe Tyr Asn Asp Glu Glu Glu Leu Glu Glu 260 265 270 Tyr Lys Pro Leu Phe Thr Glu Leu Ala Lys Lys Asn Arg Gly Leu Met 275 280 285 Asn Phe Val Ser Ile Asp Ala Arg Lys Phe Gly Arg His Ala Gly Asn 290 295 300 Leu Asn Met Lys Glu Gln Phe Pro Leu Phe Ala Ile His Asp Met Thr 305 310 315 320 Glu Asp Leu Lys Tyr Gly Leu Pro Gln Leu Ser Glu Glu Ala Phe Asp 325 330 335 Glu Leu Ser Asp Lys Ile Val Leu Glu Ser Lys Ala Ile Glu Ser Leu 340 345 350 Val Lys Asp Phe Leu Lys Gly Asp Ala Ser Pro Ile Val Lys Ser Gln 355 360 365 Glu Ile Phe Glu Asn Gln Asp Ser Ser Val Phe Gln Leu Val Gly Lys 370 375 380 Asn His Asp Glu Ile Val Asn Asp Pro Lys Lys Asp Val Leu Val Leu 385 390 395 400 Tyr Tyr Ala Pro Trp Cys Gly His Cys Lys Arg Leu Ala Pro Thr Tyr 405 410 415 Gln Glu Leu Ala Asp Thr Tyr Ala Asn Ala Thr Ser Asp Val Leu Ile 420 425 430 Ala Lys Leu Asp His Thr Glu Asn Asp Val Arg Gly Val Val Ile Glu 435 440 445 Gly Tyr Pro Thr Ile Val Leu Tyr Pro Gly Gly Lys Lys Ser Glu Ser 450 455 460 Val Val Tyr Gln Gly Ser Arg Ser Leu Asp Ser Leu Phe Asp Phe Ile 465 470 475 480 Lys Glu Asn Gly His Phe Asp Val Asp Gly Lys Ala Leu Tyr Glu Glu 485 490 495 Ala Gln Glu Lys Ala Ala Glu Glu Ala Glu Ala Asp Ala Glu Ala Glu 500 505 510 Ala Asp Ala Asp Ala Glu Leu Ala Asp Glu Glu Asp Ala Ile His Asp 515 520 525 Glu Leu 530 <210> 5 <211> 642 <212> PRT <213> Saccharomyces cerevisiae SSA1 protein sequence <400> 5 Met Ser Lys Ala Val Gly Ile Asp Leu Gly Thr Thr Tyr Ser Cys Val 1 5 10 15 Ala His Phe Ala Asn Asp Arg Val Asp Ile Ile Ala Asn Asp Gln Gly 20 25 30 Asn Arg Thr Thr Pro Ser Phe Val Ala Phe Thr Asp Thr Glu Arg Leu 35 40 45 Ile Gly Asp Ala Ala Lys Asn Gln Ala Ala Met Asn Pro Ser Asn Thr 50 55 60 Val Phe Asp Ala Lys Arg Leu Ile Gly Arg Asn Phe Asn Asp Pro Glu 65 70 75 80 Val Gln Ala Asp Met Lys His Phe Pro Phe Lys Leu Ile Asp Val Asp 85 90 95 Gly Lys Pro Gln Ile Gln Val Glu Phe Lys Gly Glu Thr Lys Asn Phe 100 105 110 Thr Pro Glu Gln Ile Ser Ser Met Val Leu Gly Lys Met Lys Glu Thr 115 120 125 Ala Glu Ser Tyr Leu Gly Ala Lys Val Asn Asp Ala Val Val Thr Val 130 135 140 Pro Ala Tyr Phe Asn Asp Ser Gln Arg Gln Ala Thr Lys Asp Ala Gly 145 150 155 160 Thr Ile Ala Gly Leu Asn Val Leu Arg Ile Ile Asn Glu Pro Thr Ala 165 170 175 Ala Ala Ile Ala Tyr Gly Leu Asp Lys Lys Gly Lys Glu Glu His Val 180 185 190 Leu Ile Phe Asp Leu Gly Gly Gly Thr Phe Asp Val Ser Leu Leu Phe 195 200 205 Ile Glu Asp Gly Ile Phe Glu Val Lys Ala Thr Ala Gly Asp Thr His 210 215 220 Leu Gly Gly Glu Asp Phe Asp Asn Arg Leu Val Asn His Phe Ile Gln 225 230 235 240 Glu Phe Lys Arg Lys Asn Lys Lys Asp Leu Ser Thr Asn Gln Arg Ala 245 250 255 Leu Arg Arg Leu Arg Thr Ala Cys Glu Arg Ala Lys Arg Thr Leu Ser 260 265 270 Ser Ser Ala Gln Thr Ser Val Glu Ile Asp Ser Leu Phe Glu Gly Ile 275 280 285 Asp Phe Tyr Thr Ser Ile Thr Arg Ala Arg Phe Glu Glu Leu Cys Ala 290 295 300 Asp Leu Phe Arg Ser Thr Leu Asp Pro Val Glu Lys Val Leu Arg Asp 305 310 315 320 Ala Lys Leu Asp Lys Ser Gln Val Asp Glu Ile Val Leu Val Gly Gly 325 330 335 Ser Thr Arg Ile Pro Lys Val Gln Lys Leu Val Thr Asp Tyr Phe Asn 340 345 350 Gly Lys Glu Pro Asn Arg Ser Ile Asn Pro Asp Glu Ala Val Ala Tyr 355 360 365 Gly Ala Ala Val Gln Ala Ala Ile Leu Thr Gly Asp Glu Ser Ser Lys 370 375 380 Thr Gln Asp Leu Leu Leu Leu Asp Val Ala Pro Leu Ser Leu Gly Ile 385 390 395 400 Glu Thr Ala Gly Gly Val Met Thr Lys Leu Ile Pro Arg Asn Ser Thr 405 410 415 Ile Ser Thr Lys Lys Phe Glu Ile Phe Ser Thr Tyr Ala Asp Asn Gln 420 425 430 Pro Gly Val Leu Ile Gln Val Phe Glu Gly Glu Arg Ala Lys Thr Lys 435 440 445 Asp Asn Asn Leu Leu Gly Lys Phe Glu Leu Ser Gly Ile Pro Pro Ala 450 455 460 Pro Arg Gly Val Pro Gln Ile Glu Val Thr Phe Asp Val Asp Ser Asn 465 470 475 480 Gly Ile Leu Asn Val Ser Ala Val Glu Lys Gly Thr Gly Lys Ser Asn 485 490 495 Lys Ile Thr Ile Thr Asn Asp Lys Gly Arg Leu Ser Lys Glu Asp Ile 500 505 510 Glu Lys Met Val Ala Glu Ala Glu Lys Phe Lys Glu Glu Asp Glu Lys 515 520 525 Glu Ser Gln Arg Ile Ala Ser Lys Asn Gln Leu Glu Ser Ile Ala Tyr 530 535 540 Ser Leu Lys Asn Thr Ile Ser Glu Ala Gly Asp Lys Leu Glu Gln Ala 545 550 555 560 Asp Lys Asp Thr Val Thr Lys Lys Ala Glu Glu Thr Ile Ser Trp Leu 565 570 575 Asp Ser Asn Thr Thr Ala Ser Lys Glu Glu Phe Asp Asp Lys Leu Lys 580 585 590 Glu Leu Gln Asp Ile Ala Asn Pro Ile Met Ser Lys Leu Tyr Gln Ala 595 600 605 Gly Gly Ala Pro Gly Gly Ala Ala Gly Gly Ala Pro Gly Gly Phe Pro 610 615 620 Gly Gly Ala Pro Pro Ala Pro Glu Ala Glu Gly Pro Thr Val Glu Glu 625 630 635 640 Val Asp <210> 6 <211> 1929 <212> DNA <213> Saccharomyces cerevisiae SSA1 DNA sequence <400> 6 atgtcaaaag ctgtcggtat tgatttaggt acaacatact cgtgtgttgc tcactttgct 60 aatgatcgtg tggacattat tgccaacgat caaggtaaca gaaccactcc atcttttgtc 120 gctttcactg acactgaaag attgattggt gatgctgcta agaatcaagc tgctatgaat 180 ccttcgaata ccgttttcga cgctaagcgt ttgatcggta gaaacttcaa cgacccagaa 240 gtgcaggctg acatgaagca cttcccattc aagttgatcg atgttgacgg taagcctcaa 300 attcaagttg aatttaaggg tgaaaccaag aactttaccc cagaacaaat ctcctccatg 360 gtcttgggta agatgaagga aactgccgaa tcttacttgg gagccaaggt caatgacgct 420 gtcgtcactg tcccagctta cttcaacgat tctcaaagac aagctaccaa ggatgctggt 480 accattgctg gtttgaatgt cttgcgtatt attaacgaac ctaccgccgc tgccattgct 540 tacggtttgg acaagaaggg taaggaagaa cacgtcttga ttttcgactt gggtggtggt 600 actttcgatg tctctttgtt gttcattgaa gacggtatct ttgaagttaa ggccaccgct 660 ggtgacaccc atttgggtgg tgaagatttt gacaacagat tggtcaacca cttcatccaa 720 gaattcaaga gaaagaacaa gaaggacttg tctaccaacc aaagagcttt gagaagatta 780 agaaccgctt gtgaaagagc caagagaact ttgtcttcct ccgctcaaac ttccgttgaa 840 attgactctt tgttcgaagg tatcgatttc tacacttcca tcaccagagc cagattcgaa 900 gaattgtgtg ctgacttgtt cagatctact ttggacccag ttgaaaaggt cttgagagat 960 gctaaattgg acaaatctca agtcgatgaa attgtcttgg tcggtggttc taccagaatt 1020 ccaaaggtcc aaaaattggt cactgactac ttcaacggta aggaaccaaa cagatctatc 1080 aacccagatg aagctgttgc ttacggtgct gctgttcaag ctgctatttt gactggtgac 1140 gaatcttcca agactcaaga tctattgttg ttggatgtcg ctccattatc cttgggtatt 1200 gaaactgctg gtggtgtcat gaccaagttg attccaagaa actctaccat ttcaacaaag 1260 aagttcgaga tcttttccac ttatgctgat aaccaaccag gtgtcttgat tcaagtcttt 1320 gaaggtgaaa gagccaagac taaggacaac aacttgttgg gtaagttcga attgagtggt 1380 attccaccag ctccaagagg tgtcccacaa attgaagtca ctttcgatgt cgactctaac 1440 ggtattttga atgtttccgc cgtcgaaaag ggtactggta agtctaacaa gatcactatt 1500 accaacgaca agggtagatt gtccaaggaa gatatcgaaa agatggttgc tgaagccgaa 1560 aaattcaagg aagaagatga aaaggaatct caaagaattg cttccaagaa ccaattggaa 1620 tccattgctt actctttgaa gaacaccatt tctgaagctg gtgacaaatt ggaacaagct 1680 gacaaggaca ccgtcaccaa gaaggctgaa gagactattt cttggttaga cagcaacacc 1740 actgccagca aggaagaatt cgatgacaag ttgaaggagt tgcaagacat tgccaaccca 1800 atcatgtcta agttgtacca agctggtggt gctccaggtg gcgctgcagg tggtgctcca 1860 ggcggtttcc caggtggtgc tcctccagct ccagaggctg aaggtccaac cgttgaagaa 1920 gttgattaa 1929 <210> 7 <211> 1089 <212> PRT <213> Saccharomyces cerevisiae PSE1 protein sequence <400> 7 Met Ser Ala Leu Pro Glu Glu Val Asn Arg Thr Leu Leu Gln Ile Val 1 5 10 15 Gln Ala Phe Ala Ser Pro Asp Asn Gln Ile Arg Ser Val Ala Glu Lys 20 25 30 Ala Leu Ser Glu Glu Trp Ile Thr Glu Asn Asn Ile Glu Tyr Leu Leu 35 40 45 Thr Phe Leu Ala Glu Gln Ala Ala Phe Ser Gln Asp Thr Thr Val Ala 50 55 60 Ala Leu Ser Ala Val Leu Phe Arg Lys Leu Ala Leu Lys Ala Pro Pro 65 70 75 80 Ser Ser Lys Leu Met Ile Met Ser Lys Asn Ile Thr His Ile Arg Lys 85 90 95 Glu Val Leu Ala Gln Ile Arg Ser Ser Leu Leu Lys Gly Phe Leu Ser 100 105 110 Glu Arg Ala Asp Ser Ile Arg His Lys Leu Ser Asp Ala Ile Ala Glu 115 120 125 Cys Val Gln Asp Asp Leu Pro Ala Trp Pro Glu Leu Leu Gln Ala Leu 130 135 140 Ile Glu Ser Leu Lys Ser Gly Asn Pro Asn Phe Arg Glu Ser Ser Phe 145 150 155 160 Arg Ile Leu Thr Thr Val Pro Tyr Leu Ile Thr Ala Val Asp Ile Asn 165 170 175 Ser Ile Leu Pro Ile Phe Gln Ser Gly Phe Thr Asp Ala Ser Asp Asn 180 185 190 Val Lys Ile Ala Ala Val Thr Ala Phe Val Gly Tyr Phe Lys Gln Leu 195 200 205 Pro Lys Ser Glu Trp Ser Lys Leu Gly Ile Leu Leu Pro Ser Leu Leu 210 215 220 Asn Ser Leu Pro Arg Phe Leu Asp Asp Gly Lys Asp Asp Ala Leu Ala 225 230 235 240 Ser Val Phe Glu Ser Leu Ile Glu Leu Val Glu Leu Ala Pro Lys Leu 245 250 255 Phe Lys Asp Met Phe Asp Gln Ile Ile Gln Phe Thr Asp Met Val Ile 260 265 270 Lys Asn Lys Asp Leu Glu Pro Pro Ala Arg Thr Thr Ala Leu Glu Leu 275 280 285 Leu Thr Val Phe Ser Glu Asn Ala Pro Gln Met Cys Lys Ser Asn Gln 290 295 300 Asn Tyr Gly Gln Thr Leu Val Met Val Thr Leu Ile Met Met Thr Glu 305 310 315 320 Val Ser Ile Asp Asp Asp Asp Ala Ala Glu Trp Ile Glu Ser Asp Asp 325 330 335 Thr Asp Asp Glu Glu Glu Val Thr Tyr Asp His Ala Arg Gln Ala Leu 340 345 350 Asp Arg Val Ala Leu Lys Leu Gly Gly Glu Tyr Leu Ala Ala Pro Leu 355 360 365 Phe Gln Tyr Leu Gln Gln Met Ile Thr Ser Thr Glu Trp Arg Glu Arg 370 375 380 Phe Ala Ala Met Met Ala Leu Ser Ser Ala Ala Glu Gly Cys Ala Asp 385 390 395 400 Val Leu Ile Gly Glu Ile Pro Lys Ile Leu Asp Met Val Ile Pro Leu 405 410 415 Ile Asn Asp Pro His Pro Arg Val Gln Tyr Gly Cys Cys Asn Val Leu 420 425 430 Gly Gln Ile Ser Thr Asp Phe Ser Pro Phe Ile Gln Arg Thr Ala His 435 440 445 Asp Arg Ile Leu Pro Ala Leu Ile Ser Lys Leu Thr Ser Glu Cys Thr 450 455 460 Ser Arg Val Gln Thr His Ala Ala Ala Ala Leu Val Asn Phe Ser Glu 465 470 475 480 Phe Ala Ser Lys Asp Ile Leu Glu Pro Tyr Leu Asp Ser Leu Leu Thr 485 490 495 Asn Leu Leu Val Leu Leu Gln Ser Asn Lys Leu Tyr Val Gln Glu Gln 500 505 510 Ala Leu Thr Thr Ile Ala Phe Ile Ala Glu Ala Ala Lys Asn Lys Phe 515 520 525 Ile Lys Tyr Tyr Asp Thr Leu Met Pro Leu Leu Leu Asn Val Leu Lys 530 535 540 Val Asn Asn Lys Asp Asn Ser Val Leu Lys Gly Lys Cys Met Glu Cys 545 550 555 560 Ala Thr Leu Ile Gly Phe Ala Val Gly Lys Glu Lys Phe His Glu His 565 570 575 Ser Gln Glu Leu Ile Ser Ile Leu Val Ala Leu Gln Asn Ser Asp Ile 580 585 590 Asp Glu Asp Asp Ala Leu Arg Ser Tyr Leu Glu Gln Ser Trp Ser Arg 595 600 605 Ile Cys Arg Ile Leu Gly Asp Asp Phe Val Pro Leu Leu Pro Ile Val 610 615 620 Ile Pro Pro Leu Leu Ile Thr Ala Lys Ala Thr Gln Asp Val Gly Leu 625 630 635 640 Ile Glu Glu Glu Glu Ala Ala Asn Phe Gln Gln Tyr Pro Asp Trp Asp 645 650 655 Val Val Gln Val Gln Gly Lys His Ile Ala Ile His Thr Ser Val Leu 660 665 670 Asp Asp Lys Val Ser Ala Met Glu Leu Leu Gln Ser Tyr Ala Thr Leu 675 680 685 Leu Arg Gly Gln Phe Ala Val Tyr Val Lys Glu Val Met Glu Glu Ile 690 695 700 Ala Leu Pro Ser Leu Asp Phe Tyr Leu His Asp Gly Val Arg Ala Ala 705 710 715 720 Gly Ala Thr Leu Ile Pro Ile Leu Leu Ser Cys Leu Leu Ala Ala Thr 725 730 735 Gly Thr Gln Asn Glu Glu Leu Val Leu Leu Trp His Lys Ala Ser Ser 740 745 750 Lys Leu Ile Gly Gly Leu Met Ser Glu Pro Met Pro Glu Ile Thr Gln 755 760 765 Val Tyr His Asn Ser Leu Val Asn Gly Ile Lys Val Met Gly Asp Asn 770 775 780 Cys Leu Ser Glu Asp Gln Leu Ala Ala Phe Thr Lys Gly Val Ser Ala 785 790 795 800 Asn Leu Thr Asp Thr Tyr Glu Arg Met Gln Asp Arg His Gly Asp Gly 805 810 815 Asp Glu Tyr Asn Glu Asn Ile Asp Glu Glu Glu Asp Phe Thr Asp Glu 820 825 830 Asp Leu Leu Asp Glu Ile Asn Lys Ser Ile Ala Ala Val Leu Lys Thr 835 840 845 Thr Asn Gly His Tyr Leu Lys Asn Leu Glu Asn Ile Trp Pro Met Ile 850 855 860 Asn Thr Phe Leu Leu Asp Asn Glu Pro Ile Leu Val Ile Phe Ala Leu 865 870 875 880 Val Val Ile Gly Asp Leu Ile Gln Tyr Gly Gly Glu Gln Thr Ala Ser 885 890 895 Met Lys Asn Ala Phe Ile Pro Lys Val Thr Glu Cys Leu Ile Ser Pro 900 905 910 Asp Ala Arg Ile Arg Gln Ala Ala Ser Tyr Ile Ile Gly Val Cys Ala 915 920 925 Gln Tyr Ala Pro Ser Thr Tyr Ala Asp Val Cys Ile Pro Thr Leu Asp 930 935 940 Thr Leu Val Gln Ile Val Asp Phe Pro Gly Ser Lys Leu Glu Glu Asn 945 950 955 960 Arg Ser Ser Thr Glu Asn Ala Ser Ala Ala Ile Ala Lys Ile Leu Tyr 965 970 975 Ala Tyr Asn Ser Asn Ile Pro Asn Val Asp Thr Tyr Thr Ala Asn Trp 980 985 990 Phe Lys Thr Leu Pro Thr Ile Thr Asp Lys Glu Ala Ala Ser Phe Asn 995 1000 1005 Tyr Gln Phe Leu Ser Gln Leu Ile Glu Asn Asn Ser Pro Ile Val Cys 1010 1015 1020 Ala Gln Ser Asn Ile Ser Ala Val Val Asp Ser Val Ile Gln Ala Leu 1025 1030 1035 1040 Asn Glu Arg Ser Leu Thr Glu Arg Glu Gly Gln Thr Val Ile Ser Ser 1045 1050 1055 Val Lys Lys Leu Leu Gly Phe Leu Pro Ser Ser Asp Ala Met Ala Ile 1060 1065 1070 Phe Asn Arg Tyr Pro Ala Asp Ile Met Glu Lys Val His Lys Trp Phe 1075 1080 1085 Ala <210> 8 <211> 3270 <212> DNA <213> Saccharomyces cerevisiae PSE1 DNA sequence <400> 8 atgtctgctt taccggaaga agttaataga acattacttc agattgtcca ggcgtttgct 60 tcccctgaca atcaaatacg ttctgtagct gagaaggctc ttagtgaaga atggattacc 120 gaaaacaata ttgagtatct tttaactttt ttggctgaac aagccgcttt ctcccaagat 180 acaacagttg cagcattatc tgctgttctg tttagaaaat tagcattaaa agctccccct 240 tcttcgaagc ttatgattat gtccaaaaat atcacacata ttaggaaaga agttcttgca 300 caaattcgtt cttcattgtt aaaagggttt ttgtcggaaa gagctgattc aattaggcac 360 aaactatctg atgctattgc tgagtgtgtt caagacgact taccagcatg gccagaatta 420 ctacaagctt taatagagtc tttaaaaagc ggtaacccaa attttagaga atccagtttt 480 agaattttga cgactgtacc ttatttaatt accgctgttg acatcaacag tatcttacca 540 atttttcaat caggctttac tgatgcaagt gataatgtca aaattgctgc agttacggct 600 ttcgtgggtt attttaagca actaccaaaa tctgagtggt ccaagttagg tattttatta 660 ccaagtcttt tgaatagttt accaagattt ttagatgatg gtaaggacga tgcccttgca 720 tcagtttttg aatcgttaat tgagttggtg gaattggcac caaaactatt caaggatatg 780 tttgaccaaa taatacaatt cactgatatg gttataaaaa ataaggattt agaacctcca 840 gcaagaacca cagcactcga actgctaacc gttttcagcg agaacgctcc ccaaatgtgt 900 aaatcgaacc agaattacgg gcaaacttta gtgatggtta ctttaatcat gatgacggag 960 gtatccatag atgatgatga tgcagcagaa tggatagaat ctgacgatac cgatgatgaa 1020 gaggaagtta catatgacca cgctcgtcaa gctcttgatc gtgttgcttt aaagctgggt 1080 ggtgaatatt tggctgcacc attgttccaa tatttacagc aaatgatcac atcaaccgaa 1140 tggagagaaa gattcgcggc catgatggca ctttcctctg cagctgaggg ttgtgctgat 1200 gttctgatcg gcgagatccc aaaaatcctg gatatggtaa ttcccctcat caacgatcct 1260 catccaagag tacagtatgg atgttgtaat gttttgggtc aaatatctac tgatttttca 1320 ccattcattc aaagaactgc acacgataga attttgccgg ctttaatatc taaactaacg 1380 tcagaatgca cctcaagagt tcaaacgcac gccgcagcgg ctctggttaa cttttctgaa 1440 ttcgcttcga aggatattct tgagccttac ttggatagtc tattgacaaa tttattagtt 1500 ttattacaaa gcaacaaact ttacgtacag gaacaggccc taacaaccat tgcatttatt 1560 gctgaagctg caaagaataa atttatcaag tattacgata ctctaatgcc attattatta 1620 aatgttttga aggttaacaa taaagataat agtgttttga aaggtaaatg tatggaatgt 1680 gcaactctga ttggttttgc cgttggtaag gaaaaatttc atgagcactc tcaagagctg 1740 atttctatat tggtcgcttt acaaaactca gatatcgatg aagatgatgc gctcagatca 1800 tacttagaac aaagttggag caggatttgc cgaattctgg gtgatgattt tgttccgttg 1860 ttaccgattg ttataccacc cctgctaatt actgccaaag caacgcaaga cgtcggttta 1920 attgaagaag aagaagcagc aaatttccaa caatatccag attgggatgt tgttcaagtt 1980 cagggaaaac acattgctat tcacacatcc gtccttgacg ataaagtatc agcaatggag 2040 ctattacaaa gctatgcgac acttttaaga ggccaatttg ctgtatatgt taaagaagta 2100 atggaagaaa tagctctacc atcgcttgac ttttacctac atgacggtgt tcgtgctgca 2160 ggagcaactt taattcctat tctattatct tgtttacttg cagccaccgg tactcaaaac 2220 gaggaattgg tattgttgtg gcataaagct tcgtctaaac taatcggagg cttaatgtca 2280 gaaccaatgc cagaaatcac gcaagtttat cacaactcgt tagtgaatgg tattaaagtc 2340 atgggtgaca attgcttaag cgaagaccaa ttagcggcat ttactaaggg tgtctccgcc 2400 aacttaactg acacttacga aaggatgcag gatcgccatg gtgatggtga tgaatataat 2460 gaaaatattg atgaagagga agactttact gacgaagatc ttctcgatga aatcaacaag 2520 tctatcgcgg ccgttttgaa aaccacaaat ggtcattatc taaagaattt ggagaatata 2580 tggcctatga taaacacatt ccttttagat aatgaaccaa ttttagtcat ttttgcatta 2640 gtagtgattg gtgacttgat tcaatatggt ggcgaacaaa ctgctagcat gaagaacgca 2700 tttattccaa aggttaccga gtgcttgatt tctcctgacg ctcgtattcg ccaagctgct 2760 tcttatataa tcggtgtttg tgcccaatac gctccatcta catatgctga cgtttgcata 2820 ccgactttag atacacttgt tcagattgtc gattttccag gctccaaact ggaagaaaat 2880 cgttcttcaa cagagaatgc cagtgcagcc atcgccaaaa ttctttatgc atacaattcc 2940 aacattccta acgtagacac gtacacggct aattggttca aaacgttacc aacaataact 3000 gacaaagaag ctgcctcatt caactatcaa tttttgagtc aattgattga aaataattcg 3060 ccaattgtgt gtgctcaatc taatatctcc gctgtagttg attcagtcat acaagccttg 3120 aatgagagaa gtttgaccga aagggaaggc caaacggtga taagttcagt taaaaagttg 3180 ttgggatttt tgccttctag tgatgctatg gcaattttca atagatatcc agctgatatt 3240 atggagaaag tacataaatg gtttgcataa 3270 <210> 9 <211> 216 <212> PRT <213> Saccharomyces cerevisiae ORM2 protein sequence <400> 9 Met Ile Asp Arg Thr Lys Asn Glu Ser Pro Ala Phe Glu Glu Ser Pro 1 5 10 15 Leu Thr Pro Asn Val Ser Asn Leu Lys Pro Phe Pro Ser Gln Ser Asn 20 25 30 Lys Ile Ser Thr Pro Val Thr Asp His Arg Arg Arg Arg Ser Ser Ser 35 40 45 Val Ile Ser His Val Glu Gln Glu Thr Phe Glu Asp Glu Asn Asp Gln 50 55 60 Gln Met Leu Pro Asn Met Asn Ala Thr Trp Val Asp Gln Arg Gly Ala 65 70 75 80 Trp Leu Ile His Ile Val Val Ile Val Leu Leu Arg Leu Phe Tyr Ser 85 90 95 Leu Phe Gly Ser Thr Pro Lys Trp Thr Trp Thr Leu Thr Asn Met Thr 100 105 110 Tyr Ile Ile Gly Phe Tyr Ile Met Phe His Leu Val Lys Gly Thr Pro 115 120 125 Phe Asp Phe Asn Gly Gly Ala Tyr Asp Asn Leu Thr Met Trp Glu Gln 130 135 140 Ile Asn Asp Glu Thr Leu Tyr Thr Pro Thr Arg Lys Phe Leu Leu Ile 145 150 155 160 Val Pro Ile Val Leu Phe Leu Ile Ser Asn Gln Tyr Tyr Arg Asn Asp 165 170 175 Met Thr Leu Phe Leu Ser Asn Leu Ala Val Thr Val Leu Ile Gly Val 180 185 190 Val Pro Lys Leu Gly Ile Thr His Arg Leu Arg Ile Ser Ile Pro Gly 195 200 205 Ile Thr Gly Arg Ala Gln Ile Ser 210 215 <210> 10 <211> 651 <212> DNA <213> Saccharomyces cerevisiae ORM2 DNA sequence <400> 10 atgattgacc gcactaaaaa cgaatctcca gcttttgaag agtctccgct tacccccaat 60 gtgtctaacc tgaaaccatt cccttctcaa agcaacaaaa tatccactcc agtgaccgac 120 cataggagaa gacggtcatc cagcgtaata tcacatgtgg aacaggaaac cttcgaagac 180 gaaaatgacc agcagatgct tcccaacatg aacgctacgt gggtcgacca gcgaggcgcg 240 tggttgattc atatcgtcgt aatagtactc ttgaggctct tctactcctt gttcgggtcg 300 acgcccaaat ggacgtggac tttaacaaac atgacctaca tcatcggatt ctatatcatg 360 ttccaccttg tcaaaggtac gcccttcgac tttaacggtg gtgcgtacga caacctgacc 420 atgtgggagc agattaacga tgagactttg tacacaccca ctagaaaatt tctgctgatt 480 gtacccattg tgttgttcct gattagcaac cagtactacc gcaacgacat gacactattc 540 ctctccaacc tcgccgtgac ggtgcttatt ggtgtcgttc ctaagctggg aattacgcat 600 agactaagaa tatccatccc tggtattacg ggccgtgctc aaattagtta g 651 <210> 11 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> CF86 oligonucleotide <400> 11 ggagtggtac gtattaatta aggccggcca ggcccgggta cgtaccaatt ga 52 <210> 12 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> CF87 oligonucleotide <400> 12 caattggtac gtacccgggc ctggccggcc ttaattaata cgtaccactc ct 52 <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> CF88 primer <400> 13 atcacgtaat acttctaggg 20 <210> 14 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> CF98 primer <400> 14 agagtgagtt ggaaggaagg 20 <210> 15 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> CF99 primer <400> 15 agctcgtaag cgtcgttacc 20 <210> 16 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> CF90 primer <400> 16 ctagtttctc ggtactatgc 20 <210> 17 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> CF91 primer <400> 17 gagttgacta atgttgtggg 20 <210> 18 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> CF100 primer <400> 18 aaagctttga agaaaaatgc 20 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> CF101 primer <400> 19 gcaaggggta ggatcgatcc 20 <210> 20 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> CF123 primer <400> 20 attcgagctc ggtacctacg tact 24 <210> 21 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> CF126 primer <400> 21 cccgggcacg tgggatcctc taga 24 <210> 22 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> M13 Forward primer <400> 22 gtaaaacgac ggccagt 17 <210> 23 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> M13 Reverse primer <400> 23 aacagctatg accatg 16 <210> 24 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> CF129 primer <400> 24 gtgtttatgc ttaaatgcg 19 <210> 25 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> CF130 primer <400> 25 tcctcttgca tttgtgtctc 20 <210> 26 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> CF131 primer <400> 26 atcttcctat tattatagc 19 <210> 27 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> CF104 oligonucleotide <400> 27 gtattaatta aggccggcca ggcccgggta c 31 <210> 28 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> CF105 oligonucleotide <400> 28 gtacccgggc ctggccggcc ttaattaata c 31 <210> 29 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> CF120 oligonucleotide <400> 29 gtaataatac gtattaatta aggccggcca ggcccgggta cgtaa 45 <210> 30 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> CF121 oligonucleotide <400> 30 tacgtacccg ggcctggccg gccttaatta atacgtatta ttact 45 <210> 31 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> CF108 oligonucleotide <400> 31 ataataatac gtattaatta aggccggcca ggcccgggta cgta 44 <210> 32 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> CF109 oligonucleotide <400> 32 tacgtacccg ggcctggccg gccttaatta atacgtatta ttat 44 <210> 33 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Fragment of REP2 coding sequence - Forward <400> 33 accatcactg agggccctaa agcg 24 <210> 34 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Fragment of REP2 coding sequence - Reverse <400> 34 tagggccctc agtgatggt 19 <210> 35 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> CF116 oligonucleotide <400> 35 cttaataata cgtattaatt aaggccggcc aggcccgggt acgtagggcc 50 <210> 36 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> CF117 oligonucleotide <400> 36 ctacgtaccc gggcctggcc ggccttaatt aatacgtatt attaagggcc 50 <210> 37 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> CF106 oligonucleotide <400> 37 taataatacg tattaattaa ggccggccag gcccgggtac gta 43 <210> 38 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> CF107 oligonucleotide <400> 38 tacgtacccg ggcctggccg gccttaatta atacgtatta tta 43 <210> 39 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> CF118 oligonucleotide <400> 39 gatcactaat aatacgtatt aattaaggcc ggccaggccc gggtacgta 49 <210> 40 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> CF119 oligonucleotide <400> 40 gatctacgta cccgggcctg gccggcctta attaatacgt attattagt 49 <210> 41 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> CF114 oligonucleotide <400> 41 agtactataa tacgtattaa ttaaggccgg ccaggcccgg gtacgta 47 <210> 42 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> CF115 oligonucleotide <400> 42 gtacttacgt acccgggcct ggccggcctt aattaatacg tattata 47 <210> 43 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> CF127 oligonucleotide <400> 43 cgtaatactt ctagggtatg atacgtatcc aatatcaaag gaaatgatag c 51 <210> 44 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> CF128 oligonucleotide <400> 44 gcattatgaa gatcccatac tatgcatagg ttatagtttc ctttactatc g 51 <210> 45 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> DS299 primer <400> 45 cgtagcggcc gcctgaaagg ggttgaccgt ccgtcggc 38 <210> 46 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> DS300 primer <400> 46 cgtaaagctt cgccgcccga cagggtaaca tattatcac 39 <210> 47 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> DS301 primer <400> 47 cgtaaagctt gaccacgtag taataataag tgcatggc 38 <210> 48 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> DS302 primer <400> 48 cgtactgcag attggatagt gattagagtg tatagtcccg g 41 <210> 49 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> DS303 primer <400> 49 ggagcgacaa acctttcg 18 <210> 50 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> DS304 primer <400> 50 accgtaataa aagatggctg 20 <210> 51 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> DS305 primer <400> 51 catcttgtgt gtgagtatgg tcgg 24 <210> 52 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> DS306 primer <400> 52 cccaggataa ttttcagg 18 <210> 53 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> DS230 primer <400> 53 tagcgaattc aatcagtaaa aatcaacgg 29 <210> 54 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> DS231 primer <400> 54 gtcaaagctt caaaaaaaga aaagctccgg 30 <210> 55 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> DS232 primer <400> 55 tagcggatcc gaattcggcg gttgtttgca agaccgag 38 <210> 56 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> DS233 primer <400> 56 gtcaaagctt taaagataat gctaaatcat ttgg 34 <210> 57 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> DS234 primer <400> 57 tgacaagctt tcggtcgaaa aaagaaaagg agagg 35 <210> 58 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> DS235 primer <400> 58 tgacaagctt gatcttttat gcttgctttt c 31 <210> 59 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> DS236 primer <400> 59 aatagttcag gcactccg 18 <210> 60 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> DS237 primer <400> 60 tggaaggcaa gagagcc 17 <210> 61 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> DS238 primer <400> 61 taaaatgtaa gctctcgg 18 <210> 62 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> DS239 primer <400> 62 ccaaccaagt atttcgg 17 <210> 63 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> CED005 primer <400> 63 gagctgacag ggaaatggtc 20 <210> 64 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> CED006 primer <400> 64 tacgaggata cggagagagg 20 <210> 65 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> DS248 primer <400> 65 gtcagaattc gagctctacg tattaattaa ggccggccag gcccgggcta gtctcttttt 60 ccaatttgcc accgtgtagc attttgttgt 90 <210> 66 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> DS249 primer <400> 66 gtcaggatcc tacgtacccg gggatatcat tatcatcttt gtcgtggtca tcttgtgtg 59 <210> 67 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> gtcaggatcc tacgtacccg ggtaaggcgt tcgtgcagtg tgacgaatat agcg <400> 67 gtcaggatcc tacgtacccg ggtaaggcgt tcgtgcagtg tgacgaatat agcg 54 <210> 68 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> DS251 primer <400> 68 gtcagaattc gagctctacg tattaattaa ggccggccag gcccgggccc gtatggacat 60 acatatatat atatatatat atatatattt tgttacgcg 99 <210> 69 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> DS252 primer <400> 69 gtcagaattc gagctctacg tattaattaa ggccggccag gcccgggctt gttgcaagca 60 gcatgtctaa ttggtaattt taaagctgcc 90 <210> 70 <211> 103 <212> DNA <213> Artificial Sequence <220> <223> DS267 primer <400> 70 gtcagaattc gagctctacg tattaattaa ggccggccag gcccgggccc gtatggacat 60 acatatatat atatatatat atatatatat attttgttac gcg 103 <210> 71 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> DS253 primer <400> 71 cctccctgct gctcgcc 17 <210> 72 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> DS254 primer <400> 72 ctgtaagaac atggctcc 18 <210> 73 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> DS255 primer <400> 73 ctcgatcgat tacgaggg 18 <210> 74 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> DS256 primer <400> 74 aagaaagccg atatcgc 17 <210> 75 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> DS257 primer <400> 75 caactctctg aagaggcg 18 <210> 76 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> DS258 primer <400> 76 caacgccaca tccgacg 17 <210> 77 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> DS259 primer <400> 77 gtaattctga tcactttgg 19 <210> 78 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> DS260 primer <400> 78 gcacttatta ttactacgtg g 21 <210> 79 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> DS261 primer <400> 79 gttttccttg atgaagtcg 19 <210> 80 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> DS262 primer <400> 80 gtgaccacac catggggc 18 <210> 81 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> DS263 primer <400> 81 gttgccggcg tgtctgcc 18 <210> 82 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> DS264 primer <400> 82 ttgaaatcat cgtctgcg 18 <210> 83 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> DS265 primer <400> 83 cggcagttct aggtccc 17 <210> 84 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> DS266 primer <400> 84 ccacagcctc ttgttggg 18 <210> 85 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> M13/pUC primer (-40) <400> 85 gttttcccag tcacgac 17

Claims

REP2 유전자 또는 FLP 유전자중 적어도 하나의 마지막 작용 코돈이후의 첫번째 염기와 상기 유전자에 인접한 역위 반복내의 FRT 사이트이전의 마지막 염기사이에 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 포함하는 2㎛-패밀리 플라스미드.
제 1항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 FLP 유전자 및/또는 REP2 유전자는 각각 자연 발생 2㎛-패밀리 플라스미드로부터 유래된 FLP 유전자 및/또는 REP2 유전자를 갖는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 1항에 있어서, 상기 자연 발생 2㎛-패밀리 플라스미드는 지고사카로미세스 로욱시(Zygosaccharomyces rouxii))로부터 얻어지는 pSR1, pSB3 또는 pSB4, 지고사카로미세스 베일리(Zygosaccharomyces bailii)로부터 모두 얻어지는 pSB1 또는 pSB2, 지고사카로미세스 퍼멘타티(Zygosaccharomyces fermentati)로부터 얻어지는 pSM1, 클루이베로미세스 드로스필라럼(Kluyveromyces drosphilarum)으로부터 얻어지는 pKD1, 피치아 멤브라나에파시엔스(Pichia membranaefaciens)로부터 얻어지는 pPM1 및 사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터 얻어지는 2㎛ 플라스미드로부터 선택되는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 2항 또는 제 3항에 있어서, 상기 FLP 및/또는 REP2 유전자에 인접한 역위 반복의 서열은 상기 유전자가 유래되는 서열과 동일한 자연 발생 2㎛-패밀리 플라스미드내의 이에 상응하는 역위 반복의 서열로부터 유래되는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 2항 내지 제 4항 중 어느 한 항에 있어서, 상기 자연 발생 2㎛-패밀리 플라스미드는 사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터 얻어지는 2㎛ 플라스미드인 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 5항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 REP2 유전자의 코돈 59의 첫번째 염기와 인접 역위 반복내 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 5항 또는 제 6항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 REP2 유전자 및 인접 역위 반복의 서열은 SEQ ID NO:1 또는 이의 변이체로 정의되는 것임을 특징으로 하는 2㎛-패밀리 플라스미드.
제 1항 내지 제 7항 중 어느 한 항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 역위 반복의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 1항 내지 제 7항 중 어느 한 항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 REP2 암호 서열의 마직막이후의 첫번째 염기에서와 같이 REP2 암호 서열의 마지막이후의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 1항 내지 제 7항 중 어느 한 항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, REP2 암호 서열이 후속하는 역위 반복는 사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터 얻어지는 2㎛ 플라스미드의 이에 상응하는 리전으로부터 유래되는 서열을 가지며 그리고 바람직하게 상기 폴리 뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 역위 반복내 XcmI 사이트 또는 FspI 사이트에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 5항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 FLP 유전자의 코돈 344의 첫번째 염기와 인접 역위 반복내 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 5항 또는 제 11항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, 상기 FLP 암호 서열 및 인접 역위 반복의 서열은 SEQ ID NO:2 또는 이의 변이체로 정의되는 것임을 특징으로 하는 2㎛-패밀리 플라스미드.
제 11항 또는 제 12항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 역위 반복의 첫번째 염기와 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 13항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환 은 FLP 암호 서열의 마지막이후 첫번째 염기와 FRT 사이트이전의 마지막 염기사이의 포지션에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 14항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 FLP 암호 서열의 마지막이후 첫번째 염기에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 11항 내지 제 15항 중 어느 한 항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환이외에, FLP 유전자가 후속하는 역위 반복는 사카로미세스 세레비지아에(Saccharomyces cerevisiae)로부터 얻어지는 2㎛ 플라스미드의 이에 상응하는 리전으로부터 유래되는 서열을 가지며 그리고 바람직하게 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 역위 반복내 HgaI 사이트 또는 FspI 사이트에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 11항 내지 제 16항 중 어느 한 항에 있어서, REP2 유전자 및 FLP 유전자 모두의 마지막 작용 코돈이후 첫번째 염기와 상기 유전자 각각에 인접한 역위 반복내 FRT 사이트이전 마지막 염기사이에 폴리뉴클레오타이드 서열 삽입, 결실 및/또 는 치환을 포함하며, 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 동일하거나 다를 수 있는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 11항 내지 제 17항 중 어느 한 항에 있어서, 제 11항 내지 제 17항 중 어느 한 항에 정의된 바와 같은 포지션이 아닌 포지션에서 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환을 더욱 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 18항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 ARS 서열주변의 비전사 리전내에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 1항 내지 제 19항 중 어느 한 항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환 또는 적어도 하나의 폴리뉴클레오타이드 서열 삽입, 결실 및/또는 치환은 폴리뉴클레오타이드 서열 삽입인 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 20항에 있어서, 상기 폴리뉴클레오타이드 서열 삽입은 오픈 리딩 프래임을 암호하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 21항에 있어서, 상기 오픈 리딩 프래임은 비-2㎛-패밀리 플라스미드 단백질을 암호하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 22항에 있어서, 상기 비-2㎛-패밀리 플라스미드 단백질은 단백질 폴딩에 관련되는 단백질, 또는 샤프롱 활성을 갖거나 폴딩되지 않은 단백질 반응에 관련되는 단백질, 알부민, 모노클로날 항체, 에토포시드, 혈청 단백질(혈 응고 인자와 같은), 안티스타신, 진드기 항응고 펩타이드, 트랜스페린, 락토페린, 엔도스타틴, 안지로스타틴, 콜라겐, 면역글로블린 또는 면역글로블린-기초 분자 또는 이의 프레그먼트(예, dAb, Fab'프래그먼트, F(ab')2, scAb, scFv 또는 scFv 프레그먼트), Kunitz 도메인 단백질, 인터페론, 인터루킨, IL10, IL11, IL2, 인터페론 α 종 및 아종, 인터페론 β 종 및 아종, 인터페론 γ 종 및 아종, 렙틴, CNTF, CNTF_AX15, IL1-수용체 안타고니스트, 에리트로포에틴(EPO) 및 EPO 모사물, 트롬보포에틴(TPO) 및 TPO 모사물, 프로샙타이드, 시아노비린-N, 5-헬릭스, T20 펩타이드, T1249 펩타 이드, HIV gp41, HIV gp120, 유로키나아제, 프로유로키나아제, tPA, 히루딘, 혈소판 유래 성장 인자, 파라티로이드 호르몬, 프로인슐린, 인슐린, 글루카곤, 글루카곤-유사 펩타이드, 인슐린-유사 성장 인자, 칼시토닌, 성장 호르몬, 형질변형 성장 인자 β, 종양 괴사 인자, G-CSF, GM-CSF, M-CSF, FGF, 프리 폼 및 활성 폼 모두를 포함하며 이에 한정하는 것은 아니나 플라스미노겐, 피브리노겐, 트롬빈, 프리-트롬빈, 프로-트롬빈, 폰 빌레브란트 인자, α₁-안티트립신, 플라스미노겐 활성제, 팩터 VII, 팩터 VIII, 팩터 IX, 팩터 X 및 팩터 XIII를 포함하는 응집 인자, 신경 성장 인자, LACI, 혈소판-유래 내피세포 성장 인자(PD-ECGF), 글루코즈 옥시다아제, 혈청 콜린에스테라아제, 아프로티닌, 아밀로이드 전구체 단백질, 인터-알파 트립신 억제제, 안티트롬빈 III, 아포-리포프로틴 종, 프로틴 C, 프로틴 S의 서열, 또는 상기 어느 것의 변이체나 프레그먼트를 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 23항에 있어서, 상기 비-2㎛-패밀리 플라스미드 단백질은 알부민의 서열, 이의 변이체나 프레그먼트, 또는 어느 이러한 서열을 포함하는 융합 단백질을 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 23항에 있어서, 상기 비-2㎛-패밀리 플라스미드 단백질은 트랜스페린의 서열, 이의 변이체나 프레그먼트, 또는 어느 이러한 서열을 포함하는 융합 단백질을 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 23항에 있어서, 상기 비-2㎛-패밀리 플라스미드 단백질은 락토페린의 서열, 이의 변이체나 프레그먼트, 또는 어느 이러한 서열을 포함하는 융합 단백질을 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 23항에 있어서, 상기 비-2㎛-패밀리 플라스미드 단백질은 Fc의 서열, 이의 변이체나 프레그먼트, 또는 어느 이러한 서열을 포함하는 융합 단백질을 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 23항에 있어서, 상기 비-2㎛-패밀리 플라스미드 단백질은 AHA1 , CCT2 , CCT3, CCT4 , CCT5 , CCT6 , CCT7 , CCT8 , CNS1 , CPR3 , CPR6 , ER01 , EUG1 , HCH1 , HSP10, HSP12 , HSP104 , HSP26 , HSP30 , HSP42 , HSP60 , HSP78 , HSP82 , JEM1 , MDJ1 , MDJ2, MPD1 , MPD2 , PD11 , PFD1 , ABC1 , APJ1 , ATP11 , ATP12 , BTT1 , CDC37 , CNS1 , CPR6, CPR7 , HSC82 , KAR2 , LHS1 , MGE1 , MRS11 , NOB1 , ECM10 , SSA1 , SSA2 , SSA3 , SSA4, SSC1 , SSE2 , SIL1 , SLS1 , ORM1 , UBI4 , ORM2 , PER1 , PTC2 , PSE1 및 HAC1 또는 절단된 무인트론 HAC1 중 어느 하나에 의해 암호화되는, 단백질 폴딩에 관련되는 단백질, 또는 샤프롱 활성을 갖거나 폴딩되지 않은 단백질 반응에 관련되는 단백질의 서열을 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 23항 또는 제 28항에 있어서, 상기 샤프롱은 단백질 디설피드 이소머라아제(PDI)이거나, 또는 ORM2, SSA1 또는 PSE1에 의해 암호화된 단백질인 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 22항 내지 제 29항 중 어느 한 항에 있어서, 상기 비-2㎛-패밀리 플라스미드 단백질은 분미 리더 서열을 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 22항에 있어서, 상기 비-2㎛-패밀리 플라스미드 단백질은 박테리아 선별 마커 및/또는 이스트 선별 마커의 서열을 포함하는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 31항에 있어서, 상기 박테리아 선별 마커는 β-락타마아제 유전자이며 그리고/또는 상기 이스트 선별 마커는 LEU2 선별 마커인 것을 특징으로 하는 2㎛-패밀리 플라스미드.
제 1항 내지 제 32항 중 어느 한 항에 있어서, 플라스미드는 (i) 비-2㎛-패밀리 플라스미드 단백질을 암호하는 이종성 서열; (ii) 단백질 폴딩에 관련되는 단백질, 샤프롱 또는 폴딩되지 않은 단백질 반응에 관련되는 단백질, 바람직하게 단백질 디설피드 이소머라아제의 서열을 포함하는 단백질을 암호하는 이종성 서열; 및 (iii) 선별 마커의 서열을 포함하는 단백질을 암호하는 이종성 서열을 포함하며, 상기 이종성 서열의 적어도 하나는 제 1항 내지 제 16항 중 어느 한 항에 의해 정의된 포지션에서 일어나는 것을 특징으로 하는 2㎛-패밀리 플라스미드.
(a) REP2 유전자 및 상기 REP2 유전자에 후속하는 역위 반복, 또는 FLP 유전자 및 상기 FLP 유전자에 후속하는 역위 반복의 서열을 포함하며, 각각의 경우에 역위 반복는 FRT 사이트를 포함하는 플라스미드를 제공하는 단계;

(b) 폴리뉴클레오타이드 서열을 제공하고 상기 폴리뉴클레오타이드 서열을 상기 플라스미드내로 제 1항 내지 제 16항 중 어느 한 항에 정의된 포지션에 삽입 하는 단계; 그리고/또는

(c) 제 1항 내지 제 16항 중 어느 한 항에 정의된 포지션에서 상기 뉴클레오타이드 염기의 일부 또는 모두를 제거하는 단계; 그리고/또는

(d) 제 1항 내지 제 16항 중 어느 한 항에 정의된 포지션에서 상기 뉴클레오타이드 염기의 일부 또는 모두를 택일적인 뉴클레오타이드 염기로 치환하는 단계

를 포함하는 제 1항 내지 제 33항 중 어느 한 항에 의해 정의된 플라스미드 제조 방법.
제 34항의 방법에 의해 획득가능한 플라스미드.
제 33항 및 제 35항 중 어느 한 항에 의해 정의된 플라스미드를 포함하는 숙주 세포.
제 36항에 있어서, 상기 숙주 세포는 이스트 세포인 것을 특징으로 하는 숙주 세포.
제 36항 또는 제 37항에 있어서, 상기 플라스미드는 다중복제 플라스미드로서 안정한 것을 특징으로 하는 숙주 세포.
제 38항에 있어서, 상기 플라스미드는 pSR1, pSB3 또는 pSB4에 기초하고 상기 이스트 세포는 지고사카로미세스 로욱시(Zygosaccharomyces rouxii))이거나, 상기 플라스미드는 pSB1 또는 pSB2에 기초하고 상기 이스트 세포는 지고사카로미세스 베일리(Zygosaccharomyces bailii)이거나, 상기 플라스미드는 pSM1에 기초하고 상기 이스트 세포는 지고사카로미세스 퍼멘타티(Zygosaccharomyces fermentati)이거나, 상기 플라스미드는 pKD1에 기초하고 상기 이스트 세포는 클루이베로미세스 드로스필라럼(Kluyveromyces drosphilarum)이거나, 상기 플라스미드는 pPM1에 기초하고 상기 이스트 세포는 피치아 멤브라나에파시엔스(Pichia membranaefaciens)이거나 또는 상기 플라스미드는 2㎛ 플라스미드에 기초하고 상기 이스트 세포는 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 또는 사카로미세스 칼스버제네시스(Saccharomyces. carlsbergenesis)인 것을 특징으로 하는 숙주 세포.
제 38항 또는 제 39항에 있어서, 상기 플라스미드가 선별 마커를 함유하거나 함유하도록 변형되는 경우, 안정성은 상기 마커의 소실에 의한 측정으로 적어도 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.9% 또는 5세대후 실질적으로 100%인 것을 특징으로 하는 숙주 세포.
(a) 제 1항 내지 제 33항 또는 제 35항 중 어느 한 항에 의해 정의된 플라스미드를 제공하는 단계;

(b) 적절한 숙주 세포를 제공하는 단계;

(c) 상기 숙주 세포를 상기 플라스미드로 형질변형시키는 단계; 및

(d) 상기 형질변형된 숙주 세포를 배양 배지에서 배양하는 단계;

(e) 이에 따라 단백질을 생성하는 단계

를 포함하는 단백질 생성 방법.
제 1항 내지 제 33항 또는 제 35항 중 어느 한 항에 의해 정의된 플라스미드를 포함하는, 제 36항 내지 제 40항 중 어느 한 항에 의해 정의된 숙주 세포를 제공하는 단계 및 상기 숙주 세포를 배양 배지에서 배양하여 단백질을 생성하는 단계를 포함하는 단백질 생성 방법.
제 41항 또는 제 42항에 있어서, 배양된 숙주 세포 또는 배양 배지로부터 이 에 따라 생성된 단백질을 분리하는 단계를 더욱 포함하는 것을 특징으로 하는 방법.
제 43항에 있어서, 분리된 단백질을 상업적으로 허용가능한 수준의 순도로 정제하는 단계를 더욱 포함하는 것을 특징으로 하는 방법.
제 44항에 있어서, 정제된 단백질을 담체 또는 희석제와 배합하는 단계 및 임의로 이에 따라 배합된 단백질을 단위 형태로 제공하는 단계를 더욱 포함하는 것을 특징으로 하는 방법.
제 43항에 있어서, 분리된 단백질을 약학적으로 허용가능한 수준의 순도로 정제하는 단계를 더욱 포함하는 것을 특징으로 하는 방법.
제 44항에 있어서, 정제된 단백질을 약학적으로 허용가능한 담체 또는 희석제와 배합하는 단계 및 임의로 이에 따라 배합된 단백질을 단위 형태로 제공하는 단계를 더욱 포함하는 것을 특징으로 하는 방법.
단독 이스트 선별 마커로서, 필수 단백질을 암호하는 유전자 또는 유전자들이 숙주세포에서 제거 혹은 불활성화되는 경우 상기 숙주 세포는 배양시 생존불가능하고 그 결핍은 성장 배지에 첨가나 변형에 의해 보완될 수 없는 점에서 숙수 이스트 세포의 생존능에 필수적인 단백질을 암호하는 유전자를 포함하는 플라스미드.
제 48항에 있어서, 상기 필수적인 단백질을 암호하는 유전자는 플라스미드에 의해 암호화된 단독 선별 마커인 것을 특징으로 하는 플라스미드.
제 48항 또는 제 49항에 있어서, 상기 필수적인 단백질은 샤프롱(chaperone)인 것을 특징으로 하는 플라스미드.
제 51항에 있어서, 상기 샤프롱은 단백질 디설피드 이소머라아제 또는 Pse1p인 것을 특징으로 하는 플라스미드.
제 48항 내지 제 51항 중 어느 한 항에 있어서, 제 23항 내지 제 27항 중 어느 한 항에 의해 정의된 단백질과 같은 비-2㎛-패밀리 플라스미드 단백질을 암호하는 유전자를 더욱 포함하는 것을 특징으로 하는 플라스미드.
제 48항 내지 제 52항 중 어느 한 항에 있어서, 상기 플라스미드는 2㎛-패밀리 플라스미드인 것을 특징으로 하는 플라스미드.
제 53항에 있어서, 상기 플라스미드는 제 1항 내지 제 33항 중 어느 한 항에 의해 정의된 플라스미드인 것을 특징으로 하는 플라스미드.
숙주 세포의 생존능에 필수적인 단백질을 암호하는 유전자를 포함하는 플라스미드를 포함하며, 상기 플라스미드의 부재하에서, 상기 숙주 세포는 상기 필수적인 단백질을 생성할 수 없고 성장 배지에 첨가나 변형에 의해 생존가능하도록 될 수 없는 숙주 세포.
제 55항에 있어서, 상기 플라스미드는 제 1항 내지 제 33항 또는 제 48항 내 지 제 54항 중 어느 한 항에 따른 플라스미드인 것을 특징으로 하는 숙주 세포.
제 55항 또는 제 56항에 있어서, 상기 플라스미드의 부재하에서 상기 숙주 세포는 생존가능한 것을 특징으로 하는 숙주 세포.
제 55항 내지 제 57항 중 어느 한 항에 있어서, 상기 숙주 세포는 제 23항 내지 제 27항 중 어느 한 항에 의해 정의된 단백질과 같은 원하는 단백질을 암호하는 재조합 유전자를 더욱 포함하는 것을 특징으로 하는 숙주 세포.
제 58항에 있어서, 상기 원하는 단백질은 제 23항 내지 제 27항 중 어느 한 항에 의해 정의된 비-2㎛-패밀리 플라스미드인 것을 특징으로 하는 숙주 세포.
제 59항에 있어서, 상기 필수적인 단백질은 단백질 디설피드 이소머라아제 또는 PSE1과 같은 샤프롱인 것을 특징으로 하는 숙주 세포.
제 59항 또는 제 60항에 있어서, 상기 재조합 유전자는 상기 필수적인 단백질을 암호하는 유전자와 동일한 플라스미드상에 위치하는 것을 특징으로 하는 숙주 세포.
제 59항 내지 제61항 중 어느 한 항에 의해 정의된 숙주 세포를 제공하는 단계;

필수 단백질 및 원하는(desired) 단백질의 발현이 이루어지는 조건하에 배양 배지에서 상기 숙주 세포를 배양하는 단계; 및

임의로 배양된 숙주 세포 또는 배양 배지로부터 이에 따라 발현된 원하는 단백질을 분리하는 단계; 및

임의로 이에 따라 분리된 원하는 단백질을 상업적으로 허용가능한 수준의 순도로 정제하는 단계; 및

추가적인 임의로 이에 따라 정제된 단백질을 동결건조하거나 정제된 원하는 단백질을 담체 또는 희석제(약학적으로 허용가능한 담체 또는 희석제)와 배합하는 단계; 및

임의로 이에 따라 배합된 원하는 단백질을 단위 형태로 제공하는 단계

를 포함하는 원하는 재조합 단백질을 생성하는 방법.
제 62항에 있어서, 상기 숙주 세포를 배양하는 단계는 복합 배지 또는 완전 배지와 같은 비-선별 배지에서 상기 숙주 세포를 배양하는 것을 포함하는 것을 특징으로 하는 방법.