KR101246040B1

KR101246040B1 - Ｆｉｖｓｉ 모티프를 포함하는 신호서열을 갖는폴리펩타이드 및 이를 암호하는 폴리뉴클레오타이드

Info

Publication number: KR101246040B1
Application number: KR1020057001329A
Authority: KR
Inventors: 슬립다렐
Original assignee: 노보자임스 바이오파마 디케이 에이/에스
Priority date: 2002-07-23
Filing date: 2003-07-23
Publication date: 2013-03-27
Also published as: ZA200703235B; EP2390333B1; CN1681930B; AU2003254495B2; KR20050059046A; GB2406571A; WO2004009819A3; CA2493432A1; EP2390333A1; EP1530639B1; HK1071909A1; US20060183187A1; JP2006501818A; US20130059785A1; US9133265B2; GB2406571B; CN1681930A; GB0501988D0; JP4597668B2; ATE527364T1

Abstract

본 발명은 (a) 분비 프리 서열 및 (b) 하기 모티프:

-X₁-X₂-X₃-X₄-X₅-

를 포함하며,

상기 식에서, X₁은 페닐알라닌, 트립토판 또는 티로신이며, X₂는 이소루신, 루신, 발린, 알라닌 또는 메티오닌이며, X₃는 루신, 발린, 알라닌 또는 메티오닌이며, X₄는 세린 또는 트레오닌이며 그리고 X₅는 이소루신, 발린, 알라닌 또는 메티오닌인 (i) 리더 서열 및 (ii) 상기 리더 서열에 이종성인 원하는(desired) 단백질을 포함하는 폴리펩타이드를 제공한다. 본 발명의 폴리펩타이드는 또한 리더 서열의 일부로서 분비 프로 서열을 포함한다. 본 발명은 또한 본 발명의 폴리펩타이드를 암호하는 서열을 포함하는 폴리뉴클레오타이드 및 세포, 바람직하게는 상기 폴리뉴클레오타이드를 포함하는 효모 세포를 제공한다.

알부민, 폴리펩타이드, 폴리뉴클레오타이드, 효모, 트랜스페린

Description

ＦＩＶＳＩ 모티프를 포함하는 신호서열을 갖는 폴리펩타이드 및 이를 암호하는 폴리뉴클레오타이드{POLYPEPTIDES WITH A SIGNAL SEQUENCE COMPRISING AN FIVSI MOTIF AND POLYNUCLEOTIDES ENCODING THEREFOR}

본 발명은 숙주세포로부터 단백질을 분비시키기위한 폴리펩타이드 및 폴리뉴클레오타이드 서열에 관한 것이다.

여러가지 천연 혹은 합성 폴리펩타이드 신호서열(분비 프리 리전으로도 불리움)은 숙주세포로부터 원하는 펩타이드, 폴리펩타이드 및 단백질(이들 용어는 본 명세서에서 호환적으로 사용된다)을 분비시키기위해 사용되거나 개발되어왔다. 상기 신호서열은 세포로부터 단백질을 주위의 매체로 혹은 일부 경우에 주변 세포질 공간으로 배출시키도록 초기의 단백질을 세포의 기구에 대해 지시한다. 상기 신호 서열은 일반적으로 필수적이지 않지만 일차 번역 생성물의 N-말단에 위치하며 일반적으로 필수적이지 않지만 분비 공정 도중 원하는 단백질을 분열시켜 "성숙" 단백질을 생성한다.

일부 원하는 단백질의 경우, 신호서열의 제거후 초기에 분비되는 엔티티(entity)는 그 N-말단에 추가 아미노산을 포함하며, 이는 "프로" 서열로 불리우며 그 중간체 엔티티는 "프로-단백질"로 불리운다. 이들 프로 서열은 최종 단백질이 폴딩되고 기능화되도록 도와주며 그 다음 일반적으로 분열된다. 다른 예로, 상기 프로 리전은 단순히 효소가 프리-프로 리전을 분열하기위한 분할 사이트를 제공하며 다른 기능을 갖는 것에 대해서는 알려지지 않았다.

프로 서열은 세포로부터 원하는 단백질의 분비도중 혹은 세포로부터 주위 매체나 주변세포질 공간으로 배출된 후에 제거될 수 있다.

신호(즉, 프리) 서열 혹은 프리-프로 분비 서열과 유사하든 상관없이 단백질의 분비를 지시하는 폴리펩타이드 서열은 또한 종종 리더 서열로 간주된다. 단백질의 분비는 번역, 변위 및 포스트-번역 공정을 포함하는 역학적 공정이며 이러한 단계의 하나 또는 그 이상은 다른 한 단계가 개시 혹은 완료되기전에 반드시 완료되는 것은 아니다.

효모 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 및 피치아 파스토리스(Pichia pastoris)와 같은 진핵 종에서 단백질의 생성에 대하여, 알려진 리더 서열은 S. 세레비지아에(S. cerevisiae) 및 포스파타아제 단백질(Pho5p)(참조 EP 366 400), 인버타아제 단백질(Suc2p)(참조 Smith 등(1985) Science, 229, 1219-1224) 및 열-충격 단백질-150(Hsp150p)(참조 WO 95/33833)을 포함한다. 또한, S. 세레비지아에 메이팅 팩터 알파-1 단백질(MFα-1) 및 휴먼 리소자임 및 휴먼 혈청 알부민(HSA) 단백질의 리더 서열이 사용되어 왔으며, 후자는 배타적이지 않음에도 불구하고 특히 휴먼 알부민 분비용으로 사용되어 왔다. WO 90/01063에는 MFα-1과 HSA 리더 서열의 융합이 개시되어 있으며, 이는 MFα-1 리더 서열의 사용과 관련된 휴먼 알부민의 오염 프레그먼트의 생성을 감소시키는데 유용하다.

예기치않게, 본 발명자들은 아미노산 서열 모티프의 도입에 의해, 바람직하게 리더 서열의 변형에 의해 분비 단백질의 수율이 증가될 수 있음을 발견하였다. 상기 변형은 완전한 네이티브 알부민 리더 서열, 이들의 변이체, 또는 WO 90/01063에 개시된 MFα-1과 HSA 리더 서열의 융합체와 같은 휴먼 알부민 리더 서열의 관련부를 이용하는 다른 리더 서열로 만들어지든 상관없이 효과적이다. 후자의 경우에, 만일 알부민이 분비된 단백질인 경우, 이에 따라 생성된 알부민은 감소된 오염 프레그먼트의 유익한 특성을 보유하며 여전히 증가된 수율을 나타낸다.

WO 90/01063의 융합 리더 서열의 보존적 변형이 WO 90/01063(예, 참조 WO 90/01063의 8쪽)에서 일반적인 용어로 개시되었음에도 불구하고, 일부 8x10¹² 폴리펩타이드의 부류가 정의되었다. 폴리뉴클레오타이드 암호 서열은 유전 암호의 퇴화에 따라 예시된 리더 서열에 대해 시작되었다. 이는 또한 다수의 가능성을 나타낸다. WO 90/01063에는 본 발명에 의해 제공되는 특정 부류의 변형 리더 서열이 분비 단백질의 발현용으로 유리한 특성을 갖는다고 인식되어 있지 않다.

본 발명의 제 1 견지로 (a) 분비 프리 서열 및 (b) 하기 모티프:

-X₁-X₂-X₃-X₄-X₅-

를 포함하며,

상기 식에서, X₁은 페닐알라닌, 트립토판 또는 티로신이며, X₂는 이소루신, 루신, 발린, 알라닌 또는 메티오닌이며, X₃는 루신, 발린, 알라닌 또는 메티오닌이며, X₄는 세린 또는 트레오닌이며 그리고 X₅는 이소루신, 발린, 알라닌 또는 메티오닌인 (i) 리더 서열 및 (ii) 상기 리더 서열에 이종성인 원하는 단백질을 포함하는 폴리펩타이드가 제공된다.

즉, 상기 폴리펩타이드는 SEQ ID NO 1 에 따른 서열을 포함한다.

N-(Phe/Trp/Tyr)-(Ile/Leu/Val/Ala/Met)-(Leu/Val/Ala/Met)-(Ser/Thr)-(Ile/Val/Ala/Met)-C

SEQ ID No 1

본 발명의 제 1 견지의 바람직한 구현예로, X₁은 페닐알라닌이다. 따라서 바람직한 폴리펩타이드는 SEQ ID NO 2의 서열을 포함한다.

N-Phe-(Ile/Leu/Val/Ala/Met)-(Leu/Val/Ala/Met)-(Ser/Thr)-(Ile/Val/Ala/Met)-C

SEQ ID No 2

본 발명의 제 1 견지의 다른 바람직한 구현예로, X₂는 이소루신이다. 따라서 다른 바람직한 폴리펩타이드는 SEQ ID NO 3의 서열을 포함한다.

N-(Phe/Trp/Tyr)-Ile-(Leu/Val/Ala/Met)-(Ser/Thr)-(Ile/Val/Ala/Met)-C

SEQ ID No 3

본 발명의 제 1 견지의 다른 바람직한 구현예로, X₃는 발린이다. 따라서 다른 바람직한 폴리펩타이드는 SEQ ID NO 4의 서열을 포함한다.

N-(Phe/Trp/Tyr)-(Ile/Leu/Val/Ala/Met)-Val-(Ser/Thr)-(Ile/Val/Ala/Met)-C

SEQ ID No 4

다른 바람직한 폴리펩타이드로 X₄는 세린이며 따라서 SEQ ID NO 5의 서열을 포함한다.

N-(Phe/Trp/Tyr)-(Ile/Leu/Val/Ala/Met)-(Leu/Val/Ala/Met)-Ser-(Ile/Val/Ala/Met)-C

SEQ ID No 5

본 발명의 제 1 견지의 다른 바람직한 구현예로, X₄는 트레오닌이다. 따라서 다른 바람직한 폴리펩타이드는 SEQ ID NO 29의 서열을 포함한다.

N-(Phe/Trp/Tyr)-(Ile/Leu/Val/Ala/Met)-(Leu/Val/Ala/Met)-Thr-(Ile/Val/Ala/Met)-C

SEQ ID No 29

본 발명의 제 1 견지의 다른 바람직한 구현예로, X₅는 이소루신이다. 따라서 다른 바람직한 폴리펩타이드는 SEQ ID NO 6의 서열을 포함한다.

N-(Phe/Trp/Tyr)-(Ile/Leu/Val/Ala/Met)-(Leu/Val/Ala/Met)-(Ser/Thr)-Ile-C

SEQ ID No 6

X₁, X₂, X₃, X₄ 및 X₅중 보다 바람직하게 적어도 2, 보다 바람직하게 적어도 3, 보다 바람직하게 적어도 4가 상기 바람직한 구현예에서 정의된 바와 같다.

상기 모티프는 리더 서열내로 삽입되거나(즉, 부가), 혹은 리더 서열내 1, 2, 3, 4, 5 또는 그 이상의 인접 아미노산에 대한 치환체로서 포함될 수 있다.

바람직한 구현예로, 상기 모티프는 자연적으로 발생하는 아미노산에 대한 치 환체로서 리더 서열내에 포함된다. 즉, 상기 모티프의 아미노산은 본 발명에 따른 최적화가 이루어지기 전에 리더 서열내에 존재하였거나 존재해온 5 인접 아미노산의 장소에 포함된다. 독자는 문구 "자연적으로 발생하는"은 이와 관련하여 사용되는 경우 본 발명을 자연적으로 발생하는 리더 서열의 최적화에 한정하려고 의도하는 것은 아님을 인지할 것이다. 반대로, 본 발명은 또한 HSA/MFα-1 리더 서열 융합체와 같은 합성 리더 서열의 최적화에 적용가능하며, 그 최적화가 본 명세서에 예시된다.

상기 모티프가 치환체로서 리더 서열내에 포함되는 경우 X₄는 자연적으로 발생하는 아미노산 또는 이들의 변이체인 것이 바람직하다. 즉, 바람직하게 X₁, X₂, X₃ 및 X₅만 치환되며, X₄는 변하지 않은 채로 유지되거나 단순히 변이체, 바람직하게는 그 위치에서 천연 아미노산의 하기 정의된 바와 같은 보존적 치환체로서 변한다.

본 발명의 제 1 견지의 특히 바람직한 구현예로, X₁은 페닐알라닌이며, X₂는 이소루신이며, X₃는 발린이며, X₄는 세린이며 그리고 X₅는 이소루신이다. 따라서 본 발명의 제 1 견지의 특히 바람직한 구현예로, SEQ ID No 7의 서열을 포함하는 폴리펩타이드가 제공된다.

N-Phe-Ile-Val-Ser-Ile-C

SEQ ID No 7

상기 기구에서, "N" 및 "C"는 폴리펩타이드 서열의 방향을 나타내며, 실제 말단에 대한 이들의 해석으로 한정하려는 것은 아닌 것으로, 즉, 폴리펩타이드 서열은 N- 또는 C- 말단에 혹은 대부분 양 말단에 하나 또는 그 이상의 다른 폴리펩타이드 서열에 연결(예, 융합, 접합 혹은 결찰)될 수 있다.

본 발명의 제 1 견지에 따른 폴리펩타이드는 상기 리더 서열에 이종성인 성숙된 원하는 단백질의 서열을 포함한다. 성숙된 원하는 단백질 서열은 발현 생성물에 존재하게될 일차 아미노산 서열이며 이는 본 발명의 폴리펩타이드가 발현되는 발현 시스템에 의해 포스트-번역 공정이 이루어진다. 원하는 단백질은 바람직하게 본 발명의 폴리펩타이드가 발현되는 세포로부터 분비되기에 적합한 것이다.

원하는 단백질은 리더 서열과 이종성이다. 즉, 본 발명의 제 1 견지의 폴리펩타이드는 이들의 리더 서열로 상기한 바와 같이 정의된 모티프- X₁-X₂-X₃-X ₄-X₅- 을 갖는 자연적으로 발생하는 단백질을 포함하지 않는다. 바람직한 구현예로, 본 발명의 제 1 견지의 폴리펩타이드는 어느 위치에서도 상기한 바와 같이 정의된 모티프- X₁-X₂-X₃-X₄-X₅- 을 갖는 자연적으로 발생하는 단백질을 포함하지 않는다. 이 와 관련하여, 용어 "자연적으로 발생하는"은 재조합 기술, 특정부위 돌연변이 유발 혹은 사람의 개입을 필요로하는 이와 동등한 인공기술에 의해 변형되지않은 자연적으로 발생하는 유기체에 의해 암호화된 단백질을 가리킨다.

원하는 단백질은 어떠한 서열을 포함할 수 있으며, 이는 천연 단백질(지모겐(zymogen) 포함), 폴리펩타이드 또는 펩타이드, 또는 천연 단백질, 폴리펩타이드 또는 펩타이드의 변이체 또는 프레그먼트(예를들어 도메인일 수 있음); 총 합성 단백질, 폴리펩타이드 또는 펩타이드; 또는 다른 단백질, 폴리펩타이드 또는 펩타이드(천연 또는 합성)의 단일 또는 다중 융합체일 수 있다. 이러한 단백질은 이에 한정하는 것은 아니나 WO 01/79258, WO 01/79271, WO 01/79442, WO 01/79443, WO 01/79444 및 WO 01/79480에 제공된 리스트, 또는 이들의 변이체나 프레그먼트로부터 취할 수 있다. 이들 특허 출원이 알부민에 대한 융합 파트너와 관련된 단백질의 리스트를 나타냄에도 불구하고, 본 발명은 이에 한정되지 않으며, 본 발명의 목적상, 이에 열거된 어느 단백질이 단독으로 존재하거나 알부민, 면역글로블린의 Fc 리전, 트랜스페린 또는 원하는 폴리펩타이드로서 어느 다른 단백질에 대한 융합 파트너로 존재할 수 있다.

본 발명에 의해 발현되는 원하는 단백질의 바람직한 예는 알부민, 트랜스페린, 락토페린, 엔도스태틴, 안지오스태틴, 콜라겐, 면역글로블린, Fab' 프레그먼트, F(ab')2, ScAb, ScFv, 인터페론, IL10, IL11, IL2, 인터페론 α종 및 그 하위 종, 인터페론 β종 및 그 하위종, 인터페론 γ종 및 그 하위종, IL1-수용체 길항제, EPO, TPO, 프로샙타이드, 시아노비린-N, 5-헬릭스, T20 펩타이드, T1249 펩타이드, HIV gp41, HIV gp120, 피브리노겐, 유로키나아제, 프로유로키나아제, tPA(조직 플라스미노겐 활성제), 히루딘, 혈소판 유래 성장인자, 파라티로이드 호르몬, 프로인슐린, 인슐린, 인슐린-유사(insulin-like) 성장 인자, 칼시토닌, 성장 호르몬, 형질변형 성장 인자 β, 종양 괴사 인자, G-CSF, GM-CSF, M-CSF, 이에 한정하는 것은 아니나 플라스미노겐, 피브리노겐, 트롬빈, 프리-트롬빈, 프로-트롬빈, 본 윌브랜드 팩터, α₁-안티트립신, 플라스미노겐 활성제, 팩터 VII, 팩터 VIII, 팩터 IX, 팩터 X 및 팩터 XIII, 신경세포 인자, LACI(조직 인자 경로 억제제 혹은 외인성 경로 억제제로도 알려진 리포프로틴 관련 응집 억제제), 혈소판-유래 내피 세포 성장 인자(PD-ECGF), 글루코즈 옥시다아제, 혈청 콜린에스테라제, 아프로티닌, 아밀로이드 전구체, 인터-알파 트립신 억제제, 안티트롬빈 III, 아포-리포프로틴 종, 프로틴 C, 프로틴 S, 상기의 어느 변이체 또는 프레그먼트를 포함하는 프리 및 활성 형태 모두의 응집 인자를 포함한다.

원하는 단백질과 관련하여 "변이체"는 하나 또는 그 이상의 위치에서 보존적 혹은 비보존적 아미노산 삽입, 결실 또는 치환이 존재하며, 단 이러한 변화는 예를들어, 효소 활성 혹은 수용체 바인딩(활성의 타입 및 특정 활성), 열안정성, 특정 pH-범위에서의 활성(pH-안정성)과 같이 단백질에서 기본적인 특성이 현저하게 변화 시키지 않는 것이다. 이와 관련되어 "현저하게"란 당해 기술분야의 숙련자가 그 변이체의 특성이 여전히 다르지만 본래 단백질의 특성에 비해 자명하지 않는 것을 의미한다.

"보존적 치환"은 Val, Ile, Leu, Ala, Met; Asp, Glu; Asn, Gln; Ser, Thr, Gly, Ala; Lys, Arg, His; 및 Phe, Tyr, Trp와 같은 조합을 의미한다. 바람직한 보존적 치환은 Gly, Ala; Val, Ile, Leu; Asp, Glu; Asn, Gln; Ser, Thr; Lys, Arg; 및 Phe, Tyr을 포함한다.

"변이체"는 전형적으로 그 유래된 폴리펩타이드에 대해 적어도 25%, 적어도 50%, 적어도 60% 또는 적어도 70%, 바람직하게 적어도 80%, 보다 바람직하게 적어도 90%, 보다 바람직하게 적어도 95%, 보다 바람직하게 적어도 99%, 가장 바람직하게 적어도 99.5% 서열 동일성을 갖는다.

두 폴리펩타이드사이의 퍼센트 서열 동일성은 예를들어 위스콘신 대학 유전학 컴퓨터 그룹의 GAP 프로그램과 같은 적절한 컴퓨터 프로그램을 이용하여 조사될 수 있으며 퍼센트 동일성은 그 서열이 최적으로 배열된 폴리펩타이드에 대하여 계산되는 것으로 인정될 것이다.

배열은 택일적으로 Clustal W 프로그램(Thompson 등, (1994) Nucleic Acids Res., 22(22), 4673-80)을 이용하여 수행될 수 있다. 다음과 같은 파라미터가 사용될 수 있다:

ㆍ패스트 페어와이즈 배열 파라미터: K-터플(문자) 사이즈; 1, 윈도우 사이즈; 5, 갭 페널티; 3, 탑 다이아고널의 수; 5. 스코어링 방법: x 퍼센트.

ㆍ다중 배열 파라미터: 갭 오픈 페널티; 10, 갭 익스텐션 페널티; 0.05.

ㆍ스코어링 매트릭스: BLOSUM.

이러한 변이체는 자연적이거나 또는 당해 기술분야에 잘 알려진 바와 같은 단백질공학 및 특정부위 돌연변이 유발 방법을 이용하여 생성될 수 있다.

원하는 단백질과 관련되어 "프레그먼트"는 하나 또는 그 이상의 위치에서 결실이 이루어진 단백질을 칭한다. 따라서 상기 프레그먼트는 기껏해야 전체 성숙 폴리펩타이드의 완전 서열의 5, 10, 20, 30, 40 또는 50%를 포함할 수 있다. 전형적으로 프레그먼트는 전체 원하는 단백질의 완전 서열의 최대 60%, 보다 전형적으로 70%, 바람직하게 최대 80%, 보다 바람직하게 최대 90%, 보다 바람직하게 최대 95%, 보다 바람직하게 최대 99%를 포함한다. 원하는 단백질의 특히 바람직한 프레그먼트는 원하는 단백질의 하나 또는 그 이상의 전 도메인을 포함한다. 예를들어, 원하는 단백질은 알부민일 수 있다. 알부민은 3 도메인을 갖는다. 특히 바람직한 알부민의 프레그먼트는 하나 또는 그 이상의 도메인을 포함할 수 있으며 따라서 전형적으로 알부민의 완전 서열의 적어도 33% 또는 적어도 66%를 포함할 것이다.

알부민 및 트랜스페린, 또는 이들의 변이체나 프레그먼트는 특히 이들이 휴먼 오리진인 경우, 즉, 이들이 자연적으로 생성되는 사람의 단백질에서 발견되는 것과 동일한 경우에 원하는 단백질로 특히 바람직하다.

용어 "휴먼 알부민"은 본 명세서에서 사람의 혈청 알부민과 구별할 수 없거나 이들의 변이체나 프레그먼트인 물질을 가리킨다. "변이체"는 그 변화가 실질적으로 알부민의 종창에 관한 유용한 리간드-바인딩 혹은 면역유발 특성을 변경하지 않는 보존적 혹은 비-보존적인 삽입, 결실 및 치환을 포함한다. 예를들어 자연적으로 발생하는 휴먼 알부민의 다형 변이체 또는 EP-A-322 094에 개시되어 있는 휴먼 알부민 유사체를 포함한다. 일반적으로, 휴먼 알부민의 변이체나 프레그먼트는 중량에 대한 중량으로, 휴먼 혈청 알부민의 리간드 바인딩 활성의 적어도 10%(바람직하게 적어도 50%, 80%, 90% 또는 95%) 및 사람 혈청 알부민의 종창 활성의 적어도 50%(바람직하게 적어도 80%, 90% 또는 95%)를 가질 것이다. 알부민, 알부민 변이체 또는 알부민의 프레그먼트의 콜로이드 삼투압으로도 알려진 종창 활성은 Hoefs, J.C.(1992) Hepatology 16:396-403에 기재된 방법에 의해 조사될 수 있다. 빌리루빈 바인딩은 HSA에 대하여 527nm에서 형광 증가에 의해 측정될 수 있다. 빌리루빈(1.0mg)은 1M NaOH 50μL에 용해되고 탈염수로 1.0mL로 희석된다. 빌리루빈 스톡은 100mM Tris-HCl pH8.5, 1mM EDTA로 희석되어 형광계 큐벳내에 0.6nmol의 빌리루빈 mL^-1으로 제공된다. 형광은 0 대 5(몰:몰)의 HSA:빌리루빈의 범위에 걸쳐 HSA를 이용한 적정도중 448nm에서 여기 및 527nm(10nm 슬릿 폭)에서 방출에 의해 측정된다.

바람직한 구현예로, 상기 원하는 단백질은 트랜스페린이다. 이는 트랜스페린과의 멤버(Testa, Proteins of iron metabolism, CRC Press, 2002; Harris & Aisen, Iron carriers and iron proteins, Vol. 5, Physical Bioinorganic Chemistry, VCH, 1991) 및 트랜스페린, 돌연변이 트랜스페린(Mason 등, 1993, Biochemistry, 32, 5472; Mason 등, 1998, Biochem. J., 330(1), 35), 절단된 트랜스페린, 트랜스페린 로브(Mason 등, 1996, Protein Expr. Purif., 8, 119; Mason 등, 1991, Protein Expr. Purif., 2, 214), 락토페린, 돌연변이 락토페린, 절단된 락토페린, 락토페린 로브 또는 상기 어느 것과 다른 펩타이드, 폴리펩타이드나 단백질의 융합체(Shin 등, 1995, Proc. Natl. Acad. Sci. USA, 92, 2820; Ali 등, 1999, J. Biol. Chem., 274, 24066; Mason 등, 2002, Biochemistry, 41, 9448)와 같은 이들의 유도체를 포함한다.

용어 "휴먼 트랜스페린"은 본 명세서에서 사람으로부터 유래된 트랜스페린 또는 이들의 변이체나 프레그먼트와 구별할 수 없는 물질을 가리킨다. "변이체"는 그 변화가 실질적으로 트랜스페린의 유용한 리간드-바인딩 혹은 면역유발 특성을 변경하지 않는 보존적 혹은 비-보존적인 삽입, 결실 및 치환을 포함한다. 예를들어 자연적으로 발생하는 휴먼 트랜스페린의 다형 변이체 또는 휴먼 트랜스페린 유사체를 포함한다. 일반적으로, 휴먼 트랜스페린의 변이체 또는 프레그먼트는 중량에 대한 중량으로, 휴먼 트랜스페린의 리간드 바인딩 활성(예, 철-바인딩)의 적어도 50%(바람직하게 적어도 80%, 90% 또는 95%)를 가질 것이다. 트랜스페린 또는 시험 시료의 철 바인딩 활성은 이들의 철이 없는 상태 및 완전히 철이 적재된 상태에서 그 단백질에 대해 470nm:280nm 흡광도 비율로 분광학적으로 측정될 수 있다. 시약은 특별한 언급이 없는한 철을 함유하지 않아야 한다. 철은 0.1M 시트레이트, 0.1M 아세테이트, 10mM EDTA pH4.5에 대한 투석에 의해 트랜스페린 혹은 시험 시료로부터 제거될 수 있다. 단백질은 100mM HEPES, 10mM NaHCO₃ pH8.0에 약 20mg/mL로 존재할 수 있다. 물에 희석된 아포트랜스페린(Calbiochem, CN Biosciences, Nottingham, UK)의 470nm:280nm 흡광도 비율을 측정하여 280nm에서 흡광도가 정밀하게 분광학적으로 측정될 수 있다(0% 철 바인딩). 1M NaOH 2mL에 니트로트리아세트산 191mg을 용해한 다음, 0.5M 염화 제2철 2mL을 첨가하여 20mM 철-니트릴로트리아세테이트(FeNTA) 용액을 준비한다. 이를 탈이온수로 50mL로 희석한다. 새로이 준비된 20mM FeNTA를 과량 첨가하여 아포-트랜스페린에 철을 완전히 적재시킨 다음(100% 철 바인딩), 그 홀로-트랜스페린 제조물을 100mM HEPES, 10mM NaHCO3 pH8.0에 대해 완전히 투석하여 잔류 FeNTA를 제거하고 470nm:280nm에서 흡광도 비율을 측정한다. 상기 방법은 초기에 철이 함유되지 않은 시험 시료를 이용하여 반복되며 대조구와 최종 비율에 대해 비교한다.

또한, 상기 어느 단일 혹은 다중 이종성 융합체; 또는 알부민, 트랜스페린 또는 면역글로블린이나 이들의 어느 변이체나 프레그먼트에 대한 단일 혹은 다중 이종성 융합체가 사용될 수 있다. 이러한 융합체는 알부민 N-말단 융합체, 알부민 C-말단 융합체 및 WO 01/79271에 예시된 co-N-말단 및 C-말단 알부민 융합체, 및 트랜스페린 N-말단 융합체, 트랜스페린 C-말단 융합체, 및 co-N-말단 및 C-말단 트랜스페린 융합체를 포함한다.

바람직한 구현예로, 본 발명의 제 1 견지에 따른 폴리펩타이드는 상기한 바와 같이 정의된 X₁-X₅ 펜타펩타이드 모티프의 적어도 일부를 포함하는 분비 프리 서열을 포함한다. 즉, 성숙된 원하는 폴리펩타이드의 분비에 영향을 주도록 작용하는 리더 서열의 리전은 X₁-X₅ 펜타펩타이드 모티프의 1, 2, 3, 4, 또는 5 아미노산을 포함한다. 상기 분비 프리 서열 리전이 X₁-X₅ 펜타펩타이드 모티프의 5 아미노산미만을 포함하는 경우, 프리 서열내에 포함되는 모티프의 아미노산은 프리 서열 리전의 가장자리중 하나에 위치하여 이들은 X₁-X₅ 펜타펩타이드 모티프의 나머지 아미노산에 인접하게 된다.

보다 바람직한 구현예로 본 발명의 제 1 견지에 따른 폴리펩타이드는 이것이 본 발명의 제 1 견지에 의해 상기 정의된 바와 같은 모티프를 포함하는 분비 프리 서열을 포함하는 것을 특징으로 하는 리더 서열을 포함한다. 상기 리더 서열은 일반적으로 반드시 그러한 것은 아니나 일차 전사물의 N-말단에 위치하며 일반적으로 반드시 그러한 것은 아니나 분비 공정도중 단백질을 분열하여 성숙된 "원하는" 단백질을 생성한다.

반드시 그러한 것은 아니지만, 분비 리더 서열은 일반적으로 아미노산의 N-말단 서열이며, 그 폴리펩타이드는 생성되어지는 숙주세포로부터 분비되는 일부를 형성한다. 분비는 인지질 이중층, 전형적으로, 이에 한정하는 것은 아니나 진핵 유기체의 소포체 또는 원핵 유기체의 원형질막을 가로질러 세포질 구획으로부터 단백질의 코-트랜스래이셔널 포스트-번역 변위로 정의된다. 분비된 단백질은 그 세포의 영역내(전형적으로, 이에 한정하는 것은 아니나 소포체, 골지체, 액포, 리소좀 혹은 주변 세포질 공간내)에 보유되거나 혹은 이는 그 세포로부터 배지내로 분비될 수 있다. 서열 프리 서열이 없는 그와 동등한 폴리펩타이드와 비교하여, 그 폴리펩타이드가 생성되어지는 숙주세포로부터 더 많이 분비되도록 하는 서열이 분비 리더 서열로 작용한다. 일반적으로, 리더 서열을 갖는 폴리펩타이드는 분비될 것이며 한편 리더 서열이 없는 폴리펩타이드는 분비되지 않을 것이다. 그러나, 본 발명은 다른 리더 서열이 다른 수준의 효율성을 갖는 환경을 응시한다. 따라서 리더 서열은 세포에 의해 생성되어지는 성숙 단백질의 적어도 10%, 20%, 30 또는 40% 또는 50%, 전형적으로 적어도 60% 또는 70%, 바람직하게 적어도 80%, 보다 바람직하게 적어도 90%, 보다 바람직하게 적어도 95%, 보다 바람직하게 98%, 가장 바람직하게 적어도 99%가 세포로부터 분비되도록 할 수 있다. 세포로부터 성숙 폴리펩타이드의 분비는 예를들어, 적절한 DNA 구조물을 갖는 숙주세포를 제공하고 세포내에서 생성되는 어느 성숙 단백질과 비교하여 분비되어지는 성숙 단백질(예, 휴먼 알부민)의 양을 측정함으로써 측정될 수 있다.

바람직한 분비 리더 서열은 숙주세포가 효모세포(예, 사카로미세스 세레비지아제(Saccharomyces cerevisiae) 또는 피치아 파스토리스(Pichia pastoris))인 경우 상기 언급한 분비 수준을 제공할 것이다. 효모 숙주 세포로부터 성숙 폴리펩타이드의 분비는 예를들어, 하기 실시예에 나타낸 바와 같은 방법에 의해 측정될 수 있다.

따라서, 분비는 시험 리더 서열을 포함하는 단백질의 분비 수준을 조절 리더 서열을 포함하는 단백질의 분비 수준에 대하여 비교함으로써 측정될 수 있다. 주어진 서열("시험 서열")이 주어진 분비 수준을 달성할 수 있는지 조사하기위해, 첫번째 방법은 전형적으로, 하기에 나타낸 PRB1 프로모터 및 ADH1 터미네이터와 같은 기능적 효모 조절 리전에 실시가능하게 연결된 SEQ ID NO:26에 의해 정의된 변형된 리더 서열을 가지며, LEU2 유전자 및 rHA를 암호하는 폴리뉴클레오타이드를 갖는, EP 0 286 422에 기재된 타입의 효모 디스인테그레이션 벡터, "출발자" 플라스미드에서 사용될 수 있으며, 이는 리더 서열의 그 상응 리전 대신에 시험 서열을 암호하는 폴리뉴클레오타이드 서열을 포함하도록 변형되어 따라서 시험 플라스미드를 제공한다. 제 1 대조구로서, WO 90/01063에 기재된 리더 서열을 암호하는 변형되지 않은 '출발자' 플라스미드가 사용된다. 사카로미세스 세레비지아제(Saccharomyces cerevisiae) 스트레인 AH22 cir⁰(Hinnen 등, 1978, Proc. Natl. Acad. Sci. USA, 75(4), 1929-33; Mead 등, 1986, Mol. Gen. Genet., 205, 417), 리버티드 His4가 시험 숙주로 사용된다. AH22(leu2, his4, can1)의 HIS4 복귀 돌연변이체(즉, His+)는 0.002%(w/v) 루신이 보충된 BMMD 아가에서 충분한 AH22 세포를 그 콜로니가 나타날때까지 배양함으로써 획득될 수 있다. 콜로니는 0.002%(w/v) 루신이 보충된 BMMD 아가(플래이트 1), 0.002%(w/v) 루신이 보충되고 0.002%(w/v) 히스티딘이 보충된 BMMD 아가(플래이트 2), 및 BMMD 아가(플래이트 3)에 플래이팅하여 Leu- 및 His+를 확인하도록 시험된다. AH22 His+(leu2, can1) 분리물은 플래이트 1 및 플래이트 2에서 성장하지만 플래이트 3에서는 성장하지 않을 것이다. 시험 숙주는 시험 및 대조구 플라스미드를 갖는 루신 야생형으로 형질변형된다. 형질변형체는 2%(w/v) 글루코즈(BMMD)를 함유하는 완충 최소 배지(BMM, Kerry-Williams, S.M. 등(1998) Yeast 14, 161-169)상에서 패치아웃되고 추가 분석을 위해 충분히 성장할 때 까지 30℃에서 배양한다. 형질변형체는 배지에서 필 앤드 드로우 방법에 따라 그리고 WO 96/37515의 페드-배치(fed-batch) 방법에 대해 기술된 조절 파라미터를 이용하여 페드-배치 배양 방법의 공급 단계 완료시 고 세포 밀도로 배양되고, 그 배양물의 90%는 발효기로부터 제거된다. 배치 배지는 초기의 공급 첨가전에 WO 96/37515에 기술된 배지 및 조절 파라미터를 이용하여 (pH 조절이 유지되는)배양물 의 잔류 10부피%로 첨가된다. 필 앤드 드로우 방법은 무제한 사이클수로 반복될 수 있다. 시험 및 조절 플라스미드를 포함하는 형질변형체의 휴먼 알부민 생산성(Y_P/S)은 세포를 함유하지 않는 전체 배양물의 SDS-PAGE의 주사 밀도법에 의해 평가된다. Y_P/S는 발효도중 배양물에 첨가된 수크로오즈의 그램당 휴먼 알부민 단백질(mg)의 비율을 나타낸다.

본 발명에 따른 리더 서열은 상기 제 1 방법에 의해 측정되는 Y_P/S에 의해 조사되는 바와 같은 즉, 그 시험 및 제 1 대조구 형질변형체가 유사한 발효기 환경에서 유사한 시간동안 배양되는 경우 제 1 대조구에 의해 획득된 분비 수준보다 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190%, 200%, 210%, 220%, 230%, 240%, 250%, 260%, 270%, 280%, 290%, 300%, 310%, 320%, 330%, 340%, 350%, 360%, 370%, 380%, 390%, 400%, 410%, 420%, 430%, 440%, 450%, 460%, 470%, 480%, 490% 또는 500% 보다 높은 분비 수준을 획득할 수 있다. 따라서 본 발명에 따른 리더 서열은 제 1 대조구보다 최고 400%, 450%, 500%, 550%, 600%, 650%, 700%, 750% 또는 그 이상의 분비수준을 나타낼 수 있다. 본 발명에 따른 리더 서열은 제 1 대조구에 의해 획득되는 분비수준보다 408%와 같은 적어도 400%, 또는 442%와 같은 적어도 440%의 분비수준을 획득할 수 있는 것이 특히 바람직하다.

제 1 방법에 대한 대안으로, 주어진 서열("시험 서열")이 주어진 분비 수준을 달성할 수 있는지 조사하기 위해 제 2 방법이 사용될 수 있다. 제 2 방법은 본질적으로 제 1 방법과 동일하다. 그러나, 제 2 방법은 상기 정의된 '출발자' 플라스미드를 이용하나, SEQ ID NO:26 대신에 그 플라스미드는 SEQ ID NO:22에 정의된 폴리뉴클레오타이드 서열을 가지며 rHA를 암호하는 폴리뉴클레오타이드에 연결되며 WO 90/01063에 기술된 아미노산 서열을 갖는 리더 서열을 암호한다("제 2 출발자" 플라스미드). 시험 플라스미드는 제 2 출발자 플라스미드의 리더 서열의 그 상응 리전 대신에 시험 서열을 암호하는 폴리뉴클레오타이드 서열을 포함하도록 제 2 출발자 플라스미드를 변형시킴으로써 생성된다. 제2 대조구로서, 변형되지않은 제 2 출발자 플라스미드가 사용된다. 시험 및 제 2 대조구 플라스미드를 포함하는 형질변형체는 제 1 방법에 기술된 바와 같이 제조되고, 배지에서 페드-배치 방법에 따라 그리고 WO 96/37515에 기술된 바와 같은 대조구 파라미터를 이용하여 고 세포 밀도 발효로 배양된다. Y_P/S는 상기한 바와 같이 평가된다.

본 발명에 따른 리더 서열은 상기 제 2 방법에 의해 측정되는 YP/S에 의해 조사되는 바와 같은, 즉 시험 및 제 2 대조구 형질변형체가 유사한 발효기 환경에서 유사한 시간동안 배양되는 경우 제 2 대조구에 의해 획득된 분비 수준보다 적어도 1%, 2%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19% 또는 20% 보다 높은 분비 수준을 획득할 수 있다. 따라서 본 발명에 따른 리더 서열은 제 2 대조구보다 최고 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100% 또는 그 이상의 분비 수준을 나타낼 수 있다. 본 발명에 따른 리더 서열은 제 2 대조구에 의해 획득되는 분비수준보다 6%와 같은 적어도 5%, 또는 12%, 13%, 14%, 15% 또는 16%와 같은 적어도 10%의 분비수준을 획득할 수 있는 것이 특히 바람직하다.

일 구현예로, 본 발명에 따른 리더 서열은 제 1 방법과 관련하여 상기 정의한 바와 같은 분비수준을 획득할 것이다. 다른 구현예로, 본 발명에 따른 리더 서열은 제 2 방법과 관련하여 상기 정의한 바와 같은 분비 수준을 획득할 것이다. 특히 바람직한 구현예로, 본 발명에 따른 리더 서열은 제 1 및 제 2 방법 모두와 관련하여 상기 정의한 바와 같은 분비 수준을 획득할 것이다.

세포 바이오매스로부터 가용화된 단백질 및 배양 상층액내의 분비 단백질은 다음과 같이 분석될 수 있다:

1. 겔 침투 고압 액체 크로마토그래피.

2. SDS-PAGE의 밀도법

3. 로켓 면역전기영동

분비된 세포내의 원하는 단백질의 양은 원하는 단백질의 표준곡선에 대하여 정량화되고 당해 기술분야의 숙련자에게 알려진 바와 같은 바이오매스의 양으로 표준화될 수 있다.

일반적으로 리더 서열은 그것이 존재하는 혹은 결합되는 것으로 의도되는 성숙 단백질의 성숙된 형태로부터 유래되는 것이 바람직하다. 따라서, 예를들어, 성숙 단백질이 알부민인 경우, 자연적으로 발생하는 알부민 분비 프리 서열, 혹은 프로 서열 혹은 프리-프로 서열을 포함하는 서열을 사용하는 것이 바람직하다. 그러나, 리더 서열은 택일적으로 성숙 단백질의 서열이외의 다른 공급원으로부터 유래될 수 있다.

따라서 바람직한 구현예로, 본 발명의 제 1 견지의 폴리펩타이드 리더 서열은 알부민 분비 프리 서열 혹은 그 변이체로부터 유래된 분비 프리 서열을 포함한다.

상기 사용된 알부민 프리 서열의 "변이체"는 상기 X₁, X₂, X₃, X₄ 또는 X₅로 정의된 것들외에 하나 또는 그 이상의 위치에서 (상기한 바와 같이)보존적 혹은 비보존적 아미노산 삽입, 결실 또는 치환이 존재하며, 단 이러한 변화는 그 펩타이드가 프리 서열로 작용하도록 하는 알부민 프리 서열을 가리킨다.

바람직하게, 알부민 프리 서열의 "변이체"는 상기 X1-X5와 같이 정의된 잔기와 다르며, 자연적으로 발생하는 알부민 프리 서열과 적어도 2, 적어도 3 또는 적 어도 4, 바람직하게 적어도 5, 보다 바람직하게 적어도 6, 보다 바람직하게 적어도 7, 보다 바람직하게 적어도 8, 가장 바람직하게 적어도 9개의 동일 아미노산을 가지며, 가장 바람직하게 도 1의 알부민 프리 서열을 갖는다.

보다 바람직하게, 분비 프리 서열이 알부민 분비 프리 서열로부터 유도되는 경우, 본 발명의 제 1 견지에 따른 폴리펩타이드는 포지션 -20, -19, -18, -17 및 -16에서 자연적으로 발생하는 아미노산 대신에 각각 X₁, X₂, X₃, X₄ 및 X₅를 가지며, 여기서 넘버링은 -1 잔기가 네이티브 알부민 분비 프로 서열의 C-말단 아미노산이 되는 식으로 이루어지고 X₁, X₂, X₃, X₄ 및 X₅는 상기 정의한 바와 같은 아미노산이다.

예를들어, 상기 언급한 넘버링이 휴먼 알부민 분비 프리 서열의 서열(예, WO 90/01063에 기재)에 적용되는 경우, 다음과 같이 얻어질 수 있다.

특히 바람직한 구현예로 휴먼 알부민 분비 프리 서열의 서열로부터 유도된 분비 프리 서열이 사용된다.

따라서, 예를들어, X₁-X₅ 펜타펩타이드는 N-말단 끝에서 하기 서열 SEQ ID NO 8 -

N-Met-Lys-Trp-Val-C

SEQ ID No 8

또는 이들의 보존적 치환 변이체, 즉 -

N-Met-(Lys/Arg/His)-(Phe/Trp/Tyr)-(Ile/Leu/Val/Ala/Met)-C

SEQ ID No.33

의 C-말단의 끝과 직접 혹은 간접적으로 융합될 수 있다.

부가적으로 혹은 택일적으로 이는 그 C-말단 끝에서 적어도 하나의 하기 서열 -

N-Leu-Phe-Leu-Phe-Ser-Ala-Tyr-Ser-C

SEQ ID No.9

또는 이들의 보존적 치환 변이체, 즉 -

N-(Ile/Leu/Val/Ala/Met)-(Phe/Trp/Tyr)-(Ile/Leu/Val/Ala/Met)-

(Phe/Trp/Tyr)-(Ser/Thr/Gly/Tyr/Ala)-(Ser/Thr/Gly/Tyr/Ala)-

(Ile/Leu/Val/Ala/Met)-(Phe/Trp/Tyr)-(Ser/Thr/Gly/Tyr/Ala)-C

SEQ ID No.10

또는

N-Leu-Phe-Leu-Phe-Ser-Ser-Ala-Tyr-Ser-Arg-Ser-Leu-Asp-Lys-Arg-C

SEQ ID No.11

또는

N-Leu-Phe-Leu-Phe-Ser-Ala-Tyr-Ser-Arg-Gly-Val-Phe-Arg-Arg-C

SEQ ID No.30

의 N-말단 끝과 융합될 수 있다.

SEQ ID No.9에 주어진 서열은 천연 휴먼 알분 프리 서열의 최종 9 아미노산을 나타낸다. SEQ ID No.11의 경우, 이는 WO 90/01063의 두 주요 융합 리더중 하나의 최종 6 아미노산에 융합되며, SEQ ID No.30, SEQ ID No.9의 경우 천연 휴먼 알부민 프로 서열의 최종 6 아미노산에 융합된다.

바람직하게, 각 경우에, X¹은 F, X²는 I, X³는 V, X⁴는 S 또는 T이며 X⁵는 I이다.

바람직한 구현예로, 펜타펩타이드는 N-말단에서 SEQ ID NO. 8 또는 그 보존적 치환 변이체의 서열의 C-말단과 융합되며, C-말단에서 SEQ ID NO.9, 그 보존적 치환 변이체, SEQ ID No. 10, 11 또는 30의 서열의 N-말단과 융합되어 이에 따라 예를들어, 하기 서열중 하나를 형성한다.

N-Met-Lys-Trp-Val-X1-X2-X3-X4-X5-

Leu-Phe-Leu-Phe-Ser-Ser-Ala-Tyr-Ser-C

SEQ ID No.12

또는

N-Met-Lys-Trp-Val-X₁-X₂-X₃-X₄-X₅-(Ile/Leu/Val/Ala/Met)-(Phe/Trp/Tyr)-

(Ile/Leu/Val/Ala/Met)-(Phe/Trp/Tyr)-(Ser/Thr/Gly/Tyr/Ala)-

(Ser/Thr/Gly/Tyr/Ala)-(Ile/Leu/Val/Ala/Met)-(Phe/Trp/Tyr)-

(Ser/Thr/Gly/Tyr/Ala)-C

SEQ ID No.13

N-Met-Lys-Trp-Val-X₁-X₂-X₃-X₄-X₅-

Leu-Phe-Leu-Phe-Ser-Ser-Ala-Tyr-Ser-Arg-Ser-Leu-Asp-Lys-Arg-C

SEQ ID No. 14

N-Met-Lys-Trp-Val-X₁-X₂-X₃-X₄-X₅-

Leu-Phe-Leu-Phe-Ser-Ser-Ala-Tyr-Ser-Arg-Gly-Val-Phe-Arg-Arg-C

SEQ ID No 31

여기서 X1-X5는 상기 정의한 바와 같거나 혹은 상기한 바와 같이 정의된 이들의 보존적 치환 변이체이다.

특히 바람직한 구현예는 분비 프리 서열로서 SEQ ID NO 28의 서열을 갖는다.

N-Met-Lys-Trp-Val-Phe-Ile-Val-Ser-Ile-Leu-Phe-Ser-Ser-Ala-

Tyr-Ser-C

SEQ ID No 28

즉, 상기 프리 서열은 휴먼 알부민 분비 프리 서열로 부터 유도되며, X₁, X₂, X₃, X₄ 및 X₅는 포지션 -20, -19, -18, -17 및 -16에 존재하며 X₁, X₂, X₃, X₄ 및 X₅는 SEQ ID No.7에서 정의된 바와 같다.

상기로부터 알 수 있는 바와 같이, SEQ ID Nos 12 또는 28의 서열처럼 상기 정의된 분비 프리 서열은 분비 프로 서열과 결합되어 기능적 프리-프로 분비 서열을 형성할 수 있다. 바람직한 구현예로, 프리 서열 모티프는 그 C-말단 끝에서 펩타이드 결합에 의해 분비 프로 서열 모티프의 N-말단 아미노산과 융합되어 이에 따라 프리-프로 서열 모티프를 형성한다. 리더 서열이 존재하거나 결합되는 것으로 의도되는 성숙 단백질의 미성숙 형태로부터 유도된 프로 서열을 사용하는 것이 바람직할 수 있다. 또한 관련된 리더로부터 변형되지않은 프리 서열 또는 프로 서열, 또는 이들의 일부와 특성상 관련된 프로 서열을 사용하는 것이 바람직할 수 있다.

바람직하게, 프로 서열은 아미노산의 이염기성 쌍으로 C-말단에서 종결된다. 즉 각각은 Lys 또는 Arg이다.

전형적으로 분비 프로 서열 모티프는 알부민 분비 프로 서열 또는 아미노산의 이염기성쌍을 포함하는 변이체와 같은 이들의 변이체이며 다른 위치에서 보존적 치환만을 가지며, 일반적으로 휴먼 알부민 분비 프로 서열, 즉, N-Arg-Gly-Val-Phe-Arg-Arg-C 또는 그 변이체를 갖는다. 다른 바람직한 구현예로 프로 서열은 효모 MFα-1 분비 프로 서열, 즉, N-Ser-Leu-Asp-Lys-Arg-C 또는 알부민 프로 서열에 대해 정의한 바와 같은 그 변이체의 전체 또는 일부 서열을 포함한다.

WO 90/01063에 정의된 리더 및 휴먼 알부민 리더의 이와 상응하는 부분과 비교하여, 본 발명의 폴리펩타이드는 적어도 4 아미노산 변화, 즉 Ser-20Phe 또는 Trp 또는 Tyr; Phe-19Ile 또는 Leu 또는 Val 또는 Ala 또는 Met; Ile-18Leu 또는 Val 또는 Ala 또는 Met; 및 Leu-16Ile 또는 Val 또는 Ala 또는 Met를 가지며, 여기서 상기 기호는 예를들어 첫번째 명명된 돌연변이의 경우, 포지션 -20에서의 세린 잔기(즉, 리더 서열을 이용하여 분비되는 성숙 단백질의 N-말단에 대해 마이너스 20)는 페닐알라닌 잔기로 변화함을 의미한다. 이는 도 1에 예시된다.

바람직한 프리-프로 서열은 다음의 서열을 포함한다:

MKWVFIVSILFLFSSAYSRY¹Y²Y³Y⁴Y⁵

여기서 Y1은 Gly 또는 Ser이며, Y2는 Val 또는 Leu이며, Y3는 Phe 또는 Asp이며, Y4는 Arg 또는 Lys 이며 그리고 Y5는 Arg 또는 Lys이다.

바람직한 구현예로, Y¹은 Gly이며, Y²는 Val이며 그리고 Y³는 Phe이다. 다른 바람직한 구현예로 Y¹은 Ser이며, Y²는 Leu이며 그리고 Y³는 Asp이다.

전형적으로 Y⁴는 Arg이며 Y⁵는 Arg이다. 택일적으로 Y⁴가 Lys이며 Y⁵가 Arg인 경우가 바람직하다. 또한 택일적으로 Y⁴가 Lys이며 Y⁵는 Lys인 경우가 바람직하다. Y⁴는 또한 Arg 일 수 있으며 이때 Y⁵는 Lys이다.

특히 바람직한 구현예는 분비 프리프로 서열로서 SEQ ID NO 32의 서열을 갖는다.

N-Met-Lys-Trp-Val-Phe-Ile-Val-Ser-Ile-Leu-Phe-Leu-Phe-Ser-Ala-

Tyr-Ser-Arg-Ser-Leu-Asp-Lys-Arg-C

SEQ ID No 32

본 발명의 제2 견지로 본 발명의 제 1 견지에 의해 정의된 모티프를 암호하는 서열을 갖는 분리된 폴리뉴클레오타이드를 제공한다.

본 명세서에 사용된, 용어 "분리된"은 그 폴리뉴클레오타이드가 DNA 분자인 경우 적어도 대부분 자연적으로 발견되는 염색체로부터 분리된 것임을 의미하며, 그 폴리뉴클레오타이드가 RNA 분자인 경우 자연적으로 전사되는 본래의 세포로부터 분리된 것임을 의미하는 것을 포함한다. 즉, 자연적인 형태와 같이 이미 존재하는 형태의 폴리뉴클레오타이드는 포함되지 않는다. 따라서, 본 발명의 제 2 견지에 따른 폴리뉴클레오타이드는 플라스미드와 같은 박테리아 혹은 균류 벡터 혹은 박테리오파지와 같은 바이러스 벡터내로 클로닝되는 폴리뉴클레오타이드를 포함한다. 바람직하게 이러한 클론은 관련 염색체의 DNA 라이브러리를 구성하는 클론으로부터 분리시 존재한다.

선형 아미노산 서열은 대부분의 아미노산이 하나이상의 트리뉴클레오타이드 코돈에 의해 암호화된 디제네레이트 스탠다드 유전 암호(도 2)를 이용하여 DNA 서열내로 역전사될 수 있다.

예를들어, SEQ ID 1으로 정의된 펩타이드를 암호하는 DNA 서열은 다음과 같이 추론될 수 있다:

5'-(TTY/TGG/TAY)-(ATH/TTR 또는 CTN/GTN/GCN/ATG)-(TTR 또는 CTN/GTN/ATG)-(AGY 또는 TCN/ACN)-(ATH 또는 CTN/GTN/GCN/ATG)-3'

SEQ ID No 15

여기서 " 3' " 및 " 5' "는 실제 말단이라기 보다는 폴리뉴클레오타이드 서열의 방향을 나타내는 것으로, 즉 폴리뉴클레오타이드 서열은 다른 폴리뉴클레오타이드 서열과 한쪽 말단 혹은 양 말단에 연결될 수 있으며, 그리고 Y, R, H 및 N은 도 2에 정의한 바와 같다.

동일한 전환 방법을 이용하여 SEQ ID No 7의 폴리펩타이드를 암호하는 다음과 같은 DNA 서열이 추론될 수 있다.

5'-TTY-ATH-GTN-(TCN 또는 AGY)-ATH-3'

SEQ ID No 16

휴먼 알부민과 같은 자연적으로 발생하는 성숙 단백질을 암호하는 서열을 포함하는 폴리뉴클레오타이드 서열의 경우에, 이는 휴먼 알부민 유전자 서열과 같은 자연적으로 발생하는 암호 서열이나, 혹은 상보적 DNA 서열(cDNA) 또는 하나이상의 인트론을 포함하는 cDNA일 수 있다.

추가의 서열 변형이 또한 예를들어 암호 리전내로 도입될 수 있다. 본 발명의 폴리펩타이드를 암호하는 DNA를 변형시키는 바람직한 방법은 Saiki 등(1988) Science 239, 487-491에 개시된 바와 같은 중합효소 연쇄반응을 이용하는 것이다. 이 방법에서 효소적으로 증폭되는 DNA는 두개의 특정 올리고뉴클레오타이드 프라이머에 의해 플랭킹되고 이는 스스로 증폭되는 DNA내로 편입된다. 상기 특정 프라이머는 당해 기술분야에 알려진 방법을 이용하여 발현벡터내로 클로닝하기 위해 사용될 수 있는 제한 엔도뉴클레아제 인지부를 포함할 수 있다.

본 발명의 리더 서열을 암호하는 폴리뉴클레오타이드는 올리고뉴클레오타이드의 화학적 합성후 다른 유전학적 구조물의 요소에 접합을 통해 가장 편리하게 제조되며, 이러한 방법은 당해 기술분야에 잘 알려져 있으며 또한 하기에 보다 상세히 설명된다.

성숙 알부민을 암호하는 폴리뉴클레오타이드를 변형시키고자 하는 경우, 이는 천연 cDNA 서열로부터 출발하거나 어셈블링 합성 올리고뉴클레오타이드로부터 출발하는 특정부위 돌연변이 유발 또는 PCR 돌연변이 유발에 의해 편리하게 달성될 수 있다. 또한, 이러한 기술은 당해 기술분야에서 일반적인 것이며 하기에 보다 상세히 설명된다.

이러한 암호 서열에 대한 변형은 특정 유기체내에서 일부 고 발현되는 단백 질을 암호하는 폴리뉴클레오타이드 서열이 특정 아미노산에 대하여 다른 것보다 일부 코돈을 선호하기때문에(소위 코돈 바이어스라 칭함) 유용할 수 있다. 본 발명의 제 2 견지의 바람직한 구현예로 스탠다드 유전학적 암호는 선택된 숙주 유기체에 대한 바람직한 코돈으로 축소될 수 있다. 본 발명의 제 2 견지의 특히 바람직한 구현예로 스탠다드 유전학적 암호는 효모의 바람직한 코돈으로 축소될 수 있다(Sharp 및 Crowe(1991) Yeast 7, 657-678의 표 4 참조). 이러한 리스트의 바람직한 효모 코돈은 아스파라긴 코돈 5'-GAT-3'(도 3)을 포함함으로써 변형될 수 있다.

예를들어 SEQ ID No 1의 펩타이드 서열을 이용하여, 효모에서 이 펩타이드를 암호하는 코돈 바이어스드 DNA 서열은 다음과 같은 축소될 수 있다:

5'-(TTC/TGG/TAC)-(ATY/TTG/GTY/GCT/ATG)-

(TTG/GTY/GCT/ATG)-(TCY/ACY)-(ATY/GTY/GCT/ATG)-5'

SEQ ID No 17

이는 동일한 전환 방법을 이용하여 SEQ ID No 7의 서열을 갖는 특히 바람직한 폴리펩타이드 모티프에 대해 다음과 같은 코돈-바이어스드 디제네레이트 DNA 서열로 축소될 수 있다:

5'-TTC-ATY-GTY-TCY-ATY-3'

SEQ ID No 18

하지만 SEQ ID No. 7의 서열을 갖는 폴리펩타이드 모티프를 암호하는 가장 바람직한 코돈-바이어스드 DNA 서열은 다음과 같다:

TTCATCGTCTCCATT

SEQ ID No.34

도 2에 주어진 유전 암호 또는 의도된 숙주에 이용가능한 바람직한 코돈 바이어스 표나 도 3에 주어진 바람직한 코돈 바이어스를 이용하여 동일한 전환 방법이 부분적으로 중복되는 폴리펩타이드 서열내로 어떠한 원하는 아미노산 서열로 전환시키는데 사용될 수 있다. 이 방법에 의해 DNA 서열로 전환될 수 있는 아미노산 서열은 이에 한정하는 것은 아니지만 본 발명의 제 1 견지에 따른 폴리펩타이드로부터 취할 수 있다. 예를들어, 성숙 휴먼 알부민에 대한 암호 리전의 서열은 이러한 방식으로 유도될 수 있다. EP 308 381에는 휴먼 알부민에 대한 부분적으로 효모-코돈-최적화된 암호서열이 개시되어 있다. 본 명세서에서 SEQ ID No.20이 또한 이러한 서열이다. DNA 서열 중복성이 허용되는 경우, 유용하게 제한부위가 암호화된 아미노산 서열(또는 도 3이 사용되는 경우 코돈 바이어스)을 교란하지않고 도메인 및 서브-도메인 경계에 도입될 수 있다.

나머지 DNA 서열 중복성은 소멸될 수 있으며 다른 코돈의 출현수는 중복 DNA 서열로 각 아미노산에 대해 균등해진다. 유용하게, 적절한 전사 종결자 서열을 나타내는 DNA 서열은 디제네레이트 코돈의 DNA 서열 중복성을 이용함으로써 적절하게 제거 혹은 감소될 수 있다. 결국 중복 DNA 서열을 갖는 아미노산에 대한 택일적 코돈의 균형은 앞선 변형과 상반됨이 없이 재-균등화될 수 있다.

본 발명의 제 2 견지에 따른 폴리뉴클레오타이드는 5' 및/또는 3' 말단에서 하나 또는 그 이상의 다른 뉴클레오타이드와 직접 혹은 간접적으로 융합되어 예를들어 완전한 유전자 혹은 발현 벡터를 형성할 수 있다. 따라서, 발현 벡터는 또한 바람직하게 전사 개시 및 종결을 위한 부위를 포함할 수 있으며 전사 리전에 번역 개시를 위한 리보솜 바인딩 부위를 포함할 수 있다(Hasting 등, WO 98/16643, 1998. 4. 23. 공개).

따라서, 본 발명의 제 2 견지로 본 발명의 제 1 견지에 따른 폴리펩타이드를 암호하는 DNA 서열(특히 원하는 단백질이 알부민인 경우), 또는 이들의 변이체나 프레그먼트를 갖는 이종성 단백질을 암호하는 DNA의 인접 혹은 비인점 융합체인 DNA 서열을 포함하는 폴리뉴클레오타이드를 포함한다. 이와 관련하여 용어 "이종성 단백질"은 그것이 "원하는 단백질"과 동일하지 않은, 즉 호모다이머를 형성하지 않는 것을 의미한다.

따라서, 상기 폴리뉴클레오타이드는 5' 말단에서 프로모터(RNA 중합효소의 바인딩이 일어나고 전사가 일어나는 DNA 서열에 의해 형성되는 발현 조절 요소)에 및/또는 3' 말단에서 번역 종결 서열과 같은 다른 조절 서열에 직접 혹은 간접적으로 융합될 수 있다. 따라서 폴리뉴클레오타이드는 하나 또는 그 이상의 조절 리전, 일반적으로 전사 조절 리전에 실시가능하게 연결될 수 있다. "실시가능하게 연결" 이란 폴리뉴클레오타이드 서열에 영향을 끼칠 수 있는 식으로 조절 리전이 연결되는 것을 의미한다. 사용하려는 조절 리전의 선택은 예상되는 숙주(즉, 의도되는 발현 시스템)에 따라 일부 달라질 것이며 바람직한 서열의 선택은 당해 기술분야의 숙련자에게 알려진 것일 것이다.

예를들어, 재조합 박테리오파지, 플라스미드 또는 코스미드 DNA 발현 벡터로 형질변형된 박테리아(예, 바실러스 서브틸리스(Bacillus subtilis) 또는 에스케리차 콜라이(Escherichia coli)); 예를들어, 효모 발현 벡터로 형질변형된 효모(예, 사카로미세스 세레비지아에(Saccharomyces cerevisiae) 또는 피치아 파스토리스(Pichia pastoris)); 예를들어 바이러스 발현벡터(예, 배큘로바이러스)로 형질변형된 곤충 세포 시스템; 예를들어 바이러스 또는 박테리아 발현 벡터로 형질변형된 식물 세포 시스템; 예를들어, 아데노바이러스 발현 벡터로 형질변형된 세포 배양물, 유전자도입 혹은 유전자 치료의 동물 세포 시스템을 이용하는 시스템을 포함하는 다수의 발현 시스템이 알려져 있다. 숙주 세포는 바람직하게 효모이다(가장 바람직하게는 S. 세레비지아에(S. cerevisiae)와 같은 사카로미세스(Saccharomyces) 종 혹은 P. 파스토리스(P. pastoris)와 같은 피치아(Pichia) 종이다).

따라서, 본 발명의 제 3 견지로 본 발명의 제 2 견지에 따른 폴리뉴클레오타이드로 형질변형된 숙주세포가 제공된다. 상기 숙주 세포는 원핵 혹은 진핵성일 수 있다. 박테리아 세포가 바람직한 숙주 세포이며, 특히 바실러스(Bacillus) 및 에스 케리챠(Escherichia)의 일부 종과 같이 단백질을 분비할 수 있는 것이 바람직하다. 바람직한 진핵 숙주세포는 식물, 균류, 효모 및 동물 세포, 바람직하게 척추동물 세포, 보다 바람직하게 마우스, 래트, 소, 양, 염소, 돼지, 버팔로, 야크, 말 또는 다른 길들여진 동물, 원숭이나 사람과 같은 포유류의 세포를 포함한다. 적절한 휴먼 세포는 휴먼 섬유아세포 세포주의 세포를 포함한다. 따라서 숙주세포는 원위치에서의(in situ) 포유류 유전자도입 세포일 수 있으며, 따라서 유전자 치료법의 결과물이거나 유전자도입 개체의 생성의 결과물일 수 있다. 후자의 경우에 있어서 개체는 논-휴먼 포유류인 것이 바람직하다.

박테리아 숙주의 예시적 속은 이.콜라이(E.coli) 및 바실러스 서브틸리스(Bacillus subtilis)를 포함한다.

식물 숙주의 예시적 속은 종자식물, 양치식물(예, 양치류, 클럽모세스, 쇄뜨기), 선태류 식물(예, 우산이끼 및 이끼유), 및 조류를 포함한다. 전형적으로 상기 식물 숙주 세포는 다세포성 식물, 일반적으로 나자식물 또는 피자식물과 같은 종자식물로부터 유도될 것이다. 적절한 나자식물은 구과식물(예, 소나무, 낙엽송, 전나무 및 삼나무), 소철류, 서양주목 및 진코스를 포함한다. 보다 전형적으로 상기 식물 숙주세포는 피자식물의 세포이며, 이는 단자엽식물 또는 쌍자엽식물일 수 있으며, 바람직하게 재배 식물이다. 바람직한 단자엽식물은 옥수수, 밀, 보리, 수수, 양파, 귀리, 오리새 및 다른 푸이데아에(Pooideae)를 포함한다. 바람직한 쌍자엽 재배식물은 토마토, 감자, 사탕무, 카사바, 겨자과 재배식물(오일시드 유채 포함), 린시드, 담배, 해바라기, 면과 같은 섬유 재배식물, 및 완두, 콩, 특히 대두, 및 자주개나리와 같은 콩과 식물을 포함한다. 숙주세포는 따라서 예를들어 단세포성 식물의 세포 혹은 세포 배양시 유지되는 세포와 같은 자발성 세포일 수 있으며, 또는 다세포성 식물의 원위치 세포일 수 있다. 따라서 본 발명은 바람직하게 안정하고 유전성의 유전자도입 표현형을 보유하는 완전 유전자도입 식물의 생산을 예견한다.

균류 숙주의 예시적 속은 아스퍼질러스(Aspergillus)(예, A. 나이거(A. niger) 및 A. 오리자에(A. oryzae)), 스트렙토미세스(Streptomyces), 페니실리움(Penicillium) 및 효모를 포함한다. 본 발명의 시행시 유용할 것으로 예견되는 효모의 예시적 속은 피치아(Pichia)(한세눌라(Hansenula)), 사카로미세스(Saccharomyces), 클루이베로미세스(Kluyveromyces), 칸디다(Candida), 토룰롭시스(Torulopsis), 토룰라스포라(Torulaspora), 쉬조사카로미세스(Schizosaccharomyces), 시테로미세스(Citeromyces), 파치솔렌(Pachysolen), 데바로미세스(Debaromyces), 메천니코위아(Metschunikowia), 로도스포리디움(Rhodosporidium), 루코스포리디움(Leucosporidium), 보트리오아스커스(Botryoascus), 스포리디오볼러스(Sporidiobolus), 엔도미콥시스(Endomycopsis) 등이다. 바람직한 속은 피치아(Pichia)(한세눌라(Hansenula)), 사카로미세스(Saccharomyces), 클루이베로미세스(Kluyveromyces) 및 야로위아(Yarrowia)로 구성 되는 그룹으로부터 선택된 것들이다. 클루이베로미세스 종의 예는 K. 프라질리스(K. fragilis) 및 K. 락티스(K. lactis)이다. 피치아(Pichia)(한세눌라(Hansenula))의 예는 P. 파스토리스(P. pastoris), P. 아노말라(P. anomala) 및 P. 캡슐라타(P. capsulata)이다. Y. 리포리티카(Y. lipolytica)는 적절한 야로위아(Yarrowia) 종의 예이다. 효모 숙주세포는 YPH499, YPH500 및 YPH501을 포함하며, 이는 일반적으로 Stratagene Cloning Systems, La Jolla, CA 92037, USA로 부터 이용가능하다.

바람직한 포유류 숙주세포는 ATCC로부터 CCL61로 이용가능한 차이니즈 햄스터 난소(CHO) 세포, ATCC로부터 CRL 1658로 이용가능한 NIH 스위스 마우스 배세포 NIH/3T3, 및 ATCC로부터 CRL 1650으로 이용가능한 원숭이 신장-유래 COS-1 세포를 포함한다. 바람직한 곤충세포는 배큘로바이러스 발현 벡터로 형질감염될 수 있는 Sf9 세포이다.

상기한 바와 같이, 폴리뉴클레오타이드 조절 리전의 선택은 의도된 숙주의 특성에 따라 일부 달라질 것이다.

박테리아 숙주세포에 사용되기에 적절한 프로모터는 이. 콜라이(E. coli) lacI 및 lacZ 프로모터, T3 및 T7 프로모터, gpt 프로모터, 파지 λPR 및 PL 프로모터, phoA 프로모터 및 trp 프로모터를 포함한다. 예시적인 박테리아 숙주와 호환 가능한 프로모터 서열은 전형적으로 본 발명의 DNA 세그먼트 삽입에 편리한 제한 부위를 포함하는 플라스미드 벡터로 제공된다.

진핵 프로모터는 CMV 즉시 초기 프로모터, HSV 티미딘 키나아제 프로모터, 초기 및 후기 SV40 프로모터 및 레트로바이러스의 LTRs의 프로모터를 포함한다. 당해 기술분야의 숙련자에게는 다른 적절한 프로모터가 알려져 있다.

S. 세레비지아에(S. cerevisiae)에 대한 적절한 프로모터는 PGK1 유전자, GAL1 또는 GAL10 유전자, CYC1, PHO5, TRP1, ADH1, ADH2, 글리세르알데히드-3-포스페이트 탈수효소, 헥소키나아제, 피루베이트 탈카르복시화 효소, 포스포프룩토키나아제, 트리오스 포스페이트 이소메라아제, 포스포글루코즈 이소메라아제, 글루코키나아제, α-메이팅 팩터 페로몬, a-메이팅 팩터 페로몬, PRB1 프로모터, GPD1 프로모터, 및 5' 조절 리전의 일부와 다른 프로모터의 5' 조절 리전의 일부 또는 업스트림 활성 부위(예, EP-A-258 067의 프로모터)의 하이브리드에 관련된 하이브리드 프로모터에 대한 유전자와 관련된 것들을 포함한다.

다른 적절한 숙주세포인 쉬조사카로미세스 폼브(Schizosaccharomyces pombe)에 사용되는 편리한 조절가능 프로모터는 Maundrell(1990) J. Biol. Chem. 265, 10857-10864에 기술된 nmt 유전자의 티아민-억제 프로모터 및 Hoffman & Winston(1990) Genetics 124, 807-816에 기술된 글루코즈-억제 fbp1 유전자 프로모 터이다.

피치아(Pichia)에 대한 적절한 프로모터, 형질변형 방법 및 배양 조건은 US 5 986 062에 기재되어 있다. 예를들어, HSA-생성 숙주(또는 HSA-생성 스트레인)의 제조는 재조합 플라스미드가 염색제내로 도입되는 방법(EP-A-399455에 대응하는 JP-A-3-72889), HSA가 효모에서 발현되는 방법(EP-A-123544에 대응하는 JP-A-60-41487, EP-A-248657에 대응하는 JP-A-63-39576 및 EP-A-251744에 대응하는 JP-A-63-74493) 및 HSA가 피치아(Pichia)에서 발현되는 방법(EP-A-344459에 대응하는 JP-A-2-104290)을 이용하여 이루어질 수 있다. HSA-생성 숙주의 배양(HSA 생성방법)은 US 5,986,062에서와 같이 예를들어 JP-A-3-83959 또는 JP-A-4-293495(EP-A-504823에 대응)에 개시된 방법에 따른 공지방법을 이용하여 수행될 수 있다. 형질변형된 숙주를 배양하기위한 배지는 US 5,986,062에 따라 제조될 수 있으며 숙주의 배양은 US 5,986,062의 설명에 따라 고정 혹은 교반 배양 혹은 배치, 세미-배치 혹은 교반하에서의 연속 배양 및 에어레이션의 수단에 의해 바람직하게 15-43℃(보다 바람직하게 20-30℃)에서 1-1,000시간동안 수행될 수 있다.

적절한 전사 종결 신호는 이 분야에 잘 알려져 있다. 숙주세포가 진핵인 경우, 전사 종결 신호는 바람직하게 진핵 유전자의 3'플랭킹 서열로부터 유도되며, 이는 전사 종결 및 폴리아데닐화에 적절한 신호를 포함한다. 적절한 3' 플랭킹 서열은 예를들어, 사용된 발현 조절 서열에 자연적으로 연결되는 유전자의 것일 수 있는 것으로, 즉 그 프로모터에 상응할 수 있다. 택일적으로, 이들은 다를 수 있다. 이러한 경우, 그 숙주가 효모, 바람직하게 S. 세레비지아에(S. cerevisiae)이며, S. 세레비지아에(S. cerevisiae) ADH1 유전자의 종결 신호가 바람직하다.

따라서 본 발명의 제 2 견지에 따른 폴리뉴클레오타이드는 상기한 바와 같은 방법을 이용하여 어떠한 원하는 숙주에 대해 개발될 수 있다.

성숙 휴먼 알부민을 암호하는 DNA 서열은 네이티브 유전자, cDNA 또는 상기한 바와 같은 하나 또는 그 이상의 인트론을 포함하는 cDNA와 상기한 방법에 의해 유도된 코돈 바이어스드 휴먼 알부민 DNA 서열사이의 DNA 융합으로부터 개발될 수 있다.

SEQ ID No 19는 번역 개시 부위에 대한 5'에 22 뉴클레오타이드를 포함하는 폴리뉴클레오타이드 서열이며, 바람직하게 분비 리더 서열 SEQ ID No.32 및 성숙 휴먼 알부민 암호 리전 SEQ ID No 20에 대한 폴리뉴클레오타이드를 암호하는 서열이다. 상기 암호 서열은 번역 종결 코돈으로 끝난다. 전형적으로, 이는 TGA, TAG 또는 TAA이나, 효모에서 TAA가 가장 효과적이다. 바람직하게, 추가의 번역 종결 코돈(바람직하게 모두 TAA이다)은 일반적으로 하나 또는 두개가 포함되며, 바람직하게 서로 인접하거나 각 종결코돈쌍 사이에 3개 이하의 염기쌍을 갖는다. SEQ ID No 19는 적절한 클로닝 자리에 의해 양 말단에 플랭킹된다.

본 발명의 제 2 견지의 폴리뉴클레오타이드는 또한 적절한 숙주내로의 도입을 위한 광범위하게 다양한 다른 DNA 서열에 연결될 수 있다. 이러한 동반 서열(들)은 숙주의 성숙, 폴리뉴클레오타이드의 숙주내로 도입 방식 및 에피좀 유지 혹은 통합이 원하여지는지에 따라 달라질 것이다. 예를들어, 상기 벡터는 다른, 비-원핵 세포 타입에서 발현되는데 사용되더라도 원핵세포에서의 증식을 위해 Col E1 ori와 같은 원핵 레플리콘을 포함할 수 있다.

일반적으로, 본 발명의 제 2 견지에 따른 폴리뉴클레오타이드는 적절한 방향으로 그리고 발현을 위해 올바른 리딩 프래임으로 플라스미드와 같은 발현 벡터내로 삽입된다.

따라서, 상기 폴리뉴클레오타이드는 본 명세서에 포함된 가르침의 견지로 적절히 변형된 공지 기술에 따라 이에 한정하는 것은 아니나 통합 벡터, 센트로머릭 벡터 및 에피좀 벡터를 포함하는 발현 벡터를 구성하는데 이용될 수 있다.

따라서 본 발명의 제 2 견지의 일 구현예로 상기 폴리뉴클레오타이드는 벡터이다.

전형적인 원핵 벡터 플라스미드는 pUC18, pUC19, pBR322 및 pBR329(Biorad Laboratories, Richmond, CA, USA); pTrc99A, pKK223-3, pKK233-3, pDR540 및 pRIT5(Pharmacia, Piscataway, NJ, USA); pBS 벡터, 파지스크립트 벡터, 블루스크립트 벡터, pNH8A, pNH16A, pNH18a, pNH46A(Stratagene Cloning Systems(La Jolla, CA 92037, USA)이다.

전형적인 포유류 세포 벡터 플라스미드는 Pharmacia(Piscataway, NJ, USA)로 부터 이용가능한 pSVL이다. 이 벡터는 클로닝된 유전자의 발현을 유도하기 위해 SV40 레이트 프로모터를 사용하며, 최고 수준의 발현은 COS-1 세포와 같은 T 항원-생성 세포에서 발견된다. 유도가능한 포유류 발현벡터의 예는 pMSG이며, 이 역시 Pharmacia(Piscataway, NJ, USA)로부터 이용가능하다. 이 벡터는 마우스 유방 종양 바이러스 LTR(long terminal repeat)의 글루코코르티코이드-유도성 프로모터를 사용하여 클로닝된 유전자의 발현을 유도한다.

유용한 효모 에피좀 플라스미드 벡터는 일반적으로 Stratagene Cloning Systems(La Jolla, CA 92037, USA)로부터 이용가능한 pRS403-406 및 pRS413-416, YEp24(Botstein, D., 등(1979) Gene 8, 17-24), 및 YEplac122, YEplac195 및 YEplac181(Gietz, R.D. 및 Sugino. A. (1988) Gene 74, 527-534)이다. 다른 효모 플라스미드는 WO 90/01063 및 EP 424 117에 기술되어 있으며 또한 EP-A-286 424의 디스인테그레이션 벡터를 포함한다. 플라스미드 pRS403, pRS404, pRS405 및 pRS406은 효모 인터그레이팅 플라스미드(YIps)이며 YIplac204, YIplac211 및 YIplac128(Gietz, R.D. 및 Sugino. A.(1988) Gene 74, 527-534)와 같이 효모 선별 마커 HIS3, TRP1, LEU2 및 URA3를 통합한다. 플라스미드 pRS413-416은 YCplac22, YCplac33 및 YCplac111(Gietz, R.D. 및 Sugino. A. (1988) Gene 74, 527-534)와 같이 효모 동원체 플라스미드(YCps)이다.

당해 기술분야의 숙련자에게 잘 알려진 방법을 사용하여 암호 서열 및 예를들어 적절한 전사 혹은 번역 조절 서열을 포함하는 발현 벡터를 제조할 수 있다. 이러한 한 방법은 부착성 말단을 통한 라이게이션을 포함한다. 호환가능한 부착성 말단은 적절한 제한효소의 작용에 의해 DNA 프레그먼트 및 벡터에 생겨날 수 있다. 이러한 말단은 상보적 염기쌍 형성을 통해 신속히 어닐링될 것이며 잔존하는 닉은 DNA 라이게이즈의 작용에 의해 차단될 수 있다.

다른 방법으로 합성 이중 스트랜드 올리고뉴클레오타이드 연결기 및 접속기를 사용한다. 블런트 말단을 갖는 DNA 프레그먼트는 3'말단을 밀어내고 우묵한 3'말단에 채우는 박테리오파지 T4 DNA 중합효소 혹은 이.콜라이(E.coli) DNA 중합효소 I에 의해 생성된다. 정의된 제한효소에 대한 인지 서열을 포함하는 합성 연결기 및 블런트-말단 이중-가닥 DNA의 조각은 T4 라이게이즈에 의해 블런트-말단 DNA 프레그먼트에 결찰될 수 있다. 이들은 후속적으로 적절한 제한효소로 다이제스팅되어 부착성 말단을 생성하고 호환성 말단을 갖는 발현벡터에 결찰된다. 접속기는 또한 결찰에 사용되는 하나의 블런트 말단을 포함하지만 또한 하나의 미리 형성된 부착 성 말단을 갖는 화학적으로 합성된 DNA 프레그먼트이다. 택일적으로 DNA 프레그먼트나 DNA 프레그먼트들은 임의로 부착성 말단을 갖는 하나 또는 그 이상의 합성 이중 스트랜드 올리고뉴클레오타이드의 존재 혹은 부재하에 DNA 라이게이즈의 작용에 의해 함께 결찰될 수 있다.

여러가지의 제한 엔도뉴클레아제 자리를 갖는 합성 연결기는 Sigma-Genosys Ltd, London Road, Pampisford, Cambridge, United Kingdom을 포함하는 다수의 공급원으로부터 상업적으로 이용가능하다.

본 발명의 벡터는 따라서 본 발명의 제 1 견지에서 정의된 바와 같은 서열을 포함하는 폴리펩타이드의 발현 및 생성을 위해 적절한 숙주세포를 형질변형시키기위해 사용될 수 있다. 이러한 기술은 미국 특허 제 4,440,859(1984.4.3, Rutter 등), 4,530,901(1985.7.23, Weissman), 4,582,800(1986.4.15, Crowl), 4,677,063(1987.6.30, Mark 등), 4,678,751(1987.7.7, Goeddel), 4,704,362(1987.11.3, Itakura 등), 4,710,463(1987.12.1, Murray), 4,757,006(1988.7.12, Toole, Jr. 등), 4,766,075(1988.8.23, Goeddel 등) 및 4,810,648(1989.3.7, Stalker)에 기재된 것들을 포함한다.

본 발명의 DNA 구조물을 이용한 적절한 세포 숙주의 형질변형은 잘 알려진 방법에 의해 수행되며 그 방법은 전형적으로 사용되는 벡터의 타입에 따라 달라진 다. 원핵 숙주 세포의 형질변형과 관련하여, 예를들어 Cohen 등(1972) Proc. Natl. Acad. Sci. USA 69, 2110 및 Sambrook 등(2001) Molecular Cloning, A Laboratory Manual, 3rd Ed. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY을 참조바란다. 효모 세포의 형질변형은 Sherman 등(1986) Methods In Yeast Genetics, A Laboratory Manual, Cold Spring Harbor, NY에 기재되어 있다. Beggs(1978) Nature 275, 104-109의 방법이 또한 유용하다. S. 세레비지아에(S. cerevisiae)의 형질변형을 위한 방법은 일반적으로 EP 251 744, EP 258 067 및 WO 90/01063에 가르쳐져 있다. 척추동물 세포와 관련하여, 이러한 세포를 형질감염시키는데 유용한 시약들, 예를들어 칼슘 포스페이트 및 DEAE-덱스트란 또는 리포좀 배합물은 Stratagene Cloning Systems, 또는 Life Technologies Inc., Gaithersburg, MD 20877, USA로부터 이용가능하다.

세포를 형질변형시키는데 일렉트로포레이션이 또한 유용하며 이는 효모 세포, 박테리아 세포 및 척추동물 세포를 형질변형시키는 기술분야에 잘 알려져 있다. 일렉트로포레이션에 의한 효모의 형질변형 방법은 Becker & Guarente(1990) Methods Enzymol. 194, 182에 기술되어 있다.

DNA를 동물 및 식물 세포내로 도입시키기위해 물리적 방법이 사용될 수 있다. 예를들어, 마이크로주입은 매우 미세한 파이펫을 이용하여 DNA 분자를 직접 형질변형되어지는 세포의 핵내로 주입한다. 다른 예는 고-속 마이크로추진체, 일반적 으로 DNA로 코팅된 금 또는 텅스텐 입자를 이용한 세포의 충격을 포함한다.

식물은 다수의 공지 방법으로 형질변형될 수 있다. 당해 기술분야의 숙련자는 형질변형을 위해 표적되는 식물의 타입에 따라 그 방법의 선택을 적절히 할 것이다. 식물을 형질변형시키는 적절한 방법의 예는 마이크로주입(Crossway 등, BioTechniques 4:320-334(1986)), 일렉트로포레이션(Riggs 등, Proc. Natl. Acad. Sci. USA 83:5602-5606(1986), 아그로박테리움(Agrobacterium)-매개 형질변형(Hinchee 등, Biotechnology 6:915-921(1988); 옥수수 형질변형에 관해서는 Ishida 등, Nature Biotechnology 14:745-750(1996)을 또한 참조바람), 직접 유전자 전달(Paszkowski 등, EMBO J. 3:2717-2722(1984); Hayashimoto 등, Plant Physiol. 93:857-863(1990)(벼)), 및 Agracetus, Inc., Madison, Wisconsin and Dupont, Inc., Wilmington, Delaware로 부터 이용가능한 장치를 이용한 탄도성 입자 촉진(참조 예, Sanford 등, 미국 특허 4,945,050; 및 McCabe 등, Biotechnology 6:923-926(1988))을 포함한다. 또한, Weissinger 등, Annual Rev. Genet. 22:421-477(1988); Sanford 등, Particulate Science and Technology 5:27-37 91987)(양파); Svab 등, Proc. Natl. Acad. Sci. USA 87:8526-8530(1990)(담배 엽록체); Christou 등, Plant Physiol. 87:671-674(1988)(대두); McCabe 등, Bio/Technology 6:923-926(1988)(대두); Klein 등, Proc. Natl. Acad. Sci. USA, 85:4305-4309(1988)(옥수수); Klein 등, Bio/Technology 6:559-563(1988)(옥수수); Fromm 등, Bio/Technology 8:833-839(1990); 및 Gordon-Kamm 등, Plant Cell 2: 603- 618(1990)(옥수수); Koziel 등, Biotechnology 11:194-200(1993)(옥수수); Shimamoto 등, Nature 338:274-277(1989)(벼); Christou 등, Biotechnology 9:957-962(1991)(벼); Datta 등, Bio/Technology 8:736-740(1990)(벼); 유럽특허출원 EP-A-332 581(오차드그라스 및 다른 푸이데아); Vasil 등, Biotechnology 11:1553-1558(1993)(밀); Weeks 등, Plant Physiol. 102:1077-1084(1993)(밀); Wan 등, Plant Physiol. 104:37-48(1994)(보리); Umbeck 등, Bio/Technology 5:263-266(1987)(면); Casas 등, Proc. Natl. Acad. Sci. USA 90: 11212-11216(1993)(사탕수수); Somers 등, Bio/Technology 10:1589-1594(1992)(보리); Torbert 등, Plant Cell Reports 14:635-640(1995)(보리); Weeks 등, Plant Physiol. 102.1077-1084(1993)(밀); Chang 등, WO 94/13822(밀) 및 Nehra 등, The Plant Journal 5:285-297(1994)(밀)을 참조바람. 아그로박테리움-매개 형질변형은 일반적으로 단자엽 식물에 비효과적이며 상기 언급한 다른 방법이 바람직하다.

일반적으로, 상기 벡터는 모든 숙주를 형질변형시키지 않으며 따라서 형질변형된 숙주세포에 대한 선별이 필요할 것이다. 선별 기술은 형질변형된 세포에서 선별가능한 특성에 대해 암호하는 어떠한 필요 조절 요소와 함께 발현벡터내로 DNA 서열 마커를 편입시키는 것을 포함한다. 이러한 마커는 진핵 세포 배양시 디하이드로폴레이트 환원효소, G418 또는 네오마이신 저항성 유전자를, 그리고 이.콜라이(E.coli) 및 다른 박테리아에서 배양시 테트라사이클린, 가나마이신 또는 앰피실린 저항성 유전자를 포함한다. 택일적으로, 이러한 선별가능한 특성에 대한 유전자는 원하는 숙주세포를 동시 형질변형하는데 사용되는 또 다른 벡터에 존재할 수 있다.

마커 유전자는 형질변형체를 확인하는데 사용될 수 있지만 어느 세포가 재조합 DNA 분자를 함유하는지 그리고 어느 세포가 자가-결찰된 벡터 분자를 함유하는지 조사하는 것이 바람직하다. 이는 DNA 프레그먼트의 삽입이 그 분자에 존재하는 유전자중 하나의 본래모습을 파괴하는 클로닝 벡터를 이용하여 달성될 수 있다. 재조합체는 따라서 그 유전자의 기능상실에 기인하여 확인될 수 있다.

성공적으로 형질변형된 세포를 확인하는 다른 방법은 본 발명의 발현 구조물의 도입으로 얻어지는 세포를 성장시켜 본 발명의 폴리펩타이드를 생성하는 것을 포함한다. 세포는 배양될 수 있으며 용혈되어 Southern(1975) J. Mol. Biol.98, 503 또는 Berent 등(1985) Biotech. 3, 208에 기술된 바와 같은 방법을 이용하여 그 DNA의 존재에 대해 DNA 내용물을 조사할 수 있다. 택일적으로, 형질변형된 세포 배양물의 상층액내에 그 성숙 단백질의 존재는 항체를 이용하여 검출될 수 있다.

재조합 DNA의 존재에 대하여 직접적으로 조사하는 것에 부가적으로, 성공적인 형질변형은 그 재조합 DNA가 그 단백질 발현을 지시할 수 있는 경우 잘 알려진 면역학적 방법에 의해 확인될 수 있다. 예를들어, 발현 벡터로 성공적으로 형질변형된 세포는 적절한 항원성을 나타내는 단백질을 생성한다. 형질변형되는 것으로 예측되는 세포의 시료를 수확하고 적절한 항체를 이용하여 단백질에 대해 평가된 다.

따라서, 형질변형된 숙주세포 자체에 부가적으로, 본 발명은 또한 이러한 세포의 배양물, 바람직하게 모노클로날(클론적으로 동종성) 배양물, 또는 배지에서 모노클로날 배양물로부터 유도된 배양물에 관한 것이다.

따라서, 본 발명의 제 4 견지로 본 발명의 제 3 견지에 따른 세포 및 배지를 포함하는 세포 배양물이 제공된다. 전형적으로 배지는 발현 시스템내에 본 발명의 제 1 견지에 따른 폴리펩타이드의 발현으로부터 그리고 일반적으로 프리 및/또는 프로 서열의 제거와 같은 추가 번역 공정에 의해 얻어지는 성숙 폴리펩타이드를 포함할 것이다.

이. 콜라이(E.coli)와 같은 원핵 숙주세포, 및 포유류 세포와 같은 진핵 숙주세포를 배양하는 방법은 당해 기술분야에 잘 알려져 있다. 효모 배양법은 일반적으로 EP 330 451 및 EP 361 991에 가르쳐져 있다.

본 발명의 재조합 DNA에 의해 형질변형된 숙주세포를 충분한 시간동안 그리고 본 명세서에 기술한 가르침의 견지로 당해 기술분야의 숙련자에게 알려진 적절한 조건하에서 배양함으로써 본 발명의 제 1 견지에 따른 폴리펩타이드의 발현이 이루어진다. 이렇게 형성된 폴리펩타이드는 또한 그 프리 및/또는 프로 서열이 제 거되도록 숙주세포에 의해 더욱 공정될 수 있다. 따라서 "성숙"된 원하는 단백질은 본래 번역된 것과 다를 수 있다.

따라서 본 발명은 제 5 견지로서 상기 정의된 바와 같은 성숙된 원하는 단백질을 생성하는 방법을 제공한다. 상기 방법은 본 발명의 제 1 견지에서 정의된 바와 같은 폴리펩타이드의 발현 결과로서 세포가 성숙된 원하는 단백질을 분비하고 이는 주변세포질 공간, 배지 혹은 두가지 모두에 그 분비물이 축적되는, 바람직하게는 배지내로 축적되는, 배지에서 본 발명의 제 3 견지에 따른 세포를 배양하는 단계를 포함한다. 분비되는 원하는 단백질을 포함하는 배지는 그 다음 세포 배지에서 세포로부터 분리될 수 있다. 상기 세포 벽과 관련된 분비 단백질은 일반적으로 삼투 지지(예, 소르비톨) 조건하에서 용균 효소를 이용하여 해리된다(분비 단백질이 선택적으로 서서히 방출된다). 참조 Elango 등, J. Biol. Chem. 257: 1398-1400(1982). 이 목적에 적절한 용해 효소의 예는 리티카아제, Zymolyase-60,000 및 Glusulase를 포함하며 모두 상업적으로 이용가능하며, 예를들어 후자의 두 경우는 각각 Seikagaku Kogyo 또는 Kirin Brewery, 및 Boehringer Mannheim으로부터 이용가능하다.

바람직하게, 배지 분리후 성숙된 원하는 단백질은 그 배지로부터 분리된다. 보다 바람직하게, 이와 같이 얻어딘 성숙된 원하는 단백질은 더욱 정제된다.

원하는 성숙 단백질은 당해 기술분야에 알려진 다수 방법에 의해 배지로부터 추출될 수 있다. 예를들어 재조합 발현 알부민의 회수에 대한 정제기술은 매트릭스-유래 염색물질의 분리에 대해서는 WO 92/04367에, 효모-유래 착색물질의 분리에 대해서는 EP 464 590에, 알부민의 알칼리 침전 및 친유성 상으로의 후속적 적용에 대해서는 EP 319 067에, 그리고 완전 정제 공정에 대해서는 WO 96/37515, US 5 728 553 및 WO 00/44772에 기술되어 있다. 본 발명의 변형된 리더 서열은 본질적으로 그 성숙 단백질에 영향을 주지 않기때문에, 알부민외에 다른 단백질은 그러한 단백질을 정제하는데 유용한 것으로 발견되는 어떠한 기술에 의해 배지로부터 정제될 수 있다.

이와 같이 잘 알려진 방법은 암모늄 설페이트 또는 에탄올 침전, 산 추출, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀룰로즈 크로마토그래피, 소수성 상호작용 크로마토그래피, 친화성 크로마토그래피, 하이드록실아파타이트 크로마토그래피 및 렉틴 크로마토그래피를 포함한다. 가장 바람직하게, 고성능 액체 크로마토그래피("HPLC")가 정제용으로 사용된다.

그 결과물인 단백질은 어떠한 알려진 용도에 사용될 수 있으며, 알부민의 경우에 심한 화상, 쇼크 및 출혈을 치료하기위한 환자에 정맥 주사, 배지 보충, 및 다른 단백질 배합물에 부형제로 사용되는 것을 포함한다.

본 발명의 방법에 의해 얻어진 치료학적으로 유용한 원하는 단백질을 단독으로 투여하는 것이 가능하지만, 하나 또는 그 이상의 허용가능한 캐리어나 희석제와 함께 약학 배합물로서 존재하는 것이 바람직하다. 캐리어(들) 또는 희석제(들)는 원하는 단백질과 혼화적인 의미로 "허용가능"해야 하며 그 수용자에게 악영향을 주지 않아야 한다. 전형적으로, 캐리어 또는 희석제는 멸균되고 발열원이 없는 물이나 염수일 것이다.

따라서, 본 발명의 제 6 견지는 본 발명의 제 5 견지에 따른 방법에 의해 얻어진 원하는 단백질이 치료학적으로 허용가능한 캐리어 또는 희석제와 함께 배합되어 사람 또는 동물에 투여용으로 적합한 치료 생성물을 생성하는 방법을 제공한다.

치료 생성물은 편의상 단위 투여 형태로 존재할 수 있으며 제약기술에 잘 알려진 어떠한 방법에 의해 제조될 수 있다. 바람직한 단위 투여 생성물은 활성 성분의 일일 투여량 혹은 단위, 일일 이하의 투여량 또는 그 적절한 분획을 포함하는 것들이다.

특정적으로 상술한 성분들에 부가적으로 치료 생성물은 의심중에 있는 생성물 타입과 관련되어 당해 기술분야에서 통상적인 다른 약제를 포함할 수 있는 것으로 이해되어야 한다.

본 발명은 하기 비-제한적인 도면 및 실시예를 참고로 보다 상세히 설명될 것이다.

도 1은 천연 HSA 리더(프리 및 프로 리전 함유)(첫번째 줄)와 WO 90/01063에 개시된 융합 HSA/MFα-1 리더 서열(두번째 줄) 및 본 발명의 바람직한 변형된 리더 서열(세번째 줄)의 비교를 나타낸다.

도 2는 표준 유전학적 암호를 나타낸다.

도 3은 바람직한 S. 세레베지아에(S. cerevisiae) 코돈의 변형된 리스트를 나타낸다.

도 4는 pAYE438의 플라스미드 맵을 나타낸다.

도 5는 pAYE441의 플라스미드 맵을 나타낸다.

도 6은 pAYE309의 플라스미드 맵을 나타낸다.

도 7은 pAYE467의 플라스미드 맵을 나타낸다.

도 8은 pAYE443의 플라스미드 맵을 나타낸다.

도 9는 pAYE653의 플라스미드 맵을 나타낸다.

도 10은 pAYE655의 플라스미드 맵을 나타낸다.

도 11은 pAYE639의 플라스미드 맵을 나타낸다.

도 12는 pAYE439의 플라스미드 맵을 나타낸다.

도 13은 pAYE466의 플라스미드 맵을 나타낸다.

도 14는 pAYE640의 플라스미드 맵을 나타낸다.

도 15는 pAYE638 및 pAYE642의 플라스미드 맵을 나타낸다.

도 16은 pAYE643의 플라스미드 맵을 나타낸다.

도 17은 pAYE645의 플라스미드 맵을 나타낸다.

도 18은 pAYE646의 플라스미드 맵을 나타낸다.

도 19는 pAYE647의 플라스미드 맵을 나타낸다.

도 20은 로켓 면역전기영동에 의한 rHA 생성능 분석을 나타낸다. 효모는 YEP, 2%(w/v) 수크로즈 또는 B/MM, 2%(w/v) 수크로즈에서 72시간동안 200rpm, 30℃에서 배양되었다. 정량화는 HSA 스탠다드를 기준으로 하여 수행되었다(mg.L^-1).

도 21은 고 세포 밀도 발효시 알부민 생성능을 나타낸다. *휴먼 알부민 수준은 정량화하기에 너무 낮았음을 의미한다.

도 22는 실시예에 사용된 구조물의 특성을 요약한 것이다.

실시예 1

사카로미세스 세레비지아에 PRB1 프로모터는 두개의 단일 스트랜드 올리고뉴클레오타이드 PRBJM1 및 PRBJM2를 이용하여 PCR에 의해 효모 게노믹 DNA로부터 분 리되었다.

PCR 조건은 94℃ 30초, 50℃ 40초, 72℃ 120초의 40사이클후, 72℃ 600초후 4℃ 유지이었다. 0.85kb DNA 프레그먼트가 NotI 및 HindIII 두가지를 이용하여 다이제스팅되고 이와 동일하게 NotI 및 HindIII로 다이제스팅된 WO 97/2445에 기술된 pBST+내로 라이게이션되어 플라스미드 pAYE438(도 4)을 생성하였다. 플라스미드 pAYE438은 HindIII 및 BamHI으로 다이제스팅되고 WO 00/44772에 이미 기술된 pAYE440의 0.48kb HindIII/BamHI ADH1 종결자 DNA 프레그먼트와 라이게이션되어 플라스미드 pAYE441(도 5)을 생성하였다. 플라스미드 pAYE441은 유일한 HindIII 사이트에서 선형화되고 Sleep, D. 등(1991) Bio/Technology 9, 183-187 및 EP-A-0 431 880에서 이미 기술된 pAYE309(도 6)의 1.8kb HindIII/Bsu36I 프레그먼트 및 그 이중 스트랜드 올리고뉴클레오타이드 연결기

와 라이게이션되어 pAYE467(도 7)을 생성하였다. pAYE467의 3.2kb NotI, 발 현벡터는 카프 인테스티널 포스페이트(CIP)로 미리 처리된 NotI 선형 pSAC35(Sleep 등(1991), Bio/technology 9: 183-187)내로 라이게이션되어 플라스미드 pAYE443(도 8)을 생성하였다. SEQ ID No 22는 HSA/MFα-1 융합 리더 서열의 암호 리전 및 pAYE467과 pAYE443 모두의 DNA 서열내에서 발견되는 성숙 휴먼 알부민 암호 리전을 포함하는 폴리뉴클레오타이드 서열을 나타낸다. HSA/MFα-1 융합 리더 서열을 암호하는 폴리뉴클레오타이드 서열은 하기 DNA 서열을 갖는 CPK1으로 불리우는 단일 스트랜드 올리고뉴클레오타이드로 사이트 디렉티드 돌연변이유발에 의해 변형되었다.

사이트 디렉티드 돌연변이유발(SDM)은 스탠다드 프로토콜(Botstein 및 Shortle, "Strategies and Applications of In Vitro Mutagenesis" Science, 229: 193-1210(1985))에 따라 수행되었으나 다른 적절한 기술이 또한 사용될 수 있다. CPK1의 뉴클레오타이드 서열은 HSA/MFα-1 융합 리더 서열의 아미노산 서열을 변형시키기위해 하기 돌연변이 Thr-20Phe, Phe-19Ile, Ile-18Val 및 Leu-16Ile(여기서 넘버링(-20 등)은 -1 잔기가 HSA/MFα-1 융합 리더 서열의 C-말단 아미노산을 의미함)이 도입되도록 디자인되었다.

돌연변이생성된 플라스미드의 DNA 서열은 그 폴리뉴클레오타이드 서열이 원하는 서열로 돌연변이생성되었는지 그리고 다른 DNA 서열 변화가 도입되었는지 확 인하는 디데옥시뉴클레오타이드 시퀀싱에 의해 확인되었다. 새로운 플라스미드는 pAYE653(도 9)로 명명되었다. SEQ ID No 24는 변형된 HSA/MFα-1 융합 리더 서열의 암호 리전 및 pAYE653의 폴리뉴클레오타이드 서열내에서 발견되는 성숙 휴먼 알부민 암호 리전을 포함하는 폴리뉴클레오타이드 서열을 나타낸다.

NotI 휴먼 알부민 발현 카세트는 pAYE653으로부터 분리되어 플라스미드 pSAC35의 유일한 NotI 사이트내로 라이게이션되어 플라스미드 pAYE655(도 10)를 생성하였다.

실시예 2

SEQ ID No 19는 사카로미세스 세레비지아에(Saccharomyces cerevisiae) PRB1 프로모터의 5'UTR을 포함하는 비-암호 리전; 본 발명의 변형된 HSA/MFα-1 융합 리더 서열을 암호하는 폴리뉴클레오타이드 리전; 성숙 휴먼 알부민 및 번역 종결 사이트에 대한 코돈 최적화 암호 리전을 포함하는 DNA 서열을 나타낸다.

SEQ ID No 19에서 리더 서열에 대하여 제공되는 서열 변형의 영향을 비교하기위해 대조구로서 SEQ ID No 40은 본 발명의 제 2 견지를 나타내는 15 폴리뉴클레오타이드 리전 대신에, SEQ ID No 40의 DNA 서열은 변형된 HSA/MFα-1 융합 리더 서열, 즉 SFISL의 5 아미노산을 암호하는 15 폴리뉴클레오타이드 리전을 포함하는 것을 제외하고 SEQ ID No 19와 본질적으로 동일한 DNA 서열을 나타낸다.

두 DNA 서열 모두 Genosys, Inc(Cambridge, UK)에 의해 오버래핑 단일-스트랜드 올리고뉴클레오타이드로부터 합성되었다.

SEQ ID No 40은 1.865kb SacI-HindIII DNA 프레그먼트로 합성되었으며, 이는 플라스미드 pBSSK-(Stratagene Europe, P.O. Box 12085, Amsterdam, The Netherlands)의 SacI-HindIII 사이트내로 클로닝되어 플라스미드 pAYE639(도 11)를 생성하였다.

사카로미세스 세레비지아에(Saccharomyces cerevisiae) PRB1 프로모터는 두가지 단일 스트랜드 올리고뉴클레오타이드 PRBJM1 및 PRBJM3를 이용하여 PCR에 의해 효모 게노믹 DNA로부터 분리되었다.

PCR 조건은 94℃ 30초, 50℃ 40초, 72℃ 120초의 40사이클후, 72℃ 600초후 4℃ 유지이었다. 0.81kb DNA 프레그먼트가 NotI 및 HindIII 두가지를 이용하여 다이제스팅되고 이와 동일하게 NotI 및 HindIII로 다이제스팅된 WO 97/2445에 기술된 pBST+내로 라이게이션되어 플라스미드 pAYE439(도 12)를 생성하였다. 플라스미드 pAYE439는 HindIII 및 BamHI으로 다이제스팅되고 WO 00/44772에 이미 기술된 pAYE440의 0.48kb HindIII/BamHI ADH1 종결자 DNA 프레그먼트와 라이게이션되어 플라스미드 pAYE466(도 13)을 생성하였다.

SEQ ID No 40의 1.865kb HindIII DNA 프레그먼트는 플라스미드 pAYE466의 유일한 HindIII 사이트내로 클로닝되어 플라스미드 pAYE640을 생성하였으며, 이는 PRB1 프로모터와 ADH1 종결자 사이에 SEQ ID No 40의 1.865kb HindIII DNA 프레그먼트를 PRB1 프로모터로부터의 발현을 위한 올바른 방향으로 포함하는 것으로 나타났다(도 14).

플라스미드 pAYE640은 NotI/PvuI으로 완전 다이제스팅되었으며 NotI 3.2kb, SEQ ID No 40 유전자/ADH1 종결자 발현 카세트의 PRB1 프로모터/HindIII DNA 프레그먼트가 정제되었다. 발현 카세트(3.2kb) 및 pBST+ 플라스미드 백본(3.15kb)은 크기가 유사하기때문에 단일 NotI 다이제스션보다 pAYE640의 NotI/PvuI 이중 다이제스션이 바람직하였다. pAYE640의 발현벡터, 3.2kb NotI은 카프 인테스티널 포스파타아제(CIP)로 미리 처리된 NotI 선형화 pSAC35(Sleep 등(1991), Bio/technology 9: 183-187)내로 라이게이션되어 플라스미드 pAYE638(도 15)을 생성하였다. 플라스미드 pAYE638은 pSAC35의 NotI 사이트내로 삽입되고 HSA 유전자의 발현이 LEU2 영양요구성 마커로부터 멀어지고 2㎛ 복제 오리진을 향하도록 배향된 NotI HSA 발현 카세트를 포함하는 것으로 나타났다. 플라스미드 pAYE642는 동일한 HSA 발현 카세트를 포함하였으나 그 반대 방향으로 배열되었다(도 15).

SEQ ID No 19는 1.865kb SacI-HindIII DNA 프레그먼트로 합성되고, pBSSK-(Stratagene Europe, P.O. Box 12085, Amsterdam, The Netherlands)내로 클로닝되어 플라스미드 pAYE643(도 16)으로 생성되었다. pAYE643내에 HSA/MFα-1 융합 리더 서열-알부민 융합체를 암호하는 DNA 서열은 SEQ ID No 27로 주어진다. SEQ ID No 19의 1.865kb HindIII 프레그먼트는 pAYE643으로부터 분리되었으며 pAYE466의 유일한 HindIII 사이트내로 라이게이션되어 플라스미드 pAYE645(도 17)을 생성하였다. NotI PRB1 rHA 발현 카세트는 NotI/PvuI으로 다이제스팅되어 pAYE645로부터 분리되었으며, pSAC35의 유일한 NotI 사이트내로 라이게이션되어 플라스미드 pAYE646(도 18) 및 pAYE647(도 19)을 생성하였다. 플라스미드 pAYE646내의 NotI 발현 카세트는 플라스미드 pAYE638 및 pAYE443과 동일한 방향으로 배향되었으며, 플라스미드 pAYE647내의 NotI 발현 카세트는 그 반대방향으로 그리고 플라스미드 pAYE642와 동일한 방향으로 배열되었다.

실시예 3

3개의 다른 효모 스트레인, A, B 및 C가 플라스미드 pAYE443, pAYE638 및 pAYE655을 이용하여 루신 야생성으로 형질변형되었다. 형질변형체는 2%(w/v) 글루코즈(BMMD)를 함유하는 완충 최소 배지(BMM, Kerry-Williams, S.M. 등(1998) Yeast 14, 161-169)상에서 패치아웃되고 추가 분석을 위해 충분히 성장할 때 까지 30℃에서 배양되었다. 형질변형체의 휴먼 알부민 생성능은 2%(w/v) 글루코즈(YEPD)를 함 유하는 10mL YEP(1%(w/v) 효모 추출물; 2%(w/v) 박토 펩톤) 및 BMMD 쉐이크 플라스크 배양(30℃, 200rpm, 72시간)으로부터 세포가 없는 배양물 상층액의 로켓 면역전기영동에 의해 분석되었다(도 20).

pAYE638로 형질변형된 모든 3 스트레인의 휴먼 알부민 생성능은 모두 풍부하고 규정된 배지에서 pAYE442(모두 HSA/MFα-1 융합 리더 서열을 포함하나 다른 폴리뉴클레오타이드 서열에 의해 암호화됨)으로 형질변형된 동일한 스트레인에서 관찰되는 것보다 약 4-5배 낮았다. 예기치않게, pAYE646 또는 pAYE655로 형질변형된 모든 3 스트레인의 휴먼 알부민 생성능은 pAYE638의 경우보다 현저히 높았으며 pAYE443으로 형질변형된 동일한 스트레인에 대해 관찰된 경우와 동일하거나 약간 높았다.

실시예 4

효모 스트레인 C[pAYE443], 스트레인 C[pAYE655], 스트레인 C[pAYE638] 및 스트레인 C[pAYE646], 및 스트레인 B[pAYE443] 및 스트레인 B[pAYE646]은 모두 페드-배치 및 필 앤드 드로우 방법으로 고세포 밀도 발효로 배양되었다. 페드-배치 방법은 WO 96/37515에 기술된 바와 같은 배지 및 컨트롤 파라미터를 사용하였다. 필 앤드 드로우 방법은 상기한 바와 같이 페드-배치 방법을 사용하였으나 부가적으로 다음 단계를 포함하였다: 페드-배치 배양 방법의 공급 단계 완료시, 배양물 부피의 90%를 발효 용기로부터 제거하고 WO 96/37515에 기술된 배지 및 컨트롤 파라 미터를 이용하여 공급 첨가 시작전에 남은 배양물 10부피%에(pH 조절을 유지하면서) 배치 배지를 첨가하였다. 휴먼 알부민 생성능(Y_P/S) 및 휴먼 알부민 농도(g/L)는 세포가 없는 전체 배양물의 SDS-PAGE의 주사 밀도법에 의해 평가되었다. 바이오매스 수율(Y_X/S)이 또한 중량법 정량으로 계산되었다. 그 결과(도 21)는 실시예 3에 이미 나타낸 바와 같이, HSA/MFα-1 융합 리더 서열 및 성숙 휴먼 알부민 모두의 아미노산 서열이 동일하였음에도 불구하고, 휴먼 알부민 발현 플라스미드 pAYE638(효모-바이어스드 코돈이 아닌 네이티브 폴리펩타이드 서열)을 함유하는 효모 스트레인의 휴먼 알부민 생성능(Y_P/S) 및 휴먼 알부민 농도(g/L)는 휴먼 알부민 발현 플라스미드 pAYE443(네이티브 폴리펩타이드 서열이며 리더 및 성숙 알부민에 대한 천연 코돈 바이어스)을 함유하는 동일한 스트레인보다 현저히 낮은 생성능을 가졌다.

요약

플라스미드 pAYE443 및 pAYE638은 모두 HSA/MFα-1 융합 리더 서열로부터 유도된 리더 서열을 갖는 휴먼 알부민을 암호하지만, 전자는 네이티브 폴리뉴클레오타이드 서열의 천연 코돈 바이어스를 사용하는 한편, 후자는 효모 발현용으로 완전히 코돈 최적화된 폴리뉴클레오타이드 서열을 사용한다. pAYE638로부터 얻어진 휴먼 알부민의 발현은 pAYE443을 이용하여 얻어진 경우보다 4-5배 낮다. 본 발명에 따른 변형된 리더 서열을 암호하는 폴리뉴클레오타이드 서열은 pAYE443 및 pAYE638 모두의 HSA/MFα-1 융합 리더 서열을 암호하는 폴리뉴클레오타이드 서열내로 치환 되어 각각 휴먼 알부민 발현 플라스미드 pAYE665 및 pAYE646을 생성하였다. 본 발명에 따른 폴리펩타이드 서열의 도입으로 원하는 폴리펩타이드의 생산에 현저한 향상이 나타났다.

<110> Delta Biotechnology Limited <120> Gene and Polypeptide Sequences <150> GB 0217033.0 <151> 2002-07-23 <160> 40 <170> KopatentIn 1.71 <210> 1 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <220> <221> VARIANT <222> (1) <223> CAN BE EITHER Phe OR Trp OR Tyr <220> <221> VARIANT <222> (2) <223> CAN BE EITHER Ile OR Leu OR Val OR Ala OR Met <220> <221> VARIANT <222> (3) <223> CAN BE EITHER Leu OR Val OR Ala OR Met <220> <221> VARIANT <222> (4) <223> CAN BE EITHER Ser OR Thr <220> <221> VARIANT <222> (5) <223> CAN BE EITHER Ile OR Val OR Ala OR Met <400> 1 Phe Ile Leu Ser Ile 1 5 <210> 2 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <220> <221> VARIANT <222> (2) <223> CAN BE EITHER Ile OR Leu OR Val OR Ala OR Met <220> <221> VARIANT <222> (3) <223> CAN BE EITHER Leu OR Val OR Ala OR Met <220> <221> VARIANT <222> (4) <223> CAN BE EITHER Ser OR Thr <220> <221> VARIANT <222> (5) <223> CAN BE EITHER Ile OR Val OR Ala OR Met <400> 2 Phe Ile Leu Ser Ile 1 5 <210> 3 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <220> <221> VARIANT <222> (1) <223> CAN BE EITHER Phe OR Trp OR Tyr <220> <221> VARIANT <222> (3) <223> CAN BE EITHER Leu OR Val OR Ala OR Met <220> <221> VARIANT <222> (4) <223> CAN BE EITHER Ser OR Thr <220> <221> VARIANT <222> (5) <223> CAN BE EITHER Ile OR Val OR Ala OR Met <400> 3 Phe Ile Leu Ser Ile 1 5 <210> 4 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <220> <221> VARIANT <222> (1) <223> CAN BE EITHER Phe OR Trp OR Tyr <220> <221> VARIANT <222> (2) <223> CAN BE EITHER Ile OR Leu OR Val OR Ala OR Met <220> <221> VARIANT <222> (4) <223> CAN BE EITHER Ser OR Thr <220> <221> VARIANT <222> (5) <223> BE EITHER Ile OR Val OR Ala OR Met <400> 4 Phe Ile Val Ser Ile 1 5 <210> 5 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <220> <221> VARIANT <222> (1) <223> CAN BE EITHER Phe OR Trp OR Tyr <220> <221> VARIANT <222> (2) <223> CAN BE EITHER Ile OR Leu OR Val OR Ala OR Met <220> <221> VARIANT <222> (3) <223> CAN BE EITHER Leu OR Val OR Ala OR Met <220> <221> VARIANT <222> (5) <223> CAN BE EITHER Ile Val OR Ala OR Met <400> 5 Phe Ile Leu Ser Ile 1 5 <210> 6 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <220> <221> VARIANT <222> (1) <223> CAN BE EITHER Phe OR Trp OR Tyr <220> <221> VARIANT <222> (2) <223> CAN BE EITHER Ile OR Leu OR Val OR Ala OR Met <220> <221> VARIANT <222> (3) <223> CAN BE EITHER Leu OR Val OR Ala OR Met <220> <221> VARIANT <222> (4) <223> CAN BE EITHER Ser OR Thr <400> 6 Phe Ile Leu Ser Ile 1 5 <210> 7 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <400> 7 Phe Ile Val Ser Ile 1 5 <210> 8 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <400> 8 Met Lys Trp Val 1 <210> 9 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <400> 9 Leu Phe Leu Phe Ser Ser Ala Tyr Ser 1 5 <210> 10 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <220> <221> VARIANT <222> (1) <223> CAN BE EITHER Ile OR Leu OR Val OR Ala OR Met <220> <221> VARIANT <222> (2) <223> CAN BE EITHER Phe OR Trp OR Tyr <220> <221> VARIANT <222> (3) <223> CAN BE EITHER Ile OR Leu OR Val OR Ala OR Met <220> <221> VARIANT <222> (4) <223> CAN BE EITHER Phe OR Trp OR Tyr <220> <221> VARIANT <222> (5) <223> CAN BE EITHER Ser OR Thr OR Gly OR Tyr OR Ala <220> <221> VARIANT <222> (6) <223> CAN BE EITHER Ser OR Thr OR Gly OR Tyr OR Ala <220> <221> VARIANT <222> (7) <223> CAN BE EITHER Ile OR Leu OR Val OR Ala OR Met <220> <221> VARIANT <222> (8) <223> CAN BE EITHER Phe OR Trp OR Tyr <220> <221> VARIANT <222> (9) <223> CAN BE EITHER Ser OR Thr OR Gly OR Tyr OR Ala <400> 10 Ile Phe Ile Phe Ser Ser Ile Phe Ser 1 5 <210> 11 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <400> 11 Leu Phe Leu Phe Ser Ser Ala Tyr Ser Arg Ser Leu Asp Lys Arg 1 5 10 15 <210> 12 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <220> <221> VARIANT <222> (5) <223> PREFERABLY Phe <220> <221> VARIANT <222> (6) <223> PREFERABLY Ile <220> <221> VARIANT <222> (7) <223> PREFERABLY Val <220> <221> VARIANT <222> (8) <223> PREFERABLY Ser or Thr <220> <221> VARIANT <222> (9) <223> PREFERABLY Ile <400> 12 Met Lys Trp Val Xaa Xaa Xaa Xaa Xaa Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser <210> 13 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <220> <221> VARIANT <222> (5) <223> PREFERABLY Phe <220> <221> VARIANT <222> (6) <223> PREFERABLY Ile <220> <221> VARIANT <222> (7) <223> PREFERABLY Val <220> <221> VARIANT <222> (8) <223> PREFERABLY Ser or Thr <220> <221> VARIANT <222> (9) <223> PREFERABLY Ile <400> 13 Met Lys Trp Val Xaa Xaa Xaa Xaa Xaa Ile Phe Ile Phe Ser Ser Ile 1 5 10 15 Phe Ser <210> 14 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <220> <221> VARIANT <222> (5) <223> PREFERABLY Phe <220> <221> VARIANT <222> (6) <223> PREFERABLY Ile <220> <221> VARIANT <222> (7) <223> PREFERABLY Val <220> <221> VARIANT <222> (8) <223> PREFERABLY Ser or Thr <220> <221> VARIANT <222> (9) <223> PREFERABLY Ile <400> 14 Met Lys Trp Val Xaa Xaa Xaa Xaa Xaa Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Ser Leu Asp Lys Arg 20 <210> 15 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Leader sequence <220> <221> misc_feature <222> (1)..(3) <223> CAN BE EITHER tty OR tgg OR tay <220> <221> misc_feature <222> (4)..(6) <223> CAN BE EITHER ath OR ttr OR ctn OR gtn OR gcn OR atg <220> <221> misc_structure <222> (7)..(9) <223> CAN BE EITHER ttr OR ctn OR gtn OR gcn OR atg <220> <221> misc_feature <222> (10)..(12) <223> CAN BE EITHER agy OR tcn OR acn <220> <221> misc_feature <222> (13)..(15) <223> CAN BE EITHER ath OR ctn OR gtn OR gcn OR atg <400> 15 ttyathttra gyath 15 <210> 16 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Leader sequence <220> <221> misc_feature <222> (10)..(12) <223> CAN BE EITHER tcn OR agy <400> 16 ttyathgtnt cnath 15 <210> 17 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Leader Sequence <220> <221> misc_feature <222> (1)..(3) <223> CAN BE EITHER ttc OR tgg OR tac <220> <221> misc_feature <222> (4)..(6) <223> CAN BE EITHER aty OR ttg OR gty OR gct OR atg <220> <221> misc_feature <222> (7)..(9) <223> CAN BE EITHER ttg OR gty OR gct OR atg <220> <221> misc_feature <222> (10)..(12) <223> CAN BE EITHER tcy OR acy <220> <221> misc_feature <222> (11)..(15) <223> CAN BE EITHER aty OR gty OR gct OR atg <400> 17 ttcatyttgt cyaty 15 <210> 18 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Leader Sequence <400> 18 ttcatygtyt cyaty 15 <210> 19 <211> 1865 <212> DNA <213> Artificial Sequence <220> <223> S. cerevisiae 5'UTR and leader sequence and mature human albumin CDS <400> 19 aagcttaacc taattctaac aagcaaagat gaagtgggtt ttcatcgtct ccattttgtt 60 cttgttctcc tctgcttact ctagatcttt ggataagaga gacgctcaca agtccgaagt 120 cgctcacaga ttcaaggact tgggtgaaga aaacttcaag gctttggtct tgatcgcttt 180 cgctcaatac ttgcaacaat gtccattcga agatcacgtc aagttggtca acgaagttac 240 cgaattcgct aagacttgtg ttgctgacga atctgctgaa aactgtgaca agtccttgca 300 caccttgttc ggtgataagt tgtgtactgt tgctaccttg agagaaacct acggtgaaat 360 ggctgactgt tgtgctaagc aagaaccaga aagaaacgaa tgtttcttgc aacacaagga 420 cgacaaccca aacttgccaa gattggttag accagaagtt gacgtcatgt gtactgcttt 480 ccacgacaac gaagaaacct tcttgaagaa gtacttgtac gaaattgcta gaagacaccc 540 atacttctac gctccagaat tgttgttctt cgctaagaga tacaaggctg ctttcaccga 600 atgttgtcaa gctgctgata aggctgcttg tttgttgcca aagttggatg aattgagaga 660 cgaaggtaag gcttcttccg ctaagcaaag attgaagtgt gcttccttgc aaaagttcgg 720 tgaaagagct ttcaaggctt gggctgtcgc tagattgtct caaagattcc caaaggctga 780 attcgctgaa gtttctaagt tggttactga cttgactaag gttcacactg aatgttgtca 840 cggtgacttg ttggaatgtg ctgatgacag agctgacttg gctaagtaca tctgtgaaaa 900 ccaagactct atctcttcca agttgaagga atgttgtgaa aagccattgt tggaaaagtc 960 tcactgtatt gctgaagttg aaaacgatga aatgccagct gacttgccat ctttggctgc 1020 tgacttcgtt gaatctaagg acgtttgtaa gaactacgct gaagctaagg acgtcttctt 1080 gggtatgttc ttgtacgaat acgctagaag acacccagac tactccgttg tcttgttgtt 1140 gagattggct aagacctacg aaactacctt ggaaaagtgt tgtgctgctg ctgacccaca 1200 cgaatgttac gctaaggttt tcgatgaatt caagccattg gtcgaagaac cacaaaactt 1260 gatcaagcaa aactgtgaat tgttcgaaca attgggtgaa tacaagttcc aaaacgcttt 1320 gttggttaga tacactaaga aggtcccaca agtctccacc ccaactttgg ttgaagtctc 1380 tagaaacttg ggtaaggtcg gttctaagtg ttgtaagcac ccagaagcta agagaatgcc 1440 atgtgctgaa gattacttgt ccgtcgtttt gaaccaattg tgtgttttgc acgaaaagac 1500 cccagtctct gatagagtca ccaagtgttg tactgaatct ttggttaaca gaagaccatg 1560 tttctctgct ttggaagtcg acgaaactta cgttccaaag gaattcaacg ctgaaacttt 1620 caccttccac gctgatatct gtaccttgtc cgaaaaggaa agacaaatta agaagcaaac 1680 tgctttggtt gaattggtca agcacaagcc aaaggctact aaggaacaat tgaaggctgt 1740 catggatgat ttcgctgctt tcgttgaaaa gtgttgtaag gctgatgata aggaaacttg 1800 tttcgctgaa gaaggtaaga agttggtcgc tgcttcccaa gctgctttgg gtttgtaata 1860 agctt 1865 <210> 20 <211> 1773 <212> DNA <213> Artificial Sequence <220> <223> A mature human albumin coding region <400> 20 agatctttgg ataagagaga cgctcacaag tccgaagtcg ctcacagatt caaggacttg 60 ggtgaagaaa acttcaaggc tttggtcttg atcgctttcg ctcaatactt gcaacaatgt 120 ccattcgaag atcacgtcaa gttggtcaac gaagttaccg aattcgctaa gacttgtgtt 180 gctgacgaat ctgctgaaaa ctgtgacaag tccttgcaca ccttgttcgg tgataagttg 240 tgtactgttg ctaccttgag agaaacctac ggtgaaatgg ctgactgttg tgctaagcaa 300 gaaccagaaa gaaacgaatg tttcttgcaa cacaaggacg acaacccaaa cttgccaaga 360 ttggttagac cagaagttga cgtcatgtgt actgctttcc acgacaacga agaaaccttc 420 ttgaagaagt acttgtacga aattgctaga agacacccat acttctacgc tccagaattg 480 ttgttcttcg ctaagagata caaggctgct ttcaccgaat gttgtcaagc tgctgataag 540 gctgcttgtt tgttgccaaa gttggatgaa ttgagagacg aaggtaaggc ttcttccgct 600 aagcaaagat tgaagtgtgc ttccttgcaa aagttcggtg aaagagcttt caaggcttgg 660 gctgtcgcta gattgtctca aagattccca aaggctgaat tcgctgaagt ttctaagttg 720 gttactgact tgactaaggt tcacactgaa tgttgtcacg gtgacttgtt ggaatgtgct 780 gatgacagag ctgacttggc taagtacatc tgtgaaaacc aagactctat ctcttccaag 840 ttgaaggaat gttgtgaaaa gccattgttg gaaaagtctc actgtattgc tgaagttgaa 900 aacgatgaaa tgccagctga cttgccatct ttggctgctg acttcgttga atctaaggac 960 gtttgtaaga actacgctga agctaaggac gtcttcttgg gtatgttctt gtacgaatac 1020 gctagaagac acccagacta ctccgttgtc ttgttgttga gattggctaa gacctacgaa 1080 actaccttgg aaaagtgttg tgctgctgct gacccacacg aatgttacgc taaggttttc 1140 gatgaattca agccattggt cgaagaacca caaaacttga tcaagcaaaa ctgtgaattg 1200 ttcgaacaat tgggtgaata caagttccaa aacgctttgt tggttagata cactaagaag 1260 gtcccacaag tctccacccc aactttggtt gaagtctcta gaaacttggg taaggtcggt 1320 tctaagtgtt gtaagcaccc agaagctaag agaatgccat gtgctgaaga ttacttgtcc 1380 gtcgttttga accaattgtg tgttttgcac gaaaagaccc cagtctctga tagagtcacc 1440 aagtgttgta ctgaatcttt ggttaacaga agaccatgtt tctctgcttt ggaagtcgac 1500 gaaacttacg ttccaaagga attcaacgct gaaactttca ccttccacgc tgatatctgt 1560 accttgtccg aaaaggaaag acaaattaag aagcaaactg ctttggttga attggtcaag 1620 cacaagccaa aggctactaa ggaacaattg aaggctgtca tggatgattt cgctgctttc 1680 gttgaaaagt gttgtaaggc tgatgataag gaaacttgtt tcgctgaaga aggtaagaag 1740 ttggtcgctg cttcccaagc tgctttgggt ttg 1773 <210> 21 <211> 1827 <212> DNA <213> Artificial Sequence <220> <223> .. <400> 21 atgaagtggg ttttcatcgt ctccattttg ttcttgttct cctctgctta ctctagatct 60 ttggataaga gagacgctca caagtccgaa gtcgctcaca gattcaagga cttgggtgaa 120 gaaaacttca aggctttggt cttgatcgct ttcgctcaat acttgcaaca atgtccattc 180 gaagatcacg tcaagttggt caacgaagtt accgaattcg ctaagacttg tgttgctgac 240 gaatctgctg aaaactgtga caagtccttg cacaccttgt tcggtgataa gttgtgtact 300 gttgctacct tgagagaaac ctacggtgaa atggctgact gttgtgctaa gcaagaacca 360 gaaagaaacg aatgtttctt gcaacacaag gacgacaacc caaacttgcc aagattggtt 420 agaccagaag ttgacgtcat gtgtactgct ttccacgaca acgaagaaac cttcttgaag 480 aagtacttgt acgaaattgc tagaagacac ccatacttct acgctccaga attgttgttc 540 ttcgctaaga gatacaaggc tgctttcacc gaatgttgtc aagctgctga taaggctgct 600 tgtttgttgc caaagttgga tgaattgaga gacgaaggta aggcttcttc cgctaagcaa 660 agattgaagt gtgcttcctt gcaaaagttc ggtgaaagag ctttcaaggc ttgggctgtc 720 gctagattgt ctcaaagatt cccaaaggct gaattcgctg aagtttctaa gttggttact 780 gacttgacta aggttcacac tgaatgttgt cacggtgact tgttggaatg tgctgatgac 840 agagctgact tggctaagta catctgtgaa aaccaagact ctatctcttc caagttgaag 900 gaatgttgtg aaaagccatt gttggaaaag tctcactgta ttgctgaagt tgaaaacgat 960 gaaatgccag ctgacttgcc atctttggct gctgacttcg ttgaatctaa ggacgtttgt 1020 aagaactacg ctgaagctaa ggacgtcttc ttgggtatgt tcttgtacga atacgctaga 1080 agacacccag actactccgt tgtcttgttg ttgagattgg ctaagaccta cgaaactacc 1140 ttggaaaagt gttgtgctgc tgctgaccca cacgaatgtt acgctaaggt tttcgatgaa 1200 ttcaagccat tggtcgaaga accacaaaac ttgatcaagc aaaactgtga attgttcgaa 1260 caattgggtg aatacaagtt ccaaaacgct ttgttggtta gatacactaa gaaggtccca 1320 caagtctcca ccccaacttt ggttgaagtc tctagaaact tgggtaaggt cggttctaag 1380 tgttgtaagc acccagaagc taagagaatg ccatgtgctg aagattactt gtccgtcgtt 1440 ttgaaccaat tgtgtgtttt gcacgaaaag accccagtct ctgatagagt caccaagtgt 1500 tgtactgaat ctttggttaa cagaagacca tgtttctctg ctttggaagt cgacgaaact 1560 tacgttccaa aggaattcaa cgctgaaact ttcaccttcc acgctgatat ctgtaccttg 1620 tccgaaaagg aaagacaaat taagaagcaa actgctttgg ttgaattggt caagcacaag 1680 ccaaaggcta ctaaggaaca attgaaggct gtcatggatg atttcgctgc tttcgttgaa 1740 aagtgttgta aggctgatga taaggaaact tgtttcgctg aagaaggtaa gaagttggtc 1800 gctgcttccc aagctgcttt gggtttg 1827 <210> 22 <211> 1827 <212> DNA <213> Artificial Sequence <220> <223> Leader sequence and the mature human albumin coding region <400> 22 atgaagtggg taagctttat ttcccttctt tttctcttta gctcggctta ttccaggagc 60 ttggataaaa gagatgcaca caagagtgag gttgctcatc ggtttaaaga tttgggagaa 120 gaaaatttca aagccttggt gttgattgcc tttgctcagt atcttcagca gtgtccattt 180 gaagatcatg taaaattagt gaatgaagta actgaatttg caaaaacatg tgttgctgat 240 gagtcagctg aaaattgtga caaatcactt catacccttt ttggagacaa attatgcaca 300 gttgcaactc ttcgtgaaac ctatggtgaa atggctgact gctgtgcaaa acaagaacct 360 gagagaaatg aatgcttctt gcaacacaaa gatgacaacc caaacctccc ccgattggtg 420 agaccagagg ttgatgtgat gtgcactgct tttcatgaca atgaagagac atttttgaaa 480 aaatacttat atgaaattgc cagaagacat ccttactttt atgccccgga actccttttc 540 tttgctaaaa ggtataaagc tgcttttaca gaatgttgcc aagctgctga taaagctgcc 600 tgcctgttgc caaagctcga tgaacttcgg gatgaaggga aggcttcgtc tgccaaacag 660 agactcaagt gtgccagtct ccaaaaattt ggagaaagag ctttcaaagc atgggcagta 720 gctcgcctga gccagagatt tcccaaagct gagtttgcag aagtttccaa gttagtgaca 780 gatcttacca aagtccacac ggaatgctgc catggagatc tgcttgaatg tgctgatgac 840 agggcggacc ttgccaagta tatctgtgaa aatcaagatt cgatctccag taaactgaag 900 gaatgctgtg aaaaacctct gttggaaaaa tcccactgca ttgccgaagt ggaaaatgat 960 gagatgcctg ctgacttgcc ttcattagct gctgattttg ttgaaagtaa ggatgtttgc 1020 aaaaactatg ctgaggcaaa ggatgtcttc ctgggcatgt ttttgtatga atatgcaaga 1080 aggcatcctg attactctgt cgtgctgctg ctgagacttg ccaagacata tgaaaccact 1140 ctagagaagt gctgtgccgc tgcagatcct catgaatgct atgccaaagt gttcgatgaa 1200 tttaaacctc ttgtggaaga gcctcagaat ttaatcaaac aaaattgtga gctttttgag 1260 cagcttggag agtacaaatt ccagaatgcg ctattagttc gttacaccaa gaaagtaccc 1320 caagtgtcaa ctccaactct tgtagaggtc tcaagaaacc taggaaaagt gggcagcaaa 1380 tgttgtaaac atcctgaagc aaaaagaatg ccctgtgcag aagactatct atccgtggtc 1440 ctgaaccagt tatgtgtgtt gcatgagaaa acgccagtaa gtgacagagt caccaaatgc 1500 tgcacagaat ccttggtgaa caggcgacca tgcttttcag ctctggaagt cgatgaaaca 1560 tacgttccca aagagtttaa tgctgaaaca ttcaccttcc atgcagatat atgcacactt 1620 tctgagaagg agagacaaat caagaaacaa actgcacttg ttgagctcgt gaaacacaag 1680 cccaaggcaa caaaagagca actgaaagct gttatggatg atttcgcagc ttttgtagag 1740 aagtgctgca aggctgacga taaggagacc tgctttgccg aggagggtaa aaaacttgtt 1800 gctgcaagtc aagctgcctt aggctta 1827 <210> 23 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <400> 23 ctaaagagaa aaagaatgga gacgatgaat acccacttca tctttgc 47 <210> 24 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Leader Sequence <400> 24 atgaagtggg tattcatcgt ctccattctt tttctcttta gctcggctta ttccaggagc 60 ttggataaaa ga 72 <210> 25 <211> 1827 <212> DNA <213> Artificial Sequence <220> <223> Leader Sequence <400> 25 atgaagtggg tattcatcgt ctccattctt tttctcttta gctcggctta ttccaggagc 60 ttggataaaa gagatgcaca caagagtgag gttgctcatc ggtttaaaga tttgggagaa 120 gaaaatttca aagccttggt gttgattgcc tttgctcagt atcttcagca gtgtccattt 180 gaagatcatg taaaattagt gaatgaagta actgaatttg caaaaacatg tgttgctgat 240 gagtcagctg aaaattgtga caaatcactt catacccttt ttggagacaa attatgcaca 300 gttgcaactc ttcgtgaaac ctatggtgaa atggctgact gctgtgcaaa acaagaacct 360 gagagaaatg aatgcttctt gcaacacaaa gatgacaacc caaacctccc ccgattggtg 420 agaccagagg ttgatgtgat gtgcactgct tttcatgaca atgaagagac atttttgaaa 480 aaatacttat atgaaattgc cagaagacat ccttactttt atgccccgga actccttttc 540 tttgctaaaa ggtataaagc tgcttttaca gaatgttgcc aagctgctga taaagctgcc 600 tgcctgttgc caaagctcga tgaacttcgg gatgaaggga aggcttcgtc tgccaaacag 660 agactcaagt gtgccagtct ccaaaaattt ggagaaagag ctttcaaagc atgggcagta 720 gctcgcctga gccagagatt tcccaaagct gagtttgcag aagtttccaa gttagtgaca 780 gatcttacca aagtccacac ggaatgctgc catggagatc tgcttgaatg tgctgatgac 840 agggcggacc ttgccaagta tatctgtgaa aatcaagatt cgatctccag taaactgaag 900 gaatgctgtg aaaaacctct gttggaaaaa tcccactgca ttgccgaagt ggaaaatgat 960 gagatgcctg ctgacttgcc ttcattagct gctgattttg ttgaaagtaa ggatgtttgc 1020 aaaaactatg ctgaggcaaa ggatgtcttc ctgggcatgt ttttgtatga atatgcaaga 1080 aggcatcctg attactctgt cgtgctgctg ctgagacttg ccaagacata tgaaaccact 1140 ctagagaagt gctgtgccgc tgcagatcct catgaatgct atgccaaagt gttcgatgaa 1200 tttaaacctc ttgtggaaga gcctcagaat ttaatcaaac aaaattgtga gctttttgag 1260 cagcttggag agtacaaatt ccagaatgcg ctattagttc gttacaccaa gaaagtaccc 1320 caagtgtcaa ctccaactct tgtagaggtc tcaagaaacc taggaaaagt gggcagcaaa 1380 tgttgtaaac atcctgaagc aaaaagaatg ccctgtgcag aagactatct atccgtggtc 1440 ctgaaccagt tatgtgtgtt gcatgagaaa acgccagtaa gtgacagagt caccaaatgc 1500 tgcacagaat ccttggtgaa caggcgacca tgcttttcag ctctggaagt cgatgaaaca 1560 tacgttccca aagagtttaa tgctgaaaca ttcaccttcc atgcagatat atgcacactt 1620 tctgagaagg agagacaaat caagaaacaa actgcacttg ttgagctcgt gaaacacaag 1680 cccaaggcaa caaaagagca actgaaagct gttatggatg atttcgcagc ttttgtagag 1740 aagtgctgca aggctgacga taaggagacc tgctttgccg aggagggtaa aaaacttgtt 1800 gctgcaagtc aagctgcctt aggctta 1827 <210> 26 <211> 1827 <212> DNA <213> Artificial Sequence <220> <223> Plasmid <400> 26 atgaagtggg tttctttcat ttccttgttg ttcttgttct cctctgctta ctctagatct 60 ttggataaga gagacgctca caagtccgaa gtcgctcaca gattcaagga cttgggtgaa 120 gaaaacttca aggctttggt cttgatcgct ttcgctcaat acttgcaaca atgtccattc 180 gaagatcacg tcaagttggt caacgaagtt accgaattcg ctaagacttg tgttgctgac 240 gaatctgctg aaaactgtga caagtccttg cacaccttgt tcggtgataa gttgtgtact 300 gttgctacct tgagagaaac ctacggtgaa atggctgact gttgtgctaa gcaagaacca 360 gaaagaaacg aatgtttctt gcaacacaag gacgacaacc caaacttgcc aagattggtt 420 agaccagaag ttgacgtcat gtgtactgct ttccacgaca acgaagaaac cttcttgaag 480 aagtacttgt acgaaattgc tagaagacac ccatacttct acgctccaga attgttgttc 540 ttcgctaaga gatacaaggc tgctttcacc gaatgttgtc aagctgctga taaggctgct 600 tgtttgttgc caaagttgga tgaattgaga gacgaaggta aggcttcttc cgctaagcaa 660 agattgaagt gtgcttcctt gcaaaagttc ggtgaaagag ctttcaaggc ttgggctgtc 720 gctagattgt ctcaaagatt cccaaaggct gaattcgctg aagtttctaa gttggttact 780 gacttgacta aggttcacac tgaatgttgt cacggtgact tgttggaatg tgctgatgac 840 agagctgact tggctaagta catctgtgaa aaccaagact ctatctcttc caagttgaag 900 gaatgttgtg aaaagccatt gttggaaaag tctcactgta ttgctgaagt tgaaaacgat 960 gaaatgccag ctgacttgcc atctttggct gctgacttcg ttgaatctaa ggacgtttgt 1020 aagaactacg ctgaagctaa ggacgtcttc ttgggtatgt tcttgtacga atacgctaga 1080 agacacccag actactccgt tgtcttgttg ttgagattgg ctaagaccta cgaaactacc 1140 ttggaaaagt gttgtgctgc tgctgaccca cacgaatgtt acgctaaggt tttcgatgaa 1200 ttcaagccat tggtcgaaga accacaaaac ttgatcaagc aaaactgtga attgttcgaa 1260 caattgggtg aatacaagtt ccaaaacgct ttgttggtta gatacactaa gaaggtccca 1320 caagtctcca ccccaacttt ggttgaagtc tctagaaact tgggtaaggt cggttctaag 1380 tgttgtaagc acccagaagc taagagaatg ccatgtgctg aagattactt gtccgtcgtt 1440 ttgaaccaat tgtgtgtttt gcacgaaaag accccagtct ctgatagagt caccaagtgt 1500 tgtactgaat ctttggttaa cagaagacca tgtttctctg ctttggaagt cgacgaaact 1560 tacgttccaa aggaattcaa cgctgaaact ttcaccttcc acgctgatat ctgtaccttg 1620 tccgaaaagg aaagacaaat taagaagcaa actgctttgg ttgaattggt caagcacaag 1680 ccaaaggcta ctaaggaaca attgaaggct gtcatggatg atttcgctgc tttcgttgaa 1740 aagtgttgta aggctgatga taaggaaact tgtttcgctg aagaaggtaa gaagttggtc 1800 gctgcttccc aagctgcttt gggtttg 1827 <210> 27 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Leader sequence <400> 27 atgaagtggg ttttcatcgt ctccattttg ttcttgttct cctctgctta ctctagatct 60 ttggataaga ga 72 <210> 28 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Secretion pre-sequence <400> 28 Met Lys Trp Val Phe Ile Val Ser Ile Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser <210> 29 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Leader Sequence <220> <221> VARIANT <222> (1) <223> CAN BE EITHER Phe OR Trp OR Tyr <220> <221> VARIANT <222> (2) <223> CAN BE EITHER Ile OR Leu OR Val OR Ala OR Met <220> <221> VARIANT <222> (3) <223> CAN BE EITHER Leu OR Val OR Ala OR Met <220> <221> VARIANT <222> (5) <223> CAN BE EITHER Ile OR Val OR Ala OR Met <400> 29 Phe Ile Leu Thr Ile 1 5 <210> 30 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Secretion pre-sequence <400> 30 Leu Phe Leu Phe Ser Ser Ala Tyr Ser Arg Gly Val Phe Arg Arg 1 5 10 15 <210> 31 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Leader Sequence <220> <221> VARIANT <222> (5) <223> PREFERABLY Phe <220> <221> VARIANT <222> (6) <223> PREFERABLY Ile <220> <221> VARIANT <222> (7) <223> PREFERABLY Val <220> <221> VARIANT <222> (8) <223> PREFERABLY Ser or Thr <220> <221> VARIANT <222> (9) <223> PREFERABLY Ile <400> 31 Met Lys Trp Val Xaa Xaa Xaa Xaa Xaa Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Gly Val Phe Arg Arg 20 <210> 32 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Secretion pre-pro sequence <400> 32 Met Lys Trp Val Phe Ile Val Ser Ile Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Ser Leu Asp Lys Arg 20 <210> 33 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Leader Sequence <220> <221> VARIANT <222> (2) <223> CAN BE EITHER Lys OR Arg OR His <220> <221> VARIANT <222> (3) <223> CAN BE EITHER Phe OR Trp OR Tyr <220> <221> VARIANT <222> (4) <223> CAN BE EITHER Ile OR Leu OR Val OR Ala OR Met <400> 33 Met Lys Phe Ile 1 <210> 34 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Leader Sequence <400> 34 ttcatcgtct ccatt 15 <210> 35 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <400> 35 gcatgcggcc gcccgtaatg cggtatcgtg aaagcg 36 <210> 36 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <400> 36 gcataagctt acccacttca tctttgcttg tttag 35 <210> 37 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide linker <400> 37 ttaggcttat a 11 <210> 38 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide linker <400> 38 ccgaatattc ga 12 <210> 39 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <400> 39 gttagaatta ggttaagctt gtttttttat tggcgatgaa 40 <210> 40 <211> 1865 <212> DNA <213> Artificial Sequence <220> <223> Plasmid <400> 40 aagcttaacc taattctaac aagcaaagat gaagtgggtt tctttcattt ccttgttgtt 60 cttgttctcc tctgcttact ctagatcttt ggataagaga gacgctcaca agtccgaagt 120 cgctcacaga ttcaaggact tgggtgaaga aaacttcaag gctttggtct tgatcgcttt 180 cgctcaatac ttgcaacaat gtccattcga agatcacgtc aagttggtca acgaagttac 240 cgaattcgct aagacttgtg ttgctgacga atctgctgaa aactgtgaca agtccttgca 300 caccttgttc ggtgataagt tgtgtactgt tgctaccttg agagaaacct acggtgaaat 360 ggctgactgt tgtgctaagc aagaaccaga aagaaacgaa tgtttcttgc aacacaagga 420 cgacaaccca aacttgccaa gattggttag accagaagtt gacgtcatgt gtactgcttt 480 ccacgacaac gaagaaacct tcttgaagaa gtacttgtac gaaattgcta gaagacaccc 540 atacttctac gctccagaat tgttgttctt cgctaagaga tacaaggctg ctttcaccga 600 atgttgtcaa gctgctgata aggctgcttg tttgttgcca aagttggatg aattgagaga 660 cgaaggtaag gcttcttccg ctaagcaaag attgaagtgt gcttccttgc aaaagttcgg 720 tgaaagagct ttcaaggctt gggctgtcgc tagattgtct caaagattcc caaaggctga 780 attcgctgaa gtttctaagt tggttactga cttgactaag gttcacactg aatgttgtca 840 cggtgacttg ttggaatgtg ctgatgacag agctgacttg gctaagtaca tctgtgaaaa 900 ccaagactct atctcttcca agttgaagga atgttgtgaa aagccattgt tggaaaagtc 960 tcactgtatt gctgaagttg aaaacgatga aatgccagct gacttgccat ctttggctgc 1020 tgacttcgtt gaatctaagg acgtttgtaa gaactacgct gaagctaagg acgtcttctt 1080 gggtatgttc ttgtacgaat acgctagaag acacccagac tactccgttg tcttgttgtt 1140 gagattggct aagacctacg aaactacctt ggaaaagtgt tgtgctgctg ctgacccaca 1200 cgaatgttac gctaaggttt tcgatgaatt caagccattg gtcgaagaac cacaaaactt 1260 gatcaagcaa aactgtgaat tgttcgaaca attgggtgaa tacaagttcc aaaacgcttt 1320 gttggttaga tacactaaga aggtcccaca agtctccacc ccaactttgg ttgaagtctc 1380 tagaaacttg ggtaaggtcg gttctaagtg ttgtaagcac ccagaagcta agagaatgcc 1440 atgtgctgaa gattacttgt ccgtcgtttt gaaccaattg tgtgttttgc acgaaaagac 1500 cccagtctct gatagagtca ccaagtgttg tactgaatct ttggttaaca gaagaccatg 1560 tttctctgct ttggaagtcg acgaaactta cgttccaaag gaattcaacg ctgaaacttt 1620 caccttccac gctgatatct gtaccttgtc cgaaaaggaa agacaaatta agaagcaaac 1680 tgctttggtt gaattggtca agcacaagcc aaaggctact aaggaacaat tgaaggctgt 1740 catggatgat ttcgctgctt tcgttgaaaa gtgttgtaag gctgatgata aggaaacttg 1800 tttcgctgaa gaaggtaaga agttggtcgc tgcttcccaa gctgctttgg gtttgtaata 1860 agctt 1865

Claims

(i) 알부민 분비 프리-서열을 포함하는 리더 서열로서, -Phe-Ile-Val-Ser-Ile-, -Trp-Ile-Val-Ser-Ile-, -Tyr-Ile-Val-Ser-Ile-, -Phe-Leu-Val-Ser-Ile-, -Phe-Val-Val-Ser-Ile-, -Phe-Ala-Val-Ser-Ile-, -Phe-Met-Val-Ser-Ile-, -Phe-Ile-Leu-Ser-Ile-, -Phe-Ile-Ala-Ser-Ile-, -Phe-Ile-Met-Ser-Ile-, -Phe-Ile-Val-Thr-Ile-, -Phe-Ile-Val-Ser-Val-, -Phe-Ile-Val-Ser-Ala- 및 -Phe-Ile-Val-Ser-Met-로부터 선택된 모티프를 포함하는 알부민 분비 프리-서열을 포함하며,

여기서 상기 모티프는 상기 분비 프리-서열의 아미노산 위치 -20, -19, -18, -17 및 -16에 위치하며, 그 넘버링은 -1 잔기가 네이티브 알부민 분비 프로 서열의 C-말단 아미노산이 되도록 이루어지며, 그리고 여기서 상기 모티프의 아미노산은 자연적으로 발생하는 아미노산에 대한 치환체로서 폴리펩타이드 내에 포함되는, 리더 서열; 및

(ii) 상기 리더 서열에 이종성의 원하는(desired) 단백질

을 포함하는, 폴리펩타이드.
삭제
삭제
삭제
삭제
삭제
삭제
제 1항에 있어서, 상기 모티프는 -Phe-Ile-Val-Ser-Ile-인 것을 특징으로 하는 폴리펩타이드.
삭제
제 1항에 있어서, 상기 알부민 분비 프리-서열은 휴먼 알부민 분비 프리 서열인 것을 특징으로 하는 폴리펩타이드.
제 10항에 있어서, 분비 프리-서열 MKWVFIVSILFLFSSAYS를 포함하는 것을 특징으로 하는 폴리펩타이드.
청구항 12은(는) 설정등록료 납부시 포기되었습니다.

제 1항에 있어서, 상기 리더 서열은 분비 프로 서열을 포함하는 것을 특징으로 하는 폴리펩타이드.
청구항 13은(는) 설정등록료 납부시 포기되었습니다.

제 12항에 있어서, 상기 알부민 분비 프리-서열은 그 C-말단 끝에서 펩타이드 결합에 의해 분비 프로 서열의 N-말단 아미노산과 융합되어 프리-프로 서열을 형성하는 것을 특징으로 하는 폴리펩타이드.
청구항 14은(는) 설정등록료 납부시 포기되었습니다.

제 12항에 있어서, 상기 분비 프로 서열은 알부민 분비 프로 서열인 것을 특징으로 하는 폴리펩타이드.
청구항 15은(는) 설정등록료 납부시 포기되었습니다.

제 14항에 있어서, 상기 알부민 분비 프로 서열은 휴먼 혈청 알부민 분비 프로 서열인 것을 특징으로 하는 폴리펩타이드.
청구항 16은(는) 설정등록료 납부시 포기되었습니다.

제 12항에 있어서, 분비 프로 서열 모티프는 효모 MFα-1 분비 프로 서열인 것을 특징으로 하는 폴리펩타이드.
청구항 17은(는) 설정등록료 납부시 포기되었습니다.

제 12항에 있어서,

리더 서열: MKWVFIVSILFLFSSAYSRY¹Y²Y³Y⁴Y⁵

(Y¹은 Gly 또는 Ser이며, Y²는 Val 또는 Leu이며, Y³는 Phe 또는 Asp이며, Y⁴는 Arg 또는 Lys이며 그리고 Y⁵는 Arg 또는 Lys이다.)

을 포함하는 것을 특징으로 하는 폴리펩타이드.
청구항 18은(는) 설정등록료 납부시 포기되었습니다.

제 17항에 있어서, Y¹은 Gly이며, Y²는 Val이며 그리고 Y³는 Phe이거나; 혹은 Y¹은 Ser이며, Y²는 Leu이며 그리고 Y³는 Asp인 것을 특징으로 하는 폴리펩타이드.
청구항 19은(는) 설정등록료 납부시 포기되었습니다.

제 17항에 있어서, Y⁴는 Arg이며 Y⁵는 Arg이거나; Y⁴는 Lys이며 Y⁵는 Arg이거나; Y⁴는 Lys이며 Y⁵는 Lys이거나; 혹은 Y⁴는 Arg이며 Y⁵는 Lys인 것을 특징으로 하는 폴리펩타이드.
청구항 20은(는) 설정등록료 납부시 포기되었습니다.

제 1항에 있어서, 상기 모티프의 적어도 일부는 분비 프리-서열내에 존재하는 것을 특징으로 하는 폴리펩타이드.
청구항 21은(는) 설정등록료 납부시 포기되었습니다.

제 1항에 있어서, 원하는 단백질의 서열은 그 N-말단 끝에서 리더 서열의 C-말단 아미노산과 융합되는 것을 특징으로 하는 폴리펩타이드.
제 1항에 있어서, 원하는 단백질은 알부민 또는 그 융합체인 것을 특징으로 하는 폴리펩타이드.
청구항 23은(는) 설정등록료 납부시 포기되었습니다.

제 22항에 있어서, 원하는 단백질은 알부민의 3 도메인중 하나 또는 둘을 포함하는 것을 특징으로 하는 폴리펩타이드.
청구항 24은(는) 설정등록료 납부시 포기되었습니다.

제 22항에 있어서, 상기 알부민은 휴먼 알부민인 것을 특징으로 하는 폴리펩타이드.
제 1항에 있어서, 성숙 폴리펩타이드는 트랜스페린 또는 그 융합체인 것을 특징으로 하는 폴리펩타이드.
청구항 26은(는) 설정등록료 납부시 포기되었습니다.

제 25항에 있어서, 상기 트랜스페린은 휴먼 트랜스페린인 것을 특징으로 하는 폴리펩타이드.
제 1항에 정의된 폴리펩타이드를 암호하는 서열을 포함하는 분리된 폴리뉴클레오타이드.
제 27항에 있어서, SEQ ID No. 15, SEQ ID No. 16, SEQ ID No. 17, SEQ ID No. 18 또는 SEQ ID No. 34의 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오타이드.
청구항 29은(는) 설정등록료 납부시 포기되었습니다.

제 28항에 있어서, SEQ ID No. 24의 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오타이드.
청구항 30은(는) 설정등록료 납부시 포기되었습니다.

제 29항에 있어서, SEQ ID No. 25의 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오타이드.
청구항 31은(는) 설정등록료 납부시 포기되었습니다.

제 28항에 있어서, SEQ ID No. 27의 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오타이드.
청구항 32은(는) 설정등록료 납부시 포기되었습니다.

제 31항에 있어서, SEQ ID No. 21의 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오타이드.
삭제
SEQ ID No. 21의 서열을 포함하는 폴리뉴클레오타이드.
제 30항, 제 32항 또는 제 34항중 어느 한 항에 있어서, 상기 폴리뉴클레오타이드는 이종성 단백질을 암호하는 DNA 서열과 DNA 서열 SEQ ID No. 25 또는 DNA 서열 SEQ ID No. 21의 인접 혹은 비-인접 융합체가 되는 DNA 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오타이드.
제 27항에 따른 폴리뉴클레오타이드의 상보적 스트랜드가 되는 폴리뉴클레오타이드.
청구항 37은(는) 설정등록료 납부시 포기되었습니다.

제 27항에 있어서, 실시가능하게 연결된 전사 조절 리전을 포함하는 것을 특징으로 하는 폴리뉴클레오타이드.
청구항 38은(는) 설정등록료 납부시 포기되었습니다.

제 37항에 있어서, 상기 전사 조절 리전은 전사 프로모터를 포함하는 것을 특징으로 하는 폴리뉴클레오타이드.
제 27항에 따른 폴리뉴클레오타이드를 포함하는 자가-복제가능한 폴리뉴클레오타이드 서열.
제 27항에 따른 폴리뉴클레오타이드를 포함하는 세포.
제 40항에 있어서, 상기 세포는 진핵 세포인 것을 특징으로 하는 세포.
청구항 42은(는) 설정등록료 납부시 포기되었습니다.

제 41항에 있어서, 상기 세포는 균류 세포인 것을 특징으로 하는 세포.
청구항 43은(는) 설정등록료 납부시 포기되었습니다.

제 42항에 있어서, 상기 세포는 아스퍼질러스(Aspergillus) 세포인 것을 특징으로 하는 세포.
청구항 44은(는) 설정등록료 납부시 포기되었습니다.

제 42항에 있어서, 상기 세포는 효모 세포인 것을 특징으로 하는 세포.
청구항 45은(는) 설정등록료 납부시 포기되었습니다.

제 44항에 있어서, 상기 세포는 사카로미세스(Saccharomyces), 클루이베로미세스(Kluyveromyces), 쉬조사카로미세스(Schizosaccharomyces) 또는 피치아(Pichia) 세포인 것을 특징으로 하는 세포.
제 41항에 따른 세포 및 배지를 포함하는 세포 배양물.
청구항 47은(는) 설정등록료 납부시 포기되었습니다.

제 46항에 있어서, 상기 배지는 제 1항에서 정의된 바와 같은 폴리펩타이드의 생성 결과로서 성숙된 원하는 단백질을 포함하는 것을 특징으로 하는 세포 배양물.
(1) 배지에서 제 40항 내지 제 46항중 어느 한 항에 따른 세포를 배양하며, 상기 세포는 제 1항, 제 8항 및 제 10항 내지 제 26항 중 어느 한 항에 정의된 바와 같은 폴리펩타이드의 생성 결과로서 배지내로 성숙된 원하는 단백질을 분비하는 단계, 및 (2) 분비된 성숙 단백질을 함유하는 배지를 상기 세포로부터 분리하는 단계를 포함하는 성숙된 원하는 단백질을 생성하는 방법.
제 48항에 있어서, 배지로부터 성숙된 원하는 단백질을 분리하고 임의로 그 성숙된 원하는 단백질을 더욱 정제하는 단계를 더욱 포함하는 것을 특징으로 하는 방법.
제 49항에 있어서, 분리된 그리고/또는 정제된 성숙된 원하는 단백질을 치료학적으로 허용가능한 캐리어 또는 희석제와 함께 배합하여 사람이나 동물 투여용으로 적합한 치료 제품으로 제조하는 단계를 더욱 포함하는 것을 특징으로 하는 방법.
삭제
삭제
(i) 알부민 리더 서열 및 성숙된 원하는 단백질의 아미노산 서열을 포함하는 미성숙 단백질을 제공하는 단계;

(ii) 상기 알부민 리더 서열 내로 아미노산 서열 모티프를 도입하는 단계; 및

(iii) 상기 미성숙 단백질을 원핵성 또는 균류 숙주 세포에 의해 분비되도록 하여 성숙 단백질을 생성하는 단계

를 포함하며, 여기서 상기 모티프는 -Phe-Ile-Val-Ser-Ile-, -Trp-Ile-Val-Ser-Ile-, -Tyr-Ile-Val-Ser-Ile-, -Phe-Leu-Val-Ser-Ile-, -Phe-Val-Val-Ser-Ile-, -Phe-Ala-Val-Ser-Ile-, -Phe-Met-Val-Ser-Ile-, -Phe-Ile-Leu-Ser-Ile-, -Phe-Ile-Ala-Ser-Ile-, -Phe-Ile-Met-Ser-Ile-, -Phe-Ile-Val-Thr-Ile-, -Phe-Ile-Val-Ser-Val-, -Phe-Ile-Val-Ser-Ala- 또는 -Phe-Ile-Val-Ser-Met-을 포함하며, 상기 모티프는 상기 알부민 리더 서열의 아미노산 위치 -20, -19, -18, -17 및 -16에 위치하며, 그 넘버링은 -1 잔기가 네이티브 알부민 리더 서열의 C-말단 아미노산이 되도록 이루어지며, 그리고 여기서 상기 모티프의 아미노산은 자연적으로 발생하는 아미노산에 대한 치환체로서 상기 아미노산 서열 내에 포함되며; 그리고

상기 성숙 단백질의 분비 수율은 상기 모티프가 없는 리더 서열을 포함하는 미성숙 단백질로부터 얻어지는 성숙 단백질의 분비 수율에 비해 증가되는 것을 특징으로 하는, 성숙 단백질의 분비 수율을 증가시키는 방법.
제 53항에 있어서, 상기 리더 서열은 알부민 분비 프리 서열 MKWVFIVSILFLFSSAYS을 포함하는 것을 특징으로 하는 방법.
삭제
삭제
삭제
제 53항에 있어서, 상기 모티프의 아미노산은 자연적으로 발생하는 아미노산에 대한 치환체로서 폴리펩타이드내에 포함되는 것을 특징으로 하는 방법.
삭제
삭제
삭제
삭제
삭제
제 54항에 있어서, 상기 알부민 분비 프리 서열은 휴먼 알부민 분비 프리 서열(MKWVFIVSILFLFSSAYS)이며, 분비 프리 서열 MKWVZ₁Z₂Z₃Z₄Z₅LFLFSSAYS를 포함하며, 여기서 Z₁, Z₂, Z₃, Z₄ 또는 Z₅ 중 하나 이상은 X₁, X₂, X₃, X₄ 또는 X₅ 중 하나 이상으로 치환되는 것을 특징으로 하는 방법.
청구항 65은(는) 설정등록료 납부시 포기되었습니다.

제 53항에 있어서, 상기 리더 서열은 분비 프로-서열을 포함하는 것을 특징으로 하는 방법.
청구항 66은(는) 설정등록료 납부시 포기되었습니다.

제 65항에 있어서, 상기 리더 서열은 알부민 분비 프리 서열을 포함하며, 이는 그 C-말단 끝에서 펩타이드 결합에 의해 분비 프로 서열의 N-말단 아미노산과 융합되어 프리-프로 서열을 형성하는 것을 특징으로 하는 방법.
청구항 67은(는) 설정등록료 납부시 포기되었습니다.

제 66항에 있어서, 상기 분비 프로 서열은

알부민 분비 프로 서열인 것을 특징으로 하는 방법.
청구항 68은(는) 설정등록료 납부시 포기되었습니다.

제 67항에 있어서, 상기 리더 서열은

MKWVFIVSILFLFSSAYSRY¹Y²Y³Y⁴Y⁵

(Y¹은 Gly 또는 Ser이며, Y²는 Val 또는 Leu이며, Y³는 Phe 또는 Asp이며, Y⁴는 Arg 또는 Lys이며 그리고 Y⁵는 Arg 또는 Lys이다.)

를 포함하는 것을 특징으로 하는 방법.
청구항 69은(는) 설정등록료 납부시 포기되었습니다.

제 68항에 있어서, Y¹은 Gly이며, Y²는 Val이며 그리고 Y³는 Phe이거나; 혹은 Y¹은 Ser이며, Y²는 Leu이며 그리고 Y³는 Asp인 것을 특징으로 하는 방법.
청구항 70은(는) 설정등록료 납부시 포기되었습니다.

제 69항에 있어서, Y⁴는 Arg이며 Y⁵는 Arg이거나; Y⁴는 Lys이며 Y⁵는 Arg이거나; Y⁴는 Lys이며 Y⁵는 Lys이거나; 혹은 Y⁴는 Arg이며 Y⁵는 Lys인 것을 특징으로 하는 방법.
제 53항에 있어서, 상기 모티프의 적어도 일부는 분비 프리 서열내에 존재하는 것을 특징으로 하는 방법.
청구항 72은(는) 설정등록료 납부시 포기되었습니다.

제 53항에 있어서, 상기 원하는 단백질의 서열은 그 N-말단 끝에서 리더 서열의 C-말단 아미노산과 융합되는 것을 특징으로 하는 방법.
제 53항에 있어서, 상기 원하는 단백질은

(a) 알부민; 또는

(b) (a)를 포함하는 융합 단백질, 또는

(c) 트랜스페린; 또는

(d) (c)를 포함하는 융합 단백질

인 것을 특징으로 하는 방법.
제 53항, 제 54항, 제 58항 및 제 64항 내지 제 73항 중 어느 한 항에 있어서, 상기 성숙 단백질의 분비 수율은 상기 모티프가 없는 리더 서열을 포함하는 미성숙 단백질로부터 얻어지는 성숙 단백질의 분비 수율에 비해 적어도 5% 증가되는 것을 특징으로 하는 방법.
청구항 75은(는) 설정등록료 납부시 포기되었습니다.

제 74항에 있어서, 상기 성숙 단백질의 분비 수율은 상기 모티프가 없는 리더 서열을 포함하는 미성숙 단백질로부터 얻어지는 성숙 단백질의 분비 수율에 비해 적어도 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 250%, 300%, 350%, 400%, 450% 또는 500% 증가되는 것을 특징으로 하는 방법.