KR20090098880A - 트랜스페린 융합 단백질 라이브러리 - Google Patents

트랜스페린 융합 단백질 라이브러리 Download PDF

Info

Publication number
KR20090098880A
KR20090098880A KR1020097014465A KR20097014465A KR20090098880A KR 20090098880 A KR20090098880 A KR 20090098880A KR 1020097014465 A KR1020097014465 A KR 1020097014465A KR 20097014465 A KR20097014465 A KR 20097014465A KR 20090098880 A KR20090098880 A KR 20090098880A
Authority
KR
South Korea
Prior art keywords
fusion protein
amino acid
protein
moiety
sequence
Prior art date
Application number
KR1020097014465A
Other languages
English (en)
Inventor
앤드류 존 터너
베이양 왕
Original Assignee
바이오렉시스 파마슈티칼 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이오렉시스 파마슈티칼 코포레이션 filed Critical 바이오렉시스 파마슈티칼 코포레이션
Publication of KR20090098880A publication Critical patent/KR20090098880A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/79Transferrins, e.g. lactoferrins, ovotransferrins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/76Albumins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/035Fusion polypeptide containing a localisation/targetting motif containing a signal for targeting to the external surface of a cell, e.g. to the outer membrane of Gram negative bacteria, GPI- anchored eukaryote proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/31Fusion polypeptide fusions, other than Fc, for prolonged plasma life, e.g. albumin
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Virology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Mycology (AREA)
  • Botany (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본원은 트랜스페린(Tf) 부분 및 인테그린 결합 도메인을 포함하는 융합 단백질 및 이의 펩티드 라이브러리를 개시한다. 본 발명은 숙주 세포에 의해 발현된 융합 단백질에서 디스플레이된 Tf 및 인테그린 펩티드 라이브러리를 스크리닝하는 방법을 포함한다. 본 발명의 융합 단백질은 효모에서 발현될 수 있는 Tf 융합 단백질을 포함한다.

Description

트랜스페린 융합 단백질 라이브러리{TRANSFERRIN FUSION PROTEIN LIBRARIES}
본 발명은 융합 단백질, 융합 단백질 라이브러리, 및 리간드, 예컨대, 인테그린(integrin) 결합 펩티드의 결합 활성을 스크리닝하기 위한 융합 단백질의 용도에 관한 것이다.
관련 출원
본원은 미국 가출원 제60/691,229호(2005년 7월 17일자로 출원됨)를 우선권 주장하는 국제특허출원 제PCT/US2006/023742호(2006년 6월 19일자로 출원됨)와 관련된다. 또한, 본원은 본원에 전체가 참고로 도입되는 미국 특허출원 제10/515,429호(2004년 11월 23일자로 출원됨); 미국 특허출원 제10/384,060호(2003년 3월 10일자로 출원됨); 및 미국 가출원 제60/406,977호(2002년 8월 30일자로 출원됨)와 관련된다.
배경기술
세포 표면 디스플레이 시스템
조합 라이브러리 스크리닝 및 선별 방법은 통상적인 연구 수단이다(Phizicky et al. (1995) Microbiological Reviews 59: 94-123). 가장 많이 활용되는 기법들 중 하나는 파지 디스플레이인데, 파지 디스플레이에서 단백질은 박테리오파지 코트 단백질과의 폴리펩티드 융합체로서 발현된 후 고정된 바이오티닐화된 리간드 또는 가용성 바이오티닐화된 리간드와의 결합에 의해 스크리닝된다. 무작위(random) 펩티드의 제시는 사상(filamentous) 박테리오파지, 예컨대, M13, fd 및 f1의 외면 상에 발현되는 키메라 단백질을 구축함으로써 종종 달성된다. 파지 디스플레이는 항체, DNA 결합 단백질, 단백질분해효소(protease) 억제제 및 효소에 성공적으로 적용되어 왔다. 문헌(Hoogenboom et al. (1997) Trends in Biotechnol. 15: 62-70; Ladner (1995) Trends in Biotechnol. 13: 426-430; Lowman et al. (1991) Biochemistry 30: 10832-10838; Markland et al. (1996) Biochemistry 35: 8045-8057; and Matthews et al. (1993) Nucleic Acids Res. 21: 1727-1734)을 참조한다.
파지 디스플레이 이외에, 여러 박테리아 세포 표면 디스플레이 방법이 개발되어 왔다. 문헌(Georgiou et al. (1997) Nat. Biotechnol. 15: 29-34)을 참조한다. 박테리아 세포 표면 디스플레이 방법 유형의 한 방법은 선모(pilus)를 형성할 수 있는 박테리아 숙주 세포의 외면 상에 라이브러리 펩티드를 디스플레이하는 이종 폴리펩티드 및 필린(pilin) 단백질(TraA) 또는 이의 일부를 포함하는 융합 단백질을 사용하는 방법이다. 본원에 전체가 참고로 도입되는 미국 특허 제5,516,637호를 참조한다.
FLITRX™ 무작위 펩티드 라이브러리(인비트로겐™ 라이프 테크놀로지스)는 구조적으로 구속된 방식으로 이. 콜라이(E. coli)의 표면 상에 도데카머(dodecamer)의 무작위 펩티드 라이브러리를 디스플레이하기 위해 박테리아 편모 단백질, 즉 FliC 및 티오레독신, 즉 TrxA를 사용한다. 문헌(Lu et al. (1995) BioTechnology 13: 366)을 참조한다. 이 시스템은 항체 에피토프 맵핑, 생박테리아 백신 전달 시스템의 개발 및 구축, 및 환경 정화 목적 및 진단을 위한 전체-세포 생물흡착제의 제조에 적용되어 왔다. 종양으로부터 유래된 상피세포 상의 종양 특이적 표적에 결합하는 펩티드 서열도 FLITRX™ 시스템의 이용을 통해 확인되어 왔다. 문헌(Brown et al. (2000) Annals of Surgical Oncology, 7(10): 743)을 참조한다.
효모 세포 표면 디스플레이 시스템은 라이브러리 스크리닝을 위해 개발되었고 파지 디스플레이 시스템 및 박테리아 디스플레이 시스템의 한계점 중 일부를 극복하는 데 있어서 성공적이었다. 효모 표면 디스플레이 시스템, 예컨대, pYD1 효모 디스플레이 벡터 키트(인비트로겐™ 라이프 테크놀로지스)는 세포 표면 상에 외래 단백질을 디스플레이하기 위해 사카로마이세스 세레비지애(Saccharomyces cerevisiae)의 a-어글루티닌(a-agglutinin) 수용체를 사용한다. a-어글루티닌 수용체는 AGA1 및 AGA2 유전자에 의해 코딩된 2개의 서브유니트로 구성된다. Aga1 단백질(Aga1p, 725개 아미노산)은 세포로부터 분비되어 효모 세포벽의 세포외 매트릭스에서 β-글루칸에 공유결합된다. Aga2 단백질(Aga2p, 69개 아미노산)은 2개의 이황화 결합을 통해 Aga1p에 결합하고 분비된 후 Aga1p와의 접촉을 통해 세포에 부착된 상태로 남는다. Aga2p의 N-말단 부분은 Aga1p에의 부착에 필요하지만, 단백 질 및 펩티드는 효모 세포 표면 상에서의 제시를 위해 C-말단에 융합될 수 있다. 어글루티닌은 일반적으로 교배 과정 동안 효모 세포들이 융합하는 데 있어서 특정한 부착점으로서 작용하는 천연 효모 단백질이다. 따라서, 어글루티닌은 세포벽 성분들로부터의 과도한 입체적 장애 없이 단백질-단백질 결합을 위해 진화되어 왔다. 본원에 전체가 참고로 도입되는 문헌(Boder et al. in "Yeast Surface Display for Directed Evolution of Protein Expression, Affinity, and Stability", Applications of Chimeric Genes and Hybrid Proteins, (Jeremy Thorner et al.), Academic Press, 2000, Vol. 328, pages 430-439); 미국 특허 제6,699,658호; 및 미국 특허 제6,423,538호를 참조한다.
그러나, 이 시스템의 결점들 중 하나는 Aga2p 단백질이 세포벽에 부착되기 위해 Aga2p-융합 단백질 및 Aga1p가 이황화 결합을 형성하는 데 필요하기 때문에, 디스플레이의 효율이 비교적 낮고, 효모 세포의 40 내지 60%만이 표면 상에 단백질을 효율적으로 디스플레이한다는 점이다. 문헌(Feldhause et al. (2003) Nat. Biotechnol. 21(2): 163-70)을 참조한다. 세포 표면 상에 모든 단백질은 아니더라도 대부분의 단백질을 제시하는 효모 디스플레이 시스템이 필요하다.
Aga1p 및 Aga2p 효모 디스플레이 시스템의 또 다른 결점은 스크리닝될 리간드가 Aga2p의 C-말단에 부착될 필요가 있다는 점이다. 그 결과, 상기 시스템은 자유 N-말단이 결합에 필요하고/하거나 활성에 필요한 펩티드를 선별하는 데에는 사용될 수 없다. 따라서, 리간드의 N-말단과 효모 세포 단백질의 결합을 필요로 하지 않는 유연한 디스플레이 시스템이 필요하다.
트랜스페린 융합 단백질
혈청 트랜스페린(Tf)은 순환계에서 철과 결합하여 트랜스페린 수용체(TfR)를 통해 철을 다양한 조직에 수송하는, 분자량이 80,000 달톤인 단량체성 당단백질이다(Aisen et al. (1980) Ann. Rev. Biochem. 49: 357-393; MacGillivray et al. (1981) J. Biol. Chem. 258: 3543-3553; 및 미국특허 제5,026,651호). Tf는 총 혈청 단백질의 약 5 내지 10% 이하를 구성하는, 가장 흔한 혈청 분자들 중 하나이다. 탄수화물 결핍 Tf는 알코올중독 개체의 혈액에서 상승된 수준으로 발견되고 글리코실화된 Tf의 수명(약 7 내지 10일)보다 더 긴 수명(약 14 내지 17일)을 나타낸다. 문헌(van Eijk et al. (1983) Clin. Chim. Acta 132: 167-171; Stibler (1991) Clin. Chem. 37: 2029-2037; Arndt (2001) Clin. Chem. 47(1): 13-27; and Stibler et al. in "Carbohydrate-deficient consumption", Advances in the Biosciences, (Ed Nordmann et al.), Pergamon, 1988, Vol. 71, pages 353-357)을 참조한다. Tf의 구조는 잘 규명되어 있고, 수용체 결합, 철 결합 및 방출, 및 탄수화물 이온 결합의 기작도 밝혀져 있다. 본원에 전체가 참고로 도입되는 미국 특허 제5,026,651호, 미국 특허 제5,986,067호 및 문헌(MacGillivray et al. (1983) J. Biol. Chem. 258(6): 3543-3546)을 참조한다.
뮤신은 고도로 글리코실화된 단백질 패밀리이다. 뮤신 및 뮤신-유사 단백질은 마이크로어레이로부터 상당한 거리를 두고 융합 단백질의 리간드 도메인을 상승시키는 데 사용되어 왔다. 지지체로부터 상당한 거리를 두고 리간드를 상승시키는 것은 수용체-발현 세포에서 디스플레이된 수용체와 리간드의 결합을 증가시킨다는 가설이 있다. 본원에 전체가 참고로 도입되는 국제특허출원 공개 제WO 01/46698호를 참조한다.
본 발명의 발명자들은 Tf 융합 단백질 라이브러리를 이미 개발하였다. 본원에 전체가 참고로 도입되는 미국 특허출원 제10/515,429호를 참조한다. 본 발명은 입체 장애를 감소시키고 리간드 결합을 증가시키도록 디자인된 줄기(stalk)-유사 잔기, 예컨대, 뮤신 또는 뮤신-유사 단백질을 함유하는 Tf 융합 단백질을 제공한다. 상기 융합 단백질은 발현된 Tf 융합 단백질이 펩티드 스크리닝 플랫폼으로서 사용될 수 있도록 숙주 세포, 예컨대, 효모의 표면 상에서 발현되고 디스플레이될 수 있다. 또한, 상기 융합 단백질의 Tf 및 리간드 부분은 절단되어 치료제로서 사용될 수 있다. 이것은 N-말단 융합된 Aga2 단백질의 제거가 Tf에 연결된 작은 리간드의 구조에 영향을 줄 가능성이 높기 때문에 기존 효모 디스플레이 기법에 의해서는 달성될 수 없다.
도 1은 Tf 융합 단백질 상에 디스플레이된 무작위(random) 펩티드 또는 CDR 라이브러리 및 리간드와 표적의 결합을 보여준다.
도 2는 효모 YIR019C 글리코실-포스파티딜-이노시톨(GPI) 고착자(anchor) 펩티드 서열을 보여주는데, 세포막 부착을 담당하는 아미노산들은 진하게 표시되어 있다.
도 3은 pREX0549에 대한 벡터 맵을 보여준다.
도 4는 pREX0995에 대한 벡터 맵을 보여준다.
도 5는 pREX0667에 대한 벡터 맵을 보여준다.
도 6은 pREX1012에 대한 벡터 맵을 보여준다.
도 7은 pREX0759에 대한 벡터 맵을 보여준다.
도 8은 2회의 MACS 분리의 후 Flag-태그를 갖는 효모의 존재를 보여준다.
도 9는 pREX0855에 대한 벡터 맵을 보여준다.
도 10은 pREX1087에 대한 벡터 맵을 보여준다.
도 11은 pREX1106에 대한 벡터 맵을 보여준다.
도 12는 MUC1 및 AGA1을 사용한 형광-활성화된 세포 분류(FACS) 분석을 보여준다.
도 13은 pREX1106을 프라이머 P1980/P2181 및 P2127/P1173으로 증폭시켜 수득한 단편 A 및 B를 보여준다.
도 14는 인테그린 결합 아미노산 서열 Arg-Gly-Asp(RGD) 트랜스바디(transbody)와 인테그린의 직접적인 결합을 보여준다.
도 15는 RGD 트랜스바디 결합의 경합 결합 분석을 보여준다.
도 16은 RGD 트랜스바디 클론에 의한 마우스 혈소판 응집의 억제를 보여준다.
도 17은 효모에서 발현된 hMUC3 변이체의 FACS 분석을 보여준다.
도 18은 pREX0757에 대한 벡터 맵을 보여준다.
도 19는 pREX1234에 대한 벡터 맵을 보여준다.
도 20은 pREX1235에 대한 벡터 맵을 보여준다.
도 21은 Flag-태그를 갖는 Tf를 발현하는 포유동물 세포로부터 얻은 용해물을 사용하여 제조되고 항-Flag 또는 항-Tf 항체로 프로빙된 웨스턴 블롯을 보여준다.
도 22는 노출된 원형질막 단백질의 웨스턴 블롯을 보여준다.
도 23은 pREX1235의 FACS 분석을 보여준다.
발명의 개요
하기에 더 상세히 기재되는 바와 같이, 본 발명은 Tf 부분을 갖는 융합 단백질을 포함한다. 본 발명의 한 실시양태에서, 상기 융합 단백질은 Tf 부분, 줄기 부분 및 세포벽 연결 부재를 포함한다. 본 발명의 이 실시양태에서, 상기 융합 단백질은 세포의 세포 표면 상에서 발현되어 세포벽 연결 부재에 의해 세포벽에 연결된다. 본 발명의 또 다른 실시양태에서, 상기 융합 단백질은 고착자, 예를 들어, GPI 고착자를 통해 세포막에 연결되어 있는 Tf 부분을 포함한다.
본 발명의 Tf 부분은 Tf 단백질 또는 이의 일부를 포함한다. 예를 들어, Tf 부분은 Tf 단백질의 N 도메인, 즉 로브(lobe)의 일부일 수 있다. Tf 부분은 단백질의 Tf 부분이 야생형 Tf에 비해 감소된 글리코실화를 나타내도록 변경된 Tf 단백질일 수 있다. 본 발명의 한 실시양태에서, 융합 단백질의 Tf 부분은 글리코실화를 전혀 나타내지 않는다. 본 발명의 또 다른 실시양태에서, 융합 단백질의 Tf 부분은 이 Tf 부분이 야생형 Tf에 비해 철 또는 중탄산염에 대한 감소된 친화성 및/또는 TfR에 대한 감소된 친화성을 나타내도록 변경되어 있다. Tf 부분은 이 Tf 부분이 TfR, 철 또는 중탄산염에 결합할 수 없도록 변경될 수 있다. 따라서, 본 발명은 Tf 부분이 글리코실화 부위, 철 결합 부위, 힌지(hinge) 부위, 중탄산염 결합 부위 및 수용체 결합 부위로 구성된 군으로부터 선택된 1개 이상의 부위에서 변경되어 있는 변경된 Tf 부분을 포함한다.
본 발명의 리간드는 다양한 방식으로 Tf 부분에 결합될 수 있거나 융합될 수 있다. 또한, Tf 부분은 그 자신과 연결된 1개 이상의 리간드를 가질 수 있다. 리간드 부분은 Tf 부분의 N-말단 또는 C-말단에 융합될 수 있거나 Tf 부분 내에 위치할 수 있다. 본 발명의 한 실시양태에서, 리간드는 Asp33, Asn55, Asn75, Asp90, Gly257, Lys280, His289, Ser298, Ser105, Glu141, Asp166, Gln184, Asp197, Lys217, Thr231 및 Cys241 아미노산 위치로 구성된 군으로부터 선택된 N-로브(N1 또는 N2)의 1개 이상의 아미노산 위치에서 삽입되어 있다.
또한, 본 발명은 Tf 부분의 노출된 루프(loop) 상에 위치된 리간드를 포함한다. 융합 단백질은 예를 들어, Tf 융합 단백질 및 리간드를 코딩하는 벡터를 숙주 세포 내에서 발현시켜 리간드 부분이 Tf 부분과 인-프레임(in-frame)으로 존재하도록 구축될 수 있다.
또 다른 실시양태에서, 리간드 부분은 Tf 부분 내에 존재하는 1개 이상의 무작위화된 표면 노출된 아미노산 잔기를 포함할 수 있다. 예를 들어, Tf 부분은 약 3, 약 4, 약 5, 약 6, 약 7, 약 8, 약 9 또는 약 10개 또는 그 이상의 무작위화된 표면 노출된 아미노산 잔기를 포함할 수 있다. 한 실시양태에서, Tf 융합 단백질 또는 Tf 단백질의 라이브러리는 약 6개의 표면 노출된 아미노산 잔기를 사용하여 구축한다. Tf의 표면 노출된 아미노산은 당업계에 공지되어 있는 돌연변이유발 기법을 이용하여 무작위화할 수 있다. 무작위화된 아미노산 잔기들은 노출된 영역 내에서 연속적으로 존재할 수 있거나 군집 형태로 존재할 수 있다. Tf의 표면 노출된 영역은 약 85 내지 약 92 위치, 약 276 내지 약 298 위치, 또는 약 207 내지 약 217 위치의 아미노산을 포함하나 이들로 한정되지 않는다.
리간드는 단일쇄 항체, 항체, 항체 단편, 항체 가변 영역, 무작위 펩티드 또는 항체 상보성-결정 영역(CDR)을 포함하나 이들로 한정되지 않는 많은 형태를 취할 수 있다. 리간드는 가변 또는 무작위 영역 및 비가변 영역을 포함할 수 있다. 한 실시양태에서, 리간드는 무작위 펩티드이다. Tf 부분과 함께 발현되는 무작위 펩티드 리간드 부분은 오류 유발(error prone) PCR 및 DNA 셔플링(shuffling)을 포함하나 이들로 한정되지 않은, 당업계에 공지되어 있는 많은 방법에 의해 발생될 수 있다. 리간드 부분은 Tf 융합 단백질이 이미 번역된 후 Tf 융합 단백질에 부가될 수도 있다.
리간드는 원하는 리간드일 수 있거나 리간드 라이브러리에 있는 리간드들 중 한 리간드일 수 있다. 리간드는 1개 이상의 수용체 결합할 수 있거나 펩티드, 항원, 수용체, 항체, 독소, 대사물질 및 핵산과 같은 물질에 결합할 수 있다.
본 발명의 한 실시양태에서, 리간드는 리간드 결합 서열 내에 또는 리간드 결합 서열과 매우 인접한 위치에서 1개 이상의 무작위화된 아미노산을 포함하는 공지된 리간드 결합 서열이다. 예를 들어, 리간드는 RGD 서열의 어느 한 측면 또는 양 측면을 플랭킹하는 1개 이상의 무작위화된 아미노산 잔기를 갖는 RGD일 수 있다. 본 발명의 한 실시양태에서, 리간드는 CXXXRGDXXXC이고, 이때 X는 무작위화된 아미노산 잔기이다. 본 발명의 추가 실시양태에서, 리간드는 XXXRGDXXX이다.
전술한 바와 같이, 한 실시양태에서, 융합 단백질은 줄기 부분을 포함한다. 상기 줄기 부분은 그의 N-말단이 Tf 부분에 융합되어 있고 그의 C-말단이 세포, 예를 들어, 세포벽에 위치하도록 배향될 수 있다. 한 실시양태에서, 줄기 부분의 C-말단은 고착자 부분에 융합되어 있다. 한 실시양태에서, 본 발명의 줄기 부분은 효모 세포의 세포벽에 걸쳐 있고 일반적으로 중도 내지 고도로 글리코실화된 펩티드이다. 줄기 부분은 세포벽에 걸쳐 있음으로써 세포벽을 통해 융합 단백질을 부착시키는 세포벽 연결 부재로서 작용할 수 있다. 본 발명의 또 다른 실시양태에서, 줄기 부분은 세포벽에 걸쳐 있고 세포 표면 상에 부분적으로 디스플레이되어 있다. 줄기 부분의 조성은 입체 장애를 감소시키는 막대-유사 구조를 줄기 부분에 부여할 수 있는데, 상기 막대-유사 구조가 줄기 부분에 부여되지 않으면 줄기 부분은 융합 단백질, 특히 리간드와 숙주 세포 사이에 존재할 것이다.
줄기 부분은 뮤신, 뮤신 변이체 또는 이들의 단편을 포함할 수 있거나 뮤신, 뮤신 변이체 또는 이들의 단편으로 구성된다. 뮤신 도메인은 예를 들어, MUC1, MUC2, MUC3, MUC4, MUC5AC, MUC5B, MUC6, MUC7, MUC8, MUC9, MUC10, MUC11, MUC12, MUC13, MUC14, MUC15, MUC16, MUC17, MUC18, MUC19, MUC20, MUC21 및 이들의 변이체를 포함할 수 있다. 한 실시양태에서, 줄기 부분은 인간 MUC 도메인, 예컨대, 서열번호 5의 핵산 서열 또는 이의 단편에 상응하는 펩티드를 포함한다. 또 다른 실시양태에서, 줄기 부분은 뮤신의 반복부(repeat)를 2개 이상, 예를 들어, MUC1 또는 MUC3의 반복부를 2개 이상 포함한다. 추가 실시양태에서, 줄기 부분은 MUC1, MUC2, MUC3, MUC4, MUC5AC, MUC5B, MUC6, MUC7, MUC8, MUC9, MUC10, MUC11, MUC12, MUC13, MUC14, MUC15, MUC16, MUC17, MUC18, MUC19, MUC20 및 MUC21로 구성된 군으로부터 선택된 2개 이상의 뮤신 단백질, 또는 이들의 변이체 또는 단편을 포함한다. 뮤신 변이체 및 다른 줄기 단백질들의 변이체는 당업계에 공지되어 있는 방법, 예를 들어, 무작위화된 돌연변이유발에 의해 제조될 수 있다.
줄기 부분은 천연 효모 세포벽 단백질을 비롯한, 중도 내지 고도로 글리코실화된 다른 단백질들도 포함하거나 상기 다른 단백질들로 구성될 수 있다. 예를 들어, 본 발명의 한 실시양태에서, 줄기 부분은 Aga1, Aga1의 변이체 또는 이의 단편을 포함하거나 Aga1, Aga1의 변이체 또는 이의 단편으로 구성된다.
본 발명의 융합 단백질은 융합 단백질을 숙주 세포에 고정시키거나 부착시키는 역할을 수행하는 세포벽 연결 부재도 포함할 수 있다. 상기 세포벽 연결 부재는 본 발명의 융합 단백질을 효모 세포벽에 공유결합시키거나 비-공유결합시킬 수 있다. 본 발명의 한 실시양태에서, 융합 단백질의 줄기 부분은 세포벽 연결 부재이다. 예를 들어, 줄기 부분의 O-글리칸은 세포벽의 β-글루칸에 가교결합할 수 있다. 다른 세포벽 연결 부재는 자유 시스테인 잔기를 포함하는 펩티드를 포함하나 이들로 한정되지 않는다. 예를 들어, 1개 이상의 페어링되지 않은 시스테인 잔기를 포함하는 줄기 부분 또는 고착자 부분은 세포벽 내의 단백질의 1개 이상의 비-페어링된 시스테인 잔기와 이황화 결합을 형성할 수 있다.
본 발명의 융합 단백질은 Tf 용합 단백질을 숙주 세포에 고정시키거나 부착시키는 역할도 수행하는 고착자 부분을 포함하거나 포함하지 않을 수 있다. 상기 고착자 부분은 세포벽 연결 부재일 수 있거나 융합 단백질을 세포벽에 부착시킬 수 있다.
본 발명의 융합 단백질을 특히, 효모 세포막에 부착시킬 수 있는 한 고착 도메인은 번역 후 단백질 변경을 통해 GPI 신호 펩티드 서열, 예컨대, 서열번호 15로 표시되는 신호 펩티드 서열 내의 ω-부위에 부가되는 GPI 펩티드 고착자이다. GPI 펩티드 고착자는 본 발명의 융합 단백질을 고등 진핵세포의 세포막, 예를 들어, 포유동물 세포의 세포막 또는 식물세포의 세포막에 고착시키는 데 사용될 수도 있다. 본 발명의 한 실시양태에서, 변경된 GPI 신호 서열에 의해 제공되는 고착자와 같은 고착자는 절단되기 전에 융합 단백질을 숙주세포의 세포막 또는 세포벽에 일시적으로 부착시킨다. 일단 절단되면 융합 단백질은 줄기 부분의 글리칸이 세포벽의 β-글리칸으로 가교결합됨으로써 세포벽 결합 부재를 통해 세포에 부착된 상태로 남는다.
본 발명의 또 다른 실시양태에서, 고착자는 경막(transmembrane) 도메인(TMD)이다. TMD는 단회 통과(single pass) I형 또는 II형 막 단백질의 영역일 수 있거나 다회 통과(multispan) 막 단백질의 여러 경막 영역들 중 임의의 한 경막 영역일 수 있다.
본 발명은 본 발명의 융합 단백질을 코딩하는 핵산 분자도 포함한다. 상기 핵산 분자는 벡터 내에 삽입되어 숙주 세포, 예컨대, 효모를 형질전환시키는 데 사용될 수 있다. 숙주 세포는 일단 본 발명의 핵산으로 형질전환되면 융합 단백질을 발현할 수 있다. 융합 단백질의 발현 유도는 당업계에 공지되어 있는 방법, 예를 들어, 유도성 프로모터의 사용에 의해 조절될 수 있다. 본 발명은 숙주 세포들의 군집, 예를 들어, 무작위 펩티드를 디스플레이하는 본 발명의 융합 단백질을 발현하는 효모 세포의 군집에서 발현된 융합 단백질들로 구성된 라이브러리를 포함한다.
본 발명의 또 다른 실시양태에서, 융합 단백질은 리간드 또는 물질의 결합 활성에 대해 스크리닝하는 데 사용된다. 본 발명의 융합 단백질을 발현할 수 있는 숙주 세포로 구성된 라이브러리는 항원 또는 수용체를 포함하나 이들로 한정되지 않은 물질에 노출된 후 결합 활성에 대해 스크리닝될 수 있다. 세포 표면 라이브러리는 FACS 및 자기 비드를 포함하나 이들로 한정되지 않은, 당업계에 공지되어 있는 방법을 통해 스크리닝될 수 있다.
발명의 상세한 설명
일반적 설명
본 발명의 발명자들은 예를 들어, 라이브러리, 예컨대, 무작위 펩티드 또는 CDR 라이브러리를 스크리닝하기 위한 세포 표면 디스플레이 시스템의 일부로서 사용될 수 있는 다작용성 융합 단백질을 개발하였다. 상기 융합 단백질은 1개 이상의 리간드에 결합되어 있거나 융합되어 있는 Tf 부분을 포함한다. 상기 Tf 부분은 표면 노출된 아미노산 잔기를 무작위화함으로써 리간드로서 작용할 수도 있다.
본 발명은 Tf 이외의 다른 단백질이 가용성을 나타내고 융합 단백질의 나머지 부분으로부터 절단된 경우 또는 융합 단백질의 나머지 부분 없이 재구축된 경우 증가된 혈청 반감기를 융합된 1가지 이상의 리간드에 부여할 수 있는 한 상기 다른 단백질을 포함하는 융합 단백질을 포함한다. 예를 들어, 알부민 또는 이의 변이체 또는 단편이 Tf 대신에 사용될 수 있다.
본 발명의 한 실시양태에서, 융합 단백질의 Tf 부분은 중도 내지 고도로 글리코실화되어 있는 줄기 부분에 융합되어 있다. 본 발명의 이 실시양태에서, 융합 단백질은 융합 단백질을 효모 세포의 세포벽에 공유결합시키거나 비-공유결합시킬 수 있는 세포벽 연결 부재를 포함한다.
본 발명의 또 다른 실시양태에서, 융합 단백질은 고착자 부분, 예컨대, 경막 도메인을 포함한다. 융합 단백질은 GPI 고착자를 통해 세포막에 고착될 수도 있다. 이러한 고착자는 포유동물 세포 상에 본 발명의 융합 단백질을 발현시키는 데 사용될 수 있다. 본 발명의 융합 단백질이 줄기 부분 및 고착자 부분 둘다를 포함할 수 있지만, 본 발명은 줄기 부분을 포함하고 고착자 부분을 포함하지 않는 융합 단백질뿐만 아니라 고착자 부분을 포함하고 줄기 부분을 포함하지 않는 융합 단백질도 포함한다.
본 발명의 한 실시양태에서, 융합 단백질은 효모에서 발현된다. 이러한 융합 단백질은 Aga1p 및 Aga2p 효모 디스플레이 시스템에 비해 세포 표면에 디스플레이된 펩티드를 갖는 클론의 비율을 증가시킨다는 점을 비롯하여 선행기술에 비해 개선된 이점을 제공한다. 본 발명의 융합 단백질은 결합을 위해 이용가능한 N-말단을 필요로 하는 리간드를 스크리닝하는 유연성도 제공한다. 또한, 본 발명의 융합 단백질이 포유동물 세포의 세포막에 고착됨으로써 본 발명의 융합 단백질은 포유동물 상에서 발현되어 제시될 수 있다.
또한, 본 발명은 융합 단백질 또는 이의 일부를 포함하는 치료 조성물, 및 융합 단백질 또는 이의 일부를 질환 또는 장애의 치료, 예방 또는 경감이 필요한 개체에게 투여하여 질환 또는 장애를 치료하거나, 예방하거나 경감시키는 방법을 포함한다. 본 발명의 융합 단백질은 적어도 잠재적 치료 단백질의 단편 또는 변이체를 리간드 부분으로서 포함한다. 본 발명의 한 실시양태에서, Tf 및 리간드, 즉 융합 단백질의 치료제 부분은 세포로부터 절단되어 생약 또는 백신의 제조에 사용될 수 있다. 예를 들어, 융합 단백질의 치료제 부분은 줄기 부분 또는 고착자로부터 절단될 수 있다.
정의
본원에서 사용된 바와 같이, 용어 "생물학적 활성"은 생물학적 면에서, 즉 유기체 또는 이의 시험관내 모델에서 치료 분자, 리간드 부분, 단백질 또는 펩티드에 의해 발휘되는 기능 또는 일련의 활성을 지칭한다. 생물학적 활성은 본 발명의 융합 단백질의 치료 분자 부분의 기능, 예컨대, 반응성 세포주로부터의 세포외 매트릭스 분비의 유도, 호르몬 분비의 유도, 화학주성의 유도, 유사분열의 유도, 분화의 유도 및 반응성 세포의 세포 분열 억제를 포함할 수 있으나 이들로 한정되지 않는다. 본 발명의 융합 단백질 또는 펩티드는 이것이 그의 치료 단백질의 천연 대응물(counterpart)의 1가지 이상의 생물학적 활성을 나타내는 경우 생물학적 활성을 나타낸다고 간주된다.
본원에서 사용된 바와 같이, Tf 서열에서 "에 상응하는 아미노산" 또는 "등가의 아미노산"은 제1 Tf 서열과 1개 이상의 제2 Tf 서열 사이의 동일성 또는 유사성을 최대화하기 위한 정렬에 의해 확인된다. 제2 Tf 서열에서 등가의 아미노산을 확인하는 데 사용되는 수는 제1 Tf 서열에서 상응하는 아미노산을 확인하는 데 사용된 수를 기초로 한다. 일부 경우, 상기 어구들은 토끼 혈청 Tf의 특정 잔기와 비교하여 인간 Tf의 아미노산 잔기를 설명하는 데 사용될 수 있다.
본원에서 사용된 바와 같이, 용어 "Tf 부분", "Tf 단백질의 단편", "Tf 단백질" 또는 "Tf 단백질의 일부"는 천연 발생 Tf 단백질 또는 이의 변이체의 약 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 또는 100%를 구성하는 아미노산 서열을 지칭한다.
본원에서 사용된 바와 같이, 용어 "유전자"는 생물학적 기능과 관련된 DNA의 임의의 분절을 지칭한다. 따라서, 유전자는 코딩 서열, 및/또는 이의 발현에 필요한 조절 서열을 포함하나 이들로 한정되지 않는다. 유전자는 예를 들어, 다른 단백질에 대한 인식 서열을 형성하는 비-발현되는 DNA 분절도 포함할 수 있다. 유전자는 원하는 공급원으로부터의 클로닝 또는 공지되어 있거나 예측되는 서열 정보로부터의 합성을 비롯한 다양한 공급원으로부터 수득될 수 있고 원하는 파라미터를 갖도록 디자인된 서열들을 포함할 수 있다.
본원에서 사용된 바와 같이, "이종 폴리뉴클레오티드", "이종 핵산", "이종 유전자", "이종 서열" 또는 "외래 DNA 분절"은 특정 숙주 세포에 대해 외래물질인 공급원으로부터 유래된 폴리뉴클레오티드, 핵산 또는 DNA 분절, 또는 동일한 공급원으로부터 유래된 경우 원래 형태로부터 변경되어 있는 폴리뉴클레오티드, 핵산 또는 DNA 분절을 지칭한다. 숙주 세포 내의 이종 유전자는 특정 숙주 세포에 대해 내재물질이만 변경되어 있는 유전자를 포함한다. 따라서, 상기 용어들은 세포에 대해 외래물질이거나 이종물질인 DNA 분절, 또는 세포에 대해 동종물질이지만 숙주 세포의 핵산 내에서 원래 발견되지 않는 위치에 존재하는 DNA 분절을 지칭한다. 예를 들어, 효모 세포에 대해 천연물질이지만 인간 Tf 서열에 부착되어 있는 신호 서열은 이종물질이다.
본원에서 사용된 바와 같이, "단리된" 핵산 서열은 다른 핵산 서열을 본질적으로 포함하지 않는 핵산 서열, 예를 들어, 아가로스 겔 전기영동에 의한 측정 시 순도가 약 20% 이상, 바람직하게는 순도가 약 40% 이상, 더 바람직하게는 순도가 약 60% 이상, 훨씬 더 바람직하게는 순도가 약 80% 이상, 가장 바람직하게는 순도가 약 90% 이상, 훨씬 더 바람직하게는 순도가 약 95% 이상인 핵산 서열을 지칭한다. 예를 들어, 단리된 핵산 서열은 핵산을 그의 원래 위치로부터 그 자신이 다시 생성되는 상이한 부위로 재위치화시키기 위한 유전공학적 기법에서 이용되는 표준 클로닝 절차에 의해 수득될 수 있다. 클로닝 절차는 폴리펩티드를 코딩하는 핵산 서열을 포함하는 원하는 핵산 단편의 절단 및 단리, 벡터 분자 내로의 상기 단편의 삽입, 및 핵산 서열의 다수의 복제물 또는 클론이 복제될 숙주 세포 내로의 재조합 벡터의 도입을 포함할 수 있다. 핵산 서열은 게놈, cDNA, RNA, 반합성 핵산 서열, 합성 핵산 서열 또는 이들의 조합물일 수 있다.
본원에서 사용된 바와 같이, 2개 이상의 DNA 코딩 서열들은 DNA 코딩 서열들 사이의 인-프레임 융합의 결과로서 DNA 코딩 서열들이 융합 폴리펩티드로 번역되는 경우 "연결되어" 또는 "융합되어" 있다고 기재된다. 융합 단백질을 언급할 때 용어 "융합"은 리간드 부분, 줄기 부분 및 고착자 부분을 포함한다. Tf 융합 단백질은 Tf 부분과 줄기 부분의 융합체이고 세포벽 결합 부재를 포함한다.
본원에서 사용된 바와 같이, "변경된 Tf"는 야생형 Tf에 비해 그의 아미노산 서열의 1가지 이상의 변경을 나타내는 Tf 분자를 지칭한다.
본원에서 사용된 바와 같이, "변경된 Tf 융합 단백질"은 줄기 부분에 융합된 리간드에 결합된 또는 융합된 1개 이상의 변경된 Tf(또는 이의 단편 또는 변이체) 분자의 융합에 의해 형성된 단백질을 지칭한다.
본원에서 사용된 바와 같이, 용어 "핵산" 또는 "폴리뉴클레오티드"는 단일 가닥 또는 이중 가닥 형태의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 및 이들의 중합체를 지칭한다. 달리 한정하지 않는 한, 상기 용어들은 기준 핵산과 유사한 결합 성질을 나타내고 천연 발생 뉴클레오티드와 유사한 방식으로 대사되는 천연 뉴클레오티드의 유사체를 포함하는 핵산을 포괄한다. 달리 명시하지 않는 한, 특정 핵산 서열은 그의 보존적으로 변경된 변이체(예를 들어, 축퇴 코돈 치환) 및 상보적 서열뿐만 아니라 명시적으로 표시된 서열도 함축적으로 포괄한다. 구체적으로, 축퇴 코돈 치환은 1개 이상의 선택된 (또는 모든) 코돈의 제3 위치가 혼합된-염기 및/또는 데옥시이노신 잔기들로 치환되어 있는 서열을 발생시킴으로써 달성할 수 있다(Batzer et al. (1991) Nucleic Acid Res. 19: 5081; Ohtsuka et al. (1985) J. Biol. Chem. 260: 2605-2608; Cassol et al. (1992); Rossolini et al. (1994) Mol. Cell. Probes 8: 91-98). 용어 "핵산"은 유전자, cDNA, 및 유전자에 의해 코딩된 mRNA와 상호교환적으로 사용된다.
본원에서 사용된 바와 같이, DNA 분절은 이 DNA 분절이 또 다른 DNA 분절과 기능적 관계에 놓여 있을 경우 "작동가능하게 연결"되어 있다고 기재된다. 예를 들어, 신호 서열에 대한 DNA는 이것이 융합 단백질의 분비에 참여하는 전구단백질로서 발현되는 경우 본 발명의 융합 단백질을 코딩하는 DNA에 작동가능하게 연결되어 있고, 프로모터 또는 인핸서(enhancer)는 이것이 코딩 서열의 전사를 자극하는 경우 상기 코딩 서열에 작동가능하게 연결되어 있다. 일반적으로, 작동가능하게 연결되어 있는 DNA 서열들은 인접하여 위치하고, 신호 서열 또는 융합 단백질의 경우 둘다 인접하여 인-프레임으로 위치한다. 그러나, 인핸서는 이것에 의해 전사가 조절되는 코딩 서열들과 인접하여 위치할 필요가 없다. 따라서, 연결은 편리한 제한효소 인식 부위 또는 이 부위 대신에 삽입된 어댑터(adapter) 또는 링커에서의 라이게이션(ligation)에 의해 달성된다.
본원에서 사용된 바와 같이, 용어 "프로모터"는 전사를 개시하는 RNA 중합효소가 결합하는 데 관여하는 DNA의 한 영역을 지칭한다.
본원에서 사용된 바와 같이, 용어 "재조합"은 재조합 DNA를 사용한 형질전환을 겪는 세포, 조직 또는 유기체를 지칭한다.
본원에서 사용된 바와 같이, 표적화제, 단백질, 폴리펩티드 또는 펩티드는 특정 세포, 예를 들어, 정상 세포, 예컨대, 림프구, 또는 비정상 세포, 예컨대, 암세포에 특이적으로 결합하여 그 세포에 Tf 융합 단백질 또는 화합물(약물 또는 세포독성제)을 특이적으로 표적화하는 데 사용될 수 있는 분자를 지칭한다.
본원에서 사용된 바와 같이, "치료 단백질"은 한 가지 이상의 치료적 활성 및/또는 생물학적 활성을 나타내는, 단백질, 폴리펩티드, 항체, 펩티드, 또는 이들의 단편 또는 변이체를 지칭한다. 본 발명에 의해 포괄되는 치료 단백질은 단백질, 폴리펩티드, 펩티드, 항체 및 생물학적 물질을 포함하나 이들로 한정되지 않는다. 용어 "펩티드", "단백질" 및 "폴리펩티드"는 본원에서 상호교환가능하게 사용된다. 또한, 용어 "치료 단백질"은 치료 단백질의 내재성 관련물(correlate) 또는 천연 발생 관련물을 지칭할 수도 있다. "치료적 활성"을 나타내는 폴리펩티드 또는 "치료적 활성"을 나타내는 단백질이라 함은 치료 단백질, 예컨대, 본원에 기재된 치료 단백질들 또는 당업계에 공지되어 있는 치료 단백질들 중 1가지 이상의 치료 단백질과 관련된 1가지 이상의 공지된 생물학적 및/또는 치료적 활성을 보유하는 폴리펩티드를 의미한다. 비-제한적 예로서, "치료 단백질"은 질환, 병태 또는 장애를 치료하거나, 예방하거나 경감시키는 데 유용한 단백질이다. 상기 질환, 병태 또는 장애는 인간 또는 비-인간 동물, 예컨대, 수의학적 용도에서 사용될 수 있다.
본원에서 사용된 바와 같이, 용어 "형질전환"은 핵산, 즉 뉴클레오티드 중합체가 세포 내로 전달되는 것을 지칭한다. 본원에서 사용된 바와 같이, 용어 "유전적 형질전환"은 세포 내로의 DNA, 특히 재조합 DNA의 전달 및 도입을 지칭한다.
본원에서 사용된 바와 같이, 용어 "형질전환체"는 형질전환을 겪는 세포, 조직 또는 유기체를 지칭한다.
본원에서 사용된 바와 같이, 용어 "형질전이유전자(transgene)"는 그의 기능이 보장되는 방식으로 유기체, 숙주 세포 또는 벡터 내로 삽입되는 핵산을 지칭한다.
본원에서 사용된 바와 같이, 용어 "형질전환" 세포, 세포 배양물, 유기체, 박테리아, 진균, 동물, 식물 및 이들의 자손은 다양한 형질전환 방법들 중 한 방법에 의해 외래 또는 변경된 유전자, 특히 변경된 Tf 융합 단백질을 코딩하는 유전자를 제공받은 세포, 세포 배양물, 유기체, 박테리아, 진균, 동물, 식물 및 이들의 자손을 지칭하고, 이때 외래 또는 변경된 유전자는 이 외래 또는 변경된 유전자를 제공받은 유기체의 종과 동일한 또는 상이한 종으로부터 유래된다.
"변이체들 또는 변이체"는 기준 핵산 또는 폴리펩티드와 구별되지만 이들의 본질적인 성질을 보유하는 폴리뉴클레오티드 또는 핵산을 지칭한다. 일반적으로, 변이체는 기준 핵산 또는 폴리펩티드와 전체적으로 매우 유사하고 많은 영역에서 기준 핵산 또는 폴리펩티드와 동일하다. 본원에서 사용된 바와 같이, "변이체"는 서열 면에서 천연 치료 단백질과 구별되지만 본원의 다른 곳에서 기재되어 있거나 당업계에 공지되어 있는 1가지 이상의 기능적 및/또는 치료적 성질을 보유하는 본 발명의 Tf 융합 단백질의 치료 단백질 부분을 지칭한다.
본원에 사용된 바와 같이, 용어 "벡터"는 넓게는 외래 핵산을 코딩하는 임의의 플라스미드, 파지미드 또는 바이러스를 지칭한다. 또한, 상기 용어는 비리온 또는 세포 내로의 핵산의 전달을 용이하게 하는 비-플라스미드, 비-파지미드 및 비-바이러스 화합물, 예컨대, 폴리라이신 화합물 등을 포함하는 것으로 해석된다. 벡터는 핵산 또는 이의 변이체를 세포로 전달하기 위한 전달 비히클로서 적합한 바이러스 벡터 또는 비-바이러스 벡터일 수 있다. DNA를 세포 및 조직으로 전달하기 위한 바이러스 벡터 및 비-바이러스 벡터의 예는 당업계에 잘 공지되어 있고 예를 들어, 문헌(Ma et al., 1997, Proc. Natl. Acad. Sci. U.S.A. 94: 12744-12746)에 기재되어 있다. 바이러스 벡터의 예로는 재조합 백시니아 바이러스, 재조합 아데노바이러스, 재조합 레트로바이러스, 재조합 아데노-관련 바이러스, 재조합 조류 수두 바이러스 등을 들 수 있으나 이들로 한정되지 않는다(Cranage et al., 1986, EMBO J. 5: 3057-3063; 국제특허출원 공개 제WO 94/17810호(1994년 8월 18일자로 공개됨); 및 국제특허출원 공개 제WO 94/23744호(1994년 10월 27일자로 공개됨). 비-바이러스 벡터의 예로는 리포좀, DNA의 폴리아민 유도체 등을 들 수 있으나 이들로 한정되지 않는다.
본원에서 사용된 바와 같이, 용어 "야생형"은 천연 발생 폴리뉴클레오티드 또는 폴리펩티드 서열을 지칭한다.
본원에서 사용된 바와 같이, "스카폴드(scaffold) 단백질", "스카폴드 폴리펩티드" 또는 "스카폴드"는 아미노산 서열, 예컨대, 무작위 펩티드가 융합될 수 있는 단백질을 지칭한다. 상기 펩티드는 스카폴드에 대해 외래물질이다.
본원에서 사용된 바와 같이, "무작위 펩티드 서열"은 1개 이상의 아미노산 단량체로 구성되어 있으며 확률적 방법 또는 무작위 방법에 의해 구축된 아미노산 서열을 지칭한다. 무작위 펩티드는 불변 서열을 포함할 수 있는 골격 또는 스카폴드 모티프를 포함할 수 있다. 무작위 펩티드 서열은 비-변이체, 즉 비-무작위 아미노산들의 일부를 포함할 수 있다.
본원에서 사용된 바와 같이, "무작위 펩티드 라이브러리"는 무작위 펩티드 세트를 코딩하는 폴리뉴클레오티드 서열 세트, 이 폴리뉴클레오티드 서열에 의해 코딩된 무작위 펩티드 세트, 및 이 무작위 펩티드를 포함하는 융합 단백질을 지칭한다.
본원에서 사용된 바와 같이, 용어 "슈도무작위(pseudorandom)"는 예를 들어, 한 위치에서의 잔기 변동가능성 정도가 또 다른 위치에서의 잔기 변동가능성 정도와 상이하도록 한정된 변동가능성을 갖는 서열 세트를 지칭하지만, 임의의 슈도무작위 위치는 어느 정도의 한정된 잔기 변동을 허용한다.
본원에서 사용된 바와 같이, 용어 "소정의 서열 골격"은 비-무작위적 기초, 일반적으로 실험 데이터 또는 구조적 데이터를 기초로 선별된 소정의 서열 세트를 지칭하고, 예를 들어, 소정의 서열 골격은 β-시트 구조를 형성할 것으로 예측되는 아미노산 서열 세트를 포함할 수 있거나 다른 변경들 중에서 류신 지퍼 헵타드(heptad) 반복부 모티프 또는 징크-핑거(zinc-finger) 도메인을 포함할 수 있다. "소정의 서열 핵"은 한정된 범위의 변동가능성을 포괄하는 서열 세트이다. 20가지 보편적 아미노산들로 구성된 완전 무작위 10-머 서열은 (2O)10개의 서열들 중 임의의 서열일 수 있는 반면, 20가지 보편적 아미노산들로 구성된 슈도무작위 10-머 서열은 (2O)10개의 서열들 중 임의의 서열일 수 있으나 일부 위치에서 일부 잔기에 대한 변동을 우세하게 일으키는 성향을 나타낼 것이고/이거나, 전체적으로 소정의 서열 핵은 각 잔기 위치가 허용가능한 20가지 보편적 아미노산 (및/또는) 비-보편적 아미노산/이미노산) 중 임의의 아미노산이 되도록 허용되는 경우 잠재적인 서열들의 최대수 미만의 서열들로 구성된 하위세트이다. 소정의 서열 핵은 일반적으로 가변 잔기 위치 및 불변 잔기 위치를 포함하고/하거나, 개개의 선별된 라이브러리 구성원 서열의 분절 또는 전체 길이에 걸쳐 소정의 아미노산 잔기 서브세트로부터 선택된 잔기 등을 포함할 수 있다. 소정의 서열 핵은 아미노산 서열 또는 폴리뉴클레오티드 서열을 지칭할 수 있다.
본원에서 사용된 바와 같이, "링커(linker)" 또는 "스페이서(spacer)"는 2개의 분자, 예컨대, DNA 결합 단백질과 무작위 펩타이드를 연결하고 예를 들어, 무작위 펩타이드가 DNA 결합 단백질로부터 최소한의 입체 장애를 받으면서 수용체에 결합할 수 있도록 상기 2개의 분자가 바람직한 구조로 위치할 수 있게 하는 분자 또는 기를 지칭한다.
본원에서 사용된 바와 같이, 용어 "가변 분절"은 무작위, 슈도무작위 또는 소정의 핵 서열을 포함하는 신생 펩티드의 일부를 지칭한다. 당업자의 판단에 따라, 가변 분절은 가변 잔기 위치 및 불변 잔기 위치 둘다를 포함할 수 있고, 가변 잔기 위치에서의 잔기 가변도는 한정될 수 있다. 전형적으로, 가변 분절의 길이는 약 3 내지 20개 아미노산 잔기, 예를 들어, 8 내지 10개 아미노산 잔기이지만 더 길수 있고, 항체의 일부 또는 수용체 단백질, 예컨대, 항체 단편, 핵산 결합 단백질, 수용체 단백질 등을 포함할 수 있다.
본원에서 사용된 바와 같이, 용어 "에피토프"는 항체의 가변 영역 결합 포켓(pocket)과 상호작용하는 결합 상호작용을 형성할 수 있는 항원 또는 다른 거대분자의 일부를 지칭한다. 전형적으로, 이러한 결합 상호작용은 CDR의 1개 이상의 아미노산 잔기와의 분자간 접촉으로서 나타난다.
본원에서 사용된 바와 같이, 용어 "수용체", "표적" 또는 "물질"은 소정의 리간드에 대한 친화성을 갖는 분자를 지칭한다. 수용체는 천연 발생 분자 또는 합성 분자일 수 있다. 수용체는 변경되지 않은 상태 또는 다른 종과의 응집물 상태로서 사용될 수 있다. 수용체는 결합 구성원, 즉 리간드에 직접적으로 또는 특정 결합 물질을 통해 공유결합될 수 있거나 비-공유결합될 수 있다. 수용체의 예는 (예컨대, 바이러스, 세포 또는 다른 물질 상의) 특이적 항원성 결정인자와 반응하는 단일클론 항체 및 항혈청을 포함하는 항체, 세포막 수용체, 항원, 에피토프 보유 분자, 결합체 탄수화물 및 당단백질, 효소 및 호르몬 수용체를 포함하나 이들로 한정되지 않는다.
본원에서 사용된 바와 같이, 용어 "리간드" 또는 "리간드 부분"은 특정 수용체 또는 물질에 의해 인식되는 분자, 예컨대, 무작위 펩티드 또는 가변 분절 서열을 지칭한다. 당업자라면 분자(또는 거대분자 결합체)가 수용체 및 리간드 둘다일 수 있음을 인식할 것이다.
본원에서 사용된 바와 같이, "융합된", "결합된" 또는 "작동가능하게 연결된"은 무작위 펩티드와 스카폴드 단백질이 스카폴드 구조의 안정성의 파괴를 최소화하는 방식으로 서로 연결되어 있음을 의미한다.
본원에서 사용된 바와 같이, 용어 "단일쇄 항체"는 폴리펩티드 결합에서 일반적으로 스페이서 펩티드(예를 들어, [Gly-Gly-Gly-Gly-Ser]x(서열번호 17))를 통해 연결된 VH 도메인 및 VL 도메인을 포함하고 아미노-말단 및/또는 카복시-말단에서 추가 아미노산 서열을 포함하는 폴리펩티드를 지칭한다. 예를 들어, 단일쇄 항체는 코딩 폴리뉴클레오티드에의 연결을 위한 부착자(tether) 분절을 포함할 수 있다. 예를 들어, scFv는 단일쇄 항체이다. 단일쇄 항체는 일반적으로 실질적으로 면역글로불린 수퍼패밀리(superfamily)의 유전자에 의해 코딩된, 가장 흔하게는 설치류, 비-인간 영장류, 조류, 돼지, 소, 양, 염소 또는 인간 중쇄 또는 경쇄 유전자 서열에 의해 코딩된, 10개 이상의 연속 아미노산으로 구성된 1개 이상의 폴리펩티드 분절로 구성된 단백질이다(예를 들어, 본원에 참고로 도입되는 문헌(The Immunoglobulin Gene Superfamily, A. F. Williams and A. N. Barclay, in Immunoglobulin Genes, T. Honjo, F. W. Alt, and T. H. Rabbitts, eds., (1989) Academic Press: San Diego, Calif., pp. 361-387) 참조). 기능성 단일쇄 항체는 일반적으로 특정 표적 분자, 전형적으로 수용체 또는 항원(에피토프)과의 결합 성질을 보유하기 위해 면역글로불린 수퍼패밀리 유전자 생성물의 충분한 부분을 포함한다.
본원에서 사용된 바와 같이, 용어 "상보성 결정 영역" 및 "CDR"은 카바트(Kabat) 및 초티아(Chothia) CDR 정의에 의해 예시된, 당업자에 의해 인식되는 용어를 지칭하고 일반적으로 초가변 영역 또는 초가변 루프로도 공지되어 있다. 문헌(Chothia and Lesk (1987) J. Mol. Biol. 196: 901; Chothia et al. (1989) Nature 342: 877; E. A. Kabat et al., Sequences of Proteins of Immunological Interest (National Institutes of Health, Bethesda, Md.) (1987); and Tramontano et al. (1990) J. Mol. Biol. 215: 175)을 참조한다. 가변 영역 도메인은 전형적으로 천연 발생 면역글로불린 쇄의 약 105 내지 115개 아미노산, 예를 들어, 1 내지 110개 아미노산을 포함하지만, 다소 더 짧거나 긴 가변 도메인도 단일쇄 항체의 형성에 적합하다.
면역글로불린 경쇄 또는 중쇄 가변 영역은 CDR로도 지칭되는 3개의 초가변 영역들에 의해 단절되어 있는 "골격" 영역으로 구성된다. 골격 영역 및 CDR의 정도는 정확하게 정의되어 있다. 문헌("Sequences of Proteins of Immunological Interest," E. Kabat et al., 4th Ed., U.S. Department of Health and Human Services, Bethesda, Md. (1987))을 참조한다. 다양한 경쇄 또는 중쇄의 골격 영역의 서열은 종 내에서 상대적으로 보존되어 있다. 본원에서 사용된 바와 같이, "인간 골격 영역"은 천연 발생 인간 면역글로불린의 골격 영역과 실질적으로 (약 85% 이상, 통상적으로 90 내지 95% 이상) 동일한 골격 영역이다. 항체의 골격 영역, 즉 항체를 구성하는 경쇄와 중쇄의 조합된 골격 영역은 CDR을 위치시키고 정렬하는 데 기여한다. CDR은 일차적으로 항원의 에피토프와의 결합을 담당한다.
달리 정의하지 않은 한, 본원에서 사용된 모든 기술 용어 및 과학 용어는 본 발명이 속하는 분야에서 숙련된 기술을 갖는 자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 본원에 기재된 방법 및 재료와 유사하거나 균등한 임의의 방법 및 재료가 본 발명의 실시 또는 시험에서 사용될 수 있지만, 바람직한 방법 및 재료가 본원에 기재된다.
Tf 및 Tf 변경
본 발명의 융합 단백질은 리간드, 예컨대, 무작위 펩티드 또는 CDR을 수용체 또는 물질에 제시할 수 있는 Tf 단백질 또는 이의 일부를 포함한다. Tf 부분은 줄기 부분의 N-말단에 융합되어 있다. 상기 융합 단백질의 Tf 단백질 또는 이의 일부는 융합 단백질의 Tf "일부", "영역" 또는 "부분"으로 지칭될 수 있다. 본원에서 사용된 바와 같이, Tf 융합 단백질은 줄기 부분에 융합되어 있고 세포벽 연결 부재 및 선택적으로 고착자 부분을 포함하는 Tf 단백질 또는 부분이거나, 세포막 고착자에 직접적으로 융합되어 있는 Tf 단백질 또는 부분이다.
임의의 Tf가 본 발명의 변경된 Tf 융합 단백질을 제조하는 데 사용될 수 있다. 예를 들어, 야생형 Tf(Tf)는 유전자 복제로부터 유래된 것으로 보이는 2개의 주요 로브 또는 도메인, 즉 N(약 330개 아미노산) 및 C(약 340개 아미노산)를 갖는 약 75 kDa(글리코실화를 설명하지 못함)의 679개 아미노산 단백질이다. 진뱅크(GenBank) 검색번호 NM001063, XM002793, M12530, XM039845, XM039847 및 S95936(www.ncbi.nlm.nih.gov)(이들 모두는 본원에 전체가 참고로 도입됨) 및 서열번호 1 내지 3을 참조한다. 상기 2개의 도메인은 시간의 경과에 따라 서로 상이하게 진화되어 왔지만 높은 수준의 동일성/유사성을 보유한다.
N 도메인 및 C 도메인 각각은 2개의 서브도메인, 즉 N1과 N2 및 C1과 C2로 더 분류된다. Tf의 기능은 철을 체내의 세포에 전달하는 것이다. 이 과정은 모든 세포, 특히 활발하게 성장하는 세포 상에 발현되어 있는 TfR에 의해 매개된다. TfR이 철-결합된 형태의 Tf를 인식한 후(수용체 당 2개의 철-결합된 Tf가 결합됨), 세포내이입(endocytosis)이 일어남으로써 TfR/Tf 결합체가 엔도좀(endosome)으로 전달되고, 엔도좀에서의 pH의 편재된 강하가 결합된 철의 방출, 세포 표면으로의 TfR/Tf 결합체의 재순환 및 Tf(철이 결합되지 않은 형태의 apoTf로서 공지되어 있음)의 방출을 초래한다. 수용체 결합은 주로 Tf의 C 도메인을 통해 일어난다. C 도메인 내의 2개의 글리코실화 부위는 비-글리코실화된 철-결합된 Tf가 상기 수용체에 결합하기 때문에 수용체 결합에 관여하지 않는 것으로 보인다.
Tf 분자 각각은 2개의 철 이온(Fe3+)을 운반할 수 있다. 철 이온은 N1 서브도메인과 N2 서브도메인, 및 C1 서브도메인과 C2 서브도메인 사이의 공간에서 결합되어 분자의 구조적 변화를 초래한다.
인간 Tf에서, 철 결합 부위는 적어도 서열번호 3의 아미노산 Asp63(천연 Tf 신호 서열을 포함하는 서열번호 2의 Asp82), Asp 92(서열번호 2의 Asp411), Tyr95(서열번호 2의 Tyr114), Tyr426(서열번호 2의 Tyr445), Tyr188(서열번호 2의 Tyr 207), Tyr514 또는 Tyr517(서열번호 2의 Tyr533 또는 Tyr536), His249(서열번호 2의 His268) 및 His585(서열번호 2의 His604)를 포함한다. 힌지 영역은 적어도 서열번호 3의 N 도메인 아미노산 잔기 94-96, 245-247 및/또는 316-318 및 C 도메인 아미노산 잔기 425-427, 581-582 및/또는 652-658를 포함한다. 탄산염 결합 부위는 서열번호 3의 아미노산 Thr120(서열번호 2의 Thr139), Thr452(서열번호 2의 Thr471), Arg124(서열번호 2의 Arg143), Arg456(서열번호 2의 Arg475), Ala126(서열번호 2의 Ala145), Ala458(서열번호 2의 Ala477), Gly127(서열번호 2의 Gly146) 및 Gly459(서열번호 2의 Gly478)를 포함한다.
본 발명의 한 실시양태에서, 융합 단백질은 변형된 인간 Tf를 포함하지만, 인간, 소, 돼지, 양, 개, 토끼, 래트, 마우스, 햄스터, 바늘두더지, 오리너구리, 닭, 개구리, 박각시벌레, 원숭이, 유인원뿐만 아니라, 다른 소과, 개과 및 조류과 종의 Tf 변이체를 포함하는 임의의 동물 Tf 분자가 본 발명의 융합 단백질을 제조하는 데 사용될 수 있다. 이 Tf 서열들 모두가 진뱅크 및 다른 공개 데이터베이스에서 용이하게 입수될 수 있다. 인간 Tf 뉴클레오티드 서열도 입수될 수 있고(서열번호 1 내지 3, 및 웹페이지(www.ncbi.nlm.nih.gov)에서 입수가능하고 상기 검색번호 참조) Tf 또는 이의 도메인과 선택된 치료 분자 사이의 유전적 융합체를 제조하는 데 사용될 수 있다. 융합체는 관련 분자, 예컨대, 락토 Tf(락토페린)(진뱅크 검색번호 NM 002343) 또는 멜라노트랜스페린으로부터 제조될 수도 있다.
천연 방어 철-결합 단백질인 락토페린(Lf)은 항균 활성, 항진균 활성, 항바이러스 활성, 항신생물 활성 및 소염 활성을 보유하는 것으로 밝혀져 있다. 상기 단백질은 정상균총(normal flora)에 통상적으로 노출되는 외분비선 분비물, 젖, 눈물, 코 배출물, 타액, 기관지 점액, 위장액, 자궁-질 점액 및 정액에 존재한다. 또한, Lf는 순환하는 다형핵 호중구(PMN)의 이차 특이적 과립의 주성분이다. 아포단백질은 부패 영역에서 PMN의 탈과립화 시 방출된다. Lf의 주기능은 자유 라디칼-매개 손상을 억제하고 침윤 미생물 및 신생물 세포에 의한 금속의 이용가능성을 감소시키기 위해 체액 및 염증 영역에서 자유 철을 제거하는 것이다. 성체에서의 125I Lf의 전환률을 조사한 연구에서, Lf는 간 및 비장에 의해 신속히 흡수되고 방사성은 간 및 비장에서 수주 동안 지속된다고 밝혀졌다(Bennett et al. (1979), Clin. Sci. (Lond.) 57: 453-460).
한 실시양태에서, 본 발명의 융합 단백질의 Tf 부분은 Tf 스플라이스 변이체를 포함한다. 한 실시양태에서, Tf 스플라이스 변이체는 인간 Tf의 스플라이스 변이체일 수 있다. 한 특정 실시양태에서, 인간 Tf 스플라이스 변이체는 진뱅크 검색번호 AAA61140의 서열일 수 있다.
또 다른 실시양태에서, 본 발명의 융합 단백질의 Tf 부분은 Lf 스플라이스 변이체를 포함한다. 일례에서, 인간 혈청 Lf 스플라이스 변이체는 호중구 Lf의 신규 스플라이스 변이체일 수 있다. 한 특정 실시양태에서, 호중구의 Lf 스플라이스 변이체는 진뱅크 검색번호 AAA59479의 서열일 수 있다. 또 다른 특정 실시양태에서, 호중구의 Lf 스플라이스 변이체는 신규 스플라이스-가변 영역을 포함하는 아미노산 서열 EDCIALKGEADA(서열번호 4)를 포함할 수 있다.
융합체는 멜라노트랜스페린(진뱅크 검색번호 NM_013900, 뮤린 멜라노트랜스페린)을 사용하여 제조할 수도 있다. 멜라노트랜스페린은 악성 흑색종 세포에서 고도로 발견되는 글리코실화된 단백질이고 원래 명칭은 인간 흑색종 항원 p97이었다(Brown et al., 1982, Nature, 296: 171-173). 멜라노트랜스페린은 인간 혈청 Tf, 인간 Lf 및 닭 Tf와 높은 서열 상동성을 갖는다(Brown et al., 1982, Nature, 296: 171-173; Rose et al., Proc. Natl. Acad. Sci., 1986, 83: 1261-1265). 그러나, 이 단백질들과 달리 멜라노트랜스페린에 대한 세포 수용체는 확인되어 있지 않다. 멜라노트랜스페린은 철에 가역적으로 결합하고 2가지 형태로 존재하는데, 이때 상기 2가지 형태 중 하나는 GPI 고착자에 의해 세포막에 결합되지만, 나머지 다른 형태는 가용성을 나타내며 활발히 분비된다(Baker et al., 1992, FEBS Lett, 298: 215-218; Alemany et al., 1993, J. Cell Sci., 104: 1155-1162; Food et al., 1994, J. Biol. Chem. 274: 7011-7017).
변경된 Tf 융합체는 임의의 Tf 단백질, 단편, 도메인 또는 개조된 도메인을 사용하여 제조할 수 있다. 예를 들어, 융합 단백질은 천연 Tf 신호 서열이 있거나 없는 전장 Tf 서열을 사용하여 제조할 수 있다. 트랜스바디도 단일 Tf 도메인, 예컨대, 개개의 N 또는 C 도메인을 사용하여 제조할 수 있다. 트랜스바디는 이중 Tf 도메인, 예컨대, 이중 N 도메인 또는 이중 C 도메인을 사용하여 제조할 수도 있다. 일부 실시양태에서, 치료 단백질과 단일 C 도메인의 융합체를 제조할 수 있는데, 이때 상기 C 도메인은 글리코실화, 철 결합 및/또는 Tf 수용체 결합을 감소시키거나, 억제하거나 방지하도록 변경된다. 다른 실시양태에서, 단일 N 도메인의 사용은 C 도메인 및 N 도메인에서 Tf 글리코실화 부위 잔기가 스스로 철 또는 Tf 수용체에 결합하지 않기 때문에 유리하다. 한 실시양태에서, Tf 융합 단백질은 고도로 발현되는 단일 N 도메인을 갖는다.
본원에서 사용된 바와 같이, N-유사 도메인처럼 기능하도록 변경되어 있는 C-말단 도메인 또는 로브는 천연 또는 야생형 N 도메인 또는 로브와 실질적으로 유사한 글리코실화 패턴 또는 철 결합 성질을 나타내도록 변경된다. 한 실시양태에서, C 도메인 또는 로브는 관련 C 도메인 영역 또는 아미노산이 천연 또는 야생형 N 도메인의 상응하는 영역 또는 부위에 존재하는 아미노산으로 치환됨으로써 글리코실화되지 않고 철에 결합하지 않도록 변경된다.
본원에서 사용된 바와 같이, "2개의 N 도메인 또는 로브"를 포함하는 Tf 부분은 천연 C 도메인 또는 로브가 제2 천연 또는 야생형 N 도메인 또는 로브, 또는 변경된 N 도메인 또는 로브로 치환되거나 야생형 또는 변경된 N 도메인과 실질적으로 유사하게 기능하도록 변경된 C 도메인을 포함하도록 변경된 Tf 분자를 포함한다. 본원에 전체가 참고로 도입되는 미국 가출원 제60/406,977호를 참조한다.
상기 2개의 도메인의 3-차원적 구조의 중첩(스위스 PDB 뷰어 3.7b2, 이터레이티브 매직 피트(Iterative Magic Fit)) 및 직접적인 아미노산 정렬(ClustalW 다중 정렬)에 의한 상기 2개의 도메인의 분석은 상기 2개의 도메인이 시간의 경과에 따라 서로 상이하게 진화됨을 보여준다. 아미노산 정렬은 상기 2개의 도메인 사이의 42% 동일성 및 59% 유사성을 보여준다. 그러나, N 도메인의 약 80%는 구조적 등가성에 대해 C 도메인과 일치한다. 또한, C 도메인은 N 도메인에 비해 수개의 이황화 결합을 더 갖는다.
N 도메인 및 C 도메인에 대한 분자 모델의 정렬은 다음과 같은 구조적 등가성을 보여준다:
N 도메인(1-330) C 도메인(340-679)
4-24 340-361
36-72 75-88 365-415
94-136 425-437 439-468
138-139 470-471
149-164 475-490
168-173 492-497
178-198 200-214 507-542
219-255 555-591
259-260 593-594
263-268 597-602
271-275 605-609
279-280 614-615
283-288 290-304 620-640
309-327 645-663
N 도메인 및 C 도메인에 대한 이황화 결합은 다음과 같이 정렬된다:
N 도메인 C 도메인
C339-C596
C9-C48 C345-C377
C19-C39 C355-C368
C402-C674
C418-C637
C118-C194 C450-C523
C137-C331
C474-C665
C158-C174 C484-C498
C161-C179
C171-C177 C495-C506
C227-C241 C563-C577
C615-C620
굵은 글자체는 정렬된 이황화 결합을 표시하고, 이탤릭 글자체는 가교 펩티드를 표시한다.
한 실시양태에서, 융합 단백질의 Tf 부분은 2개 이상의 Tf N-말단 로브를 포함한다. 추가 실시양태에서, 융합 단백질의 Tf 부분은 인간 혈청 Tf로부터 유래된 2개 이상의 Tf N-말단 로브를 포함한다.
또 다른 실시양태에서, 융합 단백질의 Tf 부분은 서열번호 3의 Asp63, Gly65, Tyr95, Tyr188, 및 His249로 구성된 군으로부터 선택된 1개 이상의 아미노산 잔기에서 돌연변이를 갖는 2개 이상의 Tf N-말단 로브를 포함하거나 상기 2개 이상의 Tf N-말단 로브로 구성된다.
또 다른 실시양태에서, 변경된 융합 단백질의 Tf 부분은 서열번호 3의 Lys206 또는 His207에서 돌연변이를 갖는 재조합 인간 혈청 Tf N-말단 로브 돌연변이체를 포함한다.
또 다른 실시양태에서, 융합 단백질의 Tf 부분은 2개 이상의 Tf C-말단 로브를 포함하거나 본질적으로 상기 2개 이상의 Tf C-말단 로브로 구성되거나, 상기 2개 이상의 Tf C-말단 로브로 구성된다. 추가 실시양태에서, 융합 단백질의 Tf 부분은 인간 혈청 Tf로부터 유래된 2개 이상의 Tf C-말단 로브를 포함한다.
추가 실시양태에서, C-말단 로브 변이체는 글리코실화를 허용하지 않는 서열번호 3의 Asn413 및 Asn611 중 1개 이상의 돌연변이를 추가로 포함한다.
또 다른 실시양태에서, Tf 부분은 서열번호 3의 Asp392, Tyr426, Tyr514, Tyr517 및 His585로 구성된 군으로부터 선택된 1개 이상의 아미노산 잔기에서 돌연변이를 갖는 2개 이상의 Tf C-말단 로브를 포함하고, 이때 변이체는 금속 이온에 결합하는 능력을 보유한다. 대안적 실시양태에서, Tf 부분은 서열번호 3의 Tyr426, Tyr514, Tyr517 및 His585로 구성된 군으로부터 선택된 1개 이상의 아미노산 잔기에서 돌연변이를 갖는 2개 이상의 Tf C-말단 로브를 포함하고, 이때 변이체는 금속 이온에 결합하는 능력이 감소되어 있다. 또 다른 실시양태에서, Tf 부분은 서열번호 3의 Asp392, Tyr426, Tyr517 및 His58로 구성된 군으로부터 선택된 1개 이상의 아미노산 잔기에서 돌연변이를 갖는 2개 이상의 Tf C-말단 로브를 포함하고, 이때 변이체는 금속 이온에 결합하는 능력을 보유하지 않으면 실질적으로 N 도메인과 유사한 기능을 수행한다.
일부 실시양태에서, 융합 단백질의 Tf 또는 Tf 부분 및 리간드가 융합 단백질의 나머지 부분으로부터 절단되는 경우, Tf 또는 Tf 부분은 비-융합된 상태의 리간드, 즉 Tf에 융합되지 않은 리간드의 생체내 순환 반감기, 혈청 안정성, 시험관내 용액 안정성 또는 생체이용능에 비해 리간드, 즉 치료제의 생체내 순환 반감기, 혈청 안정성, 시험관내 용액 안정성 또는 생체이용능을 증가시키기에 충분한 길이를 가질 것이다. 이러한 안정성, 생체내 순환 반감기 또는 생체이용능에서의 증가는 비-융합된 리간드 부분 영역에 비해 약 30, 50, 70, 80 또는 90% 이상의 증가일 수 있다. 일부 경우, 변경된 Tf를 포함하는 리간드 부분은 비-융합된 상태의 리간드에 비해 약 1일 이상, 1 내지 2일 이상, 3 내지 5일 이상, 5 내지 10일 이상, 10 내지 15일 이상, 10 내지 20일 이상, 약 12 내지 18일 이상 또는 약 14 내지 17일 이상의 혈청 반감기를 나타낸다.
Tf의 C 도메인이 융합 단백질의 일부인 경우, 2개의 N-결합된 글리코실화 부위, 즉 서열번호 3의 N413 및 N611에 상응하는 아미노산 잔기는 글리코실화 또는 과다만노실화를 방지하고 융합 단백질의 혈청 반감기를 연장하도록(아시알로-Tf를 생성하도록, 또는 일부 경우 모노시알로-Tf 또는 다이시알로-Tf를 생성하도록) 효모 시스템에서의 발현을 위해 돌연변이될 수 있다. N413 및 N611에 상응하는 Tf 아미노산 이외에, N-X-S/T 글리코실화 부위 내에 있거나 N-X-S/T 글리코실화 부위에 인접한 잔기에 대한 돌연변이는 글리코실화를 방지하거나 실질적으로 감소시킨다. 미국 특허 제5,986,067호(Funk et al.)를 참조한다. 예를 들어, 본 발명은 아미노산 S415 및 T613에서의 변경을 포함한다. 한 실시양태에서, 변경 S415A 및 T613A를 포함한다. 이 실시양태에서, 아미노산 변경은 서열번호 3의 S415 및 T613에 상응한다.
또한, 피키아 파스토리스(Pichia pastoris)에서 발현된 Tf의 N 도메인은 S32에서 단일 헥소스로 O-결합된 글리코실화되어 있고, 상기 S32는 이러한 글리코실화를 방지하도록 돌연변이되거나 변경될 수 있다고 보고되어 있다. 게다가, O-결합된 글리코실화는 PMT 유전자 중 하나 이상에서 돌연변이를 갖는 효모 숙주 세포에서 감소될 수 있거나 제거될 수 있다.
따라서, 본 발명의 한 실시양태에서, 융합 단백질은 아시알로-Tf, 모노시알로-Tf 및 다이시알로-Tf 형태를 포함하나 이들로 한정되지 않는 변경된 Tf 분자를 포함하고, 이때 Tf는 감소된 글리코실화를 나타낸다. 또 다른 실시양태에서, 융합 단백질의 Tf 부분은 글리코실화를 방지하도록 돌연변이된 재조합 Tf 변이체를 포함한다. 또 다른 실시양태에서, 융합 단백질의 Tf 부분은 완전히 글리코실화되어 있는 재조합 Tf 변이체를 포함한다. 추가 실시양태에서, 융합 단백질의 Tf 부분은 글리코실화를 방지하도록 돌연변이된 재조합 인간 혈청 Tf 변이체를 포함하고, 이때 서열번호 3의 Asn413 및 Asn611 중 하나 이상이 글리코실화를 허용하지 않는 아미노산으로 돌연변이된다. 또 다른 실시양태에서, 융합 단백질의 Tf 부분은 글리코실화를 방지하거나 실질적으로 감소시키도록 돌연변이된 재조합 인간 혈청 Tf 변이체를 포함하고, 이때 돌연변이는 N-X-S/T 글리코실화 부위 내의 잔기들에 대한 돌연변이일 수 있다. 뿐만 아니라, 글리코실화는 세린 또는 쓰레오닌 잔기를 돌연변이시켜 감소시키거나 방지할 수 있다. 예를 들어, 본 발명의 한 실시양태에서, 융합 단백질의 Tf 부분은 글리코실화를 방지하도록 돌연변이된 재조합 인간 혈청 Tf 변이체를 포함하고, 이때 서열번호 3의 Ser415 및 Thr613 중 하나 이상이 글리코실화를 허용하지 않는 아미노산으로 돌연변이되어 있다. 또한, 상기 X를 프롤린으로 변경하는 것도 글리코실화를 억제한다고 공지되어 있다.
하기에 더 상세하게 기재되는 바와 같이, 변경된 Tf를 포함하는 본 발명의 변경된 Tf 융합 단백질은 철에 결합하지 않고/않거나 Tf 수용체에 결합하지 않도록 개조될 수도 있다. 본 발명의 다른 실시양태에서, 철 결합은 유지되고, Tf의 철 결합능은 치료 단백질 또는 펩티드를 세포의 내부에 전달하고/하거나 혈액 뇌 장벽(BBB)을 통과하여 전달하는 데 이용될 수 있다. N 도메인은 철이 적재된 경우 단독으로 TfR에 결합하지 않을 것이고, 철-결합된 C 도메인은 TfR에 결합할 것이지만 결합 친화성은 전체 분자와 동일하지 않을 것이다.
또 다른 실시양태에서, Tf 융합 단백질의 Tf 부분은 돌연변이를 갖는 재조합 Tf 변이체를 포함하고, 이때 상기 변이체는 금속 이온과 결합하는 능력을 보유하지 않는다. 대안적 실시양태에서, Tf 융합 단백질의 Tf 부분은 돌연변이를 갖는 재조합 Tf 변이체를 포함하고, 이때 상기 변이체는 금속 이온에 대한 결합 친화성이 야생형 혈청 Tf보다 약하다. 대안적 실시양태에서, Tf 융합 단백질의 Tf 부분은 돌연변이를 갖는 재조합 Tf 변이체를 포함하고, 이때 상기 변이체는 금속 이온에 대한 결합 친화성이 야생형 혈청 Tf보다 강하다.
또 다른 실시양태에서, Tf 부분은 돌연변이를 갖는 재조합 Tf 변이체를 포함하고, 이때 상기 변이체는 TfR에 결합하는 능력을 보유하지 않는다. 대안적 실시양태에서, Tf 부분은 돌연변이를 갖는 재조합 Tf 변이체를 포함하고, 이때 상기 변이체는 TfR에 대한 결합 친화성이 야생형 혈청 Tf보다 약하다. 대안적 실시양태에서, Tf 부분은 돌연변이를 갖는 재조합 Tf 변이체를 포함하고, 이때 상기 변이체는 TfR에 대한 결합 친화성이 야생형 혈청 Tf보다 강하다.
또 다른 실시양태에서, Tf 부분은 돌연변이를 갖는 재조합 Tf 변이체를 포함하고, 이때 상기 변이체는 탄산염 이온에 결합하는 능력을 보유하지 않는다. 대안적 실시양태에서, Tf 부분은 돌연변이를 갖는 재조합 Tf 변이체를 포함하고, 이때 상기 변이체는 탄산염 이온에 대한 결합 친화성이 야생형 혈청 Tf보다 약하다. 대안적 실시양태에서, Tf 부분은 돌연변이를 갖는 재조합 Tf 변이체를 포함하고, 이때 상기 변이체는 탄산염 이온에 대한 결합 친화성이 야생형 혈청 Tf보다 강하다.
또 다른 실시양태에서, Tf 부분은 서열번호 3의 Asp63, Gly65, Tyr95, Tyr188, His249, Asp392, Tyr426, Tyr514, Tyr517 및 His585로 구성된 군으로부터 선택된 1개 이상의 아미노산 잔기에서 돌연변이를 갖는 재조합 인간 혈청 Tf 변이체를 포함하고, 이때 상기 변이체는 금속 이온에 결합하는 능력을 보유한다. 대안적 실시양태에서, 서열번호 3의 Asp63, Gly65, Tyr95, Tyr188, His249, Asp392, Tyr426, Tyr514, Tyr517 및 His585로 구성된 군으로부터 선택된 1개 이상의 아미노산 잔기에서 돌연변이를 갖는 재조합 인간 혈청 Tf 변이체는 금속 이온에 결합하는 감소된 능력을 나타낸다. 또 다른 실시양태에서, 서열번호 3의 Asp63, Gly65, Tyr95, Tyr188, His249, Asp392, Tyr426, Tyr517 및 His585로 구성된 군으로부터 선택된 1개 이상의 아미노산 잔기에서 돌연변이를 갖는 재조합 인간 혈청 Tf 변이체는 금속 이온에 결합하는 능력을 보유하지 않는다.
또 다른 실시양태에서, Tf 부분은 서열번호 3의 Lys206 또는 His207에서 돌연변이를 갖는 재조합 인간 혈청 Tf 변이체를 포함하고, 이때 상기 변이체는 금속 이온에 대한 결합 친화성이 야생형 인간 혈청 Tf보다 강하다(본원에 전체가 참고로 도입되는 미국 특허 제5,986,067호 참조). 대안적 실시양태에서, Tf 부분은 서열번호 3의 Lys206 또는 His207에서 돌연변이를 갖는 재조합 인간 혈청 Tf 변이체를 포함하고, 이때 상기 변이체는 금속 이온에 대한 결합 친화성이 야생형 인간 혈청 Tf보다 약하다. 추가 실시양태에서, Tf 부분은 서열번호 3의 Lys206 또는 His207에서 돌연변이를 갖는 재조합 인간 혈청 Tf 변이체를 포함하고, 이때 상기 변이체는 금속 이온에 결합하지 않는다.
통상적으로 이용가능한 분자 기법, 예를 들어, 문헌(Sambrook et al. Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press, 1989)에 개시된 기법을 포함하나 이들로 한정되지 않는 임의의 이용가능한 기법을 이용하여 본 발명의 융합 단백질을 제조할 수 있다. 당업계에 잘 공지되어 있는 부위-특이적 돌연변이유발을 달성하기 위한 기법을 이용하여 뉴클레오티드 치환을 수행하는 경우, 코딩된 아미노산 변경은 바람직하게는 미미한 영향을 미치는 변경, 즉 보존적 아미노산 치환이지만, 다른 비-보존적 치환도 특히 변경된 Tf 부분, 예를 들어, 감소된 글리코실화, 감소된 철 결합 등을 나타내는 변경된 융합 단백질을 제조하는 경우 고려된다. 전형적으로 1 내지 약 30개의 아미노산 치환, 작은 결실 또는 삽입; Tf 도메인들 사이의 삽입; 작은 아미노 또는 카복시 말단 연장부, 예컨대, 아미노-말단 메티오닌 잔기, 또는 Tf 도메인들 사이에 존재하거나 Tf 단백질과 치료 단백질 또는 펩티드, 리간드 또는 항체 가변 영역 또는 줄기 영역을 연결하는 50, 40, 30, 20 또는 10개 미만의 잔기로 구성된 작은 링커 펩티드; 또는 정제를 용이하게 하는 작은 연장부, 예컨대, 폴리-히스티딘 트랙(tract), 항원성 에피토프 또는 결합 도메인이 특히 고려된다.
보존적 아미노산 치환의 예로는 동일한 군, 예컨대, 염기성 아미노산 군(예컨대, 아르기닌, 라이신 및 히스티딘), 산성 아미노산 군(예컨대, 글루탐산 및 아스파르트산), 극성 아미노산 군(예컨대, 글루타민 및 아스파라긴), 소수성 아미노산 군(예컨대, 류신, 이소류신 및 발린), 방향족 아미노산 군(예컨대, 페닐알라닌, 트립토판 및 티로신) 및 작은 아미노산 군(예컨대, 글리신, 알라닌, 세린, 쓰레오닌 및 메티오닌) 내에서 이루어진 치환을 들 수 있다.
비-보존적 치환은 한 군 내의 아미노산이 또 다른 군 내의 아미노산으로 치환되는 것을 포괄한다. 예를 들어, 비-보존적 치환은 극성 아미노산이 소수성 아미노산으로 치환되는 것을 포함한다. 뉴클레오티드 치환의 일반적인 설명을 위해서는 예를 들어, 문헌(Ford et al. (1991), Prot. Exp. Pur. 2: 95-107)을 참조한다. 비-보존적 치환, 결실 및 삽입은 철과의 결합을 전혀 나타내지 않거나 철과의 감소된 결합을 나타내고/내거나 융합 단백질과 TfR의 결합을 전혀 나타내지 않거나 융합 단백질과 TfR의 감소된 결합을 나타내는 본 발명의 Tf 융합 단백질, 바람직하게는 트랜스바디를 제조하는 데 특히 유용하다.
본 발명의 폴리펩티드 및 단백질에서, 하기 보편적인 목록에 따라 아미노산을 명명하기 위한 하기 시스템을 따른다:
아미노산 표
아미노산 1-문자 기호 3-문자 기호
알라닌 A Ala
아르기닌 R Arg
아스파라긴 N Asn
아스파르트산 D Asp
시스테인 C Cys
글루타민 Q Gln
글루탐산 E Glu
글리신 G Gly
히스티딘 H His
아이소류신 I Ile
류신 L Leu
라이신 K Lys
메티오닌 M Met
페닐알라닌 F Phe
프롤린 P Pro
세린 S Ser
쓰레오닌 T Thr
트립토판 W Trp
티로신 Y Tyr
발린 V Val
철 결합 및/또는 수용체 결합은 서열번호 3의 Tf N 도메인 잔기 Asp63, Tyr95, Tyr188 및/또는 His249, 및/또는 C 도메인 잔기 Asp392, Tyr426, Tyr514 및/또는 His585 중 1개 이상의 잔기에 상응하는 아미노산 잔기에 대한 결실, 치환 및 삽입을 비롯한 돌연변이에 의해 감소되거나 파괴될 수 있다. 철 결합은 서열번호 3의 아미노산 Lys206, His207 또는 Arg632에 대한 돌연변이에 의해 영향을 받을 수도 있다. 탄산염 결합은 서열번호 3의 Tf N 도메인 잔기 Thr120, Arg124, Ala126 및/또는 Gly127, 및/또는 C 도메인 잔기 Thr452, Arg456, Ala458 및/또는 Gly459 중 1개 이상의 잔기에 상응하는 아미노산 잔기에 대한 결실, 치환 및 삽입을 비롯한 돌연변이에 의해 감소되거나 파괴될 수 있다. 탄산염 결합의 감소 또는 파괴는 철 및/또는 수용체 결합에 악영향을 미칠 수 있다.
TfR에의 결합은 철 결합에 대해 전술한 Tf N 도메인 잔기 중 1개 이상의 잔기에 상응하는 아미노산 잔기에 대한 결실, 치환 및 삽입을 비롯한 돌연변이에 의해 감소되거나 파괴될 수 있다.
전술한 바와 같이, 글리코실화는 C 도메인 잔기 N413 및/또는 N611에 상응하는, N-X-S/T 부위 내의 Tf C 도메인 잔기 중 1개 이상의 잔기에 상응하는 아미노산에 대한 결실, 치환 및 삽입을 비롯한 돌연변이에 의해 감소되거나 파괴될 수 있다. 미국 특허 제5,986,067호를 참조한다. 예를 들어, N413 및/또는 N611은 인접한 아미노산일 수 있기 때문에 Glu 잔기로 돌연변이될 수 있다. 한 실시양태에서, S415 및/또는 T613은 Ala 잔기로 돌연변이된다.
본 발명의 Tf 융합 단백질이 글리코실화, 철 결합, 탄산염 결합 및/또는 수용체 결합을 방지하도록 변경되지 않는 경우, 철 및/또는 탄산염 이온은 융합 단백질로부터 제거되거나 절단될 수 있다. 예를 들어, 이용가능한 데글리코실레이즈(deglycosylase)를 사용하여 융합 단백질로부터 글리코실화 잔기, 특히 Tf 부분에 부착된 당 잔기를 제거할 수 있고, 글리코실화 효소가 결핍된 효모를 사용하여 글리코실화를 방지할 수 있고/있거나, 재조합 세포를 글리코실화를 방지하는 물질, 예컨대, 투니카마이신(tunicamycin)의 존재 하에서 생장시킬 수 있다.
융합 단백질 상의 탄수화물은 상기 융합 단백질을 데글리코실레이즈로 처리하여 효소적으로 감소시키거나 완전히 제거할 수도 있다. 데글리코실레이즈는 당업계에 잘 공지되어 있다. 데글리코실레이즈의 예로는 갈락토시데이즈, PNGase A, PNGase F, 글루코시데이즈, 만노시데이즈, 푸코시데이즈 및 엔도 H 데글리코실레이즈를 들 수 있으나 이들로 한정되지 않는다.
Tf의 3-차원적 구조를 변경하기 위한 Tf에 대한 추가 돌연변이, 예컨대, 철 결합 및 Tf 수용체 인식에 필요한 구조적 변경을 방지하기 위한 힌지 영역에 대한 변경을 발생시킬 수 있다. 예를 들어, 돌연변이는 N 도메인 아미노산 잔기 94-96, 245-247 및/또는 316-318 뿐만 아니라 C 도메인 아미노산 잔기 425-427, 581-582 및/또는 652-658에서 또는 이 위치들 주변에서 발생시킬 수 있다. 또한, 돌연변이는 Tf 구조 및 기능을 변경시키기 위해 상기 부위들의 플랭킹(flanking) 영역에서 또는 상기 영역 주변에서 발생시킬 수 있다.
본 발명의 한 측면에서, 융합 단백질은 리간드의 반감기 또는 생체이용능을 연장시킬 뿐만 아니라 일부 경우 리간드를 세포 내에 전달하기 위한 운반체 단백질로서 기능할 수 있고, BBB를 통과하는 능력을 보유한다. 대안적 실시양태에서, 융합 단백질은 BBB를 통과하는 능력을 보유하지 않는 변경된 Tf 분자를 포함한다.
또 다른 실시양태에서, 융합 단백질은 TfR에 결합하고 항체 가변 영역을 세포 내로 전달하는 능력을 보유하는 변경된 Tf 분자를 포함한다. 대안적 실시양태에서, 융합 단백질은 TfR에 결합하고 항체 가변 영역을 세포 내로 전달하는 능력을 보유하지 않는 변경된 Tf 분자를 포함한다.
추가 실시양태에서, 융합 단백질은 TfR에 결합하고 항체 가변 영역을 세포 내로 전달하는 능력을 보유하지만 BBB를 통과하는 능력을 보유하지 않는 변경된 Tf 분자를 포함한다. 대안적 실시양태에서, 융합 단백질은 BBB를 통과하는 능력을 보유하지만 TfR에 결합하고 항체 가변 영역을 세포 내로 전달하는 능력을 보유하지 않는 변경된 Tf 분자를 포함한다.
Tf 융합 단백질
본 발명의 융합 단백질은 Tf 단백질의 N-말단 및/또는 C-말단에 부착된 리간드, 항체 가변 영역 또는 무작위 펩티드를 1개 이상의 카피(copy) 만큼 포함할 수 있다. 한 실시양태에서, 리간드 부분은 Tf 단백질의 N-말단에 부착되어 있다. 일부 실시양태에서, 리간드, 가변 영역 또는 펩티드는 Tf 단백질의 N-말단 및 C-말단 둘다에 부착되어 있고, 융합 단백질은 Tf의 어느 한쪽 말단 또는 양 말단에서 상기 영역들의 1개 이상의 등가물을 포함할 수 있다.
다른 실시양태에서, 1개 이상의 리간드가 Tf 펩티드, 예를 들어, Tf 단백질의 공지된 도메인, 예컨대, Tf의 1개 이상의 루프 내로 삽입되어 있다. 문헌(Ali et al. (1999) J. Biol. Chem. 274(34): 24066-24073)을 참조한다.
본 발명의 한 실시양태에서, 리간드는 Tf의 N 로브 내로 삽입되어 있다. 예를 들어, 본 발명은 하기 표에 나타낸 바와 같은 N 로브의 N1 및 N2 도메인 내의 다른 위치에서 또는 상기 다른 위치 주변에서 발생될 수 있는 1개 이상의 삽입도 포함한다:
N 1 N 2
Asp33 Ser105
Asn55 Glu141
Asn75 Asp166
Asp90 Gln184
Gly257 Asp197
Lys280 Lys217
His289 Thr231
Ser298 Cys241
또 다른 실시양태에서, 리간드는 Tf 단백질의 표면 노출된 아미노산 잔기에서 무작위화된 아미노산 잔기를 포함한다. 무작위화된 아미노산 잔기는 표면 노출된 아미노산으로 구성된 1개 영역 또는 표면 노출된 아미노산으로 구성된 1개 초과의 영역에 위치할 수 있다. 예를 들어, 무작위화된 아미노산은 서열번호 3의 약 85 내지 약 92 위치 아미노산 잔기, 약 276 내지 약 298 위치 아미노산 잔기, 또는 약 207 내지 약 217 위치 아미노산 잔기로 구성된 영역들 중 1개 이상의 영역 내에 포함되어 있을 수 있다. 본 발명의 한 실시양태에서, 무작위화된 아미노산 잔기는 서열번호 3의 Y85, G86, S87, E89, D90 및 Q92 위치에 존재한다. 또 다른 실시양태에서, 무작위화된 아미노산 잔기는 서열번호 3의 K276, D277, K280, Q283, S286 및 D297 위치 및 선택적으로 S298 위치에 존재한다. 또 다른 실시양태에서, 무작위화된 아미노산 잔기는 서열번호 3의 H207, S208, F211, E212 및 A215 위치 및 선택적으로 N216 및/또는 K217 위치에 존재한다.
영역 당 무작위화된 아미노산 잔기의 수는 다양할 수 있고, 영역 당 바람직하게는 약 3개 이상, 약 4개 이상, 약 5개 이상, 약 6개 이상, 약 7개 이상, 약 8개 이상, 약 9개 이상, 약 10개 이상 또는 그 이상의 아미노산 잔기가 무작위화될 수 있다.
본 발명의 한 실시양태에서, 리간드 부분은 공지된 리간드 결합 서열, 예컨대, α4 인테그린(예를 들어, a4b1 및 a4b7)을 포함하나 이들로 한정되지 않는 인테그린에 결합할 수 있는 리간드 서열을 포함한다. 이러한 리간드는 혈관 세포 부착 분자(VCAM) 및 점막 어드레신(addressin) 세포 부착 분자(MAdCAM)을 포함하나 이들로 한정되지 않는다. 모든 목적을 위해 본원에 전체가 참고로 도입되는 문헌(Jackson, 2002, Current Pharmaceutical Design. *: 1229-1253)을 참조한다.
조직 손상 및 질환을 초래하는 염증 과정은 백혈구 표면 상에 노출된 α4 인테그린, 예컨대, a4b1 및 a4b7에 의해 부분적으로 매개된다. 이 당단백질 수용체는 영향받은 조직에서 발현된 그들의 일차 리간드, 즉 VCAM 및 MAdCAM과의 상호작용을 통해 세포 부착을 조절한다. 결합 시, 세포 표면에서의 조합된 인테그린/CAM 상호작용은 혈관벽에의 백혈구의 확고한 부착 후 영향받은 조직 내로의 도입을 야기한다. 다양한 기관에서의 상승된 세포 부착 분자(CAM) 발현은 여러 자가면역 질환과 관련되어 있다. 본 발명의 한 실시양태에서, α4 인테그린 또는 이의 CAM 리간드에 결합할 수 있는 1개 이상의 펩티드를 포함하는 트랜스바디(즉, Tf 및 리간드를 포함하는 융합 단백질)를 개체에 투여하여 염증을 치료하고/하거나 조절할 수 있다. 본 발명의 한 실시양태에서, α4 인테그린 또는 이의 CAM 리간드에 결합할 수 있는 1개 이상의 펩티드를 포함하는 트랜스바디를 개체에 투여하여 자가면역 질환을 치료할 수 있다.
본 발명의 또 다른 실시양태에서, 리간드 부분은 공지된 리간드 결합 서열을 포함하고 리간드 결합 서열 내에서 또는 리간드 결합 서열의 어느 한 측면 또는 양 측면에서 무작위화된 아미노산 잔기를 포함한다. 예를 들어, 본 발명은 무작위화된 아미노산 잔기들에 의해 둘러싸인 인테그린 결합 서열 RGD를 포함하는 Tf 융합 단백질을 포함한다. 이러한 융합 단백질은 Tf 부분, 예를 들어, 서열번호 3의 289 위치 아미노산과 290 위치 아미노산 사이에 삽입될 수 있다. 본 발명의 한 실시양태에서, 인테그린 결합 서열 및 무작위화된 펩티드 리간드 부분은 CXXXRGDXXXC이고, 이때 X는 무작위화된 아미노산 잔기이다. 본 발명의 또 다른 실시양태에서, 인테그린 결합 서열 및 무작위화된 펩티드 리간드 부분은 XXXRGDXXX이다. 또한, 본 발명은 무작위화된 펩티드에 의해 둘러싸인 인테그린 결합 서열 KGD 및 무작위화된 펩티드에 의해 둘러싸인 인테그린 결합 서열 LDV를 포함하나 이들로 한정되지 않는다.
본 발명의 또 다른 실시양태에서, 리간드 부분은 항체 가변 영역이다. 이 실시양태에서, 일반적으로, 본 발명의 Tf 융합 단백질은 1개의 변경된 Tf-유래 영역 및 1개의 항체 가변 영역을 가질 수 있다. 그러나, 1개 초과의 항체 가변 영역을 사용하여 본 발명의 Tf 융합 단백질을 제조함으로써 변경된 다작용성 Tf 융합 단백질을 제조할 수 있다.
한 실시양태에서, 본 발명의 융합 단백질은 Tf 분자 또는 이의 일부에 융합된 항체 가변 영역 또는 이의 일부를 포함한다. 또 다른 실시양태에서, 본 발명의 융합 단백질은 Tf 분자의 N-말단에 융합된 항체 가변 영역을 포함한다. 대안적 실시양태에서, 본 발명의 융합 단백질은 Tf 분자의 C-말단에 융합된 항체 가변 영역을 포함한다. 추가 실시양태에서, 본 발명의 융합 단백질은 항체 가변 영역의 N-말단에 융합된 Tf 분자를 포함한다. 대안적 실시양태에서, 본 발명의 융합 단백질은 항체 가변 영역의 C-말단에 융합된 Tf 분자를 포함한다.
본 발명은 변경된 Tf 분자 또는 이의 일부에 융합된 항체 가변 영역 또는 이의 일부를 포함하는 융합 단백질도 제공한다.
다른 실시양태에서, 본 발명의 융합 단백질은 변경된 Tf의 N-말단 및 C-말단 둘다에 융합된 항체 가변 영역을 포함한다. 또 다른 실시양태에서, N-말단 및 C-말단에서 융합된 항체 가변 영역은 동일한 항원에 결합한다. 또한, 동일한 항원에 결합하는 항체 가변 영역은 상이한 항체들로부터 유래될 수 있으므로, 동일한 표적 상의 상이한 에피토프들에 결합할 수 있다. 대안적 실시양태에서, N-말단 및 C-말단에서 융합된 항체 가변 영역은 상이한 항원들에 결합한다. 또 다른 대안적 실시양태에서, N-말단 및 C-말단에 융합된 항체 가변 영역은 질환, 장애 또는 병태의 치료 또는 예방을 위해 2가지 상이한 세포를 활성화시키는 데 유용할 수 있는 상이한 항원들에 결합한다. 또 다른 실시양태에서, N-말단 및 C-말단에 융합된 항체 가변 영역은 당업계에서 환자에서 흔히 동시적으로 발생하는 것으로 공지되어 있는 질환 또는 장애의 치료 또는 예방을 위해 2가지 상이한 항원들을 가교시키는 데 유용할 수 있는 상이한 항원들에 결합한다.
또한, 본 발명의 Tf 융합 단백질은 원하는 항체 가변 영역, 예를 들어, 치료 단백질 또는 이의 단편 또는 변이체에 결합하는 단일쇄 항체를 변경된 Tf의 내부 영역 내로 도입함으로써 제조할 수도 있다. 변경된 Tf의 내부 영역은 루프 영역, 철 결합 부위, 힌지 영역, 중탄산염 결합 부위 및 수용체 결합 도메인을 포함하나 이들로 한정되지 않는다.
이황화 결합에 의해 안정화되는 다수의 루프 또는 회전이 변경된 Tf 분자의 단백질 서열 내에 존재한다. 상기 루프는 특정 생물학적 활성을 갖는 변경된 Tf 분자를 발생시키기 위해 치료 활성 펩티드, 바람직하게는 항체 가변 영역, 특히 기능을 발휘하는 데 있어서 2차 구조를 요구하는 영역, 또는 치료 단백질, 바람직하게는 항체 가변 영역의 삽입 또는 내부 융합에 있어서 유용하다.
리간드, 예컨대, 항체 가변 영역, 바람직하게는 CDR이 Tf 분자의 1개 이상의 루프 내로 삽입되거나 치환되는 경우, 삽입은 Tf의 다른 영역 이외에 표면 노출된 루프 영역들 중 어느 한 영역 내에서 일어날 수 있다. 예를 들어, 삽입은 Tf 아미노산 32-33, 74-75, 256-257, 279-280 및 288-289를 포함하는 루프 내에서 일어날 수 있다. 상기 문헌(Ali et al.)을 참조한다. 전술한 바와 같이, 삽입은 Tf의 다른 영역, 예컨대, 철 및 중탄산염 결합을 위한 부위, 힌지 영역, 및 하기에 더 상세하게 기재된 수용체 결합 도메인 내에서 일어날 수도 있다. 단백질 또는 펩티드의 삽입을 위한 변경/치환에 적합한, Tf 단백질 서열 내의 루프는 무작위 펩티드 삽입물(insert)의 스크리닝가능한 라이브러리를 개발하는 데에도 사용될 수 있다. 이용가능한 파지 디스플레이 시스템 및 박테리아 디스플레이 시스템을 비롯한 펩티드 라이브러리의 발생을 위한 핵산 삽입물을 임의의 방법으로 제조한 후, Tf 도메인 내로 클로닝하고/하거나 Tf의 말단에 융합시킨다.
Tf의 N-말단은 자유롭고 융합 단백질의 본체로부터 외부로 향해 존재한다. Tf의 N-말단 상의 리간드 또는 리간드들의 융합체는 본 발명의 한 실시양태이다. 이러한 융합체는 링커 영역, 예컨대, 폴리-글리신 스트레치(stretch) 또는 PEAPTD 링커(서열번호 18)(이들로 한정되지 않음)를 포함하여 Tf로부터 리간드를 분리시킬 수 있다.
Tf의 C-말단은 묻혀 있거나 부분적으로 묻혀있을 수 있고 C-말단으로부터 6개 아미노산만큼 떨어져 있는 이황화 결합에 의해 확보될 수 있다. 인간 Tf에서, C-말단 아미노산은 프롤린이고, 이 프롤린은 이것이 배향되는 방식에 따라 융합체로부터 외부로 향해 존재하거나 분자의 본체 내부로 향해 존재할 것이다. C-말단에 있는 링커 또는 스페이서 부분은 본 발명의 일부 실시양태에서 사용될 수 있다. N-말단 근처에도 프롤린이 존재한다. 본 발명의 한 측면에서, N-말단 및/또는 C-말단에 존재하는 프롤린은 또 다른 아미노산으로 변경될 수 있거나 치환될 수 있다. 본 발명의 또 다른 측면에서, C-말단 이황화 결합은 C-말단을 없애기 위해 제거될 수 있다.
줄기 부분
본 발명의 줄기 부분은 그의 N-말단에서 Tf 부분 또는 리간드에 융합되고 그의 C-말단에서 고착자 부분과 융합되거나 융합되지 않을 수 있다. 효모 세포에서 발현되는 경우, 줄기 부분의 C-말단은 세포, 예를 들어, 세포벽 내에 위치한다. 본 발명의 한 실시양태에서, 줄기 부분은 융합 단백질을 효모 세포의 세포벽에 공유결합시키거나 비-공유결합시키는 세포벽 연결 부재로서 작용한다.
본 발명의 줄기부분은 막대-유사 또는 브러시-유사 구조를 갖는다. 이러한 종류의 구조는 중도 내지 고도로 글리코실화된 펩티드의 전형적인 구조이다. 본 발명의 줄기 부분은 N-글리칸 또는 O-글리칸을 포함한다. 본원에 전체가 참고로 도입되는 미국 특허 제6,114,147호를 참조한다. O-글리칸의 존재는 O-글리칸이 N-글리칸과 비교할 때 줄기 부분으로 하여금 연장된 막대-유사 구조를 취하게 하기 때문에 N-글리칸에 비해 바람직하다. 줄기 부분은 세린 및 쓰레오닌 글리코실화 부위의 중도 내지 고도 글리코실화도 포함할 수 있다.
본 발명의 융합 단백질의 줄기 부분은 중도 내지 고도 비율의 세린 또는 쓰레오닌 잔기를 포함한다. 예를 들어, 본 발명은 약 5% 이상의 세린 및/또는 쓰레오닌 잔기, 약 10% 이상의 세린 및/또는 쓰레오닌 잔기, 약 20% 이상의 세린 및/또는 쓰레오닌 잔기, 약 30% 이상의 세린 및/또는 쓰레오닌 잔기, 약 40% 이상의 세린 및/또는 쓰레오닌 잔기, 약 50% 이상의 세린 및/또는 쓰레오닌 잔기, 약 60% 이상의 세린 및/또는 쓰레오닌 잔기, 약 70% 이상의 세린 및/또는 쓰레오닌 잔기, 약 80% 이상의 세린 및/또는 쓰레오닌 잔기, 또는 약 90% 이상의 세린 및/또는 쓰레오닌 잔기를 갖는 줄기 부분을 포함한다. 본 발명의 한 실시양태에서, 줄기 부분은 약 20 내지 30%의 세린 및/또는 쓰레오닌 잔기, 약 20 내지 40%의 세린 및/또는 쓰레오닌 잔기, 약 30 내지 40%의 세린 및/또는 쓰레오닌 잔기, 약 20 내지 50%의 세린 및/또는 쓰레오닌 잔기, 약 30 내지 50%의 세린 및/또는 쓰레오닌 잔기, 약 20 내지 60%의 세린 및/또는 쓰레오닌 잔기, 또는 약 30 내지 60%의 세린 및/또는 쓰레오닌 잔기를 포함한다.
줄기 부분은 약 5 중량% 이상의 N- 또는 O-글리칸, 약 10 중량% 이상의 N- 또는 O-글리칸, 약 20 중량% 이상의 N- 또는 O-글리칸, 약 30 중량% 이상의 N- 또는 O-글리칸, 약 40 중량% 이상의 N- 또는 O-글리칸, 약 50 중량% 이상의 N- 또는 O-글리칸, 약 60 중량% 이상의 N- 또는 O-글리칸, 약 70 중량% 이상의 N- 또는 O-글리칸, 약 80 중량% 이상의 N- 또는 O-글리칸 또는 약 90 중량% 이상의 N- 또는 O-글리칸을 포함할 수 있다. 본 발명의 한 실시양태에서, 줄기 부분은 약 20 내지 30 중량%의 O-글리칸, 약 20 내지 40 중량%의 O-글리칸, 약 30 내지 40 중량%의 O-글리칸, 약 20 내지 50 중량%의 O-글리칸, 약 30 내지 50 중량%의 O-글리칸, 약 20 내지 60 중량%의 O-글리칸 또는 약 30 내지 60 중량%의 O-글리칸을 포함한다. 또 다른 실시양태에서, 글리칸, 특히 O-글리칸의 존재는 줄기 부분이 세포벽의 단백질에 존재하는 β-글리칸과 가교결합하게 한다. 따라서, 본 발명의 줄기 부분은 세포벽 가교결합 부재로서 작용할 수 있다.
줄기 부분은 MUC-타입 단백질의 구성원인 뮤신 단백질 또는 이의 일부를 포함할 수 있다. MUC-타입 뮤신은 고도로 글리코실화되어 있고, 호흡관, 위장관 및 생식관의 상피에서 발현되는 구조적으로 관련된 분자들, 예를 들어, MUC1(진뱅크 검색 번호 AF125525), MUC2(진뱅크 검색 번호 L21998), MUC3(진뱅크 검색 번호 AF113616), MUC4(진뱅크 검색 번호 AJ000281), MUC5AC(진뱅크 검색 번호 U83139), MUC5B(진뱅크 검색 번호 AJ001402), MUC6(진뱅크 검색 번호 U97698), MUC7(진뱅크 검색 번호 L13283), MUC8(진뱅크 검색 번호 U14383), MUC9(진뱅크 검색 번호 AW271430) 등으로 구성된 패밀리이다. 본 발명이 한 실시양태에서, 줄기 부분은 hMUC1 또는 이의 일부, 예를 들어, 서열번호 70의 핵산에 의해 코딩된 서열번호 71뿐만 아니라 서열번호 5의 핵산에 의해 코딩된 폴리펩티드를 포함한다. 본 발명의 또 다른 실시양태에서, 줄기 부분은 hMUC3 단백질 또는 이의 일부를 포함한다. 예를 들어, 본 발명은 서열번호 68의 핵산에 의해 코딩된 서열번호 69의 hMUC3 줄기를 포함한다.
본 발명의 융합 단백질은 뮤신 단백질, 뮤신-유사 단백질 및 이의 일부의 유사체 및 유도체와 같은 변이체를 포함하는 줄기도 포함한다. 변이체는 세포의 표면 상에 단백질을 디스플레이하는 것을 최적화하도록 생성될 수 있다. 변이체는 당업계에 공지된 방법에 의해 생성될 수 있다. 예를 들어, 변이체는 반복되는 아미노산 잔기를 제거하고/하거나 펩티드에 대해 무작위 돌연변이유발 및 선별 과정을 실시함으로써 개조할 수 있다.
본 발명의 줄기 부분은 AGA1(예를 들어, 서열번호 72에 의해 코딩된 서열번호 73), MAdCAM-1, GlyCAM-1, CD34; E-셀렉틴(selectin), P-셀렉틴 또는 L-셀렉틴으로부터의 컨센서스 반복부; 또는 바이러스 당단백질 스파이크(spike)(예컨대, 인플루엔자 바이러스, 허피스 심플렉스 바이러스, 인간 면역결핍 바이러스 또는 담배 모자이크 바이러스), 및 이의 변이체 및 단편을 포함하나 이들로 한정되지 않는, 뮤신 이외의 다른 글리코실화된 단백질로부터 유래될 수 있다. 본원에 전체가 참고로 도입되는 국제특허출원 공개 제WO 01/46698호, 문헌(Girard et al. (1995) Immunity 2: 113-123) 및 문헌(Van Kinken et al. (1998) Anal. Biochem. 265: 103-116)을 참조한다. 본 발명은 2가지 이상의 글리코실화된 단백질 또는 이들의 단편의 반복부 뿐만 아니라 2가지 이상의 글리코실화된 단백질의 조합물을 포함한다.
본 발명의 또 다른 실시양태에서, 줄기는 1개 이상의 자유 시스테인 잔기를 포함하도록 개조된다. 1개 이상의 자유 시스테인 잔기는 효모 세포의 세포벽 내의 단백질의 자유 시스테인 잔기와 이황화 결합을 형성할 수 있다. 세포벽 내에서의 1개 이상의 이황화 결합의 형성은 세포벽 결합 부재로서 작용할 수 있는 줄기 부분을 개조하는 데 이용될 수 있는 또 다른 방법을 대표한다.
본 발명의 융합 단백질이 효모 세포에서 발현되는 경우, 줄기 부분은 바람직하게는 효모 세포의 전체 세포벽을 덮기에 충분한 길이를 갖는다. 바람직하게는, 줄기 부분의 N-말단은 세포벽의 외부에 위치하고, 가장 바람직하게는 Tf 부분 및 리간드와 숙주 효모 세포 사이의 입체 장애를 감소시키기 위해 효모 세포로부터 떨어져 막대-유사 구조로 연장되어 있다. 줄기 부분의 길이는 약 25개 이상의 아미노산, 약 50개 이상의 아미노산, 약 75개 이상의 아미노산, 약 100개 이상의 아미노산, 약 125개 이상의 아미노산, 약 150개 이상의 아미노산, 약 175개 이상의 아미노산, 약 200개 이상의 아미노산, 약 225개 이상의 아미노산, 약 250개 이상의 아미노산, 약 275개 이상의 아미노산, 약 300개 이상의 아미노산, 약 325개 이상의 아미노산, 약 350개 이상의 아미노산, 약 375개 이상의 아미노산, 약 400개 이상의 아미노산, 약 425개 이상의 아미노산, 약 450개 이상의 아미노산, 약 475개 이상의 아미노산, 약 500개 이상의 아미노산, 약 525개 이상의 아미노산, 약 550개 이상의 아미노산, 약 575개 이상의 아미노산, 약 600개 이상의 아미노산, 약 625개 이상의 아미노산 또는 약 650개 이상의 아미노산이어야 한다. 한 실시양태에서, 줄기 부분의 길이는 약 500개 아미노산이다. 또 다른 실시양태에서, 줄기 부분의 길이는 약 300 내지 600개 아미노산이다.
고착자 부분
본 발명의 융합 단백질의 고착자 부분은 상기 융합 단백질을 숙주 세포 표면 또는 지지체 표면에 물리적으로 부착시키는 융합 단백질의 일부이다. 본 발명의 한 실시양태에서, 고착자 부분은 융합 단백질을 포유동물 세포막(이로 한정되지 않음)과 같은 세포막에 부착시킨다. 본 발명의 또 다른 실시양태에서, 고착자 부분은 융합 단백질을 효모 세포벽(이로 한정되지 않음)과 같은 세포벽에 부착시키거나 고정시킬 수 있다. 고착자가 융합 단백질을 세포벽에 부착시킬 때, 고착자는 세포벽 결합 부재이다.
고착자 부분은 융합 단백질을 세포벽 또는 세포막에 일시적으로 부착시킬 수 있다. 본 발명의 한 실시양태에서, 고착자 부분은 줄기 부분이 세포벽에 공유결합되거나 비-공유결합되는 기회를 제공하는 세포벽 또는 세포막에 융합 단백질을 일시적으로 부착시킨다. 예를 들어, 세포에서 고착자의 일시적 부착은 줄기 부분의 O-글리칸이 세포벽의 β-글리칸과 가교결합하게 할 수 있다.
본 발명의 한 실시양태에서, 고착자 부분은 미생물, 예컨대, 효모 및 곰팡이와 같은 하등 진핵생물뿐만 아니라 포유동물 세포주와 같은 포유동물 세포의 세포막 또는 세포벽에 부착된다. 고착자 부분은 프롤린과 같은 아미노산을 갖는 세포막 또는 세포벽에 고착자 부분을 고착시키는 긴 C-말단을 가질 수 있다(Kok (1990) FEMS Microbiology Reviews 87: 15-42).
고착자 부분은 GPI 고착자의 사용에 의해 세포에 고착될 수 있다. 문헌(Conzelmann et al. EMBO 9: 653-661) 및 (Lipke and Ovalle (1998) J. Bacteriol. 180: 3735-3740)을 참조한다. 본원에 개시된 GPI 신호 펩티드와 같은 GPI 신호 서열 펩티드는 GPI를 융합 단백질의 C-말단에 부착시키는 신호를 보낸다. GPI 신호 자체는 3가지 도메인, 즉 GPI 부착 부위(ω 부위)뿐만 아니라 ω 부위의 다운스트림에 존재하는 제1 및 제2 아미노산을 포함하는 영역, 5 내지 10개의 아미노산으로 구성된 스페이서, 및 10 내지 15개의 아미노산으로 구성된 소수성 스트레치를 갖는다. GPI 신호를 포함하는 단백질은 ω 부위에서 절단되고 상기 단백질의 생성된 카복시 말단은 GPI 잔기에 공유결합된다. 이 반응은 소포체(endoplasmic reticulum)에서 일어난다. GPI 부분에 의해 막에 결합되어 있는 GPI-부착된 단백질은 세포 표면으로 수송되고 상기 단백질이 짧은 ω-마이너스 영역 내에 염기성 잔기(R 및/또는 K)를 함유하는 경우 GPI-고착된 단백질로서 원형질막 상에 존재한다. ω-4/-5 부위에서 V, I 또는 L을 갖고 ω-2 부위에서 Y 또는 N을 갖는 GPI-결합된 단백질은 세포막에 삽입된다. 문헌(Hamada et al. (1999) J. Bacteriol. 181: 3886-3889; Nuoffer et al. (1993) J. Biol. Chem. 268: 10558-10563; De Nobel et al. (1994) Trends Cell Biol. 4: 42-45.; Hamada et al. (1998) Mol. Gen. Genet. 258: 53-59; and Van Der Vaart et al. (1998) Biotechnol. Genet. Eng. Rev. 15: 387-411)을 참조한다.
본 발명의 한 실시양태에서, 효모 GPI YIR019C는 Tf 융합 단백질의 고착자 부분을 제공하는 데 사용된다. 도 2는 GPI YIR019C를 도식적으로 보여준다. 아미노산 서열(서열번호 15) 내의 ω 부위는 글리신이고 그의 어느 한 측면 상에서 스페이스를 갖는 것으로 도시되어 있다. 스페이스는 ω 부위의 어느 한 측면 상의 스페이서 영역을 표시한다. 진하게 표시되어 있는 I 및 Y 아미노산은 각각 ω-5/-4 부위 및 ω-2 부위이다.
여러 사카로마이세스 고착자 부분이 당업계에 공지되어 있고 본 발명의 융합 단백질을 구축하는 데 사용될 수 있다. 효모 GPI 신호 단백질의 다른 예로는 YDR534C, YNL327W, YOR214C, YDR134C, YPL130, YOR009W, YER150W, YDR077W, YOR383C, YJR151C, YJR004, YJL078C, YLR110C 및 YNL300W를 들 수 있으나 이들로 한정되지 않는다. 또한, 다른 유기체로부터 유래된 GPI 신호 단백질, 예를 들어, 캔디다 글라브라타(Candida glabrata)의 EPA1, 캔디다 알비칸스(Candida albicans)의 Hwp1p 또는 트리파노소마 브루세이(Trypanosoma brucei)의 VSG의 GPI를 사용할 수 있다.
본 발명의 한 실시양태에서, 고착자 부분은 포유동물의 고착자 부분 또는 이의 유도체 또는 단편이다. 본 발명의 또 다른 실시양태에서, GPI 신호 펩티드는 포유동물 GPI 신호 단백질이다. 예를 들어, 본 발명은 인간 MDP GPI 신호 단백질의 유도체, 예컨대, 표 1에 개시된 단백질을 포함한다(실시예 5 참조).
본 발명은 1개 이상의 비-결합된 시스테인 잔기를 갖는 고착자 부분을 포함하는 융합 단백질을 포함한다. 상기 시스테인 잔기는 세포벽에서 단백질의 시스테인 잔기와 이황화 결합을 형성하여 융합 단백질을 세포에 부착시키는 역할을 수행할 수 있다.
본 발명은 고착자 부분으로서 경막 도메인(TMD)을 포함하는 융합 단백질을 포함한다. 본 발명의 한 실시양태에서, TMD는 단회 통과 타입 I 또는 타입 II 막 단백질의 한 영역이다. 예를 들어, 본 발명은 FUS1의 잔기 70 내지 98을 포함하나 이들로 한정되지 않는다.
본 발명의 또 다른 실시양태에서, TMD는 다회 통과 막 단백질의 여러 경막 영역들 중 1개 이상의 경막 영역을 포함한다. 본 발명의 한 실시양태에서, TMD는 약 10 내지 60개의 아미노산, 약 15 내지 60개의 아미노산, 약 20 내지 60개의 아미노산, 약 30 내지 60개의 아미노산 또는 약 25 내지 50개의 아미노산을 포함하는 다회 통과 막 단백질의 소수성 영역이다. 예를 들어, 본 발명은 아미노산 잔기 25 내지 30, 73 내지 100, 171 내지 198, 249 내지 277, 714 내지 742, 761 내지 789, 838 내지 858, 864 내지 884, 940 내지 967, 및 979 내지 100으로 구성된 군으로부터 선택된, 사카로마이세스의 STE6의 TMD 중 1개 이상의 TMD를 포함하나 이들로 한정되지 않는다(사카로마이세스 게놈 데이터베이스 주석).
또 다른 실시양태에서, 고착자 부분은 Tf 융합 단백질을 고체 지지체, 예컨대, 마이크로어레이에 부착시키는 데 사용된다. 고착자 부분은 바람직하게는 짧은 에피토프 태그(즉, 항체, 전형적으로 단일클론 항체에 의해 인식되는 서열), 예컨대, 폴리히스티딘, SEAP, 또는 M1 및 M2 Flag이다. 본원에 전체가 참고로 도입되는 문헌(Bush et al. (1991) J. Biol. Chem. 266: 13811-13814, Berger et al. (1988) Gene 66: 1-10), 미국 특허 제5,011,912호, 미국 특허 제4,851,341호, 미국 특허 제4,703,004호 및 미국 특허 제4,782,137호를 참조한다. 한 실시양태에서, 줄기 도메인은 항-줄기 서열 항체, 예컨대, 항-뮤신 항체에 의해 지지체에 부착된다.
알부민
본 발명은 리간드를 표적에 "제시"하는 데 있어서 Tf 이외의 다른 단백질 또는 단백질 단편을 사용하는 융합 단백질도 포함한다. 적절한 단백질은 가용성을 나타내면서 길이가 약 50개 이상의 아미노산인 단백질이다. 본 발명의 한 실시양태에서, 단백질 또는 단백질 단편은 Tf의 2차 구조와 유사한 2차 구조를 보유한다.
단백질 또는 그의 단편이 융합 단백질의 줄기 부분으로부터 잘려 나와 치료제로서 사용될 때 리간드의 반감기를 증가시킬 수 있는 것이 바람직하다. 예를 들어, 본 발명은 알부민 부분, 줄기 부분 및 세포벽 결합 부재를 포함하는 융합 단백질의 사용을 예상한다. 또한, 본 발명은 알부민 부분 및 고착자 부분을 포함하는 융합 단백질의 사용을 예상한다. 알부민 부분은 융합 단백질의 알부민 부분 및 리간드 부분이 융합 단백질의 나머지 부분으로부터 잘려 나와 상기 리간드를 치료제로서 필요로 하는 환자에게 투여된 경우 리간드, 즉 치료제에 증가된 혈청 반감기를 부여할 수 있다.
알부민 부분을 포함하는 융합 단백질은 알부민 단백질, 알부민 변이체 또는 이의 단편을 포함할 수 있다. 한 실시양태에서, 알부민 단백질은 서열번호 66의 핵산 서열에 의해 코딩된 서열번호 67의 아미노산 서열을 포함한다. 본 발명은 당업계에 공지되어 있는 알부민의 변경을 포함한다.
핵산
또한, 본 발명은 핵산 분자도 제공한다. 상기 핵산 분자는 리간드 부분에 공유결합되거나 공유연결된 Tf 단백질 또는 이의 일부를 포함하는 변경된 Tf 융합 단백질을 코딩한다. 상기 융합 단백질은 링커 영역, 예를 들어, 약 50, 40, 30, 20 또는 10개의 미만의 아미노산 잔기를 갖는 링커를 추가로 포함할 수 있다. 상기 링커는 Tf 단백질 또는 이의 일부 및 리간드 부분에 공유결합될 수 있거나 Tf 단백질 또는 이의 일부와 리간드 부분 사이에 공유결합될 수 있다. 본 발명의 핵산 분자는 정제되거나 정제되지 않을 수 있다.
핵산 분자를 복제하고 코딩된 융합 단백질을 발현하기 위한 숙주 세포 및 벡터도 제공된다. 원핵세포이든 진핵세포이든 관계없이 임의의 벡터 또는 숙주 세포가 사용될 수 있으나, 진핵 발현 시스템, 특히 효모 발현 시스템 및 포유동물 발현 시스템이 바람직할 수 있다. 이러한 목적을 위해 사용될 수 있는 많은 벡터 및 숙주 세포가 당업계에 공지되어 있다. 원하는 목적에 적절한 세트를 선별하는 것은 당업계의 기술 수준 내에 있다.
Tf, Tf의 일부 및 원하는 치료 단백질을 코딩하는 DNA 서열은 당업계에 공지되어 있는 다양한 게놈 또는 cDNA 라이브러리로부터 클로닝될 수 있다. 프로브-기재 방법을 이용하여 이러한 DNA 서열을 단리하는 기법은 통상적인 기법이고 당업자에게 잘 공지되어 있다. 상기 DNA 서열을 단리하기 위한 프로브는 공개된 DNA 또는 단백질 서열을 기초로 할 수 있다(예를 들어, 본원에 전체가 참고로 도입되는 문헌(Baldwin, G. S. (1993) Comparison of Transferrin Sequences from Different Species. Comp. Biochem. Physiol. 106B/1: 203-218) 및 이 문헌에서 언급된 모든 참고문헌 참조). 별법으로, 본원에 참고로 도입되는 미국 특허 제4,683,195호(Mullis et al.) 및 미국 특허 제4,683,202호(Mullis)에 개시된 중합효소 연쇄 반응(PCR)을 이용할 수 있다. 상기 DNA 서열의 단리를 위한 라이브러리 및 프로브의 선택은 당업계의 통상의 기술 수준 내에 있다.
당업계에 공지되어 있는 바와 같이, 2개의 폴리뉴클레오티드 또는 폴리펩티드 사이의 "유사성"은 1개의 폴리뉴클오티드 또는 폴리펩티드의 뉴클레오티드 또는 아미노산 서열 및 이의 보존된 뉴클레오티드 또는 아미노산 치환체를 제2 폴리뉴클레오티드 또는 폴리펩티드의 서열과 비교하여 측정한다. 마찬가지로 당업계에 공지되어 있는 바와 같이, 2개의 폴리펩티드 또는 2개의 폴리뉴클레오티드 서열 사이의 서열 관련성 정도를 의미하는 동일성은 상기 2개의 서열 사이의 일치를 확인함으로써 측정한다. 동일성 및 유사성 둘다 용이하게 계산될 수 있다(Computational Molecular Biology, Lesk, A. M., ed., Oxford University Press, New York, 1988; Biocomputing: Informatics and Genome Projects, Smith, D. W., ed., Academic Press, New York, 1993; Computer Analysis of Sequence Data, Part I, Griffin, A. M., and Griffin, H. G., eds., Humana Press, New Jersey, 1994; Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987; and Sequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991).
2개의 폴리뉴클레오티드 또는 폴리펩티드 서열 사이의 동일성 및 유사성을 측정하기 위한 다수의 방법이 존재하지만, 용어 "동일성" 및 "유사성"은 당업계에 잘 공지되어 있다(Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987; Sequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991; and Carillo, H., and Lipman, D., SIAM J. Applied Math., 48: 1073 (1988)). 2개의 서열 사이의 동일성 또는 유사성을 측정하는 데 통상적으로 이용되는 방법은 문헌(Guide to Huge Computers, Martin J. Bishop, ed., Academic Press, San Diego, 1994, and Carillo, H., and Lipman, D., SIAM J. Applied Math. 48: 1073 (1988))에 개시된 방법들을 포함하나 이들로 한정되지 않는다.
동일성을 측정하기에 바람직하는 방법은 시험되는 2개의 서열 사이에서 가장 큰 일치를 제공하도록 디자인되어 있다. 동일성 및 유사성을 측정하는 방법은 컴퓨터 프로그램으로 암호화되어 있다. 2개의 서열 사이의 동일성 및 유사성을 측정하기에 바람직한 컴퓨터 프로그램 방법은 GCG 프로그램 팩키지(Devereux, et al., Nucl. Acid Res. 12(1): 387 (1984)), BLASTP, BLASTN 및 FASTA(Atschul, et al., J. Mol. Biol. 215: 403 (1990))를 포함하나 이들로 한정되지 않는다. 전술된 유사성 또는 동일성 정도는 종종 제1 서열과 제2 서열의 차이를 표시하는, 2개 서열 사이의 일치도로서 측정된다. 2개 핵산 서열 사이의 동일성 정도는 GCG 프로그램 팩키지(Needleman and Wunsch J. Mol. Biol. 48: 443-453 (1970)) 내에 공급된 GAP과 같은, 당업계에 공지된 컴퓨터 프로그램에 의해 측정될 수 있다. 본 발명의 2개 핵산 서열 사이의 동일성 정도를 측정하기 위해, 하기 셋팅을 갖는 GAP을 사용한다: GAP 생성 벌점 5.0 및 GAP 연장 벌점 0.3.
코돈 최적화
유전 코드의 축퇴는 천연 DNA 서열에 의해 코딩된 폴리펩티드와 동일한 아미노산 서열을 갖는 폴리펩티드를 여전히 생성하면서 Tf 단백질 및/또는 원하는 치료 단백질의 뉴클레오티드 서열의 변경을 허용한다. "코돈 최적화"(본원에 전체가 참고로 도입되는 미국 특허 제5,547,871호에 기재됨)로서 공지되어 있는 방법은 변경된 DNA 서열을 디자인하는 수단을 갖는 방법을 제공한다. 코돈 최적화된 유전자의 디자인은 유기체 내에서의 코돈 사용 빈도, 가장 가까운 인접 코돈 빈도, RNA 안정성, 2차 구조 형성에 대한 잠재력, 합성 경로 및 해당 유전자의 목적하는 DNA 개조를 비롯한 다양한 인자를 고려해야 한다. 특히, 효모 발현 시스템이 사용되는 경우, 이용가능한 방법을 이용하여 소정의 융합 단백질을 코딩하는 코돈을 효모에 의해 가장 용이하게 인식되는 코돈으로 변경시킬 수 있다.
유전 코드의 축퇴성은 동일한 아미노산 서열이 많은 다양한 방식으로 코딩되고 번역될 수 있게 한다. 예를 들어, 류신, 세린 및 아르기닌은 6가지 상이한 코돈에 의해 각각 코딩되지만, 발린, 프롤린, 쓰레오닌, 알라닌 및 글리신은 4가지 상이한 코돈에 의해 각각 코딩된다. 그러나, 동일한 아미노산을 코딩하는 코돈들의 사용 빈도는 진핵생물 및 원핵생물 사이에서 게놈마다 상이하다. 예를 들어, 포유동물 사이에서 동일한 아미노산을 코딩하는 코돈 선택 패턴은 매우 유사하지만, 효모(예컨대, 사카로마이세스 세레비지애), 박테리아(예컨대, 이. 콜라이) 및 곤충(예컨대, 초파리)과 같은 진화적으로 구별되는 유기체들은 명백히 상이한 패턴의 게놈 코돈 사용 빈도를 나타낸다(Grantham, R., et al., Nucl. Acid Res., 8, 49-62 (1980); Grantham, R., et al., Nucl. Acid Res., 9, 43-74 (1981); Maroyama, T., et al., Nucl. Acid Res., 14, 151-197 (1986); Aota, S., et al., Nucl. Acid Res., 16, 315-402 (1988); Wada, K., et al., Nucl. Acid Res., 19 Supp., 1981-1985 (1991); Kurland, C. G., FEBS Lett., 285, 165-169 (1991)). 코돈 선택 패턴에서의 이러한 차이는 펩티드 연장 속도를 조절함으로써 개개의 유전자의 전체 발현 수준에 기여하는 듯하다(Kurland, C. G., FEBS Lett., 285, 165-169 (1991); Pedersen, S., EMBO J., 3, 2895-2898 (1984); Sorensen, M. A., J. Mol. Biol., 207, 365-377 (1989); Randall, L. L., et al., Eur. J. Biochem., 107, 375-379 (1980); Curran, J. F., and Yams, M., J. Mol. Biol., 209, 65-77 (1989); Varenne, S., et al., J. Mol. Biol., 180, 549-576 (1984), Varenne, S., et al., J. Mol. Biol., 180, 549-576 (1984); Garel, J.-P., J. Theor. Biol., 43, 211-225 (1974); Ikemura, T., J. Mol. Biol., 146, 1-21 (1981); Ikemura, T., J. Mol. Biol., 151, 389-409 (1981)).
합성 유전자에 대한 코돈 사용 빈도는 재조합 단백질 발현에 사용되는 것을 목적으로 하는 세포/유기체의 정확한 (또는 가능한 밀접하게 관련되어 있는) 게놈, 특히 효모 종의 정확한 (또는 가능한 밀접하게 관련되어 있는) 게놈으로부터 유래된 핵 유전자의 코돈 사용을 반영해야 한다. 전술한 바와 같이, 한 실시양태에서, 인간 Tf 서열은 치료 단백질 뉴클레오티드 서열일 수 있기 때문에 효모 발현에 대해 전술한 바와 같이 변경 전 또는 후에 최적화된 코돈이다.
벡터
본 발명에서 사용하기 위한 발현 유니트는 일반적으로 5'에서 3' 방향으로 작동가능하게 연결된 하기 요소들을 포함할 것이다: 전사 프로모터, 2차 신호 서열, 원하는 치료 단백질 또는 펩티드를 코딩하는 DNA 서열에 연결된 Tf 단백질 또는 이의 일부를 포함하는 변경된 Tf 융합 단백질을 코딩하는 DNA 서열, 및 전사 종결서열(terminator). 전술한 바와 같이, Tf 부분에 융합되어 있거나 Tf 부분 내에 있는 치료 단백질 또는 펩티드의 임의의 정렬은 본 발명의 벡터에서 사용될 수 있다. 적절한 프로모터, 신호 서열 및 종결서열의 선택은 선택된 숙주 세포에 의해 결정될 것이고 당업자에게 자명할 것이며 하기에 더 구체적으로 논의되어 있다.
본 발명에서 사용하기에 적합한 효모 벡터는 미국 특허 제6,291,212호에 기재되어 있고 YRp7(Struhl et al., Proc. Natl. Acad. Sci. USA 76: 1035-1039, 1978), YEp13(Broach et al., Gene 8: 121-133, 1979), pJDB249 및 pJDB219(Beggs, Nature 275: 104-108, 1978), pPPCOOO5, pSeCHSA, pScNHSA, pC4 및 이들의 유도체를 포함한다. 유용한 효모 플라스미드 벡터는 pRS403-406, pRS413-416 및 스트라진 클로닝 시스템스(Stratagene Cloning Systems; 미국 캘리포니아주 92037 라 졸라 소재)로부터 구입가능한 피키아 벡터도 포함한다. 플라스미드 pRS403, pRS404, pRS405 및 pRS406은 효모 삽입 플라스미드(Yip)이고 효모 선별 마커 HIS3, TRP1, LEU2 및 URA를 삽입시킨다. 플라스미드 pRS413~41.6은 효모 센트로미어 플라스미드(YCp)이다.
이러한 벡터는 일반적으로 표현형 분석에 의해 형질전환체가 선별될 있게 하는 우성 표현형을 나타내는 임의의 수의 유전자들 중 하나일 수 있는 선별 마커를 포함할 것이다. 바람직한 선별가능한 마커는 숙주 세포 영양요구를 보완하거나, 항생제 내성을 제공하거나, 또는 세포가 특정 탄소원을 사용할 수 있게 하는 마커이고, LEU2(Broach et al., Gene 8: 121-133, 1979), URA3(Botstein et al., Gene 8: 17, 1979), HIS3(Struhl et al., Proc. Natl. Acad. Sci. USA 76: 1035-1039, 1978) 또는 POT1(Kawasaki and Bell, 유럽 특허 제171,142호)을 포함한다. 다른 적절한 선별 마커는 효모 세포에 클로람페니콜 내성을 부여하는 CAT 유전자를 포함한다. 효모에서 사용하기에 바람직한 프로모터는 효모 해당효소 유전자(Hitzeman et al., J. Biol. Chem. 225: 12073-12080, 1980; Alber and Kawasaki, J. Mol. Appl. Genet. 1: 419-434, 1982; 미국 특허 제4,599,311호(Kawasaki)) 또는 알코올 데하이드로게네이즈 유전자(Young et al., Genetic Engineering of Microorganisms for Chemicals, Hollaender et al., (eds.), p. 355, Plenum, N.Y., 1982; Ammerer, Meth. Enzymol. 101: 192-201, 1983)로부터 유래된 프로모터를 포함한다. 이와 관련하여, 사용될 수 있는 프로모터는 TPH 프로모터(미국 특허 제4,599,311호(Kawasaki)) 및 ADH2-4c(미국 특허 제6,291,212호) 프로모터이다(Russell et al., Nature 304: 652-654, 1983). 발현 유니트는 전사 종결서열도 포함할 수 있다. 한 전사 종결서열은 TPH 종결서열이다(Alber and Kawasaki, J. Mol. Appl. Genet. 1: 419-434, 1982).
본 발명의 변경된 융합 단백질은 효모 이외에 사상 진규, 예를 들어, 진균 아스퍼길러스(Aspergillus)의 균주에서 발현될 수 있다. 유용한 프로모터의 예로는 아스퍼길러스 니둘란스 해당효소 유전자로부터 유래된 프로모터, 예컨대, adh3 프로모터(McKnight et al., EMBO J. 4: 2093-2099, 1985) 및 tpiA 프로모터를 들 수 있다. 적절한 종결서열의 예는 adh3 종결서열(McKnight et al., EMBO J. 4: 2093-2099, 1985)이다. 이러한 구성요소를 사용하는 발현 유니트는 예를 들어, 아스퍼길러스의 염색체 DNA 내로 삽입될 수 있는 벡터 내로 클로닝될 수 있다.
본 발명을 수행하는 데 있어서 사용되는 포유동물 발현 벡터는 변경된 Tf 융합 단백질의 전사를 지시할 수 있는 프로모터를 포함할 것이다. 프로모터는 바이러스 프로모터 및 세포내 프로모터를 포함하나 이들로 한정되지 않는다. 예를 들어, 바이러스 프로모터는 아데노바이러스 2의 주요 후기 프로모터(Kaufman and Sharp, Mol. Cell. Biol. 2: 1304-13199, 1982) 및 SV40 프로모터(Subramani et al., Mol. Cell. Biol.: 854-864, 1981)를 포함한다. 세포내 프로모터는 마우스 메탈로티오네인 1 프로모터(Palmiter et al., Science 222: 809-814, 1983) 및 마우스 V6(미국 특허 제6,291,212호 참조) 프로모터(Grant et al., Nuc. Acids Res. 15: 5496, 1987)를 포함한다. 이러한 프로모터 중 하나는 마우스 VH(미국 특허 제6,291,212호 참조) 프로모터(Loh et al., ibid.)이다. 이러한 발현 벡터는 프로모터의 다운스트림과 Tf 융합 단백질을 코딩하는 DNA 서열의 업스트림에 위치한 RNA 스플라이스 부위 세트도 포함할 수 있다. RNA 스플라이스 부위는 예를 들어, 아데노바이러스 및/또는 면역글로불린 유전자로부터 수득될 수 있다.
원하는 코딩 서열의 다운스트림에 위치한 폴리아데닐화 신호도 발현 벡터 내에 포함된다. 폴리아데닐화 신호는 SV40으로부터 유래된 초기 또는 후기 폴리아데닐화 신호(Kaufman and Sharp, Mol. Cell. Biol. 2: 1304-13199, 1982), 아데노바이러스 5 E1B 영역으로부터 유래된 폴리아데닐화 신호 및 인간 성장 호르몬 유전자 종결서열(DeNoto et al., Nucl. Acid Res. 9: 3719-3730, 1981)을 포함한다. 이러한 폴리아데닐화 신호 중 하나는 VH(미국 특허 제6,291,212호 참조) 유전자 종결서열(Loh et al., ibid.)이다. 발현 벡터는 비-코딩 바이러스 리더 서열, 예컨대, 프로모터와 RNA 스플라이스 부위 사이에 위치한 아데노바이러스 2 삼분(tripartite) 리더를 포함할 수 있다. 바람직한 벡터는 인핸서 서열, 예컨대, SV40 인핸서 및 마우스(미국 특허 제6,291,212호 참조) 인핸서도 포함할 수 있다(Gillies, Cell 33: 717-728, 1983). 발현 벡터는 아데노바이러스 VA RNA를 코딩하는 서열도 포함할 수 있다.
형질전환
진균을 형질전환시키는 기법은 문헌에 잘 공지되어 있고 예를 들어, 문헌(Beggs, Nature 275: 104-108, 1978), 문헌(Hinnen et al., Proc. Natl. Acad. Sci. USA 75: 1929-1933, 1978), 문헌(Yelton et al., Proc. Natl. Acad. Sci. USA 81: 1740-1747, 1984) 및 문헌(Russell, Nature 301: 167-169, 1983)에 기재되어 있다. 숙주 세포의 유전형은 일반적으로 발현 벡터 상에 존재하는 선별 마커에 의해 보완되는 유전적 결함을 포함할 것이다. 구체적인 숙주 및 선별 마커의 선택은 당업계의 통상의 기술 수준 내에 있다.
본 발명의 변경된 Tf 융합 단백질을 포함하는 클로닝된 DNA 서열은 예를 들어, 칼슘 포스페이트-매개 형질감염(Wigler et al., Cell 14: 725, 1978; Corsaro and Pearson, Somatic Cell Genetics 7: 603, 1981; Graham and Van der Eb1 Virology 52: 456, 1973)에 의해 배양된 포유동물 세포 내로 도입될 수 있다. 클로닝된 DNA 서열을 포유동물 세포 내로 도입하기 위한 다른 기법, 예컨대, 전기천공(Neumann et al., EMBO J. 1: 841-845, 1982) 또는 리포펙션(lipofection)도 이용될 수 있다. 클로닝된 DNA가 도입된 세포를 확인하기 위해, 선별 마커는 일반적으로 원하는 유전자 또는 cDNA와 함께 세포 내로 도입된다. 배양된 포유동물 세포에서 사용하기에 바람직한 선별 마커는 약물, 예컨대, 네오마이신, 하이그로마이신 및 메토트렉세이트에 대한 내성을 부여하는 유전자를 포함한다. 선별 마커는 증폭가능한 선별 마커일 수 있다. 증폭가능한 선별 마커 중 하나는 DHFR 유전자이다. 증폭가능한 마커 중 하나는 DHFRr(미국 특허 제6,291,212호 참조) cDNA이다(Simonsen and Levinson, Proc. Natl. Acad. Sci. USA 80: 2495-2499, 1983). 선별가능한 마커는 문헌(Thilly, Mammalian Cell Technology, Butterworth Publishers, Stoneham, Mass.)에 기재되어 있고, 선별 마커의 선택은 당업계의 통상의 기술 수준 내에 있다.
숙주 세포
본 발명은 본 발명의 변경된 Tf 융합 단백질을 발현하도록 형질전환된 세포, 예를 들어, 효모 세포 또는 포유동물 세포도 포함한다. 형질전환된 숙주 세포 자체 이외에, 본 발명은 상기 세포의 배양물, 예를 들어, 단일클론 (클론적으로 균질한) 배양물, 또는 영양 배지 중의 단일클론 배양물로부터 유래된 배양물도 포함한다. 폴리펩티드가 분비되는 경우, 배지는 세포와 함께 폴리펩티드를 함유하거나, 또는 세포가 여과되거나 원심분리에 의해 제거된 경우 세포 없이 폴리펩티드를 함유할 것이다.
본 발명을 실시하는 데 사용되는 숙주 세포는 외래 DNA로 형질전환되거나 형질감염되고 배양물 중에서 생장할 수 있는 진핵세포 및 일부 경우 원핵세포, 예컨대, 배양된 포유동물 세포, 곤충 세포, 진균 세포, 식물 세포 및 박테리아 세포를 포함한다.
효모의 종(예를 들어, 사카로마이세스 종, 쉬조사카로마이세스 종, 피키아 종)을 비롯한 진균 세포는 본 발명에서 숙주 세포로서 사용될 수 있다. 본 발명의 Tf 융합 단백질을 발현시키기 위한 숙주로서 본 발명의 실시에서 사용될 수 있는 것으로 고려되는 예시적 효모 속은 피키아(이전에 한세눌라로서 분류된 종을 포함함), 사카로마이세스, 클루이베로마이세스(Kluyveromyces), 아스퍼길러스, 캔디다, 토룰롭시스(Torulopsis), 토룰라스포라(Torulaspora), 쉬조사카로마이세스, 시테로마이세스(Citeromyces), 파키솔렌(Pachysolen), 지고사카로마이세스(Zygosaccharomyces), 데바로마이세스(Debaromyces), 트리코데르마(Trichoderma), 세팔로스포륨(Cephalosporium), 후미콜라(Humicola), 뮤코르(Mucor), 뉴로스포라(Neurospora), 야로위아(Yarrowia), 메트슈니코위아(Metschunikowia), 로도스포리듐(Rhodosporidium), 류코스포리듐(Leucosporidium), 보트리오아스쿠스(Botryoascus), 스포리디오볼루스(Sporidiobolus), 엔도마이콥시스(Endomycopsis) 등이다. 사카로마이세스 종의 예는 사카로마이세스 세레비지애, 사카로마이세스 이탈리쿠스(Saccharomyces italicus), 사카로마이세스 로욱시이(Saccharomyces rouxii)이다. 클로이베로마이세스 종의 예는 클로이베로마이세스 락티스(Kluyveromyces lactis) 및 클로이베로마이세스 마르시아누스(Kluyveromyces marxianus)이다. 적절한 종은 토룰라스포라 델브루엑키이(Torulaspora delbrueckii)이다. 피키아 (한세눌라) 종의 예는 이전에 한세눌라 폴리모파(Hansenula polymorpha)로 지칭되던 피키아 안구스타(Pichia angusta), 이전에 한세눌라 아노말라(Hansenula anomala)로 지칭되던 피키아 아노말라(Pichia anomala) 및 피키아 파스토리스이다.
본 발명의 Tf 융합 단백질을 제조하는 데 특히 유용한 숙주 세포는 메탄올친화성 피키아 파스토리스(Steinlein et al., (1995) Protein Express. Purif. 6: 619-624)이다. 피키아 파스토리스는 그의 알코올 옥시데이즈 프로모터가 단리되고 클로닝되었기 때문에 외래 단백질의 제조에 뛰어난 숙주가 되도록 개발되었고, 그의 형질전환은 1985년에 처음 보고되었다. 피키아 파스토리스는 글루코스의 부재 하에 탄소원으로서 메탄올을 사용할 수 있다. 피키아 파스토리스 발현 시스템은 메탄올 대사에서 제1 단계의 촉매로서 작용하는 효소인 알코올 옥시데이즈의 발현을 코딩하는 유전자를 조절하는 메탄올-유도된 알코올 옥시데이즈(AOX1) 프로모터를 사용할 수 있다. 이 프로모터는 그 특징이 규명되었고 일련의 피키아 파스토리스 발현 벡터 내로 도입된 바 있다. 피키아 파스토리스에서 제조된 단백질은 전형적으로 정확하게 폴딩되어 배지 내로 분비되기 때문에, 유전적으로 개조된 피키아 파스토리스의 발현은 이. 콜라이 발현 시스템에 대한 훌륭한 대안을 제공한다. 파상풍 독소 단편, 보르다텔라 퍼투스시스(Bordatella pertussis) 퍼택틴(pertactin), 인간 혈청 알부민 및 라이소자임을 비롯한 다수의 단백질이 상기 시스템의 사용을 통해 제조되었다.
예를 들어, 푸사륨 옥시스포룸(Fusarium oxysporum)의 형질전환은 문헌(Malardier et al. (1989) Gene 78: 147-156)에 기재된 바와 같이 수행할 수 있다.
효모 사카로마이세스 세레비지애의 균주는 또 다른 바람직한 숙주이다. 한 실시양태에서, 당단백질의 아스파라긴-결합된 글리코실화에 필요한 유전자에 있어서 유전적 결함을 갖는 효모 세포, 보다 구체적으로 사카로마이세스 세레비지애가 사용된다. 이러한 결함을 갖는 사카로마이세스 세레비지애 숙주 세포는 많은 이용가능한 효모 균주가 글리코실화 또는 과다만노실화를 방지하거나 감소시키도록 변경되어 있다 하더라도 돌연변이유발 및 선별의 표준 기법의 이용을 통해 제조될 수 있다. 문헌(Ballou et al. J. Biol. Chem. 255: 5986-5991, 1980)에는 아스파라긴-결합된 글리코실화에 영향을 미치는 유전자에 있어서 결함을 갖는 만노단백질 생합성 변이체의 단리가 기재되어 있다. 문헌(Gentzsch and Tanner, Glycobiology 7: 481-486, 1997)에는 효모에서 단백질의 O-글리코실화의 제1 단계를 담당하는 효소를 코딩하는 적어도 6가지 유전자(PMT1-6)로 구성된 패밀리가 기재되어 있다. 이 유전자들 중 하나 이상에서 결함을 갖는 변이체는 감소된 O-결합된 글리코실화 및/또는 O-글리코실화의 변경된 특이성을 보인다.
이종 단백질의 제조를 최적화하기 위해, 숙주 균주가 단백질분해 활성을 감소시키는 돌연변이, 예컨대, 사카로마이세스 세레비지애 pep4 돌연변이(Jones, Genetics 85: 23-33, 1977)를 보유하는 것이 바람직할 수 있다. 다른 단백질분해효소 코딩 영역에 돌연변이를 보유하는 숙주 균주는 본 발명의 Tf 융합 단백질을 대량으로 제조하는 데 특히 유용하다.
본 발명의 DNA 구축물을 함유하는 숙주 세포는 적절한 생장 배지에서 생장한다. 본원에서 사용된 바와 같이, 용어 "적절한 생장 배지"는 세포의 생장에 필요한 영양분을 함유하는 배지를 의미한다. 세포 생장에 필요한 영양분은 탄소원, 질소원, 필수 아미노산, 비타민, 미네랄 및 성장 인자를 포함할 수 있다. 생장 배지는 일반적으로 DNA 구축물 상의 선별 마커에 의해 보충되거나 DNA 구축물과 함께 형질감염되는, 예컨대, 약물 선별 또는 필수 영영분의 결핍에 의해 DNA 구축물을 함유하는 세포가 선별될 수 있게 할 것이다. 예를 들어, 효모 세포는 바람직하게는 탄소원, 예를 들어, 슈크로스, 비-아미노산 질소원, 무기 염, 비타민 및 필수 아미노산 보충물을 포함하는 화학적으로 정의된 배지 중에서 생장된다. 배지의 pH는 바람직하게는 2 초과 내지 8 미만, 바람직하게는 5.5 내지 6.5로 유지된다. 안정한 pH를 유지하는 방법은 바람직하게는 수산화나트륨의 첨가를 통한 완충 및 일정한 pH 조절을 포함한다. 바람직한 완충제는 석신산 및 Bis-Tris(시그마 케미칼 캄파니(Sigma Chemical Co.); 미국 미조리주 세인트 루이스 소재)를 포함한다. 아스파라긴-결합된 글리코실화에 필요한 유전자에 결함을 갖는 효모 세포는 바람직하게는 삼투압 안정화제를 함유하는 배지 중에서 생장된다. 이러한 삼투압 안정화제 중 하나는 0.1 내지 1.5 M, 바람직하게는 0.5 또는 1.0 M의 농도로 배지 내로 보충되는 소르비톨이다.
배양된 포유동물 세포는 일반적으로 시판되는 혈청-함유 또는 혈청-무함유 배지 중에서 생장된다. 구체적으로 사용된 세포주에 적합한 배지의 선택은 당업계의 통상의 기술 수준 내에 있다. 형질감염된 포유동물 세포는 일정 기간, 전형적으로 1 내지 2일 동안 생장하여 원하는 DNA 서열을 발현하기 시작한다. 그 후, 약물 선별을 적용하여 안정한 방식으로 선별 마커를 발현하는 세포의 생장을 선별한다. 증폭가능한 선별 마커로 형질감염된 세포의 경우, 약물 농도는 증가된 카피 수의 클로닝된 서열을 선별하여 발현 수준을 증가시키도록 단계적 방식으로 증가될 수 있다.
바큘로바이러스/곤충 세포 발현 시스템도 본 발명의 변경된 Tf 융합 단백질의 제조에 사용될 수 있다. BacPAK™ 바큘로바이러스 발현 시스템(BD Biosciences (Clontech))은 곤충 숙주 세포에서 고수준으로 재조합 단백질을 발현한다. 표적 유전자는 선형화된 BacPAK6 바이러스 DNA와 함께 곤충 숙주 세포 내로 형질감염되는 전달 벡터 내로 삽입된다. BacPAK6 DNA는 바큘로바이러스 게놈의 필수적인 부분을 결여하고 있다. DNA가 벡터와 재조합될 때, 필수 구성요소가 회복되고 표적 유전자가 바큘로바이러스 게놈으로 전달된다. 재조합 후, 소수의 바이러스 플라크를 픽킹하여 정제하고, 재조합 표현형을 검증한다. 그 다음, 새로이 단리된 재조합 바이러스를 증폭하여 곤충 세포 배양물을 감염시키는 데 사용함으로써 대량의 원하는 단백질을 제조할 수 있다.
분비 신호 서열
용어 "분비 신호 서열", "신호 서열" 또는 "분비 리더 서열"은 상호교환가능하게 사용되고 예를 들어, 본원에 전체가 참고로 도입되는 미국 특허 제6,291,212호 및 미국 특허 제5,547,871호에 기재되어 있다. 분비 신호 서열, 신호 서열 또는 분비 리더 서열은 분비 펩티드를 코딩한다. 분비 펩티드는 성숙 폴리펩티드 또는 단백질이 세포로부터 분비되게 하는 아미노산 서열이다. 분비 펩티드는 일반적으로 소수성 아미노산으로 구성된 코어를 특징으로 하고 전형적으로(그러나 전적으로는 아님) 새로이 합성된 단백질의 아미노 말단에서 발견된다. 분비 펩티드는 아주 종종 분비 과정 동안 성숙 단백질로부터 절단된다. 분비 펩티드는 성숙 단백질이 분비 경로를 통과할 때 분비 펩티드가 성숙 단백질로부터 절단되게 하는 가공 부위를 포함할 수 있다. 가공 부위는 신호 펩티드 내에 코딩되어 있을 수 있거나 예를 들어, 시험관내 돌연변이유발에 의해 신호 펩티드에 부가될 수 있다.
분비 펩티드는 본 발명의 변경된 Tf 융합 단백질의 분비를 지시하는 데 사용될 수 있다. 다른 분비 펩티드와 함께 사용될 수 있는 상기 분비 펩티드 중 하나는 효모 장벽(Barrier) 단백질의 제3 도메인이다. 분비 신호 서열, 신호 서열 또는 분비 리더 서열은 단백질을 분비시키는 일련의 복잡한 번역 후 가공 단계에 필요하다. 온전한 신호 서열이 존재하는 경우, 발현된 단백질은 조질 소포체의 루멘(lumen)으로 들어간 후 골기체를 통해 분비 비지클로 수송되고 최종적으로 세포 외부로 수송된다. 일반적으로, 신호 서열 직후에 개시 코돈이 존재하고 신호 서열은 분비될 단백질의 아미노 말단에서 신호 펩티드를 코딩한다. 대부분의 경우, 신호 서열은 신호 펩티데이즈로 지칭되는 특정한 단백질분해효소에 의해 절단된다. 바람직한 신호 서열은 바이러스, 포유동물 또는 효모 발현 벡터를 사용한 재조합 단백질 발현의 가공 및 배출 효율을 개선시킨다. 일부 경우, 천연 Tf 신호 서열은 본 발명의 융합 단백질을 발현시키고 분비하는 데 사용될 수 있다.
링커
본 발명의 변경된 Tf 융합 단백질의 Tf 부분과 리간드는 직접적으로 융합될 수 있거나 보다 우수한 물리적 분리를 제공하여 융합된 단백질들 사이의 보다 높은 공간적 이동을 허용함으로써 예를 들어, 동족 수용체에의 결합을 위한 항체 가변 영역의 접근가능성을 최대화시키기 위한 다양한 길이의 링커 펩티드를 사용하여 융합시킬 수 있다. 링커 펩티드는 유연성 또는 강성이 더 높은 아미노산으로 구성될 수 있다. 한 실시양태에서, 본 발명은 실질적으로 비-나선형을 갖는 링커, 예컨대, (PEAPTD)n(서열번호 18)를 포함한다. 또 다른 실시양태에서, 본 발명의 융합 단백질은 폴리-글리신 스트레치를 갖는 링커를 포함한다. 상기 링커의 길이는 약 50, 40, 30, 20 또는 10개 미만의 아미노산 잔기일 수 있다. 상기 링커는 Tf 단백질 또는 이의 일부 및 항체 가변 영역에서 공유결합될 수 있거나 Tf 단백질 또는 이의 일부와 항체 가변 영역 사이에서 공유결합될 수 있다.
링커는 리간드 또는 리간드들 내에의 항체 가변 영역들을 연결하는 데 사용될 수도 있다. 항체 가변 영역들을 연결하기에 적합한 링커는 항체 가변 영역들이 전체 항체의 결합 특이성을 유지하는 3차원적 구조로 폴딩되게 하는 링커이다.
스크리닝 방법
본 발명의 융합 단백질 라이브러리를 스크리닝함으로써 확인할 수 있는 리간드에 대한 가능한 표적 분자의 수는 사실상 한정되지 않는다. 예를 들어, 표적 분자, 즉 수용체 또는 물질은 항체(또는 이의 결합 부분) 또는 항원일 수 있다. 항체가 결합하는 항원은 공지되어 있을 수 있고 심지어 본 발명이 항원의 에피토프를 맵핑하는 데 사용될 수 있는 경우에는 시퀀싱될 수 있다. 항원이 공지되어 있지 않은 경우, 예컨대, 일부 자가면역 질환의 경우, 예를 들어, 상기 질환을 앓는 환자로부터 얻은 혈청, 체액, 조직 또는 세포를 본 발명의 스크리닝 방법에서 사용하여 자가면역 반응을 불러일으키는 펩티드, 궁극적으로 항원을 확인할 수 있다. 펩티드가 확인되면, 상기 펩티드는 백신, 치료제, 진단제 등의 개발을 위한 기초로서 사용될 수 있거나 상기 기초를 제공할 수 있다. 리간드가 스크리닝될 수 있는 표적 분자의 목록에 대해서는 모든 목적을 위해 본원에 전체가 참고로 도입되는 국제특허출원 공개 제WO 01/46698호를 참조한다.
스크리닝은 당업자에게 잘 공지되어 있는 방법 중 하나, 예를 들어, 바이오패닝(biopanning), FACS 또는 MACS를 이용하여 수행할 수 있다. 본 발명의 한 실시양태에서, 스크리닝은 수용체 활성화를 위해 수행된다. 표적은 정제될 수 있거나, 용액 중에 존재할 수 있거나, 표면 또는 세포에 결합된 상태로 존재할 수 있다. 표적은 예를 들어, 바이오틴으로 표지될 수 있거나 당업계에 공지되어 있는 다른 방법에 의해 표지될 수 있다.
원하는 성질을 갖는 폴리펩티드 및 펩티드는 상응하는 핵산 서열의 시퀀싱, 아미노산 시퀀싱 또는 질량 분광법에 의해 단리되고 확인될 수 있다. 후속 최적화는 하위서열을 다양한 서열, 바람직하게는 무작위 서열로 치환시키는 단계를 반복하고 스크리닝 단계를 1회 이상 반복함으로써 수행할 수 있다.
펩티드 라이브러리가 구축되면, 숙주 세포를 라이브러리 벡터로 형질전환시킨다. 성공적인 형질전환체는 전형적으로 선별 배지 또는 선별 조건, 예를 들어, 적절한 생장 배지 또는 사용되는 벡터에 따라 다른 배지 중에서 생장시켜 선별한다. 이 선별은 고체 배지 상에서 수행될 수 있거나 액체 생장 배지 중에서 수행될 수 있다. 고체 배지 상에서 박테리아 세포를 생장시키는 경우, 세포를 예를 들어, 선별 항생제가 함유된 L-아가의 큰 표면 상에 고밀도(㎡ 당 약 108 내지 109개의 형질전환체)로 생장시켜 본질적으로 전면생장 잔디(confluent lawn)를 형성한다. 액체 배지 중에서 생장시키는 경우, 세포는 약 10회 이상의 더블링(doubling)을 통해 L-브로쓰(broth)(항생제 선별을 포함함) 중에서 생장시킬 수 있다. 액체 배지 중에서의 생장은 라이브러리의 크기 때문에 더 편리할 수 있지만, 고체 배지 상에서의 생장은 증폭 과정 동안 편향 기회를 덜 제공할 것이다.
Tf 융합 단백질 펩티드 라이브러리가 효모 세포 표면 디스플레이에 의해 스크리닝되는 경우, 효모 세포는 Tf 융합 단백질을 코딩하는 발현 벡터로 형질전환될 것이다. 모든 돌연변이유발 방법들이 오류 유발 PCR 및 DNA 셔플링과 같은 효모 표면 디스플레이 라이브러리 구축에 적합하다. 문헌(Boder et al. (2000) Methods of Enzymology 328: 430-444)을 참조한다. 별법으로, 발현된 융합 단백질의 Tf 부분은 무작위 펩티드 서열 또는 CDR에 대한 스카폴드로서 작용할 수 있다.
효모 세포 Tf 융합 단백질 펩티드 라이브러리가 구축되면 원하는 펩티드를 확인하기 위한 여러 방법들이 당업계에 공지되어 있다. 예를 들어, 펩티드는 꽤 낮은 친화성 농도(Kd> nM, 또는 라이브러리가 신규 결합 특이성을 단리하기 위해 스크리닝되는 경우 친화성 없음)의 경우 저농도의 형광 표지된 표적, 즉 수용체 또는 물질과의 평형화된 결합에 의해 구별될 수 있다. 강하게 결합하는 단백질을 이끌어내기 위한 경우, 샘플의 취급을 복잡하게 하는 몰 리간드 과량을 유지하는 데 있어서 과도하게 큰 부피의 묽은 표적 용액이 필요할 수 있다. 이러한 경우, 결합 친화성의 개선이 해리 속도에서의 변화에 의해 대략적으로 추정될 수 있다. 표적을 화학량론적으로 한정하기 위한 속도 경합도 집단 내에서 개선된 클론을 확인하는 데 이용될 수 있지만(Hawkins et al. (1992) J. Mol. Biol. 226: 889), 이 방법은 스크리닝 방법의 정량적 예측가능성이 없어지게 하므로 일반적으로 권장되지 않는다. 문헌(Boder et al. (2000) Methods of Enzymology 328: 430-444)을 참조한다.
표적은 바이오티닐화될 수 있거나 형광 표지될 수 있거나, 또는 원하는 리간드, 즉 Tf 상에 디스플레이된 펩티드가 표지될 수 있다. 바람직하게는, 표적은 표지된다. 표지된 표적, 예를 들어, 바이오티닐화된 표적은 Tf 융합 단백질 펩티드 라이브러리와 함께 항온처리될 수 있다. 라이브러리는 약 104개 이상의 구성원(즉, 디스플레이된 펩티드), 약 105개 이상의 구성원, 약 106개 이상의 구성원, 약 107개 이상의 구성원, 약 108개 이상의 구성원, 약 109개 이상의 구성원, 약 1010개 이상의 구성원, 약 1011개 이상의 구성원, 약 1012개 이상의 구성원, 약 1013개 이상의 구성원, 약 1014개 이상의 구성원, 약 1015개 이상의 구성원 또는 약 1016개 이상의 구성원을 가질 수 있다.
항온처리 후, 세포는 제2 표지, 예컨대, 2차 항체 또는 스트렙타비딘으로 표지된 분자로 표지될 수 있거나 당업계에 공지되어 있는 다른 방법으로 표지될 수 있다. 2차 항체는 항-바이오틴 항체일 수 있다. 스트렙타비딘으로 표지된 분자는 스트렙타비딘-파이코에리쓰린 또는 스트렙타비딘 마이크로비드를 포함하나 이들로 한정되지 않는다.
유세포분류(flow cytometry)는 당업계에 공지되어 있는 바와 같이 세포 집단을 분석하는 데 이용될 수 있다. 이것을 수행하는 경우, 집단의 디스플레이 분획만이 분석된다. 본원에 전체가 참고로 도입되는 문헌(Boder et al. (2000) Methods of Enzymology 328: 430-444 and Kondo et al. (2004) Appl. Microbiol. Biotechnol. 64: 28-40)을 참조한다.
별법으로, 표지된 비드로 구성된 제2 표지, 즉 항-바이오틴 또는 스트렙타비딘으로 표지된 비드가 사용되는 경우, 리간드와 표적 분자의 혼합물은 본원에 전체가 참고로 도입되는 문헌(Yeung et al. (2002) Biotechnol. Prog. 18: 212-220)에 기재된 바와 같이 자기 분류 프로토콜의 이용을 통해 분류될 수 있다. MACS® 마이크로비드 키트(밀테니이 바이오텍 게엠베하(Miltenyi Biotec GmbH))가 이 스크리닝 프로토콜에서 사용될 수 있다
본 발명의 한 실시양태에서, 효모 세포에서 발현된 원하는 단일 리간드의 특징을 규명하는 것이 바람직하다. 발현된 단백질은 다양한 방식으로 스크리닝될 수 있다. 단백질이 기능을 갖는 경우, 단백질은 직접 분석될 수 있다. 예를 들어, 효모 표면 상에 발현된 단일쇄 항체가 완전히 기능을 갖고 항원에의 결합을 기초로 하여 스크리닝될 수 있다. 단백질이 용이하게 분석될 수 있는 검출가능한 기능을 갖지 않는 경우, 리간드의 발현은 항체의 사용을 통해 모니터링될 수 있다. 효모 세포가 파지보다 훨씬 더 크기 때문에, 유세포분류를 이용하여 단일 효모 세포 상의 단백질의 표현형을 모니터링할 수 있다.
본 발명의 또 다른 실시양태에서, 리간드 부분과 수용체 또는 물질의 결합은 세포 표면 디스플레이 이외에 당업계에 공지되어 있는 수단, 예컨대, ELISA, 표적 천연 결합 파트너가 공지되어 있는 경우 경합 결합 분석, 샌드위치 분석, 펩티드 라이브러리에 의해 결합이 차단되는 방사성 리간드를 사용한 방사성수용체 분석 등에 의해 수행된다. 이 방법들에서, Tf 융합 단백질 펩티드 라이브러리로 형질전환된 숙주 세포가 용해된다. Tf 융합 단백질 펩티드는 적절한 고착자 부분, 예컨대, 항-MUC1 항체(이로 한정되지 않음)를 통해 분석 지지체에 고착된다. 스크리닝 과정은 Tf 펩티드 라이브러리를 원하는 표적과 반응시켜 기준 결합 수준을 확립하는 단계를 포함하는데, 상기 기준 결합 수준은 추후 펩티드 라이브러리의 결합 활성을 비교하는 데 있어서 기준이 된다. 분석이 표적에 결합하거나 표적에의 결합에 대해 경쟁하는 소량의 펩티드를 검출하기에 충분한 감수성을 나타내는 한, 분석의 성질은 중요하지 않다. 분석 조건은 다양한 원하는 결합 물질에 대한 최적 결합 조건 또는 다른 생물학적 활성을 고려하도록 변경될 수 있다. 따라서, 원하는 환경 조건과 유사한 조건 하에서 펩티드와 표적의 결합을 달성하기 위해 pH, 온도, 염 농도, 부피 및 결합 지속시간 등을 모두 변경할 수 있다.
Tf 펩티드 라이브러리가 원하는 표적에 결합하는 펩티드 또는 펩티드들을 보유함이 확인되면, 본 발명의 방법을 이용하여 혼합물 중의 펩티드의 서열을 확인할 수 있다. 표적에 결합하는 펩티드를 디스플레이하는 세포는 MACS 또는 FACS 스크리닝에 의해 일반적 라이브러리 집단으로부터 단리될 수 있다. 스크리닝 과정은 임의의 비-특이적 결합 물질을 제거하기 위해 초기 단리물에 대해 2 내지 3회 반복수행한다. 이어서, 결합 친화성을 기초로 하여 단리하기 위해 FACS 분류에 의한 최종회의 스크리닝을 수행한다. 단리된 세포로부터 플라스미드 DNA를 회수하고, 삽입물의 영역에 대한 DNA를 시퀀싱하여 단백질 서열을 확인한다. 그 후, 단리물들 사이의 공통된 모티프를 확인할 수 있다.
치료 리간드 분자
본 발명의 리간드는 잠정적인 또는 공지된 치료 분자일 수 있다. 본원에서 사용되는 바와 같이, 치료 분자는 전형적으로 시험관내 또는 생체내에서 유리한 생물학적 효과를 발휘할 수 있는 단백질 또는 펩티드이고 정상적인 항상성, 생리학적 상태 또는 질환 상태와 관련하여 유리한 효과를 발휘하는 단백질 또는 펩티드를 포함한다. 치료 분자는 마커 또는 단백질 정제 보조제로서 통상적으로 사용되는 융합 파트너, 예컨대, 갈락토시데이즈(예를 들어, 미국 특허 제5,986,067호 및 문헌(Aldred et al., (1984) Biochem. Biophys. Res. Commun. 122: 960-965) 참조)를 포함하지 않는다. 예를 들어, 질환 상태와 관련된 유리한 효과는 질환 예방, 질환 안정화, 질환 증상의 경감 또는 완화, 및 치료받는 개체에게 유리한 효과를 나타내기 위한 병인적 결함의 조절, 경감 또는 치유를 포함하는, 치료받는 개체에게 이로운 임의의 효과를 포함한다.
치료 리간드는 전술한 바와 같이 Tf 부분에 직접적으로 융합될 수 있거나 링커 부분을 통해 간접적으로 Tf 부분에 융합될 수 있다. 한 실시양태에서, 융합 단백질의 Tf 부분 및 리간드 부분을 융합 단백질의 나머지 부분으로부터 분리하기 위해 융합 단백질을 절단하는 것이 바람직할 수 있다. 또 다른 실시양태에서, 리간드를 융합 단백질의 나머지 부분으로부터 절단하는 것이 바람직할 수 있다.
본 발명의 융합 단백질의 리간드 부분은 적어도 치료 단백질의 단편 또는 변이체, 및/또는 적어도 항체의 단편 또는 변이체를 포함할 수 있다. 추가 실시양태에서, 융합 단백질은 1가지 이상의 생물학적 활성 또는 치료 활성을 보유하는 단백질 또는 항체의 펩티드 단편 또는 펩티드 변이체를 포함할 수 있다. 융합 단백질은 변경된 Tf의 N-말단 또는 C-말단에 융합되거나 변경된 Tf의 루프 내로 삽입된, 약 3개 이상의 아미노산, 약 4개 이상의 아미노산, 약 5개 이상의 아미노산, 약 6개 이상의 아미노산, 약 7개 이상의 아미노산, 약 8개 이상의 아미노산, 약 9개 이상의 아미노산, 약 10개 이상의 아미노산, 약 11개 이상의 아미노산, 약 12개 이상의 아미노산, 약 13개 이상의 아미노산, 약 14개 이상의 아미노산, 약 15개 이상의 아미노산, 약 20개 이상의 아미노산, 약 25개 이상의 아미노산, 약 30개 이상의 아미노산, 약 35개 이상의 아미노산, 약 40개 이상의 아미노산, 약 50개 이상의 아미노산, 약 55개 이상의 아미노산, 약 60개 이상의 아미노산 또는 약 70개 이상의 아미노산 길이를 갖는 펩티드 단편 또는 펩티드 변이체일 수 있는 치료 단백질을 포함할 수 있다.
또 다른 실시양태에서, 본 발명의 융합 단백질의 리간드 부분은 전장 단백질뿐만 아니라 아미노산 서열의 아미노 말단에서 1개 이상의 잔기가 결실되어 있는 폴리펩티드를 포함하는 치료 단백질의 단편일 수 있는 치료 단백질 부분을 포함한다.
또 다른 실시양태에서, 본 발명의 융합 단백질의 리간드 부분은 전장 단백질뿐만 아니라 아미노산 서열의 카복시 말단에서 1개 이상의 잔기가 결실되어 있는 폴리펩티드를 포함하는 치료 단백질의 단편일 수 있는 치료 단백질 부분을 포함한다.
또 다른 실시양태에서, 본 발명의 융합 단백질의 리간드 부분은 아미노 말단 및 카복시 말단 둘다에서 1개 이상의 아미노산이 결실되어 있을 수 있는 치료 단백질 부분을 포함한다.
또 다른 실시양태에서, 융합 단백질은 본원에 기재된 기준 치료 단백질 세트 또는 이의 단편과 약 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상 동일한 치료 단백질 부분, 즉 리간드 부분을 포함한다. 추가 실시양태에서, Tf 융합 분자는 전술한 바와 같이 N-말단 및 C-말단 결실을 갖는 아미노산 서열을 갖는 기준 폴리펩티드와 약 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상 동일한 치료 단백질 부분을 포함한다.
또 다른 실시양태에서, 융합 단백질은 예를 들어, 치료 단백질의 천연 또는 야생형 아미노산 서열과 약 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상 또는 100% 동일한 치료 단백질 부분을 포함한다. 이 폴리펩티드들의 단편들도 제공된다.
본 발명의 변경된 Tf 융합 단백질의 치료 단백질 부분에 상응하는 치료 단백질, 예컨대, 세포 표면 및 분비 단백질은 1개 이상의 올리고사카라이드 기의 부착에 의해 변경될 수 있다. 글리코실화로 지칭되는 이 변경은 단백질의 물성에 유의한 영향을 미칠 수 있고 단백질 안정성, 분비 및 위치화에 있어서 중요할 수 있다. 글리코실화는 폴리펩티드 골격을 따라 특정 위치에서 일어난다. 통상적으로 2가지 주요 유형의 글리코실화, 즉 세린 또는 쓰레오닌 잔기에 부착된 O-결합된 올리고사카라이드를 특징으로 하는 글리코실화, 및 Asn-X-Ser/Thr 서열(여기서, X는 프롤린을 제외한 아미노산임)에서 아스파라긴 잔기에 부착된 N-결합된 올리고사카라이드를 특징으로 하는 글리코실화가 존재한다. 단백질 구조 및 세포 종류와 같은 변수는 다양한 글리코실화 부위에서 쇄 내의 탄수화물 유니트의 수 및 성질에 영향을 미친다. 또한, 글리코실화 이성질체는 소정의 세포 유형 내에서 동일한 부위에서 공통적으로 존재한다. 예를 들어, 여러 종류의 인간 인터페론이 글리코실화되어 있다.
본 발명의 융합 단백질의 치료 단백질 부분에 상응하는 치료 단백질, 및 이의 유사체 및 변이체는 이들이 발현되는 숙주 세포에 의한 이들의 핵산 서열의 개조로 인해 또는 이들의 다른 발현 조건으로 인해 1개 이상의 부위에서 글리코실화가 변경되도록 변화될 수 있다. 예를 들어, 글리코실화 이성질체는 글리코실화 부위의 제거 또는 도입, 예를 들어, 아미노산 잔기의 치환 또는 결실을 통해, 예컨대, 아스파라긴을 글루타민으로 치환시켜 제조할 수 있거나, 비-글리코실화된 재조합 단백질을 글리코실화시키지 않을 숙주 세포, 예를 들어, 글리코실화 능력-결여 효모에서 상기 비-글리코실화된 재조합 단백질을 발현시켜 제조할 수 있다. 이 방법들은 당업계에 공지되어 있다.
치료 단백질 및 이의 핵산 서열은 당업계에 잘 공지되어 있고 공개 데이터베이스, 예컨대, 화학 초록 서비스 데이터베이스(Chemical Abstracts Services Databases)(예컨대, CAS 등록), 진뱅크 및 GenSeq에서 입수가능하다. 하기에 언급된 검색 번호 및 서열은 본원에 전체가 참고로 도입된다.
추가로, 본 발명은 본원에 기재된 치료 단백질의 단편을 포함하는 융합 단백질에 관한 것이다. 단백질의 N-말단으로부터의 1개 이상의 아미노산의 결실이 치료 단백질의 1가지 이상의 생물학적 기능을 변경시키거나 상실시킬지라도, 다른 치료 활성 및/또는 기능적 활성(예컨대, 생물학적 활성, 다량체화 능력, 리간드에의 결합 능력)은 여전히 보유될 수 있다. 예를 들어, 완전한 형태 또는 성숙 형태의 폴리펩티드를 인식하는 항체를 유도하고/하거나 상기 항체에 결합하는, N-말단 결실이 있는 폴리펩티드의 능력은 일반적으로 완전한 폴리펩티드의 잔기들의 대다수 미만의 잔기들이 N-말단으로부터 제거된 경우 보유될 것이다. 완전한 폴리펩티드의 N-말단 잔기를 결여하고 있는 특정 폴리펩티드가 이러한 면역학적 활성을 보유하는 지는 본원에 기재되어 있거나 당업계에 공지되어 있는 관용적인 방법에 의해 분석될 수 있다. 많은 수의 N-말단 아미노산 잔기가 결실되어 있는 변이체가 일부 생물학적 활성 또는 면역원적 활성을 보유할 수 있을 가능성이 있다. 사실상, 6개만큼 적은 수의 아미노산 잔기로 구성된 펩티드는 종종 면역 반응을 일으킬 수 있다.
또한, 전술한 바와 같이, 치료 단백질의 N-말단 또는 C-말단으로부터의 1개 이상의 아미노산의 결실이 상기 치료 단백질의 1가지 이상의 생물학적 기능을 변경시키거나 상실시킬지라도, 다른 기능적 활성, 예컨대, 생물학적 활성, 다량체화 능력, 리간드에의 결합 능력 및/또는 치료 활성은 여전히 유지될 수 있다. 예를 들어, 완전한 형태 또는 성숙 형태의 폴리펩티드를 인식하는 항체를 유도하고/하거나 상기 항체에 결합하는, C-말단 결실이 있는 폴리펩티드의 능력은 일반적으로 완전한 형태 또는 성숙 형태의 폴리펩티드의 잔기의 대다수 미만의 잔기가 C-말단으로부터 제거된 경우 보유될 것이다. 기준 폴리펩티드의 N-말단 및/또는 C-말단 잔기를 결여하고 있는 특정 폴리펩티드가 치료 활성을 보유하는 지는 본원에 기재되고/되거나 당업계에 공지되어 있는 관용적인 방법에 의해 용이하게 확인될 수 있다.
치료 단백질의 펩티드 단편은 치료 단백질(이의 아미노산 서열은 단편임)의 폴리펩티드 서열의 치료 활성 및/또는 기능적 활성, 예컨대, 생물학적 활성을 나타내는 아미노산 서열을 포함하거나 상기 아미노산 서열로 구성된 단편일 수 있다.
다른 폴리펩티드 단편은 생물학적 활성 단편이다. 생물학적 활성 단편은 본 발명에서 사용된 치료 단백질의 활성과 유사하나 반드시 동일하지 않은 활성을 나타내는 단편이다. 단편의 생물학적 활성은 개선된 원하는 활성 또는 감소된 바람직하지 않은 활성을 포함할 수 있다.
일반적으로, 단백질의 변이체는 전체적으로 매우 유사하고, 많은 영역에서 본 발명의 Tf 융합 단백질의 치료 단백질 부분에 상응하는 치료 단백질의 아미노산 서열과 동일하다. 이 변이체를 코딩하는 핵산도 본 발명에 포함된다.
본 발명에서 사용될 수 있는 추가 치료 폴리펩티드는 당업자에게 공지되어 있는 엄격한 혼성화 조건 하에서 치료 단백질의 아미노산 서열을 코딩하는 핵산 분자의 보체에 혼성화하는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드이다. 예를 들어, 문헌(Ausubel, F.M. et al., eds., 1989 Current protocol in Molecular Biology, Green Publishing Associates, Inc., and John Wiley & Sons Inc., New. York)을 참조한다. 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드도 본 발명에 포함된다.
본 발명의 질의(query) 아미노산 서열과 예를 들어, 95% 이상 "동일한" 아미노산 서열을 갖는 폴리펩티드라 함은 대상 폴리펩티드의 아미노산 서열이 상기 질의 아미노산 서열의 100개 아미노산 당 5개 이하의 아미노산 변경을 포함할 수 있다는 점을 제외하고 상기 질의 아미노산 서열과 동일함을 의미한다. 다시 말해, 질의 아미노산 서열과 95% 이상 동일한 아미노산 서열을 갖는 폴리펩티드를 수득하기 위해서는, 대상 서열 내의 아미노산 잔기의 5% 이하를 삽입시킬 수 있거나, 결실시킬 수 있거나, 또 다른 아미노산 잔기로 치환시킬 수 있다. 기준 서열의 이러한 변경은 기준 아미노산 서열의 아미노 말단 또는 카복시 말단에서 일어날 수 있거나, 기준 서열 내의 잔기들 사이에서 개별적으로 또는 기준 서열 내의 1개 이상의 인접 군으로 산재되어 있는, 상기 두 말단 위치 사이의 임의의 위치에서 일어날 수 있다.
실질적인 문제로서, 임의의 특정 폴리펩티드가 예를 들어, 본 발명의 융합 단백질 또는 이의 단편(예컨대, 상기 융합 단백질의 치료 단백질 부분 또는 이의 일부)의 아미노산 서열과 약 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상 동일한 지는 공지된 컴퓨터 프로그램을 이용하여 통상적으로 확인할 수 있다. 질의 서열(본 발명의 서열)과 대상 서열 사이의 전체적인 최적 매치(전반적 서열 정렬로도 지칭됨)를 확인하는 방법은 문헌(Brufiag et al., Comp. App. Biosci 245- (1990))의 알고리즘을 기초로 한 FASTDB 컴퓨터 프로그램을 이용하여 확인할 수 있다.
본 발명의 폴리뉴클레오티드 변이체는 코딩 영역, 비-코딩 영역 또는 이 영역들 둘다에서 변경을 포함할 수 있다. 침묵 치환, 부가 또는 결실을 발생시키지만 코딩된 폴리펩티드의 성질 또는 활성을 변경시키지 않는 변경을 포함하는 폴리뉴클레오티드 변이체를 사용하여 변경된 리간드 부분을 제조할 수 있다. 유전 코드의 축퇴성으로 인해 침묵 치환에 의해 생성된 뉴클레오티드 변이체가 활용될 수 있다. 더욱이, 약 50개 미만, 40개 미만, 30개 미만, 20개 미만, 10개 미만, 5 내지 50개, 5 내지 25개, 5 내지 10개, 1 내지 5개 또는 1 또는 2개의 아미노산이 임의의 조합으로 치환되어 있거나, 결실되어 있거나 부가되어 있는 폴리펩티드 변이체도 사용될 수 있다. 폴리뉴클레오티드 변이체는 다양한 이유로, 예를 들어, 특정 숙주를 위한 코돈 발현을 최적화하기 위해(전술한 바와 같이, 인간 mRNA의 코돈을 숙주, 예컨대, 효모 또는 이. 콜라이에 의해 선호되는 코돈으로 변경하기 위해) 제조될 수 있다.
다른 실시양태에서, 치료 단백질 부분, 즉 리간드 부분은 야생형 서열에 비해 보존적 치환을 갖는다. "보존적 치환"이라 함은 군 내에서의 치환, 예컨대, 지방족 또는 소수성 아미노산인 Ala, Val, Leu 및 Ile의 치환; 하이드록실 잔기인 Ser 및 Thr의 치환; 산성 잔기인 Asp 및 Glu의 치환; 아마이드 잔기인 Asn 및 Gln의 치환; 염기성 잔기인 Lys, Arg 및 His의 치환; 방향족 잔기인 Phe, Tyr 및 Trp의 치환; 및 작은 크기의 아미노산인 Ala, Ser, Thr, Met 및 Gly의 치환을 의미한다. 표현형적 침묵 아미노산 치환을 만드는 방법에 관한 지침은 예를 들어, 문헌(Bowie et al., "Deciphering the Message in Protein Sequences: Tolerance to Amino Acid Substitutions," Science 247: 1306-1310 (1990))에 기재되어 있다. 특정 실시양태에서, 본 발명의 폴리펩티드는 본원에 기재된 치료 단백질 및/또는 혈청 Tf, 및/또는 본 발명의 변경된 Tf 단백질의 아미노산 서열의 단편 또는 변이체를 포함하거나 상기 변이체로 구성되고, 이때 상기 단편 또는 변이체는 기준 아미노산 서열과 비교할 때 1 내지 5개, 5 내지 10개, 5 내지 25개, 5 내지 50개, 10 내지 50개 또는 50 내지 150개의 아미노산 부가, 치환 및/또는 결실을 갖는다. 추가 실시양태에서, 아미노산 치환은 보존적 아미노산 치환이다. 이 폴리펩티드들을 코딩하는 핵산들도 본 발명에 포함된다.
본 발명의 변경된 융합 단백질은 펩티드 결합 또는 변경된 펩티드 결합에 의해 서로 연결되어 있는 아미노산들로 구성될 수 있고 20가지 유전자에 의해 코딩된 아미노산 이외의 아미노산을 포함할 수 있다. 폴리펩티드는 천연 공정, 예컨대, 번역 후 프로세싱, 또는 당업계에 잘 공지되어 있는 화학적 변경 기법에 의해 변경될 수 있다. 이러한 변경은 기본 교재 및 보다 상세한 논문뿐만 아니라 부피가 큰 연구 문헌에도 잘 기재되어 있다.
변경은 펩티드 골격, 아미노산 측쇄 및 아미노 또는 카복시 말단을 비롯한 폴리펩티드 내의 임의의 위치에서 일어날 수 있다. 동일한 유형의 변경이 소정의 폴리펩티드 내의 여러 부위에서 동일한 또는 다양한 정도로 존재할 수 있음을 인식할 것이다. 또한, 소정의 폴리펩티드는 많은 유형의 변경을 포함할 수 있다. 폴리펩티드는 예를 들어, 유비퀴틴화(ubiquitination)의 결과로서 분지될 수 있고 분지를 갖거나 갖지 않는 환형 폴리펩티드일 수 있다. 환형 폴리펩티드, 분지형 폴리펩티드 및 분지된 환형 폴리펩티드는 번역 후 천연 공정으로부터 비롯될 수 있거나 합성 방법에 의해 만들어질 수 있다. 변경은 아세틸화, 아실화, ADP-리보실화, 아마이드화, 플라빈의 공유결합, 헴(heme) 부분의 공유결합, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유결합, 지질 또는 지질 유도체의 공유결합, 포스포티딜이노시톨의 공유결합, 가교결합, 환형화, 이황화 결합 형성, 탈메틸화, 공유 가교결합의 형성, 시스테인의 형성, 글리코실화, GPI 고착자 형성, 하이드록실화, 요오드화, 메틸화, 미리스틸화, 산화, 페그화, 단백질분해성 프로세싱, 인산화. 프레닐화, 라세미체화, 황산화, 단백질로의 아미노산의 t-RNA 매개 부가, 예컨대, 아르기닐화, 및 유비퀴틴화를 포함한다. 예를 들어, 문헌(H. Freeman and Company, New York (1993); POST-TRANSLATIONAL COVALENT MODIFICATION OF PROTEINS, B. C. Johnson, Ed., Academic Press, New York, pgs. 1-12 (1983); Seifter et al. (1990) Meth. Enzymol. 182: 626-646; Rattan et al., Ann. N.Y. Acad. Sci 663: 48-62)을 참조한다.
리간드 부분으로서 사용될 수 있는 치료 단백질은 호르몬, 매트릭스 단백질, 면역억제제, 기관지확장제, 심혈관 약제, 효소, CNS 약제, 신경전달물질, 수용체 단백질 또는 펩티드, 성장 호르몬, 성장 인자, 항바이러스 펩티드, 융합(fusogenic) 억제제 펩티드, 사이토카인, 림포카인, 모노카인, 인터루킨, 콜로니 자극 인자, 분화 인자, 혈관신생 인자, 수용체 리간드, 암 관련 단백질, 항신생물성 약제, 바이러스 펩티드, 항생제 펩티드, 혈액 단백질, 길항제 단백질, 전사 인자, 항혈관신생 인자, 길항제 단백질 또는 펩티드, 수용체 길항제, 항체, 단일쇄 항체 및 세포 부착 분자를 포함하나 이들로 한정되지 않는다. 다양한 치료 분자들을 단일 융합 단백질로 조합하여 이작용성 또는 다작용성 치료 분자를 제조할 수 있다. 다양한 분자들을 함께 사용하여 치료 물질 및 표적 물질을 갖는 융합 단백질을 제조할 수도 있다. 치료 분자는 본 발명의 줄기 부분에 직접 융합될 수 있거나, 제시자(presenter) 부분, 예컨대, Tf 부분 또는 알부민 부분에 융합되거나 삽입될 수 있다.
사이토카인은 면역 반응을 조절하는 데 있어서 특정 수용체들을 통해 비-효소적으로 작용하는, 면역 시스템의 세포들에 의해 방출되는 가용성 단백질이다. 사이토카인은 높은 친화성으로 특정 수용체에 결합된 상태로 낮은 농도에서 작용한다는 점에서 호르몬과 유사하다. 용어 "사이토카인"은 사이토카인에 대한 수용체를 갖는 세포 내에서 특정 생물학적 반응을 일으키는 천연 발생 또는 재조합 단백질, 및 이의 유사체 및 단편을 지칭하기 위해 본원에서 사용된다. 사이토카인은 바람직하게는 인터루킨, 예컨대, 인터루킨-2(IL-2)(진뱅크 검색 번호 S77834), IL-3(진뱅크 검색 번호 M14743), IL-4(진뱅크 검색 번호 M23442), IL-5(진뱅크 검색 번호 J03478), IL-6(진뱅크 검색 번호 M14584), IL-7(진뱅크 검색 번호 NM_000880), IL-10(진뱅크 검색 번호 NM_000572), IL-12(진뱅크 검색 번호 AF180562 및 진뱅크 검색 번호 AF180563), IL-13(진뱅크 검색 번호 U10307), IL-14(진뱅크 검색 번호 XM_170924), IL-15(진뱅크 검색 번호 X91233), IL-16(진뱅크 검색 번호 NM_004513), IL-17(진뱅크 검색 번호 NM_002190) 및 IL-18(진뱅크 검색 번호 NM_001562), 조혈 인자, 예컨대, 과립구-대식세포 콜로니 자극 인자(GM-CSF)(진뱅크 검색 번호 X03021), 과립구 콜로니 자극 인자(G-CSF)(진뱅크 검색 번호 X03656), 혈소판 활성화 인자(진뱅크 검색 번호 NM_000437) 및 에리쓰로포이에틴(진뱅크 검색 번호 X02158), 종양 괴사 인자(TNF), 예컨대, TNFα(진뱅크 검색 번호 X02910), 림포카인, 예컨대, 림포톡신-α(진뱅크 검색 번호 X02911), 림프톡신-β(진뱅크 검색 번호 L11016), 루코레귤린(leukoregulin), 대식세포 이동 억제 인자(진뱅크 검색 번호 M25639) 및 뉴로루킨(neuroleukin)(진뱅크 검색 번호 K03515), 대사 과정의 조절자, 예컨대, 렙틴(leptin)(진뱅크 검색 번호 U43415), 인터페론, 예컨대, 인터페론 α(IFNα)(진뱅크 검색 번호 M54886), IFNβ(진뱅크 검색 번호 V00534), IFNγ(진뱅크 검색 번호 J00219), IFNo(진뱅크 검색 번호 NM_002177), 쓰롬보스폰딘 1(THBS1)(진뱅크 검색 번호 NM_003246), THBS2(진뱅크 검색 번호 L12350), THBS3(진뱅크 검색 번호 L38969), THBS4(진뱅크 검색 번호 NM_003248) 및 케모카인을 포함한다. 바람직하게는, 본 발명의 변경된 Tf-사이토카인 융합 단백질은 사이토카인의 생물학적 활성을 나타낸다.
용어 "호르몬"은 특정 세포 또는 조직에 의해 생성되고 특정 생물학적 변화 또는 활성이 체내의 임의의 위치에 존재하는 또 다른 세포 또는 조직에서 일어나게 하는 다수의 생물학적 활성 물질 중 어느 하나를 지칭하기 위해 본원에서 사용된다. 호르몬은 바람직하게는 프로인슐린(진뱅크 검색 번호 V00565), 인슐린(진뱅크 검색 번호 NM_000207), 성장 호르몬 1(진뱅크 검색 번호 V00520), 성장 호르몬 2(진뱅크 검색 번호 F006060), 성장 호르몬 방출 인자(진뱅크 검색 번호 NMJ321081), 인슐린-유사 성장 인자 I(진뱅크 검색 번호 M27544), 인슐린-유사 성장 인자 II(진뱅크 검색 번호 NM_000612), 인슐린-유사 성장 인자 결합 단백질 1(IGFBP-1)(진뱅크 검색 번호 M59316), IGFBP-2(진뱅크 검색 번호 X16302), IGFBP-3(진뱅크 검색 번호 NM_000598), IGFBP-4(진뱅크 검색 번호 Y12508), IGFBP-5(진뱅크 검색 번호 M65062), IGFBP-6(진뱅크 검색 번호 NM_002178), IGFBP-7(진뱅크 검색 번호 NM_001553), 융모성 성선자극호르몬 β 쇄(진뱅크 검색 번호 NM_033142), 융모성 성선자극호르몬 α 쇄(진뱅크 검색 번호 NM_000735), 황체형성 호르몬 β(진뱅크 검색 번호 X00264), 여포 자극 호르몬 β(진뱅크 검색 번호 NM_000510), 갑상선 자극 호르몬 β(진뱅크 검색 번호 NM_000549), 프로락틴(진뱅크 검색 번호 NM_000948), 프로오피오멜라노코틴(proopiomelanocortin)(진뱅크 검색 번호 V01510), 코티코트로핀(corticotropin)(ACTH), β-리포트로핀(lipotropin), α-멜라닌세포 자극 호르몬(α-MSH), γ-리포트로핀, β-MSH, β-엔도핀(endorphin), 및 코티코트로핀-유사 중간체 로브 펩티드(CLIP)를 포함한다.
용어 "호르몬"은 소위 장인슐린 축(enteroinsular axis)에 속하는 인슐린 분비를 조절하는 위장 호르몬인 글루카곤-유사 펩티드-1(GLP-1)뿐만 아니라 GLP-1 수용체 길항제인 엑센딘(enxendin)(예를 들어, 엑센딘-4 및 이의 변이체)도 포함한다.
용어 "성장 인자"는 수용체에 결합하여 세포 증식을 자극하는 임의의 단백질 또는 펩티드를 지칭하기 위해 본원에서 사용된다. 성장 인자는 바람직하게는 혈소판-유래의 성장 인자-α(PDGF-α)(진뱅크 검색 번호 X03795), PDGF-β(진뱅크 검색 번호 X02811), 스테로이드 호르몬, 상피 성장 인자(EGF)(진뱅크 검색 번호 NM_001963), 섬유모세포 성장 인자, 예컨대, 섬유모세포 성장 인자 1(FGF1)(진뱅크 검색 번호 NM_000800), FGF2(진뱅크 검색 번호 NM_002006), FGF3(진뱅크 검색 번호 NM_005247), FGF4(진뱅크 검색 번호 NM_002007), FGF5(진뱅크 검색 번호 M37825), FGF6(진뱅크 검색 번호 X57075), FGF7(진뱅크 검색 번호 NM_002009), FGF8(진뱅크 검색 번호 AH006649), FGF9(진뱅크 검색 번호 NM_002010), FGF10(진뱅크 검색 번호 AB002097), FGF11(진뱅크 검색 번호 NM_004112), FGF12(진뱅크 검색 번호 NM_021032), FGF13(진뱅크 검색 번호 NM_004114), FGF14(진뱅크 검색 번호 NM_004115), FGF16(진뱅크 검색 번호 AB009391), FGF17(진뱅크 검색 번호 NM_003867), FGF18(진뱅크 검색 번호 AF075292), FGF19(진뱅크 검색 번호 NM_005117), FGF20(진뱅크 검색 번호 NM_019851), FGF21(진뱅크 검색 번호 NM_019113), FGF22(진뱅크 검색 번호 NM_020637) 및 FGF23(진뱅크 검색 번호 NM_020638), 안지오게닌(angiogenin)(진뱅크 검색 번호 M11567), 뇌-유래의 향신경성 인자(진뱅크 검색 번호 M61176), 섬모 향신경성 성장 인자(진뱅크 검색 번호 X60542), 형질전이 성장 인자-α(TGF-α)(진뱅크 검색 번호 X70340), TGF-β(진뱅크 검색 번호 X02812), 신경 성장 인자-α(NGF-α)(진뱅크 검색 번호 NM_010915), NGF-β(진뱅크 검색 번호 X52599), 메탈로프로테이네이즈 1의 조직 억제자(TIMP1)(진뱅크 검색 번호 NM_003254), TIMP2(진뱅크 검색 번호 NM_003255), TIMP3(진뱅크 검색 번호 U02571), TIMP4(진뱅크 검색 번호 U76456) 및 대식세포 자극 인자 1(진뱅크 검색 번호 L11924)을 포함한다.
용어 "매트릭스 단백질"은 정상적으로 세포외 매트릭스에서 발견되는 단백질 또는 펩티드를 지칭하기 위해 본원에서 사용된다. 이 단백질은 강도, 여과 또는 부착에 있어서 기능적으로 중요할 수 있다. 매트릭스 단백질은 바람직하게는 콜라겐, 예컨대, 콜라겐 I(진뱅크 검색 번호 Z74615), 콜라겐 II(진뱅크 검색 번호 X16711), 콜라겐 III(진뱅크 검색 번호 X14420), 콜라겐 IV(진뱅크 검색 번호 NM_001845), 콜라겐 V(진뱅크 검색 번호 NM_000393), 콜라겐 VI(진뱅크 검색 번호 NM_058175), 콜라겐 VII(진뱅크 검색 번호 L02870), 콜라겐 VIII(진뱅크 검색 번호 NM_001850), 콜라겐 IX(진뱅크 검색 번호 X54412), 콜라겐 X(진뱅크 검색 번호 X60382), 콜라겐 XI(진뱅크 검색 번호 J04177), 및 콜라겐 XII(진뱅크 검색 번호 U73778), 라미닌 단백질, 예컨대, LAMA2(진뱅크 검색 번호 NM_000426), LAMA3(진뱅크 검색 번호 L34155), LAMA4(진뱅크 검색 번호 NM_002290), LAMB1(진뱅크 검색 번호 NM_002291), LAMB3(진뱅크 검색 번호 L25541), LAMC1(진뱅크 검색 번호 NM_002293), 니도겐(nidogen)(진뱅크 검색 번호 NM_002508), α-텍토린(tectorin)(진뱅크 검색 번호 NM_005422), β-텍토린(진뱅크 검색 번호 NM_058222), 및 피브로넥틴(진뱅크 검색 번호 X02761)을 포함한다.
용어 "혈액 단백질"은 전통적으로 혈장으로부터 유래된 것으로서 정의되었으나, 현재는 많은 혈액 단백질들이 재조합 수단에 의해 제조되고, 천연 혈청 단백질, 및 이의 유도체, 단편 및 변이체 또는 변경체, 혈액 응고 인자, 및 이의 유도체, 변이체, 변경체 및 단편(인자 VII, VIII, IX 및 X를 포함함), 단백질분해효소 억제제(항쓰롬빈 3, α-1 항트립신), 유로키네이즈-유형 플라스미노겐 활성화제, 면역글로불린, 본 빌레브란트 인자(von Willebrand factor) 및 본 빌레브란트 변이체, 피브로넥틴, 피브리노겐, 쓰롬빈 및 헤모글로빈을 포함하나 이들로 한정되지 않는다.
용어 "효소"는 그 자체가 영구적으로 변경되거나 파괴되지 않으면서 특정 반응의 촉매로서 작용하는 임의의 단백질 또는 단백질성 물질을 지칭하기 위해 본원에서 사용된다. 효소는 바람직하게는 응고 인자, 예컨대, F2(진뱅크 검색 번호 XM_170688), F7(진뱅크 검색 번호 XM_027508), F8(진뱅크 검색 번호 XM_013124), F9(진뱅크 검색 번호 NM_000133), F10(진뱅크 검색 번호 AF503510) 등, 매트릭스 메탈로프로테이네이즈, 예컨대, 매트릭스 메탈로프로테이네이즈 I(MMP1)(진뱅크 검색 번호 NM_002421), MMP2(진뱅크 검색 번호 NM_004530), MMP3(진뱅크 검색 번호 NM_002422), MMP7(진뱅크 검색 번호 NM_002423), MMP8(진뱅크 검색 번호 NM_002424), MMP9(진뱅크 검색 번호 NM_004994), MMP10(진뱅크 검색 번호 NM_002425), MMP12(진뱅크 검색 번호 NM_002426), MMP13(진뱅크 검색 번호 X75308), MMP20(진뱅크 검색 번호 NM_004771), 아데노신 데아미네이즈(adenosine deaminase)(진뱅크 검색 번호 NM_000022), 미토겐에 의해 활성화되는 단백질 카이네이즈, 예컨대, MAPK3(진뱅크 검색 번호 XM_055766), MAP2K2(진뱅크 검색 번호 NM_030662), MAP2K1(진뱅크 검색 번호 NM_002755), MAP2K4(진뱅크 검색 번호 NM_003010), MAP2K7(진뱅크 검색 번호 AF013588) 및 MAPK12(진뱅크 검색 번호 NM_002969), 카이네이즈, 예컨대, JNKK1(진뱅크 검색 번호 U17743), JNKK2(진뱅크 검색 번호 AF014401), JAK1(진뱅크 검색 번호 M64174), JAK2(진뱅크 검색 번호 NM_004972) 및 JAK3(진뱅크 검색 번호 NM_000215), 및 포스파테이즈, 예컨대, PPM1A(진뱅크 검색 번호 NMJ321003) 및 PPM1D(진뱅크 검색 번호 NM_003620)를 포함한다.
용어 "전사 인자"는 단백질 코딩 유전자의 전사에 관여하는 임의의 단백질 또는 펩티드를 지칭하기 위해 본원에서 사용된다. 전사 인자는 Sp1, Sp2(진뱅크 검색 번호 NM_003110), Sp3(진뱅크 검색 번호 AY070137), Sp4(진뱅크 검색 번호 NM_003112), NFYB(진뱅크 검색 번호 NM_006166), Hap2(진뱅크 검색 번호 M59079), GATA-1(진뱅크 검색 번호 NM_002049), GATA-2(진뱅크 검색 번호 NM_002050), GATA-3(진뱅크 검색 번호 X55122), GATA-4(진뱅크 검색 번호 L34357), GATA-5, GATA-6(진뱅크 검색 번호 NM_005257), FOG2(NM_012082), Eryf1(진뱅크 검색 번호 X17254), TRPS1(진뱅크 검색 번호 NM_014112), NF-E2(진뱅크 검색 번호 NM_006163), NF-E3, NF-E4, TFCP2(진뱅크 검색 번호 NM_005653), Oct-1(진뱅크 검색 번호 X13403), 호메오박스(homeobox) 단백질, 예컨대, HOXB2(진뱅크 검색 번호 NM_002145), HOX2H(진뱅크 검색 번호 X16665), 무모(hairless) 상동체(진뱅크 검색 번호 NM_005144), 데카펜타플레직(decapentaplegic) 단백질에 대한 마더스(mothers), 예컨대, MADH1(진뱅크 검색 번호 NM_005900), MADH2(진뱅크 검색 번호 NM_005901), MADH3(진뱅크 검색 번호 NM_005902), MADH4(진뱅크 검색 번호 NM_005359), MADH5(진뱅크 검색 번호 AF009678), MADH6(진뱅크 검색 번호 NM_005585), MADH7(진뱅크 검색 번호 NM_005904) 및 MADH9(진뱅크 검색 번호 NM_005905), 및 전사 단백질의 신호 전달자 및 활성화자, 예컨대, STAT1(진뱅크 검색 번호 XM_010893), STAT2(진뱅크 검색 번호 NM_ 005419), STAT3(진뱅크 검색 번호 AJ012463), STAT4(진뱅크 검색 번호 NM_003151), STAT5(진뱅크 검색 번호 L41142) 및 STAT6(진뱅크 검색 번호 NM_003153)을 포함할 수 있다.
본 발명의 또 다른 실시양태에서, 치료 분자는 비-인간 또는 비-포유동물 단백질이다. 예를 들어, HIV gp120, HIV Tat, 다른 바이러스, 예컨대, 간염 바이러스, 허피스 바이러스, 인플루엔자 바이러스, 아데노바이러스 및 RSV의 표면 단백질, 다른 HIV 성분들, 기생성 표면 단백질, 예컨대, 말라리아 항원, 및 박테리아 표면 단백질이 사용될 수 있다. 이러한 비-인간 단백질은 유용한 활성을 갖기 때문에 예를 들어, 항원으로서 사용될 수 있다. 예를 들어, 치료 분자는 스트렙토카이네이즈, 스타필로카이네이즈, 아스파라기네이즈, 유로키네이즈, 또는 유용한 효소 활성을 갖는 다른 단백질일 수 있다.
본 발명의 대안적 실시양태에서, 치료 분자는 생물학적 활성을 갖는 리간드 결합 단백질이다. 이러한 리간드 결합 단백질은 예를 들어, (1) 세포 표면에서 수용체-리간드 상호작용을 차단할 수 있거나, (2) 혈액의 유체 상(phase) 중의 분자의 생물학적 활성을 중화시켜 상기 분자가 그의 세포 표적에 도달하지 못하게 할 수 있다. 일부 실시양태에서, 변경된 Tf 융합 단백질은 저밀도 지단백질(LDL) 수용체, 아세틸화된 LDL 수용체, 종양 괴사 인자 α 수용체, 형질전이 성장 인자 β 수용체, 사이토카인 수용체, 면역글로불린 Fc 수용체, 호르몬 수용체, 글루코스 수용체, 당지질 수용체 및 글리코스아미노글리칸 수용체로 구성된 (그러나, 이들로 한정되지 않음) 군으로부터 선택된 수용체의 리간드-결합 도메인에 융합된 변경된 Tf 분자를 포함한다. 다른 실시양태에서, 리간드 결합 단백질은 CD2(진뱅크 검색 번호 M14362), CD3G(진뱅크 검색 번호 NM_000073), CD3D(진뱅크 검색 번호 NM_000732), CD3E(진뱅크 검색 번호 NM_000733), CD3Z(진뱅크 검색 번호 J04132), CD28(진뱅크 검색 번호 NM_006139), CD4(진뱅크 검색 번호 NM_000616), CD1A(진뱅크 검색 번호 M28825), CD1B(진뱅크 검색 번호 NM_001764), CD1C(진뱅크 검색 번호 NM_001765), CD1D(진뱅크 검색 번호 NM_001766), CD80(진뱅크 검색 번호 NM_005191), GNB3(진뱅크 검색 번호 AF501884), CTLA-4(진뱅크 검색 번호 NM_005214), 세포간 부착 분자, 예컨대, ICAM-1(진뱅크 검색 번호 NM_000201), ICAM-2(진뱅크 검색 번호 NM_000873) 및 ICAM-3(진뱅크 검색 번호 NM_002162), 종양 괴사 인자 수용체, 예컨대, TNFRSF1A(진뱅크 검색 번호 X55313), TNFR1SFB(진뱅크 검색 번호 NM_001066), TNFRSF9(진뱅크 검색 번호 NMJ)OI 561), TNFRSF10B(진뱅크 검색 번호 NM_003842), TNFRSF11B(진뱅크 검색 번호 NM_002546) 및 TNFRSF13B(진뱅크 검색 번호 NM_006573), 및 인터루킨 수용체, 예컨대, IL2RA(진뱅크 검색 번호 NM_000417), IL2RG(진뱅크 검색 번호 NM_000206), IL4R(진뱅크 검색 번호 AF421855), IL7R(진뱅크 검색 번호 NM_002185), IL9R(진뱅크 검색 번호 XM_015989) 및 IL13R(진뱅크 검색 번호 X95302)을 포함한다. 바람직하게는, 본 발명의 리간드 결합 단백질 융합체는 리간드 결합 단백질의 생물학적 활성을 나타낸다.
용어 "암 관련 단백질"은 그의 발현이 암 또는 조절된 세포 생장의 유지와 관련된 단백질 또는 폴리펩티드, 예컨대, 종양 억제자 유전자 또는 종양발생유전자(oncogene)에 의해 코딩된 단백질을 지칭하기 위해 본원에서 사용된다. 암 관련 단백질은 p16(진뱅크 검색 번호 AH005371), p53(진뱅크 검색 번호 NM_000546), p63(진뱅크 검색 번호 NM_003722), p73(진뱅크 검색 번호 NM_005427), BRCA1(진뱅크 검색 번호 U14680), BRCA2(진뱅크 검색 번호 NM_000059), CTBP 상호작용 단백질(진뱅크 검색 번호 U72066), DMBT1(진뱅크 검색 번호 NM_004406), HRAS(진뱅크 검색 번호 NM_005343), NCYM(진뱅크 검색 번호 NM_006316), FGR(진뱅크 검색 번호 NM_005248), myb(진뱅크 검색 번호 AF104863), raf1(진뱅크 검색 번호 NM_002880), erbB2(진뱅크 검색 번호 NM_004448), VAV(진뱅크 검색 번호 X16316), c-fos(V 진뱅크 검색 번호 01512), c-fes(진뱅크 검색 번호 X52192), c-jun(진뱅크 검색 번호 NM_002228), MAS1(진뱅크 검색 번호 M13150), pim-1(진뱅크 검색 번호 M16750), TIF1(진뱅크 검색 번호 NM_003852), c-fms(진뱅크 검색 번호 X03663), EGFR(진뱅크 검색 번호 NM_005228), erbA(진뱅크 검색 번호 X04707), c-src 티로신 카이네이즈(진뱅크 검색 번호 XM_044659), c-abl(진뱅크 검색 번호 M14752), N-ras(진뱅크 검색 번호 X02751), K-ras(진뱅크 검색 번호 M54968), jun-B(진뱅크 검색 번호 M29039), c-myc(진뱅크 검색 번호 AH001511), RB1(진뱅크 검색 번호 M28419), DCC(진뱅크 검색 번호 X76132), APC(진뱅크 검색 번호 NM_000038), NF1(진뱅크 검색 번호 M89914), NF2(진뱅크 검색 번호 Y18000), 및 bcl-2(진뱅크 검색 번호 M13994)를 포함할 수 있다.
"융합 억제자 펩티드"는 항-바이러스 활성, 항-막 융합능, 및/또는 세포내 과정, 예를 들어, 코일 형태로 감긴-코일 펩티드 구조를 수반하는 과정을 조절하는 능력을 보이는 펩티드를 지칭하기 위해 본원에서 사용된다. 항-바이러스 활성은 HIV-1, HIV-2, RSV, SIV, EBV, 홍역, 바이러스, 인플루엔자 바이러스, 또는 CMV가 비-감염된 세포로 전염되는 것을 억제하는 것을 포함하나 이로 한정되지 않는다. 또한, 펩티드의 항-융합능, 항-바이러스 활성 또는 세포내 조절 활성은 펩티드의 존재만을 필요로 하며 상기 펩티드에 대해 유도되는 숙주 면역 반응의 자극을 특별히 필요로 하지 않는다. 항-융합은 펩티드의 부재 하에서 2개 이상의 부분 사이에 일어나는 막 융합의 수준에 비해 상기 2개 이상의 부분 사이의 막 융합 사건의 수준을 억제하거나 감소시키는 상기 펩티드의 능력을 지칭한다. 상기 부분은 예를 들어, 세포막 또는 바이러스 구조체, 예컨대, 바이러스 외피 또는 털(pili)일 수 있다. 본원에서 사용된 바와 같이, 용어 "항-바이러스 펩티드"는 세포의 바이러스 감염을 억제하거나 예를 들어, 세포-세포 융합 또는 자유 바이러스 감염을 통한 생산적 바이러스 감염 및/또는 바이러스 발병기전에 필요한 바이러스 활성을 억제하는 펩티드의 능력을 지칭한다. 이러한 감염은 외피를 갖는 바이러스의 경우에서 일어나는 막 융합을 수반할 수 있거나, 바이러스 구조체 및 세포 구조체를 수반하는 일부 다른 융합 사건을 수반할 수 있다. 융합 억제자 펩티드 및 항-바이러스 펩티드는 종종 1가지보다 많은 바이러스 단백질로부터 유래된 아미노산 서열을 갖는다(예컨대, HIV-1, HIV-2, RSV 및 SIV-유래의 폴리펩티드).
융합 억제자 펩티드 및 항-바이러스 펩티드의 예는 본원에 참고로 도입되는 국제특허출원 공개 제WO 94/2820호, 국제특허출원 공개 제WO 96/19495호, 국제특허출원 공개 제WO 96/40191호, 국제특허출원 공개 제WO 01/64013호, 미국 특허 제6,333,395호, 미국 특허 제6,258,782호, 미국 특허 제6,228,983호, 미국 특허 제6,133,418호, 미국 특허 제6,093,794호, 미국 특허 제6,068,973호, 미국 특허 제6,060,065호, 미국 특허 제6,054,265호, 미국 특허 제6,020,459호, 미국 특허 제6,017,536호, 미국 특허 제6,013,263호, 미국 특허 제5,464,933호, 미국 특허 제5,346,989호, 미국 특허 제5,603,933호, 미국 특허 제5,656,480호, 미국 특허 제5,759,517호, 미국 특허 제6,245,737호, 미국 특허 제6,326,004호 및 미국 특허 제6,348,568호에서 찾을 수 있다.
다른 유형의 펩티드의 예로는 본원에 기재된 치료 단백질의 단편, 특히, 모 분자의 활성을 1가지 이상 보유하는 인간 단백질의 단편을 들 수 있다. 본 발명의 리간드 부분을 제조하는 데 사용될 수 있는 펩티드는 모사체(mimetic) 펩티드, 및 치료 단백질의 생물학적 활성을 나타내되 서열 또는 3차원적 구조에 있어서 전장 치료 단백질과는 상이한 펩티드도 포함한다. 펩티드는 비-제한적 예로서 문헌(Johnson et al. (2000) Nephrol. Dial. Transplant 15(9): 1274-7; Kuai et al. (2000) J. Pept. Res. 56(2): 59-62; Barbone et al. (1999) Nephrol. Dial. Transplant 14 Supp 2: 80-4; Middleton et al. (1999) J. Biol. Chem. 274(20): 14163-9; Johnson et al. (1998) Biochemistry 37(11): 3699-710; Johnson et al. (1997) Chem. Biol. 12: 939-50; Wrighton et al. (1997) Nat. Biotechnol. 15(12): 1261-5; Livnah et al. (1996) Science 273: 464-71; and Wrighton et al., (1996) Science 273: 458-64)에 개시된 에리쓰로포이에틴 모사체 펩티드를 포함한다.
치료 단백질은 알레르겐성 단백질 및 이의 절단된 단편도 포함한다. 상기 알레르겐성 단백질은 두드러기쑥, 호밀, 6월 목초, 과수원 목초, 달콤한 봄철 목초, 외겨이삭 목초, 티모씨 목초, 황색 덕(yellow dock), 밀, 옥수수, 산쑥, 청색 목초, 캘리포니아 일년생 목초, 명아주, 버뮤다(Bermuda) 목초, 러시아 엉겅퀴, 산악 히말라야삼목(mountain cedar), 활엽수, 박스 엘더(box elder), 무화과나무, 단풍나무, 느릅나무 등의 화분 알레르겐, 먼지 진드기, 벌 독액, 식품 알레르겐, 동물 비듬, 및 다른 곤충 독액도 포함한다.
다른 치료 분자는 바이러스, 박테리아 및 원형동물 백신뿐만 아니라 이들의 다양한 성분들, 예컨대, 표면 항원을 포함하는 미생물 백신을 포함한다. 상기 미생물 백신은 당단백질, 단백질, 또는 이 단백질들로부터 유래된 펩티드를 포함하는 백신을 포함한다. 이러한 백신은 스타필로코커스 아우레우스(Staphylococcus aureus), 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 뉴모니아(Streptococcus pneumoniae), 네이세리아 메닝기티디스(Neisseria meningitidis), 네이세리아 고노르호에애(Neisseria gonorrhoeae), 살모넬라 종(Salmonella spp .), 쉬겔라 종(Shigella spp .), 이. 콜라이, 크렙시엘라 종(Klebsiella spp .), 프로테우스 종(Proteus spp .), 비브리오 콜레라(Vibrio cholerae), 캄필로박터 파이로리(Campylobacter pylori), 슈도모나스 애루기노사(Pseudomonas aeruginosa), 해모필루스 인플루엔자, 보르데텔라 퍼투시스, 마이코박테리움 튜버큘로시스(Mycobacterium tuberculosis), 레기오넬라 뉴모필라(Legionella pneumophila), 트레포네마 팔리둠(Treponema pallidum), 클라미디아(chlamydia), 파상풍 독소, 디프테리아 독소, 인플루엔자 바이러스, 아데노바이러스, 파라믹소바이러스(볼거리, 홍역), 루벨라 바이러스, 폴리오 바이러스, 간염 바이러스, 허피스 바이러스, 공수병 바이러스, HIV-1, HIV-2, RSV 및 파필로마 바이러스로부터 제조된다.
바람직한 융합 분자는 항-HIV 바이러스 펩티드, 항-RSV 펩티드, 인간 성장 호르몬, α 및/또는 β 인터페론, 에리쓰로포이에틴(EPO), EPO-유사 펩티드, 과립구-콜로니 자극 인자(GCSF), 과립구-대식세포 콜로니-자극 인자(GMCSF), 인슐린, 인슐린-유사 성장 인자(IGF), 쓰롬보포이에틴, 항체의 CDR에 상응하는 펩티드, 소도 신생 관련 단백질(INGAP), 칼시토닌, 안지오스타틴, 엔도스타틴, IL-2, 성장 호르몬 방출 인자, 인간 부갑상선 호르몬, 항-종양 괴사 인자(TNF) 펩티드, IL-1 수용체 및/또는 단일쇄 항체를 포함할 수 있다.
본 발명의 융합 단백질은 새로운 또는 신규 기능을 갖는 분자를 스크리닝하기 위해 펩티드 라이브러리로부터 유래된 펩티드 또는 폴리펩티드를 포함하도록 제조될 수도 있다. 이러한 펩티드 라이브러리는 예를 들어, 어메리칸 펩티드 캄파니 인코포레이티드(American Peptide Co. Inc.), 셀 사이언스 인코포레이티드(Cell Sciences Inc.), 인비트로겐 코포레이션(Invitrogen Corporation), 포에닉스 파마슈티칼스 인코포레이티드(Phoenix Pharmaceuticals Inc.) 및 유나이티드 스테이트 바이오로지칼(nited States Biological)로부터 시판되거나 공개적으로 이용가능한 펩티드 라이브러리뿐만 아니라, 이용가능한 기술에 의해 제조된 펩티드 라이브러리, 예를 들어, 표준 방법을 이용하여 제조한 박테리오파지 및 박테리아 디스플레이 라이브러리를 포함할 수 있다.
본 발명의 다른 실시양태에서, 융합 단백질은 당업계에 공지되어 있고 식품의약청(www.fda.gov/cber/efoi/approve.htm)에 의해 현재 승인받은 펩티드 및 단백질뿐만 아니라 본원에 전체가 참고로 도입되는 국제특허출원 공개 제WO 01/79258호, 국제특허출원 공개 제WO 01/77137호, 국제특허출원 공개 제WO 01/79442호, 국제특허출원 공개 제WO 01/79443호, 국제특허출원 공개 제WO 01/79444호 및 국제특허출원 공개 제WO 01/79480호에 기재된 펩티드 및 단백질로 예시되는 치료 단백질 부분을 사용하여 제조할 수 있다.
본원에 참고로 도입되는 국제특허출원 공개 제WO 03/020746호에 기재된 표 1은 본 발명의 융합 단백질의 치료 단백질 부분, 즉 리간드 부분에 상응하는 치료 단백질의 비-제한적 목록을 제공한다. "치료 단백질 X" 단락은 치료 단백질 분자 또는 이의 단편 또는 변이체를 포함하거나 치료 단백질 또는 이의 단편 또는 변이체로 구성된 과학적 브렌드명이 가로 안에 병기되어 있는 치료 단백질 분자를 개시하고 있다. 본원에서 사용된 "치료 단백질 X"는 (CAS 및 진뱅크 검색 번호로부터 입수될 수 있는 아미노산 서열에 의해 정의된) 개개의 치료 단백질 분자를 지칭하거나, 이 단락에서 개시된 소정의 치료 단백질 분자와 관련된 치료 단백질들로 구성된 전체 군을 지칭할 수 있다. "예시적 식별기호(Identifier)" 컬럼은 단백질 분자의 아미노산 서열 또는 치료 단백질 분자의 단편 또는 변이체의 아미노산 서열을 포함하는 CAS 등록 또는 진뱅크 데이터베이스에서 엔트리(entry)에 상응하는 국립생명공학정보 센터(NCBI) 웹페이지(www.ncbi.nlm.nih.gov)를 통해 이용가능한 CAS 등록 번호(미국 화학 협회에 의해 공개됨) 및/또는 진뱅크 검색 번호(예를 들어, 로커스 ID, NP - XXXX(기준 서열 단백질) 및 XP-XXXXX(모델 단백질) 식별기호)를 제공한다. 뿐만 아니라, GenSeq 검색 번호 및/또는 논문 간행물 인용이 일부 폴리펩티드의 경우 예시적 아미노산 서열을 확인하기 위해 제시된다.
상기 CAS, 진뱅크 및 GenSeq 검색 번호 각각과 관련되어 있는 요약 페이지, 및 인용된 논문 간행물은 입수가능하고(예를 들어, PubMed ID 번호(PMID)) 전체가 참고로 본원에 도입되어 있다. PCT/특허 언급 단락은 치료 단백질 분자를 개시하는 특허 및/또는 공개된 특허출원에 상응하는 미국 특허 번호 또는 국제특허출원 공개 번호를 제공하고, 상기 특허 및 특허출원은 본원에 전체가 참고로 도입된다. 생물학적 활성 단락은 치료 단백질 분자와 관련된 생물학적 활성을 개시하고 있다. 예시적 활성 분석 단락은 치료 단백질 X, 또는 치료 단백질 X 부분을 포함하는 본 발명의 Tf 융합 단백질의 치료 활성 및/또는 생물학적 활성을 시험하는 데 사용될 수 있는 분석법을 개시하는 참고문헌을 제공한다. 이 참고문헌들도 본원에 전체가 참고로 도입된다. "바람직한 처방 Y" 단락은 치료 단백질 X, 또는 치료 단백질 X 부분을 포함하는 본 발명의 Tf 융합 단백질에 의해 치료되거나, 예방되거나, 진단되거나, 또는 완화될 수 있는 질환, 장애 및/또는 병태를 개시한다. 본 발명은 본원에 전체가 참고로 도입되는 국제특허출원 공개 제WO 03/020746호에 기재된 치료 단백질을 포함한다.
실시예 1: GPI 고착자, hMUC1 및 mTf 발현 카세트의 제조
mTf 발현 카세트(서열번호 16)를 포함하는 pREX0549 벡터를 SalI 및 HindIII로 절단하였다. 도 3은 pREX0549에 대한 벡터 맵을 제공한다. 프라이머 P0922 및 P0923(서열번호 7 및 8)을 서로 어닐링시키고 SalI/HindIII 절단 부위에서 pREX0549와 라이게이션시켰다. P0922 및 P0923에 의해 형성된 링커는 SpeI, HindIII 및 XbaI 제한 부위를 포함하였고 GPI 고착자 및 MUC1 줄기를 코딩하는 핵산 분자를 수용하도록 디자인되었다. 생성된 벡터 pREX0628은 P0922/P0923 링커를 갖는 mTf 발현 카세트를 포함하였다.
pREX0628을 HindIII 및 XbaI으로 절단하였다. 프라이머 P0924 및 P0925(서열번호 9 및 10)를 어닐링시켜 GPI 고착자 YIR019c를 형성하였다. YIR019c를 절단된 pREX0628과 라이게이션시켜 벡터 pREX0634를 생성하였다.
hMUC1 cDNA는 프라이머 P0958 및 P0959(서열번호 11 및 12)를 사용하여 인간 유방 종양 총 RNA 라이브러리(클론텍)로부터 RT-PCR로 증폭시켰다. 생성된 cDNA를 프라이머 P1019 및 P1020(서열번호 13 및 14)으로 증폭시켜 SpeI 및 HindIII 제한 부위를 생성하였다. SpeI 및 HindIII 부위를 갖는 생성된 hMUC1은 서열번호 6으로 표시된다.
pREX0634를 SpeI 및 HindIII로 절단하고, SpeI 및 HindIII 부위를 갖는 hMUC1을 상기 벡터와 라이게이션시켰다. 생성된 벡터 pREX0663을 디스플레이 발현 카세트(mTf-MUC1-GPI)로서 사용하였다.
pREX0663을 사용하여 높은 카피 수의 효모 발현 벡터 및 낮은 카피 수의 효모 발현 벡터를 생성하였다. 높은 카피 수의 효모 발현 벡터를 생성하기 위해, pREX0663을 NotI으로 절단하여 4.1 kb의 디스플레이 발현 카세트를, pREX0663으로부터 제거하였다. 이어서, 상기 발현 카세트를 NotI으로 절단되고 탈인산화된 벡터 pSAC35와 라이게이션시켜 벡터 pREX0667(효모 디스플레이 벡터 I)을 생성하였다.
낮은 카피 수의 효모 발현 벡터는 pREX0663을 NotI으로 절단하고 상기 발현 벡터를, NotI으로 절단되고 탈인산화된 벡터 pREX0699와 라이게이션시켜 pREX0721 효모 디스플레이(효모 디스플레이 벡터 II)를 생성하였다.
전술한 효모 발현 벡터들은 당업계에 공지되어 있는 바와 같이 효모 세포 및 박테리아 세포를 형질전환하는 데 사용될 수 있다. 상기 벡터는 당업계에 공지되어 있는 바와 같이 효모에서 발현될 수 있다. 또한, 리간드 부분, 예컨대, 무작위 펩티드 또는 CDR의 라이브러리를 디스플레이할 수 있는 발현된 Tf 융합 단백질들의 집합체를 생성하여 당업계에 공지된 바와 같이 결합제를 스크리닝하는 데 사용할 수 있다.
실시예 2: 15-머 무작위 라이브러리 구축
신규 결합 특성을 갖는 Tf 변이체의 선별을 위해, 당업계에 공지되어 있는 PCR 니팅(knitting) 기법을 통해 Tf의 289 또는 290 아미노산 위치에서 무작위 15-머 라이브러리를 구축하였다(문헌(Martin and Smith (2006) Biochem J. 396(2): 287-95) 참조). 통상적으로 약 7개의 아미노산만이 결합 에피토프를 형성하는 데 필요할지라도 15-머 라이브러리를 디자인하였고, 약 109 크기의 라이브러리만이 디자인된 라이브러리의 작은 분획(3.3 x 1019)을 커버한다. 그러나, 109 크기의 라이브러리에 있어서, 15-머 라이브러리는 동일한 크기의 7-머 라이브러리보다 7-머를 6.4배 더 많이 커버한다.
P1174/P1227을 사용하여 Tf의 BamHI/BspEI 서열을 포함하는 DNA 단편을 수득한 후, 2가지 PCR 반응(각각 단일 프라이머 P1172 및 P1173을 사용함)을 수행하여 단일 가닥 DNA를 수득하였다. ssDNA를 단리하고 어닐링하여 니팅 15-머 라이브러 리를 형성하였다. 이 작업은 라이브러리가 합성 올리고뉴클레오티드의 원래의 복잡성(original complexity)을 유지하게 하였다. 이중 가닥 니팅 15-머 라이브러리도 P1174/P1227을 사용하여 증폭시켜 충분한 양의 DNA를 수득하였다. PCR 생성물을 정제하고 BamHI/BspEI으로 절단하여 적절한 플라스미드 벡터, 예를 들어, pREX0995(도 4) 또는 pREX0667에 클로닝하였다.
P1172(서열번호 19): 전방향 단편을 위한 289-290 15-머 무작위 펩티드 라이브러리 삽입 니팅 전방향 프라이머
C CAA CTA TTC AGC TCT CCT 567 567 567 567 567 567 567 567 567 567 567 567 567 567 567 CAT GGG AAG GAC CTG CTG TTT AAG
DNA 서열의 각 위치에서 무작위성(randomness)을 도입하기 위해, 뉴클레오티드(A, G, T 및 C)의 혼합물을 문헌(LaBean and Kauffman (1993) Protein Sci. 2: 1249-54)에 따라 예정된 비로 상기 위치에 도입하였다. 하기 표시된 혼합물은 정지 코돈 빈도를 최소화하고 아미노산 조성을 천연 단백질에 일치시킨다:
5 13% T, 32% G, 20% C, 35% A
6 24% T, 24% G, 22% C, 30% A
7 37% T, 26% G, 37% C
P1173(서열번호 20): 전방향 단편을 위한 289-290 15-머 무작위 펩티드 라이브러리 니팅 후방향 프라이머
AGGAGAGCTGAATAGTTGG
P1174(서열번호 21): 전방향 단편을 위한 289-290 15-머 무작위 펩티드 라이브러리 니팅 전방향 프라이머
CTGGATGCAGGTTTGGTGTATG
P1227(서열번호 22): 후방향 단편을 위한 289-290 15-머 무작위 펩티드 라이브러리 니팅 후방향 프라이머
TCATGATCTTGGCGATGCAGTC
실시예 3: Flag를 디스플레이하는 효모 세포의 선별
줄기 영역, huMUCI 및 GPI 신호 서열에의 융합에 의해 Tf의 N 로브가 효모의 표면에 디스플레이되는 효모 디스플레이 시스템을 확립하였다. 결합제 선별에 있어서 상기 시스템의 유용성을 입증하기 위해, Flag-태그 서열인 DYKDDDDK(서열번호 23) 또는 무작위 15-머 펩티드 라이브러리를 Tf N 로브의 289 아미노산 위치에 삽입하였다. Flag 태그를 갖는 Tf N 로브, 즉 pREX1012(도 6)를 디스플레이하는 효모를 무작위 15-머 펩티드를 갖는 Tf N 로브를 디스플레이하는 효모 풀(pool)과 혼합하였다. 이 혼합된 집단으로부터 Flag-태그를 갖는 Tf N 로브를 디스플레이하는 효모만을 항-Flag 항체를 사용한 선별을 통해 회수하였다.
Flag-태그 서열을 Tf의 289 아미노산 위치 내로 삽입하기 위해, Flag-태그 서열을 도입하는 올리고머를 합성하여 벡터 pREX0667 내로 PCR 니팅함으로써 벡터 pREX0759를 생성하였다(도 7). 그 다음, Flag-태그 서열을 포함하는 pREX0759의 BamHI/BspEI 단편을 사용하여 pREX0995(도 4)의 동일한 제한 단편을 치환시켰다. 생성된 플라스미드 pREX1012는 Flag-태그를 갖는 Tf N 로브-MUC1-GPI 융합 단백질을 발현한다.
15-머 라이브러리 또한 pREX0995의 BamHI 부위와 BspEI 부위 사이에 클로닝하였다. 15-머 라이브러리의 제조는 하기에 기재되어 있다. 라이게이션 샘플을 이. 콜라이 DH5α 내로 형질전환시키고, 형질전환 혼합물을 2개의 LB/Amp(50 ㎍/㎖) 아가 플레이트 상에 모두 플레이팅하였다. 모든 콜로니를 모으고 수개의 미니프렙 컬럼을 사용하는 퀴아젠 플라스미드 프렙 프로토콜을 이용하여 플라스미드 DNA를 추출하였다.
pREX1012 및 15-머 라이브러리 둘다에 대한 플라스미드 DNA를 사카로마이세스 세레비지애 균주 DS1101 cir° 내로 형질전환시켰다. pREX1012의 단일 콜로니를 수크로스가 함유된 완충 최소 배지(BMM/S) 내로 접종하고 밤새 배양하였다. 15-머 라이브러리의 모든 콜로니를 모아 BMM/S를 접종시켰다. 2개의 밤샘 배양물의 세포수를 혈구계로 측정하고 하기 세포 혼합물을 제조하였다:
(A) 109개의 15-머 라이브러리 효모 세포와 혼합된 103개의 pREX1012 효모 세포(10:107)
(B) 108개의 15-머 라이브러리 효모 세포와 혼합된 103개의 pREX1012 효모 세포(100:107)
상기 세포 혼합물들을 얼음 상의 1 ㎖ 세포 차단액(1xPBS/0.05% Tween-20, 1% BSA) 중에서 30분 동안 항온처리하였다. 원심분리(13000 rpm에서 30초) 후, 세포 펠렛을 바이오티닐화된 항-Flag 항체(시그마 알드리치, 1:25 희석)가 함유된 1 ㎖ 세척액(1xPBS, 0.5% BSA, 2mM EDTA) 중에 현탁시키고 얼음 상에서 30분 동안 항온처리하였다. 세포를 1 ㎖ 세척액으로 2회 세척하고 800 ㎕의 차단액(세포 혼합물 (A)의 경우) 및 160 ㎕의 차단액(세포 혼합물 (B)의 경우) 중에 현탁시켰다. 세포 현탁액에, 스트렙타비딘 MACS 마이크로비드(밀테니이 바이오텍) 200 ㎕(세포 혼합물 (A)의 경우) 및 40 ㎕(포 혼합물 (B)의 경우)를 첨가하고 얼음 상에서 30분 동안 항온처리하였다. 제조자(밀테니이 바이오텍)의 지시에 따라 MS 컬럼을 사용하여 표지된 세포를 비-표지된 세포로부터 분리하였다. 표지된 세포를 모아 BMM/S 아가로스 플레이트 상에 플레이팅하고 작은 콜로니가 나타날 때까지 30℃에서 항온처리하였다.
각 플레이트로부터 모든 콜로니를 모아 5 ㎖ BMM/S 중에서 30℃에서 밤새 생장시켜 제2회 선별을 수행하였다. 이 배양물들로부터, 1.5의 OD600에 해당하는 세포에 대해 전술한 바와 같은 MACS 분리를 추가로 수행하였다. 이 제2회 스크리닝으로부터 얻은 세포를 5 ㎖ BMM/S 중에서 30℃에서 밤새 배양하였다. 각 선별 전 및 후, 아질런드 테크놀로지(Agilent Technology)로부터 구입한 바이오어날라이저(Bioanalyzer)에서 항-Flag 단일클론 항체(시그마 알드리치) 및 APC 표지된-염소 항-마우스 검출 항체를 사용한 FACS로 효모 세포 배양물을 분석하였다. FACS 분석은 제조자의 지시에 따라 수행하였다. Flag-태그를 갖는 효모의 존재는 2회의 MACS 분리 후에 분명해졌다(도 8).
실시예 4: Aga1 줄기 디스플레이
효모 유전자 AGA1의 코어 영역(성숙 단백질의 잔기 116 내지 658)에 대한 DNA 서열을 하기 프라이머를 사용한 S288c 효모 게놈 DNA의 PCR을 통해 수득하였다:
(a) CAGATCTAGAACAACCGCTATCAGCTCATTATCC(서열번호 24)
(b) CAGAAAGCTTAGTAGTGGAAACTTCTGTAGTG(서열번호 25)
Figure 112009042130014-PCT00001
Figure 112009042130014-PCT00002
Figure 112009042130014-PCT00003
약 1.5 kb의 PCR 생성물을 단리하고 XbaI/HindIII로 절단하였다. 단편을 SpeI/HindIII로 절단된 pREX0855(도 9)와 라이게이션시키고 이. 콜라이 DH5α 내로 형질전환시켰다. 모든 생성된 콜로니를 모으고, 플라스미드 DNA를 세포로부터 단 리하였다. NotI으로 절단하여 발현 카세트를 회수하고 pSAC35와 라이게이션시켜 효모 발현 벡터를 수득하였다.
상기 벡터를 효모 내로 형질전환시키고 전술한 바와 같이 항-Flag 항체를 사용한 FACS로 분석하였다. 효모 콜로니는 비교가능한 MUC1 줄기 기재 구축물보다 약 10배 더 높은 고수준의 N 로브 디스플레이를 보였다(데이타는 나타내지 않음).
단일 효모 콜로니를 단리하고 플라스미드 DNA를 이 효모 세포로부터 추출하였다. 추출된 플라스미드 DNA를 NotI으로 절단한 후 NotI 발현 카세트를 회수하여 NotI으로 절단된 pREX0855와 라이게이션시켜, Flag-N 로브-Aga1-GPI 발현 카세트를 포함하는 pUC-기재 벡터인 플라스미드 pREX1087(도 10)을 수득하였다. Aga1에 상응하는 DNA 서열의 영역을 시퀀싱하여 그의 실체를 확인하였다. 이 발현 카세트를 다시 pSAC35로 전달하여 pREX1105(도 11)을 수득하였다.
실시예 5: 효모 세포에서 작용하는 포유동물 GPI 변이체의 선별
포유동물 GPI 신호는 이의 효모 대응물(counterpart)이 수행하지 않는 역할, 예컨대, 세포내 트래픽킹(trafficking), 경막 신호의 전달 및 클라쓰린(clathrin)-의존성 세포내이입을 수행한다(Biochem J. 1993, 294: 305-324). 효모 세포는 세포막뿐만 아니라 포유동물 세포에는 존재하지 않는 세포벽도 갖고 있으며, 효모 GPI의 대다수는 단백질을 효모 세포벽에 표적화시키는 독특한 서열을 갖는다(J Bacteriol, 1999, 181: 3886-3889). 인간 태반 알칼리성 포스파테이즈의 GPI는 효모 세포에서 전혀 기능하지 않는 것으로 밝혀져 있다(Mol. Microbiol. 1999, 34: 247-256). 발현된 재조합 단백질을 효모 세포벽에 부착시킬 수 있는 신규 서열을 수득하는 방법으로서, pREX0885(도 5)를 기재로 하되 huMDP GPI 서열 (DQLGGSCRTHYGYS S GASSLHRHWGLLLASMPLVLCLSLL)을 사용하지 않는 효모 디스플레이 벡터가 개발되었다. 상기 서열은 4개의 완전한 무작위 코돈(X) 및 수개의 (밑줄친) 적절한 변경을 도입하도록, 즉 XQXGGSXXTIGGYS G AASSLQRTIGLLLASLAPLVLASLL(서열번호 26)이 되도록 변경되었고, 이때 X는 임의의 아미노산이다.
융합 단백질 Flag-태그-N 로브-MUC1 줄기-GPI를 발현하는 효모 라이브러리(이때, GPI 서열은 전술한 바와 같이 변경됨)를 사카로마이세스 세레비지애 균주 DS1101 cir° 내로 형질전환시켰다. 세포벽에 부착된 융합 단백질을 갖는 임의의 효모 세포를, 바이오티닐화된 항-Flag 항체를 사용한 MACS를 통해 단리하였다.
2개의 올리고머 P2035 및 P2036(하기 참조)을 어닐링하고 Taq 중합효소를 사용하여 연장시켰다. 생성된 DNA 단편을 정제하고 HindIII/XbaI으로 절단하고 HindIII/XbaI으로 절단된 pREX0855와 라이게이션시켰다(하기 및 도 9 참조).
프라이머:
P2035(서열번호 27)
CTACAAGCTTNNKCAANNKGGTGGTTCTNNKNNKACTATTGGTGGTTATTCTGGTGCTGCTTCTTCCTTGCAGAGAACTATTG
P2036(서열번호 28)
GATGTCTAGATTATTATAACAAAGAAGCTAAAACCAATGGAGCTAAAGAAGCCAATAACAAACCAATAGTTCTCTGCAAGGAAG
Figure 112009042130014-PCT00004
라이게이션 혼합물을 이. 콜라이 DH5α 내로 형질전환시켜 약 5x105개의 콜로니를 수득하였다. 모든 콜로니를 모아 플라스미드 DNA를 단리하였다. 플라스미드 DNA를 NotI으로 절단하여 발현 카세트를 회수하고 이를 SAC35에 클로닝하여 효모 발현 라이브러리를 생성하였다. 이 라이브러리를 전기천공을 통해 DS1101 cir° 세포 내로 형질전환시켰다. 상기 라이브러리의 밤샘 배양물에 대해 바이오티닐화된 항-Flag 항체를 사용한 MACS를 실시하엿다. 단리된 세포는 상기 항체를 사용한 MACS를 통해 다시 즉시 정제하였다. 발생된 세포를 BMMS 플레이트 상에 플레이팅하고 24개의 콜로니의 특징을 FACS 및 DNA 시퀀싱 분석으로 규명하였다(Flag 스파이크 설명 참조).
판독가능한 서열을 제공하는 22개의 클론들 중 7개의 클론만이 다양한 수준의 디스플레이를 보이면서 전장 GPI 고착자를 가졌고(표 1), 이들 중 최상의 클론은 효모 GPI 고착자를 갖는 동일한 융합 단백질을 발현하는 벡터 pREX1003보다 더 우수하였다.
Figure 112009042130014-PCT00005
Figure 112009042130014-PCT00006
예상외로, 50%의 콜로니가 GPI 고착자 신호를 효과적으로 결실시키는 무작위화된 코돈들 중 하나에서 정지 코돈에 의해 말단이 결실되어 있었다. 이 12개의 클론들 중 2개의 클론이 pREX1003보다 유의하게 우수한 디스플레이 수준을 나타내는 것으로 확인되었고 정지 코돈 직전에 시스테인 잔기를 함유하는 것으로 밝혀졌다(CQIGGS*(서열번호 34) 및 CQ*(이때, *는 정지 코돈임))(도 12). 아마도 이 구축물들은 세포벽 단백질 내의 자유 시스테인 잔기에의 이황화 결합을 통해 세포벽에 가교결합되었을 것이다.
실시예 6: RGD 라이브러리 구축 및 스크리닝
인테그린 αIIbβ3에 결합하고 혈소판 응집을 억제하는 Tf 변이체를 선별하기 위해, RGD의 양 측면 상에 3가지 무작위화된 아미노산을 포함하는 펩티드를, PCR 니트 기법을 통해 Tf의 289 또는 290 아미노산 위치에서 Tf 스카폴드(CXXXRGDXXXC; X는 무작위화 위치를 나타냄) 내에 삽입함으로써 라이브러리를 구축하였다.
프라이머 P1980/P2181 및 P2127/P1173을 사용하여 pREX1106(도 11)을 증폭함으로써 단편 A 및 B(도 13)를 수득하였다.
P1173: 전방향 단편을 위한 289-290 니팅 후방향 프라이머
AGGAGAGCTGAATAGTTGG
P1980: 후방향 단편을 위한, 289-290 RGD 함유 무작위 펩티드 라이브러리 니팅 전방향 프라이머
CCAACTATTCAGCTCTCCTTGT567567567AGAGGAGAC567567567TGTCATGGGAAGGACCTGCTGTTTAAG
5 13% T, 32% G, 20% C, 35% A
6 24% T, 24% G, 22% C, 30% A
7 37% T, 26% G, 37% C
(정지 코돈 빈도를 최소화하고 아미노산 조성을 천연 단백질에 일치시키기 위한 뉴클레오티드 혼합물; Labean, TH and Kauffman, SA, 1993, Protein Science. 2: 1249-1254)
P2127: 전방향 단편을 위한 289-290 니팅 전방향 프라이머
CCTCCTACCTTGATTGCATCAG
P2181: 후방향 단편을 위한 289-290 니팅 후방향 프라이머
GGAGATGAAGAAGTCAAACTTGGG
P2139: Gap 복구 GPI 라이브러리
GAGGCACTTGATGGTTCAATGG
프라이머 P1980은 무작위화된 서열을 도입하였다. 증폭된 DNA 단편을 겔 정제하고 단일 프라이머(단편 A에 대해 P2181 및 단편 B에 대해 P2127)를 사용하여 더 증폭시킴으로써 단일 가닥 DNA(ss-A 및 ss-B)를 수득하였다. ss-A 및 ss-B를 dNTP 및 클레나우 효소의 존재 하에 어닐링시켜 이중 가닥 단편을 형성하였다. 이 어닐링 생성물을 P2127 및 P2139를 사용하여 최종적으로 증폭시키고 겔 정제함으로써 RGD-라이브러리 삽입물을 생성하였다. 이 작업은 라이브러리가 합성 올리고뉴클레오티드의 원래의 복잡성을 유지하게 하였다.
상기 삽입물은 하기 전기천공 방법을 이용한 BamHI-BspEI으로 절단된 pREX1106으로의 갭-복구를 통해 7x108 라이브러리를 구축하는 데 사용되었다. 각각의 갭-복구 반응을 위해, BamHI/BspEI으로 절단된 pREX1106 1.4 ㎍을 상기 RGD-라이브러리 삽입물 1 ㎍과 혼합하고 전기천공을 이용하여 DS1101 cir° 효모 세포 내로 도입하였다.
라이브러리 구축을 위한 효모(DS1101 cir°)의 고효율 전기천공
1) OD600이 0.2에 도달할 때까지 YEP/S(1 중량/부피%의 효모 추출물, 2 중량/부피%의 펩톤, 2 중량/부피%의 수크로스) 100 ㎖를 DS1101 cir°의 신선한 밤샘 배양물로 접종하였다.
2) 30℃ 및 200 rpm에서 OD600이 0.8에 도달할 때까지 (약 5시간) 세포를 생장시켰다.
3) 2,000 rpm에서 5분 동안 원심분리하여 세포를 모았다.
4) 상청액을 따라 버리고 펠렛을 TE(10 mM Tris-HCl, pH 7.5 및 1 mM EDTA) 완충제 18 ㎖에 재현탁시켰다. 이어서, 1 M의 아세트산리튬을 첨가하였다.
5) 30℃의 롤러 드럼 내에서 세포를 45분 동안 항온처리하였다.
6) 1 M의 DTT 0.5 ㎖를 첨가하였다.
7) 30℃의 롤러 드럼 내에서 15분 동안 항온처리하였다.
8) 실온에서 멸균수 80 ㎖로 세척하였다.
9) 실온에서 펠렛을 멸균수 100 ㎖로 세척하였다.
10) 펠렛을 1 M의 빙냉 소르비톨 10 ㎖로 세척하였다.
11) 세포를 1 M의 빙냉 소르비톨 60 ㎕(6회의 형질전환을 위한 충분한 양)에 재현탁시켰다.
12) 세포를 얼음 상에서 유지하고 멸균 마이크로퓨즈(microfuge) 튜브 내에서 혼합하였다:
i. 컴피턴트(competent) 효모 세포 50 ㎕
ii. DNA 1.4 ㎍(5 ㎕ 이하)
iii. ssDNA 5 ㎍(0.5 ㎕, 10 mg/㎖)
13) 펄스를 인가하기 전에 얼음 상에서 5분 동안 항온처리하였다. 세포/DNA 현탁액을 0.2 cm 빙냉 큐빗 바닥까지 가볍게 두드리고 1회 펄스를 인가하였다:
i. 전압 1.5 Kv
ii. 전기용량 25 μF
iii. 저항 200Ω
14) YEP/S와 1 M 소르비톨의 50:50 혼합물 1 ㎖를 즉시 첨가하고, 효모를 마이크로퓨즈 튜브로 옮기고 효모를 20℃에서 1시간 동안 회수하였다(시험이 요구되는 경우 회수할 필요가 없을 수 있음).
15) 5,000 rpm에서 1분 동안 원심분리하여 세포를 모으고 1 M 소르비톨 1 ㎖로 1회 세척하였다.
16) 1 M 소르비톨 1 ㎖에 재현탁시키고 BMM/S 플레이트 상에 스프레딩하였다. 30℃에서 항온처리하였다.
αIIbβ3에 대한 고친화성 트랜스바디를 인간 혈소판으로부터 정제된 인테그린으로 코팅된 플레이트 상의 효모 디스플레이 라이브러리로부터 선별하였다. αIIbβ3 인테그린의 정제를 약간 변경시킨, 문헌((Hillman et al., 2002, Protein Expr. Purif. 25(3): 494-502)의 방법에 따라 수행하였다. 인테그린을 코팅 완충제(50 mM 보레이트 완충제, pH 9.5)로 희석(1:30 희석)하고 4℃에서 페트리디쉬를 상기 희석된 인테그린으로 밤새 코팅하였다. 완충제 A(20 mM Tris-HCl, pH7.5, 150 mM NaCl, 1 mM MgCl2, 1 mM CaCl2 및 1 mM MnCl2)로 3회 린싱한 후, 결합 완충제 및 1% BSA를 사용하여 실온에서 플레이트를 2시간 동안 블로킹하였다. 상기 플레이트 상에서의 밤샘 배양 효모 RGD 라이브러리 40 0D600 유니트를 30℃ 및 200 rpm에서 BMM/S(2 중량/부피% 수크로스) 중에서 생장시키고 원심분리하여 모으고, 1% BSA 및 GRGDSP 억제제 펩티드(1차 선별을 위해 1 ㎍/㎖ 및 2차 선별을 위해 10 ㎍/㎖)가 함유된 결합 완충제 10 ㎖에 재현탁시키고, 약하게 진탕하면서 실온에서 코팅된 인테그린과 함께 2시간 동안 항온처리하였다. 비-결합된 세포를 결합 완충제로 3회 세척하여 제거하고 결합된 세포를 모았다.
가용성 단백질의 제조
RGD 서열을 포함하는 N 로브에 대한 DNA 코딩 영역을 효모 디스플레이 벡터로부터 회수하고 효모 발현 벡터에 클로닝하여 RGD 서열을 포함하는 가용성 Tf 분자를 제조하였다. 상기 분자들을 높은 세포 밀도 유가배양식 발효에서 발현시키고 컬럼 크로마토그래피로 정제하였다. 천연 αIIbβ3 리간드의 서열과 선택된 클론들의 서열의 비교예는 다음과 같다:
Figure 112009042130014-PCT00007
인테그린 결합 분석
인테그린과 RGD 트랜스바디의 직접적 결합은 ELISA로 측정하였다. 인테그린을 코팅 완충제로 희석하고 4℃에서 맥시소브(Maxisorb) ELISA 플레이트를 상기 희석된 인테그린으로 밤새 코팅하였다. 플레이트를 실온에서 진탕하면서 1%의 BSA 및 0.05%의 Tween-20(결합 완충제)이 함유된 완충제 A로 2시간 동안 블로킹하였다. 결합 완충제로 희석된 트랜스바디를 4℃에서 인테그린에 밤새 결합시켰다. 0.05% Tween-20(세척 완충제)이 함유된 완충제 A를 사용하여 비-결합된 물질을 세척하였다. 결합 완충제 중의 바이오티닐화된 항-Tf 및 스트렙타비딘-HRP를 사용하여 결합된 물질을 검출하고, 각 단계 후 세척 완충제로 세척하였다. 결합의 정량은 퀀타블루(QuantaBlue) 형광 기질을 사용한 스펙트라맥스 제미니(SpectraMax Gemini) EM 및 소프트맥스(SoftMax) 소프트웨어를 이용하여 수행하였다. 도 14를 참조한다.
또한, 트랜스바디 결합을 경합 ELISA 분석 포맷에서 평가하였다. 인테그린으로 코팅하고 플레이트를 전술한 바와 같이 블로킹하였다. 결합 완충제 중의 트랜스바디 또는 대조군 펩티드 및 바이오티닐화된 피브로넥틴을 적절한 세포에 첨가하고 4℃에서 밤새 결합시켰다. 플레이트를 세척 완충제로 세척하고, 스트렙타비딘-HRP를 사용하여 결합된 피브로넥틴을 검출하였다. 결합의 정량은 전술한 바와 같이 수행하였다. 도 15를 참조한다.
혈소판 응집 분석
혈소판이 풍부한 마우스 혈장(PRP)을 사용하여 혈소판 응집 분석을 수행하였다. 신선한 혈소판을 B6 마우스로부터 수득하였다. 사용을 위해 혈소판을 2.5x108/㎖까지 희석하였다. 혈소판 응집을 교반하면서(900 rpm) 37℃에서 응집측정기(aggregometer)로 측정하였다. ADP(10 μM)를 첨가하기 전에, 시험 샘플을 PRP와 함께 10분 동안 항온처리하였다. 혈소판 응집 정도를 탁도측정기로 6분 동안 연속적으로 모니터링하고 광 투과의 증가로서 표시하였다. 도 16을 참조한다.
실시예 7: MUC3 줄기 개조
효모의 표면 상에 단백질을 디스플레이하기 위해, 인간 MUC3(hMUC3) 단백질을 디스플레이 줄기로서 최적화하였다. 반복도의 일부가 제거되고 효모에 대해 최적화된 합성 올리고뉴클레오티드 코돈에 의한 구축을 허용하도록 hMUC3 DNA 서열(진뱅크 검색 번호 AAC02272)을 변경시켰다. 생성된 hMUC3 줄기 서열(하기 서열 참조)은 진스크립트 코포레이션(GenScript Corporation; 미국 뉴저지주 피스카타웨이 소재)에 의해 합성되었다.
변경된 hMUC3 DNA는 효모 디스플레이 벡터 내에 존재하는 경우 이. 콜라이에서 불안정한 것으로 입증되었다. hMUC3 DNA 서열을, 무작위 돌연변이유발 및 이. 콜라이에서의 안정한 클론의 선별을 통해 더 개조하였다. hMUC3 DNA 서열에 대해 오류 유발 PCR 진모프(GeneMorph) II 키트(스트라타진)를 사용한 2회의 무작위 돌연변이유발 수행하였다. 생성된 PCR 단편을 SpeI/HindIII로 절단하여 SpeI/HindIII로 절단된 pREX0855에 라이게이션시켰다. 라이게이션 혼합물을 사용하여 이. 콜라이 XL1-Blue를 형질전환시켰다. 상기 이. 콜라이 세포를 플레이팅하고 밤새 생장시킨 후, 플레이트로부터 모든 생체물질을 회수하였다. 플라스미드 DNA를 회수하고, NotI/XmnI으로 절단하고 아가로스 겔 전기영동으로 분리하였다. 정확한 크기의 DNA 밴드를 겔로부터 잘라내어 정제하였다. hMUC3 줄기를 갖는 NotI 디스플레이 카세트를 보유하는 생성된 DNA를 효모에서의 갭-복구를 통해 pSAC35 기재의 효모 디스플레이 벡터 pREX1003에 클로닝하였다.
모든 생성된 효모를 BMM/S 배지 중에서 배양하고 배양된 효모에 대해 항-Flag 항체로 코팅된 플레이트 상에서의 패닝(panning) 선별을 실시하였다. 항-Flag 항체(시그마 F9291)를 코팅 완충제(50 mM 보레이트 완충제, pH 9.5)로 희석(1:25 희석)하고 4℃에서 페트리디쉬를 상기 희석된 항-Flag 항체로 밤새 코팅하였다. 결합 완충제(PBS-T, 2 mM EDTA, 1% BSA)로 3회 린싱한 후, 플레이트를 실온에서 결합 완충제로 2시간 동안 블로킹하였다. 밤샘 효모 배양물 40 OD600 유니트를 모아 결합 완충제 10 ㎖에 현탁시키고 약하게 진탕하면서 실온에서 상기 코팅된 항체와 함께 2시간 동안 항온처리하였다. 결합 완충제를 사용한 3회 세척으로 비-결합된 세포를 제거하고, 결합된 세포를 모았다.
결합제는 FACS 분석(도 17)에 의해 입증되는 바와 같이 고수준의 단백질 디스플레이를 보였다. 개개의 클론들을 단리하여, 이. 콜라이에서 안정하고 효모에서 고수준의 디스플레이를 제공하는 hMUC3 DNA 서열을 수득하였다.
변경된 hMUC3 유전자(서열번호 76)
Figure 112009042130014-PCT00008
실시예 8: 표면 노출된 Tf 아미노산 잔기의 무작위화
표면 노출된 아미노산 잔기, 예를 들어, 6개의 표면 노출된 잔기(즉, 삽입물은 아님)를 Tf 분자의 여러 지점에서 무작위화하여 Tf 융합 단백질 라이브러리를 생성할 수 있다. 상기 잔기들은 연속적일 필요는 없지만 바람직하게는 분자의 본체로부터 용매 상 내로 돌출되는 측쇄를 갖는 영역 내에 군집해있을 것이다. 6개의 표면 노출된 잔기를 갖는 라이브러리는 약 107개의 단백질만을 필요로 할 것이므로, (프라이머의 질에 따라) 라이브러리 당 20 내지 40회의 형질전환만을 필요로 할 것이다.
3개의 가능한 부위의 예는 다음과 같다:
Figure 112009042130014-PCT00009
실시예 9: 포유동물 세포의 표면 상에서의 Tf 융합 단백질의 발현
재료 및 방법
HEK-293 세포를 10% 태아 소 혈청(하이클론(HyClone)), L-글루타민(GIBCO-BRL) 및 HEPES(GIBCO-BRL)로 보충된 DMEM(하이클론) 중에서 생장시키고 유지시켰다.
하기 프라이머 P0926 및 P0927을 어닐링한 후 Taq DNA 중합효소로 연장시켜 인간 태반 알칼리성 포스파타제(ALPP) GPI DNA 서열을 발생시켰다:
P0926
ACTAAGCTTGACCTGGCTCCACAAATTGCTGGCTATACCGACGCCGCGCATCCGG GTAGATCCGTGGTCCCAGCTTTGCTTCCTCT
P0927
TTATCTAGATTATTATGGAGCAGTGGCAGTTTCCAACAGTAACAGAGTACCGGCCA GCAGAGGAAGCAAAGCTGGGAC
PCR 반응 조건은 다음과 같다: 94℃에서 1분; 94℃에서 40초, 55℃에서 40초 및 72℃에서 2분, 25 주기; 이어서 72℃에서 7분 동안의 연장. PCR 생성물을 HindIII/XbaI으로 절단하고, pREX0757(도 18)의 HindIII/XbaI 부위에 클로닝하여 효모 GPI 서열을 제거한 후, 시퀀싱하였다. 생성된 플라스미드 pREX1234(도 19)는 N-말단에 Flag-태그를 갖고 C-말단에 인간 GPI 서열을 갖는 변경된 Tf(mTf)를 보유하였다. 이 mTf 카세트를, 하기 조건 하에 하기 프라이머 P2225 및 P2226을 사용한 PCR로 포유동물 발현 벡터에 클로닝하기 위해 5' 및 3' 말단에서 변경시켰다: 94℃에서 1분; 94℃에서 40초, 55℃에서 40초 및 72℃에서 2분, 25 주기; 이어서 72℃에서 7분 동안의 연장:
P2225
CACCATGAGGCTCGCCGTGGGAGCCCTG
P2226
TTATTATGGAGCAGTGGCAGTTTC
이 PCR 생성물을 pcDNA3.1(인비트로겐(미국 캘리포니아주 칼스바드 소재))에 클로닝하여 pREX1235(도 20)를 생성하였다. pREX1235 내의 mTf 카세트의 서열은 DNA 시퀀싱으로 확인하였다.
FuGENE 6(로슈)을 제조자의 프로토콜에 따라 사용하여 HEK-293 세포를 pREX1235로 형질감염시켰다. 세포를 1X 포스페이트-완충 생리식염수(1X PBS)로 세척하고 4℃에서 세포 용해 완충제(pH 7.4의 20 mM Tris-HCl, 150 mM NaCl, 1% 트리톤 X-100, 1 mM EDTA) 및 Halt™ 포스파테이즈 억제제 칵테일(피어스(Pierce))과 단백질분해효소 억제제 칵테일(시그마)의 혼합물을 사용하여 용해시켰다. 세포를 4℃에서 14,000 rpm으로 30분 동안 원심분리하여 펠렛 형태로 침전시켰다. 상청액을 모아 4℃에서 항-Flag 아가로스 비드(시그마)에 2시간 동안 결합시켰다. 펠렛을 용해 완충제로 1회, Tris-완충 생리식염수(TBS)(pH 7.4의 20 mM Tris-HCl, 150 mM NaCl) 및 0.5% 트리톤 X-100으로 3회, 1X PBS로 1회 세척하였다. 세포를 4℃에서 14,000 rpm으로 30분 동안 원심분리하여 펠렛을 침전시켰다. 샘플을 NuPAGE® LDS 샘플 로딩 완충제 및 샘플 환원제(인비트로겐)로 용출하였다. 회수된 단백질을 NuPAGE™ 4 내지 12% Bis-Tris 겔(인비트로겐) 상에서 런닝하고 제조자의 지시에 따라 NuPAGE® 전달 완충제를 사용하여 PVDF(인비트로겐) 막으로 옮겼다. 블롯을 실온에서 PBS-T(1X PBS + 0.2 시그마) 중의 5% 탈지 건조유로 1시간 동안 블로킹하고, 실온에서 Flag에 대한 바이오티닐화된 일차 항체(1:1,000 마우스 항-Flag BioM2; 시그마) 또는 인간 Tf(1:4,000 바이오티닐화된 닭 항-인간 Tf; 어큐레이트 케미칼 & 사이언티픽(Accurate Chemical & Scientific))로 2시간 동안 프로빙한 후, 실온에서 스트렙타비딘-호오스-라디쉬 퍼록시데이즈(SA-HRP)(1:2,500 ImmunoPure® 스트렙타비딘 호스라디쉬 퍼록시데이즈 접합체; 피어스)와 함께 1시간 동안 항온처리하였다. 별법으로, 표면 바이오티닐화 실험을 위해, 블롯을 SA-HRP(1:2,500; 피어스)로만 프로빙하였다. 수퍼시그날 웨스트 듀라 익스텐디드 듀레이션 서브스트레이트(SuperSignal West Dura Extended Duration Substrate; 피어스)를 사용하여 모든 블롯을 현상하고 퀀터니 원(Quantity One) 소프트웨어(v.4.5.0; 바이오-라드)를 사용하는 Fluor-S™ 멀티이미저(MultiImager)(바이오-라드) 상에서 가시화하였다.
HEK-293 세포를 전술한 바와 같이 24시간 동안 형질감염시켰다. 세포를 멸균 빙냉 1X PBS로 3회 세척하였다. 이어서, 세포를 1X PBS 중의 설포-NHS-LC-바이오틴 시약(피어스) 0.5 mg/㎖로 처리하고 4℃에서 락커 플랫폼 상에서 2시간 동안 항온처리하였다. 표면 바이오티닐화 후, 세포를 켄치 완충제(1X PBS + 100 mM 글리신)로 3회 세척하고 전술한 바와 같은 면역침전 및 면역블롯팅을 위해 세포 용해 완충제에 재현탁시켰다.
HEK-293 세포를 전술한 바와 같이 24시간 동안 형질감염시켰다. 세포를 멸균 1X PBS로 1회 세척한 후, 추가 1X PBS에 재현탁시키고 세포의 수를 세었다. 샘플 당 4.25x105개의 세포를 1.5 ㎖ 에펜도르프 튜브로 옮겼다. 세포를 4℃에서 4,000 rpm으로 3분 동안 원심분리하여 펠렛을 침전시켰다. 이어서, 세포를 1X PBS-T(0.05 시그마)로 블로킹하고 실온에서 30분 동안 항온처리하였다. 세포를 1X PBS-T로 2회 세척하고, 이차 항체(1:100 염소 항-마우스-APC; 몰레큘라 프로브스)에 재현탁시키고 실온에서 30분 동안 항온처리하였다. 1X PBS-T로 2회 더 세척한 후, 세포를 세포 완충제(아질런트(Agilent))에 재현탁시켜 세포의 최종 농도가 2x106 세포/㎖이 되도록 하고 제조자의 지시에 따라 세포 형광 칩(셀 플루오레센스 LabChip® 키트, 아질런트) 상에 로딩하였다. 아질런트 2100 생물분석기 및 2100 소프트웨어를 이용하여 모든 FACS 분석을 수행하였다.
결과
pREX1235로 형질감염된 세포 또는 모의-형질감염 세포로부터 얻은 용해물에 대해 항-Flag-아가로스 비드를 사용한 면역침전에 이어 웨스턴 블롯팅을 수행하였다. 항-Flag 또는 항-Tf 항체를 사용한 웨스턴 블롯의 프로빙은 Tf 및 Flag 부분 둘다의 존재를 명확하게 보여준다(도 21).
pREX1235로 형질감염된 세포 또는 모의-형질감염 세포의 표면을 용해 전에 바이오티닐화시키고 상기 세포에 대해 항-Flag-아가로스 및 스트렙타비딘-HRP를 사용한 웨스턴 블롯팅을 수행하였다. 표면-바이오티닐화는 노출된 원형질막 단백질만이 웨스턴 블롯팅에서 검출되게 한다. 예측된 분자량을 갖는 Flag-침전가능한 단백질이 관찰되었는데, 이는 Flag-Tf 융합체가 세포 표면 상에서 발현됨을 입증한다(도 22).
또한, 형질감염된 세포에 대해 FACS를 수행하였다. 모의-형질감염 세포에 비해 pREX1235로 형질감염된 세포에서 4배의 염색 증가가 관찰되었는데, 이는 Flag-Tf 융합체의 세포-표면 발현을 명확하게 입증한다(도 23).
본 발명이 상기 실시예를 참조하여 상세히 기재되어 있지만, 본 발명의 기술적 사상을 벗어나지 않으면서 다양한 변경이 가능함을 이해할 것이다. 따라서, 본 발명은 하기 청구범위에 의해서만 한정된다. 본원과 관련하여 언급된 모든 특허, 특허출원 및 간행물은 본원에 전체가 참고로 도입된다.
SEQUENCE LISTING <110> BIOREXIS PHARMACEUTICAL CORPORATION <120> TRANSFERRIN FUSION PROTEINS LIBRARIES <130> PC19610A <140> PCT/IB2007/003908 <141> 2007-12-07 <150> US 60/934,951 <151> 2006-12-12 <160> 76 <170> PatentIn version 3.3 <210> 1 <211> 2318 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (51)..(2147) <223> GenBank Acc. No. NM_001063, transferrin gene and protein <220> <221> sig_peptide <222> (51)..(107) <400> 1 gcacagaagc gagtccgact gtgctcgctg ctcagcgccg cacccggaag atg agg 56 Met Arg 1 ctc gcc gtg gga gcc ctg ctg gtc tgc gcc gtc ctg ggg ctg tgt ctg 104 Leu Ala Val Gly Ala Leu Leu Val Cys Ala Val Leu Gly Leu Cys Leu 5 10 15 gct gtc cct gat aaa act gtg aga tgg tgt gca gtg tcg gag cat gag 152 Ala Val Pro Asp Lys Thr Val Arg Trp Cys Ala Val Ser Glu His Glu 20 25 30 gcc act aag tgc cag agt ttc cgc gac cat atg aaa agc gtc att cca 200 Ala Thr Lys Cys Gln Ser Phe Arg Asp His Met Lys Ser Val Ile Pro 35 40 45 50 tcc gat ggt ccc agt gtt gct tgt gtg aag aaa gcc tcc tac ctt gat 248 Ser Asp Gly Pro Ser Val Ala Cys Val Lys Lys Ala Ser Tyr Leu Asp 55 60 65 tgc atc agg gcc att gcg gca aac gaa gcg gat gct gtg aca ctg gat 296 Cys Ile Arg Ala Ile Ala Ala Asn Glu Ala Asp Ala Val Thr Leu Asp 70 75 80 gca ggt ttg gtg tat gat gct tac ctg gct ccc aat aac ctg aag cct 344 Ala Gly Leu Val Tyr Asp Ala Tyr Leu Ala Pro Asn Asn Leu Lys Pro 85 90 95 gtg gtg gca gag ttc tat ggg tca aaa gag gat cca cag act ttc tat 392 Val Val Ala Glu Phe Tyr Gly Ser Lys Glu Asp Pro Gln Thr Phe Tyr 100 105 110 tat gct gtt gct gtg gtg aag aag gat agt ggc ttc cag atg aac cag 440 Tyr Ala Val Ala Val Val Lys Lys Asp Ser Gly Phe Gln Met Asn Gln 115 120 125 130 ctt cga ggc aag aag tcc tgc cac acg ggt cta ggc agg tcc gct ggg 488 Leu Arg Gly Lys Lys Ser Cys His Thr Gly Leu Gly Arg Ser Ala Gly 135 140 145 tgg aac atc ccc ata ggc tta ctt tac tgt gac tta cct gag cca cgt 536 Trp Asn Ile Pro Ile Gly Leu Leu Tyr Cys Asp Leu Pro Glu Pro Arg 150 155 160 aaa cct ctt gag aaa gca gtg gcc aat ttc ttc tcg ggc agc tgt gcc 584 Lys Pro Leu Glu Lys Ala Val Ala Asn Phe Phe Ser Gly Ser Cys Ala 165 170 175 cct tgt gcg gat ggg acg gac ttc ccc cag ctg tgt caa ctg tgt cca 632 Pro Cys Ala Asp Gly Thr Asp Phe Pro Gln Leu Cys Gln Leu Cys Pro 180 185 190 ggg tgt ggc tgc tcc acc ctt aac caa tac ttc ggc tac tcg gga gcc 680 Gly Cys Gly Cys Ser Thr Leu Asn Gln Tyr Phe Gly Tyr Ser Gly Ala 195 200 205 210 ttc aag tgt ctg aag gat ggt gct ggg gat gtg gcc ttt gtc aag cac 728 Phe Lys Cys Leu Lys Asp Gly Ala Gly Asp Val Ala Phe Val Lys His 215 220 225 tcg act ata ttt gag aac ttg gca aac aag gct gac agg gac cag tat 776 Ser Thr Ile Phe Glu Asn Leu Ala Asn Lys Ala Asp Arg Asp Gln Tyr 230 235 240 gag ctg ctt tgc ctg gac aac acc cgg aag ccg gta gat gaa tac aag 824 Glu Leu Leu Cys Leu Asp Asn Thr Arg Lys Pro Val Asp Glu Tyr Lys 245 250 255 gac tgc cac ttg gcc cag gtc cct tct cat acc gtc gtg gcc cga agt 872 Asp Cys His Leu Ala Gln Val Pro Ser His Thr Val Val Ala Arg Ser 260 265 270 atg ggc ggc aag gag gac ttg atc tgg gag ctt ctc aac cag gcc cag 920 Met Gly Gly Lys Glu Asp Leu Ile Trp Glu Leu Leu Asn Gln Ala Gln 275 280 285 290 gaa cat ttt ggc aaa gac aaa tca aaa gaa ttc caa cta ttc agc tct 968 Glu His Phe Gly Lys Asp Lys Ser Lys Glu Phe Gln Leu Phe Ser Ser 295 300 305 cct cat ggg aag gac ctg ctg ttt aag gac tct gcc cac ggg ttt tta 1016 Pro His Gly Lys Asp Leu Leu Phe Lys Asp Ser Ala His Gly Phe Leu 310 315 320 aaa gtc ccc ccc agg atg gat gcc aag atg tac ctg ggc tat gag tat 1064 Lys Val Pro Pro Arg Met Asp Ala Lys Met Tyr Leu Gly Tyr Glu Tyr 325 330 335 gtc act gcc atc cgg aat cta cgg gaa ggc aca tgc cca gaa gcc cca 1112 Val Thr Ala Ile Arg Asn Leu Arg Glu Gly Thr Cys Pro Glu Ala Pro 340 345 350 aca gat gaa tgc aag cct gtg aag tgg tgt gcg ctg agc cac cac gag 1160 Thr Asp Glu Cys Lys Pro Val Lys Trp Cys Ala Leu Ser His His Glu 355 360 365 370 agg ctc aag tgt gat gag tgg agt gtt aac agt gta ggg aaa ata gag 1208 Arg Leu Lys Cys Asp Glu Trp Ser Val Asn Ser Val Gly Lys Ile Glu 375 380 385 tgt gta tca gca gag acc acc gaa gac tgc atc gcc aag atc atg aat 1256 Cys Val Ser Ala Glu Thr Thr Glu Asp Cys Ile Ala Lys Ile Met Asn 390 395 400 gga gaa gct gat gcc atg agc ttg gat gga ggg ttt gtc tac ata gcg 1304 Gly Glu Ala Asp Ala Met Ser Leu Asp Gly Gly Phe Val Tyr Ile Ala 405 410 415 ggc aag tgt ggt ctg gtg cct gtc ttg gca gaa aac tac aat aag agc 1352 Gly Lys Cys Gly Leu Val Pro Val Leu Ala Glu Asn Tyr Asn Lys Ser 420 425 430 gat aat tgt gag gat aca cca gag gca ggg tat ttt gct gta gca gtg 1400 Asp Asn Cys Glu Asp Thr Pro Glu Ala Gly Tyr Phe Ala Val Ala Val 435 440 445 450 gtg aag aaa tca gct tct gac ctc acc tgg gac aat ctg aaa ggc aag 1448 Val Lys Lys Ser Ala Ser Asp Leu Thr Trp Asp Asn Leu Lys Gly Lys 455 460 465 aag tcc tgc cat acg gca gtt ggc aga acc gct ggc tgg aac atc ccc 1496 Lys Ser Cys His Thr Ala Val Gly Arg Thr Ala Gly Trp Asn Ile Pro 470 475 480 atg ggc ctg ctc tac aat aag atc aac cac tgc aga ttt gat gaa ttt 1544 Met Gly Leu Leu Tyr Asn Lys Ile Asn His Cys Arg Phe Asp Glu Phe 485 490 495 ttc agt gaa ggt tgt gcc cct ggg tct aag aaa gac tcc agt ctc tgt 1592 Phe Ser Glu Gly Cys Ala Pro Gly Ser Lys Lys Asp Ser Ser Leu Cys 500 505 510 aag ctg tgt atg ggc tca ggc cta aac ctg tgt gaa ccc aac aac aaa 1640 Lys Leu Cys Met Gly Ser Gly Leu Asn Leu Cys Glu Pro Asn Asn Lys 515 520 525 530 gag gga tac tac ggc tac aca ggc gct ttc agg tgt ctg gtt gag aag 1688 Glu Gly Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Val Glu Lys 535 540 545 gga gat gtg gcc ttt gtg aaa cac cag act gtc cca cag aac act ggg 1736 Gly Asp Val Ala Phe Val Lys His Gln Thr Val Pro Gln Asn Thr Gly 550 555 560 gga aaa aac cct gat cca tgg gct aag aat ctg aat gaa aaa gac tat 1784 Gly Lys Asn Pro Asp Pro Trp Ala Lys Asn Leu Asn Glu Lys Asp Tyr 565 570 575 gag ttg ctg tgc ctt gat ggt acc agg aaa cct gtg gag gag tat gcg 1832 Glu Leu Leu Cys Leu Asp Gly Thr Arg Lys Pro Val Glu Glu Tyr Ala 580 585 590 aac tgc cac ctg gcc aga gcc ccg aat cac gct gtg gtc aca cgg aaa 1880 Asn Cys His Leu Ala Arg Ala Pro Asn His Ala Val Val Thr Arg Lys 595 600 605 610 gat aag gaa gct tgc gtc cac aag ata tta cgt caa cag cag cac cta 1928 Asp Lys Glu Ala Cys Val His Lys Ile Leu Arg Gln Gln Gln His Leu 615 620 625 ttt gga agc aac gta act gac tgc tcg ggc aac ttt tgt ttg ttc cgg 1976 Phe Gly Ser Asn Val Thr Asp Cys Ser Gly Asn Phe Cys Leu Phe Arg 630 635 640 tcg gaa acc aag gac ctt ctg ttc aga gat gac aca gta tgt ttg gcc 2024 Ser Glu Thr Lys Asp Leu Leu Phe Arg Asp Asp Thr Val Cys Leu Ala 645 650 655 aaa ctt cat gac aga aac aca tat gaa aaa tac tta gga gaa gaa tat 2072 Lys Leu His Asp Arg Asn Thr Tyr Glu Lys Tyr Leu Gly Glu Glu Tyr 660 665 670 gtc aag gct gtt ggt aac ctg aga aaa tgc tcc acc tca tca ctc ctg 2120 Val Lys Ala Val Gly Asn Leu Arg Lys Cys Ser Thr Ser Ser Leu Leu 675 680 685 690 gaa gcc tgc act ttc cgt aga cct taa aatctcagag gtagggctgc 2167 Glu Ala Cys Thr Phe Arg Arg Pro 695 caccaaggtg aagatgggaa cgcagatgat ccatgagttt gccctggttt cactggccca 2227 agtggtttgt gctaaccacg tctgtcttca cagctctgtg ttgccatgtg tgctgaacaa 2287 aaaataaaaa ttattattga ttttatattt c 2318 <210> 2 <211> 698 <212> PRT <213> Homo sapiens <400> 2 Met Arg Leu Ala Val Gly Ala Leu Leu Val Cys Ala Val Leu Gly Leu 1 5 10 15 Cys Leu Ala Val Pro Asp Lys Thr Val Arg Trp Cys Ala Val Ser Glu 20 25 30 His Glu Ala Thr Lys Cys Gln Ser Phe Arg Asp His Met Lys Ser Val 35 40 45 Ile Pro Ser Asp Gly Pro Ser Val Ala Cys Val Lys Lys Ala Ser Tyr 50 55 60 Leu Asp Cys Ile Arg Ala Ile Ala Ala Asn Glu Ala Asp Ala Val Thr 65 70 75 80 Leu Asp Ala Gly Leu Val Tyr Asp Ala Tyr Leu Ala Pro Asn Asn Leu 85 90 95 Lys Pro Val Val Ala Glu Phe Tyr Gly Ser Lys Glu Asp Pro Gln Thr 100 105 110 Phe Tyr Tyr Ala Val Ala Val Val Lys Lys Asp Ser Gly Phe Gln Met 115 120 125 Asn Gln Leu Arg Gly Lys Lys Ser Cys His Thr Gly Leu Gly Arg Ser 130 135 140 Ala Gly Trp Asn Ile Pro Ile Gly Leu Leu Tyr Cys Asp Leu Pro Glu 145 150 155 160 Pro Arg Lys Pro Leu Glu Lys Ala Val Ala Asn Phe Phe Ser Gly Ser 165 170 175 Cys Ala Pro Cys Ala Asp Gly Thr Asp Phe Pro Gln Leu Cys Gln Leu 180 185 190 Cys Pro Gly Cys Gly Cys Ser Thr Leu Asn Gln Tyr Phe Gly Tyr Ser 195 200 205 Gly Ala Phe Lys Cys Leu Lys Asp Gly Ala Gly Asp Val Ala Phe Val 210 215 220 Lys His Ser Thr Ile Phe Glu Asn Leu Ala Asn Lys Ala Asp Arg Asp 225 230 235 240 Gln Tyr Glu Leu Leu Cys Leu Asp Asn Thr Arg Lys Pro Val Asp Glu 245 250 255 Tyr Lys Asp Cys His Leu Ala Gln Val Pro Ser His Thr Val Val Ala 260 265 270 Arg Ser Met Gly Gly Lys Glu Asp Leu Ile Trp Glu Leu Leu Asn Gln 275 280 285 Ala Gln Glu His Phe Gly Lys Asp Lys Ser Lys Glu Phe Gln Leu Phe 290 295 300 Ser Ser Pro His Gly Lys Asp Leu Leu Phe Lys Asp Ser Ala His Gly 305 310 315 320 Phe Leu Lys Val Pro Pro Arg Met Asp Ala Lys Met Tyr Leu Gly Tyr 325 330 335 Glu Tyr Val Thr Ala Ile Arg Asn Leu Arg Glu Gly Thr Cys Pro Glu 340 345 350 Ala Pro Thr Asp Glu Cys Lys Pro Val Lys Trp Cys Ala Leu Ser His 355 360 365 His Glu Arg Leu Lys Cys Asp Glu Trp Ser Val Asn Ser Val Gly Lys 370 375 380 Ile Glu Cys Val Ser Ala Glu Thr Thr Glu Asp Cys Ile Ala Lys Ile 385 390 395 400 Met Asn Gly Glu Ala Asp Ala Met Ser Leu Asp Gly Gly Phe Val Tyr 405 410 415 Ile Ala Gly Lys Cys Gly Leu Val Pro Val Leu Ala Glu Asn Tyr Asn 420 425 430 Lys Ser Asp Asn Cys Glu Asp Thr Pro Glu Ala Gly Tyr Phe Ala Val 435 440 445 Ala Val Val Lys Lys Ser Ala Ser Asp Leu Thr Trp Asp Asn Leu Lys 450 455 460 Gly Lys Lys Ser Cys His Thr Ala Val Gly Arg Thr Ala Gly Trp Asn 465 470 475 480 Ile Pro Met Gly Leu Leu Tyr Asn Lys Ile Asn His Cys Arg Phe Asp 485 490 495 Glu Phe Phe Ser Glu Gly Cys Ala Pro Gly Ser Lys Lys Asp Ser Ser 500 505 510 Leu Cys Lys Leu Cys Met Gly Ser Gly Leu Asn Leu Cys Glu Pro Asn 515 520 525 Asn Lys Glu Gly Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Val 530 535 540 Glu Lys Gly Asp Val Ala Phe Val Lys His Gln Thr Val Pro Gln Asn 545 550 555 560 Thr Gly Gly Lys Asn Pro Asp Pro Trp Ala Lys Asn Leu Asn Glu Lys 565 570 575 Asp Tyr Glu Leu Leu Cys Leu Asp Gly Thr Arg Lys Pro Val Glu Glu 580 585 590 Tyr Ala Asn Cys His Leu Ala Arg Ala Pro Asn His Ala Val Val Thr 595 600 605 Arg Lys Asp Lys Glu Ala Cys Val His Lys Ile Leu Arg Gln Gln Gln 610 615 620 His Leu Phe Gly Ser Asn Val Thr Asp Cys Ser Gly Asn Phe Cys Leu 625 630 635 640 Phe Arg Ser Glu Thr Lys Asp Leu Leu Phe Arg Asp Asp Thr Val Cys 645 650 655 Leu Ala Lys Leu His Asp Arg Asn Thr Tyr Glu Lys Tyr Leu Gly Glu 660 665 670 Glu Tyr Val Lys Ala Val Gly Asn Leu Arg Lys Cys Ser Thr Ser Ser 675 680 685 Leu Leu Glu Ala Cys Thr Phe Arg Arg Pro 690 695 <210> 3 <211> 679 <212> PRT <213> Homo sapiens <220> <221> MISC_FEATURE <223> Mature Transferrin Protein <400> 3 Val Pro Asp Lys Thr Val Arg Trp Cys Ala Val Ser Glu His Glu Ala 1 5 10 15 Thr Lys Cys Gln Ser Phe Arg Asp His Met Lys Ser Val Ile Pro Ser 20 25 30 Asp Gly Pro Ser Val Ala Cys Val Lys Lys Ala Ser Tyr Leu Asp Cys 35 40 45 Ile Arg Ala Ile Ala Ala Asn Glu Ala Asp Ala Val Thr Leu Asp Ala 50 55 60 Gly Leu Val Tyr Asp Ala Tyr Leu Ala Pro Asn Asn Leu Lys Pro Val 65 70 75 80 Val Ala Glu Phe Tyr Gly Ser Lys Glu Asp Pro Gln Thr Phe Tyr Tyr 85 90 95 Ala Val Ala Val Val Lys Lys Asp Ser Gly Phe Gln Met Asn Gln Leu 100 105 110 Arg Gly Lys Lys Ser Cys His Thr Gly Leu Gly Arg Ser Ala Gly Trp 115 120 125 Asn Ile Pro Ile Gly Leu Leu Tyr Cys Asp Leu Pro Glu Pro Arg Lys 130 135 140 Pro Leu Glu Lys Ala Val Ala Asn Phe Phe Ser Gly Ser Cys Ala Pro 145 150 155 160 Cys Ala Asp Gly Thr Asp Phe Pro Gln Leu Cys Gln Leu Cys Pro Gly 165 170 175 Cys Gly Cys Ser Thr Leu Asn Gln Tyr Phe Gly Tyr Ser Gly Ala Phe 180 185 190 Lys Cys Leu Lys Asp Gly Ala Gly Asp Val Ala Phe Val Lys His Ser 195 200 205 Thr Ile Phe Glu Asn Leu Ala Asn Lys Ala Asp Arg Asp Gln Tyr Glu 210 215 220 Leu Leu Cys Leu Asp Asn Thr Arg Lys Pro Val Asp Glu Tyr Lys Asp 225 230 235 240 Cys His Leu Ala Gln Val Pro Ser His Thr Val Val Ala Arg Ser Met 245 250 255 Gly Gly Lys Glu Asp Leu Ile Trp Glu Leu Leu Asn Gln Ala Gln Glu 260 265 270 His Phe Gly Lys Asp Lys Ser Lys Glu Phe Gln Leu Phe Ser Ser Pro 275 280 285 His Gly Lys Asp Leu Leu Phe Lys Asp Ser Ala His Gly Phe Leu Lys 290 295 300 Val Pro Pro Arg Met Asp Ala Lys Met Tyr Leu Gly Tyr Glu Tyr Val 305 310 315 320 Thr Ala Ile Arg Asn Leu Arg Glu Gly Thr Cys Pro Glu Ala Pro Thr 325 330 335 Asp Glu Cys Lys Pro Val Lys Trp Cys Ala Leu Ser His His Glu Arg 340 345 350 Leu Lys Cys Asp Glu Trp Ser Val Asn Ser Val Gly Lys Ile Glu Cys 355 360 365 Val Ser Ala Glu Thr Thr Glu Asp Cys Ile Ala Lys Ile Met Asn Gly 370 375 380 Glu Ala Asp Ala Met Ser Leu Asp Gly Gly Phe Val Tyr Ile Ala Gly 385 390 395 400 Lys Cys Gly Leu Val Pro Val Leu Ala Glu Asn Tyr Asn Lys Ser Asp 405 410 415 Asn Cys Glu Asp Thr Pro Glu Ala Gly Tyr Phe Ala Val Ala Val Val 420 425 430 Lys Lys Ser Ala Ser Asp Leu Thr Trp Asp Asn Leu Lys Gly Lys Lys 435 440 445 Ser Cys His Thr Ala Val Gly Arg Thr Ala Gly Trp Asn Ile Pro Met 450 455 460 Gly Leu Leu Tyr Asn Lys Ile Asn His Cys Arg Phe Asp Glu Phe Phe 465 470 475 480 Ser Glu Gly Cys Ala Pro Gly Ser Lys Lys Asp Ser Ser Leu Cys Lys 485 490 495 Leu Cys Met Gly Ser Gly Leu Asn Leu Cys Glu Pro Asn Asn Lys Glu 500 505 510 Gly Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Val Glu Lys Gly 515 520 525 Asp Val Ala Phe Val Lys His Gln Thr Val Pro Gln Asn Thr Gly Gly 530 535 540 Lys Asn Pro Asp Pro Trp Ala Lys Asn Leu Asn Glu Lys Asp Tyr Glu 545 550 555 560 Leu Leu Cys Leu Asp Gly Thr Arg Lys Pro Val Glu Glu Tyr Ala Asn 565 570 575 Cys His Leu Ala Arg Ala Pro Asn His Ala Val Val Thr Arg Lys Asp 580 585 590 Lys Glu Ala Cys Val His Lys Ile Leu Arg Gln Gln Gln His Leu Phe 595 600 605 Gly Ser Asn Val Thr Asp Cys Ser Gly Asn Phe Cys Leu Phe Arg Ser 610 615 620 Glu Thr Lys Asp Leu Leu Phe Arg Asp Asp Thr Val Cys Leu Ala Lys 625 630 635 640 Leu His Asp Arg Asn Thr Tyr Glu Lys Tyr Leu Gly Glu Glu Tyr Val 645 650 655 Lys Ala Val Gly Asn Leu Arg Lys Cys Ser Thr Ser Ser Leu Leu Glu 660 665 670 Ala Cys Thr Phe Arg Arg Pro 675 <210> 4 <211> 12 <212> PRT <213> Artificial sequence <220> <223> Neutrophil splice variant sequence <400> 4 Glu Asp Cys Ile Ala Leu Lys Gly Glu Ala Asp Ala 1 5 10 <210> 5 <211> 732 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Human MUCI <400> 5 acaggttctg gtcatgcaag ctctacccca ggtggagaaa aggagacttc ggctacccag 60 agaagttcag tgcccagctc tactgagaag aatgctgtga gtatgaccag cagcgtactc 120 tccagccaca gccccggttc aggctcctcc accactcagg gacaggatgt cactctggcc 180 ccggccacgg aaccagcttc aggttcagct gccacctggg gacaggatgt cacctcggtc 240 ccagtcacca ggccagccct gggctccacc accccgccag cccacgatgt cacctcagcc 300 ccggacaaca agccagcccc gggctccacc gcccccccag cccacggtgt cacctcggcc 360 ccggacaaca ggcccgcctt ggcgtccacc gcccctccag tccacaatgt cacctcggcc 420 tcaggctctg catcaggctc agcttctact ctggtgcaca acggcacctc tgccagggct 480 accacaaccc cagccagcaa gagcactcca ttctcaattc ccagccacca ctctgatact 540 cctaccaccc ttgccagcca tagcaccaag actgatgcca gtagcactca ccatagcacg 600 gtacctcctc tcacctcctc caatcacagc acttctcccc agttgtctac tggggtctct 660 ttctttttcc tgtcttttca catttcaaac ctccagttta attcctctct ggaagatccc 720 agcaccgact ac 732 <210> 6 <211> 744 <212> DNA <213> Artificial Sequence <220> <223> hMUCI with SpeI and HindIII sites <400> 6 actagtacag gttctggtca tgcaagctct accccaggtg gagaaaagga gacttcggct 60 acccagagaa gttcagtgcc cagctctact gagaagaatg ctgtgagtat gaccagcagc 120 gtactctcca gccacagccc cggttcaggc tcctccacca ctcagggaca ggatgtcact 180 ctggccccgg ccacggaacc agcttcaggt tcagctgcca cctggggaca ggatgtcacc 240 tcggtcccag tcaccaggcc agccctgggc tccaccaccc cgccagccca cgatgtcacc 300 tcagccccgg acaacaagcc agccccgggc tccaccgccc ccccagccca cggtgtcacc 360 tcggccccgg acaacaggcc cgccttggcg tccaccgccc ctccagtcca caatgtcacc 420 tcggcctcag gctctgcatc aggctcagct tctactctgg tgcacaacgg cacctctgcc 480 agggctacca caaccccagc cagcaagagc actccattct caattcccag ccaccactct 540 gatactccta ccacccttgc cagccatagc accaagactg atgccagtag cactcaccat 600 agcacggtac ctcctctcac ctcctccaat cacagcactt ctccccagtt gtctactggg 660 gtctctttct ttttcctgtc ttttcacatt tcaaacctcc agtttaattc ctctctggaa 720 gatcccagca ccgactacaa gctt 744 <210> 7 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 7 tactagtatc aagcttatct ctagataata at 32 <210> 8 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 8 agctattatt atctagagat aagcttgata ctagta 36 <210> 9 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 9 atcaagcttt ctggttctgc agtcgctaca tactctgttc cttctatctc gagtacttac 60 caaggtgctg ctaatatcaa ggttct 86 <210> 10 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 10 ttatctagat tattagaata caactggaag agcgagtagc aaccacataa agtttccaag 60 aaccttgata ttagcagcac 80 <210> 11 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 11 gtagtcggtg ctgggatctt ccagag 26 <210> 12 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 12 gctgctcctc acagtgctta cagttg 26 <210> 13 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 13 cgtactagta caggttctgg tcatgcaagc tc 32 <210> 14 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 14 tctaagcttg tagtcggtgc tgggatcttc c 31 <210> 15 <211> 40 <212> PRT <213> Saccharomyces cerevisiae <220> <221> MISC_FEATURE <223> Yeast YIR019C GPI anchor <400> 15 Ser Gly Ser Ala Val Ala Thr Tyr Ser Val Pro Ser Ile Ser Ser Thr 1 5 10 15 Tyr Gln Gly Ala Ala Asn Ile Lys Val Leu Gly Asn Phe Met Trp Leu 20 25 30 Leu Leu Ala Leu Pro Val Val Phe 35 40 <210> 16 <211> 2094 <212> DNA <213> Homo sapiens <220> <221> misc_feature <223> Modified transferrin <220> <221> misc_feature <223> Tf expression cassette <400> 16 atgaggctcg ccgtgggagc cctgctggtc tgcgccgtcc tggggctgtg tctggcggta 60 cctgataaaa ctgtgagatg gtgtgcagtg tcggagcatg aggccactaa gtgccagagt 120 ttccgcgacc atatgaaaag cgtcattcca tccgatggtc ccagtgttgc ttgtgtgaag 180 aaagcctcct accttgattg catcagggcc attgcggcaa acgaagcgga tgctgtgaca 240 ctggatgcag gtttggtgta tgatgcttac ctggctccca ataacctgaa gcctgtggtg 300 gcagagttct atgggtcaaa agaggatcca cagactttct attatgctgt tgctgtggtg 360 aagaaggata gtggcttcca gatgaaccag cttcgaggca agaagtcctg ccacacgggt 420 ctaggcaggt ccgctgggtg gaacatcccc ataggcttac tttactgtga cttacctgag 480 ccacgtaaac ctcttgagaa agcagtggcc aatttcttct cgggcagctg tgccccttgt 540 gcggatggga cggacttccc ccagctgtgt caactgtgtc cagggtgtgg ctgctccacc 600 cttaaccaat acttcggcta ctcgggagcc ttcaagtgtc tgaaggatgg tgctggggat 660 gtggcctttg tcaagcactc gactatattt gagaacttgg caaacaaggc tgacagggac 720 cagtatgagc tgctttgcct ggacaacacc cggaagccgg tagatgaata caaggactgc 780 cacttggccc aggtcccttc tcataccgtc gtggcccgaa gtatgggcgg caaggaggac 840 ttgatctggg agcttctcaa ccaggcccag gaacattttg gcaaagacaa atcaaaagaa 900 ttccaactat tcagctctcc tcatgggaag gacctgctgt ttaaggactc tgcccacggg 960 tttttaaaag tcccccccag gatggatgcc aagatgtacc tgggctatga gtatgtcact 1020 gccatccgga atctacggga aggcacatgc ccagaagccc caacagatga atgcaagcct 1080 gtgaagtggt gtgcgctgag ccaccacgag aggctcaagt gtgatgagtg gagtgttaac 1140 agtgtaggga aaatagagtg tgtatcagca gagaccaccg aagactgcat cgccaagatc 1200 atgaatggag aagctgatgc catgagcttg gatggagggt ttgtctacat agcgggcaag 1260 tgtggtctgg tgcctgtctt ggcagaaaac tacaataagg ctgataattg tgaggataca 1320 ccagaggcag ggtattttgc tgtagcagtg gtgaagaaat cagcttctga cctcacctgg 1380 gacaatctga aaggcaagaa gtcctgccat acggcagttg gcagaaccgc tggctggaac 1440 atccccatgg gcctgctcta caataagatc aaccactgca gatttgatga atttttcagt 1500 gaaggttgtg cccctgggtc taagaaagac tccagtctct gtaagctgtg tatgggctca 1560 ggcctaaacc tctgtgaacc caacaacaaa gagggatact acggctacac aggcgctttc 1620 aggtgtctgg ttgagaaggg agatgtggcc tttgtgaaac accagactgt cccacagaac 1680 actgggggaa aaaaccctga tccatgggct aagaatctga atgaaaaaga ctatgagttg 1740 ctgtgccttg atggtactag gaaacctgtg gaggagtatg cgaactgcca cctggccaga 1800 gccccgaatc acgctgtggt cacacggaaa gataaggaag catgcgtcca caagatatta 1860 cgtcaacagc agcacctatt tggaagcaac gtagctgact gctcgggcaa cttttgtttg 1920 ttccggtcgg aaaccaagga ccttctgttc agagatgaca cagtatgttt ggccaaactt 1980 catgacagaa acacatatga aaaatactta ggagaagaat atgtcaaggc tgttggtaac 2040 ctgagaaaat gctccacctc atcactcctg gaagcctgca ctttccgtcg acct 2094 <210> 17 <211> 5 <212> PRT <213> Unknown <220> <223> Spacer peptide <220> <221> REPEAT <222> (1)..(5) <223> Sequence may be repeated <400> 17 Gly Gly Gly Gly Ser 1 5 <210> 18 <211> 6 <212> PRT <213> Unknown <220> <223> Linker peptide <220> <221> REPEAT <222> (1)..(6) <223> May be repeated <400> 18 Pro Glu Ala Pro Thr Asp 1 5 <210> 19 <211> 88 <212> DNA <213> Artificial Sequence <220> <223> P1172 primer <220> <221> misc_feature <222> (20)..(64) <223> n is a, c, g, or t <400> 19 ccaactattc agctctcctn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 60 nnnncatggg aaggacctgc tgtttaag 88 <210> 20 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> P1173 primer <400> 20 aggagagctg aatagttgg 19 <210> 21 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> P1174 primer <400> 21 ctggatgcag gtttggtgta tg 22 <210> 22 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> P1227 primer <400> 22 tcatgatctt ggcgatgcag tc 22 <210> 23 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Flag-tag sequence <400> 23 Asp Tyr Lys Asp Asp Asp Asp Lys 1 5 <210> 24 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> PCR primer for yeast gene AGA1 <400> 24 cagatctaga acaaccgcta tcagctcatt atcc 34 <210> 25 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> PCR primer for yeast gene AGA1 <400> 25 cagaaagctt agtagtggaa acttctgtag tg 32 <210> 26 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> Modified huMDP GPI sequence <220> <221> misc_feature <222> (1)..(1) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (3)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (7)..(8) <223> Xaa can be any naturally occurring amino acid <400> 26 Xaa Gln Xaa Gly Gly Ser Xaa Xaa Thr Ile Gly Gly Tyr Ser Gly Ala 1 5 10 15 Ala Ser Ser Leu Gln Arg Thr Ile Gly Leu Leu Leu Ala Ser Leu Ala 20 25 30 Pro Leu Val Leu Ala Ser Leu Leu 35 40 <210> 27 <211> 83 <212> DNA <213> Artificial Sequence <220> <223> P2035 primer <220> <221> misc_feature <222> (11)..(12) <223> n is a, c, g, or t <220> <221> misc_feature <222> (17)..(18) <223> n is a, c, g, or t <220> <221> misc_feature <222> (29)..(30) <223> n is a, c, g, or t <220> <221> misc_feature <222> (32)..(33) <223> n is a, c, g, or t <400> 27 ctacaagctt nnkcaannkg gtggttctnn knnkactatt ggtggttatt ctggtgctgc 60 ttcttccttg cagagaacta ttg 83 <210> 28 <211> 84 <212> DNA <213> Artificial Sequence <220> <223> P2036 primer <400> 28 gatgtctaga ttattataac aaagaagcta aaaccaatgg agctaaagaa gccaataaca 60 aaccaatagt tctctgcaag gaag 84 <210> 29 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> DNA sequence resulting from restriction enzyme digestion of anneal and extend reaction of oligos P2035 and P2036 <220> <221> misc_feature <222> (7)..(8) <223> n is a, c, g, or t <220> <221> misc_feature <222> (13)..(14) <223> n is a, c, g, or t <220> <221> misc_feature <222> (25)..(26) <223> n is a, c, g, or t <220> <221> misc_feature <222> (28)..(29) <223> n is a, c, g, or t <400> 29 aagcttnnkc aannkggtgg ttctnnknnk actattggtg gttattctgg tgctgcttct 60 tccttgcaga gaactattgg tttgttattg gcttctttag ctccattggt tttagcttct 120 ttgttataat aatctaga 138 <210> 30 <211> 42 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of DNA sequence that resulted from anneal and extend reaction of oligos P2035 and P2036 <220> <221> misc_feature <222> (3)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(5) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (9)..(10) <223> Xaa can be any naturally occurring amino acid <400> 30 Lys Leu Xaa Gln Xaa Gly Gly Ser Xaa Xaa Thr Ile Gly Gly Tyr Ser 1 5 10 15 Gly Ala Ala Ser Ser Leu Gln Arg Thr Ile Gly Leu Leu Leu Ala Ser 20 25 30 Leu Ala Pro Leu Val Leu Ala Ser Leu Leu 35 40 <210> 31 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Consensus GPI anchor sequence <220> <221> misc_feature <222> (1)..(2) <223> n is a, c, g, or t <220> <221> misc_feature <222> (7)..(8) <223> n is a, c, g, or t <220> <221> misc_feature <222> (19)..(20) <223> n is a, c, g, or t <220> <221> misc_feature <222> (22)..(23) <223> n is a, c, g, or t <400> 31 nnkcaannkg gtggttctnn knnk 24 <210> 32 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 23 GPI anchor sequence <400> 32 tgtcaatagg gtggttctag gcct 24 <210> 33 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 8 GPI anchor sequence <400> 33 tgtcaaattg gtggttctta gtgt 24 <210> 34 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Clone 8 GPI anchor sequence <400> 34 Cys Gln Ile Gly Gly Ser 1 5 <210> 35 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 15 GPI anchor sequence <400> 35 cagcaatatg gtggttctgt ggat 24 <210> 36 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Clone 15 GPI anchor sequence <400> 36 Glu Gln Tyr Gly Gly Ser Val Asp 1 5 <210> 37 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 14 GPI anchor sequence <400> 37 tctcaagttg gtggttctac ttgg 24 <210> 38 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Clone 14 GPI anchor sequence <400> 38 Ser Gln Val Gly Gly Ser Thr Trp 1 5 <210> 39 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 5 GPI anchor sequence <220> <221> misc_feature <222> (1)..(2) <223> n is a, c, g, or t <220> <221> misc_feature <222> (7)..(8) <223> n is a, c, g, or t <220> <221> misc_feature <222> (19)..(20) <223> n is a, c, g, or t <220> <221> misc_feature <222> (22)..(23) <223> n is a, c, g, or t <400> 39 nnkcaannkg gtggttctnn knnk 24 <210> 40 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 2 GPI anchor sequence <400> 40 catcaaggtg gtggttctat tcgg 24 <210> 41 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Clone 2 GPI anchor sequence <400> 41 His Gln Gly Gly Gly Ser Ile Arg 1 5 <210> 42 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 6 GPI anchor sequence <220> <221> misc_feature <222> (1)..(2) <223> n is a, c, g, or t <220> <221> misc_feature <222> (7)..(8) <223> n is a, c, g, or t <220> <221> misc_feature <222> (19)..(20) <223> n is a, c, g, or t <220> <221> misc_feature <222> (22)..(23) <223> n is a, c, g, or t <400> 42 nnkcaannkg gtggttctnn knnk 24 <210> 43 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 12 GPI anchor sequence <400> 43 catcaattgg gtggttctgt tacg 24 <210> 44 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Clone 12 GPI anchor sequence <400> 44 His Gln Leu Gly Gly Ser Val Thr 1 5 <210> 45 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 18 GPI anchor sequence <400> 45 tatcaatcgg gtggttctgg gact 24 <210> 46 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Clone 18 GPI anchor sequence <400> 46 Tyr Gln Ser Gly Gly Ser Gly Thr 1 5 <210> 47 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 13 GPI anchor sequence <400> 47 gggcaatatg gtggttctta gtgg 24 <210> 48 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Clone 13 GPI anchor sequence <400> 48 Gly Gln Tyr Gly Gly Ser 1 5 <210> 49 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 1 GPI anchor sequence <400> 49 gtgcaagcgg gtggttctga ttag 24 <210> 50 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Clone 1 GPI anchor sequence <400> 50 Val Gln Ala Gly Gly Ser Asp 1 5 <210> 51 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 4 GPI anchor sequence <400> 51 tagcaaatgg gtggttctac taag 24 <210> 52 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 21 GPI anchor sequence <400> 52 tagcaaacgg gtggttcttc ttat 24 <210> 53 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 3 GPI anchor sequence <400> 53 aagcaacggg gtggttctta gact 24 <210> 54 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Clone 3 GPI anchor sequence <400> 54 Lys Gln Pro Gly Gly Ser 1 5 <210> 55 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 7 GPI anchor sequence <400> 55 ctgcaatgtg gtggttctta gtgg 24 <210> 56 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Clone 7 GPI anchor sequence <400> 56 Leu Gln Lys Gly Gly Ser 1 5 <210> 57 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 16 GPI anchor sequence <400> 57 tagcaactgg gtggttcttt tggg 24 <210> 58 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 17 GPI anchor sequence <400> 58 tagcaatatg gtggttctgt tcta 24 <210> 59 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 19 GPI anchor sequence <400> 59 cttcaagtgg gtggttcttt gtag 24 <210> 60 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Clone 19 GPI anchor sequence <400> 60 Leu Gln Val Gly Gly Ser Leu 1 5 <210> 61 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 24 GPI anchor sequence <400> 61 tagcaatttg gtggttctca tgcg 24 <210> 62 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 9 GPI anchor sequence <400> 62 cggcaacggg gtggttctaa gtgg 24 <210> 63 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Clone 9 GPI anchor sequence <400> 63 Arg Gln Arg Gly Gly Ser Lys Trp 1 5 <210> 64 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Clone 20 GPI anchor sequence <400> 64 tcgcaaactg gtggttctgt tgct 24 <210> 65 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Clone 20 GPI anchor sequence <400> 65 Ser Gln Thr Gly Gly Ser Val Ala 1 5 <210> 66 <211> 2215 <212> DNA <213> Homo sapiens <220> <221> sig_peptide <222> (40)..(93) <220> <221> CDS <222> (40)..(1866) <220> <221> mat_peptide <222> (112)..(1866) <400> 66 agcttttctc ttctgtcaac cccacacgcc tttggcaca atg aag tgg gta acc 54 Met Lys Trp Val Thr -20 ttt att tcc ctt ctt ttt ctc ttt agc tcg gct tat tcc agg ggt gtg 102 Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala Tyr Ser Arg Gly Val -15 -10 -5 ttt cgt cga gat gca cac aag agt gag gtt gct cat cgg ttt aaa gat 150 Phe Arg Arg Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp -1 1 5 10 ttg gga gaa gaa aat ttc aaa gcc ttg gtg ttg att gcc ttt gct cag 198 Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln 15 20 25 tat ctt cag cag tgt cca ttt gaa gat cat gta aaa tta gtg aat gaa 246 Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu 30 35 40 45 gta act gaa ttt gca aaa aca tgt gtt gct gat gag tca gct gaa aat 294 Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn 50 55 60 tgt gac aaa tca ctt cat acc ctt ttt gga gac aaa tta tgc aca gtt 342 Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val 65 70 75 gca act ctt cgt gaa acc tat ggt gaa atg gct gac tgc tgt gca aaa 390 Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys 80 85 90 caa gaa cct gag aga aat gaa tgc ttc ttg caa cac aaa gat gac aac 438 Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn 95 100 105 cca aac ctc ccc cga ttg gtg aga cca gag gtt gat gtg atg tgc act 486 Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr 110 115 120 125 gct ttt cat gac aat gaa gag aca ttt ttg aaa aaa tac tta tat gaa 534 Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu 130 135 140 att gcc aga aga cat cct tac ttt tat gcc ccg gaa ctc ctt ttc ttt 582 Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe 145 150 155 gct aaa agg tat aaa gct gct ttt aca gaa tgt tgc caa gct gct gat 630 Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp 160 165 170 aaa gct gcc tgc ctg ttg cca aag ctc gat gaa ctt cgg gat gaa ggg 678 Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly 175 180 185 aag gct tcg tct gcc aaa cag aga ctc aag tgt gcc agt ctc caa aaa 726 Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys 190 195 200 205 ttt gga gaa aga gct ttc aaa gca tgg gca gta gct cgc ctg agc cag 774 Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln 210 215 220 aga ttt ccc aaa gct gag ttt gca gaa gtt tcc aag tta gtg aca gat 822 Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp 225 230 235 ctt acc aaa gtc cac acg gaa tgc tgc cat gga gat ctg ctt gaa tgt 870 Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys 240 245 250 gct gat gac agg gcg gac ctt gcc aag tat atc tgt gaa aat caa gat 918 Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp 255 260 265 tcg atc tcc agt aaa ctg aag gaa tgc tgt gaa aaa cct ctg ttg gaa 966 Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu 270 275 280 285 aaa tcc cac tgc att gcc gaa gtg gaa aat gat gag atg cct gct gac 1014 Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp 290 295 300 ttg cct tca tta gct gct gat ttt gtt gaa agt aag gat gtt tgc aaa 1062 Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys 305 310 315 aac tat gct gag gca aag gat gtc ttc ctg ggc atg ttt ttg tat gaa 1110 Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu 320 325 330 tat gca aga agg cat cct gat tac tct gtc gtg ctg ctg ctg aga ctt 1158 Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu 335 340 345 gcc aag aca tat gaa acc act cta gag aag tgc tgt gcc gct gca gat 1206 Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp 350 355 360 365 cct cat gaa tgc tat gcc aaa gtg ttc gat gaa ttt aaa cct ctt gtg 1254 Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val 370 375 380 gaa gag cct cag aat tta atc aaa caa aat tgt gag ctt ttt gag cag 1302 Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln 385 390 395 ctt gga gag tac aaa ttc cag aat gcg cta tta gtt cgt tac acc aag 1350 Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys 400 405 410 aaa gta ccc caa gtg tca act cca act ctt gta gag gtc tca aga aac 1398 Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn 415 420 425 cta gga aaa gtg ggc agc aaa tgt tgt aaa cat cct gaa gca aaa aga 1446 Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg 430 435 440 445 atg ccc tgt gca gaa gac tat cta tcc gtg gtc ctg aac cag tta tgt 1494 Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys 450 455 460 gtg ttg cat gag aaa acg cca gta agt gac aga gtc acc aaa tgc tgc 1542 Val Leu His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys 465 470 475 aca gaa tcc ttg gtg aac agg cga cca tgc ttt tca gct ctg gaa gtc 1590 Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val 480 485 490 gat gaa aca tac gtt ccc aaa gag ttt aat gct gaa aca ttc acc ttc 1638 Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe 495 500 505 cat gca gat ata tgc aca ctt tct gag aag gag aga caa atc aag aaa 1686 His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys 510 515 520 525 caa act gca ctt gtt gag ctc gtg aaa cac aag ccc aag gca aca aaa 1734 Gln Thr Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys 530 535 540 gag caa ctg aaa gct gtt atg gat gat ttc gca gct ttt gta gag aag 1782 Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys 545 550 555 tgc tgc aag gct gac gat aag gag acc tgc ttt gcc gag gag ggt aaa 1830 Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys 560 565 570 aaa ctt gtt gct gca agt caa gct gcc tta ggc tta taacatctac 1876 Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly Leu 575 580 585 atttaaaagc atctcagcct accatgagaa taagagaaag aaaatgaaga tcaaaagctt 1936 attcatctgt tttctttttc gttggtgtaa agccaacacc ctgtctaaaa aacataaatt 1996 tctttaatca ttttgcctct tttctctgtg cttcaattaa taaaaaatgg aaagaatcta 2056 atagagtggt acagcactgt tatttttcaa agatgtgttg ctatcctgaa aattctgtag 2116 gttctgtgga agttccagtg ttctctctta ttccacttcg gtagaggatt tctagtttct 2176 gtgggctaat taaataaatc actaatactc ttctaagtt 2215 <210> 67 <211> 609 <212> PRT <213> Homo sapiens <400> 67 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala -20 -15 -10 Tyr Ser Arg Gly Val Phe Arg Arg Asp Ala His Lys Ser Glu Val Ala -5 -1 1 5 His Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu 10 15 20 Ile Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val 25 30 35 40 Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp 45 50 55 Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp 60 65 70 Lys Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala 75 80 85 Asp Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln 90 95 100 His Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val 105 110 115 120 Asp Val Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys 125 130 135 Lys Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro 140 145 150 Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys 155 160 165 Cys Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu 170 175 180 Leu Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys 185 190 195 200 Ala Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val 205 210 215 Ala Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser 220 225 230 Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly 235 240 245 Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile 250 255 260 Cys Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu 265 270 275 280 Lys Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp 285 290 295 Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser 300 305 310 Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly 315 320 325 Met Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val 330 335 340 Leu Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys 345 350 355 360 Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu 365 370 375 Phe Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys 380 385 390 Glu Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu 395 400 405 Val Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val 410 415 420 Glu Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His 425 430 435 440 Pro Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val 445 450 455 Leu Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg 460 465 470 Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe 475 480 485 Ser Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala 490 495 500 Glu Thr Phe Thr Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu 505 510 515 520 Arg Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys 525 530 535 Pro Lys Ala Thr Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala 540 545 550 Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe 555 560 565 Ala Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly 570 575 580 Leu 585 <210> 68 <211> 1507 <212> DNA <213> Homo sapiens <400> 68 tctactagta ctcccagcta cactacctca atcaccacca ccgagacccc ctcacacagt 60 actcccagct acactacctc aatcaccacc accgagaccc catcacacag tactcccagc 120 ttcacttctt caatcaccac caccgagacc acatcccaca gtactcccag cttcacttct 180 tcaatcagga ccaccgagac cacatcctac agtactccca gcttcacttc ttcaaatacc 240 atcactgaga ccacctcaca cagtactccc agctacatta cctcaatcac caccaccgag 300 accccctcaa gcagtactcc cagcttcagt tcttcgatca ccaccactga gaccacatcc 360 cacagtactc ccggcttcac ttcttcaatc accaccactg agactacatc ccacagtact 420 cccagcttca cttcttcgat caccaccact gagaccacct cacatgatac tcccagcttc 480 acttcttcaa tcaccaccag tgagaccccc tcacacagta ctcccagctc cacttcttta 540 atcaccacca ccaagaccac ctcacacagt actcccagct tcacttcttc gatcaccacc 600 accgagacca cctcacacag tgctcgcagc ttcacttctt cgatcaccac caccgagacc 660 acctcacaca atactcggag cttcacttct tcgatcacca ccaccgagac caactctcac 720 agtactacca gcttcacttc ttcgatcacc accaccgaga ccacctcaca cagtactccc 780 agcttcagtt cttcaatcac caccactgag acccccttac acagtactcc tggcctacct 840 tcgtgggtca ccaccaccaa gaccacctca cacattactc ctggcctcac ttcttcaatc 900 accaccactg agactacctc acacagtact cccggcttca cttcttcaat caccaccact 960 gagaccacct cagagagtac tcccagcctc agttcttcaa ccatctactc cacagtcagc 1020 acatccacaa ctgccatcac ctcacatttt actacctcag agactgcggt gactcccaca 1080 cctgtaaccc catcttctct gagtacagac atcccgacca caagcctacg aactctcacc 1140 ccttcgtctg tgggcaccag cacttcattg actacaacca cagactttcc ctctataccc 1200 actgatatca gtaccttacc aactcgaaca cacatcattt catcttctcc ctccatccaa 1260 agtacagaaa cctcatccct tgtgggcacc acctctccca ccatgtccac tgtgagaatg 1320 accctcagaa ttactgagaa caccccaatc agttccttta gcacaagtat tgttgttata 1380 cctgaaaccc caacacagac ccctcctgta ctgacgtcag ccactgggac ccaaacatct 1440 cctgcaccta ctactgtcac ctttggaagt acggattcct ccacgtccac tcttcataag 1500 cttctct 1507 <210> 69 <211> 502 <212> PRT <213> Homo sapiens <400> 69 Ser Thr Ser Thr Pro Ser Tyr Thr Thr Ser Ile Thr Thr Thr Glu Thr 1 5 10 15 Pro Ser His Ser Thr Pro Ser Tyr Thr Thr Ser Ile Thr Thr Thr Glu 20 25 30 Thr Pro Ser His Ser Thr Pro Ser Phe Thr Ser Ser Ile Thr Thr Thr 35 40 45 Glu Thr Thr Ser His Ser Thr Pro Ser Phe Thr Ser Ser Ile Arg Thr 50 55 60 Thr Glu Thr Thr Ser Tyr Ser Thr Pro Ser Phe Thr Ser Ser Asn Thr 65 70 75 80 Ile Thr Glu Thr Thr Ser His Ser Thr Pro Ser Tyr Ile Thr Ser Ile 85 90 95 Thr Thr Thr Glu Thr Pro Ser Ser Ser Thr Pro Ser Phe Ser Ser Ser 100 105 110 Ile Thr Thr Thr Glu Thr Thr Ser His Ser Thr Pro Gly Phe Thr Ser 115 120 125 Ser Ile Thr Thr Thr Glu Thr Thr Ser His Ser Thr Pro Ser Phe Thr 130 135 140 Ser Ser Ile Thr Thr Thr Glu Thr Thr Ser His Asp Thr Pro Ser Phe 145 150 155 160 Thr Ser Ser Ile Thr Thr Ser Glu Thr Pro Ser His Ser Thr Pro Ser 165 170 175 Ser Thr Ser Leu Ile Thr Thr Thr Lys Thr Thr Ser His Ser Thr Pro 180 185 190 Ser Phe Thr Ser Ser Ile Thr Thr Thr Glu Thr Thr Ser His Ser Ala 195 200 205 Arg Ser Phe Thr Ser Ser Ile Thr Thr Thr Glu Thr Thr Ser His Asn 210 215 220 Thr Arg Ser Phe Thr Ser Ser Ile Thr Thr Thr Glu Thr Asn Ser His 225 230 235 240 Ser Thr Thr Ser Phe Thr Ser Ser Ile Thr Thr Thr Glu Thr Thr Ser 245 250 255 His Ser Thr Pro Ser Phe Ser Ser Ser Ile Thr Thr Thr Glu Thr Pro 260 265 270 Leu His Ser Thr Pro Gly Leu Pro Ser Trp Val Thr Thr Thr Lys Thr 275 280 285 Thr Ser His Ile Thr Pro Gly Leu Thr Ser Ser Ile Thr Thr Thr Glu 290 295 300 Thr Thr Ser His Ser Thr Pro Gly Phe Thr Ser Ser Ile Thr Thr Thr 305 310 315 320 Glu Thr Thr Ser Glu Ser Thr Pro Ser Leu Ser Ser Ser Thr Ile Tyr 325 330 335 Ser Thr Val Ser Thr Ser Thr Thr Ala Ile Thr Ser His Phe Thr Thr 340 345 350 Ser Glu Thr Ala Val Thr Pro Thr Pro Val Thr Pro Ser Ser Leu Ser 355 360 365 Thr Asp Ile Pro Thr Thr Ser Leu Arg Thr Leu Thr Pro Ser Ser Val 370 375 380 Gly Thr Ser Thr Ser Leu Thr Thr Thr Thr Asp Phe Pro Ser Ile Pro 385 390 395 400 Thr Asp Ile Ser Thr Leu Pro Thr Arg Thr His Ile Ile Ser Ser Ser 405 410 415 Pro Ser Ile Gln Ser Thr Glu Thr Ser Ser Leu Val Gly Thr Thr Ser 420 425 430 Pro Thr Met Ser Thr Val Arg Met Thr Leu Arg Ile Thr Glu Asn Thr 435 440 445 Pro Ile Ser Ser Phe Ser Thr Ser Ile Val Val Ile Pro Glu Thr Pro 450 455 460 Thr Gln Thr Pro Pro Val Leu Thr Ser Ala Thr Gly Thr Gln Thr Ser 465 470 475 480 Pro Ala Pro Thr Thr Val Thr Phe Gly Ser Thr Asp Ser Ser Thr Ser 485 490 495 Thr Leu His Lys Leu Leu 500 <210> 70 <211> 738 <212> DNA <213> Homo sapiens <400> 70 actagtacag gttctggtca tgcaagctct accccaggtg gagaaaagga gacttcggct 60 acccagagaa gttcagtgcc cagctctact gagaagaatg ctgtgagtat gaccagcagc 120 gtactctcca gccacagccc cggttcaggc tcctccacca ctcagggaca ggatgtcact 180 ctggccccgg ccacggaacc agcttcaggt tcagctgcca cctggggaca ggatgtcacc 240 tcggtcccag tcaccaggcc agccctgggc tccaccaccc cgccagccca cgatgtcacc 300 tcagccccgg acaacaagcc agccccgggc tccaccgccc ccccagccca cggtgtcacc 360 tcggccccgg acaacaggcc cgccttggcg tccaccgccc ctccagtcca caatgtcacc 420 tcggcctcag gctctgcatc aggctcagct tctactctgg tgcacaacgg cacctctgcc 480 agggctacca caaccccagc cagcaagagc actccattct caattcccag ccaccactct 540 gatactccta ccacccttgc cagccatagc accaagactg atgccagtag cactcaccat 600 agcacggtac ctcctctcac ctcctccaat cacagcactt ctccccagtt gtctactggg 660 gtctctttct ttttcctgtc ttttcacatt tcaaacctcc agtttaattc ctctctggaa 720 gatcccagca ccgactac 738 <210> 71 <211> 246 <212> PRT <213> Homo sapiens <400> 71 Thr Ser Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly Gly Glu Lys 1 5 10 15 Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser Thr Glu Lys 20 25 30 Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro Gly 35 40 45 Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro Ala 50 55 60 Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val Thr 65 70 75 80 Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser Thr Thr Pro Pro Ala 85 90 95 His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro Ala Pro Gly Ser Thr 100 105 110 Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Asn Arg Pro Ala 115 120 125 Leu Ala Ser Thr Ala Pro Pro Val His Asn Val Thr Ser Ala Ser Gly 130 135 140 Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala 145 150 155 160 Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro 165 170 175 Ser His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys 180 185 190 Thr Asp Ala Ser Ser Thr His His Ser Thr Val Pro Pro Leu Thr Ser 195 200 205 Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe 210 215 220 Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu 225 230 235 240 Asp Pro Ser Thr Asp Tyr 245 <210> 72 <211> 1632 <212> DNA <213> Saccharomyces sp. <400> 72 agaacaaccg ctatcagctc attatccgaa gtaggaacta caaccgtggt atcatccagc 60 gccattgaac catcaagtgc ctctataatc tcacctgtca cctctacact ttcgagtaca 120 acatcgtcca atccaactac tacctcccta agttcgacat ctacatctcc aagctctaca 180 tctacatctc caagctctac atctacctca tcaagttcga catctacctc atcaagttcg 240 acatctacct catcaagttc gacatctaca tctccaagtt cgacatccac atcttcaagt 300 ttgacatcca catcttcaag ttctacatct acatcccaaa gttctacatc tacctcatca 360 agttcgacat ctacatctcc aagctctaca tctacctcat caagttcaac atctacatct 420 ccaagttcta aatctacttc tgcaagctcc acttccactt cttcatattc aacatctaca 480 tccccaagtt tgacttcttc atctccaact ttggcttcca cttctccaag ttcaacatct 540 attagctcta cttttactga ttcaacttca tcccttggct cctctatagc atcttcatca 600 acgtctgtgt cattatacag cccatccaca cctgtttact ccgtcccttc gacttcgtca 660 aatgttgcaa ctccttctat gacttcttca actgttgaaa caactgttag ttcacaaagt 720 tcgtctgaat atatcaccaa atcctcaatt tctactacta tcccatcatt ttccatgtct 780 acatatttca ccactgttag tggagtcact acaatgtata cgacatggtg tccttatagc 840 tctgaatctg agactagcac attaaccagt atgcatgaaa cggttacaac agacgctaca 900 gtctgcactc acgagtcttg catgccctcg cagacaacaa gtttgattac atcttctata 960 aaaatgtcca ctaaaaacgt cgcaacttct gtaagcacct caacggttga atcctcatat 1020 gcatgctcca catgtgctga aacgtcacac tcgtattctt ccgtgcaaac agcttcatca 1080 agttctgtaa cacagcagac cacatccaca aagagttggg taagttcaat gacaacttcg 1140 gatgaagatt tcaataagca cgctaccggt aagtatcatg taacatcttc aggtacctca 1200 accatttcga ctagtgtaag tgaagccacg agtacatcaa gcattgactc agaatctcaa 1260 gaacaatcat cacacttatt atcgacatcg gtcctttcat cctcctcctt gtctgctaca 1320 ttatcctctg acagtactat tttgctattc agttctgtat catcactaag tgtcgaacag 1380 tcaccagtta ccacacttca aatttcttca acatcagaga ttttacaacc cacttcttcc 1440 acagctattg ctacaatatc tgcctctaca tcatcacttt ccgcaacatc tatctctaca 1500 ccatctacct ctgtggaatc gactattgaa tcttcatcat tgactccgac ggtatcttct 1560 attttcctct catcatcatc tgctccctct tctctacaaa catctgttac cactacagaa 1620 gtttccacta ct 1632 <210> 73 <211> 544 <212> PRT <213> Saccharomyces sp. <400> 73 Arg Thr Thr Ala Ile Ser Ser Leu Ser Glu Val Gly Thr Thr Thr Val 1 5 10 15 Val Ser Ser Ser Ala Ile Glu Pro Ser Ser Ala Ser Ile Ile Ser Pro 20 25 30 Val Thr Ser Thr Leu Ser Ser Thr Thr Ser Ser Asn Pro Thr Thr Thr 35 40 45 Ser Leu Ser Ser Thr Ser Thr Ser Pro Ser Ser Thr Ser Thr Ser Pro 50 55 60 Ser Ser Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Ser Ser Ser 65 70 75 80 Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Pro Ser Ser Thr Ser 85 90 95 Thr Ser Ser Ser Leu Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser 100 105 110 Gln Ser Ser Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Pro Ser 115 120 125 Ser Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Pro Ser Ser Lys 130 135 140 Ser Thr Ser Ala Ser Ser Thr Ser Thr Ser Ser Tyr Ser Thr Ser Thr 145 150 155 160 Ser Pro Ser Leu Thr Ser Ser Ser Pro Thr Leu Ala Ser Thr Ser Pro 165 170 175 Ser Ser Thr Ser Ile Ser Ser Thr Phe Thr Asp Ser Thr Ser Ser Leu 180 185 190 Gly Ser Ser Ile Ala Ser Ser Ser Thr Ser Val Ser Leu Tyr Ser Pro 195 200 205 Ser Thr Pro Val Tyr Ser Val Pro Ser Thr Ser Ser Asn Val Ala Thr 210 215 220 Pro Ser Met Thr Ser Ser Thr Val Glu Thr Thr Val Ser Ser Gln Ser 225 230 235 240 Ser Ser Glu Tyr Ile Thr Lys Ser Ser Ile Ser Thr Thr Ile Pro Ser 245 250 255 Phe Ser Met Ser Thr Tyr Phe Thr Thr Val Ser Gly Val Thr Thr Met 260 265 270 Tyr Thr Thr Trp Cys Pro Tyr Ser Ser Glu Ser Glu Thr Ser Thr Leu 275 280 285 Thr Ser Met His Glu Thr Val Thr Thr Asp Ala Thr Val Cys Thr His 290 295 300 Glu Ser Cys Met Pro Ser Gln Thr Thr Ser Leu Ile Thr Ser Ser Ile 305 310 315 320 Lys Met Ser Thr Lys Asn Val Ala Thr Ser Val Ser Thr Ser Thr Val 325 330 335 Glu Ser Ser Tyr Ala Cys Ser Thr Cys Ala Glu Thr Ser His Ser Tyr 340 345 350 Ser Ser Val Gln Thr Ala Ser Ser Ser Ser Val Thr Gln Gln Thr Thr 355 360 365 Ser Thr Lys Ser Trp Val Ser Ser Met Thr Thr Ser Asp Glu Asp Phe 370 375 380 Asn Lys His Ala Thr Gly Lys Tyr His Val Thr Ser Ser Gly Thr Ser 385 390 395 400 Thr Ile Ser Thr Ser Val Ser Glu Ala Thr Ser Thr Ser Ser Ile Asp 405 410 415 Ser Glu Ser Gln Glu Gln Ser Ser His Leu Leu Ser Thr Ser Val Leu 420 425 430 Ser Ser Ser Ser Leu Ser Ala Thr Leu Ser Ser Asp Ser Thr Ile Leu 435 440 445 Leu Phe Ser Ser Val Ser Ser Leu Ser Val Glu Gln Ser Pro Val Thr 450 455 460 Thr Leu Gln Ile Ser Ser Thr Ser Glu Ile Leu Gln Pro Thr Ser Ser 465 470 475 480 Thr Ala Ile Ala Thr Ile Ser Ala Ser Thr Ser Ser Leu Ser Ala Thr 485 490 495 Ser Ile Ser Thr Pro Ser Thr Ser Val Glu Ser Thr Ile Glu Ser Ser 500 505 510 Ser Leu Thr Pro Thr Val Ser Ser Ile Phe Leu Ser Ser Ser Ser Ala 515 520 525 Pro Ser Ser Leu Gln Thr Ser Val Thr Thr Thr Glu Val Ser Thr Thr 530 535 540 <210> 74 <211> 1629 <212> DNA <213> Saccharomyces sp. <400> 74 acaaccgcta tcagctcatt atccgaagta ggaactacaa ccgtggtatc atccagcgcc 60 attgaaccat caagtgcctc tataatctca cctgtcacct ctacactttc gagtacaaca 120 tcgtccaatc caactactac ctccctaagt tcgacatcta catctccaag ctctacatct 180 acatctccaa gctctacatc tacctcatca agttcgacat ctacctcatc aagttcgaca 240 tctacctcat caagttcgac atctacatct ccaagttcga catccacatc ttcaagtttg 300 acatccacat cttcaagttc tacatctaca tcccaaagtt ctacatctac ctcatcaagt 360 tcgacatcta catctccaag ctctacatct acctcatcaa gttcaacatc tacatctcca 420 agttctaaat ctacttctgc aagctccact tccacttctt catattcaac atctacatcc 480 ccaagtttga cttcttcatc tccaactttg gcttccactt ctccaagttc aacatctatt 540 agctctactt ttactgattc aacttcatcc cttggctcct ctatagcatc ttcatcaacg 600 tctgtgtcat tatacagccc atccacacct gtttactccg tcccttcgac ttcgtcaaat 660 gttgcaactc cttctatgac ttcttcaact gttgaaacaa ctgttagttc acaaagttcg 720 tctgaatata tcaccaaatc ctcaatttct actactatcc catcattttc catgtctaca 780 tatttcacca ctgttagtgg agtcactaca atgtatacga catggtgtcc ttatagctct 840 gaatctgaga ctagcacatt aaccagtatg catgaaacgg ttacaacaga cgctacagtc 900 tgcactcacg agtcttgcat gccctcgcag acaacaagtt tgattacatc ttctataaaa 960 atgtccacta aaaacgtcgc aacttctgta agcacctcaa cggttgaatc ctcatatgca 1020 tgctccacat gtgctgaaac gtcacactcg tattcttccg tgcaaacagc ttcatcaagt 1080 tctgtaacac agcagaccac atccacaaag agttgggtaa gttcaatgac aacttcggat 1140 gaagatttca ataagcacgc taccggtaag tatcatgtaa catcttcagg tacctcaacc 1200 atttcgacta gtgtaagtga agccacgagt acatcaagca ttgactcaga atctcaagaa 1260 caatcatcac acttattatc gacatcggtc ctttcatcct cctccttgtc tgctacatta 1320 tcctctgaca gtactatttt gctattcagt tctgtatcat cactaagtgt cgaacagtca 1380 ccagttacca cacttcaaat ttcttcaaca tcagagattt tacaacccac ttcttccaca 1440 gctattgcta caatatctgc ctctacatca tcactttccg caacatctat ctctacacca 1500 tctacctctg tggaatcgac tattgaatct tcatcattga ctccgacggt atcttctatt 1560 ttcctctcat catcatctgc tccctcttct ctacaaacat ctgttaccac tacagaagtt 1620 tccactact 1629 <210> 75 <211> 543 <212> PRT <213> Saccharomyces sp. <400> 75 Thr Thr Ala Ile Ser Ser Leu Ser Glu Val Gly Thr Thr Thr Val Val 1 5 10 15 Ser Ser Ser Ala Ile Glu Pro Ser Ser Ala Ser Ile Ile Ser Pro Val 20 25 30 Thr Ser Thr Leu Ser Ser Thr Thr Ser Ser Asn Pro Thr Thr Thr Ser 35 40 45 Leu Ser Ser Thr Ser Thr Ser Pro Ser Ser Thr Ser Thr Ser Pro Ser 50 55 60 Ser Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Ser Ser Ser Thr 65 70 75 80 Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Pro Ser Ser Thr Ser Thr 85 90 95 Ser Ser Ser Leu Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Gln 100 105 110 Ser Ser Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Pro Ser Ser 115 120 125 Thr Ser Thr Ser Ser Ser Ser Thr Ser Thr Ser Pro Ser Ser Lys Ser 130 135 140 Thr Ser Ala Ser Ser Thr Ser Thr Ser Ser Tyr Ser Thr Ser Thr Ser 145 150 155 160 Pro Ser Leu Thr Ser Ser Ser Pro Thr Leu Ala Ser Thr Ser Pro Ser 165 170 175 Ser Thr Ser Ile Ser Ser Thr Phe Thr Asp Ser Thr Ser Ser Leu Gly 180 185 190 Ser Ser Ile Ala Ser Ser Ser Thr Ser Val Ser Leu Tyr Ser Pro Ser 195 200 205 Thr Pro Val Tyr Ser Val Pro Ser Thr Ser Ser Asn Val Ala Thr Pro 210 215 220 Ser Met Thr Ser Ser Thr Val Glu Thr Thr Val Ser Ser Gln Ser Ser 225 230 235 240 Ser Glu Tyr Ile Thr Lys Ser Ser Ile Ser Thr Thr Ile Pro Ser Phe 245 250 255 Ser Met Ser Thr Tyr Phe Thr Thr Val Ser Gly Val Thr Thr Met Tyr 260 265 270 Thr Thr Trp Cys Pro Tyr Ser Ser Glu Ser Glu Thr Ser Thr Leu Thr 275 280 285 Ser Met His Glu Thr Val Thr Thr Asp Ala Thr Val Cys Thr His Glu 290 295 300 Ser Cys Met Pro Ser Gln Thr Thr Ser Leu Ile Thr Ser Ser Ile Lys 305 310 315 320 Met Ser Thr Lys Asn Val Ala Thr Ser Val Ser Thr Ser Thr Val Glu 325 330 335 Ser Ser Tyr Ala Cys Ser Thr Cys Ala Glu Thr Ser His Ser Tyr Ser 340 345 350 Ser Val Gln Thr Ala Ser Ser Ser Ser Val Thr Gln Gln Thr Thr Ser 355 360 365 Thr Lys Ser Trp Val Ser Ser Met Thr Thr Ser Asp Glu Asp Phe Asn 370 375 380 Lys His Ala Thr Gly Lys Tyr His Val Thr Ser Ser Gly Thr Ser Thr 385 390 395 400 Ile Ser Thr Ser Val Ser Glu Ala Thr Ser Thr Ser Ser Ile Asp Ser 405 410 415 Glu Ser Gln Glu Gln Ser Ser His Leu Leu Ser Thr Ser Val Leu Ser 420 425 430 Ser Ser Ser Leu Ser Ala Thr Leu Ser Ser Asp Ser Thr Ile Leu Leu 435 440 445 Phe Ser Ser Val Ser Ser Leu Ser Val Glu Gln Ser Pro Val Thr Thr 450 455 460 Leu Gln Ile Ser Ser Thr Ser Glu Ile Leu Gln Pro Thr Ser Ser Thr 465 470 475 480 Ala Ile Ala Thr Ile Ser Ala Ser Thr Ser Ser Leu Ser Ala Thr Ser 485 490 495 Ile Ser Thr Pro Ser Thr Ser Val Glu Ser Thr Ile Glu Ser Ser Ser 500 505 510 Leu Thr Pro Thr Val Ser Ser Ile Phe Leu Ser Ser Ser Ser Ala Pro 515 520 525 Ser Ser Leu Gln Thr Ser Val Thr Thr Thr Glu Val Ser Thr Thr 530 535 540 <210> 76 <211> 1506 <212> DNA <213> Artificial Sequence <220> <223> Modified human MUC3 gene <400> 76 tctactagta caccaagcta tactacatca attactagca ctgagacacc atctcattca 60 actccttcta gttcgacttc aattacaact acagagacac ccagtcacag caccccatct 120 tacactagct ctgtctccac atccgagact acatcacatt ctactccatc agaaacaagc 180 tccagtagaa caacagaaag cacctcttat agttcaccta gctccacttc atctaacaca 240 attactgaga caagctcaca ctccactcct agtactgcta cttctatttc ctcgaccgaa 300 acacctagtt caagtacacc atctgtatca tcgtccatta ctgttactga gagttcatct 360 catagcactc ctggagctac ttccactttg acatcgagtg aaacttctac ttggtcaaca 420 ccatctagca caagttctat tatgtcaagc tcctacactt cagctgacac tccatctgaa 480 acatcagttt atacttccag cgaaacccca tcgtcctcaa gcccaactag cacatctttg 540 atttctagtt cgaagtcaac atcgaccagt acaccttcgt ttacttcttc gattactagc 600 actgagacct cctcatattc tgctagttcc tatacacctt cagttagtag cacagcaagt 660 tctagcaaga acacaacgag ttccactgct tctataagca gtacagagac tgttagttca 720 tcgactagct ctgtctctag tactattcct tcttctcaat ccacaagtta ttctacacca 780 tcattctcca gttcggcaac aagcagtgtt actccattgc attcaacacc atctctacca 840 tcttgggtta ctacaagtaa gaccacatca catattacac caggtctgac ttcgtccatg 900 tcttcgagcg agacctatag ccatagtact ccaggtttta caagctctat tacttcgaca 960 gaatcgacaa gtgagtcaac tccatcattg tccagttcta caatttatag tactgtttca 1020 acatctacta cagctattac ttcacatttt acaacttctg agacagctgt tactccaaca 1080 ccagttacac cctctagctt gagtacagat atcccaacta caagtttgag aactttgact 1140 ccttcctctg ttggtacctc gacttccttg acaactacaa ctgactttcc atcaattcca 1200 acagacatta gcactttgcc aacaagaact catattattt caagctcacc atctattcaa 1260 tcaacagaga ctagcagttt ggttggtact acatctccaa ctatgtcaac agttagaatg 1320 actttgagaa ttacagagaa cactccaatt tcttcattca gtacttccat tgttgttatt 1380 ccagagacac caactcaaac accaccagtt ttgacttctg ctacaggtac tcaaacatca 1440 ccagctccaa ctacagttac ttttggttct actgactcat ctacatcaac tttgcataag 1500 cttttg 1506

Claims (118)

  1. (a) 트랜스페린(Tf) 부분(moiety) 및 (b) 인테그린(integrin) 결합 부분을 포함하는 융합 단백질.
  2. 제1항에 있어서,
    줄기(stalk) 부분을 추가로 포함하는 융합 단백질.
  3. 제1항 또는 제2항에 있어서,
    세포벽 결합 부재(member)를 추가로 포함하는 융합 단백질.
  4. 제2항에 있어서,
    Tf 부분이 줄기 부분에 직접 융합되어 있는, 융합 단백질.
  5. 제1항 내지 제3항 중 어느 한 항에 있어서,
    고착자(anchor) 부분을 추가로 포함하는 융합 단백질.
  6. 제1항에 있어서,
    Tf 부분이 Tf 단백질, 변경된 Tf 단백질 또는 이들의 단편인, 융합 단백질.
  7. 제6항에 있어서,
    Tf 단백질이 인간 Tf 단백질인, 융합 단백질.
  8. 제6항에 있어서,
    Tf 부분이 서열번호 3의 아미노산 서열을 포함하는, 융합 단백질.
  9. 제1항에 있어서,
    Tf 부분이 Tf 단백질의 N 도메인을 포함하는, 융합 단백질.
  10. 제1항에 있어서,
    Tf 부분이 Tf 단백질의 N 도메인으로 구성되어 있는, 융합 단백질.
  11. 제1항에 있어서,
    Tf 부분이 Tf 단백질의 N 도메인의 일부를 포함하는, 융합 단백질.
  12. 제1항에 있어서,
    Tf 부분이 Tf 단백질의 C 도메인을 포함하는, 융합 단백질.
  13. 제1항에 있어서,
    Tf 부분이 Tf 단백질의 C 도메인으로 구성되어 있는, 융합 단백질.
  14. 제1항에 있어서,
    Tf 부분이 Tf 단백질의 C 도메인의 일부를 포함하는, 융합 단백질.
  15. 제1항에 있어서,
    Tf 부분이 감소된 글리코실화를 나타내는, 융합 단백질.
  16. 제1항에 있어서,
    Tf 부분이 Tf 수용체에 대한 감소된 결합 친화성을 나타내도록 변경되어 있는, 융합 단백질.
  17. 제16항에 있어서,
    Tf 부분이 Tf 수용체에 결합하지 않는, 융합 단백질.
  18. 제1항에 있어서,
    Tf 부분이 철에 대한 감소된 결합 친화성을 나타내도록 변경되어 있는, 융합 단백질.
  19. 제18항에 있어서,
    Tf 부분이 철에 결합하지 않는, 융합 단백질.
  20. 제1항에 있어서,
    Tf 부분이 중탄산염에 대한 감소된 결합 친화성을 나타내도록 변경되어 있는, 융합 단백질.
  21. 제20항에 있어서,
    Tf 부분이 중탄산염에 결합하지 않는, 융합 단백질.
  22. 제1항에 있어서,
    Tf 부분이 글리코실화 부위, 철 결합 부위, 힌지(hinge) 부위, 중탄산염 결합 부위 및 수용체 결합 부위로 구성된 군으로부터 선택된 하나 이상의 부위에서 변경되어 있는, 융합 단백질.
  23. 제1항에 있어서,
    Tf 부분이 글리코실화를 방지하는 1개 이상의 돌연변이를 포함하는, 융합 단백질.
  24. 제23항에 있어서,
    돌연변이가 서열 N-X-S/T를 포함하는 N-결합된 글리코실화 부위 내에 존재하는, 융합 단백질.
  25. 제24항에 있어서,
    서열 N-X-S/T가 서열번호 3의 N413 또는 N611에 상응하는 아미노산에서 시작하는, 융합 단백질.
  26. 제25항에 있어서,
    N, X, S 또는 T가 프롤린으로 변경되어 있는, 융합 단백질.
  27. 제23항에 있어서,
    Tf 부분이 서열번호 3의 아미노산 S415 및 T613에서 돌연변이를 포함하는, 융합 단백질.
  28. 제23항에 있어서,
    Tf 부분이 서열번호 3의 아미노산 S415 또는 T613에서 돌연변이를 포함하는, 융합 단백질.
  29. 제1항에 있어서,
    Tf 부분이 글리코실화를 나타내지 않도록 변경되어 있는, 융합 단백질.
  30. 제1항에 있어서,
    인테그린 결합 부분이 Tf 부분의 N-말단 단부에 융합되어 있는, 융합 단백질.
  31. 제1항에 있어서,
    인테그린 결합 부분이 Tf 부분의 C-말단 단부에 융합되어 있는, 융합 단백질.
  32. 제1항에 있어서,
    인테그린 결합 부분이 Tf 부분 내에 삽입되어 있는, 융합 단백질.
  33. 제29항에 있어서,
    인테그린 결합 부분이 Tf(서열번호 3)의 289 또는 290 아미노산 위치 내에 삽입되어 있는, 융합 단백질.
  34. 제1항에 있어서,
    인테그린 결합 부분이 Tf 부분의 표면 노출된 루프 내에 삽입되어 있는, 융합 단백질.
  35. 제1항에 있어서,
    인테그린 결합 부분이 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상, 12개 이상, 13개 이상, 14개 이상, 15개 이상 또는 20개 이상의 아미노산으로 구성되어 있는, 융합 단백질.
  36. 제1항에 있어서,
    인테그린 결합 부분이 아미노산 서열 Arg-Gly-Asp(RGD)를 포함하는, 융합 단백질.
  37. 제1항에 있어서,
    인테그린 결합 부분이 아미노산 서열 CXXXRGDXXXC(이때, X는 임의의 아미노산임)를 포함하는, 융합 단백질.
  38. 제1항에 있어서,
    인테그린 결합 부분이 아미노산 서열 XXXRGDXXX(이때, X는 임의의 아미노산임)를 포함하는, 융합 단백질.
  39. 제36항에 있어서,
    인테그린 결합 부분이 아미노산 서열 RGD의 N-말단 및 C-말단에서 1개 이상의 무작위화된(randomized) 아미노산을 포함하는, 융합 단백질.
  40. 제36항에 있어서,
    인테그린 결합 부분이 아미노산 서열 RGD의 N-말단 또는 C-말단에서 1개 이상의 무작위화된 아미노산을 포함하는, 융합 단백질.
  41. 제1항에 있어서,
    Tf 부분 및 인테그린 결합 부분이 트랜스바디(transbody)를 포함하는, 융합 단백질.
  42. 제1항에 있어서,
    인테그린 결합 부분이 인테그린 αIIbβ3에 결합할 수 있는, 융합 단백질.
  43. 제1항에 있어서,
    인테그린 결합 부분이 α4 인테그린에 결합할 수 있는, 융합 단백질.
  44. 제1항에 있어서,
    인테그린 결합 부분이 혈소판 응집을 억제할 수 있는, 융합 단백질.
  45. 제2항에 있어서,
    Tf 부분이 줄기 부분의 N-말단 단부에 융합되어 있는, 융합 단백질.
  46. 제2항에 있어서,
    줄기 부분이 Tf 부분의 C-말단 단부에 융합되어 있는, 융합 단백질.
  47. 제2항에 있어서,
    줄기 부분이 고도로 글리코실화된 펩티드인, 융합 단백질.
  48. 제2항에 있어서,
    줄기 부분이 효모 AGA1 단백질 또는 이의 단편을 포함하는, 융합 단백질.
  49. 제2항에 있어서,
    줄기 부분이 뮤신(mucin) 도메인 또는 뮤신-유사 도메인을 포함하는, 융합 단백질.
  50. 제49항에 있어서,
    뮤신 도메인이 MUC1, MUC2, MUC3, MUC4, MUC5AC, MUC5B, MUC6, MUC7, MUC8, MUC9, MUC10, MUC11, MUC12, MUC13, MUC14, MUC15, MUC16, MUC17, MUC18, MUC19, MUC20 및 MUC21, 및 이들의 변이체, 유도체, 유사체 및 단편으로 구성된 군으로부터 선택된 1가지 이상의 단백질을 포함하는, 융합 단백질.
  51. 제2항에 있어서,
    줄기 부분이 인간 MUC1 단백질, 또는 이의 변이체 또는 단편을 포함하는, 융합 단백질.
  52. 제51항에 있어서,
    줄기 부분이 서열번호 5의 핵산에 의해 코딩되는, 융합 단백질.
  53. 제2항에 있어서,
    줄기 부분이 인간 MUC3 단백질, 또는 이의 변이체 또는 단편을 포함하는, 융합 단백질.
  54. 제2항에 있어서,
    줄기 부분이 Tf 부분과 숙주 세포 또는 기질 사이의 입체 장애를 감소시키는 작용을 하는, 융합 단백질.
  55. 제5항에 있어서,
    줄기 부분이 고착자 부분의 N-말단 단부에 융합되어 있는, 융합 단백질.
  56. 제5항에 있어서,
    고착자 부분이 줄기 부분의 C-말단 단부에 융합되어 있는, 융합 단백질.
  57. 제5항에 있어서,
    고착자 부분이 글리코실-포스파티딜-이노시톨(GPI), 또는 이의 유도체 또는 단편인, 융합 단백질.
  58. 제57항에 있어서,
    GPI가 효모 GPI 신호 서열 또는 이의 단편을 포함하는, 융합 단백질.
  59. 제58항에 있어서,
    효모 GPI 신호 서열이 서열번호 15를 포함하는, 융합 단백질.
  60. 제57항에 있어서,
    GPI가 포유동물 GPI 신호 서열 또는 이의 단편을 포함하는, 융합 단백질.
  61. 제5항에 있어서,
    고착자 부분이 변경된 GPI 신호 서열을 포함하는, 융합 단백질.
  62. 제61항에 있어서,
    변경된 GPI 신호 서열이 서열번호 26의 1 위치에서 시스테인 잔기를 포함하는, 융합 단백질.
  63. 제61항에 있어서,
    변경된 GPI 신호 서열이 서열번호 34의 처음 2개 아미노산, 서열번호 34, 서열번호 36 및 서열번호 38로 구성된 군으로부터 선택된 아미노산 서열인, 융합 단백질.
  64. 제3항에 있어서,
    세포벽 결합 부재가 세포벽에 공유결합되는, 융합 단백질.
  65. 제3항에 있어서,
    세포벽 결합 부재가 세포벽에 비-공유결합되는, 융합 단백질.
  66. 제3항에 있어서,
    세포벽 결합 부재가 줄기 부분인, 융합 단백질.
  67. 제3항에 있어서,
    세포벽 결합 부재가 고착자 부분인, 융합 단백질.
  68. 제67항에 있어서,
    고착자 부분이 경막(transmembrane) 도메인인, 융합 단백질.
  69. 제3항에 있어서,
    세포벽 결합 부재가 세포벽 내의 1가지 이상의 단백질과 이황화 결합을 형성할 수 있는 1개 이상의 자유 시스테인 잔기를 포함하는, 융합 단백질.
  70. 제3항에 있어서,
    세포벽 결합 부재가 세포벽의 β-글루칸과 교차-결합할 수 있는 줄기 부분의 1개 이상의 글리칸을 포함하는, 융합 단백질.
  71. (A) 알부민 부분 및 (b) 인테그린 결합 부분을 포함하는 융합 단백질.
  72. 제71항에 있어서,
    줄기 부분을 추가로 포함하는 융합 단백질.
  73. 제71항 또는 제72항에 있어서,
    세포벽 결합 부재를 추가로 포함하는 융합 단백질.
  74. 제71항에 있어서,
    알부민 부분이 알부민 단백질, 변경된 알부민 단백질 또는 이들의 단편인, 융합 단백질.
  75. 제73항에 있어서,
    알부민 단백질이 인간 알부민 단백질인, 융합 단백질.
  76. 제71항 내지 제74항 중 어느 한 항에 있어서,
    고착자 부분을 추가로 포함하는 융합 단백질.
  77. 제71항에 있어서,
    경막 도메인을 추가로 포함하는 융합 단백질.
  78. 제71항에 있어서,
    인테그린 결합 부분이 아미노산 서열 RGD를 포함하는, 융합 단백질.
  79. 제71항에 있어서,
    인테그린 결합 부분이 아미노산 서열 CXXXRGDXXXC(이때, X는 임의의 아미노산임)를 포함하는, 융합 단백질.
  80. 제71항에 있어서,
    인테그린 결합 부분이 아미노산 서열 XXXRGDXXX(이때, X는 임의의 아미노산임)를 포함하는, 융합 단백질.
  81. 제78항에 있어서,
    인테그린 결합 부분이 아미노산 서열 RGD의 N-말단 및 C-말단에서 1개 이상의 무작위화된 아미노산을 포함하는, 융합 단백질.
  82. 제78항에 있어서,
    인테그린 결합 부분이 아미노산 서열 RGD의 N-말단 또는 C-말단에서 1개 이상의 무 작위화된 아미노산을 포함하는, 융합 단백질.
  83. 제71항에 있어서,
    인테그린 결합 부분이 인테그린 αIIbβ3에 결합할 수 있는, 융합 단백질.
  84. 제71항에 있어서,
    인테그린 결합 부분이 혈소판 응집을 억제할 수 있는, 융합 단백질.
  85. 제1항 내지 제84항 중 어느 한 항의 융합 단백질을 코딩하는 핵산 분자.
  86. 제85항의 핵산 분자를 포함하는 숙주 세포.
  87. 제1항 내지 제84항 중 어느 한 항의 융합 단백질을 발현하는 숙주 세포.
  88. 제86항에 있어서,
    효모 세포인 숙주 세포.
  89. 제88항에 있어서,
    효모 세포가 사카로마이세스(Saccharomyces) 또는 피키아(Pichia)인, 숙주 세포.
  90. 제1항 또는 제71항의 융합 단백질을 복수개 포함하는 라이브러리.
  91. 제2항 또는 제72항의 융합 단백질을 복수개 포함하는 라이브러리.
  92. 인테그린 결합 서열을 포함하는 1개 이상의 제2 펩티드에 융합된 제1 Tf 펩티드를 각각 포함하는 복수개의 융합 단백질을 포함하는 라이브러리.
  93. 제92항에 있어서,
    인테그린 결합 서열이 아미노산 서열 RGD를 포함하는, 라이브러리.
  94. 제92항에 있어서,
    제2 펩티드가 아미노산 서열 CXXXRGDXXXC(이때, X는 임의의 아미노산임)를 포함하는, 라이브러리.
  95. 제92항에 있어서,
    제2 펩티드가 아미노산 서열 XXXRGDXXX(이때, X는 임의의 아미노산임)를 포함하는, 라이브러리.
  96. 제92항에 있어서,
    제2 펩티드가 아미노산 서열 RGD의 양 측면에서 1개 이상의 무작위화된 아미노산을 포함하는, 라이브러리.
  97. 제92항에 있어서,
    제2 펩티드가 아미노산 서열 RGD의 한 측면에서 1개 이상의 무작위화된 아미노산을 포함하는, 라이브러리.
  98. 제92항에 있어서,
    제1 Tf 펩티드 및 제2 펩티드가 트랜스바디를 포함하는, 라이브러리.
  99. 제92항에 있어서,
    인테그린 결합 서열이 인테그린 αIIbβ3에 결합할 수 있는, 라이브러리.
  100. 제92항에 있어서,
    인테그린 결합 서열이 혈소판 응집을 억제할 수 있는, 라이브러리.
  101. 제90항 내지 제92항 중 어느 한 항의 라이브러리를 물질에 노출시키는 단계, 및 1개 이상의 융합 단백질과 상기 물질의 결합을 검출하는 단계를 포함하는, 인테그린 결합 서열의 결합 활성을 스크리닝하는 방법.
  102. 제101항에 있어서,
    라이브러리가 효모 세포 내에서 발현되는, 방법.
  103. 제101항에 있어서,
    물질이 인테그린인, 방법.
  104. 복수개의 Tf 단백질을 포함하는 Tf 단백질의 라이브러리로서, 이때 Tf 단백질이 약 3개 이상의 무작위적으로 돌연변이된 아미노산 잔기를 각각 포함하고, 상기 약 3개 이상의 무작위적으로 돌연변이된 아미노산 잔기가 Tf의 한 표면 노출된 영역 내에 위치하는, 라이브러리.
  105. 제104항에 있어서,
    Tf 단백질이 약 4개 이상의 무작위적으로 돌연변이된 아미노산 잔기를 각각 포함하는, 라이브러리.
  106. 제104항에 있어서,
    Tf 단백질이 약 5개 이상의 무작위적으로 돌연변이된 아미노산 잔기를 각각 포함하는, 라이브러리.
  107. 제104항에 있어서,
    Tf 단백질이 약 6개 이상의 무작위적으로 돌연변이된 아미노산 잔기를 각각 포함하는, 라이브러리.
  108. 제104항에 있어서,
    3개 이상의 무작위적으로 돌연변이된 아미노산 잔기가 Y85, G86, S87, E89, D90, Q92, K276, D277, K280, Q283, S286, D297, S298, H207, S208, F211, E212, A215, N216 및 K217로 구성된 군으로부터 선택되는, 라이브러리.
  109. 제104항에 있어서,
    Tf의 한 표면 노출된 영역이 아미노산 잔기 약 85 내지 약 92, 아미노산 잔기 약 276 내지 약 298, 및 아미노산 잔기 약 207 내지 약 217로 영역들로 구성된 군으로부터 선택되는, 라이브러리.
  110. 제104항에 있어서,
    Tf 단백질이 줄기 부분에 각각 융합되어 있는. 라이브러리.
  111. (a) Tf 부분, (b) 줄기 부분 및 (c) 세포벽 결합 부재를 포함하는 융합 단백질.
  112. 제111항에 있어서,
    Tf 부분이 약 3개 이상의 돌연변이된 표면 노출된 아미노산 잔기를 포함하는, 융합 단백질.
  113. 제112항에 있어서,
    약 3개 이상의 돌연변이된 표면 노출된 아미노산 잔기가 Y85, G86, S87, E89, D90, Q92, K276, D277, K280, Q283, S286, D297, S298, H207, S208, F211, E212, A215, N216 및 K217로 구성된 군으로부터 선택되는, 융합 단백질.
  114. 제112항에 있어서,
    3개 이상의 돌연변이된 표면 노출된 아미노산 잔기가 아미노산 잔기 약 85 내지 약 92, 아미노산 잔기 약 276 내지 약 298, 및 아미노산 잔기 약 207 내지 약 217로 구성된 영역들로 구성된 군으로부터 선택된 Tf의 한 표면 노출된 영역 내에 위치하는, 융합 단백질.
  115. 제111항에 있어서,
    Tf 부분이 약 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 표면 노출된 아미노산 잔기를 포함하는, 융합 단백질.
  116. 제111항에 있어서,
    줄기 부분이 1개 이상의 무작위화된 돌연변이를 포함하는, 융합 단백질.
  117. 제111항에 있어서,
    줄기 부분이 MUC3 변이체를 포함하는, 융합 단백질.
  118. 제117항에 있어서,
    MUC3 변이체가 서열번호 76의 서열을 포함하는, 융합 단백질.
KR1020097014465A 2006-12-12 2007-12-07 트랜스페린 융합 단백질 라이브러리 KR20090098880A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US93495106P 2006-12-12 2006-12-12
US60/934,951 2006-12-12

Publications (1)

Publication Number Publication Date
KR20090098880A true KR20090098880A (ko) 2009-09-17

Family

ID=39362844

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097014465A KR20090098880A (ko) 2006-12-12 2007-12-07 트랜스페린 융합 단백질 라이브러리

Country Status (13)

Country Link
US (1) US8822639B2 (ko)
EP (2) EP2479189B1 (ko)
JP (1) JP5492563B2 (ko)
KR (1) KR20090098880A (ko)
CN (1) CN101622274A (ko)
AU (1) AU2007331195A1 (ko)
CA (1) CA2673085C (ko)
ES (1) ES2535358T3 (ko)
IL (1) IL198815A0 (ko)
MX (1) MX2009006398A (ko)
NO (1) NO20092591L (ko)
WO (1) WO2008072075A2 (ko)
ZA (1) ZA200904757B (ko)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8401798B2 (en) * 2008-06-06 2013-03-19 Dna Twopointo, Inc. Systems and methods for constructing frequency lookup tables for expression systems
EP3252068A3 (en) 2009-10-12 2018-03-14 Larry J. Smith Methods and compositions for modulating gene expression using oligonucleotide based drugs administered in vivo or in vitro
CN102258767B (zh) * 2010-05-24 2013-05-15 黄敏铨 促进伤口愈合的组合物
WO2012057934A1 (en) * 2010-10-26 2012-05-03 The Rockefeller University Immunogenic agents
KR101615161B1 (ko) * 2011-02-02 2016-04-25 메디포스트(주) 신경질환의 예방 또는 치료를 위한 icam-1의 용도
US9623117B2 (en) * 2011-04-04 2017-04-18 Wisconsin Alumni Research Foundation Method for selective targeting and entry of bacterial toxins to cells
WO2013184938A2 (en) 2012-06-08 2013-12-12 Alkermes. Inc. Fusion polypeptides comprising mucin-domain polypeptide linkers
US11105802B2 (en) * 2012-12-10 2021-08-31 Seattle Children's Hospital Cell-free biofragment compositions and related systems, devices, and methods
JP7235436B2 (ja) * 2014-11-10 2023-03-08 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 細胞の表面上にポリペプチドを発現させるための組成物および方法
WO2017170418A1 (ja) * 2016-03-30 2017-10-05 株式会社カネカ エンドヌクレアーゼ活性を有するポリペプチド及びその製造方法
AU2017316955B2 (en) * 2016-08-25 2022-03-03 Jcr Pharmaceuticals Co., Ltd. Method for producing antibody fusion protein
JP2022515150A (ja) * 2018-12-21 2022-02-17 フエー・イー・ベー・フエー・ゼツト・ウエー サイトカイン及び足場タンパク質を含む融合タンパク質
CN113045670B (zh) * 2019-12-27 2022-11-01 华南农业大学 一种可溶性鸡α干扰素融合蛋白及其生产方法与应用
WO2023114912A2 (en) * 2021-12-16 2023-06-22 Thomas Jefferson University A therapeutic against crimean-congo hemorrhagic fever virus

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4599311A (en) 1982-08-13 1986-07-08 Kawasaki Glenn H Glycolytic promotersfor regulated protein expression: protease inhibitor
US4703004A (en) 1984-01-24 1987-10-27 Immunex Corporation Synthesis of protein with an identification peptide
US4782137A (en) 1984-01-24 1988-11-01 Immunex Corporation Synthesis of protein with an identification peptide, and hybrid polypeptide incorporating same
AU600885B2 (en) 1984-05-25 1990-08-30 Zymogenetics Inc. Stable DNA constructs
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5026651A (en) 1985-04-25 1991-06-25 Board Of Regents, The University Of Texas System Methods and compositions for the production of human transferrin
US5011912A (en) 1986-12-19 1991-04-30 Immunex Corporation Hybridoma and monoclonal antibody for use in an immunoaffinity purification system
US4851341A (en) 1986-12-19 1989-07-25 Immunex Corporation Immunoaffinity purification system
US6018026A (en) 1988-01-22 2000-01-25 Zymogenetics, Inc. Biologically active dimerized and multimerized polypeptide fusions
US6514936B1 (en) 1988-09-01 2003-02-04 Bayer Corporation Antiviral methods using human rhinovirus receptor (ICAM-1)
US5346989A (en) 1990-08-22 1994-09-13 Syntello Vaccine Development Kb Peptides for use in induction of T cell activation against HIV-1
US5347849A (en) 1990-08-30 1994-09-20 Tanknology Corporation International Water sensor that detects tank or vessel leakage
US5986067A (en) 1991-02-08 1999-11-16 The University Of Vermont And State Agricultural College Recombinant transferrins, transferrin half-molecules and mutants thereof
DE69226197T2 (de) 1991-11-08 1999-02-11 Somatogen Inc Hämoglobine als arzneimittelabgabesystem
JP4010560B2 (ja) 1992-07-20 2007-11-21 ドューク ユニバーシティー Hiv複製を阻害する化合物
US5547871A (en) 1993-01-25 1996-08-20 American Cyanamid Company Heterologous signal sequences for secretion of insect controlling proteins
AU6235294A (en) * 1993-02-02 1994-08-29 Scripps Research Institute, The Methods for producing polypeptide binding sites
AU6139794A (en) 1993-02-10 1994-08-29 Unilever Plc Immobilized proteins with specific binding capacities and their use in processes and products
WO1994017810A1 (en) 1993-02-12 1994-08-18 The Wistar Institute Of Anatomy And Biology Recombinant cytomegalovirus vaccine
EP0708658A4 (en) 1993-04-16 1997-05-21 Wistar Inst VACCINE CONTAINING A RECOMBINANT CYTOMEGALOVIRUS
US6479055B1 (en) 1993-06-07 2002-11-12 Trimeris, Inc. Methods for inhibition of membrane fusion-associated events, including respiratory syncytial virus transmission
US5464933A (en) 1993-06-07 1995-11-07 Duke University Synthetic peptide inhibitors of HIV transmission
US6017536A (en) 1993-06-07 2000-01-25 Trimeris, Inc. Simian immunodeficiency virus peptides with antifusogenic and antiviral activities
US5603933A (en) 1993-08-31 1997-02-18 Board Of Regents, The University Of Texas CD4 peptides for binding to viral envelope proteins
US5981478A (en) * 1993-11-24 1999-11-09 La Jolla Cancer Research Foundation Integrin-binding peptides
US5516637A (en) 1994-06-10 1996-05-14 Dade International Inc. Method involving display of protein binding pairs on the surface of bacterial pili and bacteriophage
US5843882A (en) 1995-04-27 1998-12-01 The United States Of America As Represented By The Department Of Health And Human Services Antiviral proteins and peptides
US5817789A (en) 1995-06-06 1998-10-06 Transkaryotic Therapies, Inc. Chimeric proteins for use in transport of a selected substance into cells
BR9609152A (pt) 1995-06-07 1999-05-04 Trimeris Inc Processo para tratamento de infecção por hiv em um individuo inibição da replicação do hiv e composição farmaceutica aceitavel util para o tratamento de infecção por hiv
US6696251B1 (en) 1996-05-31 2004-02-24 Board Of Trustees Of The University Of Illinois Yeast cell surface display of proteins and uses thereof
US6300065B1 (en) 1996-05-31 2001-10-09 Board Of Trustees Of The University Of Illinois Yeast cell surface display of proteins and uses thereof
US6699658B1 (en) 1996-05-31 2004-03-02 Board Of Trustees Of The University Of Illinois Yeast cell surface display of proteins and uses thereof
US6759243B2 (en) 1998-01-20 2004-07-06 Board Of Trustees Of The University Of Illinois High affinity TCR proteins and methods
US6258782B1 (en) 1998-05-20 2001-07-10 Trimeris, Inc. Hybrid polypeptides with enhanced pharmacokinetic properties
US6699677B1 (en) * 1999-12-20 2004-03-02 Chemocentryx, Inc. Tethered ligands and methods of use
US6623741B1 (en) 2000-02-29 2003-09-23 Trimeris, Inc. Methods and compositions for inhibition of membrane fusion-associated events including RSV transmission
JP2003530838A (ja) 2000-04-12 2003-10-21 ヒューマン ゲノム サイエンシズ インコーポレイテッド アルブミン融合タンパク質
EP1427750B1 (en) 2001-08-30 2010-12-08 Biorexis Pharmaceutical Corporation Modified transferrin fusion proteins
WO2004019872A2 (en) 2002-08-30 2004-03-11 Biorexis Pharmaceutical Corporation Oral delivery of modified transferrin fusion proteins
US20070031440A1 (en) 2001-08-30 2007-02-08 Prior Christopher P Modified transferin-antibody fusion proteins
US20030226155A1 (en) 2001-08-30 2003-12-04 Biorexis Pharmaceutical Corporation Modified transferrin-antibody fusion proteins
US7176278B2 (en) 2001-08-30 2007-02-13 Biorexis Technology, Inc. Modified transferrin fusion proteins
ATE452650T1 (de) * 2002-08-30 2010-01-15 Biorexis Pharmaceutical Corp Transferrin-fusionsproteinbibliotheken
US20060130158A1 (en) 2002-08-30 2006-06-15 Turner Andrew J Modified transferrin fusion proteins comprising duplicate transferrin amino or carboxy terminal domains
US20060105387A1 (en) 2002-08-30 2006-05-18 Prior Christopher P Transferrin fusion proteins libraries
US20070060512A1 (en) 2003-03-04 2007-03-15 Homayoun Sadeghi Dipeptidyl-peptidase protected protein
EP1626981A4 (en) 2003-03-04 2006-11-22 Biorexis Pharmaceutical Corp PROTEINS PROTECTED AGAINST DIPEPTIDYLPEPTIDASE
US20060205037A1 (en) 2003-08-28 2006-09-14 Homayoun Sadeghi Modified transferrin fusion proteins
EP1663278A4 (en) 2003-08-28 2009-07-29 Biorexis Pharmaceutical Corp EPO MIMETIC PEPTIDES AND FUSION PROTEINS
WO2006049983A2 (en) * 2004-10-27 2006-05-11 Biorexis Pharmaceutical Corporation Peptide yy modified transferrin fusion proteins
WO2006096515A2 (en) 2005-03-04 2006-09-14 Biorexis Pharmaceutical Corporation Modified transferrin fusion proteins
US20090275481A1 (en) 2005-06-17 2009-11-05 Pfizer, Inc. Anchored Transferrin Fusion Protein Libraries
CA2658654A1 (en) 2006-07-24 2008-01-31 Biorexis Pharmaceutical Corporation Exendin fusion proteins

Also Published As

Publication number Publication date
NO20092591L (no) 2009-09-11
MX2009006398A (es) 2009-06-23
WO2008072075A3 (en) 2008-11-06
ES2535358T3 (es) 2015-05-08
EP2479189A1 (en) 2012-07-25
CN101622274A (zh) 2010-01-06
EP2479189B1 (en) 2015-02-25
JP5492563B2 (ja) 2014-05-14
CA2673085A1 (en) 2008-06-19
JP2010512160A (ja) 2010-04-22
IL198815A0 (en) 2011-08-01
EP2114999A2 (en) 2009-11-11
US8822639B2 (en) 2014-09-02
AU2007331195A1 (en) 2008-06-19
CA2673085C (en) 2013-10-15
WO2008072075A2 (en) 2008-06-19
US20110086768A1 (en) 2011-04-14
ZA200904757B (en) 2010-04-28

Similar Documents

Publication Publication Date Title
CA2673085C (en) Transferrin fusion protein libraries
Rich et al. Survey of the year 2001 commercial optical biosensor literature
EP3472208B9 (en) T cell receptors and uses thereof
EP1427750B1 (en) Modified transferrin fusion proteins
US20040101905A1 (en) Product
US9212231B2 (en) TRAIL R2-specific multimeric scaffolds
EP3327040B1 (en) Multimeric il-15 soluble fusion molecules and methods of making and using same
US20130011401A1 (en) Soluble proteins for use as therapeutics
AU2002323501A1 (en) Modified transferrin fusion proteins
US20090275481A1 (en) Anchored Transferrin Fusion Protein Libraries
US20060105387A1 (en) Transferrin fusion proteins libraries
US20220218752A1 (en) Lockr-mediated recruitment of car t cells
EP1539221B1 (en) Transferrin fusion protein libraries
ES2355488T3 (es) Proteína de fusión de tranferrina modificadas.
JP2021527047A (ja) 消化管系へのペイロード送達のための、btnl3/8を標的とする構築物
WO2011132939A2 (ko) Rtk에 특이적으로 결합하는 rtk-bpb
JPS61501607A (ja) T−細胞レセプタ−−抗原特異的ポリペプチド及びポリヌクレオチド

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application