KR100865602B1 - 스캐폴드 구조의 c-타입 렉틴 유사 도메인을 가지는단백질의 조합 라이브러리 - Google Patents

스캐폴드 구조의 c-타입 렉틴 유사 도메인을 가지는단백질의 조합 라이브러리 Download PDF

Info

Publication number
KR100865602B1
KR100865602B1 KR1020037007858A KR20037007858A KR100865602B1 KR 100865602 B1 KR100865602 B1 KR 100865602B1 KR 1020037007858 A KR1020037007858 A KR 1020037007858A KR 20037007858 A KR20037007858 A KR 20037007858A KR 100865602 B1 KR100865602 B1 KR 100865602B1
Authority
KR
South Korea
Prior art keywords
nucleic acid
ensemble
ala
amino acid
glu
Prior art date
Application number
KR1020037007858A
Other languages
English (en)
Other versions
KR20040018316A (ko
Inventor
마이클 에트제로드트
토르 라스 홀테트
닐스 조나스 헤일스코브 그라베르센
한스 크리티안 토게르젠
Original Assignee
아나포르, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아나포르, 인코포레이티드 filed Critical 아나포르, 인코포레이티드
Publication of KR20040018316A publication Critical patent/KR20040018316A/ko
Application granted granted Critical
Publication of KR100865602B1 publication Critical patent/KR100865602B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1044Preparation or screening of libraries displayed on scaffold proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4726Lectins
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/02Libraries contained in or displayed by microorganisms, e.g. bacteria or animal cells; Libraries contained in or displayed by vectors, e.g. plasmids; Libraries containing only microorganisms or vectors
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은 DTLD에서 리간드 결합 부위를 라이닝하는 내부 폴리펩타이드 루프 영역이 전체적으로 또는 부분적으로 무작위화된 폴리펩타이드 단편의 앙상블로 대체된 CTLD(C-타입 렉틴 유사 도메인: C-type Lectin-Like Domains)를 포함하는 신규한 군의 단백질 라이브러리에 관한 것이다. 테트라넥틴 CTLD를 본 발명의 바람직한 구체예를 위한 프레임워크로서 선택하고; 인간 및 뮤린 테트라넥틴 CTLD 라이브러리의 생성 및 조작에 유용한 다용도 파지미드 벡터를 본 발명의 일부로서 공개한다. 모노머 형태 뿐만 아니라 트리머 형태의 테트라넥틴 CTLD가 재조합 fd 파지 디스플레이 벡터에 의해 완전한 작용성 형태로 유전자 III 융합체로서 효과적으로 디스플레이된다. 신규한 리간드에 대하여 친화성을 가지는 CTLD 유도체는, 스크리닝 또는 선별에 의한 1회 또는 수회의 강화 후에 각 회의 강화된 서브집합체의 증폭을 이용하여 루프 영역이 무작위화된 CTLD를 디스플레이하는 벡터의 라이브러리로부터 용이하게 분리될 수 있다. 신규한 결합 특성을 가지는 CTLD를 함유하는 단백질 생성물이 모노머, 트리머, 또는 멀티머 형태로 예를 들어 시험관내 리폴딩으로 박테리아 발현에 의해 생성될 수 있는 효율은 재조합 항체 유도체와 비교하여 생성, 생산, 진단 또는 치료용으로 적용된 경우의 간단성, 비용, 및 효율의 관점에서 중요한 잇점을 제공한다.

Description

스캐폴드 구조의 C-타입 렉틴 유사 도메인을 가지는 단백질의 조합 라이브러리 {COMBINATORIAL LIBRARIES OF PROTEINS HAVING THE SCAFFOLD STRUCTURE OF C-TYPE LECTIN-LIKE DOMAINS}
기술분야
본 발명은, 탄수화물 인식 도메인(CRD)이 C-타입 렉틴 유사 도메인(CTLD)을 함유하는 단백질 군의 한 예임을 나타내는, 소위 C-타입 렉틴 유사 도메인(CTLD)을 함유하는 단백질로부터 유래된 리간드 결합 단백질 유닛의 무작위화된 라이브러리의 생성에 관한 시스템을 설명한다.
배경기술
C-타입 렉틴 유사 도메인(CTLD)은 많은 동물 종으로부터 분리된 많은 단백질에서 확인된 단백질 도메인 군이다(드릭카머(Drickamer)와 테일러(Taylor)(1993) 및 드릭카머(1999)에 의해 검토됨). 처음에, CTLD 도메인은 소위 C-타입 렉틴(칼슘-의존성 탄수화물 결합 단백질)에 공통적인 도메인으로서 확인되고, "탄수화물 인식 도메인"("CRD")라고 명명되었다. 보다 최근에는, 이러한 도메인이 많은 진핵세포 단백질 간에 공통되며, 이들 중 몇몇은 당 잔기에 결합하지 않아서 이러한 일반적인 도메인은 CTLD라고 명명되었다.
CTLD는 탄수화물, 지질, 단백질, 및 아이스를 포함하여 광범한 화합물을 결 합시키는 것으로 보고된 바 있다(참조: Aspberg et al., 1997, Bettler et al, 1992, Ewrat et al., 1998, Graversen et al., 1998, Mizumo et al., 1997., Sano et al., 1998, 및 Tormo et al., 1999). CTLD의 단지 한 복제물만이 일부 단백질에 존재하는 반면에, 다른 단백질은 CTLD의 2개 내지 수개 복제물을 함유한다. 생리적 작용 유닛에서, CTLD의 수의 다수성은 종종 더 큰 구조로 단일 복제물 단백질 프로모터를 회합함에 의해 달성된다.
CTLD는 약 120개 아미노산 잔기로 구성되고, 특징적으로 2개 또는 3개의 내부 사슬 이황화 결합을 함유한다. 상이한 단백질의 CTLD간의 아미노산 서열의 유사성이 상대적으로 낮은 데도 불구하고, 많은 CTLD의 3D-구조는 매우 보존적이고 구조적 다양성은 기본적으로 흔히 5개 이하의 루프로 정의되는, 소위 루프 영역에 국한되는 것으로 밝혀졌다. 몇몇 CTLD는 1개 또는 2개의 칼슘에 대한 결합 부위를 함유하고, 칼슘과 상호작용하는 측쇄의 대부분은 루프 영역에 위치한다.
3D 구조에 대한 정보를 수득할 수 있는 CTLD에 기초하여, 일반적인 CTLD는 구조적으로, β1, α1, α2, β2, β3, β4, β5순으로 연쇄적으로 존재하는 7개의 주요 2차 구조 구성요소(예를 들어, 5개의 β-가닥 및 2개의 α-나선)에 의해 특징화됨을 추측할 수 있다(도 1 및 이에 인용된 참고문헌). 3D 구조가 결정된 모든 CTLD에서, β-가닥은 하나는 β1 및 β5로 구성되고, 다른 하나는 β2, β3, 및 β4로 구성된 2개의 역방향의 β-시트로 배열되어 있다. 추가의 β-가닥, β0은 종종 서열에서 β1을 선행하고, 이 경우에 β1 및 β5-시트와 통합되는 추가의 가닥을 형성한다. 또한, 하나는 β1 및 β5을 연결하고(CI-CIV, 도 1), 다른 하나는 β3과 β4과 β5를 연결하는 폴리펩타이드 단편을 연결하는(CII-CIII, 도 1) 2개의 이황화 결합은 지금까지 특성이 규명된 모든 CTLD에서 일관되게 발견된다. CTLD 3D 구조에서, 이러한 보존된 2차 구조 구성요소는 많은 루프에 대한 밀집한 스캐폴드를 형성하고, 여기서 많은 루프는 코어로부터 돌출된 "루프 영역"이라고 한다. 이들 루프는 2개의 단편, 루프 단편 A, LSA 및 루프 단편 B, LSB로 구성된 CTLD의 1차 구조이다. LSA는 종종 규칙적인 2차 구조가 없고 4개 이하의 루프를 함유하는, β2 및 β3를 연결하는 긴 폴리펩타이드 단편을 나타낸다. LSB는 β가닥, β3 및 β4를 연결하는 폴리펩타이드 단편을 나타낸다. LSA의 잔기는 β4의 단일 잔기와 함께 테트라넥틴의 CTLD를 포함하여 몇몇 CTLD의 Ca2+- 및 리간드-결합 부위를 특정하는 것으로 보인다. 단일 또는 몇몇 잔기의 치환을 포함하여, 예를 들어 돌연변이 연구는 결합 특이성, Ca2+-예민도, 및/또는 친화성의 변화는 CTLD 도메인에 의해 조절될 수 있는 것으로 밝혀졌다(참조: Weis and Drickamer, 1996, Chiba et al., 1999, Graversen et al., 2000).
상기 언급한 바와 같이, CTLD간의 전체 서열 유사성은 단백질 과학 분야에서 일반적으로 사용되는 서열 정렬 방법 및 분석 기구를 사용하여 도 1에 도시된 구조-특징화된 CTLD의 군과 예상 CTLD 서열을 정렬(aligning)함에 의해 조사된 바와 같이 종종 제한된다. 이러한 정렬에서, 통상적으로 예상 CTLD의 잔기의 22 내지 30%가 하나 이상의 구조-특징화된 CTLD의 상응하는 잔기와 동일할 것이다. 도 1에 도시된 서열 정렬은 실질적인 3D 구조 데이터로부터 엄격하게 밝혀져서, 프레임워크의 상응한 구조 구성요소의 폴리펩타이드 단편이 또한 큰 서열 유사성을 보인다는 사실은 서열 정렬로부터 용이하게 추측될 수 있는 직접적인 서열 구조 신호를 제공한다.
정확한 3d 구조 정보를 아직 얻을 수 없는 CTLD 또한 새로운 군의 CTLD 라이브러리의 제작에 프레임워크로서 사용될 수 있다는 것이 암시된다. 정학한 3D 구조가 수득될 수 없는 CTLD에 기초하여 신규한 군의 CTLD 라이브러리의 제작을 위한 출발 물질을 제조하는데 관련된 특정 추가 단계는 하기와 같을 수 있다:
(1) 신규한 CTLD의 서열을 도 1에 도시된 서열과 정렬하는 단계; (2) 2개의 보존된 이황화 결합(도 1의 CI-CIV 및 CII-CIII)의 형성에 관련된 4개의 일반적인 시스테인 잔기의 정확한 정렬을 확인하기 위하여 정렬의 부수적인 조절에 대한 필요성을 관찰하여, 서열 정렬에 의해 안내된 바와 같이 프레임워크 구조 구성요소의 대략적인 위치를 할당하는 단계. 이들 단계의 주요한 목적은 β2-, β3-, 및 β4- 가닥에 상응하는 단편에 의해 서열에서 플랭킹된, 신규한 CTLD의 루프 영역의 서열 위치를 확인하는 것일 것이다. 이에 대한 추가의 안내를 제공하기 위하여, 29개의 공식 CTLD의 서열의 분석 결과를 CTLD β2- 및 β3-가닥의 부분으로 밝혀진, 통상적인 테트라펩타이드 서열 및 이들의 컨센서스 서열, 및 밝혀진 위치 및 서열 특징에 의한 β4-가닥의 정확한 위치의 형태로 도시하였다.
표 1: β1, β2, 및 β4 컨센서스 구성요소 분석
Figure 112003020953455-pct00001
참조: LSA, 루프 단편 A; LSB, 루프 단편 B.
서열 공급: Berglund and Petersen (1992) [TN, 테트라넥틴]; Bertrand et al. (1996) [LIT, 리쏘스타틴]; Mann et al.(2000) [MGL, 마우스 마크로파지 갈락토오스 렉틴, KUCR, 컵퍼 세포 수용체, NEU, 닭 뉴로칸, PLC, 펄루신, H1-ASR, 아시알로당단백질 수용체]; Mio et al. (1998) [CPCP, 연골 프로테오글리칸 코아 단백질, IGE-FCR, IgE Fc 수용체, PAP, 췌장염 관련 단백질, MMR, 마우스 마크로파지 수용체, NKG2, 천연 살생 그룹, SCGF, 줄기 세포 성장 호르몬]; Mizuno et al., (1997) [IX-A 및 B, 인자 IX/X 결합 단백질, MBP, 만노스 결합 단백질]; Ohtani et al. (1999) [BCON, 소 콘글루티닌, BCL43, 소 CL43, CL-L1, 콜레틴 간 1, SP-A, 께면활성 단백질 A, SP-D, 계면활성 단백질 D]; Poget et al. (1999) [ESL, e-셀레틴, TU14, 피막성 C-타입 렉틴]; Tormo et al. (1999) [CD94, CD94 NK 수용체 도메인, LY49A, LY49A NK 수용체 도메인]; Zhang et al. (2000) [CHL, 닭 간 렉틴, TCL-1, 연어 C-타입 렉틴, GP120, HIV gp 120-결합 c-타입 렉틴 DCIR, 수지상 세포 면역 수용체].
29개의 β2-가닥 중에서,
14개는 컨센서스 서열 WIGX에 해당하는 것으로 밝혀졌고(이 중 12개는 WIGL 서열, 1개는 WIGI 서열, 1개는 WIGV 서열이다);
3개는 컨센서스 서열 WLGX에 해당하는 것으로 밝혀졌고(이 중 1개는 WLGL 서열, 1개는 WLGV 서열, 1개는 WLGX 서열이다);
3개는 WMGL 서열인 것으로 밝혀졌고;
3개는 컨센서스 서열 YLXM에 해당하는 것으로 밝혀졌고(이 중 2개는 YLSM 서열, 1개는 YLGM 서열이다);
2개는 컨센서스 서열 WVGA에 해당하는 것으로 밝혀졌고(이 중 1개는 WLVG 서열, 1개는 WVGA 서열이다);
집합물 중 남은 4개의 β2-가닥의 서열은 각각 FLGI, FVGL, FIGV 및 FLSM 서열이다.
따라서, 4개 잔기 β2 컨센서스 서열("β2cseq")은 하기와 같이 특정될 수 있는 것으로 결론된다:
잔기 1: 방향족 잔기, 가장 바람직하게는 Trp, 덜 바람직하게는 Phe, 가장 덜 바람직하게는 Tyr이다.
잔기 2: 지방족 또는 비극성 잔기, 가장 바람직하게는 Ile, 덜 바람직하게는 Leu 또는 Met, 가장 덜 바람직하게는 Val이다.
잔기 3: 지방족 또는 친수성 잔기, 가장 바람직하게는 Gly, 가장 덜 바람직하게는 Ser이다.
잔기 4: 지방족 또는 비극성 잔기, 가장 바람직하게는 Leu, 덜 바람직하게는 Met, Val, 또는 Ile이다.
따라서, β2 컨센서스 서열은 하기와 같이 요약될 수 있다:
β2cseq: (W,Y,F)-(I,L,V,M)-(G,S)-(L,M,V,I),
여기서, 밑줄친 잔기는 이들 서열 위치에서 가장 일반적으로 발견되는 잔기이다.
분석된 모든 29개 β3-가닥은 모든 공지된 CTLD 서열에 대해 일반적인 CysII 잔기로 시작되고, 29개의 β3-가닥 중에서,
5개는 컨센서스 서열 CVXI에 해당하는 것으로 밝혀졌고(이 중에서 3개는 CVEI 서열이고, 1개는 CVTI 서열이고, 1개는 CVQI서열이다);
4개는 컨센서스 서열 CVXM에 해당하는 것으로 밝혀졌고(이 중에서 2개는 CVEM 서열이고, 1개는 CVVM 서열이고, 1개는 CVMM 서열이다);
6개는 컨센서스 서열 CVXL에 해당하는 것으로 밝혀졌고(이 중에서 2개는 CVVL 서열이고, 2개는 CVSL 서열이고, 1개는 CVHL 서열이고, 1개는 CVAL 서열이다);
3개는 컨센서스 서열 CAXL에 해당하는 것으로 밝혀졌고(이 중에서 2개는 CAVL 서열이고, 1개는 CASL 서열이다);
2개는 컨센서스 서열 CAXF에 해당하는 것으로 밝혀졌고(이 중에서 1개는 1 CAHF 서열이고, 1개는 CAEF 서열이다);
2개는 컨센서스 서열 CLXL에 해당하는 것으로 밝혀졌고(이 중에서 1개는 CLEL 서열이고, 1개는 CLGL 서열이다);
집합물 중 남은 7개의 β3-가닥의 서열은 각각 CVYF, CVAQ, ACHV, CAHI, CLEI, CIAY, 및 CMLL 서열이다.
따라서, 4개 잔기 β3 컨센서스 서열("β3cseq")는 하기와 같이 특정될 수 있는 것으로 결론된다:
잔기 1: CTLD의 일반적인 CysII 잔기인 Cys이다.
잔기 2: 지방족 또는 비극성 잔기, 가장 바람직하게는 Val, 덜 바람직하게는 Ala 또는 Leu, 가장 덜 바람직하게는 Ile 또는 Met이다.
잔기 3: 가장 일반적으로는 지방족 또는 하전된 잔기, 가장 바람직하게는 Glu이다.
잔기 4: 가장 일반적으로는 지방족, 비극성, 방향족 잔기, 가장 바람직하게는 Leu 또는 Ile, 덜 바람직하게는 Met 또는 Phe, 가장 덜 바람직하게는 Tyr 또는 Val이다.
따라서, β3 컨센서스 서열은 하기와 같이 요약될 수 있다:
β3cseq: (C)-(V,A,L,I,M)-(E,X)-(L,I,M,F,Y,V),
상기 식에서 밑줄친 잔기는 상기 서열 위치에서 가장 일반적으로 발견되는 잔기를 의미한다.
공지된 CTLD의 3D 구조(도 1)로부터, β4-가닥은 대분분 모든 공지된 CTLD의 일반적인 CysIII 잔기에 대하여 -6 내지 -2 위치에 일차 구조에 위치하는 5개의 잔기로 구성되고, 일부는 모든 공지된 CTLD의 일반적인 CysIII 잔기에 대하여 -5 내지 -2의 위치에 위치하는 4개의 잔기로 구성된다. CysIII에 대하여 -3 위치에 위치한 잔기는 이러한 부위를 하우징하는 CTLD의 위치 2의 칼륨 이온의 배위에 관련되고, 이는 27개는 이 위치에 Asp 잔기 또는 Asn 잔기를 가지는 반면에 2개의 CTLD는 이 위치에 Ser을 가지는 29개의 CTLD 서열의 관찰로부터 반영된다. 공지된 CTLD 3D 구 조로부터, CysIII 잔기에 대하여 -5 위치에 위치한 잔기는 CTLD 스캐폴드의 소수성 코아의 형성에 관여한다는 것을 알 수 있다. 이는 상기 위치에서 25개가 Trp 잔기를 가지고, 3개가 Leu 잔기를 가지고, 1개가 Ala 잔기를 가지는, 분석된 29개의 CTLD 서열의 관찰로부터 반영된다. 분석된 29개 CTLD 서열 중 18개는 -4 위치에서 Asn 잔기를 가진다. 또한, 29개의 β 가닥 단편 중 19개는 Gly 잔기에 의해 선행된다.
β4 가닥에서 일반적인 CysIII 잔기에 대하여 -5, -4, 및 -3 위치에 위치한 29개의 중앙 3개 잔기 모티브 중에서,
22개는 서열 WXD이고(18개는 WND, 2개는 WKD, 1개는 WFD, 1개는 WWD이다),
2개는 서열 WXN이고(1개는 WVN, 1개는 WSN이다),
남은 5개 모티브(WRS, LDD, LDN, LKS, 및 ALD)는 각각 분석에서 1번 나타냈다.
CTLD 도메인 군의 각 멤버는, 신규한 리간드 표적에 대해 친화성을 가지는 멤버가 스크리닝 또는 선별 방법을 사용하여 확인되고 분리될 수 있는 신규한 단백질 라이브러리의 제작에 대한 흥미있는 가능성을 제시한다는 것을 발견하였다. 이러한 라이브러리는, CTLD의 루프 영역이 부분적으로 또는 전부 하나 이상의 무작위화된 폴리펩타이드 단편으로 대체된 CTLD 프레임워크 구조를 조합함에 의해 제작될 수 있다.
스캐폴드로서 사용된 단백질이 테트라넥틴 또는 테트라넥틴의 CTLD 도메인인 이러한 한 시스템은, 적어도 테트라넥틴 프로모터의 트리머 복합체의 안정성이 매우 높기 때문에 특정 관심 대상인 시스템으로서 파악된다(참조: 국제 특허 출원 공개 번호 제 WO 98/56906 A2호).
테트라넥틴은 트리머 당단백질이고(참조: Holtet et al., 1997, Niesen et al., 1997), 이는 인간 혈장으로부터 분리되고 특정 조직에서 세포외 매트릭스에 존재하는 것으로 밝혀졌다. 테트라넥틴은 칼슘, 복합 다당류, 플라스미노겐, 피브리노겐/피브린, 및 아포리포단백질 (a)에 결합하는 것으로 공지되어 있다. 플라스미노겐 및 아포리포단백질 (a)와의 상호작용은 이들의 소위 크링글 4 단백질 도메인에 의해 매개된다. 이러한 상호작용은 칼슘 및 아미노산 라이신 유도체에 예민한 것으로 공지되어 있다(참조: Graversen et al., 1998).
인간 테트라넥틴 유전자는 특성이 규명되어 있고, 인간 및 뮤린(murine) 테트라넥틴 cDNA 클론 둘 모두가 분리되었다. 인간 및 뮤린 성숙 단백질 둘 모두는 181개 아미노산 잔기로 구성되어 있다(도 2). 전장 재조합 인간 테트라넥틴 및 분리된 테트라넥틴 CTLD의 3D-구조는 독립적으로 2개의 분리된 연구에서 결정되었다(참조: Nielsen et al., 1997, 및 Kastrup et al., 1998). 테트라넥틴은 2개 도메인 단백질이거나 예측컨데 3개 도메인 단백질이고, 예를 들어 폴리펩타이드 사슬의 주요부가 CTLD(아미노산 잔기 Gly53 내지 Val181)로 구성되는 반면에, 영역 Leu26 내지 Lys52가 호모트리머가 평행하게 감긴 코일의 형성을 통하여 단백질의 트리머화를 결정하는 알파 나선을 코딩한다. 폴리펩타이드 단편 Glu1 내지 Glu25는 복합 다당류(Lys6 내지 Lys15)에 대한 결합 잔기를 함유하고(참조: Lorentsen et al., 2000), 트리머 구조의 안정화에 기여하는 것으로 보인다(참조: Holtet et al., 1997). 루프 4에 편재된 2개의 아미노산 잔기 Lys148 내지 Glu150 및 Asp165(β4에 편재됨)은 플라스미노겐 크링글 4 결합을 위하여 결정적으로 중요하고, 잔기 Ile140(루프 3) 및 Lys166 내지 Arg176(β4)는 다소 중요한 것으로 보인다(참조: Graversen et al., 1998). (루프 4의) Thr149를 방향족 잔기로 치환하는 것은 테트라넥틴의 크링글 4의 친화성을 상당히 증가시키고, 플라스미노겐에 대한 친화성을 야생형 크링글 4의 테트라넥틴의 친화성에 상당하는 수준으로 증가시키는 것으로 보인다(참조: Graversen et al., 2000).
발명의 목적
본 발명의 목적은 높은 친화성과 특이성으로 대상 성분에 결합할 수 있는 결합 부위를 가지는 유용한 단백질 생성물의 생성을 위한 신규하고 실용적인 방법을 제공하는 것이다.
본 발명은, 상기 신규하고 유용한 단백질 생성물이 재조합 항체 분야에 일반적으로 사용되는 표준 조합 단백질 화학 방법을 적용하여 각 멤버가 CTLD의 코아 구조와 유사한, 본질적으로 공통인 코아 구조를 함유하는 단백질 모듈의 무작위화된 조합 라이브러리를 생성시킴으로써 유리하게 수득될 수 있게 하는 한 가지 방법을 기술하는 것이다.
천연 CTLD 간의 결합 부위 형태의 변이는 이들의 공통된 코아 구조가 많은 본질적으로 상이한 형태의 리간드 결합 부위를 수용할 수 있다는 것을 제시한다. 따라서, CTLD는 요망되는 결합 특성을 가지는 이러한 신규하고 유용한 단백질 생성물을 제작하기 위한 기초로서 작용하는데 특히 적합하다.
실질적인 적용의 관점에서, 신규한 인공 CTLD 단백질 생성물은 항체 생성물이 현재 특수 생화학 검정 시스템 또는 의학적 시험관내 또는 생체내 진단 검정 시스템 중의 중요 시약으로서 사용되거나, 치료용 조성물 중에서 활성 성분으로서 사용되고 있는 적용에서 사용될 수 있다.
시험관내 검정 시스템의 구성요소로서 사용되는 경우, 신규한 단백질 생성물내의 각각의 결합 부위가 단일의 구조적으로 자율적인 단백질 도메인 내에 함유되어 있으므로 인공 CTLD 단백질 생성물이 항체 유도체보다 바람직하다. CTLD 도메인은 단백질 분해에 내성이 있고, 리간드 결합 부위에 대한 접근성 및 안정성은 모두 CTLD의 N- 또는 C-말단에 다른 단백질 도메인이 부착됨에 의해 약화되지 않는다. 따라서, CTLD 결합 모듈은, 예를 들어 페록시다제, 포스파타아제, 또는 임의의 다른 시그날 매개 잔기와 같은 적절한 적절한 리포터 모듈 이외에 동일하거나 동일하지 않은 특이성을 가지는 다수의 CLTD를 함유하는 모듈 분자 어셈블리의 제작을 위한 빌딩 블록으로서 용이하게 사용될 수 있다.
생체내 진단 또는 치료 목적으로 사용하려는 조성물의 필수 구성요소로서 생체내에서 사용되는 경우, 인간 CTLD에 기초하여 제작된 인공 CTLD 단백질 생성물은 체내에 이미 존재하는 상응하는 천연 CTLD 단백질과 실질적으로 동일하여서 환자에서 최소의 면역학적 반응을 유발할 것으로 기대된다. 단일 CTLD는 가장 작은 작용성 항체 유도체인 단일 사슬 Fv 유도체의 질량의 대략 절반이고, 이러한 작은 크기는 보다 우수한 조직 투과성 및 분포성 뿐만 아니라 순환시의 더 짧은 반감기를 제공할 수 있기 때문에 일부 용도에서 유리할 수 있다. 예를 들어, 만노오스 결합 단백질과 같은 완전한 테트라넥틴 트리머 또는 추가로 멀티머화된 집합물에 상응하는, 다가 형태의 CTLD 단백질은 증가된 결합 능력 및 애비더티(avidity) 및 더 길어진 순환 반감기를 제공한다.
본 발명의 바람직한 구체예의 하나의 특정 잇점은 뮤린 및 인간 테트라넥틴에 의해 예시된 바와 같이 포유류 테트라넥틴은 본질적으로 동일한 구조라는 사실로부터 야기된다. 이러한 종간 보존성은, 예를 들어 뮤린 및 인간 테트라넥틴 유도체 간의 리간드 결합 특이성을 규정하는 폴리펩타이드 세그먼트의 직접적인 교환을 가능하게 한다는 점에서 매우 실용적인 중요성을 갖는다. 테트라넥틴 유도체 간의 종의 유전적 배경의 용이한 교환의 선택은 뮤린 항체 유도체의 "인간화(humanization)"를 달성하는데 있어서의 널리 공지된 복잡성과 매우 대조된다.
본 발명의 추가의 잇점은 하기와 같다:
추가의 재형성 없이 소규모 및 대규모로 세균에서 생성될 수 있는, 최종 단백질 생성물로 최초 선택된 단백질 유도체를 확실하게 전환시키기 위한 일반적이고 간단한 방법의 이용가능성(참조: 국제 특허 출원 공개번호 제 WO 94/18227 A2호).
간단하고 일반적인 수단에 의해 동일한 작용성 단백질 유닛에 몇몇 동일하거나 동일하지 않은 결합 부위를 포함시켜서 이작용성 또는 이종작용성 분자 어셈블리의 제작 또는 상호작용에 있어 애비더티에 의한 약한 친화성의 이용을 가능하게 하는 선택권(참조: 국제 특허 출원 공개번호 제 WO 98/56906 A2호).
CTLD의 하나 이상의 보존된 금속 결합 부위(들)을 가지는, 조합 라이브러리에서 이가 금속 이온(예를 들어 칼륨 이온)의 첨가 또는 제거에 의해 결합을 조절할 수 있는 가능성.
발명의 개요
본 발명은 루프 영역이 아미노산 치환, 결실, 삽입, 또는 이들의 조합에 의해 변경되지만 α-나선, β-가닥 및 연결 세그먼트가 C-타입 렉틴 유사 도메인(CTLD)의 스캐폴드 구조를 실질적으로 유지하는 정도로 보존되는 모델 CTLD의 변이체를 포함하는, 스캐폴드 구조의 C-타입 렉틴 유사 도메인을 가지는 단백질로서, 표 2에 나열된 C-타입 렉틴 유사 단백질 또는 C-타입 렉틴의 공지된 CTLD 루프 유도체가 아닌, 많은 신규하고 유용한 단백질을 제공한다.
표 2: 공지된 β2, β3, β4, LSA 및 LSB CTLD 유도체
표 2A: LSA 유도체 (β2 및 β3 컨센서스 구성요소은 밑줄로 표시됨)
Figure 112003020953455-pct00002
Figure 112003020953455-pct00003
Figure 112003020953455-pct00004
Figure 112003020953455-pct00005
표 2B: LSB 유도체 (β3 및 β4 컨센서스 구성요소는 밑줄로 표시)
Figure 112003020953455-pct00006
Figure 112003020953455-pct00007
표 2C: 다른 TN CTLD 유도체
Figure 112003020953455-pct00008
일반적으로 모델 CTLD는 하기 주요 2차 구조 구성요소에 의해 특징화되는, 도 1에 도시된 2차 구조 배열에 해당하는 3D 구조를 가지는 것으로 규정된다:
5개의 β-가닥 및 2개의 α-나선 (5개의 β-가닥 및 2개의 α-나선이 β1, α1, α2, β2, β3, β4 및 β5 순으로 연쇄적으로 존재하며, 여기서 β-가닥은 하나는 β1과 β5로 구성되고, 다른 하나는 β2, β3, 및 β4로 구성된 2개의 역방향의 β-시트로 배열됨);
2개 이상의 이황화물 다리 (2개 이상의 이황화 결합 중 하나는 α1과 β5를 연결하고, 다른 하나는 β3 및 β4와 β5를 연결하는 폴리펩타이드 세그먼트를 연결함); 및
루프 단편 A(LSA)와 루프 단편 B(LSB)의 2개의 폴리펩타이드 세그먼트로 구성된 루프 영역 (루프 단편 A(LSA)는 β2와 β3을 연결하고 통상적으로 15 내지 70개의 아미노산 잔기, 또는 덜 통상적으로는 5 내지 14개의 아미노산 잔기를 포함하며, 루프 단편 B(LSB)는 β3와 β4를 연결하고 통상적으로는 5 내지 12개의 아미노산 잔기, 또는 덜 통상적으로는 2 내지 4개의 아미노산 잔기를 포함함).
그러나, 정확한 3D 구조를 알 수 없는 CTLD가 또한, 모델 CTLD로서 사용될 수 있고, 이러한 CTLD는 22% 이상, 바람직하게는 25% 이상, 보다 바람직하게는 30% 이상의 아미노산 서열 동일성에 의해 표현되는 CTLD군의 이미 인식된 멤버와의 서열 유사성을 나타내고, 보존되는 2개의 이황화물 다리 토폴로지(즉, CysI, CysII, CysIII, 및 CysIV)를 확립하기 위해 필요한 시스테인 잔기를 함유함에 의해 규정된다. 루프 세그먼트 LSA 및 LSB로 구성되는 루프 영역 및 이의 플랭킹 β-가닥 구조 구성요소는 도 1에 도시된 CTLD의 집합체와의 서열 정렬의 검사에 의해 확인될 수 있고, 이는 이들 서열을, 보존된 CysIII 잔기에 대하여 통상적으로 -6 위치 내지 -2 위치, 덜 통상적으로 -5 위치 내지 -2 위치에 위치하는 β4 가닥 세그먼트 및 4개 잔기 컨센서스 서열인 β2cseq 및 β3cseq, 및 표 1에 설명되어 있고 상기 기술배경하에서 공제되는 -5 위치 내지 -3 위치의 특징적인 잔기와 비교함에 의해 제공된 추가의 연구로 β2- 및 β3-가닥의 서열 위치를 확인할 수 있게 한다.
동일한 고려사항이, 모델 CTLD에서 α-나선, β-가닥, 및 연결 세그먼트가 CTLD의 스캐폴드 구조가 실질적으로 유지되는 정도로 보존되는지 여부를 결정하기 위하여 적용된다.
모델 CTLD의 α-나선 및/또는 β-가닥, 및/또는 연결 세그먼트에서 10개 이하, 바람직하게는 4개 이하, 보다 바람직하게는 1개 또는 2개의 아미노산 잔기가 치환되거나, 결실되거나, 삽입되는 것이 바람직하다. 특히, CTLD의 스캐폴드 구조가 실질적으로 유지되면서 루프 영역의 일부 또는 전부의 절단 및 변경된 아미노산 서열의 삽입을 용이하게 하기 위해 하나 이상의 제한 엔도누클레아제를 위한 인식 부위의 도입의 결과로서 모델 CTLD의 β-가닥에 4개 이하의 잔기가 변경될 수 있다.
모델 CTLD가 테트라넥틴의 CTLD인 단백질이 특히 관심의 대상이다. CTLD가 모델 CTLD로서 사용될 수 있는 널리 공지된 테트라넥틴은 인간 테트라넥틴 및 뮤린 테트라넥틴이다. 따라서, 본 발명에 따른 단백질은 이러한 모델 CTLD의 변이체를 포함한다.
본 발명에 따른 단백질은 CTLD 변이체의 N-말단 및/또는 C-말단 연장부를 포함할 수 있고, 이러한 연장부는 예를 들어 이펙터, 효소, 추가의 결합 및/또는 멀티머화 작용기를 함유할 수 있다. 특히, 상기 연장부는 천연 C-타입 렉틴-유사 단백질 또는 C-타입 렉틴의 비-CTLD 부분 또는 작용성 막투과 도메인이 없는 이들의 "용해성" 변이체일 수 있다.
본 발명에 따른 단백질은 또한 CTLD 변이체를 포함하는 부분의 멀티머, 예를 들어 천연 테트라넥틴 트리머의 유도체일 수 있다.
바람직한 측면에서, 본 발명은 CTLD의 루프 영역 또는 루프 영역의 일부가 아미노산 서열 및/또는 아미노산 잔기의 수와 관련하여 무작위화되지만, α-나선 및 β-가닥이 CTLD의 스캐폴드 구조를 실질적으로 유지할 정도로 보존되는 모델 CTLD의 변이체를 포함하는, 스캐폴드 구조의 C-타입 렉틴 유사 도메인을 가지는 단백질의 조합 라이브러리를 제공한다.
이러한 조합 라이브러리를 구성하는 단백질은 본 발명에 따른 상기 단백질에 대해 정의된 모델 CTLD의 변이체를 포함하고, 변이체는 상기 단백질에 대해 기술된 변화를 포함할 수 있다.
특히, 본 발명에 따른 조합 라이브러리는 모델 CTLD가 테트라넥틴의 CTLD, 예를 들어 인간 테트라넥틴 또는 뮤린 테트라넥틴의 CTLD인 단백질로 구성될 수 있다.
본 발명에 따른 조합 라이브러리는 CTLD 변이체의 N-말단 및/또는 C-말단 연장부를 포함하는 단백질로 구성될 수 있고, 이러한 연장부는 예를 들어 이펙터, 효소, 추가의 결합 및/또는 멀티머화 작용기를 함유할 수 있다. 특히, 상기 연장부는 천연 C-타입 렉틴 유사 단백질 또는 C-타입 렉틴 또는 작용성 막투과 도메인이 없는 이들의 "용해성" 변이체의 비-CTLD 부분일 수 있다.
본 발명에 따른 조합 라이브러리는 또한 CTLD 변이체를 포함하는 잔기의 멀티머, 예를 들어 천연 테트라넥틴 트리머의 유도체인 단백질로 구성될 수 있다.
본 발명은 또한 CTLD의 α-나선 및/또는 β가닥 및/또는 연결 세그먼트에서 10개 이하, 바람직하게는 4개 이하, 보다 바람직하게는 1개 또는 2개의 아미노산 잔기가 치환되거나, 결실되거나, 삽입된 천연 테트라넥틴의 유도체 뿐만 아니라 이러한 유도체를 코딩하는 핵산을 제공한다. 특정 유도체는 서열 번호 02, 04, 09, 11, 13, 15, 29, 31, 36, 및 38로부터 나타나고, 특정 테트라넥틴 유도체를 코딩하는 뉴클레오티드 삽입체를 포함하는 핵산은 서열 번호 12, 14, 35, 및 37로부터 나타난다.
본 발명은 테트라넥틴 유도체를 코딩하는 핵산이 β2, β3, 또는 β4를 코딩하는 핵산 세그먼트에 속하는 임의의 뉴클레오타이드로부터 서열상 30개 이하의 뉴클레오타이드 업스트림 또는 다운스트림 위치에 또는 β2, β3, 또는 β4를 코딩하는 핵산 단편 내에 엔도누클레아제를 생성하도록 개질된, 본 발명에 따른 조합 라이브러리의 제조용으로 적합화된 테트라넥틴 유도체를 제작하는 방법을 포함한다.
본 발명은 또한 CTLD의 루프 영역을 코딩하는 핵산 서열의 일부 또는 모두를 무작위화함에 의해 관련 단백질을 코딩하는 뉴클레오타이드 서열의 라이브러리를 제조하기 위한 테트라넥틴 또는 CTLD의 스캐폴드 구조를 실질적으로 유지하는 이의 유도체를 코딩하는 누클레오티드 서열의 용도를 포함한다.
또한, 본 발명은 본 발명에 따른 단백질을 코딩하는 임의의 뉴클레오타이드 서열을 포함하는 핵산을 제공한다.
특히, 본 발명은 상기 핵산의 라이브러리를 집합적으로 구성하는 핵산 앙상블의 멤버가 디스플레이 시스템에서 발현될 수 있는 본 발명에 따른 조합 라이브러리의 단백질을 코딩하는 핵산 라이브러리를 제공하며, 이는 디스플레이된 발현 생성물의 특성을 나타내는 표현형을 디스플레이하는 물질과 이들의 상응하는 유전자형 사이의 논리적, 물리적 또는 화학적 연계를 제공한다.
이러한 라이브러리에서, 디스플레이 시스템은 하기로부터 선택될 수 있다:
(I) (1) 핵산 라이브러리가 (a) 파지미드 벡터, (b) 파지의 바이러스 게놈, (c) 정제된 단일 또는 이중 가닥 형태의 정제된 바이러스 핵산내로 삽입된 섬유상 파지 fd, 또는
(2) 라이브러리가 (a) 정제된 파지 람다 DNA, 또는 (b) 람다 파지 입자내의 핵산내로 삽입된 파지 람다와 같은 파지 디스플레이 시스템;
(II) 핵산의 라이브러리가 바큘로바이러스와 같은 진핵세포 바이러스의 바이러스 핵산내로 삽입된 바이러스 디스플레이 시스템;
(III) 핵산의 라이브러리가 숙주 게놈내로 통합될 수 있거나 세포내에서 유지되고 발현될 수 있으며 (a) 세균 세포, (b) 효모 세포 또는 (c) 포유동물 세포의 표면상에서의 세포-표면 디스플레이에 적합한 염색체외 요소내로 통합될 수 있는 핵산 담체내로 삽입되거나 이러한 담체에 결합되어 있는 세포 기재 디스플레이 시스템;
(IV) 핵산의 라이브러리가 삽입되어 있는 리보솜 결합 디스플레이에 적합한 핵산 물질; 또는
(V) 핵산의 라이브러리가 삽입되어 있는 플라스미드 결합 디스플레이에 적합한 플라스미드.
널리 공지되고 유용한 디스플레이 시스템은 애머샴 파마시아 바이오테크로부터 제공된 파지미드 벡터 "pCANTAB 5E"(코드 번호 27-9401-01)를 이용한 "재조합 파지 항체 시스템"이다.
또한, 본 발명은, 단백질이 스크리닝 또는 선택에 의해 하나 이상의 CTLD 라이브러리로부터 단리된 신규한 루프-영역 서열을 가지는 동일하거나 동일하지 않은 CTLD 도메인을 하나 이상 포함하는, 본 발명에 따른 단백질을 제조하는 방법을 제공한다. 하나 이상의 상기 CTLD 도메인은 돌연변이에 의해 추가로 개질될 수 있고, 하나 이상의 CTLD 도메인을 함유하는 단백질은 화학적 또는 효소적 커플링 또는 가교에 의해 2개 이상의 구성요소로부터 어셈블링될 수 있다.
또한, 본 발명은, 1) 모델 CTLD를 포함하는 단백질을 코딩하는 핵산을 적합한 벡터로 삽입하는 단계;
2) 필요한 경우, CTLD의 루프 영역 또는 이들의 부분을 코딩하는 서열의 말단의 서열 또는 이에 가까운 서열에 적절하게 위치하도록 제한 엔도누클레아제 인식 부위를 부위 특이적 돌연변이에 의해 도입하는 단계;
3) 적절한 제한 엔도누클레아제를 사용하여 루프 영역 또는 이들의 부분을 코딩하는 DNA 단편을 절단하는 단계;
4) 제한 처리된 벡터내로 DNA 단편의 혼합물을 라이게이션시키는 단계;
5) 벡터를 적합한 배지에서 CTLD의 스캐폴드 구조를 가지는 무작위화된 단백질을 발현하도록 유도하는 단계를 포함하여, 본 발명에 따른 조합 라이브러리를 제조하는 방법을 제공한다.
추가의 측면에서, 본 발명은, 1) 디스플레이 시스템에서 본 발명에 따른 핵산 라이브러리를 발현시켜서 단백질 라이브러리를 디스플레이하는 단계;
2) 디스플레이된 물질의 집합체를 표적 성분에 대해 친화성을 보이는 CTLD-유래물의 단리가 요망되는 적합하게 태깅된 표적 성분과 접촉시키는 단계;
3) 서브 라이브러리의 재증폭이 후속하는, 당분야에서 통상적으로 "친화성 패닝"으로 언급되는 방법인 친화성 정제, 또는 비히클로서 표적 성분이 컨쥬게이션되거나 물리적으로 결합되거나 부착되는 태그를 사용하는 친화성에 의한 선택적 추출에 의해서 표적 성분에 대해 친화성을 보이는 디스플레이된 물질의 서브집단을 회수하는 단계;
4) 적합하게 적은 수의 우수한 후보 결합체가 수득될 때까지 패닝 또는 재증폭을 반복함에 의해 점진적으로 보다 우수한 결합체를 단리하는 단계; 및
5) 요망되는 경우, 개별적인 클론으로서 우수한 후보 결합체 각각을 단리하고, 이를 하나 이상의 바람직한 생성물 클론의 최종 선택을 위한 준비로 통상적인 기능적 및 구조적 특성화를 수행하는 단계를 포함하여, 특이적 표적으로 결합하는 것에 대해 본 발명에 따른 조합 라이브러리를 스크리닝하는 방법을 제공한다.
다른 추가의 측면에서, 본 발명은, PCR 기법, 부위 특이적 돌연변이 또는 제한 효소 소화에 의해 상기 단백질을 코딩하는 핵산으로부터 루프 영역-치환 폴리펩타이드 및 임의의 필요한 프레임워크 변이를 코딩하는 핵산 단편을 절단하고, 상기 핵산 단편을 요망되는 대안적인 CTLD 프레임워크를 코딩하는 핵산 서열을 가지는 디스플레이 또는 단백질 발현 벡터의 적합한 위치(들)내로 삽입함으로써 본 발명에 따른 단백질 또는 본 발명에 따른 조합 라이브러리로부터 선택되고 요망되는 결합 특성을 보이는 CTLD 변이체를 함유하는 단백질을 요망되는 대안적인 종-양립가능한 프레임워크에서 재구성하는 방법
도면의 간단한 설명
도 1은 공지된 3D 구조의 10개의 CTLD의 아미노산 서열의 정렬을 도시한다. 주요 2차 구조 구성요소의 서열 위치는은 각 서열 위에 α-나선수 N을 의미하는 "αN" 및 β-가닥수 M을 의미하는 "βM"으로서 연속적인 수순으로 라벨링되어 기재되어 있다.
CTLD의 2개의 보존성 이황화물 다리의 형성에 관여하는 4개의 시스테인 잔기는 도면에 "CI", "CII", "CIII", 및 "CIV"로서 각각 표기되어 있다. 2개의 보존성 이황화물 다리는 각각 CI-CIV 및 CII-CIII이다.
10개의 C 타입 렉틴은 하기와 같다:
hTN: 인간 테트라넥틴 (Nielsen et al., 1997);
MBP: 만노오스 결합 단백질 (Weis et al., 1991; Sheriff et al., 1994);
SP-D: 표면 활성 단백질 D (Hakansson et al., 1999);
LY49A: NK 수용체 LY49A (Tormo et al., 1999);
H1-ASR: 아시알로당단백질 수용체의 H1 수용체 (Meier et al., 2000);
MMR-4: 마크로파지 만노스 수용체 도메인 4 (Feinberg et al., 2000);
IX-A 및 IX-B: 각각 응고 인자 IX/X-결합 단백질 도메인 A 및 B (Mizuno et al., 1997);
Lit: 리토스타틴 (Bertrand et al., 1996);
TU14: 피막성(tunicate) C-타입 렉틴 (Poget et al., 1999).
도 2는 공지된 2차 구조 구성요소가 표시된 인간 및 뮤린 테트라넥틴의 성숙 형태의 코딩 영역의 뉴클레오타이드 및 아미노산 서열의 정렬을 도시한다.
hTN: 인간 테트라넥틴; 뉴클레오타이드 서열 (Berglund and Petersen, 1992).
mTN: 뮤린 테트라넥틴; 뉴클레오타이드 서열 (Sorensen et al., 1995).
2차 구조 구성요소 (Nielsen et al., 1997). "α"는 α-나선을 의미하고, "β"는 β-가닥을 의미하고, "L"은 루프를 의미한다.
도 3은 인간 및 뮤린 tlec 코딩 영역의 뉴클레오타이드 및 아미노산 서열의 정렬을 도시한다. htlec: hTN으로부터 유래된 서열; mtlec: mTN으로부터 유래된 서열. Bgl II, Kpn I, 및 Mun I에 대한 제한 엔도누클레아제의 위치가 표기되어 있다.
도 4는 인간 및 뮤린 tCTLD 코딩 영역의 뉴클레오타이드 및 아미노산 서열의 정렬을 도시한다. htCTLD: hTN으로부터 유래된 서열; mtCTLD: mTN으로부터 유래된 서열. Bgl II, Kpn I, 및 Mun I에 대한 제한 엔도누클레아제의 위치가 표기되어 있다.
도 5는 pT7H6FX-htlec 발현 플라스미드의 개략도이다. FX-htlec 단편은 Bam HI 및 Hind III 클로닝 부위 사이에서 pT7H6(Christensen et al., 1991)으로 삽입되었다.
도 6은 pT7H6FX-htlec에 의해 생성된 H6FX-htlec 융합 단백질의 FX-htlec 부분의 아미노산 서열(단일 문자 코드)를 도시한다.
도 7은 pT7H6FX-htCTLD 발현 플라스미드의 개략도이다. FX-htCTLD 단편은 Bam HI 및 Hind III 클로닝 부위 사이에서 pT7H6(Christensen et al., 1991)으로 삽입되었다.
도 8은 pT7H6FX-htCTLD에 의해 생성된 H6FX-htCTLD 융합 단백질의 FX-htCTLD 부분의 아미노산 서열(단일 문자 코드)를 도시한다.
도 9는 pPhTN 파지미드의 개략도이다. PhTN 단편은 Sfi I 및 Not I 제한효소 영역 사이에서 파지미드 pCANTAB 5E(애머샴 파마시아 바이오테크, 코드 번호 제 27-9401-01)로 삽입되었다.
도 10은 pPhTN에 의해 생성된 PhTN-유전자 III 융합 단백질의 PhTN 부분의 아미노산 서열(단일 문자 코드)을 도시한다.
도 11은 pPhTN3 파지미드의 개략도이다. PhTN3 단편은 Sfi I 및 Not I 제한 부위 사이에서 파지미드 pCANTAB 5E(애머샴 파마시아 바이오테크, 코드 번호 27-9401-01)로 삽입되었다.
도 12는 pPhTN3에 의해 생성된 PhTN3-유전자 III 융합 단백질의 PhTN3 부분의 아미노산 서열(단일 문자 코드)를 도시한다.
도 13은 pPhtlec 파지미드의 개략도이다. Phtlec 단편은 Sfi 및 Not I 제한효소 부위 사이에서 파지미드 pCANTAB 5E(애머샴 파마시아 바이오테크, 코드 번호 27-9401-01)로 삽입되었다.
도 14는 pPhtlec에 의해 생성된 Phtlec-유전자 III 융합 단백질의 Phtlec 부분의 아미노산 서열(단일 문자 코드)을 도시한다.
도 15는 pPhtCTLD 파지미드의 개략도이다. PhtCTLD 단편은 Sfi I 및 Not I 제한 부위사이에서 파지미드 pCANTAB 5E(애머샴 파마시아 바이오테크, 코드 번호 27-9401-01)로 삽입되었다.
도 16은 pPhtCTLD에 의해 생성된 PhtCTLD-유전자 III 융합 단백질의 PhtCTLD 부분의 아미노산 서열(단일 문자 코드)를 도시한다.
도 17은 pUC-mtlec의 개략도이다.
도 18은 pT7H6FX-mtlec 발현 플라스미드의 개략도를 도시한다. FX-mtlec 단편은 Bam HI 및 Hind III 클로닝 부위 사이에서 pT7H6(Christensen et al., 1991)로 삽입되었다.
도 19는 pT7H6FX-mtlec에 의해 생성된 H6FX-mtlec 융합 단백질의 FX-mtlec 부분의 아미노산 서열(단일 문자 코드)를 도시한다.
도 20은 pT7H6FX-mtCTLD 발현 플라스미드의 개략도이다. FX-mtCTLD 단편은 Bam HI 및 Hind III 클로닝 부위 사이에서 pT7H6(Christensen et al., 1991)로 삽입되었다.
도 21은 pT7H6FX-mtCTLD에 의해 생성된 H6FX-mtCTLD 융합 단백질의 FX-mtCTLD 부분의 아미노산 서열(단일 문자 코드)를 도시한다.
도 22는 pPmtlec 파지미드의 개략도를 도시한다. Pmtlec 단편은 Sfi I 및 Not I 제한 부위 사이에서 파지미드 pCANTAB 5E(애머샴 파마시아 바이오테크, 코드 번호 27-9401-01)로 삽입되었다.
도 23은 pPmtlec에 의해 생성된 Pmtlec-유전자 III 융합 단백질의 Pmtlec 부분의 아미노산 서열(단일 문자 코드)를 도시한다.
도 24는 pPmtCTLD 파지미드의 개략도를 도시한다. PmtCTLD 단편은 Sfi I 및 Not I 제한 부위 사이에서 파지미드 pCANTAB 5E(애머샴 파마시아 바이오테크 코드 번호 27-9401-01)로 삽입되었다.
도 25는 pPmtCTLD에 의해 생성된 PmtCTLD-유전자 III 융합 단백질의 PmtCTLD 부분의 아미노산 서열(단일 문자 코드)를 도시한다.
도 26은 항테트라넥틴 또는 BSA에 결합하는 Phtlec-, PhTN3-, 및 M13KO7 헬퍼 파지의 ELISA-타입 분석을 도시한다. 패널 A: 블록킹 시약으로서 3% 탈지유/5mM EDTA를 이용한 분석. 패널 B: 블록킹 시약으로서 3% 탈지유를 사용한 분석.
도 27은 플라스미노겐 (Plg) 및 BSA에 결합하는 Phtlec-, PhTN3-, 및 M13K07 헬퍼 파지의 ELISA-타입 분석을 도시한다. 패널 A: 블록킹 시약으로서 3% 탈지유/5mM EDTA를 이용한 분석. 패널 B: 블록킹 시약으로서 3% 탈지유를 사용한 분석.
도 28은 백그라운드와 비교하여, 플라스미노겐(Plg)에 결합하는, 2회 선별로부터 얻은 B 시리즈 및 C 시리즈 폴리클로날 집합체의 ELISA-타입 분석을 도시한다.
도 29는 ELISA-타입 검정에서 암닭 달걀 흰자위 라이소자임, 인간 β2-마이크로글로불린 및 백그라운드와의 결합에 대하여 분석된 3회 선별로부터 단리된 12개 클론으로부터의 파지를 도시한다.
도 30은 pPrMBP에 의해 생성된 PrMBP-유전자 III 융합 단백질의 PrMBP 부분의 아미노산 서열(단일 문자 코드)를 도시한다.
도 31은 pPrMBP 파지미드의 개략도를 도시한다. PrMBP 단편은 Sfi I 및 Not I 제한 부위 사이에서 파지미드 pCANTAB 5E(애머샴 파마시아 바이오테크, 코드 번호 27-9401-01)로 삽입되었다.
도 32는 pPhSP-D에 의해 생성된 PhSP-D-유전자 III 융합 단백질의 PhSP-D 부분의 아미노산 서열(단일 문자 코드)를 도시한다.
도 33은 pPhSP-D 파지미드의 개략도이다. PhSP-D 단편은 Sfi I 및 Not I 제한 부위 사이에서 파지미드 pCANTAB 5E(애머샴 파마시아 바이오테크, 코드 번호 27-9401-01)에 삽입되었다.
도 34는 ELISA-타입 검정에서 암닭 달걀 흰자위 라이소자임 및 A-HA와의 결합에 대하여 분석된 #1 시리즈의 3회째 선별으로부터 단리된 48개 클론으로부터의 파지를 도시한다.
도 35는 ELISA-타입 검정에서 암닭 달걀 흰자위 라이소자임 및 A-HA와의 결합에 대하여 분석된 #4 시리즈의 3회째 선별으로부터 단리된 48개 클론으로부터의 파지를 도시한다.
발명의 상세한 설명
I. 정의
용어 "C-타입 렉틴 유사 단백질" 및 "C-타입 렉틴"은 임의의 진핵세포 종에 존재하는 임의의 단백질 또는 이의 게놈에서 코딩되는 임의의 단백질을 의미하는 것으로 사용되고, 이들 단백질은 하나 이상의 CTLD 또는 탄수화물 리간드와 결합하는 CTLD의 서브그룹인 CRD에 속하는 하나 이상의 도메인을 함유한다. 상기 정의는 구체적으로, 막 부착 C-타입 렉틴 유사 단백질 및 C-타입 렉틴, 작용성 막 투과 도메인이 없는 "용해성" C-타입 렉틴 유사 단백질 및 C-타입 렉틴, 생체내에서 글리코실화 또는 임의의 다른 합성후수식에 의해 하나 이상의 아미노산 잔기가 변경된 변이체 C-타입 렉틴 유사 단백질 및 C-타입 렉틴 뿐만 아니라 C-타입 렉틴 유사 단백질 및 C-타입 렉틴의 화학적 개질에 의해 수득된 임의의 생성물을 포함한다.
청구범위 및 명세서에서, 특정 변경은 CTLD 도메인 또는 CTLD-함유 단백질의 아미노산 잔기 번호에 관하여 정의될 수 있다. 아미노산 넘버링은, 경우에 따라서, 각 경우에 모호하지 않은 문헌 참조 또는 그대로의 전후상황 내에서 본원에 함유된 도면을 참조하여 CTLD, 또는 천연 또는 인공 CTLD-함유 단백질 생성물의 첫번째 N-말단 아미노산에서 출발한다.
용어 "아미노산", "아미노산들" 및 "아미노산 잔기들"은 모두 천연에서 발견되는 L-α-아미노산을 의미한다. 이러한 정의는 노르루신, 오르니틴, 및 호모시스테인을 포함한다. 아미노산은 하기와 같이 단일 문자 또는 3개 문자에 의해 표기된다:
Asp D 아스파르트산 Ile I 이소루신
Thr T 트레오닌 Leu L 루신
Ser S 세린 Tyr Y 티로신
Glu E 글루타민산 Phe F 페닐알라닌
Pro P 프롤린 His H 히스티딘
Gly G 글리신 Lys K 라이신
Ala A 알라닌 Arg R 아르기닌
Cys C 시스테인 Trp W 트립토판
Val V 발린 Gln Q 글루타민
Met M 메티오닌 Asn N 아스파라긴
Nle J 노르루신 Orn O 오르니틴
Hcy U 호모시스테인 Xxx X 임의의 L-α-아미노산
천연에서 발견되는 L-α-아미노산은 이들의 화학적 조성 및 이들의 측쇄에 따라 분류될 수 있다. 이들은 크게 2개의 그룹, 하전된 그룹 및 하전되지 않은 그룹으로 분류된다. 이들 그룹 각각은 하기와 같이 하부 그룹으로 나누어져 아미노산이 보다 정확하게 분류된다:
A. 하전된 아미노산
산성 잔기: Asp, Glu
염기성 잔기: Lys, Arg, His, Orn
B. 하전되지 않은 아미노산
친수성 잔기: Ser, Thr, Asn, Gln
지방성 잔기: Gly, Ala, Val, Leu, Ile, Nle
비극성 잔기: Cys, Met, Pro, Hcy
방향성 잔기: Phe, Tyr, Trp.
용어 "아미노산 변경" 및 "변경"은 CTLD 아미노산 서열의 아미노산 치환, 결실, 삽입, 또는 이들의 조합을 의미한다. 본 발병의 CTLD 변이체에서, 이러한 변경은 CTLD 아미노산 서열의 위치 또는 위치들에서 일어난다. 본원에서 치환에 의한 변이체는 천연 CTLD 서열상의 하나 이상의 아미노산 잔기가 제거되고 동일한 위치에 상이한 잔기가 삽입된 것을 의미한다. 이러한 치환은 분자 상의 단지 1개의 아미노산이 치환된 단일 치환이거나 2개 이상의 아미노산이 동일한 분자에서 치환된 다중 치환일 수 있다.
본원에서 치환 변이체의 표시는 문자, 숫자, 문자 순으로 구성된다. 첫번째 (가장 좌측) 문자는 천연 (변경되지 않은) CTLD 또는 CTLD-함유 단백질의 아미노산을 의미한다. 숫자는 아미노산이 치환된 아미노산 위치를 의미하고, 두번째 (우측) 문자는 천연 아미노산을 대체하는데 사용된 아미노산을 의미한다. 상기에 언급된 바와 같이, 넘버링은 경우에 따라, CTLD 또는 CTLD-함유 단백질의 N-말단 아 미노산 서열을 의미하는 "1"로 출발한다. 다중 변경은 이들을 읽기 편하게 쉼표 (,)로 구분하였다.
용어 "코딩하는 핵산 분자", "코딩하는 DNA 서열", 및 "코딩하는 DNA"은 데옥시리보핵산의 가닥 상의 데옥시리보뉴클레오타이드의 순서 또는 서열에 관한 것이다. 이러한 데옥시리보뉴클레오타이드의 순서는 폴리펩타이드 사슬 상에서 아미노산의 순서를 결정한다. 이와 같이, DNA 서열은 아미노산 서열을 코딩한다.
용어 "돌연변이에 의해 무작위화된 서열", "무작위화된 폴리펩타이드 단편", "무작위화된 아미노산 서열", "무작위화된 올리고뉴클레오타이드" 및 "돌연변이에 의해 무작위화된 서열 뿐만 아니라, 무작위화된 서열, 폴리펩타이드 또는 핵산을 위미하는 다른 문맥에서 사용된 임의의 유사한 서열은 폴리펩타이드 또는 핵산 서열 또는 단편을 의미하고, 하나 이상의 서열 위치의 아미노산 잔기 또는 뉴클레오타이드는 폴리펩타이드 또는 핵산의 앙상블의 상이한 멤버 간에 다를 수 있어서, 각 서열 위치에서 나타나는 아미노산 잔기 또는 뉴클레오타이드는 모든 가능한 아미노산 잔기 또는 뉴클레오타이드 또는 이들의 임의의 제한된 서브세트를 포함할 수 있는 아미노산 잔기 또는 뉴클레오타이드의 세트에 속할 수 있다. 상기 용어는 종종 아미노산 잔기 또는 뉴클레오타이드의 수가 앙상블의 각 멤버에 대해 같은 앙상블을 의미하는데 사용되지만, 또한 앙상블의 각 멤버의 아미노산 또는 뉴클레오타이드의 수가 적절한 범위의 정수 내에서 임의의 정수일 수 있는 앙상블을 의미하는 데 사용될 수 있다.
II. 조합 CTLD 라이브러리의 제작 및 활용
추정되는 리간드 결합 모듈 또는 추정되는 효소 활성을 가지는 모듈의 관점에서, 표현형을 디스플레이하는 몇몇 시스템을 설명된 바 있다. 이들은 파지 디스플레이[예를 들어, 필라멘트형 파지 fd(Dunn, 1996; Griffiths and Duncan, 1998; Marks et al, 1992); 파지 람다(Mikawa et al., 1996)]; 진핵세포 바이러스 상에서의 디스플레이[예를 들어 배큘로바이러스(Ernst et al., 2000)]; 세포 디스플레이 [예를 들어 세균 세포(Benhar et al., 2000)], 효모 세포(Border and Wittrup, 1997), 및 포유류 세포(Whitehorn et al., 1995) 상에서의 디스플레이; 리보솜 연계 디스플레이(Schaffitzel et al., 1999), 및 플라스미드 연계 디스플레이(Gates et al., 1996)를 포함한다.
표현형 디스플레이 및 이들의 유전자형에 연계시키는 데 가장 일반적으로 사용되는 방법은 파지 디스플레이에 의한다. 이는 스캐폴드 단백질 또는 대상 단백질을 코딩하는 리딩 프레임을 표면에 노출된 파지 단백질의 내부 도메인 단편으로 삽입하여 수행된다. 필라멘트형 파지 fd(예를 들어 M13)은 이러한 목적에 가장 유용한 것으로 입증되었다. 폴리펩타이드, 단백질 도메인, 또는 단백질은 가장 빈번하게 "배출" 시그날과 fd 유전자 III 단백질의 도메인 1 사이에 삽입되거나 fd-파지 유전자 III 단백질의 도메인 2 및 도메인 3 사이의 소위 힌지(hinge) 영역으로 삽입된다. 인간 항체는 신규한 결합 유닛의 분리를 위해 가장 빈번하게 사용되는 단백질이지만, 다른 단백질 및 도메인도 사용된다[예를 들어, 인간 성장 호르몬(Bass et al., 1990), 알카라인 포스파타아제(McCafferty et al., 1991), β-락타마아제 억제 단백질(Huang et al., 2000); 및 세포독성 T 림프구-관련 항원 4(Hufton et al., 2000)). 항체는 종종 scFv 또는 Fab 융합 단백질로서 발현되고 제공된다. 3개의 전략이 사용되어 왔다. 특이적 항체는 항원 결합 클레프트 내에서 돌연변이로 무작위화된 서열의 라이브러리(예를 들어 Fuji et al., 1998)를 생성하기 위한 스캐폴드로서 사용되거나, 비면역화된 숙주(예를 들어 Nissim et al., 1994) 또는 면역화된 숙주(예를 들어 Cyr 및 Hudspeth, 2000)로부터 인간 항체 코딩 유전자의 커다란 앙상블을 나타내는 라이브러리가 fd 파지 벡터로 클로닝된다.
CTLD 라이브러리의 생성을 위한 디스플레이 시스템을 생성하기 위한 일반적인 방법은 본질적으로,
(1) 선택된 CTLD의 3D 구조에 관한 정보를 얻을 수 있는 경우에, 이를 참조하여 루프 영역의 위치를 확인하거나, 그렇지 않다면, 상기 공개된 β2 및 β3 컨센서스 서열 구성요소 및 β4-가닥 특성에 해당하는 서열 구성요소를 확인하는 추가의 연구에 의해 도 1에 도시된 서열과의 서열 정렬에 의해 β2-, β3- 및 β4 가닥의 서열 위치를 확인하고;
(2) β2, β3, 및 β4를 코딩하는 서열에 인접하게 엔도누클레아제를 사전에 삽입하거나 삽입하지 않고 단백질 디스플레이 벡터 시스템에서 선택된 CTLD를 코딩하는 핵산 단편을 서브클로닝하고;
(3) 수용 프레임워크를 코딩하는 핵산 콘텍스트로 삽입한 후에, 원래의 루프 영역 폴리펩타이드 단편을 무작위적으로 선택된 핵산 단편으로 치환하는, 다수의 핵산 단편으로 구성된 앙상블의 무작위적으로 선택된 멤버로 선택된 CTLD의 루프 영역의 일부 또는 모두를 코딩하는 핵산 단편을 치환하는 것을 필수적으로 포함한다. 원래의 루프 단편 또는 전체 루프 단편을 대체하는 새로운 폴리펩타이드를 코딩하는 클로닝된 핵산 단편의 각각은 신규한 서열 콘텍스트 내에서 결정된 리딩 프레임으로 해독될 것이다.
핵산 단편은 임의의 통상적인 핵산의 분자 클로닝 방법, 예를 들어 화학적으로 합성된 핵산이 수용 핵산으로 복제-편집되는 적절하게 설계된 PCR 조작에 의해 수용 핵산으로 특정 위치에서 삽입될 수 있고, 이 경우에 삽입을 위해 엔도누클레아제 제한 부위가 필요하지 않다. 대안적으로, 핵산 단편의 삽입/절단은 엔도누클레아제 제한 부위의 적절한 조합을, 적절하게 설계된 올리고누클레오디트 단편이 핵산을 분자 클로닝하는 표준 방법을 사용하여 삽입될 수 있는 표적 핵산으로 처리함에 의해 용이하게 될 수 있다.
제한 엔도누클레아제 위치가 편의상 삽입된 CTLD 라이브러리로부터 분리된 대상 CTLD 변이체가 원래의 CRLD에 존재하는 잔기에 상응하지도 않고 신규한 대상 CTLD 변이체의 친화도를 유지하는데 중요한 변이된 아미노산 잔기 또는 추가의 아미노산 잔기를 함유할 수 있다는 것이 명백하다. 요망되는 경우에, 예를 들어 생성물이 가능한 한 비면역성인 경우에, 이러한 잔기는 적절하게 특정 클론에서 복귀 돌연변이 또는 결실에 의해 변경되거나 제거될 수 있다.
다수의 핵산 단편으로 구성되는 앙상블은 단계식 합성에 따라, 핵산 단편의 화학적 합성의 각 단계에서 뉴클레오타이드 모노머의 임의의 조합의 혼합물 또는 순수한 뉴클레오타이드 모노머의 미리 규정된 조합을 첨가함에 의해 핵산의 화학적 합성을 위한 통상의 방법에 의해 수득될 수 있다. 이러한 방법으로, 하나의 독특한 핵산 서열로부터 임의의 수준의 서열의 축퇴(degeneracy)를 생성하는 것이 가능하고, 이는 N이 서열에서의 뉴클레오타이드의 개수인 4N라는 최대수의 유일한 서열의 완전하거나 완전하지 않은 예를 나타낸다.
다수의 핵산 단편으로 구성된 복합 앙상블은 대안적으로, 예를 들어 임의의유기체로부터 추출된 게놈 핵산과 유사한 고분자량 핵산 조성물의 화학적, 물리적, 또는 효소적 단편화에 의해 핵산 단편의 혼합물을 생성함에 의해 제조될 수 있다. 이러한 핵산 혼합물을 분자 앙상블의 생성에 유용하게 하기 위해, 본원에 기술된 바와 같이, 초기 절단 단계에서 수득된 단편의 미정제 혼합물은 통상적으로 크기별로 단편화되어 통상적으로, 수용 핵산 벡터로 크기별로 제한 처리된 올리고뉴클레오타이드 단편의 링커-함입 혼합물의 삽입을 용이하게 하도록 설계된, 적합한 쌍의 링커 핵산에 결합된 대략적인 분자량 범위의 단편을 얻을 것이다.
본 발명의 바람직한 구체예의 모델 CTLD인 테트라넥틴의 CTLD 조합 라이브러리의 제작을 용이하게 하기 위하여, 인간 및 뮤린 둘 모두의 테트라넥틴에서 β2, β3, 및 β4를 코딩하는 핵산 서열에 인접하여 위치한 적합한 제한 부위는 변경된 서열에 의해 코딩된 폴리펩타이드 서열의 최소 변동으로 설계되었다. 하기에 설명될 바와 같이, 동일한 엔도누클레아제 제한 부위가 2개의 서열에서 상응하는 위치에서 도입될 수 있어서, 관심 대상인 루프 영역 변이체를 재조합 뮤린 CTLD로부터 용이하게 절단하여 인간 테트라넥틴의 CTLD 단편으로 정확하게 삽입하거나 그 역으로 할 수 있게 하는 설계 전략을 확립하는 것이 가능한 것으로 보인다.
성숙한 형태의 인간 테트라넥틴을 코딩하는 뉴클레오타이드 서열의 분석으로부터, 제한 엔도누클레아제 Bgl II에 대한 인식 부위는 β2의 코딩된 잔기 Glu109, Ile110, 및 Trp111을 포함하는 위치 326번 내지 331번(AGATCT)에서 발견되고, 제한 엔도누클레아제 Kas I에 대한 인식 부위는 코딩된 아미노산 잔기 Gly128 및 Ala129(루프 2의 C-말단에 위치)를 포함하는 위치 382번 내지 387번 (GGCGCC)에서 발견됨을 알 수 있었다(도 2).
인간 테트라넥틴을 코딩하는 뉴클레오타이드 서열의 G513을 A로, C514를 T로 부위 특이적 돌연변이에 의해 돌연변이시키는 것은 그 안에 위치 511번 내지 516번에 위치하는 Mun I 제한 엔도누클레아제 인식 부위를 도입하고, 뮤린 테트라넥틴을 코딩하는 뉴클레오타이드 서열의 G513을 A로 돌연변이하는 것은 코딩된 프로토머의 아미노산 서열에 영향을 주지 않고 인간 테트라넥틴에 Mun I 영역에 해당하는 위치에서 Mun I 제한 엔도누클레아제 부위를 도입할 것이다. 뮤린 테트라넥틴을 코딩하는 뉴클레오타이드 서열의 C327을 G로, G386을 C로 돌연변이시키는 부위 특이적 돌연변이에 의한 돌연변이 Bgl II 및 Kas I 제한 엔도누클레아제 인식 부위를 각각 그 안에 도입시킬 것이다. 추가적으로 뮤린 테트로넥틴을 코딩하는 뉴클레오타이드 서열의 A325는 G로 돌연변이된다. 이들 3개의 돌연변이는 각각 Asn109를 Glu로 Gly129를 Ala로 치환함에 의해 코딩된 아미노산 서열에 영향을 준다. 이제, 제한 엔도누클레아제 Kas I은 뚜렷한 부위 선호도를 보이고 단지 느리게 테트라넥틴 코딩 영역을 절단하는 것으로 공지되어 있다. 따라서, Kas I 위치를 치환하는 다른 제한 엔도누클레아제의 인식 부위가 바람직하다 (예를 들어, 엔도누클레아제 Kpn I에 대한 인식 부위, 인식 서열 GGTACC). 생성된 테트라넥틴 유도체, 인간 테트라넥틴 렉틴(htlec), 및 뮤린 테트라넥틴 렉틴(mtlec)의 뉴클레오타이드 및 아미노산 서열은 도 3에 도시된다. htlec 및 mtlec 프로모터를 코딩하는 누크레오티드 서열은 연관된 뉴클레오타이드 서열(예를 들어 파지미드 벡터)의 단백질 디스플레이를 가능하게 하는 장치 및 단백질의 이종성 발현을 위하여 설계된 플라스미드(예를 들어, pT7H6, Christensen et al., 1991)로 용이하게 서브클로닝될 수 있다. htlec 또는 mtlec(각각 htCTLD 및 mtCTLD)의 돌연변이된 CTLD 만을 코딩하는 다른 유도체가 또한 제작되고 파지미드 벡터 및 발현 플라스미드로 서브클로닝되고, 이러한 CTLD 유도체의 뉴클레오타이드 및 아미노산 서열이 도 4에 도시되어 있다.
테트라넥틴 및 CTLD 유도체의 앙상블에 제한 엔도누클레아제 Bgl II, Kas I 또는 Kpn I, 및 Mun I에 대한 통상적인 세트의 인식 부위가 존재하는 것은, 무작위화된 올리고뉴클레오타이드를 htlec, mtlec, htCTLd, 또는 tmCTLD 유도체를 코딩하는, 적절하게 제한된 파지미드 벡터로 라이게이션시킴에 의해 렉틴 리간드 결합 영역을 포함하는 β4의 단일 잔기 위치 및 하나 이상의 루프에서 무작위화된 아미노산 서열을 가지는 단백질 라이브러리의 생성을 가능하게 한다.
특정 표적(진핵세포, 바이러스, 세균, 특정 단백질, 다당류, 다른 중합체, 유기화합물 등) 상에서의 수회 선별 후에, DNA가 특정 파지로부터 단리되고, 결정된 리간드-결합 영역을 코딩하는 단편의 뉴클레오타이드 서열은 파지미드 DNA에로부터 절단되고, 목적하는 생성물의 이종성 생성을 위한 적절히 유도된 발현 벡터에 전달된다. 원핵세포에서의 이종성 생성은 테트라넥틴 및 유도체의 분리 및 리폴딩을 위한 효율적인 프로토콜이 보고된 바 있기 때문에(참조: 국제 특허 출원공개 번호 제 WO 94/18227 A2호) 바람직할 수 있다.
스캐폴드 구조로서 테트라넥틴을 사용하여 본 발명의 기술을 수행함에 의해 얻어진 특정 잇점은, 뮤린 및 인간 테트라넥틴 스캐폴드의 구조가 거의 동일하여 루프 영역이 기능성을 보유하면서 뮤린 및 인간 테트라넥틴 유도체 간에 자유롭게 교환될 수 있게 하는 것이다. 뮤린 및 인간 프레임워크 간의 루프 영역의 교환은 기술된 테트라넥틴 유도체 벡터 내에서 수행되고, 이는 유전자 수준에서조차 인간 및 마우스 서열 간의 높은 수준의 상동성의 관점에서 의약 또는 척추동물 의약에서 적합성을 가지는 다른 동물 종(예를 들어, 고대 및 현대 원숭이, 개, 소, 양, 염소 등)으로 연장될 수 있다는 것을 예상하게 한다.
C-타입 렉틴 리간드 결합 영역은 항체의 항원 결합 크레프트(cleft)에 비교하여 상이한 위상학적 유닛을 나타내기 때문에, 본 발명자들은 선택된 결합 특이성이 항체에 비하여 상이한 본질을 가질 것이라는 것을 파악할 수 있다. 또한, 본 발명자들은 테트라넥틴 유도체가 당 잔기 또는 다당류와의 결합 특이성에 관하여 항체에 비하여 잇점을 가진다. 테트라넥틴 유도체는 또한 특정 천연 또는 합성 유기 화합물에 대하여 결합 특이성을 선택할 수 있는 잇점을 가질 수 있다.
몇몇 CTLD는 칼슘 이온에 결합하는 것으로 공지되어 있고, 다른 리간드의 결합은 종종 칼슘에 의존하거나[예를 들어 C-타입 렉틴의 컬렉틴 패밀리, 여기서 부위 2에 결합된 칼슘 이온은 당 리간드와 결합하는 데 직접 관여하거나(참조: Weis and Dricker, 1996) 또는 칼슘 이온에 민감하다[예를 들어 테트라넥틴, 여기서 칼슘의 결합은 그렇지 않은 것으로 공지되어 있는 플라스미노겐 크링글 4 결합에 관련된 공지된 더 많은 측쇄를 수반한다(참조: Graversen et al, 1998). C-타입 렉틴 유사 단백질 패밀리에 특징적인 칼슘 결합 영역은 루프 1, 루프 4, 및 β-가닥 4에 위치한 잔기에 의해 포함되고, 이는 프롤린 잔기(종종 구조에 있어 루프 3과 루프 4의 사이를 차지)의 존재에 의존적이며, 이 영역에서의 결합은 일관적으로 시스 형태인 것으로 발견된다. 또한, 칼슘의 결합은 CTLD 루프 영역이 구조적으로 변경되도록 하는 것으로 공지된다(참조: Ng et al., 1998a,b). 따라서, 본 발명자들은 보존된 CTLD 금속 결합 부위를 가지는 조합 라이브러리의 멤버에 의해 특정 표적 리간드에 결합하는 것이 2가 금속 이온의 첨가 또는 제거에 의해 조절될 수 있는데, 이는 금속 이온이 직접적으로 결합에 관여하거나, 금속 이온이 경쟁적 리간드이거나, 금속 이온의 결합이 추정되는 결합 위치 내에서 구조적으로 재배열되도록 하기 때문이다.
테트라넥틴을 포함하여 C-타입 렉틴 및 C-타입 렉틴 유사 단백질 패밀리의 몇몇 멤버의 트리머 특성 및 결합에 수반되는 애비더티는 또한 매우 높은 결합 친화성을 가지는 결합 위치의 생성에 이용될 수 있다.
상기 개시된 것으로부터 평가될 수 있듯이, 본 발명은 출원의 광범한 통상의 범위 및 넓은 영역을 가진다. 따라서, 이들의 다양한 구체예를 설명하는 하기 실시예는 설명을 위한 것이고, 한정을 위한 것이 아니다.
실시예 1
테트라넥틴 유래 E.coli 발현 플라스미드 및 파지미드의 제작
전장 H6FX-htlec 융합 단백질의 FX-htlec(서열 번호 01) 부분을 코딩하는 발현 플라스미드 pT7H6FX-htlec를, 퀵체인지TM(QuickChangeTM) 부위 특이적 돌연변이 키트(참조: Stratagene, La Jolla, CA)를 사용하고 제조자가 기술한 대로 수행하여 발현 플라스미드 pT7H6-rTN123으로부터 출발하는 4개의 연속적인 부위 특이적 돌연변이 실험에 의해 제작하였다(참조: Holet et al., 1997). 목적하는 돌연변이를 도입하는 미스매칭(mismatching)된 프라이머 쌍은 DNA 테크놀로지로부터 제공받았다(참조: Aarhus, Denmark). 생성된 pT7H6FX-htlec 발현 플라스미드의 개요를 도 5에서 도시하고, FX-htlec 코딩 삽입체의 뉴클레오타이드 서열을 서열번호 01로 나타내었다. FX-htlec 융합 단백질의 FX-htlec 부분의 아미노산 서열은 도 6에 도시되어 있고, 서열 번호 02로 나타내었다.
H6FX-htCTLD 융합 단백질의 FX-htCTLD(서열 번호: 03) 부분을 코딩하는 발현 플라스미드 pT7H6FX-htCTLD를 증폭 및 플라스미드 pT7H6으로 서브클로닝함에 의해 제작하였다(예를 들어, 발현 플라스미드 pT7H6-htlec를 주형으로 사용하고, 그렇지 않으면 발현 플라스미드 pT7H6TN3의 제작을 위해 설명된 프라이머, 조건, 및 서브클로닝 방법을 사용하여 폴리머라제 사슬 반응으로 증폭)(Holtet et al., 1997). 생성된 pT7H6FX-htCTLD 발현 플라스미드의 개요를 도 7에 도시하였고, FX-htCTLD 코딩 삽입체의 뉴클레오타이드 서열을 서열 번호 03에 나타내었다. FX-htCTLD 융합 단백질의 FX-htCTLD 부분의 아미노산 서열을 도 8에 도시하였고 서열 번호 04로 나타내었다.
파지미드, pPhTN 및 pPhTN3를 발현 플라스미드 pT7H6-rTN123(올리고뉴클레오타이드 프라이머 5'-CGGCTGAGCGGCCCAGCCGGCCATGGCCGAGCCACCAACCCAGAAGC-3'[서열 번호 05] 및 5'-CCTGCGGCCGCCACGATCCCGAACTGG-3'[서열 번호 06]를 사용) 및 pT7H6FX-htCTLD(올리고뉴클레오타이드 프라이머 5'-CGGCTGAGCGGCCCAGCCGGCCATGGCCGCCCTGCAGACGGTC-3'[서열 번호 07] 및 5'-CCTGCGGCCGCCACGATCCCGAACTGG-3'[서열 번호 06]를 사용)로부터 증폭된 Sfi I 및 Not I으로 제한 처리된 DNA 단편을 각각 표준 방법을 사용하여 애머샴 파마시아 바이오테크(코드 번호 27-9401-01)로부터 공급받은 Sfi I 및 Not I으로 사전 절단된 벡터, pCANTAB 5E로 라이게이션하여 제작하였다. 생성된 pPhTN 및 pPhTN3 파지미드의 개요를 각각 도 9 및 도 11에 도시하였고, PhTN 및 PhTN3 삽입체의 뉴클레오타이드 서열을 각각 서열 번호: 08 및 서열 번호: 10으로서 나타내었다. PhTN 및 PhTN3 삽입체에 의해 코딩된 아미노산 서열을 각각 도 10(서열 번호: 09) 및 도 12(서열 번호: 11)에 도시하였다.
파지미드, pPhtlec 및 pPhtCTLD를 발현 플라스미드 pT7H6FX-htlec(올리고뉴클레오타이드 프라이머 5'-CGGCTGAGCGGCCCAGCCGGCCATGGCCGAGCCACCAACCCAGAAGC-3'[서열 번호 05] 및 5'-CCTGCGGCCGCCACGATCCCGAACTGG-3'[서열 번호 06]를 사용) 및 pT7H6FX-htCTLD(올리고뉴클레오타이드 프라이머 5'-CGGCTGAGCGGCCCAGCCGGCCATGGCCGCCCTGCAGACGGTC-3'[서열 번호 07] 및 5'-CCTGCGGCCGCCACGATCCCGAACTGG-3'[서열 번호 06]를 사용)로부터 증폭된 Sfi I 및 Not I으로 제한 처리된 DNA 단편을 각각 표준 방법을 사용하여 애머샴 파마시아 바이오테크(코드 번호 27-9401-01)로부터 공급받은 Sfi I 및 Not I으로 사전 절단된 벡터, pCANTAB 5E로 라이게이션하여 제작하였다. 생성된 pPhtlec 및 pPhtCTLD 파지미드의 개요를 각각 도 13 및 도 15에 도시하였고, Phtlec 및 PhtCTLD 삽입체의 뉴클레오타이드 서열을 각각 서열 번호: 12 및 서열 번호: 14으로서 나타내었다. Phtlec 및 PhtCTLD 삽입체에 의해 코딩된 아미노산 서열을 각각 도 14(서열 번호: 13) 및 도 16(서열 번호: 15)에 도시하였다.
뮤린 테트라넥틴 유도체 mtlec에 상응하는 뉴클레오타이드 서열을 함유하는 플라스미드 클론, pUC-mtlec(도 3 및 서열 번호 16)을 하기 방법으로 DNA 부단편을 4회의 연속된 서브클로닝에 의해 제작하였다: 첫 번째, 2개의 올리고뉴클레오타이드 5'-CGGAATTCGAGTCACCCACTCCCAAGGCCAAGAAGGCTGCAAATGCCAAGAAAGATTTGGTGAGCTCAAAGATGTTC-3'(서열 번호 17) 및 5'-GCGGATCCAGGCCTGCTTCTCCTTCAGCAGGGCCACCTCCTGGGCCAGGACATCCATCCTGTTCTTGAGCTCCTCGAACATCTTTGAGCTCACC-3'(서열 번호 18)을 어닐링하고, 반응을 충족시킨 후에 제한 엔도누클레아제 Eco RI (GAATTC) 및 Bam HI (GGATCC)로 절단하고, Eco RI 및 Bam HI로 사전절단된 pUC18 플라스미드 DNA로 라이게이션하였다. 둘째, 한 쌍의 올리고뉴클레오타이드 5'-GCAGGCCTTACAGACTGTGTGCCTGAAGGGCACCAAGGTGAACTTGAAGTGCCTCCTGGCCTTCACCCAACCGAAGACCTTCCATGAGGCGAGCGAG-3'(서열 번호 19) 및 5'-CCGCATGCTTCGAACAGCGCCTCGTTCTCTAGCTCTGACTGCGGGGTGCCCAGCGTGCCCCCTTGCGAGATGCAGTCCTCGCTCGCCTCATGG-3'(서열 번호 20)을 어닐링하고, 반응을 충족시킨 후에 제한 엔도누클레아제 Stu I (AGGCCT) 및 Sph I (GCATGC)로 절단하고 첫 번째 라이게이션으로 생성된 제한 엔도누클레아제 Stu I 및 Sph I로 사전절단된 플라스미드로 라이게이션하였다. 셋째, 올리고뉴클레오타이드 쌍 5'-GGTTCGAATACGCGCGCCACAGCGTGGGCAACGATGCGGAGATCTAAATGCTCCCAATTGC-3'(서열 번호 21) 및 5'-CCAAGCTTCACAATGGCAAACTGGCAGATGTAGGGCAATTGGGAGCATTTAGATC-3'(서열 번호 22)를 어닐링하고, 반응을 충족시킨 후에 제한 엔도누클레아제 BstBI (TTCGAA) 및 Hind III (AAGCTT)로 절단하고 두 번째 라이게이션으로부터 생성된 BstB I 및 Hind III로 사전 절단된 플라스미드로 라이게이션시켰다. 네 번째, 올리고뉴클레오타이드 쌍 5'-CGGAGATCTGGCTGGGCCTCAACGACATGGCCGCGGAAGGCGCCTGGGTGGACATGACCGGTACCCTCCTGGCCTACAAGAACTGG-3'(서열 번호 23) 및 5'-GGGCAATTGATCGCGGCATCGCTTGTCGAACCTCTTGCCGTTGGCTGCGCCAGACAGGGCGGCGCAGTTCTTCTCGGCTTTGCCGCCGTCGGGTTGCGTCGTGATCTCCGTCTCCCAGTTCTTGTAGGCCAGG-3'(서열 번호 24)를 어닐링하고, 반응이 충족된 후에 제한 엔도누클레아제 Bgl II (AGATCT) 및 Mun I (CAATTG)로 절단하고, 세 번째 라이게이션으로부터 생성된 Bgl II 및 Mun I으로 사전절단된 플라스미드로 라이게이션하였다. pUC-mtlec 플라스미드의 개요를 도 17에 도시하였고, Eco RI 내지 Hind III 삽입체의 생성된 뉴클레오타이드 서열을 서열 번호 16에 도시하였다.
발현 플라스미드 pT7H6FX-mtlec 및 pT7H6FX-mtCTLD를, 올리고뉴클레오타이드 프라이머 쌍 5'-CTGGGATCCATCCAGGGTCGCGAGTCACCCACTCCCAAGG-3'(서열 번호 25) 및 5'-CCGAAGCTTACACAATGGCAAACTGGC-3'(서열 번호 26) 및 5'-CTGGGATCCATCCAGGGTCGCGCCTTACAGACTGTGGTC-3'(서열 번호 27) 및 5'-CCGAAGCTTACACAATGGCAAACTGGC-3'(서열 번호 26)으로 각각 pUC-mtlec 플라스미드로부터 증폭된 Bam HI 및 Hind III로 제한 처리된 DNA 단편을 각각 표준 방법으로 사용하여 Bam HI 및 Hind III로 사전 절단된 pT7H6 벡터로 라이게이션하여 제작할 수 있다. 발현 플라스미드 pT7H6FX-mtlec 및 pT7H6FX-mtCTLD의 개요를 각각 도 18 및 도 19에 도시하였고, FX-mtlec 및 FX-mtCTLD 삽입체의 아미노산 서열 번호 28 및 서열 번호 30으로 각각 도시하였다. 융합 단백질 H6FX-mtlec 및 H6FX-mtCTLD 융합 단백질의 FX-mtlec 및 FX-mtCTLD 부분의 아미노산 서열을 도 19(서열 번호 29) 및 도 21(서열 번호 31)에 각각 도시하였다.
파지미드 pPmtlec 및 pPmtCTLD를, 올리고뉴클레오타이드 프라이머 쌍 5'-CGGCTGAGCGGCCCAGCCGGCCATGGCCGAGTCACCCACTCCCAAGG-3'(서열 번호 32) 및 5'-CCTGCGGCCGCCACGATCCCGAACTGG-3'(서열 번호 33), 및 올리고뉴클레오타이드 5'-CGGCTGAGCGGCCCAGCCGGCCATGGCCGCCTTACAGACTGTGGTC-3'(서열 번호 34) 및 5'-CCTGCGGCCGCCACGATCCCGAACTGG-3'(서열 번호 33)으로 pUC-mtlec 플라스미드로부터 증폭된 Sfi I 및 Not I으로 제한 처리된 DNA 단편을 각각 표준 방법으로 사용하여 Sfi I 및 Not I으로 사전 절단된, 애머샴 파마시아 바이오테크(코드 번호 27-9401-01)가 제공한 pCANTAB 5E로 라이게이션하여 제작할 수 있다. pPmtlec 및 pPmtCTLD 플라스미드의 개요를 각각 도 22 및 도 24에 도시하였고, Pmtlec 및 PmtCTLD 삽입체의 뉴클레오타이드 서열 번호 35 및 서열 번호 37로 각각 도시하였다. Pmtlec 및 PmtCTLD 삽입체에 의해 코딩된 아미노산 서열을 도 23(서열 번호 36) 및 도 25(서열 번호 38)로 각각 도시하였다.
실시예 2
파지에서의 Phtlec 및 PhTN3의 성공적인 디스플레이의 증명
Phtlec 및 PhTN3 유전자 III 융합 단백질이 실제로 재조합 파지 입자에 의해 디스플레이될 수 있는지를 증명하기 위하여, 파지미드 pPhtlec 및 pPhTN3(실시예 1에서 설명)을 E.coli TGI 세포로 형질전환시켜 헬퍼 파지 M13K07로 감염시켜 제조합 파지를 생성하였다. 재조합 파지는 폴리(에틸렌 글리콜)(PEG 8000)으로 침전시켜 분리하고, Phtlec 및 PhTN3 파지 제조물의 샘플 뿐만 아니라 헬퍼 파지의 샘플에 대해 ELISA-타입 샌드위치 검정을 수행하였고, 여기서 맥시솔브(Maxisorb)(Nunc) 멀티웰 플레이트를 처음에 항인간 테트라넥틴 또는 우혈청 알부민(BSA)와 함께 인큐베이션하고, 탈지유 또는 탈지유/EDTA로 블록킹하였다. 간략하게, pPhtlec 및 pPhTN3 파지미드 형질전환된 TGI 세포의 배양은 A600이 0.5가될 때까지 2% 글루코오스 및 100㎎/L 앰피실린이 보강된 2xTY-배지 중에서 37℃로 수행되었다. 그 때까지, 헬퍼 파지, M13K07을 5×109 pfu/㎖의 농도로 첨가하였다. 배양물을 추가 30분 동안 37℃에서 인큐베이션하고, 세포를 원심분리에 의해 회수하고 50㎎/L 카나마이신 및 100㎎/L 앰피실린이 보강된 동일한 배양 부피의 2×TY 배지 중에 재현탁시키고, 신선한 세트의 플라스크에 옮겨 25℃에서 16시간 동안 증식시켰다. 세포를 원심분리에 의해 제거하고 파지를 빙냉된 20% PEG 8000, 2.5M NaCl 6㎖을 첨가하여 20㎖ 배양 상청액으로부터 침전시켰다. 용액을 혼합한 후에, 이를 1시간동안 얼음 중에 방치하고, 4℃에서 원심분리하여 침전된 파지를 분리하였다. 각 파지 펠릿을 10mM 트리스-HCl pH8, 1mM EDTA(TE) 1㎖ 중에 재현탁시켰다. 파지 함유 상청액을 새 튜브에 옮겼다. 파지 샘플의 제조와 함께, 맥시솔브 플레이트의 웰을 1:2000 비율로 희석된 토끼 항 인간 테트라넥틴(DAKO A/S의 다클론성 항체, 코드 번호 A0371) 또는 BSA(10㎎/㎖)로 밤새 코팅하였다. 코팅이 되면, 웰을 PBS(2.68mM Kcl, 1.47mM KH2PO4, 137mM NaCl, 8.10mM Na2HPO4, pH7.4)로 3회 세척하고, PBS 중의 3% 탈지유, 또는 PBS 중의 3% 탈지유, 5mM EDTA 280㎕로 37℃에서 1시간 동안 블록킹하였다. 다음에, 항테트라넥틴으로 코팅되고 BSA 코팅된 웰을 인간 Phtlec-, PhTN3-, 또는 헬퍼 파지 샘플로 1시간 동안 인큐베이션하고 적절한 블록킹 제제로 보강된 PBS 완충액으로 3회 세척하였다. 웰 중의 파지를 HRP-컨쥬게이션된 항 파지 컨쥬게이트(애머샴 파마시아 코드 번호 27-9421-01)로 인큐베이션시킨 후에 검출하고, 다음에, 추가로 세척하였다. 다음에, HRP 활성을 표준 HRP 크로모젠성 기질 검정을 사용하여 96웰 ELISA 리더로 측정하였다.
PHtlec 및 PhTN3 파지는 블록킹 제제 중의 EDTA의 존재 또는 부재에 관계 없이 상기 검정에서 강한 반응을 생성한 반면에(백그라운드의 14배), 헬퍼 파지는 어느 블록킹 제제 중에서도 상기 백그라운드 기록에 대한 어떠한 반응을 생성하지 않았다. BSA에 대한 낮은 결합만이 관찰되었다(도 26).
따라서, 인간 Phtlec 및 PhTN3 파지 둘 모두가 항 인간 테트라넥틴 항체에 의해 특이적으로 인지되는 에피토프를 디스플레이한다고 결론내릴 수 있다.
실시예 3:
파지 상에 디스플레이된 Phtlec 및 PhTN3 의 확실한 리간드의 결합 특성의 증명
인간 테트라넥틴의 CTLD 도메인의 아포폼은 인간 플라스미노겐의 크링글 4 도메인에 라이신-민감성 형태로 특이적으로 결합한다(참조: Graversen et al., 1998). 테트라넥틴을 플라스미노겐에 결합시키는 것은, CTLD 도메인의 리간드 결합 부위의 2개의 부위와 결합하는 칼슘(Kd 약 0.2 밀리몰) 또는 하나는 크링글 1에 위치하고 하나는 크링글 4에 위치하는 플라스미노겐의 2개의 보다 강한 라이신-결합 영역에서 특이적으로 결합하는 AMCHA 유사 라이신 유사체(6-아미노-시클로헥사논산)(Kd 약 15마이크로몰)에 의해 억제될 수 있다.
인간 플라스미노겐과의 인간 Phtlec 및 PhTN3 파지의 특이적 AMCHA-민감성 결합을 증명하기 위하여, 파지 입자(실시예 2 참조) 상에 디스플레이된 Phtlec 및 PhCTLD GIII 융합 단백질의 존재를 증명하기 위한 것에 유사한 ELISA 검정을 고안하였다.
웰을 5mM AMCHA를 첨가하거나 첨가하지 않고, 인간 플라스미노겐(10㎍/㎖)의 용액으로 코팅하였다. 대조군 웰은 BSA로 코팅하였다. 2개의 동일한 검정을 확립하였는데, 하나는 3% 탈지유로 과잉 결합 능력을 블록킹하였고, 하나는 5mM EDTA로 보강된 3% 탈지유를 사용하여 블록킹하였다. 적절한 경우에, 블록킹 용액, 세척 용액, 및 파지 스탁 용액을 5mM AMCHA로 보강하였다. 2개 어레이의 웰을 Phtelc-, 또는 PhTN3- 또는 헬퍼 파지 샘플로 인큐베이션시키고, 세척 후에, 각 웰에 결합된 파지의 양을 상기와 같이 HRP-컨쥬게이션된 항파지 항체를 사용하여 측정하였다. 결과를 도 27의 패널 A 및 패널 B에 도시하였고, 이 결과를 하기와 같이 요약할 수 있다:
(a) ABCHA가 첨가되지 않은 경우에, 인간 Phtlec 파지의 플라스미노겐 코팅된 웰과의 결합은 블록킹 제제의 제형화를 사용하여 8 내지 10배의 백그라운 수준 반응을 생성한 반면에, 인간 PhTN3 파지는 4배(EDTA 미첨가 시)의 백그라운드 수준 또는 7배(EDTA 첨가 시)의 백그라운드 수준 반응을 생성하였다.
(b) 5mM AMCHA가 첨가된 경우에, 인간 Phtlec- 및 PhTN3 파지의 플라스미노겐과의 결합은 완전히 일어나지 않은 것으로 관찰되었다.
(c) Phtlec 및 PhTN3 파지는 BSA와 결합하지 않았고, 임의의 대조군 헬퍼 파지는 임의의 고정된 성분에 결합하지 않았다.
(d) 보통의 결합력으로 특정 리간드로의 인간 Phtlec 및 PhTN3 파지의 특정 결합(약 20마이크로몰 수준)을 비특이적 결합을 감소시키는 바람직한 제제로서 조합 파지 기술 분야의 널리 공지된 탈지유 블록킹 제제를 사용하여 사실상 백그라운드 없이 고효율로 검출할 수 있었다.
결론적으로, 결과로부터 파지 입자 상에 디스플레이된 Phtlec 및 PhTN3 유전자 III 융합 단백질은 진정한 테트라넥틴의 플라스미노겐 결합 특성에 상응하는 플라스미노겐 결합 특성을 보였고, Phtlec 및 PhTN3 파지의 물리적 및 생화학적 특성 은 신규한 결합 특성을 가지는 CTLD 유래 유닛이 선택될 수 있는 조합 라이브리의 생성을 위한 비히클로서 제안된 용도와 일치한다는 것을 알 수 있다.
실시예 4:
파지 라이브러리 Phtlec-1b001 및 Phtlec-1b002의 제작
본 실시예에서 사용된 모든 올리고 뉴클레오타이드는 DNA 기술(Aarhus, Denmark)에 의해 공급되었다.
Phtlec(서열 번호 12) 위치 141번 내지 146번(루프 3), 150번 내지 153번(루프 4의 일부)에 해당하는 무작위 아미노산 잔기 및 잔기 168(β4의 Phe)를 함유하는 파지 라이브러리 Phtlec-1b001을 20㎍ KpnI 및 MunI으로 제한 처리된 pPhtlec 파지미드 DNA(실시예 1 참조)를, 표준 조건을 사용하여, 적절하게 무작위화된 뉴클레오타이드 서열을 코딩하는 올리고뉴클레오타이드 htlec-lib1-tp(서열 번호 39), 올리고뉴클레오타이드 htlec-lib1-rev(서열 번호 40) 및 htlec-libl/2-fo(서열 번호 41)를 프라이머로서 이로부터 증폭된 10㎍의 KpnI 및 MunI으로 제한 처리된 DNA 단편과 라이게이션시켜 제작하였고, 여기서 N은 각 뉴클레오타이드 T, C, G, 및 A를 25%씩 함유하는 혼합물을 의미하고, S는 C 및 G를 각각 50%씩 함유하는 혼합물을 의미한다. 라이게이션 혼합물을 표준 방법을 사용하여 전기천공법에 의해 소위 E.coli TG-1 세포를 형질전환시키는 데 사용하였다. 형질전환 후에, E.coli TG-1 세포를 0.2㎎ 앰피실린/㎖ 및 2% 글루코오스를 함유하는 2xTY-아가 플레이트 상에 플레이팅하고, 30℃에서 밤새 인큐베이션하였다.
Phtlec(서열 번호 12) 위치 121번 내지 123번, 125번 및 126번(루프 1의 대부분), 잔기 150번 내지 153번(루프 4의 부분)에 해당하는 무작위 아미노산 잔기 를 함유하는 파지 라이브러리 Phtlec-1b002를 20㎍ Bgl II 및 MunI으로 제한 처리된 pPhtlec 파지미드 DNA(실시예 1 참조)를, 표준 조건을 사용하여, 올리고뉴클레오타이드 쌍 htlec-lib2-tprev(서열 번호 42) 및 올리고뉴클레오타이드 htlec-lib2-tpfo(서열 번호 43), 및 올리고뉴클레오타이드 htlec-lib2-rev(서열번호 44) 및 htlec-lib1-2-fo(서열 번호 41)을 프라이머로서 이로부터 증폭된 15㎍의 Bgl II 및 MunI으로 제한 처리된 DNA 단편과 라이게이션시켜 제작하였고, 여기서 N은 각 뉴클레오타이드 T, C, G, 및 A를 25%씩 함유하는 혼합물을 의미하고, S는 C 및 G를 각각 50%씩 함유하는 혼합물을 의미한다. 라이게이션 혼합물을 표준 방법을 사용하여 전기천공법에 의해 소위 E.coli TG-1 세포를 형질전환시키는 데 사용하였다. 형질전환 후에, E.coli TG-1 세포를 0.2㎎ 앰피실린/㎖ 및 2% 글루코오스를 함유하는 2xTY-아가 플레이트 상에 플레이팅하고, 30℃에서 밤새 인큐베이션하였다.
라이브러리 Phtlec-1b001 및 -1b002의 역가가 각각 1.4×109 및 3.2×109 클론으로 측정되었다. 각 라이브러리로부터 6개의 클론을 증식시키고 파지미드 DNA를 표준 미니프렙 방법 및 결정된 루프 영역의 뉴클레오타이드 서열을 사용하여 분리하였다(참조: DNA 테크놀로지, Aarhus, Denmark). 각 라이브러리의 하나의 클론은 기술적인 이유로 신뢰성있는 뉴클레오타이드 서열을 제공할 수 없었고, Phtlec-lib001로부터의 클론은 명백히 주요한 결실을 함유하였다. 다른 9개의 클론(1b001-1, 1b001-2, 1b001-3, 1b001-4, 1b002-1, 1b002-2, 1b002-3, 1b-002-4, 및 1b002-5)의 루프 영역의 Phtlec(서열 번호 12)와 비교하여, 뉴클레오타이드 서열의 변형을 표 3에 도시하였다.
표 3: 라이브러리 Phtlec-Ib001 및 -Ib002로부터 분리된 Phtlec 루프 유도체의 변이 (β2 및 β3 컨센서스 서열 구성요소가 표기됨)
Figure 112003020953455-pct00009
실시예 5:
파지 라이브러리 PhtCTLD-1b003의 제작
본 실시예에 사용된 모든 뉴클레오타이드를 DNA 기술(Aarhus, Denmark)에 의해 공급하였다.
PhtCTLD (서열 번호 15) 위치 77번 내지 79번 및 81번 내지 82번(루프 1) 및 108번 내지 109번 (루프 4)을 함유하는 파지 라이브러리 PhtCTLD-1b003를, 20㎍ BglII 및 MunI로 제한 처리된 pPhtCTLD 파지미드 DNA(실시예 1 참조)를 루프 1의 2개 및 3개의 잔기가 무작위로 삽입되거나 삽이되지 않고 루프 4의 3개 및 4개 잔기로 무작위로 삽입된 적절하게 무작위화된 루프 1 및 루프 4 영역을 코딩하는 10㎍의 BglII 및 MunI 제한 처리된 DNA 단편 집합체와 라이게이션시켜 제작하였다. DNA 단편 집합체를, 표준 방법을 사용하여 프라이머로서 올리고뉴클레오타이드 TN-lib3-rev(서열 번호 45) 및 루프 3-4-5 tagfo(서열 번호 46)을 사용하고 주형으로서 2개의 루프 4 DNA 단편 각각을 사용하여, 3개의 루프 1 DNA 단편 각각을 결합시키는 6개의 소위 어셈블리 반응으로부터 증폭시켰다. 3개의 루프 1 단편 각각은 프라이머로서 올리고뉴클레오타이드 TN-lib3-rev(서열 번호 45) 및 TN-KpnI-fo(서열 번호 50)을 사용하고 올리고뉴클레오타이드 loop1b(서열 번호 47), loop1c(서열 번호 48), 또는 loop1d(서열 번호 49)를 주형으로서 사용한 반응에서 증폭시켰고, 2개의 DNA 루프 4 단편의 각각을 표준 방법을 사용하여 프라이머로서 올리고뉴클레오타이드 loop3-4rev(서열 번호 53) 및 loop3-4fo(서열 번호 54)를 사용하고 주형으로서 올리고뉴클레오타이드 loop4b(서열 번호 51) 또는 loop4c(서열 번호 52) 중 어느 하나를 사용한 반응에서 증폭시켰다. 올리고뉴클레오타이드 서열에서 N은 각 뉴클레오타이드 T, C, G, 및 A를 25%씩 함유하는 혼합물을 의미하고, S는 C 및 G를 각각 50%씩 함유하는 혼합물을 의미한다. 라이게이션 혼합물을 표준 방법을 사용하여 전기천공법에 의해 소위 E.coli TG-1 세포를 형질전환시키는 데 사용하였다. 형질전환 후에, E.coli TG-1 세포를 0.2㎎ 앰피실린/㎖ 및 2% 글루코오스를 함유하는 2xTY-아가 플레이트 상에 플레이팅하고, 30℃에서 밤새 인큐베이션하였다.
생성된 라이브러리 PhtCTLD-1b003의 크기는 1.4×1010 클론으로 측정되었다. 라이브러리의 24개 클론을 증식시키고, 파지 및 파지미드 DNA를 분리하였다. 루프 영역의 뉴클레오타이드 서열을 결정하고(DNA 테크놀로지, Aarhus, Denmark), 테트라넥틴에 대한 다클론성 항체, 항-TN(DAKO A/S, Dnemark)에 결합시키고, 표준 방법을 사용하여 2차 항체로서 HRP 컨쥬게이션된 항-유전자 VIII(애머샴 파마시아 바이오테크)를 사용하여 ELISA 타입 검정에서 검정하였다. 18개 클론이 루프 삽입체를 함유하고, 1개 클론이 야생형 루프 영역 서열을 함유하고, 1개 클론이 주요한 결실부를 함유하고, 4개가 2개 이상의 서열을 함유하고, 2개의 클론이 영역에서 프레임 쉬프트 돌연변이를 함유하는 것으로 관찰되었다. 올바른 루프 삽입체를 가지는 18개의 클론 중에서 13개, 야생형 클론 및 혼합된 단리체 중 1개가 다클론성 항-TN 항체가 항체와 약하게 반응하는 반면에, 올바른 클론 중 2개, 결실 돌연변이, 혼합체 중 1개 및 2개의 프레임쉬프트 돌연변이는 백그라운드에 비해 시그날을 보이지 않았다.
실시예 6
항-TN 항체 상의 바이오패닝에 의한 파지 선택
PhtCTLD-1b003 라이브러리로부터의 약 1011 파지를 표준 방법을 사용하여 맥시솔브 이뮤노튜브(NUNC, Denmark)에서 패닝하여 다클론성 항-TN 항체 상에서 2회 선별하는데 사용하였다. 2차 선별 후에 플레이팅하여 7×107 중 15개 클론을 증식시키고, 파지미드 DNA를 분리하고 뉴클레오타이드 서열을 결정하였다. 모든 15개 클론이 올바르고 상이한 루프 서열을 코딩하는 것으로 발견되었다.
실시예 7
플라스미노겐 상에서의 CTLD-파지의 모델 선별
I. 패닝 후에 트립신 소화에 의한 용출
테트라넥틴 유래 CTLD 함유 파지가 파지의 집합체로부터 선택될 수 있음을 증명하기 위하여, M13K07 헬퍼 파지로 감염시킨 후에 파지미드 pPhtCTLD(실시예 1 참조)로 형질전환된 E.coli TG1 배양물로부터 분리된 PhtCTLD 파지 및 M13K07 헬퍼 파지로 감염시킨 후에 파지미드 pPhtCPB로 형질전환된 배양물로부터 분리된 파지의 혼합물을 각각 1:10 및 1:105으로 96웰 맥시솔브 마이크로역가 플레이트(NUNC, Denmark)에서 패닝을 사용하여 항원으로서 인간 플라스미노겐을 사용하여 선별 실험에 사용하였다. pPhtCPB 파지미드를 적절한 제한 효소 오버행 서열을 가지는 2중가닥 올리고뉴클레오타이드(서열 번호 55)를 KpnI 및 MunI 제한 처리된 pPhtCTLD 파지미드 DNA로 라이게이션하여 제작하였다. 헬퍼 파지로 감염되어 유래된 pPhtCBP 파지를 생성된 pPhtCPB 파지미드(서열 번호 56)으로 도입된 변역 종결 코돈 때문에 야생형 M13 유전자 III 단백질 만을 디스플레이한다.
선별 실험을 표준 방법을 사용하여 96웰 마이크로역가 플레이트에서 수행하였다. 간략하게, 각 웰에 100㎕ PBS(PBS, 0.2g KCl, 0.2g KH2PO4, 8g NaCl, 1.44g Na2HPO4, 2H2O 함유, 1L가 되도록 물을 첨가하고 NaOH를 사용하여 pH를 7.4로 조절) 또는 100㎕ PBS (비특이적 결합의 분석을 위하여) 중의 인간 플라스미노겐 3㎍을 사용하여 1시간 동안 4℃ 및 37℃에서 밤새 코팅하였다. PBS로 2회 세척한 후에, 웰을 1시간 동안 37℃에서 400㎕ PBS 및 3% 탈지분유로 코팅하였다. 블록킹시킨 후에, 웰을 PBS 및 0.1% 트윈 20으로 1회 세척하고 PBS로 3회 세척한 후에, 100㎕ PBS 및 3% 탈지분유 중에 현탁된 파지를 첨가하였다. 파지를 1시간 동안 37℃에서 결합하도록 한 후에, PBS, 트윈20으로 3회 세척하고, PBS로 3회 세척하였다. 결합된 파지를 실온에서 30분 동안 100㎕(PBS 중의 1㎎/㎖ 트립신)으로 트립신 소화에 의해 각 웰로부터 용출시키고, 기하급수적으로 증식하는 E.coli TG1 세포를 감염시키기 위해 사용한 후에, 2% 글루코오스 및 0.1㎎/㎖ 앰피실린을 함유하는 2×TY 아가 플레이트 상에서 플레이팅하고 적정하였다.
처음에는(1회 선별), 1012 PhtCTLD 파지(A 시리즈), 1010 PhtCTLD 파지 및 1011 PhtCTLD 파지(B 시리즈)의 혼합물, 또는 106 PhtCTLD 및 1011 PhtCPB 파지(C 시리즈)를 사용하였다. 다음 선별(2회 선별)에는, 각 시리즈로부터의 생성물인 1011 파지를 사용하였다. 2회 선별로부터의 결과를 표 4에 요약하였다.
표 4: 트립신을 사용한 패닝 및 용출에 의한 PhtCTLD 및 PhtCPB 혼합물의 선별
플라스미노겐 (*105 콜로니) 블랭크 (*105콜로니)
1회 A 113.0 19.50
B 1.8 1.10
C 0.1 0.30
2회 A 49 0.10
B 5.2 0.20
C 0.3 0.04
초기 파지 혼합물의 플레이팅으로부터 얻은 5개의 콜로니와 함께 2회 플레이팅으로부터 얻은 12개의 콜로니로부터 파지미드 DNA를 분리하고, CTLD 영역의 뉴클레오타이드 서열을 결정하였다. PhtCTLD/PhtCPB의 초기 1/10 혼합물(B 시리즈)에서 5개 중 하나가 CTLD 서열로서 결정되었다. 초기 1/105 혼합물(C 시리즈)에서 5개 서열 모두가 pPhtCPB 파지미드로부터 유래되었다. 2회 선별 후에 B 시리즈로부터 분석된 12개 서열 중 9개 및 C 시리즈의 12개 서열 모두가 pPhtCTLD 파지미드로부터 유래되었다.
실시예 8
플라스미노겐 상의 CTLD 모델 선별
II: 패닝 후에 0.1M 트리에틸아민에 의한 용출
테트라넥틴 유래 CTLD 함유 파지가 파지 집합물로부터 선별될 수 있음을 증명하기 위하여, M13K07 헬퍼 파지로 감염시킨 후에 파지미드 pPhtCTLD(실시예 1 참조)로 형질전환된 E.coli TG1 배양물로부터 분리된 PhtCTLD 파지 및 M13K07 헬퍼 파지로 감염시킨 후에 파지미드 pPhtCPB(실시예 6 참조)로 형질전환된 배양물로부 터 분리된 파지의 혼합물을 각각 1:102 및 1:105으로 96웰 맥시솔브 마이크로역가 플레이트(NUNC, Denmark)에서 패닝을 사용하여 항원으로서 인간 플라스미노겐을 사용하여 선별 실험에 사용하였다.
간략하게, 각 웰에 100㎕ PBS(PBS, 0.2g KCl, 0.2g KH2PO4, 8g NaCl, 1.44g Na2HPO4, 2H2O 함유, 1L가 되도록 물을 첨가하고 NaOH를 사용하여 pH를 7.4로 조절) 또는 100㎕ PBS (비특이적 결합의 분석을 위하여) 중의 인간 플라스미노겐 3㎍을 사용하여 1시간 동안 4℃ 및 37℃에서 밤새 코팅하였다. PBS로 2회 세척한 후에, 웰을 1시간 동안 37℃에서 400㎕ PBS 및 3% 탈지분유로 코팅하였다. 블록킹시킨 후에, 웰을 PBS 및 0.1% 트윈 20으로 1회 세척하고 PBS로 3회 세척한 후에, 100㎕ PBS 및 3% 탈지분유 중에 현탁된 파지를 첨가하였다. 파지를 1시간 동안 37℃에서 결합하도록 한 후에, PBS, 트윈20으로 15회 세척하고, PBS로 15회 세척하였다. 결합된 파지를 실온에서 10분 동안 100㎕ 0.1M 트리에틸렌아민으로 각 웰로부터 용출시키고, 0.5 부피, 1M Tris-HCl pH7.4로 중화시켜 기하급수적으로 증식하는 E.coli TG1 세포를 감염시키기 위해 사용한 후에, 2% 글루코오스 및 0.1㎎/㎖ 앰피실린을 함유하는 2×TY 아가 플레이트 상에서 플레이팅하고 적정하였다.
처음에는(1회 선별) 1012 PhtCTLD 파지(A 시리즈), 109 PhtCTLD 파지 및 1011 PhtCTLD 파지(B 시리즈)의 혼합물, 또는 105 PhtCTLD 및 1011 PhtCPB 파지(C 시리즈)를 사용하였다. 다음 선별(2회 선별)에는, 각 시리즈로부터의 생성물인 1011 파지를 사용하였다. 2회 선별로부터의 결과를 표 5에 요약하였다.
표 5: 트리에틸아민을 사용한 패닝 용출에 의한 PhtCTLD 및 PhtCPB의 혼합물의 선별
플라스미노겐 (*104 콜로니) 블랭크 (*104 콜로니)
1회 A 18 0.02
B 0.5 0.00
C 0.25 0.02
2회 A n.d. n.d.
B 5.0 0.00
C 1.8 0.02
3회 A n.d. n.d.
B 11 0.00
C 6.5 0.02
n.d. = 측정되지 않음
2회 선별로부터 A 및 B 시리즈로부터 파지 혼합물을 표준 방법을 사용하여 증식시키고, ELISA 타입 검정으로 플라스미노겐과의 결합을 위하여 분석하였다. 간략하게, 각 웰에 100㎕ PBS(PBS, 0.2g KCl, 0.2g KH2PO4, 8g NaCl, 1.44g Na2 HPO4, 2H2O 함유, 1L가 되도록 물을 첨가하고 NaOH를 사용하여 pH를 7.4로 조절) 또는 100㎕ PBS (비특이적 결합의 분석을 위하여) 중의 인간 플라스미노겐 3㎍을 사용하여 1시간 동안 4℃ 및 37℃에서 밤새 코팅하였다. PBS로 2회 세척한 후에, 웰을 1시간 동안 37℃에서 400㎕ PBS 및 3% 탈지분유로 코팅하였다. 블록킹시킨 후에, 웰을 PBS 및 0.1% 트윈 20으로 1회 세척하고 PBS로 3회 세척한 후에, 100㎕ PBS 및 3% 탈지분유 중에 현탁된 파지를 첨가하였다. 파지 혼합물을 1시간 동안 37℃에서 결합되도록 한 후에, PBS, 트윈 20으로 3회 세척하고 PBS로 3회 세척하였다. 세척한 후에, 50㎕의 1: 5000으로 희석된 PBS, 3% 탈지유 중의 HRP-컨쥬게이션된 항 유전자 VIII 항체(애머샴 파마시아 바이오테크)를 각 웰에 첨가하고 1시간 동안 37℃에서 인큐베이션하였다. "2차" 항체의 결합 후에, 웰을 PBS, 트윈 20으로 3회 세척하고, PBS로 3회 세척하고 50㎕의 TMB 기질(DAKO-TMB 원-스텝 기질 시스템, 코드: S1600, DAKO, Denmark)을 첨가하였다. 반응을 20분 동안 진행되도록 한 후에, 0.5 부피의 O.5M H2SO4로 퀀칭시키고 분석하였다. ELISA 분석의 결과는 시리즈 모두의 파지의 플라스미노겐과의 특이적 결합을 확인하였다(도 28).
실시예 9
암닭 달걀 흰자위 라이소자임과의 라이브러리 Phtlec-1b002의 결합으로부터 파지의 선별
Phtlec-1b002 라이브러리로부터 유래된 원래의 라이브러리의 크기의 약 250배 되는 1.2×1012개 파지(실시예 4 참조)를 표준 방법을 사용하여 연속적으로 패닝시키는 것을 포함하여 암닭 달걀 흰자위 라이소자임에 결합하는 파지를 선별하기 위한 실험 방법에 사용하였다.
간략하게, 1㎖ PBS(PBS, 0.2g KCl, 0.2g KH2PO4, 8g NaCl, 1.44g Na2HPO 4, 2H2O를 함유, 1L가 되도록 물을 첨가하고 NaOH로 pH 7.4로 조절함) 또는 1㎖ PBS(비특이적 결합의 분석을 위하여) 중의 암닭 달걀 흰자위 라이소자임 30㎍을 1시간 동안 4℃ 및 37℃에서 맥시솔브 이뮤노튜브(NUNC, Denmark)를 밤새 코팅하기 위하여 사용하였다. PBS로 1회 세척한 후에, 튜브를 채우고, 37℃에서 1시간 동안 PBS 및 3% 탈지분유로 블록킹시켰다. 블록킹시킨 후에, 튜브를 PBS, 0.1% 트윈20으로 1회 세척하고 PBS로 3회 세척한 후에, 1㎖ PBS, 3% 탈지분유 중에 재현탁된 파지를 첨가하였다. 파지를 1시간 동안 37℃에서 결합하도록 한 후에, PBS, 트윈20으로 6회 세척하고 PBS로 6회 세척하였다. 결합된 파지를 실온에서 10분 동안 1㎖의 0.1M 트리에틸아민으로 각 웰로부터 용출시키고, 1M Tris-HCl pH 7.4로 중화시켜 기하급수적으로 증식되는 E.coli TG1 세포의 감염에 사용한 후에, 2% 글루코오스 및 0.1㎎/㎖ 앰피실린을 함유하는 2×TY 아가 플레이트 상에 플레이팅하여 적정하였다. 후속하는 선별에서 라이소자임으로 코팅된 튜브로부터 용출된 파지로 감염시킨 후에 플레이팅된 콜로니로부터 용출된 파지로부터 유래된 약 1012 파지를 패닝 방법에 사용하였다. 그러나, 결합에 있어서의 스트린전시를, 파지를 6에서 10으로 패닝시킨 후의 세척 단계의 수를 증가시켜 증가시켰다.
선별 방법으로부터의 결과를 표 7에 도시하였다.
표 7: Phtlec-1b002 라이브러리로부터 라이소자임 결합 파지의 패닝에 의한 선별
라이소자임 블랭크 비율
1회 2.4×104 n.a. n.a.
2회 3.5×103 4.0×102 9
3회 3.2×105 2.5×102 1.3×103
n.a.=적용할 수 없음.
파지를 표준 방법을 사용하여 결합 특이성을 분석하기 위하여 3회 선별로부터 분리된 12개 클론으로부터 증식시키고, ELISA-타입 검정에서 β2-마이크로글루불린 및 암닭 달걀 흰자위 라이소자임과의 결합에 대하여 분석하였다. 간략하게, 각 웰에서 100㎕ PBS(PBS, 0.2g KCl, 0.2g KH2PO4, 8g NaCl, 1.44g Na2HPO4, 2H2O를 함유, 1L가 되도록 물을 첨가하고 NaOH로 pH 7.4로 조절함) 중의 암닭 달걀 흰자위 라이소자임 3㎍, 인간 β2-마이크로글로불린 3㎍, 또는 100㎕ PBS(비특이적 결합의 분석을 위하여)을 1시간 동안 4℃ 및 37℃에서 밤새 코팅시키기 위하여 사용하였다. PBS로 1회 세척한 후에, 웰을 37℃에서 1시간 동안 400㎕ PBS 및 3% 탈지분유로 블록킹하였다. 블록킹시킨 후에, 웰을 PBS 및 0.1% 트윈20으로 1회 세척하고, PBS로 3회 세척한 후에, 100㎕ 및 3% 탈지분유 중에 현탁된 파지를 첨가하였다. 파지를 1시간 동안 37℃에서 결합하도록 한 후에, 세척 후에 50㎕의 1 내지 5000배 희석된 PBS 중의 HRP-컨쥬게이션된 항 유전자 VIII 항체(Amersham Pharmacia Biotech)를 각 웰에 첨가하고 1시간 동안 37℃에서 인큐베이션시켰다. "2차" 항체의 결합 후에, 웰을 PBS, 트윈 20으로 3회 세척하고, PBS로 3회 세척한 후에, 50㎕의 TMB 기질(DAKO-TMB 원-스텝 서브스트레이트 시스템, 코드: S1600, DAKO, Denmark)를 첨가하였다. 반응이 20분 동안 진행되도록 한 후에, 0.5M H2SO4로 퀀칭시켰다.
라이소자임에 대해 비교적 약하지만 특이적인 결합을 보이는 결과를 도 29에 요약하였다.
실시예 10
래트 만노오스-결합 단백질 CTLD(r-MBP) 유래 파지미드(pPrMBP) 및 인간 허파 계면활성 단백질 D CTLD (h-SP-D) 유래 파지미드(pPhSP-D)의 제작
파지미드, pPrMBP를, 래트 간으로 분리된 cDNA로부터 증폭된 Sfi I 및 Not I으로 제한 처리된 DNA 단편(참조: Drickamer, K., et al., J. Biol. Chem. 1987, 262(6): 2582-2589)(올리고뉴클레오타이드 프라이머 SfiMBP 5'-CGGCTGAGCGGCCCAGCCGGCCATGGCCGAGCCAAACAAGTTGCATGCCTTCTCC-3' [서열 번호 62] 및 NotMBP 5'-GCACTCCTGCGGCCGCGGCTGGGAACTCGCAGAC-3' [서열 번호 63]을 사용)을 표준 방법을 사용하여 애머샴 파마시아 바이오테크(코드 번호 27-9401-01)로부터 공급받은 Sfi I 및 Not I으로 사전 절단된 벡터, pCANTAB 5E로 라이게이션시켜 제작하였다. 생성된 pPrMBP의 개요가 도 31에 도시되어 있고, PrMBP의 뉴클레오타이드 서열을 서열 번호 58로서 나타내었다. PrMBP 삽입체에 의해 코딩된 아미노산 서열을 도 30에 도시하였다(서열 번호 59).
파지미드, pPhSP-D를, 인간 허파로 분리된 cDNA로부터 증폭된 Sfi I 및 Not I으로 제한 처리된 DNA 단편(참조: Lu, J., et al., Biochem J. 1992 Jun 15; 284:795-802)(올리고뉴클레오타이드 프라이머 SfiSP-D 5'-CGGCTGAGCGGCCCAGCCGGCCATGGCCGAGCCAAAGAAAGTTGAGCTCTTCCC-3' [서열 번호 64] 및 NotSP-D 5'-GCACTCCTGCGGCCGCGAACTCGCAGACCACAAGAC-3' [서열 번호 65]을 사용)을 표준 방법을 사용하여 애머샴 파마시아 바이오테크(코드 번호 27-9401-01)로부터 공급받은 Sfi I 및 Not I으로 사전 절단된 벡터, pCANTAB 5E로 라이게이션시켜 제작하였다. 생성된 pPrSP-D의 개요를 도 33에 도시하였고, PhSP-D의 뉴클레오타이드 서열을 서열 번호 60으로서 나타내었다. PrSP-D 삽입체에 의해 코딩된 아미노산 서열을 도 32에 도시하였다(서열 번호 61).
실시예 11
파지 라이브러리 PrMBP-1b001의 제작
PrMBP-CTLD (서열 번호 59) 위치 71번 내지 73번 또는 70번 내지 76번(루프 1), 및 97번 내지 101번 또는 100번 또는 101번(루프 4)에 해당하는 무작위 아미노산 잔기를 함유하는 파지 라이브러리 PrMBP-1b001을, 20㎍ sfiI 및 NotI으로 제한 처리된 pPrMBP 파지미드 DNA(실시예 10 참조)를 적절하게 무작위화된 루프 1 및 4 영역을 코딩하는 SfiI 및 NotI으로 제한 처리된 DNA 단편 집합체 10㎍과 라이게이션시켜 제작하였다. DNA 단편 집합체를, 표준 방법을 사용하여 프라이머로서 올리고뉴클레오타이드 Sfi-tag 5'-CGGCTGAGCGGCCCAGC-3'(서열 번호 74) 및 올리고뉴클레오타이드 Not-tag 5'-GCAGTCCTGCGGCCGCG-3'(서열 번호 75)를 사용하고 주형으로서 3개의 루프 4 DNA 단편 각각을 사용하여, 3개의 루프 1 DNA 단편 각각을 결합시키는 6개의 소위 어셈블리 반응으로부터 증폭시켰다. 3개의 루프 1 단편 각각은 프라이머로서 올리고뉴클레오타이드 MBPloop1a fo(서열 번호 66), MBPloop1b fo(서열 번호 67), 또는 MBPloop1c fo(서열 번호 68) 및 SfiMBP (서열 번호 62)를 사용하고 pPrMBP 파지미드 DNA(실시예 10 참조)를 주형으로서 사용한 1차 PCR 반응에서 증폭시켰고, Sfi-tag (서열 번호 74) 및 MBPloop1-tag fo(서열 번호 69)를 사용한 2차 PCR 반응에서 증폭시켰다. 3개의 DNA 루프 4 단편 각각을 표준 방법을 사용하여 프라이머로서 올리고뉴클레오타이드 MBPloop4a rev(서열 번호 71), MBPloop4b rev(서열 번호 72) 또는 MBPloop4c rev(서열 번호 73) 및 NotMBP(서열 번호 63)을 사용하고, 주형으로서 pPrMBP 파지미드 DNA(실시예 10 참조)를 사용하는 1차 PCR 반응에서 증폭시키고, MBPloop4-tag rev(서열 번호 70) 및 Not-tag(서열 번호 63)을 사용하는 2차 PCR 반응에서 추가로 증폭시켰다. 올리고뉴클레오타이드 서열에서 N은 각 뉴클레오타이드 T, C, G, 및 A를 25%씩 함유하는 혼합물을 의미하고, S는 C 및 G를 각각 50%씩 함유하는 혼합물을 의미하고 이들은 적절하게 무작위화된 뉴클레오타이드 서열을 코딩한다. 라이게이션 혼합물을 표준 방법을 사용하여 전기천공법에 의해 소위 E.coli TG-1 세포를 형질전환시키는 데 사용하였다. 형질전환 후에, E.coli TG-1 세포를 0.2㎎ 앰피실린/㎖ 및 2% 글루코오스를 함유하는 2xTY-아가 플레이트 상에 플레이팅하고, 30℃에서 밤새 인큐베이션하였다.
실시예 12
파지 라이브러리 PhSP-D-lb001의 제작
PhSP-D CTLD 삽입체 (서열 번호 61) 위치 74번 내지 76번 또는 73번 내지 79번(루프 1), 및 100번 내지 104번 또는 103번 내지 104번(루프 4)에 해당하는 무작위 아미노산 잔기를 함유하는 파지 라이브러리 PhSP-D-1b001을, 20㎍ SfiII 및 NotI으로 제한 처리된 pPhSP-D 파지미드 DNA(실시예 10 참조)를 적절하게 무작위화된 루프 1 및 4 영역을 코딩하는 SfiI 및 NotI으로 제한 처리된 DNA 단편 집합체 10㎍과 라이게이션시켜 제작하였다. DNA 단편 집합체를, 표준 방법을 사용하여 프라이머로서 올리고뉴클레오타이드 Sfi-tag 5'-CGGCTGAGCGGCCCAGC-3'(서열 번호 74) 및 올리고뉴클레오타이드 Not-tag 5'-GCACTCCTGCGGCCGCG-3'(서열 번호 75)를 사용하고 주형으로서 3개의 루프 4 DNA 단편 각각을 사용하여, 3개의 루프 1 DNA 단편 각각을 결합시키는 9개의 어셈블리 반응으로부터 증폭시켰다. 3개의 루프 1 단편 각각은 프라이머로서 올리고뉴클레오타이드 Sp-dloop1a fo(서열 번호 76), Sp-dloop1b fo(서열 번호 77), 또는 Sp-dloop1c fo(서열 번호 78) 및 SfiSp-D (서열 번호 64)를 사용하고 pPhSP-D 파지미드 DNA(실시예 10 참조)를 주형으로서 사용한 1차 PCR 반응에서 증폭시켰고, Sfi-tag (서열 번호 74) 및 Sp-dloop1-tag fo(서열 번호 79)를 사용한 2차 PCR 반응에서 증폭시켰다. 3개의 DNA 루프 4 단편 각각을 표준 방법을 사용하여 프라이머로서 올리고뉴클레오타이드 Sp-dloop4a rev(서열 번호 81), Sp-dloop4b rev(서열 번호 82) 또는 Sp-dloop4c rev(서열 번호 83) 및 NotSp-d(서열 번호 65)를 사용하고, 주형으로서 pPhSp-d 파지미드 DNA(실시예 10 참조)를 사용하는 1차 PCR 반응에서 증폭시키고, 프라이머로서 Sp-dloop4-tag rev(서열 번호 80) 및 Not-tag(서열 번호 75)를 사용하는 2차 PCR 반응에서 추가로 증폭시켰다. 올리고뉴클레오타이드 서열에서 N은 각 뉴클레오타이드 T, C, G, 및 A를 25%씩 함유하는 혼합물을 의미하고, S는 C 및 G를 각각 50%씩 함유하는 혼합물을 의미하고 이들은 적절하게 무작위화된 뉴클레오타이드 서열을 코딩한다. 라이게이션 혼합물을 표준 방법을 사용하여 전기천공법에 의해 소위 E.coli TG-1 세포를 형질전환시키는 데 사용하였다. 형질전환 후에, E.coli TG-1 세포를 0.2㎎ 앰피실린/㎖ 및 2% 글루코오스를 함유하는 2xTY-아가 플레이트 상에 플레이팅하고, 30℃에서 밤새 인큐베이션하였다.
실시예 13
파지 라이브러리 PhtCTLD-lb004의 제작
상기 실시예에 사용된 모든 뉴클레오타이드를 DNA 기술(Aarhus, Denmark)에 의해 공급하였다.
PhtCTLD (서열 번호 15) 위치 97번 내지 102번 또는 98번 내지 101번(루프 3) 및 위치 116번 내지 122번 또는 118번 내지 120번을 함유하는 파지 라이브러리 PhtCTLD-1b004를, 20㎍ KpnI 및 MunI로 제한 처리된 pPhtCTLD 파지미드 DNA를 무작위화된 루프 3 및 루프 5 영역을 코딩하는 10㎍의 KpnI 및 MunI 제한 처리된 DNA 단편 집합체와 라이게이션시켜 제작하였다. DNA 단편 집합체를 3개의 루프 3 DNA 단편 각각을 3개의 루프 5 DNA 단편 각각과 결합하는 9회의 1차 PCR 반응으로부터 증폭시켰다. 단편을 올리고뉴클레오타이드 loop3a(서열 번호 84), loop3b(서열 번호 85), 또는 loop3c(서열 번호 86)를 주형으로 사용하고, loop5a(서열 번호 87), loop5b(서열 번호 88), 또는 loop5c(서열 번호 89) 및 loop3-4rev(서열 번호 91)을 프라이머로 사용하여 증폭시켰다. DNA 단편을 1차 PCR 생성물을 주형으로 사용하고 올리고뉴클레오타이드 loop3-4rev(서열 번호 91) 및 loop3-4-5tag fo(서열 번호 90)을 프라이머로 사용하는 PCR 반응에서 증폭시켰다. 모든 PCR 반응을 표준 방법을 사용하여 수행하였다.
올리고뉴클레오타이드 서열에서 N은 각 뉴클레오타이드 T, C, G, 및 A를 25%씩 함유하는 혼합물을 의미하고, S는 C 및 G를 각각 50%씩 함유하는 혼합물을 의미하고 이들은 적절하게 무작위화된 뉴클레오타이드 서열을 코딩한다. 라이게이션 혼합물을 표준 방법을 사용하여 전기천공법에 의해 소위 일렉트로컴티턴트(electrocompetent) E.coli TG-1 세포를 형질전환시키는 데 사용하였다. 형질전환 후에, E.coli TG-1 세포를 0.2㎎ 앰피실린/㎖ 및 2% 글루코오스를 함유하는 2xTY-아가 플레이트 상에 플레이팅하고, 30℃에서 밤새 인큐베이션하였다.
생성된 라이브러리 PhtCTLD-1b004의 크기는 7×109 클론으로 측정되었다. 라이브러리의 16개 클론을 증식시키고, 파지 및 파지미드 DNA를 분리하였다. 루프 영역의 뉴클레오타이드 서열을 결정하였다(DNA 테크놀로지, Aarhus, Denmark). 13개 클론이 영역에서 프레임쉬프트 돌연변이를 함유하는 것으로 관찰되었다.
실시예 14
인간 혈청 알부민 상의 고정된 혈액 군 A 당 잔기에 결합하는 Phtlec-파지 및 PhtCTLD-파지의 선별
표준 방법을 사용하여, 라이브러리 Phtlec-1b001 및 Phtlec-1b002의 글리세롤 스탁으로부터 증식된 파지 및 라이브러리 PhtCTLD-1b003(실시예 5 참조)의 글리세롤 스탁으로부터 증식된 파지를, 표준 방법을 사용하여 96웰 맥시솔브 마이크로역가 플레이트(NUNC, Denmark) 중에서 패닝시켜, 인간 혈청 알부민 상에 고정된 혈액 군 A 당 잔기와의 특이적 친화도를 가지는 Phtlec- 및 PhtCTLD의 선별을 위하여 고안된 실험에서 사용하였다.
처음에는, 파지 상청액을 0.3 부피의 20% 폴리에틸렌 글리콜 6000(PEG) 및 2.5M NaCl의 용액으로 침전시키고 펠릿을 TE-완충액(10mM Tris-HCl pH8, 1mM EDTA) 중에 재현탁시켰다. E.coli TG-1 세포 상에서 적정한 후에, Phtlec-lb001 및 lb002로부터 유래된 파지를 1:1 비율로 혼합하고(#1), 2*TY 배지 중에서 2.5×pfu/㎖로 조절하였다.
3개의 웰 각각에서, 1마이크로그램의 "항원"인, 100㎕ PBS(PBS, 0.2g KCl, 0.2g KH2PO4, 8g NaCl, 1.44g Na2HPO4, 2H2O를 함유하고, 1L가 되도록 물이 첨가되고 NaOH로 pH를 7.4로 조절) 중의 인간 혈청 알부민, A-HA(글리코렉스 AB, Lund, Sweden) 상에 고정된 인간 혈액 군 A 트리사카라이드를 1시간 동안 4℃ 및 실온에서 밤새 코팅하는데 사용한 후에 1회 패닝을 수행하였다. PBS로 1회 세척한 후에, 웰을 PBS, 0.1% 트윈 20으로 1회 세척하고, PBS로 3회 세척한 후에, 파지 현탁액 50㎕ 및 50㎕ PBS, 6% 탈지분유를 첨가하였다. 결합된 파지를 실온에서 30분 동안 100㎕의 트립신 소화(1㎎/㎖ PBS 중의 트립신)에 의해 각 웰로부터 용출시키고, 이를 사용하여 기하급수적으로 증식하는 E.coli TG1 세포를 감염시킨 후에, 2% 글로코오스 및 0.1㎎/㎖ 앰피실린을 함유하는 2×TY 아가 플레이트 상에서 플레이팅하고 적정하였다.
2회 선별에서, 1회 생성 콜로니로부터 증식된 150㎕의 원액 파지 현탁액을 150㎕ PBS, 6% 탈지분유와 혼합하고, 앞서 기술된 바와 같이 3개의 A-HA 코팅된 웰 각각에 혼합물 100㎕를 분배하는 패닝을 위하여 사용하였다. 결합에 있어서의 스트린전시를 16회에서 32회로 세척 단계의 수를 증가시켜 증가시켰다. 300㎕의 파지 혼합물을 3개 웰 중의 패닝을 위하여 사용하였고 이는 대조군으로서 항원을 함유하지 않았다.
3회 선별에서, 1회 생성 콜로니로부터 증식된 150㎕의 원액 파지 현탁액을 150㎕ PBS, 6% 탈지분유와 혼합하고, 앞서 기술된 바와 같이 3개의 A-HA 코팅된 웰 각각에 혼합물 100㎕를 분배하는 패닝을 위하여 사용하였다. 세척 단계의 수는 다시 32회였다. 300㎕의 파지 혼합물을 3개 웰 중의 패닝을 위하여 사용하였고 이는 대조군으로서 항원을 함유하지 않았다.
선별 과정으로부터의 결과를 표 8에 요약하였다.
표 8: 패닝과 트립신 소화에 의한 용출에 의해 A-HA에 결합하는 Phtlec 파지(#1) 및 PhtCTLD 파지(#4)의 선별
A-HA 블랭크 비율
1회 #1 0.8×103 n.a. n.a.
#4 1.1×103 n.a. n.a.
2회 #1 1.0×103 0.5×102 20
#4 1.3×103 0.5×102 26
3회 #1 8.0×104 0.5×102 1600
#4 9.0×105 0.5×102 18000
n.a. 적용할 수 없음
#1 및 #4 시리즈 각각으로부터의 48개 클론을 피킹(picking)하여 96웰 마이크로역가 트레이 중에서 증식시켜, 표준 방법을 사용하여 M13K07 헬퍼 파지로 감염시켜 파지를 생성하였다. 96 파지 상청액으로부터의 파지를 ELISA-타입 검정을 사용하여 A-HA 항원과의 결합 및 암닭 달걀 흰자위 라이소자임과의 비특이적 결합에 대해여 분석하였다. 간략하게, 각 웰에 100㎕ PBS(PBS, 0.2g KCl, 0.2g KH2PO4, 8g NaCl, 1.44g Na2HPO4, 2H2O 함유, 1L가 되도록 물을 첨가하고 NaOH를 사용하여 pH를 7.4로 조절) 중의 A-HA 1㎍ 또는 100㎕ PBS (비특이적 결합의 분석을 위하여) 중의 암닭 달걀 흰자위 라이소자임을 1시간 동안 4℃ 및 실온에서 밤새 코팅하는데 사용하였다. PBS로 1회 세척한 후에, 웰을 실온에서 1시간 동안 300㎕ PBS 및 3% 탈지분유로 블록킹하였다. 블록킹시킨 후에, 웰을 PBS 및 0.1% 트윈20 중에서 1회 세척하고 PBS로 3회 세척한 후에, 50㎕ PBS 중의 50㎕ 파지 상청액, 6% 탈지분유를 첨가하였다. 파지 혼합물을 2시간 동안 실온에서 결합하도록 하고 PBS, 트윈 20으로 3회 세척하고 PBS로 3회 세척하였다. 세척 후에, 1:5000 희석율의 PBS, 3% 탈지분유 중의 HRP-컨쥬게이션된 항-유전자 VIII 항원(애머샴 파마시아 바이오테크) 50㎕를 각 웰에 첨가하여 1시간 동안 실온에서 인큐베이션시켰다. "2차" 항원을 결합시킨 후에, 웰을 PBS, 트윈 20으로 3회 세척하고 PBS로 3회 세척한 후에, 50㎕의 TMB 기질(DAKO-TMB 원-스텝 서브스트레이트 시스템, DAKO, Denmark)을 첨가하였다. 반응을 20분 동안 진행되도록 한 후에 0.5M H2SO4로 퀀칭시키고 분석하였다. ELISA 검정의 결과로부터, 1.5 이상의 A-HA에 대한 시그날 대 라이소자임에 대한 시그날 및 백그라운드 초과의 시그날 사이의 시그날 비율에 의해 판단된 바와 같이, 시리즈 모두에서 파지의 A-HA과의 특이적 결합과 관련하여 "히트(hits)"를 관찰하였다.
#1 시리즈로부터 13개의 히트를 확인하였고 #4 시리즈로부터 28개의 히트를 확인하였다.
참고 문헌
Figure 112003020953455-pct00010
Figure 112003020953455-pct00011
Figure 112003020953455-pct00012
Figure 112008041664115-pct00055
Figure 112003020953455-pct00014
Figure 112003020953455-pct00015
Figure 112003020953455-pct00016
Figure 112003020953455-pct00017
Figure 112003020953455-pct00018
Figure 112003020953455-pct00019
SEQUENCE LISTING <110> Borean Pharma A/S <120> Combinatorial libraries of proteins having the scaffold structure of C-type lectin-like domains <130> P200001100 WO JNy <140> <141> <150> DK PA 2000 01872 <151> 2000-12-13 <160> 91 <170> PatentIn Ver. 2.1 <210> 1 <211> 571 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (1)..(564) <223> FX-htlec encoding insert <400> 1 gga tcc atc gag ggt agg ggc gag cca cca acc cag aag ccc aag aag 48 Gly Ser Ile Glu Gly Arg Gly Glu Pro Pro Thr Gln Lys Pro Lys Lys 1 5 10 15 att gta aat gcc aag aaa gat gtt gtg aac aca aag atg ttt gag gag 96 Ile Val Asn Ala Lys Lys Asp Val Val Asn Thr Lys Met Phe Glu Glu 20 25 30 ctc aag agc cgt ctg gac acc ctg gcc cag gag gtg gcc ctg ctg aag 144 Leu Lys Ser Arg Leu Asp Thr Leu Ala Gln Glu Val Ala Leu Leu Lys 35 40 45 gag cag cag gcc ctg cag acg gtc gtc ctg aag ggg acc aag gtg cac 192 Glu Gln Gln Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val His 50 55 60 atg aaa gtc ttt ctg gcc ttc acc cag acg aag acc ttc cac gag gcc 240 Met Lys Val Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu Ala 65 70 75 80 agc gag gac tgc atc tcg cgc ggg ggc acc ctg agc acc cct cag act 288 Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln Thr 85 90 95 ggc tcg gag aac gac gcc ctg tat gag tac ctg cgc cag agc gtg ggc 336 Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val Gly 100 105 110 aac gag gcc gag atc tgg ctg ggc ctc aac gac atg gcg gcc gag ggc 384 Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly 115 120 125 acc tgg gtg gac atg acc ggt acc cgc atc gcc tac aag aac tgg gag 432 Thr Trp Val Asp Met Thr Gly Thr Arg Ile Ala Tyr Lys Asn Trp Glu 130 135 140 act gag atc acc gcg caa ccc gat ggc ggc aag acc gag aac tgc gcg 480 Thr Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu Asn Cys Ala 145 150 155 160 gtc ctg tca ggc gcg gcc aac ggc aag tgg ttc gac aag cgc tgc cgc 528 Val Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg 165 170 175 gat caa ttg ccc tac atc tgc cag ttc ggg atc gtg taagctt 571 Asp Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val 180 185 <210> 2 <211> 188 <212> PRT <213> Homo sapiens <400> 2 Gly Ser Ile Glu Gly Arg Gly Glu Pro Pro Thr Gln Lys Pro Lys Lys 1 5 10 15 Ile Val Asn Ala Lys Lys Asp Val Val Asn Thr Lys Met Phe Glu Glu 20 25 30 Leu Lys Ser Arg Leu Asp Thr Leu Ala Gln Glu Val Ala Leu Leu Lys 35 40 45 Glu Gln Gln Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val His 50 55 60 Met Lys Val Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu Ala 65 70 75 80 Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln Thr 85 90 95 Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val Gly 100 105 110 Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly 115 120 125 Thr Trp Val Asp Met Thr Gly Thr Arg Ile Ala Tyr Lys Asn Trp Glu 130 135 140 Thr Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu Asn Cys Ala 145 150 155 160 Val Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg 165 170 175 Asp Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val 180 185 <210> 3 <211> 436 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (1)..(429) <223> FX-htCTLD encoding insert <400> 3 gga tcc atc gag ggt agg gcc ctg cag acg gtc gtc ctg aag ggg acc 48 Gly Ser Ile Glu Gly Arg Ala Leu Gln Thr Val Val Leu Lys Gly Thr 1 5 10 15 aag gtg cac atg aaa gtc ttt ctg gcc ttc acc cag acg aag acc ttc 96 Lys Val His Met Lys Val Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe 20 25 30 cac gag gcc agc gag gac tgc atc tcg cgc ggg ggc acc ctg agc acc 144 His Glu Ala Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr 35 40 45 cct cag act ggc tcg gag aac gac gcc ctg tat gag tac ctg cgc cag 192 Pro Gln Thr Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln 50 55 60 agc gtg ggc aac gag gcc gag atc tgg ctg ggc ctc aac gac atg gcg 240 Ser Val Gly Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala 65 70 75 80 gcc gag ggc acc tgg gtg gac atg acc ggt acc cgc atc gcc tac aag 288 Ala Glu Gly Thr Trp Val Asp Met Thr Gly Thr Arg Ile Ala Tyr Lys 85 90 95 aac tgg gag act gag atc acc gcg caa ccc gat ggc ggc aag acc gag 336 Asn Trp Glu Thr Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu 100 105 110 aac tgc gcg gtc ctg tca ggc gcg gcc aac ggc aag tgg ttc gac aag 384 Asn Cys Ala Val Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys 115 120 125 cgc tgc cgc gat caa ttg ccc tac atc tgc cag ttc ggg atc gtg 429 Arg Cys Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val 130 135 140 taagctt 436 <210> 4 <211> 143 <212> PRT <213> Homo sapiens <400> 4 Gly Ser Ile Glu Gly Arg Ala Leu Gln Thr Val Val Leu Lys Gly Thr 1 5 10 15 Lys Val His Met Lys Val Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe 20 25 30 His Glu Ala Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr 35 40 45 Pro Gln Thr Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln 50 55 60 Ser Val Gly Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala 65 70 75 80 Ala Glu Gly Thr Trp Val Asp Met Thr Gly Thr Arg Ile Ala Tyr Lys 85 90 95 Asn Trp Glu Thr Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu 100 105 110 Asn Cys Ala Val Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys 115 120 125 Arg Cys Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val 130 135 140 <210> 5 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 5 cggctgagcg gcccagccgg ccatggccga gccaccaacc cagaagc 47 <210> 6 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 6 cctgcggccg ccacgatccc gaactgg 27 <210> 7 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 7 cggctgagcg gcccagccgg ccatggccgc cctgcagacg gtc 43 <210> 8 <211> 570 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (8)..(565) <223> PhTN encoding insert <400> 8 ggcccag ccg gcc atg gcc gag cca cca acc cag aag ccc aag aag att 49 Pro Ala Met Ala Glu Pro Pro Thr Gln Lys Pro Lys Lys Ile 1 5 10 gta aat gcc aag aaa gat gtt gtg aac aca aag atg ttt gag gag ctc 97 Val Asn Ala Lys Lys Asp Val Val Asn Thr Lys Met Phe Glu Glu Leu 15 20 25 30 aag agc cgt ctg gac acc ctg gcc cag gag gtg gcc ctg ctg aag gag 145 Lys Ser Arg Leu Asp Thr Leu Ala Gln Glu Val Ala Leu Leu Lys Glu 35 40 45 cag cag gcc ctg cag acg gtc tgc ctg aag ggg acc aag gtg cac atg 193 Gln Gln Ala Leu Gln Thr Val Cys Leu Lys Gly Thr Lys Val His Met 50 55 60 aaa tgc ttt ctg gcc ttc acc cag acg aag acc ttc cac gag gcc agc 241 Lys Cys Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu Ala Ser 65 70 75 gag gac tgc atc tcg cgc ggg ggc acc ctg agc acc cct cag act ggc 289 Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln Thr Gly 80 85 90 tcg gag aac gac gcc ctg tat gag tac ctg cgc cag agc gtg ggc aac 337 Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val Gly Asn 95 100 105 110 gag gcc gag atc tgg ctg ggc ctc aac gac atg gcg gcc gag ggc acc 385 Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly Thr 115 120 125 tgg gtg gac atg acc ggc gcc cgc atc gcc tac aag aac tgg gag act 433 Trp Val Asp Met Thr Gly Ala Arg Ile Ala Tyr Lys Asn Trp Glu Thr 130 135 140 gag atc acc gcg caa ccc gat ggc ggc aag acc gag aac tgc gcg gtc 481 Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu Asn Cys Ala Val 145 150 155 ctg tca ggc gcg gcc aac ggc aag tgg ttc gac aag cgc tgc cgc gat 529 Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg Asp 160 165 170 cag ctg ccc tac atc tgc cag ttc ggg atc gtg gcg gccgc 570 Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val Ala 175 180 185 <210> 9 <211> 186 <212> PRT <213> Homo sapiens <400> 9 Pro Ala Met Ala Glu Pro Pro Thr Gln Lys Pro Lys Lys Ile Val Asn 1 5 10 15 Ala Lys Lys Asp Val Val Asn Thr Lys Met Phe Glu Glu Leu Lys Ser 20 25 30 Arg Leu Asp Thr Leu Ala Gln Glu Val Ala Leu Leu Lys Glu Gln Gln 35 40 45 Ala Leu Gln Thr Val Cys Leu Lys Gly Thr Lys Val His Met Lys Cys 50 55 60 Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu Ala Ser Glu Asp 65 70 75 80 Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln Thr Gly Ser Glu 85 90 95 Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val Gly Asn Glu Ala 100 105 110 Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly Thr Trp Val 115 120 125 Asp Met Thr Gly Ala Arg Ile Ala Tyr Lys Asn Trp Glu Thr Glu Ile 130 135 140 Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu Asn Cys Ala Val Leu Ser 145 150 155 160 Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg Asp Gln Leu 165 170 175 Pro Tyr Ile Cys Gln Phe Gly Ile Val Ala 180 185 <210> 10 <211> 438 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (8)..(433) <223> PhTN3 encoding insert <400> 10 ggcccag ccg gcc atg gcc gcc ctg cag acg gtc tgc ctg aag ggg acc 49 Pro Ala Met Ala Ala Leu Gln Thr Val Cys Leu Lys Gly Thr 1 5 10 aag gtg cac atg aaa tgc ttt ctg gcc ttc acc cag acg aag acc ttc 97 Lys Val His Met Lys Cys Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe 15 20 25 30 cac gag gcc agc gag gac tgc atc tcg cgc ggg ggc acc ctg agc acc 145 His Glu Ala Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr 35 40 45 cct cag act ggc tcg gag aac gac gcc ctg tat gag tac ctg cgc cag 193 Pro Gln Thr Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln 50 55 60 agc gtg ggc aac gag gcc gag atc tgg ctg ggc ctc aac gac atg gcg 241 Ser Val Gly Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala 65 70 75 gcc gag ggc acc tgg gtg gac atg acc ggc gcc cgc atc gcc tac aag 289 Ala Glu Gly Thr Trp Val Asp Met Thr Gly Ala Arg Ile Ala Tyr Lys 80 85 90 aac tgg gag act gag atc acc gcg caa ccc gat ggc ggc aag acc gag 337 Asn Trp Glu Thr Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu 95 100 105 110 aac tgc gcg gtc ctg tca ggc gcg gcc aac ggc aag tgg ttc gac aag 385 Asn Cys Ala Val Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys 115 120 125 cgc tgc cgc gat cag ctg ccc tac atc tgc cag ttc ggg atc gtg gcg 433 Arg Cys Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val Ala 130 135 140 gccgc 438 <210> 11 <211> 142 <212> PRT <213> Homo sapiens <400> 11 Pro Ala Met Ala Ala Leu Gln Thr Val Cys Leu Lys Gly Thr Lys Val 1 5 10 15 His Met Lys Cys Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu 20 25 30 Ala Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln 35 40 45 Thr Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val 50 55 60 Gly Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu 65 70 75 80 Gly Thr Trp Val Asp Met Thr Gly Ala Arg Ile Ala Tyr Lys Asn Trp 85 90 95 Glu Thr Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu Asn Cys 100 105 110 Ala Val Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys 115 120 125 Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val Ala 130 135 140 <210> 12 <211> 570 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (8)..(565) <223> Phtlec encoding insert <400> 12 ggcccag ccg gcc atg gcc gag cca cca acc cag aag ccc aag aag att 49 Pro Ala Met Ala Glu Pro Pro Thr Gln Lys Pro Lys Lys Ile 1 5 10 gta aat gcc aag aaa gat gtt gtg aac aca aag atg ttt gag gag ctc 97 Val Asn Ala Lys Lys Asp Val Val Asn Thr Lys Met Phe Glu Glu Leu 15 20 25 30 aag agc cgt ctg gac acc ctg gcc cag gag gtg gcc ctg ctg aag gag 145 Lys Ser Arg Leu Asp Thr Leu Ala Gln Glu Val Ala Leu Leu Lys Glu 35 40 45 cag cag gcc ctg cag acg gtc gtc ctg aag ggg acc aag gtg cac atg 193 Gln Gln Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val His Met 50 55 60 aaa gtc ttt ctg gcc ttc acc cag acg aag acc ttc cac gag gcc agc 241 Lys Val Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu Ala Ser 65 70 75 gag gac tgc atc tcg cgc ggg ggc acc ctg agc acc cct cag act ggc 289 Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln Thr Gly 80 85 90 tcg gag aac gac gcc ctg tat gag tac ctg cgc cag agc gtg ggc aac 337 Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val Gly Asn 95 100 105 110 gag gcc gag atc tgg ctg ggc ctc aac gac atg gcg gcc gag ggc acc 385 Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly Thr 115 120 125 tgg gtg gac atg acc ggt acc cgc atc gcc tac aag aac tgg gag act 433 Trp Val Asp Met Thr Gly Thr Arg Ile Ala Tyr Lys Asn Trp Glu Thr 130 135 140 gag atc acc gcg caa ccc gat ggc ggc aag acc gag aac tgc gcg gtc 481 Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu Asn Cys Ala Val 145 150 155 ctg tca ggc gcg gcc aac ggc aag tgg ttc gac aag cgc tgc cgc gat 529 Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg Asp 160 165 170 caa ttg ccc tac atc tgc cag ttc ggg atc gtg gcg gccgc 570 Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val Ala 175 180 185 <210> 13 <211> 186 <212> PRT <213> Homo sapiens <400> 13 Pro Ala Met Ala Glu Pro Pro Thr Gln Lys Pro Lys Lys Ile Val Asn 1 5 10 15 Ala Lys Lys Asp Val Val Asn Thr Lys Met Phe Glu Glu Leu Lys Ser 20 25 30 Arg Leu Asp Thr Leu Ala Gln Glu Val Ala Leu Leu Lys Glu Gln Gln 35 40 45 Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val His Met Lys Val 50 55 60 Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu Ala Ser Glu Asp 65 70 75 80 Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln Thr Gly Ser Glu 85 90 95 Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val Gly Asn Glu Ala 100 105 110 Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly Thr Trp Val 115 120 125 Asp Met Thr Gly Thr Arg Ile Ala Tyr Lys Asn Trp Glu Thr Glu Ile 130 135 140 Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu Asn Cys Ala Val Leu Ser 145 150 155 160 Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg Asp Gln Leu 165 170 175 Pro Tyr Ile Cys Gln Phe Gly Ile Val Ala 180 185 <210> 14 <211> 438 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (8)..(433) <223> PhtCTLD encoding insert <400> 14 ggcccag ccg gcc atg gcc gcc ctg cag acg gtc gtc ctg aag ggg acc 49 Pro Ala Met Ala Ala Leu Gln Thr Val Val Leu Lys Gly Thr 1 5 10 aag gtg cac atg aaa gtc ttt ctg gcc ttc acc cag acg aag acc ttc 97 Lys Val His Met Lys Val Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe 15 20 25 30 cac gag gcc agc gag gac tgc atc tcg cgc ggg ggc acc ctg agc acc 145 His Glu Ala Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr 35 40 45 cct cag act ggc tcg gag aac gac gcc ctg tat gag tac ctg cgc cag 193 Pro Gln Thr Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln 50 55 60 agc gtg ggc aac gag gcc gag atc tgg ctg ggc ctc aac gac atg gcg 241 Ser Val Gly Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala 65 70 75 gcc gag ggc acc tgg gtg gac atg acc ggt acc cgc atc gcc tac aag 289 Ala Glu Gly Thr Trp Val Asp Met Thr Gly Thr Arg Ile Ala Tyr Lys 80 85 90 aac tgg gag act gag atc acc gcg caa ccc gat ggc ggc aag acc gag 337 Asn Trp Glu Thr Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu 95 100 105 110 aac tgc gcg gtc ctg tca ggc gcg gcc aac ggc aag tgg ttc gac aag 385 Asn Cys Ala Val Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys 115 120 125 cgc tgc cgc gat caa ttg ccc tac atc tgc cag ttc ggg atc gtg gcg 433 Arg Cys Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val Ala 130 135 140 gccgc 438 <210> 15 <211> 142 <212> PRT <213> Homo sapiens <400> 15 Pro Ala Met Ala Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val 1 5 10 15 His Met Lys Val Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu 20 25 30 Ala Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln 35 40 45 Thr Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val 50 55 60 Gly Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu 65 70 75 80 Gly Thr Trp Val Asp Met Thr Gly Thr Arg Ile Ala Tyr Lys Asn Trp 85 90 95 Glu Thr Glu Ile Thr Ala Gln Pro Asp Gly Gly Lys Thr Glu Asn Cys 100 105 110 Ala Val Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys 115 120 125 Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Gly Ile Val Ala 130 135 140 <210> 16 <211> 555 <212> DNA <213> Mus musculus <220> <223> EcoRI to HindIII insert containing mtlec encoding part <400> 16 ggaattcgag tcacccactc ccaaggccaa gaaggctgca aatgccaaga aagatttggt 60 gagctcaaag atgtcgagga gctcaagaac aggatggatg tcctggccca ggaggtggcc 120 ctgctgaagg agaagcaggc cttacagact gtggtcctga agggcaccaa ggtgaacttg 180 aaggtcctcc tggccttcac ccaaccgaag accttccatg aggcgagcga ggactgcatc 240 tcgcaagggg gcacgctggg caccccgcag tcagagctag agaacgaggc gctgttcgag 300 tacgcgcgcc acagcgtggg caacgatgcg gagatctggc tgggcctcaa cgacatggcc 360 gcggaaggcg cctgggtgga catgaccggt accctcctgg cctacaagaa ctgggagacg 420 gagatcacga cgcaacccga cggcggcaaa gccgagaact gcgccgccct gtctggcgca 480 gccaacggca agtggttcga caagcgatgc cgcgatcaat tgccctacat ctgccagttt 540 gccattgtga agctt 555 <210> 17 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 17 cggaattcga gtcacccact cccaaggcca agaaggctgc aaatgccaag aaagatttgg 60 tgagctcaaa gatgttc 77 <210> 18 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 18 gcggatccag gcctgcttct ccttcagcag ggccacctcc tgggccagga catccatcct 60 gttcttgagc tcctcgaaca tctttgagct cacc 94 <210> 19 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 19 gcaggcctta cagactgtgt gcctgaaggg caccaaggtg aacttgaagt gcctcctggc 60 cttcacccaa ccgaagacct tccatgaggc gagcgag 97 <210> 20 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 20 ccgcatgctt cgaacagcgc ctcgttctct agctctgact gcggggtgcc cagcgtgccc 60 ccttgcgaga tgcagtcctc gctcgcctca tgg 93 <210> 21 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 21 ggttcgaata cgcgcgccac agcgtgggca acgatgcgga gatctaaatg ctcccaattg 60 c 61 <210> 22 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 22 ccaagcttca caatggcaaa ctggcagatg tagggcaatt gggagcattt agatc 55 <210> 23 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 23 cggagatctg gctgggcctc aacgacatgg ccgcggaagg cgcctgggtg gacatgaccg 60 gtaccctcct ggcctacaag aactgg 86 <210> 24 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 24 gggcaattga tcgcggcatc gcttgtcgaa cctcttgccg ttggctgcgc cagacagggc 60 ggcgcagttc tcggctttgc cgccgtcggg ttgcgtcgtg atctccgtct cccagttctt 120 gtaggccagg 130 <210> 25 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 25 ctgggatcca tccagggtcg cgagtcaccc actcccaagg 40 <210> 26 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 26 ccgaagctta cacaatggca aactggc 27 <210> 27 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 27 ctgggatcca tccagggtcg cgccttacag actgtggtc 39 <210> 28 <211> 568 <212> DNA <213> Mus musculus <220> <221> CDS <222> (1)..(561) <223> FX-mtlec encoding insert <400> 28 gga tcc atc cag ggt cgc gag tca ccc act ccc aag gcc aag aag gct 48 Gly Ser Ile Gln Gly Arg Glu Ser Pro Thr Pro Lys Ala Lys Lys Ala 1 5 10 15 gca aat gcc aag aaa gat ttg gtg agc tca aag atg ttc gag gag ctc 96 Ala Asn Ala Lys Lys Asp Leu Val Ser Ser Lys Met Phe Glu Glu Leu 20 25 30 aag aac agg atg gat gtc ctg gcc cag gag gtg gcc ctg ctg aag gag 144 Lys Asn Arg Met Asp Val Leu Ala Gln Glu Val Ala Leu Leu Lys Glu 35 40 45 aag cag gcc tta cag act gtg gtc ctg aag ggc acc aag gtg aac ttg 192 Lys Gln Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val Asn Leu 50 55 60 aag gtc ctc ctg gcc ttc acc caa ccg aag acc ttc cat gag gcg agc 240 Lys Val Leu Leu Ala Phe Thr Gln Pro Lys Thr Phe His Glu Ala Ser 65 70 75 80 gag gac tgc atc tcg caa ggg ggc acg ctg ggc acc ccg cag tca gag 288 Glu Asp Cys Ile Ser Gln Gly Gly Thr Leu Gly Thr Pro Gln Ser Glu 85 90 95 cta gag aac gag gcg ctg ttc gag tac gcg cgc cac agc gtg ggc aac 336 Leu Glu Asn Glu Ala Leu Phe Glu Tyr Ala Arg His Ser Val Gly Asn 100 105 110 gat gcg gag atc tgg ctg ggc ctc aac gac atg gcc gcg gaa ggc gcc 384 Asp Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly Ala 115 120 125 tgg gtg gac atg acc ggt acc ctc ctg gcc tac aag aac tgg gag acg 432 Trp Val Asp Met Thr Gly Thr Leu Leu Ala Tyr Lys Asn Trp Glu Thr 130 135 140 gag atc acg acg caa ccc gac ggc ggc aaa gcc gag aac tgc gcc gcc 480 Glu Ile Thr Thr Gln Pro Asp Gly Gly Lys Ala Glu Asn Cys Ala Ala 145 150 155 160 ctg tct ggc gca gcc aac ggc aag tgg ttc gac aag cga tgc cgc gat 528 Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg Asp 165 170 175 caa ttg ccc tac atc tgc cag ttt gcc att gtg taagctt 568 Gln Leu Pro Tyr Ile Cys Gln Phe Ala Ile Val 180 185 <210> 29 <211> 187 <212> PRT <213> Mus musculus <400> 29 Gly Ser Ile Gln Gly Arg Glu Ser Pro Thr Pro Lys Ala Lys Lys Ala 1 5 10 15 Ala Asn Ala Lys Lys Asp Leu Val Ser Ser Lys Met Phe Glu Glu Leu 20 25 30 Lys Asn Arg Met Asp Val Leu Ala Gln Glu Val Ala Leu Leu Lys Glu 35 40 45 Lys Gln Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val Asn Leu 50 55 60 Lys Val Leu Leu Ala Phe Thr Gln Pro Lys Thr Phe His Glu Ala Ser 65 70 75 80 Glu Asp Cys Ile Ser Gln Gly Gly Thr Leu Gly Thr Pro Gln Ser Glu 85 90 95 Leu Glu Asn Glu Ala Leu Phe Glu Tyr Ala Arg His Ser Val Gly Asn 100 105 110 Asp Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly Ala 115 120 125 Trp Val Asp Met Thr Gly Thr Leu Leu Ala Tyr Lys Asn Trp Glu Thr 130 135 140 Glu Ile Thr Thr Gln Pro Asp Gly Gly Lys Ala Glu Asn Cys Ala Ala 145 150 155 160 Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg Asp 165 170 175 Gln Leu Pro Tyr Ile Cys Gln Phe Ala Ile Val 180 185 <210> 30 <211> 436 <212> DNA <213> Mus musculus <220> <221> CDS <222> (1)..(429) <223> FX-mtCTLD encoding insert <400> 30 gga tcc atc cag ggt cgc gcc tta cag act gtg gtc ctg aag ggc acc 48 Gly Ser Ile Gln Gly Arg Ala Leu Gln Thr Val Val Leu Lys Gly Thr 1 5 10 15 aag gtg aac ttg aag gtc ctc ctg gcc ttc acc caa ccg aag acc ttc 96 Lys Val Asn Leu Lys Val Leu Leu Ala Phe Thr Gln Pro Lys Thr Phe 20 25 30 cat gag gcg agc gag gac tgc atc tcg caa ggg ggc acg ctg ggc acc 144 His Glu Ala Ser Glu Asp Cys Ile Ser Gln Gly Gly Thr Leu Gly Thr 35 40 45 ccg cag tca gag cta gag aac gag gcg ctg ttc gag tac gcg cgc cac 192 Pro Gln Ser Glu Leu Glu Asn Glu Ala Leu Phe Glu Tyr Ala Arg His 50 55 60 agc gtg ggc aac gat gcg gag atc tgg ctg ggc ctc aac gac atg gcc 240 Ser Val Gly Asn Asp Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala 65 70 75 80 gcg gaa ggc gcc tgg gtg gac atg acc ggt acc ctc ctg gcc tac aag 288 Ala Glu Gly Ala Trp Val Asp Met Thr Gly Thr Leu Leu Ala Tyr Lys 85 90 95 aac tgg gag acg gag atc acg acg caa ccc gac ggc ggc aaa gcc gag 336 Asn Trp Glu Thr Glu Ile Thr Thr Gln Pro Asp Gly Gly Lys Ala Glu 100 105 110 aac tgc gcc gcc ctg tct ggc gca gcc aac ggc aag tgg ttc gac aag 384 Asn Cys Ala Ala Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys 115 120 125 cga tgc cgc gat caa ttg ccc tac atc tgc cag ttt gcc att gtg 429 Arg Cys Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Ala Ile Val 130 135 140 taagctt 436 <210> 31 <211> 143 <212> PRT <213> Mus musculus <400> 31 Gly Ser Ile Gln Gly Arg Ala Leu Gln Thr Val Val Leu Lys Gly Thr 1 5 10 15 Lys Val Asn Leu Lys Val Leu Leu Ala Phe Thr Gln Pro Lys Thr Phe 20 25 30 His Glu Ala Ser Glu Asp Cys Ile Ser Gln Gly Gly Thr Leu Gly Thr 35 40 45 Pro Gln Ser Glu Leu Glu Asn Glu Ala Leu Phe Glu Tyr Ala Arg His 50 55 60 Ser Val Gly Asn Asp Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala 65 70 75 80 Ala Glu Gly Ala Trp Val Asp Met Thr Gly Thr Leu Leu Ala Tyr Lys 85 90 95 Asn Trp Glu Thr Glu Ile Thr Thr Gln Pro Asp Gly Gly Lys Ala Glu 100 105 110 Asn Cys Ala Ala Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys 115 120 125 Arg Cys Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Ala Ile Val 130 135 140 <210> 32 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 32 cggctgagcg gcccagccgg ccatggccga gtcacccact cccaagg 47 <210> 33 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 33 cctgcggccg ccacgatccc gaactgg 27 <210> 34 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Primer <400> 34 cggctgagcg gcccagccgg ccatggccgc cttacagact gtggtc 46 <210> 35 <211> 570 <212> DNA <213> Mus musculus <220> <221> CDS <222> (8)..(565) <223> Pmtlec encoding insert <400> 35 ggcccag ccg gcc atg gcc gag tca ccc act ccc aag gcc aag aag gct 49 Pro Ala Met Ala Glu Ser Pro Thr Pro Lys Ala Lys Lys Ala 1 5 10 gca aat gcc aag aaa gat ttg gtg agc tca aag atg ttc gag gag ctc 97 Ala Asn Ala Lys Lys Asp Leu Val Ser Ser Lys Met Phe Glu Glu Leu 15 20 25 30 aag aac agg atg gat gtc ctg gcc cag gag gtg gcc ctg ctg aag gag 145 Lys Asn Arg Met Asp Val Leu Ala Gln Glu Val Ala Leu Leu Lys Glu 35 40 45 aag cag gcc tta cag act gtg gtc ctg aag ggc acc aag gtg aac ttg 193 Lys Gln Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val Asn Leu 50 55 60 aag gtc ctc ctg gcc ttc acc caa ccg aag acc ttc cat gag gcg agc 241 Lys Val Leu Leu Ala Phe Thr Gln Pro Lys Thr Phe His Glu Ala Ser 65 70 75 gag gac tgc atc tcg caa ggg ggc acg ctg ggc acc ccg cag tca gag 289 Glu Asp Cys Ile Ser Gln Gly Gly Thr Leu Gly Thr Pro Gln Ser Glu 80 85 90 cta gag aac gag gcg ctg ttc gag tac gcg cgc cac agc gtg ggc aac 337 Leu Glu Asn Glu Ala Leu Phe Glu Tyr Ala Arg His Ser Val Gly Asn 95 100 105 110 gat gcg gag atc tgg ctg ggc ctc aac gac atg gcc gcg gaa ggc gcc 385 Asp Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly Ala 115 120 125 tgg gtg gac atg acc ggt acc ctc ctg gcc tac aag aac tgg gag acg 433 Trp Val Asp Met Thr Gly Thr Leu Leu Ala Tyr Lys Asn Trp Glu Thr 130 135 140 gag atc acg acg caa ccc gac ggc ggc aaa gcc gag aac tgc gcc gcc 481 Glu Ile Thr Thr Gln Pro Asp Gly Gly Lys Ala Glu Asn Cys Ala Ala 145 150 155 ctg tct ggc gca gcc aac ggc aag tgg ttc gac aag cga tgc cgc gat 529 Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg Asp 160 165 170 caa ttg ccc tac atc tgc cag ttt gcc att gtg gcg gccgc 570 Gln Leu Pro Tyr Ile Cys Gln Phe Ala Ile Val Ala 175 180 185 <210> 36 <211> 186 <212> PRT <213> Mus musculus <400> 36 Pro Ala Met Ala Glu Ser Pro Thr Pro Lys Ala Lys Lys Ala Ala Asn 1 5 10 15 Ala Lys Lys Asp Leu Val Ser Ser Lys Met Phe Glu Glu Leu Lys Asn 20 25 30 Arg Met Asp Val Leu Ala Gln Glu Val Ala Leu Leu Lys Glu Lys Gln 35 40 45 Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val Asn Leu Lys Val 50 55 60 Leu Leu Ala Phe Thr Gln Pro Lys Thr Phe His Glu Ala Ser Glu Asp 65 70 75 80 Cys Ile Ser Gln Gly Gly Thr Leu Gly Thr Pro Gln Ser Glu Leu Glu 85 90 95 Asn Glu Ala Leu Phe Glu Tyr Ala Arg His Ser Val Gly Asn Asp Ala 100 105 110 Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu Gly Ala Trp Val 115 120 125 Asp Met Thr Gly Thr Leu Leu Ala Tyr Lys Asn Trp Glu Thr Glu Ile 130 135 140 Thr Thr Gln Pro Asp Gly Gly Lys Ala Glu Asn Cys Ala Ala Leu Ser 145 150 155 160 Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys Arg Asp Gln Leu 165 170 175 Pro Tyr Ile Cys Gln Phe Ala Ile Val Ala 180 185 <210> 37 <211> 438 <212> DNA <213> Mus musculus <220> <221> CDS <222> (8)..(433) <223> PmtCTLD encoding insert <400> 37 ggcccag ccg gcc atg gcc gcc tta cag act gtg gtc ctg aag ggc acc 49 Pro Ala Met Ala Ala Leu Gln Thr Val Val Leu Lys Gly Thr 1 5 10 aag gtg aac ttg aag gtc ctc ctg gcc ttc acc caa ccg aag acc ttc 97 Lys Val Asn Leu Lys Val Leu Leu Ala Phe Thr Gln Pro Lys Thr Phe 15 20 25 30 cat gag gcg agc gag gac tgc atc tcg caa ggg ggc acg ctg ggc acc 145 His Glu Ala Ser Glu Asp Cys Ile Ser Gln Gly Gly Thr Leu Gly Thr 35 40 45 ccg cag tca gag cta gag aac gag gcg ctg ttc gag tac gcg cgc cac 193 Pro Gln Ser Glu Leu Glu Asn Glu Ala Leu Phe Glu Tyr Ala Arg His 50 55 60 agc gtg ggc aac gat gcg gag atc tgg ctg ggc ctc aac gac atg gcc 241 Ser Val Gly Asn Asp Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala 65 70 75 gcg gaa ggc gcc tgg gtg gac atg acc ggt acc ctc ctg gcc tac aag 289 Ala Glu Gly Ala Trp Val Asp Met Thr Gly Thr Leu Leu Ala Tyr Lys 80 85 90 aac tgg gag acg gag atc acg acg caa ccc gac ggc ggc aaa gcc gag 337 Asn Trp Glu Thr Glu Ile Thr Thr Gln Pro Asp Gly Gly Lys Ala Glu 95 100 105 110 aac tgc gcc gcc ctg tct ggc gca gcc aac ggc aag tgg ttc gac aag 385 Asn Cys Ala Ala Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys 115 120 125 cga tgc cgc gat caa ttg ccc tac atc tgc cag ttt gcc att gtg gcg 433 Arg Cys Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Ala Ile Val Ala 130 135 140 gccgc 438 <210> 38 <211> 142 <212> PRT <213> Mus musculus <400> 38 Pro Ala Met Ala Ala Leu Gln Thr Val Val Leu Lys Gly Thr Lys Val 1 5 10 15 Asn Leu Lys Val Leu Leu Ala Phe Thr Gln Pro Lys Thr Phe His Glu 20 25 30 Ala Ser Glu Asp Cys Ile Ser Gln Gly Gly Thr Leu Gly Thr Pro Gln 35 40 45 Ser Glu Leu Glu Asn Glu Ala Leu Phe Glu Tyr Ala Arg His Ser Val 50 55 60 Gly Asn Asp Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu 65 70 75 80 Gly Ala Trp Val Asp Met Thr Gly Thr Leu Leu Ala Tyr Lys Asn Trp 85 90 95 Glu Thr Glu Ile Thr Thr Gln Pro Asp Gly Gly Lys Ala Glu Asn Cys 100 105 110 Ala Ala Leu Ser Gly Ala Ala Asn Gly Lys Trp Phe Asp Lys Arg Cys 115 120 125 Arg Asp Gln Leu Pro Tyr Ile Cys Gln Phe Ala Ile Val Ala 130 135 140 <210> 39 <211> 116 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 39 cgcctacaag aactggnnsn nsnnsnnsnn snnscaaccc gatnnsnnsn nsnnsgagaa 60 ctgcgcggtc ctgtcaggcg cggccaacgg caagtggnns gacaagcgct gccgcg 116 <210> 40 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 40 gaccggtacc cgcatcgcct acaagaactg g 31 <210> 41 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 41 gtagggcaat tgatcgcggc agcgcttgtc 30 <210> 42 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 42 gctgggcctc aacgacnnsn nsnnsgagnn snnstgggtg gacatgaccg gtacccgcat 60 cgcctacaag aactgggaga ctgagatcac cgcg 94 <210> 43 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 43 cgcggcagcg cttgtcgaac cacttgccgt tggccgcgcc tgacaggacc gcgcagttct 60 csnnsnnsnn snnatcgggt tgcgcggtga tctcagtctc cc 102 <210> 44 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 44 cgaggccgag atctggctgg gcctcaacga c 31 <210> 45 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 45 gggcaacgag gccgagatct ggctgggcct c 31 <210> 46 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 46 cctgaccctg cagcgcttg 19 <210> 47 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 47 cgagatctgg ctgggcctca acgacnnsnn snnsnnsnns nnsgagggca cctgggtgga 60 catgaccggt acccgcatcg c 81 <210> 48 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 48 cgagatctgg ctgggcctca acgacnnsnn snnsnnsnns gagggcacct gggtggacat 60 gaccggtacc cgcatcgc 78 <210> 49 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 49 gctgggcctc aacgacnnsn nsnnsgagnn snnstgggtg gacatgaccg gtacccgcat 60 cgcctacaag aactgggaga ctgagatcac cgcg 94 <210> 50 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 50 gcgatgcggg taccggtc 18 <210> 51 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 51 gcatcgccta caagaactgg gagactgaga tcaccgcgca acccgatggc ggcnnsnnsn 60 nsnnsnnsnn sgagaactgc gcggtcctg 89 <210> 52 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 52 gcatcgccta caagaactgg gagactgaga tcaccgcgca acccgatggc ggcnnsnnsn 60 nsnnsnnsga gaactgcgcg gtcctg 86 <210> 53 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 53 catgaccggt acccgcatcg cctacaagaa ctgg 34 <210> 54 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 54 cctgaccctg cagcgcttgt cgaaccactt gccgttggcc gcgcctgaca ggaccgcgca 60 gttctc 66 <210> 55 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 55 ggtacctaag tgacgatatc ctgacctaac tgcagggatc aattg 45 <210> 56 <211> 343 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (8)..(274) <223> Human PhtCPB insert <400> 56 ggcccag ccg gcc atg gcc gcc ctc cag acg gtc tgc ctg aag ggg acc 49 Pro Ala Met Ala Ala Leu Gln Thr Val Cys Leu Lys Gly Thr 1 5 10 aag gtg cac atg aaa tgc ttt ctg gcc ttc acc cag acg aag acc ttc 97 Lys Val His Met Lys Cys Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe 15 20 25 30 cac gag gcc agc gag gac tgc atc tcg cgc ggg ggc acc ctg agc acc 145 His Glu Ala Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr 35 40 45 cct cag act ggc tcg gag aac gac gcc ctg tat gag tac ctg cgc cag 193 Pro Gln Thr Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln 50 55 60 agc gtg ggc aac gag gcc gag atc tgg ctg ggc ctc aac gac atg gcg 241 Ser Val Gly Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala 65 70 75 gcc gag ggc acc tgg gtg gac atg acc ggt acc taagtgacga tatcctgacc 294 Ala Glu Gly Thr Trp Val Asp Met Thr Gly Thr 80 85 taactgcagg gatcaattgc cctacatctg ccagttcggg atcgtgtag 343 <210> 57 <211> 89 <212> PRT <213> Homo sapiens <400> 57 Pro Ala Met Ala Ala Leu Gln Thr Val Cys Leu Lys Gly Thr Lys Val 1 5 10 15 His Met Lys Cys Phe Leu Ala Phe Thr Gln Thr Lys Thr Phe His Glu 20 25 30 Ala Ser Glu Asp Cys Ile Ser Arg Gly Gly Thr Leu Ser Thr Pro Gln 35 40 45 Thr Gly Ser Glu Asn Asp Ala Leu Tyr Glu Tyr Leu Arg Gln Ser Val 50 55 60 Gly Asn Glu Ala Glu Ile Trp Leu Gly Leu Asn Asp Met Ala Ala Glu 65 70 75 80 Gly Thr Trp Val Asp Met Thr Gly Thr 85 <210> 58 <211> 405 <212> DNA <213> Rattus rattus <220> <221> CDS <222> (8)..(400) <223> Rat PrMBP insert <400> 58 ggcccag ccg gcc atg gcc aac aag ttg cat gcc ttc tcc atg ggt aaa 49 Pro Ala Met Ala Asn Lys Leu His Ala Phe Ser Met Gly Lys 1 5 10 aag tct ggg aag aag ttc ttt gtg acc aac cat gaa agg atg ccc ttt 97 Lys Ser Gly Lys Lys Phe Phe Val Thr Asn His Glu Arg Met Pro Phe 15 20 25 30 tcc aaa gtc aag gcc ctg tgc tca gag ctc cga ggc act gtg gct atc 145 Ser Lys Val Lys Ala Leu Cys Ser Glu Leu Arg Gly Thr Val Ala Ile 35 40 45 ccc aag aat gct gag gag aac aag gcc atc caa gaa gtg gct aaa acc 193 Pro Lys Asn Ala Glu Glu Asn Lys Ala Ile Gln Glu Val Ala Lys Thr 50 55 60 tct gcc ttc cta ggc atc acg gac gag gtg act gaa ggc caa ttc atg 241 Ser Ala Phe Leu Gly Ile Thr Asp Glu Val Thr Glu Gly Gln Phe Met 65 70 75 tat gtg aca ggg ggg agg ctc acc tac agc aac tgg aaa aag gat gag 289 Tyr Val Thr Gly Gly Arg Leu Thr Tyr Ser Asn Trp Lys Lys Asp Glu 80 85 90 ccc aat gac cat ggc tct ggg gaa gac tgt gtc act ata gta gac aac 337 Pro Asn Asp His Gly Ser Gly Glu Asp Cys Val Thr Ile Val Asp Asn 95 100 105 110 ggt ctg tgg aat gac atc tcc tgc caa gct tcc cac acg gct gtc tgc 385 Gly Leu Trp Asn Asp Ile Ser Cys Gln Ala Ser His Thr Ala Val Cys 115 120 125 gag ttc cca gcc gcg gccgc 405 Glu Phe Pro Ala Ala 130 <210> 59 <211> 131 <212> PRT <213> Rattus rattus <400> 59 Pro Ala Met Ala Asn Lys Leu His Ala Phe Ser Met Gly Lys Lys Ser 1 5 10 15 Gly Lys Lys Phe Phe Val Thr Asn His Glu Arg Met Pro Phe Ser Lys 20 25 30 Val Lys Ala Leu Cys Ser Glu Leu Arg Gly Thr Val Ala Ile Pro Lys 35 40 45 Asn Ala Glu Glu Asn Lys Ala Ile Gln Glu Val Ala Lys Thr Ser Ala 50 55 60 Phe Leu Gly Ile Thr Asp Glu Val Thr Glu Gly Gln Phe Met Tyr Val 65 70 75 80 Thr Gly Gly Arg Leu Thr Tyr Ser Asn Trp Lys Lys Asp Glu Pro Asn 85 90 95 Asp His Gly Ser Gly Glu Asp Cys Val Thr Ile Val Asp Asn Gly Leu 100 105 110 Trp Asn Asp Ile Ser Cys Gln Ala Ser His Thr Ala Val Cys Glu Phe 115 120 125 Pro Ala Ala 130 <210> 60 <211> 408 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (8)..(403) <223> Human PhSP-D insert <400> 60 ggcccag ccg gcc atg gcc aag aaa gtt gag ctc ttc cca aat ggc caa 49 Pro Ala Met Ala Lys Lys Val Glu Leu Phe Pro Asn Gly Gln 1 5 10 agt gtg ggg gag aag att ttc aag aca gca ggc ttt gta aaa cca ttt 97 Ser Val Gly Glu Lys Ile Phe Lys Thr Ala Gly Phe Val Lys Pro Phe 15 20 25 30 acg gag gca cag ctg ctg tgc aca cag gct ggt gga cag ttg gcc tct 145 Thr Glu Ala Gln Leu Leu Cys Thr Gln Ala Gly Gly Gln Leu Ala Ser 35 40 45 cca cgc tct gcc gct gag aat gcc gcc ttg caa cag ctg gtc gta gct 193 Pro Arg Ser Ala Ala Glu Asn Ala Ala Leu Gln Gln Leu Val Val Ala 50 55 60 aag aac gag gct gct ttc ctg agc atg act gat tcc aag aca gag ggc 241 Lys Asn Glu Ala Ala Phe Leu Ser Met Thr Asp Ser Lys Thr Glu Gly 65 70 75 aag ttc acc tac ccc aca gga gag tcc ctg gtc tat tcc aac tgg gcc 289 Lys Phe Thr Tyr Pro Thr Gly Glu Ser Leu Val Tyr Ser Asn Trp Ala 80 85 90 cca ggg gag ccc aac gat gat ggc ggg tca gag gac tgt gtg gag atc 337 Pro Gly Glu Pro Asn Asp Asp Gly Gly Ser Glu Asp Cys Val Glu Ile 95 100 105 110 ttc acc aat ggc aag tgg aat gac agg gct tgt gga gaa aag cgt ctt 385 Phe Thr Asn Gly Lys Trp Asn Asp Arg Ala Cys Gly Glu Lys Arg Leu 115 120 125 gtg gtc tgc gag ttc gcg gccgc 408 Val Val Cys Glu Phe Ala 130 <210> 61 <211> 132 <212> PRT <213> Homo sapiens <400> 61 Pro Ala Met Ala Lys Lys Val Glu Leu Phe Pro Asn Gly Gln Ser Val 1 5 10 15 Gly Glu Lys Ile Phe Lys Thr Ala Gly Phe Val Lys Pro Phe Thr Glu 20 25 30 Ala Gln Leu Leu Cys Thr Gln Ala Gly Gly Gln Leu Ala Ser Pro Arg 35 40 45 Ser Ala Ala Glu Asn Ala Ala Leu Gln Gln Leu Val Val Ala Lys Asn 50 55 60 Glu Ala Ala Phe Leu Ser Met Thr Asp Ser Lys Thr Glu Gly Lys Phe 65 70 75 80 Thr Tyr Pro Thr Gly Glu Ser Leu Val Tyr Ser Asn Trp Ala Pro Gly 85 90 95 Glu Pro Asn Asp Asp Gly Gly Ser Glu Asp Cys Val Glu Ile Phe Thr 100 105 110 Asn Gly Lys Trp Asn Asp Arg Ala Cys Gly Glu Lys Arg Leu Val Val 115 120 125 Cys Glu Phe Ala 130 <210> 62 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 62 cggctgagcg gcccagccgg ccatggccaa caagttgcat gccttctcc 49 <210> 63 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 63 gcactcctgc ggccgcggct gggaactcgc agac 34 <210> 64 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 64 cggctgagcg gcccagccgg ccatggccaa gaaagttgag ctcttccc 48 <210> 65 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 65 gcactcctgc ggccgcgaac tcgcagacca caagac 36 <210> 66 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 66 gccaccggtg acgtagatga attggccttc snnsnnsnns nnsnngtccg tgatgcctag 60 gaagg 65 <210> 67 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 67 gccaccggtg acgtagatga attggccttc snnsnnsnns nnsnnsnngt ccgtgatgcc 60 taggaagg 68 <210> 68 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 68 gccaccggtg acgtagatga asnnsnnsnn snnsnnsnns nncgtgatgc ctaggaaggc 60 ag 62 <210> 69 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 69 ccagttgctg tatttcaggc tgccaccggt gacgtagatg 40 <210> 70 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 70 gcctgaaata cagcaactgg aagaaagacg aacc 34 <210> 71 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 71 ctggaagaaa gacgaaccga atgaccatgg cnnsnnsnns nnsnnsgaag actgtgtcac 60 tatagtag 68 <210> 72 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 72 ctggaagaaa gacgaaccga atgaccatgg cnnsnnsnns nnsnnsnnsg aagactgtgt 60 cactatagta g 71 <210> 73 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 73 ctggaagaaa gacgaaccga atnnsnnsnn snnsnnsgaa gactgtgtca ctatagtag 59 <210> 74 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 74 cggctgagcg gcccagc 17 <210> 75 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 75 gcactcctgc ggccgcg 17 <210> 76 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 76 ctcaccggtc ggatacgtga acttgccctc tgtsnnsnns nnsnnsnnat cagtcatgct 60 caggaaagc 69 <210> 77 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 77 ctcaccggtc ggatacgtga acttgccctc tgtsnnsnns nnsnnsnnsn natcagtcat 60 gctcaggaaa gc 72 <210> 78 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 78 ctcaccggtc ggatacgtga asnnsnnsnn snnsnnsnns nnagtcatgc tcaggaaagc 60 <210> 79 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 79 cagttggaat agaccaggga ctcaccggtc ggatacgtg 39 <210> 80 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 80 gggccccagg ggagcccaac gatgatggcn nsnnsnnsnn snnsgaggac tgtgtggaga 60 tcttc 65 <210> 81 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 81 gggccccagg ggagcccaac gatgatggcn nsnnsnnsnn snnsnnsgag gactgtgtgg 60 agatcttc 68 <210> 82 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 82 gggccccagg ggagcccaac gatgatggcn nsnnsnnsnn snnsnnsgag gactgtgtgg 60 agatcttc 68 <210> 83 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 83 gggccccagg ggagcccaac nnsnnsnnsn nsnnsgagga ctgtgtggag atcttc 56 <210> 84 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 84 gcatcgccta caagaactgg nnsnnsnnsn nsnnsnnsca acccgatggc ggcaagaccg 60 agaactgcgc ggtcctg 77 <210> 85 <211> 83 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 85 gcatcgccta caagaactgg gagnnsnnsn nsnnsnnsnn sgcgcaaccc gatggcggca 60 agaccgagaa ctgcgcggtc ctg 83 <210> 86 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 86 gcatcgccta caagaactgg gagnnsnnsn nsnnsnnsgc gcaacccgat ggcggcaaga 60 ccgagaactg cgcggtcctg 80 <210> 87 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 87 gtagggcaat tgatcgctgc agcgcttgtc gaaccasnns nnsnnsnnsn nsnnsnncag 60 gaccgcgcag ttctc 75 <210> 88 <211> 84 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 88 gtagggcaat tgatcgctgc agcgcttgtc gaaccacttg ccsnnsnnsn nsnnsnnsnn 60 gcctgacagg accgcgcagt tctc 84 <210> 89 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 89 gtagggcaat tgatcgctgc agcgcttgtc gaaccacttg ccsnnsnnsn nsnnsnngcc 60 tgacaggacc gcgcagttct c 81 <210> 90 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 90 gtagggcaat tgatcgctgc 20 <210> 91 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: oligonucleotide <400> 91 catgaccggt acccgcatcg cctacaagaa ctgg 34 34 1

Claims (92)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 1) 하기 a) 내지 c)의 주요 2차 구조 요소를 특징으로 하는 C-타입 렉틴 유사 도메인 (CTLD)의 스캐폴드 구조를 지닌 폴리펩타이드의 앙상블(ensemble)을 엔코딩하는 핵산의 라이브러리를 제공하는 단계:
    a) β1, α1, α2, β2, β3, β4 및 β5순으로 연쇄적으로 존재하는 5개의 β-가닥 및 2개의 α-나선 (여기서, β-가닥은 하나는 β1과 β5로 구성되고, 다른 하나는 β2, β3 및 β4로 구성된 2개의 역방향의 β-시트로 배열됨),
    b) 하나는 α1과 β5를 연결하는 것이고, 다른 하나는 β3과 β4 및 β5를 연결하는 폴리펩타이드 세그먼트를 연결하는 것인 2개 이상의 이황화물 다리,
    c) β2와 β3을 연결하는 루프 세그먼트 A (LSA) 및 β3와 β4를 연결하는 루프 세그먼트 B (LSB)인 2개의 폴리펩타이드 세그먼트로 구성된 루프 영역으로서, 이러한 루프 영역의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원에 의해 치환된 루프 영역;
    2) 디스플레이 시스템에서 핵산 라이브러리를 발현시켜서 폴리펩타이드의 앙상블을 수득하는 단계로서, 아미노산 잔기가 하나 이상의 서열 위치에서 상기 폴리펩타이드의 앙상블의 다양한 구성원 간에 상이한 단계;
    3) 폴리펩타이드의 앙상블을 표적과 접촉시키는 단계; 및
    4) 상기 표적에 결합할 수 있는 폴리펩타이드를 단리하는 단계를 포함하여 특정 표적에 결합할 수 있는 폴리펩타이드를 확인하고 단리하기 위한 방법.
  33. 제 32항에 있어서, 루프 세그먼트 A의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  34. 제 32항에 있어서, 루프 세그먼트 B의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  35. 제 32항에 있어서, 아미노산 잔기가 상기 폴리펩타이드의 앙상블의 다양한 구성원 간에 2개 이상의 서열 위치에서 상이한 것인 방법.
  36. 제 32항에 있어서, 아미노산 잔기가 상기 폴리펩타이드의 앙상블의 다양한 구성원 간에 3개 이상의 서열 위치에서 상이한 것인 방법.
  37. 제 32항에 있어서, 아미노산 잔기가 상기 폴리펩타이드의 앙상블의 다양한 구성원 간에 4개 이상의 서열 위치에서 상이한 것인 방법.
  38. 제 32항에 있어서, 아미노산 잔기가 상기 폴리펩타이드의 앙상블의 다양한 구성원 간에 5개 이상의 서열 위치에서 상이한 것인 방법.
  39. 제 32항에 있어서, 아미노산 잔기가 상기 폴리펩타이드의 앙상블의 다양한 구성원 간에 6개 이상의 서열 위치에서 상이한 것인 방법.
  40. 제 32항에 있어서, 아미노산 잔기가 상기 폴리펩타이드의 앙상블의 다양한 구성원 간에 7개 이상의 서열 위치에서 상이한 것인 방법.
  41. 제 32항에 있어서, 아미노산 잔기가 상기 폴리펩타이드의 앙상블의 다양한 구성원 간에 8개 이상의 서열 위치에서 상이한 것인 방법.
  42. 제 32항에 있어서, 아미노산 잔기가 상기 폴리펩타이드의 앙상블의 다양한 구성원 간에 9개 이상의 서열 위치에서 상이한 것인 방법.
  43. 제 32항에 있어서, 아미노산 잔기가 상기 폴리펩타이드의 앙상블의 다양한 구성원 간에 10개 이상의 서열 위치에서 상이한 것인 방법.
  44. 제 32항에 있어서, 아미노산 잔기가 상기 폴리펩타이드의 앙상블의 다양한 구성원 간에 11개 이상의 서열 위치에서 상이한 것인 방법.
  45. 제 32항에 있어서, 아미노산 잔기가 상기 폴리펩타이드의 앙상블의 다양한 구성원 간에 12개 이상의 서열 위치에서 상이한 것인 방법.
  46. 제 32항에 있어서, 아미노산 잔기가 상기 폴리펩타이드의 앙상블의 다양한 구성원 간에 13개 이상의 서열 위치에서 상이한 것인 방법.
  47. 제 32항에 있어서, 루프 세그먼트 A가 15개 내지 70개의 아미노산 잔기를 포함하는 것인 방법.
  48. 제 32항에 있어서, 루프 세그먼트 A가 5개 내지 14개의 아미노산 잔기를 포함하는 것인 방법.
  49. 제 32항에 있어서, 루프 세그먼트 B가 5개 내지 12개의 아미노산 잔기를 포함하는 것인 방법.
  50. 제 32항에 있어서, 루프 세그먼트 B가 2개 내지 4개의 아미노산 잔기를 포함하는 것인 방법.
  51. 제 32항에 있어서, 상기 α-나선, β-가닥 또는 연결 세그먼트의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환되며, 이러한 치환이 상기 각각의 폴리펩타이드의 α-나선, β-가닥 또는 연결 세그먼트에서 10개 이하의 아미노산 잔기가 변경되는 것인 방법.
  52. 제 32항에 있어서, C-타입 렉틴 유사 도메인 (CTLD)의 스캐폴드 구조를 지닌 폴리펩타이드의 앙상블이 테트라넥틴으로부터 유래되는 것인 방법.
  53. 제 32항에 있어서, C-타입 렉틴 유사 도메인 (CTLD)의 스캐폴드 구조를 지닌 폴리펩타이드의 앙상블이 인간 테트라넥틴 (hTN)으로부터 유래되는 것인 방법.
  54. 제 53항에 있어서, 폴리펩타이드의 앙상블이 SEQ ID NO:13의 5번 위치 Glu 내지 185번 위치 Val의 아미노산 서열을 지닌 펩타이드 htlec로부터 유래되는 것인 방법.
  55. 제 53항에 있어서, 폴리펩타이드의 앙상블이 SEQ ID NO:15의 5번 위치 Ala 내지 141번 위치 Val의 아미노산 서열을 지닌 펩타이드 htCTLD로부터 유래되는 것인 방법.
  56. 제 53항에 있어서, 폴리펩타이드의 앙상블이 SEQ ID NO:9의 5번 위치 Glu 내지 185번 위치 Val의 아미노산 서열을 지닌 펩타이드 hTN으로부터 유래되는 것인 방법.
  57. 제 53항에 있어서, 폴리펩타이드의 앙상블이 SEQ ID NO:11의 5번 위치 Ala 내지 141번 위치 Val의 아미노산 서열을 지닌 펩타이드 hTN3으로부터 유래되는 것인 방법.
  58. 제 53항에 있어서, 도 2에 도시된 116번 위치 D (Asp) 내지 123번 위치 W (Trp)의 아미노산 서열 (루프 1)의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  59. 제 53항에 있어서, 도 2에 도시된 125번 위치 D (Asp) 내지 129번 위치 A (Ala)의 아미노산 서열 (루프 2)의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  60. 제 53항에 있어서, 도 2에 도시된 135번 위치 N (Asn) 내지 143번 위치 Q (Gln)의 아미노산 서열 (루프 3)의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  61. 제 53항에 있어서, 도 2에 도시된 145번 위치 D (Asp) 내지 151번 위치 N (Asn)의 아미노산 서열 (루프 4)의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  62. 제 53항에 있어서, 도 2에 도시된 158번 위치 A (Ala) 내지 161번 위치 G (Gly)의 아미노산 서열 (루프 5)의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  63. 제 55항에 있어서, SEQ ID NO:15의 77번 위치 Met 내지 82번 위치 Thr의 아미노산 서열의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  64. 제 55항에 있어서, SEQ ID NO:15의 97번 위치 Glu 내지 102번 위치 Ala의 아미노산 서열의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  65. 제 55항에 있어서, SEQ ID NO:15의 108번 위치 Lys 내지 109번 위치 Thr의 아미노산 서열의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  66. 제 55항에 있어서, SEQ ID NO:15의 116번 위치 Ser 내지 122번 위치 Lys의 아미노산 서열의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  67. 제 53항에 있어서, SEQ ID NO:12의 121번 위치 Met 내지 123번 위치 Ala의 아미노산 서열의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  68. 제 53항에 있어서, SEQ ID NO:12의 125번 위치 Gly 내지 126번 위치 Thr의 아미노산 서열의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  69. 제 53항에 있어서, SEQ ID NO:12의 141번 위치 Glu 내지 146번 위치 Ala의 아미노산 서열의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  70. 제 53항에 있어서, SEQ ID NO:12의 150번 위치 Gly 내지 153번 위치 Thr의 아미노산 서열의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  71. 제 53항에 있어서, SEQ ID NO:12에서 168번 위치의 Phe (β4 내의) 아미노산을 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  72. 제 32항에 있어서, C-타입 렉틴 유사 도메인 (CTLD)의 스캐폴드 구조를 지닌 폴리펩타이드의 앙상블이 뮤린 테트라넥틴으로부터 유래되는 것인 방법.
  73. 제 72항에 있어서, 폴리펩타이드의 앙상블이 SEQ ID NO:36의 5번 위치 Glu 내지 185번 위치 Val의 아미노산 서열을 지닌 펩타이드 mtlec로부터 유래되는 것인 방법.
  74. 제 72항에 있어서, 폴리펩타이드의 앙상블이 SEQ ID NO:38의 5번 위치 Ala 내지 141번 위치 Val의 아미노산 서열을 지닌 펩타이드 mtCTLD로부터 유래되는 것인 방법.
  75. 제 32항에 있어서, C-타입 렉틴 유사 도메인 (CTLD)의 스캐폴드 구조를 지닌 폴리펩타이드의 앙상블이 만노오스 결합 단백질 (MBP)로부터 유래되는 것인 방법.
  76. 제 75항에 있어서, SEQ ID NO:59의 70번 위치 Asp 내지 76번 위치 Gln의 아미노산 서열의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  77. 제 75항에 있어서, SEQ ID NO:59의 97번 위치 Asp 내지 101번 위치 Gly의 아미노산 서열의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  78. 제 32항에 있어서, C-타입 렉틴 유사 도메인 (CTLD)의 스캐폴드 구조를 지닌 폴리펩타이드의 앙상블이 표면활성 단백질 D (SP-D)로부터 유래되는 것인 방법.
  79. 제 32항에 있어서, C-타입 렉틴 유사 도메인 (CTLD)의 스캐폴드 구조를 지닌 폴리펩타이드의 앙상블이 인간 폐 표면활성 단백질 D로부터 유래되는 것인 방법.
  80. 제 79항에 있어서, SEQ ID NO:61의 73번 위치 Asp 내지 79번 위치 Lys의 아미노산 서열의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  81. 제 79항에 있어서, SEQ ID NO:61의 100번 위치 Asp 내지 104번 위치 Ser의 아미노산 서열의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환된 것인 방법.
  82. 제 32항에 있어서, C-타입 렉틴 유사 도메인 (CTLD)의 스캐폴드 구조를 지닌 폴리펩타이드의 앙상블이 NK 수용체 (LY49A)로부터 유래되는 것인 방법.
  83. 제 32항에 있어서, C-타입 렉틴 유사 도메인 (CTLD)의 스캐폴드 구조를 지닌 폴리펩타이드의 앙상블이 아시알로당단백질 수용체의 H1 서브유닛 (H1-ASR)으로부터 유래되는 것인 방법.
  84. 제 32항에 있어서, C-타입 렉틴 유사 도메인 (CTLD)의 스캐폴드 구조를 지닌 폴리펩타이드의 앙상블이 대식구 만노오스 수용체 도메인 4 (MMR-4)로부터 유래되는 것인 방법.
  85. 제 32항에 있어서, C-타입 렉틴 유사 도메인 (CTLD)의 스캐폴드 구조를 지닌 폴리펩타이드의 앙상블이 응고 인자 IX/X-결합 단백질로부터 유래되는 것인 방법.
  86. 제 32항에 있어서, C-타입 렉틴 유사 도메인 (CTLD)의 스캐폴드 구조를 지닌 폴리펩타이드의 앙상블이 리토스타틴 (Lit)으로부터 유래되는 것인 방법.
  87. 제 32항에 있어서, C-타입 렉틴 유사 도메인 (CTLD)의 스캐폴드 구조를 지닌 폴리펩타이드의 앙상블이 피막성(tunicate) C-타입 렉틴 (TU14)로부터 유래되는 것인 방법.
  88. 제 32항에 있어서, 디스플레이 시스템이 하기 (I) 내지 (V)로부터 선택되는 방법:
    (I) (1) 핵산의 라이브러리가 (a) 파지미드 벡터, (b) 파지의 바이러스 게놈 또는 (c) 정제된 단일 가닥 또는 이중 가닥 형태의 정제된 바이러스 핵산내로 삽입된 섬유상 파지, 또는
    (2) 핵산의 라이브러리가 (a) 정제된 파지 람다 DNA 또는 (b) 람다 파지 입자내의 핵산내로 삽입되는 파지 람다로부터 선택된 파지 디스플레이 시스템;
    (II) 핵산의 라이브러리가 바큘로바이러스로부터 선택된 진핵 바이러스의 바이러스 핵산내로 삽입된 바이러스 디스플레이 시스템;
    (III) 핵산의 라이브러리가 숙주 게놈내로 통합될 수 있거나 세포내에서 유지되고 발현될 수 있으며 (a) 세균 세포, (b) 효모 세포 또는 (c) 포유동물 세포의 표면상에서의 세포-표면 디스플레이에 적합한 염색체외 요소내로 통합될 수 있는 핵산 담체내로 삽입되거나 이러한 담체에 결합되어 있는 세포 기재 디스플레이 시스템;
    (IV) 핵산의 라이브러리가 삽입되어 있는 리보솜 결합 디스플레이에 적합한 핵산 물질; 또는
    (V) 핵산의 라이브러리가 삽입되어 있는 플라스미드 결합 디스플레이에 적합한 플라스미드.
  89. 제 88항에 있어서, 상기 파지미드 벡터가 아머샴 파마시아 바이오테크 (Amersham Pharmacia Biotech)에 의해 제공되는 벡터 "pCANTAB 5 E" (code no. 27-9401-01)인 방법.
  90. 제 32항에 있어서, 표적이 진핵 세포, 바이러스, 세균, 단백질, 다당류, 중합체 및 유기 화합물로 구성된 군으로부터 선택되는 것인 방법.
  91. 제 32항에 있어서, 상기 α-나선, β-가닥 또는 연결 세그먼트의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환되며, 이러한 치환이 상기 각각의 폴리펩타이드의 α-나선, β-가닥 또는 연결 세그먼트에서 4개 이하의 아미노산 잔기가 변경되는 것인 방법.
  92. 제 32항에 있어서, 상기 α-나선, β-가닥 또는 연결 세그먼트의 일부 또는 전부를 엔코딩하는 핵산 단편이 다수의 핵산 단편으로 구성된 앙상블의 무작위 선택된 구성원으로 치환되며, 이러한 치환이 상기 각각의 폴리펩타이드의 α-나선, β-가닥 또는 연결 세그먼트에서 1개 또는 2개의 아미노산 잔기가 변경되는 것인 방법.
KR1020037007858A 2000-12-13 2001-12-13 스캐폴드 구조의 c-타입 렉틴 유사 도메인을 가지는단백질의 조합 라이브러리 KR100865602B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
DKPA200001872 2000-12-13
DKPA200001872 2000-12-13
US27209801P 2001-02-28 2001-02-28
US60/272,098 2001-02-28
PCT/DK2001/000825 WO2002048189A2 (en) 2000-12-13 2001-12-13 Combinatorial libraries of proteins having the scaffold structure of c-type lectin-like domains

Publications (2)

Publication Number Publication Date
KR20040018316A KR20040018316A (ko) 2004-03-03
KR100865602B1 true KR100865602B1 (ko) 2008-10-27

Family

ID=26068925

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020037007858A KR100865602B1 (ko) 2000-12-13 2001-12-13 스캐폴드 구조의 c-타입 렉틴 유사 도메인을 가지는단백질의 조합 라이브러리

Country Status (14)

Country Link
US (2) US8017559B2 (ko)
EP (2) EP2105503B1 (ko)
JP (1) JP4493271B2 (ko)
KR (1) KR100865602B1 (ko)
CN (1) CN100580084C (ko)
AT (1) ATE431851T1 (ko)
AU (2) AU2156802A (ko)
BR (1) BR0116138A (ko)
CA (1) CA2430953A1 (ko)
DE (1) DE60138764D1 (ko)
DK (1) DK1341912T3 (ko)
NO (1) NO20032663L (ko)
NZ (1) NZ526312A (ko)
WO (1) WO2002048189A2 (ko)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2430953A1 (en) 2000-12-13 2002-06-20 Borean Pharma A/S Combinatorial libraries of proteins having the scaffold structure of c-type lectin-like domains
AU2003239777A1 (en) * 2002-07-05 2004-01-23 Borean Pharma A/S Multimerised growth hormone fusion proteins
US7329739B2 (en) 2002-08-20 2008-02-12 Summit Glycoresearch Corporation Use of lectin library for distinguishing glycoproteins or cells, diagnosing serum or cells, or fractionating glycoproteins or cells
EP2311867A1 (en) 2002-10-29 2011-04-20 Anaphore, Inc. Trimeric binding proteins for trimeric cytokines
EP1692159B1 (en) 2003-11-06 2010-09-29 Danisco US Inc. Tgf-beta1 binding and supported peptides
US20100028995A1 (en) * 2004-02-23 2010-02-04 Anaphore, Inc. Tetranectin Trimerizing Polypeptides
JP2008520214A (ja) * 2004-11-22 2008-06-19 ボレアン・ファルマ・アンパルトセルスカブ Tnfアンタゴニスト
US7723477B2 (en) 2005-10-31 2010-05-25 Oncomed Pharmaceuticals, Inc. Compositions and methods for inhibiting Wnt-dependent solid tumor cell growth
CA2670471A1 (en) 2006-11-22 2008-06-05 Adnexus, A Bristol-Myers Squibb R&D Company (A Delaware Corporation) Targeted therapeutics based on engineered proteins for tyrosine kinases receptors, including igf-ir
JP2010538655A (ja) * 2007-09-12 2010-12-16 アナフォア インコーポレイテッド 自己免疫疾患についてのhsp70に基づく治療
WO2009062195A2 (en) * 2007-11-09 2009-05-14 Anaphore, Inc. Fusion proteins of mannose binding lectins for treatment of disease
EP2799448A1 (en) 2008-05-22 2014-11-05 Bristol-Myers Squibb Company Multivalent fibronectin based scaffold domain proteins
US20130295106A1 (en) * 2008-09-26 2013-11-07 Oncomed Pharmaceuticals, Inc. Frizzled-Binding Agents And Uses Thereof
DK2331136T3 (en) 2008-09-26 2018-03-05 Oncomed Pharm Inc FRIZZLED BINDING AGENTS AND APPLICATIONS THEREOF
JP2012504969A (ja) 2008-10-10 2012-03-01 アナフォア インコーポレイテッド Trail−r1及びtrail−r2に結合するポリペプチド
CN102686727A (zh) * 2009-10-09 2012-09-19 阿纳福公司 基于c-型凝集素结构域的组合文库
JP2013507124A (ja) * 2009-10-09 2013-03-04 アナフォア インコーポレイテッド Il−23rを結合するポリペプチド
US20110086806A1 (en) * 2009-10-09 2011-04-14 Anaphore, Inc. Polypeptides that Bind IL-23R
WO2011074941A1 (en) * 2009-12-15 2011-06-23 Universiti Malaya A method of high throughput screening of inhibitors that inhibit interaction of an attachment protein to cell receptors using recombinant phage display
TWI535445B (zh) 2010-01-12 2016-06-01 安可美德藥物股份有限公司 Wnt拮抗劑及治療和篩選方法
AU2011235904B2 (en) 2010-04-01 2015-10-08 Oncomed Pharmaceuticals, Inc. Frizzled-binding agents and uses thereof
KR101294982B1 (ko) * 2011-12-09 2013-08-08 경북대학교 산학협력단 단백질 골격모듈을 포함하는 융합 폴리펩타이드 및 이를 이용한 목적 단백질에 특이적인 펩타이드 라이브러리 스크리닝 방법
JP6126075B2 (ja) * 2012-03-02 2017-05-10 国立研究開発法人科学技術振興機構 機能性核酸分子の構築法、および当該方法に用いる核酸組合せ物
WO2014066328A1 (en) 2012-10-23 2014-05-01 Oncomed Pharmaceuticals, Inc. Methods of treating neuroendocrine tumors using wnt pathway-binding agents
CA2899353A1 (en) 2013-02-04 2014-08-07 Oncomed Pharmaceuticals, Inc. Methods and monitoring of treatment with a wnt pathway inhibitor
US9168300B2 (en) 2013-03-14 2015-10-27 Oncomed Pharmaceuticals, Inc. MET-binding agents and uses thereof
US20160039877A1 (en) 2013-03-15 2016-02-11 Shenzhen Hightide Biopharmaceutical, Ltd. Compositions and methods of using islet neogenesis peptides and analogs thereof
GB201311031D0 (en) 2013-06-20 2013-08-07 Queen Mary & Westfield College Method
AU2015324924B2 (en) 2014-10-01 2021-07-01 Medimmune, Llc Method of conjugating a polypeptide
AR111963A1 (es) 2017-05-26 2019-09-04 Univ California Método y moléculas
CN113372428B (zh) * 2021-05-21 2022-07-08 广东食品药品职业学院 文昌鱼C型凝集素BjCTL4基因及其应用

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2134756C (en) 1992-04-30 2010-04-20 David V. Erbe Selectin variants
US5679548A (en) * 1993-02-02 1997-10-21 The Scripps Research Institute Methods for producing polypeptide metal binding sites and compositions thereof
ATE241642T1 (de) 1993-02-04 2003-06-15 Denzyme Aps Verbessertes verfahren zur rückfaltung der proteine
US6025485A (en) * 1997-02-14 2000-02-15 Arcaris, Inc. Methods and compositions for peptide libraries displayed on light-emitting scaffolds
AU736707B2 (en) * 1997-06-11 2001-08-02 Anaphore, Inc. Trimerising module
EP0947582A1 (en) * 1998-03-31 1999-10-06 Innogenetics N.V. A polypeptide structure for use as a scaffold
US6180343B1 (en) * 1998-10-08 2001-01-30 Rigel Pharmaceuticals, Inc. Green fluorescent protein fusions with random peptides
CA2430953A1 (en) 2000-12-13 2002-06-20 Borean Pharma A/S Combinatorial libraries of proteins having the scaffold structure of c-type lectin-like domains

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Journal of Biological Chemistry, Vol.275(48), 01 December 2000, pages 37390-37396

Also Published As

Publication number Publication date
US8017559B2 (en) 2011-09-13
AU2156802A (en) 2002-06-24
EP2105503A3 (en) 2011-03-02
WO2002048189A2 (en) 2002-06-20
JP4493271B2 (ja) 2010-06-30
EP1341912B1 (en) 2009-05-20
EP1341912A2 (en) 2003-09-10
CN100580084C (zh) 2010-01-13
US20070275393A1 (en) 2007-11-29
JP2004515245A (ja) 2004-05-27
EP2105503B1 (en) 2012-09-19
WO2002048189A3 (en) 2003-01-09
NZ526312A (en) 2004-11-26
ATE431851T1 (de) 2009-06-15
NO20032663D0 (no) 2003-06-12
CA2430953A1 (en) 2002-06-20
EP2105503A2 (en) 2009-09-30
DK1341912T3 (da) 2009-09-21
BR0116138A (pt) 2003-09-23
NO20032663L (no) 2003-07-17
DE60138764D1 (de) 2009-07-02
KR20040018316A (ko) 2004-03-03
AU2002221568B2 (en) 2005-06-02
CN1484698A (zh) 2004-03-24
US20120094873A1 (en) 2012-04-19

Similar Documents

Publication Publication Date Title
KR100865602B1 (ko) 스캐폴드 구조의 c-타입 렉틴 유사 도메인을 가지는단백질의 조합 라이브러리
US20040132094A1 (en) Combinatorial libraries of proteins having the scaffold structure of c-type lectinlike domains
US9657287B2 (en) Repeat protein from collection of repeat proteins comprising repeat modules
EP1266025B1 (en) Protein scaffolds for antibody mimics and other binding proteins
CA2378871C (en) Design of beta-sheet proteins with specific binding properties
AU2002221568A1 (en) Combinatorial libraries of proteins having the scaffold structure of C-type lectin-like domains
US20110086770A1 (en) Combinatorial Libraries Based on C-type Lectin-like Domain
US20140094595A1 (en) Protein Scaffolds for Antibody Mimics and Other Binding Proteins
US20110028403A1 (en) HSP70-Based Treatment for Autoimmune Diseases and Cancer
WO1991018980A1 (en) Compositions and methods for identifying biologically active molecules
WO2002032925A9 (en) Protein scaffolds for antibody mimics and other binding proteins
CA2297109A1 (en) 5&#39; ests for secreted proteins expressed in muscle and other mesodermal tissues
WO2011043834A1 (en) Combinatorial libraries based on c-type lectin domain
Class et al. Patent application title: COMBINATORIAL LIBRARIES OF PROTEINS HAVING THE SCAFFOLD STRUCTURE OF C-TYPE LECTIN-LIKE DOMAINS Inventors: Michael Etzerodt (Hinnerup, DK) Thor Las Holtet (Ronde, DK) Thor Las Holtet (Ronde, DK) Niels Jonas Heilskov Graversen (Abyhoj, DK) Hans Christian Thøgersen (Mundelstrup, DK) Assignees: ANAPHORE, INC.
JP2839837B2 (ja) 顆粒球コロニー刺激因子受容体のリガンド結合領域蛋白質をコードしているdna
CN117858982A (zh) 人纤连蛋白iii型蛋白支架
AU2002301051B2 (en) Extended cDNAs for secreted proteins
AU2010303879A1 (en) Combinatorial libraries based on C-type lectin domain

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
N231 Notification of change of applicant
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
N231 Notification of change of applicant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20111010

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee