KR101861872B1

KR101861872B1 - 항암 융합 단백질

Info

Publication number: KR101861872B1
Application number: KR1020137002118A
Authority: KR
Inventors: 예주 쉐제판 피에크지코란; 세바스티안 도미니크 파블락; 바르틀로미 마체 제렉; 쉬즈토프 카지미에즈 렘케
Original assignee: 아다메드 에스피. 제트 오.오.
Priority date: 2010-06-25
Filing date: 2011-06-24
Publication date: 2018-05-28
Also published as: AU2011268876B2; SI2585480T1; EA023005B1; EA201291362A1; DK2585480T3; SG186439A1; HRP20150241T1; CN102958940A; ZA201300677B; HK1178908A1; AU2011268876A1; CY1116099T1; WO2011161260A1; ES2531288T3; MX2012015246A; CN102958940B; PT2585480E; CA2800841C; BR112012032708A2; KR20130088137A

Abstract

hTRAIL95보다 낮지 않은 위치에 있는 아미노산으로부터 시작하는 가용성 hTRAIL 단백질 서열 또는 그와 70% 이상의 상동성을 갖는 서열의 기능 분절인 도메인 (a); 및 세포사멸 유발 효과기 펩티드의 서열인 도메인 (b)를 포함하는 융합 단백질, 특히 재조합 융합 단백질로서, 여기에서 상기 도메인 (b)의 서열은 상기 도메인 (a)의 C-말단 및/또는 N-말단에 부착된다. 상기 융합 단백질은 항암 활성을 갖는다. 상기 융합 단백질을 코딩하는 뉴클레오티드 서열, 상기 융합 단백질의 제조를 위한 발현 벡터 및 숙주 세포, 암 질환의 치료를 위한 융합 단백질의 용도에 관한 것이다.

Description

항암 융합 단백질{ANTICANCER FUSION PROTEIN}

본 발명은 치료학적 융합 단백질, 특히 재조합 융합 단백질 분야에 관한 것이다. 특히 더, 본 발명은 짧은 세포사멸 유발(proapoptotic) 펩티드의 서열과 조합된 가용성 인간 TRAIL 단백질 서열의 분절(fragment)을 함유하는 융합 단백질, 그를 함유하는 약제학적 조성물, 치료, 특히 항암제로서의 그의 용도, 및 융합 단백질을 코딩하는 폴리뉴클레오티드 서열, 폴리뉴클레오티드 서열을 함유하는 발현 벡터, 및 이들 발현 벡터를 함유하는 숙주 세포에 관한 것이다.

세포사멸(세포 예정사(programmed cell death))은 비정상적인 암세포의 세포사멸을 유도하는 약제를 사용함에 의한 암 예방 및 암 치료에 중요한 역할을 하는 과정이다.

세포사멸(apoptosis)에 대한 신호화는 세포 외측(외인성 또는 사멸 수용체(death receptor) 경로) 또는 세포 내측(내인성 또는 미토콘드리아 경로)에서 개시될 수 있다.

인간 암세포에서 외인성 세포사멸 경로의 활성화는 수용체를 활성화하기 위해 세포사멸 수용체에 의한 리간드의 결합이 필요하다. 리간드의 결합시, 활성화된 수용체는 세포사멸 신호를 유도한다.

미토콘드리아 경로에 의한 세포 내측에서 내인성 세포사멸의 개시는 상이한 레벨의 세포사멸 캐스케이드에서 개시되어 최종적으로 세포사멸 생성 유발(proapoptogenic) 단백질(시토크롬 c, SmacDiablo, AlF, p53, BH3 도메인 패밀리를 포함하는 Bcl2 단백질 패밀리)의 기능, 핵산 분해 또는 카스파제의 활성화를 유도 또는 복원할 수 있다.

Apo2L(Apo2-리간드)로도 알려진, 사이토카인 패밀리(리간드를 유도하는 세포사멸 연관-종양 괴사 인자)에 속하는 TRAIL 단백질은 바이러스에 의해 감염된 세포 및 종양 세포에서 세포사멸의 강력한 활성제이다. TRAIL은 체내에서 자연적으로 발생하는 리간드이다. TRAIL 단백질, 그의 아미노산 서열, 코딩 DNA 서열 및 단백질 발현 시스템은 EP0835305A1호에서 처음으로 기술되었다.

TRAIL 단백질은 세포사멸 유발 TRAIL 표면 수용체 1 및 2(TRAIL-R1/R2)에 결합 및 이들 수용체의 후속하는 활성화로 그의 항암 활성을 나타낸다. DR4 및 DR5로도 알려진 이들 수용체(사멸 수용체 4 및 사멸 수용체 5)는 TNF 수용체 패밀리에 속하며 상이한 타입의 암세포에 의해 과발현된다. 수용체의 활성화는 실행 카스파제의 활성화 및 그에 의한 핵산의 분해를 초래하는 활성화된 카스파제-8에 의해, 억제 유전자 p53으로부터 독립한 세포사멸의 외부 신호화 경로를 유도할 수 있다. TRAIL 활성화에서 방출된 카스파제-8은 또한 Bid 단백질의 방출 및 그에 의한 미토콘드리아 경로의 간접적인 활성화를 야기할 수 있으며, Bid 단백질은 미토콘드리아로 전위되고, 이것은 시토크롬 c의 방출을 자극하여, 사멸 수용체로부터 세포사멸 신호를 간접적으로 증폭시킨다.

TRAIL은 이 단백질에 내성인 건강한 세포 내에서의 세포사멸을 필수적으로 유도함이 없이 종양 세포에 선택적으로 작용한다. 그러므로, TRAIL의 엄청난 잠재력은 혈액암 및 고형 종양을 포함하는 광범위하고 상이한 타입의 종양 세포에 작용하며 동시에 정상 세포에는 영향을 주지않으며 잠재적으로 상당히 작은 부작용을 나타내는 항암제로 인식되었다.

TRAIL 단백질은 281 아미노산 길이를 갖는 타입 II 막 단백질이며 프로테아제에 의한 절단시 아미노산 잔기 114-281을 포함하는 그의 세포외 영역은 생물학적으로도 또한 활성인 20 kDa 크기의 가용성 sTRAIL 분자를 형성한다. TRAIL 및 sTRAIL 형태 양자는 표적(target) 세포 상에 존재하는 TRAIL 수용체와의 상호 작용을 통해 세포사멸을 촉발할 수 있다. TRAIL 분자의 가용성 부분의 강한 항종양 활성 및 매우 낮은 전신 독성은 세포주(cell lines) 시험을 사용하여 입증되었다. 또한, INN 둘라너민(dulanermin)으로 알려진 hTRAIL의 아미노산 114-281에 상응하는 아미노산 서열을 갖는 재조합 인간 가용성 TRAIL(rhTRAIL)에 관한 인간 임상 연구는 그의 양호한 내성 및 용량 제한 독성의 부재를 보여주었다.

최근 연구는 TRAIL 단백질이 아미노산 114-281보다 더 짧은 형태를 가질 수 있으며, 또한 이러한 형태는 DR 패밀리의 막 수용체와 결합할 수 있으며(사멸 수용체(death receptor), DR1 , DR2 , DcR1 , DcR2 및 OPG ) 이들 수용체를 통해 세포사멸을 유도할 수 있다는 것을 보여준다(F., FANG , A., WANG , S.,F., YANG , Antitumor activity of a novel recombinant mutant human tumor necrosis factor -related apoptosis-inducing ligand (신규 재조합 돌연변이 인간 종양 괴사 인자 연관 세포사멸 유도 리간의 항종양 활성), Acta Pharmacologica Sinica 2005 Nov ; 26 (11): 1373-1381).

현재 보고된 간 세포 상의 재조합 TRAIL 단백질의 독성 효과는 변형(modification), 즉 전신 독성을 나타내지 않는 태그되지 않은 TRAIL인 폴리히스티딘 태그의 존재와 연관되는 것으로 나타난다.

그러나, 추가의 연구 및 개발 중에, 많은 암세포가 TRAIL에 대한 원발성 또는 후천성 내성을 또한 보여주는 것으로 나타났다(예를 들어 WO2007/022214호 참조). TRAIL에 대한 내성의 메커니즘이 완전하게 이해되어 지진 않았지만, 세포 표면상의 수용체의 레벨로부터 신호 경로 내의 실행 카스파제까지의 범위인 상이한 레벨에서, TRAIL-유도 세포사멸 경로에 의해, 그 자체는 명백할 수 있는 것으로 믿어진다. 이러한 내성은 항암제로서의 TRAIL의 유용성을 제한한다.

더욱이, 환자에 대한 임상 실험에서 단일 요법으로서의 TRAIL의 실제 효능은 낮은 것으로 입증되었다. 이러한 TRAIL에 대한 종양의 낮은 효능 및 내성을 극복하기 위하여, 다양한 조합 요법이 방사- 및 화학 요법제로 제작되었으며, 이것은 상승적인 세포사멸 효과를 초래하였다(WO2009/002947호; A. Almasan 및 A. Ashkenazi, Cytokine Growth Factor Reviews 14(2003) 337-348; RK Srivastava, Neoplasis, Vol 3, No 6, 2001, 535-546, Soria JC 등, J. Clin. Oncology, Vol 28, No 9(2010), p.1527-1533). 선택된 통상의 화학 요법제(파클리탁셀(paclitaxel), 카르보플라틴(carboplatin)) 및 단일클론 항-VEGF 항체와의 조합에 의한 암치료를 위한 rhTRAIL의 용도는 WO2009/140469호에 기술되어 있다. 그러나, 이러한 조합은 종래의 화학 요법 또는 방사선 요법의 공지된 결함을 필수적으로 내포한다.

메탈로프로테아제 절단 부위 링커(linker)로 연결된 TRAIL 및 혈관 형성 억제제 바소스타틴의 서열을 함유하는 조립된(constructed) 융합 단백질은 A.I. Guo 등에 의해 「Chinese Journal of Biochemistry 및 Molecular Biology 2008, vol. 24(10), 925-930」에 종양 세포 내에서 세포사멸-유도 효과를 나타내는 것으로 기술되었다.

혈관 형성 억제제 툼스타틴(tumstatin)의 서열 툼스타틴183-230 및 TRAIL114-281을 함유하는 조립된 융합 단백질은 N.Ren 등에 의해 「Academic Journal of Second Military Medical University 2008, vol. 28(5), 676-478」에 췌장 암세포의 세포사멸의 유도를 나타내는 것으로 기술되었다.

US2005/244370호 및 대응하는 WO2004/035794호는 세포 표면 결합 도메인으로서 TNF 패밀리 리간드 CD40의 또 다른 멤버의 세포외 부분과 펩티드 링커에 의해 연결된 효과기(effector) 도메인으로서 TRAIL95-281의 구조물을 기술한다. 구조물의 활성화는 그의 CD40 부분의 결합을 통해서인 것으로 서술되어 있다.

더욱이, TRAIL 요법과 관련된 문제는 그의 낮은 안정성 및 투여 후 신체로부터의 신속한 제거로 입증되었다.

많은 임상학적 암 요법이 현재 유용하지만, 이들은 종종 효과가 불충분하며 공지된 많은 단점을 가지며, 이들 중, 가장 치료를 난처하게 하고 제한하는 것은 치료 동안 암세포에 대한 선택성 결여, 심한 부작용 및 원발성 또는 후천성 내성이다. 현재, 암세포에 효과적이고 동시에 선택적인 제한된 수의 항암제가 공지되어 있다. 그러므로, 이용 가능한 약제의 범위를 넓히고 더욱 효과적(세포 독성) 및 선택적인 약제를 알아내도록 할 수 있는 신규 항암제에 대한 다급하고 충족되지 않은 필요성이 남아있다. 또한, 증진된 안정성 및 개선된 약물 동태를 갖는 신규 선택적 약제에 대한 필요성이 있다.

본 발명은 TRAIL의 작용을 강화 또는 보완하는 내인성(세포 내) 또는 외인성(세포외) 세포사멸 유발 활성을 갖는 TRAIL 분절을 포함하지 않는 짧은 효과기 펩티드 도메인 및 TRAIL로부터 유도된 도메인을 함유하는 신규 융합 단백질을 제공함으로써 이 문제의 해결을 제시한다. 더욱이, 많은 경우 본 발명의 융합 단백질은 가용성 TRAIL 및 서열의 분절을 포함하는 그의 변이체보다 더 강력한 활성을 나타내며, 많은 경우 또한 TRAIL에 대한 내성을 극복하는 것으로 판명되었다. 더욱이, 효과기 펩티드의 첨가는 반감기 연장 및 종양 내에서 단백질의 보유 증가 및 최종적으로 그의 효율 증가를 초래한다.

본 발명은 지금부터 하기 도면을 참고로 하여 상세히 기술될 것이다.
도 1은 실시예 1, 실시예 2, 실시예 3, 실시예 4 및 실시예 5에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 2는 실시예 6, 실시예 7, 실시예 8, 실시예 9 및 실시예 10에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 3은 실시예 11, 실시예 12, 실시예 13, 실시예 14 및 실시예 15에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 4는 실시예 16, 실시예 17, 실시예 18, 실시예 19 및 실시예 20에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 5는 실시예 21, 실시예 22, 및 실시예 23에 따른 본 발명의 융합 단백질, 뿐만 아니라 실시예 24, 실시예 25 및 실시예 26의 비교 융합 단백질의 개략적 구조를 나타낸다.
도 6은 실시예 27, 실시예 28, 실시예 29, 실시예 30 및 실시예 31에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 7은 실시예 32, 실시예 33, 실시예 34, 실시예 35 및 실시예 36에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 8은 실시예 37, 실시예 38, 실시예 39, 실시예 40 및 실시예 41에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 9는 실시예 42, 실시예 43, 실시예 44, 실시예 45 및 실시예 46에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 10은 실시예 47, 실시예 48, 실시예 49, 실시예 50 및 실시예 51에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 11은 실시예 52, 실시예 53, 실시예 54, 및 실시예 55에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 12는 hTRAIL114-281과 비교된 본 발명의 융합 단백질로 처리된 대장암 Colo205이 존재하는 SCID/NOD 마우스의 시간에 따른 종양 부피 변화를 나타낸다.
도 13은 hTRAIL114-281과 비교된 실험 29일에 본 발명의 융합 단백질로 처리된 대장암 Colo205가 존재하는 마우스의 종양 성장 억제 값을 나타낸다.
도 14는 hTRAIL114-281과 비교된 본 발명의 융합 단백질로 처리된 인간 폐암 NCI-H460이 존재하는 마우스 Crl:SHO-PrkdcscidHrhr의 시간에 따른 종양 부피 변화를 나타낸다.
도 15는 hTRAIL114-281과 비교된 실험 29일에 본 발명의 융합 단백질로 처리된 인간 폐암 NCI-H460이 존재하는 마우스의 종양 성장 억제를 나타낸다.
도 16은 hTRAIL114-281과 비교된 본 발명의 융합 단백질로 처리된 인간 소세포 폐암 A549가 존재하는 마우스 Crl:SHO-PrkdcscidHrhr의 시간에 따른 종양 부피 변화를 나타낸다.
도 17은 hTRAIL114-281과 비교된 실험 34일에 본 발명의 융합 단백질로 처리된 인간 소세포 폐암 A549가 존재하는 마우스의 종양 성장 억제를 나타낸다.
도 18은 hTRAIL114-281과 비교된 본 발명의 융합 단백질로 처리된 인간 췌장 암종, 상피성(epithelial-like) 세포주 PANC-1이 존재하는 마우스Crl:SHO-PrkdcscidHrhr의 시간에 따른 종양 부피 변화를 나타낸다.
도 19는 hTRAIL114-281과 비교된 실험 43일에 본 발명의 융합 단백질로 처리된 인간 췌장 암종, 상피성 세포주 PANC-1이 존재하는 마우스의 종양 성장 억제를 나타낸다.
도 20은 특정 타원율로 나타낸 rhTRAI114-281 및 실시예 1, 실시예 2, 실시예 14, 실시예 24, 실시예 51 및 실시예 42의 융합 단백질에 대한 원편광 이색성 스펙트럼을 나타낸다.

발명의 상세한 설명

본 발명은 하기를 포함하는 융합 단백질에 관한 것이다:

hTRAIL95보다 낮지 않은 위치에 있는 아미노산으로부터 시작하는 분절인 가용성 hTRAIL 단백질 서열의 기능 분절인 도메인 (a), 및

내인성 세포사멸 경로를 통해 그의 세포사멸 유발 작용을 실행하는, 세포사멸 유발 효과기 펩티드의 서열인 도메인 (b), 여기에서 도메인 (b)의 서열은 도메인 (a)의 C-말단 및/또는 N-말단에 부착된다.

용어 "가용성 hTRAIL 서열의 기능 가용성 분절(the functional soluble fragment of a sequence of soluble hTRAIL)"은 세포사멸 신호를 유도할 수 있는 이러한 가용성 hTRAIL의 분절을 나타내는 것으로 이해되어야 한다.

본 발명에 따른 용어 "펩티드"는 펩티드 결합을 통해 함께 연결된 복수의 아미노산으로부터의 분자 빌트(molecule built)로 이해되어야 한다. 따라서, 본 발명에 따른 용어 "펩티드"는 올리고펩티드, 폴리펩티드 및 단백질을 포함한다.

본 발명의 융합 단백질에서 효과기 펩티드의 도메인 (b)는 hTRAIL 단백질도 아니고 hTRAIL 단백질의 일부도 아니라는 것을 이해하여야 한다.

본 발명에서 펩티드의 아미노산 서열은 펩티드의 N-말단(N-종결)에서 그의 C-말단(C-종결) 쪽으로의 방향으로 당업계에서 채택되는 통상의 방식으로 존재할 것이다. 그러므로, 임의의 서열은 왼쪽 측 상에 그의 N-말단 및 오른쪽 측 상에 C-말단을 가질 것이다.

본 발명의 융합 단백질은 도메인 (a)의 C-말단 또는 N-말단에 부착된 효과기 펩티드의 단일 도메인 (b)를 포함할 수 있다.

본 발명의 융합 단백질은 도메인 (b) 중 하나가 도메인 (a)의 C-말단에 부착되고 다른 하나는 도메인 (a)의 N-말단에 부착된, 효과기 펩티드의 두 도메인 (b)도 또한 함유할 수 있다.

본 발명의 융합 단백질이 효과기 펩티드의 두 도메인 (b)를 포함할 때, 이들 도메인은 동일하거나 상이할 수 있다. 바람직하게는, 이 경우 도메인 (b)가 상이한 것이다.

특정 실시 양태에서, 도메인 (a)는 hTRAIL114에서 hTRAIL121까지의 범위의 아미노산으로부터 시작하여, 아미노산 hTRAIL281상에서 종결하는 hTRAIL 서열의 분절, 또는 수탁 번호 제P50591호로 젠뱅크에 게재된 hTRAIL 서열의 기타 기능 분절이다.

특히, 도메인 (a)는 hTRAIL114-281(서열 번호 27), hTRAIL119-281(서열 번호 28), 및 hTRAIL121-281(서열 번호 29), hTRAIL116-281 및 hTRAIL120-281에 상응하는 서열로 이루어진 군으로부터 선택될 수 있다.

또 다른 실시 양태에서, 도메인 (a)는 서열 hTRAIL95-281일 수 있다.

내인성 세포사멸 경로(세포 내)를 통해 그의 세포사멸 활성을 나타내는 도메인 (b)의 세포사멸 유발 효과기 펩티드는 세포사멸의 미토콘드리아 경로의 신호화 캐스케이드 성분을 활성화에 의해, 또는 세포 내에서 미토콘드리아 세포사멸의 직접적인 유도에 의해 직접적으로 세포사멸을 유도할 수 있다.

본 발명의 융합 단백질의 실시 양태에서, 효과기 펩티드는 하기로 이루어진 군으로부터 선택된 내인성 세포사멸 경로를 통해 작용하는 펩티드이다: 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33, 서열 번호 34, 서열 번호 35, 서열 번호 36, 서열 번호 37, 서열 번호 38, 서열 번호 39, 서열 번호 40, 서열 번호 41, 서열 번호 42, 서열 번호 43, 서열 번호 44, 서열 번호 45, 서열 번호 46, 및 서열 번호 47, 또는 서열 번호 151, 서열 번호 152, 서열 번호 153, 서열 번호 154, 서열 번호 155, 서열 번호 156, 서열 번호 157, 서열 번호 158 서열 번호 159, 서열 번호 160, 서열 번호 161, 서열 번호 162, 서열 번호 163, 서열 번호 164, 서열 번호 165 및 서열 번호 166.

상기 군의 서열 번호 30의 효과기 펩티드는 항 세포사멸 인자를 억제하는 Bax 단백질의 BH3 도메인, 및 구체적으로 하기로 표시되는 16-아미노산 펩티드로부터 유도된 펩티드이다:

KKLSECLKRI GDELDS 서열 번호 30

Bax 단백질의 BH3 도메인의 서열을 기초로 한 펩티드는 항-세포사멸 단백질 Bcl-2 및 Bcl-XL에 효과적으로 결합할 수 있는 것으로 믿어진다.

Bcl-2 및 Bcl-XL 단백질의 항-세포사멸 활성은 세포사멸의 개시를 담당하는 인자(Bax, Bak, Bad) 내에 존재하는 BH3 도메인과의 상호작용을 근거로 한다. BH3 도메인의 결합은 이들의 천연 리간드와 단백질 Bcl-2 및 Bcl-XL의 상호작용을 방지하고 그의 활성을 억제하는 효과를 초래하며, 그에 의하여 세포사멸 촉진의 개시에 기여한다.

상기 군의 서열 번호 31의 효과기 펩티드는 하기로 표시되는 Bid 단백질의 BH3 도메인을 포함하는 15-아미노산 펩티드이다:

RNIARHLAQV GDSMD (서열 번호 31).

Bid 단백질은 Bcl-2 패밀리에 속하며 그 중에서도 세포사멸 유발 인자 Bax의 활성화에 책임이 있다. 본 발명의 융합 단백질에 혼입된 Bid 단백질의 BH3 도메인을 포함하는 16-아미노산 펩티드는 세포사멸을 효과적으로 유도할 것으로 믿어진다.

상기 군의 서열 번호 32의 효과기 펩티드는 하기로 표시되는 리보뉴클레아제 A(RNase A)의 펩티드 동족체이다:

KETA AKFERQHMDS STSAASSSNY CNQMMKSRNL TKDRCKPVNT FVHESLADVQ

AVCSQKNVAC KNGQTNCYQS YSTMSITDCR ETGSSKYPNC AYKTTQANKH

IIVACEGNPY VPVHFDASV(서열 번호 32).

리보뉴클레아제는 음으로 하전된 세포막에 결합하여 이다도시토시스(endocytosis)를 통해 세포로 들어가고, 그후 시토졸로 유출되며, 여기에서 이들은 RNA의 분해를 야기하는 효소로서 작용하는 강력한 항신생물(antineoplastic) 성질을 갖는 작은 단백질이다. 10nM의 농도에서 시작하여, 이들은 세포 주기 저지 및 세포사멸을 야기한다.

상기 기술된 군의 서열 번호 33의 효과기 펩티드는 하기로 표시되는 시토크롬 C 분자이다:

GDVEK GKKIFIMKCS QCHTVEKGGK HKTGPNLHGL FGRKTGQAPG YSYTAANKNK

GIIWGEDTLM EYLENPKKYI PGTKMIFVGI KKKEERADLI AYLKKATNE(서열 번호 33).

미토콘드리아에서 세포질로의 시토크롬 C의 방출은 소위 미토콘드리아 경로를 통한 세포사멸을 유도하는 주 신호 중의 하나이다. 단백질은 카스파제 9를 활성화하는 아포프토솜 복합체(apoptosome complex)의 부분이다.

상기 기술된 군의 서열 번호 34의 효과기 펩티드는 하기로 표시되는 그랜자임 B이다:

IIGGHVAKPH SRPYMAYLMI WDQKSLKRCG GFLIRDDFVL TAAHCWGSSINVTLGAHNIK

EQEPTQQFIP VKRAIPHPAY NPKNFSNDIM LLQLERKAKR

TRAVQPLRLP SNKAQVKPGQ TCSVAGWGQT APLGKHSHTL QEVKMTVQED

RKCESDLRHY YDSTIELCVG DPEIKKTSFK GDSGGPLVCN KVAQGIVSYG

RNNGMPPRAC TKVSSFVHWI KKTMKRY(서열 번호 34).

문헌에서 프래그멘틴(fragmentin)으로도 불리우는 그랜자임(granzyme)은 Tc 림프구 및 NK 세포의 세포 입도(granularity)를 위한 전형적인 세린 프로테아제이다. 인간에서, 현재 5의 상이한 그랜자임이 확인되었다: A, B, H, K(트립타제) 및 M(메티오니나제). 연구는 이들 효소가 표적 세포에 대하여 림프구에 의해 발휘된 세포 독성 반응의 요소인 것으로 확인되었다. 이들 효소는 세포막에 기공(pore)을 생성하고 그에 의해 세포 독성 반응을 매개하는 단백질인 퍼포린을 활성화하는 것으로 나타났다. 더욱이, 이들 효소는 표적 세포에서 세포사멸의 유도에 직접적으로 포함되는 것으로 믿어진다. 그랜자임 B는 선택된 프로카스파제를 그들의 활성 형태(예컨대 카스파제 3)로 활성화하며, 또한 단백질 분해를 통해 활성 형태의 Bid 단백질(Bcl-2 단백질 패밀리에 속하는 단백질)을 방출하고, 이것은 미토콘드리아 막으로 혼입되고 막 내에 기공을 생성하고, 이어서 세포사멸-유도 인자(시토크롬 C, 카스파제 9, Apaf)를 방출하여 세포사멸의 세포 내 경로를 개시하게 한다. 히스톤에 결합함에 의해 그랜자임 B는 또한 염색질 구조의 이완에도 참여할 수 있으며, 이것은 그의 이완을 야기하며 엔도뉴클레아제를 위한 DNA로의 접근을 증진시킨다.

상기 군의 서열 번호 35의 효과기 펩티드는 하기로 표시되는 Nur77 단백질의 분절이다:

FSRSLHSLL (서열 번호 35).

핵 수용체 Nur77은 세포사멸의 매우 강력한 유도물질(inducer)이다. 그의 작용 메커니즘 중의 하나는, 중요한 항-세포사멸 인자인 Bcl-2 단백질에 결합하는 능력이다. 이러한 상호작용은, 세포사멸의 유도물질로 전환하는 Bcl-2의 구조에서의 입체형태 변화를 야기한다. 상기에서 표시된 분절은 세포 내에서 세포사멸의 유도 및 Bcl-2의 결합 및 전환에 책임이 있는 것으로 확인된 Nur77의 서열로부터 9-아미노산 영역이다.(Kolluri 등, Cancer Cell 14: 285-298, 2008).

상기 군의 서열 번호 36의 효과기 펩티드는 하기로 표시되는 Bak 단백질의 BH3 도메인을 포함하는 15-아미노산 펩티드이다:

GQVGRQLAII GDDIN (서열 번호 36).

본 발명의 융합 단백질로 혼입되는 이러한 짧은 펩티드는 세포사멸 신호를 효과적으로 유도할 것으로 믿어진다.

상기 군의 서열 번호 37의 효과기 펩티드는 하기로 표시되는 단백질 PUMA/BBC3의 BH3 도메인이다:

EEQWAREIGA QLRRMADDLN AQYE 서열 번호 37.

PUMA/BBC3(세포사멸/Bcl-2-결합 성분 3의 p53 조절증진된 조절인자(upregulated modulator))는 Bcl-2 단백질 패밀리(BH3-만의 서브패밀리)의 멤버이다. 이것은 p53에 의존 및 독립하는 양자의 방식으로 세포사멸을 매개한다. 모든 공지의 생존 유발(pro-survival) Bcl-2 단백질과 PUMA/BBC3의 직접 상호작용은 이들의 불활성화인 미토콘드리아 기능장애를 야기하며, 따라서 세포사 및 카스파제의 활성화를 야기한다. PUMA는 또한 Bak 및 Bax와 같은 분자의 세포사멸 유발 활성의 복원에 간접적으로 영향을 준다. BH3 도메인은 생존 유발 단백질과 PUMA의 결합에 책임이 있다.

상기 군의 서열 번호 38의 효과기 펩티드는 하기로 표시되는 단백질 PUMA/BBC3이다.

ARAR QEGSSPEPVE GLARDGPRPF PLGRLVPSAV SCGLCEPGLA AAPAAPTLLP

AAYLCAPTAP PAVTAALGGS RWPGGPRSRP RGPRPDGPQP SLSLAEQHLE

SPVPSAPGAL AGGPTQAAPG VRGEEEQWAR EIGAQLRRMA DDLNAQYERR

RQEEQQRHRP SPWRVLYNLI MGLLPLPRGH RAPEMEPN(서열 번호 38).

본 발명의 융합 단백질로 혼입될 때 단백질 PUMA/BBC3 및 그의 BH3 도메인 양자가 효과적으로 세포사멸 신호를 유도할 것으로 믿어진다.

상기 군의 서열 번호 39의 효과기 펩티드는 하기로 표시되는 단백질 SMAC/Diablo의 8-아미노산 분절이다:

AVPIAQKP (서열 번호 39).

SMAC/DIABLO(Second mitochondria-derived activator of Caspase(카스파제의 제2 미토콘드리아 유도 활성제)/Direct IAP Binding Protein with Low PI(낮은 PI를 갖는 직접 IAP 결합 단백질)는 미토콘드리아로부터 방출된 카스파제의 활성제이다. 그의 N-말단 모티프는 IAP 단백질에 경쟁적으로 결합하여, 카스파제의 불활성화로부터 그들의 BIR 2 및 BIR 3 도메인을 방지한다. 본 발명의 융합 단백질로 혼입될 때 이 짧은 펩티드는 세포사멸 신호를 효과적으로 유도할 것으로 믿어진다.

상기 군의 서열 번호 40의 효과기 펩티드는 하기로 표시되는 부포린(buforin) IIb 펩티드이다:

RAGLQFPVGR LLRRLLRRLL (서열 번호 40).

부포린 IIb는 히스톤 H2A로 유도된 펩티드이며, 이것은 세포막의 독립적인 침투가 가능하며 항세균(antibacterial) 성질을 갖는다(Park 등, Biochem Biophys. Res. Commun., 244: 253-257, 1998). 항암제로서의 그의 유용성에 관한 연구는 이것이 많은 암세포에 선택적으로 결합할 수 있고, 세포에 침투하며 핵 내에 축적할 수 있어 미토콘드리아 경로를 통한 세포사멸을 유도할 수 있다는 것을 보여주었다(Lee 등, Cancer Letters, 271:47-55, 2008).

상기 군의 서열 번호 41의 효과기 펩티드는 하기로 표시되는 온코나제(onconase) 펩티드이다:

QDWLT FQKKHITNTR DVDCDNIMST NLFHCKDKNT FIYSRPEPVK AICKGIIASK

NVLTTSEFYL SDCNVTSRPC KYKLKKSTNK FCVTCENQAP VHFVGVGSC(서열 번호 41).

온코나제 또는 P-30은 개구리 라나 피피엔스(frog Rana pipiens) 난모세포의 용해물로부터 최초로 유도된 단백질이다. 이것은 12kDa의 질량을 가지며, RNase A의 구조 동족체인 단일 가닥 단백질이다. 이 단백질에 대한 연구는 종양 세포에 대한 놀라운 세포 독성 활성을 갖는 것을 보여주었다(Y Wu, SM Mikulski, W Ardelt, SM Rybak and RJ Youle, The Journal of Biological Chemistry 268, 10686-10693). 온코나제의 작용 메커니즘에 대한 연구는 내재화 과정시 세포내로 들어가고, 여기에서 단백질 합성 및 세포사의 억제를 초래하는 28S 및 18S 리보솜 rRNA의 분해 과정을 수행한다는 것을 보여주었다.

상기 군의 서열 번호 42의 효과기 펩티드는 p14ARF 단백질의 20-아미노산 N-말단 분절이며, 이것은 하기로 표시되는 생존 유발 Mdm2 단백질의 억제제이다:

VRRFLVTLRI RRACGPPRV (서열 번호 42).

P14ARF는 종양 억제 유전자 p53에 결합하고 그의 분해 및 그에 의한 형질전환된 세포의 생존 가능성에 책임이 있는 Mdm2 단백질의 활성을 조절하는 단백질이다. Mdm2에 결합함에 의해 P14ARF 단백질은 그의 p53과의 상호작용을 방지한다. p14ARF로부터 유도된 짧은 펩티드는 Mdm2 와 p53 사이의 상호 작용을 차단하기에 충분하고 후자의 분해를 방지하는 것으로 보고되었다.(Midgley 등, Oncogene 19: 2312-2323, 2000).

상기 군의 서열 번호 43의 효과기 펩티드는 하기로 표시되는 Mdm2에 결합하는 11-아미노산 펩티드이다:

PRFMDTWEGL N (서열 번호 43).

상기 펩티드는 p53 서열에 대하여 서열 상동성을 나타내며 Mdm2-p53 상호작용의 억제에 대하여 중요한 효율성을 나타내고(Bottger 등, Oncogene 13:2141-2147, 1996), 그에 의해 p53의 분해를 방지한다.

상기 군의 서열 번호 44의 효과기 펩티드는 하기로 표시되는 루나신(lunasin) 펩티드의 17-아미노산 분절이다

CEKHIMEKIQ GRGDDDD (서열 번호 44).

루나신은 강력한 항암물질로 입증된 대두(글라이신 맥스(Glycine max))로부터 유도된 43-아미노산 펩티드이다. 이 분자의 일반적 작용 메커니즘은 히스톤 아세틸화의 억제로 구성된다. 데아세틸라제(deacetylase) 활성을 갖는 분자는 또한 전사 과정에서 공동-억제 유전자(co-suppressor)로서 작용한다는 것이 공지되어 있다(Leong 등, Cancer Lett, 18: 42 - 48, 2007).

상기 군의 서열 번호 45의 효과기 펩티드는 하기로 표시되는 Bik 단백질의 BH3 도메인이다:

LALRLAC IGDEMDVS (서열 번호 45).

Bik 단백질은 생존 신호(예컨대 Bcl-2)를 개시하는 세포 및 바이러스 인자와 상호작용하고, 그에 의해 세포사멸을 촉진한다. 많은 다른 세포사멸 유발 단백질과 마찬가지로, 이것은 Bcl-2와 상호작용하기 위해 필요한 BH3 도메인을 함유한다. BH3 도메인을 포함하는 단백질로부터 유도된 펩티드는 다른 세포사멸 유발 단백질을 활성화하여 또는 항-세포사멸 단백질을 억제하여 세포사멸을 개시할 수 있다.(Del Gaizo Moore, V, 등, Blond, 111: 2300-2309, 2008).

상기 군의 서열 번호 46의 효과기 펩티드는 하기로 표시되는 합성 펩티드- 프로테아좀 억제제이다:

AGAGGGAGG AGAGGGAGGA G (서열 번호 46).

이 펩티드는 Gly 및 Ala 잔기의 반복 시리즈로 구성되며 TRAIL 수용체 DR5의 과발현 유도에 의해 TRAIL-유도 세포사멸을 강화할 수 있는 프로테아좀 억제제이다.

상기 군의 서열 번호 47의 효과기 펩티드는 하기로 표시되는 프로테아좀 S5a의 C-말단 분절의 도메인이다.

MTISQQEFG RTGLPDLSSM TEEEQIAYAM QMSLQGAEFG QAESADIDAS SAMDTSEPAK

EEDDYDVMQD PEFLQSVLEN LPGVDPNNEA IRNAMGSLAS QATKDGKKDK KEEDK(서열 번호 47).

프로테아좀 S5a 분절로부터의 이 도메인은 유비퀴틴 결합에 직접 참여하는 UIMs 모티프를 함유하며 따라서 세포사멸을 유도할 수 있는 능력을 갖는다.

상기 군의 서열 번호 151의 효과기 펩티드는 아주린(azurin) 유도된 펩티드이다.

아주린은 병원성 박테리아인 녹농균 (Psedomonas aeruginosa)에 의해 방출된 구리 함유 산화 환원 단백질이며, 많은 암 세포주에 대하여 고도로 세포독성이 있다. 이것은 시토졸에 진입하고 핵으로 이동한다. 그의 활성은 엄격히 암세포 내의 p53 활성 형태의 존재에 의존한다. 아주린은 p53과 결합하고 p53 및 Bax 레벨을 포스트-번역으로(post-translationaly) 증가시킨다. Mdm2-p53 기능 상호 작용에 대한 명백한 길항작용은 p53에 아주린의 결합이 Mdm2-p53회합으로 방해받으며 따라서 p53의 분해를 방지한다는 것을 암시한다. 결합시, 시토졸로 미토콘드리아 시토크롬 c의 방출을 촉발한다. 이 과정은 카스파제 캐스케이드(카스파제-9 및 카스파제-7 포함)을 활성화하며, 그에 의해 세포사멸 과정을 개시하게한다(Punj V, 등 Oncogene. 2004 Mar 25;23(13):2367-78, Funari G 등. J Mol Recognit. 2010 Jul Aug;23(4):343-51). 아주린 서열로부터 유도된 펩티드 활성의 상세한 분석은 효율적 세포 침투 및 세포사멸의 촉발에 책임이 있는 28 아미노산의 영역을 나타낸다(Yamada i wsp., Cell Microbiol, 7:1418-1431, 2005).

상기 군의 서열 번호 152의 효과기 펩티드는 전체 길이의 아주린 펩티드이다.

상기 군의 서열 번호 153의 효과기 펩티드는 Bax 단백질의 BH3 도메인 및 aPP 단백질로부터 제작된 펩티드이다.

aPP 단백질의 키메라 및 다시 제작된 세포사멸 유발 Bak 단백질은 인간 Bcl-2 및 Bcl-X에 대하여 매우 강력하고 특이적인 리간드로서 EP1309680호에 보고되었다(또한, Chin JW, Schepartz A. Design and evolution of a miniature Bcl-2 binding protein Angew Chem Int Ed Engl. 2001 Oct 15;40(20):3806-3809 참조).

상기 군의 서열 번호 154의 효과기 펩티드는 Bax 단백질의 BH3 도메인 및 aPP 단백질로부터 제작된 또 다른 펩티드이다.

상기 기술된 군의 서열 번호 155의 효과기 펩티드는 레티쿨론(Reticulon) RTN1-C 유도된 펩티드이다.

RTN1-C 단백질은 ER에 국지적으로 존재하는 막 단백질이며 신경 시스템에서 발현되고, 그의 생물학적 역할은 완전히 밝혀지진 않았다. 잔기 186 내지 208의 분절에 상응하는 RTN1-C의 C-말단 영역은 핵산에 결합할 수 있으며 그들의 활성을 감소시키는 히스톤 데아세틸라제(HDAC) 효소와 상호작용할 수 있다.

상기 군의 서열 번호 156의 효과기 펩티드는 전체 길이의 인간 레티쿨론 3(이소형태(isoform) a)이다. 레티쿨론(RTNs)은 다른 공지의 세포사멸-관련 도메인에 상동성을 갖지 않는 내재 막(integral membrane) 단백질의 군을 형성한다. 레티쿨론 3 이소형태 a는 종양 세포주 내에서 과발현되며, 이들을 TRAIL-매개 세포사멸에 민감하게 전환시킨다.

상기 군의 서열 번호 157의 효과기 펩티드는 구성적으로 활성인 변형된 카스파제-3(단일 사슬)이다. (Srinivasula SM, Ahmad M, MacFarlane M, Luo Z, Huang Z, Fernandes-Alnemri T, Alnemri ES. Generation of 구성적으로 active recombinant caspases-3 및 -6 by rearrangement of their subunits(서브유닛의 재배열에 의한 구성적으로 활성인 재조합 카스파제-3 및 -6의 발생). J Biol Chem. 1998 Apr 24;273(17):10107-11).

상기 군의 서열 번호 158의 효과기 펩티드는 Par-4 단백질로부터의 SAC 도메인이다. (전립선 세포사멸 반응 단백질 par-4).

Par-4는 세포사멸 유발 기능을 갖는 종양 억제 유전자 단백질이다. Par-4 잔기의 암-특이적 세포사멸 유발 작용은 그의 중심에 위치한 SAC 도메인이다. 분자의 기능은 2개의 별개의 수단에 의해 성취된다: 세포사 기구(cell-death machinery) 의 분자 성분의 활성화(플라스마 막으로 Fas 및 FasL의 전좌), 및 생존 유발 인자(NF-κB 경로)의 억제.(Zhao Y, Rangnekar VM. Par-4에 의해 부여된 세포사멸 및 종양 내성(Apoptosis and tumor resistance conferred by Para-4). Cancer Biol Ther. 2008 Dec;7(12):1867-74. Epub 2008 Dec 8. Review).

상기 군의 서열 번호 159의 효과기 펩티드는 녹사(Noxa) 단백질이다. 녹사는 단백질의 Bcl-2 패밀리의 Bcl-2 상동성 3(BH3) 단일 멤버를 코딩한다; 이 멤버는 BH3 영역을 함유하지만 다른 BH 도메인은 함유하지 않는다. 녹사는 p53-의존 세포사멸의 매개자이며 미토콘드리아에 BH3 모티프 의존 국지화가 진행되고 항-세포사멸 Bcl-2 패밀리 멤버와 상호작용하여, 카스파제-9의 활성화를 초래한다.

상기 기술된 군의 서열 번호 160의 효과기 펩티드는 미토콘드리아 위치를 위해 필요한 녹사 단백질의 10 AA(KLLNLISKLF) 분절이다(MTD-미토콘드리아 타겟팅 도메인 또는 CKP-세포를 치사하는 펩티드). 이것은 WO2006/001582호 및 Young-Woo Seo 등, 「The Journal of Biological Chemistry Vol. 278, No. 48, 11월 28일 발행, pp. 48292-48299, 2003」에 기술되어 있다.

상기 군의 서열 번호 161의 효과기 펩티드는 WO2010055929호에 기술된 짧은 하이브리드 펩티드 Antp-TPR이다. Antp-TPR은 조작된 하이브리드 펩티드 타겟팅 Hsp90이며, 이것은 Hop의 TPR2A 도메인과 Hsp90의 상호작용의 억제로 인해 암세포에 대한 선택적인 세포 독성 활성을 갖는다.

상기 기술된 군의 서열 번호 162의 효과기 펩티드는 Stat3 단백질의 SH2 도메인의 펩티드 억제제이다.

Stat 단백질의 SH2 도메인은 성장 인자 및 사이토카인에 대한 반응에서 정상 STAT 신호화를 통한 세포 성장 및 분화의 촉진을 초래하는 일련의 이벤트들에 책임이 있다.

상기 군의 서열 번호 163의 효과기 펩티드는 Bak 단백질(Bcl-2 패밀리)의 BH3 도메인으로부터 유도된 펩티드 GQVGRQLAIIGDDINR이다(Castelli M, Reiners JJ, Kessel D. 우루소데옥시콜산의 세포사멸 유발 활성에 대한 메커니즘 : Bcl-2 입체구조에 대한 효과(A mechanism for the proapoptotic activity of ursodeoxycholic acid: effects on Bcl-2conformation). Cell Death Differ. 2004 Aug;11(8):906-14). Bak 단백질은 세포사멸 개시와 연관된 Bcl-2 패밀리의 세포사멸 유발 멤버이다.

상기 군의 서열 번호 164의 효과기 펩티드는 Bad 단백질(Bcl-2 패밀리)의 BH3 도메인으로부터 유도된 펩티드 KNLWAAQRYGRELRRMSDEFEGSFKGL이다(Wang JL, Zhang ZJ, Choksi S, Shan S, Lu Z, Croce CM, Alnemri ES, Korngold R, Huang Z. 세포 투과성 Bcl-2 결합 펩티드: 종양 세포에서 세포사멸 유도로의 화학적 접근(Cell permeable Bcl-2 binding peptides: a chemical approach to apoptosis induction in tumor cells). Cancer Res. 2000 Mar 15;60(6):1498-502).

상기 군의 서열 번호 165의 효과기 펩티드는 Bfl1 단백질로부터의 펩티드 ATAP이다.

ATAP(양친매성 테일-고정 펩티드, (amphipathic tail-anchoring peptide)) (Bfl1으로부터의 잔기 147-175, 2가의 Bcl2 패밀리 단백질)는 특이적으로 미토콘드리아를 표적으로 하며 Bax 또는 Bak가 필요없는 카스파제-의존 세포사멸을 유도한다.

상기 군의 서열 번호 166의 효과기 펩티드는 Bfl1 단백질로부터의 또 다른 ATAP 펩티드이다. ATAP 단백질은 HCCS1로부터 MTS 도메인으로 융합된다.(Ko JK, Choi KH, Pan Z, Lin P, Lin P, Weisleder N, Kim CW, Ma J. Bfl1 및 HCCS1의 테일-고정 도메인은 세포사멸을 유도하기 위해 미토콘드리아 막 투과성을 표적으로 한다(The tail-anchoring domain of Bfl1 and HCCS1 targets mitochondrial membrane permeability to induce apoptosis). J Cell Sci. 2007 Aug 15;120(Pt 16):2912-23. Epub 2007 Jul 31).

상술한 바와 같이, 도메인 (b)의 세포사멸 유발 효과기 펩티드의 제1 변이체는 내인성 세포사멸 경로(세포 내)를 통해 그의 세포사멸 활성을 나타내는 펩티드일 수 있으며, 이것은 세포사멸의 미토콘드리아 경로의 신호화 캐스케이드 성분의 활성화에 의해, 또는 세포 내에서 미토콘드리아 세포사멸의 직접적인 유도에 의해 직접적으로 세포사멸을 유도한다.

제1 변이체의 한 실시 양태에서, 내인성 경로를 통한 그의 활성을 나타내는 도메인 (b)의 세포사멸 유발 효과기 펩티드의 한 군은 결합시에 항-세포사멸 단백질 Bcl-2 및 Bcl-XL과 같은 세포 내 항-세포사멸 또는 생존 유발 인자를 저해 및/또는 조절하는 펩티드일 수 있다.

상기 군의 예시적인 효과기 펩티드는 실시예 1의 융합 단백질에 존재하는 서열 번호 30, 실시예 11 및 47의 융합 단백질에 존재하는 서열 번호 37, 실시예 21의 융합 단백질에 혼입된 서열 번호 45, 실시예 42 및 43의 융합 단백질에 존재하는 서열 번호 158 및 실시예 44의 융합 단백질에 혼입된 서열 번호 159로 표시되는 펩티드이다.

이러한 제1 변이체의 또 다른 실시 양태에서, 내인성 경로를 통해 그의 활성을 나타내는 도메인 (b)의 세포사멸 유발 효과기 펩티드의 한 군은 세포 내부에서 직접적인 파괴 효과를 나타내어 세포주기를 저지하는 펩티드일 수 있다.

상기 미토콘드리아 내인성 경로의 세포 내에서의 직접적인 파괴 효과는 세포사를 이끄는 카스파제 캐스케이드의 상이한 레벨에서 효과기 펩티드에 의해 개시될 수 있다.

상기 미토콘드리아 내인성 경로의 효과기 펩티드의 직접적인 파괴 효과의 예는 핵산, 특히 전체 세포 RNA 또는 DNA의 분해 및 분해적인 뉴클레아제의 유도이다. 이러한 효과는 예를 들어 인간 췌장 RNAse을 포함하는 췌장 RNAse A, 인간 안지오제닌(리보뉴클레아제 5, hAng), 인간 호산성-유도된 신경독소(eosinophil-derived neurotoxin) (EDN) 및 소 리보뉴클레아제, 뿐만 아니라 그들의 동족체 및 변이체의 슈퍼패밀리의 리보뉴클레아제와 같은 리보뉴클레아제로 나타낼 수 있다. RNAse 동족체의 예는 황소 개구리(Rana catesbiana) 및 일본 산 개구리(Rana japonica)로부터 단리된 리보뉴클레아제인 온코나제이다.

핵산의 분해에 의해 작용하는 상기 군의 예시적인 효과기 펩티드는 실시예 3, 4 및 27의 융합 단백질에 존재하는 서열 번호 32, 실시예 16, 17 및 46의 융합 단백질에 존재하는 서열 번호 41, 및 실시예 41의 융합 단백질에 존재하는 서열 번호 157로 표시되는 펩티드이다.

상기 미토콘드리아 내인성 경로에서 효과기 펩티드의 직접적인 파괴 효과의 또 다른 예는 카스파제 활성화이다. 이러한 효과는 예를 들어 실시예 5 및 6의 융합 단백질에 존재하는 시토크롬 c(서열 번호 33), 실시예 7 및 8의 융합 단백질에 존재하는 그랜자임 B(서열 번호 34), 또는 실시예 14, 21, 33, 34 및 35의 융합 단백질에 존재하는 단백질 Smac/DIABLO(서열 번호 39)에 의해 나타낼 수 있다.

상기 미토콘드리아 내인성 경로에서 효과기 펩티드의 직접적인 파괴 효과의 또 다른 예는 p53 기능의 복원시 세포사멸 유발 단백질의 안정화의 영향으로 인한 프로테아좀 억제이다.

프로테아좀 억제에 의해 작용하는 상기 군의 예시적인 효과기 펩티드는 실시예 22의 융합 단백질에 혼입된 서열 번호 46, 및 실시예 23의 융합 단백질에 혼입된 서열 번호 47에 의해 표시되는 펩티드이다.

상기 미토콘드리아 내인성 경로에서 효과기 펩티드의 직접적인 파괴 효과의 또 다른 예는 p53 기능의 복원시 세포사멸 유발 단백질 발현의 영향을 증진함으로인한 히스톤 단백질의 조절이다.

히스톤 단백질의 조절에 의해 작용하는 상기 군의 예시적인 효과기 펩티드는 실시예 15의 융합 단백질에 혼입된 서열 번호 40으로 표시되는 부포린 IIb 및 실시예 20의 융합 단백질에 혼입된 서열 번호 44로 표시되는 루나신이다.

상기 미토콘드리아 내인성 경로에서 효과기 펩티드의 직접적인 파괴 효과의 또 다른 예는 예컨대 그의 분해 억제에 의한 p53기능의 복원이다. p-53 분해의 방지는 MDM2(murine double minute 2)와 같은 p-53의 음성 조절자의 억제에 의해 그의 음성 조절을 방해하여 성취될 수 있다. 이것은 아주린, 구리 함유 산화 환원 단백질, 세포 주기 조절자 p14ARF, 또는 SuperTIP(티오레독신 삽입 단백질, 박테리아 티오레독신 단백질의 활성 부위 루프 내의 mdm-2-결합 펩티드), 또는 이들의 분절과 같은, p-53에 결합하기 위해 MDM2와 경쟁하는, MDM2 결합 펩티드에 의해 성취될 수 있다.

p-53 기능의 복원에 의해 작용하는 상기 군의 예시적인 효과기 펩티드는 실시예 18의 융합 단백질에 혼입된 서열 번호 42, 실시예 19의 융합 단백질에 혼입된 서열 번호 43, 실시예 29, 30 및 31의 융합 단백질에 존재하는 서열 번호 151, 및 실시예 32의 융합 단백질에 혼입된 서열 번호 152로 표시되는 펩티드이다.

상기 미토콘드리아 내인성 경로에서 효과기 펩티드의 직접적인 파괴 효과의 또 다른 예는 Bcl-2 단백질 패밀리, 예컨대 단백질 Bax, Bak, Bok, Bid, Bim, Bad, Bmf, Hrk, Noxa, Puma, Bik, BNIP3 및 Spike, 특히 더 Bid, Bim, Bad, Bmf, Hrk, Noxa, Puma, Bik, BNIP3 및 Spike를 포함하는 BH3 단일 단백질 패밀리에 영향을 주는 것, 즉 활성화, 억제 또는 조절이다. 특히, Bcl-2 패밀리 멤버의 BH3 도메인의 분절은 유리한 효과기 펩티드일 것이다. 효과기 펩티드의 다른 군은 예를 들어 핵 수용체 Nur77과 같은 핵 수용체 RXR(레티노이드 X 수용체)의 패밀리의 분절이다.

Bcl-2 단백질 패밀리에 영향을 주는 것에 의해 작용하는 상기 군의 예시적인 효과기 펩티드는 실시예 1의 융합 단백질에 혼입된 서열 번호 30, 실시예 2, 4 및 8의 융합 단백질에 존재하는 서열 번호 31, 실시예 3의 융합 단백질에 혼입된 서열 번호 32, 실시예 9의 융합 단백질에 혼입된 서열 번호 35, 실시예 10의 융합 단백질에 혼입된 서열 번호 36, 실시예 11 및 47의 융합 단백질에 존재하는 서열 번호 37, 실시예 12 및 13의 융합 단백질에 존재하는 서열 번호 38, 실시예 44의 융합 단백질에 혼입된 서열 번호 159, 실시예 45의 융합 단백질에 혼입된 서열 번호 160, 실시예 51의 융합 단백질에 혼입된 서열 번호 163, 실시예 52 및 53의 융합 단백질에 존재하는 서열 번호 164, 실시예 54의 융합 단백질에 혼입된 서열 번호 165, 및 실시예 55의 융합 단백질에 혼입된 서열 번호 166으로 표시되는 펩티드이다.

상기 미토콘드리아 내인성 경로에서 효과기 펩티드의 직접적인 파괴 효과의 또 다른 예는 TRAIL 수용체에 결합하는 TRAIL에 의해, 특히 카스파제 활성화에 의해 유도된 세포사멸 신호의 수렴이다.

상기 미토콘드리아 내인성 경로에서 효과기 펩티드의 직접적인 파괴 효과의 또 다른 예는 아포프토솜(apoptosome) 형성의 촉진이다.

상기 아포프토솜 형성의 촉진에 의해 작용하는 상기 군의 예시적인 효과기 펩티드는 실시예 1의 융합 단백질에 혼입된 서열 번호 30, 실시예 2의 융합 단백질에 혼입된 서열 번호 31, 실시예 5 및 6의 융합 단백질에 존재하는 서열 번호 33, 실시예 9의 융합 단백질에 혼입된 서열 번호 35, 실시예 10의 융합 단백질에 혼입된 서열 번호 36, 실시예 47의 융합 단백질에 혼입된 서열 번호 37, 실시예 33, 34 및 35의 융합 단백질에 존재하는 서열 번호 39, 실시예 14의 융합 단백질에 혼입된 서열 번호 40, 실시예 21의 융합 단백질에 혼입된 서열 번호 45, 실시예 36 및 37의 융합 단백질에 존재하는 서열 번호 153, 실시예 38의 융합 단백질에 혼입된 서열 번호 154, 실시예 41의 융합 단백질에 혼입된 서열 번호 157, 실시예 42 및 43의 융합 단백질에 존재하는 서열 번호 158, 실시예 44의 융합 단백질에 혼입된 서열 번호 159, 실시예 45의 융합 단백질에 혼입된 서열 번호 160, 실시예 51의 융합 단백질에 혼입된 서열 번호 163, 및 실시예 52 및 53의 융합 단백질에 존재하는 서열 번호 164로 표시되는 펩티드이다.

상기 미토콘드리아 내인성 경로에서 효과기 펩티드의 직접적인 파괴 효과의 또 다른 예는 미토콘드리아에 의해 방출된 단백질이 카스파제 활성화 레벨에서 작용할 수 있도록 기인하는 미토콘드리아 외막(MOMP) 투과화(permeabilization)의 촉진이다.

MOMP 투과화의 촉진에 의해 작용하는 상기 군의 예시적인 효과기 펩티드는 실시예 1의 융합 단백질에 혼입된 서열 번호 30, 실시예 2 및 48의 융합 단백질에 존재하는 서열 번호 31, 실시예 5 및 6의 융합 단백질에 존재하는 서열 번호 33, 실시예 14, 33, 34 및 35의 융합 단백질에 존재하는 서열 번호 39, 실시예 15의 융합 단백질에 혼입된 서열 번호 40, 실시예 46의 융합 단백질에 혼입된 서열 번호 41, 및 실시예 21의 융합 단백질에 혼입된 서열 번호 45로 표시되는 펩티드이다.

상술한 바와 같이, 본 발명의 도메인 (b)의 세포사멸 유발 효과기 펩티드의 제2 변이체는 외인성 경로(세포외)를 통해 작용하는 세포사멸 유발 효과기 펩티드의 군이며, 그의 효과는 암세포의 표면상에 존재하는 수용체에 결합시 필요하다.

세포 외로 작용하는 펩티드로서의 하기 TNF-리간드(TNF-종양 괴사 인자) 또는 TNF-유사체는 비교 효과기 펩티드로서 사용되었다:

- VANPQAEGQL 데카펩티드(서열 번호 48);

- LANGVE 헥사펩티드(서열 번호 49), 또는

- 셉타펩티드 CPSEGLC(서열 번호 50).

서열 번호 48로 표시되는 데카펩티드는 JP 60,226,816호에서 TNF의 유사체/아고니스트로서 기술되어 있다.

서열 번호 49로 표시되는 헥사펩티드는 TNF에서 유도되며 DE 3,841,768호에 기술되어 있다.

서열 번호 50으로 표시되는 셉타펩티드는 사이토카인과 그의 세포 수용체와의 상호작용의 표면으로부터 유도된 TNF 사이토카인의 일부인 5-아미노산 펩티드: 두 시스테인 잔기에 의해 C-말단 및 N-말단에서 측면에 있는 TNFR55 및 TNFR75이다. 시스테인 잔기는 아미노산 사이의 황화물 브리지의 형성을 통해 펩티드 고리화를 안정화한다. 고리화의 목적은 펩티드의 안정화 및 그의 활성의 개선이다.

암세포의 표면상에 존재하는 TRAIL 수용체에 결합시, 융합 단백질은 이중효과를 나타낼 것이다. TRAIL의 기능 분절인 도메인 (a)는 그의 알려진 아고니스트 활성 - 즉 세포 표면상에서 사멸 수용체에 결합 및 세포사멸의 외인성 경로의 활성화를 나타낼 것이다. 세포 내 작용하는 세포사멸 유발 펩티드를 포함하는 융합 단백질의 엔도시토시스(endocytosis)를 통해 내재화(intenalizaion) 후, 도메인 (b)는 TRAIL 도메인의 활성에 병행하여 세포 내 작용을 강력하게 나타낼 수 있을 것이다. 이러한 방식으로, TRAIL의 항암 활성은 세포사멸의 메커니즘 및 다른 요소의 활성화에 의해 강력하게 될 것이다.

세포외에서 작용하는 세포사멸 유발 펩티드를 혼입한 비교 융합 단백질은 TRAIL 수용체 이외의 세포사멸 유발 수용체에 결합 및 활성화하여 세포사멸 경로를 강력하게 추가적으로 개시시켜야 한다.

본 발명의 한 실시 양태에서, 융합 단백질의 도메인 (a) 및 (b)는 직접적으로 서로 연결될 수 있다.

또 다른 실시 양태에서, 도메인 (a) 및 도메인 (b)는 세포 환경, 특히 종양 세포 환경에 존재하는 프로테아제에 의해 인식된 절단 부위의 서열을 포함하는 도메인 (c)에 의해 연결된다.

프로테아제 절단 부위는 하기에서 선택될 수 있다:

- 메탈로프로테아제 MMP, 특히 서열 PLGLAG(서열 번호 51), PLGIAGE(서열 번호 171) 또는 PLGLAGQ(서열 번호 173)에 의해 인식되는 서열

- 유로키나제 uPA, 특히 RVVR 서열(서열 번호 52)에 의해 인식되는 서열, 및

- 퓨린, 특히 서열 RKKR(서열 번호 53), 또는 서열 RKKRVKR(서열 번호 172) 에 의해 인식되는 서열,

및 그의 조합.

특히, 프로테아제 절단 부위는 임의의 순서로 서로 나란히 위치한, 메탈로프로테아제 MMP에 의해 인식되는 서열 및 유로키나제 uPA에 의해 인식되는 서열의 조합이다.

한 실시 양태에서, 도메인 (c)는 서열 PLGLAGRVVR인 MMP/uPA 서열 번호 51/서열 번호 52의 조합, 또는 서열 RVVRPLGLAG인 uPA/MMP 서열 번호 52/서열 번호 51의 조합물이다.

프로테아제 메탈로프로테아제 MMP, 유로키나제 및/또는 퓨린은 종양 환경에서 과발현된다. 프로테아제에 의해 인식되는 서열의 존재는 구조물의 내재화시 도메인 (b)에서 도메인 (a)의 절단, 즉 기능 도메인 (b)의 방출 및 이에 따른 그의 활성화를 할 수 있게 한다.

효과기 펩티드의 신속한 방출을 허용함에 의한 프로테아제 절단 부위의 존재는, 세포 발생에서 존재하는 프로테아제에 의해 융합 단백질의 랜덤 분해 전에, 펩티드를 그의 작용 위치에 수송하는 기회를 증진시킨다.

추가로, 본 발명의 융합 단백질의 효과기 펩티드의 도메인 (b)에 하기로 이루어진 군으로부터 선택된 수송 도메인(d)를 부착시킬 수 있다:

(d1) 소포체로 향하는 서열,

(d2) 6, 7, 8 또는 9 Arg 잔기를 포함하는 세포막을 통해 수송하는 폴리아르기닌 서열,

(d3) 녹농균(Pseudomonas aeruginosa)의 전좌 도메인(서열 번호 54),

(d4) 막 수송 도메인,

(d5) 핵 국지화 도메인, 및

(d6) 미토콘드리아 타겟팅 도메인,

및 그의 조합.

도메인(d1) (d2) 및 (d3)의 조합은, 특히 (d1)/(d2), (d1)/(d3) 또는 (d1)/(d2)/(d3)의 조합을 포함할 수 있다.

도메인 (d1), (d2), (d3), (d4), 및 (d5)의 조합은 또한 특히, (d1)/(d2), (d1)/(d3), (d1)/(d4), (d1)/(d5) 및 (d1)/(d2)/(d3), (d3)/(d5), (d2)/(d5), (d1)/(d3)/(d5), (d2)/(d3)/(d6)의 조합을 포함할 수 있다.

더욱이, 도메인 (d1), (d2), (d3), (d4), 및 (d5)의 조합은 서로 나란히 위치하며 도메인 (b)의 한 끝에 연결된 도메인 및/또는 도메인 (b)의 상이한 끝에 연결된 도메인을 포함할 수 있다.

융합 단백질이 도메인 (b)에 부착된 수송 도메인(d) 및 도메인 (a) 및 (b) 사이의 절단 부위인 도메인 (c) 양자를 가질 때, 도메인 (c)는 구조물의 절단 후, 수송 도메인(d)가 도메인 (b)에 부착되어 있도록 하는 방식으로 위치한다는 것을 이해하여야 한다. 다시 말해서, 융합 단백질이 수송 도메인(d) 및 절단 부위 도메인 (c) 양자를 함유한다면, 도메인(d)는 도메인 (b) 와 도메인 (c) 사이에 위치하거나 또는 도메인(d)의 부착 위치의 맞은편인 도메인 (b)의 끝에 위치한다. 본 발명은 구조물의 절단 후 수송 도메인이 TRAIL 도메인에 부착되어 있는 경우, 도메인(d)가 도메인 (c) 및 도메인 (a) 사이에 위치하는 변이체를 포함하지 않는다.

수송 서열은 도메인 (b)의 N-말단 또는 C-말단에 부착될 수 있다. 몇몇 실시 양태에서, 수송하는 서열은 또한 도메인 (a) 및 (b)의 부착 방식에 따라 C-말단 부분 또는 N-말단 부분과 같은 전체 구조물의 말단 부분일 수 있다.

녹농균(Pseudomonas aeruginosa)의 전좌 도메인은 리소좀 막을 통해 세포질로 전좌할 수 있으며 종양 세포 구획(compartments)에 효과기 펩티드를 도입하는데 사용될 수 있다. 녹농균의 전좌 도메인 서열은 공지되어 있으며 하기로 표시된다:

PEGGSLA ALTAHQACHL PLETFTRHRQ PRGWEQLEQC GYPVQRLVAL YLAARLSWNQ

VDQVIANALA SPGSGGDLGE AIRESPEQAR LALTLAAAES ERFVRQGTGN

DEAGAANGPA D(서열 번호 54)

소포체로 향하는 서열(d1)은 이것으로 제한되는 것은 아니지만 예컨대 KDEL, HDEL, RDEL, DDEL, ADEL, SDEL, KEDL과 같은 당업계에 공지된 소포체로 향하는 임의의 신호 서열일 수 있다. 서열(d1)은 바람직하게는 서열 KDEL(서열 번호 55) 및 KEDL(서열 번호 56)로부터 선택된다.

바람직하게는, 향하는 서열(d1)은 본 발명의 융합 단백질의 C-말단에 위치하며 그의 C-말단 부분을 형성한다.

막 수송 도메인(d4)는 이것으로 제한되는 것은 아니지만 예컨대 KPRRPY 또는 K PRRPYR과 같은 당업계에 공지된 플라스마 막을 통해 수송하는 임의의 신호 서열일 수 있다.

핵 국지화 서열(d5)는 이것으로 제한되는 것은 아니지만 예컨대 EEEAAGRKRKKRT(서열 번호 168), FFFAAGRKRKKRT, NNNAAGRKRKKRT, YYYAAGRKRKKRT, AAKKK, 또는 GR KRKKRT와 같은 당업계에서 공지된 핵으로 향하는 임의의 신호 서열일 수 있다.

미토콘드리아 타겟팅 도메인(d6)은 이것으로 제한되는 것은 아니지만 예컨대 RVSFCRPGWSAMARSRLTATSVSQVQENGFVK(서열 번호 166), 인간 시토크롬 옥시다제 서브유닛 IV의 분절 MLATRVFSLVGKRAISTSVCVR(hCOXIV1), 또는 오르니틴 트랜스카르바밀라제 선도 펩티드와 같은 당업계에서 공지된 미토콘드리아로 향하는 임의의 신호 서열일 수 있다.

융합 단백질, 수송 도메인 및 절단 부위 도메인의 주요 기능 요소 이외에도, 본 발명의 융합 단백질은 도메인(e), 즉 이것으로 제한되는 것은 아니지만 예컨대, CAACAAAC 서열(서열 번호 177) 또는 CAAECAAAC　(서열 번호 178)과 같은 삼합체 안정화를 용이하게 하는 폴리시스테인 모티프를 함유할 수 있다.

더욱이, 폴리시스테인 도메인(e)는 도메인 (b)의 한 끝에 연결 및/또는 도메인 (b)의 상이한 끝에 연결될 수 있다.

융합 단백질이 도메인 (b)에 부착된 폴리시스테인 도메인(e) 및 도메인 (a) 및 (b) 사이의 절단 부위의 도메인 (c) 양자를 가질 때, 도메인 (c)는 구조물의 절단 후, 폴리시스테인 도메인(e)가 도메인 (a)에 부착되어 있도록 하는 방식으로 위치한다는 것을 이해하여야 한다. 다시 말해서, 융합 단백질이 폴리시스테인 도메인(e) 및 절단 부위 도메인 (c) 양자를 함유한다면, 도메인(e)는 도메인 (a) 와 도메인 (c) 사이에 위치하거나 또는 도메인(d)의 부착 위치의 맞은편 도메인 (a)의 끝에 위치한다. 본 발명은 구조물의 절단 후 폴리시스테인 도메인이 효과기 펩티드 도메인에 부착되어 있는, 도메인 (c) 및 도메인 (b) 사이에 도메인(e)가 위치할 수 있는 그러한 변이체는 포함하지 않는다.

융합 단백질, 수송 도메인 및 절단 부위 도메인(들)의 주요 기능 요소 외에도, 본 발명의 융합 단백질은 알라닌, 글리신, 글루타민, 시스테인, 히스티딘 및 세린 잔기를 포함하는 가요성 입체 링커(flexible steric linker)(스페이서)의 중성 서열/서열들을 함유할 수 있다. 이러한 링커/스페이서는 공지되어 있으며 문헌에 기술되어 있다. 융합 단백질의 서열로의 이들의 혼입은 숙주 세포에서 그의 과발현의 과정에 의해 생성된 단백질의 올바른 폴딩을 제공하고자 하는 것이다.

특히, 가요성 입체 링커는 GGSG(서열 번호 57), GGGS(서열 번호 58), GGGGS(서열 번호 59), GGSGG(서열 번호 60), GGGSGG(서열 번호 61), GGGSGGG(서열 번호 62), GGGSGGGS(서열 번호 63), GGGSGGGGS(서열 번호 64), ASGG(서열 번호 65), GGGSASGG(서열 번호 66) SGCGS(서열 번호 169), GGGGSGGGG(서열 번호 180),GGSHG(서열 번호 182), SGGCGGS(서열 번호 183) 및 AACAA(서열 번호 184)로 이루어진 군으로부터 선택될 수 있다.

한 실시 양태에서, 도메인 (a) 및 도메인 (b) 사이에 추가로 본 발명의 PEG 분자(PEG 링커)의 융합 단백질에 부착하기에 적당한 서열의 (f) 도메인이 있다.

이러한 링커는 서열 번호 170으로서 첨부된 서열 목록(Sequence Listing)에서 제작된 공지의 서열 AlaSerGlyCysGlyProGlu(한 글자 규정으로 ASGCGPE)일 수 있다. PEG 링커는 또한 첨부된 서열 목록에서 각각, 서열 번호 178, 서열 번호 177 및 서열 번호 179로 지정된 AlaAlaCysAlaAla(AACAA), SerGlyGlyCysGlyGlySer(SGGCGGS) i(SGCGS) 사이로부터 선택될 수 있다.

또 다른 실시 양태에서 도메인 (a) (b) (c) (d) (e) 및 (f)는 특히 글리신 및 글루타민으로 이루어진 군에서 선택된 아미노산 잔기로 형성된, 3까지의 아미노산 잔기에 의해 추가로 분리될 수 있다.

더욱이, 몇몇 실시 양태에서 융합 단백질은, 전체 구조물의 C-말단 부분으로서, 구조물로부터 그의 절단을 허용하는 서열, 유리하게는 프로테아제 절단 부위, 바람직하게는 트롬빈에 의해 인식되는 서열이 선행하는 서열 hTRAIL95-121과 같은 hTRAIL의 비-기능(non-functional) 분절을 함유할 수 있다. 이러한 hTRAIL의 작은 비-기능 분절의 혼입은 전체 구조물에 더 큰 친수성을 부여하며, 따라서 발현 과정중 단백질의 용해도를 개선한다. 정제 단계 후 hTRAIL95-121은 트롬빈에 의해 절단될 것이다. 이 경우, hTRAIL95-121은 약제학적 조성물의 제조에 사용된 융합 단백질에 존재하지 않을 것이다.

당업계에 공지된 트롬빈에 의해 인식된 임의의 서열, 특히 서열 LVPRGS (서열 번호 174)이 사용될 수 있다.

이러한 추가의 hTRAIL95-121 서열은 친유성 효과기 펩티드의 경우에, 및 도메인 (a)가 아미노산 114로 시작하고 전체 TRAIL 서열보다 높을 때 특히 유리하다.

본 발명의 융합 단백질의 특정 실시 양태는 하기로 표시되는 단백질로 이루어진 군으로부터 선택된, 세포 내 작용하는 세포사멸 유발 펩티드를 포함하는 융합 단백질이다:

서열 번호 1, 서열 번호 2, 서열 번호 3, 서열 번호 4, 서열 번호 5, 서열 번호 6, 서열 번호 7, 서열 번호 8, 서열 번호 9, 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 20, 서열 번호 21, 서열 번호 22, 서열 번호 23, 서열 번호 93, 서열 번호 94, 서열 번호 95, 서열 번호 96, 서열 번호 97, 서열 번호 98, 서열 번호 99, 서열 번호 100, 서열 번호 101, 서열 번호 102, 서열 번호 103, 서열 번호 104, 서열 번호 105, 서열 번호 106, 서열 번호 107, 서열 번호 108, 서열 번호 109, 서열 번호 110, 서열 번호 111, 서열 번호 112, 서열 번호 113, 서열 번호 114, 서열 번호 115, 서열 번호 116, 서열 번호 117, 서열 번호 118, 서열 번호 119, 서열 번호 120 및 서열 번호 121.

본 발명의 융합 단백질의 다른 특이적 실시 양태는 서열 번호 24, 서열 번호 25 및 서열 번호 26에 의해 표시된 단백질로 이루어진 군으로부터 선택된 세포외에서 작용하는 세포사멸 유발 펩티드를 포함하는 융합 단백질이다.

상술한 예시적인 융합 단백질 구조의 상세한 설명은 도 1 내지 5 및 9 내지 13 및 하기에 제시된 실시예이다.

본 발명에 따라, 융합 단백질에 의해, 2 이상의 단백질 또는 그의 분절을 함유하는 단일 단백질 분자는, 추가의 화학 링커 없이, 이들 각각의 펩티드 사슬 내에서 펩티드 결합을 통해 공유결합으로 연결된 것을 의미한다.

융합 단백질은 또한 대안적으로 단백질 구조물 또는 키메라 단백질로서 기술될 수 있다. 본 발명에 따라, 용어 "구조물" 또는 "키메라 단백질"은, 사용된다면, 상술한 바와 같이 융합 단백질을 언급하는 것으로 이해되어야 한다.

당업자에게 이와 같이 정의된 융합 단백질은 공지의 펩티드 및 단백질의 화학 합성 방법에 의해 합성될 수 있다는 것은 명백할 것이다.

융합 단백질은 화학 펩티드 합성 방법, 특히 캐리어로서 적당한 수지를 사용한 고체상에서의 펩티드 합성 기술을 사용하여 합성될 수 있다. 이러한 기술은 당업계에 통상적으로 공지된 것이며, 그 중에서도 특히 논문 예컨대 「보단스즈키(Bodanszky) 및 보단스즈키, 펩티드 합성의 실시(The Practice of Peptide Synthesis), 1984, Springer-Verlag, 뉴욕, Stewart 등., Solid Phase Peptide Synthesis, 2판, 1984, 피어스 케미컬 컴퍼니(Pierce Chemical Company)」에 기술되어 있다.

융합 단백질은 연속 단백질로서 펩티드의 화합 합성의 방법에 의해 합성될 수 있다. 대안적으로, 단백질의 개별 분절(도메인)은 별개로 합성하고 그 후 제2 펩티드의 카르복실 말단으로부터 한 펩티드 분절의 아미노 말단을 축합하여, 펩티드 결합을 통해 한 연속 펩티드에서 함께 조합할 수 있다. 이러한 기술은 통상적으로 공지된 것이다.

수득한 펩티드의 구조를 증명하기 위해, 펩티드의 분자량을 결정하는 고분해능 질량 분석법(high resolution mass spectrometry)과 같은 공지의 펩티드의 아미노산 조성을 분석하는 공지 방법이 사용될 수 있다. 펩티드 서열을 확인하기 위해, 순차적으로 펩티드를 분해하고 아미노산의 서열을 식별하는 단백질 서열 분석기도 또한 사용할 수 있다.

바람직하게는, 그러나, 본 발명의 융합 단백질은 숙주 세포 내의 융합 단백질을 코딩하는 폴리뉴클레오티드 서열의 유전자 발현 방법에 의해 생성된 재조합 단백질이다.

본 발명의 추가의 양상은 상술한 바와 같은 폴리뉴클레오티드 서열, 특히 융합 단백질을 코딩하는 DNA 서열이다.

바람직하게는, 상술한 바와 같이 융합 단백질을 코딩하는 본 발명에 따른 폴리뉴클레오티드 서열, 특히 DNA는 대장균(E. coli)에서의 발현에 최적화된 서열이다.

본 발명의 또 다른 양상은 또한 상술한 바와 같은 본 발명의 폴리뉴클레오티드 서열, 특히 DNA 서열을 함유하는 발현 벡터이다.

본 발명의 또 다른 양상은 상술한 바와 같은 발현 벡터를 포함하는 숙주 세포이다.

본 발명의 융합 단백질의 발현을 위한 바람직한 숙주 세포는 대장균 세포이다.

융합 단백질을 포함하는 재조합 단백질의 생성 방법은 공지되어 있다. 간단히, 이 기술은 폴리뉴클레오티드 분자의 생성, 예를 들어 표적 단백질의 아미노산 서열을 코딩하고 숙주에서 표적 단백질의 발현을 지시하는 DNA 분자를 생성하는 것으로 구성된다. 그후, 폴리뉴클레오티드 분자를 코딩하는 표적 단백질은 폴리펩티드의 효율적 발현을 보장하는 적절한 발현 벡터로 혼입된다. 재조합 발현 벡터는 그후 형질 감염(transfection)/형질 전환(transformation)을 위해 숙주 세포에 도입되고, 그 결과로서 형질 전환된 숙주 세포가 생성된다. 이것은 그후 형질 전환 세포의 배양에 의해 표적 단백질을 과발현시키고, 수득 된 단백질을 정제하며, 임의로 발현에 사용된 태그 서열을 절단하여 자르거나 또는 단백질을 정제한다.

발현 및 정제의 적당한 기술이 예를 들어 논문「Goeddel, Gene Expression Technology, Methods in Enzymology 185, Academic Press, San Diego, CA(1990), 및 A. Staron 등, Advances Mikrobiol., 2008, 47, 2, 1983-1995」에 기술되어 있다.

숙주 세포에서 DNA 서열의 도입 및 복제를 위한 발현 벡터로서 코스미드, 플라스미드 또는 변형된(modified) 바이러스가 사용될 수 있다. 전형적으로 플라스미드가 발현 벡터로서 사용된다. 적당한 플라스미드는 공지되어 있으며 상업적으로 입수 가능하다.

본 발명의 발현 벡터는 본 발명의 융합 단백질을 코딩하는 폴리뉴클레오티드 분자 및 적당한 숙주 세포에 혼입된 코딩 서열의 전사 및 번역을 위한 필수 조절 서열을 포함한다. 조절 서열의 선택은 숙주 세포의 타입에 의존되며 당업자에 의해 용이하게 수행될 수 있다. 이러한 조절 서열의 예는 전사 프로모터(promoter) 및 인핸서(enhancer) 또는 RNA 폴리머라제 결합 서열, 코딩 서열 전에 삽입된 전사 개시 신호를 함유하는 리보솜 결합 서열, 및 코딩 서열 후에 삽입된 전사 터미네이터 서열이다. 더욱이, 사용된 숙주 세포 및 벡터에 따라, 복제 개시점, 추가적인 DNA 제한 부위, 인핸서, 및 전사의 유도를 허용하는 서열과 같은 기타 서열이 발현 벡터에 도입될 수 있다.

발현 벡터는 형질전환된 세포에 명확한 표현형을 부여하고 형질전환된 세포의 특이적 선택을 할 수 있게 하는 마커 유전자(marker gene) 서열을 또한 포함한다. 더욱이, 벡터는 또한 삽입 없이 플라스미드를 취한 것으로부터 표적 단백질의 삽입된 코딩 서열을 함유하는 재조합 플라스미드로 형질전환된 세포를 구분하도록 허용하는 제2 마커 서열을 함유할 수 있다. 가장 종종, 전형적인 항생물질 내성 마커가 사용된다, 그러나 세포 내(생체 내)의 존재가 자기방사(autoradiography) 기술, 분광 광도법 또는 생체- 및 화학-루미네선스를 사용하여 용이하게 결정될 수 있는 당업계에 공지된 임의의 다른 리포터 유전자(reporter genes)도 사용될 수 있다. 예를 들어, 숙주 세포에 따라, β-갈락토시다아제, β-글룩쿠로니다제(β-gluckuronidase), 루시페라제, 클로람페니콜 아세틸트랜스퍼라제 또는 녹색 형광 단백질과 같은 리포터 유전자가 사용될 수 있다.

더욱이, 발현 벡터는 폴딩이 용이하게 되는 예컨대 페리플라스마(periplasma)인 적절한 세포 구획으로 단백질을 수송하는 신호 서열을 함유할 수 있다. 추가로 N-말단에 부착된 Histag 또는 C-말단에 부착된 GST와 같은 라벨/태그를 코딩하는 서열이 존재할 수 있으며, 이것은 니켈 컬럼 상에서 친화성 크로마토그래피를 통해, 친화성의 원리를 사용하여 생성된 단백질의 후속 정제를 용이하게한다. 추가로 숙주 세포 내에서 단백질 분해에 대하여 단백질을 보호하는 서열, 뿐만 아니라 그의 용해도를 향상시키는 서열도 또한 존재할 수 있다.

표적 단백질의 서열에 부착된 보조 요소는 그의 활성을 차단하거나, 또는 예를 들어 독성으로 인한 것과 같은 또 다른 이유 때문에 장해가 될 수 있다. 이러한 요소는 제거되어야 하는 데, 효소 또는 화학 절단에 의해 성취될 수 있다.

특히, 6-히스티딘 태그 HisTag 또는 친화성 크로마토그래피에 의해 단백질 정제를 허용하도록 부착된 이러한 타입의 다른 마커가 제거되어야 하는데 그 이유는 가용성 TRAIL 단백질의 간 독성에 대한 그의 기술된 효과 때문이다.

원핵 세포: 에스캐리키아 콜라이(Escherichia coli) 또는 바실러스 서브틸리스(Bacillus subtilis)와 같은 박테리아, 사카로마이세스 세르비시아에(Saccharomyces cervisiae) 또는 피치아 파스토리스(Pichia pastoris)와 같은 효모, 및 진핵생물 세포주(곤충, 포유류, 식물)를 포함하는 다양한 공지 숙주 세포를 기재로 하는 이형(heterologous) 발현 시스템이 사용될 수 있다.

바람직하게는, 배양 및 유전자 조작, 및 다량의 수득 생성물로 인해, 대장균(E. coli) 발현 시스템이 사용된다. 따라서, 본 발명의 융합 단백질을 코딩하는 표적 서열을 함유하는 폴리뉴클레오티드 서열이 대장균 내에서 발현을 위해 최적화될 것이다, 즉 당업계에 공지된 가능한 서열 변이체에서 선택된 대장균 내의 발현에 최적인 코돈을 코딩 서열 내에 함유할 것이다. 더욱이, 발현 벡터는 코딩 서열에 부착된 대장균에 적당한 상술한 요소를 함유할 것이다.

따라서, 본 발명의 바람직한 실시 양태에서 대장균 내의 발현을 위해 최적화된 본 발명의 융합 단백질을 코딩하는 서열을 포함하는 폴리뉴클레오티드 서열은 하기로 이루어진 폴리뉴클레오티드 서열의 군으로부터 선택된다:

서열 번호 67, 서열 번호 68, 서열 번호 69, 서열 번호 70, 서열 번호 71, 서열 번호 72, 서열 번호 73, 서열 번호 74, 서열 번호 75, 서열 번호 76, 서열 번호 77, 서열 번호 78, 서열 번호 79, 서열 번호 80, 서열 번호 81, 서열 번호 82, 서열 번호 83, 서열 번호 84, 서열 번호 85, 서열 번호 86, 서열 번호 87, 서열 번호 88), 서열 번호 89, 서열 번호 90, 서열 번호 91, 서열 번호 92, 서열 번호 122, 서열 번호 123, 서열 번호 124, 서열 번호 125, 서열 번호 126, 서열 번호 127, 서열 번호 128, 서열 번호 129, 서열 번호 130, 서열 번호 131, 서열 번호 132, 서열 번호 133, 서열 번호 134, 서열 번호 135, 서열 번호 136, 서열 번호 137, 서열 번호 138, 서열 번호 139, 서열 번호 140, 서열 번호 141, 서열 번호 142, 서열 번호 143), 서열 번호 144, 서열 번호 145, 서열 번호 146, 서열 번호 147; 서열 번호 148, 서열 번호 149, 및 서열 번호 150;

이것은 각각 하기의 아미노산 서열로 이루어진 군으로부터 선택된 아미노산 서열에 상응하는 아미노산 서열을 갖는 융합 단백질을 코딩한다:

서열 번호 1, 서열 번호 2, 서열 번호 3, 서열 번호 4, 서열 번호 5, 서열 번호 6, 서열 번호 7, 서열 번호 8, 서열 번호 9, 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 20, 서열 번호 21, 서열 번호 22), 서열 번호 23, 서열 번호 24, 서열 번호 25, 서열 번호 26, 서열 번호 93, 서열 번호 94, 서열 번호 95, 서열 번호 96, 서열 번호 97, 서열 번호 98, 서열 번호 99, 서열 번호 100, 서열 번호 101, 서열 번호 102, 서열 번호 103, 서열 번호 104, 서열 번호 105, 서열 번호 106, 서열 번호 107, 서열 번호 108, 서열 번호 109, 서열 번호 110, 서열 번호 111, 서열 번호 112, 서열 번호 113, 서열 번호 114, 서열 번호 115, 서열 번호 116, 서열 번호 117 및 서열 번호 118, 서열 번호 119, 서열 번호 120 및 서열 번호 121.

바람직한 실시 양태에서, 본 발명은 또한 상기 예시된 폴리뉴클레오티드 서열인 서열 번호 67 내지 서열 번호 92 및 서열 번호 122 내지 서열 번호 150의 군으로부터 선택된 폴리뉴클레오티드 서열을 포함하는 대장균의 형질 전환에 적당한 발현 벡터, 뿐만 아니라, 이러한 발현 벡터로 형질전환된 대장균 세포를 제공한다.

형질 전환, 즉 박테리아 숙주 세포, 특히 대장균으로의 DNA 서열의 도입은 예를 들어 저온(4℃)에서 칼슘 이온으로 처리하고, 그후 열 충격(37-42℃에서)을 수행하여 또는 전기천공법에 의해 DNA를 받아들일 수 있도록 제조된 컴피턴트(competent) 세포 상에서 일반적으로 수행된다. 이러한 기술은 공지되어 있으며 일반적으로 발현 시스템의 제조자에 의해 결정된다.

대장균 발현 시스템 내의 본 발명의 융합 단백질의 과발현의 절차가 하기에서 더 기술될 것이다.

본 발명은 또한 활성 성분으로서 상기 정의된 바의 본 발명의 융합 단백질 및 적당한 약제학적으로 허용가능한 담체, 희석제 및 통상의 보조 성분을 함유하는 약제학적 조성물을 제공한다.

약제학적 조성물은 담체 또는 희석제 내에 용해 또는 분산된 본 발명의 유효량의 융합 단백질 및 약제학적으로 허용 가능한 보조 성분을 함유할 것이며, 바람직하게는 단위 투약 형태로 제형화된 약제학적 조성물의 형태 또는 복수의 복용량을 함유하는 제제의 형태일 것이다.

약제학적 형태 및 그의 제형화 방법 뿐만 아니라 기타 성분, 담체 및 희석제는 당업자에게 공지되어 있으며 문헌에 기술되어 있다. 예를 들어, 이들은 논문「Remington's Pharmaceutical Sciences, ed.20, 2000, Mack Publishing Company, 이스턴, 미국」에 기술되어 있다.

용어 "약제학적으로 허용가능한 담체, 희석제, 및 보조 성분"은 당업계에 공지된 임의의 용매, 분산 매체, 계면활성제, 산화방지제, 안정화제, 방부제(예컨대 항세균제, 항진균제), 등장제를 포함한다. 본 발명의 약제학적 조성물은 선택된 투여 경로 및 원하는 투약 형태, 예컨대 액체, 고체 및 경구용 에어로졸 형태, 비경구, 흡입, 국소에 따라 다양한 타입의 담체, 희석제 및 부형제를 함유할 수 있으며, 이러한 선택된 형태는 주사(injection)와 같은 투여 경로를 위해 무균이어야 한다.

본 발명에 따른 약제학적 조성물의 바람직한 투여 경로는 정맥내, 근육내, 피하, 복강내, 종양내(intratumourous)와 같은 주사 경로, 또는 단일 또는 지속 정맥내 주입(infusion)을 포함하는 비경구이다.

한 실시 양태에서, 본 발명의 약제학적 조성물은 종양에 직접적으로 주사하여 투여될 수 있다. 또 다른 실시 양태에서, 본 발명의 약제학적 조성물은 정맥내 투여될 수 있다. 여전히 또 다른 실시 양태에서, 본 발명의 약제학적 조성물은 피하 또는 복강내로 투여될 수 있다.

비경구 투여를 위한 약제학적 조성물은, 필요하다면, 적절한 pH로 완충되고 체액으로 등삼투성(isoosmotic)인 약제학적으로 허용 가능한 수성 또는 비수성 매질 내에 용액 또는 분산액일 수 있으며, 또한 수용체의 조직 또는 혈액과 상용성이 있는 조성물을 만드는 산화 방지제, 완충액, 세균발육 저해제, 가용성 물질도 함유할 수 있다. 조성물에 포함될 수 있는 기타 성분은 예를 들어 물, 에탄올과 같은 알콜, 글리세롤, 프로필렌 글리콜, 액체 폴리에틸렌 글리콜과 같은 폴리올, 트리글리세리드와 같은 지질, 식물성 오일, 리포솜을 포함할 수 있다. 물질의 적당한 유동성 및 입자 크기는 레시틴과 같은 코팅 물질, 및 히드록시프로필셀룰로스 폴리소르베이트와 같은 계면활성제, 등에 의해 제공될 수 있다. 액체 비경구 조성물을 위한 적당한 등장제(isotoning agent)는 예를 들어 글루코스와 같은 당, 및 염화 나트륨 및 그의 조합이다.

대안적으로 주사 또는 주입 투여를 위한 약제학적 조성물은 예컨대 발열원 없는 무균수와 같은 적당한 담체 내에서 사용되기 전에 즉시 재구성을 위해 동결 건조된 분말과 같은 분말 형태일 수 있다.

비경구 투여를 위한 본 발명의 약제학적 조성물은 용액, 스프레이 또는 에어로졸을 포함하는 비내 투여의 형태도 또한 가질 수 있다. 바람직하게는 비내 투여를 위한 형태는 수용액일 것이며 코 분비물과 유사한 특성을 유지하도록 약 5.5 내지 약 6.5의 pH를 유지한 완충 또는 등장성이 될 것이다. 더욱이, 비강내 제제에서 공지된 바의 방부제 또는 안정화제를 함유할 것이다.

조성물은 하나 이상의 성분의 산화를 지연시키는 다양한 산화 방지제를 함유할 수 있다. 더욱이, 미생물의 작용을 방지하기 위해, 조성물은 이것으로 제한되는 것은 아니지만 예를 들어, 파라벤, 클로로-부탄올, 티메로살, 소르브산, 및 이러한 타입의 공지된 유사 물질을 포함하는 다양한 항세균 및 항진균제를 함유할 수 있다.

일반적으로, 본 발명의 약제학적 조성물은 예를 들어 적어도 약 0.01wt% 의 활성 성분을 포함할 수 있다. 특히 더, 조성물은 조성물 단위의 1중량% 내지 75중량%의 양으로, 또는 예를 들어 25중량% 내지 60중량%의 양으로 함유될 수 있으며, 지시된 값으로 제한되는 것은 아니다.

인간을 포함하는 환자에게 투여되는 본 발명에 따른 조성물의 실제 복용량은 체중, 상태의 심각성, 치료될 질환의 타입, 선행 또는 수반되는 치료학적 개입, 투여 환자 및 투여 경로와 같은 육체적 및 생리적 인자에 의해 결정될 것이다. 적당한 단위 복용량, 전체 복용량 및 조성물 내에서 활성 성분의 농도가 치료하는 의사에 의해 결정된다.

조성물은 예를 들어 약 1 마이크로그램/kg의 환자의 체중 내지 약 1000mg/kg의 환자의 체중의 복용량으로, 예컨대 5mg/kg의 체중 내지 100mg/kg의 체중 범위 또는 5mg/kg의 체중 내지 500mg/kg의 체중 범위로 투여될 수 있다.

융합 단백질 및 이를 함유하는 조성물은 항암 또는 항종양을 나타내며 암 질환의 치료를 위해 사용될 수 있다.

본 발명은 인간을 포함하는 포유류의 암 질환 치료를 위한 상기 정의된 바의 본 발명의 융합 단백질의 용도도 또한 제공한다.

본 발명은 이러한 치료가 필요한 대상에게 상기 정의된 바의 본 발명의 융합 단백질의 항암 유효량을, 임의로 적절한 약제학적 조성물의 형태로 투여하는 것을 포함하는 인간을 포함하는 포유류의 암 질환 치료 방법도 또한 제공한다.

본 발명의 융합 단백질은 백혈병, 육아종증(granulomatosis), 골수종(myeloma) 및 기타 혈액암과 같은 혈액암의 치료를 위해 사용될 수 있다. 융합 단백질은 또한 유방암, 비소세포성 폐암(non-small cell lung cancer)을 포함하는 폐암, 대장암, 췌장암, 난소암, 방광암, 전립선암, 신장암, 뇌종양(brain cancer), 등과 같은 고형 종양의 치료를 위해 또한 사용될 수 있다.

암의 치료에서 융합 단백질 투여의 적절한 경로는 투여 경로를 위한 적절한 형태 및 조성물의 주사 또는 주입의 형태로 본 발명의 융합 단백질을 투여하는 것으로 구성되는 특히 비경구 경로일 것이다.

본 발명은 하기의 특정 융합 단백질의 일반 절차 및 실시예에서 더 상세히 기술될 것이다.

융합 단백질의 과발현을 위한 일반적 절차

플라스미드의 제조

표적 융합 단백질의 아미노산 서열은 대장균(Escherichia coli) 내의 발현을 위해 최적화된 코돈을 포함하는, 그것을 코딩하는 DNA 서열을 생성하도록 하기 위해 템플레이트로서 사용되었다. 이러한 절차는 대장균(Escherichia coli) 내의 표적 단백질 합성의 추가 단계의 효율을 향상시키도록 허용한다. 수득한 뉴클레오티드 서열은 그 후 자동적으로 합성되었다. 추가로, 제한 효소 Ndel(선도 사슬의 5'-종결에서) 및 Xhol(선도 사슬의 3'-종결에서)의 절단 부위는 표적 단백질을 코딩하는 수득한 유전자에 첨가하였다. 이들은 벡터 pET28a(노바겐)로 유전자를 클로닝하기 위해 사용되었다. 이들은 또한 다른 벡터에 단백질을 코딩하는 유전자를 클로닝하기 위해 사용될 수 있다. 이러한 구조물로부터 발현된 표적 단백질은 트롬빈에 위해 인식된 부위에 의해 진행된 폴리히스티딘 태그(6 히스티딘)로 N-말단에 설치되며, 이것은 후속하여 친화성 크로마토그래피를 통해 정제를 위해 제공되었다. 수득한 구조물의 정확성은 효소 Ndel 및 Xhol을 사용하여 단리된 플라스미드의 제한 분석에 의해, 이어서 표적 단백질의 전체 리딩 프레임의 자동 서열화에 의해 우선적으로 확인되었다. 서열화를 위해 사용된 프라이머는 벡터 내에 존재하는 T7 프로모터(5'-TAATACGACTCACTATAGG-3') 및 T7 터미네이터(5'-GCTAGTTATTGCTCAGCGG-3')의 서열에 상보적이다.

수득한 플라스미드는 제조자의 추천에 따라 형질전환된 통상의 대장균 균주 내의 표적 융합 단백질의 과발현을 위해 사용되었다. 선택 배지(LB 한천, 카나마이신 50 ug/ml, 1% 글루코스) 상에서 수득된 콜로니는 카나마이신(50ug/ml) 및 1% 글루코스가 보충된 LB 액체 배지 내에서 밤새 배양하여 제조하기 위해 사용되었다. 진탕 배양기에서 약 15시간의 성장 후, 배양액은 적절한 배양액을 접종하기 위해 사용되었다.

융합 단백질의 과발현 및 정제 - 일반 절차 A

카나마이신(30ug/ml) 및 100uM 황산 아연이 있는 LB 배지를 밤새 배양액으로 접종하였다. 배양액은 600nm에서 광학 밀도(OD)가 0.60-0.80에 도달될 때까지 37℃에서 배양하였다. 그 후 IPTG는 0.25 -1mM 범위의 최종 농도까지 첨가하였다. 25℃에서 진탕(shaking) 하면서 배양 후(3.5-20h), 배양액은 25분간 6,000g에서 원심분리하였다.

박테리아 펠릿은 pH 7.4의 50mM KH₂PO₄, 0.5M NaCl, 10mM 이미다졸을 함유하는 완충액에서 재현탁 시켰다. 현탁액은 8분 동안 얼음 상에서 초음파(40% 진폭, 15-초 펄스, 10초 간격)처리하였다. 수득한 추출물은 20.000g, 4℃에서 40분 동안 원심분리하여 맑게 하였다. Ni-세파로오스(GE 헬스케어) 수지는 박테리아 세포 추출물의 제조용으로 사용된 완충액으로 평형하게 하여 전처리하였다. 수지는 그후 추출물의 원심 분리 후 상청액으로 4℃에서 밤새 배양하였다. 그후, 이것은 크로마토그래피 컬럼에 적재하고 pH 7.4의 50mM KH₂PO₄, 0.5M NaCl, 20mM 이미다졸 완충액 15 내지 50 부피로 세정하였다. 수득된 단백질은 pH 7.4의 0.5M NaCl이 있는 50mM KH₂PO₄ 완충액 내에서 이미다졸 구배(gradient)를 사용하여 컬럼으로부터 용리시켰다. 수득된 분획은 SDS-PAGE로 분석하였다. 적절한 분획은 혼합하고 50mM 트리스 완충액, pH 7.2, 150mM NaCl, 500mM L-아르기닌, 0.1mM ZnSO₄, 0.01% 트윈(Tween) 20에 대하여 4℃에서 밤새 투석하고 동시에 Histag는 트롬빈(1:50)으로 절단하였다. 절단 후, 트롬빈은 벤즈아미딘 세파로오스^TM 수지를 사용하여 표적 융합 단백질로부터 분리하였다. 생성물의 순도는 SDS-PAGE 전기영동에 의해 분석하였다(Maniatis 등, Molecular Cloning. 콜드 스프링 하버, 뉴욕, 1982).

융합 단백질의 과발현 및 정제 - 일반 절차 B

카나마이신(30ug/ml) 및 100uM 황산 아연이 있는 LB 배지를 밤새 배양액으로 접종하였다. 배양액은 600nm에서 광학 밀도(OD)가 0.60-0.80에 도달될 때까지 37℃에서 배양하였다. 그후 IPTG는 0.5 -1mM 범위의 최종 농도까지 첨가하였다. 25℃에서 진탕 하면서 20 시간 인큐베이션 후, 배양액은 25분 동안 6,000g에서 원심분리하였다.

과발현 후 박테리아 세포는 pH 7.8의 50mM KH₂PO₄, 0.5M NaCl, 10mM 이미다졸, 5mM 베타-메르캅토에탄올, 0.5mM PMSF(페닐메틸술포닐 플루오라이드)를 함유하는 완충액 내에서 프렌치 프레스(French Press)로 분열시켰다. 수득한 추출물은 8.000g에서 50분 동안 원심분리하여 맑게 하였다. Ni-세파로오스 수지는 수득된 상청액으로 밤새 배양하였다. 그후 결합 단백질이 있는 수지는 크로마토그래피 컬럼에 가득 넣었다. 비결합 단백질을 함유하는 분획을 세정-제거하기 위해, 컬럼은 15 내지 50 부피의 완충액 50mM KH₂PO₄, 0.5M NaCl, 10mM 이미다졸, 5mM 베타-메르캅토에탄올, 0.5mM PMSF(페닐메틸술포닐 플루오라이드), pH7.8로 세정하였다. 그후, 베드와 특이적으로 결합하는 대부분의 단백질을 세정-제거하기 위해, 컬럼은 50mM KH₂PO₄, 0.5M NaCl, 500mM 이미다졸, 10% 글리세롤, 0,5mM PMSF를 함유하는 완충액, pH 7.5로 세정하였다. 수득된 분획은 SDS-PAGE로 분석하였다(Maniatis 등, Molecular Cloning. 콜드 스프링 하버, 뉴욕, 1982). 표적 단백질을 함유하는 분획을 합하고 트롬빈으로 절단하여(1U/4mg의 단백질, 16℃에서 8시간) 폴리히스티딘 태그를 제거하였다. 그후, 분획은 완충액 제제(500mM L-아르기닌, 50mM 트리스, 2,5mM ZnSO₄, pH 7.4)에 대하여 투석되었다.

2-D 전기영동을 사용한 융합 단백질의 특징 부여

수득된 단백질을 더 특징짓고 크로마토그래피 조건을 정확하게 선택하기 위하여, 단백질의 등전점(isoelectric points)을 결정하였다. 이러한 목적을 위하여, 하기 스케쥴에 따라 2단계로 2차원 전기영동(2-D)방법을 사용하였다.

단계 1. pH 구배 및 변성 조건에서 단백질의 등전점포커싱(isoelectrofocusing).

1-2mg/ml의 농도에서 단백질 조제를 아세톤 내에서 10% 트리클로로-아세트산 및 0.07% 베타-메르캅토에탄올을 함유하는 침전 용액과 1:1비로 혼합하여 침전시켰다. 혼합물은 -20℃에서 30분 동안 배양하고 그후 15,000g 및 4℃에서 25분 동안 원심분리하였다. 상청액은 제거하고 펠릿은 0.07% 베타-메르캅토에탄올과 함께 차가운 아세톤으로 2회 세정하였다. 그후, 아세톤 잔기는 탐지 가능한 냄새가 검출되지 않을 때까지 증발시켰다. 단백질 펠릿은 후속하여 사용된 스트립에 따라, pH 3-11 또는 6-11의 프로파일로 250ml의 재수화(rehydration) 완충액 8M 우레아, 1% CHAPS, 15mM DTT, 0.5% 양쪽성 전해질(GE 헬스케어) 내에서 현탁 시켰다. 단백질 용액은 등전점포커싱을 위해 세라믹 챔버에 놓고, 이어서 적절한 pH 프로파일(3-11 또는 6-11)로 13cm 드라이스트립(DryStrip)(GE 헬스케어)하였다. 전체를 미네랄 오일 층으로 덮었다. 챔버를 Ettan IPGphor III 장치에 놓고, 여기에서 등전점포커싱은 스트립의 면적 및 pH 프로파일에 할당된 하기 프로그램에 따라 수행하였다:

20℃에서 16시간 탈수

고정된 pH 구배에서 전기장 내의 포커싱

그 후, 포커싱된 단백질을 함유하는 스트립은 탈이온수 내에서 1분간 세정하고, 쿠마시 브릴리언트(Coomassie Brilliant)로 염색하고 그후 탈색하며 단백질의 위치를 표시하기 위해 상으로 보관하였다. 변색된 스트립은 하기 조성의 완충액으로 2 x 15분 평형을 유지하였다: 50mM 트리스-HCl pH 8.8, 6M 우레아, 1% DTT, 2% SDS, 30% 글리세롤.

단계 2. SDS-PAGE에 의한 제2 방향에서의 분리.

스트립은 표준 크기에 대하여 단일 웰(single well)을 함유하는 12.5% 폴리아크릴아미드 겔 상에 놓고 그후 3시간 동안 200V의 전압에서 SDS-PAGE를 위한 장치로 분리를 수행하였다. 겔은 쿠마시 브릴리언트로 염색하고 그 후 적용 스케일로 보관하였다. 단백질은 크기의 표준을 기준으로 그의 중량을 측정하여 확인하였고, 그의 IPI는 제조자(GE 헬스케어)에 의해 제공된 곡선(애노드로 표시된 끝으로부터 스트립 길이의 %에 대한 pH의 비)을 기준으로 하여 6-11의 스케일로 판독되거나 또는 등전점포커싱 캘리브레이션 키트(GE 헬스케어)의 수단에 의해 실험으로 측정된 곡선을 기준으로 3-11의 스케일로 판독되었다 .

본 발명의 융합 단백질의 예시적인 실시예가 하기에 기술된다.

실시예 1. 서열 번호 1의 융합 단백질

서열 번호 1의 단백질은 TRAIL121-281 서열의 N-말단에서 Bax 단백질(서열 번호 30)의 BH3 도메인으로부터 유도된 16-아미노산 펩티드가 효과기 펩티드로서 부착된, 194 아미노산의 길이 및 22.7 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 16-아미노산 서열의 C-말단에 7Arg/R 잔기의 폴리아르기닌 서열이 부착된다. 폴리아르기닌 서열은 세포막의 침투 및 세포로의 융합 단백질의 수송을 돕는다. 폴리아르기닌 서열 및 TRAIL 도메인 사이에 유로키나제 uPA(서열 번호 52) 및 메탈로프로테아제 MMP(서열 번호 51)에 의해 인식되는 서열들이 서로 나란히 연속적으로 혼입되어 있으며, 이로 인해 융합 단백질의 내재화 시 효과기 펩티드가 종양 환경에서 절단될 것이다.

융합 단백질의 구조는 도 1에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 1 및 서열 번호 67로 하기에 나타낸다.

아미노산 서열: 서열 번호 1

1 KKLSECLKRI GDELDSRRRR RRRRVVRPLG LAGRVAAHIT GTRGRSNTLS

51 SPNSKNEKAL GRKINSWESS RSGHSFLSNL HLRNGELVIH EKGFYYIYSQ

101 TYFRFQEEIK ENTKNDKQMV QYIYKYTSYP DPILLMKSAR NSCWSKDAEY

151 GLYSIYQGGI FELKENDRIF VSVTNEHLID MDHEASFFGA FLVG

DNA 서열: 서열 번호 67

1 GCCCACCAGA AATGCACCAA AAAAGCTGGC TTCATGATCC ATATCAATCA GATGTTCATT GGTCACGCTC ACAAAAATGC GATCATTTTC TTTCAGTTCA

101 AAAATGCCAC CCTGATAAAT GCTATACAGG CCATATTCTG CATCTTTGCT CCAACAGCTA TTACGTGCGC TTTTCATCAG CAGAATCGGA TCCGGATAGC

201 TGGTATATTT ATAAATGTAC TGCACCATTT GTTTATCATT TTTGGTATTT TCTTTAATTT CTTCCTGAAA GCGAAAATAG GTCTGGCTAT AAATATAATA

301 AAAGCCTTTT TCATGAATCA CCAGTTCACC ATTACGCAGA TGCAGATTGC TCAGAAAGCT ATGACCGCTA CGGCTGCTTT CCCAGCTATT AATTTTGCGA

401 CCCAGGGCTT TTTCATTTTT GCTATTCGGG CTGCTCAGGG TATTGCTACG ACCACGGGTG CCGGTAATAT GTGCTGCAAC ACGACCTGCC AGACCCAGCG

501 GACGAACAAC ACGACGACGG CGACGACGAC GACGGCTATC CAGTTCATCA CCAATACGTT TCAGGCATTC GCTCAGTTTT TT

상술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 양자가 노바겐(Novagen)으로부터 입수한 대장균 균주 BL21(DE3) 및 튜너(Tuner)(DE3) pLysS를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.

실시예 2. 서열 번호 2의 융합 단백질

서열 번호 2의 융합 단백질은 121-281TRAIL 서열의 N-말단에서 Bid 단백질(서열 번호 31)로부터 유도된 16-아미노산 펩티드가 효과기 펩티드로서 부착된, 193 아미노산의 길이 및 22.5kDa의 질량을 갖는 단백질이다. 추가로, 효과기 단백질의 C-말단에 7 Arg 잔기로 이루어진 폴리아르기닌 서열이 부착된다. 폴리아르기닌 서열은 세포막의 침투 및 세포로의 융합 단백질의 수송을 돕는다. 폴리아르기닌 서열 및 TRAIL 사이에 메탈로프로테아제 MMP(서열 번호 51) 및 유로키나제 uPA(서열 번호 52)에 의해 인식되는 서열들이 서로 나란히 연속적으로 혼입되어 있으며, 이로 인해 융합 단백질의 내재화 시 효과기 펩티드가 종양 환경에서 절단될 것이다.

융합 단백질의 구조는 도 1에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 2 및 서열 번호 68로 하기에 나타낸다.

아미노산 서열: 서열 번호 2

1 RNIARHLAQV GDSMDRRRRR RRRVVRPLGL AGRVAAHITG TRGRSNTLSS

51 PNSKNEKALG RKINSWESSR SGHSFLSNLH LRNGELVIHE KGFYYIYSQT

101 YFRFQEEIKE NTKNDKQMVQ YIYKYTSYPD PILLMKSARN SCWSKDAEYG

151 LYSIYQGGIF ELKENDRIFV SVTNEHLIDM DHEASFFGAF LVG

DNA 서열: 서열 번호 68

1 CGTAATATTG CACGTCATCT GGCACAGGTT GGTGATAGCA TGGACCGTCG TCGTCGTCGC CGTCGTCGTG TTGTTCGTCC GCTGGGTCTG GCAGGTCGTG

101 TTGCAGCACA TATTACCGGC ACCCGTGGTC GTAGCAATAC CCTGAGCAGC CCGAATAGCA AAAATGAAAA AGCCCTGGGT CGCAAAATTA ATAGCTGGGA

201 AAGCAGCCGT AGCGGTCATA GCTTTCTGAG CAATCTGCAT CTGCGTAATG GTGAACTGGT GATTCATGAA AAAGGCTTTT ATTATATTTA TAGCCAGACC

301 TATTTTCGCT TTCAGGAAGA AATTAAAGAA AATACCAAAA ATGATAAACA AATGGTGCAG TACATTTATA AATATACCAG CTATCCGGAT CCGATTCTGC

401 TGATGAAAAG CGCACGTAAT AGCTGTTGGA GCAAAGATGC AGAATATGGC CTGTATAGCA TTTATCAGGG TGGCATTTTT GAACTGAAAG AAAATGATCG

501 CATTTTTGTG AGCGTGACCA ATGAACATCT GATTGATATG GATCATGAAG CCAGCTTTTT TGGTGCATTT CTGGTGGGC

상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21(DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.

실시예 3. 서열 번호 3의 융합 단백질

서열 번호 3의 융합 단백질은 121-281TRAIL 서열의 C-말단에서 리보뉴클레아제 RNase A(서열 번호 32)의 동족체가 효과기 펩티드로서 부착된, 303 아미노산의 길이 및 34.2kDa의 질량을 갖는 단백질이다. 폴리아르기닌 서열 및 TRAIL의 서열 사이에 메탈로프로테아제 MMP(서열 번호 51) 및 유로키나제 uPA(서열 번호 52)에 의해 인식되는 서열들이 순차적으로 서로 나란히 혼입되어 있으며, 이로 인해 융합 단백질의 내재화 시 효과기 펩티드가 종양 환경에서 절단될 것이다.

단백질은 또한 TRAIL 도메인 서열 및 절단 부위의 서열 사이에, 가요성 글리신-세린 링커 GGSG(서열 번호 57)를 함유한다. 더욱이, 효과기 펩티드의 C-말단에서, 단백질은 전체 구조물의 C-말단 부분이기도 한, 소포체로 향하는 서열 KEDL(서열 번호 56)를 함유한다.

융합 단백질의 구조는 도 1에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 3 및 서열 번호 69로 하기에 나타낸다.

아미노산 서열: 서열 번호 3

1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR

51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI

101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH

151 EASFFGAFLV GGGSGPLGLA GRVVRKETAA AKFERQHMDS STSAASSSNY

201 CNQMMKSRNL TKDRCKPVNT FVHESLADVQ AVCSQKNVAC KNGQTNCYQS

251 YSTMSITDCR ETGSSKYPNC AYKTTQANKH IIVACEGNPY VPVHFDASVK

301 EDL

DNA 서열: 서열 번호 69

1 CGTGTTGCAG CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCCCT GGGTCGCAAA ATTAATAGCT

101 GGGAAAGCAG CCGTAGCGGT CATAGCTTTC TGAGCAATCT GCATCTGCGT AATGGTGAAC TGGTGATTCA TGAAAAAGGC TTTTATTATA TTTATAGCCA

201 GACCTATTTT CGCTTTCAGG AAGAAATTAA AGAAAATACC AAAAATGACA AACAAATGGT GCAGTATATC TACAAATACA CCAGCTATCC GGATCCGATT

301 CTGCTGATGA AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCAGAATA TGGCCTGTAT AGCATTTATC AGGGTGGCAT TTTTGAACTG AAAGAAAATG

401 ATCGCATTTT TGTGAGCGTG ACCAATGAAC ATCTGATTGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTT GGTGGTGGTA GCGGTCCGCT

501 GGGTCTGGCA GGTCGTGTTG TTCGTAAAGA AACCGCAGCA GCCAAATTTG AACGTCAGCA CATGGATAGC AGCACCAGCG CAGCAAGCAG CAGCAATTAT

601 TGCAATCAGA TGATGAAAAG CCGCAATCTG ACCAAAGATC GTTGTAAACC GGTGAATACC TTTGTTCATG AAAGCCTGGC AGATGTTCAG GCAGTTTGCA

701 GCCAGAAAAA TGTGGCCTGT AAAAATGGTC AGACCAATTG CTATCAGAGC TATAGCACCA TGAGCATTAC CGATTGTCGT GAAACCGGTA GCAGCAAATA

801 TCCGAATTGC GCCTATAAAA CCACCCAGGC CAATAAACAT ATTATTGTGG CCTGTGAAGG CAATCCGTAT GTTCCGGTTC ATTTTGATGC CAGCGTGAAA

901 GAAGATCTG

상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21(DE3)를 사용하여 일반 절차 B에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.

실시예 4. 서열 번호 4의 융합 단백질

서열 번호 4의 단백질은 TRAIL121-281 서열의 C-말단에서 리보뉴클레아제 RNase A(서열 번호 32)의 동족체가 효과기 펩티드로서 부착된, 293 아미노산의 길이 및 33.2kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드 및 TRAIL의 서열 사이에, 가요성 글리신-세린 링커 GGGSGGGS(서열 번호 63)이 있다.

융합 단백질의 구조는 도 1에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 4 및 서열 번호 70으로 하기에 나타낸다.

아미노산 서열: 서열 번호 4

1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR

51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI

101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH

151 EASFFGAFLV GGGGSGGGSK ETAAAKFERQ HMDSSTSAAS SSNYCNQMMK

201 SRNLTKDRCK PVNTFVHESL ADVQAVCSQK NVACKNGQTN CYQSYSTMSI

251 TDCRETGSSK YPNCAYKTTQ ANKHIIVACE GNPYVPVHFD ASV

DNA 서열: 서열 번호 70

1 CGTGTTGCAG CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCACT GGGTCGCAAA ATTAATAGCT

201 GACCTATTTT CGCTTTCAAG AAGAAATTAA AGAAAATACC AAAAATGATA AGCAGATGGT GCAGTATATC TATAAATATA CCAGCTATCC GGATCCGATT

301 CTGCTGATGA AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCAGAATA TGGTCTGTAT AGCATTTATC AGGGTGGCAT TTTTGAACTG AAAGAAAATG

401 ATCGCATTTT TGTGAGCGTG ACCAATGAAC ATCTGATTGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTT GGTGGTGGTG GTAGCGGTGG

501 TGGTAGTAAA GAAACCGCAG CAGCAAAATT TGAACGTCAG CACATGGATA GCAGCACCAG CGCAGCAAGC AGCAGCAATT ATTGTAATCA GATGATGAAA

601 AGCCGCAATC TGACCAAAGA TCGTTGTAAA CCGGTGAATA CCTTTGTTCA TGAAAGCCTG GCAGATGTTC AGGCAGTTTG TAGCCAGAAA AATGTTGCCT

701 GTAAAAATGG TCAGACCAAT TGCTATCAGA GCTATAGCAC CATGAGCATT ACCGATTGTC GTGAAACCGG TAGCAGCAAA TATCCGAATT GTGCATATAA

801 AACCACCCAG GCCAATAAAC ATATTATTGT TGCCTGTGAA GGCAATCCGT ATGTTCCGGT TCATTTTGAT GCAAGCGTT

상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 스트라테이진(Stratagene)으로부터 입수한 대장균 균주 BL21DE3pLysSRIL 및 노바겐으로부터 입수한 튜너(DE3)를 사용하여 일반 절차 B에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.

실시예 5. 서열 번호 5의 융합 단백질

서열 번호 5의 단백질은 121-281TRAIL 서열의 C-말단에서 시토크롬 C의 서열(서열 번호 33)이 효과기 펩티드로서 부착된, 283 아미노산의 길이 및 31kDa의 질량을 갖는 융합 단백질이다. TRAIL 도메인 및 효과기 단백질의 서열 사이에 메탈로프로테아제 MMP(서열 번호 51) 및 유로키나제 uPA(서열 번호 52)에 의해 인식되는 서열들이 순차적으로 서로 나란히 혼입되어 있으며, 이로 인해 융합 단백질의 내재화 시 효과기 펩티드가 종양 환경에서 절단될 것이다. 단백질은 또한 TRAIL 도메인 서열 및 절단 부위의 서열 사이에, 가요성 글리신-세린 링커 GGSG(서열 번호 57)를 함유한다. 더욱이, 효과기 펩티드의 C-말단에서, 단백질은 전체 구조물의 C-말단 부분인, 소포체로 향하는 서열 KEDL(서열 번호 56)를 함유한다.

융합 단백질의 구조는 도 1에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 5 및 서열 번호 71로 하기에 나타낸다.

아미노산 서열: 서열 번호 5

1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR

51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI

101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH

151 EASFFGAFLV GGGSGPLGLA GRVVRGDVEK GKKIFIMKCS QCHTVEKGGK

201 HKTGPNLHGL FGRKTGQAPG YSYTAANKNK GIIWGEDTLM EYLENPKKYI

251 PGTKMIFVGI KKKEERADLI AYLKKATNEK EDL

DNA 서열: 서열 번호 71

1 CAGATCTTCT TTTTCATTGG TGGCTTTTTT CAGATAGGCA ATCAGATCTG CGCGTTCTTC TTTTTTTTTA ATGCCCACAA AAATCATTTT CGTACCCGGA

101 ATATATTTTT TCGGATTTTC CAGATATTCC ATCAGGGTAT CTTCACCCCA AATAATGCCT TTGTTTTTAT TGGCTGCGGT ATAGCTATAA CCCGGTGCCT

201 GACCGGTTTT ACGACCAAAC AGACCATGCA GATTCGGACC GGTTTTATGT TTGCCACCTT TTTCAACGGT ATGACACTGG CTGCATTTCA TAATAAAAAT

301 TTTTTTGCCT TTTTCCACAT CACCACGAAC AACACGACCT GCCAGACCCA GCGGACCGCT ACCACCACCA ACCAGAAATG CACCAAAAAA GCTGGCTTCA

401 TGATCCATAT CAATCAGATG TTCATTGGTC ACGCTCACAA AAATGCGATC ATTTTCTTTC AGTTCAAAAA TGCCACCCTG ATAAATGCTA TACAGGCCAT

501 ATTCTGCATC TTTGCTCCAA CAGCTATTAC GTGCGCTTTT CATCAGCAGA ATCGGATCCG GATAGCTGGT ATATTTATAA ATGTACTGCA CCATTTGTTT

601 ATCGTTTTTG GTATTTTCTT TAATTTCTTC CTGAAAGCGA AAATAGGTCT GGCTATAAAT ATAATAAAAG CCTTTTTCAT GAATCACCAG TTCACCATTA

701 CGCAGATGCA GATTGCTCAG AAAGCTATGA CCGCTACGGC TGCTTTCCCA GCTATTAATT TTGCGACCCA GGGCTTTTTC ATTTTTGCTA TTCGGGCTGC

801 TCAGGGTATT GCTACGACCA CGGGTGCCGG TAATATGTGC TGCAACACGC AT

상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 튜너(DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.

실시예 6. 서열 번호 6의 융합 단백질

서열 번호 6의 단백질은 121-281TRAIL 서열의 C-말단에서 시토크롬 C의 서열(서열 번호 33)이 효과기 펩티드로서 부착된, 407 아미노산의 길이 및 45.2kDa의 질량을 갖는 융합 단백질이다. TRAIL 도메인의 서열 및 효과기 펩티드 사이에 퓨린(서열 번호 53) 및 녹농균(Pseudomonas aeruginosa)으로부터의 전좌 도메인(서열 번호 54)에 의해 인식되는 서열이 있다. 단백질은 또한 가요성 링커를 함유한다: 퓨린에 의해 인식된 TRAIL의 서열 및 절단 부위의 서열 사이에 가요성 글리신-세린 링커 GGGS(서열 번호 58)가 있으며, 퓨린 및 녹농균(Pseudomonas aeruginosa)으로부터의 전좌 도메인에 의해 인식된 절단 부위의 서열 사이에 가요성 글리신-세린 링커 ASGG(서열 번호 65)가 있으며, 전좌 도메인의 서열 및 시토크롬 C의 서열 사이에 가요성 글리신-세린 링커 GGGSGGG(서열 번호 62)가 있다.

더욱이, 효과기 펩티드 도메인의 C-말단에서, 단백질은 전체 구조물의 C-말단 부분인, 소포체로 향하는 서열 KEDL(서열 번호 56)를 함유한다.

융합 단백질의 구조는 도 2에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 6 및 서열 번호 72로 하기에 나타낸다.

아미노산 서열: 서열 번호 6

1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR

51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI

101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH

151 EASFFGAFLV GGGGSRKKRA SGGPEGGSLA ALTAHQACHL PLETFTRHRQ

201 PRGWEQLEQC GYPVQRLVAL YLAARLSWNQ VDQVIANALA SPGSGGDLGE

251 AIRESPEQAR LALTLAAAES ERFVRQGTGN DEAGAANGPA DGGGSGGGMG

301 DVEKGKKIFI MKCSQCHTVE KGGKHKTGPN LHGLFGRKTG QAPGYSYTAA

351 NKNKGIIWGE DTLMEYLENP KKYIPGTKMI FVGIKKKEER ADLIAYLKKA

401 TNEKDEL

DNA 서열: 서열 번호 72

201 GACCTATTTT CGCTTTCAAG AAGAAATTAA AGAAAATACC AAAAATGACA AACAAATGGT GCAGTATATC TATAAATATA CCAGCTATCC GGATCCGATT

401 ATCGCATTTT TGTGAGCGTG ACCAATGAAC ATCTGATTGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTT GGTGGTGGTG GTAGCCGTAA

501 AAAACGTGCA AGCGGTGGTC CGGAAGGTGG TAGCCTGGCA GCACTGACCG CACATCAGGC ATGTCATCTG CCGCTGGAAA CCTTTACCCG TCATCGTCAG

601 CCTCGTGGTT GGGAACAGCT GGAACAGTGT GGTTATCCGG TTCAGCGTCT GGTTGCACTG TATCTGGCAG CACGTCTGAG CTGGAATCAG GTTGATCAGG

701 TTATTGCAAA TGCACTGGCA AGTCCGGGTA GCGGTGGTGA TCTGGGTGAA GCAATTCGTG AAAGTCCGGA ACAGGCACGT CTGGCACTGA CCCTGGCAGC

실시예 7. 서열 번호 7의 융합 단백질

서열 번호 7의 단백질은 TRAIL114-281 서열의 N-말단에서 그랜자임 B의 서열(서열 번호 34)이 효과기 펩티드로서 부착된, 409 아미노산의 길이 및 46.1kDa의 질량을 갖는 융합 단백질이다. TRAIL 도메인의 서열 및 효과기 펩티드 그랜자임 B의 서열 사이에 부가적으로 가요성 글리신-세린 링커 GGGGS(서열 번호 59)에 의해 측면에 위치한, 퓨린 절단 부위(서열 번호 53)가 있다.

융합 단백질의 구조는 도 2에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 7 및 서열 번호 73으로 하기에 나타낸다.

아미노산 서열: 서열 번호 7

1 IIGGHVAKPH SRPYMAYLMI WDQKSLKRCG GFLIRDDFVL TAAHCWGSSI

51 NVTLGAHNIK EQEPTQQFIP VKRAIPHPAY NPKNFSNDIM LLQLERKAKR

101 TRAVQPLRLP SNKAQVKPGQ TCSVAGWGQT APLGKHSHTL QEVKMTVQED

151 RKCESDLRHY YDSTIELCVG DPEIKKTSFK GDSGGPLVCN KVAQGIVSYG

201 RNNGMPPRAC TKVSSFVHWI KKTMKRYGGG GSRKKRGGGG SVRERGPQRV

251 AAHITGTRGR SNTLSSPNSK NEKALGRKIN SWESSRSGHS FLSNLHLRNG

301 ELVIHEKGFY YIYSQTYFRF QEEIKENTKN DKQMVQYIYK YTSYPDPILL

351 MKSARNSCWS KDAEYGLYSI YQGGIFELKE NDRIFVSVTN EHLIDMDHEA

401 SFFGAFLVG

DNA 서열: 서열 번호 73

1 CGTGTTGCAG CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCCCT GGGTCGTAAA ATTAATAGCT

101 GGGAAAGCAG CCGTAGCGGT CATAGCTTTC TGAGCAATCT GCATCTGCGT AATGGCGAAC TGGTGATTCA TGAAAAAGGC TTTTATTATA TTTATAGCCA

201 GACCTATTTT CGCTTTCAGG AAGAAATTAA AGAAAATACC AAAAATGATA AACAAATGGT GCAGTATATC TATAAATATA CCAGCTATCC GGATCCGATT

301 CTGCTGATGA AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCCGAATA TGGTCTGTAT AGCATTTATC AGGGTGGCAT TTTTGAACTG AAAGAAAATG

501 AAAACGTGGT GGTGGCGGTT CTATTATTGG TGGTCATGTT GCAAAACCGC ATAGCCGTCC GTATATGGCA TATCTGATGA TTTGGGATCA GAAAAGCCTG

601 AAACGTTGTG GTGGCTTTCT GATTCGTGAT GATTTTGTTC TGACCGCAGC ACATTGTTGG GGTAGCAGCA TTAATGTTAC CCTGGGTGCC CATAATATTA

701 AAGAACAGGA ACCGACCCAG CAGTTTATTC CGGTTAAACG TGCAATTCCG CATCCGGCAT ATAATCCGAA AAATTTTAGC AATGATATCA TGCTGCTGCA

801 GCTGGAACGT AAAGCAAAAC GTACCCGTGC AGTTCAGCCG CTGCGTCTGC CGAGCAATAA AGCACAGGTT AAACCGGGTC AGACCTGTAG CGTTGCAGGT

901 TGGGGTCAGA CCGCACCGCT GGGTAAACAT TCTCATACCC TGCAAGAGGT TAAAATGACC GTCCAAGAGG ATCGTAAATG CGAAAGCGAT CTGCGCCATT

1001 ATTATGATAG CACCATTGAA CTGTGTGTGG GCGATCCGGA AATCAAAAAA ACCAGCTTTA AAGGTGATAG CGGTGGTCCG CTGGTTTGTA ATAAAGTTGC

1101 CCAGGGTATT GTTAGCTATG GTCGTAATAA TGGTATGCCG CCGCGTGCAT GTACCAAAGT TAGCAGCTTT GTGCATTGGA TTAAAAAAAC GATGAAACGC

1201 TATAAAGATG AACTG

실시예 8. 서열 번호 8의 융합 단백질

서열 번호 8의 단백질은 TRAIL121-281 서열의 C-말단에서 그랜자임 B(서열 번호 34)의 서열이 효과기 펩티드로서 부착된, 405 아미노산의 길이 및 45.7kDa의 질량을 갖는 융합 단백질이다. TRAIL의 서열 및 효과기 펩티드의 서열 사이에 추가로 각각의 가요성 글리신-세린 링커 GGGS(서열 번호 58) 및 GGGGS(서열 번호 59)로 그랜자임 B 및 TRAIL 양자의 서열로부터 분리된 퓨린 절단 부위의 서열(서열 번호 53)이 있다. 더욱이, 효과기 펩티드의 C-말단에서, 단백질은 전체 구조물의 C-말단 부분인, 소포체로 향하는 서열 KDEL을 함유한다.

융합 단백질의 구조는 도 2에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 8 및 서열 번호 74로 하기에 나타낸다.

아미노산 서열: 서열 번호 8

1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR

51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI

101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH

151 EASFFGAFLV GGGGSRKKRG GGGSIIGGHV AKPHSRPYMA YLMIWDQKSL

201 KRCGGFLIRD DFVLTAAHCW GSSINVTLGA HNIKEQEPTQ QFIPVKRAIP

251 HPAYNPKNFS NDIMLLQLER KAKRTRAVQP LRLPSNKAQV KPGQTCSVAG

301 WGQTAPLGKH SHTLQEVKMT VQEDRKCESD LRHYYDSTIE LCVGDPEIKK

351 TSFKGDSGGP LVCNKVAQGI VSYGRNNGMP PRACTKVSSF VHWIKKTMKR

401 YKDEL

DNA 서열: 서열 번호 74

201 GACCTATTTT CGCTTTCAAG AAGAAATTAA AGAAAACACC AAAAATGATA AACAAATGGT GCAGTATATT TACAAATATA CCAGCTATCC GGATCCGATT

501 AAAACGTGGT GGTGGCGGTA GTATTATTGG TGGTCATGTT GCAAAACCGC ATAGCCGTCC GTATATGGCA TATCTGATGA TTTGGGATCA GAAAAGCCTG

601 AAACGTTGTG GTGGTTTTCT GATTCGTGAT GATTTTGTTC TGACCGCAGC ACATTGTTGG GGTAGCAGCA TTAATGTTAC CCTGGGTGCC CATAATATTA

701 AAGAACAAGA ACCGACCCAG CAGTTTATTC CGGTTAAACG TGCAATTCCG CATCCGGCAT ATAATCCGAA AAATTTTAGC AATGATATTA TGCTGCTGCA

801 GCTGGAACGC AAAGCAAAAC GTACCCGTGC AGTTCAGCCG CTGCGTCTGC CGAGCAATAA AGCACAGGTT AAACCGGGTC AGACCTGTAG CGTTGCAGGT

901 TGGGGTCAGA CCGCACCGCT GGGTAAACAT TCACATACCC TGCAAGAGGT GAAAATGACC GTTCAAGAGG ATCGTAAATG CGAAAGCGAT CTGCGCCATT

1001 ATTATGATAG CACCATTGAA CTGTGTGTTG GTGATCCGGA AATTAAAAAA ACCAGCTTTA AAGGCGATAG CGGTGGTCCG CTGGTTTGTA ATAAAGTTGC

1101 ACAGGGTATT GTGAGCTATG GTCGTAATAA TGGTATGCCT CCGCGTGCAT GTACCAAAGT TAGCAGCTTT GTGCATTGGA TTAAAAAAAC GATGAAACGC

1201 TATAAAGATG AACTG

상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 튜너(DE3) pLysS를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.

실시예 9. 서열 번호 9의 융합 단백질

서열 번호 9의 단백질은 TRAIL121-281 서열의 N-말단에서 Nur77 단백질로부터 유도된 9-아미노산 펩티드(서열 번호 35)가 효과기 펩티드로서 부착된, 187 아미노산의 길이 및 21.9kDa의 질량을 갖는 융합 단백질이며, 효과기 펩티드의 C-말단에 추가로 7 Arg 잔기로 이루어진 폴리아르기닌 서열이 부착된다. 효과기 펩티드 및 TRAIL 서열 사이에, 메탈로프로테아제 MMP(서열 번호 51) 및 유로키나제 uPA(서열 번호 52)를 위한 절단 부위의 서열이 있다.

융합 단백질의 구조는 도 2에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 9 및 서열 번호 75로 하기에 나타낸다.

아미노산 서열: 서열 번호 9

1 FSRSLHSLLR RRRRRRRVVR PLGLAGRVAA HITGTRGRSN TLSSPNSKNE

51 KALGRKINSW ESSRSGHSFL SNLHLRNGEL VIHEKGFYYI YSQTYFRFQE

101 EIKENTKNDK QMVQYIYKYT SYPDPILLMK SARNSCWSKD AEYGLYSIYQ

151 GGIFELKEND RIFVSVTNEH LIDMDHEASF FGAFLVG

DNA 서열: 서열 번호 75

1 TTTAGCCGTA GCCTGCATAG CCTGCTGCGT CGTCGTCGTC GCCGTCGTCG TGTTGTTCGT CCGCTGGGTC TGGCAGGTCG TGTTGCAGCA CATATTACCG

101 GCACCCGTGG TCGTAGCAAT ACCCTGAGCA GCCCGAATAG CAAAAATGAA AAAGCCCTGG GTCGCAAAAT TAATAGCTGG GAAAGCAGCC GTAGCGGTCA

201 TAGCTTTCTG AGCAATCTGC ATCTGCGTAA TGGTGAACTG GTGATTCATG AAAAAGGCTT TTATTATATT TATAGCCAGA CCTATTTTCG CTTTCAGGAA

301 GAAATTAAAG AAAATACCAA AAATGATAAA CAAATGGTGC AGTACATTTA TAAATATACC AGCTATCCGG ATCCGATTCT GCTGATGAAA AGCGCACGTA

401 ATAGCTGTTG GAGCAAAGAT GCAGAATATG GCCTGTATAG CATTTATCAG GGTGGCATTT TTGAACTGAA AGAAAATGAT CGCATTTTTG TGAGCGTGAC

501 CAATGAACAT CTGATTGATA TGGATCATGA AGCCAGCTTT TTTGGTGCAT TTCTGGTGGG C

상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 로제타(DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.

실시예 10. 서열 번호 10의 융합 단백질

서열 번호 10의 단백질은 TRAIL121-281 서열의 N-말단에서 Bak 단백질의 BH3 도메인을 함유하는 16-아미노산 펩티드(서열 번호 36)가 효과기 펩티드로서 부착된, 193 아미노산의 길이 및 22.4kDa의 질량을 갖는 융합 단백질이며, 효과기 펩티드의 C-말단에 추가로 7 Arg 잔기로 이루어진 막 관통 폴리아르기닌 서열이 부착된다. 효과기 펩티드 서열 및 TRAIL 서열 사이에, 메탈로프로테아제 MMP(서열 번호 51) 및 유로키나제 uPA(서열 번호 52)를 위한 절단 부위의 서열이 있다.

융합 단백질의 구조는 도 2에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 10 및 서열 번호 76으로 하기에 나타낸다.

아미노산 서열: 서열 번호 10

1 GQVGRQLAII GDDINRRRRR RRRVVRPLGL AGRVAAHITG TRGRSNTLSS

51 PNSKNEKALG RKINSWESSR SGHSFLSNLH LRNGELVIHE KGFYYIYSQT

101 YFRFQEEIKE NTKNDKQMVQ YIYKYTSYPD PILLMKSARN SCWSKDAEYG

151 LYSIYQGGIF ELKENDRIFV SVTNEHLIDM DHEASFFGAF LVG

DNA 서열: 서열 번호 76

1 GGTCAGGTTG GTCGTCAGCT GGCAATTATT GGTGATGATA TTAACCGTCG TCGTCGTCGC CGTCGTCGTG TTGTTCGTCC GCTGGGTCTG GCAGGTCGTG

상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21 (DE3) 및 튜너 (DE3) pLysS를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.

실시예 11. 서열 번호 11의 융합 단백질

서열 번호 11의 단백질은 TRAIL121-281 서열의 N-말단에서 PUMA/BBC3 분자의 BH3 도메인(서열 번호 37)이 효과기 펩티드로서 부착된, 204 아미노산의 길이 및 24.3kDa의 질량을 갖는 융합 단백질이며, 효과기 펩티드의 C-말단에 추가로 9 Arg 잔기를 포함하는 폴리아르기닌 서열이 부착된다. 효과기 펩티드 서열 및 TRAIL 서열 사이에, 구조물은 또한 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열을 포함한다.

융합 단백질의 구조는 도 3에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 11 및 서열 번호 77로 하기에 나타낸다.

아미노산 서열: 서열 번호 11

1 EEQWAREIGA QLRRMADDLN AQYERRRRRR RRRRVVRPLG LAGRVAAHIT

51 GTRGRSNTLS SPNSKNEKAL GRKINSWESS RSGHSFLSNL HLRNGELVIH

101 EKGFYYIYSQ TYFRFQEEIK ENTKNDKQMV QYIYKYTSYP DPILLMKSAR

151 NSCWSKDAEY GLYSIYQGGI FELKENDRIF VSVTNEHLID MDHEASFFGA

201 FLVG

DNA 서열: 서열 번호 77

1 GAAGAACAGT GGGCACGTGA AATTGGTGCA CAGCTGCGTC GTATGGCAGA TGATCTGAAT GCACAGTATG AACGTCGTCG TCGTCGCCGT CGGCGTCGTC

101 GTGTTGTTCG TCCGCTGGGT CTGGCAGGTC GTGTTGCAGC ACATATTACC GGCACCCGTG GTCGTAGCAA TACCCTGAGC AGCCCGAATA GCAAAAATGA

201 AAAAGCACTG GGTCGCAAAA TCAATAGCTG GGAAAGCAGC CGTAGCGGTC ATAGCTTTCT GAGCAATCTG CATCTGCGTA ATGGTGAACT GGTGATTCAT

301 GAAAAAGGCT TTTATTATAT TTATAGCCAG ACCTATTTTC GCTTTCAAGA AGAGATTAAA GAAAATACCA AAAATGATAA ACAAATGGTG CAGTATATTT

401 ACAAATACAC CAGCTATCCG GACCCGATTC TGCTGATGAA AAGCGCACGT AATAGCTGTT GGAGCAAAGA TGCAGAATAT GGTCTGTATA GCATTTATCA

501 GGGTGGCATC TTTGAGCTGA AAGAAAATGA TCGCATCTTT GTTAGCGTGA CCAACGAACA TCTGATCGAT ATGGATCATG AAGCCAGCTT TTTTGGTGCA

실시예 12. 서열 번호 12의 융합 단백질

서열 번호 12의 단백질은 TRAIL121-281 서열의 C-말단에서 PUMA 단백질 (서열 번호 38)이 효과기 펩티드로서 부착된, 372 아미노산의 길이 및 41kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드 서열 및 TRAIL 서열 사이에, 메탈로프로테아제 MMP (서열 번호 51) 및 유로키나제 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재하며, 이는 추가로 가요성 글리신-세린 링커 GGSGG (서열 번호 60)에 의해 TRAIL의 서열로부터 분리된다. 더욱이, 효과기 펩티드의 C-말단에서, 효과기 펩티드는 소포체를 향하고, 전체 구조물의 C-말단 부분을 형성하는 KEDL 서열(서열 번호 56)을 포함한다.

융합 단백질의 구조는 도 3에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 12 및 서열 번호 78로 하기에 나타낸다.

아미노산 서열: 서열 번호 12

1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR

51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI

101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH

151 EASFFGAFLV GGGSGGPLGL AGRVVRARAR QEGSSPEPVE GLARDGPRPF

201 PLGRLVPSAV SCGLCEPGLA AAPAAPTLLP AAYLCAPTAP PAVTAALGGS

251 RWPGGPRSRP RGPRPDGPQP SLSLAEQHLE SPVPSAPGAL AGGPTQAAPG

301 VRGEEEQWAR EIGAQLRRMA DDLNAQYERR RQEEQQRHRP SPWRVLYNLI

351 MGLLPLPRGH RAPEMEPNKE DL

DNA 서열: 서열 번호 78

1 CGTGTTGCAG CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCACT GGGTCGCAAA ATCAATAGCT

201 GACCTATTTT CGCTTTCAAG AAGAGATTAA AGAAAATACC AAAAATGATA AACAAATGGT GCAGTACATT TACAAATATA CCAGCTATCC GGACCCGATT

301 CTGCTGATGA AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCAGAATA TGGTCTGTAT AGCATTTATC AGGGTGGCAT CTTTGAGCTG AAAGAAAATG

401 ATCGCATCTT TGTTAGCGTG ACCAACGAAC ATCTGATCGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTT GGTGGTGGTA GCGGTGGTCC

501 GCTGGGTCTG GCAGGTCGTG TTGTTCGTGC CCGTGCGCGT CAAGAAGGTA GCAGTCCGGA ACCGGTTGAA GGTCTGGCAC GTGATGGTCC GCGTCCGTTT

601 CCGCTGGGTC GTCTGGTTCC GAGCGCAGTT AGCTGTGGTC TGTGTGAACC GGGTCTGGCA GCCGCACCGG CAGCACCGAC ACTGCTGCCT GCAGCATATC

701 TGTGTGCACC GACCGCACCG CCTGCAGTTA CCGCAGCACT GGGTGGTAGC CGTTGGCCTG GTGGTCCGCG TAGTCGTCCG CGTGGTCCTC GTCCGGATGG

801 TCCGCAGCCG AGCCTGAGCC TGGCAGAACA GCATCTGGAA AGTCCGGTGC CGAGCGCACC GGGTGCACTG GCAGGCGGTC CTACACAGGC AGCACCGGGT

901 GTTCGTGGTG AAGAGGAACA GTGGGCACGT GAAATTGGTG CACAGCTGCG TCGTATGGCA GATGATCTGA ATGCACAGTA TGAACGTCGT CGTCAAGAAG

1001 AACAGCAGCG TCATCGTCCG AGCCCGTGGC GTGTTCTGTA TAATCTGATT ATGGGTCTGC TGCCGCTGCC TCGTGGTCAT CGTGCACCGG AAATGGAACC

1101 GAATAAAGAA GATCTG

상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 B.21 (DE3) 및 스트라테이진으로부터 입수한 i BL21DE3pLysSRIL을 사용하여 일반 절차 B에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.

실시예 13. 서열 번호 13의 융합 단백질

서열 번호 13의 단백질은 121-281 TRAIL의 C-말단에서 PUMA 단백질의 서열 (서열 번호 38)이 효과기 펩티드로서 부착된, 493 아미노산의 길이 및 53.4 kDa의 질량을 갖는 융합 단백질이다. 더욱이, PUMA 단백질 서열 및 TRAIL 서열 사이에, 녹농균(Pseudomonas aeruginosa)으로부터의 전좌 도메인의 서열이 존재하며, 이는 가요성 글리신-세린 링커 GGGGS (서열 번호 59), 퓨린 절단 부위 (서열 번호 53) 및 가요성 알라닌-글리신-세린 링커 ASGG (서열 번호 65)의 연속적인 서열에 의해 TRAIL의 서열로부터 추가로 분리 및 가요성 글리신-세린 링커 GGSGG (서열 번호 60)에 의해 PUMA 단백질로부터 추가로 분리된다. 더욱이, 효과기 펩티드의 C-말단에서, 효과기 펩티드는 소포체를 향하는 KEDL 서열(서열 번호 56)을 포함하며, 이는 전체 구조물의 C-말단 부분이다.

융합 단백질의 구조는 도 3에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 13 및 서열 번호 79로 하기에 나타낸다.

아미노산 서열: 서열 번호 13

1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR

51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI

101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH

151 EASFFGAFLV GGGGSRKKRA SGGPEGGSLA ALTAHQACHL PLETFTRHRQ

201 PRGWEQLEQC GYPVQRLVAL YLAARLSWNQ VDQVIANALA SPGSGGDLGE

251 AIRESPEQAR LALTLAAAES ERFVRQGTGN DEAGAANGPA DGGSGGGARA

301 RQEGSSPEPV EGLARDGPRP FPLGRLVPSA VSCGLCEPGL AAAPAAPTLL

351 PAAYLCAPTA PPAVTAALGG SRWPGGPRSR PRGPRPDGPQ PSLSLAEQHL

401 ESPVPSAPGA LAGGPTQAAP GVRGEEEQWA REIGAQLRRM ADDLNAQYER

451 RRQEEQQRHR PSPWRVLYNL IMGLLPLPRG HRAPEMEPNK DEL

DNA 서열: 서열 번호 79

801 AGCAGAAAGC GAACGTTTTG TTCGTCAGGG CACCGGTAAT GATGAAGCCG GTGCAGCAAA TGGTCCGGCA GATGGTGGTA GTGGTGGTGG TGCACGTGCT

901 CGTCAAGAAG GTAGCAGTCC GGAACCGGTT GAAGGTCTGG CACGTGACGG TCCGCGTCCG TTTCCGCTGG GTCGTCTGGT TCCGAGCGCA GTTAGCTGTG

1001 GTCTGTGTGA ACCGGGTCTG GCAGCCGCAC CGGCAGCACC GACACTGCTG CCTGCAGCAT ATCTGTGTGC ACCGACCGCA CCGCCTGCAG TTACCGCAGC

1101 ACTGGGTGGT AGTCGTTGGC CTGGTGGTCC GCGTAGTCGT CCGCGTGGTC CGCGTCCGGA TGGTCCGCAG CCGAGTCTGA GCCTGGCAGA ACAGCATCTG

1201 GAAAGTCCTG TGCCGAGCGC ACCGGGTGCA CTGGCAGGCG GTCCGACACA GGCAGCACCT GGTGTTCGTG GTGAAGAAGA ACAGTGGGCA CGCGAAATTG

1301 GTGCACAGCT GCGTCGTATG GCAGATGATC TGAATGCACA GTATGAACGT CGTCGTCAAG AAGAACAGCA GCGTCATCGT CCGAGCCCGT GGCGTGTTCT

1401 GTATAATCTG ATTATGGGTC TGCTGCCGCT GCCTCGTGGT CATCGTGCAC CGGAAATGGA ACCGAATAAA GATGAACTG

상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21 (DE3) 및 스트라테이진으로부터 입수한 BL21DE3pLysSRIL을 사용하여 일반 절차 B에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.

실시예 14. 서열 번호 14의 융합 단백질

서열 번호 14의 단백질은 TRAIL 121-281 서열의 N-말단에서 SMAC/Diablo 단백질의 8-아미노산 분절 (서열 번호 39)이 효과기 펩티드로서 부착된, 186 아미노산의 길이 및 21.5 kDa의 질량을 갖는 융합 단백질이며, 효과기 펩티드의 C-말단에 추가로 7 Arg 잔기로 이루어진 폴리아르기닌 서열이 부착된다. 더욱이, 폴리아르기닌 서열 및 TRAIL 서열 사이에, 상기 단백질은 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열을 포함한다.

융합 단백질의 구조는 도 3에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 14 및 서열 번호 80으로 하기에 나타낸다.

아미노산 서열: 서열 번호 14

1 AVPIAQKPRR RRRRRRVVRP LGLAGRVAAH ITGTRGRSNT LSSPNSKNEK

51 ALGRKINSWE SSRSGHSFLS NLHLRNGELV IHEKGFYYIY SQTYFRFQEE

101 IKENTKNDKQ MVQYIYKYTS YPDPILLMKS ARNSCWSKDA EYGLYSIYQG

151 GIFELKENDR IFVSVTNEHL IDMDHEASFF GAFLVG

DNA 서열: 서열 번호 80

1 GCAGTTCCGA TTGCACAGAA ACCGCGTCGT CGTCGTCGCC GTCGTCGTGT TGTTCGTCCG CTGGGTCTGG CAGGTCGTGT TGCAGCACAT ATTACCGGCA

101 CCCGTGGTCG TAGCAATACC CTGAGCAGCC CGAATAGCAA AAATGAAAAA GCCCTGGGTC GCAAAATCAA TAGCTGGGAA AGCAGCCGTA GCGGTCATAG

201 CTTTCTGAGC AATCTGCATC TGCGTAATGG TGAACTGGTG ATTCATGAAA AAGGCTTTTA CTATATCTAT AGCCAGACCT ACTTCCGCTT TCAGGAAGAA

301 ATTAAAGAAA ATACCAAAAA TGATAAACAA ATGGTGCAGT ATATCTATAA ATATACCAGC TATCCGGATC CGATTCTGCT GATGAAAAGC GCACGTAATA

401 GCTGTTGGAG CAAAGATGCA GAATATGGCC TGTATAGCAT TTATCAGGGT GGCATTTTTG AACTGAAAGA AAATGATCGC ATTTTTGTGA GCGTGACCAA

501 TGAACATCTG ATTGATATGG ATCATGAAGC CAGCTTTTTT GGTGCATTTC TGGTGGGT

상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21 (DE3) 또는 튜너 (DE3)를 사용하여 일반 절차 B에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.

실시예 15. 서열 번호 15의 융합 단백질

서열 번호 15의 단백질은 TRAIL 121-281 서열의 N-말단에서 부포린 IIb (서열 번호 40)이 효과기 펩티드로서 부착된, 191 아미노산의 길이 및 22.2 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드 및 TRAIL 서열 사이에, 상기 단백질은 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열을 포함한다.

융합 단백질의 구조는 도 3에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 15 및 서열 번호 81로 하기에 나타낸다.

아미노산 서열: 서열 번호 15

1 RAGLQFPVGR LLRRLLRRLL RVVRPLGLAG RVAAHITGTR GRSNTLSSPN

51 SKNEKALGRK INSWESSRSG HSFLSNLHLR NGELVIHEKG FYYIYSQTYF

101 RFQEEIKENT KNDKQMVQYI YKYTSYPDPI LLMKSARNSC WSKDAEYGLY

151 SIYQGGIFEL KENDRIFVSV TNEHLIDMDH EASFFGAFLV G

DNA 서열: 서열 번호 81

1 CGTGCAGGTC TGCAGTTTCC GGTTGGACGT CTGTTACGTC GCCTGCTGCG TCGTCTGCTG CGCGTTGTTC GTCCGCTGGG TCTGGCAGGT CGTGTTGCAG

101 CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCACT GGGTCGCAAA ATCAATAGCT GGGAAAGCAG

201 CCGTAGCGGT CATAGCTTTC TGAGCAATCT GCATCTGCGT AATGGTGAAC TGGTGATTCA TGAAAAAGGC TTTTATTATA TTTATAGCCA GACCTATTTT

301 CGCTTTCAAG AAGAGATTAA AGAAAATACC AAAAATGATA AACAAATGGT GCAGTACATT TACAAATATA CCAGCTATCC GGACCCGATT CTGCTGATGA

401 AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCAGAATA TGGTCTGTAT AGCATTTATC AGGGTGGCAT CTTTGAGCTG AAAGAAAATG ATCGCATCTT

501 TGTTAGCGTG ACCAACGAAC ATCTGATCGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTG GGTCTGGTTC CGCGTGGTAG CGGTAGCAGC

601 CATCATCATC ATCACCATAG CAGCGGT

상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 튜너 (DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.

실시예 16. 서열 번호 16의 융합 단백질

서열 번호 16의 단백질은 TRAIL 121-281 서열의 C-말단에서 단백질 온코나제 (서열 번호 41)가 효과기 펩티드로서 부착된, 279 아미노산의 길이 및 31.7 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열 및 TRAIL 서열 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되고, 추가로 가요성 글리신-세린 링커 GGGS (서열 번호 58)에 의해 TRAIL의 서열로부터 분리되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 4에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 16 및 서열 번호 82로 하기에 나타낸다.

아미노산 서열: 서열 번호 16

1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR

51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI

101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH

151 EASFFGAFLV GGGSGPLGLA GRVVRQDWLT FQKKHITNTR DVDCDNIMST

201 NLFHCKDKNT FIYSRPEPVK AICKGIIASK NVLTTSEFYL SDCNVTSRPC

251 KYKLKKSTNK FCVTCENQAP VHFVGVGSC

DNA 서열: 서열 번호 82

501 GGGTCTGGCA GGTCGTGTTG TTCGTCAGGA TTGGCTGACC TTTCAGAAAA AACATATTAC CAATACCCGT GATGTGGATT GCGATAATAT TATGAGCACC

601 AACCTGTTTC ATTGCAAAGA TAAAAATACC TTTATTTATA GCCGTCCGGA ACCGGTTAAA GCAATTTGTA AAGGTATTAT TGCCAGCAAA AATGTGCTGA

701 CCACGAGCGA ATTCTATCTG AGCGATTGTA ATGTTACCAG CCGTCCGTGT AAATATAAAC TGAAAAAAAG CACCAATAAA TTTTGCGTGA CCTGCGAAAA

801 TCAGGCACCG GTTCATTTTG TTGGTGTTGG TAGCTGT

실시예 17. 서열 번호 17의 융합 단백질

서열 번호 17의 단백질은 TRAIL 121-281 서열의 C-말단에서 단백질 온코나제 (서열 번호 41)가 효과기 펩티드로서 부착된, 274 아미노산의 길이 및 31 kDa의 질량을 갖는 융합 단백질이며, 효과기 펩티드의 서열은 가요성 글리신-세린 링커, GGGGSGGGGS (서열 번호 64)에 의해 TRAIL의 서열로부터 추가로 분리된다.

융합 단백질의 구조는 도 4에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 17 및 서열 번호 83으로 하기에 나타낸다.

아미노산 서열: 서열 번호 17

1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR

51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI

101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH

151 EASFFGAFLV GGGGSGGGGS QDWLTFQKKH ITNTRDVDCD NIMSTNLFHC

201 KDKNTFIYSR PEPVKAICKG IIASKNVLTT SEFYLSDCNV TSRPCKYKLK

251 KSTNKFCVTC ENQAPVHFVG VGSC

DNA 서열: 서열 번호 83

501 TGGTGGCAGC CAGGATTGGC TGACCTTTCA GAAAAAACAT ATTACCAATA CCCGTGATGT GGATTGCGAT AATATTATGA GCACCAACCT GTTTCATTGC

601 AAAGATAAAA ATACCTTTAT TTATAGCCGT CCGGAACCGG TTAAAGCAAT TTGTAAAGGT ATTATTGCCA GCAAAAATGT GCTGACCACG AGCGAATTCT

701 ATCTGAGCGA TTGTAATGTT ACCAGCCGTC CGTGTAAATA TAAACTGAAA AAAAGCACCA ATAAATTTTG CGTGACCTGC GAAAATCAGG CACCGGTTCA

801 TTTTGTTGGT GTTGGTAGCT GT

실시예 18. 서열 번호 18의 융합 단백질

서열 번호 18의 단백질은 TRAIL 121-281 서열의 N-말단에서 단백질 p14ARF의 N-말단 도메인을 함유하는 20-아미노산 펩티드(서열 번호 42)가 효과기 펩티드로서 부착된, 197 아미노산의 길이 및 23.2 kDa의 질량을 갖는 융합 단백질이며, 효과기 펩티드의 C-말단에 추가로 6 Arg 잔기로 이루어진 폴리아르기닌 서열이 부착된다. 더욱이, 폴리아르기닌 서열 및 TRAIL 서열 사이에, 프로테아제 절단 부위 uPA (서열 번호 52) 및 MMP (서열 번호 51)의 서열을 포함한다.

융합 단백질의 구조는 도 4에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 18 및 서열 번호 84로 하기에 나타낸다.

아미노산 서열: 서열 번호 18

1 VRRFLVTLRI RRACGPPRVR RRRRRRRVVR PLGLAGRVAA HITGTRGRSN

51 TLSSPNSKNE KALGRKINSW ESSRSGHSFL SNLHLRNGEL VIHEKGFYYI

101 YSQTYFRFQE EIKENTKNDK QMVQYIYKYT SYPDPILLMK SARNSCWSKD

151 AEYGLYSIYQ GGIFELKEND RIFVSVTNEH LIDMDHEASF FGAFLVG

DNA 서열: 서열 번호 84

1 GTTCGTCGTT TTCTGGTTAC CCTGCGTATT CGTCGTGCAT GTGGTCCTCC GCGTGTGCGT CGTCGTCGTC GCCGTCGTCG TGTTGTTCGT CCTCTGGGTC

101 TGGCAGGTCG CGTTGCAGCA CATATTACCG GCACCCGTGG TCGTAGCAAT ACCCTGAGCA GCCCGAATAG CAAAAATGAA AAAGCCCTGG GTCGCAAAAT

201 TAATAGCTGG GAAAGCAGCC GTAGCGGTCA TAGCTTTCTG AGCAATCTGC ATCTGCGTAA TGGTGAACTG GTGATTCATG AAAAAGGCTT TTATTATATT

301 TATAGCCAGA CCTATTTTCG CTTTCAGGAA GAAATTAAAG AAAATACCAA AAATGATAAA CAAATGGTGC AGTATATCTA TAAATATACC AGCTATCCGG

401 ATCCGATTCT GCTGATGAAA AGCGCACGTA ATAGCTGTTG GAGCAAAGAT GCAGAATATG GCCTGTATAG CATTTATCAG GGTGGCATTT TTGAACTGAA

501 AGAAAATGAT CGCATTTTTG TGAGCGTGAC CAATGAACAT CTGATTGATA TGGATCATGA AGCCAGCTTT TTTGGTGCAT TTCTGGTTGG T

실시예 19. 서열 번호 19의 융합 단백질

서열 번호 19의 단백질은 TRAIL 121-281 서열의 N-말단에서 Mdm2에 결합하는 11-아미노산 펩티드(서열 번호 43)가 효과기 펩티드로서 부착된, 189 아미노산의 길이 및 22.3 kDa의 질량을 갖는 융합 단백질이며, 효과기 펩티드의 C-말단에 추가로 7 Arg 잔기로 이루어진 폴리아르기닌 서열이 부착된다. 더욱이, 폴리아르기닌 서열 및 TRAIL 서열 사이에, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 4에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 19 및 서열 번호 85로 하기에 나타낸다.

아미노산 서열: 서열 번호 19

1 PRFMDTWEGL NRRRRRRRRV VRPLGLAGRV AAHITGTRGR SNTLSSPNSK

51 NEKALGRKIN SWESSRSGHS FLSNLHLRNG ELVIHEKGFY YIYSQTYFRF

101 QEEIKENTKN DKQMVQYIYK YTSYPDPILL MKSARNSCWS KDAEYGLYSI

151 YQGGIFELKE NDRIFVSVTN EHLIDMDHEA SFFGAFLVG

DNA 서열: 서열 번호 85

1 CCTCGTTTTA TGGATACCTG GGAAGGTCTG AATCGCCGTC GGCGTCGTCG GCGTCGTGTT GTTCGTCCGC TGGGTCTGGC AGGTCGTGTT GCAGCACATA

101 TTACCGGCAC CCGTGGTCGT AGCAATACCC TGAGCAGCCC GAATAGCAAA AATGAAAAAG CACTGGGTCG CAAAATTAAT AGCTGGGAAA GCAGCCGTAG

201 CGGTCATAGC TTTCTGAGCA ATCTGCATCT GCGTAATGGT GAACTGGTGA TTCATGAAAA AGGCTTTTAT TATATTTATA GCCAGACCTA TTTTCGCTTT

301 CAGGAAGAAA TTAAAGAAAA TACCAAAAAT GATAAACAAA TGGTGCAGTA CATTTACAAA TATACCAGCT ATCCGGATCC GATTCTGCTG ATGAAAAGCG

401 CACGTAATAG CTGTTGGAGC AAAGATGCAG AATATGGTCT GTATAGCATT TATCAGGGTG GCATTTTTGA ACTGAAAGAA AATGATCGCA TTTTTGTGAG

501 CGTGACCAAT GAACATCTGA TTGATATGGA TCATGAAGCC AGCTTTTTTG GTGCATTTCT GGTTGGT

실시예 20. 서열 번호 20의 융합 단백질

서열 번호 20의 단백질은 TRAIL 121-281 서열의 N-말단에서 루나신으로부터 유도된 펩티드(서열 번호 44)가 효과기 펩티드로서 부착된, 195 아미노산의 길이 및 22.9 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드 및 TRAIL의 서열의 사이에는, 주어진 순서로, 7개의 Arg 잔기로 이루어진 폴리아르기닌 서열 및 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 대한 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 4에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 20 및 서열 번호 86으로 하기에 나타낸다.

아미노산 서열: 서열 번호 20

1 CEKHIMEKIQ GRGDDDDRRR RRRRRVVRPL GLAGRVAAHI TGTRGRSNTL

51 SSPNSKNEKA LGRKINSWES SRSGHSFLSN LHLRNGELVI HEKGFYYIYS

101 QTYFRFQEEI KENTKNDKQM VQYIYKYTSY PDPILLMKSA RNSCWSKDAE

151 YGLYSIYQGG IFELKENDRI FVSVTNEHLI DMDHEASFFG AFLVG

DNA 서열: 서열 번호 86

1 TGTGAAAAAC ATATTATGGA AAAAATTCAG GGTCGCGGTG ATGATGATGA TCGCCGTCGG CGTCGTCGGC GTCGTGTTGT TCGTCCGCTG GGTCTGGCAG

101 GTCGTGTTGC AGCACATATT ACCGGCACCC GTGGTCGTAG CAATACCCTG AGCAGCCCGA ATAGCAAAAA TGAAAAAGCA CTGGGTCGCA AAATTAATAG

201 CTGGGAAAGC AGCCGTAGCG GTCATAGCTT TCTGAGCAAT CTGCATCTGC GTAATGGTGA ACTGGTGATT CATGAAAAAG GCTTTTATTA TATTTATAGC

301 CAGACCTATT TTCGCTTTCA GGAAGAAATT AAAGAAAATA CCAAAAATGA TAAACAAATG GTGCAGTACA TTTACAAATA TACCAGCTAT CCGGATCCGA

401 TTCTGCTGAT GAAAAGCGCA CGTAATAGCT GTTGGAGCAA AGATGCAGAA TATGGTCTGT ATAGCATTTA TCAGGGTGGC ATTTTTGAAC TGAAAGAAAA

501 TGATCGCATT TTTGTGAGCG TGACCAATGA ACATCTGATT GATATGGATC ATGAAGCCAG CTTTTTTGGT GCATTTCTGG TTGGT

실시예 21. 서열 번호 21의 융합 단백질

서열 번호 21의 단백질은, 그것의 C-말단에 7 Arg 잔기로 이루어진 폴리아르기닌 서열의 부착과 함께 TRAIL 121-281 서열의 N-말단에 효과기 펩티드로서 8-아미노산 단백질 Smac/Diablo의 분절(서열 번호 39)이 부착되어 있는, 218 아미노산의 길이 및 25.5 kDa의 질량을 갖는 융합 단백질이다. 더욱이, TRAIL 121-281 서열의 C-말단에는, Bik 단백질 (서열 번호 45)의 BH3 도메인을 포함하는 펩티드가 제2 효과기 펩티드로서 부착되어 있고, 상기 제2 효과기 펩티드는 그 N-말단에 7개의 Arg 잔기로 이루어진 폴리아르기닌 서열이 부착되어 있다. TRAIL의 서열 및 부착된 폴리아르기닌 서열을 갖는 2개의 효과기 펩티드 사이에는, 메탈로프로테아제 MMP (서열 번호 51) 및 유로키나제 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 4에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 21 및 서열 번호 87로 하기에 나타낸다.

아미노산 서열: 서열 번호 21

1 AVPIAQKPRR RRRRRRVVRP LGLAGRVAAH ITGTRGRSNT LSSPNSKNEK

51 ALGRKINSWE SSRSGHSFLS NLHLRNGELV IHEKGFYYIY SQTYFRFQEE

101 IKENTKNDKQ MVQYIYKYTS YPDPILLMKS ARNSCWSKDA EYGLYSIYQG

151 GIFELKENDR IFVSVTNEHL IDMDHEASFF GAFLVGPLGL AGRVVRRRRR

201 RRRLALRLAC IGDEMDVS

DNA 서열: 서열 번호 87

1 GCAGTTCCGA TTGCACAGAA ACCGCGTCGT CGTCGTCGCC GTCGTCGTGT TGTTCGTCCT CTGGGTCTGG CAGGTCGCGT TGCAGCACAT ATTACCGGCA

101 CCCGTGGTCG TAGCAATACC CTGAGCAGCC CGAATAGCAA AAATGAAAAA GCCCTGGGTC GCAAAATTAA TAGCTGGGAA AGCAGCCGTA GCGGTCATAG

201 CTTTCTGAGC AATCTGCATC TGCGTAATGG TGAACTGGTG ATTCATGAAA AAGGCTTTTA TTATATTTAT AGCCAGACCT ATTTTCGCTT TCAGGAAGAA

501 TGAACATCTG ATTGATATGG ATCATGAAGC CAGCTTTTTT GGTGCATTTC TGGTTGGTCC GCTGGGCCTG GCTGGCCGTG TGGTTCGCCG GCGCCGTCGC

601 CGTCGCCGCC TGGCACTGCG TCTGGCATGT ATTGGTGATG AAATGGATGT GAGC

상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 E.coli 균주 Rosetta (DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.

실시예 22. 서열 번호 22의 융합 단백질 22

서열 번호 22의 단백질은, TRAIL 121-281 서열의 C-말단에 효과기 펩티드로서 Gly, Ala 반복으로 이루어진 합성 펩티드 서열(서열 번호 46)이 부착된, 199 아미노산의 길이 및 22.3 kDa의 질량을 갖는 융합 단백질이고, 그것의 C-말단에 또한 8개의 Arg 잔기로 이루어진 폴리아르기닌 서열이 부착되며, 후자는 또한 전체 구조물의 C-말단 부분을 형성한다. 더욱이, TRAIL의 서열 및 효과기 펩티드 사이에는, 메탈로프로테아제 MMP (서열 번호 51) 및 유로키나제 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 4에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 22 및 서열 번호 88로 하기에 나타낸다.

아미노산 서열: 서열 번호 22

1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR

51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI

101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH

151 EASFFGAFLV GRVVRPLGLA GAGAGGGAGG AGAGGGAGGA GRRRRRRRR

DNA 서열: 서열 번호 88

501 TGGTCGTGTT GTTCGTCCGC TGGGTCTGGC TGGTGCCGGT GCCGGTGGTG GTGCAGGCGG TGCTGGTGCG GGTGGCGGAG CCGGTGGTGC AGGTCGTCGT

601 CGTCGCCGTC GTCGGCGT

실시예 23. 서열 번호 23의 융합 단백질

서열 번호 23의 단백질은 TRAIL 121-281 서열의 C-말단에 UIMs 모티프를 포함하는 프로테아좀 성분 S5a의 C-말단 도메인(서열 번호 46)이 효과기 펩티드로서 부착된, 289 아미노산의 길이 및 32.6 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드 및 TRAIL의 서열의 사이에는, 가요성 글리신-세린 링커 GGGSGG (서열 번호 61)에 의해 TRAIL 서열로부터 추가로 분리된, 퓨린 절단 부위의 서열 (서열 번호 53)이 존재하고, 효과기 펩티드의 C-말단에는 소포체를 향하는 KEDL 서열(서열 번호 56)이 위치되며, 후자는 전체 구조물의 C-말단 부분이 된다.

융합 단백질의 구조는 도 8에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 23 및 서열 번호 89로 하기에 나타낸다.

아미노산 서열: 서열 번호 23

1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR

51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI

101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH

151 EASFFGAFLV GGGGSGGRKK RMTISQQEFG RTGLPDLSSM TEEEQIAYAM

201 QMSLQGAEFG QAESADIDAS SAMDTSEPAK EEDDYDVMQD PEFLQSVLEN

251 LPGVDPNNEA IRNAMGSLAS QATKDGKKDK KEEDKKEDL

DNA 서열: 서열 번호 89

501 TCGTAAAAAA CGTATGACCA TTAGCCAGCA AGAATTTGGT CGTACCGGTC TGCCGGATCT GAGCAGCATG ACCGAAGAAG AACAAATTGC CTACGCAATG

601 CAGATGAGCC TGCAGGGTGC AGAATTTGGT CAGGCAGAAA GCGCAGATAT TGATGCAAGC AGCGCAATGG ATACCAGCGA ACCGGCAAAA GAAGAAGACG

701 ATTACGACGT TATGCAGGAT CCGGAATTTC TGCAGAGCGT TCTGGAAAAT CTGCCGGGTG TTGATCCGAA TAATGAAGCA ATTCGTAATG CAATGGGTAG

801 CCTGGCAAGC CAAGCAACCA AAGATGGCAA AAAAGATAAA AAAGAGGAAG ACAAAAAAGA AGATCTG

실시예 24. 서열 번호 24의 융합 단백질 (비교)

서열 번호 24의 단백질은 119-281 TRAIL 서열의 N-말단에 TNF 리간드로부터 유도된 데카펩티드(서열 번호 48)가 효과기 펩티드로서 부착된, 183 아미노산의 길이 및 21 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 5에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 24 및 서열 번호 90으로 하기에 나타낸다.

아미노산 서열: 서열 번호 24

1 VANPQAEGQL RVVRPLGLAG PQRVAAHITG TRGRSNTLSS PNSKNEKALG

51 RKINSWESSR SGHSFLSNLH LRNGELVIHE KGFYYIYSQT YFRFQEEIKE

101 NTKNDKQMVQ YIYKYTSYPD PILLMKSARN SCWSKDAEYG LYSIYQGGIF

151 ELKENDRIFV SVTNEHLIDM DHEASFFGAF LVG

DNA 서열: 서열 번호 90

1 GTTGCAAATC CGCAGGCAGA AGGTCAGCTG CGCGTTGTTC GTCCGCTGGG TCTGGCAGGT CCGCAGCGTG TTGCAGCACA TATTACCGGC ACCCGTGGTC

101 GTAGCAATAC CCTGAGCAGC CCGAATAGCA AAAATGAAAA AGCCCTGGGT CGTAAAATTA ATAGCTGGGA AAGCAGCCGT AGCGGTCATA GCTTTCTGAG

201 CAATCTGCAT CTGCGTAATG GCGAACTGGT GATTCATGAA AAAGGCTTTT ATTATATTTA TAGCCAGACC TATTTTCGCT TTCAGGAAGA AATTAAAGAA

301 AATACCAAAA ATGATAAACA AATGGTGCAG TATATCTATA AATATACCAG CTATCCGGAT CCGATTCTGC TGATGAAAAG CGCACGTAAT AGCTGTTGGA

401 GCAAAGATGC CGAATATGGT CTGTATAGCA TTTATCAGGG TGGCATTTTT GAACTGAAAG AAAATGATCG CATTTTTGTG AGCGTGACCA ATGAACATCT

501 GATTGATATG GATCATGAAG CCAGCTTTTT TGGTGCATTT CTGGTTGGT

상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21 (DE3)을 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.

실시예 25. 서열 번호 25의 융합 단백질 (비교)

서열 번호 25의 단백질은 TRAIL 119-281 서열의 N-말단에 TNF로부터 유도된 6-아미노산 펩티드(서열 번호 49)가 효과기 펩티드로서 부착된, 179 아미노산의 길이 및 20.7 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 5에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 25 및 서열 번호 91로 하기에 나타낸다.

아미노산 서열: 서열 번호 25

1 LANGVERVVR PLGLAGPQRV AAHITGTRGR SNTLSSPNSK NEKALGRKIN

51 SWESSRSGHS FLSNLHLRNG ELVIHEKGFY YIYSQTYFRF QEEIKENTKN

101 DKQMVQYIYK YTSYPDPILL MKSARNSCWS KDAEYGLYSI YQGGIFELKE

151 NDRIFVSVTN EHLIDMDHEA SFFGAFLVG

DNA 서열: 서열 번호 91

1 CTGGCAAATG GTGTTGAACG TGTTGTTCGT CCGCTGGGTC TGGCAGGTCC GCAGCGTGTT GCAGCACATA TTACCGGCAC CCGTGGTCGT AGCAATACCC

101 TGAGCAGCCC GAATAGCAAA AATGAAAAAG CCCTGGGTCG TAAAATTAAT AGCTGGGAAA GCAGCCGTAG CGGTCATAGC TTTCTGAGCA ATCTGCATCT

201 GCGTAATGGC GAACTGGTGA TTCATGAAAA AGGCTTTTAT TATATTTATA GCCAGACCTA TTTTCGCTTT CAGGAAGAAA TTAAAGAAAA TACCAAAAAT

301 GATAAACAAA TGGTGCAGTA TATCTATAAA TATACCAGCT ATCCGGATCC GATTCTGCTG ATGAAAAGCG CACGTAATAG CTGTTGGAGC AAAGATGCCG

401 AATATGGTCT GTATAGCATT TATCAGGGTG GCATTTTTGA ACTGAAAGAA AATGATCGCA TTTTTGTGAG CGTGACCAAT GAACATCTGA TTGATATGGA

501 TCATGAAGCC AGCTTTTTTG GTGCATTTCT GGTTGGT

실시예 26. 서열 번호 26의 융합 단백질 (비교)

서열 번호 26의 단백질은 TRAIL 119-281 서열의 N-말단에, C-말단 및 N-말단 양쪽에 추가적인 1개의 Cys 잔기를 갖는, TNF 사이토카인의 5-아미노산 분절(서열 번호 50)이 효과기 펩티드로서 부착된, 180 아미노산의 길이 및 20.8 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 5에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 26 및 서열 번호 92로 하기에 나타낸다.

아미노산 서열: 서열 번호 26

1 CPSEGLCRVV RPLGLAGPQR VAAHITGTRG RSNTLSSPNS KNEKALGRKI

51 NSWESSRSGH SFLSNLHLRN GELVIHEKGF YYIYSQTYFR FQEEIKENTK

101 NDKQMVQYIY KYTSYPDPIL LMKSARNSCW SKDAEYGLYS IYQGGIFELK

151 ENDRIFVSVT NEHLIDMDHE ASFFGAFLVG

DNA 서열: 서열 번호 92

1 TGTCCGAGCG AAGGTCTGTG TCGTGTTGTT CGTCCGCTGG GTCTGGCAGG TCCGCAGCGT GTTGCAGCAC ATATTACCGG CACCCGTGGT CGTAGCAATA

101 CCCTGAGCAG CCCGAATAGC AAAAATGAAA AAGCCCTGGG TCGTAAAATT AATAGCTGGG AAAGCAGCCG TAGCGGTCAT AGCTTTCTGA GCAATCTGCA

201 TCTGCGTAAT GGCGAACTGG TGATTCATGA AAAAGGCTTT TATTATATTT ATAGCCAGAC CTATTTTCGC TTTCAGGAAG AAATTAAAGA AAATACCAAA

301 AATGATAAAC AAATGGTGCA GTATATCTAT AAATATACCA GCTATCCGGA TCCGATTCTG CTGATGAAAA GCGCACGTAA TAGCTGTTGG AGCAAAGATG

401 CCGAATATGG TCTGTATAGC ATTTATCAGG GTGGCATTTT TGAACTGAAA GAAAATGATC GCATTTTTGT GAGCGTGACC AATGAACATC TGATTGATAT

501 GGATCATGAA GCCAGCTTTT TTGGTGCATT TCTGGTTGGT

실시예 27. 서열 번호 93의 융합 단백질

서열 번호 93의 단백질은 TRAIL95-281 서열의 C-말단에, 소포체를 향하는 서열(KDEL)이 그것의 C-말단에서 측면에 위치되고, 그 N-말단에서 가요성 글리신-세린 링커 (서열 번호 175)가 측면에 위치된, 전체 길이의 인간 RNAse A (서열 번호 32)가 효과기 펩티드로서 부착된, 459 아미노산의 길이 및 50.4 kDa의 질량을 갖는 융합 단백질이다. 추가로, 그 삼합체 구조를 안정화하기 위하여, TRAIL의 서열은 그 N-말단에서 글리신 잔기의 측면에 위치된 폴리시스테인 링커 (서열 번호 179)를 N-말단에 부착한다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 주어진 순서로, 가요성 글리신-세린 링커 (서열 번호 59), 페길레이션을 위한 링커 (서열 번호 170), 퓨린에 의해 인식되는 절단 부위의 서열 (서열 번호 53), 가요성 글리신-세린 링커 (서열 번호 65) 및 변형된 녹농균 전좌 도메인 (헬릭스 F 결실) 이 존재한다.

융합 단백질의 구조는 도 6에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 93 및 서열 번호 122이다.

전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.

실시예 28. 서열 번호 94의 융합 단백질

서열 번호 94의 단백질은 TRAIL95-281 서열의 N-말단에, Nur77 유도된 펩티드 (서열 번호 35)가 효과기 펩티드로서 부착된, 213 아미노산의 길이 및 24.7 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그 N-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52) 에 의해 인식되는 절단 부위의 서열이 존재한다.

실시예 29. 서열 번호 95의 융합 단백질 95

서열 번호 95의 단백질은 TRAIL116-281 서열의 N-말단에, 아주린 유도된 펩티드 (서열 번호 151)가 효과기 펩티드로서 부착된, 204 아미노산의 길이 및 23.1 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52) 에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 6에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 95 및 서열 번호 124이다.

실시예 30. 서열 번호 96의 융합 단백질 96

서열 번호 96의 단백질은 TRAIL120-281 서열의 C-말단에, 아주린 유도된 펩티드 (서열 번호 151)가 효과기 펩티드로서 부착된, 205 아미노산의 길이 및 23.3 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 퓨린 프로테아제 (서열 번호 172)에 의해 인식되고, 가요성 글리신-세린 링커 GGGS (서열 번호 58)에 의해 TRAIL 서열로부터 추가로 분리되는 절단 부위의 서열이 존재한다. 효과기 펩티드의 C-말단에는 소포체를 향하는 서열 KEDL (서열 번호 56)이 측면에 위치되며, 이는 전체 구조물의 C-말단 부분을 형성한다.

융합 단백질의 구조는 도 6에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 96 및 서열 번호 125이다.

실시예 31. 서열 번호 97의 융합 단백질

서열 번호 97의 단백질은 TRAIL120-281 서열의 C-말단에, 아주린 유도된 펩티드 (서열 번호 151)가 효과기 펩티드로서 부착된, 207 아미노산의 길이 및 23.1 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되고, 가요성 글리신-세린 링커 GGGSGGG (서열 번호 62)에 의해 TRAIL 서열로부터 추가로 분리되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 6에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 97 및 서열 번호 126이다.

실시예 32. 서열 번호 98의 융합 단백질

서열 번호 98의 단백질은 TRAIL120-281 서열의 C-말단에, 전체 길이의 아주린 펩티드 (서열 번호 152)가 효과기 펩티드로서 부착된, 327 아미노산의 길이 및 36.2 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되고, 가요성 글리신-세린 링커 GGGSGGG (서열 번호 62)에 의해 TRAIL 서열의 서열로부터 추가로 분리되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 7에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 98 및 서열 번호 127이다.

실시예 33. 서열 번호 99의 융합 단백질

서열 번호 99의 단백질은 TRAIL114-281 서열의 N-말단에, Smac/DIABLO 유도된 옥타머 펩티드 (서열 번호 39)가 효과기 펩티드로서 부착된, 199 아미노산의 길이 및 22.9 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 7에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 99 및 서열 번호 128이다.

실시예 34. 서열 번호 100의 융합 단백질

서열 번호 100의 단백질은 TRAIL95-281 서열의 N-말단에, Smac/DIABLO 유도된 옥타머 펩티드 (서열 번호 39)가 효과기 펩티드로서 부착된, 221 아미노산의 길이 및 25.2 kDa의 질량을 갖는 융합 단백질이다. 그 삼합체 구조를 안정화하기 위하여, TRAIL의 서열은 그 N-말단에 폴리시스테인 링커 (서열 번호 177)를 부착한다. 효과기 펩티드의 서열은 그것의 C-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 7에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 100 및 서열 번호 129이다.

실시예 35. 서열 번호 101의 융합 단백질

서열 번호 101의 단백질은 TRAIL95-281 서열의 N-말단에, Smac/DIABLO 유도된 옥타머 펩티드 (서열 번호 39)가 효과기 펩티드로서 부착된, 212 아미노산의 길이 및 24.5 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 7에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 101 및 서열 번호 130이다.

실시예 36. 서열 번호 102의 융합 단백질

서열 번호 102의 단백질은 TRAIL121-281 서열의 N-말단에, Bax 단백질 (서열 번호 153)의 BH3 도메인 및 aPP 단백질로부터 지정된 펩티드가 효과기 펩티드로서 부착된, 212 아미노산의 길이 및 24.5 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 6 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 7에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 102 및 서열 번호 131이다.

실시예 37. 서열 번호 103의 융합 단백질

서열 번호 103의 단백질은 TRAIL95-281 서열의 N-말단에, Bax 단백질 (서열 번호 153)의 BH3 도메인 및 aPP 단백질로부터 지정된 펩티드가 효과기 펩티드로서 부착된, 247 아미노산의 길이 및 28.1 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 6 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 그 삼합체 구조를 안정화하기 위하여, TRAIL의 서열은 그 N-말단에 폴리시스테인 링커 (서열 번호 177)를 부착한다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 8에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 103 및 서열 번호 132이다.

실시예 38. 서열 번호 104의 융합 단백질

서열 번호 104의 단백질은 TRAIL114-281 서열의 C-말단에, Bax 단백질 (서열 번호 153)의 BH3 도메인 및 aPP 단백질로부터 지정된 펩티드가 효과기 펩티드로서 부착된, 212 아미노산의 길이 및 24.4 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 8에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 104 및 서열 번호 133이다.

실시예 39. 서열 번호 105의 융합 단백질

서열 번호 105의 단백질은 TRAIL120-281 서열의 N-말단에, 레티쿨론 RTN1-C 유도된 펩티드 (서열 번호 155)가 효과기 펩티드로서 부착된, 221 아미노산의 길이 및 24.8 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 핵 국소화 서열(서열 번호 168)에 부착된다. 추가로, 그 삼합체 구조를 안정화하기 위하여, TRAIL의 서열은 그 N-말단에, 2 내지 3개의 글리신 잔기가 각각 그 N- 및 C-말단의 측면에 위치하는 폴리시스테인 링커 (서열 번호 179)를 부착한다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 8에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 105 및 서열 번호 134이다.

실시예 40. 서열 번호 106의 융합 단백질

서열 번호 106의 단백질은 TRAIL119-281 서열의 N-말단에, 레티쿨론 RTN1-C 유도된 펩티드 (서열 번호 156)가 효과기 펩티드로서 부착된, 435 아미노산의 길이 및 48 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 8 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 추가로, 그 삼합체 구조를 안정화하기 위하여, TRAIL의 서열은 그 N-말단에 폴리시스테인 링커 (서열 번호 178)를 부착한다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재하며, 절단 부위의 이러한 서열은 각각 그 N- 및 C-말단에 링커 서열 GGSGG (서열 번호 60)가 측면에 위치된다.

융합 단백질의 구조는 도 8에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 106 및 서열 번호 135이다.

실시예 41. 서열 번호 107의 융합 단백질

서열 번호 107의 단백질은 TRAIL121-281 서열의 C-말단에, 구성적으로 활성인 카스파제-3 (단일 사슬) (서열 번호 157)이 효과기 펩티드로서 부착된, 580 아미노산의 길이 및 65 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 슈도모나스(서열 번호 176)로부터 유도된 수송 도메인이 존재한다. 수송 도메인 및 효과기 펩티드의 서열은 가요성 링커 GGGSGGG (서열 번호 62)를 통해 연결된다. 수송 도메인은 퓨린 (서열 번호 53)에 의해 인식된 절단 부위의 서열에 의해 TRAIL의 서열로부터 분리되고, 이러한 절단 부위의 서열은 각각 그 N- 및 C-말단에 2개의 링커 서열 GGGGS (서열 번호 59) 및 ASGG (서열 번호 65)가 측면에 위치된다.

융합 단백질의 구조는 도 8에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 107 및 서열 번호 136이다.

실시예 42. 서열 번호 108의 융합 단백질

서열 번호 108의 단백질은 TRAIL119-281 서열의 N-말단에, Par-4 (서열 번호 158)로부터의 SAC 도메인이 효과기 펩티드로서 부착된, 247 아미노산의 길이 및 28.5 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 추가로, TRAIL의 서열은 그 N-말단에 가요성 글리신-세린 링커 GGSGG (서열 번호 60)를 부착한다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 173)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 9에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 108 및 서열 번호 137이다.

실시예 43. 서열 번호 109의 융합 단백질

서열 번호 109의 단백질은 TRAIL119-281 서열의 N-말단에, Par-4 (서열 번호 158)로부터의 SAC 도메인이 효과기 펩티드로서 부착된, 247 아미노산의 길이 및 28.5 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착되고, 그 N-말단에서 Oct6 전사 인자로부터의 NLS(핵 국지화 신호) 서열(서열 번호 168)에 부착된다. TRAIL의 서열은 그 N-말단에 가요성 글리신-세린 링커 GGSGG (서열 번호 60)를 부착한다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 173)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 9에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 109 및 서열 번호 138이다.

실시예 44. 서열 번호 110의 융합 단백질

서열 번호 110의 단백질은 TRAIL95-281 서열의 C-말단에, 녹사 단백질 (서열 번호 159)이 효과기 펩티드로서 부착된, 270 아미노산의 길이 및 30.8 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그 N-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 추가로, 그 삼합체 구조를 안정화하기 위하여, TRAIL의 서열은 그것의 C-말단에 폴리시스테인 링커 (서열 번호 177)를 부착하고, 가요성 글리신-세린 링커 GGSG (서열 번호 57)에 의해 TRAIL의 서열로부터 분리된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 9에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 110 및 서열 번호 139이다.

실시예 45. 서열 번호 111의 융합 단백질 111

서열 번호 111의 단백질은 TRAIL114-281 서열의 C-말단에, 녹사 단백질 (서열 번호 160)로부터 유도된 MTD/CKP 펩티드가 효과기 펩티드로서 부착된, 207 아미노산의 길이 및 23.7 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그 N-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 그 삼합체 구조를 안정화하기 위하여, TRAIL의 서열은 그것의 C-말단에 폴리시스테인 링커 (서열 번호 177)를 부착하고, 이 링커는 가요성 글리신-세린 링커 GGSG (서열 번호 57)에 의해 TRAIL의 서열로부터 분리된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 9에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 111 및 서열 번호 140이다.

실시예 46. 서열 번호 112의 융합 단백질

서열 번호 112의 단백질은 TRAIL95-281 서열의 N-말단에, 펩티드 온코나제 (서열 번호 41)가 효과기 펩티드로서 부착된, 311 아미노산의 길이 및 35 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되고, 2개의 가요성 글리신-세린 링커 GGGGS (서열 번호 59)에 의해 TRAIL의 서열로부터 추가로 분리되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 9에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 112 및 서열 번호 141이다.

실시예 47. 서열 번호 113의 융합 단백질

서열 번호 113의 단백질은 TRAIL95-281 서열의 N-말단에, PUMA 단백질 (서열 번호 37)로부터의 BH3 도메인이 효과기 펩티드로서 부착된, 230 아미노산의 길이 및 27 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 9 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 10에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 113 및 서열 번호 142이다.

실시예 48. 서열 번호 114의 융합 단백질

서열 번호 114의 단백질은 TRAIL95-281 서열의 C-말단에, Bid 단백질 (서열 번호 31)로부터 유도된 짧은 펩티드가 효과기 펩티드로서 부착된, 225 아미노산의 길이 및 25.7 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 수송 도메인 KPRRPY (서열 번호 167)에 부착된다. 그 삼합체 구조를 안정화하기 위하여, TRAIL의 서열은 그것의 C-말단에 폴리시스테인 링커 (서열 번호 177)를 부착한다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 10에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 114 및 서열 번호 143이다.

실시예 49. 서열 번호 115의 융합 단백질

서열 번호 115의 단백질은 TRAIL95-281 서열의 C-말단에, 짧은 하이브리드펩티드 Antp-TPR (서열 번호 161)이 효과기 펩티드로서 부착된, 234 아미노산의 길이 및 26.7 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되고, 그 삼합체 구조를 안정화하기 위하여 폴리시스테인 링커 (서열 번호 177)에 이어, 2개의 글리신 잔기에 의해 TRAIL 서열로부터 추가로 분리된 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 10에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 115 및 서열 번호 144이다.

실시예 50. 서열 번호 116의 융합 단백질

서열 번호 116의 단백질은 TRAIL120-281 서열의 N-말단에, Stat3 단백질 (서열 번호 162)의 SH2 도메인의 펩티드 억제제가 효과기 펩티드로서 부착된, 216 아미노산의 길이 및 24.3 kDa의 질량을 갖는 융합 단백질이다. 추가로, 그 삼합체 구조를 안정화하기 위하여, TRAIL 서열의 N-말단에는 폴리시스테인 링커 (서열 번호 179)가 부착되고, 상기 링커에는 각각 그 N- 및 C-말단에 3개의 글리신 잔기 및 GSG 모티프가 측면에 위치된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 10에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 116 및 서열 번호 145이다.

실시예 51. 서열 번호 117의 융합 단백질

서열 번호 117의 단백질은 TRAIL121-281 서열의 N-말단에, Bak 단백질 (서열 번호 163)의 BH3 도메인으로부터 유도된 펩티드가 효과기 펩티드로서 부착된, 194 아미노산의 길이 및 22,8 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.

융합 단백질의 구조는 도 10에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 117 및 서열 번호 146이다.

실시예 52. 서열 번호 118의 융합 단백질

서열 번호 118의 단백질은 TRAIL121-281 서열의 N-말단에, Bad 단백질 (서열 번호 164)의 BH3 도메인으로부터 유도된 펩티드가 효과기 펩티드로서 부착된, 257 아미노산의 길이 및 30 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 8 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다. TRAIL121-281의 서열의 C-말단에는 가요성 링커 GGSHG (서열 번호 182)에 이어서, 트롬빈 프로테아제 (서열 번호 174)에 의해 인식되는 절단 부위의 서열과, 전체 구조물의 C-말단 부분으로서, TRAIL95-121의 서열이 존재한다.

융합 단백질의 구조는 도 11에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 118 및 서열 번호 147이다.

실시예 53. 서열 번호 119의 융합 단백질

서열 번호 119의 단백질은 TRAIL95-281 서열의 C-말단에, Bad 단백질 (서열 번호 164)의 BH3 도메인으로부터 유도된 펩티드가 효과기 펩티드로서 부착된, 236 아미노산의 길이 및 27.5 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그 N-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재하고, TRAIL95-281의 서열의 C-말단은 GGS 잔기로 이루어진 링커에 의해 절단 부위의 서열로부터 추가로 분리된다.

융합 단백질의 구조는 도 11에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 119 및 서열 번호 148이다.

실시예 54. 서열 번호 120의 융합 단백질

서열 번호 120의 단백질은 TRAIL121-281 서열의 C-말단에, Bfl1 단백질 (서열 번호 165)로부터의 ATAP 펩티드가 효과기 펩티드로서 부착된, 216 아미노산의 길이 및 24.7 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그 N-말단에서 막 수송 도메인 KPRRPYR (서열 번호 181)에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재하고, 가요성 글리신-세린 링커 GGGGSGGGG (서열 번호 180)에 의해 TRAIL의 서열로부터 추가로 분리된다.

융합 단백질의 구조는 도 11에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 120 및 서열 번호 149이다.

실시예 55. 서열 번호 121의 융합 단백질

서열 번호 121의 단백질은 TRAIL121-281 서열의 N-말단에, Bfl1 단백질 (서열 번호 165)로부터의 ATAP 펩티드가 효과기 펩티드로서 부착된, 237 아미노산의 길이 및 27 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그 N-말단에서 미토콘드리아 타겟팅 서열(서열 번호 166)에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재하고, 가요성 글리신-세린 링커 GGSGG (서열 번호 60)에 의해 TRAIL의 서열로부터 추가로 분리된다.

융합 단백질의 구조는 도 11에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 121 및 서열 번호 150이다.

융합 단백질의 항암 활성의 시험

종양 세포주의 세포독성 분석으로 시험관 내 및 마우스에서 생체 내에서 융합 단백질의 항암 활성의 시험을 행하였다. 비교를 위해서, hTRAIL114-281 단백질 (이하 간단히 TRAIL로도 나타낸다)을 사용하였다.

1. 시험관 내 세포주 테스트

세포주

인간 대장암 Colo205 (ATCC # CCL-222), 소세포 폐암 A549 (ATCC # CCL-185), 췌장암 BxPC3 (ATCC # CRL-1687), 전립선암 DU145 (ATCC # HTB-81) 및 PC3 (ATCC # CRL-1435), 및 인간 대세포 폐암 NCI-H460-Luc2 (Caliper # 124316)의 세포를 10% 우태아 혈청으로 보충된 RPMI 1640 배지(Hyclone, Logan, UT, USA)에 두었다. 인간 난소암 세포 OVCAR-3 (ATCC # HTB-161)을 20% 우태아 혈청 및 0.01 mg / ml 인슐린으로 보충된 RPMI 1640 배지 (Hyclone, Logan, UT, USA)에 두었다. 방광암 세포 UM-UC-3 (ATCC # CRL-1749), 폐암 세포 SK-MES-1 (ATCC # HTB-58), 유방암 세포 MCF-7 (ATCC # HTB-22), HT1080 결합 조직 암 세포 ( ATCC # CCL-121), 간 헤파토마 HepG2 세포(ATCC # HB-8065)를 10% 우태아 혈청 (Hyclone, Logan, UT, USA)으로 보충된 MEM 배양액 배지 (Hyclone, Logan, UT, USA)에 두었다. 결합 조직 종양 세포 HT1080를 또한 실험 도중 조절된 배지 내에 유지하고, 이들 세포의 2-일 정상 배양액으로부터 얻었다. 인간 대장암 HCT-116 (ATCC # CCL-247) 및 HT-29 (HTB-38), 난소암 SK-OV-3 (ATCC # HTB-77), 자궁암 MES-SA (ATCC # CRL- 1976)의 세포 및 독소루비신에 대해 내성인 그의 클론 MES-SA/Dx5 (ATCC # CRL-1977)를 10% 우태아 혈청으로 보충된 맥코이 배지 (Hyclone, Logan, UT, USA)에 두었다. 방광 암 세포 SW780 (ATCC # CRL-2169), 유방암 세포 MDA-MB-231 (ATCC # HTB-26) 및 인간 췌장 암종 상피성 세포주 PANC-1, CLS (Cell line Service # 300228)를 10% 우태아 혈청으로 보충된 DMEM (Hyclone, Logan, UT, USA)에 두었다. 탯줄 정맥으로부터의 HUVEC 세포(ATCC # CRL-1730)를 20% 우태아 혈청, 성장 인자 0.02 mg/ml ECGS (Sigma), 0.1 mg/ml 헤파린(Sigma)으로 보충된 M199 배지 (Hyclone, Logan, UT, USA)에 두고, 이들 세포를 0.1% 젤라틴으로 코팅된 배지에서 생육하였다. MCF10A 유방 세포(ATCC # CRL-10317)를 5% 말 혈청, 0.5 mg/ml 히드로코르티손, 10 μg/ml 인슐린, 20 ng/ml 성장 인자 EGF (모두 Sigma, USA)로 보충된 DMEM: F12 (1:1) (Sigma, USA)에 두었다. 모든 배지에 2mM L-글루타민 및 항생물질 (100 U/ml 페니실린 및 100 mg/ml 스트렙토마이신 (Hyclone, Logan, UT, USA))을 추가로 보충하였다. 세포를 37℃에서 성장 배지 RPMI, MEM, McCoy 및 DMEM:F12의 경우에5% CO₂/공기에, DMEM의 경우에 10% CO₂/공기에 두었다. 키트 Venor®GeM 마이코플라스마 PCR 검출 키트(Minerva Biolabs, Berlin, Germany)를 사용한 PCR 기법을 사용하여 마이코플라스마의 존재에 대해 세포를 일상적으로 체크하였다.

MTT 세포독성 테스트

MTT 분석은 세포 증식, 생존능력 및 세포독성을 측정하기 위해 사용되는 비색 분석이다. 이는 미토콘드리아에 존재하는 효소 숙시네이트-테트라졸륨 환원효소에 의한 황색 테트라졸륨 염 MTT (4,5-디메틸-2-티아졸릴)-2,5-디페닐테트라졸륨 브로마이드)의 비수용성 보라색 염료 포르마잔으로의 분해로 구성된다. MTT 환원은 살아있는 세포에서만 일어난다. 데이터 분석은 단백질의, 대조군 세포 대비 처리된 모집단에서 세포 수의 50% 환원이 발생하는, IC₅₀ 농도의 측정으로 이루어진다(ng/ml로). 결과는 GraphPad Prism 5.0을 사용하여 분석하였다.

테스트는 문헌의 상세한 설명에 따라 수행하였다(Celis, JE, (1998). Cell Biology, a Laboratory Handbook, second edition, Academic Press, San Diego; Yang, Y., Koh, LW, Tsai, JH., (2004); Involvment of viral and chemical factors with oral cancer in Taiwan, Jpn J Clin Oncol, 34 (4), 176-183).

세포 배양 배지를 정해진 밀도(100 μl 당 10⁴ - 10⁵ 세포)로 희석하였다. 이어서 100 μl의 적절하게 희석된 세포 현탁액을 96-웰 플레이트에 3번 적용하였다. 그와 같이 제조된 세포를 사용된 배지에 따라 5% 또는 10% CO₂에서 24시간 동안 37℃에서 배양하고, 이어서 (100 μl의 배지 중) 상기 세포에 다양한 농도의 테스트 단백질을 함유하는 100 μl의 배지를 추가로 가하였다. 3-4회의 세포 분열에 상응하는 다음 72시간에 걸쳐 테스트 단백질과 함께 세포를 배양하고, 그 후 테스트 단백질을 갖는 배지에 MTT의 작업 용액[5 mg/ml] 20 ml를 가하고, 5% CO₂에서 3시간 동안 37℃에서 배양하였다. 이어서 MTT 용액의 배지를 제거하고, 100 μl 의 DMSO를 가하여 포르마잔 결정을 용해하였다. 혼합 후, 570 nm에서 흡광도를 측정하였다(레퍼런스 필터 690 nm).

시험관 내 세포독성 테스트의 결과를 표 1, 1a, 1b 및 표 2에 IC₅₀ 값 (ng/ml)으로서 요약하였으며, IC₅₀ 값은 용매만으로 배양된 대조군 세포에 대해 50% 수준에서 융합 단백질의 세포독성 효과가 관찰되는 단백질 농도에 해당한다. 각각의 실험은 3부로 행해진 2개 이상의 독립적인 실험의 평균값을 나타낸다. 단백질 제제의 활성 결여의 기준으로는 2000 ng/ml의 IC₅₀ 한도를 적용하였다. 2000을 넘는 IC₅₀ 값을 갖는 융합 단백질은 비활성인 것으로 간주하였다.

이러한 테스트를 위한 세포는, 종래의 항암제에 대해 내성인 암 세포주로서 독소루비신 라인 MES-SA/DX5에 대해 내성인 및 TRAIL 단백질에 대해 민감한 종양 세포주, TRAIL 단백질에 대해 천연적으로 내성인 종양 세포주를 포함하도록 선택하였다(TRAIL에 대해 천연적으로 내성의 기준 : TRAIL 단백질에 대한 IC₅₀ > 2000).

비-암세포에서 융합 단백질의 영향/독성의 평가를 위해 건강한 대조군 세포주로서 분화되지 않은 HUVEC 세포주를 사용하였다.

TRAIL에 대해 천연적으로 내성인 세포에 본 발명의 특정 융합 단백질을 투여함으로서 TRAIL에 대한 세포주의 내성 극복의 가능성을 얻어진 결과로 확인하였다. TRAIL에 대해 민감한 세포 내로 본 발명의 융합 단백질을 투여할 때, 일부의 경우 TRAIL 작용의 효능의 분명하고 강력한 강화가 관찰되었으며, TRAIL 단독에 대한 IC₅₀과의 비교시 융합 단백질의 IC₅₀ 값의 감소가 명백하였다. 더욱이, 일부의 경우 TRAIL의 활성보다 더 강력한, 전통적인 항암제 독소루비신에 대해 내성인 세포에서 본 발명의 융합 단백질의 세포독성 활성이 얻어졌다.

비-암세포주에 대해 얻어진 2000을 넘는 IC₅₀ 값은, 건강한 세포에 대해서는 본 발명의 단백질의 사용과 관련된 독성 작용이 없음을 나타내며, 이는 단백질의 전신 독성 가능성이 낮음을 나타낸다.

[표 1a]

[표 1b]

2. 확장된 패널의 종양 세포주에 대해 선택된 단백질 제제의 세포독성 활성의 분석

표 2는 브로드한 범위의 가장 일반적인 암에 상응하는, 상이한 장기로부터의 브로드한 패널의 종양 세포에 대해 선택된 본 발명의 융합 단백질의 시험관 내 세포독성 활성의 결과를 나타낸다. 얻어진 IC₅₀ 값으로, 융합 단백질의 높은 세포독성 활성과 그에 따른 암 치료에서의 잠재적 유용성을 확인하였다.

3. 이종이식에서 생체 내 융합 단백질의 항암 효능

인간 대장암 Colo205, 인간 대세포 폐암 NCI-H460-Luc2, 인간 폐암 A549, 및 인간 췌장암 PANC-1의 마우스 모델에서 단백질 제제의 항암 활성을 테스트하였다.

세포

Colo205 세포(ATCC # CCL-222)를 10% 우태아 혈청 및 2 mM 글루타민으로 보충된 Opti-MEM ((Invitrogen, Cat.22600-134)과 1:1 비율로 혼합된 RPMI 1640 배지 (Hyclone, Logan, UT, USA)에 두었다. 마우스 이식의 당일에, 트립신(Invitrogen)으로 세포를 세척하여 서포트로부터 세포를 분리하고, 이어서 세포를 1300 rpm, 4℃에서, 8분 동안 원심분리하고, HBSS 완충액 (Hanks 배지)에 현탁하고, 28.57x10⁶세포/ml의 농도까지 카운트 및 희석하였다. 이어서 상기 세포에 최종 세포 농도 25x10⁶ 세포/ml까지 Matrigel(BD Biocsciences, Cat.354 248)을 가하였다.

H460-Luc2 세포를 10% 우태아 혈청 및 2 mM 글루타민으로 보충된 RPMI 1640 배지 (HyClone, Logan, UT, USA)에 두었다. 마우스 이식의 당일에, 트립신(Invitrogen)으로 세포를 세척하여 서포트로부터 세포를 분리하고, 이어서 세포를 1300 rpm, 4℃에서, 8분 동안 원심분리하고, HBSS 완충액 (Hanks 배지)에 현탁하고, 50x10⁶세포/ml의 농도까지 카운트 및 희석하였다.

A549 세포를 10% 우태아 혈청 및 2 mM 글루타민으로 보충된 RPMI 1640 배지 (HyClone, Logan, UT, USA)에 두었다. 마우스 이식의 당일에, 트립신(Invitrogen)으로 세포를 세척하여 서포트로부터 세포를 분리하고, 이어서 세포를 1300 rpm, 4℃에서, 8분 동안 원심분리하고, HBSS 완충액 (Hanks 배지)에 현탁하였다.

인간 췌장암 PANC-1 세포를 10% 우태아 혈청 및 2 mM 글루타민으로 보충된 DMEM 배지 (HyClone, Logan, UT, USA)에 두었다. 마우스 이식의 당일에, 트립신(Invitrogen)으로 세포를 세척하여 서포트로부터 세포를 분리하고, 이어서 세포를 1300 rpm, 4℃에서, 8분 동안 원심분리하고, HBSS 완충액 (Hanks 배지)에 현탁하였다.

마우스

본 발명의 단백질의 항암 활성의 시험은 Harlan UK Ltd.,(Shaws Farm, Bicester, UK)로부터 입수한 7-9주령 NOD SCID 마우스로 수행하였다. A549, NCI-H460-Luc2 및 PANC-1 세포의 경우에, 본 발명의 단백질의 항암 활성의 시험은 Charles River Germany로부터 입수한 4-5주령 Crl:SHO-Prkdc^scidHr^hr 마우스로 수행하였다. 마우스를 음식물과 탈이온수에 대한 자유로운 접근(아드리비툼)과 함께 특별한 병원체가 없는 조건 하에 두었다. 동물에 대한 모든 실험은 New York Academy of Sciences' Ad Hoc Committee on Animal Research에 의해 발행되고, IV Local Ethics Committee on Animal Experimentation in Warsaw (No. 71/2009)에 의해 승인된 가이드라인: "Interdisciplinary Principles and Guidelines for the Use of Animals in Research, Marketing and Education"에 따라 행하였다.

실험 과정 및 평가

0일에 0.5 x 25 mm의 바늘(Bogmark)을 갖는 주사기로 0.15 ml HBSS 완충액 및 0.05 ml의 Matrigel에 현탁된 5x10⁶의 Colo205 세포를 마우스의 우측에 피하로(sc) 이식하였다. 종양이 ~ 90-140 mm³ (11일)의 크기에 도달할 때, 마우스를 임의로 추출하여 ~ 115 mm³의 그룹의 평균 종양 크기를 얻었고, 치료군으로 할당하였다. 치료군에 본 발명의 융합 단백질의 제제 및 비교로서 TRAIL114-281을 투여하였다. 11-20일에 제제를 복강내로(ip) 매일 10일 동안(qdx10) 투여하였다. 치료군의 평균 종양 크기가 ~ 2000 mm³에 도달할 때, 척수의 파괴로 마우스를 희생시켰다. 대조군은 TRAIL114-281을 받았다.

H460의 경우에, 0일에 0.5 x 25 mm의 바늘(Bogmark)을 갖는 주사기로 0.1 ml HBSS 완충액에 현탁된 5x10⁶의 NCI-H460-Luc2 세포를 마우스의 우측에 피하로(sc) 이식하였다. 종양이 ~ 100-120 mm³ (11일)의 크기에 도달할 때, 마우스를 임의로 추출하여 치료군으로 할당하였다. 치료군에 본 발명의 융합 단백질의 제제 및 비교로서 TRAIL114-281을 투여하였다. 제제를 이틀마다 하루 6회 정맥내로(i.v.) 투여하였다. 실험 29일째에 척수의 파괴로 마우스를 희생시켰다. 대조군은 TRAIL114-281을 받았다.

A549의 경우에, 0일에 0.5 x 25 mm의 바늘(Bogmark)을 갖는 주사기로 HBSS 완충액: Martigel의 3:1 비율로 된 혼합물 0.1 ml에 현탁된 7x10⁶의 A549 세포를 마우스의 우측에 피하로(sc) 이식하였다. 종양이 ~ 100-120 mm³ (17일)의 크기에 도달할 때, 마우스를 임의로 추출하여 치료군으로 할당하였다. 치료군에 본 발명의 융합 단백질의 제제 및 비교로서 TRAIL114-281을 투여하였다. 제제를 이틀마다 하루 6회 정맥내로(i.v.) 투여하였다. 실험 34일째에 척수의 파괴로 마우스를 희생시켰다. 대조군은 TRAIL114-281을 받았다.

PANC-1의 경우에, 0일에 0.5 x 25 mm의 바늘(Bogmark)을 갖는 주사기로 HBSS 완충액: Martigel의 3:1 비율로 된 혼합물 0.1 ml에 현탁된 7x10⁶의 A54PANC-1 세포를 마우스의 우측에 피하로(sc) 이식하였다. 종양이 ~ 95 mm³ (27일)의 크기에 도달할 때, 마우스를 임의로 추출하여 치료군으로 할당하였다. 치료군에 본 발명의 융합 단백질의 제제 및 비교로서 TRAIL114-281을 투여하였다. 제제를 이틀마다 하루 6회 정맥내로(i.v.) 투여하였다. 실험 43일째에 척수의 파괴로 마우스를 희생시켰다. 대조군은 TRAIL114-281을 받았다.

종양 크기는 전자 캘리퍼를 사용하여 측정하였고, 종양 체적은 식 : (a² x b)/2를 사용하여 계산하였으며, 여기서 a = 종양의 짧은 쪽 대각선(mm) 및 b = 종양의 긴 쪽 대각선(mm)이다. 종양 성장의 억제는 하기 식:

TGI [%] (종양 성장 억제) = (WT/WC) x 100 - 100%

을 사용하여 계산하였으며, 여기서 WT는 치료군에서 평균 종양 체적을 의미하고, WC는 대조군에서 평균 종양 체적을 의미한다.

실험 결과는 평균 값 ± 표준 편차(SD)로 제시된다. 모든 계산 및 그래프는 GraphPad Prism 5.0 프로그램을 사용하여 제작하였다.

실험 결과는 도 12 및 13에 본 발명의 융합 단백질 및 비교로 TRAIL114-281로 치료되는 Colo205 대장암이 존재하는 마우스 SCID/NOD에서 종양 체적 변화의 다이어그램으로 도시된다. 도 12 및 13에서 그래프로 제시된 실험 결과는, 실시예 1 및 실시예 14의 본 발명의 융합 단백질의 투여가, 실험 29일째에 대조군에 비해 각각 39% 및 32% TGI로, 종양 Colo205 성장 억제를 유발하였음을 도시한다. 참조 제제로서 사용된 TRAIL114-281에 대해서는, 9% 수준의 TGI로 대조군에 비해 종양 세포 성장에 대한 약간의 억제 효과가 얻어졌다. 따라서, 본 발명의 융합 단백질은 TRAIL에 비해 훨씬 더 강력한 효과를 발휘한다.

테스트된 융합 단백질은 마우스의 체중 감소에 의해 명백해지는 중요한 부작용을 일으키지 않았다(즉, 기준 체중의 10% 미만). 이는 단백질의 낮은 전신 독성을 보여준다.

도 14 및 15에 제시된 실험 결과는, 본 발명의 융합 단백질 및 비교로 TRAIL114-281로 치료되는 NCI-H460 인간 대세포 폐암이 존재하는 마우스 Crl:SHO-Prkdc^scidHr^hr에서 종양 체적 변화의 다이어그램을 도시한다. 이는 실시예 14 및 실시예 2의 본 발명의 융합 단백질의 투여에 의해, 실험 29일째에 대조군에 비해 각각 82% 및 81% TGI로, NCI-H460 종양 성장 억제를 얻었음을 볼 수 있다. 참조 제제로서 사용된 TRAIL114-281에 대해서는, 75% 수준의 TGI로 대조군에 비해 종양 세포 성장에 대한 약간의 억제 효과가 얻어졌다. 따라서, 본 발명의 융합 단백질은 TRAIL에 비해 이러한 암 세포에 대한 훨씬 더 강력한 효과를 발휘한다.

도 16 및 17에 제시된 실험 결과는, 본 발명의 융합 단백질 및 비교로 TRAIL114-281로 치료되는 A549 인간 폐암이 존재하는 마우스 Crl:SHO-Prkdc^scidHr^hr에서 종양 체적 변화의 다이어그램을 도시한다. 이는 실시예 14 및 실시예 2의 본 발명의 융합 단백질의 투여에 의해, 실험 29일째에 대조군에 비해 각각 48% 및 45.5% TGI로, A549 종양 성장 억제를 얻었음을 볼 수 있다. 참조 제제로서 사용된 TRAIL114-281에 대해서는, 20.7% 수준의 TGI로, 대조군에 비해 종양 세포 성장에 대한 약간의 억제 효과가 얻어졌다. 따라서, 본 발명의 융합 단백질은 TRAIL에 비해 훨씬 더 강력한 효과를 발휘한다.

도 18 및 19에 제시된 실험 결과는, 본 발명의 융합 단백질 및 비교로 TRAIL114-281로 치료되는 PANC-1 인간 췌장 암종, 상피성 세포가 존재하는 마우스 Crl:SHO-Prkdc^scidHr^hr에서 종양 체적 변화의 다이어그램을 도시한다. 이는 실시예 14 및 실시예 2의 본 발명의 융합 단백질의 투여에 의해, 실험 43일째에 대조군에 비해 각각 41.5% 및 49.8% TGI로, PANC-1 종양 성장 억제를 얻었음을 볼 수 있다. 참조 제제로서 사용된 TRAIL114-281에 대해서는, 32% 수준의 TGI로, 대조군에 비해 종양 세포 성장에 대한 약간의 억제 효과가 얻어졌다. 따라서, 본 발명의 융합 단백질은 TRAIL에 비해 훨씬 더 강력한 효과를 발휘한다.

원편광 이색성 - 본 발명의 융합 단백질 제제의 2차 구조 함량의 판정

그 구조의 관점에서 융합 단백질 제제 구조의 품질은 원편광 이색성 (CD)을 사용하여 2차 구조의 분석에 의해 판정하였다. CD 방법은 타원 편광의 외관 및 빛의 편광면 회전으로 명백해지는 단백질 구조의 광학 활성을 사용한다. 원자외선 (UV)에서 단백질의 CD 스펙트럼은 주 폴리펩티드 사슬의 입체구조에 대한 정확한 데이터를 제공한다.

실시예 1, 실시예 2, 실시예 14, 실시예 24, 실시예 51 및 실시예 42에서 제조된 단백질의 샘플을 50 mM Tris-HCl pH 8,0, 100 mM NaCl, 10% 글리세롤, 0,1 mM ZnCl2, 80 mM 이당류, 5mM DTT로 이루어진 완충액으로 제형화 후 컷 오프 12 kDa로, 투석 백(Sigma-Aldrich)에서 투석하였다. 4℃에서 몇 시간 동안, 단백질 제제와 비교하여 100배 과량 (v/v)의 완충액에 대해 교반하면서, 투석을 수행하였다. 투석을 완료한 후, 각각의 제제를 원심분리하고(25 000 rpm., 10 분, 4℃), 적절한 상청액을 수집하였다. 상기와 같이 얻어진 샘플 중 단백질 농도를 Bradford 법에 의해 판정하였다.

0.1-2.7 mg/ml 농도 범위의 단백질에 대한 원편광 이색성의 측정을, 0.2 mm 또는 1 mm의 광로를 갖는 석영 큐벳트에서 Jasco J-710 분광편광계로 수행하였다. 7 l/분의 질소의 흐름 하에서 측정을 수행하였으며, 이는 195 내지 250 nm의 파장 범위에서 측정을 행하는 것을 가능하게 한다.

측정의 파라미터 : 스펙트럼 해상도 - 1 nm; 광선의 반치폭 1 nm; 감도 20 mdeg, 1파장에 대한 평균 시간 - 8 초, 스캔 속도 10 nm/분.

3회 측정의 평균으로서 결과를 제시하였다. 실시예 1, 실시예 2, 실시예 14, 실시예 24, 실시예 51 및 실시예 42에 따른 단백질에 대한 원편광 이색성 스펙트럼을 도 20에 나타낸다.

얻어진 스펙트럼을 CDPro 팩을 사용하여 193-250 nm의 범위에서 수치로 분석하였다. 이러한 파장 범위에서 너무 낮은 신호에 기인한 노이즈 비율 때문에 광전자증배관에서의 전압이 700 V를 넘는 포인트는 생략하였다. 얻어진 데이터는 CDPro 프로그램 패키지를 사용하여, 분석된 단백질에서 특정의 2차 구조 함량의 산출을 제공한다(표 4).

대조군(rhTRAIL114-281)은 주로 β-시트 구조 타입을 갖는 단백질에 대한 특징적인 CD 스펙트럼을 나타낸다(220 nm 파장에서 최소인 급격한 윤곽의 타원률). 이것으로 2차 구조 성분의 산출이 확인되며, 이는 미미한 수의 α-헬릭스 성분을 제시한다. 얻어진 결과는 또한 TRAIL 단백질의 결정 구조로부터의 데이터와 부합하며, 그것에 의해 베타 성분은 그 조성의 절반이 넘게 구성된다. 실시예 1 및 실시예 42의 하이브리드 단백질의 경우, 이색성 스펙트럼은 파장 208 및 220 nm에서 2개의 최소값을 특징으로 하며, 이는 알파/베타 타입의 혼합된 2차 구조를 갖는 단백질에 대한 특징이다. 이는 아마도 TRAIL에 대한 도메인(예를 들어 Bax로부터의 BH3)의 부착에 기인하며, 이는 알파-헬릭스 구조를 형성하여, 분석된 키메라 단백질에서 2차 구조의 혼합된 본성이 그들의 존재를 확인할 수 있게 한다(실시예 42에 대해서 열악한 품질의 스펙트럼 때문에 이는 덜 선명함).

실시예 2, 실시예 51, 실시예 14 및 실시예 24의 제제에 대해서, 및 TRAIL 단백질에 대해서, 상당한 함량의 베타-타입 구조가 발견되었다. 이는 아마도 부착된 짧은 펩티드가 처음에 베타 구조를 갖거나 또는 구조화되지 않고, 그에 따라 그 조성에 크게 영향을 주지 않는다는 사실에 기인한다. 실시예 2의 단백질의 경우에, 알파 구조의 함량에서 약간의 증가가 또한 관찰되었다. 실시예 1의 단백질과 유사하게, 이는 좁은 범위의 파장에 기인하거나(원자외선에서 많은 양의 노이즈는 판독을 제외하였다) 또는 유사한 형태를 형성하는, BH3 도메인의 존재에 기인한 것일 수 있다. 분석된 스펙트럼의 영역에서 180-200 nm 범위의 급격한 윤곽의 결여는 α-헬릭스 구조의 과-함량을 초래할 수 있다.

SEQUENCE LISTING <110> Adamed Sp. z o.o. Pienkow 149, 05-152 Czosnow Poland Pieczykolan, Jerzy Szczepan Pawlak, Sebastian Dominik Zerek, Bartlomiej Maciej Lemke, Krzysztof Kazimierz <120> Anticancer fusion protein <130> P069/02/PCT <150> PL391627 <151> 2010-06-25 <160> 184 <170> PatentIn version 3.5 <210> 1 <211> 194 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 1 Lys Lys Leu Ser Glu Cys Leu Lys Arg Ile Gly Asp Glu Leu Asp Ser 1 5 10 15 Arg Arg Arg Arg Arg Arg Arg Arg Val Val Arg Pro Leu Gly Leu Ala 20 25 30 Gly Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr 35 40 45 Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile 50 55 60 Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu 65 70 75 80 His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr 85 90 95 Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn 100 105 110 Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser 115 120 125 Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp 130 135 140 Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile 145 150 155 160 Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu 165 170 175 His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu 180 185 190 Val Gly <210> 2 <211> 193 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 2 Arg Asn Ile Ala Arg His Leu Ala Gln Val Gly Asp Ser Met Asp Arg 1 5 10 15 Arg Arg Arg Arg Arg Arg Arg Val Val Arg Pro Leu Gly Leu Ala Gly 20 25 30 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 35 40 45 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 50 55 60 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 65 70 75 80 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 85 90 95 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 100 105 110 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 115 120 125 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 130 135 140 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 145 150 155 160 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 165 170 175 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 180 185 190 Gly <210> 3 <211> 303 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 3 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 1 5 10 15 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 20 25 30 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 35 40 45 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 50 55 60 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 65 70 75 80 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 85 90 95 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 100 105 110 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 115 120 125 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 130 135 140 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 145 150 155 160 Gly Gly Gly Ser Gly Pro Leu Gly Leu Ala Gly Arg Val Val Arg Lys 165 170 175 Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser Ser Thr 180 185 190 Ser Ala Ala Ser Ser Ser Asn Tyr Cys Asn Gln Met Met Lys Ser Arg 195 200 205 Asn Leu Thr Lys Asp Arg Cys Lys Pro Val Asn Thr Phe Val His Glu 210 215 220 Ser Leu Ala Asp Val Gln Ala Val Cys Ser Gln Lys Asn Val Ala Cys 225 230 235 240 Lys Asn Gly Gln Thr Asn Cys Tyr Gln Ser Tyr Ser Thr Met Ser Ile 245 250 255 Thr Asp Cys Arg Glu Thr Gly Ser Ser Lys Tyr Pro Asn Cys Ala Tyr 260 265 270 Lys Thr Thr Gln Ala Asn Lys His Ile Ile Val Ala Cys Glu Gly Asn 275 280 285 Pro Tyr Val Pro Val His Phe Asp Ala Ser Val Lys Glu Asp Leu 290 295 300 <210> 4 <211> 293 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 4 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 1 5 10 15 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 20 25 30 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 35 40 45 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 50 55 60 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 65 70 75 80 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 85 90 95 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 100 105 110 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 115 120 125 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 130 135 140 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 145 150 155 160 Gly Gly Gly Gly Ser Gly Gly Gly Ser Lys Glu Thr Ala Ala Ala Lys 165 170 175 Phe Glu Arg Gln His Met Asp Ser Ser Thr Ser Ala Ala Ser Ser Ser 180 185 190 Asn Tyr Cys Asn Gln Met Met Lys Ser Arg Asn Leu Thr Lys Asp Arg 195 200 205 Cys Lys Pro Val Asn Thr Phe Val His Glu Ser Leu Ala Asp Val Gln 210 215 220 Ala Val Cys Ser Gln Lys Asn Val Ala Cys Lys Asn Gly Gln Thr Asn 225 230 235 240 Cys Tyr Gln Ser Tyr Ser Thr Met Ser Ile Thr Asp Cys Arg Glu Thr 245 250 255 Gly Ser Ser Lys Tyr Pro Asn Cys Ala Tyr Lys Thr Thr Gln Ala Asn 260 265 270 Lys His Ile Ile Val Ala Cys Glu Gly Asn Pro Tyr Val Pro Val His 275 280 285 Phe Asp Ala Ser Val 290 <210> 5 <211> 283 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 5 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 1 5 10 15 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 20 25 30 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 35 40 45 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 50 55 60 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 65 70 75 80 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 85 90 95 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 100 105 110 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 115 120 125 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 130 135 140 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 145 150 155 160 Gly Gly Gly Ser Gly Pro Leu Gly Leu Ala Gly Arg Val Val Arg Gly 165 170 175 Asp Val Glu Lys Gly Lys Lys Ile Phe Ile Met Lys Cys Ser Gln Cys 180 185 190 His Thr Val Glu Lys Gly Gly Lys His Lys Thr Gly Pro Asn Leu His 195 200 205 Gly Leu Phe Gly Arg Lys Thr Gly Gln Ala Pro Gly Tyr Ser Tyr Thr 210 215 220 Ala Ala Asn Lys Asn Lys Gly Ile Ile Trp Gly Glu Asp Thr Leu Met 225 230 235 240 Glu Tyr Leu Glu Asn Pro Lys Lys Tyr Ile Pro Gly Thr Lys Met Ile 245 250 255 Phe Val Gly Ile Lys Lys Lys Glu Glu Arg Ala Asp Leu Ile Ala Tyr 260 265 270 Leu Lys Lys Ala Thr Asn Glu Lys Glu Asp Leu 275 280 <210> 6 <211> 407 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 6 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 1 5 10 15 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 20 25 30 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 35 40 45 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 50 55 60 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 65 70 75 80 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 85 90 95 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 100 105 110 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 115 120 125 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 130 135 140 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 145 150 155 160 Gly Gly Gly Gly Ser Arg Lys Lys Arg Ala Ser Gly Gly Pro Glu Gly 165 170 175 Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys His Leu Pro Leu 180 185 190 Glu Thr Phe Thr Arg His Arg Gln Pro Arg Gly Trp Glu Gln Leu Glu 195 200 205 Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu Tyr Leu Ala Ala 210 215 220 Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Ala Asn Ala Leu Ala 225 230 235 240 Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile Arg Glu Ser Pro 245 250 255 Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala Glu Ser Glu Arg 260 265 270 Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly Ala Ala Asn Gly 275 280 285 Pro Ala Asp Gly Gly Gly Ser Gly Gly Gly Met Gly Asp Val Glu Lys 290 295 300 Gly Lys Lys Ile Phe Ile Met Lys Cys Ser Gln Cys His Thr Val Glu 305 310 315 320 Lys Gly Gly Lys His Lys Thr Gly Pro Asn Leu His Gly Leu Phe Gly 325 330 335 Arg Lys Thr Gly Gln Ala Pro Gly Tyr Ser Tyr Thr Ala Ala Asn Lys 340 345 350 Asn Lys Gly Ile Ile Trp Gly Glu Asp Thr Leu Met Glu Tyr Leu Glu 355 360 365 Asn Pro Lys Lys Tyr Ile Pro Gly Thr Lys Met Ile Phe Val Gly Ile 370 375 380 Lys Lys Lys Glu Glu Arg Ala Asp Leu Ile Ala Tyr Leu Lys Lys Ala 385 390 395 400 Thr Asn Glu Lys Asp Glu Leu 405 <210> 7 <211> 409 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 7 Ile Ile Gly Gly His Val Ala Lys Pro His Ser Arg Pro Tyr Met Ala 1 5 10 15 Tyr Leu Met Ile Trp Asp Gln Lys Ser Leu Lys Arg Cys Gly Gly Phe 20 25 30 Leu Ile Arg Asp Asp Phe Val Leu Thr Ala Ala His Cys Trp Gly Ser 35 40 45 Ser Ile Asn Val Thr Leu Gly Ala His Asn Ile Lys Glu Gln Glu Pro 50 55 60 Thr Gln Gln Phe Ile Pro Val Lys Arg Ala Ile Pro His Pro Ala Tyr 65 70 75 80 Asn Pro Lys Asn Phe Ser Asn Asp Ile Met Leu Leu Gln Leu Glu Arg 85 90 95 Lys Ala Lys Arg Thr Arg Ala Val Gln Pro Leu Arg Leu Pro Ser Asn 100 105 110 Lys Ala Gln Val Lys Pro Gly Gln Thr Cys Ser Val Ala Gly Trp Gly 115 120 125 Gln Thr Ala Pro Leu Gly Lys His Ser His Thr Leu Gln Glu Val Lys 130 135 140 Met Thr Val Gln Glu Asp Arg Lys Cys Glu Ser Asp Leu Arg His Tyr 145 150 155 160 Tyr Asp Ser Thr Ile Glu Leu Cys Val Gly Asp Pro Glu Ile Lys Lys 165 170 175 Thr Ser Phe Lys Gly Asp Ser Gly Gly Pro Leu Val Cys Asn Lys Val 180 185 190 Ala Gln Gly Ile Val Ser Tyr Gly Arg Asn Asn Gly Met Pro Pro Arg 195 200 205 Ala Cys Thr Lys Val Ser Ser Phe Val His Trp Ile Lys Lys Thr Met 210 215 220 Lys Arg Tyr Gly Gly Gly Gly Ser Arg Lys Lys Arg Gly Gly Gly Gly 225 230 235 240 Ser Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly 245 250 255 Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu 260 265 270 Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly 275 280 285 His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile 290 295 300 His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe 305 310 315 320 Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln 325 330 335 Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys 340 345 350 Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr 355 360 365 Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile 370 375 380 Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala 385 390 395 400 Ser Phe Phe Gly Ala Phe Leu Val Gly 405 <210> 8 <211> 405 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 8 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 1 5 10 15 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 20 25 30 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 35 40 45 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 50 55 60 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 65 70 75 80 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 85 90 95 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 100 105 110 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 115 120 125 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 130 135 140 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 145 150 155 160 Gly Gly Gly Gly Ser Arg Lys Lys Arg Gly Gly Gly Gly Ser Ile Ile 165 170 175 Gly Gly His Val Ala Lys Pro His Ser Arg Pro Tyr Met Ala Tyr Leu 180 185 190 Met Ile Trp Asp Gln Lys Ser Leu Lys Arg Cys Gly Gly Phe Leu Ile 195 200 205 Arg Asp Asp Phe Val Leu Thr Ala Ala His Cys Trp Gly Ser Ser Ile 210 215 220 Asn Val Thr Leu Gly Ala His Asn Ile Lys Glu Gln Glu Pro Thr Gln 225 230 235 240 Gln Phe Ile Pro Val Lys Arg Ala Ile Pro His Pro Ala Tyr Asn Pro 245 250 255 Lys Asn Phe Ser Asn Asp Ile Met Leu Leu Gln Leu Glu Arg Lys Ala 260 265 270 Lys Arg Thr Arg Ala Val Gln Pro Leu Arg Leu Pro Ser Asn Lys Ala 275 280 285 Gln Val Lys Pro Gly Gln Thr Cys Ser Val Ala Gly Trp Gly Gln Thr 290 295 300 Ala Pro Leu Gly Lys His Ser His Thr Leu Gln Glu Val Lys Met Thr 305 310 315 320 Val Gln Glu Asp Arg Lys Cys Glu Ser Asp Leu Arg His Tyr Tyr Asp 325 330 335 Ser Thr Ile Glu Leu Cys Val Gly Asp Pro Glu Ile Lys Lys Thr Ser 340 345 350 Phe Lys Gly Asp Ser Gly Gly Pro Leu Val Cys Asn Lys Val Ala Gln 355 360 365 Gly Ile Val Ser Tyr Gly Arg Asn Asn Gly Met Pro Pro Arg Ala Cys 370 375 380 Thr Lys Val Ser Ser Phe Val His Trp Ile Lys Lys Thr Met Lys Arg 385 390 395 400 Tyr Lys Asp Glu Leu 405 <210> 9 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 9 Phe Ser Arg Ser Leu His Ser Leu Leu Arg Arg Arg Arg Arg Arg Arg 1 5 10 15 Arg Val Val Arg Pro Leu Gly Leu Ala Gly Arg Val Ala Ala His Ile 20 25 30 Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys 35 40 45 Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg 50 55 60 Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu 65 70 75 80 Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe 85 90 95 Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met 100 105 110 Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu 115 120 125 Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly 130 135 140 Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp 145 150 155 160 Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His 165 170 175 Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly 180 185 <210> 10 <211> 193 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 10 Gly Gln Val Gly Arg Gln Leu Ala Ile Ile Gly Asp Asp Ile Asn Arg 1 5 10 15 Arg Arg Arg Arg Arg Arg Arg Val Val Arg Pro Leu Gly Leu Ala Gly 20 25 30 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 35 40 45 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 50 55 60 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 65 70 75 80 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 85 90 95 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 100 105 110 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 115 120 125 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 130 135 140 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 145 150 155 160 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 165 170 175 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 180 185 190 Gly <210> 11 <211> 204 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 11 Glu Glu Gln Trp Ala Arg Glu Ile Gly Ala Gln Leu Arg Arg Met Ala 1 5 10 15 Asp Asp Leu Asn Ala Gln Tyr Glu Arg Arg Arg Arg Arg Arg Arg Arg 20 25 30 Arg Arg Val Val Arg Pro Leu Gly Leu Ala Gly Arg Val Ala Ala His 35 40 45 Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser 50 55 60 Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser 65 70 75 80 Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu 85 90 95 Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr 100 105 110 Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln 115 120 125 Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu 130 135 140 Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr 145 150 155 160 Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn 165 170 175 Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp 180 185 190 His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly 195 200 <210> 12 <211> 372 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 12 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 1 5 10 15 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 20 25 30 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 35 40 45 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 50 55 60 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 65 70 75 80 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 85 90 95 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 100 105 110 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 115 120 125 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 130 135 140 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 145 150 155 160 Gly Gly Gly Ser Gly Gly Pro Leu Gly Leu Ala Gly Arg Val Val Arg 165 170 175 Ala Arg Ala Arg Gln Glu Gly Ser Ser Pro Glu Pro Val Glu Gly Leu 180 185 190 Ala Arg Asp Gly Pro Arg Pro Phe Pro Leu Gly Arg Leu Val Pro Ser 195 200 205 Ala Val Ser Cys Gly Leu Cys Glu Pro Gly Leu Ala Ala Ala Pro Ala 210 215 220 Ala Pro Thr Leu Leu Pro Ala Ala Tyr Leu Cys Ala Pro Thr Ala Pro 225 230 235 240 Pro Ala Val Thr Ala Ala Leu Gly Gly Ser Arg Trp Pro Gly Gly Pro 245 250 255 Arg Ser Arg Pro Arg Gly Pro Arg Pro Asp Gly Pro Gln Pro Ser Leu 260 265 270 Ser Leu Ala Glu Gln His Leu Glu Ser Pro Val Pro Ser Ala Pro Gly 275 280 285 Ala Leu Ala Gly Gly Pro Thr Gln Ala Ala Pro Gly Val Arg Gly Glu 290 295 300 Glu Glu Gln Trp Ala Arg Glu Ile Gly Ala Gln Leu Arg Arg Met Ala 305 310 315 320 Asp Asp Leu Asn Ala Gln Tyr Glu Arg Arg Arg Gln Glu Glu Gln Gln 325 330 335 Arg His Arg Pro Ser Pro Trp Arg Val Leu Tyr Asn Leu Ile Met Gly 340 345 350 Leu Leu Pro Leu Pro Arg Gly His Arg Ala Pro Glu Met Glu Pro Asn 355 360 365 Lys Glu Asp Leu 370 <210> 13 <211> 493 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 13 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 1 5 10 15 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 20 25 30 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 35 40 45 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 50 55 60 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 65 70 75 80 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 85 90 95 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 100 105 110 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 115 120 125 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 130 135 140 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 145 150 155 160 Gly Gly Gly Gly Ser Arg Lys Lys Arg Ala Ser Gly Gly Pro Glu Gly 165 170 175 Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys His Leu Pro Leu 180 185 190 Glu Thr Phe Thr Arg His Arg Gln Pro Arg Gly Trp Glu Gln Leu Glu 195 200 205 Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu Tyr Leu Ala Ala 210 215 220 Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Ala Asn Ala Leu Ala 225 230 235 240 Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile Arg Glu Ser Pro 245 250 255 Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala Glu Ser Glu Arg 260 265 270 Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly Ala Ala Asn Gly 275 280 285 Pro Ala Asp Gly Gly Ser Gly Gly Gly Ala Arg Ala Arg Gln Glu Gly 290 295 300 Ser Ser Pro Glu Pro Val Glu Gly Leu Ala Arg Asp Gly Pro Arg Pro 305 310 315 320 Phe Pro Leu Gly Arg Leu Val Pro Ser Ala Val Ser Cys Gly Leu Cys 325 330 335 Glu Pro Gly Leu Ala Ala Ala Pro Ala Ala Pro Thr Leu Leu Pro Ala 340 345 350 Ala Tyr Leu Cys Ala Pro Thr Ala Pro Pro Ala Val Thr Ala Ala Leu 355 360 365 Gly Gly Ser Arg Trp Pro Gly Gly Pro Arg Ser Arg Pro Arg Gly Pro 370 375 380 Arg Pro Asp Gly Pro Gln Pro Ser Leu Ser Leu Ala Glu Gln His Leu 385 390 395 400 Glu Ser Pro Val Pro Ser Ala Pro Gly Ala Leu Ala Gly Gly Pro Thr 405 410 415 Gln Ala Ala Pro Gly Val Arg Gly Glu Glu Glu Gln Trp Ala Arg Glu 420 425 430 Ile Gly Ala Gln Leu Arg Arg Met Ala Asp Asp Leu Asn Ala Gln Tyr 435 440 445 Glu Arg Arg Arg Gln Glu Glu Gln Gln Arg His Arg Pro Ser Pro Trp 450 455 460 Arg Val Leu Tyr Asn Leu Ile Met Gly Leu Leu Pro Leu Pro Arg Gly 465 470 475 480 His Arg Ala Pro Glu Met Glu Pro Asn Lys Asp Glu Leu 485 490 <210> 14 <211> 186 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 14 Ala Val Pro Ile Ala Gln Lys Pro Arg Arg Arg Arg Arg Arg Arg Arg 1 5 10 15 Val Val Arg Pro Leu Gly Leu Ala Gly Arg Val Ala Ala His Ile Thr 20 25 30 Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn 35 40 45 Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser 50 55 60 Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val 65 70 75 80 Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg 85 90 95 Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val 100 105 110 Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met 115 120 125 Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu 130 135 140 Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg 145 150 155 160 Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu 165 170 175 Ala Ser Phe Phe Gly Ala Phe Leu Val Gly 180 185 <210> 15 <211> 191 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 15 Arg Ala Gly Leu Gln Phe Pro Val Gly Arg Leu Leu Arg Arg Leu Leu 1 5 10 15 Arg Arg Leu Leu Arg Val Val Arg Pro Leu Gly Leu Ala Gly Arg Val 20 25 30 Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser 35 40 45 Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp 50 55 60 Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg 65 70 75 80 Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser 85 90 95 Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn 100 105 110 Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp 115 120 125 Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp 130 135 140 Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu 145 150 155 160 Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile 165 170 175 Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly 180 185 190 <210> 16 <211> 279 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 16 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 1 5 10 15 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 20 25 30 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 35 40 45 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 50 55 60 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 65 70 75 80 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 85 90 95 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 100 105 110 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 115 120 125 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 130 135 140 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 145 150 155 160 Gly Gly Gly Ser Gly Pro Leu Gly Leu Ala Gly Arg Val Val Arg Gln 165 170 175 Asp Trp Leu Thr Phe Gln Lys Lys His Ile Thr Asn Thr Arg Asp Val 180 185 190 Asp Cys Asp Asn Ile Met Ser Thr Asn Leu Phe His Cys Lys Asp Lys 195 200 205 Asn Thr Phe Ile Tyr Ser Arg Pro Glu Pro Val Lys Ala Ile Cys Lys 210 215 220 Gly Ile Ile Ala Ser Lys Asn Val Leu Thr Thr Ser Glu Phe Tyr Leu 225 230 235 240 Ser Asp Cys Asn Val Thr Ser Arg Pro Cys Lys Tyr Lys Leu Lys Lys 245 250 255 Ser Thr Asn Lys Phe Cys Val Thr Cys Glu Asn Gln Ala Pro Val His 260 265 270 Phe Val Gly Val Gly Ser Cys 275 <210> 17 <211> 274 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 17 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 1 5 10 15 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 20 25 30 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 35 40 45 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 50 55 60 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 65 70 75 80 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 85 90 95 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 100 105 110 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 115 120 125 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 130 135 140 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 145 150 155 160 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Asp Trp Leu Thr Phe 165 170 175 Gln Lys Lys His Ile Thr Asn Thr Arg Asp Val Asp Cys Asp Asn Ile 180 185 190 Met Ser Thr Asn Leu Phe His Cys Lys Asp Lys Asn Thr Phe Ile Tyr 195 200 205 Ser Arg Pro Glu Pro Val Lys Ala Ile Cys Lys Gly Ile Ile Ala Ser 210 215 220 Lys Asn Val Leu Thr Thr Ser Glu Phe Tyr Leu Ser Asp Cys Asn Val 225 230 235 240 Thr Ser Arg Pro Cys Lys Tyr Lys Leu Lys Lys Ser Thr Asn Lys Phe 245 250 255 Cys Val Thr Cys Glu Asn Gln Ala Pro Val His Phe Val Gly Val Gly 260 265 270 Ser Cys <210> 18 <211> 197 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 18 Val Arg Arg Phe Leu Val Thr Leu Arg Ile Arg Arg Ala Cys Gly Pro 1 5 10 15 Pro Arg Val Arg Arg Arg Arg Arg Arg Arg Arg Val Val Arg Pro Leu 20 25 30 Gly Leu Ala Gly Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg 35 40 45 Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly 50 55 60 Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu 65 70 75 80 Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly 85 90 95 Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile 100 105 110 Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys 115 120 125 Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn 130 135 140 Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln 145 150 155 160 Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val 165 170 175 Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly 180 185 190 Ala Phe Leu Val Gly 195 <210> 19 <211> 189 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 19 Pro Arg Phe Met Asp Thr Trp Glu Gly Leu Asn Arg Arg Arg Arg Arg 1 5 10 15 Arg Arg Arg Val Val Arg Pro Leu Gly Leu Ala Gly Arg Val Ala Ala 20 25 30 His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn 35 40 45 Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser 50 55 60 Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly 65 70 75 80 Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr 85 90 95 Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys 100 105 110 Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile 115 120 125 Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu 130 135 140 Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu 145 150 155 160 Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met 165 170 175 Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly 180 185 <210> 20 <211> 195 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 20 Cys Glu Lys His Ile Met Glu Lys Ile Gln Gly Arg Gly Asp Asp Asp 1 5 10 15 Asp Arg Arg Arg Arg Arg Arg Arg Arg Val Val Arg Pro Leu Gly Leu 20 25 30 Ala Gly Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn 35 40 45 Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys 50 55 60 Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn 65 70 75 80 Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr 85 90 95 Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu 100 105 110 Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr 115 120 125 Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys 130 135 140 Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly 145 150 155 160 Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn 165 170 175 Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe 180 185 190 Leu Val Gly 195 <210> 21 <211> 218 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 21 Ala Val Pro Ile Ala Gln Lys Pro Arg Arg Arg Arg Arg Arg Arg Arg 1 5 10 15 Val Val Arg Pro Leu Gly Leu Ala Gly Arg Val Ala Ala His Ile Thr 20 25 30 Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn 35 40 45 Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser 50 55 60 Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val 65 70 75 80 Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg 85 90 95 Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val 100 105 110 Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met 115 120 125 Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu 130 135 140 Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg 145 150 155 160 Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu 165 170 175 Ala Ser Phe Phe Gly Ala Phe Leu Val Gly Pro Leu Gly Leu Ala Gly 180 185 190 Arg Val Val Arg Arg Arg Arg Arg Arg Arg Arg Leu Ala Leu Arg Leu 195 200 205 Ala Cys Ile Gly Asp Glu Met Asp Val Ser 210 215 <210> 22 <211> 199 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 22 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 1 5 10 15 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 20 25 30 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 35 40 45 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 50 55 60 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 65 70 75 80 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 85 90 95 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 100 105 110 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 115 120 125 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 130 135 140 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 145 150 155 160 Gly Arg Val Val Arg Pro Leu Gly Leu Ala Gly Ala Gly Ala Gly Gly 165 170 175 Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly Arg 180 185 190 Arg Arg Arg Arg Arg Arg Arg 195 <210> 23 <211> 289 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 23 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 1 5 10 15 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 20 25 30 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 35 40 45 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 50 55 60 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 65 70 75 80 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 85 90 95 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 100 105 110 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 115 120 125 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 130 135 140 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 145 150 155 160 Gly Gly Gly Gly Ser Gly Gly Arg Lys Lys Arg Met Thr Ile Ser Gln 165 170 175 Gln Glu Phe Gly Arg Thr Gly Leu Pro Asp Leu Ser Ser Met Thr Glu 180 185 190 Glu Glu Gln Ile Ala Tyr Ala Met Gln Met Ser Leu Gln Gly Ala Glu 195 200 205 Phe Gly Gln Ala Glu Ser Ala Asp Ile Asp Ala Ser Ser Ala Met Asp 210 215 220 Thr Ser Glu Pro Ala Lys Glu Glu Asp Asp Tyr Asp Val Met Gln Asp 225 230 235 240 Pro Glu Phe Leu Gln Ser Val Leu Glu Asn Leu Pro Gly Val Asp Pro 245 250 255 Asn Asn Glu Ala Ile Arg Asn Ala Met Gly Ser Leu Ala Ser Gln Ala 260 265 270 Thr Lys Asp Gly Lys Lys Asp Lys Lys Glu Glu Asp Lys Lys Glu Asp 275 280 285 Leu <210> 24 <211> 183 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 24 Val Ala Asn Pro Gln Ala Glu Gly Gln Leu Arg Val Val Arg Pro Leu 1 5 10 15 Gly Leu Ala Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg 20 25 30 Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala 35 40 45 Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser 50 55 60 Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu 65 70 75 80 Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu 85 90 95 Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile 100 105 110 Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala 115 120 125 Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile 130 135 140 Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val 145 150 155 160 Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe 165 170 175 Phe Gly Ala Phe Leu Val Gly 180 <210> 25 <211> 179 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 25 Leu Ala Asn Gly Val Glu Arg Val Val Arg Pro Leu Gly Leu Ala Gly 1 5 10 15 Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn 20 25 30 Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys 35 40 45 Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn 50 55 60 Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr 65 70 75 80 Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu 85 90 95 Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr 100 105 110 Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys 115 120 125 Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly 130 135 140 Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn 145 150 155 160 Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe 165 170 175 Leu Val Gly <210> 26 <211> 180 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 26 Cys Pro Ser Glu Gly Leu Cys Arg Val Val Arg Pro Leu Gly Leu Ala 1 5 10 15 Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser 20 25 30 Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg 35 40 45 Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser 50 55 60 Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe 65 70 75 80 Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys 85 90 95 Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr 100 105 110 Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser 115 120 125 Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly 130 135 140 Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr 145 150 155 160 Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala 165 170 175 Phe Leu Val Gly 180 <210> 27 <211> 168 <212> PRT <213> Homo sapiens <300> <308> P50591 <309> 1996-10-01 <313> (114)..(281) <400> 27 Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr 1 5 10 15 Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys 20 25 30 Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His 35 40 45 Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His 50 55 60 Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln 65 70 75 80 Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr 85 90 95 Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser 100 105 110 Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser 115 120 125 Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe 130 135 140 Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser 145 150 155 160 Phe Phe Gly Ala Phe Leu Val Gly 165 <210> 28 <211> 163 <212> PRT <213> Homo sapiens <300> <308> P50591 <309> 1996-10-01 <313> (119)..(281) <400> 28 Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn 1 5 10 15 Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys 20 25 30 Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn 35 40 45 Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr 50 55 60 Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu 65 70 75 80 Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr 85 90 95 Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys 100 105 110 Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly 115 120 125 Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn 130 135 140 Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe 145 150 155 160 Leu Val Gly <210> 29 <211> 161 <212> PRT <213> Homo sapiens <300> <308> P50591 <309> 1996-10-01 <313> (121)..(281) <400> 29 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 1 5 10 15 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 20 25 30 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 35 40 45 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 50 55 60 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 65 70 75 80 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 85 90 95 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 100 105 110 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 115 120 125 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 130 135 140 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 145 150 155 160 Gly <210> 30 <211> 16 <212> PRT <213> Homo sapiens <300> <308> GenBank/ AAF71267.1 <309> 2000-05-21 <313> (57)..(72) <400> 30 Lys Lys Leu Ser Glu Cys Leu Lys Arg Ile Gly Asp Glu Leu Asp Ser 1 5 10 15 <210> 31 <211> 15 <212> PRT <213> Homo sapiens <300> <308> GenBank/ AAH22072.2 <309> 2005-07-21 <313> (141)..(155) <400> 31 Arg Asn Ile Ala Arg His Leu Ala Gln Val Gly Asp Ser Met Asp 1 5 10 15 <210> 32 <211> 124 <212> PRT <213> Homo sapiens <300> <308> GenBank/ AAA72757.1 <309> 1993-08-30 <313> (33)..(156) <400> 32 Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser Ser 1 5 10 15 Thr Ser Ala Ala Ser Ser Ser Asn Tyr Cys Asn Gln Met Met Lys Ser 20 25 30 Arg Asn Leu Thr Lys Asp Arg Cys Lys Pro Val Asn Thr Phe Val His 35 40 45 Glu Ser Leu Ala Asp Val Gln Ala Val Cys Ser Gln Lys Asn Val Ala 50 55 60 Cys Lys Asn Gly Gln Thr Asn Cys Tyr Gln Ser Tyr Ser Thr Met Ser 65 70 75 80 Ile Thr Asp Cys Arg Glu Thr Gly Ser Ser Lys Tyr Pro Asn Cys Ala 85 90 95 Tyr Lys Thr Thr Gln Ala Asn Lys His Ile Ile Val Ala Cys Glu Gly 100 105 110 Asn Pro Tyr Val Pro Val His Phe Asp Ala Ser Val 115 120 <210> 33 <211> 104 <212> PRT <213> Homo sapiens <300> <308> GenBank/ AAH67222.1 <309> 2006-07-15 <313> (2)..(105) <400> 33 Gly Asp Val Glu Lys Gly Lys Lys Ile Phe Ile Met Lys Cys Ser Gln 1 5 10 15 Cys His Thr Val Glu Lys Gly Gly Lys His Lys Thr Gly Pro Asn Leu 20 25 30 His Gly Leu Phe Gly Arg Lys Thr Gly Gln Ala Pro Gly Tyr Ser Tyr 35 40 45 Thr Ala Ala Asn Lys Asn Lys Gly Ile Ile Trp Gly Glu Asp Thr Leu 50 55 60 Met Glu Tyr Leu Glu Asn Pro Lys Lys Tyr Ile Pro Gly Thr Lys Met 65 70 75 80 Ile Phe Val Gly Ile Lys Lys Lys Glu Glu Arg Ala Asp Leu Ile Ala 85 90 95 Tyr Leu Lys Lys Ala Thr Asn Glu 100 <210> 34 <211> 227 <212> PRT <213> Homo sapiens <300> <308> GenBank/ CAA01810.1 <309> 1995-10-17 <313> (1)..(227) <400> 34 Ile Ile Gly Gly His Val Ala Lys Pro His Ser Arg Pro Tyr Met Ala 1 5 10 15 Tyr Leu Met Ile Trp Asp Gln Lys Ser Leu Lys Arg Cys Gly Gly Phe 20 25 30 Leu Ile Arg Asp Asp Phe Val Leu Thr Ala Ala His Cys Trp Gly Ser 35 40 45 Ser Ile Asn Val Thr Leu Gly Ala His Asn Ile Lys Glu Gln Glu Pro 50 55 60 Thr Gln Gln Phe Ile Pro Val Lys Arg Ala Ile Pro His Pro Ala Tyr 65 70 75 80 Asn Pro Lys Asn Phe Ser Asn Asp Ile Met Leu Leu Gln Leu Glu Arg 85 90 95 Lys Ala Lys Arg Thr Arg Ala Val Gln Pro Leu Arg Leu Pro Ser Asn 100 105 110 Lys Ala Gln Val Lys Pro Gly Gln Thr Cys Ser Val Ala Gly Trp Gly 115 120 125 Gln Thr Ala Pro Leu Gly Lys His Ser His Thr Leu Gln Glu Val Lys 130 135 140 Met Thr Val Gln Glu Asp Arg Lys Cys Glu Ser Asp Leu Arg His Tyr 145 150 155 160 Tyr Asp Ser Thr Ile Glu Leu Cys Val Gly Asp Pro Glu Ile Lys Lys 165 170 175 Thr Ser Phe Lys Gly Asp Ser Gly Gly Pro Leu Val Cys Asn Lys Val 180 185 190 Ala Gln Gly Ile Val Ser Tyr Gly Arg Asn Asn Gly Met Pro Pro Arg 195 200 205 Ala Cys Thr Lys Val Ser Ser Phe Val His Trp Ile Lys Lys Thr Met 210 215 220 Lys Arg Tyr 225 <210> 35 <211> 9 <212> PRT <213> Homo sapiens <300> <308> GenBank/ EAW58223.1 <309> 2006-12-18 <313> (561)..(569) <400> 35 Phe Ser Arg Ser Leu His Ser Leu Leu 1 5 <210> 36 <211> 15 <212> PRT <213> Homo sapiens <300> <308> GenBank/ AAI10338.1 <309> 2009-03-18 <313> (72)..(86) <400> 36 Gly Gln Val Gly Arg Gln Leu Ala Ile Ile Gly Asp Asp Ile Asn 1 5 10 15 <210> 37 <211> 24 <212> PRT <213> Homo sapiens <300> <308> GenBank/ AAB51243.2 <309> 2001-09-26 <313> (130)..(153) <400> 37 Glu Glu Gln Trp Ala Arg Glu Ile Gly Ala Gln Leu Arg Arg Met Ala 1 5 10 15 Asp Asp Leu Asn Ala Gln Tyr Glu 20 <210> 38 <211> 192 <212> PRT <213> Homo sapiens <300> <308> GenBank/ AAB51243.2 <309> 2001-09-26 <313> (2)..(193) <400> 38 Ala Arg Ala Arg Gln Glu Gly Ser Ser Pro Glu Pro Val Glu Gly Leu 1 5 10 15 Ala Arg Asp Gly Pro Arg Pro Phe Pro Leu Gly Arg Leu Val Pro Ser 20 25 30 Ala Val Ser Cys Gly Leu Cys Glu Pro Gly Leu Ala Ala Ala Pro Ala 35 40 45 Ala Pro Thr Leu Leu Pro Ala Ala Tyr Leu Cys Ala Pro Thr Ala Pro 50 55 60 Pro Ala Val Thr Ala Ala Leu Gly Gly Ser Arg Trp Pro Gly Gly Pro 65 70 75 80 Arg Ser Arg Pro Arg Gly Pro Arg Pro Asp Gly Pro Gln Pro Ser Leu 85 90 95 Ser Leu Ala Glu Gln His Leu Glu Ser Pro Val Pro Ser Ala Pro Gly 100 105 110 Ala Leu Ala Gly Gly Pro Thr Gln Ala Ala Pro Gly Val Arg Gly Glu 115 120 125 Glu Glu Gln Trp Ala Arg Glu Ile Gly Ala Gln Leu Arg Arg Met Ala 130 135 140 Asp Asp Leu Asn Ala Gln Tyr Glu Arg Arg Arg Gln Glu Glu Gln Gln 145 150 155 160 Arg His Arg Pro Ser Pro Trp Arg Val Leu Tyr Asn Leu Ile Met Gly 165 170 175 Leu Leu Pro Leu Pro Arg Gly His Arg Ala Pro Glu Met Glu Pro Asn 180 185 190 <210> 39 <211> 8 <212> PRT <213> Homo sapiens <300> <308> GenBank/ EAW98311.1 <309> 2006-12-18 <313> (132)..(138) <400> 39 Ala Val Pro Ile Ala Gln Lys Pro 1 5 <210> 40 <211> 20 <212> PRT <213> Homo sapiens <300> <308> GenBank/ BAG35060.1 <309> 2008-05-24 <313> (21)..(36) <400> 40 Arg Ala Gly Leu Gln Phe Pro Val Gly Arg Leu Leu Arg Arg Leu Leu 1 5 10 15 Arg Arg Leu Leu 20 <210> 41 <211> 104 <212> PRT <213> Homo sapiens <300> <308> Swiss-Prot/ P22069.2 <309> 2010-03-02 <313> (1)..(104) <400> 41 Gln Asp Trp Leu Thr Phe Gln Lys Lys His Ile Thr Asn Thr Arg Asp 1 5 10 15 Val Asp Cys Asp Asn Ile Met Ser Thr Asn Leu Phe His Cys Lys Asp 20 25 30 Lys Asn Thr Phe Ile Tyr Ser Arg Pro Glu Pro Val Lys Ala Ile Cys 35 40 45 Lys Gly Ile Ile Ala Ser Lys Asn Val Leu Thr Thr Ser Glu Phe Tyr 50 55 60 Leu Ser Asp Cys Asn Val Thr Ser Arg Pro Cys Lys Tyr Lys Leu Lys 65 70 75 80 Lys Ser Thr Asn Lys Phe Cys Val Thr Cys Glu Asn Gln Ala Pro Val 85 90 95 His Phe Val Gly Val Gly Ser Cys 100 <210> 42 <211> 19 <212> PRT <213> Homo sapiens <300> <308> GenBank/ AAH15960.3 <309> 2008-11-30 <313> (18)..(36) <400> 42 Val Arg Arg Phe Leu Val Thr Leu Arg Ile Arg Arg Ala Cys Gly Pro 1 5 10 15 Pro Arg Val <210> 43 <211> 11 <212> PRT <213> Homo sapiens <300> <301> B?tger <303> Oncogene <304> 13 <306> 2141-2147 <307> 1996 <400> 43 Pro Arg Phe Met Asp Thr Trp Glu Gly Leu Asn 1 5 10 <210> 44 <211> 17 <212> PRT <213> Glycine max <300> <308> GenBank/ ACE36683.1 <309> 2008-07-10 <313> (43)..(59) <400> 44 Cys Glu Lys His Ile Met Glu Lys Ile Gln Gly Arg Gly Asp Asp Asp 1 5 10 15 Asp <210> 45 <211> 15 <212> PRT <213> Homo sapiens <300> <308> GenBank/ EAW98311.1 <309> 2006-12-18 <313> (132)..(138) <400> 45 Leu Ala Leu Arg Leu Ala Cys Ile Gly Asp Glu Met Asp Val Ser 1 5 10 15 <210> 46 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> artificial <300> <308> GenBank/ AAY41125.1 <309> 2006-01-06 <313> (148)..(167) <400> 46 Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala 1 5 10 15 Gly Gly Ala Gly 20 <210> 47 <211> 114 <212> PRT <213> Homo sapiens <300> <308> GenBank/ CAO72169.1 <309> 2009-01-13 <313> (79)..(191) <400> 47 Met Thr Ile Ser Gln Gln Glu Phe Gly Arg Thr Gly Leu Pro Asp Leu 1 5 10 15 Ser Ser Met Thr Glu Glu Glu Gln Ile Ala Tyr Ala Met Gln Met Ser 20 25 30 Leu Gln Gly Ala Glu Phe Gly Gln Ala Glu Ser Ala Asp Ile Asp Ala 35 40 45 Ser Ser Ala Met Asp Thr Ser Glu Pro Ala Lys Glu Glu Asp Asp Tyr 50 55 60 Asp Val Met Gln Asp Pro Glu Phe Leu Gln Ser Val Leu Glu Asn Leu 65 70 75 80 Pro Gly Val Asp Pro Asn Asn Glu Ala Ile Arg Asn Ala Met Gly Ser 85 90 95 Leu Ala Ser Gln Ala Thr Lys Asp Gly Lys Lys Asp Lys Lys Glu Glu 100 105 110 Asp Lys <210> 48 <211> 10 <212> PRT <213> Homo sapiens <300> <308> GenBank/ AAO21132.1 <309> 2003-01-18 <313> (93)..(102) <400> 48 Val Ala Asn Pro Gln Ala Glu Gly Gln Leu 1 5 10 <210> 49 <211> 6 <212> PRT <213> Homo sapiens <300> <308> GenBank/ AAO21132.1 <309> 2003-01-18 <313> (113)..(118) <400> 49 Leu Ala Asn Gly Val Glu 1 5 <210> 50 <211> 7 <212> PRT <213> Homo sapiens <300> <308> GenBank/ AAO21132.1 <309> 2003-01-18 <313> (127)..(131) <400> 50 Cys Pro Ser Glu Gly Leu Cys 1 5 <210> 51 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 51 Pro Leu Gly Leu Ala Gly 1 5 <210> 52 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 52 Arg Val Val Arg 1 <210> 53 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 53 Arg Lys Lys Arg 1 <210> 54 <211> 118 <212> PRT <213> Pseudomonas aeruginosa <400> 54 Pro Glu Gly Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys His 1 5 10 15 Leu Pro Leu Glu Thr Phe Thr Arg His Arg Gln Pro Arg Gly Trp Glu 20 25 30 Gln Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu Tyr 35 40 45 Leu Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Ala Asn 50 55 60 Ala Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile Arg 65 70 75 80 Glu Ser Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala Glu 85 90 95 Ser Glu Arg Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly Ala 100 105 110 Ala Asn Gly Pro Ala Asp 115 <210> 55 <211> 4 <212> PRT <213> Homo sapiens <400> 55 Lys Asp Glu Leu 1 <210> 56 <211> 4 <212> PRT <213> Homo sapiens <400> 56 Lys Glu Asp Leu 1 <210> 57 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 57 Gly Gly Ser Gly 1 <210> 58 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 58 Gly Gly Gly Ser 1 <210> 59 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 59 Gly Gly Gly Gly Ser 1 5 <210> 60 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 60 Gly Gly Ser Gly Gly 1 5 <210> 61 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 61 Gly Gly Gly Ser Gly Gly 1 5 <210> 62 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 62 Gly Gly Gly Ser Gly Gly Gly 1 5 <210> 63 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 63 Gly Gly Gly Ser Gly Gly Gly Ser 1 5 <210> 64 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 64 Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 <210> 65 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 65 Ala Ser Gly Gly 1 <210> 66 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> artificial <400> 66 Gly Gly Gly Ser Ala Ser Gly Gly 1 5 <210> 67 <211> 582 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 67 gcccaccaga aatgcaccaa aaaagctggc ttcatgatcc atatcaatca gatgttcatt 60 ggtcacgctc acaaaaatgc gatcattttc tttcagttca aaaatgccac cctgataaat 120 gctatacagg ccatattctg catctttgct ccaacagcta ttacgtgcgc ttttcatcag 180 cagaatcgga tccggatagc tggtatattt ataaatgtac tgcaccattt gtttatcatt 240 tttggtattt tctttaattt cttcctgaaa gcgaaaatag gtctggctat aaatataata 300 aaagcctttt tcatgaatca ccagttcacc attacgcaga tgcagattgc tcagaaagct 360 atgaccgcta cggctgcttt cccagctatt aattttgcga cccagggctt tttcattttt 420 gctattcggg ctgctcaggg tattgctacg accacgggtg ccggtaatat gtgctgcaac 480 acgacctgcc agacccagcg gacgaacaac acgacgacgg cgacgacgac gacggctatc 540 cagttcatca ccaatacgtt tcaggcattc gctcagtttt tt 582 <210> 68 <211> 579 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 68 cgtaatattg cacgtcatct ggcacaggtt ggtgatagca tggaccgtcg tcgtcgtcgc 60 cgtcgtcgtg ttgttcgtcc gctgggtctg gcaggtcgtg ttgcagcaca tattaccggc 120 acccgtggtc gtagcaatac cctgagcagc ccgaatagca aaaatgaaaa agccctgggt 180 cgcaaaatta atagctggga aagcagccgt agcggtcata gctttctgag caatctgcat 240 ctgcgtaatg gtgaactggt gattcatgaa aaaggctttt attatattta tagccagacc 300 tattttcgct ttcaggaaga aattaaagaa aataccaaaa atgataaaca aatggtgcag 360 tacatttata aatataccag ctatccggat ccgattctgc tgatgaaaag cgcacgtaat 420 agctgttgga gcaaagatgc agaatatggc ctgtatagca tttatcaggg tggcattttt 480 gaactgaaag aaaatgatcg catttttgtg agcgtgacca atgaacatct gattgatatg 540 gatcatgaag ccagcttttt tggtgcattt ctggtgggc 579 <210> 69 <211> 909 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 69 cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60 agcaaaaatg aaaaagccct gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120 catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180 ttttattata tttatagcca gacctatttt cgctttcagg aagaaattaa agaaaatacc 240 aaaaatgaca aacaaatggt gcagtatatc tacaaataca ccagctatcc ggatccgatt 300 ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggcctgtat 360 agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420 accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480 ggtggtggta gcggtccgct gggtctggca ggtcgtgttg ttcgtaaaga aaccgcagca 540 gccaaatttg aacgtcagca catggatagc agcaccagcg cagcaagcag cagcaattat 600 tgcaatcaga tgatgaaaag ccgcaatctg accaaagatc gttgtaaacc ggtgaatacc 660 tttgttcatg aaagcctggc agatgttcag gcagtttgca gccagaaaaa tgtggcctgt 720 aaaaatggtc agaccaattg ctatcagagc tatagcacca tgagcattac cgattgtcgt 780 gaaaccggta gcagcaaata tccgaattgc gcctataaaa ccacccaggc caataaacat 840 attattgtgg cctgtgaagg caatccgtat gttccggttc attttgatgc cagcgtgaaa 900 gaagatctg 909 <210> 70 <211> 879 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 70 cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60 agcaaaaatg aaaaagcact gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120 catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180 ttttattata tttatagcca gacctatttt cgctttcaag aagaaattaa agaaaatacc 240 aaaaatgata agcagatggt gcagtatatc tataaatata ccagctatcc ggatccgatt 300 ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360 agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420 accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480 ggtggtggtg gtagcggtgg tggtagtaaa gaaaccgcag cagcaaaatt tgaacgtcag 540 cacatggata gcagcaccag cgcagcaagc agcagcaatt attgtaatca gatgatgaaa 600 agccgcaatc tgaccaaaga tcgttgtaaa ccggtgaata cctttgttca tgaaagcctg 660 gcagatgttc aggcagtttg tagccagaaa aatgttgcct gtaaaaatgg tcagaccaat 720 tgctatcaga gctatagcac catgagcatt accgattgtc gtgaaaccgg tagcagcaaa 780 tatccgaatt gtgcatataa aaccacccag gccaataaac atattattgt tgcctgtgaa 840 ggcaatccgt atgttccggt tcattttgat gcaagcgtt 879 <210> 71 <211> 852 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 71 cagatcttct ttttcattgg tggctttttt cagataggca atcagatctg cgcgttcttc 60 ttttttttta atgcccacaa aaatcatttt cgtacccgga atatattttt tcggattttc 120 cagatattcc atcagggtat cttcacccca aataatgcct ttgtttttat tggctgcggt 180 atagctataa cccggtgcct gaccggtttt acgaccaaac agaccatgca gattcggacc 240 ggttttatgt ttgccacctt tttcaacggt atgacactgg ctgcatttca taataaaaat 300 ttttttgcct ttttccacat caccacgaac aacacgacct gccagaccca gcggaccgct 360 accaccacca accagaaatg caccaaaaaa gctggcttca tgatccatat caatcagatg 420 ttcattggtc acgctcacaa aaatgcgatc attttctttc agttcaaaaa tgccaccctg 480 ataaatgcta tacaggccat attctgcatc tttgctccaa cagctattac gtgcgctttt 540 catcagcaga atcggatccg gatagctggt atatttataa atgtactgca ccatttgttt 600 atcgtttttg gtattttctt taatttcttc ctgaaagcga aaataggtct ggctataaat 660 ataataaaag cctttttcat gaatcaccag ttcaccatta cgcagatgca gattgctcag 720 aaagctatga ccgctacggc tgctttccca gctattaatt ttgcgaccca gggctttttc 780 atttttgcta ttcgggctgc tcagggtatt gctacgacca cgggtgccgg taatatgtgc 840 tgcaacacgc at 852 <210> 72 <211> 800 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 72 cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60 agcaaaaatg aaaaagcact gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120 catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180 ttttattata tttatagcca gacctatttt cgctttcaag aagaaattaa agaaaatacc 240 aaaaatgaca aacaaatggt gcagtatatc tataaatata ccagctatcc ggatccgatt 300 ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360 agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420 accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480 ggtggtggtg gtagccgtaa aaaacgtgca agcggtggtc cggaaggtgg tagcctggca 540 gcactgaccg cacatcaggc atgtcatctg ccgctggaaa cctttacccg tcatcgtcag 600 cctcgtggtt gggaacagct ggaacagtgt ggttatccgg ttcagcgtct ggttgcactg 660 tatctggcag cacgtctgag ctggaatcag gttgatcagg ttattgcaaa tgcactggca 720 agtccgggta gcggtggtga tctgggtgaa gcaattcgtg aaagtccgga acaggcacgt 780 ctggcactga ccctggcagc 800 <210> 73 <211> 1215 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 73 cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60 agcaaaaatg aaaaagccct gggtcgtaaa attaatagct gggaaagcag ccgtagcggt 120 catagctttc tgagcaatct gcatctgcgt aatggcgaac tggtgattca tgaaaaaggc 180 ttttattata tttatagcca gacctatttt cgctttcagg aagaaattaa agaaaatacc 240 aaaaatgata aacaaatggt gcagtatatc tataaatata ccagctatcc ggatccgatt 300 ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgccgaata tggtctgtat 360 agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420 accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480 ggtggtggtg gtagccgtaa aaaacgtggt ggtggcggtt ctattattgg tggtcatgtt 540 gcaaaaccgc atagccgtcc gtatatggca tatctgatga tttgggatca gaaaagcctg 600 aaacgttgtg gtggctttct gattcgtgat gattttgttc tgaccgcagc acattgttgg 660 ggtagcagca ttaatgttac cctgggtgcc cataatatta aagaacagga accgacccag 720 cagtttattc cggttaaacg tgcaattccg catccggcat ataatccgaa aaattttagc 780 aatgatatca tgctgctgca gctggaacgt aaagcaaaac gtacccgtgc agttcagccg 840 ctgcgtctgc cgagcaataa agcacaggtt aaaccgggtc agacctgtag cgttgcaggt 900 tggggtcaga ccgcaccgct gggtaaacat tctcataccc tgcaagaggt taaaatgacc 960 gtccaagagg atcgtaaatg cgaaagcgat ctgcgccatt attatgatag caccattgaa 1020 ctgtgtgtgg gcgatccgga aatcaaaaaa accagcttta aaggtgatag cggtggtccg 1080 ctggtttgta ataaagttgc ccagggtatt gttagctatg gtcgtaataa tggtatgccg 1140 ccgcgtgcat gtaccaaagt tagcagcttt gtgcattgga ttaaaaaaac gatgaaacgc 1200 tataaagatg aactg 1215 <210> 74 <211> 1215 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 74 cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60 agcaaaaatg aaaaagcact gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120 catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180 ttttattata tttatagcca gacctatttt cgctttcaag aagaaattaa agaaaacacc 240 aaaaatgata aacaaatggt gcagtatatt tacaaatata ccagctatcc ggatccgatt 300 ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360 agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420 accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480 ggtggtggtg gtagccgtaa aaaacgtggt ggtggcggta gtattattgg tggtcatgtt 540 gcaaaaccgc atagccgtcc gtatatggca tatctgatga tttgggatca gaaaagcctg 600 aaacgttgtg gtggttttct gattcgtgat gattttgttc tgaccgcagc acattgttgg 660 ggtagcagca ttaatgttac cctgggtgcc cataatatta aagaacaaga accgacccag 720 cagtttattc cggttaaacg tgcaattccg catccggcat ataatccgaa aaattttagc 780 aatgatatta tgctgctgca gctggaacgc aaagcaaaac gtacccgtgc agttcagccg 840 ctgcgtctgc cgagcaataa agcacaggtt aaaccgggtc agacctgtag cgttgcaggt 900 tggggtcaga ccgcaccgct gggtaaacat tcacataccc tgcaagaggt gaaaatgacc 960 gttcaagagg atcgtaaatg cgaaagcgat ctgcgccatt attatgatag caccattgaa 1020 ctgtgtgttg gtgatccgga aattaaaaaa accagcttta aaggcgatag cggtggtccg 1080 ctggtttgta ataaagttgc acagggtatt gtgagctatg gtcgtaataa tggtatgcct 1140 ccgcgtgcat gtaccaaagt tagcagcttt gtgcattgga ttaaaaaaac gatgaaacgc 1200 tataaagatg aactg 1215 <210> 75 <211> 561 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 75 tttagccgta gcctgcatag cctgctgcgt cgtcgtcgtc gccgtcgtcg tgttgttcgt 60 ccgctgggtc tggcaggtcg tgttgcagca catattaccg gcacccgtgg tcgtagcaat 120 accctgagca gcccgaatag caaaaatgaa aaagccctgg gtcgcaaaat taatagctgg 180 gaaagcagcc gtagcggtca tagctttctg agcaatctgc atctgcgtaa tggtgaactg 240 gtgattcatg aaaaaggctt ttattatatt tatagccaga cctattttcg ctttcaggaa 300 gaaattaaag aaaataccaa aaatgataaa caaatggtgc agtacattta taaatatacc 360 agctatccgg atccgattct gctgatgaaa agcgcacgta atagctgttg gagcaaagat 420 gcagaatatg gcctgtatag catttatcag ggtggcattt ttgaactgaa agaaaatgat 480 cgcatttttg tgagcgtgac caatgaacat ctgattgata tggatcatga agccagcttt 540 tttggtgcat ttctggtggg c 561 <210> 76 <211> 579 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 76 ggtcaggttg gtcgtcagct ggcaattatt ggtgatgata ttaaccgtcg tcgtcgtcgc 60 cgtcgtcgtg ttgttcgtcc gctgggtctg gcaggtcgtg ttgcagcaca tattaccggc 120 acccgtggtc gtagcaatac cctgagcagc ccgaatagca aaaatgaaaa agccctgggt 180 cgcaaaatta atagctggga aagcagccgt agcggtcata gctttctgag caatctgcat 240 ctgcgtaatg gtgaactggt gattcatgaa aaaggctttt attatattta tagccagacc 300 tattttcgct ttcaggaaga aattaaagaa aataccaaaa atgataaaca aatggtgcag 360 tacatttata aatataccag ctatccggat ccgattctgc tgatgaaaag cgcacgtaat 420 agctgttgga gcaaagatgc agaatatggc ctgtatagca tttatcaggg tggcattttt 480 gaactgaaag aaaatgatcg catttttgtg agcgtgacca atgaacatct gattgatatg 540 gatcatgaag ccagcttttt tggtgcattt ctggtgggc 579 <210> 77 <211> 666 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 77 gaagaacagt gggcacgtga aattggtgca cagctgcgtc gtatggcaga tgatctgaat 60 gcacagtatg aacgtcgtcg tcgtcgccgt cggcgtcgtc gtgttgttcg tccgctgggt 120 ctggcaggtc gtgttgcagc acatattacc ggcacccgtg gtcgtagcaa taccctgagc 180 agcccgaata gcaaaaatga aaaagcactg ggtcgcaaaa tcaatagctg ggaaagcagc 240 cgtagcggtc atagctttct gagcaatctg catctgcgta atggtgaact ggtgattcat 300 gaaaaaggct tttattatat ttatagccag acctattttc gctttcaaga agagattaaa 360 gaaaatacca aaaatgataa acaaatggtg cagtatattt acaaatacac cagctatccg 420 gacccgattc tgctgatgaa aagcgcacgt aatagctgtt ggagcaaaga tgcagaatat 480 ggtctgtata gcatttatca gggtggcatc tttgagctga aagaaaatga tcgcatcttt 540 gttagcgtga ccaacgaaca tctgatcgat atggatcatg aagccagctt ttttggtgca 600 tttctggtgg gtctggttcc gcgtggtagc ggtagcagcc atcatcatca tcaccatagc 660 agcggt 666 <210> 78 <211> 1116 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 78 cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60 agcaaaaatg aaaaagcact gggtcgcaaa atcaatagct gggaaagcag ccgtagcggt 120 catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180 ttttattata tttatagcca gacctatttt cgctttcaag aagagattaa agaaaatacc 240 aaaaatgata aacaaatggt gcagtacatt tacaaatata ccagctatcc ggacccgatt 300 ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360 agcatttatc agggtggcat ctttgagctg aaagaaaatg atcgcatctt tgttagcgtg 420 accaacgaac atctgatcga tatggatcat gaagccagct tttttggtgc atttctggtt 480 ggtggtggta gcggtggtcc gctgggtctg gcaggtcgtg ttgttcgtgc ccgtgcgcgt 540 caagaaggta gcagtccgga accggttgaa ggtctggcac gtgatggtcc gcgtccgttt 600 ccgctgggtc gtctggttcc gagcgcagtt agctgtggtc tgtgtgaacc gggtctggca 660 gccgcaccgg cagcaccgac actgctgcct gcagcatatc tgtgtgcacc gaccgcaccg 720 cctgcagtta ccgcagcact gggtggtagc cgttggcctg gtggtccgcg tagtcgtccg 780 cgtggtcctc gtccggatgg tccgcagccg agcctgagcc tggcagaaca gcatctggaa 840 agtccggtgc cgagcgcacc gggtgcactg gcaggcggtc ctacacaggc agcaccgggt 900 gttcgtggtg aagaggaaca gtgggcacgt gaaattggtg cacagctgcg tcgtatggca 960 gatgatctga atgcacagta tgaacgtcgt cgtcaagaag aacagcagcg tcatcgtccg 1020 agcccgtggc gtgttctgta taatctgatt atgggtctgc tgccgctgcc tcgtggtcat 1080 cgtgcaccgg aaatggaacc gaataaagaa gatctg 1116 <210> 79 <211> 1479 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 79 cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60 agcaaaaatg aaaaagcact gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120 catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180 ttttattata tttatagcca gacctatttt cgctttcaag aagaaattaa agaaaatacc 240 aaaaatgata agcagatggt gcagtatatc tataaatata ccagctatcc ggatccgatt 300 ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360 agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420 accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480 ggtggtggtg gtagccgtaa aaaacgtgca agcggtggtc cggaaggtgg tagcctggca 540 gcactgaccg cacatcaggc atgtcatctg ccgctggaaa cctttacccg tcatcgtcag 600 cctcgtggtt gggaacagct ggaacagtgt ggttatccgg ttcagcgtct ggttgcactg 660 tatctggcag cacgtctgag ctggaatcag gttgatcagg ttattgcaaa tgcactggca 720 agtccgggta gcggtggtga tctgggtgaa gcaattcgtg aaagtccgga acaggcacgt 780 ctggcactga ccctggcagc agcagaaagc gaacgttttg ttcgtcaggg caccggtaat 840 gatgaagccg gtgcagcaaa tggtccggca gatggtggta gtggtggtgg tgcacgtgct 900 cgtcaagaag gtagcagtcc ggaaccggtt gaaggtctgg cacgtgacgg tccgcgtccg 960 tttccgctgg gtcgtctggt tccgagcgca gttagctgtg gtctgtgtga accgggtctg 1020 gcagccgcac cggcagcacc gacactgctg cctgcagcat atctgtgtgc accgaccgca 1080 ccgcctgcag ttaccgcagc actgggtggt agtcgttggc ctggtggtcc gcgtagtcgt 1140 ccgcgtggtc cgcgtccgga tggtccgcag ccgagtctga gcctggcaga acagcatctg 1200 gaaagtcctg tgccgagcgc accgggtgca ctggcaggcg gtccgacaca ggcagcacct 1260 ggtgttcgtg gtgaagaaga acagtgggca cgcgaaattg gtgcacagct gcgtcgtatg 1320 gcagatgatc tgaatgcaca gtatgaacgt cgtcgtcaag aagaacagca gcgtcatcgt 1380 ccgagcccgt ggcgtgttct gtataatctg attatgggtc tgctgccgct gcctcgtggt 1440 catcgtgcac cggaaatgga accgaataaa gatgaactg 1479 <210> 80 <211> 558 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 80 gcagttccga ttgcacagaa accgcgtcgt cgtcgtcgcc gtcgtcgtgt tgttcgtccg 60 ctgggtctgg caggtcgtgt tgcagcacat attaccggca cccgtggtcg tagcaatacc 120 ctgagcagcc cgaatagcaa aaatgaaaaa gccctgggtc gcaaaatcaa tagctgggaa 180 agcagccgta gcggtcatag ctttctgagc aatctgcatc tgcgtaatgg tgaactggtg 240 attcatgaaa aaggctttta ctatatctat agccagacct acttccgctt tcaggaagaa 300 attaaagaaa ataccaaaaa tgataaacaa atggtgcagt atatctataa atataccagc 360 tatccggatc cgattctgct gatgaaaagc gcacgtaata gctgttggag caaagatgca 420 gaatatggcc tgtatagcat ttatcagggt ggcatttttg aactgaaaga aaatgatcgc 480 atttttgtga gcgtgaccaa tgaacatctg attgatatgg atcatgaagc cagctttttt 540 ggtgcatttc tggtgggt 558 <210> 81 <211> 627 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 81 cgtgcaggtc tgcagtttcc ggttggacgt ctgttacgtc gcctgctgcg tcgtctgctg 60 cgcgttgttc gtccgctggg tctggcaggt cgtgttgcag cacatattac cggcacccgt 120 ggtcgtagca ataccctgag cagcccgaat agcaaaaatg aaaaagcact gggtcgcaaa 180 atcaatagct gggaaagcag ccgtagcggt catagctttc tgagcaatct gcatctgcgt 240 aatggtgaac tggtgattca tgaaaaaggc ttttattata tttatagcca gacctatttt 300 cgctttcaag aagagattaa agaaaatacc aaaaatgata aacaaatggt gcagtacatt 360 tacaaatata ccagctatcc ggacccgatt ctgctgatga aaagcgcacg taatagctgt 420 tggagcaaag atgcagaata tggtctgtat agcatttatc agggtggcat ctttgagctg 480 aaagaaaatg atcgcatctt tgttagcgtg accaacgaac atctgatcga tatggatcat 540 gaagccagct tttttggtgc atttctggtg ggtctggttc cgcgtggtag cggtagcagc 600 catcatcatc atcaccatag cagcggt 627 <210> 82 <211> 837 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 82 cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60 agcaaaaatg aaaaagcact gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120 catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180 ttttattata tttatagcca gacctatttt cgctttcaag aagaaattaa agaaaatacc 240 aaaaatgata agcagatggt gcagtatatc tataaatata ccagctatcc ggatccgatt 300 ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360 agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420 accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480 ggtggtggta gcggtccgct gggtctggca ggtcgtgttg ttcgtcagga ttggctgacc 540 tttcagaaaa aacatattac caatacccgt gatgtggatt gcgataatat tatgagcacc 600 aacctgtttc attgcaaaga taaaaatacc tttatttata gccgtccgga accggttaaa 660 gcaatttgta aaggtattat tgccagcaaa aatgtgctga ccacgagcga attctatctg 720 agcgattgta atgttaccag ccgtccgtgt aaatataaac tgaaaaaaag caccaataaa 780 ttttgcgtga cctgcgaaaa tcaggcaccg gttcattttg ttggtgttgg tagctgt 837 <210> 83 <211> 822 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 83 cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60 agcaaaaatg aaaaagcact gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120 catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180 ttttattata tttatagcca gacctatttt cgctttcaag aagaaattaa agaaaatacc 240 aaaaatgata agcagatggt gcagtatatc tataaatata ccagctatcc ggatccgatt 300 ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360 agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420 accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480 ggtggtggtg gtagcggtgg tggtggcagc caggattggc tgacctttca gaaaaaacat 540 attaccaata cccgtgatgt ggattgcgat aatattatga gcaccaacct gtttcattgc 600 aaagataaaa atacctttat ttatagccgt ccggaaccgg ttaaagcaat ttgtaaaggt 660 attattgcca gcaaaaatgt gctgaccacg agcgaattct atctgagcga ttgtaatgtt 720 accagccgtc cgtgtaaata taaactgaaa aaaagcacca ataaattttg cgtgacctgc 780 gaaaatcagg caccggttca ttttgttggt gttggtagct gt 822 <210> 84 <211> 591 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 84 gttcgtcgtt ttctggttac cctgcgtatt cgtcgtgcat gtggtcctcc gcgtgtgcgt 60 cgtcgtcgtc gccgtcgtcg tgttgttcgt cctctgggtc tggcaggtcg cgttgcagca 120 catattaccg gcacccgtgg tcgtagcaat accctgagca gcccgaatag caaaaatgaa 180 aaagccctgg gtcgcaaaat taatagctgg gaaagcagcc gtagcggtca tagctttctg 240 agcaatctgc atctgcgtaa tggtgaactg gtgattcatg aaaaaggctt ttattatatt 300 tatagccaga cctattttcg ctttcaggaa gaaattaaag aaaataccaa aaatgataaa 360 caaatggtgc agtatatcta taaatatacc agctatccgg atccgattct gctgatgaaa 420 agcgcacgta atagctgttg gagcaaagat gcagaatatg gcctgtatag catttatcag 480 ggtggcattt ttgaactgaa agaaaatgat cgcatttttg tgagcgtgac caatgaacat 540 ctgattgata tggatcatga agccagcttt tttggtgcat ttctggttgg t 591 <210> 85 <211> 567 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 85 cctcgtttta tggatacctg ggaaggtctg aatcgccgtc ggcgtcgtcg gcgtcgtgtt 60 gttcgtccgc tgggtctggc aggtcgtgtt gcagcacata ttaccggcac ccgtggtcgt 120 agcaataccc tgagcagccc gaatagcaaa aatgaaaaag cactgggtcg caaaattaat 180 agctgggaaa gcagccgtag cggtcatagc tttctgagca atctgcatct gcgtaatggt 240 gaactggtga ttcatgaaaa aggcttttat tatatttata gccagaccta ttttcgcttt 300 caggaagaaa ttaaagaaaa taccaaaaat gataaacaaa tggtgcagta catttacaaa 360 tataccagct atccggatcc gattctgctg atgaaaagcg cacgtaatag ctgttggagc 420 aaagatgcag aatatggtct gtatagcatt tatcagggtg gcatttttga actgaaagaa 480 aatgatcgca tttttgtgag cgtgaccaat gaacatctga ttgatatgga tcatgaagcc 540 agcttttttg gtgcatttct ggttggt 567 <210> 86 <211> 585 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 86 tgtgaaaaac atattatgga aaaaattcag ggtcgcggtg atgatgatga tcgccgtcgg 60 cgtcgtcggc gtcgtgttgt tcgtccgctg ggtctggcag gtcgtgttgc agcacatatt 120 accggcaccc gtggtcgtag caataccctg agcagcccga atagcaaaaa tgaaaaagca 180 ctgggtcgca aaattaatag ctgggaaagc agccgtagcg gtcatagctt tctgagcaat 240 ctgcatctgc gtaatggtga actggtgatt catgaaaaag gcttttatta tatttatagc 300 cagacctatt ttcgctttca ggaagaaatt aaagaaaata ccaaaaatga taaacaaatg 360 gtgcagtaca tttacaaata taccagctat ccggatccga ttctgctgat gaaaagcgca 420 cgtaatagct gttggagcaa agatgcagaa tatggtctgt atagcattta tcagggtggc 480 atttttgaac tgaaagaaaa tgatcgcatt tttgtgagcg tgaccaatga acatctgatt 540 gatatggatc atgaagccag cttttttggt gcatttctgg ttggt 585 <210> 87 <211> 654 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 87 gcagttccga ttgcacagaa accgcgtcgt cgtcgtcgcc gtcgtcgtgt tgttcgtcct 60 ctgggtctgg caggtcgcgt tgcagcacat attaccggca cccgtggtcg tagcaatacc 120 ctgagcagcc cgaatagcaa aaatgaaaaa gccctgggtc gcaaaattaa tagctgggaa 180 agcagccgta gcggtcatag ctttctgagc aatctgcatc tgcgtaatgg tgaactggtg 240 attcatgaaa aaggctttta ttatatttat agccagacct attttcgctt tcaggaagaa 300 attaaagaaa ataccaaaaa tgataaacaa atggtgcagt atatctataa atataccagc 360 tatccggatc cgattctgct gatgaaaagc gcacgtaata gctgttggag caaagatgca 420 gaatatggcc tgtatagcat ttatcagggt ggcatttttg aactgaaaga aaatgatcgc 480 atttttgtga gcgtgaccaa tgaacatctg attgatatgg atcatgaagc cagctttttt 540 ggtgcatttc tggttggtcc gctgggcctg gctggccgtg tggttcgccg gcgccgtcgc 600 cgtcgccgcc tggcactgcg tctggcatgt attggtgatg aaatggatgt gagc 654 <210> 88 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 88 cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60 agcaaaaatg aaaaagcact gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120 catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180 ttttattata tttatagcca gacctatttt cgctttcaag aagaaattaa agaaaacacc 240 aaaaatgata aacaaatggt gcagtatatt tacaaatata ccagctatcc ggatccgatt 300 ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360 agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420 accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480 ggtggtggtg gtagcggtgg tggtcgtgtt gttcgtccgc tgggtctggc tggtgccggt 540 gccggtggtg gtgcaggcgg tgctggtgcg ggtggcggag ccggtggtgc aggtcgtcgt 600 cgtcgccgtc gtcggcgt 618 <210> 89 <211> 867 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 89 cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60 agcaaaaatg aaaaagcact gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120 catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180 ttttattata tttatagcca gacctatttt cgctttcaag aagaaattaa agaaaacacc 240 aaaaatgata aacaaatggt gcagtatatt tacaaatata ccagctatcc ggatccgatt 300 ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360 agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420 accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480 ggtggtggtg gtagcggtgg tcgtaaaaaa cgtatgacca ttagccagca agaatttggt 540 cgtaccggtc tgccggatct gagcagcatg accgaagaag aacaaattgc ctacgcaatg 600 cagatgagcc tgcagggtgc agaatttggt caggcagaaa gcgcagatat tgatgcaagc 660 agcgcaatgg ataccagcga accggcaaaa gaagaagacg attacgacgt tatgcaggat 720 ccggaatttc tgcagagcgt tctggaaaat ctgccgggtg ttgatccgaa taatgaagca 780 attcgtaatg caatgggtag cctggcaagc caagcaacca aagatggcaa aaaagataaa 840 aaagaggaag acaaaaaaga agatctg 867 <210> 90 <211> 549 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 90 gttgcaaatc cgcaggcaga aggtcagctg cgcgttgttc gtccgctggg tctggcaggt 60 ccgcagcgtg ttgcagcaca tattaccggc acccgtggtc gtagcaatac cctgagcagc 120 ccgaatagca aaaatgaaaa agccctgggt cgtaaaatta atagctggga aagcagccgt 180 agcggtcata gctttctgag caatctgcat ctgcgtaatg gcgaactggt gattcatgaa 240 aaaggctttt attatattta tagccagacc tattttcgct ttcaggaaga aattaaagaa 300 aataccaaaa atgataaaca aatggtgcag tatatctata aatataccag ctatccggat 360 ccgattctgc tgatgaaaag cgcacgtaat agctgttgga gcaaagatgc cgaatatggt 420 ctgtatagca tttatcaggg tggcattttt gaactgaaag aaaatgatcg catttttgtg 480 agcgtgacca atgaacatct gattgatatg gatcatgaag ccagcttttt tggtgcattt 540 ctggttggt 549 <210> 91 <211> 537 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 91 ctggcaaatg gtgttgaacg tgttgttcgt ccgctgggtc tggcaggtcc gcagcgtgtt 60 gcagcacata ttaccggcac ccgtggtcgt agcaataccc tgagcagccc gaatagcaaa 120 aatgaaaaag ccctgggtcg taaaattaat agctgggaaa gcagccgtag cggtcatagc 180 tttctgagca atctgcatct gcgtaatggc gaactggtga ttcatgaaaa aggcttttat 240 tatatttata gccagaccta ttttcgcttt caggaagaaa ttaaagaaaa taccaaaaat 300 gataaacaaa tggtgcagta tatctataaa tataccagct atccggatcc gattctgctg 360 atgaaaagcg cacgtaatag ctgttggagc aaagatgccg aatatggtct gtatagcatt 420 tatcagggtg gcatttttga actgaaagaa aatgatcgca tttttgtgag cgtgaccaat 480 gaacatctga ttgatatgga tcatgaagcc agcttttttg gtgcatttct ggttggt 537 <210> 92 <211> 540 <212> DNA <213> Artificial Sequence <220> <223> artificial <400> 92 tgtccgagcg aaggtctgtg tcgtgttgtt cgtccgctgg gtctggcagg tccgcagcgt 60 gttgcagcac atattaccgg cacccgtggt cgtagcaata ccctgagcag cccgaatagc 120 aaaaatgaaa aagccctggg tcgtaaaatt aatagctggg aaagcagccg tagcggtcat 180 agctttctga gcaatctgca tctgcgtaat ggcgaactgg tgattcatga aaaaggcttt 240 tattatattt atagccagac ctattttcgc tttcaggaag aaattaaaga aaataccaaa 300 aatgataaac aaatggtgca gtatatctat aaatatacca gctatccgga tccgattctg 360 ctgatgaaaa gcgcacgtaa tagctgttgg agcaaagatg ccgaatatgg tctgtatagc 420 atttatcagg gtggcatttt tgaactgaaa gaaaatgatc gcatttttgt gagcgtgacc 480 aatgaacatc tgattgatat ggatcatgaa gccagctttt ttggtgcatt tctggttggt 540 <210> 93 <211> 459 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 93 Gly Cys Ala Ala Ala Cys Ala Ala Cys Thr Ser Glu Glu Thr Ile Ser 1 5 10 15 Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro Leu Val Arg Glu Arg 20 25 30 Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser 35 40 45 Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg 50 55 60 Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser 65 70 75 80 Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe 85 90 95 Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys 100 105 110 Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr 115 120 125 Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser 130 135 140 Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly 145 150 155 160 Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr 165 170 175 Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala 180 185 190 Phe Leu Val Gly Gly Gly Gly Ser Ala Ser Gly Cys Gly Pro Glu Arg 195 200 205 Lys Lys Arg Ala Ser Gly Gly Pro Glu Gly Gly Ser Leu Ala Ala Leu 210 215 220 Thr Ala His Gln Ala Cys His Leu Pro Leu Glu Thr Phe Thr Arg His 225 230 235 240 Arg Gln Pro Arg Gly Trp Glu Gln Leu Glu Gln Cys Gly Tyr Pro Val 245 250 255 Gln Arg Leu Val Ala Leu Tyr Leu Ala Ala Arg Leu Ser Trp Asn Gln 260 265 270 Val Asp Gln Val Ile Arg Asn Ala Leu Ala Ser Pro Gly Ser Gly Gly 275 280 285 Asp Leu Gly Glu Ala Ile Arg Glu Gln Pro Glu Gln Ala Arg Leu Ala 290 295 300 Leu Thr Leu Ala Ala Ala Glu Ser Glu Arg Phe Val Arg Gln Gly Thr 305 310 315 320 Gly Asn Gly Gly Gly Gly Ser Gly Gly Gly Ser Lys Glu Thr Ala Ala 325 330 335 Ala Lys Phe Glu Arg Gln His Met Asp Ser Ser Thr Ser Ala Ala Ser 340 345 350 Ser Ser Asn Tyr Cys Asn Gln Met Met Lys Ser Arg Asn Leu Thr Lys 355 360 365 Asp Arg Cys Lys Pro Val Asn Thr Phe Val His Glu Ser Leu Ala Asp 370 375 380 Val Gln Ala Val Cys Ser Gln Lys Asn Val Ala Cys Lys Asn Gly Gln 385 390 395 400 Thr Asn Cys Tyr Gln Ser Tyr Ser Thr Met Ser Ile Thr Asp Cys Arg 405 410 415 Glu Thr Gly Ser Ser Lys Tyr Pro Asn Cys Ala Tyr Lys Thr Thr Gln 420 425 430 Ala Asn Lys His Ile Ile Val Ala Cys Glu Gly Asn Pro Tyr Val Pro 435 440 445 Val His Phe Asp Ala Ser Val Lys Asp Glu Leu 450 455 <210> 94 <211> 213 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 94 Phe Ser Arg Ser Leu His Ser Leu Leu Arg Arg Arg Arg Arg Arg Arg 1 5 10 15 Arg Val Val Arg Pro Leu Gly Leu Ala Gly Thr Ser Glu Glu Thr Ile 20 25 30 Ser Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro Leu Val Arg Glu 35 40 45 Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg 50 55 60 Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly 65 70 75 80 Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu 85 90 95 Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly 100 105 110 Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile 115 120 125 Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys 130 135 140 Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn 145 150 155 160 Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln 165 170 175 Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val 180 185 190 Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly 195 200 205 Ala Phe Leu Val Gly 210 <210> 95 <211> 204 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 95 Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala 1 5 10 15 Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Pro Leu Gly Leu 20 25 30 Ala Gly Arg Val Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His 35 40 45 Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser 50 55 60 Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser 65 70 75 80 Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu 85 90 95 Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr 100 105 110 Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln 115 120 125 Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu 130 135 140 Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr 145 150 155 160 Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn 165 170 175 Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp 180 185 190 His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly 195 200 <210> 96 <211> 205 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 96 Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr 1 5 10 15 Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile 20 25 30 Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu 35 40 45 His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr 50 55 60 Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn 65 70 75 80 Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser 85 90 95 Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp 100 105 110 Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile 115 120 125 Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu 130 135 140 His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu 145 150 155 160 Val Gly Gly Gly Gly Ser Arg Lys Lys Arg Val Lys Arg Leu Ser Thr 165 170 175 Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala Ser Gly Leu 180 185 190 Asp Lys Asp Tyr Leu Lys Pro Asp Asp Lys Asp Glu Leu 195 200 205 <210> 97 <211> 207 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 97 Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr 1 5 10 15 Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile 20 25 30 Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu 35 40 45 His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr 50 55 60 Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn 65 70 75 80 Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser 85 90 95 Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp 100 105 110 Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile 115 120 125 Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu 130 135 140 His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu 145 150 155 160 Val Gly Gly Gly Gly Ser Gly Gly Gly Pro Leu Gly Leu Ala Gly Arg 165 170 175 Val Val Arg Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp 180 185 190 Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp 195 200 205 <210> 98 <211> 327 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 98 Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr 1 5 10 15 Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile 20 25 30 Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu 35 40 45 His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr 50 55 60 Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn 65 70 75 80 Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser 85 90 95 Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp 100 105 110 Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile 115 120 125 Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu 130 135 140 His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu 145 150 155 160 Val Gly Gly Gly Gly Ser Gly Gly Gly Pro Leu Gly Leu Ala Gly Arg 165 170 175 Val Val Arg Met Leu Arg Lys Leu Ala Ala Val Ser Leu Leu Ser Leu 180 185 190 Leu Ser Ala Pro Leu Leu Ala Ala Glu Cys Ser Val Asp Ile Gln Gly 195 200 205 Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr Val Asp Lys Ser 210 215 220 Cys Lys Gln Phe Thr Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys 225 230 235 240 Asn Val Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln 245 250 255 Gly Val Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu 260 265 270 Lys Pro Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser 275 280 285 Gly Glu Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly 290 295 300 Glu Gln Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Met 305 310 315 320 Lys Gly Thr Leu Thr Leu Lys 325 <210> 99 <211> 193 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 99 Ala Val Pro Ile Ala Gln Lys Pro Arg Arg Arg Arg Arg Arg Arg Arg 1 5 10 15 Val Val Arg Pro Leu Gly Leu Ala Gly Val Arg Glu Arg Gly Pro Gln 20 25 30 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 35 40 45 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 50 55 60 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 65 70 75 80 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 85 90 95 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 100 105 110 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 115 120 125 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 130 135 140 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 145 150 155 160 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 165 170 175 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 180 185 190 Gly <210> 100 <211> 221 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 100 Ala Val Pro Ile Ala Gln Lys Pro Arg Arg Arg Arg Arg Arg Arg Arg 1 5 10 15 Val Val Arg Pro Leu Gly Leu Ala Gly Gly Cys Ala Ala Ala Cys Ala 20 25 30 Ala Cys Thr Ser Glu Glu Thr Ile Ser Thr Val Gln Glu Lys Gln Gln 35 40 45 Asn Ile Ser Pro Leu Val Arg Glu Arg Gly Pro Gln Arg Cys Ala Ala 50 55 60 His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn 65 70 75 80 Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser 85 90 95 Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly 100 105 110 Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr 115 120 125 Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys 130 135 140 Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile 145 150 155 160 Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu 165 170 175 Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu 180 185 190 Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met 195 200 205 Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly 210 215 220 <210> 101 <211> 212 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 101 Ala Val Pro Ile Ala Gln Lys Pro Arg Arg Arg Arg Arg Arg Arg Arg 1 5 10 15 Val Val Arg Pro Leu Gly Leu Ala Gly Thr Ser Glu Glu Thr Ile Ser 20 25 30 Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro Leu Val Arg Glu Arg 35 40 45 Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser 50 55 60 Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg 65 70 75 80 Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser 85 90 95 Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe 100 105 110 Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys 115 120 125 Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr 130 135 140 Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser 145 150 155 160 Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly 165 170 175 Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr 180 185 190 Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala 195 200 205 Phe Leu Val Gly 210 <210> 102 <211> 212 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 102 Gly Pro Ser Gln Pro Thr Tyr Pro Gly Asp Asp Ala Pro Val Glu Asp 1 5 10 15 Leu Ile Arg Phe Val Gly Arg Leu Leu Ala Tyr Phe Gly Asp Thr Ile 20 25 30 Asn Arg Arg Arg Arg Arg Arg Arg Arg Arg Val Val Arg Pro Leu Gly 35 40 45 Leu Ala Gly Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser 50 55 60 Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg 65 70 75 80 Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser 85 90 95 Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe 100 105 110 Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys 115 120 125 Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr 130 135 140 Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser 145 150 155 160 Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly 165 170 175 Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr 180 185 190 Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala 195 200 205 Phe Leu Val Gly 210 <210> 103 <211> 247 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 103 Gly Pro Ser Gln Pro Thr Tyr Pro Gly Asp Asp Ala Pro Val Glu Asp 1 5 10 15 Leu Ile Arg Phe Val Gly Arg Leu Leu Ala Tyr Phe Gly Asp Thr Ile 20 25 30 Asn Arg Arg Arg Arg Arg Arg Arg Arg Arg Val Val Arg Pro Leu Gly 35 40 45 Leu Ala Gly Gly Cys Ala Ala Ala Cys Ala Ala Cys Thr Ser Glu Glu 50 55 60 Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro Leu Val 65 70 75 80 Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg 85 90 95 Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala 100 105 110 Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser 115 120 125 Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu 130 135 140 Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu 145 150 155 160 Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile 165 170 175 Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala 180 185 190 Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile 195 200 205 Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val 210 215 220 Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe 225 230 235 240 Phe Gly Ala Phe Leu Val Gly 245 <210> 104 <211> 212 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 104 Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr 1 5 10 15 Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys 20 25 30 Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His 35 40 45 Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His 50 55 60 Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln 65 70 75 80 Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr 85 90 95 Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser 100 105 110 Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser 115 120 125 Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe 130 135 140 Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser 145 150 155 160 Phe Phe Gly Ala Phe Leu Val Gly Pro Leu Gly Leu Ala Gly Arg Val 165 170 175 Val Arg Gly Pro Arg Arg Pro Arg Arg Pro Gly Asp Asp Ala Pro Val 180 185 190 Glu Asp Leu Ile Arg Phe Val Gly Arg Leu Leu Ala Tyr Phe Gly Asp 195 200 205 Thr Ile Asn Arg 210 <210> 105 <211> 221 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 105 Arg Thr His Ile Asn Thr Val Val Ala Lys Ile Gln Ala Lys Ile Pro 1 5 10 15 Gly Ala Lys Arg His Ala Glu Glu Glu Glu Ala Ala Gly Arg Lys Arg 20 25 30 Lys Lys Arg Thr Arg Val Val Arg Pro Leu Gly Leu Ala Gly Gly Gly 35 40 45 Cys Ala Ala Ala Cys Ala Ala Cys Gly Gly Gly Gln Arg Val Ala Ala 50 55 60 His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn 65 70 75 80 Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser 85 90 95 Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly 100 105 110 Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr 115 120 125 Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys 130 135 140 Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile 145 150 155 160 Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu 165 170 175 Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu 180 185 190 Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met 195 200 205 Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly 210 215 220 <210> 106 <211> 435 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 106 Ala Glu Pro Ser Ala Ala Thr Gln Ser His Ser Ile Ser Ser Ser Ser 1 5 10 15 Phe Gly Ala Glu Pro Ser Ala Pro Gly Gly Gly Gly Ser Pro Gly Ala 20 25 30 Cys Pro Ala Leu Gly Thr Lys Ser Cys Ser Ser Ser Cys Ala Val His 35 40 45 Asp Leu Ile Phe Trp Arg Asp Val Lys Lys Thr Gly Phe Val Phe Gly 50 55 60 Thr Thr Leu Ile Met Leu Leu Ser Leu Ala Ala Phe Ser Val Ile Ser 65 70 75 80 Val Val Ser Tyr Leu Ile Leu Ala Leu Leu Ser Val Thr Ile Ser Phe 85 90 95 Arg Ile Tyr Lys Ser Val Ile Gln Ala Val Gln Lys Ser Glu Glu Gly 100 105 110 His Pro Phe Lys Ala Tyr Leu Asp Val Asp Ile Thr Leu Ser Ser Glu 115 120 125 Ala Phe His Asn Tyr Met Asn Ala Ala Met Val His Ile Asn Arg Ala 130 135 140 Leu Lys Leu Ile Ile Arg Leu Phe Leu Val Glu Asp Leu Val Asp Ser 145 150 155 160 Leu Lys Leu Ala Val Phe Met Trp Leu Met Thr Tyr Val Gly Ala Val 165 170 175 Phe Asn Gly Ile Thr Leu Leu Ile Leu Ala Glu Leu Leu Ile Phe Ser 180 185 190 Val Pro Ile Val Tyr Glu Lys Tyr Lys Thr Gln Ile Asp His Tyr Val 195 200 205 Gly Ile Ala Arg Asp Gln Thr Lys Ser Ile Val Glu Lys Ile Gln Ala 210 215 220 Lys Leu Pro Gly Ile Ala Lys Lys Lys Ala Glu Arg Arg Arg Arg Arg 225 230 235 240 Arg Arg Arg Gly Gly Ser Gly Gly Arg Val Val Arg Pro Leu Gly Leu 245 250 255 Ala Gly Gly Gly Ser Gly Gly Cys Ala Ala Glu Cys Ala Ala Ala Cys 260 265 270 Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn 275 280 285 Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys 290 295 300 Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn 305 310 315 320 Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr 325 330 335 Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu 340 345 350 Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr 355 360 365 Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys 370 375 380 Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly 385 390 395 400 Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn 405 410 415 Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe 420 425 430 Leu Val Gly 435 <210> 107 <211> 580 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 107 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 1 5 10 15 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 20 25 30 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 35 40 45 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 50 55 60 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 65 70 75 80 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 85 90 95 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 100 105 110 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 115 120 125 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 130 135 140 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 145 150 155 160 Gly Gly Gly Gly Ser Arg Lys Lys Arg Ala Ser Gly Gly Pro Glu Gly 165 170 175 Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys His Leu Pro Leu 180 185 190 Glu Thr Phe Thr Arg His Arg Gln Pro Arg Gly Trp Glu Gln Leu Glu 195 200 205 Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu Tyr Leu Ala Ala 210 215 220 Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Ala Asn Ala Leu Ala 225 230 235 240 Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile Arg Glu Ser Pro 245 250 255 Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala Glu Ser Glu Arg 260 265 270 Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly Ala Ala Asn Gly 275 280 285 Pro Ala Asp Gly Gly Gly Ser Gly Gly Gly Met Ile Glu Thr Asp Ser 290 295 300 Gly Val Asp Asp Asp Met Ala Cys His Lys Ile Pro Val Asp Ala Asp 305 310 315 320 Phe Leu Tyr Ala Tyr Ser Thr Ala Pro Gly Tyr Tyr Ser Trp Arg Asn 325 330 335 Ser Lys Asp Gly Ser Trp Phe Ile Gln Ser Leu Cys Ala Met Leu Lys 340 345 350 Gln Tyr Ala Asp Lys Leu Glu Phe Met His Ile Leu Thr Arg Val Asn 355 360 365 Arg Lys Val Ala Thr Glu Phe Glu Ser Phe Ser Phe Asp Ala Thr Phe 370 375 380 His Ala Lys Lys Gln Ile Pro Cys Ile Val Ser Met Leu Thr Lys Glu 385 390 395 400 Leu Tyr Phe Tyr His Asp Val Asp Gly Met Glu Asn Thr Glu Asn Ser 405 410 415 Val Asp Ser Lys Ser Ile Lys Asn Leu Glu Pro Lys Ile Ile His Gly 420 425 430 Ser Glu Ser Met Asp Ser Gly Met Ser Trp Asp Thr Gly Tyr Lys Met 435 440 445 Asp Tyr Pro Glu Met Gly Leu Cys Ile Ile Ile Asn Asn Lys Asn Phe 450 455 460 His Lys Ser Thr Gly Met Thr Ser Arg Ser Gly Thr Asp Val Asp Ala 465 470 475 480 Ala Asn Leu Arg Glu Thr Phe Arg Asn Leu Lys Tyr Glu Val Arg Asn 485 490 495 Lys Asn Asp Leu Thr Arg Glu Glu Ile Val Glu Leu Met Arg Asp Val 500 505 510 Ser Lys Glu Asp His Ser Lys Arg Ser Ser Phe Val Cys Val Leu Leu 515 520 525 Ser His Gly Glu Glu Gly Ile Ile Phe Gly Thr Asn Gly Pro Val Asp 530 535 540 Leu Lys Lys Ile Thr Asn Phe Phe Arg Gly Asp Arg Cys Arg Ser Leu 545 550 555 560 Thr Gly Lys Pro Lys Leu Phe Ile Ile Gln Ala Cys Arg Gly Thr Glu 565 570 575 Leu Asp Cys Gly 580 <210> 108 <211> 247 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 108 Ala Arg Lys Gly Lys Gly Gln Ile Glu Lys Arg Lys Leu Arg Glu Lys 1 5 10 15 Arg Arg Ser Thr Gly Val Val Asn Ile Pro Ala Ala Glu Cys Leu Asp 20 25 30 Glu Tyr Glu Asp Asp Glu Ala Gly Gln Lys Glu Arg Lys Arg Glu Asp 35 40 45 Ala Ile Thr Gln Gln Asn Thr Ile Gln Asn Glu Ala Arg Arg Arg Arg 50 55 60 Arg Arg Arg Arg Val Val Arg Pro Leu Gly Leu Ala Gly Gln Gly Gly 65 70 75 80 Ser Gly Gly Ser Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg 85 90 95 Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala 100 105 110 Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser 115 120 125 Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu 130 135 140 Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu 145 150 155 160 Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile 165 170 175 Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala 180 185 190 Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile 195 200 205 Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val 210 215 220 Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe 225 230 235 240 Phe Gly Ala Phe Leu Val Gly 245 <210> 109 <211> 260 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 109 Glu Glu Glu Ala Ala Gly Arg Lys Arg Lys Lys Arg Thr Ala Arg Lys 1 5 10 15 Gly Lys Gly Gln Ile Glu Lys Arg Lys Leu Arg Glu Lys Arg Arg Ser 20 25 30 Thr Gly Val Val Asn Ile Pro Ala Ala Glu Cys Leu Asp Glu Tyr Glu 35 40 45 Asp Asp Glu Ala Gly Gln Lys Glu Arg Lys Arg Glu Asp Ala Ile Thr 50 55 60 Gln Gln Asn Thr Ile Gln Asn Glu Ala Arg Arg Arg Arg Arg Arg Arg 65 70 75 80 Arg Val Val Arg Pro Leu Gly Leu Ala Gly Gln Gly Gly Ser Gly Gly 85 90 95 Ser Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser 100 105 110 Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg 115 120 125 Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser 130 135 140 Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe 145 150 155 160 Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys 165 170 175 Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr 180 185 190 Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser 195 200 205 Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly 210 215 220 Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr 225 230 235 240 Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala 245 250 255 Phe Leu Val Gly 260 <210> 110 <211> 270 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 110 Thr Ser Glu Glu Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile 1 5 10 15 Ser Pro Leu Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile 20 25 30 Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys 35 40 45 Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg 50 55 60 Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu 65 70 75 80 Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe 85 90 95 Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met 100 105 110 Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu 115 120 125 Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly 130 135 140 Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp 145 150 155 160 Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His 165 170 175 Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly Gly Gly Ser Gly Cys 180 185 190 Ala Ala Cys Ala Ala Ala Cys Pro Leu Gly Leu Ala Gly Arg Val Val 195 200 205 Arg Arg Arg Arg Arg Arg Arg Arg Met Pro Gly Lys Lys Ala Arg Lys 210 215 220 Asn Ala Gln Pro Ser Pro Ala Arg Ala Pro Ala Glu Leu Glu Val Glu 225 230 235 240 Cys Ala Thr Gln Leu Arg Arg Phe Gly Asp Lys Leu Asn Phe Arg Gln 245 250 255 Lys Leu Leu Asn Leu Ile Ser Lys Leu Phe Cys Ser Gly Thr 260 265 270 <210> 111 <211> 207 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 111 Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr 1 5 10 15 Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys 20 25 30 Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His 35 40 45 Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His 50 55 60 Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln 65 70 75 80 Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr 85 90 95 Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser 100 105 110 Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser 115 120 125 Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe 130 135 140 Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser 145 150 155 160 Phe Phe Gly Ala Phe Leu Val Gly Gly Gly Ser Gly Cys Ala Ala Cys 165 170 175 Ala Ala Ala Cys Pro Leu Gly Leu Ala Gly Arg Val Val Arg Arg Arg 180 185 190 Arg Arg Arg Arg Arg Lys Leu Leu Asn Leu Ile Ser Lys Leu Phe 195 200 205 <210> 112 <211> 311 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 112 Gln Asp Trp Leu Thr Phe Gln Lys Lys His Ile Thr Asn Thr Arg Asp 1 5 10 15 Val Asp Cys Asp Asn Ile Met Ser Thr Asn Leu Phe His Cys Lys Asp 20 25 30 Lys Asn Thr Phe Ile Tyr Ser Arg Pro Glu Pro Val Lys Ala Ile Cys 35 40 45 Lys Gly Ile Ile Ala Ser Lys Asn Val Leu Thr Thr Ser Glu Phe Tyr 50 55 60 Leu Ser Asp Cys Asn Val Thr Ser Arg Pro Cys Lys Tyr Lys Leu Lys 65 70 75 80 Lys Ser Thr Asn Lys Phe Cys Val Thr Cys Glu Asn Gln Ala Pro Val 85 90 95 His Phe Val Gly Val Gly Ser Cys Arg Val Val Arg Pro Leu Gly Leu 100 105 110 Ala Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Thr Ser Glu Glu 115 120 125 Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro Leu Val 130 135 140 Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg 145 150 155 160 Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala 165 170 175 Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser 180 185 190 Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu 195 200 205 Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu 210 215 220 Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile 225 230 235 240 Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala 245 250 255 Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile 260 265 270 Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val 275 280 285 Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe 290 295 300 Phe Gly Ala Phe Leu Val Gly 305 310 <210> 113 <211> 230 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 113 Glu Glu Gln Trp Ala Arg Glu Ile Gly Ala Gln Leu Arg Arg Met Ala 1 5 10 15 Asp Asp Leu Asn Ala Gln Tyr Glu Arg Arg Arg Arg Arg Arg Arg Arg 20 25 30 Arg Arg Val Val Arg Pro Leu Gly Leu Ala Gly Thr Ser Glu Glu Thr 35 40 45 Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro Leu Val Arg 50 55 60 Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly 65 70 75 80 Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu 85 90 95 Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe 100 105 110 Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys 115 120 125 Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu 130 135 140 Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr 145 150 155 160 Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg 165 170 175 Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr 180 185 190 Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser 195 200 205 Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe 210 215 220 Gly Ala Phe Leu Val Gly 225 230 <210> 114 <211> 225 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 114 Thr Ser Glu Glu Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile 1 5 10 15 Ser Pro Leu Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile 20 25 30 Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys 35 40 45 Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg 50 55 60 Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu 65 70 75 80 Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe 85 90 95 Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met 100 105 110 Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu 115 120 125 Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly 130 135 140 Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp 145 150 155 160 Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His 165 170 175 Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly Cys Ala Ala Cys Ala 180 185 190 Ala Ala Cys Pro Leu Gly Leu Ala Gly Arg Val Val Arg Asn Ile Ala 195 200 205 Arg His Leu Ala Gln Val Gly Asp Ser Met Asp Lys Pro Arg Arg Pro 210 215 220 Tyr 225 <210> 115 <211> 234 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 115 Thr Ser Glu Glu Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile 1 5 10 15 Ser Pro Leu Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile 20 25 30 Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys 35 40 45 Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg 50 55 60 Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu 65 70 75 80 Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe 85 90 95 Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met 100 105 110 Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu 115 120 125 Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly 130 135 140 Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp 145 150 155 160 Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His 165 170 175 Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly Cys Ala Ala Cys Ala 180 185 190 Ala Ala Cys Gly Gly Pro Leu Gly Leu Ala Gly Arg Val Val Arg Gln 195 200 205 Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys Lys Ala 210 215 220 Tyr Ala Ala Ala Gly Asn Ser Tyr Phe Lys 225 230 <210> 116 <211> 216 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 116 Phe Ile Ser Lys Glu Arg Arg Glu Arg Ala Ile Leu Ser Thr Lys Pro 1 5 10 15 Pro Gly Thr Phe Leu Leu Arg Phe Ser Glu Ser Ser Lys Arg Val Val 20 25 30 Arg Pro Leu Gly Ile Ala Gly Glu Gly Gly Gly Cys Ala Ala Ala Cys 35 40 45 Ala Ala Cys Gly Ser Gly Gln Arg Val Ala Ala His Ile Thr Gly Thr 50 55 60 Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys 65 70 75 80 Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His 85 90 95 Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His 100 105 110 Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln 115 120 125 Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr 130 135 140 Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser 145 150 155 160 Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser 165 170 175 Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe 180 185 190 Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser 195 200 205 Phe Phe Gly Ala Phe Leu Val Gly 210 215 <210> 117 <211> 194 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 117 Gly Gln Val Gly Arg Gln Leu Ala Ile Ile Gly Asp Asp Ile Asn Arg 1 5 10 15 Arg Arg Arg Arg Arg Arg Arg Arg Val Val Arg Pro Leu Gly Leu Ala 20 25 30 Gly Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr 35 40 45 Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile 50 55 60 Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu 65 70 75 80 His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr 85 90 95 Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn 100 105 110 Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser 115 120 125 Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp 130 135 140 Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile 145 150 155 160 Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu 165 170 175 His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu 180 185 190 Val Gly <210> 118 <211> 243 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 118 Lys Asn Leu Trp Ala Ala Gln Arg Tyr Gly Arg Glu Leu Arg Arg Met 1 5 10 15 Ser Asp Glu Phe Glu Gly Ser Phe Lys Gly Leu Arg Arg Arg Arg Arg 20 25 30 Arg Arg Arg Arg Val Val Arg Pro Leu Gly Leu Ala Gly Arg Val Ala 35 40 45 Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro 50 55 60 Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu 65 70 75 80 Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn 85 90 95 Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln 100 105 110 Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp 115 120 125 Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro 130 135 140 Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala 145 150 155 160 Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys 165 170 175 Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp 180 185 190 Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly Gly Gly 195 200 205 Ser His Gly Leu Val Pro Arg Gly Ser Thr Ser Glu Glu Thr Ile Ser 210 215 220 Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro Leu Val Arg Glu Arg 225 230 235 240 Gly Pro Gln <210> 119 <211> 236 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 119 Thr Ser Glu Glu Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile 1 5 10 15 Ser Pro Leu Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile 20 25 30 Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys 35 40 45 Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg 50 55 60 Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu 65 70 75 80 Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe 85 90 95 Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met 100 105 110 Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu 115 120 125 Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly 130 135 140 Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp 145 150 155 160 Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His 165 170 175 Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly Gly Gly Ser Pro Leu 180 185 190 Gly Leu Ala Gly Cys Arg Val Val Arg Arg Arg Arg Arg Arg Arg Arg 195 200 205 Arg Lys Asn Leu Trp Ala Ala Gln Arg Tyr Gly Arg Glu Leu Arg Arg 210 215 220 Met Ser Asp Glu Phe Glu Gly Ser Phe Lys Gly Leu 225 230 235 <210> 120 <211> 216 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 120 Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu 1 5 10 15 Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn 20 25 30 Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His 35 40 45 Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile 50 55 60 Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr 65 70 75 80 Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr 85 90 95 Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser 100 105 110 Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe 115 120 125 Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His 130 135 140 Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val 145 150 155 160 Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Pro Leu Gly Leu Ala Gly 165 170 175 Arg Val Val Arg Lys Phe Glu Pro Lys Ser Gly Trp Met Thr Phe Leu 180 185 190 Glu Val Thr Gly Lys Ile Cys Glu Met Leu Ser Leu Leu Lys Gln Tyr 195 200 205 Cys Lys Pro Arg Arg Pro Tyr Arg 210 215 <210> 121 <211> 237 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <400> 121 Arg Val Ser Phe Cys Arg Pro Gly Trp Ser Ala Met Ala Arg Ser Arg 1 5 10 15 Leu Thr Ala Thr Ser Val Ser Gln Val Gln Glu Asn Gly Phe Val Lys 20 25 30 Lys Phe Glu Pro Lys Ser Gly Trp Met Thr Phe Leu Glu Val Thr Gly 35 40 45 Lys Ile Cys Glu Met Leu Ser Leu Leu Lys Gln Tyr Cys Arg Val Val 50 55 60 Arg Pro Leu Gly Leu Ala Gly Gly Gly Ser Gly Gly Arg Val Ala Ala 65 70 75 80 His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn 85 90 95 Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser 100 105 110 Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly 115 120 125 Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr 130 135 140 Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys 145 150 155 160 Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile 165 170 175 Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu 180 185 190 Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu 195 200 205 Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met 210 215 220 Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly 225 230 235 <210> 122 <211> 1377 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 122 ggttgtgcag cagcatgtgc agcctgtacc agcgaagaaa ccattagcac cgttcaagaa 60 aaacagcaga atattagtcc gctggttcgt gaacgtggtc cgcagcgtgt tgcagcacat 120 attaccggca cccgtggtcg tagcaatacc ctgagcagcc cgaatagcaa aaatgaaaaa 180 gccctgggtc gcaaaattaa cagctgggaa agcagccgta gcggtcatag ctttctgagc 240 aatctgcatc tgcgtaatgg tgaactggtg attcacgaga aaggcttcta ttatatctat 300 agccagacct atttccgctt ccaagaagag atcaaagaga acaccaaaaa cgacaaacaa 360 atggtgcagt acatctataa atacaccagc tatccggatc cgattctgct gatgaaaagc 420 gcacgtaata gctgttggag caaagatgca gaatatggcc tgtatagcat ctatcagggt 480 ggcatttttg aactgaaaga aaacgatcgc atctttgtga gcgtgaccaa tgaacatctg 540 attgatatgg atcacgaagc cagctttttt ggtgcatttc tggttggtgg tggtggtagc 600 gcaagcggtt gtggtccgga acgtaaaaaa cgtgcaagcg gtggtccgga aggtggtagt 660 ctggcagcac tgaccgcaca tcaggcatgt catctgccgc tggaaacctt tacccgtcat 720 cgtcagcctc gtggttggga acagctggaa cagtgtggtt atccggttca gcgtctggtt 780 gcactgtatc tggcagctcg tctgagctgg aatcaggttg atcaggttat tcgtaatgca 840 ctggcaagtc cgggtagcgg tggcgatctg ggtgaagcaa ttcgtgaaca gccggaacag 900 gcacgtctgg cactgaccct ggcagcagca gaaagcgaac gttttgttcg tcaaggcacc 960 ggtaatggtg gtggcggtag tggtggtggt tcaaaagaaa ccgcagcagc caaatttgaa 1020 cgtcagcaca tggatagcag caccagcgca gcaagcagca gcaattattg caatcagatg 1080 atgaaaagcc gcaatctgac caaagatcgt tgtaaaccgg tgaatacctt tgttcatgaa 1140 agcctggcag atgttcaggc agtttgcagc cagaaaaatg tggcctgtaa aaatggtcag 1200 accaattgct atcagagcta tagcaccatg agcattaccg attgtcgtga aaccggtagc 1260 agcaaatatc cgaattgcgc ctataaaacc acccaggcca ataaacatat tattgtggcc 1320 tgtgaaggca atccgtatgt tccggttcat tttgatgcca gcgtgaaaga tgaactg 1377 <210> 123 <211> 639 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 123 tttagccgta gcctgcatag cctgctgcgt cgtcgtcgcc gtcgtcggcg tgttgttcgt 60 ccgctgggtc tggcaggcac cagcgaagaa accattagca ccgttcaaga aaaacagcag 120 aatattagtc cgctggttcg tgaacgtggt ccgcagcgtg ttgcagcaca tattaccggc 180 acccgtggtc gtagcaatac cctgagcagc ccgaatagca aaaatgaaaa agccctgggt 240 cgcaaaatta acagctggga aagcagccgt agcggtcata gctttctgag caatctgcat 300 ctgcgtaatg gtgaactggt gattcacgag aaaggcttct attatatcta tagccagacc 360 tatttccgct tccaagaaga gatcaaagag aacaccaaaa acgacaaaca aatggtgcag 420 tacatctata aatacaccag ctatccggat ccgattctgc tgatgaaaag cgcacgtaat 480 agctgttgga gcaaagatgc agaatatggc ctgtatagca tctatcaggg tggcattttt 540 gaactgaaag aaaacgatcg catctttgtg agcgtgacca atgaacatct gattgatatg 600 gatcacgaag ccagcttttt tggtgccttt ctggttggt 639 <210> 124 <211> 612 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 124 ctgtctaccg cagcagatat gcagggtgtt gttaccgatg gtatggcaag cggtctggat 60 aaagattatc tgaaaccgga tgatccgctg ggtctggcag gtcgtgttgt tcgtgaacgt 120 ggtccgcagc gtgttgcagc acatattacc ggcacccgtg gtcgtagcaa taccctgagc 180 agcccgaata gcaaaaatga aaaagccctg ggtcgcaaaa ttaatagctg ggaaagcagc 240 cgtagcggtc atagctttct gagcaatctg catctgcgta atggtgaact ggtgattcat 300 gaaaaaggct tttattatat ttatagccag acctattttc gctttcagga agaaattaaa 360 gaaaacacca aaaatgataa acaaatggtg cagtatatct ataaatatac cagctatccg 420 gatccgattc tgctgatgaa aagcgcacgt aatagctgtt ggagcaaaga tgcagaatat 480 ggcctgtata gcatttatca gggtggcatt tttgaactga aagaaaatga tcgcattttt 540 gtgagcgtga ccaatgaaca tctgattgat atggatcatg aagccagctt ttttggtgca 600 tttctggttg gt 612 <210> 125 <211> 615 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 125 cagcgtgttg cagcacatat taccggcacc cgtggtcgta gcaataccct gagcagcccg 60 aatagcaaaa atgaaaaagc actgggtcgc aaaattaaca gctgggaaag cagccgtagc 120 ggtcatagct ttctgagcaa tctgcatctg cgtaatggtg aactggtgat tcatgaaaaa 180 ggcttctact atatctacag ccagacctat tttcgcttcc aagaagagat taaagaaaac 240 accaaaaacg ataaacaaat ggtgcagtac atctataaat acaccagcta tccggatccg 300 attctgctga tgaaaagcgc acgtaatagc tgttggagca aagatgcaga atatggcctg 360 tatagcattt atcagggtgg catctttgaa ctgaaagaaa acgatcgtat tttcgtgagc 420 gtgaccaatg aacatctgat cgatatggat catgaagcca gcttttttgg tgcatttctg 480 gtgggtggtg gtggtagccg taaaaaacgt gttaaacgtc tgagcaccgc agcagatatg 540 cagggtgttg ttaccgatgg tatggcaagc ggtctggata aagattatct gaaaccggat 600 gataaagatg aactg 615 <210> 126 <211> 621 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 126 cagcgtgttg cagcacatat taccggcacc cgtggtcgta gcaataccct gagcagcccg 60 aatagcaaaa atgaaaaagc actgggtcgc aaaatcaata gctgggaaag cagccgtagc 120 ggtcatagct ttctgagcaa tctgcatctg cgtaatggtg aactggtgat tcatgaaaaa 180 ggcttttatt atatttatag ccagacctat tttcgctttc aagaagagat taaagaaaat 240 accaaaaatg ataaacaaat ggtgcagtac atttataaat ataccagcta tccggacccg 300 attctgctga tgaaaagcgc acgtaatagc tgttggagca aagatgcaga atatggtctg 360 tatagcattt atcagggtgg catctttgag ctgaaagaaa atgatcgcat ctttgttagc 420 gtgaccaacg aacatctgat cgatatggat catgaagcca gcttttttgg tgcatttctg 480 gttggtggtg gtggtagcgg tggtggtccg ctgggtctgg caggtcgtgt tgttcgtctg 540 agcaccgcag cagatatgca gggtgttgtt accgatggta tggcaagcgg tctggataaa 600 gattatctga aaccggatga t 621 <210> 127 <211> 981 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 127 cagcgtgttg cagcacatat taccggcacc cgtggtcgta gcaataccct gagcagcccg 60 aatagcaaaa atgaaaaagc actgggtcgc aaaatcaata gctgggaaag cagccgtagc 120 ggtcatagct ttctgagcaa tctgcatctg cgtaatggtg aactggtgat tcatgaaaaa 180 ggcttttatt atatttatag ccagacctat tttcgctttc aagaagagat taaagaaaat 240 accaaaaatg ataaacaaat ggtgcagtac atttataaat ataccagcta tccggacccg 300 attctgctga tgaaaagcgc acgtaatagc tgttggagca aagatgcaga atatggtctg 360 tatagcattt atcagggtgg catctttgag ctgaaagaaa atgatcgcat ctttgttagc 420 gtgaccaacg aacatctgat cgatatggat catgaagcca gcttttttgg tgcatttctg 480 gttggtggtg gtggtagcgg tggtggtccg ctgggtctgg caggtcgtgt tgttcgtatg 540 ctgcgtaaac tggcagcagt tagcctgctg agtctgctga gcgcaccgct gctggcagca 600 gaatgtagcg ttgatattca gggtaatgat cagatgcagt ttaacaccaa tgccattacc 660 gttgacaaaa gctgtaaaca gtttaccgtg aatctgagcc atccgggtaa tctgccgaaa 720 aatgttatgg gtcataattg ggttctgagc accgcagcag atatgcaggg tgttgttacc 780 gatggtatgg caagcggtct ggataaagat tatctgaaac cggatgatag ccgtgttatt 840 gcacatacca aactgattgg tagcggtgaa aaagatagcg ttacctttga tgtgagcaaa 900 ctgaaagaag gcgagcagta tatgttcttt tgtacctttc cgggtcatag cgcactgatg 960 aaaggcaccc tgaccctgaa a 981 <210> 128 <211> 579 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 128 gcagttccga ttgcacagaa accgcgtcgt cgtcgtcgcc gtcggcgtgt tgttcgtccg 60 ctgggtctgg caggcgttcg tgaacgtggt ccgcagcgtg ttgcagcaca tattaccggc 120 acccgtggtc gtagcaatac cctgagcagc ccgaatagca aaaatgaaaa agcactgggt 180 cgcaaaatca atagctggga aagcagccgt agcggtcata gctttctgag caatctgcat 240 ctgcgtaatg gtgaactggt gattcatgaa aaaggctttt attatattta tagccagacc 300 tattttcgct ttcaagaaga gattaaagaa aataccaaaa atgataaaca aatggtgcag 360 tatatctata aatataccag ctatccggac ccgattctgc tgatgaaaag cgcacgtaat 420 agctgttgga gcaaagatgc agaatatggt ctgtatagca tttatcaggg tggcatcttt 480 gagctgaaag aaaatgatcg catctttgtt agcgtgacca acgaacatct gatcgatatg 540 gatcatgaag ccagcttttt tggtgcattt ctggttggt 579 <210> 129 <211> 663 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 129 gcagttccga ttgcacagaa accgcgtcgt cgtcgtcgcc gtcggcgtgt tgttcgtccg 60 ctgggtctgg caggcggttg tgcagcagca tgtgcagcct gtaccagcga agaaaccatt 120 agcaccgttc aagaaaaaca gcagaatatt agtccgctgg ttcgtgaacg tggtccgcag 180 cgttgtgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 240 agcaaaaatg aaaaagcact gggtcgcaaa atcaatagct gggaaagcag ccgtagcggt 300 catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 360 ttctactata tctatagcca gacctatttc cgcttccaag aagaaatcaa agaaaatacc 420 aaaaatgata aacaaatggt gcagtatatt tacaaatata ccagctatcc ggatccgatt 480 ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 540 agcatttatc agggtggcat ctttgagctg aaagaaaatg atcgcatctt tgttagcgtg 600 accaacgaac atctgatcga tatggatcat gaagccagct tttttggtgc atttctggtg 660 ggt 663 <210> 130 <211> 636 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 130 gcagttccga ttgcacagaa accgcgtcgt cgtcgtcgcc gtcggcgtgt tgttcgtccg 60 ctgggtctgg caggcaccag tgaagaaacc attagcaccg ttcaagaaaa acagcagaat 120 attagtccgc tggttcgtga acgtggtccg cagcgtgttg cagcacatat taccggcacc 180 cgtggtcgta gcaataccct gagcagcccg aatagcaaaa atgaaaaagc actgggtcgc 240 aaaatcaata gctgggaaag cagccgtagc ggtcatagct ttctgagcaa tctgcatctg 300 cgtaatggtg aactggtgat tcatgaaaaa ggcttctact atatctacag ccagacctat 360 tttcgcttcc aagaagaaat caaagagaac accaaaaacg acaaacaaat ggtgcagtac 420 atctacaaat ataccagcta tccggatccg attctgctga tgaaaagcgc acgtaatagc 480 tgttggagca aagatgcaga atatggtctg tatagcattt atcagggtgg catctttgag 540 ctgaaagaaa atgatcgcat ctttgttagc gtgaccaacg aacatctgat cgatatggat 600 catgaagcca gcttttttgg tgcatttctg gtgggt 636 <210> 131 <211> 636 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 131 ggtccgagcc agccgaccta tccgggtgat gatgcaccgg ttgaagatct gattcgtttt 60 gttggtcgtc tgctggcata ttttggcgat accattaatc gtcgtcgtag acgtcgtcgg 120 cgtcgtgttg ttcgtccgct gggtctggca ggtcgtgttg cagcacatat taccggcacc 180 cgtggtcgta gcaataccct gagcagcccg aatagcaaaa atgaaaaagc actgggtcgc 240 aaaatcaata gctgggaaag cagccgtagc ggtcatagct ttctgagcaa tctgcatctg 300 cgtaatggtg aactggtgat tcatgaaaaa ggcttttatt atatttatag ccagacctat 360 tttcgctttc aagaagagat taaagaaaat accaaaaatg ataaacaaat ggtgcagtat 420 atctataaat ataccagcta tccggacccg attctgctga tgaaaagcgc acgtaatagc 480 tgttggagca aagatgcaga atatggtctg tatagcattt atcagggtgg catctttgag 540 ctgaaagaaa atgatcgcat ctttgttagc gtgaccaacg aacatctgat cgatatggat 600 catgaagcca gcttttttgg tgcatttctg gtgggt 636 <210> 132 <211> 741 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 132 ggtccgagcc agccgaccta tccgggtgat gatgcaccgg ttgaagatct gattcgtttt 60 gttggtcgtc tgctggcata ttttggcgat accattaatc gtcgtcgtcg ccgtcgtaga 120 cgtcgtgttg ttcgtccgct gggtctggca ggcggttgtg cagcagcatg tgcagcctgt 180 accagcgaag aaaccattag caccgttcaa gaaaaacagc agaatattag tccgctggtt 240 cgtgaacgtg gtccgcagcg ttgtgcagca catattaccg gcacccgtgg tcgtagcaat 300 accctgagca gcccgaatag caaaaatgaa aaagcactgg gtcgcaaaat caatagctgg 360 gaaagcagcc gtagcggtca tagctttctg agcaatctgc atctgcgtaa tggtgaactg 420 gtgattcatg aaaaaggctt ctactatatc tatagccaga cctatttccg cttccaagaa 480 gaaatcaaag aaaataccaa aaatgataaa caaatggtgc agtatattta caaatatacc 540 agctatccgg atccgattct gctgatgaaa agcgcacgta atagctgttg gagcaaagat 600 gcagaatatg gtctgtatag catttatcag ggtggcatct ttgagctgaa agaaaatgat 660 cgcatctttg ttagcgtgac caacgaacat ctgatcgata tggatcatga agccagcttt 720 tttggtgcat ttctggtggg t 741 <210> 133 <211> 686 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 133 ggtccgagcc agccgaccta tccgggtgat gatgcaccgg ttgaagatct gttcgtgaac 60 gtggtccgca gcgtgttgca gcacatatta ccggcacccg tggtcgtagc aataccctga 120 gcagcccgaa tagcaaaaat gaaaaagcac tgggtcgcaa aatcaatagc tgggaaagca 180 gccgtagcgg tcatagcttt ctgagcaatc tgcatctgcg taatggtgaa ctggtgattc 240 atgaaaaagg cttttattat atttatagcc agacctattt tcgctttcaa gaagagatta 300 aagaaaatac caaaaatgat aaacaaatgg tgcagtatat ctataaatat accagctatc 360 cggacccgat tctgctgatg aaaagcgcac gtaatagctg ttggagcaaa gatgcagaat 420 atggtctgta tagcatttat cagggtggca tctttgagct gaaagaaaat gatcgcatct 480 ttgttagcgt gaccaacgaa catctgatcg atatggatca tgaagccagc ttttttggtg 540 catttctggt tggtccgctg ggtctggcag gtcgtgttgt tcgtggtccg cgtcgtcctc 600 gtcgtccggg tgatgatgca ccggttgaag atctgattcg ttttgttggt cgtctgctgg 660 catattttgg cgataccatt aaccgc 686 <210> 134 <211> 663 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 134 cgcacccata ttaacaccgt tgttgcaaaa attcaggcca aaattccggg tgcaaaacgt 60 catgccgaag aagaagaggc agcaggtcgt aaacgtaaaa aacgtacccg tgttgttcgt 120 ccgctgggtc tggcaggcgg tggttgtgca gcagcatgtg cagcctgtgg tggtggtcag 180 cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 240 agcaaaaatg aaaaagcact gggtcgcaaa attaacagct gggaaagcag ccgtagcggt 300 catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 360 ttctactata tctacagcca gacctatttt cgcttccaag aagagattaa agaaaacacc 420 aaaaacgata aacaaatggt gcagtacatc tataaataca ccagctatcc ggatccgatt 480 ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggcctgtat 540 agcatttatc agggtggcat ctttgaactg aaagaaaacg atcgtatttt cgtgagcgtg 600 accaatgaac atctgatcga tatggatcat gaagccagct tttttggtgc atttctggtg 660 ggt 663 <210> 135 <211> 1305 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 135 gcagaaccga gcgcagcaac ccagagccat agcattagca gcagcagctt tggtgcagaa 60 ccgtcagcac cgggtggtgg tggtagtccg ggtgcatgtc cggcactggg caccaaaagc 120 tgtagcagca gttgtgcagt tcatgatctg attttttggc gtgacgtgaa aaaaaccggc 180 tttgtttttg gcaccaccct gattatgctg ctgagcctgg cagcatttag cgttattagc 240 gttgtgagct atctgattct ggcactgctg agcgttacca ttagctttcg tatctataaa 300 agcgttattc aggccgtgca gaaaagcgaa gaaggtcatc cgtttaaagc atatctggat 360 gttgatatta ccctgagcag cgaagcattt cacaattata tgaatgcagc catggtgcac 420 attaatcgtg ccctgaaact gattattcgt ctgtttctgg ttgaagatct ggtggatagt 480 ctgaaactgg cagtttttat gtggctgatg acctatgttg gtgccgtgtt taatggcatt 540 accctgctga tcctggccga actgctgatt tttagcgttc cgattgtgta tgaaaaatac 600 aaaacccaga tcgatcacta tgtgggtatt gcacgtgatc agaccaaaag cattgtggaa 660 aaaattcagg caaaactgcc tgggatcgca aaaaaaaaag cagaacgtcg tcgtcgccgt 720 cgtcggcgtg gtggttcagg tggtcgtgtt gttcgtccgc tgggtctggc aggcggtggt 780 agcggtggtt gtgcagcaga atgtgcagcc gcatgtccgc agcgtgttgc agcacatatt 840 accggcaccc gtggtcgtag caataccctg agtagcccga atagcaaaaa tgaaaaagca 900 ctgggtcgta aaatcaacag ctgggaaagc agccgtagcg gtcatagctt tctgagcaat 960 ctgcatctgc gtaatggtga actggtgatt catgaaaaag gcttctacta tatctacagc 1020 cagacctatt ttcgcttcca agaagagatt aaagaaaaca ccaaaaacga taaacaaatg 1080 gtgcagtaca tctataaata caccagctat ccggatccga ttctgctgat gaaaagcgca 1140 cgtaatagct gttggagcaa agatgcagaa tatggcctgt atagcattta ccagggtggt 1200 atctttgaac tgaaagaaaa cgatcgcatt tttgtgagcg tgaccaatga acatctgatc 1260 gatatggatc atgaagccag cttttttggt gcatttctgg tgggt 1305 <210> 136 <211> 1740 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 136 cgtgtggcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60 agcaaaaatg aaaaagcact gggtcgcaaa atcaatagct gggaaagcag ccgtagcggt 120 catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180 ttttattata tttatagcca gacctatttt cgctttcaag aagagattaa agaaaatacc 240 aaaaatgata aacaaatggt gcagtacatc tataaatata ccagctatcc ggacccgatt 300 ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360 agcatttatc agggtggcat ctttgagctg aaagaaaatg atcgcatctt tgttagcgtg 420 accaacgaac atctgatcga tatggatcat gaagccagct tttttggtgc atttctggtt 480 ggtggtggtg gtagccgtaa aaaacgtgca agcggtggtc cggaaggtgg tagcctggca 540 gcactgaccg cacatcaggc atgtcatctg ccgctggaaa cctttacccg tcatcgtcag 600 cctcgtggtt gggaacagct ggaacagtgt ggttatccgg ttcagcgtct ggttgcactg 660 tatctggcag cacgtctgag ctggaatcag gttgatcagg ttattgcaaa tgcactggca 720 agtccgggta gcggtggtga tctgggtgaa gcaattcgtg aaagtccgga acaggcacgt 780 ctggcactga ccctggcagc agcagaaagc gaacgttttg ttcgtcaggg caccggtaat 840 gatgaagccg gtgcagcaaa tggtccggca gatggtggtg gttcaggtgg tggtatgatt 900 gaaaccgata gcggtgttga tgatgatatg gcctgtcata aaattccggt tgatgccgat 960 ttcctgtatg catatagcac cgcaccgggt tattatagct ggcgtaatag caaagatggc 1020 agctggttta ttcagagcct gtgtgcaatg ctgaaacagt atgcagataa actggaattc 1080 atgcatattc tgacccgtgt taatcgtaaa gttgcaaccg aatttgagag ctttagcttt 1140 gatgcaacct tccatgccaa aaaacaaatt ccgtgcattg ttagcatgct gaccaaagaa 1200 ctgtatttct atcatgatgt ggatggcatg gaaaataccg aaaatagcgt tgatagcaaa 1260 agcattaaaa atctggaacc gaaaatcatc catggtagcg aaagcatgga tagcggtatg 1320 agctgggata ccggttataa aatggattat ccggaaatgg gcctgtgcat tatcatcaac 1380 aacaaaaact ttcataaaag caccggtatg accagccgta gtggcaccga tgttgatgca 1440 gcaaatctgc gtgaaacctt tcgcaatctg aaatatgaag tgcgcaacaa aaacgatctg 1500 acccgtgaag aaattgttga actgatgcgt gatgtgagca aagaagatca tagcaaacgt 1560 agcagctttg tttgtgttct gctgagccat ggtgaagaag gtattatttt tggcaccaat 1620 ggtccggtgg acctgaaaaa aatcaccaat ttttttcgtg gtgatcgttg tcgtagcctg 1680 accggtaaac cgaaactgtt tatcattcag gcatgtcgtg gcaccgaact ggattgtggt 1740 <210> 137 <211> 741 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 137 gcacgtaaag gtaaaggcca gattgaaaaa cgtaaactgc gtgaaaaacg tcgtagcacc 60 ggtgttgtta atattccggc agcagaatgt ctggatgaat atgaagatga tgaagccggt 120 cagaaagaac gtaaacgtga agatgcaatt acccagcaga ataccattca gaatgaagca 180 cgtcgtcgtc gtcgccgtcg tcgtgttgtt cgtccgctgg gtctggcagg tcagggtggt 240 agcggtggta gtccgcagcg tgttgcagca catattaccg gcacccgtgg tcgtagcaat 300 accctgagca gcccgaatag caaaaatgaa aaagcactgg gtcgcaaaat taatagctgg 360 gaaagcagcc gtagcggtca tagctttctg agcaatctgc atctgcgtaa tggtgaactg 420 gtgattcatg aaaaaggctt ttattatatt tatagccaga cctattttcg ctttcaggaa 480 gaaattaaag aaaataccaa aaacgataaa caaatggtgc agtatatcta taaatatacc 540 agctatccgg atccgattct gctgatgaaa agcgcacgta atagctgttg gagcaaagat 600 gcagaatatg gtctgtatag catttatcag ggtggcattt ttgaactgaa agaaaatgat 660 cgcatttttg tgagcgtgac caatgaacat ctgattgata tggatcatga agccagcttt 720 tttggtgcat ttctggtggg t 741 <210> 138 <211> 780 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 138 gaagaagaag cagcaggtcg taaacgtaaa aaacgtaccg cacgtaaagg taaaggccag 60 attgaaaaac gtaaactgcg tgaaaaacgc cgtagcaccg gtgttgttaa tattccggca 120 gcagaatgtc tggatgaata tgaagatgat gaagccggtc agaaagaacg caaacgtgaa 180 gatgcaatta cccagcagaa taccattcag aatgaagcac gtcgtcgtcg ccgtcgtcgg 240 cgtgttgttc gtccgctggg tctggcaggt cagggtggta gcggtggtag tccgcagcgt 300 gttgcagcac atattaccgg cacccgtggt cgtagcaata ccctgagcag cccgaatagc 360 aaaaatgaaa aagcactggg tcgcaaaatt aacagctggg aaagcagccg tagcggtcat 420 agctttctga gcaatctgca tctgcgtaat ggtgaactgg tgattcatga aaaaggcttc 480 tactatatct acagccagac ctattttcgc ttccaagaag agattaaaga aaacaccaaa 540 aacgataaac aaatggtgca gtacatctat aaatacacca gctatccgga tccgattctg 600 ctgatgaaaa gcgcacgtaa tagctgttgg agcaaagatg cagaatatgg cctgtatagc 660 atttatcagg gtggcatctt tgaactgaaa gaaaacgatc gtattttcgt gagcgtgacc 720 aatgaacatc tgatcgatat ggatcatgaa gccagctttt ttggtgcatt tctggtgggt 780 <210> 139 <211> 810 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 139 accagcgaag aaaccattag caccgttcaa gaaaaacagc agaatattag tccgctggtt 60 cgtgaacgtg gtccgcagcg tgttgcagca catattaccg gcacccgtgg tcgtagcaat 120 accctgagca gcccgaatag caaaaatgaa aaagcactgg gtcgcaaaat caatagctgg 180 gaaagcagcc gtagcggtca tagctttctg agcaatctgc atctgcgtaa tggtgaactg 240 gtgattcatg aaaaaggctt ctactatatc tatagccaga cctatttccg cttccaagaa 300 gaaatcaaag aaaataccaa aaatgataaa caaatggtgc agtatattta caaatatacc 360 agctatccgg atccgattct gctgatgaaa agcgcacgta atagctgttg gagcaaagat 420 gcagaatatg gtctgtatag catttatcag ggtggcatct ttgagctgaa agaaaatgat 480 cgcatctttg ttagcgtgac caacgaacat ctgatcgata tggatcatga agccagcttt 540 tttggtgcat ttctggttgg tggtggtagc ggttgtgcag catgtgcagc cgcatgtccg 600 ctgggtctgg caggtcgtgt tgttcgtcgg cgtcgtcgcc gtcgtcgtat gcctggtaaa 660 aaagcacgta aaaatgcaca gccgagtccg gcacgtgcac cggcagaact ggaagttgaa 720 tgtgcaaccc agctgcgtcg ttttggtgat aaactgaatt ttcgtcagaa actgctgaat 780 ctgattagca aactgttttg tagcggcacc 810 <210> 140 <211> 621 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 140 gttcgtgaac gtggtccgca gcgtgttgca gcacatatta ccggcacccg tggtcgtagc 60 aataccctga gcagcccgaa tagcaaaaat gaaaaagcac tgggtcgcaa aattaacagc 120 tgggaaagca gccgtagcgg tcatagcttt ctgagcaatc tgcatctgcg taatggtgaa 180 ctggtgattc atgaaaaagg cttctactat atctacagcc agacctattt tcgcttccaa 240 gaagagatta aagaaaacac caaaaacgat aaacaaatgg tgcagtacat ctataaatac 300 accagctatc cggatccgat tctgctgatg aaaagcgcac gtaatagctg ttggagcaaa 360 gatgcagaat atggcctgta tagcatttat cagggtggca tctttgaact gaaagaaaac 420 gatcgtattt tcgtgagcgt gaccaatgaa catctgatcg atatggatca tgaagccagc 480 ttttttggtg catttctggt tggtggtggt agcggttgtg cagcatgtgc agccgcatgt 540 ccgctgggtc tggcaggtcg tgttgttcgt cgtcgtcgcc gtcgtcggcg taaactgctg 600 aatctgatta gcaaactgtt t 621 <210> 141 <211> 933 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 141 caggattggc tgacctttca gaaaaaacat attaccaaca cccgtgatgt ggattgcgat 60 aacattatga gcaccaacct gtttcactgc aaagataaaa acaccttcat ctatagccgt 120 ccggaaccgg ttaaagcaat ttgtaaaggt attatcgcca gcaaaaatgt tctgaccacg 180 agcgagtttt atctgagcga ttgtaatgtt accagccgtc cgtgtaaata caaactgaaa 240 aaaagcacca acaaattctg cgtgacctgt gaaaatcagg caccggttca ttttgttggt 300 gttggtagct gtcgtgttgt tcgtccgctg ggtctggcag gcggtggtgg tggtagtggt 360 ggcggtggta gcaccagcga agaaaccatt agcaccgttc aagaaaaaca gcagaatatt 420 agtccgctgg ttcgtgaacg tggtccgcag cgtgttgcag cacatattac cggtacacgt 480 ggtcgtagca ataccctgag cagcccgaat agcaaaaatg aaaaagcact gggtcgcaaa 540 atcaatagct gggaaagcag ccgtagcggt catagctttc tgagcaatct gcatctgcgt 600 aatggtgaac tggtgattca tgaaaaaggc ttctactata tctatagcca gacctatttc 660 cgcttccaag aagaaatcaa agagaacacc aaaaacgata aacaaatggt gcagtacatc 720 tataaataca ccagctatcc ggatccgatt ctgctgatga aaagcgcacg taatagctgt 780 tggagcaaag atgcagaata tggtctgtat agcatttatc agggtggcat ctttgagctg 840 aaagaaaatg atcgcatctt tgttagcgtg accaacgaac atctgatcga tatggatcat 900 gaagccagct tttttggtgc atttctggtg ggt 933 <210> 142 <211> 690 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 142 gaagaacagt gggcacgtga aattggtgca cagctgcgtc gtatggcaga tgatctgaat 60 gcacagtatg aacgccgtcg tcgtcgccgt agacgtcgtc gtgttgttcg tccgctgggt 120 ctggcaggca ccagtgaaga aaccattagc accgttcaag aaaaacagca gaatattagt 180 ccgctggttc gtgaacgtgg tccgcagcgt gttgcagcac atattaccgg cacccgtggt 240 cgtagcaata ccctgagcag cccgaatagc aaaaatgaaa aagccctggg tcgcaaaatt 300 aacagctggg aaagcagccg tagcggtcat agctttctga gcaatctgca tctgcgtaat 360 ggtgaactgg tgattcacga gaaaggcttc tattatatct atagccagac ctatttccgc 420 ttccaagaag agatcaaaga gaacaccaaa aacgacaaac aaatggtgca gtacatctat 480 aaatacacca gctatccgga tccgattctg ctgatgaaaa gcgcacgtaa tagctgttgg 540 agcaaagatg cagaatatgg cctgtatagc atctatcagg gtggcatttt tgaactgaaa 600 gaaaacgatc gcatctttgt gagcgtgacc aatgaacatc tgattgatat ggatcacgaa 660 gccagctttt ttggtgcctt tctggttggt 690 <210> 143 <211> 675 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 143 accagcgaag aaaccattag caccgttcaa gaaaaacagc agaatattag tccgctggtt 60 cgtgaacgtg gtccgcagcg tgttgcagca catattaccg gcacccgtgg tcgtagcaat 120 accctgagca gcccgaatag caaaaatgaa aaagcactgg gtcgcaaaat caatagctgg 180 gaaagcagcc gtagcggtca tagctttctg agcaatctgc atctgcgtaa tggtgaactg 240 gtgattcatg aaaaaggctt ctactatatc tatagccaga cctatttccg cttccaagaa 300 gaaatcaaag aaaataccaa aaatgataaa caaatggtgc agtatattta caaatatacc 360 agctatccgg atccgattct gctgatgaaa agcgcacgta atagctgttg gagcaaagat 420 gcagaatatg gtctgtatag catttatcag ggtggcatct ttgagctgaa agaaaatgat 480 cgcatctttg ttagcgtgac caacgaacat ctgatcgata tggatcatga agccagcttt 540 tttggtgcat ttctggttgg ttgtgcagca tgtgcagccg catgtccgct gggtctggca 600 ggtcgtgttg ttcgtaatat tgcacgtcat ctggcacagg ttggtgatag catggataaa 660 ccgcgtcgtc cgtat 675 <210> 144 <211> 702 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 144 accagcgaag aaaccattag caccgttcaa gaaaaacagc agaatattag tccgctggtt 60 cgtgaacgtg gtccgcagcg tgttgcagca catattaccg gcacccgtgg tcgtagcaat 120 accctgagca gcccgaatag caaaaatgaa aaagcactgg gtcgcaaaat taacagctgg 180 gaaagcagcc gtagcggtca tagctttctg agcaatctgc atctgcgtaa tggtgaactg 240 gtgattcatg aaaaaggctt ctactatatc tacagccaga cctattttcg cttccaagaa 300 gagattaaag aaaacaccaa aaacgataaa caaatggtgc agtacatcta taaatacacc 360 agctatccgg atccgattct gctgatgaaa agcgcacgta atagctgttg gagcaaagat 420 gcagaatatg gcctgtatag catttatcag ggtggcatct ttgaactgaa agaaaacgat 480 cgtattttcg tgagcgtgac caatgaacat ctgatcgata tggatcatga agccagcttt 540 tttggtgcat ttctggttgg ttgtgcagca tgtgcagccg catgtggtgg tccgctgggt 600 ctggcaggtc gtgttgttcg tcagattaaa atctggtttc agaaccgtcg catgaaatgg 660 aaaaaaaaag cctatgcagc agccggtaac agctacttta aa 702 <210> 145 <211> 648 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 145 ttcatcagca aagaacgtcg tgaacgtgca attctgagca ccaaaccgcc tggcaccttt 60 ctgctgcgtt ttagcgaaag cagcaaacgt gttgttcgtc cgctgggtat tgccggtgaa 120 ggtggtggtt gtgcagcagc atgtgcagcc tgtggtagcg gtcagcgtgt tgcagcacat 180 attaccggca cccgtggtcg tagcaatacc ctgagcagcc cgaatagcaa aaatgaaaaa 240 gcactgggtc gcaaaattaa cagctgggaa agcagccgta gtggtcatag ctttctgagc 300 aatctgcatc tgcgtaatgg tgaactggtg attcatgaaa aaggcttcta ctatatctac 360 agccagacct attttcgctt ccaagaagag attaaagaaa acaccaaaaa cgataaacaa 420 atggtgcagt acatctataa atacaccagc tatccggatc cgattctgct gatgaaaagc 480 gcacgtaata gctgttggag caaagatgca gaatatggcc tgtatagcat ttatcagggt 540 ggcatctttg aactgaaaga aaacgatcgt attttcgtga gcgtgaccaa tgaacatctg 600 atcgatatgg atcatgaagc cagctttttt ggtgcatttc tggtgggt 648 <210> 146 <211> 582 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 146 ggacaggttg gtcgtcagct ggcaattatt ggtgatgata ttaatcgtcg tcgtcggcgt 60 cgtagacgtc gtgttgttcg tccgctgggt ctggcaggtc gtgttgcagc acatattacc 120 ggcacccgtg gtcgtagcaa taccctgagc agcccgaata gcaaaaatga aaaagcactg 180 ggtcgcaaaa tcaatagctg ggaaagcagc cgtagcggtc atagctttct gagcaatctg 240 catctgcgta atggtgaact ggtgattcat gaaaaaggct tttattatat ttatagccag 300 acctattttc gctttcaaga agagattaaa gaaaatacca aaaatgataa acaaatggtg 360 cagtacatct ataaatatac cagctatccg gacccgattc tgctgatgaa aagcgcacgt 420 aatagctgtt ggagcaaaga tgcagaatat ggtctgtata gcatttatca gggtggcatc 480 tttgagctga aagaaaatga tcgcatcttt gttagcgtga ccaacgaaca tctgatcgat 540 atggatcatg aagccagctt ttttggtgca tttctggttg gt 582 <210> 147 <211> 729 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 147 aaaaatctgt gggcagcaca gcgttatggt cgtgaactgc gtcgtatgag tgatgaattt 60 gaaggtagct ttaaaggtct gcgtcgtcgt cgtcgccgtc gtcggcgtgt tgttcgtccg 120 ctgggtctgg caggtcgtgt tgcagcacat attaccggca cccgtggtcg tagcaatacc 180 ctgagcagcc cgaatagcaa aaatgaaaaa gcactgggtc gcaaaatcaa tagctgggaa 240 agcagccgta gcggtcatag ctttctgagc aatctgcatc tgcgtaatgg tgaactggtg 300 attcatgaaa aaggctttta ttatatttat agccagacct attttcgctt tcaagaagag 360 attaaagaaa ataccaaaaa tgataaacaa atggtgcagt acatctataa atataccagc 420 tatccggacc cgattctgct gatgaaaagc gcacgtaata gctgttggag caaagatgca 480 gaatatggtc tgtatagcat ttatcagggt ggcatctttg agctgaaaga aaatgatcgc 540 atctttgtta gcgtgaccaa cgaacatctg atcgatatgg atcatgaagc cagctttttt 600 ggtgcatttc tggttggtgg tggtagccat ggtctggttc cgcgtggtag caccagcgaa 660 gaaaccatta gcaccgttca agaaaaacag cagaatatta gtccgctggt tcgtgaacgt 720 ggtccgcag 729 <210> 148 <211> 708 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 148 accagcgaag aaaccattag caccgttcaa gaaaaacagc agaatattag tcctctggtt 60 cgtgaacgtg gtccgcagcg tgttgcagca catattaccg gcacccgtgg tcgtagcaat 120 accctgagca gcccgaatag caaaaatgaa aaagcactgg gtcgcaaaat caatagctgg 180 gaaagcagcc gtagcggtca tagctttctg agcaatctgc atctgcgtaa tggtgaactg 240 gtgattcatg aaaaaggctt ttattatatt tatagccaga cctattttcg ctttcaagaa 300 gagattaaag aaaataccaa aaatgataaa caaatggtgc agtacatcta taaatatacc 360 agctatccgg acccgattct gctgatgaaa agcgcacgta atagctgttg gagcaaagat 420 gcagaatatg gtctgtatag catttatcag ggtggcatct ttgagctgaa agaaaatgat 480 cgcatctttg ttagcgtgac caacgaacat ctgatcgata tggatcatga agccagcttt 540 tttggtgcat ttctggttgg tggtggtagt ccgctgggtc tggcaggttg tcgtgttgtt 600 cgtcgtcgtc gccgtcgtcg gcgtcgtaaa aatctgtggg cagcacagcg ttatggtcgt 660 gaactgcgtc gtatgagtga tgaatttgaa ggtagcttta aaggcctg 708 <210> 149 <211> 648 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 149 cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60 agcaaaaatg aaaaagcact gggtcgcaaa attaacagct gggaaagcag ccgtagcggt 120 catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180 ttctactata tctacagcca gacctatttt cgcttccaag aagagattaa agaaaacacc 240 aaaaacgata aacaaatggt gcagtacatc tataaataca ccagctatcc ggatccgatt 300 ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggcctgtat 360 agcatttatc agggtggcat ctttgaactg aaagaaaacg atcgtatttt cgtgagcgtg 420 accaatgaac atctgatcga tatggatcat gaagccagct tttttggtgc atttctggtg 480 ggtggtggtg gcggtagtgg cggtggtggt cctctgggtc tggcaggtcg tgttgttcgt 540 aaatttgaac cgaaaagcgg ttggatgacc tttctggaag ttaccggcaa aatttgtgaa 600 atgctgagcc tgctgaaaca gtattgtaaa ccgcgtcgtc cgtatcgc 648 <210> 150 <211> 711 <212> DNA <213> Artificial Sequence <220> <223> fusion protein <400> 150 cgtgttagct tttgtcgtcc gggttggagc gcaatggcac gtagccgtct gaccgcaacc 60 agcgttagcc aggttcaaga aaatggtttc gtgaaaaaat tcgaaccgaa aagcggttgg 120 atgacctttc tggaagttac cggcaaaatt tgtgaaatgc tgagcctgct gaaacagtat 180 tgtcgtgttg ttcgtccgct gggtctggca ggcggtggta gcggtggtcg tgttgcagca 240 catattaccg gcacccgtgg tcgtagcaat accctgagca gcccgaatag caaaaatgaa 300 aaagcactgg gtcgcaaaat taacagctgg gaaagcagcc gtagcggtca tagctttctg 360 agcaatctgc atctgcgtaa tggtgaactg gtgattcatg aaaaaggctt ctactatatc 420 tacagccaga cctattttcg cttccaagaa gagattaaag aaaacaccaa aaacgataaa 480 caaatggtgc agtacatcta taaatacacc agctatccgg atccgattct gctgatgaaa 540 agcgcacgta atagctgttg gagcaaagat gcagaatatg gcctgtatag catttatcag 600 ggtggcatct ttgaactgaa agaaaacgat cgtattttcg tgagcgtgac caatgaacat 660 ctgatcgata tggatcatga agccagcttt tttggtgcat ttctggtggg t 711 <210> 151 <211> 28 <212> PRT <213> Pseudomonas aeruginosa <300> <308> GenBankAAA25730.1 <309> 2000-03-19 <313> (70)..(97) <400> 151 Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala 1 5 10 15 Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp 20 25 <210> 152 <211> 148 <212> PRT <213> Pseudomonas aeruginosa <300> <308> GenBank/AAA25730.1 <309> 2000-03-29 <313> (1)..(148) <400> 152 Met Leu Arg Lys Leu Ala Ala Val Ser Leu Leu Ser Leu Leu Ser Ala 1 5 10 15 Pro Leu Leu Ala Ala Glu Cys Ser Val Asp Ile Gln Gly Asn Asp Gln 20 25 30 Met Gln Phe Asn Thr Asn Ala Ile Thr Val Asp Lys Ser Cys Lys Gln 35 40 45 Phe Thr Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val Met 50 55 60 Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val 65 70 75 80 Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp 85 90 95 Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys 100 105 110 Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr 115 120 125 Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Met Lys Gly Thr 130 135 140 Leu Thr Leu Lys 145 <210> 153 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <300> <301> E. P. Holinger, T. Chittenden, R. J. Lutz, J. <302> Bak BH3 peptides antagonize Bcl-xL function and induce apoptosis through cytochrome c-independent activation of caspases. <303> Journal of Biological Chemistry <304> 7 <305> 274(19): <306> 13298-304 <307> 1999-05-07 <400> 153 Gly Pro Ser Gln Pro Thr Tyr Pro Gly Asp Asp Ala Pro Val Glu Asp 1 5 10 15 Leu Ile Arg Phe Val Gly Arg Leu Leu Ala Tyr Phe Gly Asp Thr Ile 20 25 30 Asn Arg Arg 35 <210> 154 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> fusion protein <300> <301> E. P. Holinger, T. Chittenden, R. J. Lutz <302> Bak BH3 Peptides Antagonize Bcl-xL Function and Induce Apoptosis through Cytochrome c-independent Activation of Caspases <303> Journal of Biological Chemistry <304> 7 <305> 274(19) <306> 13298-304 <307> 1999-05-07 <400> 154 Gly Pro Arg Arg Pro Arg Arg Pro Gly Asp Asp Ala Pro Val Glu Asp 1 5 10 15 Leu Ile Arg Phe Val Gly Arg Leu Leu Ala Tyr Phe Gly Asp Thr Ile 20 25 30 Asn Arg <210> 155 <211> 23 <212> PRT <213> Homo sapiens <300> <301> Nepravishta R, Bellomaria A, Polizio F, Paci M, Melino S. <302> Reticulon RTN1-C(CT)peptide: a potential nuclease and inhibitor of histone deacetylase enzymes <303> Biochemistry <304> 19 <305> 49(2) <306> 252-8 <307> 2010-01-19 <400> 155 Arg Thr His Ile Asn Thr Val Val Ala Lys Ile Gln Ala Lys Ile Pro 1 5 10 15 Gly Ala Lys Arg His Ala Glu 20 <210> 156 <211> 235 <212> PRT <213> Homo sapiens <300> <308> GenBank/NP_006045 <309> 2011-06-01 <313> (2)..(236) <400> 156 Ala Glu Pro Ser Ala Ala Thr Gln Ser His Ser Ile Ser Ser Ser Ser 1 5 10 15 Phe Gly Ala Glu Pro Ser Ala Pro Gly Gly Gly Gly Ser Pro Gly Ala 20 25 30 Cys Pro Ala Leu Gly Thr Lys Ser Cys Ser Ser Ser Cys Ala Val His 35 40 45 Asp Leu Ile Phe Trp Arg Asp Val Lys Lys Thr Gly Phe Val Phe Gly 50 55 60 Thr Thr Leu Ile Met Leu Leu Ser Leu Ala Ala Phe Ser Val Ile Ser 65 70 75 80 Val Val Ser Tyr Leu Ile Leu Ala Leu Leu Ser Val Thr Ile Ser Phe 85 90 95 Arg Ile Tyr Lys Ser Val Ile Gln Ala Val Gln Lys Ser Glu Glu Gly 100 105 110 His Pro Phe Lys Ala Tyr Leu Asp Val Asp Ile Thr Leu Ser Ser Glu 115 120 125 Ala Phe His Asn Tyr Met Asn Ala Ala Met Val His Ile Asn Arg Ala 130 135 140 Leu Lys Leu Ile Ile Arg Leu Phe Leu Val Glu Asp Leu Val Asp Ser 145 150 155 160 Leu Lys Leu Ala Val Phe Met Trp Leu Met Thr Tyr Val Gly Ala Val 165 170 175 Phe Asn Gly Ile Thr Leu Leu Ile Leu Ala Glu Leu Leu Ile Phe Ser 180 185 190 Val Pro Ile Val Tyr Glu Lys Tyr Lys Thr Gln Ile Asp His Tyr Val 195 200 205 Gly Ile Ala Arg Asp Gln Thr Lys Ser Ile Val Glu Lys Ile Gln Ala 210 215 220 Lys Leu Pro Gly Ile Ala Lys Lys Lys Ala Glu 225 230 235 <210> 157 <211> 282 <212> PRT <213> Homo sapiens <300> <301> Srinivasula SM, Ahmad M, MacFarlane M, Luo Z, Huang Z, Fernandes-Alnemri T, Alnemri ES <302> Generation of constitutively active recombinant caspases-3 and -6 by rearrangement of their subunits <303> Journal of Biological Chemistry <304> 273 <305> 17 <306> 10107-11 <307> 1998-04-24 <400> 157 Met Ile Glu Thr Asp Ser Gly Val Asp Asp Asp Met Ala Cys His Lys 1 5 10 15 Ile Pro Val Asp Ala Asp Phe Leu Tyr Ala Tyr Ser Thr Ala Pro Gly 20 25 30 Tyr Tyr Ser Trp Arg Asn Ser Lys Asp Gly Ser Trp Phe Ile Gln Ser 35 40 45 Leu Cys Ala Met Leu Lys Gln Tyr Ala Asp Lys Leu Glu Phe Met His 50 55 60 Ile Leu Thr Arg Val Asn Arg Lys Val Ala Thr Glu Phe Glu Ser Phe 65 70 75 80 Ser Phe Asp Ala Thr Phe His Ala Lys Lys Gln Ile Pro Cys Ile Val 85 90 95 Ser Met Leu Thr Lys Glu Leu Tyr Phe Tyr His Asp Val Asp Gly Met 100 105 110 Glu Asn Thr Glu Asn Ser Val Asp Ser Lys Ser Ile Lys Asn Leu Glu 115 120 125 Pro Lys Ile Ile His Gly Ser Glu Ser Met Asp Ser Gly Met Ser Trp 130 135 140 Asp Thr Gly Tyr Lys Met Asp Tyr Pro Glu Met Gly Leu Cys Ile Ile 145 150 155 160 Ile Asn Asn Lys Asn Phe His Lys Ser Thr Gly Met Thr Ser Arg Ser 165 170 175 Gly Thr Asp Val Asp Ala Ala Asn Leu Arg Glu Thr Phe Arg Asn Leu 180 185 190 Lys Tyr Glu Val Arg Asn Lys Asn Asp Leu Thr Arg Glu Glu Ile Val 195 200 205 Glu Leu Met Arg Asp Val Ser Lys Glu Asp His Ser Lys Arg Ser Ser 210 215 220 Phe Val Cys Val Leu Leu Ser His Gly Glu Glu Gly Ile Ile Phe Gly 225 230 235 240 Thr Asn Gly Pro Val Asp Leu Lys Lys Ile Thr Asn Phe Phe Arg Gly 245 250 255 Asp Arg Cys Arg Ser Leu Thr Gly Lys Pro Lys Leu Phe Ile Ile Gln 260 265 270 Ala Cys Arg Gly Thr Glu Leu Asp Cys Gly 275 280 <210> 158 <211> 60 <212> PRT <213> Homo sapiens <300> <308> GenBank/AAC24947.1 <309> 1998-07-01 <313> (146)..(205) <400> 158 Ala Arg Lys Gly Lys Gly Gln Ile Glu Lys Arg Lys Leu Arg Glu Lys 1 5 10 15 Arg Arg Ser Thr Gly Val Val Asn Ile Pro Ala Ala Glu Cys Leu Asp 20 25 30 Glu Tyr Glu Asp Asp Glu Ala Gly Gln Lys Glu Arg Lys Arg Glu Asp 35 40 45 Ala Ile Thr Gln Gln Asn Thr Ile Gln Asn Glu Ala 50 55 60 <210> 159 <211> 54 <212> PRT <213> Homo sapiens <300> <308> GenBank/NP_066950 <309> 2011-06-05 <313> (1)..(54) <400> 159 Met Pro Gly Lys Lys Ala Arg Lys Asn Ala Gln Pro Ser Pro Ala Arg 1 5 10 15 Ala Pro Ala Glu Leu Glu Val Glu Cys Ala Thr Gln Leu Arg Arg Phe 20 25 30 Gly Asp Lys Leu Asn Phe Arg Gln Lys Leu Leu Asn Leu Ile Ser Lys 35 40 45 Leu Phe Cys Ser Gly Thr 50 <210> 160 <211> 9 <212> PRT <213> Homo sapiens <300> <302> CELL-KILLING PEPTIDE <310> WO2006001582 <311> 2005-03-22 <312> 2006-01-05 <400> 160 Lys Leu Leu Asn Leu Ile Ser Lys Leu 1 5 <210> 161 <211> 27 <212> PRT <213> Homo sapiens <300> <302> NOVEL HSP90-TARGETED ANTI-CANCER CHIMERIC PEPTIDE <310> WO2010055929 <311> 2009-11-13 <312> 2010-05-20 <400> 161 Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys Lys 1 5 10 15 Ala Tyr Ala Ala Ala Gly Asn Ser Tyr Phe Lys 20 25 <210> 162 <211> 29 <212> PRT <213> Homo sapiens <300> <301> Zhao W, Jaganathan S, Turkson <302> A cell-permeable Stat3 SH2 domain mimetic inhibits Stat3 activation and induces antitumor cell effects in vitro <303> Journal of Biological Chemistry <304> 285 <305> 46 <306> 35855-65. <307> 2010-11-12 <308> genBank/NP_644805 <309> 2011-06-05 <313> (517)..(544) <400> 162 Phe Ile Ser Lys Glu Arg Arg Glu Arg Ala Ile Leu Ser Thr Lys Pro 1 5 10 15 Pro Gly Thr Phe Leu Leu Arg Phe Ser Glu Ser Ser Lys 20 25 <210> 163 <211> 15 <212> PRT <213> Homo sapiens <300> <308> GenBank/AAA74466.1 <309> 1995-08-18 <313> (72)..(86) <400> 163 Gly Gln Val Gly Arg Gln Leu Ala Ile Ile Gly Asp Asp Ile Asn 1 5 10 15 <210> 164 <211> 27 <212> PRT <213> Homo sapiens <300> <301> Wang JL, Zhang ZJ, Choksi S, Shan S, Lu Z, Croce CM, Alnemri ES, Korngold R, Huang Z. <302> Cell permeable Bcl-2 binding peptides: a chemical approach to apoptosis induction in tumor cells <303> Cancer Research <304> 60 <305> 6 <306> 1498-502 <307> 2000-03-15 <400> 164 Lys Asn Leu Trp Ala Ala Gln Arg Tyr Gly Arg Glu Leu Arg Arg Met 1 5 10 15 Ser Asp Glu Phe Glu Gly Ser Phe Lys Gly Leu 20 25 <210> 165 <211> 29 <212> PRT <213> Homo sapiens <300> <308> GenBank/CAG46760.1 <309> 2004-06-29 <313> (147)..(175) <400> 165 Lys Phe Glu Pro Lys Ser Gly Trp Met Thr Phe Leu Glu Val Thr Gly 1 5 10 15 Lys Ile Cys Glu Met Leu Ser Leu Leu Lys Gln Tyr Cys 20 25 <210> 166 <211> 32 <212> PRT <213> Homo sapiens <300> <301> Ko JK, Choi KH, Pan Z, Lin P, Weisleder N, Kim CW, Ma J. <302> The tail-anchoring domain of Bfl1 and HCCS1 targets mitochondrial membrane permeability to induce apoptosis <303> J Cell Sci. <304> 120 <305> 16 <306> 2912-23. <307> 2007-07-31 <400> 166 Arg Val Ser Phe Cys Arg Pro Gly Trp Ser Ala Met Ala Arg Ser Arg 1 5 10 15 Leu Thr Ala Thr Ser Val Ser Gln Val Gln Glu Asn Gly Phe Val Lys 20 25 30 <210> 167 <211> 6 <212> PRT <213> Homo sapiens <400> 167 Lys Pro Arg Arg Pro Tyr 1 5 <210> 168 <211> 13 <212> PRT <213> Homo sapiens <300> <308> NCBI Reference Sequence/NP_002690.3 <309> 2011-04-19 <313> (334)..(344) <400> 168 Glu Glu Glu Ala Ala Gly Arg Lys Arg Lys Lys Arg Thr 1 5 10 <210> 169 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> flexible linker <400> 169 Ser Gly Cys Gly Ser 1 5 <210> 170 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Pegylation linker <400> 170 Ala Ser Gly Cys Gly Pro Glu 1 5 <210> 171 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> MMP protease cleavage site <400> 171 Pro Leu Gly Ile Ala Gly Glu 1 5 <210> 172 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Furin cleavage site <300> <301> chards RM, Lowy DR, Schiller JT, Day PM <302> Cleavage of the papillomavirus minor capsid protein, L2, at a furin consensus site is necessary for infection. <303> Proc Natl Acad Sci U S A <304> 103 <305> 5 <306> 1522-7 <307> 2006-01-31 <400> 172 Arg Lys Lys Arg Val Lys Arg 1 5 <210> 173 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> MMP cleavage site <400> 173 Pro Leu Gly Leu Ala Gly Gln 1 5 <210> 174 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Thrombin cleavage site <400> 174 Leu Val Pro Arg Gly Ser 1 5 <210> 175 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> flexible steric linker <400> 175 Gly Gly Gly Gly Ser Gly Gly Gly Ser 1 5 <210> 176 <211> 107 <212> PRT <213> Pseudomonas aeruginosa <300> <308> GenBank/1IKQ_A <309> 2008-08-24 <313> (251)..(357) <400> 176 Pro Glu Gly Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys His 1 5 10 15 Leu Pro Leu Glu Thr Phe Thr Arg His Arg Gln Pro Arg Gly Trp Glu 20 25 30 Gln Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu Tyr 35 40 45 Leu Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Arg Asn 50 55 60 Ala Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile Arg 65 70 75 80 Glu Gln Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala Glu 85 90 95 Ser Glu Arg Phe Val Arg Gln Gly Thr Gly Asn 100 105 <210> 177 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> trimerization domain <400> 177 Cys Ala Ala Cys Ala Ala Ala Cys 1 5 <210> 178 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> trimerization domain <400> 178 Cys Ala Ala Glu Cys Ala Ala Ala Cys 1 5 <210> 179 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> trimerization domain <400> 179 Cys Ala Ala Ala Cys Ala Ala Cys 1 5 <210> 180 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> flexible linker <400> 180 Gly Gly Gly Gly Ser Gly Gly Gly Gly 1 5 <210> 181 <211> 7 <212> PRT <213> Homo sapiens <400> 181 Lys Pro Arg Arg Pro Tyr Arg 1 5 <210> 182 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> flexible linker <400> 182 Gly Gly Ser His Gly 1 5 <210> 183 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> flexible linker <400> 183 Ser Gly Gly Cys Gly Gly Ser 1 5 <210> 184 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> flexible linker <400> 184 Ala Ala Cys Ala Ala 1 5

Claims

가용성 hTRAIL 단백질 서열의 기능 분절인 도메인 (a)로서, 상기 기능 분절은 세포사멸 신호를 유도할 수 있고, hTRAIL95에서 hTRAIL121까지의 범위의 위치에 있는 아미노산으로부터 시작하여, 아미노산 hTRAIL281로 종결하는 것인 도메인 (a); 및
내인성 세포사멸 경로를 통해 그의 세포사멸 유발 작용(pro-apoptotic action)을 실행하는, 세포사멸 유발 효과기 펩티드의 서열인 도메인 (b)
를 포함하는 융합 단백질로서, 상기 도메인 (b)는 하기로 이루어진 군으로부터 선택되고:
- 서열 번호 30의 Bax 단백질의 BH3 도메인의 분절;
- 서열 번호 31의 Bid 단백질의 분절;
- 서열 번호 32의 리보뉴클레아제 A;
- 서열 번호 33의 시토크롬 C;
- 서열 번호 34의 그랜자임 B;
- 서열 번호 35의 Nur77 단백질의 분절;
- 서열 번호 36의 Bak 단백질의 BH3 도메인;
- 서열 번호 37의 PUMA/BBC3 단백질의 BH3 도메인;
- 서열 번호 38의 PUMA/BBC3 단백질;
- 서열 번호 39의 SMAC/Diablo 단백질의 분절;
- 서열 번호 40의 부포린 A;
- 서열 번호 41의 온코나제;
- 서열 번호 42의 Mdm2 단백질의 분절;
- 서열 번호 43의 Mdm2에 대한 펩티드 결합;
- 서열 번호 44의 루나신의 분절;
- 서열 번호 45의 Bik 단백질의 BH3 도메인;
- 서열 번호 46의 프로테아좀의 펩티드 억제제;
- 서열 번호 47의 프로테아좀 결합 UIM 모티프를 포함하는 도메인;
- 서열 번호 151의 아주린 유도된 펩티드;
- 서열 번호 152의 전체 길이의 아주린 펩티드;
- 서열 번호 153의 Bax 단백질의 BH3 도메인 및 aPP 단백질로부터 지정된 펩티드;
- 서열 번호 154의 Bax 단백질의 BH3 도메인 및 aPP 단백질로부터 지정된 펩티드;
- 서열 번호 155의 레티쿨론 RTN1-C 유도된 펩티드;
- 서열 번호 156의 전체 길이의 인간 레티쿨론 3;
- 서열 번호 157의 변형된, 구성적으로 활성인 카스파제-3;
- 서열 번호 158의 Par-4 단백질로부터의 SAC 도메인;
- 서열 번호 159의 녹사(Noxa) 단백질;
- 서열 번호 160의 녹사 단백질의 MTD/CKP 분절;
- 서열 번호 161의 짧은 하이브리드 펩티드(short hybride peptide) Antp-TPR;
- 서열 번호 162의 Stat3 단백질의 SH2 도메인의 펩티드 억제제;
- 서열 번호 163의 Bak 단백질의 BH3 도메인으로부터 유도된 펩티드;
- 서열 번호 164의 Bad 단백질의 BH3 도메인으로부터 유도된 펩티드; 및
- 서열 번호 165의 Bfl1 단백질로부터의 펩티드 ATAP
상기 도메인 (b)의 서열은 상기 도메인 (a)의 C-말단 및/또는 N-말단에 부착되는 것인, 융합 단백질.
삭제
청구항 1에 있어서, 상기 도메인 (a)는 hTRAIL95-281, hTRAIL114-281 (서열 번호 27), hTRAIL119-281 (서열 번호 28), hTRAIL121-281 (서열 번호 29), hTRAIL116-281 및 hTRAIL120-281로 이루어진 군으로부터 선택된 것인, 융합 단백질.
삭제
삭제
청구항 1에 있어서, 도메인 (a) 및 도메인 (b) 사이에, 메탈로프로테아제 MMP에 의해 인식되는 서열, 유로키나제 uPA에 의해 인식되는 서열, 퓨린에 의해 인식되는 서열, 및 그의 조합으로부터 선택된, 종양 세포 환경에 존재하는 프로테아제에 의해 인식된 프로테아제 절단 부위를 포함하는 도메인 (c)를 함유하는 융합 단백질.
청구항 6에 있어서, 상기 메탈로프로테아제 MMP에 의해 인식되는 서열은 서열 번호 51, 서열 번호 171 또는 서열 번호 173이고, 상기 유로키나제 uPA에 의해 인식되는 서열은 서열 번호 52이고, 상기 퓨린에 의해 인식되는 서열은 서열 번호 53 또는 서열 번호 172인 것인, 융합 단백질.
청구항 6 또는 청구항 7에 있어서, 상기 도메인 (c)는 서로 나란히 위치된 메탈로프로테아제 MMP 및 유로키나제 uPA에 의해 인식되는 서열의 조합인 것인, 융합 단백질.
청구항 6 또는 청구항 7에 있어서, 상기 도메인 (c)는 퓨린에 의해 인식되는 서열인 것인, 융합 단백질.
청구항 1에 있어서, 상기 도메인 (b)는:
(d1) 소포체로 향하는 서열,
(d2) 6, 7, 8 또는 9 Arg 잔기를 포함하는, 세포막을 통해 수송하는 폴리아르기닌 서열,
(d3) 서열 번호 54 또는 서열 번호 176으로부터 선택된 녹농균(Pseudomonas aeruginosa) 전좌 도메인,
(d4) 막 수송 도메인,
(d5) 핵 국지화 도메인, 및
(d6) 미토콘드리아 타겟팅 도메인,
및 그의 조합으로 이루어진 군으로부터 선택된 수송 도메인 (d)와 추가로 연결된 것인, 융합 단백질.
청구항 10에 있어서, 상기 소포체로 향하는 서열 (d1)은 KEDL (서열 번호 55) 또는 KDEL (서열 번호 56)인 것인, 융합 단백질.
청구항 10 또는 청구항 11에 있어서, 상기 소포체로 향하는 서열 (d1)은 상기 융합 단백질의 C-말단에 위치되는 것인, 융합 단백질.
청구항 10에 있어서, 상기 폴리아르기닌 서열 (d2)는 상기 융합 단백질의 C-말단에 위치되는 것인, 융합 단백질.
청구항 10에 있어서, 상기 폴리아르기닌 서열 (d2)는 도메인 (b) 및 도메인 (c) 사이에 위치되는 것인, 융합 단백질.
청구항 10에 있어서, 상기 녹농균 전좌 도메인 (d3)은 도메인 (a) 및 도메인 (c) 사이에 위치되는 것인, 융합 단백질.
청구항 1에 있어서, 도메인 (a) 및 도메인 (b) 사이에 글리신-세린 가요성 입체 링커(flexible steric linker)의 도메인 (e)를 추가로 포함하는 융합 단백질.
청구항 16에 있어서, 상기 글리신-세린 링커는, GGSG (서열 번호 57), GGGS (서열 번호 58), GGGGS (서열 번호 59), GGSGG (서열 번호 60), GGGSGG (서열 번호 61), GGGSGGG (서열 번호 62), GGGSGGGS (서열 번호 63), GGGSGGGGS (서열 번호 64), ASGG (서열 번호 65), GGGSASGG (서열 번호 66), GGSHG (서열 번호 182), SGCGS (서열 번호 169), GGGGSGGGG (서열 번호 180), SGGCGGS(서열 번호 183) 및 AACAA (서열 번호 184)로 이루어진 군으로부터 선택된 것인, 융합 단백질.
청구항 1에 있어서, 서열 번호 1; 서열 번호 2; 서열 번호 3; 서열 번호 4; 서열 번호 5; 서열 번호 6; 서열 번호 7; 서열 번호 8; 서열 번호 9; 서열 번호 10; 서열 번호 11; 서열 번호 12; 서열 번호 13; 서열 번호 14; 서열 번호 15; 서열 번호 16; 서열 번호 17; 서열 번호 18; 서열 번호 19; 서열 번호 20; 서열 번호 21; 서열 번호 22; 서열 번호 23; 서열 번호 24; 서열 번호 25, 서열 번호 26, 서열 번호 93, 서열 번호 94, 서열 번호 95, 서열 번호 96, 서열 번호 97, 서열 번호 98, 서열 번호 99, 서열 번호 100, 서열 번호 101, 서열 번호 102, 서열 번호 103, 서열 번호 104, 서열 번호 105, 서열 번호 106, 서열 번호 107, 서열 번호 108, 서열 번호 109, 서열 번호 110, 서열 번호 111, 서열 번호 112, 서열 번호 113, 서열 번호 114, 서열 번호 115, 서열 번호 116, 서열 번호 117, 서열 번호 118, 서열 번호 119, 서열 번호 120 및 서열 번호 121로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는, 융합 단백질.
청구항 1 또는 청구항 18에 있어서, 재조합 단백질인 융합 단백질.
청구항 1 또는 청구항 18에 있어서, 구조물로부터 그의 절단을 가능하게 하는 프로테아제 절단 부위의 서열이 선행하는, 서열 hTRAIL95-121을 그것의 C-말단 부분으로서 추가로 함유하는 융합 단백질.
청구항 1 또는 청구항 18에 기재된 융합 단백질을 코딩하는 폴리뉴클레오티드.
청구항 21에 있어서, 대장균(E. coli)에서의 유전자 발현을 위해 사용되는 폴리뉴클레오티드.
청구항 22에 있어서, 서열 번호 67; 서열 번호 68; 서열 번호 69; 서열 번호 70; 서열 번호 71; 서열 번호 72; 서열 번호 73; 서열 번호 74; 서열 번호 75; 서열 번호 76; 서열 번호 77; 서열 번호 78; 서열 번호 79; 서열 번호 80; 서열 번호 81; 서열 번호 82; 서열 번호 83; 서열 번호 84; 서열 번호 85; 서열 번호 86; 서열 번호 87; 서열 번호 88; 서열 번호 89; 서열 번호 122; 서열 번호 123; 서열 번호 124; 서열 번호 125; 서열 번호 126; 서열 번호 127; 서열 번호 128; 서열 번호 129; 서열 번호 130; 서열 번호 131; 서열 번호 132; 서열 번호 133; 서열 번호 134; 서열 번호 135; 서열 번호 136; 서열 번호 137; 서열 번호 138; 서열 번호 139; 서열 번호 140; 서열 번호 141; 서열 번호 142; 서열 번호 143; 서열 번호 144; 서열 번호 145; 서열 번호 146; 서열 번호 147; 서열 번호 148; 서열 번호 149; 및 서열 번호 150으로 이루어진 군으로부터 선택된 서열에 의해 표시되는 폴리뉴클레오티드.
청구항 21에 기재된 폴리뉴클레오티드를 포함하는 발현 벡터.
청구항 24에 기재된 발현 벡터를 포함하는 숙주 세포.
청구항 25에 있어서, 상기 숙주 세포는 대장균(E. coli) 세포인 숙주 세포.
약제학적으로 허용가능한 담체와 조합하여 청구항 1 또는 청구항 18에 기재된 융합 단백질을 활성 성분으로서 포함하는, 혈액암, 유방암, 폐암, 대장암, 췌장암, 난소암, 방광암, 전립선암, 신장암 또는 뇌종양(brain cancer)의 치료를 위한 약제학적 조성물.
삭제
삭제
청구항 6에 있어서, 도메인 (a) 및 도메인 (c), 또는 도메인 (b) 및 도메인 (c) 사이에 글리신-세린 가요성 입체 링커의 도메인 (e)를 추가로 포함하는 융합 단백질.
청구항 10에 있어서, 도메인 (a) 및 도메인 (b), 또는 도메인 (b) 및 도메인 (d) 사이에 글리신-세린 가요성 입체 링커의 도메인 (e)를 추가로 포함하는 융합 단백질.
청구항 6에 있어서, 상기 도메인 (b)는:
(d1) 소포체로 향하는 서열,
(d2) 6, 7, 8 또는 9 Arg 잔기를 포함하는, 세포막을 통해 수송하는 폴리아르기닌 서열,
(d3) 서열 번호 54 또는 서열 번호 176으로부터 선택된 녹농균(Pseudomonas aeruginosa) 전좌 도메인,
(d4) 막 수송 도메인,
(d5) 핵 국지화 도메인, 및
(d6) 미토콘드리아 타겟팅 도메인,
및 그의 조합으로 이루어진 군으로부터 선택된 수송 도메인 (d)와 추가로 연결된 것인, 융합 단백질.
청구항 32에 있어서, 도메인 (a) 및 도메인 (c), 도메인 (b) 및 도메인 (c), 도메인 (b) 및 도메인 (d), 또는 도메인 (c) 및 도메인 (d) 사이에 글리신-세린 가요성 입체 링커의 도메인 (e)를 추가로 포함하는 융합 단백질.