KR20140036239A

KR20140036239A - 치료용 융합 단백질

Info

Publication number: KR20140036239A
Application number: KR1020137033432A
Authority: KR
Inventors: 존 채덕; 일레인 하퍼
Original assignee: 신택신 리미티드
Priority date: 2011-05-16
Filing date: 2012-05-16
Publication date: 2014-03-25
Also published as: MX348047B; KR102032760B1; US10704038B2; JP2014516526A; CA2835285C; AU2012257578B9; US20190062721A1; JP6050330B2; CN103649317B; EP2710129B1; US20140147429A1; AU2012257578A1; AU2012257578B2; RU2651492C2; US10081803B2; GB201108108D0; WO2012156743A1; ES2562425T3; EP2710129A1; MX2013013447A

Abstract

본 발명은 비-세포독성 프로테아제, 전위 펩티드 및 표적화 모이어티 펩티드를 포함하고 상기 표적화 모이어티는 유리 N-말단 도메인 및 유리 C-말단 도메인을 갖는 표적화된 분비 억제제(Targeted Secretion Inhibitor)(TSI)의 새로운 클래스의 구성(construction) 및; 그의 단일-쇄 융합 단백질 전구체, 및 상기 단일-쇄 융합 단백질 전구체를 활성화시키는 방법에 관한 것이다.

Description

치료용 융합 단백질{Therapeutic fusion proteins}

본 발명은 표적화된 분비 억제제(Targeted Secretion Inhibitor)(TSI)의 새로운 클래스의 구성(construction), 그의 활성화 방법, 및 활성화된 생성물에 관한 것이다.

비-세포독성 프로테아제(non-cytotoxic protease)는 세포 기능을 무력화하는 것에 의해 표적세포에 작용하는, 프로테아제의 잘 알려진 그룹이다. 중요하게, 비-세포독성 프로테아제는 그들이 작용하는 표적 세포를 죽이지 않는다. 비-세포독성 프로테아제의 가장 잘 알려진 예는 클로스티리디움 신경독소(clostridial neurotoxins)(예를 들면, Dysport^TM, Neurobloc^TM, 및 Botox^TM와 같은 이름으로 판매되는 보툴리눔 신경독소(botulinum neurotoxin)) 및 IgA 프로테아제를 포함한다.

비-세포독성 프로테아제는 SNARE 단백질(예를 들면, SNAP-25, VAMP, 또는 신택신(syntaxin))로 알려진 세포내 수송 단백질(intracellular transport protein)을 단백질 분해-절단(proteolytically-cleaving)하는 것에 의해 작용한다 - Gerald K (2002) "Cell and Molecular Biology" (4th edition) John Wiley & Sons , Inc 참조. 약어 SNARE는 S oluble N SF A ttachment Re ceptor에서 유래하였으며, NSF는 N-에틸말레이미드-민강성 인자( N -ethylmaleimide- S ensitive F actor)를 의미한다. SNARE 단백질은 세포내 소포(vesicle) 형성에 필수적이고, 따라서 세포의 소포 수송을 통한 분자의 분비에 필수적이다. 따라서, 원하는 표적 세포에 전달된 후, 비-세포독성 프로테아제는 표적 세포의 세포 분비를 억제할 수 있다.

비-세포독성 프로테아제는 그들의 원시(native) 형태 또는 실질적인 원시 형태(즉, Dysport^TM, Neurobloc^TM, 및 Botox^TM의 경우에서와 같은 홀로톡신(holotoxin))로 이용될 수 있고, 특정 세포-타입에 대한 프로테아제의 표적화인 경우에는 (i) 프로테아제의 국소적인 투여에 의지하거나 및/또는 (ii) 원시 프로테아제의 내재된 결합 능력에 의존한다. 대안적으로, 비-세포독성 프로테아제는 원시 프로테아제가 표적화 모이어티(Targeting Moiety)(TM)로 알려진 외인성 리간드를 포함하도록 변형된 재-표적화된(re-targeted) 형태로 이용될 수 있다. TM은 원하는 표적 세포에 결합 특이성을 제공하도록 선택되고, 재-표적화 과정의 일부로서, 비-세포독성 프로테아제의 원시 결합 부분이 제거될 수 있다.

본 출원인은 클로스트리디움 신경 독소-기반 재-표적화 기술의 개념 및 개발을 개척하였으며, 결과적으로 수득된 융합 단백질은 표적화된 분비 억제제(Targeted Secretion Inhibitor)(TSI)로 알려져 있다.

TM 치환은 당업자에게 잘 알려진, 종래의 화학적 컨쥬게이션 기법(chemical conjugation technique)에 의해 수행될 수 있다. 이와 관련하여, Hermanson, G.T. (1996), Bioconjugate techniques, Academic Press 및 Wong, S.S. (1991), Chemistry of protein conjugation and cross-linking, CRC Press를 참조한다.

그러나, 화학적 컨쥬게이션은 종종 부정확하다. 예를 들면, 컨쥬게이션 후, TM은 둘 이상의 부착 부위(attachment site)에서 컨쥬게이트(conjugate)의 나머지 부분과 결합(join)될 수 있다. 화학적 컨쥬게이션은 또한 제어하기 어렵다. 예를 들면, TM은 프로테아제 성분(component) 및/또는 전위(translocation) 성분의 부착 부위에서 변형된 독소의 나머지 부분에 결합될 수 있다. 치료 효과를 위해서 상기 구성요소 중 한 부분(바람직하게는 단일 부위)에서의 부착이 요구되는 경우, 문제가 된다. 따라서, 화학적 컨쥬게이션은 변형된 독소 분자의 혼합된 집단을 초래하고, 이는 바람직하지 않다.

화학적 컨쥬게이션에 대한 대안으로, TM 치환은 단일-쇄(single-chain) 폴리펩티드 융합 단백질의 재조합 제조(preparation)에 의해 영향을 받을 수 있다. 이러한 분자의 제조는 WO98/07864에 기술되어 있다. 그러나, 본 발명자는 WO98/07864의 방법이 TM의 모든 타입에 적합한 것은 아니라는 것을 확인하였다.

WO98/07864에 대한 대안적인 시스템은 WO2006/059093에 기술되어 있다. WO2006/059093에 따르면, TM은 단일-쇄 융합 단백질 내에서 비-세포독성 프로테아제 성분과 전위 도메인 성분 사이에, 중앙에 제시된다(centrally-presented)(CP). 이는 하기의 구조를 갖는 단일-쇄 융합 단백질이 된다:

NH₂ - [프로테아제 성분] - [TM] - [전위 성분] - COOH

전술된 융합 단백질은 프로테아제 성분의 C-말단에 위치한 부위를 절단하는 프로테아제의 처리에 의해 활성화된다. 이 활성화 과정은 융합 단백질의 전위 성분에 공유결합으로 (이황화 결합을 통해) 부착된 프로테아제 성분을 포함하는 이중-쇄(di-chain) 단백질을 생성한다. WO2006/059093의 경우, 생성된 이중-쇄 분자는 전위 도메인 성분의 N-말단에 그의 C-말단을 통해 펩티드-결합된 TM을 갖는다. 따라서, TM의 N-말단 부분은 그 후 원하는 수용체와의 상호작용 및 결합이 자유롭다. 이 배열(arrangement)은 TM의 수용체에 결합하기 위하여 유리 N-말단 또는 유리 N-말단 부분이 필요한 TM의 클래스에서 중요하다.

예로서, 단백질분해에 의한 활성화 후, WO2006/059093은 하기의 이중-쇄 형태(conformation)를 갖는 폴리펩티드를 제공한다:

NH₂-[프로테아제 성분] [TM]-[전위 성분]-COOH

└───────────┘

상기 이중-쇄 형태에서, TM 및 전위 성분은 단일-쇄 융합 단백질의 형태로 나타나고, 상기 TM의 C-말단은 전위 성분의 N-말단에 펩티드-결합된다.

본 발명자는 WO98/07864 및 WO2006/059093에 기술된 시스템이 TM의 모든 타입의 제시(presentation)에 대해 최적인 것은 아니라고, 따라서, 의도된 표적 세포에 대해 원하지 않는/감소된 결합 능력을 갖는 융합 단백질의 생성을 초래할 수 있다는 것을 확인하였다.

따라서 TSI 구성에 대한 대안적인 또는 개선된 시스템에 대한 요구가 존재한다.

본 발명은 하기를 포함하는, 단일-쇄, 폴리펩티드 융합 단백질을 제공하여 앞서 언급된 문제들 중 하나 이상을 해결한다:

(a) 비-세포독성 프로테아제 또는 그의 단편으로서, 상기 프로테아제 또는 프로테아제 단편은 표적 세포의 엑소사이토시스 융합 기구(exocytic fusion apparatus) 단백질을 절단(cleaving)할 수 있는 것인, 비-세포독성 프로테아제 또는 그의 단편;

(b) 표적 세포의 결합 부위에 결합할 수 있는 표적화 모이어티(targeting moiety)로서, 상기 결합 부위는 표적 세포 내 엔도좀(endosome)에 통합되어 엔도사이토시스(endocytosis)를 수행할 수 있는 것인 표적화 모이어티;

(c) 상기 프로테아제 또는 프로테아제 단편을 엔도좀 내로부터 엔도좀 막을 거쳐 표적 세포의 세포질로 전위시킬 수 있는 전위(translocation) 도메인;

(d) 상기 융합 단백질이 제 1 프로테아제에 의해 절단되는, 제 1 프로테아제 절단 부위로서, 상기 제 1 프로테아제 절단 부위(cleavage site)는 상기 비-세포독성 프로테아제와 상기 전위 도메인 사이에 위치하는 것인 제 1 프로테아제 절단 부위;

(e) 상기 융합 단백질이 제 2 프로테아제에 의해 절단되는, 제 2 프로테아제 절단 부위로서, 상기 제 2 프로테아제 절단 부위는 상기 전위 도메인과 상기 표적화 모이어티 사이에 위치하는 것인 제 2 프로테아제 절단 부위; 및

(f) 상기 표적화 모이어티와 상기 전위 도메인 사이의 공유결합으로서, 상기 제 2 프로테아제 절단 부위에서 단백질 분해에 의한 절단 후 상기 표적화 모이어티가 상기 공유 결합에 의해 전위 도메인에 연결된 상태를 유지하는 것인 공유 결합.

WO2006/059093에 기술된 시스템은 표적 세포의 결합 부위와 자유롭게 상호작용하는 N-말단이 있는 TM을 갖는 TSI를 제공한다. 그러나, 본 발명자는 WO2006/059093에 기술된 시스템이 표적 세포의 결합 부위와 상호작용하기 위하여 유리 N-말단 도메인과 유리 C-말단 도메인 모두를 요구하는 TM에 적합하지 않다는 것을 발견하였다.

따라서, WO2006/059093과는 대조적으로, 본 발명은 TM 성분이 유리 N-말단 도메인과 유리 C-말단 도메인 모두를 갖는 것인, TSI를 제공하기 위한 시스템을 제공한다.

일 구체예에서, 본 발명은 P1 및 P2는 제 1 및 제 2 프로테아제 절단 부위를 나타내는 것인 하기의 N-말단에서 C-말단으로의 배향을 갖는 단일-쇄 융합 단백질을 제공한다:

NH₂-[프로테아제 성분] - [P1] - [TM] - [P2] -[전위 성분]-COOH

제 1 및 제 2 절단 부위에서 절단 후, 상기 단일-쇄 융합 단백질은 상기 TM 및 상기 전위 성분이 서로 공유결합으로 연결된, 하기의 삼중-쇄(tri-chain) 구조를 취하고, 이 구조에서,

A) 상기 프로테아제 성분은 상기 TM 성분과 공유 결합으로 연결되거나:

┌────┐

NH₂-[프로테아제 성분] [TM] [전위 성분]-COOH

└──────────┘

또는 B) 상기 프로테아제 성분은 상기 전위 성분과 공유 결합으로 연결된다:

┌────┐

NH₂-[프로테아제 성분] [TM] [전위 성분]-COOH

└────────────────┘

또 다른 구체예에서, 본 발명은 하기의 N-말단에서 C-말단으로 배향을 갖는 단일-쇄 융합 단백질을 제공하고, P1 및 P2는 제 1 및 제 2 프로테아제 절단 부위를 나타낸다:

NH₂-[프로테아제 성분] - [P1] - [전위 성분] - [P2] - [TM] -COOH

제 1 및 제 2 절단 부위에서 절단 후, 상기 단일-쇄 융합 단백질은 상기 TM 및 상기 전위 성분이 서로 공유 결합으로 연결된, 하기의 삼중-쇄(tri-chain) 구조를 취하고, 이 구조에서,

A) 상기 프로테아제 성분은 상기 전위 성분과 공유 결합으로 연결되거나:

┌─────┐

NH₂-[프로테아제 성분] - [전위 성분] - [TM] -COOH

└─────────┘

또는 B) 상기 프로테아제 성분은 상기 TM 성분과 공유 결합으로 연결된다:

┌──────┐

NH₂-[프로테아제 성분] - [전위 성분] - [TM] -COOH

└───────────────┘

NH₂- [TM] - [P2] - [프로테아제 성분] - [P1] - [전위 성분] -COOH

┌──────────────┐

NH₂- [TM] - [프로테아제 성분] - [전위 성분] -COOH

└────────┘

┌──────────────┐

NH₂- [TM] - [프로테아제 성분] - [전위 성분] -COOH

└──────┘

이용에서, 본 발명의 폴리펩티드 TSI는 표적 세포에 결합하고, 이 결합은 TM에 의해 촉진된다. 그 후 전위 도메인 성분은 비-세포독성 프로테아제 성분의 표적 세포의 세포질로의 전달을 수행한다. 일단 내부로 전달된 후, 비-세포독성 프로테아제 성분은 표적 세포의 엑소사이토시스 융합(exocytic fusion) 과정을 억제한다. 따라서, 표적 세포의 엑소사이토시스 융합 기구(exocytic fusion apparatus)를 불활성화시키는 것에 의해, 본 발명의 폴리펩티드는 그로부터의 분비를 억제한다. 따라서, 본 발명의 TSI 폴리펩티드는 세포 분비와 관련된 다양한 병태생리학적 상태 또는 증상을 억제하거나 치료하는데 이용될 수 있다.

비-세포독성 프로테아제

본 발명의 TSI 폴리펩티드의 생물학적 활성 성분은 비-세포독성 프로테아제이다. 따라서, 표적 세포의 세포질로 전달된 후에, 비-세포독성 프로테아제 성분은 원하는 표적 세포 내에서 SNARE 절단을 수행한다. SNARE 단백질은 포유류 표적 세포 내에서 분비 과정의 필수적인 구성 성분이기 때문에, 그의 단백질 분해에 의한 불활성화는 상기 표적 세포로부터의 분비를 억제/저지한다.

비-세포독성 프로테아제는 세포를 죽이지 않는 분자의 별개의 클래스이다; 대신에, 이들은 단백질 합성이 아닌 세포 과정(cellular process)을 억제하여 작용한다. 비-세포독성 프로테아제는 다양한 고등 생물(예를 들면, 식물 및 동물)에 의해 생성된다 - 이러한 고등 생물의 예는 브라질 전갈이다. 또한, 비-세포독성 프로테아제는 다양한 미생물, 특히 클로스트리디움 속(Clostridium sp.) 및 네이세리아 속(Neisseria sp.)과 같은 박테리아에 의해 생성된다.

클로스트리디움 신경독소는 비-세포독성 독소 분자의 주된 그룹을 대표하며, 이황화 결합에 의해 서로 결합된 두 개의 폴리펩티드 사슬로 이루어진다. 두 개의 사슬은 약 100 kDa의 분자량을 갖는 중쇄(H-chain), 및 약 50 kDa의 분자량을 갖는 경쇄(L-chain)로 지칭된다. 프로테아제 기능을 보유하고 엑소사이토시스 과정(exocytic process)에 관여하는, 소포 및/또는 세포막 결합(plasma membrane associated) (SNARE) 단백질(예를 들면, 시냅토브레빈(synaptobrevin), 신택신(syntaxin), SNAP 및/또는 VAMP)에 대한 높은 기질 특이성을 나타내는 것은 경쇄이다. 이러한 기질은 세포의 분비 기구의 중요한 구성성분이다.

네이세리아 속, 특히 네이세리아 고노리아(N. gonorrhoeae) 종은 기능적으로 유사한 비-세포독성 독소 분자를 생성한다. 이러한 비-세포독성 프로테아제의 예는 IgA 프로테아제이다(WO99/58571 참조). 유사한 IgA 프로테아제는 폐렴 연쇄구균(Streptococcus pneumoniae)과 같은 연쇄상구균(Streptococci)에 의해 생성된다.

따라서, 일 구체예에서, 본 발명의 비-세포독성 프로테아제는 클로스트리디움 신경독소 프로테아제 또는 IgA 프로테아제일 수 있다(예를 들면, WO 99/032272 참조). 또 다른 비-세포독성 프로테아제의 예는 브라질 전갈 티티우스 세룰라투스(Tityus serrulatus)의 독으로부터의 프로테아제, 또는 프로테아제 안타레아제(antarease)와 같은 전갈 독 프로테아제이다(예를 들면, WO 2011/022357 참조).

표적화 모이어티( TM )

본 발명의 TM 성분은 본 발명의 폴리펩티드의 표적 세포의 결합 부위로의 결합을 담당한다. 따라서, TM 성분은 본 발명의 폴리펩티드를 선택된 표적 세포에 결합시키는 리간드이다.

본 발명에서, 표적 세포는 포유동물(바람직하게는 인간) 세포일 수 있다. 따라서, TM은 비-신경 세포(non-neuronal cell) 및/또는 신경 세포에 결합할 수 있다.

본 발명의 폴리펩티드의 TM 성분은 유리 N-말단 부분 및 유리 C-말단 부분 모두를 갖는다. 따라서, 일 구체예에서, TM은 표적화 모이어티의 N-말단 부분과 결합 부위의 도메인 사이의 상호작용을 통해 표적 세포의 결합 부위(예를 들면 수용체(receptor 또는 acceptor))와 상호작용할 수 있다. 또 다른 구체예에서, TM은 표적화 모이어티의 C-말단 부분과 결합 부위의 도메인 사이에서 상호작용할 수 있다. 또 다른 구체예에서, TM은 표적화 모이어티의 N-말단 부분이 결합 부위의 도메인과 상호작용하고 표적화 모이어티의 C-말단 부분이 결합 부위의 도메인과 상호작용하는, 이중 상호작용을 할 수 있다. 후자의 구체예에서, TM의 N- 및 C-말단 부분은 결합 부위의 동일한 도메인 또는 상이한 도메인에 결합할 수 있고, 및/또는 상이한 결합 부위의 도메인에 결합할 수 있다.

본 발명의 폴리펩티드에 이용하기 적절한 TM은 사이토카인, 성장인자, 뉴로펩티드, 렉틴 및 항체를 포함하고 - 용어 항체는 단클론 항체, 단백질 결합 스캐폴드(scaffold), Fab, F(ab)'₂, Fv, ScFv와 같은 항체 단편 및 카멜리드(camelid)와 같은 단일-쇄 항체 등을 포함한다.

일 구체예에서, TM 성분은 표적 세포에 존재하는 수용체에 결합하는 펩티드 리간드(예를 들면 펩티드 호르몬)를 포함하거나 또는 그로 구성된다. 일 구체예에서, 펩티드 리간드는 5-200개의 연속적인 아미노산 잔기의 아미노산 서열을 갖는다. 예로서, 상기 펩티드 리간드는 5-150개 또는 5-100개 또는 5-50개 또는 5-40개 또는 5-30개 또는 5-25개 또는 5-20개 또는 7-12개의 연속적인 아미노산 잔기 또는 약 10개의 연속적인 아미노산 잔기로 구성되거나 그를 포함한다.

TM 성분은 N-말단 부분 및 C-말단 부분을 포함한다. 각각의 상기 부분은 일반적으로 5개 이상, 10개 이상, 15개 이상, 20개 이상 또는 25개 이상의 연속적인 아미노산 잔기를 포함한다.

일 구체예에서, TM은 MRGPRX₁(예를 들면 소 부신 수질(Bovine Adrenal Medulla, BAM) 펩티드 수용체), 오피오이드 펩티드 수용체(opioid peptide receptor), OPRM₁ 또는 OPRD₁(예를 들면, 베타-엔돌핀(beta-endorphin) 펩티드 수용체), BDKRB₁ 또는 BDKRB₂(예를 들면, 브래디키닌 펩티드 수용체), OPRM1 또는 OPRD1(예를 들면, met-엔케팔린(met-enkephalin) 또는 leu-엔케팔린(leu-enkephalin) 펩티드 수용체), OPRK₁(예를 들면, 디놀핀(dynorphin) 펩티드 수용체), GALR₁, GALR₂ 또는 GALR₃(예를 들면, 갈라닌(galanin) 펩티드 수용체), OPRL₁(예를 들면, 노시셉틴(nociceptin) 펩티드 수용체), 및 TACR₁, TACR₂, TACR₃(예를 들면, P 물질(substance P) 펩티드 수용체)로부터 선택되는 수용체에 결합하는 펩티드 리간드(또는 그의 유사체)를 포함하거나 또는 그로 구성된다.

일 구체예에서, TM은 소 부신 수질(BAM) 펩티드, 오피오이드 펩티드, 베타-엔돌핀 펩티드, 브래디키닌 펩티드, met-엔케팔린 또는 leu-엔케팔린, 디놀핀 펩티드, 갈라닌 펩티드, 노시셉틴 펩티드, 및 P 물질 펩티드로부터 선택되는 펩티드 리간드로 포함하거나 또는 그로 구성된다.

일 구체예에서, TM은 성선자극호르몬-분비 호르몬(gonadotropin-releasing hormone, GnRH) 펩티드를 포함하거나 또는 그로 구성된다. GnRH는 10개의 아미노산으로 이루어진 펩티드 호르몬(10 amino acid peptide hormone)이다. GnRH의 N-말단 아미노산은 수용체 활성화의 역할을 가지나 반면, C-말단 아미노산은 GnRH 수용체로의 고 친화도 결합을 위해 요구된다(Flanagan, Millar & Illing (1997) Reviews of Reproduction, 2, 113-120 참조, 참조에 의해 그 전체가 본 명세서에 완전히 통합된다). 인 비보(in vivo)에서 GnRH의 기능은 뇌하수체 전엽에 위치한 GnRH 수용체에 작용하고 황체 호르몬(luteinising hormone, LH) 및 난포 자극 호르몬(follicle-stimulating hormone, FSH)과 같은 성선자극호르몬의 합성 및 분비를 자극하는 것이다. GnRH 펩티드의 지칭은 모든 그의 기능적 결합 단편, 및 변이체(variant) 및 유사체를 포함한다. 예로서, 용어 GnRH 펩티드는 (글리신(glycine) 및/또는 알라닌(alanine)과 같은 두 개의 아키랄(achiral) 아미노산 잔기에 의해 플랭크된(flanked)) 시스테인(cysteine) 아미노산이 GnRH 펩티드의 6번 아미노산의 치환으로 삽입된 것인 GnRH 펩티드를 포함한다. GnRH는 또한 황체 호르몬 분비 호르몬(LHRH)으로도 알려져 있다. 다른 예는 전장 92개의 아미노산으로 이루어진 GnRH 전구체 폴리펩티드 및 그의 절단물(truncation) 뿐만 아니라, GnRHI 펩티드, GnRHII 펩티드 및 GnRHIII 펩티드를 포함한다.

일 구체예에서, TM은 코르티코트로핀-분비 인자(Corticotrophin-releasing factor, CRF) 펩티드를 포함하거나 또는 그로 구성된다. CRF는 CRF₁ 및 CRF₂ 수용체와 상호작용하는 아미노산 41개의 시상하부 펩티드 호르몬이다. 인 비보에서 CRF의 주 기능은 뇌하수체 전엽 내 부신피질자극세포(corticotrope)에서 ACTH의 분비를 자극하는 것이다. CRF 펩티드에 대한 지침은 전장 CRF, 유로코르틴 1(urocortin 1) 및 유로코르틴 2(urocortin 2) 및 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다.

일 구체예에서, TM은 가스트린 분비 펩티드(gastrin releasing peptide, GRP)를 포함하거나 또는 그로 구성된다. GRP는 위장관 호르몬의 분비, 평활근 세포의 수축, 및 상피세포의 증식을 포함한, 위장관 및 중추 신경계의 여러 기능을 조절하고 종양 조직(neoplastic tissue)에 대한 강력한 유사분열물질(mitogen)이다. GRP 펩티드에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다.

일 구체예에서, TM은 뉴로메딘 B(neuromedin B)를 포함하거나 또는 그로 구성된다. 뉴로메딘 B는 아미노산 10개로 이루어진 펩티드 호르몬이다. 뉴로메딘 B의 기능은 인 비보에서 BB₁ 수용체에 작용하고 정상 및 종양인 폐와 위장관 상피 조직에 대한 강력한 유사분열물질이며 성장인자이다. 뉴로메딘 B 펩티드에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다. 뉴로메딘 B 펩티드에 대한 지침은 인간 상동 펩티드(homolog peptide), 봄베신(bombesin)을 포함하고, 전장: 봄베신 - 개구리의 피부에서 처음으로 단리된 아미노산 14개의 펩티드- 및 그의 절단물 및 펩티드 유사체를 포함한다.

일 구체예에서, TM은 가스트린 또는 콜레시스토키닌(cholecystokinin, CCK)을 포함하거나 또는 그로 구성된다. 가스트린은 17개의 아미노산으로 이루어진 펩티드 호르몬이고, CCK는 8개의 아미노산으로 이루어진 펩티드 호르몬이다. 가스트린 및 콜레시스토키닌 모두 인 비보에서 위장관계 및 중추신경계 내 CCK1 및 CCK2 수용체에 주로 작용하여 췌장 효소의 분비 및 담낭 및 위의 평활근 수축, 불안, 진통, 각성(arousal) 및 신경이완 활성을 조절한다. 가스트린 및 콜레시스토키닌 펩티드에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다.

일 구체예에서, TM은 소마토스타틴(SST) 펩티드를 포함하거나 또는 그로 구성된다. 적절한 SST 펩티드 TM의 예는 BIM 23052, BIM 23056 또는 BIM23268; 옥트레오타이드(octreotide) 펩티드, 란레오타이드(lanreotide) 펩티드, BIM23027, CYN154806, BIM23027, 바프레오타이드(vapreotide) 펩티드, 세글리타이드(seglitide) 펩티드, 및 SOM230와 같은 전장 SST 및 코르티스타틴(cortistatin, CST) 및 그의 절단물 및 펩티드 유사체를 포함한다. 이러한 TM은 sst₁, sst₂, sst₃, sst₄ 및 sst₅ 수용체와 같은 sst 수용체에 결합한다. SST 및 CST는 높은 구조적 상동성을 갖고, 모든 공지된 sst 수용체에 결합한다. SST 또는 CST에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다.

일 구체예에서, TM은 성장호르몬 분비 호르몬(GHRH) 펩티드를 포함하거나 또는 그로 구성된다. GHRH는 또한 성장-호르몬-분비 인자(GRF 또는 GHRF) 또는 소마토크리닌(somatocrinin)으로 알려져 있다. 적절한 GHRH 펩티드는 전장 GHRH(1-44) 펩티드, 및 GHRH(1-27, 1-28, 1-29), GHRH(1-37), 및 GHRH(1-40, 1-43)-OH와 같은 그의 절단물 및 BIM 28011 또는 NC-9-96과 같은 펩티드 유사체를 포함한다. GHRH 펩티드에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다.

일 구체예에서, TM은 프로테이나제 활성화 수용체(proteinase activated receptor, PAR) 펩티드, 예를 들면 PAR1을 포함하거나 또는 그로 구성된다. PAR 펩티드는 고정된(tethered) 활성화 리간드로 작용하는, 새로운 세포외(extracellular) N-말단을 노출시키기 위해 단백질 분해에 의해 변형된다는 점에서 7-막관통 수용체 G-단백질-커플링 수용체(7-transmembrane receptor G-protein-coupled receptor)의 고유의 서브타입을 나타낸다. 그의 동족 수용체(cognate receptor)를 활성화시키는 PAR1 작용제(예를 들면 TFLLR)가 확인되었다. PAR 펩티드에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다.

일 구체예에서, TM은 부갑상선 호르몬(PTH)을 포함하거나 또는 그로 구성된다. PTH는 부갑상선에 의해 분비되고 PTH-1 수용체에 결합하는 펩티드이다. 이 수용체는 널리 분포되어 있으나 특히 PTH 표적 조직, 주로 신장과 뼈에 풍부하다. PTH 펩티드에 대한 지침은 그의 모든 기능적 결합 단편, 그의 변이체 및 유사체를 포함한다.

일 구체예예서, TM은 점액-분비 세포, 또는 점액 분비를 조절하거나 지시하는 신경 세포에 결합하는 펩티드를 포함하거나 또는 그로 구성된다. 예를 들면, TM은 (a) 상피 배상 세포(goblet cell) 및 점막하 선(gland) 점액 분비 세포와 같은, 뮤신(mucin)을 분비하는 세포, (b) 세기관지 세포(Clara cell) 및 장액 세포와 같은 점액의 수용성 성분을 분비하는 세포, 및/또는 (c) "원심성-감각" C-신경섬유("sensory-efferent" C-fiber), 또는 NANC 신경계 섬유와 같은 점액 분비를 조절하거나 지시하는 세포에 결합한다. 하기의 펩티드 TM이 구체적으로 언급된다: VIP; 베타₂ 아드레날린수용체 작용제; 가스트린-분비 펩티드; 및 칼시토닌 유전자 관련 펩티드(calcitionin gene related peptide). 이러한 펩티드 TM에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다. 따라서, 본 구체예에 따른 TSI는 점액 과분비, 천식 및/또는 만성 폐쇄성 폐질환 치료에 치료적 적용(therapeutic application)을 갖는다.

또 다른 구체예에서, TM은 내분비 세포에 결합하는 펩티드를 포함하거나 또는 그로 구성된다. GHRH; 갑상선 자극 호르몬(TSH); 인슐린; 인슐린-유사 성장 인자(insulin-like growth factor); TSH 분비 호르몬(프로티렐린)(protirelin); FSH/LH 분비 호르몬(고나도렐린)(gonadorelin); 코르티코트로핀 분비 호르몬(corticotrophin releasing hormone, CRH); 및 ACTH가 구체적으로 본 명세서에서 언급된다. 이러한 TM 펩티드에 대한 지침은 그의 모든 기능적 결합 단편, 그의 변이체 및 유사체를 포함한다. 따라서, 본 구체예에 따른 TSI는 MEN을 포함한 내분비 종양; 갑상선중독증(thyrotoxicosis) 및 갑상선의 과다분비에 따른 기타 질환; 말단비대증, 고프로락틴혈증, 쿠싱병 및 뇌하수체 전엽의 과다분비에 따른 기타 질환; 고안드로겐증, 만성 무배란 및 다낭성 난소 증후군과 관련된 기타 질환 치료에 치료적 적용을 갖는다.

또 다른 구체예에서, TM은 염증 세포에 결합하는 펩티드를 포함하거나 또는그로 구성된다. (i) Fc IgE의 C4 도메인과 같은, 비만 세포(mast cell)에 대한 펩티드 TM; (ii) C3a/C4a-R 보체 수용체에 대한 리간드, CR4 보체 수용체에 대하여 반응하는 항원과 같은, 호산구에 대한 펩티드 TM; (iii) 마크로파지 자극 인자와 같은, 마크로파지 및 단핵구에 대한 펩티드 TM, (iv) iC3b 보체 수용체 또는 IL8과 연관된 항원과 같은, 호중구에 대한 펩티드 TM이 구체적으로 본 명세서에서 언급된다. 이러한 펩티드 TM에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다. 따라서, 본 구체예에 따른 TSI는 알레르기(계절성 알레르기 비염(건초열), 알레르기 결막염, 혈관운동성 비염 및 식품 알레르기), 호산구 증가증, 천식, 류마티스 관절염, 전신성 홍반성 루푸스, 원판상 홍반성 루푸스, 궤양성 대장염, 크론병, 치질, 가려움증, 사구체신염, 간염, 췌장염, 위염, 혈관염, 심근염, 건선, 습진, 만성 방사선-유발 섬유증, 폐 흉터 형성 및 기타 섬유성 질환 치료에 치료적 적용을 갖는다.

또 다른 구체예에서, TM은 외분비 세포에 결합하는 펩티드를 포함하거나 또는 그로 구성된다. 뇌하수체 아데닐 사이클라아제 활성화 펩티드(PACAP-38)가 구체적으로 본 명세서에서 언급된다. 이러한 펩티드 TM에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다. 따라서, 본 구체예에 따른 TSI는 소화관에 위치한, 구체적으로 결장에 위치한 점액-분비 세포의 점액 과다분비 치료에 치료적 적용을 갖는다.

다른 구체예에서, TM은 면역세포에 결합하는 펩티드를 포함하거나 또는 그로 구성된다. 엡스타인 바(Epstein Barr) 바이러스 단편/표면 부분(surface feature)과 같은 리간드가 본 명세서에서 언급된다. 이러한 펩티드 TM에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다. 따라서, 본 구체예에 따른 TSI는 중증근무력증, 류마티스 관절염, 전신성 홍반성 루푸스, 원판상 홍반성 루푸스, 장기이식, 조직 이식, 체액(fluid) 이식, 그레이브스병, 갑상선 중독증, 자가면역성 당뇨, 용혈성 빈혈, 혈소판감소성 자반병, 호중구 감소증, 만성 자가면역 간염, 자가면역성 위염, 악성빈혈, 하시모토 갑상선염, 애디슨 병, 쇼그렌 증후군, 원발성 담즙성 간경변, 다발성근염, 피부경화증, 전신성 경화증, 심상성 천포창, 수포성 유천포창, 심근염, 류마티스 심장염, 사구체신염(굿파스처 타입), 포도막염, 고환염, 궤양성 대장염, 혈관염, 위축성 위염, 악성빈혈, 제1형 당뇨의 치료에 치료적 적용을 갖는다.

다른 구체예에서, TM은 심혈관 세포에 결합하는 펩티드를 포함하거나 또는 그로 구성된다. 트롬빈 및 TRAP(thrombin receptor agonist peptide), GP1b 표면 항원-인식 항체와 같은 심혈관 내피 세포에 결합하는 리간드가 본 명세서에서 언급된다. 이러한 펩티드 TM에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다. 따라서, 본 구체예에 따른 TSI는 심혈관 질환 및/또는 고혈압의 치료에 치료적 적용을 갖는다.

다른 구체예에서, TM은 골 세포에 결합하는 펩티드를 포함하거나 또는 그로 구성된다. 칼시토닌을 포함한, 골화석증 및 골다공증으로부터 선택되는 질환의 치료를 위해 조골세포에 결합하는 리간드, 및 파골세포 분화 인자(예를 들면, TRANCE, 또는 RANKL 또는 OPGL)를 포함한, 파골세포에 결합하는 리간드가 본 명세서에서 언급된다. 이러한 펩티드 TM에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다. 따라서, 본 구체예에 따른 TSI는 골 질환 치료에 치료적 적용을 가진다.

선형 및 고리형 인테그린 결합 서열은 본 발명의 펩티드 TM의 또 다른 그룹을 나타낸다. 다수의 인테그린이 삼중 Arg-Gly-Asp(RGD) 펩티드 서열을 인식한다(Ruoslahti, 1996). RGD 모티프는 피브로넥틴(fibronectin), 테나신(tenascin), 피브리노겐(fibrinogen) 및 비트로넥틴(vitronectin)을 포함한, 100개 이상의 단백질에서 발견된다. RGD-인테그린 상호작용은 콕사키바이러스(coxsackievirus) (Roivaninen 등, 1991) 및 아데노바이러스(adenovirus)(Mathias 등, 1994)를 포함한, 다수의 병원균에 의해 보존된 세포 침투의 메커니즘으로 이용된다. 선형 및 고리형 펩티드 서열인, PLAEIDGIEL 및 CPLAEIDGIELC 각각은 α₉β₁ 인테그린을 발현하는 세포에서 DNA에 결합하고 내재화(internalise)시키는 것으로 확인되었다(Schneider 등, 1999). 이러한 펩티드 TM에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다.

본 발명의 기타 TM은 파지 디스플레이 기법에 의해 발견된 것들, 구체적으로 인간 기도 상피 세포를 표적화하고 그에 의해 내재화되는 것들을 포함한다. 이들은 선형 및 고리형 THALWHT(Jost 등, 2001); LEBP-1 (QPFMQCLCLIYDASC), LEBP-2 (RNVPPIFNDVYWIAF) 및 LEBP-3 (VFRVRPWYQSTSQS) (Wu 등, 2003); CDSAFVTVDWGRSMSLC (Florea 등, 2003); SERSMNF, YGLPHKF, PSGAARA, LPHKSMP, LQHKSMP (Writer 등, 2004); FSLSKPP, HSMQLST 및 STQAMFQ 펩티드 (Rahim 등, 2003)를 포함한다. 이러한 펩티드 TM에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다.

일 구체예에서, TM은 제 1 및 제 2 부분(예를 들면, 도메인)을 포함하거나 또는 그로 구성된다. 일 구체예에서, 표적화 모이어티의 제 1 및 제 2 부분은 동일한 리간드(예를 들면, 앞서 확인된 TM 리간드 중 어느 하나)로부터 유래될 수 있다. 제 1 및 제 2 부분은 동일한 수용체의 동일한 부위 또는 상이한 부위에 결합할 수 있다. 대안적으로, 제 1 및 제 2 부분은 상이한 수용체의 부위에 결합할 수 있다.

표적화 모이어티의 제 1 및 제 2 부분은 동일한 또는 상이한 수용체에 결합할 수 있는 상이한 리간드(예를 들면, 앞서 확인된 TM 리간드 중 어느 하나)로부터 유래될 수 있다. 따라서, TM은 두 개의 TM의 하이브리드(hybrid)일 수 있다. 제 1 및 제 2 부분은 동일한 수용체의 동일한 부위 또는 상이한 부위에 결합할 수 있다. 대안적으로, 제 1 및 제 2 부분은 상이한 수용체의 부위에 결합할 수 있다.

TM은 다른 TM으로부터의 제 3 및/또는 그 후속 부분(예를 들면, 앞서 확인된 TM 리간드 중 어느 하나)을 더 포함할 수 있다.

일 구체예에서, 제 1 부분(예를 들면 도메인)은 그의 표적 수용체에 유리 N-말단 부분(예를 들면, 유리 N-말단)을 통해 결합하는 리간드를 포함하거나 또는 그로 구성된다. 이러한 리간드의 예는 오피오이드 수용체에 결합하는 리간드(예를 들면, 오피오이드 펩티드와 같은, ORL₁ 수용체에 결합하는 리간드)이다. 오피오이드 펩티드의 다른 예는 노시셉틴, 디놀핀, 베타-엔돌핀, 및 엔케팔린을 포함한다. 기타 비-오피오이드 펩티드 TM 리간드는 BAM, 갈라닌, P 물질, GnRH, CRF, GRP, 뉴로메딘 B, 봄베신, 가스트린, CCK, SST, CST, 및 GHRH 펩티드(및 그의 절단물, 변이체, 유사체)를 포함한다.

또 다른(또는 동일한) 구체예에서, 제 2 부분(예를 들면 도메인)은 그의 표적 수용체에 유리 C-말단 부분(예를 들면, 유리 C-말단)을 통해 결합하는 리간드를 포함하거나 또는 그로 구성된다. 이러한 리간드의 예는 브래디키닌 수용체에 결합하는 리간드(예를 들면, 브래디키닌 펩티드) 또는 P 물질 수용체에 결합하는 리간드(P 물질 펩티드)이다. 기타 펩티드 TM 리간드는 BAM, 갈라닌, P 물질, GnRH, CRF, GRP, 뉴로메딘 B, 봄베신, 가스트린, CCK, SST, CST, 및 GHRH 펩티드(및 그의 절단물, 변이체, 유사체뿐만 아니라)를 포함한다.

예로서, 하이브리드 TM은 노시셉틴 펩티드를 포함하거나 또는 그로 구성되는 제 1 부분 및 브래디키닌 펩티드(또는 P 물질 펩티드)를 포함하거나 또는 그로 구성되는 제 2 부분을 포함한다. 다른 예에서, 제 1 부분은 노시셉틴 펩티드를 포함하거나 또는 그로 구성되고 제 2 부분은 BAM 펩티드, 오피오이드 펩티드, 베타-엔돌핀 펩티드, 브래디키닌 펩티드, 엔케팔린 펩티드, 디놀핀 펩티드, 갈라닌 펩티드, 및 P 물질 펩티드로부터 선택되는 펩티드를 포함하거나 또는 그로 구성된다.

또 다른 예에서, 하이브리드 TM은 디놀핀 펩티드를 포함하거나 또는 그로 구성되는 제 1 부분 및 브래디키닌 펩티드(또는 P 물질 펩티드)를 포함하거나 또는 그로 구성되는 제 2 부분을 포함한다. 다른 예에서, 제 1 부분은 디놀핀 펩티드를 포함하거나 또는 그로 구성되고 제 2 부분은 BAM 펩티드, 오피오이드 펩티드, 베타-엔돌핀 펩티드, 브래디키닌 펩티드, 엔케팔린 펩티드, 노시셉틴 펩티드, 갈라닌 펩티드, 및 P 물질 펩티드로부터 선택되는 펩티드를 포함하거나 또는 그로 구성된다.

또 다른 예에서, 하이브리드 TM은 갈라닌 펩티드를 포함하거나 또는 그로 구성되는 제 1 부분 및 브래디키닌 펩티드(또는 P 물질 펩티드)를 포함하거나 또는 그로 구성되는 제 2 부분을 포함한다. 다른 예에서, 제 1 부분은 갈라닌 펩티드를 포함하거나 또는 그로 구성되고 제 2 부분은 BAM 펩티드, 오피오이드 펩티드, 베타-엔돌핀 펩티드, 브래디키닌 펩티드, 엔케팔린 펩티드, 노시셉틴 펩티드, 디놀핀 펩티드, 및 P 물질 펩티드로부터 선택되는 펩티드를 포함하거나 또는 그로 구성된다.

또 다른 예에서, 하이브리드 TM은 BAM 펩티드를 포함하거나 또는 그로 구성되는 제 1 부분 및 브래디키닌 펩티드(또는 P 물질 펩티드)를 포함하거나 또는 그로 구성되는 제 2 부분을 포함한다. 다른 예에서, 제 1 부분은 BAM 펩티드를 포함하거나 또는 그로 구성되고 제 2 부분은 오피오이드 펩티드, 베타-엔돌핀 펩티드, 브래디키닌 펩티드, 엔케팔린 펩티드, 노시셉틴 펩티드, 디놀핀 펩티드, 갈라닌 펩티드, 및 P 물질 펩티드로부터 선택되는 펩티드를 포함하거나 또는 그로 구성된다.

또 다른 예에서, 하이브리드 TM은 베타-엔돌핀 펩티드를 포함하거나 또는 그로 구성되는 제 1 부분 및 브래디키닌 펩티드(또는 P 물질 펩티드)를 포함하거나 또는 그로 구성되는 제 2 부분을 포함한다. 다른 예에서, 제 1 부분은 베타-엔돌핀 펩티드를 포함하거나 또는 그로 구성되고 제 2 부분은 오피오이드 펩티드, BAM 펩티드, 브래디키닌 펩티드, 엔케팔린 펩티드, 노시셉틴 펩티드, 디놀핀 펩티드, 갈라닌 펩티드, 및 P 물질 펩티드로부터 선택되는 펩티드를 포함하거나 또는 그로 구성된다.

또 다른 예에서, 하이브리드 TM은 엔케팔린(예를 들면, leu- 또는 met-엔케팔린) 펩티드를 포함하거나 또는 그로 구성되는 제 1 부분 및 브래디키닌 펩티드(또는 P 물질 펩티드)를 포함하거나 또는 그로 구성되는 제 2 부분을 포함한다. 다른 예에서, 제 1 부분은 엔케팔린 펩티드를 포함하거나 또는 그로 구성되고 제 2 부분은 오피오이드 펩티드, 베타-엔돌핀 펩티드, 브래디키닌 펩티드, BAM 펩티드, 노시셉틴 펩티드, 디놀핀 펩티드, 갈라닌 펩티드, 및 P 물질 펩티드로부터 선택되는 펩티드를 포함하거나 또는 그로 구성된다.

일 구체예에서, TM은 동일한(또는 유사한) 제 1 및 제 2 부분(예를 들면, 도메인)을 포함하거나 또는 그로 구성되고, 조합되어, 표적 세포의 수용체와 효과적인 상호작용을 제공한다. 다른(예를 들면, 제 3, 및 선택적으로 추가적인 부분 등) 동일한/ 유사한 부분이 또한 포함될 수 있다. 따라서, 본 구체예에서, 본 발명의 폴리펩티드는 동일한(또는 유사한) TM의 반복되는 구조(예를 들면, TM-TM; TM-TM-TM 등)를 포함한다.

이러한 반복되는 TM 구조(예를 들면, TM-TM; TM-TM-TM 등)의 예는 오피오이드 펩티드, 베타-엔돌핀 펩티드, 브래디키닌 펩티드, BAM 펩티드, 노시셉틴 펩티드, 디놀핀 펩티드, 갈라닌 펩티드, 엔케팔린 펩티드, 물질 P 펩티드, GnRH 펩티드, CRF 펩티드, GRP 펩티드, 뉴로메딘 B 펩티드, 봄베신 펩티드, 가스트린 펩티드, CCK 펩티드, SST 펩티드, CST 펩티드, GHRH 펩티드(및 그의 절단물, 변이체 및 유사체뿐만 아니라)로부터 선택되는 TM에 의해 제공된다.

일 구체예에서, TM의 제 1 및 제 2(및/또는 그 후속) 부분은 스페이서(spacer) 서열, 예를 들면 펩티드 서열에 의해 분리된다. 일 구체예에서, 제 1 및 제 2(및/또는 그 후속) 부분은 40개 이하 또는 35개 이하 또는 30개 이하 또는 25개 이하 또는 20개 이하 또는 15개 이하 또는 10개 이하 또는 5개 이하의 아미노산 잔기의 서열에 의해 분리될 수 있다. 일 구체예에서, 제 1 및 제 2(및/또는 그 후속) 부분은 4, 3, 2, 1 또는 0개의 아미노산 잔기의 서열에 의해 분리될 수 있다.

본 발명의 융합 단백질은 상응하는 '유리' TM(즉 단리된 TM 그 자체)과 비교하면 일반적으로 표적 세포에 대해 (100배까지의 범위로) 감소된 결합 친화성을 나타낸다. 그러나, 이러한 관측에도 불구하고, 본 발명의 융합 단백질은 놀랍게도 우수한 효능을 보인다. 이는 두 가지 주요 특징에서 기인할 수 있다. 첫째, 비-세포독성 프로테아제 성분은 촉매적이다 - 따라서, 이러한 분자의 치료 효과는 표적 세포내에서 신속하게 증폭된다. 둘째, 표적 세포 상에 존재하는 수용체는 치료제의 진입을 위한 관문(gateway)로서만 작용하면 되고, 리간드-수용체 매개 약리적 반응을 달성하기 위해 요구되는 수준으로 반드시 자극될 필요가 없다. 따라서, 본 발명의 융합 단백질은 일반적으로 마이크로그램에서 밀리그램(심지어 수백 밀리그램까지)의 고용량을 투여하는, 치료 분자의 다른 타입에 이용되는 것보다 낮은 용량으로 투여될 수 있다. 대조적으로, 본 발명의 융합 단백질은 훨씬 더 낮은 용량, 일반적으로 10배 이상 낮은, 더욱 일반적으로 100배 더 낮은 용량으로 투여될 수 있다.

전위 도메인( translocation domain )

본 발명의 전위 성분은 표적 세포로 비-세포독성 프로테아제(또는 그의 단편)를 전위시켜, 프로테아제 활성의 기능적 발현이 표적 세포의 세포질 내에서 일어날 수 있게 한다. 전위 성분은 바람직하게는 낮은 pH 조건하에서 지질막(예를 들면 엔도좀 막)에 이온-투과성 세공(pore)을 형성할 수 있다. 전위 성분은 미생물 단백질 소스(source), 예를 들면 박테리아 또는 바이러스 단백질 소스로부터 얻을 수 있다. 따라서, 일 구체예에서, 전위 성분은 박테리아 독소와 같은, 효소의 전위 도메인을 포함하거나 또는 그로 구성된다. 또 다른 구체예에서, 전위 도메인은 바이러스 단백질의 전위 도메인을 포함하거나 또는 그로 구성된다. 일 구체예에서, 본 발명의 전위 성분은 클로스트리디움 신경독소의 H_N 도메인(또는 그의 전위 단편)과 같은 클로스트리디움 신경독소의 중쇄(H-chain) 또는 그의 단편을 포함하거나 또는 그로 구성된다.

제 1 및 제2 프로테아제 절단 부위

본 발명의 폴리펩티드는 제 1 프로테아제 절단 부위를 포함한다. 제 1 프로테아제 절단 부위는 비-세포독성 프로테아제 성분과 융합 단백질의 나머지 부분 사이의 위치에서 융합 단백질의 절단(예를 들면 제어된 절단(controlled cleavage))을 가능하게 한다. 이 절단 사건(event)은 단일-쇄 (비-세포독성 프로테아제-전위 도메인) 구조를 '활성화'하는 역할을 하고, 비-세포독성 프로테아제 성분이 융합 단백질의 나머지 부분과 공유결합으로 연결된(예를 들면 이황화-결합) '활성화된' 이중-쇄 구조의 형성을 초래한다.

본 발명의 폴리펩티드는 또한 제 2 프로테아제 절단 부위를 포함한다. 제 2 프로테아제 절단 부위는 표적화 모이어티 성분과 전위 도메인 성분 사이의 위치에서 융합 단백질의 절단을 가능하게 한다. 이 절단 사건은 단일-쇄 (TM-전위 도메인) 구조를 분리하는 역할을 하고, TM 성분이 융합 단백질의 전위 성분과 공유결합으로 연결된 (예를 들면 이황화-결합) 별개의 이중-쇄(di-chain) 구조의 형성을 초래한다. 그렇게 함으로써, TM 성분의 구조적 환경이 변화되어 N-말단 및 C-말단 부분(예를 들면 도메인) 모두가 더 이상 융합 단백질의 나머지 부분에 펩티드-결합되지 않고 따라서 각각 하나(또는 그 이상)의 수용체의 상이한 결합 도메인과 자유롭게 상호작용(예를 들면 결합)할 수 있는 형태(conformation)로 제시된다.

따라서, 제 1 또는 제 2 프로테아제 절단 부위에서 단백질 분해에 의한 절단은 단일-쇄 폴리펩티드 융합 단백질을 이중-쇄 폴리펩티드로 변환시킨다. 제 1 프로테아제 절단 부위의 절단 반응이 일어난면, 비-세포독성 프로테아제 성분은 전위 도메인 성분 및/또는 TM 성분에 공유결합(예를 들면 이황화결합)에 의해 연결된 상태를 유지한다. 상기 공유결합은, 예를 들면 그 자체가 비-세포독성 프로테아제 성분, TM 성분 및/또는 전위 성분에 연결된 하나(또는 그 이상)의 스페이서(spacer) 또는 링커(linker) 분자를 통하여, 간접적일 수 있다. 마찬가지로, 제 2 프로테아제 절단 부위에서 절단 반응이 일어나면, 전위 도메인 성분은 공유 결합(예를 들면 이황화 결합)에 의해 TM 성분에 연결된 상태를 유지한다. 상기 공유 결합은, 예를 들면 그 자체가 전위 성분 및/또는 TM에 연결된 하나(또는 그 이상)의 스페이서 또는 링커 분자를 통하여, 간접적일 수 있다.

절단 반응이 제 1 및 제 2 프로테아제 절단 부위 모두에서 발생하는 경우, 단일-쇄 폴리펩티드 융합 단백질은 삼중-쇄(tri-chain) 폴리펩티드로 변환된다.

제 1 및 제 2 프로테아제 절단 부위는 부위-지정 돌연변이유발(site-directed mutagenesis)과 같은 종래의 수단에 의해 DNA 수준에서 도입(및/또는 고유의 절단 서열이 제거)될 수 있다. 절단 서열의 존재를 확인하기 위한 스크리닝은 수동으로 또는 컴퓨터 소프트웨어(예를 들면 DNASTAR사의 MapDraw 프로그램)의 도움으로 수행될 수 있다.

임의의 프로테아제 절단 부위가 본 발명의 폴리펩티드에서 제 1 프로테아제 절단 부위로서의 용도 및/또는 제 2 프로테아제 절단 부위로서의 용도로 이용될 수 있고, 하기의 것이 바람직하다:

엔테로키나아제(Enterokinase) (DDDDK↓)

인자 Xa(Factor Xa) (IEGR↓ / IDGR↓)

TEV(Tobacco Etch virus) (ENLYFQ↓G)

트롬빈(Thrombin) (LVPR↓GS)

프리시션(PreScission) (LEVLFQ↓GP)

추가적인 비-한정적 예는 식물의 파파인 절단 부위, 및 곤충의 파파인 절단 부위, 갑각류의 파파인 절단 부위, 인간 리노바이러스(rhinovirus) 3C 프로테아제 절단 부위, 인간 엔테로바이러스(enterovirus) 3C 프로테아제 절단 부위, TEV(tobacco etch virus) 프로테아제 절단 부위, TVMV(tobacco vein mottling virus) 절단 부위, 서브틸리신(subtilisin) 절단 부위, 히드록실아민 절단 부위, 또는 카스파제(caspase) 3 절단 부위를 포함한다.

또한 용어 프로테아제 절단 부위(pretease cleavage site)는 자가-절단(self-cleaving) 서열인 인테인(intein)을 포함한다. 자가-스플라이싱(self-splicing) 반응은, 예를 들면 존재하는 환원제의 농도를 다양하게 하여 제어할 수 있다. 또한 용어 프로테아제 절단 부위는 비-세포독성 프로테아제(예를 들면 클로스트리디움 신경독소)가 작용하는 절단 서열을 포함한다. 이러한 절단 부위의 예는 SNARE 단백질 절단 부위 서열이고 - 광법위한 비-세포독성 프로테아제에 대한 원시(native) 절단 부위 인식 서열의 예는 본 상세한 설명 섹션의 말미에 제공된다.

제 1 및 제 2 절단 부위는 동일하거나 상이할 수 있다. 제 1 및 제 2 절단 부위는 (오직) 동일한 또는 (오직) 상이한 프로테아제에 의해 절단될 수 있다.

본 발명의 별개의 양태로서, 앞서-언급된 절단 부위/절단 프로테아제는 본 발명의 폴리펩티드로 통합되는 경우, "파괴성(destructive)" 절단 부위/프로테아제(후술)로서 별개로 이용될 수 있다.

일 구체예에서, 단일-쇄 폴리펩티드에서, 비-세포독성 프로테아제 성분 및 전위 도메인 성분은 이황화 결합에 의해 서로 연결된다. 따라서 제 1 프로테아제 절단 부위의 절단 후, 폴리펩티드는 이중-쇄 형태를 취하고, 이 형태에서 상기 프로테아제 및 전위 도메인 성분은 이황화 결합에 의해 서로 연결된 상태를 유지한다. 이 절단 반응은 증가된(예를 들면 최적의) 프로테아제 활성을 갖는 비-세포독성 프로테아제 성분을 초래하므로, 일반적으로 "활성화" 단계로 지칭된다.

일 구체예에서, 비-세포독성 프로테아제 성분은 융합 단백질의 전위 도메인 성분과 공유 결합을 형성한다. 예를 들면, 일 구체예에서, 공유 결합을 형성하는 프로테아제 성분의 아미노산 잔기는 프로테아제 성분의 마지막 20개, 바람직하게는 마지막 10개의 C-말단 아미노산 잔기 내에 위치한다. 유사하게, 일 구체예에서, 공유결합의 제 2 부분을 형성하는 전위 성분 내 아미노산 잔기는 전위 성분의 최초 20개, 바람직하게는 최초 10개의 N-말단 아미노산 잔기 내에 위치할 수 있다.

전술된 공유결합 배열은 프로테아제 및 전위 성분이 원시(native) 비-세포독성 프로테아제(예를 들면 원시 클로스트리디움 신경독소)에 대한 것과 유사한 방식으로 배열되는 장점을 갖는다. 비교로서, 원시 클로스트리디움 신경독소에 대한 일차 아미노산 서열을 참조하면, 개별적인 시스테인 아미노산 잔기는 8 내지 27 아미노산 잔기만큼 떨어져 있다 - Popoff, MR & Marvaud, J-C, 1999, Structural & genomic features of clostridial neurotoxins, Chapter 9, in The Comprehensive Sourcebook of Bacterial Protein Toxins. Ed. Alouf & Freer에서 발췌:

혈청형 ¹	서열	C-C 사이의 '원시' 길이
BoNT/A1	CVRGIITSKTKS----LDKGYNKALNDLC	23
BoNT/A2	CVRGIIPFKTKS----LDEGYNKALNDLC	23
BoNT/B	CKSVKAPG-------------------IC	8
BoNT/C	CHKAIDGRS----------LYNKTLDC	15
BoNT/D	CLRLTK---------------NSRDDSTC	12
BoNT/E	CKN-IVSVK----------GIRK---SIC	13
BoNT/F	CKS-VIPRK----------GTKAPP-RLC	15
BoNT/G	CKPVMYKNT----------GKSE----QC	13
TeNT	CKKIIPPTNIRENLYNRTASLTDLGGELC	27

¹단백질 분해 균주만의 정보

일 구체예에서, 본 발명의 단일-쇄 융합 단백질의 비-세포독성 프로테아제 성분 및 제 1 프로테아제 절단 부위 성분은 30, 25, 20, 15, 또는 10개 이하의 아미노산 잔기에 의해 분리된다. 일 구체예에서, 상기 두 성분은 단일-쇄 융합 단백질 내에서 5, 4, 3, 2, 또는 1개 이하의 아미노산 잔기에 의해 분리된다. 또 다른 구체예에서, 상기 두 성분은 단일-쇄 융합 단백질 내에서 0개의 아미노산 잔기에 의해 분리된다.

따라서, 일 구체예에서, 비-세포독성 프로테아제와 제 1 프로테아제 절단 부위는 제 1 스페이서 서열을 이용하여 분리될 수 있고, 상기 스페이서 서열은 제 1 프로테아제 절단 부위의 N-말단 및 비-세포독성 프로테아제 성분의 C-말단에 위치한다. 일 구체예에서, 제 1 스페이서 서열은 제 1 프로테아제 절단 부위의 일부 또는 전부를 포함할 수 있거나, 비-세포독성 프로테아제 성분의 일부일 수 있다.

일 구체예에서, 단일-쇄 융합 단백질의 전위 도메인(또는 TM) 성분과 제 1 프로테아제 절단 부위 성분은 30, 25, 20, 15, 또는 10개 이하의 아미노산 잔기에 의해 분리된다. 일 구체예에서, 상기 두 성분은 단일-쇄 융합 단백질 내에서 5, 4, 3, 2, 또는 1개 이하의 아미노산 잔기에 의해 분리된다. 또 다른 구체예에서, 상기 두 성분은 단일-쇄 융합 단백질 내에서 0개의 아미노산 잔기에 의해 분리된다.

따라서, 일 구체예에서, 전위 도메인(또는 TM)과 제 1 프로테아제 절단 부위는 제 2 스페이서 서열에 의해 분리될 수 있고, 상기 제 2 스페이서 서열은 제 1 프로테아제 절단 부위의 C-말단 및 전위 도메인(또는 TM) 성분의 N-말단에 위치한다. 제 2 스페이서 서열은 비-세포독성 프로테아제와 제 1 프로테아제 절단 부위를 분리하는 제 1 스페이서 서열과 동일하거나 또는 상이할 수 있다. 일 구체예에서, 제 2 스페이서 서열은 제 2 프로테아제 절단 부위의 일부 또는 전부를 포함할 수 있거나, 또는 전위 도메인 성분의 일부일 수 있다.

일 구체예에서, 단일-쇄 융합 단백질의 전위 도메인 성분과 제 2 프로테아제 절단 부위 성분은 30, 25, 20, 15, 또는 10개 이하의 아미노산 잔기에 의해 분리된다. 일 구체예에서, 상기 두 성분은 단일-쇄 융합 단백질 내에서 5, 4, 3, 2, 또는 1개 이하의 아미노산 잔기에 의해 분리된다. 또 다른 구체예에서, 상기 두 성분은 단일-쇄 융합 단백질 내에서 0개의 아미노산 잔기에 의해 분리된다.

따라서, 일 구체예에서, 전위 도메인과 제 2 프로테아제 절단 부위는 제 3 스페이서 서열에 의해 분리될 수 있고, 상기 제 3 스페이서 서열은 전위 도메인의 N-말단 또는 C-말단에 위치한다. 제 3 스페이서 서열은 제 1 및 제 2 스페이서 서열중 하나 또는 모두와 동일(하거나 상이)할 수 있다. 일 구체예에서, 제 3 스페이서 서열은 제 2 프로테아제 절단 부위의 일부 또는 전부를 포함할 수 있거나, 또는 전위 도메인 성분의 일부일 수 있다.

일 구체예에서, 표적화 모이어티와 제 2 프로테아제 절단 부위는 30, 25, 20, 15, 또는 10개 이하의 아미노산 잔기에 의해 분리된다. 일 구체예에서, 상기 두 성분은 단일-쇄 융합 단백질 내에서 5, 4, 3, 2, 또는 1개 이하의 아미노산 잔기에 의해 분리된다. 또 다른 구체예에서, 상기 두 성분은 단일-쇄 융합 단백질 내에서 0개의 아미노산 잔기에 의해 분리된다.

따라서, 제 2 프로테아제 절단 부위에서 절단 후, 폴리펩티드에 컨쥬게이트(conjugate)의 나머지 부분으로부터 실질적으로 자유로운 N-말단 도메인 및 C-말단 도메인을 갖는 표적화 모이어티가 제공된다. 이 배열은 표적화 모이어티의 N-말단 및 C-말단 성분과 표적 세포의 결합 부위의 상호작용을 촉진한다.

일 구체예에서, 표적화 모이어티와 제 2 프로테아제 절단 부위는 제 4 스페이서 서열에 의해 분리될 수 있고, 상기 제 4 스페이서 서열은 표적화 모이어티의 N-말단 또는 C-말단에 위치한다. 제 4 스페이서 서열은 제 1, 제 2 및 제 3 스페이서 서열중 하나, 둘 또는 모두와 동일(하거나 상이)할 수 있다. 일 구체예에서, 제 4 스페이서 서열은 제 2 프로테아제 절단 부위의 일부 또는 전부를 포함할 수 있거나, 또는 전위 도메인 성분의 일부일 수 있다.

일 구체예에서, (제 1 프로테아제 절단 부위를 절단할 수 있는) 제 1 프로테아제는 (제 2 프로테아제 절단 부위를 절단할 수 있는) 제 2 프로테아제와 동일하다.

따라서, 일 구체예에서, 단일 프로테아제로 단일-쇄 폴리펩티드 융합 단백질을 처리하면 제 1 및 제 2 프로테아제 절단 부위 모두의 절단을 가져올 수 있다.

다양한 스페이서 분자가 본 발명의 융합 단백질에서 이용될 수 있다. 이러한 스페이서 분자의 예는 GS5, GS10, GS15, GS20, GS25, 및 Hx27을 포함한다.

공유 결합

본 발명의 폴리펩티드 융합 단백질은 2개의 공유 결합을 포함한다: 제 1 결합은 비-세포독성 프로테아제 성분과 융합 단백질의 나머지 부분 사이에 있고; 제 2 결합은 표적화 모이어티와 전위 도메인 사이에 있다. (각각의) 제 1 및 제 2 프로테아제 절단 부위에서 단백질 분해에 의한 절단 후, 상기 두 공유 결합은 온전한 상태로 남는다. 일 구체예에서, 공유 결합은 펩티드 결합이 아니다(즉 공유 결합은 비-펩티드 결합이다). 예를 들면, 일 구체예에서, 상기 공유 결합 중 하나 또는 둘 모두는 이황화 결합이다.

제 2 프로테아제 절단 부위에서 단백질 분해에 의한 절단 후, 공유 결합은 온전한 상태로 남는다. 제 2 프로테아제 절단 부위에서의 절단은 표적화 모이어티의 N-말단(또는 C-말단)을 노출시키는 효과를 갖는다. 따라서, 제 2 프로테아제 절단 부위에서의 절단은 유리 N-말단 및 유리 C-말단을 갖는 표적화 모이어티를 생성한다.

따라서, 제 2 프로테아제 절단 부위에서의 절단 후, 표적화 모이어티와 전위 도메인 사이의 펩티드 결합이 절단되었기 때문에 표적화 모이어티 성분은 더 이상 전위 도메인 성분과 동일한 폴리펩티드 사슬의 일부가 아니다. 그러나 표적화 모이어티는 공유 결합의 존재로 전위 도메인에 부착된 상태를 유지한다.

공유 결합은 폴리펩티드 사슬 내 두 개의 아미노산 잔기 사이에서 형성할 수 있거나 형성될 수 있는 공유 결합을 포함할 수 있다.

일 구체예에서, 공유 결합은 이황화 결합이다. 이황화 결합은 폴리펩티드에 존재하는 두 개의 티올(즉 -SH)기 사이에서 형성될 수 있다. 예로서, 이황화 결합은 폴리펩티드 사슬에 위치한 두 개의 시스테인 잔기(또는 기능적으로 동등한 그의 변이체) 사이에서 형성될 수 있다.

따라서, 일 구체예에서, 전위 도메인 성분에 위치한 시스테인 잔기는 표적화 모이어티 성분에 위치한 또 다른 시스테인 잔기와 공유 결합을 형성한다. 이러한 이황화결합은 제 2 프로테아제 절단 부위에서의 절단 후 온전한 상태로 남아있다.

공유 결합에 의해 결합(join)되는 전위 도메인 성분 및 표적화 모이어티 성분에 위치한 아미노산 잔기는 상기 성분에 자연적으로 존재할 수 있다. 따라서, 일 구체예에서, 공유 결합은 전위 도메인 성분에 자연적으로 존재하는 아미노산 잔기와 표적화 모이어티 성분에 자연적으로 존재하는 아미노산 잔기 사이에서 형성된다. 대안적으로, 상기 아미노산 잔기 중 하나 또는 모두는 전위 도메인 성분 및/또는 표적화 모이어티 성분에 도입될 수 있다. 아미노산 잔기는 치환으로 도입될 수 있다.

일 구체예에서, 공유 결합은 전위 도메인 성분에 자연적으로 존재하는 시스테인 잔기와 표적화 모이어티 성분에 자연적으로 존재하는 시스테인 잔기 사이에 형성된 이황화 결합이다. 다른 예에서, 시스테인 잔기는 이 두 성분 간의 이황화 결합의 형성을 촉진하거나 허용하기 위하여, 구체적으로 전위 도메인 또는 표적화 모이어티 중 하나, 또는 모두에 도입된다.

일 구체예에서, 하나 이상의 시스테인 잔기가 TM 및/또는 전위 도메인에 도입된다. 이 경우, 도입된 시스테인 잔기는 두 개의, 작은, 아키랄 아미노산 잔기 (예를 들면 글리신 및/또는 알라닌)에 의해 플랭크(flanked)될 수 있다. 이러한 아미노산 잔기의 이용은 직접적인 3차 구조를 피하고 이황화 결합 형성을 촉진한다. 작은, 아키랄 아미노산 잔기는 자연적으로 존재할 수 있거나, 또는 TM 및/또는 전위 도메인에 도입될 수 있다.

일 구체예에서, 공유결합 외에, 이차 폴리펩티드 구조를 제공하는 짧은 폴리펩티드(예를 들면 1-20, 또는 1-10, 또는 5-10 아미노산 잔기)가 전위 도메인과 표적화 모이어티 사이에 위치한다. 상기 이차 폴리펩티드 구조는 전위 도메인과 표적화 모이어티의 배치를 돕고, 그에 의해 (1) TM과 전위 도메인 사이의 공유 결합의 형성, 및/또는 (2) 그의 C-말단과 N-말단이 전위 성분으로부터 멀리 향하도록 하여 TM의 배치를 돕는다.

따라서, 일 구체예에서, 이차 폴리펩티드 구조는 표적화 모이어티의 일부를 상기 전위 도메인에 인접하게 배치시키는 역할을 하고, 이에 의해, 상기 공유 결합의 형성이 에너지 측면에서 더 유리하게 된다.

일 구체예에서, 앞서 기술한 것과 같은 이차 폴리펩티드 구조를 형성할 수 있는 폴리펩티드는 프롤린(proline) 잔기와 같이 하나 이상의 '부피가 큰(bulky)' 아미노산 잔기를 포함하는 폴리펩티드 서열이다.

따라서, 일 구체예에서, 하나 이상의 부피가 큰 아미노산 잔기를 포함하는 폴리펩티드가 전위 도메인과 표적화 모이어티 사이에 위치한다. 상기 부피가 큰 잔기는 폴리펩티드 사슬에서 표적화 모이어티의 일부가 부피가 그렇지 않은 경우보다 전위 도메인에 더 인접하게 배치되도록 만곡(bend) 형성을 돕는다.

비-세포독성 프로테아제 성분과 융합 단백질의 나머지 부분(예를 들면 전위 성분 및/또는 TM 성분) 사이의 상응하는 공유 결합은 앞서 전술된 전위 도메인 성분과 TM 성분 사이의 공유 결합과 동일한 방식으로 형성될 수 있다. 전술된 바와 같이, 하나 이상의 이차 구조 및/또는 하나 이상의 부피가 큰 아미노산 잔기가 도입될 수 있다.

일 구체예에서, 비-세포독성 프로테아제 성분과 융합 단백질의 나머지 부분 사이의 공유 결합은 비-세포독성 프로테아제 성분과 전위 도메인 성분 사이이다. 일 구체예에서, 비-세포독성 프로테아제 성분과 전위 도메인 성분 사이의 공유 결합은, 예를 들면 상세한 설명 섹션에서 앞서 설명한 하나 이상의 시스테인 잔기와 같은 각각의 성분에 위치한 자연-발생한(naturally-occurring) 시스테인 잔기를 이용한다. 대안적으로, 하나 이상의 적절한 시스테인 잔기가 각각의 성분에 도입될 수 있다.

융합 단백질은 프로테아제 성분의 N-말단 및/또는 전위 성분의 C-말단에 위치한 하나 이상의 정제 태그(purification tag)를 포함할 수 있다.

어떠한 정제 태그도 사용될 수 있지만, 하기의 것이 바람직하다:

His-태그 (예를 들면 6 × 히스티딘), 바람직하게는 C-말단 및/또는 N-말단 태그

MBP-태그 (maltose binding protein), 바람직하게는 N-말단 태그

GST-태그 (glutathione-S-transferase), 바람직하게는 N-말단 태그

His-MBP-태그, 바람직하게는 N-말단 태그

GST-MBP-태그, 바람직하게는 N-말단 태그

티오레독신-태그(Thioredoxin), 바람직하게는 N-말단 태그

CBD-태그 (Chitin Binding Domain), 바람직하게는 N-말단 태그.

치료적 적용( therapeutic application )

TM 성분은 본 발명의 표적화된 분비 억제제(TSI) 치료 분자를 원하는 표적 세포로 향하게 한다.

예로서, 본 명세서에 기술된 TM(예를 들면 오피오이드 펩티드, 베타-엔돌핀 펩티드, 브래디키닌 펩티드, BAM 펩티드, 노시셉틴 펩티드, 디놀핀 펩티드, 갈라닌 펩티드, 엔케팔린 펩티드, P 물질 펩티드)의 용도는 본 발명의 표적화된 분비 억제제(TSI) 치료 분자를 통증-감지 세포(예를 들면 일차 구심성 신경(primary sensory afferent))로 향하게 한다. 그 결과 융합 단백질은 따라서 통증을 억제하는 치료 분자를 제공한다 - 출원인은 WO2006/059093, WO2007/138339 및 WO96/33273를 참조하고, 각각은 참조에 의해 그 전체가 본 명세서에 통합된다.

본 명세서에 기술된 TM은 본 발명의 표적화된 분비 억제제(TSI) 분자를 신경성 염증(neurogenic inflammation)을 촉진시키는 세포로 향하게 하는데 이용될 수 있다. 따라서, 본 발명의 표적화된 분비 억제제(TSI) 분자는 신경성 염증을 억제하는 치료 분자를 제공한다 - 출원인은 WO2010/138395, WO2010/138392, WO2010/138387, WO2010138382 및 WO2010/138379를 참조하고, 각각은 참조에 의해 그 전체가 본 명세서에 통합된다. 이러한 TSI 분자 및 치료제로 이용하기에 바람직한 TM은 노시셉틴 및 디놀핀과 같은 오피오이드 TM을 포함한다.

본 명세서에 기술된 TM은 본 발명의 표적화된 분비 억제제(TSI) 분자를 과민성 방광(over-active bladder)과 같은 비뇨생식기-신경학적 질환(urogenital-neurological disorder)을 촉진시키는 세포로 향하게 하는데 이용될 수 있다. 따라서, 본 발명의 표적화된 분비 억제제(TSI) 분자는 과민성 방광과 같은 비뇨생식기-신경학적 질환을 억제하는 치료 분자를 제공한다 - 출원인은 WO2010/138393, WO2010/138389, WO2010/138384, 및 WO2010/138366을 참조하고, 각각은 참조에 의해 그 전체가 본 명세서에 통합된다. 이러한 TSI 분자 및 치료제로 이용하기에 바람직한 TM은 노시셉틴 및 디놀핀과 같은 오피오이드 TM을 포함한다.

성선자극호르몬-분비 호르몬(GnRH) 펩티드, CRF 펩티드, GRP 펩티드, 뉴로메딘 B 펩티드, 봄베신 펩티드, 가스트린 펩티드, CCK 펩티드, SST 펩티드, CST 펩티드, 및 GHRH 펩티드와 같은 TM은 본 발명의 TSI 분자를 암을 촉진하는 세포 또는 실제로 암 세포 자체로 향하게 하는데 이용될 수 있다. 따라서, 본 발명의 표적화된 분비 억제제(TSI) 분자는 말단 비대증 및 쿠싱병과 같은 신경내분비 (neuroendocrine) 질환을 억제하는 치료분자 및 암(예를 들면, 폐암, 신장암, 뇌암, 유방암, 췌장암, 대장암(colorectal cancer), 부신암, 식도암, 림프종, 백혈병, 급성 백혈병, 방광암, 골암, 장암(bowel caner), 자궁경부암, 만성 림프성 백혈병, 호지킨 림프종, 간암, 피부암, 인두암(oropharyngeal cancer), 골수종, 전립선암, 위암, 고환암, 자궁암 또는 카포시 육종)을 억제하는 치료 분자를 제공한다 - 출원인은 WO2009/150489, WO2009/150470, 및 WO2010/055358을 참조하고, 각각은 참조에 의해 그 전체가 본 명세서에 통합된다. 이러한 TSI 분자 및 치료제로 이용하기에 바람직한 TM은 GHRH 펩티드, SST 펩티드 및 CST 펩티드를 포함한다.

파괴성(destructive) 절단 부위

본 발명의 폴리펩티드는 비-표적화된 영역으로의 분산과 관련된 원하지 않는 부작용을 감소시키거나 방지하기 위하여 더 변형될 수 있다. 본 구체예에 따르면, 폴리펩티드는 파괴성 절단 부위를 포함한다. 파괴성 절단 부위는 '활성화' 부위(즉 이중-쇄 형성) 및 제 2 프로테아제 절단 부위(즉, 유리 C-말단 및 N-말단 도메인을 갖는 TM의 형성)와 구별된다. 상기 파괴성 절단 부위는 제 3 프로테아제에 의해 절단될 수 있고 제 1 또는 제 2 프로테아제에 의해서는 절단되지 않는다. 또한, 제 3 프로테아제에 의해 파괴성 절단 부위에서 절단되는 경우, 본 발명의 폴리펩티드는 효능이 감소하였다(예를 들면 의도된 표적 세포에 대한 결합 능력의 감소, 전위 활성의 감소 및/또는 비-세포독성 프로테아제 활성의 감소). 예로서, 출원인은 WO 2010/094905 및, WO 02/044199를 참조하고, 각각은 참조에 의해 그 전체가 본 명세서에 통합된다.

따라서, 본 구체예에 따르면, 본 발명은 떨어진(off-site) 위치에서 제어 가능하게 불활성화 및/또는 파괴될 수 있는 폴리펩티드를 제공한다.

일 구체예에서, 파괴성 절단 부위는 순환하는 프로테아제(예를 들면, 혈청 프로테아제 또는 혈액 응고 캐스케이드의 프로테아제와 같은 세포외 프로테아제), 조직-관련 프로테아제(예를 들면 근육의 MMP와 같은 매트릭스 메탈로프로테아제(matrix metalloprotease)(MMP)), 및 세포내 프로테아제(바람직하게는 표적세포에는 없는 프로테아제)로부터 선택되는 제 3 프로테아제(즉 파괴 프로테아제)에 의해 인식되고 절단된다. 따라서, 이용에서, 본 발명의 폴리펩티드가 의도된 표적 세포로부터 멀리 분산되고 및/또는 비-표적 세포에 의해 흡수되는 경우, 폴리펩티드는 (제 3 프로테아제에 의해) 파괴성 절단 부위의 절단에 의해 불활성화될 것이다.

메트릭스 메탈로프로테아제(MMP)는 본 발명의 맥락에서 파괴성 프로테아제의 바람직한 군이다. 이 군 내에서, ADAM17(또한 TACE로 알려진 EC 3.4.24.86)이 바람직하고 세포외 도메인을 "제거(shed)"하기 위하여 다양한 막에 고정된(membrane-anchored), 세포 표면 단백질을 절단한다. 또한, 바람직한 MMP는 아다말리신(adamalysin), 세르랄리신(serralysin), 및 아스타신(astacin)을 포함한다. 바람직한 파괴 프로테아제의 또 다른 군은 트롬빈, 응고인자 VIIa, 응고인자 IXa, 응고인자 Xa, 응고인자 XIa, 응고인자 XIIa, 칼리크레인, 단백질 C, 및 MBP-관련 세린 프로테아제와 같은 포유동물의 혈액 프로테아제이다.

본 발명의 제 2 양태에 따르면, 앞서-기술한 폴리펩티드 융합 단백질을 코딩하는 핵산 서열이 제공된다.

본 발명의 바람직한 양태에서, DNA 서열은 DNA 벡터의 일부로서 제조(prepared)되고, 상기 벡터는 프로모터 및 터미네이터를 포함한다. 전술된 폴리펩티드 융합 단백질을 코팅하는 DNA 서열은 프로모터의 하류에 위치하고; 터미네이터는 핵산 서열의 하류에 위치한다.

바람직한 구체예에서, 벡터는 하기로부터 선택되는 프로모터를 갖는다:

프로모터	유도제	일반적인 유도 조건
tac(하이브리드)	IPTG	0.2 mM(0.05 - 2.0mM)
AraBAD	L-아라비노스	0.2%(0.002 - 0.4%)
T7 - lac 오퍼레이터	IPTG	0.2 mM(0.05 - 2.0 mM)

본 발명의 DNA 구조체(construct)는 바람직하게는 인 실리코(in silico)로 설계되고, 그 후 통상적인 DNA 합성 기법에 의해 합성된다.

앞서-언급된 DNA 서열 정보는 이용될 궁극적인 숙주 세포(예를 들면 E. coli) 발현 시스템에 따른 코돈-바이어스(codon-biasing)를 위해 선택적으로 (optionally) 변형된다.

DNA 백본(backbone)은 바람직하게는, 전사 및 번역시, 제 2 펩티드-코딩 서열에 의해 코딩되는 프로테아제 절단 부위에 상응하는 아미노산 서열을 생성할 수 있는 내재된(inherent) 핵산 서열에 대해 스크리닝된다. 이 스크리닝은 수동으로 또는 컴퓨터 소프트웨어(예를 들면 DNASTAR사의 MapDraw 프로그램)의 도움으로 수행될 수 있다.

본 발명의 또 다른 구체예에 따라, 숙주 세포에서, 앞서 기술된 융합 단백질을 코딩하는 핵산 서열, 또는 앞서 기술된 바와 같은 DNA 벡터를 발현시키는 단계를 포함하는, 앞서 기술된 바와 같은 단일-쇄 폴리펩티드 융합단백질을 제조하는 방법이 제공된다.

본 발명의 다른 구체예에 따라, 하기를 포함하는 비-세포독성 작용제(agent)를 제조하는 방법이 제공된다:

a. 본 발명의 단일-쇄 폴리펩티드 융합 단백질을 포함하는 용액을 제공하는 단계;

b. 상기 용액에 제 1 프로테아제 절단 부위를 절단할 수 있는 제 1 프로테아제 및 제 2 프로테아제 절단 부위를 절단할 수 있는 제 2 프로테아제를 첨가하는 단계;

c. 제 1 프로테아제 절단 부위 및 제 2 프로테아제 절단 부위를 절단하여, 이에 의해 삼중-쇄 융합 단백질(tri-chain) fusion protein)을 형성하는 단계.

일 구체예에서, 제 1 프로테아제 및 제 2 프로테아제는 순차적으로 첨가된다. 대안적인 구체예에서, 제 2 프로테아제는 제 1 프로테아제 전에 첨가된다. 또 다른 구체예에서, 제 1 프로테아제 및 제 2 프로테아제는 동시에 첨가된다.

본 양태는 삼중-쇄 폴리펩티드를 제공한다. 더 상세하게는, 생성된 삼중-쇄 폴리펩티드는 일반적으로:

a. 제 1 쇄는 표적 세포의 엑소사이토시스 융합 기구 단백질을 절단할 수 있는 비-세포독성 프로테아제, 또는 그의 단편을 포함하고;

b. 제 2 쇄는 엔도좀 내로부터 상기 프로테아제 또는 프로테아제 단편을 엔도좀 막을 거쳐 상기 표적 세포의 세포질 속으로 전위시킬 수 있는 전위 도메인을 포함하며;

c. 제 3 쇄는 상기 표적 세포의 결합 부위에 결합할 수 있는 표적화 모이어티를 포함하고, 상기 결합 부위는 상기 표적 세포 내 엔도좀에 통합되어 엔도사이토시스를 수행할 수 있고;

d. 상기 제 1 및 제 2 쇄는 서로 이황화 결합으로 연결되고; 및 제 2 및 제 3 도메인은 공유 결합에 의해 서로 연결되는 것인 구조를 갖는다.

폴리펩티드 전달

본 발명의 다른 양태에 따라, 질환(medical condition)의 치료, 예방 또는 개선에 사용하기 위한, 앞서 기술된 바와 같은 단일-쇄 폴리펩티드 융합 단백질, 또는 앞서 기술된 바와 같은 비-세포독성 폴리펩티드가 제공된다.

이용에서, 본 발명은 약학적으로 허용가능한 담체(carrier), 부형제(excipient), 보조제(adjuvant), 추진제(propellant) 및/또는 염으로부터 선택되는 하나 이상의 성분과 함께, 폴리펩티드를 포함하는 약학적 조성물을 이용한다.

본 발명의 폴리펩티드는 경구, 비경구(pareteral), 지속 주입(continuous infusion), 이식(implant), 흡입(inhalation) 또는 국소 적용을 위해 제형화될 수 있다. 주사에 적합한 조성물은 용액, 현탁액(suspension), 에멀젼(emulsion), 또는 사용하기 전에 적절한 비이클(vehicle)에 용해되거나 현탁되는 건조 분말의 형태일 수 있다.

국소 전달 수단은 에어로졸, 또는 기타 스프레이(예를 들면 네뷸라이저)를 포함한다. 이와 관련하여, 폴리펩티드의 에어로졸 제형은 폐 및/또는 기타 비강 및/또는 기관지 또는 기도로의 전달을 가능하게 한다. 바람직한 투여 경로는 전신(예를 들면 iv), 복강경 및/또는 국소 주사(예를 들면, 종양과 같은 표적 세포로의 직접적인 경접협동 주사(transsphenoidal injection))로부터 선택된다.

주사 제형의 경우에, 투여 부위에서 폴리펩티드의 유지를 돕거나 제거를 감소시키기 위하여 선택적으로 약학적 활성 물질을 포함한다. 이러한 약학적 활성물질의 한 예는 아드레날린 같은 혈관수축제이다. 이러한 제형은 투여 후 폴리펩티드의 체류 시간이 증가하고 따라서 그의 효과가 증가하거나 및/또는 강화되는 장점을 부여한다.

본 발명의 폴리펩티드의 투여를 위한 용량 범위는 원하는 치료 효과를 생성하는 범위이다. 요구되는 용량 범위는 폴리펩티드 또는 조성물의 정확한 속성, 투여경로, 제형의 속성, 환자의 연령, 환자 상태의 속성, 정도 또는 중증도, 존재하는 경우, 금기, 및 담당 의사의 판단에 의존하는 것으로 이해될 것이다. 이러한 용량 수준의 변화는 최적화를 위한 표준 실험 루틴을 이용하여 조정될 수 있다.

적절한 (환자의 체중당) 일일 용량은 0.0001-1 mg/kg, 바람직하게는 0.0001-0.5 mg/kg, 더 바람직하게는 0.002-0.5 mg/kg, 및 특히 바람직하게는 0.004-0.5 mg/kg의 범위이다. 단위 용량은 1 마이크로그램 미만 내지 30mg까지 다양할 수 있지만, 일반적으로 용량당 0.01 내지 1mg의 범위일 것이고, 매일 또는 바람직하게는 주별 또는 6 개월 마다와 같이 덜 빈번하게 투여될 수 있다. 특히 바람직한 투여 요법(dosing regimen)은 1X 용량인 폴리펩티드 2.5 ng을 기초로 한다. 이와 관련하여, 바람직한 용량은 1X-100X(즉 2.5-250ng)의 범위이다.

유체 투여 형태는 일반적으로 폴리펩티드 및 파이로젠(pyrogen)이 없는 멸균 비이클(vehicle)을 이용하여 제조된다. 폴리펩티드는 사용되는 비이클 및 농도에 따라, 비이클에 용해되거나 현탁될 수 있다. 용액 제조에서 폴리펩티드를 비이클에 용해시킬 수 있고, 용액을 필요한 경우 염화 나트륨을 첨가하여 등장성으로 만들고, 적절한 멸균 바이알 또는 앰플에 채우고 밀봉하기 전에 무균기법을 이용하여 멸균 필터를 통해 여과하고 멸균시킬 수 있다. 대안적으로, 용액의 안정성이 적절한 경우, 밀봉된 용기의 용액을 가압증기멸균(autoclaving)에 의해 멸균시킬 수 있다. 유리하게, 완충제, 가용화제, 안정화제, 보존제 또는 살균제, 현탁화제 또는 에멀젼화제 및/또는 국소 마취제와 이로운 첨가제를 비이클에 용해시킬 수 있다.

사용 전 적절한 비이클에 용해되거나 현탁되는, 건조 분말은 미리 멸균된 성분을 멸균 영역에서 무균 기법을 이용하여 멸균 용기에 충전하여 제조할 수 있다. 대안적으로, 성분은 멸균 영역에서 무균 기법을 이용하여 적절한 용기에 용해시킬 수 있다. 그 후 생성물을 동결 건조하고 용기를 무균 밀봉한다.

근육내 주사, 피하 주사 또는 피내 주사에 적절한 비경구 현탁액은, 멸균된 성분을 멸균 비이클에 용해하는 대신 현탁하는 것과 여과에 의해 멸균을 달성할 수 없다는 것을 제외하고는, 실질적으로 동일한 방식으로 제조된다. 성분을 멸균 상태에서 단리 할 수 있거나 대안적으로 단리 후, 예를 들면 감마선 조사에 의해 멸균할 수 있다.

유용하게는, 현탁화제, 예를 들면 폴리비닐피롤리돈(polyvinylpyrrolidone)이 성분의 균일한 분포를 가능하게 하기 위해 조성물에 포함된다.

정의 섹션

표적화 모이어티(Targeting Moiety)(TM)는 본 발명의 폴리펩티드와 표적 세포의 표면 사이에서 물리적 결합(physical association)을 유발하기 위해서 기능적으로 결합 부위(Binding Site)와 상호작용하는 화학구조를 의미한다. 용어 TM은 표적 세포의 결합 부위에 결합할 수 있는 분자(즉 천연 분자, 또는 화학적/물리적으로 변형된 그의 변이체)를 포함하고, 상기 결합부위는 내재화(internalisation)(예를 들면 엔도좀 형성) - 수용체-매개 엔도사이토시스(receptor-mediated endocytosis)라고도 지칭된다 - 될 수 있다. TM은 엔도좀 막 전위 기능을 가질 수 있고, 이 경우 본 발명의 작용제에 별개의 TM 및 전위 도메인 성분이 존재할 필요가 없다. 앞선 설명에서, 특정 TM이 기술되었다. 상기 TM에 대한 언급은 단지 예시이며, 본 발명은 예시된 TM의 기본적인 결합(즉 표적화) 능력을 유지하는 그의 모든 변이체 및 유도체를 포함한다.

앞서 언급한 바와 같이, 바람직한 TM은 항체(예를 들면 항체 단편) 및 결합 스캐폴드(scaffold); 특히, 표적 세포에 (예를 들면 특이적으로) 결합하는 것을 목적으로 설계된 상업적으로 이용가능한 항체/단편 및 스캐폴드를 포함한다.

단백질 스캐폴드는, 각각 본 발명의 TM으로 이용될 수 있는, scFv, Fab 분자, dAb(single-domain antibody), 카멜리드(camelid), 디아바디(diabody) 및 미니바디(minibody)와 같은 치료용 단클론 항체 및 유도체의 레퍼토리(repertoire) 확대를 보완하기 위한 범용 결합 구조(universal binding framework)의 새로운 세대를 대표한다. 스캐폴드 시스템은 신규한 스캐폴드의 생성 또는 공지된 단백질 결합 도메인의 변형을 통해 공지된 단백질의 인식 도메인을 만들거나 변형한다. 이러한 스캐폴드는 하기를 포함하나 이에 한정되지 않는다:

(i) 단백질 A 기반 스캐폴드 - 어피바디(affibody)(Nord, K. 등 1997 “Binding proteins selected from combinatorial libraries of an alpha-helical bacterial receptor domain". Nat Biotechnol 15, 772-777);

(ii) 리포칼린(lipocalin) 기반 스캐폴드 - 안티칼린(anticalin)(Skerra 2008 “Alternative binding proteins: anticalins - harnessing the structural plasticity of the lipocalin ligand pocket to engineer novel binding activities”. FEBS J. 275:2677-83);

(iii) 피브로넥틴(fibronectin) 기반 스캐폴드 - 애드넥틴(adnectin)(Dineen 등 2008 “The Adnectin CT-322 is a novel VEGF receptor 2 inhibitor that decreases tumor burden in an orthotopic mouse model of pancreatic cancer”. BMC Cancer 8:352);

(iv) 아비머(avimer)(Silverman 등 2005 “Multivalent avimer proteins evolved by exon shuffling of a family of human receptor domains”. Nat Biotechnol 23:1556-61);

(v) 안키린(ankyrin) 기반 스캐폴드 - 달핀(darpin)(Zahnd 등 2006 “Selection and characterization of Her2 binding-designed ankyrin repeat proteins”. J Biol Chem. 281:35167-75); 및

(vi) 센티린(centyrin) 스캐폴드 - CDR과 유사한 루프(loop)를 가진 Ig 도메인과 상당한 구조적 상동성을 갖는 단백질 폴드(protein fold)에 기반함. Ig 도메인은 인간 단백질의 공통된 모듈이고 대안적인 스캐폴드 단백질로서 널리 적용된다. 전술된 '스캐폴드' 공개문헌 각각은 참조에 의해 본 명세서에 (그 전체가) 통합된다.

결합 스캐폴드는 특정 세포 표면 단백질, 수용체 또는 당기(sugar group)와 같은 기타 세포 표면 에피토프(epitope)의 상호작용을 통해 특정 세포 타입을 표적화하는데 이용될 수 있다. 이러한 변형된 스캐폴드가 재조합 비-세포독성 프로테아제 기반 본 발명의 폴리펩티드로 조작(engineered)될 수 있다.

본 발명의 TM은 해당 표적세포에 결합(바람직하게는 특이적으로 결합)한다. 용어 "특이적으로 결합하는(specifically bind)"은 바람직하게는 주어진 TM이 10⁶M^-1 이상, 바람직하게는 10⁷M^-1이상, 더 바람직하게는 10⁸M^- ¹이상, 및 가장 바람직하게는 10⁹M^- ¹이상의 결합 친화성(binding affinity)(Ka)으로 표적 세포에 결합하는 것을 의미한다.

본 명세서의 TM에 대한 지침은 해당 표적 세포에 결합하는 능력을 유지하는, 그의 단편 및 변이체를 포함한다. 예로서, 변이체는 표준(reference) TM과 80% 이상, 바람직하게는 90% 이상, 더 바람직하게는 95% 이상, 및 가장 바람직하게는 97% 이상 또는 99% 이상의 아마노산 서열 상동성을 가질 수 있다. 따라서, 변이체는 아미노산 유사체(예를 들면 자연에 없는 아미노산), 또는 치환된 결합을 하나 이상 포함할 수 있다. 또한, 예로서, TM과 관련하여 이용될 때, 용어 단편(fragment)은 10개 이상, 바람직하게는 20개 이상, 더 바람직하게는 30개 이상, 및 가장 바람직하게는 40개 이상의 표준 TM의 아미노산 잔기를 갖는 펩티드를 의미한다. 용어 단편은 또한 앞서 언급된 변이체에 관한 것이다. 따라서, 예로서, 본 발명의 단편은 10, 20, 30, 또는 40개 이상의 아미노산을 갖는 펩티드 서열을 포함할 수 있고, 상기 펩티드 서열은 표준 펩티드의 (연속적인) 아미노산의 상응하는 펩티드 서열과 80% 이상의 서열 상동성을 갖는다.

TM이 선택된 표적 세포에 결합하는 것을 확인하는 것은 통상적이다. 예를 들면, 해당 표적 세포를 대표하는 조직 또는 세포가 표지되지 않은 TM의 과량 존재에서 표지된(예를 들면, 삼중수소화(tritiated)) TM에 노출되는 것인 간단한 방사성 변위 실험이 이용될 수 있다. 이러한 실험에서, 비-특이적 및 특이적 결합의 상대적인 비율이 평가될 수 있고, 이에 의해 TM이 표적 세포에 결합하는 것을 확인할 수 있다. 선택적으로, 분석법은 하나 이상의 결합 길항제를 포함할 수 있고, 분석법은 TM 결합의 감소를 관찰하는 것을 더 포함할 수 있다. 이러한 종류의 실험의 예는 Hulme, E.C. (1990), Receptor-binding studies, a brief outline, pp. 303-311, In Receptor biochemistry, A Practical Approach, Ed. E.C. Hulme, Oxford University Press에서 찾을 수 있다.

본 발명의 맥락에서, 유사체가 상응하는 '표준(reference)' TM과 동일한 수용체에 결합하는 한, 펩티드 TM에 대한 지침은 그의 펩티드 유사체를 포함한다. 상기 유사체는 하기와 같은 합성 잔기를 포함할 수 있다:

ß-Nal = ß-나프틸알라닌(β-naphthylalanine)

ß-Pal = ß-피리딜알라닌(β-pyridylalanine)

hArg(Bu) = N-구아니디노-(부틸)-호모아르기닌(N-guanidino-(butyl)-homoarginine)

hArg(Et)₂ = N,N'-구아니디노-(디메틸)-호모아르기닌(N,N'-guanidino-(dimethyl)-homoarginine)

hArg(CH₂CF₃)₂ = N,N'-구아니디노-비스-(2,2,2,-트리플루오로에틸)-호모아르기닌(N,N'-guanidino-bis-(2,2,2,-trifluoroethyl)-homoarginine)

hArg(CH₃, hexyl) = N,N'-구아니디노-(메틸, 헥실)-호모아르기닌(N,N'-guanidino-(methyl, hexyl)-homoarginine)

Lys(Me) = N^e-메틸라이신(N^e-methyllysine)

Lys(iPr) = N^e-이소프로필라이신(N^e-isopropyllysine)

AmPhe = 아미노메틸페닐알라닌(aminomethylphenylalanine)

AChxAla = 아미노사이클로헥실알라닌(aminocyclohexylalanine)

Abu = α-아미노부틸산(α-aminobutyric acid)

Tpo = 4-티아프롤린(4-thiaproline)

MeLeu = N-메틸류신(N-methylleucine)

Orn = 오르니틴(ornithine)

Nle = 노르류신(norleucine)

Nva = 노르발린(norvaline)

Trp(Br) = 5-브로모-트립토판(5-bromo-tryptophan)

Trp(F) = 5-플루오로-트립토판(5-fluoro-tryptophan)

Trp(N0₂) = 5-니트로-트립토판(5-nitro-tryptophan)

Gaba = γ-아미노부틸산(γ-aminobutyric acid)

Bmp = J-머캅토프로피오닐(J-mercaptopropionyl)

Ac = 아세틸(acetyl)

Pen = 페니실라민(pencillamine)

본 발명의 폴리펩티드는 클로스트리디움 신경독소의 기능적 H_C 또는 H_CC 도메인이 없을 수 있다. 따라서, 상기 폴리펩티드는 Shone 등. (1985) Eur. J. Biochem. 151, 75-82에서 기술한 바와 같은 결합 분석법에서 (클로스트리드움 H_C 성분을 통해) 랫트(rat)의 시냅토좀 막(synaptosomal membrane)에 결합할 수 없다. 일 구체예에서, 상기 폴리펩티드는 클로스트리디움 신경독소 홀로톡신의 마지막 50개의 C-말단 아미노산이 없다. 또 다른 구체예에서, 상기 폴리펩티드는 클로스트리디움 신경독소 홀로톡신의 마지막 100, 150, 200, 250, 또는 300개의 C-말단 아미노산 잔기가 없다. 대안적으로 H_C 결합 활성이 돌연변이유발(mutagenesis)에 의해 제거가 되거나 감소될 수 있다 - 예로서, 편의상 BoNT/A라고 지칭하는, 강글리오사이드 결합 포켓(binding pocket) 중 하나 또는 두 개의 아미노산 잔기의 돌연변이(W1266의 L로의 변형 및 Y1267의 F로의 변형)의 변형은 H_C 영역(region)이 그의 수용체 결합 기능을 상실하게 한다. 유사한 돌연변이가 비-혈청형 A 클로스트리디움 펩티드 성분에 생성되어, 예를 들면 돌연변이 보툴리눔 B(W1262의 L로의 변이 및 Y1263의 F로의 변이) 또는 보튤리늄 E (W1224의 L로의 변이 및 Y1225의 F로의 변이)를 기반으로 한 구조체(construct)를 얻을 수 있다. 활성 부위의 다른 돌연변이는 예를 들면 보툴리눔 A형 독소의 Y1267S와 같은 H_C 수용체 결합 활성 및 기타 클로스트리디움 신경독소의 그에 상응하는 고도로 보존된 잔기의 돌연변이가 동일한 제거(ablation)를 달성한다. 이 돌연변이 및 기타 돌연변이의 상세한 설명은 Rummel 등 (2004) (Molecular Microbiol. 51:631-634)에 기술되고, 이는 참조에 의해 본 명세서에 통합된다.

원시(native) 클로스트리디움 신경독소의 H_C 펩티드는 약 400-440개의 아미노산 잔기를 포함하고, 각각 약 25kDa의 두 개의 기능적으로 구별되는 도메인, 즉 N-말단 영역(일반적으로 H_CN 펩티드 또는 도메인으로 지칭된다) 및 C-말단 영역(일반적으로 H_CC 펩티드 또는 도메인으로 지칭된다)으로 구성된다. 또한, C-말단의 160-200개의 아미노산 잔기로 구성되는 C-말단 영역(H_CC)은 그의 자연 세포 수용체, 즉 신경근육 접합부(neuromuscular junction)의 신경 말단으로의 클로스트리디움 신경독소의 결합을 담당한다는 것이 잘 기록되어 있다. 따라서, 중쇄가 원시 클로스트리디움 신경독소가 결합하는 세포 표면 수용체에 결합할 수 없도록, 기능적 중쇄 H_C 펩티드가 없는 클로스트리디움 중쇄에 대한 본 명세서에서의 기재는 클로스트리디움 중쇄가 단순히 기능적 H_CC 펩티드가 없는 것을 의미한다. 즉, H_CC 펩티드 영역은 신경근육 접합부에서 신경말단에 대한 그의 원시 결합 능력을 불활성화하기 위하여 부분적으로 또는 전체가 결손(deleted)되거나, 또는 변형된다(예를 들면 종래의 화학적 또는 단백분해적 처리를 통하여).

따라서, 일 구체예에서, 본 발명의 클로스트리디움 H_N 펩티드는 클로스트리디움 신경독소의 C-말단 펩티드 부분(H_CC)의 일부가 없고 따라서 원시 클로스트리디움 신경독소의 H_C 결합 기능이 없다. 예로서, 일 구체예에서, C-말단 연장(C-terminally extended) 클로스트리드움 H_N 펩티드는 클로스트리디움 신경독소 중쇄의 C-말단의 40개 아미노산 잔기, 또는 C-말단의 60개 아미노산 잔기, 또는 C-말단의 80개 아미노산 잔기, 또는 C-말단의 100개 아미노산 잔기, 또는 C-말단의 120개 아미노산 잔기, 또는 C-말단의 140개 아미노산 잔기, 또는 C-말단의 150개 아미노산 잔기, 또는 C-말단의 160개 아미노산 잔기가 없다. 또 다른 구체예에서, 본 발명의 클로스트리디움 H_N 펩티드는 클로스트리디움 신경독소의 C-말단 펩티드 부분(H_CC) 전체가 없고 따라서 원시 클로스트리디움 신경독소의 H_C 결합 기능이 없다. 예로서, 일 구체예에서, 클로스트리드움 H_N 펩티드는 클로스트리디움 신경독소 중쇄의 C-말단의 165개 아미노산 잔기, 또는 C-말단의 170개 아미노산 잔기, 또는 C-말단의 175개 아미노산 잔기, 또는 C-말단의 180개 아미노산 잔기, 또는 C-말단의 185개 아미노산 잔기, 또는 C-말단의 190개 아미노산 잔기, 또는 C-말단의 195개 아미노산 잔기가 없다. 추가적인 예로서, 본 발명의 클로스트리디움 H_N 펩티드는 하기로 이루어진 군으로부터 선택되는 클로스트리디움 H_CC 표준 서열이 없다:

보툴리눔 A형 신경독소 - 아미노산 잔기(Y1111-L1296)

보툴리눔 B형 신경독소 - 아미노산 잔기(Y1098-E1291)

보툴리눔 C형 신경독소 - 아미노산 잔기(Y1112-E1291)

보툴리눔 D형 신경독소 - 아미노산 잔기(Y1099-E1276)

보툴리눔 E형 신경독소 - 아미노산 잔기(Y1086-K1252)

보툴리눔 F형 신경독소 - 아미노산 잔기(Y1106-E1274)

보툴리눔 G형 신경독소 - 아미노산 잔기(Y1106-E1297)

파상풍 신경독소 - 아미노산 잔기 (Y1128-D1315).

아혈청형(sub-serotyep)에 따라 약간의 변화가 일어날 수 있으므로 앞서 확인된 표준 서열은 가이드로 간주되어야 한다.

본 발명의 프로테아제는 진핵세포에서 엑소사이토시스 융합 기구의 하나 이상의 단백질을 절단할 수 있는 모든 비-세포독성 프로테아제를 포함한다. 본 발명의 프로테아제는 바람직하게는 박테리아 프로테아제(또는 그의 단편)이다. 더욱 바람직하게는 박테리아 프로테아제는 클로스트리디움(Clostridium) 또는 나이세리아(Neisseria)/연쇄상구균(Streptococcus) 속(예를 들면 클로스트리디움 경쇄(L-chain), 또는 바람직하게는 임균(N. gonorrhoeae)의 나이세리아 IgA 프로테아제 또는 폐렴연쇄구균(S. pneumoniae)의 프로테아제)으로부터 선택된다.

본 발명은 또한, 프로테아제의 변이체(variant protease)가 필수적인 프로테아제 활성을 보이는 한, 비-세포독성 프로테아제의 변이체(즉 천연 프로테아제 분자의 변이체)를 포함한다. 예로서, 변이체는 표준 프로테아제 서열과 70% 이상, 바람직하게는 80% 이상, 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 또는 98% 이상 아미노산 서열 상동성을 갖는다. 따라서, 용어 변이체(variant)는 강화된 (또는 감소된) 엔도펩티다아제(endopeptidase) 활성을 갖는 비-세포독성 프로테아제를 포함한다 - BoNT/A 돌열변이체 Q161A, E54A 및 K165L의 증가된 K_cat/K_m에 대하여 구체적으로 본 명세서에서 언급되었고, 참조에 의해 통합된 Ahmed, S.A. (2008) Protein J. DOI 10.1007/s10930-007-9118-8을 참조한다. 프로테아제와 관련하여 이용될 때, 용어 단편(fragment)은 일반적으로 표준 프로테아제의 150개 이상, 바람직하게는 200개 이상, 더욱 바람직하게는 250개 이상, 및 가장 바람직하게는 300개 이상의 아미노산 잔기를 갖는 펩티드를 의미한다. (앞서 검토된) TM '단편' 성분의 경우와 같이, 본 발명의 프로테아제 '단편'은 표준 서열에 기반한 프로테아제 변이체의 단편을 포함한다.

본 발명의 프로테아제는 바람직하게는 세린 또는 메탈로프로테아제(metalloprotease) 활성(예를 들면 엔도펩티다아제 활성)을 보인다. 프로테아제는 바람직하게는 SNARE 단백질(예를 들면 SNAP-25, 시냅토브레빈/VAMP, 또는 신택신)에 대해 특이적이다.

신경독소의 프로테아제 도메인, 예를 들면 박테리아 신경독소의 프로테아제 도메인에 대하여 특히 언급한다. 따라서, 본 발명은 천연 신경독소 도메인 및 상기 천연 신경독소의 재조합 제조 버전의 이용을 포함한다. 대표 신경독소는 클로스트리디움에 의해 생성되고, 용어 클로스트리디움 신경독소(clostridial neurotoxin)는 파상풍균(C. tetani)(TeNT), 및 보툴리누스균(C. botulinum)(BoNT) 혈청형 A-G에 의해 생성된 신경독소 및 클로스트리디움 바라티(C. baratii) 및 클로스트리디움 부티리컴(C. butyricum)에 의해 생성된, 밀접하게 연관된 BoNT-유사 신경독소를 포함한다. 앞서-언급된 약어는 본 명세서 전반에 걸쳐 사용된다. 예를 들면, 명명법 BoNT/A는 신경독소의 소스를 BoNT(혈청형 A)로 표시한다.

BoNT는 50kDa 이하의 경쇄(L-chain)에 단일 이황화결합에 의해 공유 결합된 100kDa 이하의 중쇄(H-chain)로 구성되는, 150kDa 이하의 이중-쇄 단백질의, 공통 구조를 공유한다. 중쇄는 각각 50 kDa 이하인 두 개의 도메인으로 구성된다. C-말단 도메인(H_C)이 높은 친화성 뉴런(neuronal) 결합을 위해 요구되고, 반면 N-말단 도메인(H_N)은 막의 전위(translocation)에 관여하는 것으로 제안된다. 경쇄는 기질인 SNARE 단백질의 절단을 담당하는 아연-의존적 메탈로프로테아제이다.

용어 경쇄 단편(L-chain fragment)은 신경독소의 경쇄 성분을 의미하고, 단편은 메탈로프로테아제 활성을 나타내고 세포의 엑소사이토시스와 연관된 소포 및/또는 세포막 관련 단백질(plasma membrane associated protein)을 단백질 분해에 의해 절단할 수 있다.

적절한 프로테아제 (표준) 서열의 예는 하기를 포함한다:

보툴리눔 A형 신경독소 - 아미노산 잔기(1-448)

보툴리눔 B형 신경독소 - 아미노산 잔기(1-440)

보툴리눔 C형 신경독소 - 아미노산 잔기(1-441)

보툴리눔 D형 신경독소 - 아미노산 잔기(1-445)

보툴리눔 E형 신경독소 - 아미노산 잔기(1-422)

보툴리눔 F형 신경독소 - 아미노산 잔기(1-439)

보툴리눔 G형 신경독소 - 아미노산 잔기(1-441)

파상풍 신경독소 - 아미노산 잔기 (1-457)

IgA 프로테아제 - 아미노산 잔기(1-959)^*

^*Pohlner, J. 등 (1987). Nature 325, pp. 458-462, 참조에 의해 본 명세서에 통합됨.

아혈청형(sub-serotyep)에 따라 약간의 변화가 일어날 수 있으므로 앞서 확인된 표준 서열은 가이드로 간주되어야 한다. 예로서, US 2007/0166332(그의 참조에 의해 본 명세서에 통합됨)는 하기와 같이 약간 다른 클로스트리디움 서열을 인용한다:

보툴리눔 A형 신경독소 - 아미노산 잔기(M1-K448)

보툴리눔 B형 신경독소 - 아미노산 잔기(M1-K441)

보툴리눔 C형 신경독소 - 아미노산 잔기(M1-K449)

보툴리눔 D형 신경독소 - 아미노산 잔기(M1-R445)

보툴리눔 E형 신경독소 - 아미노산 잔기(M1-R422)

보툴리눔 F형 신경독소 - 아미노산 잔기(M1-K439)

보툴리눔 G형 신경독소 - 아미노산 잔기(M1-K446)

파상풍 신경독소 - 아미노산 잔기(M1-A457)

경쇄를 포함하는 다양한 클로스트리디움 독소 단편은, 이러한 경쇄 단편이 특이적으로 신경전달물질 방출 기구(neurotransmitter release apparatus)의 핵심 성분을 표적화할 수 있고 따라서 전체적인 세포 메커니즘 실행에 참여하여 클로스트리디움 독소가 기질을 단백질 분해에 의해 절단하는 것을 조건으로, 본 발명의 양태에서 유용할 수 있다. 클로스트리디움 독소의 경쇄는 길이가 약 420-460개의 아미노산이고 효소 도메인을 포함한다. 연구는 클로스트리디움 독소 경쇄의 전체 길이가 효소 도메인의 효소 활성을 위해 필요하지 않다는 것을 보여준다. 비-한정적 예로서, BoNT/A 경쇄의 최초 8개의 아미노산은 효소 활성을 위해 필요하지 않다. 또 다른 비-한정적 예로서, TeNT 경쇄의 최초 8개의 아미노산은 효소 활성을 위해 필요하지 않다. 마찬가지로, 경쇄의 카복시-말단은 활성을 위해 필요하지 않다. 비-한정적 예로서, BoNT/A 경쇄의 마지막 32개의 아미노산(잔기 417-448)은 효소 활성을 위해 필요하지 않다. 또 다른 비-한정적 예로서, TeNT 경쇄의 마지막 31개의 아미노산(잔기 427-457)은 효소 활성을 위해 필요하지 않다. 따라서, 본 구체예의 양태는 예를 들면 350개 이상의 아미노산, 375개 이상의 아미노산, 400개 이상의 아미노산, 425개 이상의 아미노산 및 450개 이상의 아미노산의 길이를 갖는 효소 도메인을 포함하는 클로스트리드움 독소 경쇄를 포함할 수 있다. 본 구체예의 다른 양태는 예를 들면 350개 이하의 아미노산, 375개 이하의 아미노산, 400개 이하의 아미노산, 425개 이하의 아미노산 및 450개 이하의 아미노산의 길이를 갖는 효소 도메인을 포함하는 클로스트리드움 독소 경쇄를 포함할 수 있다.

일 구체예에서, 비-세포독성 프로테아제는 SNAP-23 단백질과 같은 비-신경원성(non-neuronal) SNARE 단백질을 절단한다. 일 구체예에서, 비-세포독성 프로테아제는 SNAP-23을 절단할 수 있는 변형된 보툴리눔 독소 경쇄이다. 이러한 변형된 경쇄의 예는 Chen 및 Barbieri, PNAS, vol. 106, no. 23, p9180-9184, 2009에서 설명된다.

일 구체예에서, 비-세포독성 프로테아제는 BoNT/A, BoNT/C 또는 BoNT/E 프로테아제이고, 바람직한 SNARE 모티프(motif)는 SNAP(예를 들면 SNAP 25)모티프이다. 또 다른 구체예에서, 비-세포독성 프로테아제는 BoNT/B, BoNT/D, BoNT/F 또는 BoNT/G 또는 파상풍 신경독소(TeNT) 프로테아제이고, 바람직한 SNARE 모티프는 VAMP 모티프이다. 또 다른 구체예에서, 비-세포독성 프로테아제는 BoNT/C₁ 프로테아제이고, 바람직한 SNARE 모티프는 신택신 모티프이다.

본 발명의 폴리펩티드, 특히 그의 프로테아제 성분은 페길화(PEGylated)될 수 있다 - 이는 안정성, 예를 들면 프로테아제 성분의 작용의 지속시간(duration) 증가를 도울 수 있다. 페길화는 프로테아제가 BoNT/A, B 또는 C₁ 프로테아제를 포함하는 경우 특히 바람직하다. 페길화는 바람직하게는 프로테아제 성분의 N-말단으로의 PEG의 첨가를 포함한다. 예로서, 프로테아제의 N-말단은 동일하거나 상이할 수 있는 하나 이상의 아미노산(예를 들면 시스테인) 잔기로 연장될 수 있다. 하나 이상의 상기 아미노산 잔기는 그 부착된(예를 들면 공유 결합에 의해 부착된) 자신의 PEG 분자를 가질 수 있다. 이 기술의 예는 참조에 의해 그 전체가 통합된 WO2007/104567에서 설명된다.

전위 도메인은 프로테아제 활성의 기능적 발현이 표적 세포의 세포질 내에서 발생하도록 표적 세포로 프로테아제를 전위시킬 수 있는 분자이다. 분자(예를 들면 단백질 또는 펩티드)가 본 발명의 필수적인 전위 기능을 갖는지 여부는 다수의 통상적인 분석법 중 하나에 의해 확인될 수 있다.

예를 들면, Shone C. (1987)은 테스트 분자로 시험되는(challenged), 리포좀을 이용한 인 비트로(in vitro) 분석법을 기술한다. 필수적인 전위 기능의 존재는 용이하게 모니터링될 수 있는, K⁺ 및/또는 표지된 NAD의 리포좀으로부터 분비에 의해 확인된다[Shone C. (1987) Eur. J. Biochem; vol. 167(1): pp. 175-180 참조]. 다른 예는 평면 인지질 이중층 막을 이용하는 간단한 인 비트로 분석법을 기술하는 Blaustein R. (1987)에 의해 제공된다. 막(membrane)은 테스트 분자로 시험되고 필수적인 전위 기능은 상기 막의 전도성 증가에 의해 확인된다[Blaustein (1987) FEBS Letts; vol. 226, no. 1: pp. 115-120 참조]. 막 융합을 평가할 수 있고 따라서 본 발명에 이용하기 적절한 전위 도메인을 확인할 수 있는 추가적인 방법은 Enzymology Vol 220 and 221, Membrane Fusion Techniques, Parts A and B, Academic Press 1993의 방법에 의해 제공된다.

본 발명은 또한 도메인의 변이체(variant domain)가 필수적인 전위 활성을 보이는 한, 전위 도메인의 변이체를 포함한다. 예로서, 변이체는 표준 전위 도메인과 70% 이상, 바람직하게는 80% 이상, 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 또는 98% 이상의 아미노산 서열 상동성을 갖는다. 전위 도메인과 관련하여 이용될 때, 용어 단편(fragment)은 표준 전위 도메인의 20개 이상, 바람직하게는 40개 이상, 더욱 바람직하게는 80개 이상, 및 가장 바람직하게는 100개 이상의 아미노산 잔기를 갖는 펩티드를 의미한다. 클로스트리디움 전위 도메인의 경우, 단편은 바람직하게는 100개 이상, 바람직하게는 150개 이상, 더욱 바람직하게는 200개 이상, 및 가장 바람직하게는 250개 이상의 표준 전위 도메인(예를 들면 H_N 도메인)의 아미노산 잔기를 갖는다. (앞서 검토된) TM '단편' 성분의 경우와 같이, 본 발명의 전위 '단편'은 표준 서열에 기반한 전위 도메인의 변이체의 단편을 포함한다.

박테리아 독소 분자의 특정 도메인은 이러한 세공(pore)를 형성할 수 있다는 것이 충분히 기록되어 있다. 바이러스에 의해 발현된 막 융합 단백질(virally expressed membrane fusion protein)의 특정 전위 도메인은 이러한 세공을 형성할 수 있다는 것이 또한 알려져 있다. 이러한 도메인이 본 발명에 이용될 수 있다.

전위 도메인은 H_N 도메인(또는 그의 기능적 성분)과 같은 클로스트리디움 기원일 수 있다. H_N은 중쇄의 아미노-말단 절반(amino-terminal half) 또는 온전한 중쇄의 단편에 상응하는 도메인과 거의 동등한 클로스트리디움 신경독소의 중쇄 부분 또는 단편을 의미한다. 이와 관련하여, H_C 세포-결합 기능의 제거가 요구되는 경우, 이는 H_C 또는 H_CC 아미노산 서열의 결실(뉴클레아제(nuclease) 또는 프로테아제 처리(treatment)에 의해 DNA 합성 수준, 또는 후-합성 수준에서)에 의해 수행될 수 있다. 대안적으로, H_C 기능은 화학적 또는 생물학적 처리에 의해 불활성화될 수 있다.

적절한 (표준) 전위 도메인의 예는 하기를 포함한다:

보툴리눔 A형 신경독소 - 아미노산 잔기(449-871)

보툴리눔 B형 신경독소 - 아미노산 잔기(441-858)

보툴리눔 C형 신경독소 - 아미노산 잔기(442-866)

보툴리눔 D형 신경독소 - 아미노산 잔기(446-862)

보툴리눔 E형 신경독소 - 아미노산 잔기(423-845)

보툴리눔 F형 신경독소 - 아미노산 잔기(440-864)

보툴리눔 G형 신경독소 - 아미노산 잔기(442-863)

파상풍 신경독소 - 아미노산 잔기 (458-879)

아혈청형(sub-serotyep)에 따라 약간의 변화가 일어날 수 있으므로 앞서 확인된 표준 서열은 가이드로 간주되어야 한다. 예로서, US 2007/0166332(참조에 의해 본 명세서에 통합됨)는 하기와 같은, 약간 다른 클로스트리디움 서열을 인용한다:

보툴리눔 A형 신경독소 - 아미노산 잔기(A449-K871)

보툴리눔 B형 신경독소 - 아미노산 잔기(A442-S858)

보툴리눔 C형 신경독소 - 아미노산 잔기(T450-N866)

보툴리눔 D형 신경독소 - 아미노산 잔기(D446-N862)

보툴리눔 E형 신경독소 - 아미노산 잔기(K423-K845)

보툴리눔 F형 신경독소 - 아미노산 잔기(A440-K864)

보툴리눔 G형 신경독소 - 아미노산 잔기(S447-S863)

파상풍 신경독소 - 아미노산 잔기(S458-V879)

본 발명의 맥락에서, 전위 도메인을 포함하는 다양한 클로스트리디움 독소 H_N영역은, 이러한 활성 단편이 세포내 소포에서 표적 세포의 세포질로 비-세포독성 프로테아제(예를 들면 클로스트리디움 경쇄)의 분비를 촉진시킬 수 있고 따라서 전체적인 세포 메커니즘 실행에 참여하여 클로스트리디움 독소가 기질을 단백질 분해에 의해 절단하는 것을 조건으로, 본 발명의 양태에서 유용할 수 있다. 클로스트리디움 독소의 중쇄에서 H_N 영역은 약 410-430개의 아미노산으로 이루어진 길이이고 전위 도메인을 포함한다. 연구는 클로스트리디움 독소 중쇄에서 H_N 영역의 전장는 전위 도메인의 전위 활성을 위해 필요하지 않다는 것을 보여주었다. 따라서 본 구체예의 양태는 예를 들면 350개 이상의 아미노산, 375개 이상의 아미노산, 400개 이상의 아미노산 및 425개 이상의 아미노산의 길이를 갖는 전위 도메인을 포함하는 클로스트리디움 독소 H_N 영역을 포함한다. 본 구체예의 다른 양태는 예를 들면 350개 이하의 아미노산, 375개 이하의 아미노산, 400개 이하의 아미노산 및 425개 이하의 아미노산의 길이를 갖는 전위 도메인을 포함하는 클로스트리디움 독소 H_N 영역을 포함할 수 있다.

클로스트리디움 보툴리눔 및 클로스트리디움 테타니에서 독소 생성의 유전적 기초에 대한 더 자세한 내용은, Henderson 등 (1997) in The Clostridia: Molecular Biology and Pathogenesis, Academic press을 참조한다. 용어 H_N은 천연 신경독소 H_N 부분 및 변형된 H_N 부분이 앞서 언급한 전위 기능을 보여주는 한, 자연적으로 발생하지 않는 아미노산 서열 및/또는 합성 아미노산 잔기를 갖는 변형된 H_N 부분을 포함한다.

대안적으로, 전위 도메인은 비-클로스트리디움 기원일 수 있다. 비-클로스트리디움 (표준) 전위 도메인 기원의 예는 디프테리아 독소의 전위 도메인[O’Keefe et al., Proc. Natl. Acad. Sci. USA (1992) 89, 6202-6206; Silverman et al., J. Biol. Chem. (1993) 269, 22524-22532; and London, E. (1992) Biochem. Biophys. Acta., 1112, pp.25-51], 슈도모나스(pseudomonas) 외독소 A형의 전위 도메인[Prior 등. Biochemistry (1992) 31, 3555-3559], 탄저병(anthrax) 독소의 전위 도메인[Blanke 등. Proc. Natl. Acad. Sci. USA (1996) 93, 8437-8442], 다양한 전위 기능의 융합성(fusogenic) 또는 소수성 펩티드[Plank et al. J. Biol. Chem. (1994) 269, 12918-12924; and Wagner et al (1992) PNAS, 89, pp.7934-7938], 및 양친매성(amphiphilic) 펩티드[Murata et al (1992) Biochem., 31, pp.1986-1992]를 포함하나, 이에 한정되지 않는다. 전위 도메인은 천연 단백질에 존재하는 전위 도메인을 반영할 수 있거나, 또는 변이가 전위 도메인의 전위 능력을 파괴하지 않는 한, 아미노산 변이체를 포함할 수 있다.

본 발명에 이용하기 적절한 바이러스 전위 도메인의 구체적인 예는 바이러스에 의해 발현된 막 융합 단백질(virally expressed membrane fusion protein)의 특정 전위 도메인을 포함한다. 예를 들면, Wagner 등 (1992) 및 Murata 등 (1992)은 인플루엔자 바이러스 헤마글루티닌(haemagglutinin)의 N-말단 부위에서 유래된 다수의 융합성(fusogenic) 및 양친매성 펩티드의 전위(즉 막 융합 및 소포형성) 기능을 설명한다. 원하는 전위 활성을 갖는 것으로 알려진, 기타 바이러스에 의해 발현된 막 융합 단백질은 셈리키 포레스트 바이러스(Semliki Forest Virus)(SFV)의 융합성 펩티드의 전위 도메인, 수포성 구내염 바이러스(vesicular stomatitis virus)(VSV) 당단백질 G의 전위 도메인, SER 바이러스 F 단백질의 전위 도메인 및 포미 바이러스(Foamy virus) 외피 당단백질의 전위 도메인이다. 바이러스에 의해 코딩된 Aspike 단백질, 예를 들면 SFV의 E1 단백질 및 VSV의 G단백질은 본 발명의 맥락에서 특정 적용을 갖는다.

(표준) 전위 도메인의 용도는 그의 서열 변이체의 용도를 포함한다. 변이체는, 변이체가 필수적인 전위 기능을 보유하는 것을 조건으로, 하나 이상의 보존적 핵산 치환 및/또는 핵산 결실 또는 삽입을 포함한다. 변이체는 또한, 변이체가 필수적인 전위 기능을 보유하는 한, 하나 이상의 아미노산 치환 및/또는 아미노산 결실 또는 삽입을 포함한다.

본 발명의 폴리펩티드는 전위 촉진 도메인을 더 포함할 수 있다. 상기 도메인은 비-세포독성 프로테아제를 표적 세포의 세포질로 전달하는 것을 촉진하고 예를 들면, WO 08/008803 및 WO 08/008805에서 설명되고, 이들 각각은 참조에 의해 본 명세서에 통합된다.

예로서, 적절한 전위 촉진 도메인은 외피보유(enveloped) 바이러스 융합성 펩티드 도메인을 포함하고, 예를 들면 적절한 융합성 펩티드 도메인은 인플루엔자 바이러스 융합성 펩티드 도메인(예를 들면, 23개 아미노산의 인플루엔자 A 바이러스 융합성 단백질 도메인), 알파바이러스 융합성 펩티드 도메인(예를 들면, 26개 아미노산의 셈리키 포레스트 바이러스 융합성 펩티드 도메인), 수포성 바이러스(vesiculovirus) 융합성 펩티드 도메인(예를 들면 21개 아미노산의 수포성 구내염 바이러스 융합성 펩티드 도메인), 레스피로바이러스(respirovirus) 융합성 펩티드 도메인(예를 들면, 25개 아미노산의 센다이(sendai) 바이러스 융합성 펩티드 도메인), 모빌리바이러스(morbiliivirus) 융합성 펩티드 도메인(예를 들면, 25개 아미노산의 개 홍역 바이러스(Canine distemper virus) 융합성 펩티드 도메인), 아불라바이러스 (avulavirus) 융합성 펩티드 도메인(예를 들면, 25개 아미노산의 뉴캐슬병 바이러스 융합성 펩티드 도메인), 헤니파바이러스(henipavirus) 융합성 펩티드 도메인(예를 들면, 25개 아미노산의 헨드라 바이러스 융합성 펩티드 도메인), 메타뉴모바이러스(metapneumovirus) 융합성 펩티드 도메인(예를 들면, 25개 아미노산의 인간 메타뉴모바이러스 융합성 펩티드 도메인) 또는 유인원 포말 바이러스(simian foamy virus) 융합성 펩티드 도메인과 같은 스푸마바이러스(spumavirus) 융합성 펩티드 도메인; 또는 그의 단편 또는 변이체를 포함한다.

추가적 예로서, 전위 촉진 도메인(translocation facilitating domain)은 클로스트리디움 독소 H_CN 도메인 또는 그의 단편 또는 변이체를 포함할 수 있다. 더 자세하게는, 클로스트리디움 독소 H_CN 전위 촉진 도메인은 200개 이상의 아미노산, 225개 이상의 아미노산, 250개 이상의 아미노산, 275개 이상의 아미노산의 길이를 가질 수 있다. 이와 관련하여, 클로스트리디움 독소 H_CN 전위 촉진 도메인은 바람직하게는 200개 이하의 아미노산, 225개 이하의 아미노산, 250개 이하의 아미노산, 또는 275개 이하의 아미노산의 길이를 갖는다. 구체적인 (표준) 예는 하기를 포함한다:

보툴리눔 A형 신경독소 - 아미노산 잔기(872-1110)

보툴리눔 B형 신경독소 - 아미노산 잔기(859-1097)

보툴리눔 C형 신경독소 - 아미노산 잔기(867-1111)

보툴리눔 D형 신경독소 - 아미노산 잔기(863-1098)

보툴리눔 E형 신경독소 - 아미노산 잔기(846-1085)

보툴리눔 F형 신경독소 - 아미노산 잔기(865-1105)

보툴리눔 G형 신경독소 - 아미노산 잔기(864-1105)

파상풍 신경독소 - 아미노산 잔기 (880-1127)

전술된 서열 위치는 혈청형/아형에 따라 약간 변할 수 있고, 적절한 (표준) 클로스트리디움 독소 H_CN 도메인의 추가적 예는 하기를 포함한다:

보툴리눔 A형 신경독소 - 아미노산 잔기(874-1110)

보툴리눔 B형 신경독소 - 아미노산 잔기(861-1097)

보툴리눔 C형 신경독소 - 아미노산 잔기(869-1111)

보툴리눔 D형 신경독소 - 아미노산 잔기(865-1098)

보툴리눔 E형 신경독소 - 아미노산 잔기(848-1085)

보툴리눔 F형 신경독소 - 아미노산 잔기(867-1105)

보툴리눔 G형 신경독소 - 아미노산 잔기(866-1105)

파상풍 신경독소 - 아미노산 잔기 (882-1127)

앞선 기술한 촉진 도메인은 앞서 기술한 본 발명에 이용하기 적합한 전위 도메인 펩티드와 조합될 수 있다. 따라서, 예로서, 비-클로스트리디움(non-clostridial) 촉진 도메인은 비-클로스트리디움 전위 도메인 펩티드 또는 클로스트리디움 전위 도메인 펩티드와 조합될 수 있다. 대안적으로, 클로스트리디움 독소 H_CN 전위 촉진 도메인은 비-클로스트리디움 전위 도메인 펩티드와 조합될 수 있다. 대안적으로, 클로스트리디움 독소 H_CN 촉진 도메인은 클로스트리디움 전위 도메인 펩티드와 조합될 수 있고, 그 예는 하기를 포함한다:

보툴리눔 A형 신경독소 - 아미노산 잔기(449-1110)

보툴리눔 B형 신경독소 - 아미노산 잔기(442-1097)

보툴리눔 C형 신경독소 - 아미노산 잔기(450-1111)

보툴리눔 D형 신경독소 - 아미노산 잔기(446-1098)

보툴리눔 E형 신경독소 - 아미노산 잔기(423-1085)

보툴리눔 F형 신경독소 - 아미노산 잔기(440-1105)

보툴리눔 G형 신경독소 - 아미노산 잔기(447-1105)

파상풍 신경독소 - 아미노산 잔기 (458-1127)

서열 상동성( Sequence homology )

다양한 서열 정렬(alignment) 방법은, 전체적인(global) 방법, 지역적인(local) 방법 및 혼합(hybrid) 방법, 예를 들면 단편 접근법과 같은 방법을 포함하나 이에 한정되지 않는 퍼센트 동일성(percent identity)을 결정하는데 이용될 수 있다. 퍼센트 동일성을 결정하기 위한 프로토콜은 당업자의 범위 내에서 일상적인 절차이다. 전체적인 방법은 분자의 처음부터 끝까지 서열을 정렬시키고 개별 잔기 쌍의 점수를 합하고 간격(gap)에는 벌점을 부과하여 최적의 정렬을 결정한다. 비-한정적인 방법은 예를 들면, 하기를 포함한다: CLUSTAL W, 예를 들면 Julie D. Thompson 등, CLUSTAL W: Improving the Sensitivity of Progressive Multiple Sequence Alignment Through Sequence Weighting, Position- Specific Gap Penalties and Weight Matrix Choice, 22(22) Nucleic Acids Research 4673-4680 (1994) 참조; 및 반복 정제(iterative refinement), 예를 들면 Osamu Gotoh, Significant Improvement in Accuracy of Multiple Protein: Sequence Alignments by Iterative Refinement as Assessed by Reference to Structural Alignments, 264(4) J. MoI. Biol. 823-838 (1996) 참조. 지역적인 방법은 모든 입력 서열에 의해 공유되는 하나 이상의 보존된 모티프를 확인하는 것에 의해 서열을 정렬시킨다. 비-한정적인 방법은 하기를 포함한다: 매치-박스(Match-box), 예를 들면 Eric Depiereux 및 Ernest Feytmans, Match-Box: A Fundamentally New Algorithm for the Simultaneous Alignment of Several Protein Sequences, 8(5) CABIOS 501-509 (1992) 참조; 깁스 샘플링(Gibbs sampling), 예를 들면, C. E. Lawrence 등, Detecting Subtle Sequence Signals: A Gibbs Sampling Strategy for Multiple Alignment, 262(5131) Science 208-214 (1993) 참조; Align-M, 예를 들면 Ivo Van WaIIe 등, Align-M - A New Algorithm for Multiple Alignment of Highly Divergent Sequences, 20(9) Bioinformatics:1428-1435 (2004) 참조. 따라서, 퍼센트 서열 동일성은 통상적인 방법에 의해 결정된다. 예를 들면 Altschul 등, Bull . Math. Bio . 48: 603-16, 1986 및 Henikoff and Henikoff, Proc . Natl . Acad . Sci . USA 89:10915-19, 1992. 참조. 요약하면, 두 개의 아미노산 서열은 간격 열림(gap opening)에 10점 감점, 간격 확장(gap extension)에 1점 감점, 및 Henikoff 및 Henikoff의 "blosum 62" 점수 메트릭스를 이용하여 정렬 점수가 최적화되도록 정렬된다.

실질적인 상동 폴리펩티드는 하나 이상의 아미노산 치환, 결실 또는 첨가를갖는 것을 특징으로 한다. 바람직하게는, 이러한 변화, 즉, 폴리펩티드의 폴딩 또는 활성에 유의성 있게 영향을 주지 않는 보존적 아미노산 치환(하기 참조) 및 기타 치환; 일반적으로 1 내지 약 30개의 아미노산의, 짧은(small) 결실; 및 아미노-말단 메티오닌 잔기, 약 20-25 잔기까지의 짧은 링커 펩티드, 또는 친화성 태그와 같은 짧은 아미노- 또는 카르복실-말단의 연장은, 중요하지 않은 속성이다.

보존적 아미노산 치환

염기성: 아르기닌; 리신; 히스티딘

산성: 글루탐산; 아스파르트산;

극성: 글루타민; 아스파라긴

소수성: 류신; 이소류신; 발린

방향족: 페닐알라닌; 트립토판; 티로신

소형: 글리신; 알라닌; 세린; 트레오닌; 메티오닌

20개의 표준 아미노산 이외에, 비-표준 아미노산(예를 들면, 4-하이드록시프롤린, 6-N-메틸 라이신, 2-아미노이소부티르 산, 이소발린, 및 α-메틸 세린)이 본 발명의 폴리펩티드의 아미노산 잔기를 치환할 수 있다. 제한된 수의 비-보존적 아미노산, 유전자 코드에 의해 코딩되지 않는 아미노산, 자연에 없는(unnatural) 아미노산이 클로스트리디움 폴리펩티드 아미노산 잔기를 치환할 수 있다. 본 발명의 폴리펩티드는 또한 비-천연(non-naturally occurring) 아미노산 잔기를 포함할 수 있다.

비-자연발생 아미노산은 트랜스-3-메틸프롤린, 2,4-메타노-프롤린, 시스-4-하이드록시프롤린, 트랜스-4-하이드록시-프롤린, N-메틸글리신, 알로-트레오닌, 메틸-트레오닌, 하이드록시-에틸시스테인, 하이드록시에틸호모-시스테인, 니트로-글루타민, 호모글루타민, 피페콜린 산, 터트-류신(tert-leucine), 노르발린, 2-아자페닐알라닌, 3-아자페닐-알라닌, 4-아자페닐-알라닌, 및 4-플루오로페닐알라닌을 포함하나 이에 한정되지 않는다. 비-천연 아미노산 잔기를 단백질에 통합시키는 여러 방법이 당업계에 공지되어 있다. 예를 들면, 넌센스 돌연변이가 화학적으로 아미노아실화된 억제 tRNA를 이용하여 억제되는 인 비트로 시스템이 이용될 수 있다. 아미노산 합성 방법 및 tRNA 아미노아실화 방법은 당업계에 공지되어 있다. 넌센스 돌연변이를 포함하는 플라스미드의 전사 및 번역은 E. coli S30 추출물 및 상업적으로 이용가능한 효소 및 기타 시약을 포함하는 무세포 시스템(cell free system)에서 수행된다. 단백질은 크로마토그래피에 의해 정제된다. 예를 들면, Robertson 등., J. Am . Chem . Soc. 113:2722, 1991; Ellman 등, Methods Enzymol. 202:301, 1991; Chung 등, Science 259:806-9, 1993; 및 Chung 등, Proc . Natl . Acad . Sci . USA 90:10145-9, 1993 참조. 두 번째 방법에서, 번역은 돌연변이된 mRNA 및 화학적으로 아미노아실화된 억제 tRNA의 미세주입(microinjection)에 의해 발톱개구리(Xenopus)의 난자에서 수행된다(Turcatti et al., J. Biol . Chem . 271:19991-8, 1996). 세 번째 방법에서, E.coli 세포는 치환될 천연 아미노산(예를 들면 페닐알라닌)의 부재 및 원하는 비-천연 아미노산(예를 들면, 2-아자페닐알라닌, 3-아자페닐알라닌, 4-아자페닐알라닌, 또는 4-플루오로페닐알라닌)의 존재 하에 배양된다. 비-천연 아미노산은 그의 천연 대응물(counterpart) 대신 폴리펩티드로 통합된다. Koide 등, Biochem. 33:7470-6, 1994, 참조. 천연 아미노산 잔기는 인 비트로 화학적 변형에 의해 비-천연 종으로 변환될 수 있다. 치환의 범위를 더 확장하기 위하여, 화학적 변형이 부위-지정 돌연변이유발과 조합될 수 있다(Wynn 및 Richards, Protein Sci. 2:395-403, 1993).

제한된 수의 비-보존적 아미노산, 유전자 코드에 의해 코딩되지 않는 아미노산, 비-천연 아미노산, 및 자연에 없는(unnatural) 아미노산이 본 발명의 폴리펩티드의 아미노산 잔기를 치환할 수 있다.

본 발명의 폴리펩티드의 필수 아미노산은 부위-지정 돌연변이유발 또는 알라닌-스캐닝 돌연변이유발과 같은 당업계에 알려진 절차에 따라 확인될 수 있다 (Cunningham 및 Wells, Science 244: 1081-5, 1989). 생물학적 상호작용의 부위는 또한, 추정적 접촉 부위 아미노산의 돌연변이와 함께, 핵 자기 공명, 결정학, 전자 회절 또는 광친화성 표지화(photoaffinity labeling)와 같은 기법에 의해 결정되는, 구조의 물리적 분석에 의해 결정될 수 있다. 예를 들면, de Vos 등., Science 255:306-12, 1992; Smith 등, J. Mol . Biol. 224:899-904, 1992; Wlodaver 등, FEBS Lett. 309:59-64, 1992, 참조. 필수 아미노산의 실체(identity)는 또한 본 발명의 폴리펩티드의 관련 성분(예를 들면 전위 또는 프로테아제 성분)과의 상동성 분석으로부터 유추될 수 있다.

복수의 아미노산 치환이 Reidhaar-Olson 및 Sauer (Science 241:53-7, 1988) 또는 Bowie 및 Sauer (Proc . Natl . Acad . Sci . USA 86:2152-6, 1989)에 의해 개시된 것과 같은 돌연변이유발 및 스크리닝의 알려진 방법을 이용하여 이루어지고 테스트될 수 있다. 요약하면, 이러한 저자들은 폴리펩티드의 2개 이상의 위치를 동시에 랜덤화하고, 기능적 폴리펩티드를 선별하고, 및 그 후 각 위치에서 허용가능한 치환의 스펙트럼을 결정하기 위하여 돌연변이유발된 폴리펩티드의 서열을 결정하는 방법을 개시한다. 이용할 수 있는 다른 방법은 파지 디스플레이(예를 들면 Lowman 등, Biochem . 30:10832-7, 1991; Ladner 등, U.S. Patent No. 5,223,409; Huse, WIPO Publication WO 92/06204) 및 영역-지정 돌연변이유발(region-directed mutagenesis)(Derbyshire 등, Gene 46:145, 1986; Ner 등, DNA 7:127, 1988)을 포함한다.

실시예의 요약 설명

실시예 1 H_N 도메인의 C-말단에 GnRH 폴리펩티드를 통합하는 LHD 단백질의 생성

실시예 2 H_N 도메인의 C-말단에 GnRH 폴리펩티드를 통합하는 LHA 단백질의 생성

실시예 3 두 개의 상이한 프로테아제 인식 부위가 통합된, H_N 도메인의 C-말단에 GnRH 폴리펩티드를 통합하는 LHD 단백질의 생성

실시예 4 H_N 도메인의 C-말단에 GnRH 폴리펩티드를 통합하는 LHD 단백질의 제조 방법

실시예 5 웨스턴 블랏팅에 의한, 공유 결합으로 부착된 리간드 존재의 입증

실시예 6 질량 분석법에 의한, 공유 결합으로 부착된 TM 존재의 입증

실시예 7 GnRH 폴리펩티드를 통합하는 LHD 단백질의 결합 능력 평가

실시예 8 GnRH 폴리펩티드를 통합하는 LHD 단백질의 인 비트로 기능성 평가

실시예 9 H_N 도메인의 C-말단에 디놀핀 및 브래디키닌 폴리펩티드를 통합하는 LHD 단백질의 생성

실시예 10 H_N 도메인의 C-말단에 베타-엔돌핀 및 브래디키닌 폴리펩티드를 통합하는 LHA 단백질의 생성

실시예 11 H_N 도메인의 C-말단에 두 개의 GHRH 폴리펩티드를 통합하는 LHD 단백질의 생성

실시예 12 제 2 프로테아제 활성화 부위로부터 5개의 아미노산만큼 떨어진(spaced), H_N 도메인의 C-말단에 GnRH 폴리펩티드를 통합하는 LHD 단백질의 생성

실시예 13 H_N 도메인의 C-말단에 가스트린 분비 펩티드를 통합하는 LHA 단백질의 생성

실시예 14 전립선암 환자의 치료 방법

실시예 15 신경성 염증 환자의 치료 방법

실시예 16 자궁내막증 환자의 치료방법

도 1은 환원 및 비-환원 조건에서 실시예 4의 활성화된 샘플(80 mM + 250 mM의 이미다졸 분획에서 용출)의 SDS-PAGE 분석을 보여준다.
서열번호의 간단한 설명
하기의 서열번호 모두는 최초 메티오닌 아미노산 잔기(또는 그에 상응하는 N-말단 핵산 코돈/서열)를 제외할 수 있다.
서열번호 1 LHD-GnRH의 DNA 서열
서열번호 2 LHD-GnRH의 단백질 서열
서열번호 3 LHA-GnRH의 DNA 서열
서열번호 4 LHA-GnRH의 단백질 서열
서열번호 5 두 개의 상이한 프로테아제 부위를 갖는 LHD-GnRH의 DNA 서열
서열번호 6 두 개의 상이한 프로테아제 부위를 갖는 LHD-GnRH의 단백질 서열
서열번호 7 H_N 도메인의 C-말단에 디놀핀 및 브래디키닌 폴리펩티드를 통합하는 LHD의 DNA 서열
서열번호 8 H_N 도메인의 C-말단에 디놀핀 및 브래디키닌 폴리펩티드를 통합하는 LHD의 단백질 서열
서열번호 9 H_N 도메인의 C-말단에 베타-엔돌핀 및 브래디키닌 폴리펩티드를 통합하는 LHA의 DNA 서열
서열번호 10 H_N 도메인의 C-말단에 베타-엔돌핀 및 브래디키닌 폴리펩티드를 통합하는 LHA의 단백질 서열
서열번호 11 H_N 도메인의 C-말단에 두 개의 GHRH 폴리펩티드를 통합하는 LHD의 DNA 서열
서열번호 12 H_N 도메인의 C-말단에 두 개의 GHRH 폴리펩티드를 통합하는 LHD의 단백질 서열
서열번호 13 H_N 도메인의 C-말단에 GnRH를 통합하는 LHD의 DNA 서열
서열번호 14 H_N 도메인의 C-말단에 GnRH를 통합하는 LHD의 단백질 서열
서열번호 15 H_N 도메인의 C-말단에 가스트린 분비 펩티드를 통합하는 LHA의 DNA 서열
서열번호 16 H_N 도메인의 C-말단에 가스트린 분비 펩티드를 통합하는 LHA 단백질 서열

하기에 실시예에 의해 예시되는, 본 발명의 특정 구체예의 설명이 제공된다.

실시예 1 H _N 도메인의 C-말단에 GnRH 폴리펩티드를 통합하는 LHD 단백질의 생성

BoNT/D의 LH_N 단편과 10개의 아미노산 펩티드 GnRH의 유전적 융합(genetic fusion)에 의해 구축된 키메라 단백질의 일차(primary) 서열을 인자 Xa의 원형의(prototypical) 인식 부위(IEGR)와 닮은 아미노산 배열(string)의 존재에 대하여 검토한다. 이러한 배열이 발견되지 않을 때, LC-H_N 접합부에서 융합 단백질을 활성화하고 또한 H_N과 TM(GnRH) 사이의 펩티드 결합을 절단하기 위한 프로테아제로 FXa를 이용하는 선택이 이루어진다.

N-말단에서 C-말단으로, 하기의 구조를 갖는 융합 단백질을 코딩하는, E. coli 발현에 최적화된 DNA를 Entelechon(독일)에서 상업적으로 얻는다:

● 10개의 His N-말단(10 His N-terminal) 정제 태그,

● 10개의 아스파라긴 아미노산 스페이서,

● BoNT/D의 LC,

● FXa의 기질인 테트라 펩티드 IEGR을 통합하도록 변형된, BoNT/A에서 발견되는 것과 유사한 일차 서열을 갖는 인터-도메인 링커(inter-domain linker),

● C-말단 시스테인을 통합하도록 변형된 BoNT/D의 H_N

● C-말단에 IEGR 펩티드 서열을 통합하는 Gly-Gly-Gly-Gly-Ser 스페이서

● 6번 자리에 천연 글리신 대신 시스테인 잔기를 통합하도록 변형된 10개의 아미노산으로 이루어진 GnRH 펩티드(QHWSYCLRPG).

구성(construction)이 열등한(poor) 코돈 이용을 초래하지 않는다는 것을 확실하게 하기 위하여 Graphical Codon Usage Analyser (Geneart)과 같은 소프트웨어 프로그램을 참조하여 E.coli 코돈의 이용을 평가하고, 공개된 코돈 이용 테이블(codon usage table)(예를 들면 GenBank Release 143, 2004년 9월 13일)을 참조하여 %GC 함량 및 코돈 이용 비율을 평가하였다. E.coli 숙주로의 형질전환 전에 표준 클로닝 벡터, 예를 들면 pCR4에 DNA를 통합시켰다. 서열 결정에 의해 ORF DNA의 완전성(integrity)을 확인하였다. 최종 ORF는 서열번호 1로 표시되고 발현 생성물의 아미노산 서열은 서열번호 2로 표시된다.

실시예 2 H _N 도메인의 C-말단에 GnRH 폴리펩티드를 통합하는 LHA 단백질의 생성

BoNT/A의 LH_N 단편과 10개의 아미노산 펩티드 GnRH의 유전적 융합에 의해 구축된 키메라 단백질의 일차 서열을 인자 Xa의 원형의 인식 부위(IEGR)와 닮은 아미노산 배열의 존재에 대하여 검토한다. 이러한 배열이 발견되지 않을 때, LC-H_N 접합부에서 융합 단백질을 활성화하고 또한 H_N과 TM(GnRH) 사이의 펩티드 결합을 절단하기 위한 프로테아제로 FXa를 이용하는 선택이 이루어진다.

N-말단에서 C-말단으로, 하기의 구조를 갖는 융합 단백질을 코딩하는, E. coli 발현에 최적화된 DNA는 Entelechon(독일)에서 상업적으로 얻는다:

● 10개의 His N-말단 정제 태그,

● 10개의 아스파라긴 아미노산 스페이서,

● BoNT/A의 LC,

● FXa의 기질인 테트라 펩티드 IEGR을 통합하도록 변형된, BoNT/A에서 발견되는 것과 유사한 일차 서열을 갖는 인터-도메인 링커,

● C-말단 시스테인을 통합하도록 변형된 BoNT/A의 H_N,

● 6번 자리에 천연 글리신 대신 시스테인 잔기를 통합하도록 변형된 10개의 아미노산으로 이루어진 GnRH 펩티드.

구성이 열등한 코돈 이용을 초래하지 않는다는 것을 확실하게 하기 위하여 Graphical Codon Usage Analyser (Geneart)과 같은 소프트웨어 프로그램을 참조하여 E.coli 코돈의 이용을 평가하고, 공개된 코돈 이용 테이블(codon usage table)(예를 들면 GenBank Release 143, 2004년 9월 13일)을 참조하여 %GC 함량 및 코돈 이용 비율을 평가하였다. E.coli 숙주로의 형질전환 전에 표준 클로닝 벡터, 예를 들면 pCR4에 DNA를 통합시켰다. 서열 결정에 의해 ORF DNA의 완전성을 확인하였다. 최종 ORF는 서열번호 3으로 표시되고 발현 생성물의 아미노산 서열은 서열번호 4로 표시된다.

실시예 3 두 개의 상이한 프로테아제 인식 부위가 통합된, H _N 도메인의 C-말단에 GnRH 폴리펩티드를 통합하는 LHD 단백질의 생성

BoNT/D의 LH_N 단편과 10개의 아미노산 펩티드 GnRH의 유전적 융합에 의해 구축된 키메라 단백질의 일차 서열을 인자 Xa 및 엔테로키나아제(DDDDK)의 원형의 인식 부위(IEGR)와 닮은 아미노산 배열의 존재에 대하여 검토한다. 이러한 배열이 발견되지 않을 때, LC-H_N 접합부에서 융합 단백질을 활성화하기 위한 프로테아제 및 H_N과 TM(GnRH) 사이의 펩티드 결합을 절단하기 위한 엔테로키나아제로 FXa를 이용하는 선택이 이루어진다.

● 10개의 His N-말단 정제 태그,

● 10개의 아미노산 아스파라긴 스페이서,

● BoNT/D의 LC,

● FXa의 기질인 테트라 펩티드 IEGR를 통합하도록 변형된, BoNT/A에서 발견되는 것과 유사한 일차 서열을 갖는 인터-도메인 링커,

● C-말단 시스테인을 통합하기 위해 변형된 BoNT/D의 H_N,

● C-말단에 DDDDK 펩티드 서열을 통합하는 Gly-Gly-Gly-Gly-Ser 스페이서

구성이 열등한 코돈 이용을 초래하지 않는다는 것을 확실하게 하기 위하여 Graphical Codon Usage Analyser (Geneart)과 같은 소프트웨어 프로그램을 참조하여 E.coli 코돈의 이용을 평가하고, 공개된 코돈 이용 테이블(codon usage table)(예를 들면 GenBank Release 143, 2004년 9월 13일)을 참조하여 %GC 함량 및 코돈 이용 비율을 평가하였다. E.coli 숙주로의 형질전환 전에 표준 클로닝 벡터, 예를 들면 pCR4에 DNA를 통합시켰다. 서열 결정에 의해 ORF DNA의 완전성을 확인하였다. 최종 ORF는 서열번호 5로 표시되고 발현 생성물의 아미노산 서열은 서열번호 6으로 표시된다.

실시예 4 H _N 도메인의 C-말단에 GnRH 폴리펩티드를 통합하는 LHD 단백질의 제조 방법

실시예 1에서 생성된 ORF를 E.coli 발현 벡터(유동성(mobilisation) 결핍을 보장하기 위해 변형된 pET(Novagen) 벡터)로 클로닝하고, E.coli 숙주 균주, 가장 일반적인 BL21에 형질전환하였다.

LHD-GnRH 융합 단백질의 발현은 하기의 프로토콜을 이용하여 달성된다. LHD-GnRH 발현 균주의 단일 콜로니를 250ml 플라스크 중 0.2% 글루코오스 및 암피실린 100㎍/ml를 포함하는 변형된 TB 100ml를 접종한다. 37℃, 225rpm으로 16시간 배양물을 배양한다. 10ml의 밤새 배양한 배양물로 2x2L 플라스크에 0.2% 글루코오스 및 암피실린 100㎍/ml를 포함하는 변형된 TB 2x1L를 접종한다. 약 0.5의 OD600nm에 도달될 때까지 37℃에서 배양하고 그 시점에서 온도를 16℃까지 감소시킨다. 1시간 후 1mM IPTG로 배양물을 유도하고 16시간 더 16℃에서 배양한다. 배양물을 원심분리하여 32.5g의 세포 페이스트(paste)를 얻었다.

LHD-GnRH 융합체의 정제는 친화성 크로마토그래피에 의해 달성된다. 구체적으로, 25ml의 50mM HEPES pH 7.2, 200mM NaCl 및 약 10g의 E.coli BL21 세포 페이스트를 포함하는 팔콘 튜브를 해동한다. 샘플을 차갑게 유지하면서, 22 마이크론의 파워로 세포 페이스트를 얼음에서 30초 초음파 처리하고, 30초 쉬는 사이클을 10사이클 반복한다. 용해된 세포를 18000rpm, 4℃에서 30분간 스핀한다. 상층액을 50mM HEPES pH 7.2, 200mM NaCl로 평형화시킨 His Trap HP Chelating 컬럼(5ml 컬럼이 충분하다)에 로딩한다. 비-특이적으로 결합된 단백질을 세척하기 위해 40mM 이미다졸의 첨가 후, 80mM 이미다졸, 250mM 이미다졸, 500mM 이미다졸의 단계적 구배로 융합 단백질을 용출한다. 용출된 융합 단백질을 4℃에서 밤새 50mM HEPES pH 7.2, 200mM NaCl 5L에 대하여 투석하고 투석된 융합 단백질의 OD를 측정한다. 융합단백질 mg 당 10U의 인자 Xa를 첨가하고 25℃ 항온으로 밤새 인큐베이션한다. 50mM HEPES pH 7.2, 200mM NaCl로 평형화시킨 His Trap HP Chelating 컬럼(5ml 컬럼이 충분하다)에 로딩한다. 50mM HEPES pH 7.2, 200mM NaCl로 베이스라인(baseline)까지 컬럼을 세척한다. 10 및 40mM 이미다졸의 단계적 구배를 이용하여, 비-특이적으로 결합된 단백질을 세척하고 100mM 이미다졸로 융합 단백질을 용출한다. 용출된 융합 단백질을 4℃에서 밤새 25mM Tris, 200mM NaCl, pH 8.0의 5L에 대하여 투석하고 약 2mg/ml로 융합물을 농축하고, 샘플을 분주하고, -20℃에서 동결한다. OD, BCA 및 순도 분석을 이용하여 정제된 단백질을 테스트한다.

활성화된 단백질의 샘플은 환원 및 비-환원 조건에서 SDS-PAGE에 의해 분석된다. 80mM 및 250mM 이미다졸 부분에서 용출된 샘플을 분석한다 - 도 1 참조.

실시예 5 웨스턴 블랏팅에 의해 공유 결합으로 부착된 리간드 존재의 입증

융합 단백질 내 TM의 존재는 다양한 방법에 의해 평가될 수 있다. 한 방법은 TM에 대한 특정 항혈청을 사용하고 SDS-PAGE 및 웨스턴 블랏팅에 의해 시각화하는 것이다. TM에 대한 항체는 상업적으로 얻을 수 있거나(예를 들면 항-GnRH 항체는 Abcam(AB76560) 또는 Novus Biologicals(H00002796-B01)) 또는 상업적 서비스 제공자에 의해 특정 펩티드 서열에 특이적으로 제조될 수 있다.

이러한 기법을 이용하여, 비-환원 조건에서 수행될 때, GnRH의 존재가 전장의 활성화된 융합 단백질 내에 있는 것으로 확인되나, 환원 조건에서 수행될 때, H_N 도메인상에는 존재하지 않는다.

실시예 6 질량 분석법에 의해 공유 결합으로 부착된 TM 존재의 입증

융합 단백질 내 TM의 존재는 다양한 방법에 의해 평가될 수 있다. 한 방법은 환원 전 후의 융합 단백질의 질량을 확인하는 질량 분석법을 이용하는 것이다.

실시예 4에 따라 제조된 단백질을 이용하여, 다양한 환원되지 않은 단백질 샘플 및 환원된 단백질 샘플을 SDS-PAGE로부터 추출하고 질량분석계(Intertek, Manchester)에 의해 분석했다.

비-활성화된, 환원되지 않은 융합 단백질의 예측 질량은 105271 Da이다. 샘플의 관측된 질량은 105284 Da이고, 차이는 장비의 오차 내인 13 Da에 불과하다. 따라서 비-활성화된, 환원되지 않은 융합 단백질에서 온전한(intact) GnRH의 존재가 확인된다.

환원되지 않은 샘플:
이론적 질량:	상응하는 구조:	관측된 질량:	질량 차이:
105271 Da	전장	105284 Da	13 Da

활성화된, 환원되지 않은 융합 단백질의 예측 질량은 105271 Da이다. 샘플의 관측된 질량은 105321 Da이고, 차이는 장비의 오차 내인 50 Da에 불과하다. 따라서 활성화된, 환원되지 않은 융합 단백질에서 온전한 GnRH의 존재가 확인된다.

환원되지 않은 샘플:
이론적 질량:	상응하는 구조:	관측된 질량:	질량 차이:
105271 Da	전장	105321 Da	50 Da

LC 및 H_N 도메인의 환원된 샘플을 평가하는 경우, H_N 도메인(H_N + 스페이서 + 활성화 부위를 포함해야 한다)은 예측 질량이 49419 Da이고 관측된 질량은 49421이다. 이것은 환원된 H_N 도메인은 GnRH 펩티드를 보유하지 않는다는 것을 나타낸다. 이 결과는 단백질분해 및 이황화 결합의 환원은 H_N 도메인의 C-말단으로부터 GnRH 서열을 방출할 것이므로 예측과 완전히 같다.

환원된 샘플:Hn 소단위(subunit) 질량
이론적 질량:	상응하는 구조:	관측된 질량:	질량 차이:
49419 Da	중쇄 + 스페이서 + 활성 부위	49421 Da	2 Da

이러한 데이터는 GnRH 리간드가 활성화 및 환원 전에 융합 단백질에 부착되어 있고, 환원제 없이 활성화 후 융합 단백질에 부착되어 있지만, 활성화 및 환원 후 H_N 도메인으로부터 이탈된다(absent)는 것을 보여준다. 이는 융합 단백질은 정확하게 단백질분해 부위에서 활성화되고 GnRH 리간드는 조작에 의해 도입된된(engineered) 이황화 결합을 통해 H_N 도메인에 부착된다는 것을 확인한다.

실시예 7 GnRH 폴리펩티드를 통합하는 LHD 단백질의 결합 능력 평가

실시예 4에 따라 제조된 단백질을 다수의 적절한 분석법 중 하나를 이용한 리간드-수용체 상호작용의 기능성에 대해 평가한다. 예를 들면 Cisbio Bioassays에 의해 공급된 성선자극호르몬-분비 호르몬 GnRHR 수용체 리간드 결합 분석법은 샘플 중 결합 활성을 정량화하는 경쟁 분석법(competition assay)이다(http://www.htrf.com/products/gpcr/binding/ligands/inserts/C1TT1GNRH.pdf). 대안적으로, 다양한, 공개적으로 이용가능한 결합 분석법이 과학 문헌에 보고되어 있다(예를 들면 Christopher E. Heise, Susan K. Sullivan 및 Paul D. Crowe, J Biomol Screen 2007 12: 235; DOI: 10.1177/1087057106297362). 이러한 분석법의 이용은 GnRH TM은 표적 수용체와 상호작용할 수 있다는 것을 나타낸다.

데이터는 GnRH TM이 표적 수용체와 상호작용할 수 있다는 것을 나타낸다.

실시예 8 GnRH 폴리펩티드를 통합하는 LHD 단백질의 인 비트로 기능성 평가

실시예 4에 따라 제조된 단백질을 표적 세포 내 SNARE 단백질을 절단하는 능력에 대해 평가한다. 요약하면, 성선자극호르몬-분비 호르몬(GnRH) 수용체를 높은 수준으로 발현하는 알파 T3-1 세포주(불멸화 성선자극세포 세포주)(immortalized gonadotroph cell line)를 본 발명의 화합물과 인큐베이션한다. 24시간 후 세포 물질을 수집하고 웨스턴 블랏팅에 의해 SNARE 단백질을 분석한다. 데이터는 GnRH TM을 포함하는 융합 단백질은 표적 수용체와 상호작용할 수 있어서, 내재화 및 세포내 SNARE 단백질의 절단을 가져온다는 것을 나타낸다.

실시예 9 H _N 도메인의 C-말단에 디놀핀 및 브래디키닌 폴리펩티드를 통합하는 LHD 단백질의 생성

BoNT/D의 LH_N 단편과 디놀핀 및 브래디키닌 펩티드의 유전적 융합에 의해 구축된 키메라 단백질의 일차 서열을 인자 Xa의 원형의 인식 부위(IEGR)와 닮은 아미노산 배열의 존재에 대하여 검토한다. 이러한 배열이 발견되지 않을 때, LC-H_N 접합부에서 융합 단백질을 활성화하고 또한 H_N과 디놀핀 펩티드 사이의 펩티드 결합을 절단하기 위한 프로테아제로 FXa를 이용하는 선택이 이루어진다. H_N으로의 이황화 결합을 촉진하기 위하여 단일 시스테인을 통합하는 11개의 아미노산으로 이루어진 스페이서를 디놀핀과 브래디키닌 펩티드 사이에 구축한다.

● 10개의 His N-말단 정제 태그,

● 10개의 아스파라긴 아미노산 스페이서,

● BoNT/D의 LC,

● C-말단 시스테인을 통합하도록 변형된 BoNT/D의 H_N,

● 17개 아미노산으로 이루어진 디놀핀 펩티드

● Gly-Gly-Gly-Gly-Ser-Cys-Gly-Gly-Gly-Gly-Ser의 11개 아미노산

● 9개 아미노산으로 이루어진 브래디키닌 펩티드.

구성이 열등한 코돈 이용을 초래하지 않는다는 것을 확실하게 하기 위하여 Graphical Codon Usage Analyser (Geneart)과 같은 소프트웨어 프로그램을 참조하여 E.coli 코돈의 이용을 평가하고, 공개된 코돈 이용 테이블(codon usage table)(예를 들면 GenBank Release 143, 2004년 9월 13일)을 참조하여 %GC 함량 및 코돈 이용 비율을 평가하였다. E.coli 숙주로의 형질전환 전에 표준 클로닝 벡터, 예를 들면 pCR4에 DNA를 통합시켰다. 서열 결정에 의해 ORF DNA의 완전성을 확인하였다. 최종 ORF는 서열번호 7로 표시되고 발현 생성물의 아미노산 서열은 서열번호 8로 표시된다.

실시예 10 H _N 도메인의 C-말단에 베타- 엔돌핀 및 브래디키닌 폴리펩티드를 통합하는 LHA 단백질의 생성

BoNT/A의 LH_N 단편과 베타-엔돌핀 및 브래디키닌 펩티드의 유전적 융합에 의해 구축된 키메라 단백질의 일차 서열을 인자 Xa의 원형의 인식 부위(IEGR)와 닮은 아미노산 배열의 존재에 대하여 검토한다. 이러한 배열이 발견되지 않을 때, LC-H_N 접합부에서 융합 단백질을 활성화하고 또한 H_N과 베타-엔돌핀 펩티드 사이의 펩티드 결합을 절단하기 위한 프로테아제로 FXa를 이용하는 선택이 이루어진다. H_N으로의 이황화 결합을 촉진하기 위하여 단일 시스테인을 통합하는 11개의 아미노산으로 이루어진 스페이서를 베타-엔돌핀과 브래디키닌 펩티드 사이에 구축된다.

● 10개의 His N-말단 정제 태그,

● 10개의 아스파라긴 아미노산 스페이서,

● BoNT/A의 LC,

● C-말단 시스테인을 통합하도록 변형된 BoNT/A의 H_N,

● 31개 아미노산으로 이루어진 베타-엔돌핀 펩티드

● Gly-Gly-Gly-Gly-Ser-Cys-Gly-Gly-Gly-Gly-Ser의 11개 아미노산

● 9개 아미노산으로 이루어진 브래디키닌 펩티드.

구성이 열등한 코돈 이용을 초래하지 않는다는 것을 확실하게 하기 위하여 Graphical Codon Usage Analyser (Geneart)과 같은 소프트웨어 프로그램을 참조하여 E.coli 코돈의 이용을 평가하고, 공개된 코돈 이용 테이블(codon usage table)(예를 들면 GenBank Release 143, 2004년 9월 13일)을 참조하여 %GC 함량 및 코돈 이용 비율을 평가하였다. E.coli 숙주로의 형질전환 전에 표준 클로닝 벡터, 예를 들면 pCR4에 DNA를 통합시켰다. 서열 결정에 의해 ORF DNA의 완전성을 확인하였다. 최종 ORF는 서열번호 9로 표시되고 발현 생성물의 아미노산 서열은 서열번호 10으로 표시된다.

실시예 11 H _N 도메인의 C-말단에 두 개의 GHRH 폴리펩티드를 통합하는 LHD 단백질의 생성

BoNT/D의 LH_N 단편과 두 개의 GHRH 펩티드의 유전적 융합에 의해 구축된 키메라 단백질의 일차 서열을 인자 Xa의 원형의 인식 부위(IEGR)와 닮은 아미노산 배열의 존재에 대하여 검토한다. 이러한 배열이 발견되지 않을 때, LC-H_N 접합부에서 융합 단백질을 활성화하고 또한 H_N과 GHRH 펩티드 사이의 펩티드 결합을 절단하기 위한 프로테아제로 FXa를 이용하는 선택이 이루어진다. H_N으로의 이황화 결합을 촉진하기 위하여 단일 시스테인을 통합하는 11개의 아미노산으로 이루어진 스페이서를 두 개의 GHRH 펩티드 사이에 구축한다.

● 10개의 His N-말단 정제 태그,

● 10개의 아미노산 아스파라긴 스페이서,

● BoNT/D의 LC,

● C-말단 시스테인을 통합하도록 변형된 BoNT/D의 H_N,

● 40개 아미노산으로 이루어진 GHRH 펩티드

● Gly-Gly-Gly-Gly-Ser-Cys-Gly-Gly-Gly-Gly-Ser의 11개 아미노산

● 40개 아미노산으로 이루어진 GHRH 펩티드.

구성이 열등한 코돈 이용을 초래하지 않는다는 것을 확실하게 하기 위하여 Graphical Codon Usage Analyser (Geneart)과 같은 소프트웨어 프로그램을 참조하여 E.coli 코돈의 이용을 평가하고, 공개된 코돈 이용 테이블(codon usage table)(예를 들면 GenBank Release 143, 2004년 9월 13일)을 참조하여 %GC 함량 및 코돈 이용 비율을 평가하였다. E.coli 숙주로의 형질전환 전에 표준 클로닝 벡터, 예를 들면 pCR4에 DNA를 통합시켰다. 서열 결정에 의해 ORF DNA의 완전성을 확인하였다. 최종 ORF는 서열번호 11로 표시되고 발현 생성물의 아미노산 서열은 서열번호 12로 표시된다.

실시예 12 제 2 프로테아제 활성화 부위로부터 5개의 아미노산만큼 떨어진, H _N 도메인의 C-말단에 GnRH 폴리펩티드를 통합하는 LHD 단백질의 생성

BoNT/D의 LH_N 단편과 GnRH의 10개의 아미노산 펩티드의 유전적 융합에 의해 구축된 키메라 단백질의 일차 서열을 인자 Xa의 원형의 인식 부위(IEGR)와 닮은 아미노산 배열의 존재에 대하여 검토한다. 이러한 배열이 발견되지 않을 때, LC-H_N 접합부에서 융합 단백질을 활성화하고 또한 H_N과 TM(GnRH)의 N-말단의 스페이서 사이의 펩티드 결합을 절단하기 위한 프로테아제로 FXa를 이용하는 선택이 이루어진다.

● 10개의 His N-말단 정제 태그,

● 10개의 아스파라긴 아미노산 스페이서,

● BoNT/D의 LC,

● C-말단 시스테인을 통합하도록 변형된 BoNT/D의 H_N,

● IEGR 펩티드를 통합하는 Gly-Gly-Gly-Gly-Ser-Ile-Glu-Gly-Arg-Gly-Gly-Gly-Gly-Ser 스페이서,

구성이 열등한 코돈 이용을 초래하지 않는다는 것을 확실하게 하기 위하여 Graphical Codon Usage Analyser (Geneart)과 같은 소프트웨어 프로그램을 참조하여 E.coli 코돈의 이용을 평가하고, 공개된 코돈 이용 테이블(codon usage table)(예를 들면 GenBank Release 143, 2004년 9월 13일)을 참조하여 %GC 함량 및 코돈 이용 비율을 평가하였다. E.coli 숙주로의 형질전환 전에 표준 클로닝 벡터, 예를 들면 pCR4에 DNA를 통합시켰다. 서열 결정에 의해 ORF DNA의 완전성을 확인하였다. 최종 ORF는 서열번호 13으로 표시되고 발현 생성물의 아미노산 서열은 서열번호 14로 표시된다.

실시예 13 H _N 도메인의 C-말단에 가스트린 분비 펩티드를 통합하는 LHA 단백질의 생성

BoNT/A의 LH_N 단편과 27개의 아미노산으로 이루어진 가스트린 분비 펩티드(GRP)의 유전적 융합에 의해 구축된 키메라 단백질의 일차 서열을 인자 Xa의 원형의 인식 부위(IEGR)와 닮은 아미노산 배열(string)의 존재에 대하여 검토한다. 이러한 배열이 발견되지 않을 때, LC-H_N 접합부에서 융합 단백질을 활성화하고 또한 H_N과 TM(GRP) 사이의 펩티드 결합을 절단하기 위한 프로테아제로 FXa를 이용하는 선택이 이루어진다.

● 10개의 His N-말단 정제 태그,

● 10개의 아스파라긴 아미노산 스페이서,

● BoNT/A의 LC,

● FXa의 기질인 테트라 펩티드 IEGR을 통합하더럭 변형된, BoNT/A에서 발견되는 것과 유사한 일차 서열을 갖는 인터-도메인 링커,

● C-말단 시스테인을 통합하도록 변형된 BoNT/A의 H_N,

● C-말단 아미드화에 대한 필요성을 대체하기 위해, 천연 아르기닌 대신, 17번 자리에서 시스테인 잔기 및 C-말단에 추가적인 글리신 잔기를 통합하도록 변형된 28개의 아미노산으로 이루어진 가스트린 분비 펩티드 (VPLPAGGGTVLTKMYPCGNHWAVGHLMG).

구성이 열등한 코돈 이용을 초래하지 않는다는 것을 확실하게 하기 위하여 Graphical Codon Usage Analyser (Geneart)과 같은 소프트웨어 프로그램을 참조하여 E.coli 코돈의 이용을 평가하고, 공개된 코돈 이용 테이블(codon usage table)(예를 들면 GenBank Release 143, 2004년 9월 13일)을 참조하여 %GC 함량 및 코돈 이용 비율을 평가하였다. E.coli 숙주로의 형질전환 전에 표준 클로닝 벡터, 예를 들면 pCR4에 DNA를 통합시켰다. 서열 결정에 의해 ORF DNA의 완전성을 확인하였다. 최종 ORF는 서열번호 15로 표시되고 발현 생성물의 아미노산 서열은 서열번호 16으로 표시된다.

실시예 14 전립선암 환자의 치료 방법

56세 남성이 안드로겐-차단 요법(Androgen deprivation therapy)으로 더 이상 질병을 충분히 통제할 수 없는 상황까지 진행된 전립선암을 앓고 있다. 전립선 주변에 본 발명의 TSI(본 구체적인 실시예에서, GnRH 펩티드 TM 기반 TSI)를 포함하는 조성물의 국소 투여로 상기 환자를 치료한다. 환자의 상태를 모니터링하고 치료 후 약 2개월째 의사는 본 발명의 분자를 포함하는 조성물의 성공적인 치료를 나타내는 종양크기의 감소를 지적한다.

실시예 15 신경성 염증 환자의 치료 방법

류마티스 관절염으로 진단된 62세 여성이 관절 강직과 부종을 호소한다. 의사는 관절 강직 및 부종은 만성 신경성 염증에 의한 것으로 판단한다. 질병 영역(affected area)의 주변에 본 발명의 TSI(본 실시예에서, TSI는 오피오이드 TM을 포함함 - 노시셉틴 또는 디놀핀 TM을 포함하는 TSI로 병행(parallel) 실시예를 수행함)를 포함하는 조성물의 국소 투여로 상기 환자를 치료한다. 환자의 상태를 모니터링하고 치료 후 약 1-3일 후 상기 환자는 감소된 관절 강직 및 부종을 나타낸다. 1개월째 및 3개월째 검진에서, 상기 환자는 치료받은 부위에서 지속적으로 감소된 관절 강직 및 부종을 갖는 것으로 나타난다. 만성 신경성 염증 증상의 이러한 감소는 본 발명의 분자를 포함하는 조성물의 성공적인 치료를 나타낸다.

실시예 16 자궁내막증 환자의 치료방법

39세 여성이 비스테로이드성 항 염증제(NSAID) 및 조합된 에스트로겐-프로게스테론 피임약으로 적절히 치료되지 않는 자궁내막증에 의한 골반 통증을 호소한다. 의사는 본 발명의 TSI를 포함하는 조성물을 투여한다(본 실시예에서, TSI는 오피오이드 TM을 포함함 - 노시셉틴 또는 디놀핀 TM을 포함하는 TSI로 병행 실시예를 수행함). 환자의 상태를 모니터링하고 치료 후 약 1-3일 후 상기 환자는 감소된 통증을 나타낸다. 1개월째 및 3개월째 검진에서, 상기 환자는 지속적으로 감소된 통증 및 향상된 움직임의 자유를 갖는 것으로 나타난다. 자궁내막증과 연관된 증상에서 이러한 감소는 본 발명의 분자를 포함하는 조성물의 성공적인 치료를 나타낸다.

실시예 17 과민성 방광 환자의 치료법

58세 남성이 증가된 절박뇨(urinary urgency)를 호소한다. 의사는 환자를 이상(abnormal) 뉴런 활성을 포함하는 신경학적 성분을 갖는 과민성 방광으로 진단한다. 본 발명의 TSI(본 실시예에서, TSI는 오피오이드 TM을 포함함 - 노시셉틴 또는 디놀핀 TM을 포함하는 TSI로 병행 실시예를 수행함)를 포함하는 조성물의 요도경(urethroscopically) 주사로 상기 환자를 치료한다. 이상 뉴런 활성의 위치에 따라, 예를 들면, 배뇨근, 내부 및 외부 요도 괄약근을 포함한 방광목, 삼각부, 방광 천장부(bladder dome) 또는 방광벽의 다른 부위, 및/또는 요도, 요관, 비뇨생식기 격막(urogenital diaphragm), 골반 하부 근육(lower pelvic muscle), 전립선, 구요도선(bulbourethral gland), 망울(bulb), 하퇴부(crus) 또는 음경과 같은 방광 주변의 다른 부위에 독소를 투여할 수 있다. 환자의 상태를 모니터링하고 치료로부터 약 1-3일 후, 상기 환자는 감소된 절박뇨를 가짐을 나타낸다. 1개월째 및 3개월째 검진에서, 상기 환자는 절박뇨 감소를 지속적으로 갖는 것으로 나타난다. 과민성 방광 증상에서 이러한 감소는 본 발명의 분자를 포함하는 조성물의 성공적인 치료를 나타낸다.

실시예 18 신경성 염증 환자의 치료 방법

류마티스 관절염으로 진단된 62세 여성이 관절 강직과 부종을 호소한다. 의사는 관절 강직 및 부종은 만성 신경성 염증에 의한 것으로 판단한다. 질병 영역의 주변에 본 발명의 TSI(본 실시예에서, TSI는 오피오이드 TM을 포함함 - 노시셉틴 또는 디놀핀 TM을 포함하는 TSI로 병행 실시예를 수행함)를 포함하는 조성물의 국소 투여로 상기 환자를 치료한다. 환자의 상태를 모니터링하고 치료 후 약 1-3일 후, 상기 환자는 감소된 관절 강직 및 부종을 나타낸다. 1개월째 및 3개월째 검진에서, 상기 환자는 치료받은 부위에서 지속적으로 감소된 관절 강직 및 부종을 갖는 것으로 나타난다. 만성 신경성 염증 증상에서 이러한 감소는 본 발명의 분자를 포함하는 조성물의 성공적인 치료를 나타낸다. 본 명세서에서 개시된 바와 같이 단백질의 국소 투여의 유사한 타입을 예를 들면, 골관절염, 소아특발성관절염(juvenile idiopathic arthritis), 화농성 관절염(septic arthritis), 척추관절증(spondyloarthropathy)(강직성 척추염(ankylosing spondylitis), 반응성 관절염(reactive arthritis)(라이터 증후군), 건선 관절염(psoriatic arthritis), 염증성 장질환과 연관된 장병성 관절염(enteropathic arthritis), 휘플병(Whipple disease) 또는 베체트병(Behcet disease) 포함), 활막염, 통풍, 가성통풍, 또는 스틸병(Still's Disease)과 같은 단일관절염(monoarthritis), 빈발성관절염(oligoarthritis), 또는 다발성관절염(polyarthritis) 및 윤활낭염(bursitis), 류마티스열, 또는 건초염(tenosynovitis)과 연관된 만성 신경성 염증을 앓는 환자를 치료하는데 사용할 수 있다. 또한, 전신투여가 만성 신경성 염증을 치료하기 위하여 본 발명의 분자를 포함하는 조성물을 투여하는데 또한 이용될 수 있다.

서열 번호
서열 번호 1

서열 번호 2

서열 번호 3

서열 번호 4

서열 번호 5

서열 번호 6

서열 번호 7

서열 번호 8

서열 번호 9

서열 번호 10

서열 번호 11

서열 번호 12

서열 번호 13

서열 번호 14

서열 번호 15

서열 번호 16

<110> Syntaxin Limited Chaddock, John Harper, Elaine <120> Therapeutic fusion proteins <130> P35972WO-MRM <140> Not yet assigned <141> 2012-05-16 <150> GB1108108.0 <151> 2011-05-16 <160> 16 <170> PatentIn version 3.5 <210> 1 <211> 2769 <212> DNA <213> Artificial Sequence <220> <223> Synthetic sequence <400> 1 atgcatcacc atcaccatca ccatcaccat catgggagct cgaacaataa caacaataac 60 aataacaata acggatccat gacgtggcca gttaaggatt tcaactactc agatcctgta 120 aatgacaacg atattctgta ccttcgcatt ccacaaaata aactgatcac cacaccagtc 180 aaagcattca tgattactca aaacatttgg gtcattccag aacgcttttc tagtgacaca 240 aatccgagtt tatctaaacc tccgcgtccg acgtccaaat atcagagcta ttacgatccc 300 tcatatctca gtacggacga acaaaaagat actttcctta aaggtatcat taaactgttt 360 aagcgtatta atgagcgcga tatcgggaaa aagttgatta attatcttgt tgtgggttcc 420 ccgttcatgg gcgatagctc tacccccgaa gacacttttg attttacccg tcatacgaca 480 aacatcgcgg tagagaagtt tgagaacgga tcgtggaaag tcacaaacat cattacacct 540 agcgtcttaa tttttggtcc gctgccaaac atcttagatt atacagccag cctgactttg 600 caggggcaac agtcgaatcc gagtttcgaa ggttttggta ccctgagcat tctgaaagtt 660 gccccggaat ttctgctcac tttttcagat gtcaccagca accagagctc agcagtatta 720 ggaaagtcaa ttttttgcat ggacccggtt attgcactga tgcacgaact gacgcactct 780 ctgcatcaac tgtatgggat caacatcccc agtgacaaac gtattcgtcc ccaggtgtct 840 gaaggatttt tctcacagga tgggccgaac gtccagttcg aagagttgta tactttcgga 900 ggcctggacg tagagatcat tccccagatt gagcgcagtc agctgcgtga gaaggcattg 960 ggccattata aggatattgc aaaacgcctg aataacatta acaaaacgat tccatcttcg 1020 tggatctcga atattgataa atataagaaa atttttagcg agaaatataa ttttgataaa 1080 gataatacag gtaactttgt ggttaacatt gacaaattca actcccttta cagtgatttg 1140 acgaatgtaa tgagcgaagt tgtgtatagt tcccaataca acgttaagaa tcgtacccat 1200 tacttctctc gtcactacct gccggttttc gcgaacatcc ttgacgataa tatttacact 1260 attcgtgacg gctttaactt gaccaacaag ggcttcaata ttgaaaattc aggccagaac 1320 attgaacgca acccggcctt gcagaaactg tcgagtgaat ccgtggttga cctgtttacc 1380 aaagtctgcg tcgacggcat cattacctcc aaaactaaat ctctgataga aggtagaaac 1440 aaagcgctga acctgcagtg tattaaagtg aaaaacaatc ggctgcctta tgtagcagat 1500 aaagatagca ttagtcagga gattttcgaa aataaaatta tcactgacga aaccaatgtt 1560 cagaattatt cagataaatt ttcactggac gaaagcatct tagatggcca agttccgatt 1620 aacccggaaa ttgttgatcc gttactgccg aacgtgaata tggaaccgtt aaacctccct 1680 ggcgaagaga tcgtatttta tgatgacatt acgaaatatg tggactacct taattcttat 1740 tactatttgg aaagccagaa actgtccaat aacgtggaaa acattactct gaccacaagc 1800 gtggaagagg ctttaggcta ctcaaataag atttatacct tcctcccgtc gctggcggaa 1860 aaagtaaata aaggtgtgca ggctggtctg ttcctcaact gggcgaatga agttgtcgaa 1920 gactttacca cgaatattat gaaaaaggat accctggata aaatctccga cgtctcggtt 1980 attatcccat atattggccc tgcgttaaat atcggtaata gtgcgctgcg ggggaatttt 2040 aaccaggcct ttgctaccgc gggcgtcgcg ttcctcctgg agggctttcc tgaatttact 2100 atcccggcgc tcggtgtttt tacattttac tcttccatcc aggagcgtga gaaaattatc 2160 aaaaccatcg aaaactgcct ggagcagcgg gtgaaacgct ggaaagattc ttatcaatgg 2220 atggtgtcaa actggttatc tcgcatcacg acccaattca accatattaa ttaccagatg 2280 tatgatagtc tgtcgtacca agctgacgcc attaaagcca aaattgatct ggaatataaa 2340 aagtactctg gtagcgataa ggagaacatc aaaagccagg tggagaacct taagaatagt 2400 ctggatgtga aaatctctga agctatgaat aacattaaca aattcattcg tgaatgttcg 2460 gtgacgtacc tgttcaagaa tatgctgcca aaagttattg atgaactgaa taaatttgat 2520 ctgcgtacca aaaccgaact tatcaacctc atcgactccc acaacattat ccttgtgggc 2580 gaagtggatc gtctgaaggc caaagtaaac gagagctttg aaaatacgat gccgtttaat 2640 attttttcat ataccaataa ctccttgctg aaagatatca tcaatgaata tttcaatcta 2700 gaatgtggcg gtggcggtag catcgaaggt cgtcagcact ggtcctattg cctgcgccct 2760 ggttgataa 2769 <210> 2 <211> 921 <212> PRT <213> Artificial Sequence <220> <223> Synthetic sequence <400> 2 Met His His His His His His His His His His Gly Ser Ser Asn Asn 1 5 10 15 Asn Asn Asn Asn Asn Asn Asn Asn Gly Ser Met Thr Trp Pro Val Lys 20 25 30 Asp Phe Asn Tyr Ser Asp Pro Val Asn Asp Asn Asp Ile Leu Tyr Leu 35 40 45 Arg Ile Pro Gln Asn Lys Leu Ile Thr Thr Pro Val Lys Ala Phe Met 50 55 60 Ile Thr Gln Asn Ile Trp Val Ile Pro Glu Arg Phe Ser Ser Asp Thr 65 70 75 80 Asn Pro Ser Leu Ser Lys Pro Pro Arg Pro Thr Ser Lys Tyr Gln Ser 85 90 95 Tyr Tyr Asp Pro Ser Tyr Leu Ser Thr Asp Glu Gln Lys Asp Thr Phe 100 105 110 Leu Lys Gly Ile Ile Lys Leu Phe Lys Arg Ile Asn Glu Arg Asp Ile 115 120 125 Gly Lys Lys Leu Ile Asn Tyr Leu Val Val Gly Ser Pro Phe Met Gly 130 135 140 Asp Ser Ser Thr Pro Glu Asp Thr Phe Asp Phe Thr Arg His Thr Thr 145 150 155 160 Asn Ile Ala Val Glu Lys Phe Glu Asn Gly Ser Trp Lys Val Thr Asn 165 170 175 Ile Ile Thr Pro Ser Val Leu Ile Phe Gly Pro Leu Pro Asn Ile Leu 180 185 190 Asp Tyr Thr Ala Ser Leu Thr Leu Gln Gly Gln Gln Ser Asn Pro Ser 195 200 205 Phe Glu Gly Phe Gly Thr Leu Ser Ile Leu Lys Val Ala Pro Glu Phe 210 215 220 Leu Leu Thr Phe Ser Asp Val Thr Ser Asn Gln Ser Ser Ala Val Leu 225 230 235 240 Gly Lys Ser Ile Phe Cys Met Asp Pro Val Ile Ala Leu Met His Glu 245 250 255 Leu Thr His Ser Leu His Gln Leu Tyr Gly Ile Asn Ile Pro Ser Asp 260 265 270 Lys Arg Ile Arg Pro Gln Val Ser Glu Gly Phe Phe Ser Gln Asp Gly 275 280 285 Pro Asn Val Gln Phe Glu Glu Leu Tyr Thr Phe Gly Gly Leu Asp Val 290 295 300 Glu Ile Ile Pro Gln Ile Glu Arg Ser Gln Leu Arg Glu Lys Ala Leu 305 310 315 320 Gly His Tyr Lys Asp Ile Ala Lys Arg Leu Asn Asn Ile Asn Lys Thr 325 330 335 Ile Pro Ser Ser Trp Ile Ser Asn Ile Asp Lys Tyr Lys Lys Ile Phe 340 345 350 Ser Glu Lys Tyr Asn Phe Asp Lys Asp Asn Thr Gly Asn Phe Val Val 355 360 365 Asn Ile Asp Lys Phe Asn Ser Leu Tyr Ser Asp Leu Thr Asn Val Met 370 375 380 Ser Glu Val Val Tyr Ser Ser Gln Tyr Asn Val Lys Asn Arg Thr His 385 390 395 400 Tyr Phe Ser Arg His Tyr Leu Pro Val Phe Ala Asn Ile Leu Asp Asp 405 410 415 Asn Ile Tyr Thr Ile Arg Asp Gly Phe Asn Leu Thr Asn Lys Gly Phe 420 425 430 Asn Ile Glu Asn Ser Gly Gln Asn Ile Glu Arg Asn Pro Ala Leu Gln 435 440 445 Lys Leu Ser Ser Glu Ser Val Val Asp Leu Phe Thr Lys Val Cys Val 450 455 460 Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg Asn 465 470 475 480 Lys Ala Leu Asn Leu Gln Cys Ile Lys Val Lys Asn Asn Arg Leu Pro 485 490 495 Tyr Val Ala Asp Lys Asp Ser Ile Ser Gln Glu Ile Phe Glu Asn Lys 500 505 510 Ile Ile Thr Asp Glu Thr Asn Val Gln Asn Tyr Ser Asp Lys Phe Ser 515 520 525 Leu Asp Glu Ser Ile Leu Asp Gly Gln Val Pro Ile Asn Pro Glu Ile 530 535 540 Val Asp Pro Leu Leu Pro Asn Val Asn Met Glu Pro Leu Asn Leu Pro 545 550 555 560 Gly Glu Glu Ile Val Phe Tyr Asp Asp Ile Thr Lys Tyr Val Asp Tyr 565 570 575 Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys Leu Ser Asn Asn Val 580 585 590 Glu Asn Ile Thr Leu Thr Thr Ser Val Glu Glu Ala Leu Gly Tyr Ser 595 600 605 Asn Lys Ile Tyr Thr Phe Leu Pro Ser Leu Ala Glu Lys Val Asn Lys 610 615 620 Gly Val Gln Ala Gly Leu Phe Leu Asn Trp Ala Asn Glu Val Val Glu 625 630 635 640 Asp Phe Thr Thr Asn Ile Met Lys Lys Asp Thr Leu Asp Lys Ile Ser 645 650 655 Asp Val Ser Val Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly 660 665 670 Asn Ser Ala Leu Arg Gly Asn Phe Asn Gln Ala Phe Ala Thr Ala Gly 675 680 685 Val Ala Phe Leu Leu Glu Gly Phe Pro Glu Phe Thr Ile Pro Ala Leu 690 695 700 Gly Val Phe Thr Phe Tyr Ser Ser Ile Gln Glu Arg Glu Lys Ile Ile 705 710 715 720 Lys Thr Ile Glu Asn Cys Leu Glu Gln Arg Val Lys Arg Trp Lys Asp 725 730 735 Ser Tyr Gln Trp Met Val Ser Asn Trp Leu Ser Arg Ile Thr Thr Gln 740 745 750 Phe Asn His Ile Asn Tyr Gln Met Tyr Asp Ser Leu Ser Tyr Gln Ala 755 760 765 Asp Ala Ile Lys Ala Lys Ile Asp Leu Glu Tyr Lys Lys Tyr Ser Gly 770 775 780 Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu Asn Leu Lys Asn Ser 785 790 795 800 Leu Asp Val Lys Ile Ser Glu Ala Met Asn Asn Ile Asn Lys Phe Ile 805 810 815 Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn Met Leu Pro Lys Val 820 825 830 Ile Asp Glu Leu Asn Lys Phe Asp Leu Arg Thr Lys Thr Glu Leu Ile 835 840 845 Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val Gly Glu Val Asp Arg 850 855 860 Leu Lys Ala Lys Val Asn Glu Ser Phe Glu Asn Thr Met Pro Phe Asn 865 870 875 880 Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys Asp Ile Ile Asn Glu 885 890 895 Tyr Phe Asn Leu Glu Cys Gly Gly Gly Gly Ser Ile Glu Gly Arg Gln 900 905 910 His Trp Ser Tyr Cys Leu Arg Pro Gly 915 920 <210> 3 <211> 2739 <212> DNA <213> Artificial Sequence <220> <223> Synthetic sequence <400> 3 atgcatcacc atcaccatca ccatcaccat catgggagct cgaacaataa caacaataac 60 aataacaata acggatccat ggagttcgtt aacaaacagt tcaactataa agacccagtt 120 aacggtgttg acattgctta catcaaaatc ccgaacgctg gccagatgca gccggtaaag 180 gcattcaaaa tccacaacaa aatctgggtt atcccggaac gtgatacctt tactaacccg 240 gaagaaggtg acctgaaccc gccaccggaa gcgaaacagg tgccggtatc ttactatgac 300 tccacctacc tgtctaccga taacgaaaag gacaactacc tgaaaggtgt tactaaactg 360 ttcgagcgta tttactccac cgacctgggc cgtatgctgc tgactagcat cgttcgcggt 420 atcccgttct ggggcggttc taccatcgat accgaactga aagtaatcga cactaactgc 480 atcaacgtta ttcagccgga cggttcctat cgttccgaag aactgaacct ggtgatcatc 540 ggcccgtctg ctgatatcat ccagttcgag tgtaagagct ttggtcacga agttctgaac 600 ctcacccgta acggctacgg ttccactcag tacatccgtt tctctccgga cttcaccttc 660 ggttttgaag aatccctgga agtagacacg aacccactgc tgggcgctgg taaattcgca 720 actgatcctg cggttaccct ggctcacgaa ctgattcatg caggccaccg cctgtacggt 780 atcgccatca atccgaaccg tgtcttcaaa gttaacacca acgcgtatta cgagatgtcc 840 ggtctggaag ttagcttcga agaactgcgt acttttggcg gtcacgacgc taaattcatc 900 gactctctgc aagaaaacga gttccgtctg tactactata acaagttcaa agatatcgca 960 tccaccctga acaaagcgaa atccatcgtg ggtaccactg cttctctcca gtacatgaag 1020 aacgttttta aagaaaaata cctgctcagc gaagacacct ccggcaaatt ctctgtagac 1080 aagttgaaat tcgataaact ttacaaaatg ctgactgaaa tttacaccga agacaacttc 1140 gttaagttct ttaaagttct gaaccgcaaa acctatctga acttcgacaa ggcagtattc 1200 aaaatcaaca tcgtgccgaa agttaactac actatctacg atggtttcaa cctgcgtaac 1260 accaacctgg ctgctaattt taacggccag aacacggaaa tcaacaacat gaacttcaca 1320 aaactgaaaa acttcactgg tctgttcgag ttttacaagc tgctgtgcgt cgacggcatc 1380 attacctcca aaactaaatc tctgatagaa ggtagaaaca aagcgctgaa cgacctctgt 1440 atcaaggtta acaactggga tttattcttc agcccgagtg aagacaactt caccaacgac 1500 ctgaacaaag gtgaagaaat cacctcagat actaacatcg aagcagccga agaaaacatc 1560 tcgctggacc tgatccagca gtactacctg acctttaatt tcgacaacga gccggaaaac 1620 atttctatcg aaaacctgag ctctgatatc atcggccagc tggaactgat gccgaacatc 1680 gaacgtttcc caaacggtaa aaagtacgag ctggacaaat ataccatgtt ccactacctg 1740 cgcgcgcagg aatttgaaca cggcaaatcc cgtatcgcac tgactaactc cgttaacgaa 1800 gctctgctca acccgtcccg tgtatacacc ttcttctcta gcgactacgt gaaaaaggtc 1860 aacaaagcga ctgaagctgc aatgttcttg ggttgggttg aacagcttgt ttatgatttt 1920 accgacgaga cgtccgaagt atctactacc gacaaaattg cggatatcac tatcatcatc 1980 ccgtacatcg gtccggctct gaacattggc aacatgctgt acaaagacga cttcgttggc 2040 gcactgatct tctccggtgc ggtgatcctg ctggagttca tcccggaaat cgccatcccg 2100 gtactgggca cctttgctct ggtttcttac attgcaaaca aggttctgac tgtacaaacc 2160 atcgacaacg cgctgagcaa acgtaacgaa aaatgggatg aagtttacaa atatatcgtg 2220 accaactggc tggctaaggt taatactcag atcgacctca tccgcaaaaa aatgaaagaa 2280 gcactggaaa accaggcgga agctaccaag gcaatcatta actaccagta caaccagtac 2340 accgaggaag aaaaaaacaa catcaacttc aacatcgacg atctgtcctc taaactgaac 2400 gaatccatca acaaagctat gatcaacatc aacaagttcc tgaaccagtg ctctgtaagc 2460 tatctgatga actccatgat cccgtacggt gttaaacgtc tggaggactt cgatgcgtct 2520 ctgaaagacg ccctgctgaa atacatttac gacaaccgtg gcactctgat cggtcaggtt 2580 gatcgtctga aggacaaagt gaacaatacc ttatcgaccg acatcccttt tcagctcagt 2640 aaatatgtcg ataaccaacg ccttttgtcc acttgtggcg gtggcggtag catcgaaggt 2700 cgtcagcact ggtcctattg cctgcgccct ggttgataa 2739 <210> 4 <211> 911 <212> PRT <213> Artificial Sequence <220> <223> Synthetic sequence <400> 4 Met His His His His His His His His His His Gly Ser Ser Asn Asn 1 5 10 15 Asn Asn Asn Asn Asn Asn Asn Asn Gly Ser Met Glu Phe Val Asn Lys 20 25 30 Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly Val Asp Ile Ala Tyr Ile 35 40 45 Lys Ile Pro Asn Ala Gly Gln Met Gln Pro Val Lys Ala Phe Lys Ile 50 55 60 His Asn Lys Ile Trp Val Ile Pro Glu Arg Asp Thr Phe Thr Asn Pro 65 70 75 80 Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu Ala Lys Gln Val Pro Val 85 90 95 Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr Asp Asn Glu Lys Asp Asn 100 105 110 Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu Arg Ile Tyr Ser Thr Asp 115 120 125 Leu Gly Arg Met Leu Leu Thr Ser Ile Val Arg Gly Ile Pro Phe Trp 130 135 140 Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys Val Ile Asp Thr Asn Cys 145 150 155 160 Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr Arg Ser Glu Glu Leu Asn 165 170 175 Leu Val Ile Ile Gly Pro Ser Ala Asp Ile Ile Gln Phe Glu Cys Lys 180 185 190 Ser Phe Gly His Glu Val Leu Asn Leu Thr Arg Asn Gly Tyr Gly Ser 195 200 205 Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe Thr Phe Gly Phe Glu Glu 210 215 220 Ser Leu Glu Val Asp Thr Asn Pro Leu Leu Gly Ala Gly Lys Phe Ala 225 230 235 240 Thr Asp Pro Ala Val Thr Leu Ala His Glu Leu Ile His Ala Gly His 245 250 255 Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn Arg Val Phe Lys Val Asn 260 265 270 Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu Glu Val Ser Phe Glu Glu 275 280 285 Leu Arg Thr Phe Gly Gly His Asp Ala Lys Phe Ile Asp Ser Leu Gln 290 295 300 Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn Lys Phe Lys Asp Ile Ala 305 310 315 320 Ser Thr Leu Asn Lys Ala Lys Ser Ile Val Gly Thr Thr Ala Ser Leu 325 330 335 Gln Tyr Met Lys Asn Val Phe Lys Glu Lys Tyr Leu Leu Ser Glu Asp 340 345 350 Thr Ser Gly Lys Phe Ser Val Asp Lys Leu Lys Phe Asp Lys Leu Tyr 355 360 365 Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp Asn Phe Val Lys Phe Phe 370 375 380 Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn Phe Asp Lys Ala Val Phe 385 390 395 400 Lys Ile Asn Ile Val Pro Lys Val Asn Tyr Thr Ile Tyr Asp Gly Phe 405 410 415 Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn Phe Asn Gly Gln Asn Thr 420 425 430 Glu Ile Asn Asn Met Asn Phe Thr Lys Leu Lys Asn Phe Thr Gly Leu 435 440 445 Phe Glu Phe Tyr Lys Leu Leu Cys Val Asp Gly Ile Ile Thr Ser Lys 450 455 460 Thr Lys Ser Leu Ile Glu Gly Arg Asn Lys Ala Leu Asn Asp Leu Cys 465 470 475 480 Ile Lys Val Asn Asn Trp Asp Leu Phe Phe Ser Pro Ser Glu Asp Asn 485 490 495 Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu Ile Thr Ser Asp Thr Asn 500 505 510 Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu Asp Leu Ile Gln Gln Tyr 515 520 525 Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro Glu Asn Ile Ser Ile Glu 530 535 540 Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu Glu Leu Met Pro Asn Ile 545 550 555 560 Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu Leu Asp Lys Tyr Thr Met 565 570 575 Phe His Tyr Leu Arg Ala Gln Glu Phe Glu His Gly Lys Ser Arg Ile 580 585 590 Ala Leu Thr Asn Ser Val Asn Glu Ala Leu Leu Asn Pro Ser Arg Val 595 600 605 Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys Lys Val Asn Lys Ala Thr 610 615 620 Glu Ala Ala Met Phe Leu Gly Trp Val Glu Gln Leu Val Tyr Asp Phe 625 630 635 640 Thr Asp Glu Thr Ser Glu Val Ser Thr Thr Asp Lys Ile Ala Asp Ile 645 650 655 Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly Asn Met 660 665 670 Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu Ile Phe Ser Gly Ala Val 675 680 685 Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala Ile Pro Val Leu Gly Thr 690 695 700 Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys Val Leu Thr Val Gln Thr 705 710 715 720 Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu Lys Trp Asp Glu Val Tyr 725 730 735 Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys Val Asn Thr Gln Ile Asp 740 745 750 Leu Ile Arg Lys Lys Met Lys Glu Ala Leu Glu Asn Gln Ala Glu Ala 755 760 765 Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn Gln Tyr Thr Glu Glu Glu 770 775 780 Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp Leu Ser Ser Lys Leu Asn 785 790 795 800 Glu Ser Ile Asn Lys Ala Met Ile Asn Ile Asn Lys Phe Leu Asn Gln 805 810 815 Cys Ser Val Ser Tyr Leu Met Asn Ser Met Ile Pro Tyr Gly Val Lys 820 825 830 Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys Asp Ala Leu Leu Lys Tyr 835 840 845 Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly Gln Val Asp Arg Leu Lys 850 855 860 Asp Lys Val Asn Asn Thr Leu Ser Thr Asp Ile Pro Phe Gln Leu Ser 865 870 875 880 Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser Thr Cys Gly Gly Gly Gly 885 890 895 Ser Ile Glu Gly Arg Gln His Trp Ser Tyr Cys Leu Arg Pro Gly 900 905 910 <210> 5 <211> 2772 <212> DNA <213> Artificial Sequence <220> <223> Synthetic sequence <400> 5 atgcatcacc atcaccatca ccatcaccat catgggagct cgaacaataa caacaataac 60 aataacaata acggatccat gacgtggcca gttaaggatt tcaactactc agatcctgta 120 aatgacaacg atattctgta ccttcgcatt ccacaaaata aactgatcac cacaccagtc 180 aaagcattca tgattactca aaacatttgg gtcattccag aacgcttttc tagtgacaca 240 aatccgagtt tatctaaacc tccgcgtccg acgtccaaat atcagagcta ttacgatccc 300 tcatatctca gtacggacga acaaaaagat actttcctta aaggtatcat taaactgttt 360 aagcgtatta atgagcgcga tatcgggaaa aagttgatta attatcttgt tgtgggttcc 420 ccgttcatgg gcgatagctc tacccccgaa gacacttttg attttacccg tcatacgaca 480 aacatcgcgg tagagaagtt tgagaacgga tcgtggaaag tcacaaacat cattacacct 540 agcgtcttaa tttttggtcc gctgccaaac atcttagatt atacagccag cctgactttg 600 caggggcaac agtcgaatcc gagtttcgaa ggttttggta ccctgagcat tctgaaagtt 660 gccccggaat ttctgctcac tttttcagat gtcaccagca accagagctc agcagtatta 720 ggaaagtcaa ttttttgcat ggacccggtt attgcactga tgcacgaact gacgcactct 780 ctgcatcaac tgtatgggat caacatcccc agtgacaaac gtattcgtcc ccaggtgtct 840 gaaggatttt tctcacagga tgggccgaac gtccagttcg aagagttgta tactttcgga 900 ggcctggacg tagagatcat tccccagatt gagcgcagtc agctgcgtga gaaggcattg 960 ggccattata aggatattgc aaaacgcctg aataacatta acaaaacgat tccatcttcg 1020 tggatctcga atattgataa atataagaaa atttttagcg agaaatataa ttttgataaa 1080 gataatacag gtaactttgt ggttaacatt gacaaattca actcccttta cagtgatttg 1140 acgaatgtaa tgagcgaagt tgtgtatagt tcccaataca acgttaagaa tcgtacccat 1200 tacttctctc gtcactacct gccggttttc gcgaacatcc ttgacgataa tatttacact 1260 attcgtgacg gctttaactt gaccaacaag ggcttcaata ttgaaaattc aggccagaac 1320 attgaacgca acccggcctt gcagaaactg tcgagtgaat ccgtggttga cctgtttacc 1380 aaagtctgcg tcgacggcat cattacctcc aaaactaaat ctctgataga aggtagaaac 1440 aaagcgctga acctgcagtg tattaaagtg aaaaacaatc ggctgcctta tgtagcagat 1500 aaagatagca ttagtcagga gattttcgaa aataaaatta tcactgacga aaccaatgtt 1560 cagaattatt cagataaatt ttcactggac gaaagcatct tagatggcca agttccgatt 1620 aacccggaaa ttgttgatcc gttactgccg aacgtgaata tggaaccgtt aaacctccct 1680 ggcgaagaga tcgtatttta tgatgacatt acgaaatatg tggactacct taattcttat 1740 tactatttgg aaagccagaa actgtccaat aacgtggaaa acattactct gaccacaagc 1800 gtggaagagg ctttaggcta ctcaaataag atttatacct tcctcccgtc gctggcggaa 1860 aaagtaaata aaggtgtgca ggctggtctg ttcctcaact gggcgaatga agttgtcgaa 1920 gactttacca cgaatattat gaaaaaggat accctggata aaatctccga cgtctcggtt 1980 attatcccat atattggccc tgcgttaaat atcggtaata gtgcgctgcg ggggaatttt 2040 aaccaggcct ttgctaccgc gggcgtcgcg ttcctcctgg agggctttcc tgaatttact 2100 atcccggcgc tcggtgtttt tacattttac tcttccatcc aggagcgtga gaaaattatc 2160 aaaaccatcg aaaactgcct ggagcagcgg gtgaaacgct ggaaagattc ttatcaatgg 2220 atggtgtcaa actggttatc tcgcatcacg acccaattca accatattaa ttaccagatg 2280 tatgatagtc tgtcgtacca agctgacgcc attaaagcca aaattgatct ggaatataaa 2340 aagtactctg gtagcgataa ggagaacatc aaaagccagg tggagaacct taagaatagt 2400 ctggatgtga aaatctctga agctatgaat aacattaaca aattcattcg tgaatgttcg 2460 gtgacgtacc tgttcaagaa tatgctgcca aaagttattg atgaactgaa taaatttgat 2520 ctgcgtacca aaaccgaact tatcaacctc atcgactccc acaacattat ccttgtgggc 2580 gaagtggatc gtctgaaggc caaagtaaac gagagctttg aaaatacgat gccgtttaat 2640 attttttcat ataccaataa ctccttgctg aaagatatca tcaatgaata tttcaatcta 2700 gaatgtggcg gtggcggtag cgacgatgac gataaacagc actggtccta ttgcctgcgc 2760 cctggttgat aa 2772 <210> 6 <211> 922 <212> PRT <213> Artificial Sequence <220> <223> Synthetic sequence <400> 6 Met His His His His His His His His His His Gly Ser Ser Asn Asn 1 5 10 15 Asn Asn Asn Asn Asn Asn Asn Asn Gly Ser Met Thr Trp Pro Val Lys 20 25 30 Asp Phe Asn Tyr Ser Asp Pro Val Asn Asp Asn Asp Ile Leu Tyr Leu 35 40 45 Arg Ile Pro Gln Asn Lys Leu Ile Thr Thr Pro Val Lys Ala Phe Met 50 55 60 Ile Thr Gln Asn Ile Trp Val Ile Pro Glu Arg Phe Ser Ser Asp Thr 65 70 75 80 Asn Pro Ser Leu Ser Lys Pro Pro Arg Pro Thr Ser Lys Tyr Gln Ser 85 90 95 Tyr Tyr Asp Pro Ser Tyr Leu Ser Thr Asp Glu Gln Lys Asp Thr Phe 100 105 110 Leu Lys Gly Ile Ile Lys Leu Phe Lys Arg Ile Asn Glu Arg Asp Ile 115 120 125 Gly Lys Lys Leu Ile Asn Tyr Leu Val Val Gly Ser Pro Phe Met Gly 130 135 140 Asp Ser Ser Thr Pro Glu Asp Thr Phe Asp Phe Thr Arg His Thr Thr 145 150 155 160 Asn Ile Ala Val Glu Lys Phe Glu Asn Gly Ser Trp Lys Val Thr Asn 165 170 175 Ile Ile Thr Pro Ser Val Leu Ile Phe Gly Pro Leu Pro Asn Ile Leu 180 185 190 Asp Tyr Thr Ala Ser Leu Thr Leu Gln Gly Gln Gln Ser Asn Pro Ser 195 200 205 Phe Glu Gly Phe Gly Thr Leu Ser Ile Leu Lys Val Ala Pro Glu Phe 210 215 220 Leu Leu Thr Phe Ser Asp Val Thr Ser Asn Gln Ser Ser Ala Val Leu 225 230 235 240 Gly Lys Ser Ile Phe Cys Met Asp Pro Val Ile Ala Leu Met His Glu 245 250 255 Leu Thr His Ser Leu His Gln Leu Tyr Gly Ile Asn Ile Pro Ser Asp 260 265 270 Lys Arg Ile Arg Pro Gln Val Ser Glu Gly Phe Phe Ser Gln Asp Gly 275 280 285 Pro Asn Val Gln Phe Glu Glu Leu Tyr Thr Phe Gly Gly Leu Asp Val 290 295 300 Glu Ile Ile Pro Gln Ile Glu Arg Ser Gln Leu Arg Glu Lys Ala Leu 305 310 315 320 Gly His Tyr Lys Asp Ile Ala Lys Arg Leu Asn Asn Ile Asn Lys Thr 325 330 335 Ile Pro Ser Ser Trp Ile Ser Asn Ile Asp Lys Tyr Lys Lys Ile Phe 340 345 350 Ser Glu Lys Tyr Asn Phe Asp Lys Asp Asn Thr Gly Asn Phe Val Val 355 360 365 Asn Ile Asp Lys Phe Asn Ser Leu Tyr Ser Asp Leu Thr Asn Val Met 370 375 380 Ser Glu Val Val Tyr Ser Ser Gln Tyr Asn Val Lys Asn Arg Thr His 385 390 395 400 Tyr Phe Ser Arg His Tyr Leu Pro Val Phe Ala Asn Ile Leu Asp Asp 405 410 415 Asn Ile Tyr Thr Ile Arg Asp Gly Phe Asn Leu Thr Asn Lys Gly Phe 420 425 430 Asn Ile Glu Asn Ser Gly Gln Asn Ile Glu Arg Asn Pro Ala Leu Gln 435 440 445 Lys Leu Ser Ser Glu Ser Val Val Asp Leu Phe Thr Lys Val Cys Val 450 455 460 Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg Asn 465 470 475 480 Lys Ala Leu Asn Leu Gln Cys Ile Lys Val Lys Asn Asn Arg Leu Pro 485 490 495 Tyr Val Ala Asp Lys Asp Ser Ile Ser Gln Glu Ile Phe Glu Asn Lys 500 505 510 Ile Ile Thr Asp Glu Thr Asn Val Gln Asn Tyr Ser Asp Lys Phe Ser 515 520 525 Leu Asp Glu Ser Ile Leu Asp Gly Gln Val Pro Ile Asn Pro Glu Ile 530 535 540 Val Asp Pro Leu Leu Pro Asn Val Asn Met Glu Pro Leu Asn Leu Pro 545 550 555 560 Gly Glu Glu Ile Val Phe Tyr Asp Asp Ile Thr Lys Tyr Val Asp Tyr 565 570 575 Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys Leu Ser Asn Asn Val 580 585 590 Glu Asn Ile Thr Leu Thr Thr Ser Val Glu Glu Ala Leu Gly Tyr Ser 595 600 605 Asn Lys Ile Tyr Thr Phe Leu Pro Ser Leu Ala Glu Lys Val Asn Lys 610 615 620 Gly Val Gln Ala Gly Leu Phe Leu Asn Trp Ala Asn Glu Val Val Glu 625 630 635 640 Asp Phe Thr Thr Asn Ile Met Lys Lys Asp Thr Leu Asp Lys Ile Ser 645 650 655 Asp Val Ser Val Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly 660 665 670 Asn Ser Ala Leu Arg Gly Asn Phe Asn Gln Ala Phe Ala Thr Ala Gly 675 680 685 Val Ala Phe Leu Leu Glu Gly Phe Pro Glu Phe Thr Ile Pro Ala Leu 690 695 700 Gly Val Phe Thr Phe Tyr Ser Ser Ile Gln Glu Arg Glu Lys Ile Ile 705 710 715 720 Lys Thr Ile Glu Asn Cys Leu Glu Gln Arg Val Lys Arg Trp Lys Asp 725 730 735 Ser Tyr Gln Trp Met Val Ser Asn Trp Leu Ser Arg Ile Thr Thr Gln 740 745 750 Phe Asn His Ile Asn Tyr Gln Met Tyr Asp Ser Leu Ser Tyr Gln Ala 755 760 765 Asp Ala Ile Lys Ala Lys Ile Asp Leu Glu Tyr Lys Lys Tyr Ser Gly 770 775 780 Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu Asn Leu Lys Asn Ser 785 790 795 800 Leu Asp Val Lys Ile Ser Glu Ala Met Asn Asn Ile Asn Lys Phe Ile 805 810 815 Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn Met Leu Pro Lys Val 820 825 830 Ile Asp Glu Leu Asn Lys Phe Asp Leu Arg Thr Lys Thr Glu Leu Ile 835 840 845 Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val Gly Glu Val Asp Arg 850 855 860 Leu Lys Ala Lys Val Asn Glu Ser Phe Glu Asn Thr Met Pro Phe Asn 865 870 875 880 Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys Asp Ile Ile Asn Glu 885 890 895 Tyr Phe Asn Leu Glu Cys Gly Gly Gly Gly Ser Asp Asp Asp Asp Lys 900 905 910 Gln His Trp Ser Tyr Cys Leu Arg Pro Gly 915 920 <210> 7 <211> 2850 <212> DNA <213> Artificial Sequence <220> <223> Synthetic sequence <400> 7 atgcatcacc atcaccatca ccatcaccat catgggagct cgaacaataa caacaataac 60 aataacaata acggatccat gacgtggcca gttaaggatt tcaactactc agatcctgta 120 aatgacaacg atattctgta ccttcgcatt ccacaaaata aactgatcac cacaccagtc 180 aaagcattca tgattactca aaacatttgg gtcattccag aacgcttttc tagtgacaca 240 aatccgagtt tatctaaacc tccgcgtccg acgtccaaat atcagagcta ttacgatccc 300 tcatatctca gtacggacga acaaaaagat actttcctta aaggtatcat taaactgttt 360 aagcgtatta atgagcgcga tatcgggaaa aagttgatta attatcttgt tgtgggttcc 420 ccgttcatgg gcgatagctc tacccccgaa gacacttttg attttacccg tcatacgaca 480 aacatcgcgg tagagaagtt tgagaacgga tcgtggaaag tcacaaacat cattacacct 540 agcgtcttaa tttttggtcc gctgccaaac atcttagatt atacagccag cctgactttg 600 caggggcaac agtcgaatcc gagtttcgaa ggttttggta ccctgagcat tctgaaagtt 660 gccccggaat ttctgctcac tttttcagat gtcaccagca accagagctc agcagtatta 720 ggaaagtcaa ttttttgcat ggacccggtt attgcactga tgcacgaact gacgcactct 780 ctgcatcaac tgtatgggat caacatcccc agtgacaaac gtattcgtcc ccaggtgtct 840 gaaggatttt tctcacagga tgggccgaac gtccagttcg aagagttgta tactttcgga 900 ggcctggacg tagagatcat tccccagatt gagcgcagtc agctgcgtga gaaggcattg 960 ggccattata aggatattgc aaaacgcctg aataacatta acaaaacgat tccatcttcg 1020 tggatctcga atattgataa atataagaaa atttttagcg agaaatataa ttttgataaa 1080 gataatacag gtaactttgt ggttaacatt gacaaattca actcccttta cagtgatttg 1140 acgaatgtaa tgagcgaagt tgtgtatagt tcccaataca acgttaagaa tcgtacccat 1200 tacttctctc gtcactacct gccggttttc gcgaacatcc ttgacgataa tatttacact 1260 attcgtgacg gctttaactt gaccaacaag ggcttcaata ttgaaaattc aggccagaac 1320 attgaacgca acccggcctt gcagaaactg tcgagtgaat ccgtggttga cctgtttacc 1380 aaagtctgcg tcgacggcat cattacctcc aaaactaaat ctctgataga aggtagaaac 1440 aaagcgctga acctgcagtg tattaaagtg aaaaacaatc ggctgcctta tgtagcagat 1500 aaagatagca ttagtcagga gattttcgaa aataaaatta tcactgacga aaccaatgtt 1560 cagaattatt cagataaatt ttcactggac gaaagcatct tagatggcca agttccgatt 1620 aacccggaaa ttgttgatcc gttactgccg aacgtgaata tggaaccgtt aaacctccct 1680 ggcgaagaga tcgtatttta tgatgacatt acgaaatatg tggactacct taattcttat 1740 tactatttgg aaagccagaa actgtccaat aacgtggaaa acattactct gaccacaagc 1800 gtggaagagg ctttaggcta ctcaaataag atttatacct tcctcccgtc gctggcggaa 1860 aaagtaaata aaggtgtgca ggctggtctg ttcctcaact gggcgaatga agttgtcgaa 1920 gactttacca cgaatattat gaaaaaggat accctggata aaatctccga cgtctcggtt 1980 attatcccat atattggccc tgcgttaaat atcggtaata gtgcgctgcg ggggaatttt 2040 aaccaggcct ttgctaccgc gggcgtcgcg ttcctcctgg agggctttcc tgaatttact 2100 atcccggcgc tcggtgtttt tacattttac tcttccatcc aggagcgtga gaaaattatc 2160 aaaaccatcg aaaactgcct ggagcagcgg gtgaaacgct ggaaagattc ttatcaatgg 2220 atggtgtcaa actggttatc tcgcatcacg acccaattca accatattaa ttaccagatg 2280 tatgatagtc tgtcgtacca agctgacgcc attaaagcca aaattgatct ggaatataaa 2340 aagtactctg gtagcgataa ggagaacatc aaaagccagg tggagaacct taagaatagt 2400 ctggatgtga aaatctctga agctatgaat aacattaaca aattcattcg tgaatgttcg 2460 gtgacgtacc tgttcaagaa tatgctgcca aaagttattg atgaactgaa taaatttgat 2520 ctgcgtacca aaaccgaact tatcaacctc atcgactccc acaacattat ccttgtgggc 2580 gaagtggatc gtctgaaggc caaagtaaac gagagctttg aaaatacgat gccgtttaat 2640 attttttcat ataccaataa ctccttgctg aaagatatca tcaatgaata tttcaatcta 2700 gaatgtggcg gtggcggtag catcgaaggt cgttatggag gttttttgag aaggatacga 2760 ccaaaattaa agtgggataa tcaaggcggt gggggtagtt gcggcggtgg cggttcgcgt 2820 ccgccgggtt tctctccgtt ccgttgataa 2850 <210> 8 <211> 948 <212> PRT <213> Artificial Sequence <220> <223> Synthetic sequence <400> 8 Met His His His His His His His His His His Gly Ser Ser Asn Asn 1 5 10 15 Asn Asn Asn Asn Asn Asn Asn Asn Gly Ser Met Thr Trp Pro Val Lys 20 25 30 Asp Phe Asn Tyr Ser Asp Pro Val Asn Asp Asn Asp Ile Leu Tyr Leu 35 40 45 Arg Ile Pro Gln Asn Lys Leu Ile Thr Thr Pro Val Lys Ala Phe Met 50 55 60 Ile Thr Gln Asn Ile Trp Val Ile Pro Glu Arg Phe Ser Ser Asp Thr 65 70 75 80 Asn Pro Ser Leu Ser Lys Pro Pro Arg Pro Thr Ser Lys Tyr Gln Ser 85 90 95 Tyr Tyr Asp Pro Ser Tyr Leu Ser Thr Asp Glu Gln Lys Asp Thr Phe 100 105 110 Leu Lys Gly Ile Ile Lys Leu Phe Lys Arg Ile Asn Glu Arg Asp Ile 115 120 125 Gly Lys Lys Leu Ile Asn Tyr Leu Val Val Gly Ser Pro Phe Met Gly 130 135 140 Asp Ser Ser Thr Pro Glu Asp Thr Phe Asp Phe Thr Arg His Thr Thr 145 150 155 160 Asn Ile Ala Val Glu Lys Phe Glu Asn Gly Ser Trp Lys Val Thr Asn 165 170 175 Ile Ile Thr Pro Ser Val Leu Ile Phe Gly Pro Leu Pro Asn Ile Leu 180 185 190 Asp Tyr Thr Ala Ser Leu Thr Leu Gln Gly Gln Gln Ser Asn Pro Ser 195 200 205 Phe Glu Gly Phe Gly Thr Leu Ser Ile Leu Lys Val Ala Pro Glu Phe 210 215 220 Leu Leu Thr Phe Ser Asp Val Thr Ser Asn Gln Ser Ser Ala Val Leu 225 230 235 240 Gly Lys Ser Ile Phe Cys Met Asp Pro Val Ile Ala Leu Met His Glu 245 250 255 Leu Thr His Ser Leu His Gln Leu Tyr Gly Ile Asn Ile Pro Ser Asp 260 265 270 Lys Arg Ile Arg Pro Gln Val Ser Glu Gly Phe Phe Ser Gln Asp Gly 275 280 285 Pro Asn Val Gln Phe Glu Glu Leu Tyr Thr Phe Gly Gly Leu Asp Val 290 295 300 Glu Ile Ile Pro Gln Ile Glu Arg Ser Gln Leu Arg Glu Lys Ala Leu 305 310 315 320 Gly His Tyr Lys Asp Ile Ala Lys Arg Leu Asn Asn Ile Asn Lys Thr 325 330 335 Ile Pro Ser Ser Trp Ile Ser Asn Ile Asp Lys Tyr Lys Lys Ile Phe 340 345 350 Ser Glu Lys Tyr Asn Phe Asp Lys Asp Asn Thr Gly Asn Phe Val Val 355 360 365 Asn Ile Asp Lys Phe Asn Ser Leu Tyr Ser Asp Leu Thr Asn Val Met 370 375 380 Ser Glu Val Val Tyr Ser Ser Gln Tyr Asn Val Lys Asn Arg Thr His 385 390 395 400 Tyr Phe Ser Arg His Tyr Leu Pro Val Phe Ala Asn Ile Leu Asp Asp 405 410 415 Asn Ile Tyr Thr Ile Arg Asp Gly Phe Asn Leu Thr Asn Lys Gly Phe 420 425 430 Asn Ile Glu Asn Ser Gly Gln Asn Ile Glu Arg Asn Pro Ala Leu Gln 435 440 445 Lys Leu Ser Ser Glu Ser Val Val Asp Leu Phe Thr Lys Val Cys Val 450 455 460 Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg Asn 465 470 475 480 Lys Ala Leu Asn Leu Gln Cys Ile Lys Val Lys Asn Asn Arg Leu Pro 485 490 495 Tyr Val Ala Asp Lys Asp Ser Ile Ser Gln Glu Ile Phe Glu Asn Lys 500 505 510 Ile Ile Thr Asp Glu Thr Asn Val Gln Asn Tyr Ser Asp Lys Phe Ser 515 520 525 Leu Asp Glu Ser Ile Leu Asp Gly Gln Val Pro Ile Asn Pro Glu Ile 530 535 540 Val Asp Pro Leu Leu Pro Asn Val Asn Met Glu Pro Leu Asn Leu Pro 545 550 555 560 Gly Glu Glu Ile Val Phe Tyr Asp Asp Ile Thr Lys Tyr Val Asp Tyr 565 570 575 Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys Leu Ser Asn Asn Val 580 585 590 Glu Asn Ile Thr Leu Thr Thr Ser Val Glu Glu Ala Leu Gly Tyr Ser 595 600 605 Asn Lys Ile Tyr Thr Phe Leu Pro Ser Leu Ala Glu Lys Val Asn Lys 610 615 620 Gly Val Gln Ala Gly Leu Phe Leu Asn Trp Ala Asn Glu Val Val Glu 625 630 635 640 Asp Phe Thr Thr Asn Ile Met Lys Lys Asp Thr Leu Asp Lys Ile Ser 645 650 655 Asp Val Ser Val Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly 660 665 670 Asn Ser Ala Leu Arg Gly Asn Phe Asn Gln Ala Phe Ala Thr Ala Gly 675 680 685 Val Ala Phe Leu Leu Glu Gly Phe Pro Glu Phe Thr Ile Pro Ala Leu 690 695 700 Gly Val Phe Thr Phe Tyr Ser Ser Ile Gln Glu Arg Glu Lys Ile Ile 705 710 715 720 Lys Thr Ile Glu Asn Cys Leu Glu Gln Arg Val Lys Arg Trp Lys Asp 725 730 735 Ser Tyr Gln Trp Met Val Ser Asn Trp Leu Ser Arg Ile Thr Thr Gln 740 745 750 Phe Asn His Ile Asn Tyr Gln Met Tyr Asp Ser Leu Ser Tyr Gln Ala 755 760 765 Asp Ala Ile Lys Ala Lys Ile Asp Leu Glu Tyr Lys Lys Tyr Ser Gly 770 775 780 Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu Asn Leu Lys Asn Ser 785 790 795 800 Leu Asp Val Lys Ile Ser Glu Ala Met Asn Asn Ile Asn Lys Phe Ile 805 810 815 Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn Met Leu Pro Lys Val 820 825 830 Ile Asp Glu Leu Asn Lys Phe Asp Leu Arg Thr Lys Thr Glu Leu Ile 835 840 845 Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val Gly Glu Val Asp Arg 850 855 860 Leu Lys Ala Lys Val Asn Glu Ser Phe Glu Asn Thr Met Pro Phe Asn 865 870 875 880 Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys Asp Ile Ile Asn Glu 885 890 895 Tyr Phe Asn Leu Glu Cys Gly Gly Gly Gly Ser Ile Glu Gly Arg Tyr 900 905 910 Gly Gly Phe Leu Arg Arg Ile Arg Pro Lys Leu Lys Trp Asp Asn Gln 915 920 925 Gly Gly Gly Gly Ser Cys Gly Gly Gly Gly Ser Arg Pro Pro Gly Phe 930 935 940 Ser Pro Phe Arg 945 <210> 9 <211> 2862 <212> DNA <213> Artificial Sequence <220> <223> Synthetic sequence <400> 9 atgcatcacc atcaccatca ccatcaccat catgggagct cgaacaataa caacaataac 60 aataacaata acggatccat ggagttcgtt aacaaacagt tcaactataa agacccagtt 120 aacggtgttg acattgctta catcaaaatc ccgaacgctg gccagatgca gccggtaaag 180 gcattcaaaa tccacaacaa aatctgggtt atcccggaac gtgatacctt tactaacccg 240 gaagaaggtg acctgaaccc gccaccggaa gcgaaacagg tgccggtatc ttactatgac 300 tccacctacc tgtctaccga taacgaaaag gacaactacc tgaaaggtgt tactaaactg 360 ttcgagcgta tttactccac cgacctgggc cgtatgctgc tgactagcat cgttcgcggt 420 atcccgttct ggggcggttc taccatcgat accgaactga aagtaatcga cactaactgc 480 atcaacgtta ttcagccgga cggttcctat cgttccgaag aactgaacct ggtgatcatc 540 ggcccgtctg ctgatatcat ccagttcgag tgtaagagct ttggtcacga agttctgaac 600 ctcacccgta acggctacgg ttccactcag tacatccgtt tctctccgga cttcaccttc 660 ggttttgaag aatccctgga agtagacacg aacccactgc tgggcgctgg taaattcgca 720 actgatcctg cggttaccct ggctcacgaa ctgattcatg caggccaccg cctgtacggt 780 atcgccatca atccgaaccg tgtcttcaaa gttaacacca acgcgtatta cgagatgtcc 840 ggtctggaag ttagcttcga agaactgcgt acttttggcg gtcacgacgc taaattcatc 900 gactctctgc aagaaaacga gttccgtctg tactactata acaagttcaa agatatcgca 960 tccaccctga acaaagcgaa atccatcgtg ggtaccactg cttctctcca gtacatgaag 1020 aacgttttta aagaaaaata cctgctcagc gaagacacct ccggcaaatt ctctgtagac 1080 aagttgaaat tcgataaact ttacaaaatg ctgactgaaa tttacaccga agacaacttc 1140 gttaagttct ttaaagttct gaaccgcaaa acctatctga acttcgacaa ggcagtattc 1200 aaaatcaaca tcgtgccgaa agttaactac actatctacg atggtttcaa cctgcgtaac 1260 accaacctgg ctgctaattt taacggccag aacacggaaa tcaacaacat gaacttcaca 1320 aaactgaaaa acttcactgg tctgttcgag ttttacaagc tgctgtgcgt cgacggcatc 1380 attacctcca aaactaaatc tctgatagaa ggtagaaaca aagcgctgaa cgacctctgt 1440 atcaaggtta acaactggga tttattcttc agcccgagtg aagacaactt caccaacgac 1500 ctgaacaaag gtgaagaaat cacctcagat actaacatcg aagcagccga agaaaacatc 1560 tcgctggacc tgatccagca gtactacctg acctttaatt tcgacaacga gccggaaaac 1620 atttctatcg aaaacctgag ctctgatatc atcggccagc tggaactgat gccgaacatc 1680 gaacgtttcc caaacggtaa aaagtacgag ctggacaaat ataccatgtt ccactacctg 1740 cgcgcgcagg aatttgaaca cggcaaatcc cgtatcgcac tgactaactc cgttaacgaa 1800 gctctgctca acccgtcccg tgtatacacc ttcttctcta gcgactacgt gaaaaaggtc 1860 aacaaagcga ctgaagctgc aatgttcttg ggttgggttg aacagcttgt ttatgatttt 1920 accgacgaga cgtccgaagt atctactacc gacaaaattg cggatatcac tatcatcatc 1980 ccgtacatcg gtccggctct gaacattggc aacatgctgt acaaagacga cttcgttggc 2040 gcactgatct tctccggtgc ggtgatcctg ctggagttca tcccggaaat cgccatcccg 2100 gtactgggca cctttgctct ggtttcttac attgcaaaca aggttctgac tgtacaaacc 2160 atcgacaacg cgctgagcaa acgtaacgaa aaatgggatg aagtttacaa atatatcgtg 2220 accaactggc tggctaaggt taatactcag atcgacctca tccgcaaaaa aatgaaagaa 2280 gcactggaaa accaggcgga agctaccaag gcaatcatta actaccagta caaccagtac 2340 accgaggaag aaaaaaacaa catcaacttc aacatcgacg atctgtcctc taaactgaac 2400 gaatccatca acaaagctat gatcaacatc aacaagttcc tgaaccagtg ctctgtaagc 2460 tatctgatga actccatgat cccgtacggt gttaaacgtc tggaggactt cgatgcgtct 2520 ctgaaagacg ccctgctgaa atacatttac gacaaccgtg gcactctgat cggtcaggtt 2580 gatcgtctga aggacaaagt gaacaatacc ttatcgaccg acatcccttt tcagctcagt 2640 aaatatgtcg ataaccaacg ccttttgtcc acttgtggcg gtggcggtag catcgaaggt 2700 cgttacggtg gtttcatgac ctctgaaaaa tctcagaccc cgctggttac cctgttcaaa 2760 aacgctatca tcaaaaacgc ttacaaaaaa ggtgaaggcg gtgggggtag ttgcggcggt 2820 ggcggttcgc gtccgccggg tttctctccg ttccgttgat aa 2862 <210> 10 <211> 952 <212> PRT <213> Artificial Sequence <220> <223> Synthetic sequence <400> 10 Met His His His His His His His His His His Gly Ser Ser Asn Asn 1 5 10 15 Asn Asn Asn Asn Asn Asn Asn Asn Gly Ser Met Glu Phe Val Asn Lys 20 25 30 Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly Val Asp Ile Ala Tyr Ile 35 40 45 Lys Ile Pro Asn Ala Gly Gln Met Gln Pro Val Lys Ala Phe Lys Ile 50 55 60 His Asn Lys Ile Trp Val Ile Pro Glu Arg Asp Thr Phe Thr Asn Pro 65 70 75 80 Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu Ala Lys Gln Val Pro Val 85 90 95 Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr Asp Asn Glu Lys Asp Asn 100 105 110 Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu Arg Ile Tyr Ser Thr Asp 115 120 125 Leu Gly Arg Met Leu Leu Thr Ser Ile Val Arg Gly Ile Pro Phe Trp 130 135 140 Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys Val Ile Asp Thr Asn Cys 145 150 155 160 Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr Arg Ser Glu Glu Leu Asn 165 170 175 Leu Val Ile Ile Gly Pro Ser Ala Asp Ile Ile Gln Phe Glu Cys Lys 180 185 190 Ser Phe Gly His Glu Val Leu Asn Leu Thr Arg Asn Gly Tyr Gly Ser 195 200 205 Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe Thr Phe Gly Phe Glu Glu 210 215 220 Ser Leu Glu Val Asp Thr Asn Pro Leu Leu Gly Ala Gly Lys Phe Ala 225 230 235 240 Thr Asp Pro Ala Val Thr Leu Ala His Glu Leu Ile His Ala Gly His 245 250 255 Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn Arg Val Phe Lys Val Asn 260 265 270 Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu Glu Val Ser Phe Glu Glu 275 280 285 Leu Arg Thr Phe Gly Gly His Asp Ala Lys Phe Ile Asp Ser Leu Gln 290 295 300 Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn Lys Phe Lys Asp Ile Ala 305 310 315 320 Ser Thr Leu Asn Lys Ala Lys Ser Ile Val Gly Thr Thr Ala Ser Leu 325 330 335 Gln Tyr Met Lys Asn Val Phe Lys Glu Lys Tyr Leu Leu Ser Glu Asp 340 345 350 Thr Ser Gly Lys Phe Ser Val Asp Lys Leu Lys Phe Asp Lys Leu Tyr 355 360 365 Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp Asn Phe Val Lys Phe Phe 370 375 380 Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn Phe Asp Lys Ala Val Phe 385 390 395 400 Lys Ile Asn Ile Val Pro Lys Val Asn Tyr Thr Ile Tyr Asp Gly Phe 405 410 415 Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn Phe Asn Gly Gln Asn Thr 420 425 430 Glu Ile Asn Asn Met Asn Phe Thr Lys Leu Lys Asn Phe Thr Gly Leu 435 440 445 Phe Glu Phe Tyr Lys Leu Leu Cys Val Asp Gly Ile Ile Thr Ser Lys 450 455 460 Thr Lys Ser Leu Ile Glu Gly Arg Asn Lys Ala Leu Asn Asp Leu Cys 465 470 475 480 Ile Lys Val Asn Asn Trp Asp Leu Phe Phe Ser Pro Ser Glu Asp Asn 485 490 495 Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu Ile Thr Ser Asp Thr Asn 500 505 510 Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu Asp Leu Ile Gln Gln Tyr 515 520 525 Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro Glu Asn Ile Ser Ile Glu 530 535 540 Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu Glu Leu Met Pro Asn Ile 545 550 555 560 Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu Leu Asp Lys Tyr Thr Met 565 570 575 Phe His Tyr Leu Arg Ala Gln Glu Phe Glu His Gly Lys Ser Arg Ile 580 585 590 Ala Leu Thr Asn Ser Val Asn Glu Ala Leu Leu Asn Pro Ser Arg Val 595 600 605 Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys Lys Val Asn Lys Ala Thr 610 615 620 Glu Ala Ala Met Phe Leu Gly Trp Val Glu Gln Leu Val Tyr Asp Phe 625 630 635 640 Thr Asp Glu Thr Ser Glu Val Ser Thr Thr Asp Lys Ile Ala Asp Ile 645 650 655 Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly Asn Met 660 665 670 Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu Ile Phe Ser Gly Ala Val 675 680 685 Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala Ile Pro Val Leu Gly Thr 690 695 700 Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys Val Leu Thr Val Gln Thr 705 710 715 720 Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu Lys Trp Asp Glu Val Tyr 725 730 735 Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys Val Asn Thr Gln Ile Asp 740 745 750 Leu Ile Arg Lys Lys Met Lys Glu Ala Leu Glu Asn Gln Ala Glu Ala 755 760 765 Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn Gln Tyr Thr Glu Glu Glu 770 775 780 Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp Leu Ser Ser Lys Leu Asn 785 790 795 800 Glu Ser Ile Asn Lys Ala Met Ile Asn Ile Asn Lys Phe Leu Asn Gln 805 810 815 Cys Ser Val Ser Tyr Leu Met Asn Ser Met Ile Pro Tyr Gly Val Lys 820 825 830 Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys Asp Ala Leu Leu Lys Tyr 835 840 845 Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly Gln Val Asp Arg Leu Lys 850 855 860 Asp Lys Val Asn Asn Thr Leu Ser Thr Asp Ile Pro Phe Gln Leu Ser 865 870 875 880 Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser Thr Cys Gly Gly Gly Gly 885 890 895 Ser Ile Glu Gly Arg Tyr Gly Gly Phe Met Thr Ser Glu Lys Ser Gln 900 905 910 Thr Pro Leu Val Thr Leu Phe Lys Asn Ala Ile Ile Lys Asn Ala Tyr 915 920 925 Lys Lys Gly Glu Gly Gly Gly Gly Ser Cys Gly Gly Gly Gly Ser Arg 930 935 940 Pro Pro Gly Phe Ser Pro Phe Arg 945 950 <210> 11 <211> 3012 <212> DNA <213> Artificial Sequence <220> <223> Synthetic sequence <400> 11 atgcatcacc atcaccatca ccatcaccat catgggagct cgaacaataa caacaataac 60 aataacaata acggatccat gacgtggcca gttaaggatt tcaactactc agatcctgta 120 aatgacaacg atattctgta ccttcgcatt ccacaaaata aactgatcac cacaccagtc 180 aaagcattca tgattactca aaacatttgg gtcattccag aacgcttttc tagtgacaca 240 aatccgagtt tatctaaacc tccgcgtccg acgtccaaat atcagagcta ttacgatccc 300 tcatatctca gtacggacga acaaaaagat actttcctta aaggtatcat taaactgttt 360 aagcgtatta atgagcgcga tatcgggaaa aagttgatta attatcttgt tgtgggttcc 420 ccgttcatgg gcgatagctc tacccccgaa gacacttttg attttacccg tcatacgaca 480 aacatcgcgg tagagaagtt tgagaacgga tcgtggaaag tcacaaacat cattacacct 540 agcgtcttaa tttttggtcc gctgccaaac atcttagatt atacagccag cctgactttg 600 caggggcaac agtcgaatcc gagtttcgaa ggttttggta ccctgagcat tctgaaagtt 660 gccccggaat ttctgctcac tttttcagat gtcaccagca accagagctc agcagtatta 720 ggaaagtcaa ttttttgcat ggacccggtt attgcactga tgcacgaact gacgcactct 780 ctgcatcaac tgtatgggat caacatcccc agtgacaaac gtattcgtcc ccaggtgtct 840 gaaggatttt tctcacagga tgggccgaac gtccagttcg aagagttgta tactttcgga 900 ggcctggacg tagagatcat tccccagatt gagcgcagtc agctgcgtga gaaggcattg 960 ggccattata aggatattgc aaaacgcctg aataacatta acaaaacgat tccatcttcg 1020 tggatctcga atattgataa atataagaaa atttttagcg agaaatataa ttttgataaa 1080 gataatacag gtaactttgt ggttaacatt gacaaattca actcccttta cagtgatttg 1140 acgaatgtaa tgagcgaagt tgtgtatagt tcccaataca acgttaagaa tcgtacccat 1200 tacttctctc gtcactacct gccggttttc gcgaacatcc ttgacgataa tatttacact 1260 attcgtgacg gctttaactt gaccaacaag ggcttcaata ttgaaaattc aggccagaac 1320 attgaacgca acccggcctt gcagaaactg tcgagtgaat ccgtggttga cctgtttacc 1380 aaagtctgcg tcgacggcat cattacctcc aaaactaaat ctctgataga aggtagaaac 1440 aaagcgctga acctgcagtg tattaaagtg aaaaacaatc ggctgcctta tgtagcagat 1500 aaagatagca ttagtcagga gattttcgaa aataaaatta tcactgacga aaccaatgtt 1560 cagaattatt cagataaatt ttcactggac gaaagcatct tagatggcca agttccgatt 1620 aacccggaaa ttgttgatcc gttactgccg aacgtgaata tggaaccgtt aaacctccct 1680 ggcgaagaga tcgtatttta tgatgacatt acgaaatatg tggactacct taattcttat 1740 tactatttgg aaagccagaa actgtccaat aacgtggaaa acattactct gaccacaagc 1800 gtggaagagg ctttaggcta ctcaaataag atttatacct tcctcccgtc gctggcggaa 1860 aaagtaaata aaggtgtgca ggctggtctg ttcctcaact gggcgaatga agttgtcgaa 1920 gactttacca cgaatattat gaaaaaggat accctggata aaatctccga cgtctcggtt 1980 attatcccat atattggccc tgcgttaaat atcggtaata gtgcgctgcg ggggaatttt 2040 aaccaggcct ttgctaccgc gggcgtcgcg ttcctcctgg agggctttcc tgaatttact 2100 atcccggcgc tcggtgtttt tacattttac tcttccatcc aggagcgtga gaaaattatc 2160 aaaaccatcg aaaactgcct ggagcagcgg gtgaaacgct ggaaagattc ttatcaatgg 2220 atggtgtcaa actggttatc tcgcatcacg acccaattca accatattaa ttaccagatg 2280 tatgatagtc tgtcgtacca agctgacgcc attaaagcca aaattgatct ggaatataaa 2340 aagtactctg gtagcgataa ggagaacatc aaaagccagg tggagaacct taagaatagt 2400 ctggatgtga aaatctctga agctatgaat aacattaaca aattcattcg tgaatgttcg 2460 gtgacgtacc tgttcaagaa tatgctgcca aaagttattg atgaactgaa taaatttgat 2520 ctgcgtacca aaaccgaact tatcaacctc atcgactccc acaacattat ccttgtgggc 2580 gaagtggatc gtctgaaggc caaagtaaac gagagctttg aaaatacgat gccgtttaat 2640 attttttcat ataccaataa ctccttgctg aaagatatca tcaatgaata tttcaatcta 2700 gaatgtggcg gtggcggtag catcgaaggt cgtcacgtgg atgcgatctt cactcagtct 2760 taccgtaaag ttctggcgca gctgagcgct cgtaaactgc tgcaggatat cctgaaccgt 2820 cagcagggtg aacgtaacca ggaacagggc gctggcggtg ggggtagttg cggcggtggc 2880 ggttcgcacg tggatgcgat cttcactcag tcttaccgta aagttctggc gcagctgagc 2940 gctcgtaaac tgctgcagga tatcctgaac cgtcagcagg gtgaacgtaa ccaggaacag 3000 ggcgcttgat aa 3012 <210> 12 <211> 1002 <212> PRT <213> Artificial Sequence <220> <223> Synthetic sequence <400> 12 Met His His His His His His His His His His Gly Ser Ser Asn Asn 1 5 10 15 Asn Asn Asn Asn Asn Asn Asn Asn Gly Ser Met Thr Trp Pro Val Lys 20 25 30 Asp Phe Asn Tyr Ser Asp Pro Val Asn Asp Asn Asp Ile Leu Tyr Leu 35 40 45 Arg Ile Pro Gln Asn Lys Leu Ile Thr Thr Pro Val Lys Ala Phe Met 50 55 60 Ile Thr Gln Asn Ile Trp Val Ile Pro Glu Arg Phe Ser Ser Asp Thr 65 70 75 80 Asn Pro Ser Leu Ser Lys Pro Pro Arg Pro Thr Ser Lys Tyr Gln Ser 85 90 95 Tyr Tyr Asp Pro Ser Tyr Leu Ser Thr Asp Glu Gln Lys Asp Thr Phe 100 105 110 Leu Lys Gly Ile Ile Lys Leu Phe Lys Arg Ile Asn Glu Arg Asp Ile 115 120 125 Gly Lys Lys Leu Ile Asn Tyr Leu Val Val Gly Ser Pro Phe Met Gly 130 135 140 Asp Ser Ser Thr Pro Glu Asp Thr Phe Asp Phe Thr Arg His Thr Thr 145 150 155 160 Asn Ile Ala Val Glu Lys Phe Glu Asn Gly Ser Trp Lys Val Thr Asn 165 170 175 Ile Ile Thr Pro Ser Val Leu Ile Phe Gly Pro Leu Pro Asn Ile Leu 180 185 190 Asp Tyr Thr Ala Ser Leu Thr Leu Gln Gly Gln Gln Ser Asn Pro Ser 195 200 205 Phe Glu Gly Phe Gly Thr Leu Ser Ile Leu Lys Val Ala Pro Glu Phe 210 215 220 Leu Leu Thr Phe Ser Asp Val Thr Ser Asn Gln Ser Ser Ala Val Leu 225 230 235 240 Gly Lys Ser Ile Phe Cys Met Asp Pro Val Ile Ala Leu Met His Glu 245 250 255 Leu Thr His Ser Leu His Gln Leu Tyr Gly Ile Asn Ile Pro Ser Asp 260 265 270 Lys Arg Ile Arg Pro Gln Val Ser Glu Gly Phe Phe Ser Gln Asp Gly 275 280 285 Pro Asn Val Gln Phe Glu Glu Leu Tyr Thr Phe Gly Gly Leu Asp Val 290 295 300 Glu Ile Ile Pro Gln Ile Glu Arg Ser Gln Leu Arg Glu Lys Ala Leu 305 310 315 320 Gly His Tyr Lys Asp Ile Ala Lys Arg Leu Asn Asn Ile Asn Lys Thr 325 330 335 Ile Pro Ser Ser Trp Ile Ser Asn Ile Asp Lys Tyr Lys Lys Ile Phe 340 345 350 Ser Glu Lys Tyr Asn Phe Asp Lys Asp Asn Thr Gly Asn Phe Val Val 355 360 365 Asn Ile Asp Lys Phe Asn Ser Leu Tyr Ser Asp Leu Thr Asn Val Met 370 375 380 Ser Glu Val Val Tyr Ser Ser Gln Tyr Asn Val Lys Asn Arg Thr His 385 390 395 400 Tyr Phe Ser Arg His Tyr Leu Pro Val Phe Ala Asn Ile Leu Asp Asp 405 410 415 Asn Ile Tyr Thr Ile Arg Asp Gly Phe Asn Leu Thr Asn Lys Gly Phe 420 425 430 Asn Ile Glu Asn Ser Gly Gln Asn Ile Glu Arg Asn Pro Ala Leu Gln 435 440 445 Lys Leu Ser Ser Glu Ser Val Val Asp Leu Phe Thr Lys Val Cys Val 450 455 460 Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg Asn 465 470 475 480 Lys Ala Leu Asn Leu Gln Cys Ile Lys Val Lys Asn Asn Arg Leu Pro 485 490 495 Tyr Val Ala Asp Lys Asp Ser Ile Ser Gln Glu Ile Phe Glu Asn Lys 500 505 510 Ile Ile Thr Asp Glu Thr Asn Val Gln Asn Tyr Ser Asp Lys Phe Ser 515 520 525 Leu Asp Glu Ser Ile Leu Asp Gly Gln Val Pro Ile Asn Pro Glu Ile 530 535 540 Val Asp Pro Leu Leu Pro Asn Val Asn Met Glu Pro Leu Asn Leu Pro 545 550 555 560 Gly Glu Glu Ile Val Phe Tyr Asp Asp Ile Thr Lys Tyr Val Asp Tyr 565 570 575 Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys Leu Ser Asn Asn Val 580 585 590 Glu Asn Ile Thr Leu Thr Thr Ser Val Glu Glu Ala Leu Gly Tyr Ser 595 600 605 Asn Lys Ile Tyr Thr Phe Leu Pro Ser Leu Ala Glu Lys Val Asn Lys 610 615 620 Gly Val Gln Ala Gly Leu Phe Leu Asn Trp Ala Asn Glu Val Val Glu 625 630 635 640 Asp Phe Thr Thr Asn Ile Met Lys Lys Asp Thr Leu Asp Lys Ile Ser 645 650 655 Asp Val Ser Val Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly 660 665 670 Asn Ser Ala Leu Arg Gly Asn Phe Asn Gln Ala Phe Ala Thr Ala Gly 675 680 685 Val Ala Phe Leu Leu Glu Gly Phe Pro Glu Phe Thr Ile Pro Ala Leu 690 695 700 Gly Val Phe Thr Phe Tyr Ser Ser Ile Gln Glu Arg Glu Lys Ile Ile 705 710 715 720 Lys Thr Ile Glu Asn Cys Leu Glu Gln Arg Val Lys Arg Trp Lys Asp 725 730 735 Ser Tyr Gln Trp Met Val Ser Asn Trp Leu Ser Arg Ile Thr Thr Gln 740 745 750 Phe Asn His Ile Asn Tyr Gln Met Tyr Asp Ser Leu Ser Tyr Gln Ala 755 760 765 Asp Ala Ile Lys Ala Lys Ile Asp Leu Glu Tyr Lys Lys Tyr Ser Gly 770 775 780 Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu Asn Leu Lys Asn Ser 785 790 795 800 Leu Asp Val Lys Ile Ser Glu Ala Met Asn Asn Ile Asn Lys Phe Ile 805 810 815 Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn Met Leu Pro Lys Val 820 825 830 Ile Asp Glu Leu Asn Lys Phe Asp Leu Arg Thr Lys Thr Glu Leu Ile 835 840 845 Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val Gly Glu Val Asp Arg 850 855 860 Leu Lys Ala Lys Val Asn Glu Ser Phe Glu Asn Thr Met Pro Phe Asn 865 870 875 880 Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys Asp Ile Ile Asn Glu 885 890 895 Tyr Phe Asn Leu Glu Cys Gly Gly Gly Gly Ser Ile Glu Gly Arg His 900 905 910 Val Asp Ala Ile Phe Thr Gln Ser Tyr Arg Lys Val Leu Ala Gln Leu 915 920 925 Ser Ala Arg Lys Leu Leu Gln Asp Ile Leu Asn Arg Gln Gln Gly Glu 930 935 940 Arg Asn Gln Glu Gln Gly Ala Gly Gly Gly Gly Ser Cys Gly Gly Gly 945 950 955 960 Gly Ser His Val Asp Ala Ile Phe Thr Gln Ser Tyr Arg Lys Val Leu 965 970 975 Ala Gln Leu Ser Ala Arg Lys Leu Leu Gln Asp Ile Leu Asn Arg Gln 980 985 990 Gln Gly Glu Arg Asn Gln Glu Gln Gly Ala 995 1000 <210> 13 <211> 2814 <212> DNA <213> Artificial Sequence <220> <223> Synthetic sequence <400> 13 atgcatcacc atcaccatca ccatcaccat catgggagct cgaacaataa caacaataac 60 aataacaata acggatccat gacgtggcca gttaaggatt tcaactactc agatcctgta 120 aatgacaacg atattctgta ccttcgcatt ccacaaaata aactgatcac cacaccagtc 180 aaagcattca tgattactca aaacatttgg gtcattccag aacgcttttc tagtgacaca 240 aatccgagtt tatctaaacc tccgcgtccg acgtccaaat atcagagcta ttacgatccc 300 tcatatctca gtacggacga acaaaaagat actttcctta aaggtatcat taaactgttt 360 aagcgtatta atgagcgcga tatcgggaaa aagttgatta attatcttgt tgtgggttcc 420 ccgttcatgg gcgatagctc tacccccgaa gacacttttg attttacccg tcatacgaca 480 aacatcgcgg tagagaagtt tgagaacgga tcgtggaaag tcacaaacat cattacacct 540 agcgtcttaa tttttggtcc gctgccaaac atcttagatt atacagccag cctgactttg 600 caggggcaac agtcgaatcc gagtttcgaa ggttttggta ccctgagcat tctgaaagtt 660 gccccggaat ttctgctcac tttttcagat gtcaccagca accagagctc agcagtatta 720 ggaaagtcaa ttttttgcat ggacccggtt attgcactga tgcacgaact gacgcactct 780 ctgcatcaac tgtatgggat caacatcccc agtgacaaac gtattcgtcc ccaggtgtct 840 gaaggatttt tctcacagga tgggccgaac gtccagttcg aagagttgta tactttcgga 900 ggcctggacg tagagatcat tccccagatt gagcgcagtc agctgcgtga gaaggcattg 960 ggccattata aggatattgc aaaacgcctg aataacatta acaaaacgat tccatcttcg 1020 tggatctcga atattgataa atataagaaa atttttagcg agaaatataa ttttgataaa 1080 gataatacag gtaactttgt ggttaacatt gacaaattca actcccttta cagtgatttg 1140 acgaatgtaa tgagcgaagt tgtgtatagt tcccaataca acgttaagaa tcgtacccat 1200 tacttctctc gtcactacct gccggttttc gcgaacatcc ttgacgataa tatttacact 1260 attcgtgacg gctttaactt gaccaacaag ggcttcaata ttgaaaattc aggccagaac 1320 attgaacgca acccggcctt gcagaaactg tcgagtgaat ccgtggttga cctgtttacc 1380 aaagtctgcg tcgacggcat cattacctcc aaaactaaat ctctgataga aggtagaaac 1440 aaagcgctga acctgcagtg tattaaagtg aaaaacaatc ggctgcctta tgtagcagat 1500 aaagatagca ttagtcagga gattttcgaa aataaaatta tcactgacga aaccaatgtt 1560 cagaattatt cagataaatt ttcactggac gaaagcatct tagatggcca agttccgatt 1620 aacccggaaa ttgttgatcc gttactgccg aacgtgaata tggaaccgtt aaacctccct 1680 ggcgaagaga tcgtatttta tgatgacatt acgaaatatg tggactacct taattcttat 1740 tactatttgg aaagccagaa actgtccaat aacgtggaaa acattactct gaccacaagc 1800 gtggaagagg ctttaggcta ctcaaataag atttatacct tcctcccgtc gctggcggaa 1860 aaagtaaata aaggtgtgca ggctggtctg ttcctcaact gggcgaatga agttgtcgaa 1920 gactttacca cgaatattat gaaaaaggat accctggata aaatctccga cgtctcggtt 1980 attatcccat atattggccc tgcgttaaat atcggtaata gtgcgctgcg ggggaatttt 2040 aaccaggcct ttgctaccgc gggcgtcgcg ttcctcctgg agggctttcc tgaatttact 2100 atcccggcgc tcggtgtttt tacattttac tcttccatcc aggagcgtga gaaaattatc 2160 aaaaccatcg aaaactgcct ggagcagcgg gtgaaacgct ggaaagattc ttatcaatgg 2220 atggtgtcaa actggttatc tcgcatcacg acccaattca accatattaa ttaccagatg 2280 tatgatagtc tgtcgtacca agctgacgcc attaaagcca aaattgatct ggaatataaa 2340 aagtactctg gtagcgataa ggagaacatc aaaagccagg tggagaacct taagaatagt 2400 ctggatgtga aaatctctga agctatgaat aacattaaca aattcattcg tgaatgttcg 2460 gtgacgtacc tgttcaagaa tatgctgcca aaagttattg atgaactgaa taaatttgat 2520 ctgcgtacca aaaccgaact tatcaacctc atcgactccc acaacattat ccttgtgggc 2580 gaagtggatc gtctgaaggc caaagtaaac gagagctttg aaaatacgat gccgtttaat 2640 attttttcat ataccaataa ctccttgctg aaagatatca tcaatgaata tttcaatcta 2700 gaatgtggtg gcggtggctc tggtggcggc ggttctattg aaggtcgcgg tggcggtggc 2760 tctggtggcg gcggttctca gcactggtcc tattgcctgc gccctggttg ataa 2814 <210> 14 <211> 936 <212> PRT <213> Artificial Sequence <220> <223> Synthetic sequence <400> 14 Met His His His His His His His His His His Gly Ser Ser Asn Asn 1 5 10 15 Asn Asn Asn Asn Asn Asn Asn Asn Gly Ser Met Thr Trp Pro Val Lys 20 25 30 Asp Phe Asn Tyr Ser Asp Pro Val Asn Asp Asn Asp Ile Leu Tyr Leu 35 40 45 Arg Ile Pro Gln Asn Lys Leu Ile Thr Thr Pro Val Lys Ala Phe Met 50 55 60 Ile Thr Gln Asn Ile Trp Val Ile Pro Glu Arg Phe Ser Ser Asp Thr 65 70 75 80 Asn Pro Ser Leu Ser Lys Pro Pro Arg Pro Thr Ser Lys Tyr Gln Ser 85 90 95 Tyr Tyr Asp Pro Ser Tyr Leu Ser Thr Asp Glu Gln Lys Asp Thr Phe 100 105 110 Leu Lys Gly Ile Ile Lys Leu Phe Lys Arg Ile Asn Glu Arg Asp Ile 115 120 125 Gly Lys Lys Leu Ile Asn Tyr Leu Val Val Gly Ser Pro Phe Met Gly 130 135 140 Asp Ser Ser Thr Pro Glu Asp Thr Phe Asp Phe Thr Arg His Thr Thr 145 150 155 160 Asn Ile Ala Val Glu Lys Phe Glu Asn Gly Ser Trp Lys Val Thr Asn 165 170 175 Ile Ile Thr Pro Ser Val Leu Ile Phe Gly Pro Leu Pro Asn Ile Leu 180 185 190 Asp Tyr Thr Ala Ser Leu Thr Leu Gln Gly Gln Gln Ser Asn Pro Ser 195 200 205 Phe Glu Gly Phe Gly Thr Leu Ser Ile Leu Lys Val Ala Pro Glu Phe 210 215 220 Leu Leu Thr Phe Ser Asp Val Thr Ser Asn Gln Ser Ser Ala Val Leu 225 230 235 240 Gly Lys Ser Ile Phe Cys Met Asp Pro Val Ile Ala Leu Met His Glu 245 250 255 Leu Thr His Ser Leu His Gln Leu Tyr Gly Ile Asn Ile Pro Ser Asp 260 265 270 Lys Arg Ile Arg Pro Gln Val Ser Glu Gly Phe Phe Ser Gln Asp Gly 275 280 285 Pro Asn Val Gln Phe Glu Glu Leu Tyr Thr Phe Gly Gly Leu Asp Val 290 295 300 Glu Ile Ile Pro Gln Ile Glu Arg Ser Gln Leu Arg Glu Lys Ala Leu 305 310 315 320 Gly His Tyr Lys Asp Ile Ala Lys Arg Leu Asn Asn Ile Asn Lys Thr 325 330 335 Ile Pro Ser Ser Trp Ile Ser Asn Ile Asp Lys Tyr Lys Lys Ile Phe 340 345 350 Ser Glu Lys Tyr Asn Phe Asp Lys Asp Asn Thr Gly Asn Phe Val Val 355 360 365 Asn Ile Asp Lys Phe Asn Ser Leu Tyr Ser Asp Leu Thr Asn Val Met 370 375 380 Ser Glu Val Val Tyr Ser Ser Gln Tyr Asn Val Lys Asn Arg Thr His 385 390 395 400 Tyr Phe Ser Arg His Tyr Leu Pro Val Phe Ala Asn Ile Leu Asp Asp 405 410 415 Asn Ile Tyr Thr Ile Arg Asp Gly Phe Asn Leu Thr Asn Lys Gly Phe 420 425 430 Asn Ile Glu Asn Ser Gly Gln Asn Ile Glu Arg Asn Pro Ala Leu Gln 435 440 445 Lys Leu Ser Ser Glu Ser Val Val Asp Leu Phe Thr Lys Val Cys Val 450 455 460 Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg Asn 465 470 475 480 Lys Ala Leu Asn Leu Gln Cys Ile Lys Val Lys Asn Asn Arg Leu Pro 485 490 495 Tyr Val Ala Asp Lys Asp Ser Ile Ser Gln Glu Ile Phe Glu Asn Lys 500 505 510 Ile Ile Thr Asp Glu Thr Asn Val Gln Asn Tyr Ser Asp Lys Phe Ser 515 520 525 Leu Asp Glu Ser Ile Leu Asp Gly Gln Val Pro Ile Asn Pro Glu Ile 530 535 540 Val Asp Pro Leu Leu Pro Asn Val Asn Met Glu Pro Leu Asn Leu Pro 545 550 555 560 Gly Glu Glu Ile Val Phe Tyr Asp Asp Ile Thr Lys Tyr Val Asp Tyr 565 570 575 Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys Leu Ser Asn Asn Val 580 585 590 Glu Asn Ile Thr Leu Thr Thr Ser Val Glu Glu Ala Leu Gly Tyr Ser 595 600 605 Asn Lys Ile Tyr Thr Phe Leu Pro Ser Leu Ala Glu Lys Val Asn Lys 610 615 620 Gly Val Gln Ala Gly Leu Phe Leu Asn Trp Ala Asn Glu Val Val Glu 625 630 635 640 Asp Phe Thr Thr Asn Ile Met Lys Lys Asp Thr Leu Asp Lys Ile Ser 645 650 655 Asp Val Ser Val Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly 660 665 670 Asn Ser Ala Leu Arg Gly Asn Phe Asn Gln Ala Phe Ala Thr Ala Gly 675 680 685 Val Ala Phe Leu Leu Glu Gly Phe Pro Glu Phe Thr Ile Pro Ala Leu 690 695 700 Gly Val Phe Thr Phe Tyr Ser Ser Ile Gln Glu Arg Glu Lys Ile Ile 705 710 715 720 Lys Thr Ile Glu Asn Cys Leu Glu Gln Arg Val Lys Arg Trp Lys Asp 725 730 735 Ser Tyr Gln Trp Met Val Ser Asn Trp Leu Ser Arg Ile Thr Thr Gln 740 745 750 Phe Asn His Ile Asn Tyr Gln Met Tyr Asp Ser Leu Ser Tyr Gln Ala 755 760 765 Asp Ala Ile Lys Ala Lys Ile Asp Leu Glu Tyr Lys Lys Tyr Ser Gly 770 775 780 Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu Asn Leu Lys Asn Ser 785 790 795 800 Leu Asp Val Lys Ile Ser Glu Ala Met Asn Asn Ile Asn Lys Phe Ile 805 810 815 Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn Met Leu Pro Lys Val 820 825 830 Ile Asp Glu Leu Asn Lys Phe Asp Leu Arg Thr Lys Thr Glu Leu Ile 835 840 845 Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val Gly Glu Val Asp Arg 850 855 860 Leu Lys Ala Lys Val Asn Glu Ser Phe Glu Asn Thr Met Pro Phe Asn 865 870 875 880 Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys Asp Ile Ile Asn Glu 885 890 895 Tyr Phe Asn Leu Glu Cys Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 900 905 910 Ile Glu Gly Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln His 915 920 925 Trp Ser Tyr Cys Leu Arg Pro Gly 930 935 <210> 15 <211> 2793 <212> DNA <213> Artificial Sequence <220> <223> Synthetic sequence <400> 15 atgcatcacc atcaccatca ccatcaccat catgggagct cgaacaataa caacaataac 60 aataacaata acggatccat ggagttcgtt aacaaacagt tcaactataa agacccagtt 120 aacggtgttg acattgctta catcaaaatc ccgaacgctg gccagatgca gccggtaaag 180 gcattcaaaa tccacaacaa aatctgggtt atcccggaac gtgatacctt tactaacccg 240 gaagaaggtg acctgaaccc gccaccggaa gcgaaacagg tgccggtatc ttactatgac 300 tccacctacc tgtctaccga taacgaaaag gacaactacc tgaaaggtgt tactaaactg 360 ttcgagcgta tttactccac cgacctgggc cgtatgctgc tgactagcat cgttcgcggt 420 atcccgttct ggggcggttc taccatcgat accgaactga aagtaatcga cactaactgc 480 atcaacgtta ttcagccgga cggttcctat cgttccgaag aactgaacct ggtgatcatc 540 ggcccgtctg ctgatatcat ccagttcgag tgtaagagct ttggtcacga agttctgaac 600 ctcacccgta acggctacgg ttccactcag tacatccgtt tctctccgga cttcaccttc 660 ggttttgaag aatccctgga agtagacacg aacccactgc tgggcgctgg taaattcgca 720 actgatcctg cggttaccct ggctcacgaa ctgattcatg caggccaccg cctgtacggt 780 atcgccatca atccgaaccg tgtcttcaaa gttaacacca acgcgtatta cgagatgtcc 840 ggtctggaag ttagcttcga agaactgcgt acttttggcg gtcacgacgc taaattcatc 900 gactctctgc aagaaaacga gttccgtctg tactactata acaagttcaa agatatcgca 960 tccaccctga acaaagcgaa atccatcgtg ggtaccactg cttctctcca gtacatgaag 1020 aacgttttta aagaaaaata cctgctcagc gaagacacct ccggcaaatt ctctgtagac 1080 aagttgaaat tcgataaact ttacaaaatg ctgactgaaa tttacaccga agacaacttc 1140 gttaagttct ttaaagttct gaaccgcaaa acctatctga acttcgacaa ggcagtattc 1200 aaaatcaaca tcgtgccgaa agttaactac actatctacg atggtttcaa cctgcgtaac 1260 accaacctgg ctgctaattt taacggccag aacacggaaa tcaacaacat gaacttcaca 1320 aaactgaaaa acttcactgg tctgttcgag ttttacaagc tgctgtgcgt cgacggcatc 1380 attacctcca aaactaaatc tctgatagaa ggtagaaaca aagcgctgaa cgacctctgt 1440 atcaaggtta acaactggga tttattcttc agcccgagtg aagacaactt caccaacgac 1500 ctgaacaaag gtgaagaaat cacctcagat actaacatcg aagcagccga agaaaacatc 1560 tcgctggacc tgatccagca gtactacctg acctttaatt tcgacaacga gccggaaaac 1620 atttctatcg aaaacctgag ctctgatatc atcggccagc tggaactgat gccgaacatc 1680 gaacgtttcc caaacggtaa aaagtacgag ctggacaaat ataccatgtt ccactacctg 1740 cgcgcgcagg aatttgaaca cggcaaatcc cgtatcgcac tgactaactc cgttaacgaa 1800 gctctgctca acccgtcccg tgtatacacc ttcttctcta gcgactacgt gaaaaaggtc 1860 aacaaagcga ctgaagctgc aatgttcttg ggttgggttg aacagcttgt ttatgatttt 1920 accgacgaga cgtccgaagt atctactacc gacaaaattg cggatatcac tatcatcatc 1980 ccgtacatcg gtccggctct gaacattggc aacatgctgt acaaagacga cttcgttggc 2040 gcactgatct tctccggtgc ggtgatcctg ctggagttca tcccggaaat cgccatcccg 2100 gtactgggca cctttgctct ggtttcttac attgcaaaca aggttctgac tgtacaaacc 2160 atcgacaacg cgctgagcaa acgtaacgaa aaatgggatg aagtttacaa atatatcgtg 2220 accaactggc tggctaaggt taatactcag atcgacctca tccgcaaaaa aatgaaagaa 2280 gcactggaaa accaggcgga agctaccaag gcaatcatta actaccagta caaccagtac 2340 accgaggaag aaaaaaacaa catcaacttc aacatcgacg atctgtcctc taaactgaac 2400 gaatccatca acaaagctat gatcaacatc aacaagttcc tgaaccagtg ctctgtaagc 2460 tatctgatga actccatgat cccgtacggt gttaaacgtc tggaggactt cgatgcgtct 2520 ctgaaagacg ccctgctgaa atacatttac gacaaccgtg gcactctgat cggtcaggtt 2580 gatcgtctga aggacaaagt gaacaatacc ttatcgaccg acatcccttt tcagctcagt 2640 aaatatgtcg ataaccaacg ccttttgtcc acttgtggcg gtggcggtag catcgaaggt 2700 cgtgttccat taccagcagg aggaggaaca gtattgacta aaatgtatcc atgcggaaat 2760 cactgggcag tgggacatct aatgggatga taa 2793 <210> 16 <211> 929 <212> PRT <213> Artificial Sequence <220> <223> Synthetic sequence <400> 16 Met His His His His His His His His His His Gly Ser Ser Asn Asn 1 5 10 15 Asn Asn Asn Asn Asn Asn Asn Asn Gly Ser Met Glu Phe Val Asn Lys 20 25 30 Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly Val Asp Ile Ala Tyr Ile 35 40 45 Lys Ile Pro Asn Ala Gly Gln Met Gln Pro Val Lys Ala Phe Lys Ile 50 55 60 His Asn Lys Ile Trp Val Ile Pro Glu Arg Asp Thr Phe Thr Asn Pro 65 70 75 80 Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu Ala Lys Gln Val Pro Val 85 90 95 Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr Asp Asn Glu Lys Asp Asn 100 105 110 Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu Arg Ile Tyr Ser Thr Asp 115 120 125 Leu Gly Arg Met Leu Leu Thr Ser Ile Val Arg Gly Ile Pro Phe Trp 130 135 140 Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys Val Ile Asp Thr Asn Cys 145 150 155 160 Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr Arg Ser Glu Glu Leu Asn 165 170 175 Leu Val Ile Ile Gly Pro Ser Ala Asp Ile Ile Gln Phe Glu Cys Lys 180 185 190 Ser Phe Gly His Glu Val Leu Asn Leu Thr Arg Asn Gly Tyr Gly Ser 195 200 205 Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe Thr Phe Gly Phe Glu Glu 210 215 220 Ser Leu Glu Val Asp Thr Asn Pro Leu Leu Gly Ala Gly Lys Phe Ala 225 230 235 240 Thr Asp Pro Ala Val Thr Leu Ala His Glu Leu Ile His Ala Gly His 245 250 255 Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn Arg Val Phe Lys Val Asn 260 265 270 Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu Glu Val Ser Phe Glu Glu 275 280 285 Leu Arg Thr Phe Gly Gly His Asp Ala Lys Phe Ile Asp Ser Leu Gln 290 295 300 Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn Lys Phe Lys Asp Ile Ala 305 310 315 320 Ser Thr Leu Asn Lys Ala Lys Ser Ile Val Gly Thr Thr Ala Ser Leu 325 330 335 Gln Tyr Met Lys Asn Val Phe Lys Glu Lys Tyr Leu Leu Ser Glu Asp 340 345 350 Thr Ser Gly Lys Phe Ser Val Asp Lys Leu Lys Phe Asp Lys Leu Tyr 355 360 365 Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp Asn Phe Val Lys Phe Phe 370 375 380 Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn Phe Asp Lys Ala Val Phe 385 390 395 400 Lys Ile Asn Ile Val Pro Lys Val Asn Tyr Thr Ile Tyr Asp Gly Phe 405 410 415 Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn Phe Asn Gly Gln Asn Thr 420 425 430 Glu Ile Asn Asn Met Asn Phe Thr Lys Leu Lys Asn Phe Thr Gly Leu 435 440 445 Phe Glu Phe Tyr Lys Leu Leu Cys Val Asp Gly Ile Ile Thr Ser Lys 450 455 460 Thr Lys Ser Leu Ile Glu Gly Arg Asn Lys Ala Leu Asn Asp Leu Cys 465 470 475 480 Ile Lys Val Asn Asn Trp Asp Leu Phe Phe Ser Pro Ser Glu Asp Asn 485 490 495 Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu Ile Thr Ser Asp Thr Asn 500 505 510 Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu Asp Leu Ile Gln Gln Tyr 515 520 525 Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro Glu Asn Ile Ser Ile Glu 530 535 540 Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu Glu Leu Met Pro Asn Ile 545 550 555 560 Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu Leu Asp Lys Tyr Thr Met 565 570 575 Phe His Tyr Leu Arg Ala Gln Glu Phe Glu His Gly Lys Ser Arg Ile 580 585 590 Ala Leu Thr Asn Ser Val Asn Glu Ala Leu Leu Asn Pro Ser Arg Val 595 600 605 Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys Lys Val Asn Lys Ala Thr 610 615 620 Glu Ala Ala Met Phe Leu Gly Trp Val Glu Gln Leu Val Tyr Asp Phe 625 630 635 640 Thr Asp Glu Thr Ser Glu Val Ser Thr Thr Asp Lys Ile Ala Asp Ile 645 650 655 Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly Asn Met 660 665 670 Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu Ile Phe Ser Gly Ala Val 675 680 685 Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala Ile Pro Val Leu Gly Thr 690 695 700 Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys Val Leu Thr Val Gln Thr 705 710 715 720 Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu Lys Trp Asp Glu Val Tyr 725 730 735 Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys Val Asn Thr Gln Ile Asp 740 745 750 Leu Ile Arg Lys Lys Met Lys Glu Ala Leu Glu Asn Gln Ala Glu Ala 755 760 765 Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn Gln Tyr Thr Glu Glu Glu 770 775 780 Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp Leu Ser Ser Lys Leu Asn 785 790 795 800 Glu Ser Ile Asn Lys Ala Met Ile Asn Ile Asn Lys Phe Leu Asn Gln 805 810 815 Cys Ser Val Ser Tyr Leu Met Asn Ser Met Ile Pro Tyr Gly Val Lys 820 825 830 Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys Asp Ala Leu Leu Lys Tyr 835 840 845 Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly Gln Val Asp Arg Leu Lys 850 855 860 Asp Lys Val Asn Asn Thr Leu Ser Thr Asp Ile Pro Phe Gln Leu Ser 865 870 875 880 Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser Thr Cys Gly Gly Gly Gly 885 890 895 Ser Ile Glu Gly Arg Val Pro Leu Pro Ala Gly Gly Gly Thr Val Leu 900 905 910 Thr Lys Met Tyr Pro Cys Gly Asn His Trp Ala Val Gly His Leu Met 915 920 925 Gly

Claims

하기를 포함하는, 단일-쇄, 폴리펩티드 융합 단백질:
(a) 표적 세포의 엑소사이토시스 융합 기구(exocytic fusion apparatus)의 단백질을 절단(cleaving)할 수 있는 비-세포독성 프로테아제(protease);
(b) 표적 세포의 결합 부위에 결합할 수 있는 표적화 모이어티(targeting moiety)로서, 상기 결합 부위는 표적 세포 내 엔도좀(endosome)에 통합되어 엔도사이토시스(endocytosis)를 수행할 수 있는 것인 표적화 모이어티;
(c) 상기 프로테아제를 엔도좀 내로부터 엔도좀 막을 거쳐 표적 세포의 세포질로 전위시킬 수 있는 전위(translocation) 도메인;
(d) 상기 융합 단백질이 제 1 프로테아제에 의해 절단되는, 제 1 프로테아제 절단 부위로서, 상기 제 1 프로테아제 절단 부위(cleavage site)는 상기 비-세포독성 프로테아제와 상기 전위 도메인 사이에 위치하는 것인 제 1 프로테아제 절단 부위;
(e) 상기 융합 단백질이 제 2 프로테아제에 의해 절단되는, 제 2 프로테아제 절단 부위로서, 상기 제 2 프로테아제 절단 부위는 상기 전위 도메인과 상기 표적화 모이어티 사이에 위치하는 것인 제 2 프로테아제 절단 부위; 및
(f) 상기 표적화 모이어티와 상기 전위 도메인 사이의 공유결합으로서, 상기 제 2 프로테아제 절단 부위에서 단백질 분해에 의한 절단 후 상기 표적화 모이어티가 공유 결합에 의해 전위 도메인에 연결된 상태를 유지하는 것인 공유 결합.
청구항 1에 있어서, 상기 전위 도메인은 상기 비-세포독성 프로테아제와 상기 표적화 모이어티 사이에 위치하는 것인 융합 단백질.
청구항 1에 있어서, 상기 표적화 모이어티는 상기 비-세포독성 프로테아제와 상기 전위 도메인 사이에 위치하고; 상기 제 1 프로테아제 절단 부위는 또한 상기 비-세포독성 프로테아제와 상기 표적화 모이어티 사이에 위치하는 것인 융합 단백질.
선행하는 항 중 어느 한 항에 있어서, 상기 비-세포독성 프로테아제는 상기 단백질의 N-말단에 위치하는 것인 융합 단백질.
선행하는 항 중 어느 한 항에 있어서, 상기 공유 결합은 이황화 결합인 것인 융합 단백질.
선행하는 항 중 어느 한 항에 있어서, 상기 전위 도메인과 상기 표적화 모이어티 사이에 이차 폴리펩티드 구조를 제공하는 짧은 폴리펩티드가 위치하고, 및 상기 이차 폴리펩티드 구조는 상기 표적화 모이어티의 일부를 상기 전위 도메인에 인접하게 배치시키는 역할을 하고, 이에 의해, 상기 공유 결합의 형성이 에너지 측면에서 더 유리하게 되는 것인 융합 단백질.
선행하는 항 중 어느 한 항에 있어서, 상기 표적화 모이어티는 제 1 및 제 2 도메인을 포함하고, 및 상기 제 1 및 제 2 도메인은 10개 이하의 아미노산 잔기, 바람직하게는 5개 이하의 아미노산 잔기, 및 더욱 바람직하게는 0개의 아미노산 잔기에 의해 분리되는 것인 융합 단백질.
청구항 7에 있어서, 상기 표적화 모이어티의 제 1 및 제 2 도메인은 상이한 수용체의 리간드로부터 유래되는 것인 융합 단백질.
선행하는 항 중 어느 한 항에 있어서, 상기 표적화 모이어티는 상기 표적화 모이어티의 N-말단 도메인과 상기 결합 부위의 도메인 사이의 상호작용을 통해서 및 동시에 상기 표적화 모이어티의 C-말단 도메인과 상기 결합 부위의 도메인 사이의 상호작용을 통해 표적 세포의 결합 부위와 상호작용할 수 있는 것인 융합 단백질.
선행하는 항 중 어느 한 항에 있어서, 상기 표적화 모이어티는 하기의 군으로부터 선택되는 펩티드를 포함하거나 또는 그로 구성되는 것인 융합 단백질: 성선자극호르몬-분비 호르몬(gonadotropin-releasing hormone, GnRH) 펩티드, 오피오이드(opioid) 펩티드, 베타-엔돌핀(beta-endorphin) 펩티드, 브래디키닌(bradykinin) 펩티드, BAM 펩티드, 노시셉틴(nociceptin) 펩티드, 디놀핀(dynorphin) 펩티드, 갈라닌(galanin) 펩티드, 엔케팔린(enkephalin) 펩티드, P 물질(substance P) 펩티드, 코르티코트로핀-분비 인자(corticotrophin-releasing factor, CRF) 펩티드, 가스트린-분비 펩티드(gastrin-releasing peptide, GRP), 뉴로메딘 B(Neuromedin B) 펩티드, 봄베신(bombesin) 펩티드, 가스트린(gastrin) 펩티드, CCK 펩티드, 소마토스타틴(somatostatin, SST) 펩티드, 코르티스타틴(cortistatin, CST) 펩티드, 성장호르몬 분비 호르몬(growth hormone releasing hormone, GHRH) 펩티드, PAR 펩티드, 부갑상선 호르몬(parathyroid hormone, PTH) 펩티드, VIP(vasointestinal peptide), 베타₂ 아드레날린수용체 작용제 펩티드, 가스트린-분비 펩티드, 칼시토닌 유전자 관련 펩티드(calcitonin gene related peptide), 갑상선 자극 호르몬(thyroid stimulating hormone, TSH) 펩티드, 인슐린 펩티드, 인슐린-유사 성장 인자(insuline-like growth factor) 펩티드, 고나도렐린(gonadorelin) 펩티드, 코르티코트로핀 분비 호르몬(corticotrophin releasing hormone, CRH) 펩티드, 부신피질자극 호르몬(adrenocorticotropic hormone, ACTH) 펩티드, 뇌하수체 아데닐 사이클라제 활성화 펩티드(pituitary adenyl cyclase activating peptide, PACAP).
선행하는 항 중 어느 한 항에 있어서, 상기 비-세포독성 프로테아제와 제 1 프로테아제 절단 부위는 10개 이하의 아미노산 잔기, 바람직하게는 5개 이하의 아미노산 잔기, 및 더욱 바람직하게는 0개의 아미노산 잔기에 의해 분리되는 것인 융합 단백질.
선행하는 항 중 어느 한 항에 있어서, 상기 전위 도메인과 제 1 프로테아제 절단 부위는 10개 이하의 아미노산 잔기, 바람직하게는 5개 이하의 아미노산 잔기, 및 더욱 바람직하게는 0개의 아미노산 잔기에 의해 분리되는 것인 융합 단백질.
선행하는 항 중 어느 한 항에 있어서, 상기 전위 도메인과 제 2 프로테아제 절단 부위는 10개 이하의 아미노산 잔기, 바람직하게는 5개 이하의 아미노산 잔기, 및 더욱 바람직하게는 0개의 아미노산 잔기에 의해 분리되는 것인 융합 단백질.
선행하는 항 중 어느 한 항에 있어서, 상기 표적화 모이어티와 제 2 프로테아제 절단 부위는 10개 이하의 아미노산 잔기, 바람직하게는 5개 이하의 아미노산 잔기, 및 더욱 바람직하게는 0개의 아미노산 잔기에 의해 분리되는 것인 융합 단백질.
선행하는 항 중 어느 한 항에 있어서, 상기 제 1 프로테아제와 제 2 프로테아제는 동일한 것인 융합 단백질.
선행하는 항 중 어느 한 항에 있어서, 상기 비-세포독성 프로테아제는 클로스트리디움 신경독소 경쇄(L-chain) 또는 그의 단편인 것인 융합 단백질.
선행하는 항 중 어느 한 항에 있어서, 상기 전위 도메인은 클로스트리디움 신경독소 H_N 도메인 또는 그의 단편인 것인 융합 단백질.
선행하는 항 중 어느 한 항에 있어서, 상기 융합 단백질은 정제 태그(purification tag)를 포함하는 것인 융합 단백질.
선행하는 항 중 어느 한 항에 따른 폴리펩티드 융합 단백질을 코딩하는 핵산 서열.
프로모터, 청구항 19에 따른 핵산 서열, 및 터미네이터를 포함하고; 상기 핵산 서열은 상기 프로모터의 하류에 위치하고; 상기 터미네이터는 상기 핵산 서열의 하류에 위치하는 것인 DNA 벡터.
청구항 19에 따른 DNA 서열의 상보적 DNA 가닥.
숙주세포에서, 청구항 19에 따른 핵산 서열, 또는 청구항 17에 따른 DNA 벡터를 발현시키는 단계를 포함하는, 청구항 1 내지 18 중 어느 한 항에 따른 단일-쇄 폴리펩티드 융합 단백질을 제조하는 방법.
하기를 포함하는, 비-세포독성 작용제(agent)의 제조 방법:
a. 본 발명의 단일-쇄 폴리펩티드 융합 단백질을 포함하는 용액을 제공하는 단계;
b. 상기 용액에 제 1 프로테아제 절단 부위를 절단할 수 있는 제 1 프로테아제 및 제 2 프로테아제 절단 부위를 절단할 수 있는 제 2 프로테아제를 첨가하는 단계; 및
c. 상기 제 1 프로테아제 절단 부위 및 상기 제 2 프로테아제 절단 부위를 절단하여, 이에 의해 삼중-쇄 융합 단백질(tri-chain fusion protein)을 형성하는 단계.
청구항 23의 방법에 의해서 얻을 수 있는 비-세포독성 폴리펩티드로서, 상기 폴리펩티드는 삼중-쇄 폴리펩티드이고:
a. 제 1 쇄는 표적 세포의 엑소사이토시스 융합 기구의 단백질을 절단할 수 있는 비-세포독성 프로테아제를 포함하고;
b. 제 2 쇄는 엔도좀 내로부터 상기 비- 세포독성 프로테아제를 엔도좀 막을 거쳐 상기 표적 세포의 세포질 속으로 전위시킬 수 있는 전위 도메인을 포함하며;
c. 제 3 쇄는 상기 표적 세포의 결합 부위에 결합할 수 있는 표적화 모이어티를 포함하고, 상기 결합 부위는 상기 표적 세포 내 엔도좀에 통합되어 엔도사이토시스를 수행할 수 있고;
d. 상기 제 1 및 제 2 쇄는 서로 이황화 결합으로 연결되고; 및 제 2 및 제 3 도메인은 공유 결합에 의해 서로 연결되는 것인 비-세포독성 폴리펩티드.
질병(medical condition)의 치료, 예방 또는 개선에 이용하기 위한, 청구항 1 내지 18 중 어느 한 항에 따른 단일-쇄 폴리펩티드 융합 단백질 또는 청구항 24에 따른 비-세포독성 폴리펩티드.
청구항 25에 있어서, 상기 의학적 상태는 통증, (만성) 신경성 염증, 과민성 방광과 같은 비뇨생식기-신경학적 상태, 전립선암, 폐암, 유방암, 또는 대장암(colorectal cancer)으로부터 선택되는 것인, 단일-쇄 폴리펩티드 융합 단백질 또는 비-세포독성 폴리펩티드.