KR20070104605A

KR20070104605A - 이황화 가교된 이쇄형 단백질의 재조합 발현

Info

Publication number: KR20070104605A
Application number: KR1020077018752A
Authority: KR
Inventors: 볼카 슈페흐트
Original assignee: 바이오테콘 쎄라퓨틱스 게엠베하
Priority date: 2005-01-21
Filing date: 2006-01-20
Publication date: 2007-10-26
Also published as: DE102005002978B4; IL184112A0; JP2008527983A; DK1844150T3; CN103320459A; AU2006207726A1; JP2012254088A; US20080103098A1; CN101107361A; DE102005002978A1; CN101107361B; BRPI0606612A2; EP1844150A2; RU2007127624A; JP5107055B2; DE112006000677A5; RU2412253C2; CA2593520C; ES2380677T3; ATE546533T1

Abstract

본 발명은 대장균 숙주세포에서 재조합 발현으로 이쇄형의 폴리펩티드 또는 단백질을 제조하는 방법에 관한 것으로, 상기 방법에서 (i) 상기 폴리펩티드 또는 단백질은 이쇄 폴리펩티드 또는 단백질로서 그 생물학적 활성을 나타내고, (ii) 제1 사슬의 C-말단 아미노산 그룹은 Arg 또는 Lys 그룹이고, (iii) 상기 단백질 또는 폴리펩티드의 제2 사슬은 N-말단에 1 내지 20 아미노산 그룹 및 PRS로 지칭되는 펜타펩티드 서열 VPXGS을 가지며, 이때 X는 모든 자연 발생 아미노산일 수 있으며, V는 Val, Leu, Ile, Ala, Phe, Pro 또는 Gly이며, P는 Pro, Leu, Ile, Ala, Phe, Val 또는 Gly이며, G는 Gly, Leu, Ile, Ala, Pro, Phe 또는 Val이며, S는 Ser, Tyr, Trp, 또는 Thr이다; 및 (iv) 상기 방법은 (a) 폴리펩티드 또는 단백질이 그 루프 영역내에 VPXGS 서열(X, V, P, G, 및 S 는 상기에서 정의된 바와 동일하다)을 갖도록, 핵산 수준에서 폴리펩티드 또는 단백질을 변경하는 단계; (b) 상기 핵산 수준에서 변경된 구조체를 대장균 세포에 삽입하는 단계; (c) 숙주 세포를 배양하고 이후 용해시키는 단계; 및 (d) 이황화 가교된 이쇄 펩티드 또는 단백질을 분리하는 단계를 포함한다. 본 발명의 바람직한 구현예에 따르면, 상기 폴리펩티드 또는 단백질은 보툴리늄 신경 독소, 특히 보툴리늄 신경 독소 타입 A(BoNT(A))이다.

대장균 숙주세포, 재조합 발현, 이쇄 형태, 폴리펩티드 또는 단백질

Description

이황화 가교된 이쇄형 단백질의 재조합 발현{RECOMBINANT EXPRESSION OF PROTEINS IN A DISULFIDE-BRIDGED, TWO-CHAIN FORM}

본 발명은 대장균 숙주 세포에서의 재조합 발현에 의해 이쇄형(dichain form)의 단백질을 제조하는 방법에 관한 것이다. 본 발명은 또한 상기 방법으로 제조될 수 있는 생물학적으로 활성이며 이쇄형의 단백질 또는 폴리펩티드에 관한 것이다.

본 발명의 중요한 장점은 본 발명에 따른 기술적 특징을 나타내지 않는 재조합 단백질 또는 폴리펩티드에 비교하여 볼 때, 폴리펩티드 사슬의 표적 절단을 위해 특정 프로테아제로 처리할 필요가 없어 제조 방법이 매우 간단하다는 것이다. 본 발명의 추가적인 면은 본 발명에 따른 폴리펩티드 또는 단백질을 코드하는 핵산; 상기 핵산 또는 핵산 서열을 포함하는 벡터; 상기 벡터를 포함하는 숙주 세포; 및, 생물학적으로 활성인 이쇄 프로테인/폴리펩티드를 포함하는 약학적 제제에 관한 것이다.

클로스트리듐 신경독소(Clostridial neurotoxin)는 신경세포에서 칼슘-의존성 신경전달체 분비의 강력한 억제제이다. 예를 들어 상한 음식 등을 통해 보툴리늄 독소(BoNT)가 경구로 흡수되면, 다양한 근육의 마비를 특징으로 하는 보툴리즘 이라 지칭되는 임상 증상이 나타난다. 호흡근의 마비는 최종적으로 감염된 사람의 치사까지 이르게 한다. 이와 관련하여 신경에서 근육으로의 신호 전달은 근수용기(myoceptor)에서 차단되는데, 운동 신경이 더 이상 아세틸콜린을 분비하지 않기 때문이다. 보툴리늄 신경독소는 SNARE 단백질로 지칭되는 분비과정에 참여하는 단백질을 단백분해성 절단함으로써 억제작용을 나타낸다. 상이한 혈청형의 신경독소는 SNARE 단백질에 대해 상이한 특이성 및 상이한 각 아미노산 서열에서의 절단 부위를 갖는다. BoNT(A) 및 BoNT(E)는 SNARE 단백질 SNAP-25을 절단하는 반면, BoNT(C)는 SNAP-25 뿐만 아니라 신탁신-1(syntaxin-1)도 기질로서 인식한다. 또한, 혈청형 B, D, F, 및 G 독소와 파상풍 독소(TeNT)는 VAMP-2(시나프로브래빈-2;synaprobrevin-2)를 절단한다(Schiavo 등., 1997).

클로스트리듐성 신경독소는 가장 강력한 공지 독소이다. 예를 들면, 쥐에 정맥주사시, 단지 5pg으로 투여된 모든 쥐 중 반을 치사시킬 수 있다. 대부분의 혈청형 독소가 경구 투여시에도 독성을 나타내는데, 이는 복합체 단백질(complex protein)이 형성되고, 이 복합체 단백질에 독소가 끼어져, 위장관을 통과할 때 독소가 소화 효소에 의해 분해되는 것을 막기 때문이다. 이들은 또한 독소가 소장 상피세포로 재흡수되는 데 있어서도 일정 기능을 발휘한다(Fujinaga, 1997).

과거 수십년간, 혈청형 A 및 B의 보툴리늄 독소가 치료적 효과가 있음이 밝혀졌다. 예를 들어, 아주 최소량의 표적 주사에 의해 만성 경련을 일으키는 개별 근육을 이완시키는 것이 가능하다. 특히 장점은 효과가 장기간 지속 되는 것인데, 예를 들면 BoNT(A) 및 BoNT(B)은 3개월 이상 6개월까지 효과가 지속 된다. 제1적응 증은 사경(torticollia), 눈꺼풀연축(blepharospasm) 및 사시(strabism)와 같은 근육긴장이상(dystonia)이며; 다한증(hyperhidrosis) 또는 주름완화를 위한 미용적 처치법 등이 부가되었다. 치료제로서 보툴리늄 독소에 대한 시장은 급속하게 성장하고 있는데, 이는 추가적인 적응증의 개발에 기인한 것이라기보다 이미 존재하는 적응증을 보다 광범위하게 사용한 덕택이었다. 이와 관련하여, 신경독소의 성질을 활성 지속, 역가 및 항원 잠재성 등에 관해 개선시키고자 하는 시도가 있다. 테스트결과, 시판되고 있는 제제(BoNT(A)제제로서, Allergen and Dysport 및 Ipsen-Beaufort에서 입수가능한 BOTOX, 및 BoNT(B)제제로서, Elan에서 입수가능한 Myobloc/Neurobloc)에 포함되어 있는 복합체 단백질은 활성 지속이나 역가에서 긍정적인 효과를 나타내지 않았고, 또한 동일한 활성을 갖는 순수 신경독소 제제에 비하여 단백질 함량이 더 높기 때문에 환자에서 면역반응을 촉발하여 더 이상의 주입이 효과가 없게 된다는 것이 밝혀졌다.

상기 복합체 단백질은 활성 성분 제형으로 부합되지 않고, 더구나 불리한 영향을 미치며, 신경독소의 성질을 개선하기 위한 어떤 변경은 오직 유전공학기술을 통해서만 달성될 수 있으므로, 신경독소를 재조합 발현, 예를 들어 대장균내에서의 발현으로 제조할 필요가 크다(이러한 방식으로 생성된 신경독소는 전술된 복합체 단백질이 없다). 보툴리늄 독소가 상이한 세포 특이성을 갖게 된다는 점에서 새로운 적응증이 개발될 수 있다. 관련하여, 재조합 독소 또는 독소 유도체를 통한 경로 또한 바람직하다.

보툴리늄 독소와 파상풍 독소는 그 아미노산 서열에 있어서 높은 상동성을 나타내며, 특히 그 도메인 구조가 유사하다. 이들은 수용체 결합 도메인(Hc), 전좌 도메인(H_N), 및 신경 세포에서 대응하는 SNARE 단백질을 절단하는 촉매 서브유닛(L)으로 구성된다. Hc는 신경독소의 근수용기에 대한 특이적 결합을 담당하며, 전좌 도메인(transslocation domain)은 L이 엔도좀에서 뉴런의 세포질로 확실하게 통과할 수 있게 한다. H_N (N-말단) 및 Hc(C-말단)은 100 kDa의 중쇄를 형성하며, 반면 L은 50 kDa의 경쇄 촉매 서브유닛을 형성한다. 두 폴리펩티드 사슬은 이황화 결합으로 연결된다. 참여 시스테인 잔기 사이에, 링커 영역 또는 루프 영역(링커 서열 또는 루프 서열과 동의어이며, 간단하게 링커 또는 루프로 지칭된다)이 있으며, 이들 영역의 길이는 보툴리늄 독소의 개별적 혈청형에 따라 매우 다양하다. 세포 용해 과정 중 클로스트리아에서 독소가 방출되는 마지막 순간에, 현재까지도 그 특성이 제대로 규명되지 않은 클로스트리듐 엔도펩티다제에 의해 상기 루프가 절단되며, 절단 및 미절단 종간의 비율은 각 혈청형에 따라 다양하다. 신경독소의 활성을 위해서는 상기 루프가 절단되어 이쇄 독소가 되는 것이 필수적이다(Schiavo 등., 1997). 예를 들면, 보툴리늄 신경독소 A의 경우, 루프, 즉 루프 서열 VRGIITSKTKSLDKGYNKALNDL로부터 데카펩티드가 절단되며, 이는 N-말단 및 C-말단에 서로 인접하는 시스테인 잔기를 가지며, 오직 하나의 펩티드 결합이 절단되는 것이 아니라 두개의 단백분해성 전달이 일어난다. 따라서, 생물학적으로 활성인 보툴리늄 신경독소 A는 원래의 클로스트리듐에서 번역된 독소에 비하여 자연적으로 더 낮은 분자량을 갖는다.

클로스트리듐성 프로테아제는 대장균과 같은 다른 숙주 유기체에는 존재하지 않기 때문에, 재조합 보툴리늄 독소 및 그 단편 또는 유도체는 다른 숙주 유기체에서 단쇄 펩티드로서 발현된다. 이는 이쇄 단백질일때 정상적인 생물학적/생화학적 활성을 나타내는 다른 모든 단백질도 그러하다: 통상, 이러한 단백질은 단쇄 단백질로서 재조합 DNA 기술에 의해 얻어지며, 따라서, 이쇄 단백질로서 자연적으로 나타내는 생물학적/생화학적 활성은 거의 없거나 아예 나타나지 않는다.

활성 단백질, 특히 활성 보툴리늄 독소를 만들기 위해서는 트롬빈, Xa AA 인자, 또는 게네나제(genenase)와 같은 서열-특이적 프로테아제를 위한 인식 서열의 삽입이 과거에는 필수적이었으며, 이로써 정제후, 절단 및 엔도프로테아제의 첨가에 의한 활성화가 수행될 수 있었다. 이러한 엔도프로테아제의 사용은 본질적으로 다음 두가지의 문제점이 있는데:하나는 유전공학적 방법에 의해 부가된 절단 부위이외에 다른 부차적인 절단 부위가 아미노산 서열내에 존재할 가능성을 배제할 수 없다는 것이다. 이 부차적 절단 부위에서의 절단이 상당히 비효율적으로 이루어지는 경우에도, 프로테아제 처리후, 독소의 상이한 절단 변이체 혼합물이 생성되어 그 분리가 매우 어려울 수 있다. 다른 하나는 약학적 제제의 경우 약사법상(등록을 고려) 매우 불리하다는 것인데, 제제에 후속하여 단백질을 가하거나 다른 부가적인 단백질과 접촉시키는 것은 이들 단백질의 완전한 제거나, 이후 프로세싱에서 임의로 존재하는 오염물질의 완전한 제거를 증명하여야 하므로 심각한 단점이 되며; 이는 일반적으로 상당한 경비 지출을 요구한다.

또한 다른 박테리아성 독소, 예를 들면 슈도모나스 외독소 또는 디프테리아 독소의 경우에도 효소 도메인이 독소 활성을 나타내기 위하여 이황화 가교된 이쇄 폴리펩티드로의 단백분해성 절단에 의한 활성화가 요구된다(예를 들면, 신장인자의 ADP 리보실화 및 단백질 합성의 억제). 이러한 독소들은 특히 암 치료에 사용되는 소위 면역독소를 제조하는데 사용된다. 이러한 목적을 달성하기 위하여 이들 독소의 세포 결합 도메인은 암-특이적 표면 단백질(분화 항원 또는 암-수반 항원)에 높은 결합 친화력을 가진 단백질 도메인으로 교환된다. 전형적인 면역독소에서 이들 단백질 도메인은 단클론 항체 또는 그 단편으로 구성되며, 특정 암세포에 대한 특이성은 또한 예를 들면, 시토킨, 성장인자, 아필린(affilins) 안키린 반복 단백질(ankyrin repeat protein) 또는 안티칼린(anticalins) 패밀리 등의 돌연변이성의 선택된 단백질 등에 의해 부여된다. 이러한 융합 단백질의 재조합 발현에서, 단쇄 폴리펩티드가 수득된다. 예를 들면 라이신(ricin)은 라이시누스 콤뮤니스(Ricinus communis)를 제외하고는 프로테아제에 대한 프로세싱 부위가 없으며, 이러한 부위는 반드시 삽입되어야 하며, 면역 독소의 구성성분으로서 디프테리아 독소 단편 및 슈도모나스 외독소 단편은 엔도조말 컴파트먼트에서 내재화된 후 표적 세포의 프로테아제에 의하여 절단될 수 있다. 이는 이황화 가교를 형성하는 시스테인 잔기 사이의 루프 부위에서 행해진다. 그러나, 오직 최소한의 부분만이 이러한 과정을 거치며, 모든 내재화된 면역 독소 분자가 이러한 방식으로 프로세싱되는 것은 아니다(Ogata 등., 1990).

재조합 단백질, 특히 더 작은 폴리펩티드를 충분한 양으로 그리고 가용성 형태로 얻기 위해서는, 많은 경우 이들을 예를 들면, 대장균의 글루타티온-S-트랜스 퍼라제(GST) 또는 말토스 결합단백질(MBP)과의 융합 단백질 또는 혼성 단백질로서 발현시켜야 한다. 또한, 시중의 수많은 발현 시스템은 친화성 정제(affinity purification)를 위해 목적 폴리펩티드가 N-말단 태그 또는 C-말단 태그, 예를 들면, His 태그, Strep 태그 또는 FLAG 태그 등으로 발현되어 있다. 많은 경우, 발현 플라스미드에는 목적 단백질을 코딩하는 DNA 서열이 삽입되는 복수 클로닝 부위 사이에 프로테아제 인식 서열 및 융합 파트너 또는 친화성 태그에 대한 코딩 서열이 있다. 이 서열은 융합 단백질의 발현 및 정제 후 적합한 서열-특이적 엔도프로테아제(예를 들면, 트롬빈, Xa 인자, 또는 게네나제)의 추가에 의해 목적 단백질을 부가적 펩티드 부위로부터 분리할 수 있도록 디자인되어 있다. 만약 두 융합 파트너가 펩티드 결합 대신 이황화 가교로 서로 공유적으로 결합되어 있다면, 정제후 β-머캅토에탄올, DTT, 또는 환원 글루타티온과 같은 티올-함유 물질로 간단한 환원에 의해 서로로부터 분리가 가능할 것이다. 예를 들어, 친화성 태그는 매트릭스에 결합되어 있고, 반면 목적 단백질은 친화성 매트릭스, 예를 들면, Ni-NTA 아가로스 또는 StrepTactin 세파로스로부터 전술한 환원 물질로 용출될 수 있다. 따라서, 친화성 태그 또는 가해진 엔도프로테아제를 분리하는 이후의 정제 단계는 생략될 수 있다.

따라서, 일반적인 단백질 또는 폴리펩티드, 특히 신경독소의 단백질 또는 폴리펩티드 및 그 단편 또는 유도체, 및 융합 단백질 또는 혼성 단백질(hybrid protein), 특히 숙주 세포의 용해후 생물학적으로 활성이며 이황화 가교된 이쇄 구조로 존재하는 면역 독소의 융합 단백질 또는 혼성 단백질의 재조합 발현 방법을 제공하는 것은 바람직하다. 이러한 단백질 및 폴리펩티드를 제조하는 방법이 이하에서 제공된다.

놀랍게도, 본 발명자들은 재조합 발현에 의해 단쇄로 수득되나, 그 정상적인 생물학적 또는 생화학적 활성은 이황화 가교 이쇄형이 나타내는 BoNT(A)의 LH_N 단편, 및 완전 신경독소 A 양자 모두가, LH_N 단편 또는 완전 독소에 바람직하게는 핵산 수준에서 적어도 하나의 특정 변경을 시행하는 경우, 이쇄형으로 재조합 발현에 의해 수득될 수 있음을 발견하였다. 본 발명자에 의해 행해진 후속 테스트에서, 통상적인 재조합 방법에서 단쇄로서 얻어지나 그 생물학적 활성은 이황화 가교된 이쇄 형태에서 나타내는 모든 다른 단백질 또는 폴리펩티드에도 동일하게 적용됨을 확인하였다.

전술한 "적어도 하나의 변경"은 BoNT(A) 또는 BoNT(A)의 LH_N 단편의 경우에는 본 명세서에서 PRS(프로테아제 인식 부위)로 지칭되는 펜타펩티드 서열의 삽입을 의미한다. 일반적인 단백질 또는 폴리펩티드의 경우, 변경될(바람직하게는 핵산 수준에서)단백질 또는 폴리펩티드에 존재하는 펜타펩티드 서열을 이미 존재하는 서열내로 삽입될 펜타펩티드 서열 PRS과 매치되도록 변경될 수 있다(예를 들면, PRS의 아미노산 잔기의 삽입 또는 적어도 하나의 아미노산 잔기의 교환 또는 아미노산 잔기의 삭제에 의해서). 동일하게, 헥사/헵타/옥타(등) 펩티드 서열은 하나,두개, 세개 또는 여러개의 아미노산 잔기의 삭제하면서, 또는 삭제없이 삽입될 수 있다. 본 발명에 따라, 최종적으로 발현된 폴리펩티드가 루프 영역에 PRS(펜타펩티드)서열을 갖는 것은 유리하며, 상기 루프 영역은 본 발명에서 이황화 가교에 참여하는 두개의 시스테인 잔기사이에 위치되는 아미노산 서열로 정의된다. 이 PRS 서열이 루프 영역에 존재할 때, 폴리펩티드 서열 PRS(아미노산 수준에서)에 인접하는 단쇄 폴리펩티드의 절단은 두 상이한 사슬에 천연적으로 존재하는 서열을 두개의 상이한 사슬로 분배하는 결과를 초래한다. 보툴리늄 신경 독소 A(BoNT(A))에서, PRS 서열은 바람직하게는 BoNT(A)의 펩타펩티드 Asp₄₄₃ - Asn₄₄₇을 삭제시키고(도 3-1 참조) 루프내로 삽입한다. 다른 단백질 또는 폴리펩티드(예를 들면, BoNT(B), BoNT(C1), BoNT(D), BoNT(E)의 경우, 라이신의 경우, 슈도모나스 외독소의 PE40의 경우, 디프테리아 독소(DT)의 경우)에는, BoNT(A)의 변경된 루프를 루프 서열내로 삽입하는 것이 바람직하며(도 3-2 내지 3-5 참조), 이때 천연 루프 서열의 아미노산 잔기는 삭제될 수도 있고, 아닐 수도 있다. 도 3-2 내지 3-5 에서의 변경된 루프 서열은 두개의 말단 Cys 잔기가 없는 서열로서, PRS 서열의 중심 아미노산은 R, Y, H, 또는 Q 뿐 아니라 어떤 다른 자연 발생 아미노산일 수 있다. 전술한 기타 단백질 또는 폴리펩티드의 경우, 특히 BoNT(A)의 변경된 루프의 일부분만을, 특히 서열 GIITSKTKSLVPXGSKALNDL (X = 자연 발생 아미노산), 을 삽입시키는 것이 바람직하며, 이때 천연 루프 서열의 아미노산 잔기는 삭제될 수도 있고, 아닐 수도 있다. 도 3-2 내지 3-5 의 변경된 루프 서열은 두 말단 Cys 잔기가 없는 서열이다.

BoNT(A)의 LH_N 단편 또는 완전 재조합 독소에 있어서, 서열 변경은 L 및 H_N 사이의 루프 영역의 변화를 의미하고, 이러한 변화는 PRS 서열을 제공하는 것이다. 본 발명에 따르면, PRS 서열은, BoNT(A)에 대해서만으로 제한되지 않으며, 펜타펩티드 서열 Val-Pro-Xaa-Gly-Ser이다. Xaa은 모든 자연 발생적 아미노산을 의미한다. Xaa가 Arg 또는 기타 다른 자연 발생 아미노산이든 관계없이, 펜타펩티드 서열 Val-Pro-Xaa-Gly-Ser은 어떤 경우에서든 펜타펩티드 서열로서 지칭된다. 그러나 PRS 서열의 네개의 다른 아미노산 잔기 중 하나가 변경되면, 실제 본 발명의 내용 내에서 가능한데, 특히, 상응하는 친수성/소수성 또는 극성 단일극성 잔기로 변경되면, 이들은 본 발명에서 PRS-펜타펩티드 서열의 변이체로 지칭된다. 변이체는 예를 들면, Val이 Leu, Ile, Ala, Phe, Pro, 또는 Gly으로 대체되는 경우 존재한다. 또한 변이체는 N-말단에서 볼때 PRS의 2번째 위치의 proline이 Leu, Ile, Ala, Phe, Val, 또는 Gly으로 대체될 때 존재한다. 또한 PRS의 4번째 위치의 glycine이 Leu, Ile, Ala, Pro, Phe, 또는 Val으로 대체될 때, 이는 다른 변이체를 초래한다. PRS의 5번째 위치의 serine이 예를 들면 Tyr, Trp, Thr, 임의로 Cys, 또는 Met로 대체될 때, 새로운 형태의 변이체가 만들어진다. 본 발명에 따르면, 적어도 PRS 서열 중 1, 2, 4, 및 5 중 한 위치에 Val-1, Pro-2, Gly-4, 및/또는 Ser-5 과 상이한 아미노산 잔기를 함유하는 서열은 상기 펜타펩티드 서열의 변이체로 지칭된다.

BoNT(A)의 LH_N 단편(또는 완전 재조합 독소) 또는, 재조합 발현으로 통상 단쇄 단백질 또는 폴리펩티드로서 수득되나 (오직) 이쇄형에서 생물학적으로 활성인 어떤 다른 단백질 또는 폴리펩티드가 펜타펩티드 서열 Val-Pro-Xaa-Gly-Ser(여기에서, Xaa는 20개의 자연 발생 아미노산 중 하나이며, 4개의 다른 아미노산은 전술한 바와 같은 의미에 따라 대체될 수 있다)을 포함하는 경우, 대장균 숙주 세포의 용해물내에서 이쇄형으로 존재하며(예를 들어, 대장균 K12, 특히 M15[pREP4], XL1-BLUE 또는 UT5600 균주의 대장균 K12 숙주 세포), BoNT(A)의 경우 경쇄는 H_N에 또는 완전 중쇄에 이황화 가교를 통해 공유적으로 결합되어 있다(도 7 참조). 모든 세포의 용해후 직접, 또는 세포 용해물을 몇시간 인큐베이션 한 후 실질적으로 전부 상기 폴리펍티드 사슬의 절단이 실현된다. 독소 또는 독소 단편의 프로테아제 도메인의 활성에 의한 자가-단백질분해는 배제될 수 있는데, 루프 영역에 따라 변경된 프로테아제-불활성 돌연변이주가 발현되고 대장균 숙주 세포의 분해후 이쇄 구조내에 존재하기 때문이다. 명백하게, 대장균 숙주 균주의 프로테아제가 PRS 펜타펩티드 서열의 절단을 담당한다.

전술한 "놀랍게도, 본 발명자들은.."의 문단에 따른 바람직한 변경은 PRS 서열의 N-말단(펜타펩티드 PRS 서열의 발린 잔기에 바로 인접하여 위치하는 N-말단 방향의 아미노산, 도 3-2 내지 도 3-5의 경우에는 PRS 서열에서 1개의 아미노산 잔기 간격을 갖는 루이신 잔기)이 1 내지 20 아미노산 잔기의 간격에서, 특히 3 내지 15 아미노산 잔기 간격, 특별히 3 내지 10 아미노산 잔기, 특히 바람직하게는 3 내지 8 아미노산 잔기 간격에서, 보다 바람직하게는 3 아미노산 잔기 간격에서, 기초 아미노산 잔기, 바람직하게는 라이신 잔기 또는 아르기닌 잔기가 존재하고, 그 C- 말단에서 대장균 숙주 세포의 프로테아제가 루프 서열을 절단하는 데 있다. 절단 후, 이렇게 수득 되는 폴리펩티드는 PRS 서열의 발린 잔기에서 예를 들면 두 아미노산 잔기(상기 정의된 간격이 3 아미노산 잔기인 경우)-말단를 가진다. 이 경우, "변경"은 반드시 사전적 의미의 변경, 즉 아미노산 잔기의 삽입이나 치환을 의미할 필요는 없고, PRS 서열의 N-말단에 후속하여 앞서 정의된 1 내지 20 아미노산 잔기의 간격에서 기초 아미노산 잔기(예를 들면, 라이신 잔기)가 위치해 있으면 된다. 중요한 것은 기초 아미노산 잔기(라이신 잔기 또는 아르기닌 잔기와 같은)가 앞서 언급한 간격을 두고 PRS 서열의 N-말단쪽에 존재한다는 것이다.

바람직한 다른 변경은, 대장균 숙주 세포의 프로테아제가 절단하는 루프 서열이 적어도 9개의 아미노산 잔기 길이를 갖는다는 것이다. 루프 서열의 길이는 바람직하게는 최소한 12, 최소한 15, 최소한 18, 최소한 20, 및 최소한 23 아미노산 잔기이다. 특히 바람직한 루프 서열의 길이는 15 내지 22, 특히 18 내지 22 아미노산 잔기이다.

본 발명에 따른 방법은 매우 일반적인 용어로 대장균 숙주세포에서 재조합 발현에 의해 두사슬이 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질을 제조하는 방법으로서, (i) 상기 폴리펩티드 또는 단백질은 이황화 가교 이쇄 폴리펩티드 또는 단백질로서 그 생물학적 활성을 나타내고; (ii) 제1 사슬의 C-말단 아미노산 잔기는 Arg 잔기 또는 Lys 잔기이고; (iii) 상기 단백질 또는 폴리펩티드의 제2 사슬은 N-말단 1 내지 20 아미노산 잔기로서 시스테인 잔기의 N-말단 및 PRS로 지칭되는 펜타펩티드 서열 VPXGS을 가지며, 이때 X는 어떤 자연 발생 아미노산(any naturally occurring amino acid)이어도 되며, V는 Val, Leu, Ile, Ala, Phe, Pro 또는 Gly이며, P는 Pro, Leu, Ile, Ala, Phe, Val 또는 Gly이며, G는 Gly, Leu, Ile, Ala, Pro, Phe 또는 Val이며, S 는 Ser, Tyr, Trp, 또는 Thr이다; 및 (iv) 상기 방법은 하기 단계를 포함하는 바: (a) 변경된 형태의 폴리펩티드 또는 단백질이 그 루프 영역내에 전술한 펜타펩티드 서열(VPXGS)을 갖도록, 폴리펩티드 또는 단백질을 핵산 수준에서 변경하는 단계; (b) 상기 핵산 수준에서 변경된 구조체(construct)를 대장균 세포에 삽입하는 단계; (c) 숙주 세포를 배양하고 이후 용해시키는 단계; 및 (d) 이쇄 펩티드 또는 단백질을 분리하는 단계를 포함한다.

본 발명에 따르면, 단백질 또는 폴리펩티드의 제1 사슬은 바람직하게는 대응하는 DNA의 N-말단에 의해 코딩되는 사슬이고, 따라서 단백질 또는 폴리펩티드의 제2 사슬은 대응하는 DNA의 C-말단에 의해 코딩되는 사슬이다. 5'-DNA-3'의 발현이 N-폴리펩티드-C로 귀결되기 때문에, 전술한 본 발명의 바람직한 경우에서, 이는 상기 발현이 다음과 같이 대표될 수 있음을 의미한다: 5'-DNA-3'은 N-제1 폴리펩티드 사슬-C-루프-N-제2 폴리펩티드 사슬-C로 발현된다. 본 발명에 따라, 상기 루프는 이미 인 시투 절단되고 최종적으로 본 발명에 따른 폴리펩티드 또는 단백질 N-제1 폴리펩티드 사슬-C-N-제2 폴리펩티드 사슬-C가 이쇄 구조로 얻어진다.

본 발명에서 "상기 단백질 또는 폴리펩티드의 제2 사슬은 N-말단 1 내지 20 아미노산 잔기로서 시스테인 잔기의 N-말단 및 PRS로 지칭되는 펜타펩티드 서열 VPXGS을 가지며"는 N-말단이 예를 들어 펜타펩티드 서열 VPXGS의 발린 잔기가 아니라, 다른 (어떤) 아미노산 잔기인 것을 의미한다. 이 다른 (어떤) 아미노산 잔기와 PRS의 발린 잔기 사이에는, 1 내지 19 아미노산 잔기가 더 위치될 수 있으며, N-말단 아미노산 잔기는 작접적으로, 예를 들어 발린 잔기에 펩티드 결합에 의해 결합할 수 있고, PRS의 발린 잔기의 인접하는 이웃이 될 수 있다.

본 발명에 따른 그 (생물학적으로) 활성인 이쇄 구조로서 분리될 수 있는 단백질 또는 폴리펩티드는 제1 사슬의 C-말단이 기초 아미노산 잔기, 특히, Arg 잔기 또는 Lys 잔기이고, 그 제2 사슬은 1 내지 20 아미노산 잔기 및 PRS로 지칭되는 펜타펩티드 서열 VPXGS 서열(여기에서 X, V, P, G, 및 S 는 상기에서 정의된 바와 동일하다)을 갖는 N-말단을 구비한다.

본 발명에 따르면, 재조합 라이신(ricin)에 기초한 면역 독소의 경우, 예를 들어 그 활성화를 위해 트롬빈, Xa 인자와 같은 서열 특이적 프로테아제로 처리하는 것은 구식이다. 예를 들면, 디프테리아 독소 또는 슈도모나스 독소에 기초한 면역 독소의 경우 효율의 상당한 증가가 기대되었고, 실제 얻어졌으며, 이는 독소의 효소 도메인의 세포질로의 전좌를 위한 속도-결정 단계로서 표적 세포의 프로테아제에 의한 프로세싱이 더 이상 요구되지 않기 때문이다. 이미 이황화 가교 이쇄 폴리펩티드로서 존재하는 면역 독소는 소량으로 적용될 수 있으며, 여전히 동일한 세포-독성 활성을 제공한다. 이는 한편으로는 치료 경비를 저하시키고, 다른 한편으로는 면역 독소의 추가 적용시 불활성을 유발하는 항체 형성의 위험을 저하시킨다. 따라서 본 발명은 이황화 가교된 이쇄 및 활성화된 면역 독소를 제조하는 방법을 제공한다.

본 발명에 따라 제공된 방법에 의해, 이쇄 형태의 융합 단백질 또는 혼성 단백질, 즉 친화성 정제에 대한 펩티드 태그를 갖는 단백질 등을 제조할 수 있으며, 이 단백질들에서 두 폴리펩티드 사슬은 이황화 가교로 공유결합되어 있으며, 친화 크로마토그래피 또는 다른 정제 방법 후에 β-머캅토에탄올, DTT, 또는 환원 글루타티온과 같은 티올-함유 물질로 간단한 환원에 의해 분리할 수 있다.

M15[pREP4] 또는 BL21(DE3)와 같은 대장균 발현 균주에서의 클로스티리듐 신경독소 및 그 단편(예를 들면, LH_N 단편 또는 개질된 세포 특이성을 갖는 클로스티리듐 신경 독소의 유도체)의 재조합 발현은 단쇄 폴리펩티드를 생산한다. 이들 폴리펩티드를 트립신으로 처리함으로써, 프로테아제 도메인의 전좌 도메인에로의 전이 영역내의 루프 서열 영역에서 절단이 일어난다. 트립신은 서열 특이적 프로테아제가 아니기 때문에, 통상 원하지 않는 폴리펩티드의 다른 영역에서의 절단이 일어날 수 있다. 예를 들면, BoNT(A)는 가해진 트립신에 의해 H_N 및 H_C 사이에서 절단되고, LH_N 단편 및 H_C 단편 이쇄가 제조될 수 있다. 대부분의 경우에서 원하는 루프영역에서의 선택적인 절단을 보증하기 위하여, 특이적 엔도프로테아제를 위한 인식 서열의 존재(임의적으로 삽입에 의해)가 요구된다.

트롬빈, Xa 인자, 게네나제 등과 같은 서열 특이적 엔도프로테아제에 의한 재조합 융합 단백질/혼성 단백질의 재조합 절단은 일반적으로 알려진 범위의 방법에 속한다. 정제후, 재조합 단백질 또는 폴리펩티드에 개선된 용해성 및/또는 개선된 발현을 부여하거나, 친화성 정제를 위한 펩티드 태그로서 기능하는 융합 파트너를 분리할 수 있다. 이를 위하여, 단백질 용액은 용해 형태 또는 매트릭스 상에 고정화된 형태의 적합한 엔도프로테아제와 인큐베이션한다.

상기 기술은 또한 이쇄 단백질 또는 폴리펩티드로서 그 정상적인 생물학적/생화학적 활성을 발생하며, 재조합 DNA 기술에 의해서는 불활성인 단쇄 단백질 또는 폴리펩티드로서 수득되는(예를 들면, 클로스트리듐 신경 독소, LH_N 단편과 같은 이들의 단편 또는 예를 들어 개질된 세포 특이성을 갖는 클로스트리듐 신경 독소의 유도체), 전술한 재조합 단백질 또는 폴리펩티드의 발현에 사용할 수 있다: 엔도프로테아제를 위한 인식 서열을 상기 폴리펩티드, 바람직하게는 핵산 수준에서, 예를 들면, L 및 H_N 사이의 루프 영역내로 클로닝하고, 또한 N-말단 또는 C-말단에 동일 또는 추가 엔도 프로테아제를 위한 추가 인식 서열을 클로닝하고, 그 측방에 친화성 정제를 위한 펩티드 태그를 클로닝할 수 있다. 상기 단쇄 발현된 단백질 또는 폴리펩티드는 이후 대응하는 엔도프로테아제로 처리하거나, 또는 엔도프로테아제와 동시 또는 순차적으로 L 및 H_N 사이의 루프 영역에서 절단하고 펩티드 태그를 제거함으로써 활성화시킬 수 있다.

이러한 엔도프로테아제 사용에 대한 경비 및 요구되는 부가적인 작업 단계이외에도, 이들의 약학적 제제에서의 사용(예를 들면, 재조합 보툴리늄 독소 및 그 유도체의 사용)은 약사법에 기초한 (등록에 관한)이유에서 아주 문제가 많다. 한편으로는 사용된 엔도프로테아제의 순도가 실험적으로 증명되어야 하며, 다른 한편으로는 제품으로부터의 완전한 제거 및 특히 바이러스-제거가 추가되는 코스의 정제 프로토콜내에서 정밀하게 서류화되어야 하며; 이는 통상 엄청난 분석 경비를 요구한다. 차후에는, 예를 들어 개선된 성질 또는 개선된 세포 특이성을 갖는 보툴리늄 독소 또한 재조합 발현에 의해 제조될 것이기 때문에, 그 정상적인 생물학적/생화학적 활성을 이쇄 단백질 또는 폴리펩티드로서 발생하며, 재조합 DNA 기술에 의해서는 불활성인 단쇄 단백질 또는 폴리펩티드의 형태로 수득되는 전술한 재조합 단백질 또는 폴리펩티드, 특히 보툴리늄 독소 또는 그 유도체를 엔도프로테아제를 사용하지 않고, 이황화 가교된 이쇄의 따라서 생물학적으로 활성인 단백질 또는 폴리펩티드로서 제공할 수 있는 발현 방법이 매우 요망된다.

이하에서 보다 자세히 설명될 본 발명은 따라서, 가장 넓은 의미에서, 클로스트리듐 신경독소와 같은 단백질뿐 아니라 그 단편 및 유도체를 대장균 숙주 세포내에서 재조합 발현으로 제조할 수 있으며, 그 활성화에 엔도프로테아제의 추가가 요구되지 않는 생물학적으로 활성인 이황화 가교된 이쇄 형태로 분리할 수 있는 방법을 제공한다.

본 발명의 바람직한 첫번째 구현예에서, BoNT(A)의 시스테인 잔기 430 및 454 사이의 루프 영역의 아미노산 서열(도 3-1 내지 도 3-5 참조)이 변경되어, 대장균 숙주 세포의 용해물내의 발현된 독소 또는 그 단편/유도체가 이미 이쇄 폴리펩티드로서 존재한다. 이 두 사슬은 시스테인 잔기 430 및 454가 이황화 결합으로 참여하여 서로 공유적으로 결합한다. 특히 바람직한 예는 도 3에 설명된 바와 같이, 펜타펩티드 Asp₄₄₃ - Asn₄₄₇ (DKGYN)가 Val-Pro-Arg-Gly-Ser (VPRGS)로 대체된 것이다. 또한 Asp₄₄₃ - Asn₄₄₇ (DKGYN)는 Val-Pro-Tyr-Gly-Ser (VPYGS), Val-Pro-His-Gly-Sr (VPHGS) 또는 Val-Pro-Gln-Gly-Ser (VPQGS)으로 또한 대체될 수 있다. 상기 중심 아미노산 잔기는 자연 발생 아미노산 중 어느 것도 될 수 있을 뿐 아니라, 다른 4개의 아미노산 또한 전술한 바와 같이 교환될 수 있다(이들 잔기중 하나 이상이 교환될 때, 본 발명의 의미에서 PRS 서열의 변이체로 존재한다). 또한, 본 구현예 및 다른 바람직한 구현예에서, 바람직하게는 루프 서열은 PRS에서 N-말단으로 1 내지 20 아미노산 잔기 간격을 두고 에 기초 아미노산 잔기, 특히 라이신 또는 아르기닌 잔기를 갖는다.

본 발명이 속하는 분야의 당업자에게 상기와 같은 특징을 갖는 BoNT(A)의 루프 영역에서 각각의 또는 수개의 아미노산 잔기의 추가적인 교환 또는 추가적인 아미노산 잔기의 삽입 또는 삭제된 것 역시, 용해물 내 본 발명의 발현 독소 또는 이로부터 유도된 단편/유도체가 이쇄 폴리펩티드로 존재하도록 결과함은 명백하다. 이러한 변이체는 또한 본 발명에 포함된다.

또한, 본 발명이 속하는 분야의 당업자에게 발현 및 단쇄 번역되는 폴리펩티드 또는 단백질내에서 PRS-펜타펩티드 서열 또는 그것의 인식가능한 변이체 중 하나가 루프 영역내에 존재하는 한, 야생형 BoNT(A)에 존재하는 펜타펩티드 Asp₄₄₃ - Asn₄₄₇ (DKGYN)가 헥사펩티드, 헵타펩티드, 옥타펩티드에 의해 대체될 수 있음은 명백하다. 전술한 바와 같이, 바람직하게는 펜타펩티드의 N-말단쪽에 기초 아미노산 잔기(바람직하게는 라이신)가 존재한다.

또한 본 발명이 속하는 분야의 당업자에게, 바람직한 구현예인 PRS의 펜타펩티드(Val-Pro-Arg-Gly-Ser)가 혈액 응고 캐스캐이드에서 중요한 역할을 하며 높은 서열 특이성을 갖는 프로테아제 트롬빈에 대한 가능한 인식 서열 중 일부임은 명백하다. 먼저, 보툴리늄 신경 독소 타입 A 뿐만 아니라, 다른 폴리펩티드에서도 트롬빈에 의한 절단은 원하는 이황화 가교된 이쇄형을 수득하는데 요구되지 않으며, 두번재로 트롬빈 인식 서열 그 자체, 즉 개질되지 않은 형태는 대장균 용해물의 프로테아제 활성에 의한 절단에 유익하지만 전혀 필수적인 것은 아님을 명백하게 지적한다. 전술한 바와 같이 대응하는 폴리펩티드(그 루프에서 더 좋다)에서 삽입되거나 생성되는 PRS 펜타펩티드 서열의 구현예는, 트롬빈이 절단, 따라서 루프내 절단을 초래할 수 있는 아르기닌 잔기를 C-말단에 포함하지 않는다(대신에 다른 자연 발생 아미노산이 존재한다). 이 절단은 바람직하게 먼저 설명한 바와 같이 펜타펩티드의 N-말단인 루프의 라이신 잔기에서 실현된다(실시예 2 참조; 도 3).

장시간 작용 신경독소로서의 BoNT(B) 및 BoNT(C1), 단시간 작용 신경독소로서의 BoNT(E)와 같은 다른 혈청형의 보툴리늄 독소뿐만 아니라, 단쇄로서 재조합 발현되나 이쇄로서만이 생물학적 활성을 나타내는 전적으로 상이한 폴리펩티드 또는 단백질들도 치료학적으로 사용될 수 있기 때문에, 이들 독소 및 이들의 단편 또는 유도체(및 기타 폴리펩티드 또는 단백질 또한)가 대장균 용해물에서 이황화 가교된 이쇄 폴리펩티드 또는 단백질로서 수득되는 것은 매우 바람직하다. 특히 BoNT(B)의 경우, 대장균 용해물에서 재조합 독소의 완전한 이쇄 폴리펩티드 또는 단백질로의 절단은 클로스트리듐 보툴리늄에서 분비되는 천연 신경독소-일반적으로 40% 이상이 단쇄로서 존재하여 불활성화 폴리펩티드이며 활성화 이쇄형으로부터 분리될 수 없다-에 비해서 상당히 유리하다. 이황화 결합에 참여하는 시스테인 잔기 사이의 혈청형 B, C1, 및 E 신경독소의 루프 영역은 BoNT(A)의 루프 영역에 비하여 상당히 짧다(도 3 및 도 4 참조). BoNT(A)의 경우 23개의 아미노산 잔기(Val₄₃₁ - Leu₄₅₃)가 존재하는 반면, BoNT (B)에는 오직 8개의 아미노산 잔기(Lys₄₃₈ - Ile₄₄₅), BoNT(C1)에는 15개의 아미노산 잔기 (His₄₃₈ - Asp₄₅₂), 및 BoNT(E)에는 13개의 아미노산 잔기(Lys₄₁₃ - Ile₄₂₅)가 이 영역에 존재한다. 그럼에도 불구하고, BoNT(B)만 제외하고, 이 상대적으로 짧은 영역은 본 발명에 따른 PRS 서열을 가질때 사슬의 절단 및 이황화 가교의 형성이 가능할 만큼 충분히 길다는 것이 발견되었다. BoNT(B)는 루프내 펜타펩티드가 PRS 펜타펩티드서열로 교환되었을 때(따라서, 루프 서열의 전체 길이는 오직 8개 아미노산 잔기이다), 본 발명이 의미하는 두 사슬(경쇄 및 중쇄)로 절단되긴 하였지만, 루프길이가 9개 이상, 15개 이상, 20개 이상, 또는 22개 아미노산 잔기를 가질 때 더욱 좋은 결과, 즉 본 발명에 따라 더욱 바람직한 결과를 얻을 수 있었다. 가장 나중에 언급된 루프가 22 아미노산 잔기를 가진 구현예가 도 4-1 및 4-2의 서열로서 또는 이들 둘의 비교로서 예시적으로 설명된다.

본 발명은 또한 BoNT(A)의 루프 영역에 대한 서브타입 B, C1 등의 루프 영역의 또는 이들의 중요 부분의 교환이 특히 루프가 9개 이상, 바람직하게는 15개 이상의 잔기로 확장되고 및/또는 PRS의 N-말단 기초 아미노산 잔기(예를 들면, 바람직하게는 Lys 잔기)가 삽입되는(N-말단 기초 또는 Lys 잔기가 미리 존재하지 않는 경우) 방식으로 교환되는 것이 신경 독소의 이황화 가교 이쇄 폴리펩티드 또는 단백질로의 절단에 있어 바람직하다는 것을 실험적으로 증명하였다. 특히 바람직한 교환을 도 4에 도시하였다(도 4의 PRS 서열은 VPRGS이지만, VPYGS, VPHGS, VPQGS, VPKGS, VPIGS 및 VPAGS도 가능하며 바람직하다).

본 발명의 다른 구현예에서, 혈청형 B, C1, D, E, F, 및 G 보툴리늄 독소 및 파상풍 독소의 루프 영역을 코딩하는 아미노산 서열 및 그 유전 영역은 L 및 HN의 이황화 가교에 참여하는 시스테인 잔기 사이가 변경되어, 대장균 숙주 세포의 용해물내에서 발현 독소 또는 이로부터 유도되는 단편/유도체가 두 사슬이 이황화 가교로서 공유적으로 결합되어 있는 이쇄 폴리펩티드로 이미 존재한다(이는 재조합 발현시 단쇄로서 생성되나 오직 이쇄형태에 있을 때만이 생물학적 활성을 발휘하는 기타 다른 폴리펩티드 또는 단백질에도 동일하게 적용된다). 본 발명의 바람직한 구현예에서, 신경독소의 완전 루프 영역(또는 그 일부분) 또는 이로부터 유래되는 독소 단편/유도체는 도 3에서 특정된 바 있는, 펜타펩티드 Asp₄₄₃ - Asn₄₄₇이 바람직하게는 예를 들면, Val-Pro-Arg-Gly-Ser (VPRGS)로 대체된, BoNT(A)의 완전 루프 영역 또는 BoNT(A)의 루프 영역의 일부로 교환될 수 있다. 다른 바람직한 구현예로서, 상기 펜타펩티드 Asp₄₄₃ - Asn₄₄₇은 또한 Val-Pro-Tyr-Gly-Ser, Val-Pro-His-Gly-Ser, 또한 Val-Pro-Gln-Gly-Ser으로 대체될 수 있다. 특히 바람직한 구현예로서는 상기 신경독소 및 이로부터 유도되는 단편/유도체의 루프 영역 또는 그 일부는 올리고펩티드 Arg/Ser-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala(18mer: R/SGIITSKTKSLVPRGSKA)로 대체될 수 있다. 전술한 루프 서열 영역의 개별 또는 수개의 아미노산 잔기의 추가적인 교환, 삽입 또는 삭제는 도 4에 보인 바와 같이 본 발명에 의해 명백히 포함되는 이황화 가교 이쇄 폴리펩티드 또는 단백질로서 대장균내(예를 들어 대장균 K12 숙주 세포 또는 그 유도체)에 발현되는, 발현 신경 독소 또는 그 단편/유도체를 결과한다(이는 재조합 발현시 단쇄로서 생성되나 오직 이쇄형태에 있을 때만이 생물학적 활성을 발휘하는 기타 다른 폴리펩티드 또는 단백질에도 동일하게 적용된다).

반복하여 개시한 바와 같이, 본 발명에 따른 방법은 또한 하기 구성성분 A, B, 및 C를 갖는 융합 단백질 또는 혼성 단백질을 생산할 수 있다:

(구성성분 A)- 효소활성에 의해 예를 들어 표적 세포에서의 분비를 억제하거나 살해할 수 있는 효과 도메인, 또는 독소 도메인;

(구성성분 B)- 상기 정의된 PRS 펜타펩티드 서열 VPXGS(예를 들어, 도 3에 개시한 바와 같이 BoNT(A)의 변경된 루프 서열 및 그 변이체)를 갖도록 변경되며, 시스테인 잔기를 N-말단 및/또는 C-말단으로 부착할 수 있는, 전술한 본 발명에 따른 루프 서열; 및

(구성성분 C)- 융합 단백질 또는 혼성 단백질에 세포 특이성을 부여하는 세포 결합 도메인.

구성성분 B(루프 서열)은 또한 앞서 전술한 바와 같이 바람직하게는 (i) 도 4에 도시된 변경된 루프 서열, (ii) 이로부터 유도된 어느 서열이며, 그 PRS의 중심 잔기는 어떤 자연 발생 아미노산일 수 있다, (iii) (i) 또는 (ii)의 변이체(전술한 변이체 정의 참조). 도 4에서 BoNT(B), BoNT(C1) 또는 BoNT(E) 의 각 루프 서열은 하나 또는 두개의 N-말단 및 두개의 C- 말단 아미노산을 제외하고는 삭제되었으며, 삭제된 아미노산 잔기는 BoNT(A)의 변경된 루프 서열의 17머 GIITSKTKSLVPRGSKA(도 4-2 및 4-6) 또는 18머 RGIITSKTKSLVPRGSKA(도 4-4)로 대체되었다.

전술한 구성성분 A, B 및 C 이외에도, 융합/혼성 단백질은 전좌 도메인(보툴리늄 신경 독소의 경우 루프 서열 및 세포 결합 도메인 사이에 위치됨)을 가질 수 있다. 이 부가적인 도메인은 효과 도메인이 표적 세포의 세포질로 삽입되는 것을 보조한다. 이러한 융합 단백질의 대장균에서의 발현은(예를 들면, 대장균 K12 또는 그 유도체) 이쇄 폴리펩티드 또는 단백질을 결과하며, 여기에서 한 도메인은 제1 사슬상에 있고 다른 두 도메인은 제2 사슬상에 있다(보툴리늄 신경 독소의 경우, 경쇄 상의 효과 도메인은 중쇄상의 다른 두 도메인과 이황화 가교로 공유 결합된다).

본 발명의 융합 또는 혼성 단백질은 소위 면역 독신으로 기능할 수 있으며, 특히 암치료에 유용성이 있다. 이와 관련하여, 독소 도메인은 세포 결합 도메인을 부착함으로써 특정 세포 타입, 일반적으로 암세포에 대한 특이성을 부여받는다. 독소 도메인으로서는, 일차적으로 디프테리아 독소, 슈도모나스 독소 및 라이신의 효소 도메인이 사용된다. 이들 독소는 이쇄 AB 독소에 속하며, 효소 활성을 제공하는 A 사슬은 전좌 활성 및 세포 결합 활성을 결합하는 B 사슬에 이황화 가교에 의해 공유적으로 결합된다. 그러나, 면역독소에서 다른 독소 또는 독소 단편도 사용가능하므로, 원하는 활성(예를 들어, 암 세포 살해)을 표적 세포 내에서 나타낼 수 있다. 면역 독소의 1세대는 독소 도메인의 화학적 커플링, 예를 들면 라이신 A 사슬을 단클론 항체와 결합하여 제조하였으나, 2세대 면역 독소는 주로 대장균에서 Fab 독소, 단쇄 Fv 독소(scFv 독소) 또는 이황화-안정화된 Fv(dsFv 독소)로서 또한 성장인자 또는 시토킨과의 융합 단백질로서 재조합 발현에 의해 제조된다( Reiter, 2001). 차세대 면역 독소에서는 세포 특이성 또한 예를 들면 아필린 단백질 패밀리, 안키린 반복 프로테인 또는 안티칼린 등과 같은 종양-특이적 표면 단백질에 대한 높은 친화적 결합에 따라 선택되는 변경된 폴리펩티드에 의해 부여될 수 있을 것이다.

면역 독소의 모든 변이체에서, 효소성 독소 도메인은 그 독성을 나타내기 위하여 반드시 표적 세포의 세포질내로 통과하여 들어갈 수 있어야 한다. 대장균에서 면역독소는 단쇄 폴리펩티드로서 발현되기 때문에, 사슬에 있어 전좌 유닛 및 세포 결합 도메인으로부터 효소 독소 도메인을 분리하기 위해서는 단백분해성 절단 및 이황화 가교의 환원이 요구된다. 재조합 디프테리아 독소 단편 및 재조합 슈도모나스 외독소 단편의 경우, 절단은 표적세포의 엔도조말 컴파트먼트에의 내재화후 퓨린과 같은 세포내 프로테아제에 의해 일어난다 (Williams et al., 1990). 한편, 라이신은 이러한 프로세싱 사이트가 없고, 따라서 이황화 가교 이쇄 면역 독소로서 투여되기 위해서는 인공적으로 프로테아제 인식 서열을 삽입하여야 한다. 또한 디프테리아 독소 및 슈도모나스 외독소에 기초한 면역 독소의 경우, 오직 최소 부분의 내재화된 융합 단백질만이 절단되어 동량의 최소 부분의 효소 도메인만이 세포질까지 도달할 수 있다(Ogata et al., 1990). 이후 개시되는 본 발명의 바람직한 구현예는 대장균에서의 재조합 발현에 의하여 제조되고 생물학적으로(효소적으로)활성화 형태인 이황화 가교 이쇄 형태로 분리될 수 있으며, 그 활성화를 위해 세포내 엔도프로테아제나 엔도프로테아제의 인비트로 첨가가 요구되지 않는 면역 독소 변이체의 제조방법 및 구조체를 개시한다. 이들 면역 독소는 전좌 가능한 형태로 효소성 독소 도메인을 표적 세포에 전달할 수 있어, 세포내 프로테아제에 의한 절단을 필요로 하지 않으며, 따라서 상당히 감소된 투여량의 면역독소로도 원하는 세포 독성 효과를 달성할 수 있다.

본 발명의 바람직한 다른 구현예는 하기 구성성분 A, B, 및 C를 갖는 융합 단백질 또는 혼성 단백질을 포함한다:

(구성성분 A)- 독소 도메인 또는 그 단편/유도체;

(구성성분 B)- 상기 정의된 PRS 펜타펩티드 서열 VPXGS(예를 들어, 도 3에 개시한 바와 같이 BoNT(A)의 변경된 루프 서열 중 하나 또는 그 변이체)를 갖도록 변경되며, 시스테인 잔기를 N-말단 및/또는 C-말단으로 부착할 수 있는, 전술한 본 발명에 따른 루프 서열; 및

(구성성분 C)- 단클론항체 또는 그 단편, 아필린, 안키린 반복 단백질, 안티칼린, 성장 인자(예컨대, TGF-alpha, FGF, VEGF, 또는 IGF-1), 시토킨(IL2, IL4, 또는 IL6)의 단백질 패밀리로부터 선택될 수 있는 세포 결합 도메인.

상기 바람직한 구현예에 따르면, 상기 구성성분 B(루프 서열)은 마찬가지로 (i) 도 4에 도시된 변경된 루프 서열 중 어느 하나, (ii) 이로부터 유도된 모든 서열이며, 그 PRS의 중심 잔기는 모든 자연 발생 아미노산일 수 있다, (iii) (i) 또는 (ii)의 변이체(전술한 변이체 정의 참조).

독소 도메인은 라이신의 A-사슬, PE40 또는 PE38 (도메인 Ib를 갖거나 갖지 않은 도메인 II 및 III; 도 2) 와 같은 슈도모나스 외독소의 단편 또는 디프테리아 독소의 단편일 수 있다. 앞서 언급한 효과 도메인 또는 독소 또는 세포 결합 도메인은 오직 예시로서 이해되어야 한다. 모든 단백질 또는 단백질 단편은 본 발명에 포함되는 바, 한편으로는 융합 단백질/혼성 단백질에 표적 세포, 예를 들면 암세포의 표면 항원에 대한 특이적 결합 활성을 부여하거나, 다른 한편으로 표적 세포내에서 내재화된 후 어떤 활성, 예를 들면 세포 살해활성을 나타내도록 하며, 본 발명에 따른 대장균내에서 이러한 융합/혼성 단백질의 발현이 이쇄 폴리펩티드 또는 단백질을 생산하며, 여기에서 독소 도메인 또는 그 유도체는 세포 결합 도메인에 이황화 가교로 공유 결합되어 있다.

슈도모나스 외독소에 기초한 면역 독소의 효율 및 특이성을 개선하기 위하여 과거에는 여러 다른 접근법이 선택되었다. 예를 들면, 수용체 결합 도메인(아미노산 잔기 1-152를 갖는 도메인 Ia)이 단클론 항체의 단편으로 변경되었으며, 동시에 전좌 도메인(도메인 II)내 시스테인 잔기 13 및 35(도메인 II를 기준으로 숫자매김) 사이의 루프 영역(도 2 및 5)는 더이상 도처에 존재하는 세포내 프로테아제 퓨린의 절단에 감수성을 갖지 않도록, 대신 특정 암세포에서만 상당한 정도로 발현되고 부분적으로 분비되는 특정 프로테아제에 감수성을 갖도록 변경되었다(미국 특허 6,426,075호). 이러한 프로테아제 감수성의 변경은 면역 독소에 증강된 세포 특이성을 부여하도록 또한 변경된 수용체 결합 도메인을 갖도록 디자인되었다. 그러나 다른 세포내 프로테아제에 의해서도 상기와 같은 루프에서의 절단 증강 및 이에 따른 효소 도메인 III의 전좌 효율의 개선이 이루어질 수 있을 것으로 예상되지 않는다.

면역 독소에 대한 또 다른 추가적 접근에 따르면, 수용체 결합 도메인 및 전좌 도메인의 N-말단 영역이 루프 영역에서 아르기닌 잔기 27에까지 제거되었다. 이러한 면역독소에서 요구된 세포 특이성은, 예를 들면 V_L 도메인에 결합된 단클론 항체의 V_H 도메인을 이황화 가교에 의해 도메인 II 및 III 사이의 Ib 부위에 삽입함으로써, 또는 도메인 III의 C-말단의 부착에 의하여 부여되었다(미국 특허 5,980,895호). 이러한 구조체에서는 프로테아제에 의한 활성화가 더 이상 필요치 않다; 따라서 이는 한편으로 상당히 증가된 수송 효율을 나타낸다. 그러나 다른 한편으로는, 효소 도메인 III의 N-말단 또는 C-말단에 위치한 수용체 결합 도메인에 의한 전좌가 단클론 항체의 V_H 도메인 또는 TGF-alpha에 의해 손상될 것이 예상된다. 이들 수용체 결합 도메인은 효소 도메인으로부터 분리되지 않기 때문에, 효소 활성 따라서 표적 세포내에서의 독성에 부정적인 영향을 미칠 것이 예상된다. 슈도모나스 외독소-기초 면역독소의 경우, 한편으로는 시스테인 잔기 13 및 35 사이의 루프가 절단된 이황화 가교형으로 이미 존재하여 따라서 세포내 프로테아제에 의한 활성화가 요구되지 않고, 다른 한편으로는 수용체 결합 도메인이 외독소의 도메인 I의 위치에서 전좌 도메인의 N-말단에 융합함으로써 세포질에서 환원된 이후 독소 도메인으로부터 분리되고 따라서 도메인 III의 효소활성을 손상시키지 않을 때, 상대적으로 최대치의 세포 독성활성을 얻을 수 있다.

특히 바람직한 본 발명에 따른 구현예는 단클론 항체, 그 단편, 아필린, 안키린 반복 단백질, 안티칼린, 성장 인자(예를 들어, TGF-alpha, FGF, VEGF, 또는 IGF-1), 또는 시토킨(예를 들어, IL2, IL4, 및 IL6)의 단백질 패밀리에서 선택될 수 있는 세포 결합 도메인(C)을 포함하고, 상기 세포 결합 도메인(C)의 C-말단에, 세포질내세망(ER)에 대한 보유 시그널, Lys-Asp-Gly-Leu 또는 그 변이체를 C-최말단에 가지는 변경된 PE38 단편이 융합된 융합/혼성 단백질을 포함한다. 상기 PE38 단편의 변경은 시스테인 잔기 13 및 35 사이의 전체 루프 서열(또는 오직 그 일부분)을 PRS 펜타펩티드 서열 VPXGS, 바람직하게는 도 3에 도시된 BoNT(A)의 변경된 루프 서열 또는 그 변이체, 특히 펩티드 서열 Arg-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala (도 5) (전술한 변이체 정의 참조)로 교환하는 것으로 구성되어 있다. 바람직하게는 본 구현예에서, 또한 도 5에 도시된 바와 같이, 기초 아미노산 잔기가 1 내지 20 아미노산 잔기의 간격을 두고 PRS에서 N-말단에 위치하고 있다. 대응하는 변경된 PE38 단편 및 이 변경된 단편을 포함하는 융합/혼성 단백질은 대장균 숙주 세포(예컨대, M15[pREP4])의 용해물에서 이황화 가교된 이쇄 형태로 존재한다.

슈도모나스 외독소와 대조적으로, 디프테리아 독소의 효소 도메인, A-사슬은 N-말단에 존재한다. 전좌 도메인 및 수용체 결합 도메인은 B-사슬의 C-말단에 존재한다. 양 사슬은 루프 서열로 연결되며, 코리네박테리움 디프테리아 세포에서 분비시 상기 루프 서열중 아르기닌 잔기 193에서 프로테아제에 의한 단백분해성 절단이 일어난다. 이 양사슬은 절단후 시스테인 잔기 186 및 201 사이가 이황화 가교에 의해 서로 공유적으로 결합되어 존재한다. 이점에서 , 디프테리아 독소는 보툴리늄 독소 및 파상풍 독신과 그 도메인 구조가 유사하다.

재조합 면역 독신의 제조를 위해, 수용체 결합 도메인 또는 그 일부는 예를 들면, VEGF 또는 IL2 (Arora등, 1999; Williams등., 1990) 과 교환되고, 이로써 융합 단백질에 새로운 세포 특이성이 부여된다. A-사슬이 표적 세포의 세포질에 도달하기 위해서는 대장균에서 단쇄로 발현된 면역독소의 폴리펩티드 사슬이 A-사슬과 B-사슬간에 루프 영역에서 절단되어져야 하며, 다른 한편 이황화 가교가 환원되어져야 한다. 전좌 과정중 이황화 가교의 환원이 일어나는 동안, 세포내 프로테아제에 의한 단백분해성 절단은 불완전해 오직 최소 부분의 A-사슬만이 세포질로 방출될 수 있다(Williams 등., 1990). 만약 면역 독소가 투여시 이미 이황화 가교된 이쇄 형태로 존재한다면, 모든 A-사슬이 전좌 가능한 형태로 될 수 있기 때문에, 상당한 효율 증가가 예상될 수 있다.

본 발명의 또 다른 바람직한 구현예는 따라서 단클론 항체, 그 단편, 아필린, 안키린 반복 단백질, 안티칼린, 성장 인자(예를 들어, TGF-alpha, FGF, VEGF, 또는 IGF-1), 또는 시토킨(예를 들어, IL2, IL4, 및 IL6)의 단백질 패밀리에서 선택될 수 있는 세포 결합 도메인(C)을 포함하고, 상기 세포 결합 도메인(C)의 N-말단에, 변경된 디프테리아 독소 단편이 융합된 융합 또는 혼성 단백질을 포함한다. 상기 독소 단편은 A-사슬 및 하나 이상의 B-사슬의 전좌 도메인 Gly₁ - Phe₃₈₉ 또는 Gly₁ - Asn₄₈₆을 포함할 수 있다. 디프테리아 독소 단편의 변경은 시스테인 잔기 186 및 201 사이의 전체 루프 서열(또는 오직 그 일부분)이 도 3에 도시된 BoNT(A)의 변경된 루프 서열 또는 그 변이체, 특히 펩티드 서열 Arg-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala(도 5)(전술한 변이체 정의 참조)로의 교환으로 구성되어 있다. 대응하는 변경된 디프테리아 독소 단편 및 이 변경된 단편을 포함하는 융합 단백질은 대장균 숙주 세포, 예컨대, M15[pREP4]의 용해물에서 이황화 가교된 이쇄 형태로 존재한다.

제1세대 라이신-기초 면역 독소는 라이신 A-사슬을 단클론 항체와 결합시켜 제조되었다. 이는 과거에는 A-사슬의 C-말단에 위치한 시스테인 잔기의 티올 기능기와 이황화 가교를 형성하는 화학적 링커제로 항체를 유도체화함으로서 달성되었다. 항체의 유도체화가 방향성이 없기 때문에 이러한 콘쥬게이트는 매우 이질적이었다. 콘쥬게이트 크기 및 B-사슬에 국재화되어 있는 전좌 도메인의 결핍으로 인하여 종양에 대한 효율은 최소는 아니지만, 상당히 불충분하였다. 천연상태의 B-사슬이 면역 독소의 구성성분으로 존재하는 경우, 독성은 상당히 증가하지만, B-사슬의 렉틴-양 세포 결합 특성 때문에 원하는 표적 세포가 아닌 다른 세포에의 비특이적 흡수도 일어난다. 이러한 표적의 충돌은 B-사슬을 그 전좌 활성은 남기고 다만 세포 표면의 글리코 구조에 대한 결합 친화성은 상당히 감소되도록 변경하는 전략으로 대응하였다(WO 89/04839). 그러나, 이렇게 변경된 B-사슬을 함유하는 재조합 발현된 면역 독소는 단쇄 구조를 가지기 때문에, A-사슬과 B-사슬간의 링커 펩티드에 세포내 프로테아제에 대한 인식 서열이 결핍되어 있는 관계로, 면역독소가 표적 세포에 흡수될 때, A-사슬의 방출 및 전좌가 전혀 불가능하거나 매우 낮은 효율로 이루어졌다. 미국 특허 6,593,132호에서는 상이한 세포-특이적 프로테아제에 대한 인식 서열로 표시되는 이 천연 링커 펩티드의 변경이 개시되어 있다. 이 변경된 링커 펩티드를 단백분해 절단할 수 있는 각 프로테아제는 다른 세포형에 비하여 목적 표적 세포에서만 발현되며 상당히 증가된 양으로 발현되므로, 이러한 변경을 한 라이신 변이체는 대응하는 세포 특이성을 가지게 된다. 그러나, 이는 상기 절단이 오직 내재화된 독소 분자 분획에서만 일어나므로, 이에 대응하는 극히 소량의 A-사슬만이 세포질로 전좌된다는 것을 감안하여야 한다. 바람직한 라이신-기초 이쇄 면역 독소는 그 전좌 활성은 그대로 남아있고, 비특이적인 렉틴-양 세포 결합 성질은 억제되도록 변경된 B-사슬과 A-사슬이 이황화 가교로 결합되어 있으며, C-말단에 특이적인 세포 결합 도메인이 융합되어 있는 것이다. 이러한 면역 독소는 세포 특이성과 높은 독성을 결합할 수 있다.

또 다른 본 발명의 바람직한 구현예는 하기 구성성분 A, B, 및 C를 갖는 융합 단백질을 포함한다:

(구성성분 A)- 라이신의 A-사슬;

상기 바람직한 구현예에 따르면, 상기 구성성분 B는 마찬가지로 (i) 도 4에 도시된 변경된 루프 서열 중 어느 하나, (ii) 이로부터 유도된 모든 서열이며, 그 PRS의 중심 잔기는 모든 자연 발생 아미노산일 수 있다, (iii) (i) 또는 (ii)의 변이체(전술한 변이체 정의 참조).

특히, 상기 루프 서열은 펩티드 서열 Ala-Pro-Pro-Arg-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala-Asp-Val(도 5-6), 즉 변경된 라이신 A-사슬의 루프 서열을 포함할 수 있다. 바람직하게 시스테인 잔기는 루프 서열의 C-말단에 부가될 수 있다. 여기 포함된 PRS 서열 Val-Pro-Arg-Gly-Ser에서, Arg은 어떤 기타 자연 발생 아미노산 Xaa일 수 있다. 루프서열은 양 끝에서 추가적인 아미노산 잔기(예를 들면 글라이신 및 세린 잔기)로 확장될 수 있다. 또한 라이신의 A-사슬은 완전 B-사슬, 또는 그 부분 또는 변이체와 루프서열에 의해 결합될 수 있으며, 루프서열은 프로 라이신(pro ricin)의 야생형 서열의 시스테인 잔기 259 및 283 사이의 아미노산 잔기를 최소한 도 3에 기재된 변경된 BoNT(A) 루프 영역 또는 그 변이체를 포함하는 루프 서열에 의해, 전체적으로 또는 부분적으로 대체한 것이다. 여기에서, 이황화 가교는 시스테인 잔기 259 및 283(프로 라이신의 야생형 서열에 대하여)에 의해 형성된다. 세포 결합 도메인은 B-사슬의 C-말단에 융합되며, 상기 언급된 폴리펩티드 패밀리로부터 선택된다. 대응하는 융합/혼성 단백질은 대장균 숙주 세포, 예컨대, M15[pREP4] 세포주의 용해물에서 이황화 가교된 이쇄 형태로 존재한다.

(구성성분 A)- 융합 단백질에 더 나은 용해성을 부여하고, 더 높은 발현율을 나타내게 하며 및/또는 친화성 정제를 가능하게 하는 단백질 또는 올리고 펩티드(예를 들면, 글루타티온-S-트랜스퍼라제(GST), 말토스 결합단백질(MBP), His 태그, Strep 태그, 또는 FLAG 태그);

(구성성분 C)- 모든 형태의 폴리펩티드.

특히 상기 루프는 펩티드 서열 Val-Arg-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala-Leu-Asn-Asp-Leu을 가질 수 있으며, 상기 서열에서 PRS의 중심에 있는 Arg은 Xaa이다. 상기 루프는 그 양끝에서 추가적인 아미노산 잔기(예를 들면, 글라이신 및 세린 잔기)로 확장될 수 있다. 이러한 융합 단백질의 대장균에서의 발현은 이쇄 폴리펩티드 또는 단백질을 결과하는데, 상기 두 사슬은 이황화 가교로 공유결합되어 있으며, 티올-함유 물질(예를 들면, β-머캅토에탄올, DTT, 또는 환원 글루타티온)로 간단하게 환원한 후, 프로테아제의 첨가없이, 완전 정제된 후 서로로부터 분리될 수 있다. 이러한 발현 시스템은 특히 그 반응성 티올그룹을 가진 융합 파트너의 정제 및 분리후, 티올 반응성 링커 분자와의 커플링 반응 또는 예컨대, 폴리에틸렌글루콜과의 변경을 위한 부위를 제공하기 위하여, 시스테인 잔기를 두 말단 중 어느 한 말단에 구비하는 재조합 단백질에 적합하다.

본 발명은 또한 코돈 용법의 상이한 가능성을 고려하여, 전술한 바와 같은 본 발명에 따른 폴리펩티드를 코딩하는 모든 핵산을 포함한다. 또한, 본 발명은 본 발명에 따른 각 폴리펩티드을 코딩하는 DNA 서열을 포함하는 상업적으로 입수가능하거나 개별적으로 구축된 클로닝 및 발현 플라스미드를 포함하며, 상기 발현 플라스미드로 형질전환되어, 본 발명에 따른 각 폴리펩티드를 그 활성 이황화 가교 이쇄 형태로 발현할 수 있는 적합한 클로닝 및 발현 대장균 균주를 포함한다. 이러한 발현 시스템의 한 예로서, M15[pREP4] 대장균 숙주 균주와 조합된 pQE 시리즈의 발현 플라스미드를 들 수 있다.

약학적으로 사용가능한 폴리펩티드 또는 단백질의 개발에 관한 분야의 숙련자에게, 본 발명의 폴리펩티드 또는 단백질의 활성화에 엔도프로테아제가 첨가될 필요가 없다는 사실에 관한 이점은 명백할 것이다. 전술한 본 발명에 따른 폴리펩티드 또는 단백질의 많은 부분이 특히 약학적 사용을 표적으로 하고 있다. 따라서, 본 발명은 본 발명의 폴리펩티드 또는 단백질 중 하나 또는 그 혼합물을 활성 성분 또는 제제에 충분한 안정성을 부여하고, 그 조성이 바라는 투여형태로 조정된 유용한 첨가제로서 포함하는 약학적 제제를 포함한다.

서열번호 1은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 A를 코드하는 핵산(DNA)의 일 예이다(rBoTN(A)-mod1).

서열번호 2는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 A의 일 예이다(rBoTN(A)-mod1).

서열번호 3은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 A의 LH_N 단편을 코드하는 핵산(DNA)의 일 예이다(rBoTN(A)-L_mod1H_N). 상기 서열은 서열번호 1에서 핵산 2620-3888이 삭제된 것에 대응된다.

서열번호 4는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 A의 LH_N 단편의 일 예이다(rBoTN(A)-L_mod1H_N). 상기 서열은 서열번호 2에서 아미노산 잔기 874-1296이 삭제된 것에 대응된다.

서열번호 5는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 A의 LH_NH_CN 단편을 코드하는 핵산(DNA)의 일 예이다(rBoTN(A)-L_mod1H_NH_CN). 상기 서열은 서열번호 1에서 핵산 3286 - 3888 이 삭제된 것에 대응된다.

서열번호 6은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 A의 LH_NH_CN 단편의 일 예이다(rBoTN(A)-L_mod1H_NH_CN). 상기 서열은 서열번호 2에서 아미노산 잔기 1096-1296이 삭제된 것에 대응된다.

서열번호 7은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 B를 코드하는 핵산(DNA)의 일 예이다(rBoTN(B)-mod1).

서열번호 8은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 B의 일 예이다(rBoTN(B)-mod1).

서열번호 9는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 B의 LH_N 단편을 코드하는 핵산(DNA)의 일 예이다(rBoTN(B)-L_mod1H_N). 상기 서열은 서열번호 7에서 핵산 2623-3915가 삭제된 것에 대응된다.

서열번호 10은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 B의 LH_N 단편의 일 예이다(rBoTN(B)-L_mod1H_N). 상기 서열은 서열번호 8에서 아미노산 잔기 875-1305가 삭제된 것에 대응된다.

서열번호 11은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 C1을 코드하는 핵산(DNA)의 일 예이다(rBoTN(C1)-mod1).

서열번호 12는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 C1의 일 예이다(rBoTN(C1)-mod1).

서열번호 13은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 C1의 LH_N 단편을 코드하는 핵산(DNA)의 일 예이다(rBoTN(C1)-L_mod1H_N). 상기 서열은 서열번호 11에서 핵산 2599-3858이 삭제된 것에 대응된다.

서열번호 14는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 C1의 LH_N 단편의 일 예이다(rBoTN(C1)-L_mod1H_N). 상기 서열은 서열번호 12에서 아미노산 잔기 867-1286이 삭제된 것에 대응된다.

서열번호 15는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 E을 코드하는 핵산(DNA)의 일 예이다(rBoTN(E)-mod1).

서열번호 16는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 E의 일 예이다(rBoTN(E)-mod1).

서열번호 17은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 도메인 II, Ib,및 III을 포함하는 슈도모나스 외독소 40kDa 단편을 코드하는 핵산(DNA)의 일 예이다(PE40-mod1).

서열번호 18은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 도메인 II, Ib,및 III을 포함하는 재조합 슈도모나스 외독소 40kDa 단편의 일 예이다(PE40-mod1).

서열번호 19는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 A-사슬 및 B 사슬의 N-말단 단편을 포함하는 재조합 디프테리아 독소 단편을 코드하는 핵산(DNA)의 일 예이다(DT389-mod1).

서열번호 20은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 A-사슬 및 B 사슬의 N-말단 단편을 포함하는 재조합 디프테리아 독소 단편의 일 예이다(DT389-mod1).

서열번호 21은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 라이신 독소 단편을 코드하는 핵산(DNA)의 일 예이다(rRicin-mod1).

서열번호 22는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 라이신 독소 단편의 일 예이다(rRicin-mod1).

도 1은 클로스트리듐 보툴리늄 또는 대장균 K12에서부터 야생형 루프 또는 본 발명에 따라 변경된 루프를 갖는 보툴리늄 신경 독소 타입 A의 방출을 도시한 것이다. A: 클로스트리듐 보툴리늄 세포의 용해에서, 클로스트리듐성 엔도프로테아제에 의해 경쇄(L) 및 중쇄(H) 사이의 루프 영역에서 신경 독소가 절단되는 것을 도시한 것이다. 양 사슬은 서로 이황화 가교에 의해 연결되어 있다. B: 대장균에서 야생형 루프를 갖는 재조합 신경독소의 발현 및 세포 용해 후, 단쇄 형태로 존재하는 것을 나타낸 것이다. C: 본 발명에 따른 변경된 루프를 갖는 재조합 신경독소가 대장균에서 방출될 때, 엔도프로테아제에 의해 루프 영역에서의 절단이 이루어지는 것을 도시한 것이다.

도 2는 대장균 세포에서 방출된 후 야생형 루프 영역 및 본 발명에 따른 변경된 루프 영역을 갖는 상이한 재조합 독소를 비교하여 도시한 것이다.

A: 보툴리늄 신경 독소, B: 슈도모나스 외독소, C: 디프테리아 독소

도 3은 야생형 루프를 본 발명에 따라 변경된 BoNT(A)의 루프 서열의 선택을 비교하여 도시한 것이다. 핵산 서열 및 경쇄 및 중쇄의 제한 시스테인 잔기를 포함하는 유도된 아미노산 서열이 도시되었다. 화살표는 대장균 용해물내 엔도프로테아제에 대한 절단 부위를 표시한다.

도 4는 보툴리늄 신경 독소 혈청형 B, C1, 및 E의 야생형 루프와 본 발명에 따라 변경된 예시적인 루프 서열을 각각 비교하여 도시한 것이다. 핵산 서열 및 경쇄 및 중쇄의 제한 시스테인 잔기를 포함하는 유도된 아미노산 서열이 도시되었다. 화살표는 대장균 용해물내 엔도프로테아제에 대한 절단 부위를 표시한다.

도 5는 슈도모나스 외독소의 PE40 단편, 디프테리아 독소(DT) 및 라이신의 야생형 루프와 본 발명에 따라 변경된 예시적인 루프 서열을 각각 비교하여 도시한 것이다. 핵산 서열 및 제한 시스테인 잔기를 포함하는 유도된 아미노산 서열이 도시되었다. 화살표는 대장균 용해물내 엔도프로테아제에 대한 절단 부위를 표시한다.

도 6은 재조합 독소 및 독소 단편을 클로닝하게 위해 사용되었던 올리고뉴클레오티드의 조합을 보인 것이다. 각 제한 엔도뉴클레아제에 대한 인식 서열에 밑줄표시하였다.

도 7은 본 발명에 따라 변경된 루프 서열을 갖는 재조합 BoNT(A)의 LH_N 단편을 SDS 폴리아크릴아미드 겔상에서 분석한 것을 도시한 것이다. LH_N 단편의 발현은 플라스미드 pQE-BoNT(A)-L_mod1H_N로 형질 전환된 M15[pREP4] 세포에서 시행되었다. 레인 2 및 5: Ni-NTA 아가로스에서 정제된 LH_N 단편; 레인 1 및 4: 트롬빈에서 인큐베이션 후 LH_N 단편; 레인 3: 분자량 마커. 레인 1 및 2는 환원 조건에서 샘플 적용하였으며, 레인 4 및 5는 비환원 조건에서 샘플 적용함.

도 8은 본 발명에 따라 변경된 루프 서열을 갖는 재조합 BoNT(B)의 LH_N 단편을 SDS 폴리아크릴아미드 겔상에서 분석한 것을 도시한 것이다. LH_N 단편의 발현은 플라스미드 pQE-BoNT(B)-L_mod1H_N로 형질 전환된 M15[pREP4] 세포에서 시행되었다. 레 인 1 및 4: Ni-NTA 아가로스에서 정제된 LH_N 단편; 레인 2: 분자량 마커; 레인 3:적용 없음. 레인 1은 환원 조건에서 샘플 적용하였으며, 레인 4는 비환원 조건에서 샘플 적용함.

도 9는 본 발명에 따라 변경된 루프 서열을 갖는 재조합 BoNT(C1)을 SDS 폴리아크릴아미드 겔상에서 분석한 것을 도시한 것이다. 독소의 발현은 플라스미드 pQE-BoNT(C1)-L_mod1H_NH_C로 형질 전환된 M15[pREP4] 세포에서 시행되었다. 레인 1 및 4: Ni-NTA 아가로스에서 정제된 독소; 레인 2: 분자량 마커; 레인 3:적용 없음. 레인 1은 환원 조건에서 샘플 적용하였으며, 레인 4는 비환원 조건에서 샘플 적용함.

실시예 1: 변경된 루프를 갖는 보툴리늄 신경 독소 타입 A의 LH _N 단편의 클 로닝 및 발현

경쇄 및 전좌 도메인의 DNA 서열 클로닝을 위하여, 클로스트리듐 보툴리늄 타입 A(ATCC 3502 균주)의 배양물로부터 염색체 DNA를 분리하였다. 프라이머 #1 및 #2(도 6 참조)를 사용한 PCR 증폭에 의해 변경된 루프 서열 및 C-말단 His 태그를 갖는 BoNT(A)의 경쇄를 코딩하는 유전자 단편을 수득하였다. 상기 PCR 증폭 산물을 제한효소부위 Nco I 및 Sal I를 통해 발현 플라스미드 pQE-60 내로 클로닝하여 플라스미드 pQE-BoNT(A)-L_mod1를 얻었다. 프라이머 #3 및 #4(도 6 참조)를 사용한 PCR 증폭에 의해 BoNT(A)의 전좌 도메인을 코딩하는 유전자 단편을 생성하였다. 제한효 소부위 Stu I 및 Xho I를 통해 pQE-BoNT(A)-L_mod1의 루프 서열 및 His 태그 서열 사이로 클로닝하였다(플라스미드 pQE-BoNT(A)-L_mod1H_N; 서열# 2, Fig. 3, No. 2). 상기 플라스미드 pQE-BoNT(A)-L_mod1H_N로 대장균 발현 균주 M15[pREP4](Qiagen)을 형질전환하였다. 변형된 LH_N 단편은 최후 농도 500μM IPTG 로 25℃에서 밤새 단계적 유도를 시행하여 발현시켰다. 상기 세포는 300 mM NaCl 함유하는 pH 8.0의 50 mM 인산 버퍼내에서 리소자임을 처리하여 용해시키고, 초음파처리 하였다. 원심분리된 용해물을 Ni-NTA 아가로스 칼럼상에서 크로마토그래피하였다. SDS 폴리아크릴아미드 겔상에서 분석한 결과, 환원조건하에서 약 50 kDa 및 100 kDa에 해당하는 두 밴드는 코마시 염색되고, 반면 비환원조건하에서는 오직 100 kDa에 해당하는 밴드만이 검출되었다(도 7). 이와 같이, LH_N 단편은 박테리아로부터 75% 이상 두 사슬이 이황화 가교로 서로 공유결합된 이쇄 폴리펩티드로서 방출된다는 것이 명백히 입증되었다. 이후 트롬빈으로 처리한 결과, 한편으로는 단쇄 형태의 절단을 초래하였으며, 다른 한편, 이쇄 폴리펩티드의 전좌 도메인의 단축이 초래되었다(도 7). LH_N 단편의 정제전에 대장균 용해물을 2시간 인큐베이션한 결과, 이쇄 폴리펩티드에서의 완전한 절단이 초래되었다.

천연 루프서열(도 3의 1)에 대응하는 발현 및 정제된 LH_N 단편은 SDS 폴리아크릴아미드 겔상에서 비환원조건 및 환원조건하에서 100 kDa에 해당하는 밴드로 보여졌다. 이 단쇄 폴리펩티드는 트립신에 의한 절단이 되었을 때만이 이황화 가교된 이쇄 LH_N 단편으로 전환되었다.

실시예 2: 변경된 루프를 갖는 보툴리늄 신경 독소 타입 A의 LH _N H _CN 단편의 클로닝 및 발현 및 절단 부위의 특성화

LH_NH_CN 단편(BoNT(A)의 수용체 결합 도메인의 N-말단의 반을 갖는 전좌 도메인)은 프라이머 #3 및 #5(도 6)을 사용한 PCR 증폭으로 생성하였으며, 제한효소부위 Stu I 및 Xho I를 통해 플라스미드 pQE-BoNT(A)-L_mod1내로 클로닝하였다(플라스미드 pQE-BoNT(A)-L_mod1H_NH_CN;서열 #3). 발현 및 정제는 실시예 1에 개시된 대로 수행되었다. SDS 폴리아크릴아미드 겔상에서 분석한 결과, 단쇄 폴리펩티드에 해당하는 약한 밴드이외에 추가적으로 특정되지 않는 밴드, 경쇄 및 H_NH_CN 단편에 해당하는 50 kDa, 75 kDa에 해당하는 밴드가 검출되었다. N-말단 서열분석 결과 상기 H_NH_CN 단편의 처음 4개의 아미노산 잔기는 Ser-Leu-Val-Pro이었다. 대장균 용해물에서의 프로테아제 활성에 의한 절단은 Lys₄₄₀다음에서, 따라서 루프내 삽입된 펜타펩티드 Val-Pro-Arg-Gly-Ser의 N-말단에서 일어났다.

실시예 3: 변경된 루프를 갖는 보툴리늄 신경 독소 타입 B의 LH _N 단편의 클 로닝 및 발현

경쇄 및 전좌 도메인의 DNA 서열 클로닝을 위하여, 클로스트리듐 보툴리늄 타입 B(Okra 균주)의 배양물로부터 염색체 DNA를 분리하였다. 프라이머 #6 및 #7(도6 참조)를 사용한 PCR 증폭에 의해, BoNT(A)의 변경된 루프 서열을 갖는 BoNT(B) 경쇄를 코딩하는 유전자 단편을 생성하였다. 프라이머 #8 및 #9(도6 참조)로, BoNT(B)의 전좌 도메인을 코딩하는 유전자 단편을 생성하였다. 발현 플라스미드 pQE-60 내로의 클로닝은 먼저, pQE-BoNT(A)-L_mod1내 BoNT(A)-L 유전자 단편을 제한효소부위 Nco I 및 Stu I를 통해 BoNT(B)-L_mod1 증폭산물로 교환하는 것으로 실행되었다. 후속하여, BoNT(B)-H_N 증폭산물을 제한효소부위 Stu I 및 Xho I를 통해 그 뒤에 클로닝하여, 플라스미드 pQE-BoNT(B)-L_mod1H_N(서열 #5)를 얻었다. 숙주 균주 M15[pREP4]에서의 발현 및 LH_N 단편의 정제는 실시예 1에 개시된 대로 시행하였다. SDS 폴리아크릴아미드 겔상에서 분석한 결과, 환원조건하에서 약 50 kDa 및 55 kDa에 해당하는 두 밴드가 코마시 염색되고, 반면 비환원조건하에서는 오직 105 kDa에 해당하는 밴드만이 검출되었다(도 8). 이는 LH_N 단편이 박테리아로부터 실질적으로 80% 이상 두 사슬이 이황화 가교로 서로 공유결합된 이쇄 폴리펩티드로서 방출된다는 것을 명백하게 보여준다.

실시예 4: 변경된 루프를 갖는 보툴리늄 신경 독소 타입 C1의 LH _N 단편의 클 로닝 및 발현 및 절단 부위의 특성화

경쇄 및 전좌 도메인의 DNA 서열 클로닝을 위하여, 클로스트리듐 보툴리늄 타입 C1(C205 균주)의 배양물로부터 염색체 DNA를 분리하였다. 프라이머 #10 및 #11(도 6 참조)를 사용한 PCR 증폭에 의해, BoNT(A)의 변경된 루프 서열을 갖는 BoNT(C1) 경쇄를 코딩하는 유전자 단편을 생성하였다. 프라이머 #12 및 #13(도 6 참조)로, BoNT(C1)의 전좌 도메인을 코딩하는 유전자 단편을 생성하였다. 발현 플라스미드 pQE-60 내로의 클로닝은 먼저, pQE-BoNT(A)-L_mod1내 BoNT(A)-L 유전자 단편을 Nco I 및 Stu I에 대한 제한 부위를 통한 BoNT(C1)-L_mod1 증폭산물로 교환하는 것으로 실행되었다. 후속하여, BoNT(C1)-H_N 증폭산물을 Stu I 및 Xho I 에 대한 제한 부위를 통해 그 뒤에 클로닝하여, 플라스미드 pQE-BoNT(C1)-L_mod1H_N(서열 #7)를 얻었다. 숙주 균주 M15[pREP4]에서의 발현 및 LH_N 단편의 정제는 실시예 1에 개시된 대로 시행하였다. SDS 폴리아크릴아미드 겔상에서 분석한 결과, 환원조건하에서 약 50 kDa 및 55 kDa에 해당하는 두 밴드는 코마시 염색되고, 반면 비환원조건하에서는 오직 105 kDa에 해당하는 밴드만이 검출되었다. 이는 LH_N 단편이 박테리아로부터 실질적으로 90% 이상 두 사슬이 이황화 가교로 서로 공유결합된 이쇄 폴리펩티드로서 방출된다는 것을 명백하게 보여준다. N-말단 서열분석 결과 상기 H_N 단편의 처음 의 4개의 아미노산 잔기는 Ser-Leu-Val-Pro이었다. 대장균 용해물에서의 프로테아제 활성에 의한 절단은 Lys₄₄₇ 다음에서, 따라서 BoNT(A) 루프내 삽입된 펜타펩티드 Val-Pro-Arg-Gly-Ser의 N-말단에서 일어났다. 삽입된 펜타펩티드의 아르기닌 잔기를 돌연변이를 유도하여 히스티딘, 티로신 및 글루타민으로 교환하였다. 동일한 방법으로 발현된 돌연변이된 LH_N 단편은 대장균 용해물의 2시간 인큐베이션 후에 90% 이상 이황화 가교된 이쇄형으로 존재하였으며, 그 절단 효율은 펜타펩티드 Val-Pro-Arg-Gly-Ser으로 변경된 BoNT(A)루프를 포함하는 LH_N 단편보다 약간 낮았다.

실시예 5: 변경된 루프를 갖는 재조합 보툴리늄 신경 독소 타입 C1 의 클로닝 및 발현

클로스트리듐 보툴리늄 C205 균주의 염색체 DNA를 사용하고, 프라이머 #12 및 #14(도 6 참조)를 사용하여 중쇄를 코딩하는 유전자 단편을 증폭하였다. 증폭된 유전자 단편을 제한효소부위 Stu I 및 Xho I를 통해 플라스미드 BoNT(C1)-L_mod1H_N내로, 경쇄를 코딩하는 서열 섹션 및 His 태그에 대한 서열사이에 클로닝하였다(플라스미드 pQE-BoNT(C1)-L_mod1H_NH_C;서열 #6). 대응하는 발현 플라스미드로 대장균 발현 균주 M15[pREP4](Qiagen)을 형질전환하였다. 숙주 균주 M15[pREP4]에서의 발현 및 정제는 실시예 1에 개시된 바와 같이 수행하였다. SDS 폴리아크릴아미드 겔상에서 분석한 결과, 환원조건하에서 약 50 kDa 및 105 kDa에 해당하는 두 밴드는 코마시 염색되고, 반면 비환원조건하에서는 오직 155 kDa에 해당하는 밴드만이 검출되었다(도 9). 이는 LH_N 단편이 박테리아로부터 실질적으로 90% 이상 두 사슬이 이황화 가교로 서로 공유결합된 이쇄 폴리펩티드로서 방출된다는 것을 명백하게 보여준다. 편측횡경막 검사(hemidiaphragm assay)에서의 활성 테스트 결과, 독성은 클로스트리듐 보툴리늄에서 분리된 천연 상태의 신경 독소 타입 C1의 독성만큼 매우 높았다. 따라서 경쇄 및 전좌 도메인 사이의 루프 영역의 변경은 독성에는 영향을 미치지 않음을 확인하였다.

실시예 6: 변경된 루프를 갖는 재조합 슈도모나스 외독소 단편( PE40 )의 클로닝 및 발현

슈도모나스 아에루기노사 103 균주의 염색체 DNA를 사용하여, 도메인 III 및 시스테인 잔기 13 및 36 사이의 루프의 C-말단에 위치하는 도메인 II 영역을 코딩하는 유전자 단편을 프라이머 #17 및 #18(도 6)을 사용하여 PCR 증폭하였다. 이 증폭 산물을 플라스미드 제한효소부위 Nco I 및 Mlu I을 통해 유전자 단편 BoNT(A)-L_mod1을 교환하여 플라스미드 pQE-BoNT(A)-L_mod1에 클로닝하였다(플라스미드 pQE-PEII₃ III). 루프의 N-말단인 도메인 II 영역을 위한 서열 섹션은 올리고뉴클레오티드 # 15 및 #16(도 6)의 혼성화하고 Nco I 및 Kpn I에 대한 제한 부위를 통해 플라스미 드 pQE-PEII₃ III에 삽입하였다(플라스미드 pQE-PEII_mod III; 서열 #9). 대응하는 발현 플라스미드로 대장균 발현 균주 M15[pREP4](Qiagen)을 형질전환하였다. 숙주 균주 M15[pREP4]에서의 발현 및 정제는 실시예 1에 개시된 바와 같이 수행하였다. SDS 겔상에서 분석한 결과, 환원조건하에서 40 kDa의 약한 밴드 및 37 kDa의 강한 밴드가 나타났다. 그러나 비환원조건하에서는 오직 40 kDa에 해당하는 하나의 밴드만이 관찰되었다. 친화성 크로마토그래피로 정제하기 전에 실온에서 2시간 이상 상기 세포 용해물을 인큐베이션하였을 때, 40 kDa에 해당하는 밴드는 환원 조건하에서 더 이상 검출되지 않았다. PE40의 도메인 II 단편의 시스테인 잔기 13 및 36 사이의 루프 영역을 변경된 BoNT(A)로 교환함으로써, 폴리펩티드 사슬의 절단이 일어났으며, 상기 전술한 시스테인 잔기가 이황화 가교를 형성하였다. 약 3 kDa의 N-말단 단편은 12% SDS 겔에서의 환원 후 더 이상 검출되지 않았다.

실시예 7: 변경된 루프를 갖는 재조합 디프테리아 독소 단편( DT389 )의 클로닝 및 발현

코리네박테리움 디프테리아 NCTC 13129 균주의 염색체 DNA를 사용하여, 디프테리아 독소의 A-사슬을 코딩하는 유전자 단편을 프라이머 #19 및 #20(도 6)을 사용하여 PCR 증폭하였다. Nco I 및 Stu I 제한 효소 부위를 통해 증폭 산물을 플라스미드 pQE-BoNT(A)-L_mod1(실시예 1 참조)에 클로닝하였다(플라스미드 pQE-DT-A_mod1). 동일한 방식으로 B-사슬의 N-말단 단편을 코딩하는 유전자 단편을 프라이머 #21 및 #22(도 6)을 이용하여 증폭하고, Stu I 및 Xho I 제한효소부위를 통해 pQE-DT-A_mod1에 클로닝하였다(플라스미드 pQE-DT389-mod1; 서열 #10). 대응하는 발현 플라스미드로 대장균 발현균주 M15[pREP4](Qiagen)을 형질전환하였다. 숙주 균주 M15[pREP4]에서의 발현 및 정제는 실시예 1에 개시된 바와 같이 수행하였다. SDS 겔상에서 분석한 결과, 환원조건하에는 약 22 kDa에 두개의 밴드가 코마시염색되었고, 비환원 조건하에서는 약 43 kDa에 하나의 밴드가 관찰되었다. 이는 재조합 디프테리아 독소 단편이 박테리아로부터 두 사슬이 서로 이황화 가교로 공유적으로 연결되어 있는 이쇄 폴리펩티드로 90% 이상 방출된다는 것을 명백히 보여준다.

실시예 8: 변경된 루프를 갖는 재조합 라이신의 클로닝 및 발현

라이시누스 코뮤니스의 종자 mRNA를 사용하여, 라이신의 A-사슬을 코딩하는 유전자 단편을 프라이머 #23 및 #24(도 6)을 사용하여 RT-PCR로 증폭하였다. 이 증폭산물을 Nco I 및 Xho I 제한효소부위를 통해 플라스미드 pQE-BoNT(A)-L_mod1(실시예 1 참조)내로 클로닝하였다(플라스미드 pQE-ricin-A). 동일한 방식으로 B-사슬을 코딩하는 유전자 단편을 프라이머 #25 및 #26(도 6)을 이용하여 증폭하고, Kpn I 및 Xho I 제한 효소 부위를 통해 pQE-ricin-A에 클로닝하였다(플라스미드 pQE-ricin-mod1;서열 #11). 대응하는 발현 플라스미드로 대장균 발현 균주 M15[pREP4] (Qiagen)을 형질전환하였다. 숙주 균주 M15[pREP4]에서의 발현 및 발현된 라이신의 가용성 부분의 정제는 실시예 1에 개시된 것과 유사하게 수행하였다. SDS 겔 상에서 분석한 결과, 환원조건하에는 약 19 kDa 및 42 kDa에 두개의 밴드가 코마시염색되었고, 비환원 조건하에서는 약 62 kDa에 하나의 밴드가 관찰되었다. 이는 재조합 라이신의 가용성 부분이 박테리아로부터 두 사슬이 서로 이황화 가교로 공유적으로 연결되어 있는 이쇄 폴리펩티드로 90% 이상 방출된다는 것을 명백히 보여준다.

과학 문헌

Arora 등. (1999), Cancer Res. 59:183-8

Collier (2001), Toxicon 39 (11): 1793-803

Fujinaga (1997), Microbiology 143: 3841-47

Ogata 등. (1990), J. Biol. Chem 265(33): 20678-85

Reiter (2001), Adv. Cancer Res. 81: 93-124

Schiavo 및 Montecucco (1997), The Clostridia: Molecular Biology and Pathogenesis, Academic Press, San Diego: 295-322

Williams 등. (1990) J. Biol Chem, 265(33): 20673-77

특허문헌

Borgford, 미국 특허 제6,593,132호

Brown 및 Jones, WO 제89/04839호

Fitzgerald 등., 미국 특허 제6,426,075호

Pastan 등., 미국 특허 제5,980,895호

SEQUENCE LISTING <110> BioteCon Therapeutics GmbH <120> Recombinant Expression of Proteins in a Disulfide-Bridged Two-Chain Form <130> IP2007944/FR <140> PCT/DE 2006/000088 <141> 2006-01-20 <150> 10 2005 002978.7 <151> 2005-01-21 <160> 22 <170> KopatentIn 1.71 <210> 1 <211> 3915 <212> DNA <213> Clostridium botulinum <400> 1 atggcatttg ttaataaaca atttaattat aaagatcctg taaatggtgt tgatattgct 60 tatataaaaa ttccaaatgc aggacaaatg caaccagtaa aagcttttaa aattcataat 120 aaaatatggg ttattccaga aagagataca tttacaaatc ctgaagaagg agatttaaat 180 ccaccaccag aagcaaaaca agttccagtt tcatattatg attcaacata tttaagtaca 240 gataatgaaa aagataatta tttaaaggga gttacaaaat tatttgagag aatttattca 300 actgatcttg gaagaatgtt gttaacatca atagtaaggg gaataccatt ttggggtgga 360 agtacaatag atacagaatt aaaagttatt gatactaatt gtattaatgt gatacaacca 420 gatggtagtt atagatcaga agaacttaat ctagtaataa taggaccctc agctgatatt 480 atacagtttg aatgtaaaag ctttggacat gaagttttga atcttacgcg aaatggttat 540 ggctctactc aatacattag atttagccca gattttacat ttggttttga ggagtcactt 600 gaagttgata caaatcctct tttaggtgca ggcaaatttg ctacagatcc agcagtaaca 660 ttagcacatg aacttataca tgctggacat agattatatg gaatagcaat taatccaaat 720 agggttttta aagtaaatac taatgcctat tatgaaatga gtgggttaga agtaagcttt 780 gaggaactta gaacatttgg gggacatgat gcaaagttta tagatagttt acaggaaaac 840 gaatttcgtc tatattatta taataagttt aaagatatag caagtacact taataaagct 900 aaatcaatag taggtactac tgcttcatta cagtatatga aaaatgtttt taaagagaaa 960 tatctcctat ctgaagatac atctggaaaa ttttcggtag ataaattaaa atttgataag 1020 ttatacaaaa tgttaacaga gatttacaca gaggataatt ttgttaagtt ttttaaagta 1080 cttaacagaa aaacatattt gaattttgat aaagccgtat ttaagataaa tatagtacct 1140 aaggtaaatt acacaatata tgatggattt aatttaagaa atacaaattt agcagcaaac 1200 tttaatggtc aaaatacaga aattaataat atgaatttta ctaaactaaa aaattttact 1260 ggattgtttg aattttataa gttgctatgt gtaagaggga taataacttc taaaactaaa 1320 tcattagttc cgcgtggatc caaggcctta aatgatttat gtatcaaagt taataattgg 1380 gacttgtttt ttagtccttc agaagataat tttactaatg atctaaataa aggagaagaa 1440 attacatctg atactaatat agaagcagca gaagaaaata ttagtttaga tttaatacaa 1500 caatattatt taacctttaa ttttgataat gaacctgaaa atatttcaat agaaaatctt 1560 tcaagtgaca ttataggcca attagaactt atgcctaata tagaaagatt tcctaatgga 1620 aaaaagtatg agttagataa atatactatg ttccattatc ttcgtgctca agaatttgaa 1680 catggtaaat ctaggattgc tttaacaaat tctgttaacg aagcattatt aaatcctagt 1740 cgtgtttata catttttttc ttcagactat gtaaagaaag ttaataaagc tacggaggca 1800 gctatgtttt taggctgggt agaacaatta gtatatgatt ttaccgatga aactagcgaa 1860 gtaagtacta cggataaaat tgcggatata actataatta ttccatatat aggacctgct 1920 ttaaatatag gtaatatgtt atataaagat gattttgtag gtgctttaat attttcagga 1980 gctgttattc tgttagaatt tataccagag attgcaatac ctgtattagg tacttttgca 2040 cttgtatcat atattgcgaa taaggttcta accgttcaaa caatagataa tgctttaagt 2100 aaaagaaatg aaaaatggga tgaggtctat aaatatatag taacaaattg gttagcaaag 2160 gttaatacac agattgatct aataagaaaa aaaatgaaag aagctttaga aaatcaagca 2220 gaagcaacaa aggctataat aaactatcag tataatcaat atactgagga agagaaaaat 2280 aatattaatt ttaatattga tgatttaagt tcgaaactta atgagtctat aaataaagct 2340 atgattaata taaataaatt tttgaatcaa tgctctgttt catatttaat gaattctatg 2400 atcccttatg gtgttaaacg gttagaagat tttgatgcta gtcttaaaga tgcattatta 2460 aagtatatat atgataatag aggaacttta attggtcaag tagatagatt aaaagataaa 2520 gttaataata cacttagtac agatatacct tttcagcttt ccaaatacgt agataatcaa 2580 agattattat ctacatttac tgaatatatt aagaatatta ttaatacttc tatattgaat 2640 ttaagatatg aaagtaatca tttaatagac ttatctaggt atgcatcaaa aataaatatt 2700 ggtagtaaag taaattttga tccaatagat aaaaatcaaa ttcaattatt taatttagaa 2760 agtagtaaaa ttgaggtaat tttaaaaaat gctattgtat ataatagtat gtatgaaaat 2820 tttagtacta gcttttggat aagaattcct aagtatttta acagtataag tctaaataat 2880 gaatatacaa taataaattg tatggaaaat aattcaggat ggaaagtatc acttaattat 2940 ggtgaaataa tctggacttt acaggatact caggaaataa aacaaagagt agtttttaaa 3000 tacagtcaaa tgattaatat atcagattat ataaacagat ggatttttgt aactatcact 3060 aataatagat taaataactc taaaatttat ataaatggaa gattaataga tcaaaaacca 3120 atttcaaatt taggtaatat tcatgctagt aataatataa tgtttaaatt agatggttgt 3180 agagatacac atagatatat ttggataaaa tattttaatc tttttgataa ggaattaaat 3240 gaaaaagaaa tcaaagattt atatgataat caatcaaatt caggtatttt aaaagacttt 3300 tggggtgatt atttacaata tgataaacca tactatatgt taaatttata tgatccaaat 3360 aaatatgtcg atgtaaataa tgtaggtatt agaggttata tgtatcttaa agggcctaga 3420 ggtagcgtaa tgactacaaa catttattta aattcaagtt tgtatagggg gacaaaattt 3480 attataaaaa aatatgcttc tggaaataaa gataatattg ttagaaataa tgatcgtgta 3540 tatattaatg tagtagttaa aaataaagaa tataggttag ctactaatgc atcacaggca 3600 ggcgtagaaa aaatactaag tgcattagaa atacctgatg taggaaatct aagtcaagta 3660 gtagtaatga agtcaaaaaa tgatcaagga ataacaaata aatgcaaaat gaatttacaa 3720 gataataatg ggaatgatat aggctttata ggatttcatc agtttaataa tatagctaaa 3780 ctagtagcaa gtaattggta taatagacaa atagaaagat ctagtaggac tttgggttgc 3840 tcatgggaat ttattcctgt agatgatgga tggggagaaa ggccactgct cgagcaccac 3900 caccaccacc actaa 3915 <210> 2 <211> 1304 <212> PRT <213> Clostridium botulinum <400> 2 Met Ala Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly 1 5 10 15 Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Val Gly Gln Met Gln Pro 20 25 30 Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro Glu Arg 35 40 45 Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu 50 55 60 Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr 65 70 75 80 Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu 85 90 95 Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser Ile Val 100 105 110 Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys 115 120 125 Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr 130 135 140 Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala Asp Ile 145 150 155 160 Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn Leu Thr 165 170 175 Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe 180 185 190 Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro Leu Leu 195 200 205 Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala His Glu 210 215 220 Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn 225 230 235 240 Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu 245 250 255 Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp Ala Lys 260 265 270 Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn 275 280 285 Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser Ile Val 290 295 300 Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys Glu Lys 305 310 315 320 Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp Lys Leu 325 330 335 Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp 340 345 350 Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn 355 360 365 Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val Asn Tyr 370 375 380 Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn 385 390 395 400 Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr Lys Leu 405 410 415 Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys Val Arg 420 425 430 Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys 435 440 445 Ala Leu Asn Asp Leu Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe 450 455 460 Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu 465 470 475 480 Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu 485 490 495 Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro 500 505 510 Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu 515 520 525 Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu 530 535 540 Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu 545 550 555 560 His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu 565 570 575 Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys 580 585 590 Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu 595 600 605 Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr 610 615 620 Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala 625 630 635 640 Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu 645 650 655 Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala 660 665 670 Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys 675 680 685 Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu 690 695 700 Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys 705 710 715 720 Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu 725 730 735 Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn 740 745 750 Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp 755 760 765 Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile 770 775 780 Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met 785 790 795 800 Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys 805 810 815 Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly 820 825 830 Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp 835 840 845 Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser 850 855 860 Thr Phe Thr Glu Tyr Ile Lys Asn Ile Ile Asn Thr Ser Ile Leu Asn 865 870 875 880 Leu Arg Tyr Glu Ser Asn His Leu Ile Asp Leu Ser Arg Tyr Ala Ser 885 890 895 Lys Ile Asn Ile Gly Ser Lys Val Asn Phe Asp Pro Ile Asp Lys Asn 900 905 910 Gln Ile Gln Leu Phe Asn Leu Glu Ser Ser Lys Ile Glu Val Ile Leu 915 920 925 Lys Asn Ala Ile Val Tyr Asn Ser Met Tyr Glu Asn Phe Ser Thr Ser 930 935 940 Phe Trp Ile Arg Ile Pro Lys Tyr Phe Asn Ser Ile Ser Leu Asn Asn 945 950 955 960 Glu Tyr Thr Ile Ile Asn Cys Met Glu Asn Asn Ser Gly Trp Lys Val 965 970 975 Ser Leu Asn Tyr Gly Glu Ile Ile Trp Thr Leu Gln Asp Thr Gln Glu 980 985 990 Ile Lys Gln Arg Val Val Phe Lys Tyr Ser Gln Met Ile Asn Ile Ser 995 1000 1005 Asp Tyr Ile Asn Arg Trp Ile Phe Val Thr Ile Thr Asn Asn Arg 1010 1015 1020 Leu Asn Asn Ser Lys Ile Tyr Ile Asn Gly Arg Leu Ile Asp Gln 1025 1030 1035 Lys Pro Ile Ser Asn Leu Gly Asn Ile His Ala Ser Asn Asn Ile 1040 1045 1050 Met Phe Lys Leu Asp Gly Cys Arg Asp Thr His Arg Tyr Ile Trp 1055 1060 1065 Ile Lys Tyr Phe Asn Leu Phe Asp Lys Glu Leu Asn Glu Lys Glu 1070 1075 1080 Ile Lys Asp Leu Tyr Asp Asn Gln Ser Asn Ser Gly Ile Leu Lys 1085 1090 1095 Asp Phe Trp Gly Asp Tyr Leu Gln Tyr Asp Lys Pro Tyr Tyr Met 1100 1105 1110 Leu Asn Leu Tyr Asp Pro Asn Lys Tyr Val Asp Val Asn Asn Val 1115 1120 1125 Gly Ile Arg Gly Tyr Met Tyr Leu Lys Gly Pro Arg Gly Ser Val 1130 1135 1140 Met Thr Thr Asn Ile Tyr Leu Asn Ser Ser Leu Tyr Arg Gly Thr 1145 1150 1155 Lys Phe Ile Ile Lys Lys Tyr Ala Ser Gly Asn Lys Asp Asn Ile 1160 1165 1170 Val Arg Asn Asn Asp Arg Val Tyr Ile Asn Val Val Val Lys Asn 1175 1180 1185 Lys Glu Tyr Arg Leu Ala Thr Asn Ala Ser Gln Ala Gly Val Glu 1190 1195 1200 Lys Ile Leu Ser Ala Leu Glu Ile Pro Asp Val Gly Asn Leu Ser 1205 1210 1215 Gln Val Val Val Met Lys Ser Lys Asn Asp Gln Gly Ile Thr Asn 1220 1225 1230 Lys Cys Lys Met Asn Leu Gln Asp Asn Asn Gly Asn Asp Ile Gly 1235 1240 1245 Phe Ile Gly Phe His Gln Phe Asn Asn Ile Ala Lys Leu Val Ala 1250 1255 1260 Ser Asn Trp Tyr Asn Arg Gln Ile Glu Arg Ser Ser Arg Thr Leu 1265 1270 1275 Gly Cys Ser Trp Glu Phe Ile Pro Val Asp Asp Gly Trp Gly Glu 1280 1285 1290 Arg Pro Leu Leu Glu His His His His His His 1295 1300 <210> 3 <211> 2646 <212> DNA <213> Clostridium botulinum <400> 3 atggcatttg ttaataaaca atttaattat aaagatcctg taaatggtgt tgatattgct 60 tatataaaaa ttccaaatgc aggacaaatg caaccagtaa aagcttttaa aattcataat 120 aaaatatggg ttattccaga aagagataca tttacaaatc ctgaagaagg agatttaaat 180 ccaccaccag aagcaaaaca agttccagtt tcatattatg attcaacata tttaagtaca 240 gataatgaaa aagataatta tttaaaggga gttacaaaat tatttgagag aatttattca 300 actgatcttg gaagaatgtt gttaacatca atagtaaggg gaataccatt ttggggtgga 360 agtacaatag atacagaatt aaaagttatt gatactaatt gtattaatgt gatacaacca 420 gatggtagtt atagatcaga agaacttaat ctagtaataa taggaccctc agctgatatt 480 atacagtttg aatgtaaaag ctttggacat gaagttttga atcttacgcg aaatggttat 540 ggctctactc aatacattag atttagccca gattttacat ttggttttga ggagtcactt 600 gaagttgata caaatcctct tttaggtgca ggcaaatttg ctacagatcc agcagtaaca 660 ttagcacatg aacttataca tgctggacat agattatatg gaatagcaat taatccaaat 720 agggttttta aagtaaatac taatgcctat tatgaaatga gtgggttaga agtaagcttt 780 gaggaactta gaacatttgg gggacatgat gcaaagttta tagatagttt acaggaaaac 840 gaatttcgtc tatattatta taataagttt aaagatatag caagtacact taataaagct 900 aaatcaatag taggtactac tgcttcatta cagtatatga aaaatgtttt taaagagaaa 960 tatctcctat ctgaagatac atctggaaaa ttttcggtag ataaattaaa atttgataag 1020 ttatacaaaa tgttaacaga gatttacaca gaggataatt ttgttaagtt ttttaaagta 1080 cttaacagaa aaacatattt gaattttgat aaagccgtat ttaagataaa tatagtacct 1140 aaggtaaatt acacaatata tgatggattt aatttaagaa atacaaattt agcagcaaac 1200 tttaatggtc aaaatacaga aattaataat atgaatttta ctaaactaaa aaattttact 1260 ggattgtttg aattttataa gttgctatgt gtaagaggga taataacttc taaaactaaa 1320 tcattagttc cgcgtggatc caaggcctta aatgatttat gtatcaaagt taataattgg 1380 gacttgtttt ttagtccttc agaagataat tttactaatg atctaaataa aggagaagaa 1440 attacatctg atactaatat agaagcagca gaagaaaata ttagtttaga tttaatacaa 1500 caatattatt taacctttaa ttttgataat gaacctgaaa atatttcaat agaaaatctt 1560 tcaagtgaca ttataggcca attagaactt atgcctaata tagaaagatt tcctaatgga 1620 aaaaagtatg agttagataa atatactatg ttccattatc ttcgtgctca agaatttgaa 1680 catggtaaat ctaggattgc tttaacaaat tctgttaacg aagcattatt aaatcctagt 1740 cgtgtttata catttttttc ttcagactat gtaaagaaag ttaataaagc tacggaggca 1800 gctatgtttt taggctgggt agaacaatta gtatatgatt ttaccgatga aactagcgaa 1860 gtaagtacta cggataaaat tgcggatata actataatta ttccatatat aggacctgct 1920 ttaaatatag gtaatatgtt atataaagat gattttgtag gtgctttaat attttcagga 1980 gctgttattc tgttagaatt tataccagag attgcaatac ctgtattagg tacttttgca 2040 cttgtatcat atattgcgaa taaggttcta accgttcaaa caatagataa tgctttaagt 2100 aaaagaaatg aaaaatggga tgaggtctat aaatatatag taacaaattg gttagcaaag 2160 gttaatacac agattgatct aataagaaaa aaaatgaaag aagctttaga aaatcaagca 2220 gaagcaacaa aggctataat aaactatcag tataatcaat atactgagga agagaaaaat 2280 aatattaatt ttaatattga tgatttaagt tcgaaactta atgagtctat aaataaagct 2340 atgattaata taaataaatt tttgaatcaa tgctctgttt catatttaat gaattctatg 2400 atcccttatg gtgttaaacg gttagaagat tttgatgcta gtcttaaaga tgcattatta 2460 aagtatatat atgataatag aggaacttta attggtcaag tagatagatt aaaagataaa 2520 gttaataata cacttagtac agatatacct tttcagcttt ccaaatacgt agataatcaa 2580 agattattat ctacatttac tgaatatatt aagaatattc tcgagcacca ccaccaccac 2640 cactaa 2646 <210> 4 <211> 881 <212> PRT <213> Clostridium botulinum <400> 4 Met Ala Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly 1 5 10 15 Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Val Gly Gln Met Gln Pro 20 25 30 Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro Glu Arg 35 40 45 Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu 50 55 60 Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr 65 70 75 80 Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu 85 90 95 Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser Ile Val 100 105 110 Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys 115 120 125 Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr 130 135 140 Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala Asp Ile 145 150 155 160 Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn Leu Thr 165 170 175 Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe 180 185 190 Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro Leu Leu 195 200 205 Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala His Glu 210 215 220 Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn 225 230 235 240 Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu 245 250 255 Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp Ala Lys 260 265 270 Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn 275 280 285 Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser Ile Val 290 295 300 Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys Glu Lys 305 310 315 320 Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp Lys Leu 325 330 335 Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp 340 345 350 Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn 355 360 365 Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val Asn Tyr 370 375 380 Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn 385 390 395 400 Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr Lys Leu 405 410 415 Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys Val Arg 420 425 430 Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys 435 440 445 Ala Leu Asn Asp Leu Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe 450 455 460 Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu 465 470 475 480 Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu 485 490 495 Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro 500 505 510 Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu 515 520 525 Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu 530 535 540 Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu 545 550 555 560 His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu 565 570 575 Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys 580 585 590 Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu 595 600 605 Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr 610 615 620 Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala 625 630 635 640 Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu 645 650 655 Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala 660 665 670 Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys 675 680 685 Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu 690 695 700 Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys 705 710 715 720 Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu 725 730 735 Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn 740 745 750 Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp 755 760 765 Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile 770 775 780 Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met 785 790 795 800 Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys 805 810 815 Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly 820 825 830 Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp 835 840 845 Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser 850 855 860 Thr Phe Thr Glu Tyr Ile Lys Asn Ile Leu Glu His His His His His 865 870 875 880 His <210> 5 <211> 3312 <212> DNA <213> Clostridium botulinum <400> 5 atggcatttg ttaataaaca atttaattat aaagatcctg taaatggtgt tgatattgct 60 tatataaaaa ttccaaatgc aggacaaatg caaccagtaa aagcttttaa aattcataat 120 aaaatatggg ttattccaga aagagataca tttacaaatc ctgaagaagg agatttaaat 180 ccaccaccag aagcaaaaca agttccagtt tcatattatg attcaacata tttaagtaca 240 gataatgaaa aagataatta tttaaaggga gttacaaaat tatttgagag aatttattca 300 actgatcttg gaagaatgtt gttaacatca atagtaaggg gaataccatt ttggggtgga 360 agtacaatag atacagaatt aaaagttatt gatactaatt gtattaatgt gatacaacca 420 gatggtagtt atagatcaga agaacttaat ctagtaataa taggaccctc agctgatatt 480 atacagtttg aatgtaaaag ctttggacat gaagttttga atcttacgcg aaatggttat 540 ggctctactc aatacattag atttagccca gattttacat ttggttttga ggagtcactt 600 gaagttgata caaatcctct tttaggtgca ggcaaatttg ctacagatcc agcagtaaca 660 ttagcacatg aacttataca tgctggacat agattatatg gaatagcaat taatccaaat 720 agggttttta aagtaaatac taatgcctat tatgaaatga gtgggttaga agtaagcttt 780 gaggaactta gaacatttgg gggacatgat gcaaagttta tagatagttt acaggaaaac 840 gaatttcgtc tatattatta taataagttt aaagatatag caagtacact taataaagct 900 aaatcaatag taggtactac tgcttcatta cagtatatga aaaatgtttt taaagagaaa 960 tatctcctat ctgaagatac atctggaaaa ttttcggtag ataaattaaa atttgataag 1020 ttatacaaaa tgttaacaga gatttacaca gaggataatt ttgttaagtt ttttaaagta 1080 cttaacagaa aaacatattt gaattttgat aaagccgtat ttaagataaa tatagtacct 1140 aaggtaaatt acacaatata tgatggattt aatttaagaa atacaaattt agcagcaaac 1200 tttaatggtc aaaatacaga aattaataat atgaatttta ctaaactaaa aaattttact 1260 ggattgtttg aattttataa gttgctatgt gtaagaggga taataacttc taaaactaaa 1320 tcattagttc cgcgtggatc caaggcctta aatgatttat gtatcaaagt taataattgg 1380 gacttgtttt ttagtccttc agaagataat tttactaatg atctaaataa aggagaagaa 1440 attacatctg atactaatat agaagcagca gaagaaaata ttagtttaga tttaatacaa 1500 caatattatt taacctttaa ttttgataat gaacctgaaa atatttcaat agaaaatctt 1560 tcaagtgaca ttataggcca attagaactt atgcctaata tagaaagatt tcctaatgga 1620 aaaaagtatg agttagataa atatactatg ttccattatc ttcgtgctca agaatttgaa 1680 catggtaaat ctaggattgc tttaacaaat tctgttaacg aagcattatt aaatcctagt 1740 cgtgtttata catttttttc ttcagactat gtaaagaaag ttaataaagc tacggaggca 1800 gctatgtttt taggctgggt agaacaatta gtatatgatt ttaccgatga aactagcgaa 1860 gtaagtacta cggataaaat tgcggatata actataatta ttccatatat aggacctgct 1920 ttaaatatag gtaatatgtt atataaagat gattttgtag gtgctttaat attttcagga 1980 gctgttattc tgttagaatt tataccagag attgcaatac ctgtattagg tacttttgca 2040 cttgtatcat atattgcgaa taaggttcta accgttcaaa caatagataa tgctttaagt 2100 aaaagaaatg aaaaatggga tgaggtctat aaatatatag taacaaattg gttagcaaag 2160 gttaatacac agattgatct aataagaaaa aaaatgaaag aagctttaga aaatcaagca 2220 gaagcaacaa aggctataat aaactatcag tataatcaat atactgagga agagaaaaat 2280 aatattaatt ttaatattga tgatttaagt tcgaaactta atgagtctat aaataaagct 2340 atgattaata taaataaatt tttgaatcaa tgctctgttt catatttaat gaattctatg 2400 atcccttatg gtgttaaacg gttagaagat tttgatgcta gtcttaaaga tgcattatta 2460 aagtatatat atgataatag aggaacttta attggtcaag tagatagatt aaaagataaa 2520 gttaataata cacttagtac agatatacct tttcagcttt ccaaatacgt agataatcaa 2580 agattattat ctacatttac tgaatatatt aagaatatta ttaatacttc tatattgaat 2640 ttaagatatg aaagtaatca tttaatagac ttatctaggt atgcatcaaa aataaatatt 2700 ggtagtaaag taaattttga tccaatagat aaaaatcaaa ttcaattatt taatttagaa 2760 agtagtaaaa ttgaggtaat tttaaaaaat gctattgtat ataatagtat gtatgaaaat 2820 tttagtacta gcttttggat aagaattcct aagtatttta acagtataag tctaaataat 2880 gaatatacaa taataaattg tatggaaaat aattcaggat ggaaagtatc acttaattat 2940 ggtgaaataa tctggacttt acaggatact caggaaataa aacaaagagt agtttttaaa 3000 tacagtcaaa tgattaatat atcagattat ataaacagat ggatttttgt aactatcact 3060 aataatagat taaataactc taaaatttat ataaatggaa gattaataga tcaaaaacca 3120 atttcaaatt taggtaatat tcatgctagt aataatataa tgtttaaatt agatggttgt 3180 agagatacac atagatatat ttggataaaa tattttaatc tttttgataa ggaattaaat 3240 gaaaaagaaa tcaaagattt atatgataat caatcaaatt caggtctcga gcaccaccac 3300 caccaccact aa 3312 <210> 6 <211> 1103 <212> PRT <213> Clostridium botulinum <400> 6 Met Ala Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly 1 5 10 15 Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Val Gly Gln Met Gln Pro 20 25 30 Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro Glu Arg 35 40 45 Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu 50 55 60 Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr 65 70 75 80 Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu 85 90 95 Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser Ile Val 100 105 110 Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys 115 120 125 Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr 130 135 140 Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala Asp Ile 145 150 155 160 Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn Leu Thr 165 170 175 Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe 180 185 190 Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro Leu Leu 195 200 205 Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala His Glu 210 215 220 Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn 225 230 235 240 Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu 245 250 255 Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp Ala Lys 260 265 270 Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn 275 280 285 Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser Ile Val 290 295 300 Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys Glu Lys 305 310 315 320 Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp Lys Leu 325 330 335 Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp 340 345 350 Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn 355 360 365 Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val Asn Tyr 370 375 380 Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn 385 390 395 400 Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr Lys Leu 405 410 415 Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys Val Arg 420 425 430 Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys 435 440 445 Ala Leu Asn Asp Leu Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe 450 455 460 Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu 465 470 475 480 Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu 485 490 495 Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro 500 505 510 Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu 515 520 525 Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu 530 535 540 Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu 545 550 555 560 His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu 565 570 575 Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys 580 585 590 Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu 595 600 605 Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr 610 615 620 Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala 625 630 635 640 Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu 645 650 655 Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala 660 665 670 Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys 675 680 685 Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu 690 695 700 Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys 705 710 715 720 Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu 725 730 735 Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn 740 745 750 Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp 755 760 765 Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile 770 775 780 Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met 785 790 795 800 Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys 805 810 815 Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly 820 825 830 Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp 835 840 845 Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser 850 855 860 Thr Phe Thr Glu Tyr Ile Lys Asn Ile Ile Asn Thr Ser Ile Leu Asn 865 870 875 880 Leu Arg Tyr Glu Ser Asn His Leu Ile Asp Leu Ser Arg Tyr Ala Ser 885 890 895 Lys Ile Asn Ile Gly Ser Lys Val Asn Phe Asp Pro Ile Asp Lys Asn 900 905 910 Gln Ile Gln Leu Phe Asn Leu Glu Ser Ser Lys Ile Glu Val Ile Leu 915 920 925 Lys Asn Ala Ile Val Tyr Asn Ser Met Tyr Glu Asn Phe Ser Thr Ser 930 935 940 Phe Trp Ile Arg Ile Pro Lys Tyr Phe Asn Ser Ile Ser Leu Asn Asn 945 950 955 960 Glu Tyr Thr Ile Ile Asn Cys Met Glu Asn Asn Ser Gly Trp Lys Val 965 970 975 Ser Leu Asn Tyr Gly Glu Ile Ile Trp Thr Leu Gln Asp Thr Gln Glu 980 985 990 Ile Lys Gln Arg Val Val Phe Lys Tyr Ser Gln Met Ile Asn Ile Ser 995 1000 1005 Asp Tyr Ile Asn Arg Trp Ile Phe Val Thr Ile Thr Asn Asn Arg 1010 1015 1020 Leu Asn Asn Ser Lys Ile Tyr Ile Asn Gly Arg Leu Ile Asp Gln 1025 1030 1035 Lys Pro Ile Ser Asn Leu Gly Asn Ile His Ala Ser Asn Asn Ile 1040 1045 1050 Met Phe Lys Leu Asp Gly Cys Arg Asp Thr His Arg Tyr Ile Trp 1055 1060 1065 Ile Lys Tyr Phe Asn Leu Phe Asp Lys Glu Leu Asn Glu Lys Glu 1070 1075 1080 Ile Lys Asp Leu Tyr Asp Asn Gln Ser Asn Ser Gly Leu Glu His 1085 1090 1095 His His His His His 1100 <210> 7 <211> 3942 <212> DNA <213> Clostridium botulinum <400> 7 atggcagtta caataaataa ttttaattat aatgatccta ttgataataa taatattatt 60 atgatggagc ctccatttgc gagaggtacg gggagatatt ataaagcttt taaaatcaca 120 gatcgtattt ggataatacc ggaaagatat acttttggat ataaacctga ggattttaat 180 aaaagttccg gtatttttaa tagagatgtt tgtgaatatt atgatccaga ttacttaaat 240 actaatgata aaaagaatat atttttacaa acaatgatca agttatttaa tagaatcaaa 300 tcaaaaccat tgggtgaaaa gttattagag atgattataa atggtatacc ttatcttgga 360 gatagacgtg ttccactcga agagtttaac acaaacattg ctagtgtaac tgttaataaa 420 ttaatcagta atccaggaga agtggagcga aaaaaaggta ttttcgcaaa tttaataata 480 tttggacctg ggccagtttt aaatgaaaat gagactatag atataggtat acaaaatcat 540 tttgcatcaa gggaaggctt cgggggtata atgcaaatga agttttgccc agaatatgta 600 agcgtattta ataatgttca agaaaacaaa ggcgcaagta tatttaatag acgtggatat 660 ttttcagatc cagccttgat attaatgcat gaacttatac atgttttaca tggattatat 720 ggcattaaag tagatgattt accaattgta ccaaatgaaa aaaaattttt tatgcaatct 780 acagatgcta tacaggcaga agaactatat acatttggag gacaagatcc cagcatcata 840 actccttcta cggataaaag tatctatgat aaagttttgc aaaattttag agggatagtt 900 gatagactta acaaggtttt agtttgcata tcagatccta acattaatat taatatatat 960 aaaaataaat ttaaagataa atataaattc gttgaagatt ctgagggaaa atatagtata 1020 gatgtagaaa gttttgataa attatataaa agcttaatgt ttggttttac agaaactaat 1080 atagcagaaa attataaaat aaaaactaga gcttcttatt ttagtgattc cttaccacca 1140 gtaaaaataa aaaatttatt agataatgaa atctatacta tagaggaagg gtttaatata 1200 tctgataaag atatggaaaa agaatataga ggtcagaata aagctataaa taaacaagct 1260 tatgaagaaa ttagcaagga gcatttggct gtatataaga tacaaatgtg taaaagtggg 1320 ataataactt ctaaaactaa atcattggtt ccacgtggat ccaaggcctc aggaatatgt 1380 attgatgttg ataatgaaga tttgttcttt atagctgata aaaatagttt ttcagatgat 1440 ttatctaaaa acgaaagaat agaatataat acacagagta attatataga aaatgacttc 1500 cctataaatg aattaatttt agatactgat ttaataagta aaatagaatt accaagtgaa 1560 aatacagaat cacttactga ttttaatgta gatgttccag tatatgaaaa acaacccgct 1620 ataaaaaaaa tttttacaga tgaaaatacc atctttcaat atttatactc tcagacattt 1680 cctctagata taagagatat aagtttaaca tcttcatttg atgatgcatt attattttct 1740 aacaaagttt attcattttt ttctatggat tatattaaaa ctgctaataa agtggtagaa 1800 gcaggattat ttgcaggttg ggtgaaacag atagtaaatg attttgtaat cgaagctaat 1860 aaaagcaata ctatggataa aattgcagat atatctctaa ttgttcctta tataggatta 1920 gctttaaatg taggaaatga aacagctaaa ggaaattttg aaaatgcttt tgagattgca 1980 ggagccagta ttctactaga atttatacca gaacttttaa tacctgtagt tggagccttt 2040 ttattagaat catatattga caataaaaat aaaattatta aaacaataga taatgcttta 2100 actaaaagaa atgaaaaatg gagtgatatg tacggattaa tagtagcgca atggctctca 2160 acagttaata ctcaatttta tacaataaaa gagggaatgt ataaggcttt aaattatcaa 2220 gcacaagcat tggaagaaat aataaaatac agatataata tatattctga aaaagaaaag 2280 tcaaatatta acatcgattt taatgatata aattctaaac ttaatgaggg tattaaccaa 2340 gctatagata atataaataa ttttataaat ggatgttctg tatcatattt aatgaaaaaa 2400 atgattccat tagctgtaga aaaattacta gactttgata atactctcaa aaaaaatttg 2460 ttaaattata tagatgaaaa taaattatat ttgattggaa gtgcagaata tgaaaaatca 2520 aaagtaaata aatacttgaa aaccattatg ccgtttgatc tttcaatata taccaatgat 2580 acaatactaa tagaaatgtt taataaatat aatagcgaaa ttttaaataa tattatctta 2640 aatttaagat ataaggataa taatttaata gatttatcag gatatggggc aaaggtagag 2700 gtatatgatg gagtcgagct taatgataaa aatcaattta aattaactag ttcagcaaat 2760 agtaagatta gagtgactca aaatcagaat atcatattta atagtgtgtt ccttgatttt 2820 agcgttagct tttggataag aatacctaaa tataagaatg atggtataca aaattatatt 2880 cataatgaat atacaataat taattgtatg aaaaataatt cgggctggaa aatatctatt 2940 aggggtaata ggataatatg gactttaatt gatataaatg gaaaaaccaa atcggtattt 3000 tttgaatata acataagaga agatatatca gagtatataa atagatggtt ttttgtaact 3060 attactaata atttgaataa cgctaaaatt tatattaatg gtaagctaga atcaaataca 3120 gatattaaag atataagaga agttattgct aatggtgaaa taatatttaa attagatggt 3180 gatatagata gaacacaatt tatttggatg aaatatttca gtatttttaa tacggaatta 3240 agtcaatcaa atattgaaga aagatataaa attcaatcat atagcgaata tttaaaagat 3300 ttttggggaa atcctttaat gtacaataaa gaatattata tgtttaatgc ggggaataaa 3360 aattcatata ttaaactaaa gaaagattca cctgtaggtg aaattttaac acgtagcaaa 3420 tataatcaaa attctaaata tataaattat agagatttat atattggaga aaaatttatt 3480 ataagaagaa agtcaaattc tcaatctata aatgatgata tagttagaaa agaagattat 3540 atatatctag atttttttaa tttaaatcaa gagtggagag tatataccta taaatatttt 3600 aagaaagagg aagaaaaatt gtttttagct cctataagtg attctgatga gttttacaat 3660 actatacaaa taaaagaata tgatgaacag ccaacatata gttgtcagtt gctttttaaa 3720 aaagatgaag aaagtactga tgagatagga ttgattggta ttcatcgttt ctacgaatct 3780 ggaattgtat ttgaagagta taaagattat ttttgtataa gtaaatggta cttaaaagag 3840 gtaaaaagga aaccatataa tttaaaattg ggatgtaatt ggcagtttat tcctaaagat 3900 gaagggtgga ctgaactcga gcaccaccac caccaccact aa 3942 <210> 8 <211> 1313 <212> PRT <213> Clostridium botulinum <400> 8 Met Ala Val Thr Ile Asn Asn Phe Asn Tyr Asn Asp Pro Ile Asp Asn 1 5 10 15 Asn Asn Ile Ile Met Met Glu Pro Pro Phe Ala Arg Gly Thr Gly Arg 20 25 30 Tyr Tyr Lys Ala Phe Lys Ile Thr Asp Arg Ile Trp Ile Ile Pro Glu 35 40 45 Arg Tyr Thr Phe Gly Tyr Lys Pro Glu Asp Phe Asn Lys Ser Ser Gly 50 55 60 Ile Phe Asn Arg Asp Val Cys Glu Tyr Tyr Asp Pro Asp Tyr Leu Asn 65 70 75 80 Thr Asn Asp Lys Lys Asn Ile Phe Leu Gln Thr Met Ile Lys Leu Phe 85 90 95 Asn Arg Ile Lys Ser Lys Pro Leu Gly Glu Lys Leu Leu Glu Met Ile 100 105 110 Ile Asn Gly Ile Pro Tyr Leu Gly Asp Arg Arg Val Pro Leu Glu Glu 115 120 125 Phe Asn Thr Asn Ile Ala Ser Val Thr Val Asn Lys Leu Ile Ser Asn 130 135 140 Pro Gly Glu Val Glu Arg Lys Lys Gly Ile Phe Ala Asn Leu Ile Ile 145 150 155 160 Phe Gly Pro Gly Pro Val Leu Asn Glu Asn Glu Thr Ile Asp Ile Gly 165 170 175 Ile Gln Asn His Phe Ala Ser Arg Glu Gly Phe Gly Gly Ile Met Gln 180 185 190 Met Lys Phe Cys Pro Glu Tyr Val Ser Val Phe Asn Asn Val Gln Glu 195 200 205 Asn Lys Gly Ala Ser Ile Phe Asn Arg Arg Gly Tyr Phe Ser Asp Pro 210 215 220 Ala Leu Ile Leu Met His Glu Leu Ile His Val Leu His Gly Leu Tyr 225 230 235 240 Gly Ile Lys Val Asp Asp Leu Pro Ile Val Pro Asn Glu Lys Lys Phe 245 250 255 Phe Met Gln Ser Thr Asp Ala Ile Gln Ala Glu Glu Leu Tyr Thr Phe 260 265 270 Gly Gly Gln Asp Pro Ser Ile Ile Thr Pro Ser Thr Asp Lys Ser Ile 275 280 285 Tyr Asp Lys Val Leu Gln Asn Phe Arg Gly Ile Val Asp Arg Leu Asn 290 295 300 Lys Val Leu Val Cys Ile Ser Asp Pro Asn Ile Asn Ile Asn Ile Tyr 305 310 315 320 Lys Asn Lys Phe Lys Asp Lys Tyr Lys Phe Val Glu Asp Ser Glu Gly 325 330 335 Lys Tyr Ser Ile Asp Val Glu Ser Phe Asp Lys Leu Tyr Lys Ser Leu 340 345 350 Met Phe Gly Phe Thr Glu Thr Asn Ile Ala Glu Asn Tyr Lys Ile Lys 355 360 365 Thr Arg Ala Ser Tyr Phe Ser Asp Ser Leu Pro Pro Val Lys Ile Lys 370 375 380 Asn Leu Leu Asp Asn Glu Ile Tyr Thr Ile Glu Glu Gly Phe Asn Ile 385 390 395 400 Ser Asp Lys Asp Met Glu Lys Glu Tyr Arg Gly Gln Asn Lys Ala Ile 405 410 415 Asn Lys Gln Ala Tyr Glu Glu Ile Ser Lys Glu His Leu Ala Val Tyr 420 425 430 Lys Ile Gln Met Cys Lys Ser Gly Ile Ile Thr Ser Lys Thr Lys Ser 435 440 445 Leu Val Pro Arg Gly Ser Lys Ala Ser Gly Ile Cys Ile Asp Val Asp 450 455 460 Asn Glu Asp Leu Phe Phe Ile Ala Asp Lys Asn Ser Phe Ser Asp Asp 465 470 475 480 Leu Ser Lys Asn Glu Arg Ile Glu Tyr Asn Thr Gln Ser Asn Tyr Ile 485 490 495 Glu Asn Asp Phe Pro Ile Asn Glu Leu Ile Leu Asp Thr Asp Leu Ile 500 505 510 Ser Lys Ile Glu Leu Pro Ser Glu Asn Thr Glu Ser Leu Thr Asp Phe 515 520 525 Asn Val Asp Val Pro Val Tyr Glu Lys Gln Pro Ala Ile Lys Lys Ile 530 535 540 Phe Thr Asp Glu Asn Thr Ile Phe Gln Tyr Leu Tyr Ser Gln Thr Phe 545 550 555 560 Pro Leu Asp Ile Arg Asp Ile Ser Leu Thr Ser Ser Phe Asp Asp Ala 565 570 575 Leu Leu Phe Ser Asn Lys Val Tyr Ser Phe Phe Ser Met Asp Tyr Ile 580 585 590 Lys Thr Ala Asn Lys Val Val Glu Ala Gly Leu Phe Ala Gly Trp Val 595 600 605 Lys Gln Ile Val Asn Asp Phe Val Ile Glu Ala Asn Lys Ser Asn Thr 610 615 620 Met Asp Lys Ile Ala Asp Ile Ser Leu Ile Val Pro Tyr Ile Gly Leu 625 630 635 640 Ala Leu Asn Val Gly Asn Glu Thr Ala Lys Gly Asn Phe Glu Asn Ala 645 650 655 Phe Glu Ile Ala Gly Ala Ser Ile Leu Leu Glu Phe Ile Pro Glu Leu 660 665 670 Leu Ile Pro Val Val Gly Ala Phe Leu Leu Glu Ser Tyr Ile Asp Asn 675 680 685 Lys Asn Lys Ile Ile Lys Thr Ile Asp Asn Ala Leu Thr Lys Arg Asn 690 695 700 Glu Lys Trp Ser Asp Met Tyr Gly Leu Ile Val Ala Gln Trp Leu Ser 705 710 715 720 Thr Val Asn Thr Gln Phe Tyr Thr Ile Lys Glu Gly Met Tyr Lys Ala 725 730 735 Leu Asn Tyr Gln Ala Gln Ala Leu Glu Glu Ile Ile Lys Tyr Arg Tyr 740 745 750 Asn Ile Tyr Ser Glu Lys Glu Lys Ser Asn Ile Asn Ile Asp Phe Asn 755 760 765 Asp Ile Asn Ser Lys Leu Asn Glu Gly Ile Asn Gln Ala Ile Asp Asn 770 775 780 Ile Asn Asn Phe Ile Asn Gly Cys Ser Val Ser Tyr Leu Met Lys Lys 785 790 795 800 Met Ile Pro Leu Ala Val Glu Lys Leu Leu Asp Phe Asp Asn Thr Leu 805 810 815 Lys Lys Asn Leu Leu Asn Tyr Ile Asp Glu Asn Lys Leu Tyr Leu Ile 820 825 830 Gly Ser Ala Glu Tyr Glu Lys Ser Lys Val Asn Lys Tyr Leu Lys Thr 835 840 845 Ile Met Pro Phe Asp Leu Ser Ile Tyr Thr Asn Asp Thr Ile Leu Ile 850 855 860 Glu Met Phe Asn Lys Tyr Asn Ser Glu Ile Leu Asn Asn Ile Ile Leu 865 870 875 880 Asn Leu Arg Tyr Lys Asp Asn Asn Leu Ile Asp Leu Ser Gly Tyr Gly 885 890 895 Ala Lys Val Glu Val Tyr Asp Gly Val Glu Leu Asn Asp Lys Asn Gln 900 905 910 Phe Lys Leu Thr Ser Ser Ala Asn Ser Lys Ile Arg Val Thr Gln Asn 915 920 925 Gln Asn Ile Ile Phe Asn Ser Val Phe Leu Asp Phe Ser Val Ser Phe 930 935 940 Trp Ile Arg Ile Pro Lys Tyr Lys Asn Asp Gly Ile Gln Asn Tyr Ile 945 950 955 960 His Asn Glu Tyr Thr Ile Ile Asn Cys Met Lys Asn Asn Ser Gly Trp 965 970 975 Lys Ile Ser Ile Arg Gly Asn Arg Ile Ile Trp Thr Leu Ile Asp Ile 980 985 990 Asn Gly Lys Thr Lys Ser Val Phe Phe Glu Tyr Asn Ile Arg Glu Asp 995 1000 1005 Ile Ser Glu Tyr Ile Asn Arg Trp Phe Phe Val Thr Ile Thr Asn 1010 1015 1020 Asn Leu Asn Asn Ala Lys Ile Tyr Ile Asn Gly Lys Leu Glu Ser 1025 1030 1035 Asn Thr Asp Ile Lys Asp Ile Arg Glu Val Ile Ala Asn Gly Glu 1040 1045 1050 Ile Ile Phe Lys Leu Asp Gly Asp Ile Asp Arg Thr Gln Phe Ile 1055 1060 1065 Trp Met Lys Tyr Phe Ser Ile Phe Asn Thr Glu Leu Ser Gln Ser 1070 1075 1080 Asn Ile Glu Glu Arg Tyr Lys Ile Gln Ser Tyr Ser Glu Tyr Leu 1085 1090 1095 Lys Asp Phe Trp Gly Asn Pro Leu Met Tyr Asn Lys Glu Tyr Tyr 1100 1105 1110 Met Phe Asn Ala Gly Asn Lys Asn Ser Tyr Ile Lys Leu Lys Lys 1115 1120 1125 Asp Ser Pro Val Gly Glu Ile Leu Thr Arg Ser Lys Tyr Asn Gln 1130 1135 1140 Asn Ser Lys Tyr Ile Asn Tyr Arg Asp Leu Tyr Ile Gly Glu Lys 1145 1150 1155 Phe Ile Ile Arg Arg Lys Ser Asn Ser Gln Ser Ile Asn Asp Asp 1160 1165 1170 Ile Val Arg Lys Glu Asp Tyr Ile Tyr Leu Asp Phe Phe Asn Leu 1175 1180 1185 Asn Gln Glu Trp Arg Val Tyr Thr Tyr Lys Tyr Phe Lys Lys Glu 1190 1195 1200 Glu Glu Lys Leu Phe Leu Ala Pro Ile Ser Asp Ser Asp Glu Phe 1205 1210 1215 Tyr Asn Thr Ile Gln Ile Lys Glu Tyr Asp Glu Gln Pro Thr Tyr 1220 1225 1230 Ser Cys Gln Leu Leu Phe Lys Lys Asp Glu Glu Ser Thr Asp Glu 1235 1240 1245 Ile Gly Leu Ile Gly Ile His Arg Phe Tyr Glu Ser Gly Ile Val 1250 1255 1260 Phe Glu Glu Tyr Lys Asp Tyr Phe Cys Ile Ser Lys Trp Tyr Leu 1265 1270 1275 Lys Glu Val Lys Arg Lys Pro Tyr Asn Leu Lys Leu Gly Cys Asn 1280 1285 1290 Trp Gln Phe Ile Pro Lys Asp Glu Gly Trp Thr Glu Leu Glu His 1295 1300 1305 His His His His His 1310 <210> 9 <211> 2649 <212> DNA <213> Clostridium botulinum <400> 9 atggcagtta caataaataa ttttaattat aatgatccta ttgataataa taatattatt 60 atgatggagc ctccatttgc gagaggtacg gggagatatt ataaagcttt taaaatcaca 120 gatcgtattt ggataatacc ggaaagatat acttttggat ataaacctga ggattttaat 180 aaaagttccg gtatttttaa tagagatgtt tgtgaatatt atgatccaga ttacttaaat 240 actaatgata aaaagaatat atttttacaa acaatgatca agttatttaa tagaatcaaa 300 tcaaaaccat tgggtgaaaa gttattagag atgattataa atggtatacc ttatcttgga 360 gatagacgtg ttccactcga agagtttaac acaaacattg ctagtgtaac tgttaataaa 420 ttaatcagta atccaggaga agtggagcga aaaaaaggta ttttcgcaaa tttaataata 480 tttggacctg ggccagtttt aaatgaaaat gagactatag atataggtat acaaaatcat 540 tttgcatcaa gggaaggctt cgggggtata atgcaaatga agttttgccc agaatatgta 600 agcgtattta ataatgttca agaaaacaaa ggcgcaagta tatttaatag acgtggatat 660 ttttcagatc cagccttgat attaatgcat gaacttatac atgttttaca tggattatat 720 ggcattaaag tagatgattt accaattgta ccaaatgaaa aaaaattttt tatgcaatct 780 acagatgcta tacaggcaga agaactatat acatttggag gacaagatcc cagcatcata 840 actccttcta cggataaaag tatctatgat aaagttttgc aaaattttag agggatagtt 900 gatagactta acaaggtttt agtttgcata tcagatccta acattaatat taatatatat 960 aaaaataaat ttaaagataa atataaattc gttgaagatt ctgagggaaa atatagtata 1020 gatgtagaaa gttttgataa attatataaa agcttaatgt ttggttttac agaaactaat 1080 atagcagaaa attataaaat aaaaactaga gcttcttatt ttagtgattc cttaccacca 1140 gtaaaaataa aaaatttatt agataatgaa atctatacta tagaggaagg gtttaatata 1200 tctgataaag atatggaaaa agaatataga ggtcagaata aagctataaa taaacaagct 1260 tatgaagaaa ttagcaagga gcatttggct gtatataaga tacaaatgtg taaaagtggg 1320 ataataactt ctaaaactaa atcattggtt ccacgtggat ccaaggcctc aggaatatgt 1380 attgatgttg ataatgaaga tttgttcttt atagctgata aaaatagttt ttcagatgat 1440 ttatctaaaa acgaaagaat agaatataat acacagagta attatataga aaatgacttc 1500 cctataaatg aattaatttt agatactgat ttaataagta aaatagaatt accaagtgaa 1560 aatacagaat cacttactga ttttaatgta gatgttccag tatatgaaaa acaacccgct 1620 ataaaaaaaa tttttacaga tgaaaatacc atctttcaat atttatactc tcagacattt 1680 cctctagata taagagatat aagtttaaca tcttcatttg atgatgcatt attattttct 1740 aacaaagttt attcattttt ttctatggat tatattaaaa ctgctaataa agtggtagaa 1800 gcaggattat ttgcaggttg ggtgaaacag atagtaaatg attttgtaat cgaagctaat 1860 aaaagcaata ctatggataa aattgcagat atatctctaa ttgttcctta tataggatta 1920 gctttaaatg taggaaatga aacagctaaa ggaaattttg aaaatgcttt tgagattgca 1980 ggagccagta ttctactaga atttatacca gaacttttaa tacctgtagt tggagccttt 2040 ttattagaat catatattga caataaaaat aaaattatta aaacaataga taatgcttta 2100 actaaaagaa atgaaaaatg gagtgatatg tacggattaa tagtagcgca atggctctca 2160 acagttaata ctcaatttta tacaataaaa gagggaatgt ataaggcttt aaattatcaa 2220 gcacaagcat tggaagaaat aataaaatac agatataata tatattctga aaaagaaaag 2280 tcaaatatta acatcgattt taatgatata aattctaaac ttaatgaggg tattaaccaa 2340 gctatagata atataaataa ttttataaat ggatgttctg tatcatattt aatgaaaaaa 2400 atgattccat tagctgtaga aaaattacta gactttgata atactctcaa aaaaaatttg 2460 ttaaattata tagatgaaaa taaattatat ttgattggaa gtgcagaata tgaaaaatca 2520 aaagtaaata aatacttgaa aaccattatg ccgtttgatc tttcaatata taccaatgat 2580 acaatactaa tagaaatgtt taataaatat aatagcgaaa ttctcgagca ccaccaccac 2640 caccactaa 2649 <210> 10 <211> 882 <212> PRT <213> Clostridium botulinum <400> 10 Met Ala Val Thr Ile Asn Asn Phe Asn Tyr Asn Asp Pro Ile Asp Asn 1 5 10 15 Asn Asn Ile Ile Met Met Glu Pro Pro Phe Ala Arg Gly Thr Gly Arg 20 25 30 Tyr Tyr Lys Ala Phe Lys Ile Thr Asp Arg Ile Trp Ile Ile Pro Glu 35 40 45 Arg Tyr Thr Phe Gly Tyr Lys Pro Glu Asp Phe Asn Lys Ser Ser Gly 50 55 60 Ile Phe Asn Arg Asp Val Cys Glu Tyr Tyr Asp Pro Asp Tyr Leu Asn 65 70 75 80 Thr Asn Asp Lys Lys Asn Ile Phe Leu Gln Thr Met Ile Lys Leu Phe 85 90 95 Asn Arg Ile Lys Ser Lys Pro Leu Gly Glu Lys Leu Leu Glu Met Ile 100 105 110 Ile Asn Gly Ile Pro Tyr Leu Gly Asp Arg Arg Val Pro Leu Glu Glu 115 120 125 Phe Asn Thr Asn Ile Ala Ser Val Thr Val Asn Lys Leu Ile Ser Asn 130 135 140 Pro Gly Glu Val Glu Arg Lys Lys Gly Ile Phe Ala Asn Leu Ile Ile 145 150 155 160 Phe Gly Pro Gly Pro Val Leu Asn Glu Asn Glu Thr Ile Asp Ile Gly 165 170 175 Ile Gln Asn His Phe Ala Ser Arg Glu Gly Phe Gly Gly Ile Met Gln 180 185 190 Met Lys Phe Cys Pro Glu Tyr Val Ser Val Phe Asn Asn Val Gln Glu 195 200 205 Asn Lys Gly Ala Ser Ile Phe Asn Arg Arg Gly Tyr Phe Ser Asp Pro 210 215 220 Ala Leu Ile Leu Met His Glu Leu Ile His Val Leu His Gly Leu Tyr 225 230 235 240 Gly Ile Lys Val Asp Asp Leu Pro Ile Val Pro Asn Glu Lys Lys Phe 245 250 255 Phe Met Gln Ser Thr Asp Ala Ile Gln Ala Glu Glu Leu Tyr Thr Phe 260 265 270 Gly Gly Gln Asp Pro Ser Ile Ile Thr Pro Ser Thr Asp Lys Ser Ile 275 280 285 Tyr Asp Lys Val Leu Gln Asn Phe Arg Gly Ile Val Asp Arg Leu Asn 290 295 300 Lys Val Leu Val Cys Ile Ser Asp Pro Asn Ile Asn Ile Asn Ile Tyr 305 310 315 320 Lys Asn Lys Phe Lys Asp Lys Tyr Lys Phe Val Glu Asp Ser Glu Gly 325 330 335 Lys Tyr Ser Ile Asp Val Glu Ser Phe Asp Lys Leu Tyr Lys Ser Leu 340 345 350 Met Phe Gly Phe Thr Glu Thr Asn Ile Ala Glu Asn Tyr Lys Ile Lys 355 360 365 Thr Arg Ala Ser Tyr Phe Ser Asp Ser Leu Pro Pro Val Lys Ile Lys 370 375 380 Asn Leu Leu Asp Asn Glu Ile Tyr Thr Ile Glu Glu Gly Phe Asn Ile 385 390 395 400 Ser Asp Lys Asp Met Glu Lys Glu Tyr Arg Gly Gln Asn Lys Ala Ile 405 410 415 Asn Lys Gln Ala Tyr Glu Glu Ile Ser Lys Glu His Leu Ala Val Tyr 420 425 430 Lys Ile Gln Met Cys Lys Ser Gly Ile Ile Thr Ser Lys Thr Lys Ser 435 440 445 Leu Val Pro Arg Gly Ser Lys Ala Ser Gly Ile Cys Ile Asp Val Asp 450 455 460 Asn Glu Asp Leu Phe Phe Ile Ala Asp Lys Asn Ser Phe Ser Asp Asp 465 470 475 480 Leu Ser Lys Asn Glu Arg Ile Glu Tyr Asn Thr Gln Ser Asn Tyr Ile 485 490 495 Glu Asn Asp Phe Pro Ile Asn Glu Leu Ile Leu Asp Thr Asp Leu Ile 500 505 510 Ser Lys Ile Glu Leu Pro Ser Glu Asn Thr Glu Ser Leu Thr Asp Phe 515 520 525 Asn Val Asp Val Pro Val Tyr Glu Lys Gln Pro Ala Ile Lys Lys Ile 530 535 540 Phe Thr Asp Glu Asn Thr Ile Phe Gln Tyr Leu Tyr Ser Gln Thr Phe 545 550 555 560 Pro Leu Asp Ile Arg Asp Ile Ser Leu Thr Ser Ser Phe Asp Asp Ala 565 570 575 Leu Leu Phe Ser Asn Lys Val Tyr Ser Phe Phe Ser Met Asp Tyr Ile 580 585 590 Lys Thr Ala Asn Lys Val Val Glu Ala Gly Leu Phe Ala Gly Trp Val 595 600 605 Lys Gln Ile Val Asn Asp Phe Val Ile Glu Ala Asn Lys Ser Asn Thr 610 615 620 Met Asp Lys Ile Ala Asp Ile Ser Leu Ile Val Pro Tyr Ile Gly Leu 625 630 635 640 Ala Leu Asn Val Gly Asn Glu Thr Ala Lys Gly Asn Phe Glu Asn Ala 645 650 655 Phe Glu Ile Ala Gly Ala Ser Ile Leu Leu Glu Phe Ile Pro Glu Leu 660 665 670 Leu Ile Pro Val Val Gly Ala Phe Leu Leu Glu Ser Tyr Ile Asp Asn 675 680 685 Lys Asn Lys Ile Ile Lys Thr Ile Asp Asn Ala Leu Thr Lys Arg Asn 690 695 700 Glu Lys Trp Ser Asp Met Tyr Gly Leu Ile Val Ala Gln Trp Leu Ser 705 710 715 720 Thr Val Asn Thr Gln Phe Tyr Thr Ile Lys Glu Gly Met Tyr Lys Ala 725 730 735 Leu Asn Tyr Gln Ala Gln Ala Leu Glu Glu Ile Ile Lys Tyr Arg Tyr 740 745 750 Asn Ile Tyr Ser Glu Lys Glu Lys Ser Asn Ile Asn Ile Asp Phe Asn 755 760 765 Asp Ile Asn Ser Lys Leu Asn Glu Gly Ile Asn Gln Ala Ile Asp Asn 770 775 780 Ile Asn Asn Phe Ile Asn Gly Cys Ser Val Ser Tyr Leu Met Lys Lys 785 790 795 800 Met Ile Pro Leu Ala Val Glu Lys Leu Leu Asp Phe Asp Asn Thr Leu 805 810 815 Lys Lys Asn Leu Leu Asn Tyr Ile Asp Glu Asn Lys Leu Tyr Leu Ile 820 825 830 Gly Ser Ala Glu Tyr Glu Lys Ser Lys Val Asn Lys Tyr Leu Lys Thr 835 840 845 Ile Met Pro Phe Asp Leu Ser Ile Tyr Thr Asn Asp Thr Ile Leu Ile 850 855 860 Glu Met Phe Asn Lys Tyr Asn Ser Glu Ile Leu Glu His His His His 865 870 875 880 His His <210> 11 <211> 3885 <212> DNA <213> Clostridium botulinum <400> 11 atggcaataa caattaacaa ctttaattat tcagatcctg ttgataataa aaatatttta 60 tatttagata ctcatttaaa tacattagct aatgagcctg aaaaagcctt tcgcattata 120 gggaatatat gggtaatacc cgatagattt tcaagagatt ctaatccaaa tttaaataaa 180 cctccacgag ttacaagccc taaaagtggt tattatgatc ctaattattt gagtactgat 240 tctgaaaaag atacattttt aaaagaaatt ataaagttat ttaaaagaat taactctaga 300 gaaataggag aagaattaat atatagactt gcaacagaca taccctttcc tgggaataac 360 aatactccaa ttaatacttt tgattttgat gtagatttta acagtgttga tgttaaaact 420 agacaaggta acaactgggt taaaactggt agtataaatc ctagtgttat aataactgga 480 cctagagaaa acattataga cccagaaact tctacgttta aattaactaa caatactttt 540 gcggcacaag aaggatttgg tgctttatca ataatttcaa tatcacctag atttatgcta 600 acatatagta atgcaactaa taatgtagga gagggtagat tttctaagtc tgaattttgc 660 atggatccaa tactaatttt aatgcatgaa cttaatcatg caatgcataa tttatatgga 720 atagctatac caaatgatca aagaatttca tctgtaacta gtaatatttt ttattctcaa 780 tataatgtga aattagagta tgcagaaata tatgcatttg gaggtccaac tatagacctt 840 attcctaaaa gtgcaaggaa atattttgag gaaaaggcat tggattatta tagatccata 900 gctaaaagac ttaatagtat aactactgca aatccttcaa gctttaataa atatatagga 960 gaatataaac agaaacttat tagaaagtat agattcgtag tagaatcttc aggtgaagtt 1020 gcagtagatc gtaataagtt tgctgagtta tataaagaac ttacacaaat atttacagaa 1080 tttaactacg ctaaaatata taatgtacaa aataggaaaa tatatctttc aaatgtatat 1140 actccggtta cggcaaatat attagacgat aatgtttatg atatacaaaa tggatttaac 1200 atacctaaaa gtaatttaaa tgtactattt atgggtcaaa atttatctcg aaatccagca 1260 ttaagaaaag tcaatcctga aaatatgctt tatttattta caaaattttg tcatagaggg 1320 ataataactt ctaaaactaa atcattagtt ccgcgtggat ccaaggcctt agattgtaga 1380 gagcttttag ttaaaaatac tgacttaccc tttataggtg atattagtga tatcaaaact 1440 gatatatttt taagcaaaga tattaatgaa gaaactgaag ttatagacta tccggacaat 1500 gtttcagtgg atcaagttat tctcagtaag aatacctcag aacatggaca actagattta 1560 ttatacccta ttattgaagg tgagagtcaa gtattaccgg gagagaatca agtcttttat 1620 gataatagaa ctcaaaatgt tgattatttg aattcttatt attacctaga atctcaaaaa 1680 ctaagtgata atgttgaaga ttttactttt acgacatcaa ttgaggaagc tttggataat 1740 agtggaaaag tatatactta ctttcctaaa ctagctgata aagtaaatac gggtgttcaa 1800 ggtggtttat ttttaatgtg ggcaaatgat gtagttgaag attttactac aaatattcta 1860 agaaaagata cattagataa aatatcagat gtatcagcta ttattcccta tataggacct 1920 gcattaaata taagtaattc tgtaagaagg ggaaatttta ctgaagcatt tgcagttacc 1980 ggtgtaacta ttttattaga agcgtttcaa gaatttacaa tacctgcact tggtgcattt 2040 gtgatttata gtaaggttca agaaagaaac gagattatta aaactataga taattgttta 2100 gaacaaagga ttaaaagatg gaaagattca tatgaatgga tgataggaac gtggttatcc 2160 aggattacta ctcaatttaa taatataagt tatcaaatgt atgattcttt aaattatcag 2220 gcagatgcaa tcaaagataa aatagattta gaatataaaa aatactcagg aagtgataaa 2280 gaaaatataa aaagtcaagt tgaaaattta aaaaatagtt tagatataaa aatctcggaa 2340 gcaatgaata atataaataa atttatacga gaatgttctg taacatactt atttaaaaat 2400 atgctcccta aagtaattga tgaattaaat aagtttgatt taaaaactaa aacagaatta 2460 attaatctta tagatagtca taatattatt ctagttggtg aagtagatag attaaaagca 2520 aaaataaatg agagttttga aaatacaata ccctttaata ttttttcata tactaataat 2580 tctttattaa aagatatact cgaggaatat ttcaatagta ttaatgattc aaaaattttg 2640 agcttacaaa acaaaaaaaa tgctttagtg gatacatcag gatataatgc agaagtgagg 2700 ctagaaggtg atgttcaagt taatacgata tatacaaatg attttaaatt aagtagttca 2760 ggagataaaa ttatagtaaa tttaaataat aatattttat atagcgctat ttatgagaac 2820 tctagtgtta gtttttggat taagatatct aaagatttaa ctaattctca taatgaatat 2880 actataatta atagtataaa acaaaattct gggtggaaat tatgtattag aaatggcaat 2940 atagaatgga ttttacaaga tattaataga aagtataaaa gtttaatttt tgattatagt 3000 gaatcattaa gtcatacagg atatacaaat aaatggtttt ttgttactat aactaataat 3060 ataatggggt atatgaaact ttatataaat ggagaattaa agcagagtga aagaattgaa 3120 gatttagatg aggttaagtt agataaaacc atagtatttg gaatagatga gaatatagat 3180 gagaatcaga tgctttggat tagagatttt aatatttttt ctaaagaatt aagcaatgaa 3240 gatattaata ttgtatatga gggacaaata ttaagaaatg ttattaaaga ttattgggga 3300 aatcctttga agtttgatac agaatattat atgattaatt ataattatat agataggtat 3360 atagcaccta aaaataatat acttgtactt gttcagtatt cagatatatc taaattatat 3420 actaaaaatc ctattactat taaatcagca gctaataaga atccttatag tagaatttta 3480 aatggagatg atataatgtt tcatatgtta tatgatagta gggaatatat gataataaga 3540 gatactgata caatatatgc aacacaagga ggacagtgtt caaaaaattg tgtatatgca 3600 ttaaaattac agagtaattt aggtaattat ggtataggta tatttagtat aaaaaatatt 3660 gtatctcaaa ataaatattg tagtcaaatt ttctctagtt ttatgaaaaa tacaatgctt 3720 ctagcagata tatataaacc ttggagattt tcttttgaaa atgcatacac gccagttgca 3780 gtaactaatt atgagacaaa actattatca acttcatctt tttggaaatt tatttctagg 3840 gatccaggat gggtagagct cgagcaccac caccaccacc actaa 3885 <210> 12 <211> 1294 <212> PRT <213> Clostridium botulinum <400> 12 Met Ala Ile Thr Ile Asn Asn Phe Asn Tyr Ser Asp Pro Val Asp Asn 1 5 10 15 Lys Asn Ile Leu Tyr Leu Asp Thr His Leu Asn Thr Leu Ala Asn Glu 20 25 30 Pro Glu Lys Ala Phe Arg Ile Ile Gly Asn Ile Trp Val Ile Pro Asp 35 40 45 Arg Phe Ser Arg Asp Ser Asn Pro Asn Leu Asn Lys Pro Pro Arg Val 50 55 60 Thr Ser Pro Lys Ser Gly Tyr Tyr Asp Pro Asn Tyr Leu Ser Thr Asp 65 70 75 80 Ser Glu Lys Asp Thr Phe Leu Lys Glu Ile Ile Lys Leu Phe Lys Arg 85 90 95 Ile Asn Ser Arg Glu Ile Gly Glu Glu Leu Ile Tyr Arg Leu Ala Thr 100 105 110 Asp Ile Pro Phe Pro Gly Asn Asn Asn Thr Pro Ile Asn Thr Phe Asp 115 120 125 Phe Asp Val Asp Phe Asn Ser Val Asp Val Lys Thr Arg Gln Gly Asn 130 135 140 Asn Trp Val Lys Thr Gly Ser Ile Asn Pro Ser Val Ile Ile Thr Gly 145 150 155 160 Pro Arg Glu Asn Ile Ile Asp Pro Glu Thr Ser Thr Phe Lys Leu Thr 165 170 175 Asn Asn Thr Phe Ala Ala Gln Glu Gly Phe Gly Ala Leu Ser Ile Ile 180 185 190 Ser Ile Ser Pro Arg Phe Met Leu Thr Tyr Ser Asn Ala Thr Asn Asn 195 200 205 Val Gly Glu Gly Arg Phe Ser Lys Ser Glu Phe Cys Met Asp Pro Ile 210 215 220 Leu Ile Leu Met His Glu Leu Asn His Ala Met His Asn Leu Tyr Gly 225 230 235 240 Ile Ala Ile Pro Asn Asp Gln Arg Ile Ser Ser Val Thr Ser Asn Ile 245 250 255 Phe Tyr Ser Gln Tyr Asn Val Lys Leu Glu Tyr Ala Glu Ile Tyr Ala 260 265 270 Phe Gly Gly Pro Thr Ile Asp Leu Ile Pro Lys Ser Ala Arg Lys Tyr 275 280 285 Phe Glu Glu Lys Ala Leu Asp Tyr Tyr Arg Ser Ile Ala Lys Arg Leu 290 295 300 Asn Ser Ile Thr Thr Ala Asn Pro Ser Ser Phe Asn Lys Tyr Ile Gly 305 310 315 320 Glu Tyr Lys Gln Lys Leu Ile Arg Lys Tyr Arg Phe Val Val Glu Ser 325 330 335 Ser Gly Glu Val Ala Val Asp Arg Asn Lys Phe Ala Glu Leu Tyr Lys 340 345 350 Glu Leu Thr Gln Ile Phe Thr Glu Phe Asn Tyr Ala Lys Ile Tyr Asn 355 360 365 Val Gln Asn Arg Lys Ile Tyr Leu Ser Asn Val Tyr Thr Pro Val Thr 370 375 380 Ala Asn Ile Leu Asp Asp Asn Val Tyr Asp Ile Gln Asn Gly Phe Asn 385 390 395 400 Ile Pro Lys Ser Asn Leu Asn Val Leu Phe Met Gly Gln Asn Leu Ser 405 410 415 Arg Asn Pro Ala Leu Arg Lys Val Asn Pro Glu Asn Met Leu Tyr Leu 420 425 430 Phe Thr Lys Phe Cys His Arg Gly Ile Ile Thr Ser Lys Thr Lys Ser 435 440 445 Leu Val Pro Arg Gly Ser Lys Ala Leu Asp Cys Arg Glu Leu Leu Val 450 455 460 Lys Asn Thr Asp Leu Pro Phe Ile Gly Asp Ile Ser Asp Ile Lys Thr 465 470 475 480 Asp Ile Phe Leu Ser Lys Asp Ile Asn Glu Glu Thr Glu Val Ile Asp 485 490 495 Tyr Pro Asp Asn Val Ser Val Asp Gln Val Ile Leu Ser Lys Asn Thr 500 505 510 Ser Glu His Gly Gln Leu Asp Leu Leu Tyr Pro Ile Ile Glu Gly Glu 515 520 525 Ser Gln Val Leu Pro Gly Glu Asn Gln Val Phe Tyr Asp Asn Arg Thr 530 535 540 Gln Asn Val Asp Tyr Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys 545 550 555 560 Leu Ser Asp Asn Val Glu Asp Phe Thr Phe Thr Thr Ser Ile Glu Glu 565 570 575 Ala Leu Asp Asn Ser Gly Lys Val Tyr Thr Tyr Phe Pro Lys Leu Ala 580 585 590 Asp Lys Val Asn Thr Gly Val Gln Gly Gly Leu Phe Leu Met Trp Ala 595 600 605 Asn Asp Val Val Glu Asp Phe Thr Thr Asn Ile Leu Arg Lys Asp Thr 610 615 620 Leu Asp Lys Ile Ser Asp Val Ser Ala Ile Ile Pro Tyr Ile Gly Pro 625 630 635 640 Ala Leu Asn Ile Ser Asn Ser Val Arg Arg Gly Asn Phe Thr Glu Ala 645 650 655 Phe Ala Val Thr Gly Val Thr Ile Leu Leu Glu Ala Phe Gln Glu Phe 660 665 670 Thr Ile Pro Ala Leu Gly Ala Phe Val Ile Tyr Ser Lys Val Gln Glu 675 680 685 Arg Asn Glu Ile Ile Lys Thr Ile Asp Asn Cys Leu Glu Gln Arg Ile 690 695 700 Lys Arg Trp Lys Asp Ser Tyr Glu Trp Met Ile Gly Thr Trp Leu Ser 705 710 715 720 Arg Ile Thr Thr Gln Phe Asn Asn Ile Ser Tyr Gln Met Tyr Asp Ser 725 730 735 Leu Asn Tyr Gln Ala Asp Ala Ile Lys Asp Lys Ile Asp Leu Glu Tyr 740 745 750 Lys Lys Tyr Ser Gly Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu 755 760 765 Asn Leu Lys Asn Ser Leu Asp Ile Lys Ile Ser Glu Ala Met Asn Asn 770 775 780 Ile Asn Lys Phe Ile Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn 785 790 795 800 Met Leu Pro Lys Val Ile Asp Glu Leu Asn Lys Phe Asp Leu Lys Thr 805 810 815 Lys Thr Glu Leu Ile Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val 820 825 830 Gly Glu Val Asp Arg Leu Lys Ala Lys Ile Asn Glu Ser Phe Glu Asn 835 840 845 Thr Ile Pro Phe Asn Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys 850 855 860 Asp Ile Leu Glu Glu Tyr Phe Asn Ser Ile Asn Asp Ser Lys Ile Leu 865 870 875 880 Ser Leu Gln Asn Lys Lys Asn Ala Leu Val Asp Thr Ser Gly Tyr Asn 885 890 895 Ala Glu Val Arg Leu Glu Gly Asp Val Gln Val Asn Thr Ile Tyr Thr 900 905 910 Asn Asp Phe Lys Leu Ser Ser Ser Gly Asp Lys Ile Ile Val Asn Leu 915 920 925 Asn Asn Asn Ile Leu Tyr Ser Ala Ile Tyr Glu Asn Ser Ser Val Ser 930 935 940 Phe Trp Ile Lys Ile Ser Lys Asp Leu Thr Asn Ser His Asn Glu Tyr 945 950 955 960 Thr Ile Ile Asn Ser Ile Lys Gln Asn Ser Gly Trp Lys Leu Cys Ile 965 970 975 Arg Asn Gly Asn Ile Glu Trp Ile Leu Gln Asp Ile Asn Arg Lys Tyr 980 985 990 Lys Ser Leu Ile Phe Asp Tyr Ser Glu Ser Leu Ser His Thr Gly Tyr 995 1000 1005 Thr Asn Lys Trp Phe Phe Val Thr Ile Thr Asn Asn Ile Met Gly 1010 1015 1020 Tyr Met Lys Leu Tyr Ile Asn Gly Glu Leu Lys Gln Ser Glu Arg 1025 1030 1035 Ile Glu Asp Leu Asp Glu Val Lys Leu Asp Lys Thr Ile Val Phe 1040 1045 1050 Gly Ile Asp Glu Asn Ile Asp Glu Asn Gln Met Leu Trp Ile Arg 1055 1060 1065 Asp Phe Asn Ile Phe Ser Lys Glu Leu Ser Asn Glu Asp Ile Asn 1070 1075 1080 Ile Val Tyr Glu Gly Gln Ile Leu Arg Asn Val Ile Lys Asp Tyr 1085 1090 1095 Trp Gly Asn Pro Leu Lys Phe Asp Thr Glu Tyr Tyr Met Ile Asn 1100 1105 1110 Tyr Asn Tyr Ile Asp Arg Tyr Ile Ala Pro Lys Asn Asn Ile Leu 1115 1120 1125 Val Leu Val Gln Tyr Ser Asp Ile Ser Lys Leu Tyr Thr Lys Asn 1130 1135 1140 Pro Ile Thr Ile Lys Ser Ala Ala Asn Lys Asn Pro Tyr Ser Arg 1145 1150 1155 Ile Leu Asn Gly Asp Asp Ile Met Phe His Met Leu Tyr Asp Ser 1160 1165 1170 Arg Glu Tyr Met Ile Ile Arg Asp Thr Asp Thr Ile Tyr Ala Thr 1175 1180 1185 Gln Gly Gly Gln Cys Ser Lys Asn Cys Val Tyr Ala Leu Lys Leu 1190 1195 1200 Gln Ser Asn Leu Gly Asn Tyr Gly Ile Gly Ile Phe Ser Ile Lys 1205 1210 1215 Asn Ile Val Ser Gln Asn Lys Tyr Cys Ser Gln Ile Phe Ser Ser 1220 1225 1230 Phe Met Lys Asn Thr Met Leu Leu Ala Asp Ile Tyr Lys Pro Trp 1235 1240 1245 Arg Phe Ser Phe Glu Asn Ala Tyr Thr Pro Val Ala Val Thr Asn 1250 1255 1260 Tyr Glu Thr Lys Leu Leu Ser Thr Ser Ser Phe Trp Lys Phe Ile 1265 1270 1275 Ser Arg Asp Pro Gly Trp Val Glu Leu Glu His His His His His 1280 1285 1290 His <210> 13 <211> 2625 <212> DNA <213> Clostridium botulinum <400> 13 atggcaataa caattaacaa ctttaattat tcagatcctg ttgataataa aaatatttta 60 tatttagata ctcatttaaa tacattagct aatgagcctg aaaaagcctt tcgcattata 120 gggaatatat gggtaatacc cgatagattt tcaagagatt ctaatccaaa tttaaataaa 180 cctccacgag ttacaagccc taaaagtggt tattatgatc ctaattattt gagtactgat 240 tctgaaaaag atacattttt aaaagaaatt ataaagttat ttaaaagaat taactctaga 300 gaaataggag aagaattaat atatagactt gcaacagaca taccctttcc tgggaataac 360 aatactccaa ttaatacttt tgattttgat gtagatttta acagtgttga tgttaaaact 420 agacaaggta acaactgggt taaaactggt agtataaatc ctagtgttat aataactgga 480 cctagagaaa acattataga cccagaaact tctacgttta aattaactaa caatactttt 540 gcggcacaag aaggatttgg tgctttatca ataatttcaa tatcacctag atttatgcta 600 acatatagta atgcaactaa taatgtagga gagggtagat tttctaagtc tgaattttgc 660 atggatccaa tactaatttt aatgcatgaa cttaatcatg caatgcataa tttatatgga 720 atagctatac caaatgatca aagaatttca tctgtaacta gtaatatttt ttattctcaa 780 tataatgtga aattagagta tgcagaaata tatgcatttg gaggtccaac tatagacctt 840 attcctaaaa gtgcaaggaa atattttgag gaaaaggcat tggattatta tagatccata 900 gctaaaagac ttaatagtat aactactgca aatccttcaa gctttaataa atatatagga 960 gaatataaac agaaacttat tagaaagtat agattcgtag tagaatcttc aggtgaagtt 1020 gcagtagatc gtaataagtt tgctgagtta tataaagaac ttacacaaat atttacagaa 1080 tttaactacg ctaaaatata taatgtacaa aataggaaaa tatatctttc aaatgtatat 1140 actccggtta cggcaaatat attagacgat aatgtttatg atatacaaaa tggatttaac 1200 atacctaaaa gtaatttaaa tgtactattt atgggtcaaa atttatctcg aaatccagca 1260 ttaagaaaag tcaatcctga aaatatgctt tatttattta caaaattttg tcatagaggg 1320 ataataactt ctaaaactaa atcattagtt ccgcgtggat ccaaggcctt agattgtaga 1380 gagcttttag ttaaaaatac tgacttaccc tttataggtg atattagtga tatcaaaact 1440 gatatatttt taagcaaaga tattaatgaa gaaactgaag ttatagacta tccggacaat 1500 gtttcagtgg atcaagttat tctcagtaag aatacctcag aacatggaca actagattta 1560 ttatacccta ttattgaagg tgagagtcaa gtattaccgg gagagaatca agtcttttat 1620 gataatagaa ctcaaaatgt tgattatttg aattcttatt attacctaga atctcaaaaa 1680 ctaagtgata atgttgaaga ttttactttt acgacatcaa ttgaggaagc tttggataat 1740 agtggaaaag tatatactta ctttcctaaa ctagctgata aagtaaatac gggtgttcaa 1800 ggtggtttat ttttaatgtg ggcaaatgat gtagttgaag attttactac aaatattcta 1860 agaaaagata cattagataa aatatcagat gtatcagcta ttattcccta tataggacct 1920 gcattaaata taagtaattc tgtaagaagg ggaaatttta ctgaagcatt tgcagttacc 1980 ggtgtaacta ttttattaga agcgtttcaa gaatttacaa tacctgcact tggtgcattt 2040 gtgatttata gtaaggttca agaaagaaac gagattatta aaactataga taattgttta 2100 gaacaaagga ttaaaagatg gaaagattca tatgaatgga tgataggaac gtggttatcc 2160 aggattacta ctcaatttaa taatataagt tatcaaatgt atgattcttt aaattatcag 2220 gcagatgcaa tcaaagataa aatagattta gaatataaaa aatactcagg aagtgataaa 2280 gaaaatataa aaagtcaagt tgaaaattta aaaaatagtt tagatataaa aatctcggaa 2340 gcaatgaata atataaataa atttatacga gaatgttctg taacatactt atttaaaaat 2400 atgctcccta aagtaattga tgaattaaat aagtttgatt taaaaactaa aacagaatta 2460 attaatctta tagatagtca taatattatt ctagttggtg aagtagatag attaaaagca 2520 aaaataaatg agagttttga aaatacaata ccctttaata ttttttcata tactaataat 2580 tctttattaa aagatatact cgagcaccac caccaccacc actaa 2625 <210> 14 <211> 874 <212> PRT <213> Clostridium botulinum <400> 14 Met Ala Ile Thr Ile Asn Asn Phe Asn Tyr Ser Asp Pro Val Asp Asn 1 5 10 15 Lys Asn Ile Leu Tyr Leu Asp Thr His Leu Asn Thr Leu Ala Asn Glu 20 25 30 Pro Glu Lys Ala Phe Arg Ile Ile Gly Asn Ile Trp Val Ile Pro Asp 35 40 45 Arg Phe Ser Arg Asp Ser Asn Pro Asn Leu Asn Lys Pro Pro Arg Val 50 55 60 Thr Ser Pro Lys Ser Gly Tyr Tyr Asp Pro Asn Tyr Leu Ser Thr Asp 65 70 75 80 Ser Glu Lys Asp Thr Phe Leu Lys Glu Ile Ile Lys Leu Phe Lys Arg 85 90 95 Ile Asn Ser Arg Glu Ile Gly Glu Glu Leu Ile Tyr Arg Leu Ala Thr 100 105 110 Asp Ile Pro Phe Pro Gly Asn Asn Asn Thr Pro Ile Asn Thr Phe Asp 115 120 125 Phe Asp Val Asp Phe Asn Ser Val Asp Val Lys Thr Arg Gln Gly Asn 130 135 140 Asn Trp Val Lys Thr Gly Ser Ile Asn Pro Ser Val Ile Ile Thr Gly 145 150 155 160 Pro Arg Glu Asn Ile Ile Asp Pro Glu Thr Ser Thr Phe Lys Leu Thr 165 170 175 Asn Asn Thr Phe Ala Ala Gln Glu Gly Phe Gly Ala Leu Ser Ile Ile 180 185 190 Ser Ile Ser Pro Arg Phe Met Leu Thr Tyr Ser Asn Ala Thr Asn Asn 195 200 205 Val Gly Glu Gly Arg Phe Ser Lys Ser Glu Phe Cys Met Asp Pro Ile 210 215 220 Leu Ile Leu Met His Glu Leu Asn His Ala Met His Asn Leu Tyr Gly 225 230 235 240 Ile Ala Ile Pro Asn Asp Gln Arg Ile Ser Ser Val Thr Ser Asn Ile 245 250 255 Phe Tyr Ser Gln Tyr Asn Val Lys Leu Glu Tyr Ala Glu Ile Tyr Ala 260 265 270 Phe Gly Gly Pro Thr Ile Asp Leu Ile Pro Lys Ser Ala Arg Lys Tyr 275 280 285 Phe Glu Glu Lys Ala Leu Asp Tyr Tyr Arg Ser Ile Ala Lys Arg Leu 290 295 300 Asn Ser Ile Thr Thr Ala Asn Pro Ser Ser Phe Asn Lys Tyr Ile Gly 305 310 315 320 Glu Tyr Lys Gln Lys Leu Ile Arg Lys Tyr Arg Phe Val Val Glu Ser 325 330 335 Ser Gly Glu Val Ala Val Asp Arg Asn Lys Phe Ala Glu Leu Tyr Lys 340 345 350 Glu Leu Thr Gln Ile Phe Thr Glu Phe Asn Tyr Ala Lys Ile Tyr Asn 355 360 365 Val Gln Asn Arg Lys Ile Tyr Leu Ser Asn Val Tyr Thr Pro Val Thr 370 375 380 Ala Asn Ile Leu Asp Asp Asn Val Tyr Asp Ile Gln Asn Gly Phe Asn 385 390 395 400 Ile Pro Lys Ser Asn Leu Asn Val Leu Phe Met Gly Gln Asn Leu Ser 405 410 415 Arg Asn Pro Ala Leu Arg Lys Val Asn Pro Glu Asn Met Leu Tyr Leu 420 425 430 Phe Thr Lys Phe Cys His Arg Gly Ile Ile Thr Ser Lys Thr Lys Ser 435 440 445 Leu Val Pro Arg Gly Ser Lys Ala Leu Asp Cys Arg Glu Leu Leu Val 450 455 460 Lys Asn Thr Asp Leu Pro Phe Ile Gly Asp Ile Ser Asp Ile Lys Thr 465 470 475 480 Asp Ile Phe Leu Ser Lys Asp Ile Asn Glu Glu Thr Glu Val Ile Asp 485 490 495 Tyr Pro Asp Asn Val Ser Val Asp Gln Val Ile Leu Ser Lys Asn Thr 500 505 510 Ser Glu His Gly Gln Leu Asp Leu Leu Tyr Pro Ile Ile Glu Gly Glu 515 520 525 Ser Gln Val Leu Pro Gly Glu Asn Gln Val Phe Tyr Asp Asn Arg Thr 530 535 540 Gln Asn Val Asp Tyr Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys 545 550 555 560 Leu Ser Asp Asn Val Glu Asp Phe Thr Phe Thr Thr Ser Ile Glu Glu 565 570 575 Ala Leu Asp Asn Ser Gly Lys Val Tyr Thr Tyr Phe Pro Lys Leu Ala 580 585 590 Asp Lys Val Asn Thr Gly Val Gln Gly Gly Leu Phe Leu Met Trp Ala 595 600 605 Asn Asp Val Val Glu Asp Phe Thr Thr Asn Ile Leu Arg Lys Asp Thr 610 615 620 Leu Asp Lys Ile Ser Asp Val Ser Ala Ile Ile Pro Tyr Ile Gly Pro 625 630 635 640 Ala Leu Asn Ile Ser Asn Ser Val Arg Arg Gly Asn Phe Thr Glu Ala 645 650 655 Phe Ala Val Thr Gly Val Thr Ile Leu Leu Glu Ala Phe Gln Glu Phe 660 665 670 Thr Ile Pro Ala Leu Gly Ala Phe Val Ile Tyr Ser Lys Val Gln Glu 675 680 685 Arg Asn Glu Ile Ile Lys Thr Ile Asp Asn Cys Leu Glu Gln Arg Ile 690 695 700 Lys Arg Trp Lys Asp Ser Tyr Glu Trp Met Ile Gly Thr Trp Leu Ser 705 710 715 720 Arg Ile Thr Thr Gln Phe Asn Asn Ile Ser Tyr Gln Met Tyr Asp Ser 725 730 735 Leu Asn Tyr Gln Ala Asp Ala Ile Lys Asp Lys Ile Asp Leu Glu Tyr 740 745 750 Lys Lys Tyr Ser Gly Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu 755 760 765 Asn Leu Lys Asn Ser Leu Asp Ile Lys Ile Ser Glu Ala Met Asn Asn 770 775 780 Ile Asn Lys Phe Ile Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn 785 790 795 800 Met Leu Pro Lys Val Ile Asp Glu Leu Asn Lys Phe Asp Leu Lys Thr 805 810 815 Lys Thr Glu Leu Ile Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val 820 825 830 Gly Glu Val Asp Arg Leu Lys Ala Lys Ile Asn Glu Ser Phe Glu Asn 835 840 845 Thr Ile Pro Phe Asn Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys 850 855 860 Asp Ile Leu Glu His His His His His His 865 870 <210> 15 <211> 3810 <212> DNA <213> Clostridium botulinum <400> 15 atggcaacaa ttaatagttt taattataat gatcctgtta ataatagaac aattttatat 60 attaaaccag gcggttgtca acaattttat aaatcattta atattatgaa aaatatttgg 120 ataattccag agagaaatgt aattggtaca attccccaag attttcttcc gcctacttca 180 ttgaaaaatg gagatagtag ttattatgac cctaattatt tacaaagtga tcaagaaaag 240 gataaatttt taaaaatagt cacaaaaata tttaatagaa taaatgataa tctttcagga 300 aggattttat tagaagaact gtcaaaagct aatccatatt taggaaatga taatactcca 360 gatggtgact tcattattaa tgatgcatca gcagttccaa ttcaattctc aaatggtagc 420 caaagcatac tattacctaa tgttattata atgggagcag agcctgattt atttgaaact 480 aacagttcca atatttctct aagaaataat tatatgccaa gcaatcacgg ttttggatca 540 atagctatag taacattctc acctgaatat tcttttagat ttaaagataa tagtatgaat 600 gaatttattc aagatcctgc tcttacatta atgcatgaat taatacattc attacatgga 660 ctatatgggg ctaaagggat tactacaaag tatactataa cacaaaaaca aaatccccta 720 ataacaaata taagaggtac aaatattgaa gaattcttaa cttttggagg tactgattta 780 aacattatta ctagtgctca gtccaatgat atctatacta atcttctagc tgattataaa 840 aaaatagcgt ctaaacttag caaagtacaa gtatctaatc cactacttaa tccttataaa 900 gatgtttttg aagcaaagta tggattagat aaagatgcta gcggaattta ttcggtaaat 960 ataaacaaat ttaatgatat ttttaaaaaa ttatacagct ttacggaatt tgatttagca 1020 actaaatttc aagttaaatg taggcaaact tatattggac agtataaata cttcaaactt 1080 tcaaacttgt taaatgattc tatttataat atatcagaag gctataatat aaataattta 1140 aaggtaaatt ttagaggaca gaatgcaaat ttaaatccta gaattattac accaattaca 1200 ggtagaggac tagtaaaaaa aatcattaga ttttgtaaaa gtgggataat aacttctaaa 1260 actaaatcat tggttccacg tggatccaag gcctcaatat gtatcgaaat aaataatggt 1320 gagttatttt ttgtggcttc cgagaatagt tataatgatg ataatataaa tactcctaaa 1380 gaaattgacg atacagtaac ttcaaataat aattatgaaa atgatttaga tcaggttatt 1440 ttaaatttta atagtgaatc agcacctgga ctttcagatg aaaaattaaa tttaactatc 1500 caaaatgatg cttatatacc aaaatatgat tctaatggaa caagtgatat agaacaacat 1560 gatgttaatg aacttaatgt atttttctat ttagatgcac agaaagtgcc cgaaggtgaa 1620 aataatgtca atctcacctc ttcaattgat acagcattat tagaacaacc taaaatatat 1680 acattttttt catcagaatt tattaataat gtcaataaac ctgtgcaagc agcattattt 1740 gtaggctgga tacaacaagt attagtagat tttactactg aagctaacca aaaaagtact 1800 gttgataaaa ttgcagatat ttctatagtt gttccatata taggtcttgc tttaaatata 1860 ggaaatgaag cacaaaaagg aaattttaaa gatgcacttg aattattagg agcaggtatt 1920 ttattagaat ttgaacccga gcttttaatt cctacaattt tagtattcac gataaaatct 1980 tttttaggtt catctgataa taaaaataaa gttattaaag caataaataa tgcattgaaa 2040 gaaagagatg aaaaatggaa agaagtatat agttttatag tatcgaattg gatgactaaa 2100 attaatacac aatttaataa aagaaaagaa caaatgtatc aagctttaca aaatcaagta 2160 aatgcactta aagcaataat agaatctaag tataatagtt atactttaga agaaaaaaat 2220 gagcttacaa ataaatatga tattgagcaa atagaaaatg aacttaatca aaaggtttct 2280 atagcaatga ataatataga caggttctta actgaaagtt ctatatctta tttaatgaaa 2340 ttaataaatg aagtaaaaat taataaatta agagaatatg atgaaaatgt taaaacgtat 2400 ttattagatt atattataaa acatggatca atcttgggag agagtcagca agaactaaat 2460 tctatggtaa ttgataccct aaataatagt attcctttta agctttcttc ttatacagat 2520 gataaaattt taatttcata ttttaataag ttctttaaga gaattaaaag tagttctgtt 2580 ttaaatatga gatataaaaa tgataaatac gtagatactt caggatatga ttcaaatata 2640 aatattaatg gagatgtata taaatatcca actaataaaa atcaatttgg aatatataat 2700 gataaactta gtgaagttaa tatatctcaa aatgattaca ttatatatga taataaatat 2760 aaaaatttta gtattagttt ttgggtaaga attcctaact atgataataa gatagtaaat 2820 gttaataatg aatacactat aataaattgt atgagggata ataattcagg atggaaagta 2880 tctcttaatc ataatgaaat aatttggaca ttgcaagata attcaggaat taatcaaaaa 2940 ttagcattta actatggtaa cgcaaatggt atttctgatt atataaataa gtggattttt 3000 gtaactataa ctaatgatag attaggagat tctaaacttt atattaatgg aaatttaata 3060 gataaaaaat caattttaaa tttaggtaat attcatgtta gtgacaatat attatttaaa 3120 atagttaatt gtagttatac aagatatatt ggtattagat attttaatat ttttgataaa 3180 gaattagatg aaacagaaat tcaaacttta tataacaatg agcctaatgc aaatatttta 3240 aaggattttt ggggaaatta tttgctttat gacaaagaat attatttatt aaatgtgtta 3300 aaaccaaata actttattaa taggagaaca gattctactt taagcattaa taatataaga 3360 agcactattc ttttagctaa tagattatat agtggaataa aagttaaaat acaaagagtt 3420 aataatagta gtactaacga taatcttgtt agaaagaatg atcaggtata tattaatttt 3480 gtagccagca aaactcactt acttccatta tatgctgata cagctaccac aaataaagag 3540 aaaacaataa aaatatcatc atctggcaat agatttaatc aagtagtagt tatgaattca 3600 gtaggaaata attgtacaat gaattttaaa aataataatg gaaataatat tgggttgtta 3660 ggtttcaagg cagatactgt agttgctagt acttggtatt atacacatat gagagataat 3720 acaaacagca atggattttt ttggaacttt atttctgaag aacatggatg gcaagaaaaa 3780 acgcgttctc accaccacca ccaccactaa 3810 <210> 16 <211> 1269 <212> PRT <213> Clostridium botulinum <400> 16 Met Ala Thr Ile Asn Ser Phe Asn Tyr Asn Asp Pro Val Asn Asn Arg 1 5 10 15 Thr Ile Leu Tyr Ile Lys Pro Gly Gly Cys Gln Gln Phe Tyr Lys Ser 20 25 30 Phe Asn Ile Met Lys Asn Ile Trp Ile Ile Pro Glu Arg Asn Val Ile 35 40 45 Gly Thr Ile Pro Gln Asp Phe Leu Pro Pro Thr Ser Leu Lys Asn Gly 50 55 60 Asp Ser Ser Tyr Tyr Asp Pro Asn Tyr Leu Gln Ser Asp Gln Glu Lys 65 70 75 80 Asp Lys Phe Leu Lys Ile Val Thr Lys Ile Phe Asn Arg Ile Asn Asp 85 90 95 Asn Leu Ser Gly Arg Ile Leu Leu Glu Glu Leu Ser Lys Ala Asn Pro 100 105 110 Tyr Leu Gly Asn Asp Asn Thr Pro Asp Gly Asp Phe Ile Ile Asn Asp 115 120 125 Ala Ser Ala Val Pro Ile Gln Phe Ser Asn Gly Ser Gln Ser Ile Leu 130 135 140 Leu Pro Asn Val Ile Ile Met Gly Ala Glu Pro Asp Leu Phe Glu Thr 145 150 155 160 Asn Ser Ser Asn Ile Ser Leu Arg Asn Asn Tyr Met Pro Ser Asn His 165 170 175 Gly Phe Gly Ser Ile Ala Ile Val Thr Phe Ser Pro Glu Tyr Ser Phe 180 185 190 Arg Phe Lys Asp Asn Ser Met Asn Glu Phe Ile Gln Asp Pro Ala Leu 195 200 205 Thr Leu Met His Glu Leu Ile His Ser Leu His Gly Leu Tyr Gly Ala 210 215 220 Lys Gly Ile Thr Thr Lys Tyr Thr Ile Thr Gln Lys Gln Asn Pro Leu 225 230 235 240 Ile Thr Asn Ile Arg Gly Thr Asn Ile Glu Glu Phe Leu Thr Phe Gly 245 250 255 Gly Thr Asp Leu Asn Ile Ile Thr Ser Ala Gln Ser Asn Asp Ile Tyr 260 265 270 Thr Asn Leu Leu Ala Asp Tyr Lys Lys Ile Ala Ser Lys Leu Ser Lys 275 280 285 Val Gln Val Ser Asn Pro Leu Leu Asn Pro Tyr Lys Asp Val Phe Glu 290 295 300 Ala Lys Tyr Gly Leu Asp Lys Asp Ala Ser Gly Ile Tyr Ser Val Asn 305 310 315 320 Ile Asn Lys Phe Asn Asp Ile Phe Lys Lys Leu Tyr Ser Phe Thr Glu 325 330 335 Phe Asp Leu Ala Thr Lys Phe Gln Val Lys Cys Arg Gln Thr Tyr Ile 340 345 350 Gly Gln Tyr Lys Tyr Phe Lys Leu Ser Asn Leu Leu Asn Asp Ser Ile 355 360 365 Tyr Asn Ile Ser Glu Gly Tyr Asn Ile Asn Asn Leu Lys Val Asn Phe 370 375 380 Arg Gly Gln Asn Ala Asn Leu Asn Pro Arg Ile Ile Thr Pro Ile Thr 385 390 395 400 Gly Arg Gly Leu Val Lys Lys Ile Ile Arg Phe Cys Lys Ser Gly Ile 405 410 415 Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys Ala Ser 420 425 430 Ile Cys Ile Glu Ile Asn Asn Gly Glu Leu Phe Phe Val Ala Ser Glu 435 440 445 Asn Ser Tyr Asn Asp Asp Asn Ile Asn Thr Pro Lys Glu Ile Asp Asp 450 455 460 Thr Val Thr Ser Asn Asn Asn Tyr Glu Asn Asp Leu Asp Gln Val Ile 465 470 475 480 Leu Asn Phe Asn Ser Glu Ser Ala Pro Gly Leu Ser Asp Glu Lys Leu 485 490 495 Asn Leu Thr Ile Gln Asn Asp Ala Tyr Ile Pro Lys Tyr Asp Ser Asn 500 505 510 Gly Thr Ser Asp Ile Glu Gln His Asp Val Asn Glu Leu Asn Val Phe 515 520 525 Phe Tyr Leu Asp Ala Gln Lys Val Pro Glu Gly Glu Asn Asn Val Asn 530 535 540 Leu Thr Ser Ser Ile Asp Thr Ala Leu Leu Glu Gln Pro Lys Ile Tyr 545 550 555 560 Thr Phe Phe Ser Ser Glu Phe Ile Asn Asn Val Asn Lys Pro Val Gln 565 570 575 Ala Ala Leu Phe Val Gly Trp Ile Gln Gln Val Leu Val Asp Phe Thr 580 585 590 Thr Glu Ala Asn Gln Lys Ser Thr Val Asp Lys Ile Ala Asp Ile Ser 595 600 605 Ile Val Val Pro Tyr Ile Gly Leu Ala Leu Asn Ile Gly Asn Glu Ala 610 615 620 Gln Lys Gly Asn Phe Lys Asp Ala Leu Glu Leu Leu Gly Ala Gly Ile 625 630 635 640 Leu Leu Glu Phe Glu Pro Glu Leu Leu Ile Pro Thr Ile Leu Val Phe 645 650 655 Thr Ile Lys Ser Phe Leu Gly Ser Ser Asp Asn Lys Asn Lys Val Ile 660 665 670 Lys Ala Ile Asn Asn Ala Leu Lys Glu Arg Asp Glu Lys Trp Lys Glu 675 680 685 Val Tyr Ser Phe Ile Val Ser Asn Trp Met Thr Lys Ile Asn Thr Gln 690 695 700 Phe Asn Lys Arg Lys Glu Gln Met Tyr Gln Ala Leu Gln Asn Gln Val 705 710 715 720 Asn Ala Leu Lys Ala Ile Ile Glu Ser Lys Tyr Asn Ser Tyr Thr Leu 725 730 735 Glu Glu Lys Asn Glu Leu Thr Asn Lys Tyr Asp Ile Glu Gln Ile Glu 740 745 750 Asn Glu Leu Asn Gln Lys Val Ser Ile Ala Met Asn Asn Ile Asp Arg 755 760 765 Phe Leu Thr Glu Ser Ser Ile Ser Tyr Leu Met Lys Leu Ile Asn Glu 770 775 780 Val Lys Ile Asn Lys Leu Arg Glu Tyr Asp Glu Asn Val Lys Thr Tyr 785 790 795 800 Leu Leu Asp Tyr Ile Ile Lys His Gly Ser Ile Leu Gly Glu Ser Gln 805 810 815 Gln Glu Leu Asn Ser Met Val Ile Asp Thr Leu Asn Asn Ser Ile Pro 820 825 830 Phe Lys Leu Ser Ser Tyr Thr Asp Asp Lys Ile Leu Ile Ser Tyr Phe 835 840 845 Asn Lys Phe Phe Lys Arg Ile Lys Ser Ser Ser Val Leu Asn Met Arg 850 855 860 Tyr Lys Asn Asp Lys Tyr Val Asp Thr Ser Gly Tyr Asp Ser Asn Ile 865 870 875 880 Asn Ile Asn Gly Asp Val Tyr Lys Tyr Pro Thr Asn Lys Asn Gln Phe 885 890 895 Gly Ile Tyr Asn Asp Lys Leu Ser Glu Val Asn Ile Ser Gln Asn Asp 900 905 910 Tyr Ile Ile Tyr Asp Asn Lys Tyr Lys Asn Phe Ser Ile Ser Phe Trp 915 920 925 Val Arg Ile Pro Asn Tyr Asp Asn Lys Ile Val Asn Val Asn Asn Glu 930 935 940 Tyr Thr Ile Ile Asn Cys Met Arg Asp Asn Asn Ser Gly Trp Lys Val 945 950 955 960 Ser Leu Asn His Asn Glu Ile Ile Trp Thr Leu Gln Asp Asn Ser Gly 965 970 975 Ile Asn Gln Lys Leu Ala Phe Asn Tyr Gly Asn Ala Asn Gly Ile Ser 980 985 990 Asp Tyr Ile Asn Lys Trp Ile Phe Val Thr Ile Thr Asn Asp Arg Leu 995 1000 1005 Gly Asp Ser Lys Leu Tyr Ile Asn Gly Asn Leu Ile Asp Lys Lys 1010 1015 1020 Ser Ile Leu Asn Leu Gly Asn Ile His Val Ser Asp Asn Ile Leu 1025 1030 1035 Phe Lys Ile Val Asn Cys Ser Tyr Thr Arg Tyr Ile Gly Ile Arg 1040 1045 1050 Tyr Phe Asn Ile Phe Asp Lys Glu Leu Asp Glu Thr Glu Ile Gln 1055 1060 1065 Thr Leu Tyr Asn Asn Glu Pro Asn Ala Asn Ile Leu Lys Asp Phe 1070 1075 1080 Trp Gly Asn Tyr Leu Leu Tyr Asp Lys Glu Tyr Tyr Leu Leu Asn 1085 1090 1095 Val Leu Lys Pro Asn Asn Phe Ile Asn Arg Arg Thr Asp Ser Thr 1100 1105 1110 Leu Ser Ile Asn Asn Ile Arg Ser Thr Ile Leu Leu Ala Asn Arg 1115 1120 1125 Leu Tyr Ser Gly Ile Lys Val Lys Ile Gln Arg Val Asn Asn Ser 1130 1135 1140 Ser Thr Asn Asp Asn Leu Val Arg Lys Asn Asp Gln Val Tyr Ile 1145 1150 1155 Asn Phe Val Ala Ser Lys Thr His Leu Leu Pro Leu Tyr Ala Asp 1160 1165 1170 Thr Ala Thr Thr Asn Lys Glu Lys Thr Ile Lys Ile Ser Ser Ser 1175 1180 1185 Gly Asn Arg Phe Asn Gln Val Val Val Met Asn Ser Val Gly Asn 1190 1195 1200 Asn Cys Thr Met Asn Phe Lys Asn Asn Asn Gly Asn Asn Ile Gly 1205 1210 1215 Leu Leu Gly Phe Lys Ala Asp Thr Val Val Ala Ser Thr Trp Tyr 1220 1225 1230 Tyr Thr His Met Arg Asp Asn Thr Asn Ser Asn Gly Phe Phe Trp 1235 1240 1245 Asn Phe Ile Ser Glu Glu His Gly Trp Gln Glu Lys Thr Arg Ser 1250 1255 1260 His His His His His His 1265 <210> 17 <211> 1116 <212> DNA <213> Pseudomonas aeruginosa <400> 17 atgggcagcc tggccgcgct gaccgcgcac caggcttgcc acagagggat aataacttct 60 aaaactaaat cattagttcc gcgtggatcc aaggccctgg agcagtgcgg gtacccggtg 120 cagcggctgg tcgccctcta cctggcggcg cggctgtcgt ggaaccaggt cgaccaggtg 180 atccgcaacg ccctggccag ccccggcagc ggcggcgacc tgggcgaagc gatccgcgag 240 cagccggagc aggcccgtct ggccctgacc ctggccgccg ccgagagcga gcgcttcgtc 300 cggcagggca ccggcaacga cgaggccggc gcggccaacg ccgacgtggt gagcctgacc 360 tgcccggtcg ccgccggtga atgcgcgggc ccggcggaca gcggcgacgc cctgctggag 420 cgcaactatc ccactggcgc ggagttcctc ggcgacggcg gcgacgtcag cttcagcacc 480 cgcggcacgc agaactggac ggtggagcgg ctgctccagg cgcaccgcca actggaggag 540 cgcggctatg tgttcgtcgg ctaccacggc accttcctcg aagcggcgca aagcatcgtc 600 ttcggcgggg tgcgcgcgcg cagccaggac ctcgacgcga tctggcgcgg tttctatatc 660 gccggcgatc cggcgctggc ctacggctac gcccaggacc aggaacccga cgcacgcggc 720 cggatccgca acggtgccct gctgcgggtc tatgtgccgc gctcgagcct gccgggcttc 780 taccgcacca gcctgaccct ggccgcgccg gaggcggcgg gcgaggtcga acggctgatc 840 ggccatccgc tgccgctgcg cctggacgcc atcaccggcc ccgaggagga aggcgggcgc 900 ctggagacca ttctcggctg gccgctggcc gagcgcaccg tggtgattcc ctcggcgatc 960 cccaccgacc cgcgcaacgt cggcggcgac ctcgacccgt ccagcatccc cgacaaggaa 1020 caggcgatca gcgccctgcc ggactacgcc agccagcccg gcaaaccgcc gcgcgaggac 1080 ctgacgcgtc tcgagcacca ccaccaccac cactaa 1116 <210> 18 <211> 371 <212> PRT <213> Pseudomonas aeruginosa <400> 18 Met Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys His Arg Gly 1 5 10 15 Ile Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys Ala 20 25 30 Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu Tyr Leu 35 40 45 Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Arg Asn Ala 50 55 60 Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile Arg Glu 65 70 75 80 Gln Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala Glu Ser 85 90 95 Glu Arg Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly Ala Ala 100 105 110 Asn Ala Asp Val Val Ser Leu Thr Cys Pro Val Ala Ala Gly Glu Cys 115 120 125 Ala Gly Pro Ala Asp Ser Gly Asp Ala Leu Leu Glu Arg Asn Tyr Pro 130 135 140 Thr Gly Ala Glu Phe Leu Gly Asp Gly Gly Asp Val Ser Phe Ser Thr 145 150 155 160 Arg Gly Thr Gln Asn Trp Thr Val Glu Arg Leu Leu Gln Ala His Arg 165 170 175 Gln Leu Glu Glu Arg Gly Tyr Val Phe Val Gly Tyr His Gly Thr Phe 180 185 190 Leu Glu Ala Ala Gln Ser Ile Val Phe Gly Gly Val Arg Ala Arg Ser 195 200 205 Gln Asp Leu Asp Ala Ile Trp Arg Gly Phe Tyr Ile Ala Gly Asp Pro 210 215 220 Ala Leu Ala Tyr Gly Tyr Ala Gln Asp Gln Glu Pro Asp Ala Arg Gly 225 230 235 240 Arg Ile Arg Asn Gly Ala Leu Leu Arg Val Tyr Val Pro Arg Ser Ser 245 250 255 Leu Pro Gly Phe Tyr Arg Thr Ser Leu Thr Leu Ala Ala Pro Glu Ala 260 265 270 Ala Gly Glu Val Glu Arg Leu Ile Gly His Pro Leu Pro Leu Arg Leu 275 280 285 Asp Ala Ile Thr Gly Pro Glu Glu Glu Gly Gly Arg Leu Glu Thr Ile 290 295 300 Leu Gly Trp Pro Leu Ala Glu Arg Thr Val Val Ile Pro Ser Ala Ile 305 310 315 320 Pro Thr Asp Pro Arg Asn Val Gly Gly Asp Leu Asp Pro Ser Ser Ile 325 330 335 Pro Asp Lys Glu Gln Ala Ile Ser Ala Leu Pro Asp Tyr Ala Ser Gln 340 345 350 Pro Gly Lys Pro Pro Arg Glu Asp Leu Thr Arg Leu Glu His His His 355 360 365 His His His 370 <210> 19 <211> 1215 <212> DNA <213> Corynebacterium diphtheriae <400> 19 atggctgatg atgttgttga ttcttctaaa tcttttgtga tggaaaactt ttcttcgtac 60 cacgggacta aacctggtta tgtagattcc attcaaaaag gtatacaaaa gccaaaatct 120 ggtacacaag gaaattatga cgatgattgg aaagggtttt atagtaccga caataaatac 180 gacgctgcgg gatactctgt agataacgaa aacccgctct ctggaaaagc tggaggcgtg 240 gtcaaagtga cgtatccagg actgacgaag gtcctcgcac taaaagtgga taatgccgaa 300 actattaaga aagagttagg tttaagtctc actgaaccgt tgatggagca agtcggaaca 360 gaagagttta tcaaaaggtt cggggatggt gcttcgcgtg tagtactcag ccttcccttt 420 gccgagggga gttctagcgt cgaatatatt aataactggg aacaggcgaa agcgttaagc 480 gtagaacttg agattaattt tgaaacccgt ggaaaacgtg gccaagatgc gatgtatgag 540 tatatggctc aagcctgtgc aagagggata ataacttcta aaactaaatc attggttcca 600 cgtggatcca aggccttgtc atgcataaat cttgattggg atgtcataag ggataaaact 660 aagacaaaga tagagtcttt gaaagagcat ggccctatca aaaataaaat gagcgaaagt 720 cccaataaaa cagtatctga ggaaaaagct aaacaatacc tagaagaatt tcatcaaacc 780 gcattagagc atcctgaatt gtcagaactt aaaaccgtta ctgggaccaa tcctcttttc 840 gctggggcta actatgcggc gtgggcagta aacgttgcgc aagttatcga tagcgaaaca 900 gctgataatt tggaaaagac aactgctgct ctttcgatac ttcctggtat cggtagcgta 960 atgggcattg cagacggtgc cgttcaccac aatacagaag agatagtggc acaatcaata 1020 gctttatcgt ctttaatggt tgctcaagct attccattgg taggagagct agttgatatt 1080 ggtttcgctg catataattt tgtagagagt attatcaatt tgtttcaagt agttcataat 1140 tcgtataatc gtcccgcgta ttctccgggg cataaaacgc aaccatttct cgagcaccac 1200 caccaccacc actaa 1215 <210> 20 <211> 404 <212> PRT <213> Corynebacterium diphtheriae <400> 20 Met Ala Asp Asp Val Val Asp Ser Ser Lys Ser Phe Val Met Glu Asn 1 5 10 15 Phe Ser Ser Tyr His Gly Thr Lys Pro Gly Tyr Val Asp Ser Ile Gln 20 25 30 Lys Gly Ile Gln Lys Pro Lys Ser Gly Thr Gln Gly Asn Tyr Asp Asp 35 40 45 Asp Trp Lys Gly Phe Tyr Ser Thr Asp Asn Lys Tyr Asp Ala Ala Gly 50 55 60 Tyr Ser Val Asp Asn Glu Asn Pro Leu Ser Gly Lys Ala Gly Gly Val 65 70 75 80 Val Lys Val Thr Tyr Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val 85 90 95 Asp Asn Ala Glu Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu 100 105 110 Pro Leu Met Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly 115 120 125 Asp Gly Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser 130 135 140 Ser Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser 145 150 155 160 Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln Asp 165 170 175 Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Arg Gly Ile Ile Thr 180 185 190 Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys Ala Leu Ser Cys 195 200 205 Ile Asn Leu Asp Trp Asp Val Ile Arg Asp Lys Thr Lys Thr Lys Ile 210 215 220 Glu Ser Leu Lys Glu His Gly Pro Ile Lys Asn Lys Met Ser Glu Ser 225 230 235 240 Pro Asn Lys Thr Val Ser Glu Glu Lys Ala Lys Gln Tyr Leu Glu Glu 245 250 255 Phe His Gln Thr Ala Leu Glu His Pro Glu Leu Ser Glu Leu Lys Thr 260 265 270 Val Thr Gly Thr Asn Pro Val Phe Ala Gly Ala Asn Tyr Ala Ala Trp 275 280 285 Ala Val Asn Val Ala Gln Val Ile Asp Ser Glu Thr Ala Asp Asn Leu 290 295 300 Glu Lys Thr Thr Ala Ala Leu Ser Ile Leu Pro Gly Ile Gly Ser Val 305 310 315 320 Met Gly Ile Ala Asp Gly Ala Val His His Asn Thr Glu Glu Ile Val 325 330 335 Ala Gln Ser Ile Ala Leu Ser Ser Leu Met Val Ala Gln Ala Ile Pro 340 345 350 Leu Val Gly Glu Leu Val Asp Ile Gly Phe Ala Ala Tyr Asn Phe Val 355 360 365 Glu Ser Ile Ile Asn Leu Phe Gln Val Val His Asn Ser Tyr Asn Arg 370 375 380 Pro Ala Tyr Ser Pro Gly His Lys Thr Gln Pro Phe Leu Glu His His 385 390 395 400 His His His His <210> 21 <211> 1650 <212> DNA <213> Ricinus communis <400> 21 atggtcccca aacaataccc aattataaac tttaccacag cgggtgccac tgtgcaaagc 60 tacacaaact ttatcagagc tgttcgcggt cgtttaacaa ctggagctga tgtgagacat 120 gatataccag tgttgccaaa cagagttggt ttgcctataa accaacggtt tattttagtt 180 gaactctcaa atcatgcaga gctttctgtt acattagccc tggatgtcac caatgcatat 240 gtggtcggct accgtgctgg aaatagcgca tatttctttc atcctgacaa tcaggaagat 300 gcagaagcaa tcactcatct tttcactgat gttcaaaatc gatatacatt cgcctttggt 360 ggtaattatg atagacttga acaacttgct ggtaatctga gagaaaatat cgagttggga 420 aatggtccac tagaggaggc tatctcagcg ctttattatt acagtactgg tggcactcag 480 cttccaactc tggctcgttc ctttataatt tgcatccaaa tgatttcaga agcagcaaga 540 ttccaatata ttgagggaga aatgcgcacg agaattaggt acaaccggag atctgcacca 600 gatcctagcg taattacact tgagaatagt tgggggagac tttccactgc aattcaagag 660 tctaaccaag gagcctttgc tagtccaatt caactgcaaa gacgtaatgg ttccaaattc 720 agtgtgtacg atgtgagtat attaatccct atcatagctc tcatggtgta tagatgcgca 780 cctcctaggg ggataataac ttctaaaact aaatcattgg ttccacgtgg atccaaggct 840 gatgtttgta tggatcctga gcccatagtg cgtatcgtag gtcgaaatgg tctatgtgtt 900 gatgttaggg atggaagatt ccacaacgga aacgcaatac agttgtggcc atgcaagtct 960 aatacagatg caaatcagct ctggactttg aaaagagaca atactattcg atctaatgga 1020 aagtgtttaa ctacttacgg gtacagtccg ggagtctatg tgatgatcta tgattgcaat 1080 actgctgcaa ctgatgccac ccgctggcaa atatgggata atggaaccat cataaatccc 1140 agatctagtc tagttttagc agcgacatca gggaacagtg gtaccacact tacggtgcaa 1200 accaacattt atgccgttag tcaaggttgg cttcctacta ataatacaca accttttgtt 1260 acaaccattg ttgggctata tggtctgtgc ttgcaagcaa atagtggaca agtatggata 1320 gaggactgta gcagtgaaaa ggctgaacaa cagtgggctc tttatgcaga tggttcaata 1380 cgtcctcagc aaaaccgaga taattgcctt acaagtgatt ctaatatacg ggaaacagtt 1440 gttaagatcc tctcttgtgg ccctgcatcc tctggccaac gatggatgtt caagaatgat 1500 ggaaccattt taaatttgta tagtggattg gtgttagatg tgaggcgatc ggatccgagc 1560 cttaaacaaa tcattcttta ccctctccat ggtgacccaa accaaatatg gttaccatta 1620 tttctcgagc accaccacca ccaccactaa 1650 <210> 22 <211> 549 <212> PRT <213> Ricinus communis <400> 22 Met Val Pro Lys Gln Tyr Pro Ile Ile Asn Phe Thr Thr Ala Gly Ala 1 5 10 15 Thr Val Gln Ser Tyr Thr Asn Phe Ile Arg Ala Val Arg Gly Arg Leu 20 25 30 Thr Thr Gly Ala Asp Val Arg His Asp Ile Pro Val Leu Pro Asn Arg 35 40 45 Val Gly Leu Pro Ile Asn Gln Arg Phe Ile Leu Val Glu Leu Ser Asn 50 55 60 His Ala Glu Leu Ser Val Thr Leu Ala Leu Asp Val Thr Asn Ala Tyr 65 70 75 80 Val Val Gly Tyr Arg Ala Gly Asn Ser Ala Tyr Phe Phe His Pro Asp 85 90 95 Asn Gln Glu Asp Ala Glu Ala Ile Thr His Leu Phe Thr Asp Val Gln 100 105 110 Asn Arg Tyr Thr Phe Ala Phe Gly Gly Asn Tyr Asp Arg Leu Glu Gln 115 120 125 Leu Ala Gly Asn Leu Arg Glu Asn Ile Glu Leu Gly Asn Gly Pro Leu 130 135 140 Glu Glu Ala Ile Ser Ala Leu Tyr Tyr Tyr Ser Thr Gly Gly Thr Gln 145 150 155 160 Leu Pro Thr Leu Ala Arg Ser Phe Ile Ile Cys Ile Gln Met Ile Ser 165 170 175 Glu Ala Ala Arg Phe Gln Tyr Ile Glu Gly Glu Met Arg Thr Arg Ile 180 185 190 Arg Tyr Asn Arg Arg Ser Ala Pro Asp Pro Ser Val Ile Thr Leu Glu 195 200 205 Asn Ser Trp Gly Arg Leu Ser Thr Ala Ile Gln Glu Ser Asn Gln Gly 210 215 220 Ala Phe Ala Ser Pro Ile Gln Leu Gln Arg Arg Asn Gly Ser Lys Phe 225 230 235 240 Ser Val Tyr Asp Val Ser Ile Leu Ile Pro Ile Ile Ala Leu Met Val 245 250 255 Tyr Arg Cys Ala Pro Pro Arg Gly Ile Ile Thr Ser Lys Thr Lys Ser 260 265 270 Leu Val Pro Arg Gly Ser Lys Ala Asp Val Cys Met Asp Pro Glu Pro 275 280 285 Ile Val Arg Ile Val Gly Arg Asn Gly Leu Cys Val Asp Val Arg Asp 290 295 300 Gly Arg Phe His Asn Gly Asn Ala Ile Gln Leu Trp Pro Cys Lys Ser 305 310 315 320 Asn Thr Asp Ala Asn Gln Leu Trp Thr Leu Lys Arg Asp Asn Thr Ile 325 330 335 Arg Ser Asn Gly Lys Cys Leu Thr Thr Tyr Gly Tyr Ser Pro Gly Val 340 345 350 Tyr Val Met Ile Tyr Asp Cys Asn Thr Ala Ala Thr Asp Ala Thr Arg 355 360 365 Trp Gln Ile Trp Asp Asn Gly Thr Ile Ile Asn Pro Arg Ser Ser Leu 370 375 380 Val Leu Ala Ala Thr Ser Gly Asn Ser Gly Thr Thr Leu Thr Val Gln 385 390 395 400 Thr Asn Ile Tyr Ala Val Ser Gln Gly Trp Leu Pro Thr Asn Asn Thr 405 410 415 Gln Pro Phe Val Thr Thr Ile Val Gly Leu Tyr Gly Leu Cys Leu Gln 420 425 430 Ala Asn Ser Gly Gln Val Trp Ile Glu Asp Cys Ser Ser Glu Lys Ala 435 440 445 Glu Gln Gln Trp Ala Leu Tyr Ala Asp Gly Ser Ile Arg Pro Gln Gln 450 455 460 Asn Arg Asp Asn Cys Leu Thr Ser Asp Ser Asn Ile Arg Glu Thr Val 465 470 475 480 Val Lys Ile Leu Ser Cys Gly Pro Ala Ser Ser Gly Gln Arg Trp Met 485 490 495 Phe Lys Asn Asp Gly Thr Ile Leu Asn Leu Tyr Ser Gly Leu Val Leu 500 505 510 Asp Val Arg Arg Ser Asp Pro Ser Leu Lys Gln Ile Ile Leu Tyr Pro 515 520 525 Leu His Gly Asp Pro Asn Gln Ile Trp Leu Pro Leu Phe Leu Glu His 530 535 540 His His His His His 545

Claims

대장균 숙주세포에서 재조합 발현에 의해 두 사슬이 이황화 가교된 이쇄형의 폴리펩티드 또는 단백질을 제조하는 방법으로서,

(i) 상기 폴리펩티드 또는 단백질은 이황화 가교된 이쇄 폴리펩티드 또는 단백질로서 그 생물학적 활성을 나타내고,

(ii) 상기 폴리펩티드 또는 단백질의 제1 사슬의 C-말단 아미노산 잔기는 Arg 또는 Lys 잔기이고,

(iii) 상기 단백질 또는 폴리펩티드의 제2 사슬은 N-말단에 1 내지 20 아미노산 잔기 및 PRS로 지칭되는 펜타펩티드 서열 VPXGS을 가지며, 이때 X는 자연 발생 아미노산 중 하나이며, V는 Val, Leu, Ile, Ala, Phe, Pro 또는 Gly이며, P는 Pro, Leu, Ile, Ala, Phe, Val 또는 Gly이며, G는 Gly, Leu, Ile, Ala, Pro, Phe 또는 Val이며, S 는 Ser, Tyr, Trp, 또는 Thr이며; 및

(iv)(a) 폴리펩티드 또는 단백질을 핵산 수준에서 변경하는 단계로서, 변경된 형태의 폴리펩티드 또는 단백질이 그 루프 영역내에 VPXGS 서열(X, V, P, G, 및 S 는 상기에서 정의된 바와 동일하다)을 갖도록 변경하는 단계;

(b) 상기 핵산 수준에서 변경된 구조체를 대장균 세포에 삽입하는 단계;

(c) 숙주 세포를 배양하고 이후 용해시키는 단계; 및

(d) 이황화 가교된 이쇄 펩티드 또는 단백질을 분리하는 단계를 포함하는, 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
제1항에 있어서, 상기 제1 사슬은 단백질 또는 폴리펩티드의 경쇄이고, 제2 사슬은 단백질 또는 폴리펩티드의 중쇄인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
제1항 또는 제2항에 있어서, 상기 폴리펩티드 또는 단백질은 보툴리늄 신경 독소인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 폴리펩티드 또는 단백질은 혈청형 A 보툴리늄 신경 독소(BoNT(A))인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
제1항 또는 제2항에 있어서, 상기 폴리펩티드 또는 단백질은 BoNT(A)의 LH_N 단편인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
제4항 또는 제5항에 있어서, 상기 PRS 서열 VPXGS이 BoNT(A)의 443-447 아미노산의 삭제와 함께 Leu ₄₄₂ 및 Lys₄₄₈ 아미노산 사이에 삽입되는, 재조합 발현에 의 한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
제6항에 있어서, 상기 PRS 서열 VPRGS, VPYGS, VPHGS, 또는 VPQGS이 삽입되는, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 PRS 서열 VPXGS가 하나 이상의 아미노산 삭제와 함께, BoNT(B)의 옥타펩티드 Lys₄₃₈ - Ile₄₄₅ 내로, BoNT(C1)의 15머 His₄₃₈- Asp₄₅₂, 또는 BoNT(E)의 13머 Lys₄₁₃ - Ile₄₂₅ 내로 삽입되는, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
제8항에 있어서, 상기 PRS 서열 VPXGS가 17머 GIITSKTKSLVPRGSKA 또는 18머 RGIITSKTKSLVPRGSKA의 형태로 삽입되는, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
제1항 또는 제2항에 있어서, 상기 단백질이 혼성 단백질인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
제10항에 있어서, 상기 혼성 단백질은 하기 구성성분 A, B, 및 C를 갖는 것 인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법:

(구성성분 A)- 효소활성에 의해 표적 세포에서의 분비를 억제하거나 살해할 수 있는 효과 도메인, 또는 독소 도메인;

(구성성분 B)- 서열 VPXGS를 포함하는 루프 서열; 및

(구성성분 C)- 융합 단백질 또는 혼성 단백질에 세포 특이성을 부여하는 세포 결합 도메인.
제11항에 있어서, 상기 혼성 단백질은 구성성분 D로서 전좌 도메인을 추가로 포함하는, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
제11항 또는 제12항에 있어서, 상기 독소 도메인(A)는 디프테리아 독소의 도메인, 슈도모나스 외독소의 도메인, 또는 라이신의 도메인인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
제13항에 있어서, 상기 독소 도메인(A)는 슈도모나스 외독소 단편 PE40 (도메인 III, 도메인 II, 및 도메인 Ib) 또는 단편 PE38 (도메인 III 및 도메인 II) 또는 라이신의 A 사슬인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
제11항 내지 제14항 중 어느 한 항에 있어서, 상기 세포 결합 도메인(C)가 단클론 항체, 아필린, 안키린 반복 단백질, 안티칼린, TGF-alpha, FGF, VEGF, 또는 IGF-1와 같은 성장 인자, 또는 IL2, IL4, 또는 IL6와 같은 시토킨인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
제10항에 있어서, 상기 혼성 단백질은 하기 구성성분 A, B, 및 C를 갖는 것인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법:

(구성성분 A)- 융합 단백질에 더 나은 용해성을 부여하고, 더 높은 발현율을 나타내게 하며 및/또는 친화성 정제를 가능하게 하는 단백질 또는 올리고 펩티드;

(구성성분 B)- 서열 VPXGS를 포함하는 루프 서열; 및

(구성성분 C)- 모든 형태의 폴리펩티드.
제16항에 있어서, 상기 구성성분 A는 글루타티온-S-트랜스퍼라제(GST), 말토스 결합단백질(MBP), His 태그, Strep 태그, 또는 FLAG 태그인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
제1항 내지 제17항 중 어느 한 항에 있어서, 상기 대장균 세포는 대장균 K12, 특히 M15[pREP4], XL1-BLUE 또는 UT5600 균주의 대장균 K12 세포인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
제1 사슬의 C-말단이 Arg 또는 Lys 잔기이고, 제2 사슬은 N-말단에 1 내지 20 아미노산 잔기 및 PRS로 지칭되는 펜타펩티드 서열 VPXGS을 가지며, 이때 X는 자연 발생 아미노산 중 하나이며, V는 Val, Leu, Ile, Ala, Phe, Pro 또는 Gly이며, P는 Pro, Leu, Ile, Ala, Phe, Val 또는 Gly이며, G는 Gly, Leu, Ile, Ala, Pro, Phe 또는 Val이며, S 는 Ser, Tyr, Trp, 또는 Thr인 것을 특징으로 하는, 이황화 가교된 이쇄 폴리펩티드 또는 단백질로서 존재하고, 생물학적 활성인 폴리펩티드 또는 단백질.
제19항에 있어서, 상기 제1 사슬은 단백질 또는 폴리펩티드의 경쇄이고, 제2 사슬은 단백질 또는 폴리펩티드의 중쇄인 폴리펩티드 또는 단백질.
제19항 또는 제20항에 있어서, 상기 제1 사슬의 C-말단이 Lys 잔기인 폴리펩티드 또는 단백질.
제19항 내지 제21항 중 어느 한 항에 있어서, 상기 제2 사슬이 N-말단에 펜타펩티드 서열 VPXGS, 헥사펩티드 서열 XVPXGS, 또는 헵타펩티드 서열 XXVPXGS을 갖는 폴리펩티드 또는 단백질.
제19항 또는 제22항에 있어서, 상기 폴리펩티드 또는 단백질이 보툴리늄 신경독소, 보툴리늄 신경독소의 유도체 또는 단편, 특히 LH_N 단편을 포함하거나, 보툴리늄 신경독소의 생물학적 활성을 갖는 폴리펩티드 또는 단백질.
제19항 내지 제23항 중 어느 한 항에 있어서, 상기 폴리펩티드 또는 단백질이 혈청형 A 보툴리늄 신경 독소(BoNT(A))를 포함하거나, 또는 BoNT(A)의 생물학적 활성을 갖는, 폴리펩티드 또는 단백질.
제19항 내지 제22항 중 어느 한 항에 있어서, 상기 폴리펩티드 또는 단백질이 BoNT(A)의 LH_N 단편이거나, 또는 BoNT(A)의 생물학적 활성을 갖는, 폴리펩티드 또는 단백질.
제19항 내지 제25항 중 어느 한 항에 있어서, 상기 제2 사슬이 N-말단에 헵타펩티드 서열 SLVPXGS을 갖는 폴리펩티드 또는 단백질.
제26항에 있어서, X가 R, Y, H, 또는 Q인 폴리펩티드 또는 단백질.
제19항 내지 제22항 중 어느 한 항, 제26항 또는 제27항에 있어서, 상기 단백질이 혼성 단백질인 폴리펩티드 또는 단백질.
제28항에 있어서, 상기 혼성 단백질은 하기 구성성분 A, B, 및 C를 갖는 것인, 폴리펩티드 또는 단백질:

(구성성분 A)- 효소활성에 의해 표적 세포에서의 분비를 억제하거나 살해할 수 있는 효과 도메인, 또는 독소 도메인;

(구성성분 B)- 서열 VPXGS를 포함하는 루프 서열; 및

(구성성분 C)- 융합 단백질 또는 혼성 단백질에 세포 특이성을 부여하는 세포 결합 도메인.
제29항에 있어서, 상기 혼성 단백질은 구성성분 D로서 전좌 도메인을 추가로 포함하는 폴리펩티드 또는 단백질.
제29항 또는 제30항에 있어서, 상기 독소 도메인(A)는 디프테리아 독소의 도메인, 슈도모나스 외독소의 도메인, 또는 라이신의 도메인인 폴리펩티드 또는 단백질.
제31항에 있어서, 상기 독소 도메인(A)는 슈도모나스 외독소 단편 PE40 (도메인 III, 도메인 II, 및 도메인 Ib) 또는 단편 PE38 (도메인 III 및 도메인 II) 또는 라이신의 A 사슬인 폴리펩티드 또는 단백질.
제29항 내지 제32항 중 어느 한 항에 있어서, 상기 세포 결합 도메인(C)가 단클론 항체, 아필린, 안키린 반복 단백질, 안티칼린, TGF-alpha, FGF, VEGF, 또는 IGF-1와 같은 성장 인자, 또는 IL2, IL4, 또는 IL6와 같은 시토킨인 폴리펩티드 또는 단백질.
제28항에 있어서, 상기 혼성 단백질은 하기 구성성분 A, B, 및 C를 갖는 것인, 폴리펩티드 또는 단백질:

(구성성분 A)- 융합 단백질에 더 나은 용해성을 부여하고, 더 높은 발현율을 나타내게하며 및/또는 친화성 정제를 가능하게 하는 단백질 또는 올리고 펩티드;

(구성성분 B)- 서열 VPXGS를 포함하는 루프 서열; 및

(구성성분 C)- 모든 형태의 폴리펩티드.
제34항에 있어서, 상기 구성성분 A는 글루타티온-S-트랜스퍼라제(GST), 말토스 결합단백질(MBP), His 태그, Strep 태그, 또는 FLAG 태그인, 폴리펩티드 또는 단백질
제19항 내지 35항 중 어느 한 항에 따른 폴리펩티드 또는 단백질을 코딩하는 핵산.
제36항에 있어서, DNA인 핵산.
제36항 또는 제37항의 핵산을 포함하는 벡터.
제38항의 벡터를 포함하는 숙주 세포.
제39항에 있어서, 상기 숙주 세포가 원핵세포, 특히 대장균 세포, 특히 대장균 K12 세포인 숙주세포.
제39항 또는 제40항에 있어서, 상기 숙주세포가 M15[pREP4]이고, 상기 벡터가 pQE 시리즈의 플라스미드인 숙주세포.
제19항 내지 제35항 중 어느 한 항의 폴리펩티드 또는 단백질을 포함하는 약학적 제제.