KR20070104605A - 이황화 가교된 이쇄형 단백질의 재조합 발현 - Google Patents
이황화 가교된 이쇄형 단백질의 재조합 발현 Download PDFInfo
- Publication number
- KR20070104605A KR20070104605A KR1020077018752A KR20077018752A KR20070104605A KR 20070104605 A KR20070104605 A KR 20070104605A KR 1020077018752 A KR1020077018752 A KR 1020077018752A KR 20077018752 A KR20077018752 A KR 20077018752A KR 20070104605 A KR20070104605 A KR 20070104605A
- Authority
- KR
- South Korea
- Prior art keywords
- ile
- asn
- leu
- lys
- ser
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/21—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Pseudomonadaceae (F)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/06—Preparation of peptides or proteins produced by the hydrolysis of a peptide bond, e.g. hydrolysate products
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/33—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Clostridium (G)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/34—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Corynebacterium (G)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Biochemistry (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Oncology (AREA)
- Communicable Diseases (AREA)
- Immunology (AREA)
- Epidemiology (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 대장균 숙주세포에서 재조합 발현으로 이쇄형의 폴리펩티드 또는 단백질을 제조하는 방법에 관한 것으로, 상기 방법에서 (i) 상기 폴리펩티드 또는 단백질은 이쇄 폴리펩티드 또는 단백질로서 그 생물학적 활성을 나타내고, (ii) 제1 사슬의 C-말단 아미노산 그룹은 Arg 또는 Lys 그룹이고, (iii) 상기 단백질 또는 폴리펩티드의 제2 사슬은 N-말단에 1 내지 20 아미노산 그룹 및 PRS로 지칭되는 펜타펩티드 서열 VPXGS을 가지며, 이때 X는 모든 자연 발생 아미노산일 수 있으며, V는 Val, Leu, Ile, Ala, Phe, Pro 또는 Gly이며, P는 Pro, Leu, Ile, Ala, Phe, Val 또는 Gly이며, G는 Gly, Leu, Ile, Ala, Pro, Phe 또는 Val이며, S는 Ser, Tyr, Trp, 또는 Thr이다; 및 (iv) 상기 방법은 (a) 폴리펩티드 또는 단백질이 그 루프 영역내에 VPXGS 서열(X, V, P, G, 및 S 는 상기에서 정의된 바와 동일하다)을 갖도록, 핵산 수준에서 폴리펩티드 또는 단백질을 변경하는 단계; (b) 상기 핵산 수준에서 변경된 구조체를 대장균 세포에 삽입하는 단계; (c) 숙주 세포를 배양하고 이후 용해시키는 단계; 및 (d) 이황화 가교된 이쇄 펩티드 또는 단백질을 분리하는 단계를 포함한다. 본 발명의 바람직한 구현예에 따르면, 상기 폴리펩티드 또는 단백질은 보툴리늄 신경 독소, 특히 보툴리늄 신경 독소 타입 A(BoNT(A))이다.
대장균 숙주세포, 재조합 발현, 이쇄 형태, 폴리펩티드 또는 단백질
Description
본 발명은 대장균 숙주 세포에서의 재조합 발현에 의해 이쇄형(dichain form)의 단백질을 제조하는 방법에 관한 것이다. 본 발명은 또한 상기 방법으로 제조될 수 있는 생물학적으로 활성이며 이쇄형의 단백질 또는 폴리펩티드에 관한 것이다.
본 발명의 중요한 장점은 본 발명에 따른 기술적 특징을 나타내지 않는 재조합 단백질 또는 폴리펩티드에 비교하여 볼 때, 폴리펩티드 사슬의 표적 절단을 위해 특정 프로테아제로 처리할 필요가 없어 제조 방법이 매우 간단하다는 것이다. 본 발명의 추가적인 면은 본 발명에 따른 폴리펩티드 또는 단백질을 코드하는 핵산; 상기 핵산 또는 핵산 서열을 포함하는 벡터; 상기 벡터를 포함하는 숙주 세포; 및, 생물학적으로 활성인 이쇄 프로테인/폴리펩티드를 포함하는 약학적 제제에 관한 것이다.
클로스트리듐 신경독소(Clostridial neurotoxin)는 신경세포에서 칼슘-의존성 신경전달체 분비의 강력한 억제제이다. 예를 들어 상한 음식 등을 통해 보툴리늄 독소(BoNT)가 경구로 흡수되면, 다양한 근육의 마비를 특징으로 하는 보툴리즘 이라 지칭되는 임상 증상이 나타난다. 호흡근의 마비는 최종적으로 감염된 사람의 치사까지 이르게 한다. 이와 관련하여 신경에서 근육으로의 신호 전달은 근수용기(myoceptor)에서 차단되는데, 운동 신경이 더 이상 아세틸콜린을 분비하지 않기 때문이다. 보툴리늄 신경독소는 SNARE 단백질로 지칭되는 분비과정에 참여하는 단백질을 단백분해성 절단함으로써 억제작용을 나타낸다. 상이한 혈청형의 신경독소는 SNARE 단백질에 대해 상이한 특이성 및 상이한 각 아미노산 서열에서의 절단 부위를 갖는다. BoNT(A) 및 BoNT(E)는 SNARE 단백질 SNAP-25을 절단하는 반면, BoNT(C)는 SNAP-25 뿐만 아니라 신탁신-1(syntaxin-1)도 기질로서 인식한다. 또한, 혈청형 B, D, F, 및 G 독소와 파상풍 독소(TeNT)는 VAMP-2(시나프로브래빈-2;synaprobrevin-2)를 절단한다(Schiavo 등., 1997).
클로스트리듐성 신경독소는 가장 강력한 공지 독소이다. 예를 들면, 쥐에 정맥주사시, 단지 5pg으로 투여된 모든 쥐 중 반을 치사시킬 수 있다. 대부분의 혈청형 독소가 경구 투여시에도 독성을 나타내는데, 이는 복합체 단백질(complex protein)이 형성되고, 이 복합체 단백질에 독소가 끼어져, 위장관을 통과할 때 독소가 소화 효소에 의해 분해되는 것을 막기 때문이다. 이들은 또한 독소가 소장 상피세포로 재흡수되는 데 있어서도 일정 기능을 발휘한다(Fujinaga, 1997).
과거 수십년간, 혈청형 A 및 B의 보툴리늄 독소가 치료적 효과가 있음이 밝혀졌다. 예를 들어, 아주 최소량의 표적 주사에 의해 만성 경련을 일으키는 개별 근육을 이완시키는 것이 가능하다. 특히 장점은 효과가 장기간 지속 되는 것인데, 예를 들면 BoNT(A) 및 BoNT(B)은 3개월 이상 6개월까지 효과가 지속 된다. 제1적응 증은 사경(torticollia), 눈꺼풀연축(blepharospasm) 및 사시(strabism)와 같은 근육긴장이상(dystonia)이며; 다한증(hyperhidrosis) 또는 주름완화를 위한 미용적 처치법 등이 부가되었다. 치료제로서 보툴리늄 독소에 대한 시장은 급속하게 성장하고 있는데, 이는 추가적인 적응증의 개발에 기인한 것이라기보다 이미 존재하는 적응증을 보다 광범위하게 사용한 덕택이었다. 이와 관련하여, 신경독소의 성질을 활성 지속, 역가 및 항원 잠재성 등에 관해 개선시키고자 하는 시도가 있다. 테스트결과, 시판되고 있는 제제(BoNT(A)제제로서, Allergen and Dysport 및 Ipsen-Beaufort에서 입수가능한 BOTOX, 및 BoNT(B)제제로서, Elan에서 입수가능한 Myobloc/Neurobloc)에 포함되어 있는 복합체 단백질은 활성 지속이나 역가에서 긍정적인 효과를 나타내지 않았고, 또한 동일한 활성을 갖는 순수 신경독소 제제에 비하여 단백질 함량이 더 높기 때문에 환자에서 면역반응을 촉발하여 더 이상의 주입이 효과가 없게 된다는 것이 밝혀졌다.
상기 복합체 단백질은 활성 성분 제형으로 부합되지 않고, 더구나 불리한 영향을 미치며, 신경독소의 성질을 개선하기 위한 어떤 변경은 오직 유전공학기술을 통해서만 달성될 수 있으므로, 신경독소를 재조합 발현, 예를 들어 대장균내에서의 발현으로 제조할 필요가 크다(이러한 방식으로 생성된 신경독소는 전술된 복합체 단백질이 없다). 보툴리늄 독소가 상이한 세포 특이성을 갖게 된다는 점에서 새로운 적응증이 개발될 수 있다. 관련하여, 재조합 독소 또는 독소 유도체를 통한 경로 또한 바람직하다.
보툴리늄 독소와 파상풍 독소는 그 아미노산 서열에 있어서 높은 상동성을 나타내며, 특히 그 도메인 구조가 유사하다. 이들은 수용체 결합 도메인(Hc), 전좌 도메인(HN), 및 신경 세포에서 대응하는 SNARE 단백질을 절단하는 촉매 서브유닛(L)으로 구성된다. Hc는 신경독소의 근수용기에 대한 특이적 결합을 담당하며, 전좌 도메인(transslocation domain)은 L이 엔도좀에서 뉴런의 세포질로 확실하게 통과할 수 있게 한다. HN (N-말단) 및 Hc(C-말단)은 100 kDa의 중쇄를 형성하며, 반면 L은 50 kDa의 경쇄 촉매 서브유닛을 형성한다. 두 폴리펩티드 사슬은 이황화 결합으로 연결된다. 참여 시스테인 잔기 사이에, 링커 영역 또는 루프 영역(링커 서열 또는 루프 서열과 동의어이며, 간단하게 링커 또는 루프로 지칭된다)이 있으며, 이들 영역의 길이는 보툴리늄 독소의 개별적 혈청형에 따라 매우 다양하다. 세포 용해 과정 중 클로스트리아에서 독소가 방출되는 마지막 순간에, 현재까지도 그 특성이 제대로 규명되지 않은 클로스트리듐 엔도펩티다제에 의해 상기 루프가 절단되며, 절단 및 미절단 종간의 비율은 각 혈청형에 따라 다양하다. 신경독소의 활성을 위해서는 상기 루프가 절단되어 이쇄 독소가 되는 것이 필수적이다(Schiavo 등., 1997). 예를 들면, 보툴리늄 신경독소 A의 경우, 루프, 즉 루프 서열 VRGIITSKTKSLDKGYNKALNDL로부터 데카펩티드가 절단되며, 이는 N-말단 및 C-말단에 서로 인접하는 시스테인 잔기를 가지며, 오직 하나의 펩티드 결합이 절단되는 것이 아니라 두개의 단백분해성 전달이 일어난다. 따라서, 생물학적으로 활성인 보툴리늄 신경독소 A는 원래의 클로스트리듐에서 번역된 독소에 비하여 자연적으로 더 낮은 분자량을 갖는다.
클로스트리듐성 프로테아제는 대장균과 같은 다른 숙주 유기체에는 존재하지 않기 때문에, 재조합 보툴리늄 독소 및 그 단편 또는 유도체는 다른 숙주 유기체에서 단쇄 펩티드로서 발현된다. 이는 이쇄 단백질일때 정상적인 생물학적/생화학적 활성을 나타내는 다른 모든 단백질도 그러하다: 통상, 이러한 단백질은 단쇄 단백질로서 재조합 DNA 기술에 의해 얻어지며, 따라서, 이쇄 단백질로서 자연적으로 나타내는 생물학적/생화학적 활성은 거의 없거나 아예 나타나지 않는다.
활성 단백질, 특히 활성 보툴리늄 독소를 만들기 위해서는 트롬빈, Xa AA 인자, 또는 게네나제(genenase)와 같은 서열-특이적 프로테아제를 위한 인식 서열의 삽입이 과거에는 필수적이었으며, 이로써 정제후, 절단 및 엔도프로테아제의 첨가에 의한 활성화가 수행될 수 있었다. 이러한 엔도프로테아제의 사용은 본질적으로 다음 두가지의 문제점이 있는데:하나는 유전공학적 방법에 의해 부가된 절단 부위이외에 다른 부차적인 절단 부위가 아미노산 서열내에 존재할 가능성을 배제할 수 없다는 것이다. 이 부차적 절단 부위에서의 절단이 상당히 비효율적으로 이루어지는 경우에도, 프로테아제 처리후, 독소의 상이한 절단 변이체 혼합물이 생성되어 그 분리가 매우 어려울 수 있다. 다른 하나는 약학적 제제의 경우 약사법상(등록을 고려) 매우 불리하다는 것인데, 제제에 후속하여 단백질을 가하거나 다른 부가적인 단백질과 접촉시키는 것은 이들 단백질의 완전한 제거나, 이후 프로세싱에서 임의로 존재하는 오염물질의 완전한 제거를 증명하여야 하므로 심각한 단점이 되며; 이는 일반적으로 상당한 경비 지출을 요구한다.
또한 다른 박테리아성 독소, 예를 들면 슈도모나스 외독소 또는 디프테리아 독소의 경우에도 효소 도메인이 독소 활성을 나타내기 위하여 이황화 가교된 이쇄 폴리펩티드로의 단백분해성 절단에 의한 활성화가 요구된다(예를 들면, 신장인자의 ADP 리보실화 및 단백질 합성의 억제). 이러한 독소들은 특히 암 치료에 사용되는 소위 면역독소를 제조하는데 사용된다. 이러한 목적을 달성하기 위하여 이들 독소의 세포 결합 도메인은 암-특이적 표면 단백질(분화 항원 또는 암-수반 항원)에 높은 결합 친화력을 가진 단백질 도메인으로 교환된다. 전형적인 면역독소에서 이들 단백질 도메인은 단클론 항체 또는 그 단편으로 구성되며, 특정 암세포에 대한 특이성은 또한 예를 들면, 시토킨, 성장인자, 아필린(affilins) 안키린 반복 단백질(ankyrin repeat protein) 또는 안티칼린(anticalins) 패밀리 등의 돌연변이성의 선택된 단백질 등에 의해 부여된다. 이러한 융합 단백질의 재조합 발현에서, 단쇄 폴리펩티드가 수득된다. 예를 들면 라이신(ricin)은 라이시누스 콤뮤니스(Ricinus communis)를 제외하고는 프로테아제에 대한 프로세싱 부위가 없으며, 이러한 부위는 반드시 삽입되어야 하며, 면역 독소의 구성성분으로서 디프테리아 독소 단편 및 슈도모나스 외독소 단편은 엔도조말 컴파트먼트에서 내재화된 후 표적 세포의 프로테아제에 의하여 절단될 수 있다. 이는 이황화 가교를 형성하는 시스테인 잔기 사이의 루프 부위에서 행해진다. 그러나, 오직 최소한의 부분만이 이러한 과정을 거치며, 모든 내재화된 면역 독소 분자가 이러한 방식으로 프로세싱되는 것은 아니다(Ogata 등., 1990).
재조합 단백질, 특히 더 작은 폴리펩티드를 충분한 양으로 그리고 가용성 형태로 얻기 위해서는, 많은 경우 이들을 예를 들면, 대장균의 글루타티온-S-트랜스 퍼라제(GST) 또는 말토스 결합단백질(MBP)과의 융합 단백질 또는 혼성 단백질로서 발현시켜야 한다. 또한, 시중의 수많은 발현 시스템은 친화성 정제(affinity purification)를 위해 목적 폴리펩티드가 N-말단 태그 또는 C-말단 태그, 예를 들면, His 태그, Strep 태그 또는 FLAG 태그 등으로 발현되어 있다. 많은 경우, 발현 플라스미드에는 목적 단백질을 코딩하는 DNA 서열이 삽입되는 복수 클로닝 부위 사이에 프로테아제 인식 서열 및 융합 파트너 또는 친화성 태그에 대한 코딩 서열이 있다. 이 서열은 융합 단백질의 발현 및 정제 후 적합한 서열-특이적 엔도프로테아제(예를 들면, 트롬빈, Xa 인자, 또는 게네나제)의 추가에 의해 목적 단백질을 부가적 펩티드 부위로부터 분리할 수 있도록 디자인되어 있다. 만약 두 융합 파트너가 펩티드 결합 대신 이황화 가교로 서로 공유적으로 결합되어 있다면, 정제후 β-머캅토에탄올, DTT, 또는 환원 글루타티온과 같은 티올-함유 물질로 간단한 환원에 의해 서로로부터 분리가 가능할 것이다. 예를 들어, 친화성 태그는 매트릭스에 결합되어 있고, 반면 목적 단백질은 친화성 매트릭스, 예를 들면, Ni-NTA 아가로스 또는 StrepTactin 세파로스로부터 전술한 환원 물질로 용출될 수 있다. 따라서, 친화성 태그 또는 가해진 엔도프로테아제를 분리하는 이후의 정제 단계는 생략될 수 있다.
따라서, 일반적인 단백질 또는 폴리펩티드, 특히 신경독소의 단백질 또는 폴리펩티드 및 그 단편 또는 유도체, 및 융합 단백질 또는 혼성 단백질(hybrid protein), 특히 숙주 세포의 용해후 생물학적으로 활성이며 이황화 가교된 이쇄 구조로 존재하는 면역 독소의 융합 단백질 또는 혼성 단백질의 재조합 발현 방법을 제공하는 것은 바람직하다. 이러한 단백질 및 폴리펩티드를 제조하는 방법이 이하에서 제공된다.
놀랍게도, 본 발명자들은 재조합 발현에 의해 단쇄로 수득되나, 그 정상적인 생물학적 또는 생화학적 활성은 이황화 가교 이쇄형이 나타내는 BoNT(A)의 LHN 단편, 및 완전 신경독소 A 양자 모두가, LHN 단편 또는 완전 독소에 바람직하게는 핵산 수준에서 적어도 하나의 특정 변경을 시행하는 경우, 이쇄형으로 재조합 발현에 의해 수득될 수 있음을 발견하였다. 본 발명자에 의해 행해진 후속 테스트에서, 통상적인 재조합 방법에서 단쇄로서 얻어지나 그 생물학적 활성은 이황화 가교된 이쇄 형태에서 나타내는 모든 다른 단백질 또는 폴리펩티드에도 동일하게 적용됨을 확인하였다.
전술한 "적어도 하나의 변경"은 BoNT(A) 또는 BoNT(A)의 LHN 단편의 경우에는 본 명세서에서 PRS(프로테아제 인식 부위)로 지칭되는 펜타펩티드 서열의 삽입을 의미한다. 일반적인 단백질 또는 폴리펩티드의 경우, 변경될(바람직하게는 핵산 수준에서)단백질 또는 폴리펩티드에 존재하는 펜타펩티드 서열을 이미 존재하는 서열내로 삽입될 펜타펩티드 서열 PRS과 매치되도록 변경될 수 있다(예를 들면, PRS의 아미노산 잔기의 삽입 또는 적어도 하나의 아미노산 잔기의 교환 또는 아미노산 잔기의 삭제에 의해서). 동일하게, 헥사/헵타/옥타(등) 펩티드 서열은 하나,두개, 세개 또는 여러개의 아미노산 잔기의 삭제하면서, 또는 삭제없이 삽입될 수 있다. 본 발명에 따라, 최종적으로 발현된 폴리펩티드가 루프 영역에 PRS(펜타펩티드)서열을 갖는 것은 유리하며, 상기 루프 영역은 본 발명에서 이황화 가교에 참여하는 두개의 시스테인 잔기사이에 위치되는 아미노산 서열로 정의된다. 이 PRS 서열이 루프 영역에 존재할 때, 폴리펩티드 서열 PRS(아미노산 수준에서)에 인접하는 단쇄 폴리펩티드의 절단은 두 상이한 사슬에 천연적으로 존재하는 서열을 두개의 상이한 사슬로 분배하는 결과를 초래한다. 보툴리늄 신경 독소 A(BoNT(A))에서, PRS 서열은 바람직하게는 BoNT(A)의 펩타펩티드 Asp443 - Asn447을 삭제시키고(도 3-1 참조) 루프내로 삽입한다. 다른 단백질 또는 폴리펩티드(예를 들면, BoNT(B), BoNT(C1), BoNT(D), BoNT(E)의 경우, 라이신의 경우, 슈도모나스 외독소의 PE40의 경우, 디프테리아 독소(DT)의 경우)에는, BoNT(A)의 변경된 루프를 루프 서열내로 삽입하는 것이 바람직하며(도 3-2 내지 3-5 참조), 이때 천연 루프 서열의 아미노산 잔기는 삭제될 수도 있고, 아닐 수도 있다. 도 3-2 내지 3-5 에서의 변경된 루프 서열은 두개의 말단 Cys 잔기가 없는 서열로서, PRS 서열의 중심 아미노산은 R, Y, H, 또는 Q 뿐 아니라 어떤 다른 자연 발생 아미노산일 수 있다. 전술한 기타 단백질 또는 폴리펩티드의 경우, 특히 BoNT(A)의 변경된 루프의 일부분만을, 특히 서열 GIITSKTKSLVPXGSKALNDL (X = 자연 발생 아미노산), 을 삽입시키는 것이 바람직하며, 이때 천연 루프 서열의 아미노산 잔기는 삭제될 수도 있고, 아닐 수도 있다. 도 3-2 내지 3-5 의 변경된 루프 서열은 두 말단 Cys 잔기가 없는 서열이다.
BoNT(A)의 LHN 단편 또는 완전 재조합 독소에 있어서, 서열 변경은 L 및 HN 사이의 루프 영역의 변화를 의미하고, 이러한 변화는 PRS 서열을 제공하는 것이다. 본 발명에 따르면, PRS 서열은, BoNT(A)에 대해서만으로 제한되지 않으며, 펜타펩티드 서열 Val-Pro-Xaa-Gly-Ser이다. Xaa은 모든 자연 발생적 아미노산을 의미한다. Xaa가 Arg 또는 기타 다른 자연 발생 아미노산이든 관계없이, 펜타펩티드 서열 Val-Pro-Xaa-Gly-Ser은 어떤 경우에서든 펜타펩티드 서열로서 지칭된다. 그러나 PRS 서열의 네개의 다른 아미노산 잔기 중 하나가 변경되면, 실제 본 발명의 내용 내에서 가능한데, 특히, 상응하는 친수성/소수성 또는 극성 단일극성 잔기로 변경되면, 이들은 본 발명에서 PRS-펜타펩티드 서열의 변이체로 지칭된다. 변이체는 예를 들면, Val이 Leu, Ile, Ala, Phe, Pro, 또는 Gly으로 대체되는 경우 존재한다. 또한 변이체는 N-말단에서 볼때 PRS의 2번째 위치의 proline이 Leu, Ile, Ala, Phe, Val, 또는 Gly으로 대체될 때 존재한다. 또한 PRS의 4번째 위치의 glycine이 Leu, Ile, Ala, Pro, Phe, 또는 Val으로 대체될 때, 이는 다른 변이체를 초래한다. PRS의 5번째 위치의 serine이 예를 들면 Tyr, Trp, Thr, 임의로 Cys, 또는 Met로 대체될 때, 새로운 형태의 변이체가 만들어진다. 본 발명에 따르면, 적어도 PRS 서열 중 1, 2, 4, 및 5 중 한 위치에 Val-1, Pro-2, Gly-4, 및/또는 Ser-5 과 상이한 아미노산 잔기를 함유하는 서열은 상기 펜타펩티드 서열의 변이체로 지칭된다.
BoNT(A)의 LHN 단편(또는 완전 재조합 독소) 또는, 재조합 발현으로 통상 단쇄 단백질 또는 폴리펩티드로서 수득되나 (오직) 이쇄형에서 생물학적으로 활성인 어떤 다른 단백질 또는 폴리펩티드가 펜타펩티드 서열 Val-Pro-Xaa-Gly-Ser(여기에서, Xaa는 20개의 자연 발생 아미노산 중 하나이며, 4개의 다른 아미노산은 전술한 바와 같은 의미에 따라 대체될 수 있다)을 포함하는 경우, 대장균 숙주 세포의 용해물내에서 이쇄형으로 존재하며(예를 들어, 대장균 K12, 특히 M15[pREP4], XL1-BLUE 또는 UT5600 균주의 대장균 K12 숙주 세포), BoNT(A)의 경우 경쇄는 HN에 또는 완전 중쇄에 이황화 가교를 통해 공유적으로 결합되어 있다(도 7 참조). 모든 세포의 용해후 직접, 또는 세포 용해물을 몇시간 인큐베이션 한 후 실질적으로 전부 상기 폴리펍티드 사슬의 절단이 실현된다. 독소 또는 독소 단편의 프로테아제 도메인의 활성에 의한 자가-단백질분해는 배제될 수 있는데, 루프 영역에 따라 변경된 프로테아제-불활성 돌연변이주가 발현되고 대장균 숙주 세포의 분해후 이쇄 구조내에 존재하기 때문이다. 명백하게, 대장균 숙주 균주의 프로테아제가 PRS 펜타펩티드 서열의 절단을 담당한다.
전술한 "놀랍게도, 본 발명자들은.."의 문단에 따른 바람직한 변경은 PRS 서열의 N-말단(펜타펩티드 PRS 서열의 발린 잔기에 바로 인접하여 위치하는 N-말단 방향의 아미노산, 도 3-2 내지 도 3-5의 경우에는 PRS 서열에서 1개의 아미노산 잔기 간격을 갖는 루이신 잔기)이 1 내지 20 아미노산 잔기의 간격에서, 특히 3 내지 15 아미노산 잔기 간격, 특별히 3 내지 10 아미노산 잔기, 특히 바람직하게는 3 내지 8 아미노산 잔기 간격에서, 보다 바람직하게는 3 아미노산 잔기 간격에서, 기초 아미노산 잔기, 바람직하게는 라이신 잔기 또는 아르기닌 잔기가 존재하고, 그 C- 말단에서 대장균 숙주 세포의 프로테아제가 루프 서열을 절단하는 데 있다. 절단 후, 이렇게 수득 되는 폴리펩티드는 PRS 서열의 발린 잔기에서 예를 들면 두 아미노산 잔기(상기 정의된 간격이 3 아미노산 잔기인 경우)-말단를 가진다. 이 경우, "변경"은 반드시 사전적 의미의 변경, 즉 아미노산 잔기의 삽입이나 치환을 의미할 필요는 없고, PRS 서열의 N-말단에 후속하여 앞서 정의된 1 내지 20 아미노산 잔기의 간격에서 기초 아미노산 잔기(예를 들면, 라이신 잔기)가 위치해 있으면 된다. 중요한 것은 기초 아미노산 잔기(라이신 잔기 또는 아르기닌 잔기와 같은)가 앞서 언급한 간격을 두고 PRS 서열의 N-말단쪽에 존재한다는 것이다.
바람직한 다른 변경은, 대장균 숙주 세포의 프로테아제가 절단하는 루프 서열이 적어도 9개의 아미노산 잔기 길이를 갖는다는 것이다. 루프 서열의 길이는 바람직하게는 최소한 12, 최소한 15, 최소한 18, 최소한 20, 및 최소한 23 아미노산 잔기이다. 특히 바람직한 루프 서열의 길이는 15 내지 22, 특히 18 내지 22 아미노산 잔기이다.
본 발명에 따른 방법은 매우 일반적인 용어로 대장균 숙주세포에서 재조합 발현에 의해 두사슬이 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질을 제조하는 방법으로서, (i) 상기 폴리펩티드 또는 단백질은 이황화 가교 이쇄 폴리펩티드 또는 단백질로서 그 생물학적 활성을 나타내고; (ii) 제1 사슬의 C-말단 아미노산 잔기는 Arg 잔기 또는 Lys 잔기이고; (iii) 상기 단백질 또는 폴리펩티드의 제2 사슬은 N-말단 1 내지 20 아미노산 잔기로서 시스테인 잔기의 N-말단 및 PRS로 지칭되는 펜타펩티드 서열 VPXGS을 가지며, 이때 X는 어떤 자연 발생 아미노산(any naturally occurring amino acid)이어도 되며, V는 Val, Leu, Ile, Ala, Phe, Pro 또는 Gly이며, P는 Pro, Leu, Ile, Ala, Phe, Val 또는 Gly이며, G는 Gly, Leu, Ile, Ala, Pro, Phe 또는 Val이며, S 는 Ser, Tyr, Trp, 또는 Thr이다; 및 (iv) 상기 방법은 하기 단계를 포함하는 바: (a) 변경된 형태의 폴리펩티드 또는 단백질이 그 루프 영역내에 전술한 펜타펩티드 서열(VPXGS)을 갖도록, 폴리펩티드 또는 단백질을 핵산 수준에서 변경하는 단계; (b) 상기 핵산 수준에서 변경된 구조체(construct)를 대장균 세포에 삽입하는 단계; (c) 숙주 세포를 배양하고 이후 용해시키는 단계; 및 (d) 이쇄 펩티드 또는 단백질을 분리하는 단계를 포함한다.
본 발명에 따르면, 단백질 또는 폴리펩티드의 제1 사슬은 바람직하게는 대응하는 DNA의 N-말단에 의해 코딩되는 사슬이고, 따라서 단백질 또는 폴리펩티드의 제2 사슬은 대응하는 DNA의 C-말단에 의해 코딩되는 사슬이다. 5'-DNA-3'의 발현이 N-폴리펩티드-C로 귀결되기 때문에, 전술한 본 발명의 바람직한 경우에서, 이는 상기 발현이 다음과 같이 대표될 수 있음을 의미한다: 5'-DNA-3'은 N-제1 폴리펩티드 사슬-C-루프-N-제2 폴리펩티드 사슬-C로 발현된다. 본 발명에 따라, 상기 루프는 이미 인 시투 절단되고 최종적으로 본 발명에 따른 폴리펩티드 또는 단백질 N-제1 폴리펩티드 사슬-C-N-제2 폴리펩티드 사슬-C가 이쇄 구조로 얻어진다.
본 발명에서 "상기 단백질 또는 폴리펩티드의 제2 사슬은 N-말단 1 내지 20 아미노산 잔기로서 시스테인 잔기의 N-말단 및 PRS로 지칭되는 펜타펩티드 서열 VPXGS을 가지며"는 N-말단이 예를 들어 펜타펩티드 서열 VPXGS의 발린 잔기가 아니라, 다른 (어떤) 아미노산 잔기인 것을 의미한다. 이 다른 (어떤) 아미노산 잔기와 PRS의 발린 잔기 사이에는, 1 내지 19 아미노산 잔기가 더 위치될 수 있으며, N-말단 아미노산 잔기는 작접적으로, 예를 들어 발린 잔기에 펩티드 결합에 의해 결합할 수 있고, PRS의 발린 잔기의 인접하는 이웃이 될 수 있다.
본 발명에 따른 그 (생물학적으로) 활성인 이쇄 구조로서 분리될 수 있는 단백질 또는 폴리펩티드는 제1 사슬의 C-말단이 기초 아미노산 잔기, 특히, Arg 잔기 또는 Lys 잔기이고, 그 제2 사슬은 1 내지 20 아미노산 잔기 및 PRS로 지칭되는 펜타펩티드 서열 VPXGS 서열(여기에서 X, V, P, G, 및 S 는 상기에서 정의된 바와 동일하다)을 갖는 N-말단을 구비한다.
본 발명에 따르면, 재조합 라이신(ricin)에 기초한 면역 독소의 경우, 예를 들어 그 활성화를 위해 트롬빈, Xa 인자와 같은 서열 특이적 프로테아제로 처리하는 것은 구식이다. 예를 들면, 디프테리아 독소 또는 슈도모나스 독소에 기초한 면역 독소의 경우 효율의 상당한 증가가 기대되었고, 실제 얻어졌으며, 이는 독소의 효소 도메인의 세포질로의 전좌를 위한 속도-결정 단계로서 표적 세포의 프로테아제에 의한 프로세싱이 더 이상 요구되지 않기 때문이다. 이미 이황화 가교 이쇄 폴리펩티드로서 존재하는 면역 독소는 소량으로 적용될 수 있으며, 여전히 동일한 세포-독성 활성을 제공한다. 이는 한편으로는 치료 경비를 저하시키고, 다른 한편으로는 면역 독소의 추가 적용시 불활성을 유발하는 항체 형성의 위험을 저하시킨다. 따라서 본 발명은 이황화 가교된 이쇄 및 활성화된 면역 독소를 제조하는 방법을 제공한다.
본 발명에 따라 제공된 방법에 의해, 이쇄 형태의 융합 단백질 또는 혼성 단백질, 즉 친화성 정제에 대한 펩티드 태그를 갖는 단백질 등을 제조할 수 있으며, 이 단백질들에서 두 폴리펩티드 사슬은 이황화 가교로 공유결합되어 있으며, 친화 크로마토그래피 또는 다른 정제 방법 후에 β-머캅토에탄올, DTT, 또는 환원 글루타티온과 같은 티올-함유 물질로 간단한 환원에 의해 분리할 수 있다.
M15[pREP4] 또는 BL21(DE3)와 같은 대장균 발현 균주에서의 클로스티리듐 신경독소 및 그 단편(예를 들면, LHN 단편 또는 개질된 세포 특이성을 갖는 클로스티리듐 신경 독소의 유도체)의 재조합 발현은 단쇄 폴리펩티드를 생산한다. 이들 폴리펩티드를 트립신으로 처리함으로써, 프로테아제 도메인의 전좌 도메인에로의 전이 영역내의 루프 서열 영역에서 절단이 일어난다. 트립신은 서열 특이적 프로테아제가 아니기 때문에, 통상 원하지 않는 폴리펩티드의 다른 영역에서의 절단이 일어날 수 있다. 예를 들면, BoNT(A)는 가해진 트립신에 의해 HN 및 HC 사이에서 절단되고, LHN 단편 및 HC 단편 이쇄가 제조될 수 있다. 대부분의 경우에서 원하는 루프영역에서의 선택적인 절단을 보증하기 위하여, 특이적 엔도프로테아제를 위한 인식 서열의 존재(임의적으로 삽입에 의해)가 요구된다.
트롬빈, Xa 인자, 게네나제 등과 같은 서열 특이적 엔도프로테아제에 의한 재조합 융합 단백질/혼성 단백질의 재조합 절단은 일반적으로 알려진 범위의 방법에 속한다. 정제후, 재조합 단백질 또는 폴리펩티드에 개선된 용해성 및/또는 개선된 발현을 부여하거나, 친화성 정제를 위한 펩티드 태그로서 기능하는 융합 파트너를 분리할 수 있다. 이를 위하여, 단백질 용액은 용해 형태 또는 매트릭스 상에 고정화된 형태의 적합한 엔도프로테아제와 인큐베이션한다.
상기 기술은 또한 이쇄 단백질 또는 폴리펩티드로서 그 정상적인 생물학적/생화학적 활성을 발생하며, 재조합 DNA 기술에 의해서는 불활성인 단쇄 단백질 또는 폴리펩티드로서 수득되는(예를 들면, 클로스트리듐 신경 독소, LHN 단편과 같은 이들의 단편 또는 예를 들어 개질된 세포 특이성을 갖는 클로스트리듐 신경 독소의 유도체), 전술한 재조합 단백질 또는 폴리펩티드의 발현에 사용할 수 있다: 엔도프로테아제를 위한 인식 서열을 상기 폴리펩티드, 바람직하게는 핵산 수준에서, 예를 들면, L 및 HN 사이의 루프 영역내로 클로닝하고, 또한 N-말단 또는 C-말단에 동일 또는 추가 엔도 프로테아제를 위한 추가 인식 서열을 클로닝하고, 그 측방에 친화성 정제를 위한 펩티드 태그를 클로닝할 수 있다. 상기 단쇄 발현된 단백질 또는 폴리펩티드는 이후 대응하는 엔도프로테아제로 처리하거나, 또는 엔도프로테아제와 동시 또는 순차적으로 L 및 HN 사이의 루프 영역에서 절단하고 펩티드 태그를 제거함으로써 활성화시킬 수 있다.
이러한 엔도프로테아제 사용에 대한 경비 및 요구되는 부가적인 작업 단계이외에도, 이들의 약학적 제제에서의 사용(예를 들면, 재조합 보툴리늄 독소 및 그 유도체의 사용)은 약사법에 기초한 (등록에 관한)이유에서 아주 문제가 많다. 한편으로는 사용된 엔도프로테아제의 순도가 실험적으로 증명되어야 하며, 다른 한편으로는 제품으로부터의 완전한 제거 및 특히 바이러스-제거가 추가되는 코스의 정제 프로토콜내에서 정밀하게 서류화되어야 하며; 이는 통상 엄청난 분석 경비를 요구한다. 차후에는, 예를 들어 개선된 성질 또는 개선된 세포 특이성을 갖는 보툴리늄 독소 또한 재조합 발현에 의해 제조될 것이기 때문에, 그 정상적인 생물학적/생화학적 활성을 이쇄 단백질 또는 폴리펩티드로서 발생하며, 재조합 DNA 기술에 의해서는 불활성인 단쇄 단백질 또는 폴리펩티드의 형태로 수득되는 전술한 재조합 단백질 또는 폴리펩티드, 특히 보툴리늄 독소 또는 그 유도체를 엔도프로테아제를 사용하지 않고, 이황화 가교된 이쇄의 따라서 생물학적으로 활성인 단백질 또는 폴리펩티드로서 제공할 수 있는 발현 방법이 매우 요망된다.
이하에서 보다 자세히 설명될 본 발명은 따라서, 가장 넓은 의미에서, 클로스트리듐 신경독소와 같은 단백질뿐 아니라 그 단편 및 유도체를 대장균 숙주 세포내에서 재조합 발현으로 제조할 수 있으며, 그 활성화에 엔도프로테아제의 추가가 요구되지 않는 생물학적으로 활성인 이황화 가교된 이쇄 형태로 분리할 수 있는 방법을 제공한다.
본 발명의 바람직한 첫번째 구현예에서, BoNT(A)의 시스테인 잔기 430 및 454 사이의 루프 영역의 아미노산 서열(도 3-1 내지 도 3-5 참조)이 변경되어, 대장균 숙주 세포의 용해물내의 발현된 독소 또는 그 단편/유도체가 이미 이쇄 폴리펩티드로서 존재한다. 이 두 사슬은 시스테인 잔기 430 및 454가 이황화 결합으로 참여하여 서로 공유적으로 결합한다. 특히 바람직한 예는 도 3에 설명된 바와 같이, 펜타펩티드 Asp443 - Asn447 (DKGYN)가 Val-Pro-Arg-Gly-Ser (VPRGS)로 대체된 것이다. 또한 Asp443 - Asn447 (DKGYN)는 Val-Pro-Tyr-Gly-Ser (VPYGS), Val-Pro-His-Gly-Sr (VPHGS) 또는 Val-Pro-Gln-Gly-Ser (VPQGS)으로 또한 대체될 수 있다. 상기 중심 아미노산 잔기는 자연 발생 아미노산 중 어느 것도 될 수 있을 뿐 아니라, 다른 4개의 아미노산 또한 전술한 바와 같이 교환될 수 있다(이들 잔기중 하나 이상이 교환될 때, 본 발명의 의미에서 PRS 서열의 변이체로 존재한다). 또한, 본 구현예 및 다른 바람직한 구현예에서, 바람직하게는 루프 서열은 PRS에서 N-말단으로 1 내지 20 아미노산 잔기 간격을 두고 에 기초 아미노산 잔기, 특히 라이신 또는 아르기닌 잔기를 갖는다.
본 발명이 속하는 분야의 당업자에게 상기와 같은 특징을 갖는 BoNT(A)의 루프 영역에서 각각의 또는 수개의 아미노산 잔기의 추가적인 교환 또는 추가적인 아미노산 잔기의 삽입 또는 삭제된 것 역시, 용해물 내 본 발명의 발현 독소 또는 이로부터 유도된 단편/유도체가 이쇄 폴리펩티드로 존재하도록 결과함은 명백하다. 이러한 변이체는 또한 본 발명에 포함된다.
또한, 본 발명이 속하는 분야의 당업자에게 발현 및 단쇄 번역되는 폴리펩티드 또는 단백질내에서 PRS-펜타펩티드 서열 또는 그것의 인식가능한 변이체 중 하나가 루프 영역내에 존재하는 한, 야생형 BoNT(A)에 존재하는 펜타펩티드 Asp443 - Asn447 (DKGYN)가 헥사펩티드, 헵타펩티드, 옥타펩티드에 의해 대체될 수 있음은 명백하다. 전술한 바와 같이, 바람직하게는 펜타펩티드의 N-말단쪽에 기초 아미노산 잔기(바람직하게는 라이신)가 존재한다.
또한 본 발명이 속하는 분야의 당업자에게, 바람직한 구현예인 PRS의 펜타펩티드(Val-Pro-Arg-Gly-Ser)가 혈액 응고 캐스캐이드에서 중요한 역할을 하며 높은 서열 특이성을 갖는 프로테아제 트롬빈에 대한 가능한 인식 서열 중 일부임은 명백하다. 먼저, 보툴리늄 신경 독소 타입 A 뿐만 아니라, 다른 폴리펩티드에서도 트롬빈에 의한 절단은 원하는 이황화 가교된 이쇄형을 수득하는데 요구되지 않으며, 두번재로 트롬빈 인식 서열 그 자체, 즉 개질되지 않은 형태는 대장균 용해물의 프로테아제 활성에 의한 절단에 유익하지만 전혀 필수적인 것은 아님을 명백하게 지적한다. 전술한 바와 같이 대응하는 폴리펩티드(그 루프에서 더 좋다)에서 삽입되거나 생성되는 PRS 펜타펩티드 서열의 구현예는, 트롬빈이 절단, 따라서 루프내 절단을 초래할 수 있는 아르기닌 잔기를 C-말단에 포함하지 않는다(대신에 다른 자연 발생 아미노산이 존재한다). 이 절단은 바람직하게 먼저 설명한 바와 같이 펜타펩티드의 N-말단인 루프의 라이신 잔기에서 실현된다(실시예 2 참조; 도 3).
장시간 작용 신경독소로서의 BoNT(B) 및 BoNT(C1), 단시간 작용 신경독소로서의 BoNT(E)와 같은 다른 혈청형의 보툴리늄 독소뿐만 아니라, 단쇄로서 재조합 발현되나 이쇄로서만이 생물학적 활성을 나타내는 전적으로 상이한 폴리펩티드 또는 단백질들도 치료학적으로 사용될 수 있기 때문에, 이들 독소 및 이들의 단편 또는 유도체(및 기타 폴리펩티드 또는 단백질 또한)가 대장균 용해물에서 이황화 가교된 이쇄 폴리펩티드 또는 단백질로서 수득되는 것은 매우 바람직하다. 특히 BoNT(B)의 경우, 대장균 용해물에서 재조합 독소의 완전한 이쇄 폴리펩티드 또는 단백질로의 절단은 클로스트리듐 보툴리늄에서 분비되는 천연 신경독소-일반적으로 40% 이상이 단쇄로서 존재하여 불활성화 폴리펩티드이며 활성화 이쇄형으로부터 분리될 수 없다-에 비해서 상당히 유리하다. 이황화 결합에 참여하는 시스테인 잔기 사이의 혈청형 B, C1, 및 E 신경독소의 루프 영역은 BoNT(A)의 루프 영역에 비하여 상당히 짧다(도 3 및 도 4 참조). BoNT(A)의 경우 23개의 아미노산 잔기(Val431 - Leu453)가 존재하는 반면, BoNT (B)에는 오직 8개의 아미노산 잔기(Lys438 - Ile445), BoNT(C1)에는 15개의 아미노산 잔기 (His438 - Asp452), 및 BoNT(E)에는 13개의 아미노산 잔기(Lys413 - Ile425)가 이 영역에 존재한다. 그럼에도 불구하고, BoNT(B)만 제외하고, 이 상대적으로 짧은 영역은 본 발명에 따른 PRS 서열을 가질때 사슬의 절단 및 이황화 가교의 형성이 가능할 만큼 충분히 길다는 것이 발견되었다. BoNT(B)는 루프내 펜타펩티드가 PRS 펜타펩티드서열로 교환되었을 때(따라서, 루프 서열의 전체 길이는 오직 8개 아미노산 잔기이다), 본 발명이 의미하는 두 사슬(경쇄 및 중쇄)로 절단되긴 하였지만, 루프길이가 9개 이상, 15개 이상, 20개 이상, 또는 22개 아미노산 잔기를 가질 때 더욱 좋은 결과, 즉 본 발명에 따라 더욱 바람직한 결과를 얻을 수 있었다. 가장 나중에 언급된 루프가 22 아미노산 잔기를 가진 구현예가 도 4-1 및 4-2의 서열로서 또는 이들 둘의 비교로서 예시적으로 설명된다.
본 발명은 또한 BoNT(A)의 루프 영역에 대한 서브타입 B, C1 등의 루프 영역의 또는 이들의 중요 부분의 교환이 특히 루프가 9개 이상, 바람직하게는 15개 이상의 잔기로 확장되고 및/또는 PRS의 N-말단 기초 아미노산 잔기(예를 들면, 바람직하게는 Lys 잔기)가 삽입되는(N-말단 기초 또는 Lys 잔기가 미리 존재하지 않는 경우) 방식으로 교환되는 것이 신경 독소의 이황화 가교 이쇄 폴리펩티드 또는 단백질로의 절단에 있어 바람직하다는 것을 실험적으로 증명하였다. 특히 바람직한 교환을 도 4에 도시하였다(도 4의 PRS 서열은 VPRGS이지만, VPYGS, VPHGS, VPQGS, VPKGS, VPIGS 및 VPAGS도 가능하며 바람직하다).
본 발명의 다른 구현예에서, 혈청형 B, C1, D, E, F, 및 G 보툴리늄 독소 및 파상풍 독소의 루프 영역을 코딩하는 아미노산 서열 및 그 유전 영역은 L 및 HN의 이황화 가교에 참여하는 시스테인 잔기 사이가 변경되어, 대장균 숙주 세포의 용해물내에서 발현 독소 또는 이로부터 유도되는 단편/유도체가 두 사슬이 이황화 가교로서 공유적으로 결합되어 있는 이쇄 폴리펩티드로 이미 존재한다(이는 재조합 발현시 단쇄로서 생성되나 오직 이쇄형태에 있을 때만이 생물학적 활성을 발휘하는 기타 다른 폴리펩티드 또는 단백질에도 동일하게 적용된다). 본 발명의 바람직한 구현예에서, 신경독소의 완전 루프 영역(또는 그 일부분) 또는 이로부터 유래되는 독소 단편/유도체는 도 3에서 특정된 바 있는, 펜타펩티드 Asp443 - Asn447이 바람직하게는 예를 들면, Val-Pro-Arg-Gly-Ser (VPRGS)로 대체된, BoNT(A)의 완전 루프 영역 또는 BoNT(A)의 루프 영역의 일부로 교환될 수 있다. 다른 바람직한 구현예로서, 상기 펜타펩티드 Asp443 - Asn447은 또한 Val-Pro-Tyr-Gly-Ser, Val-Pro-His-Gly-Ser, 또한 Val-Pro-Gln-Gly-Ser으로 대체될 수 있다. 특히 바람직한 구현예로서는 상기 신경독소 및 이로부터 유도되는 단편/유도체의 루프 영역 또는 그 일부는 올리고펩티드 Arg/Ser-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala(18mer: R/SGIITSKTKSLVPRGSKA)로 대체될 수 있다. 전술한 루프 서열 영역의 개별 또는 수개의 아미노산 잔기의 추가적인 교환, 삽입 또는 삭제는 도 4에 보인 바와 같이 본 발명에 의해 명백히 포함되는 이황화 가교 이쇄 폴리펩티드 또는 단백질로서 대장균내(예를 들어 대장균 K12 숙주 세포 또는 그 유도체)에 발현되는, 발현 신경 독소 또는 그 단편/유도체를 결과한다(이는 재조합 발현시 단쇄로서 생성되나 오직 이쇄형태에 있을 때만이 생물학적 활성을 발휘하는 기타 다른 폴리펩티드 또는 단백질에도 동일하게 적용된다).
반복하여 개시한 바와 같이, 본 발명에 따른 방법은 또한 하기 구성성분 A, B, 및 C를 갖는 융합 단백질 또는 혼성 단백질을 생산할 수 있다:
(구성성분 A)- 효소활성에 의해 예를 들어 표적 세포에서의 분비를 억제하거나 살해할 수 있는 효과 도메인, 또는 독소 도메인;
(구성성분 B)- 상기 정의된 PRS 펜타펩티드 서열 VPXGS(예를 들어, 도 3에 개시한 바와 같이 BoNT(A)의 변경된 루프 서열 및 그 변이체)를 갖도록 변경되며, 시스테인 잔기를 N-말단 및/또는 C-말단으로 부착할 수 있는, 전술한 본 발명에 따른 루프 서열; 및
(구성성분 C)- 융합 단백질 또는 혼성 단백질에 세포 특이성을 부여하는 세포 결합 도메인.
구성성분 B(루프 서열)은 또한 앞서 전술한 바와 같이 바람직하게는 (i) 도 4에 도시된 변경된 루프 서열, (ii) 이로부터 유도된 어느 서열이며, 그 PRS의 중심 잔기는 어떤 자연 발생 아미노산일 수 있다, (iii) (i) 또는 (ii)의 변이체(전술한 변이체 정의 참조). 도 4에서 BoNT(B), BoNT(C1) 또는 BoNT(E) 의 각 루프 서열은 하나 또는 두개의 N-말단 및 두개의 C- 말단 아미노산을 제외하고는 삭제되었으며, 삭제된 아미노산 잔기는 BoNT(A)의 변경된 루프 서열의 17머 GIITSKTKSLVPRGSKA(도 4-2 및 4-6) 또는 18머 RGIITSKTKSLVPRGSKA(도 4-4)로 대체되었다.
전술한 구성성분 A, B 및 C 이외에도, 융합/혼성 단백질은 전좌 도메인(보툴리늄 신경 독소의 경우 루프 서열 및 세포 결합 도메인 사이에 위치됨)을 가질 수 있다. 이 부가적인 도메인은 효과 도메인이 표적 세포의 세포질로 삽입되는 것을 보조한다. 이러한 융합 단백질의 대장균에서의 발현은(예를 들면, 대장균 K12 또는 그 유도체) 이쇄 폴리펩티드 또는 단백질을 결과하며, 여기에서 한 도메인은 제1 사슬상에 있고 다른 두 도메인은 제2 사슬상에 있다(보툴리늄 신경 독소의 경우, 경쇄 상의 효과 도메인은 중쇄상의 다른 두 도메인과 이황화 가교로 공유 결합된다).
본 발명의 융합 또는 혼성 단백질은 소위 면역 독신으로 기능할 수 있으며, 특히 암치료에 유용성이 있다. 이와 관련하여, 독소 도메인은 세포 결합 도메인을 부착함으로써 특정 세포 타입, 일반적으로 암세포에 대한 특이성을 부여받는다. 독소 도메인으로서는, 일차적으로 디프테리아 독소, 슈도모나스 독소 및 라이신의 효소 도메인이 사용된다. 이들 독소는 이쇄 AB 독소에 속하며, 효소 활성을 제공하는 A 사슬은 전좌 활성 및 세포 결합 활성을 결합하는 B 사슬에 이황화 가교에 의해 공유적으로 결합된다. 그러나, 면역독소에서 다른 독소 또는 독소 단편도 사용가능하므로, 원하는 활성(예를 들어, 암 세포 살해)을 표적 세포 내에서 나타낼 수 있다. 면역 독소의 1세대는 독소 도메인의 화학적 커플링, 예를 들면 라이신 A 사슬을 단클론 항체와 결합하여 제조하였으나, 2세대 면역 독소는 주로 대장균에서 Fab 독소, 단쇄 Fv 독소(scFv 독소) 또는 이황화-안정화된 Fv(dsFv 독소)로서 또한 성장인자 또는 시토킨과의 융합 단백질로서 재조합 발현에 의해 제조된다( Reiter, 2001). 차세대 면역 독소에서는 세포 특이성 또한 예를 들면 아필린 단백질 패밀리, 안키린 반복 프로테인 또는 안티칼린 등과 같은 종양-특이적 표면 단백질에 대한 높은 친화적 결합에 따라 선택되는 변경된 폴리펩티드에 의해 부여될 수 있을 것이다.
면역 독소의 모든 변이체에서, 효소성 독소 도메인은 그 독성을 나타내기 위하여 반드시 표적 세포의 세포질내로 통과하여 들어갈 수 있어야 한다. 대장균에서 면역독소는 단쇄 폴리펩티드로서 발현되기 때문에, 사슬에 있어 전좌 유닛 및 세포 결합 도메인으로부터 효소 독소 도메인을 분리하기 위해서는 단백분해성 절단 및 이황화 가교의 환원이 요구된다. 재조합 디프테리아 독소 단편 및 재조합 슈도모나스 외독소 단편의 경우, 절단은 표적세포의 엔도조말 컴파트먼트에의 내재화후 퓨린과 같은 세포내 프로테아제에 의해 일어난다 (Williams et al., 1990). 한편, 라이신은 이러한 프로세싱 사이트가 없고, 따라서 이황화 가교 이쇄 면역 독소로서 투여되기 위해서는 인공적으로 프로테아제 인식 서열을 삽입하여야 한다. 또한 디프테리아 독소 및 슈도모나스 외독소에 기초한 면역 독소의 경우, 오직 최소 부분의 내재화된 융합 단백질만이 절단되어 동량의 최소 부분의 효소 도메인만이 세포질까지 도달할 수 있다(Ogata et al., 1990). 이후 개시되는 본 발명의 바람직한 구현예는 대장균에서의 재조합 발현에 의하여 제조되고 생물학적으로(효소적으로)활성화 형태인 이황화 가교 이쇄 형태로 분리될 수 있으며, 그 활성화를 위해 세포내 엔도프로테아제나 엔도프로테아제의 인비트로 첨가가 요구되지 않는 면역 독소 변이체의 제조방법 및 구조체를 개시한다. 이들 면역 독소는 전좌 가능한 형태로 효소성 독소 도메인을 표적 세포에 전달할 수 있어, 세포내 프로테아제에 의한 절단을 필요로 하지 않으며, 따라서 상당히 감소된 투여량의 면역독소로도 원하는 세포 독성 효과를 달성할 수 있다.
본 발명의 바람직한 다른 구현예는 하기 구성성분 A, B, 및 C를 갖는 융합 단백질 또는 혼성 단백질을 포함한다:
(구성성분 A)- 독소 도메인 또는 그 단편/유도체;
(구성성분 B)- 상기 정의된 PRS 펜타펩티드 서열 VPXGS(예를 들어, 도 3에 개시한 바와 같이 BoNT(A)의 변경된 루프 서열 중 하나 또는 그 변이체)를 갖도록 변경되며, 시스테인 잔기를 N-말단 및/또는 C-말단으로 부착할 수 있는, 전술한 본 발명에 따른 루프 서열; 및
(구성성분 C)- 단클론항체 또는 그 단편, 아필린, 안키린 반복 단백질, 안티칼린, 성장 인자(예컨대, TGF-alpha, FGF, VEGF, 또는 IGF-1), 시토킨(IL2, IL4, 또는 IL6)의 단백질 패밀리로부터 선택될 수 있는 세포 결합 도메인.
상기 바람직한 구현예에 따르면, 상기 구성성분 B(루프 서열)은 마찬가지로 (i) 도 4에 도시된 변경된 루프 서열 중 어느 하나, (ii) 이로부터 유도된 모든 서열이며, 그 PRS의 중심 잔기는 모든 자연 발생 아미노산일 수 있다, (iii) (i) 또는 (ii)의 변이체(전술한 변이체 정의 참조).
독소 도메인은 라이신의 A-사슬, PE40 또는 PE38 (도메인 Ib를 갖거나 갖지 않은 도메인 II 및 III; 도 2) 와 같은 슈도모나스 외독소의 단편 또는 디프테리아 독소의 단편일 수 있다. 앞서 언급한 효과 도메인 또는 독소 또는 세포 결합 도메인은 오직 예시로서 이해되어야 한다. 모든 단백질 또는 단백질 단편은 본 발명에 포함되는 바, 한편으로는 융합 단백질/혼성 단백질에 표적 세포, 예를 들면 암세포의 표면 항원에 대한 특이적 결합 활성을 부여하거나, 다른 한편으로 표적 세포내에서 내재화된 후 어떤 활성, 예를 들면 세포 살해활성을 나타내도록 하며, 본 발명에 따른 대장균내에서 이러한 융합/혼성 단백질의 발현이 이쇄 폴리펩티드 또는 단백질을 생산하며, 여기에서 독소 도메인 또는 그 유도체는 세포 결합 도메인에 이황화 가교로 공유 결합되어 있다.
슈도모나스 외독소에 기초한 면역 독소의 효율 및 특이성을 개선하기 위하여 과거에는 여러 다른 접근법이 선택되었다. 예를 들면, 수용체 결합 도메인(아미노산 잔기 1-152를 갖는 도메인 Ia)이 단클론 항체의 단편으로 변경되었으며, 동시에 전좌 도메인(도메인 II)내 시스테인 잔기 13 및 35(도메인 II를 기준으로 숫자매김) 사이의 루프 영역(도 2 및 5)는 더이상 도처에 존재하는 세포내 프로테아제 퓨린의 절단에 감수성을 갖지 않도록, 대신 특정 암세포에서만 상당한 정도로 발현되고 부분적으로 분비되는 특정 프로테아제에 감수성을 갖도록 변경되었다(미국 특허 6,426,075호). 이러한 프로테아제 감수성의 변경은 면역 독소에 증강된 세포 특이성을 부여하도록 또한 변경된 수용체 결합 도메인을 갖도록 디자인되었다. 그러나 다른 세포내 프로테아제에 의해서도 상기와 같은 루프에서의 절단 증강 및 이에 따른 효소 도메인 III의 전좌 효율의 개선이 이루어질 수 있을 것으로 예상되지 않는다.
면역 독소에 대한 또 다른 추가적 접근에 따르면, 수용체 결합 도메인 및 전좌 도메인의 N-말단 영역이 루프 영역에서 아르기닌 잔기 27에까지 제거되었다. 이러한 면역독소에서 요구된 세포 특이성은, 예를 들면 VL 도메인에 결합된 단클론 항체의 VH 도메인을 이황화 가교에 의해 도메인 II 및 III 사이의 Ib 부위에 삽입함으로써, 또는 도메인 III의 C-말단의 부착에 의하여 부여되었다(미국 특허 5,980,895호). 이러한 구조체에서는 프로테아제에 의한 활성화가 더 이상 필요치 않다; 따라서 이는 한편으로 상당히 증가된 수송 효율을 나타낸다. 그러나 다른 한편으로는, 효소 도메인 III의 N-말단 또는 C-말단에 위치한 수용체 결합 도메인에 의한 전좌가 단클론 항체의 VH 도메인 또는 TGF-alpha에 의해 손상될 것이 예상된다. 이들 수용체 결합 도메인은 효소 도메인으로부터 분리되지 않기 때문에, 효소 활성 따라서 표적 세포내에서의 독성에 부정적인 영향을 미칠 것이 예상된다. 슈도모나스 외독소-기초 면역독소의 경우, 한편으로는 시스테인 잔기 13 및 35 사이의 루프가 절단된 이황화 가교형으로 이미 존재하여 따라서 세포내 프로테아제에 의한 활성화가 요구되지 않고, 다른 한편으로는 수용체 결합 도메인이 외독소의 도메인 I의 위치에서 전좌 도메인의 N-말단에 융합함으로써 세포질에서 환원된 이후 독소 도메인으로부터 분리되고 따라서 도메인 III의 효소활성을 손상시키지 않을 때, 상대적으로 최대치의 세포 독성활성을 얻을 수 있다.
특히 바람직한 본 발명에 따른 구현예는 단클론 항체, 그 단편, 아필린, 안키린 반복 단백질, 안티칼린, 성장 인자(예를 들어, TGF-alpha, FGF, VEGF, 또는 IGF-1), 또는 시토킨(예를 들어, IL2, IL4, 및 IL6)의 단백질 패밀리에서 선택될 수 있는 세포 결합 도메인(C)을 포함하고, 상기 세포 결합 도메인(C)의 C-말단에, 세포질내세망(ER)에 대한 보유 시그널, Lys-Asp-Gly-Leu 또는 그 변이체를 C-최말단에 가지는 변경된 PE38 단편이 융합된 융합/혼성 단백질을 포함한다. 상기 PE38 단편의 변경은 시스테인 잔기 13 및 35 사이의 전체 루프 서열(또는 오직 그 일부분)을 PRS 펜타펩티드 서열 VPXGS, 바람직하게는 도 3에 도시된 BoNT(A)의 변경된 루프 서열 또는 그 변이체, 특히 펩티드 서열 Arg-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala (도 5) (전술한 변이체 정의 참조)로 교환하는 것으로 구성되어 있다. 바람직하게는 본 구현예에서, 또한 도 5에 도시된 바와 같이, 기초 아미노산 잔기가 1 내지 20 아미노산 잔기의 간격을 두고 PRS에서 N-말단에 위치하고 있다. 대응하는 변경된 PE38 단편 및 이 변경된 단편을 포함하는 융합/혼성 단백질은 대장균 숙주 세포(예컨대, M15[pREP4])의 용해물에서 이황화 가교된 이쇄 형태로 존재한다.
슈도모나스 외독소와 대조적으로, 디프테리아 독소의 효소 도메인, A-사슬은 N-말단에 존재한다.
전좌
도메인 및 수용체 결합 도메인은 B-사슬의 C-말단에 존재한다. 양 사슬은 루프 서열로 연결되며,
코리네박테리움
디프테리아 세포에서 분비시 상기 루프
서열중
아르기닌
잔기
193에서 프로테아제에 의한
단백분해성
절단이 일어난다. 이 양사슬은
절단후
시스테인
잔기
186 및 201 사이가
이황화
가교에 의해 서로
공유적으로
결합되어
존재한다.
이점에서
, 디프테리아 독소는
보툴리늄
독소 및 파상풍 독신과 그 도메인 구조가 유사하다.
재조합 면역 독신의 제조를 위해, 수용체 결합 도메인 또는 그 일부는 예를 들면, VEGF 또는 IL2 (Arora등, 1999; Williams등., 1990) 과 교환되고, 이로써 융합 단백질에 새로운 세포 특이성이 부여된다. A-사슬이 표적 세포의 세포질에 도달하기 위해서는 대장균에서 단쇄로 발현된 면역독소의 폴리펩티드 사슬이 A-사슬과 B-사슬간에 루프 영역에서 절단되어져야 하며, 다른 한편 이황화 가교가 환원되어져야 한다. 전좌 과정중 이황화 가교의 환원이 일어나는 동안, 세포내 프로테아제에 의한 단백분해성 절단은 불완전해 오직 최소 부분의 A-사슬만이 세포질로 방출될 수 있다(Williams 등., 1990). 만약 면역 독소가 투여시 이미 이황화 가교된 이쇄 형태로 존재한다면, 모든 A-사슬이 전좌 가능한 형태로 될 수 있기 때문에, 상당한 효율 증가가 예상될 수 있다.
본 발명의 또 다른 바람직한 구현예는 따라서 단클론 항체, 그 단편, 아필린, 안키린 반복 단백질, 안티칼린, 성장 인자(예를 들어, TGF-alpha, FGF, VEGF, 또는 IGF-1), 또는 시토킨(예를 들어, IL2, IL4, 및 IL6)의 단백질 패밀리에서 선택될 수 있는 세포 결합 도메인(C)을 포함하고, 상기 세포 결합 도메인(C)의 N-말단에, 변경된 디프테리아 독소 단편이 융합된 융합 또는 혼성 단백질을 포함한다. 상기 독소 단편은 A-사슬 및 하나 이상의 B-사슬의 전좌 도메인 Gly1 - Phe389 또는 Gly1 - Asn486을 포함할 수 있다. 디프테리아 독소 단편의 변경은 시스테인 잔기 186 및 201 사이의 전체 루프 서열(또는 오직 그 일부분)이 도 3에 도시된 BoNT(A)의 변경된 루프 서열 또는 그 변이체, 특히 펩티드 서열 Arg-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala(도 5)(전술한 변이체 정의 참조)로의 교환으로 구성되어 있다. 대응하는 변경된 디프테리아 독소 단편 및 이 변경된 단편을 포함하는 융합 단백질은 대장균 숙주 세포, 예컨대, M15[pREP4]의 용해물에서 이황화 가교된 이쇄 형태로 존재한다.
제1세대 라이신-기초 면역 독소는 라이신 A-사슬을 단클론 항체와 결합시켜 제조되었다. 이는 과거에는 A-사슬의 C-말단에 위치한 시스테인 잔기의 티올 기능기와 이황화 가교를 형성하는 화학적 링커제로 항체를 유도체화함으로서 달성되었다. 항체의 유도체화가 방향성이 없기 때문에 이러한 콘쥬게이트는 매우 이질적이었다. 콘쥬게이트 크기 및 B-사슬에 국재화되어 있는 전좌 도메인의 결핍으로 인하여 종양에 대한 효율은 최소는 아니지만, 상당히 불충분하였다. 천연상태의 B-사슬이 면역 독소의 구성성분으로 존재하는 경우, 독성은 상당히 증가하지만, B-사슬의 렉틴-양 세포 결합 특성 때문에 원하는 표적 세포가 아닌 다른 세포에의 비특이적 흡수도 일어난다. 이러한 표적의 충돌은 B-사슬을 그 전좌 활성은 남기고 다만 세포 표면의 글리코 구조에 대한 결합 친화성은 상당히 감소되도록 변경하는 전략으로 대응하였다(WO 89/04839). 그러나, 이렇게 변경된 B-사슬을 함유하는 재조합 발현된 면역 독소는 단쇄 구조를 가지기 때문에, A-사슬과 B-사슬간의 링커 펩티드에 세포내 프로테아제에 대한 인식 서열이 결핍되어 있는 관계로, 면역독소가 표적 세포에 흡수될 때, A-사슬의 방출 및 전좌가 전혀 불가능하거나 매우 낮은 효율로 이루어졌다. 미국 특허 6,593,132호에서는 상이한 세포-특이적 프로테아제에 대한 인식 서열로 표시되는 이 천연 링커 펩티드의 변경이 개시되어 있다. 이 변경된 링커 펩티드를 단백분해 절단할 수 있는 각 프로테아제는 다른 세포형에 비하여 목적 표적 세포에서만 발현되며 상당히 증가된 양으로 발현되므로, 이러한 변경을 한 라이신 변이체는 대응하는 세포 특이성을 가지게 된다. 그러나, 이는 상기 절단이 오직 내재화된 독소 분자 분획에서만 일어나므로, 이에 대응하는 극히 소량의 A-사슬만이 세포질로 전좌된다는 것을 감안하여야 한다. 바람직한 라이신-기초 이쇄 면역 독소는 그 전좌 활성은 그대로 남아있고, 비특이적인 렉틴-양 세포 결합 성질은 억제되도록 변경된 B-사슬과 A-사슬이 이황화 가교로 결합되어 있으며, C-말단에 특이적인 세포 결합 도메인이 융합되어 있는 것이다. 이러한 면역 독소는 세포 특이성과 높은 독성을 결합할 수 있다.
또 다른 본 발명의 바람직한 구현예는 하기 구성성분 A, B, 및 C를 갖는 융합 단백질을 포함한다:
(구성성분 A)- 라이신의 A-사슬;
(구성성분 B)- 상기 정의된 PRS 펜타펩티드 서열 VPXGS(예를 들어, 도 3에 개시한 바와 같이 BoNT(A)의 변경된 루프 서열 중 하나 또는 그 변이체)를 갖도록 변경되며, 시스테인 잔기를 N-말단 및/또는 C-말단으로 부착할 수 있는, 전술한 본 발명에 따른 루프 서열; 및
(구성성분 C)- 단클론항체 또는 그 단편, 아필린, 안키린 반복 단백질, 안티칼린, 성장 인자(예컨대, TGF-alpha, FGF, VEGF, 또는 IGF-1), 시토킨(IL2, IL4, 또는 IL6)의 단백질 패밀리로부터 선택될 수 있는 세포 결합 도메인.
상기 바람직한 구현예에 따르면, 상기 구성성분 B는 마찬가지로 (i) 도 4에 도시된 변경된 루프 서열 중 어느 하나, (ii) 이로부터 유도된 모든 서열이며, 그 PRS의 중심 잔기는 모든 자연 발생 아미노산일 수 있다, (iii) (i) 또는 (ii)의 변이체(전술한 변이체 정의 참조).
특히, 상기 루프 서열은 펩티드 서열 Ala-Pro-Pro-Arg-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala-Asp-Val(도 5-6), 즉 변경된 라이신 A-사슬의 루프 서열을 포함할 수 있다. 바람직하게 시스테인 잔기는 루프 서열의 C-말단에 부가될 수 있다. 여기 포함된 PRS 서열 Val-Pro-Arg-Gly-Ser에서, Arg은 어떤 기타 자연 발생 아미노산 Xaa일 수 있다. 루프서열은 양 끝에서 추가적인 아미노산 잔기(예를 들면 글라이신 및 세린 잔기)로 확장될 수 있다. 또한 라이신의 A-사슬은 완전 B-사슬, 또는 그 부분 또는 변이체와 루프서열에 의해 결합될 수 있으며, 루프서열은 프로 라이신(pro ricin)의 야생형 서열의 시스테인 잔기 259 및 283 사이의 아미노산 잔기를 최소한 도 3에 기재된 변경된 BoNT(A) 루프 영역 또는 그 변이체를 포함하는 루프 서열에 의해, 전체적으로 또는 부분적으로 대체한 것이다. 여기에서, 이황화 가교는 시스테인 잔기 259 및 283(프로 라이신의 야생형 서열에 대하여)에 의해 형성된다. 세포 결합 도메인은 B-사슬의 C-말단에 융합되며, 상기 언급된 폴리펩티드 패밀리로부터 선택된다. 대응하는 융합/혼성 단백질은 대장균 숙주 세포, 예컨대, M15[pREP4] 세포주의 용해물에서 이황화 가교된 이쇄 형태로 존재한다.
또 다른 본 발명의 바람직한 구현예는 하기 구성성분 A, B, 및 C를 갖는 융합 단백질을 포함한다:
(구성성분 A)- 융합 단백질에 더 나은 용해성을 부여하고, 더 높은 발현율을 나타내게 하며 및/또는 친화성 정제를 가능하게 하는 단백질 또는 올리고 펩티드(예를 들면, 글루타티온-S-트랜스퍼라제(GST), 말토스 결합단백질(MBP), His 태그, Strep 태그, 또는 FLAG 태그);
(구성성분 B)- 상기 정의된 PRS 펜타펩티드 서열 VPXGS(예를 들어, 도 3에 개시한 바와 같이 BoNT(A)의 변경된 루프 서열 중 하나 또는 그 변이체)를 갖도록 변경되며, 시스테인 잔기를 N-말단 및/또는 C-말단으로 부착할 수 있는, 전술한 본 발명에 따른 루프 서열; 및
(구성성분 C)- 모든 형태의 폴리펩티드.
상기 바람직한 구현예에 따르면, 상기 구성성분 B는 마찬가지로 (i) 도 4에 도시된 변경된 루프 서열 중 어느 하나, (ii) 이로부터 유도된 모든 서열이며, 그 PRS의 중심 잔기는 모든 자연 발생 아미노산일 수 있다, (iii) (i) 또는 (ii)의 변이체(전술한 변이체 정의 참조).
특히 상기 루프는 펩티드 서열 Val-Arg-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala-Leu-Asn-Asp-Leu을 가질 수 있으며, 상기 서열에서 PRS의 중심에 있는 Arg은 Xaa이다. 상기 루프는 그 양끝에서 추가적인 아미노산 잔기(예를 들면, 글라이신 및 세린 잔기)로 확장될 수 있다. 이러한 융합 단백질의 대장균에서의 발현은 이쇄 폴리펩티드 또는 단백질을 결과하는데, 상기 두 사슬은 이황화 가교로 공유결합되어 있으며, 티올-함유 물질(예를 들면, β-머캅토에탄올, DTT, 또는 환원 글루타티온)로 간단하게 환원한 후, 프로테아제의 첨가없이, 완전 정제된 후 서로로부터 분리될 수 있다. 이러한 발현 시스템은 특히 그 반응성 티올그룹을 가진 융합 파트너의 정제 및 분리후, 티올 반응성 링커 분자와의 커플링 반응 또는 예컨대, 폴리에틸렌글루콜과의 변경을 위한 부위를 제공하기 위하여, 시스테인 잔기를 두 말단 중 어느 한 말단에 구비하는 재조합 단백질에 적합하다.
본 발명은 또한 코돈 용법의 상이한 가능성을 고려하여, 전술한 바와 같은 본 발명에 따른 폴리펩티드를 코딩하는 모든 핵산을 포함한다. 또한, 본 발명은 본 발명에 따른 각 폴리펩티드을 코딩하는 DNA 서열을 포함하는 상업적으로 입수가능하거나 개별적으로 구축된 클로닝 및 발현 플라스미드를 포함하며, 상기 발현 플라스미드로 형질전환되어, 본 발명에 따른 각 폴리펩티드를 그 활성 이황화 가교 이쇄 형태로 발현할 수 있는 적합한 클로닝 및 발현 대장균 균주를 포함한다. 이러한 발현 시스템의 한 예로서, M15[pREP4] 대장균 숙주 균주와 조합된 pQE 시리즈의 발현 플라스미드를 들 수 있다.
약학적으로 사용가능한 폴리펩티드 또는 단백질의 개발에 관한 분야의 숙련자에게, 본 발명의 폴리펩티드 또는 단백질의 활성화에 엔도프로테아제가 첨가될 필요가 없다는 사실에 관한 이점은 명백할 것이다. 전술한 본 발명에 따른 폴리펩티드 또는 단백질의 많은 부분이 특히 약학적 사용을 표적으로 하고 있다. 따라서, 본 발명은 본 발명의 폴리펩티드 또는 단백질 중 하나 또는 그 혼합물을 활성 성분 또는 제제에 충분한 안정성을 부여하고, 그 조성이 바라는 투여형태로 조정된 유용한 첨가제로서 포함하는 약학적 제제를 포함한다.
서열번호 1은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 A를 코드하는 핵산(DNA)의 일 예이다(rBoTN(A)-mod1).
서열번호 2는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 A의 일 예이다(rBoTN(A)-mod1).
서열번호 3은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 A의 LHN 단편을 코드하는 핵산(DNA)의 일 예이다(rBoTN(A)-Lmod1HN). 상기 서열은 서열번호 1에서 핵산 2620-3888이 삭제된 것에 대응된다.
서열번호 4는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 A의 LHN 단편의 일 예이다(rBoTN(A)-Lmod1HN). 상기 서열은 서열번호 2에서 아미노산 잔기 874-1296이 삭제된 것에 대응된다.
서열번호 5는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 A의 LHNHCN 단편을 코드하는 핵산(DNA)의 일 예이다(rBoTN(A)-Lmod1HNHCN). 상기 서열은 서열번호 1에서 핵산 3286 - 3888 이 삭제된 것에 대응된다.
서열번호 6은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 A의 LHNHCN 단편의 일 예이다(rBoTN(A)-Lmod1HNHCN). 상기 서열은 서열번호 2에서 아미노산 잔기 1096-1296이 삭제된 것에 대응된다.
서열번호 7은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 B를 코드하는 핵산(DNA)의 일 예이다(rBoTN(B)-mod1).
서열번호 8은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 B의 일 예이다(rBoTN(B)-mod1).
서열번호 9는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 B의 LHN 단편을 코드하는 핵산(DNA)의 일 예이다(rBoTN(B)-Lmod1HN). 상기 서열은 서열번호 7에서 핵산 2623-3915가 삭제된 것에 대응된다.
서열번호 10은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 B의 LHN 단편의 일 예이다(rBoTN(B)-Lmod1HN). 상기 서열은 서열번호 8에서 아미노산 잔기 875-1305가 삭제된 것에 대응된다.
서열번호 11은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 C1을 코드하는 핵산(DNA)의 일 예이다(rBoTN(C1)-mod1).
서열번호 12는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 C1의 일 예이다(rBoTN(C1)-mod1).
서열번호 13은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 C1의 LHN 단편을 코드하는 핵산(DNA)의 일 예이다(rBoTN(C1)-Lmod1HN). 상기 서열은 서열번호 11에서 핵산 2599-3858이 삭제된 것에 대응된다.
서열번호 14는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 C1의 LHN 단편의 일 예이다(rBoTN(C1)-Lmod1HN). 상기 서열은 서열번호 12에서 아미노산 잔기 867-1286이 삭제된 것에 대응된다.
서열번호 15는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 E을 코드하는 핵산(DNA)의 일 예이다(rBoTN(E)-mod1).
서열번호 16는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 보툴리늄 신경 독소 타입 E의 일 예이다(rBoTN(E)-mod1).
서열번호 17은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 도메인 II, Ib,및 III을 포함하는 슈도모나스 외독소 40kDa 단편을 코드하는 핵산(DNA)의 일 예이다(PE40-mod1).
서열번호 18은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 도메인 II, Ib,및 III을 포함하는 재조합 슈도모나스 외독소 40kDa 단편의 일 예이다(PE40-mod1).
서열번호 19는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 A-사슬 및 B 사슬의 N-말단 단편을 포함하는 재조합 디프테리아 독소 단편을 코드하는 핵산(DNA)의 일 예이다(DT389-mod1).
서열번호 20은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 A-사슬 및 B 사슬의 N-말단 단편을 포함하는 재조합 디프테리아 독소 단편의 일 예이다(DT389-mod1).
서열번호 21은 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 라이신 독소 단편을 코드하는 핵산(DNA)의 일 예이다(rRicin-mod1).
서열번호 22는 본 발명에 따라 변경된 루프 서열 및 C-말단 헥사히스티딘 태그를 갖는 재조합 라이신 독소 단편의 일 예이다(rRicin-mod1).
도 1은 클로스트리듐 보툴리늄 또는 대장균 K12에서부터 야생형 루프 또는 본 발명에 따라 변경된 루프를 갖는 보툴리늄 신경 독소 타입 A의 방출을 도시한 것이다. A: 클로스트리듐 보툴리늄 세포의 용해에서, 클로스트리듐성 엔도프로테아제에 의해 경쇄(L) 및 중쇄(H) 사이의 루프 영역에서 신경 독소가 절단되는 것을 도시한 것이다. 양 사슬은 서로 이황화 가교에 의해 연결되어 있다. B: 대장균에서 야생형 루프를 갖는 재조합 신경독소의 발현 및 세포 용해 후, 단쇄 형태로 존재하는 것을 나타낸 것이다. C: 본 발명에 따른 변경된 루프를 갖는 재조합 신경독소가 대장균에서 방출될 때, 엔도프로테아제에 의해 루프 영역에서의 절단이 이루어지는 것을 도시한 것이다.
도 2는 대장균 세포에서 방출된 후 야생형 루프 영역 및 본 발명에 따른 변경된 루프 영역을 갖는 상이한 재조합 독소를 비교하여 도시한 것이다.
A: 보툴리늄 신경 독소, B: 슈도모나스 외독소, C: 디프테리아 독소
도 3은 야생형 루프를 본 발명에 따라 변경된 BoNT(A)의 루프 서열의 선택을 비교하여 도시한 것이다. 핵산 서열 및 경쇄 및 중쇄의 제한 시스테인 잔기를 포함하는 유도된 아미노산 서열이 도시되었다. 화살표는 대장균 용해물내 엔도프로테아제에 대한 절단 부위를 표시한다.
도 4는 보툴리늄 신경 독소 혈청형 B, C1, 및 E의 야생형 루프와 본 발명에 따라 변경된 예시적인 루프 서열을 각각 비교하여 도시한 것이다. 핵산 서열 및 경쇄 및 중쇄의 제한 시스테인 잔기를 포함하는 유도된 아미노산 서열이 도시되었다. 화살표는 대장균 용해물내 엔도프로테아제에 대한 절단 부위를 표시한다.
도 5는 슈도모나스 외독소의 PE40 단편, 디프테리아 독소(DT) 및 라이신의 야생형 루프와 본 발명에 따라 변경된 예시적인 루프 서열을 각각 비교하여 도시한 것이다. 핵산 서열 및 제한 시스테인 잔기를 포함하는 유도된 아미노산 서열이 도시되었다. 화살표는 대장균 용해물내 엔도프로테아제에 대한 절단 부위를 표시한다.
도 6은 재조합 독소 및 독소 단편을 클로닝하게 위해 사용되었던 올리고뉴클레오티드의 조합을 보인 것이다. 각 제한 엔도뉴클레아제에 대한 인식 서열에 밑줄표시하였다.
도 7은 본 발명에 따라 변경된 루프 서열을 갖는 재조합 BoNT(A)의 LHN 단편을 SDS 폴리아크릴아미드 겔상에서 분석한 것을 도시한 것이다. LHN 단편의 발현은 플라스미드 pQE-BoNT(A)-Lmod1HN로 형질 전환된 M15[pREP4] 세포에서 시행되었다. 레인 2 및 5: Ni-NTA 아가로스에서 정제된 LHN 단편; 레인 1 및 4: 트롬빈에서 인큐베이션 후 LHN 단편; 레인 3: 분자량 마커. 레인 1 및 2는 환원 조건에서 샘플 적용하였으며, 레인 4 및 5는 비환원 조건에서 샘플 적용함.
도 8은 본 발명에 따라 변경된 루프 서열을 갖는 재조합 BoNT(B)의 LHN 단편을 SDS 폴리아크릴아미드 겔상에서 분석한 것을 도시한 것이다. LHN 단편의 발현은 플라스미드 pQE-BoNT(B)-Lmod1HN로 형질 전환된 M15[pREP4] 세포에서 시행되었다. 레 인 1 및 4: Ni-NTA 아가로스에서 정제된 LHN 단편; 레인 2: 분자량 마커; 레인 3:적용 없음. 레인 1은 환원 조건에서 샘플 적용하였으며, 레인 4는 비환원 조건에서 샘플 적용함.
도 9는 본 발명에 따라 변경된 루프 서열을 갖는 재조합 BoNT(C1)을 SDS 폴리아크릴아미드 겔상에서 분석한 것을 도시한 것이다. 독소의 발현은 플라스미드 pQE-BoNT(C1)-Lmod1HNHC로 형질 전환된 M15[pREP4] 세포에서 시행되었다. 레인 1 및 4: Ni-NTA 아가로스에서 정제된 독소; 레인 2: 분자량 마커; 레인 3:적용 없음. 레인 1은 환원 조건에서 샘플 적용하였으며, 레인 4는 비환원 조건에서 샘플 적용함.
실시예
1: 변경된 루프를 갖는
보툴리늄
신경 독소 타입 A의
LH
N
단편의
클
로닝 및 발현
경쇄 및 전좌 도메인의 DNA 서열 클로닝을 위하여, 클로스트리듐 보툴리늄 타입 A(ATCC 3502 균주)의 배양물로부터 염색체 DNA를 분리하였다. 프라이머 #1 및 #2(도 6 참조)를 사용한 PCR 증폭에 의해 변경된 루프 서열 및 C-말단 His 태그를 갖는 BoNT(A)의 경쇄를 코딩하는 유전자 단편을 수득하였다. 상기 PCR 증폭 산물을 제한효소부위 Nco I 및 Sal I를 통해 발현 플라스미드 pQE-60 내로 클로닝하여 플라스미드 pQE-BoNT(A)-Lmod1를 얻었다. 프라이머 #3 및 #4(도 6 참조)를 사용한 PCR 증폭에 의해 BoNT(A)의 전좌 도메인을 코딩하는 유전자 단편을 생성하였다. 제한효 소부위 Stu I 및 Xho I를 통해 pQE-BoNT(A)-Lmod1의 루프 서열 및 His 태그 서열 사이로 클로닝하였다(플라스미드 pQE-BoNT(A)-Lmod1HN; 서열# 2, Fig. 3, No. 2). 상기 플라스미드 pQE-BoNT(A)-Lmod1HN로 대장균 발현 균주 M15[pREP4](Qiagen)을 형질전환하였다. 변형된 LHN 단편은 최후 농도 500μM IPTG 로 25℃에서 밤새 단계적 유도를 시행하여 발현시켰다. 상기 세포는 300 mM NaCl 함유하는 pH 8.0의 50 mM 인산 버퍼내에서 리소자임을 처리하여 용해시키고, 초음파처리 하였다. 원심분리된 용해물을 Ni-NTA 아가로스 칼럼상에서 크로마토그래피하였다. SDS 폴리아크릴아미드 겔상에서 분석한 결과, 환원조건하에서 약 50 kDa 및 100 kDa에 해당하는 두 밴드는 코마시 염색되고, 반면 비환원조건하에서는 오직 100 kDa에 해당하는 밴드만이 검출되었다(도 7). 이와 같이, LHN 단편은 박테리아로부터 75% 이상 두 사슬이 이황화 가교로 서로 공유결합된 이쇄 폴리펩티드로서 방출된다는 것이 명백히 입증되었다. 이후 트롬빈으로 처리한 결과, 한편으로는 단쇄 형태의 절단을 초래하였으며, 다른 한편, 이쇄 폴리펩티드의 전좌 도메인의 단축이 초래되었다(도 7). LHN 단편의 정제전에 대장균 용해물을 2시간 인큐베이션한 결과, 이쇄 폴리펩티드에서의 완전한 절단이 초래되었다.
천연 루프서열(도 3의 1)에 대응하는 발현 및 정제된 LHN 단편은 SDS 폴리아크릴아미드 겔상에서 비환원조건 및 환원조건하에서 100 kDa에 해당하는 밴드로 보여졌다. 이 단쇄 폴리펩티드는 트립신에 의한 절단이 되었을 때만이 이황화 가교된 이쇄 LHN 단편으로 전환되었다.
실시예
2: 변경된 루프를 갖는
보툴리늄
신경 독소 타입 A의
LH
N
H
CN
단편의 클로닝 및 발현 및 절단 부위의 특성화
LHNHCN 단편(BoNT(A)의 수용체 결합 도메인의 N-말단의 반을 갖는 전좌 도메인)은 프라이머 #3 및 #5(도 6)을 사용한 PCR 증폭으로 생성하였으며, 제한효소부위 Stu I 및 Xho I를 통해 플라스미드 pQE-BoNT(A)-Lmod1내로 클로닝하였다(플라스미드 pQE-BoNT(A)-Lmod1HNHCN;서열 #3). 발현 및 정제는 실시예 1에 개시된 대로 수행되었다. SDS 폴리아크릴아미드 겔상에서 분석한 결과, 단쇄 폴리펩티드에 해당하는 약한 밴드이외에 추가적으로 특정되지 않는 밴드, 경쇄 및 HNHCN 단편에 해당하는 50 kDa, 75 kDa에 해당하는 밴드가 검출되었다. N-말단 서열분석 결과 상기 HNHCN 단편의 처음 4개의 아미노산 잔기는 Ser-Leu-Val-Pro이었다. 대장균 용해물에서의 프로테아제 활성에 의한 절단은 Lys440다음에서, 따라서 루프내 삽입된 펜타펩티드 Val-Pro-Arg-Gly-Ser의 N-말단에서 일어났다.
실시예
3: 변경된 루프를 갖는
보툴리늄
신경 독소 타입 B의
LH
N
단편의
클
로닝 및 발현
경쇄 및 전좌 도메인의 DNA 서열 클로닝을 위하여, 클로스트리듐 보툴리늄 타입 B(Okra 균주)의 배양물로부터 염색체 DNA를 분리하였다. 프라이머 #6 및 #7(도6 참조)를 사용한 PCR 증폭에 의해, BoNT(A)의 변경된 루프 서열을 갖는 BoNT(B) 경쇄를 코딩하는 유전자 단편을 생성하였다. 프라이머 #8 및 #9(도6 참조)로, BoNT(B)의 전좌 도메인을 코딩하는 유전자 단편을 생성하였다. 발현 플라스미드 pQE-60 내로의 클로닝은 먼저, pQE-BoNT(A)-Lmod1내 BoNT(A)-L 유전자 단편을 제한효소부위 Nco I 및 Stu I를 통해 BoNT(B)-Lmod1 증폭산물로 교환하는 것으로 실행되었다. 후속하여, BoNT(B)-HN 증폭산물을 제한효소부위 Stu I 및 Xho I를 통해 그 뒤에 클로닝하여, 플라스미드 pQE-BoNT(B)-Lmod1HN(서열 #5)를 얻었다. 숙주 균주 M15[pREP4]에서의 발현 및 LHN 단편의 정제는 실시예 1에 개시된 대로 시행하였다. SDS 폴리아크릴아미드 겔상에서 분석한 결과, 환원조건하에서 약 50 kDa 및 55 kDa에 해당하는 두 밴드가 코마시 염색되고, 반면 비환원조건하에서는 오직 105 kDa에 해당하는 밴드만이 검출되었다(도 8). 이는 LHN 단편이 박테리아로부터 실질적으로 80% 이상 두 사슬이 이황화 가교로 서로 공유결합된 이쇄 폴리펩티드로서 방출된다는 것을 명백하게 보여준다.
실시예
4: 변경된 루프를 갖는
보툴리늄
신경 독소
타입 C1의
LH
N
단편의
클
로닝 및 발현 및 절단 부위의 특성화
경쇄 및 전좌 도메인의 DNA 서열 클로닝을 위하여, 클로스트리듐 보툴리늄 타입 C1(C205 균주)의 배양물로부터 염색체 DNA를 분리하였다. 프라이머 #10 및 #11(도 6 참조)를 사용한 PCR 증폭에 의해, BoNT(A)의 변경된 루프 서열을 갖는 BoNT(C1) 경쇄를 코딩하는 유전자 단편을 생성하였다. 프라이머 #12 및 #13(도 6 참조)로, BoNT(C1)의 전좌 도메인을 코딩하는 유전자 단편을 생성하였다. 발현 플라스미드 pQE-60 내로의 클로닝은 먼저, pQE-BoNT(A)-Lmod1내 BoNT(A)-L 유전자 단편을 Nco I 및 Stu I에 대한 제한 부위를 통한 BoNT(C1)-Lmod1 증폭산물로 교환하는 것으로 실행되었다. 후속하여, BoNT(C1)-HN 증폭산물을 Stu I 및 Xho I 에 대한 제한 부위를 통해 그 뒤에 클로닝하여, 플라스미드 pQE-BoNT(C1)-Lmod1HN(서열 #7)를 얻었다. 숙주 균주 M15[pREP4]에서의 발현 및 LHN 단편의 정제는 실시예 1에 개시된 대로 시행하였다. SDS 폴리아크릴아미드 겔상에서 분석한 결과, 환원조건하에서 약 50 kDa 및 55 kDa에 해당하는 두 밴드는 코마시 염색되고, 반면 비환원조건하에서는 오직 105 kDa에 해당하는 밴드만이 검출되었다. 이는 LHN 단편이 박테리아로부터 실질적으로 90% 이상 두 사슬이 이황화 가교로 서로 공유결합된 이쇄 폴리펩티드로서 방출된다는 것을 명백하게 보여준다. N-말단 서열분석 결과 상기 HN 단편의 처음 의 4개의 아미노산 잔기는 Ser-Leu-Val-Pro이었다. 대장균 용해물에서의 프로테아제 활성에 의한 절단은 Lys447 다음에서, 따라서 BoNT(A) 루프내 삽입된 펜타펩티드 Val-Pro-Arg-Gly-Ser의 N-말단에서 일어났다. 삽입된 펜타펩티드의 아르기닌 잔기를 돌연변이를 유도하여 히스티딘, 티로신 및 글루타민으로 교환하였다. 동일한 방법으로 발현된 돌연변이된 LHN 단편은 대장균 용해물의 2시간 인큐베이션 후에 90% 이상 이황화 가교된 이쇄형으로 존재하였으며, 그 절단 효율은 펜타펩티드 Val-Pro-Arg-Gly-Ser으로 변경된 BoNT(A)루프를 포함하는 LHN 단편보다 약간 낮았다.
실시예
5: 변경된 루프를 갖는 재조합
보툴리늄
신경 독소 타입
C1
의
클로닝
및 발현
클로스트리듐 보툴리늄 C205 균주의 염색체 DNA를 사용하고, 프라이머 #12 및 #14(도 6 참조)를 사용하여 중쇄를 코딩하는 유전자 단편을 증폭하였다. 증폭된 유전자 단편을 제한효소부위 Stu I 및 Xho I를 통해 플라스미드 BoNT(C1)-Lmod1HN내로, 경쇄를 코딩하는 서열 섹션 및 His 태그에 대한 서열사이에 클로닝하였다(플라스미드 pQE-BoNT(C1)-Lmod1HNHC;서열 #6). 대응하는 발현 플라스미드로 대장균 발현 균주 M15[pREP4](Qiagen)을 형질전환하였다. 숙주 균주 M15[pREP4]에서의 발현 및 정제는 실시예 1에 개시된 바와 같이 수행하였다. SDS 폴리아크릴아미드 겔상에서 분석한 결과, 환원조건하에서 약 50 kDa 및 105 kDa에 해당하는 두 밴드는 코마시 염색되고, 반면 비환원조건하에서는 오직 155 kDa에 해당하는 밴드만이 검출되었다(도 9). 이는 LHN 단편이 박테리아로부터 실질적으로 90% 이상 두 사슬이 이황화 가교로 서로 공유결합된 이쇄 폴리펩티드로서 방출된다는 것을 명백하게 보여준다. 편측횡경막 검사(hemidiaphragm assay)에서의 활성 테스트 결과, 독성은 클로스트리듐 보툴리늄에서 분리된 천연 상태의 신경 독소 타입 C1의 독성만큼 매우 높았다. 따라서 경쇄 및 전좌 도메인 사이의 루프 영역의 변경은 독성에는 영향을 미치지 않음을 확인하였다.
실시예
6: 변경된 루프를 갖는 재조합 슈도모나스 외독소 단편(
PE40
)의
클로닝
및 발현
슈도모나스 아에루기노사 103 균주의 염색체 DNA를 사용하여, 도메인 III 및 시스테인 잔기 13 및 36 사이의 루프의 C-말단에 위치하는 도메인 II 영역을 코딩하는 유전자 단편을 프라이머 #17 및 #18(도 6)을 사용하여 PCR 증폭하였다. 이 증폭 산물을 플라스미드 제한효소부위 Nco I 및 Mlu I을 통해 유전자 단편 BoNT(A)-Lmod1을 교환하여 플라스미드 pQE-BoNT(A)-Lmod1에 클로닝하였다(플라스미드 pQE-PEII3 III). 루프의 N-말단인 도메인 II 영역을 위한 서열 섹션은 올리고뉴클레오티드 # 15 및 #16(도 6)의 혼성화하고 Nco I 및 Kpn I에 대한 제한 부위를 통해 플라스미 드 pQE-PEII3 III에 삽입하였다(플라스미드 pQE-PEIImod III; 서열 #9). 대응하는 발현 플라스미드로 대장균 발현 균주 M15[pREP4](Qiagen)을 형질전환하였다. 숙주 균주 M15[pREP4]에서의 발현 및 정제는 실시예 1에 개시된 바와 같이 수행하였다. SDS 겔상에서 분석한 결과, 환원조건하에서 40 kDa의 약한 밴드 및 37 kDa의 강한 밴드가 나타났다. 그러나 비환원조건하에서는 오직 40 kDa에 해당하는 하나의 밴드만이 관찰되었다. 친화성 크로마토그래피로 정제하기 전에 실온에서 2시간 이상 상기 세포 용해물을 인큐베이션하였을 때, 40 kDa에 해당하는 밴드는 환원 조건하에서 더 이상 검출되지 않았다. PE40의 도메인 II 단편의 시스테인 잔기 13 및 36 사이의 루프 영역을 변경된 BoNT(A)로 교환함으로써, 폴리펩티드 사슬의 절단이 일어났으며, 상기 전술한 시스테인 잔기가 이황화 가교를 형성하였다. 약 3 kDa의 N-말단 단편은 12% SDS 겔에서의 환원 후 더 이상 검출되지 않았다.
실시예
7: 변경된 루프를 갖는 재조합 디프테리아 독소 단편(
DT389
)의
클로닝
및 발현
코리네박테리움 디프테리아 NCTC 13129 균주의 염색체 DNA를 사용하여, 디프테리아 독소의 A-사슬을 코딩하는 유전자 단편을 프라이머 #19 및 #20(도 6)을 사용하여 PCR 증폭하였다. Nco I 및 Stu I 제한 효소 부위를 통해 증폭 산물을 플라스미드 pQE-BoNT(A)-Lmod1(실시예 1 참조)에 클로닝하였다(플라스미드 pQE-DT-Amod1). 동일한 방식으로 B-사슬의 N-말단 단편을 코딩하는 유전자 단편을 프라이머 #21 및 #22(도 6)을 이용하여 증폭하고, Stu I 및 Xho I 제한효소부위를 통해 pQE-DT-Amod1에 클로닝하였다(플라스미드 pQE-DT389-mod1; 서열 #10). 대응하는 발현 플라스미드로 대장균 발현균주 M15[pREP4](Qiagen)을 형질전환하였다. 숙주 균주 M15[pREP4]에서의 발현 및 정제는 실시예 1에 개시된 바와 같이 수행하였다. SDS 겔상에서 분석한 결과, 환원조건하에는 약 22 kDa에 두개의 밴드가 코마시염색되었고, 비환원 조건하에서는 약 43 kDa에 하나의 밴드가 관찰되었다. 이는 재조합 디프테리아 독소 단편이 박테리아로부터 두 사슬이 서로 이황화 가교로 공유적으로 연결되어 있는 이쇄 폴리펩티드로 90% 이상 방출된다는 것을 명백히 보여준다.
실시예
8: 변경된 루프를 갖는 재조합 라이신의
클로닝
및 발현
라이시누스 코뮤니스의 종자 mRNA를 사용하여, 라이신의 A-사슬을 코딩하는 유전자 단편을 프라이머 #23 및 #24(도 6)을 사용하여 RT-PCR로 증폭하였다. 이 증폭산물을 Nco I 및 Xho I 제한효소부위를 통해 플라스미드 pQE-BoNT(A)-Lmod1(실시예 1 참조)내로 클로닝하였다(플라스미드 pQE-ricin-A). 동일한 방식으로 B-사슬을 코딩하는 유전자 단편을 프라이머 #25 및 #26(도 6)을 이용하여 증폭하고, Kpn I 및 Xho I 제한 효소 부위를 통해 pQE-ricin-A에 클로닝하였다(플라스미드 pQE-ricin-mod1;서열 #11). 대응하는 발현 플라스미드로 대장균 발현 균주 M15[pREP4] (Qiagen)을 형질전환하였다. 숙주 균주 M15[pREP4]에서의 발현 및 발현된 라이신의 가용성 부분의 정제는 실시예 1에 개시된 것과 유사하게 수행하였다. SDS 겔 상에서 분석한 결과, 환원조건하에는 약 19 kDa 및 42 kDa에 두개의 밴드가 코마시염색되었고, 비환원 조건하에서는 약 62 kDa에 하나의 밴드가 관찰되었다. 이는 재조합 라이신의 가용성 부분이 박테리아로부터 두 사슬이 서로 이황화 가교로 공유적으로 연결되어 있는 이쇄 폴리펩티드로 90% 이상 방출된다는 것을 명백히 보여준다.
과학 문헌
Arora 등. (1999), Cancer Res. 59:183-8
Collier (2001), Toxicon 39 (11): 1793-803
Fujinaga (1997), Microbiology 143: 3841-47
Ogata 등. (1990), J. Biol. Chem 265(33): 20678-85
Reiter (2001), Adv. Cancer Res. 81: 93-124
Schiavo 및 Montecucco (1997), The Clostridia: Molecular Biology and Pathogenesis, Academic Press, San Diego: 295-322
Williams 등. (1990) J. Biol Chem, 265(33): 20673-77
특허문헌
Borgford, 미국 특허 제6,593,132호
Brown 및 Jones, WO 제89/04839호
Fitzgerald 등., 미국 특허 제6,426,075호
Pastan 등., 미국 특허 제5,980,895호
SEQUENCE LISTING
<110> BioteCon Therapeutics GmbH
<120> Recombinant Expression of Proteins in a Disulfide-Bridged
Two-Chain Form
<130> IP2007944/FR
<140> PCT/DE 2006/000088
<141> 2006-01-20
<150> 10 2005 002978.7
<151> 2005-01-21
<160> 22
<170> KopatentIn 1.71
<210> 1
<211> 3915
<212> DNA
<213> Clostridium botulinum
<400> 1
atggcatttg ttaataaaca atttaattat aaagatcctg taaatggtgt tgatattgct 60
tatataaaaa ttccaaatgc aggacaaatg caaccagtaa aagcttttaa aattcataat 120
aaaatatggg ttattccaga aagagataca tttacaaatc ctgaagaagg agatttaaat 180
ccaccaccag aagcaaaaca agttccagtt tcatattatg attcaacata tttaagtaca 240
gataatgaaa aagataatta tttaaaggga gttacaaaat tatttgagag aatttattca 300
actgatcttg gaagaatgtt gttaacatca atagtaaggg gaataccatt ttggggtgga 360
agtacaatag atacagaatt aaaagttatt gatactaatt gtattaatgt gatacaacca 420
gatggtagtt atagatcaga agaacttaat ctagtaataa taggaccctc agctgatatt 480
atacagtttg aatgtaaaag ctttggacat gaagttttga atcttacgcg aaatggttat 540
ggctctactc aatacattag atttagccca gattttacat ttggttttga ggagtcactt 600
gaagttgata caaatcctct tttaggtgca ggcaaatttg ctacagatcc agcagtaaca 660
ttagcacatg aacttataca tgctggacat agattatatg gaatagcaat taatccaaat 720
agggttttta aagtaaatac taatgcctat tatgaaatga gtgggttaga agtaagcttt 780
gaggaactta gaacatttgg gggacatgat gcaaagttta tagatagttt acaggaaaac 840
gaatttcgtc tatattatta taataagttt aaagatatag caagtacact taataaagct 900
aaatcaatag taggtactac tgcttcatta cagtatatga aaaatgtttt taaagagaaa 960
tatctcctat ctgaagatac atctggaaaa ttttcggtag ataaattaaa atttgataag 1020
ttatacaaaa tgttaacaga gatttacaca gaggataatt ttgttaagtt ttttaaagta 1080
cttaacagaa aaacatattt gaattttgat aaagccgtat ttaagataaa tatagtacct 1140
aaggtaaatt acacaatata tgatggattt aatttaagaa atacaaattt agcagcaaac 1200
tttaatggtc aaaatacaga aattaataat atgaatttta ctaaactaaa aaattttact 1260
ggattgtttg aattttataa gttgctatgt gtaagaggga taataacttc taaaactaaa 1320
tcattagttc cgcgtggatc caaggcctta aatgatttat gtatcaaagt taataattgg 1380
gacttgtttt ttagtccttc agaagataat tttactaatg atctaaataa aggagaagaa 1440
attacatctg atactaatat agaagcagca gaagaaaata ttagtttaga tttaatacaa 1500
caatattatt taacctttaa ttttgataat gaacctgaaa atatttcaat agaaaatctt 1560
tcaagtgaca ttataggcca attagaactt atgcctaata tagaaagatt tcctaatgga 1620
aaaaagtatg agttagataa atatactatg ttccattatc ttcgtgctca agaatttgaa 1680
catggtaaat ctaggattgc tttaacaaat tctgttaacg aagcattatt aaatcctagt 1740
cgtgtttata catttttttc ttcagactat gtaaagaaag ttaataaagc tacggaggca 1800
gctatgtttt taggctgggt agaacaatta gtatatgatt ttaccgatga aactagcgaa 1860
gtaagtacta cggataaaat tgcggatata actataatta ttccatatat aggacctgct 1920
ttaaatatag gtaatatgtt atataaagat gattttgtag gtgctttaat attttcagga 1980
gctgttattc tgttagaatt tataccagag attgcaatac ctgtattagg tacttttgca 2040
cttgtatcat atattgcgaa taaggttcta accgttcaaa caatagataa tgctttaagt 2100
aaaagaaatg aaaaatggga tgaggtctat aaatatatag taacaaattg gttagcaaag 2160
gttaatacac agattgatct aataagaaaa aaaatgaaag aagctttaga aaatcaagca 2220
gaagcaacaa aggctataat aaactatcag tataatcaat atactgagga agagaaaaat 2280
aatattaatt ttaatattga tgatttaagt tcgaaactta atgagtctat aaataaagct 2340
atgattaata taaataaatt tttgaatcaa tgctctgttt catatttaat gaattctatg 2400
atcccttatg gtgttaaacg gttagaagat tttgatgcta gtcttaaaga tgcattatta 2460
aagtatatat atgataatag aggaacttta attggtcaag tagatagatt aaaagataaa 2520
gttaataata cacttagtac agatatacct tttcagcttt ccaaatacgt agataatcaa 2580
agattattat ctacatttac tgaatatatt aagaatatta ttaatacttc tatattgaat 2640
ttaagatatg aaagtaatca tttaatagac ttatctaggt atgcatcaaa aataaatatt 2700
ggtagtaaag taaattttga tccaatagat aaaaatcaaa ttcaattatt taatttagaa 2760
agtagtaaaa ttgaggtaat tttaaaaaat gctattgtat ataatagtat gtatgaaaat 2820
tttagtacta gcttttggat aagaattcct aagtatttta acagtataag tctaaataat 2880
gaatatacaa taataaattg tatggaaaat aattcaggat ggaaagtatc acttaattat 2940
ggtgaaataa tctggacttt acaggatact caggaaataa aacaaagagt agtttttaaa 3000
tacagtcaaa tgattaatat atcagattat ataaacagat ggatttttgt aactatcact 3060
aataatagat taaataactc taaaatttat ataaatggaa gattaataga tcaaaaacca 3120
atttcaaatt taggtaatat tcatgctagt aataatataa tgtttaaatt agatggttgt 3180
agagatacac atagatatat ttggataaaa tattttaatc tttttgataa ggaattaaat 3240
gaaaaagaaa tcaaagattt atatgataat caatcaaatt caggtatttt aaaagacttt 3300
tggggtgatt atttacaata tgataaacca tactatatgt taaatttata tgatccaaat 3360
aaatatgtcg atgtaaataa tgtaggtatt agaggttata tgtatcttaa agggcctaga 3420
ggtagcgtaa tgactacaaa catttattta aattcaagtt tgtatagggg gacaaaattt 3480
attataaaaa aatatgcttc tggaaataaa gataatattg ttagaaataa tgatcgtgta 3540
tatattaatg tagtagttaa aaataaagaa tataggttag ctactaatgc atcacaggca 3600
ggcgtagaaa aaatactaag tgcattagaa atacctgatg taggaaatct aagtcaagta 3660
gtagtaatga agtcaaaaaa tgatcaagga ataacaaata aatgcaaaat gaatttacaa 3720
gataataatg ggaatgatat aggctttata ggatttcatc agtttaataa tatagctaaa 3780
ctagtagcaa gtaattggta taatagacaa atagaaagat ctagtaggac tttgggttgc 3840
tcatgggaat ttattcctgt agatgatgga tggggagaaa ggccactgct cgagcaccac 3900
caccaccacc actaa 3915
<210> 2
<211> 1304
<212> PRT
<213> Clostridium botulinum
<400> 2
Met Ala Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly
1 5 10 15
Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Val Gly Gln Met Gln Pro
20 25 30
Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro Glu Arg
35 40 45
Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu
50 55 60
Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr
65 70 75 80
Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu
85 90 95
Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser Ile Val
100 105 110
Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys
115 120 125
Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr
130 135 140
Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala Asp Ile
145 150 155 160
Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn Leu Thr
165 170 175
Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe
180 185 190
Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro Leu Leu
195 200 205
Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala His Glu
210 215 220
Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn
225 230 235 240
Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu
245 250 255
Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp Ala Lys
260 265 270
Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn
275 280 285
Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser Ile Val
290 295 300
Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys Glu Lys
305 310 315 320
Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp Lys Leu
325 330 335
Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp
340 345 350
Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn
355 360 365
Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val Asn Tyr
370 375 380
Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn
385 390 395 400
Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr Lys Leu
405 410 415
Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys Val Arg
420 425 430
Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys
435 440 445
Ala Leu Asn Asp Leu Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe
450 455 460
Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu
465 470 475 480
Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu
485 490 495
Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro
500 505 510
Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu
515 520 525
Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu
530 535 540
Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu
545 550 555 560
His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu
565 570 575
Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys
580 585 590
Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu
595 600 605
Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr
610 615 620
Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala
625 630 635 640
Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu
645 650 655
Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala
660 665 670
Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys
675 680 685
Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu
690 695 700
Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys
705 710 715 720
Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu
725 730 735
Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn
740 745 750
Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp
755 760 765
Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile
770 775 780
Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met
785 790 795 800
Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys
805 810 815
Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly
820 825 830
Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp
835 840 845
Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser
850 855 860
Thr Phe Thr Glu Tyr Ile Lys Asn Ile Ile Asn Thr Ser Ile Leu Asn
865 870 875 880
Leu Arg Tyr Glu Ser Asn His Leu Ile Asp Leu Ser Arg Tyr Ala Ser
885 890 895
Lys Ile Asn Ile Gly Ser Lys Val Asn Phe Asp Pro Ile Asp Lys Asn
900 905 910
Gln Ile Gln Leu Phe Asn Leu Glu Ser Ser Lys Ile Glu Val Ile Leu
915 920 925
Lys Asn Ala Ile Val Tyr Asn Ser Met Tyr Glu Asn Phe Ser Thr Ser
930 935 940
Phe Trp Ile Arg Ile Pro Lys Tyr Phe Asn Ser Ile Ser Leu Asn Asn
945 950 955 960
Glu Tyr Thr Ile Ile Asn Cys Met Glu Asn Asn Ser Gly Trp Lys Val
965 970 975
Ser Leu Asn Tyr Gly Glu Ile Ile Trp Thr Leu Gln Asp Thr Gln Glu
980 985 990
Ile Lys Gln Arg Val Val Phe Lys Tyr Ser Gln Met Ile Asn Ile Ser
995 1000 1005
Asp Tyr Ile Asn Arg Trp Ile Phe Val Thr Ile Thr Asn Asn Arg
1010 1015 1020
Leu Asn Asn Ser Lys Ile Tyr Ile Asn Gly Arg Leu Ile Asp Gln
1025 1030 1035
Lys Pro Ile Ser Asn Leu Gly Asn Ile His Ala Ser Asn Asn Ile
1040 1045 1050
Met Phe Lys Leu Asp Gly Cys Arg Asp Thr His Arg Tyr Ile Trp
1055 1060 1065
Ile Lys Tyr Phe Asn Leu Phe Asp Lys Glu Leu Asn Glu Lys Glu
1070 1075 1080
Ile Lys Asp Leu Tyr Asp Asn Gln Ser Asn Ser Gly Ile Leu Lys
1085 1090 1095
Asp Phe Trp Gly Asp Tyr Leu Gln Tyr Asp Lys Pro Tyr Tyr Met
1100 1105 1110
Leu Asn Leu Tyr Asp Pro Asn Lys Tyr Val Asp Val Asn Asn Val
1115 1120 1125
Gly Ile Arg Gly Tyr Met Tyr Leu Lys Gly Pro Arg Gly Ser Val
1130 1135 1140
Met Thr Thr Asn Ile Tyr Leu Asn Ser Ser Leu Tyr Arg Gly Thr
1145 1150 1155
Lys Phe Ile Ile Lys Lys Tyr Ala Ser Gly Asn Lys Asp Asn Ile
1160 1165 1170
Val Arg Asn Asn Asp Arg Val Tyr Ile Asn Val Val Val Lys Asn
1175 1180 1185
Lys Glu Tyr Arg Leu Ala Thr Asn Ala Ser Gln Ala Gly Val Glu
1190 1195 1200
Lys Ile Leu Ser Ala Leu Glu Ile Pro Asp Val Gly Asn Leu Ser
1205 1210 1215
Gln Val Val Val Met Lys Ser Lys Asn Asp Gln Gly Ile Thr Asn
1220 1225 1230
Lys Cys Lys Met Asn Leu Gln Asp Asn Asn Gly Asn Asp Ile Gly
1235 1240 1245
Phe Ile Gly Phe His Gln Phe Asn Asn Ile Ala Lys Leu Val Ala
1250 1255 1260
Ser Asn Trp Tyr Asn Arg Gln Ile Glu Arg Ser Ser Arg Thr Leu
1265 1270 1275
Gly Cys Ser Trp Glu Phe Ile Pro Val Asp Asp Gly Trp Gly Glu
1280 1285 1290
Arg Pro Leu Leu Glu His His His His His His
1295 1300
<210> 3
<211> 2646
<212> DNA
<213> Clostridium botulinum
<400> 3
atggcatttg ttaataaaca atttaattat aaagatcctg taaatggtgt tgatattgct 60
tatataaaaa ttccaaatgc aggacaaatg caaccagtaa aagcttttaa aattcataat 120
aaaatatggg ttattccaga aagagataca tttacaaatc ctgaagaagg agatttaaat 180
ccaccaccag aagcaaaaca agttccagtt tcatattatg attcaacata tttaagtaca 240
gataatgaaa aagataatta tttaaaggga gttacaaaat tatttgagag aatttattca 300
actgatcttg gaagaatgtt gttaacatca atagtaaggg gaataccatt ttggggtgga 360
agtacaatag atacagaatt aaaagttatt gatactaatt gtattaatgt gatacaacca 420
gatggtagtt atagatcaga agaacttaat ctagtaataa taggaccctc agctgatatt 480
atacagtttg aatgtaaaag ctttggacat gaagttttga atcttacgcg aaatggttat 540
ggctctactc aatacattag atttagccca gattttacat ttggttttga ggagtcactt 600
gaagttgata caaatcctct tttaggtgca ggcaaatttg ctacagatcc agcagtaaca 660
ttagcacatg aacttataca tgctggacat agattatatg gaatagcaat taatccaaat 720
agggttttta aagtaaatac taatgcctat tatgaaatga gtgggttaga agtaagcttt 780
gaggaactta gaacatttgg gggacatgat gcaaagttta tagatagttt acaggaaaac 840
gaatttcgtc tatattatta taataagttt aaagatatag caagtacact taataaagct 900
aaatcaatag taggtactac tgcttcatta cagtatatga aaaatgtttt taaagagaaa 960
tatctcctat ctgaagatac atctggaaaa ttttcggtag ataaattaaa atttgataag 1020
ttatacaaaa tgttaacaga gatttacaca gaggataatt ttgttaagtt ttttaaagta 1080
cttaacagaa aaacatattt gaattttgat aaagccgtat ttaagataaa tatagtacct 1140
aaggtaaatt acacaatata tgatggattt aatttaagaa atacaaattt agcagcaaac 1200
tttaatggtc aaaatacaga aattaataat atgaatttta ctaaactaaa aaattttact 1260
ggattgtttg aattttataa gttgctatgt gtaagaggga taataacttc taaaactaaa 1320
tcattagttc cgcgtggatc caaggcctta aatgatttat gtatcaaagt taataattgg 1380
gacttgtttt ttagtccttc agaagataat tttactaatg atctaaataa aggagaagaa 1440
attacatctg atactaatat agaagcagca gaagaaaata ttagtttaga tttaatacaa 1500
caatattatt taacctttaa ttttgataat gaacctgaaa atatttcaat agaaaatctt 1560
tcaagtgaca ttataggcca attagaactt atgcctaata tagaaagatt tcctaatgga 1620
aaaaagtatg agttagataa atatactatg ttccattatc ttcgtgctca agaatttgaa 1680
catggtaaat ctaggattgc tttaacaaat tctgttaacg aagcattatt aaatcctagt 1740
cgtgtttata catttttttc ttcagactat gtaaagaaag ttaataaagc tacggaggca 1800
gctatgtttt taggctgggt agaacaatta gtatatgatt ttaccgatga aactagcgaa 1860
gtaagtacta cggataaaat tgcggatata actataatta ttccatatat aggacctgct 1920
ttaaatatag gtaatatgtt atataaagat gattttgtag gtgctttaat attttcagga 1980
gctgttattc tgttagaatt tataccagag attgcaatac ctgtattagg tacttttgca 2040
cttgtatcat atattgcgaa taaggttcta accgttcaaa caatagataa tgctttaagt 2100
aaaagaaatg aaaaatggga tgaggtctat aaatatatag taacaaattg gttagcaaag 2160
gttaatacac agattgatct aataagaaaa aaaatgaaag aagctttaga aaatcaagca 2220
gaagcaacaa aggctataat aaactatcag tataatcaat atactgagga agagaaaaat 2280
aatattaatt ttaatattga tgatttaagt tcgaaactta atgagtctat aaataaagct 2340
atgattaata taaataaatt tttgaatcaa tgctctgttt catatttaat gaattctatg 2400
atcccttatg gtgttaaacg gttagaagat tttgatgcta gtcttaaaga tgcattatta 2460
aagtatatat atgataatag aggaacttta attggtcaag tagatagatt aaaagataaa 2520
gttaataata cacttagtac agatatacct tttcagcttt ccaaatacgt agataatcaa 2580
agattattat ctacatttac tgaatatatt aagaatattc tcgagcacca ccaccaccac 2640
cactaa 2646
<210> 4
<211> 881
<212> PRT
<213> Clostridium botulinum
<400> 4
Met Ala Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly
1 5 10 15
Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Val Gly Gln Met Gln Pro
20 25 30
Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro Glu Arg
35 40 45
Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu
50 55 60
Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr
65 70 75 80
Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu
85 90 95
Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser Ile Val
100 105 110
Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys
115 120 125
Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr
130 135 140
Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala Asp Ile
145 150 155 160
Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn Leu Thr
165 170 175
Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe
180 185 190
Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro Leu Leu
195 200 205
Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala His Glu
210 215 220
Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn
225 230 235 240
Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu
245 250 255
Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp Ala Lys
260 265 270
Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn
275 280 285
Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser Ile Val
290 295 300
Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys Glu Lys
305 310 315 320
Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp Lys Leu
325 330 335
Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp
340 345 350
Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn
355 360 365
Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val Asn Tyr
370 375 380
Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn
385 390 395 400
Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr Lys Leu
405 410 415
Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys Val Arg
420 425 430
Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys
435 440 445
Ala Leu Asn Asp Leu Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe
450 455 460
Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu
465 470 475 480
Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu
485 490 495
Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro
500 505 510
Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu
515 520 525
Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu
530 535 540
Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu
545 550 555 560
His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu
565 570 575
Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys
580 585 590
Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu
595 600 605
Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr
610 615 620
Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala
625 630 635 640
Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu
645 650 655
Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala
660 665 670
Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys
675 680 685
Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu
690 695 700
Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys
705 710 715 720
Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu
725 730 735
Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn
740 745 750
Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp
755 760 765
Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile
770 775 780
Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met
785 790 795 800
Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys
805 810 815
Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly
820 825 830
Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp
835 840 845
Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser
850 855 860
Thr Phe Thr Glu Tyr Ile Lys Asn Ile Leu Glu His His His His His
865 870 875 880
His
<210> 5
<211> 3312
<212> DNA
<213> Clostridium botulinum
<400> 5
atggcatttg ttaataaaca atttaattat aaagatcctg taaatggtgt tgatattgct 60
tatataaaaa ttccaaatgc aggacaaatg caaccagtaa aagcttttaa aattcataat 120
aaaatatggg ttattccaga aagagataca tttacaaatc ctgaagaagg agatttaaat 180
ccaccaccag aagcaaaaca agttccagtt tcatattatg attcaacata tttaagtaca 240
gataatgaaa aagataatta tttaaaggga gttacaaaat tatttgagag aatttattca 300
actgatcttg gaagaatgtt gttaacatca atagtaaggg gaataccatt ttggggtgga 360
agtacaatag atacagaatt aaaagttatt gatactaatt gtattaatgt gatacaacca 420
gatggtagtt atagatcaga agaacttaat ctagtaataa taggaccctc agctgatatt 480
atacagtttg aatgtaaaag ctttggacat gaagttttga atcttacgcg aaatggttat 540
ggctctactc aatacattag atttagccca gattttacat ttggttttga ggagtcactt 600
gaagttgata caaatcctct tttaggtgca ggcaaatttg ctacagatcc agcagtaaca 660
ttagcacatg aacttataca tgctggacat agattatatg gaatagcaat taatccaaat 720
agggttttta aagtaaatac taatgcctat tatgaaatga gtgggttaga agtaagcttt 780
gaggaactta gaacatttgg gggacatgat gcaaagttta tagatagttt acaggaaaac 840
gaatttcgtc tatattatta taataagttt aaagatatag caagtacact taataaagct 900
aaatcaatag taggtactac tgcttcatta cagtatatga aaaatgtttt taaagagaaa 960
tatctcctat ctgaagatac atctggaaaa ttttcggtag ataaattaaa atttgataag 1020
ttatacaaaa tgttaacaga gatttacaca gaggataatt ttgttaagtt ttttaaagta 1080
cttaacagaa aaacatattt gaattttgat aaagccgtat ttaagataaa tatagtacct 1140
aaggtaaatt acacaatata tgatggattt aatttaagaa atacaaattt agcagcaaac 1200
tttaatggtc aaaatacaga aattaataat atgaatttta ctaaactaaa aaattttact 1260
ggattgtttg aattttataa gttgctatgt gtaagaggga taataacttc taaaactaaa 1320
tcattagttc cgcgtggatc caaggcctta aatgatttat gtatcaaagt taataattgg 1380
gacttgtttt ttagtccttc agaagataat tttactaatg atctaaataa aggagaagaa 1440
attacatctg atactaatat agaagcagca gaagaaaata ttagtttaga tttaatacaa 1500
caatattatt taacctttaa ttttgataat gaacctgaaa atatttcaat agaaaatctt 1560
tcaagtgaca ttataggcca attagaactt atgcctaata tagaaagatt tcctaatgga 1620
aaaaagtatg agttagataa atatactatg ttccattatc ttcgtgctca agaatttgaa 1680
catggtaaat ctaggattgc tttaacaaat tctgttaacg aagcattatt aaatcctagt 1740
cgtgtttata catttttttc ttcagactat gtaaagaaag ttaataaagc tacggaggca 1800
gctatgtttt taggctgggt agaacaatta gtatatgatt ttaccgatga aactagcgaa 1860
gtaagtacta cggataaaat tgcggatata actataatta ttccatatat aggacctgct 1920
ttaaatatag gtaatatgtt atataaagat gattttgtag gtgctttaat attttcagga 1980
gctgttattc tgttagaatt tataccagag attgcaatac ctgtattagg tacttttgca 2040
cttgtatcat atattgcgaa taaggttcta accgttcaaa caatagataa tgctttaagt 2100
aaaagaaatg aaaaatggga tgaggtctat aaatatatag taacaaattg gttagcaaag 2160
gttaatacac agattgatct aataagaaaa aaaatgaaag aagctttaga aaatcaagca 2220
gaagcaacaa aggctataat aaactatcag tataatcaat atactgagga agagaaaaat 2280
aatattaatt ttaatattga tgatttaagt tcgaaactta atgagtctat aaataaagct 2340
atgattaata taaataaatt tttgaatcaa tgctctgttt catatttaat gaattctatg 2400
atcccttatg gtgttaaacg gttagaagat tttgatgcta gtcttaaaga tgcattatta 2460
aagtatatat atgataatag aggaacttta attggtcaag tagatagatt aaaagataaa 2520
gttaataata cacttagtac agatatacct tttcagcttt ccaaatacgt agataatcaa 2580
agattattat ctacatttac tgaatatatt aagaatatta ttaatacttc tatattgaat 2640
ttaagatatg aaagtaatca tttaatagac ttatctaggt atgcatcaaa aataaatatt 2700
ggtagtaaag taaattttga tccaatagat aaaaatcaaa ttcaattatt taatttagaa 2760
agtagtaaaa ttgaggtaat tttaaaaaat gctattgtat ataatagtat gtatgaaaat 2820
tttagtacta gcttttggat aagaattcct aagtatttta acagtataag tctaaataat 2880
gaatatacaa taataaattg tatggaaaat aattcaggat ggaaagtatc acttaattat 2940
ggtgaaataa tctggacttt acaggatact caggaaataa aacaaagagt agtttttaaa 3000
tacagtcaaa tgattaatat atcagattat ataaacagat ggatttttgt aactatcact 3060
aataatagat taaataactc taaaatttat ataaatggaa gattaataga tcaaaaacca 3120
atttcaaatt taggtaatat tcatgctagt aataatataa tgtttaaatt agatggttgt 3180
agagatacac atagatatat ttggataaaa tattttaatc tttttgataa ggaattaaat 3240
gaaaaagaaa tcaaagattt atatgataat caatcaaatt caggtctcga gcaccaccac 3300
caccaccact aa 3312
<210> 6
<211> 1103
<212> PRT
<213> Clostridium botulinum
<400> 6
Met Ala Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly
1 5 10 15
Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Val Gly Gln Met Gln Pro
20 25 30
Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro Glu Arg
35 40 45
Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu
50 55 60
Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr
65 70 75 80
Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu
85 90 95
Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser Ile Val
100 105 110
Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys
115 120 125
Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr
130 135 140
Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala Asp Ile
145 150 155 160
Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn Leu Thr
165 170 175
Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe
180 185 190
Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro Leu Leu
195 200 205
Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala His Glu
210 215 220
Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn
225 230 235 240
Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu
245 250 255
Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp Ala Lys
260 265 270
Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn
275 280 285
Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser Ile Val
290 295 300
Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys Glu Lys
305 310 315 320
Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp Lys Leu
325 330 335
Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp
340 345 350
Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn
355 360 365
Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val Asn Tyr
370 375 380
Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn
385 390 395 400
Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr Lys Leu
405 410 415
Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys Val Arg
420 425 430
Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys
435 440 445
Ala Leu Asn Asp Leu Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe
450 455 460
Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu
465 470 475 480
Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu
485 490 495
Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro
500 505 510
Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu
515 520 525
Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu
530 535 540
Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu
545 550 555 560
His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu
565 570 575
Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys
580 585 590
Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu
595 600 605
Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr
610 615 620
Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala
625 630 635 640
Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu
645 650 655
Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala
660 665 670
Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys
675 680 685
Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu
690 695 700
Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys
705 710 715 720
Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu
725 730 735
Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn
740 745 750
Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp
755 760 765
Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile
770 775 780
Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met
785 790 795 800
Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys
805 810 815
Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly
820 825 830
Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp
835 840 845
Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser
850 855 860
Thr Phe Thr Glu Tyr Ile Lys Asn Ile Ile Asn Thr Ser Ile Leu Asn
865 870 875 880
Leu Arg Tyr Glu Ser Asn His Leu Ile Asp Leu Ser Arg Tyr Ala Ser
885 890 895
Lys Ile Asn Ile Gly Ser Lys Val Asn Phe Asp Pro Ile Asp Lys Asn
900 905 910
Gln Ile Gln Leu Phe Asn Leu Glu Ser Ser Lys Ile Glu Val Ile Leu
915 920 925
Lys Asn Ala Ile Val Tyr Asn Ser Met Tyr Glu Asn Phe Ser Thr Ser
930 935 940
Phe Trp Ile Arg Ile Pro Lys Tyr Phe Asn Ser Ile Ser Leu Asn Asn
945 950 955 960
Glu Tyr Thr Ile Ile Asn Cys Met Glu Asn Asn Ser Gly Trp Lys Val
965 970 975
Ser Leu Asn Tyr Gly Glu Ile Ile Trp Thr Leu Gln Asp Thr Gln Glu
980 985 990
Ile Lys Gln Arg Val Val Phe Lys Tyr Ser Gln Met Ile Asn Ile Ser
995 1000 1005
Asp Tyr Ile Asn Arg Trp Ile Phe Val Thr Ile Thr Asn Asn Arg
1010 1015 1020
Leu Asn Asn Ser Lys Ile Tyr Ile Asn Gly Arg Leu Ile Asp Gln
1025 1030 1035
Lys Pro Ile Ser Asn Leu Gly Asn Ile His Ala Ser Asn Asn Ile
1040 1045 1050
Met Phe Lys Leu Asp Gly Cys Arg Asp Thr His Arg Tyr Ile Trp
1055 1060 1065
Ile Lys Tyr Phe Asn Leu Phe Asp Lys Glu Leu Asn Glu Lys Glu
1070 1075 1080
Ile Lys Asp Leu Tyr Asp Asn Gln Ser Asn Ser Gly Leu Glu His
1085 1090 1095
His His His His His
1100
<210> 7
<211> 3942
<212> DNA
<213> Clostridium botulinum
<400> 7
atggcagtta caataaataa ttttaattat aatgatccta ttgataataa taatattatt 60
atgatggagc ctccatttgc gagaggtacg gggagatatt ataaagcttt taaaatcaca 120
gatcgtattt ggataatacc ggaaagatat acttttggat ataaacctga ggattttaat 180
aaaagttccg gtatttttaa tagagatgtt tgtgaatatt atgatccaga ttacttaaat 240
actaatgata aaaagaatat atttttacaa acaatgatca agttatttaa tagaatcaaa 300
tcaaaaccat tgggtgaaaa gttattagag atgattataa atggtatacc ttatcttgga 360
gatagacgtg ttccactcga agagtttaac acaaacattg ctagtgtaac tgttaataaa 420
ttaatcagta atccaggaga agtggagcga aaaaaaggta ttttcgcaaa tttaataata 480
tttggacctg ggccagtttt aaatgaaaat gagactatag atataggtat acaaaatcat 540
tttgcatcaa gggaaggctt cgggggtata atgcaaatga agttttgccc agaatatgta 600
agcgtattta ataatgttca agaaaacaaa ggcgcaagta tatttaatag acgtggatat 660
ttttcagatc cagccttgat attaatgcat gaacttatac atgttttaca tggattatat 720
ggcattaaag tagatgattt accaattgta ccaaatgaaa aaaaattttt tatgcaatct 780
acagatgcta tacaggcaga agaactatat acatttggag gacaagatcc cagcatcata 840
actccttcta cggataaaag tatctatgat aaagttttgc aaaattttag agggatagtt 900
gatagactta acaaggtttt agtttgcata tcagatccta acattaatat taatatatat 960
aaaaataaat ttaaagataa atataaattc gttgaagatt ctgagggaaa atatagtata 1020
gatgtagaaa gttttgataa attatataaa agcttaatgt ttggttttac agaaactaat 1080
atagcagaaa attataaaat aaaaactaga gcttcttatt ttagtgattc cttaccacca 1140
gtaaaaataa aaaatttatt agataatgaa atctatacta tagaggaagg gtttaatata 1200
tctgataaag atatggaaaa agaatataga ggtcagaata aagctataaa taaacaagct 1260
tatgaagaaa ttagcaagga gcatttggct gtatataaga tacaaatgtg taaaagtggg 1320
ataataactt ctaaaactaa atcattggtt ccacgtggat ccaaggcctc aggaatatgt 1380
attgatgttg ataatgaaga tttgttcttt atagctgata aaaatagttt ttcagatgat 1440
ttatctaaaa acgaaagaat agaatataat acacagagta attatataga aaatgacttc 1500
cctataaatg aattaatttt agatactgat ttaataagta aaatagaatt accaagtgaa 1560
aatacagaat cacttactga ttttaatgta gatgttccag tatatgaaaa acaacccgct 1620
ataaaaaaaa tttttacaga tgaaaatacc atctttcaat atttatactc tcagacattt 1680
cctctagata taagagatat aagtttaaca tcttcatttg atgatgcatt attattttct 1740
aacaaagttt attcattttt ttctatggat tatattaaaa ctgctaataa agtggtagaa 1800
gcaggattat ttgcaggttg ggtgaaacag atagtaaatg attttgtaat cgaagctaat 1860
aaaagcaata ctatggataa aattgcagat atatctctaa ttgttcctta tataggatta 1920
gctttaaatg taggaaatga aacagctaaa ggaaattttg aaaatgcttt tgagattgca 1980
ggagccagta ttctactaga atttatacca gaacttttaa tacctgtagt tggagccttt 2040
ttattagaat catatattga caataaaaat aaaattatta aaacaataga taatgcttta 2100
actaaaagaa atgaaaaatg gagtgatatg tacggattaa tagtagcgca atggctctca 2160
acagttaata ctcaatttta tacaataaaa gagggaatgt ataaggcttt aaattatcaa 2220
gcacaagcat tggaagaaat aataaaatac agatataata tatattctga aaaagaaaag 2280
tcaaatatta acatcgattt taatgatata aattctaaac ttaatgaggg tattaaccaa 2340
gctatagata atataaataa ttttataaat ggatgttctg tatcatattt aatgaaaaaa 2400
atgattccat tagctgtaga aaaattacta gactttgata atactctcaa aaaaaatttg 2460
ttaaattata tagatgaaaa taaattatat ttgattggaa gtgcagaata tgaaaaatca 2520
aaagtaaata aatacttgaa aaccattatg ccgtttgatc tttcaatata taccaatgat 2580
acaatactaa tagaaatgtt taataaatat aatagcgaaa ttttaaataa tattatctta 2640
aatttaagat ataaggataa taatttaata gatttatcag gatatggggc aaaggtagag 2700
gtatatgatg gagtcgagct taatgataaa aatcaattta aattaactag ttcagcaaat 2760
agtaagatta gagtgactca aaatcagaat atcatattta atagtgtgtt ccttgatttt 2820
agcgttagct tttggataag aatacctaaa tataagaatg atggtataca aaattatatt 2880
cataatgaat atacaataat taattgtatg aaaaataatt cgggctggaa aatatctatt 2940
aggggtaata ggataatatg gactttaatt gatataaatg gaaaaaccaa atcggtattt 3000
tttgaatata acataagaga agatatatca gagtatataa atagatggtt ttttgtaact 3060
attactaata atttgaataa cgctaaaatt tatattaatg gtaagctaga atcaaataca 3120
gatattaaag atataagaga agttattgct aatggtgaaa taatatttaa attagatggt 3180
gatatagata gaacacaatt tatttggatg aaatatttca gtatttttaa tacggaatta 3240
agtcaatcaa atattgaaga aagatataaa attcaatcat atagcgaata tttaaaagat 3300
ttttggggaa atcctttaat gtacaataaa gaatattata tgtttaatgc ggggaataaa 3360
aattcatata ttaaactaaa gaaagattca cctgtaggtg aaattttaac acgtagcaaa 3420
tataatcaaa attctaaata tataaattat agagatttat atattggaga aaaatttatt 3480
ataagaagaa agtcaaattc tcaatctata aatgatgata tagttagaaa agaagattat 3540
atatatctag atttttttaa tttaaatcaa gagtggagag tatataccta taaatatttt 3600
aagaaagagg aagaaaaatt gtttttagct cctataagtg attctgatga gttttacaat 3660
actatacaaa taaaagaata tgatgaacag ccaacatata gttgtcagtt gctttttaaa 3720
aaagatgaag aaagtactga tgagatagga ttgattggta ttcatcgttt ctacgaatct 3780
ggaattgtat ttgaagagta taaagattat ttttgtataa gtaaatggta cttaaaagag 3840
gtaaaaagga aaccatataa tttaaaattg ggatgtaatt ggcagtttat tcctaaagat 3900
gaagggtgga ctgaactcga gcaccaccac caccaccact aa 3942
<210> 8
<211> 1313
<212> PRT
<213> Clostridium botulinum
<400> 8
Met Ala Val Thr Ile Asn Asn Phe Asn Tyr Asn Asp Pro Ile Asp Asn
1 5 10 15
Asn Asn Ile Ile Met Met Glu Pro Pro Phe Ala Arg Gly Thr Gly Arg
20 25 30
Tyr Tyr Lys Ala Phe Lys Ile Thr Asp Arg Ile Trp Ile Ile Pro Glu
35 40 45
Arg Tyr Thr Phe Gly Tyr Lys Pro Glu Asp Phe Asn Lys Ser Ser Gly
50 55 60
Ile Phe Asn Arg Asp Val Cys Glu Tyr Tyr Asp Pro Asp Tyr Leu Asn
65 70 75 80
Thr Asn Asp Lys Lys Asn Ile Phe Leu Gln Thr Met Ile Lys Leu Phe
85 90 95
Asn Arg Ile Lys Ser Lys Pro Leu Gly Glu Lys Leu Leu Glu Met Ile
100 105 110
Ile Asn Gly Ile Pro Tyr Leu Gly Asp Arg Arg Val Pro Leu Glu Glu
115 120 125
Phe Asn Thr Asn Ile Ala Ser Val Thr Val Asn Lys Leu Ile Ser Asn
130 135 140
Pro Gly Glu Val Glu Arg Lys Lys Gly Ile Phe Ala Asn Leu Ile Ile
145 150 155 160
Phe Gly Pro Gly Pro Val Leu Asn Glu Asn Glu Thr Ile Asp Ile Gly
165 170 175
Ile Gln Asn His Phe Ala Ser Arg Glu Gly Phe Gly Gly Ile Met Gln
180 185 190
Met Lys Phe Cys Pro Glu Tyr Val Ser Val Phe Asn Asn Val Gln Glu
195 200 205
Asn Lys Gly Ala Ser Ile Phe Asn Arg Arg Gly Tyr Phe Ser Asp Pro
210 215 220
Ala Leu Ile Leu Met His Glu Leu Ile His Val Leu His Gly Leu Tyr
225 230 235 240
Gly Ile Lys Val Asp Asp Leu Pro Ile Val Pro Asn Glu Lys Lys Phe
245 250 255
Phe Met Gln Ser Thr Asp Ala Ile Gln Ala Glu Glu Leu Tyr Thr Phe
260 265 270
Gly Gly Gln Asp Pro Ser Ile Ile Thr Pro Ser Thr Asp Lys Ser Ile
275 280 285
Tyr Asp Lys Val Leu Gln Asn Phe Arg Gly Ile Val Asp Arg Leu Asn
290 295 300
Lys Val Leu Val Cys Ile Ser Asp Pro Asn Ile Asn Ile Asn Ile Tyr
305 310 315 320
Lys Asn Lys Phe Lys Asp Lys Tyr Lys Phe Val Glu Asp Ser Glu Gly
325 330 335
Lys Tyr Ser Ile Asp Val Glu Ser Phe Asp Lys Leu Tyr Lys Ser Leu
340 345 350
Met Phe Gly Phe Thr Glu Thr Asn Ile Ala Glu Asn Tyr Lys Ile Lys
355 360 365
Thr Arg Ala Ser Tyr Phe Ser Asp Ser Leu Pro Pro Val Lys Ile Lys
370 375 380
Asn Leu Leu Asp Asn Glu Ile Tyr Thr Ile Glu Glu Gly Phe Asn Ile
385 390 395 400
Ser Asp Lys Asp Met Glu Lys Glu Tyr Arg Gly Gln Asn Lys Ala Ile
405 410 415
Asn Lys Gln Ala Tyr Glu Glu Ile Ser Lys Glu His Leu Ala Val Tyr
420 425 430
Lys Ile Gln Met Cys Lys Ser Gly Ile Ile Thr Ser Lys Thr Lys Ser
435 440 445
Leu Val Pro Arg Gly Ser Lys Ala Ser Gly Ile Cys Ile Asp Val Asp
450 455 460
Asn Glu Asp Leu Phe Phe Ile Ala Asp Lys Asn Ser Phe Ser Asp Asp
465 470 475 480
Leu Ser Lys Asn Glu Arg Ile Glu Tyr Asn Thr Gln Ser Asn Tyr Ile
485 490 495
Glu Asn Asp Phe Pro Ile Asn Glu Leu Ile Leu Asp Thr Asp Leu Ile
500 505 510
Ser Lys Ile Glu Leu Pro Ser Glu Asn Thr Glu Ser Leu Thr Asp Phe
515 520 525
Asn Val Asp Val Pro Val Tyr Glu Lys Gln Pro Ala Ile Lys Lys Ile
530 535 540
Phe Thr Asp Glu Asn Thr Ile Phe Gln Tyr Leu Tyr Ser Gln Thr Phe
545 550 555 560
Pro Leu Asp Ile Arg Asp Ile Ser Leu Thr Ser Ser Phe Asp Asp Ala
565 570 575
Leu Leu Phe Ser Asn Lys Val Tyr Ser Phe Phe Ser Met Asp Tyr Ile
580 585 590
Lys Thr Ala Asn Lys Val Val Glu Ala Gly Leu Phe Ala Gly Trp Val
595 600 605
Lys Gln Ile Val Asn Asp Phe Val Ile Glu Ala Asn Lys Ser Asn Thr
610 615 620
Met Asp Lys Ile Ala Asp Ile Ser Leu Ile Val Pro Tyr Ile Gly Leu
625 630 635 640
Ala Leu Asn Val Gly Asn Glu Thr Ala Lys Gly Asn Phe Glu Asn Ala
645 650 655
Phe Glu Ile Ala Gly Ala Ser Ile Leu Leu Glu Phe Ile Pro Glu Leu
660 665 670
Leu Ile Pro Val Val Gly Ala Phe Leu Leu Glu Ser Tyr Ile Asp Asn
675 680 685
Lys Asn Lys Ile Ile Lys Thr Ile Asp Asn Ala Leu Thr Lys Arg Asn
690 695 700
Glu Lys Trp Ser Asp Met Tyr Gly Leu Ile Val Ala Gln Trp Leu Ser
705 710 715 720
Thr Val Asn Thr Gln Phe Tyr Thr Ile Lys Glu Gly Met Tyr Lys Ala
725 730 735
Leu Asn Tyr Gln Ala Gln Ala Leu Glu Glu Ile Ile Lys Tyr Arg Tyr
740 745 750
Asn Ile Tyr Ser Glu Lys Glu Lys Ser Asn Ile Asn Ile Asp Phe Asn
755 760 765
Asp Ile Asn Ser Lys Leu Asn Glu Gly Ile Asn Gln Ala Ile Asp Asn
770 775 780
Ile Asn Asn Phe Ile Asn Gly Cys Ser Val Ser Tyr Leu Met Lys Lys
785 790 795 800
Met Ile Pro Leu Ala Val Glu Lys Leu Leu Asp Phe Asp Asn Thr Leu
805 810 815
Lys Lys Asn Leu Leu Asn Tyr Ile Asp Glu Asn Lys Leu Tyr Leu Ile
820 825 830
Gly Ser Ala Glu Tyr Glu Lys Ser Lys Val Asn Lys Tyr Leu Lys Thr
835 840 845
Ile Met Pro Phe Asp Leu Ser Ile Tyr Thr Asn Asp Thr Ile Leu Ile
850 855 860
Glu Met Phe Asn Lys Tyr Asn Ser Glu Ile Leu Asn Asn Ile Ile Leu
865 870 875 880
Asn Leu Arg Tyr Lys Asp Asn Asn Leu Ile Asp Leu Ser Gly Tyr Gly
885 890 895
Ala Lys Val Glu Val Tyr Asp Gly Val Glu Leu Asn Asp Lys Asn Gln
900 905 910
Phe Lys Leu Thr Ser Ser Ala Asn Ser Lys Ile Arg Val Thr Gln Asn
915 920 925
Gln Asn Ile Ile Phe Asn Ser Val Phe Leu Asp Phe Ser Val Ser Phe
930 935 940
Trp Ile Arg Ile Pro Lys Tyr Lys Asn Asp Gly Ile Gln Asn Tyr Ile
945 950 955 960
His Asn Glu Tyr Thr Ile Ile Asn Cys Met Lys Asn Asn Ser Gly Trp
965 970 975
Lys Ile Ser Ile Arg Gly Asn Arg Ile Ile Trp Thr Leu Ile Asp Ile
980 985 990
Asn Gly Lys Thr Lys Ser Val Phe Phe Glu Tyr Asn Ile Arg Glu Asp
995 1000 1005
Ile Ser Glu Tyr Ile Asn Arg Trp Phe Phe Val Thr Ile Thr Asn
1010 1015 1020
Asn Leu Asn Asn Ala Lys Ile Tyr Ile Asn Gly Lys Leu Glu Ser
1025 1030 1035
Asn Thr Asp Ile Lys Asp Ile Arg Glu Val Ile Ala Asn Gly Glu
1040 1045 1050
Ile Ile Phe Lys Leu Asp Gly Asp Ile Asp Arg Thr Gln Phe Ile
1055 1060 1065
Trp Met Lys Tyr Phe Ser Ile Phe Asn Thr Glu Leu Ser Gln Ser
1070 1075 1080
Asn Ile Glu Glu Arg Tyr Lys Ile Gln Ser Tyr Ser Glu Tyr Leu
1085 1090 1095
Lys Asp Phe Trp Gly Asn Pro Leu Met Tyr Asn Lys Glu Tyr Tyr
1100 1105 1110
Met Phe Asn Ala Gly Asn Lys Asn Ser Tyr Ile Lys Leu Lys Lys
1115 1120 1125
Asp Ser Pro Val Gly Glu Ile Leu Thr Arg Ser Lys Tyr Asn Gln
1130 1135 1140
Asn Ser Lys Tyr Ile Asn Tyr Arg Asp Leu Tyr Ile Gly Glu Lys
1145 1150 1155
Phe Ile Ile Arg Arg Lys Ser Asn Ser Gln Ser Ile Asn Asp Asp
1160 1165 1170
Ile Val Arg Lys Glu Asp Tyr Ile Tyr Leu Asp Phe Phe Asn Leu
1175 1180 1185
Asn Gln Glu Trp Arg Val Tyr Thr Tyr Lys Tyr Phe Lys Lys Glu
1190 1195 1200
Glu Glu Lys Leu Phe Leu Ala Pro Ile Ser Asp Ser Asp Glu Phe
1205 1210 1215
Tyr Asn Thr Ile Gln Ile Lys Glu Tyr Asp Glu Gln Pro Thr Tyr
1220 1225 1230
Ser Cys Gln Leu Leu Phe Lys Lys Asp Glu Glu Ser Thr Asp Glu
1235 1240 1245
Ile Gly Leu Ile Gly Ile His Arg Phe Tyr Glu Ser Gly Ile Val
1250 1255 1260
Phe Glu Glu Tyr Lys Asp Tyr Phe Cys Ile Ser Lys Trp Tyr Leu
1265 1270 1275
Lys Glu Val Lys Arg Lys Pro Tyr Asn Leu Lys Leu Gly Cys Asn
1280 1285 1290
Trp Gln Phe Ile Pro Lys Asp Glu Gly Trp Thr Glu Leu Glu His
1295 1300 1305
His His His His His
1310
<210> 9
<211> 2649
<212> DNA
<213> Clostridium botulinum
<400> 9
atggcagtta caataaataa ttttaattat aatgatccta ttgataataa taatattatt 60
atgatggagc ctccatttgc gagaggtacg gggagatatt ataaagcttt taaaatcaca 120
gatcgtattt ggataatacc ggaaagatat acttttggat ataaacctga ggattttaat 180
aaaagttccg gtatttttaa tagagatgtt tgtgaatatt atgatccaga ttacttaaat 240
actaatgata aaaagaatat atttttacaa acaatgatca agttatttaa tagaatcaaa 300
tcaaaaccat tgggtgaaaa gttattagag atgattataa atggtatacc ttatcttgga 360
gatagacgtg ttccactcga agagtttaac acaaacattg ctagtgtaac tgttaataaa 420
ttaatcagta atccaggaga agtggagcga aaaaaaggta ttttcgcaaa tttaataata 480
tttggacctg ggccagtttt aaatgaaaat gagactatag atataggtat acaaaatcat 540
tttgcatcaa gggaaggctt cgggggtata atgcaaatga agttttgccc agaatatgta 600
agcgtattta ataatgttca agaaaacaaa ggcgcaagta tatttaatag acgtggatat 660
ttttcagatc cagccttgat attaatgcat gaacttatac atgttttaca tggattatat 720
ggcattaaag tagatgattt accaattgta ccaaatgaaa aaaaattttt tatgcaatct 780
acagatgcta tacaggcaga agaactatat acatttggag gacaagatcc cagcatcata 840
actccttcta cggataaaag tatctatgat aaagttttgc aaaattttag agggatagtt 900
gatagactta acaaggtttt agtttgcata tcagatccta acattaatat taatatatat 960
aaaaataaat ttaaagataa atataaattc gttgaagatt ctgagggaaa atatagtata 1020
gatgtagaaa gttttgataa attatataaa agcttaatgt ttggttttac agaaactaat 1080
atagcagaaa attataaaat aaaaactaga gcttcttatt ttagtgattc cttaccacca 1140
gtaaaaataa aaaatttatt agataatgaa atctatacta tagaggaagg gtttaatata 1200
tctgataaag atatggaaaa agaatataga ggtcagaata aagctataaa taaacaagct 1260
tatgaagaaa ttagcaagga gcatttggct gtatataaga tacaaatgtg taaaagtggg 1320
ataataactt ctaaaactaa atcattggtt ccacgtggat ccaaggcctc aggaatatgt 1380
attgatgttg ataatgaaga tttgttcttt atagctgata aaaatagttt ttcagatgat 1440
ttatctaaaa acgaaagaat agaatataat acacagagta attatataga aaatgacttc 1500
cctataaatg aattaatttt agatactgat ttaataagta aaatagaatt accaagtgaa 1560
aatacagaat cacttactga ttttaatgta gatgttccag tatatgaaaa acaacccgct 1620
ataaaaaaaa tttttacaga tgaaaatacc atctttcaat atttatactc tcagacattt 1680
cctctagata taagagatat aagtttaaca tcttcatttg atgatgcatt attattttct 1740
aacaaagttt attcattttt ttctatggat tatattaaaa ctgctaataa agtggtagaa 1800
gcaggattat ttgcaggttg ggtgaaacag atagtaaatg attttgtaat cgaagctaat 1860
aaaagcaata ctatggataa aattgcagat atatctctaa ttgttcctta tataggatta 1920
gctttaaatg taggaaatga aacagctaaa ggaaattttg aaaatgcttt tgagattgca 1980
ggagccagta ttctactaga atttatacca gaacttttaa tacctgtagt tggagccttt 2040
ttattagaat catatattga caataaaaat aaaattatta aaacaataga taatgcttta 2100
actaaaagaa atgaaaaatg gagtgatatg tacggattaa tagtagcgca atggctctca 2160
acagttaata ctcaatttta tacaataaaa gagggaatgt ataaggcttt aaattatcaa 2220
gcacaagcat tggaagaaat aataaaatac agatataata tatattctga aaaagaaaag 2280
tcaaatatta acatcgattt taatgatata aattctaaac ttaatgaggg tattaaccaa 2340
gctatagata atataaataa ttttataaat ggatgttctg tatcatattt aatgaaaaaa 2400
atgattccat tagctgtaga aaaattacta gactttgata atactctcaa aaaaaatttg 2460
ttaaattata tagatgaaaa taaattatat ttgattggaa gtgcagaata tgaaaaatca 2520
aaagtaaata aatacttgaa aaccattatg ccgtttgatc tttcaatata taccaatgat 2580
acaatactaa tagaaatgtt taataaatat aatagcgaaa ttctcgagca ccaccaccac 2640
caccactaa 2649
<210> 10
<211> 882
<212> PRT
<213> Clostridium botulinum
<400> 10
Met Ala Val Thr Ile Asn Asn Phe Asn Tyr Asn Asp Pro Ile Asp Asn
1 5 10 15
Asn Asn Ile Ile Met Met Glu Pro Pro Phe Ala Arg Gly Thr Gly Arg
20 25 30
Tyr Tyr Lys Ala Phe Lys Ile Thr Asp Arg Ile Trp Ile Ile Pro Glu
35 40 45
Arg Tyr Thr Phe Gly Tyr Lys Pro Glu Asp Phe Asn Lys Ser Ser Gly
50 55 60
Ile Phe Asn Arg Asp Val Cys Glu Tyr Tyr Asp Pro Asp Tyr Leu Asn
65 70 75 80
Thr Asn Asp Lys Lys Asn Ile Phe Leu Gln Thr Met Ile Lys Leu Phe
85 90 95
Asn Arg Ile Lys Ser Lys Pro Leu Gly Glu Lys Leu Leu Glu Met Ile
100 105 110
Ile Asn Gly Ile Pro Tyr Leu Gly Asp Arg Arg Val Pro Leu Glu Glu
115 120 125
Phe Asn Thr Asn Ile Ala Ser Val Thr Val Asn Lys Leu Ile Ser Asn
130 135 140
Pro Gly Glu Val Glu Arg Lys Lys Gly Ile Phe Ala Asn Leu Ile Ile
145 150 155 160
Phe Gly Pro Gly Pro Val Leu Asn Glu Asn Glu Thr Ile Asp Ile Gly
165 170 175
Ile Gln Asn His Phe Ala Ser Arg Glu Gly Phe Gly Gly Ile Met Gln
180 185 190
Met Lys Phe Cys Pro Glu Tyr Val Ser Val Phe Asn Asn Val Gln Glu
195 200 205
Asn Lys Gly Ala Ser Ile Phe Asn Arg Arg Gly Tyr Phe Ser Asp Pro
210 215 220
Ala Leu Ile Leu Met His Glu Leu Ile His Val Leu His Gly Leu Tyr
225 230 235 240
Gly Ile Lys Val Asp Asp Leu Pro Ile Val Pro Asn Glu Lys Lys Phe
245 250 255
Phe Met Gln Ser Thr Asp Ala Ile Gln Ala Glu Glu Leu Tyr Thr Phe
260 265 270
Gly Gly Gln Asp Pro Ser Ile Ile Thr Pro Ser Thr Asp Lys Ser Ile
275 280 285
Tyr Asp Lys Val Leu Gln Asn Phe Arg Gly Ile Val Asp Arg Leu Asn
290 295 300
Lys Val Leu Val Cys Ile Ser Asp Pro Asn Ile Asn Ile Asn Ile Tyr
305 310 315 320
Lys Asn Lys Phe Lys Asp Lys Tyr Lys Phe Val Glu Asp Ser Glu Gly
325 330 335
Lys Tyr Ser Ile Asp Val Glu Ser Phe Asp Lys Leu Tyr Lys Ser Leu
340 345 350
Met Phe Gly Phe Thr Glu Thr Asn Ile Ala Glu Asn Tyr Lys Ile Lys
355 360 365
Thr Arg Ala Ser Tyr Phe Ser Asp Ser Leu Pro Pro Val Lys Ile Lys
370 375 380
Asn Leu Leu Asp Asn Glu Ile Tyr Thr Ile Glu Glu Gly Phe Asn Ile
385 390 395 400
Ser Asp Lys Asp Met Glu Lys Glu Tyr Arg Gly Gln Asn Lys Ala Ile
405 410 415
Asn Lys Gln Ala Tyr Glu Glu Ile Ser Lys Glu His Leu Ala Val Tyr
420 425 430
Lys Ile Gln Met Cys Lys Ser Gly Ile Ile Thr Ser Lys Thr Lys Ser
435 440 445
Leu Val Pro Arg Gly Ser Lys Ala Ser Gly Ile Cys Ile Asp Val Asp
450 455 460
Asn Glu Asp Leu Phe Phe Ile Ala Asp Lys Asn Ser Phe Ser Asp Asp
465 470 475 480
Leu Ser Lys Asn Glu Arg Ile Glu Tyr Asn Thr Gln Ser Asn Tyr Ile
485 490 495
Glu Asn Asp Phe Pro Ile Asn Glu Leu Ile Leu Asp Thr Asp Leu Ile
500 505 510
Ser Lys Ile Glu Leu Pro Ser Glu Asn Thr Glu Ser Leu Thr Asp Phe
515 520 525
Asn Val Asp Val Pro Val Tyr Glu Lys Gln Pro Ala Ile Lys Lys Ile
530 535 540
Phe Thr Asp Glu Asn Thr Ile Phe Gln Tyr Leu Tyr Ser Gln Thr Phe
545 550 555 560
Pro Leu Asp Ile Arg Asp Ile Ser Leu Thr Ser Ser Phe Asp Asp Ala
565 570 575
Leu Leu Phe Ser Asn Lys Val Tyr Ser Phe Phe Ser Met Asp Tyr Ile
580 585 590
Lys Thr Ala Asn Lys Val Val Glu Ala Gly Leu Phe Ala Gly Trp Val
595 600 605
Lys Gln Ile Val Asn Asp Phe Val Ile Glu Ala Asn Lys Ser Asn Thr
610 615 620
Met Asp Lys Ile Ala Asp Ile Ser Leu Ile Val Pro Tyr Ile Gly Leu
625 630 635 640
Ala Leu Asn Val Gly Asn Glu Thr Ala Lys Gly Asn Phe Glu Asn Ala
645 650 655
Phe Glu Ile Ala Gly Ala Ser Ile Leu Leu Glu Phe Ile Pro Glu Leu
660 665 670
Leu Ile Pro Val Val Gly Ala Phe Leu Leu Glu Ser Tyr Ile Asp Asn
675 680 685
Lys Asn Lys Ile Ile Lys Thr Ile Asp Asn Ala Leu Thr Lys Arg Asn
690 695 700
Glu Lys Trp Ser Asp Met Tyr Gly Leu Ile Val Ala Gln Trp Leu Ser
705 710 715 720
Thr Val Asn Thr Gln Phe Tyr Thr Ile Lys Glu Gly Met Tyr Lys Ala
725 730 735
Leu Asn Tyr Gln Ala Gln Ala Leu Glu Glu Ile Ile Lys Tyr Arg Tyr
740 745 750
Asn Ile Tyr Ser Glu Lys Glu Lys Ser Asn Ile Asn Ile Asp Phe Asn
755 760 765
Asp Ile Asn Ser Lys Leu Asn Glu Gly Ile Asn Gln Ala Ile Asp Asn
770 775 780
Ile Asn Asn Phe Ile Asn Gly Cys Ser Val Ser Tyr Leu Met Lys Lys
785 790 795 800
Met Ile Pro Leu Ala Val Glu Lys Leu Leu Asp Phe Asp Asn Thr Leu
805 810 815
Lys Lys Asn Leu Leu Asn Tyr Ile Asp Glu Asn Lys Leu Tyr Leu Ile
820 825 830
Gly Ser Ala Glu Tyr Glu Lys Ser Lys Val Asn Lys Tyr Leu Lys Thr
835 840 845
Ile Met Pro Phe Asp Leu Ser Ile Tyr Thr Asn Asp Thr Ile Leu Ile
850 855 860
Glu Met Phe Asn Lys Tyr Asn Ser Glu Ile Leu Glu His His His His
865 870 875 880
His His
<210> 11
<211> 3885
<212> DNA
<213> Clostridium botulinum
<400> 11
atggcaataa caattaacaa ctttaattat tcagatcctg ttgataataa aaatatttta 60
tatttagata ctcatttaaa tacattagct aatgagcctg aaaaagcctt tcgcattata 120
gggaatatat gggtaatacc cgatagattt tcaagagatt ctaatccaaa tttaaataaa 180
cctccacgag ttacaagccc taaaagtggt tattatgatc ctaattattt gagtactgat 240
tctgaaaaag atacattttt aaaagaaatt ataaagttat ttaaaagaat taactctaga 300
gaaataggag aagaattaat atatagactt gcaacagaca taccctttcc tgggaataac 360
aatactccaa ttaatacttt tgattttgat gtagatttta acagtgttga tgttaaaact 420
agacaaggta acaactgggt taaaactggt agtataaatc ctagtgttat aataactgga 480
cctagagaaa acattataga cccagaaact tctacgttta aattaactaa caatactttt 540
gcggcacaag aaggatttgg tgctttatca ataatttcaa tatcacctag atttatgcta 600
acatatagta atgcaactaa taatgtagga gagggtagat tttctaagtc tgaattttgc 660
atggatccaa tactaatttt aatgcatgaa cttaatcatg caatgcataa tttatatgga 720
atagctatac caaatgatca aagaatttca tctgtaacta gtaatatttt ttattctcaa 780
tataatgtga aattagagta tgcagaaata tatgcatttg gaggtccaac tatagacctt 840
attcctaaaa gtgcaaggaa atattttgag gaaaaggcat tggattatta tagatccata 900
gctaaaagac ttaatagtat aactactgca aatccttcaa gctttaataa atatatagga 960
gaatataaac agaaacttat tagaaagtat agattcgtag tagaatcttc aggtgaagtt 1020
gcagtagatc gtaataagtt tgctgagtta tataaagaac ttacacaaat atttacagaa 1080
tttaactacg ctaaaatata taatgtacaa aataggaaaa tatatctttc aaatgtatat 1140
actccggtta cggcaaatat attagacgat aatgtttatg atatacaaaa tggatttaac 1200
atacctaaaa gtaatttaaa tgtactattt atgggtcaaa atttatctcg aaatccagca 1260
ttaagaaaag tcaatcctga aaatatgctt tatttattta caaaattttg tcatagaggg 1320
ataataactt ctaaaactaa atcattagtt ccgcgtggat ccaaggcctt agattgtaga 1380
gagcttttag ttaaaaatac tgacttaccc tttataggtg atattagtga tatcaaaact 1440
gatatatttt taagcaaaga tattaatgaa gaaactgaag ttatagacta tccggacaat 1500
gtttcagtgg atcaagttat tctcagtaag aatacctcag aacatggaca actagattta 1560
ttatacccta ttattgaagg tgagagtcaa gtattaccgg gagagaatca agtcttttat 1620
gataatagaa ctcaaaatgt tgattatttg aattcttatt attacctaga atctcaaaaa 1680
ctaagtgata atgttgaaga ttttactttt acgacatcaa ttgaggaagc tttggataat 1740
agtggaaaag tatatactta ctttcctaaa ctagctgata aagtaaatac gggtgttcaa 1800
ggtggtttat ttttaatgtg ggcaaatgat gtagttgaag attttactac aaatattcta 1860
agaaaagata cattagataa aatatcagat gtatcagcta ttattcccta tataggacct 1920
gcattaaata taagtaattc tgtaagaagg ggaaatttta ctgaagcatt tgcagttacc 1980
ggtgtaacta ttttattaga agcgtttcaa gaatttacaa tacctgcact tggtgcattt 2040
gtgatttata gtaaggttca agaaagaaac gagattatta aaactataga taattgttta 2100
gaacaaagga ttaaaagatg gaaagattca tatgaatgga tgataggaac gtggttatcc 2160
aggattacta ctcaatttaa taatataagt tatcaaatgt atgattcttt aaattatcag 2220
gcagatgcaa tcaaagataa aatagattta gaatataaaa aatactcagg aagtgataaa 2280
gaaaatataa aaagtcaagt tgaaaattta aaaaatagtt tagatataaa aatctcggaa 2340
gcaatgaata atataaataa atttatacga gaatgttctg taacatactt atttaaaaat 2400
atgctcccta aagtaattga tgaattaaat aagtttgatt taaaaactaa aacagaatta 2460
attaatctta tagatagtca taatattatt ctagttggtg aagtagatag attaaaagca 2520
aaaataaatg agagttttga aaatacaata ccctttaata ttttttcata tactaataat 2580
tctttattaa aagatatact cgaggaatat ttcaatagta ttaatgattc aaaaattttg 2640
agcttacaaa acaaaaaaaa tgctttagtg gatacatcag gatataatgc agaagtgagg 2700
ctagaaggtg atgttcaagt taatacgata tatacaaatg attttaaatt aagtagttca 2760
ggagataaaa ttatagtaaa tttaaataat aatattttat atagcgctat ttatgagaac 2820
tctagtgtta gtttttggat taagatatct aaagatttaa ctaattctca taatgaatat 2880
actataatta atagtataaa acaaaattct gggtggaaat tatgtattag aaatggcaat 2940
atagaatgga ttttacaaga tattaataga aagtataaaa gtttaatttt tgattatagt 3000
gaatcattaa gtcatacagg atatacaaat aaatggtttt ttgttactat aactaataat 3060
ataatggggt atatgaaact ttatataaat ggagaattaa agcagagtga aagaattgaa 3120
gatttagatg aggttaagtt agataaaacc atagtatttg gaatagatga gaatatagat 3180
gagaatcaga tgctttggat tagagatttt aatatttttt ctaaagaatt aagcaatgaa 3240
gatattaata ttgtatatga gggacaaata ttaagaaatg ttattaaaga ttattgggga 3300
aatcctttga agtttgatac agaatattat atgattaatt ataattatat agataggtat 3360
atagcaccta aaaataatat acttgtactt gttcagtatt cagatatatc taaattatat 3420
actaaaaatc ctattactat taaatcagca gctaataaga atccttatag tagaatttta 3480
aatggagatg atataatgtt tcatatgtta tatgatagta gggaatatat gataataaga 3540
gatactgata caatatatgc aacacaagga ggacagtgtt caaaaaattg tgtatatgca 3600
ttaaaattac agagtaattt aggtaattat ggtataggta tatttagtat aaaaaatatt 3660
gtatctcaaa ataaatattg tagtcaaatt ttctctagtt ttatgaaaaa tacaatgctt 3720
ctagcagata tatataaacc ttggagattt tcttttgaaa atgcatacac gccagttgca 3780
gtaactaatt atgagacaaa actattatca acttcatctt tttggaaatt tatttctagg 3840
gatccaggat gggtagagct cgagcaccac caccaccacc actaa 3885
<210> 12
<211> 1294
<212> PRT
<213> Clostridium botulinum
<400> 12
Met Ala Ile Thr Ile Asn Asn Phe Asn Tyr Ser Asp Pro Val Asp Asn
1 5 10 15
Lys Asn Ile Leu Tyr Leu Asp Thr His Leu Asn Thr Leu Ala Asn Glu
20 25 30
Pro Glu Lys Ala Phe Arg Ile Ile Gly Asn Ile Trp Val Ile Pro Asp
35 40 45
Arg Phe Ser Arg Asp Ser Asn Pro Asn Leu Asn Lys Pro Pro Arg Val
50 55 60
Thr Ser Pro Lys Ser Gly Tyr Tyr Asp Pro Asn Tyr Leu Ser Thr Asp
65 70 75 80
Ser Glu Lys Asp Thr Phe Leu Lys Glu Ile Ile Lys Leu Phe Lys Arg
85 90 95
Ile Asn Ser Arg Glu Ile Gly Glu Glu Leu Ile Tyr Arg Leu Ala Thr
100 105 110
Asp Ile Pro Phe Pro Gly Asn Asn Asn Thr Pro Ile Asn Thr Phe Asp
115 120 125
Phe Asp Val Asp Phe Asn Ser Val Asp Val Lys Thr Arg Gln Gly Asn
130 135 140
Asn Trp Val Lys Thr Gly Ser Ile Asn Pro Ser Val Ile Ile Thr Gly
145 150 155 160
Pro Arg Glu Asn Ile Ile Asp Pro Glu Thr Ser Thr Phe Lys Leu Thr
165 170 175
Asn Asn Thr Phe Ala Ala Gln Glu Gly Phe Gly Ala Leu Ser Ile Ile
180 185 190
Ser Ile Ser Pro Arg Phe Met Leu Thr Tyr Ser Asn Ala Thr Asn Asn
195 200 205
Val Gly Glu Gly Arg Phe Ser Lys Ser Glu Phe Cys Met Asp Pro Ile
210 215 220
Leu Ile Leu Met His Glu Leu Asn His Ala Met His Asn Leu Tyr Gly
225 230 235 240
Ile Ala Ile Pro Asn Asp Gln Arg Ile Ser Ser Val Thr Ser Asn Ile
245 250 255
Phe Tyr Ser Gln Tyr Asn Val Lys Leu Glu Tyr Ala Glu Ile Tyr Ala
260 265 270
Phe Gly Gly Pro Thr Ile Asp Leu Ile Pro Lys Ser Ala Arg Lys Tyr
275 280 285
Phe Glu Glu Lys Ala Leu Asp Tyr Tyr Arg Ser Ile Ala Lys Arg Leu
290 295 300
Asn Ser Ile Thr Thr Ala Asn Pro Ser Ser Phe Asn Lys Tyr Ile Gly
305 310 315 320
Glu Tyr Lys Gln Lys Leu Ile Arg Lys Tyr Arg Phe Val Val Glu Ser
325 330 335
Ser Gly Glu Val Ala Val Asp Arg Asn Lys Phe Ala Glu Leu Tyr Lys
340 345 350
Glu Leu Thr Gln Ile Phe Thr Glu Phe Asn Tyr Ala Lys Ile Tyr Asn
355 360 365
Val Gln Asn Arg Lys Ile Tyr Leu Ser Asn Val Tyr Thr Pro Val Thr
370 375 380
Ala Asn Ile Leu Asp Asp Asn Val Tyr Asp Ile Gln Asn Gly Phe Asn
385 390 395 400
Ile Pro Lys Ser Asn Leu Asn Val Leu Phe Met Gly Gln Asn Leu Ser
405 410 415
Arg Asn Pro Ala Leu Arg Lys Val Asn Pro Glu Asn Met Leu Tyr Leu
420 425 430
Phe Thr Lys Phe Cys His Arg Gly Ile Ile Thr Ser Lys Thr Lys Ser
435 440 445
Leu Val Pro Arg Gly Ser Lys Ala Leu Asp Cys Arg Glu Leu Leu Val
450 455 460
Lys Asn Thr Asp Leu Pro Phe Ile Gly Asp Ile Ser Asp Ile Lys Thr
465 470 475 480
Asp Ile Phe Leu Ser Lys Asp Ile Asn Glu Glu Thr Glu Val Ile Asp
485 490 495
Tyr Pro Asp Asn Val Ser Val Asp Gln Val Ile Leu Ser Lys Asn Thr
500 505 510
Ser Glu His Gly Gln Leu Asp Leu Leu Tyr Pro Ile Ile Glu Gly Glu
515 520 525
Ser Gln Val Leu Pro Gly Glu Asn Gln Val Phe Tyr Asp Asn Arg Thr
530 535 540
Gln Asn Val Asp Tyr Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys
545 550 555 560
Leu Ser Asp Asn Val Glu Asp Phe Thr Phe Thr Thr Ser Ile Glu Glu
565 570 575
Ala Leu Asp Asn Ser Gly Lys Val Tyr Thr Tyr Phe Pro Lys Leu Ala
580 585 590
Asp Lys Val Asn Thr Gly Val Gln Gly Gly Leu Phe Leu Met Trp Ala
595 600 605
Asn Asp Val Val Glu Asp Phe Thr Thr Asn Ile Leu Arg Lys Asp Thr
610 615 620
Leu Asp Lys Ile Ser Asp Val Ser Ala Ile Ile Pro Tyr Ile Gly Pro
625 630 635 640
Ala Leu Asn Ile Ser Asn Ser Val Arg Arg Gly Asn Phe Thr Glu Ala
645 650 655
Phe Ala Val Thr Gly Val Thr Ile Leu Leu Glu Ala Phe Gln Glu Phe
660 665 670
Thr Ile Pro Ala Leu Gly Ala Phe Val Ile Tyr Ser Lys Val Gln Glu
675 680 685
Arg Asn Glu Ile Ile Lys Thr Ile Asp Asn Cys Leu Glu Gln Arg Ile
690 695 700
Lys Arg Trp Lys Asp Ser Tyr Glu Trp Met Ile Gly Thr Trp Leu Ser
705 710 715 720
Arg Ile Thr Thr Gln Phe Asn Asn Ile Ser Tyr Gln Met Tyr Asp Ser
725 730 735
Leu Asn Tyr Gln Ala Asp Ala Ile Lys Asp Lys Ile Asp Leu Glu Tyr
740 745 750
Lys Lys Tyr Ser Gly Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu
755 760 765
Asn Leu Lys Asn Ser Leu Asp Ile Lys Ile Ser Glu Ala Met Asn Asn
770 775 780
Ile Asn Lys Phe Ile Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn
785 790 795 800
Met Leu Pro Lys Val Ile Asp Glu Leu Asn Lys Phe Asp Leu Lys Thr
805 810 815
Lys Thr Glu Leu Ile Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val
820 825 830
Gly Glu Val Asp Arg Leu Lys Ala Lys Ile Asn Glu Ser Phe Glu Asn
835 840 845
Thr Ile Pro Phe Asn Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys
850 855 860
Asp Ile Leu Glu Glu Tyr Phe Asn Ser Ile Asn Asp Ser Lys Ile Leu
865 870 875 880
Ser Leu Gln Asn Lys Lys Asn Ala Leu Val Asp Thr Ser Gly Tyr Asn
885 890 895
Ala Glu Val Arg Leu Glu Gly Asp Val Gln Val Asn Thr Ile Tyr Thr
900 905 910
Asn Asp Phe Lys Leu Ser Ser Ser Gly Asp Lys Ile Ile Val Asn Leu
915 920 925
Asn Asn Asn Ile Leu Tyr Ser Ala Ile Tyr Glu Asn Ser Ser Val Ser
930 935 940
Phe Trp Ile Lys Ile Ser Lys Asp Leu Thr Asn Ser His Asn Glu Tyr
945 950 955 960
Thr Ile Ile Asn Ser Ile Lys Gln Asn Ser Gly Trp Lys Leu Cys Ile
965 970 975
Arg Asn Gly Asn Ile Glu Trp Ile Leu Gln Asp Ile Asn Arg Lys Tyr
980 985 990
Lys Ser Leu Ile Phe Asp Tyr Ser Glu Ser Leu Ser His Thr Gly Tyr
995 1000 1005
Thr Asn Lys Trp Phe Phe Val Thr Ile Thr Asn Asn Ile Met Gly
1010 1015 1020
Tyr Met Lys Leu Tyr Ile Asn Gly Glu Leu Lys Gln Ser Glu Arg
1025 1030 1035
Ile Glu Asp Leu Asp Glu Val Lys Leu Asp Lys Thr Ile Val Phe
1040 1045 1050
Gly Ile Asp Glu Asn Ile Asp Glu Asn Gln Met Leu Trp Ile Arg
1055 1060 1065
Asp Phe Asn Ile Phe Ser Lys Glu Leu Ser Asn Glu Asp Ile Asn
1070 1075 1080
Ile Val Tyr Glu Gly Gln Ile Leu Arg Asn Val Ile Lys Asp Tyr
1085 1090 1095
Trp Gly Asn Pro Leu Lys Phe Asp Thr Glu Tyr Tyr Met Ile Asn
1100 1105 1110
Tyr Asn Tyr Ile Asp Arg Tyr Ile Ala Pro Lys Asn Asn Ile Leu
1115 1120 1125
Val Leu Val Gln Tyr Ser Asp Ile Ser Lys Leu Tyr Thr Lys Asn
1130 1135 1140
Pro Ile Thr Ile Lys Ser Ala Ala Asn Lys Asn Pro Tyr Ser Arg
1145 1150 1155
Ile Leu Asn Gly Asp Asp Ile Met Phe His Met Leu Tyr Asp Ser
1160 1165 1170
Arg Glu Tyr Met Ile Ile Arg Asp Thr Asp Thr Ile Tyr Ala Thr
1175 1180 1185
Gln Gly Gly Gln Cys Ser Lys Asn Cys Val Tyr Ala Leu Lys Leu
1190 1195 1200
Gln Ser Asn Leu Gly Asn Tyr Gly Ile Gly Ile Phe Ser Ile Lys
1205 1210 1215
Asn Ile Val Ser Gln Asn Lys Tyr Cys Ser Gln Ile Phe Ser Ser
1220 1225 1230
Phe Met Lys Asn Thr Met Leu Leu Ala Asp Ile Tyr Lys Pro Trp
1235 1240 1245
Arg Phe Ser Phe Glu Asn Ala Tyr Thr Pro Val Ala Val Thr Asn
1250 1255 1260
Tyr Glu Thr Lys Leu Leu Ser Thr Ser Ser Phe Trp Lys Phe Ile
1265 1270 1275
Ser Arg Asp Pro Gly Trp Val Glu Leu Glu His His His His His
1280 1285 1290
His
<210> 13
<211> 2625
<212> DNA
<213> Clostridium botulinum
<400> 13
atggcaataa caattaacaa ctttaattat tcagatcctg ttgataataa aaatatttta 60
tatttagata ctcatttaaa tacattagct aatgagcctg aaaaagcctt tcgcattata 120
gggaatatat gggtaatacc cgatagattt tcaagagatt ctaatccaaa tttaaataaa 180
cctccacgag ttacaagccc taaaagtggt tattatgatc ctaattattt gagtactgat 240
tctgaaaaag atacattttt aaaagaaatt ataaagttat ttaaaagaat taactctaga 300
gaaataggag aagaattaat atatagactt gcaacagaca taccctttcc tgggaataac 360
aatactccaa ttaatacttt tgattttgat gtagatttta acagtgttga tgttaaaact 420
agacaaggta acaactgggt taaaactggt agtataaatc ctagtgttat aataactgga 480
cctagagaaa acattataga cccagaaact tctacgttta aattaactaa caatactttt 540
gcggcacaag aaggatttgg tgctttatca ataatttcaa tatcacctag atttatgcta 600
acatatagta atgcaactaa taatgtagga gagggtagat tttctaagtc tgaattttgc 660
atggatccaa tactaatttt aatgcatgaa cttaatcatg caatgcataa tttatatgga 720
atagctatac caaatgatca aagaatttca tctgtaacta gtaatatttt ttattctcaa 780
tataatgtga aattagagta tgcagaaata tatgcatttg gaggtccaac tatagacctt 840
attcctaaaa gtgcaaggaa atattttgag gaaaaggcat tggattatta tagatccata 900
gctaaaagac ttaatagtat aactactgca aatccttcaa gctttaataa atatatagga 960
gaatataaac agaaacttat tagaaagtat agattcgtag tagaatcttc aggtgaagtt 1020
gcagtagatc gtaataagtt tgctgagtta tataaagaac ttacacaaat atttacagaa 1080
tttaactacg ctaaaatata taatgtacaa aataggaaaa tatatctttc aaatgtatat 1140
actccggtta cggcaaatat attagacgat aatgtttatg atatacaaaa tggatttaac 1200
atacctaaaa gtaatttaaa tgtactattt atgggtcaaa atttatctcg aaatccagca 1260
ttaagaaaag tcaatcctga aaatatgctt tatttattta caaaattttg tcatagaggg 1320
ataataactt ctaaaactaa atcattagtt ccgcgtggat ccaaggcctt agattgtaga 1380
gagcttttag ttaaaaatac tgacttaccc tttataggtg atattagtga tatcaaaact 1440
gatatatttt taagcaaaga tattaatgaa gaaactgaag ttatagacta tccggacaat 1500
gtttcagtgg atcaagttat tctcagtaag aatacctcag aacatggaca actagattta 1560
ttatacccta ttattgaagg tgagagtcaa gtattaccgg gagagaatca agtcttttat 1620
gataatagaa ctcaaaatgt tgattatttg aattcttatt attacctaga atctcaaaaa 1680
ctaagtgata atgttgaaga ttttactttt acgacatcaa ttgaggaagc tttggataat 1740
agtggaaaag tatatactta ctttcctaaa ctagctgata aagtaaatac gggtgttcaa 1800
ggtggtttat ttttaatgtg ggcaaatgat gtagttgaag attttactac aaatattcta 1860
agaaaagata cattagataa aatatcagat gtatcagcta ttattcccta tataggacct 1920
gcattaaata taagtaattc tgtaagaagg ggaaatttta ctgaagcatt tgcagttacc 1980
ggtgtaacta ttttattaga agcgtttcaa gaatttacaa tacctgcact tggtgcattt 2040
gtgatttata gtaaggttca agaaagaaac gagattatta aaactataga taattgttta 2100
gaacaaagga ttaaaagatg gaaagattca tatgaatgga tgataggaac gtggttatcc 2160
aggattacta ctcaatttaa taatataagt tatcaaatgt atgattcttt aaattatcag 2220
gcagatgcaa tcaaagataa aatagattta gaatataaaa aatactcagg aagtgataaa 2280
gaaaatataa aaagtcaagt tgaaaattta aaaaatagtt tagatataaa aatctcggaa 2340
gcaatgaata atataaataa atttatacga gaatgttctg taacatactt atttaaaaat 2400
atgctcccta aagtaattga tgaattaaat aagtttgatt taaaaactaa aacagaatta 2460
attaatctta tagatagtca taatattatt ctagttggtg aagtagatag attaaaagca 2520
aaaataaatg agagttttga aaatacaata ccctttaata ttttttcata tactaataat 2580
tctttattaa aagatatact cgagcaccac caccaccacc actaa 2625
<210> 14
<211> 874
<212> PRT
<213> Clostridium botulinum
<400> 14
Met Ala Ile Thr Ile Asn Asn Phe Asn Tyr Ser Asp Pro Val Asp Asn
1 5 10 15
Lys Asn Ile Leu Tyr Leu Asp Thr His Leu Asn Thr Leu Ala Asn Glu
20 25 30
Pro Glu Lys Ala Phe Arg Ile Ile Gly Asn Ile Trp Val Ile Pro Asp
35 40 45
Arg Phe Ser Arg Asp Ser Asn Pro Asn Leu Asn Lys Pro Pro Arg Val
50 55 60
Thr Ser Pro Lys Ser Gly Tyr Tyr Asp Pro Asn Tyr Leu Ser Thr Asp
65 70 75 80
Ser Glu Lys Asp Thr Phe Leu Lys Glu Ile Ile Lys Leu Phe Lys Arg
85 90 95
Ile Asn Ser Arg Glu Ile Gly Glu Glu Leu Ile Tyr Arg Leu Ala Thr
100 105 110
Asp Ile Pro Phe Pro Gly Asn Asn Asn Thr Pro Ile Asn Thr Phe Asp
115 120 125
Phe Asp Val Asp Phe Asn Ser Val Asp Val Lys Thr Arg Gln Gly Asn
130 135 140
Asn Trp Val Lys Thr Gly Ser Ile Asn Pro Ser Val Ile Ile Thr Gly
145 150 155 160
Pro Arg Glu Asn Ile Ile Asp Pro Glu Thr Ser Thr Phe Lys Leu Thr
165 170 175
Asn Asn Thr Phe Ala Ala Gln Glu Gly Phe Gly Ala Leu Ser Ile Ile
180 185 190
Ser Ile Ser Pro Arg Phe Met Leu Thr Tyr Ser Asn Ala Thr Asn Asn
195 200 205
Val Gly Glu Gly Arg Phe Ser Lys Ser Glu Phe Cys Met Asp Pro Ile
210 215 220
Leu Ile Leu Met His Glu Leu Asn His Ala Met His Asn Leu Tyr Gly
225 230 235 240
Ile Ala Ile Pro Asn Asp Gln Arg Ile Ser Ser Val Thr Ser Asn Ile
245 250 255
Phe Tyr Ser Gln Tyr Asn Val Lys Leu Glu Tyr Ala Glu Ile Tyr Ala
260 265 270
Phe Gly Gly Pro Thr Ile Asp Leu Ile Pro Lys Ser Ala Arg Lys Tyr
275 280 285
Phe Glu Glu Lys Ala Leu Asp Tyr Tyr Arg Ser Ile Ala Lys Arg Leu
290 295 300
Asn Ser Ile Thr Thr Ala Asn Pro Ser Ser Phe Asn Lys Tyr Ile Gly
305 310 315 320
Glu Tyr Lys Gln Lys Leu Ile Arg Lys Tyr Arg Phe Val Val Glu Ser
325 330 335
Ser Gly Glu Val Ala Val Asp Arg Asn Lys Phe Ala Glu Leu Tyr Lys
340 345 350
Glu Leu Thr Gln Ile Phe Thr Glu Phe Asn Tyr Ala Lys Ile Tyr Asn
355 360 365
Val Gln Asn Arg Lys Ile Tyr Leu Ser Asn Val Tyr Thr Pro Val Thr
370 375 380
Ala Asn Ile Leu Asp Asp Asn Val Tyr Asp Ile Gln Asn Gly Phe Asn
385 390 395 400
Ile Pro Lys Ser Asn Leu Asn Val Leu Phe Met Gly Gln Asn Leu Ser
405 410 415
Arg Asn Pro Ala Leu Arg Lys Val Asn Pro Glu Asn Met Leu Tyr Leu
420 425 430
Phe Thr Lys Phe Cys His Arg Gly Ile Ile Thr Ser Lys Thr Lys Ser
435 440 445
Leu Val Pro Arg Gly Ser Lys Ala Leu Asp Cys Arg Glu Leu Leu Val
450 455 460
Lys Asn Thr Asp Leu Pro Phe Ile Gly Asp Ile Ser Asp Ile Lys Thr
465 470 475 480
Asp Ile Phe Leu Ser Lys Asp Ile Asn Glu Glu Thr Glu Val Ile Asp
485 490 495
Tyr Pro Asp Asn Val Ser Val Asp Gln Val Ile Leu Ser Lys Asn Thr
500 505 510
Ser Glu His Gly Gln Leu Asp Leu Leu Tyr Pro Ile Ile Glu Gly Glu
515 520 525
Ser Gln Val Leu Pro Gly Glu Asn Gln Val Phe Tyr Asp Asn Arg Thr
530 535 540
Gln Asn Val Asp Tyr Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys
545 550 555 560
Leu Ser Asp Asn Val Glu Asp Phe Thr Phe Thr Thr Ser Ile Glu Glu
565 570 575
Ala Leu Asp Asn Ser Gly Lys Val Tyr Thr Tyr Phe Pro Lys Leu Ala
580 585 590
Asp Lys Val Asn Thr Gly Val Gln Gly Gly Leu Phe Leu Met Trp Ala
595 600 605
Asn Asp Val Val Glu Asp Phe Thr Thr Asn Ile Leu Arg Lys Asp Thr
610 615 620
Leu Asp Lys Ile Ser Asp Val Ser Ala Ile Ile Pro Tyr Ile Gly Pro
625 630 635 640
Ala Leu Asn Ile Ser Asn Ser Val Arg Arg Gly Asn Phe Thr Glu Ala
645 650 655
Phe Ala Val Thr Gly Val Thr Ile Leu Leu Glu Ala Phe Gln Glu Phe
660 665 670
Thr Ile Pro Ala Leu Gly Ala Phe Val Ile Tyr Ser Lys Val Gln Glu
675 680 685
Arg Asn Glu Ile Ile Lys Thr Ile Asp Asn Cys Leu Glu Gln Arg Ile
690 695 700
Lys Arg Trp Lys Asp Ser Tyr Glu Trp Met Ile Gly Thr Trp Leu Ser
705 710 715 720
Arg Ile Thr Thr Gln Phe Asn Asn Ile Ser Tyr Gln Met Tyr Asp Ser
725 730 735
Leu Asn Tyr Gln Ala Asp Ala Ile Lys Asp Lys Ile Asp Leu Glu Tyr
740 745 750
Lys Lys Tyr Ser Gly Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu
755 760 765
Asn Leu Lys Asn Ser Leu Asp Ile Lys Ile Ser Glu Ala Met Asn Asn
770 775 780
Ile Asn Lys Phe Ile Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn
785 790 795 800
Met Leu Pro Lys Val Ile Asp Glu Leu Asn Lys Phe Asp Leu Lys Thr
805 810 815
Lys Thr Glu Leu Ile Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val
820 825 830
Gly Glu Val Asp Arg Leu Lys Ala Lys Ile Asn Glu Ser Phe Glu Asn
835 840 845
Thr Ile Pro Phe Asn Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys
850 855 860
Asp Ile Leu Glu His His His His His His
865 870
<210> 15
<211> 3810
<212> DNA
<213> Clostridium botulinum
<400> 15
atggcaacaa ttaatagttt taattataat gatcctgtta ataatagaac aattttatat 60
attaaaccag gcggttgtca acaattttat aaatcattta atattatgaa aaatatttgg 120
ataattccag agagaaatgt aattggtaca attccccaag attttcttcc gcctacttca 180
ttgaaaaatg gagatagtag ttattatgac cctaattatt tacaaagtga tcaagaaaag 240
gataaatttt taaaaatagt cacaaaaata tttaatagaa taaatgataa tctttcagga 300
aggattttat tagaagaact gtcaaaagct aatccatatt taggaaatga taatactcca 360
gatggtgact tcattattaa tgatgcatca gcagttccaa ttcaattctc aaatggtagc 420
caaagcatac tattacctaa tgttattata atgggagcag agcctgattt atttgaaact 480
aacagttcca atatttctct aagaaataat tatatgccaa gcaatcacgg ttttggatca 540
atagctatag taacattctc acctgaatat tcttttagat ttaaagataa tagtatgaat 600
gaatttattc aagatcctgc tcttacatta atgcatgaat taatacattc attacatgga 660
ctatatgggg ctaaagggat tactacaaag tatactataa cacaaaaaca aaatccccta 720
ataacaaata taagaggtac aaatattgaa gaattcttaa cttttggagg tactgattta 780
aacattatta ctagtgctca gtccaatgat atctatacta atcttctagc tgattataaa 840
aaaatagcgt ctaaacttag caaagtacaa gtatctaatc cactacttaa tccttataaa 900
gatgtttttg aagcaaagta tggattagat aaagatgcta gcggaattta ttcggtaaat 960
ataaacaaat ttaatgatat ttttaaaaaa ttatacagct ttacggaatt tgatttagca 1020
actaaatttc aagttaaatg taggcaaact tatattggac agtataaata cttcaaactt 1080
tcaaacttgt taaatgattc tatttataat atatcagaag gctataatat aaataattta 1140
aaggtaaatt ttagaggaca gaatgcaaat ttaaatccta gaattattac accaattaca 1200
ggtagaggac tagtaaaaaa aatcattaga ttttgtaaaa gtgggataat aacttctaaa 1260
actaaatcat tggttccacg tggatccaag gcctcaatat gtatcgaaat aaataatggt 1320
gagttatttt ttgtggcttc cgagaatagt tataatgatg ataatataaa tactcctaaa 1380
gaaattgacg atacagtaac ttcaaataat aattatgaaa atgatttaga tcaggttatt 1440
ttaaatttta atagtgaatc agcacctgga ctttcagatg aaaaattaaa tttaactatc 1500
caaaatgatg cttatatacc aaaatatgat tctaatggaa caagtgatat agaacaacat 1560
gatgttaatg aacttaatgt atttttctat ttagatgcac agaaagtgcc cgaaggtgaa 1620
aataatgtca atctcacctc ttcaattgat acagcattat tagaacaacc taaaatatat 1680
acattttttt catcagaatt tattaataat gtcaataaac ctgtgcaagc agcattattt 1740
gtaggctgga tacaacaagt attagtagat tttactactg aagctaacca aaaaagtact 1800
gttgataaaa ttgcagatat ttctatagtt gttccatata taggtcttgc tttaaatata 1860
ggaaatgaag cacaaaaagg aaattttaaa gatgcacttg aattattagg agcaggtatt 1920
ttattagaat ttgaacccga gcttttaatt cctacaattt tagtattcac gataaaatct 1980
tttttaggtt catctgataa taaaaataaa gttattaaag caataaataa tgcattgaaa 2040
gaaagagatg aaaaatggaa agaagtatat agttttatag tatcgaattg gatgactaaa 2100
attaatacac aatttaataa aagaaaagaa caaatgtatc aagctttaca aaatcaagta 2160
aatgcactta aagcaataat agaatctaag tataatagtt atactttaga agaaaaaaat 2220
gagcttacaa ataaatatga tattgagcaa atagaaaatg aacttaatca aaaggtttct 2280
atagcaatga ataatataga caggttctta actgaaagtt ctatatctta tttaatgaaa 2340
ttaataaatg aagtaaaaat taataaatta agagaatatg atgaaaatgt taaaacgtat 2400
ttattagatt atattataaa acatggatca atcttgggag agagtcagca agaactaaat 2460
tctatggtaa ttgataccct aaataatagt attcctttta agctttcttc ttatacagat 2520
gataaaattt taatttcata ttttaataag ttctttaaga gaattaaaag tagttctgtt 2580
ttaaatatga gatataaaaa tgataaatac gtagatactt caggatatga ttcaaatata 2640
aatattaatg gagatgtata taaatatcca actaataaaa atcaatttgg aatatataat 2700
gataaactta gtgaagttaa tatatctcaa aatgattaca ttatatatga taataaatat 2760
aaaaatttta gtattagttt ttgggtaaga attcctaact atgataataa gatagtaaat 2820
gttaataatg aatacactat aataaattgt atgagggata ataattcagg atggaaagta 2880
tctcttaatc ataatgaaat aatttggaca ttgcaagata attcaggaat taatcaaaaa 2940
ttagcattta actatggtaa cgcaaatggt atttctgatt atataaataa gtggattttt 3000
gtaactataa ctaatgatag attaggagat tctaaacttt atattaatgg aaatttaata 3060
gataaaaaat caattttaaa tttaggtaat attcatgtta gtgacaatat attatttaaa 3120
atagttaatt gtagttatac aagatatatt ggtattagat attttaatat ttttgataaa 3180
gaattagatg aaacagaaat tcaaacttta tataacaatg agcctaatgc aaatatttta 3240
aaggattttt ggggaaatta tttgctttat gacaaagaat attatttatt aaatgtgtta 3300
aaaccaaata actttattaa taggagaaca gattctactt taagcattaa taatataaga 3360
agcactattc ttttagctaa tagattatat agtggaataa aagttaaaat acaaagagtt 3420
aataatagta gtactaacga taatcttgtt agaaagaatg atcaggtata tattaatttt 3480
gtagccagca aaactcactt acttccatta tatgctgata cagctaccac aaataaagag 3540
aaaacaataa aaatatcatc atctggcaat agatttaatc aagtagtagt tatgaattca 3600
gtaggaaata attgtacaat gaattttaaa aataataatg gaaataatat tgggttgtta 3660
ggtttcaagg cagatactgt agttgctagt acttggtatt atacacatat gagagataat 3720
acaaacagca atggattttt ttggaacttt atttctgaag aacatggatg gcaagaaaaa 3780
acgcgttctc accaccacca ccaccactaa 3810
<210> 16
<211> 1269
<212> PRT
<213> Clostridium botulinum
<400> 16
Met Ala Thr Ile Asn Ser Phe Asn Tyr Asn Asp Pro Val Asn Asn Arg
1 5 10 15
Thr Ile Leu Tyr Ile Lys Pro Gly Gly Cys Gln Gln Phe Tyr Lys Ser
20 25 30
Phe Asn Ile Met Lys Asn Ile Trp Ile Ile Pro Glu Arg Asn Val Ile
35 40 45
Gly Thr Ile Pro Gln Asp Phe Leu Pro Pro Thr Ser Leu Lys Asn Gly
50 55 60
Asp Ser Ser Tyr Tyr Asp Pro Asn Tyr Leu Gln Ser Asp Gln Glu Lys
65 70 75 80
Asp Lys Phe Leu Lys Ile Val Thr Lys Ile Phe Asn Arg Ile Asn Asp
85 90 95
Asn Leu Ser Gly Arg Ile Leu Leu Glu Glu Leu Ser Lys Ala Asn Pro
100 105 110
Tyr Leu Gly Asn Asp Asn Thr Pro Asp Gly Asp Phe Ile Ile Asn Asp
115 120 125
Ala Ser Ala Val Pro Ile Gln Phe Ser Asn Gly Ser Gln Ser Ile Leu
130 135 140
Leu Pro Asn Val Ile Ile Met Gly Ala Glu Pro Asp Leu Phe Glu Thr
145 150 155 160
Asn Ser Ser Asn Ile Ser Leu Arg Asn Asn Tyr Met Pro Ser Asn His
165 170 175
Gly Phe Gly Ser Ile Ala Ile Val Thr Phe Ser Pro Glu Tyr Ser Phe
180 185 190
Arg Phe Lys Asp Asn Ser Met Asn Glu Phe Ile Gln Asp Pro Ala Leu
195 200 205
Thr Leu Met His Glu Leu Ile His Ser Leu His Gly Leu Tyr Gly Ala
210 215 220
Lys Gly Ile Thr Thr Lys Tyr Thr Ile Thr Gln Lys Gln Asn Pro Leu
225 230 235 240
Ile Thr Asn Ile Arg Gly Thr Asn Ile Glu Glu Phe Leu Thr Phe Gly
245 250 255
Gly Thr Asp Leu Asn Ile Ile Thr Ser Ala Gln Ser Asn Asp Ile Tyr
260 265 270
Thr Asn Leu Leu Ala Asp Tyr Lys Lys Ile Ala Ser Lys Leu Ser Lys
275 280 285
Val Gln Val Ser Asn Pro Leu Leu Asn Pro Tyr Lys Asp Val Phe Glu
290 295 300
Ala Lys Tyr Gly Leu Asp Lys Asp Ala Ser Gly Ile Tyr Ser Val Asn
305 310 315 320
Ile Asn Lys Phe Asn Asp Ile Phe Lys Lys Leu Tyr Ser Phe Thr Glu
325 330 335
Phe Asp Leu Ala Thr Lys Phe Gln Val Lys Cys Arg Gln Thr Tyr Ile
340 345 350
Gly Gln Tyr Lys Tyr Phe Lys Leu Ser Asn Leu Leu Asn Asp Ser Ile
355 360 365
Tyr Asn Ile Ser Glu Gly Tyr Asn Ile Asn Asn Leu Lys Val Asn Phe
370 375 380
Arg Gly Gln Asn Ala Asn Leu Asn Pro Arg Ile Ile Thr Pro Ile Thr
385 390 395 400
Gly Arg Gly Leu Val Lys Lys Ile Ile Arg Phe Cys Lys Ser Gly Ile
405 410 415
Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys Ala Ser
420 425 430
Ile Cys Ile Glu Ile Asn Asn Gly Glu Leu Phe Phe Val Ala Ser Glu
435 440 445
Asn Ser Tyr Asn Asp Asp Asn Ile Asn Thr Pro Lys Glu Ile Asp Asp
450 455 460
Thr Val Thr Ser Asn Asn Asn Tyr Glu Asn Asp Leu Asp Gln Val Ile
465 470 475 480
Leu Asn Phe Asn Ser Glu Ser Ala Pro Gly Leu Ser Asp Glu Lys Leu
485 490 495
Asn Leu Thr Ile Gln Asn Asp Ala Tyr Ile Pro Lys Tyr Asp Ser Asn
500 505 510
Gly Thr Ser Asp Ile Glu Gln His Asp Val Asn Glu Leu Asn Val Phe
515 520 525
Phe Tyr Leu Asp Ala Gln Lys Val Pro Glu Gly Glu Asn Asn Val Asn
530 535 540
Leu Thr Ser Ser Ile Asp Thr Ala Leu Leu Glu Gln Pro Lys Ile Tyr
545 550 555 560
Thr Phe Phe Ser Ser Glu Phe Ile Asn Asn Val Asn Lys Pro Val Gln
565 570 575
Ala Ala Leu Phe Val Gly Trp Ile Gln Gln Val Leu Val Asp Phe Thr
580 585 590
Thr Glu Ala Asn Gln Lys Ser Thr Val Asp Lys Ile Ala Asp Ile Ser
595 600 605
Ile Val Val Pro Tyr Ile Gly Leu Ala Leu Asn Ile Gly Asn Glu Ala
610 615 620
Gln Lys Gly Asn Phe Lys Asp Ala Leu Glu Leu Leu Gly Ala Gly Ile
625 630 635 640
Leu Leu Glu Phe Glu Pro Glu Leu Leu Ile Pro Thr Ile Leu Val Phe
645 650 655
Thr Ile Lys Ser Phe Leu Gly Ser Ser Asp Asn Lys Asn Lys Val Ile
660 665 670
Lys Ala Ile Asn Asn Ala Leu Lys Glu Arg Asp Glu Lys Trp Lys Glu
675 680 685
Val Tyr Ser Phe Ile Val Ser Asn Trp Met Thr Lys Ile Asn Thr Gln
690 695 700
Phe Asn Lys Arg Lys Glu Gln Met Tyr Gln Ala Leu Gln Asn Gln Val
705 710 715 720
Asn Ala Leu Lys Ala Ile Ile Glu Ser Lys Tyr Asn Ser Tyr Thr Leu
725 730 735
Glu Glu Lys Asn Glu Leu Thr Asn Lys Tyr Asp Ile Glu Gln Ile Glu
740 745 750
Asn Glu Leu Asn Gln Lys Val Ser Ile Ala Met Asn Asn Ile Asp Arg
755 760 765
Phe Leu Thr Glu Ser Ser Ile Ser Tyr Leu Met Lys Leu Ile Asn Glu
770 775 780
Val Lys Ile Asn Lys Leu Arg Glu Tyr Asp Glu Asn Val Lys Thr Tyr
785 790 795 800
Leu Leu Asp Tyr Ile Ile Lys His Gly Ser Ile Leu Gly Glu Ser Gln
805 810 815
Gln Glu Leu Asn Ser Met Val Ile Asp Thr Leu Asn Asn Ser Ile Pro
820 825 830
Phe Lys Leu Ser Ser Tyr Thr Asp Asp Lys Ile Leu Ile Ser Tyr Phe
835 840 845
Asn Lys Phe Phe Lys Arg Ile Lys Ser Ser Ser Val Leu Asn Met Arg
850 855 860
Tyr Lys Asn Asp Lys Tyr Val Asp Thr Ser Gly Tyr Asp Ser Asn Ile
865 870 875 880
Asn Ile Asn Gly Asp Val Tyr Lys Tyr Pro Thr Asn Lys Asn Gln Phe
885 890 895
Gly Ile Tyr Asn Asp Lys Leu Ser Glu Val Asn Ile Ser Gln Asn Asp
900 905 910
Tyr Ile Ile Tyr Asp Asn Lys Tyr Lys Asn Phe Ser Ile Ser Phe Trp
915 920 925
Val Arg Ile Pro Asn Tyr Asp Asn Lys Ile Val Asn Val Asn Asn Glu
930 935 940
Tyr Thr Ile Ile Asn Cys Met Arg Asp Asn Asn Ser Gly Trp Lys Val
945 950 955 960
Ser Leu Asn His Asn Glu Ile Ile Trp Thr Leu Gln Asp Asn Ser Gly
965 970 975
Ile Asn Gln Lys Leu Ala Phe Asn Tyr Gly Asn Ala Asn Gly Ile Ser
980 985 990
Asp Tyr Ile Asn Lys Trp Ile Phe Val Thr Ile Thr Asn Asp Arg Leu
995 1000 1005
Gly Asp Ser Lys Leu Tyr Ile Asn Gly Asn Leu Ile Asp Lys Lys
1010 1015 1020
Ser Ile Leu Asn Leu Gly Asn Ile His Val Ser Asp Asn Ile Leu
1025 1030 1035
Phe Lys Ile Val Asn Cys Ser Tyr Thr Arg Tyr Ile Gly Ile Arg
1040 1045 1050
Tyr Phe Asn Ile Phe Asp Lys Glu Leu Asp Glu Thr Glu Ile Gln
1055 1060 1065
Thr Leu Tyr Asn Asn Glu Pro Asn Ala Asn Ile Leu Lys Asp Phe
1070 1075 1080
Trp Gly Asn Tyr Leu Leu Tyr Asp Lys Glu Tyr Tyr Leu Leu Asn
1085 1090 1095
Val Leu Lys Pro Asn Asn Phe Ile Asn Arg Arg Thr Asp Ser Thr
1100 1105 1110
Leu Ser Ile Asn Asn Ile Arg Ser Thr Ile Leu Leu Ala Asn Arg
1115 1120 1125
Leu Tyr Ser Gly Ile Lys Val Lys Ile Gln Arg Val Asn Asn Ser
1130 1135 1140
Ser Thr Asn Asp Asn Leu Val Arg Lys Asn Asp Gln Val Tyr Ile
1145 1150 1155
Asn Phe Val Ala Ser Lys Thr His Leu Leu Pro Leu Tyr Ala Asp
1160 1165 1170
Thr Ala Thr Thr Asn Lys Glu Lys Thr Ile Lys Ile Ser Ser Ser
1175 1180 1185
Gly Asn Arg Phe Asn Gln Val Val Val Met Asn Ser Val Gly Asn
1190 1195 1200
Asn Cys Thr Met Asn Phe Lys Asn Asn Asn Gly Asn Asn Ile Gly
1205 1210 1215
Leu Leu Gly Phe Lys Ala Asp Thr Val Val Ala Ser Thr Trp Tyr
1220 1225 1230
Tyr Thr His Met Arg Asp Asn Thr Asn Ser Asn Gly Phe Phe Trp
1235 1240 1245
Asn Phe Ile Ser Glu Glu His Gly Trp Gln Glu Lys Thr Arg Ser
1250 1255 1260
His His His His His His
1265
<210> 17
<211> 1116
<212> DNA
<213> Pseudomonas aeruginosa
<400> 17
atgggcagcc tggccgcgct gaccgcgcac caggcttgcc acagagggat aataacttct 60
aaaactaaat cattagttcc gcgtggatcc aaggccctgg agcagtgcgg gtacccggtg 120
cagcggctgg tcgccctcta cctggcggcg cggctgtcgt ggaaccaggt cgaccaggtg 180
atccgcaacg ccctggccag ccccggcagc ggcggcgacc tgggcgaagc gatccgcgag 240
cagccggagc aggcccgtct ggccctgacc ctggccgccg ccgagagcga gcgcttcgtc 300
cggcagggca ccggcaacga cgaggccggc gcggccaacg ccgacgtggt gagcctgacc 360
tgcccggtcg ccgccggtga atgcgcgggc ccggcggaca gcggcgacgc cctgctggag 420
cgcaactatc ccactggcgc ggagttcctc ggcgacggcg gcgacgtcag cttcagcacc 480
cgcggcacgc agaactggac ggtggagcgg ctgctccagg cgcaccgcca actggaggag 540
cgcggctatg tgttcgtcgg ctaccacggc accttcctcg aagcggcgca aagcatcgtc 600
ttcggcgggg tgcgcgcgcg cagccaggac ctcgacgcga tctggcgcgg tttctatatc 660
gccggcgatc cggcgctggc ctacggctac gcccaggacc aggaacccga cgcacgcggc 720
cggatccgca acggtgccct gctgcgggtc tatgtgccgc gctcgagcct gccgggcttc 780
taccgcacca gcctgaccct ggccgcgccg gaggcggcgg gcgaggtcga acggctgatc 840
ggccatccgc tgccgctgcg cctggacgcc atcaccggcc ccgaggagga aggcgggcgc 900
ctggagacca ttctcggctg gccgctggcc gagcgcaccg tggtgattcc ctcggcgatc 960
cccaccgacc cgcgcaacgt cggcggcgac ctcgacccgt ccagcatccc cgacaaggaa 1020
caggcgatca gcgccctgcc ggactacgcc agccagcccg gcaaaccgcc gcgcgaggac 1080
ctgacgcgtc tcgagcacca ccaccaccac cactaa 1116
<210> 18
<211> 371
<212> PRT
<213> Pseudomonas aeruginosa
<400> 18
Met Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys His Arg Gly
1 5 10 15
Ile Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys Ala
20 25 30
Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu Tyr Leu
35 40 45
Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Arg Asn Ala
50 55 60
Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile Arg Glu
65 70 75 80
Gln Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala Glu Ser
85 90 95
Glu Arg Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly Ala Ala
100 105 110
Asn Ala Asp Val Val Ser Leu Thr Cys Pro Val Ala Ala Gly Glu Cys
115 120 125
Ala Gly Pro Ala Asp Ser Gly Asp Ala Leu Leu Glu Arg Asn Tyr Pro
130 135 140
Thr Gly Ala Glu Phe Leu Gly Asp Gly Gly Asp Val Ser Phe Ser Thr
145 150 155 160
Arg Gly Thr Gln Asn Trp Thr Val Glu Arg Leu Leu Gln Ala His Arg
165 170 175
Gln Leu Glu Glu Arg Gly Tyr Val Phe Val Gly Tyr His Gly Thr Phe
180 185 190
Leu Glu Ala Ala Gln Ser Ile Val Phe Gly Gly Val Arg Ala Arg Ser
195 200 205
Gln Asp Leu Asp Ala Ile Trp Arg Gly Phe Tyr Ile Ala Gly Asp Pro
210 215 220
Ala Leu Ala Tyr Gly Tyr Ala Gln Asp Gln Glu Pro Asp Ala Arg Gly
225 230 235 240
Arg Ile Arg Asn Gly Ala Leu Leu Arg Val Tyr Val Pro Arg Ser Ser
245 250 255
Leu Pro Gly Phe Tyr Arg Thr Ser Leu Thr Leu Ala Ala Pro Glu Ala
260 265 270
Ala Gly Glu Val Glu Arg Leu Ile Gly His Pro Leu Pro Leu Arg Leu
275 280 285
Asp Ala Ile Thr Gly Pro Glu Glu Glu Gly Gly Arg Leu Glu Thr Ile
290 295 300
Leu Gly Trp Pro Leu Ala Glu Arg Thr Val Val Ile Pro Ser Ala Ile
305 310 315 320
Pro Thr Asp Pro Arg Asn Val Gly Gly Asp Leu Asp Pro Ser Ser Ile
325 330 335
Pro Asp Lys Glu Gln Ala Ile Ser Ala Leu Pro Asp Tyr Ala Ser Gln
340 345 350
Pro Gly Lys Pro Pro Arg Glu Asp Leu Thr Arg Leu Glu His His His
355 360 365
His His His
370
<210> 19
<211> 1215
<212> DNA
<213> Corynebacterium diphtheriae
<400> 19
atggctgatg atgttgttga ttcttctaaa tcttttgtga tggaaaactt ttcttcgtac 60
cacgggacta aacctggtta tgtagattcc attcaaaaag gtatacaaaa gccaaaatct 120
ggtacacaag gaaattatga cgatgattgg aaagggtttt atagtaccga caataaatac 180
gacgctgcgg gatactctgt agataacgaa aacccgctct ctggaaaagc tggaggcgtg 240
gtcaaagtga cgtatccagg actgacgaag gtcctcgcac taaaagtgga taatgccgaa 300
actattaaga aagagttagg tttaagtctc actgaaccgt tgatggagca agtcggaaca 360
gaagagttta tcaaaaggtt cggggatggt gcttcgcgtg tagtactcag ccttcccttt 420
gccgagggga gttctagcgt cgaatatatt aataactggg aacaggcgaa agcgttaagc 480
gtagaacttg agattaattt tgaaacccgt ggaaaacgtg gccaagatgc gatgtatgag 540
tatatggctc aagcctgtgc aagagggata ataacttcta aaactaaatc attggttcca 600
cgtggatcca aggccttgtc atgcataaat cttgattggg atgtcataag ggataaaact 660
aagacaaaga tagagtcttt gaaagagcat ggccctatca aaaataaaat gagcgaaagt 720
cccaataaaa cagtatctga ggaaaaagct aaacaatacc tagaagaatt tcatcaaacc 780
gcattagagc atcctgaatt gtcagaactt aaaaccgtta ctgggaccaa tcctcttttc 840
gctggggcta actatgcggc gtgggcagta aacgttgcgc aagttatcga tagcgaaaca 900
gctgataatt tggaaaagac aactgctgct ctttcgatac ttcctggtat cggtagcgta 960
atgggcattg cagacggtgc cgttcaccac aatacagaag agatagtggc acaatcaata 1020
gctttatcgt ctttaatggt tgctcaagct attccattgg taggagagct agttgatatt 1080
ggtttcgctg catataattt tgtagagagt attatcaatt tgtttcaagt agttcataat 1140
tcgtataatc gtcccgcgta ttctccgggg cataaaacgc aaccatttct cgagcaccac 1200
caccaccacc actaa 1215
<210> 20
<211> 404
<212> PRT
<213> Corynebacterium diphtheriae
<400> 20
Met Ala Asp Asp Val Val Asp Ser Ser Lys Ser Phe Val Met Glu Asn
1 5 10 15
Phe Ser Ser Tyr His Gly Thr Lys Pro Gly Tyr Val Asp Ser Ile Gln
20 25 30
Lys Gly Ile Gln Lys Pro Lys Ser Gly Thr Gln Gly Asn Tyr Asp Asp
35 40 45
Asp Trp Lys Gly Phe Tyr Ser Thr Asp Asn Lys Tyr Asp Ala Ala Gly
50 55 60
Tyr Ser Val Asp Asn Glu Asn Pro Leu Ser Gly Lys Ala Gly Gly Val
65 70 75 80
Val Lys Val Thr Tyr Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val
85 90 95
Asp Asn Ala Glu Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu
100 105 110
Pro Leu Met Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly
115 120 125
Asp Gly Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser
130 135 140
Ser Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser
145 150 155 160
Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln Asp
165 170 175
Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Arg Gly Ile Ile Thr
180 185 190
Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys Ala Leu Ser Cys
195 200 205
Ile Asn Leu Asp Trp Asp Val Ile Arg Asp Lys Thr Lys Thr Lys Ile
210 215 220
Glu Ser Leu Lys Glu His Gly Pro Ile Lys Asn Lys Met Ser Glu Ser
225 230 235 240
Pro Asn Lys Thr Val Ser Glu Glu Lys Ala Lys Gln Tyr Leu Glu Glu
245 250 255
Phe His Gln Thr Ala Leu Glu His Pro Glu Leu Ser Glu Leu Lys Thr
260 265 270
Val Thr Gly Thr Asn Pro Val Phe Ala Gly Ala Asn Tyr Ala Ala Trp
275 280 285
Ala Val Asn Val Ala Gln Val Ile Asp Ser Glu Thr Ala Asp Asn Leu
290 295 300
Glu Lys Thr Thr Ala Ala Leu Ser Ile Leu Pro Gly Ile Gly Ser Val
305 310 315 320
Met Gly Ile Ala Asp Gly Ala Val His His Asn Thr Glu Glu Ile Val
325 330 335
Ala Gln Ser Ile Ala Leu Ser Ser Leu Met Val Ala Gln Ala Ile Pro
340 345 350
Leu Val Gly Glu Leu Val Asp Ile Gly Phe Ala Ala Tyr Asn Phe Val
355 360 365
Glu Ser Ile Ile Asn Leu Phe Gln Val Val His Asn Ser Tyr Asn Arg
370 375 380
Pro Ala Tyr Ser Pro Gly His Lys Thr Gln Pro Phe Leu Glu His His
385 390 395 400
His His His His
<210> 21
<211> 1650
<212> DNA
<213> Ricinus communis
<400> 21
atggtcccca aacaataccc aattataaac tttaccacag cgggtgccac tgtgcaaagc 60
tacacaaact ttatcagagc tgttcgcggt cgtttaacaa ctggagctga tgtgagacat 120
gatataccag tgttgccaaa cagagttggt ttgcctataa accaacggtt tattttagtt 180
gaactctcaa atcatgcaga gctttctgtt acattagccc tggatgtcac caatgcatat 240
gtggtcggct accgtgctgg aaatagcgca tatttctttc atcctgacaa tcaggaagat 300
gcagaagcaa tcactcatct tttcactgat gttcaaaatc gatatacatt cgcctttggt 360
ggtaattatg atagacttga acaacttgct ggtaatctga gagaaaatat cgagttggga 420
aatggtccac tagaggaggc tatctcagcg ctttattatt acagtactgg tggcactcag 480
cttccaactc tggctcgttc ctttataatt tgcatccaaa tgatttcaga agcagcaaga 540
ttccaatata ttgagggaga aatgcgcacg agaattaggt acaaccggag atctgcacca 600
gatcctagcg taattacact tgagaatagt tgggggagac tttccactgc aattcaagag 660
tctaaccaag gagcctttgc tagtccaatt caactgcaaa gacgtaatgg ttccaaattc 720
agtgtgtacg atgtgagtat attaatccct atcatagctc tcatggtgta tagatgcgca 780
cctcctaggg ggataataac ttctaaaact aaatcattgg ttccacgtgg atccaaggct 840
gatgtttgta tggatcctga gcccatagtg cgtatcgtag gtcgaaatgg tctatgtgtt 900
gatgttaggg atggaagatt ccacaacgga aacgcaatac agttgtggcc atgcaagtct 960
aatacagatg caaatcagct ctggactttg aaaagagaca atactattcg atctaatgga 1020
aagtgtttaa ctacttacgg gtacagtccg ggagtctatg tgatgatcta tgattgcaat 1080
actgctgcaa ctgatgccac ccgctggcaa atatgggata atggaaccat cataaatccc 1140
agatctagtc tagttttagc agcgacatca gggaacagtg gtaccacact tacggtgcaa 1200
accaacattt atgccgttag tcaaggttgg cttcctacta ataatacaca accttttgtt 1260
acaaccattg ttgggctata tggtctgtgc ttgcaagcaa atagtggaca agtatggata 1320
gaggactgta gcagtgaaaa ggctgaacaa cagtgggctc tttatgcaga tggttcaata 1380
cgtcctcagc aaaaccgaga taattgcctt acaagtgatt ctaatatacg ggaaacagtt 1440
gttaagatcc tctcttgtgg ccctgcatcc tctggccaac gatggatgtt caagaatgat 1500
ggaaccattt taaatttgta tagtggattg gtgttagatg tgaggcgatc ggatccgagc 1560
cttaaacaaa tcattcttta ccctctccat ggtgacccaa accaaatatg gttaccatta 1620
tttctcgagc accaccacca ccaccactaa 1650
<210> 22
<211> 549
<212> PRT
<213> Ricinus communis
<400> 22
Met Val Pro Lys Gln Tyr Pro Ile Ile Asn Phe Thr Thr Ala Gly Ala
1 5 10 15
Thr Val Gln Ser Tyr Thr Asn Phe Ile Arg Ala Val Arg Gly Arg Leu
20 25 30
Thr Thr Gly Ala Asp Val Arg His Asp Ile Pro Val Leu Pro Asn Arg
35 40 45
Val Gly Leu Pro Ile Asn Gln Arg Phe Ile Leu Val Glu Leu Ser Asn
50 55 60
His Ala Glu Leu Ser Val Thr Leu Ala Leu Asp Val Thr Asn Ala Tyr
65 70 75 80
Val Val Gly Tyr Arg Ala Gly Asn Ser Ala Tyr Phe Phe His Pro Asp
85 90 95
Asn Gln Glu Asp Ala Glu Ala Ile Thr His Leu Phe Thr Asp Val Gln
100 105 110
Asn Arg Tyr Thr Phe Ala Phe Gly Gly Asn Tyr Asp Arg Leu Glu Gln
115 120 125
Leu Ala Gly Asn Leu Arg Glu Asn Ile Glu Leu Gly Asn Gly Pro Leu
130 135 140
Glu Glu Ala Ile Ser Ala Leu Tyr Tyr Tyr Ser Thr Gly Gly Thr Gln
145 150 155 160
Leu Pro Thr Leu Ala Arg Ser Phe Ile Ile Cys Ile Gln Met Ile Ser
165 170 175
Glu Ala Ala Arg Phe Gln Tyr Ile Glu Gly Glu Met Arg Thr Arg Ile
180 185 190
Arg Tyr Asn Arg Arg Ser Ala Pro Asp Pro Ser Val Ile Thr Leu Glu
195 200 205
Asn Ser Trp Gly Arg Leu Ser Thr Ala Ile Gln Glu Ser Asn Gln Gly
210 215 220
Ala Phe Ala Ser Pro Ile Gln Leu Gln Arg Arg Asn Gly Ser Lys Phe
225 230 235 240
Ser Val Tyr Asp Val Ser Ile Leu Ile Pro Ile Ile Ala Leu Met Val
245 250 255
Tyr Arg Cys Ala Pro Pro Arg Gly Ile Ile Thr Ser Lys Thr Lys Ser
260 265 270
Leu Val Pro Arg Gly Ser Lys Ala Asp Val Cys Met Asp Pro Glu Pro
275 280 285
Ile Val Arg Ile Val Gly Arg Asn Gly Leu Cys Val Asp Val Arg Asp
290 295 300
Gly Arg Phe His Asn Gly Asn Ala Ile Gln Leu Trp Pro Cys Lys Ser
305 310 315 320
Asn Thr Asp Ala Asn Gln Leu Trp Thr Leu Lys Arg Asp Asn Thr Ile
325 330 335
Arg Ser Asn Gly Lys Cys Leu Thr Thr Tyr Gly Tyr Ser Pro Gly Val
340 345 350
Tyr Val Met Ile Tyr Asp Cys Asn Thr Ala Ala Thr Asp Ala Thr Arg
355 360 365
Trp Gln Ile Trp Asp Asn Gly Thr Ile Ile Asn Pro Arg Ser Ser Leu
370 375 380
Val Leu Ala Ala Thr Ser Gly Asn Ser Gly Thr Thr Leu Thr Val Gln
385 390 395 400
Thr Asn Ile Tyr Ala Val Ser Gln Gly Trp Leu Pro Thr Asn Asn Thr
405 410 415
Gln Pro Phe Val Thr Thr Ile Val Gly Leu Tyr Gly Leu Cys Leu Gln
420 425 430
Ala Asn Ser Gly Gln Val Trp Ile Glu Asp Cys Ser Ser Glu Lys Ala
435 440 445
Glu Gln Gln Trp Ala Leu Tyr Ala Asp Gly Ser Ile Arg Pro Gln Gln
450 455 460
Asn Arg Asp Asn Cys Leu Thr Ser Asp Ser Asn Ile Arg Glu Thr Val
465 470 475 480
Val Lys Ile Leu Ser Cys Gly Pro Ala Ser Ser Gly Gln Arg Trp Met
485 490 495
Phe Lys Asn Asp Gly Thr Ile Leu Asn Leu Tyr Ser Gly Leu Val Leu
500 505 510
Asp Val Arg Arg Ser Asp Pro Ser Leu Lys Gln Ile Ile Leu Tyr Pro
515 520 525
Leu His Gly Asp Pro Asn Gln Ile Trp Leu Pro Leu Phe Leu Glu His
530 535 540
His His His His His
545
Claims (42)
- 대장균 숙주세포에서 재조합 발현에 의해 두 사슬이 이황화 가교된 이쇄형의 폴리펩티드 또는 단백질을 제조하는 방법으로서,(i) 상기 폴리펩티드 또는 단백질은 이황화 가교된 이쇄 폴리펩티드 또는 단백질로서 그 생물학적 활성을 나타내고,(ii) 상기 폴리펩티드 또는 단백질의 제1 사슬의 C-말단 아미노산 잔기는 Arg 또는 Lys 잔기이고,(iii) 상기 단백질 또는 폴리펩티드의 제2 사슬은 N-말단에 1 내지 20 아미노산 잔기 및 PRS로 지칭되는 펜타펩티드 서열 VPXGS을 가지며, 이때 X는 자연 발생 아미노산 중 하나이며, V는 Val, Leu, Ile, Ala, Phe, Pro 또는 Gly이며, P는 Pro, Leu, Ile, Ala, Phe, Val 또는 Gly이며, G는 Gly, Leu, Ile, Ala, Pro, Phe 또는 Val이며, S 는 Ser, Tyr, Trp, 또는 Thr이며; 및(iv)(a) 폴리펩티드 또는 단백질을 핵산 수준에서 변경하는 단계로서, 변경된 형태의 폴리펩티드 또는 단백질이 그 루프 영역내에 VPXGS 서열(X, V, P, G, 및 S 는 상기에서 정의된 바와 동일하다)을 갖도록 변경하는 단계;(b) 상기 핵산 수준에서 변경된 구조체를 대장균 세포에 삽입하는 단계;(c) 숙주 세포를 배양하고 이후 용해시키는 단계; 및(d) 이황화 가교된 이쇄 펩티드 또는 단백질을 분리하는 단계를 포함하는, 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
- 제1항에 있어서, 상기 제1 사슬은 단백질 또는 폴리펩티드의 경쇄이고, 제2 사슬은 단백질 또는 폴리펩티드의 중쇄인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
- 제1항 또는 제2항에 있어서, 상기 폴리펩티드 또는 단백질은 보툴리늄 신경 독소인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 폴리펩티드 또는 단백질은 혈청형 A 보툴리늄 신경 독소(BoNT(A))인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
- 제1항 또는 제2항에 있어서, 상기 폴리펩티드 또는 단백질은 BoNT(A)의 LHN 단편인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
- 제4항 또는 제5항에 있어서, 상기 PRS 서열 VPXGS이 BoNT(A)의 443-447 아미노산의 삭제와 함께 Leu 442 및 Lys448 아미노산 사이에 삽입되는, 재조합 발현에 의 한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
- 제6항에 있어서, 상기 PRS 서열 VPRGS, VPYGS, VPHGS, 또는 VPQGS이 삽입되는, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 PRS 서열 VPXGS가 하나 이상의 아미노산 삭제와 함께, BoNT(B)의 옥타펩티드 Lys438 - Ile445 내로, BoNT(C1)의 15머 His438- Asp452, 또는 BoNT(E)의 13머 Lys413 - Ile425 내로 삽입되는, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
- 제8항에 있어서, 상기 PRS 서열 VPXGS가 17머 GIITSKTKSLVPRGSKA 또는 18머 RGIITSKTKSLVPRGSKA의 형태로 삽입되는, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
- 제1항 또는 제2항에 있어서, 상기 단백질이 혼성 단백질인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
- 제10항에 있어서, 상기 혼성 단백질은 하기 구성성분 A, B, 및 C를 갖는 것 인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법:(구성성분 A)- 효소활성에 의해 표적 세포에서의 분비를 억제하거나 살해할 수 있는 효과 도메인, 또는 독소 도메인;(구성성분 B)- 서열 VPXGS를 포함하는 루프 서열; 및(구성성분 C)- 융합 단백질 또는 혼성 단백질에 세포 특이성을 부여하는 세포 결합 도메인.
- 제11항에 있어서, 상기 혼성 단백질은 구성성분 D로서 전좌 도메인을 추가로 포함하는, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
- 제11항 또는 제12항에 있어서, 상기 독소 도메인(A)는 디프테리아 독소의 도메인, 슈도모나스 외독소의 도메인, 또는 라이신의 도메인인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
- 제13항에 있어서, 상기 독소 도메인(A)는 슈도모나스 외독소 단편 PE40 (도메인 III, 도메인 II, 및 도메인 Ib) 또는 단편 PE38 (도메인 III 및 도메인 II) 또는 라이신의 A 사슬인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
- 제11항 내지 제14항 중 어느 한 항에 있어서, 상기 세포 결합 도메인(C)가 단클론 항체, 아필린, 안키린 반복 단백질, 안티칼린, TGF-alpha, FGF, VEGF, 또는 IGF-1와 같은 성장 인자, 또는 IL2, IL4, 또는 IL6와 같은 시토킨인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
- 제10항에 있어서, 상기 혼성 단백질은 하기 구성성분 A, B, 및 C를 갖는 것인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법:(구성성분 A)- 융합 단백질에 더 나은 용해성을 부여하고, 더 높은 발현율을 나타내게 하며 및/또는 친화성 정제를 가능하게 하는 단백질 또는 올리고 펩티드;(구성성분 B)- 서열 VPXGS를 포함하는 루프 서열; 및(구성성분 C)- 모든 형태의 폴리펩티드.
- 제16항에 있어서, 상기 구성성분 A는 글루타티온-S-트랜스퍼라제(GST), 말토스 결합단백질(MBP), His 태그, Strep 태그, 또는 FLAG 태그인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 대장균 세포는 대장균 K12, 특히 M15[pREP4], XL1-BLUE 또는 UT5600 균주의 대장균 K12 세포인, 재조합 발현에 의한 이황화 가교된 이쇄 형태의 폴리펩티드 또는 단백질 제조방법.
- 제1 사슬의 C-말단이 Arg 또는 Lys 잔기이고, 제2 사슬은 N-말단에 1 내지 20 아미노산 잔기 및 PRS로 지칭되는 펜타펩티드 서열 VPXGS을 가지며, 이때 X는 자연 발생 아미노산 중 하나이며, V는 Val, Leu, Ile, Ala, Phe, Pro 또는 Gly이며, P는 Pro, Leu, Ile, Ala, Phe, Val 또는 Gly이며, G는 Gly, Leu, Ile, Ala, Pro, Phe 또는 Val이며, S 는 Ser, Tyr, Trp, 또는 Thr인 것을 특징으로 하는, 이황화 가교된 이쇄 폴리펩티드 또는 단백질로서 존재하고, 생물학적 활성인 폴리펩티드 또는 단백질.
- 제19항에 있어서, 상기 제1 사슬은 단백질 또는 폴리펩티드의 경쇄이고, 제2 사슬은 단백질 또는 폴리펩티드의 중쇄인 폴리펩티드 또는 단백질.
- 제19항 또는 제20항에 있어서, 상기 제1 사슬의 C-말단이 Lys 잔기인 폴리펩티드 또는 단백질.
- 제19항 내지 제21항 중 어느 한 항에 있어서, 상기 제2 사슬이 N-말단에 펜타펩티드 서열 VPXGS, 헥사펩티드 서열 XVPXGS, 또는 헵타펩티드 서열 XXVPXGS을 갖는 폴리펩티드 또는 단백질.
- 제19항 또는 제22항에 있어서, 상기 폴리펩티드 또는 단백질이 보툴리늄 신경독소, 보툴리늄 신경독소의 유도체 또는 단편, 특히 LHN 단편을 포함하거나, 보툴리늄 신경독소의 생물학적 활성을 갖는 폴리펩티드 또는 단백질.
- 제19항 내지 제23항 중 어느 한 항에 있어서, 상기 폴리펩티드 또는 단백질이 혈청형 A 보툴리늄 신경 독소(BoNT(A))를 포함하거나, 또는 BoNT(A)의 생물학적 활성을 갖는, 폴리펩티드 또는 단백질.
- 제19항 내지 제22항 중 어느 한 항에 있어서, 상기 폴리펩티드 또는 단백질이 BoNT(A)의 LHN 단편이거나, 또는 BoNT(A)의 생물학적 활성을 갖는, 폴리펩티드 또는 단백질.
- 제19항 내지 제25항 중 어느 한 항에 있어서, 상기 제2 사슬이 N-말단에 헵타펩티드 서열 SLVPXGS을 갖는 폴리펩티드 또는 단백질.
- 제26항에 있어서, X가 R, Y, H, 또는 Q인 폴리펩티드 또는 단백질.
- 제19항 내지 제22항 중 어느 한 항, 제26항 또는 제27항에 있어서, 상기 단백질이 혼성 단백질인 폴리펩티드 또는 단백질.
- 제28항에 있어서, 상기 혼성 단백질은 하기 구성성분 A, B, 및 C를 갖는 것인, 폴리펩티드 또는 단백질:(구성성분 A)- 효소활성에 의해 표적 세포에서의 분비를 억제하거나 살해할 수 있는 효과 도메인, 또는 독소 도메인;(구성성분 B)- 서열 VPXGS를 포함하는 루프 서열; 및(구성성분 C)- 융합 단백질 또는 혼성 단백질에 세포 특이성을 부여하는 세포 결합 도메인.
- 제29항에 있어서, 상기 혼성 단백질은 구성성분 D로서 전좌 도메인을 추가로 포함하는 폴리펩티드 또는 단백질.
- 제29항 또는 제30항에 있어서, 상기 독소 도메인(A)는 디프테리아 독소의 도메인, 슈도모나스 외독소의 도메인, 또는 라이신의 도메인인 폴리펩티드 또는 단백질.
- 제31항에 있어서, 상기 독소 도메인(A)는 슈도모나스 외독소 단편 PE40 (도메인 III, 도메인 II, 및 도메인 Ib) 또는 단편 PE38 (도메인 III 및 도메인 II) 또는 라이신의 A 사슬인 폴리펩티드 또는 단백질.
- 제29항 내지 제32항 중 어느 한 항에 있어서, 상기 세포 결합 도메인(C)가 단클론 항체, 아필린, 안키린 반복 단백질, 안티칼린, TGF-alpha, FGF, VEGF, 또는 IGF-1와 같은 성장 인자, 또는 IL2, IL4, 또는 IL6와 같은 시토킨인 폴리펩티드 또는 단백질.
- 제28항에 있어서, 상기 혼성 단백질은 하기 구성성분 A, B, 및 C를 갖는 것인, 폴리펩티드 또는 단백질:(구성성분 A)- 융합 단백질에 더 나은 용해성을 부여하고, 더 높은 발현율을 나타내게하며 및/또는 친화성 정제를 가능하게 하는 단백질 또는 올리고 펩티드;(구성성분 B)- 서열 VPXGS를 포함하는 루프 서열; 및(구성성분 C)- 모든 형태의 폴리펩티드.
- 제34항에 있어서, 상기 구성성분 A는 글루타티온-S-트랜스퍼라제(GST), 말토스 결합단백질(MBP), His 태그, Strep 태그, 또는 FLAG 태그인, 폴리펩티드 또는 단백질
- 제19항 내지 35항 중 어느 한 항에 따른 폴리펩티드 또는 단백질을 코딩하는 핵산.
- 제36항에 있어서, DNA인 핵산.
- 제36항 또는 제37항의 핵산을 포함하는 벡터.
- 제38항의 벡터를 포함하는 숙주 세포.
- 제39항에 있어서, 상기 숙주 세포가 원핵세포, 특히 대장균 세포, 특히 대장균 K12 세포인 숙주세포.
- 제39항 또는 제40항에 있어서, 상기 숙주세포가 M15[pREP4]이고, 상기 벡터가 pQE 시리즈의 플라스미드인 숙주세포.
- 제19항 내지 제35항 중 어느 한 항의 폴리펩티드 또는 단백질을 포함하는 약학적 제제.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102005002978.7 | 2005-01-21 | ||
DE102005002978A DE102005002978B4 (de) | 2005-01-21 | 2005-01-21 | Rekombinante Expression von Proteinen in einer disulfidverbrückten, zweikettigen Form |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20070104605A true KR20070104605A (ko) | 2007-10-26 |
Family
ID=36603464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077018752A KR20070104605A (ko) | 2005-01-21 | 2006-01-20 | 이황화 가교된 이쇄형 단백질의 재조합 발현 |
Country Status (15)
Country | Link |
---|---|
US (1) | US20080103098A1 (ko) |
EP (1) | EP1844150B1 (ko) |
JP (2) | JP5107055B2 (ko) |
KR (1) | KR20070104605A (ko) |
CN (2) | CN101107361B (ko) |
AT (1) | ATE546533T1 (ko) |
AU (1) | AU2006207726B2 (ko) |
BR (1) | BRPI0606612A2 (ko) |
CA (1) | CA2593520C (ko) |
DE (2) | DE102005002978B4 (ko) |
DK (1) | DK1844150T3 (ko) |
ES (1) | ES2380677T3 (ko) |
IL (1) | IL184112A0 (ko) |
RU (1) | RU2412253C2 (ko) |
WO (1) | WO2006076902A2 (ko) |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009014854A1 (en) | 2007-07-26 | 2009-01-29 | Allergan, Inc. | Methods of activiting clostridial toxins |
AU2009286973B2 (en) | 2008-08-29 | 2014-06-12 | Merz Pharma Gmbh & Co. Kgaa | Clostridial neurotoxins with altered persistency |
EP2202518A1 (en) | 2008-12-19 | 2010-06-30 | Merz Pharma GmbH & Co.KGaA | In vivo assay for quantifying clostridial neurotoxin activity |
EP2218783A1 (en) | 2009-02-05 | 2010-08-18 | Merz Pharma GmbH & Co. KGaA | Novel method for the manufacturing of neurotoxins |
CN102325792B (zh) | 2009-02-19 | 2018-01-09 | 莫茨制药有限及两合公司 | 用于生产高纯度神经毒素的手段和方法 |
TW201120210A (en) | 2009-11-05 | 2011-06-16 | Hoffmann La Roche | Glycosylated repeat-motif-molecule conjugates |
US9310386B2 (en) | 2010-01-22 | 2016-04-12 | Merz Pharma Gmbh & Co. Kgaa | In vitro assay for quantifying clostridial neurotoxin activity |
CN102822196B (zh) * | 2010-01-25 | 2014-12-17 | 阿勒根公司 | 将单链蛋白质细胞内转化成它们的双链形式的方法 |
NZ602958A (en) * | 2010-03-30 | 2014-07-25 | Pfenex Inc | High level expression of recombinant toxin proteins |
AR081361A1 (es) * | 2010-04-30 | 2012-08-29 | Molecular Partners Ag | Proteinas de union modificadas que inhiben la interaccion de receptor del factor de crecimiento endotelial vascular de glicoproteina a vegf-a |
WO2012020057A1 (en) | 2010-08-11 | 2012-02-16 | Merz Pharma Gmbh & Co. Kgaa | Selective manufacture of recombinant neurotoxin polypeptides |
US20140377248A1 (en) | 2011-12-23 | 2014-12-25 | Merz Pharma Gmbh & Co. Kgaa | Method for the manufacturing of di-chain proteins for use in humans |
CN103509807B (zh) * | 2012-09-14 | 2015-04-15 | 山东大学 | 糖基化的麦芽糖结合蛋白及其制备方法与应用 |
GB201219602D0 (en) | 2012-10-31 | 2012-12-12 | Syntaxin Ltd | Recombinant clostridium botulinum neurotoxins |
RU2673910C2 (ru) * | 2012-11-21 | 2018-12-03 | Ипсен Байоинновейшн Лимитед | Способ производства протеолитически процессированного полипептида |
US9975929B2 (en) | 2014-03-05 | 2018-05-22 | Merz Pharma Gmbh & Co. Kgaa | Recombinant clostridial neurotoxins with increased duration of effect |
ES2837699T3 (es) | 2014-12-19 | 2021-07-01 | Merz Pharma Gmbh & Co Kgaa | Medios y métodos para la determinación de la actividad biológica de BoNT/E en células |
DK3242884T3 (da) * | 2015-01-09 | 2021-04-19 | Ipsen Bioinnovation Ltd | Kationiske neurotoksiner |
TW201718627A (zh) | 2015-06-11 | 2017-06-01 | 梅茲製藥有限兩合公司 | 重組梭菌神經毒素及其使用與形成方法、包括其之醫藥組合物及對應其之前驅物、編碼前驅物之核酸序列及其獲得方法與前驅物之形成方法、載體與包括核酸序列之重組宿主細胞 |
TWI799366B (zh) | 2015-09-15 | 2023-04-21 | 美商建南德克公司 | 胱胺酸結骨架平臺 |
US11078472B2 (en) | 2016-01-20 | 2021-08-03 | Merz Pharma Gmbh & Co., Kgaa | Recombinant clostridial neurotoxins with increased duration of effect |
CA3010146A1 (en) | 2016-03-02 | 2017-09-08 | Merz Pharma Gmbh & Co. Kgaa | Composition comprising botulinum toxin |
EP3263710A1 (en) | 2016-07-01 | 2018-01-03 | Ipsen Biopharm Limited | Production of activated clostridial neurotoxins |
EP3290437A1 (en) | 2016-08-31 | 2018-03-07 | Merz Pharma GmbH & Co. KGaA | Novel recombinant clostridial neurotoxins with decreased duration of effect |
EP3312193A1 (en) | 2016-10-19 | 2018-04-25 | Merz Pharma GmbH & Co. KGaA | Novel recombinant botulinum neurotoxins with accelerated onset of effect |
EP3333179A1 (en) | 2016-12-07 | 2018-06-13 | Merz Pharma GmbH & Co. KGaA | Novel recombinant botulinum toxin with accelarated onset of effect |
EP3335719A1 (en) | 2016-12-14 | 2018-06-20 | Merz Pharma GmbH & Co. KGaA | Novel recombinant botulinum neurotoxins with a stabilized light chain |
US11952601B2 (en) | 2017-06-20 | 2024-04-09 | Merz Pharma Gmbh & Co. Kgaa | Recombinant botulinum toxin with increased duration of effect |
EP3649143B1 (en) | 2017-07-06 | 2022-08-31 | Merz Pharma GmbH & Co. KGaA | Novel recombinant botulinum neurotoxins with increased duration of effect |
EP3700919A1 (en) | 2017-10-26 | 2020-09-02 | Merz Pharma GmbH & Co. KGaA | Novel recombinant botulinum neurotoxins with increased duration of effect |
US20200354706A1 (en) | 2017-11-22 | 2020-11-12 | Merz Pharma Gmbh & Co. Kgaa | Novel recombinant botulinum toxin with increased duration of effect |
WO2019158745A1 (de) * | 2018-02-16 | 2019-08-22 | Bontana Therapies Gmbh | Nukleinsäure-basiertes botulinum neurotoxin zur therapeutischen anwendung |
CA3101481A1 (en) * | 2018-05-30 | 2019-12-05 | The Governing Council Of The University Of Toronto | Methods and kits for identifying a protein associated with receptor-ligand interactions |
CN111655734A (zh) * | 2019-04-28 | 2020-09-11 | 广州市雷德生物科技有限公司 | 一种促进蛋白二聚体形成的拉链扣结构及其应用 |
WO2021125866A1 (ko) * | 2019-12-18 | 2021-06-24 | 성균관대학교산학협력단 | 보툴리눔 신경 독소의 안전한 제조 방법 |
CN114957482A (zh) * | 2021-02-26 | 2022-08-30 | 重庆誉颜制药有限公司 | 一种经修饰的神经毒素的单链多肽及其用途 |
CN113480667B (zh) * | 2021-08-17 | 2023-03-28 | 长春萤火虫生物科技有限公司 | 一种人粒细胞集落刺激因子突变体重组融合蛋白及其制备方法和应用 |
KR20240038789A (ko) * | 2022-05-24 | 2024-03-25 | 제이에이치엠 바이오파마슈티컬 (항저우) 씨오., 엘티디. | 재조합 보툴리눔 신경독소 a형 및 이의 제조 방법 |
CN115894641B (zh) * | 2022-09-13 | 2023-09-29 | 君合盟生物制药(杭州)有限公司 | A型肉毒素突变体及其基因工程菌的构建 |
CN115819526A (zh) * | 2022-12-02 | 2023-03-21 | 海雅美生物技术(珠海)有限公司 | 一种重组肉毒杆菌神经毒素及其制备方法和应用 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0363063A3 (en) * | 1988-09-29 | 1990-07-25 | Bunge (Australia) Proprietary Limited | Sheep growth hormone |
GB9010552D0 (en) * | 1990-05-10 | 1990-07-04 | Erba Carlo Spa | Method for the recombinant production of hirudins and novel hirudins |
AU706056B2 (en) * | 1995-10-13 | 1999-06-10 | Government Of The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services, The | Immunotoxin containing a disulfide-stabilized antibody fragment |
US7192596B2 (en) * | 1996-08-23 | 2007-03-20 | The Health Protection Agency Ipsen Limited | Recombinant toxin fragments |
EP0941334B1 (en) * | 1996-11-06 | 2004-06-02 | THE UNITED STATES OF AMERICA, as represented by the Secretary of the Department of Health and Human Services | Protease-activatable pseudomonas exotoxin a-like proproteins |
WO1998049311A2 (en) * | 1997-04-30 | 1998-11-05 | De Novo Enzyme Corporation | Ricin-like toxin variants for treatment of cancer, viral or parasitic infections |
EP2267010B1 (en) * | 1999-08-25 | 2014-05-07 | Allergan, Inc. | Activatable recombinant neurotoxins |
US7273722B2 (en) * | 2000-11-29 | 2007-09-25 | Allergan, Inc. | Neurotoxins with enhanced target specificity |
US20040018589A1 (en) * | 2002-07-25 | 2004-01-29 | Jun Zhong | Method for producing biologically active botulinum neurotoxins through recombinant DNA technique |
WO2004099254A2 (en) * | 2003-05-06 | 2004-11-18 | The Government Of The United States, As Represented By The Secretary Of Health And Human Services | Activation of recombinant diphtheria toxin fusion proteins by specific proteases highly expressed on the surface of tumor cells |
-
2005
- 2005-01-21 DE DE102005002978A patent/DE102005002978B4/de not_active Expired - Fee Related
-
2006
- 2006-01-20 WO PCT/DE2006/000088 patent/WO2006076902A2/de not_active Application Discontinuation
- 2006-01-20 JP JP2007551542A patent/JP5107055B2/ja not_active Expired - Fee Related
- 2006-01-20 CN CN2006800029573A patent/CN101107361B/zh not_active Expired - Fee Related
- 2006-01-20 BR BRPI0606612-7A patent/BRPI0606612A2/pt not_active IP Right Cessation
- 2006-01-20 EP EP06705826A patent/EP1844150B1/de not_active Not-in-force
- 2006-01-20 DK DK06705826.3T patent/DK1844150T3/da active
- 2006-01-20 US US11/814,511 patent/US20080103098A1/en not_active Abandoned
- 2006-01-20 CA CA2593520A patent/CA2593520C/en not_active Expired - Fee Related
- 2006-01-20 ES ES06705826T patent/ES2380677T3/es active Active
- 2006-01-20 CN CN2013102392934A patent/CN103320459A/zh active Pending
- 2006-01-20 AT AT06705826T patent/ATE546533T1/de active
- 2006-01-20 KR KR1020077018752A patent/KR20070104605A/ko active IP Right Grant
- 2006-01-20 DE DE112006000677T patent/DE112006000677A5/de not_active Withdrawn
- 2006-01-20 AU AU2006207726A patent/AU2006207726B2/en not_active Ceased
- 2006-01-20 RU RU2007127624/10A patent/RU2412253C2/ru not_active IP Right Cessation
-
2007
- 2007-06-21 IL IL184112A patent/IL184112A0/en unknown
-
2012
- 2012-08-16 JP JP2012180318A patent/JP2012254088A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
DE102005002978B4 (de) | 2013-04-25 |
IL184112A0 (en) | 2007-10-31 |
JP2008527983A (ja) | 2008-07-31 |
DK1844150T3 (da) | 2012-05-29 |
CN103320459A (zh) | 2013-09-25 |
AU2006207726A1 (en) | 2006-07-27 |
JP2012254088A (ja) | 2012-12-27 |
US20080103098A1 (en) | 2008-05-01 |
CN101107361A (zh) | 2008-01-16 |
DE102005002978A1 (de) | 2006-08-03 |
CN101107361B (zh) | 2013-07-17 |
BRPI0606612A2 (pt) | 2009-07-07 |
EP1844150A2 (de) | 2007-10-17 |
RU2007127624A (ru) | 2009-02-27 |
JP5107055B2 (ja) | 2012-12-26 |
DE112006000677A5 (de) | 2007-12-27 |
RU2412253C2 (ru) | 2011-02-20 |
CA2593520C (en) | 2013-11-19 |
ES2380677T3 (es) | 2012-05-17 |
ATE546533T1 (de) | 2012-03-15 |
WO2006076902A2 (de) | 2006-07-27 |
AU2006207726B2 (en) | 2011-04-14 |
EP1844150B1 (de) | 2012-02-22 |
WO2006076902A3 (de) | 2006-11-02 |
CA2593520A1 (en) | 2006-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20070104605A (ko) | 이황화 가교된 이쇄형 단백질의 재조합 발현 | |
KR101454273B1 (ko) | 페그화된 돌연변이 클로스트리디움 보툴리눔 독소 | |
CA2413045C (en) | Expression system | |
CA2498502C (en) | Recombinant clostridial toxin fragments with proteolytic activation | |
JP5134540B2 (ja) | クロストリジウム毒素活性化クロストリジウム毒素 | |
JP2008538902A (ja) | 神経細胞をターゲッティングするための担体 | |
HUE029962T2 (hu) | Egyláncú fehérjék kétláncú formájúvá történõ intracelluláris konverziójának módszerei | |
CA2392202C (en) | Constructs for delivery of therapeutic agents to neuronal cells | |
TW201718627A (zh) | 重組梭菌神經毒素及其使用與形成方法、包括其之醫藥組合物及對應其之前驅物、編碼前驅物之核酸序列及其獲得方法與前驅物之形成方法、載體與包括核酸序列之重組宿主細胞 | |
Gallagher et al. | Identification and localization of the membrane‐associated, ATP‐binding subunit of the oligopeptide permease of Salmonella typhimurium | |
US20030147895A1 (en) | Constructs for delivery of threrapeutic agents to neuronal cells | |
WO1995030016A1 (en) | Methods for peptide synthesis and purification | |
JP4005633B2 (ja) | F型ボツリヌス毒素およびその用途 | |
Chiron et al. | Pseudomonas exotoxin exhibits increased sensitivity to furin when sequences at the cleavage site are mutated to resemble the arginine‐rich loop of diphtheria toxin | |
AU2011288456B2 (en) | Selective manufacture of recombinant neurotoxin polypeptides | |
KR20230144618A (ko) | 변형된 신경독소의 단일 사슬 폴리펩티드 및 이의 용도 | |
AU2001269305B2 (en) | Expression system | |
JP4273250B2 (ja) | 組換え毒素フラグメント | |
AU2001269305A1 (en) | Expression system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
N231 | Notification of change of applicant | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |