KR102609790B1

KR102609790B1 - O-당단백질에 대한 프로테아제 및 결합 폴리펩티드

Info

Publication number: KR102609790B1
Application number: KR1020197036837A
Authority: KR
Inventors: 프레드릭 레오; 롤프 루드; 스티븐 비요크; 마린 메야르; 프레드릭 올손
Original assignee: 게노비스 에이비
Priority date: 2017-05-26
Filing date: 2018-05-25
Publication date: 2023-12-04
Also published as: JP2023103233A; CA3063815A1; WO2018215656A9; CN111183220A; CN111183221B; AU2018272984A1; US20200087643A1; JP7195008B2; EP3630967A1; KR102608876B1; AU2018272400A1; IL270950A; JP2020522242A; CN111183221A; IL270949A; US20230212543A1; EP3630968A1; WO2018215657A1; WO2018215656A1; CA3063828A1

Abstract

본 발명은 O-연결 당단백질에 결합하지만 가수분해 활성이 없거나 감소된 신규한 엔도프로테아제, 이의 돌연변이체, 및 이의 연구 및 단리 방법에서의 용도에 관한 것이다.

Description

O-당단백질에 대한 프로테아제 및 결합 폴리펩티드

최근, 생물학적 기능에 대한 글리코실화의 영향, 특히 O-연결 글리칸에 대한 관심이 증가하고 있다. 그러나, 이러한 중요한 단백질 변형에 대한 관심이 재개되고 있지만, 글리칸, 및 당단백질을 효율적으로 연구하기 위한 도구는 부족하다.

천연 단백질로부터 O-연결 글리칸 제거 및 글리칸 서열분석 둘 모두에 매우 유용한 몇몇 엑소- 및 엔도글리코시다제가 개발되었다. 이러한 둘 모두의 접근법은 당단백질의 이질성을 감소시키기 위해 개별적으로 사용될 수 있으며, 따라서, 질량 분석에서 단백질 및 이의 단편화된 펩티드의 분석을 용이하게 할 수 있다. 가수분해에 의해 영향을 받는 기능의 하류 분석에 의한 글리칸의 생물학적 효과의 보다 효율적인 분석이 또한 수행될 수 있다. 그러나, 이러한 도구는, 예컨대 O-연결 당단백질의 식별, 글리코실화 부위의 결정 및 O-연결 글리코펩티드의 정제를 용이하게 하는데 효율적이지 않다.

O-글리칸에 결합하고 주로 글리칸에 근접한 R-N-결합을 가수분해하는 최초의O-당단백질-특이적 엔도프로테아제가 1991/1992년에 보고되었다(Abdullah et al., J Bacteriol 173, 5597-5603 (1991); Abdullah et al., Infect Immun 60, 56-62 (1992)). 그러나, 이러한 효소는 시알산을 포함하는 O-글리칸(대부분이지만 모두 O-연결 글리칸과는 거리가 먼)에 대해서만 특이적이고 특정한 아미노산 요구를 가지므로 일반적으로 낮은 가수분해 수준을 야기하기 때문에 의약 및 생명공학에 대한 유용성이 제한적이다. O-연결 당단백질을 연구하기 위한 보다 우수한 도구가 필요하다.

본 발명자들은 본원에서 LS로 지칭되는 아커만시아 뮤시니필라(Akkermansia muciniphila)로부터의 신규한 폴리펩티드를 확인, 식별 및 특성을 분석하였다. 상기 폴리펩티드는 엔도프로테아제, 구체적으로 특정 아미노산 서열에 대한 특이성 또는 제한을 나타내지 않으면서 O-연결 글리칸에 대해 아미노산 결합 N 말단 및 이의 근접한 곳을 절단/가수분해하는 작용을 한다.

본 발명자들은 또한 LS의 서열을 변형시키고 O-연결 글리칸에 결합할 수 있지만 당단백질을 가수분해하는 능력이 없거나 감소된 돌연변이체를 식별하였다. 이러한 돌연변이체는 유리 O-글리칸, O-글리코펩티드 및/또는 O-당단백질의 선택적 제거, 농축 또는 정제에 사용될 수 있다.

따라서, 본 발명의 제1 양태에서, 다음을 포함하는 O-글리코실화된 단백질에 특이적인 엔도프로테아제 활성을 갖는 폴리펩티드가 제공된다:

(a) 서열번호 1의 아미노산 서열;

(b) 서열번호 1의 아미노산 서열과 적어도 85% 동일한 아미노산 서열; 또는

(c) 서열번호 1의 서열의 단편인 아미노산 서열 또는 서열번호 1의 아미노산 서열과 85% 동일한 아미노산 서열의 단편.

본 발명은 또한 O-당단백질을 가수분해하는 방법을 제공하며, 여기서, 상기 방법은 단백질을 포함하는 샘플을 본 발명의 폴리펩티드와 접촉시키는 단계 및 선택적으로 가수분해 생성물의 검출 또는 분석을 추가로 포함하는 단계를 포함한다.

추가로, 단백질을 포함하는 샘플을 본 발명의 폴리펩티드와 접촉시키고 생성된 생성물을 검출 및/또는 분석하는 단계를 포함하는, 단백질의 글리코실화 상태를 평가하는 방법이 제공되며, 선택적으로, 절단 생성물의 존재 또는 부재는 샘플에서 O-당단백질의 존재 또는 부재를 결정하는데 사용되고/되거나, 상기 분석은 O-글리칸 쇄 및/또는 이의 O-당단백질의 부착 위치를 식별하기 위해 수행된다.

본 발명의 제2 양태에서, 다음을 포함하는, O-글리칸, O-글리코펩티드 및/또는 O-당단백질에 결합할 수 있고 O-글리코실화된 단백질에 특이적인 엔도프로테아제 활성이 없거나 감소된 폴리펩티드가 제공된다:

(a) 서열번호 5의 아미노산 서열;

(b) 서열번호 5 또는 서열번호 20의 아미노산 서열과 적어도 85% 동일한 아미노산 서열; 또는

(c) 서열번호 5 또는 서열번호 20의 절편인 아미노산 서열, 또는 서열번호 5 또는 서열번호 20의 아미노산 서열과 85% 동일한 아미노산 서열의 단편.

본 발명은 또한 O-글리칸, O-글리코펩티드 및/또는 O-당단백질에 결합하는 방법을 제공하며, 여기서 상기 방법은 O-글리칸, O-글리코펩티드 및/또는 O-당단백질을 포함하는 샘플을 본 발명의 폴리펩티드와 접촉시키고, 선택적으로 O-글리칸, O-글리코펩티드 또는 O-당단백질이 결합되었는지 여부를 결정하고/하거나 O-글리칸 및 임의의 연결된 당단백질, O-글리코펩티드 또는 O-당단백질을 생성된 혼합물로부터 분리하는 단계를 포함한다.

추가로, 단백질을 포함하는 샘플을 본 발명의 폴리펩티드와 접촉시키고 단백질이 상기 폴리펩티드에 의해 결합되는지 여부를 결정하는 단계를 포함하는, 단백질의 글리코실화 상태를 평가하는 방법이 제공된다.

또한, 샘플 중의 O-글리코펩티드 및/또는 O-당단백질의 검출 방법이 제공되며, 여기서, 상기 방법은 다음의 단계를 포함한다:

(a) 상기 샘플을 본 발명의 폴리펩티드와 접촉시켜 본 발명의 폴리펩티드와 O-연결 글리코펩티드 및/또는 O- 당단백질 사이에 복합체를 형성하도록 하는 단계(O-연결 글리코펩티드/단백질-폴리펩티드 복합체);

(b) 선택적으로 접촉된 샘플로부터 상기 폴리펩티드를 분리하는 단계; 및

(c) 분리된 폴리펩티드가 O-연결 글리코펩티드 또는 당단백질에 결합했는지 여부를 결정하여 샘플 중의 O-연결 글리코펩티드 또는 당단백질의 존재 또는 부재를 결정하는 단계.

도 1: LS 발현 및 정제. LS를 pET21(a)+ 벡터에서 C-말단 His-태그가 있는 융합 단백질로서 발현시켰다. BL21(DE3) Star로 형질전환시킨 후에, 4개의 개별적인 클론을 발현시키고 His GravityFlow 컬럼에서 균질하게 정제하였다. 정제된 샘플 중의 단백질의 총 양 및 SDS-PAGE에 기반한 순도에 기초하여, 조사된 4개 클론 모두가 동일하게 잘 발현되었다.
도 2: LS는 특히 O-글리칸을 함유하는 단백질에 작용한다 - 도는 SDS-PAGE에 의해 분석된 생성물을 나타낸다. LS를 IgG 또는 IgA와 함께 항온 처리하면 IgA의 특이적 분해가 발생하지만, IgG(허셉틴/트라스투주맙)에 대한 가시적인 활성은 없었다. 모든 항온 처리는 PBS에서 37℃에서 밤새 이루어졌다. 이러한 조건 동안 시알리다제(Am0707)의 첨가는 LS의 활성에 필요하지 않았다.
도 3: 최적의 효소 조건. LS는 넓은 pH 범위에서 활성이고(A), NaCl을 잘 견뎌내지만(B), EDTA에 대해 매우 민감하며(C, D), Zn2+에 의해 부분적으로 억제된다(D). 모든 실험(pH 분석 제외)은 37℃에서 PBS에서 밤새 수행하였다. pH 최적 측정을 위해, 효소를 20 mM Tris-HCl (pH 6.8-8.8) 또는 50 mM 아세트산 (pH 5.6)에서 항온 처리하였다.
도 4: LS의 활성은 글리칸 조성에 의해 조절된다. (A) LS로 30분 동안 가수분해 하기 전에 특정 글리칸을 순차적으로 제거한 결과 시알릴화된 단백질에서 활성이 매우 낮고, 비시알릴화된 단백질에서 활성이 높고, 갈락토스가 제거된 샘플에서는 활성이 없었다. (S) 시알리다제, (SG) 시알리다제 및 갈락토시다제, (LS) LS. (B) 완전히 글리코실화된(엔브렐) 또는 시알리다제 처리된(엔브릴(S)) 당단백질의 연장된 항온 처리(밤새)는 두 샘플 모두에서 완전한 가수분해를 초래하였다. 엔브렐은 본원에서 에타너셉트(etanercept)로도 지칭될 수 있다. (C) 에타너셉트(TNFαR)의 TNFα 결합 부분을 시알리다제("시알리다제"), O-글리코시다제/시알리다제("O-glyc"), 또는 PNGaseF("N-glyc")로 전처리하여 시알산, O-글리칸, 및 N-글리칸을 각각 제거하였다. LS를 샘플에 첨가하고, 분석 전에 항온 처리를 밤새 지속하였다. LS는 O-글리코시다제로 처리된 샘플을 제외한 모든 샘플에서 활성을 가졌다.
도 5: LS가 O-글리칸의 당단백질 N-말단을 가수분해한다는 것을 보여주는 검색 결과. LS를 사용하여 단편으로 가수분해되고, 이어서 O-글리코시다제 처리로 탈글리코실화된 에타너셉트를 질량 분석(LC/MS 및 MS/MS)하였다. 확인된 펩티드(백색 및 해칭 박스)를 m/z 값 및 MS/MS 데이터에 기초하여 에타너셉트의 서열에 맞추고, y' 및 b' 이온을 작은 회색 박스로 표시하였다. 모든 백색 및 해칭 박스(예컨데, 펩티드)는 T 또는 S에서 직접 시작하며, 여기에 O-글리칸이 부착된다. 선행 아미노산은 다양하고(P, S, H, T, G), 가수분해에 영향을 미치지 않는 것으로 보인다. (A) S/T-펩티다제로 생성된 펩티드를 구체적으로 검색하는, 편향 접근접을 사용한 분석. (B) 비편향 접근법을 사용한 분석.
도 6: 불활성화된 LS는 O-연결 당단백질에 특이적으로 결합한다. 메탈로프로테아제 활성 부위를 돌연변이시켜 기질 친화성 또는 상호작용에 영향을 미치지 않으면서 촉매능을 제거하였다. 구체적으로 이는 E를 A로 교환하여 클론 "LS_mut"(LS_E206A로도 지칭됨)를 생성함으로써 이루어졌다. (A) LS는 시알리다제의 존재 하에 엔브렐을 가수분해 할 수 있었지만, 불활성화된 Lsmut는 시험된 조건 하에 엔브렐을 가수분해할 수 없었다. 활성의 상실을 SDS-PAGE 상에서 확인하였다. (B) 가수분해 활성이 상실되었지만, LS_mut는 여전히 O-당단백질에 결합할 수 있었다. 특이적 결합을 고정된 LS_E206A를 갖는 스핀 컬럼에서 확인하였으며, O-연결 당단백질에 대한 특이적 친화성을 입증하였다. 세파로스에 LSmut를 고정시킴으로써, IgA를 친화성 정제할 수 있었다. O-글리칸이 없는 허셉틴(트라스투주맙), 및 O-글리코시다제 처리된 IgA는 컬럼에 결합하지 않았지만, 통과물(flowthrough, FT)에서 검출될 수 있다. Neur = 뉴라미니다제/시알리다제 0707.
도 7: α2-3 결합된 시알산은 LS의 효율을 제한한다. 엔브렐을 당단백질 기질로 사용하여 30분 내지 20시간 동안 다양한 시알리다제 세트와 LS를 동시 항온 처리하면 α2-3 특이적 시알리다제 1757의 존재 하에, 또는 혼합물(0707 + 1757)과 함께 더 높은 효율을 나타낸 반면, 넓은 범위의 시알리다제 0707은 LS의 전체 활성에 필요한 것은 아니므로 α2-6 (및 α2-8) 결합은 LS 활성에 대한 우려가 아님을 시사한다.
도 8: LS 활성의 개략도. LS는 O-연결 GalNAc에 부착된 말단 갈락토스를 우선적으로 결합시켜 글리칸이 부착된 세린 또는 트레오닌의 N-말단 가수분해를 초래한다. 시알산의 존재는 LS의 효율을 감소시키지만, 이를 억제하지는 않을 것이다. N-연결 글리칸에서는 활성을 보이지 않는다.
도 9: 에리스로포이에틴을 상이한 조합의 LS, N-글리칸을 제거하기 위한 PNGaseF, 시알산을 제거하기 위한 시알리다제, 및 O-글리칸을 제거하기 위한 O-글리코시다제로 절단한 실험 결과. 반응 생성물을 SDS-PAGE, RPLC 및 ESI 질량 분석법으로 분석하였다 (A) SDS-PAGE 분석 결과: 레인 1 = PNGaseF 및 시알리다제로 처리된 EPO; 레인 2 = PNGaseF 및 시알리다제 + LS로 처리한 EPO; 레인 3 = PNGaseF + LS로 처리한 EPO; 레인 4 = LS로 처리하기 전에 PNGaseF, 시알리다제, O-글리코시다제로 처리한 EPO; 레인 5 = 효소 대조군. 밴드 X = 비절단된 EPO; 밴드 Y = LS에 의해 소화된 EPO의 N 말단 단편; 밴드 Z = LS에 의해 소화된 EPO의 C 말단 단편. 레인 2 및 3은 시알산이 제거된 곳 및 시알산이 손상되지 않은 곳에서 LS가 EPO를 절단한다는 것을 보여준다. 레인 2 및 3은 N-글리칸이 PNGaseF로 제거된 곳에서 LS가 EPO를 또한 절단한다는 것을 보여준다. 레인 4는 O-글리칸이 제거된 곳에서 LS가 EPO를 절단하지 않는다는 것을 보여준다. (B) UV 크로마토그램은 PNGaseF 및 시알리다제 + LS로 처리된 EPO에 대한 RPLC 분리의 결과를 보여준다. 도시된 바와 같이 2개의 주요 피크가 확인되었다. 피크 1은 LS에 의해 소화된 EPO의 C 말단 단편이다; 피크 2는 LS에 의해 소화된 EPO의 N 말단 단편이다; (C, D)는 질량 분석법 분석 결과를 나타낸다. 도 C는 (현재 N 말단) 세린에 여전히 부착된 O-글리칸을 갖는 EPO의 C 말단 단편의 질량을 나타낸다(사각형 = GlcNAc, 원 = 갈락토스). 질량의 차이는 샘플 일부분에서 O-글리칸의 분해 차이(말단 갈락토스 손실)에 기인하며, 이는 MS 기구의 이온화 에너지에 의해 야기될 수 있다; 도 D는 글리칸이 결여된 EPO의 N 말단 단편과, 글리칸이 여전히 부착된 소화되지 않은 EPO를 보여준다.
도 10: LS_E206A가 일부 활성을 보유하는 반면 LS_H205A/E206A(LS _HE206AA로도 지칭될 수 있음)가 완전히 비활성화된 실험 결과. LS 돌연변이체 LS_E206A (A) 및 LS_H205A/E206A (B)의 활성을 야생형 LS 효소와 비교하여, 에타너셉트의 TNFα 결합 부분(TNFaR2; 본원에서 TNFaR로도 지칭될 수 있음) 및 에타너셉트 그 자체(에타너셉트)를 포함하여 비시알릴화된 O-글리코실화된 기질에 대해 평가하였다. 상이한 농도의 LS 돌연변이체를 1 μg 기질(1:1 내지 15;1, 효소:기질)에 첨가하고, SDS-PAGE 상에서 분석하기 전에 37℃에서 밤새 항온 처리하였다.
A) 레인 1: 비시알릴화된 기질 단독; 레인 2: LS 단독, 레인 3: 0.5 μg LS_E206A, 레인 4: 5 μg LS_E206A, 레인 5: TNFaR2 + LS(1:1 비율), 레인 6: TNFaR2 + LS_E206A(1:1 비율).
B) 레인 1: 비시알릴화된 기질 단독; 레인 2: LS_H205A/E206A + 에타너셉트(15:1 비율), 레인 3: LS_H205A/E206A + 에타너셉트(5:1 비율), 레인 4: LS_H205A/E206A + 에타너셉트(1:1 비율), 레인 5: LS + 에타너셉트(1:1 비율), 레인 6: LS_H205A/E206A
도 11: 수지에 고정화된 LS_H205A/E206A가 단백질을 함유하는 O-글리칸에 특이적으로 결합함을 보여주는 실험 결과. 도는 각각의 경우에 시작/로딩 물질, 통과물(FT) 및 용리물(E)에 대한 SDS-PAGE 분석을 나타낸다 ( A ) 샘플은 BSA(소 혈청 알부민), 에타너셉트, IgA, 및 IgG를 포함함, 도시된 바와 같이 천연 또는 시알리다제 혼합물 +/- O-글리코시다제로 전처리됨. ( B ) 샘플은 O-글리코실화된 단백질(TNFaR 및 ApoE), N-글리코실화된 단백질(애플리버셉트, AGP (알파-1-산 당단백질), IgG Fc (IgG의 Fc 도메인) 및 비-글리코실화된 단백질(BSA)의 혼합물을 포함함, 시알리다제 혼합물로 전처리됨. ( C ) 샘플은 N-글리코실화된 단백질(세툭시맙, 애플리버셉트, AGP) 및 비-글리코실화된 단백질(BSA, 탄산 무수화효소)의 혼합물을 포함함, 시알리다제 혼합물로 전처리함.
도 12: 고정된 LS_H205A/E206A가 O-당단백질의 결합에 대한 농도 의존능을 갖는다는 것을 보여주는 실험 결과. 비시알릴화된 에타너셉트(50~250 μg; 100 μl PBS 중)를 상이한 고정화 조건의 LS_H205A/E206A(5~15 mg/mL)를 포함하는 50 μl PBS-평형화된 LS_H205A/E206A 수지에 첨가하였다. 단백질을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하게 하였다. 수지를 PBS(350 μl)로 3회 세척한 다음 8 M 우레아(50 μl, 5분 항온 처리; 2회 반복)를 첨가하여 용리하였다. 결합에서 우레아 및 구아니딘 히드로클로리드(GHCl)의 효과를 연구하기 위해, 결합 완충액에 50 μg의 비시알릴화된 에타너셉트와 함께 포함시켰지만, 다른 것은 동일하게 취급하였다. (A) 모든 샘플을 SDS-PAGE에서 분리하고 GelDoc EZ 및 소프트웨어 ImageLab을 사용하여 밀도 측정법을 통해 밴드 강도를 결정하였다. 언급된 퍼센트는 대조군과 비교하여 밴드 강도를 나타낸다. (B) 밴드 강도에 의해 결정된 단백질 결합 능력을 고정된 LS_H205A/E206A의 양에 대해 플롯팅하였다.
도 13: LS_H205A/E206A가 약 3 mg의 에타너셉트/mL 수지를 친화성 정제할 수 있음을 보여주는 실험 결과. 비시알릴화된 에타너셉트(10~200 μg; PBS 중의 100 μl)를 50 μl PBS-평형화된 LS_H205A/E206A 수지에 첨가하였다. 단백질을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하게 하였다. 수지를 PBS(350 μl)로 3회 세척한 다음 8 M 우레아(50 μl, 5분 항온 처리; 2회 반복)를 첨가하여 용리하였다. 모든 샘플을 SDS-PAGE에서 분리하고 GelDoc EZ 및 소프트웨어 ImageLab을 사용하여 밀도 측정법을 통해 밴드 강도를 결정하였다. 언급된 퍼센트는 대조군과 비교하여 밴드 강도를 나타낸다.
도 14: LS_H205A/E206A-기질 상호작용이 높은 이온 강도 및 완충액 부피/유형의 차이에 둔감하고, 넓은 pH 범위에서 작동함을 보여주는 실험 결과. (A) 비시알릴화된 에타너셉트, 50 μg; 도시된 바와 같은 농도에서 첨가된 NaCl을 포함하는 PBS 중의 100 μl (B) 비시알릴화된 에타너셉트, 50 μg; 도시된 바와 같이 PBS 중의 100~300 μl; (C) 비시알릴화된 에타너셉트(50 μg) 및 도시된 바와 같이 상이한 pH에서 상이한 완충액 중의 BSA(50 μg)의 샘플로부터의 통과물; (D) C 샘플로부터의 용리물.
도 15: 변성 또는 세제의 첨가가 LS_H205A/E206A에 결합된 O-당단백질을 용리한다는 것을 보여주는 실험 결과. 비시알릴화된 에타너셉트(50 μg; PBS 중의 100 μl)를 50 μl의 PBS-평형화된 LS_H205A/E206A 수지에 첨가하였다. 단백질을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하게 하였다. 수지를 PBS(350 μl)로 3회 세척한 다음 (A) 1~8 M 우레아 또는 (B) 1.25~10% SDS (50 μl, 5분 항온 처리; 2회 반복)를 첨가하여 용리하였다. 모든 샘플을 분석을 위해 SDS-PAGE 상에서 분리하였다.
도 16a: LS를 이용한 LS_H205A/E206A-결합 O-당단백질의 효소 용리를 보여주는 실험 결과. 비시알릴화된 아바타셉트(10 μg, PBS 중의 100 μl) 및 에타너셉트 (50 μg; PBS 중의 100 μl)를 50 μl PBS-평형화된 LS_H205A/E206A 수지에 첨가하였다. 단백질을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하게 하였다. 100 μl PBS의 총 부피 중의 50 유닛 LS를 첨가하기 전에 수지를 결합 완충액(350 μl)으로 3회 세척하였다. 샘플을 진탕(450 rpm)하면서 37℃에서 추가의 6 내지 24시간 동안 항온 처리하였다. 8 M 우레아(50 μl, 5 분 인큐베이션; 2회 반복)를 첨가하여 컬럼을 최종적으로 용리하기 전에 원심분리(1000 g, 1 분)를 통해 LS 방출 O-당단백질/글리코펩티드를 수집하였다. 모든 샘플을 분석을 위해 SDS-PAGE 상에서 분리하였다.
도 16b: LS로 용리된 에타너셉트의 질량 분석(LC/MS 및 MS/MS)의 결과. 확인된 펩티드(도 16b.1)는 에타너셉트(도 16b.2)의 LS 소화에서 생성된 것과 일치하였다. m/z 값 및 MS/MS 데이터를 기초로 확인된 펩티드(흰색 박스)를 에타너셉트의 서열에 맞추었으며, y' 및 b' 이온은 작은 회색 박스로 표시하였다. 모든 흰색 박스(예컨대 펩티드)는 O-글리칸이 부착된 T 또는 S에서 직접 시작한다.
도 17: O-글리코실화된 혈청 단백질의 친화성 정제 및 농축을 입증하는 결과. (A) 비시알릴화된 혈청(20 μl; PBS 중의 100 μl )을 50 μl PBS 평형화된 LS_H205A/E206A 수지에 첨가하였다. 단백질을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하게 하였다. 수지를 결합 완충액(350 μl)으로 3회 세척한 다음 8 M 우레아를 첨가하여 용리하였다. (B) 상호작용에 대한 글리칸의 영향을 조사하기 위해, 샘플을 시알리다제 혼합물 +/- O-글리코시다제로 전처리하였다. 하류 정제를 상기와 같이 수행하였다. (C) 혈청 (40 μl)을 PBS (최대 100 μl) 및 시알리다제 혼합물(50~500 유닛)과 혼합하고 PBS 평형화된 컬럼에 첨가하고, 엔드-오버-엔드 회전으로 실온에서 2시간 동안 항온 처리한 후, 샘플을 상기와 같이 세척하고 용리하였다. 모든 샘플을 분석을 위해 SDS-PAGE 상에서 분리하였다.
도 18: 인간 혈청으로부터 O-당단백질을 농축한 결과. PBS 중에서 2.5x로 희석하여 100 μl로 희석된 인간 혈청을 스핀 컬럼 중의 50 μl PBS 평형화된 LS_H205A/E206A 수지에 적용하였다. 50~500 유닛의 시알리다제 혼합물을 첨가하고 실온에서 2시간 동안 수지 상에서 동시 항온 처리하였다. 통과물을 수집하고, 수지를 PBS로 5~10회 세척하였다. 결합된 단백질을 8 M 우레아 중에서 용리한 후 5 mM DTT를 첨가하여 변성 및 환원을 수행하고 37℃에서 60분 동안 항온 처리하였다. 환원된 시스테인을 실온의 어두운 곳에서 30분 동안 15 mM 요오도아세트아미드로 알킬화 하였다. 스핀 탈염 컬럼에서 샘플을 50 mM Tris pH 8.0으로 완충액 교환하였다. 트립신(2.5 μg)을 용액에 첨가하고 소화를 37℃에서 밤새 수행하였다. 펩티드를 분리하고 45 ℃에서 MQ 중의 0.1%FA : 95% ACN 중의 0.1%FA 구배 및 0.2 ml/분의 유속에서 C18 컬럼 상에서 RP-LC MS/MS를 사용하여 분석하였다. ESI-Q-TOF에서 검출하였다. 데이터를 mgf 포맷 파일로 변환하고 Swiss Prot 데이터베이스에 대해 검색하였다. (A) O-글리코실화된 단백질 또는 비-O-글리코실화된 것으로 주석이 붙은 단백질로부터 유래한 확인된 펩티드. >6의 매칭 펩티드 및 >200의 MASCOT 점수를 갖는 단백질만 포함시켰다. (B) 상이한 세척 단계는 확인된 펩티드의 변화뿐만 아니라, O-글리코실화된 단백질 대 비-O-글리코실화된 단백질의 변화된 비를 초래하였다. (C). Sia = 시알리다제 처리된 것; Sia Pre = 시알리다제 전처리 된 것.
도 19: 고정화된 이중-돌연변이체가 또한 보다 짧은 O-글리코펩티드에 결합한다는 것을 보여주는 실험 결과. 도 19a는 O-글리코실화된 펩티드(글리코드로소신 (GD)) 및 몇몇 비-글리코실화된 펩티드(H2686, H4062 H8390 및 인슐린 산화된 베타 쇄(IOB))의 제조된 혼합물에 대한 결합의 LC/MS 분석에 대한 대표적인 결과를 나타낸다. 도 19b는 트립신 소화가 단일 O-글리코실화된 펩티드를 생성할 것임을 나타내는 IgA의 개략도를 보여준다. 도 19c는 IgA의 트립신 소화에 결합하는 LC/MS 분석에 대한 대표적인 결과를 보여준다.
도 20: 고정화된 이중-돌연변이체가 다른 상업적으로 입수가능한 O-당단백질 결합 매트릭스와 유리하게 비교됨을 보여주는 실험 결과. 도 20a는 도시된 바와 같이 상이한 고정화된 렉틴 또는 LS 이중 돌연변이체와의 항온 처리 후 통과물(FT) 또는 용리물(E)에서 에타너셉트 또는 비시알릴화된 에타너셉트(에타너셉트(S))의 존재를 비교하는 대표적인 SDS-PAGE 겔을 나타낸다. 도 20b는 1.5 μg의 직접적으로 로딩된 기질의 양성 대조군에 대한 겔의 밀도 측정 분석을 보여준다.
서열의 간단한 설명
서열번호 1은 O-당단백질-특이적 엔도프로테아제 활성을 갖는 폴리펩티드의 아미노산 서열이다.
서열번호 2는 O-당단백질-특이적 엔도프로테아제 활성을 갖는 본 발명의 예시적인 폴리펩티드의 아미노산 서열이다. 서열번호 1과 비교하여, 이는 추가의 N 말단 메티오닌 및 C-말단 링커 + His₆ 태그를 포함한다. 이러한 서열로 이루어진 폴리펩티드는 본원에서 LS로 지칭될 수 있다.
서열번호 3은 서열번호 2의 서열을 갖는 폴리펩티드를 인코딩하는 뉴클레오티드 서열이다.
서열번호 4는 O-당단백질-특이적 엔도프로테아제 활성을 갖는 아커만시아 뮤시니필라로부터 단리된 폴리펩티드의 야생형 아미노산 서열이다. 서열번호 1과 비교하여, 이는 N-말단에서 신호 모티프를 포함한다.
서열번호 5는 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성은 없거나 감소된 폴리펩티드의 아미노산 서열이다.
서열번호 6은 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성은 없거나 감소된 예시적인 폴리펩티드의 아미노산 서열이다. 서열번호 5와 비교하여, 이는 추가의 N 말단 메티오닌 및 C-말단 링커 + His₆ 태그를 포함한다. 이러한 서열로 이루어진 폴리펩티드는 본원에서 LS_E206A로 지칭될 수 있다.
서열번호 7은 서열번호 6의 서열을 갖는 폴리펩티드를 인코딩하는 뉴클레오티드 서열이다.
서열번호 8은 O-당단백질-특이적 엔도프로테아제 활성을 갖는 본 발명의 예시적인 폴리펩티드의 메탈로프로테아제 도메인 모티프이다.
서열번호 9는 아커만시아 뮤시니필라로부터 단리된, 시알리다제 Am1757의 야생형 아미노산 서열이다. 이는 N 말단에 신호 모티프를 포함한다.
서열번호 10은 서열번호 9와 비교하여 N 말단에 신호 모티프가 결여된, 시알리다제 Am1757의 야생형 아미노산 서열이다.
서열번호 11은 예시적인 시알리다제 Am1757의 아미노산 서열이다. 서열번호 10과 비교하여, 이는 추가의 N 말단 메티오닌 및 C-말단 링커 + His₆ 태그를 포함한다.
서열번호 12는 아커만시아 뮤시니필라로부터 단리된, 시알리다제 Am0707의 야생형 아미노산 서열이다. 이는 N 말단에 신호 모티프를 포함한다.
서열번호 13은 서열번호 12와 비교하여 N 말단에 신호 모티프가 결여된, 시알리다제 Am0707의 야생형 아미노산 서열이다.
서열번호 14는 예시적인 시알리다제 Am0707의 아미노산 서열이다. 서열번호 13과 비교하여, 이는 추가의 N 말단 메티오닌 및 C-말단 링커 + His₆ 태그를 포함한다.
서열번호 15는 S. 오랄리스(oralis)로부터 단리된 O-글리코시다제의 아미노산 서열이다.
서열번호 16 및 17은 프라이머 서열이다.
서열번호 18은 EPO의 아미노산 서열을 나타낸다.
서열번호 20은 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 폴리펩티드의 아미노산 서열이다.
서열번호 21은 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 본 발명의 예시적인 폴리펩티드의 아미노산 서열이다. 서열번호 20과 비교하여, 이는 추가의 N 말단 메티오닌 및 C-말단 링커 + His₆ 태그를 포함한다. 이러한 서열로 이루어진 폴리펩티드는 본원에서 LS_HE206AA 또는 LS_H205A/E206A로 지칭될 수 있다.
서열번호 22는 서열번호 21의 서열을 갖는 폴리펩티드를 인코딩하는 뉴클레오티드 서열이다.
서열번호 23, 24 및 25는 각각이 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 본 발명의 폴리펩티드의 파괴된 메탈로프로테아제 도메인 모티프의 서열이다.
서열번호 26, 27 및 28은 각각이 O-당단백질-특이적 엔도프로테아제 활성을 갖는 폴리펩티드의 아미노산 서열이다.
서열번호 29, 30 및 31은 O-당단백질-특이적 엔도프로테아제 활성을 갖는 예시적인 폴리펩티드의 아미노산 서열이다. 각각 서열번호 26, 27 및 28과 비교하여, 서열번호 29, 30 및 31 각각은 추가의 N 말단 메티오닌 및 C-말단 링커 + His₆ 태그를 포함한다.
서열번호 32, 33 및 34는 O-당단백질-특이적 엔도프로테아제 활성을 갖는 폴리펩티드의 야생형 아미노산 서열이며, 이는 각각 슈도모나스 에루지노사 PAO1, 박테리오데스 테타이오타오미크론 VPI-5482, 및 클로스트리디움 퍼프린젠스로부터 단리되었다. 각각 서열번호 26, 27 및 28과 비교하여, 각각은 N 말단에 신호 모티프를 포함한다.
서열번호 35, 36 및 37은 각각 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 폴리펩티드의 아미노산 서열이다.
서열번호 38, 39, 및 40은 각각 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 본 발명의 예시적인 폴리펩티드의 아미노산 서열이다. 각각 서열번호 35, 36 및 37과 비교하여, 서열번호 38, 39 및 40은 각각 추가의 N 말단 메티오닌 및 C-말단 링커 + His₆ 태그를 포함한다.
서열번호 41 내지 43은 O-당단백질-특이적 엔도프로테아제의 대표적인 메탈로프로테아제 모티프의 아미노산 서열이다.
서열번호 44 내지 46은 O-글리칸에는 결합할 수 있지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 폴리펩티드의 대표적인 파괴된 메탈로프로테아제 모티프의 아미노산 서열이다.
서열번호 47은 글리코드로소신 펩티드의 아미노산 서열이다. T 잔기에 O-글리코실화 부위가 있다.
서열번호 48 내지 50은 O-글리코실화 되지 않은 펩티드의 아미노산 서열이다.

개시된 생성물과 방법의 상이한 적용은 기술 분야의 특정한 필요에 따라 변경될 수 있는 것으로 이해된다. 또한, 본원에서 사용된 용어는 오직 발명의 특정 구현예를 설명하기 위한 목적으로 이해되고. 제한하는 것을 의도하지 않는다. 위쪽 또는 아래쪽의 본원에서 인용된 모든 간행물, 특허 및 특허 출원은 그 전체가 참조로서 본 명세서에 포함된다.

본 명세서와 첨부된 청구 범위에서 사용된, 단수 형태인 "하나의"("a", "an"), 및 "그"("the")는 달리 명시적으로 지시하고 있지 않는 한 복수의 지시 대상을 포함한다. 따라서, 예를 들어, "하나의 폴리펩티드"는 "폴리펩티드들"을 지칭하며 기타 등등도 그러하다.

일반적인 폴리펩티드 특징

"폴리펩티드"는 본원에서 광의의 의미로 사용되어 2개 이상의 서브유닛 아미노산, 아미노산 유사체, 또는 다른 펩티드 모방체의 화합물을 지칭한다. 용어 "폴리펩티드"는 따라서 짧은 펩티드 서열 및 보다 긴 폴리펩티드 및 단백질을 또한 포함한다. 용어 "단백질", "펩티드" 및 "폴리펩티드"는 상호교환적으로 사용될 수 있다. 본원에서 사용된 바와 같이, 용어 "아미노산"은 D 또는 L 광학 이성질체를 포함하여, 천연 및/또는 비천연 또는 합성 아미노산, 및 아미노산 유사체 및 펩티드 모방체를 지칭한다.

폴리펩티드는 재조합 또는 합성 방법을 포함하여, 적합한 방법에 의해 생성될 수 있다. 예를 들어, 폴리펩티드는 당업계에 공지된 표준 기술, 예컨대 Fmoc 고상 화학, Boc 고상 화학을 사용하여 직접적으로, 또는 용액상 펩티드 합성에 의해 합성될 수 있다. 대안적으로, 폴리펩티드는 핵산 분자 또는 상기 폴리펩티드를 인코딩하고 있는 벡터를 포함하는 세포, 전형적으로 박테리아 세포를 형질전환시켜 생성될 수 있다. 박테리아 숙주 세포에서 발현에 의한 폴리펩티드의 생성은 아래에서 기술되며 실시예에서 설명된다. 본 발명은 본 발명의 폴리펩티드를 인코딩하는 핵산 분자 및 벡터를 제공한다. 본 발명은 또한 이러한 핵산 또는 벡터를 포함하는 숙주 세포를 제공한다. 본원에 개시된 폴리펩티드를 인코딩하는 예시적인 폴리뉴클레오티드 분자는 서열번호 3 및 7로 제공된다. 이들 서열 각각은 5' 말단에서 N 말단 메티오닌(ATG)에 대한 코돈, 3' 말단에서 정지 코돈(TAA) 앞에, Gly-Ser-Gly 링커 및 6x His 태그에 대한 코돈을 포함하며, 이는 선택적으로 제외될 수 있다. 추가의 메티오닌 및 태그의 선택적인 포함은 아래에서 보다 상세하게 논의된다.

용어 "핵산 분자" 및 "폴리뉴클레오티드"는 본원에서 상호교환적으로 사용되며 임의의 길이의 뉴클레오티드의 중합체 형태, 디옥시리보뉴클레오티드 또는 리보뉴클레오티드, 또는 이의 유사체를 지칭한다. 폴리뉴클레오티드의 비-제한적인 예는 유전자, 유전자 단편, 메신저 RAN(mRNA), cDNA, 재조합 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 핵산 프로브, 및 프라이머를 포함한다. 본 발명의 폴리뉴클레오티드는 본 발명의 폴리펩티드를 인코딩하고 단리되거나 실질적으로 단리된 형태로 제공될 수 있다. 실질적으로 단리되는 것은, 임의의 주변 매질로부터 폴리펩티드를 실질적이지만 완전히 단리되지 않을 수 있음을 의미한다. 폴리뉴클레오티드는 의도된 용도를 방해하지 않고 담체 또는 희석제와 혼합될 수 있으며 여전히 실질적으로 단리된 것으로 간주된다. 선택된 폴리펩티드를 "인코딩"하는 핵산 서열은 적절한 조절 서열의 제어 하에 놓였을 때, 예컨대 발현 벡터에서, 생체 내에서 전사(DNA의 경우)되고 번역(mNRA의 경우)되어 폴리펩티드가 되는 핵산 분자이다. 코딩 서열의 경계는 5' (아미노) 말단의 시작 코돈과 3'(카복시) 말단의 번역 정지 코돈에 의해 결정된다. 본 발명의 목적에서, 이러한 핵산 서열은, 비제한적으로 바이러스, 원핵 또는 진핵 mRNA로부터의 cDNA, 바이러스 또는 원핵 DNA 또는 RNA로부터의 게놈 서열, 및 심지어는 합성 DNA 서열을 포함할 수 있다. 전사 종결 서열은 코딩 서열의 3'에 위치할 수 있다.

Sambrook et al (1989, Molecular Cloning - a laboratory manual; Cold Spring Harbor Press)에 예시로서 기술된 바와 같이, 폴리뉴클레오티드는 당업계에 잘 알려진 방법에 따라 합성될 수 있다. 본 발명의 핵산 분자는 삽입된 서열에 작동적으로 연결된 조절 서열을 포함하는 발현 카세트의 형태로 제공될 수 있으므로, 생체 내에서(예컨대, 원핵 또는 진핵 발현 시스템에서) 본 발명의 폴리펩티드가 발현될 수 있다. 차례로, 이러한 발현 카세트는 전형적으로 벡터(예컨대, 플라스미드 또는 재조합 바이러스 벡터) 내에 제공된다. 이러한 발현 카세트는 숙주 대상에 직접적으로 투여될 수 있다. 대안적으로, 본 발명의 폴리뉴클레오티드를 포함하는 벡터는 숙주 대상에 투여될 수 있다. 바람직하게는, 폴리뉴클레오티드는 유전자 벡터를 이용하여 제조 및/또는 투여될 수 있다. 적합한 벡터는 충분한 양의 유전자 정보를 보유할 수 있고, 본 발명의 폴리펩티드를 발현시킬 수 있는 임의의 벡터일 수 있다.

따라서, 본 발명은 이러한 폴리뉴클레오티드 서열을 포함하는 발현 벡터를 포함한다. 이러한 발현 벡터는 분자 생물학 분야에서 통상적으로 구축되고 예컨대 플라스미드 DNA 및 적합한 개시제, 프로모터, 인핸서 및 기타 요소, 예컨대 필요할 수 있고 본 발명의 펩티드의 발현을 가능케 하기 위해 올바른 배향으로 위치한 폴리아데닐화 신호의 사용을 포함할 수 있다. 다른 적합한 벡터는 당업자에게 명백할 것이다. 이와 관련하여 추가의 예로 우리는 Sambrook et al을 참조한다.

본 발명은 또한 본 발명의 폴리펩티드를 발현시키기 위해 변형된 세포를 포함한다. 이러한 세포는 전형적으로 원핵 세포, 예컨대 박테리아 세포, 예컨대 대장균을 포함한다. 이러한 세포는 본 발명의 폴리펩티드를 생성하기 위한 일상적인 방법을 사용하여 배양될 수 있다.

폴리펩티드는 이의 생산, 단리 또는 정제를 돕기 위해 유도체화 되거나 변형될 수 있다. 예컨대, 본 발명의 폴리펩티드가 박테리아 숙주 세포에서 재조합 발현에 의해 생산되는 경우, 폴리펩티드의 서열은 발현을 향상시키기 위해 N 말단에 추가의 메티오닌(M) 잔기를 포함할 수 있다. 또 다른 예로, 본 발명의 폴리펩티드는 분리 수단에 직접적으로 및 특이적으로 결합할 수 있는 리간드의 추가에 의해 다양화되거나 변형될 수 있다. 대안적으로, 폴리펩티드는 결합 쌍의 하나의 구성원의 첨가에 의해 유도체화 또는 변형될 수 있고 분리 수단은 결합 쌍의 또 다른 구성원의 첨가에 의해 유도체화 또는 변형된 시약을 포함한다. 임의의 적합한 결합 쌍이 사용될 수 있다. 바람직한 구현예에서, 본 발명에서 사용하기 위한 폴리펩티드가 결합 쌍의 하나의 구성원의 추가에 의해 유도체화되거나 변형되는 경우, 폴리펩티드는 바람직하게는 히스티딘-태깅되거나 비오틴-태깅된다. 전형적으로, 히스티딘 또는 비오틴 태그의 아미노산 코딩 서열은 유전자 수준에서 포함되고 폴리펩티드는 대장균에서 재조합적으로 발현된다. 히스티딘 또는 비오틴 태그는 전형적으로 폴리펩티드의 말단에, 바람직하게는 C-말단에 있다. 이는 폴리펩티드에 직접 연결되거나 3, 4, 또는 5개의 글리신 잔기, 또는 글리신과 세린 잔기의 혼합물과 같은 임의의 적합한 링커 서열에 의해 간접적으로 연결될 수 있다. 히스티딘 태그는 전형적으로 6개의 히스티딘 잔기로 이루어지지만, 이보다 길거나, 전형적으로 7, 8, 9, 10 또는 20개 이하의 아미노산, 또는 더 짧게, 예컨대 5, 4, 3, 2 또는 1개의 아미노산으로 이루어질 수 있다.

폴리펩티드는 실질적으로 단리된 또는 정제된 형태로 제공될 수 있다. 즉, 폴리펩티드가 발현되었던 세포로부터의 세포 추출물에 존재하는 대부분의 다른 성분으로부터 단리되었다. 실질적으로 정제함으로써, 폴리펩티드는 적어도 50%, 60%, 70%, 80% 또는 바람직하게는 적어도 90% 균질하게 정제되는 것으로 이해될 것이다. 순도 수준은 임의의 적합한 수단에 의해 평가될 수 있지만, 전형적으로 샘플의 SDS-PAGE 분석 후, 쿠마시 블루 검출을 포함한다. 폴리펩티드는 폴리펩티드의 의도된 목적을 방해하지 않고 담체, 희석제 또는 보존제와 혼합될 수 있으며 여전히 실질적으로 단리 또는 정제된 것으로 간주된다. 폴리펩티드가 다른 폴리펩티드와 같은 추가의 활성 성분을 갖는 조성물로 제공되는 경우, 각각의 상기 폴리펩티드는 각각의 의도된 목적에 적합한 비율로 혼합하기 전에 높은 수준의 균질성으로 개별적으로 정제될 것이다. 예컨대, 2개의 폴리펩티드는 1:1 비로 조합하기 전에 각각 적어도 90% 균질성으로 정제될 수 있다.

폴리펩티드(또는 이의 혼합물)는 사용 전에 수용액에서 재구성에 적합한, 동결건조된 형태로 제공될 수 있다. 동결건조된 조성물은 폴리펩티드의 더 긴 저장을 가능하게 하는 개선된 안정성을 갖는다. Tris-완충 식염수(TBS)와 같은 적합한 완충액으로 상기 폴리펩티드(또는 혼합물)를 동결건조시키는 단계를 포함하는, 동결건조된 형태로 폴리펩티드(또는 이의 혼합물)를 제조하는 방법이 본원에서 제공된다. 폴리펩티드는 전형적으로 동결 건조 전에 실질적으로 정제된다. 동결건조된 형태의 생성된 폴리펩티드(또는 혼합물)가 또한 제공된다. 동결건조된 형태로 폴리펩티드(또는 혼합물)를 제공하는 단계 및 적합한 담체 또는 희석제, 예컨대 물로 재구성하는 단계를 포함하는, 폴리펩티드(또는 혼합물) 용액을 제조하는 방법이 또한 제공된다.

폴리펩티드는 예컨대 Datta S et al., Enzyme immobilization: an overview on techniques and support materials, 3 Biotech, 3(1):1-9 (2013)에 기술된 바와 같이, 당업계에 공지된 방법을 사용하여 고정화될 수 있다. 예컨대, 폴리펩티드는 흡착, 공유 결합, 친화성 고정화 또는 포획에 의해 고정화될 수 있다. 지지체로서 사용될 수 있는 재료는 비제한적으로, 예컨대 천연 지지체 예컨대 아가로스, 콜라겐, 젤라틴, 셀룰로스, 펙틴, 세파로스, 무기 재료 예컨대 세라믹, 실리카, 유리, 활성탄소 또는 숯, 또는 합성 중합체를 포함한다. 예컨대, 폴리펩티드는 선택적으로 수지로서 제공되는, 세파로스 또는 아가로스 상에 고정될 수 있다.

엔도프로테아제 활성을 갖는 폴리펩티드

엔도프로테아제 활성을 갖는 폴리펩티드의 기능적 특성

일 구현예에서, 본 발명은 O-글리코실화된 단백질에 특이적인 엔도프로테아제 활성을 갖는 폴리펩티드에 관한 것이다. 즉, 폴리펩티드는 O-당단백질-특이적 엔도프로테아제 활성을 갖는다. 폴리펩티드는 임의의 O-연결 당단백질, 바람직하게는 임의의 인간 O-연결 당단백질을 절단한다. O-연결 당단백질의 예는 전장 항체, Fc 단편 및 Fc 융합 단백질, 특히, IgA, IgD 및 IgG3 이소형의 것들을 포함하여 면역글로불린의 전부 또는 일부를 포함하거나 이로 이루어진 임의의 단백질을 포함한다. O-연결 당단백질의 또 다른 예는 에타너셉트이며, 이는 수많은 O-글리코실화 부위를 갖는, IgG1의 Fc 부분에 연결된 인간 TNFα 수용체 2의 리간드 결합 도메인의 융합 단백질이다. O-연결 당단백질의 다른 예는 에리스로포이에틴(EPO), TNFα 수용체, 페투인, 및 플라스미노겐을 포함한다.

기질 당단백질의 가수분해(즉, 절단)는 전형적으로 O-글리코실화 세린 또는 트레오닌에 부근에 가까운 펩티드 결합 N-말단에서 높은 특이성으로 발생하며, O-글리칸 의존적이다. 본 발명의 폴리펩티드는 바람직하게는 기질 당단백질의 모든 O-글리코실화 부위에 근접하여 이러한 펩티드 결합을 절단할 수 있다. 반응은 바람직하게는 임의의 아미노산 특이성 또는 제한을 나타내지 않으며, 특히, 임의의 특정 아미노산이 O-글리코실화 세린 또는 트레오닌에 대해 N-말단에 존재할 필요는 없다. 표준 질량 분석법 파라미터를 사용하여 평가할 때, 절단 부위는 일반적으로 각각의 O-글리코실화 잔기에 대해 바로 N 말단의 펩티드 결합에 있는 것으로 일반적으로 관찰된다.

주어진 폴리펩티드의 엔도프로테아제 활성 및 특이성은 적합한 분석법의 수단에 의해 결정될 수 있다. 예컨대, 표준 O-당단백질 기질, 예컨대 IgA 분자 또는 에리스로포이에틴(EPO)이 시험 폴리펩티드와 함께 항온 처리될 수 있다. 이어서 시작 물질 및 반응 생성물이 SDS-PAGE 및/또는 질량 분석법에 의해 분석되어 절단 생성물(임의의 존재하는 것)의 존재를 결정하고 필요한 경우 이들 생성물을 추가로 특성분석할 수 있다. O-글리코실화되지 않은 당단백질 기질, 예컨대 IgG1 분자는 음성 대조군으로 사용될 수 있다. 결과는 기질이 서열번호 2의 아미노산 서열로 이루어진 폴리펩티드와 같이, 본 발명의 예시적인 폴리펩티드와 접촉될 때 동일한 분석에서 얻어진 것들과 비교될 수 있다. 서열번호 2의 폴리펩티드의 1 유닛은 SDS-PAGE에 의해 모니터링 되는 바와 같이, 37℃에서 밤새 20 mM Tris 완충액 pH 6.8에서 시알리다제 혼합물의 1 유닛과 조합하여 1 μg의 에리스로포이에틴(EPO)을 90% 초과로 소화하는데 필요한 양으로 정의된다(바람직한 시알리다제 혼합물이 아래 추가로 기술되어 있음). 시험 폴리펩티드는 바람직하게는 동일한 양으로 존재할 때 유사한 수준의 활성을 달성한다. 예시적인 분석법이 또한 실시예에 기술되어 있다.

엔도프로테아제 활성을 갖는 폴리펩티드의 구조적 특징

본 섹션은 이전의 섹션에 기술된 기능적 특징에 추가하여 적용되는, 이러한 구현예에 따른 폴리펩티드의 구조적 특징을 설명한다.

폴리펩티드는 전형적으로 적어도 150, 200, 250, 275, 280, 290, 300, 310, 320, 330, 340, 350 또는 360 아미노산 길이이다. 폴리펩티드는 전형적으로 400, 395, 390, 385, 380, 375, 370 또는 365 아미노산 길이 이하이다. 폴리펩티드 길이에 대한 범위를 제공하기 위해 상기 열거된 상한 중 임의의 것과 조합될 수 있음을 이해할 것이다. 예컨대, 폴리펩티드는 150 내지 400 아미노산 길이, 또는 280 내지 380 아미노산 길이일 수 있다. 폴리펩티드는 바람직하게는 340 내지 380 아미노산 길이, 가장 바람직하게는 360 내지 375 아미노산 길이이다.

폴리펩티드의 1차 구조(아미노산 서열)는 아커만시아 뮤니시필라의 Amuc1119 유전자에 의해 인코딩된 폴리펩티드의 1차 구조에 기초한다. 이러한 폴리펩티드의 전체 서열이 서열번호 4에 제시되어 있으며, 이는 1-24 위치에 신호 모티프를 포함한다. 신호 모티프가 제거된 서열이 서열번호 1에 제시되어 있다.

본 발명의 폴리펩티드는 서열번호 1의 서열을 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어질 수 있다.

대안적으로, 본 발명의 폴리펩테드는 서열번호 1의 아미노산 서열과 적어도 50% 동일한 서열번호 1의 아미노산 서열의 변이체를 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어질 수 있다. 변이체 서열은 서열번호 1의 서열과 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일할 수 있다. 동일 수준은 바람직하게는 적어도 85% 이상이다. 서열번호 1의 서열에 대한 동일성은 서열번호 1에 나타낸 서열의 적어도 100, 적어도 200, 적어도 300 또는 적어도 350개 이상의 인접 아미노산 영역에 걸쳐 측정될 수 있거나, 보다 바람직하게는 서열번호 1의 전장에 걸쳐 측정될 수 있다. 변이체는 전형적으로 참조 서열보다 길거나 짧은 50개 이하 아미노산 길이이고, 바람직하게는 참조 서열과 대략(또는 정확하게) 동일한 길이이다.

아미노산 동일성은 임의의 적합한 알고리즘을 사용하여 계산될 수 있다. 예컨대, PILEUP 및 BLAST 알고리즘이 예를 들어 Altschul S. F. (1993) J Mol Evol 36:290-300; Altschul, S, F et al (1990) J Mol Biol 215:403-10에 기술된 것과 같이, 동일성 또는 라인업 서열(예컨대, 동일하거나 상응하는 서열을 식별하는 것(전형적으로 기본 설정))을 계산하기 위해 사용될 수 있다. BLAST 분석을 수행하기 위한 소프트웨어는 국립 생명공학 정보 센터(National Center for Biotechnology Information)(http://www.ncbi.nlm.nih.gov/)를 통해 공개적으로 이용가능하다. 이러한 알고리즘은 데이터베이스 서열에서 동일한 길이의 단어와 정렬될 때 일부 양의 값의 임계 점수 T와 일치하거나 만족하는 쿼리 서열에서 길이 W의 짧은 단어를 식별하여 우선 높은 점수의 서열 쌍(HSP)을 식별한다. T는 이웃 단어 점수 임계값으로 지칭된다(위의 Altschul et al.). 이러한 초기 이웃 단어 적중은 이를 포함하는 HSP를 찾기 위한 검색을 시작하기 위한 시드 역할을 한다. 누적 정렬 점수가 증가될 수 있는 한, 단어 적중은 각 서열을 따라 양방향으로 확장된다. 각 방향으로의 단어 적중에 대한 확장은 다음과 같은 경우에 중지된다: 누적 정렬 점수가 최대 달성 값으로부터 수량 X만큼 떨어지는 경우; 하나 이상의 음의-점수의 잔기 정렬의 축적으로 인해 누적 점수가 0 이하로 되는 경우; 또는 서열의 끝에 도달한 경우. BALST 알고리즘 파라미터 W, T 및 X는 정렬의 감도와 속도를 결정한다. BLAST 프로그램은 11의 단어 길이(W), BLOSUM62 점수 매트릭스(Henikoff and Henikoff (1992) Proc. Natl. Acad. Sci. USA 89: 10915-10919 참조) 50의 정렬(B), 10의 기대값(E), M=5, N=4, 및 두 가닥의 비교를 기본 값으로 사용한다.

BLAST 알고리즘은 두 서열 간의 유사성에 대한 통계적인 분석을 수행한다; 예컨대, Karlin 및 Altschul (1993) Proc. Natl. Acad. Sci. USA 90: 5873-5787을 참조한다. BLAST 알고리즘에 의해 제공되는 유사성의 한 척도는 가장 작은 합 확률(P(N))이며, 이는 두 폴리뉴클레오티드 또는 아미노산 서열 간의 일치가 우연히 발생할 확률의 지표를 제공한다. 예를 들어, 제1서열과 제2서열의 비교에서 가장 작은 합 확률이 약 1 미만, 바람직하게는 약 0.1 미만, 보다 바람직하게는 약 0.01 미만, 및 가장 바람직하게는 약 0.001 미만인 경우 서열은 또 다른 서열과 유사한 것으로 간주된다. 대안적으로, UWGCG Package는 동일성을 계산하는데 사용될 수 있는 BESTFIT 프로그램을 제공한다(예컨대, 기본 설정에 사용)(Devereux et al (1984) Nucleic Acids Research 12, 387-395).

본 발명의 폴리펩티드 서열은 서열번호 1의 아미노산 서열의 변이체를 포함할 수 있으며, 여기서, 아미노산 첨가, 결실 또는 치환과 같은 변형이 서열번호 1의 서열에 대해 이루어진다. 달리 명시되지 않는 한, 변형은 바람직하게는 보존적 아미노산 치환이다. 보존적 치환은 아미노산이 유사한 화학적 구조, 유사한 화학적 특성 또는 유사한 측쇄 부피의 또 다른 아미노산과 대체된다. 도입된 아미노산은 이들이 대체하는 아미노산과 유사한 극성, 친수성, 소수성, 염기성, 산성, 중성 또는 전하를 가질 수 있다. 대안적으로, 보존적 치환은 기존의 방향족 또는 지방족 아미노산에 대신에 방향족 또는 지방족인 또 다른 아미노산을 도입할 수 있다. 보존적 아미노산 변화는 당업계에 잘 알려져 있고 아래 표 A1에 정의된 바와 같은 20개 주요 아미노산의 특성에 따라 선택될 수 있다. 아미노산이 유사한 극성을 갖는 경우, 이는 표 A2의 아미노산 측쇄에 대한 소수성 스케일을 참조하여 결정될 수 있다. 본 발명의 폴리펩티드 서열은 최대 10, 20, 30, 40, 50 또는 60개의 보존적 치환이 이루어진 서열번호 1의 아미노산 서열의 변이체를 포함할 수 있다.

표 A1 - 아미노산의 화학적 특성

표 A2 - 소수성 스케일

본 발명의 폴리펩티드의 아미노산 서열은 상기 서열번호 1의 아미노산 서열의 변이체를 포함할 수 있다. 그러나, 서열번호 1의 아미노산 서열 중의 특정 잔기는 바람직하게는 상기 변이체 서열 내에 유지된다. 예를 들어, 상기 변이체 서열은 전형적으로 엔도프로테아제 활성을 위해 요구되는 것으로 공지된 특정 잔기를 보유한다. 따라서, 서열번호 1의 위치 182(서열번호 4의 위치 206에 상응함)에서의 글루타메이트는 바람직하게는 본 발명의 폴리펩티드의 아미노산 서열에 유지된다. 이러한 잔기는 활성 부위에서의 전자 이동에 필요한 것으로 생각된다. 따라서, 본 발명의 폴리펩티드는 전형적으로 서열번호 1의 위치 182에 상응하는 상기 변이체 서열 중의 위치에 글루타메이트(E)를 갖는 서열번호 1의 아미노산 서열의 변이체를 포함한다. 유사하게, 서열번호 1의 위치 181(서열번호 4의 위치 205에 상응함)의 히스티딘은 바람직하게는 본 발명의 폴리펩티드의 아미노산 서열에 유지된다. 이러한 잔기는 아연 이온 보조-인자에 결합하기 위해 필요한 것으로 생각된다.

상기 글루타메이트 및 상기 히스티딘 잔기는 둘 모두 전형적으로 모티프 HEbbH를 갖는 메탈로프로테아제 도메인 내에 포함되며, 여기서, b는 전하가 없는 아미노산, 예컨대 아미노산 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W이다. 이러한 도메인의 바람직한 예는 서열 HELGH(서열번호 41)을 가지며, 이는 서열번호 1의 위치 181 내지 185(서열번호 4의 위치 205 내지 209)에 상응한다. 따라서, 본 발명의 폴리펩티드는 전형적으로 서열번호 1의 위치 181 내지 185에 상응하는 위치에, 모티프 HEbbH(예컨대 HEIGH(서열번호 42) 또는 HELGH, 바람직하게는 HELGH)를 포함하는, 서열번호 1의 아미노산 서열의 변이체를 포함한다. 본 발명의 폴리펩티드는 전형적으로 메탈로프로테아제 도메인에 대한 C-말단에 위치한 O-글리칸 특이적 결합 도메인을 포함한다.

모티프 HEbbH는 모티프 abxHEbbHbc를 갖는 보다 큰 메탈로프로테아제 도메인 내에 포함될 수 있으며, 여기서, a는 아미노산 V, T 또는 G이고, b는 전하가 없는 아미노산, 예컨대 아미노산 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W이고, x는 임의의 아미노산이고, c는 소수성 아미노산 예컨대 A, C, F, I, L, M, P, V, W 또는 Y이다. 이러한 도메인의 바람직한 예는 서열 GMAHELGHGL(서열번호 8)을 가지며, 이는 서열번호 1의 위치 178 내지 187(서열번호 4의 위치 202 내지 211)에 상응한다. 다른 예는 GVAHELGHNF(서열번호 43)를 포함한다. 따라서, 본 발명의 폴리펩티드는 바람직하게는 서열번호 1의 178 내지 187의 위치에 상응하는 위치에 모티프 abxHEbbHbc, (예컨대 GMAHELGHGL 또는 GVAHELGHNF, 바람직하게는 GMAHELGHGL)를 포함하는 서열번호 1의 아미노산 서열의 변이체를 포함한다. 본 발명의 폴리펩티드는 전형적으로 메탈로프로테아제 도메인의 C-말단에 위치한 O-글리칸 특이적 결합 도메인을 포함한다.

대안적으로, 본 발명의 폴리펩티드는 상기 서열번호 1의 보다 짧은 단편 또는 이의 변이체를 포함하거나, 이로 본질적으로 이루어지거나, 이루어질 수 있다. 단편은 O-당단백질 특이적-엔도프로테아제 활성을 보유하는 서열번호 1의 절단된 형태로서 기술될 수 있다. 이러한 단편은 서열번호 1보다 짧으며 전형적으로 적어도 100, 150 또는 200 아미노산 길이이다. 단편은 전형적으로 서열번호 1의 위치 182에 상응하는 위치에 글루탐산 잔기(E) 및 서열번호 1의 위치 181에 상응하는 위치에 히스티딘 잔기(H), 및 메탈로프로테아제 도메인의 C-말단에 위치한 O-글리칸 특이적 결합 도메인을 포함하여, 서열번호 1의 위치 178 내지 187에 상응하는 위치에 메탈로프로테아제 도메인을 포함한다.

서열번호 1 또는 이의 변이체, 또는 이들 중 하나의 단편을 포함하는 본 발명의 임의의 폴리펩티드는 선택적으로 N 말단에 추가의 메티오닌 및/또는 C 말단에 히스티딘 또는 다른 태그를 포함할 수 있다. 이러한 추가의 서열은 발현 및/또는 정제를 도울 수 있다. 히스티딘 태그는 바람직하게는 6개의 히스티딘 잔기로 구성된다. 히스티딘 태그는 바람직하게는 링커에 의해 C 말단에 연결되며, 이는 전형적으로 짧은 아미노산 서열, 예컨대 3 내지 5 아미노산이다. 링커는 전형적으로 주로 글리신 및 세린 잔기로 이루어지고, 바람직하게는 서열 GSG를 포함할 수 있다. 예컨대 GSG 및 GSGLE가 적합한 링커이다.

따라서 요약하면, 본 발명의 폴리펩티드는 다음을 포함하는 O-당단백질-특이적 엔도프로테아제 활성을 갖는 폴리펩티드이다:

(a) 서열번호 1의 아미노산 서열;

(b) 서열번호 1의 아미노산 서열과 적어도 85% 동일한 아미노산 서열 또는

(c) 서열번호 1의 서열의 단편인 아미노산 서열 또는 서열번호 1의 아미노산 서열과 85% 동일한 아미노산의 단편;

선택적으로, 상기 폴리펩티드는 N 말단에 추가의 메티오닌 및/또는 C 말단에 히스티딘 태그를 포함하며, 상기 태그는 링커에 의해 C 말단에 결합될 수 있다.

본 발명의 예시적인 폴리펩티드 서열은 서열번호 2로서 제공된다. 폴리펩티드는 서열번호 2의 아미노산 서열을 포함하거나 이로 구성될 수 있다. 이러한 폴리펩티드를 인코딩하는 예시적인 폴리뉴클레오티드 서열이 서열번호 3에 제시되어 있다.

O-당단백질-특이적 엔도프로테아제 활성을 갖는 대안적인 폴리펩티드는 슈도모나스 에루지노사 PAO1, 박테리오데스 테타이오타오미크론 VPI-5482, 및 클로스트리디움 퍼프린젠스에서 동정되었다(Noach et al; PNAS 2017, pE679-688 및 지지 부록, 특히, Materials and Methods for Cloning, Protein Expression and Purification에 기술된 3개의 펩티다제 참조). 이러한 폴리펩티드의 전장 서열이 서열번호 32, 33 및 34로 제공된다. 이러한 서열 각각은 상기와 같이 모티프 HEbbH를 갖는 메탈로프로테아제 도메인을 포함한다. 클로스트리디움 퍼프린젠스 서열은 상기와 같은 모티프 abxHEbbHbc를 갖는 보다 긴 메탈로프로테아제 도메인을 또한 갖는다. 이러한 서열 각각은 존재할 수 있는 임의의 신호 서열 또는 프로-효소 서열을 제거하고/하거나 N 말단에 추가의 메티오닌 및/또는 C 말단에 히스티딘 또는 다른 태그를 포함하기 위해 선택적으로 변형될 수 있다. 이러한 추가의 서열은 발현(예컨대 대장균에서) 및/또는 정제를 도울 수 있다. 신호 및 다른 미성숙 서열이 제거된 상응하는 서열은 서열번호 26, 27 및 28로 제공된다. 대장균에서의 발현 및 후속 정제에 최적화된 (N 말단에서 추가의 메티오닌 및 C 말단에서 히스티딘 태그를 포함시킴으로써) 이러한 서열의 버전은 서열번호 29, 30 및 31로 제공된다. O-당단백질-특이적 엔도프로테아제 활성을 갖는 본 발명의 폴리펩티드의 사용에 대해 본원에서 기술된 방법에서, 본 발명의 폴리펩티드는 이러한 폴리펩티드들 중 하나와 선택적으로 대체될 수 있다. 따라서, 이러한 방법에서 사용하기 위한 바람직한 폴리펩티드는 서열번호 26 내지 31 중 임의의 하나를 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어진다.

폴리펩티드의 엔도프로테아제 활성을 사용하는 방법

본 발명은 또한 O-당단백질을 가수분해하는 방법을 제공하며, 여기서, 상기 방법은 O-당단백질-특이적 엔도프로테아제 활성을 갖는 본 발명의 폴리펩티드를 상기 단백질 샘플과 접촉시키는 단계를 포함하고 선택적으로 가수분해 산물을 검출하는 단계를 추가로 포함한다.

본 발명은 또한 O-당단백질-특이적 엔도프로테아제 활성을 갖는 본 발명의 폴리펩티드를 상기 샘플과 접촉시키는 단계 및 생성된 산물을 분석하는 단계를 포함하는, 단백질의 글리코실화 상태를 평가하는 방법을 포함할 수 있다. 절단 산물의 존재는 상기 샘플 중의 단백질이 O-글리코실화된 것을 나타내며, 따라서, 상기 방법은 또한 O-당단백질의 검출에 사용될 수 있다. 절단 산물은 선택적으로 글리칸 쇄 및 단백질에 대한 부착 위치를 확인하기 위해 추가로 분석될 수 있다.

이러한 방법에서, 샘플은 폴리펩티드가 샘플에서 임의의 단백질과 상호작용하고 가수분해/절단 반응(엔도프로테아제 활성)이 발생하기에 적합한 조건 하에서 본 발명의 폴리펩티드와 접촉된다. 적합한 조건은 본 발명의 폴리펩티드와 함께 적어도 20 분, 30 분, 40 분, 50 분, 60 분, 70 분, 80 분, 90 분 또는 120 분, 3 시간, 5 시간, 10 시간 동안, 또는 밤새 항온 처리하는 것을 포함한다. 항온 처리는 바람직하게는 실온, 보다 바람직하게는 약 20℃, 25℃, 30℃, 35℃, 40℃ 또는 45℃, 및 가장 바람직하게는 약 37℃에서 일어난다. 상기 방법은 임의의 적합한 pH 하에 수행될 수 있다. 적합한 pH 값은, 예컨대 약 3.0, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9 또는 9.5의 pH를 포함한다. 본 발명의 폴리펩티드 활성을 위해 바람직한 pH는 5.6 내지 6.8 범위 이내이다. 상기 방법은 임의의 적합한 완충액, 예컨대 Tris 완충 식염수(TBS) 또는 인산염 완충된 식염수(PBS)에서 수행될 수 있다. 본 발명의 폴리펩티드 대 샘플의 단백질 함량의 대략적인 비(효소:기질)는 1:1, 2:1, 4:1, 6:1, 10:1, 15:1, 20:1, 1:2, 1:4, 또는 1:6, 1:10, 1:15, 1:20, 1:40, 1:100, 1: 200 또는 1:400일 수 있다. 바람직한 비는 1:20이다. 더 짧은 반응 시간이 요구되거나, O-당단백질이 많이 시알릴화된 경우 기질에 대한 효소의 비율이 높아질 수 있다. 대안적으로, 초기 또는 동시 시알리다제 항온 처리 단계는 아래에서 더 상세히 논의되는 바와 같이 시알산 함량을 감소시키기 위해 사용될 수 있다. 기질은 전형적으로 0.1mg/ml 내지 10mg/ml, 바람직하게는 약 0.1 내지 2mg/ml의 농도로 존재한다.

생성된 생성물의 검출 또는 분석은 임의의 적합한 분석적 방법, 예컨대 비제한적으로 질량 분석법, HPLC, 친화성 크로마토그래피, 겔 전기영동, SDS-PAGE, ELISA, 렉틴 블롯팅, 분광법, 모세관 전기영동 및 단백질 분석을 위한 다른 표준 실험실 기법에 의해 평가될 수 있다.

상기 방법 중 임의의 것에서의 샘플은 환자, 바람직하게는 인간 환자로부터 채취된 샘플일 수 있다. 얻어진 결과는 진단 목적, 예컨대 O-연결 글리코실화를 포함하는 암의 존재를 검출하기 위해 사용될 수 있다. 이러한 용도는 환자로부터 얻은 결과와 건강한 대조군으로부터 얻은 샘플을 사용하여 얻은 결과의 비교를 포함할 수 있다.

본 발명의 임의의 방법에서, 폴리펩티드는 프로테아제 또는 글리코시다제와 같은 또 다른 효소와 조합하여 사용될 수 있다. 추가의 프로테아제 또는 글리코시다제는 전형적으로 기질 단백질을 추가로 소화할 것이며, 이는 본 발명의 폴리펩티드의 활성을 향상시키고/시키거나 생성물의 보다 쉽고 보다 상세한 분석을 허용할 수 있다.

예를 들어, 본 발명자들은 기질 단백질의 O-글리칸이 시알산을 제거하기 위해 먼저 변형된다면 본 발명의 폴리펩티드가 개선된 엔도프로테아제 활성을 나타내는 것으로 결정하였다. 따라서, 본 발명의 바람직한 방법에서, 샘플은 시알산을 제거하기 위해 제제와 접촉된다. 상기 제제는 바람직하게는 시알리다제 효소 또는 이러한 효소의 혼합물일 수 있으며, 이는 적합한 완충액, 예컨대 TBS 또는 PBS 중에 존재할 수 있다. 완충액은 바람직하게는 저농도, 전형적으로 300mM, 250mM, 200mM, 또는 150mM 이하의 NaCl을 포함한다. NaCl 농도는 바람직하게는 약 150mM, 예컨대 125mM 내지 175mM이다. 시알리다제(또는 뉴라미니다제)는 당단백질 상의 복합체 탄수화물로부터 말단 시알산의 절단을 촉매하고 고도의 특이성을 나타낸다. 이러한 효소는 O-당단백질 내에서 통상적으로 발견되는 3개의 별개의 시알산 결합, 즉, α2-3, α2-6 및 α2-8 결합을 표적화한다. 기술된 방법에서 사용하기에 적합한 시알리다제는 α2-3, α2-6, 또는 α2-8 결합 모두를 표적화하는 광범위한 스펙트럼의 시알리다제, 및 전형적으로 하나의 유형의 결합만을 표적화하는 좁은 스펙트럼의 시알리다제를 포함한다. α2-3 결합이 인간 당단백질에서 가장 흔하므로, 좁은 스펙트럼의 시알리다제가 사용되는 경우 이 결합을 표적으로 하는 것이 바람직하다. 적합한 시알리다제는 바이러스 또는 포유류 시알리다제를 포함할 수 있지만 바람직하게는 시알리다제는 비제한적으로 클로스트리디움 퍼프린젠스, 아스로박터 우레아페시언스, 스트렙토코커스 뉴모니아, 비브리오 콜레라 및 아커만시아 뮤니시필라의 균주를 포함하여, 박테리아로부터 단리된다.

바람직한 좁은 스펙트럼의 시알리다제는 아커만시아 뮤시니필라로부터 단리된 Am1757이다. Am1757은 α2-3 결합에 대해 특이적 활성을 갖는다. Am1757의 야생형 서열은 신호 서열을 포함하는 서열번호 9로 제공된다. 신호 서열이 없는 Am1757의 야생형 서열은 서열번호 10으로 제공된다. 이러한 서열은 N 말단에 추가의 메티오닌 및/또는 C 말단에 히스티딘 또는 다른 태그를 포함하기 위해 선택적으로 변형될 수 있다. 이러한 추가의 서열은 발현(예컨대 대장균에서) 및/또는 정제를 도울 수 있다. 히스티딘 태그는 바람직하게는 6개의 히스티딘 잔기로 구성된다. 히스티딘 태그는 바람직하게는 링커에 의해 C 말단에 연결되고, 이는 전형적으로 짧은 아미노산 서열, 예컨대 3 내지 5 아미노산 서열이다. 링커는 전형적으로 주로 글리신 및 세린 잔기로 이루어지고, 바람직하게는 서열 GSG를 포함할 수 있다. 예컨대, GSG 및 GSGLE가 적합한 링커이다. N 말단에 추가의 메티오닌을 갖고 C 말단에 GSGLE 링커 및 His₆ 태그를 갖는 예시적인 Am1757 서열이 서열번호 11로 제공된다. 본 개시 내용에서 Am1757에 대한 임의의 언급은 서열번호 9, 10 또는 11 중 임의의 것을 의미할 수 있지만, 바람직하게는 서열번호 10의 아미노산 서열을 포함하거나 이로 이루어진 폴리펩티드를 지칭한다. 가장 바람직한 것은 서열번호 11의 아미노t산 서열로 이루어진 폴리펩티드이다.

바람직한 광범위한 스펙트럼 시알리다제는 아커만시아 뮤시니필라로부터 단리된 Am0707이다. Am0707은 α2-3, α2-6 및 α2-8 결합에 대해 활성을 갖는다. Am0707의 야생형 서열이 서열번호 12로 제공되며, 이는 신호 서열을 포함한다. 신호 서열이 없는 Am0707의 야생형 서열이 서열번호 13으로 제공된다. 이러한 서열은 N 말단에 추가의 메티오닌 및/또는 C 말단에 히스티딘 또는 다른 태그를 포함하도록 선택적으로 변형될 수 있다. 이러한 추가의 서열은 발현 및/또는 정제를 도울 수 있다. 히스티딘 태그는 바람직하게는 6개의 히스티딘 잔기로 구성된다. 히스티딘 태그는 바람직하게는 링커에 의해 C 말단에 연결되며, 이는 전형적으로 짧은 아미노산 서열, 예컨대 3 내지 5개 아미노산이다. 링커는 전형적으로 주로 글리신 및 세린 잔기로 이루어져 있으며, 바람직하게는 서열 GSG를 포함할 수 있다. 예컨대, GSG 및 GSGLE가 적합한 링커이다. N 말단에 추가의 메티오닌 및 C 말단에 GSGLE 링커 및 His₆ 태그를 가진 예시적인 Am0707 서열이 서열번호 14로 제공된다. 본 개시에서 Am0707에 대한 임의의 언급은 서열번호 12, 13 또는 14 중 임의의 것을 의미할 수 있지만, 바람직하게는 서열번호 13의 아미노산 서열을 포함하거나 이로 이루어진 폴리펩티드를 지칭한다. 가장 바람직한 것은 서열번호 14의 아미노산 서열로 이루어진 폴리펩티드이다.

모든 시알산 결합을 가수분해 할 수 있는 바람직한 시알리다제 혼합물은 아커만시아 뮤시니필라로부터 단리된 Am1757 및 Am0707을 포함한다. Am1757 및 Am0707의 혼합물은 전형적으로 1:1 비율이다. 특히 바람직한 혼합물은 서열번호 11의 아미노산로 이루어진 폴리펩티드 및 서열번호 14의 아미노산 서열로 이루어진 폴리펩티드를 포함할 수 있다.

본 발명의 방법은 바람직하게는 시알리다제의 활성에 적합한 조건 하에, 샘플을 본 발명의 폴리펩티드와 항온 처리하기 이전에 또는 동시에 Am1757과 또는 Am1757 및 Am0707의 혼합물과 항온 처리하는 단계를 포함할 수 있다. 본 발명은 또한 본 발명의 폴리펩티드 및 Am1757 또는 Am1757 및 Am0707의 혼합물을 포함하는 조성물(동결건조되거나 용액 형태)을 제공한다. 이러한 조성물은 바람직하게는 약 pH 7.6일 수 있는 Tris 완충 식염수에서 동결건조될 수 있다. 이러한 조성물에서, Am1757 및 Am0707은 바람직하게는 서로 1:1 비율로 존재할 것이며, 총 시알리다제 함량(Am1757+Am0707)이 또한 본 발명의 폴리펩티드에 대해 1:1 비율로 존재한다. 예컨대, 조성물이 본 발명의 2000 유닛의 폴리펩티드를 포함하는 경우, 이는 또한 2000 유닛의 시알리다제를 포함할 것이며, 상기 2000 유닛의 시알리다제는 1000 유닛의 Am1757 및 1000 유닛의 Am0707을 포함한다. 시알리다제 혼합물의 1 유닛은 전형적으로 SDS-PAGE에 의해 모니터링 될 때 37℃에서 2시간 동안 37℃에서 20 mM Tris pH 6.8에서 항온 처리될 때 1 μg 당단백질(페투인)의 90% 이상으로부터 시알산을 가수분해하는데 필요한 양이다. 본 발명의 폴리펩티드 1 유닛은 전형적으로 SDS-PAGE에 의해 모니터링 될 때 37℃에서 1 유닛의 시알리다제 혼합물과 함께 밤새, 20 mM Tris 완충액 pH 6.8에서 항온 처리될 때 1 μg의 에리스로포이에틴(EPO)의 90% 초과를 소화시키는데 필요한 양이다.

본 발명은 또한 상이한 효소의 병용에 대한 지침과 함께, Am1757 또는 Am1757 및 Am0707의 혼합물로부터 별도의 용기에 본 발명의 폴리펩티드를 포함하는 키트를 제공한다.

또 다른 예시로서, 본원에 기술된 임의의 방법에서, 샘플은 표적 단백질로부터 N-글리칸을 제거하기 위해, 샘플을 본 발명의 폴리펩티드와 접촉하기 이전에, 접촉과 동시에, 또는 접촉한 후에, 샘플은 N-글리코시다제와 함께 항온 처리될 수 있다. 예시적인 N-글리코시다제는 PNGaseF이다. 샘플이 면역글로불린을 포함할 때 사용될 수 있는 다른 N-글리코시다제는 EndoS(WO2008071418의 서열번호 1 참조) 또는 EndoS2(EndoS49로 지칭될 수 있음 - WO2013037824의 서열번호 1 참조)이다. 이러한 효소 각각은 IgG1의 Asn-297로부터 N-연결 당단백질을 제거한다. 특정 구현예에서, 샘플은 본 발명의 폴리펩티드 외에 N-글리코시다제 및 시알리다제(또는 이들의 혼합물)과 접촉될 수 있다. 이러한 방법에서, 시알리다제(또는 혼합물)는 N-글리코시다제 및 본 발명의 폴리펩티드의 동시 첨가 전에 먼저 적용될 수 있다. 이러한 방법은 특히 O-글리코실화 부위의 후속 평가에 적합하며, 전형적으로 예컨대 RPLC를 사용하여 생성물을 분리한 후 예컨대 질량 분석법을 사용하여 상이한 분획을 분석하여 달성될 수 있다.

또 다른 예로서, 본원에 기술된 임의의 방법에서, 샘플은 표적 단백질을 추가로 소화하기 위해, 샘플을 본 발명의 폴리펩티드와 접촉하기 전에, 접촉과 동시에, 또는 접촉 후에 샘플은 프로테아제와 함께 항온 처리될 수 있다. 적합한 일반적인 프로테아제는 트립신, 키모트립신, Lys-C, Asp-N, Glu-C, Arg-C 또는 유사한 엔도프로테아제, 또는 포르피로모나스 진지발리스(Porphyromonas gingivalis)의 Arg-진지페인(gingipain)(RgpB)을 포함한다.

샘플이 면역글로불린을 포함하는 경우, 면역글로불린 프로테아제는 SpeB(WO2015040125의 서열 참조), S. 피오게네스(pyogenes)의 면역글로불린 G-분해 효소(IdeS - WO2015040125의 서열 참조), S. 에퀴(equi) 아종 주에피데미쿠스(zooepidemicus)(IdeZ)의 면역글로불린 G-분해 효소, 포르피로모나스 진지발리스의 Lys-진지페인(Kgp), 및 S. 아갈락티애(agalactiae)의 면역글로불린 G-분해 효소(IgdE_agalactiae - PCT/EP2017/052463의 서열번호 3 참조)와 같은 것이 사용될 수 있다. 본 발명의 방법에서 이러한 프로테아제의 임의의 조합의 사용은 예컨대 질량분석법(중간 다운 접근법)을 사용하여 모노클로날 항체 및 이의 서브유닛 상의 O-글리코실화 부위의 결정을 도울 수 있다.

또 다른 예로서, 본원에 기술된 임의의 방법에서, 샘플이 본 발명의 폴리펩티드와 접촉한 후에 샘플은 O-글리코시다제와 함께 항온 처리될 수 있다. 예컨대, 생성된 생성물의 분석을 단순화하기 위해, 임의의 적합한 방법에 의한 추가 분석 전에 O-글리칸을 제거하기 위해 생성물은 O-글리코시다제에 의해 소화된다. 적합한 O-글리코시다제는 엔테로코커스 패컬리스(Enterococcus faecalis), 스트렙토코커스 오랄리스(Streptococcus oralis), 또는 비피도박테리움 비피덤(Bifidobacterium bifidum), 바람직하게는 엔테로코커스 패컬리스 또는 스트렙토코커스 오랄리스, 가장 바람직하게는 스트렙토코커스 오랄리스의 균주로부터 수득될 수 있다. 스트렙토코커스 오랄리스로부터의 예시적인 O-글리코시다제의 서열이 서열번호 15로 제공된다.

O-연결 당단백질에 결합하지만 엔도프로테아제 활성이 없거나 감소된 폴리펩티드

엔도프로테아제 활성이 없는 폴리펩티드의 기능적 특성

일 구현예에서, 본 발명은 엔도프로테아제 활성이 없거나 감소되었지만, O-글리칸에 결합할 수 있는 능력이 있는 폴리펩티드에 관한 것이다. 즉, 폴리펩티드는 상기 글리칸이 부착된 당단백질을 상당히 가수분해하지 않는 O-글리칸-특이적 결합제로서 기술될 수 있다.

O-당단백질 엔도프로테아제 활성은 임의의 적합한 방법을 사용하여 결정될 수 있지만, 전형적으로 이러한 활성을 지닌 본 발명의 폴리펩티드에 대해 상기된 바와 동일한 방법을 사용할 수 있다. 시험 폴리펩티드에서의 활성 결여는 O-당단백질 기질과 항온 처리 후 절단 생성물의 부재로 표시될 것이다. 서열번호 1의 아미노산 서열을 포함하는 폴리펩티드에 의한 동일한 기질의 절단은 양성 대조군으로서 사용될 수 있다. 시험 폴리펩티드에서의 활성 감소는 동일한 대조군과 비교하여 결정될 수 있다. 본 발명의 폴리펩티드는 전형적으로 서열번호 1의 아미노산 서열을 포함하는 폴리펩티드의 활성에 비해 감소된 O-당단백질 엔도프로테아제 활성을 갖는다. 본 발명의 폴리펩티드는 전형적으로 서열번호 1의 아미노산 서열을 포함하는 폴리펩티드의 활성에 비해 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10% 또는 5% 미만인 O-당단백질 엔도프로테아제 활성을 갖는다.

O-글리칸 또는 O-당단백질에 결합하는 폴리펩티드의 능력은 또한 임의의 적합한 방법에 의해 평가될 수 있다. 하나의 이러한 방법은 예컨대 스핀 컬럼에서 세파로스 상에 시험 폴리펩티드를 고정시킨 다음 O-당단백질 및/또는 O-글리칸을 함유하는 샘플과 함께 항온 처리하는 것을 포함한다. 시험 폴리펩티드가 O-글리칸 및/또는 O-당단백질 결합 능력을 갖는 경우, O-당단백질 및/또는 O-글리칸은 컬럼에 부착되어 또는 후속 용리에서 검출될 것이다. 바람직하게는, 폴리펩티드는 서열번호 1의 아미노산 서열을 포함하는 폴리펩티드에 의해 가수분해될 수 있는 모든 O-당단백질에 결합할 수 있다.

이러한 유형의 예시적인 분석법이 실시예에 기술되어 있다.

엔도프로테아제 활성이 없는 폴리펩티드의 구조적 특징

본 섹션은 이러한 구현예에 따른 폴리펩티드의 구조적 특정을 기술하며, 이는 이전 섹션에 기술된 기능적 특징에 추가로 적용된다. 본 발명의 구현예에 따른 폴리펩티드는 아미노산 서열이 하나 이상의 아미노산 첨가, 결실 또는 치환에 의해 변형되어 상기 활성이 감소 또는 제거된 것을 제외하고, 엔도프로테아제 활성을 갖는 폴리펩티드와 관련하여 상기된 바와 동일한 구조적 특징을 가질 수 있다. 전형적으로, 본 발명의 이러한 구현예에 따른 폴리펩티드는 HEbbH 또는 abxHEbbHbc의 무손상 메탈로프로테아제 모티프를 포함하지 않을 것이다. 상기 모티프는 첨가, 결실 또는 치환에 의해 파괴될 수 있지만, 바람직하게는 적어도 하나의 아미노산 치환에 의해 파괴된다. 바람직하게는, 치환은 상기 모티프의 글루탐산(E) 잔기를 대안적인 아미노산으로 치환하고/하거나 보다 짧은 모티프의 첫 번째 위치(보다 긴 모티프의 4번째 위치)에 상응하는 위치에서 히스티딘(H) 잔기의 치환 및/또는 보다 짧은 모티프의 5번째 위치(보다 긴 모티프의 8번째 위치)에 상응하는 위치에서 히스티딘(H) 잔기의 치환을 포함한다. 바람직하게는, 상기 3개의 치환 중 하나 또는 둘, 또는 모두는 비-보존적이다. E 잔기의 치환은 전자 이동을 감소시키거나 제거해야 한다. H 잔기 중 하나의 치환은 아연 이온 보조-인자 결합을 감소시키거나 제거해야 한다. E 잔기는 따라서 바람직하게는 비-극성 또는 비하전 아미노산, 예컨대 , C, F, G, I, L, M, N, P, Q, S, T, V 또는 W로 치환되지만, 가장 바람직하게는 알라닌(A) 또는 글리신(G)으로 치환된다. H 잔기는 임의의 비-H 아미노산으로 각각 개별적으로 치환될 수 있지만, 비-극성 아미노산 예컨대 A 및 G가 더 바람직하다.

따라서, 본 발명의 폴리펩티드는 바람직하게는, 서열번호 1의 위치 182에 상응하는 위치에서 글루탐산 잔기의 치환 및/또는 서열번호 1의 위치 181에 상응하는 히스티딘 잔기의 대안적인 아미노산으로의 치환 및/또는 서열번호 1의 위치 185에 상응하는 히스티딘 잔기의 대안적인 아미노산으로의 치환에 의해, HEbbH 또는 abxHEbbHbc의 메탈로프로테아제 모티프가 파괴된 서열번호 1의 아미노산 서열을 포함하거나, 이로 본질적으로 이루어지거나 이로 이루어질 수 있다. 즉, 폴리펩티드는 메탈로프로테아제 모티프 HEbbH를 포함하지 않고 바람직하게는 상기 모티프의 파괴된 버전을 포함하는 것을 포함하여 다음과 같이 기술될 수 있다:

(a) 첫 번째 위치의 H가 대안적인 아미노산, 바람직하게는 A 또는 G로 치환됨; 및/또는

(b) 두 번째 위치의 E가 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W, 바람직하게는 A 또는 G로 치환됨; 및/또는

(c) 5번째 위치의 H가 대안적인 아미노산, 바람직하게는 A 또는 G로 대체됨

이때, 상기 모티프의 b는 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W이다.

따라서 상기 폴리펩티드는 모티프 xbbbx를 포함하는 것으로 기술될 수 있고, 여기서:

(a) x는 바람직하게는 H를 제외한 임의의 아미노산이고, 바람직하게는 A 또는 G이다; 및/또는

(b) b는 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W이고, 바람직하게는 A 또는 G이다;

선택적으로, 이때, 상기 모티프는 서열번호 1의 위치 181 내지 185에 상응하는 위치에서 상기 폴리펩티드에 존재한다.

따라서 상기 폴리펩티드는 예컨대 다음의 서열 중 임의의 하나를 갖는 파괴된 메탈로프로테아제 모티프를 포함할 수 있다: HALGH(서열번호 44), AELGH(서열번호 45) 또는 가장 바람직하게는 AALGH(서열번호 46). 서열번호 1에 대한 이러한 유형의 특이적 변화를 포함하는 서열은 서열번호 5 및 서열번호 20에 제시되어 있다. 즉, 따라서, 본 발명의 이러한 구현예의 폴리펩티드는 서열번호 5 또는 서열번호 20의 아미노산 서열을 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어질 수 있다.

상기 폴리펩티드는 모티프 abxxbbbxbc를 포함하는 것으로 대안적으로 기술될 수 있으며, 여기서:

(a) a는 아마노산 V, T 또는 G이고;

(b) b는 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W, 바람직하게는 A 또는 G이고;

(c) x는 모티프의 4번째 및/또는 8번째 위치의 아미노산이 바람직하게는 H가 아닌 것을 제외하고 임의의 아미노산, 바람직하게는 A 또는 G이고;

(d) c는 소수성 아미노산, 선택적으로 A, C, F, I, L, M, P, V, W 또는 Y이다;

선택적으로, 여기서, 상기 모티프는 서열번호 1의 178 내지 187의 위치에 해당하는 위치에서 상기 폴리펩티드에 존재한다.

따라서 상기 폴리펩티드는 예컨대 다음 서열 중 임의의 하나를 갖는 파괴된 메탈로프로테아제 모티프를 포함할 수 있다: GMAHALGHGL(서열번호 23), GMAAELGHGL(서열번호 24) 또는 가장 바람직하게는 GMAAALGHGL(서열번호 25). 서열번호 1에 대한 이러한 유형의 특이적 변화를 포함하는 서열은 서열번호 5 및 서열번호 20에 제시되어 있다. 즉, 따라서, 본 발명의 이러한 구현예의 폴리펩티드는 서열번호 5 또는 서열번호 20의 아미노산 서열을 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어질 수 있다.

대안적으로, 본 발명의 폴리펩티드는, 글루탐산 잔기가 서열번호 1의 위치 182에 상응하는 위치에 도입되지 않고/않거나 히스티딘 잔기가 서열번호 1의 위치 181에 상응하는 위치에 도입되지 않고/않거나 히스티딘 잔기가 서열번호 1의 위치 185에 상응하는 위치에 도입되지 않는다면, 서열번호 5의 아미노산 서열과 적어도 50% 동일한 서열번호 5 또는 서열번호 20의 아미노산 서열의 변이체를 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어질 수 있다.

변이체 서열은 서열번호 5의 서열과 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일할 수 있다. 동일성 수준은 바람직하게는 적어도 85% 이상이다. 서열번호 5 또는 서열번호 20의 서열에 대한 동일성은 서열번호 5 또는 서열번호 20에 제시된 서열의 적어도 100, 적어도 200, 적어도 300 또는 적어도 350개 이상의 인접 아미노산의 영역에 걸쳐, 보다 바람직하게는 서열번호 5 또는 서열번호 20의 전장에 걸쳐 측정될 수 있다. 본 발명의 폴리펩티드 서열은 서열번호 5 또는 서열번호 20의 아미노산 서열의 변이체를 포함할 수 있으며, 여기서, 10, 20, 30, 40, 50 또는 60개 이하의 보존적 치환이 이루어진다. 서열 동일성의 결정 및 보존적 및 비-보존적 치환에 대한 설명은 엔도프로테아제 활성을 갖는 폴리펩티드에 관한 섹션에서 제공되며 여기에서도 동일하게 적용된다.

대안적으로, 본 발명의 폴리펩티드는 서열번호 5 또는 서열번호 20의 보다 짧은 단편, 또는 상기된 바와 같은 이의 변이체를 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어질 수 있다. 단편은 O-당단백질 결합 활성을 보유하는 서열번호 5 또는 서열번호 20의 절단된 형태로서 기술될 수 있다. 이러한 단편은 서열번호 1보다 짧고 전형적으로 적어도 100, 150 또는 200 아미노산 길이이다.

서열번호 5 또는 서열번호 20을 포함하는 본 발명의 폴리펩티드는, 또는 이의 변이체, 또는 이들 중 하나의 단편은 선택적으로 N 말단에 추가의 메티오닌 및/또는 C 말단에 히스티딘 또는 다른 태그를 포함할 수 있다. 이러한 추가의 서열은 발현 및/또는 정제를 도울 수 있다. 히스티딘 태그는 바람직하게는 6개의 히스티딘 잔기로 이루어진다. 히스티딘 태그는 바람직하게는 3 내지 5개 아미노산과 같이 전형적으로 짧은 아미노산 서열인 링커에 의해 C 말단에 연결된다. 링커는 전형적으로 주로 글리신 및 세린 잔기로 이루어지며, 바람직하게는 GSG를 포함할 수 있다. 예컨대, GSG 및 GSGLE가 적합한 링커이다.

따라서 요약하면, 본 발명의 폴리펩티드는 O-당단백질 결합 활성을 갖지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 폴리펩티드이며, 다음을 포함한다:

(a) 서열번호 5 또는 서열번호 20의 아미노산 서열;

(b) 서열번호 5 또는 서열번호 20의 아미노산 서열과 적어도 85% 동일한 아미노산 서열;

(c) 서열번호 5 또는 서열번호 20의 서열 단편인 아미노산 서열, 또는 서열번호 5 또는 서열번호 20의 아미노산 서열과 85% 동일한 아미노산 단편;

선택적으로 여기서, 상기 폴리펩티드는 N 말단에 추가의 메티오닌 및/또는 C 말단에 히스티딘 태그를 포함하며, 상기 태그는 링커에 의해 C 말단에 결합될 수 있다.

본 발명의 예시적인 폴리펩티드 서열은 서열번호 6으로 제공된다. 폴리펩티드는 서열번호 6의 아미노산 서열을 포함하거나 이로 이루어질 수 있다. 이러한 폴리펩티드를 인코딩하는 예시적인 폴리뉴클레오티드 서열이 서열번호 7에 제시되어 있다. 본 발명의 또 다른 예시적인 폴리펩티드 서열이 서열번호 21로 제공된다. 폴리펩티드는 서열번호 21의 아미노산 서열을 포함하거나 이로 이루어질 수 있다. 이러한 폴리펩티드를 인코딩하는 예시적인 폴리뉴클레오티드가 서열번호 22에 제시되어 있다.

상기 폴리펩티드는 바람직하게는 선택적으로 수지로서 제공된 아가로스 또는 세파로스와 같이 고정화된 형태로 제공된다.

O-당단백질 결합 활성은 갖지만 O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 본 발명의 추가의 폴리펩티드는 이러한 모티프를 포함하는 O-당단백질-특이적 엔도프로테아제 활성을 갖는 임의의 다른 폴리펩티드 중의 메탈로프로테아제 도메인 모티프 HEbbH 또는 abxHEbbHbc를 파괴함으로써 생성될 수 있다. 엔도프로테아제 활성이 없거나 감소된 본 발명의 폴리펩티드의 용도에 대해 본원에 기술된 방법에서, 본 발명의 폴리펩티드에 대한 언급은 이러한 폴리펩티드를 포함한다. 상기 모티프의 파괴는 바람직하게는 상기와 같이 달성되어 다음과 같다:

(c) 다섯 번째 위치의 H가 대안적인 아미노산, 바람직하게는 A 또는 G로 치환됨

여기서, 상기 모티프 중의 b는 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W이다.

따라서 상기 폴리펩티드는 모티프 xbbbx를 포함하는 것으로 기술될 수 있으며, 여기서:

(a) x는 바람직하게는 H를 제외한 임의의 아미노산이고, 바람직하게는 A 또는 G이고/이거나;

(b) b는 비하전 아미노산, 선택적으로 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W, 바람직하게는 A 또는 G이다;

O-당단백질-특이적 엔도프로테아제 활성을 갖고 이러한 방식으로 파괴될 수 있는 다른 폴리펩티드는 슈도모나스 에루지노사 PAO1, 박테리오데스 테타이오타오미크론 VPI-5482, 및 클로스트리디움 퍼프린젠스(Noach et al; PNAS 2017, pE679-688 및 지원 부록, 특히 Materials and Methods for Cloning, Protein Expression and Purification에 기술된 3개의 펩티다제 참조)에서 확인된 것으로 상기되어 있다. 이러한 폴리펩티드의 전장 서열이 서열번호 32, 33 및 34로 제공된다. 상응하는 성숙 서열(예컨대 신호 및 다른 서열이 제거된 것)이 서열번호 26, 27 및 28로 제공된다. 대장균에서 발현하도록 최적화되고 후속 정제된(N 말단에 추가의 메티오닌 및 C 말단에 히스티딘 태그를 포함시킴으로써) 이러한 서열의 버전이 서열번호 29, 30 및 31로 제공된다. 따라서, 서열번호 26 내지 34 각각은 본 발명의 추가의 폴리펩티드를 생산하기 위해, 파괴되어 상기와 같은 모티프 xbbx를 생성할 수 있는 모티프 HEbbH를 갖는 메탈로프로테아제 도메인을 포함한다. HEbbH 모티프가 파괴된 서열번호 26, 27 및 28의 버전이 서열번호 35, 36 및 37로 제공된다. 대장균에서 발현하도록 최적화되고 후속 정제된(N 말단에 추가의 메티오닌 및 C 말단에 히스티딘 태그를 포함시킴으로써) 이러한 서열의 버전이 서열번호 38, 39 및 40으로 제공된다. O-당단백질-특이적 엔도프로테아제 활성이 없거나 감소된 본 발명의 폴리펩티드는 서열번호 35, 36, 37, 38, 39 또는 40 중 임의의 하나를 포함하거나, 이로 본질적으로 이루어지거나, 이로 이루어질 수 있다.

엔도프로테아제 활성이 없거나 감소된 LS 돌연변이체의 사용 방법

본 발명은 또한 O-글리칸에 대한 결합 방법을 제공하며, 여기서 상기 방법은 O-글리칸에 결합할 수 있고 O-글리코실화된 단백질에 대해 특이적인 엔도프로테아제 활성이 없거나 감소된 본 발명의 폴리펩티드를 O-글리칸을 포함하는 샘플과 접촉시키는 단계를 포함한다. 상기 방법은 선택적으로 O-글리칸이 결합되었는지 여부를 결정하는 단계 및/또는 생성된 혼합물로부터 O-글리칸 및 임의의 연결된 당단백질이 분리하는 단계를 추가로 포함한다.

본 발명은 또한 O-글리칸에 결합할 수 있고 O-글리코실화된 단백질에 특이적인 엔도프로테아제 활성이 없거나 감소된 본 발명의 폴리펩티드를 상기 샘플과 접촉시키는 단계, 및 단백질이 상기 폴리펩티드에 결합되었는지 여부를 결정하는 단계를 포함하는, 단백질의 글리코실화 상태를 평가하는 방법을 포함할 수 있다.

본 발명은 또한 샘플에서 O-연결 당단백질을 검출하는 방법을 포함할 수 있으며, 여기서, 상기 방법은 O-글리칸에 결합할 수 있고 O-글리코실화된 단백질에 특이적인 엔도프로테아제 활성이 없거나 감소된 본 발명의 폴리펩티드를 상기 샘플과 접촉시켜, O-연결 당단백질-폴리펩티드 복합체를 형성하도록 하는 단계를 포함한다. 상기 방법은 선택적으로 접촉된 샘플로부터의 상기 폴리펩티드를 분리하는 단계 및 분리된 폴리펩티드가 O-연결 당단백질에 결합되었는지 여부를 결정함으로써 샘플 중에 O-연결 당단백질의 존재 또는 부재를 결정하는 단계가 따라서 결정될 수 있는 것을 포함할 수 있다. 상기 방법은 또한 O-글리칸 또는 O-연결 당단백질을 함유하는 샘플로부터 O-글리칸 또는 O-연결 당단백질을 단리하기 위해 사용될 수 있다.

이러한 방법에서, 폴리펩티드가 샘플 중의 임의의 O-글리칸 또는 단백질과 상호작용하고 결합이 일어나기에 적합한 조건 하에서 샘플은 본 발명의 폴리펩티드와 접촉된다. 적합한 조건은 적어도 20 분, 30 분, 40 분, 50 분, 60 분, 70 분, 80 분, 90 분 또는 120 분, 3 시간, 5 시간, 10 시간 동안, 또는 밤새, 전형적으로 혼합 예컨대 엔드-오버-엔드 혼합하며, 본 발명의 폴리펩티드와 함께 항온 처리하는 것을 포함한다. 항온 처리는 바람직하게는 실온에서, 보다 바람직하게는 약 20℃, 25℃, 30℃, 35℃, 40℃ 또는 45℃, 가장 바람직하게는 약 37℃에서 발생한다. 상기 방법은 임의의 적합한 pH 하에서 수행될 수 있다. 적합한 pH 값은 예컨대 약 3.0, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9 또는 9.5의 pH를 포함한다. 본 발명의 폴리펩티드의 활성에 대해 바람직한 pH는 5.6 내지 6.8의 범위이다. 상기 방법은 임의의 적합한 완충액, 예컨대 Tris 완충 식염수(TBS) 또는 인산염 완충된 식염수(PBS)에서 수행될 수 있다. 본 발명의 폴리펩티드 대 샘플의 단백질 함량의 대략적인 비는 1:1, 2:1, 4:1, 6:1, 10:1, 15:1, 20:1, 1:2, 1:4, or 1:6, 1:10, 1:15, 1:20, 1:40, 1:100, 1: 200 또는 1:400 (중량:중량)일 수 있다. 바람직한 비는 1:1(중량:중량)이다. 보다 짧은 반응 시간이 요구되는 경우, 또는 O-당단백질이 많이 시알릴화된 경우 폴리펩티드 대 기질의 보다 높은 비율이 유리할 수 있다. 대안적으로, 초기 또는 동시 시알리다제 항온 처리 단계가 아래 보다 상세히 논의되는 바와 같이 시알산 함량을 감소시키기 위해 사용될 수 있다. 기질은 전형적으로 약 0.01 mg/ml 내지 10 mg/ml, 바람직하게는 약 0.1 mg/ml 내지 10 mg/ml, 약 0.01 mg/ml 내지 2 mg/ml, 또는 약 0.1 mg/ml 내지 2 mg/ml의 함량으로 존재한다.

O-글리칸 또는 O-연결 당단백질이 결합되었는지 여부를 결정하기 위한 샘플의 검출 또는 분석이 임의의 적합한 분석적 방법, 예컨대 비제한적으로 질량 분석법, HPLC, 친화성 크로마토그래피, 겔 전기영동, SDS-PAGE, ELISA, 렉틴 블롯팅, 분광법, 모세관 전기영동 및 단백질의 분석을 위한 다른 표준 실험실 기법에 의해 평가될 수 있다. 예컨대, 폴리펩티드의 분자량이 분석될 수 있다. O-글리칸 또는 O-연결 당단백질에 결합된 본 발명의 폴리펩티드는 O-글리칸 또는 O-연결 당단백질이 결합되지 않은 폴리펩티드보다 높은 분자량을 가질 것이다.

결합된 O-글리칸 또는 O-연결 당단백질 및 본 발명의 폴리펩티드의 분리는 임의의 적합한 분리 수단에 의해 수행될 수 있다. 예컨대, 분리 수단은 자성 나노파티클의 집단을 포함할 수 있다. 이들은 자기장 분리, 바람직하게는 고-구배 자기장 분리를 사용하여 샘플로부터 분리될 수 있다. 시약 또는 분리 수단의 예는 본 발명의 폴리펩티드에 결합할 수 있는 자기 입자 집단이다. 예컨대, 폴리펩티드가 히스티딘 태그로 유도체화되는 경우, 자기 입자는 니켈, 구리 또는 아연 이온을 운반하는 표면 킬레이트 기를 함유한다. 대안적으로, 폴리펩티드가 비오틴 태그로 유도체화되는 경우, 자기 입자는 이의 표면 스트렙타비딘을 함유한다.

분리 수단은 또한 본 발명의 폴리펩티드가 고정화된 고체 지지체를 포함할 수 있다. 고체 지지체의 예는 이전 섹션에 기술된 것들을 포함하고, 아가로스 또는 세파로스 수지, 가교된 아가로스 비드, 또는 유사한 것을 포함할 수 있다. 지지체는 친화성 크로마토그래피 컬럼에서 매트릭스로서 사용될 수 있다. 대안적으로 고체 지지체는 적합한 실리카-기반 물질 또는 폴리스티렌, 또는 본 발명의 폴리펩티드가 직접적으로 흡착될 수 있는 플라스틱 용기 예컨대 마이크로타이터 플레이트 또는 등가물을 포함할 수 있다.

대안적인 분리 수단은 본 발명의 폴리펩티드에 특이적인 항체를 포함하는 시약을 포함하며, 이는 당업계의 표준 방법에 의해 생성될 수 있다. 이러한 의미의 항체는 모노클로날 항체, 폴리클로날 항체, 단일쇄 항체, 키메라 항체, CDR-그래프팅된 항체 또는 인간화 항체를 포함한다. 항체는 무손상 면역글로불린 분자 또는 이의 단편 예컨대 Fab, F(ab')2 또는 Fv 단편일 수 있다. 하나 이상의 항체가 존재하는 경우, 항체는 바람직하게는 상이한 비-중첩 결정인자를 가지므로 본 발명의 폴리펩티드에 동시에 결합할 수 있다. 항체는 고체 지지체에 결합될 수 있거나 또 다른 화학 기 또는 분자에 표지 또는 접합되어 이의 분리 또는 단리를 도울 수 있다. 예컨대, 전형적인 화학 기는 형광 표지 예컨대 플루오레세인(FITC) 또는 피코에리스린(PE), 또는 비오틴과 같은 태그를 포함한다.

다른 적합한 분리 수단은 접촉된 샘플로부터의 폴리펩티드를 적합한 용리 완충액과 접촉시켜 (전형적으로 고정화된) 폴리펩티드로부터 단백질을 용리하는 것을 포함한다. 용리 완충액의 선택은 단백질의 산-민감도에 의존할 수 있다. 바람직한 용리 완충액은 높은 몰 농도의 우레아(전형적으로 적어도 5, 6, 7 또는 가장 바람직하게는 적어도 8M)또는 고농도의 세제(전형적으로 적어도 약 1%, 5% 또는 10%)를 포함할 수 있다. 적합한 세제는 Nonidet P40, Triton X-100, Tween 20, CHAPS, 소듐 디옥시콜레이트, 및 RapiGest SF 계면활성제를 포함하지만, 소듐 도데실 설페이트(SDS)가 바람직하다. 높은 몰의 우레아가 세제보다 바람직한데 그 이유는 하류 공정이 세제의 존재에 대해 보다 민감할 수 있기 때문이다.

또 다른 바람직한 용리 완충액은 O-당단백질 엔도프로테아제 활성을 갖는 적합한 농도의 본 발명의 폴리펩티드, 예컨대 서열번호 1의 폴리펩티드를 포함한다. 이러한 폴리펩티드에 의한 O-글리칸에서의 절단은 결합된 O-당단백질을 방출하여 우레아 또는 세제-기반 용리의 필요성을 제거할 것이다.

본 발명의 고정된 폴리펩티드로부터 O-당단백질을 용리하는 바람직한 방법이 실시예에서 입증된다.

임의의 상기 방법에서의 샘플은 환자, 바람직하게는 인간 환자로부터 취해진 샘플일 수 있다. 수득된 결과는 진단 목적, 예컨대 O-연결 글리코실화와 관련된 암의 존재를 검출하기 위해 사용될 수 있다. 이러한 용도는 건강한 대조군으로부터 수득된 샘플을 사용하여 수득된 것에 대해 환자의 샘플로부터 수득된 결과를 비교하는 것을 포함할 수 있다.

본 발명의 임의의 방법에서, 폴리펩티드는 프로테아제 또는 글리코시다제와 같은 또 다른 효소와 조합하여 사용될 수 있다. 추가의 프로테아제 또는 글리코시다제는 전형적으로 기질 단백질 또는 글리칸을 추가로 소화할 것이고, 이는 생성물의 보다 쉽고 보다 상세한 분석을 허용할 것이다.

예컨대, 본 발명의 폴리펩티드는 시알산을 제거하기 위한 제제와 조합하여 사용될 수 있다. 상기 제제는 바람직하게는 시알리다제 효소 또는 상기 섹션에 기술된 바와 같은 이러한 효소의 혼합물일 수 있다. 본 발명은 또한 본 발명의 폴리펩티드 및 Am1757 또는 Am1757 및 Am0707의 혼합물을 포함하는 조성물(동결건조되거나 용액 형태)을 제공한다. 본 발명은 또한 상이한 효소의 병용에 대한 지침과 함께, Am1757 또는 Am1757 및 Am0707의 혼합물로부터 별도의 용기에 본 발명의 폴리펩티드를 포함하는 키트를 제공한다.

또 다른 예시로서, 본원에 기술된 임의의 방법에서, 샘플은 표적 단백질로부터 N-글리칸을 제거하기 위해, 샘플을 본 발명의 폴리펩티드와 접촉하기 이전에, 접촉과 동시에, 또는 접촉한 후에, 샘플은 N-글리코시다제와 함께 항온 처리될 수 있다. 예시적인 N-글리코시다제는 PNGaseF이다. 샘플이 면역글로불린을 포함할 때 사용될 수 있는 다른 N-글리코시다제는 EndoS(WO2008071418의 서열번호 1 참조) 또는 EndoS2(EndoS49로 지칭될 수 있음 - WO2013037824의 서열번호 1 참조)이다. 이러한 효소 각각은 IgG1의 Asn-297로부터 N-연결 당단백질을 제거한다. 샘플은 본 발명의 폴리펩티드 외에 N-글리코시다제 및 시알리다제(또는 이들의 혼합물)과 접촉될 수 있다. 이러한 방법에서, 시알리다제(또는 혼합물)는 N-글리코시다제 및 본 발명의 폴리펩티드의 동시 첨가 전에 먼저 적용될 수 있다.

또 다른 예로서, 본원에 기술된 임의의 방법에서, 샘플은 표적 단백질을 추가로 소화하기 위해, 샘플을 본 발명의 폴리펩티드와 접촉하기 전에, 접촉과 동시에, 또는 접촉 후에 샘플은 프로테아제와 함께 항온 처리될 수 있다. 적합한 일반적인 프로테아제는 트립신, 키모트립신, Lys-C, Asp-N, Glu-C, Arg-C 또는 유사한 엔도프로테아제, 또는 포르피로모나스 진지발리스의 Arg-진지페인(gingipain)(RgpB)을 포함한다.

샘플이 면역글로불린을 포함하는 경우, 면역글로불린 프로테아제는 SpeB(WO2015040125의 서열 참조), S. 피오게네스의 면역글로불린 G-분해 효소(IdeS - WO2015040125의 서열 참조), S. 에퀴 아종 주에피데미쿠스(IdeZ)의 면역글로불린 G-분해 효소, 포르피로모나스 진지발리스의 Lys-진지페인(Kgp), 및 S. 아갈락티애의 면역글로불린 G-분해 효소(IgdE_agalactiae - PCT/EP2017/052463의 서열번호 3 참조)와 같은 것이 사용될 수 있다. 본 발명의 방법에서 이러한 프로테아제의 임의의 조합의 사용은 예컨대 질량분석법을 사용하여 기질 단백질 또는 글리칸의 분석을 도울 수 있다.

또 다른 예로서, 본원에 기술된 임의의 방법에서, 임의의 적합한 방법에 의한 추가 분석 전에 O-글리칸을 제거하기 위해 단리된 O-연결 당단백질은 O-글리코시다제와 함께 항온 처리될 수 있다. 적합한 O-글리코시다제는 엔테로코커스 패컬리스, 스트렙토코커스 오랄리스, 또는 비피도박테리움 비피덤, 바람직하게는 엔테로코커스 패컬리스 또는 스트렙토코커스 오랄리스, 가장 바람직하게는 스트렙토코커스 오랄리스의 균주로부터 수득될 수 있다. 스트렙토코커스 오랄리스로부터의 예시적인 O-글리코시다제의 서열이 서열번호 15로 제공된다.

다음의 실시예가 본 발명을 설명한다:

실시예 1:

재료 및 방법

LS의 돌연변이 유발

프라이머 E206A_fwd 5'-ATGGCGCACGC GCTGGGCCACG-3' 및 5'-GCCACCGTAC CATTTCGTC-3' (rev)을 사용하여 제조사의 지시(어닐링 온도 68℃, 3분 신장)에 따라 Q5(NEB)를 사용하여 부위-지시된 돌연변이 유발을 수행하였다; 따라서, 돌연변이체 Amuc1119_E206A(LS_E206A)를 생성하기 위해 아커만시아 뮤시니필라로부터 Amuc1119 유전자 중의 글루탐산을 알라닌으로 변환시켰다. 구축물을 DH5α 대장균에 형질전환시키고, 단리하고 서열분석(GATC Biotech)을 사용하여 검증하였다.

LS 및 LS _E206A 의 재조합 발현

아커만시아 뮤시니필라 ATCC BAA-835로부터의 유전자 Amuc1119, 및 돌연변이체 Amuc1119_E206A(Amuc1119 - LS; Amuc1119_E206A - LS_E206A)를 대장균(DNA 2.0)에서 발현시키기 위해 코돈 최적화 하고 융합 단백질의 부분으로서 C-말단 6xHis-태그를 가진 발현 벡터에 클로닝하였다.

코돈-최적화된 유전자를 BL21(DE3) Star 세포에 형질전환 하였다. 대장균을 일상적으로 37℃에서 180 rpm으로 LB에서 배양하였다. 플라스미드의 존재 하에, 50 ug/mL 가나마이신을 첨가하였다. 밤새 항온 처리 한 후에, 배양물을 신선한 LB(kana)에서 1:20으로 희석하고, OD₆₂₀ ~ 0.7-0.8까지 성장시킨 후 1 mM IPTG를 첨가하여 재조합 단백질 발현을 유도하고, 6시간 동안 계속해서 발현시키고 세포를 수집하고 동결하였다. 동결 세포를 해동하고 His 결합 완충액(20 mM NaP pH 7.4, 500 mM NaCl, 20 mM 이미다졸)에서 분해하고, 세포 내 단백질을 방출시키기 위해 초음파처리 하였다. 세포 파편을 원심분리로 제거하였다. 멸균 여과된 상등액을 니켈 컬럼 상에서 친화성 정제하고, PD-25 컬럼에서 20 mM Tris-HCl pH 8.0에 재-완충하였다. 단백질의 농도를 Nanodrop을 사용하여 결정하고, SDS-PAGE를 통해 순도를 예측하였다.

단백질 기질을 사용한 활성 평가

TNFαR을 2:1 비로 LS와 함께 혼합하고 37℃에서 15 내지 60분 동안 항온 처리한 후 단백질을 4-20% Novex 구배 SDS-PAGE 상에서 분리하였다. LS 활성에 대한 NaCl (0-1 M), 2가 양이온, EDTA, 및 pH의 영향을 조사하고, Gel Doc EZ (BioRad)를 사용하여 밀도 측정 분석을 통해 생성된 가수분해 단편의 차이를 조사하였다.

활성의 시간 및 용량 의존성

TNFαR (0.5 μg)을 PBS에서 37℃에서 15 또는 60분 동안 다양한 용량의 LS와 함께 항온 처리한 후 단백질을 4~20% Novex 구배 SDS-PAGE 상에서 분리하였다. 생성된 단편의 강도(밀도측정)를 사용하여 효율적인 항온 처리 조건을 위한 최적의 용량 및 시간을 결정하였다.

기질 특이성

LS를 2:1(기질:효소)의 비로 37℃에서 밤새 다양한 N- 및 O-연결 기질과 함께 항온 처리하였다. LS를 50:1의 비로 EPO(0.3mg/ml)와 함께 항온 처리하였다. 단백질을 4~20% Novex 구배 SDS-PAGE 겔 상에서 분리하고 분석하였다.

LS _E206A 의 고정화

LS_E206A를 커플링 완충액(0.2 M NaHCO₃, 0.5 M NaCl pH 8.3)에 재현탁하고 20 mg/ml로 농축하였다. NHS-활성화된 세파로스 4 Fast Flow (GE Healthcare)를 제조사의 지침에 따라 커플링을 위해 제조하였다(예컨대, HCl 세척 및 커플링 완충액의 평형화). LS_E206A를 4℃에서 세파로스와 함께 밤새 항온 처리하고 일정한 혼합을 위해 천천히 흔들면서 고정하였다. 0.1 M Tris pH 8.5를 첨가하여 세파로스를 블로킹하고 0.1 M Tris pH 8.5 / 0.1 M NaAc, 0.5 M NaCl pH 5.0의 3회 반복으로 세척하고, 사용하기 전까지 EtOH에 저장하였다.

LS _E206A 의 결합 친화성

PBS에서 평형화된 50 μl 고정화된 LS_E206A(예컨대 약 50 ug 단백질)를 갖는 스핀 컬럼을 시알리다제 혼합물(Am0707:Am1757) 또는 시알리다제 및 스트렙토코커스 오랄리스 엔도-α-N-아세틸-갈락토사미니다제(예컨대 O-글리코시다제)의 조합으로 전처리된 10 μg 당단백질과 함께 항온 처리하였다. 샘플을 37℃에서 2시간 동안 항온 처리한 후 컬럼을 PBS (10 부피; 100 g, 30 초)로 세척하고 0.1 M 글리신 pH 3.0으로 용리하였다. 분획을 SDS-PAGE 상에서 분석하였다.

질량 분석

에타너셉트(엔브렐®)는 TNFα에 결합하는 임상적으로 승인된 Fc-융합 단백질이다. 에타너셉트는 여러 O-글리칸을 함유한다. 효소적 절단 특이성을 시험하기 위해, 엔도프로테아제를 에타너셉트와 함께 37℃에서 항온 처리하였다. 질량 분석을 단순화하기 위해, 시알리다제 및 O-글리코시다제(밤새, PBS에서 1:40 비의 모든 단일 효소)를 사용하여 나머지 O-글리칸을 제거하기 위해 2차 효소 처리를 수행하였다. 생성된 펩티드는 C18 역상 액체 크로마토그래피에 의해 펩티드를 분리한 후 MS/MS로 분석하였다.

결과

LS는 추정 메탈로프로테아제이다

서열 및 도메인 유사성에 기초하여, LS는 추정 활성 부위 서열 GMAHELGHGL을 함유하는 몇몇 메탈로프로테아제와 상동성을 공유하고, 일반적인 메탈로프로테아제 서열 abxHEbbHbc(a = V/T, b = 전하 없음, c = 소수성)와 유사성을 공유한다. 히스티딘은 일반적으로 기질 결합 및 Zn²⁺ 친화성에 관여하는 반면, 글루탐산은 히스티딘과 함께 전자 이동을 매개하여 가수분해 효과를 나타낸다. 효소를 추가적으로 특성분석하기 위해, 본 발명자들은 기질에 결합할 수 있지만 E를 A로 변경함으로써 가수분해 능력이 없거나 감소된 LS_E206A 돌연변이체를 구축하였다. 완전한 비활성 상태를 유지하려면 추가 수정(예컨대 H를 A로 변경)이 필요할 수 있다. 두 구축물 모두 잘 발현되었고, His-태그에 기초한 친화성 크로마토그래피를 사용하여 용이하게 정제되었다(도 1).

LS는 O-글리칸이 있는 당단백질을 특이적으로 가수분해한다

LS의 기질 특이성을 조사하기 위해, 프로테아제를 다양한 단백질과 함께 항온 처리하였다. 도 2에 제시된 바와 같이, LS를 IgA 및 허셉틴(트라스투주맙)과 함께 항온 처리하였다. LS는 IgA와 같은 O-연결 글리칸을 갖는 단백질에만 작용할 수 있었다. 말단 시알산의 존재는 부분적으로 LS의 활성을 억제하는 것으로 보이지만, 시알산의 부재는 가수분해의 전제 조건이 아니다(도 4).

LS는 다양한 조건에서 O-연결 당단백질에 작용할 수 있다

LS의 효소적 특성을 평가하기 위해 SDS-PAGE 겔의 밀도 측정 분석을 수행하였다. LS는 대부분의 조건 하에서 활성이며, 약간 산성의 pH 및 낮은 NaCl 농도를 선호한다(도 3a 및 3b). Mg²⁺ 및 Ca²⁺ 이온 모두 LS의 가수분해 활성에 긍정적인 영향을 미쳤지만, Zn²⁺의 존재는 활성을 현저히 낮추었고, EDTA는 이를 완전히 없앴다(도 3c 및 3d).

O-연결 갈락토시다제 잔기는 LS 활성에 중요하다

말단 시알산이 없는 상태에서 증가된 활성을 갖지만, LS의 활성에 대한 O-글리칸에서의 다른 탄수화물의 중요성은 완전히 이해되지 않았다. LS의 활성은 말단 시알산이 없는 상태에서 현저히 증가하지만, 갈락토스의 제거는 LS의 활성을 완전히 억제한다(도 4a). 또한, 시알릴화된 단백질에 대한 LS의 낮은 활성은 밤새 항온 처리한 후의 완전한 가수분해에 의해 입증되는 바와 같이, 시알산의 존재 하에서 결합을 가수분해 할 수 없기 때문은 아니다(도 4b). LS의 활성은 O-글리칸에 전적으로 의존하는데, N-글리칸의 제거는 LS에 의한 가수분해에 영향을 미치지 않기 때문이다(도 4c).

O-연결 글리칸은 LS의 절단 부위를 지시한다

O-글리칸이 활성에 중요하다는 것을 입증한 후, 본 발명자들은 다음으로 LS의 특이적 절단 부위를 조사하고자 하였다. 질량 분석법을 사용하여, 본 발명자들은 이의 유형과 관계 없이, LS가 O-글리코실화된 Ser/Thr 및 이의 N-말단 아미노산 사이의 아미노 결합을 가수분해한다는 것을 입증할 수 있었다(예컨대, 프롤린은 가수분해를 억제하지 않는 것으로 보인다)(도 5).

O-연결 글리칸이 풍부하기 때문에 에타너셉트를 모델 단백질로 사용하여, 당단백질을 LS로 처리한 후, 질량 분석을 용이하게 하기 위해 후속하여 O-글리코시다제로 처리하였다. MS/MS 데이터와 함께 조합하여, 질량분석에서 생성된 m/z 값을 에타너셉트에 맞추었다. 모든 확인된 펩티드는 N-말단 세린 또는 트레오닌을 가졌으며, O-글리칸의 바로 N-말단을 절단하는 LS와 일치하였다(도 5). 분석은 지시된 검색(파라미터에서 S/T 가수분해를 정의함; 도 5a), 및 비편향 접근법(도 5b) 둘 모두에서 펩티드를 확인하였다.

LS의 가수분해 비활성 변이체는 O-글리칸 함유 단백질에 특이적으로 결합한다

LS가 O-글리칸에 결합하고 글리칸 옆에(예컨대, Ser/Thr 옆에) 아미노산 결합을 가수분해하는 능력으로, 본 발명자들은 LS의 E₂₀₆A 돌연변이체는 가수분해 활성은 없지만 결합력은 유지한다는 가설을 세웠다. 이러한 도구는 a) O-연결 당단백질의 확인, b) 제거 또는 연구를 위한 O-연결 글리코펩티드의 친화성 정제, 및 c) O-글리칸의 친화성-정제에 특히 유용할 것이다.

도 6a는 돌연변이체 LS가 검출가능한 가수분해 활성을 갖지 않았음을 보여준다. LS가 시알리다제의 존재 하에 에타너셉트를 가수분해 할 수 있었지만, LSmut는 에타너셉트를 가수분해 할 수 없었으며, 시험된 조건 하에서 유전적 변경이 실제로 O-글리코프로테아제를 불활성화시킨다는 것을 확인하였다.

LS_E206A를 세파로스에 고정시키고 보다 용이한 취급을 위해 스핀 컬럼에 첨가하였다. 중요하게도, 상이한 기질에 대한 LS_E206A의 결합은 LS의 가수분해 활성과 완벽하게 상관관계가 있었다(도 6b). LS_E206A(LS_mut로 표지됨)는 O-연결 당단백질에 대한 특이적 친화성을 입증하였다. 세파로스 상에 LS_mut를 고정시킴으로써, 본 발명자들은 IgA를 친화성 정제할 수 있었다. 그러나, 본 발명자들은 강한 친화성으로 인해 단백질을 용리할 수 없었다. IgA로 처리된 O-글리코시다제뿐만 아니라 O-글리칸이 없는 허셉틴(트라스투주맙)은 컬럼에 결합하지 않았지만, 통과물(FT)에서 검출될 수 있었다.

2-3 시알 결합은 완전한 LS 활성을 제거하기 위해 중요하다

우리는 최근에 엔도프로테아제 활성이 특정 시알산 결합에 의존하여 완전한 효과를 위해 2~3 및 2~6 연결된 시알산 둘 모두의 제거를 필요로 한다는 것을 결정하였다. LS의 활성에 대한 특정 시알산 결합의 개별적인 역할을 결정하기 위해, 우리는 30분 내지 20 시간 동안 LS와 조합하여 상이한 시알리다제와 함께 엔브렐을 항온 처리하였다. LS에 의한 가수분해에 2~3 결합 제거가 충분해 보였다(도 7).

LS는 에리스로포이에틴(EPO)을 절단한다

EPO를 PNGaseF, 시알리다제(Smix, Am0707 및 Am1757을 포함함) 및/또는 O-글리코시다제로 처리하고 LS와 함께 항온 처리하였다.

이어서 생성된 생성물을 SDS-PAGE 및 쿠마시 블루 염색뿐만 아니라, RPLC 및 질량분석법으로 분석하였다. SDS-PAGE 결과가 도 9a에 제시되어 있으며, 이는 시알산이 제거되고 이들이 손상되지 않았을 때 LS가 EPO를 절단한다는 것을 보여준다. 또한, LS는 또한 N-글리칸이 PNGaseF로 제거되었을 때 EPO를 소화시켜 LS 활성이 N-글리칸 제거에 영향을 받지 않는다는 것을 확인한다. 그러나, O-글리칸이 O-글리코시다제로 제거될 때 LS는 EPO를 절단하지 않았으며, 이는 LS가 단백질을 절단하기 위해 O-글리칸이 필요함을 보여준다. 10:1, 5:1 및 2:1(기질:효소)의 비율에서 동등한 결과가 관찰되었다(데이터는 제시되지 않음).

PNGaseF, Smix 및 LS와 함께 항온 처리한 후 샘플 혼합물을 역상 액체 크로마토그래피로 분리하고 효소 처리 후 반응 생성물의 식별을 위해 ESI 질량 분석법으로 분석하였다.

도 9b는 RPLC로부터의 UV 크로마토그램을 나타낸다. 예상한 바와 같이, EPO가 하나의 제안된 O-글리칸 위치(아래의 서열번호 14의 예측된 위치 참조)를 가지면, 크로마토그램은 LS에 의한 절단으로 인한 2개의 단편에 상응하는 2개의 피크를 나타낸다.

이러한 단편을 MS에 의해 추가로 분석하고(도 9c 및 d 참조) 아래와 같이 확인하였다:

SAAPLRTITADTFRKLFRVYSNFLRGKLKLYTGEACRTGD (질량 = 4900.5868Da - 절단 지점에 대한 서열 C 말단에 상응하고 따라서 N 말단 세린에 여전히 연결된 O-글리칸을 포함함); 및

APPRLICDSRVLERYLLEAKEAEDITTGCAEHCSLDENITVPDTKVDFYAWKRMEVGQQAVEVWQGLALLSEAVLRGQALLVNSSQPWEPLQLHVDKAVSGLRSLTTLLRALGAQKEAISPPDAA (질량 = 13714.1199Da, 절단 지점에 대한 서열 N 말단에 상응함).

따라서, PNgaseF, 시알리다제 혼합물 및 LS의 병용은 EPO에서 O-글리칸-함유 세린의 단리 및 정확한 확인을 허용하였다. 이러한 유형의 방법은 임의의 O-당단백질에 적용할 수 있으며 O-글리칸 부착 위치를 신속하게 식별할 수 있도록 한다.

실시예 2

도입

실시예 1에 기술된 LSE206A 돌연변이체는 LS의 활성 부위(abxHEbbHbc 내지 abxHAbbHbc)의 부위-지향적 돌연변이를 통합하여, 효소 분열의 전자 전달 능력을 제거한다. 하기에 추가로 설명되는 바와 같이, 추가의 스트레스 시험에서, 이러한 변화는 야생형 서열에 비해 O-글리코프로테아제 활성을 감소시켰지만 이를 완전히 제거하지 않는다는 것을 발견하였다. 따라서, 본 발명자들은 효소 분열에 추가 치환을 포함하는 또 다른 돌연변이체를 개발하고 특성분석하였다. 구체적으로, 보조-인자 아연 이온의 배향에 중요한 His 잔기를 Ala로 치환하였다. 생성된 이중-돌연변이체를 H205A/E206A(abxHEbbHbc 내지 abxAAbbHbc)로 지칭한다.

2.1 이중-돌연변이체의 생성

표준 프로토콜(예컨대 실시예 1에서와 같이)을 사용하는 부위-지향적 돌연변이 유발은 아커만시아 뮤시니필라의 Amuc1119 유전자와 관련하여 히스티딘 및 글루탐산 둘 모두를 알라닌으로 변화시켜 이중 돌연변이체 Amuc1119H205A/E206A(LS_H205A/E206A)를 생성하였다. 구축물을 대장균에 형질전환시키고, 실시예 1에서와 같이 서열분석을 사용하여 단리 및 확인하였다. 대장균에서의 발현을 실시예 1에 기술된 바와 같이 수행하였다. 발현된 단백질의 서열이 서열번호 21로 제공된다.

2.2 이중-돌연변이체의 특성

2.2.1 이중 돌연변이체는 LS의 활성을 완전히 비활성화시킨다

실시예 1에 나타낸 바와 같이, 단일 돌연변이체 LSE206A는 2 시간 이내에 O-당단백질을 가수분해할 수 없기 때문에 비활성인 것으로 나타났다. 그러나, 스트레스 테스트에서 O-글리코프로테아제 활성이 완전히 폐지되지는 않았지만, 더 높은 비율의 효소:O-당단백질 및 더 긴 항온 처리 시간에서 일부 활성이 관찰되었다는 점에서 다소 감소된 것으로만 확인되었다.

LSE206A : 비시알릴화된 O-당단백질에 대해 1:1(중량:중량) 비율로 24시간 동안 항온 처리하면 기질의 상당한 가수분해가 나타났으나, 야생형 LS와 같은 정도는 아니었다(도 10a). 대조적으로, 이중-돌연변이체 LSH205A/E206A는 밤새 항온 처리한 후 효소:O-당단백질에 대해 15:1(중량:중량) 비율에서도 가수분해의 임의의 증거를 나타내지 않았으며(도 10b), 이는 효소가 두 번째 돌연변이의 추가로 완전히 비활성화되었음을 시사한다.

2.2.2 이중 돌연변이체는 O-당단백질에 특이적으로 결합한다

상이한 단백질에 대한 결합을 평가하기 위해, 고정화된 LS_H205A/E206A(50 μl 수지) (실시예 1과 동일한 프로토콜을 사용하여 제조함)를 PBS에서 평형화시킨 후, 50 μg의 상이한 단백질 샘플을 0.5 mg/mL의 농도로 첨가하고 실온에서 2시간 동안 엔드-오버-엔드 회전으로 항온 처리하였다. 통과물을 원심분리(200 g, 1분)를 통해 수집하고 수지를 350 μl PBS로 3회 세척하였다. 결합된 단백질의 50 μl 8 M 우레와와 함께 2회 연속 5분 항온 처리한 후 원심분리(1000 g, 1분)로 용리하였다. 모든 샘플을 동일한 부피로 로딩하였다. SDS-PAGE에 의해 시작/로딩 물질, 통과물, 및 용리물을 평가하였다.

첫 번째 실험에서(도 11a 참조), 글리코실화된 또는 비-글리코실화된 단백질을 시알리다제 혼합물(Am0707:Am1757)로, 또는 시알리다제 혼합물과 스트렙토코커스 오랄리스 엔도-α-N-아세틸-갈락토사미니다제(예컨대 O-글리코시다제)의 조합으로 전처리하고 수지와 함께 항온 처리하고, 세척하고 용리하였다. 샘플(시알리다제 혼합물 +/- O-글리코시다제)의 전처리를 제조사의 지시에 따라 수행하였다. 시알산이 없는 경우 친화성이 증가된 O-글리칸을 갖는 단백질만이 수지에 결합하였다. O-글리코시다제로 처리한 후 상호작용이 없는 것으로 나타난 바와 같이, O-글리칸의 존재는 임의의 결합이 일어나기 위해 필수적이었다.

두 번째 실험에서(도 11b 참조), N-글리코실화된, O-글리코실화된 및 비-글리코실화된 단백질 혼합물을 LS 이중 돌연변이체 수지와 함께 항온 처리하였다. O-글리코실화된 단백질(TNFαR 및 ApoE)만이 매트릭스에 결합되었고 8 M 우레아로 용리되었다. N-글리코실화된(애플리버셉트, AGP (알파-1-산 당단백질), IgG의 Fc 도메인(IgG Fc) 및 비-글리코실화(BSA)는 LS 이중 돌연변이체 수지에 결합하지 않았고 통과물에서 발견되었다. 따라서, 이중 돌연변이체 수지는 샘플이 N-, O- 및 비-글리코실화된 단백질의 혼합물을 함유할 때 O-글리코실화된 단백질에만 특이적으로 결합한다.

세 번째 실험에서(도 11c 참조), N-글리코실화된 및 비-글리코실화된 단백질의 혼합물을 LS 이중 돌연변이체 수지와 함께 항온 처리하였다. O-당단백질로부터 가능한 경쟁이 없을 때에도(아무것도 존재하지 않음) 비-특이적 결합이 없었다. 용리물에서 단백질이 발견되지 않았다. 따라서, 이중 돌연변이체 수지는 O-글리칸이 없는 단백질에 결합하지 않는다.

2.2.3 이중 돌연변이체는 용량을 향상시키기 위해 상이한 농도로 수지에 고정될 수 있다

더 많은 O-글리코실화된 단백질에 결합하는 고정화된 이중-돌연변이체 수지의 용량을 향상시키는 능력을 조사하기 위해, 상이한 농도의 이중 돌연변이체(5 내지 15 mg/mL)를 수지에 고정시키는 동안 사용하였다. 대표적인 겔이 도 12a에 제시되어 있다. 도시된 %는 양성 대조군에 대한 결합 수준이며 겔의 밀도측정 분석에 의해 결정되었다. 결과를 도 12b의 그래프에 나타냈다. 고정화 동안 더 높은 농도의 이중 돌연변이체를 사용하는 경우, 더 높은 O-당단백질 결합능을 갖는 용량-의존적 증가가 관찰되었다. 15 mg/mL의 고정화된 이중 돌연변이체를 사용하여 추가 실험을 계속하였다. 또한, 1 M 우레아 및 1 M GHCl의 존재 하에서도 높은 수준의 O-당단백질 결합이 유지되었지만, 후자는 결합 효율을 상당히 감소시켰다.

2.2.4 이중 돌연변이체의 친화성 정제 능력은 약 3 mg 당단백질/mL 수지이다

이중-돌연변이체 수지가 O-당단백질을 친화성 정제하는 능력, 및 이러한 능력의 샘플에 대한 농도의 영향을 구체적으로 조사하기 위해, 상이한 양 및 농도의 비시알릴화된 에타너셉트를 수지에 첨가하였다. 개별적인 컬럼(50 μl의 이중 돌연변이체 수지 함유)은 150 μg의 O-당단백질(즉 3 mg O-당단백질/mL 수지)와 결합하는 능력을 가졌다. 도 13은 대표적인 겔을 나타낸다.

2.2.5 이중-돌연변이체에 대한 O-당단백질의 결합은 이온 강도 또는 완충액 부피/유형에 의해 유의하게 영향을 받지 않으며, 넓은 pH 범위에서 작동한다

샘플 단백질을 상이한 조건의 범위 하에서 엔드-오버-엔드 회전으로 실온에서 2시간 동안 이중-돌연변이 수지에 결합시켜 이온 강도, 완충액 부피/유형 및 pH가 수지의 결합 능력에 미치는 영향을 시험하였다. 각각의 경우에, 이어서 수지를 각각의 결합 완충액(350 μl)으로 3회 세척하고 이어서 8 M 우레아(50 μl, 5분 항온 처리; 2회 반복)를 첨가하여 용리하였다. 이어서 모든 샘플을 SDS-PAGE로 분석하였다.

첫 번째 실험에서(도 14a 참조), 다양한 이온 강도를 갖는 완충액에서 상호작용의 안정성을 조사하기 위해, 샘플은 비시알릴화된 에타너셉트로 이루어져 있으며, 이를 0 내지 4 M NaCl에서 이중-돌연변이체-수지와 함께 항온 처리하고, 각각의 NaCl 농도로 모두 세척 단계를 수행하였다. NaCl의 첨가는 비시알릴화된 에타너셉트의 결합에 유의한 영향을 미치지 않았다.

두 번째 실험에서(도 14b 참조), 샘플은 상이한 부피의 PBS 범위에서 비시알릴화된 에타너셉트로 이루어져 있다. 세척 단계는 PBS를 사용하였다. 100 내지 300 μl 사이에서 기질 부피를 변화시키는 것은 효율에 유의한 영향을 미치지 않았다.

세 번째 실험에서(도 14c 및 d 참조), 샘플은 상이한 pH(pH 4-9)에서 상이한 완충액(100 mM 소듐 아세테이트, 50 mM 소듐 포스페이트 및 50 mM Tris) 중의 비시알릴화된 에타너셉트 및 BSA로 이루어져 있었다. 세척 단계는 맞는 완충액을 사용하였다. pH 6~8이 가장 잘 작동하는 것으로 밝혀진 반면 pH 4는 모두 작동하지 않았고 pH 9는 pH 8보다 약간 덜 효율적이었다. 임의의 O-글리칸을 함유하지 않았던 BSA는 임의의 결합 조건 하에서 수지에 결합하지 않았다.

2.2.6 우레아 및 SDS는 친화성-결합된 O-당단백질을 용리할 수 있다

이중 돌연변이체와 이의 O-당단백질 기질 사이의 높은 친화성에 기초하여, 본 발명자들은 이온 강도에 기초하지 않고, 수지로부터 결합된 단백질을 용리하기 위한 상이한 수단을 조사하였다. 우레아는 용량 의존적 용리를 가졌으며, 8 M 우레아를 사용하여 100%에 가까운 용리를 나타냈다(도 15a). 고농도의 SDS(예컨대 5~10%)도 또한 대부분의 결합된 단백질을 용리하였다(도 15b). 그러나, 다수의 하류 적용은 세제의 존재에 민감하기 때문에, 높은 수준의 우레아를 사용하는 것은 결합된 단백질/펩티드의 비-효소적 방출에 대한 것보다 실질적으로 유용할 것으로 보인다.

2.2.7 야생형 LS를 사용하여 이중-돌연변이체-결합된 O-당단백질을 용리할 수 있다

본 발명자들은 이중-돌연변이체 결합된 단백질에 LS의 첨가가 이의 방출을 초래할 수 있고, 따라서, 용리를 위해 우레아의 첨가를 필요로 하지 않는다고 추측하였다. 아바타셉트 및 에타너셉트 둘 모두는 6시간 내에 LS에 의해 이중-돌연변이체-수지로부터 가수분해되고 용리될 수 있지만, 24시간 후에 약간 더 완전한 용출을 가졌다(도 16a). 이후 우레아의 첨가는 매우 적은 O-당단백질이 친화성 매트릭스에 부착된 채로 남아 LS의 용리 전략이 매우 효율적이라는 것을 보여주었다.

LS로 용리된 에타너셉트는 또한 질량 분석(LC/MS 및 MS/MS)에 적용되었다, 확인된 펩티드(도 16b.1)는 에타너셉트의 LS 소화에서 생성된 것들과 일치하였다(도 16b.2). 이러한 실험의 추가 MS 데이터가 다음 표에 제시되어 있다:

2.2.8 이중 돌연변이체를 사용하여 복합체 샘플로부터 O-당단백질을 친화성-정제할 수 있다

시스템이 단순화된 시스템뿐만 아니라 복합 배지에서 O-글리코실화된 단백질에 대한 일반적인 친화성 매트릭스로서 기능할 수 있다는 개념의 증거로서, 본 발명자들은 이중-돌연변이체가 인간 혈청으로부터 O-당단백질을 정제하는 능력을 조사하였다. 인간 혈청은 주로 비-글리코실화된(BSA) 단백질 및 N-글리코실화된(IgG) 단백질로 이루어져 있으며, 총 혈청 프로테옴의 일부만이 O-글리코실화되어있다.

50 μl의 고정화된 이중-돌연변이체 수지 컬럼에 20 μl 시알리다제 처리된 혈청(약 1.2 mg 단백질)을 적용하면 거의 모든 비-글리코실화된 단백질 및 N-글리코실화된 단백질을 제거하면서, 일부 선택된 단백질을 용리할 수 있다(도 17a). 시알리다제 및 O-글리코시다제의 전처리 또는 비처리된 다량의 혈청(예컨대, 2.5 mg 단백질)을 첨가함으로써, 상호작용이 O-글리칸 및 말단 시알산의 제거에 의존적임을 입증하였다(도 17b). 또한, 시알리다제로 전처리하면 비-시알리다제-처리된 샘플에 비해 결합된 O-당단백질의 양을 유의하게 증가시킨다고 결론지었다. 50 U 시알리다제 혼합물(Am0707:Am1757)의 첨가는 친화성 정제된 O-당단백질의 양을 향상시키기에 충분하였다(도 17c).

질량 분석법으로 분석함으로써, 대부분의 친화성 정제된 혈청 단백질은 O-글리코실화된 단백질로 주석이 달릴 수 있다(도 18a, 및 아래 표에서 굵은-이탤릭 으로 된 명칭). 비-O-당단백질 펩티드와 관련하여 확인된 O-당단백질 펩티드의 수는 확인된 펩티드의 총 수의 측면(도 18b)뿐만 아니라 O-당단백질 펩티드 대 비-당단백질 펩티드의 비율(도 18c) 둘 모두에서 세척 단계에서 상이한 엄격성에 의해 영향을 받을 수 있다. 따라서, 친화성 수지는 O-당단백질을 특이적이고 선택적으로 친화성 정제 및 농축하는 능력이 매우 효율적이라는 것이 명백하다. 이러한 실험의 추가 MS 데이터가 아래 표에 제시되어 있다.

2.2.9 고정화된 이중-돌연변이체는 또한 더 짧은 O- 글리코펩티드에 결합한다

O-글리코펩티드에 대해서도 LS 이중 돌연변이체의 특이성을 입증하기 위해 일련의 실험을 수행하였다. 첫 번째 실험에서, O-글리코실화된 펩티드(트레오닌 상에 핵심 1 O-글리칸이 있는 글리코드로소신 (GD) = GKPRPYSPRPTSHPRPIRV (서열번호 47)) 및 몇몇 비-글리코실화된 펩티드(H2686, H4062 H8390 및 인슐린 산화된 베타 쇄(IOB))의 혼합물을 LS 이중 돌연변이체 수지와 함께 항온 처리하였다. (H2686 = YIYGSFK (서열번호 48), H4062 = KKLVFFA (서열번호 49), H8390 = FLPLILGKLVKGLL (서열번호 50)).

펩티드 혼합물을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 50 μl의 고정화된 이중-돌연변이체 수지에 결합하도록 하였다. 수지를 결합 완충액(300 μl)으로 5회 세척한 다음 8 M 우레아를 첨가하여 용리하였다. 로딩, 통과물 및 용리물 중의 펩티드를 LC/MS로 분석하였다. RP-LC C18 컬럼(Agilent의 Advance BioPeptide Map 2.1x100 2.7μm) 상에서 분리를 수행하고 ESI-Q-TOF Bruker Impact II로 검출하였다. 결과를 도 19a에 나타냈다. O-GalNAcGal을 함유한 혼합물에서 유일한 펩티드인 글리코드로소신을 주로 용리된 분획과 통과물 분획 중의 비-글리코실화된 펩티드에서 발견되었다.

두 번째 실험에서, LS 이중-돌연변이체가 트립신 단백질 소화(예컨대, 상이한 유형의 펩티드 혼합물)로부터 O-글리코실화된 펩티드를 풍부하게 할 수 있는지 여부를 조사하였다.

IgA를 소화 표적으로 선택하였다. 트립신 부위 및 IgA의 보고된 O-글리코실화 부위에 기초하여, 트립신 소화는 IgA의 위치 89-126에 상응하는 단일 O-글리코실화된 펩티드만을 초래해야 한다(도 19b의 개략도 참조).

트립신 소화물을 생성하기 위해, IgA를 6M 우레아 및 5 mM DTT와 함께 혼합한 후 37 ℃에서 1시간 동안 항온 처리하였다. IAM을 15 mM 첨가한 후 어두운 곳에서 30분 동안 실온에서 항온 처리하였다. 이어서 샘플을 Zeba spin 7000 K 컬럼 상에서 50 mM Tris, pH 8.0으로 완충액을 교환하였다. 이어서 트립신을 1:20으로 첨가하고 37℃에서 밤새 항온 처리하였다. 트립신 억제제 1 mg/mg을 첨가한 후 실온에서 20분 동안 항온 처리하였다. 시알리다제 혼합물 및 NaCl을 첨가하여 트립신 소화물을 생성하였다. 혼합물을 엔드-오버-엔드 회전으로 실온에서 2시간 동안 수지에 결합하도록 하였다. 수지를 PBS 완충액 (300 μl)으로 10회 세척한 다음 8 M 우레아(50 μl, 2분, 2회 반복)를 첨가하여 용리하였다.

로딩, 통과물 및 용리물의 펩티드를 45℃에서 MQ 중의 0.1%FA:95% ACN 중의 0.1%FA 구배 및 0.2 ml/분의 유속에서 C18 컬럼(Agilent Technologies의 Advance BioPeptide Plus 2.1 × 150 mm 2.7 μm)에서 RP-LC MSMS를 사용하여 분리하고 분석하였다. 검출은 ESI-Q-TOF Bruker Impact II 기기에서 이루어졌다. 결과를 도 19c에 나타냈다. O-글리코실화된 펩티드 89-126은 용리액이 상당히 풍부하였고, 특정 O-글리코펩티드 89-126은 무손상 질량으로 확인되었다.

2.2.10 고정화된 이중-돌연변이체는 다른 O-당단백질 결합 매트릭스와 유리하게 비교한다

본 발명자들은 다른 상업적으로 이용가능한 O-당단백질 결합 매트릭스, 특히 렉틴 Peanut 응집체(PNA), 및 비시아 빌로사 렉틴(Vicia villosa lectin, VVA)과 비교하여 O-당단백질을 친화성 정제하는 이중-돌연변이체의 능력을 평가하였다. 에타너셉트 및 비시알릴화된 에타너셉트를 모델 기질로 사용하였다.

50 μg 기질을 PBS(PNA 및 LS 이중 돌연변이체) 또는 렉틴 결합 완충액(VVA)에 각각의 완충액 중의 미리-평형화된 50 μl 부피의 상이한 고정화된 렉틴 또는 LS 이중-돌연변이체 수지에 첨가하였다(총 100 μl). (렉틴 결합 완충액은 20 mM Tris-HCl pH 7.4, 150 mM NaCl, 1 mM 각각의 MgCl2, CaCl2, ZnCl2, 및 MnCl2이다). 기질을 실온에서 엔드-오버-엔드 혼합으로 2시간 동안 수지와 함께 상호작용 시켰다. 비-결합된 단백질을 PBS 또는 렉틴 결합 완충액으로 각각 세척하였다(100 g, 1 분; 3 회). 수지를 원심분리(1000 g, 1분)로 건조시켰다. 8 M 우레아(PNA 및 LS 이중 돌연변이체 수지의 경우) 또는 제조사에 따른 VVA 용리 완충액(VVA 수지의 경우)(50 μl, 5분 처리 후 1000 g 1분; 2회 원심분리)을 첨가하여 결합된 단백질을 용리하고, 통과물(FT) 및 용리물(E) 둘 모두를 SDS-PAGE 상에서 분석하였다. 양성 대조군으로서 1.5 μg 기질을 각각의 겔(예컨대 3 μl)에 첨가하고 100% 효율을 가정한 1.5 μg 로딩된 기질에 대한 수지의 효율을 평가하기 위해 밀도측정 분석을 수행하였다. 에타너셉트 및 비시알릴화된 에타너셉트(에타너셉트 S)에 대한 대표적인 겔을 도 20a에 나타냈다. 밀도측정 분석의 결과를 도 20b에 나타냈다. LSH205A/E206A 이중 돌연변이체는 비시알릴화된 기질의 정제 효율을 위해 적어도 최고의 상용 렉틴뿐만 아니라 성능도 수행한다.

서열

SEQUENCE LISTING <110> GENOVIS AB <120> Protease and binding polypeptide for O-glycoproteins <130> N410795WO <150> GB1708471.6 <151> 2017-05-26 <150> GB1708476.5 <151> 2017-05-26 <150> GB1806655.5 <151> 2018-04-24 <160> 50 <170> PatentIn version 3.5 <210> 1 <211> 361 <212> PRT <213> Akkermansia muciniphila <400> 1 Glu Val Thr Val Pro Asp Ala Leu Lys Asp Arg Ile Ala Leu Lys Lys 1 5 10 15 Thr Ala Arg Gln Leu Asn Ile Val Tyr Phe Leu Gly Ser Asp Thr Glu 20 25 30 Pro Val Pro Asp Tyr Glu Arg Arg Leu Ser Glu Leu Leu Leu Tyr Leu 35 40 45 Gln Gln Phe Tyr Gly Lys Glu Met Gln Arg His Gly Tyr Gly Ala Arg 50 55 60 Ser Phe Gly Leu Asp Ile Lys Ser Pro Gly Arg Val Asn Ile Ile Glu 65 70 75 80 Tyr Lys Ala Lys Asn Pro Ala Ala His Tyr Pro Tyr Glu Asn Gly Gly 85 90 95 Gly Trp Lys Ala Ala Gln Glu Leu Asp Glu Phe Phe Lys Ala His Pro 100 105 110 Asp Arg Lys Lys Ser Gln His Thr Leu Ile Ile Met Pro Thr Trp Asn 115 120 125 Asp Glu Lys Asn Gly Pro Asp Asn Pro Gly Gly Val Pro Phe Tyr Gly 130 135 140 Met Gly Arg Asn Cys Phe Ala Leu Asp Tyr Pro Ala Phe Asp Ile Lys 145 150 155 160 His Leu Gly Gln Lys Thr Arg Glu Gly Arg Leu Leu Thr Lys Trp Tyr 165 170 175 Gly Gly Met Ala His Glu Leu Gly His Gly Leu Asn Leu Pro His Asn 180 185 190 His Gln Thr Ala Ser Asp Gly Lys Lys Tyr Gly Thr Ala Leu Met Gly 195 200 205 Ser Gly Asn Tyr Thr Phe Gly Thr Ser Pro Thr Phe Leu Thr Pro Ala 210 215 220 Ser Cys Ala Leu Leu Asp Ala Cys Glu Val Phe Ser Val Thr Pro Ser 225 230 235 240 Gln Gln Phe Tyr Glu Gly Lys Pro Glu Val Glu Val Gly Asp Val Ala 245 250 255 Ile Ser Phe Lys Gly Asp Gln Ile Leu Val Ser Gly Asn Tyr Lys Ser 260 265 270 Pro Gln Thr Val Lys Ala Leu Asn Val Tyr Ile Gln Asp Pro Pro Tyr 275 280 285 Ala Val Asn Gln Asp Tyr Asp Ala Val Ser Phe Ser Arg Arg Leu Gly 290 295 300 Lys Lys Ser Gly Lys Phe Ser Met Lys Ile Asp Lys Lys Glu Leu Glu 305 310 315 320 Gly Leu Asn Asn Asn Glu Phe Arg Ile Ser Leu Met Phe Ile Leu Ala 325 330 335 Asn Gly Leu His Met Gln Lys His Phe Thr Phe His Trp Asp Ala Leu 340 345 350 Gln Asp Tyr Arg Asp Gly Ser Lys Ser 355 360 <210> 2 <211> 371 <212> PRT <213> Artificial Sequence <220> <223> LS (N terminal methionine and a C-terminal linker + His6 tag) <400> 2 Met Glu Val Thr Val Pro Asp Ala Leu Lys Asp Arg Ile Ala Leu Lys 1 5 10 15 Lys Thr Ala Arg Gln Leu Asn Ile Val Tyr Phe Leu Gly Ser Asp Thr 20 25 30 Glu Pro Val Pro Asp Tyr Glu Arg Arg Leu Ser Glu Leu Leu Leu Tyr 35 40 45 Leu Gln Gln Phe Tyr Gly Lys Glu Met Gln Arg His Gly Tyr Gly Ala 50 55 60 Arg Ser Phe Gly Leu Asp Ile Lys Ser Pro Gly Arg Val Asn Ile Ile 65 70 75 80 Glu Tyr Lys Ala Lys Asn Pro Ala Ala His Tyr Pro Tyr Glu Asn Gly 85 90 95 Gly Gly Trp Lys Ala Ala Gln Glu Leu Asp Glu Phe Phe Lys Ala His 100 105 110 Pro Asp Arg Lys Lys Ser Gln His Thr Leu Ile Ile Met Pro Thr Trp 115 120 125 Asn Asp Glu Lys Asn Gly Pro Asp Asn Pro Gly Gly Val Pro Phe Tyr 130 135 140 Gly Met Gly Arg Asn Cys Phe Ala Leu Asp Tyr Pro Ala Phe Asp Ile 145 150 155 160 Lys His Leu Gly Gln Lys Thr Arg Glu Gly Arg Leu Leu Thr Lys Trp 165 170 175 Tyr Gly Gly Met Ala His Glu Leu Gly His Gly Leu Asn Leu Pro His 180 185 190 Asn His Gln Thr Ala Ser Asp Gly Lys Lys Tyr Gly Thr Ala Leu Met 195 200 205 Gly Ser Gly Asn Tyr Thr Phe Gly Thr Ser Pro Thr Phe Leu Thr Pro 210 215 220 Ala Ser Cys Ala Leu Leu Asp Ala Cys Glu Val Phe Ser Val Thr Pro 225 230 235 240 Ser Gln Gln Phe Tyr Glu Gly Lys Pro Glu Val Glu Val Gly Asp Val 245 250 255 Ala Ile Ser Phe Lys Gly Asp Gln Ile Leu Val Ser Gly Asn Tyr Lys 260 265 270 Ser Pro Gln Thr Val Lys Ala Leu Asn Val Tyr Ile Gln Asp Pro Pro 275 280 285 Tyr Ala Val Asn Gln Asp Tyr Asp Ala Val Ser Phe Ser Arg Arg Leu 290 295 300 Gly Lys Lys Ser Gly Lys Phe Ser Met Lys Ile Asp Lys Lys Glu Leu 305 310 315 320 Glu Gly Leu Asn Asn Asn Glu Phe Arg Ile Ser Leu Met Phe Ile Leu 325 330 335 Ala Asn Gly Leu His Met Gln Lys His Phe Thr Phe His Trp Asp Ala 340 345 350 Leu Gln Asp Tyr Arg Asp Gly Ser Lys Ser Gly Ser Gly His His His 355 360 365 His His His 370 <210> 3 <211> 1116 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence of LS <400> 3 atggaagtca ctgtgccgga cgccctgaaa gatcgcatcg cgctgaagaa aaccgctcgt 60 cagctgaata tcgtctactt cctgggttct gataccgaac cggttccgga ctacgagcgc 120 cgtctgagcg agctgctgtt gtatctgcag caattctatg gtaaagaaat gcagcgccat 180 ggctatggcg cacgcagctt tggtctggac attaagtcac cgggtcgtgt gaacattatc 240 gagtacaaag cgaagaaccc ggcagcgcat tacccgtatg agaatggtgg cggctggaaa 300 gctgcacaag aactggacga atttttcaag gcccatccag accgcaagaa aagccagcac 360 accctgatca tcatgcctac ctggaatgat gagaaaaatg gtcctgacaa tccgggtggc 420 gttccgttct atggtatggg tcgtaattgt tttgcgttgg actacccggc gtttgatatc 480 aagcacctgg gtcagaaaac gcgtgagggt cgtctgctga cgaaatggta cggtggcatg 540 gcgcacgaac tgggccacgg cctgaatctg ccgcacaatc accagaccgc gagcgatggc 600 aagaaatatg gcaccgccct gatgggtagc ggcaactaca cgttcggtac cagcccgacg 660 ttcctgaccc cggcgagctg tgcgctgctg gatgcctgcg aagtgttcag cgttaccccg 720 agccaacagt tttatgaggg taagccagaa gtcgaggttg gtgatgttgc aatttccttc 780 aagggtgatc aaatcttggt cagcggtaac tacaagagcc cgcaaaccgt gaaagctctg 840 aacgtttaca ttcaggatcc gccgtacgcc gtgaaccaag actacgatgc agtgagcttt 900 agccgtcgtc tgggcaaaaa gtccggtaag tttagcatga agattgacaa aaaagaactg 960 gaaggcctga ataacaacga attccgtatt tccttgatgt tcattctggc aaacggctta 1020 cacatgcaga agcactttac gtttcactgg gatgcgctgc aagactaccg tgacggtagc 1080 aaatctggtt cgggtcatca tcaccaccat cactga 1116 <210> 4 <211> 385 <212> PRT <213> Akkermansia muciniphila <400> 4 Met Leu Lys Arg Leu Leu Ser Ala Phe Phe Ser Leu Phe Phe Leu Gly 1 5 10 15 Ala Ala Ser Gly Thr Ser Phe Ala Glu Val Thr Val Pro Asp Ala Leu 20 25 30 Lys Asp Arg Ile Ala Leu Lys Lys Thr Ala Arg Gln Leu Asn Ile Val 35 40 45 Tyr Phe Leu Gly Ser Asp Thr Glu Pro Val Pro Asp Tyr Glu Arg Arg 50 55 60 Leu Ser Glu Leu Leu Leu Tyr Leu Gln Gln Phe Tyr Gly Lys Glu Met 65 70 75 80 Gln Arg His Gly Tyr Gly Ala Arg Ser Phe Gly Leu Asp Ile Lys Ser 85 90 95 Pro Gly Arg Val Asn Ile Ile Glu Tyr Lys Ala Lys Asn Pro Ala Ala 100 105 110 His Tyr Pro Tyr Glu Asn Gly Gly Gly Trp Lys Ala Ala Gln Glu Leu 115 120 125 Asp Glu Phe Phe Lys Ala His Pro Asp Arg Lys Lys Ser Gln His Thr 130 135 140 Leu Ile Ile Met Pro Thr Trp Asn Asp Glu Lys Asn Gly Pro Asp Asn 145 150 155 160 Pro Gly Gly Val Pro Phe Tyr Gly Met Gly Arg Asn Cys Phe Ala Leu 165 170 175 Asp Tyr Pro Ala Phe Asp Ile Lys His Leu Gly Gln Lys Thr Arg Glu 180 185 190 Gly Arg Leu Leu Thr Lys Trp Tyr Gly Gly Met Ala His Glu Leu Gly 195 200 205 His Gly Leu Asn Leu Pro His Asn His Gln Thr Ala Ser Asp Gly Lys 210 215 220 Lys Tyr Gly Thr Ala Leu Met Gly Ser Gly Asn Tyr Thr Phe Gly Thr 225 230 235 240 Ser Pro Thr Phe Leu Thr Pro Ala Ser Cys Ala Leu Leu Asp Ala Cys 245 250 255 Glu Val Phe Ser Val Thr Pro Ser Gln Gln Phe Tyr Glu Gly Lys Pro 260 265 270 Glu Val Glu Val Gly Asp Val Ala Ile Ser Phe Lys Gly Asp Gln Ile 275 280 285 Leu Val Ser Gly Asn Tyr Lys Ser Pro Gln Thr Val Lys Ala Leu Asn 290 295 300 Val Tyr Ile Gln Asp Pro Pro Tyr Ala Val Asn Gln Asp Tyr Asp Ala 305 310 315 320 Val Ser Phe Ser Arg Arg Leu Gly Lys Lys Ser Gly Lys Phe Ser Met 325 330 335 Lys Ile Asp Lys Lys Glu Leu Glu Gly Leu Asn Asn Asn Glu Phe Arg 340 345 350 Ile Ser Leu Met Phe Ile Leu Ala Asn Gly Leu His Met Gln Lys His 355 360 365 Phe Thr Phe His Trp Asp Ala Leu Gln Asp Tyr Arg Asp Gly Ser Lys 370 375 380 Ser 385 <210> 5 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide capable of binding to O-glycans but lacks or has reduced O-glycoprotein-specific endoprotease activity <400> 5 Glu Val Thr Val Pro Asp Ala Leu Lys Asp Arg Ile Ala Leu Lys Lys 1 5 10 15 Thr Ala Arg Gln Leu Asn Ile Val Tyr Phe Leu Gly Ser Asp Thr Glu 20 25 30 Pro Val Pro Asp Tyr Glu Arg Arg Leu Ser Glu Leu Leu Leu Tyr Leu 35 40 45 Gln Gln Phe Tyr Gly Lys Glu Met Gln Arg His Gly Tyr Gly Ala Arg 50 55 60 Ser Phe Gly Leu Asp Ile Lys Ser Pro Gly Arg Val Asn Ile Ile Glu 65 70 75 80 Tyr Lys Ala Lys Asn Pro Ala Ala His Tyr Pro Tyr Glu Asn Gly Gly 85 90 95 Gly Trp Lys Ala Ala Gln Glu Leu Asp Glu Phe Phe Lys Ala His Pro 100 105 110 Asp Arg Lys Lys Ser Gln His Thr Leu Ile Ile Met Pro Thr Trp Asn 115 120 125 Asp Glu Lys Asn Gly Pro Asp Asn Pro Gly Gly Val Pro Phe Tyr Gly 130 135 140 Met Gly Arg Asn Cys Phe Ala Leu Asp Tyr Pro Ala Phe Asp Ile Lys 145 150 155 160 His Leu Gly Gln Lys Thr Arg Glu Gly Arg Leu Leu Thr Lys Trp Tyr 165 170 175 Gly Gly Met Ala His Ala Leu Gly His Gly Leu Asn Leu Pro His Asn 180 185 190 His Gln Thr Ala Ser Asp Gly Lys Lys Tyr Gly Thr Ala Leu Met Gly 195 200 205 Ser Gly Asn Tyr Thr Phe Gly Thr Ser Pro Thr Phe Leu Thr Pro Ala 210 215 220 Ser Cys Ala Leu Leu Asp Ala Cys Glu Val Phe Ser Val Thr Pro Ser 225 230 235 240 Gln Gln Phe Tyr Glu Gly Lys Pro Glu Val Glu Val Gly Asp Val Ala 245 250 255 Ile Ser Phe Lys Gly Asp Gln Ile Leu Val Ser Gly Asn Tyr Lys Ser 260 265 270 Pro Gln Thr Val Lys Ala Leu Asn Val Tyr Ile Gln Asp Pro Pro Tyr 275 280 285 Ala Val Asn Gln Asp Tyr Asp Ala Val Ser Phe Ser Arg Arg Leu Gly 290 295 300 Lys Lys Ser Gly Lys Phe Ser Met Lys Ile Asp Lys Lys Glu Leu Glu 305 310 315 320 Gly Leu Asn Asn Asn Glu Phe Arg Ile Ser Leu Met Phe Ile Leu Ala 325 330 335 Asn Gly Leu His Met Gln Lys His Phe Thr Phe His Trp Asp Ala Leu 340 345 350 Gln Asp Tyr Arg Asp Gly Ser Lys Ser 355 360 <210> 6 <211> 371 <212> PRT <213> Artificial Sequence <220> <223> LS E206A (N-terminal methionine and a C-terminal linker + His6 tag) <400> 6 Met Glu Val Thr Val Pro Asp Ala Leu Lys Asp Arg Ile Ala Leu Lys 1 5 10 15 Lys Thr Ala Arg Gln Leu Asn Ile Val Tyr Phe Leu Gly Ser Asp Thr 20 25 30 Glu Pro Val Pro Asp Tyr Glu Arg Arg Leu Ser Glu Leu Leu Leu Tyr 35 40 45 Leu Gln Gln Phe Tyr Gly Lys Glu Met Gln Arg His Gly Tyr Gly Ala 50 55 60 Arg Ser Phe Gly Leu Asp Ile Lys Ser Pro Gly Arg Val Asn Ile Ile 65 70 75 80 Glu Tyr Lys Ala Lys Asn Pro Ala Ala His Tyr Pro Tyr Glu Asn Gly 85 90 95 Gly Gly Trp Lys Ala Ala Gln Glu Leu Asp Glu Phe Phe Lys Ala His 100 105 110 Pro Asp Arg Lys Lys Ser Gln His Thr Leu Ile Ile Met Pro Thr Trp 115 120 125 Asn Asp Glu Lys Asn Gly Pro Asp Asn Pro Gly Gly Val Pro Phe Tyr 130 135 140 Gly Met Gly Arg Asn Cys Phe Ala Leu Asp Tyr Pro Ala Phe Asp Ile 145 150 155 160 Lys His Leu Gly Gln Lys Thr Arg Glu Gly Arg Leu Leu Thr Lys Trp 165 170 175 Tyr Gly Gly Met Ala His Ala Leu Gly His Gly Leu Asn Leu Pro His 180 185 190 Asn His Gln Thr Ala Ser Asp Gly Lys Lys Tyr Gly Thr Ala Leu Met 195 200 205 Gly Ser Gly Asn Tyr Thr Phe Gly Thr Ser Pro Thr Phe Leu Thr Pro 210 215 220 Ala Ser Cys Ala Leu Leu Asp Ala Cys Glu Val Phe Ser Val Thr Pro 225 230 235 240 Ser Gln Gln Phe Tyr Glu Gly Lys Pro Glu Val Glu Val Gly Asp Val 245 250 255 Ala Ile Ser Phe Lys Gly Asp Gln Ile Leu Val Ser Gly Asn Tyr Lys 260 265 270 Ser Pro Gln Thr Val Lys Ala Leu Asn Val Tyr Ile Gln Asp Pro Pro 275 280 285 Tyr Ala Val Asn Gln Asp Tyr Asp Ala Val Ser Phe Ser Arg Arg Leu 290 295 300 Gly Lys Lys Ser Gly Lys Phe Ser Met Lys Ile Asp Lys Lys Glu Leu 305 310 315 320 Glu Gly Leu Asn Asn Asn Glu Phe Arg Ile Ser Leu Met Phe Ile Leu 325 330 335 Ala Asn Gly Leu His Met Gln Lys His Phe Thr Phe His Trp Asp Ala 340 345 350 Leu Gln Asp Tyr Arg Asp Gly Ser Lys Ser Gly Ser Gly His His His 355 360 365 His His His 370 <210> 7 <211> 1116 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence encoding LS E206A <400> 7 atggaagtca ctgtgccgga cgccctgaaa gatcgcatcg cgctgaagaa aaccgctcgt 60 cagctgaata tcgtctactt cctgggttct gataccgaac cggttccgga ctacgagcgc 120 cgtctgagcg agctgctgtt gtatctgcag caattctatg gtaaagaaat gcagcgccat 180 ggctatggcg cacgcagctt tggtctggac attaagtcac cgggtcgtgt gaacattatc 240 gagtacaaag cgaagaaccc ggcagcgcat tacccgtatg agaatggtgg cggctggaaa 300 gctgcacaag aactggacga atttttcaag gcccatccag accgcaagaa aagccagcac 360 accctgatca tcatgcctac ctggaatgat gagaaaaatg gtcctgacaa tccgggtggc 420 gttccgttct atggtatggg tcgtaattgt tttgcgttgg actacccggc gtttgatatc 480 aagcacctgg gtcagaaaac gcgtgagggt cgtctgctga cgaaatggta cggtggcatg 540 gcgcacgcgc tgggccacgg cctgaatctg ccgcacaatc accagaccgc gagcgatggc 600 aagaaatatg gcaccgccct gatgggtagc ggcaactaca cgttcggtac cagcccgacg 660 ttcctgaccc cggcgagctg tgcgctgctg gatgcctgcg aagtgttcag cgttaccccg 720 agccaacagt tttatgaggg taagccagaa gtcgaggttg gtgatgttgc aatttccttc 780 aagggtgatc aaatcttggt cagcggtaac tacaagagcc cgcaaaccgt gaaagctctg 840 aacgtttaca ttcaggatcc gccgtacgcc gtgaaccaag actacgatgc agtgagcttt 900 agccgtcgtc tgggcaaaaa gtccggtaag tttagcatga agattgacaa aaaagaactg 960 gaaggcctga ataacaacga attccgtatt tccttgatgt tcattctggc aaacggctta 1020 cacatgcaga agcactttac gtttcactgg gatgcgctgc aagactaccg tgacggtagc 1080 aaatctggtt cgggtcatca tcaccaccat cactga 1116 <210> 8 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Metalloprotease domain motif <400> 8 Gly Met Ala His Glu Leu Gly His Gly Leu 1 5 10 <210> 9 <211> 595 <212> PRT <213> Akkermansia muciniphila <400> 9 Met Lys Asn Leu Leu Phe Ala Leu Leu Thr Gly Ser Phe Cys Cys Cys 1 5 10 15 Tyr Ala Gln Gln Lys Ala Ala Pro Val Pro Glu Pro Glu Val Val Ala 20 25 30 Thr Pro Pro Ala Asp Ala Gly Arg Gly Leu Ile Arg Val Asp Ser Arg 35 40 45 Glu Ile Arg His Tyr Ser Gly Thr Arg Lys Glu Pro Asp Tyr Leu Val 50 55 60 Ser Arg Asp Asn Gly Lys Thr Trp Glu Met Lys Ala Ala Pro Ala Gly 65 70 75 80 Tyr Pro Pro Asn Tyr Gly Gly Ile Pro Lys Glu Ser Pro Ala Ile Val 85 90 95 Arg Asn Pro Leu Thr Arg Glu Phe Ile Arg Val Gln Pro Ile Gly Gly 100 105 110 Phe Val Phe Leu Ser Arg Gly Gly Leu Asp Gly Lys Trp Leu Ala Val 115 120 125 Thr Asn Asp Gly Lys Leu Glu Glu Asp Trp Lys Asp Pro Glu Lys Arg 130 135 140 Lys Asn Leu Lys Lys Leu Gly Gly Ile Met Arg Thr Pro Val Phe Val 145 150 155 160 Asn Lys Gly Arg Arg Val Ile Val Pro Phe His Asn Met Gly Gly Gly 165 170 175 Thr Lys Phe His Ile Ser Asp Asp Gly Gly Leu Thr Trp His Val Ser 180 185 190 Arg Asn Gly Val Thr Ser Pro Arg His Glu Ala Arg Pro Pro His Gln 195 200 205 Gly Val Arg Trp Phe Asn Asn Ala Val Glu Ala Thr Val Leu Glu Met 210 215 220 Lys Asp Gly Thr Leu Trp Ala Leu Ala Arg Thr Ser Gln Asp Gln Ala 225 230 235 240 Trp Gln Ala Phe Ser Lys Asp Tyr Gly Glu Thr Trp Ser Lys Pro Glu 245 250 255 Pro Ser Arg Phe Phe Gly Thr Leu Thr Met Asn Thr Leu Gly Arg Leu 260 265 270 Asp Asp Gly Thr Ile Val Ser Leu Trp Thr Asn Thr Met Ala Leu Pro 275 280 285 Glu Asn Ala Thr Ala Gly Asn Gly Thr Trp Glu Asp Val Phe Thr Asn 290 295 300 Arg Asp Ser His His Ile Ala Met Ser Gly Asp Glu Gly Lys Thr Trp 305 310 315 320 Tyr Gly Phe Arg Glu Ile Ile Leu Asp Glu His Arg Asn His Pro Gly 325 330 335 Tyr Ala Thr Leu Asp Gly Pro Glu Asp Arg Gly Lys His Gln Ser Glu 340 345 350 Met Val Gln Leu Asp Lys Asn Arg Ile Leu Ile Ser Leu Gly Gln His 355 360 365 Lys Asn His Arg Arg Leu Val Ile Val Asp Arg Arg Trp Val Gly Ala 370 375 380 Lys Thr Arg Ala Thr Gln Thr Gly Lys Asp Leu Asp Ser Gln Trp Thr 385 390 395 400 Ile His Thr Tyr Ile Pro Gln Lys Lys Gly His Cys Ser Tyr Asn Arg 405 410 415 Lys Pro Ser Ala Glu Leu Val Gln Asp Pro Ser Gly Gly Thr Lys Lys 420 425 430 Val Leu Gln Ile Lys Arg Leu Asp Asp Pro Glu Leu Val Asn Glu Lys 435 440 445 Ser Asn Val Asp Tyr Arg Asn Gly Gly Ala Thr Trp Asn Phe Pro Asn 450 455 460 Gly Thr Thr Gly Leu Val Lys Phe Arg Phe Arg Val Val Asp Gly Glu 465 470 475 480 Gln Ala Asp Asp Ser Gly Leu Gln Val Ser Leu Thr Asp Arg Leu Phe 485 490 495 Asn Ala Cys Asp Ser Thr Thr Lys Asp Tyr Ala Leu Phe Thr Phe Pro 500 505 510 Ile Arg Leu Lys Pro Ala Pro His Leu Leu Leu Gly Met Lys Lys Val 515 520 525 Pro Phe Thr Pro Gly Ala Trp His Glu Ile Ser Leu Leu Trp Gln Gly 530 535 540 Gly Gln Ala Val Val Ser Leu Asp Gly Lys Lys Ala Gly Thr Leu Lys 545 550 555 560 Met Ala Asn Lys Ser Pro Asn Gly Ala Ser Tyr Ile His Phe Ile Ser 565 570 575 Thr Gly Ser Gln Pro Asp Ala Gly Ile Leu Leu Asp Thr Val Asn Ala 580 585 590 Arg Val Lys 595 <210> 10 <211> 577 <212> PRT <213> Akkermansia muciniphila <400> 10 Gln Gln Lys Ala Ala Pro Val Pro Glu Pro Glu Val Val Ala Thr Pro 1 5 10 15 Pro Ala Asp Ala Gly Arg Gly Leu Ile Arg Val Asp Ser Arg Glu Ile 20 25 30 Arg His Tyr Ser Gly Thr Arg Lys Glu Pro Asp Tyr Leu Val Ser Arg 35 40 45 Asp Asn Gly Lys Thr Trp Glu Met Lys Ala Ala Pro Ala Gly Tyr Pro 50 55 60 Pro Asn Tyr Gly Gly Ile Pro Lys Glu Ser Pro Ala Ile Val Arg Asn 65 70 75 80 Pro Leu Thr Arg Glu Phe Ile Arg Val Gln Pro Ile Gly Gly Phe Val 85 90 95 Phe Leu Ser Arg Gly Gly Leu Asp Gly Lys Trp Leu Ala Val Thr Asn 100 105 110 Asp Gly Lys Leu Glu Glu Asp Trp Lys Asp Pro Glu Lys Arg Lys Asn 115 120 125 Leu Lys Lys Leu Gly Gly Ile Met Arg Thr Pro Val Phe Val Asn Lys 130 135 140 Gly Arg Arg Val Ile Val Pro Phe His Asn Met Gly Gly Gly Thr Lys 145 150 155 160 Phe His Ile Ser Asp Asp Gly Gly Leu Thr Trp His Val Ser Arg Asn 165 170 175 Gly Val Thr Ser Pro Arg His Glu Ala Arg Pro Pro His Gln Gly Val 180 185 190 Arg Trp Phe Asn Asn Ala Val Glu Ala Thr Val Leu Glu Met Lys Asp 195 200 205 Gly Thr Leu Trp Ala Leu Ala Arg Thr Ser Gln Asp Gln Ala Trp Gln 210 215 220 Ala Phe Ser Lys Asp Tyr Gly Glu Thr Trp Ser Lys Pro Glu Pro Ser 225 230 235 240 Arg Phe Phe Gly Thr Leu Thr Met Asn Thr Leu Gly Arg Leu Asp Asp 245 250 255 Gly Thr Ile Val Ser Leu Trp Thr Asn Thr Met Ala Leu Pro Glu Asn 260 265 270 Ala Thr Ala Gly Asn Gly Thr Trp Glu Asp Val Phe Thr Asn Arg Asp 275 280 285 Ser His His Ile Ala Met Ser Gly Asp Glu Gly Lys Thr Trp Tyr Gly 290 295 300 Phe Arg Glu Ile Ile Leu Asp Glu His Arg Asn His Pro Gly Tyr Ala 305 310 315 320 Thr Leu Asp Gly Pro Glu Asp Arg Gly Lys His Gln Ser Glu Met Val 325 330 335 Gln Leu Asp Lys Asn Arg Ile Leu Ile Ser Leu Gly Gln His Lys Asn 340 345 350 His Arg Arg Leu Val Ile Val Asp Arg Arg Trp Val Gly Ala Lys Thr 355 360 365 Arg Ala Thr Gln Thr Gly Lys Asp Leu Asp Ser Gln Trp Thr Ile His 370 375 380 Thr Tyr Ile Pro Gln Lys Lys Gly His Cys Ser Tyr Asn Arg Lys Pro 385 390 395 400 Ser Ala Glu Leu Val Gln Asp Pro Ser Gly Gly Thr Lys Lys Val Leu 405 410 415 Gln Ile Lys Arg Leu Asp Asp Pro Glu Leu Val Asn Glu Lys Ser Asn 420 425 430 Val Asp Tyr Arg Asn Gly Gly Ala Thr Trp Asn Phe Pro Asn Gly Thr 435 440 445 Thr Gly Leu Val Lys Phe Arg Phe Arg Val Val Asp Gly Glu Gln Ala 450 455 460 Asp Asp Ser Gly Leu Gln Val Ser Leu Thr Asp Arg Leu Phe Asn Ala 465 470 475 480 Cys Asp Ser Thr Thr Lys Asp Tyr Ala Leu Phe Thr Phe Pro Ile Arg 485 490 495 Leu Lys Pro Ala Pro His Leu Leu Leu Gly Met Lys Lys Val Pro Phe 500 505 510 Thr Pro Gly Ala Trp His Glu Ile Ser Leu Leu Trp Gln Gly Gly Gln 515 520 525 Ala Val Val Ser Leu Asp Gly Lys Lys Ala Gly Thr Leu Lys Met Ala 530 535 540 Asn Lys Ser Pro Asn Gly Ala Ser Tyr Ile His Phe Ile Ser Thr Gly 545 550 555 560 Ser Gln Pro Asp Ala Gly Ile Leu Leu Asp Thr Val Asn Ala Arg Val 565 570 575 Lys <210> 11 <211> 589 <212> PRT <213> Artificial Sequence <220> <223> Am1757 (N-terminal methionine and a C-terminal linker + His6 tag) <400> 11 Met Gln Gln Lys Ala Ala Pro Val Pro Glu Pro Glu Val Val Ala Thr 1 5 10 15 Pro Pro Ala Asp Ala Gly Arg Gly Leu Ile Arg Val Asp Ser Arg Glu 20 25 30 Ile Arg His Tyr Ser Gly Thr Arg Lys Glu Pro Asp Tyr Leu Val Ser 35 40 45 Arg Asp Asn Gly Lys Thr Trp Glu Met Lys Ala Ala Pro Ala Gly Tyr 50 55 60 Pro Pro Asn Tyr Gly Gly Ile Pro Lys Glu Ser Pro Ala Ile Val Arg 65 70 75 80 Asn Pro Leu Thr Arg Glu Phe Ile Arg Val Gln Pro Ile Gly Gly Phe 85 90 95 Val Phe Leu Ser Arg Gly Gly Leu Asp Gly Lys Trp Leu Ala Val Thr 100 105 110 Asn Asp Gly Lys Leu Glu Glu Asp Trp Lys Asp Pro Glu Lys Arg Lys 115 120 125 Asn Leu Lys Lys Leu Gly Gly Ile Met Arg Thr Pro Val Phe Val Asn 130 135 140 Lys Gly Arg Arg Val Ile Val Pro Phe His Asn Met Gly Gly Gly Thr 145 150 155 160 Lys Phe His Ile Ser Asp Asp Gly Gly Leu Thr Trp His Val Ser Arg 165 170 175 Asn Gly Val Thr Ser Pro Arg His Glu Ala Arg Pro Pro His Gln Gly 180 185 190 Val Arg Trp Phe Asn Asn Ala Val Glu Ala Thr Val Leu Glu Met Lys 195 200 205 Asp Gly Thr Leu Trp Ala Leu Ala Arg Thr Ser Gln Asp Gln Ala Trp 210 215 220 Gln Ala Phe Ser Lys Asp Tyr Gly Glu Thr Trp Ser Lys Pro Glu Pro 225 230 235 240 Ser Arg Phe Phe Gly Thr Leu Thr Met Asn Thr Leu Gly Arg Leu Asp 245 250 255 Asp Gly Thr Ile Val Ser Leu Trp Thr Asn Thr Met Ala Leu Pro Glu 260 265 270 Asn Ala Thr Ala Gly Asn Gly Thr Trp Glu Asp Val Phe Thr Asn Arg 275 280 285 Asp Ser His His Ile Ala Met Ser Gly Asp Glu Gly Lys Thr Trp Tyr 290 295 300 Gly Phe Arg Glu Ile Ile Leu Asp Glu His Arg Asn His Pro Gly Tyr 305 310 315 320 Ala Thr Leu Asp Gly Pro Glu Asp Arg Gly Lys His Gln Ser Glu Met 325 330 335 Val Gln Leu Asp Lys Asn Arg Ile Leu Ile Ser Leu Gly Gln His Lys 340 345 350 Asn His Arg Arg Leu Val Ile Val Asp Arg Arg Trp Val Gly Ala Lys 355 360 365 Thr Arg Ala Thr Gln Thr Gly Lys Asp Leu Asp Ser Gln Trp Thr Ile 370 375 380 His Thr Tyr Ile Pro Gln Lys Lys Gly His Cys Ser Tyr Asn Arg Lys 385 390 395 400 Pro Ser Ala Glu Leu Val Gln Asp Pro Ser Gly Gly Thr Lys Lys Val 405 410 415 Leu Gln Ile Lys Arg Leu Asp Asp Pro Glu Leu Val Asn Glu Lys Ser 420 425 430 Asn Val Asp Tyr Arg Asn Gly Gly Ala Thr Trp Asn Phe Pro Asn Gly 435 440 445 Thr Thr Gly Leu Val Lys Phe Arg Phe Arg Val Val Asp Gly Glu Gln 450 455 460 Ala Asp Asp Ser Gly Leu Gln Val Ser Leu Thr Asp Arg Leu Phe Asn 465 470 475 480 Ala Cys Asp Ser Thr Thr Lys Asp Tyr Ala Leu Phe Thr Phe Pro Ile 485 490 495 Arg Leu Lys Pro Ala Pro His Leu Leu Leu Gly Met Lys Lys Val Pro 500 505 510 Phe Thr Pro Gly Ala Trp His Glu Ile Ser Leu Leu Trp Gln Gly Gly 515 520 525 Gln Ala Val Val Ser Leu Asp Gly Lys Lys Ala Gly Thr Leu Lys Met 530 535 540 Ala Asn Lys Ser Pro Asn Gly Ala Ser Tyr Ile His Phe Ile Ser Thr 545 550 555 560 Gly Ser Gln Pro Asp Ala Gly Ile Leu Leu Asp Thr Val Asn Ala Arg 565 570 575 Val Lys Gly Ser Gly Leu Glu His His His His His His 580 585 <210> 12 <211> 419 <212> PRT <213> Akkermansia muciniphila <400> 12 Met Thr Trp Leu Leu Cys Gly Arg Gly Lys Trp Asn Lys Val Lys Arg 1 5 10 15 Met Met Asn Ser Val Phe Lys Cys Leu Met Ser Ala Val Cys Ala Val 20 25 30 Ala Leu Pro Ala Phe Gly Gln Glu Glu Lys Thr Gly Phe Pro Thr Asp 35 40 45 Arg Ala Val Thr Val Phe Ser Ala Gly Glu Gly Asn Pro Tyr Ala Ser 50 55 60 Ile Arg Ile Pro Ala Leu Leu Ser Ile Gly Lys Gly Gln Leu Leu Ala 65 70 75 80 Phe Ala Glu Gly Arg Tyr Lys Asn Thr Asp Gln Gly Glu Asn Asp Ile 85 90 95 Ile Met Ser Val Ser Lys Asn Gly Gly Lys Thr Trp Ser Arg Pro Arg 100 105 110 Ala Ile Ala Lys Ala His Gly Ala Thr Phe Asn Asn Pro Cys Pro Val 115 120 125 Tyr Asp Ala Lys Thr Arg Thr Val Thr Val Val Phe Gln Arg Tyr Pro 130 135 140 Ala Gly Val Lys Glu Arg Gln Pro Asn Ile Pro Asp Gly Trp Asp Asp 145 150 155 160 Glu Lys Cys Ile Arg Asn Phe Met Ile Gln Ser Arg Asn Gly Gly Ser 165 170 175 Ser Trp Thr Lys Pro Gln Glu Ile Thr Lys Thr Thr Lys Arg Pro Ser 180 185 190 Gly Val Asp Ile Met Ala Ser Gly Pro Asn Ala Gly Thr Gln Leu Lys 195 200 205 Ser Gly Ala His Lys Gly Arg Leu Val Ile Pro Met Asn Glu Gly Pro 210 215 220 Phe Gly Lys Trp Val Ile Ser Cys Ile Tyr Ser Asp Asp Gly Gly Lys 225 230 235 240 Ser Trp Lys Leu Gly Gln Pro Thr Ala Asn Met Lys Gly Met Val Asn 245 250 255 Glu Thr Ser Ile Ala Glu Thr Asp Asn Gly Gly Val Val Met Val Ala 260 265 270 Arg His Trp Gly Ala Gly Asn Cys Arg Arg Ile Ala Trp Ser Gln Asp 275 280 285 Gly Gly Glu Thr Trp Gly Gln Val Glu Asp Ala Pro Glu Leu Phe Cys 290 295 300 Asp Ser Thr Gln Asn Ser Leu Met Thr Tyr Ser Leu Ser Asp Gln Pro 305 310 315 320 Ala Tyr Gly Gly Lys Ser Arg Ile Leu Phe Ser Gly Pro Ser Ala Gly 325 330 335 Arg Arg Ile Lys Gly Gln Val Ala Met Ser Tyr Asp Asn Gly Lys Thr 340 345 350 Trp Pro Val Lys Lys Leu Leu Gly Glu Gly Gly Phe Ala Tyr Ser Ser 355 360 365 Leu Ala Met Val Glu Pro Gly Ile Val Gly Val Leu Tyr Glu Glu Asn 370 375 380 Gln Glu His Ile Lys Lys Leu Lys Phe Val Pro Ile Thr Met Glu Trp 385 390 395 400 Leu Thr Asp Gly Glu Asp Thr Gly Leu Ala Pro Gly Lys Lys Ala Pro 405 410 415 Val Leu Lys <210> 13 <211> 381 <212> PRT <213> Akkermansia muciniphila <400> 13 Gln Glu Glu Lys Thr Gly Phe Pro Thr Asp Arg Ala Val Thr Val Phe 1 5 10 15 Ser Ala Gly Glu Gly Asn Pro Tyr Ala Ser Ile Arg Ile Pro Ala Leu 20 25 30 Leu Ser Ile Gly Lys Gly Gln Leu Leu Ala Phe Ala Glu Gly Arg Tyr 35 40 45 Lys Asn Thr Asp Gln Gly Glu Asn Asp Ile Ile Met Ser Val Ser Lys 50 55 60 Asn Gly Gly Lys Thr Trp Ser Arg Pro Arg Ala Ile Ala Lys Ala His 65 70 75 80 Gly Ala Thr Phe Asn Asn Pro Cys Pro Val Tyr Asp Ala Lys Thr Arg 85 90 95 Thr Val Thr Val Val Phe Gln Arg Tyr Pro Ala Gly Val Lys Glu Arg 100 105 110 Gln Pro Asn Ile Pro Asp Gly Trp Asp Asp Glu Lys Cys Ile Arg Asn 115 120 125 Phe Met Ile Gln Ser Arg Asn Gly Gly Ser Ser Trp Thr Lys Pro Gln 130 135 140 Glu Ile Thr Lys Thr Thr Lys Arg Pro Ser Gly Val Asp Ile Met Ala 145 150 155 160 Ser Gly Pro Asn Ala Gly Thr Gln Leu Lys Ser Gly Ala His Lys Gly 165 170 175 Arg Leu Val Ile Pro Met Asn Glu Gly Pro Phe Gly Lys Trp Val Ile 180 185 190 Ser Cys Ile Tyr Ser Asp Asp Gly Gly Lys Ser Trp Lys Leu Gly Gln 195 200 205 Pro Thr Ala Asn Met Lys Gly Met Val Asn Glu Thr Ser Ile Ala Glu 210 215 220 Thr Asp Asn Gly Gly Val Val Met Val Ala Arg His Trp Gly Ala Gly 225 230 235 240 Asn Cys Arg Arg Ile Ala Trp Ser Gln Asp Gly Gly Glu Thr Trp Gly 245 250 255 Gln Val Glu Asp Ala Pro Glu Leu Phe Cys Asp Ser Thr Gln Asn Ser 260 265 270 Leu Met Thr Tyr Ser Leu Ser Asp Gln Pro Ala Tyr Gly Gly Lys Ser 275 280 285 Arg Ile Leu Phe Ser Gly Pro Ser Ala Gly Arg Arg Ile Lys Gly Gln 290 295 300 Val Ala Met Ser Tyr Asp Asn Gly Lys Thr Trp Pro Val Lys Lys Leu 305 310 315 320 Leu Gly Glu Gly Gly Phe Ala Tyr Ser Ser Leu Ala Met Val Glu Pro 325 330 335 Gly Ile Val Gly Val Leu Tyr Glu Glu Asn Gln Glu His Ile Lys Lys 340 345 350 Leu Lys Phe Val Pro Ile Thr Met Glu Trp Leu Thr Asp Gly Glu Asp 355 360 365 Thr Gly Leu Ala Pro Gly Lys Lys Ala Pro Val Leu Lys 370 375 380 <210> 14 <211> 393 <212> PRT <213> Artificial Sequence <220> <223> Am0707 (including N-terminal methionine and a C-terminal linker + His6 tag) <400> 14 Met Gln Glu Glu Lys Thr Gly Phe Pro Thr Asp Arg Ala Val Thr Val 1 5 10 15 Phe Ser Ala Gly Glu Gly Asn Pro Tyr Ala Ser Ile Arg Ile Pro Ala 20 25 30 Leu Leu Ser Ile Gly Lys Gly Gln Leu Leu Ala Phe Ala Glu Gly Arg 35 40 45 Tyr Lys Asn Thr Asp Gln Gly Glu Asn Asp Ile Ile Met Ser Val Ser 50 55 60 Lys Asn Gly Gly Lys Thr Trp Ser Arg Pro Arg Ala Ile Ala Lys Ala 65 70 75 80 His Gly Ala Thr Phe Asn Asn Pro Cys Pro Val Tyr Asp Ala Lys Thr 85 90 95 Arg Thr Val Thr Val Val Phe Gln Arg Tyr Pro Ala Gly Val Lys Glu 100 105 110 Arg Gln Pro Asn Ile Pro Asp Gly Trp Asp Asp Glu Lys Cys Ile Arg 115 120 125 Asn Phe Met Ile Gln Ser Arg Asn Gly Gly Ser Ser Trp Thr Lys Pro 130 135 140 Gln Glu Ile Thr Lys Thr Thr Lys Arg Pro Ser Gly Val Asp Ile Met 145 150 155 160 Ala Ser Gly Pro Asn Ala Gly Thr Gln Leu Lys Ser Gly Ala His Lys 165 170 175 Gly Arg Leu Val Ile Pro Met Asn Glu Gly Pro Phe Gly Lys Trp Val 180 185 190 Ile Ser Cys Ile Tyr Ser Asp Asp Gly Gly Lys Ser Trp Lys Leu Gly 195 200 205 Gln Pro Thr Ala Asn Met Lys Gly Met Val Asn Glu Thr Ser Ile Ala 210 215 220 Glu Thr Asp Asn Gly Gly Val Val Met Val Ala Arg His Trp Gly Ala 225 230 235 240 Gly Asn Cys Arg Arg Ile Ala Trp Ser Gln Asp Gly Gly Glu Thr Trp 245 250 255 Gly Gln Val Glu Asp Ala Pro Glu Leu Phe Cys Asp Ser Thr Gln Asn 260 265 270 Ser Leu Met Thr Tyr Ser Leu Ser Asp Gln Pro Ala Tyr Gly Gly Lys 275 280 285 Ser Arg Ile Leu Phe Ser Gly Pro Ser Ala Gly Arg Arg Ile Lys Gly 290 295 300 Gln Val Ala Met Ser Tyr Asp Asn Gly Lys Thr Trp Pro Val Lys Lys 305 310 315 320 Leu Leu Gly Glu Gly Gly Phe Ala Tyr Ser Ser Leu Ala Met Val Glu 325 330 335 Pro Gly Ile Val Gly Val Leu Tyr Glu Glu Asn Gln Glu His Ile Lys 340 345 350 Lys Leu Lys Phe Val Pro Ile Thr Met Glu Trp Leu Thr Asp Gly Glu 355 360 365 Asp Thr Gly Leu Ala Pro Gly Lys Lys Ala Pro Val Leu Lys Gly Ser 370 375 380 Gly Leu Glu His His His His His His 385 390 <210> 15 <211> 2133 <212> PRT <213> Streptococcus oralis <400> 15 Met Asp Lys Arg Phe Phe Glu Lys Arg Cys Lys Phe Ser Ile Arg Lys 1 5 10 15 Phe Thr Leu Gly Val Ala Ser Val Met Ile Gly Ala Thr Phe Phe Ala 20 25 30 Ala Ser Pro Val Leu Ala Asp Gln Ala Arg Val Gly Ser Thr Asp Asn 35 40 45 Leu Pro Ser Glu Leu Ala Asp Leu Asp Lys Lys Ala Ser Asp Glu Gly 50 55 60 His Asp Phe Asp Lys Glu Ala Ala Ala Gln Asn Pro Gly Ser Ala Glu 65 70 75 80 Thr Thr Glu Gly Pro Gln Thr Glu Glu Glu Leu Leu Ala Gln Glu Lys 85 90 95 Glu Lys Ser Glu Lys Pro Ser Asn Leu Pro Lys Glu Leu Glu Asp Lys 100 105 110 Leu Glu Lys Ala Glu Asp Asn Gly Arg Glu Val Asp Lys Asp Gln Leu 115 120 125 Ala Gln Asp Thr Gly Lys Leu Val Pro Glu Asp Val Ala Lys Thr Thr 130 135 140 Asn Gly Glu Leu Asn Tyr Gly Ala Thr Val Lys Ile Lys Thr Pro Ser 145 150 155 160 Gly Glu Gly Ser Gly Ile Val Val Ala Lys Asp Leu Val Leu Thr Val 165 170 175 Ser His Asn Phe Ile Lys Asp Ser Gln Glu Gly Asn Ile Arg Lys Val 180 185 190 Val Asp Asn Asp Gln Gly Asp Gly Asp Ile Tyr Ser Ile Ser Tyr Pro 195 200 205 Gly Leu Pro Asp Val Lys Phe Ser Lys Lys Asp Ile Ile His Trp Asp 210 215 220 Arg Glu Gly Tyr Leu Lys Gly Phe Lys Asn Asp Leu Ala Leu Val Arg 225 230 235 240 Leu Arg Thr Val Leu Glu Asn Thr Pro Val Glu Val Thr Lys Lys Pro 245 250 255 Val Val Lys Lys Ile Gly Asp Lys Leu His Val Phe Gly Tyr Pro Glu 260 265 270 Gly Lys Leu Asn Pro Ile Val Asn Thr Thr Val Asp Phe Ala Glu Pro 275 280 285 Tyr Gly Glu Gly Val Gln Gly Ile Gly Tyr Gln Gly Gly Lys Pro Gly 290 295 300 Ala Ser Gly Gly Gly Ile Phe Asp Thr Glu Gly Lys Leu Val Gly Val 305 310 315 320 His Gln Asn Gly Val Val Gly Lys Arg Ser Gly Gly Ile Leu Phe Ser 325 330 335 Pro Ala Gln Leu Lys Trp Ile Gln Asp His Met Gln Gly Ile Ser Ser 340 345 350 Val Lys Pro Ala Asp Leu Glu Glu Lys Glu Lys Pro Ala Glu Glu Lys 355 360 365 Pro Lys Glu Asp Lys Pro Ala Ala Ala Lys Pro Glu Thr Pro Lys Ala 370 375 380 Val Thr Pro Glu Trp Gln Thr Val Ala Asn Lys Glu Gln Gln Gly Thr 385 390 395 400 Val Thr Ile Arg Glu Glu Lys Gly Val Arg Tyr Asn Gln Leu Ser Ser 405 410 415 Thr Ala Gln Asn Asp Asn Asp Gly Lys Pro Ala Leu Phe Glu Lys Gln 420 425 430 Gly Leu Thr Val Asp Ala Asn Gly Asn Ala Thr Val Asp Leu Thr Phe 435 440 445 Lys Asp Asp Ser Glu Lys Gly Lys Ser Arg Phe Gly Val Phe Leu Lys 450 455 460 Phe Lys Asp Thr Lys Asn Asn Val Phe Val Gly Tyr Asp Gln Gly Gly 465 470 475 480 Trp Phe Trp Glu Tyr Lys Thr Pro Gly Asn Ser Thr Trp Tyr Lys Gly 485 490 495 Asn Arg Val Ala Ala Pro Glu Pro Gly Ser Val Asn Arg Leu Ser Ile 500 505 510 Thr Leu Lys Ser Asp Gly Gln Leu Asn Ala Ser Asn Asn Asp Val Asn 515 520 525 Leu Phe Asp Thr Val Thr Leu Pro Gly Ala Val Asn Glu Asn Leu Lys 530 535 540 Asn Glu Lys Lys Ile Leu Leu Lys Ala Gly Thr Tyr Ser Asn Asp Arg 545 550 555 560 Thr Val Val Ser Val Lys Thr Asp Asn Gln Glu Gly Val Lys Ala Asp 565 570 575 Asp Thr Pro Ala Gln Lys Glu Thr Gly Pro Ala Val Asp Asp Ser Lys 580 585 590 Val Thr Tyr Asp Thr Ile Gln Ser Lys Val Leu Lys Ala Val Ile Asp 595 600 605 Gln Ala Phe Pro Arg Val Lys Glu Tyr Thr Leu Asn Gly His Thr Leu 610 615 620 Pro Gly Gln Val Gln Gln Phe Asn Gln Val Phe Ile Asn Asn His Arg 625 630 635 640 Ile Thr Pro Glu Val Thr Tyr Lys Lys Ile Asn Glu Thr Thr Ala Glu 645 650 655 Tyr Leu Met Lys Leu Arg Asp Asp Ala His Leu Ile Asn Ala Glu Met 660 665 670 Thr Val Arg Leu Gln Val Val Asp Asn Gln Leu His Phe Asp Val Thr 675 680 685 Lys Ile Val Asn His Asn Gln Val Thr Pro Gly Gln Lys Ile Asp Asp 690 695 700 Glu Arg Lys Leu Leu Ser Thr Ile Ser Phe Leu Gly Asn Ala Leu Val 705 710 715 720 Ser Val Ser Ser Asp Gln Ala Gly Ala Lys Phe Asp Gly Ala Thr Met 725 730 735 Ser Asn Asn Thr His Val Ser Gly Asp Asp His Ile Asp Val Thr Asn 740 745 750 Pro Met Lys Asp Leu Ala Lys Gly Tyr Met Tyr Gly Phe Val Ser Thr 755 760 765 Asp Lys Leu Ala Ala Gly Val Trp Ser Asn Ser Gln Asn Ser Tyr Gly 770 775 780 Gly Gly Ser Asn Asp Trp Thr Arg Leu Thr Ala Tyr Lys Glu Thr Val 785 790 795 800 Gly Asn Ala Asn Tyr Val Gly Ile His Ser Ser Glu Trp Gln Trp Glu 805 810 815 Lys Ala Tyr Lys Gly Ile Val Phe Pro Glu Tyr Thr Lys Glu Leu Pro 820 825 830 Ser Ala Lys Val Val Ile Thr Glu Asp Ala Asn Ala Asp Asn Lys Val 835 840 845 Asp Trp Gln Asp Gly Ala Ile Ala Tyr Arg Ser Ile Met Asn Asn Pro 850 855 860 Gln Gly Trp Glu Lys Val Lys Asp Ile Thr Ala Tyr Arg Ile Ala Met 865 870 875 880 Asn Phe Gly Ser Gln Ala Gln Asn Pro Phe Leu Met Thr Leu Asp Gly 885 890 895 Ile Lys Lys Ile Asn Leu His Thr Asp Gly Leu Gly Gln Gly Val Leu 900 905 910 Leu Lys Gly Tyr Gly Ser Glu Gly His Asp Ser Gly His Leu Asn Tyr 915 920 925 Ala Asp Ile Gly Lys Arg Ile Gly Gly Val Glu Asp Phe Lys Thr Leu 930 935 940 Ile Glu Lys Ala Lys Lys Tyr Gly Ala His Leu Gly Ile His Val Asn 945 950 955 960 Ala Ser Glu Thr Tyr Pro Glu Ser Lys Tyr Phe Asn Glu Asn Ile Leu 965 970 975 Arg Lys Asn Pro Asp Gly Ser Tyr Ser Tyr Gly Trp Asn Trp Leu Asp 980 985 990 Gln Gly Ile Asn Ile Asp Ala Ala Tyr Asp Leu Ala His Gly Arg Leu 995 1000 1005 Ala Arg Trp Glu Asp Leu Lys Lys Lys Leu Gly Glu Gly Leu Asp 1010 1015 1020 Phe Ile Tyr Val Asp Val Trp Gly Asn Gly Gln Ser Gly Asp Asn 1025 1030 1035 Gly Ala Trp Ala Thr His Val Leu Ala Lys Glu Ile Asn Lys Gln 1040 1045 1050 Gly Trp Arg Phe Ala Ile Glu Trp Gly His Gly Gly Glu Tyr Asp 1055 1060 1065 Ser Thr Phe Gln His Trp Ala Ala Asp Leu Thr Tyr Gly Gly Tyr 1070 1075 1080 Thr Asn Lys Gly Ile Asn Ser Ala Ile Thr Arg Phe Ile Arg Asn 1085 1090 1095 His Gln Lys Asp Ser Trp Val Gly Asp Tyr Arg Ser Tyr Gly Gly 1100 1105 1110 Ala Ala Asn Tyr Pro Leu Leu Gly Gly Tyr Ser Met Lys Asp Phe 1115 1120 1125 Glu Gly Trp Gln Gly Arg Ser Asp Tyr Asn Gly Tyr Val Thr Asn 1130 1135 1140 Leu Phe Ala His Asp Val Met Thr Lys Tyr Phe Gln His Phe Thr 1145 1150 1155 Val Ser Lys Trp Glu Asn Gly Thr Pro Val Thr Met Thr Asp Asn 1160 1165 1170 Gly Ser Thr Tyr Lys Trp Thr Pro Glu Met Lys Val Glu Leu Val 1175 1180 1185 Asp Ala Ala Gly Asn Lys Val Val Val Thr Arg Lys Ser Asn Asp 1190 1195 1200 Val Asn Ser Pro Gln Tyr Arg Glu Arg Thr Val Thr Leu Asn Gly 1205 1210 1215 Arg Val Ile Gln Asp Gly Ser Ala Tyr Leu Thr Pro Trp Asn Trp 1220 1225 1230 Asp Ala Asn Gly Lys Lys Leu Pro Thr Glu Lys Glu Lys Met Tyr 1235 1240 1245 Tyr Phe Asn Thr Gln Ala Gly Ala Thr Thr Trp Thr Leu Pro Ser 1250 1255 1260 Asp Trp Ala Asn Ser Lys Val Tyr Leu Tyr Lys Leu Thr Asp Gln 1265 1270 1275 Gly Lys Thr Glu Glu Gln Glu Leu Thr Val Thr Asp Gly Lys Ile 1280 1285 1290 Thr Leu Asp Leu Leu Ala Asn Gln Pro Tyr Val Leu Tyr Arg Ser 1295 1300 1305 Lys Gln Thr Asn Pro Glu Met Ser Trp Ser Glu Gly Met His Ile 1310 1315 1320 Tyr Asp Gln Gly Phe Asn Ser Gly Thr Leu Lys His Trp Thr Ile 1325 1330 1335 Ser Gly Asp Ala Ser Lys Ala Glu Ile Val Lys Ser Gln Gly Ala 1340 1345 1350 Asn Glu Met Leu Arg Ile Gln Gly Asn Lys Ser Lys Val Ser Leu 1355 1360 1365 Thr Gln Lys Leu Thr Gly Leu Lys Pro Asn Thr Lys Tyr Ala Val 1370 1375 1380 Tyr Val Gly Val Asp Asn Arg Ser Asn Ala Lys Ala Ser Ile Thr 1385 1390 1395 Val Asn Thr Gly Glu Lys Glu Val Thr Thr Tyr Thr Asn Lys Ser 1400 1405 1410 Leu Ala Leu Asn Tyr Ile Lys Ala Tyr Ala His Asn Asn Arg Arg 1415 1420 1425 Glu Asn Ala Thr Val Asp Asp Thr Ser Tyr Phe Gln Asn Met Tyr 1430 1435 1440 Ala Phe Phe Thr Thr Gly Ser Asp Val Ser Asn Val Thr Leu Thr 1445 1450 1455 Leu Ser Arg Glu Ala Gly Asp Glu Ala Thr Tyr Phe Asp Glu Ile 1460 1465 1470 Arg Thr Phe Glu Asn Asn Ser Ser Met Tyr Gly Asp Lys His Asp 1475 1480 1485 Thr Gly Gln Gly Thr Phe Lys Gln Asp Phe Glu Asn Val Ala Gln 1490 1495 1500 Gly Ile Phe Pro Phe Val Val Gly Gly Val Glu Gly Val Glu Asp 1505 1510 1515 Asn Arg Thr His Leu Ser Glu Lys His Asp Pro Tyr Thr Gln Arg 1520 1525 1530 Gly Trp Asn Gly Lys Lys Val Asp Asp Val Ile Glu Gly Asn Trp 1535 1540 1545 Ser Leu Lys Thr Asn Gly Leu Val Ser Arg Arg Asn Leu Val Tyr 1550 1555 1560 Gln Thr Ile Pro Gln Asn Phe Arg Phe Glu Ala Gly Lys Thr Tyr 1565 1570 1575 Arg Val Thr Phe Glu Tyr Glu Ala Gly Ser Asp Asn Thr Tyr Ala 1580 1585 1590 Phe Val Val Gly Lys Gly Glu Phe Gln Ser Gly Arg Arg Gly Thr 1595 1600 1605 Gln Ala Ser Asn Leu Glu Met His Glu Leu Pro Asn Thr Trp Thr 1610 1615 1620 Asp Ser Lys Lys Ala Lys Lys Val Thr Phe Leu Val Thr Gly Ala 1625 1630 1635 Glu Thr Gly Asp Thr Trp Val Gly Ile Tyr Ser Thr Gly Asn Ala 1640 1645 1650 Ser Asn Thr Arg Gly Asp Ala Gly Gly Asn Ala Asn Phe Arg Gly 1655 1660 1665 Tyr Asn Asp Phe Met Met Asp Asn Leu Gln Ile Glu Glu Ile Thr 1670 1675 1680 Leu Thr Gly Lys Met Leu Thr Glu Asn Ala Leu Lys Asn Tyr Leu 1685 1690 1695 Pro Thr Val Ala Met Thr Asn Tyr Thr Lys Glu Ser Met Asp Ala 1700 1705 1710 Leu Lys Glu Ala Val Phe Asn Leu Ser Gln Ala Asp Asp Asp Ile 1715 1720 1725 Ser Val Glu Glu Ala Arg Ala Glu Ile Ala Lys Ile Glu Ala Leu 1730 1735 1740 Lys Asn Ala Leu Val Gln Lys Lys Thr Ala Leu Val Ala Glu Asp 1745 1750 1755 Phe Glu Ser Leu Asp Ala Pro Ala Gln Pro Gly Glu Gly Leu Glu 1760 1765 1770 Asn Ala Phe Asp Gly Asn Val Ser Ser Leu Trp His Thr Ser Trp 1775 1780 1785 Asn Gly Gly Asp Val Gly Lys Pro Ala Thr Met Val Leu Lys Glu 1790 1795 1800 Pro Thr Glu Ile Thr Gly Leu Arg Tyr Val Pro Arg Ala Ser Asp 1805 1810 1815 Ser Asn Gly Asn Leu Arg Asp Val Lys Leu Val Val Thr Asp Glu 1820 1825 1830 Ser Gly Lys Glu His Thr Phe Asn Val Thr Asp Trp Pro Asn Asn 1835 1840 1845 Asn Lys Pro Lys Asp Ile Asp Phe Gly Lys Thr Ile Lys Ala Lys 1850 1855 1860 Lys Ile Val Leu Thr Gly Thr Lys Thr Tyr Gly Asp Gly Gly Asp 1865 1870 1875 Lys Tyr Gln Ser Ala Ala Glu Leu Ile Phe Thr Arg Pro Gln Val 1880 1885 1890 Ala Glu Thr Pro Leu Asp Leu Ser Gly Tyr Glu Ala Ala Leu Ala 1895 1900 1905 Lys Ala Gln Lys Leu Thr Asp Lys Asp Asn Gln Glu Glu Val Ala 1910 1915 1920 Ser Val Gln Ala Ser Met Lys Tyr Ala Thr Asp Asn His Leu Leu 1925 1930 1935 Thr Glu Arg Met Val Ala Tyr Phe Ala Asp Tyr Leu Asn Gln Leu 1940 1945 1950 Lys Asp Ser Ala Thr Lys Pro Asp Ala Pro Thr Ser Ser Lys Gly 1955 1960 1965 Glu Glu Gln Pro Pro Val Leu Asp Val Pro Glu Phe Lys Gly Gly 1970 1975 1980 Val Asn Ala Thr Glu Ala Ala Val His Glu Val Pro Glu Phe Lys 1985 1990 1995 Gly Gly Val Asn Ala Val Gln Ala Leu Val His Glu Leu Pro Glu 2000 2005 2010 Tyr Lys Gly Gly Ala Asn Ala Val Leu Ala Ala Ala Asn Glu Val 2015 2020 2025 Pro Glu Tyr Lys Gly Gly Ala Asn Ala Val Glu Ala Leu Val Asn 2030 2035 2040 Glu Lys Pro Ala Tyr Thr Gly Val Leu Ala Thr Ala Gly Asp Gln 2045 2050 2055 Ala Ala Pro Thr Val Glu Lys Pro Glu Tyr Pro Leu Thr Pro Ser 2060 2065 2070 Pro Val Ala Asp Thr Lys Thr Pro Gly Ala Lys Asp Glu Glu Lys 2075 2080 2085 Leu Pro Ala Thr Gly Glu His Ser Ser Glu Val Ala Leu Phe Leu 2090 2095 2100 Ala Ser Val Ser Ile Ala Leu Ser Ala Ala Val Leu Ala Thr Lys 2105 2110 2115 Arg Lys Glu Glu Gly Ser Gly Leu Glu His His His His His His 2120 2125 2130 <210> 16 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> E206A forward primer <400> 16 atggcgcacg cgctgggcca cg 22 <210> 17 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> E206A reverse primer <400> 17 gccaccgtac catttcgtc 19 <210> 18 <211> 166 <212> PRT <213> Artificial Sequence <220> <223> EPO <400> 18 Ala Pro Pro Arg Leu Ile Cys Asp Ser Arg Val Leu Glu Arg Tyr Leu 1 5 10 15 Leu Glu Ala Lys Glu Ala Glu Asp Ile Thr Thr Gly Cys Ala Glu His 20 25 30 Cys Ser Leu Asp Glu Asn Ile Thr Val Pro Asp Thr Lys Val Asp Phe 35 40 45 Tyr Ala Trp Lys Arg Met Glu Val Gly Gln Gln Ala Val Glu Val Trp 50 55 60 Gln Gly Leu Ala Leu Leu Ser Glu Ala Val Leu Arg Gly Gln Ala Leu 65 70 75 80 Leu Val Asn Ser Ser Gln Pro Trp Glu Pro Leu Gln Leu His Val Asp 85 90 95 Lys Ala Val Ser Gly Leu Arg Ser Leu Thr Thr Leu Leu Arg Ala Leu 100 105 110 Gly Ala Gln Lys Glu Ala Ile Ser Pro Pro Asp Ala Ala Ser Ala Ala 115 120 125 Pro Leu Arg Thr Ile Thr Ala Asp Thr Phe Arg Lys Leu Phe Arg Val 130 135 140 Tyr Ser Asn Phe Leu Arg Gly Lys Leu Lys Leu Tyr Thr Gly Glu Ala 145 150 155 160 Cys Arg Thr Gly Asp Arg 165 <210> 19 <400> 19 000 <210> 20 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide capable of binding to O-glycans but lacks or has reduced O-glycoprotein-specific endoprotease activity <400> 20 Glu Val Thr Val Pro Asp Ala Leu Lys Asp Arg Ile Ala Leu Lys Lys 1 5 10 15 Thr Ala Arg Gln Leu Asn Ile Val Tyr Phe Leu Gly Ser Asp Thr Glu 20 25 30 Pro Val Pro Asp Tyr Glu Arg Arg Leu Ser Glu Leu Leu Leu Tyr Leu 35 40 45 Gln Gln Phe Tyr Gly Lys Glu Met Gln Arg His Gly Tyr Gly Ala Arg 50 55 60 Ser Phe Gly Leu Asp Ile Lys Ser Pro Gly Arg Val Asn Ile Ile Glu 65 70 75 80 Tyr Lys Ala Lys Asn Pro Ala Ala His Tyr Pro Tyr Glu Asn Gly Gly 85 90 95 Gly Trp Lys Ala Ala Gln Glu Leu Asp Glu Phe Phe Lys Ala His Pro 100 105 110 Asp Arg Lys Lys Ser Gln His Thr Leu Ile Ile Met Pro Thr Trp Asn 115 120 125 Asp Glu Lys Asn Gly Pro Asp Asn Pro Gly Gly Val Pro Phe Tyr Gly 130 135 140 Met Gly Arg Asn Cys Phe Ala Leu Asp Tyr Pro Ala Phe Asp Ile Lys 145 150 155 160 His Leu Gly Gln Lys Thr Arg Glu Gly Arg Leu Leu Thr Lys Trp Tyr 165 170 175 Gly Gly Met Ala Ala Ala Leu Gly His Gly Leu Asn Leu Pro His Asn 180 185 190 His Gln Thr Ala Ser Asp Gly Lys Lys Tyr Gly Thr Ala Leu Met Gly 195 200 205 Ser Gly Asn Tyr Thr Phe Gly Thr Ser Pro Thr Phe Leu Thr Pro Ala 210 215 220 Ser Cys Ala Leu Leu Asp Ala Cys Glu Val Phe Ser Val Thr Pro Ser 225 230 235 240 Gln Gln Phe Tyr Glu Gly Lys Pro Glu Val Glu Val Gly Asp Val Ala 245 250 255 Ile Ser Phe Lys Gly Asp Gln Ile Leu Val Ser Gly Asn Tyr Lys Ser 260 265 270 Pro Gln Thr Val Lys Ala Leu Asn Val Tyr Ile Gln Asp Pro Pro Tyr 275 280 285 Ala Val Asn Gln Asp Tyr Asp Ala Val Ser Phe Ser Arg Arg Leu Gly 290 295 300 Lys Lys Ser Gly Lys Phe Ser Met Lys Ile Asp Lys Lys Glu Leu Glu 305 310 315 320 Gly Leu Asn Asn Asn Glu Phe Arg Ile Ser Leu Met Phe Ile Leu Ala 325 330 335 Asn Gly Leu His Met Gln Lys His Phe Thr Phe His Trp Asp Ala Leu 340 345 350 Gln Asp Tyr Arg Asp Gly Ser Lys Ser 355 360 <210> 21 <211> 371 <212> PRT <213> Artificial Sequence <220> <223> LS HE206AA or LS H205A/E206A (including N-terminal methionine and C-terminal linker) <400> 21 Met Glu Val Thr Val Pro Asp Ala Leu Lys Asp Arg Ile Ala Leu Lys 1 5 10 15 Lys Thr Ala Arg Gln Leu Asn Ile Val Tyr Phe Leu Gly Ser Asp Thr 20 25 30 Glu Pro Val Pro Asp Tyr Glu Arg Arg Leu Ser Glu Leu Leu Leu Tyr 35 40 45 Leu Gln Gln Phe Tyr Gly Lys Glu Met Gln Arg His Gly Tyr Gly Ala 50 55 60 Arg Ser Phe Gly Leu Asp Ile Lys Ser Pro Gly Arg Val Asn Ile Ile 65 70 75 80 Glu Tyr Lys Ala Lys Asn Pro Ala Ala His Tyr Pro Tyr Glu Asn Gly 85 90 95 Gly Gly Trp Lys Ala Ala Gln Glu Leu Asp Glu Phe Phe Lys Ala His 100 105 110 Pro Asp Arg Lys Lys Ser Gln His Thr Leu Ile Ile Met Pro Thr Trp 115 120 125 Asn Asp Glu Lys Asn Gly Pro Asp Asn Pro Gly Gly Val Pro Phe Tyr 130 135 140 Gly Met Gly Arg Asn Cys Phe Ala Leu Asp Tyr Pro Ala Phe Asp Ile 145 150 155 160 Lys His Leu Gly Gln Lys Thr Arg Glu Gly Arg Leu Leu Thr Lys Trp 165 170 175 Tyr Gly Gly Met Ala Ala Ala Leu Gly His Gly Leu Asn Leu Pro His 180 185 190 Asn His Gln Thr Ala Ser Asp Gly Lys Lys Tyr Gly Thr Ala Leu Met 195 200 205 Gly Ser Gly Asn Tyr Thr Phe Gly Thr Ser Pro Thr Phe Leu Thr Pro 210 215 220 Ala Ser Cys Ala Leu Leu Asp Ala Cys Glu Val Phe Ser Val Thr Pro 225 230 235 240 Ser Gln Gln Phe Tyr Glu Gly Lys Pro Glu Val Glu Val Gly Asp Val 245 250 255 Ala Ile Ser Phe Lys Gly Asp Gln Ile Leu Val Ser Gly Asn Tyr Lys 260 265 270 Ser Pro Gln Thr Val Lys Ala Leu Asn Val Tyr Ile Gln Asp Pro Pro 275 280 285 Tyr Ala Val Asn Gln Asp Tyr Asp Ala Val Ser Phe Ser Arg Arg Leu 290 295 300 Gly Lys Lys Ser Gly Lys Phe Ser Met Lys Ile Asp Lys Lys Glu Leu 305 310 315 320 Glu Gly Leu Asn Asn Asn Glu Phe Arg Ile Ser Leu Met Phe Ile Leu 325 330 335 Ala Asn Gly Leu His Met Gln Lys His Phe Thr Phe His Trp Asp Ala 340 345 350 Leu Gln Asp Tyr Arg Asp Gly Ser Lys Ser Gly Ser Gly His His His 355 360 365 His His His 370 <210> 22 <211> 1116 <212> DNA <213> Artificial Sequence <220> <223> Nucleotide sequence encoding LS HE206AA or LS H205A/E206A <400> 22 atggaagtca ctgtgccgga cgccctgaaa gatcgcatcg cgctgaagaa aaccgctcgt 60 cagctgaata tcgtctactt cctgggttct gataccgaac cggttccgga ctacgagcgc 120 cgtctgagcg agctgctgtt gtatctgcag caattctatg gtaaagaaat gcagcgccat 180 ggctatggcg cacgcagctt tggtctggac attaagtcac cgggtcgtgt gaacattatc 240 gagtacaaag cgaagaaccc ggcagcgcat tacccgtatg agaatggtgg cggctggaaa 300 gctgcacaag aactggacga atttttcaag gcccatccag accgcaagaa aagccagcac 360 accctgatca tcatgcctac ctggaatgat gagaaaaatg gtcctgacaa tccgggtggc 420 gttccgttct atggtatggg tcgtaattgt tttgcgttgg actacccggc gtttgatatc 480 aagcacctgg gtcagaaaac gcgtgagggt cgtctgctga cgaaatggta cggtggcatg 540 gcggccgcgc tgggccacgg cctgaatctg ccgcacaatc accagaccgc gagcgatggc 600 aagaaatatg gcaccgccct gatgggtagc ggcaactaca cgttcggtac cagcccgacg 660 ttcctgaccc cggcgagctg tgcgctgctg gatgcctgcg aagtgttcag cgttaccccg 720 agccaacagt tttatgaggg taagccagaa gtcgaggttg gtgatgttgc aatttccttc 780 aagggtgatc aaatcttggt cagcggtaac tacaagagcc cgcaaaccgt gaaagctctg 840 aacgtttaca ttcaggatcc gccgtacgcc gtgaaccaag actacgatgc agtgagcttt 900 agccgtcgtc tgggcaaaaa gtccggtaag tttagcatga agattgacaa aaaagaactg 960 gaaggcctga ataacaacga attccgtatt tccttgatgt tcattctggc aaacggctta 1020 cacatgcaga agcactttac gtttcactgg gatgcgctgc aagactaccg tgacggtagc 1080 aaatctggtt cgggtcatca tcaccaccat cactga 1116 <210> 23 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> disrupted metalloprotease motif <400> 23 Gly Met Ala His Ala Leu Gly His Gly Leu 1 5 10 <210> 24 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> disrupted metalloprotease motif <400> 24 Gly Met Ala Ala Glu Leu Gly His Gly Leu 1 5 10 <210> 25 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> disrupted metalloprotease motif <400> 25 Gly Met Ala Ala Ala Leu Gly His Gly Leu 1 5 10 <210> 26 <211> 882 <212> PRT <213> Pseudomonas aeruginosa <400> 26 Ala Thr Gln Glu Glu Ile Leu Asp Ala Ala Leu Val Ser Gly Asp Ser 1 5 10 15 Ser Gln Leu Thr Asp Ser His Leu Val Ala Leu Arg Leu Gln Gln Gln 20 25 30 Val Glu Arg Ile Arg Gln Thr Arg Thr Gln Leu Leu Asp Gly Leu Tyr 35 40 45 Gln Asn Leu Ser Gln Ala Tyr Asp Pro Gly Ala Ala Ser Met Trp Val 50 55 60 Leu Pro Ala Asn Pro Asp Asn Thr Leu Pro Phe Leu Ile Gly Asp Lys 65 70 75 80 Gly Arg Val Leu Ala Ser Leu Ser Leu Glu Ala Gly Gly Arg Gly Leu 85 90 95 Ala Tyr Gly Thr Asn Val Leu Thr Gln Leu Ser Gly Thr Asn Ala Ala 100 105 110 His Ala Pro Leu Leu Lys Arg Ala Val Gln Trp Leu Val Asn Gly Asp 115 120 125 Pro Gly Ala Ala Thr Ala Lys Asp Phe Lys Val Ser Val Val Gly Val 130 135 140 Asp Lys Thr Ala Ala Leu Asn Gly Leu Lys Ser Ala Gly Leu Gln Pro 145 150 155 160 Ala Asp Ala Ala Cys Asn Ala Leu Thr Asp Ala Ser Cys Ala Ser Thr 165 170 175 Ser Lys Leu Leu Val Leu Gly Asn Gly Ala Ser Ala Ala Ser Leu Ser 180 185 190 Ala Thr Val Arg Ala Arg Leu Gln Ala Gly Leu Pro Ile Leu Phe Val 195 200 205 His Thr Asn Gly Trp Asn Gln Ser Ser Thr Gly Gln Gln Ile Leu Ala 210 215 220 Gly Leu Gly Leu Gln Glu Gly Pro Tyr Gly Gly Asn Tyr Trp Asp Lys 225 230 235 240 Asp Arg Val Pro Ser Ser Arg Thr Arg Thr Arg Ser Val Glu Leu Gly 245 250 255 Gly Ala Tyr Gly Gln Asp Pro Ala Leu Val Gln Gln Ile Val Asp Gly 260 265 270 Ser Trp Arg Thr Asp Tyr Asp Trp Ser Lys Cys Thr Ser Tyr Val Gly 275 280 285 Arg Thr Thr Cys Asp Asp Val Pro Gly Leu Ser Asp Phe Ser Lys Arg 290 295 300 Val Asp Val Leu Lys Gly Ala Leu Asp Ala Tyr Asn Gln Lys Ala Gln 305 310 315 320 Asn Leu Phe Ala Leu Pro Gly Thr Thr Ser Leu Arg Leu Trp Leu Leu 325 330 335 Trp Ala Asp Ala Val Arg Gln Asn Ile Arg Tyr Pro Met Asp Lys Ala 340 345 350 Ala Asp Thr Ala Arg Phe Gln Glu Thr Phe Val Ala Asp Ala Ile Val 355 360 365 Gly Tyr Val Arg Glu Ala Gly Ala Ala Gln Lys Glu Leu Gly Ser Tyr 370 375 380 Ala Gly Gln Arg Gln Gln Ser Met Pro Val Ser Gly Ser Glu Glu Thr 385 390 395 400 Leu Thr Leu Thr Leu Pro Ser Ala Gln Gly Phe Thr Ala Ile Gly Arg 405 410 415 Met Ala Ala Pro Gly Lys Arg Leu Ser Ile Arg Ile Glu Asp Ala Gly 420 425 430 Gln Ala Ser Leu Ala Val Gly Leu Asn Thr Gln Arg Ile Gly Ser Thr 435 440 445 Arg Leu Trp Asn Thr Arg Gln Tyr Asp Arg Pro Arg Phe Leu Lys Ser 450 455 460 Pro Asp Ile Lys Leu Gln Ala Asn Gln Ser Val Ala Leu Val Ser Pro 465 470 475 480 Tyr Gly Gly Leu Leu Gln Leu Val Tyr Ser Gly Ala Thr Pro Gly Gln 485 490 495 Thr Val Thr Val Lys Val Thr Gly Ala Ala Ser Gln Pro Phe Leu Asp 500 505 510 Ile Gln Pro Gly Glu Asp Ser Ser Gln Ala Ile Ala Asp Phe Ile Gln 515 520 525 Ala Leu Asp Ala Asp Lys Ala Asp Trp Leu Glu Ile Arg Ser Gly Ser 530 535 540 Val Glu Val His Ala Lys Val Glu Lys Val Arg Gly Ser Ile Asp Lys 545 550 555 560 Asp Tyr Gly Gly Asp Val Gln Arg Phe Ile Arg Glu Leu Asn Glu Val 565 570 575 Phe Ile Asp Asp Ala Tyr Thr Leu Ala Gly Phe Ala Ile Pro Asn Gln 580 585 590 Ala Lys Thr Pro Ala Ile Gln Gln Glu Cys Ala Ala Arg Gly Trp Asp 595 600 605 Cys Asp Ser Glu Thr Leu His Lys Leu Pro Gly Thr Gln His Ile Asn 610 615 620 Val Asp Gln Tyr Ala Gln Cys Gly Gly Gly Cys Ser Gly Asn Pro Tyr 625 630 635 640 Asp Gln Thr Trp Gly Leu Asn Pro Arg Gly Trp Gly Glu Ser His Glu 645 650 655 Leu Gly His Asn Leu Gln Val Asn Arg Leu Lys Val Tyr Gly Gly Arg 660 665 670 Ser Gly Glu Ile Ser Asn Gln Ile Phe Pro Leu His Lys Asp Trp Arg 675 680 685 Val Leu Arg Glu Phe Gly Gln Asn Leu Asp Asp Thr Arg Val Asn Tyr 690 695 700 Arg Asn Ala Tyr Asn Leu Ile Val Ala Gly Arg Ala Glu Ala Asp Pro 705 710 715 720 Leu Ala Gly Val Tyr Lys Arg Leu Trp Glu Asp Pro Gly Thr Tyr Ala 725 730 735 Leu Asn Gly Glu Arg Met Ala Phe Tyr Thr Gln Trp Val His Tyr Trp 740 745 750 Ala Asp Leu Lys Asn Asp Pro Leu Gln Gly Trp Asp Ile Trp Thr Leu 755 760 765 Leu Tyr Leu His Gln Arg Gln Val Asp Lys Ser Asp Trp Asp Ala Asn 770 775 780 Lys Ala Ala Leu Gly Tyr Gly Thr Tyr Ala Gln Arg Pro Gly Asn Ser 785 790 795 800 Gly Asp Ala Ser Ser Thr Asp Gly Asn Asp Asn Leu Leu Leu Gly Leu 805 810 815 Ser Trp Leu Thr Gln Arg Asp Gln Arg Pro Thr Phe Ala Leu Trp Gly 820 825 830 Ile Arg Thr Ser Ala Ala Ala Gln Ala Gln Val Ala Ala Tyr Gly Phe 835 840 845 Ala Glu Gln Pro Ala Phe Phe Tyr Ala Asn Asn Arg Thr Asn Glu Tyr 850 855 860 Ser Thr Val Lys Leu Leu Asp Met Ser Gln Gly Ser Pro Ala Trp Pro 865 870 875 880 Phe Pro <210> 27 <211> 536 <212> PRT <213> Bacteroides thetaiotaomicron <400> 27 Asp Lys Trp Glu Lys Glu Phe Arg Ile Arg Ser Tyr Glu Pro Tyr Ser 1 5 10 15 Asn Ile Ala Glu Trp Ala Asp Lys Leu Met Thr Lys Lys Tyr Ser Asp 20 25 30 Leu Asp Asn Pro Thr Gly Ile Ser Val Lys Ala Gly Asp Asp Ile Ile 35 40 45 Val Leu Val Gly Asp Thr Tyr Gly Gln Asn Ile Ser Met Gln Cys Ile 50 55 60 Trp Glu Thr Gly Thr Glu Tyr Lys Gln Thr Ala Ser Ser Gly Asp Val 65 70 75 80 Tyr Met Leu Asn Pro Gly Val Asn Lys Leu Thr Met Lys Gly Glu Gly 85 90 95 Gln Leu Phe Val Met Tyr Asn Thr Glu Leu Thr Ser Asn Thr Ala Lys 100 105 110 Pro Ile Lys Ile His Ile Pro Leu Gly Ser Gly Thr Val Asn Gly Phe 115 120 125 Phe Asp Leu Lys Glu His Lys Thr Asp Glu Lys Tyr Ala Glu Leu Leu 130 135 140 Lys Lys Ser Thr His Lys Tyr Phe Cys Ile Arg Gly Glu Lys Ile Met 145 150 155 160 Phe Tyr Phe His Arg Asn Lys Leu Leu Glu Tyr Val Pro Asn Asn Ile 165 170 175 Leu Ser Ala Ile His Leu Trp Asp Asn Ile Val Gly Trp Gln Gln Glu 180 185 190 Leu Met Gly Ile Asp Asp Val Arg Pro Ser Gln Val Asn Asn His Leu 195 200 205 Phe Ala Ile Ser Pro Glu Gly Ser Tyr Met Trp Ala Ser Asp Tyr Gln 210 215 220 Ile Gly Phe Val Tyr Thr Tyr Leu Gly Asn Ile Leu Leu Glu Asp Asn 225 230 235 240 Val Met Ala Ala Glu Asp Asn Ala Trp Gly Pro Ala His Glu Ile Gly 245 250 255 His Val His Gln Ala Ala Ile Asn Trp Ala Ser Ser Thr Glu Ser Ser 260 265 270 Asn Asn Leu Phe Ser Asn Phe Ile Ile Tyr Lys Leu Gly Lys Tyr Lys 275 280 285 Ser Arg Gly Asn Gly Leu Gly Ser Val Ala Thr Ala Arg Tyr Ala Asn 290 295 300 Gly Gln Ala Trp Tyr Asn Met Gly Asp Ala Thr His Gln Asn Glu Asp 305 310 315 320 Thr Glu Thr His Met Arg Met Asn Trp Gln Leu Trp Ile Tyr Tyr His 325 330 335 Arg Cys Glu Tyr Lys Thr Asp Phe Trp Gln Thr Leu Phe Lys Leu Met 340 345 350 Arg Glu Val Asn Met Thr Glu Gly Glu Asp Pro Gly Lys Lys Gln Leu 355 360 365 Glu Phe Ala Lys Met Ala Ser Lys Ala Ala Asn Gln Asn Leu Thr Asp 370 375 380 Phe Phe Glu Met Trp Gly Phe Phe Glu Pro Val Asn Thr Thr Ile Glu 385 390 395 400 Gln Tyr Gly Thr Tyr Lys Tyr Tyr Val Ser Asp Ala Met Ile Arg Glu 405 410 415 Ala Lys Glu Tyr Met Ala Gln Phe Pro Ala Pro Lys His Ala Phe Gln 420 425 430 Tyr Ile Glu Asp Arg Lys Lys Ser Glu Phe Pro Ser Asn Asp Tyr Arg 435 440 445 Tyr Ser Ala Val Gly Asp Val Gly Tyr Tyr Thr Gln Phe Lys Glu Asn 450 455 460 Gln Lys Ile Thr Lys Ala Ile Thr Ala Glu Leu Ala Gly Arg Lys Val 465 470 475 480 Ser Ile Gln Asn Gly Asp Glu Ala Val Ala Phe Glu Leu Arg Glu Asn 485 490 495 Asp Glu Asn Gly Lys Leu Leu Tyr Phe Ser Thr Phe Thr Thr Phe Glu 500 505 510 Ile Pro Ser Ser Ile Leu Met Val Asn Ala Lys Leu Tyr Ala Val Gln 515 520 525 Ala Asp Gly Lys Arg Ile Leu Leu 530 535 <210> 28 <211> 507 <212> PRT <213> Clostridium perfringens <400> 28 Val Leu Glu Leu Glu Met Arg Gly Asp Ser Ile Ser Glu Ala Lys Lys 1 5 10 15 Arg Lys Val Trp Asn Phe Gln Asp Trp Gln Ile Thr Gly Leu Ser Ala 20 25 30 Arg Ala Gly Asp Lys Ile Thr Val Tyr Val Asp Val Ala Glu Gly Asp 35 40 45 Pro Thr Pro Thr Leu Leu Tyr Lys Gln Ser Leu Thr Gln His Gly Gly 50 55 60 Ala Thr Ser Phe Gln Leu Lys Pro Gly Lys Asn Glu Ile Thr Ile Pro 65 70 75 80 Glu Ile Asn Tyr Glu Ser Asn Gly Ile Pro Lys Asp Val Ile Gln Gly 85 90 95 Gly Asp Leu Phe Phe Thr Asn Tyr Lys Ser Asp Ser Gln Lys Arg Ala 100 105 110 Pro Lys Val Arg Ile Glu Gly Ala Ser Lys Tyr Pro Val Phe Ile Leu 115 120 125 Gly Lys Ser Asp Glu Asn Glu Val Met Lys Glu Leu Glu Ala Tyr Val 130 135 140 Glu Lys Ile Lys Ala Glu Pro Lys Thr Thr Pro Asn Ile Phe Ala Val 145 150 155 160 Ser Ser Asn Lys Ser Leu Glu Phe Val Gln Ala Thr Tyr Ala Leu Asp 165 170 175 Trp Tyr Lys Lys Asn Asn Lys Thr Pro Lys Tyr Thr Ala Glu Gln Trp 180 185 190 Asp Gln Tyr Ile Ala Asp Ala Met Gly Phe Trp Gly Phe Asp Asn Ser 195 200 205 Lys Asp Val Asn Ser Asp Phe Asn Phe Arg Ile Met Pro Met Val Lys 210 215 220 Asn Leu Ser Gly Gly Ala Phe Met Asn Ala Gly Asn Gly Val Ile Gly 225 230 235 240 Ile Arg Pro Gly Asn Gln Asp Ala Ile Leu Ala Ala Asn Lys Gly Trp 245 250 255 Gly Val Ala His Glu Leu Gly His Asn Phe Asp Thr Gly Gly Arg Thr 260 265 270 Ile Val Glu Val Thr Asn Asn Met Met Pro Leu Phe Phe Glu Ser Lys 275 280 285 Tyr Lys Thr Lys Thr Arg Ile Thr Asp Gln Asn Ile Trp Glu Asn Asn 290 295 300 Thr Tyr Pro Lys Val Gly Leu Asp Asp Tyr Ser Asn Asn Glu Leu Tyr 305 310 315 320 Asn Lys Ala Asp Ser Thr His Leu Ala Gln Leu Ala Pro Leu Trp Gln 325 330 335 Leu Tyr Leu Tyr Asp Asn Thr Phe Tyr Gly Lys Phe Glu Arg Gln Phe 340 345 350 Arg Glu Arg Asp Phe Gly Asn Lys Asn Arg Glu Asp Ile Tyr Lys Ser 355 360 365 Trp Val Val Ala Ala Ser Asp Ala Met Glu Leu Asp Leu Thr Glu Phe 370 375 380 Phe Ala Arg His Gly Ile Arg Val Asp Asp Lys Val Lys Glu Asp Leu 385 390 395 400 Ala Lys Tyr Pro Lys Pro Asp Lys Lys Ile Tyr Tyr Leu Asn Asp Leu 405 410 415 Ala Met Asn Tyr Lys Gly Asp Gly Phe Thr Glu Asn Ala Lys Val Ser 420 425 430 Val Ser Thr Ser Gly Ser Asn Gly Asn Ile Lys Leu Ser Phe Ser Val 435 440 445 Asp Asp Glu Asn Lys Asp Asn Ile Leu Gly Tyr Glu Ile Arg Arg Asp 450 455 460 Gly Lys Tyr Val Gly Phe Thr Ser Asn Asp Ser Phe Val Asp Thr Lys 465 470 475 480 Ser Asn Leu Asp Glu Asp Gly Val Tyr Val Val Thr Pro Tyr Asp Arg 485 490 495 Lys Leu Asn Thr Leu Asn Pro Ile Glu Val Asn 500 505 <210> 29 <211> 892 <212> PRT <213> Artificial Sequence <220> <223> polypeptide having O-glycoprotein-specific endoprotease activity (including N-terminal methionine and a C-terminal linker + His6 tag) <400> 29 Met Ala Thr Gln Glu Glu Ile Leu Asp Ala Ala Leu Val Ser Gly Asp 1 5 10 15 Ser Ser Gln Leu Thr Asp Ser His Leu Val Ala Leu Arg Leu Gln Gln 20 25 30 Gln Val Glu Arg Ile Arg Gln Thr Arg Thr Gln Leu Leu Asp Gly Leu 35 40 45 Tyr Gln Asn Leu Ser Gln Ala Tyr Asp Pro Gly Ala Ala Ser Met Trp 50 55 60 Val Leu Pro Ala Asn Pro Asp Asn Thr Leu Pro Phe Leu Ile Gly Asp 65 70 75 80 Lys Gly Arg Val Leu Ala Ser Leu Ser Leu Glu Ala Gly Gly Arg Gly 85 90 95 Leu Ala Tyr Gly Thr Asn Val Leu Thr Gln Leu Ser Gly Thr Asn Ala 100 105 110 Ala His Ala Pro Leu Leu Lys Arg Ala Val Gln Trp Leu Val Asn Gly 115 120 125 Asp Pro Gly Ala Ala Thr Ala Lys Asp Phe Lys Val Ser Val Val Gly 130 135 140 Val Asp Lys Thr Ala Ala Leu Asn Gly Leu Lys Ser Ala Gly Leu Gln 145 150 155 160 Pro Ala Asp Ala Ala Cys Asn Ala Leu Thr Asp Ala Ser Cys Ala Ser 165 170 175 Thr Ser Lys Leu Leu Val Leu Gly Asn Gly Ala Ser Ala Ala Ser Leu 180 185 190 Ser Ala Thr Val Arg Ala Arg Leu Gln Ala Gly Leu Pro Ile Leu Phe 195 200 205 Val His Thr Asn Gly Trp Asn Gln Ser Ser Thr Gly Gln Gln Ile Leu 210 215 220 Ala Gly Leu Gly Leu Gln Glu Gly Pro Tyr Gly Gly Asn Tyr Trp Asp 225 230 235 240 Lys Asp Arg Val Pro Ser Ser Arg Thr Arg Thr Arg Ser Val Glu Leu 245 250 255 Gly Gly Ala Tyr Gly Gln Asp Pro Ala Leu Val Gln Gln Ile Val Asp 260 265 270 Gly Ser Trp Arg Thr Asp Tyr Asp Trp Ser Lys Cys Thr Ser Tyr Val 275 280 285 Gly Arg Thr Thr Cys Asp Asp Val Pro Gly Leu Ser Asp Phe Ser Lys 290 295 300 Arg Val Asp Val Leu Lys Gly Ala Leu Asp Ala Tyr Asn Gln Lys Ala 305 310 315 320 Gln Asn Leu Phe Ala Leu Pro Gly Thr Thr Ser Leu Arg Leu Trp Leu 325 330 335 Leu Trp Ala Asp Ala Val Arg Gln Asn Ile Arg Tyr Pro Met Asp Lys 340 345 350 Ala Ala Asp Thr Ala Arg Phe Gln Glu Thr Phe Val Ala Asp Ala Ile 355 360 365 Val Gly Tyr Val Arg Glu Ala Gly Ala Ala Gln Lys Glu Leu Gly Ser 370 375 380 Tyr Ala Gly Gln Arg Gln Gln Ser Met Pro Val Ser Gly Ser Glu Glu 385 390 395 400 Thr Leu Thr Leu Thr Leu Pro Ser Ala Gln Gly Phe Thr Ala Ile Gly 405 410 415 Arg Met Ala Ala Pro Gly Lys Arg Leu Ser Ile Arg Ile Glu Asp Ala 420 425 430 Gly Gln Ala Ser Leu Ala Val Gly Leu Asn Thr Gln Arg Ile Gly Ser 435 440 445 Thr Arg Leu Trp Asn Thr Arg Gln Tyr Asp Arg Pro Arg Phe Leu Lys 450 455 460 Ser Pro Asp Ile Lys Leu Gln Ala Asn Gln Ser Val Ala Leu Val Ser 465 470 475 480 Pro Tyr Gly Gly Leu Leu Gln Leu Val Tyr Ser Gly Ala Thr Pro Gly 485 490 495 Gln Thr Val Thr Val Lys Val Thr Gly Ala Ala Ser Gln Pro Phe Leu 500 505 510 Asp Ile Gln Pro Gly Glu Asp Ser Ser Gln Ala Ile Ala Asp Phe Ile 515 520 525 Gln Ala Leu Asp Ala Asp Lys Ala Asp Trp Leu Glu Ile Arg Ser Gly 530 535 540 Ser Val Glu Val His Ala Lys Val Glu Lys Val Arg Gly Ser Ile Asp 545 550 555 560 Lys Asp Tyr Gly Gly Asp Val Gln Arg Phe Ile Arg Glu Leu Asn Glu 565 570 575 Val Phe Ile Asp Asp Ala Tyr Thr Leu Ala Gly Phe Ala Ile Pro Asn 580 585 590 Gln Ala Lys Thr Pro Ala Ile Gln Gln Glu Cys Ala Ala Arg Gly Trp 595 600 605 Asp Cys Asp Ser Glu Thr Leu His Lys Leu Pro Gly Thr Gln His Ile 610 615 620 Asn Val Asp Gln Tyr Ala Gln Cys Gly Gly Gly Cys Ser Gly Asn Pro 625 630 635 640 Tyr Asp Gln Thr Trp Gly Leu Asn Pro Arg Gly Trp Gly Glu Ser His 645 650 655 Glu Leu Gly His Asn Leu Gln Val Asn Arg Leu Lys Val Tyr Gly Gly 660 665 670 Arg Ser Gly Glu Ile Ser Asn Gln Ile Phe Pro Leu His Lys Asp Trp 675 680 685 Arg Val Leu Arg Glu Phe Gly Gln Asn Leu Asp Asp Thr Arg Val Asn 690 695 700 Tyr Arg Asn Ala Tyr Asn Leu Ile Val Ala Gly Arg Ala Glu Ala Asp 705 710 715 720 Pro Leu Ala Gly Val Tyr Lys Arg Leu Trp Glu Asp Pro Gly Thr Tyr 725 730 735 Ala Leu Asn Gly Glu Arg Met Ala Phe Tyr Thr Gln Trp Val His Tyr 740 745 750 Trp Ala Asp Leu Lys Asn Asp Pro Leu Gln Gly Trp Asp Ile Trp Thr 755 760 765 Leu Leu Tyr Leu His Gln Arg Gln Val Asp Lys Ser Asp Trp Asp Ala 770 775 780 Asn Lys Ala Ala Leu Gly Tyr Gly Thr Tyr Ala Gln Arg Pro Gly Asn 785 790 795 800 Ser Gly Asp Ala Ser Ser Thr Asp Gly Asn Asp Asn Leu Leu Leu Gly 805 810 815 Leu Ser Trp Leu Thr Gln Arg Asp Gln Arg Pro Thr Phe Ala Leu Trp 820 825 830 Gly Ile Arg Thr Ser Ala Ala Ala Gln Ala Gln Val Ala Ala Tyr Gly 835 840 845 Phe Ala Glu Gln Pro Ala Phe Phe Tyr Ala Asn Asn Arg Thr Asn Glu 850 855 860 Tyr Ser Thr Val Lys Leu Leu Asp Met Ser Gln Gly Ser Pro Ala Trp 865 870 875 880 Pro Phe Pro Gly Ser Gly His His His His His His 885 890 <210> 30 <211> 546 <212> PRT <213> Artificial Sequence <220> <223> polypeptide having O-glycoprotein-specific endoprotease activity (including N-terminal methionine and a C-terminal linker + His6 tag) <400> 30 Met Asp Lys Trp Glu Lys Glu Phe Arg Ile Arg Ser Tyr Glu Pro Tyr 1 5 10 15 Ser Asn Ile Ala Glu Trp Ala Asp Lys Leu Met Thr Lys Lys Tyr Ser 20 25 30 Asp Leu Asp Asn Pro Thr Gly Ile Ser Val Lys Ala Gly Asp Asp Ile 35 40 45 Ile Val Leu Val Gly Asp Thr Tyr Gly Gln Asn Ile Ser Met Gln Cys 50 55 60 Ile Trp Glu Thr Gly Thr Glu Tyr Lys Gln Thr Ala Ser Ser Gly Asp 65 70 75 80 Val Tyr Met Leu Asn Pro Gly Val Asn Lys Leu Thr Met Lys Gly Glu 85 90 95 Gly Gln Leu Phe Val Met Tyr Asn Thr Glu Leu Thr Ser Asn Thr Ala 100 105 110 Lys Pro Ile Lys Ile His Ile Pro Leu Gly Ser Gly Thr Val Asn Gly 115 120 125 Phe Phe Asp Leu Lys Glu His Lys Thr Asp Glu Lys Tyr Ala Glu Leu 130 135 140 Leu Lys Lys Ser Thr His Lys Tyr Phe Cys Ile Arg Gly Glu Lys Ile 145 150 155 160 Met Phe Tyr Phe His Arg Asn Lys Leu Leu Glu Tyr Val Pro Asn Asn 165 170 175 Ile Leu Ser Ala Ile His Leu Trp Asp Asn Ile Val Gly Trp Gln Gln 180 185 190 Glu Leu Met Gly Ile Asp Asp Val Arg Pro Ser Gln Val Asn Asn His 195 200 205 Leu Phe Ala Ile Ser Pro Glu Gly Ser Tyr Met Trp Ala Ser Asp Tyr 210 215 220 Gln Ile Gly Phe Val Tyr Thr Tyr Leu Gly Asn Ile Leu Leu Glu Asp 225 230 235 240 Asn Val Met Ala Ala Glu Asp Asn Ala Trp Gly Pro Ala His Glu Ile 245 250 255 Gly His Val His Gln Ala Ala Ile Asn Trp Ala Ser Ser Thr Glu Ser 260 265 270 Ser Asn Asn Leu Phe Ser Asn Phe Ile Ile Tyr Lys Leu Gly Lys Tyr 275 280 285 Lys Ser Arg Gly Asn Gly Leu Gly Ser Val Ala Thr Ala Arg Tyr Ala 290 295 300 Asn Gly Gln Ala Trp Tyr Asn Met Gly Asp Ala Thr His Gln Asn Glu 305 310 315 320 Asp Thr Glu Thr His Met Arg Met Asn Trp Gln Leu Trp Ile Tyr Tyr 325 330 335 His Arg Cys Glu Tyr Lys Thr Asp Phe Trp Gln Thr Leu Phe Lys Leu 340 345 350 Met Arg Glu Val Asn Met Thr Glu Gly Glu Asp Pro Gly Lys Lys Gln 355 360 365 Leu Glu Phe Ala Lys Met Ala Ser Lys Ala Ala Asn Gln Asn Leu Thr 370 375 380 Asp Phe Phe Glu Met Trp Gly Phe Phe Glu Pro Val Asn Thr Thr Ile 385 390 395 400 Glu Gln Tyr Gly Thr Tyr Lys Tyr Tyr Val Ser Asp Ala Met Ile Arg 405 410 415 Glu Ala Lys Glu Tyr Met Ala Gln Phe Pro Ala Pro Lys His Ala Phe 420 425 430 Gln Tyr Ile Glu Asp Arg Lys Lys Ser Glu Phe Pro Ser Asn Asp Tyr 435 440 445 Arg Tyr Ser Ala Val Gly Asp Val Gly Tyr Tyr Thr Gln Phe Lys Glu 450 455 460 Asn Gln Lys Ile Thr Lys Ala Ile Thr Ala Glu Leu Ala Gly Arg Lys 465 470 475 480 Val Ser Ile Gln Asn Gly Asp Glu Ala Val Ala Phe Glu Leu Arg Glu 485 490 495 Asn Asp Glu Asn Gly Lys Leu Leu Tyr Phe Ser Thr Phe Thr Thr Phe 500 505 510 Glu Ile Pro Ser Ser Ile Leu Met Val Asn Ala Lys Leu Tyr Ala Val 515 520 525 Gln Ala Asp Gly Lys Arg Ile Leu Leu Gly Ser Gly His His His His 530 535 540 His His 545 <210> 31 <211> 517 <212> PRT <213> Artificial Sequence <220> <223> polypeptide having O-glycoprotein-specific endoprotease activity (including N-terminal methionine and a C-terminal linker + His6 tag) <400> 31 Met Val Leu Glu Leu Glu Met Arg Gly Asp Ser Ile Ser Glu Ala Lys 1 5 10 15 Lys Arg Lys Val Trp Asn Phe Gln Asp Trp Gln Ile Thr Gly Leu Ser 20 25 30 Ala Arg Ala Gly Asp Lys Ile Thr Val Tyr Val Asp Val Ala Glu Gly 35 40 45 Asp Pro Thr Pro Thr Leu Leu Tyr Lys Gln Ser Leu Thr Gln His Gly 50 55 60 Gly Ala Thr Ser Phe Gln Leu Lys Pro Gly Lys Asn Glu Ile Thr Ile 65 70 75 80 Pro Glu Ile Asn Tyr Glu Ser Asn Gly Ile Pro Lys Asp Val Ile Gln 85 90 95 Gly Gly Asp Leu Phe Phe Thr Asn Tyr Lys Ser Asp Ser Gln Lys Arg 100 105 110 Ala Pro Lys Val Arg Ile Glu Gly Ala Ser Lys Tyr Pro Val Phe Ile 115 120 125 Leu Gly Lys Ser Asp Glu Asn Glu Val Met Lys Glu Leu Glu Ala Tyr 130 135 140 Val Glu Lys Ile Lys Ala Glu Pro Lys Thr Thr Pro Asn Ile Phe Ala 145 150 155 160 Val Ser Ser Asn Lys Ser Leu Glu Phe Val Gln Ala Thr Tyr Ala Leu 165 170 175 Asp Trp Tyr Lys Lys Asn Asn Lys Thr Pro Lys Tyr Thr Ala Glu Gln 180 185 190 Trp Asp Gln Tyr Ile Ala Asp Ala Met Gly Phe Trp Gly Phe Asp Asn 195 200 205 Ser Lys Asp Val Asn Ser Asp Phe Asn Phe Arg Ile Met Pro Met Val 210 215 220 Lys Asn Leu Ser Gly Gly Ala Phe Met Asn Ala Gly Asn Gly Val Ile 225 230 235 240 Gly Ile Arg Pro Gly Asn Gln Asp Ala Ile Leu Ala Ala Asn Lys Gly 245 250 255 Trp Gly Val Ala His Glu Leu Gly His Asn Phe Asp Thr Gly Gly Arg 260 265 270 Thr Ile Val Glu Val Thr Asn Asn Met Met Pro Leu Phe Phe Glu Ser 275 280 285 Lys Tyr Lys Thr Lys Thr Arg Ile Thr Asp Gln Asn Ile Trp Glu Asn 290 295 300 Asn Thr Tyr Pro Lys Val Gly Leu Asp Asp Tyr Ser Asn Asn Glu Leu 305 310 315 320 Tyr Asn Lys Ala Asp Ser Thr His Leu Ala Gln Leu Ala Pro Leu Trp 325 330 335 Gln Leu Tyr Leu Tyr Asp Asn Thr Phe Tyr Gly Lys Phe Glu Arg Gln 340 345 350 Phe Arg Glu Arg Asp Phe Gly Asn Lys Asn Arg Glu Asp Ile Tyr Lys 355 360 365 Ser Trp Val Val Ala Ala Ser Asp Ala Met Glu Leu Asp Leu Thr Glu 370 375 380 Phe Phe Ala Arg His Gly Ile Arg Val Asp Asp Lys Val Lys Glu Asp 385 390 395 400 Leu Ala Lys Tyr Pro Lys Pro Asp Lys Lys Ile Tyr Tyr Leu Asn Asp 405 410 415 Leu Ala Met Asn Tyr Lys Gly Asp Gly Phe Thr Glu Asn Ala Lys Val 420 425 430 Ser Val Ser Thr Ser Gly Ser Asn Gly Asn Ile Lys Leu Ser Phe Ser 435 440 445 Val Asp Asp Glu Asn Lys Asp Asn Ile Leu Gly Tyr Glu Ile Arg Arg 450 455 460 Asp Gly Lys Tyr Val Gly Phe Thr Ser Asn Asp Ser Phe Val Asp Thr 465 470 475 480 Lys Ser Asn Leu Asp Glu Asp Gly Val Tyr Val Val Thr Pro Tyr Asp 485 490 495 Arg Lys Leu Asn Thr Leu Asn Pro Ile Glu Val Asn Gly Ser Gly His 500 505 510 His His His His His 515 <210> 32 <211> 923 <212> PRT <213> Pseudomonas aeruginosa <400> 32 Met Ser Leu Ser Thr Thr Ala Phe Pro Ser Leu Gln Gly Glu Asn Met 1 5 10 15 Ser Arg Ser Pro Ile Pro Arg His Arg Ala Leu Leu Ala Gly Phe Cys 20 25 30 Leu Ala Gly Ala Leu Ser Ala Gln Ala Ala Thr Gln Glu Glu Ile Leu 35 40 45 Asp Ala Ala Leu Val Ser Gly Asp Ser Ser Gln Leu Thr Asp Ser His 50 55 60 Leu Val Ala Leu Arg Leu Gln Gln Gln Val Glu Arg Ile Arg Gln Thr 65 70 75 80 Arg Thr Gln Leu Leu Asp Gly Leu Tyr Gln Asn Leu Ser Gln Ala Tyr 85 90 95 Asp Pro Gly Ala Ala Ser Met Trp Val Leu Pro Ala Asn Pro Asp Asn 100 105 110 Thr Leu Pro Phe Leu Ile Gly Asp Lys Gly Arg Val Leu Ala Ser Leu 115 120 125 Ser Leu Glu Ala Gly Gly Arg Gly Leu Ala Tyr Gly Thr Asn Val Leu 130 135 140 Thr Gln Leu Ser Gly Thr Asn Ala Ala His Ala Pro Leu Leu Lys Arg 145 150 155 160 Ala Val Gln Trp Leu Val Asn Gly Asp Pro Gly Ala Ala Thr Ala Lys 165 170 175 Asp Phe Lys Val Ser Val Val Gly Val Asp Lys Thr Ala Ala Leu Asn 180 185 190 Gly Leu Lys Ser Ala Gly Leu Gln Pro Ala Asp Ala Ala Cys Asn Ala 195 200 205 Leu Thr Asp Ala Ser Cys Ala Ser Thr Ser Lys Leu Leu Val Leu Gly 210 215 220 Asn Gly Ala Ser Ala Ala Ser Leu Ser Ala Thr Val Arg Ala Arg Leu 225 230 235 240 Gln Ala Gly Leu Pro Ile Leu Phe Val His Thr Asn Gly Trp Asn Gln 245 250 255 Ser Ser Thr Gly Gln Gln Ile Leu Ala Gly Leu Gly Leu Gln Glu Gly 260 265 270 Pro Tyr Gly Gly Asn Tyr Trp Asp Lys Asp Arg Val Pro Ser Ser Arg 275 280 285 Thr Arg Thr Arg Ser Val Glu Leu Gly Gly Ala Tyr Gly Gln Asp Pro 290 295 300 Ala Leu Val Gln Gln Ile Val Asp Gly Ser Trp Arg Thr Asp Tyr Asp 305 310 315 320 Trp Ser Lys Cys Thr Ser Tyr Val Gly Arg Thr Thr Cys Asp Asp Val 325 330 335 Pro Gly Leu Ser Asp Phe Ser Lys Arg Val Asp Val Leu Lys Gly Ala 340 345 350 Leu Asp Ala Tyr Asn Gln Lys Ala Gln Asn Leu Phe Ala Leu Pro Gly 355 360 365 Thr Thr Ser Leu Arg Leu Trp Leu Leu Trp Ala Asp Ala Val Arg Gln 370 375 380 Asn Ile Arg Tyr Pro Met Asp Lys Ala Ala Asp Thr Ala Arg Phe Gln 385 390 395 400 Glu Thr Phe Val Ala Asp Ala Ile Val Gly Tyr Val Arg Glu Ala Gly 405 410 415 Ala Ala Gln Lys Glu Leu Gly Ser Tyr Ala Gly Gln Arg Gln Gln Ser 420 425 430 Met Pro Val Ser Gly Ser Glu Glu Thr Leu Thr Leu Thr Leu Pro Ser 435 440 445 Ala Gln Gly Phe Thr Ala Ile Gly Arg Met Ala Ala Pro Gly Lys Arg 450 455 460 Leu Ser Ile Arg Ile Glu Asp Ala Gly Gln Ala Ser Leu Ala Val Gly 465 470 475 480 Leu Asn Thr Gln Arg Ile Gly Ser Thr Arg Leu Trp Asn Thr Arg Gln 485 490 495 Tyr Asp Arg Pro Arg Phe Leu Lys Ser Pro Asp Ile Lys Leu Gln Ala 500 505 510 Asn Gln Ser Val Ala Leu Val Ser Pro Tyr Gly Gly Leu Leu Gln Leu 515 520 525 Val Tyr Ser Gly Ala Thr Pro Gly Gln Thr Val Thr Val Lys Val Thr 530 535 540 Gly Ala Ala Ser Gln Pro Phe Leu Asp Ile Gln Pro Gly Glu Asp Ser 545 550 555 560 Ser Gln Ala Ile Ala Asp Phe Ile Gln Ala Leu Asp Ala Asp Lys Ala 565 570 575 Asp Trp Leu Glu Ile Arg Ser Gly Ser Val Glu Val His Ala Lys Val 580 585 590 Glu Lys Val Arg Gly Ser Ile Asp Lys Asp Tyr Gly Gly Asp Val Gln 595 600 605 Arg Phe Ile Arg Glu Leu Asn Glu Val Phe Ile Asp Asp Ala Tyr Thr 610 615 620 Leu Ala Gly Phe Ala Ile Pro Asn Gln Ala Lys Thr Pro Ala Ile Gln 625 630 635 640 Gln Glu Cys Ala Ala Arg Gly Trp Asp Cys Asp Ser Glu Thr Leu His 645 650 655 Lys Leu Pro Gly Thr Gln His Ile Asn Val Asp Gln Tyr Ala Gln Cys 660 665 670 Gly Gly Gly Cys Ser Gly Asn Pro Tyr Asp Gln Thr Trp Gly Leu Asn 675 680 685 Pro Arg Gly Trp Gly Glu Ser His Glu Leu Gly His Asn Leu Gln Val 690 695 700 Asn Arg Leu Lys Val Tyr Gly Gly Arg Ser Gly Glu Ile Ser Asn Gln 705 710 715 720 Ile Phe Pro Leu His Lys Asp Trp Arg Val Leu Arg Glu Phe Gly Gln 725 730 735 Asn Leu Asp Asp Thr Arg Val Asn Tyr Arg Asn Ala Tyr Asn Leu Ile 740 745 750 Val Ala Gly Arg Ala Glu Ala Asp Pro Leu Ala Gly Val Tyr Lys Arg 755 760 765 Leu Trp Glu Asp Pro Gly Thr Tyr Ala Leu Asn Gly Glu Arg Met Ala 770 775 780 Phe Tyr Thr Gln Trp Val His Tyr Trp Ala Asp Leu Lys Asn Asp Pro 785 790 795 800 Leu Gln Gly Trp Asp Ile Trp Thr Leu Leu Tyr Leu His Gln Arg Gln 805 810 815 Val Asp Lys Ser Asp Trp Asp Ala Asn Lys Ala Ala Leu Gly Tyr Gly 820 825 830 Thr Tyr Ala Gln Arg Pro Gly Asn Ser Gly Asp Ala Ser Ser Thr Asp 835 840 845 Gly Asn Asp Asn Leu Leu Leu Gly Leu Ser Trp Leu Thr Gln Arg Asp 850 855 860 Gln Arg Pro Thr Phe Ala Leu Trp Gly Ile Arg Thr Ser Ala Ala Ala 865 870 875 880 Gln Ala Gln Val Ala Ala Tyr Gly Phe Ala Glu Gln Pro Ala Phe Phe 885 890 895 Tyr Ala Asn Asn Arg Thr Asn Glu Tyr Ser Thr Val Lys Leu Leu Asp 900 905 910 Met Ser Gln Gly Ser Pro Ala Trp Pro Phe Pro 915 920 <210> 33 <211> 857 <212> PRT <213> Bacteroides thetaiotaomicron <400> 33 Met Thr Ile Lys Arg Phe Ile Thr Asn Leu Leu Ala Leu Phe Thr Leu 1 5 10 15 Phe Thr Val Ser Leu Ala Cys Lys Asp Thr Glu Lys Ser Ile Ile Asn 20 25 30 Ser Ser Phe Ser Ile Ser Glu Glu Tyr Leu Ile Gln Asn Leu Asp Lys 35 40 45 Ser Ser Thr Ser Val Gln Ile Pro Ile Asn Thr Ser Met Glu Leu Ala 50 55 60 Gln Trp Ser Val Ser Tyr Glu Ala Asn Trp Leu Gln Cys Ser Lys Gln 65 70 75 80 Lys Thr Ala Ala Glu Gly Thr Phe Leu Arg Ile Thr Val Asn Glu Asn 85 90 95 Thr Gly Glu Thr Lys Arg Thr Ala Asn Ile Lys Val Thr Ser Thr Thr 100 105 110 Ala Thr Tyr Thr Ile Thr Val Asn Gln Tyr Ala Lys Gly Glu Val Ile 115 120 125 Val Glu Gly Asp Ile Lys Val Thr Pro Thr Gly Gly Lys Ala Ser Glu 130 135 140 His Gln Glu Gly Gln Asp Ile Glu Asn Thr Tyr Asp Gly Lys Phe Ser 145 150 155 160 Thr Asp Gly Ala Ala Pro Phe His Thr Pro Trp Gly Gln Ser Ala Lys 165 170 175 Phe Pro Val Thr Leu Glu Tyr Tyr Phe Lys Gly Asp Thr Glu Ile Asp 180 185 190 Tyr Leu Ile Tyr Tyr Thr Arg Ser Gly Asn Gly Asn Phe Gly Lys Val 195 200 205 Lys Val Tyr Thr Thr Thr Asn Pro Asp Arg Ser Asp Tyr Thr Leu Gln 210 215 220 Gly Glu Tyr Asp Phe Lys Glu Gln Asn Ala Pro Ser Lys Val Ser Phe 225 230 235 240 Ser Glu Gly Ile Lys Ala Thr Gly Ile Lys Phe Glu Val Leu Ser Gly 245 250 255 Leu Gly Asp Phe Val Ser Cys Asp Glu Met Glu Phe Tyr Lys Thr Asn 260 265 270 Thr Asp Lys Thr Leu Asp Lys Gln Leu Leu Thr Val Phe Thr Asp Ile 275 280 285 Thr Cys Thr Glu Ile Lys Asn Asn Val Thr Asn Glu Gln Ile Gln Ala 290 295 300 Leu Pro Asp Tyr Phe Val Arg Ile Ala Glu Ala Val Arg Asp Asn Thr 305 310 315 320 Tyr Asp Lys Trp Glu Lys Glu Phe Arg Ile Arg Ser Tyr Glu Pro Tyr 325 330 335 Ser Asn Ile Ala Glu Trp Ala Asp Lys Leu Met Thr Lys Lys Tyr Ser 340 345 350 Asp Leu Asp Asn Pro Thr Gly Ile Ser Val Lys Ala Gly Asp Asp Ile 355 360 365 Ile Val Leu Val Gly Asp Thr Tyr Gly Gln Asn Ile Ser Met Gln Cys 370 375 380 Ile Trp Glu Thr Gly Thr Glu Tyr Lys Gln Thr Ala Ser Ser Gly Asp 385 390 395 400 Val Tyr Met Leu Asn Pro Gly Val Asn Lys Leu Thr Met Lys Gly Glu 405 410 415 Gly Gln Leu Phe Val Met Tyr Asn Thr Glu Leu Thr Ser Asn Thr Ala 420 425 430 Lys Pro Ile Lys Ile His Ile Pro Leu Gly Ser Gly Thr Val Asn Gly 435 440 445 Phe Phe Asp Leu Lys Glu His Lys Thr Asp Glu Lys Tyr Ala Glu Leu 450 455 460 Leu Lys Lys Ser Thr His Lys Tyr Phe Cys Ile Arg Gly Glu Lys Ile 465 470 475 480 Met Phe Tyr Phe His Arg Asn Lys Leu Leu Glu Tyr Val Pro Asn Asn 485 490 495 Ile Leu Ser Ala Ile His Leu Trp Asp Asn Ile Val Gly Trp Gln Gln 500 505 510 Glu Leu Met Gly Ile Asp Asp Val Arg Pro Ser Gln Val Asn Asn His 515 520 525 Leu Phe Ala Ile Ser Pro Glu Gly Ser Tyr Met Trp Ala Ser Asp Tyr 530 535 540 Gln Ile Gly Phe Val Tyr Thr Tyr Leu Gly Asn Ile Leu Leu Glu Asp 545 550 555 560 Asn Val Met Ala Ala Glu Asp Asn Ala Trp Gly Pro Ala His Glu Ile 565 570 575 Gly His Val His Gln Ala Ala Ile Asn Trp Ala Ser Ser Thr Glu Ser 580 585 590 Ser Asn Asn Leu Phe Ser Asn Phe Ile Ile Tyr Lys Leu Gly Lys Tyr 595 600 605 Lys Ser Arg Gly Asn Gly Leu Gly Ser Val Ala Thr Ala Arg Tyr Ala 610 615 620 Asn Gly Gln Ala Trp Tyr Asn Met Gly Asp Ala Thr His Gln Asn Glu 625 630 635 640 Asp Thr Glu Thr His Met Arg Met Asn Trp Gln Leu Trp Ile Tyr Tyr 645 650 655 His Arg Cys Glu Tyr Lys Thr Asp Phe Trp Gln Thr Leu Phe Lys Leu 660 665 670 Met Arg Glu Val Asn Met Thr Glu Gly Glu Asp Pro Gly Lys Lys Gln 675 680 685 Leu Glu Phe Ala Lys Met Ala Ser Lys Ala Ala Asn Gln Asn Leu Thr 690 695 700 Asp Phe Phe Glu Met Trp Gly Phe Phe Glu Pro Val Asn Thr Thr Ile 705 710 715 720 Glu Gln Tyr Gly Thr Tyr Lys Tyr Tyr Val Ser Asp Ala Met Ile Arg 725 730 735 Glu Ala Lys Glu Tyr Met Ala Gln Phe Pro Ala Pro Lys His Ala Phe 740 745 750 Gln Tyr Ile Glu Asp Arg Lys Lys Ser Glu Phe Pro Ser Asn Asp Tyr 755 760 765 Arg Tyr Ser Ala Val Gly Asp Val Gly Tyr Tyr Thr Gln Phe Lys Glu 770 775 780 Asn Gln Lys Ile Thr Lys Ala Ile Thr Ala Glu Leu Ala Gly Arg Lys 785 790 795 800 Val Ser Ile Gln Asn Gly Asp Glu Ala Val Ala Phe Glu Leu Arg Glu 805 810 815 Asn Asp Glu Asn Gly Lys Leu Leu Tyr Phe Ser Thr Phe Thr Thr Phe 820 825 830 Glu Ile Pro Ser Ser Ile Leu Met Val Asn Ala Lys Leu Tyr Ala Val 835 840 845 Gln Ala Asp Gly Lys Arg Ile Leu Leu 850 855 <210> 34 <211> 1687 <212> PRT <213> Clostridium perfringens <400> 34 Met Asn Lys Arg Lys Ile Ala Ala Ile Ile Leu Ala Thr Met Ile Thr 1 5 10 15 Asn Leu Ser Ala Thr Thr Ile Asp Val Leu Ala Gln Glu Leu Asn Thr 20 25 30 Lys Asn Asn Ser Lys Val Glu Val Ser His Asp Asp Glu Ser His Gln 35 40 45 Ala Arg Val Ser Lys Phe Asp Leu Tyr Asn Ser Asp Lys Leu Asp Ala 50 55 60 Tyr Asn Gln Glu Phe Gln Val Ser Arg Ser Asn Ile Lys Ser Ile Asn 65 70 75 80 Asn Asn Gly Gly Lys Tyr Asn Ser Ser Thr Ile Asp Lys Ala Ile Asp 85 90 95 Gly Asn Leu Glu Thr His Trp Glu Thr Gly Lys Pro Asn Asp Ala Asn 100 105 110 Phe Thr Asn Glu Val Val Val Thr Phe Asn Glu Ile Thr Asn Ile Asp 115 120 125 Arg Ile Val Tyr Ser Ala Arg Arg Asp Ser Ala Arg Gly Lys Gly Phe 130 135 140 Ala Lys Glu Phe Glu Ile Tyr Ala Ser Leu Lys Asp Glu Gly Asp Asp 145 150 155 160 Phe Asn Leu Val Ser Ser Gly Glu Tyr Thr Glu Ser Thr Arg Asp Leu 165 170 175 Val Glu Ile Lys Phe Asn Pro Thr Asp Phe Lys Arg Leu Lys Phe Lys 180 185 190 Phe Lys Lys Ala Asp Gln Asn Trp Ala Ser Ala Ala Glu Phe Met Phe 195 200 205 Tyr Lys Glu Asp Lys Leu Asn Glu Lys Phe Asn Gly Leu Phe Thr Asp 210 215 220 Ser Ser Met Asn Lys Val Ser Glu Glu Phe Asn Thr Leu Glu Lys Leu 225 230 235 240 Asn Ala Phe Glu Asn Glu Leu Lys Asp His Pro Ile Tyr Asp Leu Tyr 245 250 255 Lys Glu Gly Leu Asn Asn Ala Arg Ala Ile Leu Thr Glu Thr Ser Glu 260 265 270 Asn Pro Thr Lys Ala Thr Leu Gly Gln Ile Thr Tyr Asn Leu Asn Asp 275 280 285 Asp Tyr Asn Asn Gln Tyr Arg Met Pro Tyr Lys Asn Ile Lys Ala Ile 290 295 300 Lys Asn Asn Gly Arg His Tyr Ala Ala Gln Asn Ile Glu Lys Ala Ile 305 310 315 320 Asp Asn Asp Val Asn Thr Tyr Trp Glu Thr Gly Thr Leu Asn Ser Ser 325 330 335 Ser Phe Asn Asn Glu Val Glu Val Glu Phe Asn Asp Leu Val Thr Leu 340 345 350 Asp Arg Ile Val Tyr Gly Ser Arg Gln Ser Asp Leu Lys Gly Phe Ala 355 360 365 Glu Glu Val Tyr Ile Tyr Ala Ser Arg Thr Ser Lys Gly Asp Thr Tyr 370 375 380 Lys Leu Val Ala Thr Gly Ala His Glu Ala Thr Lys Gly Leu Val Glu 385 390 395 400 Ala Lys Phe Glu Pro Thr Glu Phe Lys Arg Val Lys Phe Lys Phe Lys 405 410 415 Lys Ser Lys Gln Asn Ser Ala Thr Leu Asn Glu Leu Met Phe Tyr Lys 420 425 430 Pro Asp Glu Val Tyr Ser Ser Ile Pro Lys Leu Phe Thr Asp Gly Thr 435 440 445 Met Ser Glu Leu Ser Glu Glu Phe Asn Ser Leu Glu Lys Ile Asn Ala 450 455 460 Phe Lys Glu Lys Ala Lys Asn His Pro Leu Tyr Asn Asp Phe Asn Glu 465 470 475 480 Thr Ile Glu Leu Ala Glu Ser Leu Ile Ser Asn Pro Arg Lys Glu Asp 485 490 495 Val Leu Glu Leu Glu Met Arg Gly Asp Ser Ile Ser Glu Ala Lys Lys 500 505 510 Arg Lys Val Trp Asn Phe Gln Asp Trp Gln Ile Thr Gly Leu Ser Ala 515 520 525 Arg Ala Gly Asp Lys Ile Thr Val Tyr Val Asp Val Ala Glu Gly Asp 530 535 540 Pro Thr Pro Thr Leu Leu Tyr Lys Gln Ser Leu Thr Gln His Gly Gly 545 550 555 560 Ala Thr Ser Phe Gln Leu Lys Pro Gly Lys Asn Glu Ile Thr Ile Pro 565 570 575 Glu Ile Asn Tyr Glu Ser Asn Gly Ile Pro Lys Asp Val Ile Gln Gly 580 585 590 Gly Asp Leu Phe Phe Thr Asn Tyr Lys Ser Asp Ser Gln Lys Arg Ala 595 600 605 Pro Lys Val Arg Ile Glu Gly Ala Ser Lys Tyr Pro Val Phe Ile Leu 610 615 620 Gly Lys Ser Asp Glu Asn Glu Val Met Lys Glu Leu Glu Ala Tyr Val 625 630 635 640 Glu Lys Ile Lys Ala Glu Pro Lys Thr Thr Pro Asn Ile Phe Ala Val 645 650 655 Ser Ser Asn Lys Ser Leu Glu Phe Val Gln Ala Thr Tyr Ala Leu Asp 660 665 670 Trp Tyr Lys Lys Asn Asn Lys Thr Pro Lys Tyr Thr Ala Glu Gln Trp 675 680 685 Asp Gln Tyr Ile Ala Asp Ala Met Gly Phe Trp Gly Phe Asp Asn Ser 690 695 700 Lys Asp Val Asn Ser Asp Phe Asn Phe Arg Ile Met Pro Met Val Lys 705 710 715 720 Asn Leu Ser Gly Gly Ala Phe Met Asn Ala Gly Asn Gly Val Ile Gly 725 730 735 Ile Arg Pro Gly Asn Gln Asp Ala Ile Leu Ala Ala Asn Lys Gly Trp 740 745 750 Gly Val Ala His Glu Leu Gly His Asn Phe Asp Thr Gly Gly Arg Thr 755 760 765 Ile Val Glu Val Thr Asn Asn Met Met Pro Leu Phe Phe Glu Ser Lys 770 775 780 Tyr Lys Thr Lys Thr Arg Ile Thr Asp Gln Asn Ile Trp Glu Asn Asn 785 790 795 800 Thr Tyr Pro Lys Val Gly Leu Asp Asp Tyr Ser Asn Asn Glu Leu Tyr 805 810 815 Asn Lys Ala Asp Ser Thr His Leu Ala Gln Leu Ala Pro Leu Trp Gln 820 825 830 Leu Tyr Leu Tyr Asp Asn Thr Phe Tyr Gly Lys Phe Glu Arg Gln Phe 835 840 845 Arg Glu Arg Asp Phe Gly Asn Lys Asn Arg Glu Asp Ile Tyr Lys Ser 850 855 860 Trp Val Val Ala Ala Ser Asp Ala Met Glu Leu Asp Leu Thr Glu Phe 865 870 875 880 Phe Ala Arg His Gly Ile Arg Val Asp Asp Lys Val Lys Glu Asp Leu 885 890 895 Ala Lys Tyr Pro Lys Pro Asp Lys Lys Ile Tyr Tyr Leu Asn Asp Leu 900 905 910 Ala Met Asn Tyr Lys Gly Asp Gly Phe Thr Glu Asn Ala Lys Val Ser 915 920 925 Val Ser Thr Ser Gly Ser Asn Gly Asn Ile Lys Leu Ser Phe Ser Val 930 935 940 Asp Asp Glu Asn Lys Asp Asn Ile Leu Gly Tyr Glu Ile Arg Arg Asp 945 950 955 960 Gly Lys Tyr Val Gly Phe Thr Ser Asn Asp Ser Phe Val Asp Thr Lys 965 970 975 Ser Asn Leu Asp Glu Asp Gly Val Tyr Val Val Thr Pro Tyr Asp Arg 980 985 990 Lys Leu Asn Thr Leu Asn Pro Ile Glu Val Asn Ala Leu Gln Pro Thr 995 1000 1005 Leu Ser Val Asn Pro Val Ile Thr Leu Ala Leu Gly Glu Glu Phe 1010 1015 1020 Asn Glu Glu Glu Tyr Ile Val Ala Lys Asp Ile Lys Gly Asn Ser 1025 1030 1035 Leu Ser Glu Ser Val Lys Val Lys Ser Ser Asn Val Asn Thr Ser 1040 1045 1050 Lys Val Gly Glu Tyr Glu Val Leu Tyr Ser Leu Glu Asp Ser Lys 1055 1060 1065 Gly Asn Glu Tyr Thr Lys Thr Ser Lys Val Asn Val Val Ser Arg 1070 1075 1080 Lys Glu Tyr Met Ser Asp Leu Thr Pro Lys Gln Ser Ser Asn Gly 1085 1090 1095 Trp Gly Thr Val Arg Lys Asp Lys Ser Ile Ser Gly Gly Val Ile 1100 1105 1110 Gly Leu Thr Arg Asp Gly Asp Phe Val Asp Tyr Asn Lys Gly Leu 1115 1120 1125 Gly Leu His Ser Asn Ala Glu Tyr Val Tyr Asp Leu Glu Gly Lys 1130 1135 1140 Asp Tyr Asp Tyr Phe Glu Ser Tyr Val Gly Val Asp Lys Ala Met 1145 1150 1155 Ser Ser Arg Pro Ala Ser Ser Val Ile Phe Lys Val Leu Val Asp 1160 1165 1170 Gly Glu Glu Lys Phe Asn Ser Gly Val Met Arg Ser Thr Thr Pro 1175 1180 1185 Gln Lys Tyr Val Lys Val Asp Val Lys Asn Ala Lys Glu Leu Lys 1190 1195 1200 Leu Ile Val Asn Asp Ala Gly Asp Gly Asp Ser Ser Asp His Ala 1205 1210 1215 Ser Phe Gly Asp Ala Lys Leu Ala Thr Leu Ser Ser Lys Pro Ile 1220 1225 1230 Ile Lys Gly Glu Asn Leu Ala Tyr Ser Met Asp Glu Lys Val Asp 1235 1240 1245 Leu Met Lys Gly Ile Thr Ala Thr Asp Ile Glu Asp Gly Asn Ile 1250 1255 1260 Thr Ser Lys Val Gln Ile Lys Ser Ser Asp Phe Val Glu Gly Lys 1265 1270 1275 Ser Gly Ile Phe Thr Val Val Tyr Ser Val Thr Asp Ser Asp Gly 1280 1285 1290 Leu Thr Ser Glu Cys Ser Arg Thr Ile Ala Val Thr Asp Lys Glu 1295 1300 1305 Thr Gln Leu Ser Asp Leu Asn Trp Lys Ser Ala Thr Ile Gly Ser 1310 1315 1320 Gly Ser Val Arg Lys Asp Arg Ala Val Ser Gly Asn Gln Ile Arg 1325 1330 1335 Leu Leu Asn Glu Asp Asn Ser Val Glu Thr Phe Ala Lys Gly Ile 1340 1345 1350 Gly Thr His Ser Tyr Ser Glu Ile Val Tyr Asn Ser Glu Gly Tyr 1355 1360 1365 Asp Ile Phe Asp Thr Trp Val Gly Ile Asp Arg His Val Ala Asp 1370 1375 1380 Lys Lys Val Ser Ser Val Lys Phe Lys Val Tyr Val Asp Gly Glu 1385 1390 1395 Leu Lys Ala Glu Thr Asp Val Met Arg Ile Asp Thr Pro Lys Lys 1400 1405 1410 Arg Leu Val Val Asp Val Arg Asn Ser Lys Glu Ile Lys Leu Val 1415 1420 1425 Val Asp Val Ala Asp Asn Gly Asn Asn Trp Asp His Ala Asp Trp 1430 1435 1440 Ala Asp Ala Lys Phe Arg Asn Leu Ala Glu Tyr Asp Ala Ser Glu 1445 1450 1455 Leu Asn Lys Ala Ile Glu Glu Ala Lys Lys Leu Asp Leu Asn Asn 1460 1465 1470 Tyr Thr Glu Glu Ser Ser Glu Ala Leu Lys Asn Ala Ile Ser Lys 1475 1480 1485 Gly Glu Glu Ala Leu Leu Ser Lys Asp Lys Glu Thr Ile Asn Ser 1490 1495 1500 Ala Leu Glu Glu Leu Asn Lys Glu Met Asn Ser Leu Val Lys Val 1505 1510 1515 Asp Leu Asn Ala Val Ile Asn Ile Pro Asp Lys Tyr Leu Leu Lys 1520 1525 1530 Ser Ile Gln Asn Gln Leu Asn Lys Thr Gly Asp Ile Thr Leu Gly 1535 1540 1545 Asp Met Tyr Ser Leu Thr Thr Leu Thr Leu Ser Gly Val Glu Asp 1550 1555 1560 Leu Thr Gly Leu Glu Asn Ala Lys Asn Leu Glu Thr Leu Asn Met 1565 1570 1575 Asp Tyr Asn Glu Val Lys Asp Leu Arg Pro Leu Ser Lys Leu Lys 1580 1585 1590 Lys Leu Asn Thr Leu Asn Ala Gln Glu Gln Phe Ile Ala Ala Gly 1595 1600 1605 Glu Leu Lys Pro Ser Asn Gly Lys Val Ile Gly Asp Ser Lys Val 1610 1615 1620 Tyr Asn Arg Glu Gly Lys Asn Val Ala Lys Thr Ile Arg Val Val 1625 1630 1635 Asp Lys Asn Gly Asn Thr Ile Leu Glu Gln Asp Ala Lys Asp Glu 1640 1645 1650 Phe Thr Ile Asn Thr Lys Asp Leu Ser Ser Gly Leu Tyr Gly Val 1655 1660 1665 His Val Leu Phe Glu Asp Glu Gly Phe Ser Gly Val Met Phe Tyr 1670 1675 1680 Leu Phe Asn Val 1685 <210> 35 <211> 882 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide capable of binding to O-glycans but lack or has reduced O-glycoprotein-specific endoprotease activity - Pseudomonas aeruginosa PAO1 (double mutant with removed signal sequence) <400> 35 Ala Thr Gln Glu Glu Ile Leu Asp Ala Ala Leu Val Ser Gly Asp Ser 1 5 10 15 Ser Gln Leu Thr Asp Ser His Leu Val Ala Leu Arg Leu Gln Gln Gln 20 25 30 Val Glu Arg Ile Arg Gln Thr Arg Thr Gln Leu Leu Asp Gly Leu Tyr 35 40 45 Gln Asn Leu Ser Gln Ala Tyr Asp Pro Gly Ala Ala Ser Met Trp Val 50 55 60 Leu Pro Ala Asn Pro Asp Asn Thr Leu Pro Phe Leu Ile Gly Asp Lys 65 70 75 80 Gly Arg Val Leu Ala Ser Leu Ser Leu Glu Ala Gly Gly Arg Gly Leu 85 90 95 Ala Tyr Gly Thr Asn Val Leu Thr Gln Leu Ser Gly Thr Asn Ala Ala 100 105 110 His Ala Pro Leu Leu Lys Arg Ala Val Gln Trp Leu Val Asn Gly Asp 115 120 125 Pro Gly Ala Ala Thr Ala Lys Asp Phe Lys Val Ser Val Val Gly Val 130 135 140 Asp Lys Thr Ala Ala Leu Asn Gly Leu Lys Ser Ala Gly Leu Gln Pro 145 150 155 160 Ala Asp Ala Ala Cys Asn Ala Leu Thr Asp Ala Ser Cys Ala Ser Thr 165 170 175 Ser Lys Leu Leu Val Leu Gly Asn Gly Ala Ser Ala Ala Ser Leu Ser 180 185 190 Ala Thr Val Arg Ala Arg Leu Gln Ala Gly Leu Pro Ile Leu Phe Val 195 200 205 His Thr Asn Gly Trp Asn Gln Ser Ser Thr Gly Gln Gln Ile Leu Ala 210 215 220 Gly Leu Gly Leu Gln Glu Gly Pro Tyr Gly Gly Asn Tyr Trp Asp Lys 225 230 235 240 Asp Arg Val Pro Ser Ser Arg Thr Arg Thr Arg Ser Val Glu Leu Gly 245 250 255 Gly Ala Tyr Gly Gln Asp Pro Ala Leu Val Gln Gln Ile Val Asp Gly 260 265 270 Ser Trp Arg Thr Asp Tyr Asp Trp Ser Lys Cys Thr Ser Tyr Val Gly 275 280 285 Arg Thr Thr Cys Asp Asp Val Pro Gly Leu Ser Asp Phe Ser Lys Arg 290 295 300 Val Asp Val Leu Lys Gly Ala Leu Asp Ala Tyr Asn Gln Lys Ala Gln 305 310 315 320 Asn Leu Phe Ala Leu Pro Gly Thr Thr Ser Leu Arg Leu Trp Leu Leu 325 330 335 Trp Ala Asp Ala Val Arg Gln Asn Ile Arg Tyr Pro Met Asp Lys Ala 340 345 350 Ala Asp Thr Ala Arg Phe Gln Glu Thr Phe Val Ala Asp Ala Ile Val 355 360 365 Gly Tyr Val Arg Glu Ala Gly Ala Ala Gln Lys Glu Leu Gly Ser Tyr 370 375 380 Ala Gly Gln Arg Gln Gln Ser Met Pro Val Ser Gly Ser Glu Glu Thr 385 390 395 400 Leu Thr Leu Thr Leu Pro Ser Ala Gln Gly Phe Thr Ala Ile Gly Arg 405 410 415 Met Ala Ala Pro Gly Lys Arg Leu Ser Ile Arg Ile Glu Asp Ala Gly 420 425 430 Gln Ala Ser Leu Ala Val Gly Leu Asn Thr Gln Arg Ile Gly Ser Thr 435 440 445 Arg Leu Trp Asn Thr Arg Gln Tyr Asp Arg Pro Arg Phe Leu Lys Ser 450 455 460 Pro Asp Ile Lys Leu Gln Ala Asn Gln Ser Val Ala Leu Val Ser Pro 465 470 475 480 Tyr Gly Gly Leu Leu Gln Leu Val Tyr Ser Gly Ala Thr Pro Gly Gln 485 490 495 Thr Val Thr Val Lys Val Thr Gly Ala Ala Ser Gln Pro Phe Leu Asp 500 505 510 Ile Gln Pro Gly Glu Asp Ser Ser Gln Ala Ile Ala Asp Phe Ile Gln 515 520 525 Ala Leu Asp Ala Asp Lys Ala Asp Trp Leu Glu Ile Arg Ser Gly Ser 530 535 540 Val Glu Val His Ala Lys Val Glu Lys Val Arg Gly Ser Ile Asp Lys 545 550 555 560 Asp Tyr Gly Gly Asp Val Gln Arg Phe Ile Arg Glu Leu Asn Glu Val 565 570 575 Phe Ile Asp Asp Ala Tyr Thr Leu Ala Gly Phe Ala Ile Pro Asn Gln 580 585 590 Ala Lys Thr Pro Ala Ile Gln Gln Glu Cys Ala Ala Arg Gly Trp Asp 595 600 605 Cys Asp Ser Glu Thr Leu His Lys Leu Pro Gly Thr Gln His Ile Asn 610 615 620 Val Asp Gln Tyr Ala Gln Cys Gly Gly Gly Cys Ser Gly Asn Pro Tyr 625 630 635 640 Asp Gln Thr Trp Gly Leu Asn Pro Arg Gly Trp Gly Glu Ser Ala Ala 645 650 655 Leu Gly His Asn Leu Gln Val Asn Arg Leu Lys Val Tyr Gly Gly Arg 660 665 670 Ser Gly Glu Ile Ser Asn Gln Ile Phe Pro Leu His Lys Asp Trp Arg 675 680 685 Val Leu Arg Glu Phe Gly Gln Asn Leu Asp Asp Thr Arg Val Asn Tyr 690 695 700 Arg Asn Ala Tyr Asn Leu Ile Val Ala Gly Arg Ala Glu Ala Asp Pro 705 710 715 720 Leu Ala Gly Val Tyr Lys Arg Leu Trp Glu Asp Pro Gly Thr Tyr Ala 725 730 735 Leu Asn Gly Glu Arg Met Ala Phe Tyr Thr Gln Trp Val His Tyr Trp 740 745 750 Ala Asp Leu Lys Asn Asp Pro Leu Gln Gly Trp Asp Ile Trp Thr Leu 755 760 765 Leu Tyr Leu His Gln Arg Gln Val Asp Lys Ser Asp Trp Asp Ala Asn 770 775 780 Lys Ala Ala Leu Gly Tyr Gly Thr Tyr Ala Gln Arg Pro Gly Asn Ser 785 790 795 800 Gly Asp Ala Ser Ser Thr Asp Gly Asn Asp Asn Leu Leu Leu Gly Leu 805 810 815 Ser Trp Leu Thr Gln Arg Asp Gln Arg Pro Thr Phe Ala Leu Trp Gly 820 825 830 Ile Arg Thr Ser Ala Ala Ala Gln Ala Gln Val Ala Ala Tyr Gly Phe 835 840 845 Ala Glu Gln Pro Ala Phe Phe Tyr Ala Asn Asn Arg Thr Asn Glu Tyr 850 855 860 Ser Thr Val Lys Leu Leu Asp Met Ser Gln Gly Ser Pro Ala Trp Pro 865 870 875 880 Phe Pro <210> 36 <211> 536 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide capable of binding to O-glycans but lack or has reduced O-glycoprotein-specific endoprotease activity - Bacteroides thetaiotaomicron VPI-5482 (double mutant with removed signal and other immature sequences) <400> 36 Asp Lys Trp Glu Lys Glu Phe Arg Ile Arg Ser Tyr Glu Pro Tyr Ser 1 5 10 15 Asn Ile Ala Glu Trp Ala Asp Lys Leu Met Thr Lys Lys Tyr Ser Asp 20 25 30 Leu Asp Asn Pro Thr Gly Ile Ser Val Lys Ala Gly Asp Asp Ile Ile 35 40 45 Val Leu Val Gly Asp Thr Tyr Gly Gln Asn Ile Ser Met Gln Cys Ile 50 55 60 Trp Glu Thr Gly Thr Glu Tyr Lys Gln Thr Ala Ser Ser Gly Asp Val 65 70 75 80 Tyr Met Leu Asn Pro Gly Val Asn Lys Leu Thr Met Lys Gly Glu Gly 85 90 95 Gln Leu Phe Val Met Tyr Asn Thr Glu Leu Thr Ser Asn Thr Ala Lys 100 105 110 Pro Ile Lys Ile His Ile Pro Leu Gly Ser Gly Thr Val Asn Gly Phe 115 120 125 Phe Asp Leu Lys Glu His Lys Thr Asp Glu Lys Tyr Ala Glu Leu Leu 130 135 140 Lys Lys Ser Thr His Lys Tyr Phe Cys Ile Arg Gly Glu Lys Ile Met 145 150 155 160 Phe Tyr Phe His Arg Asn Lys Leu Leu Glu Tyr Val Pro Asn Asn Ile 165 170 175 Leu Ser Ala Ile His Leu Trp Asp Asn Ile Val Gly Trp Gln Gln Glu 180 185 190 Leu Met Gly Ile Asp Asp Val Arg Pro Ser Gln Val Asn Asn His Leu 195 200 205 Phe Ala Ile Ser Pro Glu Gly Ser Tyr Met Trp Ala Ser Asp Tyr Gln 210 215 220 Ile Gly Phe Val Tyr Thr Tyr Leu Gly Asn Ile Leu Leu Glu Asp Asn 225 230 235 240 Val Met Ala Ala Glu Asp Asn Ala Trp Gly Pro Ala Ala Ala Ile Gly 245 250 255 His Val His Gln Ala Ala Ile Asn Trp Ala Ser Ser Thr Glu Ser Ser 260 265 270 Asn Asn Leu Phe Ser Asn Phe Ile Ile Tyr Lys Leu Gly Lys Tyr Lys 275 280 285 Ser Arg Gly Asn Gly Leu Gly Ser Val Ala Thr Ala Arg Tyr Ala Asn 290 295 300 Gly Gln Ala Trp Tyr Asn Met Gly Asp Ala Thr His Gln Asn Glu Asp 305 310 315 320 Thr Glu Thr His Met Arg Met Asn Trp Gln Leu Trp Ile Tyr Tyr His 325 330 335 Arg Cys Glu Tyr Lys Thr Asp Phe Trp Gln Thr Leu Phe Lys Leu Met 340 345 350 Arg Glu Val Asn Met Thr Glu Gly Glu Asp Pro Gly Lys Lys Gln Leu 355 360 365 Glu Phe Ala Lys Met Ala Ser Lys Ala Ala Asn Gln Asn Leu Thr Asp 370 375 380 Phe Phe Glu Met Trp Gly Phe Phe Glu Pro Val Asn Thr Thr Ile Glu 385 390 395 400 Gln Tyr Gly Thr Tyr Lys Tyr Tyr Val Ser Asp Ala Met Ile Arg Glu 405 410 415 Ala Lys Glu Tyr Met Ala Gln Phe Pro Ala Pro Lys His Ala Phe Gln 420 425 430 Tyr Ile Glu Asp Arg Lys Lys Ser Glu Phe Pro Ser Asn Asp Tyr Arg 435 440 445 Tyr Ser Ala Val Gly Asp Val Gly Tyr Tyr Thr Gln Phe Lys Glu Asn 450 455 460 Gln Lys Ile Thr Lys Ala Ile Thr Ala Glu Leu Ala Gly Arg Lys Val 465 470 475 480 Ser Ile Gln Asn Gly Asp Glu Ala Val Ala Phe Glu Leu Arg Glu Asn 485 490 495 Asp Glu Asn Gly Lys Leu Leu Tyr Phe Ser Thr Phe Thr Thr Phe Glu 500 505 510 Ile Pro Ser Ser Ile Leu Met Val Asn Ala Lys Leu Tyr Ala Val Gln 515 520 525 Ala Asp Gly Lys Arg Ile Leu Leu 530 535 <210> 37 <211> 507 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide capable of binding to O-glycans but lack or has reduced O-glycoprotein-specific endoprotease activity - Clostridium perfringens (double mutant with removed signal and other immature sequences) <400> 37 Val Leu Glu Leu Glu Met Arg Gly Asp Ser Ile Ser Glu Ala Lys Lys 1 5 10 15 Arg Lys Val Trp Asn Phe Gln Asp Trp Gln Ile Thr Gly Leu Ser Ala 20 25 30 Arg Ala Gly Asp Lys Ile Thr Val Tyr Val Asp Val Ala Glu Gly Asp 35 40 45 Pro Thr Pro Thr Leu Leu Tyr Lys Gln Ser Leu Thr Gln His Gly Gly 50 55 60 Ala Thr Ser Phe Gln Leu Lys Pro Gly Lys Asn Glu Ile Thr Ile Pro 65 70 75 80 Glu Ile Asn Tyr Glu Ser Asn Gly Ile Pro Lys Asp Val Ile Gln Gly 85 90 95 Gly Asp Leu Phe Phe Thr Asn Tyr Lys Ser Asp Ser Gln Lys Arg Ala 100 105 110 Pro Lys Val Arg Ile Glu Gly Ala Ser Lys Tyr Pro Val Phe Ile Leu 115 120 125 Gly Lys Ser Asp Glu Asn Glu Val Met Lys Glu Leu Glu Ala Tyr Val 130 135 140 Glu Lys Ile Lys Ala Glu Pro Lys Thr Thr Pro Asn Ile Phe Ala Val 145 150 155 160 Ser Ser Asn Lys Ser Leu Glu Phe Val Gln Ala Thr Tyr Ala Leu Asp 165 170 175 Trp Tyr Lys Lys Asn Asn Lys Thr Pro Lys Tyr Thr Ala Glu Gln Trp 180 185 190 Asp Gln Tyr Ile Ala Asp Ala Met Gly Phe Trp Gly Phe Asp Asn Ser 195 200 205 Lys Asp Val Asn Ser Asp Phe Asn Phe Arg Ile Met Pro Met Val Lys 210 215 220 Asn Leu Ser Gly Gly Ala Phe Met Asn Ala Gly Asn Gly Val Ile Gly 225 230 235 240 Ile Arg Pro Gly Asn Gln Asp Ala Ile Leu Ala Ala Asn Lys Gly Trp 245 250 255 Gly Val Ala Ala Ala Leu Gly His Asn Phe Asp Thr Gly Gly Arg Thr 260 265 270 Ile Val Glu Val Thr Asn Asn Met Met Pro Leu Phe Phe Glu Ser Lys 275 280 285 Tyr Lys Thr Lys Thr Arg Ile Thr Asp Gln Asn Ile Trp Glu Asn Asn 290 295 300 Thr Tyr Pro Lys Val Gly Leu Asp Asp Tyr Ser Asn Asn Glu Leu Tyr 305 310 315 320 Asn Lys Ala Asp Ser Thr His Leu Ala Gln Leu Ala Pro Leu Trp Gln 325 330 335 Leu Tyr Leu Tyr Asp Asn Thr Phe Tyr Gly Lys Phe Glu Arg Gln Phe 340 345 350 Arg Glu Arg Asp Phe Gly Asn Lys Asn Arg Glu Asp Ile Tyr Lys Ser 355 360 365 Trp Val Val Ala Ala Ser Asp Ala Met Glu Leu Asp Leu Thr Glu Phe 370 375 380 Phe Ala Arg His Gly Ile Arg Val Asp Asp Lys Val Lys Glu Asp Leu 385 390 395 400 Ala Lys Tyr Pro Lys Pro Asp Lys Lys Ile Tyr Tyr Leu Asn Asp Leu 405 410 415 Ala Met Asn Tyr Lys Gly Asp Gly Phe Thr Glu Asn Ala Lys Val Ser 420 425 430 Val Ser Thr Ser Gly Ser Asn Gly Asn Ile Lys Leu Ser Phe Ser Val 435 440 445 Asp Asp Glu Asn Lys Asp Asn Ile Leu Gly Tyr Glu Ile Arg Arg Asp 450 455 460 Gly Lys Tyr Val Gly Phe Thr Ser Asn Asp Ser Phe Val Asp Thr Lys 465 470 475 480 Ser Asn Leu Asp Glu Asp Gly Val Tyr Val Val Thr Pro Tyr Asp Arg 485 490 495 Lys Leu Asn Thr Leu Asn Pro Ile Glu Val Asn 500 505 <210> 38 <211> 892 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide capable of binding to O-glycans but lack or has reduced O-glycoprotein-specific endoprotease activity - Pseudomonas aeruginosa PAO1 (double mutant with removed signal sequence, with N-term Met, C-term linker/tag) <400> 38 Met Ala Thr Gln Glu Glu Ile Leu Asp Ala Ala Leu Val Ser Gly Asp 1 5 10 15 Ser Ser Gln Leu Thr Asp Ser His Leu Val Ala Leu Arg Leu Gln Gln 20 25 30 Gln Val Glu Arg Ile Arg Gln Thr Arg Thr Gln Leu Leu Asp Gly Leu 35 40 45 Tyr Gln Asn Leu Ser Gln Ala Tyr Asp Pro Gly Ala Ala Ser Met Trp 50 55 60 Val Leu Pro Ala Asn Pro Asp Asn Thr Leu Pro Phe Leu Ile Gly Asp 65 70 75 80 Lys Gly Arg Val Leu Ala Ser Leu Ser Leu Glu Ala Gly Gly Arg Gly 85 90 95 Leu Ala Tyr Gly Thr Asn Val Leu Thr Gln Leu Ser Gly Thr Asn Ala 100 105 110 Ala His Ala Pro Leu Leu Lys Arg Ala Val Gln Trp Leu Val Asn Gly 115 120 125 Asp Pro Gly Ala Ala Thr Ala Lys Asp Phe Lys Val Ser Val Val Gly 130 135 140 Val Asp Lys Thr Ala Ala Leu Asn Gly Leu Lys Ser Ala Gly Leu Gln 145 150 155 160 Pro Ala Asp Ala Ala Cys Asn Ala Leu Thr Asp Ala Ser Cys Ala Ser 165 170 175 Thr Ser Lys Leu Leu Val Leu Gly Asn Gly Ala Ser Ala Ala Ser Leu 180 185 190 Ser Ala Thr Val Arg Ala Arg Leu Gln Ala Gly Leu Pro Ile Leu Phe 195 200 205 Val His Thr Asn Gly Trp Asn Gln Ser Ser Thr Gly Gln Gln Ile Leu 210 215 220 Ala Gly Leu Gly Leu Gln Glu Gly Pro Tyr Gly Gly Asn Tyr Trp Asp 225 230 235 240 Lys Asp Arg Val Pro Ser Ser Arg Thr Arg Thr Arg Ser Val Glu Leu 245 250 255 Gly Gly Ala Tyr Gly Gln Asp Pro Ala Leu Val Gln Gln Ile Val Asp 260 265 270 Gly Ser Trp Arg Thr Asp Tyr Asp Trp Ser Lys Cys Thr Ser Tyr Val 275 280 285 Gly Arg Thr Thr Cys Asp Asp Val Pro Gly Leu Ser Asp Phe Ser Lys 290 295 300 Arg Val Asp Val Leu Lys Gly Ala Leu Asp Ala Tyr Asn Gln Lys Ala 305 310 315 320 Gln Asn Leu Phe Ala Leu Pro Gly Thr Thr Ser Leu Arg Leu Trp Leu 325 330 335 Leu Trp Ala Asp Ala Val Arg Gln Asn Ile Arg Tyr Pro Met Asp Lys 340 345 350 Ala Ala Asp Thr Ala Arg Phe Gln Glu Thr Phe Val Ala Asp Ala Ile 355 360 365 Val Gly Tyr Val Arg Glu Ala Gly Ala Ala Gln Lys Glu Leu Gly Ser 370 375 380 Tyr Ala Gly Gln Arg Gln Gln Ser Met Pro Val Ser Gly Ser Glu Glu 385 390 395 400 Thr Leu Thr Leu Thr Leu Pro Ser Ala Gln Gly Phe Thr Ala Ile Gly 405 410 415 Arg Met Ala Ala Pro Gly Lys Arg Leu Ser Ile Arg Ile Glu Asp Ala 420 425 430 Gly Gln Ala Ser Leu Ala Val Gly Leu Asn Thr Gln Arg Ile Gly Ser 435 440 445 Thr Arg Leu Trp Asn Thr Arg Gln Tyr Asp Arg Pro Arg Phe Leu Lys 450 455 460 Ser Pro Asp Ile Lys Leu Gln Ala Asn Gln Ser Val Ala Leu Val Ser 465 470 475 480 Pro Tyr Gly Gly Leu Leu Gln Leu Val Tyr Ser Gly Ala Thr Pro Gly 485 490 495 Gln Thr Val Thr Val Lys Val Thr Gly Ala Ala Ser Gln Pro Phe Leu 500 505 510 Asp Ile Gln Pro Gly Glu Asp Ser Ser Gln Ala Ile Ala Asp Phe Ile 515 520 525 Gln Ala Leu Asp Ala Asp Lys Ala Asp Trp Leu Glu Ile Arg Ser Gly 530 535 540 Ser Val Glu Val His Ala Lys Val Glu Lys Val Arg Gly Ser Ile Asp 545 550 555 560 Lys Asp Tyr Gly Gly Asp Val Gln Arg Phe Ile Arg Glu Leu Asn Glu 565 570 575 Val Phe Ile Asp Asp Ala Tyr Thr Leu Ala Gly Phe Ala Ile Pro Asn 580 585 590 Gln Ala Lys Thr Pro Ala Ile Gln Gln Glu Cys Ala Ala Arg Gly Trp 595 600 605 Asp Cys Asp Ser Glu Thr Leu His Lys Leu Pro Gly Thr Gln His Ile 610 615 620 Asn Val Asp Gln Tyr Ala Gln Cys Gly Gly Gly Cys Ser Gly Asn Pro 625 630 635 640 Tyr Asp Gln Thr Trp Gly Leu Asn Pro Arg Gly Trp Gly Glu Ser Ala 645 650 655 Ala Leu Gly His Asn Leu Gln Val Asn Arg Leu Lys Val Tyr Gly Gly 660 665 670 Arg Ser Gly Glu Ile Ser Asn Gln Ile Phe Pro Leu His Lys Asp Trp 675 680 685 Arg Val Leu Arg Glu Phe Gly Gln Asn Leu Asp Asp Thr Arg Val Asn 690 695 700 Tyr Arg Asn Ala Tyr Asn Leu Ile Val Ala Gly Arg Ala Glu Ala Asp 705 710 715 720 Pro Leu Ala Gly Val Tyr Lys Arg Leu Trp Glu Asp Pro Gly Thr Tyr 725 730 735 Ala Leu Asn Gly Glu Arg Met Ala Phe Tyr Thr Gln Trp Val His Tyr 740 745 750 Trp Ala Asp Leu Lys Asn Asp Pro Leu Gln Gly Trp Asp Ile Trp Thr 755 760 765 Leu Leu Tyr Leu His Gln Arg Gln Val Asp Lys Ser Asp Trp Asp Ala 770 775 780 Asn Lys Ala Ala Leu Gly Tyr Gly Thr Tyr Ala Gln Arg Pro Gly Asn 785 790 795 800 Ser Gly Asp Ala Ser Ser Thr Asp Gly Asn Asp Asn Leu Leu Leu Gly 805 810 815 Leu Ser Trp Leu Thr Gln Arg Asp Gln Arg Pro Thr Phe Ala Leu Trp 820 825 830 Gly Ile Arg Thr Ser Ala Ala Ala Gln Ala Gln Val Ala Ala Tyr Gly 835 840 845 Phe Ala Glu Gln Pro Ala Phe Phe Tyr Ala Asn Asn Arg Thr Asn Glu 850 855 860 Tyr Ser Thr Val Lys Leu Leu Asp Met Ser Gln Gly Ser Pro Ala Trp 865 870 875 880 Pro Phe Pro Gly Ser Gly His His His His His His 885 890 <210> 39 <211> 546 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide capable of binding to O-glycans but lack or has reduced O-glycoprotein-specific endoprotease activity - Bacteroides thetaiotaomicron VPI-5482 (double mutant with removed signal and other sequences from immature protein, with N-term <400> 39 Met Asp Lys Trp Glu Lys Glu Phe Arg Ile Arg Ser Tyr Glu Pro Tyr 1 5 10 15 Ser Asn Ile Ala Glu Trp Ala Asp Lys Leu Met Thr Lys Lys Tyr Ser 20 25 30 Asp Leu Asp Asn Pro Thr Gly Ile Ser Val Lys Ala Gly Asp Asp Ile 35 40 45 Ile Val Leu Val Gly Asp Thr Tyr Gly Gln Asn Ile Ser Met Gln Cys 50 55 60 Ile Trp Glu Thr Gly Thr Glu Tyr Lys Gln Thr Ala Ser Ser Gly Asp 65 70 75 80 Val Tyr Met Leu Asn Pro Gly Val Asn Lys Leu Thr Met Lys Gly Glu 85 90 95 Gly Gln Leu Phe Val Met Tyr Asn Thr Glu Leu Thr Ser Asn Thr Ala 100 105 110 Lys Pro Ile Lys Ile His Ile Pro Leu Gly Ser Gly Thr Val Asn Gly 115 120 125 Phe Phe Asp Leu Lys Glu His Lys Thr Asp Glu Lys Tyr Ala Glu Leu 130 135 140 Leu Lys Lys Ser Thr His Lys Tyr Phe Cys Ile Arg Gly Glu Lys Ile 145 150 155 160 Met Phe Tyr Phe His Arg Asn Lys Leu Leu Glu Tyr Val Pro Asn Asn 165 170 175 Ile Leu Ser Ala Ile His Leu Trp Asp Asn Ile Val Gly Trp Gln Gln 180 185 190 Glu Leu Met Gly Ile Asp Asp Val Arg Pro Ser Gln Val Asn Asn His 195 200 205 Leu Phe Ala Ile Ser Pro Glu Gly Ser Tyr Met Trp Ala Ser Asp Tyr 210 215 220 Gln Ile Gly Phe Val Tyr Thr Tyr Leu Gly Asn Ile Leu Leu Glu Asp 225 230 235 240 Asn Val Met Ala Ala Glu Asp Asn Ala Trp Gly Pro Ala Ala Ala Ile 245 250 255 Gly His Val His Gln Ala Ala Ile Asn Trp Ala Ser Ser Thr Glu Ser 260 265 270 Ser Asn Asn Leu Phe Ser Asn Phe Ile Ile Tyr Lys Leu Gly Lys Tyr 275 280 285 Lys Ser Arg Gly Asn Gly Leu Gly Ser Val Ala Thr Ala Arg Tyr Ala 290 295 300 Asn Gly Gln Ala Trp Tyr Asn Met Gly Asp Ala Thr His Gln Asn Glu 305 310 315 320 Asp Thr Glu Thr His Met Arg Met Asn Trp Gln Leu Trp Ile Tyr Tyr 325 330 335 His Arg Cys Glu Tyr Lys Thr Asp Phe Trp Gln Thr Leu Phe Lys Leu 340 345 350 Met Arg Glu Val Asn Met Thr Glu Gly Glu Asp Pro Gly Lys Lys Gln 355 360 365 Leu Glu Phe Ala Lys Met Ala Ser Lys Ala Ala Asn Gln Asn Leu Thr 370 375 380 Asp Phe Phe Glu Met Trp Gly Phe Phe Glu Pro Val Asn Thr Thr Ile 385 390 395 400 Glu Gln Tyr Gly Thr Tyr Lys Tyr Tyr Val Ser Asp Ala Met Ile Arg 405 410 415 Glu Ala Lys Glu Tyr Met Ala Gln Phe Pro Ala Pro Lys His Ala Phe 420 425 430 Gln Tyr Ile Glu Asp Arg Lys Lys Ser Glu Phe Pro Ser Asn Asp Tyr 435 440 445 Arg Tyr Ser Ala Val Gly Asp Val Gly Tyr Tyr Thr Gln Phe Lys Glu 450 455 460 Asn Gln Lys Ile Thr Lys Ala Ile Thr Ala Glu Leu Ala Gly Arg Lys 465 470 475 480 Val Ser Ile Gln Asn Gly Asp Glu Ala Val Ala Phe Glu Leu Arg Glu 485 490 495 Asn Asp Glu Asn Gly Lys Leu Leu Tyr Phe Ser Thr Phe Thr Thr Phe 500 505 510 Glu Ile Pro Ser Ser Ile Leu Met Val Asn Ala Lys Leu Tyr Ala Val 515 520 525 Gln Ala Asp Gly Lys Arg Ile Leu Leu Gly Ser Gly His His His His 530 535 540 His His 545 <210> 40 <211> 517 <212> PRT <213> Artificial Sequence <220> <223> Polypeptide capable of binding to O-glycans but lack or has reduced O-glycoprotein-specific endoprotease activity - Clostridium perfringens (double mutant with removed signal and other sequences from immature protein, with N-term Met, C-term <400> 40 Met Val Leu Glu Leu Glu Met Arg Gly Asp Ser Ile Ser Glu Ala Lys 1 5 10 15 Lys Arg Lys Val Trp Asn Phe Gln Asp Trp Gln Ile Thr Gly Leu Ser 20 25 30 Ala Arg Ala Gly Asp Lys Ile Thr Val Tyr Val Asp Val Ala Glu Gly 35 40 45 Asp Pro Thr Pro Thr Leu Leu Tyr Lys Gln Ser Leu Thr Gln His Gly 50 55 60 Gly Ala Thr Ser Phe Gln Leu Lys Pro Gly Lys Asn Glu Ile Thr Ile 65 70 75 80 Pro Glu Ile Asn Tyr Glu Ser Asn Gly Ile Pro Lys Asp Val Ile Gln 85 90 95 Gly Gly Asp Leu Phe Phe Thr Asn Tyr Lys Ser Asp Ser Gln Lys Arg 100 105 110 Ala Pro Lys Val Arg Ile Glu Gly Ala Ser Lys Tyr Pro Val Phe Ile 115 120 125 Leu Gly Lys Ser Asp Glu Asn Glu Val Met Lys Glu Leu Glu Ala Tyr 130 135 140 Val Glu Lys Ile Lys Ala Glu Pro Lys Thr Thr Pro Asn Ile Phe Ala 145 150 155 160 Val Ser Ser Asn Lys Ser Leu Glu Phe Val Gln Ala Thr Tyr Ala Leu 165 170 175 Asp Trp Tyr Lys Lys Asn Asn Lys Thr Pro Lys Tyr Thr Ala Glu Gln 180 185 190 Trp Asp Gln Tyr Ile Ala Asp Ala Met Gly Phe Trp Gly Phe Asp Asn 195 200 205 Ser Lys Asp Val Asn Ser Asp Phe Asn Phe Arg Ile Met Pro Met Val 210 215 220 Lys Asn Leu Ser Gly Gly Ala Phe Met Asn Ala Gly Asn Gly Val Ile 225 230 235 240 Gly Ile Arg Pro Gly Asn Gln Asp Ala Ile Leu Ala Ala Asn Lys Gly 245 250 255 Trp Gly Val Ala Ala Ala Leu Gly His Asn Phe Asp Thr Gly Gly Arg 260 265 270 Thr Ile Val Glu Val Thr Asn Asn Met Met Pro Leu Phe Phe Glu Ser 275 280 285 Lys Tyr Lys Thr Lys Thr Arg Ile Thr Asp Gln Asn Ile Trp Glu Asn 290 295 300 Asn Thr Tyr Pro Lys Val Gly Leu Asp Asp Tyr Ser Asn Asn Glu Leu 305 310 315 320 Tyr Asn Lys Ala Asp Ser Thr His Leu Ala Gln Leu Ala Pro Leu Trp 325 330 335 Gln Leu Tyr Leu Tyr Asp Asn Thr Phe Tyr Gly Lys Phe Glu Arg Gln 340 345 350 Phe Arg Glu Arg Asp Phe Gly Asn Lys Asn Arg Glu Asp Ile Tyr Lys 355 360 365 Ser Trp Val Val Ala Ala Ser Asp Ala Met Glu Leu Asp Leu Thr Glu 370 375 380 Phe Phe Ala Arg His Gly Ile Arg Val Asp Asp Lys Val Lys Glu Asp 385 390 395 400 Leu Ala Lys Tyr Pro Lys Pro Asp Lys Lys Ile Tyr Tyr Leu Asn Asp 405 410 415 Leu Ala Met Asn Tyr Lys Gly Asp Gly Phe Thr Glu Asn Ala Lys Val 420 425 430 Ser Val Ser Thr Ser Gly Ser Asn Gly Asn Ile Lys Leu Ser Phe Ser 435 440 445 Val Asp Asp Glu Asn Lys Asp Asn Ile Leu Gly Tyr Glu Ile Arg Arg 450 455 460 Asp Gly Lys Tyr Val Gly Phe Thr Ser Asn Asp Ser Phe Val Asp Thr 465 470 475 480 Lys Ser Asn Leu Asp Glu Asp Gly Val Tyr Val Val Thr Pro Tyr Asp 485 490 495 Arg Lys Leu Asn Thr Leu Asn Pro Ile Glu Val Asn Gly Ser Gly His 500 505 510 His His His His His 515 <210> 41 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Metalloprotease motif <400> 41 His Glu Leu Gly His 1 5 <210> 42 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Metalloprotease motif <400> 42 His Glu Ile Gly His 1 5 <210> 43 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Metalloprotease motif <400> 43 Gly Val Ala His Glu Leu Gly His Asn Phe 1 5 10 <210> 44 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> disrupted metalloprotease motif <400> 44 His Ala Leu Gly His 1 5 <210> 45 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> disrupted metalloprotease motif <400> 45 Ala Glu Leu Gly His 1 5 <210> 46 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> disrupted metalloprotease motif <400> 46 Ala Ala Leu Gly His 1 5 <210> 47 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> glycodrosocin peptide with O-gly site on the T <400> 47 Gly Lys Pro Arg Pro Tyr Ser Pro Arg Pro Thr Ser His Pro Arg Pro 1 5 10 15 Ile Arg Val <210> 48 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Non-O-glycosylated peptide <400> 48 Tyr Ile Tyr Gly Ser Phe Lys 1 5 <210> 49 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Non-O-glycosylated peptide <400> 49 Lys Lys Leu Val Phe Phe Ala 1 5 <210> 50 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Non-O-glycosylated peptide <400> 50 Phe Leu Pro Leu Ile Leu Gly Lys Leu Val Lys Gly Leu Leu 1 5 10

Claims

O-글리코실화된 단백질에 대해 특이적인 엔도프로테아제 활성을 갖는 폴리펩티드를 포함하는 조성물로서, 상기 폴리텝티드는 다음을 포함하는 조성물:
(a) 서열번호 1의 아미노산 서열
(b) 서열번호 1의 아미노산 서열과 적어도 90% 동일한 아미노산 서열 또는
(c) 서열번호 1의 서열의 단편인 아미노산 서열 또는 서열번호 1의 아미노산 서열과 90% 동일한 아미노산 서열의 단편,
상기 서열번호 1의 아미노산 서열과 적어도 90% 동일한 아미노산 서열, 또는 이의 단편은 모티프 HEbbH를 포함하며, 여기서, b는 비하전 아미노산이고; 및
상기 조성물은 시알리다제 Am1757, 또는 Am1757 및 Am0707의 혼합물을 추가적으로 포함하며, 상기 Am1757은 서열번호 9 내지 11 중 어느 하나의 폴리펩티드이고, Am0707은 서열번호 12 내지 14 중 어느 하나의 폴리펩티드임.
제1항에 있어서, 상기 (a) 모티프 HEbbH 내의 b는 A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W이고; 및/또는
(b) HEbbH는 서열번호 1의 위치 181 내지 185에 상응하는 위치에서 상기 폴리펩티드에 존재하는 것인, 조성물.
제2항에 있어서, 상기 모티프가 서열 HEIGH 또는 HELGH을 포함하는 조성물.
제1항에 있어서, 상기 폴리펩티드는 모티프 abxHEbbHbc를 포함하고 여기서,
(a) a는 아미노산 V, T 또는 G이고;
(b) b는
(i) 비하전 아미노산 또는
(ii) A, C, F, G, I, L, M, N, P, Q, S, T, V 또는 W이고,
(c) x는 임의의 아미노산이고; 및
(d) c는
(iii) 소수성 아미노산 또는
(iv) A, C, F, I, L, M, P, V, W 또는 Y이고, 및/또는
(e) 상기 모티프가 서열 GMAHELGHGL 또는 GVAHELGHNF을 포함하는 것인, 조성물.
제1항에 있어서, 상기 폴리펩티드는
(a) N 말단에 추가의 메티오닌 및/또는 C 말단에 His 태그를 포함하고, 상기 태그는 링커에 의해 C 말단에 결합될 수 있고,
(b) 서열번호 2의 아미노산 서열을 포함하거나 이로 이루어지고;
(c) 용액, 동결건조, 또는 고정화되어 제공되고, 및/또는
(d) 상기 Am1757는 서열번호 11로 이루어지고/지거나 Am0707은 서열번호 14로 이루어지는 것인, 조성물.
O-글리코실화된 단백질에 대해 특이적인 엔도프로테아제 활성을 갖는 폴리펩티드를 포함하는 조합물로서, 상기 폴리텝티드는 다음을 포함하는 조합물:
(a) 서열번호 1의 아미노산 서열
(b) 서열번호 1의 아미노산 서열과 적어도 90% 동일한 아미노산 서열 또는
(c) 서열번호 1의 서열의 단편인 아미노산 서열 또는 서열번호 1의 아미노산 서열과 90% 동일한 아미노산 서열의 단편,
상기 서열번호 1의 아미노산 서열과 적어도 90% 동일한 아미노산 서열, 또는 이의 단편은 모티프 HEbbH를 포함하며, 여기서, b는 비하전 아미노산이고; 및
상기 조합물은 시알리다제 Am1757, 또는 Am1757 및 Am0707의 혼합물을 추가적으로 포함하며, 상기 Am1757은 서열번호 9 내지 11 중 어느 하나의 폴리펩티드이고, Am0707은 서열번호 12 내지 14 중 어느 하나의 폴리펩티드임.
O-글리코실화된 단백질에 대해 특이적인 엔도프로테아제 활성을 갖는 폴리펩티드를 포함하는 키트로서, 상기 폴리텝티드는 다음을 포함하는 키트:
(a) 서열번호 1의 아미노산 서열
(b) 서열번호 1의 아미노산 서열과 적어도 90% 동일한 아미노산 서열 또는
(c) 서열번호 1의 서열의 단편인 아미노산 서열 또는 서열번호 1의 아미노산 서열과 90% 동일한 아미노산 서열의 단편,
상기 서열번호 1의 아미노산 서열과 적어도 90% 동일한 아미노산 서열, 또는 이의 단편은 모티프 HEbbH를 포함하며, 여기서, b는 비하전 아미노산이고; 및
상기 키트는 시알리다제 Am1757, 또는 Am1757 및 Am0707의 혼합물을 추가적으로 포함하며, 상기 Am1757은 서열번호 9 내지 11 중 어느 하나의 폴리펩티드이고, Am0707은 서열번호 12 내지 14 중 어느 하나의 폴리펩티드임.
O-당단백질의 가수분해 방법으로서, 상기 방법은 O-당단백질을 포함하는 샘플을 제1항에 따른 조성물과 접촉시켜, O-당단백질을 가수 분해하는 단계를 포함하는 방법.
단백질의 글리코실화 상태를 평가하는 방법으로서, 단백질을 포함하는 샘플을 제1항에 따른 조성물과 접촉시키는 단계 및/또는 생성된 산물을 검출 및/또는 분석하는 단계를 포함하는 방법.
제8항에 있어서, 산물은 검출 또는 분석되며, 상기 분석 또는 검출이 친화성 크로마토그래피, SDS-PAGE, HPLC 또는 질량 분석법에 의해 수행되는 것인, 방법.
제9항에 있어서, 여기에서
(a) 분석 및/또는 검출이 친화성 크로마토그래피, SDS-PAGE, HPLC 또는 질량 분석법에 의해 수행되고;
(b) 절단 생성물의 존재 또는 부재가 샘플 중의 O-당단백질의 존재 또는 부재를 결정하기 위해 사용되며;
(c) 분석이 O-글리칸 쇄의 유형을 식별하기 위해 수행되며; 및/또는
(d) 분석이 O-당단백질에 대한 O-글리칸 쇄의 부착 위치를 식별하기 위해 수행되는 것인, 방법.
O-글리칸 또는 O-당단백질에 결합할 수 있고 O-글리코실화된 단백질에 특이적인 엔도프로테아제 활성이 없거나 감소된 폴리펩티드로서, 서열번호 5 또는 서열번호 20의 아미노산 서열을 포함하는 폴리펩티드를 포함하는 조성물로서, 상기 조성물은 시알리다제 Am1757, 또는 Am1757 및 Am0707의 혼합물을 추가적으로 포함하며, 상기 Am1757은 서열번호 9 내지 11 중 어느 하나의 폴리펩티드이고, Am0707은 서열번호 12 내지 14 중 어느 하나의 폴리펩티드인, 조성물.
제12항에 있어서, 상기 폴리펩티드는
(a) N 말단에 추가의 메티오닌을 포함하고/하거나 C 말단에 His 태그를 포함하고, 상기 태그는 링커에 의해 C 말단에 결합될 수 있고,
(b) 서열번호 6 또는 21의 아미노산 서열을 포함하거나 이로 이루어지고; 및/또는
(c) 용액, 동결건조, 또는 고정화되어 제공되는 것인, 조성물.
O-글리칸 또는 O-당단백질에 결합할 수 있고 O-글리코실화된 단백질에 특이적인 엔도프로테아제 활성이 없거나 감소된 폴리펩티드로서, 서열번호 5 또는 서열번호 20의 아미노산 서열을 포함하는 폴리펩티드를 포함하는 조합물로서, 상기 조합물은 시알리다제 Am1757, 또는 Am1757 및 Am0707의 혼합물을 추가적으로 포함하며, 상기 Am1757은 서열번호 9 내지 11 중 어느 하나의 폴리펩티드이고, Am0707은 서열번호 12 내지 14 중 어느 하나의 폴리펩티드인, 조합물.
O-글리칸 또는 O-당단백질에 결합할 수 있고 O-글리코실화된 단백질에 특이적인 엔도프로테아제 활성이 없거나 감소된 폴리펩티드로서, 서열번호 5 또는 서열번호 20의 아미노산 서열을 포함하는 폴리펩티드를 포함하는 키트로서, 상기 키트는 시알리다제 Am1757, 또는 Am1757 및 Am0707의 혼합물을 추가적으로 포함하며, 상기 Am1757은 서열번호 9 내지 11 중 어느 하나의 폴리펩티드이고, Am0707은 서열번호 12 내지 14 중 어느 하나의 폴리펩티드인, 키트.
O-글리칸, O-글리코펩티드 및/또는 O-당단백질에 대한 결합 방법으로서, 상기 방법은 O-글리칸, O-글리코펩티드 및/또는 O-당단백질을 포함하는 샘플을 제12항에 따른 조성물과 접촉시키는 단계를 포함하는 방법.
제16항에 있어서, 상기 방법은 다음 단계를 포함하는 것인 방법으로서,
(a) O-글리칸, O-글리코펩티드 및/또는 O-당단백질이 결합되었는지 여부를 결정하는 단계; 및/또는
(b) 생성된 혼합물로부터 O-글리칸 및 임의의 연결된 당단백질, O-글리코펩티드 또는 O-당단백질을 분리하는 단계;를 포함하고,
상기 방법은 샘플로부터 O-글리칸 또는 연결된 당단백질, O-글리코펩티드 또는 O-당단백질을 단리하기 위한 목적인 것인, 방법.
제17항에 있어서,
(a) 상기 결정 및/또는 분리 단계가 친화성 크로마토그래피, SDS-PAGE, HPLC, 렉틴 블롯팅, ELISA 또는 질량 분석법에 의해 수행되고; 및/또는
(b) 다음을 포함하는 완충액으로 제12항의 조성물의 폴리펩티드로부터 결합된 물질을 용리하는 단계를 추가로 포함하는 방법:
(i) 고 몰 농도의 우레아;
(ii) 고농도의 세제; 또는
(iii) O-글리코실화된 단백질에 대해 특이적인 엔도프로테아제 활성을 갖는 폴리펩티드로서, 상기 폴리텝티드는 서열번호 1의 아미노산 서열; 서열번호 1의 아미노산 서열과 적어도 90% 동일한 아미노산 서열; 또는 서열번호 1의 서열의 단편인 아미노산 서열 또는 서열번호 1의 아미노산 서열과 90% 동일한 아미노산 서열의 단편을 포함하고, 상기 서열번호 1의 아미노산 서열과 적어도 90% 동일한 아미노산 서열, 또는 이의 단편은 모티프 HEbbH를 포함하며, 여기서, b는 비하전 아미노산임.
단백질을 포함하는 샘플을 제12항에 따른 조성물과 접촉시키는 단계 및 단백질이 상기 조성물의 폴리펩티드에 의해 결합되었는지 여부를 결정하는 단계를 포함하는, 단백질의 글리코실화 상태를 평가하기 위한 방법.
제19항에 있어서,
(a) 상기 결정 단계가 친화성 크로마토그래피, SDS-PAGE, HPLC, 렉틴 블롯팅, ELISA 또는 질량 분석법에 의해 수행되고; 및/또는
(b) 다음을 포함하는 완충액으로 제12항의 조성물의 폴리펩티드로부터 결합된 물질을 용리하는 단계를 추가로 포함하는 방법:
(i) 고 몰 농도의 우레아;
(ii) 고농도의 세제; 또는
(iii) O-글리코실화된 단백질에 대해 특이적인 엔도프로테아제 활성을 갖는 폴리펩티드로서, 상기 폴리텝티드는 서열번호 1의 아미노산 서열; 서열번호 1의 아미노산 서열과 적어도 90% 동일한 아미노산 서열; 또는 서열번호 1의 서열의 단편인 아미노산 서열 또는 서열번호 1의 아미노산 서열과 90% 동일한 아미노산 서열의 단편을 포함하고, 상기 서열번호 1의 아미노산 서열과 적어도 90% 동일한 아미노산 서열, 또는 이의 단편은 모티프 HEbbH를 포함하며, 여기서, b는 비하전 아미노산임.
샘플을 제12항에 따른 조성물과 접촉시켜 O-글리코펩티드 및/또는 O-당단백질 및 상기 제12항에 따른 조성물의 폴리펩티드 사이에 복합체를 형성하도록 하는 단계를 포함하는, 샘플에서 O-글리코펩티드 및/또는 O-당단백질을 검출하는 방법.
제21항에 있어서, 상기 방법은 다음 단계를 포함하는 것인, 방법:
(a) 접촉된 샘플로부터 폴리펩티드를 분리하는 단계;
(b) 분리된 폴리펩티드가 O-연결 당단백질 또는 글리코펩티드에 부착되었는지 여부를 결정하여 샘플에서 O-연결 글리코펩티드 또는 당단백질의 존재 또는 부재를 결정하는 단계; 및/또는
(c) 다음을 포함하는 완충액으로 제12항의 조성물의 폴리펩티드로부터 결합된 물질을 용리하는 단계:
(i) 고 몰 농도의 우레아;
(ii) 고농도의 세제; 또는
(iii) O-글리코실화된 단백질에 대해 특이적인 엔도프로테아제 활성을 갖는 폴리펩티드로서, 상기 폴리텝티드는 서열번호 1의 아미노산 서열; 서열번호 1의 아미노산 서열과 적어도 90% 동일한 아미노산 서열; 또는 서열번호 1의 서열의 단편인 아미노산 서열 또는 서열번호 1의 아미노산 서열과 90% 동일한 아미노산 서열의 단편을 포함하고, 상기 서열번호 1의 아미노산 서열과 적어도 90% 동일한 아미노산 서열, 또는 이의 단편이 모티프 HEbbH를 포함하며, 여기서, b는 비하전 아미노산이고;
상기 결정 및/또는 분리 단계가 친화성 크로마토그래피, SDS-PAGE, HPLC, 렉틴 블롯팅, ELISA 또는 질량 분석법에 의해 수행됨.