KR20170030648A - 베타-(1,4)-n-아세틸갈락토오스아미닐트랜스퍼라아제, 또는 이의 돌연변이체를 이용한 당 단백질의 변형 방법 - Google Patents

베타-(1,4)-n-아세틸갈락토오스아미닐트랜스퍼라아제, 또는 이의 돌연변이체를 이용한 당 단백질의 변형 방법 Download PDF

Info

Publication number
KR20170030648A
KR20170030648A KR1020177006055A KR20177006055A KR20170030648A KR 20170030648 A KR20170030648 A KR 20170030648A KR 1020177006055 A KR1020177006055 A KR 1020177006055A KR 20177006055 A KR20177006055 A KR 20177006055A KR 20170030648 A KR20170030648 A KR 20170030648A
Authority
KR
South Korea
Prior art keywords
group
leu
seq
ser
arg
Prior art date
Application number
KR1020177006055A
Other languages
English (en)
Inventor
안나 아그니에스카 바지엘
플로리스 루이스 반 델프트
산더 세바스티안 반 베르켈
Original Assignee
시나픽스 비.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 시나픽스 비.브이. filed Critical 시나픽스 비.브이.
Publication of KR20170030648A publication Critical patent/KR20170030648A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/005Glycopeptides, glycoproteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/06Pyrimidine radicals
    • C07H19/10Pyrimidine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/32Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against translation products of oncogenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01038Beta-N-acetylglucosaminylglycopeptide beta-1,4-galactosyltransferase (2.4.1.38)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01092(N-acetylneuraminyl)-galactosylglucosylceramide N-acetylgalactosaminyltransferase (2.4.1.92)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/24Immunoglobulins specific features characterized by taxonomic origin containing regions, domains or residues from different species, e.g. chimeric, humanized or veneered
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/40Immunoglobulins specific features characterized by post-translational modification
    • C07K2317/41Glycosylation, sialylation, or fucosylation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Oncology (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

본 발명은 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제 또는 이의 돌연변이를 이용한 당 단백질의 변형방법에 관한 것이다. 상기 방법은 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제 또는 이의 돌연변이의 존재하에, 말단 GlcNAc 부를 포함하는 글리칸을 포함하는 당 단백질을 비-천연 당 유도체 뉴클레오타이드와 접촉시키는 단계를 포함한다. 상기 비-천연 당 유도체 뉴클레오타이드는 화학식 (3)에 따른다.
Figure pct00038

상기 식에서, A는 -N3; -C(O)R3; -C=C-R4; -SH; -SC(O)R8; -SC(V)OR8(여기서, V는 O 또는 S임); -X(여기서, X는 F, Cl, Br 및 I로 구성되는 그룹으로부터 선택됨); -OS(O)2R5; 선택적으로 치환된 C2-C24 알킬기; 선택적으로 치환된 말단 C2-C24 알케닐기; 및 선택적으로 치환된 말단 C3-C24 알케닐기로 구성되는 그룹으로부터 선택된다.

Description

베타-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제, 또는 이의 돌연변이체를 이용한 당 단백질의 변형 방법{PROCESS FOR THE MODIFICATION OF A GLYCOPROTEIN USING A BETA-(1,4)-N-ACETYLGALACTOSAMINYLTRANSFERASE OR A MUTANT THEREOF}
본 발명은 당 단백질의 효소적 변형 방법에 관한 것이다. 보다 구체적으로, 본 발명은 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제, 또는 이의 돌연변이체를 이용하여 당 유도체 뉴클레오타이드로 당 단백질을 변형시키는 방법, 및 그 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제 돌연변이체에 관한 것이다.
글리코실트랜스퍼라아제는 당 단백질 및 당지질 상에 존재하는 복합 탄수화물의 합성에 관여하는 효소의 상과(superfamily)를 구성한다. 글리코실트랜스퍼라아제의 기본적인 역할은 뉴클레오타이드 유도체의 글리코실 부(glycosyl moiety)를 특정 당 억셉터로 전달하는 것이다. β-1,4-갈락토실트랜스퍼라아제(β4Gal-Ts)(EC 2.4.1.38)는 UDP-Gal로부터 갈락토오스(Gal)를 다른 당 억셉터로 전달하는 것을 촉매하는 적어도 7가지의 멤버들 Gal-T1 내지 Gal-T7을 포함하는 글리코실트랜스퍼라아제 상과의 아과(subfamily) 중 하나를 구성한다. 말단 GlcNAc 잔기 상에서 갈락토오스 트랜스퍼라아제로부터 생성되는 공통 모티프는 락토사민 서열 Galβ4GlcNAc-R(LacNAc 또는 LN)이며, 이는 후속적으로 다른 당 및 설페이트기의 첨가에 의해 다양한 방식으로 변형된다. 멤브레인 글리코컨주게이트의 가장 일반적이며 중요한 당 구조는 단백질(또는 지질)과 연결되어있는 폴리-N-아세틸락토사민(poly-LN)이며 세포 커뮤니케이션, 부착 및 신호 전달에 중요한 역할을 하며 면역 반응의 조절에 중요한 분자이다.
척추 동물과 무척추 동물의 글리코컨주게이트에서 발견되는 또 다른 공통 말단 모티프는 GalNAcβ4GlcNAc-R(LacdiNAc 또는 LDN) 서열이다. LDN 모티프는 말단 GalNAc 잔기가 4-O-설페이트화 되고 내피 세포 Man/S4GGnM 억셉터에 의한 제거를 위한 인식 마커로서 기능하는 포유류 뇌하수체 당 단백질 호르몬에서 발생한다. 그러나, 뇌하수체가 아닌 포유동물 당 단백질에는 LDN 결정 인자가 또한 포함되어 있다. 또한, LDN 및 LDN 서열의 변형은 다수의 기생선충 및 흡충류에서 일반적인 항원 결정인자이다. LDN의 생합성은 매우 특이적인 GalNAc-트랜스퍼라아제에 의해 수행되는 과정인 GalNAc의 말단 GlcNAc으로의 이동을 포함한다. 예를 들어, 참고문헌으로 편입된 Miller et al . J. Biol . Chem . 2008, 283, p. 1985에는, 두 가지의 밀접히 관련된 β1,4-N-아세틸갈락토오스아미닐트랜스퍼라아제인 β4GalNAc-T3와 β4GalNAc-T4가, 당 단백질 황체 형성 호르몬(LH)과 카보닉 안하이드라아제-6(CA6)을 포함하는 다수의 당 단백질 상의 Asn-결합된 올리고당에 대한 β1,4-결합된 GalNAc의 단백질-특이적 첨가를 설명하는 것으로 생각된다고 보고되어 있다.
β-(1,4)-아세틸갈락토오스아미닐트랜스퍼라아제(β-(1,4)-GalNAcTs)는 인간, 캐노헵디티스 엘레간스(Caenorhabditis elegans)(Kawar et al ., J. Biol . Chem . 2002, 277, 34924, 참고문헌으로 편입됨), 드로조필라 멜라노개스터(Drosophila melanogaster)(Hoskins et al ., Science 2007, 316, 1625, 참고문헌으로 편입됨) 및 트리코플러스아 니(Trichoplusia ni)(Vadaie et al ., J. Biol . Chem . 2004, 279, 33501, 참고문헌으로 편입됨)를 포함하는 광범위한 생물체에서 확인되었다.
결국, N-당 단백질 변형에 관여하는 GalTs와 GalNAcT 이외에, UDP-N-아세틸갈락토오스아민:폴리펩타이드 N-아세틸갈락토오스아미닐트랜스퍼라아제(ppGalNAcTs라고도 함)라고 불리는 비-관련 부류의 효소가 뮤신-타입 결합(GalNAc-α-1-O-Ser/Thr)의 생합을 담당한다. 이 효소들은 GalNAc를 당 도너 UDP-GalNAc에서 세린 및 트레오닌 잔기로 전달하여 O-당 단백질에서 전형적으로 알파 아노메릭 결합을 형성한다. 외견상 ppGalNAcTs 촉매 기능의 단순성에도 불구하고, 인 실리코(in silico) 분석에 기초하여 24개의 독특한 ppGalNAcTs 인간 유전자만이 존재하는 것으로 추정된다. O-결합된 글리코실화가 단계적으로 진행되기 때문에, 세린 또는 트레오닌에 GalNAc를 첨가하는 것은 뮤신(mucin) 생합성에서 최초로 행해진 단계를 나타낸다. 외견상 이러한 단순성에도 불구하고, 다수의 ppGalNAcTs 패밀리 멤버가 이들의 단백질 기질을 완전히 글리코실화 하는데 필요한 것으로 보인다.
β-1,4-갈락토실트랜스퍼라아제 1(β4Gal-T1)은 이의 천연 기질인 UDP-Gal 외에, 광범위한 비-천연적인 갈락토오스 유도체를 억셉터 GlcNAc 기질에 전달할 수 있는 것으로 나타났다. 특히, Ramakrishnan et al . J. Biol . Chem . 2002, 23, 20833(참고문헌으로 편입됨)에 의해 보고된 바와 같이, 소 β4Gal-T1에서의 Leu289에 대한 Tyr289 잔기의 돌연변이는 2-keto-Gal과 같이 C2에서 화학적 핸들을 수행하는 UDP-Gal 분자를 수용할 수 있는 효소의 촉매 포켓에 캐비티(cavity)를 생성한다. C-2 핸들 상에 옥심 라이게이션이 후속하는 비-천연적인 갈락토오스 부의 첫 번째 전달을 포함하는 2-단계 과정에 의해, 이 돌연변이 효소인 β4GalT(Y289L)는 단백질상의 O-GlcNAc 잔기 또는 정상 및 악성 종양 조직의 세포 표면 글리칸 상에 말단 GlcNAc 부의 존재의 시험 관내 검출에 사용되었다.
예를 들어 Khidekel et al ., J. Am . Chem . Soc . 2003, 125, 16162(참고문헌으로 편입됨)에는 β4GalT(Y289L)로 O-GlcNAc 변형된 단백질에 비-천연 케톤 작용기의 화학 선택적인 장착이 개시되어 있다. 케톤 부는 옥심 라이게이션을 이용하여 바이오틴으로 O-GlcNAc 글리코실화 단백질을 "태깅(tag)"하는 독특한 마커 역할을한다. 일단 바이오티닐화되면, 글리코컨주게이트는 쉽게 양고추냉이 퍼옥시다아제(HRP)에 컨주게이트된 스트렙타비딘을 사용하여 화학발광에 의해 검출될 수 있다.
예를 들어, WO 2007/095506, WO 2008/029281(모두 Invitrogen Corporation), WO 2014/065661(SynAffix B.V.) 및 Clark et al . J. Am . Chem . Soc . 2008, 130, 11576(모두 참고문헌으로 편입됨)은 β4GalT(Y289L) 및 갈락토오스아민의 아지도아세틸 변이체를 사용하여 유사한 접근법을 보고하며, 유사한 성공을 보였다.
또한, 돌연변이 β4GalT(Y289L)는 Zeglis et al., Bioconj . Chem . 2013, 24, 1057(참고문헌으로 편입됨)에서 보고한 바와 같이, 중쇄 글리칸에서 항체의 부위 선택 방사성 표지를 위한 조제용 형태로 가장 최근에 적용되었다. 특히, 아지드-변형된 N-아세틸갈락토오스아민 단당류(GalNAz)를 항체의 글리칸 내로 편입시키는 것은 적절한 킬레이트화제의 클릭 화학 도입 후에 89Zr의 조절된 라벨링을 가능하게 한다.
참고문헌으로 편입된 Ramakrishnan et al . Biochemistry 2004, 43, 12513은 이중 돌연변이 β4GalT(Y289L, M344H)가 Mn2 + 의존성 활성의 98%를 잃지만, 그럼에도 불구하고 C-2 변형된 갈락토오스 기질을 전달하는 능력을 포함하여 Mg2 + 존재하에 25-30% 활성을 나타내는 것을 기술하고 있다. 이중 돌연변이 β4GalT(Y289L, M344H)는 5-10mM Mn2 +의 전형적인 요구가 세포에 대한 잠재적인 세포 독성 효과를 갖는 것으로 알려져 있기 때문에 시험 관내 갈락토실화 분석에 유용하다는 것이 밝혀졌다.
참고문헌으로 편입된 Mercer et al ., Bioconj . Chem . 2013, 24, 144는 Mg2 +의 존재하에 이중 돌연변이 Y289L-M344H-β4Gal-T1 효소가 GalNAc 및 유사 당을 억셉터 GlcNAc로 전달하는 것을 기술하고 있다.
현재까지 C-2 개질된 GalNAc 전달을 위해 와일드 타입 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제(β-(1,4)-GalNAcT라고도 함)를 사용하려는 시도는 거의 성공하지 못했다.
참고문헌으로 편입된 Bertozzi et al . ACS Chem . Biol . 2009, 4, 1068은 살아있는 C. 엘레간스(C. elegans)에서 뮤신-타입 O-글리칸의 분자 이미징을 위한 생물직교(bioorthogonal) 화학적 리포터 기술을 적용하였다. 벌레는 N-아세틸갈락토오스아민(GalNAz)의 아지도-당 변이체로 처리되어 이 비-천연 당의 생체 내 편입을 가능하게 하였다. GalNAz의 당 단백질로의 대사 편입이 관찰되었지만, C. 엘레간스(C. elegans) 용해물의 콘드로이티나아제 ABC 및 펩타이드 N-글리코시다제 F(PNGase F) 모두의 다이제션 후, 포스파인-플래그 태그를 사용한 스타우딩거(Staudinger) 라이게이션 및 α-Flag 항체를 이용한 웨스턴 블롯팅에 의한 당 단백질의 프로빙은, 당 단백질의 GalNAz 잔기의 대부분이 N-글리칸과 다른 타입의 글리칸에 위치함을 나타내었다. 또한, N-글리칸 특이 렉틴 콘카나발린 A(ConA)에 대한 아지드-표지된 당 단백질의 검출 가능한 바인딩은 관찰되지 않았으며, 이는 대다수의 표지된 글리칸이 O-연결이며 N-연결되지 않는다는 가설과 일치한다. 이러한 관찰에 기초하여, GalNAz는이 유기체에서 N-GlcNAcylated 단백질에 대사적으로 편입되지 않는다고 결론 지을 수 있다.
참고문헌으로 편입된 Burnham-Marusich et al . Plos One 2012, 7, e49020에 의해 유사한 결론이 가장 최근에 도출되었으며, 여기서 PNGAse 처리시 신호 감소의 결여(N-당 단백질에서의 GalNAz의 명백한 편입을 나타내지 않음)가 또한 관찰되었다. Burnham-Marusich et al .은 대사적으로 표지된 당 단백질을 검출하기 위해 말단 알킨-프로브와 아지도-표지된 당 단백질의 Cu(I)-촉매 아지드-알킨 시클로첨가 반응을 이용한 연구를 기술하고 있다. 결과는 대부분의 GalNAz 표지가 pNGase F에 민감하지 않은 글리칸 클래스에 편입되어 N-당 단백질이 아닌 것으로 나타났다.
UDP-GalNAc에 대한 β-(1,4)-GalNAcT의 높은 기질 특이성은, 참고문헌으로 편입된 Kawar et al ., J. Biol . Chem . 2002, 277, 34924에 보고된 바와 같이, UDP-GlcNAc, UDP-Glc 및 UDP-Gal에 대해 단지 각각, 0.7%, 0.2% 및 1%의 트랜스퍼라아제 활성이 잔류하는 빈약한 인식으로부터 명백해진다.
상기에 기초하여, 당 단백질의 변형에 대한 시험관 내 방법이 2-케토 또는 2-아지도아세틸 유도체와 같은 비-천연 GalNAc 유도체의 GalNAc-트랜스퍼라아제에 의해 보고되지 않았다는 것은 놀라운 일이 아니다.
참고문헌으로 편입된 Taron et al ., Carbohydr . Res . 2012, 362, 62는 GPI-앵커에서의 GalNAz의 생체 내 대사성 편입을 기술한다.
발명의 개요
본 발명은 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제 또는 이의 돌연변이의 존재하에, 말단 GlcNAc 부를 포함하는 글리칸을 포함하는 당 단백질을 당 유도체 뉴클레오타이드 Su(A)-Nuc와 접촉시키는 단계를 포함하는, 당 단백질의 변형 방법에 관한 것으로, 여기서:
(i) 말단 GlcNAc 부를 포함하는 글리칸은 화학식 (1) 또는 (2)에 따르며:
Figure pct00001
상기 식에서:
b는 0 또는 1이며;
d는 0 또는 1이며;
e는 0 또는 1이며; 그리고
G는 단당류, 또는 2 내지 20 당 부를 포함하는 선형 또는 분지형 올리고당이며; 그리고
(ii) 당 유도체 뉴클레오타이드 Su(A)-Nuc는 화학식 (3)에 따르며:
Figure pct00002
여기서:
a는 0 또는 1이며;
Nuc는 뉴클레오타이드이며;
U는 [C(R1)2]n 또는 [C(R1)2]pO-[C(R1)2C(R1)2O]o-[C(R1)2]q이며, 여기서 n은 0 내지 24 범위의 정수이고; o는 0 내지 12 범위의 정수이고; p 및 q는 독립적으로 0, 1 또는 2이고; 그리고 R1은 H, F, Cl, Br, I 및 선택적으로 치환된 C1-C24 알킬기로 구성된 그룹으로부터 독립적으로 선택되고; T는 C3-C12(헤테로)아릴렌기이고, 여기서 (헤테로)아릴렌기는 선택적으로 치환되며; 그리고
A는 하기로 구성되는 그룹으로부터 선택된다:
(a) -N3
(b) -C(O)R3
여기서 R3은 선택적으로 치환된 C1-C24 알킬기이고;
(c) -C≡C-R4
여기서 R4는 수소 또는 선택적으로 치환된 C1-C24 알킬기이고;
(d) -SH
(e) -SC(O)R8
여기서 R8은 선택적으로 치환된 C1-C24 알킬기이고;
(f) -SC(V)OR8
여기서 V는 O 또는 S이고, R8은 선택적으로 치환된 C1-C24 알킬기이고;
(g) -X
여기서 X는 F, Cl, Br 및 I로 구성된 그룹으로부터 선택되고;
(h) -OS(O)2R5
여기서 R5는 C1-C24 알킬기, C6-C24 아릴기, C7-C24 알킬아릴기 및 C7-C24 아릴알킬기로 구성된 그룹으로부터 선택되고, 알킬기, 아릴기, 알킬아릴기 및 아릴알킬기는 선택적으로 치환되며;
(i) R11
여기서 R11은 선택적으로 치환된 C2-C24 알킬기이며;
(j) R12
여기서 R12는 선택적으로 치환된 말단 C2-C24 알케닐기이며; 그리고
(k) R13
여기서 R13은 선택적으로 치환된 말단 C3-C24 알케닐기이다.
다른 견지로, 본 발명은 본 발명에 따른 방법에 사용하기에 적절한 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제 돌연변이에 관한 것이다.
도 1에, 본 발명에 따른 방법에 의해 변형될 수 있는 말단 GlcNAc 부를 포함하는 글리칸을 포함하는 당 단백질의 예를 나타낸다.
도 2에, 당 단백질이 항체인 당 단백질의 변형 방법의 일 구현이 도시되어 있다. 이 구현에서, 당 유도체 Su(A)-Nuc는 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제의 작용하에 항체 글리칸의 말단 GlcNAc-부에 부착되어 변형된 항체를 형성한다.
도 3은 항체 글리칸 G0, G1, G2, G0F, G1F 및 G2F의 서로 다른 글리코폼들을 나타낸다.
도 4는 글리코폼 G0, G1, G2, G0F, G1F 및 G2F의 혼합물을 시알리다아제 및 갈락토시다아제로 처리하여 화학식 (27)에 따른 글리칸을 포함하는 당 단백질을 제공하는 방법, 및 글리코폼 G0, G1, G2, G0F, G1F 및 G2F의 혼합물을 엔도글리코시다아제로 처리하여 화학식 (1)에 따른 글리 칸을 포함하는 당 단백질을 제공하는 방법을 나타낸다. 화학식 (27) 또는 (1)에 따른 글리칸을 포함하는 당 단백질의 아지도-변형된 UDP-GalNAc 유도체, UDP-GalNAz를 이용한 인큐베이션은 각각 아지도-변형된 당 단백질 (33) 또는 (32)를 유도한다.
도 5는 CHO에서 일시적 발현 후 다양한 범위의 β-(1,4)-GalNAc-Ts, 크루드의 SDS-PAGE를 나타낸다.
도 6은 다양한 범위의 β-(1,4)-CeGalNAc-T 돌연변이의 비환원성 SDS-PAGE를 나타낸다.
도 7은 R&D 시스템 글리코실트랜스퍼라아제 활성 키트에 의해 검출된, UDP-F2-GalNAz를 GlcNAc로 전달하기위한 β-(1,4)-GalT(Y289L) 돌연변이와 비교하여 다양한 범위의 β-(1,4)-GalNAcTs의 활성 플롯을 나타낸 것이다.
도 8은 R&D 시스템 글리코실트랜스퍼라아제 활성 키트에 의해 검출된, UDP-F2-GalNAz를 GlcNAc로 전달하기위한 다양한 범위의 β-(1,4)-CeGalNAcT 돌연변이 Y257L, Y257M 및 Y257A의 활성 플롯을 나타낸 것이다.
정의
본 명세서 및 청구범위에서 사용된 바와 같이 "포함하는" 동사 및 그 활용형은 비제한적인 의미로 사용되며, 그 단어 뒤에 오는 항목이 포함되지만 구체적으로 언급되지 않은 항목은 제외되지 않는다는 것을 의미한다.
또한, 부정관사 "a" 또는 "an"에 의한 요소에 대한 언급은 문맥에 요소 중 하나만 존재할 것을 분명하게 요구하지 않는 한, 요소 중 하나 이상이 존재할 가능성을 배제하지 않는다. 따라서 부정관사 "a" 또는 "an"은 일반적으로 "적어도 하나"를 의미한다.
비치환된 알킬기는 일반 화학식 CnH2n +1을 가지며 선형 또는 분지형일 수 있다. 비치환된 알킬기는 또한 시클릭 부를 함유할 수 있으며, 따라서 수반되는 일반 화학식 CnH2n -1을 갖는다. 선택적으로, 알킬기는 본 명세서에서 추가로 특정된 하나 이상의 치환기로 치환된다. 알킬기의 예로는 메틸, 에틸, 프로필, 2-프로필, t-부틸, 1-헥실, 1-도데실 등이 포함된다.
아릴기는 6 내지 12개의 탄소 원자를 포함하며, 모노시클릭 및 바이시클릭 구조를 포함할 수 있다. 선택적으로, 아릴기는 본 명세서에서 추가로 특정된 하나 이상의 치환기로 치환될 수 있다. 아릴기의 예는 페닐 및 나프틸이다.
아릴알킬기 및 알킬아릴기는 적어도 7개의 탄소 원자를 포함하며 모노시클릭 및 바이시클릭 구조를 포함할 수 있다. 선택적으로, 아릴알킬기 및 알킬아릴은 본 명세서에서 추가로 특정된 하나 이상의 치환기로 치환될 수 있다. 아릴알킬기는 예를 들어 벤질이다. 알킬아릴기는 예를 들어 4-t-부틸페닐이다.
헤테로아릴기는 적어도 2개의 탄소 원자(즉, 적어도 C2) 및 하나 이상의 헤테로원자 N, O, P 또는 S를 포함한다. 헤테로 아릴기는 모노시클릭 또는 바이시클릭 구조를 가질 수 있다. 선택적으로, 헤테로아릴기는 본 명세서에서 추가로 특정된 하나 이상의 치환기로 치환될 수 있다. 적절한 헤테로아릴기의 예는 피리딜, 퀴 놀리닐, 피리미디닐, 피라지닐, 피라졸릴, 이미다졸릴, 티아졸릴, 피롤릴, 퓨라닐, 트리아졸릴, 벤조퓨라닐, 인돌릴, 퓨리닐, 벤즈옥사졸릴, 티에닐, 포스포릴 및 옥사졸릴을 포함한다.
헤테로아릴알킬기 및 알킬헤테로아릴기는 적어도 3개의 탄소 원자(즉, 적어도 C3)를 포함하며, 모노시클릭 및 바이시클릭 구조를 포함할 수 있다. 선택적으로, 헤테로아릴기는 본 명세서에서 추가로 특정된 하나 이상의 치환기로 치환될 수 있다.
아릴기가 (헤테로)아릴기로 표시되는 경우, 그 표기는 아릴기 및 헤테로아릴기를 포함하는 것을 의미한다. 유사하게, 알킬(헤테로)아릴기는 알킬아릴기 및 알킬헤테로아릴기를 포함하고, (헤테로)아릴알킬은 아릴알킬기 및 헤테로아릴알킬기를 포함하는 것을 의미한다. 따라서 C2-C24(헤테로)아릴기는 C2-C24헤테로아릴기 및 C6-C24 아릴기를 포함하는 것으로 해석되어야 한다. 유사하게, C3-C24 알킬(헤테로)아릴기는 C7-C24 알킬아릴기 및 C3-C24 알킬헤테로아릴기를 포함하고, C3-C24 (헤테로)아릴알킬은 C7-C24 아릴알킬기 및 C3-C24 헤테로아릴알킬기를 포함하는 것으로 해석되어야 한다.
달린 언급하지 않는 한, 알킬기, 알케닐기, 알켄, 알킨, (헤테로)아릴기, (헤테로)아릴알킬기, 알킬(헤테로)아릴기, 알킬렌기, 알케닐렌기, 시클로알킬렌기, (헤테로)아릴렌기, 알킬(헤테로)아릴렌기, (헤테로)아릴알킬렌기, 알케닐기, 알키닐기, 시클로알킬기, 알콕시기, 알케닐옥시기, (헤테로)아릴옥시기, 알키닐옥시기 및 시클로알킬옥시기는 C1-C12 알킬기, C2-C12 알케닐기, C2-C12 알키닐기, C3-C12 시클로알킬기, C5-C12 시클로알케닐기, C8-C12 시클로알키닐기, C1-C12 알콕시기, C2-C12 알케닐옥시기, C2-C12 알키닐옥시기, C3-C12 시클로알킬옥시기, 할로겐, 아미노기, 옥소 및 실릴기로 구성된 그룹으로부터 독립적으로 선택된 하나 이상의 치환기로 치환될 수 있으며, 여기서 실릴기는 화학식 (R2)3Si-(여기서, R2는 C1-C12 알킬기, C2-C12 알 케닐기, C2-C12 알키닐기, C3-C12 시클로알킬기, C1-C12 알콕시기, C2-C12 알케닐옥시기, C2-C12 알키닐옥시기 및 C3-C12 시클로알킬옥시기이며, 여기서 알킬기, 알케닐기, 알키닐기, 시클로알킬기, 알콕시기, 알케닐옥시기, 알키닐옥시기 및 시클로알킬옥시기는 선택적으로 치환되며, 알킬기, 알콕시기, 시클로알킬기 및 시클로알콕시기는 O, N 및 S로 구성된 그룹으로부터 선택된 하나 이상의 헤테로 원자에 의해 선택적으로 임의로 차단된다.
알키닐기는 탄소-탄소 삼중 결합을 포함한다. 하나의 삼중 결합을 포함하는 비치환된 알키닐기는 일반 화학식 CnH2n -3을 갖는다. 말단 알키닐은 삼중 결합이 탄소 사슬의 말단 위치에 위치하는 알키닐기이다. 선택적으로, 알키닐기는 본 명세서에서 추가로 특정된 하나 이상의 치환기에 의해 치환되고, 그리고/또는 산소, 질소 및 황의 그룹으로부터 선택된 헤테로 원자에 의해 차단된다. 알키닐기의 예는 에티닐, 프로피닐, 부티닐, 옥티닐 등을 포함한다.
시클로알키닐기는 시클릭 알키닐기이다. 1개의 삼중 결합을 포함하는 비치 환 시클로알키닐기는 일반 화학식 CnH2n -5를 갖는다. 선택적으로, 시클로알키닐기는 본 명세서에서 추가로 특정된 하나 이상의 치환기로 치환된다. 시클로알키닐기의 예는 시클로옥티닐이다.
헤테로시클로알키닐기는 산소, 질소 및 황의 그룹으로부터 선택된 헤테로 원자에 의해 차단된 시클로알키닐기이다. 선택적으로, 헤테로시클로알키닐기는 본 명세서에서 추가로 특정된 하나 이상의 치환기로 치환된다. 헤테로시클로알키닐기의 예는 아자시클로옥티닐이다.
(헤테로)아릴기는 아릴기 및 헤테로아릴기를 포함한다. 알킬(헤테로)아릴기는 알킬아릴기 및 알킬헤테로아릴기를 포함한다. (헤테로)아릴알킬기는 아릴알킬기 및 헤테로아릴알킬기를 포함한다. (헤테로)알키닐기는 알키닐기 및 헤테로알키닐기를 포함한다. (헤테로)시클로알키닐기는 시클로알키닐기 및 헤테로시클로알키닐기를 포함한다.
(헤테로)시클로알킨 화합물은 본 명세서에서 (헤테로)시클로알키닐기를 포함하는 화합물로 정의된다.
본 명세서 및 청구범위에 개시된 화합물 중 몇몇은 융합된 (헤테로)시클로알킨 화합물, 즉 (헤테로)시클로알킨 화합물로서 기술될 수 있으며, 여기서 제 2 고리 구조는 (헤테로)시클로알키닐기에 융합, 즉 환화(annulate)된다. 예를 들어, 융합된 (헤테로)시클로옥틴 화합물에서, (헤테로)시클로옥티닐기에 시클로알킬(예를 들어, 시클로프로필) 또는 아렌(예를 들어, 벤젠)이 환화될 수 있다. 융합된 (헤테로)시클로옥틴 화합물의 (헤테로)시클로옥티닐기의 삼중 결합은 3개의 가능한 위치, 즉 시클로옥틴 부의 2, 3 또는 4 위치 중 하나에 위치할 수 있다("IUPAC 명칭 유기 화학", 규칙 A31.2). 본 명세서 및 청구범위에서 어느 융합된 (헤테로)시클로옥틴 화합물의 기재는 시클로옥틴 부의 3개의 개별 구조 이성질체(regioisomers) 모두를 포함하는 것을 의미한다.
용어 "당(sugar)"은 예를 들어 글루코오스(Glc), 갈락토오스(Gal), 만노오스(Man) 및 푸코오스(Fuc)와 같은 단당류를 나타내기 위해 본 명세서에서 사용된다. "당 유도체(sugar derivative)"라는 용어는 단당류 당, 즉 치환기 및/ 또는 작용기를 포함하는 단당류 당의 유도체를 나타내기 위해 사용된다. 당 유도체의 예로는 예를 들어, 글루코사민(GlcNH2), 갈락토오스아민(GalNH2) N-아세틸글루코사민(GlcNAc), N-아세틸갈락토오스아민(GalNAc), N-아세틸뉴라민산(NeuNAc)으로도 칭하여지는 시알산(Sia) 및 N-아세틸뮤라민산(MurNAc), 글루쿠론산(GlcA) 및 이두론산(IdorA)과 같은 아미노당 및 당산을 포함한다.
"뉴클레오타이드(nucleotide)"라는 용어는 일반적인 과학적 의미로 사용된다. 용어 "뉴클레오타이드"는 뉴클레오베이스, 5 탄소당(리보스 또는 2-데옥시리보스) 및 1개, 2개 또는 3개의 포스페이트기로 구성된 분자를 의미한다. 포스페이트기가 없으면, 뉴클레오베이스 및 당은 뉴클레오사이드를 구성한다. 따라서, 뉴클레오타이드는 또한 뉴클레오사이드 모노포스페이트, 뉴클레오사이드 디포스페이트 또는 뉴클레오사이드 트리포스페이트로 불릴 수 있다. 뉴클레오베이스는 아데닌, 구아닌, 시토신, 우라실 또는 티민일 수 있다. 뉴클레오타이드의 예로는 유리딘 디포스페이트(UDP), 구아노신 디포스페이트(GDP), 티미딘 디포스페이트(TDP), 시티딘 디포스페이트(CDP) 및 시티딘 모노포스페이트(CMP)를 포함한다.
"단백질(protein)"이라는 용어는 일반적인 과학적 의미로 사용된다. 여기서 약 10개 이상의 아미노산을 포함하는 폴리펩타이드가 단백질로 간주된다. 단백질은 천연 아미노산뿐만 아니라 비-천연 아미노산도 포함할 수 있다.
용어 "당 단백질(glycoprotein)"은 일반적인 과학적 의미로 사용되며, 단백질에 공유결합된 하나 이상의 단당류 또는 올리고당 사슬("글리칸(glycans)")을 포함하는 단백질을 지칭한다. 글리칸은 예를 들어, 세린, 트레오닌, 티로신, 히드록시리신 또는 히드록시프롤린의 히드록실기와 같이 단백질상의 히드록실기(O-연결된-글리칸)에, 또는 예를 들어, 아스파라긴 또는 아르기닌과 같이 단백질(N-당 단백질)상의 아미드 작용기에, 또는 예를 들어, 트립토판과 같은 단백질(C-당 단백질)상의 탄소에 부착될 수 있다. 당 단백질은 하나 이상의 글리칸을 포함할 수 있고, 하나 이상의 단당류 및 하나 이상의 올리고당 글리칸의 조합을 포함할 수 있으며, N-연결된, O-연결된 및 C-연결된 글리칸의 조합을 포함할 수 있다. 모든 단백질의 50% 이상이 글리코실화의 일부 형태를 가지므로 당 단백질로 인정된다. 당 단백질의 예로는 PSMA(전립선-특이적 멤브레인 항원), CAL(칸디다 안타리티카 리파아제), gp41, gp120, EPO(에리트로포이에틴), 부동 단백질 및 항체를 포함한다.
용어 "글리칸"은 일반적인 과학적 의미로 사용되며 단백질에 연결된 단당류 또는 올리고당 사슬을 의미한다. 따라서, 글리칸이라는 용어는 당 단백질의 탄수화물-파트를 의미한다. 글리칸은 추가의 치환없이 하나의 당의 C-1 탄소를 통해 단백질에 부착되거나(단당류) 또는 하나 이상의 수산기에서 추가로 치환될 수 있다(올리고당). 자연적으로 발생하는 글리칸은 전형적으로 1 내지 약 10개의 당 부를 포함한다. 그러나, 더 긴 사카라이드 사슬이 단백질에 연결될 때, 상기 사카라이드 사슬은 또한 본 명세서에서 글리칸으로 간주된다.
당 단백질의 글리칸은 단당류일 수 있다. 전형적으로, 당 단백질의 단당류 글리칸은 단백질에 공유결합된 단일 N-아세틸글루코사민(GlcNAc), 글루코오스(Glc), 만노오스(Man) 또는 푸코오스(Fuc)로 구성된다.
글리칸은 또한 올리고당일 수 있다. 당 단백질의 올리고당 사슬은 선형 또는 분지형일 수 있다. 올리고당에서, 단백질에 직접 부착된 당을 코어 당이라고 한다. 올리고당에서 단백질에 직접 부착되지 않고 적어도 두 개의 다른 당류에 붙어있는 당을 내부 당(internal sugar)이라고 한다. 올리고당에서, 단백질에 직접적으로 결합하지 않고 하나의 다른 당에 결합한, 즉, 하나 이상의 다른 히드록실에서 당 치환기를 더 이상 함유하지 않는 당을 말단 당이라고 불린다. 의심의 여지를 피하기 위해, 당 단백질의 올리고당에는 단 말단 당이 여러 개 존재할 수 있지만 코어 당은 단 하나만 존재할 수 있다.
글리칸은 O-연결된 글리칸, N-연결된 글리칸 또는 C-연결된 글리칸일 수 있다. O-연결된 글리칸에서, 단당류 또는 올리고당 글리칸은 단백질의 아미노산에서 O-원자에, 전형적으로는 세린(Ser) 또는 트레오닌(Thr)의 히드록실기를 통해 바인딩된다. N-연결된 글리칸에서 단당류 또는 올리고당 글리칸은 아스파라긴(Asn) 또는 아르기닌(Arg)의 측쇄에서 전형적으로 아미드 질소를 통해 단백질의 아미노산에서 N 원자를 통해 단백질에 바인딩된다. C-연결된 글리칸에서 단당류 또는 올리고당 글리칸은 단백질의 아미노산에서 C-원자에, 전형적으로 트립토판(Trp)의 C-원자에 바인딩된다.
단백질에 직접 부착되는 올리고당의 말단을 글리칸의 환원 말단이라고 한다. 올리고당의 다른 말단은 글리칸의 비환원 말단(non-reducing end)이라 불린다.
O-연결된 글리칸의 경우, 다양한 종류의 사슬이 존재한다. 자연적으로 발생하는 O-연결된 글리칸은 전형적으로 다른 GalNAc, 갈락토오스, GlcNAc, 시알산 및/또는 푸코오스, 바람직하게는 갈락토오스, GlcNAc, 시알산 및/또는 푸코오스로 치환된 세린 또는 트레오닌-연결된 α-O-GalNAc 부를 특징으로 한다. 글리칸 치환을 갖는 히드록실화된 아미노산은 단백질 내의 어느 아미노산 서열의 일부일 수 있다.
N-연결된 글리칸의 경우, 다양한 종류의 사슬이 존재한다. 자연적으로 발생하는 N-연결된 글리칸은 전형적으로 아스파라긴 결합된 β-N-GlcNAc 부를 특징으로하며, 다시 4-OH에서 β-GlcNAc로 더 치환되고, 다시 4-OH에서 β-Man으로 더 치환되고 3-OH와 6-OH가 β-Man으로 치환되어 글리칸 펜타사카라이드 Man3GlcNAc2가 생성된다. 코어 GlcNAc 부는 이의 6-OH에서 α-Fuc에 의해 추가로 치환될 수 있다. 펜타사카라이드 Man3GlcNAc2는 거의 모든 N-연결된 당 단백질의 공통적인 올리고당 스캐폴드이며, 이에 한정하는 것은 아니나 Man, GlcNAc, Gal 및 시알산을 포함하는 광범위하게 다양한 다른 치환기를 보유할 수 있다. 그 측쇄상의 글라이신으로 치환된 아스파라긴은 전형적으로 서열 Asn-X-Ser/Thr의 일부이고, X는 프롤린을 제외한 어느 아미노산이고, Ser/Thr은 세린 또는 트레오닌이다.
용어 "항체"는 일반적인 과학적 의미로 사용된다. 항체는 특정 항원을 인식하고 바인딩할 수 있는 면역계에 의해 생성된 단백질이다. 항체는 당 단백질의 예이다. 항체라는 용어는 본 명세서에서 넓은 의미로 사용되며, 특히 모노클로날 항체, 폴리클로날 항체, 다이머, 멀티머, 다 특이성 항체(예를 들어, 이중 특이 항체), 항체 프래그먼트, 이중 및 단일 쇄 항체를 포함한다. 용어 "항체"는 본 명세서 인간 항체, 인간화 항체, 키메릭 항체 및 암 항원에 특이적으로 바인딩하는 항체를 포함하는 것을 의미한다. 용어 "항체"는 전체 항체뿐만 아니라 예를 들어, 분할된 항체의 항체 Fab 프레그먼트, F(ab')2, FV 프레그먼트 또는 Fc 프레그먼트, scFv-Fc 프레그먼트, 미니바디, 디아바디 또는 scFv와 같은 항체의 프레그먼트를 포함하는 것을 의미한다. 또한, 이 용어는 유전적으로 조작된 항체 및 항체의 유도체를 포함한다. 항체, 항체의 프레그먼트 및 유전자 조작된 항체는 당 업계에 공지된 방법에 의해 수득될 수 있다. 적절한 판매 항체는 그 중에 압식시맙(abciximab), 리툭시맙(rituximab), 바실릭시맙(basiliximab), 팔리비주맙(palivizumab), 인플릭시맙(infliximab), 트라스투주맙(trastuzumab), 알럼투주맙(alemtuzumab), 아달리무맙(adalimumab), 토시투모맙-I131(tositumomab-I131), 세툭시맙(cetuximab), 이브리툭시맙 티욱세탄(ibrituximab tiuxetan), 오말리주맙(omalizumab), 베바시주맙(bevacizumab), 나탈리주맙(natalizumab), 라니비주맙(ranibizumab), 파니투무맙(panitumumab), 에컬리주맙(eculizumab), 세톨리주맙 페골(certolizumab pegol), 골리무맙(golimumab), 카나키누맙(canakinumab), 카투막소맙(catumaxomab), 우스테키누맙(ustekinumab), 토실리주맙(tocilizumab), 오파투무맙(ofatumumab), 데노서맙(denosumab), 벨리무맙(belimumab), 이필리무맙(ipilimumab) 및 브렌툭시맙(brentuximab)을 포함한다.
동일성/유사성
본 발명과 관련하여, 단백질 또는 단백질 프래그먼트는 아미노산 서열로 표시된다.
주어진 SEQ ID NO:(SEQ ID NO)에 의해 본 명세서에서 식별되는 각각의 단백질 또는 단백질 프래그먼트 또는 펩타이드 또는 유도된 펩타이드 또는 폴리펩타이드는 개시된 바와 같은 이러한 특정 서열에 한정되지 않는다는 것을 이해해야한다. "서열 동일성(Sequence identity)"은 서열을 비교함으로써 결정된 바와 같이, 2개 이상의 아미노산(폴리펩타이드 또는 단백질) 서열 간의 관계로서 본 명세서에서 정의된다. 당해 기술 분야에서, "동일성(identity)"은 또한 그러한 서열의 스트링(strings) 사이의 일치에 의해 결정되는 경우, 아미노산 서열 사이의 서열 유사성의 정도를 의미한다. 본 명세서에서 달리 명시하지 않는 한, 주어진 SEQ ID NO와의 동일성 또는 유사성은 상기 서열의 전체 길이(즉, 전체 길이 또는 전체로서)에 기초한 동일성 또는 유사성을 의미한다.
2개의 아미노산 서열 사이의 "유사성(Similarity)"은 하나의 폴리펩타이드의 아미노산 서열 및 이의 보존된 아미노산 치환기들을 제 2 폴리펩타이드의 서열과 비교함으로써 결정된다. "동일성(identity)" 및 "유사성(Similarity)"은 이에 한정하는 것은 아니나, Computational Molecular Biology, Lesk, A. M., ed., Oxford University Press, New York, 1988; Biocomputing: Informatics and Genome Projects, Smith, D. W., ed., Academic Press, New York, 1993; Computer Analysis of Sequence Data, Part I, Griffin, A. M., and Griffin, H. G., eds., Humana Press, New Jersey, 1994; Sequence Analysis in Molecular Biology, von Heine, G., Academic Press, 1987; and Sequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991; and Carillo, H., and Lipman, D., SIAM J. Applied Math., 48:1073(1988)에 기술된 것들을 포함하여 공지된 방법에 의해 쉽게 산출될 수 있다.
동일성을 검출하는 바람직한 방법은 테스트된 2개 이상의 서열 사이에서 가장 큰 일치를 제공하도록 설계된다. 동일성 및 유사성을 검출하는 방법은 공개적으로 사용가능한 컴퓨터 프로그램으로 부호처리된다. 두 서열 간의 동일성 및 유사성을 검출하기위한 바람직한 컴퓨터 프로그램 방법은 예를 들어, GCG 프로그램 패키지(Devereux, J., et al ., Nucleic Acids Research 12 (1): 387(1984)), BestFit, BLASTP, BLASTN 및 FASTA(Altschul, S.F. et al ., J. Mol. 215:403-410(1990)를 포함한다. BLAST X 프로그램은 NCBI 및 다른 출처(BLAST Manual, Altschul, S., et al., NCBI NLM NIH Bethesda, MD 20894; Altschul, S., et al . , J. Mol. Biol. 215: 403-410(1990)로부터 공개적으로 이용가능하다. 잘 알려진 스미스 워터만(Smith Waterman) 알고리즘이 또한 동일성을 검출하는데 사용될 수 있다.
폴리펩타이드 서열 비교에 바람직한 파라미터는 하기를 포함한다: 알고리즘: Needleman and Wunsch, J. Mol. Biol. 48:443-453(1970); 비교 매트릭스: BLOSSUM62(Hentikoff and Hentikoff), Proc. Natl. Acad. Sci. USA. 89:10915-10919(1992); 갭 페널티: 12; 및 간격 길이 페널티: 4. 이러한 파라미터와 함께 유용한 프로그램은 위스콘신 매디슨에 있는 Genetics Computer Group의 "Ogap" 프로그램으로 공개적으로 사용가능하다. 앞서 언급한 파라미터는 아미노산 비교를 위한 디폴트 파라미터이다(최종 갭에 대한 패널티가 없음).
선택적으로, 아미노산 유사성의 정도를 검출함에 있어서, 당업자는 당업자에게 명백한 바와 같이, 소위 "보존적" 아미노산 치환을 고려할 수 있다. 보존적 아미노산 치환은 유사한 측쇄를 갖는 잔기의 상호 교환 가능성을 지칭한다. 예를 들어, 지방족 측쇄를 갖는 아미노산 기은 글리신, 알라닌, 발린, 류신 및 이소루신이며; 지방족-히드록실 측쇄를 갖는 아미노산 기은 세린 및 트레오닌이고; 아미드-함유 측쇄를 갖는 아미노산 기은 아스파라긴 및 글루타민이고; 방향족 측쇄를 갖는 아미노산 기은 페닐알라닌, 티로신 및 트립토판이고; 염기성 측쇄를 갖는 아미노산 기은 라이신, 아르기닌 및 히스티딘이며; 그리고, 황-함유 측쇄를 갖는 아미노산 기은 시스테인 및 메티오닌이다. 바람직한 보존적 아미노산 치환 기은 발린-류신-이소류신, 페닐알라닌-티로신, 리신-아르기닌, 알라닌-발린 및 아스파라긴-글루타민이다. 본 명세서에 개시된 아미노산 서열의 치환성 변이체는 개시된 서열에서 적어도 하나 이상의 잔기가 제거되고 다른 잔기가 그 자리에 삽입된 것들이다. 바람직하게, 아미노산 변화는 보존적이다. 자연적으로 발생하는 아미노산의 각각에 대해 바람직한 보존적 치환은 다음과 같다: Ala 대 Ser; Arg 대 Lys; Asn 대 Gln 또는 His; Asp 대 Glu; Cys 대 Ser 또는 Ala; Gln 대 Asn; Glu 대 Asp; Gly 대 Pro; His 대 Asn 또는 Gln; Ile 대 Leu 또는 Val; Leu 대 Ile 또는 Val; Lys 대 Arg; Gln 대 Glu; Met 대 Leu 또는 Ile; Phe 대 Met, Leu 또는 Tyr; Ser 대 Thr; Thr 대 Ser; Trp 대 Tyr 또는 His; Tyr 대 Trp 또는 Phe; 및 Val 대 Ile 또는 Leu.
당 단백질의 변형 방법
본 발명은 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제를 사용하여 변형된 당 단백질을 얻기 위해 당 단백질을 변형시키는 시험관 내(in vitro) 방법에 관한 것이다. 바람직하게, 상기 방법은 시험관 내 방법이다. 특히, 본 발명은, β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제 또는 이의 돌연변이의 존재하에, 보다 구체적으로 이의 작용하에, 말단 GlcNAc 부를 포함하는 글리칸을 포함하는 당 단백질을 당 유도체 뉴클레오타이드 Su(A)-Nuc와 접촉시키는 단계를 포함하는, 당 단백질의 변형 방법에 관한 것으로, 여기서:
(i) 말단 GlcNAc-부를 포함하는 글리칸은 화학식 (1) 또는 (2)에 따르며:
Figure pct00003
여기서:
b는 0 또는 1이며;
d는 0 또는 1이며;
e는 0 또는 1이며; 그리고
G는 단당류, 또는 2 내지 20 당 부를 포함하는 선형 또는 분지형 올리고당이며; 그리고
(ii) 당 유도체 뉴클레오타이드 Su(A)-Nuc는 화학식 (3)에 따르며:
Figure pct00004
상기 식에서:
a는 0 또는 1이며;
Nuc는 뉴클레오타이드이며;
U는 [C(R1)2]n 또는 [C(R1)2]pO-[C(R1)2C(R1)2O]o-[C(R1)2]q이며, 여기서 n은 0 내지 24 범위의 정수이고; o는 0 내지 12 범위의 정수이고; p 및 q는 독립적으로 0, 1 또는 2이고; 그리고 R1은 H, F, Cl, Br, I 및 선택적으로 치환된 C1-C24 알킬기로 구성된 그룹으로부터 독립적으로 선택되고; T는 C3-C12(헤테로)아릴렌기이고, 여기서 (헤테로)아릴렌기는 선택적으로 치환되며; 그리고
A는 하기로 구성되는 그룹으로부터 선택된다:
(a) -N3
(b) -C(O)R3
여기서 R3은 선택적으로 치환된 C1-C24 알킬기이고;
(c) -C≡C-R4
여기서 R4는 수소 또는 선택적으로 치환된 C1-C24 알킬기이고;
(d) -SH
(e) -SC(O)R8
여기서 R8은 선택적으로 치환된 C1-C24 알킬기이고;
(f) -SC(V)OR8
여기서 V는 O 또는 S이고, R8은 선택적으로 치환된 C1-C24 알킬기이고;
(g) -X
여기서 X는 F, Cl, Br 및 I로 구성된 그룹으로부터 선택되고;
(h) -OS(O)2R5
여기서 R5는 C1-C24 알킬기, C6-C24 아릴기, C7-C24 알킬아릴기 및 C7-C24 아릴알킬기로 구성된 그룹으로부터 선택되고, 알킬기, 아릴기, 알킬아릴기 및 아릴알킬기는 선택적으로 치환되며;
(i) R11
여기서 R11은 선택적으로 치환된 C2-C24 알킬기이며;
(j) R12
여기서 R12는 선택적으로 치환된 말단 C2-C24 알케닐기이며; 그리고
(k) R13
여기서 R13은 선택적으로 치환된 말단 C3-C24 알케닐기이다.
상술한 바와 같이, 당 단백질의 변형을 위한 본 발명에 따른 방법은 변형된 당 단백질을 제공한다. 변형된 당 단백질은 본 명세서에서 화학식 (4) 또는 (5)에 따른 글리칸을 포함하는 당 단백질로서 정의된다:
Figure pct00005
여기서:
b, d, e 및 G는 상기 정의한 바와 같으며; 그리고
Su(A)는 화학식 (6)에 따른 당 유도체이며:
Figure pct00006
여기서:
a, U, A 및 T는 상기 정의한 바와 같다.
화학식 (4) 및 (5)에 따른 변형된 당 단백질 글리칸에서 당 유도체 Su(A)의 C1은 β-1,4-O-글리코사이드 결합을 통해 GlcNAc 부의 C4에 부착된다.
당 단백질의 변형 방법은 말단 GlcNAc-부를 포함하는 글리칸을 포함하는 당 단백질을 제공하는 단계를 더 포함할 수 있다. 따라서, 본 발명은 또한
(1) 말단 GlcNAc 부를 포함하는 글리칸을 포함하는 당 단백질을 제공하는 단계로서, 여기서 말단 GlcNAc 부를 포함하는 글리칸은 상기 정의한 화학식 (1) 또는 (2)에 따른 것인, 당 단백질을 제공하는 단계; 및
(2) β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제 또는 이의 돌연변이의 존재하에, 상기 당 단백질을 당 유도체 뉴클레오타이드 Su(A)-Nuc와 접촉시키는 단계로서, 여기서 Su(A)-Nuc는 상기 정의한 화학식 (3)에 따른 것인, 당 단백질을 당 유도체 뉴클레오타이드 Su(A)-Nuc와 접촉시키는 단계
를 포함하는 당 단백질의 변형 방법에 관한 것이다.
β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제, 말단 GlcNAc 부를 포함하는 글리칸을 포함하는 당 단백질, 당 유도체 뉴클레오타이드 Su(A)-Nuc 및 변형된 당 단백질, 및 이의 바람직한 구현들이 하기에 보다 상세히 설명된다.
효소
본 발명에 따른 방법은 말단 GlcNAc 부를 포함하는 글리칸을 포함하는 당 단백질을, β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제 또는 이의 돌연변이의 존재하에, 보다 구체적으로 이의 작용하에, 당 유도체 뉴클레오타이드 Su(A)-Nuc와 접촉시키는 단계를 포함한다. 제 2 견지로, 본 발명은 본 명세서에 기술된 바와 같은 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제의 돌연변이에 관한 것이며, 이는 본 발명에 따른 방법을 수행하도록 특별히 고안된 것이다. β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제의 돌연변이는 자연적으로 발생하는 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제에서 유도된다. β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제는 본 명세서에서 β-(1,4)-GalNAcT 효소, 또는 β-(1,4)-GalNAcT 또는 GalNAcT라고도 불린다. 용어 "β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제 또는 이의 돌연변이"는 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제 또는 이로부터 유도된 글리코실트랜스퍼라아제를 의미한다.
β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제(β-(1,4)-GalNAcTs)는 당해 기술분야에 공지되어있다. 전형적으로, β-(1,4)-GalNAcT는 유리딘 디포스페이트-GalNAc(UDP-GalNAc, GalNAc-UDP라고도 함)로부터, 당 단백질 글리칸의 말단 GlcNAc 부로의 N-아세틸갈락토오스아민(GalNAc) 이동을 촉매하는 효소이며, 여기서 GalNAc 부의 C1은 β-1,4-O-글리코사이드 결합을 통해 GlcNAc 부의 C4에 부착된다. 하기에서 보다 상세히 기술되는 바와 같이, b가 1인 화학식 (1)에 따른 글리칸에서 GlcNAc 부, 즉 푸코실화된 GlcNAc로 구성된 글리칸 중 GlcNAc 부가 또한 본 명세서에서 말단 GlcNAc 부로 간주된다.
본 발명에 따른 방법에서, β-(1,4)-GalNAcT 효소 또는 이의 돌연변이는 당 유도체 뉴클레오타이드 Su(A)-Nuc로부터 당 단백질 글리칸의 말단 GlcNAs로의 당 유도체 Su(A)의 전달을 촉매하며, 여기서 Su(A)는 화학식 (6)에 따르며, Su(A)-Nuc는 화학식 (3)에 따르면, 그리고 말단 GlcNAc-부를 포함하는 글리칸은 상기한 바와 같이 화학식 (1) 또는 (2)에 따른다. 이 방법에서, Su(A) 부의 Cl은 β-1,4-O-글리코사이드 결합을 통해 GlcNAc 부의 C4에 부착된다.
바람직하게, 본 발명의 방법에서 사용되는 β-(1,4)-GalNAcT 효소는 무척추 동물 β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유래된 것으로, 즉 무척추 동물 종에서 유래된 β-(1,4)-GalNAcT 또는 이로부터 유도된 것이다. β-(1,4)-GalNAcT 효소는 당업자에게 공지된 어느 무척추 동물 β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유도되거나 유도될 수 있다. 바람직하게, β-(1,4)-GalNAcT 효소는 네마토다(Nematoda)의 문(phylum)(바람직하게는 크로마도레아(Chromadorea) 또는 세케르넨테아(Secernentea)의 부류, 또는 아르트로포다(Arthropoda)의 문, 바람직하게는 인섹타(Insecta)의 부류로부터 유래한 β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유래된다. 바람직하게, β-(1,4)-GalNAcT 효소는 카에노르하브디티스 엘레간스(Caenorhabditis elegans), 카에노르하브디티스 레마네이(Caenorhabditis remanei), 카에노르바브디티스 브리그사에(Caenorhabditis briggsae), 아스카리스 숨(Ascaris suum), 트리코플러시아 니(Trichoplusia ni), 드로소필라 멜라노가스터(Drosophila melanogaster), 우체레리아 반크로프티(Wuchereria bancrofti ), 로아 로아(Loa loa ), 세라파키스 비로이(Cerapachys biroi ), 주타몹시스 네바덴시스(Zootermopsis nevadensis ), 캄포노터스 플로리다너스(Camponotus floridanus ), 크라소스트레아 기가스(Crassostrea gigas ) 또는 다나우스 플렉시퍼스(Danaus plexippus), 바람직하게 카에노르하브디티스 엘레간스(Caenorhabditis elegans), 아스카리스 숨(Ascaris suum), 트리코플러시아 니(Trichoplusia ni) 또는 드로소필라 멜라노가스터(Drosophila melanogaster)로부터 유래한 β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유도된다. 보다 바람직하게, β-(1,4)-GalNAcT 효소는 카에노르하브디티스 엘레간스(Caenorhabditis elegans), 아스카리스 숨(Ascaris suum) 또는 트리코플러시아 니(Trichoplusia ni)로부터 유래한 β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유도된다. 다른 바람직한 구현으로, β-(1,4)-GalNAcT 효소는 아스카리스 숨(Ascaris suum)으로부터 유래한 β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유도된다. 다른 바람직한 구현으로, β-(1,4)-GalNAcT 효소는 카에노르하브디티스 엘레간스(Caenorhabditis elegans)로부터 유래한 β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유도된다.
카에노르하브디티스 엘레간스(Caenorhabditis elegans)는 또한 본 명세서에서 Ce로 지칭되며, 아스카리스 숨(Ascaris suum)은 As로서 지칭되며, 트리코플러시아 니(Trichoplusia ni)는 Tn으로 지칭되며, 그리고 드로소필라 멜라노가스터(Drosophila melanogaster)는 Dm으로 지칭된다.
바람직하게, 본 발명의 방법에서 사용되는 β-(1,4)-GalNAcT 효소는 SEQ ID NO: 2-5 및 15-23으로 구성된 그룹으로부터 선택된 서열, 보다 바람직하게 SEQ ID NO: 2-5, 즉 SEQ ID NO: 2, 3, 4 또는 5로 구성된 그룹으로부터 선택된 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게 100% 서열 동일성을 갖는다.
바람직하게, 본 발명의 방법에 사용되는 β-(1,4)-GalNAcT 효소는 본 명세서에서 CeGalNAcT(SEQ ID NO: 2)로 명명된 카에노르하브디티스 엘레간스(Caenorhabditis elegans) β-(1,4)-GalNAcT, 본 명세서에서 AsGalNAcT(SEQ ID NO: 3)로 명명된 아스카리스 숨(Ascaris suum) β-(1,4)-GalNAcT, 본 명세서에서 TnGalNAcT(SEQ ID NO: 4)로 명명된 트리코플러시아 니(Trichoplusia ni) β-(1,4)-GalNAcT, 본 명세서에서 DmGalNAcT(SEQ ID NO: 5)로 명명된 드로소필라 멜라노가스터(Drosophila melanogaster) β-(1,4)-GalNAcT, 카에노르하브디티스 레마네이(Caenorhabditis remanei) β-(1,4)-GalNAcT(SEQ ID NO: 15), 카에노르하브디티스 브리그사에(Caenorhabditis briggsae) β-(1,4)-GalNAcT(SEQ ID NO: 16), 우체레리아 반크로프티(Wuchereria bancrofti) β-(1,4)-GalNAcT(SEQ ID NO: 17), 로아 로아(Loa loa) β-(1,4)-GalNAcT(SEQ ID NO: 18), 세라파키스 비로이(Cerapachys biroi) β-(1,4)-GalNAcT(SEQ ID NO: 19), 주타몹시스 네바덴시스(Zootermopsis nevadensis) β-(1,4)-GalNAcT(SEQ ID NO: 20), 캄포노터스 플로리다너스(Camponotus floridanus) β-(1,4)-GalNAcT(SEQ ID NO: 21), 크라소스트레아 기가스(Crassostrea gigas) β-(1,4)-GalNAcT(SEQ ID NO: 22) 및 다나우스 플렉시퍼스(Danaus plexippus) β-(1,4)-GalNAcT(SEQ ID NO: 23)으로 구성된 그룹으로부터 선택된, 어느 자연적으로 발생하거나 또는 와일드 타입의 β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유도된다.
β-(1,4)-GalNAcT 효소는 네마토데(Nematode) 문의 무척추동물 종, 바람직하게 크로마도레아(Chromadorea) 부류의, 바람직하게 랍디티다(Rhabditida) 목의, 바람직하게는 랍디티다에(Rhabditidae) 과의, 바람직하게 카에노르하브디티스(Caenorhabditis) 속의 무척추동물 종으로부터 유래한 β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유도된 것이 보다 바람직하다. 바람직하게, 본 발명의 방법에 사용되는 β-(1,4)-GalNAcT 효소는 SEQ ID NO: 2, 15 및 16으로 구성된 기의 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게 100% 서열 동일성을 갖는다. 가장 바람직하게, 상기 무척추동물 종은 카에노르하브디티스 엘레간스(Caenorhabditis elegans)의 것이다. 바람직하게, 본 발명의 방법에 사용되는 β-(1,4)-GalNAcT 효소는 SEQ ID NO: 2와 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게 100% 서열 동일성을 갖는다.
또 다른 바람직한 구현으로, 본 발명의 방법에 사용되는 β-(1,4)-GalNAcT 효소는 네마토데(Nematode) 문의 무척추동물 종, 바람직하게 세세멘테아(Secementea) 부류의, 바람직하게 아스카리디다(Ascaridida) 목의, 바람직하게는 아스카리디다에(Ascarididae) 과의, 바람직하게 아스카리스(Ascaris) 속의 무척추동물 종으로부터 유래한 β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유도된 것이 보다 바람직하다. 보다 바람직하게, 상기 무척추동물 종은 아스카리스 숨(Ascaris suum)의 것이다. 바람직하게, 본 발명의 방법에 사용되는 β-(1,4)-GalNAcT 효소는 SEQ ID NO: 3으로 구성된 기의 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게 100% 서열 동일성을 갖는다.
또 다른 바람직한 구현으로, 본 발명의 방법에 사용되는 β-(1,4)-GalNAcT 효소는 안트로포다(Anthropoda) 문의 무척추동물 종, 바람직하게 인섹타(Insecta) 부류의, 바람직하게 레피돕테라(Lepidoptera) 목의, 바람직하게는 녹투이다에(Noctuidae) 과의, 바람직하게 트리코플러시아(Trichoplusia ) 속의 무척추동물 종으로부터 유래한 β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유도된 것이 보다 바람직하다. 보다 바람직하게, 상기 무척추동물 종은 트리코플러시아 니(Trichoplusia ni)의 것이다. 트리코플러시아 니(Trichoplusia ni)는 또한 피토종종 메트라 브라시카에(Phytometra brassicae), 플러시아 이나타(Plusia innata ) 또는 캐비지 루프(cabbage looper)로서 지칭될 수 있다. 바람직하게, 본 발명의 방법에 사용되는 β-(1,4)-GalNAcT 효소는 SEQ ID NO: 4로 구성된 기의 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게 100% 서열 동일성을 갖는다.
또 다른 바람직한 구현으로, 본 발명의 방법에 사용되는 β-(1,4)-GalNAcT 효소는 안트로포다(Anthropoda) 문의 무척추동물 종, 바람직하게 인섹타(Insecta) 부류의, 바람직하게 딥테라(Diptera) 목의, 바람직하게는 드로소필리다에(Drosophilidae) 과의, 바람직하게 드로소필라(Drosophila) 속의 무척추동물 종으로부터 유래한 β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유도된 것이 보다 바람직하다. 보다 바람직하게, 상기 무척추동물 종은 드로소필라 멜라노가스터(Drosophila melanogaster)의 것이다. 바람직하게, 본 발명의 방법에 사용되는 β-(1,4)-GalNAcT 효소는 SEQ ID NO: 5로 구성된 기의 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게 100% 서열 동일성을 갖는다.
"로부터 유래된(derived from)"은 본 명세서에서, 하나 이상의, 바람직하게는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20개 또는 그 이상의 아미노산을 각각, 치환, 삽입, 결실 또는 부가함으로써 자연적으로 발생하는 β-(1,4)-GalNAcT 효소로부터 변형된 아미노산 서열을 갖는 것으로 이해되어야한다. β-(1,4)-GalNAcT 효소로부터 유도된 β-(1,4)-GalNAcT 효소는 본 명세서에서 또한 유도된 β-(1,4)-GalNAcT 효소 또는 변형된 β-(1,4)-GalNAcT 효소 또는 β-(1,4)-GalNAcT 돌연변이 효소 또는 β-(1,4)-GalNAcT 돌연변이로서 지칭된다.
바람직하게는, 상기 유도된 β-(1,4)-GalNAcT 효소는 추가의 N- 또는 C- 말단 아미노산 또는 화학적 부를 첨가함으로써 또는 N- 또는 C-말단 아미노산을 결실시킴으로써 변형시켜 안정성, 용해도, 활성 및/또는 정제 용이성을 증가시킨다.
바람직하게는 β-(1,4)-GalNAcT 효소는 트렁케이티드(truncated) 효소로 본 명세서에서 명명된 N-말단 세포질 도메인 및 트랜스멤브레인 도메인을 결실시킴으로써 변형된다.
예를 들어, CeGalNAcT(30-383)는 본 명세서에서 SEQ ID NO: 2의 위치 30-383상의 아미노산으로 표시되는 아미노산 서열로 구성된 트렁케이티드 카에노르하브디티스 엘레간스(Caenorhabditis elegans) β-(1,4)-GalNAcT 효소로 이해되어야 한다. 이들 도메인의 결실은 수용액에서 증가된 용해도를 나타내는 효소를 생성하는 것으로 당해 기술분야에 알려져 있다.
유사하게, AsGalNAcT(30-383)는 본 명세서에서 SEQ ID NO: 3의 위치 30-383상의 아미노산으로 표시되는 아미노산 서열로 구성된 트렁케이티드 아스카리스 섬(Ascaris Sum) β-(1,4)-GalNAcT 효소로 이해되어야 하며, TnGalNAcT(33-421)는 본 명세서에서 SEQ ID NO: 4의 위치 33-421상의 아미노산으로 표시되는 아미노산 서열로 구성된 트렁케이티드 트리코플러시아 니(Trichoplusia ni) β-(1,4)-GalNAcT 효소로 이해되어야 하며, 그리고 DmGalNAcT(47-403)는 본 명세서에서 SEQ ID NO: 5의 위치 47-403상의 아미노산으로 표시되는 아미노산 서열로 구성된 트렁케이티드 드로소필라 멜라노가스터(Drosophila melanogaster) β-(1,4)-GalNAcT 효소로 이해되어야 한다. 바람직하게는, 본 발명의 방법에 사용되는 β-(1,4)-GalNAcT 효소는 SEQ ID NO 6-9의 어느 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게는 적어도 100% 서열 동일성을 갖는다. 보다 바람직하게, 본 발명의 방법에서 사용되는 β-(1,4)-GalNAcT 효소는 SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8 또는 SEQ ID NO: 9의 어느 서열과, 보다 바람직하게 SEQ ID NO: 6, SEQ ID NO: 7 또는 SEQ ID NO: 8의 어느 서열과, 보다 바람직하게 SEQ ID NO: 7 또는 SEQ ID NO: 8의 어느 서열과, 그리고 보다 바람직하게 SEQ ID NO: 8 서열과 적어도 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게는 적어도 100% 서열 동일성을 갖는다.
하나 이상의 아미노산이 치환, 추가 또는 결실된 β-(1,4)-GalNAcT 효소는 본 명세서에서 또한 돌연변이 β-(1,4)-GalNAcT 효소 또는 유도된 β-(1,4)-GalNAcT 효소로서 지칭된다. 바람직하게, β-(1,4)-GalNAcT 효소는 N-말단 세포질 도메인 및 트랜스멤브레인 도메인을 결실시킴으로써 변형되고, 하나 이상의 아미노산을 치환함으로써 돌연변이된다. 하나 이상의 아미노산의 치환은 본 명세서에서 돌연변이라고도 지칭된다. 하나 이상의 치환된 아미노산을 포함하는 효소는 또한 돌연변이 효소로 지칭된다.
본 발명에 따른 방법에서, 글리코실트랜스퍼라아제가 카에노르하브디티스 엘레간스(Caenorhabditis elegans) β-(1,4)-GalNAcT 효소 또는 트렁케이티드 β- (1,4)-GalNAcT 효소로부터 유도된 경우, 상기 효소는 하나 또는 그 이상의 돌연변이를 더 포함하는 것이 바람직하다. 바람직한 돌연변이는 257 위치의 이소류신(Ile, I로도 지칭됨)의 류신(Leu, L로도 지칭됨), 메티오닌(Met, M으로도 지칭됨) 또는 알라닌(Ala, A로도 지칭됨)으로의 치환을 포함한다. 바람직한 돌연변이는 또한 위치 312에서의 메티오닌(Met, 또한 M으로 지칭됨)의 히스티딘(His, 또한 H로 지칭됨)으로의 치환을 포함한다. 결과적으로, 글리코실트랜스퍼라아제가 CeGalNAcT 또는 CeGalNAcT(30-383)로부터 유도된 경우, 효소는 I257L, I257M 또는 I257A 돌연변이 및/또는 M312H 돌연변이를 포함하는 것이 바람직하다.
아미노산 위치의 번호 부여는 본 명세서에서 와일드 타입 β-(1,4)-GalNAcT 효소에서의 아미노산 위치의 번호 매김에 기초한다는 것을 주목해야한다. β-(1,4)-GalNAcT 효소가 예를 들어, 트렁케이티드 효소인 경우에, 본 명세서에 사용된 번호는 예를 들어. 아미노산 치환의 위치는 상응하는 와일드 타입 β-(1,4)-GalNAcT 효소에서의 아미노산 위치의 번호에 상응한다.
예로서, 와일드 타입 CeGalNAcT(SEQ ID NO: 2)에서 아미노산 위치 257에 이소류신(Ile, I)이 존재한다. CeGalNAcT(I257L)에서 위치 257의 이소류신 아미노산은 류신 아미노산(Leu, L)으로 치환된다. 상기한 바와 같이, CeGalNAcT(30-383)는 본 명세서에서 SEQ ID NO: 2의 위치 30-383상의 아미노산으로 표시되는 아미노산 서열로 구성된 트렁케이티드 CeGalNAcT 효소로 이해되는 한편, CeGalNAcT(30-383) 그 자체는 SEQ ID NO: 5으로 표시된다. CeGalNAcT(30-383; I257L)에서, I257L의 "257" 숫자는 상응하는 와일드 타입 CeGalNAcT에서 위치 257상의 I 아미노산임을 나타낸다(즉, L 아미노산으로 치환된 SEQ ID NO: 2의 번호 257). SEQ ID NO: 2의 위치 257상의 이소류신 아미노산은 SEQ ID NO: 6의 위치 228상의 이소류신 아미노산으로 표시된다.
바람직한 트렁케이티드 카에노르하브디티스 엘레간스(Caenorhabditis elegans) β-(1,4)-GalNAcT 돌연변이 효소는 CeGalNAcT(30-383; I257L)(SEQ ID NO: 10), CeGalNAcT(30-383, I257M)(SEQ ID NO: 11), CeGalNAcT(30-383; I257A)(SEQ ID NO: 12) 및 CeGalNAcT(30-383; M312H)(SEQ ID NO: 13)를 포함한다.
본 발명에 따른 방법에서, 글리코실트랜스퍼라아제가 트리코플러시아 니(Trichoplusia ni) β-(1,4)-GalNAcT 효소 또는 트렁케이티드 트리코플러시아 니(Trichoplusia ni) β-(1,4)-GalNAcT 효소로부터 유도되는 경우에, 상기 효소는 하나 이상의 돌연변이를 더 포함하는 것이 바람직하다. 바람직한 돌연변이는 위치 336상의 트립토판(Trp, W로도 지칭됨)의 페닐알라닌(Phe, F로도 지칭됨), 히스티딘(His, H로도 지칭됨) 또는 발린(Val, V로도 지칭됨)으로의 치환을 포함한다. 결과적으로, 글리코실트랜스퍼라아제가 TnGalNAcT 또는 TnGalNAcT(33-421)로부터 유도되는 경우, 상기 효소는 W336F, W336H 또는 W336V 돌연변이를 포함하는 것이 바람직하다. TnGalNAcT 또는 TnGalNAcT (33-421)의 바람직한 돌연변이는 또한 알라닌 (Ala, A라고도 함), 아스파르트산(Asp, 또한 D라고도 함) 또는 세린(Ser, S라고도 함)에 의한 위치 339상의 글루탐산 (Glu, E라고도 함)의 치환을 포함한다. 결과적으로, 글리코실트랜스퍼라아제가 TnGalNAcT 또는 TnGalNAcT(33-421)로부터 유도되는 경우에, 상기 효소는 E339A, E339D 또는 E339S 돌연변이를 포함하는 것이 바람직하다. TnGalNAcT 또는 TnGalNAcT(33-421)의 또 다른 바람직한 돌연변이는 위치 302에서 알라닌(Ala, A라고도 함) 또는 글리신(Gly, G라고도 함)에 의한 류신(Leu, L이라고도 함)의 치환을 포함한다. 다른 바람직한 돌연변이는 위치 299에서 이소류신(Ile, I로도 지칭됨)의 G로메티오닌(Met, M으로도 지칭됨), 알라닌(Ala, A로도 지칭됨) 또는 글리신(Gly, 또한 G로도 지칭됨)으로의 치환을 포함한다. 또 다른 바람직한 돌연변이는 위치 311에서 이소류신(Ile, I로도 지칭됨)의 메티오닌(Met, M으로도 지칭됨)으로의 치환을 포함한다. TnGalNAcT 또는 TnGalNAcT(33-421)의 가장 바람직한 돌연변이는 L302A 돌연변이를 포함한다.
TnGalNAcT 또는 TnGalNAcT(33-421)로부터 유도된 글리코실트랜스퍼라아제는 둘 다 상술한 바와 같이 336 및 339 위치에서의 돌연변이와 같은 하나 이상의 돌연변이를 함유할 수 있다. 일 구현으로, TnGalNAcT 또는 TnGalNAcT(33-421)로부터 유도된 글리코실트랜스퍼라아제는 W336F, W336H 또는 W336V 돌연변이 및 E339A, E339G, E339D 또는 E339S 돌연변이를 포함한다.
본 발명에 따른 방법의 바람직한 구현에서, β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유도된 글리코실트랜스퍼라아제는 TnGalNAcT(33-421; W336F)(SEQ ID NO: 25), TnGalNAcT(33-421; W336H)(SEQ ID NO: 26), TnGalNAcT(33-421; W336V)(SEQ ID NO: 27), TnGalNAcT(33-421, E339A)(SEQ ID NO: 28), TnGalNAcT(33-421; E339D)(SEQ ID NO: 30); TnGalNAcT(33-421; E339S)(SEQ ID NO: 31); TnGalNAcT(33-421; L302A)(SEQ ID NO: 29); TnGalNAcT(33-421; L302G)(SEQ ID NO: 35); TnGalNAcT(33-421; I299M)(SEQ ID NO: 36); TnGalNAcT(33-421; I299A)(SEQ ID NO: 37); TnGalNAcT(33-421; I299G)(SEQ ID NO: 38); 및 TnGalNAcT(33-421; I311M)(SEQ ID NO: 39)로 구성된 그룹으로부터 선택된 트리코플러시아 니(Trichoplusia ni) β-(1,4)-GalNAcT 효소이다.
본 발명에 따른 방법에 사용되는 β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유도된 글리코실트랜스퍼라아제는 TnGalNAcT(33-421; W336H, E339A)(SEQ ID NO: 32), TnGalNAcT(33-421; W336H, E339D)(SEQ ID NO: 33) 및 TnGalNAcT(33-421; W336H, E339S)(SEQ ID NO: 34))와 같은 트리코플러시아 니(Trichoplusia ni) β-(1,4)-GalNAcT 효소의 하나 이상의 돌연변이를 또한 함유할 수 있다.
본 발명에 따른 방법에서, 글리코실트랜스퍼라아제가 아스카리스 숨(Ascaris suum) β-(1,4)-GalNAcT 효소 또는 트렁케이티드 아스카리스 숨(Ascaris suum) β-(1,4)-GalNAcT 효소로부터 유도되는 경우, 상기 효소는 하나 이상의 돌연변이를 더 포함하는 것이 바람직하다. 바람직한 돌연변이는 위치 282에서 트립토판(Trp, W로도 지칭됨)의 히스티딘(His, H로도 지칭됨)으로의 치환, 및/또는 위치 285에서 글루탐산(Glu, E라고도 함)의 아스파르트산(Asp, D라고도 지칭됨)으로의 치환, 및/또는 위치 248에서 페닐알라닌(Phe, F라고도 지칭됨)의 알라닌(Ala, A라고도 지칭됨)으로의 치환, 및/또는 위치 248에서 페닐알라닌(Phe, F라고도 지칭됨)의 글리신(Gly, G로도 지칭됨)으로의 치환, 및/또는 위치 245에서 발린(Val, 또는 V로도 지칭됨)의 메티오닌(Met, M으로도 지칭됨)으로의 치환을 포함한다. 결과적으로, 글리코실트랜스퍼라아제가 AsGalNAcT 또는 AsGalNAcT(30-383)로부터 유도된 경우, 상기 효소는 W282H 돌연변이 및/또는 E285D 돌연변이를 포함하는 것이 바람직하다.
본 발명에 따른 방법의 또 다른 바람직한 구현에서, β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유도된 글리코실트랜스퍼라아제는 AsGalNAcT(30-383; F248A)(SEQ ID NO: 40), AsGalNAcT(30-383; F248G)(SEQ ID NO: 41) 및 AsGalNAcT(30-383; V245M)(SEQ ID NO: 42)로 구성된 그룹으로부터 선택된 아스카리스 숨(Ascaris suum) β-(1,4)-GalNAcT이다.
본 발명에 따른 방법의 바람직한 구현에서, β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유도된 글리코실트랜스퍼라아제는 AsGalNAcT(30-383; W282H)(SEQ ID NO: 46) 및 AsGalNAcT(30-383; E285D)(SEQ ID NO: 47)로 구성된 그룹으로부터 선택된 아스카리스 숨(Ascaris suum) β-(1,4)-GalNAcT이다.
바람직한 구현에서, 본 명세서에 정의된 바와 같은 β-(1,4)-GalNAcT 효소는 정제를 용이하게 하기 위해 태그를 코딩하는 서열을 포함한다. 바람직하게, 상기 태그는 이에 한정하는 것은 아니나, FLAG-태그, 폴리(His)-태그, HA-태그, Myc-태그, SUMO-태그, GST-태그, MBP-태그 또는 MBP-태그로 구성된 그룹으로부터 선택되며, 보다 바람 바람직하게 상기 태그는 6xHis 태그이다. 바람직하게, 상기 태그는 β-(1,4)-GalNAcT 효소에 대해 상기 효소의 C-말단에 공유결합된다. 또 다른 바람직한 구현에서, 상기 태그는 β-(1,4)-GalNAcT 효소에 대해 상기 효소의 N-말단에 공유결합된다.
β-(1,4)-GalNAcT 효소가 C. 엘레간스(C. Elegans) β-(1,4)-GalNAcT로부터 유도되는 경우, His-태그된 β-(1,4)-GalNAcT 효소는 바람직하게 β-(1,4)-GalNAcT 효소에 대해 상기 효소의 C-말단에 연결되며, 이는 CeGalNAcT(30-383)-His6(SEQ ID NO: 14)로 표시된다.
본 발명에 따른 방법의 바람직한 구현에서, β-(1,4)-GalNAcT 효소가 트리코플러시아 니(Trichoplusia ni) β-(1,4)-GalNAcT이거나 또는 이로부터 유도된 경우, His-태그된 β-(1,4)-GalNAcT 효소는 His6-TnGalNAcT(33-421)(SEQ ID NO: 49)이거나 또는 이로부터 유도된다.
본 발명에 따른 방법의 또 다른 바람직한 구현에서, β-(1,4)-GalNAcT 효소가 트리코플러시아 니(Trichoplusia ni) β-(1,4)-GalNAcT이거나 또는 이로부터 유도된 경우, His-태그된 β-(1,4)-GalNAcT 효소는 His6-TnGalNAcT(33-421; W336F) (SEQ ID NO: 50), His6-TnGalNAcT(33-421; W336H)(SEQ ID NO: 51, His6-TnGalNAcT(33-421; W336V)(SEQ ID NO: 52), His6-TnGalNAcT(33-421; 339A)(SEQ ID NO: 53), His6-TnGalNAcT(33-421; E339D)(SEQ ID NO: 55), His6-TnGalNAcT(33-421; E339S)(SEQ ID NO: 56), His6-TnGalNAcT(33-421; L302A)(SEQ ID NO: 43), His6-TnGalNAcT(33-421; L302G)(SEQ ID NO: 44), His6-TnGalNAcT(33-421; I299M)(SEQ ID NO: 45), His6-TnGalNAcT(33-421; I299A)(SEQ ID NO: 48), His6-TnGalNAcT(33-421; I299G)(SEQ ID NO: 54), His6-TnGalNAcT(33-421; I311M)(SEQ ID NO: 60)이거나 또는 이로부터 유도된다.
본 발명에 따른 방법의 또 다른 바람직한 구현에서, β-(1,4)-GalNAcT 효소가 아스카리스 숨(Ascaris suum) β-(1,4)-GalNAcT이거나 또는 이로부터 유도된 경웅, His-태그된 β-(1,4)-GalNAcT 효소는 His6-AsGalNAcT(30-383; W282H)(SEQ ID NO: 72), His6-AsGalNAcT(30-383; E285D)(SEQ ID NO: 73)이거나 또는 이로부터 유도된다.
바람직한 구현에서, 본 발명에 따른 방법에서 사용되는 β-(1,4)-N-아세틸갈 락토사미닐트랜스퍼라아제는 SEQ ID NO: 2-23으로 구성된 그룹으로부터 선택된 서열이거나 또는 이로부터 유도된다.
상술한 바와 같이, "로부터 유래된(derived from)"이라는 용어는 예를 들어, 트렁케이티드 효소, 돌연변이 효소 및 정제를 용이하게 하기 위한 태그를 포함하는 효소를 포함하며, 이들 변형은 상기에서 더 상세하게 기술된다. "로부터 유래된"이라는 용어는 또한 상기에서보다 상세하게 기술된 변형들의 조합을 포함하는 효소를 포함한다.
또 다른 바람직한 구현에서, 본 발명에 따른 방법에서 사용되는 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제는 SEQ ID NO: 2-23으로 구성된 그룹으로부터 선택된 서열과 적어도 50% 동일성을 갖는다. 보다 바람직하게, 본 발명에 따른 방법에서 사용되는 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제는 SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20, SEQ ID NO: 21, SEQ ID NO: 22 및 SEQ ID NO: 23으로 구성된 그룹으로부터 선택된 서열과 적어도 50% 서열 동일성, 바람직하게는 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게 100% 서열 동일성을 갖는다.
본 방법의 다른 바람직한 구현에서, β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제는 와일드 타입 β-(1,4)-GalNAcT, 바람직하게는 무척추 동물 β-(1,4)-GalNAcT이거나 또는 이로부터 유도된다. 본 방법의 또 다른 바람직한 구현에서, 글리코실트랜스퍼라아제는 무척추 동물 β-(1,4)-GalNAcT이거나 또는 이로부터 유도된다. 다른 바람직한 구현에서, 글리코실트랜스퍼라아제는 카에노르하브디티스 엘레간스(Caenorhabditis elegans) β-(1,4)-GalNAcT(CeGalNAcT), 아스카리스 숨(Ascaris suum) β-(1,4)-GalNAcT(AsGalNAcT) 또는 트리코플러시아 니(Trichoplusia ni) β-(1,4)-GalNAcT(TnGalNAcT)이거나 또는 이로부터 유도된다. (CeGalNAcT), (AsGalNAcT) 또는 (TnGalNAcT)이거나 또는 이로부터 유도된 β-(1,4)-GalNAcTs는 상기에서 보다 상세하게 기재되어 있다. 이 구현에서, 상기 방법에서 사용되는 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제는 SEQ ID NO: 2-9로 구성된 그룹으로부터, 즉 SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8 및 SEQ ID NO: 9로 구성된 그룹으로부터 선택된 서열이거나 또는 이로부터 유도되는 것이 특히 바람직하다. 더욱 바람직하게, β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제는 SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 7 및 SEQ ID NO: 8로 구성된 그룹으로부터, 보다 바람직하게 SEQ ID NO: 6, SEQ ID NO: 7 및 SEQ ID NO: 8로 구성된 그룹으로부터, 보다 바람직하게 SEQ ID NO: 7 및 SEQ ID NO: 8로 구성된 그룹으로부터 선택된 서열이거나 또는 이로부터 유도된다. 가장 바람직하게, 상기 방법에 사용되는 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제는 SEQ ID NO: 8이거나 또는 이로부터 유도된다.
또 다른 특히 바람직한 구현에서, 본 발명의 방법에 사용되는 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제는 SEQ ID NO: 2-9로 구성된 그룹으로부터, 즉 SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8 및 SEQ ID NO: 9로 구성된 그룹으로부터 선택된 서열과 적어도 50% 서열 동일성, 바람직하게 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게 100% 서열 동일성을 갖는다. 보다 바람직하게, 본 발명의 방법에 사용되는 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제는 SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 7 및 SEQ ID NO: 8로 구성된 그룹으로부터, 보다 바람직하게 SEQ ID NO: 6, SEQ ID NO: 7 및 SEQ ID NO: 8로 구성된 그룹으로부터, 보다 바람직하게 SEQ ID NO: 7 및 SEQ ID NO: 8로 구성된 그룹으로부터 선택된 서열과 적어도 50% 서열 동일성, 바람직하게 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게 100% 서열 동일성을 갖는다. 가장 바람직하게, 상기 방법에 사용되는 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제는 SEQ ID NO: 8과 적어도 50% 서열 동일성, 바람직하게 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게 100% 서열 동일성을 갖는다.
본 발명의 또 다른 특히 바람직한 구현에서, 상기 글리코실트랜스퍼라아제는 카에노르하브디티스 엘레간스(Caenorhabditis elegans) β-(1,4)-GalNAcT(CeGalNAcT)이거나 또는 이로부터 유도된다. 또 다른 특히 바람직한 구현에서, CeGalNAcT는 SEQ ID NO: 2 또는 SEQ ID NO: 6이거나 또는 이로부터 유도된다.
또 다른 특히 바람직한 구현에서, 상기 방법에 사용되는 CeGalNAcT는 SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13 또는 SEQ ID NO: 14이거나 또는 이로부터 유도된다.
또 다른 특히 바람직한 구현에서, 상기 방법에 사용되는 CeGalNAcT는 SEQ ID NO: 2 또는 SEQ ID NO: 6과 적어도 50% 서열 동일성, 바람직하게 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게 100% 서열 동일성을 갖는다. 또 다른 특히 바람직한 구현에서, 상기 방법에 사용되는 CeGalNAcT는 서열 SEQ ID NO:10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13 또는 SEQ ID NO: 14와 적어도 50% 서열 동일성, 바람직하게 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85% 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게 100% 서열 동일성을 갖는다.
본 발명에 따른 방법의 또 다른 특히 바람직한 구현에서, 상기 글리코실트랜스퍼라아제는 트리코플러시아 니(Trichoplusia ni) β-(1,4)-GalNAcT(TnGalNAcT)이거나 또는 이로부터 유도된다. 상기 방법의 다른 바람직한 구현에서, 상기 TnGalNAcT는 SEQ ID NO: 4 또는 SEQ ID NO: 8이거나 또는 이로부터 유도된다. 또 다른 추가의 바람직한 구현에서, 상기 방법에 사용되는 TnGalNAcT는 SEQ ID NO: 4 또는 SEQ ID NO: 8과 적어도 50% 서열 동일성, 바람직하게 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게 100% 서열 동일성을 갖는다. 또 다른 바람직한 구현에서, 상기 방법에 사용되는 TnGalNAcT는 SEQ ID NO: 25, SEQ ID NO: 26, SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 32, SEQ ID NO: 33, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 38, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 50, SEQ ID NO: 51, SEQ ID NO: 52, SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 55, SEQ ID NO: 56, SEQ ID NO: 57, SEQ ID NO: 58, SEQ ID NO: 59 및 SEQ ID NO: 60으로 구성된 그룹으로부터 선택된 서열이거나 또는 이로부터 유도된다. 또 다른 바람직한 구현에서, 상기 방법에 사용되는 TnGalNAcT는 SEQ ID NO: 25, SEQ ID NO: 26, SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 32, SEQ ID NO: 33, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 38, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 50, SEQ ID NO: 51, SEQ ID NO: 52, SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 55, SEQ ID NO: 56, SEQ ID NO: 57, SEQ ID NO: 58, SEQ ID NO: 59 및 SEQ ID NO: 60으로 구성된 그룹으로부터 선택된 서열과 적어도 50% 서열 동일성, 바람직하게 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게 100% 서열 동일성을 갖는다.
본 발명에 따른 방법의 또 다른 특히 바람직한 구현에서, 글리코실트랜스퍼라아제는 아스카리스 숨(Ascaris suum) β-(1,4)-GalNAcT(AsGalNAcT)이거나 또는 이로부터 유도된다. 이러한 구현에서, AsGalNAcT는 SEQ ID NO: 3 또는 SEQ ID NO: 7이거나 또는 이로부터 유도된다. 또 다른 추가의 바람직한 구현에서, 상기 방법에 사용되는 AsGalNAcT는 SEQ ID NO: 3 또는 SEQ ID NO: 7과 적어도 50% 서열 동일성, 바람직하게 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게 100% 서열 동일성을 갖는다. 또 다른 추가의 바람직한 구현에서, 상기 방법에 사용되는 AsGalNAcT는 SEQ ID NO: 40, SEQ ID NO: 41, SEQ ID NO: 42, SEQ ID NO: 46, SEQ ID NO: 47, SEQ ID NO: 71, SEQ ID NO: 72 및 SEQ ID NO: 73으로 구성된 그룹으로부터 선택된 서열이거나 또는 이로부터 유도된다. 상기 방법의 또 다른 추가의 바람직한 구현에서, 상기 방법에 사용되는 AsGalNAcT는 SEQ ID NO: 40, SEQ ID NO: 41, SEQ ID NO: 42, SEQ ID NO: 46, SEQ ID NO: 47, SEQ ID NO: 71, SEQ ID NO: 72 및 SEQ ID NO: 73으로 구성된 그룹으로부터 선택된 서열과 적어도 50% 서열 동일성, 바람직하게 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 바람직하게 100% 서열 동일성을 갖는다.
바람직하게, 본 발명의 방법에 사용되는 유도된 또는 와일드 타입 β-(1,4)-GalNAcT 효소는 UDP-F2-GalNAz 전달 활성을 갖는다. UDP-F2-GalNAz는 화학식 (18)에 따른 당 유도체 뉴클레오타이드이며, 하기에 보다 상세하게 설명된다. UDP-F2-GalNAz 전달 활성은 바람직하게 본 명세서에 예시된 방법, 즉 R&D Systems Glycosyltransferase Activity Kit (http://www.rndsystems.com/product_detail_objectname_glycotransferase_assay_principle.aspx, product number EA001)의 방법에 의해 평가된다.
요약하면, 글리코실트랜스퍼라아제 키트는 도너 당(당-UDP 뉴클레오타이드로부터)을 억셉터 당으로 전달할 때 유리된 UDP의 방출을 검출하는 결합 분석(coupled assay)에 의해 특정 글리코실트랜스퍼라아제의 활성을 측정한다. 보다 상세하게, 당의 전달시 유리된 UDP는 특정 효소(CD39L3/렉토뉴클레오사이드(rectonucleoside) 트리포스페이트 디포스포하이드롤라아제-3, 또한 NTPDase-3으로 알려짐)에 의해 가수분해되어 UMP 및 1당량의 포스페이트(Pi)를 생성한다. 후자의 포스페이트는 말라카이트 그린(malachite green)에 의해 차례로 검출되며, 이는 또한 혼합물에 첨가된다. 녹색은 방출되는 무기 포스페이트의 양에 비례하여 디벨로핑하며, 620 nm에서의 색 흡광도가 글리코실트랜스퍼라아제의 활성의 직접적인 측정값으로서 측정된다. 현재의 경우, UDP-기질로부터 단백질상의 GlcNAc로의 F2-GalNAz의 전달은 CD39L3 및 생성된 포스페이트에 의해 가수분해되는 UDP의 방출을 수반한다. 바람직하게, 본 발명에 따른 방법에 사용되는 유도된 또는 와일드 타입 β-(1,4)-GalNAcT 효소는, β-(1,4)-갈락토실트랜스퍼라아제 돌연변이 효소 보스 타우러스(Bos taurus) GalT-Y289L(SEQ ID NO: 1)의 UDP-F2-GalNAz 전달 활성과 비교하여, 적어도 30%, 33%, 50%, 75%, 100%, 150%, 200%, 또는 보다 바람직하게, 적어도 300%의 UDP-F2-GalNAz 전달 활성을 가지며, 여기서 상기 전달 활성은 R&D Systems Glycosyltransferase Activity Kit를 사용하여 실시예 18에 상세히 나타낸 바와 같은 조건을 적용하고, 동등한 양의 시험하고자하는 효소 및 β-(1,4)-갈락토실트랜스퍼라아제 돌연변이 효소 보스 타우러스(Bos taurus) GalT-Y289L(SEQ ID NO: 1)를 사용하여 평가한다.
본 발명의 제 2 견지에 따른 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제의 돌연변이는 바람직하게, SEQ ID NO: 1, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13, SEQ ID NO: 25, SEQ ID NO: 26, SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 29, SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 32, SEQ ID NO: 33, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 38, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: 41, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 46, SEQ ID NO: 47, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 51, SEQ ID NO: 52, SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 55, SEQ ID NO: 56, SEQ ID NO: 57, SEQ ID NO: 58, SEQ ID NO: 59, SEQ ID NO: 60, SEQ ID NO: 72 및 SEQ ID NO: 73으로 구성된 그룹으로부터 선택된 서열 중 하나와 적어도 50%의 서열 동일성, 보다 바람직하게는 적어도 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 및 가장 바람직하게는 100% 서열 동일성을 갖는다.
Figure pct00007
당 단백질 및 변형된 당 단백질
본 발명에 따른 방법에서 변형될 당 단백질은 글리칸을 포함하며, 상기 글리칸은 말단 GlcNAc-부, 즉 글리칸의 비환원 말단에 존재하는 Glc-NAc 부를 포함한다. 상기 글리칸은 하나 이상의 사카라이드 부를 포함하고 선형 또는 분지형일 수 있다. 말단 GlcNAc-부를 포함하는 글리칸은 화학식 (1) 또는 (2)에 따른다:
Figure pct00008
여기서:
b는 0 또는 1이며;
d는 0 또는 1이며;
e는 0 또는 1이며; 그리고
G는 단당류, 또는 2 내지 20 당 부를 포함하는 선형 또는 분지형 올리고당이다.
변형될 당 단백질은 말단 GlcNAc-부를 포함하는 하나 이상의 글리칸을 포함할 수 있다. 상기 당 단백질은 또한 말단 GlcNAc-부를 포함하지 않는 추가의 글리칸을 포함할 수 있다.
코어-GlcNAc-부, 즉 단백질에 부착된 GlcNAc-부는 선택적으로 푸코실화된다(b는 0 또는 1임). 코어-GlcNAc-부가 푸코실화되는 경우, 푸코오스는 가장 일반적으로 상기 GlcNAc-부의 α-1,6 내지 C6에 연결된다.
b가 1인 화학식 (1)에 따른 글리칸의 GlcNAc-부, 즉 푸코실화된 GlcNAc로 구성된 글리칸 중 GlcNAc-부는 또한 본 명세서에서 말단 GlcNAc-부로 간주되는 것이 주의되어야 한다.
일 구현에서, 말단 GlcNAc-부를 포함하는 글리칸은 하나의 GlcNAc-부로 구성되고, 상기 글리칸은 b가 0인 화학식 (1)에 따른 글리칸이다. 다른 구현에서, 상기 글리칸은 푸코실화된 GlcNAc-부로 구성되며, 상기 글리칸은 b가 1인 화학식 (1)에 따른 글리칸이다.
또 다른 구현에서, 상기 글리칸은 화학식 (2)에 따른 글리칸이며, 여기서 코어-GlcNAc은 존재한다면, 선택적으로 푸코실화된다(b는 0 또는 1임). 화학식 (2)에 따른 글리칸에서, G는 단당, 또는 2 내지 20, 바람직하게는 2 내지 12, 보다 바람직하게는 2 내지 10, 더욱 더 바람직하게는 2, 3, 4, 5, 6, 7 또는 8개, 가장 바람직하게는 2, 3, 4, 5 또는 6개의 당 부를 포함하는 선형 또는 분지형 올리고당을 나타낸다. G가 분지형 올리고당인 경우, G는 하나 이상의 말단 GlcNAc-부를 포함할 수 있다. 따라서, 화학식 (2)에 따른 글리칸은 하나 이상의 말단 GlcNAc-부를 포함할 수 있다. 글리칸(2)에서, d가 0인 경우에 e는 1이고, e가 0인 경우에 d는 1인 것이 바람직하다. 더욱 바람직하게는, 글리칸(2)에서 d는 1이고, 더욱더 바람직하게는 d는 1이고 e는 1이다.
글리칸에 존재할 수 있는 당 부는 당업자에게 공지되어 있으며, 예를 들어 문헌 글루코오스(Glc), 갈락토오스(Gal), 만노오스(Man), 푸코오스(Fuc), N-아세틸글루코사민(GalNAc), N-아세틸갈락토오스아민(GalNAc), N-아세틸뉴라민산(NeuNAc) 또는 시알산 및 자일로스(Xyl)를 포함한다.
본 발명에 따른 방법의 바람직한 구현에서, 말단 GlcNAc-부를 포함하는 글리칸은 상기 정의된 바와 같이 화학식 (1)에 따른다. 또 다른 바람직한 구현에서, 말단 GlcNAc-부를 포함하는 글리칸은 화학식 (2)에 따른다. 말단 GlcNAc-부를 포함하는 글리칸이 화학식 (2)에 따른 경우, 화학식 (2)에 따른 글리칸은 식 (26), (27), (28), (29) 또는 (30)에 따른 글리칸이다:
Figure pct00009

Figure pct00010

Figure pct00011

Figure pct00012

Figure pct00013

상기 식에서 b는 0 또는 1이다.
본 발명에 따른 방법의 바람직한 구현에서, 말단 GlcNAc-부를 포함하는 글리칸은 화학식 (1), (26), (27), (28), (29) 또는 (30)에 따른 글리칸이며, 더욱 바람직하게는 화학식 (1), (26), (27), (28), (29) 또는 (30)에 따른 N-연결된 글리칸이다. 추가의 바람직한 구현에서, 말단 GlcNAc-부를 포함하는 글리칸은 화학식 (1), (26) 또는 (27)에 따른 글리칸이며, 보다 바람직하게는 식 (1), (26) 또는 (27)에 따른 N-연결된 글리칸이다. 가장 바람직하게는 말단 GlcNAc-부를 포함하는 글리칸은 화학식 (1) 또는 (27)에 따른 글리칸이며, 보다 바람직하게는 식 (1) 또는 (27)에 따른 N- 연결된 글리칸이다.
말단 GlcNAc-부를 포함하는 글리칸을 포함하는 당 단백질은 바람직하게 화학식 (7) 또는 (8)에 따른 것이다;
Figure pct00014
상기 식에서:
b, d, e 및 G 및 이들의 바람직한 구현은 상기 정의된 바와 같고;
y는 1 내지 24 범위의 정수이고; 그리고
Pr은 단백질이다.
본 발명에 따른 방법에서 변형될 당 단백질은 말단 GlcNAc-부를 포함하는 하나 이상의 글리칸을 포함한다(y는 1 내지 24임). 바람직하게, y는 1 내지 12의 정수, 보다 바람직하게 1 내지 10의 정수이다. 보다 바람직하게, y는 1, 2, 3, 4, 5, 6, 7 또는 8이며, 더욱 바람직하게 y는 1, 2, 3, 4, 5 또는 6이다. 더욱 더 바람직하게, y는 1, 2, 3 또는 4이다. 상술한 바와 같이, 당 단백질은 말단 GlcNAc-부를 갖지 않는 하나 이상의 글리칸을 더 포함할 수 있다.
본 발명에 따른 방법에서 변형되는 당 단백질이 화학식 (7) 또는 (8)에 따른 경우, 말단 GlcNAc-부를 포함하는 글리칸이, 상술한 바와 같은 화학식 (1), (26), (27), (28), (29) 또는 (30)에 따른, 보다 바람직하게 화학식 (1), (26) 또는 (27)에 따른, 그리고 가장 바람직하게 화학식 (1) 또는 (27)에 따른 글리칸, 바람직하게는 N-연결된 글리칸인 것이 또한 바람직하다. 가장 바람직하게, 말단 GlcNAc-부를 포함하는 글리칸은 화학식 (1) 또는 (27)에 따른 N-연결된 글리칸이다.
본 발명에 따른 방법의 바람직한 구현에서, 말단 GlcNAc 부를 포함하는 글리칸을 포함하는 당 단백질은 항체이며, 보다 바람직하게는 단백질(Pr)이 항체(Ab)인 화학식 (7) 또는 (8)에 따른 항체이다. 또한, 변형될 당 단백질이 항체인 경우, 말단 GlcNAc-부를 포함하는 글리칸은 상기 정의한 바와 같은 화학식 (1), (26), (27), (28), (29) 또는 (30)에 따른, 더욱 바람직하게는 화학식 (1), (26) 또는 (27)에 따른, 더욱 바람직하게는 화학식 (1) 또는 화학식 (27)에 따른 글리칸인 것이 바람직하다. 이 구현에서, 말단 GlcNAc-부를 포함하는 글리칸은 화학식 (1), (26), (27), (28), (29) 또는 (30)에 따른 N-연결된 글리칸, 보다 바람직하게는 화학식 (1), (26) 또는 (27)에 따른 N-연결된 글리칸, 그리고 가장 바람직하게는 화학식 (1) 또는 (27)에 따른 N-연결된 글리칸인 것이 더 바람직하다.
변형될 당 단백질이 항체인 경우, y는 1, 2, 3, 4, 5, 6, 7 또는 8이고, 보다 바람직하게 y는 1, 2, 4, 6 또는 8이고, 더욱 바람직하게 y는 1, 2 또는 4이고, 그리고 가장 바람직하게 y는 1 또는 2인 것이 바람직하다.
상기 정의된 바와 같이, 상기 항체는 전체 항체일 수 있지만, 항체 프래그먼트일 수 있다. 항체가 전체 항체인 경우, 상기 항체는 바람직하게 각각의 중쇄 상에 하나 이상의, 보다 바람직하게는 하나의 말단 비환원성 GlcNAc-글리칸을 포함한다. 따라서, 상기 전체 항체는 바람직하게는 2개 이상, 바람직하게는 2개, 4개, 6개 또는 8개의 상기 글리칸, 보다 바람직하게는 2개 또는 4개, 그리고 가장 바람직하게는 2개의 글리칸을 포함한다. 즉, 상기 항체가 전체 항체인 경우, y는 바람직하게 2, 4, 6 또는 8이며, 보다 바람직하게 y는 2 또는 4이며, 그리고 가장 바람직하게 y는 2이다. 상기 항체가 항체 프래그먼트인 경우, y는 1, 2, 3 또는 4이고, 그리고 보다 바람직하게 y는 1 또는 2이다.
바람직한 구현에서, 상기 항체는 모노클로날 항체(mAb)이다. 바람직하게, 상기 항체는 IgA, IgD, IgE, IgG 및 IgM 항체로 구성된 그룹으로부터 선택된다. 더욱 바람직하게, 상기 항체는 IgG1, IgG2, IgG3 또는 IgG4 항체이며, 그리고 가장 바람직하게 상기 항체는 IgG1 항체이다.
본 발명에 따른 방법에서, 푸코실화된 및 비-푸코실화된 글리칸을 포함하는 당 단백질 혼합물을 출발 당 단백질로 사용할 수 있다. 상기 혼합물은 예를 들어. 하나 이상의 푸코실화된(b는 1임) 글리칸 (1) 및/또는 (2) 및/또는 하나 이상의 비-푸코실화된(b는 0임) 글리칸 (1) 및/또는 (2)를 포함하는 당 단백질을 포함할 수 있다. 따라서, 본 발명에 따른 방법에 앞서 푸코실화된 글리칸으로부터 푸코오스를 제거하는 것은 필수적이지는 않지만 선택사항이다.
말단 GlcNAc-부를 포함하는 글리칸을 포함하는 당 단백질은 본 명세서에서 "말단 비-환원성 GlcNAc-단백질(terminal non-reducing GlcNAc-protein)"이라고도 지칭되고, 말단 GlcNAc-부를 포함하는 글리칸은 본 명세서에서 "말단 비-환원성 GlcNAc-글리칸(terminal non-reducing GlcNAc-glycan)"이라고 지칭된다. 용어 "말단 비-환원성 GlcNAc-단백질"은 b가 1인 화학식 (7)의 단백질을 포함하고, 말단 비-환원성 GlcNAc-글리 칸은 b가 1인 화학식 (1)의 글리칸을 포함한다는 것을 주의해야 한다.
말단 비-환원성 GlcNAc-단백질은 하나 이상의 선형 및/또는 하나 이상의 분지형 말단 비-환원성 GlcNAc-글리칸을 포함할 수 있다. 글리칸은 글리칸 코어-당-부의 C1을 통해 바인딩되며, 그리고 상기 코어-당-부는 바람직하게 코어-GlcNAc-부이다. 결과적으로, 단백질에 바인딩된 말단 비-환원성 GlcNAc-글리칸이 화학식 (2)에 따른 글리칸인 경우, d는 1인 것이 바람직하다. 보다 바람직하게, 글리칸은 화학식 (2)에 따른 경우, d는 1이며, e는 1이다.
바람직한 구현에서, 말단 비-환원성 GlcNAc-글리칸의 코어-당 부의 C1은 상기 단백질의 아미노산 잔기의 질소 원자, 보다 바람직하게는 아스파라긴(Asn) 또는 아르기닌(Arg) 아미노산의 측쇄에 있는 아미드 질소 원자에 대한 N-글리코사이드 결합을 통해 단백질에 바인딩된다 . 그러나, 비-환원성 GlcNAc-글리칸의 코어-당-부의 C1은 또한 상기 단백질의 아미노산 잔기의 산소 원자, 보다 바람직하게는 세린(Ser) 또는 트레오닌(Thr) 아미노산의 측쇄에 있는 산소 원자에 대한 O-글리코사이드 결합을 통해 단백질에 바인딩된다. 이 구현에서, 상기 글리칸의 코어-당-부는 O-GlcNAc 부 또는 O-GalNAc 부, 바람직하게는 O-GlcNAc 부인 것이 바람직하다. 비-환원성 GlcNAc-글리칸의 코어-당-부의 C1은 또한 예를 들어, 트립토판(Trp)과 같은 단백질상의 탄소 원자에 대한 C-글리코사이드 결합을 통해 단백질에 바인딩될 수 있다. 상술한 바와 같이, 당 단백질은 하나 이상의 글리칸을 포함할 수 있으며, N-연결, O-연결 및/또는 C-연결된 당 단백질의 조합을 포함할 수 있다.
말단 비-환원성 GlcNAc-글리칸은 단백질의 네이티브 글리코실화 부위에 존재할 수 있지만, 단백질의 상이한 부위에 도입될 수도 있다.
당 단백질이 항체인 경우, 말단 GlcNAc-부를 포함하는 글리칸은 영역 290-305, 전형적으로는 N297의 아스파라긴에서 Fc-프래그먼트의 보존된 N-글리코실화 부위에 부착되는 것이 바람직하다.
본 발명에 따른 방법으로 변형될 수 있는 말단 비-환원성 GlcNAc-단백질의 여러 예들을 도 1에 나타내었다. 도 1(a)는 단일의, 선택적으로 푸코실화된 GlcNAc-부를 포함하는 당 단백질을 도시한다. 이 GlcNAc-글리칸은 예를 들어, N-글리코사이드 또는 O-글리코사이드 결합을 통해 단백질에 연결될 수 있다. 도 1(a)의 당 단백질은 예를 들어, 일반적인 발현에 이어 엔도글리코시다아제 또는 엔도글리코시다아제들의 조합으로 트리밍함으로써 수득될 수 있다. 도 1(b)는 분지 중 하나가 말단 GlcNAc-부를 포함하는 분지형 올리고당 글리칸(이 글리칸은 GnM5라고도 함)을 포함하는 당 단백질을 나타낸다. 코어-GlcNAc 부는 선택적으로 푸코실화될 수 있다. 도 1(b)의 당 단백질은 예를 들어, 스와인소닌(swainsonine)의 존재하에 포유류 시스템에서의 당 단백질의 발현 또는 예를 들어, Lec1 CHO 또는 Pichia와 같은 조작된 숙주 유기체에서의 발현에 의해 수득될 수 있다.
도 1(c)는 분지형 올리고당 글리칸을 포함하는 항체를 나타내며, 여기서 코어-GlcNAc 부는 선택적으로 푸코실화되고, 그리고 여기서 모든 분지는 말단 GlcNAc-부를 포함한다. 도 1(c)의 당 단백질은 예를 들어, 시알리다아제와 갈락토시다아제의 복합 작용시 항체 글리코폼(G0, G1, G2, G0F, G1F 및 G2F)의 일반적인 혼합물을 트리밍하여 얻어질 수 있다.
도 2에는 당 단백질이 항체인 당 단백질의 변형 방법의 일 구현이 도시되어있다. 이 구현에서, 당 유도체 Su(A)는 β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제를 사용하여 Su(A)-Nuc로부터 항체 글리칸의 말단 GlcNAc-부로 이동되어 변형된 항체를 형성한다.
상술한 바와 같이, 당 단백질의 변형을 위한 본 발명에 따른 방법은 말단 GlcNAc-부를 포함하는 글리칸을 포함하는 당 단백질을 제공하는 단계를 더 포함할 수 있으며, 그리고 이에 따라 본 발명은
1) 말단 GlcNAc 부를 포함하는 글리칸을 포함하는 당 단백질을 제공하는 단계로서, 여기서 말단 GlcNAc-부를 포함하는 글리칸은 상기 정의한 화학식 (1) 또는 (2)에 따른 것인, 당 단백질을 제공하는 단계; 및
(2) β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제 또는 이의 돌연변이의 존재하에, 상기 당 단백질을 당 유도체 뉴클레오타이드 Su(A)-Nuc와 접촉시키는 단계로서, 여기서 Su(A)-Nuc는 상기 정의한 화학식 (3)에 따른 것인, 당 단백질을 당 유도체 뉴클레오타이드 Su(A)-Nuc와 접촉시키는 단계
를 포함하는 당 단백질의 변형 방법에 관한 것이다.
예를 들어, 본 발명에 따른 방법에서 변형될 당 단백질이 화학식 (1)에 따른 글리칸을 포함하는 경우, 상기 방법의 단계 (1)에서, 변형될 당 단백질은 적절한 효소, 바람직하게는 엔도-글리코시다아제의 작용에 의해 올리고당 글리칸을 포함하는 당 단백질을 트리밍하는 단계를 포함하는 방법에 의해 제공될 수 있다.
다수의 글리칸에서, 도 1(b) 및 (c)에 나타낸 바와 같이 제 2의 GlcNAc-잔기가 당 단백질에 직접 바인딩된 GlcNac-잔기에 결합된다. 당 단백질에 직접 결합된 GlcNAc-잔기에 제 2의 GlcNAc-잔기가 바인딩된 글리칸은 화학식 (1)에 따른 글리칸을 포함하는 당 단백질을 얻기 위해 트리밍될 수 있다. 트리밍은 상기 2개의 GlcNAc-잔기 사이에서 발생한다.
"적절한 효소(suitable enzyme)"는 효소로서 정의되며, 따라서 트리밍될 글리칸은 기질이다. 본 발명에 따른 방법의 이 특정 구현의 단계 (1)에서 사용되는 바람직한 타입의 효소는 트리밍되는 특정 글리칸 또는 글리칸들에 따라 달라진다. 본 발명에 따른 방법의 이 특정 구현의 바람직한 구현에서, 상기 방법의 이 특정 구현의 단계 (1)에서 효소는 엔도-글리코시다아제의 그룹으로부터 선택된다.
엔도글리코시다아제는 글리칸 구조에서 내부 글리코사이드 연결을 분할할 수 있어 리모델링 및 합성 시도에 이점을 제공한다. 예를 들어, 엔도글리코시다아제는 보존된 글리칸 영역 내의 예측가능한 부위에서 이들이 분할할 때 이종성 글리칸 집단의 용이한 균질화를 위해 사용될 수 있다. 이 점에서 엔도글리코시다아제의 가장 중요한 부류 중 하나는 엔도-β-N-아세틸글루코사미니다아제(EC 3.2.1.96, 일반적으로 Endos와 ENGases로 알려짐)를 포함하며, 이는 N,N'-디아세틸키토비오스 코어에서 β-1,4-글리코사이드 결합을 가수분해하여 당 단백질로부터 N-글리칸을 제거하며(본 명세서에 참고문헌으로 편입된, Wong et al . Chem . Rev . 2011, 111, 4259에 의해 검토됨), 단일 코어 N-연결된 GlcNAc 잔기를 남기는 가수분해성 효소의 부류이다. 엔도-β-N-아세틸글루코사미니다아제는 pauci 만노오스에 특이적인 Endo D; 고 만노오스에 특이적인 Endo A 및 Endo H; 고 만노오스로부터 바이안테너리(biantennary) 복합체 범위의 Endo F 서브타입; 및 푸코실화된 글리칸을 제외하고 대부분의 N-글리칸 구조(고 만노오스/복합체-타입/하이브리드-타입)를 분할할 수 있는 Endo M을 포함하는 일반적인 화학효소 변이체들과 함께 자연에 걸쳐 폭넓게 분포하는 것으로 발견되며, 그리고 고-만노오스 타입 올리고당에 대한 가수분해 활성은 복합체- 및 하이브리드-타입 올리고당에 대한 활성보다 현저히 높다. 이러한 ENGase는 말단(distal) N-글리칸 구조에 특이성을 나타내지만, 이를 디스플레이하는 단백질에 대해서는 특이성을 나타내지 않아, 네이티브 상태에서 당 단백질에서 대부분의 N-연결된 글리칸을 분해하는데 유용하게 한다.
엔도글리코시다아제 F1, F2 및 F3은 네이티브 단백질의 디글리코실화에 가장 적합하다. Endo F1, F2 및 F3의 결합 특이성은 단백질을 변성시키지 않고 모든 종류의 N-연결된 올리고당을 제거할 수 있는 단백질의 디글리코실화에 대한 일반적인 전략을 제시한다. 바이안터너리(Biantennary) 및 트리안터너리(Triantennary) 구조는 각각, 엔도글리코시다아제 F2 및 F3에 의해 즉시 제거될 수 있다. 올리고-만노오스 및 하이브리드 구조는 Endo F1에 의해 제거될 수 있다.
Endo F3은 그 분할이 올리고당의 펩타이드 결합 상태뿐만 아니라 코어 푸코실화의 상태에 민감하다는 점에서 독특하다. 엔도글리코시다아제 F3는 아스파라긴-연결된 바이안터너리 및 트리안터너리 복합 올리고당을 분할한다. 이는 비-푸코실화 바이안터너리 및 트리안터너리 구조를 느린 속도로 분할하지만, 이는 펩타이드-연결된 경우에만 그러하다. 코어 푸코실화 바이안터너리 구조는 Endo F3에 대한 효율적인 기질이며, 활성은 400 배까지 이른다. 올리고만노오스 및 하이브리드 분자에는 아무런 활성이 없다. 예를 들어 Tarentino et al . Glycobiology 1995, 5, 599를 참조바라며, 이는 본 명세서에 참고문헌으로 편입된다.
Endo S는 스트렙토코커스 피오게네스(Streptococcus pyogenes)로부터 분비 된 엔도글리코시다아제이며, Collin et al .(EMBO J. 2001, 20, 3046, 본 명세서에 참고문헌으로 편입됨)에 의해 공개된 바와 같이 글리코사이드 가수분해효소 패밀리 18에도 속한다. 그러나, 위에서 언급한 ENGases와는 달리, Endo S는 보다 규정된 특이성을 지니며 인간 IgGs의 Fc 도메인에 있는 보존된 N-글리칸만을 분할하는데 특이적이며(다른 기질은 현재까지 확인되지 않았다), 이는 상기 효소와 IgG 사이의 단백질 상호작용이 이러한 특이성을 제공함을 제시한다.
Endo S2로도 알려진 Endo S49는 본 명세서에 참고문헌으로 편입된 WO 2013/037824(Genovis AB)에 기재되어 있다. Endo S49는 스트렙토코커스 피오게네스(Streptococcus pyogenes) NZ131로부터 분리되고, Endo S의 동족체이다. Endo S49는 네이티브 IgG에 특이적인 엔도글리코시다아제 활성을 가지고 있으며, Endo S보다 더 다양한 Fc 글리칸들을 분할한다.
바람직한 구현에서, 이 구현의 단계 (1)에서의 효소는 엔도-β-N-아세틸글루코사미니다아제이다. 추가의 바람직한 구현에서, 엔도-β-N-아세틸글루코사미니다아제는 Endo S, Endo S49, Endo F1, Endo F2, Endo F3, Endo H, Endo M 및 Endo A 또는 이들의 조합으로 구성된 그룹으로부터 선택된다.
트리밍될 글리칸이 복합체 타입의 디안터너리 구조인 경우, 엔도-β-N-아세틸글루코사미니다아제는 바람직하게 Endo S, Endo S49, Endo F1, Endo F2 및 Endo F3 또는 이들의 조합으로 구성된 그룹으로부터 선택된다.
당 단백질이 항체이고, 트리밍될 올리고당이 복합체 타입의 디안터너리 구조이고(즉, 도 1(c)에 따름), 그리고 N297에서 IgG 보존된 N-글리코실화 부위에 존재하는 경우, 엔도-β-N-아세틸글루코사미니다아제는 바람직하게 Endo S, Endo S49, Endo F1, Endo F2 및 Endo F3 또는 이들의 조합으로 구성된 그룹으로부터 선택되며, 보다 바람직하게는 Endo S 및 Endo S49 또는 이들의 조합으로 구성된 그룹으로부터 선택된다.
당 단백질이 항체이고, 트리밍될 글리칸이 복합체 타입의 디안테너리 구조이고, 그리고 N297의 IgG 보존된 N-글리코실화 부위에 존재하지 않는 경우, 엔도-β-N-아세틸글루코사미니다아제는 바람직하게는 Endo F1, Endo F2 및 Endo F3, 또는 이들의 조합으로 구성된 그룹으로부터 선택된다.
트리밍될 글리칸이 고 만노오스인 경우, 엔도-β-N-아세틸글루코사미니다아제는 바람직하게 Endo H, Endo M, Endo A 및 Endo F1로 구성된 그룹으로부터 선택된다.
따라서, 본 발명에 따른 방법에서 변형될 당 단백질이 화학식 (1)에 따른 글리칸을 포함하는 경우, 상기 방법의 단계 (1)에서, 변형될 당 단백질은 바람직하게 화학식 (1)에 따른 글리칸을 포함하는 당 단백질을 제공하기 위해, 엔도-β-N-아세틸글루코사미니다아제의 작용에 의해 올리고당 글리칸을 포함하는 당 단백질의 글리칸을 트리밍하는 단계를 포함하는 방법에 의해 제공된다.
다른 바람직한 구현에서, 엔도-β-N-아세틸글루코사미니다아제는 Endo S, Endo S49, Endo F1, Endo F2, Endo F3, Endo H, Endo M, Endo A 및 이들의 어느 조합으로 구성된 그룹으로부터 선택된다. 보다 바람직하게, 엔도-β-N-아세틸글루코사미니다아제는 Endo S, Endo S49, Endo H, Endo F1, Endo F2, Endo F3 및 이들의 어느 조합으로 구성된 그룹으로부터 선택된다. 가장 바람직하게, 엔도-β-N-아세틸글루코사미니다아제는 Endo S 또는 Endo S49이다.
글리코폼 G0, G1, G2, G0F, G1F 및 G2F의 혼합물을 엔도글리코시다아제로 처리하여 화학식 (1)에 따른 글리칸을 포함하는 당 단백질을 제공하는 방법을 도 4에 나타내었다. 도 4는 글리코폼 G0, G1, G2, G0F, G1F 및 G2F의 혼합물(상기 글리코폼은 도 2에 도시되어 있음)을 포함하는 당 단백질을, 본 경우에는 항체를 엔도글리코시다아로 처리한 다음, 예를 들어 β-(1,4)-GalNAcT 효소를 사용하여 N-아지도아세틸갈락토오스아민(GalNAz)를 UDP-GalNAz로부터 전달하여 화학식 (32)에 따른 변형된 항체를 생성하는 것을 보여준다.
예를 들어, 본 발명에 따른 방법에서 변형될 당 단백질이 화학식 (26)에 따른 글리칸을 포함하는 경우, "GnM5"로도 언급되는 화학식 (26)의 선택적으로 푸코 실화된 글리칸을 포함하는 당 단백질은 다양한 방식으로 제공될 수 있다. 이 구현에서, 당 단백질은 예를 들어, 참고 문헌으로 편입된 Kanda et al., Glycobiology 2006, 17, 104-118에 기재된 바와 같이, 스와인소닌의 존재하에 하이브리드 N-당 단백질의 발현에 의해 제공되는 것이 바람직하며, 필요한 경우, 후속적으로 시알리다아제/갈락토시다아제 처리가 이어진다. 대체 접근법은 숙주 유기체의 유전 공학을 포함한다. 예를 들어, Lec1 CHO는 Mns-II의 발현을 위한 유전자가 결여된 CHO 세포주이다. 결과적으로, N-glycan의 생합성은 상층물로부터 순수하게 분리될 수 있는 글리칸의 GnM5-단계에서 불가피하게 멈춘다. 좀 더 광범위한 접근법은 일반적으로 효모 또는 곤충 세포와 같은 하이브리드 또는 복합 N-글리칸을 생산하도록 프로그래밍되지 않은 숙주 유기체의 조작을 수반한다. 그러나, 이러한 비-포유류 숙주 세포(예: GlycoswitchTM)가 GnM5-타입 및 M5-타입의 글리 칸을 포함하여 특정 N-당 단백질의 단일 글리코폼의 선택적인 발현에도 사용될 수 있음이 충분히 입증되었다.
그러므로, 본 발명에 따른 방법에서 변형될 당 단백질이 화학식 (26)에 따른 글리칸을 포함하는 경우, 상기 방법의 단계 (1)에서 화학식 (26)의 선택적으로 푸코실화된 글리칸을 포함하는 당 단백질은 바람직하게는 스와인소닌(swainsonine)의 존재하에 숙주 유기체에서 당 단백질의 발현을 포함하는 방법에 의해 제공된다. 바람직하게, 상기 숙주 유기체는 포유 동물 세포주, 예를 들어, HEK293 또는 NS0 또는 CHO 세포주이다. 생성된 당 단백질은 화학식 (26)의 글리칸(GnM5로도 지칭됨), GalGnM5로 지칭되는 글리칸, SiaGalGnM5로 지칭되는 시알릴화된 글리칸 및/또는 이들의 혼합물을 포함하는 단백질의 혼합물로서 수득될 수 있다. 비-환원성 시알산 및/또는 갈락토오스 부는, 존재하는 경우, 시알리다아제(시알산 부의 제거) 및/또는 β-갈락토시다아제(갈락토오스 부의 제거)로 당 단백질을 처리함으로써 제거될 수 있으며, 이로써 화학식 (26)의 글리칸을 포함하는 당 단백질이 얻어진다. 바람직하게, 시알리다아제 및 β-갈락토시다아제의 처리는 (1b)에서 단일 단계로 일어난다. 이 구현에서, 상기 방법의 단계 (1)에서 변형될 당 단백질은
(1a) 스와인소닌(swainsonine)의 존재하에 숙주 유기체에서 당 단백질을 발현하는 단계; 및
(1b) 화학식 (26)의 글리칸을 포함하는 당 단백질을 얻기 위해 상기 얻어진 당 단백질을 시알리다아제 및 β-갈락토시다아제로 처리하는 단계
를 포함하는 방법에 의해 제공된다.
본 발명에 따른 방법에서 변형될 당 단백질이 화학식 (27)에 따른 글리칸을 포함하는 경우, 상기 방법의 단계 (1)에서, 변형될 당 단백질은 예를 들어, 당 단백질의 글리코폼 G0, G1, G2, G0F, G1F 및 G2F의 혼합물을 시알리다아제 및 갈락토시다아제로 처리하는 것을 포함하는 방법에 의해 제공될 수 있다. 도 3에는 바이안테너리 글리칸을 포함하는 항체의 글리코폼 G0, G1, G2, G0F, G1F 및 G2F가 도시되어있다.
도 4는 글리코폼 G0, G1, G2, G0F, G1F 및 G2F의 혼합물을 시알리다아제 및 갈락토시다아제로 처리한 다음, 예를 들어, β-(1,4)-GalNAcT를 사용하여 UDP-GalNAz로부터 N-아지도아세틸갈락토오스아민(GalNAz)을 전달하여 화학식 (33)에 따른 변형된 항체를 제공하는 것과 같이, 화학식 (27)에 따른 글리칸을 포함하는 당 단백질을, 본 경우에는 항체를 제공하는 방법을 나타낸다.
당 유도체 뉴클레오타이드 Su (A)- Nuc
본 발명에 따른 당 단백질의 변형 방법에서, (돌연변이) β-(1,4)-아세틸갈 락토사미닐트랜스퍼라아제의 작용하에 화학식 (1) 또는 (2)에 따른 글리칸을 포함하는 당 단백질을 당 유도체 뉴클레오타이드 Su(A)-Nuc와 접촉된다. 당 유도체 뉴클레오타이드 Su(A)-Nuc는 화학식 (3)에 따른다:
Figure pct00015
상기 식에서:
a는 0 또는 1이며;
Nuc는 뉴클레오타이드이며;
U는 [C(R1)2]n 또는 [C(R1)2]pO-[C(R1)2C(R1)2O]o-[C(R1)2]q이며, 여기서 n은 0 내지 24 범위의 정수이고; o는 0 내지 12 범위의 정수이고; p 및 q는 독립적으로 0, 1 또는 2이고; 그리고 R1은 H, F, Cl, Br, I 및 선택적으로 치환된 C1-C24 알킬기로 구성된 그룹으로부터 독립적으로 선택되고;
T는 C3-C12(헤테로)아릴렌기이고, 여기서 (헤테로)아릴렌기는 선택적으로 치환되며; 그리고
A는 하기로 구성되는 그룹으로부터 선택된다:
(a) -N3
(b) -C(O)R3
여기서 R3은 선택적으로 치환된 C1-C24 알킬기이고;
(c) -C≡C-R4
여기서 R4는 수소 또는 선택적으로 치환된 C1-C24 알킬기이고;
(d) -SH
(e) -SC(O)R8
여기서 R8은 선택적으로 치환된 C1-C24 알킬기이고;
(f) -SC(V)OR8
여기서 V는 O 또는 S이고, R8은 선택적으로 치환된 C1-C24 알킬기이고;
(g) -X
여기서 X는 F, Cl, Br 및 I로 구성된 그룹으로부터 선택되고;
(h) -OS(O)2R5
여기서 R5는 C1-C24 알킬기, C6-C24 아릴기, C7-C24 알킬아릴기 및 C7-C24 아릴알킬기로 구성된 그룹으로부터 선택되고, 알킬기, 아릴기, 알킬아릴기 및 아릴알킬기는 선택적으로 치환되며;
(i) R11
여기서 R11은 선택적으로 치환된 C2-C24 알킬기이며;
(j) R12
여기서 R12는 선택적으로 치환된 말단 C2-C24 알케닐기이며; 그리고
(k) R13
여기서 R13은 선택적으로 치환된 말단 C3-C24 알케닐기이다.
Nuc는 본 명세서에서 뉴클레오타이드로 정의된다. Nuc는 바람직하게 뉴클레오사이드 모노포스페이트 및 뉴클레오사이드 디포스페이트로 구성된 그룹으로부터 선택되며, 보다 바람직하게 유리딘 디포스페이트(UDP), 구아노신 디포스페이트(GDP), 티미딘 디포스페이트(TDP), 시티딘 디포스페이트(CDP) 및 시티딘 모노포스페이트(CMP)로 구성된 그룹으로부터 선택되며, 보다 바람직하게 유리딘 디포스페이트(UDP), 구아노신 디포스페이트(GDP) 및 시티딘 디포스페이트(CDP)로 구성된 그룹으로부터 선택된다. 가장 바람직하게, Nuc는 유리딘 디포스페이트(UDP)이다. 따라서, 바람직한 구현에서 Su(A)-Nuc(3)은 Su(A)-UDP(31)이다:
Figure pct00016
상기 식에서 U, a, T 및 A는 상기 정의된 바와 같다.
일 구현에서, A는 아지도기-N3이다.
다른 구현에서, A는 케토기 -C(O)R3이고, 여기서 R3은 선택적으로 치환된 C1-C24 알킬기, 바람직하게는 선택적으로 치환된 C1-C12 알킬기, 보다 바람직하게는 선택적으로 치환된 C1-C6 알킬기이다. 보다 더 바람직하게, R3은 메틸, 에틸, n-프로필, i-프로필, n-부틸, s-부틸 또는 t-부틸이고, 가장 바람직하게 R3은 메틸이다.
다른 구현에서, A는 알키닐기이다. 바람직한 구현에서, 알키닐기는 (헤테로)시클로알키닐기, 바람직하게는 (헤테로)시클로옥티닐기이다. 다른 바람직한 구현에서, 알키닐기는 -C≡C-R4이고, 여기서 R4는 수소 또는 선택적으로 치환된 C1-C24 알킬기, 바람직하게는 수소 또는 선택적으로 치환된 C1-C12 알킬기, 그리고 보다 바람직하게는 수소 또는 선택적으로 치환된 C1-C6 알킬기이다. 가장 바람직하게, R4는 수소, 메틸, 에틸, n-프로필, i-프로필, n-부틸, s-부틸 또는 t-부틸이다. 이 구현에서, 알키닐기는 말단 알키닐기인 것이 더욱 바람직하며, 즉 R4는 바람직하게 수소이다.
다른 구현에서, A는 티올기 -SH이다.
다른 구현에서, A는 티올기 -SC(O)R8의 전구체이고, 여기서 R8은 선택적으로 치환된 C1-C24 알킬기이다. 바람직하게, R8은 선택적으로 치환된 C1-C12 알킬기이고, 보다 바람직하게 R8은 선택적으로 치환된 C1-C6 알킬기이고, 그리고 더욱 더 바람직하게 R8은 메틸, 에틸, n-프로필, i-프로필, n-부틸, s-부틸 또는 t-부틸이다. 가장 바람직하게, R8은 메틸이다. 당 단백질의 변형을 위한 본 발명에 따른 방법에서, A가 티올기의 전구체인 당 유도체 뉴클레오타이드가 사용될 수 있다. 상기 공정 동안, 티올 전구체는 티올기로 전환된다.
다른 구현에서, A는 -SC(V)OR8이고, 여기서 V는 O 또는 S이며, 그리고 R8은 선택적으로 치환된 C1-C24 알킬기이다. 바람직한 구현에서, A는 -SC(O)OR8이다. 또 다른 바람직한 구현에서, A는 -SC(S)OR8이다. A가 -SC(O)OR8인 경우 및 A가 -SC(S)OR8인 경우 모두에 있어서, R8은 바람직하게 선택적으로 치환된 C1~C12 알킬기이며, 더욱 바람직하게 R8은 선택적으로 치환된 C1~C6 알킬기이며, 더욱 바람직하게 R8은 메틸, 에틸, n-프로필, i-프로필, n-부틸, s-부틸 또는 t-부틸이다. 가장 바람직하게, R8은 메틸이다.
다른 구현에서, A는 할로겐 X이다. X는 F, Cl, Br 및 I로 구성된 그룹으로부터 선택되고, 바람직하게는 Cl, Br 및 I로 구성된 그룹으로부터 선택되고, 보다 바람직하게는 Cl 및 Br로 구성된 그룹으로부터 선택된다. 가장 바람직하게, X는 Cl이다.
다른 구현에서, A는 설포닐옥시기 -OS(O)2R5이고, 여기서 R5는 C1-C24 알킬기, C6-C24 아릴기, C7-C24 알킬아릴기 및 C7-C24 아릴알킬기로 구성된 그룹으로부터 선택되고, 알킬기, 아릴기, 알킬아릴기 및 아릴알킬기는 선택적으로 치환된다. 바람직하게, R5는 C1-C12 알킬기, C6-C12 아릴기, C7-C12 알킬아릴기 또는 C7-C12 아릴알킬기이다. 보다 바람직하게, R5는 -CH3, -C2H5, C3의 선형 또는 분지형 알킬기, C4의 선형 또는 분지형 알킬기, C6-C10 아릴기 및 C7 알킬아릴기로 구성된 그룹으로부터 선택된다. 보다 더 바람직하게, R5는 메틸기, 에틸기, 페닐기 또는 p-톨릴기이다. 가장 바람직하게 설포닐옥시기는 메실레이트기, -OS(O)2CH3, 벤젠설포네이트기(-OS(O)2(C6H5)) 또는 토실레이트기(-OS(O)2(C6H4CH3))이다.
다른 구현에서, A는 R11이고, 여기서 R11은 선택적으로 치환된 C2-C24 알킬기이며, 바람직하게 선택적으로 치환된 C2-C12 알킬기이며, 그리고 보다 바람직하게 선택적으로 치환된 C2-C6 알킬기이다. 보다 더 바람직하게 R11은 에틸, n-프로필, i-프로필, n-부틸, s-부틸 또는 t-부틸이며, 가장 바람직하게 R11은 에틸이다.
다른 구현에서, A는 R12이고, 여기서 R12는 선택적으로 치환된 말단 C2-C24 알케닐기이다. 본 명세서에서 용어 "말단 알케닐기(terminal alkenyl group)"은 탄소-탄소 이중결합이 알케닐기의 말단에 위치하는 알케닐기를 의미한다. 따라서, 말단 C2-C24 알케닐기는 C=CH2 부로 종결한다. 바람직하게, R12는 선택적으로 치환된 말단 C2-C12 알케닐기이며, 그리고 보다 바람직하게, 선택적으로 치환된 말단 C2-C6 알케닐기이다. 보다 바람직하게, 말단 알케닐기는 선형 알케닐기, 바람직하게는 비치환된 선형 알케닐기이다. 보다 더 바람직하게, R12는 C(H)=CH2, -CH2-C(H)=CH2, -CH2-CH2-C(H)=CH2, -CH2-CH2-CH2-C(H)=CH2 및 -CH2-CH2-CH2-CH2-C(H)=CH2이다. 보다 더 바람직하게, R12는 -C(H)=CH2, -CH2-C(H)=CH2 및 -CH2-CH2-C(H)=CH2로 구성된 그룹으로부터 선택된다. 가장 바람직하게는, R12는 -C(H)=CH2이다.
다른 구현에서, A는 R13이고, 여기서 R13은 선택적으로 치환된 C3-C24 알레닐기이다. 본 명세서에서 용어 "말단 알레닐기(terminal allenyl group)"는 C=C=C 부가 알레닐기의 말단에 위치한 알레닐기를 의미한다. 따라서, 말단 C3-C24 알케닐기는 -C=C=CH2 부로 종결한다. 바람직하게, R13은 선택적으로 치환된 말단 C3-C12 알케닐기, 보다 바람직하게는 선택적으로 치환된 C3-C6 알케닐기이다. 더욱 바람직하게, 말단 알레닐기는 선형 알레닐기, 바람직하게는 비치환된 선형 알레닐기이다. 보다 바람직하게 R13은 -C(H)=C=CH2, -CH2-C(H)=C=CH2, -CH2-CH2-C(H)=C=CH2 및 -CH2-CH2-CH2-C(H)=C=CH2로 구성되는 그룹으로부터 선택된다. 보다 더 바람직하게 R13은 -C(H)=C=CH2 및 -CH2-C(H)=C=CH2로 구성되는 그룹으로부터 선택된다. 가장 바람직하게 R13은 -C(H)=C=CH2이다. A가 R13인 경우, 특히 Su(A)-Nuc(3)에서 U 및 T가 모두 존재하지 않는 것, 즉 a가 0인 것이 바람직하며, 그리고 U가 [C(R1)2]n인 경우, n은 0이며, 그리고 U가 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q인 경우, o, p 및 q는 모두 0이다.
Su(A)-Nuc (3)에서, T는 C3-C12 (헤테로)아릴렌기이고, 여기서 (헤테로)아릴렌기는 선택적으로 치환된다. 바람직한 구현에서, T는 부재이다(a는 0임). 또 다른 바람직한 구현에서, T가 존재한다(a는 1임). a가 1인 경우, (3)에서 (헤테로)아릴렌기 T는 A로 치환되고, 여기서 A는 상기 정의된 바와 같다.
(헤테로)아릴렌기 T는 선택적으로 하나 이상의 치환기 R2로 추가로 치환되고, 여기서 R2는 할로겐(-F, -Cl, -Br, -I, 바람직하게는 -F, -Cl, -Br), -CN, -NO2, -C(O)R9, -C(O)OR9, -C(O)N(R10)2, C1-C12 알킬기, C2-C12 알케닐기, C2-C12 알키닐기, C3-C12 시클로알킬기, C5-C12 시클로알케닐기, C8-C12 시클로알키닐기, C1-C12 알콕시기, C2-C12 알케닐옥시기, C2-C12 알키닐옥시기, C3-C12 시클로알킬옥시기, 아미노기(바람직하게 -N(R10)2), 옥소기 및 -Si(R7)3 기로 구성된 그룹으로부터 독립적으로 선택되며, 여기서 알킬기, 알케닐기, 알키닐기, 시클로알킬기, 시클로알케닐기, 시클로알키닐기, 알콕시기, 알케닐옥시기, 알키닐옥시기 및 시클로알킬옥시기는 선택적으로 O, N 및 N으로 구성된 그룹으로부터 선택되는 하나 이상의 헤테로 원자에 의해 차단되며, 그리고 여기서 R7은 C1-C12 알킬기, C2-C12 알케닐기, C2-C12 알키닐기, C3-C12 시클로알킬기, C1-C12 알콕시기, C2-C12 알케닐옥시기, C2-C12 알키닐옥시기 및 C3-C12 시클로알킬옥시기로 구성된 그룹으로부터 독립적으로 선택되며, 여기서, 알킬기, 알케닐기, 알키닐기, 시클로알킬기, 알콕시기, 알케닐옥시기, 알키닐옥시기 및 시클로알킬옥시기 선택적으로 치환되며, 여기서 R9는 C1-C12 알킬기이고, 그리고 여기서 R10은 수소 및 C1-C12 알킬기로부터 독립적으로 선택된다. 바람직하게, R9는 C1-C6 알킬기, 더욱 더 바람직하게는 C1-C4 알킬기이고, 가장 바람직하게는 메틸, 에틸, n-프로필, i-프로필, n-부틸, s-부틸 또는 t-부틸기이다. 바람직하게 R10은 수소 또는 C1-C6 알킬기, 보다 바람직하게는 수소 또는 C1-C4 알킬기이고, 가장 바람직하게 R10은 수소, 메틸, 에틸, n-프로필, i-프로필, n-부틸, s-부틸 또는 t-부틸기이다.
바람직하게, R2는 존재하는 경우, -F, -Cl, -Br, -I, -CN, -NO2, -C(O)R9, -C(O)OR9, -C(O)N(R10)2, C1-C12 알킬기, C1-C12 알콕시기, 아미노기(-N(R10)2), 옥소기 및 Si(R7)3기로 구성된 그룹으로부터 독립적으로 선택되며, 여기서 R7, R9, R10 및 R7, R9, R10의 바람직한 구현은 상기 정의된 바와 같다.
보다 바람직하게는, R2는 존재하는 경우, -F, -Cl, -Br, -CN, -NO2, -C(O)R9, -C(O)OR9, -C(O)N(R10)2, C1-C6 알킬기, C1-C6 알콕시기, 아미노기, 옥소기 및 -Si(R7)3기로 구성된 그룹으로부터 독립적으로 선택되며, 여기서 R7, R9, R10 및 R7, R9, R10의 바람직한 구현은 상기 정의된 바와 같다.
보다 바람직하게는, R2는 존재하는 경우, -F, -Cl, -Br, -CN, -NO2, -C(O)R9, -C(O)OR9, -C(O)N(R10)2, C1-C4 알킬기 및 C1-C4 알콕시기로 구성된 그룹으로부터 독립적으로 선택되며, 여기서 R9 및 R10, 및 R9 및 R10의 바람직한 구현은 상기 정의된 바와 같다.
보다 더 바람직하게, R2는 존재하는 경우, -F, -Cl, -Br, -CN, -NO2, 메틸, 메톡시, 에틸, 에톡시, n-프로필, n-프로폭시, i-프로필, i-프로폭시, n-부틸, n-부톡시, s-부틸, s-부톡시, t-부틸 및 t-부톡시로 구성된 그룹으로부터 독립적으로 선택된다. 가장 바람직하게, R2는 존재하는 경우, -F, -Cl, -Br, -CN, -NO2, 메틸 및 메톡시로 구성된 그룹으로부터 독립적으로 선택된다.
바람직한 구현에서, (3)에서 (헤테로)아릴렌기는 비치환된 것이다. 다른 바람직한 구현에서, (3)에서 (헤테로)아릴렌기는 하나 이상의 치환기 R2를 포함하며, 여기서 R2 및 R2의 바람직한 구현은 상기 정의된 바와 같다.
본 명세서에서 용어 "(헤테로)아릴렌기((hetero)arylene group)"는 아릴렌기뿐만 아니라 헤테로아릴렌기를 지칭한다. 본 명세서에서 용어 "(헤테로)아릴렌기"는 모노시클릭 (헤테로)아릴렌기뿐만 아니라 비시클릭 (헤테로)아릴렌기를 지칭한다. Su(A)-Nuc (3)에서 (헤테로)아릴렌기는 어느 아릴렌기 또는 어느 헤테로아릴렌기일 수 있다.
본 발명에 따른 방법의 바람직한 구현에서, (3)에서 (헤테로)아릴렌기 T는 페닐렌기, 나프틸렌기, 안트라사이클렌기, 피롤릴렌기, 피롤리우밀렌기, 퓨라닐렌기, 티오페닐렌기(즉, 티오퓨라닐렌기), 피라졸릴렌기, 이미다졸릴렌기, 피리미디니우밀렌기, 이미다졸리우밀렌기, 이속사졸릴렌기, 옥사졸릴렌기, 옥사졸리우밀렌기, 이소티아졸릴렌기, 티아졸릴렌기, 1,2,3-트리아졸릴렌기, 1,3,4-트리아졸릴렌기, 디아졸릴렌기, 1-옥사-2,3-디아졸릴렌기, 1-옥사-2,4-디아졸릴렌기, 1-옥사-2,5-디아졸릴렌기, 1-옥사-3,4-디아졸릴렌기, 1-티아-2,3-디아졸릴렌기, 1-티아-2,4-디아졸릴렌기, 1-티아-2,5-디아졸릴렌기, 1-티아-3,4-디아졸릴렌기, 테트라졸릴렌기, 피리디닐렌기, 피리다지닐렌기, 피리미디닐렌기, 피라지닐렌기, 피라지닐렌기, 피리디니우밀렌기, 피리미디니우밀렌기, 벤조퓨라닐렌기, 벤조티오페닐렌기, 벤즈이미다졸릴렌기, 인다졸린렌기, 벤조트리아졸릴렌기, 피롤로[2,3-b]피리디닐렌기, 피롤로[2,3-c]피리디닐렌기, 피롤로[3,2-c]피리디닐렌기, 피롤로[3,2-b]피리 디닐렌기, 이미다조[4,5-b]피리디닐렌기, 이미다조[4,5-c]피리디닐렌기, 피라졸로[4,5-d]피리디닐렌기, 피라졸로[3,4-c]피리디닐렌기, 피라졸로[3,4-c]피리디닐렌기, 피라졸로[3,4-b]피리디닐렌기, 이소인돌릴렌기, 인다졸릴렌기, 퓨리닐렌기, 인돌리니닐렌기, 이미다조[1,2-a]피리디닐렌기, 이미다조[1,5-a]피리디닐렌기, 피라졸로[1,5-a]피리디닐렌기, 피롤로[1,2-b]피리다지닐렌기, 이미다조[1,2-c]피리미디닐렌기, 퀴놀리닐렌기, 이소퀴놀리닐렌기, 신놀리닐렌기, 퀴나졸리닐렌기, 퀴녹살리닐렌기, 프탈라지닐렌기, 1,6-나프티리디닐렌기, 1,7-나프티리디닐렌기, 1,8-나프티리디닐렌기, 1,5-나프티리디닐렌기, 2,6-나프티리디닐렌기, 2.7-나프티리디닐렌기, 피리도[3,2-d]피리미디닐렌기, 피리도[4,3-d]피리미디닐렌기, 피리도[3,4-d]피리미디닐렌기, 피리도 [2,3-d]피리미디닐렌기, 피리도[2,3-b]피라지닐렌기, 피리도[3,4-b]피라지닐렌기, 피리미도[5,4-d]피리미디닐렌기, 피라지노[2,3-b]피라지닐렌기 및 피리미도[4,5-d]피리미디닐렌기로 구성된 그룹으로부터 선택되고, 모든 기는 선택적으로 하나 이상의 치환기 R2로 치환되고, 여기서 R2 및 R2의 바람직한 구현은 상기 정의된 바와 같다.
추가의 바람직한 구현에서, (헤테로)아릴렌기 T는 페닐렌기, 피리디닐렌기, 피리디니우밀렌기, 피리미디닐렌기, 피리미디니우밀렌기, 피라지닐렌기, 피라디지닐렌기, 피롤릴렌기, 피롤리우밀렌기, 퓨라닐렌기, 티오페닐렌기(즉, 티오퓨라닐렌기), 디아졸릴렌기, 퀴놀리닐렌기, 이미다졸릴렌기, 피리미디니우밀렌기, 이미다졸리우밀렌기, 옥사졸릴렌기 및 옥사졸리우밀렌기로 구성된 그룹으로부터 선택되며, 모든 기는 선택적으로 하나 이상의 치환기 R2로 치환되고, 여기서 R2 및 R2의 바람직한 구현은 상기 정의된 바와 같다.
보다 바람직하게, (헤테로)아릴렌기 T는 페닐렌기, 피리디닐렌기, 피리디니우밀렌기, 피리미디닐렌기, 피리미디니우밀렌기, 이미다졸릴렌기, 피리미디니우밀렌기, 이미다졸리우밀렌기, 피롤릴렌기, 퓨라닐렌기 및 티오페닐렌기로 구성된 그룹으로부터 선택되며, 모든 기는 선택적으로 하나 이상의 치환기 R2로 치환되고, 여기서 R2 및 R2의 바람직한 구현은 상기 정의된 바와 같다.
보다 바람직하게, (헤테로)아릴렌기 T는 페닐렌기, 이미다졸릴렌기, 이미다졸리우밀렌기, 피리미디니우밀렌기, 피리디닐렌기 및 피리디니우밀렌기로 구성된 그룹으로부터 선택되며, 모든 기는 선택적으로 하나 이상의 치환기 R2로 치환되고, 여기서 R2 및 R2의 바람직한 구현은 상기 정의된 바와 같다.
Su(A)-Nuc (3)에서, U는 [C(R1)2]n 또는 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q이며, 상기 식에서, n은 0 내지 24 범위의 정수이며; o는 0 내지 12 범위의 정수이고; p 및 q는 독립적으로 0, 1 또는 2이고; R1은 H, F, Cl, Br, I 및 선택적으로 치환된 C1-C24 알킬기로 구성된 그룹으로부터 독립적으로 선택된다. 바람직하게, U는 [C(R1)2]n이다.
본 발명에 따른 방법의 바람직한 구현에서, U는 부재하는 것으로, 즉 n, p, o 및 q는 모두 0이다.
본 발명에 따른 방법의 바람직한 구현에서, U가 존재하는 것으로, 즉 n, p, o 및 q는 모두 0이 아니다. 결과적으로, 이 구현에서, U가 [C(R1)2]n인 경우, n은 1 내지 24 범위의 정수이며, U가 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q인 경우, o는 1 내지 12 범위의 정수이며, 그리고/또는 p는 1 또는 2이고, 그리고/또는 q는 1 또는 2이다. 즉, U가 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q인 경우, o, p 및 q 중 적어도 하나는 0이 아니다.
U가 [C(R1)2]n인 경우, n은 0 내지 24 범위의 정수이다. 바람직한 구현에서, n은 1 내지 24 범위, 바람직하게는 1 내지 12 범위의 정수이다. 이 구현에서, 더욱 바람직하게 n은 1, 2, 3, 4, 5, 6, 7 또는 8이고, 더욱 더 바람직하게 n은 1, 2, 3, 4, 5 또는 6이고, 더욱 더 바람직하게 n은 1, 2, 3 또는 4, 보다 더 바람직하게 n은 1, 2 또는 3이고, 보다 바람직하게 n은 1 또는 2이며, 그리고 가장 바람직하게 n은 1이다. 또 다른 바람직한 구현에서, n은 0이다. n이 0 또는 1인 것이 특히 바람직하다.
U가 [C(R1)2]n이며 n이 1 이상인 경우, R1은 독립적으로 H, F, Cl, Br, I 및 선택적으로 치환된 C1-C24 알킬기로 구성된 그룹으로부터 선택되고, 바람직하게는 H, F, Cl, Br, I 및 선택적으로 치환된 C1-C12 알킬기, 그리고 보다 바람직하게는 H, F, Cl, Br, I 및 선택적으로 치환된 C1-C6 알킬기로 구성된 그룹으로부터 선택된다. 더욱 바람직하게, R1은 H, F, Cl, Br, I, 메틸기, 에틸기, n-프로필기, i-프로필기, n-부틸기, s-부틸기 또는 t-부틸기로 구성된 그룹으로부터 독립적으로 선택된다. 보다 더 바람직하게, R1은 H, F, Cl 및 메틸로 구성된 그룹으로부터 독립적으로 선택되고, 가장 바람직하게 R1은 H 및 F로 구성된 그룹으로부터 독립적으로 선택된다.
U가 [C(R1)2]n이며 n이 1 또는 2인 경우, Su(A)-Nuc에서 -[C(R1)2]n- 부의 바람직한 예는 -(CH2)-, -(CF2)-, -(CCl2)-, -(CBr2)-, -(CMe2)-, -(CH2CH2)-, -(CH2CF2)-, -(CH2CCl2)-, -(CH2CBr2)-, -(CH2CI2)-, -(CH2CMe2)-, -(CF2CF2)-, -(CCl2CCl2)-, -(CBr2CBr2)- and -(CMe2CMe2)-, 보다 바람직하게 -(CH2)-, -(CF2)-, -(CH2CH2)-, -(CH2CF2)- 및 -(CF2CF2)-를 포함한다.
U가 [C(R1)2]n이며 n이 3 이상인 경우, Su(A)-Nuc에서 -[C(R1)2]n- 부의 바람직한 예는, 예를 들어, -(C3H6)-, -(C3F6)-, -(C3Cl6)-, -(C3Br6)-, -(CH2CH2CF2)-, -(CH2CH2CCl2)-, -(CH2CH2CBr2)- and -(C4H8)-와 같이 -(CnH2n)-, -(CnF2n)-, -(CnCl2n)-, -(CnBr2n)-, -(C(n-1)H2 (n-1)CF2)-, -(C(n-1)H2 (n-1)CCl2)-, -(C(n-1)H2 (n-1)CBr2)- 및 -(C(n-1)H2 (n-1)CMe2)-를 포함한다. 보다 바람직한 예는 -(CnH2n)-, -(CnF2n)-, 예를 들어, -(C3H6)-, -(C4H8)-, -(C3F6)- 및 -(C4F8)-를 포함한다.
U가 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q인 경우, o는 0 내지 12 범위의 정수이고, p 및 q는 독립적으로 0, 1 또는 2이다. 바람직하게, o는 1 내지 10 범위의 정수이고, 더욱 바람직하게는 o는 1, 2, 3, 4, 5, 6, 7 또는 8이고, 더욱 더 바람직하게 o는 1, 2, 3, 4, 5 또는 6이고, 더욱 더 바람직하게 o는 1, 2, 3 또는 4이고, 보다 더 바람직하게 o는 1, 2 또는 3이고, 보다 더 바람직하게 o는 1 또는 2이며, 그리고 가장 바람직하게 o는 1이다. 다른 바람직한 구현에서, o는 0이다. o가 0, 1 또는 2인 것이 특히 바람직하다. o가 0인 경우, p는 0이고, q는 1 또는 2이고, q가 0인 경우, p는 1 또는 2인 것이 더욱 바람직하다.
U가 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q이며, o 및/또는 p 및/또는 q가 1 이상인 경우, R1은 독립적으로 H, F, Cl, Br, I 및 선택적으로 치환된 C1-C24 알킬기로 구성된 그룹으로부터 선택되고, 바람직하게는 H, F, Cl, Br, I 및 선택적으로 치환된 C1-C12 알킬기로 구성된 그룹으로부터, 그리고 보다 바람직하게는 H, F, Cl, Br, I 및 선택적으로 치환된 C1-C6 알킬기로 구성된 그룹으로부터 선택된다. 더욱 바람직하게, R1은 H, F, Cl, Br, I, 메틸기, 에틸기, n-프로필기, i-프로필기, n-부틸기, s-부틸기 또는 t-부틸기로 구성된 그룹으로부터 독립적으로 선택된다. 보다 더 바람직하게, R1은 H, F, Cl 및 메틸로 구성된 그룹으로부터 독립적으로 선택된다. 가장 바람직하게, R1은 H이다.
U가 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q인 경우, Su(A)-Nuc에서 -[C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q- 부의 바람직한 예는 -CH2-O-, -(CH2)2-O-, -O-CH2-, -O-(CH2)2-, -CH2-O-(CH2CH2O)o-, -(CH2)2-O-(CH2CH2O)o-, -O-(CH2CH2O)o-, -O-(CH2CH2O)o-CH2-, -O-(CH2CH2O)o-(CH2)2-, -CH2-O-(CH2CH2O)o-CH2-, -CH2-O-(CH2CH2O)o-(CH2)2-, -(CH2)2-O-(CH2CH2O)o-CH2- 및 -(CH2)2-O-(CH2CH2O)o-(CH2)2-를 포함하며, 여기서 o는 1, 2, 3, 4, 5 또는 6이며, 바람직하게 o는 1, 2, 3 또는 4이며, 보다 바람직하게 o는 1 또는 2이며, 가장 바람직하게 o는 1이다.
본 발명에 따른 방법에서, n, o, p 및 q는 모두 0이 아닌 것이 바람직하다. 따라서, U가 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q이며, 그리고 o, p 및 q는 0인 경우, a는 바람직하게 0이 아니고, 그리고/또는 U가 [C(R1)2]n이고 n이 0인 경우, a는 바람직하게는 0이 아니다. 즉, U가 없는 경우(즉, o, p 및 q가 0이고 n이 0인 경우), a는 0이 아닌 것이 바람직하다.
본 발명에 따른 방법의 바람직한 구현에서, a는 0이고, U는 [C(R1)2]n이며, 그리고 n은 1 내지 24 범위의 정수이다. 이 구현에서, 당 유도체 뉴클레오타이드 Su(A)-Nuc는 U가 [C(R1)2]n인 하기 정의된 바와 같은 화학식 (9)에 따른 것이다. 이 구현에서, a는 0이고 n은 1 내지 12 범위이고, 더욱 바람직하게 a는 0이고 n은 1, 2, 3, 4, 5, 6, 7 또는 8이며, 더욱 바람직하게 a는 0이며, n은 1, 2, 3, 4, 5 또는 6이고, 더욱 바람직하게 a는 0이고, n은 1, 2, 3 또는 4이고, 더욱더 바람직하게 a는 0이고, n은 1 또는 2이고, 그리고 가장 바람직하게는 a는 0이고 n은 1이다.
[C(R1)2]n의 바람직한 예는 상기 보다 상세하게 기재된 바와 같다.
본 발명에 따른 방법의 다른 바람직한 구현에서, a는 0이고, U는 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q이며, p, o 및 q는 모두 0이 아니며, 즉 o는 1 내지 12 범위의 정수이고, 그리고/또는 p는 1 또는 2이며, 그리고/또는 q는 1 또는 2이다. 이 구현에서, 당 유도체 뉴클레오타이드 Su(A)-Nuc는 U가 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q인 하기 정의된 바와 같은 화학식(9)에 따른 것이다. 이 구현에서, a는 0이며, 그리고 o는 1 내지 12 범위이고, 보다 바람직하게 a는 0이며, o는 1 내지 10 범위이고, 더욱 바람직하게 a는 0이고 o는 1, 2, 3, 4, 5, 6, 7 또는 8이고, 더욱더 바람직하게 a는 0이고, o는 1, 2, 3, 4, 5 또는 6이고, 더욱더 바람직하게 a는 0이고, o는 1, 2, 3 또는 4이고, 더욱더 바람직하게는 a는 0이고 o는 1 또는 2이고, 가장 바람직하게는 a는 0이고, o는 1이다. 또한, 이 구현에서, p 및 q는 독립적으로 0, 1 또는 2이다. [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q의 바람직한 예는 상기에서 보다 상세하게 설명된 바와 같다.
다른 바람직한 구현에서, a는 1이고, U는 [C(R1)2]n이고, n은 1 내지 24 범위의 정수이다. 이 구현에서, a는 1이고 n은 1 내지 12 범위인 것이 보다 바람직하며, 더욱 바람직하게 a는 1이고, n은 1, 2, 3, 4, 5, 6, 7 또는 8이고, 보다 바람직하게 a는 1이며, n은 1, 2, 3, 4, 5 또는 6이며, 보다 바람직하게 a는 1이며, n은 1, 2, 3 또는 4이며, 보다 바람직하게 a는 1이며, n은 1 또는 2이며, 가장 바람직하게는 a는 1이고, n은 1이다. [C(R1)2]n의 바람직한 예는 상기에서 보다 상세하게 설명된 바와 같다.
다른 바람직한 구현에서, a는 1이고, U는 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q이고, o는 1 내지 12 범위의 정수이며, 그리고 p 및 q는 독립적으로 0, 1 또는 2이다. 이 구현에서, a는 1이고, U는 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q이며, o는 1 내지 10 범위인 것이 바람직하며, 보다 바람직하게 a는 1이며, U는 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q이며, o는 1, 2, 3, 4, 5, 6, 7 또는 8이고, 더욱 바람직하게 a는 1이며, U는 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q이며, o는 1, 2, 3, 4, 5 또는 6이고, 더욱 바람직하게 a는 1이고, U는 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q이며, o는 1, 2, 3 또는 4이고, 더욱 바람직하게 a는 1이고, U는 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q이고, o는 1 또는 2이며, 그리고 가장 바람직하게 a는 1이고, U는 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q이고, o는 1이다. 또한, 이 구현에서, p 및 q는 독립적으로 0, 1 또는 2이다. [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q의 바람직한 예는 상기에서 보다 상세하게 설명된 바와 같다.
본 발명에 따른 방법의 바람직한 구현에서, a는 0이고 U는 존재하며, 즉 a는 0이고, U가 [C(R1)2]n일 때, n은 1 내지 24 범위의 정수이고, 또는 a가 0이고, U가 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q인 경우, o는 1 내지 12 범위의 정수이며, 그리고/또는 p는 1 또는 2이며, 그리고/또는 q는 1 또는 2이다. 즉, 본 구현에서 U가 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q인 경우, o, p 및 q 중 적어도 하나는 0이 아니며, a는 0이다.
본 발명에 따른 방법의 다른 바람직한 구현에서, a는 1이고 U는 부재이다. U가 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q이며, p, o 및 q 모두가 0인 경우, 또는 U가 [C(R1)2]n이며 n이 0인 경우, U가 부재이다. 이 구현에서, 당 유도체 뉴클레오타이드 Su(A)-Nuc는 하기 정의된 바와 같은 화학식 (10)에 따른다.
본 발명에 따른 방법의 바람직한 구현으로, 당 유도체 뉴클레오타이드 Su(A)-Nuc는 화학식 (9) 또는 (10)에 따른다:
Figure pct00017
상기 식에서, Nuc, A, T 및 U, 및 이의 바람직한 구현은 상기 정의된 바와 같다.
Su(A)-Nuc가 화학식 (9)에 따르는 경우, U는 존재하거나 부재할 수 있다. 상술한 바와 같이, U는 [C(R1)2]n 또는 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q이며, 그리고 U는 n, p, o 및 q 모두가 0인 경우에 부재이다.
Su(A)-Nuc가 화학식 (9)에 따르고, U가 부재인 경우, A는 R12 및 R13으로 구성된 그룹으로부터 선택되는 것이 바람직하다. R12 및 R13의 바람직한 구현은 상기에 더욱 상세하게 기재되어있다. (9)에서 U가 부재인 경우, R12는 -C(H)=CH2이고, R13은 -C(H)=C=CH2인 것이 특히 바람직하다. Nuc는 바람직하게는 UDP이다. 특히 바람직한 구현으로, Su(A)-Nuc는 화학식 (9)에 따르고, U는 부재이고 A는 R13이며, 여기서 R13은 -C(H)=C=CH2이다. 따라서, 특히 바람직한 구현에서, Su(A)-Nuc는 화학식 (44)에 따른다:
Figure pct00018

Su(A)-Nuc가 화학식 (9)에 따르고, U가 존재하는 경우에, U는 [C(R1)2]n인 것이 바람직하다. 이 구현에서, n은 1 내지 24 범위의 정수인 것이 바람직하고, 상기한 바와 같이, n은 1 내지 12의 범위인 것이 더욱 바람직하고, 더욱 바람직하게는 n은 1, 2, 3, 4, 5, 6, 7 또는 8이고, 더욱 바람직하게 n은 1, 2, 3, 4, 5 또는 6이고, 더욱 바람직하게 n은 1, 2, 3 또는 4, 보다 바람직하게 n은 1 또는 2이며, 가장 바람직하게 n은 1이다.
또한, Su(A)-Nuc가 화학식 (9)에 따르는 경우, 그리고 U가 [C(R1)2]n인 경우, (9)에서 -[C(R1)2]n- 부의 바람직한 예는, n이 1 또는 2인 경우에, -(CH2)-, -(CF2)-, -(CCl2)-, -(CBr2)-, -(CMe2)-, -(CH2CH2)-, -(CH2CF2)-, -(CH2CCl2)-, -(CH2CBr2)-, -(CH2CI2)-, -(CH2CMe2)-, (CF2CF2)-, -(CCl2CCl2)-, -(CBr2CBr2)- 및 -(CMe2CMe2)-, 그리고 n이 3 이상인 경우에, 예를 들어, -(C3H6)-, -(C3F6)-, -(C3Cl6)-, -(C3Br6)-, -(CH2CH2CF2)-, -(CH2CH2CCl2)-, -(CH2CH2CBr2)-, -(C4H8)-, -(C4F8)-, -(C4Cl8)- 및 -(C4Br8)-와 같이 -(CnH2n)-, -(CnF2n)-, -(CnCl2n)-, -(CnBr2n)-, -(C(n-1)H2 (n-1)CF2)-, -(C(n-1)H2 (n-1)CCl2)-, -(C(n-1)H2 (n-1)CBr2)- 및 -(C(n-1)H2 (n-1)CMe2)-를 포함한다.
특히 바람직한 구현에서, U가 [C(R1)2]n인 경우, n은 1 또는 2이며, 그리고 R1은 H 또는 F이다. 결론적으로, 특히 바람직한 구현에서, U가 [C(R1)2]n이며, 그리고 (9)에서 -[C(R1)2]n- 부은 -(CH2)-, -(CF2)-, -(CH2CH2)-, -(CF2CF2)- 또는 -(CH2CF2)-이다.
Su(A)-Nuc가 화학식 (9)에 따르는 경우에, U가 [C(R1)2]n인 경우와 U가 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q인 경우 모두에서, A는 -N3, -C=C-R4, -SH, -SC(O)R8, -SC(V)OR8, -X 및 -OS(O)2R5으로 구성되는 그룹으로부터 선택되는 것이 바람직하며, 여기서 V, R4, R5, R8, 및 이의 바람직한 구현은 상기 정의된 바와 같다. X는 F, Cl, Br 또는 I이고, A가 X인 경우, X는 Cl 또는 Br인 것이 바람직하며, 그리고 가장 바람직하게 X는 Cl이다. 보다 바람직하게, A는 -N3, -SH, -SC(O)CH3 및 -X로 구성된 그룹으로부터 선택되고, 여기서 X는 바람직하게 Cl 또는 Br, 보다 바람직하게는 Cl이다. U가 [C(R1)2]n인 것이 더욱 바람직하다.
또한, Su(A)-Nux가 화학식 (9)에 따르는 경우에, U가 [C(R1)2]n인 경우와 U가 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q인 경우 모두에 있어서, Nuc는 UDP인 것이 바람직하다. U가 [C(R1)2]n인 것이 더욱 바람직하다.
화학식 (9)에 따른 여러 가지 특히 바람직한 당 유도체 뉴클레오타이드가 하기에 제시된다. 본 발명에 따른 방법의 바람직한 구현에서, Su(A)-Nuc는 따라서 화학식 (17), (18), (19), (20), (21) 또는 (22)에 따른다:
Figure pct00019

상기 식에서:
X는 F, Cl, Br 또는 I이고;
V는 O 또는 S이고;
R8은 선택적으로 치환된 C1-C24 알킬기이고;
r은 0 또는 1이고;
s는 1 내지 10 범위의 정수이고;
t는 1 내지 10 범위의 정수이고; 그리고
u는 0 내지 10 범위의 정수이다.
(19)에서, X는 F, Cl, Br 및 I로 구성된 그룹으로부터 선택되고, 바람직하게는 X는 Cl 또는 Br이고,보다 바람직하게 X는 Cl이다.
(20)에서, r이 0인 경우와 r이 1인 경우 모두에 있어서, 바람직하게 s는 1, 2, 3, 4, 5 또는 6이다. 더욱 바람직하게, r이 0인 경우와 r이 1인 경우 모두에 있어서, s는 1, 2, 3 또는 4이며, 보다 바람직하게, r이 0인 경우와 r이 1인 경우 모두에 있어서, s는 1, 2 또는 3이고, 더욱 바람직하게 r이 0인 경우와 r이 1인 경우 모두에 있어서, s는 2 또는 3이다. 특히 s가 2 또는 3인 경우, 본 발명에 따른 방법의 이 구현에 의해 얻어지는 변형된 당 단백질의 말레이미드를 통한 후속적인 컨주게이션은 특히 안정한 말레이미드 컨주게이트를 생성한다. r이 0인 경우와 r이 1인 경우 모두에 있어서, 바람직하게 R8은 선택적으로 치환된 C1-C12 알킬기이고, 더욱 바람직하게 r이 0인 경우와 r이 1인 경우 모두에 있어서, R8은 선택적으로 치환된 C1-C6 알킬기이고, 더욱더 바람직하게, r이 0인 경우와 r이 1인 경우 모두에 있어서, R8은 메틸, 에틸, n-프로필, i-프로필, n-부틸, s-부틸 또는 t-부틸이다. 가장 바람직하게, r이 0인 경우와 r이 1인 경우 모두에 있어서, R8은 메틸이다. (20)에서, r이 0인 경우와 r이 1인 경우 모두에 있어서, R8이 메틸이고 s가 1, 2, 3 또는 4인 것이 특히 바람직하고, 보다 특히 바람직하게 r이 0인 경우와 r이 1인 경우 모두 있어서, R8이 메틸이고 s가 1, 2 또는 3이며, 그리고 가장 바람직하게 r이 0인 경우와 r이 1인 경우 모두 있어서, R8은 메틸이고 s는 1이다. 더욱 바람직하게는 r은 0이다.
(21)에서, 바람직하게 t는 1, 2, 3, 4, 5 또는 6이다. 보다 바람직하게, t는 1, 2, 3 또는 4이고, 더욱 바람직하게 t는 1, 2 또는 3이고, 가장 바람직하게 t는 2 또는 3이다. 특히 t가 2 또는 3일 때, 본 발명에 따른 방법의 이 구현에 의해 얻어지는 변형된 당 단백질의 말레이미드를 통한 후속적인 컨주게이션은 특히 안정한 말레이미드 컨주게이트를 생성한다.
(22)에서, 바람직하게 u는 1, 2, 3, 4, 5 또는 6이다. 보다 바람직하게, u는 1, 2, 3 또는 4이고, 가장 바람직하게 u는 1 또는 2이다.
Su(A)-Nuc가 화학식 (9)에 따르고, U가 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q인 경우, 화학식 (9)에 따른 여러 가지 바람직한 당 유도체 뉴클레오타이드를 하기에 나타낸다. 본 발명에 따른 방법의 바람직한 구현에서, Su(A)-Nuc는 이에 따라 화학식 (36), (37), (38), (39), (40), (41), (42) 또는 (43)에 따른다.
Figure pct00020

Figure pct00021

Figure pct00022

상기 식에서, p 및 q는 독립적으로 0, 1 또는 2이다.
Su(A)-Nuc가 화학식 (36), (37), (38), (39), (40), (41), (42) 또는 (43)에 따르는 경우에, 보다 바람직하게 p 및 q는 1 또는 2이다.
본 발명에 따른 방법의 다른 구현에서, 당 유도체 뉴클레오타이드 Su(A)-Nuc (3)은 화학식 (45), (46) 또는 (47)에 따른다:
Figure pct00023
이 구현에서, A는 선택적으로 치환된 시클로프로페닐기 또는 선택적으로 치환된 시클로프로페닐렌기를 포함한다. 보다 바람직하게는, A는 선택적으로 치환된 C3-C12 시클로프로페닐기 또는 선택적으로 치환된 C3-C12 시클로프로페닐렌기, 그리고 더욱 바람직하게는 선택적으로 치환된 C3-C8 시클로프로페닐기 또는 선택적으로 치환된 C3-C8 시클로프로페닐렌기를 포함한다. 보다 바람직하게, A는 선택적으로 치환된 C4-C12 시클로프로페닐기 또는 선택적으로 치환된 C4-C12 시클로프로페닐렌기, 그리고 더욱 바람직하게는 선택적으로 치환된 C4-C8 시클로프로페닐기 또는 선택적으로 치환된 C4-C8 시클로프로페닐렌기를 포함한다.
Su(A)-Nuc가 화학식 (10)에 따른 경우, Nuc는 UDP인 것이 또한 바람직하다. (10)에서 (헤테로)아릴렌기 T 및 T의 바람직한 구현은 (3)에 대해 보다 상세하게 기재된 바와 같으며, T는 하나 이상의 독립적으로 선택된 치환기 R2로 선택적으로 치환된다. (10)에서 R2 및 이의 그의 바람직한 구현은 (3)에 대해 보다 상세하게 기재된 바와 같다.
Su(A)-Nuc가 화학식 (10)에 따른 경우, A는 -N3, -C=C-R4, -SH, -SC(O)R8, -SC(V)OR8 및 -OS(O)2R5로 구성된 그룹으로부터 선택되며, 여기서 V, R4, R5, R8 및 이의 바람직한 구현은 상기 정의된 바와 같다. 보다 바람직하게, A는 -N3, -SH 및 -SC(O)R8로 구성된 그룹으로부터 선택된다.
화학식 (10)에 따른 여러 가지 특히 바람직한 당 유도체 뉴클레오타이드가 하기에 제시된다. 따라서, 본 발명에 따른 방법의 바람직한 구현에서 Su(A)-Nuc는 화학식 (11), (12), (13), (14), (15), (16), (34) 또는 (35)에 따른다:
Figure pct00024
상기 식에서:
Nuc, A 및 R2, 및 이의 바람직한 구현은 (3)에서 상기 정의된 바와 같고;
m은 0, 1, 2, 3 또는 4이며; 그리고
R6은 H 및 선택적으로 치환된 C1-C24 알킬기로 구성된 그룹으로부터 선택된다.
(11)에서, m은 0, 1, 2, 3 또는 4이고; (12)에서, m은 0, 1, 2 또는 3이고; (13)에서, m은 0, 1, 2 또는 3이고; (14)에서, m은 0, 1 또는 2이고; (15)에서, m은 0, 1 또는 2이고; 식 (16)에서, m은 0 또는 1이다.
(11), (12), (13), (14), (15) 또는 (16)에서, R2는 존재하는 경우, -F, -Cl, -Br, -CN, -NO2, -C(O)R9, -C(O)OR9, -C(O)N(R10)2, C1-C4 알킬기 및 C1-C4 알콕시기로 구성된 그룹으로부터 독립적으로 선택되며, 여기서 R9는 C1-C12 알킬기이며, 그리고 여기서 R10은 수소 및 C1-C12 알킬기로부터 독립적으로 선택된다. 바람직하게, R9는 C1-C6 알킬기이며, 보다 바람직하게 C1-C4 알킬기이며, 그리고 가장 바람직하게 메틸, 에틸, n-프로필, i-프로필, n-부틸, s-부틸 또는 t-부틸기이다. 바람직하게, R10은 수소 또는 C1-C6 알킬기이며, 보다 바람직하게 수소 또는 C1-C4 알킬기이며, 가장 바람직하게 R10은 수소, 메틸, 에틸, n-프로필, i-프로필, n-부틸, s-부틸 또는 t-부틸기이다. 보다 바람직하게는 R2는 -F, -Cl, -Br, -CN, -NO2, 메틸, 메톡시, 에틸, 에톡시, n-프로필, n-프로폭시, i-프로필, i-프로폭시, n-부틸, n-부톡시, s-부틸, s-부톡시, t-부틸 및 t-부톡시로 구성된 그룹으로부터 독립적으로 선택된다. 보다 바람직하게, R2는 존재하는 경우 -F, -Cl, -Br, -CN, -NO2, 메틸 및 메톡시로 구성된 그룹으로부터 독립적으로 선택된다. 가장 바람직하게, R2는 존재하는 경우 F 및 Cl로 구성된 그룹으로부터 선택된다. 추가의 바람직한 구현에서, m은 1 또는 2이다. 다른 바람직한 구현에서, m은 0이다.
(11), (12), (13), (14), (15) 또는 (16)에서, A는-N3, -C=C-R4, -SH, -SC(O)R8, -SC(V)OR8 및 -OS(O)2R5으로 구성된 그룹으로부터 선택되며, 여기서 V, R4, R5, R8 및 이의 바람직한 구현은 상기 정의된 바와 같다. 보다 바람직하게, A는 -N3, -SH 및 -SC(O)R8으로 구성된 그룹으로부터 선택된다. Nuc가 UDP인 것이 더욱 바람직하다.
(13)에서, R6은 H 또는 선택적으로 치환된 C1-C12 알킬기이고, 더욱 바람직하게 R6은 H 또는 선택적으로 치환된 C1-C6 알킬기이고, 더욱 바람직하게 R6은 H, 메틸기, 에틸기, n-프로필기, i-프로필기, n-부틸기, s-부틸기 또는 t-부틸기이며, 그리고 가장 바람직하게는 R6은 H 또는 메틸기이다.
Su(A)-Nuc(10)의 특히 바람직한 구현에서, A는 -N3이고, Nuc는 UDP이고, m은 0, 1, 2, 3 또는 4이고, 그리고 R2(여기서, m은 1, 2, 3 또는 4임)은 X이며, 여기서 X는 F, Cl, Br 또는 I이다. 이 구현에서, X는 F 또는 Cl인 것이 더욱 바람직하다.
본 발명에 따른 방법의 특히 바람직한 구현에서, Su(A)-Nuc는 화학식 (23), (24) 또는 (25)에 따른다:
Figure pct00025
X = F, Cl, Br 또는 I X = F, Cl, Br 또는 I
(24) 및 (25)에서, X는 동일하거나 상이할 수 있다. 바람직하게, X는 동일하다. X는 F, Cl 또는 Br인 것이 보다 바람직하며, 더욱 바람직하게 F 또는 Cl이다. 특히 바람직한 구현에서, (24) 및 (25)에서 X는 F이다. 다른 특히 바람직한 구현에서, (24) 및 (25)에서 X는 Cl이다.
본 발명에 따른 변형된 당 단백질의 제조 방법은 바람직하게, 예를 들어 적절한 농도의 Mn2 + 또는 Mg2 + 이온을 함유하는 포스페이트, 완충 염수(예: 포스페이트 완충 염수, 트리스 완충 염수), 시트레이트, HEPES, 트리스 및 글리신과 같은 적절한 완충액에서 수행된다. 적절한 완충액은 당 업계에 공지되어있다. 바람직하게, 완충액은 포스페이트 완충 염수(PBS) 또는 트리스 완충액이다.
상기 방법은 바람직하게 약 4 내지 약 50℃ 범위, 보다 바람직하게 약 10 내지 약 45℃ 범위, 보다 바람직하게 약 15 내지 약 40℃ 범위, 그리고 가장 바람직하게 약 20 내지 약 37℃ 범위의 온도에서 수행된다.
상기 방법은 바람직하게는 약 5 내지 약 9 범위, 바람직하게 약 5.5 내지 약 8.5 범위, 보다 바람직하게는 약 6 내지 약 8 범위의 pH에서 수행된다. 가장 바람직하게, 상기 방법은 약 7 내지 약 8 범위의 pH에서 수행된다.
특정 구현에서, 본 발명에 따른 방법이 특정 돌연변이 β-(1,4)-GalNAcT, 예를 들면, CeGalNAcT(M312H)를 사용하여 수행되는 경우, 이 방법은 또한 Mn2 + 이온 대신에 Mg2 + 이온을 함유하는 적절한 완충액에서 수행될 수 있다.
본 발명에 따른 방법은 여러 가지 장점을 갖는다. 우선, 상기 방법은 β-(1,4)-GalNAcT 효소를 사용하여 수행된다. 효소는 와일드 타입 β-(1,4)-GalNAcT 또는 이의 돌연변이일 수 있다. 다른 유기체의 광범위한 β-(1,4)-GalNAcTs가 자연적으로 이용가능하다. 또한, 광범위한 β-(1,4)-GalNAcTs는 일시적인 발현 후 이어서 스트레이트포워드 양이온 교환 컬럼 정제에 의해 CHO로부터 쉽게 얻어질 수 있다. 이러한 방식으로, 효소는 전형적으로 적어도 75%의 순도로 얻어진다.
또한, 상기에서 보다 상세하게 기술된 바와 같은 당 유도체 Su(A)와 같은 비 천연 UDP-GalNAc 유도체의 전달을 위한 β-(1,4)-GalNAcT의 전이 효소 활성은 당해 기술분야에 알려진 β-(1,4)-갈락토실트랜스퍼라아제 GalT(Y289L) 돌연변이의 트랜스퍼라아제 활성보다 높거나, 또는 훨씬 더 높을 수 있다.
예를 들어, 본 발명에 따른 방법에서, 여러 가지의 β-(1,4)-GalNAcTs 및 이의 돌연변이의 트랜스퍼라아제 활성은 여러 가지의 당 유도체 Su(A)에 대해 (상당히) 더 높다. 특히, CeGalNAcT는 도 7로부터 명백해지는 바와 같이 GalT(Y289L)보다 아지도-GalNAc 유도체의 말단 GlcNAc-함유 당 단백질로의 전달에 대해 10 배 더 높은 활성을 나타내는 것으로 밝혀졌다.
도 7은 상기 보다 상세히 기재한 바와 같은 R&D 시스템 글리코실트랜스퍼라아제 활성 키트에 의해 검출된, 식 (18)에 따른 당 유도체 Su(A)로부터 F2-GalNAz의 전달에 대한, GalT(Y289L) 돌연변이와 비교하여 다양한 범위의 β-(1,4)-GalNAcTs의 활성 플롯을 나타낸다. 도 7로부터, CeGalNAcT, CeGalNAcT-His 및 TnGalNAcT가 동일한 방법에 대해 GalT(Y289L)의 트랜스퍼라아제 활성보다 상당히 높은 트랜스퍼 라아제 활성을 갖는 것을 분명히 알 수 있다.
마찬가지로, 도 8은 &D 시스템 글리코실트랜스퍼라아제 활성 키트에 의해 검출된, UDP-F2-GalNAz(18)로부터 F2-GalNAz의 전달에 대한, 다양한 범위의 CeGalNAcT 돌연변이들, 즉 CeGalNAcT(Y257L), CeGalNAcT (Y257M) 및 CeGalNAcT(Y257A)의 활성 플롯을 나타낸다. 도 8은 분명히 또한 돌연변이 β-(1,4)-GalNAcTs CeGalNAcT(Y257L), CeGalNAcT (Y257M) 및 CeGalNAcT(Y257A)가 동일한 방법에 대해 GalT(Y289L)의 트랜스퍼라아제 활성보다 현저히 높은 트랜스퍼라아제 활성을 갖는 것을 보여준다.
실시예
실시예 1. GalNAc - 트랜스퍼라아제의 선택 및 디자인
초기의 평가를 위해 5개의 특정 서열, 구체적으로 Uniprot accession numer: Q9GUM2(C. 엘레간스(C. elegans); SEQ ID NO: 2로 나타냄), U1MEV9(A. 숨(A. suum); SEQ ID NO: 3으로 나타냄), Q6J4T9(T. 니(T. ni); SEQ ID NO: 4로 나타냄), Q7KN92(D. 멜라노가스터(D. melanogaster); SEQ ID NO: 5로 나타냄) 및 Q6L9W6(H. 사피엔스(H. sapiens))로 부터 선택되었다.
하기의 폴리펩타이드들은 예측된 세포질 도메인 및 트랜스멤브레인 도메인의 결실에 기초하여 구축되었다. 이들 폴리펩타이드들은 예측된 하기의 서열을 포함한다:
C. 엘레간스(C. elegans)(SEQ ID NO: 6으로 나타낸 CeGalNAcT [30-383])
KIPSLYENLTIGSSTLIADVDAMEAVLGNTASTSDDLLDTWNSTFSPISEVNQTSFMEDIRPILFPDNQTLQFCNQTPPHLVGPIRVFLDEPDFKTLEKIYPDTHAGGHGMPKDCVARHRVAIIVPYRDREAHLRIMLHNLHSLLAKQQLDYAIFIVEQVANQTFNRGKLMNVGYDVASRLYPWQCFIFHDVDLLPEDDRNLYTCPIQPRHMSVAIDKFNYKLPYSAIFGGISALTKDHLKKINGFSNDFWGWGGEDDDLATRTSMAGLKVSRYPTQIARYKMIKHSTEATNPVNKCRYKIMGQTKRRWTRDGLSNLKYKLVNLELKPLYTRAVVDLLEKDCRRELRRDFPTCF
A. 숨(A. suum)(SEQ ID NO: 7로 나타낸 AsGalNAcT [30-383])
DYSFWSPAFIISAPKTLTTLQPFSQSTSTNDLAVSALESVEFSMLDNSSILHASDNWTNDELVMRAQNENLQLCPMTPPALVGPIKVWMDAPSFAELERLYPFLEPGGHGMPTACRARHRVAIVVPYRDRESHLRTFLHNLHSLLTKQQLDYAIFVVEQTANETFNRAKLMNVGYAEAIRLYDWRCFIFHDVDLLPEDDRNLYSCPDEPRHMSVAVDKFNYKLPYGSIFGGISALTREQFEGINGFSNDYWGWGGEDDDLSTRVTLAGYKISRYPAEIARYKMIKHNSEKKNPVNRCRYKLMSATKSRWRNDGLSSLSYDLISLGRLPLYTHIKVDLLEKQSRRYLRTHGFPTC
T. 니(T. ni)(SEQ ID NO: 8로 나타낸 TnGalNAcT [33-421])
SPLRTYLYTPLYNATQPTLRNVERLAANWPKKIPSNYIEDSEEYSIKNISLSNHTTRASVVHPPSSITETASKLDKNMTIQDGAFAMISPTPLLITKLMDSIKSYVTTEDGVKKAEAVVTLPLCDSMPPDLGPITLNKTELELEWVEKKFPEVEWGGRYSPPNCTARHRVAIIVPYRDRQQHLAIFLNHMHPFLMKQQIEYGIFIVEQEGNKDFNRAKLMNVGFVESQKLVAEGWQCFVFHDIDLLPLDTRNLYSCPRQPRHMSASIDKLHFKLPYEDIFGGVSAMTLEQFTRVNGFSNKYWGWGGEDDDMSYRLKKINYHIARYKMSIARYAMLDHKKSTPNPKRYQLLSQTSKTFQKDGLSTLEYELVQVVQYHLYTHILVNIDERS
D. 멜라노가스터(D. melanogaster)(SEQ ID NO: 9로 나타낸 DmGalNAcT [47-403])
HKYAHIYGNASSDGAGGSEASRLPASPLALSKDRERDQELNGGPNSTIRTVIATANFTSIPQDLTRFLLGTKKFLPPRQKSTSALLANCTDPDPRDGGPITPNTTLESLDVIEAELGPLLRPGGAFEPENCNAQHHVAIVVPFRDRYAHLLLFLRNIHPFLMKQRIAYRIFIVEQTNGKPFNRAAMMNIGYLEALKLYQWDCFIFHDVDLLPLDDRNLYNCPRQPRHMSVAIDTLNFRLPYRSIFGGVSAMTREHFQAVNGFSNSFFGWGGEDDDMSNRLKHANLFISRYPVNIARYKMLKHQKEKANPKRYENLQNGMSKIEQDGINSIKYSIYSIKQFPTFTWYLAELKNSERKS
H. 사피엔스(H. sapiens)(SEQ ID NO: 24로 나타낸 HuGalNAcT [57-998])
RYGSWRELAKALASRNIPAVDPHLQFYHPQRLSLEDHDIDQGVSSNSSYLKWNKPVPWLSEFRGRANLHVFEDWCGSSIQQLRRNLHFPLYPHIRTTLRKLAVSPKWTNYGLRIFGYLHPFTDGKIQFAIAADDNAEFWLSLDDQVSGLQLLASVGKTGKEWTAPGEFGKFRSQISKPVSLSASHRYYFEVLHKQNEEGTDHVEVAWRRNDPGAKFTIIDSLSLSLFTNETFLQMDEVGHIPQTAASHVDSSNALPRDEQPPADMLRPDPRDTLYRVPLIPKSHLRHVLPDCPYKPSYLVDGLPLQRYQGLRFVHLSFVYPNDYTRLSHMETHNKCFYQENAYYQDRFSFQEYIKIDQPEKQGLEQPGFEENLLEESQYGEVAEETPASNNQNARMLEGRQTPASTLEQDATDYRLRSLRKLLAQPREGLLAPFSKRNSTASFPGRTSHIPVQQPEKRKQKPSPEPSQDSPHSDKWPPGHPVKNLPQMRGPRPRPAGDSPRKTQWLNQVESYIAEQRRGDRMRPQAPGRGWHGEEEVVAAAGQEGQVEGEEEGEEEEEEEDMSEVFEYVPVFDPVVNWDQTFSARNLDFQALRTDWIDLSCNTSGNLLLPEQEALEVTRVFLKKLNQRSRGRYQLQRIVNVEKRQDQLRGGRYLLELELLEQGQRVVRLSEYVSARGWQGIDPAGGEEVEARNLQGLVWDPHNRRRQVLNTRAQEPKLCWPQGFSWSHRAVVHFVVPVKNQARWVQQFIKDMENLFQVTGDPHFNIVITDYSSEDMDVEMALKRSKLRSYQYVKLSGNFERSAGLQAGIDLVKDPHSIIFLCDLHIHFPAGVIDAIRKHCVEGKMAFAPMVMRLHCGATPQWPEGYWEVNGFGLLGIYKSDLDRIGGMNTKEFRDRWGGEDWELLDRILQGLDVERLSLRNFFHHFHSKRGMWSRRQMKTL
또한, AsGalNAcT(30-383)에 대해(SEQ ID NO: 71로 나타낸 His6-AsGalNAcT(30-383)) 및 TnGalNAcT(33-421)에 대해 (SEQ ID NO: 49로 나타낸 His6-TnGalNAcT(33-421)) N-말단 His-태그를 함유하는 폴리펩타이드 변이체들이 구축되었다.
실시예 2. I257 의 C. 엘레간스 (C. elegans ) GalNAcT 돌연변이의 디자인
GalT와 함께 CeGalNAcT의 서열 정렬에 기초하여, 3가지의 활성 사이트 돌연변이들이 이소루신257의 루신, 메티오닌 또는 알라닌으로의 돌연변이에 의해 디자인되었다(밑줄 그어짐).
SEQ ID NO : 10으로 나타낸 CeGalNacT(30-383; I257L )
KIPSLYENLTIGSSTLIADVDAMEAVLGNTASTSDDLLDTWNSTFSPISEVNQTSFMEDIRPILFPDNQTLQFCNQTPPHLVGPIRVFLDEPDFKTLEKIYPDTHAGGHGMPKDCVARHRVAIIVPYRDREAHLRIMLHNLHSLLAKQQLDYAIFIVEQVANQTFNRGKLMNVGYDVASRLYPWQCFIFHDVDLLPEDDRNLYTCPIQPRHMSVAIDKFNYKLPYSALFGGISALTKDHLKKINGFSNDFWGWGGEDDDLATRTSMAGLKVSRYPTQIARYKMIKHSTEATNPVNKCRYKIMGQTKRRWTRDGLSNLKYKLVNLELKPLYTRAVVDLLEKDCRRELRRDFPTCF
SEQ ID NO : 11으로 나타낸 CeGalNAcT (30-383; I257M )
KIPSLYENLTIGSSTLIADVDAMEAVLGNTASTSDDLLDTWNSTFSPISEVNQTSFMEDIRPILFPDNQTLQFCNQTPPHLVGPIRVFLDEPDFKTLEKIYPDTHAGGHGMPKDCVARHRVAIIVPYRDREAHLRIMLHNLHSLLAKQQLDYAIFIVEQVANQTFNRGKLMNVGYDVASRLYPWQCFIFHDVDLLPEDDRNLYTCPIQPRHMSVAIDKFNYKLPYSAMFGGISALTKDHLKKINGFSNDFWGWGGEDDDLATRTSMAGLKVSRYPTQIARYKMIKHSTEATNPVNKCRYKIMGQTKRRWTRDGLSNLKYKLVNLELKPLYTRAVVDLLEKDCRRELRRDFPTCF
SEQ ID NO : 12로 나타낸 CeGalNacT (30-383; I257A )
KIPSLYENLTIGSSTLIADVDAMEAVLGNTASTSDDLLDTWNSTFSPISEVNQTSFMEDIRPILFPDNQTLQFCNQTPPHLVGPIRVFLDEPDFKTLEKIYPDTHAGGHGMPKDCVARHRVAIIVPYRDREAHLRIMLHNLHSLLAKQQLDYAIFIVEQVANQTFNRGKLMNVGYDVASRLYPWQCFIFHDVDLLPEDDRNLYTCPIQPRHMSVAIDKFNYKLPYSAAFGGISALTKDHLKKINGFSNDFWGWGGEDDDLATRTSMAGLKVSRYPTQIARYKMIKHSTEATNPVNKCRYKIMGQTKRRWTRDGLSNLKYKLVNLELKPLYTRAVVDLLEKDCRRELRRDFPTCF
실시예 3. M312 의 C. 엘레간스 (C. elegans ) GalNAcT 돌연변이의 디자인
CeGalNAcT 돌연변이는 메티오닌312의 히스티딘으로의 돌연변이에 의해 디자인되었다.
SEQ ID NO : 13으로 나타낸 CeGalNacT (30-383; M312H )
KIPSLYENLTIGSSTLIADVDAMEAVLGNTASTSDDLLDTWNSTFSPISEVNQTSFMEDIRPILFPDNQTLQFCNQTPPHLVGPIRVFLDEPDFKTLEKIYPDTHAGGHGMPKDCVARHRVAIIVPYRDREAHLRIMLHNLHSLLAKQQLDYAIFIVEQVANQTFNRGKLMNVGYDVASRLYPWQCFIFHDVDLLPEDDRNLYTCPIQPRHMSVAIDKFNYKLPYSAIFGGISALTKDHLKKINGFSNDFWGWGGEDDDLATRTSMAGLKVSRYPTQIARYKHIKHSTEATNPVNKCRYKIMGQTKRRWTRDGLSNLKYKLVNLELKPLYTRAVVDLLEKDCRRELRRDFPTCF
실시예 4. C-말단 His 6 -태그를 가진 CeGalNAcT 의 디자인
C-말단 His6-태그를 가진 CeGalNAcT이 디자인되었다(CeGalNAcT-His6).
SEQ ID NO : 14로 나타낸 CeGalNAcT (30-383)- His 6 )
KIPSLYENLTIGSSTLIADVDAMEAVLGNTASTSDDLLDTWNSTFSPISEVNQTSFMEDIRPILFPDNQTLQFCNQTPPHLVGPIRVFLDEPDFKTLEKIYPDTHAGGHGMPKDCVARHRVAIIVPYRDREAHLRIMLHNLHSLLAKQQLDYAIFIVEQVANQTFNRGKLMNVGYDVASRLYPWQCFIFHDVDLLPEDDRNLYTCPIQPRHMSVAIDKFNYKLPYSAIFGGISALTKDHLKKINGFSNDFWGWGGEDDDLATRTSMAGLKVSRYPTQIARYKMIKHSTEATNPVNKCRYKIMGQTKRRWTRDGLSNLKYKLVNLELKPLYTRAVVDLLEKDCRRELRRDFPTCFHHHHHH
실시예 5. CHO 에서 효소들의 일시적 발현
단백질들은 CHO K1 세포에서 20mL 스케일로 Evitria (Zurich, Switzerland)에 의해 일시적으로 발현되었다. 도 5 및 도 6에 나타낸 바와 같이, HuGalNAcTs를 제외한 모든 GalNAcTs가 성공적으로 발현되었다.
도 5는 CHO에서 일시적 발현 후 크루드, β-(1,4)-GalNAcTs의 SDS-PAGE를 보여준다. 레인 2-6 감소된 효소, 레인 7-11 감소되지 않은 동일한 효소. 레인 1: 마커, Biorad precision plus protein standard; MW 위에서 아래로: 250kDa, 150kDa, 100kDa, 75kDa, 50kDa, 37kDa, 25kDa, 20kDa. 레인 2+7: TnGalNAc. 레인 3+8: DmGalNAcT. 레인 4+9: AsGalNAcT. 레인 5+10: C 말단 His6-태그를 갖는 CeGalNAcT. 레인 6+11: huGalNAcT. 50과 55kDa 사이에서 볼 수 있는 단백질 밴드들이 원하는 GalNAcTs이며, huGalNAcT를 제외한 모든 변이체들의 발현이 성공적이었다.
도 6은 다양한 β-(1,4)-CeGalNAcT 돌연변이들의 비환원성 SDS-PAGE를 보여준다. 레인 1: 마커: GE rainbow 분자량 마커; MW 위에서 아래로: 225kDa, 150kDa, 102kDa, 76kDa, 52kDa, 38kDa, 33kDa, 24kDa, 17kDa. 레인 2: CeGalNAcT(M312H). 레인 3: CeGalNAcT(M312H). 레인 4: CeGalNAcT(I257A). 레인 5: CeGalNAcT(I257A). 레인 6: CeGalNAcT(I257L). 레인7: CeGalNAcT(I257L). 레인 8: CeGalNAcT(I257M). 레인 9: CeGalNAcT(I257L). 레인 10: His6- 태그를 갖는 CeGalNAcT. ~ 52kDa에서 볼 수 있는 단백질 밴드들은 모노머릭 CeGalNAcT 종이며 ~ 102kDa에서 볼 수 있는 밴드들은 다이머릭 CeGalNAcT 종이다. 보다 높은 MW(> 225kDa)의 단백질 밴드들은 특성화되지 않았다.
실시예 6. 비- His 태그된 GalNacT 단백질들에 대한 정제 프로토콜
정제 프로토콜은 SP 칼럼 (GE Healthcare)에서의 양이온 교환 후 크기 배제(size exclusion)에 기초한다.
전형적인 정제 실험에서, 발현된 GalNAcT를 함유하는 CHO-생성된 상층물을 20mM Tris 완충액(pH 7.5)에 대해 투석하였다. 상층물(전형적으로 25mL)을 0.45μM 포어 직경 필터를 통해 여과한 후, 사용하기 전에 20mM Tris 완충액, pH 7.5로 평형화한 양이온 교환 컬럼(SP 컬럼, 5mL, GE Healthcare)상에서 정제하였다. 정제는 외부 분획 수집기가 장착된 AKTA Prime 크로마토그래피 시스템에서 수행하였다. 샘플을 시스템 펌프 A로부터 로딩하였다. 20mM 트리스 완충액, pH 7.5의 10 컬럼 부피(CV)로 컬럼을 세정하여 컬럼으로부터 바인딩되지 않은 단백질들을 용래하였다. 보유된 단백질은 용리 완충액(20mM Tris, 1 NaCl, pH 7.5; 10 mL)로 용리시켰다. 수집된 분획을 폴리아크릴아미드겔(12%)상에서 SDS-PAGE로 분석하고, 목적 단백질을 함유하는 분획을 합하고 스핀 여과를 사용하여 0.5mL의 부피로 농축시켰다. 다음으로, 단백질을 AKTA 정제 시스템(UNICORN v6.3)상에서 조제용 Superdex 크기 배제 크로마토그래피 칼럼상에서 정제하였다. 이 정제 단계는 표적 단백질의 다이머, 및 모노머 분획의 동정 및 분리를 이끌었다. 두 분획물을 SDS-PAGE로 분석하고 추가 사용하기 전에 -80℃에서 보관하였다.
실시예 7. CeGalNAcT - His 6 의 정제
전형적인 정제 실험으로, CHO 상층물을 0.45μM 포어 직경 필터를 통해 여과하고, 사용 전에 완충액 A(20mM 트리스 완충액, 20mM 이미다졸, 500mM NaCl, pH 7.5)로 평형화된 Ni-NTA 컬럼(GE Healthcare, 5 mL)에 적용하였다. 여과 전에, 이미다졸을 컬럼에 대한 비특이적 바인딩을 최소화하기 위해 CHO 상층물에 최종 농도 20mM로 첨가하였다. 컬럼을 먼저 완충액 A(50mL)로 세척하였다. 보유된 단백질을 완충액 B(20mM Tris, 500 mM NaCl, 250mM 이미다졸, pH 7.5, 10 mL)로 용리시켰다. 분획을 폴리아크릴아미드겔(12%)상에서 SDS-PAGE로 분석하고 정제된 표적 단백질을 함유하는 분획을 합하고 4℃에서 밤새 투석함으로써 20mM Tris(pH 7.5)에 대해 완충액을 교환하였다. 정제된 단백질을 추가 사용하기 전에 -80℃에 보관하였다. 주: 모노머릭 및 다이머릭 CeGalNAcT-His6 종의 동정을 위해 추가 SEC 정제를(상술한 바와 같이) 수행하였다.
실시예 8: 에틸 2- 아지도 -2,2- 디플루오로아세테이트의 합성
드라이 DMSO(5 mL) 중 에틸 2-브로모-2,2-디플루오로아세테이트의 용액(950mg, 4.68mmol)에 소듐 아지드(365mg, 5.62mmol)를 첨가하였다. 실온에서 하룻밤 동안 교반한 후, 반응 혼합물을 물(150mL)에 부었다. 층을 분리하고, 디클로로메탄을 유기층에 첨가하고, 층을 소듐 설페이트에서 건조시켰다. 여과 후, 용매를 35℃에서 감압하에 제거하고(300mbar) 크루드 에틸 2-아지도-2,2-디플루오로아세테이트(250mg, 1.51mmol, 32%)을 수득하였다.
1H-NMR (300 MHz, CDCl3): δ 4.41 (q, J = 7.2 hz, 2H), 1.38 (t, J = 6.9 Hz, 3H).
실시예 9. α-2- 아지도 -2- 데옥시 -3,4,6-트리-O-아세틸-D-갈락토오스 1- 포스페이트의 합성
참고문헌으로 편입된 Linhardt et al ., J. Org . Chem. 2012, 77, 1449-1456에서 D-글루코사민에 대해 기재된 절차에 따라 D-갈락토오스아민으로부터 2-아지도-2-데옥시-3,4,6-트리-O-아세틸-D-갈락토오스 1-포스페이트가 제조되었다.
1H-NMR (300 MHz, CD3OD): δ 5.69 (dd, J = 7.2, 3.3 Hz, 1H), 5.43-5.42 (m, 1H), 5.35 (dd, J = 11.1, 3.3 Hz, 1H), 4.53 (t, J = 7.2 Hz, 1H), 4.21-4.13 (m, 1H), 4.07-4.00 (m, 1H), 3.82 (dt, J = 10.8, 2.7 Hz, 1H), 2.12 (s, 3H), 2.00 (s, 3H), 1.99 (s, 3H).
C12H17N3O11P (M-H+)에 대한 LRMS (ESI-) 계산치 410.06, 실측치 410.00.
실시예 10. α-2-아미노-3,4,6-트리-O-아세틸-D-갈락토오스 1- 포스페이트의 합성
MeOH(3mL) 중 α-2-아지도-2-데옥시-3,4,6-트리-O-아세틸-D-갈락토오스의 용액(105mg, 0.255mmol)에 Pd/C(20mg)를 첨가하였다. 반응물을 수소 분위기하에 2시간 동안 교반하고 셀라이트상에서 여과하였다. 필터를 MeOH(10ml)로 세정하고 여액을 진공하에 농축시켜 유리 아민(94mg, 0.244mmol, 96%)을 수득하였다.
1H-NMR (300 MHz, D2O): δ 5.87-5.76 (m, 1H), 5.44 (br s, 1H), 5.30-5.20 (m, 1H), 4.55 (t, J = 6.3 Hz, 1H), 4.28-4.00 (m, 3H), 2.11 (s, 3H), 2.03 (s, 3H), 2.00 (s, 3H).
C12H19NO11P (M-H+)에 대한 LRMS (ESI-) 계산치 384.07, 실측치 384.10.
실시예 11. α-(2'- 아지도 -2',2'- 디플루오로아세트아미도 )-3,4,6-트리-O-아세틸-D-갈락토오스 1- 포스페이트
드라이 DMF(3mL) 중 α-2-아미노-3,4,6-트리-O-아세틸-D-갈락토오스 1-포스페이트의 용액(94mg, 0.244mmol)에 에틸 디플루오로아지도아세테이트(48mg, 0.293mmol) 및 Et3N(68μL, 0.488mmol)을 첨가하였다. 반응물을 6시간 동안 교반한 후, 진공하에서 농축시켜 크루드 생성물을 수득하였다. 플래시 크로마토그래피(100:0 - 50:50 EtOAc:MeOH)에 의해 α-(2'-아지도-2',2'-디플루오로아세트아미도)-3,4,6-트리-O-아세틸-D-갈락토오스 1-포스페이트(63mg, 0.125mmol, 51%)을 얻었다.
실시예 12. UDP -α-(2'- 아지도 -2',2'- 디플루오로아세트아미도 )-3,4,6-트리-O-아세틸-D-갈락토오스 합성
α-(2'-아지도-2',2'-디플루오로아세트아미도)-3,4,6-트리-O-아세틸-D-갈락토오스 1-포스페이트를 참고문헌으로 편입된 Baisch et al . Bioorg . Med . Chem ., 1997, 5, 383-391에 따라 UMP와 커플링하였다.
따라서, H2O(1mL) 중 D-유리딘-5'-모노포스페이트 디소듐염(98mg, 0.266mmol)의 용액을 DOWEX 50Wx8(H+ 형)으로 40분 동안 처리하고 여과하였다. 트리부틸아민(63μL, 0.266mmol)을 적가하면서, 여액을 실온에서 격렬히 교반하였다. 30분 더 교반한 후, 반응 혼합물을 동결건조시키고 진공하에 P2O5상에서 5시간 동안 추가로 건조시켰다.
생성된 트리부틸암모늄 유리딘-5'-모노포스페이트를 아르곤 분위기하에 드라이 DMF(15 mL) 중에 용해시켰다. 카보닐디이미다졸(35mg, 0.219 mmol)을 첨가하고, 반응 혼합물을 실온에서 30분 동안 교반하였다. 그 다음, 드라이 MeOH(4.63μL)를 첨가하고 15분 동안 교반하여 과량의 카보닐디이미다졸을 제거하였다. 남은 MeOH를 고진공하에 15분 동안 제거하였다. 후속적으로, N-메틸이미다졸, HCl 염(61mg, 0.52mmol)을 반응 혼합물에 첨가하고, 생성된 화합물(63mg, 0.125mmol)을 드라이 DMF(15mL)에 용해시키고 반응 혼합물에 적가하였다. 반응물을 실온에서 밤새(o.n.) 교반한 후에 진공하에 농축시켰다. 이미다졸-UMP 중간물의 소비는 MS에 의해 모니터링되었다. 플래시 크로마토그래피(7:2:1-5:2:1 EtOAc:MeOH:H2O)하여 UDP-α-(2'-아지도-2',2'-디플루오로아세트아미도)-3,4,6-트리-O-아세틸-D-갈락토오스를 수득하였다.
1H-NMR (300 MHz, D2O): δ 7.87 (d, J = 8.1 Hz, 1H), 5.913-5.85 (m, 2H), 5.67 (dd, J = 6.6, 2.7 Hz, 1H), 5.56-5.50 (m, 1H), 5.47-5.43 (m, 1H), 5.31-5.25 (m, 2H), 4.61-4.43 (m, 2H), 4.31-4.05 (m, 5H), 2.16 (s, 3H), 2.02 (s, 3H), 1.94 (s, 3H).
C23H29F2N6O20P2 (M-H+)에 대한 LRMS (ESI-) 계산치 809.09, 실측치 809.1.
1H-NMR (300 MHz, CD3OD): δ 5.64 (m, 1H), 5.47 (d, J = 2.4 Hz, 1H), 5.35 (dd, J = 11.4, 3.0 Hz, 1H), 4.58-4.48 (m, 2H), 4.25-4.15 (m, 1H), 4.09-4.00 (m, 1H), 2.14 (s, 3H), 2.00 (s, 3H), 1.93 (s, 3H).
C14H18F2N4O12P (M-H+)에 대한 LRMS (ESI-) 계산치 503.06, 실측치 503.0.
실시예 13. α- UDP -2-(2'- 아지도 -2',2'- 디플루오로아세트아미도 )-2- 데옥시 -D-갈락토오스 (UDP-F 2 -GalNAz, 18 ) 의 합성
UDP-α-(2'-아지도-2',2'-디플루오로아세트아미도)-3,4,6-트리-O-아세틸-D-갈락토오스의 디아세틸화는 참고문헌으로 편입된 Kiso et al ., Glycoconj . J., 2006, 23, 565에 따라 수행되었다.
따라서, UDP-α-(2'-아지도-2',2'-디플루오로아세트아미도)-3,4,6-트리-O-아세틸-D-갈락토오스를 H2O(1mL)에 용해시키고 트리에틸아민(1mL) 및 MeOH(2.4mL)를 첨가하였다. 반응 혼합물을 2시간 동안 교반한 후 진공하에서 농축시켰다. 플래시 크로마토그래피(7:2:1-5:2:1 EtOAc:MeOH:H2O)하여 α-UDP-2-(2'-아지도-2',2'-디플루오로아세트아미도)-2-데옥시-D-갈락토오스(18)를 수득하였다.
1H-NMR (300 MHz, D2O): δ 7.86 (d, J = 8.1 Hz, 1H), 5.91-5.85 (m, 2H), 5.54 (dd, J = 6.6, 3.6 Hz, 1H), 4.31-3.95 (m, 9H), 3.74-3.62 (m, 2H).
C17H23F2N6O17P2 (M-H+)에 대한 LRMS (ESI-) 계산치 683.06, 실측치 683.10.
실시예 14. α- UDP -2- 아지도 -2- 데옥시 -3,4,6-트리-O-아세틸-D-갈락토오스 합성
실시예 9에서 제조된 바와 같이, α-2-아지도-2-데옥시-3,4,6-트리-O-아세틸-D-갈락토오스 1-포스페이트를 Baisch et al . Bioorg . Med . Chem ., 1997, 5, 383-391에 따라 UMP에 부착하였다.
따라서, H2O(15mL) 중의 D-유리딘-5'-모노포스페이트 디소듐염(1.49g, 4.05mmol)의 용액을 DOWEX 50Wx8(H+ 형)으로 30분 동안 처리하고 여과하였다. 트리부틸아민(0.966mL, 4.05mmol)을 적가하면서 여액을 실온에서 격렬하게 교반하였다. 30분 더 교반한 후, 반응 혼합물을 동결건조시키고 진공하에 P2O5상에서 5시간 동안 추가로 건조시켰다.
생성된 트리부틸암모늄 유리딘-5'-모노포스페이트를 아르곤 분위기하에서 드라이 DMF(25 mL)에 용해시켰다. 카보닐디이미다졸(1.38g, 8.51mmol)을 첨가하고, 반응 혼합물을 실온에서 30분 동안 교반하였다. 그 다음, 드라이 MeOH(180μL)를 첨가하고 15분 동안 교반하여 과량의 카보닐디이미다졸을 제거하였다. 남은 MeOH를 고진공하에 15분 동안 제거하였다. 생성된 화합물(2.0g, 4.86mmol)을 드라이 DMF(25mL)에 용해시키고 반응 혼합물에 적가하였다. 반응물을 실온에서 2일 동안 교반한 후, 진공하에서 농축시켰다. 이미다졸-UMP 중간물의 소비는 MS에 의해 모니터링되었다. 플래시 크로마토그래피(7:2:1-5:2:1 EtOAc:MeOH:H2O)하여 α-UDP-2-아지도-2-데옥시-3,4,6-트리-O-아세틸-D-갈락토오스(1.08g, 1.51mmol, 37%)을 얻었다.
1H-NMR (300 MHz, D2O): δ 7.96 (d, J = 8.0 Hz, 1H), 5.98-5.94 (m, 2H), 5.81-5.79 (m, 1H), 5.70 (dd, J = 7.1, 3.3 Hz, 1H), 5.49 (dd, J = 15.2, 2.6 Hz, 1H), 5.30 (ddd, J = 18.5, 11.0, 3.2 Hz, 2H), 4.57 (q, J = 6.0 Hz, 2H), 4.35-4.16 (m, 9H), 4.07-3.95 (m, 2H), 2.17 (s, 3H), 2.08 (s, 3H), 2.07 (s, 3H).
C21H29N5O19P2 (M-H+)에 대한 LRMS (ESI-) 계산치 716.09, 실측치 716.3.
실시예 15. α- UDP -2- 아지도 -2- 데옥시 -D-갈락토오스 합성
실시예 14에서 제조된 α-UDP-2-아지도-2-데옥시-3,4,6-트리-O-아세틸-D-갈락토오스의 디아세틸화는 Kiso et al ., Glycoconj . J., 2006, 23, 565에 따라 수행되었다.
따라서, α-UDP-2-아지도-2-데옥시-3,4,6-트리-O-아세틸-D-갈락토오스(222mg, 0.309mmol)를 H2O(2.5mL)에 용해시키고, 트리에틸아민(2.5mL) 및 MeOH(6mL)를 첨가하였다. 반응 혼합물을 3시간 동안 교반한 다음, 진공하에서 농축시켜 크루드 α-UDP-2-아지도-2-데옥시-D-갈락토오스를 수득하였다. 1H-NMR (300 MHz, D2O): δ 7.99 (d, J = 8.2 Hz, 1H), 6.02-5.98 (m, 2H), 5.73 (dd, J = 7.4, 3.4 Hz, 1H), 4.42-4.37 (m, 2H), 4.30-4.18 (m, 4H), 4.14-4.04 (m, 2H), 3.80-3.70 (m, 2H), 3.65-3.58 (m, 1H).
C15H23N5O16P2 (M-H+)에 대한 LRMS (ESI-) 계산치 590.05, 실측치 590.2.
실시예 16.α- UDP -D-갈락토오스 아민(Gal-NH 2 )의 합성
H2O:MeOH(1:1)(4mL) 중의 실시예 15에서 제조된 α-UDP-2-아지도-2-데옥시-D-갈락토오스의 용액에 린들라(Lindlar) 촉매(50mg)를 첨가하였다. 반응물을 수소 분위기하에 5시간 동안 교반하고 셀라이트상에서 여과하였다. 필터를 H2O(10ml)로 세정하고 여액을 진공하에 농축하여 α-UDP-D-갈락토오스아민(UDP-GalNH2)(169mg, 0.286mmol, 2 단계에 걸쳐 92% 수율)을 수득하였다. 1H-NMR (300 MHz, D2O): δ 7.93 (d, J = 8.1 Hz, 1H), 5.99-5.90 (m, 2H), 5.76-5.69 (m, 1H), 4.39-4.34 (m, 2H), 4.31-4.17 (m, 5H), 4.05-4.01 (m, 1H), 3.94-3.86 (m, 1H), 3.82-3.70 (m, 3H), 3.30-3.16 (m, 1H). C15H25N3O16P2 (M-H+)에 대한 계산치 564.06, 실측치 564.10.
실시예 17. α- UDP -N-(4'- 아지도 -3',5'- 디플루오로벤조일 )-D-갈락토오스아 민( 24 , X=F)의 합성
4-아지도-3,5-디플루오로벤조산 숙신이미딜 에스테르를 참고문헌으로 편입된 Rademann et al ., Angew . Chem . Int . Ed ., 2012, 51, 9441-9447에 따른 펜트-4-이노익산 숙신이미딜 에스테르에 대한 절차에 따라 제조하였다.
따라서, 4-아지도-3,5-디플루오로 벤조산의 용액에 디시클로헥실카보디이미드(1.1당량) 및 N-히드록시숙신이미드(1.2 당량)를 첨가하고, 생성된 현탁액을 밤새 교반한 후 진공 여과하였다. 여액을 농축시키고 EtOAc에 용해시킨 후 포화 NaHCO3 및 염수로 세척하였다. 유기층을 Na2SO4상에서 건조시키고, 여과하고 진공하에 농축시켜 다음 반응에서 크루드를 사용하였다.
1H-NMR (300 MHz, CDCl3): δ 7.74-7.66 (m, 2H), 2.91 (s, 4H).
다음으로, 실시예 16에서 제조된 UDP-GalNH2(30mg, 0.0531mmol)를 0.1M NaHCO3(0.2M)에 용해시키고, 4-아지도-3,5-디플루오로벤조산의 N-히드록시숙신이미드 에스테르(31mg, 0.106mmol, 2당량)을 DMF(0.2M) 중에 용해시켰다. 반응물을 실온에서 밤새 교반하고, 진공하에서 농축시켰다. 플래시 크로마토그래피(7:2:1-5:2:1 EtOAc:MeOH:H2O)하여 생성물 24(X=F)(8mg, 0.0107mmol, 20%)을 수득하였다.
1H-NMR (300 MHz, D2O): δ 7.73 (d, J = 8.4 Hz, 1H), 7.52-7.31 (m, 2H), 5.87-5.71 (m, 2H), 5.65-5.57 (m, 1H), 5.47-5.33 (m, 1H), 4.43-3.96 (m, 8H), 3.76-3.60 (m, 2H).
C22H25F2N6O17P2 (M-H+)에 대한 LRMS (ESI-) 계산치 745.07, 실측치 744.9.
실시예 18. 효소의 특이적 활성의 검출
효소의 특이적 활성은 참고문헌으로 편입된 Wu et al . in Glycobiology 2010, 21, 723-733에 기재된 바와 같이, 그리고 R&S 시스템으로부터 키트로서 상업적으로 구입가능한 커플드 글리코실트랜스퍼라아제 절차에 의해 검출되었다(http://www.rndsystems.com/Products/EA001(2014년 7월 31일에 액세스됨)).
요약하면, 96-웰 플레이트에서 실온에서 20분 동안 반응 완충액(25mM Tris, 150mM NaCl, 5mM MgCl2 및 5mM MnCl2, pH 7.5) 50μL에서 글리코실트랜스퍼라아제 반응을 수행하였다. 글리코실트랜스퍼라아제의 동역학 파라미터를 검출하기 위해, 다양한 양의 효소를 갖는 다중 반응을, 커플링 포스파타아제(ENTPD3/CD39L3)(20ng/μL 용액 2.5μL)을 포함하는 고정된 양의 모든 다른 성분들(GlcNAc: 20mM, UDP-F2-GalNAz: 500μM)의 존재하에서 동시에 수행하였다(효소 0.01, 0.02, 0.04, 0.06, 0.08, 0.10 및 0.12㎍). 상기 효소를 제외하고 모든 성분들을 함유하는 웰은 블랭크 컨트롤로서 사용되었다. 반응은 기질과 포스파타아제를 효소에 첨가하여 시작되었으며 말라카이트 시약 A 30μL와 물 100μL를 각 웰에 첨가하여 종료시켰다. 색은 말라카이트 시약 B 30μL를 각 웰에 첨가하여 부드럽게 혼합하고 실온에서 20분 동안 인큐베이션하여 디벨로빙되었다. 발색 후, 다중-웰 플레이트 판독기로 플레이트를 620nm에서 판독하였다. 흡광도와 무기 포스페이트 함량 사이의 전환 인자를 결정하기 위해 포스페이트 표준 곡선을 또한 수행하였다. UDP-F2-GalNAz의 제조는 실시예 13에 기재되어있다.
본 명세서에 기술된 GalNAcTs의 특정 활성을 WO 2007/095506 및 WO 2008/029281(모두 Invitrogen Corporation)에서 이미 개시된 바와 같이 UDP-GalNAz를 전달하는 것으로 알려진 효소인 GalT(Y289L)와 비교하였다.
여러 효소의 특이적 활성의 검출로부터 수집된 데이터를 표 1 및 표 2에 나타내었다.
Figure pct00026

Figure pct00027

도 7(표 1) 및 도 8(표 2)에 효소의 양에 대해 도시된 전환율(pmol/min/mg)을 나타내는 그래프가 표시되어 있다. 이 플롯에서 특이적 활성은 선형 회귀에 의해 계산되었다.
실시예 19. CeGalNAcT ( M312H )의 활성 검출
CeGalNAcT(M312H)의 활성이 또한 실시예 14에 기재된 것과 동일한 절차로 측정되었지만, 이 경우에는 Mn2 + 대신에 Mg2 +가 사용되었다. 이 경우, 15pmol/분/㎍의 특이적 활성이 검출되었다.
실시예 20. 엔도 S를 이용한 IgG 글리칸의 트리밍 (일반 프로토콜)
스트렙토코커스 피오제네스(Streptococcus pyogenes)(Genovis, Lund, Sweden로부터 상업적으로 입수 가능)의 Endo S를 사용하여 IgG 글리칸의 트리밍을 수행하였다. IgG(10mg/mL)를 37℃에서 약 16시간 동안 25mM Tris pH 8.0에서 Endo S(40U/mL)와 함께 인큐베이션하였다. 디글리코실화된 IgG를 농축시키고 Amicon Ultra-0.5, Ultracel-10 Membrane(Millipore)을 사용하여 10mM MnCl2 및 25mM Tris-HCl pH 8.0으로 세정하였다.
실시예 21. 트라스투주맙( Trastuzumab )의 트리밍
트라스투주맙(Trastuzumab)이 위의 트리밍 프로토콜을 적용받았다. 트리밍된 항체의 분석은 Agilent 1100 HPLC가 장착된 JEOL AccuToF상에서 수행하였다. 샘플(2μL)을 10분 동안 DTT(2μL)로 환원시킨 다음 주사하기 전에 H2O(40μL)로 희석했다. 피크의 디컨볼루션(deconvolution) 후, 질량 스펙트럼은 경쇄의 하나의 피크 및 중쇄의 두 개의 피크를 나타냈다. 중쇄의 두 개의 피크는, 코어 GlcNAc(Fuc) 치환된 트라스투주맙으로부터 형성된 하나의 주요 생성물(49496 Da, 전체 중쇄의 90%), 및 코어 GlcNac 치환된 트라스투주맙으로부터 형성된 부 생성물(49351 Da, 전체 중쇄의 ±10%)을 포함한다. 이는 화학식 (1)에 따른 글리칸을 포함하는 당 단백질의 예이다.
실시예 22. 스와인소닌(swainsonine)의 존재하에 트라스투주맙의 발현
트라스투주맙을 10 또는 25μg/mL 스와인소닌(Sigma-Aldrich에서 시판됨)의 존재하에 Evitria(Zurich, Switzerland)에 의한 CHO K1 세포에서 일시적으로 발현시키고, 단백질 A 세파로스를 사용하여 정제하고, 질량 분석으로 분석하였다. 스와인소닌의 두 농도는 GlcNAc-Man5-GlcNAc-GlcNAc(Fuc)- (c=d=0, 50712 Da, 전체 중쇄 생성물의 ±20%), Gal-GlcNAc-Man5-GlcNAc-GlcNAc(Fuc)- (c=1, d=0, 50874 Da, 전체 중쇄 생성물의 ±35%), 및 Sial-Gal-GlcNAc-Man5-GlcNAc-GlcNAc(Fuc)- (c=d=1, 51164 Da, 전체 중쇄 생성물의 ±35%)로 치환된 트라스투주맙 중쇄에 상응하는 트라스투주맙의 3가지 주요 중쇄 생성물을 제공하였다.
실시예 23. 트라스트 - Man 5 GlcNAc 을 얻기 위한 시알리다아제 / 갈락토시다아제 를 이용한 트리밍
실시예 18에 기술된 바와 같이 스와인소닌의 존재하에 일시적으로 발현된 트라스투주맙(10mg/mL)을 100mM 소듐 아세테이트 pH 6.0 및 2mM CaCl2에서 비브리오 콜레라에(Vibrio cholerae)의 뉴라미니다아제(0.5mU/mg IgG)(Sigma-aldrich로부터 시판됨)로 16시간 인큐베이션하였으며, 이는 시알산을 완전히 제거하게 하였다(총 중쇄 생성물의 약 20 및 70%에 해당하는 50712 및 50874 Da의 2가지 주요 중쇄 생성물). 스트렙토코커스 뉴모니아에(Streptococcus pneumoniae)(Calbiochem으로부터 상업적으로 입수가능)로부터의 β(1,4)-갈락토시다아제(3mU/mg IgG)의 존재하에서 동일한 반응이 수행되는 경우에, GlcNAc-Man5-GlcNAc-GlcNAc(Fuc)-치환된 중쇄를 갖는 트라스투주맙에 상응하는 단일 주요 중쇄 생성물이 관찰되었다(c=d=0, 50712 Da, 전체 중쇄 생성물의 ±90%, 및 50700과 50900 Da 사이의 부 중쇄 생성물).
이는 화학식 (26)에 따른 글리칸을 포함하는 당 단백질의 예이다.
실시예 24. 트라스트 - Man 3 GlcNAc 2 을 얻기 위한 갈락토시다아제를 이용한 트리밍
50mM 소듐 포스페이트 pH 6.0 중의 트라스투주맙(10mg/mL) 및 스트렙토코커스 뉴모니아에(Streptococcus pneumoniae)(Calbiochem으로부터 상업적으로 입수가능)로부터의 β(1,4)-갈락토시다아제(3mU/mg IgG)를 37℃에서 16시간 동안 교반한 후, MS에 의해 분석하였다. GlcNAc2-Man3-GlcNAc-GlcNAc(Fuc)-치환된 중쇄를 갖는 트라스투주맙에 상응하는 단일 주요 중쇄 생성물이 관찰되었다(c=d=0, 50592 Da).
이는 화학식 (27)에 따른 글리칸을 포함하는 당 단백질의 예이다.
IgG 의 질량 분광 분석을 위한 일반적인 프로토콜
약 70㎕의 총 부피를 갖는 50㎍(변형된) IgG, 1M Tris-HCl, pH 8.0, 1mM EDTA 및 30mM DTT의 용액을 20분 동안 37℃에서 인큐베이션하여 디설피드 브릿지를 환원시켜 경쇄 및 중쇄 모두 분석하였다. 존재하는 경우, 아지드-작용기는 이러한 조건하에서 아민으로 환원된다. 환원된 샘플을 Amicon Ultra-0.5, Ultracel-10 Membrane(Millipore)을 사용하여 milliQ로 세척하고 10μM(변형된) IgG로 농축시켰다. 환원된 IgG는 JEOL AccuTOF에서 전기 분사 이온화 타임-오브-플라이트(ESI-TOF)에 의해 분석되었다. 디컨볼루션된 스펙트럼은 Magtran 소프트웨어를 사용하여 얻어졌다.
GalNAcT 를 이용한 갈락토오스 유도체(예, 아지도당(azidosugar)의 글리코실트랜스퍼 (일반 프로토콜)
갈락토오스 유도체(예, 아지도-함유 당)를 IgG 상으로 효소적으로 도입하는 것은 GalNAc-트랜스퍼라아제 또는 이의 돌연변이로 이루어졌다. 상술한 바와 같이 제조된, 10mg/mL) 디글리코실화된 IgG를 변형된 UDP-갈락토오스 유도체 (예, 아지도-변형된 당-UDP 유도체)(0.4mM) 및 GalNAcT(1mg/mL)와 함께 10mM MnCl2 및 25mM Tris-HCl pH 8.0에서 30℃에서 16시간 동안 인큐베이션하였다. 기능화된 IgG(예, 아지도-기능화된 IgG)를 4℃에서 2시간 동안 프로틴 A 아가로즈(IgG mg 당 40μL)와 함께 인큐베이션하였다. 프로틴 A 아가로즈를 PBS로 3회 세정하고 IgG를 100mM 글리신-HCl pH 2.7로 용리시켰다. 용리된 IgG를 1M Tris-HCl pH 8.0로 중화시키고 Amicon Ultra-0.5, Ultracel-10 Membrane(Millipore)을 사용하여 15-20mg/mL의 농도로 PBS로 농축 및 세정하였다.
실시예 25. 트라스투주맙(GalNAz) 2
트리밍된 트라스투주맙은 UDP-N-아지도아세틸갈락토오스아민(UDP-GalNAz) 및 CeGalNAcT를 사용한 글리코실트랜서퍼 프로토콜을 적용받았다. 프로틴 A 친화성 정제 후, 작은 샘플을 DTT로 환원시키고, 후속적으로 MS 분석되었으며, 이는 코어 GlcNAc(Fuc) 치환된 트라스투주맙으로의 GalNAz 전달에 기인한 하나의 주요 생성물(49713 Da, 총 중쇄의 90%), 및 코어 GlcNAc 치환된 트라스투주맙으로의 GalNAz 전달에 기인한 부 생성물(49566 Da, 총 중쇄의 ±10%)을 나타내었다.
실시예 26. 트라스투주맙(F 2 -GalNAz) 2
트리밍된 트라스투주맙은 UDP-N-아지도디플루오로아세틸갈락토오스아민(UDP-F2-GalNAz) 및 GalNAcT를 사용한 글리코실트랜서퍼 프로토콜을 적용받았으며, GalNAcT는 CeGalNAcT(또는 상기한 바와 같은 이의 돌연변이), AsGalNAcT, TnGalNAcT 또는 DmGalNAcT로부터 선택되었다. 프로틴 A 친화성 정제 후, 작은 샘플을 DTT로 환원시키고, 후속적으로 MS 분석되었으며, 이는 샘플 준비 중에 DTT와 반응한 코어 GlcNAc(Fuc) 치환된 트라스투주맙으로의 F2-GalNAz 전달에 기인한 하나의 주요 중쇄 생성물(49865 Da, 총 중쇄의 90%)의 형성을 나타내었다.
실시예 27. 트라스투주맙-(F 2 - GalNBAz ) 2
화학식 1에서와 같이 트라스투주맙의 Endo S 처리에 의해 획득된, 트리밍된 트라스투주맙(10mg/mL, 6.6nmol)을 UDP-F2GalNBAz(24, X=F, 7mM) 및 CeGalNAcT(2mg/mL)과 함께 10mM MnCl2 및 25mM Tris-HCl pH 8.0에서 30℃에서 밤새 인큐베이션하였다. 환원된 샘플의 질량 분광 분석은 코어 GlcNAc(Fuc) 치환된 트라스투주맙 중쇄로의 F2-GalNBAz 전달에 기인한 하나의 주요 생성물(49815 Da, 전체 중쇄의 약 90%)의 형성을 나타내었다.
실시예 28. 트라스투주맙--( Man 5 GlcNAc - GalNAz ) 2
(실시예 19에 기재된 바와 같이 스위인소닌의 존재하에 트라스투주맙의 일시적 발현되고 뉴라미니다아제 및 갈락토시다아제로 트리밍되어 획득된 화학식 26에서와 같이) GlcNAc-Man5-GlcNAc-GlcNAc(Fuc)-치환된 트라스투주맙은 UDP-GalNAz GalNAcT를 이용하여 글리코실트랜스퍼 프로토콜을 적용받았다. 트리밍된 항체를 UDP-GalNAz(0.5 mM)(Glycohub, Inc로부터 상업적으로 입수가능) 및 CeGalNAcT(0.1 mg/mL)과 함께 10mM MnCl2 및 25mM Tris-HCl pH 8.0에서 30℃에서 16시간 동안 인큐베이션하였으며, 이는 GalNAz-GlcNAc-Man5-GlcNAc-GlcNAc(Fuc)-치환된 트라스투주맙으로의 완전한 전환을 이끌었다(50929 Da의 주요 중쇄 생성물, 전체 중쇄 생성물의 ±90%).
실시예 29. 트라스투주맙--( Man 3 ( GlcNAc - GalNAz ) 2 ) 2
(화학식 27, 실시예 24에 기재된 제조에서와 같이) 글리코시다아제를 이용한 트리밍 후에 획득된 트라스투주맙은 UDP-GalNAz 및 GalNAcT를 이용하여 글리코실트랜스퍼 프로토콜을 적용받았다. 트리밍된 항체를 UDP-GalNAz (0.5 mM)(Glycohub, Inc로부터 상업적으로 입수가능) 및 CeGalNAcT(0.1mg/mL)과 함께 10mM MnCl2 및 25mM Tris-HCl pH 8.0에서 22℃에서 16시간 동안 인큐베이션하였으며, 이는 (GalNAz-GlcNAc)2-Man3-GlcNAc-GlcNAc(Fuc)-치환된 트라스투주맙으로의 완전한 전환을 이끌었다(51027 Da의 주요 중쇄 생성물, 전체 중쇄 생성물의 ±90%).
실시예 30. CeGalNAcT ( M312H ) 및 Mg 2 + 를 이용한 트라스투주맙(F 2 -GalNAz) 2
트리밍된 트라스투주맙은 10mM MgCl2의 존재하에서 GalNAcT(1mg/mL)과 함께, UDP-N-아지도디플루오로아세틸갈락토오스아민(UDP-F2-GalNAz) 및 CeGalNAcT(M312H)를 이용하여 글리코실트랜스퍼 프로토콜을 적용받았다. 프로틴 A 친화도 정제 후, 작은 샘플을 DTT로 환원하고, 후속적으로 MS 분석하였으며, 이는 샘플 준비 도중에 DTT와 반응한 코어 GlcNAc(Fuc)-치환된 트라스투주맙으로의 F2-GalNAz 전달에 기인한 하나의 주요 중쇄 생성물(49873 Da, 전체 중쇄의 약 25%, 나머지는 트리밍된 항체로 잔류함)의 형성을 나타내었다.
부가적인 당 유도체 뉴클레오타이드 Su (A)- Nuc (3)의 합성
화학식 (3)에 따른 부가적인 당 유도체 뉴클레오타이드 Su(A)-Nuc는 예를 들어, 모두 본 명세서에 참고문헌으로 편입된 WO 2014/065661 (SynAffix B.V., Pouilly et al., ACS Chem . Biol. 2012, 7, 753 및 Guan et al., Chem . Eur . J. 2010, 16, 13343에 기재된 바와 같은 절차에 따라(a.o.) 제조되었다.
실시예 31. UDP - GalNAcSAc 의 합성(( 20 ), 여기서, V는 O, r은 0이며 그리고 R 8 CH 3 임)
UDP-D-갈락토오스아민(실시예 16)(45mg, 0.0796 mmol)을 완충액 pH 7(0.5M K2HPO4)(2mL)에 용해시켰다. N-숙신이미딜-S-아세틸티오아세테이트(37mg, 0.159mmol) 및 DMF(2mL)를 첨가하고, 반응물을 실온에서 밤새 교반하였다. 또 다른 36mg의 N-숙신이미딜-S-아세틸티오아세테이트를 첨가하고 3시간 후에 반응물을 진공하에 농축시켰다. 플래시 크로마토그래피(7:2:1-5:2:1 EtOAc:MeOH:H2O)하여 UDP-GalNAcSAc(28mg, 0.041mmol, 52%)를 수득하였다.
1H-NMR (300 MHz, D2O): δ 7.84 (d, J = 8.1 Hz, 1H), 5.90-5.82 (m, 2H), 5.48-5.41 (m, 1H), 4.29-4.22 (m, 2H), 4.20-4.00 (m, 5H), 3.98-3.82 (m, 2H), 3.79-3.59 (m, 4H), 2.30 (s, 3H). C19H29N3O18P2S (M-H+)에 대한 LRMS (ESI-) 계산치 680.06, 실측치 680.1.
실시예 32. UDP - GalNAcCl 의 합성(( 19 ), 여기서 X는 Cl 임)
UDP-D-갈락토오스아민(실시예 16)(42mg, 0.074mmol)을 0.1M NaHCO3(1mL) 및 N-(클로로아세톡시)숙신이미드(29mg, 0.149mmol)(Hosztafi et al., Helv . Chim . Acta, 1996, 79, 133-136에 따라 제조됨) 및 DMF(1mL)를 첨가하였다. 반응물을 밤새 실온에서 교반하고, 또 다른 10mg의 N-(클로로아세톡시)숙신이미드를 첨가하고 밤새 교반을 계속하였다. 반응물을 진공하에 농축시키고, 플래시 크로마토그래피(7:2:1-5:2:1 EtOAc:MeOH:H2O)로 정제하여 UDP-GalNAcCl(25mg, 0.039mmol, 53%)을 수득하였다.
1H-NMR (300 MHz, D2O): δ 7.84 (d, J = 8.1 Hz, 1H), 5.89-5.84 (m, 2H), 5.53-5.46 (m, 1H), 4.33-4.00 (m, 9H), 3.99-3.88 (m, 2H), 3.77-3.59 (m, 2H), 1.83 (s, 1H).
C17H26ClN3O17P2 (M-H+)에 대한 LRMS (ESI-) 계산치, 640.03 (100%), 642.03 (32%), 실측치 640.1 (100%), 642.2 (35%).
실시예 33. UDP - GalNAcBr 의 합성(( 19 ), 여기서 X는 Br 임)
UDP-D-갈락토오스아민(실시예 16)(42mg, 0.088mmol)을 0.1M NaHCO3(3mL) 및 N-(브로모아세톡시)숙신이미드 63mg, 0.265mmol)(Hosztafi et al ., Helv . Chim . Acta, 1996, 79, 133-136에 따라 제조됨) 및 DMF(1mL)를 첨가하였다. 반응물을 밤새 실온에서 교반하고 진공하에 농축하였다. 그 화합물을 플래시 크로마토그래피(7:2:1-5:2:1 EtOAc:MeOH:H2O)로 정제하여 UDP-GalNAcBr(25mg, 0.048mmol, 65%)을 수득하였다.
1H-NMR (300 MHz, D2O): δ 7.86 (d, J = 3.2 Hz, 1H), 5.97-5.84 (m, 2H), 5.54-5.46 (m, 1H), 4.33-4.04 (m, 6H), 3.99-3.85 (m, 2H), 3.79-3.60 (m, 2H), 2.75-2.68 (m, 3H).
C17H26BrN3O17P2 (M-H+)에 대한 계산치 683.98 (100%), 685.98 (98%), 실측치 687.1 (100%), 688.0 (92%), 686.0 (85%), 689.0 (72%).
실시예 34. T. 니(T. ni ) GalNAcT 돌연변이 및 A. 숨(A. suum ) GalNAcT 돌연변이의 디자인
TnGalNAcT 및 AsGalNAcT의 돌연변이는 Qasba et al.(J. Biol. Chem. 2002, 277: 20833-20839, 참고문헌으로 편입됨)에 의해 보고된 UDP-N-아세틸-갈락토오스아민(PDB 엔트리 1OQM) 및 β(1,4)-Gal-T1(Y289L) 돌연변이와의 복합체로 보바인 β(1,4)-Gal-T1에 대한 결정 구조에 기초하여 디자인되었다. TnGalNAcT 및 AsGalNAcT의 돌연변이는 보바인 β(1,4)-Gal-T1과 TnGalNAcT및 AsGalNAcT의 서열 정렬에 기초하여 디자인되었다. 이들 단백질 간의 상응하는 아미노산 잔기를 표 3에 나타내었다.
Figure pct00028

실시예 35. His 6 - TnGalNAcT (33-421) 돌연변이의 사이트 특이적 돌연변이 유발
NdeI-BamHI 사이트 사이의 TnGalNAcT(SEQ ID NO: 8로 나타냄)의 잔기 33-421을 코딩하는 코돈 최적화된 서열을 함유하는 pET15b 벡터를 Genscript로부터 수득하여, 이를 His6-TnGalNAcT(33-421)(SEQ ID NO: 49로 나타냄)로 하였다. TnGalNacT 돌연변이 유전자는 선형 증폭 PCR에 의해 오버래핑 프라이머 세트를 사용하여 상기 기술된 구조로부터 증폭되었다. His6-TnGalNAcT(33-421; W336F)(SEQ ID NO: 50으로 나타냄)의 제작을 위해, 본 명세서에서 SEQ ID NO: 79 및 SEQ ID NO: 80으로 정의된 한 쌍의 프라이머로 DNA 프래그먼트를 증폭시켰다. His6-TnGalNAcT(33-421; W336H)(SEQ ID NO: 51로 나타냄)의 구축을 위해, 본 명세서에서 SEQ ID NO: 81 및 SEQ ID NO: 82로 정의된 한 쌍의 프라이머로 DNA 프래그먼트를 증폭시켰다. His6-TnGalNAcT(33-421; W336V)(SEQ ID NO: 52로 나타냄)의 제작을 위해, DNA 프래그먼트를 본 명세서에서 SEQ ID NO: 83 및 SEQ ID NO: 84로 정의된 한 쌍의 프라이머로 증폭시켰다. His6-TnGalNAcT(33-421; E339A)(SEQ ID NO: 53으로 나타냄)의 제작을 위해, 본 명세서에서 SEQ ID NO: 85 및 SEQ ID NO: 86으로 정의된 한 쌍의 프라이머로 DNA 프래그먼트를 증폭시켰다. His-TnGalNAcT(33-421; E339D)(SEQ ID NO: 55로 나타냄)의 제작을 위해, DNA 프래그먼트를 본 명세서에서 SEQ ID NO: 88 및 SEQ ID NO: 89로 정의된 한 쌍의 프라이머로 증폭시켰다. His6-TnGalNAcT(33-421; I299M)(SEQ ID NO: 45로 나타냄)의 제작을 위해 DNA 프래그먼트를 본 명세서에서 SEQ ID NO: 61 및 SEQ ID NO: 62로 정의된 한 쌍의 프라이머로 증폭시켰다. His6-TnGalNAcT(33-421; I299A)(SEQ ID NO: 48로 나타냄)의 제작을 위해, DNA 프래그먼트를 본 명세서에서 SEQ ID NO: 63 및 SEQ ID NO: 64로 정의된 한 쌍의 프라이머로 증폭시켰다. His6-TnGalNAcT(33-421; I299G)(SEQ ID NO: 54로 나타냄)의 구축을 위해, DNA 프래그먼트를 본 명세서에서 SEQ ID NO: 65 및 SEQ ID NO: 66으로 정의된 한 쌍의 프라이머로 증폭시켰다. His6-TnGalNAcT(33-421; L302A)(SEQ ID NO: 43으로 나타냄)의 구축을 위해, DNA 프래그먼트를 본 명세서에서 SEQ ID NO: 67 및 SEQ ID NO: 68로 정의된 한 쌍의 프라이머로 증폭시켰다. His6-TnGalNAcT(33-421; L302G)(SEQ ID NO: 44로 나타냄)의 구축을 위해, 본 명세서에서 SEQ ID NO: 69 및 SEQ ID NO: 70으로 정의된 한 쌍의 프라이머로 DNA 프래그먼트를 증폭시켰다. His6-TnGalNAcT(33-421; I311M)(SEQ ID NO: 60으로 나타냄)의 구축을 위해, DNA 프래그먼트를 본 명세서에서 SEQ ID NO: 74 및 SEQ ID NO: 87로 정의된 한 쌍의 프라이머로 증폭시켰다. PCR 증폭 후, 반응 혼합물을 DpnI로 처리하여 주형 DNA를 절단 한 후, (New England Biolabs으로부터 획득된) NEB 10-베타-컴피턴트 세포로 형질전환시켰다. DNA를 분리하고, 돌연변이들 His6-TnGalNAcT(33-421; W336F)(SEQ ID NO: 50으로 나타냄), His6-TnGalNAcT(33-421; W336V)(SEQ ID NO: 52), His6-TnGalNAcT(33-421, E339A)(SEQ ID NO: 53으로 나타냄), His6-TnGalNAcT(33-421; I299M)(SEQ ID NO: 45로 나타냄), His6-TnGalNAcT(33-421; I299A)(SEQ ID NO: 48로 나타냄), His6-TnGalNAcT(33-421; I299G)(SEQ ID NO: 54로 나타냄), His6-TnGalNAcT(33-421; L302A)(SEQ ID NO: 44로 나타냄) 및 His6-TnGalNAcT(33-421; I311M)(SEQ ID NO: 60으로 나타냄)에 대한 서열분석에 의해 서열을 확인하였다.
Figure pct00029

실시예 36. E. 콜라이(E. coli)에서 His 6 - TnGalNAcT (33-421), His 6 -TnGalNAcT(33-421; W336F ), His 6 - TnGalNAcT (33-421; W336V ), His 6 - TnGalNAcT (33-421; I299M), His 6 - TnGalNAcT (33-421; I299A ), His 6 - TnGalNAcT (33-421; I299G ), His 6 -TnGalNAcT(33-421; L302A ), His 6 - TnGalNAcT (33-421; L302G ), His 6 -TnGalNAcT(33-421; I311M ), His 6 - TnGalNAcT (33-421; E339D ) 및 His 6 -TnGalNAcT(33-421; E339A )의 발현 및 리폴딩
His6-TnGalNAcT(33-421), His6-TnGalNAcT(33-421; W336F), His6-TnGalNAcT(33-421; W336V), His6-TnGalNAcT(33-421; I299M), His6-TnGalNAcT(33-421; I299A), His6-TnGalNAcT(33-421; I299G), His6-TnGalNAcT(33-421; L302A), His6-TnGalNAcT(33-421; L302G), His6-TnGalNAcT(33-421; I311M), His6-TnGalNAcT(33-421; E339D) 및 His6-TnGalNAcT(33-421; E339A)는 실시예 35에 기재된 바와 같이 획득된 이에 상응하는 pET15b-구조물로부터 발현되었다. 발현, 봉입체(inclusion body) 분리 및 리폴딩은 Qasba et al.(Prot. Expr. Pur. 2003, 30, 219-76229, 참고문헌으로 편입됨)에 의해 보고된 절차에 따라 수행되었다. 리폴딩 후, 불용성 단백질을 원심분리(14000xg에서 4℃에서 10분간)한 후, 0.45μM 포어 직경의 필터를 통해 여과하였다. 가용성 단백질을 HisTrap HP 5mL 컬럼(GE Healthcare)을 사용하여 정제하고 농축시켰다. 컬럼을 먼저 완충액 A(5mM Tris 완충액, 20mM 이미다졸, 500mM NaCl, pH 7.5)로 세정하였다. 보유된 단백질은 완충액 B(20mM Tris, 500mM NaCl, 500mM 이미다졸, pH 7.5, 10mL)로 용리시켰다. 분획을 폴리아크릴아미드겔(12%)상에서 SDS-PAGE로 분석하고, 정제된 표적 단백질을 함유하는 분획을 합하고, 그 완충액을 20mM Tris pH 7.5 및 500mM NaCl에 대해 4℃에서 밤새 투석함으로써 교환되었다. 정제된 단백질은 Amicon Ultra-0.5, Ultracel-10 Membrane(Millipore)을 사용하여 적어도 2mg/mL로 농축하고 이후 사용하기 전에 -80℃에서 보관했다.
실시예 37. W336 의 T. 니(T. ni ) GalNAcT 돌연변이의 디자인
GalT와 함께 TnGalNAcT의 서열 정렬에 기초하여, 3가지의 활성 사이트 돌연변이들이 트립토판336의 페닐알라닌, 히스티딘 또는 발린으로의 돌연변이에 의해 디자인되었다(밑줄 그어짐).
T. ni(SEQ ID NO: 50으로 나타낸 His6-TnGalNAcT [33-421; W336F])
MGSSHHHHHHSSGLVPRGSHMSPLRTYLYTPLYNATQPTLRNVERLAANWPKKIPSNYIEDSEEYSIKNISLSNHTTRASVVHPPSSITETASKLDKNMTIQDGAFAMISPTPLLITKLMDSIKSYVTTEDGVKKAEAVVTLPLCDSMPPDLGPITLNKTELELEWVEKKFPEVEWGGRYSPPNCTARHRVAIIVPYRDRQQHLAIFLNHMHPFLMKQQIEYGIFIVEQEGNKDFNRAKLMNVGFVESQKLVAEGWQCFVFHDIDLLPLDTRNLYSCPRQPRHMSASIDKLHFKLPYEDIFGGVSAMTLEQFTRVNGFSNKYWGFGGEDDDMSYRLKKINYHIARYKMSIARYAMLDHKKSTPNPKRYQLLSQTSKTFQKDGLSTLEYELVQVVQYHLYTHILVNIDERS
T. ni(SEQ ID NO: 51로 나타낸 His6-TnGalNAcT [33-421; W336H])
MGSSHHHHHHSSGLVPRGSHMSPLRTYLYTPLYNATQPTLRNVERLAANWPKKIPSNYIEDSEEYSIKNISLSNHTTRASVVHPPSSITETASKLDKNMTIQDGAFAMISPTPLLITKLMDSIKSYVTTEDGVKKAEAVVTLPLCDSMPPDLGPITLNKTELELEWVEKKFPEVEWGGRYSPPNCTARHRVAIIVPYRDRQQHLAIFLNHMHPFLMKQQIEYGIFIVEQEGNKDFNRAKLMNVGFVESQKLVAEGWQCFVFHDIDLLPLDTRNLYSCPRQPRHMSASIDKLHFKLPYEDIFGGVSAMTLEQFTRVNGFSNKYWGHGGEDDDMSYRLKKINYHIARYKMSIARYAMLDHKKSTPNPKRYQLLSQTSKTFQKDGLSTLEYELVQVVQYHLYTHILVNIDERS
T. ni(SEQ ID NO: 52로 나타낸 His6-TnGalNAcT [33-421; W336V])
MGSSHHHHHHSSGLVPRGSHMSPLRTYLYTPLYNATQPTLRNVERLAANWPKKIPSNYIEDSEEYSIKNISLSNHTTRASVVHPPSSITETASKLDKNMTIQDGAFAMISPTPLLITKLMDSIKSYVTTEDGVKKAEAVVTLPLCDSMPPDLGPITLNKTELELEWVEKKFPEVEWGGRYSPPNCTARHRVAIIVPYRDRQQHLAIFLNHMHPFLMKQQIEYGIFIVEQEGNKDFNRAKLMNVGFVESQKLVAEGWQCFVFHDIDLLPLDTRNLYSCPRQPRHMSASIDKLHFKLPYEDIFGGVSAMTLEQFTRVNGFSNKYWGVGGEDDDMSYRLKKINYHIARYKMSIARYAMLDHKKSTPNPKRYQLLSQTSKTFQKDGLSTLEYELVQVVQYHLYTHILVNIDERS
실시예 38. L302 의 T. 니(T. ni ) GalNAcT 돌연변이의 디자인
GalT와 함께 TnGalNAcT의 서열 정렬에 기초하여, 3가지의 활성 사이트 돌연변이들이 루신302의 글리신 또는 알라닌으로의 돌연변이에 의해 디자인되었다(밑줄 그어짐).
T. ni(SEQ ID NO: 44로 나타낸 His6-TnGalNAcT [33-421; L302G])
MGSSHHHHHHSSGLVPRGSHMSPLRTYLYTPLYNATQPTLRNVERLAANWPKKIPSNYIEDSEEYSIKNISLSNHTTRASVVHPPSSITETASKLDKNMTIQDGAFAMISPTPLLITKLMDSIKSYVTTEDGVKKAEAVVTLPLCDSMPPDLGPITLNKTELELEWVEKKFPEVEWGGRYSPPNCTARHRVAIIVPYRDRQQHLAIFLNHMHPFLMKQQIEYGIFIVEQEGNKDFNRAKLMNVGFVESQKLVAEGWQCFVFHDIDLLPLDTRNLYSCPRQPRHMSASIDKGHFKLPYEDIFGGVSAMTLEQFTRVNGFSNKYWGWGGEDDDMSYRLKKINYHIARYKMSIARYAMLDHKKSTPNPKRYQLLSQTSKTFQKDGLSTLEYELVQVVQYHLYTHILVNIDERS
T. ni(SEQ ID NO: 43으로 나타낸 His6-TnGalNAcT [33-421; L302A])
MGSSHHHHHHSSGLVPRGSHMSPLRTYLYTPLYNATQPTLRNVERLAANWPKKIPSNYIEDSEEYSIKNISLSNHTTRASVVHPPSSITETASKLDKNMTIQDGAFAMISPTPLLITKLMDSIKSYVTTEDGVKKAEAVVTLPLCDSMPPDLGPITLNKTELELEWVEKKFPEVEWGGRYSPPNCTARHRVAIIVPYRDRQQHLAIFLNHMHPFLMKQQIEYGIFIVEQEGNKDFNRAKLMNVGFVESQKLVAEGWQCFVFHDIDLLPLDTRNLYSCPRQPRHMSASIDKAHFKLPYEDIFGGVSAMTLEQFTRVNGFSNKYWGWGGEDDDMSYRLKKINYHIARYKMSIARYAMLDHKKSTPNPKRYQLLSQTSKTFQKDGLSTLEYELVQVVQYHLYTHILVNIDERS
실시예 39. E339 의 T. 니(T. ni ) GalNAcT 돌연변이의 디자인
GalT와 함께 TnGalNAcT의 서열 정렬에 기초하여, 3가지의 활성 사이트 돌연변이들이 글루탐산339의 글리신, 알라닌 또는 아스파트산으로의 돌연변이에 의해 디자인되었다(밑줄 그어짐).
T. ni(SEQ ID NO: 53으로 나타낸 His6-TnGalNAcT [33-421; E339A])
MGSSHHHHHHSSGLVPRGSHMSPLRTYLYTPLYNATQPTLRNVERLAANWPKKIPSNYIEDSEEYSIKNISLSNHTTRASVVHPPSSITETASKLDKNMTIQDGAFAMISPTPLLITKLMDSIKSYVTTEDGVKKAEAVVTLPLCDSMPPDLGPITLNKTELELEWVEKKFPEVEWGGRYSPPNCTARHRVAIIVPYRDRQQHLAIFLNHMHPFLMKQQIEYGIFIVEQEGNKDFNRAKLMNVGFVESQKLVAEGWQCFVFHDIDLLPLDTRNLYSCPRQPRHMSASIDKLHFKLPYEDIFGGVSAMTLEQFTRVNGFSNKYWGWGGADDDMSYRLKKINYHIARYKMSIARYAMLDHKKSTPNPKRYQLLSQTSKTFQKDGLSTLEYELVQVVQYHLYTHILVNIDERS
T. ni(SEQ ID NO: 55로 나타낸 His6-TnGalNAcT [33-421; E339D])
MGSSHHHHHHSSGLVPRGSHMSPLRTYLYTPLYNATQPTLRNVERLAANWPKKIPSNYIEDSEEYSIKNISLSNHTTRASVVHPPSSITETASKLDKNMTIQDGAFAMISPTPLLITKLMDSIKSYVTTEDGVKKAEAVVTLPLCDSMPPDLGPITLNKTELELEWVEKKFPEVEWGGRYSPPNCTARHRVAIIVPYRDRQQHLAIFLNHMHPFLMKQQIEYGIFIVEQEGNKDFNRAKLMNVGFVESQKLVAEGWQCFVFHDIDLLPLDTRNLYSCPRQPRHMSASIDKLHFKLPYEDIFGGVSAMTLEQFTRVNGFSNKYWGWGGDDDDMSYRLKKINYHIARYKMSIARYAMLDHKKSTPNPKRYQLLSQTSKTFQKDGLSTLEYELVQVVQYHLYTHILVNIDERS
실시예 40. T. 니(T. ni ) GalNAcT 돌연변이 I299M 의 디자인
GalT와 함께 TnGalNAcT의 서열 정렬에 기초하여, 3가지의 활성 사이트 돌연변이들이 이소루신299의 메티오닌, 알라닌 또는 글리신으로의 돌연변이에 의해 디자인되었다(밑줄 그어짐).
T. ni(SEQ ID NO: 45로 나타낸 His6-TnGalNAcT [33-421; I299M])
MGSSHHHHHHSSGLVPRGSHMSPLRTYLYTPLYNATQPTLRNVERLAANWPKKIPSNYIEDSEEYSIKNISLSNHTTRASVVHPPSSITETASKLDKNMTIQDGAFAMISPTPLLITKLMDSIKSYVTTEDGVKKAEAVVTLPLCDSMPPDLGPITLNKTELELEWVEKKFPEVEWGGRYSPPNCTARHRVAIIVPYRDRQQHLAIFLNHMHPFLMKQQIEYGIFIVEQEGNKDFNRAKLMNVGFVESQKLVAEGWQCFVFHDIDLLPLDTRNLYSCPRQPRHMSASMDKLHFKLPYEDIFGGVSAMTLEQFTRVNGFSNKYWGWGGEDDDMSYRLKKINYHIARYKMSIARYAMLDHKKSTPNPKRYQLLSQTSKTFQKDGLSTLEYELVQVVQYHLYTHILVNIDERS
T. ni(SEQ ID NO: 48로 나타낸 His6-TnGalNAcT [33-421; I299A])
MGSSHHHHHHSSGLVPRGSHMSPLRTYLYTPLYNATQPTLRNVERLAANWPKKIPSNYIEDSEEYSIKNISLSNHTTRASVVHPPSSITETASKLDKNMTIQDGAFAMISPTPLLITKLMDSIKSYVTTEDGVKKAEAVVTLPLCDSMPPDLGPITLNKTELELEWVEKKFPEVEWGGRYSPPNCTARHRVAIIVPYRDRQQHLAIFLNHMHPFLMKQQIEYGIFIVEQEGNKDFNRAKLMNVGFVESQKLVAEGWQCFVFHDIDLLPLDTRNLYSCPRQPRHMSASADKLHFKLPYEDIFGGVSAMTLEQFTRVNGFSNKYWGWGGEDDDMSYRLKKINYHIARYKMSIARYAMLDHKKSTPNPKRYQLLSQTSKTFQKDGLSTLEYELVQVVQYHLYTHILVNIDERS
T. ni(SEQ ID NO: 54로 나타낸 His6-TnGalNAcT [33-421; I299G])
MGSSHHHHHHSSGLVPRGSHMSPLRTYLYTPLYNATQPTLRNVERLAANWPKKIPSNYIEDSEEYSIKNISLSNHTTRASVVHPPSSITETASKLDKNMTIQDGAFAMISPTPLLITKLMDSIKSYVTTEDGVKKAEAVVTLPLCDSMPPDLGPITLNKTELELEWVEKKFPEVEWGGRYSPPNCTARHRVAIIVPYRDRQQHLAIFLNHMHPFLMKQQIEYGIFIVEQEGNKDFNRAKLMNVGFVESQKLVAEGWQCFVFHDIDLLPLDTRNLYSCPRQPRHMSASGDKLHFKLPYEDIFGGVSAMTLEQFTRVNGFSNKYWGWGGEDDDMSYRLKKINYHIARYKMSIARYAMLDHKKSTPNPKRYQLLSQTSKTFQKDGLSTLEYELVQVVQYHLYTHILVNIDERS
실시예 41. T. 니(T. ni ) GalNAcT 돌연변이 I311M 의 디자인
TnGalNAcT 돌연변이가 이소루신311의 메티오닌으로의 돌연변이에 의해 디자인되었다.
T. ni(SEQ ID NO: 60으로 나타낸 TnGalNAcT [33-421; I311M])
SPLRTYLYTPLYNATQPTLRNVERLAANWPKKIPSNYIEDSEEYSIKNISLSNHTTRASVVHPPSSITETASKLDKNMTIQDGAFAMISPTPLLITKLMDSIKSYVTTEDGVKKAEAVVTLPLCDSMPPDLGPITLNKTELELEWVEKKFPEVEWGGRYSPPNCTARHRVAIIVPYRDRQQHLAIFLNHMHPFLMKQQIEYGIFIVEQEGNKDFNRAKLMNVGFVESQKLVAEGWQCFVFHDIDLLPLDTRNLYSCPRQPRHMSASIDKLHFKLPYEDMFGGVSAMTLEQFTRVNGFSNKYWGWGGEDDDMSYRLKKINYHIARYKMSIARYAMLDHKKSTPNPKRYQLLSQTSKTFQKDGLSTLEYELVQVVQYHLYTHILVNIDERS
실시예 42. UDP - GalNPropN 3 의 합성(( 9 ), 여기서 U는 [ CH 2 ] 2 이며 , A = N 3 임)
화학식 (3)에 따른 당 유도체 뉴클레오타이드 Su(A)-Nuc, UDP-GalNPropN3가 예를 들어, WO 2014/065661 (SynAffix B.V.), Pouilly et al., ACS Chem . Biol. 2012, 7, 753 및 Guan et al., Chem . Eur . J. 2010, 16, 13343(모두 참고문헌으로 편입됨)에 기재된 바와 같은 절차에 따라(a.o.) 제조되었다.
실시예 43. UDP - GalNButN 3 의 합성(( 9 ), 여기서 U는 [ CH 2 ] 3 이며 , A = N 3 임)
화학식 (3)에 따른 당 유도체 뉴클레오타이드 Su(A)-Nuc, UDP-GalNButN3가 예를 들어, WO 2014/065661 (SynAffix B.V.), Pouilly et al., ACS Chem . Biol. 2012, 7, 753 및 Guan et al., Chem . Eur . J. 2010, 16, 13343(모두 참고문헌으로 편입됨)에 기재된 바와 같은 절차에 따라(a.o.) 제조되었다.
실시예 44. UDP - GalNProSH 의 합성(( 21 ), 여기서 t=2임)
화학식 (3)에 따른 당 유도체 뉴클레오타이드 Su(A)-Nuc, UDP-GalNProSH가 예를 들어, WO 2014/065661 (SynAffix B.V.), Pouilly et al., ACS Chem . Biol. 2012, 7, 753 및 Guan et al., Chem . Eur . J. 2010, 16, 13343(모두 참고문헌으로 편입됨)에 기재된 바와 같은 절차에 따라(a.o.) 제조되었다.
실시예 45. UDP - GalNBzN 3 의 합성(( 23 ), 여기서 X는 H임)
화학식 (3)에 따른 당 유도체 뉴클레오타이드 Su(A)-Nuc, UDP-GalNBzN3가 예를 들어, WO 2014/065661 (SynAffix B.V.), Pouilly et al., ACS Chem . Biol. 2012, 7, 753 및 Guan et al., Chem . Eur . J. 2010, 16, 13343(모두 참고문헌으로 편입됨)에 기재된 바와 같은 절차에 따라(a.o.) 제조되었다.
실시예 46. UDP - GalNPyrN 3 의 합성(( 12 ), 여기서 A는 N 3 이며 R 2 는 H임)
화학식 (3)에 따른 당 유도체 뉴클레오타이드 Su(A)-Nuc, UDP-GalNPyrN3가 예를 들어, WO 2014/065661 (SynAffix B.V.), Pouilly et al., ACS Chem . Biol. 2012, 7, 753 및 Guan et al., Chem . Eur . J. 2010, 16, 13343(모두 참고문헌으로 편입됨)에 기재된 바와 같은 절차에 따라(a.o.) 제조되었다.
GalNAcT 를 이용한 갈락토오스 유도체(예: 티오당 )의 글리코실트랜스퍼 (일반 프로토콜)
갈락토오스 유도체(예, 티오 함유 당 21)를 IgG상으로 효소적으로 도입하는 것은 GalNAc 트랜스퍼라아제 또는 이의 돌연변이로 이루어졌다. 디글리코실화된 IgG(상술한 바와 같이 제조됨, 10mg/mL)를 10mM MnCl2 및 50mM Tris-HCl pH 6.0에서 변형된 UDP 갈락토오스 유도체(예, 티오-변형된 당-UDP 유도체)(2mM) 및 GalNAcT(0.2mg/mL)와 함께 30℃에서 16시간 동안 인큐베이션하였다. 기능화된 IgG(예: 티오-기능화된 트라스투주맙)를 프로틴 A 아가로즈(IgG mg 당 40μL)와 함께 실온에서 1시간 동안 인큐베이션하였다. 프로틴 A 아가로즈를 TBS(pH 6.0)로 3회 세정하고, IgG를 100mM 글리신-HCl pH 2.5로 용리시켰다. 용리된 IgG를 1M Tris-HCl pH 7.0로 중화시키고, 농도가 15-20mg/mL가 되도록 Amicon Ultra-0.5, Ultracel-10 Membrane(Millipore)을 사용하여 50mM Tris-HCl pH 6.0으로 농축 및 세정하였다.
실시예 47. CeGalNAcT 을 이용하여 디글리코실화된 트라스투주맙으로의 UDP -GalNProSH(( 21 ), 여기서 t=2임)의 글리코실트랜스퍼를 통한 트라스트주 맙( GalNProSH ) 2 의 제조
트리밍된 트라스투주맙은 UDP-GalNProSH(2mM) 및 CeGalNAcT(1mg/mL)를 이용하여 글리코실트랜스퍼 프로토콜을 적용받았다. 하룻밤 배양 후, FabricatorTM(10μL PBS pH 6.6 중 50 U)으로 다이제션한 다음 Amicon Ultra-0.5, Ultracel-10 Membrane(Millipore)을 사용하여 MiliQ로 세정한 후 작은 샘플을 스펙트럼 분석에 적용하였다. 출발 물질의 두 생성물로의 완전한 전환이 관찰되었다. 주요 생성물(24387 Da, 예상 질량 24388)은 디글리코실화된 트라스투주맙 + GalNProSH(trastuzumab-(GalNProSH)2)에 해당하는 반면, 부 생성물(25037 Da, 예상 질량 25038)는 디글리코실화된 트라스투주맙 + GalNProS-UDPGalNProS 디설피드에 해당하였다. 두 생성물의 비율은 약 60:40이다.
실시예 48. TnGalNAcT 를 이용하여 디글리코실화된 트라스투주맙으로의 UDP -GalNProSH(( 21 ), 여기서 t=2임)의 글리코실트랜스퍼를 통한 트라스트주 맙( GalNProSH ) 2 의 제조
트리밍된 트라스투주맙은 UDP-GalNProSH(2mM) 및 TnGalNAcT(0.2mg/mL)를 이용하여 글리코실트랜스퍼 프로토콜을 적용받았다. 하룻밤 배양 후, FabricatorTM(10μL PBS pH 6.6 중 50 U)으로 다이제션한 다음 Amicon Ultra-0.5, Ultracel-10 Membrane(Millipore)을 사용하여 MiliQ로 세정한 후 작은 샘플을 스펙트럼 분석에 적용하였다. 출발 물질의 두 생성물로의 완전한 전환이 관찰되었다. 주요 생성물(24387 Da, 예상 질량 24388)은 디글리코실화된 트라스투주맙 + GalNProSH(trastuzumab-(GalNProSH)2)에 해당하는 반면, 부 생성물(25037 Da, 예상 질량 25038)는 디글리코실화된 트라스투주맙 + GalNProS-UDPGalNProS 디설피드에 해당하였다. 두 생성물의 비율은 약 60:40이다.
실시예 49. AsGalNAcT 를 이용하여 디글리코실화된 트라스투주맙으로의 UDP -GalNProSH(( 21 ), 여기서 t=2임)의 글리코실트랜스퍼를 통한 트라스트주맙( GalNProSH ) 2 의 제조
트리밍된 트라스투주맙은 UDP-GalNProSH(2mM) 및 AsGalNAcT(0.2mg/mL)를 이용하여 글리코실트랜스퍼 프로토콜을 적용받았다. 하룻밤 배양 후, 작은 샘플을 DTT로 환원시킨 다음, 후속적으로 MS 분석에 적용하였으며, 이는 코어 GlcNAc(Fuc) 치환된 트라스투주맙으로의 GalNProSH 전달에 기인한 하나의 주요 생성물(49755 Da, 전체 중쇄의 95%)의 형성을 나타내었다.
실시예 50. TnGalNAcT 를 이용하여 디글리코실화된 트라스투주맙으로의 UDP -GalNPyrN 3 (( 12 ), 여기서 A는 N 3 이며, R 2 는 H임)의 글리코실트랜스퍼를 통한 트라스트주맙( GalNProSH ) 2 의 제조
글리코실트랜스퍼에 대한 일반적인 프로토콜에 따라, 트리밍된 트라스투주맙을 UDP-GalNPyrN3((12), 여기서 A는 N3이며, R2는 H임)(4mM)의 존재하에서 TnGalNAcT(0.5mg/mL)로 처리하였다. 하룻밤 배양 후, FabricatorTM(10μL PBS pH 6.6 중 50U)으로 다이제션한 다음 Amicon Ultra-0.5, Ultracel-10 Membrane(Millipore)을 사용하여 MiliQ로 세정한 후 작은 샘플을 스펙트럼 분석에 적용하였다. 약 50% 전환율이 관찰되었다. 형성된 생성물(24445 Da, 예상 질량 24445)은 코어 GlcNAc(Fuc) 치환된 트라스투주맙에 기인한다.
실시예 51. TnGalNAcT 를 이용하여 디글리코실화된 트라스투주맙으로의 UDP -F 2 -GalNAz( 18 )의 글리코실트랜스퍼를 통한 트라스트주맙 (F 2 - GalNAz ) 2 의 제조
글리코실트랜스퍼에 대한 일반적인 프로토콜에 따라, 트리밍된 트라스투주맙을 UDP-F2-GalNAz(18, 1mM)의 존재하에 0.25mg/mL의 농도로 TnGalNAcT(wt), TnGalNAcT(W336V), TnGalNAcT(W336F), TnGalNAcT(E339A) 또는 TnGalNAcT(L302A)로 처리하였다. 하룻밤 배양 후, FabricatorTM(10μL PBS pH 6.6 중 50U)으로 다이제션한 다음 Amicon Ultra-0.5, Ultracel-10 Membrane(Millipore)을 사용하여 MiliQ로 세정한 후 작은 샘플을 스펙트럼 분석에 적용하였다. MS 분석은 코어 GlcNAc(Fuc) 치환된 트라스투주맙으로의 F2-GalNAz 전달에 기인한 주요 생성물(MW=24420 Da) 및 코어 GlcNAc 치환된 트라스투주맙으로의 F2-GalNAz 전달에 기인한 부 생성물(MW=24273 Da)의 형성을 나타내었다. TnGalNAcT(wt), TnGalNAcT(W336V), TnGalNAcT(W336F), TnGalNAcT(E339A) 또는 TnGalNAcT(L302A)에 대한 주요 및 부 생성물의 관찰된 누적 전환율은 각각, 95%, 27%, 24%, 5% 및 95%이었다.
실시예 52. TnGalNAcT 이용하여 이용하여 디글리코실화된 트라스투주맙으로의 UDP - GalNBzN 3 (( 23 ), 여기서 X는 H임)의 글리코실트랜스퍼를 통한 트라스트주맙( GalBzN 3 ) 2 의 제조
글리코실트랜스퍼에 대한 일반적인 프로토콜에 따라, 트리밍된 트라스투주맙을 UDP-GalNBzN3(4mM)((23), 여기서 X는 H임)의 존재하에 TnGalNAcT(0.7mg/mL)로 처리하였다. 하룻밤 배양 후, FabricatorTM(10μL PBS pH 6.6 중 50U)으로 다이제션한 다음 Amicon Ultra-0.5, Ultracel-10 Membrane(Millipore)을 사용하여 MiliQ로 후속적인 세정한 후에 작은 샘플을 스펙트럼 분석에 적용하였다. 약 70% 전환율이 관찰되었다. 형성된 생성물(24444 Da, 예상 질량 24443)은 코어 GlcNAc(Fuc) 치환된 트라스투주맙으로의 GalNBzN3 전달에 기인한다.
실시예 53. TnGalNAcT 를 이용하여 디글리코실화된 트라스투주맙으로의 UDP -F 2 -GalNBzN 3 ( 24 )의 글리코실트랜스퍼를 통한 트라스투주맙(F 2 - GalNBzN 3 ) 2 의 제조
글리코실트랜스퍼에 대한 일반적인 프로토콜에 따라, 트리밍된 트라스투주맙을 UDP-F2-GalNBzN3(24, 1mM)의 존재하에 0.5mg/mL의 농도로 TnGalNAcT(wt), TnGalNAcT(W336H), TnGalNAcT(I299M), TnGalNAcT(L302A) 또는 TnGalNAcT(L302G)로 처리하였다. 하룻밤 배양 후, 작은 샘플을 FabricatorTM(10μL PBS pH 6.6 중 50U)으로 다이제션한 다음 Amicon Ultra-0.5, Ultracel-10 Membrane(Millipore)을 사용하여 MiliQ로 세정하였다. MS 분석은 코어 GlcNAc(Fuc) 치환된 트라스투주맙으로의 F2-GalNBzN3 전달에 기인한 주요 생성물(MW=24479 Da) 및 코어 GlcNAc 치환된 트라스투주맙으로의 F2-GalNBzN3 전달에 기인한 부 생성물(MW=24332 Da)의 형성을 나타내었다. TnGalNAcT(wt), TnGalNAcT(W336H), TnGalNAcT(I299M), TnGalNAcT(L302A) 또는 TnGalNAcT(L302G)에 대한 주요 및 부 생성물의 관찰된 누적 전환율은 각각, 14%, 62%, 26%, 37% 및 14%이었다.
실시예 54. AsGalNAcT 를 이용하여 디글리코실화된 트라스투주맙으로의 UDP -GalNPropN 3 (( 31 ), 여기서 U는 [ CH 2 ] 2 이며 A= N 3 임)의 리코실트랜스퍼를 통한 트라스투주맙( GalNPropN 3 ) 2 의 제조
글리코실트랜스퍼에 대한 일반적인 프로토콜에 따라, 트리밍된 트라스투주맙을 UDP-GalNPropN3((31), 여기서 U는 [CH2]2이며 A=N3임, 0.7mM)의 존재하에 0.2mg/mL의 농도로 AsGalNAcT로 처리하였다. 하룻밤 배양 후, 작은 샘플을 DTT로 환원시킨 다음, 후속적으로 MS 분석에 적용하였으며, 이는 코어 GlcNAc(Fuc) 치환된 트라스투주맙으로의 GalNPropN3 전달에 기인한 하나의 주요 생성물(49759 Da, 전체 중쇄의 70%)의 형성을 나타내었다.
실시예 55. AsGalNAcT 를 이용하여 디글리코실화된 트라스투주맙으로의 UDP-GalNButN 3 (( 31 ) 여기서 U는 [ CH 2 ] 3 이며 A= N 3 임)의 글리코실트랜스퍼를 통한 트라스투주맙( GalNButN 3 ) 2 의 제조
글리코실트랜스퍼에 대한 일반적인 프로토콜에 따라, 트리밍된 트라스투주맙을 UDP-GalNPropN3((31), 여기서 U는 [CH2]2이며 A=N3임, 0.7mM)의 존재하에 0.2mg/mL의 농도로 AsGalNAcT(wt)로 처리하였다. 하룻밤 배양 후, 작은 샘플을 DTT로 환원시킨 다음, 후속적으로 MS 분석에 적용하였으며, 이는 코어 GlcNAc(Fuc) 치환된 트라스투주맙으로의 GalNButN3 전달에 기인한 하나의 주요 생성물(49772 Da, 전체 중쇄의 50%)의 형성을 나타내었다.
SEQUENCE LISTING <110> SynAffix B.V. <120> Process for the modification of a glycoprotein under the action of a beta-(1,4)-N-acetylgalactosaminyltransferase or a mutant thereof <130> P6052334PCT <150> EP14179713.4 <151> 2014-08-04 <160> 89 <170> PatentIn version 3.3 <210> 1 <211> 402 <212> PRT <213> Artificial <220> <223> Bos Taurus GalT Y289L mutant <400> 1 Met Lys Phe Arg Glu Pro Leu Leu Gly Gly Ser Ala Ala Met Pro Gly 1 5 10 15 Ala Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Ala Leu 20 25 30 His Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Arg 35 40 45 Arg Leu Pro Gln Leu Val Gly Val His Pro Pro Leu Gln Gly Ser Ser 50 55 60 His Gly Ala Ala Ala Ile Gly Gln Pro Ser Gly Glu Leu Arg Leu Arg 65 70 75 80 Gly Val Ala Pro Pro Pro Pro Leu Gln Asn Ser Ser Lys Pro Arg Ser 85 90 95 Arg Ala Pro Ser Asn Leu Asp Ala Tyr Ser His Pro Gly Pro Gly Pro 100 105 110 Gly Pro Gly Ser Asn Leu Thr Ser Ala Pro Val Pro Ser Thr Thr Thr 115 120 125 Arg Ser Leu Thr Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro 130 135 140 Met Leu Ile Glu Phe Asn Ile Pro Val Asp Leu Lys Leu Ile Glu Gln 145 150 155 160 Gln Asn Pro Lys Val Lys Leu Gly Gly Arg Tyr Thr Pro Met Asp Cys 165 170 175 Ile Ser Pro His Lys Val Ala Ile Ile Ile Leu Phe Arg Asn Arg Gln 180 185 190 Glu His Leu Lys Tyr Trp Leu Tyr Tyr Leu His Pro Met Val Gln Arg 195 200 205 Gln Gln Leu Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Glu Ser 210 215 220 Met Phe Asn Arg Ala Lys Leu Leu Asn Val Gly Phe Lys Glu Ala Leu 225 230 235 240 Lys Asp Tyr Asp Tyr Asn Cys Phe Val Phe Ser Asp Val Asp Leu Ile 245 250 255 Pro Met Asn Asp His Asn Thr Tyr Arg Cys Phe Ser Gln Pro Arg His 260 265 270 Ile Ser Val Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln 275 280 285 Leu Phe Gly Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Ser Ile 290 295 300 Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp 305 310 315 320 Ile Tyr Asn Arg Leu Ala Phe Arg Gly Met Ser Val Ser Arg Pro Asn 325 330 335 Ala Val Ile Gly Lys Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys 340 345 350 Asn Glu Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu 355 360 365 Thr Met Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Met Val Leu Glu 370 375 380 Val Gln Arg Tyr Pro Leu Tyr Thr Lys Ile Thr Val Asp Ile Gly Thr 385 390 395 400 Pro Ser <210> 2 <211> 383 <212> PRT <213> Caenorhabditis elegans <400> 2 Met Ala Phe Arg His Leu Ala Val Ala Arg Leu Lys Ser Leu Leu Val 1 5 10 15 Leu Cys Ala Val Leu Leu Leu Val His Ala Met Ile Tyr Lys Ile Pro 20 25 30 Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu Ile Ala Asp 35 40 45 Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser Thr Ser Asp 50 55 60 Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile Ser Glu Val 65 70 75 80 Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu Phe Pro Asp 85 90 95 Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His Leu Val Gly 100 105 110 Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr Leu Glu Lys 115 120 125 Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro Lys Asp Cys 130 135 140 Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg Asp Arg Glu 145 150 155 160 Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu Leu Ala Lys 165 170 175 Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val Ala Asn Gln 180 185 190 Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp Val Ala Ser 195 200 205 Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val Asp Leu Leu 210 215 220 Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln Pro Arg His 225 230 235 240 Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro Tyr Ser Ala 245 250 255 Ile Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu Lys Lys Ile 260 265 270 Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu Asp Asp Asp 275 280 285 Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser Arg Tyr Pro 290 295 300 Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr Glu Ala Thr 305 310 315 320 Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln Thr Lys Arg 325 330 335 Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys Leu Val Asn 340 345 350 Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp Leu Leu Glu 355 360 365 Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr Cys Phe 370 375 380 <210> 3 <211> 383 <212> PRT <213> Ascaris suum <400> 3 Met Asn Ser Lys Leu Lys Leu Val Ile Val Leu Thr Leu Cys Val Ala 1 5 10 15 Ile Ile His Phe Leu Leu Ser Asp Cys Pro Ile Ser Pro Asp Tyr Ser 20 25 30 Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr Leu Thr Thr 35 40 45 Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu Ala Val Ser 50 55 60 Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser Ser Ile Leu 65 70 75 80 His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met Arg Ala Gln 85 90 95 Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala Leu Val Gly 100 105 110 Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu Leu Glu Arg 115 120 125 Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro Thr Ala Cys 130 135 140 Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg Asp Arg Glu 145 150 155 160 Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu Leu Thr Lys 165 170 175 Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr Ala Asn Glu 180 185 190 Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala Glu Ala Ile 195 200 205 Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val Asp Leu Leu 210 215 220 Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu Pro Arg His 225 230 235 240 Met Ser Val Ala Val Asp Lys Phe Asn Tyr Lys Leu Pro Tyr Gly Ser 245 250 255 Ile Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe Glu Gly Ile 260 265 270 Asn Gly Phe Ser Asn Asp Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp 275 280 285 Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser Arg Tyr Pro 290 295 300 Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser Glu Lys Lys 305 310 315 320 Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala Thr Lys Ser 325 330 335 Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp Leu Ile Ser 340 345 350 Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp Leu Leu Glu 355 360 365 Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro Thr Cys 370 375 380 <210> 4 <211> 421 <212> PRT <213> Trichoplusia ni <400> 4 Met Gly Gly Arg Ala Thr Arg Ala Leu Arg Leu Leu Leu Leu Leu Val 1 5 10 15 Leu Ala Leu Ala Ala Val Glu Tyr Leu Phe Gly Ser Ile Leu Asp Ala 20 25 30 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 35 40 45 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 50 55 60 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 65 70 75 80 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 85 90 95 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 100 105 110 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 115 120 125 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 130 135 140 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 145 150 155 160 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 165 170 175 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 180 185 190 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 195 200 205 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 210 215 220 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 225 230 235 240 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 245 250 255 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 260 265 270 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 275 280 285 Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe 290 295 300 Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu 305 310 315 320 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp 325 330 335 Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 340 345 350 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 355 360 365 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 370 375 380 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 385 390 395 400 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 405 410 415 Ile Asp Glu Arg Ser 420 <210> 5 <211> 403 <212> PRT <213> Drosophila melanogaster <400> 5 Met Tyr Leu Phe Thr Lys Ala Asn Leu Ile Arg Phe Leu Ala Gly Ala 1 5 10 15 Ile Cys Leu Leu Leu Val Leu Asn Phe Val Gly Phe Arg Ser Asp Gly 20 25 30 Gly Ser Ala Thr Ser Leu Ser Lys Leu Ser Ile Arg Arg Val His Lys 35 40 45 Tyr Ala His Ile Tyr Gly Asn Ala Ser Ser Asp Gly Ala Gly Gly Ser 50 55 60 Glu Ala Ser Arg Leu Pro Ala Ser Pro Leu Ala Leu Ser Lys Asp Arg 65 70 75 80 Glu Arg Asp Gln Glu Leu Asn Gly Gly Pro Asn Ser Thr Ile Arg Thr 85 90 95 Val Ile Ala Thr Ala Asn Phe Thr Ser Ile Pro Gln Asp Leu Thr Arg 100 105 110 Phe Leu Leu Gly Thr Lys Lys Phe Leu Pro Pro Arg Gln Lys Ser Thr 115 120 125 Ser Ala Leu Leu Ala Asn Cys Thr Asp Pro Asp Pro Arg Asp Gly Gly 130 135 140 Pro Ile Thr Pro Asn Thr Thr Leu Glu Ser Leu Asp Val Ile Glu Ala 145 150 155 160 Glu Leu Gly Pro Leu Leu Arg Pro Gly Gly Ala Phe Glu Pro Glu Asn 165 170 175 Cys Asn Ala Gln His His Val Ala Ile Val Val Pro Phe Arg Asp Arg 180 185 190 Tyr Ala His Leu Leu Leu Phe Leu Arg Asn Ile His Pro Phe Leu Met 195 200 205 Lys Gln Arg Ile Ala Tyr Arg Ile Phe Ile Val Glu Gln Thr Asn Gly 210 215 220 Lys Pro Phe Asn Arg Ala Ala Met Met Asn Ile Gly Tyr Leu Glu Ala 225 230 235 240 Leu Lys Leu Tyr Gln Trp Asp Cys Phe Ile Phe His Asp Val Asp Leu 245 250 255 Leu Pro Leu Asp Asp Arg Asn Leu Tyr Asn Cys Pro Arg Gln Pro Arg 260 265 270 His Met Ser Val Ala Ile Asp Thr Leu Asn Phe Arg Leu Pro Tyr Arg 275 280 285 Ser Ile Phe Gly Gly Val Ser Ala Met Thr Arg Glu His Phe Gln Ala 290 295 300 Val Asn Gly Phe Ser Asn Ser Phe Phe Gly Trp Gly Gly Glu Asp Asp 305 310 315 320 Asp Met Ser Asn Arg Leu Lys His Ala Asn Leu Phe Ile Ser Arg Tyr 325 330 335 Pro Val Asn Ile Ala Arg Tyr Lys Met Leu Lys His Gln Lys Glu Lys 340 345 350 Ala Asn Pro Lys Arg Tyr Glu Asn Leu Gln Asn Gly Met Ser Lys Ile 355 360 365 Glu Gln Asp Gly Ile Asn Ser Ile Lys Tyr Ser Ile Tyr Ser Ile Lys 370 375 380 Gln Phe Pro Thr Phe Thr Trp Tyr Leu Ala Glu Leu Lys Asn Ser Glu 385 390 395 400 Arg Lys Ser <210> 6 <211> 354 <212> PRT <213> Artificial <220> <223> CeGalNAcT(30-383) <400> 6 Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu 1 5 10 15 Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser 20 25 30 Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile 35 40 45 Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu 50 55 60 Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His 65 70 75 80 Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr 85 90 95 Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro 100 105 110 Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg 115 120 125 Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu 130 135 140 Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val 145 150 155 160 Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp 165 170 175 Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val 180 185 190 Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln 195 200 205 Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro 210 215 220 Tyr Ser Ala Ile Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu 225 230 235 240 Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu 245 250 255 Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser 260 265 270 Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr 275 280 285 Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln 290 295 300 Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys 305 310 315 320 Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp 325 330 335 Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr 340 345 350 Cys Phe <210> 7 <211> 354 <212> PRT <213> Artificial <220> <223> AsGalNAcT (30-383) <400> 7 Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr 1 5 10 15 Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu 20 25 30 Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser 35 40 45 Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met 50 55 60 Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala 65 70 75 80 Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu 85 90 95 Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro 100 105 110 Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg 115 120 125 Asp Arg Glu Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu 130 135 140 Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr 145 150 155 160 Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala 165 170 175 Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val 180 185 190 Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu 195 200 205 Pro Arg His Met Ser Val Ala Val Asp Lys Phe Asn Tyr Lys Leu Pro 210 215 220 Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe 225 230 235 240 Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp Gly Trp Gly Gly Glu 245 250 255 Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser 260 265 270 Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser 275 280 285 Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala 290 295 300 Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp 305 310 315 320 Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp 325 330 335 Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro 340 345 350 Thr Cys <210> 8 <211> 389 <212> PRT <213> Artificial <220> <223> TnGalNAcT(33-421) <400> 8 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 1 5 10 15 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 20 25 30 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 35 40 45 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 50 55 60 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 65 70 75 80 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 85 90 95 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 100 105 110 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 115 120 125 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 130 135 140 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 145 150 155 160 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 165 170 175 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 180 185 190 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 195 200 205 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 210 215 220 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 225 230 235 240 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 245 250 255 Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe 260 265 270 Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu 275 280 285 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp 290 295 300 Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 305 310 315 320 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 325 330 335 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 340 345 350 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 355 360 365 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 370 375 380 Ile Asp Glu Arg Ser 385 <210> 9 <211> 357 <212> PRT <213> Artificial <220> <223> DmGalNAcT (47-403) <400> 9 His Lys Tyr Ala His Ile Tyr Gly Asn Ala Ser Ser Asp Gly Ala Gly 1 5 10 15 Gly Ser Glu Ala Ser Arg Leu Pro Ala Ser Pro Leu Ala Leu Ser Lys 20 25 30 Asp Arg Glu Arg Asp Gln Glu Leu Asn Gly Gly Pro Asn Ser Thr Ile 35 40 45 Arg Thr Val Ile Ala Thr Ala Asn Phe Thr Ser Ile Pro Gln Asp Leu 50 55 60 Thr Arg Phe Leu Leu Gly Thr Lys Lys Phe Leu Pro Pro Arg Gln Lys 65 70 75 80 Ser Thr Ser Ala Leu Leu Ala Asn Cys Thr Asp Pro Asp Pro Arg Asp 85 90 95 Gly Gly Pro Ile Thr Pro Asn Thr Thr Leu Glu Ser Leu Asp Val Ile 100 105 110 Glu Ala Glu Leu Gly Pro Leu Leu Arg Pro Gly Gly Ala Phe Glu Pro 115 120 125 Glu Asn Cys Asn Ala Gln His His Val Ala Ile Val Val Pro Phe Arg 130 135 140 Asp Arg Tyr Ala His Leu Leu Leu Phe Leu Arg Asn Ile His Pro Phe 145 150 155 160 Leu Met Lys Gln Arg Ile Ala Tyr Arg Ile Phe Ile Val Glu Gln Thr 165 170 175 Asn Gly Lys Pro Phe Asn Arg Ala Ala Met Met Asn Ile Gly Tyr Leu 180 185 190 Glu Ala Leu Lys Leu Tyr Gln Trp Asp Cys Phe Ile Phe His Asp Val 195 200 205 Asp Leu Leu Pro Leu Asp Asp Arg Asn Leu Tyr Asn Cys Pro Arg Gln 210 215 220 Pro Arg His Met Ser Val Ala Ile Asp Thr Leu Asn Phe Arg Leu Pro 225 230 235 240 Tyr Arg Ser Ile Phe Gly Gly Val Ser Ala Met Thr Arg Glu His Phe 245 250 255 Gln Ala Val Asn Gly Phe Ser Asn Ser Phe Phe Gly Trp Gly Gly Glu 260 265 270 Asp Asp Asp Met Ser Asn Arg Leu Lys His Ala Asn Leu Phe Ile Ser 275 280 285 Arg Tyr Pro Val Asn Ile Ala Arg Tyr Lys Met Leu Lys His Gln Lys 290 295 300 Glu Lys Ala Asn Pro Lys Arg Tyr Glu Asn Leu Gln Asn Gly Met Ser 305 310 315 320 Lys Ile Glu Gln Asp Gly Ile Asn Ser Ile Lys Tyr Ser Ile Tyr Ser 325 330 335 Ile Lys Gln Phe Pro Thr Phe Thr Trp Tyr Leu Ala Glu Leu Lys Asn 340 345 350 Ser Glu Arg Lys Ser 355 <210> 10 <211> 354 <212> PRT <213> Artificial <220> <223> CeGalNacT(30-383; I257L) <400> 10 Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu 1 5 10 15 Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser 20 25 30 Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile 35 40 45 Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu 50 55 60 Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His 65 70 75 80 Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr 85 90 95 Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro 100 105 110 Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg 115 120 125 Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu 130 135 140 Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val 145 150 155 160 Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp 165 170 175 Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val 180 185 190 Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln 195 200 205 Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro 210 215 220 Tyr Ser Ala Leu Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu 225 230 235 240 Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu 245 250 255 Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser 260 265 270 Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr 275 280 285 Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln 290 295 300 Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys 305 310 315 320 Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp 325 330 335 Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr 340 345 350 Cys Phe <210> 11 <211> 354 <212> PRT <213> Artificial <220> <223> CeGalNAcT(30-383; I257M) <400> 11 Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu 1 5 10 15 Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser 20 25 30 Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile 35 40 45 Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu 50 55 60 Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His 65 70 75 80 Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr 85 90 95 Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro 100 105 110 Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg 115 120 125 Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu 130 135 140 Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val 145 150 155 160 Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp 165 170 175 Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val 180 185 190 Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln 195 200 205 Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro 210 215 220 Tyr Ser Ala Met Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu 225 230 235 240 Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu 245 250 255 Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser 260 265 270 Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr 275 280 285 Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln 290 295 300 Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys 305 310 315 320 Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp 325 330 335 Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr 340 345 350 Cys Phe <210> 12 <211> 354 <212> PRT <213> Artificial <220> <223> CeGalNacT(30-383; I257A) <400> 12 Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu 1 5 10 15 Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser 20 25 30 Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile 35 40 45 Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu 50 55 60 Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His 65 70 75 80 Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr 85 90 95 Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro 100 105 110 Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg 115 120 125 Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu 130 135 140 Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val 145 150 155 160 Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp 165 170 175 Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val 180 185 190 Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln 195 200 205 Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro 210 215 220 Tyr Ser Ala Ala Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu 225 230 235 240 Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu 245 250 255 Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser 260 265 270 Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr 275 280 285 Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln 290 295 300 Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys 305 310 315 320 Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp 325 330 335 Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr 340 345 350 Cys Phe <210> 13 <211> 354 <212> PRT <213> Artificial <220> <223> CeGalNacT(30-383; M312H) <400> 13 Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu 1 5 10 15 Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser 20 25 30 Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile 35 40 45 Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu 50 55 60 Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His 65 70 75 80 Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr 85 90 95 Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro 100 105 110 Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg 115 120 125 Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu 130 135 140 Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val 145 150 155 160 Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp 165 170 175 Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val 180 185 190 Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln 195 200 205 Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro 210 215 220 Tyr Ser Ala Ile Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu 225 230 235 240 Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu 245 250 255 Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser 260 265 270 Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys His Ile Lys His Ser Thr 275 280 285 Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln 290 295 300 Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys 305 310 315 320 Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp 325 330 335 Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr 340 345 350 Cys Phe <210> 14 <211> 360 <212> PRT <213> Artificial <220> <223> CeGalNAcT(30-383)-His <400> 14 Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu 1 5 10 15 Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser 20 25 30 Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile 35 40 45 Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu 50 55 60 Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His 65 70 75 80 Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr 85 90 95 Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro 100 105 110 Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg 115 120 125 Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu 130 135 140 Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val 145 150 155 160 Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp 165 170 175 Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val 180 185 190 Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln 195 200 205 Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro 210 215 220 Tyr Ser Ala Ile Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu 225 230 235 240 Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu 245 250 255 Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser 260 265 270 Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr 275 280 285 Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln 290 295 300 Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys 305 310 315 320 Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp 325 330 335 Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr 340 345 350 Cys Phe His His His His His His 355 360 <210> 15 <211> 383 <212> PRT <213> Caenorhabditis remanei <400> 15 Met Ala Leu Arg His Leu Ala Val Ala Lys Leu Lys Thr Phe Phe Val 1 5 10 15 Leu Cys Ala Ala Leu Leu Leu Val His Thr Met Ile Tyr Lys Ala Pro 20 25 30 Ser Leu Tyr Glu Asn Phe Ser Ile Gly Ser Ser Thr Leu Ile Ala Asp 35 40 45 Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser Thr Ser Tyr 50 55 60 Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile Ser Glu Val 65 70 75 80 Asn Gln Thr Ser Phe Leu Glu Asp Val Arg Pro Ile Leu Phe Thr Asp 85 90 95 Asn Gln Thr Lys Pro Phe Cys Asn Gln Thr Pro Pro His Leu Val Gly 100 105 110 Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Ala Thr Leu Glu Lys 115 120 125 Ile Tyr Pro Asp Val His Thr Gly Gly His Gly Ile Pro Asp Glu Cys 130 135 140 Ile Ala Arg His Arg Val Ala Val Ile Val Pro Tyr Arg Asp Arg Glu 145 150 155 160 Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu Leu Ala Lys 165 170 175 Gln Gln Leu Asp Tyr Ala Ile Ile Val Val Glu Gln Ile Val Asn Gln 180 185 190 Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp Val Ala Ser 195 200 205 Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val Asp Leu Leu 210 215 220 Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln Pro Arg His 225 230 235 240 Met Ser Val Ala Ile Asp Lys Phe Asp Tyr Lys Leu Pro Tyr Ser Thr 245 250 255 Ile Phe Gly Gly Ile Ser Ala Leu Thr Gln Glu His Val Lys Lys Ile 260 265 270 Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu Asp Asp Asp 275 280 285 Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser Arg Tyr Pro 290 295 300 Ala Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr Glu Ala Thr 305 310 315 320 Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln Thr Lys Arg 325 330 335 Arg Trp Thr Arg Asp Gly Leu Ser Ser Leu Lys Tyr Lys Leu Val Lys 340 345 350 Leu Asp Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp Leu Leu Glu 355 360 365 Lys Asp Cys Arg Arg Glu Leu Arg Lys Asp Phe Pro Thr Cys Phe 370 375 380 <210> 16 <211> 384 <212> PRT <213> Caenorhabditis briggsae <400> 16 Met Ala Phe Arg His Leu Ala Ser Ala Lys Leu Lys Thr Phe Phe Val 1 5 10 15 Leu Cys Ala Ala Leu Leu Leu Val His Ala Met Ile Tyr Lys Val Pro 20 25 30 Ser Leu Tyr Glu Asn Phe Ser Ile Gly Ser Ser Thr Leu Ile Ala Asp 35 40 45 Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser Thr Ser Asp 50 55 60 Asp Pro Phe Asp Val Trp Asn Ser Thr Phe Ser Pro Ile Ser Glu Val 65 70 75 80 Asn Gln Thr Ala Phe Met Glu Asp Ile Arg Pro Ile Leu Phe Gly Asp 85 90 95 Ala Asn Glu Thr Arg Pro His Cys Asn Gln Thr Pro Pro His Leu Val 100 105 110 Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Ala Thr Leu Glu 115 120 125 Lys Ile Tyr Pro Glu Thr His Pro Gly Gly His Gly Ile Pro Thr Glu 130 135 140 Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg Asp Arg 145 150 155 160 Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu Leu Ala 165 170 175 Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Val Ala Asn 180 185 190 Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp Val Ala 195 200 205 Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val Asp Leu 210 215 220 Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln Pro Arg 225 230 235 240 His Met Ser Val Ala Ile Asp Lys Phe His Tyr Lys Leu Pro Tyr Ser 245 250 255 Ala Ile Phe Gly Gly Ile Ser Ala Leu Thr Gln Glu His Val Lys Ala 260 265 270 Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu Asp Asp 275 280 285 Asp Leu Ala Thr Arg Thr Ser Gln Ala Gly Leu Lys Val Ser Arg Tyr 290 295 300 Pro Ala Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr Glu Ala 305 310 315 320 Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln Thr Lys 325 330 335 Arg Arg Trp Lys Thr Asp Gly Leu Ser Ser Leu Lys Tyr Lys Leu Val 340 345 350 Lys Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp Leu Leu 355 360 365 Glu Lys Glu Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr Cys Phe 370 375 380 <210> 17 <211> 464 <212> PRT <213> Wuchereria bancrofti <400> 17 Met Pro Ala Ala Gly Arg Phe Val Ile Ile Leu Leu Ile Phe Gly Ala 1 5 10 15 Ala Ala His Ile Phe Leu Gly Gly Gly Leu Ser Phe Ile Ser Asp Tyr 20 25 30 His Ile Trp Arg Pro Val Val Glu Ser Ser Arg Gln Glu Ile Val Leu 35 40 45 Val His Asn Ile Asp Asn Asn Ser Asp Gln Asn Ala Glu Lys Ile Ile 50 55 60 Ser Asn Asn Glu Thr Lys Phe His Leu Thr Ser Ala Thr Pro Ile Asp 65 70 75 80 Asn Leu Val Ser Ile His Ser Asn Phe Tyr Glu Leu Phe Ile Asn Gly 85 90 95 Leu Arg Phe Gly Lys Leu Thr Thr Val Tyr Pro Ile Ile Asn Gln Ser 100 105 110 Ile Asn Asn Gly Ser Thr Thr Asp Lys Ser Thr Glu Thr Tyr Ala Glu 115 120 125 Ser Val Tyr Phe Leu Lys Thr Asp Gly Asn Ile His Ser Asn Thr Leu 130 135 140 Leu Ser Thr Ile Thr Asp Ala Gln Ser Thr Arg Gln Leu Phe Gly Asn 145 150 155 160 Glu Thr Leu Ser Ala Cys Asn Val Ile Pro Ser Phe Gln Met Met His 165 170 175 Gln Asn Leu Ser Leu Val Asn Cys Pro Val Thr Pro Pro Gly Leu Val 180 185 190 Gly Pro Ile Lys Val Trp Tyr Asp Glu Pro Thr Phe Glu Glu Ile Glu 195 200 205 Arg Leu Asn Pro Asn Leu Glu Ala Gly Gly His Gly Lys Pro Glu Asn 210 215 220 Cys Leu Ser Arg His Arg Val Ala Val Ile Val Pro Tyr Arg Asp Arg 225 230 235 240 Glu Ala His Leu Arg Ile Leu Leu His Asn Leu His Ser Leu Leu Thr 245 250 255 Lys Gln Gln Leu Asp Tyr Gly Ile Phe Val Ile Glu Gln His Glu Asn 260 265 270 Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Val Glu Ala 275 280 285 Leu Lys Leu Tyr Asp Trp Gln Cys Phe Val Phe His Asp Val Asp Leu 290 295 300 Leu Ala Glu Asp Asp Arg Asn Ile Tyr Ser Cys Pro Asp Gln Pro Arg 305 310 315 320 His Met Ser Val Ala Val Asn Lys Phe Lys Tyr Lys Leu Pro Tyr Gly 325 330 335 Ser Ile Phe Gly Gly Val Ser Ala Ile Arg Thr Glu Gln Phe Ala Thr 340 345 350 Leu Asn Gly Phe Ser Asn Ser Tyr Trp Gly Trp Gly Gly Glu Asp Asp 355 360 365 Asp Leu Ser Met Arg Val Thr Ser Ala Gly Tyr Lys Ile Met Arg Tyr 370 375 380 Pro Ser Glu Ile Ala Arg Tyr Gln Met Val Gln His Lys Ser Glu Met 385 390 395 400 Lys Asn Pro Ile Asn Arg Cys Arg Tyr Asp Leu Leu Ala Lys Thr Lys 405 410 415 Val Arg Gln Gln Thr Asp Gly Ile Ser Ser Leu Lys Tyr Glu Cys Tyr 420 425 430 Asp Leu Gln Phe Phe Thr Leu Phe Thr His Ile Lys Val Lys Leu Phe 435 440 445 Glu Gln Glu Ser Lys Ala Gln Leu Arg Glu Glu Gly Phe Lys Arg Cys 450 455 460 <210> 18 <211> 291 <212> PRT <213> Loa loa <400> 18 Met Glu Arg Gln Asn Leu Ser Leu Val Asp Cys Pro Ile Ile Pro Pro 1 5 10 15 Gly Leu Val Gly Pro Ile Lys Val Trp Tyr Asp Glu Pro Thr Phe Glu 20 25 30 Glu Ile Glu Arg Leu Asn Pro Tyr Leu Glu Leu Gly Gly His Gly Lys 35 40 45 Pro Gly Ser Cys Leu Ser Arg His Arg Val Ala Ile Ile Val Pro Tyr 50 55 60 Arg Asp Arg Glu Ala His Leu Arg Ile Leu Leu His Asn Leu His Ser 65 70 75 80 Leu Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Ile Glu Gln 85 90 95 His Glu Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr 100 105 110 Thr Glu Ala Met Lys Leu Tyr Asp Trp Gln Cys Phe Ile Phe His Asp 115 120 125 Val Asp Leu Leu Ala Glu Asp Asp Arg Asn Ile Tyr Ser Cys Pro Asp 130 135 140 Gln Pro Arg His Met Ser Val Ala Ile Asn Lys Phe Lys Tyr Arg Leu 145 150 155 160 Pro Tyr Gly Ser Ile Phe Gly Gly Val Ser Ala Ile Arg Thr Glu Gln 165 170 175 Phe Leu Lys Met Asn Gly Phe Ser Asn Ser Tyr Trp Gly Trp Gly Gly 180 185 190 Glu Asp Asp Asp Leu Ser Ile Arg Val Thr Ser Leu Gly Tyr Lys Ile 195 200 205 Met Arg Tyr Pro Leu Glu Ile Ala Arg Tyr Gln Met Val Lys His Glu 210 215 220 Ser Glu Thr Lys Asn Pro Ile Asn Arg Cys Arg Tyr Asp Leu Leu Ala 225 230 235 240 Lys Thr Lys Val Arg Gln Gln Met Asp Gly Ile Ser Ser Leu Lys Tyr 245 250 255 Glu Cys Tyr Asp Leu His Phe Leu Pro Leu Phe Thr His Ile Lys Val 260 265 270 Lys Leu Phe Glu Gln Glu Ser Lys Ala Gln Leu Arg Glu Glu Gly Phe 275 280 285 Lys Lys Cys 290 <210> 19 <211> 296 <212> PRT <213> Cerapachys biroi <400> 19 Met Pro Ile Arg Asn Leu Ala Gly Asn Gly Gly Thr Ala Arg Glu Leu 1 5 10 15 Pro Val Ala Asn Thr Thr Ser Asn Ala Thr Ile Pro Arg Cys Pro Leu 20 25 30 Ile Pro Pro Asn Leu Val Gly Pro Val Ala Val Ser Lys Ser Pro Pro 35 40 45 Pro Leu Ser Glu Met Glu Arg Ser Phe Val Glu Val Lys Ala Gly Gly 50 55 60 Lys Gly Arg Pro Ala Asp Cys Val Ala Arg His Arg Val Ala Ile Ile 65 70 75 80 Ile Pro Phe Arg Asp Arg Pro Gln His Leu Gln Thr Leu Leu Tyr Asn 85 90 95 Leu His Pro Ile Leu Leu Arg Gln Gln Ile Asp Tyr Gln Ile Phe Val 100 105 110 Ile Glu Gln Glu Gly Thr Gly Thr Phe Asn Arg Ala Met Leu Met Asn 115 120 125 Val Gly Tyr Val Glu Ala Leu Lys Glu Arg Ile Phe Asp Cys Phe Ile 130 135 140 Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr 145 150 155 160 Cys Pro Glu Gln Pro Arg His Met Ser Val Ala Val Asp Lys Phe Lys 165 170 175 Tyr Arg Leu Pro Tyr Ala Asp Leu Phe Gly Gly Val Ser Ala Met Ser 180 185 190 Arg Glu His Phe Gln Leu Val Asn Gly Phe Ser Asn Val Phe Trp Gly 195 200 205 Trp Gly Gly Glu Asp Asp Asp Met Ala Asn Arg Ile Lys Ala His Gly 210 215 220 Leu His Ile Ser Arg Tyr Pro Ala Asn Val Ala Arg Tyr Lys Met Leu 225 230 235 240 Thr His Lys Lys Glu Lys Ala Asn Pro Lys Arg Tyr Glu Phe Leu Lys 245 250 255 Thr Gly Lys Lys Arg Phe Ser Thr Asp Gly Leu Ala Asn Leu Gln Tyr 260 265 270 Glu Leu Cys Asp Lys Arg Lys Pro Lys Leu Tyr Thr Trp Leu Leu Val 275 280 285 Arg Leu Thr Pro Pro Gln Pro Ser 290 295 <210> 20 <211> 422 <212> PRT <213> Zootermopsis nevadensis <400> 20 Met Arg Cys Arg Cys Leu Ser Ala Trp Ser Arg Ile Thr Gln His Val 1 5 10 15 Pro Arg Gln Pro Cys Leu His Ile His Ser His Leu Cys Lys Val Val 20 25 30 Ile Val Leu Ala Val Leu Ile Ala Leu Gln Phe Leu Leu Thr Thr Ile 35 40 45 Phe Glu Ala Arg Gln Ile Glu Pro Leu Phe Thr Val Asn Phe Thr Tyr 50 55 60 Ser Gly Arg Arg Ser Arg Trp Gly Leu Ile Ser His Ser Arg Gly Leu 65 70 75 80 Leu Ser Pro Ser His Asn Ser Ser Phe Asn Gly Ser Met Arg Val Ser 85 90 95 Val Glu Arg Thr Leu Ser Pro Val Glu Asn Ile Ser Gly Glu Thr Lys 100 105 110 Asn Leu Ser Phe Leu His Thr His Glu Asn Ala Val Arg Asn Ala Ser 115 120 125 Ser Leu Val Leu Asn Ile Ser Leu Pro Ser Asp Leu Asn Pro Thr Thr 130 135 140 Ser Pro Ser Leu Thr Val Pro Phe Thr Gly Lys Ser Leu Cys Pro Pro 145 150 155 160 Ile Pro Pro Asn Leu Asn Gly Pro Ile Lys Val Leu Lys Asp Ser Pro 165 170 175 Ser Leu Glu Glu Leu Glu Lys Met Phe Pro Leu Leu Glu Pro Gly Gly 180 185 190 His Tyr His Pro Glu Glu Cys Gln Ala Arg Asp Arg Val Ala Ile Ile 195 200 205 Val Pro Tyr Arg Asp Arg Ala Glu His Leu Ser Thr Phe Leu Leu Asn 210 215 220 Leu His Pro Leu Leu Gln Arg Gln Gln Leu Asp Tyr Gly Met Phe Val 225 230 235 240 Ile Glu Gln Gly Gly Asp Gly Pro Phe Asn Arg Ala Met Leu Met Asn 245 250 255 Val Gly Phe Val Glu Ala Leu Lys Leu Tyr Ser Tyr Asp Cys Phe Ile 260 265 270 Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr 275 280 285 Cys Pro Glu Gln Pro Arg His Met Ser Val Ala Val Asp Val Leu Lys 290 295 300 Tyr Lys Leu Pro Tyr Gln Ala Ile Phe Gly Gly Val Ser Ala Met Thr 305 310 315 320 Lys Thr Gln Phe Gln Lys Val Asn Gly Phe Ser Asn Leu Phe Trp Gly 325 330 335 Trp Gly Gly Glu Asp Asp Asp Met Ser Asn Arg Val Arg His His Gly 340 345 350 Tyr His Ile Ser Arg Tyr Pro Ala Asn Ile Ala Arg Tyr Lys Met Leu 355 360 365 Ala His Arg Lys Gln His Ala Asn Pro Lys Arg Tyr Glu Phe Leu Asn 370 375 380 Thr Gly Arg Lys Arg Phe Lys Thr Asp Gly Leu Ser Asn Leu Gln Tyr 385 390 395 400 Asp Arg Lys Glu Leu Asn Leu Gly Lys Leu Tyr Thr Arg Val Leu Val 405 410 415 Glu Leu Ala Thr Pro Ser 420 <210> 21 <211> 295 <212> PRT <213> Camponotus floridanus <400> 21 Met Pro Thr Arg Asn Leu Val Gly Gly Gly Thr Ala Arg Glu Leu Pro 1 5 10 15 Val Ala Asn Ala Thr Asn Asn Thr Thr Met Pro Arg Cys Pro Leu Ile 20 25 30 Pro Pro Asn Leu Val Gly Pro Met Val Val Ser Lys Ser Pro Pro Pro 35 40 45 Leu Ser Glu Met Glu Arg Ser Phe Val Glu Val Asn Ala Gly Gly Arg 50 55 60 Gly Arg Pro Ala Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Ile 65 70 75 80 Pro Phe Arg Asp Arg Pro Gln His Leu Gln Thr Leu Leu Tyr Asn Leu 85 90 95 His Pro Ile Leu Leu Arg Gln Gln Ile Glu Tyr Gln Ile Phe Val Ile 100 105 110 Glu Gln Glu Gly Thr Gly Ala Phe Asn Arg Ala Met Leu Met Asn Val 115 120 125 Gly Tyr Val Glu Ala Leu Lys Glu Arg Thr Phe Asp Cys Phe Ile Phe 130 135 140 His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys 145 150 155 160 Pro Glu Gln Pro Arg His Met Ser Val Ala Val Asp Lys Phe Lys Tyr 165 170 175 Arg Leu Pro Tyr Thr Asp Leu Phe Gly Gly Val Ser Ala Met Ser Arg 180 185 190 Glu His Phe Gln Leu Val Asn Gly Phe Ser Asn Val Phe Trp Gly Trp 195 200 205 Gly Gly Glu Asp Asp Asp Met Ala Asn Arg Ile Lys Ala His Gly Leu 210 215 220 His Ile Ser Arg Tyr Pro Ala Asn Val Ala Arg Tyr Lys Met Leu Thr 225 230 235 240 His Lys Lys Glu Lys Ala Asn Pro Lys Arg Tyr Glu Phe Leu Lys Thr 245 250 255 Gly Lys Lys Arg Phe Ser Thr Asp Gly Leu Ala Asn Leu Gln Tyr Glu 260 265 270 Leu Ser Asp Lys Arg Lys Pro Lys Leu Tyr Thr Trp Leu Leu Val Arg 275 280 285 Leu Thr Pro Pro Gln Pro Ser 290 295 <210> 22 <211> 310 <212> PRT <213> Crassostrea gigas <400> 22 Met Asp Arg Gly Cys Lys Pro Met Arg Val Cys Ser Ser Ser Pro Ser 1 5 10 15 Asp Leu Val Gly Ser Leu Ala Thr Tyr Lys Glu Ala Pro Ser Tyr Lys 20 25 30 Glu Met Ile Lys Ile Tyr Pro Leu Val Arg Pro Gly Gly Leu Tyr Thr 35 40 45 Pro Pro Asp Cys Ile Ala Arg Glu Arg Val Ala Ile Ile Ile Pro Phe 50 55 60 Arg Asp Arg Glu Glu His Leu Arg Ile Leu Leu His Asn Leu His Pro 65 70 75 80 Met Leu Gln Arg Gln Gln Leu Asp Tyr Gly Ile Tyr Val Val Glu Gln 85 90 95 Glu Asn Gly Thr Gln Phe Asn Arg Ala Met Leu Met Asn Ile Gly Tyr 100 105 110 Ala Glu Ser Ile Lys Leu Tyr Asn Tyr Thr Cys Phe Ile Phe His Asp 115 120 125 Val Asp Leu Ile Pro Glu Asn Asp Arg Ile Met Tyr Asp Cys Arg Asp 130 135 140 Ser Pro Arg His Leu Ser Ser Ala Val Asp Lys Phe Lys Tyr Lys Leu 145 150 155 160 Pro Tyr Pro Gln Leu Phe Gly Gly Val Thr Ala Ile Lys Arg Ala His 165 170 175 Phe Glu Lys Val Asn Gly His Ser Asn Lys Phe Phe Gly Trp Gly Gly 180 185 190 Glu Asp Asp Asp Met Phe Arg Arg Leu Val Asn Asn Gly Phe Lys Ile 195 200 205 Ser Arg Tyr Gln Ala Ser Leu Ser Lys Tyr Lys Met Ile Lys His Leu 210 215 220 His Asp Ala Gly Asn Lys Ala Asn Lys Arg Arg His His Leu Ile Lys 225 230 235 240 Thr Gly Lys Gly Arg Tyr Arg Arg Asp Gly Ile Asn Asn Leu His Tyr 245 250 255 Lys Lys Leu Gly Ile Glu Tyr Gln Tyr Leu His Thr Arg Ile Leu Val 260 265 270 Ser Ile Asn Glu Thr Lys Val Met Thr Val Ser Leu Leu Tyr Met Tyr 275 280 285 Ser Ser Thr Thr Val Tyr Ile Ile Val Asn Ile Tyr Thr Ile Tyr Cys 290 295 300 Lys Ser Arg Asn Ile Arg 305 310 <210> 23 <211> 338 <212> PRT <213> Danaus plexippus <400> 23 Met Ala Lys Lys Leu Leu Thr Gln Gly Thr Glu Ser Val Thr Asn Tyr 1 5 10 15 Thr His Thr Thr Asn Ser Ser Asn Lys Asn Pro Ala Lys Glu Thr Phe 20 25 30 Asn Met Thr Lys Pro Asn Leu Ser Asp Asp Thr Ser Thr Pro Leu Leu 35 40 45 Ile Thr Lys Ile Met Glu Ser Ile Lys Asn Leu Val Thr Thr Glu Glu 50 55 60 Asp Phe Arg Asp Glu Pro Ser Leu Pro Leu Cys Asp Glu Met Pro Pro 65 70 75 80 Asp Leu Gly Pro Ile Ser Val Asn Lys Thr Glu Ile Glu Leu Asp Trp 85 90 95 Val Glu Lys Arg Tyr Pro Glu Val Arg Ser Gly Gly Ile Tyr Ser Ser 100 105 110 Ser Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg 115 120 125 Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro Phe 130 135 140 Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Tyr Ile Ile Glu Gln Glu 145 150 155 160 Gly Thr Ser Glu Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe Val 165 170 175 Glu Ser Gln Arg Gln Arg Ser Trp Gln Cys Phe Ile Phe His Asp Ile 180 185 190 Asp Leu Leu Pro Leu Asp Ser Arg Asn Met Tyr Ser Cys Pro Lys Gln 195 200 205 Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu Asn Phe Arg Leu Pro 210 215 220 Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu Glu Gln Phe 225 230 235 240 Thr Lys Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp Gly Gly Glu 245 250 255 Asp Asp Asp Met Phe Tyr Arg Leu Lys Lys Met Asn Tyr His Ile Ala 260 265 270 Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp His Lys Lys 275 280 285 Ser Ala Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln Thr Ser Lys 290 295 300 Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu Val Ile Lys 305 310 315 320 Val Thr Ala Asn His Leu Tyr Thr His Ile Leu Val Asn Ile Asp Glu 325 330 335 Arg Ser <210> 24 <211> 941 <212> PRT <213> Artificial <220> <223> HuGalNAcT (57-998) <400> 24 Arg Tyr Gly Ser Trp Arg Glu Leu Ala Lys Ala Leu Ala Ser Arg Asn 1 5 10 15 Ile Pro Ala Val Asp Pro His Leu Gln Phe Tyr His Pro Gln Arg Leu 20 25 30 Ser Leu Glu Asp His Asp Ile Asp Gln Gly Val Ser Ser Asn Ser Ser 35 40 45 Tyr Leu Lys Trp Asn Lys Pro Val Pro Trp Leu Ser Glu Phe Arg Gly 50 55 60 Arg Ala Asn Leu His Val Phe Glu Asp Trp Cys Gly Ser Ser Ile Gln 65 70 75 80 Gln Leu Arg Arg Asn Leu His Phe Pro Leu Tyr Pro His Ile Arg Thr 85 90 95 Thr Leu Arg Lys Leu Ala Val Ser Pro Lys Trp Thr Asn Tyr Gly Leu 100 105 110 Arg Ile Phe Gly Tyr Leu His Pro Phe Thr Asp Gly Lys Ile Gln Phe 115 120 125 Ala Ile Ala Ala Asp Asp Asn Ala Glu Phe Trp Leu Ser Leu Asp Asp 130 135 140 Gln Val Ser Gly Leu Gln Leu Leu Ala Ser Val Gly Lys Thr Gly Lys 145 150 155 160 Glu Trp Thr Ala Pro Gly Glu Phe Gly Lys Phe Arg Ser Gln Ile Ser 165 170 175 Lys Pro Val Ser Leu Ser Ala Ser His Arg Tyr Tyr Phe Glu Val Leu 180 185 190 His Lys Gln Asn Glu Glu Gly Thr Asp His Val Glu Val Ala Trp Arg 195 200 205 Arg Asn Asp Pro Gly Ala Lys Phe Thr Ile Ile Asp Ser Leu Ser Leu 210 215 220 Ser Leu Phe Thr Asn Glu Thr Phe Leu Gln Met Asp Glu Val Gly His 225 230 235 240 Ile Pro Gln Thr Ala Ala Ser His Val Asp Ser Ser Asn Ala Leu Pro 245 250 255 Arg Asp Glu Gln Pro Pro Ala Asp Met Leu Arg Pro Asp Pro Arg Asp 260 265 270 Thr Leu Tyr Arg Val Pro Leu Ile Pro Lys Ser His Leu Arg His Val 275 280 285 Leu Pro Asp Cys Pro Tyr Lys Pro Ser Tyr Leu Val Asp Gly Leu Pro 290 295 300 Leu Gln Arg Tyr Gln Gly Leu Arg Phe Val His Leu Ser Phe Val Tyr 305 310 315 320 Pro Asn Asp Tyr Thr Arg Leu Ser His Met Glu Thr His Asn Lys Cys 325 330 335 Phe Tyr Gln Glu Asn Ala Tyr Tyr Gln Asp Arg Phe Ser Phe Gln Glu 340 345 350 Tyr Ile Lys Ile Asp Gln Pro Glu Lys Gln Gly Leu Glu Gln Pro Gly 355 360 365 Phe Glu Glu Asn Leu Leu Glu Glu Ser Gln Tyr Gly Glu Val Ala Glu 370 375 380 Glu Thr Pro Ala Ser Asn Asn Gln Asn Ala Arg Met Leu Glu Gly Arg 385 390 395 400 Gln Thr Pro Ala Ser Thr Leu Glu Gln Asp Ala Thr Asp Tyr Arg Leu 405 410 415 Arg Ser Leu Arg Lys Leu Leu Ala Gln Pro Arg Glu Gly Leu Leu Ala 420 425 430 Pro Phe Ser Lys Arg Asn Ser Thr Ala Ser Phe Pro Gly Arg Thr Ser 435 440 445 His Ile Pro Val Gln Gln Pro Glu Lys Arg Lys Gln Lys Pro Ser Pro 450 455 460 Glu Pro Ser Gln Asp Ser Pro His Ser Asp Lys Trp Pro Pro Gly His 465 470 475 480 Pro Val Lys Asn Leu Pro Gln Met Arg Gly Pro Arg Pro Arg Pro Ala 485 490 495 Gly Asp Ser Pro Arg Lys Thr Gln Trp Leu Asn Gln Val Glu Ser Tyr 500 505 510 Ile Ala Glu Gln Arg Arg Gly Asp Arg Met Arg Pro Gln Ala Pro Gly 515 520 525 Arg Gly Trp His Gly Glu Glu Glu Val Val Ala Ala Ala Gly Gln Glu 530 535 540 Gly Gln Val Glu Gly Glu Glu Glu Gly Glu Glu Glu Glu Glu Glu Glu 545 550 555 560 Asp Met Ser Glu Val Phe Glu Tyr Val Pro Val Phe Asp Pro Val Val 565 570 575 Asn Trp Asp Gln Thr Phe Ser Ala Arg Asn Leu Asp Phe Gln Ala Leu 580 585 590 Arg Thr Asp Trp Ile Asp Leu Ser Cys Asn Thr Ser Gly Asn Leu Leu 595 600 605 Leu Pro Glu Gln Glu Ala Leu Glu Val Thr Arg Val Phe Leu Lys Lys 610 615 620 Leu Asn Gln Arg Ser Arg Gly Arg Tyr Gln Leu Gln Arg Ile Val Asn 625 630 635 640 Val Glu Lys Arg Gln Asp Gln Leu Arg Gly Gly Arg Tyr Leu Leu Glu 645 650 655 Leu Glu Leu Leu Glu Gln Gly Gln Arg Val Val Arg Leu Ser Glu Tyr 660 665 670 Val Ser Ala Arg Gly Trp Gln Gly Ile Asp Pro Ala Gly Gly Glu Glu 675 680 685 Val Glu Ala Arg Asn Leu Gln Gly Leu Val Trp Asp Pro His Asn Arg 690 695 700 Arg Arg Gln Val Leu Asn Thr Arg Ala Gln Glu Pro Lys Leu Cys Trp 705 710 715 720 Pro Gln Gly Phe Ser Trp Ser His Arg Ala Val Val His Phe Val Val 725 730 735 Pro Val Lys Asn Gln Ala Arg Trp Val Gln Gln Phe Ile Lys Asp Met 740 745 750 Glu Asn Leu Phe Gln Val Thr Gly Asp Pro His Phe Asn Ile Val Ile 755 760 765 Thr Asp Tyr Ser Ser Glu Asp Met Asp Val Glu Met Ala Leu Lys Arg 770 775 780 Ser Lys Leu Arg Ser Tyr Gln Tyr Val Lys Leu Ser Gly Asn Phe Glu 785 790 795 800 Arg Ser Ala Gly Leu Gln Ala Gly Ile Asp Leu Val Lys Asp Pro His 805 810 815 Ser Ile Ile Phe Leu Cys Asp Leu His Ile His Phe Pro Ala Gly Val 820 825 830 Ile Asp Ala Ile Arg Lys His Cys Val Glu Gly Lys Met Ala Phe Ala 835 840 845 Pro Met Val Met Arg Leu His Cys Gly Ala Thr Pro Gln Trp Pro Glu 850 855 860 Gly Tyr Trp Glu Val Asn Gly Phe Gly Leu Leu Gly Ile Tyr Lys Ser 865 870 875 880 Asp Leu Asp Arg Ile Gly Gly Met Asn Thr Lys Glu Phe Arg Asp Arg 885 890 895 Trp Gly Gly Glu Asp Trp Glu Leu Leu Asp Arg Ile Leu Gln Gly Leu 900 905 910 Asp Val Glu Arg Leu Ser Leu Arg Asn Phe Phe His His Phe His Ser 915 920 925 Lys Arg Gly Met Trp Ser Arg Arg Gln Met Lys Thr Leu 930 935 940 <210> 25 <211> 389 <212> PRT <213> Artificial <220> <223> TnGalNAcT(33-421; W336F) <400> 25 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 1 5 10 15 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 20 25 30 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 35 40 45 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 50 55 60 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 65 70 75 80 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 85 90 95 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 100 105 110 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 115 120 125 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 130 135 140 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 145 150 155 160 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 165 170 175 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 180 185 190 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 195 200 205 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 210 215 220 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 225 230 235 240 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 245 250 255 Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe 260 265 270 Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu 275 280 285 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Phe 290 295 300 Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 305 310 315 320 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 325 330 335 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 340 345 350 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 355 360 365 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 370 375 380 Ile Asp Glu Arg Ser 385 <210> 26 <211> 389 <212> PRT <213> Artificial <220> <223> TnGalNAcT(33-421; W336H) <400> 26 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 1 5 10 15 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 20 25 30 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 35 40 45 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 50 55 60 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 65 70 75 80 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 85 90 95 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 100 105 110 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 115 120 125 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 130 135 140 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 145 150 155 160 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 165 170 175 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 180 185 190 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 195 200 205 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 210 215 220 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 225 230 235 240 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 245 250 255 Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe 260 265 270 Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu 275 280 285 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His 290 295 300 Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 305 310 315 320 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 325 330 335 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 340 345 350 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 355 360 365 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 370 375 380 Ile Asp Glu Arg Ser 385 <210> 27 <211> 389 <212> PRT <213> Artificial <220> <223> TnGalNAcT(33-421; W336V) <400> 27 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 1 5 10 15 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 20 25 30 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 35 40 45 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 50 55 60 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 65 70 75 80 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 85 90 95 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 100 105 110 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 115 120 125 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 130 135 140 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 145 150 155 160 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 165 170 175 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 180 185 190 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 195 200 205 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 210 215 220 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 225 230 235 240 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 245 250 255 Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe 260 265 270 Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu 275 280 285 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Val 290 295 300 Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 305 310 315 320 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 325 330 335 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 340 345 350 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 355 360 365 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 370 375 380 Ile Asp Glu Arg Ser 385 <210> 28 <211> 389 <212> PRT <213> Artificial <220> <223> TnGalNAcT(33-421; E339A) <400> 28 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 1 5 10 15 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 20 25 30 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 35 40 45 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 50 55 60 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 65 70 75 80 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 85 90 95 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 100 105 110 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 115 120 125 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 130 135 140 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 145 150 155 160 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 165 170 175 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 180 185 190 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 195 200 205 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 210 215 220 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 225 230 235 240 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 245 250 255 Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe 260 265 270 Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu 275 280 285 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp 290 295 300 Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 305 310 315 320 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 325 330 335 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 340 345 350 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 355 360 365 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 370 375 380 Ile Asp Glu Arg Ser 385 <210> 29 <211> 389 <212> PRT <213> Artificial <220> <223> TnGalNAcT(33-421; L302A) <400> 29 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 1 5 10 15 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 20 25 30 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 35 40 45 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 50 55 60 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 65 70 75 80 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 85 90 95 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 100 105 110 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 115 120 125 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 130 135 140 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 145 150 155 160 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 165 170 175 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 180 185 190 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 195 200 205 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 210 215 220 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 225 230 235 240 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 245 250 255 Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Ala His Phe 260 265 270 Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu 275 280 285 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp 290 295 300 Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 305 310 315 320 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 325 330 335 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 340 345 350 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 355 360 365 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 370 375 380 Ile Asp Glu Arg Ser 385 <210> 30 <211> 389 <212> PRT <213> Artificial <220> <223> TnGalNAcT(33-421; E339D) <400> 30 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 1 5 10 15 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 20 25 30 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 35 40 45 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 50 55 60 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 65 70 75 80 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 85 90 95 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 100 105 110 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 115 120 125 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 130 135 140 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 145 150 155 160 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 165 170 175 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 180 185 190 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 195 200 205 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 210 215 220 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 225 230 235 240 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 245 250 255 Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe 260 265 270 Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu 275 280 285 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp 290 295 300 Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 305 310 315 320 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 325 330 335 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 340 345 350 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 355 360 365 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 370 375 380 Ile Asp Glu Arg Ser 385 <210> 31 <211> 389 <212> PRT <213> Artificial <220> <223> TnGalNAcT(33-421; E339S) <400> 31 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 1 5 10 15 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 20 25 30 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 35 40 45 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 50 55 60 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 65 70 75 80 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 85 90 95 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 100 105 110 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 115 120 125 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 130 135 140 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 145 150 155 160 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 165 170 175 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 180 185 190 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 195 200 205 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 210 215 220 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 225 230 235 240 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 245 250 255 Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe 260 265 270 Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu 275 280 285 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp 290 295 300 Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 305 310 315 320 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 325 330 335 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 340 345 350 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 355 360 365 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 370 375 380 Ile Asp Glu Arg Ser 385 <210> 32 <211> 389 <212> PRT <213> Artificial <220> <223> TnGalNAcT(33-421; W336H,E339A) <400> 32 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 1 5 10 15 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 20 25 30 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 35 40 45 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 50 55 60 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 65 70 75 80 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 85 90 95 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 100 105 110 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 115 120 125 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 130 135 140 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 145 150 155 160 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 165 170 175 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 180 185 190 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 195 200 205 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 210 215 220 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 225 230 235 240 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 245 250 255 Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe 260 265 270 Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu 275 280 285 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His 290 295 300 Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 305 310 315 320 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 325 330 335 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 340 345 350 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 355 360 365 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 370 375 380 Ile Asp Glu Arg Ser 385 <210> 33 <211> 389 <212> PRT <213> Artificial <220> <223> TnGalNAcT(33-421; W336H,E339D) <400> 33 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 1 5 10 15 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 20 25 30 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 35 40 45 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 50 55 60 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 65 70 75 80 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 85 90 95 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 100 105 110 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 115 120 125 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 130 135 140 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 145 150 155 160 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 165 170 175 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 180 185 190 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 195 200 205 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 210 215 220 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 225 230 235 240 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 245 250 255 Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe 260 265 270 Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu 275 280 285 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His 290 295 300 Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 305 310 315 320 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 325 330 335 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 340 345 350 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 355 360 365 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 370 375 380 Ile Asp Glu Arg Ser 385 <210> 34 <211> 389 <212> PRT <213> Artificial <220> <223> TnGalNAcT(33-421; W336H,E339S) <400> 34 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 1 5 10 15 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 20 25 30 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 35 40 45 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 50 55 60 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 65 70 75 80 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 85 90 95 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 100 105 110 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 115 120 125 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 130 135 140 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 145 150 155 160 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 165 170 175 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 180 185 190 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 195 200 205 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 210 215 220 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 225 230 235 240 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 245 250 255 Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe 260 265 270 Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu 275 280 285 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His 290 295 300 Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 305 310 315 320 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 325 330 335 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 340 345 350 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 355 360 365 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 370 375 380 Ile Asp Glu Arg Ser 385 <210> 35 <211> 389 <212> PRT <213> Artificial <220> <223> TnGalNAcT(33-421; L302G) <400> 35 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 1 5 10 15 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 20 25 30 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 35 40 45 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 50 55 60 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 65 70 75 80 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 85 90 95 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 100 105 110 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 115 120 125 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 130 135 140 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 145 150 155 160 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 165 170 175 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 180 185 190 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 195 200 205 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 210 215 220 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 225 230 235 240 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 245 250 255 Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Gly His Phe 260 265 270 Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu 275 280 285 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp 290 295 300 Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 305 310 315 320 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 325 330 335 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 340 345 350 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 355 360 365 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 370 375 380 Ile Asp Glu Arg Ser 385 <210> 36 <211> 389 <212> PRT <213> Artificial <220> <223> TnGalNAcT(33-421; I299M) <400> 36 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 1 5 10 15 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 20 25 30 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 35 40 45 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 50 55 60 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 65 70 75 80 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 85 90 95 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 100 105 110 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 115 120 125 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 130 135 140 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 145 150 155 160 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 165 170 175 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 180 185 190 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 195 200 205 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 210 215 220 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 225 230 235 240 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 245 250 255 Pro Arg Gln Pro Arg His Met Ser Ala Ser Met Asp Lys Leu His Phe 260 265 270 Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu 275 280 285 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp 290 295 300 Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 305 310 315 320 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 325 330 335 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 340 345 350 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 355 360 365 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 370 375 380 Ile Asp Glu Arg Ser 385 <210> 37 <211> 389 <212> PRT <213> Artificial <220> <223> TnGalNAcT(33-421; I299A) <400> 37 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 1 5 10 15 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 20 25 30 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 35 40 45 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 50 55 60 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 65 70 75 80 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 85 90 95 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 100 105 110 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 115 120 125 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 130 135 140 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 145 150 155 160 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 165 170 175 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 180 185 190 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 195 200 205 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 210 215 220 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 225 230 235 240 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 245 250 255 Pro Arg Gln Pro Arg His Met Ser Ala Ser Ala Asp Lys Leu His Phe 260 265 270 Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu 275 280 285 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp 290 295 300 Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 305 310 315 320 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 325 330 335 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 340 345 350 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 355 360 365 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 370 375 380 Ile Asp Glu Arg Ser 385 <210> 38 <211> 389 <212> PRT <213> Artificial <220> <223> TnGalNAcT(33-421; I299G) <400> 38 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 1 5 10 15 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 20 25 30 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 35 40 45 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 50 55 60 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 65 70 75 80 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 85 90 95 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 100 105 110 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 115 120 125 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 130 135 140 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 145 150 155 160 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 165 170 175 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 180 185 190 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 195 200 205 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 210 215 220 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 225 230 235 240 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 245 250 255 Pro Arg Gln Pro Arg His Met Ser Ala Ser Gly Asp Lys Leu His Phe 260 265 270 Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu 275 280 285 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp 290 295 300 Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 305 310 315 320 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 325 330 335 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 340 345 350 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 355 360 365 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 370 375 380 Ile Asp Glu Arg Ser 385 <210> 39 <211> 389 <212> PRT <213> Artificial <220> <223> TnGalNAcT(33-421; I311M) <400> 39 Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln 1 5 10 15 Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys 20 25 30 Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn 35 40 45 Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro 50 55 60 Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile 65 70 75 80 Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr 85 90 95 Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val 100 105 110 Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro 115 120 125 Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu 130 135 140 Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser 145 150 155 160 Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr 165 170 175 Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro 180 185 190 Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln 195 200 205 Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe 210 215 220 Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe 225 230 235 240 His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys 245 250 255 Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe 260 265 270 Lys Leu Pro Tyr Glu Asp Met Phe Gly Gly Val Ser Ala Met Thr Leu 275 280 285 Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp 290 295 300 Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr 305 310 315 320 His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp 325 330 335 His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln 340 345 350 Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu 355 360 365 Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn 370 375 380 Ile Asp Glu Arg Ser 385 <210> 40 <211> 354 <212> PRT <213> Artificial <220> <223> AsGalNAcT(30-383; F248A) <400> 40 Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr 1 5 10 15 Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu 20 25 30 Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser 35 40 45 Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met 50 55 60 Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala 65 70 75 80 Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu 85 90 95 Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro 100 105 110 Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg 115 120 125 Asp Arg Glu Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu 130 135 140 Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr 145 150 155 160 Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala 165 170 175 Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val 180 185 190 Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu 195 200 205 Pro Arg His Met Ser Val Ala Val Asp Lys Ala Asn Tyr Lys Leu Pro 210 215 220 Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe 225 230 235 240 Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp Gly Trp Gly Gly Glu 245 250 255 Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser 260 265 270 Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser 275 280 285 Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala 290 295 300 Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp 305 310 315 320 Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp 325 330 335 Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro 340 345 350 Thr Cys <210> 41 <211> 354 <212> PRT <213> Artificial <220> <223> AsGalNAcT(30-383; F248G) <400> 41 Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr 1 5 10 15 Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu 20 25 30 Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser 35 40 45 Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met 50 55 60 Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala 65 70 75 80 Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu 85 90 95 Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro 100 105 110 Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg 115 120 125 Asp Arg Glu Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu 130 135 140 Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr 145 150 155 160 Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala 165 170 175 Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val 180 185 190 Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu 195 200 205 Pro Arg His Met Ser Val Ala Val Asp Lys Gly Asn Tyr Lys Leu Pro 210 215 220 Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe 225 230 235 240 Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp Gly Trp Gly Gly Glu 245 250 255 Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser 260 265 270 Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser 275 280 285 Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala 290 295 300 Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp 305 310 315 320 Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp 325 330 335 Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro 340 345 350 Thr Cys <210> 42 <211> 354 <212> PRT <213> Artificial <220> <223> AsGalNAcT(30-383; V245M) <400> 42 Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr 1 5 10 15 Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu 20 25 30 Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser 35 40 45 Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met 50 55 60 Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala 65 70 75 80 Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu 85 90 95 Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro 100 105 110 Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg 115 120 125 Asp Arg Glu Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu 130 135 140 Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr 145 150 155 160 Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala 165 170 175 Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val 180 185 190 Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu 195 200 205 Pro Arg His Met Ser Val Ala Met Asp Lys Phe Asn Tyr Lys Leu Pro 210 215 220 Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe 225 230 235 240 Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp Gly Trp Gly Gly Glu 245 250 255 Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser 260 265 270 Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser 275 280 285 Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala 290 295 300 Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp 305 310 315 320 Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp 325 330 335 Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro 340 345 350 Thr Cys <210> 43 <211> 410 <212> PRT <213> Artificial <220> <223> His6-TnGalNAcT(33-421; L302A) <400> 43 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu 20 25 30 Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala 35 40 45 Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu 50 55 60 Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser 65 70 75 80 Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp 85 90 95 Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr 100 105 110 Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr 115 120 125 Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu 130 135 140 Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr 145 150 155 160 Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp 165 170 175 Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala 180 185 190 Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu 195 200 205 Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile 210 215 220 Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu 225 230 235 240 Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp 245 250 255 Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg 260 265 270 Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile 275 280 285 Asp Lys Ala His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val 290 295 300 Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn 305 310 315 320 Lys Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu 325 330 335 Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg 340 345 350 Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr 355 360 365 Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser 370 375 380 Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr 385 390 395 400 His Ile Leu Val Asn Ile Asp Glu Arg Ser 405 410 <210> 44 <211> 410 <212> PRT <213> Artificial <220> <223> His6-TnGalNAcT(33-421; L302G) <400> 44 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu 20 25 30 Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala 35 40 45 Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu 50 55 60 Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser 65 70 75 80 Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp 85 90 95 Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr 100 105 110 Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr 115 120 125 Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu 130 135 140 Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr 145 150 155 160 Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp 165 170 175 Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala 180 185 190 Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu 195 200 205 Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile 210 215 220 Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu 225 230 235 240 Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp 245 250 255 Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg 260 265 270 Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile 275 280 285 Asp Lys Gly His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val 290 295 300 Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn 305 310 315 320 Lys Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu 325 330 335 Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg 340 345 350 Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr 355 360 365 Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser 370 375 380 Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr 385 390 395 400 His Ile Leu Val Asn Ile Asp Glu Arg Ser 405 410 <210> 45 <211> 410 <212> PRT <213> Artificial <220> <223> His6-TnGalNAcT(33-421; I299M) <400> 45 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu 20 25 30 Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala 35 40 45 Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu 50 55 60 Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser 65 70 75 80 Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp 85 90 95 Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr 100 105 110 Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr 115 120 125 Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu 130 135 140 Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr 145 150 155 160 Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp 165 170 175 Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala 180 185 190 Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu 195 200 205 Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile 210 215 220 Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu 225 230 235 240 Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp 245 250 255 Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg 260 265 270 Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Met 275 280 285 Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val 290 295 300 Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn 305 310 315 320 Lys Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu 325 330 335 Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg 340 345 350 Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr 355 360 365 Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser 370 375 380 Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr 385 390 395 400 His Ile Leu Val Asn Ile Asp Glu Arg Ser 405 410 <210> 46 <211> 354 <212> PRT <213> Artificial <220> <223> AsGalNAcT(30-383; W282H) <400> 46 Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr 1 5 10 15 Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu 20 25 30 Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser 35 40 45 Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met 50 55 60 Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala 65 70 75 80 Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu 85 90 95 Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro 100 105 110 Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg 115 120 125 Asp Arg Glu Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu 130 135 140 Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr 145 150 155 160 Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala 165 170 175 Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val 180 185 190 Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu 195 200 205 Pro Arg His Met Ser Val Ala Val Asp Lys Phe Asn Tyr Lys Leu Pro 210 215 220 Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe 225 230 235 240 Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp Gly His Gly Gly Glu 245 250 255 Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser 260 265 270 Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser 275 280 285 Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala 290 295 300 Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp 305 310 315 320 Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp 325 330 335 Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro 340 345 350 Thr Cys <210> 47 <211> 354 <212> PRT <213> Artificial <220> <223> AsGalNAcT(30-383; E285D) <400> 47 Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr 1 5 10 15 Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu 20 25 30 Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser 35 40 45 Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met 50 55 60 Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala 65 70 75 80 Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu 85 90 95 Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro 100 105 110 Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg 115 120 125 Asp Arg Glu Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu 130 135 140 Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr 145 150 155 160 Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala 165 170 175 Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val 180 185 190 Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu 195 200 205 Pro Arg His Met Ser Val Ala Val Asp Lys Phe Asn Tyr Lys Leu Pro 210 215 220 Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe 225 230 235 240 Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp Gly Trp Gly Gly Asp 245 250 255 Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser 260 265 270 Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser 275 280 285 Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala 290 295 300 Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp 305 310 315 320 Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp 325 330 335 Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro 340 345 350 Thr Cys <210> 48 <211> 410 <212> PRT <213> Artificial <220> <223> His6-TnGalNAcT(33-421; I299A) <400> 48 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu 20 25 30 Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala 35 40 45 Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu 50 55 60 Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser 65 70 75 80 Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp 85 90 95 Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr 100 105 110 Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr 115 120 125 Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu 130 135 140 Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr 145 150 155 160 Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp 165 170 175 Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala 180 185 190 Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu 195 200 205 Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile 210 215 220 Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu 225 230 235 240 Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp 245 250 255 Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg 260 265 270 Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ala 275 280 285 Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val 290 295 300 Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn 305 310 315 320 Lys Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu 325 330 335 Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg 340 345 350 Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr 355 360 365 Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser 370 375 380 Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr 385 390 395 400 His Ile Leu Val Asn Ile Asp Glu Arg Ser 405 410 <210> 49 <211> 410 <212> PRT <213> Artificial <220> <223> His6-TnGalNAcT(33-421) <400> 49 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu 20 25 30 Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala 35 40 45 Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu 50 55 60 Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser 65 70 75 80 Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp 85 90 95 Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr 100 105 110 Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr 115 120 125 Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu 130 135 140 Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr 145 150 155 160 Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp 165 170 175 Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala 180 185 190 Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu 195 200 205 Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile 210 215 220 Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu 225 230 235 240 Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp 245 250 255 Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg 260 265 270 Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile 275 280 285 Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val 290 295 300 Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn 305 310 315 320 Lys Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu 325 330 335 Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg 340 345 350 Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr 355 360 365 Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser 370 375 380 Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr 385 390 395 400 His Ile Leu Val Asn Ile Asp Glu Arg Ser 405 410 <210> 50 <211> 410 <212> PRT <213> Artificial <220> <223> His6-TnGalNAcT(33-421; W336F) <400> 50 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu 20 25 30 Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala 35 40 45 Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu 50 55 60 Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser 65 70 75 80 Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp 85 90 95 Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr 100 105 110 Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr 115 120 125 Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu 130 135 140 Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr 145 150 155 160 Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp 165 170 175 Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala 180 185 190 Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu 195 200 205 Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile 210 215 220 Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu 225 230 235 240 Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp 245 250 255 Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg 260 265 270 Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile 275 280 285 Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val 290 295 300 Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn 305 310 315 320 Lys Tyr Trp Gly Phe Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu 325 330 335 Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg 340 345 350 Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr 355 360 365 Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser 370 375 380 Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr 385 390 395 400 His Ile Leu Val Asn Ile Asp Glu Arg Ser 405 410 <210> 51 <211> 410 <212> PRT <213> Artificial <220> <223> His6-TnGalNAcT(33-421; W336H) <400> 51 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu 20 25 30 Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala 35 40 45 Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu 50 55 60 Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser 65 70 75 80 Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp 85 90 95 Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr 100 105 110 Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr 115 120 125 Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu 130 135 140 Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr 145 150 155 160 Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp 165 170 175 Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala 180 185 190 Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu 195 200 205 Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile 210 215 220 Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu 225 230 235 240 Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp 245 250 255 Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg 260 265 270 Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile 275 280 285 Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val 290 295 300 Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn 305 310 315 320 Lys Tyr Trp Gly His Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu 325 330 335 Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg 340 345 350 Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr 355 360 365 Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser 370 375 380 Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr 385 390 395 400 His Ile Leu Val Asn Ile Asp Glu Arg Ser 405 410 <210> 52 <211> 410 <212> PRT <213> Artificial <220> <223> His6-TnGalNAcT(33-421; W336V) <400> 52 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu 20 25 30 Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala 35 40 45 Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu 50 55 60 Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser 65 70 75 80 Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp 85 90 95 Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr 100 105 110 Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr 115 120 125 Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu 130 135 140 Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr 145 150 155 160 Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp 165 170 175 Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala 180 185 190 Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu 195 200 205 Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile 210 215 220 Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu 225 230 235 240 Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp 245 250 255 Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg 260 265 270 Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile 275 280 285 Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val 290 295 300 Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn 305 310 315 320 Lys Tyr Trp Gly Val Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu 325 330 335 Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg 340 345 350 Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr 355 360 365 Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser 370 375 380 Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr 385 390 395 400 His Ile Leu Val Asn Ile Asp Glu Arg Ser 405 410 <210> 53 <211> 410 <212> PRT <213> Artificial <220> <223> His6-TnGalNAcT(33-421; E339A) <400> 53 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu 20 25 30 Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala 35 40 45 Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu 50 55 60 Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser 65 70 75 80 Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp 85 90 95 Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr 100 105 110 Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr 115 120 125 Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu 130 135 140 Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr 145 150 155 160 Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp 165 170 175 Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala 180 185 190 Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu 195 200 205 Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile 210 215 220 Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu 225 230 235 240 Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp 245 250 255 Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg 260 265 270 Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile 275 280 285 Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val 290 295 300 Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn 305 310 315 320 Lys Tyr Trp Gly Trp Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu 325 330 335 Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg 340 345 350 Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr 355 360 365 Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser 370 375 380 Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr 385 390 395 400 His Ile Leu Val Asn Ile Asp Glu Arg Ser 405 410 <210> 54 <211> 410 <212> PRT <213> Artificial <220> <223> His6-TnGalNAcT(33-421; I299G) <400> 54 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu 20 25 30 Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala 35 40 45 Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu 50 55 60 Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser 65 70 75 80 Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp 85 90 95 Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr 100 105 110 Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr 115 120 125 Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu 130 135 140 Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr 145 150 155 160 Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp 165 170 175 Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala 180 185 190 Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu 195 200 205 Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile 210 215 220 Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu 225 230 235 240 Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp 245 250 255 Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg 260 265 270 Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Gly 275 280 285 Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val 290 295 300 Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn 305 310 315 320 Lys Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu 325 330 335 Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg 340 345 350 Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr 355 360 365 Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser 370 375 380 Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr 385 390 395 400 His Ile Leu Val Asn Ile Asp Glu Arg Ser 405 410 <210> 55 <211> 410 <212> PRT <213> Artificial <220> <223> His6-TnGalNAcT(33-421; E339D) <400> 55 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu 20 25 30 Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala 35 40 45 Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu 50 55 60 Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser 65 70 75 80 Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp 85 90 95 Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr 100 105 110 Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr 115 120 125 Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu 130 135 140 Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr 145 150 155 160 Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp 165 170 175 Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala 180 185 190 Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu 195 200 205 Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile 210 215 220 Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu 225 230 235 240 Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp 245 250 255 Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg 260 265 270 Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile 275 280 285 Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val 290 295 300 Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn 305 310 315 320 Lys Tyr Trp Gly Trp Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu 325 330 335 Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg 340 345 350 Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr 355 360 365 Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser 370 375 380 Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr 385 390 395 400 His Ile Leu Val Asn Ile Asp Glu Arg Ser 405 410 <210> 56 <211> 410 <212> PRT <213> Artificial <220> <223> His6-TnGalNAcT(33-421; E339S) <400> 56 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu 20 25 30 Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala 35 40 45 Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu 50 55 60 Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser 65 70 75 80 Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp 85 90 95 Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr 100 105 110 Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr 115 120 125 Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu 130 135 140 Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr 145 150 155 160 Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp 165 170 175 Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala 180 185 190 Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu 195 200 205 Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile 210 215 220 Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu 225 230 235 240 Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp 245 250 255 Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg 260 265 270 Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile 275 280 285 Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val 290 295 300 Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn 305 310 315 320 Lys Tyr Trp Gly Trp Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu 325 330 335 Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg 340 345 350 Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr 355 360 365 Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser 370 375 380 Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr 385 390 395 400 His Ile Leu Val Asn Ile Asp Glu Arg Ser 405 410 <210> 57 <211> 410 <212> PRT <213> Artificial <220> <223> His6-TnGalNAcT(33-421; W336H,E339A) <400> 57 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu 20 25 30 Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala 35 40 45 Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu 50 55 60 Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser 65 70 75 80 Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp 85 90 95 Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr 100 105 110 Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr 115 120 125 Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu 130 135 140 Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr 145 150 155 160 Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp 165 170 175 Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala 180 185 190 Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu 195 200 205 Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile 210 215 220 Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu 225 230 235 240 Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp 245 250 255 Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg 260 265 270 Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile 275 280 285 Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val 290 295 300 Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn 305 310 315 320 Lys Tyr Trp Gly His Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu 325 330 335 Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg 340 345 350 Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr 355 360 365 Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser 370 375 380 Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr 385 390 395 400 His Ile Leu Val Asn Ile Asp Glu Arg Ser 405 410 <210> 58 <211> 410 <212> PRT <213> Artificial <220> <223> His6-TnGalNAcT(33-421; W336H,E339D) <400> 58 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu 20 25 30 Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala 35 40 45 Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu 50 55 60 Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser 65 70 75 80 Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp 85 90 95 Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr 100 105 110 Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr 115 120 125 Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu 130 135 140 Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr 145 150 155 160 Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp 165 170 175 Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala 180 185 190 Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu 195 200 205 Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile 210 215 220 Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu 225 230 235 240 Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp 245 250 255 Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg 260 265 270 Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile 275 280 285 Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val 290 295 300 Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn 305 310 315 320 Lys Tyr Trp Gly His Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu 325 330 335 Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg 340 345 350 Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr 355 360 365 Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser 370 375 380 Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr 385 390 395 400 His Ile Leu Val Asn Ile Asp Glu Arg Ser 405 410 <210> 59 <211> 410 <212> PRT <213> Artificial <220> <223> His6-TnGalNAcT(33-421; W336H,E339S) <400> 59 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu 20 25 30 Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala 35 40 45 Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu 50 55 60 Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser 65 70 75 80 Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp 85 90 95 Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr 100 105 110 Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr 115 120 125 Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu 130 135 140 Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr 145 150 155 160 Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp 165 170 175 Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala 180 185 190 Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu 195 200 205 Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile 210 215 220 Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu 225 230 235 240 Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp 245 250 255 Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg 260 265 270 Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile 275 280 285 Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val 290 295 300 Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn 305 310 315 320 Lys Tyr Trp Gly His Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu 325 330 335 Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg 340 345 350 Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr 355 360 365 Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser 370 375 380 Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr 385 390 395 400 His Ile Leu Val Asn Ile Asp Glu Arg Ser 405 410 <210> 60 <211> 410 <212> PRT <213> Artificial <220> <223> His6-TnGalNAcT(33-421; I311M) <400> 60 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu 20 25 30 Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala 35 40 45 Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu 50 55 60 Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser 65 70 75 80 Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp 85 90 95 Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr 100 105 110 Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr 115 120 125 Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu 130 135 140 Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr 145 150 155 160 Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp 165 170 175 Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala 180 185 190 Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu 195 200 205 Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile 210 215 220 Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu 225 230 235 240 Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp 245 250 255 Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg 260 265 270 Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile 275 280 285 Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Met Phe Gly Gly Val 290 295 300 Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn 305 310 315 320 Lys Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu 325 330 335 Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg 340 345 350 Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr 355 360 365 Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser 370 375 380 Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr 385 390 395 400 His Ile Leu Val Asn Ile Asp Glu Arg Ser 405 410 <210> 61 <211> 39 <212> DNA <213> Artificial <220> <223> primer sequence I299M, fwd <400> 61 gtcacatgtc agccagcatg gacaaactgc actttaaac 39 <210> 62 <211> 39 <212> DNA <213> Artificial <220> <223> primer sequence I299M, rev <400> 62 gtttaaagtg cagtttgtcc atgctggctg acatgtgac 39 <210> 63 <211> 41 <212> DNA <213> Artificial <220> <223> primer sequence I299A, fwd <400> 63 gcgtcacatg tcagccagcg ccgacaaact gcactttaaa c 41 <210> 64 <211> 41 <212> DNA <213> Artificial <220> <223> primer sequence I299A, rev <400> 64 gtttaaagtg cagtttgtcg gcgctggctg acatgtgacg c 41 <210> 65 <211> 41 <212> DNA <213> Artificial <220> <223> primer sequence I299G, fwd <400> 65 gcgtcacatg tcagccagcg gcgacaaact gcactttaaa c 41 <210> 66 <211> 41 <212> DNA <213> Artificial <220> <223> primer sequence I299G, rev <400> 66 gtttaaagtg cagtttgtcg ccgctggctg acatgtgacg c 41 <210> 67 <211> 35 <212> DNA <213> Artificial <220> <223> primer sequence L302A, fwd <400> 67 cagccagcat cgacaaagcg cactttaaac tgccg 35 <210> 68 <211> 35 <212> DNA <213> Artificial <220> <223> primer sequence L302A, rev <400> 68 cggcagttta aagtgcgctt tgtcgatgct ggctg 35 <210> 69 <211> 35 <212> DNA <213> Artificial <220> <223> primer sequence L302G, fwd <400> 69 cagccagcat cgacaaaggg cactttaaac tgccg 35 <210> 70 <211> 35 <212> DNA <213> Artificial <220> <223> primer sequence L302G, rev <400> 70 cggcagttta aagtgccctt tgtcgatgct ggctg 35 <210> 71 <211> 375 <212> PRT <213> Artificial <220> <223> His6-AsGalNAcT(30-383) <400> 71 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile 20 25 30 Ser Ala Pro Lys Thr Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr 35 40 45 Ser Thr Asn Asp Leu Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser 50 55 60 Met Leu Asp Asn Ser Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn 65 70 75 80 Asp Glu Leu Val Met Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro 85 90 95 Met Thr Pro Pro Ala Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala 100 105 110 Pro Ser Phe Ala Glu Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly 115 120 125 Gly His Gly Met Pro Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile 130 135 140 Val Val Pro Tyr Arg Asp Arg Glu Ser His Leu Arg Thr Phe Leu His 145 150 155 160 Asn Leu His Ser Leu Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe 165 170 175 Val Val Glu Gln Thr Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met 180 185 190 Asn Val Gly Tyr Ala Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe 195 200 205 Ile Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr 210 215 220 Ser Cys Pro Asp Glu Pro Arg His Met Ser Val Ala Val Asp Lys Phe 225 230 235 240 Asn Tyr Lys Leu Pro Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu 245 250 255 Thr Arg Glu Gln Phe Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp 260 265 270 Gly Trp Gly Gly Glu Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala 275 280 285 Gly Tyr Lys Ile Ser Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met 290 295 300 Ile Lys His Asn Ser Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr 305 310 315 320 Lys Leu Met Ser Ala Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser 325 330 335 Ser Leu Ser Tyr Asp Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr 340 345 350 His Ile Lys Val Asp Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg 355 360 365 Thr His Gly Phe Pro Thr Cys 370 375 <210> 72 <211> 375 <212> PRT <213> Artificial <220> <223> His6-AsGalNAcT(30-383; W282H) <400> 72 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile 20 25 30 Ser Ala Pro Lys Thr Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr 35 40 45 Ser Thr Asn Asp Leu Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser 50 55 60 Met Leu Asp Asn Ser Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn 65 70 75 80 Asp Glu Leu Val Met Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro 85 90 95 Met Thr Pro Pro Ala Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala 100 105 110 Pro Ser Phe Ala Glu Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly 115 120 125 Gly His Gly Met Pro Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile 130 135 140 Val Val Pro Tyr Arg Asp Arg Glu Ser His Leu Arg Thr Phe Leu His 145 150 155 160 Asn Leu His Ser Leu Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe 165 170 175 Val Val Glu Gln Thr Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met 180 185 190 Asn Val Gly Tyr Ala Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe 195 200 205 Ile Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr 210 215 220 Ser Cys Pro Asp Glu Pro Arg His Met Ser Val Ala Val Asp Lys Phe 225 230 235 240 Asn Tyr Lys Leu Pro Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu 245 250 255 Thr Arg Glu Gln Phe Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp 260 265 270 Gly His Gly Gly Glu Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala 275 280 285 Gly Tyr Lys Ile Ser Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met 290 295 300 Ile Lys His Asn Ser Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr 305 310 315 320 Lys Leu Met Ser Ala Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser 325 330 335 Ser Leu Ser Tyr Asp Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr 340 345 350 His Ile Lys Val Asp Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg 355 360 365 Thr His Gly Phe Pro Thr Cys 370 375 <210> 73 <211> 375 <212> PRT <213> Artificial <220> <223> His6-AsGalNAcT(30-383; E285D) <400> 73 Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro 1 5 10 15 Arg Gly Ser His Met Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile 20 25 30 Ser Ala Pro Lys Thr Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr 35 40 45 Ser Thr Asn Asp Leu Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser 50 55 60 Met Leu Asp Asn Ser Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn 65 70 75 80 Asp Glu Leu Val Met Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro 85 90 95 Met Thr Pro Pro Ala Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala 100 105 110 Pro Ser Phe Ala Glu Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly 115 120 125 Gly His Gly Met Pro Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile 130 135 140 Val Val Pro Tyr Arg Asp Arg Glu Ser His Leu Arg Thr Phe Leu His 145 150 155 160 Asn Leu His Ser Leu Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe 165 170 175 Val Val Glu Gln Thr Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met 180 185 190 Asn Val Gly Tyr Ala Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe 195 200 205 Ile Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr 210 215 220 Ser Cys Pro Asp Glu Pro Arg His Met Ser Val Ala Val Asp Lys Phe 225 230 235 240 Asn Tyr Lys Leu Pro Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu 245 250 255 Thr Arg Glu Gln Phe Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp 260 265 270 Gly Trp Gly Gly Asp Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala 275 280 285 Gly Tyr Lys Ile Ser Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met 290 295 300 Ile Lys His Asn Ser Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr 305 310 315 320 Lys Leu Met Ser Ala Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser 325 330 335 Ser Leu Ser Tyr Asp Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr 340 345 350 His Ile Lys Val Asp Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg 355 360 365 Thr His Gly Phe Pro Thr Cys 370 375 <210> 74 <211> 31 <212> DNA <213> Artificial <220> <223> primer sequence I311M, fwd <400> 74 cgaagatatg ttcggcggtg tctcagccat g 31 <210> 75 <211> 1173 <212> DNA <213> Artificial <220> <223> TnGalNAcT(33-421) <400> 75 atgtcaccgc tgcgtaccta cctgtatacc ccgctgtata atgccaccca accgaccctg 60 cgtaatgtgg aacgtctggc tgcgaactgg ccgaagaaaa ttccgagcaa ctatatcgaa 120 gattcagaag aatactcgat caaaaacatc agtctgtcca atcataccac gcgtgcgagt 180 gtggttcacc cgccgagctc tatcaccgaa acggcctcca aactggacaa aaatatgacc 240 attcaggatg gcgcgttcgc catgattagc ccgaccccgc tgctgatcac gaaactgatg 300 gacagcatta aatcttatgt caccacggaa gatggcgtga agaaagcgga agctgtcgtt 360 accctgccgc tgtgtgactc catgccgcca gatctgggtc cgattaccct gaacaaaacg 420 gaactggaac tggaatgggt tgagaaaaaa tttccggaag tcgaatgggg cggtcgctat 480 agtccgccga actgtaccgc acgtcatcgc gtggctatta tcgttccgta ccgtgaccgc 540 cagcaacacc tggcaatctt tctgaatcac atgcacccgt tcctgatgaa acagcaaatt 600 gaatacggca tttttatcgt ggaacaggaa ggtaataaag atttcaatcg tgcaaaactg 660 atgaacgttg gctttgtcga atctcagaaa ctggtggctg aaggttggca atgctttgtt 720 ttccatgaca tcgatctgct gccgctggat acccgcaatc tgtatagttg tccgcgccag 780 ccgcgtcaca tgtcagccag catcgacaaa ctgcacttta aactgccgta cgaagatatt 840 ttcggcggtg tctcagccat gaccctggaa caatttacgc gtgttaacgg cttctcgaat 900 aaatattggg gttggggcgg tgaagatgac gatatgagct accgcctgaa gaaaattaac 960 tatcatatcg cccgttacaa aatgagcatt gcgcgctatg ccatgctgga ccacaaaaaa 1020 tctaccccga atccgaaacg ttaccagctg ctgagtcaaa ccagcaaaac gtttcagaaa 1080 gatggtctgt ctacgctgga atatgaactg gtccaagttg tgcagtatca tctgtacacg 1140 catattctgg tgaacattga cgaacgctct tga 1173 <210> 76 <211> 1233 <212> DNA <213> Artificial <220> <223> His6-TnGalNAcT(33-421) <400> 76 atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60 atgtcaccgc tgcgtaccta cctgtatacc ccgctgtata atgccaccca accgaccctg 120 cgtaatgtgg aacgtctggc tgcgaactgg ccgaagaaaa ttccgagcaa ctatatcgaa 180 gattcagaag aatactcgat caaaaacatc agtctgtcca atcataccac gcgtgcgagt 240 gtggttcacc cgccgagctc tatcaccgaa acggcctcca aactggacaa aaatatgacc 300 attcaggatg gcgcgttcgc catgattagc ccgaccccgc tgctgatcac gaaactgatg 360 gacagcatta aatcttatgt caccacggaa gatggcgtga agaaagcgga agctgtcgtt 420 accctgccgc tgtgtgactc catgccgcca gatctgggtc cgattaccct gaacaaaacg 480 gaactggaac tggaatgggt tgagaaaaaa tttccggaag tcgaatgggg cggtcgctat 540 agtccgccga actgtaccgc acgtcatcgc gtggctatta tcgttccgta ccgtgaccgc 600 cagcaacacc tggcaatctt tctgaatcac atgcacccgt tcctgatgaa acagcaaatt 660 gaatacggca tttttatcgt ggaacaggaa ggtaataaag atttcaatcg tgcaaaactg 720 atgaacgttg gctttgtcga atctcagaaa ctggtggctg aaggttggca atgctttgtt 780 ttccatgaca tcgatctgct gccgctggat acccgcaatc tgtatagttg tccgcgccag 840 ccgcgtcaca tgtcagccag catcgacaaa ctgcacttta aactgccgta cgaagatatt 900 ttcggcggtg tctcagccat gaccctggaa caatttacgc gtgttaacgg cttctcgaat 960 aaatattggg gttggggcgg tgaagatgac gatatgagct accgcctgaa gaaaattaac 1020 tatcatatcg cccgttacaa aatgagcatt gcgcgctatg ccatgctgga ccacaaaaaa 1080 tctaccccga atccgaaacg ttaccagctg ctgagtcaaa ccagcaaaac gtttcagaaa 1140 gatggtctgt ctacgctgga atatgaactg gtccaagttg tgcagtatca tctgtacacg 1200 catattctgg tgaacattga cgaacgctct tga 1233 <210> 77 <211> 1068 <212> DNA <213> Artificial <220> <223> AsGalNAcT(30-383) <400> 77 atggattact cattctggag cccggcgttc atcatctctg ccccgaaaac cctgaccacc 60 ctgcaaccgt tctctcagtc tacctctacc aacgacctgg cagtctcagc tctggaatcg 120 gtggaattta gcatgctgga taatagctct attctgcatg cgtctgacaa ctggaccaat 180 gatgaactgg tgatgcgcgc ccagaacgaa aatctgcaac tgtgtccgat gacgccgccg 240 gcgctggttg gcccgatcaa agtttggatg gatgcgccga gctttgccga actggaacgt 300 ctgtatccgt tcctggaacc gggcggtcat ggtatgccga ccgcctgtcg tgcacgtcac 360 cgtgttgcca ttgtggttcc gtatcgcgac cgtgaatccc acctgcgcac cttcctgcat 420 aacctgcact cactgctgac gaaacagcaa ctggattacg caatctttgt cgtggaacag 480 accgcaaacg aaacgttcaa tcgtgctaaa ctgatgaatg ttggctatgc ggaagccatt 540 cgcctgtacg attggcgttg ctttatcttc catgacgtcg atctgctgcc ggaagatgac 600 cgcaacctgt attcttgtcc ggacgaaccg cgtcacatga gtgttgcagt cgataaattc 660 aactacaaac tgccgtacgg ttcgattttc ggcggtatca gcgctctgac ccgcgaacaa 720 tttgaaggca ttaacggttt cagcaatgat tactggggct ggggcggtga agatgacgat 780 ctgtcgaccc gtgtgacgct ggcgggttat aaaatcagcc gctacccggc agaaatcgct 840 cgttacaaaa tgatcaaaca taacagtgaa aagaaaaacc cggttaatcg ctgccgttac 900 aaactgatgt ctgccaccaa aagtcgctgg cgtaatgacg gcctgagttc cctgtcctat 960 gatctgattt cactgggtcg cctgccgctg tacacgcaca tcaaagttga cctgctggaa 1020 aaacaatctc gccgctatct gcgtacccac ggcttcccga cctgctga 1068 <210> 78 <211> 1128 <212> DNA <213> Artificial <220> <223> His6-AsGalNAcT(30-383) <400> 78 atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60 atggattact cattctggag cccggcgttc atcatctctg ccccgaaaac cctgaccacc 120 ctgcaaccgt tctctcagtc tacctctacc aacgacctgg cagtctcagc tctggaatcg 180 gtggaattta gcatgctgga taatagctct attctgcatg cgtctgacaa ctggaccaat 240 gatgaactgg tgatgcgcgc ccagaacgaa aatctgcaac tgtgtccgat gacgccgccg 300 gcgctggttg gcccgatcaa agtttggatg gatgcgccga gctttgccga actggaacgt 360 ctgtatccgt tcctggaacc gggcggtcat ggtatgccga ccgcctgtcg tgcacgtcac 420 cgtgttgcca ttgtggttcc gtatcgcgac cgtgaatccc acctgcgcac cttcctgcat 480 aacctgcact cactgctgac gaaacagcaa ctggattacg caatctttgt cgtggaacag 540 accgcaaacg aaacgttcaa tcgtgctaaa ctgatgaatg ttggctatgc ggaagccatt 600 cgcctgtacg attggcgttg ctttatcttc catgacgtcg atctgctgcc ggaagatgac 660 cgcaacctgt attcttgtcc ggacgaaccg cgtcacatga gtgttgcagt cgataaattc 720 aactacaaac tgccgtacgg ttcgattttc ggcggtatca gcgctctgac ccgcgaacaa 780 tttgaaggca ttaacggttt cagcaatgat tactggggct ggggcggtga agatgacgat 840 ctgtcgaccc gtgtgacgct ggcgggttat aaaatcagcc gctacccggc agaaatcgct 900 cgttacaaaa tgatcaaaca taacagtgaa aagaaaaacc cggttaatcg ctgccgttac 960 aaactgatgt ctgccaccaa aagtcgctgg cgtaatgacg gcctgagttc cctgtcctat 1020 gatctgattt cactgggtcg cctgccgctg tacacgcaca tcaaagttga cctgctggaa 1080 aaacaatctc gccgctatct gcgtacccac ggcttcccga cctgctga 1128 <210> 79 <211> 43 <212> DNA <213> Artificial <220> <223> primer sequence W336F, fwd <400> 79 ctcgaataaa tattggggtt ttggcggtga agatgacgat atg 43 <210> 80 <211> 43 <212> DNA <213> Artificial <220> <223> primer sequence W336F,rev <400> 80 catatcgtca tcttcaccgc caaaacccca atatttattc gag 43 <210> 81 <211> 36 <212> DNA <213> Artificial <220> <223> primer sequence W336H,fwd <400> 81 cgaataaata ttggggtcac ggcggtgaag atgacg 36 <210> 82 <211> 36 <212> DNA <213> Artificial <220> <223> primer sequence W336H,rev <400> 82 cgtcatcttc accgccgtga ccccaatatt tattcg 36 <210> 83 <211> 36 <212> DNA <213> Artificial <220> <223> primer sequence W336V,fwd <400> 83 cgaataaata ttggggtgtg ggcggtgaag atgacg 36 <210> 84 <211> 36 <212> DNA <213> Artificial <220> <223> primer sequence W336V, rev <400> 84 cgtcatcttc accgcccaca ccccaatatt tattcg 36 <210> 85 <211> 31 <212> DNA <213> Artificial <220> <223> primer sequence E339A,fwd <400> 85 gggttggggc ggtgcggatg acgatatgag c 31 <210> 86 <211> 31 <212> DNA <213> Artificial <220> <223> primer sequence E339A,rev <400> 86 gctcatatcg tcatccgcac cgccccaacc c 31 <210> 87 <211> 31 <212> DNA <213> Artificial <220> <223> primer sequence I311M, rev <400> 87 catggctgag acaccgccga acatatcttc g 31 <210> 88 <211> 31 <212> DNA <213> Artificial <220> <223> primer sequence E339D,fwd <400> 88 gggttggggc ggtgatgatg acgatatgag c 31 <210> 89 <211> 31 <212> DNA <213> Artificial <220> <223> primer sequence E339D,rev <400> 89 gctcatatcg tcatcatcac cgccccaacc c 31

Claims (16)

  1. β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제 또는 이의 돌연변이의 존재하에, 말단 GlcNAc 부(moiety)를 포함하는 글리칸을 포함하는 당 단백질을 당 유도체 뉴클레오타이드 Su(A)-Nuc와 접촉시키는 단계를 포함하는, 당 단백질의 변형 방법으로서, 여기서:
    (i) 말단 GlcNAc 부를 포함하는 글리칸은 화학식 (1) 또는 (2)에 따르며:
    Figure pct00030

    상기 식에서:
    b는 0 또는 1이며;
    d는 0 또는 1이며;
    e는 0 또는 1이며; 그리고
    G는 단당류, 또는 2 내지 20 당 부를 포함하는 선형 또는 분지형 올리고당이며; 그리고
    (ii) 당 유도체 뉴클레오타이드 Su(A)-Nuc는 화학식 (3)에 따르며:
    Figure pct00031

    상기 식에서:
    a는 0 또는 1이며;
    Nuc는 뉴클레오타이드이며;
    U는 [C(R1)2]n 또는 [C(R1)2]pO-[C(R1)2C(R1)2O]o-[C(R1)2]q이며, 여기서 n은 0 내지 24 범위의 정수이고; o는 0 내지 12 범위의 정수이고; p 및 q는 독립적으로 0, 1 또는 2이고; 그리고 R1은 H, F, Cl, Br, I 및 선택적으로 치환된 C1-C24 알킬기로 구성된 그룹으로부터 독립적으로 선택되고;
    T는 C3-C12(헤테로)아릴렌기이고, 여기서 (헤테로)아릴렌기는 선택적으로 치환되며; 그리고
    A는 하기로 구성되는 그룹으로부터 선택된다:
    (a) -N3
    (b) -C(O)R3
    여기서 R3은 선택적으로 치환된 C1-C24 알킬기이고;
    (c) -C≡C-R4
    여기서 R4는 수소 또는 선택적으로 치환된 C1-C24 알킬기이고;
    (d) -SH
    (e) -SC(O)R8
    여기서 R8은 선택적으로 치환된 C1-C24 알킬기이고;
    (f) -SC(V)OR8
    여기서 V는 O 또는 S이고, R8은 선택적으로 치환된 C1-C24 알킬기이고;
    (g) -X
    여기서 X는 F, Cl, Br 및 I로 구성된 그룹으로부터 선택되고;
    (h) -OS(O)2R5
    여기서 R5는 C1-C24 알킬기, C6-C24 아릴기, C7-C24 알킬아릴기 및 C7-C24 아릴알킬기로 구성된 그룹으로부터 선택되고, 알킬기, 아릴기, 알킬아릴기 및 아릴알킬기는 선택적으로 치환되며;
    (i) R11
    여기서 R11은 선택적으로 치환된 C2-C24 알킬기이며;
    (j) R12
    여기서 R12는 선택적으로 치환된 말단 C2-C24 알케닐기이며; 그리고
    (k) R13
    여기서 R13은 선택적으로 치환된 말단 C3-C24 알케닐기인,
    당 단백질의 변형 방법.
  2. 제1항에 있어서,
    U는 [C(R1)2]n이며, n은 1 내지 24 범위의 정수이며, 그리고 U가 [C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q인 경우에 o는 1 내지 12 범위의 정수이며 그리고/또는 p는 1 또는 2이며 그리고/또는 q는 1 또는 2인, 당 단백질의 변형 방법.
  3. 제1항에 있어서,
    U가 부재하는(absent), 당 단백질의 변형 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    당 유도체 뉴클레오타이드 Su(A)-Nuc는 화학식 (9) 또는 (10)에 따르는, 당 단백질의 변형 방법.
    Figure pct00032

    상기 식에서, Nuc, A, U 및 T는 제1항에 정의된 바와 같다.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    T가 존재하는 경우, 페닐렌기, 피리디닐렌기, 피리디니우밀렌기, 피리미디닐렌기, 피리미디니우밀렌기, 피라지닐렌기, 피라디지닐렌기, 피롤릴렌기, 피롤리우밀렌기, 퓨라닐렌기, 티오페닐렌기, 디아졸릴렌기, 퀴놀리닐렌기, 이미다졸릴렌기, 옥사졸릴렌기 및 옥사졸리우밀렌기로 구성된 그룹으로부터 선택되며, 여기서 상기 (헤테로)아릴렌기는 선택적으로 치환되는, 당 단백질의 변형 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    당 유도체 뉴클레오타이드는 화학식 (11), (12), (13), (14), (15), (16), (34) 또는 (35)에 따르는, 당 단백질의 변형 방법.
    Figure pct00033

    상기 식에서:
    A는 제1항에서 정의된 바와 같고; 그리고
    m은 0 내지 4 범위의 정수이며;
    R2는 -F, -Cl, -Br, -CN, -NO2, -C(O)R9, -C(O)OR9, -C(O)N(R10)2, C1-C4 알킬기 및 C1-C4 알콕시기로 구성된 그룹으로부터 독립적으로 선택되며, 여기서 R9는 C1-C12 알킬기이며, 그리고 여기서 R10은 수소 및 C1-C12 알킬기로부터 독립적으로 선택되며; 그리고
    R6은 H 및 선택적으로 치환된 C1-C24 알킬기로 구성된 그룹으로부터 선택된다.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    뉴클레오타이드는 UDP인, 당 단백질의 변형 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    당 유도체 뉴클레오타이드는 화학식 (17), (18), (19), (20), (21) 또는 (22)에 따르는, 당 단백질의 변형 방법.
    Figure pct00034

    상기 식에서:
    X는 F, Cl, Br 또는 I이고;
    R8은 선택적으로 치환된 C1-C24 알킬기이고;
    V는 O 또는 S이고;
    r은 0 또는 1이고;
    s는 1 내지 10 범위의 정수이고;
    t는 1 내지 10 범위의 정수이며; 그리고
    u는 0 내지 10 범위의 정수이다.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서,
    당 유도체 뉴클레오타이드는 화학식 (23), (24) 또는 (25)에 따르는, 당 단백질의 변형 방법.

    Figure pct00035


    상기 식에서, X는 F, Cl, Br 또는 I이다.
  10. 제8항 또는 제9항에 있어서,
    당 유도체 뉴클레오타이드는 화학식 (17), (18), (19), (23) 또는 (24)에 따르며, 여기서 (17), (18) 및 (19)는 제8항에 정의된 바와 같으며, 여기서 (23) 및 (24)는 제9항에 정의된 바와 같으며, 그리고 여기서 X는 Cl 또는 F인, 당 단백질의 변형 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서,
    말단 GlcNAc 부를 포함하는 글리칸은 화학식 (1), (26) 또는 (27)에 따르는, 당 단백질의 변형 방법.
    Figure pct00036

    상기 식에서:
    b는 제1항에 정의된 바와 같다.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서,
    말단 GlcNAc 부를 포함하는 글리칸을 포함하는 당 단백질은 화학식 (7) 또는 (8)에 따르는, 당 단백질의 변형 방법.
    Figure pct00037

    상기 식에서:
    b, d, e 및 G는 제1항에 정의된 바와 같으며;
    y는 1 내지 24 범위의 정수이며; 그리고
    Pr은 단백질이다.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서,
    말단 GlcNAc 부를 포함하는 글리칸을 포함하는 당 단백질은 항체인, 당 단백질의 변형 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서,
    β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제는 무척추동물 β-(1,4)-GalNAcT 효소이거나 또는 이로부터 유도되는, 당 단백질의 변형 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서,
    β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제는 SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22 및 23으로 구성된 그룹으로부터, 또는 SEQ ID NO: 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 71, 72 및 73으로 구성된 그룹으로부터 선택된 서열이거나 또는 이로부터 유도되는, 당 단백질의 변형 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서,
    β-(1,4)-N-아세틸갈락토오스아미닐트랜스퍼라아제는 SEQ ID NO: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22 및 23으로 구성된 그룹으로부터, 또는 SEQ ID NO: 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 71, 72 및 73으로 구성된 그룹으로부터 선택된 서열과 적어도 50% 동일성을 갖는, 당 단백질의 변형 방법.
KR1020177006055A 2014-08-04 2015-08-04 베타-(1,4)-n-아세틸갈락토오스아미닐트랜스퍼라아제, 또는 이의 돌연변이체를 이용한 당 단백질의 변형 방법 KR20170030648A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14179713.4 2014-08-04
EP14179713 2014-08-04
PCT/NL2015/050567 WO2016022027A1 (en) 2014-08-04 2015-08-04 Process for the modification of a glycoprotein using a βeta-(1,4)-n-acetylgalactosaminyltransferase or a mutant thereof

Publications (1)

Publication Number Publication Date
KR20170030648A true KR20170030648A (ko) 2017-03-17

Family

ID=51260772

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177006055A KR20170030648A (ko) 2014-08-04 2015-08-04 베타-(1,4)-n-아세틸갈락토오스아미닐트랜스퍼라아제, 또는 이의 돌연변이체를 이용한 당 단백질의 변형 방법

Country Status (6)

Country Link
US (1) US11046988B2 (ko)
EP (2) EP3177633B1 (ko)
JP (2) JP2017528124A (ko)
KR (1) KR20170030648A (ko)
CN (1) CN107109454A (ko)
WO (1) WO2016022027A1 (ko)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015057065A1 (en) * 2013-10-14 2015-04-23 Synaffix B.V. Glycoengineered antibody, antibody-conjugate and methods for their preparation
WO2017137457A1 (en) 2016-02-08 2017-08-17 Synaffix B.V. Antibody-conjugates with improved therapeutic index for targeting cd30 tumours and method for improving therapeutic index of antibody-conjugates
US10874746B2 (en) 2016-02-08 2020-12-29 Synaffix B.V. Sulfamide linkers for use in bioconjugates
EP3413915A1 (en) 2016-02-08 2018-12-19 Synaffix B.V. Antibody-conjugates with improved therapeutic index for targeting her2 tumours and method for improving therapeutic index of antibody-conjugates
EP3413916A1 (en) 2016-02-08 2018-12-19 Synaffix B.V. Antibody-conjugates with improved therapeutic index for targeting cd30 tumours and method for improving therapeutic index of antibody-conjugates
JP2019507741A (ja) 2016-02-08 2019-03-22 シンアフィックス ビー.ブイ. 治療において使用するためのスルファミドリンカーを含むバイオコンジュゲート
CN107028933B (zh) * 2017-05-03 2022-10-18 大连理工大学 四氢穗花杉双黄酮在制备蛋白质n-乙酰葡萄糖胺修饰抑制剂中的应用
US11911484B2 (en) 2018-08-02 2024-02-27 Dyne Therapeutics, Inc. Muscle targeting complexes and uses thereof for treating myotonic dystrophy
CN112955153A (zh) 2018-08-02 2021-06-11 达因疗法公司 肌肉靶向复合物及其用于治疗肌养蛋白病的用途
KR20210081324A (ko) 2018-08-02 2021-07-01 다인 세라퓨틱스, 인크. 근육 표적화 복합체 및 안면견갑상완 근육 이영양증을 치료하기 위한 그의 용도
US11168141B2 (en) 2018-08-02 2021-11-09 Dyne Therapeutics, Inc. Muscle targeting complexes and uses thereof for treating dystrophinopathies
CN109045019A (zh) * 2018-08-31 2018-12-21 大连理工大学 2,3,2”,3”-四氢金连木黄酮在制备蛋白质n-乙酰葡萄糖胺修饰抑制剂中的应用
CN113260384A (zh) 2018-11-05 2021-08-13 西纳福克斯股份有限公司 用于靶向表达trop-2的肿瘤的抗体缀合物
GB201901608D0 (en) 2019-02-06 2019-03-27 Vib Vzw Vaccine adjuvant conjugates
CN110195043A (zh) * 2019-05-15 2019-09-03 武汉格莱利生物科技有限公司 一种高水溶性的cgta酶及其制备方法和应用
TW202140075A (zh) 2020-01-09 2021-11-01 美商梅爾莎納醫療公司 具有含肽之連接子的位置特異性抗體-藥物共軛體
JP2024512324A (ja) 2021-03-05 2024-03-19 ジーオー セラピューティクス,インコーポレイテッド 抗グリコcd44抗体およびその使用
CN117279664A (zh) 2021-04-10 2023-12-22 普方生物制药美国公司 Folr1结合剂、其偶联物及其使用方法
EP4326768A1 (en) 2021-04-23 2024-02-28 Profoundbio Us Co. Anti-cd70 antibodies, conjugates thereof and methods of using the same
US11969475B2 (en) 2021-07-09 2024-04-30 Dyne Therapeutics, Inc. Muscle targeting complexes and uses thereof for treating facioscapulohumeral muscular dystrophy
US11672872B2 (en) 2021-07-09 2023-06-13 Dyne Therapeutics, Inc. Anti-transferrin receptor antibody and uses thereof
US11771776B2 (en) 2021-07-09 2023-10-03 Dyne Therapeutics, Inc. Muscle targeting complexes and uses thereof for treating dystrophinopathies
US11638761B2 (en) 2021-07-09 2023-05-02 Dyne Therapeutics, Inc. Muscle targeting complexes and uses thereof for treating Facioscapulohumeral muscular dystrophy
US11633498B2 (en) 2021-07-09 2023-04-25 Dyne Therapeutics, Inc. Muscle targeting complexes and uses thereof for treating myotonic dystrophy
CA3228178A1 (en) 2021-08-05 2023-02-09 Go Therapeutics, Inc. Anti-glyco-muc4 antibodies and their uses
WO2023092099A1 (en) 2021-11-19 2023-05-25 Ardeagen Corporation Gpc3 binding agents, conjugates thereof and methods of using the same
WO2023161296A1 (en) 2022-02-22 2023-08-31 Adc Therapeutics Sa Conjugation method involving a transglutaminase at the fc region comprising a trimmed n-glycan
WO2023180484A1 (en) 2022-03-23 2023-09-28 Synaffix B.V. Antibody-conjugates for targeting of tumours expressing ptk7
WO2023180490A1 (en) 2022-03-23 2023-09-28 Synaffix B.V. Antibody-conjugates for targeting of tumours expressing nectin-4
WO2023180489A1 (en) 2022-03-23 2023-09-28 Synaffix B.V. Antibody-conjugates for targeting of tumours expressing carcinoembyronic antigen
WO2023180485A1 (en) 2022-03-23 2023-09-28 Synaffix B.V. Antibody-conjugates for targeting of tumours expressing trop-2
US11931421B2 (en) 2022-04-15 2024-03-19 Dyne Therapeutics, Inc. Muscle targeting complexes and formulations for treating myotonic dystrophy
WO2024038065A1 (en) 2022-08-15 2024-02-22 Synaffix B.V. Anthracyclins and conjugates thereof

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI20011671A (fi) 2001-08-20 2003-02-21 Carbion Oy Tuumorispesifiset oligosakkaridisekvenssit ja niiden käyttö
AU2003270645A1 (en) 2002-09-13 2004-04-30 Richard D. Cummings Beta1,4-N-ACETYLGALACTOSAMINYLTRANSFERASES, NUCLEIC ACIDS AND METHODS OF USE THEREOF
JP2008514215A (ja) 2004-09-29 2008-05-08 ノボ ノルディスク ヘルス ケア アクチェンゲゼルシャフト 改変タンパク質
EP2623610B1 (en) 2006-02-10 2015-04-29 Life Technologies Corporation Labeling and detection of post translationally modified proteins
WO2008151258A2 (en) * 2007-06-04 2008-12-11 Neose Technologies, Inc. O-linked glycosylation using n-acetylglucosaminyl transferases
UY32621A (es) 2009-05-11 2010-12-31 Stichting Tech Wetenschapp Antígeno glicano
GB201115841D0 (en) 2011-09-13 2011-10-26 Genovis Ab Protein and method
HUE062385T2 (hu) 2012-10-23 2023-10-28 Synaffix Bv Módosított antitest, antitest-konjugátum és eljárás ezek elõállítására
CN105814213B (zh) 2013-10-14 2021-05-04 西纳福克斯股份有限公司 经修饰的糖蛋白、蛋白质-缀合物及其制备方法
EP3097200A1 (en) 2014-01-24 2016-11-30 SynAffix B.V. Process for the attachment of a galnac moiety comprising a (hetero)aryl group to a glcnac moiety, and product obtained thereby
EP3134520B1 (en) 2015-04-23 2017-12-20 Synaffix B.V. Process for the modification of a glycoprotein using a glycosyltransferase that is or is derived from a (1,4)-n-acetylgalactosaminyltransferase

Also Published As

Publication number Publication date
EP3177633A1 (en) 2017-06-14
WO2016022027A1 (en) 2016-02-11
JP2017528124A (ja) 2017-09-28
EP3177633B1 (en) 2022-07-20
US20170226554A1 (en) 2017-08-10
EP4148138A1 (en) 2023-03-15
CN107109454A (zh) 2017-08-29
US11046988B2 (en) 2021-06-29
JP7297820B2 (ja) 2023-06-26
JP2021191263A (ja) 2021-12-16

Similar Documents

Publication Publication Date Title
JP7297820B2 (ja) ベータ-(1,4)-n-アセチルガラクトサミニルトランスフェラーゼ又はその突然変異体を用いる糖タンパク質の改変方法
US20230100074A1 (en) PROCESS FOR THE MODIFICATION OF A GLYCOPROTEIN USING A GLYCOSYLTRANSFERASE THAT IS OR IS DERIVED FROM A ß(1,4)-N-ACETYLGALACTOSAMINYLTRANSFERASE
EP3058083B1 (en) Modified glycoprotein, protein-conjugate and process for the preparation thereof
RU2642307C2 (ru) Новые фукозилтрансферазы и их применение
RU2628307C2 (ru) Новые фукозилтрасферазы и их применения
EP2935608A1 (en) Modified glycoprotein, protein-conjugate and process for the preparation thereof
WO2015057066A1 (en) Glycoengineered antibody, antibody-conjugate and methods for their preparation
Kong et al. N-Glycosyltransferase from Aggregatibacter aphrophilus synthesizes glycopeptides with relaxed nucleotide-activated sugar donor selectivity
US20170009266A1 (en) Process for the attachment of a galnac moiety comprising a (hetero)aryl group to a glcnac moiety, and product obtained thereby
Takaya et al. Rational design, synthesis, and characterization of novel inhibitors for human β1, 4-galactosyltransferase
Huang et al. Site-selective sulfation of N-glycans by human GlcNAc-6-O-sulfotransferase 1 (CHST2) and chemoenzymatic synthesis of sulfated antibody glycoforms
JP2018500934A (ja) Cmp依存性シアリダーゼ活性
EP3423587B1 (en) A multifunctional recombinant nucleotide dependent glycosyltransferase protein and its method of glycosylation thereof
CN118056009A (zh) 分离的多肽及其应用
KR20230012576A (ko) 하이퍼-시알릴화 면역글로불린
Brzezicka Chemoenzymatic synthesis and immunological studies of Xylosylated N-glycans