KR20220145877A - 글리칸의 시알화를 위한 효소 - Google Patents

글리칸의 시알화를 위한 효소 Download PDF

Info

Publication number
KR20220145877A
KR20220145877A KR1020227033078A KR20227033078A KR20220145877A KR 20220145877 A KR20220145877 A KR 20220145877A KR 1020227033078 A KR1020227033078 A KR 1020227033078A KR 20227033078 A KR20227033078 A KR 20227033078A KR 20220145877 A KR20220145877 A KR 20220145877A
Authority
KR
South Korea
Prior art keywords
leu
seq
ser
pro
val
Prior art date
Application number
KR1020227033078A
Other languages
English (en)
Inventor
제임스 미도르 3세
산드라 프레이타스 파바오 십시
에이미 메데이로스
스리쉬티 구르나니
Original Assignee
모멘타 파머슈티컬스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 모멘타 파머슈티컬스 인코포레이티드 filed Critical 모멘타 파머슈티컬스 인코포레이티드
Publication of KR20220145877A publication Critical patent/KR20220145877A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1081Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • C12N15/625DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01022Lactose synthase (2.4.1.22)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/40Immunoglobulins specific features characterized by post-translational modification
    • C07K2317/41Glycosylation, sialylation, or fucosylation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/21Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01038Beta-N-acetylglucosaminylglycopeptide beta-1,4-galactosyltransferase (2.4.1.38)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/99Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
    • C12Y204/99001Beta-galactoside alpha-2,6-sialyltransferase (2.4.99.1)

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Polysaccharides And Polysaccharide Derivatives (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

융합 단백질, 예를 들어 ST6Gal1 또는 B4GalT1의 효소적으로 활성인 부분(들)을 포함하는 융합 단백질뿐만 아니라 이의 생성 방법, 상기 융합 단백질(들)을 인코딩하는 핵산 분자(들), 상기 핵산 분자(들)를 포함하는 벡터, 및 상기 벡터(들)를 포함하는 숙주 세포(들)가 본 명세서에 기재된다. 또한, 면역글로불린 G(IgG) 항체를 시알화하는 방법이 본 명세서에 기재된다.

Description

글리칸의 시알화를 위한 효소
우선권 주장
본 출원은 2020년 2월 25일자로 출원된 미국 가출원 제62/981,293호 및 2020년 5월 19일자로 출원된 미국 가출원 제63/026,927호의 이익을 주장한다. 전술한 것들의 전체 내용은 본 명세서에 참고로 포함된다.
기술분야
본 발명은 융합 단백질, 예를 들어 ST6Gal1 또는 B4GalT1의 효소적으로 활성인 부분(들)을 포함하는 융합 단백질뿐만 아니라 이의 생성 방법, 상기 융합 단백질(들)을 인코딩하는 핵산 분자(들), 상기 핵산 분자(들)를 포함하는 벡터, 및 상기 벡터(들)를 포함하는 숙주 세포(들)에 관한 것이다. 또한, 면역글로불린 G(IgG) 항체를 시알화하는 방법이 본 명세서에 기재된다.
인간 공여자의 풀링된 혈장(예를 들어, 적어도 1,000명의 공여자로부터의 풀링된 혈장)으로부터 제조된 정맥내 면역글로불린(IVIg)은 다양한 염증성 장애를 치료하기 위해 사용된다. 그러나, IVIg 제제는 변동이 심한 효능, 임상 위험, 높은 비용, 및 유한 공급과 같은 뚜렷한 제한을 갖는다. 각종 IVIg 제제가 임상적으로 상호교환 가능 제품으로서 빈번하게 치료되지만, 선택된 임상 응용에서 내약성 및 활성에 영향을 줄 수 있는 유의한 차이가 제품 제제간에 존재하는 것으로 잘 알려져 있다. 현재의 최대 투여 계획(dosing regimen)에서는, 많은 경우에 단지 부분적인 그리고 지속되지 않는 반응만이 달성된다. 게다가, 높은 부피의 IVIg 치료와 연관된 긴 주입 시간(4 내지 6시간)은 주입 센터에서 상당한 자원 소비를 가져오며, 편의성 및 삶의 질과 같은 환자-보고 결과에 부정적인 영향을 준다.
Fc 도메인 시알화의 중요한 항염증 역할의 확인은 더 강력한 면역글로불린 요법을 개발할 기회를 제시해 왔다. 일반적으로, 구매가능한 IVIg 제제는 존재하는 항체의 Fc 도메인 상에서 낮은 수준의 시알화를 나타낸다. 구체적으로는, 이들은 Fc 영역 상의 분지형 글리칸의 낮은 수준의 다이시알화를 나타낸다.
Washburn et al.의 문헌[Proceedings of the National Academy of Sciences, USA 112: E1297-E1306 (2015)]은 고도로 테트라-Fc-시알화된 IVIg를 발생시키기 위한 제어된 시알화 과정을 기재하고, 그 과정이 일관되게 향상된 항염증 활성을 갖는 제품을 생성한다는 것을 보여주었다.
매우 높은 수준의 Fc 시알화를 갖는 면역글로불린 G(IgG)를 제조하는 방법이 본 명세서에 기재된다. 본 명세서에 기재된 방법은 Fc 도메인 상의 분지형 글리칸의 70% 초과가 양쪽 분지 상에서(즉, 알파 1,3 분지 상에서 그리고 알파 1,6 분지 상에서) 시알화된 과시알화된 IgG(hsIgG)를 제공할 수 있다. hsIgG는 IgG 항체 아형들의 다양한 혼합물을 함유하는데, 이때 IgG1 항체가 가장 우세하고, IgG2가 그 뒤를 따른다. 항체의 다양성은 매우 높은데, 그 이유는, 출발 물질이 수백명 또는 수천명의 많은 공여자로부터 풀링된 IgG 항체이기 때문이다. hsIgG를 제조하는 데 사용되는 IgG 항체는, 예를 들어 풀링된 인간 혈장(예를 들어, 적어도 1,000 내지 30,000명의 공여자로부터 풀링된 혈장)으로부터 얻어질 수 있다. 대안적으로, IVIg - 구매가능한 IVIg를 포함함 - 가 hsIgG를 제조하는 데 사용될 수 있다. hsIgG는 IVIg보다 Fc 영역 상의 분지형 글리칸 상에 훨씬 더 높은 수준의 시알산을 갖는다. 이는 구조 및 활성 둘 모두에서 IVIg와 상이한 조성물의 생성으로 이어진다. hsIgG는 국제 특허 출원 공개 WO2014/179601호 또는 Washburn et al.의 문헌[Proceedings of the National Academy of Sciences, USA 112: E1297-E1306 (2015)]에 기재된 바와 같이 제조될 수 있으며, 이들 둘 모두는 본 명세서에 참고로 포함된다.
hsIgG를 제조하는 개선된 방법이 본 명세서에 기재된다.
과시알화된 IgG에서는, Fc 영역 상의 분지형 글리칸의 적어도 60%(예를 들어, 65%, 70%, 75%, 80%, 82%, 85%, 87%, 90%, 92%, 94%, 95%, 97%, 98%, 100%를 포함하여 최대 100%에 이르기까지))는 NeuAc-α 2,6-Gal 말단 연결을 통해 다이-시알화된다(즉, α 1,3 분지 및 α 1,6 아암의 양쪽 분지 상에서). 일부 실시 형태에서, Fc 영역 상의 분지형 글리칸의 50% 미만(예를 들어, 40%, 30%, 20%, 15%, 10%, 5%, 4%, 3%, 2%, 1% 미만)은 NeuAc-α 2,6-Gal 말단 연결을 통해 모노-시알화된다(즉, α 1,3 분지 상에서만 또는 α 1,6 분지 상에서만 시알화됨).
일부 실시 형태에서, 폴리펩티드는 혈장, 예를 들어 인간 혈장으로부터 유래된다. 소정 실시 형태에서, 폴리펩티드는 압도적으로 IgG 폴리펩티드(예를 들어, IgG1, IgG2, IgG3 또는 IgG4 또는 이들의 혼합물)이지만, 미량의 다른 면역글로불린 하위부류가 존재할 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "항체"는 적어도 하나의 면역글로불린 가변 영역, 예를 들어 면역글로불린 가변 도메인 또는 면역글로불린 가변 도메인 서열을 제공하는 아미노산 서열을 포함하는 폴리펩티드를 지칭한다. 예를 들어, 항체는 중쇄(H 사슬) 가변 영역(본 명세서에서 VH로 약기됨), 및 경쇄(L 사슬) 가변 영역(본 명세서에서 VL로 약기됨)을 포함할 수 있다. 다른 예에서, 항체는 2개의 중쇄(H 사슬) 가변 영역 및 2개의 경쇄(L 사슬) 가변 영역을 포함한다. 용어 "항체"는 항체의 항원-결합 단편(예를 들어, 단일쇄 항체, Fab, F(ab')2, Fd, Fv, 및 dAb 단편)뿐만 아니라 완전한 항체, 예를 들어 유형 IgA, IgG, IgE, IgD, IgM(이뿐만 아니라 이들의 아형)의 온전한 면역글로불린을 포함한다. 면역글로불린의 경쇄는 카파 또는 람다의 유형일 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "불변 영역"은 항체의 하나 이상의 불변 영역 면역글로불린 도메인에 상응하거나 이로부터 유래되는 폴리펩티드를 지칭한다. 불변 영역은 하기 면역글로불린 도메인들 중 임의의 것 또는 전부를 포함할 수 있다: CH1 도메인, 힌지 영역, CH2 도메인, CH3 도메인(IgA, IgD, IgG, IgE, 또는 IgM으로부터 유래됨), 및 CH4 도메인(IgE 또는 IgM으로부터 유래됨).
본 명세서에 사용되는 바와 같이, 용어 "Fc 영역"은 2개의 "Fc 폴리펩티드"의 이량체를 지칭하며, 각각의 "Fc 폴리펩티드"는 제1 불변 영역 면역글로불린 도메인을 제외한 항체의 불변 영역을 포함한다. 일부 실시 형태에서, "Fc 영역"은 하나 이상의 이황화물 결합, 화학적 링커, 또는 펩티드 링커에 의해 연결된 2개의 Fc 폴리펩티드를 포함한다. "Fc 폴리펩티드"는 IgA, IgD, 및 IgG의 마지막 2개의 불변 영역 면역글로불린 도메인, 및 IgE 및 IgM의 마지막 3개의 불변 영역 면역글로불린 도메인을 지칭하며, 또한 이들 도메인에 대해 N-말단에 있는 가요성 힌지의 일부 또는 전부를 포함할 수 있다. IgG의 경우, "Fc 폴리펩티드"는 면역글로불린 도메인 C감마2(Cγ2) 및 C감마3(Cγ3), 그리고 C감마1(Cγ1)과 Cγ2 사이의 힌지의 하부 부분을 포함한다. Fc 폴리펩티드의 경계는 변동될 수 있지만, 인간 IgG 중쇄 Fc 폴리펩티드는 T223 또는 C226 또는 P230에서 출발하여 그의 카르복실-말단에 이르기까지의 잔기들을 포함하는 것으로 통상 정의되며, 여기서 넘버링은 Kabat et al.의 문헌[1991, NIH Publication 91-3242, National Technical Information Services, Springfield, VA]에서와 같이 EU 인덱스에 따른다. IgA의 경우, Fc 폴리펩티드는 면역글로불린 도메인 C알파2(Cα2) 및 C알파3(Cα3), 그리고 C알파1(Cα1)과 Cα2 사이의 힌지의 하부 부분을 포함한다. Fc 영역은 IVIg와 같은 천연 공급원으로부터 생성되거나, 재조합되거나, 합성될 수 있다.
본 명세서에 사용되는 바와 같이, "글리칸"은 당으로서, 이는 당 잔기 - 예컨대 적어도 3개의 당 - 의 단량체 또는 중합체일 수 있고, 선형 또는 분지형일 수 있다. "글리칸"은 천연 당 잔기(예를 들어, 글루코스, N-아세틸글루코사민, N-아세틸 뉴라민산, 갈락토스, 만노스, 푸코스, 헥소스, 아라비노스, 리보스, 자일로스 등) 및/또는 변형된 당(예를 들어, 2'-플루오로리보스, 2'-데옥시리보스, 포스포만노스, 6'-설포 N-아세틸글루코사민 등)을 포함할 수 있다. 용어 "글리칸"은 당 잔기의 동종중합체 및 이종중합체를 포함한다. 용어 "글리칸"은 또한 (예를 들어, 폴리펩티드, 당지질, 프로테오글리칸 등의) 당접합체의 글리칸 성분을 포함한다. 이 용어는 또한 유리 글리칸을 포함하는데, 이에는 당접합체로부터 절단되었거나 달리 방출된 글리칸이 포함된다.
본 명세서에 사용되는 바와 같이, 용어 "당단백질"은 하나 이상의 당 모이어티(즉, 글리칸)에 공유적으로 연결된 펩티드 골격을 함유하는 단백질을 지칭한다. 당 모이어티(들)는 단당, 이당, 올리고당, 및/또는 다당의 형태일 수 있다. 당 모이어티(들)는 당 잔기의 단일 비분지쇄를 포함할 수 있거나 하나 이상의 분지쇄를 포함할 수 있다. 당단백질은 O-연결된 당 모이어티 및/또는 N-연결된 당 모이어티를 함유할 수 있다.
본 명세서에 사용되는 바와 같이, "IVIg"는 적어도 1,000명의 인간 공여자의 혈장으로부터 추출된, 4가지 IgG 하위군 모두를 포함한, 풀링된 다가 IgG의 제제이다. IVIg는 면역 결핍 환자를 위한 혈장 단백질 대체 요법으로서 승인되어 있다. IVIg Fc 글리칸 시알화의 수준은 IVIg 제제마다 다르지만, 일반적으로 20% 미만이다. 다이시알화의 수준은 일반적으로 훨씬 더 낮다. 본 명세서에 사용되는 바와 같이, 용어 "IVIg로부터 유래되는"은 IVIg의 조작으로부터 생성되는 폴리펩티드를 지칭한다. 예를 들어, IVIg로부터 정제된 폴리펩티드(예를 들어, 시알화된 IgG가 풍부화됨) 또는 변형된 IVIg로부터 정제된 폴리펩티드(예를 들어, 효소적으로 시알화된 IVIg IgG)가 있다.
본 명세서에 사용되는 바와 같이, "Fc 폴리펩티드의 N-글리코실화 부위"는 글리칸이 N-연결된 Fc 폴리펩티드 내의 아미노산 잔기를 지칭한다. 일부 실시 형태에서, Fc 영역은 Fc 폴리펩티드의 이량체를 함유하며, Fc 영역은 각각의 Fc 폴리펩티드 상에 하나씩, 2개의 N-글리코실화 부위를 포함한다.
본 명세서에 사용되는 바와 같이, "분지형 글리칸의 백분율(%)"은 존재하는 글리칸의 총 몰수에 대한 글리칸 X의 몰수를 지칭하며, 여기서 X는 관심 글리칸을 나타낸다.
용어 "약제학적 유효량" 또는 "치료학적 유효량"은 본 명세서에 기재된 장애 또는 질환을 갖는, 환자를 치료하는 데 효과적인 양(예를 들어, 용량)을 지칭한다. "약제학적 유효량"은 단독으로 또는 다른 치료제와 병용하여 취해진, 1회 용량으로 또는 임의의 투여량 또는 경로로 취해진, 원하는 치료적 효과를 제공하는 양으로서 해석될 수 있음이 또한 본 명세서에서 이해되어야 한다.
"약제학적 제제" 및 "약제학적 제품"은 제제 또는 제품 및 사용 설명서를 포함하는 키트 내에 포함될 수 있다.
"약제학적 제제" 및 "약제학적 제품"은 일반적으로, 최종으로 미리 결정된 수준의 시알화가 달성되고, 공정 불순물이 없는 조성물을 지칭한다. 이를 위해, "약제학적 제제" 및 "약제학적 제품"에는 ST6Gal 시알릴트랜스퍼라제 및/또는 시알산 공여체(예를 들어, 시티딘 5'-모노포스포-N-아세틸 뉴라민산) 또는 이의 부산물(예를 들어, 시티딘 5'-모노포스페이트)이 실질적으로 없다.
"약제학적 제제" 및 "약제학적 제품"에는, 재조합인 경우, 일반적으로 당단백질이 생성된 세포의 다른 구성요소(예를 들어, 소포체 또는 세포질 단백질 및 RNA)가 실질적으로 없다.
"정제된"(또는 "단리된")이란, 천연 환경에 존재하는 다른 성분들로부터 제거되거나 분리된 폴리뉴클레오티드 또는 폴리펩티드를 지칭한다. 예를 들어, 단리된 폴리펩티드는 이것을 생성한 세포의 다른 성분들(예를 들어, 소포체 또는 세포질 단백질 및 RNA)로부터 분리된 것이다. 단리된 폴리뉴클레오티드는 다른 핵 성분(예를 들어, 히스톤)으로부터 그리고/또는 상류 또는 하류 핵산으로부터 분리된 것이다. 단리된 폴리뉴클레오티드 또는 폴리펩티드에는 표시된 폴리뉴클레오티드 또는 폴리펩티드의 천연 환경에 존재하는 다른 성분이 적어도 60% 없거나, 적어도 75% 없거나, 적어도 90% 없거나, 적어도 95% 없을 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "시알화된"은 말단 시알산을 갖는 글리칸을 지칭한다. 용어 "모노-시알화된"은, 예를 들어 α 1,3 분지 또는 α 1,6 분지 상에, 하나의 말단 시알산을 갖는 분지형 글리칸을 지칭한다. 용어 "다이-시알화된"은, 2개의 아암 상에, 예를 들어 α 1,3 아암 및 α 1,6 아암의 양쪽 아암 상에 말단 시알산을 갖는 분지형 글리칸을 지칭한다.
융합 단백질이 본 명세서에 제공되며, 상기 융합 단백질은 N-말단 신호 서열; 및 인간 알파-2,6-시알릴트랜스퍼라제 1(ST6Gal1)의 효소적으로 활성인 부분을 포함한다.
일부 실시 형태에서, ST6Gal1의 효소적으로 활성인 부분은 서열 번호 4를 포함한다. 일부 실시 형태에서, ST6Gal1의 효소적으로 활성인 부분은 서열 번호 4로 이루어진다.
일부 실시 형태에서, 신호 서열은 N-말단 아주로시딘 신호 서열이다. 일부 실시 형태에서, 아주로시딘 신호 서열은 MTRLTVLALLAGLLASSRA(서열 번호 30)를 포함한다. 일부 실시 형태에서, 아주로시딘 신호 서열은 MTRLTVLALLAGLLASSRA(서열 번호 30)로 이루어진다.
일부 실시 형태에서, 융합 단백질은 친화성 태그를 추가로 포함한다.
일부 실시 형태에서, 친화성 태그는 폴리히스티딘, 글루타티온 S-트랜스퍼라제(GST), 말토스-결합 단백질(MBP), 키틴-결합 단백질, 스트렙타비딘 태그(예를 들어, Trp-Ser-His-Pro-Gln-Phe-Glu-Lys(서열 번호 31)), FLAG-태그(예를 들어, DYKDDDDK(서열 번호 32)), 비오틴 태그, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
일부 실시 형태에서, 폴리히스티딘 태그는 HHHH(서열 번호 11), HHHHH(서열 번호 12), HHHHHH(서열 번호 13), HHHHHHH(서열 번호 14), HHHHHHHH(서열 번호 15), HHHHHHHHH(서열 번호 16), 및 HHHHHHHHHH(서열 번호 17)로 이루어진 군으로부터 선택된다.
일부 실시 형태에서, 친화성 태그는 ST6Gal1의 효소적으로 활성인 부분의 N-말단측을 향해 위치된다.
일부 실시 형태에서, N-말단 신호 서열은 MTRLTVLALLAGLLASSRA(서열 번호 30)를 포함하고, ST6Gal1의 효소적으로 활성인 부분은 서열 번호 4를 포함한다.
일부 실시 형태에서, 융합 단백질은 헥사히스티딘 태그를 추가로 포함한다. 일부 실시 형태에서, 헥사히스티딘 태그는 N-말단 신호 서열과 ST6Gal1의 효소적으로 활성인 부분 사이에 있다. 일부 실시 형태에서, 융합 단백질은 서열 번호 6으로 이루어진다.
또한, 융합 단백질(들)을 인코딩하는 핵산 분자(들), 상기 핵산 분자(들)를 포함하는 벡터(들), 및 상기 벡터(들)에 의해, 바람직하게는 안정하게, 형질전환된 숙주 세포(들)가 본 명세서에 제공된다.
일부 실시 형태에서, 벡터는 융합 단백질을 인코딩하는 핵산에 작동가능하게 연결된 프로모터를 추가로 포함한다. 일부 실시 형태에서, 프로모터는 거대세포바이러스(CMV) 프로모터이다.
일부 실시 형태에서, 숙주 세포는 인간 배아 신장(HEK) 세포 또는 이의 유도체이다. 일부 실시 형태에서, 숙주 세포는 HEK 유도체 HEK293이다.
또한, 폴리펩티드의 생성 방법이 본 명세서에 제공되며, 상기 방법은 융합 단백질의 발현이 허용되는 조건 하에서 배양 배지 중에서 본 명세서에 기재된 바와 같은 숙주 세포를 배양하는 단계; 및 상기 배양 배지로부터 상기 융합 단백질을 단리하는 단계를 포함한다.
또한, 융합 단백질이 본 명세서에 제공되며, 상기 융합 단백질은 N-말단 신호 서열; 및 인간 베타-1,4-갈락토실트랜스퍼라제(B4GalT1)의 효소적으로 활성인 부분을 포함한다.
일부 실시 형태에서, B4GalT1의 효소적으로 활성인 부분은 서열 번호 43을 포함한다. 일부 실시 형태에서, B4GalT1의 효소적으로 활성인 부분은 서열 번호 43으로 이루어진다.
일부 실시 형태에서, 신호 서열은 N-말단 아주로시딘 신호 서열이다. 일부 실시 형태에서, 아주로시딘 신호 서열은 MTRLTVLALLAGLLASSRA(서열 번호 30)를 포함한다. 일부 실시 형태에서, 아주로시딘 신호 서열은 MTRLTVLALLAGLLASSRA(서열 번호 30)로 이루어진다.
일부 실시 형태에서, 융합 단백질은 친화성 태그를 추가로 포함한다.
일부 실시 형태에서, 친화성 태그는 폴리히스티딘, 글루타티온 S-트랜스퍼라제(GST), 말토스-결합 단백질(MBP), 키틴-결합 단백질, 스트렙타비딘 태그(예를 들어, Trp-Ser-His-Pro-Gln-Phe-Glu-Lys(서열 번호 31)), FLAG-태그(예를 들어, DYKDDDDK(서열 번호 32)), 비오틴 태그, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
일부 실시 형태에서, 폴리히스티딘 태그는 HHHH(서열 번호 11), HHHHH(서열 번호 12), HHHHHH(서열 번호 13), HHHHHHH(서열 번호 14), HHHHHHHH(서열 번호 15), HHHHHHHHH(서열 번호 16), 및 HHHHHHHHHH(서열 번호 17)로 이루어진 군으로부터 선택된다.
일부 실시 형태에서, 친화성 태그는 B4GalT1의 효소적으로 활성인 부분의 C-말단측을 향해 위치된다.
일부 실시 형태에서, N-말단 신호 서열은 MTRLTVLALLAGLLASSRA(서열 번호 30)를 포함하고, B4GalT1의 효소적으로 활성인 부분은 서열 번호 43을 포함한다.
일부 실시 형태에서, 융합 단백질은 셉타히스티딘 태그를 추가로 포함한다. 일부 실시 형태에서, 셉타히스티딘 태그는 C-말단에 있다.
일부 실시 형태에서, 융합 단백질은 서열 번호 45로 이루어진다.
또한, 융합 단백질(들)을 인코딩하는 핵산 분자(들), 상기 핵산 분자(들)를 포함하는 벡터(들), 및 상기 벡터(들)에 의해, 바람직하게는 안정하게, 형질전환된 숙주 세포(들)가 본 명세서에 제공된다.
일부 실시 형태에서, 벡터는 융합 단백질을 인코딩하는 핵산에 작동가능하게 연결된 프로모터를 추가로 포함한다. 일부 실시 형태에서, 프로모터는 거대세포바이러스(CMV) 프로모터이다.
일부 실시 형태에서, 숙주 세포는 인간 배아 신장(HEK) 세포 또는 이의 유도체이다. 일부 실시 형태에서, 숙주 세포는 HEK 유도체 HEK293이다.
또한, 폴리펩티드의 생성 방법이 본 명세서에 제공되며, 상기 방법은 융합 단백질의 발현이 허용되는 조건 하에서 배양 배지 중에서 본 명세서에 기재된 바와 같은 숙주 세포를 배양하는 단계; 및 상기 배양 배지로부터 상기 융합 단백질을 단리하는 단계를 포함한다.
또한, 면역글로불린 G(IgG) 항체를 시알화하는 방법이 본 명세서에 제공되며, 상기 방법은 a) IgG 항체를 포함하는 조성물을 제공하는 단계;
b) 상기 조성물을 UDP-Gal 및 CMP-NANA의 존재 하에서 β1,4-갈락토실트랜스퍼라제 1 및 서열 번호 4를 포함하는 ST6Gal1의 효소적으로 활성인 부분에 노출시킴으로써 시알화된 IgG(sIgG)를 포함하는 조성물을 생성하는 단계를 포함한다.
또한, 면역글로불린 G(IgG) 항체를 시알화하는 방법이 본 명세서에 제공되며, 상기 방법은 a) IgG 항체를 포함하는 조성물을 제공하는 단계; b) 상기 IgG 항체를 UDP-Gal의 존재 하에서 β1,4-갈락토실트랜스퍼라제 1에 노출시킴으로써, 갈락토실화된 IgG 항체를 포함하는 조성물을 생성하는 단계; 및 c) 갈락토실화된 IgG 항체를 포함하는 상기 조성물을 CMP-NANA의 존재 하에서 서열 번호 4를 포함하는 ST6Gal1의 효소적으로 활성인 부분에 노출시킴으로써, 시알화된 IgG(sIgG)를 포함하는 조성물을 생성하는 단계를 포함한다.
일부 실시 형태에서, 갈락토실화된 IgG 항체를 포함하는 조성물은 단계 (c) 전에 정제되지 않는다.
일부 실시 형태에서, 상기 방법은 조성물들 중 하나 이상을 CMP-NANA로 보충하는 단계를 추가로 포함한다.
일부 실시 형태에서, IgG 항체들의 혼합물은 IgG1, IgG2, IgG3, IgG4, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
일부 실시 형태에서, sIgG를 포함하는 조성물 내의 항체의 Fc 영역 상의 분지형 글리칸의 적어도 60%는 다이-시알화된다.
일부 실시 형태에서, sIgG를 포함하는 조성물 내의 항체의 Fc 영역 상의 분지형 글리칸의 50% 미만은 모노-시알화된다.
아주로시딘 신호 서열 및 서열 번호 4로 이루어진 인간 ST6 시알릴트랜스퍼라제의 일부분을 포함하는 융합 단백질을 인코딩하는 핵산 서열을 포함하는 핵산 분자에 의해 안정하게 형질전환된 인간 배아 신장(HEK) 세포가 본 명세서에 제공된다.
일부 실시 형태에서, 융합 단백질은 아주로시딘 신호 서열과 서열 번호 4로 이루어진 인간 ST6 시알릴트랜스퍼라제의 일부분 사이에 위치된 HHHHH(서열 번호 12), HHHHHH(서열 번호 13), HHHHHHH(서열 번호 14), HHHHHHHH(서열 번호 15), HHHHHHHHH(서열 번호 16), HHHHHHHHHH(서열 번호 17), HHHHHM(서열 번호 18), HHHHHHM(서열 번호 19), HHHHHHM(서열 번호 20), HHHHHHHHM(서열 번호 21), HHHHHHHHHM(서열 번호 22), 및 HHHHHHHHHHM(서열 번호 23)으로부터 선택되는 서열을 포함한다.
일부 실시 형태에서, 융합 단백질은 서열 번호 4에 대해 아미노 말단에 있는 인간 ST6 시알릴트랜스퍼라제의 일부분이 결여되어 있다.
일부 실시 형태에서, 융합 단백질은 서열 번호 4를 포함하지만, 서열 번호 4에 대해 아미노 말단에 있는 인간 ST6 시알릴트랜스퍼라제의 일부분이 결여되어 있다.
일부 실시 형태에서, 융합 단백질은 서열 번호 6의 아미노산 서열을 포함한다. 일부 실시 형태에서, 융합 단백질은 서열 번호 3의 아미노산 서열을 포함한다.
일부 실시 형태에서, 핵산 분자는 융합 단백질을 인코딩하는 핵산 서열에 작동가능하게 연결된 프로모터를 포함한다. 일부 실시 형태에서, 프로모터는 거대세포바이러스 프로모터이다.
또한, 서열 번호 3을 포함하는 폴리펩티드의 제조 방법이 본 명세서에 제공되며, 상기 방법은 융합 단백질의 발현이 허용되는 조건 하에서 배양 배지 중에서 HEK 세포를 배양하는 단계 및 상기 배양 배지로부터 서열 번호 3을 포함하는 폴리펩티드를 단리하는 단계를 포함한다.
일부 실시 형태에서, 상기 방법은 단리된 폴리펩티드를 적어도 95% w/w로 정제하는 단계를 추가로 포함한다.
또한, 서열 번호 3 또는 서열 번호 6을 포함하는 폴리펩티드가 본 명세서에 제공된다.
달리 정의되지 않는 한, 본 명세서에 사용되는 모든 기술 과학 용어는 당업자가 통상적으로 이해하는 것과 동일한 의미를 갖는다. 본 발명에서 사용하기 위한 방법 및 재료가 본 명세서에 기재되어 있으며; 당업계에 알려진 다른 적합한 방법 및 재료가 또한 사용될 수 있다. 재료, 방법, 및 실시예는 단지 예시적인 것이며, 제한하고자 하는 것이 아니다. 본 명세서에 언급된 모든 공보, 특허 출원, 특허, 서열, 데이터베이스 등록물, 및 다른 참고 문헌은 전체적으로 참고로 포함된다. 상충되는 경우, 정의를 비롯한 본 명세서가 우선할 것이다.
본 발명의 다른 특징 및 이점은 하기 상세한 설명 및 도면으로부터 그리고 청구범위로부터 명백할 것이다.
도 1은 2개의 N-아세틸글루코사민 및 3개의 만노스 잔기를 포함하는 짧은 분지형 코어 올리고당을 도시한다. 분지들 중 하나는 당업계에서 "α 1,3 아암"으로 지칭되고, 제2 분지는 "α 1,6 아암"으로 지칭된다. 정사각형: N-아세틸글루코사민; 암회색 원: 만노스; 담회색 원: 갈락토스; 마름모꼴: N-아세틸뉴라민산; 삼각형: 푸코스.
도 2는 IVIg에 존재하는 공통 Fc 글리칸을 보여준다. 정사각형: N-아세틸글루코사민; 암회색 원: 만노스; 담회색 원: 갈락토스; 마름모꼴: N-아세틸뉴라민산; 삼각형: 푸코스.
도 3은 갈락토실화 단계 후에 시알화 단계를 수행함으로써 면역글로불린, 예를 들어 IgG 항체가 어떻게 시알화될 수 있는지를 나타낸다. 정사각형: N-아세틸글루코사민; 암회색 원: 만노스; 담회색 원: 갈락토스; 마름모꼴: N-아세틸뉴라민산; 삼각형: 푸코스.
도 4는 IVIg로 출발하는 반응에 대한 IgG-Fc 글리칸 프로파일의 대표적인 예의 반응 생성물을 나타낸다. 좌측 패널은 IgG를 hsIgG로 변환시키기 위한 효소적 시알화 반응의 개략도이다. 우측 패널은 출발 IVIg 및 hsIgG에 대한 IgG Fc 글리칸 프로파일이다. 막대는, 좌측에서 우측으로, 각각 IgG1, IgG2/3, 및 IgG3/4에 상응한다.
항체는 그들의 중쇄의 불변 영역 내의 보존된 위치에서 그리고 Fab 내에서 글리코실화된다. 예를 들어, Fc 도메인 내에서, 인간 IgG 항체는 CH2 도메인의 Asn297에서 단일 N-연결된 글리코실화 부위를 갖는다. 각각의 항체 동종형(isotype)은 불변 영역 내에 별개의 다양한 N-연결된 탄수화물 구조를 갖는다. 인간 IgG의 경우, 코어 올리고당은 상이한 개수의 외부 잔기를 갖는 GlcNAc2Man3GlcNAc로 통상 이루어진다. 한쪽 또는 양쪽 말단 GlcNAc에서의 갈락토스 및/또는 갈락토스-시알산의 부착을 통해 또는 제3 GlcNAc 아암(GlcNAc를 양분함)의 부착을 통해 개별 IgG 사이의 변동이 일어날 수 있다.
본 발명은, 부분적으로는, (예를 들어, NeuAc-α 2,6-Gal 말단 연결을 갖는) 분지형 글리칸의 양쪽 아암 상에서 시알화된 특정 수준의 분지형 글리칸을 갖는 Fc 영역을 갖는 면역글로불린(예를 들어, 인간 IgG)을 제조하기 위한 방법을 포함한다. 이 수준은 개별 Fc 영역에 대해 측정되거나(예를 들어, Fc 영역 내의 분지형 글리칸의 α 1,3 아암, α 1,6 아암, 또는 양쪽 아암 상에서 시알화된 분지형 글리칸의 수), 또는 폴리펩티드의 제제의 전체 조성물에 대해 측정될 수 있다(예를 들어, 폴리펩티드의 제제 내의 Fc 영역 내의 분지형 글리칸의 α 1,3 아암, α 1,6 아암, 또는 양쪽 아암 상에서 시알화된 분지형 글리칸의 수 또는 백분율).
과시알화된(hypersialylated) IgG를 제조하는 데 사용될 수 있는 천연 유래 폴리펩티드는, 예를 들어 인간 혈청(1,000명 초과의 공여자로부터 풀링된 특정 인간 혈청) 중의 IgG, 정맥내 면역글로불린(IVIg), 및 IVIg로부터 유래되는 폴리펩티드(예를 들어, IVIg로부터 정제된 폴리펩티드(예를 들어, 시알화된 IgG가 풍부화됨) 또는 변형된 IVIg로부터 정제된 폴리펩티드(예를 들어, 효소적으로 시알화된 IVIg IgG))를 포함한다.
N-연결된 올리고당 사슬은 소포체의 내강 내의 단백질에 부가된다. 구체적으로는, 초기 올리고당(전형적으로 14-당)이 Asn-X-Ser/Thr의 표적 컨센서스 서열 내에 함유된 아스파라긴 잔기의 측쇄 상의 아미노 기에 부가되며, 여기서 X는 프롤린을 제외한 임의의 아미노산일 수 있다. 이러한 초기 올리고당의 구조는 대부분의 진핵생물에 공통적이며, 3개의 글루코스, 9개의 만노스, 및 2개의 N-아세틸글루코사민 잔기를 함유한다. 이러한 초기 올리고당 사슬은 소포체 내의 특정 글리코시다제 효소에 의해 트리밍되어, 2개의 N-아세틸글루코사민 및 3개의 만노스 잔기로 구성된 짧은 분지형 코어 올리고당을 생성할 수 있다. 도 1에 도시된 바와 같이, 분지들 중 하나는 당업계에서 "α 1,3 아암"으로 지칭되고, 제2 분지는 "α 1,6 아암"으로 지칭된다.
N-글리칸은 "고 만노스형(high mannose type)", "하이브리드형(hybrid type)", 및 "복합형(complex type)"으로 불리는 3개의 구별되는 그룹으로 세분될 수 있으며, 아울러 공통 오당 코어(Man(α 1,6)-(Man(α 1,3))-Man(β 1,4)-GlcpNAc(β 1,4)-GlcpNAc(β 1,N)-Asn)가 3개의 그룹 모두에서 존재한다.
IVIg에 존재하는 더 일반적인 Fc 글리칸이 도 2에 도시되어 있다.
추가적으로 또는 대안적으로, N-아세틸글루코사민의 하나 이상의 단당 단위가 코어 만노스 하위단위에 부가되어 "복합 글리칸"을 형성할 수 있다. 갈락토스가 N-아세틸글루코사민 하위단위에 부가될 수 있고, 시알산 하위단위가 갈락토스 하위단위에 부가될 수 있으며, 그 결과 시알산, 갈락토스 또는 N-아세틸글루코사민 잔기 중 어느 하나로 종결되는 사슬이 생성될 수 있다. 추가적으로, 푸코스 잔기가 코어 올리고당의 N-아세틸글루코사민 잔기에 부가될 수 있다. 이들 각각의 부가는 특정 글리코실 트랜스퍼라제에 의해 촉매된다.
"하이브리드 글리칸"은 고-만노스 글리칸 및 복합 글리칸 둘 모두의 특성을 포함한다. 예를 들어, 하이브리드 글리칸의 하나의 분지는 주로 또는 오로지 만노스 잔기만을 포함할 수 있는 반면, 다른 분지는 N-아세틸글루코사민, 시알산, 갈락토스, 및/또는 푸코스 당을 포함할 수 있다.
시알산은 헤테로사이클릭 고리 구조를 갖는 9-탄소 단당의 패밀리이다. 이들은 상기 고리에 부착된 카르복실산 기를 통해 음전하를 가질 뿐만 아니라, N-아세틸 및 N-글리콜릴 기를 포함한 다른 화학적 장식(chemical decoration)을 통해 음전하를 가진다. 포유류 발현 시스템에서 생성되는 폴리펩티드에서 발견되는 2가지 주요 유형의 시알릴 잔기는 N-아세틸-뉴라민산(NeuAc) 및 N-글리콜릴뉴라민산(NeuGc)이다. 이들은 통상 N-연결된 글리칸 및 O-연결된 글리칸 둘 모두의 비환원성 말단에서 갈락토스(Gal) 잔기에 부착된 말단 구조로서 존재한다. 이들 시알릴 기에 대한 글리코사이드 결합 구성은 α 2,3 또는 α 2,6 중 어느 하나일 수 있다.
Fc 영역은 보존된 N-연결된 글리코실화 부위에서 글리코실화된다. 예를 들어, IgG 항체의 각각의 중쇄는 CH2 도메인의 Asn297에서 단일 N-연결된 글리코실화 부위를 갖는다. IgA 항체는 CH2 및 CH3 도메인 내에 N-연결된 글리코실화 부위를 갖고, IgE 항체는 CH3 도메인 내에 N-연결된 글리코실화 부위를 가지며, IgM 항체는 CH1, CH2, CH3, 및 CH4 도메인 내에서 N-연결된 글리코실화 부위를 갖는다.
각각의 항체 동종형은 불변 영역 내에 별개의 다양한 N-연결된 탄수화물 구조를 갖는다. 예를 들어, IgG는 Fc 영역의 각각의 Fc 폴리펩티드 내의 CH2 도메인의 Asn297에서 단일 N-연결된 바이안테나리(biantennary) 탄수화물을 가지며, 이는 C1q 및 FcγR에 대한 결합 부위를 또한 함유한다. 인간 IgG의 경우, 코어 올리고당은 상이한 개수의 외부 잔기를 갖는 GlcNAc2Man3GlcNAc로 통상 이루어진다. 한쪽 또는 양쪽 말단 GlcNAc에서의 갈락토스 및/또는 갈락토스-시알산의 부착을 통해 또는 제3 GlcNAc 아암(GlcNAc를 양분함)의 부착을 통해 개별 IgG 사이의 변동이 일어날 수 있다.
면역글로불린, 예를 들어 IgG 항체는 갈락토실화 단계 후에 시알화 단계를 수행함으로써 시알화될 수 있다. 베타-1,4-갈락토실트랜스퍼라제 1(B4GalT)은 우리딘 5'-다이포스포갈락토스([[(2R,3S,4R,5R)-5-(2,4-다이옥소피리미딘-1-일)-3,4-다이하이드록시옥솔란-2-일]메톡시-하이드록시포스포릴] [(2R,3R,4S,5R,6R)-3,4,5-트라이하이드록시-6-(하이드록시메틸)옥산-2-일] 하이드로겐 포스페이트; UDP-Gal)로부터의 갈락토스를 β-1,4 연결로서 GlcNAc로 전이시키는 II형 골지막-결합된 당단백질이다. 알파-2,6-시알릴트랜스퍼라제 1(ST6)은 시티딘 5'-모노포스포-N아세틸뉴라민산((2R,4S,5R,6R)-5-아세트아미도-2-[[(2R,3S,4R,5R)-5-(4-아미노-2-옥소피리미딘-1-일)-3,4-다이하이드록시옥솔란-2-일]메톡시-하이드록시포스포릴]옥시-4-하이드록시-6-(1,2,3-트라이하이드록시프로필)옥산-2-카르복실산; CMP-NANA 또는 CMP-시알산)으로부터의 시알산을 α-2,6 연결로서 Gal로 전이시키는 II형 골지막-결합된 당단백질이다. 개략적으로, 반응은 도 3에 나타낸 바와 같이 진행된다.
폴리펩티드의 글리칸은 당업계에 알려진 임의의 방법을 사용하여 평가될 수 있다. 예를 들어, 글리칸 조성물의 시알화(예를 들어, α 1,3 분지 및/또는 α 1,6 분지 상에서 시알화된 분지형 글리칸의 수준)는 국제 특허 출원 공개 WO2014/179601호에 기재된 방법을 사용하여 특성화될 수 있다.
본 명세서에 기재된 방법에 의해 제조된 hsIgG 조성물의 일부 실시 형태에서, Fc 도메인 상의 분지형 글리칸의 적어도 60%, 65%, 70%, 75%, 80%, 85%, 또는 90%는 NeuAc-α 2,6-Gal 말단 연결을 통해 연결된 α 1,3 아암과 α 1,6 아암의 양쪽 아암 상에 시알산을 갖는다. 게다가, 일부 실시 형태에서, Fab 도메인 상의 분지형 글리칸의 적어도 40%, 50%, 60%, 65%, 70%, 75%, 80%, 또는 85%는 NeuAc-α 2,6-Gal 말단 연결을 통해 연결된 α 1,3 아암과 α 1,6 아암의 양쪽 아암 상에 시알산을 갖는다. 전체적으로, 일부 실시 형태에서, 분지형 글리칸의 적어도 60%, 65%, 70%, 75%, 80%, 85%, 또는 90%는 NeuAc-α 2,6-Gal 말단 연결을 통해 연결된 α 1,3 아암과 α 1,6 아암의 양쪽 아암 상에 시알산을 갖는다.
효소
베타-1,4-갈락토실트랜스퍼라제(B4GalT), 예를 들어 인간 B4GalT, 예를 들어 인간 B4Galt1, 이뿐만 아니라 이의 오르토로그(ortholog), 돌연변이체, 및 변이체 - 이는 베타-1,4-갈락토실트랜스퍼라제(B4GalT), 예를 들어 인간 B4GalT, 예를 들어 인간 B4Galt1, 이뿐만 아니라 이의 오르토로그, 돌연변이체, 및 변이체의 효소적으로 활성인 부분을 포함함 -, 및 이를 포함하는 융합 단백질이 본 명세서에 기재된 방법에 사용하기에 적합하다. B4Galt1은 7개의 베타-1,4-갈락토실트랜스퍼라제(베타4GalT) 유전자 중 하나이며, 이들 유전자는 각각 공여체 기질 UDP-갈락토스에 대해서만 유일한 특이성을 갖는 것으로 나타나는 II형 막-결합된 당단백질을 인코딩하며; 이들 모두는 베타1,4 연결에서의 갈락토스를 유사한 수용체 당으로 전이시킨다: GlcNAc, Glc, 및 Xyl. B4Galt1은 갈락토스를, 단당 또는 당단백질 탄수화물 사슬의 비환원성 말단 중 하나인 N-아세틸글루코사민 잔기에 부가한다. B4GalT1은 또한 GGTB2로 명명된다. B4GALT1(NCBI 유전자 ID 2683)의 4개의 아이소형을 인코딩하는 4개의 대체 전사체가 표 1에 기재되어 있다.
[표 1]
Figure pct00001
>NP_001488.2 B4GALT1 [유기체=호모 사피엔스] [유전자 ID=2683] [아이소형=1] (서열 번호 37)
Figure pct00002
>NP_001365424.1 B4GALT1 [유기체=호모 사피엔스] [유전자 ID=2683] [아이소형=2] (서열 번호 38)
Figure pct00003
>NP_001365425.1 B4GALT1 [유기체=호모 사피엔스] [유전자 ID=2683] [아이소형=3] (서열 번호 39)
Figure pct00004
>NP_001365426.1 B4GALT1 [유기체=호모 사피엔스] [유전자 ID=2683] [아이소형=4] (서열 번호 40)
Figure pct00005
[표 2]
Figure pct00006
[표 3]
Figure pct00007
[표 4]
Figure pct00008
B4GalT1의 가용성 형태는 단백질 분해 처리에 의해 막 형태로부터 유래한다. 절단 부위는 B4GALT1 아이소형 1(서열 번호 37)의 위치 77 및 78이다.
일부 실시 형태에서, B4GALT1 아이소형 1(서열 번호 37)의 아미노산 113, 130, 172, 243, 250, 262, 310, 343, 또는 355에 상응하는 B4GalT1의 아미노산 중 하나 이상이 (서열 번호 37)와 대비하여 보존된다.
예를 들어 B4GalT1의, 효소적으로 활성인 부분이 본 명세서에 제공된다. 일부 실시 형태에서, 효소는 B4GALT1 아이소형 1(서열 번호 37), 또는 서열 번호 37의 오르토로그, 돌연변이체, 또는 변이체의 효소적으로 활성인 부분이다. 일부 실시 형태에서, 효소는 B4GALT1 아이소형 2(서열 번호 38), 또는 서열 번호 38의 오르토로그, 돌연변이체, 또는 변이체의 효소적으로 활성인 부분이다. 일부 실시 형태에서, 효소는 B4GALT1 아이소형 3(서열 번호 39), 또는 서열 번호 39의 오르토로그, 돌연변이체, 또는 변이체의 효소적으로 활성인 부분이다. 일부 실시 형태에서, 효소는 B4GALT1 아이소형 4(서열 번호 40), 또는 서열 번호 40의 오르토로그, 돌연변이체, 또는 변이체의 효소적으로 활성인 부분이다.
일부 실시 형태에서, B4GalT1의 효소적으로 활성인 부분은 세포질 도메인, 예를 들어 서열 번호 41을 포함하지 않는다. 일부 실시 형태에서, B4GalT1의 효소적으로 활성인 부분은 막관통 도메인, 예를 들어 서열 번호 42를 포함하지 않는다. 일부 실시 형태에서, B4GalT1의 효소적으로 활성인 부분은 세포질 도메인, 예를 들어 서열 번호 41 또는 막관통 도메인, 예를 들어 서열 번호 42를 포함하지 않는다.
일부 실시 형태에서, B4GalT1의 효소적으로 활성인 부분은 내강 도메인, 예를 들어 서열 번호 43, 또는 이의 오르토로그, 돌연변이체, 또는 변이체의 전부 또는 일부분을 포함한다.
일부 실시 형태에서, B4GalT1의 효소적으로 활성인 부분은 서열 번호 37의 아미노산 109 내지 398, 또는 이의 오르토로그, 돌연변이체, 또는 변이체를 포함한다. 일부 실시 형태에서, B4GalT1의 효소적으로 활성인 부분은 서열 번호 37, 또는 서열 번호 37의 오르토로그, 돌연변이체, 또는 변이체로 이루어진다.
B4GalT1의 적합한 기능성 부분은 서열 번호 43과 적어도 80%(85%, 90%, 95%, 98% 또는 100%) 동일한 아미노산 서열을 포함하거나 이로 이루어질 수 있다.
서열 번호 43
Figure pct00009
ST6Gal1, 예를 들어 인간 ST6Gal1, 이뿐만 아니라 이의 오르토로그, 돌연변이체, 및 변이체 - 이는 ST6Gal1, 예를 들어 인간 ST6Gal1, 이뿐만 아니라 이의 오르토로그, 돌연변이체, 및 변이체의 효소적으로 활성인 부분을 포함함 -, 및 이를 포함하는 융합 단백질이 본 명세서에 기재된 방법에 사용하기에 적합하다. ST6GAL1, β-갈락토시드 α-2,6-시알릴트랜스퍼라제 1은 CMP-시알산으로부터의 시알산을 당단백질, 예컨대 아시알로페투인 및 아시알로-a1-산 당단백질 상에서 Galβ1→4GlcNAc 구조로 전이시킨다. ST6Gal1은 ST6N 또는 SIAT1로도 명명된다. ST6GAL1(NCBI 유전자 ID 6480)의 2개의 아이소형을 인코딩하는 4개의 대체 전사체가 표 1에 기재되어 있다.
[표 1]
Figure pct00010
>NP_001340845.1 (NP_003023.1, NP_775323.1) ST6GAL1 [유기체=호모 사피엔스] [유전자 ID=6480] [아이소형=a] (서열 번호 28)
Figure pct00011
>NP_775324.1 ST6GAL1 [유기체=호모 사피엔스] [유전자 ID=6480] [아이소형=b](서열 번호 29)
Figure pct00012
[표 2]
Figure pct00013
[표 3]
Figure pct00014
[표 4]
Figure pct00015
ST6Gal1의 가용성 형태는 단백질 분해 처리에 의해 막 형태로부터 유래한다.
일부 실시 형태에서, ST6Gal1 아이소형 a(서열 번호 28)의 아미노산 142, 149, 161, 184, 189, 212, 233, 335, 353, 354, 364, 365, 369, 370, 376, 또는 406에 상응하는 ST6Gal1의 아미노산 중 하나 이상이 서열 번호 28과 대비하여 보존된다.
또한, 예를 들어 ST6Gal1의, 효소적으로 활성인 부분이 본 명세서에 제공된다. 일부 실시 형태에서, 효소는 STG6Gal1 아이소형 a(서열 번호 28), 또는 서열 번호 28의 오르토로그, 돌연변이체, 또는 변이체의 효소적으로 활성인 부분이다. 일부 실시 형태에서, 효소는 STG6Gal1 아이소형 b(서열 번호 29), 또는 서열 번호 29의 오르토로그, 돌연변이체, 또는 변이체의 효소적으로 활성인 부분이다.
일부 실시 형태에서, ST6Gal1의 효소적으로 활성인 부분은 세포질 도메인, 예를 들어 서열 번호 34를 포함하지 않는다. 일부 실시 형태에서, ST6Gal1의 효소적으로 활성인 부분은 막관통 도메인, 예를 들어 서열 번호 35를 포함하지 않는다. 일부 실시 형태에서, ST6Gal1의 효소적으로 활성인 부분은 세포질 도메인, 예를 들어 서열 번호 34 또는 막관통 도메인, 예를 들어 서열 번호 35를 포함하지 않는다.
일부 실시 형태에서, ST6Gal1의 효소적으로 활성인 부분은 내강 도메인, 예를 들어 서열 번호 36, 또는 이의 오르토로그, 돌연변이체, 또는 변이체의 전부 또는 일부분을 포함한다.
일부 실시 형태에서, ST6Gal1의 효소적으로 활성인 부분은 서열 번호 28의 아미노산 87 내지 406(서열 번호 4), 또는 이의 오르토로그, 돌연변이체, 또는 변이체를 포함한다. 일부 실시 형태에서, ST6Gal1의 효소적으로 활성인 부분은 서열 번호 4, 또는 서열 번호 4의 오르토로그, 돌연변이체, 또는 변이체로 이루어진다.
ST6Gal1의 적합한 기능성 부분은 서열 번호 3 또는 서열 번호 4와 적어도 80%(85%, 90%, 95%, 98% 또는 100%) 동일한 아미노산 서열을 포함하거나 이로 이루어질 수 있다.
서열 번호 4
Figure pct00016
변이체
일부 실시 형태에서, 본 명세서에 기재된 효소(들)는 (예를 들어, 본 명세서에 제공된 바와 같은) 예시적인 서열의 아미노산 서열과 적어도 80%, 예를 들어 적어도 85%, 90%, 95%, 98%, 또는 100% 동일한데, 예를 들어 보자면, 예를 들어 보존적 돌연변이 - 예를 들어, 본 명세서에 기재된 돌연변이를 포함하거나 그에 더하여 - 로 대체되는 예시적인 서열의 잔기의 최대 1%, 2%, 5%, 10%, 15%, 또는 20%의 차이를 갖는다. 바람직한 실시 형태에서, 변이체는 모체의 원하는 활성, 예를 들어 β-갈락토시드 α-2,6-시알릴트랜스퍼라제 활성 또는 β-1,4-갈락토실트랜스퍼라제 활성을 보유한다.
2개의 핵산 서열의 % 동일성을 결정하기 위하여, 최적의 비교 목적을 위하여 서열들을 정렬시킨다(예를 들어, 최적 정렬을 위하여 제1 및 제2 아미노산 또는 핵산 서열 중 하나 또는 둘 모두에 갭(gap)이 도입될 수 있고, 비상동성 서열이 비교 목적을 위하여 무시될 수 있다). 비교 목적으로 정렬된 참조 서열의 길이는 참조 서열의 길이의 적어도 80%이고, 일부 실시 형태에서는 적어도 90% 또는 100%이다. 이어서, 상응하는 아미노산 위치 또는 뉴클레오티드 위치에 있는 뉴클레오티드들을 비교한다. 제1 서열 내의 위치가 제2 서열 내의 상응하는 위치와 동일한 뉴클레오티드에 의해 점유되는 경우, 이때 분자들은 그 위치에서 동일하다(본 명세서에 사용되는 바와 같이, 핵산 "동일성"은 핵산 "상동성"과 동등하다). 2개의 서열들 사이의 % 동일성은 서열들에 의해 공유되는 동일한 위치의 수의 함수이며, 이때 2개의 서열의 최적의 정렬을 위해 도입되어야 할 필요가 있는 갭의 수, 및 각각의 갭의 길이를 고려한다.
대상 폴리펩티드 또는 핵산 서열(즉, 질의)과 제2 폴리펩티드 또는 핵산 서열(즉, 표적) 사이의 % 동일성은 당업계의 기술 범위 내에 있는 다양한 방법으로, 예를 들어, 공개적으로 입수가능한 컴퓨터 소프트웨어, 예컨대 Smith Waterman Alignment(문헌[Smith, T. F. and M. S. Waterman (1981) J Mol Biol 147:195-7]); GeneMatcher Plus™(문헌[Schwarz and Dayhof (1979) Atlas of Protein Sequence and Structure, Dayhof, M.O., Ed, pp 353-358]) 내로 도입된 바와 같은 "BestFit"(문헌[Smith and Waterman, Advances in Applied Mathematics, 482-489 (1981)]); BLAST 프로그램(Basic Local Alignment Search Tool; (문헌[Altschul, S. F., W. Gish, et al. (1990) J Mol Biol 215: 403-10]), BLAST-2, BLAST-P, BLAST-N, BLAST-X, WU-BLAST-2, ALIGN, ALIGN-2, CLUSTAL, 또는 Megalign(DNASTAR) 소프트웨어를 사용하여 결정된다. 게다가, 당업자는 비교되는 서열들의 길이에 걸쳐 최대한의 정렬을 달성하는 데 필요한 임의의 알고리즘을 비롯하여, 정렬을 측정하기 위한 적절한 파라미터를 결정할 수 있다. 일반적으로, 표적 단백질 또는 핵산의 경우, 비교의 길이는 표적의 전장을 포함하여 최대 전장에 이르기까지의 임의의 길이(예를 들어, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 또는 100%)일 수 있다. 본 발명의 목적상, % 동일성은 질의 서열의 전장에 대해 나타낸 값이다.
본 발명의 목적상, 서열들의 비교 및 2개의 서열 사이의 % 동일성의 결정은 12의 갭 페널티, 4의 갭 연장 페널티, 및 5의 프레임시프트(frameshift) 갭 페널티를 갖는 Blossum 62 점수 행렬을 사용하여 달성될 수 있다.
보존적 치환은 전형적으로 하기 그룹 내에서의 치환을 포함한다: 글리신, 알라닌; 발린, 아이소류신, 류신; 아스파르트산, 글루탐산, 아스파라긴, 글루타민; 세린, 트레오닌; 라이신, 아르기닌; 및 페닐알라닌, 티로신.
융합 단백질
또한, 본 명세서에 기재된 바와 같은 효소(들) 또는 이의 일부분을 포함하는 융합 단백질(들)이 본 명세서에 제공된다.
일 실시 형태에서, 융합 단백질은 신호 서열을 포함한다. 일부 실시 형태에서, 신호 서열은 약 15 내지 약 20개의 아미노산 길이, 예를 들어 약 15, 16, 17, 18, 19, 또는 20개의 아미노산 길이이다. 일부 실시 형태에서, 신호 서열은 n-영역과 c-영역이 플랭킹된(flanked) 소수성 코어 영역(h-영역)을 포함한다. 일부 실시 형태에서, c-영역은 신호 펩티다제 컨센서스 절단 부위를 포함한다.
일부 실시 형태에서, 신호 서열은 N-말단 신호 서열이다.
일부 실시 형태에서, 신호 서열은 아주로시딘 신호 서열이다. 일부 실시 형태에서, 아주로시딘 신호 서열은 MTRLTVLALLAGLLASSRA(서열 번호 30)를 포함하거나 이로 이루어진다. 일부 실시 형태에서, 신호 서열은 혈청 알부민 신호 서열이다. 일부 실시 형태에서, 혈청 알부민 신호 서열은 MKWVTFISLLFLFSSAYS(서열 번호 46)를 포함하거나 이로 이루어진다. 일부 실시 형태에서, 신호 서열은 면역글로불린 중쇄 신호 서열이다. 일부 실시 형태에서, 면역글로불린 중쇄 신호 서열은 MDWTWRVFCLLAVTPGAHP(서열 번호 47)를 포함하거나 이로 이루어진다. 일부 실시 형태에서, 신호 서열은 면역글로불린 경쇄 신호 서열이다. 일부 실시 형태에서, 면역글로불린 경쇄 신호 서열은 MDWTWRVFCLLAVTPGAHP(서열 번호 48)를 포함하거나 이로 이루어진다.
일부 실시 형태에서, 신호 서열은 시스타틴-S 신호 서열이다. 일부 실시 형태에서, 시스타틴-S 신호 서열은 MARPLCTLLLLMATLAGALA(서열 번호 49)를 포함하거나 이로 이루어진다. 일부 실시 형태에서, 신호 서열은 Ig 카파 신호 서열이다. 일부 실시 형태에서, Ig 카파 신호 서열은 MDMRAPAGIFGFLLVLFPGYRS(서열 번호 50)를 포함하거나 이로 이루어진다. 일부 실시 형태에서, 신호 서열은 트립시니겐 2 신호 서열이다. 일부 실시 형태에서, 트립시노겐 2 신호 서열은 MRSLVFVLLIGAAFA(서열 번호 51)를 포함하거나 이로 이루어진다. 일부 실시 형태에서, 신호 서열은 칼륨 채널 차단제 신호 서열이다. 일부 실시 형태에서, 칼륨 채널 차단제 서열은 MSRLFVFILIALFLSAIIDVMS(서열 번호 52)를 포함하거나 이로 이루어진다.
일부 실시 형태에서, 신호 서열은 알파 코노톡신 Ip 1.3 신호 서열이다. 일부 실시 형태에서, 알파 코노톡신 Ip1.3 신호 서열은 MGMRMMFIMFMLVVLATTVVS(서열 번호 53)를 포함하거나 이로 이루어진다. 일부 실시 형태에서, 신호 서열은 알파-갈락토시다제 신호 서열이다. 일부 실시 형태에서, 알파-갈락토시다제 신호 서열은 MRAFLFLTACISLPGVFG(서열 번호 54) 포함하거나 이로 이루어진다. 일부 실시 형태에서, 신호 서열은 셀룰라제 신호 서열이다. 일부 실시 형태에서, 셀룰라제 신호 서열은 MKFQSTLLLAAAAGSALA(서열 번호 55)를 포함하거나 이로 이루어진다. 일부 실시 형태에서, 신호 서열은 아스파르트산 프로테이나제 네펜테신-1 신호 서열이다. 일부 실시 형태에서, 아스파르트산 프로테이나제 네펜테신-1 신호 서열은 MASSLYSFLLALSIVYIFVAPTHS(서열 번호 56)를 포함하거나 이로 이루어진다. 일부 실시 형태에서, 신호 서열은 산성 키티나제 신호 서열이다. 일부 실시 형태에서, 산성 키티나제 신호 서열은 MKTHYSSAILPILTLFVFLSINPSHG(서열 번호 57)를 포함하거나 이로 이루어진다. 일부 실시 형태에서, 신호 서열은 K28 프리프로-톡신 신호 서열이다. 일부 실시 형태에서, K28 프리프로-톡신 신호 서열은 MESVSSLFNIFSTIMVNYKSLVLALLSVSNLKYARG(서열 번호 58)를 포함하거나 이로 이루어진다. 일부 실시 형태에서, 신호 서열은 살해 독소 지고신(zygocin) 전구체 신호 서열이다. 일부 실시 형태에서, 살해 독소 지고신 전구체 신호 서열은 MKAAQILTASIVSLLPIYTSA(서열 번호 59)를 포함하거나 이로 이루어진다. 일부 실시 형태에서, 신호 서열은 콜레라 독소 신호 서열이다. 일부 실시 형태에서, 콜레라 독소 신호 서열은 MIKLKFGVFFTVLLSSAYA(서열 번호 60)를 포함하거나 이로 이루어진다. 일부 실시 형태에서, 신호 서열은 인간 성장 호르몬 신호 서열이다. 일부 실시 형태에서, 인간 성장 호르몬 신호 서열은 MATGSRTSLLLAFGLLCLPWLQEGSA(서열 번호 61)를 포함하거나 이로 이루어진다.
일부 실시 형태에서, 융합 단백질은 하나 이상의 친화성 태그(들)를 포함한다. 일부 실시 형태에서, 정제 태그는 폴리히스티딘, 글루타티온 S-트랜스퍼라제(GST), 말토스-결합 단백질(MBP), 키틴-결합 단백질, 스트렙타비딘 태그(예를 들어, Strep-Tag®, 예를 들어 Trp-Ser-His-Pro-Gln-Phe-Glu-Lys(서열 번호 31)), FLAG-태그(예를 들어, DYKDDDDK(서열 번호 32)), 비오틴 태그(예를 들어, AviTag™), 및 이들의 조합으로 이루어진 군으로부터 선택된다.
일부 실시 형태에서, 친화성 태그는 효소 또는 이의 일부분의 N-말단측을 향해 위치된다. 일부 실시 형태에서, 친화성 태그는 N-말단에 있다.
일부 실시 형태에서, 친화성 태그는 효소 또는 이의 일부분의 C-말단측을 향해 위치된다. 일부 실시 형태에서, 친화성 태그는 C-말단이다.
일부 실시 형태에서, 친화성 태그는 폴리히스티딘 태그이다. 일부 실시 형태에서, 폴리히스티딘 태그는 HHHH(서열 번호 11), HHHHH(서열 번호 12), HHHHHH(서열 번호 13), HHHHHHH(서열 번호 14), HHHHHHHH(서열 번호 15), HHHHHHHHH(서열 번호 16), 및 HHHHHHHHHH(서열 번호 17)로 이루어진 군으로부터 선택된다. 일부 실시 형태에서, 폴리히스티딘 태그는 헥사히스티딘 태그(예를 들어, HHHHHH(서열 번호 13))이다.
일부 실시 형태에서, 융합 단백질은 서열 번호 43, 서열 번호 44, 또는 서열 번호 45를 포함하거나 이로 이루어진다.
서열 번호 44
Figure pct00017
서열 번호 45
Figure pct00018
일부 실시 형태에서, 융합 단백질은 서열 번호 3 또는 서열 번호 5를 포함하거나 이로 이루어진다.
서열 번호 3
Figure pct00019
서열 번호 5
Figure pct00020
발현 시스템
본 명세서에 기재된 효소(들) 및/또는 융합 단백질(들)을 사용하기 위하여, 그들을 인코딩하는 핵산으로부터 그들을 발현시키는 것이 바람직할 수 있다. 이는 다양한 방식으로 수행될 수 있다. 예를 들어, 효소(들) 및/또는 융합 단백질(들)을 인코딩하는 핵산은 복제 및/또는 발현을 위하여 원핵 세포 또는 진핵 세포 내로의 형질전환을 위하여 중간 벡터 내로 클로닝될 수 있다. 중간 벡터는 전형적으로, 효소(들) 및/또는 융합 단백질(들)을 인코딩하는 핵산의 저장 또는 조작을 위한 원핵생물 벡터, 예를 들어 플라스미드, 또는 셔틀 벡터, 또는 온전한 벡터이다. 효소(들) 및/또는 융합 단백질(들)을 인코딩하는 핵산은 또한 식물 세포, 동물 세포, 바람직하게는 포유류 세포 또는 인간 세포, 진균 세포, 세균 세포, 또는 원생동물 세포에 투여하기 위해 발현 벡터 내로 클로닝될 수 있다.
발현을 얻기 위하여, 효소(들) 및/또는 융합 단백질(들)을 인코딩하는 서열은 전형적으로, 전사를 유도하기 위해 프로모터를 함유하는 발현 벡터 내로 하위클로닝된다. 적합한 세균성 프로모터 및 진핵생물 프로모터는 당업계에 잘 알려져 있으며, 예를 들어 문헌[Sambrook et al., Molecular Cloning, A Laboratory Manual (3d ed. 2001)]; 문헌[Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990)]; 및 문헌[Current Protocols in Molecular Biology (Ausubel et al., eds., 2010)]에 기재되어 있다. 조작된 단백질을 발현하기 위한 세균 발현 시스템은, 예를 들어 E. 콜라이(E. coli), 바실루스 종(Bacillus sp.), 및 살모넬라(Salmonella)에서 이용가능하다(문헌[Palva et al., 1983, Gene 22:229-235]). 그러한 발현 시스템을 위한 키트는 구매가능하다. 포유류 세포, 효모, 및 곤충 세포를 위한 진핵생물 발현 시스템은 당업계에 잘 알려져 있고, 또한 구매가능하다.
핵산의 발현을 유도하는 데 사용되는 프로모터는 특정 응용에 좌우된다. 예를 들어, 강한 구성적 프로모터는 전형적으로 융합 단백질의 발현 및 정제를 위해 사용된다.
일부 실시 형태에서, 프로모터는 인간 거대세포바이러스(CMV), EF-1 α(EF1A), 연장 인자 1α 짧은형(elongation factor 1α short, EFS), CMV 인핸서 닭 β-액틴 프로모터 및 토끼 β-글로빈 스플라이스 수용체 부위(CAG), 하이브리드 CBA(CBh), 비장 집중-형성 바이러스(SFFV), 뮤린 줄기 세포 바이러스(MSCV), 유인원 바이러스 40(SV40), 마우스 포스포글리세레이트 키나제 1(mPGK), 인간 포스포글리세레이트 키나제 1(mPGK), 및 유비퀴틴 C(UBC) 프로모터로 이루어진 군으로부터 선택된다. 일부 실시 형태에서, 프로모터는 인간 거대세포바이러스 프로모터(CMV)이다.
프로모터에 더하여, 발현 벡터는 전형적으로, 원핵생물 또는 진핵생물 중 어느 하나인 숙주 세포에서 핵산의 발현에 필요한 모든 추가의 요소를 함유하는 전사 단위 또는 발현 카세트를 함유한다. 따라서, 전형적인 발현 카세트는 작동가능하게 연결된 프로모터를 함유하는데, 이때 프로모터는, 예를 들어, 효소(들) 및/또는 융합 단백질(들), 및 예를 들어 전사체, 전사 종결, 리보솜 결합 부위, 또는 번역 종결의 효율적인 폴리아데닐화를 위해 필요한 임의의 신호를 인코딩하는 핵산 서열에 작동가능하게 연결된다. 카세트의 추가의 요소는, 예를 들어 인핸서, 및 이종성 스플라이싱된 인트론 신호를 포함할 수 있다.
일부 실시 형태에서, 발현 벡터는 마멋 간염 바이러스 전사 후 조절 요소(WPRE)를 포함한다. 예를 들어, 문헌[Zufferey et al., "Woodchuck Hepatitis Virus Posttranscriptional Regulatory Element Enhances Expression of Transgenes Delivered by Retroviral Vectors," Journal of Virology 73(4):2886-92 (1999)]을 참조한다.
유전자 정보를 세포 내로 수송하는 데 사용되는 특정 발현 벡터는 효소(들) 및/또는 융합 단백질(들)의 의도된 사용, 예를 들어 식물, 동물, 세균, 진균, 원생동물 등에서의 발현과 관련하여 선택된다.
표준 형질감염 방법을 사용하여 다량의 단백질을 발현하는 세균, 포유류, 효모 또는 곤충 세포주를 생성하고, 이어서 표준 기법을 사용하여 정제한다(예를 들어, 문헌[Colley et al., 1989, J. Biol. Chem., 264:17619-22; Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)] 참조). 진핵 세포 및 원핵 세포의 형질전환은 표준 기법에 따라 수행된다(예를 들어, 문헌[Morrison, 1977, J. Bacteriol. 132:349-351; Clark-Curtiss & Curtiss, Methods in Enzymology 101:347-362 (Wu et al., eds, 1983)] 참조).
외래 뉴클레오티드 서열을 숙주 세포 내로 도입하기 위한 것으로 알려진 임의의 절차가 사용될 수 있다. 이들은 인산칼슘 형질감염, 폴리브렌(polybrene), 원형질체 융합, 전기천공, 뉴클레오펙션, 리포좀, 현미주입, 외피 비보유(naked) DNA, 플라스미드 벡터, 바이러스 벡터(에피솜 및 통합적 둘 모두), 및 클로닝된 게놈 DNA, cDNA, 합성 DNA 또는 다른 외래 유전자 물질을 숙주 세포 내로 도입하기 위한 임의의 잘 알려진 다른 방법의 사용을 포함한다(예를 들어, 문헌[Sambrook et al., 상기 문헌] 참조). 사용된 특정 유전자 조작 절차는 효소(들) 및/또는 융합 단백질(들)을 발현할 수 있는 숙주 세포 내로 적어도 하나의 유전자를 성공적으로 도입할 수 있는 것만이 필요하다.
일부 실시 형태에서, 숙주 세포는 안정하게 형질전환된다.
일부 실시 형태에서, 숙주 세포는 비-저산소성(non-hypoxic) 조건 하에서 성장한다.
본 명세서에 기재된 효소(들) 및/또는 융합 단백질(들)은 당업계에 알려진 임의의 단백질 생성 시스템, 예컨대 숙주 세포 기반 발현 시스템, 합성 생물학 플랫폼, 또는 무세포 단백질 생성 플랫폼에 의해 생성될 수 있다. 일부 실시 형태에서, 단백질 생성 시스템은 번역 후 변형(들)이 가능할 수 있으며, 이에는 글리코실화, 예를 들어 N-글리코실화된 단백질, 이황화물 결합 형성, 및 티로신 인산화 중 하나 이상이 포함되지만 이로 한정되지 않는다. 예를 들어, 문헌[Boh and Ng, "Impact of Host Cell Line Choice on Glycan Profile," Critical Reviews in Biotechnology 38(6):851-67 (2018)]을 참조한다.
일부 실시 형태에서, 숙주 세포는 포유류 숙주 세포이다. 일부 실시 형태에서, 포유류 세포는 중국 햄스터 난소(CHO) 세포, 새끼 햄스터 신장(BHK) 세포, NS0 골수종 세포, Sp2/0 하이브리도마 마우스 세포, 인간 배아 신장 세포(HEK), HT-1080 인간 세포, 및 이들의 유도체로 이루어진 군으로부터 선택된다.
일부 실시 형태에서, 숙주 세포는 비인간 포유류 숙주 세포이다. 일부 실시 형태에서, 비인간 포유류 숙주 세포는 CHO 세포, BHK-21 세포, 뮤린 NS0 골수종 세포, Sp2/0 하이브리도마 세포, 및 이들의 유도체로부터 선택된다.
일부 실시 형태에서, 숙주 세포는 인간 포유류 숙주 세포이다. 일부 실시 형태에서, 인간 세포는 HEK, PER.C6, CAP(CEVEC's amniocyte production), AGE1.HM, HKB-11, HT-1080 세포, 및 이들의 유도체로 이루어진 군으로부터 선택된다.
일부 실시 형태에서, 숙주 세포는 인간 배아 신장 세포(HEK, ATCC® CRL-1573™) 또는 이의 유도체이다.
일부 실시 형태에서, HEK 세포는 SV40 T 항원의 온도 감수성 대립유전자를 발현한다. 일부 실시 형태에서, HEK 세포는 에틸메탄설포네이트(EMS) 돌연변이생성 후 리신(Ricin) 독소에 대해 저항성을 나타내고, 예를 들어 MGAT1 유전자에 의해 인코딩된 n-아세틸글루코사미닐트랜스퍼라제 I 활성이 결여되어 있다. 일부 실시 형태에서, HEK 세포는 주로, Man5GlcNAc2 N-글리칸을 사용하여 당단백질을 변형시킨다. 일부 실시 형태에서, HEK 세포는 tetR 억제인자를 발현하여, 테트라사이클린-유도성 단백질 발현을 가능하게 한다.
일부 실시 형태에서, HEK 유도체는 HEK293, HEK293T(293tsA1609neo, ATCC® CRL-3216™), HEK293T/17(ATCC® CRL-11268™), HEK293T/17 SF(ATCC® ACS-4500™), HEK293S, HEK293SG, HEK293FTM, HEK293SGGD, HEK293FTM, HEK293E, 및 HKB-11로 이루어진 군으로부터 선택된다.
합성 생물학 플랫폼, 예컨대 문헌[Kightlinger et al., "Synthetic Glycobiology: Parts, Systems, and Applications," ACS Synth. Biol. 9:1534-62 (2020)]에 기재된 것들이 또한 본 명세서에 기재된 효소(들) 및/또는 융합 단백질(들)을 생성하기에 적합하다.
또한, 벡터, 및 벡터를 포함하는 세포뿐만 아니라 본 명세서에 기재된 단백질 및 핵산을 포함하는 키트가, 예를 들어 본 명세서에 기재된 방법에 사용하기 위해, 본 명세서에 제공된다.
실시예
본 발명은 하기 실시예에서 추가로 설명되며, 이는 청구범위에 기재된 본 발명의 범주를 제한하지 않는다.
실시예 1: 과시알화된 IgG 제조
전체 분지형 글리칸의 60% 초과가 다이시알화된 IgG는 다음과 같이 제조될 수 있다.
간략하게 말하면, IgG 항체들의 혼합물을 β1,4 갈락토실트랜스퍼라제1(B4-GalT) 및 α2,6-시알릴트랜스퍼라제(ST6-Gal1) 효소를 사용하는 순차적 효소 반응에 노출시킨다. B4-GalT는 ST6-Gal1의 첨가 전에 반응으로부터 제거될 필요가 없고, 이들 효소 반응 사이에 생성물의 부분적인 또는 완전한 정제는 필요하지 않다.
갈락토실트랜스퍼라제 효소는 기존의 아스파라긴-연결된 글리칸에 갈락토스 잔기를 선택적으로 부가한다. 생성된 갈락토실화된 글리칸은 부착된 아스파라긴-연결된 글리칸 구조를 캡핑하기 위해 시알산 잔기를 선택적으로 부가하는 시알산 트랜스퍼라제 효소에 대한 기질로서의 역할을 한다. 따라서, 전체 시알화 반응은 2개의 당 뉴클레오티드(우리딘 5′-다이포스포갈락토스(UDPGal) 및 시티딘-5'-모노포스포-N-아세틸뉴라민산(CMP-NANA))를 사용하였다. 후자는 모노시알화된 생성물에 비해 다이시알화된 생성물을 증가시키기 위해 주기적으로 보충된다. 반응은 보조인자 염화망간을 포함한다.
IVIg로 출발하는 그러한 반응에 대한 IgG-Fc 글리칸 프로파일의 대표적인 예 및 반응 생성물이 도 4에 나타나 있다. 도 4에서, 좌측은 IgG를 hsIgG로 변환시키기 위한 효소적 시알화 반응의 개략도이고; 우측은 출발 IVIg 및 hsIgG에 대한 IgG Fc 글리칸 프로파일이다. 이 연구에서, 상이한 IgG 하위부류에 대한 글리칸 프로파일은 글리코펩티드(glycopeptide) 질량 분석법 분석을 통해 도출된다. 상이한 IgG 하위부류들에 대한 글리코펩티드를 정량화하는 데 사용된 펩티드 서열은 다음과 같았다: IgG1 = EEQYNSTYR(서열 번호 7), IgG2/3 EEQFNSTFR(서열 번호 8), IgG3/4 EEQYNSTFR (서열 번호 9) 및 EEQFNSTYR(서열 번호 10).
글리칸 데이터는 IgG 하위부류별로 나타나 있다. IgG3 및 IgG4 하위부류로부터의 글리칸은 개별적으로 정량화될 수 없다. 도시된 바와 같이, IVIg의 경우, 모든 시알화되지 않은 글리칸의 합은 80% 초과이고, 모든 시알화된 글리칸의 합은 20% 미만이다. 반응 생성물의 경우, 모든 시알화되지 않은 글리칸에 대한 합은 20% 미만이고 모든 시알화된 글리칸에 대한 합은 80% 초과이다. 글리코프로파일에 열거된 상이한 글리칸에 대한 명명법은 N-연결된 글리칸에 대한 옥스포드 표기법을 사용한다.
실시예 2: 대안적인 시알화 조건
예를 들어 50 mM BIS-TRIS(pH 6.9) 중에서, hsIgG를 생성하는 갈락토실화 및 시알화를 위한 대안적인 적합한 반응 조건은 하기를 포함한다: 다음과 같이 IgG 항체(예를 들어, 풀링된 IgG 항체, 풀링된 면역글로불린 또는 IVIg)의 갈락토실화를 수행하고: 7.4 mM MnCl2; 38 μmol UDP-Gal/g IgG 항체; 및 7.5 단위 B4GalT/g IgG 항체를 37℃에서 16 내지 24시간 인큐베이션함; 이어서 다음과 같이 시알화를 수행한다: 7.4 mM MnCl2 중에서; 220 μmol CMP-NANA/g IgG 항체(2회 첨가됨; 한 번은 반응의 출발 시점에서 첨가되고, 다시 9 내지 10시간 후에 첨가됨); 및 15 단위 ST6-Gal1/g IgG 항체를 37℃에서 30 내지 33시간 인큐베이션함. 이 반응은 ST6-Gal1 및 CMP-NANA를 갈락토실화 반응에 첨가함으로써 수행될 수 있다. 대안적으로, 모든 반응물은 개시 시점 및 CMP-NANA의 보충 시점에서 합해질 수 있다.
실시예 3: ST6Gal의 생성
ST6Gal의 효소적으로 활성인 부분을 포함하는 융합 단백질을 HEK 세포에서의 고수준 발현 및 정제 용이성을 위해 설계되었다. 서열 번호 6은 인간 ST6Gal의 일부분(서열 번호 4), 6 HIS 태그, 아주로시딘으로부터의 신호 서열(MTRLTVLALL AGLLASSRAGSSPLLD(서열 번호 31); 19개의 aa 신호가 밑줄 그어져 있음) 및 클로닝 과정으로부터 생성된 아미노산을 포함하는 미성숙 융합 단백질이다. 서열 번호 3은 분비된 형태이고, 서열 번호 5는 6 HIS 태그 및 ST6GalT 일부분을 포함한다.
서열 번호 6
Figure pct00021
서열 번호 3
Figure pct00022
서열 번호 4
Figure pct00023
서열 번호 5
Figure pct00024
HEK293 세포(Expi293F® 세포; Life Technologies)를 CMV 프로모터의 제어 하에서 서열 번호 6을 갖는 폴리펩티드를 발현하는 벡터로 안정하게 형질감염시켰다. ST6GalT 융합 단백질을 생성하기 위하여, 안정하게 형질감염되고 클론적으로 선택된 세포를 계수하고, 0.4E6개의 세포/mL의 세포 밀도로 일수 0에서 시딩하고, 37℃, 5% CO2, 130 내지 150 rpm으로 성장시켰다. 일수 4에서, 10% 글루코스/배지 공급물을 세포에 첨가하였다. 성장을 매일 모니터링하였다. 일수 7에서, 세포 상층액을 수합하고, 0.45 마이크로미터 필터, 그리고 이어서 0.2 마이크로미터 필터를 통해 멸균 여과하였다.
기타 실시 형태
본 발명이 이의 상세한 설명과 함께 기재되었지만, 전술한 설명은 예시하고자 하는 것이고, 첨부된 청구범위의 범주에 의해 규정되는 본 발명의 범주를 제한하고자 하는 것이 아님이 이해되어야 한다. 다른 태양, 이점, 및 변형이 하기 청구범위의 범주 내에 있다.
SEQUENCE LISTING <110> MOMENTA PHARMACEUTICALS, INC. <120> ENZYMES FOR SIALYLATION OF GLYCANS <130> 14131-0227WO1 <140> PCT/US2021/019607 <141> 2021-02-25 <150> 63/026,927 <151> 2020-05-19 <150> 62/981,293 <151> 2020-02-25 <160> 63 <170> PatentIn version 3.5 <210> 1 <400> 1 000 <210> 2 <400> 2 000 <210> 3 <211> 339 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 3 Gly Ser Ser Pro Leu Leu Asp Met Leu Glu His His His His His His 1 5 10 15 His His Met Ala Lys Pro Glu Ala Ser Phe Gln Val Trp Asn Lys Asp 20 25 30 Ser Ser Ser Lys Asn Leu Ile Pro Arg Leu Gln Lys Ile Trp Lys Asn 35 40 45 Tyr Leu Ser Met Asn Lys Tyr Lys Val Ser Tyr Lys Gly Pro Gly Pro 50 55 60 Gly Ile Lys Phe Ser Ala Glu Ala Leu Arg Cys His Leu Arg Asp His 65 70 75 80 Val Asn Val Ser Met Val Glu Val Thr Asp Phe Pro Phe Asn Thr Ser 85 90 95 Glu Trp Glu Gly Tyr Leu Pro Lys Glu Ser Ile Arg Thr Lys Ala Gly 100 105 110 Pro Trp Gly Arg Cys Ala Val Val Ser Ser Ala Gly Ser Leu Lys Ser 115 120 125 Ser Gln Leu Gly Arg Glu Ile Asp Asp His Asp Ala Val Leu Arg Phe 130 135 140 Asn Gly Ala Pro Thr Ala Asn Phe Gln Gln Asp Val Gly Thr Lys Thr 145 150 155 160 Thr Ile Arg Leu Met Asn Ser Gln Leu Val Thr Thr Glu Lys Arg Phe 165 170 175 Leu Lys Asp Ser Leu Tyr Asn Glu Gly Ile Leu Ile Val Trp Asp Pro 180 185 190 Ser Val Tyr His Ser Asp Ile Pro Lys Trp Tyr Gln Asn Pro Asp Tyr 195 200 205 Asn Phe Phe Asn Asn Tyr Lys Thr Tyr Arg Lys Leu His Pro Asn Gln 210 215 220 Pro Phe Tyr Ile Leu Lys Pro Gln Met Pro Trp Glu Leu Trp Asp Ile 225 230 235 240 Leu Gln Glu Ile Ser Pro Glu Glu Ile Gln Pro Asn Pro Pro Ser Ser 245 250 255 Gly Met Leu Gly Ile Ile Ile Met Met Thr Leu Cys Asp Gln Val Asp 260 265 270 Ile Tyr Glu Phe Leu Pro Ser Lys Arg Lys Thr Asp Val Cys Tyr Tyr 275 280 285 Tyr Gln Lys Phe Phe Asp Ser Ala Cys Thr Met Gly Ala Tyr His Pro 290 295 300 Leu Leu Tyr Glu Lys Asn Leu Val Lys His Leu Asn Gln Gly Thr Asp 305 310 315 320 Glu Asp Ile Tyr Leu Leu Gly Lys Ala Thr Leu Pro Gly Phe Arg Thr 325 330 335 Ile His Cys <210> 4 <211> 320 <212> PRT <213> Homo sapiens <400> 4 Ala Lys Pro Glu Ala Ser Phe Gln Val Trp Asn Lys Asp Ser Ser Ser 1 5 10 15 Lys Asn Leu Ile Pro Arg Leu Gln Lys Ile Trp Lys Asn Tyr Leu Ser 20 25 30 Met Asn Lys Tyr Lys Val Ser Tyr Lys Gly Pro Gly Pro Gly Ile Lys 35 40 45 Phe Ser Ala Glu Ala Leu Arg Cys His Leu Arg Asp His Val Asn Val 50 55 60 Ser Met Val Glu Val Thr Asp Phe Pro Phe Asn Thr Ser Glu Trp Glu 65 70 75 80 Gly Tyr Leu Pro Lys Glu Ser Ile Arg Thr Lys Ala Gly Pro Trp Gly 85 90 95 Arg Cys Ala Val Val Ser Ser Ala Gly Ser Leu Lys Ser Ser Gln Leu 100 105 110 Gly Arg Glu Ile Asp Asp His Asp Ala Val Leu Arg Phe Asn Gly Ala 115 120 125 Pro Thr Ala Asn Phe Gln Gln Asp Val Gly Thr Lys Thr Thr Ile Arg 130 135 140 Leu Met Asn Ser Gln Leu Val Thr Thr Glu Lys Arg Phe Leu Lys Asp 145 150 155 160 Ser Leu Tyr Asn Glu Gly Ile Leu Ile Val Trp Asp Pro Ser Val Tyr 165 170 175 His Ser Asp Ile Pro Lys Trp Tyr Gln Asn Pro Asp Tyr Asn Phe Phe 180 185 190 Asn Asn Tyr Lys Thr Tyr Arg Lys Leu His Pro Asn Gln Pro Phe Tyr 195 200 205 Ile Leu Lys Pro Gln Met Pro Trp Glu Leu Trp Asp Ile Leu Gln Glu 210 215 220 Ile Ser Pro Glu Glu Ile Gln Pro Asn Pro Pro Ser Ser Gly Met Leu 225 230 235 240 Gly Ile Ile Ile Met Met Thr Leu Cys Asp Gln Val Asp Ile Tyr Glu 245 250 255 Phe Leu Pro Ser Lys Arg Lys Thr Asp Val Cys Tyr Tyr Tyr Gln Lys 260 265 270 Phe Phe Asp Ser Ala Cys Thr Met Gly Ala Tyr His Pro Leu Leu Tyr 275 280 285 Glu Lys Asn Leu Val Lys His Leu Asn Gln Gly Thr Asp Glu Asp Ile 290 295 300 Tyr Leu Leu Gly Lys Ala Thr Leu Pro Gly Phe Arg Thr Ile His Cys 305 310 315 320 <210> 5 <211> 329 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 5 His His His His His His His His Met Ala Lys Pro Glu Ala Ser Phe 1 5 10 15 Gln Val Trp Asn Lys Asp Ser Ser Ser Lys Asn Leu Ile Pro Arg Leu 20 25 30 Gln Lys Ile Trp Lys Asn Tyr Leu Ser Met Asn Lys Tyr Lys Val Ser 35 40 45 Tyr Lys Gly Pro Gly Pro Gly Ile Lys Phe Ser Ala Glu Ala Leu Arg 50 55 60 Cys His Leu Arg Asp His Val Asn Val Ser Met Val Glu Val Thr Asp 65 70 75 80 Phe Pro Phe Asn Thr Ser Glu Trp Glu Gly Tyr Leu Pro Lys Glu Ser 85 90 95 Ile Arg Thr Lys Ala Gly Pro Trp Gly Arg Cys Ala Val Val Ser Ser 100 105 110 Ala Gly Ser Leu Lys Ser Ser Gln Leu Gly Arg Glu Ile Asp Asp His 115 120 125 Asp Ala Val Leu Arg Phe Asn Gly Ala Pro Thr Ala Asn Phe Gln Gln 130 135 140 Asp Val Gly Thr Lys Thr Thr Ile Arg Leu Met Asn Ser Gln Leu Val 145 150 155 160 Thr Thr Glu Lys Arg Phe Leu Lys Asp Ser Leu Tyr Asn Glu Gly Ile 165 170 175 Leu Ile Val Trp Asp Pro Ser Val Tyr His Ser Asp Ile Pro Lys Trp 180 185 190 Tyr Gln Asn Pro Asp Tyr Asn Phe Phe Asn Asn Tyr Lys Thr Tyr Arg 195 200 205 Lys Leu His Pro Asn Gln Pro Phe Tyr Ile Leu Lys Pro Gln Met Pro 210 215 220 Trp Glu Leu Trp Asp Ile Leu Gln Glu Ile Ser Pro Glu Glu Ile Gln 225 230 235 240 Pro Asn Pro Pro Ser Ser Gly Met Leu Gly Ile Ile Ile Met Met Thr 245 250 255 Leu Cys Asp Gln Val Asp Ile Tyr Glu Phe Leu Pro Ser Lys Arg Lys 260 265 270 Thr Asp Val Cys Tyr Tyr Tyr Gln Lys Phe Phe Asp Ser Ala Cys Thr 275 280 285 Met Gly Ala Tyr His Pro Leu Leu Tyr Glu Lys Asn Leu Val Lys His 290 295 300 Leu Asn Gln Gly Thr Asp Glu Asp Ile Tyr Leu Leu Gly Lys Ala Thr 305 310 315 320 Leu Pro Gly Phe Arg Thr Ile His Cys 325 <210> 6 <211> 357 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 6 Met Thr Arg Leu Thr Val Leu Ala Leu Leu Ala Gly Leu Leu Ala Ser 1 5 10 15 Ser Arg Ala Gly Ser Ser Pro Leu Leu Asp Met Leu Glu His His His 20 25 30 His His His His His Met Ala Lys Pro Glu Ala Ser Phe Gln Val Trp 35 40 45 Asn Lys Asp Ser Ser Ser Lys Asn Leu Ile Pro Arg Leu Gln Lys Ile 50 55 60 Trp Lys Asn Tyr Leu Ser Met Asn Lys Tyr Lys Val Ser Tyr Lys Gly 65 70 75 80 Pro Gly Pro Gly Ile Lys Phe Ser Ala Glu Ala Leu Arg Cys His Leu 85 90 95 Arg Asp His Val Asn Val Ser Met Val Glu Val Thr Asp Phe Pro Phe 100 105 110 Asn Thr Ser Glu Trp Glu Gly Tyr Leu Pro Lys Glu Ser Ile Arg Thr 115 120 125 Lys Ala Gly Pro Trp Gly Arg Cys Ala Val Val Ser Ser Gly Ser Leu 130 135 140 Lys Ser Ser Gln Leu Gly Arg Glu Ile Asp Asp His Asp Ala Val Leu 145 150 155 160 Arg Phe Asn Gly Ala Pro Thr Ala Asn Phe Gln Gln Asp Val Gly Thr 165 170 175 Lys Thr Thr Ile Arg Leu Met Asn Ser Gln Leu Val Thr Thr Glu Lys 180 185 190 Arg Phe Leu Lys Asp Ser Leu Tyr Asn Glu Gly Ile Leu Ile Val Trp 195 200 205 Asp Pro Ser Val Tyr His Ser Asp Ile Pro Lys Trp Tyr Gln Asn Pro 210 215 220 Asp Tyr Asn Phe Phe Asn Asn Tyr Lys Thr Tyr Arg Lys Leu His Pro 225 230 235 240 Asn Gln Pro Phe Tyr Ile Leu Lys Pro Gln Met Pro Trp Glu Leu Trp 245 250 255 Asp Ile Leu Gln Glu Ile Ser Pro Glu Glu Ile Gln Pro Asn Pro Pro 260 265 270 Ser Ser Gly Met Leu Gly Ile Ile Ile Met Met Thr Leu Cys Asp Gln 275 280 285 Val Asp Ile Tyr Glu Phe Leu Pro Ser Lys Arg Lys Thr Asp Val Cys 290 295 300 Tyr Tyr Tyr Gln Lys Phe Phe Asp Ser Ala Cys Thr Met Gly Ala Tyr 305 310 315 320 His Pro Leu Leu Tyr Glu Lys Asn Leu Val Lys His Leu Asn Gln Gly 325 330 335 Thr Asp Glu Asp Ile Tyr Leu Leu Gly Lys Ala Thr Leu Pro Gly Phe 340 345 350 Arg Thr Ile His Cys 355 <210> 7 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 7 Glu Glu Gln Tyr Asn Ser Thr Tyr Arg 1 5 <210> 8 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 8 Glu Glu Gln Phe Asn Ser Thr Phe Arg 1 5 <210> 9 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 9 Glu Glu Gln Tyr Asn Ser Thr Phe Arg 1 5 <210> 10 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 10 Glu Glu Gln Phe Asn Ser Thr Tyr Arg 1 5 <210> 11 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 11 His His His His 1 <210> 12 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 12 His His His His His 1 5 <210> 13 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 13 His His His His His His 1 5 <210> 14 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 14 His His His His His His His 1 5 <210> 15 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 15 His His His His His His His His 1 5 <210> 16 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 16 His His His His His His His His His 1 5 <210> 17 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 17 His His His His His His His His His His 1 5 10 <210> 18 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 18 His His His His His Met 1 5 <210> 19 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 19 His His His His His His Met 1 5 <210> 20 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 20 His His His His His His Met 1 5 <210> 21 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 21 His His His His His His His His Met 1 5 <210> 22 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 22 His His His His His His His His His Met 1 5 10 <210> 23 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 23 His His His His His His His His His His Met 1 5 10 <210> 24 <400> 24 000 <210> 25 <400> 25 000 <210> 26 <400> 26 000 <210> 27 <400> 27 000 <210> 28 <211> 406 <212> PRT <213> Homo sapiens <400> 28 Met Ile His Thr Asn Leu Lys Lys Lys Phe Ser Cys Cys Val Leu Val 1 5 10 15 Phe Leu Leu Phe Ala Val Ile Cys Val Trp Lys Glu Lys Lys Lys Gly 20 25 30 Ser Tyr Tyr Asp Ser Phe Lys Leu Gln Thr Lys Glu Phe Gln Val Leu 35 40 45 Lys Ser Leu Gly Lys Leu Ala Met Gly Ser Asp Ser Gln Ser Val Ser 50 55 60 Ser Ser Ser Thr Gln Asp Pro His Arg Gly Arg Gln Thr Leu Gly Ser 65 70 75 80 Leu Arg Gly Leu Ala Lys Ala Lys Pro Glu Ala Ser Phe Gln Val Trp 85 90 95 Asn Lys Asp Ser Ser Ser Lys Asn Leu Ile Pro Arg Leu Gln Lys Ile 100 105 110 Trp Lys Asn Tyr Leu Ser Met Asn Lys Tyr Lys Val Ser Tyr Lys Gly 115 120 125 Pro Gly Pro Gly Ile Lys Phe Ser Ala Glu Ala Leu Arg Cys His Leu 130 135 140 Arg Asp His Val Asn Val Ser Met Val Glu Val Thr Asp Phe Pro Phe 145 150 155 160 Asn Thr Ser Glu Trp Glu Gly Tyr Leu Pro Lys Glu Ser Ile Arg Thr 165 170 175 Lys Ala Gly Pro Trp Gly Arg Cys Ala Val Val Ser Ser Ala Gly Ser 180 185 190 Leu Lys Ser Ser Gln Leu Gly Arg Glu Ile Asp Asp His Asp Ala Val 195 200 205 Leu Arg Phe Asn Gly Ala Pro Thr Ala Asn Phe Gln Gln Asp Val Gly 210 215 220 Thr Lys Thr Thr Ile Arg Leu Met Asn Ser Gln Leu Val Thr Thr Glu 225 230 235 240 Lys Arg Phe Leu Lys Asp Ser Leu Tyr Asn Glu Gly Ile Leu Ile Val 245 250 255 Trp Asp Pro Ser Val Tyr His Ser Asp Ile Pro Lys Trp Tyr Gln Asn 260 265 270 Pro Asp Tyr Asn Phe Phe Asn Asn Tyr Lys Thr Tyr Arg Lys Leu His 275 280 285 Pro Asn Gln Pro Phe Tyr Ile Leu Lys Pro Gln Met Pro Trp Glu Leu 290 295 300 Trp Asp Ile Leu Gln Glu Ile Ser Pro Glu Glu Ile Gln Pro Asn Pro 305 310 315 320 Pro Ser Ser Gly Met Leu Gly Ile Ile Ile Met Met Thr Leu Cys Asp 325 330 335 Gln Val Asp Ile Tyr Glu Phe Leu Pro Ser Lys Arg Lys Thr Asp Val 340 345 350 Cys Tyr Tyr Tyr Gln Lys Phe Phe Asp Ser Ala Cys Thr Met Gly Ala 355 360 365 Tyr His Pro Leu Leu Tyr Glu Lys Asn Leu Val Lys His Leu Asn Gln 370 375 380 Gly Thr Asp Glu Asp Ile Tyr Leu Leu Gly Lys Ala Thr Leu Pro Gly 385 390 395 400 Phe Arg Thr Ile His Cys 405 <210> 29 <211> 175 <212> PRT <213> Homo sapiens <400> 29 Met Asn Ser Gln Leu Val Thr Thr Glu Lys Arg Phe Leu Lys Asp Ser 1 5 10 15 Leu Tyr Asn Glu Gly Ile Leu Ile Val Trp Asp Pro Ser Val Tyr His 20 25 30 Ser Asp Ile Pro Lys Trp Tyr Gln Asn Pro Asp Tyr Asn Phe Phe Asn 35 40 45 Asn Tyr Lys Thr Tyr Arg Lys Leu His Pro Asn Gln Pro Phe Tyr Ile 50 55 60 Leu Lys Pro Gln Met Pro Trp Glu Leu Trp Asp Ile Leu Gln Glu Ile 65 70 75 80 Ser Pro Glu Glu Ile Gln Pro Asn Pro Pro Ser Ser Gly Met Leu Gly 85 90 95 Ile Ile Ile Met Met Thr Leu Cys Asp Gln Val Asp Ile Tyr Glu Phe 100 105 110 Leu Pro Ser Lys Arg Lys Thr Asp Val Cys Tyr Tyr Tyr Gln Lys Phe 115 120 125 Phe Asp Ser Ala Cys Thr Met Gly Ala Tyr His Pro Leu Leu Tyr Glu 130 135 140 Lys Asn Leu Val Lys His Leu Asn Gln Gly Thr Asp Glu Asp Ile Tyr 145 150 155 160 Leu Leu Gly Lys Ala Thr Leu Pro Gly Phe Arg Thr Ile His Cys 165 170 175 <210> 30 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 30 Met Thr Arg Leu Thr Val Leu Ala Leu Leu Ala Gly Leu Leu Ala Ser 1 5 10 15 Ser Arg Ala <210> 31 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 31 Trp Ser His Pro Gln Phe Glu Lys 1 5 <210> 32 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 32 Asp Tyr Lys Asp Asp Asp Asp Lys 1 5 <210> 33 <400> 33 000 <210> 34 <211> 9 <212> PRT <213> Homo sapiens <400> 34 Met Ile His Thr Asn Leu Lys Lys Lys 1 5 <210> 35 <211> 17 <212> PRT <213> Homo sapiens <400> 35 Phe Ser Cys Cys Val Leu Val Phe Leu Leu Phe Ala Val Ile Cys Val 1 5 10 15 Trp <210> 36 <211> 380 <212> PRT <213> Homo sapiens <400> 36 Lys Glu Lys Lys Lys Gly Ser Tyr Tyr Asp Ser Phe Lys Leu Gln Thr 1 5 10 15 Lys Glu Phe Gln Val Leu Lys Ser Leu Gly Lys Leu Ala Met Gly Ser 20 25 30 Asp Ser Gln Ser Val Ser Ser Ser Ser Thr Gln Asp Pro His Arg Gly 35 40 45 Arg Gln Thr Leu Gly Ser Leu Arg Gly Leu Ala Lys Ala Lys Pro Glu 50 55 60 Ala Ser Phe Gln Val Trp Asn Lys Asp Ser Ser Ser Lys Asn Leu Ile 65 70 75 80 Pro Arg Leu Gln Lys Ile Trp Lys Asn Tyr Leu Ser Met Asn Lys Tyr 85 90 95 Lys Val Ser Tyr Lys Gly Pro Gly Pro Gly Ile Lys Phe Ser Ala Glu 100 105 110 Ala Leu Arg Cys His Leu Arg Asp His Val Asn Val Ser Met Val Glu 115 120 125 Val Thr Asp Phe Pro Phe Asn Thr Ser Glu Trp Glu Gly Tyr Leu Pro 130 135 140 Lys Glu Ser Ile Arg Thr Lys Ala Gly Pro Trp Gly Arg Cys Ala Val 145 150 155 160 Val Ser Ser Ala Gly Ser Leu Lys Ser Ser Gln Leu Gly Arg Glu Ile 165 170 175 Asp Asp His Asp Ala Val Leu Arg Phe Asn Gly Ala Pro Thr Ala Asn 180 185 190 Phe Gln Gln Asp Val Gly Thr Lys Thr Thr Ile Arg Leu Met Asn Ser 195 200 205 Gln Leu Val Thr Thr Glu Lys Arg Phe Leu Lys Asp Ser Leu Tyr Asn 210 215 220 Glu Gly Ile Leu Ile Val Trp Asp Pro Ser Val Tyr His Ser Asp Ile 225 230 235 240 Pro Lys Trp Tyr Gln Asn Pro Asp Tyr Asn Phe Phe Asn Asn Tyr Lys 245 250 255 Thr Tyr Arg Lys Leu His Pro Asn Gln Pro Phe Tyr Ile Leu Lys Pro 260 265 270 Gln Met Pro Trp Glu Leu Trp Asp Ile Leu Gln Glu Ile Ser Pro Glu 275 280 285 Glu Ile Gln Pro Asn Pro Pro Ser Ser Gly Met Leu Gly Ile Ile Ile 290 295 300 Met Met Thr Leu Cys Asp Gln Val Asp Ile Tyr Glu Phe Leu Pro Ser 305 310 315 320 Lys Arg Lys Thr Asp Val Cys Tyr Tyr Tyr Gln Lys Phe Phe Asp Ser 325 330 335 Ala Cys Thr Met Gly Ala Tyr His Pro Leu Leu Tyr Glu Lys Asn Leu 340 345 350 Val Lys His Leu Asn Gln Gly Thr Asp Glu Asp Ile Tyr Leu Leu Gly 355 360 365 Lys Ala Thr Leu Pro Gly Phe Arg Thr Ile His Cys 370 375 380 <210> 37 <211> 398 <212> PRT <213> Homo sapiens <400> 37 Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala Ala Met Pro Gly 1 5 10 15 Ala Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Ala Leu 20 25 30 His Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Ser 35 40 45 Arg Leu Pro Gln Leu Val Gly Val Ser Thr Pro Leu Gln Gly Gly Ser 50 55 60 Asn Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr Gly 65 70 75 80 Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg Pro 85 90 95 Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala Ser 100 105 110 Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu Pro 115 120 125 Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile Glu 130 135 140 Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro Asn 145 150 155 160 Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro His 165 170 175 Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu Lys 180 185 190 Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu Asp 195 200 205 Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn Arg 210 215 220 Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr Asp 225 230 235 240 Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn Asp 245 250 255 His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val Ala 260 265 270 Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe Gly Gly 275 280 285 Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe Pro 290 295 300 Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn Arg 305 310 315 320 Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala Val Val Gly 325 330 335 Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro Asn 340 345 350 Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu Ser 355 360 365 Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg Tyr 370 375 380 Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro Ser 385 390 395 <210> 38 <211> 385 <212> PRT <213> Homo sapiens <400> 38 Met Pro Gly Ala Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val 1 5 10 15 Cys Ala Leu His Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg 20 25 30 Asp Leu Ser Arg Leu Pro Gln Leu Val Gly Val Ser Thr Pro Leu Gln 35 40 45 Gly Gly Ser Asn Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly Glu Leu 50 55 60 Arg Thr Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln 65 70 75 80 Pro Arg Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly 85 90 95 Pro Ala Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu 100 105 110 Ser Leu Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met 115 120 125 Leu Ile Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln 130 135 140 Asn Pro Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val 145 150 155 160 Ser Pro His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu 165 170 175 His Leu Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln 180 185 190 Gln Leu Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile 195 200 205 Phe Asn Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys 210 215 220 Asp Tyr Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro 225 230 235 240 Met Asn Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile 245 250 255 Ser Val Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln Tyr 260 265 270 Phe Gly Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile Asn 275 280 285 Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Ile 290 295 300 Phe Asn Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn Ala 305 310 315 320 Val Val Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys Asn 325 330 335 Glu Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu Thr 340 345 350 Met Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp Val 355 360 365 Gln Arg Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr Pro 370 375 380 Ser 385 <210> 39 <211> 357 <212> PRT <213> Homo sapiens <400> 39 Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala Ala Met Pro Gly 1 5 10 15 Ala Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Ala Leu 20 25 30 His Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Ser 35 40 45 Arg Leu Pro Gln Leu Val Gly Val Ser Thr Pro Leu Gln Gly Gly Ser 50 55 60 Asn Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr Gly 65 70 75 80 Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg Pro 85 90 95 Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala Ser 100 105 110 Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu Pro 115 120 125 Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile Glu 130 135 140 Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro Asn 145 150 155 160 Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro His 165 170 175 Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu Lys 180 185 190 Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu Asp 195 200 205 Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn Arg 210 215 220 Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr Asp 225 230 235 240 Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn Asp 245 250 255 His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val Ala 260 265 270 Met Asp Lys Phe Gly Phe Arg Leu Val Phe Arg Gly Met Ser Ile Ser 275 280 285 Arg Pro Asn Ala Val Val Gly Arg Cys Arg Met Ile Arg His Ser Arg 290 295 300 Asp Lys Lys Asn Glu Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His 305 310 315 320 Thr Lys Glu Thr Met Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln 325 330 335 Val Leu Asp Val Gln Arg Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp 340 345 350 Ile Gly Thr Pro Ser 355 <210> 40 <211> 225 <212> PRT <213> Homo sapiens <400> 40 Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala Ala Met Pro Gly 1 5 10 15 Ala Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Ala Leu 20 25 30 His Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Ser 35 40 45 Arg Leu Pro Gln Leu Val Gly Val Ser Thr Pro Leu Gln Gly Gly Ser 50 55 60 Asn Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly Glu Leu Arg Thr Gly 65 70 75 80 Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser Gln Pro Arg Pro 85 90 95 Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro Gly Pro Ala Ser 100 105 110 Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala Leu Ser Leu Pro 115 120 125 Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile Glu 130 135 140 Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro Asn 145 150 155 160 Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro His 165 170 175 Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu Lys 180 185 190 Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu Asp 195 200 205 Tyr Gly Ile Tyr Val Ile Asn Gln Tyr Glu Lys Ile Arg Arg Leu Leu 210 215 220 Trp 225 <210> 41 <211> 24 <212> PRT <213> Homo sapiens <400> 41 Met Arg Leu Arg Glu Pro Leu Leu Ser Gly Ser Ala Ala Met Pro Gly 1 5 10 15 Ala Ser Leu Gln Arg Ala Cys Arg 20 <210> 42 <211> 20 <212> PRT <213> Homo sapiens <400> 42 Leu Leu Val Ala Val Cys Ala Leu His Leu Gly Val Thr Leu Val Tyr 1 5 10 15 Tyr Leu Ala Gly 20 <210> 43 <211> 290 <212> PRT <213> Homo sapiens <400> 43 Gly Pro Ala Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala 1 5 10 15 Leu Ser Leu Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro 20 25 30 Met Leu Ile Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys 35 40 45 Gln Asn Pro Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys 50 55 60 Val Ser Pro His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln 65 70 75 80 Glu His Leu Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg 85 90 95 Gln Gln Leu Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr 100 105 110 Ile Phe Asn Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu 115 120 125 Lys Asp Tyr Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile 130 135 140 Pro Met Asn Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His 145 150 155 160 Ile Ser Val Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln 165 170 175 Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile 180 185 190 Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp 195 200 205 Ile Phe Asn Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn 210 215 220 Ala Val Val Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys 225 230 235 240 Asn Glu Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu 245 250 255 Thr Met Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp 260 265 270 Val Gln Arg Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr 275 280 285 Pro Ser 290 <210> 44 <211> 293 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 44 Gly Pro Ala Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala 1 5 10 15 Leu Ser Leu Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro 20 25 30 Met Leu Ile Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys 35 40 45 Gln Asn Pro Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys 50 55 60 Val Ser Pro His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln 65 70 75 80 Glu His Leu Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg 85 90 95 Gln Gln Leu Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr 100 105 110 Ile Phe Asn Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu 115 120 125 Lys Asp Tyr Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile 130 135 140 Pro Met Asn Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His 145 150 155 160 Ile Ser Val Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln 165 170 175 Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile 180 185 190 Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp 195 200 205 Ile Phe Asn Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn 210 215 220 Ala Val Val Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys 225 230 235 240 Asn Glu Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu 245 250 255 Thr Met Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp 260 265 270 Val Gln Arg Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr 275 280 285 Pro Ser Pro Arg Asp 290 <210> 45 <211> 308 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 45 Gly Ser Ser Pro Leu Leu Asp Met Gly Pro Ala Ser Asn Leu Thr Ser 1 5 10 15 Val Pro Val Pro His Thr Thr Ala Leu Ser Leu Pro Ala Cys Pro Glu 20 25 30 Glu Ser Pro Leu Leu Val Gly Pro Met Leu Ile Glu Phe Asn Met Pro 35 40 45 Val Asp Leu Glu Leu Val Ala Lys Gln Asn Pro Asn Val Lys Met Gly 50 55 60 Gly Arg Tyr Ala Pro Arg Asp Cys Val Ser Pro His Lys Val Ala Ile 65 70 75 80 Ile Ile Pro Phe Arg Asn Arg Gln Glu His Leu Lys Tyr Trp Leu Tyr 85 90 95 Tyr Leu His Pro Val Leu Gln Arg Gln Gln Leu Asp Tyr Gly Ile Tyr 100 105 110 Val Ile Asn Gln Ala Gly Asp Thr Ile Phe Asn Arg Ala Lys Leu Leu 115 120 125 Asn Val Gly Phe Gln Glu Ala Leu Lys Asp Tyr Asp Tyr Thr Cys Phe 130 135 140 Val Phe Ser Asp Val Asp Leu Ile Pro Met Asn Asp His Asn Ala Tyr 145 150 155 160 Arg Cys Phe Ser Gln Pro Arg His Ile Ser Val Ala Met Asp Lys Phe 165 170 175 Gly Phe Ser Leu Pro Tyr Val Gln Tyr Phe Gly Gly Val Ser Ala Leu 180 185 190 Ser Lys Gln Gln Phe Leu Thr Ile Asn Gly Phe Pro Asn Asn Tyr Trp 195 200 205 Gly Trp Gly Gly Glu Asp Asp Asp Ile Phe Asn Arg Leu Val Phe Arg 210 215 220 Gly Met Ser Ile Ser Arg Pro Asn Ala Val Val Gly Arg Cys Arg Met 225 230 235 240 Ile Arg His Ser Arg Asp Lys Lys Asn Glu Pro Asn Pro Gln Arg Phe 245 250 255 Asp Arg Ile Ala His Thr Lys Glu Thr Met Leu Ser Asp Gly Leu Asn 260 265 270 Ser Leu Thr Tyr Gln Val Leu Asp Val Gln Arg Tyr Pro Leu Tyr Thr 275 280 285 Gln Ile Thr Val Asp Ile Gly Thr Pro Ser Pro Arg Asp His His His 290 295 300 His His His His 305 <210> 46 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 46 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser <210> 47 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 47 Met Asp Trp Thr Trp Arg Val Phe Cys Leu Leu Ala Val Thr Pro Gly 1 5 10 15 Ala His Pro <210> 48 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 48 Met Asp Trp Thr Trp Arg Val Phe Cys Leu Leu Ala Val Thr Pro Gly 1 5 10 15 Ala His Pro <210> 49 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 49 Met Ala Arg Pro Leu Cys Thr Leu Leu Leu Leu Met Ala Thr Leu Ala 1 5 10 15 Gly Ala Leu Ala 20 <210> 50 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 50 Met Asp Met Arg Ala Pro Ala Gly Ile Phe Gly Phe Leu Leu Val Leu 1 5 10 15 Phe Pro Gly Tyr Arg Ser 20 <210> 51 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 51 Met Arg Ser Leu Val Phe Val Leu Leu Ile Gly Ala Ala Phe Ala 1 5 10 15 <210> 52 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 52 Met Ser Arg Leu Phe Val Phe Ile Leu Ile Ala Leu Phe Leu Ser Ala 1 5 10 15 Ile Ile Asp Val Met Ser 20 <210> 53 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 53 Met Gly Met Arg Met Met Phe Ile Met Phe Met Leu Val Val Leu Ala 1 5 10 15 Thr Thr Val Val Ser 20 <210> 54 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 54 Met Arg Ala Phe Leu Phe Leu Thr Ala Cys Ile Ser Leu Pro Gly Val 1 5 10 15 Phe Gly <210> 55 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 55 Met Lys Phe Gln Ser Thr Leu Leu Leu Ala Ala Ala Ala Gly Ser Ala 1 5 10 15 Leu Ala <210> 56 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 56 Met Ala Ser Ser Leu Tyr Ser Phe Leu Leu Ala Leu Ser Ile Val Tyr 1 5 10 15 Ile Phe Val Ala Pro Thr His Ser 20 <210> 57 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 57 Met Lys Thr His Tyr Ser Ser Ala Ile Leu Pro Ile Leu Thr Leu Phe 1 5 10 15 Val Phe Leu Ser Ile Asn Pro Ser His Gly 20 25 <210> 58 <211> 36 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 58 Met Glu Ser Val Ser Ser Leu Phe Asn Ile Phe Ser Thr Ile Met Val 1 5 10 15 Asn Tyr Lys Ser Leu Val Leu Ala Leu Leu Ser Val Ser Asn Leu Lys 20 25 30 Tyr Ala Arg Gly 35 <210> 59 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 59 Met Lys Ala Ala Gln Ile Leu Thr Ala Ser Ile Val Ser Leu Leu Pro 1 5 10 15 Ile Tyr Thr Ser Ala 20 <210> 60 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 60 Met Ile Lys Leu Lys Phe Gly Val Phe Phe Thr Val Leu Leu Ser Ser 1 5 10 15 Ala Tyr Ala <210> 61 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 61 Met Ala Thr Gly Ser Arg Thr Ser Leu Leu Leu Ala Phe Gly Leu Leu 1 5 10 15 Cys Leu Pro Trp Leu Gln Glu Gly Ser Ala 20 25 <210> 62 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 62 Met Thr Arg Leu Thr Val Leu Ala Leu Leu Ala Gly Leu Leu Ala Ser 1 5 10 15 Ser Arg Ala Gly Ser Ser Pro Leu Leu Asp 20 25 <210> 63 <211> 354 <212> PRT <213> Homo sapiens <400> 63 Arg Asp Leu Ser Arg Leu Pro Gln Leu Val Gly Val Ser Thr Pro Leu 1 5 10 15 Gln Gly Gly Ser Asn Ser Ala Ala Ala Ile Gly Gln Ser Ser Gly Glu 20 25 30 Leu Arg Thr Gly Gly Ala Arg Pro Pro Pro Pro Leu Gly Ala Ser Ser 35 40 45 Gln Pro Arg Pro Gly Gly Asp Ser Ser Pro Val Val Asp Ser Gly Pro 50 55 60 Gly Pro Ala Ser Asn Leu Thr Ser Val Pro Val Pro His Thr Thr Ala 65 70 75 80 Leu Ser Leu Pro Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro 85 90 95 Met Leu Ile Glu Phe Asn Met Pro Val Asp Leu Glu Leu Val Ala Lys 100 105 110 Gln Asn Pro Asn Val Lys Met Gly Gly Arg Tyr Ala Pro Arg Asp Cys 115 120 125 Val Ser Pro His Lys Val Ala Ile Ile Ile Pro Phe Arg Asn Arg Gln 130 135 140 Glu His Leu Lys Tyr Trp Leu Tyr Tyr Leu His Pro Val Leu Gln Arg 145 150 155 160 Gln Gln Leu Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Asp Thr 165 170 175 Ile Phe Asn Arg Ala Lys Leu Leu Asn Val Gly Phe Gln Glu Ala Leu 180 185 190 Lys Asp Tyr Asp Tyr Thr Cys Phe Val Phe Ser Asp Val Asp Leu Ile 195 200 205 Pro Met Asn Asp His Asn Ala Tyr Arg Cys Phe Ser Gln Pro Arg His 210 215 220 Ile Ser Val Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln 225 230 235 240 Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Thr Ile 245 250 255 Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp 260 265 270 Ile Phe Asn Arg Leu Val Phe Arg Gly Met Ser Ile Ser Arg Pro Asn 275 280 285 Ala Val Val Gly Arg Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys 290 295 300 Asn Glu Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu 305 310 315 320 Thr Met Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Gln Val Leu Asp 325 330 335 Val Gln Arg Tyr Pro Leu Tyr Thr Gln Ile Thr Val Asp Ile Gly Thr 340 345 350 Pro Ser

Claims (51)

  1. 융합 단백질로서,
    N-말단 신호 서열; 및
    인간 알파-2,6-시알릴트랜스퍼라제 1(ST6Gal1)의 효소적으로 활성인 부분을 포함하는, 융합 단백질.
  2. 제1항에 있어서, 상기 ST6Gal1의 효소적으로 활성인 부분은 서열 번호 4를 포함하는, 융합 단백질.
  3. 제2항에 있어서, 상기 ST6Gal1의 효소적으로 활성인 부분은 서열 번호 4로 이루어진, 융합 단백질.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 신호 서열은 N-말단 아주로시딘 신호 서열인, 융합 단백질.
  5. 제4항에 있어서, 상기 아주로시딘 신호 서열은 MTRLTVLALLAGLLASSRA(서열 번호 30)를 포함하는, 융합 단백질.
  6. 제4항에 있어서, 상기 아주로시딘 신호 서열은 MTRLTVLALLAGLLASSRA(서열 번호 30)로 이루어진, 융합 단백질.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 친화성 태그를 추가로 포함하는, 융합 단백질.
  8. 제7항에 있어서, 상기 친화성 태그는 폴리히스티딘, 글루타티온 S-트랜스퍼라제(GST), 말토스-결합 단백질(MBP), 키틴-결합 단백질, 스트렙타비딘 태그(예를 들어, Trp-Ser-His-Pro-Gln-Phe-Glu-Lys(서열 번호 31)), FLAG-태그(예를 들어, DYKDDDDK(서열 번호 32)), 비오틴 태그, 및 이들의 조합으로 이루어진 군으로부터 선택되는, 융합 단백질.
  9. 제8항에 있어서, 상기 폴리히스티딘 태그는 HHHH(서열 번호 11), HHHHH(서열 번호 12), HHHHHH(서열 번호 13), HHHHHHH(서열 번호 14), HHHHHHHH(서열 번호 15), HHHHHHHHH(서열 번호 16), 및 HHHHHHHHHH(서열 번호 17)로 이루어진 군으로부터 선택되는, 융합 단백질.
  10. 제7항 내지 제9항 중 어느 한 항에 있어서, 상기 친화성 태그는 상기 ST6Gal1의 효소적으로 활성인 부분의 N-말단측을 향해 위치되는, 융합 단백질.
  11. 제1항에 있어서, 상기 N-말단 신호 서열은 MTRLTVLALLAGLLASSRA(서열 번호 30)를 포함하고, 상기 ST6Gal1의 효소적으로 활성인 부분은 서열 번호 4를 포함하는, 융합 단백질.
  12. 제11항에 있어서, 헥사히스티딘 태그를 추가로 포함하는, 융합 단백질.
  13. 제12항에 있어서, 상기 헥사히스티딘 태그는 상기 N-말단 신호 서열과 상기 ST6Gal1의 효소적으로 활성인 부분 사이에 있는, 융합 단백질.
  14. 제13항에 있어서, 서열 번호 6으로 이루어진, 융합 단백질.
  15. 제1항 내지 제14항 중 어느 한 항의 융합 단백질을 인코딩하는 핵산 분자.
  16. 제15항의 핵산 분자를 포함하는 벡터.
  17. 제16항에 있어서, 상기 융합 단백질을 인코딩하는 핵산에 작동가능하게 연결된 프로모터를 추가로 포함하는, 벡터.
  18. 제16항에 있어서, 상기 프로모터는 거대세포바이러스(CMV) 프로모터인, 벡터.
  19. 제16항의 벡터에 의해 안정하게 형질전환된 숙주 세포.
  20. 제17항에 있어서, 상기 세포는 인간 배아 신장(HEK) 세포 또는 이의 유도체인, 숙주 세포.
  21. 제20항에 있어서, 상기 세포는 HEK 유도체 HEK293인, 숙주 세포.
  22. 폴리펩티드의 생성 방법으로서,
    융합 단백질의 발현이 허용되는 조건 하에서 배양 배지 중에서 제19항 내지 제21항 중 어느 한 항의 숙주 세포를 배양하는 단계; 및
    상기 배양 배지로부터 상기 융합 단백질을 단리하는 단계를 포함하는, 방법.
  23. 융합 단백질로서,
    N-말단 신호 서열; 및
    인간 베타-1,4-갈락토실트랜스퍼라제(B4GalT1)의 효소적으로 활성인 부분을 포함하는, 융합 단백질.
  24. 제23항에 있어서, 상기 B4GalT1의 효소적으로 활성인 부분은 서열 번호 43을 포함하는, 융합 단백질.
  25. 제23항에 있어서, 상기 B4GalT1의 효소적으로 활성인 부분은 서열 번호 43으로 이루어진, 융합 단백질.
  26. 제23항 내지 제25항 중 어느 한 항에 있어서, 상기 신호 서열은 N-말단 아주로시딘 신호 서열인, 융합 단백질.
  27. 제23항에 있어서, 상기 아주로시딘 신호 서열은 MTRLTVLALLAGLLASSRA(서열 번호 30)를 포함하는, 융합 단백질.
  28. 제23항에 있어서, 상기 아주로시딘 신호 서열은 MTRLTVLALLAGLLASSRA(서열 번호 30)로 이루어진, 융합 단백질.
  29. 제23항 내지 제28항 중 어느 한 항에 있어서, 친화성 태그를 추가로 포함하는, 융합 단백질.
  30. 제29항에 있어서, 상기 친화성 태그는 폴리히스티딘, 글루타티온 S-트랜스퍼라제(GST), 말토스-결합 단백질(MBP), 키틴-결합 단백질, 스트렙타비딘 태그(예를 들어, Trp-Ser-His-Pro-Gln-Phe-Glu-Lys(서열 번호 31)), FLAG-태그(예를 들어, DYKDDDDK(서열 번호 32)), 비오틴 태그, 및 이들의 조합으로 이루어진 군으로부터 선택되는, 융합 단백질.
  31. 제30항에 있어서, 상기 폴리히스티딘 태그는 HHHH(서열 번호 11), HHHHH(서열 번호 12), HHHHHH(서열 번호 13), HHHHHHH(서열 번호 14), HHHHHHHH(서열 번호 15), HHHHHHHHH(서열 번호 16), 및 HHHHHHHHHH(서열 번호 17)로 이루어진 군으로부터 선택되는, 융합 단백질.
  32. 제23항 내지 제31항 중 어느 한 항에 있어서, 상기 친화성 태그는 상기 B4GalT1의 효소적으로 활성인 부분의 C-말단측을 향해 위치되는, 융합 단백질.
  33. 제23항에 있어서, 상기 N-말단 신호 서열은 MTRLTVLALLAGLLASSRA(서열 번호 30)를 포함하고, 상기 B4GalT1의 효소적으로 활성인 부분은 서열 번호 43을 포함하는, 융합 단백질.
  34. 제33항에 있어서, 셉타히스티딘 태그를 추가로 포함하는, 융합 단백질.
  35. 제34항에 있어서, 상기 셉타히스티딘 태그는 C-말단에 있는, 융합 단백질.
  36. 제35항에 있어서, 서열 번호 45로 이루어진, 융합 단백질.
  37. 제23항 내지 제36항 중 어느 한 항의 융합 단백질을 인코딩하는 핵산 분자.
  38. 제37항의 핵산 분자를 포함하는 벡터.
  39. 제38항에 있어서, 상기 융합 단백질을 인코딩하는 핵산에 작동가능하게 연결된 프로모터를 추가로 포함하는, 벡터.
  40. 제39항에 있어서, 상기 프로모터는 거대세포바이러스(CMV) 프로모터인, 벡터.
  41. 제16항의 벡터에 의해 안정하게 형질전환된 숙주 세포.
  42. 제41항에 있어서, 상기 세포는 인간 배아 신장(HEK) 세포 또는 이의 유도체인, 숙주 세포.
  43. 제42항에 있어서, 상기 세포는 HEK 유도체 HEK293인, 숙주 세포.
  44. 폴리펩티드의 생성 방법으로서,
    융합 단백질의 발현이 허용되는 조건 하에서 배양 배지 중에서 제41항 내지 제43항 중 어느 한 항의 숙주 세포를 배양하는 단계; 및
    상기 배양 배지로부터 상기 융합 단백질을 단리하는 단계를 포함하는, 방법.
  45. 면역글로불린 G(IgG) 항체를 시알화하는 방법으로서,
    a) IgG 항체를 포함하는 조성물을 제공하는 단계;
    b) 상기 조성물을 UDP-Gal 및 CMP-NANA의 존재 하에서 β1,4-갈락토실트랜스퍼라제 1 및 서열 번호 4를 포함하는 ST6Gal1의 효소적으로 활성인 부분에 노출시킴으로써, 시알화된 IgG(sIgG)를 포함하는 조성물을 생성하는 단계를 포함하는, 방법.
  46. 면역글로불린 G(IgG) 항체를 시알화하는 방법으로서,
    a) IgG 항체를 포함하는 조성물을 제공하는 단계;
    b) 상기 IgG 항체를 UDP-Gal의 존재 하에서 β1,4-갈락토실트랜스퍼라제 1에 노출시킴으로써, 갈락토실화된 IgG 항체를 포함하는 조성물을 생성하는 단계; 및
    c) 갈락토실화된 IgG 항체를 포함하는 상기 조성물을 CMP-NANA의 존재 하에서 서열 번호 4를 포함하는 ST6Gal1의 효소적으로 활성인 부분에 노출시킴으로써, 시알화된 IgG(sIgG)를 포함하는 조성물을 생성하는 단계를 포함하는, 방법.
  47. 제46항에 있어서, 갈락토실화된 IgG 항체를 포함하는 상기 조성물은 단계 (c) 전에 정제되지 않는, 방법.
  48. 제45항 내지 제47항 중 어느 한 항에 있어서, 상기 조성물들 중 하나 이상을 CMP-NANA로 보충하는 단계를 추가로 포함하는, 방법.
  49. 제45항 내지 제48항 중 어느 한 항에 있어서, IgG 항체들의 혼합물은 IgG1, IgG2, IgG3, IgG4, 및 이들의 조합으로 이루어진 군으로부터 선택되는, 방법.
  50. 제45항 또는 제46항에 있어서, sIgG를 포함하는 상기 조성물 내의 상기 항체의 Fc 영역 상의 분지형 글리칸의 적어도 60%는 다이-시알화되는, 방법.
  51. 제45항 또는 제46항에 있어서, sIgG를 포함하는 상기 조성물 내의 상기 항체의 Fc 영역 상의 분지형 글리칸의 50% 미만은 모노-시알화되는, 방법.
KR1020227033078A 2020-02-25 2021-02-25 글리칸의 시알화를 위한 효소 KR20220145877A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202062981293P 2020-02-25 2020-02-25
US62/981,293 2020-02-25
US202063026927P 2020-05-19 2020-05-19
US63/026,927 2020-05-19
PCT/US2021/019607 WO2021173797A1 (en) 2020-02-25 2021-02-25 Enzymes for sialylation of glycans

Publications (1)

Publication Number Publication Date
KR20220145877A true KR20220145877A (ko) 2022-10-31

Family

ID=77490192

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227033078A KR20220145877A (ko) 2020-02-25 2021-02-25 글리칸의 시알화를 위한 효소

Country Status (11)

Country Link
US (1) US20230303984A1 (ko)
EP (1) EP4110391A1 (ko)
JP (1) JP2023515554A (ko)
KR (1) KR20220145877A (ko)
CN (1) CN115605230A (ko)
AU (1) AU2021226352A1 (ko)
BR (1) BR112022016948A2 (ko)
CA (1) CA3173252A1 (ko)
CO (1) CO2022013638A2 (ko)
MX (1) MX2022010467A (ko)
WO (1) WO2021173797A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240043838A (ko) * 2022-09-27 2024-04-04 크리포 주식회사 주요 아미노산이 전하성 및 소수성 아미노산으로 구성된 비정형 펩타이드 태그를 포함하여 자가 조립체를 형성하는 융합 단백질 및 이를 이용하여 재조합 단백질을 정제하는 방법

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7094579B2 (en) * 2002-02-13 2006-08-22 Xoma Technology Ltd. Eukaryotic signal sequences for prokaryotic expression
ATE527371T1 (de) * 2005-03-24 2011-10-15 Biogenerix Ag Expression löslicher, aktiver, eukaryotischer glucosyltransferasen in prokaryotischen organismen
EP2900264A4 (en) * 2012-09-26 2016-05-25 Momenta Pharmaceuticals Inc GLYKOPROTEINZUBEREITUNGEN
EP2821482A1 (en) * 2013-07-05 2015-01-07 Roche Diagniostics GmbH N-terminally truncated glycosyltransferases
EP2824176A1 (en) * 2013-07-11 2015-01-14 Siamed'xpress Methods for producing sialylated therapeutic proteins
EP3083977B1 (en) * 2013-12-20 2018-02-28 F. Hoffmann-La Roche AG Improved recombinant polypeptide production methods
SG11201808457PA (en) * 2016-04-15 2018-10-30 Alpine Immune Sciences Inc Icos ligand variant immunomodulatory proteins and uses thereof
US11674125B2 (en) * 2017-12-18 2023-06-13 The General Hospital Corporation Glycoengineering

Also Published As

Publication number Publication date
AU2021226352A1 (en) 2022-09-29
EP4110391A1 (en) 2023-01-04
JP2023515554A (ja) 2023-04-13
CO2022013638A2 (es) 2022-10-21
US20230303984A1 (en) 2023-09-28
CN115605230A (zh) 2023-01-13
CA3173252A1 (en) 2021-09-02
BR112022016948A2 (pt) 2022-11-22
WO2021173797A1 (en) 2021-09-02
MX2022010467A (es) 2022-12-15

Similar Documents

Publication Publication Date Title
KR101589554B1 (ko) 원핵생물에서의 글리코실화 단백질 발현
KR101545914B1 (ko) 특수화된 글리칸 구조를 함유하는 분자의 생산 방법
JP4496086B2 (ja) タンパク質製造のための哺乳類細胞培養方法を用いる生成物品質の増大
US9809835B2 (en) Quantitative control of sialylation
US20230073926A1 (en) Highly sialylated multimeric binding molecules
Lim et al. The Golgi CMP-sialic acid transporter: a new CHO mutant provides functional insights
JP2019088306A (ja) Cmp依存性シアリダーゼ活性
CA2911965A1 (en) Process for the mono- and bi-sialylation of glycoproteins employing n-terminally truncated beta-galactoside alpha-2,6-sialyltransferase mutants
US20230303984A1 (en) Enzymes for Sialylation of Glycans
Mizutani et al. Genetic modification of a chicken expression system for the galactosylation of therapeutic proteins produced in egg white
CN105431530A (zh) N末端截短的糖基转移酶
US20230192814A1 (en) Hyper-sialylated immunoglobulin
US20230374062A1 (en) Methods of making hyper-sialylated immunoglobulin
Donadio-Andréi et al. Glycoengineering of protein-based therapeutics
Ullrich et al. Check for updates Chapter 18
Wenzel et al. Cell-free N-glycosylation of peptides using synthetic lipid-linked hybrid and complex N-glycans
KR20230012560A (ko) 과시알화된 IgG의 제조 및 정제
YANG Applications of a Novel CHO Glycosylation Mutant
Wildt et al. An alternative approach: Humanization of N-glycosylation pathways in yeast
Calabro et al. Glycoengineering of protein-based
Kumar Posttranslational modifications in soluble recombinant therapeutical proteins secreted by lower aukaryotes: structure and function