KR20240032972A - 위치 선택적 다이메틸화에 의한 단백질 n-말단 신규 서열분석 - Google Patents

위치 선택적 다이메틸화에 의한 단백질 n-말단 신규 서열분석 Download PDF

Info

Publication number
KR20240032972A
KR20240032972A KR1020247004479A KR20247004479A KR20240032972A KR 20240032972 A KR20240032972 A KR 20240032972A KR 1020247004479 A KR1020247004479 A KR 1020247004479A KR 20247004479 A KR20247004479 A KR 20247004479A KR 20240032972 A KR20240032972 A KR 20240032972A
Authority
KR
South Korea
Prior art keywords
dimethylation
protein
terminal
cells
mixture
Prior art date
Application number
KR1020247004479A
Other languages
English (en)
Inventor
유 펭
슌하이 왕
šœ하이 왕
Original Assignee
리제너론 파아마슈티컬스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 리제너론 파아마슈티컬스, 인크. filed Critical 리제너론 파아마슈티컬스, 인크.
Publication of KR20240032972A publication Critical patent/KR20240032972A/ko

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6818Sequencing of polypeptides
    • G01N33/6824Sequencing of polypeptides involving N-terminal degradation, e.g. Edman degradation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Hematology (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Cell Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Peptides Or Proteins (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 일반적으로 단백질의 아미노산 서열을 결정하는 방법에 관한 것이다. 특히, 본 발명은 N-말단 펩타이드 신호의 강화하고 N-말단 펩타이드 및 상응하는 b 이온의 신호를 이동시켜 N-말단 펩타이드 서열의 결정을 용이하게 하기 위한 위치 선택적 다이메틸화 및 액체 크로마토그래피 질량 분석법의 용도에 관한 것이다.

Description

위치 선택적 다이메틸화에 의한 단백질 N-말단 신규 서열분석
본 출원은 미국 가특허 출원 제63/221,454호(2021년 7월 13일 출원)에 대한 우선권 및 이익을 주장하며, 이는 참조에 의해 본원에 원용된다.
본 발명은 일반적으로 단백질 신규 서열분석 방법에 관한 것이다.
단백질 치료제는 많은 질병의 치료 및 진단에 중요한 역할을 한다. 단백질 치료제의 무결성과 품질을 보장하려면 단백질 서열 및 다른 구조적 특성을 결정하고 확인하여야 한다. 치료제 단백질을 서열분석하는 일반적인 방법은 액체 크로마토그래피 질량 분석법(LC-MS)을 사용하는 것이다. 그러나, LC-MS 방법은 낮은 이온화 효율, 이온 억제 및 N-말단 아민 차단을 포함하는 단백질 N-말단 도메인의 신뢰할 수 있는 서열분석을 방해하는 한계가 있다.
특히 단백질체학 응용분야에서 N-말단 식별을 지원하기 위해 다양한 방법이 개발되어 왔다. 전형적으로 이는 아민기의 화학적 변형 및 N-말단 펩타이드를 농축하기 위한 양성 선택 또는 음성 선택과 연관된다. 이러한 방법 중 하나는 N-말단의 식별을 지원하기 위한 단백질 N-말단 잔기의 다이메틸화 반응을 포함한다. 그러나 이러한 방법은 일반적으로 단백질체학 분석에서 단백질 식별에 적용되며 정제된 단백질의 신규 서열분석에 적용되지 않는다. 따라서, 정제된 단백질의 신규 서열분석을 위한 간단하고 신뢰할 수 있는 방법이 필요하다.
단백질 N-말단 신규 서열분석을 위한 방법이 도 1에서 예시한 바와 같이 개발되어 왔다. 방법은 검체에 있는 단백질이 위치 선택적 다이메틸화 반응을 거치게 하여 N-말단 아민이 우선적으로 다이메틸화되도록 하는 단계를 포함한다. 이후, 다이메틸화 반응은 켄칭 시약으로 켄칭될 수 있다. 단백질은 효소적으로 소화되어 LC-MS 분석을 거칠 수 있다. 다이메틸화된 N-말단 잔기는 더 큰 신호 강도와 특징적인 유지 시간 이동 및 질량 이동을 제공하는 임모늄 이온을 형성하여 N-말단 펩타이드 및 N-말단 잔기를 용이하게 식별할 수 있다. 이러한 식별은 단백질의 N-말단 서열을 결정하기 위해 사용될 수 있다.
본 개시내용은 관심 단백질의 N-말단 도메인의 아미노산 서열을 결정하는 방법을 제공한다. 일부 예시적 실시양태에서, 방법은 (a) 관심 단백질을 포함하는 검체를 적어도 하나의 다이메틸화 시약에 접촉시켜 다이메틸화 혼합물을 형성하는 단계; (b) 상기 다이메틸화 혼합물을 적어도 하나의 켄칭 시약과 접촉시켜 켄칭된 혼합물을 형성하는 단계; (c) 상기 켄칭된 혼합물을 액체 크로마토그래피 질량 분석법으로 분석하며 상기 분석법은 적어도 하나의 다이메틸화된 아미노산 잔기를 이온화하여 적어도 하나의 임모늄 이온을 형성하는 단계; (d) 상기 적어도 하나의 임모늄 이온의 존재를 기준으로 적어도 하나의 N-말단 펩타이드를 식별하는 단계; 및 (e) (d)의 상기 적어도 하나의 N-말단 펩타이드의 질량 스펙트럼을 다이메틸화되지 않은 대조 검체의 상응하는 적어도 하나의 N 말단 펩타이드의 질량 스펙트럼과 비교하여 상기 관심 단백질의 N-말단 도메인의 아미노산 서열을 결정하는 단계를 포함하며, (a)의 상기 적어도 하나의 다이메틸화 시약은 N-말단 α-아민의 다이메틸화를 우선적으로 유도하는 조건하에서 접촉된다.
일 양태에서, 상기 관심 단백질은 항체, 이중특이적 항체, 단클론성 항체, 융합 단백질, 항체 약물 접합체, 항체 단편 또는 단백질 약제학적 생성물이다.
일 양태에서, 상기 적어도 하나의 다이메틸화 시약은 HCHO, NaBH3CN, 이들의 중동위원소 및 이들의 조합으로 구성되는 군으로부터 선택된다. 다른 양태에서, 상기 다이메틸화 혼합물의 pH는 3 미만이다. 다른 양태에서, 상기 다이메틸화 혼합물은 아세트산을 포함한다. 추가 양태에서, 상기 다이메틸화 혼합물의 온도는 약 20℃ 내지 약 37℃이다. 다른 양태에서, 상기 다이메틸화 혼합물은 약 5분 내지 약 1시간 동안 정치된다.
일 양태에서, 상기 켄칭 시약은 NH3, NH2OH 및 이들의 조합으로 구성되는 군으로부터 선택된다. 다른 양태에서, 상기 켄칭된 혼합물의 온도는 약 20℃ 내지 약 37℃이다. 다른 양태에서, 상기 켄칭된 혼합물은 약 5분 내지 약 1시간 동안 정치된다.
일 양태에서, 방법은 상기 검체 및/또는 상기 켄칭된 혼합물을 적어도 하나의 소화 효소에 접촉시키는 단계를 더 포함한다. 특정 양태에서, 상기 적어도 하나의 소화 효소는 트립신, 카이모트립신, LysC, LysN, AspN, GluC, ArgC 및 이들의 조합으로 구성되는 군으로부터 선택된다.
일 양태에서, 상기 액체 크로마토그래피는 역상 액체 크로마토그래피, 이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 친화도 크로마토그래피, 소수성 상호작용 크로마토그래피, 친수성 상호작용 크로마토그래피, 혼합 모드 크로마토그래피 또는 이들의 조합을 포함한다. 다른 양태에서, 상기 액체 크로마토그래피 시스템은 상기 질량 분석기에 결합된다.
일 양태에서, 상기 질량 분석기는 전기분무 이온화 질량 분석기, 나노 전기분무 이온화 질량 분석기 또는 삼중 사중극자 질량 분석기이다. 다른 양태에서, 상기 질량 분석기는 다중 반응 모니터링 또는 병렬 반응 모니터링을 수행할 수 있다.
일 양태에서, 방법은 상기 검체 및/또는 상기 켄칭된 혼합물을 적어도 하나의 알킬화제에 접촉시키는 단계를 더 포함한다. 특정 양태에서, 상기 알킬화제는 아이오도아세트아마이드이다.
일 양태에서, 방법은 상기 검체 및/또는 상기 켄칭된 혼합물을 적어도 하나의 환원제에 접촉시키는 단계를 더 포함한다. 특정 양태에서, 상기 환원제는 다이싸이오트레이톨이다.
일 양태에서, 방법은 상기 검체를 적어도 하나의 변성제에 접촉시키는 단계를 더 포함한다. 특정 양태에서, 상기 변성제는 유레아이다.
본 발명의 이들, 및 기타 양태는 다음의 상세한 설명 및 첨부된 도면과 함께 고려될 때 보다 잘 인식되고 이해될 것이다. 하기 설명은 다양한 실시형태 및 이의 다수의 특정 세부사항을 나타내지만, 제한적인 것이 아니라 예시로서 제공된다. 많은 대체, 변형, 추가 또는 재배열이 발명의 범주 내에서 이루어질 수 있다.
도 1은 N-말단 분석의 최신 기술 및 예시적 실시양태에 따른 본 발명의 방법에 의해 충족되는 필요성을 예시한다.
도 2는 예시적 실시양태에 따른 단백질 분석에 영향을 미치는 잠재적인 N-말단 변형 및 C-말단 변형을 예시한다.
도 3은 예시적 실시양태에 따른 충돌 유도 해리(collision-induced dissociation, CID)에 의해 생성된 임모늄 이온의 구조 및 질량 스펙트럼에서 상기 이온의 증폭된 신호를 나타낸다.
도 4는 예시적 실시양태에 따른 비위치 선택적 다이메틸화 프로토콜을 예시한다.
도 5는 예시적 실시양태에 따른 비위치 선택적 다이메틸화를 사용한 단백질의 서열 적용범위를 나타낸다.
도 6은 예시적 실시양태에 따른 다이메틸화된 세린 임모늄 이온을 포함하는 질량 스펙트럼을 나타낸다.
도 7은 예시적 실시양태에 따른 위치 선택적 다이메틸화 프로토콜을 예시한다.
도 8은 예시적 실시양태에 따른 위치 선택적 다이메틸화를 사용한 단백질의 서열 적용범위를 나타낸다.
도 9는 예시적 실시양태에 따른 분획분자량(molecular weight cut off, MWCO)법 또는 원팟(one-pot)법을 사용한 위치 선택적 다이메틸화 방법의 총 이온 크로마토그램(total ion chromatogram, TIC)의 비교를 나타낸다.
도 10은 예시적 실시양태에 따른 위치 선택적 다이메틸화 방법의 시험되고 최적화된 매개변수를 나타낸다.
도 11a는 예시적 실시양태에 따른 주요 절단 종을 포함하는 융합 단백질 Ab1의 구조를 나타낸다.
도 11b는 예시적 실시양태에 따른 주요 절단 부위를 포함하는 Ab1의 아미노산 서열을 나타낸다.
도 11c는 예시적 실시양태에 따른 식별된 주요 절단 부위의 Y 임모늄 이온과 함께 위치 선택적 다이메틸화를 사용하여 분석된 Ab1의 질량 스펙트럼을 나타낸다.
도 11d는 예시적 실시양태에 따른 식별된 주요 절단 부위의 D 임모늄 이온과 함께 위치 선택적 다이메틸화를 사용하여 분석된 Ab1의 질량 스펙트럼을 나타낸다.
도 11e는 예시적 실시양태에 따른 식별된 주요 절단 부위의 T 임모늄 이온과 함께 위치 선택적 다이메틸화를 사용하여 분석된 Ab1의 질량 스펙트럼을 나타낸다.
도 12는 예시적 실시양태에 따른 NISTmAb의 위치 선택적 다이메틸화를 위한 프로토콜 및 상응하는 질량 스펙트럼을 나타낸다.
도 13a는 예시적 실시양태에 따른 FabRICATOR®의 SEC-MS TIC를 나타낸다.
도 13b는 예시적 실시양태에 따른 IdeS의 서열을 나타낸다.
도 13c는 예시적 실시양태에 따른 표시된 알려지지 않은 N-말단 서열이 있는 FabRICATOR®의 온전한 질량 스펙트럼을 나타낸다.
도 13d는 예시적 실시양태에 따른 FabRICATOR®의 질량 스펙트럼을 나타낸다.
도 14a는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 1의 크로마토그램을 나타낸다.
도 14b는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 1의 MS 스펙트럼을 나타낸다.
도 14c는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 1의 MS/MS 스펙트럼을 나타낸다.
도 15a는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 2의 크로마토그램을 나타낸다.
도 15b는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 2의 MS 스펙트럼을 나타낸다.
도 15c는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 2의 MS/MS 스펙트럼을 나타낸다.
도 16a는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 3의 크로마토그램을 나타낸다.
도 16b는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 3의 MS 스펙트럼을 나타낸다.
도 16c는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 3의 MS/MS 스펙트럼을 나타낸다.
도 17a는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 4의 크로마토그램을 나타낸다.
도 17b는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 4의 MS 스펙트럼을 나타낸다.
도 17c는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 4의 MS/MS 스펙트럼을 나타낸다.
도 18a는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 5의 크로마토그램을 나타낸다.
도 18b는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 5의 MS 스펙트럼을 나타낸다.
도 18c는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 5의 MS/MS 스펙트럼을 나타낸다.
도 19a는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 6의 크로마토그램을 나타낸다.
도 19b는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 6의 MS 스펙트럼을 나타낸다.
도 19c는 예시적 실시양태에 따른 대조군 및 다이메틸화된 FabRICATOR® N-말단 펩타이드 6의 MS/MS 스펙트럼을 나타낸다.
도 20a는 예시적 실시양태에 따른 위치 선택적 다이메틸화를 사용하여 식별된 주요 FabRICATOR® N-말단 서열의 정렬을 나타낸다.
도 20b는 예시적 실시양태에 따른 위치 선택적 다이메틸화를 사용하여 식별된 부차 FabRICATOR® N-말단 서열 및 상응하는 MS/MS 스펙트럼을 나타낸다.
도 20c는 예시적 실시양태에 따른 위치 선택적 다이메틸화를 사용하여 식별된 주요 및 부차 N-말단 서열로 완료된 FabRICATOR® 서열을 나타낸다.
도 20d는 예시적 실시양태에 따른 위치 선택적 다이메틸화를 사용하여 식별된 N-말단 서열을 검증하는 FabRICATOR®의 온전한 질량 스펙트럼을 나타낸다.
도 20e는 예시적 실시양태에 따른 대조군 비-다이메틸화 검체에서 FabRICATOR®의 서열 적용범위를 나타낸다.
도 20f는 예시적 실시양태에 따른 위치 선택적 다이메틸화 검체에서 FabRICATOR®의 서열 적용범위를 나타낸다.
도 21a는 예시적인 실시양태에 따른 위치 선택적 다이메틸화를 위한 최적화된 조건을 나타낸다.
도 21b는 예시적인 실시양태에 따른 임모늄 이온 촉발 MS/MS 데이터 획득 방법을 예시한다.
단백질 치료제, 특히 단클론성 항체는 많은 질병의 치료 및 진단에서 유의한 역할을 한다. 치료제 단백질의 품질이 좋지 않으면 환자에게 원치 않는 면역원성 반응, 약물 효능 상실 또는 유해 효과가 야기될 수 있다. 단백질 치료제의 무결성과 품질을 보장하려면 단백질 서열 및 다른 구조적 특성을 결정하고 확인하여야 한다.
서열분석을 포함한 치료제 단백질을 분석하는 일반적인 방법은 액체 크로마토그래피 질량 분석법을 사용하는 것이다. 펩타이드 서열은 선택된 분자 이온의 충돌 유도 해리(CID) 또는 공급원 후 붕괴(post-source decay, PSD)로부터 수득한 MS/MS 단편 분석을 통해 할당될 수 있다. 그러나, 단백질의 N-말단 펩타이드의 식별은 독특한 과제를 제시한다. CID 질량 스펙트럼에서 관찰되는 b 이온은 전형적으로 양성자화된 옥살로존 분자의 고리화에 의해 안정한 구조를 형성합니다. 그러나, 이러한 고리화는 N-말단 펩타이드의 N-말단 잔기를 포함하는 b1 이온에 대해 가능하지 않으며, 이는 질량 스펙트럼에서 b1 이온이 누락되고 종래의 방법으로 단백질의 N-말단 잔기를 결정할 수 없게 한다(Hsu , 2005, J Proteome Res, 4:101-108).
특히 단백질체학 응용분야의 경우, N-말단 식별을 지원하기 위해 다양한 방법이 개발되어 왔다. 전형적으로 이는 아민기의 화학적 변형 및 N-말단 펩타이드를 농축하기 위한 양성 선택 또는 음성 선택을 포함한다(Niedermaier , 2019, Biochim Biophys Acta Proteins Proteom, 1867(12):140138). 특정 방법은 폼알데하이드를 사용하여 N-말단 α-아민기 및 라이신 ε-아민기의 다이메틸화를 야기하는 것을 포함한다(Hsu ). 다이메틸화된 N-말단 잔기는 이온화되는 경우 임모늄 이온을 형성하여 이온화 효율 및 MS에서 검출 가능한 신호를 강화하며, 이는 도 3에서 나타낸 바와 같다. 또한 N-말단 다이메틸화는 N-말단 펩타이드 및 N-말단 잔기를 포함하는 b 이온이 용이하게 식별될 수 있도록 하는 예측 가능한 질량 이동을 야기한다.
단백질체학을 위한 다이메틸화 기법은 예를 들어 TAILS 기법 또는 DiLeu cPILOT 기법을 사용하여 더 최적화되었다(Marino 등, 2015, ACS Chem Biol, 10:1754-1764; Frost 등, 2018, Anal Chem, 90:10664-10669). Frost 은 낮은 pH에서 반응을 수행하여 (pKa가 더 낮은) N-말단 α-아민기가 우선적으로 반응하고 (pKa가 더 높은) 라이신 측쇄 ε-아민기가 우선적으로 변형되지 않은 채로 남아있는 다이메틸화 반응을 변형시키기 위한 산성 조건의 사용을 입증하였다. 경동위원소 및 중동위원소 다이메틸화 시약을 사용하여 대조되는 질량의 다이메틸화 검체를 생성하였다. 이러한 방법은 라이신의 동중원소 태깅과 조합되어 복잡한 검체의 24-플렉스 단백질체학 분석을 수행하여 검체에서 단백질을 식별하였다. 그러나, 이러한 방법 및 다른 설명된 N-말단 표지 방법은 전형적으로 단백질체학에 사용하도록 제한되어 왔으며, 예를 들어, 약물 개발을 위한 치료제 단백질체학을 특징화하기 위해 필요한, 정제된 단백질의 신규 서열분석에 적용되지 않았다.
보다 최근에는, 차단되지 않은 N-말단 잔기를 형광 표지하여 정제된 단백질의 신규 N-말단 서열분석을 위한 방법이 개발되었다(Vecchi , 2019, Anal Chem, 91:13591-13600). 이러한 방법은 온라인 형광 검출기를 사용해야 하며 피로글루타메이트와 같이 주로 차단된 N-말단을 표지할 수 없었다. Vecchi 은 소화되지 않은 검체와, pyroQ 잔기를 제거하는, 피로글루타메이트 아미노펩티데이스(PGAP)로 소화된 검체를 비교하는 제2 실험 트랙을 추가하여 이러한 문제를 회피하려고 시도하였다. N-말단 펩타이드를 충분히 식별할 수 없는 표지 과정의 이러한 해결 방법은 복잡한 층을 추가하고 pyroQ 이외의 임의의 N-말단 변형, 예를 들어, 도 2에서 예시되는 변형을 처리할 수 없다.
위에서 설명하고 도 1에서 예시되는 바와 같이, 특히 어려운 N-말단 도메인의 경우, 정제된 단백질의 신규 서열분석을 위한 간단하고 민감한 방법이 필요하다. 본 개시내용은 단백질의 N-말단 도메인을 표지하고 식별하며 신규 서열분석을 수행하는 신규한 방법을 제시한다.
달리 기술되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서에 기술된 것과 유사하거나 등가인 임의의 방법 및 재료가 실행 또는 시험에 사용될 수 있지만, 이제 특정 방법 및 재료가 기술된다.
"a"라는 용어는 "적어도 하나"를 의미하는 것으로 이해되어야 하며, "약" 및 "대략"이라는 용어는 당업자에게 이해될 수 있는 표준 변형을 허용하는 것으로 이해되어야 하며 범위가 제공되는 경우 엔드포인트가 포함된다. 본원에 사용된 용어 "포함하다(include)", "포함한다(includes)" 및 "포함하는(including)"은 비제한적인 의미이며 각각 "포함한다(comprise)", "포함한다(comprises)" 및 "포함하는(comprising)"을 의미하는 것으로 이해된다.
본원에서 사용되는 용어 "단백질" 또는 "관심 단백질"은 공유 결합된 아미드 결합을 갖는 임의의 아미노산 중합체를 포함할 수 있다. 단백질은 일반적으로 "폴리펩타이드"로 당해 기술분야에서 알려진 하나 이상의 아미노산 중합체 사슬을 포함한다. "폴리펩타이드"는 아미노산 잔기, 관련 자연 발생 구조 변이체 및 펩타이드 결합을 통하여 결합된 이들의 합성 비자연 발생 유사체로 구성되는 중합체를 지칭한다. "합성 펩타이드 또는 폴리펩타이드"는 비자연 발생 펩타이드 또는 폴리펩타이드를 지칭한다. 합성적 펩타이드 또는 폴리펩타이드는, 예를 들어 자동화된 폴리펩타이드 합성기를 사용하여 합성될 수 있다. 다양한 고상 펩타이드 합성 방법이 당업자에게 알려져 있다. 단백질은 단일 기능 생체분자를 형성하기 위해 하나 또는 여러개의 폴리펩타이드를 포함할 수 있다. 다른 예시적 양태에서, 단백질은 항체 단편, 나노바디, 재조합 항체 키메라, 사이토카인, 케모카인, 펩타이드 호르몬 등을 포함할 수 있다. 관심 있는 단백질에는 생물치료 단백질, 연구 또는 치료에 사용되는 재조합 단백질, 트랩 단백질 및 기타 키메라 수용체 Fc-융합 단백질, 키메라 단백질, 항체, 단클론성 항체, 다클론 항체, 인간 항체, 및 이중특이적 항체 중 임의의 것이 포함될 수 있다. 단백질은 곤충 바큘로바이러스 시스템, 효모 시스템(예를 들어, 피키아(Pichia) 종) 및 포유동물 시스템(예를 들어, CHO 세포 및 CHO-K1 세포 같은 CHO 유도체)과 같은 재조합 세포 기반 생성 시스템을 사용하여 생성될 수 있다. 생물치료 단백질과 그 생산에 대해 논의한 최근 검토 내용은 Ghaderi 등, "Production platforms for biotherapeutic glycoproteins. Occurrence, impact, and challenges of non-human sialylation"(Darius Ghaderi 등, Production platforms for biotherapeutic glycoproteins. Occurrence, impact, and challenges of non-human sialylation, 28 BIOTECHNOLOGY AND GENETIC ENGINEERING REVIEWS 147-176 (2012)를 참조하며, 이의 전체 교시는 본원에 원용된다. 일부 예시적 실시양태에서, 단백질은 변형, 부가물, 및 다른 공유 결합된 모이어티를 포함한다. 이러한 변형, 부가물 및 모이어티는 예를 들어 아비딘, 스트렙타비딘, 바이오틴, 글리칸(예를 들어, N-아세틸갈락토사민, 갈락토스, 뉴라민산, N-아세틸글루코사민, 푸코스, 만노스 및 다른 단당류), PEG, 폴리히스티딘, FLAGtag, 말토스 결합 단백질(MBP), 키틴 결합 단백질(CBP), 글루타싸이온-S-전달효소(GST) myc-에피토프, 형광 표지 및 다른 염료 등을 포함한다. 단백질은 조성과 용해도에 따라 분류될 수 있으므로 구형 단백질 및 섬유질 단백질과 같은 단순 단백질; 핵단백질, 당단백질, 점액단백질, 발색단백질, 인단백질, 금속단백질, 및 지질단백질과 같은 접합 단백질; 및 1차 유래 단백질 및 2차 유래 단백질과 같은 유래 단백질을 포함할 수 있다.
일부 예시적 실시양태에서, 관심 단백질은 재조합 단백질, 항체, 이중특이적 항체, 다중특이적 항체, 항체 단편, 단클론성 항체, 융합 단백질, scFv 및 이들의 조합일 수 있다.
본 발명에서 용어 "재조합 단백질"은 적합한 숙주 세포에 도입된 재조합 발현 벡터에 탑재된 유전자의 전사 및 번역의 결과로 생산된 단백질을 지칭한다. 특정한 예시적인 실시양태에서, 재조합 단백질은 항체, 예를 들어 키메라, 인간화 또는 완전 인간 항체일 수 있다. 특정 예시적 실시양태에서, 재조합 단백질은 IgG, IgM, IgA1, IgA2, IgD 또는 IgE로 구성되는 군으로부터 선택되는 동종형의 항체일 수 있다. 특정 예시적 실시양태에서, 항체 분자는 전장 항체(예를 들어, IgG1)이거나, 대안적으로 항체는 단편(예를 들어, Fc 단편 또는 Fab 단편)일 수 있다.
본원에 사용된 용어 "항체"는 이황화 결합에 의해 상호 연결된 2개의 중쇄 (H) 및 2개의 경쇄 (L)의 4개의 폴리펩타이드 사슬을 포함하는 면역글로불린 분자뿐만 아니라 그의 다량체 (예를 들어, IgM)를 포함한다. 각각의 중쇄는 중쇄 가변 영역 (본원에서는 HCVR 또는 VH로 약칭함) 및 중쇄 불변 영역을 포함한다. 중쇄 불변 영역은 CH1, CH2 및 CH3의 세 가지 도메인을 포함한다. 각각의 경쇄는 경쇄 가변 영역(본원에서 LCVR 또는 VL로 약술됨) 및 경쇄 불변 영역을 포함한다. 경쇄 불변 영역은 하나의 도메인 (CL1)을 포함한다. VH 및 VL 영역은 상보성 결정 영역 (CDR)으로 불리는 초가변성 영역, 프레임워크 영역 (FR)으로 불리는 더욱 보존된 영역이 산재되어 있는 영역으로 더 세분될 수 있다. 각각의 VH 및 VL은 3개의 CDR 및 4개의 FR로 구성되며, 아미노 말단부터 카복시 말단까지 FR1, CDR1, FR2, CDR2, FR3, CDR3, 및 FR4의 순서로 배열된다. 발명의 상이한 실시형태에서, 항-big-ET-1 항체(또는 그의 항원-결합 부분)의 FR은 인간 생식계열 서열과 동일할 수 있거나 자연적으로 또는 인공적으로 변형될 수 있다. 아미노산 컨센서스 서열은 2개 이상의 CDR의 병렬 분석에 기반하여 정의될 수 있다. 본원에 사용된 용어 "항체"에는 전체 항체 분자의 항원 결합 단편도 포함된다. 본원에 사용된 용어, 항체의 "항원-결합 부분", 항체의 "항원-결합 단편" 등은 항원에 특이적으로 결합하여 복합체를 형성하는 임의의 천연 발생, 효소적으로 획득가능한, 합성, 또는 유전적으로 조작된 폴리펩타이드 또는 당단백질을 포함한다. 항체의 항원 결합 단편은 예를 들어, 항체 가변 및 선택적으로 일정한 도메인을 코딩하는 DNA의 조작 및 발현을 포함하는 단백질 분해 소화 또는 재조합 유전 공학 기술과 같은 임의의 적합한 표준 기술을 사용하여 전체 항체 분자로부터 유도될 수 있다. 이러한 DNA는 공지되어 있고/거나 예를 들어 상업적 출처, DNA 라이브러리 (예를 들어, 파지-항체 라이브러리 포함)로부터 쉽게 입수할 수 있거나 합성될 수 있다. DNA는, 예를 들어 하나 이상의 가변 및/또는 불변 도메인을 적절한 배열로 배열하거나, 코돈을 도입하고, 시스테인 잔기를 생성하고, 아미노산 등을 변형, 추가 또는 삭제하기 위해 화학적으로 또는 분자 생물학 기술을 사용하여 서열분석되고 조작될 수 있다.
본 명세서에 사용된 "항체 단편"은, 예를 들어 항체의 항원-결합 또는 가변 영역과 같은 온전한 항체의 부분을 포함한다. 항체 단편의 예는 Fab 단편, Fab' 단편, F(ab')2(또는 "Fab2") 단편, scFv 단편, Fv 단편, dsFv 디아바디, dAb 단편, Fd' 단편, Fd 단편 및 단리된 상보성 결정 영역(CDR) 영역, 뿐만 아니라 트리아바디, 테트라바디, 선형 항체, 단쇄 항체 분자 및 항체 단편으로부터 형성된 다중 특이적 항체를 포함하나 이에 제한되지 않는다. Fv 단편은 면역글로불린 중쇄 및 경쇄의 가변 영역의 조합이고, ScFv 단백질은 면역글로불린 경쇄 및 중쇄 가변 영역이 펩타이드 링커에 의해 연결된 재조합 단일 사슬 폴리펩타이드 분자이다. 일부 예시적인 실시양태에서, 항체 단편은 모 항체와 동일한 항원에 결합하는 단편인, 모 항체의 충분한 아미노산 서열을 포함하고; 일부 예시적인 실시양태에서, 단편은 모 항체의 친화도와 필적하는 친화도로 항원에 결합하고/하거나 항원에 대한 결합에 대해 모 항체와 경쟁한다. 항체 단편은 임의의 수단에 의해 생성될 수 있다. 예를 들어, 항체 단편은 온전한 항체의 단편화에 의해 효소적으로 또는 화학적으로 생성될 수 있고/있거나 부분적 항체 서열을 인코딩하는 유전자로부터 재조합적으로 생성될 수 있다. 일부 예시적 실시양태에서, 항체 단편은 소화 효소 IdeS 또는 이의 변이체를 사용한 소화에 의해 생성될 수 있다. 대안적으로 또는 추가적으로, 항체 단편은 전체적으로 또는 부분적으로 합성적으로 생성될 수 있다. 항체 단편은 선택적으로 단일 사슬 항체 단편을 포함할 수 있다. 대안적으로 또는 추가적으로, 항체 단편은 예를 들어 이황화 결합에 의해 함께 연결된 다중 사슬을 포함할 수 있다. 항체 단편은 선택적으로 다중-분자 복합체를 포함할 수 있다. 기능적 항체 단편은 전형적으로 적어도 약 50개 아미노산을 포함하고 보다 전형적으로 적어도 약 200개 아미노산을 포함한다.
"이중특이적 항체"라는 용어는 2개 이상의 에피토프에 선택적으로 결합할 수 있는 항체를 포함한다. 이중특이적 항체는 일반적으로 두 개의 서로 다른 중쇄를 포함하며, 각 중쇄는 두 개의 서로 다른 분자 (예를 들어, 항원들) 또는 동일한 분자 (예를 들어, 동일한 항원) 상의 서로 다른 에피토프에 특이적으로 결합한다. 이중특이적 항체가 2개의 상이한 에피토프(첫 번째 에피토프 및 두 번째 에피토프)에 선택적으로 결합할 수 있는 경우, 첫 번째 에피토프에 대한 첫 번째 중쇄의 친화도는 일반적으로 두 번째 에피토프에 대한 첫 번째 중쇄의 친화도보다 적어도 1 내지 2 또는 3 또는 4 등급의 크기로 낮을 수 있고 그 반대의 경우도 마찬가지이다. 이중특이적 항체에 의해 인식되는 에피토프는 동일하거나 상이한 표적 상(예를 들어, 동일하거나 상이한 단백질 상)에 있을 수 있다. 이중특이적 항체는, 예를 들어 동일한 항원의 상이한 에피토프를 인식하는 중쇄를 조합함에 의해 제작될 수 있다. 예를 들어, 동일한 항원의 서로 다른 에피토프를 인식하는 중쇄 가변 서열을 코딩하는 핵산 서열은 서로 다른 중쇄 불변 영역을 코딩하는 핵산 서열에 융합될 수 있고 이러한 서열은 면역글로불린 경쇄를 발현하는 세포에서 발현될 수 있다.
일반적인 이중특이적 항체는 각각 3개의 중쇄 CDR에 이어 CH1 도메인, 힌지, CH2 도메인, 및 CH3 도메인을 갖는 2개의 중쇄, 및 항원 결합 특이성을 부여하지는 않지만 각 중쇄와 회합할 수 있거나, 각 중쇄와 회합할 수 있고 중쇄 항원 결합 영역에 의해 결합된 하나 이상의 에피토프와 결합할 수 있거나, 각 중쇄와 회합할 수 있고 하나 또는 둘 다의 중쇄가 하나 또는 둘 다의 에피토프에 결합할 수 있게 하는 면역글로불린 경쇄를 갖는다. BsAb는 Fc 영역을 보유하는 것(IgG-유사)과 Fc 영역이 없는 것인, 2가지 주요 부류로 분류된 있으며, 후자는 일반적으로 Fc를 포함하는 IgG 및 IgG-유사 이중특이적 분자보다 작다. IgG 유사 bsAb는 트리오맙, 노브 인투 홀 IgG(kih IgG), crossMab, orth-Fab IgG, 이중 가변 도메인 Ig(DVD-Ig), 투-인-원 또는 이중 작용 Fab (DAF), IgG-단일 사슬 Fv(IgG-scFv) 또는 κλ-바디를 포함하나 이에 제한되지 않는 다양한 형식을 가질 수 있다. 비IgG 유사 상이한 형식은 탠덤 scFv, 디아바디 형식, 단쇄 디아바디, 탠덤 디아바디(TandAb), 이중 친화도 재표적화 분자(DART), DART-Fc, 나노바디 또는 독-앤-락(dock-and-lock, DNL) 방법에 의해 생성된 항체를 포함한다(Gaowei Fan, Zujian Wang & Mingju Hao, Bispecific antibodies and their applications, 8 JOURNAL OF HEMATOLOGY & ONCOLOGY 130; Dafne M
Figure pct00001
ller & Roland E. Kontermann, Bispecific Antibodies, HANDBOOK OF THERAPEUTIC ANTIBODIES 265-310 (2014), 이들의 전체 교시는 본원에 원용됨). bsAb를 생산하는 방법은 2개의 상이한 하이브리도마 세포주의 체세포 융합, 화학적 가교를 포함하는 화학적 접합, 및 재조합 DNA 기술을 이용하는 유전적 접근법에 기반한 쿼드로마 기술에 제한되지 않는다. bsAb의 예는 다음 특허 출원에 개시된 것들을 포함하며, 이는 본원에 참조에 의해 원용된다: 2010년 06월 25일에 출원된 미국 일련 번호 12/823838호; 2012년 6월 5일에 출원된 미국 일련 번호 13/488628호; 2013년 9월 19일에 출원된 미국 일련 번호 14/031075호; 2015년 7월 24일에 출원된 미국 일련 번호 14/808171호; 2017년 9월 22일에 출원된 미국 일련 번호 15/713574호; 2017년 9월 22일에 출원된 미국 일련 번호 15/713569; 2016년 12월 21일에 출원된 미국 일련 번호 15/386453호; 2016년 12월 21일에 출원된 미국 일련 번호 15/386443호; 2016년 7월 29일에 출원된 미국 일련 번호 15/22343호; 및 2017년 11월 15일에 출원된 미국 일련 번호 15814095호.
본원에 사용된 "다중특이적 항체"는 적어도 2개의 상이한 항원에 대해 결합 특이성을 갖는 항체를 지칭한다. 이러한 분자는 일반적으로 2개의 항원에만 결합하지만(, 이중특이적 항체, bsAb), 삼중특이적 항체 및 KIH 삼중특이적과 같은 추가 특이성을 갖는 항체도 본원에서 개시되는 시스템 및 방법에 의해 처리될 수 있다.
본 명세서에 사용된 용어 "단클론성 항체"는 하이브리도마 기술을 통해 생산된 항체에 제한되지 않는다. 모단클론성 항체는 당업계에서 이용가능하거나 공지된 임의의 수단에 의해, 임의의 진핵생물, 원핵생물 또는 파지 클론을 포함하는 단일 클론으로부터 유래될 수 있다. 본 개시내용에 유용한 단클론성 항체는 하이브리도마, 재조합 및 파지 디스플레이 기술, 또는 이의 조합의 사용을 포함하는 당업계에 공지된 매우 다양한 기술을 사용하여 제조될 수 있다.
일부 예시적 실시양태에서, 관심 단백질은 포유동물 세포로부터 생성될 수 있다. 인간 유래 또는 비-인간 유래의 것일 수 있는 포유동물 세포는 일차 상피 세포(예를 들어, 각질세포, 자궁 경부 상피 세포, 기관지 상피 세포, 기관 상피 세포, 신장 상피 세포 및 망막 상피 세포), 확립된 세포주 및 이들의 계통(예를 들어, 293 배아 신장 세포, BHK 세포, HeLa 경부 상피 세포 및 PER-C6 망막 세포, MDBK(NBL-1) 세포, 911 세포, CRFK 세포, MDCK 세포, CHO 세포, BeWo 세포, Chang 세포, 디트로이트 562 세포, HeLa 229 세포, HeLa S3 세포, Hep-2 세포, KB 세포, LSI80 세포, LS174T 세포, NCI-H-548 세포, RPMI2650 세포, SW-13 세포, T24 세포, WI-28 VA13, 2RA 세포, WISH 세포, BS-C-I 세포, LLC-MK2 세포, 클론 M-3 세포, 1-10 세포, RAG 세포, TCMK-1 세포, Y-l 세포, LLC-PKi 세포, PK(15) 세포, GHi 세포, GH3 세포, L2 세포, LLC-RC 256 세포, MHiCi 세포, XC 세포, MDOK 세포, VSW 세포 및 TH-I, B1 세포, BSC-1 세포, RAf 세포, RK-세포, PK-15 세포 또는 이의 유도체), 임의의 조직 또는 기관으로부터 섬유아세포(비제한적으로 심장, 간, 신장, 결장, 장, 식도, 위, 신경 조직(뇌, 척수), 폐, 혈관 조직(동맥, 정맥, 모세혈관), 림프 조직(림프선, 아데노이드, 편도선, 골수 및 혈액), 비장 포함, 섬유아세포 및 섬유아세포-유사 세포주(예를 들어, CHO 세포, TRG-2 세포, IMR-33 세포, Don 세포, GHK-21 세포, 시트룰린혈증 세포, 뎀시 세포, 디트로이트 551 세포, 디트로이트 510 세포, 디트로이트 525 세포, 디트로이트 529 세포, 디트로이트 532 세포, 디트로이트 539 세포, 디트로이트 548 세포, 디트로이트 573 세포, HEL 299 세포, IMR-90 세포, MRC-5 세포, WI-38 세포, WI-26 세포, Midi 세포, CHO 세포, CV-1 세포, COS-1 세포, COS-3 세포, COS-7 세포, Vero 세포, DBS-FrhL-2 세포, BALB/3T3 세포, F9 세포, SV-T2 세포, M-MSV-BALB/3T3 세포, K-BALB 세포, BLO-11 세포, NOR-10 세포, C3H/IOTI/2 세포, HSDMiC3 세포, KLN205 세포, McCoy 세포, 마우스 L 세포, 균주 2071(마우스 L) 세포, L-M 균주(마우스 L) 세포, L-MTK'(마우스 L) 세포, NCTC 클론 2472 및 2555, SCC-PSA1 세포, Swiss/3T3 세포, 인도 문작 세포, SIRC 세포, Cn 세포 및 Jensen 세포, Sp2/0, NS0, NS1 세포 또는 이의 유도체)를 포함할 수 있다.
본원에서 사용되는 "검체"는 생물공정의 임의의 단계, 예컨대, 세포 배양액(CCF), 채취된 세포 배양액(HCCF), 다운스트림 과정에서 임의의 단계, 약물 원료(DS) 또는 최종 제형화된 제품을 포함하는 약품(DP)으로부터 수득될 수 있다. 일부 다른 특정 예시적 실시양태에서, 검체는 정화, 크로마토그래피 생성, 바이러스 불활성화 또는 여과의 다운스트림 과정의 임의의 단계로부터 선택될 수 있다. 일부 특정 예시적 실시양태에서, 약품은 진료소, 운송, 보관 또는 취급에서 제조된 약품으로부터 선택될 수 있다.
일부 예시적 실시양태에서, 관심 단백질은 예를 들어, 알킬화, 환원, 변성 및/또는 소화에 의해 제조될 수 있다.
본원에서 사용되는 용어 "단백질 알킬화제"는 단백질에서 특정 유리 아미노산 잔기를 알킬화하기 위해 사용되는 제제를 지칭한다. 단백질 알킬화제의 비제한적 예는 아이오도아세트아마이드(IAA), 클로로아세트아미드(CAA), 아크릴아미드(AA), N-에틸말레이미드(NEM), 메틸 메테인싸이오설포네이트(MMTS) 및 4-바이닐피리딘 또는 이의 조합이다. 예시적 실시양태에서, 아이오도아세트아마이드가 알킬화제로서 사용된다.
본원에서 사용되는 "단백질 변성"은 분자의 3차원적 형상이 이의 고유한 상태에서 변하는 과정을 지칭할 수 있다. 단백질 변성은 단백질 변성제를 사용하여 수행될 수 있다. 단백질 변성제의 비제한적인 예에는 열, 높거나 낮은 pH, DTT(아래 참조)와 같은 환원제 또는 수소결합 억제제(chaotropic agent)에 대한 노출을 포함한다. 여러 수소결합 억제제가 단백질 변성제로서 사용될 수 있다. 카오트로픽 용질은 수소 결합, 반 데르 발스 힘 및 소수성 효과와 같은 비-공유력에 의해 매개되는 분자내 상호작용을 방해함에 의해 시스템의 엔트로피를 증가시킨다. 수소결합 억제제의 비제한적 예는 뷰탄올, 에탄올, 염화 구아니디늄, 과염소산 리튬, 아세트산 리튬, 염화 마그네슘, 페놀, 프로판올, 황산 도데실 소듐, 싸이오유레아, N-라우로일사코신, 유레아 및 이들의 염을 포함한다. 예시적 실시양태에서, 유레아는 변성제로서 사용된다.
본원에서 사용되는 용어 "단백질 환원제"는 단백질에서 이황화 가교의 환원에 사용되는 제제를 지칭한다. 단백질을 환원시키기 위해 사용되는 단백질 환원제의 비제한적 예는 다이싸이오트레이톨(DTT), β-머캅토에탄올, 엘만(Ellman) 시약, 하이드록실아민 하이드로클로라이드, 소듐 사이아노보로하이드라이드, 트리스(2-카복시에틸)포스핀 하이드로클로라이드(TCEP-HCl) 또는 이들의 조합이다. 예시적 실시양태에서, DTT는 환원제로서 사용된다.
본 명세서에 사용된 용어 "단리"는 단백질의 하나 이상의 펩타이드 결합의 가수분해를 지칭한다. 적절한 가수분해제, 예를 들어 효소적 단리 또는 비-효소적 단리를 사용하여 샘플에서 단백질의 단리를 수행하는 몇 가지 접근법이 있다.
본원에서 사용되는 용어 "소화 효소"는 단백질의 소화를 수행할 수 있는 다수의 상이한 제제 중 임의의 하나를 지칭한다. 효소 소화를 수행할 수 있는 가수분해제의 비제한적인 예는 아스페르길루스 사이토이(Aspergillus Saitoi)로부터 유래한 단백질분해효소, 엘라스테이스, 서브틸리신, 단백질분해효소 XIII, 펩신, 트립신, Tryp-N, 카이모트립신, 아스퍼길로펩신 I, LysN 단백질분해효소(Lys-N), LysC 엔도프로테이나제( Lys-C), 펩타이드내부가수분해효소 Asp-N(Asp-N), 펩타이드내부가수분해효소 Arg-C(Arg-C), 펩타이드내부가수분해효소 Glu-C(Glu-C) 또는 외막 단백질 T(OmpT), 화농연쇄상구균의 면역글로불린 분해 효소(IdeS), 서몰리신, 파파인, 프로네이스, V8 단백질분해효소 또는 생물학적 활성 단편 또는 이들의 동족체 또는 이들의 조합을 포함한다. 단백질 소화를 위한 이용 가능한 기법에 대해 논의하는 최근 검토는 Switazar 등, "Protein Digestion: An Overview of the Available Techniques and Recent Developments"을 참조할 수 있다(Linda Switzar, Martin Giera & Wilfried M. A. Niessen, Protein Digestion: An Overview of the Available Techniques and Recent Developments, 12 JOURNAL OF PROTEOME RESEARCH 1067-1077 (2013)). 예시적 실시양태에서, 트립신 및 LysC는 소화 효소로서 사용된다.
본원에 사용된 용어 "액체 크로마토그래피"는 액체에 의해 운반되는 생물학적/화학적 혼합물이 정지 액체 또는 고체상을 통해 (또는 그 속으로) 흐를 때 성분의 차등적 분포의 결과로 성분으로 분리될 수 있는 공정을 지칭한다. 액체 크로마토그래피의 비제한적인 예에는 역상 액체 크로마토그래피, 이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 친화성 크로마토그래피, 소수성 상호작용 크로마토그래피, 친수성 상호작용 크로마토그래피, 또는 혼합 모드 크로마토그래피가 포함된다.
본 명세서에 사용된, 용어 "질량 분석기"는 특정 분자 종을 식별하고 그의 정확한 질량을 측정할 수 있는 장치를 포함한다. 이 용어는 폴리펩타이드 또는 펩타이드를 특성화할 수 있는 임의의 분자 검출기를 포함하는 의미이다. 질량 분석기는 3가지 주요 부분인: 이온 소스, 질량 분석기 및 검출기를 포함할 수 있다. 이온 소스의 역할은 기체상 이온을 생성하는 것이다. 분석물 원자, 분자 또는 클러스터는 기체 상으로 전환되고 동시에(전자분무 이온화에서와 같음) 또는 별도의 과정을 통해 이온화될 수 있다. 이온 소스의 선택은 응용 분야에 따라 다르다. 일부 예시적인 실시형태에서, 질량 분석기는 탠덤 질량 분석기일 수 있다. 본원에서 사용되는 용어 "탠덤 질량 분석법"에는 여러 단계의 질량 선택 및 질량 분리를 사용하여 샘플 분자의 구조 정보를 얻는 기술이 포함된다. 전제 조건은 첫 번째 질량 선택 단계 후에 단편이 예측 가능하고 제어 가능한 방식으로 형성되도록 샘플 분자가 기체상으로 변환되고 이온화된다는 것이다. 다단계 MS/MS 또는 MSn은 의미 있는 정보를 얻을 수 있거나 단편 이온 신호를 감지할 수 있는 한, 먼저 전구체 이온 (MS2)을 선택 및 단리하고, 이를 단편화하고, 1차 단편 이온 (MS3)을 단리하고, 이를 단편화하고, 2차 단편 (MS4)을 단리하는 등등을 수행할 수 있다. 탠덤 MS는 매우 다양한 분석기 조합으로 성공적으로 수행되었다. 특정 응용분야에 조합할 분석기는 민감도, 선택성 및 속도뿐만 아니라 크기, 비용 및 가용성과 같은 많은 상이한 요인에 의해 결정될 수 있다. 탠덤 MS 방법의 2가지 주요 범주는 탠덤-인-스페이스 및 탠덤-인-타임이지만, 탠덤-인-타임 분석기가 공간에서 또는 탠덤-인-스페이스 분석기와 커플링되는 하이브리드가 또한 있다. 탠덤-인-스페이스 질량 분석기는 이온 소스, 전구체 이온 활성화 장치 및 적어도 2개의 비-포획 질량 분석기를 포함한다. 특정 m/z 분리 기능은 기구의 한 구획에서 이온이 선택되고 중간 영역에서 해리된 후 생성물 이온이 m/z 분리 및 데이터 획득을 위해 다른 분석기로 전송되도록 설계될 수 있다. 탠덤-인-타임에, 이온 소스에서 생성된 질량 분석기 이온은 동일한 물리적 장치에서 포획, 단리, 단편화 및 m/z 분리될 수 있다. 질량 분석기에 의해 식별된 펩타이드는 온전한 단백질 및 그의 번역 후 변형의 대리 대표로 사용될 수 있다. 이들은 실험적 및 이론적 MS/MS 데이터를 상호연관시켜 단백질 특성화에 사용될 수 있으며, 후자는 단백질 서열 데이터베이스에서 가능한 펩타이드로부터 생성된다. 특징화는 단백질 단편의 아미노산 서열분석, 단백질 서열분석 결정, 단백질 신규 서열분석 결정, 번역 후 변형 위치 발견, 또는 번역 후 변형 식별, 또는 비교가능성 분석, 또는 이들의 조합을 포함하나 이에 제한되지 않는다.
일부 예시적 양태에서, 질량 분석기는 나노전기분무 또는 나노분무를 사용하여 작동할 수 있다.
본원에서 사용되는 용어 "나노전기분무" 또는 "나노분무"는 일반적으로 외부 용매 전달이 없는 매우 낮은 용매 유속 전형적으로 검체 용액의 분당 수백 나노리터 이하에서의 전기분무 이온화를 지칭한다. 나노전기분무를 형성하는 전기분무 주입 설정은 정적 나노전기분무 이미터 또는 동적 나노전기분무 이미터를 사용할 수 있다. 정적 나노전기분무 이미터는 장기간에 걸쳐 소량의 검체(분석물) 용액을 지속적으로 분석한다. 동적 나노전기분무 이미터는 모세관 컬럼 및 용매 전달 시스템을 사용하여 질량 분석기로 분석하기 전 혼합물에 대한 크로마토그래피 분리를 수행한다.
일부 예시적 양태에서, 질량 분석기는 탠덤 질량 분석기일 수 있다.
본원에서 사용되는 용어 "탠덤 질량 분석법"에는 여러 단계의 질량 선택 및 질량 분리를 사용하여 샘플 분자의 구조 정보를 얻는 기술이 포함된다. 전제 조건은 검체 분자가 기체상(gas phase)으로 이동될 수 있고 온전하게 이온화될 수 있으며 제1 질량 선택 단계 후 일부 예측 가능하고 제어 가능한 방식으로 분리되도록 유도될 수 있다는 것이다. 다단계 MS/MS 또는 MSn은 의미 있는 정보를 수득할 수 있거나 단편 이온 신호를 검출 가능한 한, 우선 전구체 이온(MS2)을 선택 및 단리하고, 이를 단편화하며, 1차 단편 이온(MS3)을 단리하고, 이를 단편화하며, 2차 단편 (MS4)을 단리하는 등에 의해 수행될 수 있다. 탠덤 MS는 매우 다양한 분석기 조합으로 성공적으로 수행되었다. 특정 애플리케이션에 결합할 분석기는 감도, 선택성, 속도뿐 아니라 크기, 비용 및 가용성과 같은 많은 상이한 요인에 의해 결정될 수 있다. 탠덤 MS 방법의 2가지 주요 범주는 탠덤-인-스페이스 및 탠덤-인-타임이지만, 탠덤-인-타임 분석기가 공간에서 또는 탠덤-인-스페이스 분석기와 커플링되는 하이브리드가 또한 있다. 탠덤-인-스페이스 질량 분석기는 이온 소스, 전구체 이온 활성화 장치 및 적어도 2개의 비-포획 질량 분석기를 포함한다. 특정 m/z 분리 기능은 기구의 한 구획에서 이온이 선택되고 중간 영역에서 해리된 후 생성물 이온이 m/z 분리 및 데이터 획득을 위해 다른 분석기로 전송되도록 설계될 수 있다. 탠덤-인-타임에, 이온 소스에서 생성된 질량 분석기 이온은 동일한 물리적 장치에서 포획, 단리, 단편화 및 m/z 분리될 수 있다.
질량 분석기에 의해 식별된 펩타이드는 온전한 단백질 및 이의 번역 후 변형의 대리 대표로 사용될 수 있다. 이들은 실험적 및 이론적 MS/MS 데이터를 상호연관시켜 단백질 특성화에 사용될 수 있으며, 후자는 단백질 서열 데이터베이스에서 가능한 펩타이드로부터 생성된다. 특징화는 단백질 단편의 아미노산 서열분석, 단백질 서열분석 결정, 단백질 신규 서열분석 결정, 번역 후 변형 위치 발견, 또는 번역 후 변형 식별, 또는 비교가능성 분석, 또는 이들의 조합을 포함하나 이에 제한되지 않는다.
본원에서 사용되는 용어 "데이터베이스"는, 예를 들어, FASTA 형식의 파일 형태로, 검체에서 존재할 가능성이 있는 단백질 서열의 컴파일된 모음을 지칭한다. 관련 단백질 서열은 연구 중인 종의 cDNA 서열로부터 유래될 수 있다. 관련 단백질 서열을 검색하기 위해 사용될 수 있는 공용 데이터베이스는 예를 들어, Uniprot 또는 Swiss-prot에서 호스팅하는 데이터베이스를 포함한다. 데이터베이스는 본원에서 "생물정보학 도구"로 지칭되는 것을 사용하여 검색할 수 있다. 생물정보학 도구는 데이터베이스(들)의 모든 가능한 서열에 대해 해석되지 않은 MS/MS 스펙트럼을 검색하고 해석된(주석 표시된) MS/MS 스펙트럼을 출력으로 제공하는 기능을 제공한다. 이러한 도구의 비제한적 예는 Mascot(www.matrixscience.com), Spectrum Mill (www.chem.agilent.com), PLGS(www.waters.com), PEAKS(www.bioinformaticssolutions.com), Proteinpilot(download.appliedbiosystems.com//proteinpilot), Phenyx(www.phenyx-ms.com), Sorcerer(www.sagenresearch.com), OMSSA(www.pubchem.ncbi.nlm.nih.gov/omssa/), X!Tandem(www.thegpm.org/TANDEM/), Protein Prospector(prospector.ucsf.edu/prospector/mshome.htm), Byonic(www.proteinmetrics.com/products/byonic) 또는 Sequest(fields.scripps.edu/sequest)이다.
일부 예시적 실시양태에서, 질량 분석기는 액체 크로마토그래피 시스템에 결합될 수 있다.
일부 예시적 실시양태에서, 질량 분석기는 액체 크로마토그래피 다중 반응 모니터링 시스템에 결합될 수 있다. 보다 일반적으로, 질량 분석기는 연속 반응 모니터링(CRM) 및 병렬 반응 모니터링(PRM)을 포함하여 선택 반응 모니터링(SRM)으로 분석할 수 있다.
본원에서 사용되는 "다중 반응 모니터링" 또는 "MRM"은 높은 민감도, 특이성 및 넓은 동적 범위로 복잡한 매트릭스 내에 있는 소분자, 펩타이드 및 단백질을 정밀하게 정량화할 수 있는 질량 분석법 기반 기법을 지칭한다(Paola Picotti & Ruedi Aebersold, Selected reaction monitoring-based proteomics: workflows, potential, pitfalls and future directions, 9 NATURE METHODS 555-566 (2012)). MRM은 전형적으로 선택된 소분자/펩타이드에 상응하는 전구체 이온이 제1 사중극자에서 선택되며 전구체 이온의 단편 이온이 제3 사중극자에서 모니터링을 위해 선택되는 삼중 사중극자 질량 분석기로 수행될 수 있다(Yong Seok Choi 등, Targeted human cerebrospinal fluid proteomics for the validation of multiple Alzheimers disease biomarker candidates, 930 JOURNAL OF CHROMATOGRAPHY B 129-135 (2013)).
일부 양태에서, 본 출원의 방법 또는 시스템의 질량 분석기는 전기분무 이온화 질량 분석기, 나노전기분무 이온화 질량 분석기 또는 삼중 사중극자 질량 분석기일 수 있으며, 여기서 질량 분석기는 액체 크로마토그래피 시스템에 결합될 수 있며, 여기서 질량 분석기는 LC-MS(액체 크로마토그래피 질량 분석법) 또는 LC-MRM-MS(액체 크로마토그래피 다중 반응 모니터링 질량 분석법) 분석을 수행할 수 있다.
본원에서 사용되는 용어 "질량분석기"는 종, 즉 원자, 분자, 또는 클러스터를 질량에 따라 분리할 수 있는 장치를 포함한다. 사용될 수 있는 질량 분석기의 비제한적인 예는 비행시간(TOF), 자기 전기 섹터, 사중극자 질량 필터(Q), 사중극자 이온 트랩(QIT), 궤도랩, 푸리에 변환 이온 사이클로트론 공명(FTICR), 및 가속기질량분석법(AMS) 기술도 있다.
본 발명은 임의의 상기 관심 단백질(들), 항체(들), 검체(들), 액체 크로마토그래피 방법(들) 또는 시스템(들), 질량 분석기(들), 알킬화제(들), 환원제(들), 소화 효소(들), 데이터베이스(들), 또는 생물정보학 도구(들)에 제한되지 않으며, 및 관심 단백질(들), 항체(들), 검체(들), 액체 크로마토그래피 방법(들) 또는 시스템(들), 질량 분석기(들), 알킬화제(들), 환원제(들), 소화 효소(들), 데이터베이스(들), 또는 생물정보학 도구(들)는 임의의 적합한 수단에 의해 선택될 수 있다.
본 발명은 다음 실시예를 참고하여 보다 완전하게 이해될 것이다. 그러나 이들은 본 발명의 범위를 제한하는 것으로 해석되어서는 안 된다.
실시예
위치 선택적 원팟 다이메틸화 프로토콜. 위치 선택적 원팟 다이메틸화를 위한 프로토콜이 본원에서 설명된다. 100 μg의 정제된 단백질을 수득하였다. 단백질은 10 μL(10 μg/μL)의 8 M 유레아에서 50℃에서 10분 동안 변성되었다. 검체를 냉각하였다. 5% 아세트산 300 mM HCHO 및 120 mM NaBH3CN을 함유하는 2.5 μL의 8 M 유레아를 포함하는 다이메틸화 반응 혼합물을 첨가하였으며, 반응을 15분 동안 37℃에서 진행하였다. 2.5% NH2OH를 함유하는 2.5 μL의 8 M 유레아를 첨가하여 다이메틸화 반응을 켄칭하였으며, 15분 동안 37℃에서 정치하였다.
이후, 단백질을 20 mM의 다이싸이오트레이톨(DTT)과 함께 0.4 M Tris pH 7.5에 2.5 μL의 8 M 유레아를 첨가하여 환원시켰으며, 37℃에서 15분 동안 정치하였다. 단백질을 알킬화하였고, 2.5 μL의 125 mM 아이오도아세트아마이드(IAA) 및 2 μL의 0.5 μg/μL rLys-C(기질 대 효소 비율 100)를 첨가하여 소화시켰으며, 암실에서 37℃에서 15분 동안 정치하였다. 이후, 160 μL의 0.1 M Tris pH 7.5를 첨가하여 검체를 희석하였고, 10 μL의 0.5 μg/μL 트립신(기질 대 효소 비율 20)을 추가 소화를 위해 첨가하였으며, 37℃에서 2시간 동안 정치하였다. 3.5 μL의 5.75 mU/μL PNGase F를 각각의 검체(기질 대 효소 비율 5, 중량 기준)에 첨가하였으며, 37℃에서 1시간 동안 정치하였다. 마지막으로, 2 μL의 10% 폼산(FA)을 첨가하여 LC-MS 분석 전 소화를 중단시켰다.
추가 최적화된 프로토콜. 위치 선택적 원팟 다이메틸화를 위한 추가 최적화된 프로토콜이 개발되었다. 200 μg의 정제된 단백질을 수득하였다. 단백질은 5 mM DTT가 있는 20 μL(10 μg/μL)의 8 M 유레아에서 37℃에서 30분 동안 변성되었고 환원되었다. 단백질을 125 mM IAA를 함유하는 2.5 μL의 8 M의 유레아를 첨가하여 알킬화하였으며 암실에서 37℃에서 15분 동안 정치하였다. 10% 아세트산, 600 mM HCHO 및 240 mM NaBH3CN을 함유하는 2.5 μL의 8 M 유레아를 포함하는 다이메틸화 반응 혼합물을 첨가하였으며, 반응을 30분 동안 37℃에서 진행하였다. 2.5% NH2OH를 함유하는 5 μL의 8 M 유레아를 첨가하여 다이메틸화 반응을 켄칭하였으며, 30분 동안 37℃에서 정치하였다.
340 μL의 0.1 M Tris pH 7.5를 첨가하여 검체를 희석하였고, 20 μL의 0.5 μg/μL 트립신(기질 대 효소 비율 20)을 소화를 위해 첨가하였으며, 37℃에서 2시간 동안 정치하였다. 7 μL의 5.75 mU/μL PNGase F를 각각의 검체(기질 대 효소 비율 5, 중량 기준)에 첨가하였으며, 37℃에서 1시간 동안 정치하였다. 마지막으로, 4 μL의 10% FA를 첨가하여 LC-MS 분석 전 소화를 중단시켰다.
실시예 1. 비위치 선택적 분획분자량법
정제된 단백질을 신규 서열분석하는 새로운 방법의 다이메틸화 검체 제조 및 LC-MS 분석을 사용하여 개발하였다. 방법의 조건을 최적화하기 위해 다양한 접근법을 시험하였고 비교하였다. 초기 접근법을 도 4에서 예시한 바와 같이 시험하였다. 이러한 접근법에서, 온전한 단백질을 비위치 선택적 방식으로 다이메틸화 시약으로 처리하여 N-말단 α-아민기 및 라이신 측쇄의 ε-아민기의 다이메틸화를 유도한 후, 다이메틸화 시약을 분획분자량(MWCO) 여과기와 완충제 교환하여 제거한다.
구체적으로, 검체는 유레아로 변성되며, HCHO 및 NaBH3CN과 함께 정치되어 아민기를 다이메틸화한다. 검체가 30K MWCO 여과기를 사용한 완충제 교환을 거치게 하여 다이메틸화 시약을 제거한다. 이후, 검체를 다이싸이오트레이톨(DTT)을 사용하여 시스테인 환원을 그리고 아이오도아세트아마이드(IAA)를 사용하여 알킬화를 수행하였다. 단백질을 rLys-C 및 트립신으로 효소 소화한 후, 최종적으로 LC-MS 분석을 거치게 하였다.
알려진 단백질 서열에 대해 이러한 방법을 사용한 예시적인 결과가 도 5에서 나타나 있다. 95%를 초과하는 수율을 예시적 단백질 서열에 대한 N-말단 세린(S)의 다이메틸화에 대해 달성하였다. 78%의 서열 적용범위를 달성하였다. 도 6의 질량 스펙트럼에서 나타낸 바와 같이, 강화된 다이메틸화 임모늄 이온을 고에너지 C-트랩 해리(HCD) 단편화 후 명확하게 관찰하였다.
해당 방법의 잠재적인 문제점은 라이신의 ε-아민의 비특이적 변형이 효소 소화를 방해하여 더 긴 서열이 생성되고 서열 적용범위가 낮아질 수 있다는 점을 포함한다. 또한, MWCO에 의한 완충제 교환은 방법을 수행하기 위해 상당한 시간을 추가하며 검체 손실을 야기하여 잠재적으로 총 이온 크로마토그램(TIC)에서 신호가 감소되게 한다.
실시예 2. 위치 선택적 분획분자량법
단백질 N-말단의 검출을 개선하고 분석을 지원하기 위해 실시예 1에서 설명된 방법을 더 변형하였다. 아민의 비위치 선택적 다이메틸화를 사용하는 대신, 위치 선택적 다이메틸화를 도 7에서 나타낸 바와 같이 사용하였다. N-말단의 α-아민기와 라이신 측쇄의 ε-아민기를 비교한 pKa 차이(각각 약 8 및 10)로 인해 각각은 상이한 pH에서 우선적으로 화학적으로 반응한다. 따라서, 특히 3 미만의 pH를 달성하기 위해 1% 아세트산의 첨가를 사용하여 다이메틸화 반응의 pH를 제어함으로써 N-말단 아민은 우선적으로 다이메틸화될 수 있으며 라이신은 상대적으로 변형되지 않은 상태로 유지된다.
알려진 단백질 서열에 대해 이러한 방법을 사용한 예시적인 결과가 도 8에서 나타나 있다. 분석은 99%를 초과하는 수율을 N-말단 다이메틸화에 대해 달성하였다는 점을 나타내었으며, 0.1% 미만의 다이메틸화를 라이신 및 내부 펩타이드의 ε-아민에서 관찰하였다. 따라서, 위치 선택적 다이메틸화는 N-말단 펩타이드 검출에 있어 상당한 개선을 가능하게 하였다.
실시예 3. 위치 선택적 원팟 방법
LC-MS로 달성 가능한 신호를 증가시키고 N-말단 펩타이드의 식별 및 서열분석을 더욱 개선하기 위해 실시예 2의 방법을 더 변형하였다. MWCO 단계를 사용한 완충제 교환을 추가 다이메틸화 반응을 방지하기 위해 다이메틸화 단계 후 혼합물에 NH2OH를 첨가하여 켄칭 단계로 대체하였다. 완충제 교환 단계를 생략하면 검체 손실이 감소하며 따라서 신호 강도가 높아진다.
이러한 방법을 사용한 예시적 결과는, 실시예 2의 MWCO의 방법과 비교하여, 도 9에서 나타나 있다. 이전 방법과 마찬가지로, 높은 수율을 N-말단 다이메틸화에 대해 달성하였으며, 0.1% 미만의 다이메틸화를 라이신 및 내부 펩타이드의 ε-아민에서 관찰하였다. 그러나, 이러한 원팟 방법은 MWCO 방법과 비교하여 TIC 신호의 극적인 개선을 나타내어 N-말단 펩타이드의 더 효과적인 검출 및 서열분석을 가능하게 하였다.
이러한 그리고 다른 매개변수는, 도 10에서 나타낸 바와 같이, 본 발명의 방법에 대해 최적화되었으며 위의 "위치 선택적 원팟 다이메틸화 프로토콜"하에서 상세하게 설명된다. 향후 실험을 위해 선택된 최적의 매개변수는 단백질을 초기에 변성시키기 위한 8 M 유레아의 사용을 포함하였다. 다이메틸화 반응을 위해, 선택된 최적의 매개변수는 1% 아세트산, 60 mM HCHO, 24 mM NaBH3CN, 15분의 반응 시간 및 37℃의 반응 온도를 포함하였다. 켄칭 과정을 위해, 선택된 최적의 매개변수는 15분 동안, 37℃에서, NH2OH의 사용을 포함하였다. 마지막으로, DTT를 환원제로 그리고 아이오도아세트아마이드를 알킬화제로 선택하였다.
실시예 4. 알려진 단백질 서열을 사용한 위치 선택적 다이메틸화의 방법 검증
본 발명의 방법의 사용을 검증하기 위해, 알려진 서열을 갖는 단백질이 위치 선택적 다이메틸화를 사용한 신규 N-말단 서열분석을 거치게 하였다. 도 11a는 항체 융합 단백질인 Ab1의 구조를 예시한다. Ab1은 N-말단의 이종성(heterogeneity)을 초래하는 주요 절단 종을 특징으로 한다. 도 11b는 주요 절단 부위, 예를 들어, 10M/11Y, 90T/91N, 및 99N/100T를 표시하는 화살표를 포함하는 Ab1의 서열을 예시한다.
Ab1가 위치 선택적 다이메틸화에 의한 신규 N-말단 서열분석을 거치게 하였으며, 절단에 의해 생성된 N-말단을 본 발명의 방법을 사용하여 성공적으로 검출하였다. 도 11c는 10M/11Y 절단된 단백질로부터 유래한 Y 임모늄 이온의 검출을 나타낸다. 도 11d는 90T/91N 절단으로부터 유래한 D 임모늄 이온의 검출을 나타낸다. 도 11e는 99N/100T 절단으로부터 유래한 T 임모늄 이온의 검출을 나타낸다.
특히, 99N/100T는 또한 비특이적 트립신 절단의 부위이다. 다이메틸화 반응이 발생하며 소화 전 켄칭되기 때문에, 소화 전 존재하는 N-말단 아민만 다이메틸화되며 임모늄 이온을 생성하여 실험 소화와 비교하여 생체내 절단으로부터 유래한 동일한 아미노산 서열을 갖는 펩타이드 단편의 분화를 가능하게 한다.
본 발명의 방법을 알려진 서열을 갖는 다른 단백질인 단클론성 항체 표준 NISTmAb를 사용하여 더 검증하였다. NISTmAb 중쇄(HC)의 N-말단의 약 99%를 피로글루타메이트(pyroQ)로 차단하여 다이메틸화 반응에 참여하는 것을 방지한다. pyroQ 또는 다수의 다른 변형 중 임의의 하나에 의한 N-말단 차단은 유리 N-말단 아민의 변형에 의존하는 기법에 대한 일반적인 과제이다. 그러나, 본 발명의 방법은 N-말단 펩타이드를 대부분의 N-말단이 차단된 경우에도 식별할 수 있을 만큼 충분히 높은 민감도를 입증한다. NISTmAb 분석의 예시적 방법 및 결과는 도 12에서 나타나 있으며, 이는 차단된 N-말단에도 불구하고 중쇄의 Q 임모늄 이온 및 경쇄의 D 임모늄 이온의 성공적인 식별을 나타낸다.
실시예 5. 알려지지 않은 N-말단 단백질 신규 서열분석의 사례 연구
본 발명은 방법은 알려진 단백질 N-말단의 신규 서열분석에 사용되었으며, 이는 실제 적용에서의 유용성을 입증하였다.
화농연쇄상구균으로부터 유래한 IdeS 단백질분해효소는 항체 치료제 개발에 유용한 도구이다(미국 공개 제2007/0237784 A1호). IdeS는 힌지 영역 아래의 IgG 항체를 특이적으로 절단하여, 2개의 Fc/2 단편 및 1개의 F(ab’)2(또는 Fab2) 단편을 생성한다. His 태그를 특징으로 하는 재조합 변형 형태의 IdeS는 FabRICATOR®라는 명칭으로 Genovis로부터 상업적으로 이용 가능하다.
FabRICATOR®의 온전한 SEC-MS 분석으로부터 유래한 TIC가 도 13a에서 나타나 있으며, 이는, 주요 단량체 종에 더하여, FabRICATOR®가 삼량체, 이량체 및 특징화되지 않은 절단 종을 포함함을 입증한다. Genovis는 FabRICATOR®의 분자량이 37,725 Da이라고 설명한다. 대조적으로, 기존에 공개된 IdeS 서열의 예측 질량은 도 13b에서 나타낸 바와 같이 36,644.5 Da이다. 이는 FabRICATOR®가 IdeS와 비교하여 추가의 개시되지 않은 아미노산을 포함하며, 이의 절단이 SEC-MS에서 볼 수 있는 절단된 종을 잠재적으로 발생시킬 수 있음을 시사한다. FabRICATOR®의 온전한 질량 분석 및 펩타이드 맵핑 분석으로부터 유래한 질량 스펙트럼이 각각 도 13c 및 도 13d에서 나타나 있다. 종래의 질량 분석 방법은 FabRICATOR®의 N-말단 서열을 식별할 수 없었다. DSFSANQEIR의 개시된 IdeS N-말단 서열 이전에 개시되지 않은 잠재적 N-말단 서열이 표시된다.
알려지지 않은 N-말단 서열의 신규 서열분석을 수행하기 위해, 대조 검체 및 다이메틸화된 검체를 동시에 제조하였다. 각각의 시작 검체의 FabRICATOR® 총량은 10 μg(0.05 μg/μL)이었다. 다이메틸화 시약을 대조 검체에 첨가하지 않은 점을 제외하면, 두 검체 모두를 위에서 설명한 위치 선택적 다이메틸화 방법을 사용하여 제조하였고 분석하였다. 각각의 검체의 단백질에 대한 크로마토그래피 주입량은 2 μg / 40 μL였다. N-말단 서열의 각각의 피크 쌍을 수동으로 식별하였다. 다이메틸화된 펩타이드는 LC 유지 시간이 다소 증가하고 질량이 28 Da 증가한 것으로 구별 가능하다. 신규 서열분석의 경우, 대조군 대 다이메틸화된 검체으로부터 유래한 각각의 b 이온은 다이메틸화된 N-말단 잔기로 인해 28 Da만큼 분리되었으며 각각의 y 이온은 동일한 정확한 질량을 가지고 있어 b 및 y 이온을 용이하게 식별할 수 있으며 따라서 명확하고 효율적인 서열분석을 할 수 있다. 이후 결과를 온전한 MS를 포함한 추가 기법을 사용하여 교차 검증하였다.
도 14a는 대조군 및 다이메틸화된(DiMe) 펩타이드를 비교하는 FabRICATOR® N-말단 펩타이드 1의 크로마토그램을 나타낸다. 다이메틸화된 펩타이드는 유지 시간이 증가한 것으로 나타났다. 도 14b는 상응하는 질량 스펙트럼을 나타내며, 이는 다이메틸화된 N-말단 펩타이드가 28 Da의 예측된 질량 이동을 가진다는 점을 나타낸다. 도 14c는 대조 검체의 FabRICATOR® N-말단 펩타이드 1의 MS/MS 스펙트럼을 나타낸다. 서열 내 제1 아미노산의 동일성은 여기서 구별 가능하지 않으며, 따라서, 서열 분석은 종래의 LC-MS/MS를 사용하여 가능하지 않다. 대조적으로, 도 14d는 다이메틸화 검체의 상응하는 스펙트럼을 나타낸다. 여기서, 다이메틸화된 G 잔기는 서열의 제1 아미노산으로 명확하게 표시된다. 도 14c 및 도 14d의 스펙트럼을 비교하여. b 이온의 동일성은, 다이메틸화된 검체에서 질량 이동이 없는 y 이온과 비교하여, 28 Da의 질량 이동이 있는 것을 기준으로 명확하게 구별 가능하다. 또한, 이는 각각의 스펙트럼 아래의 b 및 y 이온 표에서 표시되어 있다. 본 발명의 방법을 사용하여 FabRICATOR® N-말단 펩타이드 1이 GQQMGR 서열을 갖는 것으로 식별되었다.
동일한 과정을 추가 FabRICATOR® N-말단 펩타이드에 대해 반복하였다. 도 15a 내지 도 15c에서 나타낸 바와 같이, N-말단 펩타이드 2를 서열분석하였으며 GGQQMGR로 식별하였다. 도 16a 내지 도 16c에서 나타낸 바와 같이, N-말단 펩타이드 3을 서열분석하였으며 SMTGGQQMGR로 식별하였다. 도 17a 내지 도 17c에서 나타낸 바와 같이, N-말단 펩타이드 4를 서열분석하였으며 ASMTGGQQMGR로 식별하였다. 도 18a 내지 도 18c에서 나타낸 바와 같이, N-말단 펩타이드 5를 서열분석하였으며 DPL(I)ADSFSANQEIR로 식별하였다. 도 19a 내지 도 19c에서 나타낸 바와 같이, N-말단 펩타이드 6을 서열분석하였으며 RPDL(I)ADSFSANQEIR로 식별하였다. 모든 경우, 본 발명의 방법은 N-말단 펩타이드 및 N-말단 아미노산 잔기의 효율적인 표지 및 식별을 가능하게 하였으며, 이는 결국 b 이온의 식별 및 후속 아미노산 서열분석을 가능하게 하였다.
FabRICATOR® N-말단의 서열분석 결과는 도 20a에서 요약되어 있으며, 이는 본원에서 식별된 주요 N-말단 서열 및 개시된 IdeS N-말단 서열에 대한 이의 상대적인 위치를 나타낸다. N-말단 서열 MASMTGGQQMG는 T7 유전자의 T7 주요 캡시드 단백질로부터 유래한 T7 에피토프 태그로 식별되었다. T7 태그는 일반적으로 면역화학적 방법을 사용하여 단백질 분석을 용이하게 하기 위해 관심 단백질의 N-말단 또는 C-말단에 조작된다. 또한, 이러한 방법을 사용하여 식별된 부차 N-말단 서열이 도 20b에서 도시되어 있다.
본원에서 발견되는 주요 및 부차 N-말단 서열을 포함한 FabRICATOR®의 전체 서열은 도 20c에서 나타나 있다. 주요 N-말단 서열이 있는 전체 FabRICATOR® 서열은 37,725.4 Da의 예측 분자량을 가지며, 이는 37,725 Da의 개시된 FabRICATOR® 분자량에 상응한다. 식별된 N-말단 서열을 도 20d에서 나타낸 예시적 질량 스펙트럼을 사용하여 온전한 질량 분석법을 사용하여 더 검증하였다. 본원에서 식별도니 N-말단 서열을 포함하는 변이체에 상응하는 전체 질량을 갖는 다양한 종의 FabRICATOR®가 주석 표시되어 있다.
위의 분석의 FabRICATOR®의 서열 적용범위는 대조 검체(도 20e) 대 다이메틸화된 검체(도 20f)의 비교를 사용하여 볼 수 있다. 다이메틸화는 대조군과 비교하여 N-말단 펩타이드의 우수한 식별을 허용하고 N-말단 T7 태그에서 공통 절단 부위의 명확한 구분을 가능하게 하여 실시예 4에서 나타낸 바와 같이 절단 부위를 검출하는 본 발명 방법의 유효성을 재현한다.
본원에서 개시되는 방법은 종래의 펩타이드 매핑 프로토콜에 추가되는 경우 최소한의 추가 시간(약 30분) 또는 난도를 갖는 신규 N-말단 서열분석을 위한 효율적인 기법을 제공한다. 위치 선택적 원팟 다이메틸화를 사용한 서열분석은 N-말단 펩타이드의 신호 강도를 유의하게 개선하였고, 높은 표지 효율을 나타내었으며, 절단 부위를 식별할 수 있게 하였고, 주로 차단된 N-말단을 서열분석할 수 있게 하였으며, 생체내 절단 부위와 효소 소화 부위를 구별하였고, 온전한 질량 분석법 결과와 일치하는 알려지지 않은 N-말단을 정확하게 서열분석하는 것으로 나타났다.
본원의 방법의 추가 최적화가 고려된다. 예를 들어, 표지 효율성이 환원 및 알킬화 단계 후 위치 선택적 다이메틸화를 사용하여 더 증가하였다. 예시적 실험 매개변수가 도 21a에서 나타나 있으며(도 10과 비교). 99.1%의 표지 효율성이 입증되었다. 이러한 프로토콜은 위의 "추가 최적화된 프로토콜"하에서 상세하게 설명된다.
추가 최적화 방법은 임모늄 이온 촉발 MS/MS 데이터 획득이다. HCD-MS/MS에서 생성된 임모늄 이온은 N-말단 서열을 식별하고 이에 따라 단편화 기법을 맞춤화하기 위해 기구를 통해 실시간으로 식별될 수 있다. 임모늄 이온 촉발 MS/MS 데이터 획득은 데이터 분석을 간편화할 수 있다. 임모늄 이온의 자동화된 식별을 위한 예시적인 개략도가 도 21b에서 나타나 있다.
특정 시약, 분석물 및 방법 매개변수가 위의 예로서 설명되어 있으나, 본 발명의 방법은 이러한 예에 제한되지 않으며 통상의 기술자에 의해 결정되는 다양한 시약, 분석물 또는 방법 매개변수를 사용하여 적용될 수 있음을 이해하여야 한다.

Claims (22)

  1. 관심 단백질의 N-말단 도메인의 아미노산 서열을 결정하는 방법으로서,
    (a) 관심 단백질을 포함하는 검체를 적어도 하나의 다이메틸화 시약에 접촉시켜 다이메틸화 혼합물을 형성하는 단계;
    (b) 상기 다이메틸화 혼합물을 적어도 하나의 켄칭 시약과 접촉시켜 켄칭된 혼합물을 형성하는 단계;
    (c) 상기 켄칭된 혼합물을 액체 크로마토그래피 질량 분석법으로 분석하며 상기 분석법은 적어도 하나의 다이메틸화된 아미노산 잔기를 이온화하여 적어도 하나의 임모늄 이온을 형성하는 단계;
    (d) 상기 적어도 하나의 임모늄 이온의 존재를 기준으로 적어도 하나의 N-말단 펩타이드를 식별하는 단계; 및
    (e) (d)의 상기 적어도 하나의 N-말단 펩타이드의 질량 스펙트럼을 다이메틸화되지 않은 대조 검체의 상응하는 적어도 하나의 N-말단 펩타이드의 질량 스펙트럼과 비교하여 상기 관심 단백질의 N-말단 도메인의 아미노산 서열을 결정하는 단계를 포함하며,
    (a)의 상기 적어도 하나의 다이메틸화 시약은 N-말단 α-아민의 다이메틸화를 우선적으로 유도하는 조건하에서 접촉되는 방법.
  2. 제1항에 있어서, 상기 관심 단백질이 항체, 이중특이적 항체, 단클론성 항체, 융합 단백질, 항체 약물 접합체, 항체 단편 또는 단백질 약제학적 생성물인 방법.
  3. 제1항에 있어서, 상기 적어도 하나의 다이메틸화 시약이 HCHO, NaBH3CN, 이들의 중동위원소 및 이들의 조합으로 구성되는 군으로부터 선택되는 방법.
  4. 제1항에 있어서, 상기 다이메틸화 혼합물의 pH가 3 미만인 방법.
  5. 제1항에 있어서, 상기 다이메틸화 혼합물이 아세트산을 포함하는 방법.
  6. 제1항에 있어서, 상기 다이메틸화 혼합물의 온도가 약 20℃ 내지 약 37℃인 방법.
  7. 제1항에 있어서, 상기 다이메틸화 혼합물이 약 5분 내지 약 1시간 동안 정치되는 방법.
  8. 제1항에 있어서, 상기 켄칭 시약이 NH3, NH2OH 및 이들의 조합으로 구성되는 군으로부터 선택되는 방법.
  9. 제1항에 있어서, 상기 켄칭된 혼합물의 온도가 약 20℃내지 약 37℃인 방법.
  10. 제1항에 있어서, 상기 켄칭된 혼합물이 약 5분 내지 약 1시간 동안 정치되는 방법.
  11. 제1항에 있어서, 상기 검체 및/또는 상기 켄칭된 혼합물을 적어도 하나의 소화 효소에 접촉시키는 단계를 더 포함하는 방법.
  12. 제11항에 있어서, 상기 적어도 하나의 소화 효소가 트립신, 카이모트립신, LysC, LysN, AspN, GluC, ArgC 및 이들의 조합으로 구성되는 군으로부터 선택되는 방법.
  13. 제1항에 있어서, 상기 액체 크로마토그래피가 역상 액체 크로마토그래피, 이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 친화도 크로마토그래피, 소수성 상호작용 크로마토그래피, 친수성 상호작용 크로마토그래피, 혼합 모드 크로마토그래피 또는 이들의 조합을 포함하는 방법.
  14. 제1항에 있어서, 상기 액체 크로마토그래피 시스템이 상기 질량 분석기에 결합되는 방법.
  15. 제1항에 있어서, 상기 질량 분석기가 전기분무 이온화 질량 분석기, 나노 전기분무 이온화 질량 분석기 또는 삼중 사중극자 질량 분석기인 방법.
  16. 제1항에 있어서, 상기 질량 분석기가 다중 반응 모니터링 또는 병렬 반응 모니터링을 수행할 수 있는 방법.
  17. 제1항에 있어서, 상기 검체 및/또는 상기 켄칭된 혼합물을 적어도 하나의 알킬화제에 접촉시키는 단계를 더 포함하는 방법.
  18. 제17항에 있어서, 상기 알킬화제는 아이오도아세트아마이드인 방법.
  19. 제1항에 있어서, 상기 검체 및/또는 상기 켄칭된 혼합물을 적어도 하나의 환원제에 접촉시키는 단계를 더 포함하는 방법.
  20. 제19항에 있어서, 상기 환원제는 다이싸이오트레이톨인 방법.
  21. 제1항에 있어서, 상기 검체를 적어도 하나의 변성제에 접촉시키는 단계를 더 포함하는 방법.
  22. 제21항에 있어서, 상기 변성제는 유레아인 방법.
KR1020247004479A 2021-07-13 2022-07-12 위치 선택적 다이메틸화에 의한 단백질 n-말단 신규 서열분석 KR20240032972A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163221454P 2021-07-13 2021-07-13
US63/221,454 2021-07-13
PCT/US2022/036876 WO2023287828A1 (en) 2021-07-13 2022-07-12 Protein n-terminal de novo sequencing by position-selective dimethylation

Publications (1)

Publication Number Publication Date
KR20240032972A true KR20240032972A (ko) 2024-03-12

Family

ID=82846366

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247004479A KR20240032972A (ko) 2021-07-13 2022-07-12 위치 선택적 다이메틸화에 의한 단백질 n-말단 신규 서열분석

Country Status (10)

Country Link
US (1) US20230032607A1 (ko)
EP (1) EP4370928A1 (ko)
JP (1) JP2024526736A (ko)
KR (1) KR20240032972A (ko)
CN (1) CN117859065A (ko)
AU (1) AU2022309876A1 (ko)
CA (1) CA3225730A1 (ko)
CO (1) CO2024000351A2 (ko)
IL (1) IL309774A (ko)
WO (1) WO2023287828A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201715684D0 (en) * 2017-09-28 2017-11-15 Univ Gent Means and methods for single molecule peptide sequencing

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1522343A (en) 1923-05-02 1925-01-06 Thom Clarence Magnetic separator
WO2003031928A2 (en) * 2001-07-20 2003-04-17 Diversa Corporation Cellular engineering, protein expression profiling, differential labeling of peptides, and novel reagents therefor
GB0130228D0 (en) 2001-12-18 2002-02-06 Hansa Medica Ab Protein
AU2020368409A1 (en) * 2019-10-15 2022-05-19 Regeneron Pharmaceuticals, Inc. Methods for characterizing host-cell proteins

Also Published As

Publication number Publication date
CN117859065A (zh) 2024-04-09
IL309774A (en) 2024-02-01
CA3225730A1 (en) 2023-01-19
EP4370928A1 (en) 2024-05-22
US20230032607A1 (en) 2023-02-02
CO2024000351A2 (es) 2024-02-05
JP2024526736A (ja) 2024-07-19
AU2022309876A1 (en) 2024-01-18
WO2023287828A1 (en) 2023-01-19

Similar Documents

Publication Publication Date Title
JP2022517338A (ja) 抗体の断片化を特定及び定量する方法及びシステム
US20230032607A1 (en) Protein n-terminal de novo sequencing by position-selective dimethylation
US20230017454A1 (en) Bioanalysis of therapeutic antibodies and related products using immunoprecipitation and native scx-ms detection
US20230266335A1 (en) Maximizing hydrophobic peptide recovery using a mass spectrometry compatible surfactant
US20230092532A1 (en) Method to prevent sample preparation-induced disulfide scrambling in non-reduced peptide mapping
US20230348533A1 (en) Bioanalysis of therapeutic antibodies and related products using immunoprecipitation and native sec-pcd-ms detection
US20240142462A1 (en) Sequence variant analysis using heavy peptides
US20240255518A1 (en) Characterization of serine-lysine cross-link in antibody high molecular weight species
US20230243841A1 (en) Methods to prevent disulfide scrambling for ms-based proteomics
US20240337664A1 (en) Characterization of crosslinking sites in antibody-drug conjugates
US20220082571A1 (en) Methods for binding site identification using hydrogen exchange mass spectrometry
JP2024535263A (ja) 自動反復タンデム質量分析による血漿プロテオミクスプロファイリング方法
KR20240134146A (ko) 프로테오마이너에 의한 개선된 서열 변이 분석