KR20240083172A

KR20240083172A - 대장암 또는 진행성 선종 진단을 위한 바이오마커

Info

Publication number: KR20240083172A
Application number: KR1020247007008A
Authority: KR
Inventors: 다니엘 세리에; 클라우스 린드페인트너
Original assignee: 벤 바이오사이언시스 코포레이션
Priority date: 2021-08-04
Filing date: 2022-08-03
Publication date: 2024-06-11

Abstract

본원에서 질환들 및 병태들, 이를 테면 결장직장암 또는 진행성 선종의 진단에 유용한 글리코펩티드 바이오마커를 제시한다. 글리코펩티드 바이오마커를 생성시키는 방법, 질량 분광법을 사용하여 글리코펩티드들을 분석하는 방법들이 본원에서 또한 제시된다. 기계 학습 알고리즘을 이용하여 본원에서 글리코펩티드들을 분석하는 방법들이 본원에서 또한 제시된다.

Description

대장암 또는 진행성 선종 진단을 위한 바이오마커

관련 출원에 대한 상호-참조

본 출원은 2021년 8월 4일자로 출원된 U.S. 가특허 출원 번호 63/229,185를 우선권으로 주장하며, 이의 전체 내용은 모든 목적을 위해 참조로 본원에 참조로 편입된다.

서열 목록

전자 서열 목록의 내용 (166532000740SEQLIST.xml; 크기: 57,343바이트; 및 생성 날짜: 2022년 7월 28일)은 그 전문이 본원의 참고자료에 편입된다.

분야

본 개시내용은 글리칸, 펩티드들, 그리고 글리코펩티드들을 비롯한, 그러나 이에 국한되지 않는 당단백체 바이오마커, 뿐만 아니라 질량 분광법 및 임상 응용분야들에서 이들 바이오마커를 이용하는 것에 관계한다.

배경

글리코실화의 변화는 질환 상태, 이를 테면, 암의 상태와 관련하여 설명되었다. 가령, Dube, D. H.; Bertozzi, C. R. Glycans in Cancer and Inflammation - Potential for Therapeutics and Diagnostics. Nature Rev. Drug Disc. 2005, 4, 477-88, 참고, 이의 전체 내용은 모든 목적을 위해 전체 내용이 참조로 본 문서에 편입된다. 그러나, 환자의 샘플에서 글리코실화 변화를 기반으로 환자의 암, 이를 테면, 결장직장암 또는 진행성 선종을 진단하기 위한 임상적으로 관련된 비-침습적 분석법은 아직 충분히 입증되지 않았다.

결장직장암 또는 진행성 선종을 진단하기 위한 통상적인 임상적 검정에는 예를 들면, 효소-연계된 면역흡착 분석(ELISA)을 통해 환자의 혈액 내 단백질 양을 측정하는 단계가 내포된다. 그러나, ELISA는 감도와 정밀도에 한계가 있다. 예를 들면, ELISA는 ng/mL 범위의 농도에서만 단백질을 측정한다. 이러한 좁은 측정 범위는 이 농도 범위보다 실질적으로 높거나 낮은 농도에서 바이오마커를 측정하지 못함으로써 이 분석의 관련성을 제한한다. 또한, ELISA 분석은 분석할 수 있는 샘플 유형에 따라 제한된다. 보다 정확하고 민감한 검사가 부족하여, 결장직장암이나 진행성 선종으로 진단될 수 있는 환자들은 적절한 후속-치료를 받지 못한다.

대안으로, 질량 분광법(MS)은 글리코펩티드를 포함한 암-특이적 바이오마커에 대한 민감하고 정확한 측정을 제공한다. 예를 들면, Ruhaak, L.R., et al., Protein-Specific Differential Glycosylation of Immunoglobulins in Serum of Ovarian Cancer Patients DOI: 10.1021/acs.jproteome.5b01071; J. Proteome Res., 2016, 15, 1002-1010 (2016); also Miyamoto, S., et al., Multiple Reaction Monitoring for the Quantitation of Serum Protein Glycosylation Profiles: Application to Ovarian Cancer, DOI: 10.1021/acs.jproteome.7b00541, J. Proteome Res. 2018, 17, 222-233 (2017) 참고, 그 전체 내용은 모든 목적을 위해 전체 내용이 참조로 본 문서에 편입된다. 그러나, 일반적으로 암, 특히, 결장직장암이나 진행성 선종을 진단하기 위해 MS를 사용하는 것은 현재까지 임상적으로 관련된 방식으로 입증되지 않았다.

새로운 바이오마커와 이러한 바이오마커를 사용하여 암과 같은 질환 상태를 진단하기 위해 MS를 사용하는 새로운 방법이 필요하다. 글리칸, 펩티드들, 및 글리코펩티드들, 뿐만 아니라 이의 단편들을 포함하는 이러한 바이어마커, 그리고 이들 바이오마커들과 MS를 이용하여 결장직장암 또는 진행성 선종을 진단하는 방법들이 본원의 하기에서 제시된다.

요약

한 구체예에서, 서열 식별 번호: 1-38로부터 선택된 아미노산 서열로 구성된 글리코펩티드 또는 펩티드, 그리고 이의 조합들이 본원에서 제시된다.

또다른 구체예에서, 서열 식별 번호: 1-38로부터 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드 또는 펩티드, 그리고 이의 조합들이 본원에서 제시된다.

또다른 구체예에서, 하나 또는 그 이상의 MRM 전이를 검출하는 방법이 본원에 제시되는데, 이 방법은 다음을 포함한다: 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계, 이때 상기 생물학적 샘플은 하나 또는 그 이상의 당단백질들, 글리칸, 또는 당단백질들을 포함하고; 상기 샘플 내 글리코펩티드를 절단하거나 및/또는 분절화시키는 단계; 그리고 본원에서 기술된, 전이 1-38로 구성된 군에서 선택된 다중-반응-모니터링(MRM) 전이를 검출하는 단계.

또다른 구체예에서, 샘플의 분류를 확인하는 방법이 본원에서 제시되어 있고, 이 방법은 다음을 포함한다: 질량 분광법 (MS)을 이용하여 샘플에서 하나 또는 그 이상의 글리코펩티드들을 정량화하는 단계, 이때 상기 글리코펩티드들은 각각, 각 경우에 개별적으로, 본원에서 기술된 바와 같이, 예를 들면, 임의의 연합된 글리칸과 함께, 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열을 포함하거나, 필수적으로 이로 구성되거나, 또는 구성되며; 그리고 출력 확률을 생성하기 위해 훈련된 모델에 정량을 입력하는 단계; 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 샘플의 분류를 확인하는 단계.

여전히 또다른 구체예에서, 생물학적 샘플을 분류하는 방법이 본원에서 제시되어 있고, 이 방법은 다음을 포함한다: 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 상기 샘플 내 글리코펩티드를 절단하거나 및/또는 분절화시키는 단계; 전이 1-38로 구성된 군에서 선택된 MRM 전이를 검출하는 단계; 그리고 상기 글리코펩티드들 또는 이의 단편들을 정량화시키는 단계; 출력 확률을 생성하기 위해 훈련된 모델에 정량을 입력하는 단계; 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 상기 생물학적 샘플을 분류하는 단계.

또다른 구체예에서, 결장직장암 또는 진행성 선종이 있는 환자를 치료하는 방법이 본원에서 제시되며; 이 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 상기 샘플내 하나 또는 그 이상의 글리코펩티드들을 절단하거나 및/또는 분절화시키는 단계; 그리고 전이 1-38로 구성된 군에서 선택된 하나 또는 그 이상의 다중-반응-모니터링(MRM) 전이를 검출 및 정량화하는 단계; 출력 확률을 생성하기 위해 훈련된 모델에 정량을 입력하는 단계; 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 상기 환자를 분류하는 단계, 이때 상기 분류는 다음으로 구성된 군에서 선택된다: (A) 절제가 필요한 환자; (B) 치료제가 필요한 환자; (C) 알킬화 요법이 필요한 환자; (D) 표적 치료제가 필요한 환자; (E) 면역치료가 필요한 환자; (F) 면역 관문 억제제가 필요한 환자; (G) T-세포-관련된 치료가 필요한 환자; (H) 암 백신이 필요한 환자; (I) 방사능 요법이 필요한 환자; (J) 장내시경 검사가 필요한 환자; 또는 (K) 이의 조합; 분류 A 또는 K가 결정된 경우, 절제를 수행하거나, 또는 수행하였고; 분류 I 또는 K가 결정된 경우, 방사선 요법을 수행하거나, 또는 수행하였고; 분류 J 또는 K가 결정된 경우, 대장내시경 검사를 수행하거나, 또는 수행하였고; 또는 치료 유효량의 치료제를 이 환자에게 투여하고: 이때 분류 B 또는 K가 결정된 경우 치료제는 치료제들 중에서 선택되며; 또는 이때 분류 C 또는 K가 결정되면, 치료제는 알킬화제 중에서 선택되며; 또는 이때 분류 D 또는 K가 결정되면 표적 치료제 중에서 치료제가 선택되며; 이때 분류 E 또는 K가 결정되면 치료제는 면역치료제에서 선택되며; 이때 분류 F 또는 K가 결정되면 치료제는 면역 관문 억제제에서 선택되며; 이때 분류 G 또는 K가 결정되면 치료제는 T-세포-관련된 치료법에서 선택되며; 그리고 이때 분류 H 또는 K가 결정되면 치료제는 암 백신에서 선택된다.

또다른 구체예에서, 기계 학습 알고리즘을 훈련시키는 방법이 본원에서 제시되며, 이 방법은 다음을 포함한다: 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함하는 샘플을 나타내는 MRM 전이 신호의 제1 데이터 세트를 제공하는 단계; 대조군 샘플을 나타내는 MRM 전이 신호의 제2 데이터 세트를 제공하는 단계; 그리고 기계 학습 알고리즘을 이용하여 제1 데이터 세트와 제2 데이터 세트를 비교하는 단계. 특정 구체예들에서, 하이퍼파라미터 선별을 위한 교차-검증이 포함된 LASSO 방법론은 기계 학습 프로세스를 훈련하는 데 사용된다.

또다른 구체예에서, 결장직장암 또는 진행성 선종을 갖는 환자를 진단하는 방법이 본원에서 제시되며; 이 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 검출 및 정령화하기 위해; 또는 전이 1-38로 부터 선택된 하나 또는 그 이상의 MRM 전이를 검출하기 위해, 그리고 상기 MRM 전이와 연합된 글리칸, 펩티드들과 글리코펩티드들을 정량화하기 위해, QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 상기 생물학적 샘플의 질량 분광법을 수행하는 단계; 출력 확률을 생성하기 위해 상기 탐지된 글리코펩티드들 또는 MRM 전이의 정량을 훈련된 모델로 입력하는 단계, 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 상기 환자에 대한 진단 분류를 확인하는 단계; 그리고 상기 진단 분류에 기초하여 상기 환자는 결장직장암 또는 진행성 선종을 가지는 것으로 진단하는 단계. 일부 실시예들에서, 상기 방법에는 QQQ와 함께 MRM-MS를 이용하여 상기 생물학적 샘플의 질량 분광법을 수행하는 단계가 내포된다.

또다른 구체예에서, 글리코펩티드 표준, 완충제, 및 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함하는 키트가 본원에서 제시된다.

또다른 구체예에서, 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 본원에서 제시된다.

도 1은 모델 1을 이용한 결장직장암이 있을 확률의 플롯을 나타낸다.
도 2는 모델 2를 이용한 진행성 선종이 있을 확률의 플롯을 나타낸다.
도 3A는 개별 마커들에 대해 모델 1의 곡선 아래 면적(AUC)을 나타낸다. 도 3B는 개별 마커들에 대해 모델 2의 AUC 분석을 나타낸다.

상세한 설명

다음의 설명은 당업자가 본 발명을 제조 및 사용하고 이를 특정 응용 분야에 통합할 수 있도록 제공된다. 다양한 변형 뿐만 아니라 상이한 적용에서의 다양한 용도는 당업자에게 쉽게 명백할 것이며, 본원에서 특정된 일반 원리는 광범위한 실시예에 적용될 수 있다. 따라서, 본 명세서의 발명은 제시된 실시예에 제한되도록 의도되지 않으며, 본 명세서에 개시된 원리 및 신규한 특징들과 일치하는 가장 넓은 범위에 따라야 한다.

본 명세서 (수반된 청구범위, 요약 및 도면 포함)에 개시된 모든 특징들은 달리 명시되지 않는 한, 동일하거나 대등하거나 또는 유사한 목적을 제공하는 대체 특징들로 대체될 수 있다. 따라서, 명시적으로 달리 언급되지 않는 한, 공개된 각 특징은 대등하거나 또는 유사한 기능의 일반적인 시리즈 중 하나의 예시일 뿐이다.

라벨을 사용하는 경우, 왼쪽, 오른쪽, 앞, 뒤, 위, 아래, 앞, 뒤, 시계 방향 및 시계 반대 방향은 편의 목적으로만 사용되었으며, 임의의 특정한 고정된 방향을 암시하는 것은 아니다. 대신, 객체의 다양한 부분들 간에 상대적인 위치 및/또는 방향을 반영하는 데 사용된다.

I. 일반적 내용

본 개시내용은 생물학적 샘플 내 글리칸 및 글리코펩티드들의 프로파일링, 검출 및/또는 정량화를 위한 방법들 및 조성물들을 제공한다. 일부 실시예들에서, 글리칸 및 글리코펩티드 패널들은 결장직장암 또는 진행성 선종을 가지고 있는 환자들을 진단하고 스크리닝하기 위해 만들어진다. 일부 실시예들에서, 글리칸 및 글리코펩티드 패널들은 암을 가지고 있는 환자들을 진단하고 스크리닝하기 위해 만들어진다.

질량 분광법을 사용하여 생물학적 샘플들을 분석하기 위한 특정 기술들은 공지되어 있다. 예를 들면, 진단 및 치료 모니터링을 위한 생물학적 매개변수의 식별 및 사용의 제목으로 2018년 10월 18일자로 제출된 국제 특허 출원 번호 PCT/US2018/56574로써, 국제 PCT 특허 출원 공개 번호. WO2019079639A1을 참고하며, 그 전체 내용은 모든 목적을 위해 전체 내용이 참조로 본 문서에 편입된다. 진단 및 치료 모니터링을 위한 바이오마커로서 글리코펩티드의 식별 및 사용의 제목으로 2018년 8월 31일자로 제출된 US 특허 출원 공개 번호. US20190101544A1, US 특허 출원 번호. 16/120,016을 또한 참고하며, 그 전체 내용은 모든 목적을 위해 전체 내용이 참조로 본 문서에 편입된다.

II. 정의

본 명세서에 사용된 단수 형태 부정관사 ("a", "an") 및 정관사("the")는 문맥상 명확히 달리 지시하지 않는 한, 복수의 지시 대상을 포함한다.

본원에 이용된 바와 같이, 구절 "생물학적 샘플"이란 유기체로부터; 또는 유기체의 체액이나 조직으로부터 유래된, 획득된, 생성된, 제공된, 취하거나 또는 제거된 샘플을 지칭한다. 생물학적 샘플들에는 윤활액, 전혈, 혈청, 혈장, 소변, 가래, 조직, 타액, 눈물, 척수액, 생검으로 얻은 조직 절편; 조직 배양에 배치되거나 또는 적응된 세포(들); 땀, 점액, 분변 물질, 위액, 복액, 양수, 낭종액, 복막액, 췌장액, 모유, 폐 세척, 골수, 위산, 담즙, 정액, 고름, 방수, 삼출물 및 전술한 것의 파생물, 부분 및 조합을 비롯한 이와 유사한 것들이 내포되나, 이에 국한되지 않는다. 일부 실시예들에서, 생물학적 샘플들에는 혈액 및/또는 혈장이 내포되나, 이에 국한되지 않는다. 일부 실시예들에서, 생물학적 샘플들에는 소변 또는 대변이 내포되나, 이에 국한되지 않는다. 생물학적 샘플들에는 타액이 내포되나, 이에 국한되지 않는다. 생물학적 샘플들에는 조직 절개 및 조직 생검편이 내포되나, 이에 국한되지 않는다. 생물학적 샘플들에는 전술한 생물학적 샘플들의 임의의 파생물 또는 분획이 내포되나, 이에 국한되지 않는다.

본원에 이용된 바와 같이, 용어 "글리칸"은 당접합체의 탄수화물 잔기, 이를 테면 글리코펩티드, 당단백질, 당지질 또는 프로테오글리칸의 탄수화물 부분을 지칭한다. 글리칸 구조는 글리칸 참조 코드 번호로 기술되며, 또한 2020년 1월 31일자로 제출된 PCT 특허 출원 번호. PCT/US2020/0162861에서도 도시되며, 본원에서 이는 모든 목적을 위해 이의 전체 내용이 참조로 편입된다. 예를 들면, 2020년 1월 31일자로 제출된 PCT 특허 출원 번호. PCT/US2020/0162861의 도 1 ~ 도 14를 참고하며, 본원에서 이는 모든 목적을 위해 이의 전체 내용이 참조로 편입된다.

본원에 이용된 바와 같이, 용어 "글리코펩티드"란 펩티드에 결합된 적어도 하나의 글리칸 잔기를 갖는 펩티드를 말한다. 본원에서 기술된 각 구체예에서, 상기 글리코펩티드는 하나 또는 그 이상의 글리칸과 함께, 표시된 서열 식별 번호에 의해 명시된 아미노산 서열, 예를 들면 서열 식별 번호와 연합된 본원에서 기술된 아미노산 서열을 포함하는, 필수적으로 이로 구성된, 또는 이로 구성될 수 있다. 가령, 서열 식별 번호: 1에 따른 글리코펩티드는 본원에 이용된 바와 같이, 서열 식별 번호: 1의 아미노산 서열과 글리칸 5411에 따른 글리코펩티드를 지칭할 수 있으며, 이때 상기 글리칸은 잔기 107에 결합된다. 본원에 이용된 바와 같이, 서열 식별 번호: 1을 포함하는 글리코펩티드는 서열 식별 번호: 1의 아미노산 서열과 글리칸 5411을 포함하는 글리코펩티드를 지칭할 수 있으며, 이때 상기 글리칸은 잔기 107에 결합된다. 본원에 이용된 바와 같이, 서열 식별 번호: 1로 필수적으로 구성된 글리코펩티드는 서열 식별 번호: 1의 아미노산 서열과 글리칸 5411로 필수적으로 구성된 글리코펩티드를 지칭할 수 있으며, 이때 상기 글리칸은 잔기 107에 결합된다. 본원에 이용된 바와 같이, 서열 식별 번호: 1로 구성된 글리코펩티드는 서열 식별 번호: 1의 아미노산 서열과 글리칸 5411로 구성된 글리코펩티드를 지칭할 수 있으며, 이때 상기 글리칸은 잔기 107에 결합된다. 유사하게, 하기 섹션에서 기술된 글리칸과 함께 서열 식별 번호: 2-38에 용도가 적용된다.

본원에 이용된 바와 같이, 구절 "글리코실화된 펩티드들"이란 글리칸 잔기에 결합된 펩티드를 지칭한다.

본원에 이용된 바와 같이, 구절 "글리코펩티드 단편" 또는 "글리코실화된 펩티드 단편"이란 하나 또는 그 이상의 프로테아제(들)에 의한 분해, 또는 단편화, 가령, MRM-MS 기구 내에서 이온 단편화에 의해 글리코실화된 단백질로부터 글리코실화된 펩티드가 획득되는 아미노산 서열의 일부(그러나 전부는 아님)와 동일한 아미노산 서열을 갖는 글리코실화된 펩티드 (또는 글리코펩티드)를 지칭한다. MRM이란 다중-반응-모니터링을 지칭한다. 달리 명시되지 않는 한, 명세서 내에서, "글리코펩티드 단편들" 또는 "글리코펩티드의 의 단편들"이란 상기 당단백질이 글리코펩티드들을 만들기 위해 효소적으로 분해된 후, 임의선택적으로 질량 분광계를 이용하여 직접적으로 생성된 단편들을 지칭한다.

본원에 이용된 바와 같이, 구절 "다중 반응 모니터링 질량 분광계 (MRM-MS)"란 생물학적 샘플들 안에 글리칸 및 펩티드들의 표적화된 정량화를 위한 매우 민감하고, 선택적인 방법을 지칭한다. 기존의 질량 분광계와는 다르게, MRM-MS는 관심대상의 특정 펩티드 단편들을 구체적으로 찾기 위해 기기를 연구자들이 미세 조정할 수 있도록 하는, 매우 선택적 (표적화된)인 것이다. MRM은 관심대상의 펩티드들 단편들, 이를 테면, 잠재적 바이오마커의 더 큰 감도, 특이성, 속도 및 정량화를 허용한다. MRM-MS는 삼중 사중극자 (QQQ) 질량 분광계와 사중극자 비행-시간 (qTOF) 질량 분광계의 하나 또는 그 이상의 이용과 관련된다.

본원에 이용된 바와 같이, 구절 "글리코펩티드를 분해하는"이란 특이적 아미노산 펩티드 결합들을 파괴하기 위하여 효소를 이용하는 생물학적 공정을 지칭한다. 예를 들면, 글리코펩티드의 절단에는 상기 글리코펩티드의 단편들을 만들기 위해, 글리코펩티드에 절단 효소, 가령, 트립신을 접촉시키는 단계가 내포된다. 일부 실시예들에서, 글리코펩티드를 절단하기 위해 프로테아제 효소가 이용된다. 용어 "프로테아제"란 단백질분해를 수행하거나 큰 펩티드를 더 작은 폴리펩티드 또는 개별 아미노산으로 분해하는 효소를 의미한다. 프로테아제의 예시에는 세린 프로테아제, 트레오닌 프로테아제, 시스테인 프로테아제, 아스파르테이트 프로테아제, 글루탐산 프로테아제, 메탈로프로테아제, 아스파라긴 펩티드 리아제 중 하나 또는 그 이상, 그리고 전술한 것들의 임의의 조합들이 내포되나, 이에 국한되지 않는다.

본원에 이용된 바와 같이, 구절 "글리코펩티드의 단편화"란 MRM-MS 기구 안에서 일어나는 이온 단편화 공정을 지칭한다. 단편화로 동일한 질량을 가지지만, 전하량에 따라 다양한 조각을 생성시킬 수 있다.

본원에 이용된 바와 같이, 용어 "대상체"란 포유류를 지칭한다. 포유동물의 비-제한적인 예시에는 인간, 인간이 아닌 영장류, 마우스, 쥐, 개, 고양이, 말 또는 소, 그리고 이와 유사한 것들이 내포된다. 인간 이외의 포유동물은 질환, 질환-전 단계 또는 질환-전 상태의 동물 모델을 나타내는 대상으로서 유리하게 사용될 수 있다. 대상체는 암컷 또는 수컷일 수 있다. 대상체는 이전에 질환 또는 병태를 갖는 것으로 확인된 사람일 수 있으며, 선택적으로 해당 질환 또는 병태에 대한 치료적 개입을 이미 받았거나 받고 있는 대상체일 수 있다. 대안으로, 대상체는 이전에 질환이나 병태가 있는 것으로 진단되지 않은 대상체일 수도 있다. 예를 들면, 대상체는 질환 또는 병태에 대한 하나 또는 그 이상의 위험 인자를 나타내는 대상체, 질환 위험 인자를 나타내지 않는 대상체, 또는 질환 또는 병태에 대한 증상이 없는 대상체일 수 있다. 대상체는 또한 질환이나 병태를 앓고 있거나 발병할 위험이 있는 대상체일 수도 있다.

본원에 이용된 바와 같이, 용어 "환자"란 포유류 대상체를 지칭한다. 상기 포유류는 인간, 또는 말, 돼지, 개, 고양이, 유제류 및 영장류 동물을 포함하지만, 이에 제한되지 않는 동물일 수 있다. 한 구체예에서, 상기 개체는 인간이다. 본 명세서에 기술된 방법 및 용도는 의학적 용도 및 수의학적 용도 모두에 유용하다. "환자"는 다르게 명시되지 않는 한, 인간 대상체다.

본원에 이용된 바와 같이, "펩티드"는 다르게 명시되지 않는 한, 글리코펩티드들가 내포됨을 의미한다.

본원에 이용된 바와 같이, 구절 "다중-반응-모니터링(MRM) 전이"란 글리코펩티드, 또는 이의 단편이 MRM-MS에 의해 검출될 때 관찰되는 질량 대 전하(m/z) 피크 또는 신호를 의미한다. 상기 MRM 전이는 전구체와 생성물 이온의 전이로 탐지된다.

본원에 이용된 바와 같이, 구절 "다중-반응-모니터링(MRM) 전이의 검출"이란 질량 분광계가 직렬 질량 분석기 이온 단편화 방법을 사용하여 샘플을 분석하고, 샘플 내 이온 단편의 질량 대 전하 비율을 식별하는 프로세스를 의미한다. 이렇게 식별된 질량 대 전하 비율의 절대값을 전이라고 지칭한다. 본 명세서에 제시된 방법의 맥락에서, 질량 대 전하 비율 전이는 글리칸, 펩티드 또는 글리코펩티드 이온 단편을 나타내는 값이다. 본원에 제시된 일부 글리코펩티드들의 경우, 단일 전이 피크 또는 신호가 있다. 본원에 제시된 일부 다른 글리코펩티드들의 경우, 하나 초과의 전이 피크 또는 신호가 있다. MRM 질량 분광법에 대한 배경 정보는 질량 분광법 소개에서 확인할 수 있다: 2007년 11월, Instrumentation, Applications, and Strategies for Data Interpretation, 4th Edition, J. Throck Watson, O. David Sparkman, ISBN: 978-0-470-51634-8, 이의 전체 내용은 모든 목적을 위해 전체 내용이 본원의 참조로 편입된다.

본원에 이용된 바와 같이, 구절 "글리코펩티드를 나타내는 다중-반응-모니터링(MRM) 전이 검출"이란 MRM-MS 전이를 검출한 다음, 글리코펩티드를 식별하기 위해 글리코펩티드 또는 이의 단편의 계산된 질량 대 전하 비율(m/z)과 비교하는 MS 공정을 지칭한다. 본원에서 일부 실시예들에서, 단일 전이는 이들 글리코펩티드들이 동일한 MRM-MS 단편화 패턴을 갖는다면 두개 이상의 글리코펩티드들을 나타내는 것일 수 있다. 전이 피크 또는 신호에는 표 1-5, 가령, 표 1, 표 2, 표 3, 표 4, 표 5, 또는 이의 조합에 따라 서열 번호 1-38 및 이들의 조합으로부터 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드와 연합된 본원에 제시된 전이들이 내포되나, 이에 국한되지 않는다. 전이 피크 또는 신호에는 표 1-5, 가령, 표 1, 표 2, 표 3, 표 4, 표 5, 또는 이의 조합에 따라 서열 번호 1-38 및 이들의 조합으로부터 선택된 아미노산 서열로 구성된 글리코펩티드와 연합된 본원에 제시된 전이들이 내포되나, 이에 국한되지 않는다.

본원에 이용된 바와 같이, 용어 "참조 값"이라는 용어는 질환 상태가 공지된 개체(들)의 모집단에서 얻은 값을 의미한다. 상기 참조 값은 n-차원 특징 공간에 있을 수 있으며, 최대-여백 초평면에 의해 정의될 수 있다. 참조 값은 당업자에게 잘 알려진 표준 방법에 따라 임의의 특정 모집단, 하위-모집단, 또는 개체들의 모집단에 대해 결정될 수 있다.

본원에 이용된 바와 같이, 용어 "개체들의 모집단"이란 하나 또는 그 이상의 개체들을 의미한다. 한 구체예에서, 상기 개체들의 모집단은 하나의 개체로 구성된다. 한 구체예에서, 상기 개체들의 모집단은 다수 개체들을 포함한다. 본원에 이용된 바와 같이, 용어 "다수"란 적어도 2 (이를 테면 적어도 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 또는 30명) 명의 개체들을 의미한다. 한 구체예에서, 상기 개체들의 모집단은 적어도 10명의 개체들을 포함한다.

본원에 이용된 바와 같이, 용어 "치료" 또는 "치료하는"이란 대상체, 이를 테면 포유류에서 질환 또는 병태의 임의의 치료를 의미하는데: 1) 질환이나 병태를 예방하거나 보호하는 것, 즉 임상 증상이 발생하지 않도록 하는 것; 2) 질환 또는 병태를 억제하는 것, 즉 임상 증상의 발달을 저지하거나 억제하는 것; 및/또는 3) 질환 또는 병태를 완화시켜 임상 증상을 퇴행시키는 단계가 내포된다. 치료하는 것에는 치료가 필요한 대상체에게 치료제를 투여하는 것이 내포될 수 있다.

글리칸은 글리칸을 설명하기 위해 글리칸 기호 명명법(SNFG)을 사용하여 본원에서 언급된다. 상기 실례 시스템에 대한 설명은 인터넷에서 www.ncbi.nlm.nih.gov/glycans/snfg.html에서 확인할 수 있고, 그 전체 내용은 모든 목적을 위해 전체 내용이 참조로 본 문서에 편입된다. 글리칸의 그래픽 현시에 대한 기호 명명법은 Glycobiology 25: 1323-1324, 2015에 공개되며, 이는 인터넷 doi.org/10.1093/glycob/cwv091에서 볼 수 있다. SNFG 시스템의 그림을 보여주는 추가 정보가 있다. 이 시스템 내에서, Hex_i라는 용어는 다음과 같이 해석된다: i는 녹색 원(만노스)의 수와 황색 원(갈락토스)의 수를 나타낸다. 용어, HexNAC_j는 j를 사용하여 청색 사각형(GlcNAC)의 수를 나타낸다. 용어 Fuc_d는 d를 사용하여 적색 삼각형(푸코스)의 수를 나타낸다. 용어 Neu₅AC_l는 1을 이용하여 자주색 다이아몬드 (시알산)의 수를 나타낸다. 여기에 사용된 글리칸 참조 코드는 이러한 i, j, d 및 l 용어를 결합하여, 복합 4-5 숫자 글리칸 참조 코드, 가령, 5300 또는 5320을 만든다. 예로써, 도 1의 글리칸 3200 및 3210은 모두 3개 녹색 원 (만노스), 2개 청색 사각형 (GlcNAC's)을 포함하지만 자주색 다이어몬드 (시알산)는 없고, 그러나 글리칸 3210에는 또한 1개 적색 삼각형 (푸코스)이 포함된다. 예를 들면, 2020년 1월 31일자로 제출된 PCT 특허 출원 번호. PCT/US2020/0162861의 도 1 내지 도 14를 참고하며, 본원에서 이는 모든 목적을 위해 이의 전체 내용이 참조로 편입된다.

III. 바이오마커

바이오마커들이 본원에서 제시된다. 이들 바이오마커는 질환 및 병태 진단을 포함하되 이에 국한되지 않는 다양한 응용 분야에 유용하다. 예를 들면, 본원에서 제시된 특정 바이오마커들, 또는 이의 조합들은 결장직장암 또는 진행성 선종 암의 진단에 유용하다. 일부 다른 실시예에서, 본원에서 제시된 특정 바이오마커들, 또는 이의 조합들은 암, 자가면역 질환, 또는 섬유증을 가지고 있는 환자들을 진단하고 스크리닝하는데 유용하다. 일부 실시예들에서, 본원에서 제시된 바이오마커들, 또는 이의 조합들은 환자의 분류에 유용하여, 상기 환자는 적절한 의료 치료를 받는다. 일부 다른 실시예에서, 본원에서 제시된 바이오마커들, 또는 이의 조합들은 예를 들면, 환자를 치료하는 치료제를 확인함으로써, 환자의 질환 또는 병태의 치료 또는 완화에 유용하다. 일부 다른 실시예에서, 본원에서 제시된 바이오마커들, 또는 이의 조합들은 환자에 대한 치료 예후 또는 치료 방식의 성공 가능성 또는 생존 가능성을 결정하는데 유용하다.

일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 1-38 중 임의의 아미노산 서열을 포함하는 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 1-38로부터 선택된 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 1-38로부터 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 1-38로부터 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 중 임의의 아미노산 서열을 포함하는 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로부터 선택된 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로부터 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로부터 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 5의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 8의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 9의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 10의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 11의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 13의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 14의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 16의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 17의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 18의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 19의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 20의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 21의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 22의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 26의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 27의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 28의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 30의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 31의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 34의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 35의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 36의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 37의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 38의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 5의 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 8의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 9의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 10의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 11의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 13의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 14의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 16의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 17의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 18의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 19의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 20의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 21의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 22의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 26의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 27의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 28의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 30의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 31의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 34의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 35의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 36의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 37의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 38의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 5의 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 8의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 9의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 10의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 11의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 13의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 14의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 16의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 17의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 18의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 19의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 20의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 21의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 22의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 26의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 27의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 28의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 30의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 31의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 34의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 35의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 36의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 37의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 38의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 중 임의의 아미노산 서열을 포함하는 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로부터 선택된 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로부터 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로부터 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 중 임의의 아미노산 서열을 포함하는 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로부터 선택된 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로부터 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로부터 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 1-38로부터 선택된 적어도 하나의 아미노산 서열을 포함하는 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 1-38로부터 선택된 적어도 하나의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 1-38로부터 선택된 적어도 하나의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 1-38로부터 선택된 적어도 하나의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 다른 실시예에서, 본원의 방법들에는 MS에 의해 분석되며 샘플을 보유하는 환자를 선별하는 것이 내포되며, 이 분석의 결과를 이용하여 이 샘플 안에 서열 식별 번호: 1-38로부터 선택된 적어도 하나의 아미노산 서열을 포함하는 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정한다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 다른 실시예에서, 본원의 방법들에는 MS에 의해 분석되며 샘플을 보유하는 환자를 선별하는 것이 내포되며, 이 분석의 결과를 이용하여 이 샘플 안에 서열 식별 번호: 1-38로부터 선택된 적어도 하나의 아미노산 서열로 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정한다. 일부 다른 실시예에서, 본원의 방법들에는 MS에 의해 분석되며 샘플을 보유하는 환자를 선별하는 것이 내포되며, 이 분석의 결과를 이용하여 이 샘플 안에 서열 식별 번호: 1-38로부터 선택된 적어도 하나의 아미노산 서열로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정한다. 일부 다른 실시예에서, 본원의 방법들에는 MS에 의해 분석되며 샘플을 보유하는 환자를 선별하는 것이 내포되며, 이 분석의 결과를 이용하여 이 샘플 안에 서열 식별 번호: 1-38로부터 선택된 적어도 하나의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정한다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

글리칸, 펩티드들, 글리코펩티드들, 이의 단편들, 그리고 이의 조합들로부터 선택된 바이오마커들이 본원에서 제시된다. 일부 실시예들에서, 상기 글리코펩티드는 서열 식별 번호: 1-38로부터 선택된 아미노산 서열로 구성된다. 일부 실시예들에서, 상기 글리코펩티드는 서열 식별 번호: 1-38로부터 선택된 아미노산 서열로 필수적으로 구성된다.

글리칸, 펩티드들, 글리코펩티드들, 이의 단편들, 그리고 이의 조합들로부터 선택된 바이오마커들이 본원에서 제시된다. 일부 실시예들에서, 상기 글리코펩티드는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로부터 선택된 아미노산 서열을 포함한다. 일부 실시예들에서, 상기 글리코펩티드는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로부터 선택된 아미노산 서열로 구성된다. 일부 실시예들에서, 상기 글리코펩티드는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로부터 선택된 아미노산 서열로 필수적으로 구성된다.

글리칸, 펩티드들, 글리코펩티드들, 이의 단편들, 그리고 이의 조합들로부터 선택된 바이오마커들이 본원에서 제시된다. 일부 실시예들에서, 상기 글리코펩티드는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로부터 선택된 아미노산 서열을 포함한다. 일부 실시예들에서, 상기 글리코펩티드는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로부터 선택된 아미노산 서열로 구성된다. 일부 실시예들에서, 상기 글리코펩티드는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로부터 선택된 아미노산 서열로 필수적으로 구성된다.

글리칸, 펩티드들, 글리코펩티드들, 이의 단편들, 그리고 이의 조합들로부터 선택된 바이오마커들이 본원에서 제시된다. 일부 실시예들에서, 상기 글리코펩티드는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로부터 선택된 아미노산 서열을 포함한다. 일부 실시예들에서, 상기 글리코펩티드는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로부터 선택된 아미노산 서열로 구성된다. 일부 실시예들에서, 상기 글리코펩티드는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로부터 선택된 아미노산 서열로 필수적으로 구성된다.

a. O-글리코실화

일부 실시예들에서, 본원에서 제시된 글리코펩티드에는 O-글리코실화된 펩티드들이 내포된다. 이들 펩티드에는 아미노산의 산소 원자를 통하여 펩티드에 글리칸이 결합된, 글리코펩티드들이 내포된다. 전형적으로, 상기 글리칸이 결합된 아미노산은 트레오닌 (T) 또는 세린 (S)이다. 일부 실시예들에서, 상기 글리칸이 결합된 아미노산은 트레오닌 (T)이다. 일부 실시예들에서, 상기 글리칸이 결합된 아미노산은 세린 (S)이다.

특정 실시예에서, 상기 O-글리코실화된 펩티드들에는 알파-1-항트립신, 알파-1B-당단백질, 알파-2-마크로글로불린, 알파-1-항키모트립신, 알파-1-산 당단백질 1, 알파-1-산 당단백질 2, 아포리포프로테인 C-III (APOC3), 아포리포프로테인 D, 칼파인-3, 쎄룰루플라스민, 합토글로빈, 면역글로불린 중쇄 불변 μ, 혈장 칼리크레인, 혈청 파라옥소나제/아릴에스테라제 1, 단백질 unc-13호모로그 A, 알파-2-HS-당단백질 (FETUA), 그리고 이의 조합들로 구성된 군에서 선택된 펩티드들이 내포된다.

특정 실시예에서, 본원에서 제시된 O-글리코실화된 펩티드는 알파-1-항트립신 펩티드이다. 특정 실시예에서, 본원에서 제시된 O-글리코실화된 펩티드는 알파-1B-당단백질 펩티드이다. ㄹ 특정 실시예에서, 본원에서 제시된 O-글리코실화된 펩티드는 알파-2-마크로글로불린 펩티드이다. 특정 실시예에서, 본원에서 제시된 O-글리코실화된 펩티드는 알파-1-항키모트립신 펩티드이다. 특정 실시예에서, 본원에서 제시된 O-글리코실화된 펩티드는 알파-1-산 당단백질 1 펩티드이다. 특정 실시예에서, 본원에서 제시된 O-글리코실화된 펩티드는 알파-1-산 당단백질 2펩티드이다. 특정 실시예에서, 본원에서 제시된 O-글리코실화된 펩티드는 아포리포프로테인 C-III (APOC3) 펩티드이다. 특정 실시예에서, 본원에서 제시된 O-글리코실화된 펩티드는 아포리포프로테인 D 펩티드이다. 특정 실시예에서, 본원에서 제시된 O-글리코실화된 펩티드는 칼파인-3 펩티드이다. 특정 실시예에서, 본원에서 제시된 O-글리코실화된 펩티드는 쎄룰루플라스민 펩티드이다. 특정 실시예에서, 본원에서 제시된 O-글리코실화된 펩티드는 합토글로빈 펩티드이다. 특정 실시예에서, 본원에서 제시된 O-글리코실화된 펩티드는 면역글로불린 중쇄 불변 μ 펩티드이다. 특정 실시예에서, 본원에서 제시된 O-글리코실화된 펩티드는 혈장 칼리크레인 펩티드이다. 특정 실시예에서, 본원에서 제시된 O-글리코실화된 펩티드는 혈청 파라옥소나제/아릴에스테라제 1 펩티드이다. 특정 실시예에서, 본원에서 제시된 O-글리코실화된 펩티드는 단백질 unc-13호모로그 펩티드이다. 특정 실시예에서, 본원에서 제시된 O-글리코실화된 펩티드는 알파-2-HS-당단백질 (FETUA)이다.

b. N-글리코실화

일부 실시예들에서, 본원에서 제시된 글리코펩티드에는 N-글리코실화된 펩티드들이 내포된다. 이들 펩티드에는 아미노산의 질소 원자를 통하여 펩티드에 글리칸이 결합된, 글리코펩티드들이 내포된다. 전형적으로, 상기 글리칸이 결합된 아미노산은 아스파라긴 (N) 또는 아르기닌 (R)이다. 일부 실시예들에서, 상기 글리칸이 결합된 아미노산은 아스파라긴 (N)이다. 일부 실시예들에서, 상기 글리칸이 결합된 아미노산은 아르기닌 (R)이다.

특정 실시예에서, N-글리코실화된 펩티드들에는 으로 구성된 군에서 선택된 구성요소들이 내포되며, 특정 실시예에서, O-글리코실화된 펩티드들에는 알파-1-항트립신, 알파-1B-당단백질, 알파-2-마크로글로불린, 알파-1-항키모트립신, 알파-1-산 당단백질 1, 알파-1-산 당단백질 2, 아포리포프로테인 C-III (APOC3), 아포리포프로테인 D, 칼파인-3, 쎄룰루플라스민, 합토글로빈, 면역글로불린 중쇄 불변 μ, 혈장 칼리크레인, 혈청 파라옥소나제/아릴에스테라제 1, 단백질 unc-13호모로그 A, 알파-2-HS-당단백질 (FETUA), 그리고 이의 조합들로 구성된 군에서 선택된 펩티드들이 내포된다.

특정 실시예에서, 본원에서 지시된 N-글리코실화된 펩티드는 알파-1-항트립신 펩티드이다. 특정 실시예에서, 본원에서 지시된 N-글리코실화된 펩티드는 알파-1B-당단백질 펩티드이다. 특정 실시예에서, 본원에서 지시된 N-글리코실화된 펩티드는 알파-2-마크로글로불린 펩티드이다. 특정 실시예에서, 본원에서 지시된 N-글리코실화된 펩티드는 알파-1-항키모트립신 펩티드이다. 특정 실시예에서, 본원에서 지시된 N-글리코실화된 펩티드는 알파-1-산 당단백질 1 펩티드이다. 특정 실시예에서, 본원에서 지시된 N-글리코실화된 펩티드는 알파-1-산 당단백질 2펩티드이다. 특정 실시예에서, 본원에서 지시된 N-글리코실화된 펩티드는 아포리포프로테인 C-III (APOC3) 펩티드이다. 특정 실시예에서, 본원에서 지시된 N-글리코실화된 펩티드는 아포리포프로테인 D 펩티드이다. 특정 실시예에서, 본원에서 지시된 N-글리코실화된 펩티드는 칼파인-3 펩티드이다. 특정 실시예에서, 본원에서 지시된 N-글리코실화된 펩티드는 쎄룰루플라스민 펩티드이다. 특정 실시예에서, 본원에서 지시된 N-글리코실화된 펩티드는 합토글로빈 펩티드이다. 특정 실시예에서, 본원에서 지시된 N-글리코실화된 펩티드는 면역글로불린 중쇄 불변 μ 펩티드이다. 특정 실시예에서, 본원에서 지시된 N-글리코실화된 펩티드는 혈장 칼리크레인 펩티드이다. 특정 실시예에서, 본원에서 지시된 N-글리코실화된 펩티드는 혈청 파라옥소나제/아릴에스테라제 1 펩티드이다. 특정 실시예에서, 본원에서 지시된 N-글리코실화된 펩티드는 단백질 unc-13호모로그 펩티드이다. 특정 실시예에서, 본원에서 지시된 N-글리코실화된 펩티드는 알파-2-HS-당단백질 (FETUA)이다.

c. 펩티드 및 글리코펩티드들

일부 실시예들에서, 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열을 포함하는 글리코펩티드가 본원에서 제시된다.

일부 실시예들에서, 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드가 본원에서 제시된다.

일부 실시예들에서, 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드가 본원에서 제시된다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 1에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 1에 따른 글리코펩티드는 글리칸 5411을 더 포함하며, 이때 상기 글리칸(들)은 잔기 107에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 A1AT-GP001_107_5411이며, 가령, 표 10을 참조한다. 본원에서 A1AT는 알파-1-항트립신을 지칭한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 2에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 2에 따른 글리코펩티드는 글리칸 6503을 더 포함하며, 이때 상기 글리칸(들)은 잔기 271에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 A1AT-GP001_271_6503이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 3에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 3에 따른 글리코펩티드는 글리칸 5401을 더 포함하며, 이때 상기 글리칸(들)은 잔기 271에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 A1AT-GP001_271_5401이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 4에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 4에 따른 글리코펩티드는 글리칸 5402를 더 포함하며, 이때 상기 글리칸(들)은 잔기 179에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 A1BG-GP002_179_5421/5402이며, 가령, 표 10을 참조한다. 본원에서 A1BG는 알파-1B-당단백질로 지칭된다. 본원에서, 두 개의 글리칸이 사이에 슬래시(/)로 표시되는 경우, 이는 달리 명시적으로 지정하지 않는 한, 다음을 의미하는데, 질량 분석법은 가령, 두 글리칸은 공통된 질량 대 전하 비율을 공유하기 때문애 이 두 글리칸을 구별할 수 없다. 달리 명시하지 않는 한, 5421/5402이란 글리칸 5421 또는 5402이 존재한다는 것을 의미한다. 글리칸 5421/5402의 양의 정량화에는 임의의 글리칸 5421의 검출된 양, 뿐만 아니라 임의의 글리칸 5402의 검출된 양의 합산이 내포된다. 본원에서 A1BG는 알파-1B-당단백질로 지칭된다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 5에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 5에 따른 글리코펩티드는 글리칸 5402를 더 포함하며, 이때 상기 글리칸(들)은 잔기 1424에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 A2MG-GP004_1424_5402이며, 가령, 표 10을 참조한다. 본원에서 A2MG는 알파-2-마크로글로불린을 지칭한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 6에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 6에 따른 글리코펩티드는 글리칸 5412를 더 포함하며, 이때 상기 글리칸(들)은 잔기 1424에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 A2MG-GP004_1424_5412이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 7에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 7에 따른 글리코펩티드는 글리칸 5402를 더 포함하며, 이때 상기 글리칸(들)은 잔기 55에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 A2MG-GP004_55_5402이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 8에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 8에 따른 글리코펩티드는 글리칸 5401을 더 포함하며, 이때 상기 글리칸(들)은 잔기 869에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 A2MG-GP004_869_5401이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 9에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 9에 따른 글리코펩티드는 글리칸 6301을 더 포함하며, 이때 상기 글리칸(들)은 잔기 869에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 A2MG-GP004_869_6301이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 10에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 10에 따른 글리코펩티드는 글리칸 7603을 더 포함하며, 이때 상기 글리칸(들)은 잔기 271에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 AACT-GP005_271_7603이며, 가령, 표 10을 참조한다. 본원에서 AACT는 알파-1-항키모트립신을 지칭한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 11에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 11에 따른 글리코펩티드는 글리칸 9804를 더 포함하며, 이때 상기 글리칸(들)은 잔기 103에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 AGP1-GP007_103_9804이며, 가령, 표 10을 참조한다. 본원에서 AGP는 알파-1-산 당단백질 1을 지칭한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 12에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 12에 따른 글리코펩티드는 글리칸 6501을 더 포함하며, 이때 상기 글리칸(들)은 잔기 33에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 AGP1-GP007_33_6501이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 13에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 13에 따른 글리코펩티드는 글리칸 6502를 더 포함하며, 이때 상기 글리칸(들)은 잔기 93에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 AGP1-GP007_93_6502이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 14에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 14에 따른 글리코펩티드는 글리칸 7611을 더 포함하며, 이때 상기 글리칸(들)은 잔기 93에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 AGP1-GP007_93_7611이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 15에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 15에 따른 글리코펩티드는 글리칸 6503을 더 포함하며, 이때 상기 글리칸(들)은 잔기 103에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 AGP2-GP008_103_6503이며, 가령, 표 10을 참조한다. 본원에서 AGP는 알파-1-산 당단백질 2를 지칭한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 16에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 16에 따른 글리코펩티드는 글리칸 1102를 더 포함하며, 이때 상기 글리칸(들)은 잔기 74에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 APOC3-GP012_74_1102이며, 가령, 표 10을 지칭한다. 본원에서 APOC는 아포리포프로테인 C-III를 지칭한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 17에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 17에 따른 글리코펩티드는 글리칸 5402 또는 5421을 더 포함하며, 이때 상기 글리칸(들)은 잔기 98에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 APOD-GP014_98_5402/5421이며, 가령, 표 10을 참조한다. 본원에서 APOD는 아포리포프로테인 D를 지칭한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 18에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 18에 따른 글리코펩티드는 글리칸 5410을 더 포함하며, 이때 상기 글리칸(들)은 잔기 98에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 APOD-GP014_98_5410이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 19에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 19에 따른 글리코펩티드는 글리칸 6510을 더 포함하며, 이때 상기 글리칸(들)은 잔기 98에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 APOD-GP014_98_6510이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 20에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 20에 따른 글리코펩티드는 글리칸 6530을 더 포함하며, 이때 상기 글리칸(들)은 잔기 98에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 APOD-GP014_98_6530이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 21에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 21에 따른 글리코펩티드는 글리칸 9800을 더 포함하며, 이때 상기 글리칸(들)은 잔기 98에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 APOD-GP014_98_9800이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 22에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 22에 따른 글리코펩티드는 글리칸 6513을 더 포함하며, 이때 상기 글리칸(들)은 잔기 366에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 CAN3-GP022_366_6513이며, 가령, 표 10을 참조한다. 본원에서 CAN은 칼파인-3을 지칭한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 23에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 23에 따른 글리코펩티드는 글리칸 5412를 더 포함하며, 이때 상기 글리칸(들)은 잔기 138에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 CERU-GP023_138_5412이며, 가령, 표 10을 참조한다. 본원에서 CERU는 쎄룰루플라스민을 지칭한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 24에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 24에 따른 글리코펩티드는 글리칸 5421 또는 5402를 더 포함하며, 이때 상기 글리칸(들)은 잔기 138에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 CERU-GP023_138_5421/5402이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 25에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 25에 따른 글리코펩티드는 글리칸 5401을 더 포함하며, 이때 상기 글리칸(들)은 잔기 176에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 FETUA-GP036_176_5401이며, 가령, 표 10을 참조한다. 본원에서 FETUA는 알파-2-HS-당단백질을 지칭한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 26에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 26에 따른 글리코펩티드는 글리칸 6513을 더 포함하며, 이때 상기 글리칸(들)은 잔기 176에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 FETUA-GP036_176_6513이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 27에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 27에 따른 글리코펩티드는 글리칸 5401을 더 포함하며, 이때 상기 글리칸(들)은 잔기 207에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 HPT-GP044_207_5401이며, 가령, 표 10을 참조한다. 본원에서 HPT는 합토글로빈을 지칭한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 28에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 28에 따른 글리코펩티드는 글리칸 5402 또는 5421을 더 포함하며, 이때 상기 글리칸(들)은 잔기 241에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 HPT-GP044_241_5402/5421이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 29에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 29에 따른 글리코펩티드는 글리칸 5511을 더 포함하며, 이때 상기 글리칸(들)은 잔기 241에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 HPT-GP044_241_5511이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 30에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 30에 따른 글리코펩티드는 글리칸 6511을 더 포함하며, 이때 상기 글리칸(들)은 잔기 241에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 HPT-GP044_241_6511이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 31에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 31에 따른 글리코펩티드는 글리칸 7511을 더 포함하며, 이때 상기 글리칸(들)은 잔기 241에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 HPT-GP044_241_7511이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 31에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 31에 따른 글리코펩티드는 글리칸 4310을 더 포함하며, 이때 상기 글리칸(들)은 잔기 46에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 IgM-GP053_46_4310이며, 가령, 표 10을 참조한다. 본원에서 IgM은 면역글로불린 중쇄 불변 μ를 지칭한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 33에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 33에 따른 글리코펩티드는 글리칸 6503을 더 포함하며, 이때 상기 글리칸(들)은 잔기 494에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 KLKB1-GP056_494_6503이며, 가령, 표 10을 참조한다. 본원에서 KLKB는 혈장 칼리크레인을 지칭한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 34에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 34에 따른 글리코펩티드는 글리칸 5420을 더 포함하며, 이때 상기 글리칸(들)은 잔기 324에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 PON1-GP060_324_5420이며, 가령, 표 10을 참조한다. 본원에서 PON은 혈청 파라옥소나제/아릴에스테라제 1을 지칭한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 35에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 35에 따른 글리코펩티드는 글리칸 6501을 더 포함하며, 이때 상기 글리칸(들)은 잔기 324에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 PON1-GP060_324_6501이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 36에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 36에 따른 글리코펩티드는 글리칸 6502를 더 포함하며, 이때 상기 글리칸(들)은 잔기 324에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 PON1-GP060_324_6502이며, 가령, 표 10을 참조한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 37에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 37에 따른 글리코펩티드는 글리칸 5431을 더 포함하며, 이때 상기 글리칸(들)은 잔기 1005에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 UN13A-GP066_1005_5431이며, 가령, 표 10을 참조한다. 본원에서 UN13은 단백질 unc-13호모로그 A를 지칭한다.

특정 실시예에서, 상기 글리코펩티드 아미노산 서열은 서열 식별 번호: 38에서 선택된 아미노산 서열을 포함하는, 이로 필수적으로 구성된, 또는 구성된다. 특정 실시예들에서, 서열 식별 번호: 38에 따른 글리코펩티드는 글리칸 7420을 더 포함하며, 이때 상기 글리칸(들)은 잔기 1005에 결합된다. 일부 실시예들에서, 상기 글리코펩티드는 UN13A-GP066_1005_7420이며, 가령, 표 10을 참조한다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 글리코펩티드는 서열 식별 번호: 1-38로부터 선택된 적어도 하나의 아미노산 서열 또는 이의 조합을 포함한다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 글리코펩티드는 서열 식별 번호: 1-38로부터 선택된 아미노산 서열의 조합이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 하나 또는 그 이상의 펩티드들이 본원에서 제시되며, 각 경우에 개별적으로 각 펩티드는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로부터 선택된 아미노산 서열로 구성된 펩티드다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 하나 또는 그 이상의 펩티드들이 본원에서 제시되며, 각 경우에 개별적으로 각 펩티드는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로부터 선택된 아미노산 서열로 구성된 펩티드다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 하나 또는 그 이상의 펩티드들이 본원에서 제시되며, 각 경우에 개별적으로 각 펩티드는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 그리고 이의 조합들로부터 선택된 아미노산 서열로 구성된 펩티드다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 하나 또는 그 이상의 펩티드들이 본원에서 제시되며, 각 경우에 개별적으로 각 펩티드는 서열 식별 번호: 1-38 또는 이의 조합들로부터 선택된 적어도 하나의 아미노산 서열아미노산 서열을 포함하는 펩티드다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 하나 또는 그 이상의 펩티드들이 본원에서 제시되며, 각 경우에 개별적으로 각 펩티드는 서열 식별 번호: 1-38 및 이의 조합들로부터 적어도 하나의 아미노산 서열로 필수적으로 구성된 펩티드다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 하나 또는 그 이상의 펩티드들이 본원에서 제시되며, 각 경우에 개별적으로 각 펩티드는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 및 이의 조합들로부터 선택된 적어도 하나의 아미노산 서열을 포함하는 펩티드다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 하나 또는 그 이상의 펩티드들이 본원에서 제시되며, 각 경우에 개별적으로 각 펩티드는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로부터 선택된 아미노산 서열로 필수적으로 구성된 펩티드다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 하나 또는 그 이상의 펩티드들이 본원에서 제시되며, 각 경우에 개별적으로 각 펩티드는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 그리고 이의 조합들로부터 선택된 적어도 하나의 아미노산 서열을 포함하는 펩티드다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 하나 또는 그 이상의 펩티드들이 본원에서 제시되며, 각 경우에 개별적으로 각 펩티드는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로부터 선택된 아미노산 서열로 필수적으로 구성된 펩티드다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 하나 또는 그 이상의 펩티드들이 본원에서 제시되며, 각 경우에 개별적으로 각 펩티드는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 그리고 이의 조합들로로부터 선택된 적어도 하나의 아미노산 서열을 포함하는 펩티드다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 하나 또는 그 이상의 펩티드들이 본원에서 제시되며, 각 경우에 개별적으로 각 펩티드는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 그리고 이의 조합들로부터 선택된 아미노산 서열로 필수적으로 구성된 펩티드다.

IV. 바이오마커를 이용하는 방법들

A. 글리코펩티드들을 검출하기 위한 방법들

일부 구체예들에서, 검출 하나 또는 그 이상의 다중-반응-모니터링(MRM) 전이를 검출하는 방법이 본원에서 제공되며, 이 방법은 다음을 포함한다: 환자로부터 생물학적 샘플을 수득하는, 또는 수득하였고, 이때 상기 생물학적 샘플은 표 9에서 제시된 하나 또는 그 이상의 당단백질들을 포함하며; 상기 샘플 내 하나 또는 그 이상의 당단백질을 하나 또는 그 이상의 글리코펩티드로 절단시키고 및/또는 단편화시키고; 그리고 전이 1-38로 구성된 군에서 선택된 다중-반응-모니터링(MRM) 전이를 검출한다. 일부 구체예들에서, 상기 전이 1-38은 상기 생물학적 샘플로부터 적어도 하나의 펩티드 구조를 포함하는 펩티드 구조 데이터에 상응한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 표 10에서 제시된 하나 또는 그 이상의 글리코펩티드 구조들을 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-38 중 임의의 하나의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 포함한다.

일부 구체예들에서, 하나 또는 그 이상의 다중-반응-모니터링(MRM) 전이를 검출하는 방법이 본원에서 제시되며, 이 방법은 다음을 포함한다: 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계, 이때 상기 생물학적 샘플은 하나 또는 그 이상의 글리코펩티드를 포함하며; 상기 샘플 내 글리코펩티드를 절단하거나 및/또는 분절화시키는 단계; 그리고 전이 1-38로 구성된 군에서 선택된 다중-반응-모니터링(MRM) 전이를 검출하는 단계. 각종 실시예들에서, 이들 전이에는 표 1-5에서 임의의 하나 또는 그 이상의 전이가 내포될 수 있다. 각종 실시예들에서, 이들 전이에는 표 1-3에서 임의의 하나 또는 그 이상의 전이가 내포될 수 있다. 각종 실시예들에서, 이들 전이에는 표 1에서 임의의 하나 또는 그 이상의 전이가 내포될 수 있다. 각종 실시예들에서, 이들 전이에는 표 2에서 임의의 하나 또는 그 이상의 전이가 내포될 수 있다. 각종 실시예들에서, 이들 전이에는 표 3에서 임의의 하나 또는 그 이상의 전이가 내포될 수 있다. 각종 실시예들에서, 이들 전이에는 표 4에서 임의의 하나 또는 그 이상의 전이가 내포될 수 있다. 각종 실시예들에서, 이들 전이에는 표 5에서 임의의 하나 또는 그 이상의 전이가 내포될 수 있다. 이들 전이는 글리코펩티드들을 나타낼 수 있다.

일부 실시예들에서, 본원에서 하나 또는 그 이상의 글리코펩티드를 검출하는 방법이 제시되며, 이때 각 경우에서 각 글리코펩티드는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드로부터 선택된다. 일부 실시예들에서, 본원에서 하나 또는 그 이상의 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 하나 또는 그 이상의 글리코펩티드는 표 10으로부터 선택된다.

일부 실시예들에서, 본원에서 하나 또는 그 이상의 글리코펩티드를 검출하는 방법이 제시되며, 이때 각 경우에서 각 글리코펩티드는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드로부터 선택된다.

일부 실시예들에서, 본원에서 하나 또는 그 이상의 글리코펩티드를 검출하는 방법이 제시되며, 이때 각 경우에서 각 글리코펩티드는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드로부터 선택된다.

일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 5의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 8의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 9의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 10의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 11의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 13의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 14의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 16의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 17의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 18의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 19의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 20의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 21의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 22의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 26의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 27의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 28의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 30의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 31의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 34의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 35의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 36의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 37의 아미노산 서열로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 38의 아미노산 서열로 구성된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 5의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 8의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 9의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 10의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 11의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 13의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 14의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 16의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 17의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 18의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 19의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 20의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 21의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 22의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 26의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 27의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 28의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 30의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 31의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 34의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 35의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 36의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 37의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 38의 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 환자로부터 취한 샘플은 MS에 의해 분석되며, 결과는 이 샘플 안에 서열 식별 번호: 5의 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드의 존재, 절대량, 및/또는 상대적 양을 결정하는데 이용된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 8의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 9의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 10의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 11의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 13의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 14의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 16의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 17의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 18의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 19의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 20의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 21의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 22의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 26의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 27의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 28의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 30의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 31의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 34의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 35의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 36의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 37의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 본원에서 글리코펩티드를 검출하는 방법이 제시되며, 이때 상기 글리코펩티드는 샘플 내 서열 식별 번호: 38의 아미노산 서열로 구성되거나, 또는 필수적으로 구성된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 본원에서 하나 또는 그 이상의 글리코펩티드를 검출하는 방법이 제시되며, 이때 각 경우에서 각 글리코펩티드는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 군에서 선택된 글리코펩티드로부터 선택된다.

일부 실시예들에서, 본원에서 하나 또는 그 이상의 글리코펩티드를 검출하는 방법이 제시되며, 이때 각 경우에서 각 글리코펩티드는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드로부터 선택된다.

일부 실시예들에서, 본원에서 하나 또는 그 이상의 글리코펩티드를 검출하는 방법이 제시되며, 이때 각 경우에서 각 글리코펩티드는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드로부터 선택된다.

일부 실시예들에서, 본원에서 하나 또는 그 이상의 글리코펩티드를 검출하는 방법이 제시되며, 이때 각 경우에서 각 글리코펩티드는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 군에서 선택된 글리코펩티드로부터 선택된다.

일부 실시예들에서, 본원에서 하나 또는 그 이상의 글리코펩티드를 검출하는 방법이 제시되며, 이때 각 경우에서 각 글리코펩티드는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드로부터 선택된다.

일부 실시예들에서, 본원에서 하나 또는 그 이상의 글리코펩티드를 검출하는 방법이 제시된다. 일부 실시예들에서, 본원에서 하나 또는 그 이상의 글리코펩티드 단편들을 검출하는 방법이 제시된다. 특정 실시예에서, 상기 방법에는 상기 글리코펩티드, 또는 이의 단편이 속하는 글리코펩디드의 검출 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 표 9에서 제시된 당단백질의 검출 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 39-54 중 임의의 하나의 아미노산 서열을 포함하는 당단백질의 검출 단계가 내포된다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 알파-1-항트립신 (A1AT), 알파-1B-당단백질 (A1BG), 알파-2-마크로글로불린 (A2MG), 알파-1-항키모트립신 (AACT), 알파-1-산 당단백질 1 & 2 (AGP12), 알파-1-산 당단백질 1 (AGP1), 알파-1-산 당단백질 2 (AGP2), 아포리포프로테인 C-III (APOC3), 아포리포프로테인 D (APOD), 칼파인-3 (CAN3), 쎄룰루플라스민 (CERU), 알파-2-HS 당단백질 (FETUA); 합토글로빈 (HPT), 면역글로불린 중쇄 불변 μ (IgM), 혈장 칼리크레인 (KLKB1), 혈청 파라옥소나제/아릴에스테라제 1 (PON1), 단백질 unc-13호모로그A (UN13A), 그리고 이의 조합들로부터 선택된다.

이들 실시예중 일부에서, 상기 글리코펩티드 군은 알파-1-항트립신 (A1AT)이다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 알파-1B-당단백질 (A1BG)이다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 알파-2-마크로글로불린 (A2MG)이다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 알파-1-항키모트립신 (AACT)이다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 알파-1-산 당단백질 1 & 2 (AGP12)이다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 알파-1-산 당단백질 1 (AGP1)이다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 알파-1-산 당단백질 2 (AGP2)이다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 아포리포프로테인 C-III (APOC3)이다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 아포리포프로테인 D (APOD)이다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 칼파인-3 (CAN3)이다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 쎄룰루플라스민 (CERU)이다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 알파-2-HS 당단백질 (FETUA)이다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 합토글로빈 (HPT)이다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 면역글로불린 중쇄 불변 μ (IgM)이다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 혈장 칼리크레인 (KLKB1)이다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 혈청 파라옥소나제/아릴에스테라제 1 (PON1)이다. 이들 실시예중 일부에서, 상기 글리코펩티드 군은 단백질 unc-13호모로그A (UN13A)이다. 일부 실시예들에서, 상기 당단백질 군은 표 9의 당단백질들 중 하나 또는 그 이상에 의해 제시된다. 일부 실시예들에서, 상기 당단백질 군은 서열 식별 번호: 39-54 중 임의의 아미노산 서열을 포함한다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 글리코펩티드, 글리코펩티드 상의 글리칸, 그리고 글리칸이 글리코펩티드에 결합하는 글리코실화 부위 잔기를 검출하는 단계가 내포된다. 특정 실시예에서, 상기 방법에는 글리칸 잔기의 검출 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 글리코펩티드 상의 글리코실화 부위의 검출 단계가 내포된다. 일부 실시예들에서, 이 공정은 액체 크로마토그래피와 함께 사용되는 질량 분광법을 통해 수행된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 환자로부터 생물학적 샘플을 얻거나, 또는 얻었던 단계가 내포된다. 일부 실시예들에서, 상기 생물학적 샘플은 윤활액, 전혈, 혈청, 혈장, 소변, 가래, 조직, 타액, 눈물, 척수액, 생검으로 얻은 조직 절편; 조직 배양에 배치되거나 또는 적응된 세포(들); 땀, 점액, 분변 물질, 위액, 복액, 양수, 낭종액, 복막액, 췌장액, 모유, 폐 세척, 골수, 위산, 담즙, 정액, 고름, 수양액, 삼출물 및 전술한 것들의 조합을 비롯한 이와 유사한 것들이다. 특정 실시예에서, 상기 생물학적 샘플은 혈액, 혈장, 타액, 점액, 소변, 대변, 조직, 땀, 눈물, 머리카락 또는 이들의 조합으로 구성된 군에서 선택된다. 이들 실시예중 일부에서, 상기 생물학적 샘플은 혈액 샘플이다. 이들 실시예중 일부에서, 상기 생물학적 샘플은 혈장 샘플이다. 이들 실시예중 일부에서, 상기 생물학적 샘플은 타액 샘플이다. 이들 실시예중 일부에서, 상기 생물학적 샘플은 점액 샘플이다. 이들 실시예중 일부에서, 상기 생물학적 샘플은 소변 샘플이다. 이들 실시예중 일부에서, 상기 생물학적 샘플은 대변 샘플이다. 이들 실시예중 일부에서, 상기 생물학적 샘플은 땀 샘플이다. 이들 실시예중 일부에서, 상기 생물학적 샘플은 눈물 샘플이다. 이들 실시예중 일부에서, 상기 생물학적 샘플은 털 샘플이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 상기 샘플 내 글리코펩티드를 절단하거나 및/또는 분절화시키는 단계가 내포된다. 특정 실시예에서, 상기 방법에는 샘플 내 글리코펩티드를 절단시키는 단계가 내포된다. 특정 실시예에서, 상기 방법에는 샘플 내 글리코펩티드를 단편화시키는 단계가 내포된다. 일부 실시예들에서, 상기 절단된 또는 단편화된 글리코펩티드는 질량 분광법을 사용하여 분석된다. 일부 실시예들에서, 상기 글리코펩티드는 절단 효소를 이용하여 용액 상에서 절단되거나 또는 단편화된다. 일부 실시예들에서, 상기 글리코펩티드는 질량 분광기 또는 질량 분광계와 관련된 기기 내부의 기체상에서 절단되거나 단편화된다. 일부 실시예들에서, 상기 질량 분광법 결과는 기계 학습 알고리즘을 이용하여 분석된다. 일부 실시예들에서, 상기 질량 분광법 결과는 상기 글리코펩티드들, 글리칸, 펩티드들, 및 이의 단편들의 정량화다. 일부 실시예들에서, 이 정량화는 훈련된 모델의 입력으로 사용되어 출력 확률을 생성된다. 출력 확률은 주어진 범주 또는 가령, 결장직장암 또는 진행성 선종이 있는 분류 또는 결장직장암 또는 진행성 선종이 없는 분류 내에 있을 확률이다. 일부 다른 실시예에서, 출력 확률은 주어진 범주 또는 분류, 가령, 암이 있는 분류 또는 암이 없는 분류 내에 있을 확률이다. 일부 다른 실시예에서, 출력 확률은 주어진 범주 또는 분류, 가령, 자가면역 질환이 있는 분류 또는 자가면역 질환이 없는 분류 내에 있을 확률이다. 일부 다른 실시예에서, 출력 확률은 주어진 범주 또는 분류, 가령, 섬유증이 있는 분류 또는 섬유증이 없는 분류 내에 있을 확률이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 샘플, 또는 이의 일부분을 질량 분광계로 도입시키는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 샘플 또는 그 일부를 질량 분석계에 도입한 후, 샘플 내 글리코펩티드를 단편화하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 질량 분광법은 다중 반응 모니터링(MRM) 모드를 사용하여 수행된다. 일부 실시예들에서, 상기 질량 분광법은 데이터-의존적 수집으로 QTOF MS를 이용하여 수행된다. 일부 실시예들에서, 상기 질량 분광법은 MS-단독 모드를 이용하여 수행된다. 일부 실시예들에서, 면역분석법은 질량 분광법과 함께 사용된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 상기 샘플, 또는 이의 일부분을 질량 분광계로 도입 전, 샘플에서 글리코펩티드의 절단이 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 글리코펩티드 이온, 펩티드 이온, 글리칸 이온, 글리칸 부가 이온, 또는 글리칸 단편 이온을 제공하기 위해 상기 샘플 안에 글리코펩티드를 단편화시키는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공하기 위해, 상기 샘플 내 글리코펩티드를 절단하거나 및/또는 분절화시키는 단계가 내포된다. 일부 실시예들에서, 상기 방법들은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공한다. 일부 실시예들에서, 상기 방법은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공한다. 일부 실시예들에서, 상기 방법은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공한다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 제공하기 위해, 상기 샘플 내 글리코펩티드를 절단하거나 및/또는 분절화시키는 단계가 내포된다. 일부 실시예들에서, 상기 방법들은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 필수적으로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공한다. 일부 실시예들에서, 상기 방법은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 제공한다. 일부 실시예들에서, 상기 방법들은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 제공한다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공하기 위해, 상기 샘플 내 글리코펩티드를 절단하는 단계가 내포된다. 일부 실시예들에서, 상기 방법들은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공한다. 일부 실시예들에서, 상기 방법은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공한다. 일부 실시예들에서, 상기 방법은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공한다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 제공하기 위해, 상기 샘플 내 글리코펩티드를 절단하는 단계가 내포된다. 일부 실시예들에서, 상기 방법들은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 필수적으로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공한다. 일부 실시예들에서, 상기 방법은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 제공한다. 일부 실시예들에서, 상기 방법들은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 제공한다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공하기 위해, 상기 샘플 내 글리코펩티드를 분절화시키는 단계가 내포된다. 일부 실시예들에서, 상기 방법들은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공한다. 일부 실시예들에서, 상기 방법은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공한다. 일부 실시예들에서, 상기 방법은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공한다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 제공하기 위해 상기 샘플 내 글리코펩티드를 분절화시키는 단계가 내포된다. 일부 실시예들에서, 상기 방법들은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 3-38, 그리고 이의 조합들로 필수적으로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공한다. 일부 실시예들에서, 상기 방법은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 제공한다. 일부 실시예들에서, 상기 방법들은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 제공한다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 전이 1-38로 구성된 군에서 선택된 다중-반응-모니터링(MRM) 전이의 검출 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 글리코펩티드 또는 글리칸 잔기를 나타내는 MRM 전이의 검출 단계가 내포되며, 이때 상기 글리코펩티드는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 나타내는 MRM 전이의 검출 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 전이 1-38로 구성된 군의 구성원들의 조합으로부터 선택된 하나 초과의 MRM 전이를 검출하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38로부터 선택된 아미노산 서열을 갖는 글리코펩티드들의 조합을 나타내는 하나 초과의 MRM 전이를 검출하는 단계가 내포된다.

일부 실시예들에서, 상기 방법에는 글리코펩티드 또는 글리칸 잔기를 나타내는 MRM 전이의 검출 단계가 내포되며, 이때 상기 글리코펩티드는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 상기 방법에는 글리코펩티드 또는 글리칸 잔기를 나타내는 MRM 전이의 검출이 내포되며, 이때 상기 글리코펩티드는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 상기 방법에는 글리코펩티드 또는 글리칸 잔기를 나타내는 MRM 전이의 검출 단계가 내포되며, 이때 상기 글리코펩티드는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된다.

일부 실시예들에서, 상기 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 나타내는 MRM 전이의 검출 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 나타내는 MRM 전이의 검출 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 나타내는 MRM 전이의 검출 단계가 내포된다.

일부 실시예들에서, 상기 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로부터 선택된 아미노산 서열을 갖는 글리코펩티드들의 조합을 나타내는 하나 초과의 MRM 전이를 검출하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로부터 선택된 아미노산 서열을 갖는 글리코펩티드들의 조합을 나타내는 하나 초과의 MRM 전이를 검출하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로부터 선택된 아미노산 서열을 갖는 글리코펩티드들의 조합을 나타내는 하나 초과의 MRM 전이를 검출하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 생물학적 샘플 상에서 다중-반응-모니터링질량 분광법 (MRM-MS)을 이용한 질량 분광을 수행하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 제공하기 위해, 상기 샘플 내 글리코펩티드를 절단하는 단계가 내포된다. 특정 실시예에서, 상기 생물학적 샘플은 화학 시약과 복합된다. 특정 실시예에서, 상기 생물학적 샘플은 효소와 복합된다. 일부 실시예들에서, 상기 효소는 리파제다. 일부 실시예들에서, 상기 효소는 프로테아제다. 일부 실시예들에서, 상기 효소는 세린 프로테아제다. 이들 실시예중 일부에서, 상기 효소는 트립신, 키모트립신, 트롬빈, 엘라스타제, 및 서브틸리신으로 구성된 군에서 선택된다. 이들 실시예중 일부에서, 상기 효소는 트립신이다. 일부 실시예들에서, 상기 방법에는 샘플에 있는 글리코펩티드와 적어도 2개의 프로테아제를 접촉시키는 단계가 내포된다. 일부 실시예들에서, 상기 적어도 2개의 프로테아제는 세린 프로테아제, 트레오닌 프로테아제, 시스테인 프로테아제, 아스파르테이트 프로테아제로 구성된 군에서 선택된다. 일부 실시예들에서, 상기 적어도 2개의 프로테아제는 트립신, 키모트립신, 엔도프로테나제, Asp-N, Arg-C, Glu-C, Lys-C, 펩신, 터모리신, 엘라스타제, 파파인, 프로테나제 K, 서브틸리신, 클로스트리파인, 그리고 카르복시펩티다제 프로테아제, 글루탐산 프로테아제, 메탈로프로테아제, 그리고 아스파라긴 펩티드 리아제로 구성된 군에서 선택된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 전이 1-38로 구성된 군에서 선택된 다중-반응-모니터링(MRM) 전이의 검출 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 글리코펩티드 또는 글리칸 잔기를 나타내는 MRM 전이의 검출 단계가 내포되며, 이때 상기 글리코펩티드는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된다. 일부 실시예들에서, 상기 방법에는 글리코펩티드 또는 글리칸 잔기를 나타내는 MRM 전이의 검출 단계가 내포되며, 이때 상기 글리코펩티드는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 나타내는 MRM 전이의 검출 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 전이 1-38로 구성된 군의 구성원들의 조합으로부터 선택된 하나 초과의 MRM 전이를 검출하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38로부터 선택된 아미노산 서열을 갖는 글리코펩티드들의 조합을 나타내는 하나 초과의 MRM 전이를 검출하는 단계가 내포된다.

일부 실시예들에서, 상기 방법에는 글리코펩티드 또는 글리칸 잔기를 나타내는 MRM 전이의 검출 단계가 내포되며, 이때 상기 글리코펩티드는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된다. 일부 실시예들에서, 상기 방법에는 글리코펩티드 또는 글리칸 잔기를 나타내는 MRM 전이의 검출 단계가 내포되며, 이때 상기 글리코펩티드는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된다. 일부 실시예들에서, 상기 방법에는 글리코펩티드 또는 글리칸 잔기를 나타내는 MRM 전이의 검출 단계가 내포되며, 이때 상기 글리코펩티드는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된다.

일부 실시예들에서, 상기 방법에는 글리코펩티드 또는 글리칸 잔기를 나타내는 MRM 전이의 검출 단계가 내포되며, 이때 상기 글리코펩티드는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 상기 방법에는 글리코펩티드 또는 글리칸 잔기를 나타내는 MRM 전이의 검출 단계가 내포되며, 이때 상기 글리코펩티드는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된다. 일부 실시예들에서, 상기 방법에는 글리코펩티드 또는 글리칸 잔기를 나타내는 MRM 전이의 검출 단계가 내포되며, 이때 상기 글리코펩티드는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 32 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된다.

일부 실시예들에서, 상기 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 나타내는 MRM 전이의 검출 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 나타내는 MRM 전이의 검출 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 나타내는 MRM 전이의 검출 단계가 내포된다.

일부 실시예들에서, 상기 방법에는 전이 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군의 구성원들의 조합으로부터 선택된 하나 초과의 MRM 전이를 검출하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 전이 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군의 구성원들의 조합으로부터 선택된 하나 초과의 MRM 전이를 검출하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 전이 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군의 구성원들의 조합으로부터 선택된 하나 초과의 MRM 전이를 검출하는 단계가 내포된다.

일부 실시예들에서, 상기 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로부터 선택된 아미노산 서열을 갖는 글리코펩티드들의 조합을 나타내는 하나 초과의 MRM 전이를 검출하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로부터 선택된 아미노산 서열을 갖는 글리코펩티드들의 조합을 나타내는 하나 초과의 MRM 전이를 검출하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 32로부터 선택된 아미노산 서열을 갖는 글리코펩티드들의 조합을 나타내는 하나 초과의 MRM 전이를 검출하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공하기 위해, 상기 샘플 내 글리코펩티드를 절단하는 단계가 내포된다. 특정 실시예에서, 상기 생물학적 샘플은 하나 또는 그 이상의 화학적 시약과 접촉된다. 특정 실시예에서, 상기 생물학적 샘플은 하나 또는 그 이상의 효소와 접촉된다. 일부 실시예들에서, 상기 효소는 리파제다. 일부 실시예들에서, 상기 효소는 프로테아제다. 일부 실시예들에서, 상기 효소는 세린 프로테아제다. 이들 실시예중 일부에서, 상기 효소는 트립신, 키모트립신, 트롬빈, 엘라스타제, 및 서브틸리신으로 구성된 군에서 선택된다. 이들 실시예중 일부에서, 상기 효소는 트립신이다. 일부 실시예들에서, 상기 방법에는 샘플에 있는 글리코펩티드와 적어도 2개의 프로테아제를 접촉시키는 단계가 내포된다. 일부 실시예들에서, 상기 적어도 2개의 프로테아제는 세린 프로테아제, 트레오닌 프로테아제, 시스테인 프로테아제, 아스파르테이트 프로테아제로 구성된 군에서 선택된다. 일부 실시예들에서, 상기 적어도 2개의 프로테아제는 트립신, 키모트립신, 엔도프로테나제, Asp-N, Arg-C, Glu-C, Lys-C, 펩신, 터모리신, 엘라스타제, 파파인, 프로테나제 K, 서브틸리신, 클로스트리파인, 및 카르복시펩티다제 프로테아제, 글루탐산 프로테아제, 메탈로프로테아제, 그리고 아스파라긴 펩티드 리아제로 구성된 군에서 선택된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 MRM 전이는 표 1, 2 또는 3중 임의의 하나에서 전이, 또는 이의 임의의 조합들로부터 선택된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 생물학적 샘플 상에 직렬 액체 크로마토그래피-질량 분석을 수행하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 생물학적 샘플 상에 다중-반응-모니터링질량 분광법 (MRM-MS) 질량 분광법을 수행하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 삼중 사중극자 (QQQ) 및/또는 사중극자 비행-시간 (qTOF) 질량 분광계를 이용하여 MRM 전이를 검출하는 단계가 내포된다. 특정 실시예에서, 상기 방법에는 QQQ 질량 분광계를 이용하여 MRM 전이를 검출하는 단계가 내포된다. 특정 기타 실시예들에서, 상기 방법에는 qTOF 질량 분광계를 이용한 검출 단계가 내포된다. 일부 실시예들에서, 본 분석법과 함께 사용하기에 적합한 기기는 Agilent 6495B Triple Quadrupole LC/MS이며, 이는 www.agilent.com/en/products/mass-spectrometry/lc-ms-instruments/triple-quadrupole-lc-ms/6495b-triple-quadrupole-lc-ms에서 찾아볼 수 있다. 특정 기타 실시예들에서, 상기 방법에는 QQQ 질량 분광계를 이용한 검출 단계가 내포된다. 일부 실시예들에서, 본 분석법과 함께 사용하기에 적합한 기기는 Agilent 6545 LC/Q-TOF이며, 이는 https://www.agilent.com/en/products/liquid-chromatography-mass-spectrometry-lc-ms/lc-ms-instruments/quadrupole-time-of-flight-lc-ms/6545-q-tof-lc-ms에서 찾아볼 수 있다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 QQQ 및/또는 qTOF 질량 분광계를 이용하여 하나 초과의 MRM 전이를 검출하는 단계가 내포된다. 특정 실시예에서, 상기 방법에는 QQQ 질량 분광계를 이용한 하나 초과의 MRM 전이를 검출하는 단계가 내포된다. 특정 실시예에서, 상기 방법에는 qTOF 질량 분광계를 이용하여 하나 초과의 MRM 전이를 검출하는 단계가 내포된다. 특정 실시예에서, 상기 방법에는 QQQ 질량 분광계를 이용한 하나 초과의 MRM 전이를 검출하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법들은 결합 크로마토그래피 절차를 사용하는 것을 비롯하여, 하나 또는 그 이상의 생물학적 시료의 하나 또는 그 이상의 당학적 매개변수를 정량화하는 단계가 내포된다. 일부 실시예들에서, 이러한 당학적 매개변수에는 글리코펩타이드 그룹의 식별, 글리코펩타이드 상의 글리칸의 식별, 글리코실화 부위의 식별, 글리코펩타이드가 포함하는 아미노산 서열의 일부 식별이 내포된다. 일부 실시예들에서, 결합된 크로마토그래피 절차는 액체 크로마토그래피-질량 분석법(LC-MS) 작업을 수행하거나 실행하는 것을 포함한다. 일부 실시예들에서, 결합된 크로마토그래피 절차는 다중 반응 모니터링 질량 분광계 (MRM-MS) 작업을 수행하거나 실행하는 단계를 포함한다. 일부 실시예들에서, 본원의 방법들에는 액체 크로마토그래피-질량 분석법(LS-MS)을 수행하거나 또는 실행하고; 그리고 다중 반응 모니터링 질량 분광계 (MRM-MS) 작업을 실행하는 것을 포함하는 결합된 크로마토그래피 절차가 내포된다. 일부 실시예들에서, 상기 방법에는 하나 또는 그 이상의 삼중 사중극자 (QQQ) 질량 분광법 작업 및/또는 사중극자 비행-시간 (qTOF) 질량 분광법 작업에 의해 획득된 하나 또는 그 이상의 생물학적 샘플들의 하나 또는 그 이상의 당학적 매개변수를 이용하여 기계 학습 알고리즘을 훈련하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 삼중 사중극자 (QQQ) 질량 분광법 작업에 의해 획득된 하나 또는 그 이상의 생물학적 샘플들의 하나 또는 그 이상의 당학적 매개변수를 이용하여 기계 학습 알고리즘을 훈련하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 사중극자 비행-시간 (qTOF) 질량 분광법 작업에 의해 획득된 하나 또는 그 이상의 생물학적 샘플들의 하나 또는 그 이상의 당학적 매개변수를 이용하여 기계 학습 알고리즘을 훈련하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 하나 또는 그 이상의 생물학적 샘플들의 하나 또는 그 이상의 당학적 매개변수를 정량화시키는 단계가 내포되는데, 이는 삼중 사중극자 (QQQ) 질량 분광법 작업 및 사중극자 비행-시간 (qTOF) 질량 분광법 작업 중 하나 또는 그 이상을 이용하는 것을 포함한다. 일부 실시예들에서, 기계 학습 알고리즘을 이용하여 이들 당학적 매개변수를 정량화한다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 질량 분광법은 다중 반응 모니터링(MRM) 모드를 사용하여 수행된다. 일부 실시예들에서, 상기 질량 분광법은 데이터-의존적 수집으로 QTOF MS를 이용하여 수행된다. 일부 실시예들에서, 상기 질량 분광법은 MS-단독 모드를 이용하여 수행된다. 일부 실시예들에서, 면역분석법 (가령, ELISA)은 질량 분광법과 복합하여 이용된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 글리코펩티드 또는 이의 조합은 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열 그리고 이의 조합들로 구성된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 글리코펩티드 또는 이의 조합은 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열 그리고 이의 조합들로 필수적으로 구성된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공하기 위해, 상기 샘플 내 글리코펩티드를 절단하거나 및/또는 분절화시키는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 제공하기 위해, 상기 샘플 내 글리코펩티드를 절단하거나 및/또는 분절화시키는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 글리코펩티드 또는 이의 조합은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 글리코펩티드 또는 이의 조합은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 글리코펩티드 또는 이의 조합은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 글리코펩티드 또는 이의 조합은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 및 이의 조합들로 필수적으로 구성된 군에서 선택된 아미노산 서열로 구성된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 글리코펩티드 또는 이의 조합은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 그리고 이의 조합들로 필수적으로 구성된 군에서 선택된 아미노산 서열로 구성된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 글리코펩티드 또는 이의 조합은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 그리고 이의 조합들로 필수적으로 구성된 군에서 선택된 아미노산 서열로 구성된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공하기 위해, 상기 샘플 내 글리코펩티드를 절단하거나 및/또는 분절화시키는 단계가 내포된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공하기 위해, 상기 샘플 내 글리코펩티드를 절단하거나 및/또는 분절화시키는 단계가 내포된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 제공하기 위해, 상기 샘플 내 글리코펩티드를 절단하거나 및/또는 분절화시키는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 제공하기 위해, 상기 샘플 내 글리코펩티드를 절단하거나 및/또는 분절화시키는 단계가 내포된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 제공하기 위해, 상기 샘플 내 글리코펩티드를 절단하거나 및/또는 분절화시키는 단계가 내포된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 제공하기 위해, 상기 샘플 내 글리코펩티드를 절단하거나 및/또는 분절화시키는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 글리칸 3200, 3210, 3300, 3310, 3320, 3400, 3410, 3420, 3500, 3510, 3520, 3600, 3610, 3620, 3630, 3700, 3710, 3720, 3730, 3740, 4200, 4210, 4300, 4301, 4310, 4311, 4320, 4400, 4401, 4410, 4411, 4420, 4421, 4430, 4431, 4500, 4501, 4510, 4511, 4520, 4521, 4530, 4531, 4540, 4541, 4600, 4601, 4610, 4611, 4620, 4621, 4630, 4631, 4641, 4650,4700, 4701, 4710, 4711, 4720, 4730, 5200, 5210, 5300, 5301, 5310, 5311, 5320, 5400, 5401, 5402, 5410, 5411, 5412, 5420, 5421, 5430, 5431, 5432, 5500, 5501, 5502, 5510, 5511, 5512, 5520, 5521, 5522, 5530, 5531, 5541, 5600, 5601, 5602, 5610, 5611, 5612, 5620, 5621, 5631, 5650, 5700, 5701, 5702, 5710, 5711, 5712, 5720, 5721, 5730, 5731, 6200, 6210, 6300, 6301, 6310, 6311, 6320, 6400, 6401, 6402, 6410, 6411, 6412, 6420, 6421, 6432, 6500, 6501, 6502, 6503, 6510, 6511, 6512, 6513, 6520, 6521, 6522, 6530, 6531, 6532, 6540, 6541, 6600, 6601, 6602, 6603, 6610, 6611, 6612, 6613, 6620, 6621, 6622, 6623, 6630, 6631, 6632, 6640, 6641, 6642, 6652, 6700, 6701, 6711, 6721, 6703, 6713, 6710, 6711, 6712, 6713, 6720, 6721, 6730, 6731, 6740, 7200, 7210, 7400, 7401, 7410, 7411, 7412, 7420, 7421, 7430, 7431, 7432, 7500, 7501, 7510, 7511, 7512, 7600, 7601, 7602, 7603, 7604, 7610, 7611, 7612, 7613, 7614, 7620, 7621, 7622, 7623, 7632, 7640, 7700, 7701, 7702, 7703, 7710, 7711, 7712, 7713, 7714, 7720, 7721, 7722, 7730, 7731, 7732, 7740, 7741, 7751, 8200, 9200, 9210, 10200, 11200, 12200, 그리고 이의 조합들로 구성된 군에서 선택된 글리칸을 나타내는 하나 또는 그 이상의 MRM 전이를 검출하는 단계가 내포된다. 본원에서, 이들 글리칸은 도 1-14에서 도시된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 글리칸의 정량화가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 제1 글리칸의 정량화 및 제2 글리칸의 정량화가 내포되며; 그리고 상기 제1 글리칸의 정량화를 제2 글리칸의 정량화와 비교하는 것이 더 포함된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 탐지된 글리칸을 이 글리칸이 결합된 펩티드 잔기 부위와 연합시키는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 이 샘플의 글리코실화 프로파일을 생성시키는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 상기 샘플과 연합된 조직 단편 상에 공간적으로 글리칸을 프로파일링시키는 단계가 내포된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 상기 샘플과 연합된 조직 단편 상에 공간적으로 글리코펩티드들을 프로파일링시키는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 본원의 방법과 복합된 매트릭스-지원된 레이저 탈착 이온화 비행-시간 질량 분석법(MALDI-TOF) 질량 분석법이 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 글리칸 및/또는 펩티드의 상대적 풍도의 정량화가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드의 양을 규정화시키고, 또다른 화학 종의 양에 대한 정량화와 비교하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드의 정량화에 의해 펩티드의 양을 규정화시키고, 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 또다른 글리코펩티드의 양에 대한 정량화와 비교하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드의 정량화에 의해 펩티드의 양을 규정화시키고, 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 또다른 글리코펩티드의 양에 대한 정량화와 비교하는 단계가 내포된다.

B. 글리코펩티드들을 포함하는 샘플을 분류하는 방법들

또다른 구체예에서, 본원에서 샘플에 관한 분류를 확인하는 방법이 제공되며, 상기 방법은 다음을 포함한다: 샘플내 하나 또는 그 이상의 글리코펩티드들을 질량 분광법(MS)에 의해 정량화시키는 단계, 이때 각 경우들에서 각 글리코펩티드는 본원에서 기술된 그리고 표 10의 임의의 연합된 글리칸과 함께, 서열 식별 번호: 1-38 중 임의의 아미노산 서열을 포함하고; 그리고 출력 확률을 생성하기 위해 훈련된 모델에 정량을 입력하는 단계; 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 또는 낮은 여부에 기초하여 이 샘플에 대한 분류를 확인하는 단계.

또다른 구체예에서, 샘플의 분류를 확인하는 방법이 본원에서 제시되어 있고, 이 방법은 다음을 포함한다: 질량 분광법 (MS)을 이용하여 샘플에서 하나 또는 그 이상의 글리코펩티드들을 정량화하는 단계, 이때 상기 글리코펩티드들은 각각, 각 경우에 개별적으로, 본원에서 기술된 바와 같이, 예를 들면, 임의의 연합된 글리칸과 함께, 서열 식별 번호: 1-38로 구성된, 또는 필수적으로 구성된 군에서 선택된 아미노산 서열을 포함하거나, 필수적으로 이로 구성되거나, 또는 구성되며; 그리고 출력 확률을 생성하기 위해 훈련된 모델에 정량을 입력하는 단계; 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 샘플의 분류를 확인하는 단계.

또다른 구체예에서, 본원에서 샘플에 관한 분류를 확인하는 방법이 제공되며, 상기 방법은 다음을 포함한다: 샘플내 하나 또는 그 이상의 글리코펩티드들을 질량 분광법(MS)에 의해 정량화시키는 단계, 이때 각 경우들에서 각 글리코펩티드는 본원에서 기술된 그리고 표 10의 임의의 연합된 글리칸과 함께, 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들 중 임의의 아미노산 서열을 포함하고; 그리고 출력 확률을 생성하기 위해 훈련된 모델에 정량을 입력하는 단계; 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 이 샘플에 대한 분류를 확인하는 단계.

또다른 구체예에서, 샘플의 분류를 확인하는 방법이 본원에서 제시되어 있고, 이 방법은 다음을 포함한다: 질량 분광법 (MS)을 이용하여 샘플에서 하나 또는 그 이상의 글리코펩티드들을 정량화하는 단계, 이때 상기 글리코펩티드들은 각각, 각 경우에 개별적으로, 본원에서 기술된 바와 같이, 예를 들면, 임의의 연합된 글리칸과 함께, 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 필수적으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성되며; 그리고 출력 확률을 생성하기 위해 훈련된 모델에 정량을 입력하는 단계; 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 샘플의 분류를 확인하는 단계.

또다른 구체예에서, 본원에서 샘플에 관한 분류를 확인하는 방법이 제공되며, 상기 방법은 다음을 포함한다: 샘플내 하나 또는 그 이상의 글리코펩티드들을 질량 분광법(MS)에 의해 정량화시키는 단계, 이때 각 경우들에서 각 글리코펩티드는 본원에서 기술된 그리고 표 10의 임의의 연합된 글리칸과 함께, 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 중 임의의 아미노산 서열을 포함하고; 그리고 출력 확률을 생성하기 위해 훈련된 모델에 정량을 입력하는 단계; 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 이 샘플에 대한 분류를 확인하는 단계.

또다른 구체예에서, 샘플의 분류를 확인하는 방법이 본원에서 제시되어 있고, 이 방법은 다음을 포함한다: 질량 분광법 (MS)을 이용하여 샘플에서 하나 또는 그 이상의 글리코펩티드들을 정량화하는 단계, 이때 상기 글리코펩티드들은 각각, 각 경우에 개별적으로, 본원에서 기술된 바와 같이, 예를 들면, 임의의 연합된 글리칸과 함께, 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성되며; 그리고 출력 확률을 생성하기 위해 훈련된 모델에 정량을 입력하는 단계; 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 샘플의 분류를 확인하는 단계.

또다른 구체예에서, 본원에서 샘플에 관한 분류를 확인하는 방법이 제공되며, 상기 방법은 다음을 포함한다: 샘플내 하나 또는 그 이상의 글리코펩티드들을 질량 분광법(MS)에 의해 정량화시키는 단계, 이때 각 경우들에서 각 글리코펩티드는 본원에서 기술된 그리고 표 10의 임의의 연합된 글리칸과 함께, 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 중 임의의 아미노산 서열을 포함하고; 그리고 출력 확률을 생성하기 위해 훈련된 모델에 정량을 입력하는 단계; 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 여부에 기초하여 이 샘플에 대한 분류를 확인하는 단계.

또다른 구체예에서, 샘플의 분류를 확인하는 방법이 본원에서 제시되어 있고, 이 방법은 다음을 포함한다: 질량 분광법 (MS)을 이용하여 샘플에서 하나 또는 그 이상의 글리코펩티드들을 정량화하는 단계, 이때 상기 글리코펩티드들은 각각, 각 경우에 개별적으로, 본원에서 기술된 바와 같이, 예를 들면, 임의의 연합된 글리칸과 함께, 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성되거나 또는 필수적으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성되며; 그리고 출력 확률을 생성하기 위해 훈련된 모델에 정량을 입력하는 단계; 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 샘플의 분류를 확인하는 단계.

일부 실시예들에서, 본원에서 글리코펩티드들을 분류하는 방법이 제시되며, 이 방법은 다음을 포함한다: 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 상기 샘플 내 글리코펩티드를 절단하거나 및/또는 분절화시키는 단계; 전이 1-38로 구성된 군에서 선택된 다중-반응-모니터링(MRM) 전이를 검출하는 단계; 그리고 상기 탐지된 MRM 전이를 기초하여 슬리코펩티드들을 분류하는 단계. 일부 실시예들에서, 기계 학습 알고리즘을 이용하여 분석된 MRM 전환을 입력으로 사용하여 모델을 훈련한다. 일부 실시예들에서, 기계 학습 알고리즘은 MRM 전환을 교육 데이터 세트로 사용하여 훈련한다. 일부 실시예들에서, 본원의 방법들에는 글리코펩티드들, 펩티드들, 및 글리칸의 질량 분광법 상대적 풍도에 근거하여 이들을 분류하는 단계가 내포된다. 일부 실시예들에서, 기계 학습 알고리즘 또는 알고리즘은 질량 분광학 스펙트럼에서 피크를 선택하고 및/또는 식별한다.

일부 실시예들에서, 본원에서 글리코펩티드들을 분류하는 방법이 제시되며, 이 방법은 다음을 포함한다: 개체로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 상기 샘플 내 글리코펩티드를 절단하거나 및/또는 분절화시키는 단계; 전이 1-38로 구성된 군에서 선택된 다중-반응-모니터링(MRM) 전이를 검출하는 단계; 그리고 상기 탐지된 MRM 전이를 기초하여 슬리코펩티드들을 분류하는 단계. 일부 실시예들에서, 기계 학습 알고리즘을 이용하여 분석된 MRM 전환을 입력으로 사용하여 모델을 훈련한다. 일부 실시예들에서, 기계 학습 알고리즘은 MRM 전환을 교육 데이터 세트로 사용하여 훈련한다. 일부 실시예들에서, 본원의 방법들에는 글리코펩티드들, 펩티드들, 및 글리칸의 질량 분광법 상대적 풍도에 근거하여 이들을 분류하는 단계가 내포된다. 일부 실시예들에서, 기계 학습 알고리즘 또는 알고리즘은 질량 분광학 스펙트럼에서 피크를 선택하고 및/또는 식별한다.

일부 실시예들에서, 본원에서 MRM 전이를 입력 데이터 세트로 사용하여 기계 학습 알고리즘을 훈련시키는 방법이 제시된다. 일부 실시예들에서, 본원에서 샘플에 관한 분류를 확인하는 방법이 제시되며, 상기 방법은 샘플 내 글리코펩티드를 질량 분광법 (MS)에 의해 정량화시키는 단계, 이때 상기 글리코펩티드는 가령, 본원에서 기재된 바와 같은 임의의 연합된 글리칸과 함께, 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군으로부터 선택된 아미노산 서열로 구성되거나 또는 필수적으로 구성되며; 그리고 상기 정량화를 기반으로 분류를 확인하는 단계를 포함한다. 일부 실시예들에서, 상기 정량화에는 샘플 내 글리코펩티드, 또는 글리코펩티드들의 조합이 존재하는 지 또는 부재하는 지의 결정이 내포된다. 일부 실시예들에서, 상기 정량화에는 샘플 내 글리코펩티드, 또는 글리코펩티드들의 상대적 풍도를 결정하는 단계가 내포된다. 일부 실시예들에서, 훈련된 모델은 검출된 폴리펩티드 또는 MRM 전이의 정량화 입력을 기반으로 출력 확률을 생성하는 데 사용된다.

일부 실시예들에서, 본원에서 MRM 전이를 입력 데이터 세트로 사용하여 기계 학습 알고리즘을 훈련시키는 방법이 제시된다. 일부 실시예들에서, 본원에서 샘플에 관한 분류를 확인하는 방법이 제시되며, 상기 방법은 샘플 내 글리코펩티드를 질량 분광법 (MS)에 의해 정량화시키는 단계, 이때 상기 글리코펩티드는 가령, 본원에서 기재된 바와 같은 임의의 연합된 글리칸과 함께, 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군으로부터 선택된 아미노산 서열로 구성되거나 또는 필수적으로 구성되며; 그리고 상기 정량화를 기반으로 분류를 확인하는 단계를 포함한다. 일부 실시예들에서, 상기 정량화에는 샘플 내 글리코펩티드, 또는 글리코펩티드들의 조합이 존재하는 지 또는 부재하는 지의 결정이 내포된다. 일부 실시예들에서, 상기 정량화에는 샘플 내 글리코펩티드, 또는 글리코펩티드들의 상대적 풍도를 결정하는 단계가 내포된다. 일부 실시예들에서, 훈련된 모델은 검출된 폴리펩티드 또는 MRM 전이의 정량화 입력을 기반으로 출력 확률을 생성하는 데 사용된다.

일부 실시예들에서, 본원에서 MRM 전이를 입력 데이터 세트로 사용하여 기계 학습 알고리즘을 훈련시키는 방법이 제시된다. 일부 실시예들에서, 본원에서 샘플에 관한 분류를 확인하는 방법이 제시되며, 상기 방법은 샘플 내 글리코펩티드를 질량 분광법 (MS)에 의해 정량화시키는 단계, 이때 상기 글리코펩티드는 가령, 본원에서 기재된 바와 같은 임의의 연합된 글리칸과 함께, 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군으로부터 선택된 아미노산 서열로 구성되거나 또는 필수적으로 구성되며; 그리고 상기 정량화를 기반으로 분류를 확인하는 단계를 포함한다. 일부 실시예들에서, 상기 정량화에는 샘플 내 글리코펩티드, 또는 글리코펩티드들의 조합이 존재하는 지 또는 부재하는 지의 결정이 내포된다. 일부 실시예들에서, 상기 정량화에는 샘플 내 글리코펩티드, 또는 글리코펩티드들의 상대적 풍도를 결정하는 단계가 내포된다. 일부 실시예들에서, 훈련된 모델은 검출된 폴리펩티드 또는 MRM 전이의 정량화 입력을 기반으로 출력 확률을 생성하는 데 사용된다.

일부 실시예들에서, 본원에서 MRM 전이를 입력 데이터 세트로 사용하여 기계 학습 알고리즘을 훈련시키는 방법이 제시된다. 일부 실시예들에서, 본원에서 샘플에 관한 분류를 확인하는 방법이 제시되며, 상기 방법은 샘플 내 글리코펩티드를 질량 분광법 (MS)에 의해 정량화시키는 단계, 이때 상기 글리코펩티드는 가령, 본원에서 기재된 바와 같은 임의의 연합된 글리칸과 함께, 서열 식별 번호: 1-38로 구성된 군으로부터 선택된 아미노산 서열로 구성되거나 또는 필수적으로 구성되며; 그리고 상기 정량화를 기반으로 분류를 확인하는 단계를 포함한다. 일부 실시예들에서, 상기 정량화에는 샘플 내 글리코펩티드, 또는 글리코펩티드들의 조합이 존재하는 지 또는 부재하는 지의 결정이 내포된다. 일부 실시예들에서, 상기 정량화에는 샘플 내 글리코펩티드, 또는 글리코펩티드들의 상대적 풍도를 결정하는 단계가 내포된다. 일부 실시예들에서, 훈련된 모델은 검출된 폴리펩티드 또는 MRM 전이의 정량화 입력을 기반으로 출력 확률을 생성하는 데 사용된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 샘플은 질환 또는 병태를 가지고 있는 환자로부터 생물학적 샘플이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 환자는 결장직장암 또는 진행성 선종을 가지고 있다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 환자는 암을 가지고 있다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 환자는 섬유증을 가지고 있다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 환자는 자가면역 질환을 가지고 있다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 질환 또는 병태는 결장직장암 또는 진행성 선종이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 MS는 QQQ 및/또는 qTOF 질량 분광계와 함께 MRM-MS이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 기계 학습 알고리즘은 딥러닝 알고리즘, 신경망 알고리즘, 인공 신경망 알고리즘, 지도 머신 러닝 알고리즘, 선형 판별 분석 알고리즘, 2차 판별 분석 알고리즘, 서포트 벡터 머신 알고리즘, 선형 기저 함수 커널 서포트 벡터 알고리즘, 방사형 기저함수 커널 지원 벡터 알고리즘, 랜덤 포레스트 알고리즘, 유전자 알고리즘, 최근접 이웃 알고리즘, k-최근접 이웃, 나이브 베이즈 분류 알고리즘, 로지스틱 회귀 알고리즘, 정규화된 회귀 알고리즘, 또는 이의 조합으로 구성된 군에서 선택된다. 특정 실시예에서, 상기 기계 학습 알고리즘은 LASSO 회귀다. 특정 실시예에서, 상기 기계 학습 알고리즘은 복합된 판별 분석이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 샘플을 질환 분류 또는 질환 중증도 분류 내에 있거나 또는 이에 포괄되는 것으로 분류하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 샘플 내 글리코펩티드를 제1 시점에서 MS에 의한 정량화; 샘플 내 글리코펩티드를 제2 시점에서 MS에 의한 정량화; 그리고 제1 시점에서의 정량화에 제2 시점에서의 정량화를 복합시킨 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 샘플 내 상이한 글리코펩티드를 제3 시점에서 MS에 의한 정량화; 샘플 내 상이한 글리코펩티드를 제4 시점에서 MS에 의한 정량화; 그리고 제3 시점에서의 정량화에 제4 시점에서의 정량화를 복합시킨 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 환자의 건강 상태의 모니터링이 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 환자의 건강상태를 모니터링하는 것에는 위험 인자, 이를 테면, 유전적 변이를 갖는 질환 발병과 진행을 모니터링하는 것, 뿐만 아니라 암 재발을 검출하는 단계가 내포된다. 일부 구체예들에서, 상기 환자는 결장직장암 (CRC)의 하나 또는 그 이상의 위험 인자 또는 임상적 지표를 갖는다. 일부 구체예들에서, 상기 대상체는 CRC와 연합된 하나 또는 그 이상의 위험 인자들을 갖는다. 일부 구체예들에서, CRC의 위험 인자는 연령, 과민성 대장 질환, 제2형 당뇨병, CRC의 가족력, 유전적 증후군(가령, 린치 증후군), 비만, 흡연, 음주, 식이 선택 및 제한된 신체 활동으로 구성된 그룹에서 선택된다. 일부 구체예들에서, CRC의 임상 지표는 배변 습관의 변화, 혈변, 설사, 변비, 지속적인 복통, 지속적인 복부경련, 원인불명의 체중감소 등으로 구성된 군에서 선택된다. 일부 구체예들에서, 상기 개체는 건강한 상태를 가지고 있다고 판단되며, 이때 건강한 상태는 CRC 또는 AA의 부재를 포함한다. 일부 구체예들에서, 상기 방법은 이 대상체에 대해 검출된 해당 상태에 기초한 진단이 내포된 보고서를 생성하는 단계를 추가로 포함한다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 MS를 통하여 정량화시키는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 가령 본원에서 기재된 바의 임의의 연합된 글리칸과 함께, 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 MS를 통하여 정량화시키는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 글리칸 3200, 3210, 3300, 3310, 3320, 3400, 3410, 3420, 3500, 3510, 3520, 3600, 3610, 3620, 3630, 3700, 3710, 3720, 3730, 3740, 4200, 4210, 4300, 4301, 4310, 4311, 4320, 4400, 4401, 4410, 4411, 4420, 4421, 4430, 4431, 4500, 4501, 4510, 4511, 4520, 4521, 4530, 4531, 4540, 4541, 4600, 4601, 4610, 4611, 4620, 4621, 4630, 4631, 4641, 4650,4700, 4701, 4710, 4711, 4720, 4730, 5200, 5210, 5300, 5301, 5310, 5311, 5320, 5400, 5401, 5402, 5410, 5411, 5412, 5420, 5421, 5430, 5431, 5432, 5500, 5501, 5502, 5510, 5511, 5512, 5520, 5521, 5522, 5530, 5531, 5541, 5600, 5601, 5602, 5610, 5611, 5612, 5620, 5621, 5631, 5650, 5700, 5701, 5702, 5710, 5711, 5712, 5720, 5721, 5730, 5731, 6200, 6210, 6300, 6301, 6310, 6311, 6320, 6400, 6401, 6402, 6410, 6411, 6412, 6420, 6421, 6432, 6500, 6501, 6502, 6503, 6510, 6511, 6512, 6513, 6520, 6521, 6522, 6530, 6531, 6532, 6540, 6541, 6600, 6601, 6602, 6603, 6610, 6611, 6612, 6613, 6620, 6621, 6622, 6623, 6630, 6631, 6632, 6640, 6641, 6642, 6652, 6700, 6701, 6711, 6721, 6703, 6713, 6710, 6711, 6712, 6713, 6720, 6721, 6730, 6731, 6740, 7200, 7210, 7400, 7401, 7410, 7411, 7412, 7420, 7421, 7430, 7431, 7432, 7500, 7501, 7510, 7511, 7512, 7600, 7601, 7602, 7603, 7604, 7610, 7611, 7612, 7613, 7614, 7620, 7621, 7622, 7623, 7632, 7640, 7700, 7701, 7702, 7703, 7710, 7711, 7712, 7713, 7714, 7720, 7721, 7722, 7730, 7731, 7732, 7740, 7741, 7751, 8200, 9200, 9210, 10200, 11200, 12200, 그리고 이의 조합들로 구성된 군에서 선택된 하나 또는 그 이상의 글리칸을 MS로 정량화시키는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 상기 정량화에 기초하여 질환 또는 병태를 가지고 있는 환자의 진단이 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 상기 정량화에 기초하여 상기 환자가 결장직장암 또는 진행성 선종을 가지는 것으로 진단하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 치료하는 화학요법, 면역요법, 호르몬 요법, 표적 요법, 신보강 요법, 수술 및 이들의 조합으로 이루어진 군으로부터 선택된 치료 유효량의 치료제로 환자를 치료하는 단계가 내포된다.

C. 치료 방법들

일부 실시예들에서, 본원에서 질환 또는 병태를 보유하는 환자를 치료하는 방법이 제시되며, 이 방법은 상기 환자의 샘플 내 글리코펩티드를 질량 분광법으로 측정하는 단계를 포함한다. 일부 실시예들에서, 상기 환자는 인간이다. 특정 실시예에서, 상기 환자는 여성이다. 특정 기타 실시예들에서, 상기 환자는 결장직장암 또는 진행성 선종을 가지고 있는 여성이다. 특정 실시예에서, 상기 환자는 단계 1의 결장직장암 또는 진행성 선종을 가지고 있는 여성이다. 특정 실시예에서, 상기 환자는 단계 2의 결장직장암 또는 진행성 선종을 가지고 있는 여성이다. 특정 실시예에서, 상기 환자는 단계 3의 결장직장암 또는 진행성 선종을 가지고 있는 여성이다. 특정 실시예에서, 상기 환자는 단계 4의 결장직장암 또는 진행성 선종을 가지고 있는 여성이다. 일부 실시예들에서, 상기 여성은 10-20세에 대등한 또는 이 사이의 연령대다. 일부 실시예들에서, 상기 여성은 20-30세에 대등한 또는 이 사이의 연령대다. 일부 실시예들에서, 상기 여성은 30-40세에 대등한 또는 이 사이의 연령대다. 일부 실시예들에서, 상기 여성은 40-50세에 대등한 또는 이 사이의 연령대다. 일부 실시예들에서, 상기 여성은 50-60세에 대등한 또는 이 사이의 연령대다. 일부 실시예들에서, 상기 여성은 60-70세에 대등한 또는 이 사이의 연령대다. 일부 실시예들에서, 상기 여성은 70-80세에 대등한 또는 이 사이의 연령대다. 일부 실시예들에서, 상기 여성은 80-90세에 대등한 또는 이 사이의 연령대다. 일부 실시예들에서, 상기 여성은 90-100세에 대등한 또는 이 사이의 연령대다.

일부 실시예들에서, 본원에서 질환 또는 병태를 보유하는 환자를 치료하는 방법이 제시되며, 이 방법은 상기 환자의 샘플 내 글리코펩티드를 질량 분광법으로 측정하는 단계를 포함한다. 일부 실시예들에서, 상기 환자는 인간이다. 특정 실시예에서, 상기 환자는 남성이다. 특정 기타 실시예들에서, 상기 환자는 결장직장암 또는 진행성 선종을 가지고 있는 남성이다. 특정 실시예에서, 상기 환자는 단계 1의 결장직장암 또는 진행성 선종을 가지고 있는 남성이다. 특정 실시예에서, 상기 환자는 단계 2의 결장직장암 또는 진행성 선종을 가지고 있는 남성이다. 특정 실시예에서, 상기 환자는 단계 3의 결장직장암 또는 진행성 선종을 가지고 있는 남성이다. 특정 실시예에서, 상기 환자는 단계 4의 결장직장암 또는 진행성 선종을 가지고 있는 남성이다. 일부 실시예들에서, 상기 남성은 10-20세에 대등한 또는 이 사이의 연령대다. 일부 실시예들에서, 상기 남성은 20-30세에 대등한 또는 이 사이의 연령대다. 일부 실시예들에서, 상기 남성은 30-40세에 대등한 또는 이 사이의 연령대다. 일부 실시예들에서, 상기 남성은 40-50세에 대등한 또는 이 사이의 연령대다. 일부 실시예들에서, 상기 남성은 50-60세에 대등한 또는 이 사이의 연령대다. 일부 실시예들에서, 상기 남성은 60-70세에 대등한 또는 이 사이의 연령대다. 일부 실시예들에서, 상기 남성은 70-80세에 대등한 또는 이 사이의 연령대다. 일부 실시예들에서, 상기 남성은 80-90세에 대등한 또는 이 사이의 연령대다. 일부 실시예들에서, 상기 남성은 90-100세에 대등한 또는 이 사이의 연령대다.

또다른 구체예에서, 본원에서 결장직장암 또는 진행성 선종이 있는 환자를 치료하는 방법이 제시되며; 상기 방법은 다음을 포함한다: 하나 또는 그 이상의 글리코펩티드들을 포함하는 생물학적 샘플을 보유하는 환자를 선별하는 단계; 이때 상기 샘플에서 하나 또는 그 이상의 글리코펩티드들을 절단시키거나 및/또는 단편화시켰던 단계; 그리고 이때 상기 샘플내 하나 또는 그 이상의 글리코펩티드들은 전이 1-38로 구성된 군에서 선택된 하나 또는 그 이상의 다중-반응-모니터링(MRM) 전이를 이용하여 탐지되었고, 정량화되었던 단계; 이때 상기 정량화값은 훈련된 모델로 입력하여 출력 확률을 생성하고; 그리고 이때 출력 확률이 분류를 위한 임계값보다 높은 지 또는 낮은 지가 결정되었던 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 상기 환자를 분류하는 단계, 이때 상기 분류는 다음으로 구성된 군에서 선택된다: (A) 절제가 필요한 환자; (B) 치료제가 필요한 환자; (C) 알킬화 요법이 필요한 환자; (D) 표적 치료제가 필요한 환자; (E) 면역치료가 필요한 환자; (F) 면역 관문 억제제가 필요한 환자; (G) T-세포-관련된 치료가 필요한 환자; (H) 암 백신이 필요한 환자; (I) 방사능 요법이 필요한 환자; (J) 장내시경 검사가 필요한 환자; 또는 (K) 이의 조합; 분류 A 또는 K가 결정된 경우, 절제를 수행하거나, 또는 수행하였고; 분류 I 또는 K가 결정된 경우, 방사선 요법을 수행하거나, 또는 수행하였고; 분류 J 또는 K가 결정된 경우, 대장내시경 검사를 수행하거나, 또는 수행하였고; 또는 치료 유효량의 치료제를 이 환자에게 투여하고: 이때 분류 B 또는 K가 결정된 경우 치료제는 치료제들 중에서 선택되며; 또는 이때 분류 C 또는 K가 결정되면, 치료제는 알킬화제 중에서 선택되며; 또는 이때 분류 D 또는 K가 결정되면 표적 치료제 중에서 치료제가 선택되며; 이때 분류 E 또는 K가 결정되면 치료제는 면역치료제에서 선택되며; 이때 분류 F 또는 K가 결정되면 치료제는 면역 관문 억제제에서 선택되며; 이때 분류 G 또는 K가 결정되면 치료제는 T-세포-관련된 치료법에서 선택되며; 그리고 이때 분류 H 또는 K가 결정되면 치료제는 암 백신에서 선택된다.

일부 실시예들에서, MRM 전이가 정량화되며, 이 정량화는 훈련된 모델의 입력으로 사용되어 출력 확률을 생성된다. 출력 확률은 주어진 가령, 결장직장암 또는 진행성 선종이 있는 분류 또는 결장직장암 또는 진행성 선종이 없는 범주 또는 분류 내에 있을 확률이다. 일부 다른 실시예에서, 출력 확률은 주어진 범주 또는 분류, 가령, 암이 있는 분류 또는 암이 없는 분류 내에 있을 확률이다. 일부 다른 실시예에서, 출력 확률은 주어진 범주 또는 분류, 가령, 자가면역 질환이 있는 분류 또는 자가면역 질환이 없는 분류 내에 있을 확률이다. 일부 다른 실시예에서, 출력 확률은 주어진 범주 또는 분류, 가령, 섬유증이 있는 분류 또는 섬유증이 없는 분류 내에 있을 확률이다. 일부 실시예들에서, 상기 방법들은 정량화된 MRM 전이를 훈련된 모델에 입력하여 출력 확률을 생성한 후 환자를 치료하는 단계, 및 출력 확률에 따라 환자를 치료하는 단계를 포함한다.

일부 실시예들에서, 상기 기계 학습은 MRM 전환과 관련된 MS 피크를 식별하는 데 사용된다. 일부 실시예들에서, 상기 MRM 전이는 기계 학습을 이용하여 분석된다. 일부 실시예들에서, 상기 MRM 전이는 훈련된 기계 학습 알고리즘을 이용하여 분석된다. 이들 실시예중 일부에서, 상기 훈련된 기계 학습 알고리즘은 결장직장암 또는 진행성 선종을 가지고 있는 것으로 알려진 환자들의 샘플 분석에 의해 관찰된 MRM 전이를 이용하여 훈련되었다.

일부 실시예들에서, 상기 훈련된 모델을 이용하여 결장직장암 또는 진행성 선종을 가지고 있는 환자를 치료한다. 일부 실시예들에서, 상기 훈련된 모델은 환자를 치료하기 위해 MRM 전환과 관련된 MS 피크를 식별하는 데 사용된다. 일부 실시예들에서, 상기 훈련된 모델은 환자를 치료하기 위해 기계의 MRM 전환을 식별하는 데 사용된다. 일부 실시예들에서, 상기 훈련된 모델은 MRM 전이(들)과 연합된 글리코펩타이드의 양을 정량화하고, 환자를 치료하는 데 사용되는 출력 확률을 생성한다. 이들 실시예중 일부에서, 상기 훈련된 모델은 결장직장암 또는 진행성 선종이 있는 것으로 알려진 환자들의 샘플을 분석하여 관찰된 MRM 전이를 사용하여 환자를 치료한다.

일부 실시예들에서, 결장직장암 (CRC)의 하나 또는 그 이상의 위험 요소 또는 임상 지표가 환자 진단 및 치료에 고려된다. 일부 구체예들에서, 상기 진단받는 환자는 CRC와 연합된 하나 또는 그 이상의 위험 요소를 가지고 있다.일부 구체예들에서, 상기 치료받는 환자는 CRC와 연합된 하나 또는 그 이상의 위험 요소를 가지고 있다. 일부 구체예들에서, CRC의 위험 인자는 연령, 과민성 대장 질환, 제2형 당뇨병, CRC의 가족력, 유전적 증후군(가령, 린치 증후군), 비만, 흡연, 음주, 식이 선택, 제한된 신체 활동 그리고 이의 조합들을 포함한다. 일부 구체예들에서, 상기 진단받는 환자는 CRC와 연합된 하나 또는 그 이상의 임상 지료를 가지고 있다.일부 구체예들에서, 상기 치료받는 환자는 CRC와 연합된 하나 또는 그 이상의 임상 지료를 가지고 있다.일부 구체예들에서, CRC의 임상 지표는 배변 습관의 변화, 혈변, 설사, 변비, 지속적인 복통, 지속적인 복부경련, 원인불명의 체중감소중 하나 또는 그 이상을 포함한다. 일부 구체예들에서, 상기 개체는 건강한 상태를 가지고 있다고 판단되며, 이때 건강한 상태는 CRC 또는 AA의 부재를 포함한다. 일부 구체예들에서, 상기 방법은 이 대상체에 대해 검출된 해당 상태에 기초한 진단이 내포된 보고서를 생성하는 단계를 추가로 포함한다.

일부 실시예들에서, 상기 환자가 결장직장암으로 진단된 후, 이 환자는 수술을 통해 치료를 받는다. 일부 실시예들에서, 상기 환자가 결장직장암으로 진단된 후, 이 환자는 절제술을 통해 치료를 받는다. 일부 구체예들에서, 결장직장암 (CRC)을 치료하기 위한 수술은 결장의 하나 또는 그 이상의 부분의 제거를 포함한다. 일부 구체예들에서, 상기 치료법은 용종절제술, 국소 절제, 경항문 절제술(TAE), 림프절 제거, 경항문 내시경 미세수술(TEM), 하부전방절제술(LAR), 결장-항문 문합을 이용한 직장절제술, 복부회음절제술(APR), 골반 적출술, 또는 우회 결장루술을 포함한다. 일부 구체예들에서, 상기 수술은 저온수술을 포함할 수 있다.

일부 실시예들에서, 상기 환자가 결장직장암으로 진단된 후, 이 환자는 항-대사물질, 이를 테면, 류코보린, 플루오로우라실(5F0U), 카페시타빈 및 트리플루리딘/티피리실의 치료요법적 효과량으로 치료받는다. 일부 구체예들에서, 결장직장암 (CRC)을 치료하기 위한 화학요법은 5-플루오로우라실, 카페시타빈, 옥살리플라틴, 이리노테칸, 트리플루리딘 및 티피라실, 또는 이들의 조합을 포함한다. 5-플루오로우라실은 일일 약 0.4g/m²~일일 약 3g/m²의 범위로 인간 대상체에게 투여될 수 있다. 카페시타빈은 인간 대상체에게 약 1250mg/m² BID x 2주로 투여한 후, 1주간의 휴식 기간을 갖는, 3-주 주기로 투여할 수 있다. 옥살리플라틴은 일일 약 85g/m²~ 일일 약 600mg/m²의 범위로 인간 대상체에게 투여될 수 있다. 이리노테칸은 일일 125mg/m²~ 일일 약 350mg/m²의 범위로 인간 대상체에게 투여될 수 있다. 트리플루리딘/티피리실은 인간 대상체에게 약 35mg/m² PO BID에서 약 80mg을 초과하지 않는 범위로 투여될 수 있다. m²는 인간 대상체의 대략적인 표면적을 나타낼 수 있고, PO는 경구 또는 구강을 의미할 수 있으며, BID는 라틴어로 bis in die이며, 이는 일일 두 번을 나타냄을 주지해야 한다.

일부 실시예들에서, 상기 환자가 결장직장암으로 진단된 후, 상기 환자는 이리노테칸과 같은 토포이소머라제 억제제의 치료 유효량으로 치료받는다.

일부 실시예들에서, 환자들은 치료 유효량의 알킬화제로 치료받는다. 특정 실시예에서, 상기 알킬화제는 옥살리플라틴 및 엘록사틴과 같은 약물을 포함한다.

일부 실시예들에서, 환자들은 치료요법적 유효량의 표적 치료제로 치료받는다. 특정 실시예에서, 상기 표적화된 표적치료제는 혈관내피성장인자(VEGF)를 표적으로 하는 혈관을 표적으로 하는 약물, 이를 테면, 베바시주맙(Avastin), 라무시루맙(Cyramza), 및 지브-애플리베르셉트(Zaltrap) 이다. 특정 실시예에서, 상기 표적화된 치료요법제는 상피 성장 인자 수용체 (EGFR), 이를 테면, 세툭시맙 (Erbitux), 또는 파니투무맙 (Vectibix)이다. 특정 실시예에서, 상기 표적화된 치료요법제는 키나제 억제제, 이를 테면, 레고라페닙 (Stivarga)이다. 일부 구체예들에서, 상기 표적화된 치료요법제는 VEGF, EGFR, BRAF 및 MEK 유전자의 변화를 포함하되, 이에 국한되지 않는 종양 세포 유전자 발현의 환자별-특이적 변화를 기반으로 선택된다. 일부 구체예들에서, 상기 표적화된 치료요법제는 종양유전자의 억제제이다. 일부 구체예들에서, 상기 표적화된 치료요법제는 VEGF, EGFR, BRAF, 및 MEK의 하나 또는 그 이상의 억제제다. 일부 구체예들에서, 상기 표적화된 치료요법제는 애플리버셉트, 세툭시맙, 파니투무맙, 엔코라페닙, 그리고 이의 조합들을 포함한다. 일부 구체예들에서 상기 표적화된 치료요법제는 혈관생성 억제제를 포함한다. 일부 구체예들에서, 상기 혈관생성 억제제는 베바씨주맙 (Avastin, BEV) 및 라무씨루맙 (Cyramza, RAM) 중 하나이다. 일부 구체예들에서, CRC를 위한 치료요법은 하나 또는 그 이상의 표적화된 치료요법제의 조합을 포함한다.

일부 실시예들에서, 환자들은 치료요법적 유효량의 면역-치료제로 치료받는다. 특정 실시예에서, 상기 면역-치료제는 면역관문 억제제로 구성된 군에서 선택된다. 특정 실시예에서, 상기 면역관문 억제제는 PD-1-억제제, PD-L1-억제제, CTLA-4-억제제, 그리고 이의 조합들로 구성된 군에서 선택된다. 일부 구체예들에서, 면역요법은 항체다. 일부 구체예들에서, 상기 항체는 PD-1, PD-L1, 및 CTLA-4를 비롯한, 그러나 이에 국한되지 않는, 면역계 관문 단백질을 지향한다. 일부 구체예들에서, PD-1을 표적으로 하는 항체는 니볼루맙 (Opdivo), 펨브로리주맙 (Keytruda), 및 쎄미플리맙 (Libtayo)을 포함한다. 일부 구체예들에서, PD-L1을 표적으로 하는 항체는 아테졸리주맙 (Tecentriq), 두르발루맙 (Imfinzi), 및 아벨루맙 (Bavencio)을 포함한다. 일부 구체예들에서, CTLA-4를 표적으로 하는 항체는 이필리무맙 (Yervoy)을 포함한다. 일부 구체예들에서, CRC의 치료법은 PD-1, PD-L1, 및 CTLA-4를 표적으로 하는 하나 또는 그 이상의 항체의 조합을 포함한다.

일부 실시예들에서, T-세포-관련된 치료제의 치료요법적 효과량으로 환자들은 치료받는다. 특정 실시예에서, 상기 T-세포-관련된 치료제는 CAR-T-처리법, TCR-처리법, 그리고 이의 조합들로 구성된 군에서 선택된다.

일부 실시예들에서, 환자들은 치료요법적 효과량의 암 백신으로 치료받는다.

일부 실시예들에서, 환자들은 치료요법적 효과량의 방사능요법으로 치료받는다. 특정 실시예에서, 상기 방사능요법은 외부 빔-방사능요법 및 내부- 방사능요법, 화학방사선요법, 근접치료(brachytherapy), 그리고 이의 조합들로 구성된 군에서 선택된다. 일부 구체예들에서, 상기 방사능요법은 결장직장암 (CRC)을 치료하기 위해 고-에너지 광선 또는 입자를 사용하는 방사능 요법다. 일부 구체예들에서, 상기 방사능 요법는 외부 빔 방사능 요법 (EBRT) 및 내부 방사능 요법 (근접치료라고도 지칭됨)을 포함한다. 일부 구체예들에서, EBRT는 정위 절제 방사능 요법(SABR), 3차원 입체 방사능 요법(3D-CRT), 강도 변조 방사능 요법(IMRT), 정위 신체 방사능 요법(SBRT) 정위 방사선 수술(SRS) 또는 이의 조합 중 하나 또는 그 이상을 포함한다. 일부 구체예들에서, 상기 근접치료는 결장 (가령, 직장 강)의 종양 내부 또는 종양 근처에 방사성 물질을 배치하는 단계를 포함한다.

일부 실시예들에서, 상기 환자는 표적화된 요법에서 선택된 치료제로 치료된다. 일부 실시예들에서, 본원의 방법들에는 치료요법적 효과량의 5-플루오로우라실 (5-FU); 카페시타빈 (Xeloda), 이리노테칸 (Camptosar), 옥살리플라틴 (Eloxatin), 트리플루리딘 및 티피라실 (Lonsurf)을 투여하는 단계가 내포된다.

일부 실시예들에서, 상기 치료요법제는 150 mg, 250 mg, 300 mg, 350 mg, 및 600 mg의 용량으로 투여된다. 일부 실시예들에서, 상기 치료요법제는 일일 두 차례 투여된다.

화학치료요법제에는 백금-기반 약물, 이를 테면, 카보플라틴(Paraplatin), 또는 탁산과 시스플라틴, 이를 테면, 파클리탁셀(Taxol) 또는 도세탁셀(Taxotere)이 내포되지만, 이에 국한되지는 않는다. 파라플라틴은 10mg/mL 의주사 가능한 농도(50, 150, 450 및 600mg의 바이알)로 투여될 수 있다. 진행성 암종의 경우, 단일 제제 용량 360mg/m²으로 IV를 4주 동안 투여될 수 있다. 파라플라틴은 q4주 동안 병용하여 다음과 같이 투여될 수 있다=300mg/m² IV (+ 시클로포스파미드 600mg/m² IV). 탁솔은 q3주 동안, 3시간에 걸쳐 175 mg/m² 으로 IV 투여될 수 있다 (시스플라틴 투여 후). 탁솔은 q3주 동안, 3시간에 걸쳐 135 mg/m²으로 IV로 투여될 수 있다 (시스플라틴 투여 후). 탁솔은 q3주 동안, 3시간에 걸쳐 135-175 mg/m² 으로 IV로 투여될 수 있다.

표적화된 치료요법제에는 PARP 억제제가 포함되지만, 이에 국한되지는 않는다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 생물학적 샘플 및/또는 대조군 샘플 상에서 다중-반응-모니터링질량 분광법 (MRM-MS)을 수행하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 질량 분광법은 다중 반응 모니터링(MRM) 모드를 사용하여 수행된다. 일부 실시예들에서, 상기 질량 분광법은 데이터-의존적 수집으로 QTOF MS를 이용하여 수행된다. 일부 실시예들에서, 상기 질량 분광법은 MS-단독 모드를 이용하여 수행된다. 일부 실시예들에서, 면역분석법 (가령, ELISA)은 질량 분광법과 복합하여 이용된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 정량화하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 정량화하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 정량화하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 정량화하는 단계가 내포된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 그리고 이의 조합들의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 정량화하는 단계가 내포된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 그리고 이의 조합들의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 정량화하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드를 정량화하는 단계가 내포된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드를 정량화하는 단계가 내포된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드를 정량화하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 정량화하는 단계가 내포된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 정량화하는 단계가 내포된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 정량화하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 전이 1-38로 구성된 군에서 선택된 다중-반응-모니터링(MRM) 전이를 QQQ 및/또는 qTOF 질량 분광계를 이용하여 검출하는 단계가 내포된다. 전술한 것들 중 임의의 것이 내포된 일부 구체예들에서, 상기 방법에는 표 10의 하나 또는 그 이상의 펩티드 구조를 QQQ 및/또는 qTOF 질량 분광계를 이용하여 검출하는 단계가 내포된다. 전술한 것들 중 임의의 것이 내포된 일부 구체예들에서, 상기 방법에는 서열 식별 번호: 1-38의 아미노산 서열을 포함하는 하나 또는 그 이상의 펩티드 구조를 QQQ 및/또는 qTOF 질량 분광계를 이용하여 검출하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법에는 정량화 단계에 기초하여 분류를 확인하기 위해 기계 학습 알고리즘을 훈련하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 기계 학습 알고리즘은 딥러닝 알고리즘, 신경망 알고리즘, 인공 신경망 알고리즘, 지도 머신 러닝 알고리즘, 선형 판별 분석 알고리즘, 2차 판별 분석 알고리즘, 서포트 벡터 머신 알고리즘, 선형 기저 함수 커널 서포트 벡터 알고리즘, 방사형 기저함수 커널 지원 벡터 알고리즘, 랜덤 포레스트 알고리즘, 유전자 알고리즘, 최근접 이웃 알고리즘, k-최근접 이웃, 나이브 베이즈 분류 알고리즘, 로지스틱 회귀 알고리즘, 정규화된 회귀 알고리즘, 또는 이의 조합으로 구성된 군에서 선택된다.

D. 환자들을 진단하는 방법들

일부 실시예들에서, 본원에서 질환 또는 병태를 보유하는 환자를 진단하는 방법이 제시되며, 이 방법은 상기 환자의 샘플 내 글리코펩티드를 질량 분광법으로 측정하는 단계를 포함한다.

또다른 구체예에서, 결장직장암 또는 진행성 선종을 갖는 환자를 진단하는 방법이 본원에서 제시되며; 이 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 검출 및 정령화하기 위해; 또는 전이 1-38로 부터 선택된 하나 또는 그 이상의 MRM 전이를 검출하고 정량화하기 위해, QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 상기 생물학적 샘플의 질량 분광법을 수행하는 단계; 출력 확률을 생성하기 위해 상기 탐지된 글리코펩티드들 또는 MRM 전이의 정량을 훈련된 모델로 입력하는 단계, 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 상기 환자에 대한 진단 분류를 확인하는 단계; 그리고 상기 진단 분류에 기초하여 상기 환자는 결장직장암 또는 진행성 선종을 가지는 것으로 진단하는 단계.

또다른 구체예에서, 본원에서 결장직장암 또는 진행성 선종을 갖는 환자를 진단하는 방법이 제시되며; 상기 방법은 다음을 포함한다: 탐지된 글리코펩티드 또는 MRM 전이의 정량화를 훈련된 모델로 입력시켜 출력 확률을 생성하고, 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 상기 환자에 대한 진단 분류를 확인하는 단계; 그리고 상기 진단 분류에 기초하여 상기 환자는 결장직장암 또는 진행성 선종을 가지는 것으로 진단한다. 일부 실시예들에서, 상기 방법에는 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출하고 정량화하기 위해; 또는 전이 1-38로부터 선택된 하나 또는 그 이상의 MRM 전이를 을 검출하고 정량화하기 위해; 상기 생물학적 샘플의 질량 분광법을 수행하는 단계가 내포된다.

일부 실시예들에서, 본원에서 결장직장암 또는 진행성 선종을 갖는 환자를 진단하는 방법이 제시되며; 상기 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출하기 위해; 또는 전이 1-38로 부터 선택된 하나 또는 그 이상의 MRM 전이를 검출하기 위해 QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 생물학적 샘플의 질량 분광법을 수행하는 단계; 진단 분류를 확인하기 위해 훈련된 모델 또는 훈련 모델을 이용하여 탐지된 글리코펩티드 또는 MRM 전이를 분석하는 단계; 그리고 상기 진단 분류에 기초하여 상기 환자는 결장직장암 또는 진행성 선종을 가지는 것으로 진단하는 단계. 일부 실시예들에서, 상기 방법에는 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 그리고 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출하기 위해; 또는 전이 1-38로 부터 선택된 하나 또는 그 이상의 MRM 전이를 검출하기 위해; QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 상기 생물학적 샘플의 질량 분광법을 수행하는 단계.

일부 실시예들에서, 본원에서 개체에서 노화를 진단하고, 모니터링라고, 또는 분류하는 방법이 제시되며; 상기 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출하기 위해; 또는 전이 1-38로 부터 선택된 하나 또는 그 이상의 MRM 전이를 검출하기 위해 QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 상기 생물학적 샘플의 질량 분광법을 수행하는 단계; 진단 분류를 확인하기 위해 훈련된 모델을 이용하여 탐지된 글리코펩티드들 또는 MRM 전이를 분석하는 단계; 그리고 상기 진단 분류에 기초하여 상기 개체가 노화 분류를 갖는 것으로 진단, 모니터링 또는 분류하는 단계.

일부 실시예들에서, 본원에서 개체에서 노화를 진단하고, 모니터링라고, 또는 분류하는 방법이 제시되며; 상기 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출하기 위해; 또는 전이 1-38로 부터 선택된 하나 또는 그 이상의 MRM 전이를 검출하기 위해 QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 상기 생물학적 샘플의 질량 분광법을 수행하는 단계; 진단 분류를 확인하기 위해 탐지된 글리코펩티드들 또는 MRM 전이를 이용하여 모델을 훈련시키는 단계; 그리고 상기 진단 분류에 기초하여 상기 개체가 노화 분류를 갖는 것으로 진단, 모니터링 또는 분류하는 단계.

일부 실시예들에서, 본원에서 개체에서 노화를 진단하고, 모니터링하고, 또는 분류하는 방법이 제시되며; 상기 방법은 다음을 포함한다: 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출하기 위해; 또는 전이 1-38로 부터 선택된 하나 또는 그 이상의 MRM 전이를 검출하기 위해 QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 상기 생물학적 샘플의 질량 분광법을 수행하는 단계; 진단 분류를 확인하기 위해 훈련된 모델을 이용하여 탐지된 글리코펩티드들 또는 MRM 전이를 분석하는 단계; 그리고 상기 진단 분류에 기초하여 상기 개체가 노화 분류를 갖는 것으로 진단, 모니터링 또는 분류하는 단계.

또다른 구체예에서, 결장직장암 또는 진행성 선종을 갖는 환자를 진단하는 방법이 본원에서 제시되며; 이 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 검출 및 정령화하기 위해, QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 상기 생물학적 샘플의 질량 분광법을 수행하는 단계; 출력 확률을 생성하기 위해 상기 탐지된 글리코펩티드들 또는 MRM 전이의 정량을 훈련된 모델로 입력하는, 또는 모델을 훈련시키는 단계, 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 상기 환자에 대한 진단 분류를 확인하는 단계; 그리고 상기 진단 분류에 기초하여 상기 환자는 결장직장암 또는 진행성 선종을 가지는 것으로 진단하는 단계.

또다른 구체예에서, 결장직장암 또는 진행성 선종을 갖는 환자를 진단하는 방법이 본원에서 제시되며; 이 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 검출 및 정령화하기 위해, QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 상기 생물학적 샘플의 질량 분광법을 수행하는 단계; 출력 확률을 생성하기 위해 상기 탐지된 글리코펩티드들 또는 MRM 전이의 정량을 훈련된 모델로 입력하는 단계, 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 상기 환자에 대한 진단 분류를 확인하는 단계; 그리고 상기 진단 분류에 기초하여 상기 환자는 결장직장암 또는 진행성 선종을 가지는 것으로 진단하는 단계.

또다른 구체예에서, 본원에서 결장직장암 또는 진행성 선종을 갖는 환자를 진단하는 방법이 제시되며; 상기 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로부터 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 검출하고 정량화시키기 위해 QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 생물학적 샘플의 질량 분광법을 수행하는 단계; 그리고 상기 탐지된 글리코펩티드들 또는 MRM 전이의 정량화를 이용하여 출력 확률을 생성하기 위해 모델을 훈련시키는 단계.

또다른 구체예에서, 결장직장암 또는 진행성 선종을 갖는 환자를 진단하는 방법이 본원에서 제시되며; 이 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 검출 및 정령화하기 위해, QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 상기 생물학적 샘플의 질량 분광법을 수행하는 단계; 출력 확률을 생성하기 위해 상기 탐지된 글리코펩티드들 또는 MRM 전이의 정량을 훈련된 모델로 입력하는 단계, 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 상기 환자에 대한 진단 분류를 확인하는 단계; 그리고 상기 진단 분류에 기초하여 상기 환자는 결장직장암 또는 진행성 선종을 가지는 것으로 진단하는 단계.

일부 실시예들에서, 본원에서 결장직장암 또는 진행성 선종을 갖는 환자를 진단하는 방법이 제시되며; 상기 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출하기 위해 QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 생물학적 샘플의 질량 분광법을 수행하는 단계; 진단 분류를 생성시키기 위해 훈련된 모델을 이용하여 탐지된 글리코펩티드 또는 MRM 전이를 분석하는 단계; 그리고 상기 진단 분류에 기초하여 상기 환자는 결장직장암 또는 진행성 선종을 가지는 것으로 진단하는 단계. 일부 실시예들에서, 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 이용하여 진단 분류를 생성시키기 위해 모델을 훈련시킨다.

일부 실시예들에서, 본원에서 결장직장암 또는 진행성 선종을 갖는 환자를 진단하는 방법이 제시되며; 상기 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출하기 위해 QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 생물학적 샘플의 질량 분광법을 수행하는 단계; 진단 분류를 확인하기 위해 훈련된 모델을 이용하여 탐지된 글리코펩티드 또는 MRM 전이를 분석하는 단계; 그리고 상기 진단 분류에 기초하여 상기 환자는 결장직장암 또는 진행성 선종을 가지는 것으로 진단하는 단계. 일부 실시예들에서, 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 이용하여 진단 분류를 확인하기 위해 모델을 훈련시킨다.

일부 실시예들에서, 본원에서 결장직장암 또는 진행성 선종을 갖는 환자를 진단하는 방법이 제시되며; 상기 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출하기 위해 QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 생물학적 샘플의 질량 분광법을 수행하는 단계; 진단 분류를 확인하기 위해 훈련된 모델을 이용하여 탐지된 글리코펩티드 또는 MRM 전이를 분석하는 단계; 그리고 상기 진단 분류에 기초하여 상기 환자는 결장직장암 또는 진행성 선종을 가지는 것으로 진단하는 단계. 일부 실시예들에서, 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 이용하여 진단 분류를 확인하기 위해 모델을 훈련시킨다.

일부 실시예들에서, 본원에서 개체에서 노화를 진단하고, 모니터링라고, 또는 분류하는 방법이 제시되며; 상기 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출하기 위해 QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 상기 생물학적 샘플의 질량 분광법을 수행하는 단계; 진단 분류를 확인하기 위해 훈련된 모델을 이용하여 탐지된 글리코펩티드들 또는 MRM 전이를 분석하는 단계; 그리고 상기 진단 분류에 기초하여 상기 개체가 노화 분류를 갖는 것으로 진단, 모니터링 또는 분류하는 단계. 일부 실시예들에서, 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 이용하여 진단 분류를 확인하기 위해 모델을 훈련시킨다.

일부 실시예들에서, 본원에서 개체에서 노화를 진단하고, 모니터링라고, 또는 분류하는 방법이 제시되며; 상기 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출하기 위해 QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 상기 생물학적 샘플의 질량 분광법을 수행하는 단계; 진단 분류를 확인하기 위해 훈련된 모델을 이용하여 탐지된 글리코펩티드들 또는 MRM 전이를 분석하는 단계; 그리고 상기 진단 분류에 기초하여 상기 개체가 노화 분류를 갖는 것으로 진단, 모니터링 또는 분류하는 단계. 일부 실시예들에서, 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 이용하여 진단 분류를 확인하기 위해 모델을 훈련시킨다.

일부 실시예들에서, 본원에서 개체에서 노화를 진단하고, 모니터링라고, 또는 분류하는 방법이 제시되며; 상기 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출하기 위해 QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 상기 생물학적 샘플의 질량 분광법을 수행하는 단계; 그리고 진단 분류를 확인하기 위해 훈련된 모델을 이용하여 탐지된 글리코펩티드들 또는 MRM 전이를 분석하는 단계; 그리고 상기 진단 분류에 기초하여 상기 개체가 노화 분류를 갖는 것으로 진단, 모니터링 또는 분류하는 단계. 일부 실시예들에서, 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 이용하여 진단 분류를 확인하기 위해 모델을 훈련시킨다.

일부 실시예들에서, 본원에서 개체에서 노화를 진단하고, 모니터링라고, 또는 분류하는 방법이 제시되며; 상기 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출하기 위해 QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 상기 생물학적 샘플의 질량 분광법을 수행하는 단계; 진단 분류를 확인하기 위해 훈련된 모델을 이용하여 탐지된 글리코펩티드들 또는 MRM 전이를 분석하는 단계; 그리고 상기 진단 분류에 기초하여 상기 개체가 노화 분류를 갖는 것으로 진단, 모니터링 또는 분류하는 단계. 일부 실시예들에서, 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 이용하여 진단 분류를 확인하기 위해 모델을 훈련시킨다.

일부 실시예들에서, 본원에서 개체에서 노화를 진단하고, 모니터링라고, 또는 분류하는 방법이 제시되며; 상기 방법은 다음을 포함한다: 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출하기 위해 QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 상기 생물학적 샘플의 질량 분광법을 수행하는 단계; 진단 분류를 확인하기 위해 모델을 훈련시키는 단계. 일부 다른 단계들에서, 상기 방법에는 이 개체가 상기 진단 분류에 기초하여 노화 분류를 갖는 지를 진단하고, 모니터링하고, 분류하는 것이 내포될 수 있다. 일부 실시예들에서, 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 구성된, 또는 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 이용하여 진단 분류를 확인하기 위해 모델을 훈련시킨다.

E. 질환들 및 병태들

본원에서 각종 질환들 및 병태들을 진단하기 위한 바이오마커들이 제시된다.

일부 실시예들에서, 상기 질환들 및 병태들에는 암이 내포된다. 일부 실시예들에서, 상기 질환들 및 병태들은 암에 국한되지 않는다.

일부 실시예들에서, 상기 질환들 및 병태들에는 결장직장암 또는 진행성 선종이 내포된다. 일부 실시예들에서, 상기 질환들 및 병태들은 결장직장암 또는 진행성 선종에 국한되지 않는다.

일부 구체예들에서, 결장직장암 (CRC)은 하부 위장관, 예를 들어, 결장, 직장 및/또는 맹장에서의 암이다. 일부 구체예들에서, CRC는 결장 폴립에서 발달할 수 있다. 일부 구체예들에서, 상기 결장 폴립은 대장이나 직장의 내벽에서 자란다. 일부 구체예들에서, 상기 결장 폴립은 양성이다. 일부 구체예들에서, 상기 결장 폴립은 악성이다. 일부 구체예들에서, 상기 결장 폴립은 진단 및/또는 치료되지 않으면, 결장직장 선종으로 진행된다. 일부 구체예들에서, 상기 결장 폴립은 진단 및/또는 치료되지 않으면, 결장직장 선종 선종으로 진행된다. 일부 구체예들에서, 상기 결장 폴립은 진단 및/또는 치료되지 않으면, CRC로 진행된다. 시기적절한 진단 및/또는 치료가 없으면, CRC 환자의 생존율은 상당히 낮다.

일부 구체예들에서, 여기에는 CRC가 있는 개인과 CRC가 없는 개인을 분류하는 방법이 제공된다. 일부 구체예들에서, 여기에는 진행성 선종 (AA)가 있는 개체와 AA가 없는 개체를 분류하는 방법이 제공된다. 일부 구체예들에서, 여기에는 CRC가 있는 개체와 CRC가 없는 개체를 분류하는 방법이 제공된다. 일부 구체예들에서, 여기에는 개체에서 진행성 선종 (AA)가 있는 지 또는 AA가 없는 지를 진단하는 방법이 제공된다. 일부 구체예들에서, CRC를 가지고 있는 개체를 치료하는 방법이 본원에서 제공된다. 일부 구체예들에서, 진행성 선종 (AA)을 가지고 있는 개체를 치료하는 방법이 본원에서 제공된다. 일부 구체예들에서, CRC 또는 AA를 가진 개체를 치료하는 방법은 특정 치료법을 선택하고 및/또는 이 특정 치료법을 투여하는 단계를 포함한다. 본원에서 기재된 임의의 구체예들에서, 상기 방법은 질환 표시자를 식별하기 위해 훈련된 하나 또는 그 이상의 기계-학습 모델로 펩티드들 및/또는 글리코펩티드 세트에 대한 펩티드 구조 데이터로부터 확인된 정량화 데이터를 입력하는 단계를 포함한다. 일부 구체예들에서, 상기 방법은 상기 질환 표시자에 기초하여 CRC 또는 AA를 보유하는지, 또는 CRC 또는 AA를 보유하지 않는 지로 이 샘플을 분류하는 단계를 포함한다. 일부 구체예들에서, 상기 치료법은 표 10의 적어도 하나의 펩티드 구조의 존재 및/또는 양에 근거하여 선택된다. 일부 구체예들에서, 상기 치료법은 서열 식별 번호: 1-38의 아미노산 서열을 포함하는 적어도 하나의 글리코펩티드들의 존재 및/또는 양에 근거하여 선택된다. 일부 구체예들에서, 상기 치료법은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38의 아미노산 서열을 포함하는 적어도 하나의 글리코펩티드들의 존재 및/또는 양에 근거하여 선택된다. 일부 구체예들에서, 상기 치료법은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33의 아미노산 서열을 포함하는 적어도 하나의 글리코펩티드들의 존재 및/또는 양에 근거하여 선택된다. 일부 구체예들에서, 상기 치료법은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 32의 아미노산 서열을 포함하는 적어도 하나의 글리코펩티드들의 존재 및/또는 양에 근거하여 선택된다.

본원에서 개체를 진단 및 치료하는 방법이 제시된다. 본원에서 결장직장암 (CRC) 또는 진행성 선종 (AA)와 연합된 하나 또는 그 이상의 위험 인자들을 갖는 개체를 진단 및 치료하는 방법에 번원에서 더 제공된다. 일부 구체예들에서, 상기 방법은 CRC 또는 AA와 연합된 하나 또는 그 이상의 위험 인자들을 갖는 개체에서 표 10의 하나 또는 그 이상의 펩티드들 구조의 양/존재 또는 부재를 측정하는 단계를 포함한다. 일부 구체예들에서, 상기 방법은 표 10의 하나 또는 그 이상의 펩티드 구조의 존재 및/또는 양에 근거하여 개체를 진단하는 것에 관련된다. 일부 구체예들에서, 상기 방법은 표 10의 하나 또는 그 이상의 글리코펩티드의 존재 및/또는 양에 근거하여 개체를 진단하는 것에 관련된다. 일부 구체예들에서, 상기 진단은 표 10에서 제시된 서열 식별 번호: 1-38의 아미노산 서열을 포함하는 하나 또는 그 이상의 펩티드들 및/또는 글리코펩티드의 존재 및/또는 양에 근거한다. 일부 구체예들에서, 상기 진단은 표 10에서 제시된 서열 식별 번호: 1-38의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드의 존재 및/또는 양에 근거한다. 일부 구체예들에서, 상기 진단은 표 10에서 제시된 연합된 글리칸들과 함께, 서열 식별 번호: 1-38의 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드의 존재 및/또는 양에 근거한다. 일부 구체예들에서, CRC 또는 AA로 진단받은 개체는 상기 진단에 의해 결정된 질환 표시자에 근거하여 본원에서 기재된 하나 또는 그 이상의 CRC 또는 AA 치료법을 투여받는다. 일부 구체예들에서, 상기 개체는 상기 진단에 의해 결정된 질환 표시자에 근거하여 본원에서 기재된 하나 또는 그 이상의 CRC 또는 AA 치료법을 투여받는다. 일부 구체예들에서, CRC 또는 AA를 보유하는 것으로 확인된 개체는 상기 진단에 의해 결정된 질환 표시자에 기초하여 치료받는다.

일부 구체예들에서, 상기 개체는 표 10의 하나 또는 그 이상의 펩티드 구조가 탐지되고, 건강한 대조군 샘플과는 구별될 때 진단받는다. 일부 구체예들에서, 상기 개체는 서열 식별 번호: 1-38의 아미노산 서열을 포함하는 하나 또는 그 이상의 펩티드 구조가 탐지되고, 건강한 대조군 샘플과는 구별될 때 진단받는다. 일부 구체예들에서, 상기 개체는 서열 식별 번호: 1-38의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드가 탐지되고, 건강한 대조군 샘플과는 구별될 때 진단받는다. 일부 구체예들에서, 적어도 하나의 펩티드 구조의 양이 없거나, 또는 검출 한계 아래에 있다. 일부 구체예들에서, 적어도 하나의 글리코펩티드 구조의 양이 없거나, 또는 검출 한계 아래에 있다. 일부 구체예들에서, 표 10의 적어도 하나의 펩티드 구조의 양이 없거나, 또는 검출 한계 아래에 있다. 일부 구체예들에서, 표 10에서 제시된 서열 식별 번호: 1-38의 아미노산 서열을 포함하는 적어도 하나의 펩티드 구조의 양이 없거나, 또는 검출 한계 아래에 있다. 일부 구체예들에서, 적어도 하나의 펩티드 구조의 양은 건강한 개체의 대조군 샘플에 존재하는 양보다 유의미적으로 더 낮다. 일부 구체예들에서, 적어도 하나의 글리코펩티드 구조의 양은 건강한 개체의 대조군 샘플에 존재하는 양보다 유의미적으로 더 낮다. 일부 구체예들에서, 표 10의 적어도 하나의 펩티드 구조의 양은 건강한 개체의 대조군 샘플에 존재하는 양보다 유의미적으로 더 낮다. 일부 구체예들에서, 표 10에서 제시된 서열 식별 번호: 1-38의 아미노산 서열을 포함하는 적어도 하나의 펩티드 구조의 양은 건강한 개체의 대조군 샘플에 존재하는 양보다 유의미적으로 더 낮다. 일부 구체예들에서, 적어도 하나의 펩티드 구조의 양은 건강한 개체의 대조군 샘플에 존재하는 양보다 유의미적으로 더 높다. 일부 구체예들에서, 적어도 하나의 글리코펩티드 구조의 양은 건강한 개체의 대조군 샘플에 존재하는 양보다 유의미적으로 더 높다. 일부 구체예들에서, 표 10의 적어도 하나의 펩티드 구조의 양은 건강한 개체의 대조군 샘플에 존재하는 양보다 유의미적으로 더 높다. 일부 구체예들에서, 표 10에서 제시된 서열 식별 번호: 1-38의 아미노산 서열을 포함하는 적어도 하나의 펩티드 구조의 양은 건강한 개체의 대조군 샘플에 존재하는 양보다 유의미적으로 더 높다. 일부 구체예들에서, 상기 개체는 표 10의 하나 또는 그 이상의 펩티드 구조의 존재 및/또는 양에 따라 진단되며, 치료된다. 일부 구체예들에서, 상기 개체는 표 10에 제시된 연합된 글리칸과 함께, 서열 식별 번호: 1-38의 아미노산 서열을 포함하는 하나 또는 그 이상의 펩티드 구조의 존재 및/또는 양에 따라 진단되며, 치료된다.

일부 구체예들에서, 상기 개체는 CRC 또는 AA를 보유한다. 일부 구체예들에서, 상기 개체는 단계 0, 단계 I, 단계 II, 단계 III, 또는 단계 IV의 CRC를 갖는다. 일부 구체예들에서, 상기 개체는 초기-단계 CRC를 갖는다. 일부 구체예들에서, 상기 개체는 후기-단계 CRC 또는 진행된 CRC를 갖는다. 일부 구체예들에서, 상기 개체는 원발 부위로부터 확산되지 않은 CRC를 갖는다. 일부 구체예들에서, 상기 개체는 주변 조직으로 국소적으로 확산된 CRC를 갖는다. 일부 구체예들에서, 상기 개체는 원발 종양 및/또는 국소 종양 환경을 넘어 확산된 CRC를 갖는다. 일부 구체예들에서, 상기 개체는 폐를 넘어서 하나 또는 그 이상의 장기로 확산된 CRC를 갖는다. 일부 구체예들에서, 상기 개체는 전이성 CRC를 갖는다. 일부 구체예들에서, 상기 개체는 재발되거나 및/또는 진행된 CRC를 갖는다. 일부 구체예들에서, 상기 방법은 표 10에서 제공된 하나 또는 그 이상의 펩티드 구조에 기초하여 CRC와 연합된 다중 상태에 대해 생물학적 샘플을 분류하는 단계를 포함한다. 일부 구체예들에서, 상기 방법은 표 10에서 제공된 하나 또는 그 이상의 글리코펩티드들에 기초하여 CRC 또는 AA와 연합된 다중 상태에 대해 생물학적 샘플을 분류하는 단계를 포함한다. 일부 구체예들에서, 상기 방법은 질환 표시자를 식별하기 위해 훈련된 하나 또는 그 이상의 기계-학습 모델로 펩티드들 및/또는 글리코펩티드 세트에 대한 펩티드 구조 데이터로부터 확인된 정량화 데이터를 입력하는 단계를 포함한다. 일부 구체예들에서, 상기 방법은 상기 질환 표시자에 기초하여 CRC 또는 AA를 보유하는지, 또는 CRC 또는 AA를 보유하지 않는 지로 이 샘플을 분류하는 단계를 포함한다. 일부 구체예들에서, 상기 펩티드 구조 데이터는 표 10에서 제공된 하나 또는 그 이상의 펩티드 구조를 포함한다. 일부 구체예들에서, 하나 또는 그 이상의 펩티드들 및/또는 글리코펩티드의 존재, 부재 및/또는 그 양은 MRM-MS에 의해 결정된다. 일부 구체예들에서, 상기 방법은 표 10에서 제공된 펩티드 구조를 포함하는 하나 또는 그 이상의 바이오마커의 존재, 양, 및/또는 상대적 양에 기초하여 본원에서 제공된 특정 치료법을 선택하는 단계를 포함한다. 일부 구체예들에서, 상기 방법은 표 10에서 제공된 글리코펩티드들을 포함하는 하나 또는 그 이상의 바이오마커의 존재, 양, 및/또는 상대적 양에 기초하여 본원에서 제공된 특정 치료법을 선택하는 단계를 포함한다. 일부 구체예들에서, 상기 방법은 표 10에서 제공된 펩티드 구조를 포함하는 하나 또는 그 이상의 바이오마커의 존재, 양, 및/또는 상대적 양에 기초하여 본원에서 제공된 특정 치료법을 투여하는 단계를 포함한다. 일부 구체예들에서, 상기 방법은 표 10에서 제공된 글리코펩티드들을 포함하는 하나 또는 그 이상의 바이오마커의 존재, 양, 및/또는 상대적 양에 기초하여 본원에서 제공된 특정 치료법을 투여하는 단계를 포함한다. 일부 구체예들에서, 상기 방법은 상기 질환 표시자 및/또는 분류에 기초하여 본원에 기재된 특정 치료법을 선택하는 단계를 더 포함한다. 일부 구체예들에서, 상기 방법은 상기 질환 표시자 및/또는 분류에 기초하여 본원에 기재된 특정 치료법을 투여하는 단계를 더 포함한다.

일부 구체예들에서, 상기 개체는 CRC 또는 AA을 치료하기 위한 우선 요법을 받았었다 . 일부 구체예들에서, 상기 개체는 CRC 또는 AA을 치료하기 위한 적어도 1가지, 적어도 2가지, 또는 적어도 3가지 우선 요법을 받았었다. 일부 구체예들에서, 상기 개체는 CRC 또는 AA을 치료하기 위한 1가지를 넘지 않는, 2가지를 넘지 않는, 또는 3가지를 넘지 않는 우선 요법을 받았었다. 일부 구체예들에서, 상기 개체는 CRC 또는 AA을 치료하기 위한 우선 요법을 받지 않았다.

일부 구체예들에서, 상기 개체는 결장직장암 (CRC) 치료와 관련된 변경된 유전자 발현을 갖는다. 일부 구체예들에서, 상기 개체는 변경된 종양유전자 발현을 갖는다. 일부 구체예들에서, 상기 개체는 변경된 종양 세포 유전자 발현을 갖는다. 일부 구체예들에서, 상기 변경된 유전자 발현은 VEGF, EGFR, BRAF, 및 MEK 중 하나 또는 그 이상의 변경된 유전자 발현을 포함한다. 일부 구체예들에서, 상기 변경된 유전자 발현은 면역계 관문 단백질 PD-1, PD-L1, 및 CTLA-4 중 하나 또는 그 이상의 변경된 유전자 발현을 포함한다. 일부 구체예들에서, CRC 치료와 관련된 변경된 유전자 발현을 갖는 개체는 PD-1, PD-L1, 및 CTLA-4, 또는 이의 조합을 표적으로 하는 하나 또는 그 이상의 항체를 포함하는 치료법으로부터 이익을 받게 될 것이다.

일부 구체예들에서, 상기 개체는 결장직장암 (CRC) 또는 진행성 선종 (AA) 발달 위험에 처해 있다. 일부 구체예들에서, CRC 또는 AA의 위험은 표 10의 적어도 하나의 펩티드 구조의 존재 및/또는 양에 근거하여 결정된다. 일부 구체예들에서, CRC의 위험은 서열 식별 번호: 1-38의 아미노산 서열을 포함하는 하나 또는 그 이상의 펩티드들의 존재 및/또는 양에 근거하여 결정된다. 일부 구체예들에서, 상기 개체는 CRC의 발달 기회를 증가시키는 하나 또는 그 이상의 위험 인자에 대해 양성이다. 일부 구체예들에서, 상기 하나 또는 그 이상의 위험 인자는 연령, 과민성 대장 질환, 제2형 당뇨병, CRC의 가족력, 유전적 증후군(가령, 린치 증후군), 비만, 흡연, 담배 사용, 음주, 식이 선택 및 제한된 신체 활동으로 구성된 그룹에서 선택된다. 일부 구체예들에서, 상기 개체는 CRC에 대한 적어도 1가지, 적어도 2가지, 적어도 3가지, 적어도 4가지, 적어도 5가지, 또는 적어도 6가지 위험 인자들을 갖는다.

일부 구체예들에서, 상기 개체는 결장직장암 (CRC) 또는 진행성 선종 (AA)의 발달 기회를 증가시키는 하나 또는 그 이상의 위험 인자에 대해 양성이다. 일부 구체예들에서, 상기 하나 또는 그 이상의 위험 인자는 상기 개체의 연령을 포함한다. 일부 구체예들에서, 상기 개체는 적어도 30세, 적어도 35세, 적어도 40세, 적어도 45세, 적어도 50세, 적어도 55세, 적어도 60세, 적어도 65세, 적어도 70세, 적어도 75세, 적어도 80세, 적어도 85세, 또는 적어도 90세이다. 일부 구체예들에서, 상기 개체는 적어도 30세이다. 일부 구체예들에서, 상기 개체는 적어도 40세이다. 일부 구체예들에서, 상기 개체는 적어도 50세이다. 일부 구체예들에서, 상기 개체는 적어도 60세이다.

일부 구체예들에서, 결장직장암 (CRC) 또는 진행성 선종 (AA) 발달 위험에 처한 개체는 과체중 또는 비만이다. 일부 구체예들에서, CRC 발달 위험에 처한 개체의 체질량 지수 (BMI)는 ≥ 30 kg/m이다. 일부 구체예들에서, CRC 발달 위험에 처한 개체의 BMI는 ≥ 35 kg/m이다. 일부 구체예들에서, CRC 발달 위험에 처한 개체의 BMI는 ≥ 40 kg/m이다. 일부 구체예들에서, 상기 개체는 고도 비만으로 간주된다.

일부 구체예들에서, 결장직장암 (CRC) 또는 진행성 선종 (AA) 발달 위험에 처한 개체는 유전적 증후군을 갖는다. 일부 구체예들에서, 상기 유전적 증후군은 가족성 선종성 용종증(FAP) 또는 유전성 비-용종증 직장결장암(린치(Lynch) 증후군)을 포함한다.

일부 구체예들에서, 결장직장암 (CRC) 또는 진행성 선종 (AA) 발달 위험에 처한 개체는 CRC 또는 AA의 위험을 증가시킬 수 있는 식품을 섭취한다. 일부 구체예들에서, 상기 개체는 붉은 고기나 가공육을 많이 섭취한다. 일부 구체예들에서, CRC 또는 AA 발달 위험에 처한 개체 는 CRC 또는 AA의 위험을 감소시킬 수 있는 식품을 섭취하지 않는다. 일부 구체예들에서, 상기 개체의 채소 및 섬유질의 섭취는 한정적이다.

일부 구체예들에서, 결장직장암 (CRC) 또는 진행성 선종 (AA) 발달 위험에 처한 개체는 흡연자 또는 담배류를 사용한다. 일부 구체예들에서, 상기 개체는 담배, 시가, 파이프 및 기타 담배-기반 제품을 피운다. 일부 구체예들에서, 상기 개체는 흡연자다. 일부 구체예들에서, 상기 개체는 담배-함유 제품을 사용한다.

일부 구체예들에서, 상기 개체는 본원에서 기재된 결장직장암 (CRC)의 하나 또는 그 이상의 임상 표시자에 대해 양성이다. 일부 구체예들에서, CRC의 하나 또는 그 이상의 임상 표시자는 배변 습관의 변화, 혈변, 설사, 변비, 지속적인 복통, 지속적인 복부경련, 원인불명의 체중감소를 포함한다. 일부 구체예들에서, 상기 개체는 적어도 1가지, 적어도 2가지, 적어도 3가지, 적어도 4가지, 적어도 5가지, 또는 적어도 6가지 CRC의 임상 표시자를 보유한다. 일부 구체예들에서, 상기 개체는 본원에서 기재된 CRC의 임상 표시자의 임의의 조합을 보유한다.

일부 실시예들에서, 상기 병태는 노화이다. 일부 실시예들에서, 본원에서 기술된 "환자"는 "개체"와 등가로 기재된다. 예를 들면, 본원의 일부 방법들에서, 개체에서 노화 또는 노화 상태를 모니터링하거나 또는 진단하기 위한 바이오마커들이 제시된다. 이들 실시예중 일부에서, 상기 개체는 반드시 치료가 필요한 의학적 상태를 가진 환자일 필요는 없다. 일부 실시예들에서, 상기 개체는 남성이다. 일부 실시예들에서, 상기 개체는 여성이다. 일부 실시예들에서, 상기 개체는 수컷 포유류다. 일부 실시예들에서, 상기 개체는 암컷 포유류다. 일부 실시예들에서, 상기 개체는 남성 인간이다. 일부 실시예들에서, 상기 개체는 여성 인간이다.

일부 실시예들에서, 상기 개체 나이는 1세다. 일부 실시예들에서, 상기 개체 나이는 2세다. 일부 실시예들에서, 상기 개체 나이는 3세다. 일부 실시예들에서, 상기 개체 나이는 4세다. 일부 실시예들에서, 상기 개체 나이는 5세다. 일부 실시예들에서, 상기 개체 나이는 6세다. 일부 실시예들에서, 상기 개체 나이는 7세다. 일부 실시예들에서, 상기 개체 나이는 8세다. 일부 실시예들에서, 상기 개체 나이는 9세다. 일부 실시예들에서, 상기 개체 나이는 10세다. 일부 실시예들에서, 상기 개체 나이는 11세다. 일부 실시예들에서, 상기 개체 나이는 12세다. 일부 실시예들에서, 상기 개체 나이는 13세다. 일부 실시예들에서, 상기 개체 나이는 14세다. 일부 실시예들에서, 상기 개체 나이는 15세다. 일부 실시예들에서, 상기 개체 나이는 16세다. 일부 실시예들에서, 상기 개체 나이는 17세다. 일부 실시예들에서, 상기 개체 나이는 18세다. 일부 실시예들에서, 상기 개체 나이는 19세다. 일부 실시예들에서, 상기 개체 나이는 20세다. 일부 실시예들에서, 상기 개체 나이는 21세다. 일부 실시예들에서, 상기 개체 나이는 22세다. 일부 실시예들에서, 상기 개체 나이는 23세다. 일부 실시예들에서, 상기 개체 나이는 24세다. 일부 실시예들에서, 상기 개체 나이는 25세다. 일부 실시예들에서, 상기 개체 나이는 26세다. 일부 실시예들에서, 상기 개체 나이는 27세다. 일부 실시예들에서, 상기 개체 나이는 28세다. 일부 실시예들에서, 상기 개체 나이는 29세다. 일부 실시예들에서, 상기 개체 나이는 30세다. 일부 실시예들에서, 상기 개체 나이는 31세다. 일부 실시예들에서, 상기 개체 나이는 32세다. 일부 실시예들에서, 상기 개체 나이는 33세다. 일부 실시예들에서, 상기 개체 나이는 34세다. 일부 실시예들에서, 상기 개체 나이는 35세다. 일부 실시예들에서, 상기 개체 나이는 36세다. 일부 실시예들에서, 상기 개체 나이는 37세다. 일부 실시예들에서, 상기 개체 나이는 38세다. 일부 실시예들에서, 상기 개체 나이는 39세다. 일부 실시예들에서, 상기 개체 나이는 40세다. 일부 실시예들에서, 상기 개체 나이는 41세다. 일부 실시예들에서, 상기 개체 나이는 42세다. 일부 실시예들에서, 상기 개체 나이는 43세다. 일부 실시예들에서, 상기 개체 나이는 44세다. 일부 실시예들에서, 상기 개체 나이는 45세다. 일부 실시예들에서, 상기 개체 나이는 46세다. 일부 실시예들에서, 상기 개체 나이는 47세다. 일부 실시예들에서, 상기 개체 나이는 48세다. 일부 실시예들에서, 상기 개체 나이는 49세다. 일부 실시예들에서, 상기 개체 나이는 50세다. 일부 실시예들에서, 상기 개체 나이는 51세다. 일부 실시예들에서, 상기 개체 나이는 52세다. 일부 실시예들에서, 상기 개체 나이는 53세다. 일부 실시예들에서, 상기 개체 나이는 54세다. 일부 실시예들에서, 상기 개체 나이는 55세다. 일부 실시예들에서, 상기 개체 나이는 56세다. 일부 실시예들에서, 상기 개체 나이는 57세다. 일부 실시예들에서, 상기 개체 나이는 58세다. 일부 실시예들에서, 상기 개체 나이는 59세다. 일부 실시예들에서, 상기 개체 나이는 60세다. 일부 실시예들에서, 상기 개체 나이는 61세다. 일부 실시예들에서, 상기 개체 나이는 62세다. 일부 실시예들에서, 상기 개체 나이는 63세다. 일부 실시예들에서, 상기 개체 나이는 64세다. 일부 실시예들에서, 상기 개체 나이는 65세다. 일부 실시예들에서, 상기 개체 나이는 66세다. 일부 실시예들에서, 상기 개체 나이는 67세다. 일부 실시예들에서, 상기 개체 나이는 68세다. 일부 실시예들에서, 상기 개체 나이는 69세다. 일부 실시예들에서, 상기 개체 나이는 70세다. 일부 실시예들에서, 상기 개체 나이는 71세다. 일부 실시예들에서, 상기 개체 나이는 72세다. 일부 실시예들에서, 상기 개체 나이는 73세다. 일부 실시예들에서, 상기 개체 나이는 74세다. 일부 실시예들에서, 상기 개체 나이는 75세다. 일부 실시예들에서, 상기 개체 나이는 76세다. 일부 실시예들에서, 상기 개체 나이는 77세다. 일부 실시예들에서, 상기 개체 나이는 78세다. 일부 실시예들에서, 상기 개체 나이는 79세다. 일부 실시예들에서, 상기 개체 나이는 80세다. 일부 실시예들에서, 상기 개체 나이는 81세다. 일부 실시예들에서, 상기 개체 나이는 82세다. 일부 실시예들에서, 상기 개체 나이는 83세다. 일부 실시예들에서, 상기 개체 나이는 84세다. 일부 실시예들에서, 상기 개체 나이는 85세다. 일부 실시예들에서, 상기 개체 나이는 86세다. 일부 실시예들에서, 상기 개체 나이는 87세다. 일부 실시예들에서, 상기 개체 나이는 88세다. 일부 실시예들에서, 상기 개체 나이는 89세다. 일부 실시예들에서, 상기 개체 나이는 90세다. 일부 실시예들에서, 상기 개체 나이는 91세다. 일부 실시예들에서, 상기 개체 나이는 92세다. 일부 실시예들에서, 상기 개체 나이는 93세다. 일부 실시예들에서, 상기 개체 나이는 94세다. 일부 실시예들에서, 상기 개체 나이는 95세다. 일부 실시예들에서, 상기 개체 나이는 96세다. 일부 실시예들에서, 상기 개체 나이는 97세다. 일부 실시예들에서, 상기 개체 나이는 98세다. 일부 실시예들에서, 상기 개체 나이는 99세다. 일부 실시예들에서, 상기 개체 나이는 100세다. 일부 실시예들에서, 상기 개체 나이는 100세 이상이다.

V. 기계 학습

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법들에는 질량 분광법 (MS) 및/또는 약체 크로마토그래피 (LC)를 사용하여 표 10의 하나 또는 그 이상의 펩티드 구조를 포함하는 하나 또는 그 이상의 글리코펩티드들을 정량화시키는 단계가 내포된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법들에는 서열 식별 번호: 1-38 중 임의의 하나의 아미노산 서열로부터 선택된 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드들을 MS 및/또는 LC를 이용하여 정량화시키는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들 중 임의의 하나의 아미노산 서열로부터 선택된 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드들을 MS 및/또는 LC를 이용하여 정량화시키는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들 중 임의의 하나의 아미노산 서열로부터 선택된 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드들을 MS 및/또는 LC를 이용하여 정량화시키는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들 중 임의의 하나의 아미노산 서열로부터 선택된 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드들을 MS 및/또는 LC를 이용하여 정량화시키는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법들에는 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 질량 분광법 및/또는 약체 크로마토그래피를 사용하여 정량화시키는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 질량 분광법 및/또는 약체 크로마토그래피를 사용하여 정량화시키는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 질량 분광법 및/또는 약체 크로마토그래피를 사용하여 정량화시키는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 질량 분광법 및/또는 약체 크로마토그래피를 사용하여 정량화시키는 단계가 내포된다.

일부 실시예들에서, 상기 정량화 결과는 훈련된 모델의 입력으로 사용된다. 일부 실시예들에서, 상기 정량화 결과는 테스트 샘플에서 정량화된 각 글리칸 또는 글리코펩타이드의 절대량, 상대량 및/또는 유형을 기반으로 진단 알고리즘을 사용하여 분류 또는 범주화되며, 이때 진단 알고리즘은 알려진 질환이나 병태를 가진 개체 모집단으로부터 얻은 각 마커에 해당하는 값에 대해 훈련된다. 일부 실시예들에서, 질환 또는 병태는 결장직장암 또는 진행성 선종이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법들에는 질량 분광법 (MS) 및/또는 약체 크로마토그래피 (LC)를 사용하여 표 10의 하나 또는 그 이상의 펩티드 구조를 포함하는 하나 또는 그 이상의 글리코펩티드들을 정량화시키는 단계가 내포된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법들에는 서열 식별 번호: 1-38 중 임의의 하나의 아미노산 서열로부터 선택된 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드들을 MS 및/또는 LC를 이용하여 정량화시키는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 기계 학습 알고리즘을 훈련시키는 방법이 본원에서 제시되며, 이 방법은 다음을 포함한다: 서열 식별 번호: 1-38 중 임의의 하나의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 포함하는 샘플을 나타내는 MRM 전이 신호의 제1 데이터 세트를 제공하는 단계; 대조군 샘플을 나타내는 MRM 전이 신호를 나타내는 제2 데이터 세트를 제공하는 단계; 그리고 기계 학습 알고리즘을 이용하여 제1 데이터 세트와 제2 데이터 세트를 비교하는 단계. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들 중 임의의 하나의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 포함하는 샘플을 나타내는 MRM 전이 신호의 제1 데이터 세트를 제공하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 그리고 이의 조합들 중 임의의 하나의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 포함하는 샘플을 나타내는 MRM 전이 신호의 제1 데이터 세트를 제공하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 그리고 이의 조합들 중 임의의 하나의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 포함하는 샘플을 나타내는 MRM 전이 신호의 제1 데이터 세트를 제공하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 기계 학습 알고리즘을 훈련시키는 방법이 본원에서 제시되며, 이 방법은 다음을 포함한다: 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 포함하는 샘플을 나타내는 MRM 전이 신호의 제1 데이터 세트를 제공하는 단계; 대조군 샘플을 나타내는 MRM 전이 신호의 제2 데이터 세트를 제공하는 단계; 그리고 기계 학습 알고리즘을 이용하여 제1 데이터 세트와 제2 데이터 세트를 비교하는 단계. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 포함하는 샘플을 나타내는 MRM 전이 신호의 제1 데이터 세프를 제공하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 포함하는 샘플을 나타내는 MRM 전이 신호의 제1 데이터 세프를 제공하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 포함하는 샘플을 나타내는 MRM 전이 신호의 제1 데이터 세프를 제공하는 단계가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 환자로부터 얻은 샘플이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 환자로부터 얻은 샘플이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들 중 임의의 하나의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 환자로부터 얻은 샘플이다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들 중 임의의 하나의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 환자로부터 얻은 샘플이다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들 중 임의의 하나의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 환자로부터 얻은 샘플이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 환자로부터 얻은 샘플이다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 환자로부터 얻은 샘플이다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 환자로부터 얻은 샘플이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들로 필수적으로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 환자로부터 얻은 샘플이다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 환자로부터 얻은 샘플이다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 환자로부터 얻은 샘플이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 대조군 샘플의 사용이 내포되며, 이때 상기 대조군 샘플은 결장직장암 또는 진행성 선종을 가지고 있지 않은 환자의 샘플이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 한 명 또는 그 이상의 환자들로부터 모집된 샘플이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들 중 임의의 하나의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 한 명 또는 그 이상의 환자들로부터 모집된 샘플이다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들 중 임의의 하나의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 한 명 또는 그 이상의 환자들로부터 모집된 샘플이다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들 중 임의의 하나의 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 한 명 또는 그 이상의 환자들로부터 모집된 샘플이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 그리고 이의 조합들로 필수적으로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 한 명 또는 그 이상의 환자들로부터 모집된 샘플이다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 한 명 또는 그 이상의 환자들로부터 모집된 샘플이다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 포함하는 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있는 한 명 또는 그 이상의 환자들로부터 모집된 샘플이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원의 방법에는 대조군 샘플의 사용이 내포되며, 결장직장암 또는 진행성 선종을 가지고 있지 않은 한 명 또는 그 이상의 환자로부터 모집된 샘플이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법들에는 질환 또는 병태을 가지고 있는 환자들과 질환 또는 병태를 가지고 있지 않는 환자들로부터 질량 분광법 데이터 (가령, MRM-MS 전이 신호)를 이용하여 훈련된 기계 학습 모델의 생성이 내포된다. 일부 실시예들에서, 질환 또는 병태는 결장직장암 또는 진행성 선종이다. 일부 실시예들에서, 상기 방법들에는 알려진 표준 또는 기타 샘플과의 교차-검증을 통해 기계 학습 모델을 최적화하는 단계가 내포된다. 일부 실시예들에서, 상기 방법들에는 개별 민감도와 특이성을 지닌 글리칸 및 글리코펩타이드 패널을 형성하기 위해 질량 분광법 데이터를 사용하여 성능을 검증하는 단계가 내포된다. 특정 실시예에서, 상기 방법들에는 진단과 관련된 신뢰 퍼센트를 결정하는 단계가 내포된다. 일부 실시예들에서, 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 1~10개의 글리코펩티드들 서열이 결장직장암 또는 진행성 선종 환자를 특정 신뢰 페선트를 가지고 진단하는데 유용할 수 있다. 일부 실시예들에서, 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 10~50개의 글리코펩티드들 서열이 결장직장암 또는 진행성 선종 환자를 더 높은 신뢰 퍼센트를 가지고 진단하는데 유용할 수 있다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법들에는 생물학적 샘플 상에서 MRM-MS 및/또는 LC-MS를 수행하는 단계가 내포된다. 일부 실시예들에서, 상기 방법들에는 컴퓨팅 장치에 의해 다수의 질량 스펙트럼을 나타내는 이론적 질량 스펙트럼 데이터를 구축하는 것이 내포되며, 이때 다수의 질량 스펙트럼 각각은 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드에 대응한다. 일부 실시예들에서, 상기 방법들에는 다수의 글리코펩티드 중 상응하는 글리코펩티드와 연합된 다수의 이론적 표적 질량 스펙트럼 각각에 대한 다수의 질량 스펙트럼 각각의 유사성을 나타내는 비교 데이터를 생성하기 위해, 컴퓨팅 장치에 의해 질량 스펙트럼 데이터를 이론적인 질량 스펙트럼 데이터와의 비교가 내포된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법들에는 질환 또는 병태을 가지고 있는 환자들과 질환 또는 병태를 가지고 있지 않는 환자들로부터 질량 분광법 데이터 (가령, MRM-MS 전이 신호)를 이용하여 훈련된 기계 학습 모델의 생성이 내포된다. 일부 실시예들에서, 질환 또는 병태는 결장직장암 또는 진행성 선종이다. 일부 실시예들에서, 상기 방법들에는 알려진 표준 또는 기타 샘플과의 교차-검증을 통해 기계 학습 모델을 최적화하는 단계가 내포된다. 일부 실시예들에서, 상기 방법들에는 개별 민감도와 특이성을 지닌 글리칸 및 글리코펩타이드 패널을 형성하기 위해 질량 분광법 데이터를 사용하여 성능을 검증하는 단계가 내포된다. 특정 실시예에서, 상기 방법들에는 진단과 관련된 신뢰 퍼센트를 결정하는 단계가 내포된다.

일부 실시예들에서, 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 중 임의의 하나의 아미노산 서열을 포함하는 적어도 하나의 글리코펩티드들은 결장직장암 또는 진행성 선종 환자를 특정 신뢰 퍼센트로 진단하는데 유용할 것이다. 일부 실시예들에서, 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 중 임의의 하나의 아미노산 서열을 포함하는 적어도 하나의 글리코펩티드들은 결장직장암 또는 진행성 선종 환자를 특정 신뢰 퍼센트로 진단하는데 유용할 것이다. 일부 실시예들에서, 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 중 임의의 하나의 아미노산 서열을 포함하는 적어도 하나의 글리코펩티드들은 결장직장암 또는 진행성 선종 환자를 특정 신뢰 퍼센트로 진단하는데 유용할 것이다.

일부 실시예들에서, 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 적어도 하나의 글리코펩티드들은 결장직장암 또는 진행성 선종 환자를 특정 신뢰 퍼센트로 진단하는데 유용할 것이다. 일부 실시예들에서, 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 적어도 하나의 글리코펩티드들은 결장직장암 또는 진행성 선종 환자를 특정 신뢰 퍼센트로 진단하는데 유용할 것이다. 일부 실시예들에서, 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 적어도 하나의 글리코펩티드들은 결장직장암 또는 진행성 선종 환자를 특정 신뢰 퍼센트로 진단하는데 유용할 것이다.

일부 실시예들에서, 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 중 임의의 하나의 아미노산 서열을 포함하는 적어도 하나의 글리코펩티드들은 결장직장암 또는 진행성 선종 환자를 더 높은 신뢰 퍼센트로 진단하는데 유용할 것이다. 일부 실시예들에서, 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 중 임의의 하나의 아미노산 서열을 포함하는 적어도 하나의 글리코펩티드들은 결장직장암 또는 진행성 선종 환자를 더 높은 신뢰 퍼센트로 진단하는데 유용할 것이다. 일부 실시예들에서, 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 중 임의의 하나의 아미노산 서열을 포함하는 적어도 하나의 글리코펩티드들은 결장직장암 또는 진행성 선종 환자를 더 높은 신뢰 퍼센트로 진단하는데 유용할 것이다.

일부 실시예들에서, 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 적어도 하나의 글리코펩티드들은 결장직장암 또는 진행성 선종 환자를 더 높은 신뢰 퍼센트로 진단하는데 유용할 것이다. 일부 실시예들에서, 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 적어도 하나의 글리코펩티드들은 결장직장암 또는 진행성 선종 환자를 더 높은 신뢰 퍼센트로 진단하는데 유용할 것이다. 일부 실시예들에서, 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 적어도 하나의 글리코펩티드들은 결장직장암 또는 진행성 선종 환자를 더 높은 신뢰도로 진단하는데 유용할 것이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법들에는 생물학적 샘플 상에서 MRM-MS 및/또는 LC-MS를 수행하는 단계가 내포된다. 일부 실시예들에서, 상기 방법들에는 컴퓨팅 장치에 의해 다수의 질량 스펙트럼을 나타내는 이론적 질량 스펙트럼 데이터를 구축하는 것이 내포되며, 이때 다수의 질량 스펙트럼 각각은 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드에 대응한다. 일부 실시예들에서, 상기 방법들에는 컴퓨팅 장치에 의해 다수의 질량 스펙트럼을 나타내는 이론적 질량 스펙트럼 데이터를 구축하는 것이 내포되며, 이때 다수의 질량 스펙트럼 각각은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드에 대응한다. 일부 실시예들에서, 상기 방법들에는 컴퓨팅 장치에 의해 다수의 질량 스펙트럼을 나타내는 이론적 질량 스펙트럼 데이터를 구축하는 것이 내포되며, 이때 다수의 질량 스펙트럼 각각은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드에 대응한다.

일부 실시예들에서, 상기 방법들에는 다수의 글리코펩티드 중 상응하는 글리코펩티드와 연합된 다수의 이론적 표적 질량 스펙트럼 각각에 대한 다수의 질량 스펙트럼 각각의 유사성을 나타내는 비교 데이터를 생성하기 위해, 컴퓨팅 장치에 의해 질량 스펙트럼 데이터를 이론적인 질량 스펙트럼 데이터와의 비교가 내포된다.

일부 실시예들에서, 기계 학습 알고리즘은 컴퓨팅 장치에 의해 그리고 MRM-MS 데이터에 기초하여 복수의 질량 스펙트럼에서 복수의 특징 이온의 분포를 결정하는 데 사용되며; 그리고 컴퓨팅 장치에 의해 분포에 기초하여 다수의 특징적 이온 중 하나 또는 그 이상이 글리코펩티드 이온인지 여부를 결정하는 데 사용된다.

일부 실시예들에서, 본원의 방법들에는 진단 알고리즘을 훈련하는 단계가 내포된다. 본원에서, 진단 알고리즘을 훈련시키는 것은 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들에 대한 값에 기초하여 진단 알고리즘의 지도 학습을 의미할 수 있다. 진단 알고리즘을 훈련시키는 것은 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들에 대한 값에 기초한 통계 모델에서의 변수 선택을 의미할 수 있다. 진단 알고리즘을 훈련시키는 것은 예를 들면, 각 범주에 대한 특징적 공간에서 가중치 벡터를 결정하거나 또는 함수 또는 함수 매개변수를 결정하는 것이 내포될 수 있다.

일부 실시예들에서, 본원의 방법들에는 진단 알고리즘을 훈련하는 단계가 내포된다. 본원에서, 진단 알고리즘을 훈련시키는 것은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들에 대한 값에 기초하여 진단 알고리즘의 지도 학습을 의미할 수 있다. 본원에서, 진단 알고리즘을 훈련시키는 것은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들에 대한 값에 기초하여 진단 알고리즘의 지도 학습을 의미할 수 있다. 본원에서, 진단 알고리즘을 훈련시키는 것은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들에 대한 값에 기초하여 진단 알고리즘의 지도 학습을 의미할 수 있다.

진단 알고리즘을 훈련시키는 것은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들에 대한 값에 기초한 통계 모델에서의 변수 선택을 의미할 수 있다. 진단 알고리즘을 훈련시키는 것은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들에 대한 값에 기초한 통계 모델에서의 변수 선택을 의미할 수 있다. 진단 알고리즘을 훈련시키는 것은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들에 대한 값에 기초한 통계 모델에서의 변수 선택을 의미할 수 있다.

진단 알고리즘을 훈련시키는 것은 예를 들면, 각 범주에 대한 특징적 공간에서 가중치 벡터를 결정하거나 또는 함수 또는 함수 매개변수를 결정하는 것이 내포될 수 있다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 기계 학습 알고리즘은 딥러닝 알고리즘, 신경망 알고리즘, 인공 신경망 알고리즘, 지도 머신 러닝 알고리즘, 선형 판별 분석 알고리즘, 2차 판별 분석 알고리즘, 서포트 벡터 머신 알고리즘, 선형 기저 함수 커널 서포트 벡터 알고리즘, 방사형 기저함수 커널 지원 벡터 알고리즘, 랜덤 포레스트 알고리즘, 유전자 알고리즘, 최근접 이웃 알고리즘, k-최근접 이웃, 나이브 베이즈 분류 알고리즘, 로지스틱 회귀 알고리즘, 정규화된 회귀 알고리즘, 또는 이의 조합으로 구성된 군에서 선택된다. 특정 실시예에서, 상기 기계 학습 알고리즘은 라쏘(lasso) 회귀다.

특정 실시예에서, 상기 기계 학습 알고리즘은 LASSO, Ridge Regression, Random Forests, K-nearest Neighbors (KNN), Deep Neural Networks (DNN), 및 Principal Components Analysis (PCA)이다. 특정 실시예에서, DNN은 질량 분석 데이터를 분석- 가능한 형식으로 처리하는 데 사용된다. 일부 실시예들에서, DNN은 질량 스펙트럼으로부터 피크를 선택하는 데 사용된다. 일부 실시예들에서, PCA는 특징 탐지에 유용하다. 일부 실시예들에서, 상기 기계 학습은 복합 판별 분석이다.

일부 실시예들에서, LASSO는 특징 선별을 제공하는 데 사용된다.

일부 실시예들에서, 기계 학습 알고리즘은 단백질 풍도를 대표하는 각 단백질의 펩티드의 정량화에 사용된다. 일부 실시예들에서, 이 정량화에는 글리코실화가 측정되지 않은 단백질의 정량화가 내포된다.

일부 실시예들에서, 글리코펩티드 서열은 Byonic 소프트웨어를 사용한 질량 분광계 및 데이터베이스 검색의 단편화를 통해 식별된다.

일부 실시예들에서, 본원의 방법들에는 단백질 기능 또는 글리칸 모티프와 같은 알려진 생물학적 양을 나타내는 MRMS-MS 데이터의 특징을 탐지하는 자율 학습(unsupervised learning)이 내포된다. 특정 실시예에서, 이러한 특징들은 기계별로 분류하기 위한 입력으로 사용된다. 일부 실시예들에서, 상기 분류는 LASSO, Ridge Regression 또는 Random Forest 특성을 사용하여 수행된다.

일부 실시예들에서, 본원의 방법들은 알고리즘에서 값을 처리하기 전에 입력 데이터(가령, MRM 전이 피크)를 값(가령, 0-100에 기초한 스케일)으로 매핑하는 단계가 내포된다. 예를 들면, MRM 전이가 식별되고 피크가 특성화된 후, 본원의 방법에는 주어진 환자에 대한 m/z 및 피크 주변의 체류 시간 창에서 MS 스캔을 평가하는 단계가 내포된다. 일부 실시예들에서, 결과 크로마토그램은 피크 시작 및 중지 지점을 결정하고, 해당 지점으로 둘러싸인 영역과 강도(높이)를 계산하는 기계 학습 알고리즘에 의해 통합된다. 결과적으로 통합된 가치는 풍도(abundance)이며, 이는 기계 학습 및 통계 분석 교육 및 데이터 세트에 적용된다.

일부 실시예들에서, 한 가지 경우에서는 기계 학습 출력이 다른 경우에서는 기계 학습 입력으로 사용된다. 예를 들면, 분류 공정에 사용되는 PCA 외에도, DNN 데이터 처리는 PCA 및 기타 분석에 제공된다. 이로 인해 최소한 세 가지 수준의 알고리즘 처리가 이루어진다. 본 개시내용의 범위 내에서 다른 계층적 구조가 고려된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 방법들에는 샘플에서 정량화된 각 글리칸 또는 글리코펩티드의 양을 진단 알고리즘의 각 글리칸 또는 글리코펩티드에 대한 해당 참조 값과 비교하는 단계가 내포된다. 일부 실시예들에서, 상기 방법에는 샘플에서 정량화된 글리칸 또는 글리코펩티드의 양을 진단 알고리즘을 사용하여 동일한 글리칸 또는 글리코펩티드에 대한 기준 값과 비교하는 비교 프로세스가 내포된다. 상기 비교 프로세스는 진단 알고리즘에 의한 분류의 일부일 수 있다. 상기 비교 프로세스는 추상적 수준, 가령, n-차원 특징 공간 또는 더 높은 차원 공간에서 발생할 수 있다.

일부 실시예들에서, 본원의 방법들에는 진단 알고리즘을 사용하여 샘플에서 정량화된 각 글리칸 또는 글리코펩티드의 양을 기준으로 환자의 샘플을 분류하는 단계가 내포된다. 일부 실시예들에서, 상기 방법들에는 테스트 샘플에서 정량화된 글리칸 또는 글리코펩타이드의 양을 사용하여 진단 알고리즘을 통해 건강 범주를 결정하는 통계 또는 기계 학습 분류 프로세스를 사용하는 단계가 내포된다. 일부 실시예들에서, 상기 진단 알고리즘은 통계학적 또는 기계 학습 분류 알고리즘이다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 진단 알고리즘에 의한 분류에는 가능한 각 카테고리에 속하는 글리칸 또는 글리코펩타이드 값 패널의 가능성 점수 매기기, 최고-점수 범주 결정이 내포될 수 있다. 진단 알고리즘에 의한 분류에는 거리 함수를 사용하여 마커 값 패널을 이전 관찰과 비교하는 것이 내포될 수 있다. 분류에 적합한 진단 알고리즘의 예로는 랜덤 포레스트, 지원 벡터 머신, 로지스틱 회귀 (예를 들면, 다중클래스 또는 다항 로지스틱 회귀 및/또는 희소 로지스틱 회귀에 적합한 알고리즘) 또는 정규화된 회귀가 내포된다. 당업자에게 공지된 바와 같이, 분류에 적합한 다양한 다른 진단 알고리즘이 사용될 수 있다.

일부 실시예들에서, 본원의 방법들에는 질환 또는 병태 (가령, 결장직장암 또는 진행성 선종)를 갖는 개체들의 모집단으로부터 획득된 각 글리칸 또는 글리코펩티드에 대한 값을 기초로, 진단 알고리즘의 지도 학습이 내포된다. 일부 실시예들에서, 상기 방법들에는 결장직장암 또는 진행성 선종을 갖는 개체들의 모집단으로부터 획득된 각 글리칸 또는 글리코펩티드에 대한 값을 기초로 통계학적 모델에서 변수 선택이 내포된다. 진단 알고리즘을 훈련시키는 것은 예를 들면, 각 범주에 대한 특징적 공간에서 가중치 벡터를 결정하거나 또는 함수 또는 함수 매개변수를 결정하는 것이 내포될 수 있다.

한 구체예에서, 상기 참조 값은 한 개체로부터 추출된 샘플 내 글리칸 또는 글리코펩타이드의 양이다. 대안으로, 상기 참조 값은 다수 개체들로부터 획득한 데이터를 모으고, 글리칸 또는 글리코펩타이드의 평균(예를 들어, 평균 또는 중앙값) 양을 계산하여 파생될 수 있다. 따라서, 상기 참조 값은 다수 개체들에서 글리칸 또는 글리코펩티드의 평균 양을 반영할 수 있다. 전술한 양은 본원에서 기술된 것과 동일한 방식으로 절대적 용어 또는 상대적인 용어로 표현될 수 있다.

일부 실시예들에서, 상기 참조 값은 테스트 중인 샘플과 동일한 샘플에서 파생될 수 있고, 따라서 둘 사이의 적절한 비교가 가능하다. 예를 들면, 만약 샘플이 소변에서 채취된 경우, 참조 값 또한 소변으로부터 파생된다. 일부 실시예들에서, 만약 샘플이 혈액 샘플 (가령, 혈장 또는 혈청 샘플)인 경우, 그러면 상기 참조 값은 혈액 샘플 (가령, 적절한 경우, 혈장 샘플 또는 혈청 샘플)일 수도 있다. 샘플 값과 참조 값을 비교할 때, 양을 표현하는 방식은 샘플 값과 참조 값 사이에 일치된다. 따라서, 절대량은 절대량과 비교될 수 있고, 상대적 양은 상대적 양과 비교될 수 있다. 마찬가지로, 진단 알고리즘으로 분류를 위해 값을 표현하는 방식은 진단 알고리즘을 훈련하기 위해 값을 표현하는 방식과 일치한다.

글리칸 또는 글리코펩티드의 양이 결정되면, 상기 방법은 각각의 글리칸 또는 글리코펩티드의 양을 그의 상응하는 참조 값과 비교하는 것을 포함할 수 있다. 글리칸 또는 글리코펩타이드 중 하나, 일부 또는 전부의 누적량이 결정되는 경우, 상기 방법은 누적량을 상응하는 참조 값과 비교하는 단계를 포함할 수 있다. 글리칸 또는 글리코펩타이드의 양을 수식으로 조합하여 인덱스 값을 형성할 때, 인덱스 값은 동일한 방식으로 도출된 해당 참조 인덱스 값과 비교할 수 있다.

상기 참조 값은 본원에서 기술된 방법 내에서(즉, 단계를 구성함) 또는 이 범위 밖에서(즉, 단계를 구성하지 않음) 획득될 수 있다. 일부 실시예들에서, 상기 방법들에는 마커의 양에 대한 참조 값을 설정하는 단계가 내포된다. 다른 실시예들에서, 참조 값은 본원에 설명된 방법의 외부에서 획득되고, 본 발명의 비교 단계 동안 액세스된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 진단 알고리즘의 훈련은 여기에 설명된 방법 내에서(즉, 단계를 구성함) 또는 이 방법의 외부에서(즉, 단계를 구성하지 않음) 획득될 수 있다. 일부 실시예들에서, 상기 방법들에는 진단 알고리즘의 훈련 단계가 내포된다. 일부 실시예들에서, 상기 진단 알고리즘은 본원의 방법에 대해 외부적으로 훈련되고 본 발명의 분류 단계 동안 접근된다. 상기 참조 값은 건강한 개체(들)의 모집단으로부터 획득된 샘플 내 글리칸 또는 글리코펩티드의 양을 정량화하여 결정될 수 있다. 상기 진단 알고리즘은 건강한 개체(들)의 모집단으로부터 획득된 샘플 내 내 글리칸 또는 글리코펩티드의 양을 정량화함으로써 훈련될 수 있다. 본원에 이용된 바와 같이, 용어 "건강한 개체"라는 용어는 건강한 상태에 있는 개체 또는 개체들의 모집단을 의미하며, 가령, 질환의 어떠한 증상도 나타내지 않았고, 질환으로 진단되지 않았으며/또는 질환이 발생할 가능성이 없는 환자다. 바람직하게는, 전술한 건강한 개체(들)은 이 질환에 영향을 미치는 약물을 복용하지 않고, 임의의 다른 질환으로 진단받은 적이 없다. 한 명 또는 그 이상의 건강한 개체은 테스트 개체와 비교하여 유사한 성별, 연령 및 체질량 지수(BMI)를 가질 수 있다. 상기 참조 값은 이 질환을 앓고 있는 개체(들)의 모집단으로부터 획득된 샘플 내 글리칸 또는 글리코펩티드의 양을 정량화하여 결정될 수 있다. 상기 진단 알고리즘은 이 질환을 앓고 있는 개체(들)의 모집단으로부터 획득된 샘플 내 마커의 양을 정량화함으로써 훈련될 수 있다. 더욱 바람직하게는, 이러한 개체(들)은 테스트 개체와 비교하여 유사한 성별, 연령 및 체질량 지수(BMI)를 가질 수 있다. 상기 참조 값은 결장직장암 또는 진행성 선종을 앓고 있는 개체들의 모집단으로부터 획득될 수 있다. 상기 진단 알고리즘은 결장직장암 또는 진행성 선종을 앓고 있는 개체들의 모집단으로부터 획득된 샘플 내 훈련된 글리칸 또는 글리코펩티드의 양을 정량화함으로써 훈련될 수 있다. 결장직장암 또는 진행성 선종의 특징적 글리칸 또는 글리코펩티드 프로파일이 일단 결정되면, 개체로부터 획득된 생물학적 샘플의 마커 프로파일은 해당 테스트 대상체가 결장직장암 또는 진행성 선종을 보유하는 지를 결정하기 위해 이 참조 프로파일과 비교될 수 있다. 상기 진단 알고리즘은 결장직장암 또는 진행성 선종을 분류하도록 일단 훈련되면, 개체로부터 획득된 생물학적 샘플의 마커 프로파일은 해당 테스트 대상체가 결장직장암 또는 진행성 선종의 특정 단계에 또한 있는 지를 결정하기 위해 상기 훈련된 진단 알고리즘에 의해 분류될 수 있다.

VI. 조성물 및 키트

본원에서 표 10의 하나 또는 그 이상의 펩티드 구조를 포함하는 조성물이 본원에서 제공된다. 표 10의 하나 또는 그 이상의 글리코펩티드들을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10의 펩티드 구조 중 2 개 또는 그 이상을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10의 펩티드 구조 중 3 개 또는 그 이상을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10의 펩티드 구조 중 4 개 또는 그 이상을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10의 펩티드 구조 중 5 개 또는 그 이상을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10의 펩티드 구조 중 10 개 또는 그 이상을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10의 펩티드 구조 중 15 개 또는 그 이상을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10의 펩티드 구조 중 20 개 또는 그 이상을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10의 펩티드 구조 중 25 개 또는 그 이상을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10의 펩티드 구조 중 30 개 또는 그 이상을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10의 펩티드 구조 중 35 개 또는 그 이상을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 상기 조성물은 생물학적 샘플의 조성물이다. 일부 구체예들에서, 상기 조성물은 하나 또는 그 이상의 정제된 펩티드 구조를 포함한다. 일부 구체예들에서, 상기 조성물은 하나 또는 그 이상의 정제된 글리코펩티드들을 포함한다. 일부 구체예들에서, 상기 조성물은 효소적으로 절단된 펩티드 및/또는 글리코펩티드 단편들, 이를 테면 표 10에 있는 것들을 포함한다. 일부 구체예들에서, 상기 조성물은 효소적으로 절단된 글리코펩티드 단편들, 이를 테면 표 10에 있는 것들을 포함한다. 일부 구체예들에서, 상기 조성물은 표 10에 제시된 연합된 글리칸과 함께, 서열 식별 번호: 1-38에서 제시된 서열을 포함하는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 또는 적어도 35개의 펩티드들 및/또는 글리코펩티드를 포함한다.

일부 구체예들에서, 표 10에 제시된 연합된 글리칸과 함께, 서열 식별 번호: 1-38에서 제시된 서열을 포함하는 적어도 하나의 펩티드 및/또는 글리코펩티드를 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10에 제시된 연합된 글리칸과 함께, 서열 식별 번호: 1-38에서 제시된 서열을 포함하는 적어도 2개 펩티드들 및/또는 글리코펩티드들을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10에 제시된 연합된 글리칸과 함께, 서열 식별 번호: 1-38에서 제시된 서열을 포함하는 적어도 3개 펩티드들 및/또는 글리코펩티드들을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10에 제시된 연합된 글리칸과 함께, 서열 식별 번호: 1-38에서 제시된 서열을 포함하는 적어도 4개 펩티드들 및/또는 글리코펩티드들을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10에 제시된 연합된 글리칸과 함께, 서열 식별 번호: 1-38에서 제시된 서열을 포함하는 적어도 5개 펩티드들 및/또는 글리코펩티드들을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10에 제시된 연합된 글리칸과 함께, 서열 식별 번호: 1-38에서 제시된 서열을 포함하는 적어도 10개 펩티드들 및/또는 글리코펩티드들을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10에 제시된 연합된 글리칸과 함께, 서열 식별 번호: 1-38에서 제시된 서열을 포함하는 적어도 15개 펩티드들 및/또는 글리코펩티드들을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10에 제시된 연합된 글리칸과 함께, 서열 식별 번호: 1-38에서 제시된 서열을 포함하는 적어도 20개 펩티드들 및/또는 글리코펩티드들을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10에 제시된 연합된 글리칸과 함께, 서열 식별 번호: 1-38에서 제시된 서열을 포함하는 적어도 25개 펩티드들 및/또는 글리코펩티드들을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10에 제시된 연합된 글리칸과 함께, 서열 식별 번호: 1-38에서 제시된 서열을 포함하는 적어도 30개 펩티드들 및/또는 글리코펩티드들을 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 표 10에 제시된 연합된 글리칸과 함께, 서열 식별 번호: 1-38에서 제시된 서열을 포함하는 적어도 35개 펩티드들 및/또는 글리코펩티드들을 포함하는 조성물이 본원에서 제공된다.

일부 구체예들에서, 표 10에서 제시된 펩티드들 및/또는 글리코펩티드들이 본원에서 제공된다. 일부 구체예들에서, 표 10에서 제시된 글리코펩티드들이 본원에서 제공된다. 일부 구체예들에서, 표 10에 제시된 연합된 글리칸과 함께, 서열 식별 번호: 1-38에서 제시된 서열을 포함하는 펩티드들 및/또는 글리코펩티드들이 본원에서 제공된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 하나 또는 그 이상의 글리코펩티드 표준(들), 완충제, 그리고 서열 식별 번호: 1-38에서 제시된 서열을 포함하는 하나 또는 그 이상의 펩티드들을 포함하는 키트가 또한 본원에서 제공된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원에서 개체에서 암을 진단 또는 모니터링하기 위한 키트가 제시되며, 이때 전술한 개체의 샘플의 글리칸 또는 글리코펩티드 프로파일을 결정하고, 이 측정된 프로파일은 정상 환자의 프로파일 또는 암 가족력이 있는 환자의 프로파일과 비교된다. 일부 실시예들에서, 상기 키트는 하나 또는 그 이상의 글리코펩티드 표준(들), 완충제, 그리고 서열 식별 번호: 1-38에서 제시된 서열을 포함하는 하나 또는 그 이상의 펩티드들을 포함한다. 일부 실시예들에서, 상기 키트는 하나 또는 그 이상의 글리코펩티드 표준(들), 완충제, 그리고 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들에서 제시된 서열을 포함하는 하나 또는 그 이상의 펩티드들을 포함한다. 일부 실시예들에서, 상기 키트는 하나 또는 그 이상의 글리코펩티드 표준(들), 완충제, 그리고 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들에서 제시된 서열을 포함하는 하나 또는 그 이상의 펩티드들을 포함한다. 일부 실시예들에서, 상기 키트는 하나 또는 그 이상의 글리코펩티드 표준(들), 완충제, 그리고 서서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들에서 제시된 서열을 포함하는 하나 또는 그 이상의 펩티드들을 포함한다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 글리코펩티드 표준, 완충제, 그리고 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함하는 키트가 본원에서 제시된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 글리코펩티드 표준, 완충제, 그리고 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함하는 키트가 본원에서 제시된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원에서 개체에서 암을 진단 또는 모니터링하기 위한 키트가 제시되며, 이때 전술한 개체의 샘플의 글리칸 또는 글리코펩티드 프로파일을 결정하고, 이 측정된 프로파일은 정상 환자의 프로파일 또는 암 가족력이 있는 환자의 프로파일과 비교된다 일부 실시예들에서, 상기 키트는 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함한다. 일부 실시예들에서, 상기 키트는 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함한다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 글리코펩티드 표준, 완충제, 그리고 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함하는 키트가 본원에서 제시된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 글리코펩티드 표준, 완충제, 그리고 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함하는 키트가 본원에서 제시된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 글리코펩티드 표준, 완충제, 그리고 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함하는 키트가 본원에서 제시된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 글리코펩티드 표준, 완충제, 그리고 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함하는 키트가 본원에서 제시된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 글리코펩티드 표준, 완충제, 그리고 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함하는 키트가 본원에서 제시된다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 글리코펩티드 표준, 완충제, 그리고 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함하는 키트가 본원에서 제시된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원에서 개체에서 암을 진단 또는 모니터링하기 위한 키트가 제시되며, 이때 전술한 개체의 샘플의 글리칸 또는 글리코펩티드 프로파일을 결정하고, 이 측정된 프로파일은 정상 환자의 프로파일 또는 암 가족력이 있는 환자의 프로파일과 비교된다 일부 실시예들에서, 상기 키트는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함한다. 일부 실시예들에서, 상기 키트는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함한다. 일부 실시예들에서, 상기 키트는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함한다.

일부 실시예들에서, 상기 키트는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함한다. 일부 실시예들에서, 상기 키트는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함한다. 일부 실시예들에서, 상기 키트는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함한다.

일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 5의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 8의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 9의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 10의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 11의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 13의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 14의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 16의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 17의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 18의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 19의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 20의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 21의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 22의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 26의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 27의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 28의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 30의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 31의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 34의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 35의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 36의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 37의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 38의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 5의 필수적 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 8의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 9의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 10의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 11의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 13의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 14의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 16의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 17의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 18의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 19의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 20의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 21의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 22의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 26의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 27의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 28의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 30의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 31의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 34의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 35의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 36의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 37의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 38의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 5의 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 8의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 9의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 10의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 11의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 13의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 14의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 16의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 17의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 18의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 19의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 20의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 21의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 22의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 26의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 27의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 28의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 30의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 31의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 34의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 35의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 36의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 37의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 키트는 상기 샘플 내 서열 식별 번호: 38의 아미노산 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원에서 글리코펩티드로부터 유래된 산화, 질화 및/또는 당화된 유리 부가물의 정량화를 위한 시약을 포함하는 키트가 제시된다.

VII. 임상적 검정

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 바이오마커, 방법 및/또는 키트는 환자 진단을 위한 임상 환경에서 사용될 수 있다. 이들 실시예중 일부에서, 샘플 분석에는 내부 표준의 사용이 내포된다. 이들 표준에는 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들이 내포될 수 있다. 이들 표준에는 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들이 내포될 수 있다.

임상 환경에서, 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들이 내포되도록 (가령, 절단에 의해) 샘플들이 준비될 수 있다.

임상 환경에서, 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들이 내포되도록 (가령, 절단에 의해) 샘플들이 준비될 수 있다.

일부 실시예들에서, 글리칸 또는 글리코펩티드의 양은 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들의 양을 또다른 바이오마커의 농도에 비교함으로써 평가될 수 있다.

일부 실시예들에서, 글리칸 또는 글리코펩티드의 양은 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들의 양을 또다른 바이오마커의 농도에 비교함으로써 평가될 수 있다.

일부 실시예들에서, 글리칸 또는 글리코펩티드의 양은 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들의 양을 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들의 양에 비교함으로써 평가될 수 있다.

일부 실시예들에서, 글리칸 또는 글리코펩티드의 양은 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들의 양을 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들의 양에 비교함으로써 평가될 수 있다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 키트에는 글리코펩티드 MRM 전이 신호의 정규화를 계산하기 위한 소프트웨어가 내포될 수 있다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 키트에는 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드의 양을 정량화하기 위한 소프트웨어가 내포될 수 있다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 키트에는 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드의 상대적 양을 정량화하기 위한 소프트웨어가 내포될 수 있다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 훈련된 모델은 본원에 기재된 방법을 수행하는 임상의에 의해 액세스되는 서버에 저장된다. 일부 실시예들에서, 상기 임상의는 환자의 샘플에서 얻은 MRM 전이 신호의 정량화를 서버에 저장된 훈련된 모델에 입력한다. 일부 실시예들에서, 인터넷, 무선 통신 또는 기타 디지털 또는 통신 방법을 통해 상기 서버에 액세스된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 훈련된 모델은 본원에 기재된 방법을 수행하는 임상의에 의해 액세스되는 서버에 저장된다. 일부 실시예들에서, 상기 임상의는 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드 또는 글리코펩티드들의 정량화를 서버에 저장된 훈련된 모델에 입력한다. 일부 실시예들에서, 인터넷, 무선 통신 또는 기타 디지털 또는 통신 방법을 통해 상기 서버에 액세스된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 훈련된 모델은 본원에 기재된 방법을 수행하는 임상의에 의해 액세스되는 서버에 MRM 전이 신호 1-38이 저장된다. 일부 실시예들에서, 상기 임상의는 환자 샘플의 MRM 전이 신호를 서버에 저장된 MRM 전이 신호 1-38와 비교한다. 일부 실시예들에서, 인터넷, 무선 통신 또는 기타 디지털 또는 통신 방법을 통해 상기 서버에 액세스된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 본원에 기재된 MRM 전이 신호 1-38를 이용하여 훈련된 기계 학습 알고리즘은 본원에 기재된 방법을 수행하는 임상의에 의해 액세스되는 서버에 저장된다. 일부 실시예들에서, 서버에 원격으로 액세스되는 기계 학습 알고리즘은 환자 샘플의 MRM 전환 신호를 분석한다. 일부 실시예들에서, 인터넷, 무선 통신 또는 기타 디지털 또는 통신 방법을 통해 상기 서버에 액세스된다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 바이오마커, 방법 및/또는 키트는 환자 진단을 위한 임상 환경에서 사용될 수 있다. 이들 실시예중 일부에서, 샘플 분석에는 내부 표준의 사용이 내포된다. 이들 표준에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들이 내포될 수 있다. 이들 표준에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들이 내포될 수 있다. 이들 표준에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 32으로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들이 내포될 수 있다.

일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 5의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 8의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 9의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 10의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 11의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 13의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 14의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 16의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 17의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 18의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 19의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 20의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 21의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 22의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 26의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 27의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 28의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 30의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 31의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 34의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 35의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 36의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 37의 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플에서 서열 식별 번호: 38의 아미노산 서열의 글리코펩티드를 포함한다. 특정 구체예들에서, 각 글리코펩티드는 가령, 본원에 기재된 바와 같이 글리칸을 포함하거나, 또는 이에 결합된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 5의 필수적 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 8의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 9의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 10의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 11의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 13의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 14의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 16의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 17의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 18의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 19의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 20의 필수적 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 21의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 22의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 26의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 27의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 28의 필수적 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 30의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 31의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 34의 필수적 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 35의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 36의 필수적 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 37의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 특정 구체예들에서, 각 글리코펩티드는 가령, 본원에 기재된 바와 같이 글리칸을 포함하거나, 또는 이에 결합된다. 일부 실시예들에서, 상기 표준은 샘플 내 서열 식별 번호: 38의 필수적 아미노산 서열의 글리코펩티드를 포함한다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 5의 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 8의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 9의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 10의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 11의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 13의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 14의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 16의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 17의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 18의 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 19의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 20의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 21의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 22의 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 26의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 27의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 28의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 30의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 31의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 34의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 35의 서열로 구성된, 또는 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 36의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 37의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 일부 실시예들에서, 상기 표준은 상기 샘플 내 서열 식별 번호: 38의 아미노산 서열로 구성된, 또는 이의 서열로 필수적으로 구성된 글리코펩티드를 포함한다. 특정 구체예들에서, 각 글리코펩티드는 가령, 본원에 기재된 바와 같이 글리칸을 포함하거나, 또는 이에 결합된다. 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

이들 표준에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들이 내포될 수 있다. 이들 표준에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들이 내포될 수 있다. 이들 표준에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 32으로 구성된 군에서 선택된 아미노산 서열로 로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들이 내포될 수 있다.

임상 환경에서, 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들이 내포되도록 (가령, 절단에 의해) 샘플들이 준비될 수 있다. 임상 환경에서, 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들이 내포되도록 (가령, 절단에 의해) 샘플들이 준비될 수 있다 임상 환경에서, 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 32으로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들이 내포되도록 (가령, 절단에 의해) 샘플들이 준비될 수 있다.

임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 5의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 8의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 9의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 10의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 11의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 13의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 14의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 16의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 17의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 18의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 19의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 20의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 21의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 22의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 26의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 27의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 28의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 30의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 31의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 34의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 35의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 36의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 37의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 38의 아미노산 서열로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 5의 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 8의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 9의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 10의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 11의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 13의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 14의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 16의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 17의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 18의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 19의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 20의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 21의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 22의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 26의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 27의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 28의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 30의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 31의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 34의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 35의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 36의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 37의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 38의 아미노산 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 5의 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 8의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 9의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 10의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 11의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 13의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 14의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 16의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 17의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 18의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 19의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 20의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 21의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 22의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 26의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 27의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 28의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 30의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 31의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 34의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 35의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 36의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 37의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 임상 환경에서, 샘플들은 이 샘플 내 서열 식별 번호: 38의 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드가 내포되도록 준비될 수 있다(가령, 절단에 의해). 일부 실시예들에서, 하기에서 기술된 바와 같이, 글리코펩티드의 존재, 절대량, 및/또는 상대적 양은 MS 결과를 분석함으로써 결정된다. 일부 실시예들에서, 상기 MS 결과는 기계 학습을 이용하여 분석된다.

임상 환경에서, 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들이 내포되도록 (가령, 절단에 의해) 샘플들이 준비될 수 있다. 임상 환경에서, 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들이 내포되도록 (가령, 절단에 의해) 샘플들이 준비될 수 있다 임상 환경에서, 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들이 내포되도록 (가령, 절단에 의해) 샘플들이 준비될 수 있다.

일부 실시예들에서, 글리칸 또는 글리코펩티드의 양은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들의 양을 또다른 바이오마커의 농도에 비교함으로써 평가될 수 있다. 일부 실시예들에서, 글리칸 또는 글리코펩티드의 양은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들의 양을 또다른 바이오마커의 농도에 비교함으로써 평가될 수 있다. 일부 실시예들에서, 글리칸 또는 글리코펩티드의 양은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32으로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들의 양을 또다른 바이오마커의 농도에 비교함으로써 평가될 수 있다.

일부 실시예들에서, 글리칸 또는 글리코펩티드의 양은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들의 양을 또다른 바이오마커의 농도에 비교함으로써 평가될 수 있다. 일부 실시예들에서, 글리칸 또는 글리코펩티드의 양은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들의 양을 또다른 바이오마커의 농도에 비교함으로써 평가될 수 있다. 일부 실시예들에서, 글리칸 또는 글리코펩티드의 양은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들의 양을 또다른 바이오마커의 농도에 비교함으로써 평가될 수 있다.

일부 실시예들에서, 글리칸 또는 글리코펩티드의 양은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들의 양을 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들의 양에 비교함으로써 평가될 수 있다. 일부 실시예들에서, 글리칸 또는 글리코펩티드의 양은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들의 양을 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들의 양에 비교함으로써 평가될 수 있다. 일부 실시예들에서, 글리칸 또는 글리코펩티드의 양은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들의 양을 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 구성된 하나 또는 그 이상의 글리코펩티드들의 양에 비교함으로써 평가될 수 있다.

일부 실시예들에서, 글리칸 또는 글리코펩티드의 양은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들의 양을 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들의 양에 비교함으로써 평가될 수 있다. 일부 실시예들에서, 글리칸 또는 글리코펩티드의 양은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들의 양을 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들의 양에 비교함으로써 평가될 수 있다. 일부 실시예들에서, 글리칸 또는 글리코펩티드의 양은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들의 양을 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들의 양에 비교함으로써 평가될 수 있다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 키트에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드의 양을 정량화하기 위한 소프트웨어가 내포될 수 있다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 키트에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드의 양을 정량화하기 위한 소프트웨어가 내포될 수 있다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 키트에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드의 양을 정량화하기 위한 소프트웨어가 내포될 수 있다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 키트에는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드의 상대적 양을 정량화하기 위한 소프트웨어가 내포될 수 있다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 키트에는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드의 상대적 양을 정량화하기 위한 소프트웨어가 내포될 수 있다. 전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 상기 키트에는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드의 상대적 양을 정량화하기 위한 소프트웨어가 내포될 수 있다.

전술한 실시예들중 임의의 것을 비롯한, 일부 실시예들에서, 훈련된 모델은 본원에 기재된 방법을 수행하는 임상의에 의해 액세스되는 서버에 저장된다. 일부 실시예들에서, 상기 임상의는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드 또는 글리코펩티드들의 정량화를 서버에 저장된 훈련된 모델에 입력한다. 일부 실시예들에서, 상기 임상의는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33으로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드 또는 글리코펩티드들의 정량화를 서버에 저장된 훈련된 모델에 입력한다. 일부 실시예들에서, 상기 임상의는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 32로 구성된 군에서 선택된 아미노산 서열로 구성된 또는 이 서열로 필수적으로 구성된 글리코펩티드 또는 글리코펩티드들의 정량화를 서버에 저장된 훈련된 모델에 입력한다.

일부 실시예들에서, 인터넷, 무선 통신 또는 기타 디지털 또는 통신 방법을 통해 상기 서버에 액세스된다.

VIII. 실시예들

화학물질 및 시약. 인간 혈청/혈장으로부터 정제된 당단백질 표준은 Sigma-Aldrich (St. Louis, MO)으로부터 구입했다. 시퀀싱 등급 트립신은 Promega(Madison, WI)으로부터 구입했다. 디티오트레톨 (DTT) 및 요오도아세트아미드 (IAA)는 Sigma-Aldrich (St. Louis, MO)으로부터 구입했다. 인간 혈청은 Sigma-Aldrich (St. Louis, MO)으로부터 구입했다.

샘플 준비. 혈청 샘플 및 당단백질 표준을 환원시키고 알킬화시킨 후 37℃ 수조에서 18시간 동안 트립신으로 절단시켰다.

LC-MS/MS 분석. 정량적 분석을 위해, 트립신 분해된 혈청 샘플을 삼중 사중극자(QqQ) 질량 분광계와 연결된 고성능 액체 크로마토그래피(HPLC) 시스템에 주입했다. 분리는 역상 컬럼에서 수행되었다. 바이너리 구배에 사용된 용매 A와 B는 물, 아세토니트릴 및 포름산의 혼합물로 구성되었다. 공급업체가 제공한 표준에 따라 소스를 조정한 후, 일반적인 양이온화 소스 매개변수를 활용했다. 다음 범위가 평가되었다: 소스 스프레이 전압 3~5kV, 온도 250~350℃, 질소 외장 가스 유량 20~40psi. 사용된 기기의 스캔 모드는 dMRM이었다.

당단백체 분석을 위해, Q Exactive™ Hybrid Quadrupole-Orbitrap™ 질량 분광계 또는 Agilent 6495B 삼중 사중극자 LC/MS를 사용하여 농축된 혈청 글리코펩티드들을 분석했다.

MRM 질량 분광법 설정, 샘플 준비 및 시약은 Li, et al., Site-Specific Glycosylation Quantification of 50 serum Glycoproteins Enhanced by Predictive Glycopeptidomics for Improved Disease Biomarker Discovery, Anal. Chem. 2019, 91, 5433-5445; DOI: 10.1021/acs.analchem.9b00776에서 제시되며, 그 전문이 모든 목적을 위해 본원에 참조로 편입된다.

실시예 1 - 글리코펩티드 바이오마커들의 식별

본 실시예는 2020년 1월 31일자로 제출된 국제 PCT 특허 출원 번호 PCT/US2020/0162861에서 도시된 도 15를 언급하며, 이 출원은 모든 목적을 위해 전체 내용이 본원의 참조에 편입된다.

도 15의 단계 1에서 나타낸 바와 같이, 샘플들은 결장직장암 또는 진행성 선종을 가지고 있는 환자들의 샘플과 결장직장암 또는 진행성 선종이 없는 환자들의 샘플이 제공되었다. 단계 2에서, 상기 샘플들을 프로테아제 효소를 이용하여 절단시켜 글리코펩티드 단편들이 형성되었다. 단계 3에서, 상기 글리코펩티드 단편들을 직렬 LC-MS/MS 장비에 도입하여, 앞서 언급한 샘플과 관련된 유지 시간 및 MRM-MS 전이 신호를 분석했다. 단계 4에서, 글리코펩티드들과 글리칸 바이오마커들이 식별되었다. 기계 학습 알고리즘은 일련의 MS 스펙트럼에서 MRM-MS 전이 신호를 선별하였고, 해당 신호를 특정 글리코펩타이드 단편의 계산된 질량과 연합했다. 질량 분광법 피크에 대한 경계의 자동 검출 방법이 사용되었으며, 이 방법은 2020년 3월 27일에 출원된 미국 특허 16/833,324에 개시되어 있으며, 모든 목적을 위해 그 전체 내용이 본원에 참조로 편입되었다.

단계 5에서, 결장직장암 또는 진행성 선종을 가지고 있는 환자들의 샘플에서 확인된 글리코펩티드를 라쏘 회귀를 포함한 기계 학습 알고리즘을 사용하여 직장결장암 또는 진행성 선종이 없는 환자의 샘플에서 확인된 글리코펩티드와 비교했다. 이 비교에는 글리코펩타이드의 유형, 절대량, 상대량의 비교가 내포되었다. 이 비교를 통해, 펩티드의 정규화 및 글리코펩티드의 상대적 풍도가 산출되었다.

실시예 2 - 글리코펩티드 바이오마커들의 식별

본 실시예는 2020년 1월 31일자로 제출된 국제 PCT 특허 출원 번호 PCT/US2020/0162861에서 도시된 도 16을 언급하며, 이 출원은 모든 목적을 위해 전체 내용이 본원의 참조에 편입된다.

도 16의 단계 1에서 나타낸 바와 같이, 환자들의 샘플이 제공되었다. 단계 2에서, 상기 샘플들을 프로테아제 효소를 이용하여 절단시켜 글리코펩티드 단편들이 형성되었다. 단계 3에서, 상기 글리코펩티드 단편들을 직렬 LC-MS/MS 장비에 도입하여, 상기 샘플과 관련된 유지 시간 및 MRM-MS 전이 신호를 분석했다. 단계 4에서, 상기 글리코펩티드들은 MRM-MS 전이 신호를 선택하고, 해당 신호를 특정 글리코펩타이드 단편의 계산된 질량과 연관시키는 기계 학습 알고리즘을 사용하여 식별되었다. 단계 5에서, 데이터가 정규화된다. 단계 6에서, 기계 학습은 정규화된 데이터를 분석하여 직장결장암이나 진행성 선종 환자를 나타내는 바이오마커를 식별하는 데 사용된다.

실시예 3- 당단백체 훈련된 모델 테스트

본 실시예는 도 1 및 도 2을 참조한다.

마커는 진단된 진행성 선종(AA) 또는 결장직장암 (CRC)과의 연관성으로 확인되었다. 47명의 진행성 선종(AA) 환자와 74명의 결장직장암(CRC) 환자들의 질병을 4단계 전체에 걸쳐 분석했다. 또한, InterVenn 플랫폼을 통해 연령과 성별이 일치하는 건강한 대조군 121명을 분석했다. 생성된 글리코펩티드 풍도를 배치(batch) 전반에 걸쳐 실행된 풀링된 인간 혈청의 수준, 뿐만 아니라 동일한 단백질의 비-글리코실화된 펩티드 수준으로 정규화했다.

3개 세트의 글리코펩티드들이 식별되었다.

제1 세트에는 CRC를 AA와 개별적으로 구별하는 세트(FDR < 0.05)가 내포되었다. 이들은 또한 개체 CRC vs 건강한 개체 (FDR < 0.05, 동일한 방향에서, CRC vs AA); 또는 개체 AA vs 건강한 개체 (FDR < 0.05, 동일한 방향에서 CRC vs AA)에서 구별되었다. 아래 표 6에는 점수(CRC.FC)가 포함되어 있으며, 이때 이 모델에서 높은 점수는 대장내시경 검사를 수행할 필요성을 나타낼 수 있다.

제2 세트에는 CRC 및 정상 샘플(모델 1)로 구축된 다변수 LASSO 모델에 활용된 세트가 내포되었다. 모델 1은 분석 모델을 창출하기 위해 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33을 이용하였다. 도 1은 모델 1의 결과를 보여준다. 훈련 세트 데이터는 삼각형으로 표시되고, 환자 샘플은 원으로 표시된다. 이 모델은 CRC 환자와 건강한 환자를 식별할 수 있다. 모델 1은 진행성 선종 데이터가 모델 구축에 사용되지 않았음에도 불구하고, 여전히 진행성 선종을 예측한다. 모델 1은 분류를 위해 0.318의 확률 임계값을 사용했다.

제3 세트에는 AA vs 건강한 샘플들(모델 2)로 구축된 다변수 LASSO 모델에 활용된 세트가 내포되었다. 모델 2는 분석 모델을 창출하기 위해 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 32를 이용하였다. 도 2는 모델 2의 결과를 보여준다. 훈련 세트 데이터는 삼각형으로 표시되고, 환자 샘플은 원으로 표시된다. 이 모델은 AA 환자들과 건강한 환자들을 식별할 수 있다. 모델 2는 CRC 데이터가 모델 구축에 사용되지 않았음에도 불구하고, CRC를 또한 예측한다. 모델 2는 분류를 위해 0.385의 확률 임계값을 사용했다.

다변수 모델링은 242개의 샘플 세트를 70% 훈련 세트와 30% 테스트 세트로 분할하였고, 암의 단계, 연령 및 성별에 따라 균형을 맞추는 방식으로 수행되었다. 최적의 LASSO 하이퍼파라미터를 식별하기 위해, 훈련 세트에서 10-배 교차-검증을 5회 반복했으며, 전체 훈련 데이터 세트를 활용하여 해당 매개변수를 기반으로 하는 모델을 구축했다. 모델 성능은 테스트 세트에서 블라인드로 평가되었다.

CRC.FC(전체 변경)는 개별 마커에 대한 CRC 그룹과 건강한 환자 그룹 간의 평균 곱셈 차이다. 예로써, 개별 마커의 경우, CRC.FC 2는 건강한 환자와 비교했을 때, 해당 마커가 CRC에서 발현될 가능성이 두 배라는 것을 의미한다. 추가 예로서, 값이 0.5인 경우, 마커의 발현은 건강한 환자와 비교할 때 실제로 절반 정도이다.

CRC.P-값은 CRC.FC에 대한 통계적 P-값이며, CRC.FC의 유의성을 측정한다.

개별.diff는 개별 마커가 CRC와 AA 또는 CRC와 건강한 세포를 구별할 수 있는지 여부를 지정하며, CRC.P-값이 유의미한 것으로 간주되는지 여부, 특히 그룹 간에 관찰된 차이가 있는지 여부를 기반으로 한다. "예" 응답은 마커가 AA로부터 CRC를, 또는 건강한 세포로부터 CRC를 구별할 수 있음을 나타낸다. 상기 전이 번호 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38은 AA로부터 CRC를, 또는 건강한 세포로부터 CRC의 구별에 이용될 수 있다. 각 개체 전이 번호 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38은 AA로부터 CRC를, 또는 건강한 세포로부터 CRC를 개별적으로 구별함에 이용될 수 있다. 하나 또는 그 이상의 전이 번호들을 복합시켜, AA로부터 CRC를, 또는 건강한 세포의 CRC를 더 큰 확률로 구별할 수 있다. 상기 임의의 표에서 전이 번호 1-38은 표 10에서 제시된 아미노산 서열에 대응한다.

이 모델들은 CRC 및 AA를 결정하기 위해 표준 테스트와 비교될 것이다. 일부 경우들에서, 이러한 표준 검사에 환자의 대변 샘플에서 채취한 DNA 샘플이 내포된다. 이 응용 프로그램의 방법과 모델은 뛰어난 예측 성능을 가지고 있음을 보여줄 것이다. 또한, 이 응용 프로그램의 방법과 모델은 진단 목적으로 대변 샘플에만 의존할 필요가 없다.

실시예 4: 모델 1과 모델 2의 곡선 아래 면적 분석

모델 1 및 모델 2는 도 3A 및 도 3B에 표시된 대로, 특정 바이오마커 및 전체 바이오마커에 대한 AUC 분석을 사용하여 분석되었다. AUC가 높을수록 모델은 바이오마커가 질환 상태를 식별하는지 여부를 더 잘 예측할 수 있다. 진단 정확도는 정확한 검사 결과 수를 검사한 환자 수로 나눈 값이다. 민감도(질환에서 양성)는 표적이 되는 병태를 갖고, 검사 결과가 양성를 나타내는 대상체자의 비율을 의미한다. 특이도는 표적 병태가 없고, 테스트 결과가 음성을 제공하는 대상체의 비율을 의미한다.

모델 1은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33에서 제시된 아미노산 서열을 포함한다. 본원에서 기재된 모델 1은 하나 또는 그 이상의 글리코펩티드를 이용하여 건강한 개체로부터 결장직장암 (CRC)을 가지고 있는 개체를 뛰어난 예측 결과로 구별하는데 이용된다. 모델 1의 경우, 정확도는 0.962, 감도는 0.971, 특이도는 0.944로 측정되었다. 모델 1 AUC, 정확도, 민감도 및 특이도에서 높은 값은 모델 1이 탁월한 예측 결과를 제공한다는 것을 나타낸다.

모델 2는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 32에서 제시된 아미노산 서열을 포함하는 하나 또는 그 이상의 글리코펩티드를 사용한다. 본원에서 기재된 모델 2는 하나 또는 그 이상의 글리코펩티드를 이용하여 건강한 개체로부터 진행성 선종 (AA)을 가지고 있는 개체를 뛰어난 예측 결과로 구별하는데 이용된다. 모델 2의 경우, 정확도는 0.976, 감도는 0.977, 특이도는 0.972로 측정되었다. 모델 2 AUC, 정확도, 민감도 및 특이도에서 높은 값은 모델 2가 탁월한 예측 결과를 제공한다는 것을 나타낸다.

상기 AUC, 정확도, 민감도 및 특이도에서 높은 값은 이 모델이 탁월한 예측 결과를 제공한다는 것을 나타낸다.

표 11A 및 표 11B는 글리칸 GL 번호를 기준으로 표 10의 글리코펩티드에 해당하는 검출된 글리칸 모이어티의 기호 구조 및 구성을 예시한다. 기호 구조라는 용어는 N-아세틸글루코사민과 같은 최하위 탄수화물이 N-연계된 글리칸에 대해 지정된 아미노산에 결합된 탄수화물의 기하학적 구조를 나타되고, N-연계된 아세틸갈락토사민과 같은 맨 오른쪽 탄수화물은 O-연계된 글리칸에 대해 지정된 아미노산에 결합되는 탄수화물의 기하학적 연결 구조를 나타낸다. 글리칸 구조 GL 번호 1102는 표 11A에 있는 O-연계된 글리칸이고, N-연계된 글리칸은 표 11B에 있다는 점을 주지해야 한다. 참고로, N-연계된 글리칸은 아스파라긴 아미노산에 글리칸이 부착되어 있고, O-연계된 글리칸은 세린이나 트레오닌에 글리칸이 부착되어 있다.

다양한 단당류의 실체는 표 11B 끝에 위치한 범례 섹션에 설명되어 있다. 범례의 약어는 포도당을 나타내는 Glc이며, 짙은 원으로 표시되고, Gal은 갈락토스를 나타내며, 투명 원으로 표시되며, Man은 만노스를 나타내며, 중간 음영의 회색 원으로 표시되고, Fuc는 푸코스를 나타내고, 짙은 삼각형으로 표시되고, Neu5Ac는 N-아세틸뉴라민산을 나타내며, 짙은 다이아몬드로 표시되고, GlcNAc는 N-아세틸글루코사민을 나타내고, 짙은 사각형으로 표시되며, GalNAc는 N-아세틸갈락토사민을 나타내며, 투명 사각형으로 표시되고, 그리고 ManNAc는 N-아세틸만노사민을 나타내며, 중간 음영의 회색 사각형으로 표시된다.

용어 조성이란 글리칸을 구성하는 다양한 종류의 탄수화물의 수를 나타낸다. 각 탄수화물 종류의 양은 탄수화물 종류에 해당하는 약어 오른쪽에 괄호 안에 숫자로 표시되어 있다. 이러한 종류의 약어는 Hex, HexNAc, Fuc 및 NeuAc이며, 각각 육탄당, N-아세틸헥소사민, 푸코스 및 N-아세틸뉴라민산에 해당된다. 육탄당에는 포도당, 갈락토스 및 만노스가 포함되며; N-아세틸헥소사민 당에는 N-아세틸글루코사민, N-아세틸갈락토사민 및 N-아세틸만노사민이 내포됨을 주지해야 한다. 각종 구체예들에서, 용어 Neu5Ac, NeuAc, 및 N-아세틸뉴라민산이라는 용어는 시알산으로 지칭될 수 있다.

전술한 구체예 및 실시예는 단지 예시적이고 비-제한적인 것으로 의도된다. 당업자는 단지 일상적인 실험, 특정 화합물, 재료 및 절차의 수많은 등가물을 사용하여, 인식하거나 확인할 수 있을 것이다. 그러한 모든 등가물은 범위 내에 있는 것으로 간주되며, 첨부된 청구범위에 포괄된다.

IX. 예시적인 방법들

일부 측면들에서, 결장직장암 (CRC) 또는 진행성 선종 (AA)과 연합된 다중 상태에 대해 대상체로부터 획득한 생물학적 샘플을 분류하는 방법이 본원에서 제공되며, 상기 방법은 상기 생물학적 샘플 내 단백질 세트에 대응하는 펩티드 구조 데이타를 제공받는 단계를 포함한다. 일부 구체예들에서, 상기 펩티드 구조 데이터는 생물학적 샘플에서 당단백질들의 세트에 상응한다. 일부 구체예들에서, 상기 펩티드 구조 데이터는 대상체로부터 획득한 생물학적 샘플에서 당단백질 세트에 상응하고, 이때 상기 펩티드 구조 데이터는 표 10의 적어도 하나의 펩티드 구조를 포함한다. 일부 구체예들에서, 상기 방법은 상기 정량화 데이터에 근거하여 질환 표시자를 확인하도록 훈련된 기계-학습 모델로 펩티드 구조 세트에 대한 펩티드 구조 데이터로부터 확인된 정량화 데이터를 입력하는 것을 더 포함하며, 이때 펩티드 구조 세트를 표 10의 다수의 펩티드 구조로부터 확인된 적어도 하나의 펩티드 구조를 포함한다. 일부 구체예들에서, 상기 방법은 기계-학습 모델에 의해 질환 표시자를 식별하는 것을 더 포함한다. 일부 구체예들에서, 상기 방법은 식별된 질환 표시자를 근거하여 CRC 또는 AA와 연합된 다수의 상태에 대한 생물학적 샘플을 분류하는 단계를 더 포함한다. 일부 구체예들에서, 상기 방법은 상기 질환 표시자를 근거하여 상기 샘플에 CRC가 있는 지, 또는 CRC를 가지고 있지 않는 지를 분류하는 단계를 포함한다. 일부 구체예들에서, 상기 방법은 상기 질환 표시자를 근거하여 상기 샘플에 AA가 있는 지, 또는 AA를 가지고 있지 않는 지를 분류하는 단계를 포함한다. 일부 구체예들에서, 하나 또는 그 이상의 펩티드들 및/또는 글리코펩티드의 존재, 부재 및/또는 그 양은 MRM-MS에 의해 결정된다.

일부 측면들에서, 본원은 대상체에서 결장직장암 (CRC) 또는 진행성 선종 (AA)의 존재를 검출하는 방법을 제공하며, 상기 방법은 대상체로부터 획득한 생물학적 샘플 내 단백질 세트에 대응하는 펩티드 구조 데이터를 제공받는 것을 포함하고, 이때 상기 펩티드 구조 데이터는 표 10의 적어도 하나의 펩티드 구조를 포함한다. 일부 구체예들에서, 상기 펩티드 구조 데이터는 생물학적 샘플에서 당단백질들의 세트에 상응한다. 일부 구체예들에서, 상기 방법은 상기 정량화 데이터에 근거하여 질환 표시자를 확인하도록 훈련된 기계-학습 모델로 펩티드 구조 세트에 대한 펩티드 구조 데이터로부터 확인된 정량화 데이터를 입력하는 것을 더 포함한다. 일부 구체예들에서, 상기 방법은 상기 확인된 질환 표시자가 CRC 또는 AA와 연합된 선택된 범위 내에 있다는 결정에 응답으로 CRC 또는 AA의 존재를 검출하는 것을 더 포함한다. 일부 구체예들에서, 하나 또는 그 이상의 펩티드들 및/또는 글리코펩티드의 존재, 부재 및/또는 그 양은 MRM-MS에 의해 결정된다.

일부 구체예들에서, 상기 단백질 세트는 하나 또는 그 이상의 당단백질을 포함하고, 이때 상기 당단백질은 표 9의 적어도 하나의 당단백질을 포함한다. 일부 구체예들에서, 상기 하나 또는 그 이상의 당단백질들은 서열 식별 번호: 39-54의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 글리코펩티드를 포함하고, 이때 상기펩티드 구조는 표 10의 적어도 하나의 글리코펩티드를 포함한다. 일부 구체예들에서, 상기 하나 또는 그 이상의 글리코펩티드는 서열 식별 번호: 1-38의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 방법은 표 10에서 제공된 하나 또는 그 이상의 글리코펩티드들에 기초하여 CRC 또는 AA와 연합된 다중 상태에 대해 생물학적 샘플을 분류하는 단계를 포함한다. 일부 구체예들에서, 상기 다수의 상태는 CRC 상태, AA 상태, 또는 건강한 상태중 적어도 하나의 상태를 포함한다. 일부 구체예들에서, 상기 다수의 상태는 CRC 상태, AA 상태, 및 건강한 상태 중 적어도 두 가지 상태를 포함한다. 일부 구체예들에서, 상기 다수의 상태는 CRC 상태, AA 상태, 및 건강한 상태 각각을 포함한다.

일부 구체예들에서, 상기 기계-학습 모델은 로직 회귀 모델을 포함한다. 일부 구체예들에서, 상기 기계-학습 모델은 정규화된 회귀 모델을 포함한다. 일부 구체예들에서, 정규화된 회귀 모델은 최소 절대 수축 및 선택 연산자 (LASSO) 회귀 모델을 포함한다.

일부 구체예들에서, 펩티드 구조 세트의 펩티드 구조에 대한 정량화 데이터는 풍도, 상대적 풍도, 정규화된 풍도, 또는 차등 풍도 중 적어도 하나를 포함한다. 일부 구체예들에서, 펩티드 구조 세트의 펩티드 구조에 대한 정량화 데이터는 상대적 양, 조정된 양, 정규화된 양, 상대적 농도, 조정된 농도, 또는 정규화된 농도 중 적어도 하나를 포함한다. 일부 구체예들에서, 상기 정량화 데이터는 액체 크로마토그래피-질량 분석법 (LC-MS) 시스템을 이용하여 생성된다. 일부 구체예들에서, 상기 펩티드 구조 데이터는 다중 반응 모니터링 질량 분광계 (MRM-MS)를 이용하여 생성된다. 예를 들면, CRC 또는 AA를 갖는 개체로부터의 샘플을 나타내는 MRM 전이 신호의 제1 데이터 세트, 그리고 대조군 샘플을 나타내는 MRM 전이 신호의 제2 데이터 세트가 수집된다. 제1 데이터 세트와 제2 데이터 세트를 비교하면, CRC 또는 AA가 있는 개체와 대조군 샘플의 샘플과 관련된 글리코펩티드의 상대적 풍도, 정규화된 풍도 또는 차등 풍도를 계산할 수 있다.

일부 구체예들에서, 상기 기계-학습 모델은 대상체의 생물학적 샘플이 복수의 상태 중 어느 상태에 해당하는지 결정하기 위해, 펩티드 구조 패널의 하위 세트인 펩티드 구조 세트에 상응하는 정량화 데이터의 일부를 활용하여 훈련되었다. 일부 구체예들에서, 상기 펩티드 구조 세트는 서열 식별 번호: 1-38의 아미노산 서열을 포함한다. 일부 구체예들에서, 상기 펩티드 구조의 하위 세트는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38의 아미노산 서열 중 하나 또는 그 이상의 서열을 포함한다. 일부 구체예들에서, 상기 펩티드 구조의 하위 세트는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33의 아미노산 서열 중 하나 또는 그 이상의 서열을 포함한다. 일부 구체예들에서, 상기 펩티드 구조의 하위 세트는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32의 아미노산 서열 중 하나 또는 그 이상의 서열을 포함한다. 일부 구체예들에서, 상기 방법은 다수 대상체에 대한 정량화 데이터를 사용하여, 차등 발현 분석을 수행하는 단계를 추가로 포함한다. 일부 구체예들에서, CRC 완전 변경(CRC.FC)이 사용되며, 여기서 CRC.FC는 개별 마커에 대한 CRC 그룹과 건강한 환자 그룹 간의 평균 곱셈 차이다. 일부 구체예들에서, CRC.FC는 2와 같고, 이는 건강한 환자와 비교할 때, 전이가 CRC에서 발현될 가능성이 두 배 더 높다는 것을 의미한다. 일부 구체예들에서, CRC.FC는 0.5와 같고, 이는 건강한 환자와 비교할 때, 전이가 CRC에서 발현될 가능성이 절반이라 것을 의미한다. 일부 구체예들에서, CRC.FC는 CRC 또는 AA가 있는 개체의 제1 생물학적 샘플과 CRC 또는 AA가 없는 개체의 제2 대조군 샘플로부터의 펩티드 전이에 대한 차등 발현 분석이다. 일부 구체예들에서, 차등 발현 분석은 CRC 또는 AA를 갖는 개채로부터의 제1 생물학적 샘플 및 CRC 또는 AA를 갖지 않는 개체로부터의 제2 대조군 샘플로부터의 펩티드 전이의 발현 배수-변화를 결정하는 것이다. 일부 구체예들에서, 차등 발현 분석은 CRC 또는 AA를 갖는 개채로부터의 제1 생물학적 샘플 및 CRC 또는 AA를 갖지 않는 개체로부터의 제2 대조군 샘플로부터의 펩티드 전이의 풍도 배수-변화를 결정하는 것이다.

일부 구체예들에서, 상기 생물학적 샘플은 혈액, 혈청, 혈장, 또는 대변 중 적어도 하나를 포함한다. 일부 구체예들에서, 상기 생물학적 샘플은 혈액 샘플을 포함한다. 일부 구체예들에서, 상기 생물학적 샘플은 전체 혈액 샘플을 포함한다. 일부 구체예들에서, 상기 생물학적 샘플은 혈청 샘플을 포함한다. 일부 구체예들에서, 상기 생물학적 샘플은 혈장 샘플을 포함한다. 일부 구체예들에서, 상기 생물학적 샘플은 대변 샘플을 포함한다.

일부 측면들에서, 본원은 대상체에서 결장직장암 (CRC) 또는 진행성 선종 (AA)을 치료하는 방법을 제공하며, 이는 대상체로부터 획득한 생물학적 샘플 내 단백질 세트에 대응하는 펩티드 구조 데이터를 제공받는 것을 포함하고, 이때 상기 펩티드 구조 데이터는 표 10의 적어도 하나의 펩티드 구조를 포함한다. 일부 구체예들에서, 다수의 펩티드 구조로부터 확인된 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-38의 아미노산을 포함한다. 일부 구체예들에서, 상기 방법은 상기 정량화 데이터에 근거하여 CRC 또는 AA에 대한 질환 표시자를 생성시키기 위해 훈련된 기계-학습 모델로 상기 적어도 하나의 펩티드 구조에 대한 정량화 데이터를 입력하는 단계를 더 포함한다. 일부 구체예들에서, 상기 방법은 상기 기계-학습 모델에 의해 질환 표시자를 확인하는 단계를 더 포함한다. 일부 구체예들에서, 상기 방법은 상기 질환 표시자를 기반으로 하여 CRC 또는 AA를 치료하기 위해 본원에 기재된 다수의 치료 방식중 적어도 하나를 선택하는 단계를 더 포함한다. 일부 구체예들에서, 상기 단백질 세트는 하나 또는 그 이상의 당단백질들을 포함한다. 일부 구체예들에서, 상기 하나 또는 그 이상의 당단백질들은 서열 식별 번호: 39-54의 아미노산 서열을 포함한다.

일부 측면들에서, 본원은 대상체에서 결장직장암 (CRC) 또는 진행성 선종 (AA)을 치료하는 방법을 제공하며, 이는 생물학적 샘플 내 단백질 세트에 대응하는 펩티드 구조 데이터를 제공받는 단계를 포함한다. 일부 구체예들에서, 상기 방법은 상기 정량화 데이터에 근거하여 질환 표시자를 확인하도록 훈련된 기계-학습 모델로 펩티드 구조 세트에 대한 펩티드 구조 데이터로부터 확인된 정량화 데이터를 입력하는 것을 더 포함하며, 이때 펩티드 구조 데이터는 표 10의 다수의 펩티드 구조로부터 확인된 적어도 하나의 펩티드 구조를 포함한다. 일부 구체예들에서, 다수의 펩티드 구조로부터 확인된 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-38의 아미노산을 포함한다. 일부 구체예들에서, 상기 방법은 상기 기계-학습 모델에 의해 질환 표시자를 확인하는 단계를 더 포함한다. 일부 구체예들에서, 상기 방법은 확인된 질환 표시자에 기초하여 CRC 또는 AA에 대한 분류를 결정하는 단계를 더 포함한다. 일부 구체예들에서, 상기 방법은 상기 분류를 기반으로 하여 CRC 또는 AA를 치료하기 위해 본원에 기재된 다수의 치료 방식중 적어도 하나를 선택하는 단계를 더 포함한다. 일부 구체예들에서, 상기 단백질 세트는 하나 또는 그 이상의 당단백질들을 포함한다. 일부 구체예들에서, 상기 하나 또는 그 이상의 당단백질들은 서열 식별 번호: 39-54의 아미노산 서열을 포함한다.

일부 구체예에서, 상기 방법은 선택된 치료 방식을 상기 대상체에게 투여하는 단계를 더 포함한다. 일부 구체예들에서, 결장직장암 (CRC) 또는 진행성 선종 (AA)을 보유하는 개체 또는 CRC 또는 AA를 보유하는 것으로 의심되는 개체의 치료 방식은 외과술, 항대사물질, 화학요법적 치료, 토포이소메라제 억제제, 알킬화제, 표적화된 치료요법제, 면역-치료제, 면역요법, 항체, T-세포 매개된 치료법, 방사능요법, 또는 이의 조합으로부터 선택된다.

일부 측면들에서, 결장직장암 (CRC) 또는 진행성 선종 (AA)이 있는 개체를 진단하는 방법이 본원에서 제공되며, 이 방법은 표 10의 적어도 하나의 펩티드 구조 구조의 존재 또는 그 양을 검출하는 단계를 포함한다. 일부 구체예들에서, 상기 방법은 분류 라벨을 생성하도록 훈련된 기계-학습 모델로 상기 탐지된 적어도 하나의 펩티드 구조에 대한 정량을 입력하는 단계를 더 포함한다. 일부 구체예들에서, 상기 방법은 상기 분류 라벨이 분류를 위한 임계값보다 높은 지 또는 낮은 지를 결정하는 단계; 상기 분류 라벨이 분류를 위한 임계값보다 높은 지 또는 낮은 지를 기초하여 해당 개체의 진단 분류를 확인하는 단계를 더 포함한다. 일부 구체예들에서, 상기 방법은 상기 진단 분류에 기초하여 상기 개체가 CRC 또는 AA를 가지고 있는 지를 진단하는 것을 더 포함한다.

일부 구체예들에서, 상기 정량화 데이터는 액체 크로마토그래피-질량 분석법 (LC-MS) 시스템을 이용하여 생성된다. 일부 구체예들에서, 상기 펩티드 구조 데이터는 다중 반응 모니터링 질량 분광계 (MRM-MS)를 이용하여 생성된다. 일부 구체예들에서, 적어도 하나의 펩티드 구조의 양이 없거나, 또는 검출 한계 아래에 있다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 표 10의 글리코펩티드이다. 일부 구체예들에서, 상기 글리코펩티드는 서열 식별 번호: 1-38의 아미노산을 포함한다.

일부 구체예들에서, 상기 CRC는 초기-단계중 하나이다. 일부 구체예들에서, 상기 CRC는 후기-단계 CRC 중 하나이다. 일부 구체예들에서, 상기 CRC는 단계 I CRC, 단계 II CRC, 단계 III CRC, 또는 단계 IV CRC 중 하나이다. 일부 구체예들에서, 상기 CRC는 중증 CRC 중 하나이다.

일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 표 10에서 확인된 하나 또는 그 이상의 펩티드 구조를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 표 10에서 확인된 두 개 또는 그 이상의 펩티드 구조를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 표 10에서 확인된 세 개 또는 그 이상의 펩티드 구조를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 표 10에서 확인된 네 개 또는 그 이상의 펩티드 구조를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 표 10에서 확인된 다섯 개 또는 그 이상의 펩티드 구조를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 표 10에서 확인된 10개 또는 그 이상의 펩티드 구조를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 표 10에서 확인된 15개 또는 그 이상의 펩티드 구조를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 표 10에서 확인된 20개 또는 그 이상의 펩티드 구조를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 표 10에서 확인된 25개 또는 그 이상의 펩티드 구조를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 표 10에서 확인된 30개 또는 그 이상의 펩티드 구조를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 표 10에서 확인된 35개 또는 그 이상의 펩티드 구조를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나의 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나의 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나의 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나의 펩티드를 포함한다.

일부 구체예들에서, 상기 대상체는 결장직장암 (CRC)의 하나 또는 그 이상의 위험 인자들 또는 임상적 표시자를 보유한다. 일부 구체예들에서, 상기 대상체는 CRC와 연합된 하나 또는 그 이상의 위험 인자들을 갖는다. 일부 구체예들에서, CRC의 위험 인자는 연령, 과민성 대장 질환, 제2형 당뇨병, CRC의 가족력, 유전적 증후군(가령, 린치 증후군), 비만, 흡연, 음주, 식이 선택 및 제한된 신체 활동으로 구성된 그룹에서 선택된다. 일부 구체예들에서, CRC의 임상 지표는 배변 습관의 변화, 혈변, 설사, 변비, 지속적인 복통, 지속적인 복부경련, 원인불명의 체중감소 등으로 구성된 군에서 선택된다. 일부 구체예들에서, 상기 개체는 건강한 상태를 가지고 있다고 판단되며, 이때 건강한 상태는 CRC 또는 AA의 부재를 포함한다. 일부 구체예들에서, 상기 방법은 이 대상체에 대해 검출된 해당 상태에 기초한 진단이 내포된 보고서를 생성하는 단계를 추가로 포함한다.

일부 측면들에서, 본원에서 결장직장암 (CRC) 또는 진행성 선종 (AA)과 연합된 다수의 병태 중 하나를 갖는 대상체를 진단하기 위해 모델을 훈련하는 방법을 제공하며, 상기 방법은 CRC 또는 AA와 연합된 다수의 병태를 갖는 것으로 진단된 대상체들의 다수에 대한 펩티드 구조에 대한 정량화 데이터를 제공받는 단계를 포함한다. 일부 구체예들에서, 상기 방법은 상기 정량화 데이터를 기반으로 상기 대상체의 생물학적 샘플 내 다수의 병태를 결정하도록 기계-학습 모델을 훈련시키는 단계를 더 포함한다.

일부 구체예들에서, 다수의 상태를 결정하도록 상기 기계-학습 모델의 훈련은 다수의 상태에 대한 분류 라벨을 생성시키도록 상기 기계-학습 모델을 훈련시키는 단계를 포함한다. 일부 구체예들에서, 상기 다수의 상태는 CRC 상태, AA 상태, 또는 건강한 상태중 적어도 하나의 상태를 포함한다. 일부 구체예들에서, 상기 다수의 상태는 CRC 상태, AA 상태, 또는 건강한 상태 중 적어도 2개를 포함한다. 일부 구체예들에서, 상기 다수의 상태는 CRC 상태, AA 상태, 또는 건강한 상태 각각을 포함한다. 일부 구체예들에서, 상기 기계-학습 모델은 로직 회귀 모델을 포함한다. 일부 구체예들에서, 상기 기계-학습 모델은 정규화된 회귀 모델을 포함한다. 일부 구체예들에서, 정규화된 회귀 모델은 최소 절대 수축 및 선택 연산자 (LASSO) 회귀 모델을 포함한다.

일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나의, 적어도 2개, 적어도 3개, 적어도 5개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 또는 적어도 35개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나의 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 두 개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 세 개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 네 개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 다섯 개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 10개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 20개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 30개의 상이한 펩티드를 포함한다.

일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나, 적어도 두 개, 적어도 세 개, 적어도 네 개, 또는 적어도 다섯 개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나의 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 중 임의의 하나에서 제시된 서열을 포함하는 적어도 두 개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 중 임의의 하나에서 제시된 서열을 포함하는 적어도 세 개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 중 임의의 하나에서 제시된 서열을 포함하는 적어도 네 개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 중 임의의 하나에서 제시된 서열을 포함하는 적어도 다섯 개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 중 임의의 하나에서 제시된 서열을 포함하는 적어도 여섯 개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 중 임의의 하나에서 제시된 서열을 포함하는 적어도 일곱 개의 상이한 펩티드를 포함한다.

일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나, 적어도 두 개, 적어도 세 개, 적어도 다섯 개, 적어도 10개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나의 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 중 임의의 하나에서 제시된 서열을 포함하는 적어도 두 개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 중 임의의 하나에서 제시된 서열을 포함하는 적어도 세 개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 중 임의의 하나에서 제시된 서열을 포함하는 적어도 다섯 개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 중 임의의 하나에서 제시된 서열을 포함하는 적어도 10 개의 상이한 펩티드를 포함한다.

일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나, 적어도 두 개, 적어도 세 개, 적어도 다섯 개, 적어도 10개, 적어도 15개, 또는 적어도 20개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나의 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 두 개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 세 개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 다섯 개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 10개의 상이한 펩티드를 포함한다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 20개의 상이한 펩티드를 포함한다.

일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 펩티드 서열 및 글리칸 구조를 포함하며, 이때 상기 글리칸 구조는 표 10에 따른 펩티드 서열에서 연계 부위 위치에 부착된다. 일부 구체예들에서, 상기 펩티드 서열의 글리칸 구조는 표 10에 따른 글리칸 구조 GL 번호에 상응하며, 이때 상기 글리칸 구조는 표 10, 표 11A, 및 표 11B에 따른 글리칸 구조 GL 번호에 따른 심볼 구조를 포함한다. 일부 구체예들에서, 상기 펩티드 서열의 글리칸 구조는 표 10에 따른 글리칸 구조 GL 번호에 상응하며, 이때 상기 글리칸 구조는 표 10, 표 11A, 및 표 11B에 따른 글리칸 구조 GL 번호에 따른 심볼 조성을 포함한다. 일부 구체예들에서, 표 11A의 글리칸 구조의 가장 오른쪽 N-아세틸갈락토사민은 표 10에 따른 펩타이드 서열의 연결 부위 위치에 부착되며, 이때 표 11B의 글리칸 구조의 맨 아래 N-아세틸글루코사민은 표 10에 따른 펩티드 서열의 연결 부위 위치에 부착된다.

일부 구체예들에서, 표 10의 하나 또는 그 이상의 펩티드 구조를 포함하는 조성물이 본원에서 제공된다. 일부 구체예들에서, 상기 적어도 하나의 펩티드 구조는 펩티드 서열 및 글리칸 구조를 포함하며, 이때 상기 글리칸 구조는 표 10에 따른 펩티드 서열에서 연계 부위 위치에 부착된다. 일부 구체예들에서, 상기 펩티드 서열의 글리칸 구조는 표 10에 따른 글리칸 구조 GL 번호에 상응하며, 이때 상기 글리칸 구조는 표 10, 표 11A, 및 표 11B에 따른 글리칸 구조 GL 번호에 따른 심볼 구조를 포함한다. 일부 구체예들에서, 상기 펩티드 서열의 글리칸 구조는 표 10에 따른 글리칸 구조 GL 번호에 상응하며, 이때 상기 글리칸 구조는 표 10, 표 11A, 및 표 11B에 따른 글리칸 구조 GL 번호에 따른 심볼 조성을 포함한다. 일부 구체예들에서, 표 11A의 글리칸 구조의 가장 오른쪽 N-아세틸갈락토사민(GalNAc)은 표 10에 따른 펩타이드 서열의 연결 부위 위치에 부착된다. 일부 구체예들에서, 표 11B의 글리칸 구조의 가장 알 N-아세틸글루코사민(GlcNAc)은 표 10에 따른 펩타이드 서열의 연결 부위 위치에 부착된다.

특정 측면들에서, 결장직장암 (CRC) 또는 진행성 선종 (AA)과 연합된 다수의 상태에 대해 대상체로부터 획득한 생물학적 샘플을 분류하는 방법이 본원에서 제공되며, 상기 방법은 다음을 포함한다: 상기 생물학적 샘플로부터 획득한 질량 분광법 (MS) 정량화 데이터를 제공받는 단계, 이때 상기 정량화 데이터는 표 9의 하나 또는 그 이상의 단백질로부터 유래된 하나 또는 그 이상의 펩티드 각각과 연합된 정량화 수준을 포함하며; 상기 MS 정량화 데이터를 기계-학습 모델로 입력하는 단계, 이때 상기 기계-학습 모델은 CRC를 보유하는, AA를 보유하는, 또는 CRC 또는 AA를 보유하지 않는 것으로 특징화된 훈련 샘플들로부터 정량화 데이터를 포함하는 하나 또는 그 이상의 훈련 MS 정량화 데이터 상에서 훈련되며, 이때, 각 훈련 샘플의 경우, 상기 연합된 훈련 MS 정량화 데이터는 표 9의 하나 또는 그 이상의 단백질로부터 유래된 하나 또는 그 이상의 펩티드 각각과 연합된 정량화 수준을 포함하고; 그리고 CRC 또는 AA와 연합된 다수의 상태에 대해 상기 생물학적 샘플을 분류하는 단계.

일부 구체예들에서, 상기 방법은 하나 또는 그 이상의 프로세서(processor)를 포함하는 시스템 상에서 수행된다. 일부 구체예들에서, 상기 생물학적 샘플은 상기 방법을 통하여 CRC를 보유하는 것으로 분류된다. 일부 구체예들에서, 상기 생물학적 샘플은 상기 방법을 통하여 AA를 보유하는 것으로 분류된다. 일부 구체예들에서, 상기 생물학적 샘플은 CRC 또는 AA를 보유하지 않는 것으로 분류된다. 일부 구체예들에서, 상기 샘플들 중 CRC 또는 AA를 보유하지 않는 것으로 특징화된 적어도 하나의 샘플은 건강한 대상체, 이를 테면 임의의 위장 또는 결정-연합된 병태 또는 질환을 앓고 있지 않는 대상체로부터 획득된다.

특정 측면들에서, 상기 MS 정량화 데이터는 본원에서 기재된 방법에 유용한 양에 추가하여 정보, 가령, 크로마토그래피 정체 시간과 같은 정량화된 화합물의 식별 또는 그 속성과 관련된 정보를 포함한다.

일부 구체예들에서, 상기 MS 정량화 데이터는 펩티드 서열 정보를 포함한다. 일부 구체예들에서, 상기 MS 정량화 데이터는 해독- 후 변형되는 아미노산 부위를 비롯한, 해독-후 변형 정보를 포함한다. 일부 구체예들에서, 상기 해독-후 변형 정보는 글리칸 구조(들) 및/또는 아미노산 부착 부위 정보를 비롯한, 글리칸 정보를 포함한다. 일부 구체예들에서, 상기 MS 정량화 데이터는 표 9의 모델 1 또는 모델 2의 각 단백질로부터 유래된 하나 또는 그 이상의 펩티드와 연합된 정량화 수준을 포함한다. 일부 구체예들에서, 상기 MS 정량화 데이터는 표 10의 하나 또는 그 이상의 펩티드와 연합된 정량화 수준을 포함한다. 일부 구체예들에서, 표 10의 펩티드는 글리코펩티드이다. 일부 구체예들에서, 상기 MS 정량화 데이터는 표 9의 모델 1 또는 모델 2의 각 단백질로부터 유래된 적어도 하나의 펩티드와 연합된 정량화 수준을 포함한다. 일부 구체예들에서, 상기 훈련 MS 정량화 데이터는 표 9의 모델 1 또는 모델 2의 각 단백질로부터 유래된 하나 또는 그 이상의 펩티드와 연합된 정량화 수준을 포함한다. 일부 구체예들에서, 상기 훈련 MS 정량화 데이터는 표 10의 하나 또는 그 이상의 펩티드와 연합된 정량화 수준을 포함한다. 일부 구체예들에서, 표 10의 펩티드는 글리코펩티드이다. 일부 구체예들에서, 상기 펩티드의 정량화 수준은 이를 테면, 본원에 기술된 다양한 MS 정량화 기술에 기초한 펩티드의 절대량 또는 펩티드의 상대적인 양을 반영한다. 일부 구체예들에서, 상기 펩티드의 정량화 수준은 펩티드의 부재를 반영한다. 일부 구체예들에서, 상기 MS 정량화 데이터 및/또는 상기 훈련 MS 정량화 데이터는 예를 들어 미국 특허 출원 공개 번호 2020/0372973 (이는 그 전체가 모든 목적을 위해 참조로 본원에 편입됨)에 설명된 것과 같은 자동화된 AUC 측정을 포함하는 자동화된 피크 검출 기술로부터 전체 또는 부분적으로 획득된다.

일부 구체예들에서, 상기 MS 정량화 데이터는 MS 기술을 사용하여 생물학적 샘플 또는 그 파생물을 분석하여 획득한다. 일부 구체예들에서, MS 기술은 표 9의 하나 또는 그 이상의 단백질로부터 유래된 하나 또는 그 이상의 펩티드의 존재 또는 부재(이의 양 포함)에 대해 생물학적 샘플과 같은 샘플을 조사하도록 설계된 MS 기술과 같은 표적화된 MS 기술이다. 일부 구체예들에서, MS 기술은 표 9의 모델 1 및/또는 모델 2의 각 단백질로부터 유래된 하나 또는 그 이상의 펩티드의 존재 또는 부재(이의 양 포함)에 대해 샘플, 이를 테면 생물학적 샘플을 조사하도록 기획된다. 일부 구체예들에서, 상기 MS 기술은 MRM 기술이다. 일부 구체예들에서, 상기 MRM 기술은 전이 세트, 이를 테면 (a) 3, 7, 9, 28, 29, 32, 및/또는 (b) 1-4, 6-7, 12, 15, 23-25, 28, 29, 32가 내포된 전이 1-38 중 하나 또는 그 이상에 기반된다. 일부 구체예들에서, 상기 MRM 기술은 크로마토그래피 정체 시간을 고려하여, 질량 분석 데이터 수집을 설계하는 동적 MRM 기술이다.

특정 측면들에서, 대상체로부터 획득된 생물학적 샘플의 글리코펩티드 프로파일을 결정하는 방법이 본원에서 제공되며, 이때 상기 글리코펩티드 프로파일은 표 9의 하나 또는 그 이상의 단백질로부터 유래된 하나 또는 그 이상의 펩티드와 연합된 정량화 수준에 기초하며; 상기 방법은 다음을 포함한다: 생물학적 샘플 또는 이의 유도체를 표 9의 하나 이상의 단백질로부터 유래된 하나 이상의 펩티드를 평가하도록 구성된 질량 분석(MS) 기술에 적용하여 MS 정보를 얻는 단계; MS 정보에 기초하여 표 9의 하나 또는 그 이상의 단백질로부터 유래된 하나 또는 그 이상의 펩티드와 연관된 정량 수준을 결정하는 단계; 그리고 표 9의 하나 또는 그 이상의 단백질로부터 유래된 하나 또는 그 이상의 펩티드와 연관된 정량화 수준에 기초하여 글리코펩티드 프로파일을 결정하는 단계.

특정 측면들에서, 질량 분광법 분석을 수행하는 방법이 본원에서 제공되며, 상기 방법은 생물학적 샘플 또는 이의 유도체를 표 9의 하나 또는 그 이상의 단백질로부터 유래된 하나 또는 그 이상의 펩티드를 평가하도록 구성된 질량 분광계 (MS) 기술에 적용시키는 것을 단계를 포함한다. 일부 구체예들에서, 상기 MS 기술은 표적화된 MS 기술, 이를 테면 본원에서 기술된 것이다. 일부 구체예들에서, 상기 표적화된 MS 기술은 이를 테면, 본원에서 기재된 바와 같이, MRM 기술이다.

특정 측면들에서, 대상체의 결장직장암 (CRC) 또는 진행성 선종 (AA)을 치료하는 방법이 본원에서 제공되며, 상기 방법은 다음을 포함한다: CRC 또는 AA와 연합된 다수의 상태에 대해 이 대상체를 분류하는 단계; 상기 분류에 기초하여 상기 대상체에게 치료 섭생을 투여하는 단계.

특정 측면들에서, 하나 또는 그 이상의 프로세서, 그리고 하나 또는 그 이상의 프로그램을 저장하는 메모리, 하나 이상의 프로세서에 의해 실행되도록 구성된 하나 이상의 프로그램, 본원에서 제공된 방법, 이를 테면, 결장직장암 (CRC) 또는 진행성 선종 (AA)과 연합된 다수의 병태에 대해 대상체로부터 획득된 생물학적 샘플을 분류하는 방법에 대한 지침을 포함하는 하나 또는 그 이상의 프로그램을 포함하는 시스템이 본원에서 제공된다.

X. 구체예들

1.하나 또는 그 이상의 다중-반응-모니터링(MRM) 전이를 검출하는 방법, 이 방법은 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계, 이때 상기 생물학적 샘플은 하나 또는 그 이상의 당단백질들, 글리칸, 또는 글리코펩티드들을 포함하며; 상기 샘플 내 당단백질을 절달 및/또는 단편화시는 단계; 그리고 전이 1-38로 구성된 군에서 선택된 MRM 전이를 검출하는 단계를 포함한다.

2.구체예 1의 방법에 있어서, 이때 상기 샘플 내에서 글리코펩티드 단편화는 상기 샘플 또는 이의 일부분을 질량 분광계로 도입 후 발생된다.

3.구체예 1-2 중 임의의 하나의 구체예의 방법에 있어서, 이때 상기 샘플 내 당단백질 또는 글리코펩티드의 단편화로 서열 식별 번호: 1-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 펩티드 또는 글리코펩티드가 생성된다.

4.구체예 1-3 중 임의의 하나의 구체예의 방법에 있어서, 이때 상기 샘플 내 당단백질 또는 글리코펩티드의 단편화로 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 펩티드 또는 글리코펩티드가 생성된다.

5.구체예 1-3 중 임의의 하나의 구체예의 방법에 있어서, 이때 상기 샘플 내 글리코펩티드의 단편화로 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 펩티드 또는 글리코펩티드가 생성된다.

6.구체예 1-3 중 임의의 하나의 구체예의 방법에 있어서, 이때 상기 샘플 내 글리코펩티드의 단편화로 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 펩티드 또는 글리코펩티드가 생성된다.

7.구체예 1-6 중 임의의 하나의 구체예의 방법에 있어서, 이때 상기 MRM 전이는 표 1-3 중 임의의 하나의 표에서 전이, 또는 이의 임의의 조합들로부터 선택된다.

8.구체예 1-7 중 임의의 하나의 구체예의 방법에 있어서, 이때 전이 1-38로 구성된 군에서 선택된 MRM 전이의 검출은 삼중 사중극자 (QQQ) 질량 분광계 또는 사중극자 비행-시간 (qTOF) 질량 분광계를 이용하여 MRM 전이를 검출하는 단계를 포함한다.

9.구체예 1-8 중 임의의 하나의 구체예의 방법에 있어서, 이때 상기 하나 또는 그 이상의 글리코펩티드들은 서열 식별 번호: 1-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 펩티드 또는 글리코펩티드를 포함한다.

10.구체예 1-9 중 임의의 하나의 구체예의 방법은 글리칸 3200, 3210, 3300, 3310, 3320, 3400, 3410, 3420, 3500, 3510, 3520, 3600, 3610, 3620, 3630, 3700, 3710, 3720, 3730, 3740, 4200, 4210, 4300, 4301, 4310, 4311, 4320, 4400, 4401, 4410, 4411, 4420, 4421, 4430, 4431, 4500, 4501, 4510, 4511, 4520, 4521, 4530, 4531, 4540, 4541, 4600, 4601, 4610, 4611, 4620, 4621, 4630, 4631, 4641, 4650,4700, 4701, 4710, 4711, 4720, 4730, 5200, 5210, 5300, 5301, 5310, 5311, 5320, 5400, 5401, 5402, 5410, 5411, 5412, 5420, 5421, 5430, 5431, 5432, 5500, 5501, 5502, 5510, 5511, 5512, 5520, 5521, 5522, 5530, 5531, 5541, 5600, 5601, 5602, 5610, 5611, 5612, 5620, 5621, 5631, 5650, 5700, 5701, 5702, 5710, 5711, 5712, 5720, 5721, 5730, 5731, 6200, 6210, 6300, 6301, 6310, 6311, 6320, 6400, 6401, 6402, 6410, 6411, 6412, 6420, 6421, 6432, 6500, 6501, 6502, 6503, 6510, 6511, 6512, 6513, 6520, 6521, 6522, 6530, 6531, 6532, 6540, 6541, 6600, 6601, 6602, 6603, 6610, 6611, 6612, 6613, 6620, 6621, 6622, 6623, 6630, 6631, 6632, 6640, 6641, 6642, 6652, 6700, 6701, 6711, 6721, 6703, 6713, 6710, 6711, 6712, 6713, 6720, 6721, 6730, 6731, 6740, 7200, 7210, 7400, 7401, 7410, 7411, 7412, 7420, 7421, 7430, 7431, 7432, 7500, 7501, 7510, 7511, 7512, 7600, 7601, 7602, 7603, 7604, 7610, 7611, 7612, 7613, 7614, 7620, 7621, 7622, 7623, 7632, 7640, 7700, 7701, 7702, 7703, 7710, 7711, 7712, 7713, 7714, 7720, 7721, 7722, 7730, 7731, 7732, 7740, 7741, 7751, 8200, 9200, 9210, 10200, 11200, 12200, 그리고 이의 조합들로 구성된 군에서 선택된 하나 또는 그 이상의 글리칸을 나타내는 하나 또는 그 이상의 MRM 전이를 검출하는 단계를 포함한다.

11.구체예 10의 방법은 제1 글리칸의 정량화와 제2 글리칸의 정량화를 더 포함하며; 그리고 제1 글리칸의 정량화를 제2 글리칸의 정량화와 비교하는 단계를 더 포함한다.

12.구체예 10 또는 11의 방법은 상기 탐지된 글리칸은 펩티드 잔기 부위의 연합을 더 포함하고, 이때 상기 글리칸은 결합되어 있었다.

13.구체예 1-12 중 임의의 하나의 구체예의 방법은 서열 식별 번호: 1-38을 갖는 아미노산으로 필수적으로 구성된 펩티드 또는 글리코펩티드의 양을 기초로 하여, 글리코펩티드의 양을 정규화시키는 단계를 더 포함한다.

14.샘플에 관한 분류를 확인하는 방법, 상기 방법은 샘플에서 질량 분광법 (MS)에 의해 하나 또는 그 이상의 글리코펩티드들을 정량화하는 단계, 이때 각 경우들에서 각 글리코펩티드는 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 선택된 아미노산 서열로 필수적으로 구성되며; 그리고 출력 확률을 생성하기 위해 훈련된 모델에 정량을 입력하는 단계; 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 상기 샘플에 대한 분류를 확인하는 단계를 포함한다.

15.구체예 14의 방법에 있어서, 이때 상기 샘플은 질환 또는 병태를 갖는 환자 또는 개체로부터의 생물학적 샘플이다.

16.구체예 15의 방법에 있어서, 이때 상기 환자는 결장직장암 또는 진행성 선종을 비롯한 선종을 보유한다.

17.구체예 14-16 중 임의의 하나의 구체예의 방법에 있어서, 이때 상기 MS는 QQQ 및/또는 qTOF 질량 분광계와 함께 MRM-MS이다.

18.구체예 14-17 중 임의의 하나의 구체예의 방법에 있어서, 이때 상기 훈련된 모델은 딥러닝 알고리즘, 신경망 알고리즘, 인공 신경망 알고리즘, 지도 머신 러닝 알고리즘, 선형 판별 분석 알고리즘, 복합 분별 분석 알고리즘, 2차 판별 분석 알고리즘, 서포트 벡터 머신 알고리즘, 선형 기저 함수 커널 서포트 벡터 알고리즘, 방사형 기저함수 커널 지원 벡터 알고리즘, 랜덤 포레스트 알고리즘, 유전자 알고리즘, 최근접 이웃 알고리즘, k-최근접 이웃, 나이브 베이즈(Bayes) 분류 알고리즘, 로지스틱 회귀 알고리즘, 또는 이의 조합으로 구성된 군에서 선택된 기계 학습 알고리즘을 이용하여 훈련되었다.

19.구체예 14-18 중 임의의 하나의 구체예의 방법에 있어서, 이때 상기 분류는 질환 분류 또는 질환 중증도 분류다.

20.구체예 19의 방법에 있어서, 이때 상기 분류는 80% 초과 신뢰도, 85% 초과 신뢰도, 90% 초과 신뢰도, 95% 초과 신뢰도, 99% 초과 신뢰도 또는 99.9999% 초과 신뢰도로 식별된다.

21.구체예 14-20 중 임의의 하나의 구체예의 방법은 제1 시점에서 샘플 내 하나 또는 여러 개의 글리코펩티드(들)를 MS에 의해 정량화하는 단계; 제2 시점에서 샘플 내 하나 또는 여러 개의 글리코펩티드(들)를 MS로 정량화하는 단계; 그리고 제1 시점에서의 정량화를 제2 시점에서의 정량화와 비교하는 단계를 더 포함한다.

22.구체예 21의 방법은 제3 시점에서 샘플 내 하나 또는 여러 개의 글리코펩타이드를 MS로 정량화하는 단계; 제4 시점에서 샘플 내 하나 또는 여러 개의 글리코펩티드를 MS로 정량화하는 단계; 그리고 제3 시점에서의 정량화를 제4 시점에서의 정량화와 비교하는 단계를 더 포함한다.

23.구체예 14-22 중 임의의 하나의 구체예의 방법은 환자의 건강 상태를 모니터링하는 것을 더 포함한다.

24.구체예 23의 방법에 있어서, 이때 환자의 건강상태를 모니터링하는 단계는 위험 인자, 이를 테면, 유전적 변이를 갖는 질환 발병과 진행을 모니터링하는 것, 뿐만 아니라 암 재발을 검출하는 단계를 포함한다.

25.구체예 14-24 중 임의의 하나의 구체예의 방법은 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열을 MS로 정량화하는 단계를 더 포함한다.

26.구체예 14-25 중 임의의 하나의 구체예의 방법은 MS에 의해 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열의 정량화를 더 포함한다.

27.구체예 14-25 중 임의의 하나의 구체예의 방법은 MS에 의해 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열의 정량화를 더 포함한다.

28.구체예 14-25 중 임의의 하나의 구체예의 방법은 MS에 의해 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열의 정량화를 더 포함한다.

29.구체예 14-25 중 임의의 하나의 구체예의 방법은 MS에 의해 글리칸 3200, 3210, 3300, 3310, 3320, 3400, 3410, 3420, 3500, 3510, 3520, 3600, 3610, 3620, 3630, 3700, 3710, 3720, 3730, 3740, 4200, 4210, 4300, 4301, 4310, 4311, 4320, 4400, 4401, 4410, 4411, 4420, 4421, 4430, 4431, 4500, 4501, 4510, 4511, 4520, 4521, 4530, 4531, 4540, 4541, 4600, 4601, 4610, 4611, 4620, 4621, 4630, 4631, 4641, 4650,4700, 4701, 4710, 4711, 4720, 4730, 5200, 5210, 5300, 5301, 5310, 5311, 5320, 5400, 5401, 5402, 5410, 5411, 5412, 5420, 5421, 5430, 5431, 5432, 5500, 5501, 5502, 5510, 5511, 5512, 5520, 5521, 5522, 5530, 5531, 5541, 5600, 5601, 5602, 5610, 5611, 5612, 5620, 5621, 5631, 5650, 5700, 5701, 5702, 5710, 5711, 5712, 5720, 5721, 5730, 5731, 6200, 6210, 6300, 6301, 6310, 6311, 6320, 6400, 6401, 6402, 6410, 6411, 6412, 6420, 6421, 6432, 6500, 6501, 6502, 6503, 6510, 6511, 6512, 6513, 6520, 6521, 6522, 6530, 6531, 6532, 6540, 6541, 6600, 6601, 6602, 6603, 6610, 6611, 6612, 6613, 6620, 6621, 6622, 6623, 6630, 6631, 6632, 6640, 6641, 6642, 6652, 6700, 6701, 6711, 6721, 6703, 6713, 6710, 6711, 6712, 6713, 6720, 6721, 6730, 6731, 6740, 7200, 7210, 7400, 7401, 7410, 7411, 7412, 7420, 7421, 7430, 7431, 7432, 7500, 7501, 7510, 7511, 7512, 7600, 7601, 7602, 7603, 7604, 7610, 7611, 7612, 7613, 7614, 7620, 7621, 7622, 7623, 7632, 7640, 7700, 7701, 7702, 7703, 7710, 7711, 7712, 7713, 7714, 7720, 7721, 7722, 7730, 7731, 7732, 7740, 7741, 7751, 8200, 9200, 9210, 10200, 11200, 12200, 그리고 이의 조합들로 구성된 군에서 선택된 하나 또는 그 이상의 글리칸을 정량화하는 것을 더 포함한다.

30.구체예 14-29 중 임의의 하나의 구체예의 방법은 상기 분류에 근거하여 질환 또는 병태를 갖는 환자를 진단하는 것을 더 포함한다.

31.구체예 30의 방법은 상기 분류에 근거하여 진행성 선종을 비롯한 선종을 갖는 환자로 진단하는 것을 더 포함한다.

32.구체예 14-31 중 임의의 하나의 구체예의 방법은 진행성 선종을 비롯한 선종을 갖는 환자로 진단하고, 상기 환자를 절개로 치료하는 단계를 포함한다.

33.구체예 14-31 중 임의의 하나의 구체예의 방법은 상기 환자가 결장직장암을 갖는 것으로 진단하고, 상기 환자를 치료제, 보조제, 신보조제, 화학색전술, 복강내 고열치료 및 이들의 조합으로 구성된 군에서 선택된 치료제의 치료요법적 효과량으로 치료하는 단계를 포함한다.

34.구체예 14-31 중 임의의 하나의 구체예의 방법은 상기 환자가 결장직장암을 갖는 것으로 진단하고, 그리고 상기 환자를 알킬화제, 항대사물질, 토포이소메라제 억제제, 세포독성제, 그리고 이의 조합들의 치료요법적 효과량으로 치료하는 단계를 포함한다.

35.구체예 14-31 중 임의의 하나의 구체예의 방법은 결장직장암을 가진 것으로 상기 환자를 진단하고, 상기 환자를 치료요법적 효과량의 표적화된 치료요법제로 치료하는 단계를 포함한다.

36.구체예 14-31 중 임의의 하나의 구체예의 방법은 결장직장암을 가진 것으로 상기 환자를 진단하고, 상기 환자를 치료요법적 효과량의 면역-치료제로 치료하는 단계를 포함한다.

37.구체예 36의 방법에 있어서, 이때 상기 면역-치료제는 면역 관문 억제제로 구성된 군에서 선택된다.

38.구체예 37의 방법에 있어서, 이때 상기 관문 억제제들은 PD-1-억제제, PD-L1-억제제, CTLA-4-억제제, 그리고 이의 조합들로 구성된 군에서 선택된다.

39.구체예 14-31 중 임의의 하나의 구체예의 방법은 결장직장암을 가진 것으로 상기 환자를 진단하고, 상기 환자를 치료요법적 효과량의 T-세포-관련된 치료제로 치료하는 단계를 포함한다.

40.구체예 39의 방법에 있어서, 이때 상기 T-세포-관련된 치료제는 CAR-T-처리법, TCR-처리법, 그리고 이의 조합들로 구성된 군에서 선택된다.

41.구체예 14-31 중 임의의 하나의 구체예의 방법은 결장직장암을 가진 것으로 상기 환자를 진단하고, 상기 환자를 치료요법적 효과량의 암 백신으로 치료하는 단계를 포함한다.

42.구체예 14-31 중 임의의 하나의 구체예의 방법은 결장직장암을 가진 것으로 상기 환자를 진단하고, 상기 환자를 치료요법적 효과량의 방사능요법으로 치료하는 단계를 포함한다.

43.구체예 42의 방법에 있어서, 이때 상기 방사능요법은 외부 빔-방사능요법 및 내부- 방사능요법, 화학방사선요법, 근접치료(brachytherapy), 그리고 이의 조합들로 구성된 군에서 선택된다.

44.구체예 15-43 중 임의의 하나의 구체예의 방법은 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계, 이때 상기 생물학적 샘플은 하나 또는 그 이상의 당단백질들 또는 글리코펩티드들을 포함하며; 상기 샘플 내 하나 또는 그 이상의 당단백질들 또는 글리코펩티드들을 절단 및/또는 단편화하는 단계; 전이 1-38로 구성된 군에서 선택된 적어도 하나 또는 그 이상의 다중-반응-모니터링(MRM) 전이(들)을 정량화시키는 단계를 포함한다.

45.구체예 44의 방법은 상기 MRM 전이를 입력으로 이용하여 모델을 훈련시키기 위해 기계 학습 알고리즘을 사용하는 단계를 더 포함한다.

46.생물학적 샘플을 분류하는 방법으로, 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계, 이때 상기 생물학적 샘플은 하나 또는 그 이상의 당단백질들 또는 글리코펩티드들을 포함하며; 상기 샘플 내 하나 또는 그 이상의 당단백질들 또는 글리코펩티드들을 절단 및/또는 단편화시키는 단계; 적어도 서열 식별 번호: 1-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들과 연합된 적어도 하나 또는 그 이상의 다중-반응-모니터링(MRM) 전이를 검출 및 정량화시키는 단계; 그리고 출력 확률을 생성하기 위해 훈련된 모델에 정량을 입력하는 단계; 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 상기 생물학적 샘플을 분류하는 단계를 포함한다.

47.구체예 46의 방법은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 적어도 하나 또는 그 이상의 글리코펩티드들과 연합된 적어도 하나 또는 그 이상의 다중-반응-모니터링(MRM) 전이를 검출하고, 정량화시키는 단계를 포함한다.

48.구체예 46의 방법은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 적어도 하나 또는 그 이상의 글리코펩티드들과 연합된 적어도 하나 또는 그 이상의 다중-반응-모니터링(MRM) 전이를 검출하고, 정량화시키는 단계를 포함한다.

49.구체예 46의 방법은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 적어도 하나 또는 그 이상의 글리코펩티드들과 연합된 적어도 하나 또는 그 이상의 다중-반응-모니터링(MRM) 전이를 검출하고, 정량화시키는 단계를 포함한다.

50.구체예 46의 방법은 상기 MRM 전이를 입력으로 이용하여 기계 학습 알고리즘을 훈련시키는 단계를 포함한다.

51.결장직장암 또는 진행성 선종을 비롯한 선종을 갖는 환자를 치료하는 방법에 있어서; 상기 방법은 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 샘플 내 하나 또는 그 이상의 당단백질들 또는 글리코펩티드들을 절단 및/또는 단편화, 또는 절단시켰거나 또는 단편화시켰던 단계; 그리고 전이 1-38로 구성된 군에서 선택된 하나 또는 그 이상의 다중-반응-모니터링(MRM) 전이를 검출 및 정량화시키는 단계; 출력 확률을 생성하기 위해 훈련된 모델에 정량을 입력하고; 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 상기 환자를 분류하는 것을 포함하며, 이때 상기 분류는 다음으로 구성된 군에서 선택된다: (A) 절제가 필요한 환자; (B) 치료제가 필요한 환자; (C) 알킬화제가 필요한 환자; (D) 표적 치료제가 필요한 환자; (E) 면역-치료제가 필요한 환자; (F) 면역 관문 억제제가 필요한 환자; (G) T-세포-관련된 치료가 필요한 환자; (H) 암 백신이 필요한 환자; (I) 방사선 치료가 필요한 환자; (J) 장내시경 검사가 필요한 환자; (K) 또는 이의 조합; 분류 A 또는 K가 결정된 경우, 절제를 수행하거나, 또는 수행하였고; 분류 I 또는 K가 결정된 경우, 방사선 요법을 수행하거나, 또는 수행하였고; 분류 J 또는 K가 결정된 경우, 대장내시경 검사를 수행하거나, 또는 수행하였고; 또는 치료 유효량의 치료제를 이 환자에게 투여하고: 이때 분류 B 또는 K가 결정된 경우 치료제는 치료제들 중에서 선택되며; 또는 이때 분류 C 또는 K가 결정되면, 치료제는 알킬화제 중에서 선택되며; 또는 이때 분류 D 또는 K가 결정되면 표적 치료제 중에서 치료제가 선택되며; 이때 분류 E 또는 K가 결정되면 치료제는 면역치료제에서 선택되며; 이때 분류 F 또는 K가 결정되면 치료제는 면역 관문 억제제에서 선택되며; 이때 분류 G 또는 K가 결정되면 치료제는 T-세포-관련된 치료법에서 선택되며; 그리고 이때 분류 H 또는 K가 결정되면 치료제는 암 백신에서 선택된다.

52.구체예 51의 방법은 상기 생물학적 샘플 상에서 다중-반응-모니터링질량 분광법 (MRM-MS)을 수행하는 단계를 포함한다.

53.구체예 51 또는 52의 방법은 서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 정량화시키는 단계를 포함한다.

54.구체예 51-53 중 임의의 하나의 구체예의 방법은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 정량화시키는 단계를 포함한다.

55.구체예 51-53 중 임의의 하나의 구체예의 방법은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 정량화시키는 단계를 포함한다.

56.구체예 51-53 중 임의의 하나의 구체예의 방법은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 정량화시키는 단계를 포함한다.

57.구체예 51-56 중 임의의 하나의 구체예의 방법은 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드의 양의 정량화를 입력하는 단계를 포함하거나, 또는 모델을 훈련시키기 위해 상기 정량화를 이용하는 단계를 포함한다.

58.구체예 57의 방법에 있어서, 이때 상기 기계 학습 알고리즘은 딥러닝 알고리즘, 신경망 알고리즘, 인공 신경망 알고리즘, 지도 머신 러닝 알고리즘, 선형 판별 분석 알고리즘, 복합 분별 분석 알고리즘, 2차 판별 분석 알고리즘, 서포트 벡터 머신 알고리즘, 선형 기저 함수 커널 서포트 벡터 알고리즘, 방사형 기저함수 커널 지원 벡터 알고리즘, 랜덤 포레스트 알고리즘, 유전자 알고리즘, 최근접 이웃 알고리즘, k-최근접 이웃, 나이브 베이즈(Bayes) 분류 알고리즘, 로지스틱 회귀 알고리즘, 또는 이의 조합으로 구성된 군에서 선택된다.

59.구체예 51-58 중 임의의 하나의 구체예의 방법에 있어서, 이때 전이 1-38로 구성된 군에서 선택된 하나 또는 그 이상의 다중-반응-모니터링(MRM) 전이를 검출 및 정량화하는 단계는 기계 학습 알고리즘으로 탐지된 글리코펩티드 단편들의 피크를 선택하거나, 및/또는 정량화시키는 단계를 포함한다.

60.기계 학습 알고리즘을 훈련시키는 방법은 샘플이 하나 또는 그 이상의 글리코펩티드를 포함하는 글리코펩티드를 포함하는 샘플을 나타내는 MRM 전이 신호의 제1 데이터 세트를 제공하는 단계, 이때 각 글리코펩티드는 게별적으로 서열 식별 번호: 1-38로 필수적으로 구성된 군에서 선택된 아미노산 서열로 구성되며; 대조군 샘플을 나타내는 MRM 전이 신호의 제2 데이터 세트를 제공하는 단계; 그리고 기계 학습 알고리즘을 이용하여 제1 데이터 세트와 제2 데이터 세트를 비교하는 단계를 포함한다.

61.구체예 60의 방법에 있어서, 이때 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 기본적으로 구성된 글리코펩티드를 포함하는 샘플은 결장직장암 또는 진행성 선종을 비롯한 선종을 갖는 환자로부터 취한 샘플이다.

62.구체예 61의 방법에 있어서, 이때 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38로 구성된 군에서 선택된 아미노산 서열로 기본적으로 구성된 글리코펩티드를 포함하는 샘플은 결장직장암 또는 진행성 선종을 비롯한 선종을 갖는 환자로부터 취한 샘플이다.

63.구체예 61의 방법에 있어서, 이때 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33로 구성된 군에서 선택된 아미노산 서열로 기본적으로 구성된 글리코펩티드를 포함하는 샘플은 결장직장암 또는 진행성 선종을 비롯한 선종을 갖는 환자로부터 취한 샘플이다.

64.구체예 61의 방법에 있어서, 이때 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32로 구성된 군에서 선택된 아미노산 서열로 기본적으로 구성된 글리코펩티드를 포함하는 샘플은 결장직장암 또는 진행성 선종을 비롯한 선종을 갖는 환자로부터 취한 샘플이다.

65.구체예 60-64 중 임의의 하나의 구체예의 방법에 있어서, 이때 상기 대조군 샘플은 결장직장암 또는 진행성 선종을 비롯한 선종을 가지고 있지 않는 환자로부터 취한 샘플이다.

66.구체예 60-65 중 임의의 하나의 구체예의 방법에 있어서, 이때 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드를 포함하는 샘플은 결장직장암 또는 진행성 선종을 비롯한 선종을 갖는 한 명 또는 그 이상의 환자로부터 풀링된 샘플이다.

67.구체예 60-66 중 임의의 하나의 구체예의 방법에 있어서, 이때 상기 대조군 샘플은 결장직장암 또는 진행성 선종을 비롯한 선종을 갖지 않는 한 명 또는 그 이상의 환자로부터 풀링된 샘플이다.

68.결장직장암 또는 진행성 선종을 비롯한 선종을 가지고 있는 환자를 진단하는 방법; 상기 방법은 상기 환자로부터 생물학적 샘플을 획득하거나, 또는 획득하였던 단계; 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 검출 및 정령화하기 위해; 또는 전이 1-38로 부터 선택된 하나 또는 그 이상의 MRM 전이를 검출하기 위해, QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 상기 생물학적 샘플의 질량 분광법을 수행하는 단계; 출력 확률을 생성하기 위해 상기 탐지된 글리코펩티드들 또는 MRM 전이의 정량을 훈련된 모델로 입력하고, 출력 확률이 분류 임계값보다 높은 지 아니면 낮은 지 확인하는 단계; 그리고 출력 확률이 분류에 대한 임계값보다 높거나 낮은 지 여부에 기초하여 상기 환자에 대한 진단 분류를 확인하는 단계; 그리고 상기 진단 분류에 기초하여 상기 환자는 결장직장암 또는 진행성 선종을 비롯한 선종을 가지는 것으로 진단하는 단계를 포함한다.

69.구체예 68의 방법에 있어서, 이때 탐지된 글리코펩티드의 분석은 기계 학습 알고리즘을 포함한다.

70.구체예 68의 방법은 상기 MRM 전이를 입력으로 이용하여 기계 학습 알고리즘을 훈련시키는 단계를 포함한다.

71.구체예 68의 방법은 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출 및 정량화시키기 위해 QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 생물학적 샘플의 질량 분광법을 수행하는 단계를 포함한다.

72.구체예 68의 방법은 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출 및 정량화시키기 위해 QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 생물학적 샘플의 질량 분광법을 수행하는 단계를 포함한다.

73.구체예 68의 방법은 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 검출 및 정량화시키기 위해 QQQ 및/또는 qTOF 분광계와 함께 MRM-MS를 이용하여 생물학적 샘플의 질량 분광법을 수행하는 단계를 포함한다.

74.서열 식별 번호: 1-38 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드.

75.서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드.

76.서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드.

77.서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 구성된 글리코펩티드.

78.서열 식별 번호: 1-38, 그리고 이의 조합들로 필수적으로 구성된 군에서 선ㅌ개된 아미노산 서열로 필수적으로 구성된 글리코펩티드.

79.서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 필수적으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드.

80.서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 필수적으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드.

81.서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 필수적으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드.

82.하나 또는 그 이상의 글리코펩티드 표준(들), 완충제, 그리고 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 포함하는 키트.

83.하나 또는 그 이상의 글리코펩티드 표준(들), 완충제, 그리고 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들로 필수적으로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 포함하는 키트.

84.하나 또는 그 이상의 글리코펩티드 표준(들), 완충제, 그리고 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 포함하는 키트.

85.하나 또는 그 이상의 글리코펩티드 표준(들), 완충제, 그리고 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드를 포함하는 키트.

86.검출 하나 또는 그 이상의 MRM 전이(들)에 대하 신경망을 훈련시키는 컴퓨터로-구현되는 방법, 이 방법은 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들의 질량 분광법 스펙트럼 세트를 수집하는 단계; 질량 분석 스펙트럼의 주석이 달린 세트를 생성하기 위해 스펙트럼 또는 스펙트럼의 피크의 출발, 정지, 최대 또는 이들의 조합 중 적어도 하나의 식별을 비롯한 스펙트럼에 주석을 다는 단계; 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들의 수집된 질량 분광법 스펙트럼 세트를 포함하는 제1 훈련 세트, 상기 주석 달린 질량 분광법 스펙트럼 세트, 그리고 질량 분광법 스펙트럼의 제2 세트를 창출하는 단계; 제1 훈련 세트를 이용하여 제1 단계에서 신경망을 훈련시키고; 제1 훈련 단계 이후, 서열 식별 번호: 1-38로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 하나 또는 그 이상의 글리코펩티드들을 포함하는 것으로 잘못 검출된 질량 분광법 스펙트럼을 포함하는 제2 단계의 제2 훈련 세트를 창출하고; 그리고 제2 훈련 세트를 이용하여 제2 단계에서 신경망을 훈련시키는 단계를 포함한다.

87.구체예 86의 방법에 있어서, 이때 상기 하나 또는 그 이상의 글리코펩티드들은 각 경우에 각각 개별적으로 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-2830-31, 및 34-38, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 필수적으로 구성된 글리코펩티드에서 선택된다.

88.구체예 86의 방법에 있어서, 이때 상기 하나 또는 그 이상의 글리코펩티드들은 각 경우들에서 각각 개별적으로 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 기본적으로 구성된다.

89.구체예 86의 방법에 있어서, 이때 상기 하나 또는 그 이상의 글리코펩티드들은 각 경우들에서 각각 개별적으로 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들로 구성된 군에서 선택된 아미노산 서열로 기본적으로 구성된다.

90.구체예 46의 방법은 모델을 훈련시키기 위해 상기 MRM 전이를 입력으로 이용하는 것을 포함한다.

서열목록 전자파일 첨부

Claims

결장직장암 (CRC) 또는 진행성 선종 (AA)과 연합된 다수의 병태에 대래 대상체로부터 획득된 생물학적 샘플을 분류하는 방법에 있어서, 상기 방법은
상기 생물학적 샘플 내 단백질 세트에 상응하는 펩티드 구조 데이터를 수용하는 단계;
상기 정량화 데이터에 근거하여 질환 표시자를 확인하도록 훈련된 기계-학습 모델로 펩티드 구조 세트에 대한 펩티드 구조 데이터로부터 확인된 정량화 데이터를 입력하는 단계, 이때 펩티드 구조 세트를 표 10의 다수의 펩티드 구조로부터 확인된 적어도 하나의 펩티드 구조를 포함하고;
상기 기계-학습 모델에 의해 상기 질환 표시자를 확인하는 단계; 그리고
확인된 질환 표시자를 기반으로 하여 CRC 또는 AA와 연합된 다수의 병태에 대해 상기 생물학적 샘플을 분류하는 단계를 포함하는, 방법.
대상체에서 결장직장암 (CRC) 또는 진행성 선종 (AA)의 존재를 검출하는 방법에 있어서, 상기 방법은
대상체로부터 획득한 생물학적 샘플에서 단백질 세트에 상응하는 펩티드 구조 데이터를 수용하는 단계, 이때 상기 펩티드 구조 데이터는 표 10의 적어도 하나의 펩티드 구조를 포함하고;
상기 정량화 데이터에 근거하여 질환 표시자를 확인하도록 훈련된 기계-학습 모델로 펩티드 구조 세트에 대한 펩티드 구조 데이터로부터 확인된 정량화 데이터를 입력하는 단계; 그리고
상기 확인된 질환 표시자가 CRC 또는 AA와 연합된 선택된 범위 내에 있다는 결정에 응답으로 CRC 또는 AA의 존재를 검출하는 단계를 포함하는, 방법.
청구항 1 또는 2에 있어서, 이때 상기 단백질 세트는 하나 또는 그 이상의 당단백질들을 포함하는, 방법.
청구항 1-3 중 임의의 한 항에 있어서, 이때 상기 적어도 하나의 펩티드 구조는 글리코펩티드를 포함하는, 방법.
청구항 1-4 중 임의의 한 항에 있어서, 이때 상기 다수의 상태는 CRC 상태, AA 상태, 또는 건강한 상태 중 적어도 하나의 상태를 포함하는, 방법.
청구항 1-5 중 임의의 한 항에 있어서, 이때 상기 기계-학습 모델은 정규화된 회귀 모델을 포함하는, 방법.
청구항 1-6 중 임의의 한 항에 있어서, 이때 상기 정규화된 회귀 모델은 적어도 절대 수축 및 선택 연산자 (LASSO) 회귀 모델을 포함하는, 방법.
청구항 1-7 중 임의의 한 항에 있어서, 이때 펩티드 구조 세트의 펩티드 구조에 대한 정량화 데이터는 풍도, 상대적 풍도, 정규화된 풍도, 또는 차등 풍도 중 적어도 하나를 포함하는, 방법.
청구항 1-8 중 임의의 한 항에 있어서, 이때 펩티드 구조 세트의 펩티드 구조에 대한 정량화 데이터는 상대적 양, 조정된 양, 정규화된 양, 상대적 농도, 조정된 농도, 또는 정규화된 농도 중 적어도 하나를 포함하는, 방법.
청구항 1-9 중 임의의 한 항에 있어서, 이때 상기 정량화 데이터는 액체 크로마토그래피-질량 분석법 (LC-MS) 시스템을 이용하여 생성되는, 방법.
청구항 1-10 중 임의의 한 항에 있어서, 이때 the 펩티드 구조 데이터는 다중 반응 모니터링 질량 분광계 (MRM-MS)를 이용하여 생성되는, 방법.
청구항 1-11 중 임의의 한 항에 있어서, 이때 상기 기계-학습 모델은 대상체의 생물학적 샘플이 복수의 상태 중 어느 상태에 해당하는지 결정하기 위해, 펩티드 구조 패널의 하위 세트인 펩티드 구조 세트에 상응하는 정량화 데이터의 일부를 활용하여 훈련되었던, 방법.
청구항 1-12 중 임의의 한 항에 있어서, 다음을 더 포함하는, 방법:
다수 대상체에 대한 정량화 데이터를 사용하여, 차등 발현 분석을 수행하는 단계.
청구항 1-13 중 임의의 한 항에 있어서, 이때 상기 생물학적 샘플은 혈액, 혈청, 혈장, 또는 대변 중 적어도 하나를 포함하는, 방법.
대상체에서 결장직장암 (CRC) 또는 진행성 선종 (AA)를 치료하는, 다음을 포함하는 방법:
대상체로부터 획득한 생물학적 샘플에서 단백질 세트에 상응하는 펩티드 구조 데이터를 수용하는 단계, 이때 상기 펩티드 구조 데이터는 표 10의 적어도 하나의 펩티드 구조를 포함하고;
상기 정량화 데이터에 근거하여 CRC 또는 AA에 대한 질환 표시자를 생성시키기 위해 훈련된 기계-학습 모델로 상기 적어도 하나의 펩티드 구조에 대한 정량화 데이터를 입력하는 단계;
상기 기계-학습 모델에 의해 상기 질환 표시자를 확인하는 단계; 그리고
상기 질환 표시자를 기반으로 하여 CRC 또는 AA를 치료하기 위해 본원에 기재된 다수의 치료 방식중 적어도 하나를 선택하는 단계.
대상체에서 결장직장암 (CRC) 또는 진행성 선종 (AA)을 치료하는 방법에 있어서, 다음을 포함하는, 방법:
상기 생물학적 샘플 내 단백질 세트에 상응하는 펩티드 구조 데이터를 수용하는 단계;
상기 정량화 데이터에 근거하여 질환 표시자를 확인하도록 훈련된 기계-학습 모델로 펩티드 구조 세트에 대한 펩티드 구조 데이터로부터 확인된 정량화 데이터를 입력하는 단계, 이때 펩티드 구조 데이터는 표 10의 다수의 펩티드 구조로부터 확인된 적어도 하나의 펩티드 구조를 포함하며;
상기 기계-학습 모델에 의해, 상기 질환 표시자를 확인하는 단계;
확인된 질환 표시자에 기초하여 CRC 또는 AA에 대한 분류를 결정하는 단계;
상기 분류에 기초하여 CRC 또는 AA를 치료하기 위해 다수의 치료 방식 중 적어도 하나를 선택하는 단계; 그리고
상기 분류에 기초하여 CRC 또는 AA를 치료하기 위해 다수의 치료 방식 중 적어도 하나를 투여하는 단계.
청구항 15 또는 16에 있어서, 이때 상기 단백질 세트은 하나 또는 그 이상의 당단백질들을 포함하는, 방법.
청구항 15-17 중 임의의 한 항에 있어서, 선택된 치료 방식을 상기 대상체에게 투여하는 것을 더 포함하는, 방법.
결장직장암 (CRC) 또는 진행성 선종 (AA)을 가진 개체를 진단하는 방법에 있어서, 이 방법은 다음을 포함하는 방법:
표 10의 적어도 하나의 펩티드 구조의 존재 또는 양을 검출하는 단계;
분류 라벨을 생성하도록 훈련된 기계-학습 모델로 상기 탐지된 적어도 하나의 펩티드 구조에 대한 정량을 입력하는 단계;
상기 분류 라벨이 분류를 위한 임계 값보다 높은 지 또는 낮은 지를 결정하는 단계;
상기 분류 라벨이 분류를 위한 임계값보다 높은 지 또는 낮은 지에 기초하여 해당 개체의 진단 분류를 확인하는 단계; 그리고
상기 진단 분류에 기초하여 상기 개체가 CRC 또는 AA를 보유하는 지를 진단하는 단계.
청구항 1-19 중 임의의 한 항에 있어서, 이때 상기 정량화 데이터는 액체 크로마토그래피-질량 분석법 (LC-MS) 시스템을 이용하여 생성되는, 방법.
청구항 1-20 중 임의의 한 항에 있어서, 이때 상기 펩티드 구조 데이터는 다중 반응 모니터링 질량 분광계 (MRM-MS)를 이용하여 생성되는, 방법.
청구항 1-21 중 임의의 한 항에 있어서, 이때 상기 적어도 하나의 펩티드 구조의 양은 존재하지 않거나, 또는 검출 한계 이하인, 방법.
청구항 1-22 중 임의의 한 항에 있어서, 이때 상기 CRC는 초기-단계 또는 후기-단계 CRC 중 하나인, 방법.
청구항 1-23 중 임의의 한 항에 있어서, 이때 상기 CRC는 단계 I CRC, 단계 II CRC, 단계 III CRC, 또는 단계 IV CRC 중 하나인, 방법.
청구항 1-24 중 임의의 한 항에 있어서, 이때 상기 적어도 하나의 펩티드 구조는 표 10에서 확인된 세 가지 또는 그 이상의 펩티드 구조를 포함하는, 방법.
청구항 1-25 중 임의의 한 항에 있어서, 이때 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나의 펩티드를 포함하는, 방법.
청구항 1-26 중 임의의 한 항에 있어서, 이때 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 5 및/또는 서열 식별 번호: 6에서 제시된 서열을 포함하는 적어도 하나의 펩티드를 포함하는, 방법.
청구항 1-27 중 임의의 한 항에 있어서, 이때 상기 대상체는 CRC와 연합된 하나 또는 그 이상의 위험 인자들을 보유하는, 방법.
청구항 1-28 중 임의의 한 항에 있어서, 이때 상기 개체는 건강한 상태를 가지고 있는 것으로 결정되었으며, 이때 건강한 상태는 CRC 또는 AA의 부재를 포함하는, 방법.
청구항 1-29 중 임의의 한 항에 있어서, 이 대상체에 대해 검출된 해당 상태에 기초한 진단이 내포된 보고서를 생성하는 단계를 더 포함하는, 방법.
결장직장암 (CRC) 또는 진행성 선종 (AA)과 연합된 다수의 상태 중 하나를 가진 대상세츨 진단하기 위해 모델을 훈련시키는 방법에 있어서, 다음을 포함하는, 방법:
CRC 또는 AA와 연합된 다수의 병태를 갖는 것으로 진단된 대상체들의 다수에 대한 펩티드 구조에 대한 정량화 데이터를 제공받는 단계;
상기 정량화 데이터를 기반으로 상기 대상체의 생물학적 샘플 내 다수의 병태를 결정하도록 기계-학습 모델을 훈련시키는 단계.
청구항 31에 있어서, 이때 다수의 상태를 결정하도록 상기 기계-학습 모델의 훈련은 다수의 상태에 대한 분류 라벨을 생성시키도록 상기 기계-학습 모델을 훈련시키는 단계를 포함하는, 방법.
청구항 31 또는 청구항 32에 있어서, 이때 상기 다수의 상태는 CRC 상태, AA 상태, 또는 건강한 상태 중 적어도 하나의 상태를 포함하는, 방법.
청구항 31-33 중 임의의 한 항에 있어서, 이때 상기 기계-학습 모델은 정규화된 회귀 모델을 포함하는, 방법.
청구항 31-34 중 임의의 한 항에 있어서, 이때 상기 정규화된 회귀 모델은 적어도 절대 수축 및 선택 연산자 (LASSO) 회귀 모델을 포함하는, 방법.
청구항 1-35 중 임의의 한 항에 있어서, 이때 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나, 적어도 두 개, 적어도 세 개, 적어도 다섯 개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 또는 적어도 35개의 상이한 펩티드를 포함하는, 방법.
청구항 1-35 중 임의의 한 항에 있어서, 이때 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나, 적어도 두 개, 적어도 세 개, 또는 적어도 다섯 개의 상이한 펩티드를 포함하는, 방법.
청구항 1-35 중 임의의 한 항에 있어서, 이때 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나, 적어도 두 개, 적어도 세 개, 적어도 다섯 개, 적어도 10개의 상이한 펩티드를 포함하는, 방법.
청구항 1-35 중 임의의 한 항에 있어서, 이때 상기 적어도 하나의 펩티드 구조는 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38 중 임의의 하나에서 제시된 서열을 포함하는 적어도 하나, 적어도 두 개, 적어도 세 개, 적어도 다섯 개, 적어도 10개, 적어도 15개, 또는 적어도 20개의 상이한 펩티드를 포함하는, 방법.
청구항 1-39 중 임의의 한 항에 있어서, 이때 상기 적어도 하나의 펩티드 구조는 펩티드 서열 및 글리칸 구조를 포함하며, 이때 상기 글리칸 구조는 표 10에 따른 펩티드 서열에서 연계 부위 위치에 부착되는, 방법.
청구항 40에 있어서, 이때 상기 펩티드 서열의 글리칸 구조는 표 10에 따른 글리칸 구조 GL 번호에 상응하며, 이때 상기 글리칸 구조는 표 10, 표 11A, 및 표 11B에 따른 글리칸 구조 GL 번호에 따른 심볼 구조를 포함하는, 방법.
청구항 40 또는 청구항 41에 있어서, 이때 펩티드 서열의 글리칸 구조는 표 10에 따른 글리칸 구조 GL 번호에 상응하며, 이때 상기 글리칸 구조는 표 10, 표 11A, 및 표 11B에 따른 글리칸 구조 GL 번호에 따른 심볼 조성을 포함하는, 방법.
청구항 40-42 중 임의의 한 항에 있어서,
이때 표 11A의 글리칸 구조의 가장 오른쪽 N-아세틸갈락토사민은 표 10에 따른 펩타이드 서열의 연결 부위 위치에 부착되고, 그리고
이때 표 11B의 글리칸 구조의 가장 알 N-아세틸글루코사민은 표 10에 따른 펩타이드 서열의 연결 부위 위치에 부착되는, 방법.
표 10의 하나 또는 그 이상의 펩티드 구조를 포함하는 조성물.
청구항 44에 있어서, 이때 상기 하나 또는 그 이상의 펩티드 구조는 펩티드 서열 및 글리칸 구조를 포함하며, 이때 상기 글리칸 구조는 표 10에 따른 펩티드 서열에서 연계 부위 위치에 부착되는, 방법.
청구항 45에 있어서, 이때 상기 펩티드 서열의 글리칸 구조는 표 10에 따른 글리칸 구조 GL 번호에 상응하며, 이때 상기 글리칸 구조는 표 10, 표 11A, 및 표 11B에 따른 글리칸 구조 GL 번호에 따른 심볼 구조를 포함하는, 조성물.
청구항 45 또는 청구항 46에 있어서, 이때 펩티드 서열의 글리칸 구조는 표 10에 따른 글리칸 구조 GL 번호에 상응하며, 이때 상기 글리칸 구조는 표 10, 표 11A, 및 표 11B에 따른 글리칸 구조 GL 번호에 따른 심볼 조성을 포함하는, 조성물.
청구항 45-47 중 임의의 한 항에 있어서,
이때 표 11A의 글리칸 구조의 가장 오른쪽 N-아세틸갈락토사민은 표 10에 따른 펩타이드 서열의 연결 부위 위치에 부착되고, 그리고
이때 표 11B의 글리칸 구조의 가장 알 N-아세틸글루코사민은 표 10에 따른 펩타이드 서열의 연결 부위 위치에 부착되는, 방법.
서열 식별 번호: 1-38에서 제시된 서열을 포함하는 하나 또는 그 이상의 펩티드들을 포함하는 조성물.
청구항 49에 있어서, 이때 상기 하나 또는 그 이상의 펩티드들은 서열 식별 번호: 5 및/또는 서열 식별 번호: 6에서 제시된 서열을 포함하는, 조성물.
청구항 49 또는 청구항 50에 있어서, 이때 상기 하나 또는 그 이상의 펩티드들은 하나 또는 그 이상의 글리코펩티드들을 포함하는, 조성물.
하나 또는 그 이상의 글리코펩티드 표준(들), 완충제, 그리고 서열 식별 번호: 1-38에서 제시된 서열을 포함하는 하나 또는 그 이상의 펩티드들을 포함하는 키트.
청구항 52에 있어서, 이때 상기 하나 또는 그 이상의 펩티드들은 서열 식별 번호: 5 및/또는 서열 식별 번호: 6에서 제시된 서열을 포함하는, 키트.
하나 또는 그 이상의 글리코펩티드 표준(들), 완충제, 그리고 서열 식별 번호: 5, 8-11, 13-14, 16-22, 26-28, 30-31, 및 34-38, 그리고 이의 조합들에서 제시된 서열을 포함하는 하나 또는 그 이상의 펩티드들을 포함하는 키트.
하나 또는 그 이상의 글리코펩티드 표준(들), 완충제, 그리고 서열 식별 번호: 3, 7, 9, 28, 29, 32, 및 33, 그리고 이의 조합들에서 제시된 서열을 포함하는 하나 또는 그 이상의 펩티드들을 포함하는 키트.
하나 또는 그 이상의 글리코펩티드 표준(들), 완충제, 그리고 서열 식별 번호: 1-4, 6-7, 12, 15, 23-25, 28, 29, 및 32, 그리고 이의 조합들에서 제시된 서열을 포함하는 하나 또는 그 이상의 펩티드들을 포함하는 키트.
결장직장암 (CRC) 또는 진행성 선종 (AA)과 연합된 다수의 병태에 대래 대상체로부터 획득된 생물학적 샘플을 분류하는 방법에 있어서, 다음을 포함하는 방법:
상기 생물학적 샘플로부터 획득된 질량 분광법 (MS) 정량화 데이터를 수용하는 단계,
이때 상기 정량화 데이터는 표 9의 하나 또는 그 이상의 단백질로부터 유래된 하나 또는 그 이상의 펩티드 각각과 연합된 정량화 수준을 포함하고;
상기 MS 정량화 데이터를 기계-학습 모델로 입력하는 단계,
이때 상기 기계-학습 모델은 CRC를 갖는, AA를 갖는, 또는 CRC 또는 AA를 갖지 않는 것으로 특징화된 훈련 샘플들로부터 정량화 데이터를 포함하는 하나 또는 그 이상의 훈련 MS 정량화 데이터에 기초하여 훈련되며,
이때, 각 훈련 샘플의 경우, 상기 연합된 훈련 MS 정량화 데이터는 표 9의 하나 또는 그 이상의 단백질로부터 유래된 하나 또는 그 이상의 펩티드들 각각과 연합된 정량화 수준을 포함하고; 그리고
CRC 또는 AA와 연합된 다수의 상태에 대해 상기 생물학적 샘플을 분류하는 단계.
청구항 57에 있어서, 이때 상기 생물학적 샘플은 CRC를 보유하는 것으로 분류된, 방법.
청구항 57에 있어서, 이때 상기 생물학적 샘플은 AA를 보유하는 것으로 분류된, 방법.
청구항 57에 있어서, 이때 상기 생물학적 샘플은 CRC 또는 AA를 보유하지 않는 것으로 분류된, 방법.
청구항 57에 있어서, 이때 CRC 또는 AA를 보유하지 않는 것으로 특징화된 훈련 샘플 중 적어도 하나는 건강한 대상체로부터 획득된, 방법.
청구항 57-61 중 임의의 한 항에 있어서, 이때 상기 MS 정량화 데이터는 펩티드 서열 정보를 포함하는, 방법.
청구항 57-62 중 임의의 한 항에 있어서, 이때 상기 MS 정량화 데이터는 해독-후 변형 정보를 포함하는, 방법.
청구항 63에 있어서, 이때 상기 해독-후 변형 정보는 글리칸 정보를 포함하는, 방법.
청구항 57-64 중 임의의 한 항에 있어서, 이때 상기 MS 정량화 데이터는 표 9의 모델 1 또는 모델 2의 각 단백질로부터 유래된 하나 또는 그 이상의 펩티드와 연합된 정량화 수준을 포함하는, 방법.
청구항 57-64 중 임의의 한 항에 있어서, 이때 상기 MS 정량화 데이터는 표 10의 하나 또는 그 이상의 펩티드들과 연합된 정량화 수준을 포함하는, 방법.
청구항 57-64 중 임의의 한 항에 있어서, 이때 상기 MS 정량화 데이터는 표 9의 모델 1 또는 모델 2의 각 단백질로부터 유래된 적어도 하나의 펩티드와 연합된 정량화 수준을 포함하는, 방법.
청구항 57-67 중 임의의 한 항에 있어서, 이때 상기 펩티드의 정량화 수준은 상기 펩티드의 부재를 반영하는, 방법.
청구항 57-68 중 임의의 한 항에 있어서, 이때 상기 MS 정량화 데이터는 표 9의 모델 1 또는 모델 2의 각 단백질로부터 유래된 하나 또는 그 이상의 펩티드와 연합된 정량화 수준을 포함하는, 방법.
청구항 57-69 중 임의의 한 항에 있어서, 이때 상기 MS 정량화 데이터는 표 10의 하나 또는 그 이상의 펩티드들과 연합된 정량화 수준을 포함하는, 방법.
청구항 57-70 중 임의의 한 항에 있어서, 이때 상기 MS 정량화 데이터는 MS 기술을 사용하여 생물학적 샘플 또는 그 파생물을 분석하여 획득하는, 방법.
청구항 71에 있어서, 이때 상기 MS 기술은 MRM 기술인, 방법.
대상체로부터 획득된 생물학적 샘플의 글리코펩티드 프로파일을 결정하는 방법에 있어서,
이때 상기 글리코펩티드 프로파일은 표 9의 하나 또는 그 이상의 단백질로부터 유래된 하나 또는 그 이상의 펩티드들과 연합된 정량화 수준에 기초하며;
다음을 포함하는, 방법:
질량 분광계 (MS) 정보를 획득하기 위해 생물학적 샘플 또는 이의 유도체를 표 9의 하나 또는 그 이상의 단백질로부터 유래된 하나 또는 그 이상의 펩티드를 평가하도록 구성된 MS 기술에 적용시키는 단계;
상기 MS 정보에 기초하여 표 9의 하나 또는 그 이상의 단백질로부터 유래된 하나 이상의 펩티드와 연관된 정량 수준을 결정하는 단계; 그리고
표 9의 하나 또는 그 이상의 단백질로부터 유래된 하나 또는 그 이상의 펩티드들과 연합된 정량화 수준에 근거하여 상기 글리코펩티드 프로파일을 결정하는 단계.
질량 분광법 분석을 수행하는 방법에 있어서, 생물학적 샘플 또는 이의 유도체를 표 9의 하나 또는 그 이상의 단백질로부터 유래된 하나 또는 그 이상의 펩티드를 평가하도록 구성된 질량 분광계 (MS) 기술에 적용시키는 단계를 포함하는 방법.
청구항 74에 있어서, 이때 상기 MS 기술은 표적화된 MS 기술인, 방법.
청구항 75에 있어서, 상기 표적화된 MS 기술은 MRM 기술인, 방법.
대상체에서 결장직장암 (CRC) 또는 진행성 선종 (AA)을 치료하는 방법에 있어서, 다음을 포함하는, 방법:
CRC 또는 AA과 연합된 다수의 상태에 대해 대상체를 분류하는 단계; 그리고
상기 분류에 근거하여 상기 대상체에게 치료 섭생을 투여하는 단계.
개체의 결장직장 건강을 평가하는 방법에 있어서, 다음을 포함하는, 방법:
결장직장암 (CRC) 또는 진행성 선종 (AA)과 연합된 다수의 상태에 대해 상기 대상체의 생물학적 샘플을 분류하는 단계.
청구항 78에 있어서, 이때 상기 분류는 상기 대상체가 대장내시경 검사를 받아야 할 필요성을 나타내는, 방법.
청구항 57-79 중 임의의 한 항에 있어서, 이때 상기 하나 또는 그 이상의 펩티드들은 서열 식별 번호: 5 및/또는 서열 식별 번호: 6에서 제시된 서열을 포함하는, 방법.