KR20230079354A - 단백질 또는 프로테옴의 존재 및/또는 농도 및/또는 양을 확인하는 방법 - Google Patents

단백질 또는 프로테옴의 존재 및/또는 농도 및/또는 양을 확인하는 방법 Download PDF

Info

Publication number
KR20230079354A
KR20230079354A KR1020237008713A KR20237008713A KR20230079354A KR 20230079354 A KR20230079354 A KR 20230079354A KR 1020237008713 A KR1020237008713 A KR 1020237008713A KR 20237008713 A KR20237008713 A KR 20237008713A KR 20230079354 A KR20230079354 A KR 20230079354A
Authority
KR
South Korea
Prior art keywords
amino acid
protein
sample
labeled
interest
Prior art date
Application number
KR1020237008713A
Other languages
English (en)
Inventor
엠마 빅토리아 예이츠
Original Assignee
프로테오타입 다이어그노스틱스 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프로테오타입 다이어그노스틱스 리미티드 filed Critical 프로테오타입 다이어그노스틱스 리미티드
Publication of KR20230079354A publication Critical patent/KR20230079354A/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6806Determination of free amino acids
    • G01N33/6809Determination of free amino acids involving fluorescent derivatizing reagents reacting non-specifically with all amino acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6818Sequencing of polypeptides
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6842Proteomic analysis of subsets of protein mixtures with reduced complexity, e.g. membrane proteins, phosphoproteins, organelle proteins
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • G01N2021/6439Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 개시내용은 샘플에서 2 개 이상의 표지된 아미노산 유형의 측정된 표지, 아미노산 농도, 또는 아미노산 수에 기반하여 샘플 내에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 방법에 관한 것이다.

Description

단백질 또는 프로테옴의 존재 및/또는 농도 및/또는 양을 확인하는 방법
본 발명은 샘플 내에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체(subproteome), 또는 단백체(proteome)의 존재 및/또는 농도 및/또는 양을 식별하는 방법에 관한 것이다.
단백질은 아미노산의 서열로 구성된 생물학적 중합체이다. 단백체학(Proteomics)은 단백질에 대한 대규모 연구이다. 이는 단백질의 식별 및 정량화를 허용한다. 단백체학 분야 내에서, 샘플 내 단백질의 존재 및 부재를 식별하는 여러 확립된 방법이 있다. 샘플 내에서 하위단백체 또는 단백체의 존재 또는 부재의 식별은 모든 단백질의 순차적 식별을 수반하므로 어렵다. 일부 단백체학 방법은 샘플 내에서 단백질의 농도 또는 양의 정량화를 허용한다.
샘플에서 단백질의 존재를 식별하는 가장 통상적인 방법은 질량 분광법이다. 질량 분광법은 샘플에 존재하는 이온의 질량 대 전하 비율을 측정한다. 샘플의 질량 스펙트럼은 질량 대 전하 비율의 함수로서 이온 신호의 플롯이다. 스펙트럼은 샘플의 동위원소 서명 및 입자의 질량을 결정하는 데 사용되며, 화학적 정체성 또는 화학적 화합물의 구조를 제공하는 데 사용된다. 그러나, 질량 분광법은 노동 집약적이고 상이한 펩티드가 상이한 효율로 이온화되고 검출되기 때문에 본질적으로 정량적이지 않다. 이것을 방지하기 위해, 동위원소-코딩된 친화성 태그(ICAT)와 같은 접근법이 사용되지만, 이는 식별된 단백질의 분획만 정량화한다. 가장 정량적인 질량 분광법 접근법은 샘플의 절대적 정량화가 아닌, 샘플에 걸친 단백질 농도 또는 양의 상대적 변화만을 측정하게 한다. 질량 분광법 단백체학은 또한 특히 고등 유기체의 경우 적용범위가 제한된다. 전체 단백질을 분석하는 '하향식(Top down)' 질량 분광법 단백체학은 연구된 단백질의 10%에 대해서만 단백질 식별을 허용하고, 단편으로 소화된 단백질을 분석하는 '상향식(bottom up)' 질량 분광법 단백체학은 연구된 단백질의 8-25%에 대해서 단백질 식별을 허용한다. 수득된 질량 스펙트럼의 복잡성으로 인해, 혼합물 및 복합체 샘플은 질량 분광법으로 순차적으로 분석될 수 있기 전에, 예를 들어 2-차원 겔 전기영동 또는 고성능 액체 크로마토그래피(HPLC)에 의해 그들의 구성요소를 분리해야 한다.
단백질의 존재를 식별하는 대안적인 접근법은 단백질 마이크로어레이(microarray)를 사용하는 것이다. 단백질 마이크로어레이는 지지체 표면에 단백질의 어레이, 또는 프로브의 어레이를 고정하며 특히 다중화 검출에 적합하다. 태그된 프로브 또는 태그된 단백질은 어레이에 첨가되고 단백질과 프로브 사이의 결합 상호작용이 검출된다. 그러나, 단백질 마이크로어레이는 노동 집약적이고 재현성 및 정확도 부족을 겪는다. 검출은 표면 근처에서 결합 이벤트가 필요하며, 따라서, 결합 이벤트 및 이에 따른 검출의 정확도는 표면에 의해 영향을 받을 수 있다. 더욱이, 특이적 항체와 같이 상응하는 프로브가 이미 있는 단백질만이 이 방법에 의해 식별될 수 있다.
Zhang , "Top-down proteomics on a microfluidic platform"(2019), eprint 1910.11861 arXiv physics.bio-ph와 같은 여러 방법은 단백질의 물리적 파라미터 특징을 통해 단백질을 식별하는 것을 목표로 한다. 이 미세유체 방법에서, 용액 내 크기인 단백질의 유체역학적 반경(RH)은 단백질 식별을 위한 단백질 내의 Trp/Lys 및 Tyr/Lys 잔기의 형광 신호의 비율로 사용된다. 리신(Lys) 잔기는 형광으로 표지되고 트립토판(Trp) 및 티로신(Tyr) 잔기는 표지되지 않는다. 7 개의 알려진 단백질을 4 번 측정하고, 단백질을 4 번째로 측정하여 수득된 값이 단백질을 다른 3 번 측정하여 수득된 값과 일치할 때 단백질이 식별된다. 측정된 값은 측정된 단백질이 이러한 값에 기반하여 서로 구별가능하다는 점에서 실험 조건 세트 하에 알려진 단백질의 특성인 것으로 보이지만, 관심 단백질에 대해 어떤 값도 예측할 수 없다. RH는 알려져 있지 않고 종종 부분적인 본질적 무질서가 있는 아미노산 서열에 대해 예측할 수 없다. 당업자는 트립토판 및 티로신 잔기로부터의 고유한 형광이 아미노산 서열로부터 현재 예측할 수 없는 단백질 구조 내의 트립토판 및 티로신 잔기를 둘러싸는 국소 물리적 환경에 복잡한 방식으로 의존함을 인식한다. 따라서, RH, Trp 및 Tyr 신호는 용액 조건에 따라 모두 변경될 것이며, 예를 들어 단백질을 상이한 완충액에 두는 경우 또는 또 다른 생체분자와 상호작용하는 경우 동일한 단백질에 대한 상이한 판독값이 수득될 것이다. 단백질 식별에 사용되는 어떤 값도 단백질 양 또는 농도에 대한 정보를 제공하지 않았기 때문에, 방법은 단백질 정량화를 허용하지 않는다. 수득한 결과의 예측할 수 없는 속성으로 인해, 이 방법을 사용하여 단백질의 혼합물 또는 단백체를 분석하는 것은 가능하지 않다.
대안적으로, 최신 기술은 Swaminathan, J Nat Biotechnology 36, 1076-1082(2018)와 같은 새로 개발된 단백질 서열분석 방법을 포함한다. 희박 플루오로시퀀싱은 표면에 고정화하기 전에 특이적 아미노산에 형광으로 표지된 단일 펩티드 단편 분자에 대해 고전적인 Edman 분해 서열분석을 수행하고 형광으로 표지된 아미노산이 펩티드 N-말단으로부터 순차적으로 절단되는 경우 표면으로부터 형광 소실 패턴을 관찰한다. 형광 감소 패턴은 판독되는 펩티드 내의 표지된 아미노산의 위치를 나타내고 희박 펩티드 서열을 제공한다. 이러한 희박 펩티드 서열은 프로테아제 절단 특이성, 표면 부착 화학, 표지화 화학, 및 관심 단백질에 대해 예측된 펩티드 단편 내의 표지된 아미노산의 위치의 정보가 풍부한 제약 조건에 기반하여 관심 단백질에 대해 예측할 수 있다. 실질적으로, 이 노동 및 데이터 집약적 방법은 다양한 출처로부터 오류가 발생하기 쉽고 정확한 판독은 단일 정제된 펩티드에 대한 시간의 대략 40%에서 관찰된다. 정량화는 이 방법에 대해 평가되지 않았다. 방법은 모든 리신 및 모든 시스테인 아미노산과 같은 모든 아미노산이 서열분석을 수행하기 전에 각 펩티드 단편 내에서 정량적으로 형광으로 표지되는지 먼저 확인하기 위해 HPLC 및/또는 질량 분광법과 같은 크로마토그래픽 분리 방법에 대한 커플링에 의존한다. 2-구성요소 혼합물 내의 펩티드 단편이 식별되었지만, 이는 펩티드 단편이 표면 상의 상이한 위치에서 표면 부착을 통해 서로 공간적으로 분리되는 것을 요구하므로, 뚜렷한 형광 소실 흔적이 각 펩티드에 대해 관찰될 수 있다. 전통적인 Edman 서열분석과 마찬가지로, 이 방법은 하나의 Edman 주기에 1 시간이 필요함에 따라 느리며, N-말단으로 변형된 펩티드의 분석에 적합하지 않고, 30 개 초과 아미노산 길이의 펩티드 단편을 판독하는 데 적합하지 않다. Edman 서열분석에 대한 의존으로 인해, 이 방법은 긴 단백질 분자보다 짧은 펩티드의 식별에 더 적합한 것으로 인정된다. 인간 단백체 내의 단백질 분자의 평균 길이는 558 개 아미노산이다. 이 방법을 사용하여 단백질의 혼합물 또는 단백체를 분석하는 것은 가능하지 않다.
전체 단백질을 관심 단백질로서 식별하는 것을 허용하는 질량-분광법 기반 단백질 식별에 대한 간단하고 일반적인 대안을 개발할 필요성이 인식되고 있다. 단백질의 복합체 혼합물, 예를 들어 질환-연관된 단백질의 혼합물을 특성화하는 효율적인 방법에 대한 필요성이 인식되고 있다. 임의의 감염을 진단하는 빠르고 일반적인 방법에 대한 많은 필요성이 있다. 바람직하게는 이들 방법은 단백질 정량화를 가능하게 할 것이다. 따라서, 샘플 내에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하기 위한 보다 효율적이고 비용 효과적이고 일반적인 방법에 대한 필요성이 있다.
본 발명은 샘플에서 2 개 이상의 아미노산 유형을 표지하고 측정하는 것이 샘플에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별할 수 있다는 발견에 기반한다. 이는 샘플에서 각 표지된 아미노산 유형의 측정된 수준, 아미노산 농도, 또는 아미노산 수에 기반한다.
각 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체는 각 농도에서 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 2 개 이상의 아미노산 유형의 표지 값, 아미노산 농도, 또는 아미노산 수에 기반한 고유한 서명을 가지고 있음이 발견되었다.
단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 2 개 이상의 아미노산 유형 각각의 표지 값 또는 아미노산 농도의 서명은 각 농도에서 각 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대해 고유하다. 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 2 개 이상의 아미노산 유형 각각의 아미노산 수의 서명은 또한 각 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대해 고유하다.
따라서, 샘플의 서명은 샘플에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하기 위해 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 서명과 비교될 수 있다.
관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도의 서명은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도의 함수이고, 각 농도에서 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대해 고유하다. 따라서, 샘플에서 2 개 이상의 아미노산 유형의 측정된 표지 값 또는 아미노산 농도는 샘플에서 해당 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양의 적극 식별(positive identification)을 제공하기 위해 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도와 비교될 수 있다. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 2 개 이상의 아미노산 유형의 아미노산 수의 서명은 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대해 고유하다. 따라서, 샘플에서 2 개 이상의 아미노산 유형 각각의 아미노산 수는 샘플에 존재하는 적극 식별을 제공하기 위해 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 아미노산 수와 비교될 수 있다.
일부 구현예에서, 이 비교는 n-차원 공간을 사용하여 시각화될 수 있으며, 여기서 차원의 수는 본 발명의 방법에서 표지되고 측정된 n 개의 아미노산 유형의 수와 동일하다. 예를 들어, 2 개의 표지된 아미노산 유형은 2-차원 공간에서 시각화되고, 3 개의 표지된 아미노산 유형은 3-차원 공간에서 시각화된다. 이 차원 공간은 각각의 추가적인 아미노산 유형이 샘플에서 표지되고 측정됨에 따라 증가한다. 2 개 이상의 아미노산 유형의 아미노산 농도 또는 표지 값은 n-차원 공간에서 선을 차지한다. 2 개 이상의 아미노산 유형 각각의 아미노산 수는 n-차원 공간에서 점을 차지한다. 샘플에는 표지된 n 개의 아미노산 유형에 대한 n 차원이 있다.
샘플에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하기 위해 단지 2 개 이상의 아미노산 유형의 표지, 아미노산 농도, 또는 아미노산 수를 측정해야 함이 발견되었다. 2 개 이상의 아미노산 유형을 표지하고 측정하는 것은 2 개 이상의 아미노산 유형이 표지되고 측정되는 경우, 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 고유한 서명을 제공하기 때문에 본 발명의 방법에 필수적이다. 하나의 아미노산 유형만이 표지되고 측정된 경우, 모든 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체가 동일한 참조선을 갖기 때문에 2 개의 아미노산 유형이 표지되거나 측정될 필요가 있다. 샘플 점이 관심 p 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 p 선과 비교되는 경우, 각각의 농도의 함수, 샘플 내에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양은 동시에 결정된다. 이 용액 상 방법에서, 샘플 내에 함유된 단백질의 양은 샘플 내에서 식별된 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도에 샘플 내 용액의 부피를 곱하여 간단히 결정된다. 샘플에서 모든 아미노산 유형에 대한 표지, 아미노산 농도, 또는 아미노산 수를 측정하는 것은 필요하거나 효율적이지 않다.
관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 및 단백체는 모두 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도, 또는 아미노산 수의 고유한 서명을 갖는다. 샘플 내에서 해당 관심 범주의 구성원의 존재 및/또는 농도 및/또는 양을 결정하기 위해 샘플이 분자의 어떤 범주(즉, 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 혼합물, 하위단백체, 또는 단백체)를 함유하는지 알거나 의심할 필요는 없다. 예를 들어, 샘플에서 표지된 2 개 이상의 아미노산 유형은 트립토판(W) 및 리신(K)이며, 트립토판(W)의 측정된 표지는 샘플에서 트립토판(W)의 농도를 결정하는 데 사용되고, 리신(K)의 측정된 표지는 샘플에서 리신(K)의 농도를 결정하는 데 사용된다. 샘플은 10.9 μM W 및 27.9 μM K를 함유한다. 샘플은 관심 암탉 알 흰자위 리소자임의 단백질 및 관심 HIV의 단백체에 대해 식별된다. 암탉 알 흰자위 리소자임은 단백질 서열 당 6 W 및 6 K 아미노산을 가지며 HIV는 단백질 서열 당 10.9 W 아미노산 및 27.9 K 아미노산을 갖는다. 샘플의 서명을 측정할 암탉 알 흰자위 리소자임의 단백질 농도가 없기 때문에 샘플에서 암탉 알 흰자위 리소자임의 부재가 식별된다. 그러나, 샘플의 서명(10.9 μM W 및 27.9 μM K)은 1 μM 단백질 농도에서 HIV의 서명(10.9 W 및 27.9 K)과 동일하므로, 샘플에서 1 μM HIV의 존재가 식별된다.
이는 중요한 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 아미노산 유형의 각각 알려진 표지 값, 아미노산 농도, 또는 아미노산 수와 비교한 샘플에서 각 표지된 아미노산 유형의 표지, 아미노산 농도, 또는 수이며, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 아미노산의 순서와 비교한 샘플에서 아미노산의 순서가 아니다. 펩티드 및 단백질 식별을 위한 다른 최신 기술 방법은 샘플의 펩티드 또는 단백질 서열 내에서 아미노산 순서의 결정을 필요로 한다.
샘플에서 2 개 이상의 아미노산 유형이 표지된다. 아미노산 유형은 R-기, 즉 측쇄에 의해 정의된다. R-기는 각 아미노산 유형에 특이적이다. 하나의 아미노산 유형의 R-기는 모든 다른 아미노산 유형의 R-기와 구별가능하다. 예를 들어, 트립토판(W)에 대한 R-기는 인돌 기이다. 모든 W 아미노산은 인돌 기를 갖는다. 따라서, W 아미노산 유형은 인돌 R-기에 의해 정의된다. 또 다른 예에서, 리신(K)에 대한 R-기는 ε-1차 아미노 기이다. 모든 K 아미노산은 이 ε-1차 아미노 기를 갖는다. 따라서, K 아미노산 유형은 ε-1차 아미노 R-기에 의해 정의된다. 또 다른 예에서, 티로신(Y)에 대한 R-기는 페놀 기이다. 모든 Y 아미노산은 페놀 기를 갖는다. 따라서, Y 아미노산 유형은 페놀 R-기에 의해 정의된다. 아미노산 유형 W의 R-기는 아미노산 유형 K의 R-기 및 아미노산 유형 Y의 R-기와 구별가능하다. 따라서, 아미노산 유형 W는 이들 아미노산 유형 사이의 상이한 R-기로 인해 아미노산 유형 K 및 아미노산 유형 Y와 구별가능하다. 모든 아미노산 유형은 그들의 특이적 R-기에 의해 서로 구별가능하다. 일부 구현예에서, 아미노산 유형은 다른 아미노산 유형형에 대해 독립적으로 표지된다. 일부 구현예에서, 표지되는 아미노산 유형의 각 아미노산의 R-기이다. 일부 구현예에서, 각 R-기(즉, 각 아미노산 유형)는 고유한 표지 가지므로 각 R-기(즉, 각 아미노산 유형)는 다른 R-기(즉, 다른 아미노산 유형)에 대해 독립적으로 표지된다. 일부 구현예에서, 2 개 이상의 R-기(즉, 2 개 이상의 아미노산 유형)은 동일한 표지로 표지되지만, 각 표지된 R-기(즉, 각 표지된 아미노산 유형)는 또 다른 표지된 R-기(즉, 또 다른 표지된 아미노산 유형)와 상이하게 겸출된다. 일부 구현예에서, 각 표지는 아미노산 유형에 대해 표적된다. 일부 구현예에서, 각 표지는 아미노산 유형에 대해 특이적이다.
일부 구현예에서, 2 개 이상의 아미노산 유형은 알라닌(A), 아르기닌(R), 아스파라긴(N), 아스파르트산(D), 시스테인(C), 글루탐산(E), 글루타민(Q), 글리신(G), 히스티딘(H), 이소류신(I), 류신(L), 리신(K), 메티오닌(M), 페닐알라닌(F), 프롤린(P), 피롤리신(S), 셀레노시스테인(O), 트레오닌(T), 트립토판(W), 티로신(Y) 및 발린(V) 또는 합성 아미노산으로부터 선택된다. 일부 구현예에서, 아미노산 유형은 변형된 아미노산 및/또는 비변형된 아미노산을 포함한다. 일부 구현예에서, 아미노산 유형은 변형된 아미노산을 포함한다. 일부 구현예에서, 아미노산 유형은 비변형된 아미노산을 포함한다. 일부 구현예에서, 아미노산 유형은 변형 및 비변형된 아미노산을 둘 다 포함한다. 일부 구현예에서, 아미노산 유형의 변형 및 비변형된 아미노산이 둘 다 표지된 경우, 변형된 아미노산은 먼저 비변형된 아미노산으로 전환된다.
일부 구현예에서, 샘플 내의 단백질은 관심 아미노산 유형과의 반응 후 배타적으로 형광을 "켜는(turn on)" 분자로 형광생성으로 표지된다. 따라서, 미반응된 염료로부터 표지된 아미노산을 분리할 필요는 없는 데, 미반응된 염료가 형광성이 아니고 신호를 제공하지 않기 때문이다. 펩티드 또는 단백질 식별을 위한 다른 최신 기술 방법에서, 펩티드 또는 단백질 식별을 수행할 수 있기 전에 미반응된 염료로부터 표지된 아미노산을 분리할 필요가 있다.
샘플에서 각 표지된 아미노산 유형의 표지가 측정된다. 예를 들어, 샘플에서 표지된 2 개 이상의 아미노산 유형이 트립토판(W) 및 리신(K)이면, 트립토판(W)의 표지가 측정되고, 리신(K)의 표지가 측정된다.
일부 구현예에서, 각 아미노산 유형의 측정된 표지는 샘플에서 해당 표지된 아미노산 유형의 농도 및/또는 해당 표지된 아미노산 유형의 아미노산 수를 계산하는 데 사용된다. 각 아미노산 유형의 측정된 표지는 아미노산 유형의 농도, 아미노산 유형의 아미노산 수, 및 샘플의 농도 각각과 선형적으로 관련될 수 있다. 예를 들어, 샘플에서 표지된 2 개 이상의 아미노산 유형이 트립토판(W) 및 리신(K)이면, 트립토판(W)의 표지가 측정되고, 리신(K)의 표지가 측정된다. 트립토판(W)의 측정된 표지는 샘플에서 트립토판(W)의 아미노산 농도 및/또는 트립토판(W) 아미노산 수 및/또는 샘플의 농도를 계산하는 데 사용된다. 트립토판의 측정된 표지는 트립토판 아미노산의 농도, 트립토판 아미노산 수, 및 샘플의 농도 각각과 선형적으로 관련된다. 리신(K)의 측정된 표지는 리신(K)의 아미노산 농도, 및/또는, 리신(K) 아미노산 수, 및/또는 샘플의 농도를 계산하는 데 사용된다. 리신의 측정된 표지는 리신의 농도, 리신 아미노산 수, 및 샘플의 단백질 농도 각각과 선형적으로 관련된다.
일부 구현예에서, 교정 곡선 또는 표준은 측정된 표지 값(예를 들어 신호)을 샘플에서 표지된 2 개 이상의 아미노산 유형 각각에 대한 아미노산 농도로 전환하는 데 사용된다. 교정 곡선 또는 표준은 기기의 반응이 분석물의 알려진 농도에 따어떻게 변하는지 보여준다. 표준 또는 교정 곡선은 각 아미노산 유형의 하나 이상의 알려진 아미노산 농도에 대한 표지 값을 제공한다. 이 전환은 샘플 또는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 적용될 수 있다. 예를 들어, 교정 곡선은 아미노산 유형 트립토판(W)의 경우, 10 μM W의 아미노산 농도에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 알려진 표지 값을 결정하기 위해, 이 아미노산 농도에 100
Figure pct00001
을 곱하는 것을 나타는 데, 교정 곡선의 기울기이기 때문이다. 교정 곡선 또는 표준에 의해 나타낸 계산은 교정 함수 또는 교정 계수라고 한다. 교정 계수는 값에 스칼라(scalar)를 곱하거나 나누는 경우 사용되고, 교정 함수는 추가적인 단계를 수행하는 경우 사용된다. 예를 들어, 100
Figure pct00002
은 교정 계수이다. 샘플을 측정할 때마다 교정 곡선 또는 표준을 계산할 필요는 없으며, 대신 이러한 곡선 또는 표준은 이 샘플에서 2 개 이상의 표지된 아미노산 유형의 표지(예를 들어 신호)를 측정하는 것만을 필요로 하는 사용자에게 제공될 수 있고 각 아미노산 유형에 대한 교정 함수 또는 계수와 함께 제공될 수 있다. 이 구현예에서, 샘플의 존재 및/또는 농도 및/또는 양의 적극 식별은 샘플의 각 표지된 아미노산 유형의 아미노산의 농도에 기반한다. 샘플에서 각 표지된 아미노산 유형의 측정된 표지는 샘플에서 해당 아미노산 유형의 농도, 샘플에서 해당 아미노산 유형의 단백질 당 아미노산 수, 및/또는 샘플의 단백질 농도와 선형적으로 관련될 수 있다.
일부 구현예에서, 샘플에서 각 표지된 아미노산 유형의 아미노산 수는 각 표지된 아미노산 유형의 아미노산 농도를 샘플의 몰 단백질 농도로 나누어 계산된다. 따라서, 샘플에서 아미노산 수의 값을 사용하기 위해 샘플의 몰 단백질 농도를 알 필요가 있다. 이 구현예에서, 샘플 내의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재에 대한 적극 식별은 샘플에서 각 표지된 아미노산 유형의 아미노산 수에 기반할 수 있다.
관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 n 개 아미노산의 아미노산 농도 또는 알려진 표지 값이 농도의 함수로 플롯팅되는 경우, 이것은 n-차원 공간에서 선을 제공하며, 이로부터 샘플에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도가 선의 방정식을 사용하여 결정될 수 있다. 일부 구현예에서, 선은 원점에서 비롯된다. 대안적인 구현예에서, 선은 알려진 농도 범위 내에서 농도에 상응하는 아미노산 농도 또는 알려진 표지 값을 포함한다. 샘플에서 표지된 아미노산 유형에 대한 아미노산 농도 또는 측정된 표지는 n-차원 공간에서 점을 차지한다. 샘플의 점은 샘플에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하기 위해 n-차원 공간의 선과 비교될 수 있다.
예를 들어, 4 개의 관심 단백질이 있는 경우; 단백질-A, 단백질-B, 단백질-C, 및 단백질-D가 2-차원 공간에 표시되며, 여기서 차원 1 및 2는 각각 시스테인(C) 및 트립토판(W)에 대한 표지 값이다. 시스테인(C) 및 트립토판(W) 아미노산 유형은 샘플에서 표지되고 측정된다. 도 1은 시스테인(C) 및 트립토판(W)의 알려진 표지 값이 각각 4 개의 관심 단백질 각각에 대한 2-차원 공간에 선으로 나타낸 것과 대조적으로, 2-차원 공간에서 점으로서 샘플에서 표지된 시스테인(C) 및 트립토판(W) 아미노산 유형의 측정된 표지 값을 플롯팅한다. 시스테인(C) 및 트립토판(W) 아미노산 유형의 알려진 표지 값은 관심 단백질; 단백질-A, 단백질-B, 단백질-C 및 단백질-D에 대한 단백질 농도의 함수로서 플롯팅한다. 알려진 표지 값은 4 개의 관심 단백질 각각에 대한 2-차원 공간에서 별개의 선을 차지한다.
일부 구현예에서, 이 선은 참조선(reference line)이다. 도 1에서, 4 개의 관심 단백질 각각의 참조선 상의 각 점은 각 관심 단백질의 농도에 상응한다. 관심 단백질의 단백질 농도가 증가함에 따라, 참조선에 의해 제공되는 각 아미노산 유형의 알려진 표지 값은 원점으로부터 멀리 이동한다. 각 관심 단백질의 1 μM 농도에 상응하는 점은 음영 원으로 나타낸다. 샘플에서 시스테인(C) 및 트립토판(W) 아미노산 유형 각각의 표지 값이 측정되고, 이 점은 빈 사각형으로 나타낸다. 일부 구현예에서, 샘플 점과 각 참조선 사이의 최단 거리가 계산된다.
일부 구현예에서, 샘플 점은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조선 상에 놓여 있다. 샘플 내에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재가 식별되며, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도는 샘플에서 표지된 2 개 이상의 아미노산 유형 각각의 측정된 표지 값 또는 아미노산 농도가 샘플에서 표지되는 것과 동일한 2 개 이상의 아미노산 유형 각각의 알려진 표지 값 또는 아미노산 농도와 동등한 농도이다.
다른 구현예에서, 샘플 점은 참조선 상에 있지 않고, 샘플 점과 참조선 사이의 거리가 계산된다. 일부 구현예에서, 이 거리는 샘플 점과 참조선을 연결하는 참조선까지의 벡터 또는 선분(line segment)의 길이이다. 샘플 점은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 단일 농도에 대한 n 개의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도에 상응하는, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조선 상의 단일 점에 가장 가깝다.
일부 구현예에서, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재는 샘플 점과 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조선 상의 이 가장 가까운 점 사이의 거리가 오차 한계(error margin)보다 작거나 동일한 경우 샘플에서 식별된다. 일부 구현예에서, 오차 한계는 거리 임계값이다. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재가 샘플 내에서 식별되면, 샘플 점이 가장 가까운 참조선 상의 점의 단백질 농도로 존재한다.
도 1에서, 샘플 점과 4 개의 관심 단백질에 상응하는 4 개의 참조선 사이의 최단 거리는 샘플 점과 단백질-B의 참조선 사이의 거리였다. 샘플에서 관심 단백질 단백질-B의 존재가 식별된다. 관심 단백질 단백질-B에 대한 참조선 상의 각 점은 관심 단백질 단백질-B의 별개의 단백질 농도에 대한 시스테인(C) 및 트립토판(W) 아미노산 유형의 표지 값을 보여준다. 샘플은 최단 거리를 제공한 단백질-B의 참조선 상의 점의 단백질 농도로서 식별된다. 여기서, 샘플의 단백질 농도는 0.5 μM이다. 따라서, 샘플에서 관심 단백질 단백질-B의 적극 식별이 이루어질 수 있고, 샘플 내에서 0.5 μM로 관심 단백질 단백질-B의 농도가 동시에 결정된다.
일부 구현예에서, 샘플의 몰 단백질 농도가 알려져 있어서 샘플에서 2 개 이상의 아미노산 유형의 아미노산 수의 값이 이용가능하면, 동일한 상응하는 2 개의 아미노산 유형의 아미노산 수가 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 점을 제공하는 n-차원 공간에 플롯팅된다. 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대해 하나의 점만 있다. 따라서, 샘플의 점은 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 점과 비교될 수 있고 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재는 샘플의 점이 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 점과 동일한 경우 샘플에서 식별된다. 일부 구현예에서, 샘플 점과 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 점 사이의 거리가 계산될 수 있고, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재는 샘플 점과 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 점 사이의 거리가 오차 한계보다 작거나 동일한 경우 샘플에서 식별된다.
일부 구현예에서, 샘플에서 각 표지된 아미노산 유형의 측정된 표지 및/또는 농도 및/또는 아미노산 수가 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 내의 샘플에서 표지된 것과 동일한 아미노산 유형의 알려진 표지 값 및/또는 농도 및/또는 아미노산 수에 대한 오차 한계 내에 있거나 이와 동등하면, 샘플에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양의 적극 식별이 이루어질 수 있다. 예를 들어, 샘플에서 트립토판(W) 아미노산의 아미노산 농도 및 리신(K) 아미노산의 아미노산 농도가 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 트립토판(W) 아미노산의 아미노산 농도 및 리신(K) 아미노산의 아미노산 농도와 오차 한계 내에 있거나 이와 동등하면, 샘플에서 해당 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양의 적극 식별이 이루어질 수 있다.
일부 구현예에서, 샘플에서 표지된 2 개 이상의 아미노산 유형의 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대해 제공된 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도, 또는 아미노산 수 사이의 최소 거리가 계산되며, 이 거리는 오차 한계와 비교된다.
일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각에 대해 제공된 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수는 참조이다. 일부 구현예에서, 참조는 데이터베이스로부터 수득된다. 대안적으로, 참조는 계산될 수 있다.
샘플에서 각 표지된 아미노산 유형의 단위(즉, 측정된 표지, 아미노산 농도 및/또는 아미노산의 수)는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체(예를 들어 참조)에서 동일한 아미노산 유형의 동일한 단위(즉, 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수)와 비교되어야 한다. 예를 들어, W 및 Y의 아미노산 수가 샘플에서 결정되면, 이는 샘플의 단위(아미노산 수)가 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 동일한 단위(아미노산 수)와 비교되도록 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체(예를 들어 참조)에서 W 및 Y의 아미노산 수와 비교되어야 한다. W 및 Y의 아미노산 농도가 샘플에서 결정되면, 이는 샘플의 단위(아미노산 농도)가 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 동일한 단위(아미노산 농도)와 비교되도록 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체(예를 들어 참조)에서 W 및 Y의 아미노산 농도와 비교되어야 한다. . 샘플에서 W 및 Y의 측정된 표지가 샘플에서 W 및 Y의 아미노산 농도 또는 아미노산 수를 결정하는 데 사용되지 않으면, 샘플에서 W 및 Y의 측정된 표지는 샘플의 단위(표지 측정)가 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 동일한 단위(알려진 표지 값)와 비교되도록 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체( 예를 들어 참조)에 대한 W 및 Y의 알려진 표지 값과 비교되어야 한다. 예를 들어, 샘플에서 W 및 Y의 측정된 형광 강도는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체(예를 들어, 참조)에서 W 및 Y의 알려진 형광 강도와 비교된다.
일부 구현예에서, 샘플에 대해 측정된 단위(즉, 측정된 표지, 아미노산 농도 및/또는 아미노산 수)가 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 단위(즉, 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수)와 상이하면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 단위는 샘플에 대해 측정된 동일한 단위로 전환된다. 일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 특정 아미노산 유형의 아미노산 수에 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도를 곱하여 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 각 아미노산 유형의 아미노산 농도를 제공한다. 예를 들어, W 및 Y의 아미노산 농도가 샘플에서 측정되면, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 W 및 Y 아미노산의 수는 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 W 및 Y의 상응하는 아미노산 농도로 전환된다. 이는 샘플의 단위를 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 동일한 단위와 비교할 수 있게 하며, 즉, 샘플에서 W 및 Y의 측정된 아미노산 농도를 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 W 및 Y의 아미노산 농도와 비교한다.
일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 상응하는 아미노산 유형의 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수는 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열 또는 서열들 및/또는 번역 후 변형에 관한 임의의 실험적 정보로부터 계산된다. 일부 구현예에서, 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열 및/또는 번역 후 변형에 관한 임의의 실험적 정보는 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 샘플에서 표지된 각 아미노산 유형의 아미노산 수를 계산하는 데 사용된다. 예를 들어, 샘플에서 표지된 2 개 이상의 아미노산 유형이 트립토판(W) 및 리신(K)이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 트립토판(W) 아미노산의 수 및 리신(K) 아미노산의 수는 해당 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 단백질 서열 또는 단백질 서열들로부터 계산된다. 예를 들어, 샘플에서 표지된 2 개 이상의 아미노산 유형이 트립토판(W) 및 리신(K)이고 샘플에서 관심 단백질이 소 혈청 알부민이면, 소 혈청 알부민의 아미노산 서열에서 트립토판(W) 및 리신(K) 아미노산의 수는 소 혈청 알부민의 아미노산 서열로부터 2W 및 59K로 계산된다. 또 다른 예로서, 본원에 개시된 방법을 통해 관심 단백질이 이들 리신 아미노산을 표지에 비반응성으로 만드는 리신(K) 아미노산에 대해 3 개의 번역 후 변형을 갖는다는 것이 알려지면, 이 관심 단백질의 리신 아미노산의 수에 -3을 더한다.
일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열 또는 서열들이 알려져 있다(예를 들어 데이터베이스로부터 수득됨). 일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열은 당업계의 표준 기술(예를 들어 Edman 분해 또는 질량 분광법)을 사용하여 결정된다.
일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 2 개 이상의 표지된 아미노산 유형의 아미노산 수는 본원에 개시된 방법을 사용하여 결정되며, 즉, 2 개 이상의 아미노산 유형을 표지화하고, 표지를 측정하고 측정된 표지 사용하여 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 각 아미노산 유형의 아미노산 수, 또는 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 샘플에서 각 아미노산 유형의 아미노산 농도를 결정한다. 이 방식으로, 아미노산 서열이 알려져 있지 않거나 완전히 알려지지 않은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양이 결정될 수 있다.
일부 구현예에서, 이는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 2 개 이상의 아미노산 유형 각각의 수이고, 단백질 서열에서 2 개 이상의 아미노산 유형 각각의 순서 또는 단백질 서열에서 2 개 이상의 아미노산 유형 각각의 상대적 조성이 아니며, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 하나 이상의 농도에서 이러한 아미노산 유형의 상응하는 아미노산 농도 및/또는 알려진 표지 값을 계산하는 데 사용된다.
각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 알려진 표지 값 또는 아미노산 농도의 고유한 서명은 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도의 공통 파라미터에 따라, 벡터 함수, 또는 파라미터 방정식 세트로 제공될 수 있음이 발견되었다. 일부 구현예에서, 이 벡터 함수 또는 파라미터 방정식 세트가 기재되며 참조선이 샘플 내에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하기 위해 샘플 점과 정량적으로 비교될 수 있도록, 본원에 개시된 참조선을 계산하는 데 사용된다. 파라미터 방정식 세트는 파라미터라고 하는 공통 독립적 변수의 함수로서 양의 그룹을 설명한다. 파라미터 방정식 세트는 대안적으로 나중에 계산을 단순화할 수 있는 등가 벡터 함수로서 표시될 수 있다. 샘플에서 측정된 2 개 이상의 표지된 아미노산 유형의 표지 값 또는 아미노산 농도를 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도와 비교하면 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 (알려지지 않은) 농도의 함수로 제공되어 샘플 내에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 식별, 및 샘플 내에서 해당 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도 및/또는 양의 동시 식별을 허용한다. 임의적으로, 이것은 임의의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 설명하는 벡터 함수, 또는 파라미터 방정식 세트를 생성함으로써 달성될 수 있다.
일부 구현예에서, 파라미터 방정식 세트는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 2 개 이상의 아미노산 유형에 대해 측정되는 아미노산 농도의 서명을 제공한다. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체를 설명하는 파라미터 방정식의 수는 샘플에서 표지되고 측정된 2 개 이상의 아미노산 유형의 수이다. 파라미터 방정식은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체의 샘플에서 표지되고 측정된 2 개 이상의 아미노산 유형 각각의 아미노산 농도를 농도 t의 함수로 기재한다. 파라미터 방정식 1 세트는 다음과 같다:
Figure pct00003
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대해 그의 농도 t의 함수로서 제공되는 아미노산 농도이고, a 1 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 아미노산 수이고, a 2 는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 2의 아미노산 수이고, a n 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이고, t는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체의 총 몰 농도이고, 샘플에서 표지되고 측정된 n 개의 아미노산 유형에 대한 세트에 n 개의 파라미터 방정식이 있다. 일부 구현예에서, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된다,
Figure pct00004
. 다른 구현예에서, t는 농도 범위의 하한(c 1 ) 및 상한(c 2 ) 사이에 제공된다(
Figure pct00005
).
파라미터 방정식 1 세트는 대안적으로 동일한 참조선 또는 참조 곡선을 설명하는, 벡터 함수로서 집합적으로 기재될 수 있다. 표현은 상호교환가능하다. 이 표현에서, 벡터 함수 1은 다음과 같다:
Figure pct00006
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대해 농도 t의 함수로서 제공되는 아미노산 농도이고,
Figure pct00007
은 원점이고, a 1 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 아미노산 수이고, a 2 는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 2의 아미노산 수이고, a n 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이고, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의되는(
Figure pct00008
) 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체의 총 몰 농도이다. 대안적인 구현예에서, t는 농도 범위의 하한(c 1 ) 및 상한(c 2 ) 사이에 제공되고(
Figure pct00009
), 벡터는 농도 범위의 하한의 아미노 농도에서 시작한다,
Figure pct00010
.
예를 들어, 2 개의 관심 단백질 및 1 개의 관심 단백질 복합체가 있다. 첫번째 관심 단백질은 BSA이다. K(a 1 ), C(a 2 ), 및 W(a 3 ) 아미노산 유형은 샘플에서 표지되고 측정된다. BSA의 단백질 서열 내에 각각 K, C, 및 W 아미노산 유형의 59 개, 35 개, 및 2 개의 아미노산이 있기 때문에 a 1 = 59, a 2 = 35, 및 a 3 = 2이다. 아미노산 농도를 BSA의 단백질 농도의 함수로서 제공하는 벡터 함수는 다음과 같다
Figure pct00011
암탉 알 흰자위 리소자임(LYZ)은 두번째 관심 단백질이다. LYZ의 단백질 서열 내에 각각 K, C, 및 W 아미노산 유형의 6 개, 8 개, 및 6 개의 아미노산이 있기 때문에 a 1 = 6, a 2 = 8, 및 a 3 = 6이다. 아미노산 농도를 LYZ의 단백질 농도의 함수로서 제공하는 벡터 함수는 다음과 같다:
Figure pct00012
트랜스타이레틴(Transthyretin)은 관심 단백질 복합체이다. 관심 단백질 복합체를 포함하는 모든 단백질 서열 내에 K, C, 및 W 아미노산 유형의 32 개, 4 개, 및 8 개의 아미노산이 있기 때문에(단백질 복합체의 4 개의 하위단위 각각의 아미노산 수가 합산됨) a 1 = 32, a 2 = 4, 및 a 3 = 8이다. 아미노산 농도를 트랜스타이레틴(TTR)의 농도의 함수로서 제공하는 벡터 함수는 다음과 같다:
Figure pct00013
BSA에 대한 벡터 방정식은 n 차원 공간(3-차원 공간, 3 가지 유형의 아미노산이 실험에서 표지되고 측정되기 때문)에서 BSA에 대한 참조선을 제공하고, LYZ에 대한 벡터 방정식은 n 차원 공간에서 LYZ에 대한 참조선을 제공하고, TTR에 대한 벡터 방정식은 n 차원 공간에서 TTR에 대한 참조선을 제공한다. 이들 벡터 방정식 및 상응하는 참조선은 샘플 점과 함께 도 2에 표시된다. 샘플 내에서 이러한 관심 단백질 또는 단백질 복합체 중 하나의 존재 및/또는 농도 및/또는 양을 식별하기 위해, 샘플 점과 BSA, LYZ, 및 TTR에 대해 제공된 각각의 참조선 사이의 거리를 계산하고 비교한다.
이전에, 샘플 내에서 전체 단백체 또는 하위단백체를 식별하는 방법은 이용가능하지 않았다. 샘플 내에서 단백체 또는 하위단백체를 포함하는 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체를 분리한 후 단백체 또는 하위단백체 내의 각 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체를 순차적 식별하는 것을 통해 샘플 내에서 단백체 또는 하위단백체를 식별하는 것이 요구되었다.
단백체, 하위단백체, 또는 다른 혼합물을 식별하고 단백체, 하위단백체, 또는 다른 혼합물의 농도 또는 양을 결정하기 위해 샘플 내에서 단백질의 단백체, 하위단백체, 또는 다른 혼합물을 분리할 필요가 없다는 것이 발견되었다. 단백체, 하위단백체, 또는 다른 혼합물의 농도 또는 양을 식별하고 결정하기 위해 단백체, 하위단백체 또는 다른 혼합물 내에서 모든 단백질을 식별할 필요가 없다는 것이 발견되었다. 대신에, 샘플 내에 함유된 단백체, 하위단백체, 또는 다른 혼합물의 2 개 이상의 아미노산 유형의 아미노산 농도, 표지 값, 또는 아미노산 수의 단일 측정만이 이루어져야 한다.
샘플 내의 단백체 또는 하위단백체는 대안적으로 아미노산 수가 단백체 또는 하위단백체 내의 각 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 서열의 아미노산 수의 가중 평균이고, 샘플 내의 농도가 단백체 또는 하위단백체를 포함하는 모든 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체의 총 몰 단백질 농도인 평균 단백질 서열로서 생각될 수 있다는 것으로 발견되었다. 샘플 내의 분리되지 않은 단백체 또는 하위단백체는 이 방식으로 식별되고 정량화될 수 있는 데, 이들 서명이 각 단백체 및 하위단백체에 대해 고유하다는 것이 발견되었기 때문이다. 이 평균 단백질 서열 내에서 아미노산의 순서는 계산되지 않고, 모든 이러한 평균 단백질 서열 내에서 2 개 이상의 아미노산 유형의 아미노산 수는 모든 단백체 및 하위단백체에 대해 고유하다. 예를 들어, 모든 평균 단백질 서열 내에서 2 개 이상의 아미노산 유형의 아미노산 수는 모든 알려진 박테리아 단백체 및 모든 알려진 바이러스 단백체에 대해 고유하다(도 3). 이는 7581 개의 알려진 박테리아 참조 단백체 및 9377 개의 알려진 바이러스 참조 단백체에 대해 입증된다. 참조 단백체는 완전한 단백체이다. 따라서, 모든 알려진 박테리아 단백체 및 모든 알려진 바이러스 단백체는 서로의 단백체를 포함하는 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체를 분리하지 않고 본 발명의 방법을 사용하여 샘플 내에서 용이하게 검출될 수 있는 별개의 서명을 갖는다. 이는 반직관적인 결과인 데, 단백체 내의 단백질, 올리고펩티드, 폴리펩티드, 및 단백질 복합체의 2 개 이상의 아미노산 유형의 아미노산 수가 분포에 따라 달라질 것으로 예상되는 반면, 각 단백체에 대한 분포의 평균이 생물학적 기능에 의해 지시되는 단일 값 주위에 모일 것으로 예상되기 때문이다. 또한, 단백체에 걸친 2 개 이상의 아미노산 유형의 평균 아미노산 수는 x = y = z 경향을 따르지 않으며, 이 가변성이 단백체에 걸친 단백질, 올리고펩티드, 폴리펩티드, 및 단백질 복합체 서열의 평균 길이의 차이로 설명할 수 없다는 것을 시사한다.
SARS-CoV-2 감염과 같은 감염을 진단하는 현재 방법은 환자 샘플 내에서 SARS-CoV-2 RNA의 (일반적으로 정성적) 결정을 위해 역전사 폴리머라제 연쇄 반응(RT-PCR)에 의존한다. 그러나, 이러한 테스트는 30% 거짓 음성률(false negative rate)을 가지며, 이는 환자 관리, 감염 제어, 및 모델링에 대해 유의한 결과를 갖는다.
임의의 감염에 대한 신속 진단을 위한 새로운 접근법을 제공하는 것에 더하여, 본 발명의 방법은 환자 샘플 내에서 관심 질환 연관 하위단백체의 존재 및/또는 농도 및/또는 양의 식별에 적용될 수 있다. 예를 들어, 1형 진성 당뇨병의 하위단백체 서명은 타액에서 식별되고 정량화될 수 있다. 일부 구현예에서, 인간 난소암, 인간 췌장암, 인간 전립선암 또는 인간 결장직장암의 하위단백체 서명은 혈장 샘플에서 식별되고 정량화될 수 있다. 일부 구현예에서, 인간 방광암, 인간 전립선암 또는 인간 신암의 하위단백체 서명은 소변 샘플에서 식별되고 정량화될 수 있다.
일부 구현예에서, 하나 이상의 하위단백체 또는 단백체가 관심 대상인 경우, 특정 아미노산 유형의 아미노산 수는 관심 하위단백체 또는 단백체에서 모든 단백질에 걸쳐 특정 아미노산 유형의 아미노산의 가중 평균 수이다. 예를 들어, 샘플에서 표지된 2 개 이상의 아미노산 유형이 트립토판(W) 및 리신(K)이고, 샘플에서 관심 단백체가 SARS-CoV-2 단백체인 경우, SARS-CoV-2 단백체의 모든 단백질의 평균 아미노산 서열에서 트립토판(W)의 가중 평균 수 및 리신(K) 아미노산의 가중 평균 수는 SARS-CoV-2 단백체의 아미노산 서열로부터 11.3 W 및 60.6 K로 계산된다.
임의의 관심 단백체 또는 하위단백체는 파라미터 방정식 세트에 의해 설명될 수 있는 것으로 발견되었다. 일부 구현예에서, 파라미터 방정식은 단백체 또는 하위단백체에서 2 개 이상의 아미노산 유형에 대해 측정되는 아미노산 농도의 서명을 제공한다. 농도의 공통 파라미터에 따른 파라미터 방정식 세트는 파라미터 방정식 2 세트이며 다음과 같은 형식을 취한다:
Figure pct00014
여기서 p i 는 관심 단백체 또는 하위단백체 i에 대해 단백체/하위단백체 농도 t의 함수로서 제공되는 아미노산 농도이고(여기서 단백체/하위단백체 농도는 단백체 또는 하위단백체를 포함하는 모든 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체, pi의 총 몰 농도임), w 1 은 관심 단백체 또는 하위단백체에서 아미노산 유형 1의 아미노산의 가중 평균 수이고, w 2 는 관심 단백체 또는 하위단백체에서 아미노산 유형 2의 아미노산의 가중 평균 수이고, w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, t는 단백체 또는 하위단백체 농도이다(여기서 단백체 또는 하위단백체 농도는 단백체 또는 하위단백체를 포함하는 모든 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체 p i 의 총 몰 농도임). 일부 구현예에서, 단백체 또는 하위단백체 농도 t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된다. 샘플에서 표지되고 측정된 n 개의 아미노산 유형에 대한 세트에 n 개의 파라미터 방정식이 있다.
관심 단백체 또는 하위단백체에 대해 제공된 아미노산 농도의 고유한 서명은 벡터 함수 2를 사용하여 동등하게 기재될 수 있다:
Figure pct00015
여기서 p i 는 관심 단백체 또는 하위단백체 i에 대해 단백체 또는 하위단백체의 농도 t의 함수로서 제공되는 아미노산 농도이고,
Figure pct00016
은 원점이고, w 1 은 관심 단백체 또는 하위단백체에서 아미노산 유형 1의 아미노산의 가중 평균 수이고, w 2 는 관심 단백체 또는 하위단백체에서 아미노산 유형 2의 아미노산의 가중 평균 수이고, w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산 수이고, t는 단백체 또는 하위단백체 농도이다(여기서 단백체 또는 하위단백체 농도는 단백체 또는 하위단백체를 포함하는 모든 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체, p i 의 총 몰 농도임). 일부 구현예에서, 단백체 또는 하위단백체 농도 t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된다.
일부 구현예에서, 관심 단백체 또는 하위단백체의 샘플에서 표지되고 측정된 것과 동일한 2 개 이상의 아미노산 유형 각각의 평균 아미노산 수는 샘플에서 표지되고 측정된 것과 동일한 2 개 이상의 아미노산 유형 각각의 아미노산의 가중 평균 수이다. 일부 구현예에서, 가중 평균의 가중치는 관심 단백체 또는 하위단백체에서 단백질 서열의 총 수 내에서 해당 단백질 서열의 비율에 의해 제공된다. 예를 들어, 단백체 당 트립토판(W) 아미노산의 가중 평균 수는 관심 단백체 또는 하위단백체를 포함하는 모든 단백질 서열 내의 해당 단백질 서열의 비율을 곱한 단백질 서열 당 트립토판 아미노산의 수의 선형 조합과 동일하고, 단백체 당 리신(K) 아미노산의 가중 수는 관심 단백체 또는 하위단백체를 포함하는 모든 단백질 서열 내의 해당 단백질 서열의 비율을 곱한 단백질 서열 당 트립토판 아미노산의 수의 선형 조합과 동일하다.
샘플에서 2 개 이상의 표지된 아미노산 유형에 대해 측정된 아미노산 농도는 하나 이상의 관심 단백체 또는 하위단백체에 대해 제공된 동일한 2 개 이상의 아미노산 유형의 아미노산 농도와 비교된다. 이는 관심 단백체 또는 하위단백체 중 하나로서 샘플의 식별 뿐만 아니라 샘플 내에 존재하는 관심 단백체 또는 하위단백체의 농도 또는 양의 결정을 허용한다.
일부 구현예에서, 2 개 이상의 아미노산 유형 각각의 농도는 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체의 해당 표지된 아미노산 유형의 농도이다. 일부 구현예에서, 각 관심 단백체 또는 하위단백체의 2 개 이상의 아미노산 유형 각각의 농도는 관심 단백체 또는 하위단백체에서 단백질에 걸친 해당 표지된 아미노산 유형의 총 농도이다. 이는 아미노산 유형의 농도가 단백체의 총 단백질 농도를 곱한 단백체의 서열 당 평균 아미노산 수와 동일하기 때문이다.
빈번하게, 알려지지 않은 샘플의 몰 단백질 농도는 알려져 있지 않은 데, 당업계의 표준 방법을 사용하여 샘플의 흡수(A 280 ) 또는 질량 단백질 농도를 결정하는 경우, 이는 샘플의 분자량이 알려지지 않은 한 샘플의 몰 단백질 농도로 전환될 수 없기 때문이며, 샘플의 정체성이 알려지지 않았기 때문에 샘플의 분자량은 알려지지 않았다.
일부 구현예에서, 샘플의 몰 단백질 농도는 알려져 있다. 샘플의 알려진 몰 단백질 농도가 상수 SC가 되게 한다. 따라서, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 가 샘플 내에 존재하면, 샘플의 몰 단백질 농도로 존재하므로, t = SC이다. 이 특별한 경우의 결과는 파라미터 방정식 1 세트의 예를 사용하여 간주되며:
Figure pct00017
,
이는 n 차원 공간에서 점으로 단순화한다.
Figure pct00018
이것은 공통 파라미터(독립적 변수)의 함수가 아니기 때문에 더 이상 파라미터 방정식 세트가 아닌데, 변수 t가 상수 SC로 대체되었기 때문이다. 이 구현예에서, 관심 단백질 pi에 대한 아미노산 농도는 대신 n 차원 공간에서 점을 제공한다.
일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 2 개 이상의 아미노산 유형 각각의 아미노산 농도를 사용하여 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 동일한 2 개 이상의 아미노산 유형 각각의 상응하는 표지 값을 파라미터 방정식 세트로 결정한다.
이것은 임의의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 농도를 설명하는 파라미터 방정식에 각 아미노산 유형의 측정된 표지와 각 아미노산 유형의 아미노산 농도 사이를 전환하는 교정 함수 또는 교정 계수를 혼입함으로써 달성된다.
일부 구현예에서, 파라미터 방정식은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에 대한 표지 값(예를 들어 표지의 신호)의 고유한 서명을 파라미터 방정식 3 세트를 통해 농도 t의 함수로서 설명한다:
Figure pct00019
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대해 그의 농도 t의 함수로서 제공되는 알려진 표지 값이고, a 1 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 아미노산 수이고, a 2 는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 2의 아미노산 수이고, a n 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이고, b 1 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 1에 대한 배경 값이고, b 2 는 샘플에서 측정된 표지 값이 배경-보정되는 경우 0인 아미노산 2에 대한 배경 값이고, b n 은 샘플에서 측정된 표지 값이 배경-보정되는 경우 0인 아미노산 유형 n에 대한 배경 값이고, f 1 은 아미노산 유형 1에 대한 교정 함수 또는 교정 계수이고, f 2 는 아미노산 유형 2에 대한 교정 함수 또는 교정 계수이고, f n 은 아미노산 유형 n에 대한 교정 함수 또는 교정 계수이고, t는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체의 몰 농도이다. 샘플에서 표지되고 측정된 n 개의 아미노산 유형에 대한 세트에 n 개의 파라미터 방정식이 있다. 일부 구현예에서, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된다,
Figure pct00020
. 다른 구현예에서, t는 농도 범위의 하한(c 1 ) 및 상한(c 2 ) 사이에 제공된다(
Figure pct00021
).
파라미터 방정식 3 세트를 구성하는 방정식은 동등하게 벡터 함수 3으로 집합적으로 설명될 수 있다:
Figure pct00022
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대해 그의 농도 t의 함수로서 제공되는 알려진 표지 값이고, b 1 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 1에 대한 배경 값이고, b 2 는 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 2에 대한 배경 값이고, b n 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 n에 대한 배경 값이고, a 1 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 산 유형 1의 아미노산 수이고, a 2 는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 2의 아미노산 수이고, a n 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이고, f 1 은 아미노산 유형 1에 대한 교정 함수 또는 교정 계수이고, f 2 는 아미노산 유형 2에 대한 교정 함수 또는 교정 계수이고, f n 은 아미노산 유형 n에 대한 교정 함수 또는 교정 계수이고, t는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체의 몰 단백질 농도이다. 일부 구현예에서, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된다(
Figure pct00023
). 대안적인 구현예에서, t는 농도 범위의 하한(c 1 ) 및 상한(c 2 ) 사이에 제공되고(
Figure pct00024
), 벡터는 농도 범위의 하한의 표지에 대한 모든 값에서 시작한다,
Figure pct00025
.
다른 구현예에서, 임의의 농도, t에서 관심 단백체 또는 하위단백체에 대한 표지 값(예를 들어 표지의 신호)의 고유한 서명을 설명하는 파라미터 방정식은 파라미터 방정식 4 세트이다:
Figure pct00026
여기서 p i 는 관심 단백체 또는 하위단백체 i에 대해 그의 농도 t의 함수로서 제공되는 알려진 표지 값이고, w 1 은 관심 단백체 또는 하위단백체에서 아미노산 유형 1의 아미노산의 가중 평균 수이고, w 2 는 관심 단백체 또는 하위단백체에서 아미노산 유형 2의 아미노산의 가중 평균 수이고, w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, b 1 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 1에 대한 배경 값이고, b 2 는 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 2에 대한 배경 값이고, b n 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 n에 대한 배경 값이고, f 1 은 아미노산 유형 1에 대한 교정 함수 또는 교정 계수이고, f 2 는 아미노산 유형 2에 대한 교정 함수 또는 교정 계수이고, f n 은 아미노산 유형 n에 대한 교정 함수 또는 교정 계수이고, t는 관심 단백체 또는 하위단백체의 몰 농도이다. 샘플에서 표지되고 측정된 n 개의 아미노산 유형에 대한 세트에 n 개의 파라미터 방정식이 있다. 일부 구현예에서, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된다(
Figure pct00027
).
이 구현예에서 파라미터 방정식 세트는 대안적으로 벡터 함수 4를 사용하여 집합적으로 설명될 수 있다:
Figure pct00028
여기서 p i 는 관심 단백체 또는 하위단백체 i에 대해 그의 농도 t의 함수로서 제공되는 알려진 표지 값이고, b 1 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 1에 대한 배경 값이고, b 2 는 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 2에 대한 배경 값이고, b n 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 n에 대한 배경 값이고, w 1 은 관심 단백체 또는 하위단백체에서 아미노산 유형 1의 아미노산의 가중 평균 수이고, w 2 는 관심 단백체 또는 하위단백체에서 아미노산 유형 2의 아미노산의 가중 평균 수이고, w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, f 1 은 아미노산 유형 1에 대한 교정 함수 또는 교정 계수이고, f 2 는 아미노산 유형 2에 대한 교정 함수 또는 교정 계수이고, f n 은 아미노산 유형 n에 대한 교정 함수 또는 교정 계수이고, t는 관심 단백체 또는 하위단백체의 몰 농도이다. 일부 구현예에서, t는 0보다 더 크거나 같은 t에 대한 모든 값에 대해 정의된다.
따라서, 파라미터 방정식 세트 또는 벡터 함수는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 2 개 이상의 아미노산 유형의 표지 값(예를 들어 신호) 또는 아미노산 농도의 고유한 서명을 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도의 함수로서 설명하는, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 단독의 아미노산 서열 또는 서열들에 기반한 임의의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대해 구성될 수 있음이 발견되었다. 예를 들어, W 및 Y의 표지만 샘플에서 측정되었고, 샘플에서 W 및 Y 아미노산 유형의 아미노산 농도 또는 수로 전환되지 않았다면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 W 및 Y 아미노산의 수는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 알려지지 않은 농도의 함수로서 W 및 Y의 상응하는 알려진 표지 값으로 전환된다. 이는 샘플에서 W 및 Y의 측정된 표지를 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 W 및 Y의 알려진 표지 값과 비교하고, 샘플에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 결정하는 것을 허용한다. 일부 구현예에서, 샘플에 대해 측정된 신호에 대한 계산은 필요하지 않다.
각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조선 또는 참조 곡선의 벡터 형태는 샘플에서 표지되고 측정된 상응하는 2 개 이상의 아미노산 유형에 가장 가까운(즉, 샘플 점과 참조선 사이의 거리가 최소화된) 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도를 제공하는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도를 직접 계산하는 것을 허용함을 발견하였다.
이는 샘플 점과 참조선 상의 임의의 점 사이의 벡터로 참조선 방향의 내적(dot product)을 찾고, 내적을 0으로 설정하고, 샘플 점과 참조선 사이에 수직선을 제공하는 참조선의 농도를 품으로써 달성된다. 내적은 2 개의 벡터 A와 B 사이의 각도 관계, 즉,
Figure pct00029
를 나타내는 스칼라 값이며, 여기서 값 │A│ 및 │B│는 각각 벡터 A 및 B의 길이를 나타내고,
Figure pct00030
는 2개 벡터 사이의 각도이다. A 및 B가 수직이면(즉, 서로 90도) 내적은 0이 되는 데,
Figure pct00031
가 0이 되기 때문이다. 샘플 점과 참조선 사이의 이 거리가 계산되고, 이 거리가 오차 한계보다 작거나 동일하면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체는 최소 거리를 제공한 참조선 상의 단백질 농도로 존재하는 것으로 식별된다.
일부 구현예에서, 샘플 점이 하나 초과의 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 관심 단백체로부터의 오차 한계 또는 거리 임계값보다 작거나 동일하면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 혼합물이 샘플에서 식별된다. 혼합물 내의 구성요소가 혼합물의 더 큰 비율을 포함하면, 그의 서명은 혼합물 내에서 더 작은 비율을 포함하는 구성요소의 서명보다 샘플의 서명에 더 큰 영향을 미칠 것이다. 혼합물 내의 구성요소의 비율은 또한 본 발명의 방법을 사용하여 이용가능하다. 혼합물 내의 각 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 비율은 샘플과 샘플에 존재하는 것으로 식별된 각 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 사이의 거리를 비교함으로써 계산되고, 여기서 거리가 작을수록 혼합물 내의 구성요소의 비율이 더 크다는 것을 나타낸다. 일부 구현예에서, 혼합물의 각 식별된 구성요소에 대해 샘플 점에서 참조선까지 계산된 거리가 비교된다. 혼합물 내의 각 구성요소의 비율은 혼합물의 각 식별된 구성요소에 대해 정규화된 거리의 역으로부터 결정된다는 것이 발견되었다. 모든 식별된 구성요소에 대한 최대 거리가 계산되고, 이를 각 식별된 구성요소에 대한 거리로 나눈다. 일부 구현예에서, 혼합물 내의 식별된 구성요소의 비율은 역 정규화된 거리를 혼합물 내의 모든 구성요소로부터 역 정규화된 거리의 합으로 나눔으로써 계산된다.
본 발명의 방법은 샘플에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하기 위해 결정될 아미노산 서열 내의 아미노산의 순서(즉, 위치)를 필요로 하지 않는다. 본 발명의 방법은 샘플에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하기 위해 결정될 샘플에서 단백질 내의 아미노산의 서열을 필요로 하지 않는다.
본 발명의 방법은 본원에 개시된 식을 사용하여 대수적으로 기재된 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체에 대한 참조를 제공할 수 있다. 참조에는 단백질 농도라는 변수가 있다. 참조는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체의 임의의 농도에 대해 측정될 아미노산 농도 또는 형광 강도를 제공한다. 이 특징은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체가 식별될 때 정량화하는 것을 가능하게 만든다. 따라서, 본원에 개시된 방법은 정량적 기술을 제공한다.
항목
대표적인 특징은 하기 하기 항목에 제시되어 있으며, 이는 단독으로 있거나 명세서의 텍스트 및/또는 도면에 개시된 하나 이상의 특징과 임의의 조합으로 조합될 수 있다.
1a. 샘플 내에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 방법으로서, 하기 단계를 포함하는 방법:
a) 샘플 내에서 2 개 이상의 아미노산 유형을 표지화하되, 상기 아미노산 유형은 아미노산의 R-기에 의해 정의되는 것인, 단계;
b) 샘플에서 각 표지된 아미노산 유형의 표지를 측정하는 단계;
c) 임의적으로 측정된 표지로부터 각 표지된 아미노산 유형의 아미노산 농도를 계산하는 단계;
d) 임의적으로 각 표지된 아미노산 유형의 아미노산 수를 계산하는 단계; 및
e) 샘플에서 각 표지된 아미노산 유형의 측정된 표지 및/또는 아미노산 농도를 하나 이상의 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도와 비교하거나, 샘플에서 각 표지된 아미노산 유형의 아미노산 수를 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 아미노산 수와 비교함으로써 샘플에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 단계.
1b. 샘플에서 박테리아 및/또는 바이러스 및/또는 기생충 질환을 진단하는 방법으로서, 하기 단계를 포함하는 방법:
a) 샘플 내에서 2 개 이상의 아미노산 유형을 표지화하되, 상기 아미노산 유형은 아미노산의 R-기에 의해 정의되는 것인, 단계;
b) 샘플에서 각 표지된 아미노산 유형의 표지를 측정하는 단계;
c) 임의적으로 측정된 표지로부터 각 표지된 아미노산 유형의 아미노산 농도를 계산하는 단계;
d) 임의적으로 각 표지된 아미노산 유형의 아미노산 수를 계산하는 단계; 및
e) 샘플에서 각 표지된 아미노산 유형의 측정된 표지 및/또는 아미노산 농도를 하나 이상의 농도에서 하나 이상의 관심 박테리아, 바이러스 및/또는 기생충 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도와 비교하거나, 샘플에서 각 표지된 아미노산 유형의 아미노산 수를 하나 이상의 관심 바이러스, 박테리아 및/또는 기생충 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 아미노산 수와 비교함으로써 샘플에서 하나 이상의 관심 박테리아, 바이러스 및/또는 기생충 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별함으로써 샘플에서 박테리아 및/또는 바이러스 및/또는 기생충 질환을 식별하는 단계.
1c. 샘플에서 하나 이상의 박테리아 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 식별하는 방법으로서, 하기 단계를 포함하는 방법:
a) 샘플 내에서 2 개 이상의 아미노산 유형을 표지화하되, 상기 아미노산 유형은 아미노산의 R-기에 의해 정의되는 것인, 단계;
b) 샘플에서 각 표지된 아미노산 유형의 표지를 측정하는 단계;
c) 임의적으로 측정된 표지로부터 각 표지된 아미노산 유형의 아미노산 농도를 계산하는 단계;
d) 임의적으로 각 표지된 아미노산 유형의 아미노산 수를 계산하는 단계; 및
e) 샘플에서 각 표지된 아미노산 유형의 측정된 표지, 아미노산 농도 또는 아미노산 수를 하나 이상의 농도에서 하나 이상의 관심 박테리아 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도, 또는 하나 이상의 관심 박테리아 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 아미노산 수를 비교함으로써 샘플에서 하나 이상의 박테리아 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 단계.
1d. 샘플에서 하나 이상의 바이러스 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 식별하는 방법으로서, 하기 단계를 포함하는 방법:
a) 샘플 내에서 2 개 이상의 아미노산 유형을 표지화하되, 상기 아미노산 유형은 아미노산의 R-기에 의해 정의되는 것인, 단계;
b) 샘플에서 각 표지된 아미노산 유형의 표지를 측정하는 단계;
c) 임의적으로 측정된 표지로부터 각 표지된 아미노산 유형의 아미노산 농도를 계산하는 단계;
d) 임의적으로 각 표지된 아미노산 유형의 아미노산 수를 계산하는 단계; 및
e) 샘플에서 각 표지된 아미노산 유형의 측정된 표지 및/또는 아미노산 농도를 하나 이상의 농도에서 하나 이상의 관심 바이러스 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도와 비교하거나, 샘플에서 각 표지된 아미노산 유형의 아미노산 수를 하나 이상의 관심 바이러스 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 아미노산 수와 비교함으로써 샘플에서 하나 이상의 관심 바이러스 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 단계.
1e. 샘플에서 하나 이상의 기생충 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 식별하는 방법으로서, 하기 단계를 포함하는 방법:
a) 샘플 내에서 2 개 이상의 아미노산 유형을 표지화하되, 상기 아미노산 유형은 아미노산의 R-기에 의해 정의되는 것인, 단계;
b) 샘플에서 각 표지된 아미노산 유형의 표지를 측정하는 단계;
c) 임의적으로 측정된 표지로부터 각 표지된 아미노산 유형의 아미노산 농도를 계산하는 단계;
d) 임의적으로 각 표지된 아미노산 유형의 아미노산 수를 계산하는 단계; 및
e) 샘플에서 각 표지된 아미노산 유형의 측정된 표지 및/또는 아미노산 농도를 하나 이상의 농도에서 하나 이상의 관심 기생충 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도와 비교하거나, 샘플에서 각 표지된 아미노산 유형의 아미노산 수를 하나 이상의 관심 기생충 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 아미노산 수와 비교함으로써 샘플에서 하나 이상의 관심 기생충 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 단계.
1f. 샘플에서 하나 이상의 인간 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 식별하는 방법으로서, 하기 단계를 포함하는 방법:
a) 샘플 내에서 2 개 이상의 아미노산 유형을 표지화하되, 상기 아미노산 유형은 아미노산의 R-기에 의해 정의되는 것인, 단계;
b) 샘플에서 각 표지된 아미노산 유형의 표지를 측정하는 단계;
c) 임의적으로 측정된 표지로부터 각 표지된 아미노산 유형의 아미노산 농도를 계산하는 단계;
d) 임의적으로 각 표지된 아미노산 유형의 아미노산 수를 계산하는 단계; 및
e) 샘플에서 각 표지된 아미노산 유형의 측정된 표지 및/또는 아미노산 농도를 하나 이상의 농도에서 하나 이상의 관심 인간 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도와 비교하거나, 샘플에서 각 표지된 아미노산 유형의 아미노산 수를 하나 이상의 관심 인간 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 아미노산 수와 비교함으로써 샘플에서 하나 이상의 관심 인간 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 단계.
1g. 감염을 검출하거나 감염에 대한 숙주 반응을 식별하는 방법으로서, 하기 단계를 포함하는 방법:
a) 샘플 내에서 2 개 이상의 아미노산 유형을 표지화하되, 상기 아미노산 유형은 아미노산의 R-기에 의해 정의되는 것인, 단계;
b) 샘플에서 각 표지된 아미노산 유형의 표지를 측정하는 단계;
c) 임의적으로 측정된 표지로부터 각 표지된 아미노산 유형의 아미노산 농도를 계산하는 단계;
d) 임의적으로 각 표지된 아미노산 유형의 아미노산 수를 계산하는 단계; 및
e) 샘플에서 각 표지된 아미노산 유형의 측정된 표지 및/또는 아미노산 농도를 하나 이상의 농도에서 감염, 또는 감염에 대한 숙주 반응과 관련한 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도와 비교하거나, 샘플에서 각 표지된 아미노산 유형의 아미노산 수를 감염, 또는 감염에 대한 숙주 반응과 관련한 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 아미노산 수와 비교함으로써 샘플에서 감염, 또는 감염에 대한 숙주 반응과 관련한 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 단계.
1h. 암을 검출하는 방법으로서, 하기 단계를 포함하는 방법:
a) 샘플 내에서 2 개 이상의 아미노산 유형을 표지화하되, 상기 아미노산 유형은 아미노산의 R-기에 의해 정의되는 것인, 단계;
b) 샘플에서 각 표지된 아미노산 유형의 표지를 측정하는 단계;
c) 임의적으로 측정된 표지로부터 각 표지된 아미노산 유형의 아미노산 농도를 계산하는 단계;
d) 임의적으로 각 표지된 아미노산 유형의 아미노산 수를 계산하는 단계; 및
e) 샘플에서 각 표지된 아미노산 유형의 측정된 표지 및/또는 아미노산 농도를 하나 이상의 농도에서 암과 관련된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도와 비교하거나, 샘플에서 각 표지된 아미노산 유형의 아미노산 수를 암과 관련된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 아미노산 수와 비교함으로써 샘플에서 암과 관련된 하나 이상의 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 단계.
2. 항목 1a 내지 1h 중 어느 한 항목에 있어서, 상기 샘플이 체액 샘플인, 방법.
3. 항목 2에 있어서, 상기 체액 샘플이 전혈 샘플, 혈청 샘플, 혈장 샘플, 샐비어(salvia) 샘플, 가래 샘플, 대변 샘플, 소변 샘플, 정액 샘플, 비강 면봉 샘플, 비인두 흡인물 샘플, 인후 면봉, 하기도 샘플, 뇌척수(CSF) 샘플, 모유 샘플, 성 건강 샘플 또는 병변에 의해 생성된 조직 샘플 또는 유체인, 방법.
4. 항목 3에 있어서, 상기 성 건강 샘플이 요도 면봉, 자궁경부 면봉, 질 면봉 또는 직장 면봉인 방법.
4a. 항목 2에 있어서, 상기 샘플이 혈액 샘플 또는 소변 샘플인, 방법.
5. 항목 3에 있어서, 상기 하기도 샘플이 하기도 점액 흡인물 샘플인, 방법.
6. 항목 3에 있어서, 상기 조직 샘플이 조직의 생검인, 방법.
7. 항목 6에 있어서, 상기 조직이 고형 상태 종양인, 방법.
8. 항목 6에 있어서, 상기 조직이 육종, 림프종, 암종 및 흑색종인, 방법.
9. 항목 1a 내지 1h 중 어느 한 항목에 있어서, 상기 샘플이 수의과 샘플인, 방법.
10. 항목 9에 있어서, 상기 수의과 샘플이 고양이 샘플, 개 샘플, 소 샘플, 돼지 샘플, 말 샘플, 당나귀 샘플, 양 샘플, 염소 샘플, 어류 샘플, 게 샘플, 코랄린(corraline) 샘플, 호마린(homarine) 샘플, 오스트라신(ostracine) 샘플, 파충류 샘플, 조류 샘플, 갈린(galline) 샘플, 멜레아그린(meleagrine) 샘플, 오리 샘플, 거위 샘플, 사슴 샘플, 토끼 샘플, 라핀(lapine) 샘플, 녹틸리오닌(noctilionine) 샘플, 뮤린 샘플, 풀리신(pulicine) 샘플, 안카린(ancarine) 샘플, 모기 샘플, 세르코피테신(cercopithecine) 샘플, 또는 폴리도타(pholidota) 샘플인, 방법.
11. 항목 1a 내지 1h 중 어느 한 항목에 있어서, 상기 샘플이 토양 샘플, 환경적 샘플, 농작물 샘플, 식품 샘플, 음료 샘플 또는 실험실 샘플인, 방법.
12. 항목 11에 있어서, 상기 환경적 샘플이 음용수 샘플 또는 폐수 샘플과 같은 물 샘플; 또는 생물학전(biological warfare)이 의심되는 샘플; 또는 우주생물학적 샘플인, 방법.
13. 항목 11에 있어서, 상기 식품 샘플이 기능성 식품 샘플인, 방법.
14. 항목 13에 있어서, 상기 기능성 식품 샘플이 영아용 조제 샘플 또는 스포츠 영양 샘플인, 방법.
15. 항목 11에 있어서, 상기 식품 샘플이 식이 보충제 샘플인, 방법.
16. 항목 11에 있어서, 상기 식품 샘플이 발효 식품 샘플인, 방법.
17. 항목 11에 있어서, 상기 식품 샘플이 유제품 샘플, 계란 샘플, 젤라틴 샘플, 대두 샘플, 밀 샘플, 채소 샘플, 콩 샘플, 견과류 샘플 또는 양조된 대두 제품 샘플인, 방법.
18. 항목 11에 있어서, 상기 식품 샘플이 알레르겐 또는 박테리아 또는 바이러스 또는 기생충을 함유하는 것으로 의심되는 것인, 방법.
19. 항목 18에 있어서, 상기 식품 샘플이 육류 샘플이고, 육류 샘플이 에스케리키아 콜라이(Escherichia Coli), 살모넬라(Salmonela), 스타필로코쿠스 아우레우스(Staphylococcus Aureus), 리스테리아 모노사이토게네스(Listeria Monocytogenes), 예르시니아 엔테로콜리티카(Yersinia Enterocolitica), 살모넬라 엔테리티디스(Salmonella Enteritidis), 캄필로박터 제주니(Campylobacter Jejuni), 클로스트리듐 퍼프린겐스(Clostridium perfringens), 클로스트리듐 퍼프린겐스, 노로바이러스(Norovirus), 톡소플라스마 곤디이(Toxoplasma gondii), 촌충, 회충, 또는 고래회충을 함유하는 것으로 의심되는 것인, 방법.
20. 항목 18에 있어서, 상기 알레르겐이 땅콩, 글루텐, 락토스, 조개류, 어류, 참깨, 꽃가루, 카세인, 리포칼린, c-형 리소자임, 프로테아제 억제제, 트로포미오신, 파브알부민, 고양이 비듬 또는 개 비듬인, 방법.
21. 항목 11에 있어서, 상기 음료 샘플이 우유 샘플, 물 샘플, 과일 주스 샘플, 케피어(kefir) 샘플, 또는 콤부차(kombucha) 샘플인, 방법.
22. 항목 1a 내지 1h에 있어서, 상기 샘플이 백신인, 방법.
23. 항목 22에 있어서, 상기 샘플이 인플루엔자 백신, SARS-CoV-2 백신, 6-in-1 백신, 폐렴구균(Pneumococcal) 백신, MenB 백신, Hib/MenC 백신, MMR 백신, 4-in-1 취학전 부스터 백신, HPV 백신, 3-in-1 십대 부스터 백신, 파상풍 백신, 대상포진 백신, BCG(TB) 백신, B형 간염 백신, 또는 수두(Chickenpox) 백신인, 방법.
24. 항목 1 내지 23 중 어느 한 항목에 있어서, 상기 하나 이상의 관심 단백질 또는 펩티드가 α-시누클레인, 리소자임, 소 혈청 알부민, 오브알부민, β-락토글로불린, 인슐린, 글루카곤, 아밀로이드 β, 안지오텐신-전환 효소 2, 안지오텐신-전환 효소, 브래디키닌, 코르딘-유사 단백질 1, 종양 괴사 인자 β, 오스테오모듈린 전구체, 매트릭스 메탈로프로테이나제, 플레이오트로핀, 세크레토그라닌-3, 인간 성장 호르몬, 인슐린-유사 성장 인자 1, 렙틴, 텔로머라제, 갑상선-자극 호르몬, 및 이의 임의의 조합을 함유하는 군으로부터 선택되는 것인, 방법.
25. 항목 1 내지 23 중 어느 한 항목에 있어서, 상기 하나 이상의 관심 단백체가 하나 이상의 인간 단백체인, 방법.
26. 항목 25에 있어서, 상기 하나 이상의 인간 단백체가 인간 혈장 단백체, 인간 눈 단백체, 망막, 심장, 골격근, 평활근, 부신, 부갑상선, 갑상선, 뇌하수체, 폐, 골수, 림프 조직, 간, 담낭, 고환, 부고환, 전립선, 정낭, 정관, 지방질 조직, 뇌, 타액선, 식도, 혀, 위, 장, 췌장, 신장, 방광, 유방, 질, 자궁경부, 자궁내막, 나팔관, 난소, 태반, 피부 또는 혈액 단백체, 인간 대사 단백체, 인간 분비 단백체, 줄기 세포 단백체, 적혈구 단백체, 호중구 단백체, 호산구 단백체, 호염기성 단백체, 단핵구 단백체, 림프구 단백체, 뉴런 단백체, 신경교 단백체, 골격근 단백체, 심근 단백체, 평활근 단백체, 연골세포 단백체, 골아세포 단백체, 파골세포 단백체, 골세포 단백체, 뼈 내층 세포 단백체, 각질세포 단백체, 멜라닌세포 단백체, 메르켈 세포 프로테온, 랑게르한스 세포 단백체, 내피 세포 단백체, 상피 세포 단백체, 백색 지방세포 단백체, 갈색 지방세포 단백체, 상기도 세포 단백체, 정자 단백체, 또는 난자 단백체, 및 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
27. 항목 1 내지 23 중 어느 한 항목에 있어서, 상기 하나 이상의 관심 단백체가 하나 이상의 인간 암 하위단백체 및/또는 단백체인, 방법.
28. 항목 27에 있어서, 상기 하나 이상의 인간 암 단백체 및/또는 하위단백체가 인간 췌장암 단백체, 인간 신경교종 단백체, 인간 두경부 단백체, 인간 갑상선 단백체, 인간 폐 단백체, 인간 간 단백체, 인간 고환 단백체, 인간 전립선 단백체, 인간 위 단백체, 인간 결장/직장 단백체, 인간 유방 단백체, 인간 자궁내막 단백체, 인간 난소 단백체, 인간 자궁경부 단백체, 인간 췌장 단백체, 인간 신장 단백체, 인간 비뇨기 및 방광 단백체, 인간 흑색종 단백체, 인간 I형 당뇨병 하위단백체, 인간 II형 당뇨병 하위단백체, 알츠하이머병 하위단백체, 인간 파킨슨병 하위단백체, 인간 루이소체 치매 하위단백체, 인간 치매 하위단백체, 인간 대사 증후군 하위단백체, 인간 비만 하위단백체, 인간 심혈관 질환 하위단백체, 인간 다운 증후군 하위단백체, 인간 노화 하위단백체, 인간 사이토카인 하위단백체, 인간 면역 하위단백체, 박테리아 감염에 대한 인간 하위단백체, 바이러스 감염에 대한 인간 하위단백체, 코로나바이러스 감염에 대한 인간 하위단백체, SARS-CoV-2 감염에 대한 인간 하위단백체, IFN, IL-6, IL1RA, CCL2, CCL8 CXCL2, CXCL8, CXCL9, 및 CXCL16을 포함하는 SARS-CoV-2 감염에 대한 인간 하위단백체 및 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
28a. 항목 28에 있어서, 상기 하나 이상의 암 단백체가 인간 난소암 단백체, 인간 췌장암 단백체, 인간 결장직장암 단백체, 인간 방광암 단백체, 인간 전립선암 단백체, 인간 신암 단백체로 이루어진 군으로부터 선택되는 것인, 방법.
28b. 항목 27에 있어서, 상기 췌장암, 결장직장암, 인간 신경교종, 두경부암, 갑상선암, 폐암, 간암, 고환암, 전립선암, 위암, 결장/직장 암, 유방암, 자궁내막암, 난소암, 자궁경부암, 신장암, 신암, 림프종, 방광암, 인간 흑색종, 뇌암, 자궁내막암, 백혈병, 요로상피암 및 이의 임의의 조합으로 이루어진 군으로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 개의 인간 암 단백체가 샘플에서 검출되는 것인, 방법.
28c. 항목 27, 28a, 또는 28b에 있어서, 상기 방법이 샘플에서 하나 이상의 암 단백체의 양을 결정하고 암의 양이 샘플에서 암의 병기 또는 등급을 지칭하는 것인, 방법.
28d. 항목 28c에 있어서, 상기 병기가 I기, II기, III기 또는 IV기, 또는, T1, T2, T3, T4, N0, N1, N2, N3, M0 또는 M1과 같은 TNM 병기 시스템인, 방법.
28e. 항목 28c에 있어서, 상기 등급이 등급 I, II 또는 III인, 방법.
28f. 항목 27, 28a, 또는 28b에 있어서, 상기 암의 존재가 환자에서 암의 위치를 지칭하는 것인, 방법.
29. 항목 1 내지 23 중 어느 한 항목에 있어서, 상기 하나 이상의 관심 단백체가 하나 이상의 바이러스 단백체인, 방법.
30. 항목 29에 있어서, 상기 하나 이상의 바이러스 단백체가 인간 유두종 바이러스(HPV) 단백체, 인간 면역결핍 바이러스(HIV) 단백체, 오르토믹소바이러스과(Orthomyxoviridae) 단백체, 엡스타인 바(Epstein Barr) 단백체, 에볼라바이러스 단백체, 광견병 리사바이러스 단백체, 코로노바이러스 단백체, 노보바이러스 단백체, A형 간염 단백체, B형 간염 단백체, C형 간염 단백체, E형 간염 단백체, 델타 간염 단백체, 헤르페스바이러스 단백체, 유두종바이러스 단백체, 리노바이러스 단백체, 홍역 바이러스 단백체, 볼거리 바이러스 단백체, 폴리오바이러스 단백체, 광견병 단백체, 로타바이러스 단백체, 웨스트 나일 바이러스 단백체, 황열 바이러스 단백체, 지카 바이러스 단백체, 카우도비랄레스(Caudovirales) 단백체, 니마바이러스과(Nimaviridae) 단백체, 리보비리아(Riboviria) 단백체, 이노비리다에(Inoviridae) 단백체, 푸셀로비리다에(Fuselloviridae) 단백체, 헤르페스비랄레스(Herpesvirales) 단백체, 아스파르비리다에(Asfarviridae) 단백체, 비카우다비리다에(Bicaudaviridae) 단백체, 폐결핵 단백체, 소 폐결핵 단백체, 및 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
31. 항목 30에 있어서, 상기 오르토믹소바이러스과 단백체가 인플루엔자 단백체인, 방법.
32. 항목 30에 있어서, 상기 인플루엔자 단백체가 인플루엔자 A 단백체, 인플루엔자 A 아형 H1N1 단백체, 인플루엔자 B 단백체, 인플루엔자 C 단백체 및/또는 인플루엔자 D 단백체, 또는 이의 임의의 조합인, 방법.
33. 항목 30에 있어서, 상기 코로나바이러스 단백체가 SARS-CoV-2 단백체, SARS-CoV 단백체, 및/또는 MERS-CoV 단백체인, 방법.
34. 항목 33에 있어서, 상기 코로나바이러스 단백체가 SARS-CoV-2 단백체 및 이의 임의의 돌연변이인, 방법.
35. 항목 1 내지 34 중 어느 한 항목에 있어서, 상기 하나 이상의 관심 단백체가 하나 이상의 박테리아 단백체인, 방법.
36. 항목 35에 있어서, 상기 하나 이상의 박테리아 단백체가 에스케리키아 콜라이(이. 콜라이(E. coli)) 단백체, 슈도모나스 애루기노사(Pseudomonas aeruginosa)(피. 애루기노사(P. aeruginosa)) 단백체, 살모넬라 단백체, 스타필로코쿠스 아우레우스 단백체, 아시네토박터 바우만니이(Acinetobacter baumannii) 단백체, 박테로이데스 프라길리스(Bacteroides fragilis) 단백체, 부르콜데리아 세파시아(Burkholderia cepacia) 단백체, 클로스트리듐 디피실(Clostridium difficile) 단백체, 클로스트리듐 소르델리이(Clostridium sordellii) 단백체, 엔테로박테리아세아에(Enterobacteriaceae) 단백체, 엔테로코쿠스 파에칼리스(Enterococcus faecalis) 단백체, 클렙시엘라 뉴모니아에(Klebsiella pneumoniae) 단백체, 메티실린(Methicillin)-내성 스타필로코쿠스 아우레우스 단백체, 모르가넬라 모르가니이(Morganella morganii) 단백체, 마이코박테리움(Mycobacterium) 단백체 및 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
37. 항목 36에 있어서, 상기 마이코박테리움 단백체가 마이코박테리움 투베르쿨로시스 단백체인, 방법.
38. 항목 1 내지 23 중 어느 한 항에 있어서, 상기 하나 이상의 관심 단백체가 하나 이상의 기생충 단백체인, 방법.
39. 항목 38에 있어서, 상기 하나 이상의 기생충 단백체가 말라리아원충(Plasmodium) 단백체, 톡소플라스마 곤디이 단백체, 트리코모나스 바기날리스(Trichomonas vaginalis) 단백체, 기아르디아 듀오데날리스(Giardia duodenalis) 단백체, 크립토포리디우(Cryptosporidiu) 단백체 또는 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
40. 항목 39에 있어서, 상기 말라리아원충 단백체가 플라스모디움 팔시파룸(Plasmodium falciparum) 단백체, 플라스모디움 놀레시(Plasmodium knowlesi) 단백체, 플라스모디움 말라리아에(Plasmodium malariae) 단백체, 플라스모디움 오발레(Plasmodium ovale) 단백체 및/또는 플라스모디움 비박스(Plasmodium vivax) 단백체인, 방법.
41. 항목 1a, 1b, 1e 내지 1h에 있어서, 상기 하나 이상의 관심 하위단백체가 기생충 단백체에 대한 숙주 반응인, 방법.
42. 항목 1a, 1g 또는 1h에 있어서, 상기 하나 이상의 관심 단백체가 고세균 단백체인, 방법.
43. 항목 1 내지 41 중 어느 한 항목에 있어서, 상기 하나 이상의 관심 단백체가 하나 이상의 박테리아 단백체, 하나 이상의 바이러스 단백체 및/또는 하나 이상의 기생충 단백체 및 이의 임의의 조합의 혼합물인, 방법.
44. 항목 1 내지 23 중 어느 한 항목에 있어서, 상기 하나 이상의 관심 단백체가 병원성 단백체인, 방법.
45. 항목 44에 있어서, 상기 병원성 단백체가 박테리아 단백체 및/또는 바이러스 단백체인, 방법.
46. 항목 1 내지 23 중 어느 한 항목에 있어서, 상기 하나 이상의 관심 단백질이 프리온인, 방법.
47. 항목 46에 있어서, 상기 프리온이 크로이츠펠트-야콥 병(CJD)을 유발하는 것인, 방법.
48. 항목 1 내지 23 중 어느 한 항목에 있어서, 상기 하나 이상의 관심 단백체가 임의의 관심 박테리아 패밀리 내의 단백체인, 방법.
49. 항목 1 내지 23 중 어느 한 항목에 있어서, 상기 하나 이상의 관심 하위단백체가 박테리아 단백체에 대한 숙주 반응인, 방법.
50. 항목 1 내지 23 중 어느 한 항목에 있어서, 상기 박테리아 단백체 및 숙주-반응 하위단백체의 존재가 샘플에서 검출되는 것인, 방법.
51. 항목 29에 있어서, 상기 하나 이상의 관심 바이러스 단백체가 수의과 바이러스 단백체인, 방법.
52. 항목 51에 있어서, 상기 수의과 바이러스 단백체가 랍도바이러스(Rhabdoviruse) 단백체, 구제역 바이러스(Foot-and-mouth disease virus) 단백체, 페스티바이러스(Pestiviruses) 단백체, 아르테리바이러스(Arteriviruses) 단백체, 코로나바이러스 단백체, 토로바이러스(Toroviruse) 단백체, 인플루엔자 단백체, 블루텅병 바이러스(Bluetongue virus), 또는 써코바이러스(Circoviruses) 단백체 및 이의 임의의 조합인, 방법.
53. 항목 52에 있어서, 상기 인플루엔자 단백체가 조류 인플루엔자 단백체 또는 돼지 인플루엔자 단백체인, 방법.
54. 항목 52에 있어서, 상기 써코바이러스 단백체가 헤르페스바이러스 단백체, 아프리카 돼지 열병 바이러스 프로토엠(protoeme), 레트로바이러스(Retrovirus) 단백체, 플라비바이러스(Flavivirus) 단백체, 파라믹소바이러스(Paramyxovirus) 단백체, 또는 파를로바이러스(Parlovirus) 단백체인, 방법.
55. 항목 1 내지 54 중 어느 한 항목에 있어서, 상기 2 개 이상의 아미노산 유형이 알라닌(A), 아르기닌(R), 아스파라긴(N), 아스파르트산(D), 시스테인(C), 글루탐산(E), 글루타민(Q), 글리신(G), 히스티딘(H), 이소류신(I), 류신(L), 리신(K), 메티오닌(M), 페닐알라닌(F), 프롤린(P), 피롤리신(O), 셀레노시스테인(U), 세린(S), 트레오닌(T), 트립토판(W), 티로신(Y) 및 발린(V), 또는 합성 아미노산, N-말단, 및 C-말단, 및 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
56. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 알라닌(A), 아르기닌(R), 아스파라긴(N), 아스파르트산(D), 시스테인(C), 글루탐산(E), 글루타민(Q), 글리신(G), 히스티딘(H), 이소류신(I), 류신(L), 리신(K), 메티오닌(M), 페닐알라닌(F), 프롤린(P), 피롤리신(O), 셀레노시스테인(U), 세린(S), 트레오닌(T), 트립토판(W), 티로신(Y) 및 발린(V), 및 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
57. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 아르기닌(R), 아스파라긴(N), 아스파르트산(D), 시스테인(C), 글루탐산(E), 글루타민(Q), 글리신(G), 히스티딘(H), 리신(K), 메티오닌(M), 페닐알라닌(F), 프롤린(P), 피롤리신(O), 셀레노시스테인(U), 세린(S), 트레오닌(T), 트립토판(W), 티로신(Y) 및 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법
58. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 알라닌(A), 아르기닌(R), 아스파라긴(N), 아스파르트산(D), 시스테인(C), 글루탐산(E), 글루타민(Q), 히스티딘(H), 이소류신(I), 류신(L), 리신(K), 메티오닌(M), 페닐알라닌(F), 프롤린(P), 피롤리신(O), 셀레노시스테인(U), 세린(S), 트레오닌(T), 트립토판(W), 티로신(Y) 및 발린(V), 및 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
59. 항목 55에 있어서, 상기 샘플 내에서 표지된 2 개 이상의 아미노산 유형이 트립토판(W), 시스테인(C), 티로신(Y), 리신(K), 아르기닌(R), 히스티딘(H), 프롤린(P), 아스파르트산(D), 글루탐산(E), 아스파라긴(B), 글루타민(Q), 세린(S) 또는 트레오닌(T) 및 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
60. 항목 55에 있어서, 상기 샘플 내에서 표지된 2 개 이상의 아미노산 유형이 리신 및 트립토판; 시스테인(C) 및 트립토판(W); 리신(K) 및 시스테인(C); 리신(K) 및 티로신(Y); 시스테인(C) 및 티로신(Y); 트립토판(W) 및 티로신(Y); 류신(L) 및 세린(S); 류신(L) 및 리신(K); 글루탐산(E) 및 류신(L); 글리신(G) 및 류신(L); 알라닌(A) 및 류신(L); 아스파르트산(D) 및 류신(L); 류신(L) 및 세린(S); 류신(L) 및 프롤린(P); 류신(L) 및 발린(V); 리신(K) 및 세린(S); 글루탐산(E) 및 류신(L); 알라닌(A) 및 아르기닌(R); 알라닌(A) 및 글루탐산(E); 알라닌(A) 및 글리신(G); 또는 알라닌(A) 및 이소류신(I)으로 이루어진 군으로부터 선택되는 것인, 방법.
61. 항목 55에 있어서, 상기 샘플 내에서 표지된 2 개 이상의 아미노산 유형이 트립토판(W), 시스테인(C), 티로신(Y), 리신(K), 아르기닌(R), 히스티딘(H), 프롤린(P), 아스파르트산(D), 글루탐산(E), 아스파라긴(B) 및/또는 글루타민(Q) 및 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
62. 항목 55에 있어서, 상기 샘플 내에서 표지된 2 개 이상의 아미노산 유형이 트립토판(W), 시스테인(C), 티로신(Y) 및/또는 리신(K) 및 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
63. 항목 55에 있어서, 상기 2 개 이상의 아미노산이 시스테인(C), 아르기닌(R), 히스티딘(H) 및/또는 아스파르트산(D) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
64. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 시스테인(C), 아르기닌(R), 히스티딘(H) 및/또는 글루탐산(E) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
65. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 시스테인(C), 아르기닌(R), 히스티딘(H) 및/또는 글루타민(Q) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
66. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 시스테인(C), 아르기닌(R), 트립토판(W) 및/또는 아스파르트산(D) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
67. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 리신(K), 아르기닌(R), 히스티딘(H) 및/또는 아스파르트산(D) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
68. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 리신(K), 트립토판(W), 아르기닌(R) 및/또는 글루탐산(E) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
69. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 티로신(Y), 리신(K), 시스테인(C) 및/또는 아스파르트산(D) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
70. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 티로신(Y), 리신(K), 시스테인(C) 및/또는 글루탐산(E) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
71. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 프롤린(P), 시스테인(C), 아르기닌(R), 및/또는 글루탐산(E) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
72. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 프롤린(P), 시스테인(C), 아르기닌(R) 및/또는 아스파르트산(D) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
73. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 시스테인(C), 아스파라긴(B), 아르기닌(R) 및/또는 아스파르트산(D) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
74. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 시스테인(C), 아스파라긴(B), 아르기닌(R) 및/또는 글루탐산(E) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
75. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 리신(K), 아스파라긴(B), 트립토판(W) 및/또는 시스테인(C) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
76. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 아르기닌(R), 히스티딘(H), 프롤린(P) 및/또는 아스파르트산(D) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
77. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 아르기닌(R), 리신(K), 시스테인(C) 및/또는 아스파르트산(D) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
78. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 아르기닌(R), 리신(K), 시스테인(C) 및/또는 글루탐산(E) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
79. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 아르기닌(R), 리신(K), 시스테인(C) 및/또는 트립토판(W) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
80. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 아르기닌(R), 리신(K), 시스테인(C) 및/또는 티로신(Y) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
81. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 아르기닌(R), 리신(K), 히스티딘(H) 및/또는 트립토판(W) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
82. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 아르기닌(R), 리신(K), 히스티딘(H) 및/또는 시스테인(C) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
83. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 아르기닌(R), 리신(K), 히스티딘(H) 및/또는 티로신(Y) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
84. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 아르기닌(R), 시스테인(C), 트립토판(W) 및/또는 티로신(Y) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
85. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 아르기닌(R), 시스테인(C), 트립토판(W) 및/또는 프롤린(P) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
86. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 트립토판(W), 시스테인(C) 및/또는 리신(K) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
87. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 리신(K), 트립토판(W) 및/또는 티로신(Y) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
88. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 트립토판(W), 티로신(Y) 및/또는 시스테인(C) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
89. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 트립토판(W), 티로신(Y) 및/또는 리신(K) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
90. 항목 55에 있어서, 상기 2 개 이상의 아미노산 유형이 시스테인(C), 트립토판(W) 및/또는 티로신(Y) 및 이의 임의의 조합으로부터 선택되는 것인, 방법.
91. 항목 1a 내지 1h에 있어서, 상기 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40 개의 아미노산 유형이 샘플 내에서 표지되는 것인, 방법.
92. 항목 91에 있어서, 상기 2 개의 아미노산 유형이 표지되는 것인, 방법.
93. 항목 92에 있어서, 상기 표지된 2 개의 아미노산 유형이 알라닌(A), 아르기닌(R), 아스파라긴(N), 아스파르트산(D), 시스테인(C), 글루탐산(E), 글루타민(Q), 글리신(G), 히스티딘(H), 이소류신(I), 류신(L), 리신(K), 메티오닌(M), 페닐알라닌(F), 프롤린(P), 피롤리신(O), 셀레노시스테인(U), 세린(S), 트레오닌(T), 트립토판(W), 티로신(Y) 및 발린(V) 및 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
94. 항목 92에 있어서, 상기 2 개의 아미노산 유형이 류신(L) 및 세린(S)인, 방법.
95. 항목 92에 있어서, 상기 2 개의 아미노산 유형이 류신(L) 및 리신(K)인, 방법.
96. 항목 92에 있어서, 상기 2 개의 아미노산 유형이 류신(L) 및 글루탐산(E)인, 방법.
97. 항목 92에 있어서, 상기 2 개의 산 유형이 글리신(G) 및 류신(L)인, 방법.
98. 항목 92에 있어서, 상기 2 개의 아미노산 유형이 알라닌(A) 및 류신(L)인, 방법.
99. 항목 92에 있어서, 상기 2 개의 아미노산 유형이 아스파르트산(D) 및 류신(L)인, 방법.
100. 항목 92에 있어서, 상기 2 개의 아미노산 유형이 류신(L) 및 프롤린(P)인, 방법.
101. 항목 92에 있어서, 상기 2 개의 아미노산 유형이 류신(L) 및 발린(V)인, 방법.
102. 항목 92에 있어서, 상기 2 개의 아미노산 유형이 리신(K) 및 세린(S)인, 방법.
103. 항목 92에 있어서, 상기 2 개의 아미노산 유형이 글루탐산(E) 및 류신(L)인, 방법.
104. 항목 92에 있어서, 상기 2 개의 아미노산 유형이 알라닌(A) 및 아르기닌(R)인, 방법.
105. 항목 92에 있어서, 상기 2 개의 아미노산이 알라닌(A) 및 글루탐산(E)인, 방법.
106. 항목 92에 있어서, 상기 2 개의 아미노산이 알라닌(A) 및 글리신(G)인, 방법.
107. 항목 91에 있어서, 상기 3 개의 아미노산 유형이 표지되는 것인, 방법.
108. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 알라닌(A), 아르기닌(R), 아스파라긴(N), 아스파르트산(D), 시스테인(C), 글루탐산(E), 글루타민(Q), 글리신(G), 히스티딘(H), 이소류신(I), 류신(L), 리신(K), 메티오닌(M), 페닐알라닌(F), 프롤린(P), 피롤리신(O), 셀레노시스테인(U), 세린(S), 트레오닌(T), 트립토판(W), 티로신(Y) 및 발린(V) 및 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
109. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 트립토판(W), 시스테인(C), 및 티로신(Y)인, 방법.
110. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 시스테인(C), 티로신(Y) 및 리신(K)인, 방법.
111. 항목 107에 있어서, 상기 3 개의 아미노산 유형이 트립토판(W), 시스테인(C) 및 리신(K)인, 방법.
112. 항목 107에 있어서, 상기 3 개의 아미노산 유형이 리신(K), 트립토판(W) 및 티로신(Y)인, 방법.
113. 항목 107에 있어서, 상기 3 개의 아미노산 유형이 트립토판(W), 티로신(Y) 및 시스테인(C)인, 방법.
114. 항목 107에 있어서, 상기 3 개의 아미노산 유형이 트립토판(W), 티로신(Y) 및 리신(K)인, 방법.
115. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 시스테인(C), 트립토판(W) 및 티로신(Y)인, 방법.
116. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 아스파라긴(R), 글루탐산(E) 및 글리신(G)인, 방법.
117. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 알라닌(A), 류신(L) 및 세린(S)인, 방법.
118. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 아스파라긴(A), 글루탐산(E) 및 류신(L)인, 방법.
119. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 알라닌(A), 아스파르트산(D) 및 류신(L)인, 방법.
120. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 알라닌(A), 류신(L) 및 프롤린(P)인, 방법.
121. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 알라닌(A), 글루탐산(E) 및 류신(L)인, 방법.
122. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 류신(L), 세린(S) 및 발린(S)인, 방법.
123. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 글루탐산(E), 이소류신(I) 및 프롤린(P)인, 방법.
124. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 글루탐산(E), 글리신(G) 및 발린(V)인, 방법.
125. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 아르기닌(R), 세린(S) 및 발린(V)인, 방법.
126. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 알라닌(A), 류신(L) 및 리신(K)인, 방법.
127. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 알라닌(A), 아르기닌(R) 및 류신(L)인, 방법.
128. 항목 107에 있어서, 상기 표지된 3 개의 아미노산 유형이 알라닌(A), 류신(L) 및 발린(V)인, 방법.
129. 항목 91에 있어서, 상기 4 개의 아미노산 유형이 표지되는 것인, 방법.
130. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 알라닌(A), 아르기닌(R), 아스파라긴(N), 아스파르트산(D), 시스테인(C), 글루탐산(E), 글루타민(Q), 글리신(G), 히스티딘(H), 이소류신(I), 류신(L), 리신(K), 메티오닌(M), 페닐알라닌(F), 프롤린(P), 피롤리신(O), 셀레노시스테인(U), 세린(S), 트레오닌(T), 트립토판(W), 티로신(Y) 및 발린(V), 및 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
131. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 트립토판(W), 티로신(Y), 리신(K) 및 시스테인(C)인, 방법.
132. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 시스테인(C), 아르기닌(R), 히스티딘(H) 및 아스파르트산(D)인, 방법.
133. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 시스테인(C), 아르기닌(R), 히스티딘(H) 및 글루탐산(E)인, 방법.
134. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 시스테인(C), 아르기닌(R), 히스티딘(H) 및 글루타민(Q)인, 방법.
135. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 시스테인(C), 아르기닌(R), 트립토판(W) 및 아스파르트산(D)인, 방법.
136. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 리신(K), 아르기닌(R), 히스티딘(H) 및 아스파르트산(D)인, 방법.
137. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 리신(K), 트립토판(W), 아르기닌(R) 및 글루탐산(E)인, 방법.
138. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 티로신(Y), 리신(K), 시스테인(C) 및 아스파르트산(D)인, 방법.
139. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 티로신(Y), 리신(K), 시스테인(C) 및 글루탐산(E)인, 방법.
140. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 프롤린(P), 시스테인(C), 아르기닌(R), 및 글루탐산(E)인, 방법.
141. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 프롤린(P), 시스테인(C), 아르기닌(R) 및 아스파르트산(D)인, 방법.
142. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 시스테인(C), 아스파라긴(B), 아르기닌(R) 및 아스파르트산(D)인, 방법.
143. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 시스테인(C), 아스파라긴(B), 아르기닌(R) 및 글루탐산(E)인, 방법.
144. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 리신(K), 아스파라긴(B), 트립토판(W) 및 시스테인(C)인, 방법.
145. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 아르기닌(R), 히스티딘(H), 프롤린(P) 및 아스파르트산(D)인, 방법.
146. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 아르기닌(R), 리신(K), 시스테인(C) 및 아스파르트산(D)인, 방법.
147. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 아르기닌(R), 리신(K), 시스테인(C) 및 글루탐산(E)인, 방법.
148. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 아르기닌(R), 리신(K), 시스테인(C) 및 트립토판(W)인, 방법.
149. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 아르기닌(R), 리신(K), 시스테인(C) 및 티로신(Y)인, 방법.
150. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 아르기닌(R), 리신(K), 히스티딘(H) 및 트립토판(W)인, 방법.
151. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 아르기닌(R), 리신(K), 히스티딘(H) 및 시스테인(C)인, 방법.
152. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 아르기닌(R), 리신(K), 히스티딘(H) 및 티로신(Y)인, 방법.
153. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 아르기닌(R), 시스테인(C), 트립토판(W) 및 티로신(Y)인, 방법.
154. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 아르기닌(R), 시스테인(C), 트립토판(W) 및 프롤린(P)인, 방법.
155. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 글루타민(Q), 류신(L), 리신(K) 및 발린(V)인, 방법.
156. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 아르기닌(R), 이소류신(I), 류신(L) 및 세린(S)인, 방법.
157. 항목 129에 있어서, 상기 표지된 4 개의 아미노산 유형이 알라닌(A), 아스파라긴(N), 글루탐산(E), 및 세린(S)인, 방법.
158. 항목 91에 있어서, 상기 5 개의 아미노산 유형이 표지되는 것인, 방법.
159. 항목 158에 있어서, 상기 표지된 5 개의 아미노산 유형이 알라닌(A), 아르기닌(R), 아스파라긴(N), 아스파르트산(D), 시스테인(C), 글루탐산(E), 글루타민(Q), 글리신(G), 히스티딘(H), 이소류신(I), 류신(L), 리신(K), 메티오닌(M), 페닐알라닌(F), 프롤린(P), 피롤리신(O), 셀레노시스테인(U), 세린(S), 트레오닌(T), 트립토판(W), 티로신(Y) 및 발린(V), 및 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
160. 항목 158에 있어서, 상기 표지된 5 개의 아미노산 유형이 아르기닌(R), 글루탐산(E), 리신(K), 세린, 및 글루타민(Q)인, 방법.
161. 항목 158에 있어서, 상기 표지된 5 개의 아미노산 유형이 아르기닌(R), 아스파르트산(D), 리신(K), 세린, 및 글루타민(Q)인, 방법.
162. 항목 158에 있어서, 상기 표지된 5 개의 아미노산 유형이 아르기닌(R), 글리신(G), 리신(K), 세린, 및 글루타민(Q)인, 방법.
163. 항목 158에 있어서, 상기 표지된 5 개의 아미노산 유형이 알라닌(A), 아스파르트산(D), 글리신(G), 세린, 및 아르기닌(R)인, 방법.
164. 항목 158에 있어서, 상기 표지된 5 개의 아미노산 유형이 피롤리신(O), 아스파르트산(D), 글리신(G), 세린, 및 아르기닌(R)인, 방법.
165. 항목 158에 있어서, 상기 표지된 5 개의 아미노산 유형이 피롤리신(O), 아스파르트산(D), 셀레노시스테인(U), 세린, 및 아르기닌(R)인, 방법.
166. 항목 158에 있어서, 상기 표지된 5 개의 아미노산 유형이 피롤리신(O), 아스파르트산(D), 셀레노시스테인(U), 리신, 및 아르기닌(R)인, 방법.
167. 항목 1 내지 166 중 어느 한 항목에 있어서, 상기 2 개 이상의 표지된 아미노산 유형 각각이 아미노산 유형의 변형된 아미노산 및/또는 비변형된 아미노산을 포함하는 것인, 방법.
168. 항목 167에 있어서, 상기 아미노산 유형의 변형된 아미노산이 아미노산 유형의 번역 후 변형된 아미노산인, 방법.
169. 항목 167 또는 168에 있어서, 상기 4 개의 아미노산 유형이 표지되고 4 개의 아미노산 유형이 시스테인(C), 티로신(Y) 및 리신(K) 및 트립토판(W)이며, 여기서 비변형된 시스테인(CR) 아미노산, 및 변형 및 비변형된 시스테인 아미노산이 둘 다 표지되는 것인, 방법.
170. 항목 167 또는 168에 있어서, 상기 시스테인의 변형된 아미노산이 이황화 결합된 시스테인(CD) 아미노산인, 방법.
171. 항목 167 또는 168에 있어서, 상기 아르기닌의 변형된 아미노산이 N-글리코실화된 아르기닌(Rg) 아미노산인, 방법.
172. 항목 167 또는 168에 있어서, 상기 아스파라긴의 변형된 아미노산이 N-글리코실화된 아스파라긴(Ng) 아미노산인, 방법.
173. 항목 167 또는 168에 있어서, 상기 리신의 변형된 아미노산이 N6-(피리독살 포스페이트)리신(Kp) 아미노산인, 방법.
174. 항목 167 또는 168에 있어서, 상기 프롤린의 변형된 아미노산이 4-하이드록시프롤린(Ph) 아미노산인, 방법.
175. 항목 167 또는 168에 있어서, 상기 세린의 변형된 아미노산이 포스포세린(Sp) 아미노산인, 방법.
176. 항목 167 또는 168에 있어서, 상기 트레오닌의 변형된 아미노산이 포스포트레오닌(Tp) 아미노산인, 방법.
177. 항목 167 또는 168에 있어서, 상기 알라닌의 변형된 아미노산이 N-아세틸화된 알라닌(An) 아미노산인, 방법.
178. 항목 167 또는 168에 있어서, 상기 아르기닌의 변형된 아미노산이 메틸화된 아르기닌(Rm) 아미노산인, 방법.
179. 항목 167 또는 168에 있어서, 상기 아르기닌의 변형된 아미노산이 탈이민화된 아르기닌(Ri) 아미노산인, 방법.
180. 항목 167 또는 168에 있어서, 상기 아스파라긴의 변형된 아미노산이 탈아미드화된 아스파라긴(Qa) 아미노산인, 방법.
181. 항목 167 또는 168에 있어서, 상기 아미노산 유형의 변형된 아미노산이 인산화, 메틸화, 아세틸화, 아미드화, 탈아미드화, 탈아미드화, 피롤리돈 카르복실산의 형성, 이성질체화, 하이드록실화, 황산화, 플라빈-결합, 시스테인 산화, 고리화, 니트로실화, 아실화, 포름일화, 알킬화, 아르기닐화, 아미드 결합 형성, 부티릴화, 감마-카르복실화, 글리코실화, O-연결된 글리코실화, 말로닐화, 하이드록실화, 요오드화, 이소펩티드 결합 형성, 뉴클레오티드 첨가, N-아세틸화, N-미리스토일화, 인산화, 아데닐릴화, 우리딜릴화, 프로피오닐화, 피로글루타메이트 형성, S-글루타티오닐화, 산화, 술페닐화, 술포닐화, 숙시닐화, 황산화, SUMO일화, 미리스토일화, 팔미토일화, 이소프레닐화, 프레닐화, 유비퀴틴화, 및 글리피화 및 이의 임의의 조합을 통해 번역 후 변형된 아미노산인, 방법.
182. 항목 167 또는 168에 있어서, 상기 아미노산 유형의 변형 및 비변형된 아미노산이 둘 다 표지되는 것인, 방법.
183. 항목 182에 있어서, 상기 아미노산 유형 시스테인(C)의 변형 및 비변형된 아미노산이 둘 다 표지되는 것인, 방법.
184. 항목 182에 있어서, 상기 아미노산 유형 트립토판(W)의 변형 및 비변형된 아미노산이 둘 다 표지되는 것인, 방법.
185. 항목 182에 있어서, 상기 아미노산 유형 티로신(Y)의 변형 및 비변형된 아미노산이 둘 다 표지되는 것인, 방법.
186. 항목 182에 있어서, 상기 아미노산 유형 글리신(G)의 변형 및 비변형된 아미노산이 둘 다 표지되는 것인, 방법.
187. 항목 182에 있어서, 상기 아미노산 유형 히스티딘(H)의 변형 및 비변형된 아미노산이 둘 다 표지되는 것인, 방법.
188. 항목 182에 있어서, 상기 아미노산 유형 메티오닌(M)의 변형 및 비변형된 아미노산이 둘 다 표지되는 것인, 방법.
189. 항목 1a 내지 1h에 있어서, 상기 적어도 하나의 아미노산 유형이 작용기 아지드, 알킨, 알켄, 사이클로옥틴, 디엔, 아실, 요오도, 보론산, 디아지린, 사이클로옥텐, 에폭시드, 사이클로프로판, 술폰산, 술핀산, 비오틴, 옥심, 니트론, 노르보르넨, 테트라젠, 테트라졸, 쿼드리사이클란, 전자 부족 파이 시스템, 전자 풍부 파이 시스템, 할로겐, NHS 에스테르, 말레이미드, 하이드라진, 하이드라존, 및/또는 디아조 및 이의 임의의 조합을 함유하는 아미노산 유형으로부터 선택된 합성 아미노산 유형인, 방법.
190. 항목 1 내지 189 중 어느 한 항목에 있어서, 상기 각 아미노산 유형의 아미노산의 모두 또는 일부가 표지되는 것인, 방법.
191. 항목 190에 있어서, 상기 각 아미노산 유형의 모든 아미노산이 표지되는 것인, 방법.
192. 항목 190에 있어서, 상기 적어도 제1 아미노산 유형의 모두가 표지되고, 적어도 제2 아미노산 유형의 일부가 표지되는 것인, 방법.
193. 항목 190에 있어서, 상기 3 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1 아미노산 유형의 아미노산의 모두가 표지되고, 제2 및 제3 아미노산 유형의 아미노산의 일부가 표지되는 것인, 방법.
194. 항목 190에 있어서, 상기 3 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1 및 제2 아미노산 유형의 아미노산의 모두가 표지되고, 제3 아미노산 유형의 아미노산의 일부가 표지되는 것인, 방법.
195. 항목 190에 있어서, 상기 4 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1 아미노산 유형의 아미노산의 모두가 표지되고, 제2, 제3 및 제4 아미노산 유형의 아미노산의 일부가 표지되는 것인, 방법.
196. 항목 190에 있어서, 상기 4 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1 및 제2 아미노산 유형의 아미노산의 모두가 표지되고, 제3 및 제4 아미노산 유형의 아미노산의 일부가 표지되는 것인, 방법.
197. 항목 190에 있어서, 상기 4 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1, 제2 및 제3 아미노산 유형의 아미노산의 모두가 표지되고, 제4 아미노산 유형의 아미노산의 일부가 표지되는 것인, 방법.
198. 항목 190에 있어서, 상기 5 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1 아미노산 유형의 아미노산의 모두가 표지되고, 제2, 제3, 제4 및 제5 아미노산 유형의 아미노산의 일부가 표지되는 것인, 방법.
199. 항목 190에 있어서, 상기 5 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1, 제2, 제3 및 제4 아미노산 유형의 아미노산의 모두가 표지되고, 제5 아미노산 유형의 아미노산의 일부가 표지되는 것인, 방법.
200. 항목 190에 있어서, 상기 5 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1 및 제2 아미노산 유형의 아미노산의 모두가 표지되고, 제3, 제4 및 제5 아미노산 유형의 아미노산의 일부가 표지되는 것인, 방법.
201. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 5 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1, 제2 및 제3 아미노산 유형의 아미노산의 모두가 표지되고, 제4 및 제5 아미노산 유형의 아미노산의 일부, 여기서 제1, 제2 및 제3 아미노산 유형의 비변형된 아미노산이 표지되고 제4 및 제5 아미노산 유형의 변형된 아미노산이 표지되는 것인, 방법.
202. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 적어도 제1 아미노산 유형의 모두가 표지되고, 적어도 제2 아미노산 유형의 일부가 표지되고, 여기서 제1 아미노산 유형의 비변형된 아미노산이 표지되고 제2 아미노산 유형의 변형된 아미노산이 표지되는 것인, 방법.
203. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 3 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1 아미노산 유형의 아미노산의 모두가 표지되고, 제2 및 제3 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1 아미노산 유형의 비변형된 아미노산이 표지되고 제2 및 제3 아미노산 유형의 변형된 아미노산이 표지되는 것인, 방법.
204. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 3 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1 및 제2 아미노산 유형의 아미노산의 모두가 표지되고, 제3 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1 및 제2 아미노산 유형의 비변형된 아미노산이 표지되고 제3 아미노산 유형의 변형된 아미노산이 표지되는 것인, 방법.
205. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 4 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1 아미노산 유형의 아미노산의 모두가 표지되고, 제2, 제3 및 제4 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1 아미노산 유형의 비변형된 아미노산이 표지되고 제2, 제3 및 제4 아미노산 유형의 변형된 아미노산이 표지되는 것인, 방법.
206. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 4 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1 및 제2 아미노산 유형의 아미노산의 모두가 표지되고, 제3 및 제4 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1 및 제2 아미노산 유형의 비변형된 아미노산이 표지되고 제3 및 제4 아미노산 유형의 변형된 아미노산이 표지되는 것인, 방법.
207. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 4 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1, 제2 및 제3 아미노산 유형의 아미노산의 모두가 표지되고, 제4 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1, 제2 및 제3 아미노산 유형의 비변형된 아미노산이 표지되고 제4 아미노산 유형의 변형된 아미노산이 표지되는 것인, 방법.
208. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 5 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1 아미노산 유형의 아미노산의 모두가 표지되고, 제2, 제3, 제4 및 제5 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1 아미노산 유형의 비변형된 아미노산이 표지되고 제2, 제3, 제4 및 제5 아미노산 유형의 변형된 아미노산이 표지되는 것인, 방법.
209. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 5 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1, 제2, 제3 및 제4 아미노산 유형의 아미노산의 모두가 표지되고, 제5 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1, 제2, 제3 및 제4 아미노산 유형의 비변형된 아미노산이 표지되고 제5 아미노산 유형의 변형된 아미노산이 표지되는 것인, 방법.
210. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 5 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1 및 제2 아미노산 유형의 아미노산의 모두가 표지되고, 제3, 제4 및 제5 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1 및 제2 아미노산 유형의 비변형된 아미노산이 표지되고 제3, 제4 및 제5 아미노산 유형의 변형된 아미노산이 표지되는 것인, 방법.
211. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 5 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1, 제2 및 제3 아미노산 유형의 아미노산의 모두가 표지되고, 제4 및 제5 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1, 제2 및 제3 아미노산 유형의 비변형된 아미노산이 표지되고 제4 및 제5 아미노산 유형의 변형된 아미노산이 표지되는 것인, 방법.
212. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 5 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1, 제2 및 제3 아미노산 유형의 아미노산의 모두가 표지되고, 제4 및 제5 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1, 제2 및 제3 아미노산 유형의 비변형된 아미노산이 표지되고 제4 및 제5 아미노산 유형의 변형된 아미노산이 표지되는 것인, 방법.
213. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 5 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1, 제2 및 제3 아미노산 유형의 아미노산의 일부가 표지되고, 제4 및 제5 아미노산 유형의 아미노산의 모두가 표지되고, 여기서 제1, 제2 및 제3 아미노산 유형의 변형된 아미노산이 표지되고 제4 및 제5 아미노산 유형의 비변형된 아미노산이 표지되는 것인, 방법.
214. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 3 개의 아미노산 유형이 샘플에서 표지되고, 제1 아미노산 유형의 아미노산의 모두가 표지되고, 제2 및 제3 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1 아미노산 유형의 변형된 아미노산이 표지되고 제2 및 제3 아미노산 유형의 비변형된 아미노산이 표지되는 것인, 방법.
215. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 3 개의 아미노산 유형이 샘플에서 표지되고, 제1 및 제2 아미노산 유형의 아미노산의 모두가 표지되고, 제3 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1 및 제2 아미노산 유형의 변형된 아미노산이 표지되고 제3 아미노산 유형의 비변형된 아미노산이 표지되는 것인, 방법.
216. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 4 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1 아미노산 유형의 아미노산의 모두가 표지되고, 제2, 제3 및 제4 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1 및 제2 아미노산 유형의 변형된 아미노산이 표지되고 제3 및 제4 아미노산 유형의 비변형된 아미노산이 표지되는 것인, 방법.
217. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 4 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1 및 제2 아미노산 유형의 아미노산의 모두가 표지되고, 제3 및 제4 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1 및 제2 아미노산 유형의 변형된 아미노산이 표지되고 제3 및 제4 아미노산 유형의 비변형된 아미노산이 표지되는 것인, 방법.
218. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 4 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1, 제2 및 제3 아미노산 유형의 아미노산의 모두가 표지되고, 제4 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1, 제2 및 제3 아미노산 유형의 변형된 아미노산이 표지되고 제4 아미노산 유형의 비변형된 아미노산이 표지되는 것인, 방법.
219. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 5 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1 아미노산 유형의 아미노산의 모두가 표지되고, 제2, 제3, 제4 및 제5 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1 아미노산 유형의 변형된 아미노산이 표지되고 제2, 제3, 제4 및 제5 아미노산 유형의 비변형된 아미노산이 표지되는 것인, 방법.
220. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 5 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1, 제2, 제3 및 제4 아미노산 유형의 아미노산의 모두가 표지되고, 제5 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1, 제2, 제3 및 제4 아미노산 유형의 변형된 아미노산이 표지되고 제5 아미노산 유형의 비변형된 아미노산이 표지되는 것인, 방법.
221. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 5 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1 및 제2 아미노산 유형의 아미노산의 모두가 표지되고, 제3, 제4 및 제5 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1 및 제2 아미노산 유형의 변형된 아미노산이 표지되고 제3, 제4 및 제5 아미노산 유형의 비변형된 아미노산이 표지되는 것인, 방법.
222. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 5 개의 아미노산 유형이 샘플에서 표지되고, 여기서 제1, 제2 및 제3 아미노산 유형의 아미노산의 모두가 표지되고, 제4 및 제5 아미노산 유형의 아미노산의 일부가 표지되고, 여기서 제1, 제2 및 제3 아미노산 유형의 변형된 아미노산이 표지되고 제4 및 제5 아미노산 유형의 비변형된 아미노산이 표지되는 것인, 방법.
223. 항목 190에 있어서, 항목 167 또는 168에 의존하는 경우, 상기 적어도 제1 아미노산 유형의 변형된 아미노산의 모두가 표지되고, 적어도 제2 아미노산 유형의 비변형된 아미노산의 일부가 표지되는 것인, 방법.
224. 항목 1a 내지 1h에 있어서, 상기 단계 e)가 샘플에서 각 표지된 아미노산 유형의 측정된 표지 및/또는 아미노산 농도를 하나 이상의 단백질 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도를 비교하거나, 샘플에서 각 표지된 아미노산 유형의 아미노산 수를 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 아미노산 수와 비교함으로써 샘플에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 것을 포함하는 것인, 방법.
225. 항목 1a 내지 1h 또는 항목 224에 있어서, 상기 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도를 식별하는 경우 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 및/또는 아미노산 농도, 및/또는 아미노산 수를 나타내는 정보가 참조인, 방법.
226. 항목 225에 있어서, 상기 참조가 하나 이상의 단백질 농도에서 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도를 제공하거나, 상기 참조가 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 아미노산 수를 제공하는 것인, 방법.
227. 항목 226에 있어서, 상기 참조가 단백질 농도의 함수로서 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도를 제공하거나, 상기 참조가 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 아미노산 수를 제공하는 것인, 방법.
228. 항목 225 내지 227 중 어느 한 항목에 있어서, 상기 참조가 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조선 또는 참조 곡선을 제공하는 것인, 방법.
229. 항목 228에 있어서, 상기 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조선 또는 참조 곡선이 각 농도에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 알려진 표지 값 또는 아미노산 농도를 각각 제공하는 연속 점으로 구성되는 것인, 방법.
230. 항목 229에 있어서, 상기 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조선 또는 참조 곡선이 각 단백질 농도에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 알려진 표지 값 또는 아미노산 농도를 각각 제공하는 연속 점으로 구성되는 것인, 방법.
231. 항목 229 또는 230에 있어서, 상기 참조선 또는 참조 곡선이 농도 또는 단백질 농도의 공통 파라미터를 사용하여 파라미터적으로 기재되는 것인, 방법.
232. 항목 229 또는 230에 있어서, 상기 참조선 또는 참조 곡선이 농도 또는 단백질 농도의 공통 독립적 변수를 사용하여 벡터 형식으로 기재되는 것인, 방법.
233. 항목 232에 있어서, 상기 참조선 또는 참조 곡선이 벡터인, 방법.
234. 항목 228 내지 233에 있어서, 상기 샘플에서 표지된 2 개 이상의 아미노산 유형의 측정된 표지 값, 아미노산 농도, 또는 아미노산 수가 참조선 또는 참조 곡선 상의 점을 제공하는 것인, 방법.
235. 항목 234에 있어서, 상기 샘플 점과 참조 또는 참조 벡터 사이의 최단 거리가 계산되는 것인, 방법.
236. 항목 235에 있어서, 상기 샘플 점과 참조 벡터 사이의 최단 거리가 샘플 점과 참조 벡터 사이의 수직 거리인, 방법.
237. 항목 223, 234 또는 235에 있어서, 상기 샘플 점에서 참조선까지의 벡터가 결정되는 것인, 방법.
238. 항목 233, 234, 235 또는 237에 있어서, 상기 샘플 점에서 참조선까지의 벡터와 참조선의 방향 사이의 내적(ㆍ)이 결정되고, 샘플 점에서 참조 벡터까지의 수직 거리가 샘플 점과 내적(ㆍ)이 0과 동일한 참조 벡터 상의 특이적 점 사이의 거리인, 방법.
239. 항목 237에 있어서, 상기 방정식이 샘플 점과 참조선 사이의 벡터가 수직인 참조선 상의 특이적 점을 식별하는 농도, 또는 단백질 농도를 제공하기 위해 푸는 것인, 방법.
240. 항목 239에 있어서, 상기 수직 거리를 제공하는 참조선 상의 특이적 점이 농도 또는 단백질 농도의 식별된 값을 참조선의 벡터 함수에 입력함으로써 계산되는 것인, 방법.
241. 항목 236 및 240에 있어서, 상기 샘플 점과 수직 거리를 제공하는 참조선 상의 이 점 사이의 거리가 계산되는 것인, 방법.
242. 항목 1a 내지 1h 및 241에 있어서, 상기 이 수직 거리가 오차 한계와 비교되는 것인, 방법.
243. 항목 242에 있어서, 상기 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양이 샘플 점과 그의 참조선 사이의 수직 거리가 오차 한계보다 작거나 동일한 경우 식별되고, 상기 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도 또는 단백질 농도가 이 수직 거리를 제공하는 농도 또는 단백질 농도인, 방법.
244. 항목 190 또는 192 내지 223 중 어느 한 항목에 있어서, 상기 아미노산 유형의 아미노산의 비율이 표지되고, 여기서 비율이 표지된 아미노산 유형의 아미노산의 약 50%, 약 51%, 약 52%, 약 53%, 약 54%, 약 55%, 약 56%, 약 57%, 약 58%, 약 59%, 약 60%, 약 61%, 약 62%, 약 63%, 약 64%, 약 65%, 약 66%, 약 67%, 약 68%, 약 69%, 약 70%, 약 71%, 약 72%, 약 73%, 약 74%, 약 75%, 약 76%, 약 77%, 약 78%, 또는 약 79%, 약 80%, 약 81%, 약 82%, 약 83%, 약 84%, 약 85%, 약 86%, 약 87%, 약 89%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99%인, 방법.
245. 항목 167 또는 168에 있어서, 상기 아미노산 유형의 변형된 아미노산이 아미노산 유형의 비변형된 아미노산과 상이하게 표지되는 것인, 방법.
246. 항목 182에 있어서, 상기 아미노산 유형의 비변형된 아미노산이 총 변형 및 비변형된 아미노산과 상이하게 표지되는 것인, 방법.
247. 항목 245 또는 246에 있어서, 상기 아미노산 유형의 변형된 아미노산이 먼저 해당 아미노산 유형의 비변형된 아미노산으로 전환함으로써 표지되는 것인, 방법.
248. 항목 245 또는 246에 있어서, 상기 아미노산 유형의 변형된 아미노산이 먼저 화학적 변환에 의해 아미노산 유형의 비변형된 아미노산으로 전환함으로써 표지되는 것인, 방법.
249. 항목 245 또는 246에 있어서, 상기 아미노산 유형의 변형된 아미노산이 먼저 화학적 반응에 의해 아미노산 유형의 비변형된 아미노산으로 전환함으로써 표지되는 것인, 방법.
250. 항목 245 또는 246에 있어서, 상기 아미노산 유형의 변형된 아미노산이 먼저 환원 단계에 의해 아미노산 유형의 비변형된 아미노산으로 전환함으로써 표지되는 것인, 방법.
251. 항목 245 또는 246에 있어서, 상기 아미노산 유형의 변형된 아미노산이 먼저 PTM 절단 단계에 의해 아미노산 유형의 비변형된 아미노산으로 전환함으로써 표지되는 것인, 방법.
252. 항목 245 또는 246에 있어서, 상기 아미노산 유형의 변형된 아미노산이 먼저 가수분해 단계에 의해 아미노산 유형의 비변형된 아미노산을 전환함으로써 표지되는 것인, 방법.
253. 항목 245 또는 246에 있어서, 상기 아미노산 유형의 변형된 아미노산이 먼저 효소를 사용하여 아미노산 유형의 비변형된 아미노산으로 전환함으로써 표지되는 것인, 방법.
254. 항목 253에 있어서, 상기 효소가 표지화 단계 전에 샘플로부터 제거되는 것인, 방법.
255. 항목 246에 있어서, 상기 시스테인(CR) 아미노산의 비변형된 아미노산이 시스테인의 변형 및 비변형된 아미노산 둘 다가 표지되는 경우와 상이하게 표지되는 것인, 방법.
256. 항목 1 내지 255 중 어느 한 항목에 있어서, 상기 각 아미노산 유형의 표지화가 해당 아미노산 유형에 대해 특이적인 것인, 방법.
257. 항목 1 내지 256 중 어느 한 항목에 있어서, 상기 아미노산 유형의 아미노산의 R-기가 표지되는 것인, 방법.
258. 항목 257에 있어서, 상기 아미노산 유형의 변형 및/또는 비변형된 아미노산의 R-기가 표지되는 것인, 방법.
259. 항목 258에 있어서, 상기 비변형된 A 아미노산에 대해 표지된 R-기가 메틸인, 방법.
260. 항목 258에 있어서, 상기 비변형된 R 아미노산에 대해 표지된 R-기가 지방족 구아니디노 기인, 방법.
261. 항목 260에 있어서, 상기 지방족 구아니디노 기가 부분적 1차 아민 특징 및/또는 동일한 1차 아민 특징인, 방법.
262. 항목 258에 있어서, 상기 변형된 R 아미노산(Rg)에 대해 표지된 R-기가 구아니디노 아민에 결합된 탄수화물 글리코시드인, 방법.
263. 항목 258에 있어서, 상기 변형된 R 아미노산(Rm)에 대해 표지된 R-기가 메틸화된 구아니디노 아민인, 방법.
264. 항목 258에 있어서, 상기 변형된 R 아미노산(Rc)에 대해 표지된 R-기가 시트룰린인, 방법.
265. 항목 258에 있어서, 상기 변형된 A 아미노산(Aa)에 대해 표지된 R-기가 N-말단에서 N-아세틸화된 알라닌인, 방법
266. 항목 258에 있어서, 상기 비변형된 N 아미노산에 대해 표지된 R-기가 β-카르복사미드인, 방법.
267. 항목 258에 있어서, 상기 변형된 N 아미노산(Ng)에 대해 표지된 R-기가 β-카르복사미드 아민에 결합된 탄수화물 글리코시드인, 방법.
268. 항목 258에 있어서, 상기 변형된 N 아미노산(Nd)에 대해 표지된 R-기가 카르복실산(아스파르트산, D, 또는 이소아스파르트산, 이소D)인, 방법
269. 항목 258에 있어서, 상기 변형된 D 아미노산(Di)에 대해 표지된 R-기가 카르복실산(이소아스파르트산)인, 방법
270. 항목 258에 있어서, 상기 변형 및 비변형된 C 아미노산에 대해 표지된 R-기가 환원된 티올인, 방법.
271. 항목 258에 있어서, 상기 비변형된 C 아미노산(CR)에 대해 표지된 R-기가 환원된 티올인, 방법.
272. 항목 258에 있어서, 상기 변형된 C 아미노산(CD)에 대해 표지된 R-기가 산화된 티올인, 방법.
273. 항목 258에 있어서, 상기 변형된 C 아미노산(Cfe)에 대해 표지된 R-기가 술펜산인, 방법.
274. 항목 258에 있어서, 상기 변형된 C 아미노산(Cfu)에 대해 표지된 R-기가 술폰산인, 방법.
275. 항목 258에 있어서, 상기 변형된 C 아미노산(Cp)에 대해 표지된 R-기가 팔미토일화된 티올인, 방법.
276. 항목 258에 있어서, 상기 변형된 C 아미노산(Cn)에 대해 표지된 R-기가 N-말단에서 N-아세틸화된 시스테인인, 방법.
277. 항목 258에 있어서, 상기 변형된 C 아미노산(Cno)에 대해 표지된 R-기가 S-니트로소티올인, 방법.
278. 항목 258에 있어서, 상기 변형된 E 아미노산(Ep)에 대해 표지된 R-기가 피로글루타메이트인, 방법.
279. 항목 258에 있어서, 상기 변형된 E 아미노산(Ep)에 대해 표지된 R-기가 N-말단에서 피로글루타메이트인, 방법.
280. 항목 258에 있어서, 상기 변형된 E 아미노산(Ec)에 대해 표지된 R-기가 γ-디카르복시산인, 방법.
281. 항목 258에 있어서, 상기 변형된 E 아미노산(Ec)에 대해 표지된 R-기가 γ-디카르복시산인, 방법.
282. 항목 258에 있어서, 상기 변형된 Q 아미노산(Qp)에 대해 표지된 R-기는 N-말단에서 피로글루타메이트인, 방법.
283. 항목 258에 있어서, 상기 변형된 Q 아미노산(Qe)에 대해 표지된 R-기가 γ-카르복실산인, 방법.
284. 항목 258에 있어서, 상기 변형된 Q 아미노산(Qip)에 대해 표지된 R-기가 K 아미노산과의 이소펩티드 결합인, 방법.
285. 항목 258에 있어서, 상기 변형된 G 아미노산(Gm)에 대해 표지된 R-기가 N-말단에서 N-미리스토일인, 방법.
286. 항목 258에 있어서, 상기 변형된 G 아미노산에 대해 표지된 R-기가 N-말단에서 N-아세틸인, 방법.
287. 항목 258에 있어서, 상기 변형된 H 아미노산(Hp)에 대해 표지된 R-기가 포스포이미다졸인, 방법.
288. 항목 258에 있어서, 상기 변형된 K 아미노산(Ka)에 대해 표지된 R-기가 아세틸 치환기를 갖는 ε-2차 아미노 기인, 방법.
289. 항목 258에 있어서, 상기 변형된 K 아미노산(Ku)에 대해 표지된 R-기가 유비퀴틴 치환기를 갖는 ε-2차 아미노 기인, 방법.
290. 항목 258에 있어서, 상기 변형된 K 아미노산(Ks)에 대해 표지된 R-기가 ε-2차 아미노 기 SUMO일 치환기인, 방법.
291. 항목 258에 있어서, 상기 변형된 K 아미노산(Km)에 대해 표지된 R-기가 메틸 치환기를 갖는 ε-2차 아미노 기인, 방법.
292. 항목 258에 있어서, 상기 변형된 K 아미노산(Ki)에 대해 표지된 R-기가 글루타민에 대한 이소펩티드 결합을 갖는 ε-2차 아미노 기인, 방법.
293. 항목 258에 있어서, 상기 변형된 K 아미노산(Kh)에 대해 표지된 R-기가 하이드록실 치환기를 갖는 ε-2차 아미노 기인, 방법.
294. 항목 258에 있어서, 상기 변형된 M 아미노산(Ma)에 대해 표지된 R-기가 N-말단에서 N-아세틸인, 방법.
295. 항목 258에 있어서, 상기 변형된 M 아미노산(Mu)에 대해 표지된 R-기가 티오에스테르-연결된 유비퀴틴인, 방법.
296. 항목 258에 있어서, 상기 변형된 M 아미노산(Msx)에 대해 표지된 R-기가 술폭사이드인, 방법.
297. 항목 258에 있어서, 상기 변형된 M 아미노산(Mso)에 대해 표지된 R-기가 술폰인, 방법.
298. 항목 258에 있어서, 상기 변형된 P 아미노산(Ph)에 대해 표지된 R-기가 하이드록시피롤리딘인, 방법.
299. 항목 258에 있어서, 상기 변형된 S 아미노산(Sp)에 대해 표지된 R-기가 하이드록시메틸 포스페이트인, 방법.
300. 항목 258에 있어서, 상기 변형된 S 아미노산(Sg)에 대해 표지된 R-기가 하이드록시메틸 글리코시드인, 방법.
301. 항목 258에 있어서, 상기 변형된 S 아미노산(Sn)에 대해 표지된 R-기가 N-말단에서 N-아세틸인, 방법.
302. 항목 258에 있어서, 상기 변형된 T 아미노산(Tp)에 대해 표지된 R-기가 하이드록시 포스페이트인, 방법.
303. 항목 258에 있어서, 상기 변형된 T 아미노산(Tg)에 대해 표지된 R-기가 하이드록시 글리코시드인, 방법.
304. 항목 258에 있어서, 상기 변형된 T 아미노산(Tn)에 대해 표지된 R-기가 N-말단에서 N-아세틸인, 방법.
305. 항목 258에 있어서, 상기 변형된 W 아미노산(Wmo)에 대해 표지된 R-기가 인돌올(모노 하이드록실 인돌)인, 방법.
306. 항목 258에 있어서, 상기 변형된 W 아미노산(Wdo)에 대해 표지된 R-기가 인돌디올(디하이드록실 인돌)인, 방법.
307. 항목 258에 있어서, 상기 변형된 W 아미노산(Wk)에 대해 표지된 R-기가 키누레닌(Kynurenine)인, 방법.
308. 항목 258에 있어서, 상기 변형된 Y 아미노산(Ys)에 대해 표지된 R-기가 페닐 술페이트인, 방법.
309. 항목 258에 있어서, 상기 변형된 Y 아미노산(Yp)에 대해 표지된 R-기가 페닐 포스페이트인, 방법.
310. 항목 258에 있어서, 상기 변형된 V 아미노산(Vn)에 대해 표지된 R-기가 N 말단에서 N-아세틸인, 방법.
311. 항목 258에 있어서, 상기 비변형된 E 아미노산에 대해 표지된 R-기가 γ-카르복실산인, 방법.
312. 항목 258에 있어서, 상기 비변형된 Q 아미노산에 대해 표지된 R-기가 γ-카르복사미드인, 방법.
313. 항목 258에 있어서, 상기 비변형된 G 아미노산에 대해 표지된 R-기가 수소가 치환기인 알파 탄소인, 방법.
314. 항목 258에 있어서, 상기 비변형된 H 아미노산에 대해 표지된 R-기가 이미다졸인, 방법.
315. 항목 258에 있어서, 상기 비변형된 I 아미노산에 대해 표지된 R-기가 2차 부틸인, 방법.
316. 항목 258에 있어서, 상기 비변형된 L 아미노산에 대해 표지된 R-기가 이소부틸인, 방법.
317. 항목 258에 있어서, 상기 비변형된 K 아미노산에 대해 표지된 R-기가 ε-1차 아미노 기인, 방법.
318. 항목 258에 있어서, 상기 변형된 K 아미노산에 대해 표지된 R-기가 피리독시알 포스페이트 알디민인, 방법.
319. 항목 258에 있어서, 상기 비변형된 M 아미노산에 대해 표지된 R-기가 S-메틸 티오에테르인, 방법.
320. 항목 258에 있어서, 상기 비변형된 F 아미노산에 대해 표지된 R-기가 벤질인, 방법.
321. 항목 258에 있어서, 상기 비변형된 P 아미노산에 대해 표지된 R-기가 피롤리딘인, 방법.
322. 항목 258에 있어서, 상기 변형된 P 아미노산(Ph4)에 대해 표지된 R-기가 4-하이드록시피롤리딘인, 방법.
323. 항목 258에 있어서, 상기 S 비변형된 아미노산에 대해 표지된 R-기가 하이드록시메틸인, 방법.
324. 항목 258에 있어서, 상기 변형된 S 아미노산(Sp)에 대해 표지된 R-기가 포스포 메틸 에스테르인, 방법.
325. 항목 258에 있어서, 상기 비변형된 T 아미노산에 대해 표지된 R-기가 하이드록실인, 방법.
326. 항목 258에 있어서, 상기 변형된 T 아미노산(Tp)에 대해 표지된 R-기가 포스포에스테르인, 방법.
327. 항목 258에 있어서, 상기 비변형된 W 아미노산에 대해 표지된 R-기가 인돌인, 방법.
328. 항목 258에 있어서, 상기 비변형된 Y 아미노산에 대해 표지된 R-기가 페놀인, 방법.
329. 항목 258에 있어서, 상기 변형된 Y 아미노산(Yp)에 대해 표지된 R-기가 포스포페놀인, 방법.
330. 항목 258에 있어서, 상기 비변형된 V 아미노산에 대해 표지된 R-기가 이소프로필인, 방법.
331. 항목 258에 있어서, 상기 피롤리신(O)에 대한 R-기가 피롤(N,2,3-트리메틸-3,4-디하이드로-2H-피롤-2-카르복사미드)인, 방법.
332. 항목 258에 있어서, 상기 셀레노시스테인(U)에 대한 R-기가 에틸셀레놀인, 방법.
333. 항목 258에 있어서, 상기 변형 및 비변형된 W 아미노산에 대한 R-기가 인돌 기이고, 여기서 모노-산화된(변형된) W 아미노산에 대한 R-기가 하이드록시 인돌 기이고, 이산화된(변형된) W 아미노산에 대한 R-기가 디하이드록시 인돌 기인, 방법.
334. 항목 258에 있어서, 상기 비변형된 K 아미노산에 대한 R-기가 ε-1차 아미노 기이고, 여기서 아세틸화된(변형된) K에 대한 R-기가 아세틸화된 ε-2차 아미노 기이고, 유비퀴틴화된(변형된) K에 대한 R-기가 유비퀴틴화된 ε-2차 아미노 기이고, SUMO일화된(변형된) K에 대한 R-기가 SUMO일화된 ε-2차 아미노 기이고, 메틸화된(변형된) K에 대한 R-기가 메틸화된(알킬화된) ε-2차 아미노 기인, 방법.
335. 항목 258에 있어서, 상기 변형 및 비변형된 Y 아미노산에 대한 R-기가 페놀 기이고, 여기서 황산화된(변형된) Y 아미노산에 대한 R-기가 페놀 술페이트 기이고, 인산화된(변형된) Y 아미노산에 대한 R-기가 포스포페놀 기인, 방법.
336. 항목 257 내지 335 중 어느 한 항목에 있어서, 상기 각 아미노산 유형의 R-기의 표지화가 해당 아미노산 유형에 대해 특이적인 것인, 방법.
337. 항목 257 내지 335 중 어느 한 항목에 있어서, 상기 각 비변형된 아미노산 유형의 R-기의 표지화가 해당 비변형된 아미노산 유형에 대해 특이적인 것인, 방법.
338. 항목 257 내지 335 중 어느 한 항목에 있어서, 상기 각 변형된 아미노산 유형의 R-기의 표지화가 해당 아미노산 유형에 대해 특이적인 것인, 방법.
339. 항목 257 내지 335 중 어느 한 항목에 있어서, 상기 동일한 치환기를 갖는 변형된 아미노산 유형의 R-기의 표지화가 R-기의 치환기에 특이적인 것인, 방법.
340. 항목 336에 있어서, 상기 포스페이트를 함유하는 R-기의 표지화가 포스페이트를 함유하는 R-기에 대해 특이적이며, 모든 인산화된 아미노산 유형의 검출을 허용하는 것인, 방법.
341. 항목 336에 있어서, 상기 글리코시드를 함유하는 R-기의 표지화가 글리코시드를 함유하는 R-기에 대해 특이적이고 TT/n-Bu4NN3 또는 Ph3P:2,3-디클로로-5,6-디시아노벤조퀴논(DDQ):n-Bu4NN3으로 아지드로의 선택적 전환 이어서 Fl-DIBO와의 반응을 포함하는 것인, 방법.
342. 항목 336에 있어서, 상기 지방산을 함유하는 R-기의 표지화가 지방산을 함유하는 R-기에 대해 특이적이며 이극성 3-메톡시크로몬으로의 표지화를 포함하여 모든 지질화된 아미노산 유형의 검출을 허용하는 것인, 방법.
343. 항목 336에 있어서, 상기 표지화 포스페이트를 함유하는 R-기의 표지화가 카르보닐디이미다졸로 활성화시켜 이탈기를 제공한 후, 시스테인 BODIPY 염료와의 반응을 포함하고, 포스페이트를 함유하는 R-기에 대해 특이적이며, 포스페이트로 변형된 모든 아미노산 유형의 검출을 허용하는 것인, 방법.
344. 항목 1 내지 343 중 어느 한 항목에 있어서, 상기 하위단백체 또는 단백체 내의 임의의 펩티드, 올리고펩티드, 폴리펩티드, 단백질, 단백질 복합체, 또는 펩티드, 올리고펩티드, 폴리펩티드, 단백질, 또는 단백질 복합체가 샘플에서 아미노산 유형의 표지화 반응 동안 또는 전에 변성되는 것인, 방법.
345. 항목 344에 있어서, 상기 하위단백체 또는 단백체 내의 펩티드, 올리고펩티드, 폴리펩티드, 단백질, 단백질 복합체, 또는 펩티드, 올리고펩티드, 폴리펩티드, 단백질, 또는 단백질 복합체가 유기 용매를 사용하여 샘플에서 아미노산 유형의 표지화 반응 동안 또는 전에 변성되는 것인, 방법.
346. 항목 344에 있어서, 상기 하위단백체 또는 단백체 내의 펩티드, 올리고펩티드, 폴리펩티드, 단백질, 단백질 복합체, 또는 펩티드, 올리고펩티드, 폴리펩티드, 단백질, 또는 단백질 복합체가 계면활성제를 사용하여 샘플에서 아미노산 유형의 표지화 반응 동안 또는 전에 변성되는 것인, 방법.
347. 항목 344에 있어서, 상기 하위단백체 또는 단백체 내의 펩티드, 올리고펩티드, 폴리펩티드, 단백질, 단백질 복합체, 또는 펩티드, 올리고펩티드, 폴리펩티드, 단백질, 또는 단백질 복합체가 환원제를 사용하여 샘플에서 아미노산 유형의 표지화 반응 동안 또는 전에 변성되는 것인, 방법.
348. 항목 344에 있어서, 상기 하위단백체 또는 단백체 내의 펩티드, 올리고펩티드, 폴리펩티드, 단백질, 단백질 복합체, 또는 펩티드, 올리고펩티드, 폴리펩티드, 단백질, 또는 단백질 복합체가 높거나 낮은 pH 조건을 사용하여 샘플에서 아미노산 유형의 표지화 반응 동안 또는 전에 변성되는 것인, 방법.
349. 항목 344에 있어서, 상기 하위단백체 또는 단백체 내의 펩티드, 올리고펩티드, 폴리펩티드, 단백질, 단백질 복합체, 또는 펩티드, 올리고펩티드, 폴리펩티드, 단백질, 또는 단백질 복합체가 유기 용매, 계면활성제, 환원제, 또는 높거나 낮은 pH 조건 중 임의의 조합을 사용하여 샘플에서 아미노산 유형의 표지화 반응 동안 또는 전에 변성되는 것인, 방법.
350. 항목 1a 내지 1h 또는 2 내지 256 중 어느 한 항목에 있어서, 상기 2 개 이상의 아미노산 유형이 동일한 표지로 표지되고 표지가 각 아미노산 유형에 대해 독립적으로 식별되는 것인, 방법.
351. 항목 350에 있어서, 상기 표지를 검출하기 위한 파라미터가 구별되는 것인, 방법.
352. 항목 350에 있어서, 상기 표지화 반응이 구별되는 것인, 방법.
353. 항목 350에 있어서, 상기 하나의 아미노산 유형이 표지와의 반응 전에, 또 다른 아미노산 유형과 상이한 조건 하에 반응성 형태로 전환되는 것인, 방법.
354. 항목 353에 있어서, 상기 상이한 촉매가 표지화 반응 동안 사용되는 것인, 방법.
355. 항목 353에 있어서, 상기 상이한 파장의 빛을 사용하여 표지화 반응을 촉매하는 것인, 방법.
356. 항목 353에 있어서, 상기 상이한 화학 반응이 아미노산 유형에 대해 수행되어 표지와의 반응 전에 반응성 기를 설치하는 것인, 방법.
357. 항목 349에 있어서, 상기 상이한 반응 시간이 사용되는 것인, 방법. 구현예에서 하나의 아미노산 유형이 또 다른 아미노산 유형보다 표지와 더 빠르게 반응하는 경우.
358. 항목 350 또는 351에 있어서, 상기 하나의 아미노산 유형에 대한 측정된 표지가 제2 아미노산 유형에 대한 표지로부터 디콘볼루션되는(deconvoluted) 것인, 방법.
359. 항목 358에 있어서, 상기 하나의 아미노산 유형에 대한 측정된 표지가 표지된 아미노산 유형 중 하나의 아미노산만을 함유하는 디콘볼루션(deconvolution) 표준을 사용하여 제2 아미노산 유형에 대한 표지로부터 디콘볼루션되는 것인, 방법.
360. 항목 358 또는 359에 있어서, 상기 아미노산 유형 트립토판(W) 및 티로신(Y)이 동일한 표지로 표지되고 W 아미노산에 대한 측정된 표지가 Y 아미노산에 대한 표지로부터 디콘볼루션되는 것인, 방법.
361. 항목 358 또는 359에 있어서, 상기 아미노산 유형 트립토판(W) 및 티로신(Y)이 동일한 표지로 표지되고 W 아미노산에 대한 측정된 표지가 별개의 여기 파장을 사용하여, W 및 Y 아미노산에 대한 측정된 표지로부터 별도로 검출되는 것인, 방법.
362. 항목 358 또는 359에 있어서, 상기 아미노산 유형 트립토판(W) 및 티로신(Y)이 동일한 표지로 표지되고 W 및 Y 아미노산이 둘 다 표지되는 여기 파장에서 W 아미노산에 대한 측정된 표지가 W 아미노산만을 함유하는 디콘볼루션 표준을 사용하여 계산되고, 이를 W 및 Y 아미노산 둘 다에 대한 표지의 총 값에서 빼서 Y 아미노산에 대해 배타적으로 표지 값을 나타내는 것인, 방법.
363. 항목 1 내지 362 중 어느 한 항목에 있어서, 상기 2 개 이상의 아미노산 유형이 전체 샘플 내에서 표지되는 것인, 방법.
364. 항목 1 내지 363 중 어느 한 항목에 있어서, 상기 샘플이 다중 분획으로 분리되고 상이한 표지화 반응이 아미노산 유형 중 2 개 이상을 특이적으로 표지하는 각 분획에서 수행되는 것인, 방법.
365. 항목 364에 있어서, 상기 분획이 동일한 부피를 갖는 것인, 방법.
366. 항목 364 또는 365에 있어서, 상기 4 개의 아미노산 유형이 표지되고 샘플이 표지화 전에 2 개의 분획으로 분리되며, 여기서 2 개의 아미노산 유형이 하나의 분획에서 표지되고 2 개의 다른 아미노산 유형이 제2 분획에서 표지되는 것인, 방법.
367. 항목 366에 있어서, 상기 4 개의 아미노산 유형 W, K, Y 및 C가 표지되고 샘플이 표지화 전에 2 개의 분획으로 분리되며, 여기서 W 및 K 아미노산이 하나의 분획에서 표지되고 Y 및 C가 제2 분획에서 표지되는 것인, 방법.
368. 항목 366에 있어서, 상기 4 개의 아미노산 유형 W, K, Y 및 C가 표지되고 표지화 전에 3 개의 분획으로 분리되며, 여기서 W 및 Y 아미노산이 하나의 분획에서 표지되고 C 및 K 아미노산이 별개의 분획에서 표지되는 것인, 방법.
369. 항목 364 또는 365에 있어서, 상기 4 개의 아미노산 유형이 표지되고 샘플이 표지화 전에 4 개의 분획으로 분리되며, 여기서 하나의 아미노산 유형이 각 분획에서 표지되는 것인, 방법.
370. 항목 369에 있어서, 상기 아미노산 유형 W, K, Y 및 C가 표지되고 샘플이 표지화 전에 4 개의 분획으로 분리되며, 여기서 W가 제1 분획에서 표지되고, K가 제2 분획에서 표지되고, C가 제3 분획에서 표지되고, Y가 제4 분획에서 표지되는 것인, 방법.
371. 항목 364 또는 365에 있어서, 상기 분획의 수가 샘플에서 표지된 아미노산 유형의 수와 동일한 것인, 방법.
372. 항목 364 또는 365에 있어서, 상기 아미노산 유형이 소화되지 않거나 가수분해되지 않은 온전한 단백질 또는 펩티드 쇄에 함유되어 있기 때문에, 각 분획이 모든 아미노산 유형을 함유하는 것인, 방법.
373. 항목 364 또는 365에 있어서, 상기 분획의 수가 샘플에서 표지된 아미노산 유형의 수와 동일하지 않고, 하나 초과의 아미노산 유형이 분획 당 표지되는 것인, 방법.
374. 항목 364 또는 365에 있어서, 상기 2 개 이상의 아미노산 유형이 동일한 표지 갖고 이들이 상이한 분획에서 표지되는 것인, 방법.
375. 항목 1 내지 374 중 어느 한 항목에 있어서, 상기 표지화 반응이 미세유체 장치에서가 아니라 벌크으로 수행되는 것인, 방법.
376. 항목 1 내지 375 중 어느 한 항목에 있어서, 상기 샘플의 표지 및/또는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체의 알려진 표지 값이 신호를 제공하는 것인, 방법.
377. 항목 1 내지 376 중 어느 한 항목에 있어서, 상기 샘플의 표지가 형광단인, 방법.
378. 항목 1 내지 377 중 어느 한 항목에 있어서, 상기 샘플의 표지가 형광단의 반응성 유도체인, 방법.
379. 항목 377 또는 378에 있어서, 상기 샘플의 표지가 형광 표지인, 방법.
380. 항목 379에 있어서, 상기 형광 표지가 형광 프로브인, 방법.
381. 항목 380에 있어서, 상기 형광 표지가 형광 태그인, 방법.
382. 항목 380에 있어서, 상기 형광 표지가 형광 단백질인, 방법.
383. 항목 380에 있어서, 상기 형광 표지가 형광 염료인, 방법.
384. 항목 380에 있어서, 상기 형광 표지가 아미노산 유형에 특이적인 반응성 기를 포함하는 것인, 방법.
385. 항목 380에 있어서, 상기 형광 표지가 아미노산 유형을 표적하는 반응성 기를 포함하는 것인, 방법.
386. 항목 380에 있어서, 상기 형광 표지가 아미노산 유형의 R-기에 특이적인 반응성 기를 포함하는 것인, 방법.
387. 항목 380에 있어서, 상기 형광 표지가 아미노산 유형의 R-기를 표적하는 반응성 기를 포함하는 것인, 방법.
388. 항목 380에 있어서, 상기 형광 표지가 단백질의 N 또는 C 말단에 특이적인 반응성 기를 포함하는 것인, 방법.
389. 항목 380에 있어서, 상기 형광 표지가 단백질의 N 또는 C 말단을 표적하는 반응성 기를 포함하는 것인, 방법.
390. 항목 380에 있어서, 상기 형광 표지가 양자점(quantum dot)을 포함하는 것인, 방법.
391. 항목 1 내지 390 중 어느 한 항목에 있어서, 상기 샘플의 표지가 나노입자를 포함하는 것인, 방법.
392. 항목 379 내지 390에 있어서, 상기 형광 표지가 형광단을 포함하는 것인, 방법.
393. 항목 392에 있어서, 상기 형광단이 다음으로 이루어진 군으로부터 선택되는 것인, 방법: 하이드록시쿠마린, 아미노쿠마린, 메톡시쿠마린, 캐스케이드 블루(Cascade Blue), 퍼시픽 블루(Pacific Blue), 퍼시픽 오렌지(Pacific Orange), 루시퍼 옐로우(Lucifer yellow), NBD, R-피코에리트린(Phycoerythrin)(PE), PE-Cy5 접합체, PE-Cy7 접합체, Red 613, PerCP, TruRed, FluorX, BODIPY-FL, G-Dye100, G-Dye200, G-Dye300, G-Dye400, Cy2, Cy3, Cy3B, Cy3.5, Cy5, Cy5.5, Cy7, TRITC, X-로다민(Rhodamine), 리사민 로다민(Lissamin Rhodamine) B, 텍사스 레드(Texas Red), 알로피코시아닌(Allophycocyanin)(APC), APC-Cy7 접합체, DAPI, Hoechst 33258, SYTOX Blue, 크로모마이신(Chromomycin) A3, 미트라마이신(Mithramycin), YOYO-1, ATTO 390, ATTO 425, ATTO 465, ATTO 488, ATTO 495, ATTO 514, ATTO 520, ATTO 532, ATTO Rho6G, ATTO 550, ATTO 565, ATTO Rho3B, ATTO Rho11, ATTO Rho12, ATTO Thio12, ATTO Rho101, ATTO 590, ATTO Rho13, ATTO 594, ATTO 610, ATTO Rho14, ATTO 633, ATTO 647, ATTO 647N, ATTO 655, ATTO Oxa12, ATTO 665, ATTO Oxa12, ATTO 665, ATTO 680, ATTO 700, ATTO 725, ATTO 740, 브릴리언트 바이올렛(Brilliant Violet) 421, 브릴리언트 바이올렛 510, 브릴리언트 바이올렛 570, 브릴리언트 바이올렛 605, 브릴리언트 바이올렛 650, 브릴리언트 바이올렛 711, 브릴리언트 바이올렛 750, 브릴리언트 바이올렛 785, TM-BDP, KFL-1, KFL-2, KFL-3, KFL-4, 수퍼 브라이트(Super Bright) 436, 수퍼 브라이트 600, 수퍼 브라이트 645, 수퍼 브라이트 702, 수퍼 브라이트 780, 알렉사 플로우르(Alexa Flour) 350, 알렉사 플로우르 405, 알렉사 플로우르 488, 알렉사 플로우르 532, 알렉사 플로우르 546, 알렉사 플로우르 555, 알렉사 플로우르 568, 알렉사 플로우르 594, 알렉사 플로우르 647, 알렉사 플로우르 680, 알렉사 플로우르 850, 쿠마린, 퍼시픽 그린(Pacific Green), 오레곤 그린(Oregon Green), 플로우레세인(Flourescein)(FITC), PE-Cyanine7, PerCP-Cyanine5.5, 테트라메틸로다민(TRITC), eFlour 450, eFlour506, eFlour660, PE-eFlour 610, PerCP-eFlour 710, APC-eFlour 780, 수퍼 브라이트 436, 수퍼 브라이트 600, 수퍼 브라이트 645, 수퍼 브라이트 702, 수퍼 브라이트 780, DAPI, SYTOX Green, SYTO 9, TO-PRO-3, Qdot 525, Qdot 565, Qdot 605, Qdot 655, Qdot 705, Qdot 800, R-피코에리트린(R-PE), CFP, GFP(emGFP), RFP(tagRFP), VioBlue, VioGreen, VioBright 515, Vio 515, VioBright FITC, PE, PE-Vio 615, PerCP, PerCP-Vio 700, PE-Vio 770, APC, APC-Vio 770, 1,8-나프탈리미드, 아크리딘 오렌지(Acridine Orange), SYTOX Green, TOTO-1, TO-PRO-1, TO-PRO: 시아닌 단량체(Cyanine Monomer), 티아졸 오렌지(Thiazole Orange), CyTRAK Orange, 프로피듐 요오다이드(PI), LDS 751, 7-AAD, SYTOX Orange, TOTO-3, TO-PRO-3, DRAQ5, DRAQ7, Indo-1, Fluo-3, Fluo-4, DCFH, DHR 또는 SNARF.
394. 항목 379 내지 390 중 어느 한 항목에 있어서, 상기 형광 표지가 형광 단백질을 포함하는 것인, 방법.
395. 항목 394에 있어서, 상기 형광 단백질이 GFP(Y66H 돌연변이), GFP(Y66F 돌연변이), EBFP, EBFP2, 아주라이트(Azurite), GFPuv, T-Sapphire, 세룰리언(Cerulean), mCFP, mTurquoise2, ECFP, CyPet, GFP(Y66W 돌연변이), mKeima-Red, TagCFP, AmCyan1, mTFP1, GFP(S65A 돌연변이), 미도리이시 시안(Midoriishi Cyan), 야생형 GFP, GFP(S65C 돌연변이), TurboGFP, TagGFP, GFP(S65L 돌연변이), 에메랄드(Emerald), GFP(S65T 돌연변이), EGFP, 아자미 그린(Azami Green), ZsGreen1, TagYFP, EYFP, 토파즈(Topaz), 비너스(Venus), mCitrine, YPet, TurboYFP, ZsYellow1, 쿠사비라 오렌지(Kusabira Orange), mOrange, 알로피코시아닌(APC), mKO, TurboRFP, tdTomato, TagRFP, DsRed 단량체, DsRed2("RFP"), mStrawberry, TurboFP602, AsRed2, mRFP1, J-Red, R-피코에리트린(RPE), B-피코에리트린(BPE), mCherry, HcRed1, 카투샤(Katusha), P3, 페리디닌 엽록소(PerCP), mKate(TagFP635), TurboFP635, mPlum 또는 mRaspberry인, 방법.
396. 항목 1 내지 395 중 어느 한 항목에 있어서, 상기 표지가 아미노산 유형에 특이적인 반응성 기를 포함하는 것인, 방법
397. 항목 396에 있어서, 상기 표지가 아미노산 유형의 R-기에 특이적인 반응성 기를 포함하는 것인, 방법.
398. 항목 377 내지 391 또는 392 내지 395에 있어서, 상기 형광 표지가 표지화 단계 동안 또는 전에 아미노산 유형으로 이루어진 화학적 변형에 특이적인 반응성 기를 포함하는 것인, 방법.
399. 항목 398에 있어서, 상기 형광 표지가 표지화 단계 동안 또는 전에 아미노산 유형의 R-기로 이루어진 화학적 변형에 특이적인 반응성 기를 포함하는 것인, 방법.
400. 항목 398에 있어서, 상기 형광 표지가 표지화 단계 동안 또는 전에 아미노산 유형의 R-기에 인접한 단백질 백본으로 이루어진 화학적 변형에 특이적인 반응성 기를 포함하는 것인, 방법.
401. 항목 396 내지 400에 있어서, 상기 반응성 기가 NHS-에스테르, 말레이미드, 알킨, 아지드, 브로마이드, 클로라이드, 플루오라이드, 요오다이드, 아릴 브로마이드, 아릴 클로라이드, 아릴 플루오라이드, 아릴 요오다이드, 디엔, 디에노필, 올레핀, 테트라진, 사이클로옥틴, 비오틴, 스트렙타비딘, 이소티오시아네이트, 활성 에스테르, 술포닐 클로라이드, 디알데하이드, 요오도아세트아미드, 에틸렌디아민, 아미노아크리돈, 하이드라지드, 카르복실, 또는 알콕시아민으로 이루어진 군으로부터 선택되는 것인, 방법.
402. 항목 379에 있어서, 상기 형광 표지가 형광 염료인, 방법.
403. 항목 402에 있어서, 상기 형광 염료가 형광생성 염료, 비-형광생성 염료, 아미노산 유형과 반응 시 형광이 되는 분자, 및/또는 본질적으로 형광 아미노산 유형의 형광을 스펙트럼의 가시 영역으로 이동시키는 분자인, 방법.
404. 항목 402에 있어서, 상기 형광 염료가 형광생성 염료, 비-형광생성 염료, 아미노산 유형의 R-기와 반응 시 형광이 되는 분자, 또는 본질적으로 형광 아미노산 유형의 R-기의 형광을 스펙트럼의 가시 영역으로 이동시키는 분자인, 방법.
405. 항목 403에 있어서, 상기 형광생성 염료, 아미노 유형과 반응 시 형광이 되는 분자, 또는 본질적으로 형광 아미노산 유형의 형광을 스펙트럼의 가시 영역으로 이동시키는 분자가 4-플루오로-7-술파모일벤조푸라잔(ABD-F), 2,2,2-트리클로로에탄올(TCE) 및/또는 오르토-프탈알데하이드(OPA), 또는 이의 혼합물로 이루어진 군으로부터 선택되는 것인, 방법.
406. 항목 403에 있어서, 상기 형광생성 염료, 아미노 유형과 반응 시 형광이 되는 분자, 또는 본질적으로 형광 아미노산 유형의 형광을 스펙트럼의 가시 영역으로 이동시키는 분자가 할로 화합물인, 방법.
407. 항목 406에 있어서, 상기 할로 화합물이 트리클로로아세트산, 클로로포름, 트리플로우로에탄올, 트리플로우로아세트산, 플로우로포름, 트리브로모에탄올, 트리브로모아세트산, 브로모포름, 트리요오도에탄올, 트리요오도아세트산 또는 요오도포름으로 이루어진 군으로부터 선택되는 것인, 방법.
408. 항목 407에 있어서, 상기 아미노산 유형 트립토판(W) 및/또는 티로신(Y)이 트리클로로아세트산, 클로로포름, 트리플로우로에탄올, 트리플로우로아세트산, 플로우로포름, 트리브로모에탄올, 트리브로모아세트산, 브로모포름, 트리요오도에탄올, 트리요오도아세트산 또는 요오도포름으로 표지되는 것인, 방법.
409. 항목 1 내지 408 중 어느 한 항목에 있어서, 상기 각 아미노산 유형의 R-기가 표지되는 것인, 방법
410. 항목 409에 있어서, 상기 표지된 아미노산 유형의 R-기가 아미노산 유형의 변형 및/또는 비변형된 아미노산의 R-기인, 방법.
411. 항목 410에 있어서, 상기 비변형된 A 아미노산에 대한 R-기가 팔라듐 촉매화 C(sp3)-H3 결합 활성화, Pd(OAc)2와 1-에티닐-4-요오도벤젠을 통해 표지되어, 알킨 이어서 3-아지도-2H-크로멘-2-온으로 Cu(I) 촉매화된 아지드-알킨 고리화 첨가(CuAAC) "클릭-화학(click-chemistry)을 설치하는 것인, 방법
412. 항목 410에 있어서, 상기 비변형된 R 아미노산에 대한 R-기가 도파크롬(Dopachrome)으로 표지되는 것인, 방법.
413. 항목 410에 있어서, 상기 비변형된 N 아미노산에 대한 R-기가 4-아미노-3-포름일페닐 니트레이트로 표지되는 것인, 방법.
414. 항목 410에 있어서, 상기 비변형된 D 아미노산에 대한 R-기가 4-(디에틸아미노)-2-(피리딘-2-일메톡시)벤즈알데하이드 첨부된 BODIPY 기반 프로브로 표지되는 것인, 방법.
415. 항목 410에 있어서, 상기 변형 및 비변형된 C 아미노산에 대한 R-기가 산화된 티올을 트리스(2-카르복시에틸)포스핀(TCEP)으로 환원시킨 후 4-아미노술포닐-7-플루오로-2,1,3-벤족사디아졸(ABD-F)로 표지되는 것인, 방법.
416. 항목 410에 있어서, 상기 비변형된 C 아미노산(CR)에 대한 R-기가 4-아미노술포닐-7-플루오로-2,1,3-벤족사디아졸(ABD-F) 또는 o-말레이미드 BODIPY 또는 에틸 (Z)-2-(6-(에틸((3-(트리플루오로메틸)페닐)셀라닐)아미노)-3-(에틸이미노)-2,7-디메틸-3H-크산텐-9-일)벤조에이트로 표지되는 것인, 방법.
417. 항목 410에 있어서, 상기 비변형된 E 아미노산에 대한 R-기가 4-(디에틸아미노)-2-(피리딘-2-일메톡시)벤즈알데하이드 첨부된 BODIPY 기반 프로브로 표지되는 것인, 방법.
418. 항목 410에 있어서, 상기 비변형된 Q 아미노산에 대한 R-기가 4-아미노-3-포름일페닐 니트레이트로 표지되는 것인, 방법.
419. 항목 410에 있어서, 상기 비변형된 G 아미노산에 대한 R-기가 CuBr(1 μM) 및 DCM 중 10 μM의 tBuOOH의 존재 하에 H-알키닐-Phe와의 반응을 통해 카르보닐에 대한 C-H 결합 작용기화 알파, 이어서 3-아지도-7-메톡시-2H-크로멘-2-온케톤으로의 CuAAc를 통해 표지되는 것인, 방법.
420. 항목 410에 있어서, 상기 비변형된 H 아미노산에 대한 표지된 R-기가 2-부틸-6-(4-((6-(((2-에톡시에틸)아미노)메틸)피리딘-2-일)메틸)피페라진-1-일)-1H-벤조[데]이소퀴놀린-1,3(2H)-디온-Cu2+로 표지되는 것인, 방법.
421. 항목 410에 있어서, 상기 비변형된 I 아미노산에 대한 R-기가 이소류신의 δ-C-H 작용기화를 위한 청색 광 매개 호프만-뢰플러-프라이타그(Hoffman-Loffler-Freytag) 반응, 이어서 Br 기를 설치하기 위한 청색 LED에 의해 촉매화된 아세트산 하이포아브롬산 무수물과의 반응, 이어서 아지드 기를 설치하기 위한 KN3과의 SN2 반응, 이어서 4-((7-에티닐-2-옥소-2H-크로멘-4-일)메톡시)-4-옥소부탄산으로의 CuAAc로 표지되는 것인, 방법.
422. 항목 410에 있어서, 상기 비변형된 L 아미노산에 대한 R-기가 이소엘류신의 δ-C-H 작용기화를 위한 청색 광 매개 호프만-뢰플러-프라이타그 반응, 이어서 Br 기를 설치하기 위한 청색 LED에 의해 촉매화된 아세트산 하이포아브롬산 무수물과의 반응, 이어서 아지드 기를 설치하기 위한 KN3과의 SN2 반응, 이어서 4-((7-에티닐-2-옥소-2H-크로멘-4-일)메톡시)-4-옥소부탄산으로의 CuAAc로 표지되는 것인, 방법.
423. 항목 410에 있어서, 상기 비변형된 K 아미노산에 대한 R-기가 β-머캅토에탄올(BME)의 존재 하에 오르토-프탈알데하이드(OPA)로 표지되는 것인, 방법.
424. 항목 410에 있어서, 상기 비변형된 M 아미노산에 대한 R-기가 알킨 보유 메티오닌-선택적 요오도늄 염과의 반응, 이어서 CalFlour 염료로의 클릭 화학으로 표지되는 것인, 방법.
425. 항목 410에 있어서, 상기 비변형된 F 아미노산에 대한 R-기가 (브로모에티닐)트리이소프로필실란 1 μM Pd(OAc)2와 염기로서 20 μM의 K2CO3, 및 첨가제로서 1 μM PivOH와의 팔라듐 촉매화 알키닐화 반응, 이어서 3-아지도-7-하이드록시-2H-크로멘-2-온으로의 CuAAc를 통해 표지되는 것인, 방법.
426. 항목 410에 있어서, 상기 비변형된 P 아미노산에 대한 R-기가 양친매성 이극성 쉬프(Schiff) 염기 ZnII 복합체로 표지되는 것인, 방법.
427. 항목 410에 있어서, 상기 S 비변형된 아미노산에 대한 R-기가 TT/n-Bu4NN3 또는 Ph3P:2,3-디클로로-5,6- 디시아노벤조퀴논(DDQ):n-Bu4NN3으로 아지드로의 선택적 전환 이어서 Fl-DIBO와의 반응을 통해 표지되는 것인, 방법.
428. 항목 410에 있어서, 상기 비변형된 T 아미노산에 대한 R-기가 TT/n-Bu4NN3 또는 Ph3P:2,3-디클로로-5,6- 디시아노벤조퀴논(DDQ):n-Bu4NN3으로 아지드로의 선택적 전환 이어서 Fl-DIBO와의 반응을 통해 표지되는 것인, 방법.
429. 항목 410에 있어서, 상기 비변형된 W 아미노산에 대한 R-기가 트리클로로에탄올(TCE), 트리클로로아세트산(TCA), 클로로포름, 트리플루오로에탄올(TFE), 트리플로우로아세트산(TFA), 플로우로포름, 트리브로모에탄올, 트리브로모아세트산(TBA), 브로모포름, 트리요오도에탄올(TIE), 또는 트리요오도아세트산(TIA), 요오도포름, 또는, Rh2(OAc)4 및 tBuHNOH의 존재 하에 2-(2-(2-메톡시에톡시)에톡시)에틸 (E)-2-디아조-4-페닐부트-3-에노에이트로 표지되는 것인, 방법.
430. 항목 410에 있어서, 상기 변형된 W 아미노산에 대한 R-기가 트리클로로에탄올(TCE)로 표지되는 것인, 방법.
431. 항목 410에 있어서, 상기 비변형된 Y 아미노산에 대한 R-기가 트리클로로에탄올(TCE), 또는, [RhCl(PPh3)3], R2P(OAr),Ar-Br,CsCO3을 사용하여 티로신 하이드록실 기에 아릴 기 오르토의 설치로 표지되는 것인, 방법.
432. 항목 410에 있어서, 상기 비변형된 V 아미노산에 대한 R-기가 [Ru(bpy)3]Cl2 촉매 및 가시 광에 의해 촉매화된 1-아지도-1l3-벤조[d][1,2]요오다옥솔-3(1H)-온을 사용하여 발린 측쇄 상에 4차 아지드 기의 설치, 이어서 4-((7-에티닐-2-옥소-2H-크로멘-4-일)메톡시)-4-옥소부탄산과의 형광생성 CuAAC 반응을 통해 표지되는 것인, 방법.
433. 항목 410에 있어서, 상기 비변형된 O 아미노산에 대한 R-기가 아자프탈이미드와의 딜스 알더(Diels Alder) 반응을 통해 표지되는 것인, 방법.
434. 항목 410에 있어서, 상기 비변형된 U 아미노산에 대한 R-기가 pH 7에서 ABD-F로 표지되는 것인, 방법.
435. 항목 410에 있어서, 상기 변형된 S 아미노산에 대한 R-기가 BO-IMI로 표지되는 것인, 방법.
436. 항목 410에 있어서, 상기 트레오닌의 변형된 T 아미노산에 대한 R-기가 BO-IMI로 표지되는 것인, 방법.
437. 항목 410에 있어서, 상기 변형된 Y 아미노산에 대한 R-기가 BO-IMI로 표지되는 것인, 방법.
438. 항목 410에 있어서, 상기 변형된 R 아미노산이 o-말레이미드 bodipy로 표지되는 것인, 방법.
439. 항목 410에 있어서, 상기 변형된 N 아미노산이 알킨 치환기가 있는 보론산 토실 프로브로 표지되며, 후속적으로 CalFlour 염료와 반응되는 것인, 방법.
440. 항목 410에 있어서, 상기 변형된 K 아미노산이 9-플루오레닐메틸 클로로포르메이트로 표지되는 것인, 방법.
441. 항목 379에 있어서, 상기 형광 표지가 형광 단백질 또는 접합된 항체인, 방법.
442. 항목 441에 있어서, 상기 형광 단백질이 smURFP, GFP, EGFP, 세룰리언, mTurquoise, TagBFP, mCherry, mOrange, 시트린(Citrine), 드론파(Dronpa), dsRed, eqFP611, 덴드라(Dendra), EosFP, IrisFP, TagRFPs, FbFPs로 이루어진 군으로부터 선택되는 것인, 방법.
443. 항목 441에 있어서, 상기 접합된 항체가 번역 후 변형된 단클론 항체인, 방법.
444. 항목 443에 있어서, 상기 번역 후 변형된 단클론 항체가 포스포세린, 포스포트레오닌, 포스포티로신, 인산화, 리신 메틸화, 아르기닌 메틸화, 리신 아세틸화, 아르기닌 아세틸화, 아미드화, 피롤리돈 카르복실산의 형성, 이성질체화, 프롤린 하이드록실화, 리신 하이드록실화, 황산화, 플라빈-결합, 시스테인 산화, 니트로실화, 리신 아실화, 시스테인 아실화, N-말단 아실화, 리신 포름일화, 리신 알킬화, 시스테인 알킬화, 아르기닐화, 아미드 결합 형성, 부티릴화, 감마-카르복실화, 아르기닌 글리코실화, 아스파라긴 글리코실화, 시스테인 글리코실화, 하이드록시리신 글리코실화, 세린 글리코실화, 트레오닌 글리코실화, 티로신 글리코실화, 트립토판 글리코실화, 말로닐화, 프롤린 하이드록실화, 리신 하이드록실화, 티로신 요오드화, 뉴클레오티드 첨가, 인산화, 아데닐릴화, 우리딜릴화, 프로피오닐화, 피로글루타메이트 형성, S-글루타티오닐화, 시스테인 술페닐화, 시스테인 술포닐화, 리신 숙시닐화, 티로신 황산화, 미리스토일화, 팔미토일화, 이소프레닐화, 프레닐화 또는 글리피화를 검출하는 것인, 방법.
445. 항목 1 내지 376에 있어서, 상기 표지가 탠덤 질량 태그(tandem mass tag)인, 방법.
446. 항목 445에 있어서, 상기 탠덤 질량 태그가 TMTzero, TMTduplex, TMTsimplex, TMT 10-plex, TMTpro 및 TMTpro Zero로 이루어진 군으로부터 선택되는 것인, 방법.
447. 항목 1 내지 376에 있어서, 상기 표지가 동위원소 표지인, 방법.
448. 항목 447에 있어서, 상기 동위원소 표지가 비-방사성 동위원소인, 방법.
449. 항목 449에 있어서, 상기 비-방사성 동위원소 표지가 2H, 13C, 및/또는 15N으로부터 선택되는 것인, 방법.
450. 항목 350에 있어서, 상기 검출된 신호가 화학발광 신호 또는 생화학발광 신호인, 방법.
451. 항목 450에 있어서, 상기 화학발광 표지가 N-(4-아미노부틸)-N-에틸-이소루미놀(ABEI) 매크로사이클릭 락톤인, 방법
452. 항목 377 내지 451 중 어느 한 항목에 있어서, 상기 형광 표지, 동위원소 표지, 탠덤 질량 태그, 및/또는 화학발광 표지의 조합이 2 개 이상의 아미노산 유형을 표지하는 데 사용되는 것인, 방법.
453. 항목 358에 있어서, 상기 아미노산 유형 세린 및 트레오닌에 대한 측정된 표지가 서로 디콘볼루션되는 것인, 방법.
454. 항목 358에 있어서, 상기 아미노산 유형 아스파라긴 및 글루타민에 대한 측정된 표지가 서로 디콘볼루션되는 것인, 방법
455. 항목 358에 있어서, 상기 아미노산 유형 글루탐산 및 아스파르트산에 대한 측정된 표지가 서로 디콘볼루션되는 것인, 방법.
456. 항목 358에 있어서, 상기 아미노산 유형 류신 및 이소류신에 대한 측정된 표지가 서로 디콘볼루션되는 것인, 방법.
457. 항목 1 내지 456 중 어느 한 항목에 있어서, 상기 샘플이 표지화 전에, 또는 표지화 반응 동안 변성되는 것인, 방법.
458. 항목 376에 있어서, 상기 표지의 신호가 측정되는 것인, 방법.
459. 항목 1 내지 458 중 어느 한 항목에 있어서, 상기 측정된 표지가 배경 보정되는 것인, 방법.
459a. 항목 459에 있어서, 상기 샘플의 자가형광이 제거되는 것인, 방법.
460. 항목 447 내지 449에 있어서, 상기 동위원소 표지가 NMR 및/또는 질량 분광법을 통해 측정되는 것인, 방법.
461. 항목 445 내지 446에 있어서, 상기 탠덤 질량 태그가 질량 분광법을 통해 측정되는 것인, 방법.
462. 항목 379 내지 395 또는 398 내지 442에 있어서, 상기 형광 표지가 형광 현미경을 통해 측정되는 것인, 방법.
463. 항목 379 내지 395 또는 398 내지 442에 있어서, 상기 형광 표지가 형광계를 통해 측정되는 것인, 방법.
464. 항목 379 내지 395 또는 398 내지 442에 있어서, 상기 형광 표지기 형광 플레이트 판독기를 통해 측정되는 것인, 방법.
465. 항목 379 내지 395 또는 398 내지 442에 있어서, 상기 형광 표지가 여러 형광 반응을 병렬로 또는 직렬로 수행하고/하거나 판독하는 기기를 통해 측정되는 것인, 방법.
466. 항목 462에 있어서, 상기 아미노산 유형 Y가 형광 표지로 표지되고 형광 표지가 약 250nm 내지 약 380 nm의 여기 파장 및 약 370nm 내지 약 500nm의 방출 파장에서 측정되는 것인, 방법.
467. 항목 462에 있어서, 상기 아미노산 유형 W가 형광 표지로 표지되고 형광 표지가 약 270nm 내지 약 380nm의 여기 파장 및 약 430nm 내지 약 600nm의 방출 파장에서 측정되는 것인, 방법.
468. 항목 462에 있어서, 상기 아미노산 유형 K가 형광 표지로 표지되고 형광 표지가 약 320nm 내지 약 415nm의 여기 파장 및 약 400 nm 내지 약 500nm의 방출 파장에서 측정되는 것인, 방법.
469. 항목 462에 있어서, 상기 아미노산 유형 C가 형광 표지로 표지되고 형광 표지가 약 330nm 내지 약 400nm의 여기 파장 및 약 430nm 내지 약 580nm의 방출 파장에서 측정되는 것인, 방법.
470. 항목 462에 있어서, 상기 제공된 여기 및 방출 파장 범위로부터, 여기 파장이 샘플에서 표지되는 각 아미노산 유형의 각 형광 표지의 약 10nm 내지 약 20nm만큼 방출 파장으로부터 분리되는 것인, 방법.
471. 항목 1 내지 470 중 어느 한 항목에 있어서, 상기 각 표지된 아미노산 유형의 아미노산 농도가 측정된 표지로부터 계산되고 아미노산 농도가 샘플의 측정된 표지와 샘플에서 해당 아미노산 유형의 아미노산 농도 사이를 전환하는 교정 곡선 또는 표준을 사용하여 측정된 표지로부터 계산되는 것인, 방법.
472. 항목 471에 있어서, 상기 교정 곡선 또는 표준이 하나 이상의 단백질 또는 아미노산의 하나 이상의 알려진 아미노산 농도의 측정된 표지로부터 계산되는 것인, 방법.
473. 항목 471에 있어서, 상기 각 표지된 아미노산 유형의 아미노산 농도가 측정된 표지로부터 계산되고 아미노산 농도가 샘플의 측정된 표지와 샘플에서 해당 아미노산 우형의 아미노산 농도 사이를 전환하는 교정 곡선을 사용하여 측정된 표지로부터 계산되는 것인, 방법.
474. 항목 471에 있어서, 상기 각 표지된 아미노산 유형의 아미노산 농도가 측정된 표지로부터 계산되고 아미노산 농도가 샘플의 측정된 표지와 샘플에서 해당 아미노산 유형의 아미노산 농도 사이를 전환하는 표준을 사용하여 측정된 표지로부터 계산되는 것인, 방법.
475. 항목 473에 있어서, 상기 교정 곡선이 하나 이상의 단백질 또는 아미노산의 하나 초과의 알려진 아미노산 농도의 측정된 표지로부터 계산되는 것인, 방법.
476. 항목 474에 있어서, 상기 표준이 하나의 단백질 또는 아미노산의 하나의 알려진 아미노산 농도의 측정된 표지로부터 계산되는 것인, 방법.
477. 항목 471, 474 또는 476에 있어서, 상기 하나 초과의 표준이 교정 곡선을 생성하는 것인, 방법.
478. 항목 471, 472, 473 또는 476 중 어느 한 항목에 있어서, 상기 교정 곡선이 비선형인, 방법.
478a. 항목 478에 있어서, 상기 비선형 맞춤이 다항식 맞춤(polynomial fit)인, 방법.
478b. 항목 478에 있어서, 상기 비선형 맞춤이 멱함수 맞춤(power law fit)인, 방법.
478c. 항목 478에 있어서, 상기 비선형 맞춤이 지수 맞춤(exponential fit)인, 방법.
478d. 항목 478에 있어서, 상기 비선형 맞춤이 시그모이드 맞춤(sigmoidal fit)인, 방법.
479. 항목 471, 472, 473 또는 476 중 어느 한 항목에 있어서, 상기 교정 곡선이 선형인, 방법.
480. 항목 471, 472, 473 또는 475 중 어느 한 항목에 있어서, 상기 측정된 표지와 아미노산 농도 사이를 전환하기 위한 최적 맞춤(best fit)이 교정 곡선에 대해 계산되는 것인, 방법.
481. 항목 480에 있어서, 상기 측정된 표지와 아미노산 농도 사이를 전환하기 위한 최적 맞춤이 교정 곡선에 대해 계산되며 선형 맞춤인, 방법.
482. 항목 481에 있어서, 상기 최적 맞춤 선이 선형 회귀를 사용하여 계산되는 것인, 방법.
483. 항목 471, 472, 473 또는 475에 있어서, 상기 최적 맞춤이 비선형 회귀를 사용하여 계산되는 것인, 방법.
484. 항목 481에 있어서, 상기 표지가 형광 표지이고 교정 곡선에 대한 최적 맞춤 선이 방정식 5를 사용하여 계산되는 것인, 방법:
Figure pct00032
여기서 표지 값 n 은 AU의 아미노산 유형 n의 표지 값이고, m n 은 아미노산 유형 n에 대한 AU / 아미노산 농도의 최적 맞춤 선의 기울기이고, A.A.농도 n 은 아미노산 유형 n의 아미노산 농도이고, b n 은 아미노산 유형 n의 아미노산 농도가 0인 경우 표지 값이다. 맞춤의 출력은 m n b n 이다.
485. 항목 483에 있어서, 상기 샘플의 각 표지된 아미노산 유형의 아미노산 농도가 방정식 6인 교정 곡선의 역수를 사용하여 결정되는 것인, 방법:
Figure pct00033
여기서 A.A.농도 n 은 아미노산 유형 n의 아미노산 농도이고, 표지 값 n 은 AU의 아미노산 유형 n의 측정된 표지 값이고, b n 은 아미노산 유형 n의 아미노산 농도가 0인 경우 표지 값이고, m n 은 아미노산 유형 n에 대해 AU / 아미노산 농도의 계산된 최적 맞춤 선의 기울기이다.
486. 항목 481에 있어서, 상기 표지가 형광 표지이고 표지가 배경 보정되고 교정 곡선의 최적 맞춤 선이 방정식 7을 사용하여 계산된는 것인, 방법:
Figure pct00034
여기서 표지 값 n 은 AU의 아미노산 유형 n의 표지 값이고, m n 은 아미노산 유형 n에 대한 AU / 아미노산 농도의 최적 맞춤 선의 기울기이고, A.A.농도 n 은 아미노산 유형 n의 아미노산 농도이다. 맞춤의 출력은 m n 이다.
487. 항목 485에 있어서, 상기 샘플의 각 표지된 아미노산 유형의 아미노산 농도가 방정식 8인 교정 함수의 역수를 사용하여 결정되는 것인, 방법:
Figure pct00035
여기서 A.A.농도 n 은 아미노산 유형 n의 아미노산 농도이고, 표지 값 n 은 AU의 아미노산 유형 n의 측정된 표지 값이고, m n 은 AU / 아미노산 농도의 계산된 최적 맞춤 선의 기울기이다.
488. 항목 484 또는 486 중 어느 한 항목에 있어서, 상기 아미노산 유형 n에 대한 최적 맞춤 선의 기울기 m n 이 아미노산 농도를 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 알려진 표지 값으로 전환하는 경우 사용될 수 있는 아미노산 유형 n에 대한 교정 계수 f n 인, 방법.
489. 항목 485 또는 487 중 어느 한 항목에 있어서,상기 아미노산 유형 n에 대한 교정 계수의 역수,
Figure pct00036
이 알려진 표지 값을 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 아미노산 농도로 전환하는 경우 사용될 수 있는 최적 맞춤 선의 기울기의 역수
Figure pct00037
인, 방법.
490. 항목 488 또는 489에 있어서, 상기 샘플에서 각 표지된 아미노산 유형에 대한 교정 계수가 하나의 표준의 하나의 아미노산 농도로부터의 데이터를 사용하여 결정되는 것인, 방법.
491. 항목 490에 있어서, 상기 표준이 단백질 또는 아미노산인, 방법.
492. 항목 490에 있어서, 상기 아미노산 유형 n에 대한 교정 계수의 역수가 다음 식에 의해 결정되는 것인, 방법:
Figure pct00038
493. 항목 1 내지 492 중 어느 한 항목에 있어서, 상기 샘플에서 각 표지된 아미노산 유형의 아미노산 수가 계산되고, 샘플에서 각 표지된 아미노산 유형의 아미노산 수가 아미노산 농도를 샘플의 총 몰 단백질 농도로 나눔으로써 계산되는 것인, 방법.
494. 항목 493에 있어서, 상기 샘플이 관심 단백체, 하위단백체 또는 복합체 혼합물의 존재에 대해 식별되고 각 표지된 아미노산 유형의 아미노산 수가 관심 단백체, 하위단백체 또는 복합체 혼합물에 걸친 모든 단백질에서 각 표지된 아미노산 유형의 평균 아미노산 수인, 방법.
495. 항목 494에 있어서, 상기 평균 아미노산 수가 단백질의 단백체, 하위단백체 또는 혼합물에 걸친 각 단백질의 비율에 의해 가중된, 관심 단백체, 하위단백체 또는 혼합물에 걸친 모든 단백질에서 각 표지된 아미노산의 아미노산의 가중 평균 수인, 방법.
496. 항목 494 또는 495에 있어서, 상기 각 아미노산 유형의 아미노산의 가중 평균 수가 방정식 11을 사용하여 계산되는 것인, 방법:
Figure pct00039
여기서 w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, c는 관심 단백체 또는 하위단백체에서 단백질의 수이고, a n,i 는 관심 단백체 또는 하위단백체에서 단백질 i의 아미노산 유형 n의 아미노산 수이고, q i 는 관심 단백체 또는 하위단백체에서 단백질 i의 양의 척도이고, q는 관심 단백체 또는 하위단백체에서 모든 단백질(단백질 i 내지 c)의 총 양의 동등한 척도이다.
497. 항목 496에 있어서, 상기
Figure pct00040
가 관심 단백체 또는 하위단백체 내의 단백질 i의 비율을 제공하는 것인, 방법.
498. 항목 496 또는 497에 있어서, 상기 q i 가 관심 단백체 또는 하위단백체 내의 관심 단백질 i의 발현 수준인, 방법.
499. 항목 498에 있어서, 상기 단백체 또는 하위단백체 내의 관심 발현 수준 i가 질량 분광법 또는 면역검정을 포함하는 공개적으로 이용가능한 데이터로부터 결정되는 것인, 방법.
500. 항목 499에 있어서, 상기 공개적으로 이용가능한 데이터가 인간 단백질 아틀라스(Human Protein Atlas), 인간 펩티드 아틀라스(Human Peptide Atlas), 및/또는 ProteomeXchange와 같은 공개 데이터베이스인, 방법.
501. 항목 496 또는 497 중 어느 한 항목에 있어서, 상기 q가 공개적으로 이용가능한 단백질 발현 데이터를 사용하여 각각 평가된 관심 단백체 또는 하위단백체 내에 함유된 모든 단백질(단백질 i 내지 c)의 총 예측된 발현 수준인, 방법.
502. 항목 501에 있어서, 상기 q가 관심 단백체 또는 하위단백체의 총 단백질 농도인, 방법.
503. 항목 502에 있어서, 상기 q가 당업계의 표준 방법을 사용하여 계산된 관심 단백체 또는 하위단백체의 총 단백질 농도인, 방법.
504. 항목 501 및 502에 있어서, 상기 q i q가 mRNA 발현 데이터를 사용하여 결정되는 것인, 방법.
505. 항목 504에 있어서, 상기 q i 가 mRNA 발현 데이터 및 유전자 특이적 RNA-대-단백질(RTP) 전환 계수를 사용하여 결정되는 것인, 방법.
506. 항목 496에 있어서, 상기 q i q가 알려진 구조적 모델로부터 계산될 수 있는 것인, 방법.
506a. 항목 496에 있어서, 상기
Figure pct00041
가 하기 식에 의해 제공되는 것인, 방법:
Figure pct00042
여기서 int m 은 질량 분광법 데이터베이스로부터 계산된 샘플 내의 개별 단백질의 몰 강도이고, Σint m 은 질량 분광법 데이터베이스로부터 계산된 샘플 내의 모든 개별 단백질의 몰 강도의 합이고, MSIF m 은 질량 분광법 몰 강도 분율이다.
506b. 항목 506a에 있어서, 상기 q i = int m 인, 방법:
여기서 int m 은 질량 분광법 데이터베이스로부터 계산된 샘플 내의 개별 단백질의 몰 강도이다.
506c. 항목 506a 또는 506b에 있어서, 상기 q = Σint m 인, 방법:
여기서 Σint m 은 질량 분광법 데이터베이스로부터 계산된 샘플 내의 모든 개별 단백질의 몰 강도의 합이다.
506d. 항목 506b에 있어서, 상기
Figure pct00043
인, 방법:
여기서 int는 질량 분광법 데이터베이스에 의해 제공된 샘플 내의 모든 개별 단백질의 강도 또는 풍부도이고, m r 은 질량 분광법 데이터베이스 또는 단백질의 분자량 및 아미노산 서열을 제공하는 데이터베이스에 의해 제공된 샘플 내의 개별 단배질의 분자량이다.
506e. 항목 506d에 있어서, 상기 int가 정규화된 강도, 원시 강도, 정규화된 풍부도, 또는 원시 풍부도인, 방법.
506f. 항목 506a 내지 506e 중 어느 한 항목에 있어서, 상기 int가 무표지 정량화(LFQ)를 사용하여 계산되는 것인, 방법.
506g. 항목 506a 내지 506d 중 어느 한 항목에 있어서, 상기 질량 분광법 데이터베이스가 Proteome Xchange 데이터베이스인, 방법.
506h. 항목 506a 내지 506g 중 어느 한 항목에 있어서, 상기 단백질의 분자량 및 아미노산 서열을 제공하는 데이터베이스가 UniProt 데이터베이스인, 방법.
506i. 항목 506a 내지 506c 중 어느 한 항목에 있어서, 하기 식인, 방법:
Figure pct00044
여기서 Σ몰 단백질 농도는 몰 농도 값의 데이터베이스로부터 제공된 관심 단백체, 하위단백체, 또는 샘플 유형에서 모든 단백질에 대한 몰 단백질 농도의 합이고 여기서 평균(Σint m )은 데이터베이스 내의 모든 샘플에 대한 Σint m 값의 평균이다.
506j. 항목 506i에 있어서, 상기 몰 농도 값이 인간 펩티드 아틀라스 데이터베이스로부터 계산되는 것인, 방법.
506k. 항목 506i에 있어서, 상기 데이터베이스에서 각 단백질에 대한 몰 단백질 농도 값이 ELISA 검정과 같은 면역검정 기반 기술을 사용하여 계산되거나, 여기서 데이터베이스 내의 각 단백질에 대한 질량 단백질 농도 값이 ELISA 검정과 같은 면역검정 기반 기술을 사용하여 계산되고, UniProt 데이터베이스로부터 액세스된 것과 같이 각 단백질에 대한 분자량의 데이터베이스를 사용하여 몰 단백질 농도 값으로 변환되는 것인, 방법.
506l. 항목 506i에 있어서, 상기 데이터베이스에서 각 단백질에 대한 몰 단백질 농도 값이 Somascan 검정과 같은 압타머 기반 기술을 사용하여 계산되거나, 여기서 데이터베이스 내의 각 단백질에 대한 질량 단백질 농도 값이 ELISA 검정과 같은 면역검정 기반 기술을 사용하여 계산되고, UniProt 데이터베이스로부터 액세스된 것과 같이 각 단백질에 대한 분자량의 데이터베이스를 사용하여 몰 단백질 농도 값으로 변환되는 것인, 방법.
506m. 항목 506i 내지 506l 중 어느 한 항목에 있어서, 상기 a가 하기를 계산함으로써 주어진 샘플 세트에 대해 계산되는 것인, 방법:
Figure pct00045
506n. 항목 506m에 있어서, 상기 평균(Σint m )이 데이터베이스에서 모든 샘플에 대한 Σint m 값의 평균인, 방법.
506o. 항목 496에 있어서, 상기
Figure pct00046
가 하기에 의해 제공되는 것인, 방법:
Figure pct00047
여기서 int는 질량 분광법 데이터베이스에 의해 제공된 샘플 내의 개별 단백질의 강도이고, Σint는 질량 분광법 데이터베이스로부터 계산된 샘플 내의 모든 개별 단백질의 강도의 합이고, MSIF 질량 은 질량 분광법 질량 강도 분율이다.
506p. 항목 506o에 있어서, 상기 q i = int인, 방법:
여기서 int는 질량 분광법 데이터베이스에 의해 제공된 샘플 내의 개별 단백질의 강도이다.
506q. 항목 506o 또는 506p에 있어서, 상기 q = Σint인, 방법:
여기서 Σint는 질량 분광법 데이터베이스로부터 계산된 샘플 내의 모든 개별 단백질의 강도의 합이다.
506r. 항목 506o 내지 506q 중 어느 한 항목에 있어서, 상기 int가 정규화된 강도, 원시 강도, 정규화된 풍부도, 또는 원시 풍부도인, 방법.
506s. 항목 506o 내지 506r 중 어느 한 항목에 있어서, 상기 int가 무표지 정량화(LFQ)를 사용하여 계산되는 것인, 방법.
506t. 항목 506o 및 506p에 있어서, 상기 질량 분광법 데이터베이스가 Proteome Xchange 데이터베이스인, 방법.
506u. 항목 506n에 있어서, 하기인, 방법:
Figure pct00048
여기서 Σ질량 단백질 농도는 질량 농도 값의 데이터베이스에 의해 제공된, 관심 단백체, 하위단백체, 또는 샘플 유형에서 모든 단백질에 대한 질량 단백질 농도의 합이고 여기서 평균int)는 데이터베이스 내의 모든 샘플에 대한 Σint 값의 평균이다.
506v. 항목 506u에 있어서, 상기 질량 단백질 농도 값이 인간 펩티드 아틀라스 데이터베이스로부터 계산되는 것인, 방법.
506w. 항목 506t 내지 506v 중 어느 한 항목에 있어서, 상기 데이터베이스에서 각 단백질에 대한 질량 단백질 농도 값이 ELISA 검정과 같은 면역검정 기반 기술을 사용하여 계산되는 것인, 방법.
506x. 항목 506t 내지 506v 중 어느 한 항목에 있어서, 상기 데이터베이스에서 각 단백질에 대한 질량 단백질 농도 값이 Somascan 검정과 같은 압타머 기반 기술을 사용하여 계산되는 것인, 방법.
506y. 항목 506u 내지 506x 중 어느 한 항목에 있어서, 상기 a가 하기를 계산함으로써 주어진 샘플 세트에 대해 계산되는 것인, 방법:
Figure pct00049
506z. 항목 506y에 있어서, 상기 평균int)가 데이터베이스에서 모든 샘플에 대한 Σint 값의 평균인, 방법.
507. 항목 496에 있어서, 상기 관심 단백체가 바이러스이고, q i 가 바이러스 구조 내의 단백질 i의 수이고 q가 바이러스 구조 내의 모든 단백질(단백질 i 내지 c)의 수인, 방법.
508. 항목 507에 있어서, 상기 코로나바이러스 스파이크 단백질의 수가 코로나바이러스 바이러스 캡시드의 모델로부터 계산되는 것인, 방법.
509. 항목 495에 있어서, 상기 각 아미노산 유형의 아미노산의 가중 평균 수가 방정식 12로 결정되는 것인, 방법:
Figure pct00050
여기서 w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, c는 관심 단백체 또는 하위단백체에서 단백질의 수이고, a i,n 은 관심 단백체, 또는 하위단백체의 단백질 i에서 아미노산 유형 n의 아미노산 수이다.
510. 항목 509에 있어서, 상기 관심 단백체 또는 하위단백체 내의 모든 단백질이 관심 단백체 또는 하위단백체 내의 동등한 발현 또는 비율을 갖는 것으로 간주하여, 관심 단백체 또는 하위단백체 내의 각 관심 단백질에 대한 가중치가 동일한 것인, 방법.
511. 항목 496 또는 509에 있어서, 상기 선형 조합이 관심 단백체 또는 하위단백체에서 모든 단백질 i 내지 c에 대해 간주하는 것인, 방법.
512. 항목 494에 있어서, 상기 각 아미노산 유형의 아미노산의 가중 평균 수가 방정식 6을 사용하여 결정되는 것인, 방법:
Figure pct00051
여기서 w n 은 관심 단백질의 복합체 혼합물에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, c는 관심 단백질의 복합 단백질 혼합물에서 단백질의 수이고, a i,n 은 관심 단백질의 복합체 혼합물에서 단백질 i에서 아미노산 유형 n의 아미노산 수이고, q i 는 관심 단백질의 복합체 혼합물에서 단백질 i의 양의 척도이고, q는 관심 단백질의 복합체 혼합물에서 모든 단백질(단백질 i 내지 c)의 총 양의 동등한 척도이다.
513. 항목 512에 있어서, 상기 492 내지 502에 사용되는 임의의 방법이
Figure pct00052
를 계산하는 데 사용되는 것인, 방법.
514. 항목 495에 있어서, 상기 각 아미노산 유형의 아미노산의 가중 평균 수가 방정식 12로 결정되는 것인, 방법:
Figure pct00053
여기서 w n 은 관심 단백질의 복합체 혼합물에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, c는 관심 단백질의 복합체 혼합물에서 단백질의 수이고, a i,n 은 관심 단백질의 복합체 혼합물에서 아미노산 유형 n의 아미노산 수이다.
515. 항목 494, 509 및 514에 있어서, 상기 단백질의 복합체 혼합물이 5, 6, 7, 8, 9, 또는 10 개 초과의 단백질과의 혼합물인, 방법.
516. 항목 494, 509 및 514에 있어서, 상기 단백체, 하위단백체 또는 단백체의 혼합물에 걸친 각 단백질의 분율, 비율, 또는 조성이 해당 단백질의 발현 수준의 분율을 단백질의 혼합물 또는 단백체 내의 모든 단백질의 발현 수준과 비교함으로써 결정되는 것인, 방법.
517. 항목 1 내지 516 중 어느 한 항목에 있어서, 상기 하나 이상의 단백질 농도에서 하나 이상의 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체, 또는 단백체의 혼합물에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 또는 아미노산 농도가 하나 이상의 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체, 또는 단백체의 혼합물의 아미노산 서열로부터 계산되는 것인, 방법.
518. 항목 517에 있어서, 상기 하나 이상의 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체, 또는 단백체의 혼합물의 아미노산 서열이 각 아미노산 유형의 아미노산 수를 제공하는 것인, 방법.
519. 항목 518에 있어서, 상기 아미노산 수가 아미노산 서열 내의 아미노산 유형의 비변형된 아미노산 수를 포함하고, 여기서 아미노산 유형의 비변형된 아미노산 수가 아미노산 서열 내의 해당 아미노산 유형의 발생 수에서 해당 아미노산 유형의 번역 후 변형의 수를 뺀 것인, 방법.
520. 항목 1 내지 519 중 어느 한 항목에 있어서, 상기 관심 단백질, 펩티드, 올리고펩티드, 단백질 복합체, 하위단백체, 또는 단백체 내에 있거나 함유된 아미노산 서열 내의 2 개 이상의 아미노산 유형 각각의 아미노산 수를 계산하는 경우, 관심 단백질에서 각 아미노산 유형의 아미노산 수가 아미노산 표지화에 사용되는 표지와 화학적으로 비반응성으로 만드는 방식으로 아미노산 유형에 영향을 미치는 번역 후 변형(PTM)을 고려함으로써 조정되는 것인, 방법.
521. 항목 520에 있어서, 상기 관심 단백질, 펩티드, 올리고펩티드, 단백질 복합체, 하위단백체, 또는 단백체 내에 있거나 함유된 아미노산 서열 내의 2 개 이상의 아미노산 유형 각각의 아미노산 수를 계산하는 경우, 관심 단백질에서 각 아미노산 유형의 아미노산 수가 아미노산 표지화에 사용되는 표지와 화학적으로 비반응성으로 만드는 방식으로 아미노산 유형을 정의하는 R-기에 영향을 미치는 번역 후 변형(PTM)을 고려함으로써 조정되는 것인, 방법.
522. 항목 519 내지 521에 있어서, 상기 번역 후 변형에 대한 정보가 실험 결과에 기반하여 수득되거나, 예측을 사용하여 수득될 수 있는 것인, 방법.
523. 항목 519 내지 522에 있어서, 상기 표 4에 제공되는 규칙이 적용되는 것인, 방법.
524. 항목 523에 있어서, 상기 아미노산 서열 내의 아미노산 유형의 수에 -1을 더하면, 아미노산 유형의 비변형된 아미노산이 본원에 개시된 표지화 화학을 사용하여 샘플 내에 표지되는 것인, 방법.
525. 항목 523에 있어서, 상기 아미노산 서열 내의 아미노산 유형의 수에 0을 더하면, 모든(비변형 및 변형된 아미노산 둘 다) 아미노산 유형이 본원에 개시된 표지화 화학을 사용하여 샘플 내에 표지되는 것인, 방법.
526. 항목 1 내지 525 중 어느 한 항목에 있어서, 상기 아미노산 유형의 변형된 아미노산이 표지화 반응 동안 또는 전에 샘플 내에서 아미노산 유형의 비변형된 아미노산으로 전환되는 경우 항목 523의 규칙이 적용되지 않는 것인, 방법.
527. 항목 495에 있어서, 상기 관심 단백체 또는 하위단백체에 대한 2 개 이상의 아미노산 유형 각각의 아미노산의 가중 평균 수가 공개적으로 이용가능한 단백체 전체 PTM 통계를 사용하여 계산되는 것인, 방법.
528. 항목 495에 있어서, 상기 비변형 또는 변형된 아미노산 수가 공개적으로 이용가능한 단백체 전체 번역 후 변형 통계를 사용함으로써 관심 단백체 또는 하위단백체에 대해 계산되는 것인, 방법.
529. 항목 528에 있어서, 상기 단백체 전체 번역 후 변형 통계가 원핵생물, 진핵생물, 및 인간을 포함한 포유동물에 특이적인 번역 후 변형 빈도를 제공하기 위해 필터링되는 것인, 방법.
530. 항목 529에 있어서, 상기 바이러스가 번역 후 변형을 수행하는 효소를 코딩하는 유전자를 함유하지 않기 때문에 번역 후 변형을 겪지 않은 것으로 처리되는 것인, 방법.
531. 항목 530에 있어서, 상기 바이러스가 그들의 숙주 세포의 단백질 번역 기구를 장악하기 때문에 그들의 숙주 내의 단백질이 겪은 번역 후 변형 또는 번역 후 변형 하위세트를 겪지 않은 것으로 처리되는 것인, 방법.
532. 항목 528 내지 531에 있어서, 상기 아미노산 유형의 비변형된 아미노산 수를 예측하거나, 아미노산 유형의 변형된 아미노산 수를 예측하기 위해, 해당 아미노산 유형의 변형 빈도가 해당 아미노산 유형에 영향을 미치는 모든 번역 후 변형을 합하고 Swiss Prot 데이터베이스에서 해당 아미노산 유형의 총 아미노산 수로 나눔으로써 결정되고, 여기서 아미노산 유형에 영향을 미치는 번역 후 변형이 항목 523에 제공되는 것인, 방법.
533. 항목 532에 있어서, 상기 유기체의 부류에 의해 상이할 수 있는 각 아미노산 유형에 대한 변형 인자가 제공되는 것인, 방법.
534. 제1항 내지 제533항 중 어느 한 항에 있어서, 상기 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도가 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도, 및/또는 아미노산 수를 나타내는 정보로부터 식별되는 것인, 방법.
535. 항목 534에 있어서, 상기 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 정체성 및/또는 단백질 농도에 대한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도, 또는 아미노산 수에 관한 정보가 데이터베이스로부터 수득되는 것인, 방법.
536. 항목 535에 있어서, 상기 데이터베이스로부터 수득된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 정체성 및/또는 단백질 농도에 대한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도, 또는 아미노산 수에 관한 정보가 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 단백질 서열 또는 서열들을 포함하는 것인, 방법.
537. 항목 534, 535 또는 536에 있어서, 상기 데이터베이스로부터 수득된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 정체성 및/또는 단백질 농도에 대한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도, 또는 아미노산 수에 관한 정보가 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 단백질 서열 또는 서열들의 번역 후 변형에 대한 정보를 포함하는 것인, 방법.
538. 항목 534 내지 537 중 어느 한 항목에 있어서, 상기 데이터베이스로부터 수득된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 정체성 및/또는 단백질 농도에 대한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도, 또는 아미노산 수에 관한 정보가 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 식별자를 포함하는 것인, 방법.
539. 항목 534 내지 538 중 어느 한 항목에 있어서, 상기 데이터베이스로부터 수득된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 정체성 및/또는 단백질 농도에 대한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도, 또는 아미노산 수에 대한 정보가 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 명칭을 포함하는 것인, 방법.
540. 항목 534 내지 539 중 어느 한 항목에 있어서, 상기 데이터베이스로부터 수득된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 정체성 및/또는 단백질 농도에 대한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도, 또는 아미노산 수에 관한 정보가 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 계통을 포함하는 것인, 방법.
541. 항목 534 내지 540 중 어느 한 항목에 있어서, 상기 데이터베이스로부터 수득된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 정체성 및/또는 단백질 농도에 대한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도, 또는 아미노산 수에 관한 정보가 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 분류군을 포함하는 것인, 방법.
542. 항목 534 내지 541 중 어느 한 항목에 있어서, 상기 데이터베이스로부터 수득된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 정체성 및/또는 단백질 농도에 대한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도, 또는 아미노산 수에 관한 정보가 관심 샘플 유형 내에서 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 알려진 단백질 농도 범위를 포함하는 것인, 방법.
543. 항목 534 내지 542 중 어느 한 항목에 있어서, 상기 데이터베이스로부터 수득된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 정체성 및/또는 단백질 농도에 대한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도, 또는 아미노산 수에 관한 정보가 관심 조직 유형 내에서 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 알려진 단백질 농도 범위를 포함하는 것인, 방법.
544. 항목 534 내지 543 중 어느 한 항목에 있어서, 상기 데이터베이스로부터 수득된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 정체성 및/또는 단백질 농도에 대한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도, 또는 아미노산 수에 관한 정보가 관심 샘플 유형 내에서 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 알려진 단백질 발현 데이터를 포함하는 것인, 방법.
545. 항목 534 내지 544 중 어느 한 항목에 있어서, 상기 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 정체성 및/또는 단백질 농도에 대한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도, 또는 아미노산 수에 관한 정보가 참조인, 방법.
545a. 항목 545에 있어서, 상기 각 관심 단백체 또는 하위단백체의 정체성 및/또는 단백질 농도에 대한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도, 또는 아미노산 수에 관한 정보가 단일 참조로서 제공되는 것인, 방법.
546. 항목 1a 내지 1h에 있어서, 상기 하나 이상의 단백질 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도, 및/또는 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 아미노산 수가 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열로부터 결정되는 것인, 방법.
547. 항목 546에 있어서, 상기 하나 이상의 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체, 또는 단백체의 혼합물의 아미노산 서열이 단백질 서열분석을 사용하여 결정되는 것인, 방법.
548. 항목 1 내지 547 중 어느 한 항목에 있어서, 상기 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수가 데이터베이스로부터 수득되는 것인, 방법.
549. 항목 1 내지 548 중 어느 한 항목에 있어서, 상기 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수가 참조인,방법.
550. 항목 1 내지 549 중 어느 한 항목에 있어서, 상기 각 참조가 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도를 단백질 농도의 공통 파라미터에 따라 파라미터 방정식 세트 또는 벡터 값 함수로서 제공하거나, 각 참조가 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 동일한 2 개 이상의 아미노산 유형의 아미노산 수를 제공하는 것인, 방법.
551. 항목 1 내지 550 중 어느 한 항목에 있어서, 상기 하나 이상의 단백질 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 또는 아미노산 농도가 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 단백질 농도의 함수인, 방법.
552. 항목 551에 있어서, 상기 하나 이상의 단백질 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 또는 아미노산 농도가 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 총 몰 단백질 농도의 함수인, 방법.
553. 항목 551에 있어서, 상기 하나 이상의 단백질 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 또는 아미노산 농도가 펩티드, 올리고펩티드, 폴리펩티드, 단백질, 또는 단백질 복합체 농도의 함수, 또는 관심 하위단백체 또는 단백체 내에서 총 단백질 농도의 함수인, 방법.
554. 항목 551에 있어서, 상기 하나 이상의 단백질 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 또는 아미노산 농도가 총 몰 펩티드, 올리고펩티드, 폴리펩티드, 단백질, 또는 단백질 복합체 농도의 함수, 또는 관심 하위단백체 또는 단백체 내에서 총 몰 단백질 농도의 함수인, 방법.
555. 항목 551에 있어서, 상기 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도가 단백질 농도의 공통 파라미터에 따라 벡터 값 함수로서 제공되는 것인, 방법.
556. 항목 551에 있어서, 상기 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도가 단백질 농도의 공통 파라미터에 따라 벡터 함수로서 제공되는 것인, 방법.
557. 항목 551에 있어서, 상기 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도가 총 몰 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 또는 관심 하위단백체 또는 단백체 내에서 총 몰 단백질 농도의 공통 파라미터에 따라 벡터 함수로서 제공되는 것인, 방법.
558. 항목 555 내지 557에 있어서, 상기 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 동일한 2 개 이상의 아미노산 유형의 아미노산 농도를 제공하는 벡터의 방향이 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 내에서 각 아미노산 유형의 아미노산의 수 또는 가중 평균 수인, 방법.
559. 항목 558에 있어서, 상기 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 동일한 2 개 이상의 아미노산 유형의 아미노산 농도를 제공하는 벡터의 방향이 각 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체 내에서 각 아미노산 유형의 아미노산의 수 또는 가중 평균 수인, 방법.
560. 항목 555 내지 559에 있어서, 상기 벡터가 모든 아미노산 유형의 표지 값이 샘플에서 배경 보정된 경우 원점에서, 또는 각각/임의의 아미노산 유형의 표지 값이 샘플에서 배경 보정되지 않은 경우 샘플에서 표지되고 측정된 n 개의 아미노산 유형 각각에 대한 배경 값을 제공하는 점(n-투플)에서 시작하는 것인, 방법.
561. 항목 555 내지 559에 있어서, 상기 벡터가 알려지거나 계산된 단백질 발현 데이터로부터 이용가능한 단백질 농도의 하한 및 상한에 의해 한계가 있는 것인, 방법.
562. 항목 557에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 벡터 함수가 벡터 함수 1이고 하기 형태로 간주하는 것인, 방법:
Figure pct00054
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대해 단백질 농도 t의 함수로서 제공되는 아미노산의 농도이고, <0,0,…0>은 원점이고, a 1 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 수이고, a 2 는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 2의 수이고, a n 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 수이고, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체의 총 몰 단백질 농도이다.
563. 항목 557에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 벡터 함수를 하기 형태로 간주하는 것인, 방법:
Figure pct00055
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대해 단백질 농도 t의 함수로서 제공되는 아미노산 농도이고, (0,0,…0)은 원점이고, a 1 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 수이고, a 2 는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 2의 수이고, a n 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 수이고, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체의 총 몰 단백질 농도이다.
564. 항목 557에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 벡터 함수를 하기 형태로 간주하는 것인, 방법:
Figure pct00056
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대해 단백질 농도 t의 함수로서 제공되는 아미노산 농도이고, a 1 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 수이고, a 2 는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 2의 수이고, a n 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 수이고, c 1 은 단백질 농도 범위의 하한이고, c 2 는 단백질 농도 범위의 상한이고, tc 1 c 2 사이의 t의 모든 값에 대해 정의된 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체의 총 몰 단백질 농도이다.
565. 항목 557에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 벡터 함수가 벡터 함수 2이고 하기 형태로 간주하는 것인, 방법:
Figure pct00057
여기서 p i 는 관심 단백체 또는 하위단백체 i에 대해 단백질 농도 t의 함수로서 제공되는 아미노산 농도이고, <0,0,…0>은 원점이고, w 1 은 관심 단백체 또는 하위단백체에서 아미노산 유형 1의 가중 평균 수이고, w 2 는 관심 단백체 또는 하위단백체에서 아미노산 유형 2의 가중 평균 수이고, w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 수이고, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된 관심 단백체 또는 하위단백체의 총 몰 또는 질량 단백질 농도이다.
566. 항목 557에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 벡터 함수를 하기 형태로 간주하는 것인, 방법:
Figure pct00058
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대해 단백질 농도 t의 함수로서 제공되는 알려진 표지 값이고, b 1 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 1에 대한 배경 값이고, b 2 는 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 2에 대한 배경 값이고, b n 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 n에 대한 배경 값이고, a 1 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 수이고, a 2 는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 2의 수이고, a n 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 수이고, f 1 은 아미노산 유형 1에 대한 교정 함수 또는 교정 계수이고, f 2 는 아미노산 유형 2에 대한 교정 함수 또는 교정 계수이고, f n 은 아미노산 유형 n에 대한 교정 함수 또는 교정 계수이고, c 1 은 단백질 농도 범위의 하한이고, c 2 는 단백질 농도 범위의 상한이고, tc 1 c 2 사이의 t의 모든 값에 대해 정의된 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체의 총 몰 단백질 농도이다.
567. 항목 557에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 벡터 함수가 벡터 함수 3이고 하기 형태로 간주하는 것인, 방법:
Figure pct00059
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대해 단백질 농도 t의 함수로서 제공되는 알려진 표지 값이고, b 1 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 1에 대한 배경 값이고, b 2 는 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 2에 대한 배경 값이고, b n 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 n에 대한 배경 값이고, a 1 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 수이고, a 2 는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 2의 수이고, a n 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 수이고, f 1 은 아미노산 유형 1에 대한 교정 함수 또는 교정 계수이고, f 2 는 아미노산 유형 2에 대한 교정 함수 또는 교정 계수이고, f n 은 아미노산 유형 n에 대한 교정 함수 또는 교정 계수이고, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체의 총 몰 단백질 농도이다.
568. 항목 557에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 벡터 함수를 하기 형태로 간주하는 것인, 방법:
Figure pct00060
여기서 p i 는 관심 단백체 또는 하위단백체 i에 대해 단백질 농도 t의 함수로서 제공되는 알려진 표지 값이고, b 1 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 1에 대한 배경 값이고, b 2 는 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 2에 대한 배경 값이고, b n 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 n에 대한 배경 값이고, w 1 은 관심 단백체 또는 하위단백체에서 아미노산 유형 1의 가중 평균 수이고, w 2 는 관심 단백체 또는 하위단백체에서 아미노산 유형 2의 가중 평균 수이고, w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 가중 평균 수이고, f 1 은 아미노산 유형 1에 대한 교정 함수 또는 교정 계수이고, f 2 는 아미노산 유형 2에 대한 교정 함수 또는 교정 계수이고, f n 은 아미노산 유형 n에 대한 교정 함수 또는 교정 계수이고, c 1 은 단백질 농도 범위의 하한이고, c 2 는 단백질 농도 범위의 상한이고, tc 1 c 2 사이의 t의 모든 값에 대해 정의된 관심 단백체 또는 하위단백체의 총 몰 단백질 농도이다.
569. 항목 557에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 벡터 함수가 벡터 함수 4이고 하기 형태로 간주하는 것인, 방법:
Figure pct00061
여기서 p i 는 관심 단백체 또는 하위단백체 i에 대해 단백질 농도 t의 함수로서 제공되는 알려진 표지 값이고, b 1 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 1에 대한 배경 값이고, b 2 는 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 2에 대한 배경 값이고, b n 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 n에 대한 배경 값이고, w 1 은 관심 단백체 또는 하위단백체에서 아미노산 유형 1의 가중 평균 수이고, w 2 는 관심 단백체 또는 하위단백체에서 아미노산 유형 2의 가중 평균 수이고, w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 가중 평균 수이고, f 1 은 아미노산 유형 1에 대한 교정 함수 또는 교정 계수이고, f 2 는 아미노산 유형 2에 대한 교정 함수 또는 교정 계수이고, f n 은 아미노산 유형 n에 대한 교정 함수 또는 교정 계수이고, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된 관심 단백체 또는 하위단백체의 총 몰 단백질 농도이다.
570. 항목 557에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 벡터 함수를 하기 형태로 간주하는 것인, 방법:
Figure pct00062
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대한 아미노산 수이고, a 1 은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 수이고, a 2 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 수이고, a n 은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이고, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된 관심 단백체 또는 하위단백체의 총 몰 단백질 농도이다.
571. 항목 557에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 벡터 함수를 하기 형태로 간주하는 것인, 방법:
Figure pct00063
여기서 p i 는 관심 단백체 또는 하위단백체 i에 대한 아미노산의 가중 평균 수이고, w 1 은 관심 단백체 또는 하위단백체에서 아미노산 유형 1의 가중 평균 수이고, w 2 는 관심 단백체 또는 하위단백체에서 아미노산 유형 2의 가중 평균 수이고, w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 가중 평균 수이고, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된 관심 단백체 또는 하위단백체의 총 몰 단백질 농도이다.
572. 항목 546에 있어서, 상기 하나 이상의 단백질 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 또는 아미노산 농도가 파라미터 방정식 세트를 사용하여 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열 또는 서열들로부터 계산되는 것인, 방법.
573. 항목 572에 있어서, 상기 파라미터 방정식 세트가 알려지거나 계산된 단백질 발현 데이터로부터 이용가능한 단백질 농도의 하한 및 상한에 의해 한계에 있는 것인, 방법.
574. 항목 572 또는 573 중 어느 한 항목에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 파라미터 방정식 세트가 파라미터 방정식 1 세트이고 하기 형태로 간주하는 것인, 방법:
Figure pct00064
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대해 단백질 농도 t의 함수로서 제공되는 아미노산의 농도이고, <0,0,…0>은 원점이고, a 1 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 수이고, a 2 는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 2의 수이고, a n 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 수이고, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체의 총 몰 단백질 농도이고, 샘플에서 표지되고 측정된 n 개의 아미노산 유형에 대한 세트에 n 개의 파라미터 방정식이 있다.
575. 항목 572 또는 573 중 어느 한 항목에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 파라미터 방정식 세트를 하기 형태로 간주하는 것인, 방법:
Figure pct00065
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대해 단백질 농도 t의 함수로서 제공되는 아미노산 농도이고, a 1 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 수이고, a 2 는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 2의 수이고, a n 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 수이고, c 1 은 단백질 농도 범위의 하한이고, c 2 는 단백질 농도 범위의 상한이고, tc 1 c 2 사이의 t의 모든 값에 대해 정의된 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체의 총 몰 단백질 농도이고, 샘플에서 표지되고 측정된 n 개의 아미노산 유형에 대한 세트에 n 개의 파라미터 방정식이 있다.
576. 항목 572 또는 573 중 어느 한 항목에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 파라미터 방정식 세트가 파라미터 방정식 2 세트이고 하기 형태로 간주하는 것인, 방법:
Figure pct00066
여기서 p i 는 관심 단백체 또는 하위단백체 i에 대해 단백질 농도 t의 함수로서 제공되는 아미노산 농도이고, w 1 은 관심 단백체 또는 하위단백체에서 아미노산 유형 1의 가중 평균 수이고, w 2 는 관심 단백체 또는 하위단백체에서 아미노산 유형 2의 가중 평균 수이고, w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 수이고, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된 관심 단백체 또는 하위단백체의 총 몰 단백질 농도이고, 샘플에서 표지되고 측정된 n 개의 아미노산 유형에 대한 세트에 n 개의 파라미터 방정식이 있다.
577. 항목 572 또는 573 중 어느 한 항목에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 파라미터 방정식 세트를 하기 형태로 간주하는 것인, 방법:
Figure pct00067
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대해 단백질 농도 t의 함수로서 제공되는 알려진 표지 값이고, a 1 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 수이고, a 2 는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 2의 수이고, a n 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 수이고, b 1 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 1에 대한 배경 값이고, b 2 는 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 2에 대한 배경 값이고, b n 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 n에 대한 배경 값이고, f 1 은 아미노산 유형 1에 대한 교정 함수 또는 교정 계수이고, f 2 는 아미노산 유형 2에 대한 교정 함수 또는 교정 계수이고, f n 은 아미노산 유형 n에 대한 교정 함수 또는 교정 계수이고, c 1 은 단백질 농도 범위의 하한이고, c 2 는 단백질 농도 범위의 상한이고, tc 1 c 2 사이의 t의 모든 값에 대해 정의된 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체의 총 몰 단백질 농도이고, 샘플에서 표지되고 측정된 n 개의 아미노산 유형에 대한 세트에 n 개의 파라미터 방정식이 있다.
578. 항목 572 또는 573 중 어느 한 항목에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 파라미터 방정식 세트가 파라미터 방정식 3 세트이고 하기 형태로 간주하는 것인, 방법:
Figure pct00068
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대해 단백질 농도 t의 함수로서 제공되는 알려진 표지 값이고, a 1 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 수이고, a 2 는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 2의 수이고, a n 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 수이고, b 1 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 1에 대한 배경 값이고, b 2 는 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 2에 대한 배경 값이고, b n 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 n에 대한 배경 값이고, f 1 은 아미노산 유형 1에 대한 교정 함수 또는 교정 계수이고, f 2 는 아미노산 유형 2에 대한 교정 함수 또는 교정 계수이고, f n 은 아미노산 유형 n에 대한 교정 함수 또는 교정 계수이고, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체의 총 몰 단백질 농도이고, 샘플에서 표지되고 측정된 n 개의 아미노산 유형에 대한 세트에 n 개의 파라미터 방정식이 있다.
579. 항목 572 또는 573 중 어느 한 항목에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 파라미터 방정식 세트를 하기 형태로 간주하는 것인, 방법:
Figure pct00069
여기서 p i 는 관심 단백체 또는 하위단백체 i에 대해 단백질 농도 t의 함수로서 제공되는 알려진 표지 값이고, w 1 은 관심 단백체 또는 하위단백체에서 아미노산 유형 1의 가중 평균 수이고, w 2 는 관심 단백체 또는 하위단백체에서 아미노산 유형 2의 가중 평균 수이고, w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 가중 평균 수이고, b 1 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 1에 대한 배경 값이고, b 2 는 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 2에 대한 배경 값이고, b n 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 n에 대한 배경 값이고, f 1 은 아미노산 유형 1에 대한 교정 함수 또는 교정 계수이고, f 2 는 아미노산 유형 2에 대한 교정 함수 또는 교정 계수이고, f n 은 아미노산 유형 n에 대한 교정 함수 또는 교정 계수이고, c 1 은 단백질 농도 범위의 하한이고, c 2 는 단백질 농도 범위의 상한이고, tc 1 c 2 사이의 t의 모든 값에 대해 정의된 관심 단백체 또는 하위단백체의 총 몰 단백질 농도이고, 샘플에서 표지되고 측정된 n 개의 아미노산 유형에 대한 세트에 n 개의 파라미터 방정식이 있다.
580. 항목 550 중 어느 한 항목에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 벡터 함수를 하기 형태로 간주하는 것인, 방법:
Figure pct00070
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대한 아미노산 수이고, a 1 은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 수이고, a 2 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 수이고, a n 은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이고, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된 관심 단백체 또는 하위단백체의 총 몰 단백질 농도이고, 샘플에서 표지되고 측정된 n 개의 아미노산 유형에 대한 세트에 n 개의 파라미터 방정식이 있다.
581. 항목 550 중 어느 한 항목에 있어서, 상기 단백질 농도의 공통 파라미터에 따른 벡터 함수를 하기 형태로 간주하는 것인, 방법:
Figure pct00071
여기서 p i 는 관심 단백체 또는 하위단백체 i에 대한 아미노산의 가중 평균 수이고, w 1 은 관심 단백체 또는 하위단백체에서 아미노산 유형 1의 가중 평균 수이고, w 2 는 관심 단백체 또는 하위단백체에서 아미노산 유형 2의 가중 평균 수이고, w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 가중 평균 수이고, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된 관심 단백체 또는 하위단백체의 총 몰 단백질 농도이고, 샘플에서 표지되고 측정된 n 개의 아미노산 유형에 대한 세트에 n 개의 파라미터 방정식이 있다.
582. 항목 572에 있어서, 상기 하나 이상의 단백질, 펩티드, 올리고펩티드, 폴리펩티드 또는 단백질 복합체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 또는 아미노산 농도가 파라미터 방정식 1 세트 또는 3, 또는 벡터 함수 1 또는 3을 사용하여 하나 이상의 단백질, 펩티드, 올리고펩티드, 폴리펩티드 또는 단백질 복합체의 아미노산 서열로부터 계산되는 것인, 방법.
583. 항목 572에 있어서, 상기 하나 이상의 관심 단백체, 또는 하위단백체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 또는 아미노산 농도가 파라미터 방정식 2 또는 4 세트, 또는 벡터 함수 2 또는 4를 사용하여 하나 이상의 관심 단백체 또는 하위단백체의 아미노산 서열로부터 계산되는 것인, 방법.
584. 항목 549에 있어서, 상기 참조가 데이터베이스로부터 수득되는 것인, 방법.
585. 항목 1 내지 584 중 어느 한 항목에 있어서, 상기 단계 e)가 샘플에서 각 표지된 아미노산 유형의 측정된 표지, 아미노산 농도 또는 아미노산 수가 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수에 대한 오차 한계와 동일하거나, 이보다 작거나 동일한 경우 샘플에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 것을 포함하는 것인, 방법.
586. 항목 585에 있어서, 상기 오차 한계가 사용자 지정 허용오차 값을 포함하거나, 샘플의 표지된 아미노산 유형의 측정된 표지, 아미노산 농도 또는 수와 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 동일한 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수 사이의 최소 거리의 차수 통계이며 여기서 k번째 차수 통계는 k번째 최소 값인, 방법.
587. 항목 585에 있어서, 상기 오차 한계가 샘플의 표지된 아미노산 유형의 측정된 표지, 아미노산 농도 또는 수와 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수 사이의 거리 임계값인, 방법.
588. 항목 587에 있어서, 상기 샘플의 표지된 아미노산 유형의 측정된 표지, 아미노산 농도 또는 수와 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수 사이의 거리가 유클리드(Euclidian) 거리 측정인, 방법.
589. 항목 585에 있어서, 상기 오차 한계가 샘플의 표지된 아미노산 유형의 측정된 표지, 아미노산 농도 또는 수와 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체에서 동일한 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수 사이의 최소 거리인, 방법.
590. 항목 588에 있어서, 상기 유클리드 거리 측정이 방정식 17을 사용하여 계산되는 것인, 방법:
Figure pct00072
여기서 s i 는 아미노산 유형 i = 1:n에 대한 샘플에 대해 측정된 값(표지 값, 아미노산 농도, 또는 아미노산 수)이고, Q i 는 아미노산 유형 i = 1:n에 대한 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대해 제공되는 상응하는 값이다.
591. 항목 585에 있어서, 상기 오차 한계가 샘플에 대해 측정된 2 개 이상의 아미노산 유형의 표지 값, 아미노산 농도, 또는 아미노산 수를 곱한 사용자 특이적 허용오차 값을 포함하는 것인, 방법.
592. 항목 585에 있어서, 상기 오차 한계가 샘플 제곱에 대해 측정된 2 개 이상의 아미노산 유형의 표지 값, 아미노산 농도, 또는 아미노산 수의 합의 제곱근을 곱한 사용자 특이적 허용오차 값을 포함하는 것인, 방법.
593. 항목 585에 있어서, 상기 오차 한계가 거리 계산을 반영하여 샘플 값 제곱의 제곱근을 곱한 사용자 입력 허용오차 값으로부터 제공되는 것인, 방법. 이것은 방정식 8에 의해 제공된다:
Figure pct00073
여기서 ε은 오차 한계이고,
Figure pct00074
는 사용자 입력 허용오차 값이고, S 1 은 아미노산 유형 1에 대한 샘플에 대해 측정된 값(표지 값, 아미노산 농도, 또는 아미노산 수)이고, S 2 는 아미노산 유형 1에 대한 샘플에 대해 측정된 값(표지 값, 아미노산 농도, 또는 아미노산 수)이고, S n 은 아미노산 유형(n)에 대한 샘플에 대해 측정된 값(표지 값, 아미노산 농도, 또는 아미노산 수)이다.
594. 항목 593에 있어서, 상기 사용자 지정 허용오차 값,
Figure pct00075
이 0.001, 0.002, 0.003, 0.004, 0.005, 0.006, 0.007, 0.008, 0.009, 0.01, 0.02, 0.03, 0.04, 0.05, 0.06, 0.07, 0.08, 0.09, 또는 0.10인, 방법.
595. 항목 585에 있어서, 상기 샘플이 k 개의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 것으로 의심되는 경우, 오차 한계가 모든 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대해 계산된 거리의 k번째 차수 통계인, 방법.
596. 항목 585에 있어서, 샘플이 k 개의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 것으로 의심되는 경우, 거리가 분류되고, 오차 한계가 k 최소 거리인, 방법.
597. 항목 1 내지 596 중 어느 한 항목에 있어서, 상기 단계 e)가 샘플에서 각 표지된 아미노산 유형의 측정된 표지를 하나 이상의 단백질 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값과 비교하는 것을 포함하며, 여기서 하나 이상의 단백질 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 2 개 이상의 아미노산 유형의 알려진 표지 값이 벡터 함수 또는 파라미터 방정식 세트를 사용하여 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열 또는 서열들 및/또는 번역 후 변형에 대한 실험적 정보로부터 계산되는 것인, 방법.
598. 항목 1 내지 597 중 어느 한 항목에 있어서, 상기 단계 e)가 샘플에서 각 표지된 아미노산 유형의 아미노산 농도를 하나 이상의 단백질 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 동일한 2 개 이상의 아미노산 유형의 아미노산 농도와 비교하는 것을 포함하며, 여기서 하나 이상의 단백질 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 2 개 이상의 아미노산 유형의 아미노산 농도가 벡터 함수 또는 파라미터 방정식 세트를 사용하여 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열 또는 서열들 및/또는 번역 후 변형에 대한 실험적 정보로부터 계산되는 것인, 방법.
599. 항목 1 내지 598 중 어느 한 항목에 있어서, 상기 단계 e)가 샘플에서 각 표지된 아미노산 유형의 아미노산 수를 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 동일한 2 개 이상의 아미노산 유형의 아미노산 수와 비교하는 것을 포함하며, 여기서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 2 개 이상의 아미노산 유형의 아미노산 수가 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열 또는 아미노산 서열들 및/또는 번역 후 변형에 대한 실험적 정보로부터 계산되는 것인, 방법.
600. 항목 1 내지 599 중 어느 한 항목에 있어서, 상기 단계 e)가 샘플에서 각 표지된 아미노산 유형의 측정된 표지, 아미노산 농도 및/또는 아미노산 수를 하나 이상의 단백질 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도, 또는 n-차원 공간을 사용하여 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 아미노산 수와 비교하는 것을 포함하는 것인, 방법.
601. 제1항 내지 제600항 중 어느 한 항에 있어서, 상기 단계 e)가 샘플에서 각 표지된 아미노산 유형의 측정된 표지, 아미노산 농도 및/또는 아미노산 수를 단백질 농도의 함수로서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도, 또는 n-차원 공간을 사용하여 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 아미노산 수를 비교하는 것을 포함하며, 여기서 단백질 농도의 함수로서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도가 임의적으로 생물학적 샘플에서 알려진 단백질 발현 수준에 의해 한계가 있 수 있는 n-차원 공간에서 선 또는 곡선을 제공하고, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 아미노산 수가 n-차원 공간에서 점을 제공하는 것인, 방법
602. 항목 601에 있어서, 상기 2 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 2-차원 공간인, 방법.
603. 항목 601에 있어서, 상기 3 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 3-차원 공간인, 방법.
604. 항목 601에 있어서, 상기 4 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 4-차원 공간인, 방법.
605. 항목 601에 있어서, 상기 5 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 5-차원 공간인, 방법.
606. 항목 601에 있어서, 상기 6 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 6-차원 공간인, 방법.
607. 항목 601에 있어서, 상기 7 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 7-차원 공간인, 방법.
608. 항목 601에 있어서, 상기 8 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 8-차원 공간인, 방법.
609. 항목 601에 있어서, 상기 9 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 9-차원 공간인, 방법.
610. 항목 601에 있어서, 상기 10 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 10-차원 공간인, 방법.
611. 항목 601에 있어서, 상기 11 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 11-차원 공간인, 방법.
612. 항목 601에 있어서, 상기 12 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 12-차원 공간인, 방법.
613. 항목 601에 있어서, 상기 13 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 13-차원 공간인, 방법.
614. 항목 601에 있어서, 상기 14 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 14-차원 공간인, 방법.
615. 항목 601에 있어서, 상기 15 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 15-차원 공간인, 방법.
616. 항목 601에 있어서, 상기 16 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 16-차원 공간인, 방법.
617. 항목 601에 있어서, 상기 17 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 17-차원 공간인, 방법.
618. 항목 601에 있어서, 상기 18 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 18-차원 공간인, 방법.
619. 항목 601에 있어서, 상기 19 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 19-차원 공간인, 방법.
620. 항목 601에 있어서, 상기 20 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 20-차원 공간인, 방법.
621. 항목 601에 있어서, 상기 21 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 21-차원 공간인, 방법.
622. 항목 601에 있어서, 상기 22 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 22-차원 공간인, 방법.
623. 항목 601에 있어서, 상기 23 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 23-차원 공간인, 방법.
624. 항목 601에 있어서, 상기 24 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 24-차원 공간인, 방법.
625. 항목 601에 있어서, 상기 25 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 25-차원 공간인, 방법.
626. 항목 601에 있어서, 상기 26 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 26-차원 공간인, 방법.
627. 항목 601에 있어서, 상기 27 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 27-차원 공간인, 방법.
628. 항목 601에 있어서, 상기 28 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 28-차원 공간인, 방법.
629. 항목 601에 있어서, 상기 29 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 29-차원 공간인, 방법.
630. 항목 601에 있어서, 상기 30 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 30-차원 공간인, 방법.
631. 항목 601에 있어서, 상기 31 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 31-차원 공간인, 방법.
632. 항목 601에 있어서, 상기 32 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 32-차원 공간인, 방법.
633. 항목 601에 있어서, 상기 33 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 33-차원 공간인, 방법.
634. 항목 601에 있어서, 상기 34 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 34-차원 공간인, 방법.
635. 항목 601에 있어서, 상기 35 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 35-차원 공간인, 방법.
636. 항목 601에 있어서, 상기 36 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 36-차원 공간인, 방법.
637. 항목 601에 있어서, 상기 37 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 37-차원 공간인, 방법.
638. 항목 601에 있어서, 상기 38 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 38-차원 공간인, 방법.
639. 항목 601에 있어서, 상기 39 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 39-차원 공간인, 방법.
640. 항목 601에 있어서, 상기 40 개의 아미노산이 샘플에서 표지되고, n-차원 공간이 40-차원 공간인, 방법.
641. 항목 585에 있어서, 상기 샘플에서 측정된 2 개 이상의 아미노산 유형의 표지 값 또는 아미노산 농도가 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조 함수에 의해 제공된 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도와 동일하거나, 이에 대한 오차 한계보다 작거나 동일한 단백질 농도의 단일 값이 존재하는 경우 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체가 샘플에서 식별되는 것인, 방법
642. 항목 585에 있어서, 상기 샘플에서 식별된 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 단백질 농도가 샘플에서 측정된 2 개 이상의 아미노산 유형의 표지 값 또는 아미노산 농도가 샘플에서 식별된 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조 함수에 의해 제공된 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도와 동일하거나, 이에 대한 오차 한계보다 작거나 동일한 단백질 농도인, 방법.
643. 항목 642에 있어서, 상기 샘플에서 식별된 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 단백질 양이 샘플의 부피를 곱한 샘플에서 식별된 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 단백질 농도인, 방법.
644. 항목 1 내지 643 중 어느 한 항목에 있어서, 상기 샘플에 대해 측정된 2 개 이상의 아미노산 유형의 아미노산 농도가 참조 벡터 함수 또는 파라미터 방정식 세트에 의해 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대해 제공된 동일한 2 개 이상의 상응하는 아미노산 유형의 아미노산 농도와 동일한 단백질 농도의 단일 값이 존재하는 경우 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체가 샘플에서 식별되는 것인, 방법.
645. 항목 228에 있어서, 상기 단백질 농도, t에 대한 단일 해(solution)가 존재하는 경우 샘플 점이 참조선 상에 있고, t에 대한 이 해가 샘플에서 식별된 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 단백질 농도인, 방법.
646. 항목 585에 있어서, 상기 샘플에서 측정된 2 개 이상의 아미노산 유형의 표지 값 또는 아미노산 농도가 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조 함수에 의해 제공된 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도에 대한 오차 한계보다 작거나 동일한 단백질 농도의 단일 값으로 존재하는 경우 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체가 샘플에서 식별되는 것인, 방법.
647. 항목 234에 있어서, 상기 샘플에서 측정된 2 개 이상의 아미노산 유형의 표지 값 또는 아미노산 농도와 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조 함수에 의해 제공되는 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도 사이의 거리가 계산되는 것인, 방법.
648. 항목 647에 있어서, 상기 샘플에서 측정된 2 개 이상의 아미노산 유형의 표지 값 또는 아미노산 농도와 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조 함수에 의해 제공되는 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도 사이의 최소 거리가 샘플 점과 참조선 사이의 거리가 수직인 참조선 상의 점을 구함으로써 계산되는 것인, 방법.
649. 항목 648에 있어서, 상기 샘플 점과 참조선 사이의 거리가 수직인 참조선 상의 점이 샘플 점과 참조선 사이에 벡터에 대한 일반적 벡터 방정식을 제공하고, 이 벡터의 내적을 참조선의 방향 벡터로 취하고, 내적을 0과 같게 설정하고, 샘플 점으로부터의 거리가 수직인 점을 산출하는 참조선의 단백질 농도인 단백질 농도, t를 풀어 구하는 것인, 방법.
650. 항목 649에 있어서, 상기 참조선 상의 이 단백질 농도에서 각 아미노산 유형에 대한 아미노산 농도 또는 표지 값이 계산되고, 이 점과 샘플 점 사이의 거리가 계산되고 오차 한계와 비교되는 것인, 방법.
651. 항목 650에 있어서, 상기 거리가 오차 한계보다 작거나 동일한 경우, 거리가 수직인 단백질 농도에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체가 샘플에 함유되는 것인, 방법.
652. 항목 647에 있어서, 상기 하나 초과의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체가 샘플에서 식별되면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 혼합물이 샘플에서 식별되고, 혼합물 내의 각 구성요소의 상대 조성이 샘플에 대해 측정된 값과 혼합물의 각 식별된 구성요소에 대해 제공된 값 사이의 거리와 반비례 관계가 있는 것인, 방법.
653. 항목 652에 있어서, 상기 혼합물 내의 각 구성요소의 상대 조성이 샘플과 각 구성요소 사이의 거리를 샘플과 임의의 구성요소 사이의 최대 거리로 역 정규화함으로써 결정되는 것인, 방법.
654. 항목 653에 있어서, 상기 각 구성요소의 역 정규화된 거리를 모든 구성요소의 역 정규화된 거리의 합으로 나누어 혼합물 내의 각 구성요소의 상대 조성을 제공하는 것인, 방법.
655. 항목 652에 있어서, 상기 혼합물 내의 각 구성요소의 상대 조성에 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체가 식별된 단백질 농도를 곱하여, 혼합물 내의 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도를 제공하는 것인, 방법.
656. 항목 1 내지 655 중 어느 한 항목에 있어서, 상기 관심 하위단백체 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수가 관심 단백체 또는 하위단백체 내에 함유된 모든 아미노산 서열에 기반한 각 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수에 기반한 가중 평균인, 방법.
657. 항목 1 내지 656 중 어느 한 항목에 있어서, 상기 관심 하위단백체 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 아미노산 수가 관심 단백체 또는 하위단백체 내에 함유된 모든 아미노산 서열에서 각 아미노산 유형의 아미노산의 가중 평균 수인, 방법.
658. 제656항에 있어서, 상기 관심 하위단백체 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도가 관심 단백체 또는 하위단백체 내에 함유된 모든 아미노산 서열의 각 아미노산 유형의 아미노산의 가중 평균 수를 사용하여 계산되는 것인, 방법.
659. 항목 1 내지 658 중 어느 한 항목에 있어서, 상기 단계 e)가 각 아미노산 유형의 측정된 표지, 아미노산 농도 또는 수를 중복 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체를 지칭하는 샘플로부터 임의의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 제거하는 것을 포함하는 것인, 방법.
660. 항목 1 내지 659 중 어느 한 항목에 있어서, 상기 단계 e)가 샘플에서 각 표지된 아미노산 유형의 측정된 표지, 아미노산 농도 또는 아미노산 수가 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수와 동일하거나, 이에 대한 오차 한계보다 작거나 동일한 경우, 및 식별된 농도가 관심 샘플 유형에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 알려진 농도 수준에 기반한 단백질 농도 한계(c 1 , c 2 ) 내에 있는 경우 샘플에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 것을 포함하는 것인, 방법.
661. 항목 233 내지 238에 있어서, 상기 샘플 점과 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 상응하는 벡터 상의 임의의 점 사이의 벡터와 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 상응하는 벡터의 방향 사이의 내적을 통해, 샘플 점과 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 상응하는 벡터 상의 임의의 점 사이의 최소 거리를 구하는 경우 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 상응하는 벡터의 방향만이 고려되는 것인, 방법.
662. 항목 564, 566, 568에 있어서, 상기 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 상응하는 벡터가 내적을 계산하는 경우, 한계가 없거나, 원점에서만 한계가 있는 것으로 처리되는 것인, 방법.
663. 항목 1a 내지 1h에 있어서, 상기 3 개의 아미노산 유형이 샘플에서 표지되고 샘플에서 3 개의 표지된 아미노산 유형 각각의 측정된 표지, 아미노산 농도 또는 아미노산 수를 200 개 이하의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 동일한 3 개의 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수와 비교하는 것인, 방법.
664. 항목 1a 내지 1h 중 어느 한 항목에 있어서, 상기 3 개의 아미노산 유형이 샘플에서 표지되고 샘플에서 3 개의 표지된 아미노산 유형 각각의 측정된 표지, 아미노산 농도 또는 아미노산 수를 9000 개 이하의 관심 단백체 또는 하위단백체의 동일한 3 개의 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수와 비교하는 것인, 방법.
665. 항목 1 내지 664 중 어느 한 항목에 있어서, 상기 관심 단백체 또는 하위단백체가 4000 개 미만의 단백질을 갖는 것인, 방법.
666. 항목 1 내지 665 중 어느 한 항목에 있어서, 상기 샘플이 샘플 내의 아미노산의 순서를 통해 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체를 식별하기 위해 서열분석되지 않는 것인, 방법.
667. 항목 1 내지 666 중 어느 한 항목에 있어서, 상기 샘플이 샘플에서 단백체, 하위단백체, 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 존재 및/또는 농도 및/또는 양을 식별하기 위해 개별 단백질 구성요소로 분리될 필요가 없는 것인, 방법.
668. 항목 1 내지 350 중 어느 한 항목에 있어서, 단계 a)가 표지화 전에 샘플로부터 단백질 구성요소를 단리하는 것을 포함하는 것인, 방법.
669. 항목 668에 있어서, 상기 단백질 구성요소가 원심분리, 여과, 전기영동, 또는 크로마토그래피를 사용하여 단리되는 것인, 방법.
670. 항목 669에 있어서, 상기 크로마토그래피 단리가 HPLC를 수반하는 것인, 방법.
671. 항목 1 내지 670 중 어느 한 항목에 있어서, 상기 방법이 벌크으로 수행되는 것인, 방법.
672. 항목 1 내지 671 중 어느 한 항목에 있어서, 상기 단계 d) 및 e)가 분류기에서 수행되는 것인, 방법.
673. 항목 472 또는 475 중 어느 한 항목에 있어서, 상기 교정 곡선을 생성하기 위해 사용되는 임의의/모든 단백질 및/또는 아미노산에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산이 샘플에서 표지되는 것인, 방법.
674. 항목 472 또는 476 중 어느 한 항목에 있어서, 상기 표준으로서 사용되는 임의의 단백질에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산이 샘플에서 표지되는 것인, 방법.
675. 항목 472 또는 476 중 어느 한 항목에 있어서, 상기 표준으로서 사용되는 임의의 아미노산에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산이 샘플에서 표지되는 것인, 방법
676. 항목 472 및 475 중 어느 한 항목에 있어서, 상기 교정 곡선을 생성하기 위해 사용되는 임의의/모든 단백질 및/또는 아미노산에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산의 +/- 5%가 샘플에서 표지되는 것인, 방법.
677. 항목 472 및 476 중 어느 한 항목에 있어서, 상기 표준으로서 사용되는 임의의 단백질에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산의 +/- 5%가 샘플에서 표지되는 것인, 방법.
678. 항목 472 및 476 중 어느 한 항목에 있어서, 상기 표준으로서 사용되는 임의의 아미노산에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산의 +/- 5%가 샘플에서 표지되는 것인, 방법
679. 항목 472 및 475 중 어느 한 항목에 있어서, 상기 교정 곡선을 생성하기 위해 사용되는 임의의/모든 단백질 및/또는 아미노산에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산의 +/- 10%가 샘플에서 표지되는 것인, 방법.
680. 항목 472 및 476 중 어느 한 항목에 있어서, 상기 표준으로서 사용되는 임의의 단백질에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산의 +/- 10%가 샘플에서 표지되는 것인, 방법.
681. 항목 472 및 476 중 어느 한 항목에 있어서, 상기 표준으로서 사용되는 임의의 아미노산에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산의 +/- 10%가 샘플에서 표지되는 것인, 방법.
682. 항목 225 또는 545에 있어서, 상기 샘플에서 2 개 이상의 아미노산 유형의 아미노산 농도가 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 아미노산 농도와 비교되고, 여기서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 아미노산 농도가 실험적 참조인, 방법.
683. 항목 682에 있어서, 상기 교정 곡선 및 임의의 실험적 참조를 생성하기 위해 사용되는 임의의/모든 단백질 및/또는 아미노산에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산이 샘플에서 표지되는 것인, 방법
684. 항목 682에 있어서, 상기 표준 및 임의의 실험적 참조로서 사용되는 임의의 단백질에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산이 샘플에서 표지되는 것인, 방법.
685. 항목 682에 있어서, 상기 표준으로서 사용되는 임의의 아미노산에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산이 샘플 및 임의의 실험적 참조에서 표지되는 것인, 방법.
686. 항목 682에 있어서, 상기 교정 곡선을 생성하기 위해 사용되는 임의의/모든 단백질 및/또는 아미노산에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산의 +/- 5%가 샘플 및 임의의 실험적 참조에서 표지되는 것인, 방법.
687. 항목 682 중 어느 한 항목에 있어서, 상기 표준으로서 사용되는 임의의 단백질에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산의 +/- 5%가 샘플 및 임의의 실험적 참조에서 표지되는 것인, 방법.
688. 항목 682에 있어서, 상기 표준으로서 사용되는 임의의 아미노산에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산의 +/- 5%가 샘플 및 임의의 실험적 참조에서 표지되는 것인, 방법.
689. 항목 682에 있어서, 상기 교정 곡선을 생성하기 위해 사용되는 임의의/모든 단백질 및/또는 아미노산에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산의 +/- 10%가 샘플 및 임의의 실험적 참조에서 표지되는 것인, 방법.
690. 항목 682에 있어서, 상기 표준으로서 사용되는 임의의 단백질에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산의 +/- 10%가 샘플 및 임의의 실험적 참조에서 표지되는 것인, 방법.
691. 항목 682에 있어서, 상기 표준으로서 사용되는 임의의 아미노산에서 표지된 것과 동일한 비율의 아미노산 유형의 아미노산의 +/- 10%가 샘플 및 임의의 실험적 참조에서 표지되는 것인, 방법.
692. 항목 682에 있어서, 상기 동일한 비율의 아미노산 유형의 아미노산이 샘플 및 임의의 실험적 참조에서 표지되는 것인, 방법.
693. 항목 682에 있어서, 상기 동일한 비율의 아미노산 유형의 아미노산의 +/- 5%가 샘플 및 임의의 실험적 참조에서 표지되는 것인, 방법.
694. 항목 682에 있어서, 상기 동일한 비율의 아미노산 유형의 아미노산의 +/- 5%가 샘플 및 임의의 실험적 참조에서 표지되는 것인, 방법.
695. 항목 682에 있어서, 상기 동일한 비율의 아미노산 유형의 아미노산의 +/-5%가 샘플 및 임의의 실험적 참조에서 표지되는 것인, 방법.
696. 항목 682에 있어서, 상기 동일한 비율의 아미노산 유형의 아미노산의 +/- 10%가 샘플 및 임의의 실험적 참조에서 표지되는 것인, 방법.
697. 항목 682에 있어서, 상기 동일한 비율의 아미노산 유형의 아미노산의 +/- 10%가 샘플 및 임의의 실험적 참조에서 표지되는 것인, 방법.
698. 항목 682에 있어서, 상기 동일한 비율의 아미노산 유형의 아미노산의 +/-10%가 샘플 및 임의의 실험적 참조에서 표지되는 것인, 방법.
699. 항목 1c에 있어서, 상기 박테리아 단백체가 살모넬라 및/또는 이 콜라이인, 방법.
700. 항목 1d에 있어서, 상기 관심 바이러스 단백체가 SARS-CoV-2 단백체인, 방법.
701. 항목 1d에 있어서, 상기 관심 바이러스 단백체가 인수공통 바이러스 단백체인, 방법.
702. 항목 1d에 있어서, 상기 관심 바이러스 단백체가 HIV 단백체인, 방법.
703. 항목 1f에 있어서, 상기 관심 인간 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체가 암의 조기 검출을 위해 사용되는 것인, 방법.
704. 항목 1g에 있어서, 상기 감염이 인수공통 감염인, 방법.
본 발명의 구현예는 첨부된 도면을 참조하여 하기에 기재된다:
도 1은 관심 단백질-A, 관심 단백질-B, 관심 단백질-C, 및 관심 단백질-D에 대해 계산된 고유한 서명이 각 관심 단백질의 단백질 농도의 함수로서 어떻게 달라지는지 예시하는 개략도를 도시한다. 참조 벡터는 각 관심 단백질에 대해 제공되며, 참조 벡터 상의 각 점은 관심 단백질의 고유한 단백질 농도(예를 들어 1 μM, 채워진 원)에 상응한다. 샘플 점(빈 사각형)에서 각 참조선까지의 최단 거리가 계산되어, 샘플에서 관심 단백질-B의 존재를 식별하며; 샘플에서 관심 단백질-B의 농도는 최단 거리가 제공되는 관심 단백질-B의 단백질 농도(예를 들어 0.5 μM)이다.
도 2는 n-차원 공간에서 참조선을 도시한다. 파라미터 방정식 1 세트는 BSA, LYZ, 및 TTR에 대한 다음 참조선을 제공한다. 샘플 점은 빈 원으로 나타낸다. 본 발명의 방법은 샘플 점과 각 참조선 사이의 거리 비교에 기반하여 샘플에서 관심 단백질/단백질 복합체의 존재 및/또는 농도 및/또는 양을 결정하는 것을 포함한다.
도 3은 병원성 단백체에 대한 고유한 서명을 도시한다. (a) 분석된 모든 7581 개의 박테리아 참조 단백체는 박테리아 참조 단백체에서 모든 단백질에 걸쳐 알려진 표지 값, 아미노산 농도, 또는 평균 아미노산 수의 고유한 서명을 갖는다. (b) 모든 평균 단백질 서열 내에서 2 개 이상의 아미노산 유형의 아미노산 수의 평균 수의 광범위한 분포를 나타내는 확대 이미지. (c) 분석된 모든 9377 개의 바이러스 참조 단백체는 바이러스 참조 단백체에서 모든 단백질에 걸쳐 알려진 표지 값, 아미노산 농도, 또는 평균 아미노산 수의 고유한 서명을 갖는다. (d) 분석된 모든 16958 개의 박테리아 및 바이러스 참조 단백체는 박테리아 또는 바이러스 참조 단백체에서 모든 단백질에 걸쳐 알려진 표지 값, 아미노산 농도, 또는 평균 아미노산 수의 고유한 서명을 갖는다. 이것은 분리 없이 샘플에서 전체 단백체의 식별을 가능하게 한다.
도 4는 Benford의 법칙에 따라 일련의 숫자에서 선행 자릿수의 확률 분포가 인간 혈장 단백체에서 아미노산 유형이 예상된 분포를 따른다는 것을 나타내는 분석을 도시한다.
도 5는 Benford의 법칙에 따라 일련의 숫자에서 선행 자릿수의 확률 분포가 바이러스 단백체에서 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 하위단위에 걸친 아미노산의 평균 수가 예상된 분포로부터 벗어난다는 것을 나타내는 분석을 도시하며, 이는 인간 단백체에 비해 이 데이터세트에서 가변성이 증가하였음을 시사한다.
도 6은 Benford의 법칙에 따라 일련의 숫자에서 선행 자릿수의 확률 분포가 박테리아 단백체에서 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 하위단위에 걸친 아미노산의 평균 수가 예상된 분포로부터 벗어난다는 것을 나타내는 분석을 도시하며, 이는 인간 단백체에 비해 이 데이터세트에서 가변성이 증가하였음을 시사한다.
도 7은 인간 단백체 내의 단백질 서열 내에서 아미노산의 순서를 식별하는 것이 단백질 서열 내에서 아미노산 수만을 식별하는 것과 비교하여 비효율적임을 나타낸다. 단백질 서열 내에서 아미노산의 2 개 유형의 순서를 식별하는 것은 단백질 서열 내에서 아미노산의 1 개 유형의 순서를 식별하는 것에 추가 정보를 더하지 않는다.
도 8은 인간 혈장 단백체 내에서 참조선을 알려진 단백질 농도 범위로 제한하는 효과의 입증을 도시한다. (a) 인간 혈장 단백체 내의 모든 3263 개의 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체에 대한 참조선. (b) 인간 혈장 단백체 내의 모든 3263 개의 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체에 대한 한계 참조선, 여기서 참조선은 인간 혈장 단백체 내에서 이들 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체의 알려진 농도 범위에 의해 한계가 있다.
도 9는 하나 초과의 관심 단백질을 언급하는 참조의 발생이 알려진 단백질 농도 한계와 비교하여, 본 발명의 방법을 통해 액세스가능한, 단백질 농도 정보가 있거나 없는 아미노산 유형의 다양한 조합(C 및 W, K 및 W, K 및 Y, K 및 S, K 및 P, L 및 S, L 및 K, E 및 L, G 및 L, C K 및 W, C K 및 Y, L K 및 S, E G 및 K, E G 및 S, R E P 및 T, 및 Q L K 및 V - 에 대해 인간 혈장 단백체에 걸쳐 정량화되엇음을 도시한다.
도 10은 2 개의 아미노산 유형이 표지되고 비교되는 경우, 단백질 농도 또는 다른 분류에 대한 임의의 한계 또는 제약 조건을 적용하지 않고, 모든 참조가 구별가능하고 대부분의 고려되는 임상적으로 관련된 단백체 및 하위단백체(SARS-CoV-2, HIV, 엡스타인-바(Epstein-Barr), 신경교종) 내에서 관심 단백질에 고유하게 맵핑되고, 임상적으로 관련된 단백체 및 하위단백체 내에서 다수의 관심 단백질에 상응하지 않음을 도시한다.
도 11 (a) 인간 혈장 단백체 및 (b) 인간 타액 단백체 내의 단백질 서열에 대한 참조의 고유성에 대해 2 개의 아미노산 유형의 모든 조합에 의해 제공되는 정보 내용을 비교하는 것을 도시한다.
도 12는 모든 참조 박테리아 단백체(7581 개의 참조 단백체)가 모든 다른 단백체의 단백질에 걸쳐 2 개의 아미노산 유형 내에서 아미노산의 모든 다른 평균 수와 구별되는 그들의 단백체에서 단백질에 걸친 2 개의 아미노산 유형 내에서 평균 아미노산 수를 가짐을 도시한다.
도 13은 관심 단백체 내의 단지 2 개의 아미노산 유형의 표지화에 대해, 박테리아 및 바이러스 단백체가 그들의 계통에 따라 함께 클러스터링된다는 것을 도시한다. 여기서 K 및 W 아미노산 유형의 표지화가 제공되며, 다음 목 내에서 클러스터링을 나타낸다: 코리네박테리아세아에(Corynebacteriaceae), 레지오넬랄레스(Legionellales), 바실랄레스(Bacillales), 스트렙토마이세타세아에(Streptomycetaceae), 및 마이코플라스마타세아에(Mycoplasmataceae).
도 14는 단백질의 알려지지 않은 혼합물에 대한 처리를 기재한다. 혼합물의 정체성은 알려져 있지 않고, 혼합물의 단백질 농도는 알려져 있지 않다.
도 15는 유체역학적 반경이 단백질 서열 단독에 기반하여 예측될 수 없음을 도시하는 데, 최신 기술의 스케일링 방법이 여전히 단백질이 접혀 있거나 풀려있는지에 대한 지식을 필요로 하고, 부분적 고유 장애를 설명하지 않기 때문이다.
도 16은 (a) 트립토판(W), (b) 티로신(Y), (c) 환원된 시스테인(CR), (d) 시스테인(C), 및 (e) 리신(K) 아미노산 유형과 형광생성 염료, 또는 표시된 아미노산 유형과 반응 시 형광이 되는 분자의 반응을 나타내는 개략도이다.
도 17 환자 샘플과 (a) C 및 K, (b) C 및 W, 및 (c) K 및 W SARS-CoV-2 및 인플루엔자 A 참조선의 비교를 도시한다.
도 18 임의 단위(AU)의 K 아미노산 유형 K F.I.에서 μM의 K 아미노산 유형의 아미노산 농도 [K]로 배경-보정 형광 강도의 전환에 대한 교정 곡선을 도시한다. 비선형 회귀는 R2 = 0.9987인 교정 곡선에 대해 제공된 다항식 맞춤을 나타내었다.
도 19 임의 단위(AU)의 C 아미노산 유형 C F.I.에서 μM의 C 아미노산 유형의 아미노산 농도 [C]로 배경-보정 형광 강도의 전환에 대한 교정 곡선을 도시한다. 비선형 회귀는 R2 = 0.9886인 교정 곡선에 대해 제공된 다항식 맞춤을 나타내었다.
도 20 임의 단위(AU)의 W 아미노산 유형 W F.I.에서 μM의 W 아미노산 유형의 아미노산 농도 [W]로 배경-보정 형광 강도의 전환에 대한 교정 곡선을 도시한다. 비선형 회귀는 R2 = 0.9886인 교정 곡선에 대해 제공된 다항식 맞춤을 나타내었다.
도 21은 각 실험적으로 측정된 환자 PPP 샘플의 3 가지 기술적 복제물에 걸쳐 평균 측정된 아미노산 농도가 N-차원 공간(4-차원 공간)에서 표시되는 경우, 데이터가 본 발명의 개념에 의해 예측된 바와 같이 N-차원 공간에서 선으로 취한다는 것을 도시한다. 이 개념적 선은 데이터 세트를 통해 선을 그림으로써 예시하였다. 관심 PPP 단백체를 정의하는 참조선의 실제 위치 및 방정식을 계산하기 위해, 관심 PPP 단백체를 정의하는 벡터 함수의 K, C, W, 및 Y 구성요소를 다음 도면에서 실험적으로 계산하였다.
도 22는 실험적 참조선의 K 구성요소의 계수(방향)가 관심 PPP 및 PRP 단백체에 대해 어떻게 계산되었는지 도시한다. 아미노산 유형 K의 μM로 측정된 아미노산 몰 농도를 각 관심 단백체에 대해 μg/mL로 측정된 총 단백질 농도에 대해 표시하고 선형 회귀를 수행하였다. 선형 회귀는 원점을 통과하도록 제한되었다.
도 23은 실험적 참조선의 C 구성요소의 계수(방향)가 관심 PPP 및 PRP 단백체에 대해 어떻게 계산되었는지 도시한다. 아미노산 유형 C의 μM로 측정된 아미노산 몰 농도를 각 관심 단백체에 대해 μg/mL로 측정된 총 단백질 농도에 대해 표시하고 선형 회귀를 수행하였다. 선형 회귀는 원점을 통과하도록 제한하였다.
도 24는 실험적 참조선의 W 구성요소의 계수(방향)가 관심 PPP 및 PRP 단백체에 대해 어떻게 계산되었는지 도시한다. 아미노산 유형 W의 μM로 측정된 아미노산 몰 농도를 각 관심 단백체에 대해 μg/mL로 측정된 총 단백질 농도에 대해 표시하고 선형 회귀를 수행하였다. 선형 회귀는 원점을 통과하도록 제한하였다.
도 25는 실험적 참조선의 Y 구성요소의 계수(방향)가 관심 PPP 및 PRP 단백체에 대해 어떻게 계산되었는지 도시한다. 아미노산 유형 Y의 μM로 측정된 아미노산 몰 농도를 각 관심 단백체에 대해 μg/mL로 측정된 총 단백질 농도에 대해 표시하고 선형 회귀를 수행하였다. 선형 회귀는 원점을 통과하도록 제한하였다.
도 26은 실험적 참조선의 K 구성요소의 계수(방향)가 관심 PPP_50 및 PRP_50 하위단백체에 대해 어떻게 계산되었는지 도시한다. 아미노산 유형 K의 μM로 측정된 아미노산 몰 농도를 각 관심 하위단백체에 대해 μg/mL로 측정된 총 단백질 농도에 대해 표시하고 선형 회귀를 수행하였다. 선형 회귀는 원점을 통과하도록 제한하였다.
도 27은 실험적 참조선의 C 구성요소의 계수(방향)가 관심 PPP_50 및 PRP_50 하위단백체에 대해 어떻게 계산되었는지 도시한다. 아미노산 유형 C의 μM로 측정된 아미노산 몰 농도를 각 관심 하위단백체에 대해 μg/mL로 측정된 총 단백질 농도에 대해 표시하고 선형 회귀를 수행하였다. 선형 회귀는 원점을 통과하도록 제한하였다.
도 28은 실험적 참조선의 W 구성요소의 계수(방향)가 관심 PPP_50 및 PRP_50 하위단백체에 대해 어떻게 계산되었는지 도시한다. 아미노산 유형 W의 μM로 측정된 아미노산 몰 농도를 각 관심 하위단백체에 대해 μg/mL로 측정된 총 단백질 농도에 대해 표시하고 선형 회귀를 수행하였다. 선형 회귀는 원점을 통과하도록 제한하였다. 후속 8 개의 도면에서, 질량이 아닌, 몰 단백질 농도의 공통 파라미터에 기반한 실험적 참조선의 구성요소의 계수(방향) 방법이 설명된다.
도 29는 실험적 참조선의 K 구성요소의 계수(방향)가 관심 PPP 및 PRP 단백체에 대해 어떻게 계산되었는지 도시한다. 아미노산 유형 K의 μM로 측정된 아미노산 몰 농도를 각 관심 단백체에 대해 μM로 측정된 총 단백질 몰 농도에 대해 표시하고 선형 회귀를 수행하였다. 선형 회귀는 원점을 통과하도록 제한하였다.
도 30은 실험적 참조선의 C 구성요소의 계수(방향)가 관심 PPP 및 PRP 단백체에 대해 어떻게 계산되었는지 도시한다. 아미노산 유형 C의 μM로 측정된 아미노산 몰 농도를 각 관심 단백체에 대해 μM로 측정된 총 단백질 몰 농도에 대해 표시하고 선형 회귀를 수행하였다. 선형 회귀는 원점을 통과하도록 제한하였다.
도 31은 실험적 참조선의 W 구성요소의 계수(방향)가 관심 PPP 및 PRP 단백체에 대해 어떻게 계산되었는지 도시한다. 아미노산 유형 W의 μM로 측정된 아미노산 몰 농도를 각 관심 단백체에 대해 μM로 측정된 총 단백질 몰 농도에 대해 표시하고 선형 회귀를 수행하였다. 선형 회귀는 원점을 통과하도록 제한하였다.
도 32는 실험적 참조선의 Y 구성요소의 계수(방향)가 관심 PPP 및 PRP 단백체에 대해 어떻게 계산되었는지 도시한다. 아미노산 유형 Y의 μM로 측정된 아미노산 몰 농도를 각 관심 단백체에 대해 μM로 측정된 총 단백질 몰 농도에 대해 표시하고 선형 회귀를 수행하였다. 선형 회귀는 원점을 통과하도록 제한하였다.
도 33은 실험적 참조선의 K 구성요소의 계수(방향)가 관심 PPP_50 및 PRP_50 하위단백체에 대해 어떻게 계산되었는지 도시한다. 아미노산 유형 K의 μM로 측정된 아미노산 몰 농도를 각 관심 하위단백체에 대해 μM로 측정된 총 단백질 농도에 대해 표시하고 선형 회귀를 수행하였다. 선형 회귀는 원점을 통과하도록 제한하였다.
도 34는 실험적 참조선의 C 구성요소의 계수(방향)가 관심 PPP_50 및 PRP_50 하위단백체에 대해 어떻게 계산되었는지 도시한다. 아미노산 유형 C의 μM로 측정된 아미노산 몰 농도를 각 관심 하위단백체에 대해 μM로 측정된 총 단백질 농도에 대해 표시하고 선형 회귀를 수행하였다. 선형 회귀는 원점을 통과하도록 제한하였다.
도 35는 실험적 참조선의 W 구성요소의 계수(방향)가 관심 PPP_50 및 PRP_50 하위단백체에 대해 어떻게 계산되었는지 도시한다. 아미노산 유형 W의 μM로 측정된 아미노산 몰 농도를 각 관심 하위단백체에 대해 μM로 측정된 총 단백질 농도에 대해 표시하고 선형 회귀를 수행하였다. 선형 회귀는 원점을 통과하도록 제한하였다.
도 36은 각 환자 샘플(별표) 및 이론적 참조선(실선)의 3 가지 기술적 복제물에 걸쳐 평균 측정된 아미노산 농도를 도시한다. 실험적으로 측정된 데이터세트와 예측된 참조선 사이의 긴밀한 일치는 본원에 개시된 접근법의 견고성을 예시하며 이에 의해 임의의 관심 단백체 또는 하위단백체가 총 단백질 농도의 공통 파라미터의 벡터 함수인 단일 참조에 의해 대수적으로 기재될 수 있다.
도 37은 관심 PPP 및 PRP 단백체 둘 다에 대해, 아미노산 유형 K의 μM의 아미노산 농도 대 μM의 아미노산 유형 C의 아미노산 농도를 도시한다. 이 데이터세트는 훈련 세트 및 테스트 세트로 분할되었으며, 훈련 세트는 K 및 C 아미노산 유형의 측정된 농도에 기반하여 환자 샘플의 관심 단백체를 식별하기 위한 분류기를 훈련하는 데 사용되었다.
도 38 도 37에서 설명된 훈련된 분류기의 예측을 도시한다. 예측의 100%를 보정하였기 때문에 잘못된 예측은 제시되지 않는다.
도 39는 2 개의 표지된 아미노산 유형: K 및 C의 측정된 표지 값으로부터 계산된 아미노산 농도만을 사용한 PPP 대 PRP 단백체 식별의 100% 백분율의 정확도(미세 K-최근접 이웃, KNN 분류기를 사용한 참 대 예측 클래스를 도시한다.
도 40은 높은 분류 민감도 및 특이성이 사용된 분류기 유형에 대해 강력함을 도시한다. 예를 들어, 2 개의 아미노산 유형 K 및 C만을 사용한 PPP 대 PRP 단백체 식별의 100% 백분율의 정확도(배깅 결정 트리(Bagged Decision Tree) 분류기를 사용한 참 대 예측 클래스)가 제시된다. 추가로 2 개의 표지된 아미노산 유형: K 및 C의 측정된 표지 값으로부터 계산된 아미노산 농도에 기반하여 분류기 성능의 이 수준(100% 정확도)을 달성하기 위해 최적화 또는 하이퍼파라미터 조정이 필요하지 않았다.
도 41은 2 개의 아미노산 유형 K 및 C만을 사용한 PPP 대 PRP 단백체 식별의 100% 양성 예측 값(배깅 결정 트리 분류기를 사용한 참 대 예측 클래스)을 도시한다.
도 42는 환자 연령의 함수로서 표시된 모든 개별 남성 및 여성 환자에 대해 관심 PPP 및 PRP 단백체에 대한 실험적 참조선의 K 계수를 도시한다. 각 환자에 대해 계산된 실험적 단백체 참조선의 계수에 대한 환자 성별 또는 연령의 영향은 없었다. 이는 본 발명의 방법을 사용하여 측정된 단백체 서명이 임의의 환자 집단을 설명하고 특이적으로 성별 또는 연령에 의해 영향을 받지 않음을 확인시켜 준다. 이 결과는 본 발명의 방법이 개별 환자 변이에 대해 견고하고 건강한 환자가 단일 식별 단백체 서명을 나타낸다는 것을 확인시켜 준다.
도 43은 환자 연령의 함수로서 표시된 모든 개별 남성 및 여성 환자에 대해 관심 PPP 및 PRP 단백체에 대한 실험적 참조선의 C 계수를 도시한다. 각 환자에 대해 계산된 실험적 단백체 참조선의 계수에 대한 환자 성별 또는 연령의 영향은 없었다. 이는 본 발명의 방법을 사용하여 측정된 단백체 서명이 임의의 환자 집단을 설명하고 특이적으로 성별 또는 연령에 의해 영향을 받지 않는다는 것을 확인시켜 준다. 이 결과는 본 발명의 방법이 개별 환자 변이에 대해 견고하고 건강한 환자가 단일 식별 단백체 서명을 나타낸다는 것을 확인시켜 준다.
도 44는 환자 연령의 함수로서 표시된 모든 개별 남성 및 여성 환자에 대해 관심 PPP 및 PRP 단백체에 대한 실험적 참조선의 W 계수를 도시한다. 각 환자에 대해 계산된 실험적 단백체 참조선의 계수에 대한 환자 성별 또는 연령의 영향은 없었다. 이는 본 발명의 방법을 사용하여 측정된 단백체 서명이 임의의 환자 집단을 설명하고 특이적으로 성별 또는 연령에 의해 영향을 받지 않는다는 것을 확인시켜 준다. 이 결과는 본 발명의 방법이 개별 환자 변이에 대해 견고하고 건강한 환자가 단일 식별 단백체 서명을 나타낸다는 것을 확인시켜 준다.
도 45는 환자 연령의 함수로서 표시된 모든 개별 남성 및 여성 환자에 대해 관심 PPP 및 PRP 단백체에 대한 실험적 참조선의 Y 계수를 도시한다. 각 환자에 대해 계산된 실험적 단백체 참조선의 계수에 대한 환자 성별 또는 연령의 영향은 없었다. 이는 본 발명의 방법을 사용하여 측정된 단백체 서명이 임의의 환자 집단을 설명하고 특이적으로 성별 또는 연령에 의해 영향을 받지 않는다는 것을 확인시켜 준다. 이 결과는 본 발명의 방법이 개별 환자 변이에 대해 견고하고 건강한 환자가 단일 식별 단백체 서명을 나타낸다는 것을 확인시켜 준다.
도 46은 환자 연령의 함수로서 표시된 모든 개별 남성 및 여성 환자에 대해 관심 PPP_50 및 PRP_50 하위단백체에 대한 실험적 참조선의 K 계수를 도시한다. 각 환자에 대해 계산된 실험 하위단백체 참조선의 계수에 대한 환자 성별 또는 연령의 영향은 없었다. 이는 본 발명의 방법을 사용하여 측정된 하위단백체 서명이 임의의 환자 집단을 설명하고 특이적으로 성별 또는 연령에 의해 영향을 받지 않는다는 것을 확인시켜 준다. 이 결과는 본 발명의 방법이 개별 환자 변이에 대해 견고하고 건강한 환자가 단일 식별 하위단백체 서명을 나타낸다는 것을 확인시켜 준다.
도 47은 환자 연령의 함수로서 표시된 모든 개별 남성 및 여성 환자에 대해 관심 PPP_50 및 PRP_50 하위단백체에 대한 실험적 참조선의 C 계수를 도시한다. 각 환자에 대해 계산된 실험 하위단백체 참조선의 계수에 대한 환자 성별 또는 연령의 영향은 없었다. 이는 본 발명의 방법을 사용하여 측정된 하위단백체 서명이 임의의 환자 집단을 설명하고 특이적으로 성별 또는 연령에 의해 영향을 받지 않는다는 것을 확인시켜 준다. 이 결과는 본 발명의 방법이 개별 환자 변이에 대해 견고하고 건강한 환자가 단일 식별 하위단백체 서명을 나타낸다는 것을 확인시켜 준다.
도 48은 환자 연령의 함수로서 표시된 모든 개별 남성 및 여성 환자에 대해 관심 PPP_50 및 PRP_50 하위단백체에 대한 실험적 참조선의 W 계수를 도시한다. 각 환자에 대해 계산된 실험 하위단백체 참조선의 계수에 대한 환자 성별 또는 연령의 영향은 없었다. 이는 본 발명의 방법을 사용하여 측정된 하위단백체 서명이 임의의 환자 집단을 설명하고 특이적으로 성별 또는 연령에 의해 영향을 받지 않는다는 것을 확인시켜 준다. 이 결과는 본 발명의 방법이 개별 환자 변이에 대해 견고하고 건강한 환자가 단일 식별 하위단백체 서명을 나타낸다는 것을 확인시켜 준다.
도 49는 건강한 환자 인간 펩티드 아틀라스 면역검정 데이터로부터 계산된 w K , w C , w W , 및 w Y 값과 본 발명의 방법을 사용하여 계산된 w K , w C , w W , 및 w Y 값의 두 세트를 비교하여 건강한 환자 질량 분광법 데이터로부터 계산된 w K , w C , w W , 및 w Y 값을 도시한다. 이들 값의 일치는 방정식 11이 질량 분광법 및 면역검정 둘 다로부터 생성된 풍부도 데이터에 대해 견고하게 수행되어, 참조의 합동/통합 세트(벡터 함수)를 구축하는 수단을 제공하지만, 기본 데이터를 생성하기 위해 상이한 실험 기술이 이용되었다는 것을 예시한다. 기존 데이터 소스에 기반하여 구축할 프레임워크를 제공한다.
도 50은 난소암 혈장 샘플, 췌장암 혈장 샘플, 결장직장암 혈장 샘플 및 건강한 환자 혈장(PPP) 샘플에 대해 N-차원 공간에 표시된 아미노산 유형 C, W, Y 및 K에 대한 μM의 아미노산 농도를 도시하며, 이들 데이터 세트 각각은 본원에 교시된 바와 같이 (총 단백질 농도의 공통 파라미터의 함수인) 참조선의 형태를 취하는 것으로 관찰된다.
도 51은 난소암 혈장 단백체에 대한 μM의 총 몰 단백질 농도의 함수로서 표시된 아미노산 유형 K의 μM의 아미노산 농도 및 난소암 참조선의 K 계수(방향)의 계산을 도시한다.
도 52는 난소암 혈장 단백체에 대한 μM의 총 몰 단백질 농도의 함수로서 표시된 아미노산 유형 C의 μM의 아미노산 농도 및 난소암 참조선의 C 계수(방향)의 계산을 도시한다.
도 53은 난소암 혈장 단백체에 대한 μM의 총 몰 단백질 농도의 함수로서 표시된 아미노산 유형 W의 μM의 아미노산 농도 및 난소암 참조선의 W 계수(방향)의 계산을 도시한다.
도 54는 난소암 혈장 단백체에 대한 μM의 총 몰 단백질 농도의 함수로서 표시된 아미노산 유형 Y의 μM의 아미노산 농도 및 난소암 참조선의 Y 계수(방향)의 계산을 도시한다.
도 55는 췌장암 혈장 단백체에 대한 μM의 총 몰 단백질 농도의 함수로서 표시된 아미노산 유형 K의 μM의 아미노산 농도 및 췌장암 참조선의 K 계수(방향)의 계산을 도시한다.
도 56은 췌장암 혈장 단백체에 대한 μM의 총 몰 단백질 농도의 함수로서 표시된 아미노산 유형 C의 μM의 아미노산 농도 및 췌장암 참조선의 C 계수(방향)의 계산을 도시한다.
도 57은 췌장암 혈장 단백체에 대한 μM의 총 몰 단백질 농도의 함수로서 표시된 아미노산 유형 W의 μM의 아미노산 농도 및 췌장암 참조선의 W 계수(방향)의 계산을 도시한다.
도 58은 췌장암 혈장 단백체에 대한 μM의 총 몰 단백질 농도의 함수로서 표시된 아미노산 유형 Y의 μM의 아미노산 농도 및 췌장암 참조선의 Y 계수(방향)의 계산을 도시한다.
도 59는 결장직장암 혈장 단백체에 대한 μM의 총 몰 단백질 농도의 함수로서 표시된 아미노산 유형 K의 μM의 아미노산 농도 및 결장직장암 참조선의 K 계수(방향)의 계산을 도시한다.
도 60은 결장직장암 혈장 단백체에 대한 μM의 총 몰 단백질 농도의 함수로서 표시된 아미노산 유형 C의 μM의 아미노산 농도 및 결장직장암 참조선의 C 계수(방향)의 계산을 도시한다.
도 61은 결장직장암 혈장 단백체에 대한 μM의 총 몰 단백질 농도의 함수로서 표시된 아미노산 유형 W의 μM의 아미노산 농도 및 결장직장암 참조선의 W 계수(방향)의 계산을 도시한다.
도 62는 결장직장암 혈장 단백체에 대한 μM의 총 몰 단백질 농도의 함수로서 표시된 아미노산 유형 Y의 μM의 아미노산 농도 및 결장직장암 참조선의 Y 계수(방향)의 계산을 도시한다.
도 63은 환자 샘플에서 관심 단백체 또는 하위단백체의 존재 및/또는 농도 및/또는 양을 결정하는 한 가지 가능한 방식으로서 본원에 기재된 벡터 함수 접근법이 수행되는 경우, 환자 혈장에서 결장직장암, 난소암, 및 췌장암의 존재 및 부재를 결정하기 위해 매우 높은 민감도 및 특이성이 수득된다는 것을 도시한다. 구체적으로, 제공된 혼동 행렬에 요약된 바와 같이, 혈장으로부터 결장직장암 및 췌장암을 식별하는 데 100% 정확도, 혈장으로부터 난소암을 식별하는 데 90% 정확도, 및 암-음성, 건강한 샘플로서 암 음성, 건강한 샘플의 정확한 식별에 대해 95% 특이성이 달성된다.
도 64는 본원에 기재된 (정량적) 벡터 함수 접근법의 일부로서 결정되는 관심 단백체의 농도 및/또는 양이 매우 정확하며, 모든 관심 단백체에 대해 선을 따르고 y = x, 매우 낮은 오류(단지 2% 오류)로 환자 샘플 내에서 관심 단백체의 농도 및/또는 양의 결정을 허용한다는 것을 도시한다.
도 65는 관심 단백체가 또한 기계 학습 분류기를 사용하여 혈장에서 식별될 수 있다는 것을 도시한다. 선형 서포트 벡터 머신(SVM) 분류기는 데이터의 25%가 보류된 환자 혈장 샘플의 K, C, W, 및 Y 아미노산 유형의 몰(μM) 아미노산 농도로 훈련되었다. 각 관심 암 단백체(모든 암 환자 샘플) 뿐만 아니라 관심 건강한 단백체(모든 건강한 환자 샘플)에 대해 100% 양성 예측 값 및 0% 거짓 발견율이 수득되었다.
도 66 관심 단백체가 또한 단지 3 개의 표지된 아미노산 유형의 아미노산 농도로 훈련된 기계 학습 분류기를 사용하여 혈장에서 식별될 수 있다는 것을 도시한다. 선형 서포트 벡터 머신(SVM) 분류기는 데이터의 25%가 보류된 환자 혈장 샘플의 K, C, 및 W 아미노산 유형의 몰(μM) 아미노산 농도로 훈련되었다. 각 관심 암 단백체(모든 암 환자 샘플) 뿐만 아니라 관심 건강한 단백체(모든 건강한 환자 샘플)에 대해 100% 양성 예측 값 및 0% 거짓 발견율이 수득되었다.
도 67 관심 단백체가 또한 단지 2 개의 표지된 아미노산 유형의 아미노산 농도로 훈련된 기계 학습 분류기를 사용하여 혈장에서 식별될 수 있다는 것을 도시한다. 선형 서포트 벡터 머신(SVM) 분류기는 데이터의 25%가 보류된 환자 혈장 샘플의 K 및 C 아미노산 유형만의 몰(μM) 아미노산 농도로 훈련되었다. 각 관심 암 단백체(모든 암 환자 샘플) 뿐만 아니라 관심 건강한 단백체(모든 건강한 환자 샘플)에 대해 100% 양성 예측 값 및 0% 거짓 발견율이 수득되었다.
도 68 K, C, W, 및 Y 아미노산 유형의 양에 기반한 본 발명의 방법을 사용하여 III기 결장직장암을 검출하기 위한 78% 정확도를 나타내는 혼동 행렬을 도시한다.
도 69는 K, C, W, 및 Y 아미노산 유형의 양에 기반한 본 발명의 방법을 사용하여 결장직장암의 위치를 검출하기 위한 100% 양성 예측 값을 나타내는 혼동 행렬을 도시한다.
도 70은 소변에서 측정된 방광암 샘플, 전립선암 샘플 및 신암 샘플 내에서 K, C, W, 및 Y 아미노산 유형의 μM의 아미노산의 몰 농도를 도시한다.
도 71은 양성 예측 값 거짓 발견 혼동 행렬을 도시하며, 본 발명의 방법을 사용하여 소변 샘플로부터 방광암, 전립선암, 및 신암의 식별에 대해 100% 양성 예측 식별 및 0% 거짓 발견을 나타낸다. 모든 포함된 유형의 암(방광암, 전립선암, 및 신암)은 100%의 참 양성률 및 0%의 거짓 음성률로 소변 샘플로부터 정확하게 식별될 수 있다.
적절한 경우에 개시된 기능을 수행하기 위한 수단, 또는 개시된 결과를 획득하기 위한 방법 또는 프로세스의 측면에서 또는 특이적 형태로 표현된 전술한 설명, 하기 청구범위, 또는 첨부된 도면에 개시된 특징은 별도로, 또는 이러한 특징의 임의의 조합으로 이의 다양한 형태로 본 발명을 실현하기 위해 활용될 수 있다.
본 발명은 단지 샘플 내에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하기 위해 샘플에서 2 개 이상의 아미노산 유형의 표지 및/또는 아미노산 농도 또는 아미노산 수를 측정하기만 하면 된다는 발견에 기반한다. 샘플을 서열분석할 필요 없이, 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체를 식별하고 정량화하기 위해 샘플 내에서 2 개 이상의 아미노산 유형을 표지하고 측정하기만 하면 된다. 이것은 각 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체가 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 2 개 이상의 아미노산 유형의 측정된 표지, 아미노산 농도 및/또는 아미노산 수에 기반한 고유한 서명을 갖기 때문이다. 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 2 개 이상의 아미노산 유형의 측정된 표지 및 아미노산 농도의 서명은 해당 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도에 기반하여 고유하다. 예를 들어, 샘플에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 식별을 위해 샘플을 서열분석함으로써, 샘플에서 아미노산의 순서를 식별할 필요는 없다. 샘플에서 단백질 서열 내의 아미노산의 순서를 식별하는 것은 2 개 이상의 아미노산 유형이 샘플에서 표지되고 측정되는 경우 추가 정보를 더하지 않는다(도 7).
본원에 기재된 본 발명의 방법은 샘플에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 데 사용될 수 있다. 이것은 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체가 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수에 기반한 고유한 서명을 갖기 때문이다. 따라서, 샘플의 서명은 샘플에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하기 위해 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 서명과 비교될 수 있다. 예를 들어, SARS-CoV-2 단백체는 인플루엔자 A 단백체의 각 아미노산 유형 및 농도의 알려진 표지 값 및/또는 아미노산 농도 및/또는 아미노산 수와 비교하여 SARS-CoV-2 단백체의 각 아미노산 유형 및 농도의 알려진 표지 값 및/또는 아미노산 농도 및/또는 아미노산 수에 기반한 고유한 서명을 갖는다. 따라서, 샘플에서 2 개 이상의 아미노산 유형의 측정된 표지, 아미노산 농도 및/또는 아미노산 수가 결정되고, 샘플에서 SARS-CoV-2 단백체 및/또는 HIV 단백체의 존재 및/또는 농도 및/또는 양을 식별하기 위해 SARS-CoV-2 단백체 및/또는 HIV 단백체에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도 또는 아미노산 수와 비교될 수 있다.
이전에, 샘플 내에서 관심 전체 단백체 또는 하위단백체를 한번에 식별하기 위한 전략은 이용가능하지 않았다. SARS-CoV-2와 같은 병원체의 식별을 위한 전략은 SARS-CoV-2로부터 핵산의 정량적 검출을 위한 역전사 폴리머라제 연쇄 반응(RT-PCR)에 의존해 왔다. 현재 최신 테스트는 대략 30% 거짓 음성률을 가지며, 감염 통제에 대한 유의한 결과를 갖는다. 바이러스 부하에 대한 정량적 정보는 일상적으로 이용가능하지 않다. 일반적인 대안으로서, 본 발명의 방법은 샘플 내에서 관심 전체 단백체 또는 하위단백체를 한번에 식별하기 위해, 예를 들어, 환자 샘플 내에서 관심 SARS-CoV-2 단백체의 존재 및/또는 농도 및/또는 양을 식별하기 위해 사용된다.
본원에 기재된 본 발명의 방법은 샘플에서 관심 하위단백체 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 데 사용될 수 있는 데, 각 관심 하위단백체 또는 단백체가 관심 하위단백체 또는 단백체에 걸친 각 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체에서 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수에 기반한 고유한 서명을 갖기 때문이다. 따라서, 샘플의 서명은 샘플에서 관심 하위단백체 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하기 위해 하나 이상의 관심 하위단백체 또는 단백체의 서명과 비교될 수 있다. 예를 들어, 인간 혈장 단백체는 인간 눈 단백체에서 각 아미노산 유형의 평균 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수와 비교하여 각 아미노산 유형의 평균 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수에 기반한 고유한 서명을 갖는다. 따라서, 샘플에서 2 개 이상의 아미노산 유형의 측정된 표지, 아미노산 농도 및/또는 아미노산 수가 결정되고, 샘플에서 해당 단백체의 존재 및/또는 농도 및/또는 양을 식별하기 위해 관심 단백체에서 동일한 2 개 이상의 아미노산 유형의 평균 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수와 비교될 수 있다.
본 발명의 방법은 샘플에서 바이러스 단백체의 존재를 식별하는 데 사용될 수 있다. 각 바이러스 단백체는 2 개 이상의 아미노산 유형의 평균 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수에 기반한 고유한 서명을 갖는다. 따라서, 샘플에서 2 개 이상의 아미노산 유형의 평균 측정된 표지, 아미노산 농도 및/또는 아미노산 수는 샘플에서 바이러스 단백체의 존재 및/또는 농도 및/또는 양을 식별하기 위해 바이러스 단백체의 동일한 2 개 이상의 아미노산 유형의 평균 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수와 비교될 수 있다. 또한, 본 발명의 방법은 샘플 내에서 바이러스 단백체의 바이러스 부하를 식별하는 데 사용될 수 있다. 예를 들어, 각 바이러스 단백체는 바이러스 단백체에 걸친 각 단백질에서 2 개 이상의 아미노산 유형의 평균 아미노산 수에 바이러스 단백체의 총 단백질 농도를 곱한 값에 기반한 고유한 서명을 갖는다. 따라서, 샘플에서 2 개 이상의 아미노산 유형의 아미노산 농도는 샘플 내에서 바이러스 단백체의 농도를 식별하기 위해 하나 이상의 단백질 농도에서 바이러스 단백체의 동일한 2 개 이상의 아미노산 유형의 평균 아미노산 농도와 비교될 수 있다.
이전에, 샘플에서 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 존재 및/또는 농도 및/또는 양을 식별하기 위해 용액 상 전략을 사용하는 경우, 먼저 혼합물을 개별 단백질 구성요소로 분리해야 하였다. 예를 들어, 혼합물 내의 단백질은 개별 단백질이 서열분석되기 전에, 겔 전기영동에 의한 크기에 기반하여, 또는 크로마토그래피 컬럼을 사용하여 흡착제에 대한 화합물의 흡착에 기반하여 분리된다. 예를 들어, 혼합물이 2 개의 단백질; 소 혈청 알부민 및 리소자임을 함유하는 경우, 이전에는 혼합물을 소 혈청 알부민 및 리소자임의 개별 단백질 구성요소로 분리해야 하였다. 대조적으로, 본원에 기재된 본 발명의 방법은 혼합물을 개별 구성요소로 분리할 필요 없이, 전체 혼합물로부터의 평균 서명에 기반하여, 샘플에서 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 존재 및/또는 농도 및/또는 양을 식별하는 데 사용될 수 있음이 발견되었다. 예를 들어, 소 혈청 알부민 및 리소자임을 함유하는 혼합물은 혼합물을 소 혈청 알부민 및 리소자임의 개별 단백질 구성요소로 분리할 필요 없이 식별될 수 있다. 이것은 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물이 혼합물에서 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체에 걸친 2 개 이상의 아미노산 유형의 평균 아미노산 수에 기반한 고유한 서명을 갖는다는 것이 발견되었기 때문이다. 예를 들어, 소 혈청 알부민 및 리소자임을 함유하는 혼합물은 소 혈청 알부민 및 알파 시누클레인 혼합물에서 동일한 2 개 이상의 아미노산 유형의 평균 측정된 표지, 아미노산 농도 및/또는 아미노산 수에 기반한 상이한 고유한 서명을 갖는, 소 혈청 알부민 및 알파 시누클레인을 함유하는 또 다른 혼합물과 비교하여 소 혈청 알부민 및 리소자임에서 2 개 이상의 아미노산 유형의 평균 측정된 표지, 아미노산 농도 및/또는 아미노산 수에 기반한 고유한 서명을 갖는다. 샘플 내에서 혼합물의 존재 및/또는 농도 및/또는 양을 식별하기 위해 혼합물 내 구성요소의 비율을 알 필요는 없다. 대신에, 하나 초과의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체가 샘플에서 식별되는 경우 혼합물의 존재가 샘플에서 식별된다. 샘플의 서명은 혼합물 내 각 구성요소의 서명에 의해 영향을 받는다. 관심 단백질 A가 혼합물 내에서 식별되고 혼합물에서 또한 식별된 관심 단백질 B보다 더 높은 비율의 혼합물을 포함하는 경우, 샘플 점과 관심 단백질 A에 대한 참조선 또는 점 사이의 거리는 샘플 점과 관심 단백질 B에 대한 참조선 또는 점 사이의 거리보다 더 작다. 반대로, 샘플 점과 관심 단백질 A 및 B 사이의 거리가 혼합물에서 관심 단백질 A 및 B의 비율을 결정하기 위해 계산되고 비교될 수 있다는 것이 발견되었다. 따라서, 샘플의 서명은 샘플에서 이러한 혼합물의 존재 및/또는 농도 및/또는 양을 식별하기 위해 샘플에 존재하는 것으로 식별된 하나 초과의 관심 하나 초과의 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 서명과 비교될 수 있다.
본 발명의 방법은 또한 샘플에서 2 개 이상의 단백체, 즉, 샘플에서 단백체의 혼합물의 동시 감염을 식별하는 데 사용될 수 있다. 이것은 단백체의 혼합물이 단백체의 혼합물에 걸친 각 단백질에서 2 개 이상의 아미노산 유형의 평균 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수에 기반한 고유한 서명을 갖기 때문이다. 따라서, 샘플에서 2 개 이상의 아미노산 유형의 측정된 표지 값, 아미노산 농도 및/또는 아미노산 수는 하나 초과의 관심 단백체에서 동일한 2 개 이상의 아미노산 유형의 평균 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수에 대해 결정되고 비교될 수 있다. 하나 초과의 관심 단백체의 존재가 샘플 내에서 식별되는 경우, 관심 단백체의 혼합물이 샘플 내에서 식별되고, 혼합물 내의 각 단백체의 비율이 단백질의 혼합물에 대해 상기 설명된 바와 같이 결정될 수 있다. 관심 단백체 A가 혼합물 내에서 식별되고 혼합물에서 또한 식별된 관심 단백체 B보다 더 높은 비율의 혼합물을 포함하는 경우, 샘플 점과 관심 단백체 A에 대한 참조선 또는 점 사이의 거리는 샘플 점과 관심 단백체 B에 대한 참조선 또는 점 사이의 거리보다 더 작다. 반대로 샘플 점과 관심 단백체 A 및 B 사이의 거리는 혼합물에서 관심 단백체 A 및 B의 비율을 결정하기 위해 계산되고 비교될 수 있다. 따라서, 샘플의 서명은 샘플에서 이러한 혼합물의 존재 및/또는 농도 및/또는 양을 식별하기 위해 샘플에 존재하는 것으로 식별된 하나 초과의 하나 초과의 관심 단백체의 서명과 비교될 수 있다. 예를 들어, 환자는 바이러스 및 2차 박테리아 감염, 또는 2 개의 바이러스 감염을 가질 수 있다. 이 경우, 박테리아 및 바이러스 단백체 및 2 개의 바이러스 단백체는 본 발명의 방법이 수행되기 전에 서로 분리될 필요가 없다. 이것은 박테리아, 진균, 원생동물, 식물, 인간을 포함한 동물, 및 이의 임의의 조합과 같은 단백체의 임의의 조합에 동등하게 적용될 수 있다. 본원에 기재된 본 발명의 방법은 간단하고, 수월해 보이고, 매우 효율적이며 알려진 서열분석 기술 및/또는 분리 기술을 필요로 하는 방법의 고유한 단점을 피한다.
본원에 개시된 방법은 임의의 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 및/또는 단백체의 혼합물에 적용될 수 있다. 본 발명의 방법은 단순히 2 개 이상의 아미노산 유형의 아미노산의 표지화 및 이들 표지의 측정을 필요로 한다. 아미노산 유형은 각 아미노산에 특이적인 R-기에 의해 정의된다. 각 유형의 아미노산의 R-기는 고유하다. 아미노산 유형은 22 개의 단백질생성 아미노산 및/또는 비-단백질생성 또는 합성 아미노산의 변형 및/또는 비변형된 아미노산을 포함할 수 있다.
방법에 대한 유일한 요건은 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체(예를 들어 참조)의 2 개 이상의 아미노산 유형의 서명, 또는 아미노산 서열 및/또는 번역 후 변형에 대한 임의의 실험적 정보가 이용가능하다는 점이다. 샘플에서 단백질의 존재 및/또는 농도 및/또는 양을 식별하기 위해 샘플 내에서 아미노산의 서열을 결정할 필요는 없다. 일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 2 개 이상의 아미노산 유형의 서명은 (예를 들어 데이터베이스로부터) 알려져 있다. 일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 2 개 이상의 아미노산 유형의 서명은 본 발명의 방법의 일부로서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각의 아미노산 서열 또는 서열들로부터 결정된다. 일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 2 개 이상의 아미노산 유형의 서명이 알려지지 않은 경우, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열은 서명을 결정하는 데 사용될 수 있다. 대안적으로, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 2 개 이상의 아미노산 유형의 서명은 본원에 개시된 방법(예를 들어 2 개 이상의 아미노산 유형의 표지화, 표지 값의 측정, 표준 방법을 통한 샘플의 총 단백질 농도의 측정, 및 측정된 표지를 각 표지된 아미노산 유형의 아미노산 수로 전환)을 사용하여 결정된다.
관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 중 하나 이상이 아미노산 유형의 변형된 아미노산을 포함하는 하나 이상의 아미노산 유형을 갖는 경우, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 해당 아미노산 유형의 변형된 아미노산의 서명이 결정될 수 있다. 일부 구현예에서, 이것은 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 실험적 번역 후 변형 정보로부터 결정된다. 예를 들어, 아미노산 유형 C가 샘플에서 표지되고 변형된 시스테인 아미노산 시스테인 이황화(CD)를 포함하는 경우, 아미노산 유형 시스테인의 아미노산 수의 서명은 변형된 아미노산 산화된 시스테인 CO에 대한 번역 후 변형 정보를 포함할 수 있다. 샘플의 이 서명은 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 변형된 아미노산(예컨대 산화된 시스테인 CD)의 알려진 표지 값, 아미노산 농도, 또는 아미노산 수의 서명과 비교될 수 있다.
정의
달리 정의되지 않는 한, 본원에 사용되는 모든 기술적 및 과학적 용어는 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 본원에서 언급된 모든 특허, 출원, 공개된 출원 및 다른 간행물은 달리 언급되지 않는 한 그 전체가 참조로 포함된다. 본원에서 용어에 대한 복수의 정의가 있는 경우, 달리 언급되지 않는 한 이 섹션에서의 정의가 우선한다.
본원에 사용된 바와 같이, 용어 "존재"는 샘플에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 적극 식별을 지칭한다.
본원에 사용된 바와 같이, 용어 "농도"는 부피 단위 당 실체(entity)의 풍부도를 지칭한다. 실체는 분자, 복합체, 단백질 쇄 내에 함유된 아미노산과 같은 중합체 내의 단량체, 또는 원자일 수 있다. 질량 농도는 부피 단위 당 실체의 질량을 지칭한다. 수 농도는 부피 단위 당 실체의 분자 수를 지칭한다. 몰 농도는 부피 단위 당 실체의 몰 수를 지칭한다. 실체의 몰 수는 샘플 내에 함유된 실체의 총 수를 아보가드로(Avogadro) 상수 NA로 나눈 값이며, 6.02214076 x 1023 mol-1이다. 달리 명시되지 않는 한, 용어 "농도"는 실체의 몰 농도를 지칭한다. "농도, t의 함수로서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체" 또는 등가물이 빈번하게 언급된다. 이것은 t가 관심 단백질의 농도이거나, t가 관심 펩티드의 농도이거나, t가 관심 올리고펩티드의 농도이거나, t가 관심 폴리펩티드의 농도이거나, t가 관심 단백질 복합체의 농도임을 의미한다. 본원에 사용된 바와 같이, 일부 구현예에서, 관심 단백질 복합체의 농도는 복합체 내의 하위단위의 단량체 농도가 아니라, 복합체의 농도를 지칭한다. 예를 들어, 관심 단백질 복합체 a가 2 개의 하위단위, A 및 B를 가지고 있어서, 관심 단백질 복합체 a가 복합체 화학량론 A:B로 설명될 수 있는 경우, 단백질 복합체 a의 농도는 하위단위 A의 농도 + 하위단위 B의 농도가 아니라, 복합체 A:B의 농도이다. 또한 "농도, t의 함수로서 관심 하위단백체 또는 단백체" 또는 등가물이 빈번하게 언급된다. 관심 하위단백체의 농도는 관심 하위단백체를 포함하는 모든 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체의 총 농도이다. 이것은 t가 관심 하위단백체를 포함하는 모든 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체의 총 농도임을 의미한다. 관심 단백체의 농도는 관심 단백체를 포함하는 모든 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체의 총 농도이다. 이것은 t가 관심 단백체를 포함하는 모든 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체의 총 농도임을 의미한다. 샘플에 존재하는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 몰 농도가 식별되면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 질량 농도는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 몰 농도에 (아미노산 서열 또는 서열들이 이용가능하도록 이제 식별된) 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 분자량을 곱한 것이다. 일부 구현예에서, 단백질 복합체의 분자량은 그의 하위단위의 조합된 분자량이다. 관심 하위단백체 또는 단백체의 분자량은 관심 단백체 또는 하위단백체를 포함하는 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및/또는 단백질 복합체의 분자량의 평균이다. 일부 구현예에서, 단백체의 농도는 샘플에서 단백체, 또는 단백체의 혼합물의 바이러스 부하, 박테리아 부하 및/또는 기생충 부하의 척도이다. 일부 구현예에서, 단백체는 바이러스 단백체이고, 방법은 샘플 내의 바이러스 단백체의 총 몰 단백질 농도를 제공한다. 이는 카피/mL의 기존 바이러스 부하 측정과 동등하다. 대안적으로, 방법은 당업계에 알려진 표준 기술을 사용하여 카피/mL의 바이러스 부하 측정을 제공한다. 일부 구현예에서, 단백체는 박테리아 단백체이고, 방법은 샘플 내의 박테리아 단백체의 총 박테리아 농도를 제공한다. 이것은 콜로니 형성 단위(CFU)의 박테리아 부하 측정과 동등하다. 대안적으로, 방법은 당업계에 알려진 표준 기술을 사용하여 CFU의 박테리아 부하 측정을 제공한다. 일부 구현예에서, 단백체는 기생충 단백체이고 방법은 방법은 샘플 내의 기생충 단백체의 총 기생충 농도를 제공한다. 이것은 숙주 샘플 당 기생충의 수의 기생충 부하 측정과 동등하다. 대안적으로, 방법은 당업계에 알려진 표준 기술을 사용하여 숙주 샘플 당 기생충의 수의 기생충 부하 측정을 제공한다. 본 발명자들은 특정 구현예를 기재하였지만, 몰 농도와 관련하여, 이들 구현예는 실시예에 기재된 바와 같이 질량 농도에 동일하게 적용가능하다.
본원에 사용된 바와 같이, 용어 "관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도"는 관심 단백질의 단백질 농도, 또는, 관심 펩티드의 펩티드 농도, 또는, 관심 올리고펩티드의 올리고펩티드 농도, 또는, 관심 폴리펩티드의 폴리펩티드 농도, 또는, 관심 단백질 복합체의 단백질 복합체 농도, 또는, 관심 하위단백체의 하위단백체 농도, 또는, 관심 단백체의 단백체 농도를 지칭하는 약어이다.
본원에 사용된 바와 같이, 용어 "양"은 샘플 내 실체의 몰 수를 지칭한다. 실체는 분자, 복합체, 단백질 쇄 내에 함유된 아미노산과 같은 중합체 내의 단량체, 또는 원자일 수 있다. 실체의 몰 수는 샘플 내에 함유된 실체의 총 수를 아보가드로 상수 NA로 나눈 값이며, 6.02214076 x 1023 mol-1이다. 달리 명시되지 않는 한, 양은 샘플 내 분자의 몰 수를 지칭한다. 양은 샘플에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체의 분자의 몰 수를 지칭한다. 일부 구현예에서, 다중 단백질 하위단위를 함유하는 단백질 복합체의 양은 전체 단백질 복합체를 하나의 분자로서 간주한다. 관심 단백체 또는 하위단백체는 많은 상이한 유형의 분자를 갖는다. 관심 하위단백체 또는 단백체의 양은 샘플 내에서 관심 단백체 또는 하위단백체를 포함하는 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체의 총 몰 수를 지칭한다. 일부 구현예에서, 샘플의 몰 농도는 샘플의 부피를 곱하여 샘플의 양을 제공한다.
본원에 사용된 바와 같이, 용어 "상대 농도"는 샘플 사이의 분자 농도의 배수 변화를 지칭한다. 예를 들어, 두번째 샘플로부터 희석된 첫번째 샘플은 두번째 샘플보다 낮은 상대 농도를 갖는다.
본원에 사용된 바와 같이, 용어 "아미노산 농도"는 아미노산 유형 내의 아미노산의 몰 또는 질량 농도를 지칭한다. 아미노산 농도는 부피 단위 당 아미노산 유형 내의 아미노산의 양 또는 질량을 지칭한다. 달리 명시되지 않는 한, 용어 아미노산 농도는 아미노산 유형 내의 아미노산의 몰 농도를 지칭한다. 아미노 유형 내의 아미노산의 몰 농도는 분자의 농도와 상이할 수 있는 데, 아미노산 유형의 하나 초과의 아미노산, 또는 아미노산 유형의 0 개의 아미노산이 분자 내에 함유될 수 있기 때문이다. 아미노산 유형 내의 아미노산의 아미노산 농도는 분자의 총 몰 농도에 분자 당 아미노산 유형의 아미노산 수를 곱한 것과 동일하다. 예를 들어, 분자가 단백질이면, 아미노산 유형의 아미노산 농도는 단백질 농도와 상이할 수 있다(일반적임). 샘플 내의 아미노산 유형의 아미노산 농도는 알려진 아미노산 농도의 하나 이상의 단백질 또는 아미노산에 대한 표지 값을 제공하는 교정 곡선 또는 표준을 사용하여, 샘플 내의 해당 아미노산 유형의 측정된 표지 값으로부터 계산된다. 중요하게는, 샘플의 2 개 이상의 아미노산 유형의 아미노산 농도는 샘플의 농도를 지칭하지 않는다. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 2 개 이상의 아미노산 유형의 아미노산 농도는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도를 지칭하지 않는다.
본원에 사용된 바와 같이, 용어 "단백질"은 아미노산의 하나 이상의 선형 폴리펩티드 쇄로 구성된 생체분자 또는 거대분자를 지칭한다. 단백질은 아미노산의 중합체이다. 용어 "단백질"은 약 50 내지 약 3000 개의 아미노산을 함유하는 분자를 포함하나 이에 제한되지 않는다. 용어 "단백질"은 종종 생물학적으로 기능하는 방식으로 배열된 하나 이상의 폴리펩티드 쇄를 지칭한다. 단백질은 본질적으로 무질서한 접힌 3-차원 구조 또는 부분적으로 접히고 부분적으로 무질서한 3-차원 구조인 3-차원 구조를 가질 수 있다. 단백질은 또한 다른 구성요소도 포함하는 아미노산의 하나 이상의 선형 폴리펩티드 쇄로 구성된 생체분자 또는 거대분자를 지칭한다. 예를 들어, 단백질은 또한 당단백질(여기서 당 분자의 쇄는 단백질 분자에 공유적으로 부착됨), 또는 단백질이 핵산에 결합되거나 이와 회합된 핵단백질을 포함한다.
본원에 사용된 바와 같이, 용어 "펩티드"는 펩티드(아미드) 결합에 의해 연결된 아미노산의 짧은 쇄를 지칭한다. 용어 "펩티드"는 약 2 내지 약 50 개의 아미노산을 함유하는 분자를 포함하나 이에 제한되지 않는다. 바람직한 측면에서, 용어 "펩티드"는 10 개 초과의 아미노산을 함유하는 분자를 지칭한다.
본원에 사용된 바와 같이, 용어 "올리고펩티드"는 약 2 내지 약 20 개의 아미노산을 함유하는 분자를 포함하나 이에 제한되지 않는 펩티드 내의 부류를 지칭한다. 용어 "올리고펩티드"는 2 개의 아미노산을 함유하는 디펩티드, 3 개의 아미노산을 함유하는 트리펩티드, 4 개의 아미노산을 함유하는 테트라펩티드, 및 5 개의 아미노산을 함유하는 펜타펩티드를 포함하나 이에 제한되지 않는다.
본원에 사용된 바와 같은 용어 "폴리펩티드"는 펩티드 결합에 의해 함께 고정된 많은 아미노산의 단일 선형 쇄이다.
본원에 사용된 바와 같이, 용어 "단백질 복합체"는 적어도 하나의 단백질 하위단위를 함유하는 2 개 이상의 하위단위의 구조적으로 회합된 그룹을 지칭한다. 단백질 복합체는 종종 2 개 이상의 단백질을 함유한다. 또한 하나 이상의 단백질 및 하나 이상의 핵산(리보핵단백질)을 함유할 수 있다. 단백질 복합체는 단백질 하위단위가 일반적으로 협력하여 생물학적 기능을 수행하는 안정한 단백질-단백질 상호작용의 형태이다. 단백질 복합체의 예는 리보솜이다. 단백질 복합체 내의 단백질 하위단위는 서로 안정하게 구조적으로 회합되고 협력하여 생물학적 기능을 형성하기 때문에, 단백질 복합체의 각 하위단위 내의 2 개 이상의 아미노산 유형 각각의 아미노산 수를 합하여 단백질 복합체에 대한 2 개 이상의 아미노산 유형 각각의 아미노산 수를 결정한다.
본원에 사용된 바와 같이, 용어 "단백질-단백질 상호작용"은 일반적으로 특이적인 물리적 접촉을 수반하는 단백질 분자 사이의 상호작용을 지칭한다. 단백질-단백질 상호작용은 안정적이거나 일시적일 수 있다. 본 발명의 방법에서, 일시적 단백질 상호작용과 같은 단백질 복합체를 포함하지 않는 단백질-단백질 상호작용은 단백질 혼합물로 처리된다.
본원에 사용된 바와 같이, 용어 "하위단백체"는 단백체의 일부이고 질환 연관된 것과 같은 공통 특성을 공유하는 단백질의 집합이다. 예를 들어, 인간 혈장 단백체 내의 하위단백체는 심장 질환 하위단백체이다. 질환-연관된 하위단백체는 단백체 내의 단백질의 전부 또는 일부를 포함할 수 있다. 하위단백체는 또한 낮은 분자량, 크기, 전하 및/또는 밀도와 같으나 이에 제한되지 않는 공통 물리적 특성을 공유하는 단백체 내의 단백질을 설명할 수 있다. 일부 구현예에서, 저분자량 특성은 10kDa 미만, 30 kDa 미만, 50kDa 미만, 100kDa 미만, 10-30 kDa, 30-50 kDa, 10-50kDA , 30-50kDA, 10-100kDa, 50-100kDa 또는 30-100 kDa의 단백질을 지칭한다. 바람직한 구현예에서, 저분자량은 10kDa 미만 미만, 30 kDa 미만, 50kDa 미만, 100kDa 미만의 단백질, 또는 10 kDa, 30 kDa, 50 kDa 또는 100 kDa의 단백질을 지칭한다. 바람직한 구현예에서, 저분자량은 50kDa 미만의 단백질 또는 50kDa의 단백질을 지칭한다. 일부 구현예에서, 전하 특성은 반대로 하전된 수지에 결합하는 단백질을 선택하는 데 사용될 수 있는 이온 교환 크로마토그래피를 포함한 크로마토그래피를 지칭한다. 일부 구현예에서, 밀도 특성은 단백질 크기 및 모양과 관련된 침강 계수를 지칭한다.
본원에 사용된 바와 같이, 용어 "단백체"는 유기체에 의해 발현되는 모든 단백질을 지칭한다. 용어 "단백체"는 또한 특정 조직 유형 내의 유기체에 의해 발현되는 모든 단백질, 예를 들어, 인간 혈장 단백체를 지칭한다. 용어 "단백체"는 또한 특정 세포 유형, 예를 들어, 교모세포종 세포 내에서 발현되는 모든 단백질을 지칭한다. 용어 "단백체"는 또한 예를 들어 약물로 치료될 때, 주어진 시간에서 또는 주어진 조건 세트 하에 유기체, 조직 유형, 또는 세포 유형에 의해 발현되는 단백질에서의 변화를 지칭한다. 용어 "단백체"는 바이러스 단백체, 박테리아 단백체, 고세균 단백체, 기생충 단백체, 효모 단백체, 식물 단백체, 동물 단백체, 포유류 단백체, 및 인간 단백체를 포함하나 이에 제한되지 않는다. 용어 "단백체"는 50 개 미만의 단백질을 갖는 바이러스 단백체, 7000 개 미만의 단백질을 갖는 박테리아 단백체, 5000 개 미만의 단백질을 갖는 인간 혈장 단백체, 5000 개 미만의 단백질을 갖는 인간 소변 단백체, 5000 개 미만의 단백질을 갖는 인간 타액 단백체, 및 대략 22000 개의 단백질을 갖는 인간 단백체를 포함하나 이에 제한되지 않는다.
본원에 사용된 바와 같이, 용어 "혼합물"은 샘플에서 2 개 이상의 단백질, 펩티드, 폴리펩티드 또는 올리고펩티드, 하위단백체 및/또는 단백체를 지칭한다. 예를 들어, 펩티드의 혼합물은 2 개 이상의 펩티드의 조합이고, 폴리펩티드의 혼합물은 2 개 이상의 폴리펩티드의 조합이고, 단백질의 혼합물은 2 개 이상의 단백질의 조합이다. 혼합물은 동일한 구성요소로 구성될 필요가 없다. 예를 들어, 혼합물은 또한 단백질 및 펩티드의 혼합물, 펩티드 및 폴리펩티드의 혼합물, 단백질 및 폴리펩티드의 혼합물 등일 수 있다.
본원에 사용된 바와 같이, "샘플"은 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유할 수 있는 임의의 샘플을 지칭한다. 용어 "샘플"은 또한 임의의 단백질을 함유하지 않는 임의의 샘플을 포함하고 따라서 표지가 측정될 때 값(예를 들어 표지의 신호)은 수득되지 않는다.
본원에 사용된 바와 같이, 용어 "아미노산 유형"은 하나의 아민(-NH) 및 하나의 카르복실(-CO) 기, 하나의 알파 탄소, 및 각 아미노산 유형에 특이적인 하나의 R 기(측쇄)를 포함하거나, 하나의 아민(-NH2) 및 하나의 카르복실(-COOH) 기, 하나의 알파 탄소, 및 각 아미노산 유형에 특이적인 하나의 R 기(측쇄)를 포함하거나, 하나의 아민(-NH2) 및 하나의 카르복실(-CO) 기, 하나의 알파 탄소, 및 각 아미노산 유형에 특이적인 하나의 긴 R 기(측쇄)를 포함하거나, 하나의 아민(-NH) 및 하나의 카르복실(-COOH) 기, 하나의 알파 탄소, 및 각 아미노산 유형에 특이적인 하나의 R 기(측쇄)를 포함하는 유기 화합물을 지칭하거나, 아미노산 유형 프롤린을 설명하는, 아미노산 유형은 또한 하나의 이민(-NH) 및 하나의 카르복실(-COOH) 기, 하나의 알파 탄소, 및 각 아미노산 유형에 특이적인 하나의 R 기(측쇄)를 포함하거나, 하나의 이민(-NH) 및 하나의 카르복실(-CO) 기, 하나의 알파 탄소, 및 각 아미노산 유형에 특이적인 하나의 R 기(측쇄)를 포함하는 유기 화합물을 지칭한다. 아미노산 유형은 단백질 서열 내에 유리 아미노산 및 아미노산을 둘 다 포함한다. 단백질 서열 내의 아미노산은 대안적으로 아미노산 잔기 또는 잔기라고 할 수 있다. 아미노산 유형은 각 아미노산 유형에 특이적인 R-기(측쇄)에 의해 정의된다. 용어 아미노산 유형은 알라닌(A), 아르기닌(R), 아스파라긴(N), 아스파르트산(D), 시스테인(C), 글루탐산(E), 글루타민(Q), 글리신(G), 히스티딘(H), 이소류신(I), 류신(L), 리신(K), 메티오닌(M), 페닐알라닌(F), 피롤리신(O), 프롤린(P), 셀레노시스테인(U), 세린(S), 트레오닌(T), 트립토판(W), 티로신(Y) 및 발린(V)으로부터 선택된 단백질생성 아미노산, 또는, 작용기 아지드, 알킨, 알켄, 디엔, 아실, 요오도 및/또는 보론산을 함유하는 비-단백질생성 합성 아미노산을 포함하나 이에 제한되지 않는 비- 단백질생성 합성 아미노산을 지칭한다. 용어 "아미노산 유형"은 아미노산 유형의 변형된 아미노산, 비변형된 아미노산 및/또는 변형 및 비변형된 아미노산 둘 다의 조합을 포함한다. 일부 구현예에서, 용어 "아미노산 유형"은 아미노산 유형의 변형된 아미노산을 지칭한다. 일부 구현예에서, 용어 "아미노산 유형"은 아미노산 유형의 비변형된 아미노산을 지칭한다. 일부 구현예에서, 용어 "아미노산 유형"은 아미노산 유형의 변형 및 비변형된 아미노산의 조합을 지칭한다. 일부 구현예에서, 용어 "아미노산 유형"은 아미노산 유형의 비변형된 아미노산 및 아미노산 유형의 변형 및 비변형된 아미노산의 조합을 둘 다 지칭한다.
본원에 사용된 바와 같이, 용어 "R-기"는 각 아미노산 유형의 각 아미노산에 존재하는 측쇄를 지칭한다. R-기는 치환기; 아미노산의 알파 탄소 상의 하나 이상의 수소 원자를 대체하는 원자, 또는 원자의 그룹이다. 각 아미노산 유형의 R-기는 해당 아미노산 유형에 대해 고유하다. 본 발명에 의해 포함되는 각 아미노산 유형의 R-기는 표 2에 정의된다. 아미노산 유형은 비변형된(번역된 대로) 아미노산 유형 상에 존재하는 R-기에 의해 정의된다. R-기에 대한 후속 변형이 이루어지는 경우, 아미노산 유형은 변하지 않는다. 예를 들어, 시스테인(C) 아미노산 유형은 티올 R-기에 의해 정의된다. 이것은 시스테인 아미노산 유형의 비변형된 아미노산의 R-기(환원된 시스테인, CR)이다. 시스테인 아미노산 유형 내의 시스테인 아미노산의 서브세트는 번역 후 변형되어 시스테인 이황화(CD)를 형성할 수 있고, 이 시스테인 아미노산의 동일한 서브세트는 환원되어 환원된 시스테인(CR)을 형성할 수 있다. 아미노산 유형은 이들의 변환 동안 시스테인(C)으로 남아 있다. 이것은 번역 후 변형 또는 다른 변형이 가역적인지 비가역적인지에 관계 없이 해당된다.
본원에 사용된 바와 같이, "변형된 아미노산"은 단백질로 혼입된 후 화학적으로 변형된 아미노산 유형의 아미노산을 지칭한다. 일부 구현예에서, 효소는 이 화학적 변형을 수행한다. 일부 구현예에서, 변형된 아미노산은 번역 후 변형을 겪는다. 아미노산의 이러한 번역 후 변형의 예는 메틸화, 탈아민화, 탈아미드화, N-연결된 글리코실화, 이성질체화, 이황화-결합 형성, 술펜산, 술핀산 또는 술폰산으로의 산화, 팔미토일화, N-아세틸화(N-말단), S-니트로실화, 피로글루탐산으로의 고리화(N-말단), 감마-카르복실화, 이소펩티드 결합 형성, N-미리스토일화(N-말단), 인산화, 아세틸화, 유비퀴틴화, SUMO일화, 메틸화, 하이드록실화, 술폭사이드 또는 술폰으로의 산화, 하이드록실화, O-연결된 글리코실화, 모노- 또는 디-산화, 키누레닌의 형성, 및/또는 황산화를 포함하나 이에 제한되지 않는다. 예를 들어, 아미노산 유형 시스테인(C)의 아미노산은 번역 후 변형 동안 변형되어 이황화 결합 및 산화된 티올 R-기를 함유하는 시스테인 이황화(CD) 아미노산을 형성할 수 있다.
본원에 사용된 바와 같이, "비변형된 아미노산"은 단백질에 혼입된 후 화학적으로 변형되지 않은 아미노산 유형의 아미노산을 지칭한다. 예를 들어, 아미노산 유형 시스테인(C)의 비변형된 아미노산은 환원된 시스테인(CR)이며; 환원된 시스테인(CR)은 이황화 결합되지 않고 임의의 다른 번역 후 변형을 겪지 않고, 환원된 티올을 함유한다.
본원에 사용된 바와 같이, 용어 "2 개 이상의 아미노산 유형"은 적어도 2 개의 아미노산 유형을 지칭한다. 용어 "2 개 이상의 아미노산 유형"은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40 개의 아미노산 유형을 포함하나 이에 제한되지 않는다. 일부 구현예에서, 2 개의 아미노산 유형이 표지된다. 일부 구현예에서, 3 개의 아미노산 유형이 표지된다. 일부 구현예에서, 4 개의 아미노산 유형이 표지된다. 일부 구현예에서, 5 개의 아미노산 유형이 표지된다. 일부 구현예에서, 6 개의 아미노산 유형이 표지된다. 일부 구현예에서, 7 개의 아미노산 유형이 표지된다. 일부 구현예에서, 8 개의 아미노산 유형이 표지된다. 일부 구현예에서, 9 개의 아미노산 유형이 표지된다. 일부 구현예에서, 10 개의 아미노산 유형이 표지된다. 일부 구현예에서, 11 개의 아미노산 유형이 표지된다. 일부 구현예에서, 12 개의 아미노산 유형이 표지된다. 일부 구현예에서, 13 개의 아미노산 유형이 표지된다. 일부 구현예에서, 14 개의 아미노산 유형이 표지된다. 일부 구현예에서, 15 개의 아미노산 유형이 표지된다. 일부 구현예에서, 16 개의 아미노산 유형이 표지된다. 일부 구현예에서, 17 개의 아미노산 유형이 표지된다. 일부 구현예에서, 18 개의 아미노산 유형이 표지된다. 일부 구현예에서, 19 개의 아미노산 유형이 표지된다. 일부 구현예에서, 20 개의 아미노산 유형이 표지된다. 일부 구현예에서, 21 개의 아미노산 유형이 표지된다. 일부 구현예에서, 22 개의 아미노산 유형이 표지된다. 일부 구현예에서, 23 개의 아미노산 유형이 표지된다. 일부 구현예에서, 24 개의 아미노산 유형이 표지된다. 일부 구현예에서, 25 개의 아미노산 유형이 표지된다. 일부 구현예에서, 26 개의 아미노산 유형이 표지된다. 일부 구현예에서, 27 개의 아미노산 유형이 표지된다. 일부 구현예에서, 28 개의 아미노산 유형이 표지된다. 일부 구현예에서, 29 개의 아미노산 유형이 표지된다. 일부 구현예에서, 30 개의 아미노산 유형이 표지된다. 일부 구현예에서, 31 개의 아미노산 유형이 표지된다. 일부 구현예에서, 32 개의 아미노산 유형이 표지된다. 일부 구현예에서, 33 개의 아미노산 유형이 표지된다. 일부 구현예에서, 34 개의 아미노산 유형이 표지된다. 일부 구현예에서, 35 개의 아미노산 유형이 표지된다. 일부 구현예에서, 36 개의 아미노산 유형이 표지된다. 일부 구현예에서, 37 개의 아미노산 유형이 표지된다. 일부 구현예에서, 38 개의 아미노산 유형이 표지된다. 일부 구현예에서, 39 개의 아미노산 유형이 표지된다. 일부 구현예에서, 40 개의 아미노산 유형이 표지된다.
본원에 사용된 바와 같이, 용어 "표지" 또는 "표지된"은 샘플 내에서 아미노산 유형의 검출 및/또는 식별을 돕기 위해 아미노산 유형 내의 아미노산에 첨가, 삽입, 부착, 경계 형성, 또는 결합된 태그, 식별자, 또는 프로브를 지칭한다. 예를 들어, 표지는 형광단, 동위원소, 또는 탠덤 질량 태그를 포함할 수 있다. 일부 구현예에서, 표지는 신호를 제공한다. 일부 구현예에서, 표지는 형광 표지이다. 일부 구현예에서, 표지는 형광생성 염료, 또는 아미노산 유형과 반응 시 형광이 되는 분자이다. 일부 구현예에서, 표지는 아미노산 유형 내의 아미노산에 공유적으로 결합된다. 일부 구현예에서, 표지는 아미노산 유형 내의 아미노산의 R-기에 공유적으로 결합된다.
본원에 사용된 바와 같이, 용어 "신호"는 정보를 전달하는 발생을 지칭한다. 일부 구현예에서, 신호는 정보를 전달하는 시간-가변성 발생이다. 표지의 신호는 단일 시점에서 판독할수 있거나, 표지의 신호는 시간의 함수로서 판독할 수 있다. 일부 구현예에서, 표지는 형광 표지이고 표지의 신호는 형광 강도이다.
본원에 사용된 바와 같이, 용어 "발광"은 열을 발생하지 않는 물질에 의한 빛의 자발적인 방출을 지칭한다. 일부 구현예에서, 표지는 발광 표지이고 표지의 신호는 발광 신호이다. 광발광(형광 포함), 화학발광(생물발광 포함), 전기발광, 방사선발광, 및 열발광을 포함하나 이에 제한되지 않는 여러 유형의 발광이 있다. 광발광은 광자의 흡수 결과이다. 나노초의 전형적인 수명을 갖는 일중항-일중항 전자 이완의 결과로서 광발광인 형광을 포함하는 여러 유형의 광발광이 있다. 인광은 밀리초 내지 시간의 전형적인 수명을 갖는 삼중항-일중항 전자 이완의 결과인 또 다른 유형의 광발광이다. 화학발광은 화학적 반응의 결과로서 빛의 방출이다. 생물발광은 살아있는 유기체에서 생화학 반응의 결과인 화학발광 형태이다. 전기화학발광은 전기화학 반응의 결과이다. 전자발광은 물질을 통과하는 전류의 결과이다. 음극선발광은 전자에 의해 부딪치는 발광 물질의 결과이다. 음발광은 소리에 의해 여기될 때 액체 내 기포 폭발의 결과이다. 방사성 발광은 이온화 방사선에 의한 충격의 결과이다. 열발광은 물질이 가열될 때 흡수된 에너지의 재방출이다. 극저온 발광은 물체가 냉각될 때 빛의 방출이다.
본원에 사용된 바와 같이, 용어 "교정 곡선" 또는 용어 "표준"은 알려지지 않은 샘플을 알려진 농도의 표준 샘플 세트, 또는 하나의 표준 샘플과 비교함으로써 알려지지 않은 샘플에서 물질의 농도를 결정하기 위한 일반적인 분석 화학 방법을 지칭한다. 알려지지 않은 샘플이 표준 샘플 세트와 비교되는 경우, "교정 곡선"이 사용된다. 알려지지 않은 샘플이 단일 표준 샘플과 비교되는 경우, 용어 "표준"이 사용된다. 교정 곡선 또는 표준은 알려진 아미노산 농도와 관심 단백질에 대한 2 개 이상의 아미노산 유형 각각의 측정된 표지(예를 들어 표지의 신호) 사이를 전환하거나, 동일한 2 개 이상의 아미노산 유형의 측정된 표지(예를 들어 표지의 신호)와 샘플에서 각 아미노산 유형의 아미노산 농도 사이를 전환하는 데 사용된다. 아미노산 유형에 대한 교정 곡선은 아미노산 유형의 여러 알려진 아미노산 농도에 대해 수집된 데이터(표지의 신호)를 지칭하고, 표준은 아미노산 유형의 하나의 알려진 아미노산 농도에 대해 수집된 데이터(표지의 신호)를 지칭한다. 교정 함수 또는 (스칼라) 교정 계수는 교정 곡선 또는 표준으로부터 계산된다.
본원에 사용된 바와 같이, 용어 "부분"은 샘플에서 아미노산 유형의 모든 아미노산보다 작은, 즉, 샘플에서 아미노산 유형의 아미노산의 100% 미만인 아미노산 유형의 임의의 아미노산 수를 지칭한다. 용어 "부분"은 또한 예를 들어 표 4에 제공된 규칙에 따라, 표지와 반응하는 아미노산 유형의 아미노산 모든 서브세트보다 작은 아미노산 유형의 임의의 아미노산 수(예를 들어 아미노산 유형의 비변형된 아미노산)를 지칭한다. 용어 "부분"은 샘플에서 표지되는 각 아미노산 유형의 아미노산의 약 50%, 약 51%, 약 52%, 약 53%, 약 54%, 약 55%, 약 56%, 약 57%, 약 58%, 약 59%, 약 60%, 약 61%, 약 62%, 약 63%, 약 64%, 약 65%, 약 66%, 약 67%, 약 68%, 약 69%, 약 70%, 약 71%, 약 72%, 약 73%, 약 74%, 약 75%, 약 76%, 약 77%, 약 78%, 약 79%, 약 80%, 약 81%, 약 82%, 약 83%, 약 84%, 약 85%, 약 86%, 약 87%, 약 89%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99%를 포함하나 이에 제한되지 않는다. 일부 구현예에서, 부분은 샘플에 존재하는 특정 아미노산 유형의 아미노산의 약 50%이다. 일부 구현예에서, 부분은 샘플에 존재하는 특정 아미노산 유형의 아미노산의 약 60%이다. 일부 구현예에서, 부분은 샘플에 존재하는 특정 아미노산 유형의 아미노산의 약 70%이다. 일부 구현예에서, 부분은 샘플에 존재하는 특정 아미노산 유형의 아미노산의 약 80%이다. 일부 구현예에서, 부분은 샘플에 존재하는 특정 아미노산 유형의 아미노산의 약 90%이다.
본원에 사용된 바와 같이, 용어 "측정하는 것"은 검출 및 정량화를 지칭한다. 일부 구현예에서, 측정하는 것은 신호를 측정하는 것을 포함한다.
본원에 사용된 바와 같이, 용어 "아미노산 수"는 분자 당 특정 아미노산 유형의 아미노산 수를 지칭한다. 샘플에서 각 표지된 유형의 아미노산 수를 결정하기 위해, 샘플에서 아미노산 유형의 아미노산 농도를 샘플의 몰 단백질 농도로 나눈다. 관심 단백질, 또는 참조에서 아미노산 유형의 아미노산 수를 결정하기 위해, 아미노산 유형의 아미노산 수는 관심 단백질의 단백질 서열로부터 계산되거나, 이전에 결정되었고 예를 들어 데이터베이스를 통해 액세스가능하다. 대안적으로, 관심 단백질에서 아미노산 유형의 아미노산 수는 알려진 단백질 농도로 관심 단백질에서 아미노산 유형을 표지화하고, 표지를 측정하고, 측정된 표지를 본원에 개시된 방법을 사용하여 아미노산 농도로 전환하고 아미노산 유형의 아미노산 농도를 관심 단백질의 몰 단백질 농도로 나눔으로써 결정될 수 있다. 예를 들어, 리신이 표지되는 아미노산 유형이고 샘플에서 단백질 분자 당 54 개의 리신이 있는 경우, 리신의 아미노산 유형의 아미노산 수는 54이다. 아미노산 유형의 아미노산 수는 샘플을 함유하는 용액에서 아미노산 유형의 총 아미노산 수를 지칭하지 않는다. 예를 들어, 샘플에 10000 개의 단백질 분자가 있고, 각 단백질 분자가 54 개의 리신 아미노산을 함유하는 경우, 리신 아미노산 유형의 아미노산 수는 540000이 아니라 54이다.
본원에 사용된 바와 같이, 용어 "배경 보정" 또는 "배경 보정된"은 관심 아미노산 유형의 아미노산에 첨가, 삽입, 부착, 경계 형성, 결합 또는 공유적으로 결합되지 않은 용액에서 유리 표지로부터의 임의의 신호, 비-특이적 표지화, 세포 자가형광과 같이 측정되는 총 표지에 달리 기여하는 신호의 다른 공급원을 배제하도록 보정된 각 표지된 아미노산 유형의 측정된 표지를 지칭한다. 이것은 당업계의 표준 수단에 의해 달성된다.
본원에 사용된 바와 같이, 용어 "벌크(bulk)"는 일반적으로 수백 마이크로미터 이하의 치수를 갖는 채널 내에서 샘플을 제한하지 않고 수행되는 연구를 지칭한다. 고전적으로, 벌크 연구는 소량(피코리터 내지 나노리터)의 유체의 조작을 수반하지 않고, 유체는 격렬할 뿐만 아니라 확산적으로 혼합된다. 벌크 연구는 예를 들어 펌프 또는 로봇에 의한 유체의 자동화된 조작을 포함한다. 벌크 연구는 많은 반응 및/또는 측정을 병렬로 수행하기 위한 샘플 저장소를 갖는 플레이트에서 샘플을 분석하는 것을 수반할 수 있으며, 플레이트 판독기 또는 유사한 기기를 사용하는 것을 수반할 수 있다. 일반적으로, 벌크 연구는 단일 단백질 분자를 검출하는 것을 추구하지 않는다.
본원에 사용된 바와 같이, 용어 "용액 상"은 용액에서 수행되고 측정되는 연구를 지칭한다. 용액 상은 변환 내부 반사 형광(TIRF) 현미경과 같이, 표면 상에서 측정을 필요로 하는 방법을 배제한다. 용액 상은 샘플 내의 단백질이 표면 내의 합성 또는 천연 기공을 통과해야 하는 방법을 배제한다. 예를 들어, 용액 상은 표면 내의 작은 채널인 나노기공을 혼입하는 방법을 배제하고, 지질 막 내에 함침된 막관통 단백질인 생물학적 나노기공을 혼입하는 방법을 배제한다.
본원에 사용된 바와 같이, 용어 "디콘볼루트(deconvolute)"는 다중 구성요소로부터 파생된 신호가 각 구성요소로부터의 부분을 나타내도록 분석되거나 변환되는 과정을 지칭한다. 일부 구현예에서, 시간-분해 신호가 2 개의 구성요소로부터 파생되고 2 개의 분리된 피크가 있는 경우, 신호는 1 개 피크의 분석이 약 1 개 구성요소에 대한 정보를 제공하고 다른 피크의 분석이 다른 구성요소에 대한 정보를 제공하도록 역학적으로 디콘볼루션될 수 있다. 예를 들어, 역학적 디콘볼루션은 표지가 형광 표지이고 2 개 이상의 아미노산 유형이 동일한 조건 하에 동일한 형광 표지로 표지되지만, 표지화 반응이 상이한 속도로 진행되는 경우 사용될 수 있어서, 특정 시간에 표지의 신호를 측정하는 것이 배타적으로 하나의 아미노산 유형에 대한 정보를 제공하고, 또 다른 시간에 표지의 신호를 측정하는 것이 배타적으로 또 다른 아미노산 유형에 대한 정보를 제공하도록 한다. 대안적으로, 신호가 2 개의 구성요소로부터 파생되고 1 개의 구성요소가 알려진 경우, 신호를 변환하여 알려진 구성요소를 제거하고 알려지지 않은 구성요소에 대한 정보만 나타낼 수 있다.
본원에 사용된 바와 같이, 용어 "디콘볼루션 표준"은 2 개의 아미노산 유형이 동일한 조건 하에 동일한 표지로 표지되는 경우 수득된 신호를 디콘볼루션하는 데 사용되는 샘플에서 표지되고 측정된 2 개 이상의 아미노산 유형의 알려진 아미노산 농도의 단백질을 지칭한다. 디콘볼루션 표준은 상이한 여기 및 방출 파장에서 측정되어, 각 파장에서 각 표지된 아미노산 유형의 기여도를 디콘볼루션하고 샘플에서 각 표지된 아미노산 유형의 신호를 분리할 수 있다. 디콘볼루션 표준은 상기 논의된 "교정 곡선 또는 표준"이 아니다.
본원에 사용된 바와 같이, 용어 "단백질 서열분석"은 단백질, 펩티드, 올리고펩티드, 또는 폴리펩티드의 아미노산 서열을 결정하는 것을 지칭한다. 단백질 서열분석은 아미노산 쇄의 한쪽 말단에서 시작하고, 아미노산 쇄를 따라, 한번에 하나의 아미노산으로 이동하면서, 아미노산 서열을 따라 단일 아미노산을 연속적으로 판독하고 식별하는 것을 수반한다. 단백질 서열분석은 단백질 내에서 아미노산의 위치를 결정한다. 예를 들어, Edman 분해는 단백질 서열분석의 통상적인 방법이다.
본원에 사용된 바와 같이, 용어 "n-차원 공간"은 수학적 공간을 지칭하며 여기서 n은 내부의 임의의 점을 명시하는 데 필요한 좌표의 최소 수이다. n-차원 공간 내에, n-차원의 정보가 있다. 차원 정보는 표지되는 아미노산 유형의 수이다. 예를 들어, 3 차원 정보는 표지되는 3 개의 아미노산 유형을 지칭하며 3-차원 공간을 필요로 한다. 일부 구현예에서, n-차원 공간은 n 개의 아미노산 유형에 대한 표지 값, 아미노산 농도, 또는 아미노산 수를 표시하는 데 사용된다. n-차원 공간에는, 임의의 벡터를 명시하는 데 필요한 n 개의 좌표가 있다.
본원에 사용된 바와 같이, 용어 "참조"는 샘플의 값이 비교되는 것에 대한 표준 또는 대조군 값이다. 참조는 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 및/또는 아미노산 농도, 및/또는 아미노산 수를 나타내는 정보를 포함할 수 있다. 참조는 하나 이상의 단백질 농도에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체 하위단백체 또는 단백체의 2 개 이상의 아미노산 유형의 알려진 표지 값(예를 들어 신호, 예를 들어 형광 강도) 또는 아미노산 농도, 또는, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체의 아미노산 서열 또는 서열들에서 2 개 이상의 아미노산 유형의 아미노산 수를 포함할 수 있다. 2 개 이상의 아미노산 유형은 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형이다. 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조는 샘플 내에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 데 사용된다. 일부 구현예에서, 참조는 단백체, 하위단백체 또는 단백질의 혼합물에 걸친 각 단백질의 부분에 의해 가중된 단백체 또는 하위단백체의 모든 아미노산 서열에 걸친 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수의 가중 평균이다. 일부 구현예에서, 참조는 데이터베이스에 저장되고, 이로부터 액세스/수득된다. 일부 구현예에서, 참조는 실험적으로 결정된다. 일부 구현예에서, 참조는 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체의 아미노산 서열 또는 서열들로부터 계산된다. 일부 구현예에서, 참조를 생성하는 것은 다양한 단백질의 공개적으로 이용가능한 아미노산 서열을 액세스하고 성숙한 단백질에서 생물학적으로 절단되는 서열의 일부를 제거하는 것을 포함한다. 일부 구현예에서, 참조를 생성하는 것은 임의적으로 아미노산 유형의 아미노산 수로부터 아미노산 유형에 대한 표지와 반응하지 않을 번역 후 변형된 아미노산을 제거하기 위해 표 4에 요약된 규칙에 적용하여 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열 또는 아미노산 서열들 내의 샘플에서 표지된 것과 동일한 2 개 이상의 아미노산 유형의 아미노산 수를 결정하는 것을 포함한다. 일부 구현예에서, 참조는 본원에 개시된 방법을 사용하여, 즉, 2 개 이상의 아미노산 유형을 표지화하고, 표지를 측정하고 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 각 아미노산 유형의 아미노산 수 또는 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 샘플에서 각 아미노산 유형의 아미노산의 농도를 결정하기 위해 측정된 표지를 사용하여 결정된다. 일부 구현예에서, 참조는 농도의 공통 파라미터에 따라 파라미터 방정식 세트 또는 벡터 함수로서 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도를 제공한다. 다른 구현예에서, 참조는 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 아미노산 수를 제공한다. 일부 구현예에서, 참조는 본 발명의 방법을 사용하여 알려지거나 결정된 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체에 대한 농도 범위를 포함한다. 일부 구현예에서, 이러한 알려진 농도 범위는 참조를 포함하는 함수 또는 함수들에 대한 한계로서 사용된다. 일부 구현예에서, 참조는 관찰된 실험적 오류율을 혼입하는 정보와 같은 추가적인 정보를 포함한다. 일부 구현예에서, 참조는 자연에서 관찰된 많은 데이터세트 내의 선행 자릿수의 빈도 분포를 제공하는 Benford의 법칙으로부터 파생된 정보를 포함한다.
본원에 사용된 바와 같은 용어 "단일 참조"는 평균 조성에 기초하여 관심 단백체 및/또는 하위단백체를 고유하게 식별하는 관심 단백체 및/또는 하위단백체에 대해 제공된 참조를 지칭한다. 많은 개별 단백질이 관심 단백체 및/또는 하위단백체에 함유될 수 있지만, 관심 단백체 및/또는 하위단백체를 식별하기 위해 관심 단백체 및/또는 하위단백체 내에 함유된 각 단백질에 대한 참조로서 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수를 제공할 필요는 없다. 예를 들어, 관심 단백체가 700 개의 단백질 함유하는 경우, 관심 단백체 및/또는 하위단백체 내에 함유된 모든 700 개의 단백질에 대한 참조로서 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수를 제공할 필요는 없다. 대신에, 관심 단백체 및/또는 하위단백체에 대해 제공된 단일 참조는 관심 단백체 및/또는 하위단백체의 평균 서명을 제공하여, 식별을 허용한다. 예를 들어, 혈장에서 관심 결장직장암 단백체에 대한 단일 참조는 단지 혈장 용액 내의 2 개 이상의 아미노산 유형을 표지화 및 측정하고 측정된 표지 값으로부터 계산된 측정된 표지 값 또는 아미노산 농도를 단일 참조에 의해 제공된 값과 비교하는 것을 통해 혈장으로부터 관심 결장직장암 단백체의 식별을 허용한다. 관심 결장직장암 단백체 및/또는 하위단백체의 존재 및/또는 농도 및/또는 양을 검출하기 위해 관심 결장직장암 단백체 및/또는 하위단백체 내의 개별 단백질 및/또는 바이오마커를 측정할 필요는 없다. 관심 단백체 및/또는 하위단백체가 식별되고 농도/양이 내부의 단일 단백질을 측정하려는 임의의 필요조건 없이 결정된다. 관심 단백체 및/또는 하위단백체에 대한 단일 참조는 본 발명의 방법을 사용하여 이론적으로 또는 실험적으로 계산될 수 있고 예를 들어 본원에 기재된 벡터 함수 또는 파라미터 방정식 세트 중 하나에 의해 설명될 수 있는 관심 단백체 및/또는 하위단백체의 총 단백질 농도의 대수 함수이다.
본원에 사용된 바와 같이, 용어 "환원된 시스테인"(CR)은 아미노산 유형 시스테인(C)의 비변형된 아미노산을 지칭하며, 환원된 티올 R-기를 갖는다. 환원된 시스테인은 비변형되는 데, 번역 후 변형 동안 이황화 결합되지 않고 술펜산, 술핀산 또는 술폰산으로의 산화, 팔미토일화, 또는 S-니트로실화와 같은 티올 R-기의 임의의 다른 번역 후 변형을 겪지 않기 때문이다. 용어 "환원된 시스테인"(CR)은 당업계에 알려진 용어 "유리 시스테인"과 동등하다.
본원에 사용된 바와 같이, 용어 "시스테인 이황화"(CD)는 아미노산 유형 시스테인(C)의 변형된 아미노산을 지칭하며, 여기서 티올 R-기는 또 다른 티올 R-기와의 산화적 커플링 반응을 거쳐 이황화 결합을 형성한다. 시스테인 이황화(CD)는 산화된 티올 R-기를 갖는다. 시스테인 이황화(CD)는 아미노산 유형 시스테인(C)의 가역적 번역 후 변형 유형이다. 시스테인 이황화의 수는 이황화 결합에 관여된 시스테인 아미노산의 수를 지칭하며, 하나의 이황화 결합이 2 개의 시스테인 아미노산을 포함하기 때문에 이황화 결합에 관여된 시스테인 이황화 수의 ½인 이황화 결합의 수가 아니다.
본원에 사용된 바와 같이, 용어 "시스테인"(C)은 시스테인(CR)의 비변형된 아미노산, 시스테인(CD)의 변형된 아미노산 및/또는 시스테인의 비변형 및 변형된 아미노산의 조합을 지칭한다. 변형 및 비변형된 시스테인 아미노산을 둘 다 표지하기 위해, 먼저 시스테인 이황화(CD) 아미노산이 환원된 시스테인(CR)으로 화학적으로 환원되어, 표지와 반응할 수 있게 한다.
본원에 사용된 바와 같이, 용어 "분류기"는 분류를 구현하는 알고리즘을 지칭한다. 분류는 범주 신분이 알려진 관측치를 함유하는 훈련 데이터 세트에 기반하여, 새로운 관측치가 속하는 범주의 식별이다. 용어 "분류기"는 느긋 학습(사례-기반 학습) 및 열심 학습을 둘 다 사용하는 것을 포함하여, 예 입력-출력 쌍에 기반한 입력 대 출력을 맵핑하는 함수를 학습하기 위해 지도식 학습을 사용하는 기계 학습 분류기를 포함한다. 예를 들어, 분류기는 k-최근접 이웃 분류기(느긋 학습) 및/또는 서포트 벡터 머신(열심 학습)를 기재한다. 분류기는 본원에 기재된 방법의 비교 단계에서 사용될 수 있다.
본원에 사용된 바와 같이, 용어 "중복"은 하나 초과의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체가 동일한 참조를 갖거나, 하나 초과의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조가 2 개 이상의 아미노산 유형의 표지 값, 2 개 이상의 아미노산 유형의 아미노산 농도 또는 아미노산 수의 비교에 기반하여 구별할 수 없는 드문 경우를 지칭한다. 이것은 하나의 관심 단백질에서 2 개 이상의 아미노산 유형의 아미노산 수가 또 다른 관심 단백질에서 동일한 2 개 이상의 아미노산 유형의 아미노산 수와 동일하거나, 이의 배수이기 때문에 발생한다. 참조는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 또는 60 개의 중복을 가질 수 있지만, 1 개 초과의 중복은 드물다. 2 개의 관심 단백질이 동일한 참조를 갖고, 이 참조가 샘플 내에서 식별되는 경우, 샘플은 이들 2 개의 관심 단백질 중 어느 하나를 함유하는 것으로 식별된다. 샘플에서 식별된 참조의 단백질 농도를 두 관심 단백질의 알려진 생물학적 관련 농도 범위와 비교하는 것과 같이, 샘플 내에 존재하는 관심 단백질을 고유하게 식별하고 이 효과를 제거하는 다수의 접근법이 있다. 샘플은 생물학적으로 관련된 농도 범위 내에 있는 관심 단백질을 함유하는 것으로 식별된다.
명료성 및 설명을 위해, 방법은 관심 단백질 또는 단백체의 맥락에서 기재된다. 그러나, 문맥으로부터 달리 명시되거나 명확하지 않는 한, 본 발명의 방법은 일반적으로, 추가로, 또는 대안적으로, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 적용가능한 것으로 이해되어야 한다.
샘플
본 방법에서 활용되는 샘플은 표준 방법론을 사용하여 대상체로부터 수득되었다. 바람직하게는, 샘플은 체액 샘플, 조직 샘플, 토양 샘플, 물 샘플, 환경적 샘플, 농작물 샘플, 식품 샘플, 음료 샘플 또는 실험실 샘플이다.
본 발명에 의해 포함되는 체액 샘플은 전혈 샘플, 혈청 샘플, 혈장 샘플, 샐비어(salvia) 샘플, 가래 샘플, 대변 샘플, 소변 샘플, 정액 샘플, 비강 면봉 샘플, 비인두 흡인물 샘플, 인후 면봉, 또는 하기도 샘플, 예컨대 하기도 점액 흡인물 샘플, 뇌척수(CSF) 샘플, 성 건강 샘플, 예컨대 요도 면봉, 자궁경부 면봉, 질 면봉 또는 직장 면봉을 포함하나 이에 제한되지 않는다. 대안적으로, 샘플은 당업계에 알려진 임의의 다른 체액을 함유할 수 있다. 일부 구현예에서, 체액 샘플은 병변에 의해 생성된 임의의 유형의 체액이다. 일부 구현예에서, 샘플은 혈장 샘플이다. 일부 구현예에서, 샘플은 혈소판 부족 혈장(PPP) 샘플이다. 일부 구현예에서, 샘플은 혈소판 풍부 혈장(PPP) 샘플이다. 일부 구현예에서, 샘플은 혈소판 샘플이다. 일부 구현예에서, 샘플은 혈장 엑소좀 샘플이다. 일부 구현예에서, 샘플은 혈액 세포 샘플이다. 일부 구현예에서, 혈액 세포 샘플은 림프구 샘플 또는 골수 세포 샘플이다. 일부 구현예에서, 샘플은 소변 샘플이다.
대안적으로, 샘플은 조직 샘플일 수 있다. 바람직하게는, 조직 샘플은 임의의 관심 조직 유형의 생검이다. 예를 들어, 조직 샘플은 고형 종양의 생검일 수 있다. 이는 예를 들어, 육종, 림프종, 암종 및 흑색종을 포함한다.
대안적으로, 샘플은 환경적 샘플일 수 있다. 바람직하게는, 환경적 샘플은 물 샘플, 예컨대 음용수 샘플 또는 폐수 샘플이다. 일부 구현예에서, 샘플은 생물학전이 의심되는 샘플이다.
대안적으로, 샘플은 예를 들어 식품 산업에서 식품 샘플일 수 있다. 예를 들어, 본 발명은 예를 들어 치즈 제조에서 박테리아 성장 및 조성에 대해 식품 샘플을 테스트하거나, 글루텐의 강도를 평가하는 것을 통해서와 같이 빵 제조에서 밀가루 및 빵 품질에 대해 테스트하거나, 발효제의 양을 정량화하거나(예를 들어, 콤부차가 섭취하기에 안전한지 보장하기 위해 이에 있는 박테리아의 양을 식별 및 정량화), 요구르트를 테스트하거나, 샤워도우(sourdough) 모체 배양을 테스트하는 데 사용될 수 있다. 바람직하게는, 식품 샘플은 알레르겐을 함유하는 것으로 의심된다.
일부 구현예에서, 샘플은 알레르겐을 함유하는 것으로 의심될 수 있다. 바람직하게는, 알레르겐은 땅콩, 글루텐, 락토스, 꽃가루 또는 먼지 진드기, 먼지, 카세인, 리포칼린, c-형 리소자임, 프로테아제 억제제, 트로포미오신, 파브알부민, 고양이 비듬, 개 비듬이다.
대안적으로, 샘플은 음료 샘플 예컨대 우유 샘플, 물 샘플 또는 과일 주스 샘플일 수 있다. 예를 들어, 본 발명의 방법은 우유의 호르몬 구성요소의 화학적 서명을 측정하거나, 박테리아 오염에 대한 비살균처리된 우유 또는 과일 주스를 평가하기 위해 농업 산업에서 사용될 수 있다.
일부 구현예에서, 샘플은 체액 샘플(예를 들어 전혈 샘플, 혈청 샘플, 혈장 샘플, 샐비어 샘플, 가래 샘플, 대변 샘플, 소변 샘플, 정액 샘플, 비강 면봉 샘플, 비인두 흡인물 샘플, 인후 면봉, 또는 하기도 샘플, 예컨대 하기도 점액 흡인물 샘플, 뇌척수(CSF) 샘플, 성 건강 샘플, 예컨대 요도 면봉, 자궁경부 면봉, 질 면봉 또는 직장 면봉, 또는 병변에 의해 생성된 임의의 유형의 유체), 조직 샘플, 토양 샘플, 환경적 샘플(예를 들어 물 샘플 예컨대 음용수 샘플 또는 폐수 샘플; 또는 생물학전이 의심되는 샘플), 식품 샘플(예를 들어 땅콩, 글루텐, 락토스 또는 꽃가루, 카세인, 리포칼린, c-형 리소자임, 프로테아제 억제제, 트로포미오신, 파브알부민, 고양이 비듬 및/또는 개 비듬과 같은 알레르겐을 함유하는 것으로 의심되는 것, 또는 기능성 식품 샘플) 또는 음료 샘플(예를 들어 우유, 물, 과일 주스)이다.
일부 구현예에서, 단백질은 원심분리, 여과, 추출, 침전 및 분화 가용화, 초원심분리, 크기 배제 크로마토그래피, 전하 또는 소수성에 기반한 분리(예는 소수성 상호작용 크로마토그래피, 이온 교환 크로마토그래피, 및/또는 자유 유동 전기영동 포함), 및/또는 친화성 크로마토그래피 예컨대 면역친화성 크로마토그래피 또는 고성능 액체 크로마토그래피(HPLC)와 같이 당업계의 표준 기술을 사용하여 샘플로부터 단리된다. 샘플 내의 단백질은 일단 단리되면 또한 농축될 수 있다. 이는 동결건조 또는 한외여과를 수반할 수 있으나 이에 제한되지 않는다. 예를 들어, 샘플이 타액 샘플이고, 바이러스 또는 박테리아의 존재가 샘플에서 검출되는 경우, 샘플 내 바이러스 및 박테리아 단백질은 원심분리에 의해 샘플 내 인간 단백질로부터 분리된다. 원심분리 후, 펠릿은 상청액 내에 존재하는 인간 단백질 없이 샘플에 존재하는 바이러스 및 박테리아에 상응한다. 또 다른 예에서, 샘플이 고형 조직 샘플이고, 바이러스 또는 박테리아의 존재가 샘플에서 검출되는 경우, 샘플 내 바이러스 및 박테리아 단백질은 조직 샘플을 동결시키고, 샘플을 분쇄하고 조직으로부터 단백질을 완충액으로 추출함으로써 샘플에서 인간 단백질로부터 분리된다. 조직 샘플로부터 단백질을 추출하기 위한 당업계의 표준인 이들 기술의 예는 January Ericsson, C. Protein Extraction from Solid Tissue. 2011. Methods in molecular biology(Clifton, N.J.) 675:307-12. DOI: 10.1007/978-1-59745-423-0_17에 의해 제공된다.
샘플은 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 또는 단백체의 존재를 함유하는 것으로 의심될 수 있다. 일부 구현예에서, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 또는 단백체는 샘플에서 다른 단백질로부터 단리된다.
관심 단백질
"관심 단백질"은 본 출원 전반에 걸쳐 언급되지만, 용어 "관심 단백질"은 예로서 제공되고 샘플 내에서 존재 및/또는 농도 및/또는 양이 테스트되는 관심 펩티드, 관심 올리고펩티드, 관심 폴리펩티드, 관심 단백체 복합체, 관심 하위단백체, 또는 관심 단백체, 또는 이의 조합으로 대체될 수 있다. 용어의 이러한 일반적인 의미에서, "관심 단백질"은 샘플에 있는 것으로 의심되고, 관심 단백질이 샘플 내에 있다는 가설은 본 발명의 방법을 통해 테스트된다.
일부 구현예에서, 관심 단백체는 각각 바이러스 감염, 박테리아 감염, 진균 감염 또는 기생충 감염을 유발하는 것으로 의심되는 바이러스 단백체, 박테리아 단백체, 진균 단백체 또는 기생충 단백체이다. 예를 들어, 일부 구현예에서, 대상체는 말라리아에 걸린 것으로 의심되고 관심 단백체는 피. 팔시파룸(P. falciparum), 피. 말라리아에(P. malariae), 피. 오발레(P. ovale), 피. 비박스(P. vivax) 및 피. 노울레시(P. knowlesi) 단백체를 포함한다. 이러한 기생충은 말라리아의 알려진 원인 인자이다. 혈액 샘플과 같은 샘플은 말라리아에 걸린 것으로 의심되는 대상체로부터 수득되고, 기생충 단백체는 여과를 사용하여 혈액으로부터 분리된다. 혈액 샘플로부터 단리된 기생충 단백질은 말라리아의 진단을 확인하고 대상체의 샘플에서 말라리아를 유발하는 특정 기생충을 식별하기 위해 피. 팔시파룸, 피. 말라리아에, 피. 오발레, 피. 비박스 및 피. 노울레시 단백체 중 임의의 하나의 존재에 대해 테스트된다.
일부 구현예에서, 관심 단백체는 바이러스 단백체이다. 예를 들어, 일부 구현예에서, 대상체는 마른 기침, 피로, 근육통 및 발열 증상을 보이므로, 대상체는 인플루엔자 또는 코로나바이러스에 걸린 것으로 의심된다. 혈액 샘플, 비강 면봉, 비인두 흡인물 또는 하기도 점액 흡인물 샘플과 같은 샘플은 대상체로부터 수득되고 샘플은 대상체에서 증상을 유발하는 바이러스를 식별하여 대상체가 걸린 감염을 식별하기 위해 인플루엔자 단백체, 예를 들어 인플루엔자 A H1N1 단백체, 및/또는 코로나바이러스 단백체, 예를 들어 SARS-CoV-2(Covid-19) 단백체의 존재에 대해 테스트된다.
일부 구현예에서, 관심 단백체는 인간 단백체이다. 일부 구현예에서, 관심 단백체는 인간 혈장 단백체이다. 일부 구현예에서, 인간 혈장 단백체의 알부민 분획은 방법의 나머지 단계 전에 제거된다. 일부 구현예에서, 인간 혈장 단백체의 알부민 및 글로불린 분획은 방법의 나머지 단계 전에 제거된다. 대안적인 구현예에서, 인간 혈장 단백체의 알부민 분획은 방법의 나머지 단계 전에 제거되지 않는다. 일부 구현예에서, 인간 혈장 단백체의 알부민 및 글로불린 분획은 방법의 나머지 단계 전에 제거되지 않는다. 일부 구현예에서, 인간 혈장 단백체의 알부민 및 글로불린 분획은 방법의 나머지 단계 전에 알부민 및 글로불린과 같은 고분자량 단백질을 제거하는 원심 여과 단계를 사용하여 방법의 나머지 단계 전에 제거된다. 일부 구현예에서, 관심 단백체는 특이적 샘/조직의 다음 인간 단백체: 인간 눈 단백체, 망막, 심장, 골격근, 평활근, 부신, 부갑상선, 갑상선, 뇌하수체, 폐, 골수, 림프 조직, 간, 담낭, 고환, 부고환, 전립선, 정낭, 정관, 지방질 조직, 뇌, 타액선, 식도, 혀, 위, 장, 췌장, 신장, 방광, 유방, 질, 자궁경부, 자궁내막, 나팔관, 난소, 태반, 피부, 혈액, 또는 이의 임의의 조합 중 하나 이상이다. 관심 단백체는 또한 인간 대사 단백체 및/또는 인간 분비 단백체를 포함할 수 있다.
일부 구현예에서, 관심 단백체는 하위단백체일 수 있다. 예를 들어, 하나 이상의 인간 암 하위단백체는 인간 췌장암 하위단백체, 인간 신경교종 하위단백체, 인간 두경부암 하위단백체, 인간 갑상선암 하위단백체, 인간 폐암 하위단백체, 인간 간암 하위단백체, 인간 고환암 하위단백체, 인간 전립선암 하위단백체, 인간 위암 하위단백체, 인간 결장/직장 암 하위단백체, 인간 유방암 하위단백체, 인간 자궁내막암 하위단백체, 인간 난소암 하위단백체, 인간 자궁경부암 하위단백체, 인간 신장암 하위단백체, 인간 비뇨기 및 방광암 하위단백체, 인간 흑색종 하위단백체 및 이의 임의의 조합으로부터 선택된다. 다음 하위단백체가 또한 관심 대상일 수 있다: 인간 I형 진성 당뇨병 하위단백체, 인간 II형 진성 당뇨병 하위단백체, 알츠하이머병 하위단백체, 인간 파킨슨병 하위단백체, 인간 치매 하위단백체, 인간 심혈관 질환 하위단백체, 인간 다운 증후군 하위단백체, 인간 노화 하위단백체 또는 이의 임의의 조합.
일부 구현예에서, 질환 연관 하위단백체는 유기체의 질병 상태에 의해 영향을 받는 해당 유기체의 단백질을 포함한다. 일부 구현예에서, 관심 하위단백체는 인간 혈장 단백체의 인간 췌장암 하위단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 혈소판 부족 혈장(PPP) 단백체의 인간 췌장암 하위단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 혈소판 풍부 혈장(PRP) 단백체의 인간 췌장암 하위단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 혈장 단백체의 인간 췌장암 하위단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 혈소판 부족 혈장(PPP) 단백체의 인간 췌장암 하위단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 혈소판 풍부 혈장(PRP) 단백체의 인간 췌장암 하위단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 전립선암 하위단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 결장직장암 하위단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 췌장암 하위단백체이다.
일부 구현예에서, 관심 단백체는 바이러스 단백체이다. 일부 구현예에서, 바이러스 단백체는 인간 유두종 바이러스(HPV) 단백체, 인간 면역결핍 바이러스(HIV) 단백체, 오르토믹소바이러스과 단백체, 엡스타인 바 단백체, 에볼라바이러스 단백체, 광견병 리사바이러스 단백체, 코로노바이러스 단백체, 노보바이러스 단백체, A형 간염 단백체, B형 간염 단백체, C형 간염 단백체, E형 간염 단백체, 델타 간염 단백체, 헤르페스바이러스 단백체, 유두종바이러스 단백체, 리노바이러스 단백체, 홍역 바이러스 단백체, 볼거리 바이러스 단백체, 폴리오바이러스 단백체, 광견병 단백체, 로타바이러스 단백체, 웨스트 나일 바이러스 단백체, 황열 바이러스 단백체, 지카 바이러스 단백체, 카우도비랄레스 단백체, 니마바이러스과 단백체, 리보비리아 단백체, 이노비리다에 단백체, 푸셀로비리다에 단백체, 헤르페스비랄레스 단백체, 아스파르비리다에 단백체, 비카우다비리다에 단백체, 폐결핵 단백체, 소 폐결핵 단백체, 및 이의 임의의 조합으로부터 선택된다.
일부 구현예에서, 오르토믹소바이러스과 단백체는 인플루엔자 단백체이다. 인플루엔자 단백체는 인플루엔자 A 단백체, 인플루엔자 A 아형 H1N1 단백체, 인플루엔자 B 단백체, 인플루엔자 C 단백체 또는 인플루엔자 D 단백체, 또는 이의 임의의 조합을 포함하나 이에 제한되지 않는다. 일부 구현예에서, 코로노바이러스 단백체는 SARS-CoV-2(Covid-19) 단백체, SARS-CoV 단백체, 또는 MERS-CoV 단백체이다. 일부 구현예에서, 관심 바이러스 단백체는 인수공통 바이러스 단백체이다.
일부 구현예에서, 관심 단백체는 박테리아 단백체이다. 일부 구현예에서, 박테리아 단백체는 에스케리키아 콜라이(이. 콜라이) 단백체, 슈도모나스 애루기노사(피. 애루기노사) 단백체, 살모넬라 단백체, 스타필로코쿠스 아우레우스 단백체, 아시네토박터 바우만니이 단백체, 박테로이데스 프라길리스 단백체, 부르콜데리아 세파시아 단백체, 클로스트리듐 디피실 단백체, 클로스트리듐 소르델리이 단백체, 엔테로박테리아세아에 단백체, 엔테로코쿠스 파에칼리스 단백체, 클렙시엘라 뉴모니아에 단백체, 메티실린-내성 스타필로코쿠스 아우레우스 단백체, 모르가넬라 모르가니이 단백체, 마이코박테리움 단백체 또는 이의 임의의 조합을 포함하나 이에 제한되지 않는다. 일부 구현예에서, 마이코박테리움 단백체는 마이코박테리움 투베르쿨로시스 단백체이다.
일부 구현예에서, 관심 단백체는 기생충 단백체이다. 일부 구현예에서, 기생충 단백체는 말라리아원충 단백체, 톡소플라스마 곤디이 단백체, 트리코모나스 바기날리스 단백체, 기아르디아 듀오데날리스 단백체, 크립토포리디우 단백체 또는 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 말라리아원충 단백체는 플라스모디움 팔시파룸 단백체, 플라스모디움 놀레시 단백체, 플라스모디움 말라리아에 단백체, 플라스모디움 오발레 단백체 또는 플라스모디움 비박스 단백체이다.
일부 구현예에서, 관심 단백질은 알레르겐이다. 바람직하게는, 알레르겐은 땅콩, 글루텐, 락토스, 꽃가루, 카세인, 리포칼린, c-형 리소자임, 프로테아제 억제제, 트로포미오신, 파브알부민, 고양이 비듬 및/또는 개 비듬이다.
일부 구현예에서, 관심 화합물은 하나 이상의 단백질 또는 펩티드(예를 들어 알파 시누클레인, 리소자임, 소 혈청 알부민, 오브알부민, β-락토글로불린, 인슐린, 글루카곤, 아밀로이드 베타, 안지오텐신-전환 효소 2, 안지오텐신-전환 효소, 브래디키닌, 코르딘-유사 단백질 1, 종양 괴사 인자 베타, 오스테오모듈린 전구체, 매트릭스 메탈로프로테이나제 단백질, 플레이오트로핀, 세크레토그라닌-3, 인간 성장 호르몬, 인슐린-유사 성장 인자 1, 렙틴, 텔로머라제, 갑상선-자극 호르몬), 인간 단백체(예를 들어 인간 혈장 단백체, 인간 눈 단백체, 망막, 심장, 골격근, 평활근, 부신, 부갑상선, 갑상선, 뇌하수체, 폐, 골수, 림프 조직, 간, 담낭, 고환, 부고환, 전립선, 정낭, 정관, 지방질 조직, 뇌, 타액선, 식도, 혀, 위, 장, 췌장, 신장, 방광, 유방, 질, 자궁경부, 자궁내막, 나팔관, 난소, 태반, 피부, 혈액, 인간 대사 단백체, 인간 분비 단백체), 인간 하위단백체(예를 들어 인간 췌장암 단백체, 인간 신경교종 하위단백체, 인간 두경부암 하위단백체, 인간 갑상선암 하위단백체, 인간 폐암 하위단백체, 인간 간암 하위단백체, 인간 고환암 하위단백체, 인간 전립선암 하위단백체, 인간 위암 하위단백체, 인간 결장/직장 암 하위단백체, 인간 유방암 하위단백체, 인간 자궁내막암 하위단백체, 인간 난소암 하위단백체, 인간 자궁경부암 하위단백체, 인간 신장암 하위단백체, 인간 비뇨기 및 방광암 하위단백체, 인간 흑색종 하위단백체로부터 선택된 인간 암 하위단백체), (또는 예를 들어 인간 I형 당뇨병 하위단백체, 인간 II형 당뇨병 하위단백체, 알츠하이머병 하위단백체, 인간 파킨슨병 하위단백체, 인간 치매 하위단백체, 인간 심혈관 질환 하위단백체, 인간 다운 증후군 하위단백체, 인간 노화 하위단백체), 바이러스 단백체(예를 들어 인간 유두종 바이러스(HPV) 단백체, 인간 면역결핍 바이러스(HIV) 단백체, 오르토믹소바이러스과 단백체, 예컨대 인플루엔자 단백체, 예컨대 인플루엔자 A 단백체, 인플루엔자 A 아형 H1N1 단백체, 인플루엔자 B 단백체, 인플루엔자 C 단백체 또는 인플루엔자 D 단백체, 엡스타인 바 단백체, 에볼라바이러스 단백체, 광견병 리사바이러스 단백체, 코로노바이러스 단백체, 예컨대 SARS-CoV-2(Covid-19) 단백체, SARS-CoV 단백체, 또는 MERS-CoV, 노보바이러스 단백체, A형 간염 단백체, B형 간염 단백체, C형 간염 단백체, E형 간염 단백체, 델타 간염 단백체, 헤르페스바이러스 단백체, 유두종바이러스 단백체, 리노바이러스 단백체, 홍역 바이러스 단백체, 볼거리 바이러스 단백체, 폴리오바이러스 단백체, 광견병 단백체, 로타바이러스 단백체, 웨스트 나일 바이러스 단백체, 황열 바이러스 단백체, 지카 바이러스 단백체, 카우도비랄레스 단백체, 니마바이러스과 단백체, 리보비리아 단백체, 이노비리다에 단백체, 푸셀로비리다에 단백체, 헤르페스비랄레스 단백체, 아스파르비리다에 단백체, 비카우다비리다에 단백체, 폐결핵 단백체, 소 폐결핵 단백체), 인수공통 바이러스 단백체, 박테리아 단백체(예를 들어 에스케리키아 콜라이(이. 콜라이) 단백체, 슈도모나스 애루기노사(피. 애루기노사) 단백체, 살모넬라 단백체, 스타필로코쿠스 아우레우스 단백체, 아시네토박터 바우만니이 단백체, 박테로이데스 프라길리스 단백체, 부르콜데리아 세파시아 단백체, 클로스트리듐 디피실 단백체, 클로스트리듐 소르델리이 단백체, 엔테로박테리아세아에 단백체, 엔테로코쿠스 파에칼리스 단백체, 클렙시엘라 뉴모니아에 단백체, 메티실린-내성 스타필로코쿠스 아우레우스 단백체, 모르가넬라 모르가니이 단백체, 마이코박테리움 단백체, 예컨대 마이코박테리움 투베르쿨로시스 단백체), 기생충 단백체(예를 들어 말라리아원충 단백체, 톡소플라스마 곤디이 단백체, 트리코모나스 바기날리스 단백체, 기아르디아 듀오데날리스 단백체, 크립토포리디우 단백체 또는 이의 임의의 조합이다. 일부 구현예에서, 말라리아원충 단백체는 플라스모디움 팔시파룸 단백체, 플라스모디움 놀레시 단백체, 플라스모디움 말라리아에 단백체, 플라스모디움 오발레 단백체 또는 플라스모디움 비박스 단백체) 및 이의 임의의 조합이다.
아미노산 유형
기재된 방법에서, 2 개 이상의 아미노산 유형이 표지된다.
모든 아미노산은 다음 공통 구조를 갖는다: 카르복실산, 아민, 및 R-기 측쇄를 갖는 알파 탄소. 카르복실산, 아민, 및 알파 탄소는 모든 아미노산 유형에 공통이다. 아미노산(펩티드, 올리고펩티드, 폴리펩티드, 단백질)의 쇄 내에서, 아미드 결합의 유형인 펩티드 결합은 인접한 아미노산을 연결한다. 이러한 인접한 아미노산은 축합 반응을 거치며 여기서 하나의 아미노산의 비-측쇄 카르복실산 기는 다른 것의 비-측쇄 아민 기와 반응한다. 하나의 인접한 아미노산은 카르복실 기(COOH)로부터 수소 및 산소를 상실하고 다른 것은 아민 기(NH2)로부터 수소를 상실하여, 물 분자(H2O) 및 펩티드 결합에 의해 연결된 2 개의 아미노산(-CO-NH-)을 생성한다. 이 방식으로 연결된 아미노산은 또한 잔기 또는 아미노산 잔기라고 한다. 모든 아미노산은 펩티드 백본에 참여하며, 이는 반복 패턴으로 다음 아미노산의 동일한 원자에 펩티드 결합을 통해 연결된 각 아미노산의 아민 질소, 알파 탄소, 및 카르복실 탄소를 혼입하는 하나의 아미노산에서 다음 아미노산으로의 반복적 공유 결합을 설명한다. 모든 알파 탄소는 R-기라고 하는 가변 측쇄를 가지며, 이는 펩티드 백본에 참여하지 않는다. 아미노산 유형은 R-기, 즉, 측쇄에 의해 정의된다. R-기는 각 아미노산 유형에 특이적이다. 하나의 아미노산 유형의 R-기는 다른 모든 아미노산 유형의 R-기와 구별가능하다. 예를 들어, 리신(K)에 대한 R-기는 ε-1차 아미노 기이다. 모든 K 아미노산은 번역될 때 이 ε-1차 아미노 기를 갖는다. 따라서, K 아미노산 유형은 ε-아미노 R-기에 의해 정의된다. 또 다른 예에서, 트립토판(W)에 대한 R-기는 인돌 기이다. 모든 W 아미노산은 인돌 기를 갖는다. 따라서, W 아미노산 유형은 인돌 R-기에 의해 정의된다. 따라서, 아미노산 유형 K는 이들 아미노산 유형 사이의 상이한 R-기 때문에 아미노산 유형 W와 구별가능하다. 아미노산 유형의 R-기가 번역 후 변형되는 것과 같이 번역 후에 후속적으로 변형되는 경우, 아미노산 유형은 변하지 않는다.
본 발명에 의해 포함되는 2 개 이상의 아미노산 유형은 각 아미노산 유형의 변형 및/또는 비변형된 아미노산을 포함한다. 이것은 22 개의 단백질생성 아미노산 유형 및/또는 비-단백질생성 또는 합성 아미노산의 변형 및/또는 비변형된 아미노산을 포함한다.
본 발명에 의해 포함되는 2 개 이상의 아미노산 유형은 알라닌(A), 아르기닌(R), 아스파라긴(N), 아스파르트산(D), 시스테인(C), 글루탐산(E), 글루타민(Q), 글리신(G), 히스티딘(H), 이소류신(I), 류신(L), 리신(K), 메티오닌(M), 페닐알라닌(F), 프롤린(P), 피롤리신(O), 셀레노시스테인(U), 세린(S), 트레오닌(T), 트립토판(W), 티로신(Y) 및 발린(V), 및 이의 임의의 조합으로부터 선택된 22 개의 단백질생성 아미노산을 포함한다.
일부 구현예에서, 2 개 이상의 아미노산 유형은 시스테인(C), 티로신(Y), 리신(K), 아르기닌(R), 히스티딘(H), 프롤린(P), 아스파르트산(D), 글루탐산(E), 아스파라긴(B), 글루타민(Q), 세린(S) 및/또는 트레오닌(T) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 트립토판(W), 시스테인(C), 티로신(Y), 리신(K), 아르기닌(R), 히스티딘(H), 프롤린(P), 아스파르트산(D), 글루탐산(E), 아스파라긴(B) 및/또는 글루타민(Q) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 트립토판(W), 시스테인(C), 티로신(Y) 및/또는 리신(K) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산은 시스테인(C), 아르기닌(R), 히스티딘(H) 및/또는 아스파르트산(D) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 시스테인(C), 아르기닌(R), 히스티딘(H) 및/또는 글루탐산(E) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 시스테인(C), 아르기닌(R), 히스티딘(H) 및/또는 글루타민(Q) 또는 이의 변형된 유형 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 시스테인(C), 아르기닌(R), 트립토판(W) 및/또는 아스파르트산(D) 또는 이의 변형된 버전 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 리신(K), 아르기닌(R), 히스티딘(H) 및/또는 아스파르트산(D) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 리신(K), 트립토판(W), 아르기닌(R) 및/또는 글루탐산(E) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 티로신(Y), 리신(K), 시스테인(C) 및/또는 아스파르트산(D) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 티로신(Y), 리신(K), 시스테인(C) 및/또는 글루탐산(E) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 프롤린(P), 시스테인(C), 아르기닌(R), 및/또는 글루탐산(E) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 프롤린(P), 시스테인(C), 아르기닌(R) 및/또는 아스파르트산(D) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 시스테인(C), 아스파라긴(B), 아르기닌(R) 및/또는 아스파르트산(D) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 시스테인(C), 아스파라긴(B), 아르기닌(R) 및/또는 글루탐산(E) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 리신(K), 아스파라긴(B), 트립토판(W) 및/또는 시스테인(C) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 아르기닌(R), 히스티딘(H), 프롤린(P) 및/또는 아스파르트산(D) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 아르기닌(R), 리신(K), 시스테인(C) 및/또는 아스파르트산(D) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 아르기닌(R), 리신(K), 시스테인(C) 및/또는 글루탐산(E) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 아르기닌(R), 리신(K), 시스테인(C) 및/또는 트립토판(W) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 아르기닌(R), 리신(K), 시스테인(C) 및/또는 티로신(Y) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 아르기닌(R), 리신(K), 히스티딘(H) 및/또는 트립토판(W) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 아르기닌(R), 리신(K), 히스티딘(H) 및/또는 시스테인(C) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 아르기닌(R), 리신(K), 히스티딘(H) 및/또는 티로신(Y) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 아르기닌(R), 시스테인(C), 트립토판(W) 및/또는 티로신(Y) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 아르기닌(R), 시스테인(C), 트립토판(W) 및/또는 프롤린(P) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 트립토판(W), 시스테인(C) 및/또는 리신(K) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 리신(K), 트립토판(W) 및/또는 티로신(Y) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 트립토판(W), 티로신(Y) 및/또는 시스테인(C) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 트립토판(W), 티로신(Y) 및/또는 리신(K) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개 이상의 아미노산 유형은 시스테인(C), 트립토판(W) 및/또는 티로신(Y) 및 이의 임의의 조합으로부터 선택된다. 일부 구현예에서, 2 개의 아미노산 유형은 류신(L) 및 세린(S)이다. 일부 구현예에서, 2 개의 아미노산 유형은 류신(L) 및 리신(K)이다. 일부 구현예에서, 2 개의 아미노산 유형은 류신(L) 및 글루탐산(E)이다. 일부 구현예에서, 2 개의 산 유형은 글리신(G) 및 류신(L)이다. 일부 구현예에서, 2 개의 아미노산 유형은 알라닌(A) 및 류신(L)이다. 일부 구현예에서, 2 개의 아미노산 유형은 아스파르트산(D) 및 류신(L)이다. 일부 구현예에서, 2 개의 아미노산 유형은 류신(L) 및 프롤린(P)이다. 일부 구현예에서, 2 개의 아미노산 유형은 류신(L) 및 발린(V)이다. 일부 구현예에서, 2 개의 아미노산 유형은 리신(K) 및 세린(S)이다. 일부 구현예에서, 2 개의 아미노산 유형은 글루탐산(E) 및 류신(L)이다. 일부 구현예에서, 2 개의 아미노산 유형은 알라닌(A) 및 아르기닌(R)이다. 일부 구현예에서, 2 개의 아미노산은 알라닌(A) 및 글루탐산(E)이다. 일부 구현예에서, 2 개의 아미노산은 알라닌(A) 및 글리신(G)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고 표지된 3 개의 아미노산 유형은 트립토판(W), 시스테인(C), 및 티로신(Y)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고 표지된 3 개의 아미노산 유형은 시스테인(C), 티로신(Y) 및 리신(K)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고 3 개의 아미노산 유형은 트립토판(W), 시스테인(C) 및 리신(K)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고 3 개의 아미노산 유형은 리신(K), 트립토판(W) 및 티로신(Y)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고 3 개의 아미노산 유형은 트립토판(W), 티로신(Y) 및 시스테인(C)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고 3 개의 아미노산 유형은 트립토판(W), 티로신(Y) 및 리신(K)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고, 표지된 3 개의 아미노산 유형은 시스테인(C), 트립토판(W) 및 티로신(Y)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고, 표지된 3 개의 아미노산 유형은 아스파라긴(R), 글루탐산(E) 및 글리신(G)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고, 표지된 3 개의 아미노산 유형은 알라닌(A), 류신(L) 및 세린(S)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고, 표지된 3 개의 아미노산 유형은 아스파라긴(A), 글루탐산(E) 및 류신(L)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고, 표지된 3 개의 아미노산 유형은 알라닌(A), 아스파르트산(D) 및 류신(L)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고, 표지된 3 개의 아미노산 유형은 알라닌(A), 류신(L) 및 프롤린(P)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고, 표지된 3 개의 아미노산 유형은 알라닌(A), 글루탐산(E) 및 류신(L)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고, 표지된 3 개의 아미노산 유형은류신(L), 세린(S) 및 발린(S)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고, 표지된 3 개의 아미노산 유형은 글루탐산(E), 이소류신(I) 및 프롤린(P)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고, 표지된 3 개의 아미노산 유형은 글루탐산(E), 글리신(G) 및 발린(V)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고, 표지된 3 개의 아미노산 유형은 아르기닌(R), 세린(S) 및 발린(V)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고, 표지된 3 개의 아미노산 유형은 알라닌(A), 류신(L) 및 리신(K)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고, 표지된 3 개의 아미노산 유형은 알라닌(A), 아르기닌(R) 및 류신(L)이다. 일부 구현예에서, 3 개의 아미노산 유형이 표지되고, 표지된 3 개의 아미노산 유형은 알라닌(A), 류신(L) 및 발린(V)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고 표지된 4 개의 아미노산 유형은 알라닌(A), 아르기닌(R), 아스파라긴(N), 아스파르트산(D), 시스테인(C), 글루탐산(E), 글루타민(Q), 글리신(G), 히스티딘(H), 이소류신(I), 류신(L), 리신(K), 메티오닌(M), 페닐알라닌(F), 프롤린(P), 피롤리신(O), 셀레노시스테인(U), 세린(S), 트레오닌(T), 트립토판(W), 티로신(Y) 및 발린(V), 및 이의 임의의 조합으로 이루어진 군으로부터 선택된다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 트립토판(W), 티로신(Y), 리신(K) 및 시스테인(C)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 시스테인(C), 아르기닌(R), 히스티딘(H) 및 아스파르트산(D)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 시스테인(C), 아르기닌(R), 히스티딘(H) 및 글루탐산(E)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 시스테인(C), 아르기닌(R), 히스티딘(H) 및 글루타민(Q)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 시스테인(C), 아르기닌(R), 트립토판(W) 및 아스파르트산(D)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 리신(K), 아르기닌(R), 히스티딘(H) 및 아스파르트산(D)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 리신(K), 트립토판(W), 아르기닌(R) 및 글루탐산(E)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 티로신(Y), 리신(K), 시스테인(C) 및 아스파르트산(D)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 티로신(Y), 리신(K), 시스테인(C) 및 글루탐산(E)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 프롤린(P), 시스테인(C), 아르기닌(R), 및 글루탐산(E)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 프롤린(P), 시스테인(C), 아르기닌(R) 및 아스파르트산(D)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 시스테인(C), 아스파라긴(B), 아르기닌(R) 및 아스파르트산(D)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 시스테인(C), 아스파라긴(B), 아르기닌(R) 및 글루탐산(E)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 리신(K), 아스파라긴(B), 트립토판(W) 및 시스테인(C)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 아르기닌(R), 히스티딘(H), 프롤린(P) 및 아스파르트산(D)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 아르기닌(R), 리신(K), 시스테인(C) 및 아스파르트산(D)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 아르기닌(R), 리신(K), 시스테인(C) 및 글루탐산(E)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 아르기닌(R), 리신(K), 시스테인(C) 및 트립토판(W)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 아르기닌(R), 리신(K), 시스테인(C) 및 티로신(Y)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 아르기닌(R), 리신(K), 히스티딘(H) 및 트립토판(W)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 아르기닌(R), 리신(K), 히스티딘(H) 및 시스테인(C)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 아르기닌(R), 리신(K), 히스티딘(H) 및 티로신(Y)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 아르기닌(R), 시스테인(C), 트립토판(W) 및 티로신(Y)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 아르기닌(R), 시스테인(C), 트립토판(W) 및 프롤린(P)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 글루타민(Q), 류신(L), 리신(K) 및 발린(V)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 아르기닌(R), 이소류신(I), 류신(L) 및 세린(S)이다. 일부 구현예에서, 4 개의 아미노산 유형이 표지되고, 표지된 4 개의 아미노산 유형은 알라닌(A), 아스파라긴(N), 글루탐산(E), 및 세린(S)이다. 일부 구현예에서, 5 개의 아미노산 유형이 표지되고 표지된 5 개의 아미노산 유형은 아르기닌(R), 글루탐산(E), 리신(K), 세린, 및 글루타민(Q)이다 일부 구현예에서, 5 개의 아미노산 유형이 표지되고 표지된 5 개의 아미노산 유형은 아르기닌(R), 아스파르트산(D), 리신(K), 세린, 및 글루타민(Q)이다 일부 구현예에서, 5 개의 아미노산 유형이 표지되고 표지된 5 개의 아미노산 유형은 아르기닌(R), 글리신(G), 리신(K), 세린, 및 글루타민(Q)이다 일부 구현예에서, 5 개의 아미노산 유형이 표지되고 표지된 5 개의 아미노산 유형은 알라닌(A), 아스파르트산(D), 글리신(G), 세린, 및 아르기닌(R)이다 일부 구현예에서, 5 개의 아미노산 유형이 표지되고 표지된 5 개의 아미노산 유형은 피롤리신(O), 아스파르트산(D), 글리신(G), 세린, 및 아르기닌(R)이다 일부 구현예에서, 5 개의 아미노산 유형이 표지되고 표지된 5 개의 아미노산 유형은 피롤리신(O), 아스파르트산(D), 셀레노시스테인(U), 세린, 및 아르기닌(R)이다. 일부 구현예에서, 5 개의 아미노산 유형이 표지되고 표지된 5 개의 아미노산 유형은 피롤리신(O), 아스파르트산(D), 셀레노시스테인(U), 리신, 및 아르기닌(R)이다.
아미노산 유형은 각 아미노산 유형의 L(왼쪽) 이성질체 및/또는 D(오른쪽) 이성질체를 포함한다.
일부 구현예에서, 2 개 이상의 표지된 아미노산 유형은 아미노산 유형의 변형된 아미노산 및/또는 비변형된 아미노산을 포함한다. 일부 구현예에서, 아미노산 유형은 아미노산 유형의 비변형된 아미노산을 포함한다. 일부 구현예에서, 아미노산 유형의 비변형된 아미노산은 번역 후 변형을 거치지 않았다. 일부 구현예에서, 아미노산 유형은 아미노산 유형의 변형된 아미노산을 포함한다. 일부 구현예에서, 아미노산 유형의 변형된 아미노산은 번역 후 변형을 거쳤다. 일부 구현예에서, 아미노산 유형은 아미노산 유형의 변형 및 비변형된 아미노산을 포함한다. 예를 들어, 아미노산 유형 시스테인(C)은 비변형된 시스테인 아미노산(CR), 변형된 시스테인 아미노산 예컨대 시스테인 이황화(CD) 및/또는 시스테인의 비변형 및 시스테인 이황화 아미노산 둘 다의 조합을 포함할 수 있다. 일부 구현예에서, 번역 후 변형과 같은 아미노산의 변형은 아미노산 R-기 상에서 또는 이를 포함하여 발생한다. 일부 구현예에서, 변형 후, 변형된 R-기는 표지화 반응에 이용가능하지 않다. 일부 구현예에서, 비변형된 아미노산 유형은 R-기가 변형되지 않은 아미노산 유형 내의 아미노산이며 따라서 임의의 이전 화학적 변형 없이 표지화에 이용가능하다. 일부 구현예에서, 변형된 아미노산은 R-기가 변형된 아미노산 유형 내의 아미노산이며 임의의 이전 화학적 변형 없이 표지화에 이용가능하지 않다.
일부 구현예에서, 아미노산 유형 알라닌(A)은 비변형된 알라닌 아미노산, 변형된 알라닌 아미노산 및/또는 변형 및 비변형된 알라닌 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 아르기닌(R)은 비변형된 아르기닌 아미노산, 변형된 아르기닌 아미노산 및/또는 변형 및 비변형된 아르기닌 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형, 아스파라긴(N)은 비변형된 아스파라긴 아미노산, 변형된 아스파라긴 아미노산 및/또는 변형 및 비변형된 아스파라긴 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 아스파르트산(D)은 비변형된 아스파르트산 아미노산, 변형된 아스파르트산 아미노산 및/또는 변형 및 비변형된 아스파르트산 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 시스테인(C)은 비변형된 시스테인 아미노산, 변형된 시스테인 아미노산 및/또는 변형 및 비변형된 시스테인 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 글루탐산(E)은 비변형된 글루탐산 아미노산, 변형된 글루탐산 아미노산 및/또는 변형 및 비변형된 글루탐산 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 글루타민(Q)은 비변형된 글루타민 아미노산, 변형된 글루타민 아미노산 및/또는 변형 및 비변형된 글루타민 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 글리신(G)은 비변형된 글리신 아미노산, 변형된 글리신 아미노산 및/또는 변형 및 비변형된 글리신 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 히스티딘(H)은 비변형된 히스티딘 아미노산, 변형된 히스티딘 아미노산 및/또는 변형 및 비변형된 히스티딘 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 이소류신(I)은 비변형된 이소류신 아미노산, 변형된 이소류신 아미노산 및/또는 변형 및 비변형된 이소류신 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 류신(L)은 비변형된 류신 아미노산, 변형된 류신 아미노산 및/또는 변형 및 비변형된 류신 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 리신(K)은 비변형된 리신 아미노산, 변형된 리신 아미노산 및/또는 변형 및 비변형된 리신 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 메티오닌(M)은 비변형된 메티오닌 아미노산, 변형된 메티오닌 아미노산 및/또는 변형 및 비변형된 메티오닌 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 페닐알라닌(F)은 비변형된 페닐알라닌 아미노산, 변형된 페닐알라닌 아미노산 및/또는 변형 및 비변형된 페닐알라닌 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 피롤리신(O)은 비변형된 피롤리신 아미노산, 변형된 피롤리신 아미노산 및/또는 변형 및 비변형된 피롤리신 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 프롤린(P)은 비변형된 프롤린 아미노산, 변형된 프롤린 아미노산 및/또는 변형 및 비변형된 프롤린 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 셀레노시스테인(U)은 비변형된 셀레노시스테인 아미노산, 변형된 셀레노시스테인 아미노산 및/또는 변형 및 비변형된 셀레노시스테인 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 세린(S)은 비변형된 세린 아미노산, 변형된 세린 아미노산 및/또는 변형 및 비변형된 세린 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 트레오닌(T)은 비변형된 트레오닌 아미노산, 변형된 트레오닌 아미노산 및/또는 변형 및 비변형된 트레오닌 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 트립토판(W)은 비변형된 트립토판 아미노산, 변형된 트립토판 아미노산 및/또는 변형 및 비변형된 트립토판 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 티로신(Y)은 비변형된 티로신 아미노산, 변형된 티로신 아미노산 및/또는 변형 및 비변형된 티로신 아미노산의 조합을 지칭한다. 일부 구현예에서, 아미노산 유형 발린(V)은 비변형된 발린 아미노산, 변형된 발린 아미노산 및/또는 변형 및 비변형된 발린 아미노산의 조합을 지칭한다.
바람직한 구현예에서, 표 3에 개시된 특이적 염료와 R-기의 반응성은 아미노산 유형 내의 아미노산이 번역 후 변형을 거치는 경우, 표지화 반응이 번역 후 변형을 거치지 않은 해당 아미노산 유형 내의 아미노산(비변형된 아미노산)을 표지하거나, 번역 후 변형을 거친 아미노산 유형 내의 아미노산(변형된 아미노산)을 또한 표지하는지 여부를 정의한다. 예를 들어, 당업자는 표지화 반응이 친전자성 염료 상의 리신 1차 아민과 같은 친핵성 R-기의 공격을 수반하는 경우, 리신이 더 이상 친핵성 1차 아민을 갖지 않도록 번역 후 변형된 경우 표지화 반응이 진행되지 않음을 인식할 것이다. 또 다른 예로서, 당업자는 표지화 반응이 트립토판 인돌 R-기 및 트리클로로에탄올(TCE)과의 라디칼 반응을 수반하는 경우, 트립토판 인돌 R-기가 하이드록실 기를 포함하도록 모노-산화된 경우 이 반응이 억제되지 않음을 인식할 것이다. 이러한 원칙을 적용하여, 본원에 논의된 표지가 비변형된 아미노산 또는 아미노산 유형에 이용가능한 번역 후 변형을 거친 거의 변형된 아미노산을 표지할 것인지 여부가 하기 표(표 1)에 제공된다. 표지화 반응이 표시된 번역 후 변형으로 비변형된 표시된 아미노산 유형 내의 아미노산만을 표지하는 경우, "비변형됨"이 표지화 열에 제시된다. 표지화 반응이 또한 표시된 번역 후 변형으로 변형된 표시된 아미노산 유형 내의 아미노산을 표지하는 경우, "비변형됨 + 변형됨)이 표지화 열에 제시된다.
표 1: 각 아미노산 유형의 변형 및/또는 비변형된 아미노산 표지화
Figure pct00076
일부 구현예에서, 사용자가 원하는 경우, 사용자는 아미노산 유형의 변형 및 비변형된 아미노산 둘 다를 검출할 수 있도록 아미노산 유형의 변형된 아미노산을 (예를 들어 화학적 변형에 의해) 비변형된 아미노산으로 변환함으로써 아미노산 유형의 비변형 버전만, 및/또는 비변형 + 변형된 버전을 표지하는지 여부를 선택할 수 있다. 예를 들어, 시스테인의 변형 및 비변형된 아미노산 둘 다의 조합이 표지되는 경우, 변형된 아미노산(CD)은 먼저 환원되어 비변형된 시스테인 아미노산(CR)이 되고 이어서 모든 비변형된 아미노산(새로 환원된 변형된 아미노산 포함)이 표지된다. 아미노산 유형 시스테인(C)의 아미노산은 가역적 번역 후 변형(PTM)을 거칠 수 있다. 특이적으로, PTM 동안 시스테인 아미노산의 이황화 결합으로의 산화는 가역적이다. 또 다른 예로서, 글리코실화된(변형된) 세린, 트레오닌, 또는 아스파라긴 잔기는 샘플 용액의 pH를, 예를 들어 pH 10.5까지 상승시킴으로써 비변형된 세린, 트레오닌, 또는 아스파라긴 잔기로 전환될 수 있다. 세린, 트레오닌, 및 아스파라긴 잔기의 글리코실화가 또한 가역적이다.
시스테인 이황화(CD)는 변형된 시스테인 아미노산이다. 비변형된 시스테인 아미노산은 환원된 시스테인(CR)이다. 일부 구현예에서, 용어 시스테인(C)은 비변형된 아미노산, 즉, 환원된 시스테인(CR)을 지칭한다. 일부 구현예에서, 용어 시스테인(C)은 변형된 아미노산, 즉, 시스테인 이황화(CD)를 지칭한다. 일부 구현예에서, 용어 시스테인은 비변형된 아미노산(CR) 및 변형된 아미노산(CD)을 둘 다 지칭한다. 일부 구현예에서, 비변형된 아미노산(CR) 및 변형된 아미노산(CD)은 둘 다 본 발명의 방법의 일부로서 별도로 표지될 수 있다. 변형된 아미노산은 아미노산 유형일 수 있고/있거나 비변형된 아미노산은 아미노산 유형일 수 있다. 변형된 아미노산 및 비변형된 아미노산의 조합이 또한 아미노산 유형일 수 있다.
일부 구현예에서, 용어 시스테인(C)은 변형된 시스테인 아미노산, 즉, 시스테인 이황화(CD)가 환원되었고, 이어서 모든 비변형된 아미노산(새로 환원된 변형된 아미노산 포함)이 표지되는 경우, 비변형된 시스테인 아미노산, 즉, 환원된 시스테인(CR) 및 변형된 시스테인 아미노산, 즉, 시스테인 이황화(CD)의 조합을 지칭한다. 일부 구현예에서, 용어 시스테인은 표지되는 비변형된 아미노산(CR), 및 변형된 아미노산이 환원된 경우 변형 및 비변형된 아미노산의 조합을 둘 다 지칭한다. .
시스테인의 비변형된 아미노산, 즉, 환원된 시스테인(CR) 및/또는 시스테인의 변형된 아미노산, 즉, 시스테인 이황화(CD) 및/또는 시스테인의 변형 및 비변형된 아미노산의 조합은 아미노산 유형 시스테인(C)의 서브세트이다. 변형된 시스테인이 환원되면 시스테인의 비변형된 아미노산, 즉, 환원된 시스테인(CR) 및 변형 및 비변형된 시스테인의 조합이 둘 다 표지되고 표지의 상이한 측정을 제공할 수 있다. 예를 들어, 비변형된 아미노산 CR 및 CR 및 CD의 조합은 둘 다 형광생성 염료로 표지되고 상이한 형광 강도를 제공할 수 있다. 따라서, 본 발명은 환원된 시스테인(CR), 시스테인 이황화(CD) 및/또는 아미노산 유형 시스테인(C)의 변형 및 비변형된 시스테인 아미노산의 조합을 포함한다. 아미노산 유형 시스테인(C)에 대한 임의의 참조는 환원된 시스테인(CR), 시스테인 이황화(CD) 및/또는 변형 및 비변형된 시스테인 아미노산의 조합을 포함한다. 바람직하게는, 아미노산 유형 시스테인(C)에 대한 임의의 참조는 환원된 시스테인(CR) 및/또는 변형 및 비변형된 시스테인(CT)의 조합을 포함한다. 바람직하게는, 환원된 시스테인(CR) 및/또는 변형 및 비변형된 시스테인의 조합이 샘플에서 표지된다.
표지될 수 있는 별개의 R-기를 갖는 임의의 다른 아미노산 유형은 본 발명의 일부로서 동일하게 사용될 수 있다. 예를 들어, 본 발명에 의해 포함되는 2 개 이상의 아미노산 유형은 또한 합성 아미노산 유형을 포함한다. 합성 아미노산 유형은 자연적으로 발생하는 비-단백질생성 아미노산이거나, 화학적으로 합성된다. 본 발명에 의해 포함되는 합성 아미노산 유형은 작용기 아지드, 알킨, 알켄, 사이클로옥틴, 디엔, 아실, 요오도, 보론산, 디아지린, 사이클로옥텐, 에폭시드, 사이클로프로판, 비오틴, 디에노필, 술폰산, 술핀산, 비오틴, 옥심, 니트론, 노르보르넨, 테트라젠, 테트라졸, 쿼드리사이클란, 전자 부족 파이 시스템, 전자 풍부 파이 시스템, 할로겐, NHS 에스테르, 말레이미드, 및/또는 디아조 및 이의 임의의 조합을 함유하는 아미노산 유형을 포함한다. 이들 작용기는 천연 작용기 대신에 혼입된다. 또한, 본 발명에 의해 포함되는 합성 아미노산 유형은 또한 아미노산 유형의 천연 작용기에 첨부되거나 부착된 합성 치환기를 갖는 아미노산 유형을 포함한다. 예를 들어, 본 발명은 인돌 고리 상에 노르보르넨을 함유하도록 합성적으로 변형된 트립토판 아미노산을 포함한다. 일부 구현예에서, 합성 치환기가 아미노산 유형의 천연 작용기에 첨부되거나 부착되는 경우, 이 혼입은 본원에 개시된 표지화 반응 전에 발생한다.
2 개 이상의 아미노산 유형 표지화
2 개 이상의 아미노산 유형의 아미노산은 샘플에서 표지된다.
일부 구현예에서, 표지화 반응은 각 아미노산 유형에 특이적이다. 모든 아미노산 유형 내의 모든 아미노산은 온전한 단백질 분자 내에 함유된다. 이는 단백질 쇄의 개별 아미노산으로의 가수분해 또는 단백질 쇄의 온전한 단백질 쇄 내에 함유된 아미노산 유형의 하나 또는 분획만을 함유하는 단편으로의 단백질분해 소화를 필요로 하지 않고, 배타적으로 온전한 단백질 쇄 내에서 관심 아미노산 유형과의 반응을 허용한다. 이것은 관심 대상이 아닌 다른 단백질이 또한 용액 내에 존재하더라고, 항체가 오직 관심 단백질과 반응하는 방식과 유사하다. 표지 및 아미노산 유형의 상보적 화학 반응성으로 인해, 표지는 배타적으로 관심 아미노산 유형과 반응한다. 일부 구현예에서, 각 표지는 오직 하나의 아미노산 유형과 반응한다. 일부 구현예에서, 각 표지는 1 또는 2 개의 아미노산 유형과 반응한다. 일부 구현예에서, 각 표지는 1, 2 또는 3 개의 아미노산 유형과 반응한다. 예를 들어, 표지 o-말레이미드-BODIPY는 시스테인(C) 아미노산 유형에 특이적인 데, 시스테인(C) R-기를 정의하는 티올만이 말레이미드 모이어티와 반응할 수 있기 때문이다. 이것은 티올이 "부드러운" 친핵체이고 말레이미드와 같은 "부드러운" 친전자체와 우선적으로 반응하기 때문이다.
일부 구현예에서, 각 아미노산 유형은 식별을 위한 별개의 표지를 갖는다. 예를 들어, 5 개의 아미노산 유형이 표지된 경우, 5 개의 상이한 표지가 있다. 2 개의 아미노산 유형이 표지된 경우, 2 개의 상이한 표지가 있다. 예를 들어, 아미노산 유형 K의 아미노산은 제1 표지로 표지되고, 아미노산 유형 W의 아미노산은 제1 표지와 구별되는 제2 표지로 표지된다.
일부 구현예에서, 2 개의 아미노산 유형이 표지된다. 일부 구현예에서, 3 개의 아미노산 유형이 표지된다. 일부 구현예에서, 4 개의 아미노산 유형이 표지된다. 일부 구현예에서, 5 개의 아미노산 유형이 표지된다. 일부 구현예에서, 6 개의 아미노산 유형이 표지된다. 일부 구현예에서, 7 개의 아미노산 유형이 표지된다. 일부 구현예에서, 8 개의 아미노산 유형이 표지된다. 일부 구현예에서, 9 개의 아미노산 유형이 표지된다. 일부 구현예에서, 10 개의 아미노산 유형이 표지된다. 일부 구현예에서, 11 개의 아미노산 유형이 표지된다. 일부 구현예에서, 12 개의 아미노산 유형이 표지된다. 일부 구현예에서, 13 개의 아미노산 유형이 표지된다. 일부 구현예에서, 14 개의 아미노산 유형이 표지된다. 일부 구현예에서, 15 개의 아미노산 유형이 표지된다. 일부 구현예에서, 16 개의 아미노산 유형이 표지된다. 일부 구현예에서, 17 개의 아미노산 유형이 표지된다. 일부 구현예에서, 18 개의 아미노산 유형이 표지된다. 일부 구현예에서, 19 개의 아미노산 유형이 표지된다. 일부 구현예에서, 20 개의 아미노산 유형이 표지된다. 일부 구현예에서, 21 개의 아미노산 유형이 표지된다. 일부 구현예에서, 22 개의 아미노산 유형이 표지된다. 일부 구현예에서, 23 개의 아미노산 유형이 표지된다. 일부 구현예에서, 24 개의 아미노산 유형이 표지된다. 일부 구현예에서, 25 개의 아미노산 유형이 표지된다. 일부 구현예에서, 26 개의 아미노산 유형이 표지된다. 일부 구현예에서, 27 개의 아미노산 유형이 표지된다. 일부 구현예에서, 28 개의 아미노산 유형이 표지된다. 일부 구현예에서, 29 개의 아미노산 유형이 표지된다. 일부 구현예에서, 30 개의 아미노산 유형이 표지된다. 일부 구현예에서, 31 개의 아미노산 유형이 표지된다. 일부 구현예에서, 32 개의 아미노산 유형이 표지된다. 일부 구현예에서, 33 개의 아미노산 유형이 표지된다. 일부 구현예에서, 34 개의 아미노산 유형이 표지된다. 일부 구현예에서, 35 개의 아미노산 유형이 표지된다. 일부 구현예에서, 36 개의 아미노산 유형이 표지된다. 일부 구현예에서, 37 개의 아미노산 유형이 표지된다. 일부 구현예에서, 38 개의 아미노산 유형이 표지된다. 일부 구현예에서, 39 개의 아미노산 유형이 표지된다. 일부 구현예에서, 40 개의 아미노산 유형이 표지된다. 일부 구현예에서, 2, 3, 4 또는 5 개의 아미노산 유형이 표지된다. 일부 구현예에서, 4 또는 5 개의 아미노산 유형이 표지된다. 일부 구현예에서, 3 또는 4 개의 아미노산 유형이 표지된다. 일부 구현예에서, 2 개의 아미노산 유형이 표지된다.
일부 구현예에서, 표지된 2 개의 아미노산 유형은 트립토판(W), 시스테인(C), 티로신(Y) 또는 리신(K)으로부터 선택된다. 일부 구현예에서, 2 개의 아미노산 유형은 류신(L) 및 세린(S)이다. 일부 구현예에서, 2 개의 아미노산 유형은 류신(L) 및 리신(K)이다. 일부 구현예에서, 2 개의 아미노산 유형은 류신(L) 및 글루탐산(E)이다. 일부 구현예에서, 2 개의 산 유형은 글리신(G) 및 류신(L)이다. 일부 구현예에서, 2 개의 아미노산 유형은 알라닌(A) 및 류신(L)이다. 일부 구현예에서, 2 개의 아미노산 유형은 아스파르트산(D) 및 류신(L)이다. 일부 구현예에서, 2 개의 아미노산 유형은 류신(L) 및 프롤린(P)이다. 일부 구현예에서, 2 개의 아미노산 유형은 류신(L) 및 발린(V)이다. 일부 구현예에서, 2 개의 아미노산 유형은 리신(K) 및 세린(S)이다. 일부 구현예에서, 2 개의 아미노산 유형은 글루탐산(E) 및 류신(L)이다. 일부 구현예에서, 2 개의 아미노산 유형은 알라닌(A) 및 아르기닌(R)이다. 일부 구현예에서, 2 개의 아미노산은 알라닌(A) 및 글루탐산(E)이다. 일부 구현예에서, 2 개의 아미노산은 알라닌(A) 및 글리신(G)이다.
일부 구현예에서, 표지된 3 개의 아미노산 유형은 트립토판(W), 시스테인(C), 티로신(Y) 또는 리신(K)으로부터 선택된다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 트립토판(W), 시스테인(C) 및 리신(K)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 리신(K), 트립토판(W) 및 티로신(Y)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 트립토판(W), 티로신(Y) 및 시스테인(C)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 트립토판(W), 티로신(Y) 및 리신(K)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 시스테인(C), 트립토판(W) 및 티로신(Y)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 아스파라긴(R), 글루탐산(E) 및 글리신(G)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 알라닌(A), 류신(L) 및 세린(S)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 아스파라긴(A), 글루탐산(E) 및 류신(L)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 표지된 3 개의 아미노산 유형 알라닌(A), 아스파르트산(D) 및 류신(L)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 표지된 3 개의 아미노산 유형은 알라닌(A), 류신(L) 및 프롤린(P)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 알라닌(A), 글루탐산(E) 및 류신(L)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 류신(L), 세린(S) 및 발린(S)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 글루탐산(E), 이소류신(I) 및 프롤린(P)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 글루탐산(E), 글리신(G) 및 발린(V)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 아르기닌(R), 세린(S) 및 발린(V)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 알라닌(A), 류신(L) 및 리신(K)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 알라닌(A), 아르기닌(R) 및 류신(L)이다. 일부 구현예에서, 표지된 3 개의 아미노산 유형은 알라닌(A), 류신(L) 및 발린(V)이다.
일부 구현예에서, 표지된 4 개의 아미노산 유형은 트립토판(W), 티로신(Y) 및 리신(K) 및 시스테인(C)이며, 여기서 시스테인의 변형 및 비변형된 아미노산의 조합이 표지된다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 트립토판(W), 시스테인(C), 티로신(Y) 및 리신(K)이며, 여기서 환원된 시스테인(CR)이 표지된다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 트립토판(W), 시스테인(C), 티로신(Y) 및 리신(K)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 시스테인(C), 아르기닌(R), 히스티딘(H) 및 아스파르트산(D)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 시스테인(C), 아르기닌(R), 히스티딘(H) 및 글루탐산(E)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 시스테인(C), 아르기닌(R), 히스티딘(H) 및 글루타민(Q)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 시스테인(C), 아르기닌(R), 트립토판(W) 및 아스파르트산(D)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 리신(K), 아르기닌(R), 히스티딘(H) 및 아스파르트산(D)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 리신(K), 트립토판(W), 아르기닌(R) 및 글루탐산(E)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 티로신(Y), 리신(K), 시스테인(C) 및 아스파르트산(D)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 티로신(Y), 리신(K), 시스테인(C) 및 글루탐산(E)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 프롤린(P), 시스테인(C), 아르기닌(R), 및 글루탐산(E)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 프롤린(P), 시스테인(C), 아르기닌(R) 및 아스파르트산(D)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 시스테인(C), 아스파라긴(B), 아르기닌(R) 및 아스파르트산(D)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 시스테인(C), 아스파라긴(B), 아르기닌(R) 및 글루탐산(E)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 리신(K), 아스파라긴(B), 트립토판(W) 및 시스테인(C)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 아르기닌(R), 히스티딘(H), 프롤린(P) 및 아스파르트산(D)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 아르기닌(R), 리신(K), 시스테인(C) 및 아스파르트산(D)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 아르기닌(R), 리신(K), 시스테인(C) 및 글루탐산(E)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 아르기닌(R), 리신(K), 시스테인(C) 및 트립토판(W)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 아르기닌(R), 리신(K), 시스테인(C) 및 티로신(Y)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 아르기닌(R), 리신(K), 히스티딘(H) 및 트립토판(W)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 아르기닌(R), 리신(K), 히스티딘(H) 및 시스테인(C)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 아르기닌(R), 리신(K), 히스티딘(H) 및 티로신(Y)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 아르기닌(R), 시스테인(C), 트립토판(W) 및 티로신(Y)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 아르기닌(R), 시스테인(C), 트립토판(W) 및 프롤린(P)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 글루타민(Q), 류신(L), 리신(K) 및 발린(V)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 아르기닌(R), 이소류신(I), 류신(L) 및 세린(S)이다. 일부 구현예에서, 표지된 4 개의 아미노산 유형은 알라닌(A), 아스파라긴(N), 글루탐산(E), 및 세린(S)이다.
각 아미노산 유형은 해당 아미노산 유형의 변형 및/또는 비변형된 아미노산을 지칭한다. 바람직하게는, 아미노산 시스테인(C)은 일단 변형된 아미노산이 환원되면, 비변형된 아미노산(CR) 및/또는 비변형 및 변형된(시스테인 이황화) 아미노산의 조합을 지칭한다.
일부 구현예에서, 표지된 5 개의 아미노산 유형은 트립토판(W), 시스테인(C), 티로신(Y) 및 리신(K)이며, 여기서 환원된 시스테인(CR), 및 시스테인의 변형(CD) 및 비변형된(CR) 아미노산의 조합이 둘 다 표지된다. 일부 구현예에서, 표지된 5 개의 아미노산 유형은 아르기닌(R), 글루탐산(E), 리신(K), 세린, 및 글루타민(Q)이다. 일부 구현예에서, 표지된 5 개의 아미노산 유형은 아르기닌(R), 아스파르트산(D), 리신(K), 세린, 및 글루타민(Q)이다. 일부 구현예에서, 표지된 5 개의 아미노산 유형은 아르기닌(R), 글리신(G), 리신(K), 세린, 및 글루타민(Q)이다. 일부 구현예에서, 표지된 5 개의 아미노산 유형은 알라닌(A), 아스파르트산(D), 글리신(G), 세린, 및 아르기닌(R)이다. 일부 구현예에서, 표지된 5 개의 아미노산 유형은 피롤리신(O), 아스파르트산(D), 글리신(G), 세린, 및 아르기닌(R)이다. 일부 구현예에서, 표지된 5 개의 아미노산 유형은 피롤리신(O), 아스파르트산(D), 셀레노시스테인(U), 세린, 및 아르기닌(R)이다. 일부 구현예에서, 표지된 5 개의 아미노산 유형은 피롤리신(O), 아스파르트산(D), 셀레노시스테인(U), 리신, 및 아르기닌(R)이다.
일부 구현예에서, 2 개 이상의 아미노 또는 그 이상의 산 유형은 동일한 표지로 표지될 수 있고 표지는 각 아미노산 유형에 대해 독립적으로 식별된다. 예를 들어, 아미노산 유형 W의 아미노산은 아미노산 유형 Y의 아미노산과 동일한 표지로 표지되고 아미노산 유형 W의 표지는 아미노산 유형 Y의 표지와 독립적으로 식별된다. 일부 구현예에서, 2 개의 아미노산 유형이 동일한 표지로 표지되는 경우, 표지를 검출하기 위한 파라미터가 구별된다. 예를 들어, 하나의 아미노산 유형에 대한 표지는 제2 아미노산 유형에 대한 표지로부터 디콘볼루션된다. 예를 들어, 트립토판(W) 및 티로신(Y)의 아미노산 유형은 둘 다 동일한 형광 표지로 표지될 수 있지만, 트립토판(W) 표지의 형광 강도는 티로신(Y) 표지의 형광 강도로부터 디콘볼루션된다. 일부 구현예에서, 트립토판(W) 및 티로신(Y)의 아미노산 유형은 둘 다 동일한 형광생성 염료로 표지되지만, 트립토판(W)에 대한 형광생성 염료로부터 신호를 측정하기 위한 여기 및 방출 파장은 티로신(Y)에 대한 형광생성 염료로부터 신호를 측정하기 위한 여기 및 방출 파장 파라미터와 상이하다. 일부 구현예에서, 트립토판(W) 및 티로신(Y)의 아미노산 유형은 둘 다 동일한 형광생성 염료로 표지되지만, 트립토판(W)에 대한 형광생성 염료로부터 신호를 측정하기 위한 여기 및 방출 파장은 티로신(Y) 및 트립토판(W)에 대한 형광생성 염료로부터 신호를 측정하기 위한 여기 및 방출 파장과 상이하다. 일부 구현예에서, 티로신(Y) 신호는 총 트립토판(W) 및 티로신(Y) 신호에서 트립토판 신호(W)를 뺀 값으로부터 측정된다.
일부 구현예에서, 2 개 이상의 아미노산 유형은 동일한 표지로 표지(예를 들어 반응)될 수 있지만 표지화(예를 들어 반응)는 상이한 조건 하에 수행된다. 일부 구현예에서, 다중-단계 표지화 과정은 동일한 표지가 단지 하나의 아미노산 유형과 특이적으로 반응하도록 한다. 예를 들어, 메티오닌(M) 및 페닐알라닌(F) 아미노산 유형은 아지드 반응성 기를 보유하는 염료인 동일한 표지와 반응할 수 있다. 표지화 반응은 "클릭 화학"으로도 알려진 구리(I)-촉매화된 아지드-알킨 고리화 첨가(CuAAC)를 수반한다. 메티오닌(M) 또는 페닐알라닌(F) 아미노산 유형에 대한 표지화 반응의 제1 단계는 메티오닌(M) 또는 페닐알라닌(F) R-기에 알킨 기를 설치하고 후속적으로 표지화 반응의 제2 단계 동안 염료에서 아지드와 반응한다. 이 제1 단계는 단지 메티오닌(M) 아미노산 유형 또는 단지 페닐알라닌(F) 아미노산 유형과의 반응에 특이적인 조건 하에 수행된다. 이 방식으로, 동일한 표지(예를 들어 염료)는 하나 초과의 아미노산 유형과 특이적으로 반응할 수 있어서, 원하는 아미노산 유형만이 반응 조건 하에 표지되도록 한다.
일부 구현예에서, 표지된 2 개 이상의 아미노산 유형은 전체 샘플 내에서 표지된다. 일부 구현예에서, 샘플은 표지화 반응 전에 다수의 개별 분획으로 분리되지 않는다. 예를 들어, 소변 샘플이 제공되고 아미노산 유형 W, Y 및 K는 샘플을 다수의 별개의 분획으로 분리하지 않고, W, Y 및 K를 별개의 분획에서 별도로 표지하지 않고, 소변 샘플에서 모두 표지된다. 예를 들어, 단일 단백질 분자는 분자 내에서 표지된 모든 2 개 이상의 아미노산 유형을 가질 것이다. 일부 구현예에서, 표지되는 모든 아미노산 유형은 하나의 분획에서 표지된다. 이 구현예에서, 각 아미노산 유형의 표지는 다른 아미노산 유형과 교차 반응하지 않도록 하나의 아미노산 유형에 특이적으로 선택된다. 일부 구현예에서, 표지의 선택은 변형될 아미노산 유형의 화학에 의해 좌우된다. 예를 들어, 리신 및 트립토판이 동일한 분획에서 표지되는 경우, 표지화 화학은 서로 방해하지 않고, 트립토판에 연결된 염료의 신호는 리신에 연결된 염료의 신호, 즉, 형광 강도의 경우 상이한 여기 및 방출 파장으로부터 분리가능하다.
일부 구현예에서, 샘플은 표지화 반응 전에 다수의 분획으로 분리된다. 각 아미노산 유형의 아미노산은 가수분해되거나 소화되지 않은 온전한 단백질 분자 내에 함유되어 있기 때문에, 하나의 단백질 분자는 많은 아미노산 유형을 함유하고, 따라서 하나의 분획은 많은 아미노산 유형을 함유한다. 샘플이 다수의 분획으로 분리되는 경우, 관심 아미노산 유형을 특이적으로 표지하는 상이한 표지화 반응이 각 분획에서 수행된다. 일부 구현예에서, 각 분획은 동일한 부피를 함유한다. 이 구현예에서, 각 분획이 표지된다. 예를 들어, 샘플은 표지화 전에 2 개의 분획으로 분리되고 4 개의 아미노산 유형이 표지되며; 여기서 2 개의 아미노산 유형이 하나의 분획에서 표지되고 2 개의 대체 아미노산 유형이 제2 분획에서 표지된다. 예를 들어, 표지되는 샘플에서 4 개의 아미노산 유형은 W, K, Y 및 C이며, 여기서 C는 CD 및 CR의 조합이다. 샘플은 표지화 전에 2 개의 분획으로 분리되며; 제1 분획에서, 아미노산 유형 (W) 및 리신(K)은 (W) 및 (K) 아미노산 유형에 특이적인 표지 사용하여 표지되고, 제2 분획에서 아미노산 유형 시스테인(C) 및 티로신(Y)은 (C) 및 (Y) 아미노산 유형에 특이적인 표지 사용하여 표지된다. 또 다른 예에서, 샘플은 표지화 전에 4 개의 분획으로 분리된다. 4 개의 아미노산 유형이 표지되며; 하나의 아미노산 유형은 각 분획에서 표지된다. 예를 들어, 표지되는 샘플에서 4 개의 아미노산 유형은 W, K, Y 및 C이다. 샘플은 표지화 전에 4 개의 분획으로 분리되고; 아미노산 유형 트립토판(W)은 제1 분획에서 표지되고, 아미노산 유형 리신(K)은 제2 분획에서 표지되고, 아미노산 유형 시스테인(C)은 제3 분획에서 표지되고, 아미노산 유형 티로신(Y)은 제4 분획에서 표지된다. 일부 구현예에서, 분획의 수는 표지되는 아미노산 유형의 수와 동일하고, 하나의 아미노산 유형이 분획 당 표지된다. 일부 구현예에서, 분획의 수는 표지되는 아미노산 유형의 수보다 작고, 하나 초과의 아미노산 유형이 분획 당 표지된다. 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체, 또는, 샘플 내의 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 존재 및/또는 농도 및/또는 양이 각 분획의 측정된 표지에 기반하여 각 분획에 대해 결정된다.
일부 구현예에서, 2 개의 아미노산 유형이 동일한 표지 갖는 경우, 이들은 상이한 분획에서 표지되고 측정된다. 예를 들어, 일부 구현예에서, 아미노산 유형 W 및 Y는 상이한 분획에서 표지되고 측정된다. 일부 구현예에서, 제1 아미노산 유형의 표지가 제2 아미노산 유형의 표지와 교차 반응하는 것으로 예측되는 경우, 제1 및 제2 아미노산 유형은 별개의 분획으로 분리된다. 제1 분획은 샘플 내의 제1 아미노산 유형에 특이적인 표지와 반응하고, 제2 분획은 샘플 내의 제2 아미노산 유형에 특이적인 표지와 반응한다. 이것은 표지의 교차 반응을 피한다.
일부 구현예에서, 표지될 2 개 이상의 아미노산 유형은 샘플에서 또 다른 형광생성 염료 또는 아미노산 유형과 교차 반응하지 않는 형광생성 염료를 갖는 분획으로 분리된다.
일부 구현예에서, 샘플에서 2 개 이상의 아미노산 유형의 아미노산 전부, 즉 모든 아미노산이 표지된다. 일부 구현예에서, 샘플에서 2 개 이상의 아미노산 유형 각각의 모든 아미노산(즉, 아미노산 전부)이 표지된다. 예를 들어, 아미노산 유형 트립토판이 표지되는 경우, 샘플에 존재하는 모든 트립토판 아미노산이 표지된다. 일부 구현예에서, 샘플에서 2 개 이상의 아미노산 유형 각각의 모든 아미노산(즉, 아미노산 전부)이 표지된다. 예를 들어, 표지될 2 개 이상의 아미노산 유형이 트립토판(W) 및 리신(K)인 경우, 샘플에서 모든 트립토판(W) 아미노산, 즉, 전부가 표지되고 샘플에서 모든 리신(K) 아미노산, 즉, 전부가 표지된다. 또 다른 예에서, 표지될 2 개 이상의 아미노산 유형이 트립토판(W), 리신(K) 및 티로신(Y)인 경우, 샘플에서 모든 트립토판(W) 아미노산, 즉, 전부가 표지되고, 샘플에서 모든 리신(K) 아미노산, 즉, 전부가 표지되고 샘플에서 모든 티로신(Y) 아미노산, 즉, 전부가 표지된다.
일부 구현예에서, 샘플에서 2 개 이상의 아미노산 유형의 아미노산의 일부(즉, 모든 아미노산이 아님)가 표지된다. 일부 구현예에서, 샘플에서 2 개 이상의 아미노산 유형 각각의 아미노산의 일부(즉, 모든 아미노산이 아님)가 표지된다. 예를 들어, 아미노산 유형 트립토판이 표지된 경우, 샘플에 존재하는 트립토판 아미노산의 일부가 표지된다. 예를 들어, 표지될 2 개 이상의 아미노산 유형이 트립토판(W) 및 리신(K)인 경우, 샘플에서 트립토판(W) 아미노산의 일부가 표지되고 샘플에서 리신(K) 아미노산의 일부가 표지된다. 표지될 2 개 이상의 아미노산 유형이 트립토판(W), 리신(K) 및 티로신(Y)이면, 샘플에서 트립토판(W) 아미노산의 일부가 표지되고, 샘플에서 리신(K) 아미노산의 일부가 표지되고 샘플에서 티로신(Y) 아미노산의 일부가 표지된다. 바람직하게는, 2 개 이상의 아미노산 유형 각각의 아미노산의 약 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78% 또는 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%가 샘플 내에서 표지된다. 일부 구현예에서, 샘플 내에서 표지된 아미노산 유형의 아미노산의 일부는 질량 분광법을 사용하여 결정된다. 일부 구현예에서, 샘플 내에 함유된 단백체 또는 하위단백체에서 2 개 이상의 아미노산 유형의 아미노산의 일부(즉, 모든 아미노산이 아님)가 표지된다.
일부 구현예에서, 하나의 아미노산 유형의 모든(즉, 전부) 아미노산이 표지되고 또 다른 아미노산 유형의 아미노산의 일부가 표지된다. 예를 들어, 표지될 2 개 이상의 아미노산 유형이 트립토판(W) 및 리신(K)이면, 샘플에서 모든 트립토판(W) 아미노산 및 샘플에서 리신(K) 아미노산의 90%가 표지된다. 대안적으로, 샘플에서 트립토판(W) 아미노산의 90% 및 모든 리신(K) 아미노산이 표지된다.
일부 구현예에서, 2 개 이상의 아미노산 유형 내의 아미노산의 R-기가 샘플 내에서 표지된다. 각 아미노산 유형의 R-기는 각 아미노산 유형에 대해 고유하다. 예를 들어, 트립토판(W)의 R-기는 리신(K)의 R-기와 구별된다. 각 아미노산 유형에 특이적인 R-기가 표 2에 제공된다. 샘플에서 2 개 이상의 아미노산 유형이 표지된다. 일부 구현예에서, 표지되도록 선택된 아미노산 유형의 모든 아미노산(즉, 아미노산 전부)이 표지된다. 일부 구현예에서, 아미노산 유형의 모든 아미노산(즉, 아미노산 전부)의 R-기가 표지된다. 일부 구현예에서, 아미노산 유형의 일부(즉, 모든 아미노산이 아님)가 표지된다. 일부 구현예에서, 아미노산 유형의 아미노산의 일부(즉, 모든 아미노산이 아님)의 R-기가 표지된다. 일부 구현예에서, 아미노산 유형의 모든 아미노산(즉, 아미노산 전부)이 표지되고, 제2 아미노산 유형의 일부(즉, 모든 아미노산이 아님)가 표지된다. 일부 구현예에서, 제1 아미노산 유형의 모든 아미노산(즉, 아미노산 전부)의 R-기가 표지되고 제2 아미노산 유형의 아미노산의 일부(즉, 모든 아미노산이 아님)의 R-기가 표지된다.
바람직하게는, W, C, Y 또는 K로부터 선택된 아미노산 유형 중 2 개 이상 각각에 대한 R-기가 표지된다. 바람직하게는, C에 대해 표지된 R-기는 환원된 시스테인(CR)의 R-기이다. 바람직하게는, C에 대해 표지된 R 기는 CD가 환원된 후, CD 및 CR의 조합의 R-기이다. 바람직하게는, CD가 환원된 후, 아미노산 유형 시스테인(C) 내에서 (CR) 및 CD 및 CR의 조합에 대한 R-기가 둘 다 샘플 내에서 표지된다.
바람직한 구현예에서, 2 개 이상의 아미노산 유형이 표지되고, 아미노산 유형 각각의 R-기가 샘플에서 표지된다(즉, 2 개 이상의 유형의 R-기가 표지됨). R-기의 2 개 이상의 아미노산 유형은 2 개 이상의 아미노산 유형에 상응한다. 예를 들어, 트립토판 및 리신이 표지되는 2 개의 아미노산 유형인 경우, 트립토판에 대한 R-기 및 리신에 대한 R-기가 샘플에서 표지된다. 일부 구현예에서, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 또는 22 개의 아미노산 유형 각각의 R-기가 표지된다. 일부 구현예에서, 표지되는 3 개의 아미노산 R-기는 C, W 및 Y로부터 선택된 3 개의 아미노산 유형 각각에 대한 R-기이며, 여기서 C는 CD 가 환원된 후, 비변형된 C 아미노산(CR) 및 CD 및 CR의 조합이다. 일부 구현예에서, 표지되는 3 개의 아미노산 R-기는 C W 및 K로부터 선택된 3 개의 아미노산 유형 각각에 대한 R-기이며, 여기서 C는 CD가 환원된 후, 비변형된 C 아미노산(CR) 및 CD 및 CR의 조합이다. 일부 구현예에서, 표지되는 3 개의 아미노산 R-기는 C, K 및 Y로부터 선택된 3 개의 아미노산 유형 각각에 대한 R-기이며, 여기서 C는 CD가 환원된 후, 비변형된 C 아미노산(CR) 및 CD 및 CR의 조합이다. 일부 구현예에서, 표지되는 4 개의 아미노산 R-기는 C, W, K 및 Y로부터 선택된 4 개 이상의 아미노산 유형 각각에 대한 R-기이고, 여기서 C는 CD가 환원된 후, CD 및 CR의 조합이다. 일부 구현예에서, 표지되는 4 개의 아미노산 R-기는 CR, K, W 및 Y로부터 선택된 4 개의 아미노산 유형 각각에 대한 R-기이다. 일부 구현예에서, 표지되는 4 개의 아미노산 R-기는 C K, W 및 Y로부터 선택된 4 개의 아미노산 유형 각각에 대한 R-기이며, , 여기서 C는 CD가 환원된 후, 비변형된 C 아미노산(CR) 및 CD 및 CR의 조합이다.
일부 구현예에서, 하나의 아미노산 R-기는 각 아미노산 유형에 대해 표지된다. 예를 들어, 각 트립토판 아미노산 상의 인돌 R-기는 아미노산 유형 트립토판에 대해 표지된다. 또 다른 예에서, 각 리신 아미노산 상의 ε-아미노 R-기는 아미노산 유형 리신에 대해 표지된다. 각 아미노산 유형에 대한 R-기는 표 2에 요약된다.
표 2: 각 아미노산 유형에 대한 R-기
Figure pct00077
바람직한 구현예에서, 샘플 내에서 2 개 이상의 아미노산 유형은 형광으로, 동위원소로, 또는 질량 태그를 사용하여 표지된다. 대안적으로, 샘플 내에서 2 개 이상의 아미노산 유형은 뉴클레오티드로 표지된다. 일부 구현예에서, 각 아미노산 유형의 R-기는 형광으로, 동위원소로, 또는 질량 태그를 사용하여 표지된다. 일부 구현예에서, 각 아미노산의 R-기는 뉴클레오티드로 표지된다.
일부 구현예에서, 하나의 아미노산은 하나의 유형의 표지로 표지되고 또 다른 아미노산 유형은 또 다른 유형의 표지로 표지된다. 예를 들어, 하나의 아미노산 유형은 형광 표지로 표지되고 제2 아미노산 유형은 탠덤 질량 태그로 표지된다.
일부 구현예에서, 표지는 형광 표지이다. 일부 구현예에서, 형광 표지는 형광 염료, 형광 태그, 형광 프로브, 또는 형광 단백질이다. 일부 구현예에서, 형광 표지는 형광단을 포함한다. 일부 구현예에서, 형광단은 다음으로 이루어진 군으로부터 선택된다: 하이드록시쿠마린, 아미노쿠마린, 메톡시쿠마린, 캐스케이드 블루, 퍼시픽 블루, 퍼시픽 오렌지, 루시퍼 옐로우, NBD, R-피코에리트린(PE), PE-Cy5 접합체, PE-Cy7 접합체, Red 613, PerCP, TruRed, FluorX, BODIPY-FL, G-DYE100, G-DYE200, G-DYE300, G-DYE400, Cy2, Cy3, Cy3B, Cy3.5, Cy5, Cy5.5, Cy7, TRITC, X-로다민, 리사민 로다민 B, 텍사스 레드, 알로피코시아닌(APC), APC-Cy7 접합체, DAPI, Hoechst 33258, SYTOX Blue, 크로모마이신 A3, 미트라마이신, YOYO-1, ATTO 390, ATTO 425, ATTO 465, ATTO 488, ATTO 495, ATTO 514, ATTO 520, ATTO 532, ATTO Rho6G, ATTO 550, ATTO 565, ATTO Rho3B, ATTO Rho11, ATTO Rho12, ATTO Thio12, ATTO Rho101, ATTO 590, ATTO Rho13, ATTO 594, ATTO 610, ATTO Rho14, ATTO 633, ATTO 647, ATTO 647N, ATTO 655, ATTO Oxa12, ATTO 665, ATTO Oxa12, ATTO 665, ATTO 680, ATTO 700, ATTO 725, ATTO 740, 브릴리언트 바이올렛 421, 브릴리언트 바이올렛 510, 브릴리언트 바이올렛 570, 브릴리언트 바이올렛 605, 브릴리언트 바이올렛 650, 브릴리언트 바이올렛 711, 브릴리언트 바이올렛 750, 브릴리언트 바이올렛 785, TM-BDP, KFL-1, KFL-2, KFL-3, KFL-4, 수퍼 브라이트 436, 수퍼 브라이트 600, 수퍼 브라이트 645, 수퍼 브라이트 702, 수퍼 브라이트 780, 알렉사 플로우르 350, 알렉사 플로우르 405, 알렉사 플로우르 488, 알렉사 플로우르 532, 알렉사 플로우르 546, 알렉사 플로우르 555, 알렉사 플로우르 568, 알렉사 플로우르 594, 알렉사 플로우르 647, 알렉사 플로우르 680, 알렉사 플로우르 850, 쿠마린, 퍼시픽 그린, 오레곤 그린, 플로우레세인(FITC), PE-Cyanine7, PerCP-Cyanine5.5, 테트라메틸로다민(TRITC), eFlour 450, eFlour506, eFlour660, PE-eFlour 610, PerCP-eFlour 710, APC-eFlour 780, 수퍼 브라이트 436, 수퍼 브라이트 600, 수퍼 브라이트 645, 수퍼 브라이트 702, 수퍼 브라이트 780, DAPI, SYTOX Green, SYTO 9, TO-PRO-3, Qdot 525, Qdot 565, Qdot 605, Qdot 655, Qdot 705, Qdot 800, R-피코에리트린(R-PE), , VioBlue, VioGreen, VioBright 515, Vio 515, VioBright FITC, PE, PE-Vio 615, PerCP, PerCP-Vio 700, PE-Vio 770, APC, APC-Vio 770, 1,8-나프탈리미드, 티아졸 오렌지, CyTRAK Orange, LDS 751, 7-AAD, SYTOX Orange, TOTO-3, TO-PRO-3, DRAQ5, DRAQ7, Indo-1, Fluo-3, Fluo-4, DCFH, DHR, SNARF, CFP, GFP(emGFP), RFP(tagRFP), GFP(Y66H 돌연변이), GFP(Y66F 돌연변이), EBFP, EBFP2, 아주라이트, GFPuv, T-Sapphire, mCerulean, mCerulean3 mCFP, mTurquoise2, ECFP, CyPet, GFP(Y66W 돌연변이), mKeima-Red, TagCFP, AmCyan1, mTFP1, GFP(S65A 돌연변이), 미도리이시 시안, 야생형 GFP, GFP(S65C 돌연변이), TurboGFP, TagGFP, GFP(S65L 돌연변이), 에메랄드, GFP(S65T 돌연변이), EGFP, 아자미 그린, ZsGreen1, TagYFP, EYFP, 토파즈, 비너스, mCitrine, YPet, TurboYFP, ZsYellow1, 쿠사비라 오렌지, mOrange, 알로피코시아닌(APC), mKO, TurboRFP, tdTomato, TagRFP, DsRed 단량체, DsRed2("RFP"), mStrawberry, TurboFP602, AsRed2, mRFP1, J-Red, R-피코에리트린(RPE), B-피코에리트린(BPE), mCherry, HcRed1, 카투샤, P3, 페리디닌 엽록소(PerCP), mKate(TagFP635), TurboFP635, mPlum 또는 mRaspberry.
일부 구현예에서, 형광 태그 또는 형광 표지는 형광생성 염료가 아니다. 일부 구현예에서, 형광 태그 또는 형광 표지는 또한 아미노산 유형을 정의하는 R-기에 특이적인 반응성 기를 포함한다. 이 방식으로, 형광 표지는 특정 아미노산 유형을 표적한다. 일부 구현예에서, 관심 아미노산 유형을 표지화하는 것은 관심 아미노산 유형을 공유적으로 표지화하는 것이다. 일부 구현예에서, 반응성 기는 관심 아미노산 유형의 R-기의 선택적 공유 표지화를 허용한다. 일부 구현예에서, 반응성 기는 NHS-에스테르, 말레이미드, 알킨, 아지드, 브로마이드, 클로라이드, 플루오라이드, 요오다이드, 아릴 브로마이드, 아릴 클로라이드, 아릴 플루오라이드, 아릴 요오다이드, 디엔, 디에노필, 올레핀, 테트라진, 사이클로옥틴, 비오틴, 스트렙타비딘, 이소티오시아네이트, 활성 에스테르, 술포닐 클로라이드, 디알데하이드, 요오도아세트아미드, 에틸렌디아민, 아미노아크리돈, 하이드라지드, 카르복실, 또는 알콕시아민으로 이루어진 군으로부터 선택된다. 예를 들어, 친전자성 말레이미드 기가 친핵성 시스테인 티올 잔기를 선택적으로 표적한다는 것이 당업자에 의해 인식된다. 따라서, 상기 나열된 임의의 형광단이 선택되고 말레이미드 반응성 기와 커플링되어, 시스테인 티올 잔기를 선택적으로 표지할 수 있다. 예를 들어, 시스테인 티올 잔기는 수퍼 브라이트 436을 포함하는 형광 표지 및 말레이미드 반응성 기로 표지될 수 있다. 또 다른 예로서, 불안정한 NHS 에스테르 기가 리신 1차 아민 R-기를 선택적으로 표적화하고, 리신 1차 아민 R-기와의 공유 SN2 반응을 겪을 수 있음이 당업자에 의해 인식된다. 따라서, 리신 잔기는 Cy5의 NHS-에스테르 형태로 표지될 수 있다. 이러한 표지화 방법은 당업자에 의해 인식되고 개시된 형광단의 표시된 반응성 형태는 상업적으로 입수가능하다.
일부 구현예에서, 형광 표지는 아미노산 유형과 반응 시 배타적으로 형광이 되는 아미노산 유형 또는 분자를 표적하는 형광생성 염료이다. 바람직하게는, 형광생성 염료는 단백질 내의 특이적 아미노산 유형과 공유적으로 반응한 후 배타적으로 형광이 된다. 이 경우, 형광단을 반응성 기와 커플링할 필요는 없는 데, 아미노산 유형과의 반응 시 배타적으로 형광이 되는 형광생성 염료 또는 분자의 경우, 아미노산 유형에 대한 선택성이 이미 아미노산 유형과의 반응 시 배타적으로 형광이 되는 형광생성 염료 또는 분자의 화학 구조로 구축되기 때문이다. 일부 구현예에서, 아미노산 유형과의 반응 시 배타적으로 형광이 되는 아미노산 유형 또는 분자를 표적하는 형광생성 염료는 4-플루오로-7-술파모일벤조푸라잔(ABD-F), 2,2,2-트리클로로에탄올(TCE) 및/또는 오르토-프탈알데하이드(OPA), 또는 이의 혼합물로 이루어진 군으로부터 선택된다. 바람직하게는, 형광생성 염료는 각 아미노산 유형, 또는 표 2 및 표 3의 R-기에 대해 선택된다. 그러나, 이 목록은 비배타적이며 사용될 수 있는 당업계 내에서 알려진 아미노산 유형과의 반응 시 형광이 되는 임의의 다른 형광생성 염료 또는 분자가 또한 사용될 수 있다. 당업자는 높은 양자 수율의 형광생성 또는 비-형광생성 표지로의 표지화가 단일 분자 수준에서와 같이, 샘플 내에서 매우 낮은 농도의 단백질 식별을 허용할 수 있음을 인식할 것이다. 이는 1 pM 내지 1 nM 사이의 단백질 농도에 상응한다.
일부 구현예에서, 아미노산 유형은 아미노산 유형과의 반응 후 형광이 되거나, 이미 형광인 아미노산 유형의 형광을 가시 스펙트럼으로 이동시키는 분자와 반응한다. 예를 들어, 일부 구현예에서, 아미노산 유형과의 반응 후 플루로에센트(fluroescent)가 되는 분자는 할로 화합물이다. 일부 구현예에서, 할로 화합물은 트리클로로아세트산, 클로로포름, 트리플로우로에탄올, 트리플로우로아세트산, 플로우로포름, 트리브로모에탄올, 트리브로모아세트산, 브로모포름, 트리요오도에탄올, 트리요오도아세트산 또는 요오도포름이다. 일부 구현예에서, 아미노산 유형 트립토판(W) 및/또는 티로신(Y)은 트리클로로에탄올 트리클로로에탄올(TCE), 트리클로로아세트산(TCA), 클로로포름, 트리플루오로에탄올(TFE), 트리플로우로아세트산(TFA), 플로우로포름, 트리브로모에탄올, 트리브로모아세트산(TBA), 브로모포름, 트리요오도에탄올(TIE), 또는 트리요오도아세트산(TIA), 요오도포름으로, 또는, Rh2(OAc)4, tBuHNOH의 존재 하에 2-(2-(2-메톡시에톡시)에톡시)에틸 (E)-2-디아조-4-페닐부트-3-에노에이트로 표지된다. 일부 구현예에서, 아미노산 유형 Y는 트리클로로에탄올(TCE)로 표지되거나, [RhCl(PPh3)3], R2P(OAr),Ar-Br,CsCO3을 사용하여 티로신 하이드록실 기에 아릴 기 오르토를 설치한다.
당업자는 아미노산이 표지될 수 있는 방식을 용이하게 이해할 것이다.
일부 구현예에서, 표지는 아미노산 유형과의 특이적 상호작용에 기반하여 선택된다. 예를 들어, 표지는 형광생성 염료이고 염료가 특이적 아미노산 유형과 반응한 후 단지 형광이 되는(즉, 신호만 검출가능하게 되는) 경우 아미노산 유형과의 특이적 상호작용에 기반하여 선택된다. 일부 구현예에서, 표지의 선택은 변형될 아미노산 유형의 화학에 의해 좌우된다. 일부 구현예에서, 아미노산 유형과의 특이적 반응을 위해, 서로 배타적으로 반응하는 아미노산 유형에 대한 반응성 기 및 표지에 대한 반응성 기가 있다. 이것은 아미노산 유형에 대한 R-기 및 표지에 대한 반응성 기의 특이적 화학적 반응성에 의해 결정된다. 예를 들어, ABD-F는 방향족 시스템 상의 불안정한 위치에 할로겐을 함유하고 친전자성 방향족 치환에 취약하다. 여러 친핵성 아미노산 유형(예를 들어 시스테인, 리신, 히스티딘)이 있지만, 시스테인 아미노산 유형(C)은 가장 강한 친핵체인 데, 가장 분극화가능하기 때문이다. 전자 구름이 더 분극성이기 때문에, 친핵성 공격에 대한 활성화 에너지가 감소한다. 따라서, ABD-F는 시스테인(C) 잔기와 우선적으로 반응하고 더 높은 활성화 에너지를 필요로 하는 리신, 또는 히스티딘 아미노산 유형과 같은 다른 아미노산 유형과 반응하지 않는다.
일부 구현예에서, 표지화 반응은 형광생성 반응이다. 이것은 형광이 아미노산 유형과의 반응 후에 배타적으로 생성되어, 샘플로부터 미반응된 표지를 정제할 필요가 없도록 한다는 것을 의미한다.
일부 구현예에서, 형광생성 반응은 반응을 소멸시키는 형관단으로부터 기를 제거하는 것을 수반한다. 예를 들어, 말레이미드는 말레이미드의 낮은 에너지 nπ* 상태로 인해 형관단에 직접 접합되는 경우 형광단을 소멸시켜 형광단의 여기된 상태의 붕괴를 위한 비-방사성 경로를 제공하고, C=C 이중 결합으로의 광유발 전자 이동(PET)이 발생할 수 있기 때문에 공간 기에 의해 형광단에 연결될 때 형광단을 또한 소멸시킬 수 있는 것으로 알려져 있다. 예를 들어, 말레이미드가 형광 염료 BODIPY에 오르토 위치에서 부착되는 경우, 말레이미드는 염료 BODIPY의 형광을 소멸시킨다. 그러나, o-말레이미드 BODIPY가 시스테인(C) 아미노산 유형의 티올 R-기와 반응하는 경우, C=C 이중 결합은 포화되어 더 이상 형광을 소멸시키지 않으므로, BODIPY 표지가 방출된다. 당업계에 알려진 다른 소멸 기는 아지도, 알킨, 포스핀, 시드논, 테트라진, 또는 옥심을 포함하고 이들은 구리-촉매화/변형-촉진 알킨-아지드 고리화 첨가(CuAAC/SPAAC), 스타우딩거(Staudinger) 결찰, 구리-촉매화된/변형-촉진 신드논-알킨 고리화 첨가(CuSAC/SPSAC), 역 전자 요구 딜스-알더(Diels-Alder) 반응(iEDDA), 또는 1,3- 이극성 고리화 첨가를 포함하는, 형광생성 클릭 반응 후 소멸되지 않을 수 있다.
일부 구현예에서, 형광생성 반응은 형광단을 생성하는 것을 수반한다. 이 유형의 형광생성 반응의 예는 리신(K) 아미노산 유형과 오르토-프탈알데하이드의 반응이다. 두번째 고리가 형성되어, 전자 접합을 확장하고, 이 더 큰 편재된 파이 시스템은 스펙트럼의 가시 영역에서 형광이 된다. 일부 구현예에서, 형광생성 반응은 기존 형광 기질의 형광 특성을 바꾸는 것을 수반한다. 예를 들어, 본질적으로 형광인 아미노산 트립토판은 트리클로로에탄올(TCE)과의 광-촉매화된 라디칼 반응을 거쳐, 트립토판 인돌 고리 상에 알파 하이드록시 케톤을 설치하여, 접합을 확장하고 트립토판 100 nm의 고유한 형광을 스펙트럼을 적색 끝으로 이동시킨다.
아미노산 유형이 특이적으로 및 형광생성적으로 표지될 수 있는 방식을 추가로 예시하기 위해, 형광 염료 및 반응 접근법의 표가 본 발명과 함께 사용하기 위해 아래에 제시되며, 이로부터 각 반응 유형에 대해 적절한 표지 및 반응 전략이 선택될 수 있다.
표 3: 각 아미노산 유형의 각 R-기에 대한 형광생성 표지화
Figure pct00078
Figure pct00079
Figure pct00080
지방족 아미노산의 표지화를 위한 전략은 C-H 결합 작용기화의 최신 영역을 이용한다(DOI: 10.1002/ejoc.201800896). 대안적인 구현예에서, P1 또는 P1' 위치에서 지방족(A, I, L, F 또는 V) 아미노산에 대한 절단 특이성을 갖는 프로테아제를 사용하여 관심 아미노산 유형이 발생할 때마다 단백질 서열을 절단할 수 있다. 그것은 단백질 서열이 절단된 곳마다 새로운 단백질 N-말단을 생성한다. 이것은 프로테아제에 대한 절단 특이성이 알려져 있으므로 용이하게 모델링될 수 있다. 단백질 N-말단은 NHS-에스테르와 같은 N-말단에 특이적인 형광생성 염료를 사용하여 반응할 수 있다. 이 방식으로, N-말단에 특이적인 형광생성 염료는 N-말단이 관심 아미노산 유형에 인접한 경우 배타적으로 반응하며, 따라서, 샘플에서 지방족, 예를 들어 발린(V), 아미노산 유형의 농도는 프로테아제가 V 위치에서 절단하는 경우 생성된 N-말단의 농도에 기반하여 측정된다(그리고 표지의 신호는 V 아미노산 유형의 아미노산 농도에 대해 보고함). 예를 들어, 인간 호중구 엘라스타제는 발린 아미노산에서 절단한다. 관심 단백질에 대한 V 아미노산의 수는 관심 단백질 내에 이미 존재하는 N-말단의 수(단백질 쇄의 수에 기반함)를 첨가하기 위해 조정되고, 이것은 파라미터 방정식 1 세트에 대한 입력으로 사용된다. 일부 구현예에서, 프로테아제는 또한 절단하여, 자체 발린 아미노산으로 인해 신호를 생성하지만, 이는 배경 형광 강도 측정에 혼입된다.
바람직하게는, 아미노산 유형에 대해 표지된 R-기는 아미노산 유형에 대한 R-기이며; 이들은 글리코시드를 함유하는 R-기에 특이적인 글리코시드를 함유하는 R-기의 표지화를 포함하고 TT/n-Bu4NN3 또는 Ph3P:2,3-디클로로-5,6- 디시아노벤조퀴논(DDQ):n-Bu4NN3으로 아지드로의 선택적 전환 이어서 Fl-DIBO와의 반응을 포함한다.
지방산을 함유하는 R-기의 표지화는 지방산을 함유하는 R-기에 특이적이며 이극성 3-메톡시크로멘으로의 표지화를 포함하여, 모든 지질화된 아미노산 유형의 검출을 허용한다. 포스페이트를 함유하는 R-기의 표지화는 카르보닐디이미다졸로 활성화하여 이탈 기를 제공한 후, 시스테인 BODIPY 염료와 반응하는 것을 포함하고, 포스페이트를 함유하는 R-기에 특이적이며, 포스페이트로 변형된 모든 아미노산 유형의 검출을 허용한다.
일부 구현예에서, 아미노산 유형의 변형된 아미노산은 아미노산 유형의 비변형된 아미노산과 상이하게 표지된다. 예를 들어, 아미노산 유형 시스테인의 경우, 비변형된 아미노산(예를 들어 이의 R-기) CR에 대한 표지화 반응은 변형 및 비변형된 아미노산(예를 들어 일단 변형된 아미노산이 환원되면, 이의 R-기)의 조합에 대한 표지화 반응과 상이하다. CR 표지화 반응에서, 환원된 시스테인 아미노산만이 변형에 이용가능하다. 이황화 결합된 시스테인 아미노산은 변형에 이용가능하지 않다. 시스테인의 변형 및 비변형된 아미노산 둘 다를 표지하기 위해, 환원된 시스테인 아미노산 및 이황화 결합된 시스테인 아미노산 둘 다는 표지되어야 한다. 이를 달성하는 한 가지 방식은 표지되기 전에 이황화 결합된 시스테인 아미노산을 환원된 시스테인 아미노산으로 환원시키는 것이다. 바람직하게는, 이황화 결합된 시스테인 아미노산은 모든 환원된 시스테인의 표지화 전에 TCEP로 환원되며, CD가 환원된 후, ABD-F로 새로 환원된 산화된 시스테인 즉, CD 및 CR의 조합을 포함한다. 산화된 시스테인 아미노산의 이 환원은 샘플에서 이황화 결합된 시스테인 아미노산 및 환원된 시스테인 아미노산 둘 다, 즉, CD 및 CR의 조합이 표지되게 한다. 샘플을 다수의 분획으로 분획화함으로써, 샘플 내에서 CD, CR 및/또는 CD 및 CR T 아미노산의 조합을 측정하는 것이 가능하다. 일부 구현예에서, 샘플은 2 개의 분획으로 분리된다. 하나의 분획에서, CR이 표지된다. 제2 분획에서, CD 및 CR의 조합이 표지된다. 표지된 CD의 수는 단백질 당 표지된 CD 및 CR의 조합 수에서 표지된 CR의 수를 뺀 것과 동일하다.
당업자는 펩티드 내의 아미노산 전부 또는 일부가 용매에 노출되고 표지화 반응에 이용가능하지만, 접힌 단백질의 경우 그렇지 않을 수 있다고 인식할 것이다. 일부 구현예에서, 샘플은 표지화 반응 동안 또는 전에 변성된다. 단백질을 변성시키는 방법은 당업계에 알려져 있다. 일부 구현예에서, 이는 디메틸 술폭사이드, 메탄올, 아세토니트릴, 에탄올, 또는 이소프로판올과 같은 혼화성 유기 용매를 첨가하는 것을 통해 달성된다. 일부 구현예에서, 이는 완충액 조건을 pH 2, pH 3, pH 4, pH5, pH 7.5, pH 8.5, pH 9, pH 10, 또는 pH 10.5와 같은 낮거나 높은 pH로 변경하는 것을 통해 달성된다. 일부 구현예에서, 이는 용액을 40℃, 50℃, 60℃, 70℃, 80℃, 90℃, 또는 100℃로 가열함으로써 달성된다. 일부 구현예에서, 이는 TCEP, β-머캅토 에탄올, DTBA, 또는 DTT로 단백질 이황화 결합을 감소시킴으로써 달성된다. 일부 구현예에서, 이는 우레아, 구아니디늄 클로라이드, 또는 구아니디늄 티오시아네이트와 같은 변성제를 첨가함으로써 달성된다. 일부 구현예에서, 이는 나트륨 도데실 술페이트(SDS), 도데실트리메틸암모늄 브로마이드(DTAB), 세틸트리메틸암모늄 브로마이드(CTAB), 포스파티딜콜린,  Triton X-100, Triton X-114, CHAPS, NP-40, 나트륨 1-운데칸술포네이트(SUS) 나트륨 도데실벤젠술포네이트(SDBS), 나트륨 데옥시콜레이트(DOC), 나트륨 스테아레이트, 4-(5-도데실)벤젠술포네이트, 디옥틸 나트륨 술포숙시네이트, 알킬 에테르 포스페이트, 벤즈알코늄 클로라이드(BAC), 및 퍼플루오로옥탄술포네이트(PFOS)와 같은 계면활성제를 첨가함으로써 달성된다. 일부 구현예에서, 샘플 내에 함유된 단백질의 변성은 표지화 반응 동안 달성된다. 일부 구현예에서, 표지화 반응은 본원에 나열된 첨가제의 존재 하에 수행된다. 일부 구현예에서, 샘플 내에 함유된 폴리펩티드의 변성은 폴리펩티드 이황화 결합을 감소시키고 계면활성제를 첨가함으로써 달성된다. 일부 구현예에서, 샘플 내에 함유된 단백질의 변성은 단백질 이황화 결합을 감소시키고 계면활성제를 첨가함으로써 달성된다. 일부 구현예에서, 샘플 내에 함유된 폴리펩티드의 변성은 폴리펩티드 이황화 결합을 감소시키고, 계면활성제를 첨가하고 완충액 조건을 높거나 낮은 pH로 변경함으로써 달성된다. 일부 구현예에서, 샘플 내에 함유된 단백질의 변성은 단백질 이황화 결합을 감소시키고, 계면활성제를 첨가하고 완충액 조건을 높거나 낮은 pH로 변경시킴으로써 달성된다. 일부 구현예에서, 샘플 내에 함유된 단백질의 변성은 TCEP와의 단백질 이황화 결합을 감소시키고 계면활성제 SDS를 첨가시킴으로써 달성된다. 일부 구현예에서, 샘플 내에 함유된 하위단백체 또는 단백체를 포함하는 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및/또는 단백질 복합체의 변성은 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및/또는 단백질 복합체 이황화 결합을 감소시키고 계면활성제를 첨가함으로써 달성된다. 일부 구현예에서, 샘플 내에 함유된 하위단백체 또는 단백체를 포함하는 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및/또는 단백질 복합체의 변성은 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및/또는 단백질 복합체 이황화 결합을 감소시키고, 계면활성제를 첨가하고 완충액 조건을 높거나 낮은 pH로 변경시킴으로써 달성된다. 일부 구현예에서, 샘플 내에 함유된 하위단백체 또는 단백체를 포함하는 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및/또는 단백질 복합체의 변성은 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및/또는 단백질 복합체 이황화 결합을 감소시키고, 계면활성제를 첨가하고 완충액 조건을 높거나 낮은 pH로 변경시킴으로써 달성된다. 일부 구현예에서, 샘플 내에 함유된 하위단백체 또는 단백체를 포함하는 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및/또는 단백질 복합체의 변성은 TCEP와의 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및/또는 단백질 복합체 이황화 결합을 감소시키고 계면활성제 SDS를 첨가함으로써 달성된다. 예를 들어, 표지화 반응은 4% w/v SDS 및 18 mM β-머캅토에탄올의 존재 하에 pH 10에서 수행된다. 또 다른 예로서, 표지화 반응은 4% SDS 및 10 mM TCEP의 존재 하에 pH 10.5에서 수행된다. 일부 구현예에서, 표지화 반응에 대한 다수의 단계가 있다. 일부 구현예에서, 제1 단계는 비변형 또는 변형된 아미노산 유형의 R-기를 표지화에 대해 반응성으로 만들고, 해당 반응에 적합한 일련의 조건 하에 진행한다. 그런 다음 표지화의 제 2 단계는 아미노산 유형의 모든 아미노산의 표지화에 대해 기재된 변성 조건 하에 이제 반응성 R-기와 반응한다. 예를 들어, CD 및 CR 아미노산 유형 조합의 표지화는 먼저 CD 아미노산 아형을 10 mM TCEP로 환원시켜 반응성 티올을 노출시키는 것을 수반하고, pH 7에서 45분 이내에 진행한다. 그런 다음, 노출된 티올을 4% SDS의 존재 하에 pH 10.5에서 ABD-F와 반응시킨다. 또 다른 예로서, 페닐알라닌 표지화의 제1 단계는 R-기를 표지화에 대해 반응성으로 만드는 것이며, 물 중 염기로서 10 mM K2CO3, 및 첨가제로서 1 mM PivOH와 함께 10 μM Pd(OAc)2의 존재 하에 (브로모에티닐)트리이소프로필실란과의 팔라듐 촉매화 알키닐화 반응을 수반한다. 이것은 아지드 기에 대해 특이적으로 반응성인 페닐알라닌 고리에 알킨 기를 설치한다. 표지화 반응의 다음 단계는 5 μM CuSO4 및 25 μM Na 아스코르베이트의 존재 하에 75% H2O/25% BuOH 중 3-아지도-7-하이드록시-2H-크로멘-2-온으로 CuAAc를 수반한다.
일부 구현예에서, CD 및 CR 조합의 아미노산(예를 들어 R-기)은 TCEP로의 환원, 및 완충액 중 나트륨 도데실 술페이트(SDS)로의 변성 후 ABD-F로 형광생성적으로 표지된다. 일부 구현예에서, TCEP 완충액은 HEPES 완충액이고 ABD-F / SDS 완충액은 나트륨 카보네이트 완충액이다. 일부 구현예에서, CD 및 CR 조합의 아미노산은 2-10 mM ABD-F, 2-10% SDS 및 50-500 mM 나트륨 카보네이트 완충액으로 형광생성적으로 표지된다. 일부 구현예에서, CD 및 조합의 아미노산은 80 mM 나트륨 카보네이트 완충액 중 5 mM ABD-F, 4%(SDS)로 형광생성적으로 표지된다. 일부 구현예에서, TCEP 반응의 시기는 약 20 내지 약 40분, 바람직하게는 30분이다. 일부 구현예에서, ABD-F 반응의 시기는 약 5 내지 약 55분, 바람직하게는 약 45분이다.
일부 구현예에서, 환원된 시스테인(CR)의 아미노산, (예를 들어 R-기)은 완충액 중 SDS로 변성 후 ABD-F로 형광생성적으로 표지된다. 일부 구현예에서, 완충액은 나트륨 카보네이트 완충액이다. 일부 구현예에서, CR의 아미노산은 2-10 mM ABD-F, 2-10% SDS 및 50-500 mM 나트륨 카보네이트 완충액으로 형광생성적으로 표지된다. 일부 구현예에서, CR의 아미노산은 80 mM 나트륨 카보네이트 완충액 중 5mM ABD-F, 4% SDS로 형광생성적으로 표지된다.
일부 구현예에서, 리신(K)의 아미노산 유형, (예를 들어 R-기)의 비변형된 아미노산은 완충액 중 OPA, β-머캅토에탄올(BME) 및 SDS로 형광생성적으로 표지된다. 일부 구현예에서, 완충액은 나트륨 카보네이트 완충액이다. 일부 구현예에서, 아미노산은 10-20 mg OPA + 5-10 mL 카보네이트 완충액 + 10-20 μL BME + 1-5 mL 20% SDS로 형광생성적으로 표지된다. 일부 구현예에서, 아미노산은 200 mM 나트륨 카보네이트 완충액 중 12 mM 오르토-프탈알데하이드(OPA), 18 mM 베타-머캅토에탄올(BME), 4% SDS로 형광생성적으로 표지된다. 염료 분자, OPA는 디알데하이드이다. 리신 1차 아민은 하나의 알데하이드를 공격하고 물은 손실된다. 이는 이민, 구체적으로 쉬프 염기를 형성한다. BME에 의해 제시된 티올 친핵체는 이 쉬프 염기를 공격하여, 아민이 다른 펜턴드 알데하이드에 대한 폐환 공격에 다시 이용가능하도록 한다. BME는 반응에 참여하여 형광단을 생성하지만, 다른 티올이 BME 대신에 사용될 수 있다. 물이 손실되고, 접합이 새로 형성된 고리로 확장되어, 스펙트럼의 가시 영역으로 형광이 생성된다.
일부 구현예에서, 트립토판(W)의 아미노산 유형(예를 들어 R-기)의 변형 및 비변형된 아미노산의 조합 및 티로신(Y)의 변형 및 비변형된 아미노산 유형(예를 들어 R-기)의 조합은 TCEP로 환원시키고, 완충액 중 나트륨 도데실 술페이트(SDS)로 변형시킨 후, TCE로 형광생성적으로 표지된다. TCEP는 SDS 변성과 함께, 모든 트립토판(W) 및 티로신(Y) 아미노산이 반응에 이용가능하도록 단백질 내에서 이황화 결합을 감소시킨다. 일부 구현예에서, 완충액은 HEPES 완충액이다. 일부 구현예에서, W 아미노산, Y 아미노산, 또는 W 및 Y 아미노산의 여기된 사태는 TCE와의 라디칼 반응을 거친다. 일부 구현예에서, 반응은 W 아미노산, Y 아미노산, 또는 W 및 Y 아미노산에 의해 흡수되는 파장의 UV 광으로 광-촉매화된다. 일부 구현예에서, W의 아미노산 유형은 260-310 nm의 파장을 갖는 UV 광에 의해 촉매화된 1-10 mM HEPES 중 0.01-5 M TCE, 2-50 mM TCEP 및 2-20% SDS로 형광생성적으로 표지된다. 일부 구현예에서, W의 아미노산 유형은 295-305 nm의 파장을 갖는 UV 광에 의해 촉매화된 5 mM HEPES 중 0.2 M TCE, 10 mM TCEP 및 4% SDS에서 형광생성적으로 표지된다. 일부 구현예에서, Y의 아미노산 유형은 260-310 nm의 파장을 갖는 UV 광에 의해 촉매화된 1-10 mM HEPES 중 0.01-5 M TCE, 2-50 mM TCEP 및 2-20% SDS로 형광생성적으로 표지된다. 일부 구현예에서, Y의 아미노산 유형은 285-295 nm의 파장을 갖는 UV 광에 의해 촉매화된 5 mM HEPES 중 0.2 M TCE, 10 mM TCEP 및 4% SDS에서 형광생성적으로 표지된다.
일부 구현예에서, 아미노산 유형(예를 들어 R-기) 시스테인(C)을 표지화하는 경우, 여기서 시스테인의 변형 및 비변형된 아미노산 둘 다가 표지되며, 시스테인 R-기 내에 함유된 시스테인 티올이 염료 ABD-F에 대한 친전자성 부가/제거 반응에서 친핵체로서 작용하기 전에, 산화된(이황화 결합된) 시스테인은 환원제(TCEP)를 통해 환원된다. 이것은 불소 소멸기의 손실을 초래하여, 염료의 형광이 더 이상 소멸되지 않도록 한다. 아미노산 유형 리신(K)을 표지화하는 경우, R-기 내에 함유된 리신 1차 아민은 OPA 내에 함유된 알데하이드 중 하나를 공격한다. 이것은 반응에 첨가되는 티올(BME)에 의해 공격받은 이민을 형성하여, 나머지 펜던트 알데하이드에 대한 공격을 위한 1차 아민을 방출한다. 이것은 제2 고리를 폐쇄하고 형광을 가시 영역으로 가져오는 방향족 접합을 확장한다.
아미노산 유형 트립토판 및 티로신에 대한 표지화 반응은 광-촉매화된 라디칼 반응이다. 트립토판은 2,2,2-트리클로로에탄올(TCE), 2,2,2-트리클로로아세테이트(TCA) 또는 클로로포름, 뿐만 아니라 다른 디/트리 할로겐화된 화합물로 표지될 수 있다. 트립토판 R-기로부터의 라디칼 및 TCE를 조합하고, 수소 원자가 손실되어 디할로 화합물을 인돌 고리에 첨가한다. 이것은 불안정하고 물 분자에 의해 공격받은 다음, 염산이 손실되어 알파 하이드록시 케톤을 인돌 고리에 첨가하여 트립토판의 고유한 형광을 오른쪽으로 약 100 nm 및 가시 영역으로 이동시킨다. 티로신 반응에 대한 표지화 반응은 또한 티로신의 고유한 형광을 오른쪽으로 약 100 nm 및 가시 영역으로 이동시키는 TCE와의 광-촉매화된 라디칼 반응이다. 티로신의 페놀 R-기는 TCE와 조합하여 트립토판 표지화 반응에서와 동일한 메커니즘을 통해 알파 하이드록시 케톤을 고리에 첨가한다.
이미 본질적으로 형광성인 아미노산 유형을 표지화하면 비표지된 아미노산 유형에 대해 가능하지 않은 정량적 검출을 가능하게 할 수 있음이 발견되었다. 예를 들어, 트립토판 및 티로신 아미노산은 본질적으로 형광성이므로, 본질적으로 형광성인 아미노산을 형광 표지로 표지화하는 것은 반직관적이다. 트립토판 및 티로신 아미노산 유형에 대한 고유한 형광이 3D-단백질 구조 내에서 이들 잔기를 둘러싸는 국소 환경에 매우 의존하므로, 트립토판 및 티로신 아미노산 유형으로부터의 고유한 형광이 단백질 서열 내의 트립토판 및 티로신 잔기의 함량을 나타내지 않을 수 있음이 당업자에 의해 인식된다. 그러나, 이들 아미노산 유형이 표지되는 경우, 형광의 환경적 민감도는 소실되고, 표지된 트립토판 또는 티로신으로부터의 형광은 샘플 내에서 트립토판 또는 티로신 아미노산 유형의 수 또는 농도를 나타낸다. 예를 들어, 형광의 환경적 민감도의 소실이 트리클로로에탄올(TCE)로 표지된 트립토판 및 티로신 아미노산 유형에 대해 관찰된다. 이 예상치 못한 결과는 인돌 또는 페놀 고리 접합이 알파 하이드록시 케톤의 첨가를 통해 확장된 트립토판 또는 티로신의 전자 특성의 변화로 인해, 형광단을 국소 환경의 극성에 덜 민감하게 만들 수 있다.
대안적으로, 형광 표지는 형광 단백질 또는 접합된 항체를 포함한다. 바람직하게는, 형광 단백질은 다음으로 이루어진 군으로부터 선택된다: CFP, GFP(emGFP), RFP(tagRFP), GFP(Y66H 돌연변이), GFP(Y66F 돌연변이), EBFP, EBFP2, 아주라이트, GFPuv, T-Sapphire, mCerulean, mCerulean3 mCFP, mTurquoise2, ECFP, CyPet, GFP(Y66W 돌연변이), mKeima-Red, TagCFP, AmCyan1, mTFP1, GFP(S65A 돌연변이), 미도리이시 시안, 야생형 GFP, GFP(S65C 돌연변이), TurboGFP, TagGFP, GFP(S65L 돌연변이), 에메랄드, GFP(S65T 돌연변이), EGFP, 아자미 그린, ZsGreen1, TagYFP, EYFP, 토파즈, 비너스, mCitrine, YPet, TurboYFP, ZsYellow1, 쿠사비라 오렌지, mOrange, 알로피코시아닌(APC), mKO, TurboRFP, tdTomato, TagRFP, DsRed 단량체, DsRed2("RFP"), mStrawberry, TurboFP602, AsRed2, mRFP1, J-Red, R-피코에리트린(RPE), B-피코에리트린(BPE), mCherry, HcRed1, 카투샤, P3, 페리디닌 엽록소(PerCP), mKate(TagFP635), TurboFP635, mPlum 또는 mRaspberry. 일부 구현예에서, 번역 후 변형에 특이적인 접합된 항체가 본 발명의 방법 내에서 사용될 수 있다. 일부 구현예에서, 접합된 항체는 본원에 제공된 형광 표지 또는 형광단 중 하나로 표지된다. 바람직하게는, 접합된 항체는 전통적으로 또는 합성적으로 유도된 단클론 항체이고, IgG, IgM, IgA, IgE 또는 나노바디(nanobody)를 포함하는 군으로부터 선택된다. 바람직하게는, 항체는 항체 당 하나 또는 형광생성 염료, 형광 표지, 또는 형광단으로 표지된다. 일부 구현예에서, 접합된 항체는 N-아세틸화, 메틸화, 시트룰린으로의 탈이민화, 아스파르트산 또는 이소아스파르트산으로의 탈아미드화, N-연결된 글리코실화, 이소아스파르트산으로의 이성질체화, 이황화-결합 형성, 술펜산, 술핀산 또는 술폰산으로의 산화, 팔미토일화, N, 아세틸화(N-말단), S-니트로실화, 피로글루탐산으로의 고리화(N-말단), 감마-카르복실화, 글루탐산으로의 탈아미드화, 이소펩티드 결합 형성, N-미리스토일화(N-말단), 인산화, 유비퀴틴화, SUMO일화, 글루타민에 이소펩티드 결합 형성, 하이드록실화, N-연결된 유비퀴틴화, 술폭사이드 또는 술폰으로의 산화, 하이드록실화, O-연결된 글리코실화, 모노- 또는 디-산화, 키누레닌의 형성, 또는 황산화를 포함하는 번역 후 변형에 대해 선택적이다.
대안적으로, 표지는 탠덤 질량 태그(TMT)이다. 바람직하게는, 탠덤 질량 태그는 TMTzero, TMTduplex, TMTsimplex, TMT 10-plex, TMTpro 및 TMTpro Zero이다. 대안적으로, 표지는 안정한 동위원소 표지(즉, 동위원소 표지화)이다. 일부 구현예에서, 안정한 동위원소 표지는 비-방사성 동위원소이다. 일부 구현예에서, 비-방사성 동위원소 표지는 2H, 13C, 및/또는 15N이다. 일부 구현예에서, 표지화 전략은 조합하여 사용된다. 예를 들어, 각 아미노산 유형은 화학적으로(예를 들어 형광생성 염료로) 표지된 다음 항체로 표지될 수 있다. 예를 들어, 2 개 이상의 아미노산 유형은 화학적으로 표지된 다음, 예를 들어, 번역 후 변형 특이적 항체를 사용하여 상이한 아미노산 유형의 아미노산의 인산화를 검출한다.
본 발명의 일부로서 포함된 표지화 반응은 샘플의 단백질 구성요소, 또는 샘플에서 특정 관심 단백질을 단리하기 위한 분리 단계 없이, 또는 후에 수행될 수 있음이 당업자에 의해 인식될 것이다. 예를 들어, 추출, 침전 및 분화 가용화, 원심분리, 초원심분리, 초음파처리, 크기 배제 크로마토그래피, 전하 또는 소수성에 기반한 분리(예는 소수성 상호작용 크로마토그래피, 이온 교환 크로마토그래피, 자유 유동 전기영동, 모세관 전기영동 포함), 친화성 크로마토그래피 예컨대 면역친화성 크로마토그래피 및 고성능 액체 크로마토그래피(HPLC), 또는 기술 분야 내에 알려진 다른 방법과 같은 분리 단계가 사용될 수 있다.
일부 구현예에서, 샘플 내의 단백질은 일단 단리되면 농축된다. 이것은 동결건조 또는 한외여과를 수반할 수 있으나 이에 제한되지 않는다. 일부 구현예에서, 샘플 내의 하나 이상의 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체는 일단 단리되면 농축된다.
일부 구현예에서, 표지는 형광 표지이고 2 개 이상의 아미노산 유형은 동일한 조건 하에 동일한 형광 표지로 표지되지만, 표지화 반응은 상이한 속도로 진행된다. 따라서, 특정 시간에 표지의 시간-분해 신호를 측정하면 배타적으로 하나의 표지된 아미노산 유형으로부터 표지의 신호를 나타내는 반면, 또 다른 시간에 표지의 시간-분해 신호를 측정하면 배타적으로 또 다른 표지된 아미노산 유형으로부터, 또는 두 표지된 아미노산 유형으로부터 표지의 신호를 나타내어 첫번째 시간에 표지의 신호를 두번째 시간에 표지의 신호로부터 빼서 배타적으로 두번째 아미노산 유형으로부터의 표지의 신호를 나타낼 수 있도록 한다. 이는 역학적 디콘볼루션이다. 바람직하게는, 각 아미노산 유형에 대한 표지의 검출은 다른 아미노산 유형으로부터 디콘볼루션되어 각 개별 아미노산 유형에 대한 표지가 검출되는 것을 가능하게 한다. 예를 들어, W 및 Y 아미노산 유형은 둘 다 형광생성 표지 TCE로 표지되고, 표지화 반응은 동일한 조건, 5 mM HEPES 중 0.2 M TCE, 10 mM TCEP 및 4% SDS 하에 발생하고 280 nm의 파장을 갖는 UV 광에 의해 광촉매화되지만, 표지화 반응은 상이한 속도로 진행된다. 이 예에서, W 표지화는 Y 표지화 전에 발생한다. 따라서, W 및 Y는 W 잔기만이 표지된 경우 표지화 반응을 중단한 다음 W 및 Y 둘 다가 표지되기에 충분한 시간 동안 반응을 수행함으로써 디콘볼루션되어, Y 및 W 각각의 형광이 샘플에서 측정될 수 있도록 한다. 일부 구현예에서, 샘플에서 Y의 형광은 샘플 내 W 및 Y의 형광에서 샘플 내 W의 형광을 뺀 것과 동일하다. 바람직한 구현예에서, 아미노산 유형 W 및 Y는 서로 디콘볼루션된다. 바람직한 구현예에서, 아미노산 유형 세린 및 트레오닌은 서로 디콘볼루션된다. 바람직한 구현예에서, 아미노산 유형 아스파라긴 및 글루타민은 서로 디콘볼루션된다. 바람직한 구현예에서, 아미노산 유형 글루탐산 및 아스파르트산은 서로 디콘볼루션된다. 바람직한 구현예에서, 아미노산 유형 류신 및 이소류신은 서로 디콘볼루션된다.
디콘볼루션은 표지화 단계에서 달성될 수 있다. 일부 구현예에서, 디콘볼루션은 형광 염료를 형성하는 경우 달성된다. 이 구현예에서, 표지를 형성하는 경우 조건은 동일한 형광 표지로 표지되는 2 개 이상의 아미노산 유형이 서로에 비해 표지와 상이하게 반응하도록 변경된다. 일부 구현예에서, 동일한 표지로 표지된 2 개의 아미노산 유형의 디콘볼루션은 하나의 아미노산 유형이 표지와 반응하고 다른 아미노산 유형이 표지와 반응하지 않는 조건을 선택함으로써 달성될 수 있다. 바람직하게는, 하나의 아미노산 유형의 표지화 반응은 촉매화되고 다른 아미노산 유형의 표지화 반응은 촉매화되지 않는다. 예를 들어, W 및 Y 아미노산 유형의 광-촉매화된 변형 반응의 경우, 표지는 W 아미노산만 또는 W 및 Y 아미노산 둘 다가 광-촉매작용 파장에서 반응을 촉매화하는 데 필요한 광을 흡수하도록 상이한 광-촉매작용 파장에서 형성된다. 일부 구현예에서, W 아미노산 유형은 선택적으로 표지된다. https://www.biotek.com/resources/application-notes/peptide-and-amino-acid-quantification-using-uv-fluorescence-in-synergy-ht-multi-mode-microplate-reader/에 기재된 바와 같이, W 아미노산 및 Y 아미노산의 흡광도 스펙트럼이 상이하다는 것이 당업계에 잘 알려져 있다. W 아미노산 유형은 295 nm보다 더 큰 파장에서 흡수되지만 Y 아미노산 유형은 295 nm보다 더 큰 파장에서 흡수되지 않는다. 따라서, 300 nm와 같이, W 아미노산 유형을 흡수하고 Y 아미노산 유형을 흡수하지 않는 광-촉매작용 파장을 사용함으로써 Y 아미노산 유형의 반응을 촉매화하지 않으면서 W 아미노산 유형의 반응이 촉매화될 수 있다. 대안적으로, W 및 Y 아미노산 유형 둘 다의 표지화는 280 nm와 같이, W 및 Y 아미노산 유형을 둘 다 흡수하는 빛의 파장으로 반응을 촉매화함으로써 달성될 수 있다. 따라서, 여기 광의 파장이 아미노산 유형 Y에서 너무 커서 해당 영역에 흡수되지 않도록 W 아미노산 유형만이 표지되도록 약 300nm에서의 빛을 사용하여 표지를 분리하는 것이 가능하다. 일부 구현예에서, 빛의 스펙트럼, 예를 들어 명시된 영역 내에서 30 nm 대역폭이 사용될 수 있다. 일부 구현예에서, 명시된 영역 내에서 10 nm 대역폭이 사용될 수 있다. 다른 구현예에서 예를 들어 레이저 또는 LED를 통해 빛의 단일 파장이 사용될 수 있다.
일부 구현예에서, 샘플은 하위단백체, 또는 단백체를 함유하거나, 함유하는 것으로 의심된다. 이러한 구현예에서, 샘플 내의 2 개 이상의 아미노산 유형(예를 들어 R-기)은 샘플을 개별 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 구성요소로 분리할 필요 없이 표지된다. 단백체 또는 하위단백체와 같은 복합체 혼합물을 구성요소로 분리하는 것은 상당한 시간 및 노동을 필요로 할 수 있음이 당업자에 의해 인식될 것이다. 단백체 또는 하위단백체 내의 각 개별 단백질을 순차적으로 분석하기 위한 필요조건은 분석에 필요한 시간을 상당히 증가시킴이 당업자에 의해 인식될 것이며, 마치 단백체가 1000 개의 단백질을 함유하는 것처럼 이것은 1000 개의 샘플의 순차적 분석을 필요로 할 것이다, 샘플을 개별 단백질 구성요소로 분리하지 않고 단백체, 하위단백체 또는 혼합물 샘플을 분석하는 본 발명의 능력은 방법의 고처리량을 허용하는 데, 하위단백체, 단백체 또는 혼합물의 분리가 필요하지 않기 때문이다.
표지 측정
샘플에서 표지된 아미노산 유형 각각의 표지가 측정된다. 일부 구현예에서, 표지는 신호를 제공하고, 표지의 신호가 측정된다.
각 아미노산 유형의 측정된 표지는 샘플 내의 해당 아미노산 유형의 농도, 샘플에서 각 아미노산 유형의 아미노산 수, 및 샘플의 단백질 농도와 선형적으로 관련된다. 바람직한 구현예에서, 표지는 형광생성 염료이고, 각 아미노산 유형의 측정된 형광 강도는 샘플 내의 해당 아미노산 유형의 농도, 샘플에서 각 아미노산 유형의 아미노산 수, 및 샘플의 단백질 농도와 선형적으로 관련된다. 바람직한 구현예에서, 표지는 비-형광생성 염료이고 각 아미노산 유형의 비-형광생성 염료의 측정된 신호는 샘플에서 해당 아미노산 유형의 농도, 샘플에서 각 아미노산 유형의 아미노산 수, 및 샘플의 단백질 농도와 선형적으로 관련된다. 바람직하게는, 비-형광생성 염료의 신호는 미반응된 염료를 제거하도록 정제된다. 이것은 크로마토그래피 컬럼에 의해 달성될 수 있다. 일부 구현예에서, 표지는 PCR을 사용하여 증폭될 수 있는 뉴클레오티드 서열이고, 각 아미노산 유형의 측정된 뉴클레오티드 서열은 샘플 내의 해당 아미노산 유형의 농도, 샘플에서 각 아미노산 유형의 아미노산 수, 및 샘플의 단백질 농도와 선형적으로 관련된다. 바람직한 구현예에서, 표지는 질량 태그 또는 동위원소 표지이고, 측정된 태그 또는 동위원소 표지는 샘플 내의 해당 아미노산 유형의 농도, 샘플에서 각 아미노산 유형의 아미노산 수, 및 샘플의 단백질 농도와 선형적으로 관련된다.
일부 구현예에서, 샘플에서 2 개 이상의 아미노산 유형은 상이한 동위원소 표지로 각각 표지되고, 적어도 2 개의 표지된 아미노산 유형의 각 동위원소 표지는 핵 자기 공명(NMR) 및 질량 분광법을 통해 검출된다.
일부 구현예에서, 샘플에서 2 개 이상의 아미노산 유형은 탠덤 질량 태그 시스템 내의 상이한 탠덤 질량 태그로 각각 표지되고 적어도 2 개의 표지된 아미노산 유형 각각의 탠덤 질량 태그는 질량 분광법을 통해 검출된다. 일부 구현예에서, TMTduplex, TMTsixplex, TMT10plex, TMT11plex 또는 TMT16plex 탠덤 질량 태그 시스템이 사용된다. 일부 구현예에서, 탠덤 질량 태그 내의 단백질 반응성 기는 2 개 이상의 아미노산 유형 각각에 특이적이다.
바람직하게는, 표지는 형광, 화학발광, 또는 생물발광이다. 일부 구현예에서, 표지의 스펙트럼 특성이 측정된다. 일부 구현예에서, 표지의 스펙트럼 특성은 표지의 조명 또는 표지의 화학 반응에 따라 측정된다. 표지의 조명에 따라, 빛이 반사, 전송, 흡수, 또는 방출될 수 있다. 표지의 빛의 이러한 반사, 전송, 흡수, 또는 방출이 측정될 수 있다. 바람직하게는, 표지는 형광이고 표지의 빛 방출은 빛의 조사에 반응하여 측정된다. 일부 구현예에서, 하나의 형광으로 표지된 아미노산 유형의 여기 스펙트럼 및 방출 스펙트럼은 두번째 형광으로 표지된 아미노산 유형의 여기 스펙트럼 및 방출 스펙트럼과 구별가능하다. 이는 2 개 이상의 아미노산 유형이 하나의 단일 분획으로 표지되는 경우 바람직하다. 형광 표지는 형광의 고유한 서명을 갖는 샘플에서 각 표지된 아미노산 유형을 제공한다.
일부 구현예에서, 표지는 형광이다. 샘플에서 2 개 이상의 아미노산 유형은 형광생성 염료와 같은 형광으로 각각 표지되고, 적어도 2 개의 표지된 아미노산 유형 각각의 형광 강도가 결정된다. 일부 구현예에서, 적어도 2 개의 표지된 아미노산 유형 각각의 형광생성 표지의 형광 강도는 형광 현미경을 사용하여 검출된다. 일부 구현예에서, 적어도 2 개의 표지된 아미노산 유형 각각의 형광생성 표지의 형광 강도는 형광 플레이트 판독기를 사용하여 검출된다. 일부 구현예에서, 비-형광생성 염료의 형광 강도가 검출된다. 바람직하게는, 비-형광생성 염료는 검출 전에 미반응된 염료로부터 정제된다. 일부 구현예에서, 적어도 2 개의 표지된 아미노산 유형 각각의 비-형광생성 표지의 형광 강도는 형광 현미경을 사용하여 검출된다. 일부 구현예에서, 적어도 2 개의 표지된 아미노산 유형 각각의 비-형광생성 표지의 형광 강도는 형광 플레이트 판독기를 사용하여 검출된다.
일부 구현예에서, 아미노산 유형 Y의 형광 표지의 형광은 약 250nm 내지 약 400nm의 여기 파장 및 약 370nm 내지 약 600nm의 방출 파장에서 측정된다. 바람직하게는, 아미노산 유형 Y의 형광은 약 270nm 내지 약 330nm의 여기 파장 및 약 375nm 내지 약 500nm의 방출 파장에서 측정된다. 일부 구현예에서, 아미노산 유형 Y에 대한 표지는 TCE이고, 단백질 내에 함유된 임의의 이황화 결합을 TCEP로 환원시키고, 완충액 중 나트륨 도데실 술페이트(SDS)로 변성시킨 후 형광은 약 270nm 내지 약 330nm의 여기 파장 및 약 375nm 내지 약 500nm의 방출 파장에서 측정된다.
일부 구현예에서, 아미노산 유형 W의 형광 표지의 형광은 약 250nm 내지 약 400nm의 여기 파장 및 약 370nm 내지 약 600nm의 방출 파장에서 측정된다. 바람직하게는, 아미노산 유형 W의 형광은 약 270nm 내지 약 320nm 또는 약 350nm 내지 약 370nm의 여기 파장 및 약 440nm 내지 약 550nm의 방출 파장에서 측정된다. 일부 구현예에서, 아미노산 유형 W의 형광 표지는 TCE이고, 단백질 내에 함유된 임의의 이황화 결합을 TCEP로 환원시키고, 완충액 중 나트륨 도데실 술페이트(SDS)로 변성시킨 후 형광은 약 250nm 내지 약 400nm의 여기 파장 및 약 370nm 내지 약 600nm의 방출 파장에서 측정된다. 일부 구현예에서, 아미노산 유형 W의 형광 표지는 TCE이고, 단백질 내에 함유된 임의의 이황화 결합을 TCEP로 환원시키고, 완충액 중 나트륨 도데실 술페이트(SDS)로 변성시킨 후 형광은 약 270nm 내지 약 320nm 또는 약 350nm 내지 약 370nm의 여기 파장 및 약 440nm 내지 약 550nm의 방출 파장에서 측정된다.
일부 구현예에서, 아미노산 유형 K의 형광은 약 320nm 내지 약 400nm의 여기 파장 및 약 415nm 내지 약 500nm의 방출 파장에서 측정된다. 바람직하게는, 아미노산 유형 K의 형광은 약 330nm 내지 약 390nm의 여기 파장 및 약 415nm 내지 약 480nm의 방출 파장에서 측정된다. 일부 구현예에서, 아미노산 유형 K의 형광은 표지화 반응이 개시된 후 약 2 내지 약 25초에 측정된다. 바람직하게는, 아미노산 유형 K의 형광은 표지화 반응이 개시된 후 4초 이내에 측정된다. 일부 구현예에서, 아미노산 유형 K는 OPA, β-머캅토에탄올(BME) 및 완충액 중 SDS로 표지되고 형광은 약 320nm 내지 약 400nm의 여기 파장 및 약 415nm 내지 약 500nm의 방출 파장에서 측정된다. 일부 구현예에서, 아미노산 유형 K는 OPA, β-머캅토에탄올(BME) 및 완충액 중 SDS로 표지되고 형광은 약 330nm 내지 약 390nm의 여기 파장 및 약 415nm 내지 약 480nm의 방출 파장에서 측정된다. 일부 구현예에서, 아미노산 유형 K는 OPA, β-머캅토에탄올(BME) 및 완충액 중 SDS로 표지되고 형광은 350nm의 여기 파장 및 460 nm의 방출 파장에서 측정된다.
일부 구현예에서, 아미노산 유형 C의 형광은 약 330nm 내지 약 400nm의 여기 파장 및 약 430nm 내지 약 550nm의 방출 파장에서 측정된다. 바람직하게는, 아미노산 C의 형광은 약 340nm 내지 약 390nm의 여기 파장 및 약 470nm 내지 약 530nm의 방출 파장에서 측정된다. 이러한 여기 및 방출 파장은 환원된 시스테인(CR) 및/또는 CD 및 CR)의 조합 둘 다에 대한 표지를 측정하는 데 사용된다. 일부 구현예에서, 환원된 시스테인(CR)에 대한 형광 표지는 완충액 중 SDS로 변성 후 ABD-F이고 형광은 약 330nm 내지 약 400nm의 여기 파장 및 약 430nm 내지 약 550nm의 방출 파장에서 측정된다. 일부 구현예에서, 환원된 시스테인(CR)에 대한 형광 표지는 완충액 중 SDS로 변성 후 ABD-F이고 형광은 약 340nm 내지 약 390nm의 여기 파장 및 약 470nm 내지 약 530nm의 방출 파장에서 측정된다. 일부 구현예에서, CD 및 CR의 조합에 대한 형광 표지는 ABD-F이고, TCEP로 환원시키고, 완충액 중 나트륨 도데실 술페이트(SDS)로 변성시킨 후 형광은 약 330nm 내지 약 400nm의 여기 파장 및 약 430nm 내지 약 550nm의 방출 파장에서 측정된다. 일부 구현예에서, CD 및 CR의 조합에 대한 형광 표지는 ABD-F이고, TCEP로 환원시키고, 완충액 중 나트륨 도데실 술페이트(SDS)로 변성시킨 후 형광은 약 340nm 내지 약 390nm의 여기 파장 및 약 470nm 내지 약 530nm의 방출 파장에서 측정된다.
바람직하게는, 측정되는 각 아미노산 유형의 형광 표지에 대해, 여기 파장은 임의의 혼선을 피하기 위해 서로 약 10nm 내지 약 20nm만큼 방출 파장으로부터 분리된다. 이것은 여기 빛이 방출 빛에 대한 잘못된 신호를 제공하지 않음을 보장한다. 바람직하게는, 각 아미노산 유형의 형광 표지에 대해, 여기 파장은 임의의 혼선을 피하기 위해 서로 약 15nm 내지 약 20nm만큼 방출 파장으로부터 분리된다.
일부 구현예에서, 표지는 형광 표지이고 2 개 이상의 아미노산 유형은 동일한 조건 하에 동일한 형광 표지로 표지된다(예를 들어 표지가 동일하고, 표지의 농도가 동일하고, 반응을 촉매화하는 데 사용되는 빛의 파장이 동일함). 바람직하게는, 아미노산 유형에 대한 표지의 검출은 각 개별 아미노산 유형에 대한 표지가 검출될 수 있도록 다른 아미노산 유형으로부터 디콘볼루션된다. 예를 들어, W 및 Y 아미노산 유형은 둘 다 형광생성 표지 TCE로 표지된다. 예를 들어, W 및 Y 아미노산 유형은 둘 다 5 mM HEPES 중 0.2 M TCE, 10 mM TCEP 및 4% SDS로 표지되고 아미노산 유형 W 및 아미노산 유형 Y 둘 다를 흡수하는 280 nm의 파장을 갖는 UV 광에 의해 광촉매화된다. 따라서, W 및 Y의 형광 강도는 Y 및 W 각각의 형광이 샘플에서 측정될 수 있도록 디콘볼루션된다. 바람직한 구현예에서, 아미노산 유형 W 및 Y는 서로 디콘볼루션된다. 바람직한 구현예에서, 아미노산 유형 세린 및 트레오닌은 서로 디콘볼루션된다. 바람직한 구현예에서, 아미노산 유형 아스파라긴 및 글루타민은 서로 디콘볼루션된다. 바람직한 구현예에서, 아미노산 유형 글루탐산 및 아스파르트산은 서로 디콘볼루션된다. 바람직한 구현예에서, 아미노산 유형 류신 및 이소류신은 서로 디콘볼루션된다.
일부 구현예에서, 디콘볼루션은 검출 단계에서 달성된다. 바람직하게는, 디콘볼루션은 별개의 여기 파장을 사용한다. 다른 구현예에서, 디콘볼루션은 별개의 방출 파장을 사용한다. 다른 구현예에서, 디콘볼루션은 별개의 여기 및 별개의 방출 파장을 사용한다.
별개의 광-여기 파장은 새로 형성된 염료를 여기하고 염료의 형광이 측정된다. 이 구현예에서, 디콘볼루션은 하나의 아미노산 유형만이 형광 강도에 기여하는 경우 여기 및 방출 파장 쌍을 사용함으로써 달성된다. 별개의 광-여기 파장은 각 아미노산 유형을 표적한다. 예를 들어, TCE로 표지된 W 및 Y 아미노산을 함유하는 단백질은 2 개의 여기 피크를 갖는다. 약 310 nm에서 샘플을 여기하고 약 450-480 nm에서 형광을 측정하는 것은 W 및 Y 아미노산 유형(파장 쌍 1) 둘 다로부터 형광을 검출한다. 그러나, 약 355 nm에서 샘플을 여기하고 약 450-480 nm에서 형광을 측정하는 것은 배타적으로 W 아미노산 유형(파장 쌍 2)으로부터 형광 강도를 측정한다. 이것은 하나의 아미노산 유형, 예를 들어 파장 쌍 2를 통해 W 아미노산 유형에 대한 측정된 표지를 제공한다. 바람직하게는, 샘플에서 표지된 다른 아미노산 유형의 측정된 표지 및 아미노산 유형이 둘 다 검출된 여기-방출 파장 쌍에서 측정된 것은 디콘볼루션 표준을 사용하여 샘플에서 측정된 형광 강도로부터 결정된다.
디콘볼루션 표준은 1 회만 측정하면 되고, 결과는 저장되거나 사용자에게 공급될 수 있다. 여기 및 방출 파장 쌍에서 디콘볼루션되는 아미노산 유형이 샘플에 대해 측정할 때마다 디콘볼루션 표준을 측정할 필요는 없다. 샘플을 측정할 때마다 디콘볼루션 표준을 측정할 필요는 없다.
일부 구현예에서, 디콘볼루션 표준은 다양한 단백질의 공개적으로 이용가능한 아미노산 서열을 액세스하고 성숙한 단백질에서 생물학적으로 절단된 서열의 일부를 제거함으로써 선택된다. 이들 단백질에서 상응하는 아미노산 유형 중 2 개 이상 내의 아미노산 수가 결정된다. 예를 들어, W 및 Y 아미노산 유형이 샘플에서 표지되는 경우, 이들 단백질 서열 내에서 W 및 Y 아미노산의 수가 결정된다.
일부 구현예에서, 디콘볼루션 표준은 샘플에서 표지되고 두 유형의 아미노산이 검출된 파장 쌍에서 디콘볼루션되는 단지 하나의 유형의 아미노산의 아미노산을 포함한다. 예를 들어, 아미노산 유형 W 및 Y가 샘플에서 표지되는 경우, 디콘볼루션 표준은 W 아미노산을 함유하지만, Y 아미노산은 함유하지 않는다. 또 다른 예에서, 디콘볼루션 표준은 Y 아미노산을 함유하지만 W 아미노산은 함유하지 않는다. 바람직하게는, 디콘볼루션 표준은 샘플에 대한 표지 값(예를 들어 신호)이 여기 및 방출 파장 쌍에 기반하여 이미 알려진 표지된 아미노산의 유형만을 함유한다. 디콘볼루션 표준은 두 유형의 아미노산이 검출되는 파장 쌍에서 측정된 총 표지(예를 들어 신호)에 대한 배타적으로 하나의 유형의 아미노산의 기여를 결정하는 데 사용된다.
일부 구현예에서, 디콘볼루션 표준은 트립토판 및 티로신; 류신 및 이소류신; 아스파르트산 및 글루탐산; 세린 및 트레오닌; 및/또는 아스파라긴 및 글루타민의 아미노산 유형을 디콘볼루션하는 데 사용된다. 예를 들어, 디콘볼루션 표준의 선택은 트립토판 및 티로신; 류신 및 이소류신; 아스파르트산 및 글루탐산; 세린 및 트레오닌; 및/또는 아스파라긴 및 글루타민 아미노산 유형의 디콘볼루션에 대해 제시한다. 이들 디콘볼루션 표준은 콘볼루션된 아미노산 유형의 수의 곱이 0이고 콘볼루션된 아미노산 유형의 수의 합이 0이 아닌 인간 혈장 단백체 내의 단백질을 식별함으로써 발견되었다. 일부 구현예에서, 트립토판 및 티로신 아미노산 유형의 디콘볼루션을 위해, 디콘볼루션 표준은 알파-시누클레인 부갑상선 호르몬, 연령-관련 황반변성 감수성 단백질 2, 10 kDa 열 충격 단백질 미토콘드리아, 작은 프롤린-풍부 단백질 2F, 정자 프로타민 P1, 쿠니츠-유형 프로테아제 억제제 4, 스타테린(Statherin), 히스타틴(Histatin)-3, 엘라스틴(Elastin), 베타-디펜신 133, 종양 억제인자 ARF, 콤플렉신(Complexin)-2, B 흑색종 항원 5, 및/또는 셀레노단백질 W를 포함하는 군으로부터 선택된다. 일부 구현예에서, 류신 및 이소류신 아미노산 유형의 디콘볼루션을 위해, 디콘볼루션 표준은 프롤린-풍부 단백질 9, 세린/아르기닌-풍부 스플라이싱 인자 3, 로리크린(Loricrin), 메탈로티오네인-1M 아포지단백질 C-III, 베타-디펜신 124, 및 아연 핑커 단백질 575를 포함하는 군으로부터 선택된다. 일부 구현예에서, 아스파르트산 및 글루탐산 아미노산 유형의 디콘볼루션을 위해, 디콘볼루션 표준은 휴마닌-유사 9, 베타-디펜신 136, 베타-디펜신 4A, 추정 아연 핑거 단백질 726P1, T 세포 수용체 델타 다양성 1 작은 프롤린-풍부 단백질 2A, 작은 통합 막 단백질 38, T 세포 수용체 베타 결합 1-3, 추정 비특성화된 단백질 PRO0628, 작은 프롤린-풍부 단백질 2D, T 세포 수용체 베타 결합 2-5, 섬 아밀로이드 폴리펩티드, 및/또는 추정 비특성화 단백질 URB1-AS1을 포함하는 군으로부터 선택된다. 일부 구현예에서, 세린 및 트레오닌 아미노산 유형의 디콘볼루션을 위해, 디콘볼루션 표준은 사이토크롬 c 옥시다제 어셈블리 인자 1 상동체 , 염기성 타액 프롤린-풍부 단백질 1, 단백질 BEX3, 히스타틴-1, 베타-디펜신 134, 아드로핀(Adropin), 덱사메타손 유도된 단백질, 오쿨로메딘(Oculomedin), 및/또는 단백질 BEX5를 포함하는 군으로부터 선택된다. 일부 구현예에서, 아스파라긴 및 글루타민 아미노산 유형의 디콘볼루션을 위해, 디콘볼루션 표준은 트랜스타이레틴, T-세포 백혈병/림프종 단백질 1A, 고환 발달-관련 단백질 1, 단백질 WFDC11, 유비퀴틴-유사 단백질 FUBI, 및/또는 미토콘드리아 유입 수용체 하위단위 TOM7 상동체를 포함하는 군으로부터 선택된다.
디콘볼루션된 표지된 아미노산 유형 중, 별도로 검출된 아미노산 유형만을 함유하고 별도로 검출되지 않은 아미노산 유형을 함유하지 않는 디콘볼루션 표준은 형광으로 표지되고 형광은 두 아미노산 유형이 검출된 여기 및 방출 파장 쌍(파장 쌍 1)에서 검출된다. 그런 다음 동일한 형광으로 표지된 디콘볼루션 표준으로부터의 형광은 하나의 아미노산 유형만이 검출된 여기 및 방출 파장 쌍(파장 쌍 2)에서 측정된다. 디콘볼루션 표준의 단백질 농도는 알 필요가 없다. 바람직하게는, 디콘볼루션 표준의 동일한 용액은 파장 쌍 1 및 파장 쌍 2에서 측정되므로, 파장 쌍 1 및 파장 쌍 2에서 측정된 용액의 상대 및 절대 단백질 농도는 동일하다. 파장 쌍 1 및 파장 쌍 2에서 측정된 용액의 상대 단백질 농도가 변경되는 경우(예를 들어 샘플이 동일한 부피의 용액을 동일한 부피의 완충액에 첨가함으로써 2 배로 희석된 경우), 이 희석 계수에 주목하고, 디콘볼루션 표준이 희석된 파장 쌍에 대한 측정된 신호에 희석 계수를 곱하여 희석되지 않은 용액의 측정된 신호를 수득한다. 이 임의적 희석 조정 단계 후, 파장 쌍 1에서 표지된 디콘볼루션 표준에 대한 측정된 신호를 파장 쌍 2에서 표지된 디콘볼루션 표준에 대한 측정된 신호로 나누어, 파장 신호 전환을 초래한다. 그런 다음, 하나의 아미노산 유형만이 검출된 파장 쌍 2에서 샘플에 대한 표지의 신호에 파장 신호 전환을 곱하여, 별도로 검출된 아미노산 유형에서 파생된 파장 쌍 1에서 신호를 나타낸다. 이 신호를 파장 쌍 1에서 총 신호로부터 빼서 다른 아미노산 유형으로부터 배타적으로 신호를 나타낸다. 이 방식으로, 2 개의 아미노산 유형에서 파생된 신호는 2 개의 신호로 분할되며, 각각은 하나의 아미노산 유형으로부터 배타적으로 파생되므로, 신호의 수는 샘플에서 표지되고 측정된 아미노산 유형의 수와 동일하다. 예를 들어, W 아미노산만을 함유하고 임의의 Y 아미노산을 함유하지 않는 디콘볼루션 표준은 형광으로 표지되고 형광은 W 및 Y 아미노산 유형 둘 다가 검출된 여기 및 방출 파장 쌍(파장 쌍 1; 여기: 310 nm, 방출: 450 nm)에서 검출된다. 그런 다음 동일한 형광으로 표지된 디콘볼루션 표준 용액으로부터의 형광은 W 아미노산 유형만이 검출된 여기 및 방출 파장 쌍(파장 쌍 2; 여기: 355 nm, 방출: 450 nm)에서 측정된다. 동일한 형광으로 표지된 디콘볼루션 표준 용액은 파장 쌍 1 및 2에서 측정되므로, 희석되지 않는다. 파장 쌍 1에서 표지된 디콘볼루션 표준에 대한 측정된 신호를 파장 쌍 2에서 표지된 디콘볼루션 표준에 대한 측정된 신호로 나누어, 파장 신호 전환을 초래한다. 그런 다음, W 아미노산 유형만이 검출된 파장 쌍 2에서 샘플에 대한 표지의 신호에 파장 신호 전환을 곱하여, W 아미노산 유형으로 인한 파장 쌍 1에서 신호를 나타낸다. 이 신호는 파장 쌍 1에서 총 신호에서 빼서 아미노산 유형으로부터 배타적으로 신호를 나타낸다.
대안적으로, 알려진 단백질 농도의 2 개의 디콘볼루션 표준은 동일한 여기 및 방출 파장 쌍에서 검출된 아미노산의 2 개의 표지된 유형 사이를 디콘볼루션하는 데 사용된다. 디콘볼루션되는 표지된 아미노산 유형 중에서, 첫번째 디콘볼루션 표준은 하나의 아미노산 유형만이 검출된 여기-방출 파장 쌍(파장 쌍 2)에 기반하여 신호가 알려지지 않은 아미노산 유형만을 갖는다. 두번째 디콘볼루션 표준은 신호가 알려진 아미노산 유형 및 신호가 알려지지 않은 아미노산 유형 둘 다를 갖는다. 첫번째 디콘볼루션 표준은 두 아미노산 유형이 검출된 여기-방출 파장 쌍(파장 쌍 1)에서 측정된다. 두번째 디콘볼루션 표준은 두 아미노산 유형이 검출된 여기-방출 파장 쌍(파장 쌍 1)에서 측정된다. 첫번째 디콘볼루션 표준에서 검출된 아미노산 유형의 아미노산 농도는 알려져 있는 데, 이 아미노산 유형의 아미노산 수가 알려져 있고 첫번째 디콘볼루션 표준의 단백질 농도가 알려져 있기 때문이며; 이들을 곱하여 첫번째 디콘볼루션 표준에서 이 아미노산 유형의 아미노산 농도를 나타낸다. 파장 쌍 1에서 첫번째 디콘볼루션 표준에 대해 측정된 신호를 파장 쌍 1에서 첫번째 디콘볼루션 표준에 대한 이 아미노산 유형의 아미노산 농도로 나누어 첫번째 디콘볼루션 표준에 존재하는 디콘볼루션되는 아미노산 유형에 대한 아미노산 농도 당 신호를 나타낸다. 두번째 디콘볼루션 표준에서 디콘볼루션되는 두 아미노산 유형의 아미노산 농도가 알려져 있는 데, 두번째 디콘볼루션 표준에서 두 아미노산 유형의 수가 알려져 있고 두번째 디콘볼루션 표준의 단백질 농도가 알려져 있기 때문이다. 첫번째 디콘볼루션 표준에 제공된 아미노산 유형의 아미노산 농도에 첫번째 디콘볼루션 표준을 사용하여 계산된 해당 아미노산 유형에 대한 아미노산 농도 당 신호를 곱한다. 이것은 두번째 디콘볼루션 표준 내에서 해당 아미노산 유형에 대한 신호를 제공한다. 파장 쌍 1에서 두번째 디콘볼루션 표준 내의 해당 아미노산 유형에 대한 신호를 파장 쌍 1에서 측정된 총 신호에서 빼서, 파장 쌍 1에서 다른 아미노산 유형에 대한 신호를 나타낸다. 이것은 신호가 파장 쌍 2에서 별도로 검출된 동일한 아미노산 유형이다. 파장 쌍 1에서 두번째 디콘볼루션의 이 아미노산 유형에 대한 측정된 신호를 파장 쌍 2에서 두번째 디콘볼루션 표준의 이 아미노산 유형에 대한 측정된 신호로 나누어, 파장 신호 전환을 초래한다. 그런 다음, 하나의 아미노산 유형만이 검출된 파장 쌍 2에서 샘플에 대한 표지의 신호에 파장 신호 전환을 곱하여, 별도로 검출된 아미노산 유형으로부터 파생된 파장 쌍 1에서 신호를 나타낸다. 이 신호를 파장 쌍 1에서 총 신호에서 빼서 다른 아미노산 유형으로부터 배타적으로 신호를 나타낸다. 이 방식으로, 2 개의 아미노산 유형으로부터 파생된 신호는 2 개의 신호로 분할되며, 각각은 하나의 아미노산 유형으로부터 배타적으로 유도되므로, 신호의 수는 샘플에서 표지되고 측정된 아미노산 유형의 수와 동일하다. 예를 들어, 첫번째 디콘볼루션 표준은 Y 아미노산만을 함유하고 임의의 W 아미노산을 함유하지 않는다. 첫번째 디콘볼루션 표준은 알려진 Y 아미노산 농도를 갖는다. 두번째 디콘볼루션 표준은 Y 및 W 아미노산 둘 다를 함유한다. 두번째 디콘볼루션 표준은 알려진 Y 및 알려진 W 아미노산 농도를 갖는다. 첫번째 디콘볼루션 표준은 형광으로 표지되고 형광은 W 및 Y 아미노산 유형이 둘 다 검출되는 여기 및 방출 파장 쌍(파장 쌍 1; 여기: 310 nm, 방출: 450 nm)에서 검출된다. 두번째 디콘볼루션 표준은 형광으로 표지되고 형광은 W 및 Y 아미노산 유형이 둘 다 검출되는 여기 및 방출 파장 쌍(파장 쌍 1; 여기: 310 nm, 방출: 450 nm)에서 검출된다. 파장 쌍 1에서 첫번째 디콘볼루션 표준에 대한 형광 강도를 첫번째 디콘볼루션 표준에 대한 Y 아미노산 유형의 아미노산 농도로 나누어 Y 아미노산 농도 당 형광 강도를 나타낸다. Y 아미노산 농도 당 이 형광 강도에 두번째 디콘볼루션 표준의 알려진 Y 아미노산 농도를 곱하여 파장 쌍 1에서 두번째 디콘볼루션 표준의 Y 아미노산 유형으로부터의 형광 강도를 나타낸다. 이는 파장 쌍 1에서 두번째 디콘볼루션 표준에 대해 측정된 총 형광 강도를 빼서 파장 쌍 1에서 W 아미노산 유형에 대한 형광 강도를 나타낸다. 파장 쌍 1에서 두번째 디콘볼루션 표준의 W 아미노산 유형에 대한 형광 강도를 파장 쌍 2(파장 쌍 2; 여기: 355 nm, 방출: 450 nm)에서 두번째 디콘볼루션 표준의 W 아미노산 유형에 대한 형광 강도로 나누어 파장 신호 전환을 나타낸다. 파장 쌍 2에서 샘플에 대해 측정된 W 아미노산 유형에 대한 형광 강도에 파장 신호 전환을 곱하여 파장 쌍 1에서 W 아미노산 유형에 대해 측정된 형광 강도를 수득한다. 파장 쌍 1에서 샘플의 W 아미노산 유형에 대해 측정된 형광 강도를 파장 쌍 1에서 샘플의 두번째 디콘볼루션 표준에 대해 측정된 형광 강도로부터 빼서 파장 쌍 1에서 샘플의 Y 아미노산 유형에 대해 측정된 형광 강도를 나타낸다. 이 방식으로 , W 및 Y 아미노산 유형에 대한 별개의 형광 강도를 수득한다.
그런 다음 동일한 형광으로 표지된 디콘볼루션 표준 용액으로부터의 형광은 W 아미노산 유형만이 검출된 여기 및 방출 파장 쌍(파장 쌍 2; 여기: 355 nm, 방출: 450 nm)에서 측정된다. 동일한 형광으로 표지된 디콘볼루션 표준 용액은 파장 쌍 1 및 2에서 측정되므로, 희석되지 않았다. 파장 쌍 1에서 표지된 디콘볼루션 표준에 대해 측정된 신호를 파장 쌍 2에서 표지된 디콘볼루션 표준에 대해 측정된 신호로 나누어, 파장 신호 전환을 초래한다. 그런 다음, W 아미노산 유형만이 검출된 파장 쌍 2에서 샘플에 대한 표지의 신호에 파장 신호 전환을 곱하여, W 아미노산 유형으로부터 파생된 파장 쌍 1에서의 신호를 나타낸다. 이 신호를 파장 쌍 1에서의 총 신호에서 빼서 Y 아미노산 유형으로부터 배타적으로 신호를 나타낸다.
대안적으로, 형광 강도의 신호는 시간에 따라 디콘볼루션될 수 있다. 예를 들어, 하나의 표지화 반응의 역학은 또 다른 표지화 반응의 역학보다 더 빠를 수 있다. 일부 구현예에서, 신호를 모니터링하고 하나의 표지화 반응이 완료에 도달하였고 다른 표지화 반응이 시작되지 않은 시점에서 측정을 수행한다. 일부 구현예에서, 형광 강도를 모니터링하고 하나의 표지화 반응이 완료에 도달하였고 다른 표지화 반응이 시작되지 않은 시점에서 측정을 수행한다.
일부 구현예에서, 측정된 표지는 배경 보정된다. 바람직한 구현예에서, 측정된 표지는 형광 강도이고, 각 표지된 아미노산 유형에 대한 형광 강도는 배경 보정된다. 형광 배경을 형광 강도로부터 빼서 배경 보정된 형광 값을 생성한다. 당업계에 알려진 임의의 배경 보정 기술이 사용될 수 있다. 일부 구현예에서, 배경 형광을 계산하기 위해, 형광 염료 용액은 단백질보다는 동일한 부피의 완충액과 조합된다. 일부 구현예에서, 형광 염료 용액은 표지화 반응 동안 공급된 단백질-함유 용액의 부피와 동일한 부피의 완충액과 조합된다. 염료 및 완충액 용액으로부터 검출된 형광 강도를 염료 및 단백질 용액으로부터 검출된 형광 강도로부터 빼서 배경 보정된 형광 서명을 생성한다. 대안적으로, 적정 곡선을 사용하여 배경으로 식별될 수 있는 형광의 낮은 농도 한계를 결정할 수 잇다. 검출 한계는 이 한계를 넘어 검출가능한 첫번째 단백질 농도로서 식별된다.
샘플에서 아미노산 유형의 측정된 표지는 샘플에서 해당 아미노산 유형의 아미노산 농도와 관련된다. 일부 구현예에서, 샘플에서 아미노산 유형의 측정된 표지는 샘플에서 해당 아미노산 유형의 아미노산 농도와 선형적으로 관련된다. 일부 구현예에서, 샘플에서 아미노산 유형의 측정된 표지는 샘플에서 해당 아미노산 유형의 아미노산 농도와 비선형적으로 관련된다. 일부 구현예에서, 비선형 관계의 예는 멱함수, 다항식 방정식, 또는 지수 방정식을 포함한다. 일부 구현예에서, 샘플에서 아미노산 유형의 측정된 표지는 다항식 방정식을 사용한 샘플에서 해당 아미노산 유형의 아미노산 농도와 관련된다.
각 표지된 아미노산 유형의 측정된 표지, 아미노산 농도 또는 아미노산 수는 샘플에서 해당 표지된 아미노산 유형에 대한 서명을 제공한다. 샘플에서 표지된 아미노산 유형 각각의 서명은 샘플에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 양을 식별하기 위한 참조에서 동일한 아미노산 유형의 서명과 비교될 수 있다.
아미노산 유형의 모든 아미노산이 샘플에서 표지되고, 임의의 아미노산 또는 단백질이 교정 곡선 또는 표준에 대해 사용되는 경우, 측정된 표지(예를 들어 표지의 신호)는 샘플에서 해당 아미노산 유형의 모든(예를 들어 100%) 아미노산의 농도 및/또는 모든(예를 들어 100%) 아미노산의 수를 나타낸다. 동일한 비율(예를 들어 80%)의 아미노산 유형의 아미노산이 샘플에서 표지되고 임의의 아미노산 또는 단백질이 교정 곡선 또는 표준에 대해 사용되는 경우, 측정된 표지(예를 들어 표지의 신호)는 샘플에서 해당 아미노산 유형의 모든(예를 들어 100%) 아미노산의 농도 및/또는 모든(예를 들어 100%) 아미노산의 수를 나타낸다. 이것은 동일한 비율의 아미노산이 측정된 임의의 단백질에서 표지되는 경우, 이 비율이 측정된 표지(예를 들어 표지의 신호)와 샘플에 대한 농도 또는 아미노산 수 사이의 전환을 제외하기 때문이다.
각 표지된 아미노산 유형의 농도 측정
일부 구현예에서, 샘플에서 각 표지된 아미노산 유형의 농도가 측정된다. 일부 구현예에서, 샘플에서 각 표지된 아미노산 유형의 농도는 아미노산 유형의 측정된 표지(예를 들어 표지의 측정된 신호)로부터 계산된다. 일부 구현예에서, 샘플에서 아미노산 유형의 농도는 샘플에서 해당 아미노산 유형의 측정된 형광 강도로부터 계산된다. 일부 구현예에서, 샘플에서 각 표지된 아미노산 유형의 농도와 측정된 표지 사이에 선형 관계가 있다. 대안적인 구현예에서, 샘플에서 각 표지된 아미노산 유형의 농도와 측정된 표지 사이에 비선형 관계가 있다. 일부 구현예에서, 이 비선형 관계의 예는 다항식 관계, 멱함수 관계, 또는 지수 관계를 포함한다. 일부 구현예에서, 샘플에서 각 표지된 아미노산 유형의 농도와 측정된 표지 사이에 다항식 관계가 있다. 일부 구현예에서, 샘플에서 각 표지된 아미노산 유형의 농도와 측정된 표지 사이에 멱함수 관계가 있다. 일부 구현예에서, 샘플에서 각 표지된 아미노산 유형의 농도와 측정된 표지 사이에 지수 관계가 있다. 일부 구현예에서, 2 개 이상의 아미노산 유형이 형광 염료로 표지되는 경우, 샘플에서 각 표지된 아미노산 유형의 농도와 측정된 형광 강도 사이에 선형 관계가 있다. 일부 구현예에서, 2 개 이상의 아미노산 유형이 형광생성 염료로 표지되는 경우, 샘플에서 각 표지된 아미노산 유형의 농도와 측정된 형광 강도 사이에 선형 관계가 있다. 샘플에서 해당 아미노산 유형의 농도가 증가함에 따라 형광 강도가 증가한다.
일부 구현예에서, 샘플에서 2 개 이상의 표지된 아미노산 유형 각각의 아미노산의 농도는 교정 곡선 또는 표준을 사용하여 샘플에서 동일한 2 개 이상의 아미노산 유형의 측정된 표지로부터 결정된다. 교정 곡선 또는 표준은 알려지지 않은 샘플을 표준 샘플 세트, 또는 알려진 농도의 하나의 표준 샘플과 비교함으로써 알려지지 않은 샘플에서 물질의 농도를 결정하는 일반적인 분석 화학 방법이다. 교정 곡선을 사용하는 경우, 아미노산 유형의 알려진 농도의 하나 초과의 표준에 대한 표지 값이 표시된다. 데이터는 교정 곡선에 맞춤하고, 교정 곡선은 표지된 아미노산 유형의 아미노산 농도와 아미노산 유형의 표지 값 사이의 관계를 제공한다. 아미노산 유형의 알려진 아미노산 농도의 단일 표준이 표시하는 경우, 전체 교정 곡선은 이용가능하지 않고, 표지된 아미노산 유형의 아미노산 농도 및 단일 단백질 표준의 아미노산 유형의 표지 값은 표지된 아미노산 유형의 아미노산 농도와 아미노산 유형의 표지 값 사이의 관계를 제공한다. 단일 단백질 표준으로 이용가능한 정보가 적기 때문에, 이것은 아미노산 유형의 표지 값과 아미노산 농도 사이의 관계가 선형이고 원점을 통과하는 경우, 및 아미노산 유형의 표지 값이 배경 보정된 경우 사용될 수 있다.
일부 구현예에서 표지의 신호는 각 아미노산 유형에 대한 교정 플롯을 제공하기 위해 각 교정 단백질의 각 아미노산 농도에 대한 아미노산 농도의 함수로서 표시된다. 일부 구현예에서, 표지의 신호는 측정되고 임의 단위(AU)로 표시된다. 각 교정 표시는 교정 곡선을 제공하는 데 맞춤하다. 일부 구현예에서, 교정 곡선은 형광 강도, 또는 배경 보정된 형광 강도와 샘플에서 각 표지된 아미노산 유형의 아미노산 농도 사이의 관계를 결정한다. 일부 구현예에서, 형광 강도 또는 배경 보정된 형광 강도는 임의 단위(AU)로 표시된다. 예를 들어, 교정 곡선은 아미노산 유형 트립토판(W)에 대해 측정된 형광 강도와 W의 상응하는 아미노산 농도 사이의 관계를 결정한다.
일부 구현예에서, 교정 곡선을 제공하기 위해 (선형) 교정 플롯을 맞춤화하는 것은 선형 최소 제곱 회귀를 수행하는 것이다. 방정식은 아미노산 유형의 표지의 신호와 아미노산 농도 사이를 보정하기 위해 최적 맞춤 선에 대해 계산된다. 일부 구현예에서 이것은 선형 방정식이다. 일부 구현예에서, 이 선형 맞춤은 원점을 통과하도록 제한된다.
일부 구현예에서, 최적 맞춤 선이 선형 회귀를 사용하여 계산되는 경우, 아미노산 유형 n에 대한 최적 맞춤 선의 방정식은 방정식 5이다:
Figure pct00081
여기서 표지 값 n 은 AU의 아미노산 유형 n의 표지 값이고, m n 은 AU의 최적 맞춤 선 / 아미노산 유형 n에 대한 아미노산 농도의 기울기이고, A.A. 농도 n 은 아미노산 유형 n의 아미노산 농도이고, b n 은 아미노산 유형 n의 아미노산 농도가 0인 경우 표지 값이다. 맞춤의 출력은 m n b n 이다.
샘플에 대한 아미노산 유형의 신호가 측정되는 경우, 맞춤에 의해 결정된 교정은 샘플에 대한 아미노산 유형에 대해 측정된 신호를 샘플의 아미노산 유형의 아미노산 농도로 변환하는 데 사용될 수 있다. 일부 구현예에서, 방정식 5로부터의 맞춤의 출력은 방정식 6을 사용하여, AU의 아미노산 유형 n의 표지 값을 아미노산 유형 n의 아미노산 농도로 전환하는 데 사용된다:
Figure pct00082
여기서 A.A. 농도 n 은 아미노산 유형 n의 아미노산 농도이고, 표지 값 n 은 AU의 아미노산 유형 n의 측정된 표지 값이고, b n 은 아미노산 유형 n의 아미노산 농도가 0인 경우 표지 값이고, m n 은 AU의 계산된 최적 맞춤 선 / 아미노산 유형 n에 대한 아미노산 농도의 기울기이다. 일부 구현예에서, 이것은 교정 함수의 역으로 기재되며; 방정식 5의 맞춤이 반전되었기 때문에 교정 함수의 역이다.
일부 구현예에서, 최적 맞춤 선이 선형 회귀를 사용하여 계산되는 경우, 아미노산 유형 n에 대한 최적 맞춤선의 방정식은 방정식 7이다:
Figure pct00083
여기서 표지 값 n 은 AU의 아미노산 유형 n의 표지 값이고, m n 은 AU의 최적 맞춤 선 / 아미노산 유형 n에 대한 아미노산 농도의 기울기이고, A.A. 농도 n 은 아미노산 유형 n의 아미노산 농도이다. 맞춤의 출력은 m n 이다. 일부 구현예에서, 선형 맞춤이 원점을 통과하도록 제한되는 경우 방정식 7이 사용된다.
일부 구현예에서, 방정식 7로부터의 맞춤의 출력은 방정식 8을 사용하여, AU의 아미노산 유형 n의 표지 값을 아미노산 유형 n의 아미노산 농도로 전환하는 데 사용된다:
Figure pct00084
여기서 A.A. 농도 n 은 아미노산 유형 n의 아미노산 농도이고, 표지 값 n 은 AU의 아미노산 유형 n의 측정된 표지 값이고, m n 은 AU의 계산된 최적 맞춤 선 / 아미노산 유형 n에 대한 아미노산 농도의 기울기이다. 일부 구현예에서, 선형 맞춤이 원점을 통과하도록 제한되는 경우 방정식 8이 사용된다. 일부 구현예에서, m n 은 교정 곡선의 선의 기울기인 교정 계수이고,
Figure pct00085
은 아미노산 유형 n에 대한 교정 계수의 역으로 기재되며; 이것은 방정식 7로부터의 맞춤이 반전되었기 때문에 교정 계수의 역수이다. 교정 계수의 역수는 교정 곡선의 선의 기울기의 역수이고, 아미노산 유형 n의 측정된 값에 이를 곱하여 아미노산 유형 n에 대한 아미노산 농도를 계산한다. 예를 들어, 표지의 신호는 5 개의 교정 단백질의 1 μM, 5 μM, 10 μM, 20 μM, 50 μM, 및 100 μM 아미노산 농도에 대해 표시된다. 보정되는 하나의 아미노산 유형에 대해 하나의 플롯이 있으므로, 아미노산 유형 트립토판(W)에 대한 하나의 플롯 및 아미노산 유형 리신(K)에 대한 또 다른 플롯이 있고 최적 맞춤 선의 기울기가 이들 플롯에 대해 개별적으로 계산되며; 기울기는 관련되지 않는다. 아미노산 유형 트립토판(W)에 대한 최적 맞춤선의 기울기는 10 AU/ μM이므로, 교정 계수는 0.1 μM / AU이다. 아미노산 유형 리신(K)에 대한 최적 맞춤 선의 기울기는 50 AU / μM이므로, 교정 계수는 0.02 μM / AU이다.
샘플에 대한 표지의 측정된 신호가 샘플에 대한 표지된 아미노산 농도으로 변환될 때마다 이 단계를 수행할 필요는 없다. 일부 구현예에서, 각 표지된 아미노산 유형에 대한 교정 곡선은 각 아미노산 유형에 대한 표지화 반응에 대한 선형성 범위를 포함하고 이를 넘어 확장한다. 일부 구현예에서, 교정 곡선을 계산하기 위해 사용되는 데이터는 선형 최소 제곱 회귀가 편향되지 않도록 아미노산 농도에서 동일한 간격을 함유한다. 일부 구현예에서, 교정 곡선을 계산하기 위해 사용되는 데이터는 정규화된다. 일부 구현예에서, 넓은 아미노산 농도 범위가 조사되는 경우 맞춤이 더 높은 아미노산 농도에 대해 편향되는 것을 피하기 위해 맞춤 전에 아미노산 농도 및 신호 데이터의 로그를 취한다.
대안적으로, 교정 계수는 아미노산 또는 단백질의 알려진 아미노산 농도를 함유하는 표준 용액의 표지의 신호를 아미노산 또는 단백질의 알려진 아미노산 농도로 나눔으로써 결정된다. 일부 구현예에서, 각 아미노산 유형에 대한 교정 계수는 하나의 표준(교정 단백질 또는 아미노산)의 하나의 아미노산 농도로부터의 데이터를 사용하여 결정된다. 교정 곡선은 이 구현예에서 이용가능하지 않는 데 교정에 대해 사용되는 점이 단지 1 개이고, 곡선은 적어도 2 개의 점을 필요로 하기 때문이다. 각 표준은 교정되는 아미노산 유형의 알려진 아미노산 농도를 갖거나, 교정되는 아미노산 유형의 알려진 단백질 농도 및 아미노산 수를 곱하여 교정되는 아미노산 유형의 아미노산 농도를 제공한다. 교정되는 아미노산 유형의 전체 또는 일정한 비율이 표지되므로, 각 교정 단백질에 대해 측정된 표지의 신호는 각 교정 단백질에 대해 교정되는 아미노산 유형의 아미노산 농도에 비례한다. 교정되는 아미노산 유형에 대한 아미노산 농도를 교정되는 아미노산 유형에 대해 측정된 표지의 신호로 나누어 측정된 표지의 신호 당 아미노산 농도를 제공한다. 예를 들어, 10 μM의 아미노산 유형 트립토판(W)에 대해 측정된 표지의 신호는 100 AU이다. 따라서, 아미노산 유형 트립토판(W)에 대한 교정 계수는 10 μM / 100 AU = 0.1 μM / AU이다. 10 μM의 아미노산 유형 리신(K)에 대해 측정된 신호는 500 AU이다. 따라서, 아미노산 유형 리신(K)에 대한 교정 계수는 10 μM / 500 AU = 0.02 μM / AU이다. 이것은 실험에서 표지되고 측정될 아미노산 유형 각각에 대해 수행된다. 예를 들어, 2 개의 아미노산 유형이 실험에서 표지되고 측정되는 경우, 2 개의 교정 계수가 있고 3 개의 아미노산 유형이 실험에서 표지되고 측정되는 경우, 3 개의 교정 계수가 있다.
일부 구현예에서, 각 아미노산 유형에 대한 교정 또는 교정 계수는 유리 아미노산의 하나 이상의 아미노산 농도로부터의 데이터를 사용하여 결정된다. 유리 아미노산은 단백질 쇄 또는 펩티드 내에 혼입되지 않는다. 일부 구현예에서, 유리 아미노산의 하나 초과의 아미노산 농도가 사용된다. 일부 구현예에서, 유리 아미노산의 하나의 아미노산 농도가 사용된다.
일부 구현예에서, 하나 이상의 아미노산 유형은 교정 아미노산을 사용하여 교정되고, 하나 이상의 아미노산 유형은 하나 이상의 교정 단백질의 하나 이상의 단백질 농도를 사용하여 교정된다. 일부 구현예에서, 표지의 신호와 각 아미노산 유형에 대한 아미노산 농도 사이의 관계를 결정하는 데이터가 결정되는 경우, 용액 중 유리 아미노산으로부터의 데이터가 아미노산 서열 내에 혼입된 아미노산으로부터의 데이터와 함께 포함될 수 있다.
이 단계는 1 회만 수행될 필요가 있으며 결과는 저장되고/되거나 사용자에게 공급될 수 있으며; 샘플에 대한 표지의 측정된 신호가 샘플에 대한 표지된 아미노산 농도로 변환될 때마다 이 단계를 수행할 필요는 없다.
일부 구현예에서, 샘플에서 2 개 이상의 표지된 아미노산 유형 각각의 아미노산의 농도는 교정 계수를 사용하여 샘플에서 동일한 2 개 이상의 아미노산 유형의 측정된 형광 강도로부터 결정된다. 표지되고 측정된 아미노산의 각 유형은 상이한 교정을 갖는다. 표지되고 측정된 아미노산의 각 유형은 상이한 교정 계수를 갖는다. 교정 계수는 종종 임의 단위(AU)인 샘플의 측정된 샘플과 샘플에서 해당 아미노산 유형의 아미노산 농도 사이를 전환한다. 교정 계수는 측정된 표지와 샘플에서 각 표지된 아미노산 유형에 대한 아미노산 농도 사이의 관계를 결정한다.
이것은 실험에서 표지되고 측정될 아미노산 유형 각각에 대해 수행된다. 예를 들어, 2 개의 아미노산 유형이 실험에서 표지되고 측정되는 경우, 2 개의 교정 계수가 있고 3 개의 아미노산 유형이 실험에서 표지되고 측정되는 경우, 3 개의 교정 계수가 있다.
샘플을 식별하고 정량화하기 위해, 사용자는 샘플 내에서 2 개 이상의 아미노산 유형의 표지를 표지하고 측정하기만 하면 된다. 임의의 아미노산 유형에 대한 교정 함수 또는 교정 계수는 여러 검출 설정에 대해 제공될 수 있으며; 예를 들어, 형광 기반 검출을 위한 교정 계수는 여기 파장, 방출 파장, 및 기기의 이득 또는 광전증폭관(PMT) 설정에 따라 제공될 수 있다.
이 교정 계수 또는 교정 함수는 아미노산 서열과 관계가 없고 각 표지된 아미노산 유형의 알려진 아미노산 농도 및 0이 아닌 아미노산 농도의 하나 이상의 교정 아미노산 또는 교정 단백질의 하나 이상의 농도에서 표지를 측정함으로써 계산된다. 일부 구현예에서, 하나 이상의 교정 아미노산 또는 단백질의 하나 이상의 아미노산 농도는 샘플 및 임의의 임의적인 실험적 참조가 측정되는 동일한 조건(예를 들어 여기 및 방출 파장 쌍)에서 측정된다. 일부 구현예에서, 상이한 하나 이상의 교정 아미노산 또는 교정 단백질이 각 아미노산 유형에 대해 사용된다. 일부 구현예에서, 교정 함수는 비-선형이다. 바람직한 구현예에서, 교정 함수는 선형이며, 스칼라 교정 계수를 제공한다. 하나 이상의 교정 아미노산 또는 교정 단백질의 하나 초과의 농도가 사용되는 경우, 각 아미노산 유형에 대한 교정 계수는 해당 아미노산 유형의 알려진 아미노산 농도와 해당 아미노산 유형의 표지 값(예를 들어 표지의 측정된 신호) 사이의 관계를 설명하는 데이터를 맞춤으로써 계산된다. 하나의 교정 아미노산 또는 단백질의 하나의 아미노산 농도가 사용되는 경우, 각 아미노산 유형에 대한 교정 계수는 아미노산 유형에 대한 측정된 표지를 아미노산 유형의 알려진 아미노산 농도로 나눔으로써 계산되어, 해당 아미노산 유형의 알려진 아미노산 농도에 대해 각 아미노산 유형의 표지에 대해 어떤 표지 값(예를 들어 신호)이 측정될 것이지 제공한다.
일부 구현예에서, 각 아미노산 유형에 대한 교정 함수 또는 교정 계수는 하나 이상의 교정 단백질의 여러 아미노산 농도로부터의 데이터를 사용하여 결정된다. 각 교정 단백질은 교정되는 아미노산 유형의 알려진 아미노산 농도, 또는 교정되는 아미노산 유형의 알려진 단백질 농도 및 아미노산 수를 곱하여 교정되는 아미노산 유형의 아미노산 농도를 제공한다. 일부 구현예에서, 교정되는 아미노산 유형의 전부 또는 동일한 비율이 각 교정 단백질에 대해 표지되므로, 각 교정 단백질에 대해 측정된 표지의 신호는 각 교정 단백질에 대해 교정되는 아미노산 유형의 아미노산 농도에 비례한다. 예를 들어, 표지될 2 개 이상의 아미노산 유형이 트립토판(W) 및 리신(K)인 경우, 샘플에서 트립토판(W) 아미노산의 90% 및 교정에 사용되는 임의의 아미노산 또는 단백질이 표지되고 샘플에서 리신(K) 아미노산의 90% 및 교정에 사용되는 임의의 아미노산 또는 단백질이 표지된다. 일부 구현예에서, 표지된 아미노산의 비율이 각 아미노산 유형에 대해 동일한 비율일 필요는 없다. 예를 들어, 표지될 2 개 이상의 아미노산 유형이 트립토판(W) 및 리신(K)이면, 샘플에서 트립토판(W) 아미노산의 90% 및 교정에 사용되는 임의의 아미노산 또는 단백질이 표지되고 샘플에서 리신(K) 아미노산의 80% 및 교정에 사용되는 임의의 아미노산 또는 단백질이 표지된다. 또 다른 예에서, 표지될 2 개 이상의 아미노산 유형이 트립토판(W), 리신(K) 및 티로신(Y)이면, 샘플에서 트립토판(W) 아미노산의 90% 및 교정에 사용되는 임의의 아미노산 또는 단백질이 표지되고, 샘플에서 리신(K) 아미노산의 85% 및 교정에 사용되는 임의의 아미노산 또는 단백질이 표지되고 샘플에서 티로신(Y) 아미노산의 80% 및 교정에 사용되는 임의의 아미노산 또는 단백질이 표지된다.
일부 구현예에서, 임의의 실험적으로 측정된 단백질(샘플, 임의의 표준 예컨대 단백질 또는 아미노산, 및 임의의 실험적 참조 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 내의 아미노산의 전부, 또는 동일한 비율, 또는 교정 곡선은 동일하다. 이것은 아미노산 유형 내에서 아미노산 일부의 표지화가 취소되고 결과에서 관찰되지 않는다는 것을 보장한다. 아미노산 유형의 아미노산의 동일한 비율(예를 들어 80%)이 샘플 및 교정에 사용되는 임의의 아미노산 또는 단백질에서 표지되는 경우, 표지의 신호는 샘플에서 해당 아미노산 유형의 모든(예를 들어 100%) 아미노산의 농도 및/또는 모든(예를 들어 100%) 아미노산의 수를 나타낸다. 이것은 동일한 비율의 아미노산이 표지되는 경우, 이 비율이 표지의 신호와 샘플 또는 교정을 위한 농도 또는 아미노산 수 사이의 전환을 제외하기 때문이다.
각 표지된 아미노산 유형의 아미노산 수 측정
일부 구현예에서, 샘플의 몰 단백질 농도가 알려져 있는 경우, 샘플에서 각 표지된 아미노산 유형의 아미노산 수가 측정될 수 있다. 아미노산 유형의 아미노산 수는 해당 아미노산 유형의 아미노산 농도를 단백질 농도로 나눈 값과 동일하다. 아미노산 유형의 아미노산 수는 단백질 농도에 따른 아미노산 유형의 아미노산 농도의 변화와 동등하다.
샘플에서 표지된 아미노산 유형의 아미노산 수는 샘플에서 해당 표지된 아미노산 유형의 측정된 표지로부터 계산된다. 측정된 표지는 샘플에서 해당 표지된 아미노산 유형의 아미노산 농도를 제공한다. 바람직하게는, 아미노산 유형은 형광생성 염료로 표지되고 표지된 아미노산 유형의 아미노산 수는 샘플에서 해당 표지된 아미노산 유형의 형광 강도로부터 계산된다. 형광 강도는 샘플에서 해당 표지된 아미노산 유형의 아미노산 농도를 제공한다.
일부 구현예에서, 샘플에 대해 표지된 아미노산 유형의 아미노산 수는 방정식 9로부터 계산된다:
Figure pct00086
측정된 표지는 아미노산 농도를 제공한다. 하나 이상의 교정 아미노산 또는 교정 단백질의 하나 이상의 아미노산 농도는 샘플의 측정된 표지를 교정 곡선 또는 표준을 사용하여 샘플에서 표지된 아미노산 유형의 몰 아미노산 농도로 전환하는 데 사용된다. 샘플에서 표지된 아미노산 유형의 몰 아미노산 농도를 샘플의 총 몰 단백질 농도로 나누어 샘플에 대한 아미노산 유형의 아미노산 수를 제공한다. 이 계산은 샘플에서 각 표지된 아미노산 유형에 대해 수행된다. 예를 들어, 아미노산 유형 W, K 및 Y가 샘플에서 표지된 경우, 방정식 9는 아미노산 유형 W, K 및 Y 각각에 대해 수행된다. 예를 들어, 샘플에서 W 아미노산의 수는 샘플에서 W의 몰 아미노산 농도를 샘플의 총 몰 단백질 농도로 나누어 계산한다. 샘플에서 K 아미노산의 수는 샘플에서 K의 몰 아미노산 농도를 샘플의 총 몰 단백질 농도로 나누어 계산한다. 샘플에서 Y 아미노산의 수는 샘플에서 Y의 몰 아미노산 농도를 샘플의 총 단백질 농도로 나누어 계산한다.
샘플에서 각 표지된 아미노산 유형의 아미노산 수는 샘플에 대한 고유한 서명을 제공한다. 예를 들어, 샘플에서 3 개의 아미노산 유형, W, K 및 C가 표지되며; 여기서 C는 CD 및 CR의 조합이다. 각 아미노산 유형에서 아미노산 수가 결정된다. 샘플은 샘플 내의 단백질 분자에 W 아미노산 유형의 3 개의 아미노산 , K 아미노산 유형의 5 개의 아미노산 및 C 아미노산 유형의 7 개의 아미노산을 갖는 것으로 결정된다. 아미노산 수는 샘플에서 단백질 분자 당 제공되는 데, 아미노산 유형의 몰 아미노산 농도를 총 몰 단백질 농도로 나누어 샘플에서 단백질 당 아미노산 수를 제공함으로써 계산하기 때문이다. 따라서, 샘플에 대한 서명은 3W, 5K 및 7C이다. 샘플의 서명은 참조의 서명과 비교되어 샘플에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재를 식별할 수 있다.
일부 구현예에서, 샘플의 총 몰 단백질 농도는 알려져 있거나, 당업계의 표준 기술을 사용하여 결정된다. 일부 구현예에서, 총 몰 단백질 농도는 수동적으로 알려져 있다. 예를 들어, 총 몰 단백질 농도는 예를 들어, A280 신호를 통해 결정되어 몰 단백질 농도를 결정한다.
일부 구현예에서, 총 단백질 농도는 능동적으로 알려져 있으며, 즉, mg/mL의 단백질 농도가 능동적으로 결정되었다. 예를 들어, 질량 단백질 농도가 칭량되거나 측정되었으므로, 샘플에서 총 단백질의 질량 농도가 알려져 있다. 예를 들어, 0.05 mg/mL의 단백질을 칭량하고 1 mL의 완충액에 용해시켰으므로 총 질량 단백질 농도는 0.05 mg/mL인 것으로 알려져 있다. 또 다른 예로서, 당업계에 알려진 방법은 샘플의 질량 단백질 농도를 결정하는 데 사용된다. 총 질량 단백질 농도가 결정된 경우 샘플의 2 개 이상의 아미노산 유형 각각의 아미노산 수를 계산하는 것이 가능하지 않다. 총 단백질 농도가 질량 기준으로 제공되고, 아미노산 농도가 질량 기준으로 제공된 경우, 방정식 9는 샘플에서 아미노산 수의 계산을 허용하지 않는다. 샘플에서 단백질 당 아미노산 수를 계산하는 대신, 아미노산 질량 농도를 단백질 질량 농도로 나눈 결과는 표지된 아미노산 유형의 아미노산에 의해 기여된 단백질 질량의 상대적 분율일 것이다. 이 정보로부터 샘플에서 2 개 이상의 아미노산 유형 각각의 아미노산 수를 결정하는 것은 정확한 단백질 분자량(MW)에 대한 지식이 필요할 것이며, 이는 샘플의 정체성이 알려져 있지 않았기 때문에 샘플에 이용가능하지 않은 단백질 서열에 따라 달라진다. MW은 또한 샘플의 고유 장애 수준이 알려져 있지 않는 한 샘플의 유체역학적 반경(RH)과 같은 단백질 크기로부터 계산될 수 없으며, 이는 샘플의 정체성이 알려져 있지 않았기 때문에 샘플에 이용가능하지 않다(도 15).
샘플에 대해 계산되는 방정식 9에서 아미노산 수에 대해, 아미노산 농도는 질량 아미노산 농도가 아니라 몰 아미노산 농도여야 하며; 이는 무단위 아미노산 수를 나타내는 것을 취소하기 위해 단위에 필요하다. 그러나, 본 발명의 방법은 관련 변환이 정의에 의해 단백질 정체성이 알려져 있는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 수행될 수 있기 때문에 샘플의 총 질량 단백질 농도만 알려진 경우에도 여전히 사용될 수 있다는 것을 발견하였다.
일부 구현예에서, 샘플의 몰 단백질 농도는 배타적으로 단백질의 N-말단 또는 C-말단이 형광생성 염료로 표지된 경우 능동적으로 알려져 있다. 예를 들어, (https://doi.org/10.1002/9780470559277.ch100018)에 기재된 바와 같이, 단백질의 N-말단은 N-말단을 케톤(글리신을 제외한 모든 아미노산 유형) 또는 알데하이드(글리신 아미노산 유형)로 산화시키는 피리독살-5-포스페이트(PLP)와의 생체모방 아미노기 전이 반응을 통해 부위 특이적으로 변형된 다음, 알콕시아민 반응성 기를 보유하는 형광 표지와 반응하여, 안정한 공유 옥심 결합을 형성한다. 이것은 단백질 당 하나의 표지 제공하므로 총 단백질 농도는 샘플에서 표지의 총 농도와 동등하다.
참조
일부 구현예에서, 샘플에서 2 개의 아미노산 유형의 측정된 표지(예를 들어 표지의 신호)는 하나 이상의 단백질 농도에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 용액에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값(예를 들어 표지의 신호, 예를 들어 표지의 형광 강도 또는 질량 대 전하 비율의 강도)의 참조와 비교된다. 일부 구현예에서, 샘플에서 2 개 이상의 아미노산 유형의 아미노산 농도는 하나 이상의 농도에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 용액에서 동일한 2 개 이상의 아미노산 유형의 아미노산 농도의 참조와 비교된다. 일부 구현예에서, 참조가 아미노산 농도 또는 알려진 표지 값(예를 들어 표지의 신호)인 경우, 참조는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도의 함수로서 참조에 대한 값을 제공하는 함수의 그룹이다. 일부 구현예에서, 참조는 임의의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대해, 농도의 함수로서 샘플에 대해 측정된 값(예를 들어 아미노산 농도, 또는 각 표지된 아미노산 유형의 표지의 신호, 예컨대 형광 강도 또는 신호 대 질량 비율의 강도)을 제공한다. 일부 구현예에서, 이들 함수는 선형이고, n-차원 공간에서 선을 제공한다(여기서 n은 샘플에서 표지되는 아미노산 유형의 수임). 예를 들어, W 및 K 아미노산 유형이 샘플에서 표지되는 경우, 참조는 2-차원 공간에서 W 및 K의 선이다. 샘플에 대해 측정된 값(예를 들어 n 아미노산 유형의 아미노산 농도, 또는 n 아미노산 유형의 표지 신호)은 항상 n-차원 공간에서 점을 제공한다. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재는 샘플 점이 참조선 상에 있거나, 참조선에 대한 오차 한계 내에 있는 경우 검출될 수 있다. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재가 검출될 때마다, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도가 또한 농도에 대한 참조 함수를 품으로써 결정될 수 있다. 일부 구현예에서, 참조를 포함하는 함수는 파라미터 방정식 1, 2, 3, 및 4 세트, 또는 벡터 함수 1, 2, 3, 또는 4를 사용하여 생성된다.
일부 구현예에서, 샘플에서 2 개 이상의 표지된 아미노산 유형의 측정된 표지는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 하나 이상의 알려진 표지 값(예를 들어 표지의 신호, 예를 들어 표지의 형광 강도, 질량, 진동 모드, 또는 표지의 방사성 붕괴, 또는 표지의 M-F-N-R 영역)의 참조와 비교된다. 일부 구현예에서, 샘플에서 2 개 이상의 표지된 아미노산 유형의 아미노산 농도는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 샘플에서 동일한 2 개 이상의 아미노산 유형의 하나 이상의 아미노산 농도의 참조와 비교된다. 일부 구현예에서, 샘플에서 2 개 이상의 표지된 아미노산 유형의 아미노산 수는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 동일한 2 개 이상의 아미노산 유형의 수의 참조와 비교된다.
참조의 단위는 샘플에 대해 결정된 단위와 동일해야 한다. 예를 들어, 샘플에서 아미노산 유형의 아미노산 농도는 참조에서 동일한 아미노산 유형의 아미노산 농도와 비교된다. 참조의 단위가 동일하지 않으면, 참조의 단위는 샘플의 동일한 단위로 전환되거나, 그 반대의 경우도 마찬가지이다. 일부 구현예에서, 참조의 단위는 전환된다. 일부 구현예에서, 샘플의 단위는 전환된다. 예를 들어, 샘플에서 아미노산 유형의 형광 강도는 참조에서 동일한 아미노산 유형의 아미노산 농도와 비교될 수 없는 데, 형광 강도 및 아미노산 농도가 상이한 단위이기 때문이다. 대신, 참조에서 아미노산 유형의 아미노산 농도는 파라미터 방정식 3 세트를 사용하여 형광 강도로 형광 강도로 전환될 수 있다. 그런 다음, 샘플에서 아미노산 유형의 형광 강도는 참조에서 동일한 아미노산 유형의 형광 강도와 비교된다. 대안적으로, 샘플의 단위는 참조와 동일한 단위로 전환될 수 있다. 예를 들어, 샘플에서 아미노산 유형의 형광 강도는 교정 곡선, 또는 표준을 사용하여 아미노산 유형의 아미노산 농도로 전환되고, 샘플에서 아미노산 유형의 아미노산 농도는 참조에서 해당 동일한 아미노산 유형의 아미노산 농도와 비교된다. 샘플의 몰 농도가 알려져 있는 경우, 샘플에서 각 표지된 아미노산 유형의 아미노산 농도는 본원에 개시된 방법을 사용하여 샘플에서 각 표지된 아미노산 유형의 아미노산 수를 계산하는 데 사용될 수 있다. 샘플에서 표지된 아미노산 유형의 아미노산 수는 참조에서 해당 동일한 아미노산 유형의 수와 비교된다.
일부 구현예에서, 샘플의 값(즉, 2 개 이상의 아미노산 유형의 측정된 표지, 아미노산 농도 및/또는 아미노산 수)이 각 아미노산 유형에 대한 참조의 값(즉, 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수)과 동일하거나, 이에 대한 오차 한계 내에 있는 경우, 이는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체가 특이적 농도 및/또는 양으로 샘플에 존재한다는 것을 나타낸다. 반대로, 일부 구현예에서, 참조의 값(즉, 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수)과 비교하여 오차 한계를 벗어난 샘플의 값(즉, 2 개 이상의 아미노산 유형의 측정된 표지, 아미노산 농도 및/또는 아미노산 수)의 차이는 참조 단백질이 임의의 농도 및/또는 양으로 샘플에 존재하지 않는다는 것을 나타낸다.
일부 구현예에서, 참조는 이전에 결정되었다. 예를 들어, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체의 정체성 및/또는 농도에 대한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수에 관한 정보는 이전에 결정되었다. 예를 들어, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 용액의 하나 이상의 농도에서 2 개 이상의 아미노산 유형의 형광 강도, 또는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 용액의 하나 이상의 농도에서 2 개 이상의 아미노산 유형의 아미노산 농도, 또는, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열에서 2 개 이상의 아미노산 유형의 아미노산 수는 이전에 결정되었다. 일부 구현예에서, 참조는 복사, 액세스 또는 전송될 수 있는 매체에 저장된다. 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도를 식별함으로써 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도, 및/또는 아미노산 수를 나타내는 정보는 복사, 액세스 또는 전송될 수 있는 매체에 저장될 수 있다. 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 명칭)이 또한 복사, 액세스 또는 전송될 수 있는 매체에 저장될 수 있다. 예를 들어, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 용액의 하나 이상의 농도에서 2 개 이상의 아미노산 유형의 형광 강도, 또는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 용액의 하나 이상의 농도에서 2 개 이상의 아미노산 유형의 아미노산 농도, 또는, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열에서 2 개 이상의 아미노산 유형의 아미노산 수는 복사, 액세스 또는 전송될 수 있는 매체에 저장된다. 일부 구현예에서, 참조는 예를 들어 데이터베이스, 게놈 정보의 공개 데이터베이스, 공개 데이터, 또는 각각 공통 속성(예를 들어, 유기체 유형, 질병 상태, 병원체, 조직 유형, 세포 유형, 예후 값, 연령 또는 약물에 대한 반응)을 가질 수 있는 참조 대상체의 특이적 집단에 대해 생성된 데이터를 포함하여, 임의의 적합한 데이터 소스로부터 공급되거나 파생될 수 있다. 예를 들어, 상이한 농도에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 용액의 아미노산 농도 또는 알려진 표지 값(예를 들어 표지의 신호, 예를 들어 형광 강도), 및/또는, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열에서 각 아미노산 유형의 아미노산 수 및/또는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 명칭 또는 식별자는 라이브러리 또는 데이터베이스로부터 액세스될 수 있다. 일부 구현예에서, 참조는 농도의 공통 파라미터에 따라 파라미터 방정식 세트 또는 벡터 함수로서 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도를 제공한다. 다른 구현예에서, 참조는 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 아미노산 수를 제공한다.
일부 구현예에서, 참조는 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 아미노산 수를 제공하고 아미노산 수는 Power BI; Microsoft 분석 프로그램, Microsoft Excel 또는 Python을 사용하여 결정된다.
일부 구현예에서, 하나 이상의 농도에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 용액에서 2 개 이상의 아미노산 유형의 참조 아미노산 농도 또는 알려진 표지 값(예를 들어 신호)은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 각 아미노산 유형 및 농도의 아미노산 수 또는 평균 수로부터 계산될 수 있고 파라미터 방정식 1, 2, 3, 또는 4 세트 또는 벡터 함수 1, 2, 3, 또는 4를 사용하여 각 관심 아미노산 유형에 대한 교정 계수를 포함할 수 있다.
일부 구현예에서, 참조는 아미노산 수의 선행 자릿수의 빈도 분포에 대한 관찰과 같이, 다양한 샘플 및/또는 하위단백체 및/또는 단백체에 결친 아미노산 수에 대해 관찰된 빈도 분포와 관련한 정보로 향상될 수 있다. Benford의 법칙, Newcomb-Benford 법칙, 첫째 자리 법칙(Law of First Digits), 또는 유효 숫자 법칙(Significant-Digit-Law)은 자연 발생 데이터세트(특히 높은 자릿수를 갖는 것)의 다양한 세트에서 유효 숫자의 예상된 분포(숫자의 선행 숫자)에 대한 정보를 제공하고 패턴 또는 이의 부족을 검출하는 데 사용되어, 숫자 패턴의 이상 감지를 가능하게 할 수 있다. 이 법칙은 선행 유효 숫자의 예상된 분포가 균일하게 분포되지 않지만 대신 특정 로그 분포를 따른다는 것을 말한다. 아래의 도 4, 5 및 6에서, P(d)는 선행 자릿수 d의 Benford의 법칙 하에 예상된 확률을 나타내며, 여기서 d는 {1,2,3,4,5,6,7,8,9}에 있다.
인간 혈장 단백체에 대한 평균 아미노산 수의 선행 자릿수는 이 법칙을 따르지만(도 4), 바이러스 단백체는 다소 편향이 있으며(도 5), 박테리아 단백체에 대한 평균 아미노산 수의 선행 자릿수의 분포에 대해 가장 큰 편차가 관찰된다(도 6)는 것을 발견하였다. 관심 바이러스 및 박테리아 단백체에 대한 Benford 법칙과의 일치 결여는 임의의 관심 바이러스 또는 박테리아 단백체 내의 2 개 이상의 아미노산 유형에 대한 평균 아미노산 수, 아미노산 농도, 및/또는 표지 값의 서명의 정보-풍부를 확인한다. 대조적으로, 아미노산 수의 선행 자릿수에 대해 균일한 분포인 경우 P(d)는 {1,2,3,4,5,6,7,8,9}에 있는 모든 d에 대해 11.11%일 것이다. 추가로, Benfordel 법칙 또는 균일한 분포를 확인하거나 벗어나는 특이적 아미노산을 아는 것은 특정 샘플 유형 내에서 발생하는 특정 서명의 확률을 할당하는 데 사용될 수 있다.
일부 구현예에서, 참조는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 공개적으로 이용가능한 아미노산 서열로부터 수득된 서열 데이터에 기반하여 계산된 계산된 참조이다. 대안적으로, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열 또는 서열들이 공개적으로 이용가능하지 않은 경우, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열 또는 서열들은 표준 서열분석 방법, 예를 들어 Edman 분해를 사용하여 결정될 수 있다. 일부 구현예에서, 참조는 실험적 참조가다. 일부 구현예에서, 실험적 참조를 결정하는 경우, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체는 알려진 몰 농도로 제공되고, 2 개 이상의 아미노산 유형은 본원에 개시된 바와 같이 표지되고, 표지는 측정되고 측정된 표지는 아미노산 농도(측정된 표지로부터 결정됨)를 알려진 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 농도로 나눔으로써 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 각 표지된 아미노산 유형의 아미노산 수를 결정하는 데 사용된다. 대안적으로, 일부 구현예에서, 실험적 참조를 결정하는 경우, 실험적 참조에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체는 Bradford 검정과 같이 당업계에 알려진 방법을 통해 결정된 질량 농도와 같은 알려진 농도로 제공되고, 2 개 이상의 아미노산 유형은 본원에 개시된 바와 같이 표지되고, 표지는 측정되고 측정된 표지는 교정 곡선 또는 표준을 사용하여 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 각 표지된 아미노산 유형의 아미노산 농도를 결정하는 데 사용된다. 대안적으로, 일부 구현예에서, 실험적 참조를 결정하는 경우, 실험적 참조에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도는 알려져 있지 않고 결정되지 않는다. 이것은 샘플에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재의 식별, 및 샘플에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 상대 농도 및/또는 양의 결정을 허용한다. 샘플에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 상대 농도 및/또는 양은 또 다른 샘플에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도 및/또는 양과 관련하여 제공된다.
모든 구현예에서, 실험적 참조는 샘플의 테스트 전에 또는 샘플의 테스트 후에, 샘플의 테스트와 동시에 결정될 수 있다. 전형적으로, 당업자에 의해 이해되는 바와 같이, 참조는 샘플을 결정하거나 특성화하기 위해 활용되는 것들과 필적할만한 조건 하에 결정되거나 특성화된다.
샘플에서 아미노산 유형의 아미노산 전체 또는 일부의 표지화는 계산된 참조에 영향을 미치지 않는 데, 모든 아미노산 또는 동일한 비율의 아미노산이 샘플에서 표지되고 교정 곡선 또는 표준에 대해 사용되는 하나 이상의 단백질이 (샘플 또는 참조의) 형광 강도와 아미노산 농도 사이를 전환하는 데 사용되기 때문이다. 아미노산 유형의 모든 아미노산이 샘플에서 표지되는 경우, 해당 아미노산 유형의 모든 아미노산이 또한 실험적 참조에서 표지되어야 한다. 아미노산 유형의 아미노산의 일부가 샘플에서 표지되는 경우, 해당 아미노산 유형의 아미노산의 동일한 비율이 실험적 참조에서 표지되어야 한다. 이것은 동일한 비율의 아미노산이 실험적으로 측정된 임의의 단백질에서 표지되는 경우, 이 비율은 샘플 또는 참조에 대한 표지 값(예를 들어 표지의 신호)과 농도 또는 아미노산 수 사이의 전환을 제외하기 때문이다.
일부 구현예에서, 샘플의 정체성 및 단백질 양(농도 및 양)은 둘 다 알려져 있지 않다. 일부 구현예에서, 샘플의 정체성 및 단백질 양(몰 단백질 농도 및 단백질 양)은 알려져 있지 않다. 이것은 진단 환경에서 직면하는 가장 흔한 상황인 데, 샘플이 정체성이 알려지지 않은 단백질을 함유하는 경우, 아미노산 서열로부터 결정되는 단백질의 정확한 분자량제 대한 지식이 필요하기 때문에 단백질의 정체성을 알지 못하면 그의 몰 단백질 농도를 결정할 수 없기 때문이다. 샘플의 정체성 및 단백질 양(몰 단백질 농도 및 몰 단백질 양)이 둘 다 알려져 있지 않은 경우, 샘플에 대해 제공되는 측정(2 개 이상의 표지된 아미노산 유형의 아미노산 농도, 또는 2 개 이상의 표지된 아미노산 유형의 측정된 표지(예를 들어 표지의 신호))는 샘플의 알려지지 않은 단백질 농도에 따라 달라진다. 따라서, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조는 샘플의 알려지지 않은 농도의 함수이다. 파라미터 방정식은 파라미터라고 하는 공통 독립적 변수의 함수로서 양의 그룹을 설명한다. 여기서, 샘플의 알려지지 않은 몰 농도는 t라고 하는 파라미터이며, 음의 농도가 물리적으로 가능하지 않기 때문에 0보다 더 크거나 같아야 한다.
참조의 일반적 형태는 n 차원 공간에서 선이며, 여기서 n은 샘플에서 표지되고 측정된 아미노산 유형의 수이다. 참조는 각 좌표(아미노산 농도, 또는 표지의 신호)가 농도 t의 함수로서 어떻게 달라지는지 명시하는 파라미터 방정식으로 설명될 수 있다. 일반 파라미터 방정식은 다음과 같다:
Figure pct00087
여기서 n i 는 관심 단백질, 단백체, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 또는 하위단백체이고, c 1 은 아미노산 유형 1에 대한 계수이고, c 2 는 아미노산 유형 2에 대한 계수이고, c n 은 샘플에서 표지되고 측정된 아미노산 유형 n에 대한 계수이며, 각각은 다음에 따라 제공된다(아미노산 유형 n의 예에 대해 설명될 뿐만 아니라 아미노산 유형 1 및 2에 적용됨):
ㆍ 샘플에 대한 측정이 아미노산 농도로 제공되고 참조선이 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체를 설명하는 경우, c n = a n , 여기서 a n 은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이며, a n 은 0보다 더 크거나 같은 정수이다(
Figure pct00088
ㆍ 샘플에 대한 측정이 아미노산 농도로 제공되고 참조선이 관심 단백체 또는 하위단백체를 설명하는 경우, c n = w n , 여기서 w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산 가중 평균 수이다
ㆍ 샘플에 대한 측정이 측정된 표지(예를 들어 표지의 신호)로 제공되고 참조선이 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체를 설명하는 경우 c n = a n f n , 여기서 a n 은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이며, a n 은 0보다 더 크거나 같은 정수이고(
Figure pct00089
, 여기서 f n 은 아미노산 유형 n에 대한 아미노산 농도와 표지 값(예를 들어 표지의 신호) 사이를 조정하는 교정 계수 또는 교정 함수이다
ㆍ 샘플에 대한 측정이 측정된 표지(예를 들어 표지의 신호)로 제공되고 참조선이 관심 단백체 또는 하위단백체를 설명하는 경우 c n = w n f n , 여기서 w n 은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이며, 여기서 w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, 여기서 f n 은 아미노산 유형 n에 대한 아미노산 농도와 측정된 표지(예를 들어 표지의 신호) 사이를 전환하는 교정 계수 또는 교정 함수이다.
여기서 tn 차원 각각에서 참조선을 집합적으로 명시하는 n 개의 함수 각각에서 공통 독립적 변수(또는 파라미터)인 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 용액의 농도이고, 여기서 t는 0보다 더 크거나 같은 모든 t에 대해 정의된다(
Figure pct00090
참조선은 대안적으로 n 차원 공간에서 벡터로서 설명될 수 있다(발명의 내용 섹션에 제공된 공식 방정식인 가설 테스트 2의 논의 참조).
샘플에 대해 측정된 관심 단백질 및 아미노산 농도의 맥락에서 여기에 요약된 비교 단계에서 참조가 어떻게 사용되었는지에 대한 접근법은 본 발명의 구현예에 걸쳐 보존되고, 구체적인 세부사항은 하기 비교 단계 섹션에서 제공된다.
일부 구현예에서, 참조는 관심 단백질에 대한 2 개 이상의 아미노산 유형의 아미노산 농도이다. 샘플의 알려지지 않은 몰 단백질 농도 또는 알려지지 않은 질량 단백질 농도, t의 함수로서 관심 단백질 p i 에 대한 2 개 이상의 아미노산 유형의 아미노산 농도가 파라미터 방정식 1 세트로 제공된다:
Figure pct00091
2 개 이상의 아미노산 유형의 아미노산 농도는 샘플에서 표지되고 측정된다. 아미노산 유형 1은 샘플에서 표지되고 측정되고, 아미노산 유형 2는 샘플에서 표지되고 측정되고, 임의적으로 아미노산 유형 n은 샘플에서 표지되고 측정된다. 파라미터 방정식 1에서, a 1 은 관심 단백질 p i 내의 아미노산 유형 1의 아미노산 수이고 함수 a 1 t의 계수이고, a 2 는 관심 단백질 p i 내의 아미노산 유형 2의 아미노산 수이고 함수 a 2 t의 계수이고, a j 는 관심 단백질 p i 내의 아미노산 유형 n의 임의적인 수이고 함수 a n t의 계수이다.
Figure pct00092
은 함수가 모든/임의의 t ≥ 0에 대해 정의된다는 것을 의미한다. 각 아미노산 유형의 아미노산 농도는 각 아미노산 유형의 아미노산 수에 알려지지 않은 농도를 곱한 값이고, 함수이다. a 1 t는 관심 단백질의 알려지지 않은 농도, t의 함수로서 제1 아미노산 유형의 아미노산 농도이다. a 2 t는 샘플의 알려지지 않은 농도, t의 함수로서 제2 아미노산 유형의 아미노산 농도이다. a n t는 샘플의 알려지지 않은 농도, t의 함수로서 임의적인 n번째 아미노산 유형의 아미노산 농도이다. 따라서, 2 개 이상의 아미노산 유형의 아미노산이 샘플에서 표지되고 측정되는 경우, 0보다 더 크거나 같은 임의의 농도, t에서 관심 단백질 p i 를 함유하는 해에 대한 참조는 함수 [a 1 t,a 2 t,…a n t]로 제공된다.
샘플에서 표지되고 측정된 아미노산의 n 개의 유형이 있기 때문에, n 함수는 참조를 정의한다. 예를 들어, 샘플에서 표지되고 측정된 2 개의 아미노산 유형이 있는 경우, t ≥ 0인 임의의 농도, t에서 관심 단백질 p i 를 함유하는 해에 대한 참조는 함수 [a 1 t, a 2 t]로 제공된다. 또 다른 예로서, 샘플에서 표지되고 측정된 3 개의 아미노산 유형이 있는 경우, t ≥ 0인 임의의 농도, t에서 관심 단백질 p i 를 함유하는 해에 대한 참조는 함수 [a 1 t, a 2 t, a 3 t]로 제공된다. 또 다른 예로서, 샘플에서 표지되고 측정된 4 개의 아미노산 유형이 있는 경우, t ≥ 0인 임의의 농도, t에서 관심 단백질 n i 를 함유하는 해에 대한 참조는 함수 [a 1 t, a 2 t, a 3 t, a 4 t]로 제공된다. 또 다른 예로서, 샘플에서 표지되고 측정된 5 개의 아미노산 유형이 있는 경우, t ≥ 0인 임의의 농도, t에서 관심 단백질 n i 를 함유하는 해에 대한 참조는 함수 [a 1 t, a 2 t, a 3 t, a 4 t, a 5 t]로 제공된다.
샘플 내에서 관심 단백질 n i 의 존재 및/또는 농도 및/또는 양을 식별하기 위해, 샘플에 대해 측정된 각 아미노산 유형의 아미노산 농도는 관심 단백질 p i 에 대해 이들 동일한 2 개 이상의 아미노산 유형의 참조 아미노산 농도와 비교된다. 샘플에서 표지된 n 개의 아미노산 유형에 대해 측정된 n 개의 아미노산 농도는 n 차원 공간에서 점을 정의한다. 점은 좌표 (AAC 1 , AAC 2 ,…, AAC j )를 가지며 여기서 AAC 1 은 샘플에서 표지된 아미노산 유형 1에 대해 측정된 아미노산 농도이고, AAC 2 는 샘플에서 표지된 아미노산 유형 2에 대해 측정된 아미노산 농도이고, AAC n 은 샘플에서 임의적으로 표지된 아미노산 유형 n에 대해 임의적으로 측정된 아미노산 농도이다.
관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 는 관심 단백질 p i 의 농도에 대해 제공된 아미노산 농도가 샘플에 대해 측정된 아미노산 농도와 동일하거나, 이의 오차 한계 내에 있는 경우 샘플 내에 존재한다. 이것은 샘플에 대해 측정된 아미노산 농도(AAC 1 , AAC 2 ,…, AAC j )를 제공하는 점이 관심 단백질 p i 에 대한 참조로서 제공된 선 상에 있거나, 선의 오차 한계 내에 있는 경우 관심 단백질 p i 가 샘플 내에 존재한다는 것을 인식함으로써 달성된다. 이 인식은 관심 단백질 p i 가 샘플 내에 존재하는 경우, 샘플 내의 관심 단백질 n i 의 농도가 동시에 결정될 수 있다는 것을 의미한다.
이것은 비교 단계에서 수행된다. 일부 구현예에서, 비교 단계 내에서, 관심 단백질 p i 에 대해 제공된 아미노산 농도의 참조, [a 1 t, a 2 t,…, a n t]는 샘플에 대해 측정된 각 아미노산 농도를 참조에 대한 함수로 제공된 상응하는 아미노산 농도와 동일하게 설정함으로써, 샘플에 대해 측정된 아미노산 농도, (AAC 1 , AAC 2 ,…, AAC n )와 비교된다. 이것은 관심 단백질 p i 가 임의의 농도로 샘플 내에 존재한다는 가설을 테스트한다. 테스트 1은 모든 t ≥ 0에 대해, 다음과 같은 t의 값이 존재하는 경우 충족된다:
Figure pct00093
여기서 방정식의 수는 샘플에서 표지되고 측정된 n 개의 아미노산 유형의 수와 같다. 테스트 1을 포함하는 n 개의 방정식이 t의 단일 값에 대해 풀 수 있는 경우, 관심 단백질 p i 는 농도 t로 샘플 내에 존재하는 데, 샘플 점이 참조선 상에 있기 때문이다.
일부 구현예에서, 이것은
Figure pct00094
이면 테스트 1이 충족되는 것으로 공식적으로 언급될 수 있다.
이는 모든 t ≥ 0에 대해, 모든 k = 1, 2, …, n에 대해 AAC k = a k t가 되도록 t의 값이 존재하는 경우 테스트 1이 충족됨을 말한다.
예를 들어, 알려지지 않은 단백질 정체성 및 알려지지 않은 농도의 샘플이 수득되고, 트립토판(W) 및 리신(K) 아미노산 유형이 샘플에서 표지되고, 샘플에서 W 및 K 아미노산 유형의 아미노산 농도가 본원에 개시된 바와 같은 측정된 표지로부터 결정된다. 트립토판(W) 은 아미노산 유형 1이고 리신(K)은 아미노산 유형 2이다. 샘플에서 아미노산 트립토판(W)의 농도, S AAc,1 은 0.5 μM이고 샘플에서 아미노산 리신(K)의 농도 S AAc,2 는 7 μM이다.
이 예에서, 관심 단백질은 SARS-CoV-2 감염에 대한 차등 숙주 반응에 연루된 사이토카인 인터류킨-6(IL-6)이다. 일부 구현예에서, 아미노산 유형의 아미노산 수는 관심 단백질의 아미노산 서열에서 아미노산 유형의 아미노산의 총 발생 수다. IL-6에서 W 아미노산의 수는 1이고 IL-6에서 K 아미노산의 수는 14이다. W 아미노산 유형은 아미노산 유형 1이고 K 아미노산 유형은 아미노산 유형 2이다. 따라서, 임의의 단백질 농도에서 IL-6에 대한 참조는 다음이 되도록 파라미터 방정식 1에 의해 제공된다:
Figure pct00095
샘플 내에서 관심 단백질 IL-6의 임의의 단백질 농도의 존재는 테스트 1에 따라, 샘플에 대해 측정된 각 아미노산 농도를 참조에 대해 제공된 상응하는 아미노산 농도 함수와 동일하게 설정함으로써 평가된다:
Figure pct00096
이는 다음과 같고:
Figure pct00097
해가 다음으로 존재하는지 결정하면
Figure pct00098
샘플에서 아미노산 유형 1에 대해 측정된 아미노산 농도를 참조의 아미노산 유형 1에 대해 제공된 아미노산 농도 함수와 동일하게 설정하고, 샘플에서 아미노산 유형 2에 대해 측정된 아미노산 농도를 참조의 아미노산 유형 2에 대해 제공된 아미노산 농도 함수와 동일하게 설정하는 경우, 방정식에 대한 해가 존재한다는 것을 의미한다. 방정식에 대한 해는 t = 0.5 μM이다. 따라서, 관심 단백질 IL-6은 0.5 μM의 단백질 농도로 샘플에 존재하는 것으로 식별된다.
또 다른 예로서, 알려지지 않은 단백질 정체성 및 알려지지 않은 단백질 농도의 샘플이 수득되고, 트립토판(W) 및 리신(K) 아미노산 유형이 샘플에서 표지되고, 샘플에서 W 및 K 아미노산 유형의 아미노산 농도가 본원에 기재된 바와 같은 표지의 신호로부터 측정된다. 트립토판(W)은 아미노산 유형 1이고 리신(K)은 아미노산 유형 2이다. 샘플에서 아미노산 트립토판(W)의 농도, S AAc,1 은 2.4 μM이고 샘플에서 아미노산 리신(K)의 농도, S AAc,2 는 17.6 μM이다.
이 예에서, 관심 단백질은 신경학적 질환에서 세포자멸사 세포 사멸에 관여되는 것으로 여겨지는 뉴런 발달에 필수적인 키나제인 사이클린-의존적-유사 키나제 5(CDK5)이며, 혈장으로 분비된다. 단백질 서열 내에서 트립토판(W) 아미노산의 수는 3이고, 단백질 서열 내에서 리신(K) 아미노산의 수는 23이다. 그러나, 1 개의 리신 아미노산이 번역 후 변형(아세틸화)되고 따라서 이 실험을 위해 선택된 리신 표지화 염료와의 반응에 이용가능하지 않다는 것이 공공 SwissProt 데이터베이스로부터 알려져 있다. 일부 구현예에서, 관심 단백질 내의 아미노산 유형의 아미노산 수는 관심 단백질의 아미노산 서열 또는 서열들 내의 해당 아미노산 유형의 발생 수에서 아미노산 유형이 표지와 반응하는 것을 방지하는 해당 아미노산 유형의 번역 후 변형의 수를 뺀 값이다. 따라서, 관심 단백질 내의 리신(K) 아미노산 유형의 아미노산 수는 22이고 관심 단백질 내의 트립토판(W) 아미노산의 수는 3이다. 파라미터 방정식 1 세트는 샘플의 알려지지 않은 단백질 농도에서 관심 단백질(CDK5)에 대한 하기 참조를 제공한다:
Figure pct00099
샘플 내의 관심 단백질 CDK5의 임의의 단백질 농도의 존재는 테스트 1에 따라, 샘플에서 각 표지된 아미노산 유형에 대해 측정된 각 아미노산 농도를 참조에 대해 제공된 상응하는 아미노산 농도 함수와 동일하게 설정함으로써 평가된다:
Figure pct00100
이는 다음과 같고:
Figure pct00101
해가 존재하는지 여부를 결정하면
Figure pct00102
샘플에서 아미노산 유형 1에 대해 측정된 아미노산 농도를 참조의 아미노산 유형 1에 대해 제공된 아미노산 농도 함수와 동일하게 설정하고, 샘플에서 아미노산 유형 2에 대해 측정된 아미노산 농도를 참조의 아미노산 유형 2에 대해 제공된 아미노산 농도 함수와 동일하게 설정하는 경우, 방정식에 대한 해가 존재한다는 것을 의미한다. 방정식에 대한 해는 t = 0.8 μM이다. 따라서, 관심 단백질 CDK5는 0.8 μM의 단백질 농도로 샘플에 존재하는 것으로 식별된다.
일부 구현예에서, 파라미터 방정식 1은 관심 다중 단백질에 대한 참조를 제공하고, 임의적으로, 결과는 참조 데이터베이스에 저장된다. 일부 구현예에서, 파라미터 방정식 1 내에서 사용되는 각 아미노산 유형의 아미노산 수는 또한 데이터베이스에 저장되고, 파라미터 방정식 1은 참조 데이터베이스를 제공하기 위해 이 데이터베이스에서 작동한다.
예를 들어, 단백질은 HPLC를 사용하여 인간 혈장으로부터 단리되고 그의 몰 단백질 농도는 알려져 있지 않다. 아미노산 유형 C, K, 및 W는 샘플에서 표지된다. C 아미노산 유형의 모든(비변형된 + 변형된) 아미노산이 표지되고, K 아미노산 유형의 비변형된 아미노산(ε-아미노 기가 2차 아민이 아닌 1차 아민인 K 아미노산 유형의 아미노산), 및 W 아미노산 유형의 모든(비변형된 + 변형된) 아미노산이 샘플에서 표지된다. 3.8 μM C, 15.9 μM K, 및 0.9 μM W의 아미노산 농도가 본원에 기재된 바와 같은 표지의 신호로부터 샘플에서 측정된다. C 아미노산 유형은 AAC 1 이고, K 아미노산 유형은 AAC 2 이고, W 아미노산 유형은 AAC 3 이다. AAC 1 = 3.8 μM, AAC 2 = 15.9 μM, 및 AAC 3 = 0.9 μM.
참조는 인간 혈장 내에서 발견된 5 개의 관심 단백질에 대해 구축된다. 이들은 아파민, 탈린-1, L-셀렉틴, C-반응성 단백질, 및 루미칸을 포함한다. 일부 구현예에서, 참조는 참조 데이터베이스로부터 수득된다.
일부 구현예에서, 각 관심 단백질에서 C, K, 및 W 아미노산 유형의 아미노산 수는 성숙한 단백질에서 절단된 신호 서열과 같은 각 관심 단백질의 아미노산 서열의 일부를 제거하고, 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 성숙한 단백질 서열에서 C, K, 및 W 아미노산의 발생 수를 결정하고, K 아미노산의 계산된 발생에서 리신 ε-아미노 기의 1차 아민에서 2차 아민으로의 전환을 초래하는 번역 후 변형(PTM)의 수, 특히 아세틸화, 알킬화, 및 글리실-리신 이소펩티드 형성의 수를 뺌으로서 결정된다.
이것은 임의적으로 데이터베이스로부터 수득될 수 있는 C, K, 및 W 아미노산 유형에 대한 하기 아미노산 수를 제공한다:
Figure pct00103
파라미터 방정식 1은 데이터베이스의 각 행에 순차적으로 적용되어 임의의 단백질 농도, t에 대한 함수로서 각 관심 단백질에 대한 참조를 생성한다:
Figure pct00104
각 관심 단백질, p 1 , p 2 , p 3 , p 4 , 및 p 5 에 대한 참조는 3-차원 공간에서 선으로 시각적으로 제시될 수 있다. 각 관심 단백질에 대한 참조는 3-차원 공간에서 선인 데, 3 개의 유형의 아미노산이 샘플에서 표지되고 측정되고, 아미노산 유형 C가 아미노산 유형 a 1 이고, 아미노산 유형 K가 아미노산 유형 a 2 이고, 아미노산 유형 W가 아미노산 유형 a 3 이기 때문이다. 파라미터 방정식 1은 모든 t ≥ 0에 대한 참조를 정의하기 때문에, 모든 참조선은 원점에서 교차한다(그리고 a 1 , a 2 ,…, a n 의 임의의 값에 0을 곱하면 0과 같다).
비교 단계에서, 테스트 1은 각 관심 단백질에 대해 제공된 각 참조에 적용된다. 본 발명자들은 다음을 갖는다:
Figure pct00105
관심 단백질
Figure pct00106
의 경우:
Figure pct00107
따라서, 모든 t ≥ 0에 대해, 테스트 1을 포함하는 모든 방정식을 만족시키는 t의 단일 값이 존재하지 않으므로, 관심 단백질 n 1 은 임의의 단백질 농도로 샘플 내에 존재하지 않는다.
관심 단백질 p 2 의 경우:
Figure pct00108
모든 t ≥ 0에 대해, 테스트 1을 포함하는 모든 방정식이 t의 단일 값에 대해 풀도록 t가 존재하며, 따라서 관심 단백질 p 2 가 샘플 내에 존재한다. 관심 단백질 p 2 의 단백질 농도는 테스트 1을 만족시키는 t의 값이며, 이는 0.1 μM이었다. 따라서, 샘플은 0.1 μM 단백질 농도에서 탈린-1을 함유한다.
관심 단백질 p의 경우:
Figure pct00109
따라서, 모든 t ≥ 0에 대해, 테스트 1을 포함하는 모든 방정식을 만족시키는 t의 단일 값이 존재하지 않으므로, 관심 단백질 p 3 은 임의의 단백질 농도로 샘플 내에 존재하지 않는다.
관심 단백질 p 4 의 경우:
Figure pct00110
따라서, 모든 t ≥ 0에 대해, 테스트 1을 포함하는 모든 방정식을 만족시키는 t의 단일 값이 존재하지 않으므로, 관심 단백질 p4는 임의의 단백질 농도로 샘플 내에 존재하지 않는다.
관심 단백질 p 5 의 경우:
Figure pct00111
따라서, 모든 t ≥ 0에 대해, 테스트 1을 포함하는 모든 방정식을 만족시키는 t의 단일 값이 존재하지 않으므로, 관심 단백질 p 5 는 임의의 단백질 농도로 샘플 내에 존재하지 않는다.
일부 구현예에서, 테스트 1에 대해 요약된 단계는 컴퓨터 프로그램의 알고리즘으로 자동화되어, (1=참, 0=거짓) 관심 단백질 p i 가 샘플 내에 존재하는지
Figure pct00112
또는 샘플 내에 존재하지 않는지
Figure pct00113
를 보고하는 로직 결과(1,0)를 반환한다. 관심 단백질 n i 이 샘플 내에 존재하는 경우 및 경우에만(1이 반환됨), t의 값,
Figure pct00114
이 제공된다. 이것은 샘플 내의 관심 단백질 p i 의 몰 단백질 농도이다. 일부 구현예에서, 이는 파이썬 오픈 소스 프로그램(python open source program)을 사용하여 달성된다.
일부 구현예에서, 관심 단백질 p i 의 존재는 샘플에 대해 측정된 점, 예를 들어 (AAC 1 , AAC 2 , AAC j )가 관심 단백질 p에 대한 참조로서 제공된 선 상에 있지 않지만, 대신 관심 단백질 p i 에 대한 참조로서 제공된 선의 오차 한계, ε 내에 있는 경우 샘플에서 식별된다. 이는 실험 측정이 무한한 정확도도 무한한 정밀도도 없다는 사실을 반영하므로, 샘플에 대해 측정된 점은 관심 단백질 p i 가 샘플 내에 함유되는 경우 참조선 상에 항상 정확히 놓이지 않을 것이다.
테스트 2는 샘플 점이 참조선의 오차 한계, ε 내에 있는지 테스트함으로써 관심 단백질 p가 샘플 내에 존재한다는 가설을 테스트한다. 일부 구현예에서, 이것은 샘플 점과 참조선 사이의 최단 거리를 구한 다음, 이 거리가 오차 한계보다 작은지 여부를 결정함으로서 달성된다. 샘플 점과 참조선 사이의 이 최단 거리가 오차 한계보다 작으면, 샘플 내의 관심 단백질 p i 의 존재가 식별되고, 샘플 내의 관심 단백질 p의 농도가 최단 거리를 제공하는 참조선에 대한 정확한 점(농도)에 의해 제공된다.
일부 구현예에서, 점과 선 사이의 최단 거리는 점과 선 사이의 수직 거리이다. 참조선은 예를 들어 파라미터 방정식 1에 의해 파라미터적으로 설명되는 것 외에도, 내적을 통해 이 수직 거리를 산출하는 참조선 상의 정확한 점(농도)의 계산을 허용하는 벡터 형식으로 설명될 수 있다. 그런 다음, 거리 공식, 예를 들어 Euclidean 거리 공식은 샘플 점과 이 수직 거리 점 사이의 거리를 구하는 데 사용되고, 거리는 관심 단백질 p i 가 샘플 내에 존재하는지 여부를 결정하기 위해 오차 한계, ε와 비교된다. 관심 단백질 p i 가 샘플 내에 존재하면, 샘플 내에서 그의 농도는 샘플 점이 수직인 참조선 상의 농도(점)이다.
테스트 2에 대한 일반적인 접근법은 다음과 같다:
1. R을 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 에 대한 참조선으로 두고, S를 이로부터 최단 거리를 구하기 위한 샘플 점으로 둔다
2. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 의 농도인 t의 함수로서 벡터 형식으로 참조선 R의 방정식을 구한다
3. 참조선 R 상의 점 P의 일반 방정식을 구한다
4. S에서 P로의 벡터가 R에 수직이 되도록 Q라고 하는 참조선 R 상의 점 P의 정확한 위치를 구한다. 이것은 S와 Q 사이의 벡터가 수직을 제공하도록 참조선 R 상의 점 Q를 구하는 것을 의미한다. 이는 R의 방향으로 S에서 P로의 벡터의 내적(ㆍ)을 구하고, 이를 0으로 설정하고, t의 값을 제공하기 위해 t를 품으로써 달성되며, R 상의 점 P에 대한 일반 방정식으로 대체되는 경우, 수직 벡터를 산출한다. 참조가 샘플 내에 함유되면, t에 대한 이 해는 그의 농도이다.
5. 거리 공식을 사용하여 D라고 하는 Q와 S 사이의 거리를 구한다.
6. D가 오차 한계, ε보다 작은지 여부를 평가한다.
7. D > ε이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 는 샘플 내에 존재하지 않는다.
8. Dε이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 는 농도 t로 샘플 내에 존재한다.
예를 들어, 참조선(R)의 파라미터 형식은
Figure pct00115
이다
참조선의 벡터 형태는
Figure pct00116
이다
참조선 상의 점(P)의 일반 방정식은
Figure pct00117
이다
측정된 샘플 점(S)은 좌표를 갖는다:
Figure pct00118
측정된 샘플 점(S)에서 참조선(P) 상의 임의의 점까지의 벡터는 P - S이다:
Figure pct00119
.
이 벡터가 수직이 되려면, 참조선의 방향
Figure pct00120
에 따라 이 벡터의 내적(ㆍ)은 0이어야 한다. 따라서, 본 발명자들은 다음을 설정한다:
Figure pct00121
t에 대한 이 해는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 에 대한 샘플과 참조선 사이의 거리가 가장 짧은(본 발명자들이 식별한 수직 거리) 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 의 농도이다. 따라서, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 가 샘플 내에 존재하는 경우, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 는 농도 t로 샘플 내에 존재한다.
관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 가 샘플 내에 존재하는지 여부를 결정하기 위해, 수직 거리를 제공하는 참조선 상의 점, Q를 구한다. Q = P(t).
Figure pct00122
Qt에 대한 해에 상응하는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 에 대한 아미노산 농도 세트인 점이다. S도 점이다.
거리 공식을 사용하여 SQ 사이의 거리, D를 구한다.
예를 들어, 점 S와 점 Q 사이의 Euclidean 거리 공식은 다음과 같다:
Figure pct00123
따라서, 본 발명자들은 다음을 갖는다:
Figure pct00124
ε는 예를 들어 사용자에 의해 제공된 오류 임계값이다.
D > ε이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 는 샘플 내에 존재하지 않는다.
Dε이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 는 다음 농도로 샘플 내에 존재한다:
Figure pct00125
예를 들어, 단백질은 HPLC를 사용하여 인간 혈장으로부터 단리되고 그의 몰 단백질 농도는 알려져 있지 않다. 아미노산 유형 C, K, 및 W는 샘플에서 표지된다. C 아미노산 유형의 모든(비변형된 + 변형된) 아미노산, 즉, CT가 표지되고, K 아미노산 유형의 비변형된 아미노산(ε-아미노 기가 2차 아민이 아닌, 1차 아민인 K 아미노산 유형의 아미노산), 및 W 아미노산 유형의 모든(비변형된 + 변형된) 아미노산이 샘플에서 표지된다. 3.9 μM C, 16.1 μM K, 및 1.0 μM W의 아미노산 농도는 본원에 기재된 바와 같은 표지의 신호로부터 샘플에서 측정된다. C 아미노산 유형은 AAC 1 이고, K 아미노산 유형은 AAC 2 이고, W 아미노산 유형은 AAC 3 이다. AAC 1 = 3.9 μM, AAC 2 = 16.1 μM, 및 AAC 3 = 1.0 μM.
이 예에서, 참조 데이터베이스는 인간 혈장 내에서 발견된 5 개의 관심 단백질에 대해 이미 구축되었다. 이들은 파라미터 방정식 1을 사용하여 상기 기재된 바와 같은 아파민, 탈린-1, L-셀렉틴, C-반응성 단백질, 및 루미칸을 포함하여 각 관심 단백질의 임의의 단백질 농도 t에 대한 참조를 생성한다.
Figure pct00126
각 관심 단백질, p 1 , p 2 , p 3 , p 4 , 및 p 5 에 대한 참조는 3-차원 공간에서 선이다. 각 관심 단백질에 대한 참조는 3-차원 공간에서 선인 데, 아미노산의 3 개의 유형이 샘플에서 표지되고 측정되고, 아미노산 유형 C는 아미노산 유형 a 1 이고, 아미노산 유형 K는 아미노산 유형 a 2 이고, 아미노산 유형 W는 아미노산 유형 a 3 이기 때문이다. 파라미터 방정식 1 세트는 모든 t ≥ 0에 대한 참조를 정의하기 때문에, 모든 참조선은 원점을 교차한다(그리고 a 1 , a 2 ,…, a n 의 임의의 값에 0을 곱하면 0과 같다).
비교 단계에서, 테스트 1은 각 관심 단백질에 대해 제공된 각 참조에 적용된다. 본 발명자들은 다음을 갖는다:
Figure pct00127
관심 단백질 p 1 의 경우:
Figure pct00128
관심 단백질 p 1 은 테스트 1에 실패하였다.
관심 단백질 p 2 의 경우:
Figure pct00129
관심 단백질 p 2 는 테스트 1에 실패하였다.
관심 단백질 p 3 의 경우:
Figure pct00130
관심 단백질 p 3 은 테스트 1에 실패하였다.
관심 단백질 p 4 의 경우:
Figure pct00131
관심 단백질 p 4 는 테스트 1에 실패하였다.
관심 단백질 p 5 의 경우:
Figure pct00132
관심 단백질 p 5 는 테스트 1에 실패하였다.
따라서, 샘플 점은 관심 단백질 중 임의의 것에 대한 참조선 상에 없다. 그러나, 관심 단백질의 존재 및/또는 농도 및/또는 양은 샘플에서 측정된 2 개 이상의 아미노산 유형의 아미노산 농도가 하나 이상의 관심 단백질의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 아미노산 농도보다 작거나 이에 대한 오차 한계와 같은 농도의 단일 값이 존재하는 경우 샘플 내에서 식별된다. 일부 구현예에서, 오차 한계는 방정식 10으로 제공된다:
Figure pct00133
여기서 ε은 오차 한계이고,
Figure pct00134
는 사용자 입력 허용오차 값이고, S 1 은 아미노산 유형 1에 대한 샘플에 대해 측정된 값(표지 값, 아미노산 농도, 또는 아미노산 수)이고, S 2 는 아미노산 유형 1에 대한 샘플에 대해 측정된 값(표지 값, 아미노산 농도, 또는 아미노산 수)이고, S n 은 아미노산 유형 n에 대한 샘플에 대해 측정된 값(표지 값, 아미노산 농도, 또는 아미노산 수)이다.
사용자는 0.01의 사용자 입력 허용오차 값,
Figure pct00135
를 제공받았다. 따라서, 방정식 10은
Figure pct00136
이 된다.
테스트 2에서, 모든 관심 단백질은 각 관심 단백질에 대한 측정된 샘플 점과 참조선 사이의 가장 짧은(수직) 거리가 오차 한계 내에 속하는지 여부를 결정하기 위해 평가된다.
이 접근법은 관심 단백질 p 2 의 예에 대해 구체적으로 예시되고, 결과는 각 관심 단백질에 대해 후속적으로 표시된다.
관심 단백질 p 2 의 참조선(R)의 파라미터 형식은 다음과 같다:
Figure pct00137
벡터 형식에서, 이 참조선에 대한 방정식은 다음과 같다:
Figure pct00138
샘플 점은 S = (3.9, 16.1, 1)이다
측정된 샘플 점(S)에서 참조선 상의 임의의 점(P)까지의 벡터는 P - S이다:
Figure pct00139
이 벡터가 수직이 되려면, 참조선의 방향 <38, 159, 9>에 따라 이 벡터의 내적(ㆍ)은 0이어야 한다. 따라서, 본 발명자들은 다음을 설정한다
Figure pct00140
t에 대한 이 해는 샘플과 참조선 사이의 거리가 가장 짧은 관심 단백질 p 2 의 단백질 농도이다. 따라서, 관심 단백질 p 2 가 샘플 내에 존재하면, 관심 단백질 p 2 는 단백질 농도 t로 샘플 내에 존재한다.
참조가 샘플 내에 존재하는지 여부를 결정하기 위해, 수직 거리를 제공하는 참조선 상의 점, Q를 구한다. Q = P(t).
Figure pct00141
따라서, 관심 단백질 n 2 는 0.1017 μM의 단백질 농도로 샘플 내에 존재한다.
일부 구현예에서, 각 아미노산 유형(a 1 , a 2 , aj, 또는, w 1 , w 2 , w j )의 아미노산 수는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 하위단백체, 또는 단백체의 단백질 서열 또는 단백질 서열들로부터 결정되기 보다는, 실험적으로 계산된다. 이 구현예에서, 주어진 염료로 표지되지 않은 아미노산 유형의 변형된 아미노산을 초래하는 번역 후 변형, 및 관심 단백체 또는 하위단백체의 경우 단백질 발현 수준은 아미노산 수 계산 내에 자동으로 혼입된다.
관심 단백질의 경우, 샘플의 2 개 이상의 표지된 아미노산 유형에 대해 측정된 아미노산 농도에 기반한 샘플 내의 관심 단백질의 존재 및/또는 농도 및/또는 양을 평가하기 위해 파라미터 방정식에 의해 참조가 제공되는 방식, 및 비교 단계 내에서 참조가 사용되는 방식을 설명하였다. 참조는 다른 구현예에서 동일한 방식으로 비교 단계에서 사용되고, 이것은 "비교 단계" 섹션에서 추가로 설명된다. 여기서, 동일한 접근법을 따르는 참조의 나머지 형식이 설명된다.
본 발명의 방법은 또한 샘플 내에서 관심 단백체 또는 하위단백체의 존재 및/또는 농도 및/또는 양을 결정하는 데 사용된다. 관심 단백체 또는 하위단백체에 대한 참조는 또한 n 차원 공간에서 선일 수 있으며, n은 실험에서 표지되고 측정된 아미노산 유형의 수이다. 일부 구현예에서, 관심 하위단백체의 단백체에 대한 참조선의 구축은 관심 단백체 또는 하위단백체 내에 함유된 모든 단백질 서열의 아미노산의 가중 평균 수인 각 아미노산 유형의 아미노산 수를 갖는, 관심 단백체 또는 하위단백체의 (가설) 평균 단백질 서열의 아미노산 수의 결정에 의해 가능하며; 이 대표적인 단백질 서열에 아미노산 순서의 개념이 없고, 예를 들어 1980년에 Creighton(https://www.nature.com/articles/284487a0)에 의해 논의된 바와 같이, 각 아미노산 유형의 아미노산 수가 양의 정수(예를 들어
Figure pct00142
)를 갖는 표준 제약 조건이 제거된다. 각 아미노산 유형의 아미노산의 가중 평균 수는 방정식 11로 결정될 수 있다:
Figure pct00143
여기서 w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, c는 관심 단백체 또는 하위단백체에서 단백질의 수이고, a n,i 는 관심 단백체 또는 하위단백체 내의 단백질 i에서 아미노산 유형 n의 아미노산 수이고, q i 는 관심 단백체 또는 하위단백체에서 단백질 i의 양의 척도이고, q는 관심 단백체 또는 하위단백체에서 모든 단백질(단백질 i 내지 c)의 총 양의 동등한 척도이므로,
Figure pct00144
는 관심 단백체 또는 하위단백체 내의 단백질 i의 비율을 제공한다. 결과의 선형 조합은 관심 단백체 또는 하위단백체의 단백질 i 내지 c에 대해 취한다. q i q는 당업계에 알려진 다양한 방법을 사용하여 계산될 수 있다. 예를 들어, q i 는 바람직하게는 인간 단백질 아틀라스 데이터베이스 또는 ProteomeXchange에 제시된 것과 같은 질량 분광법, 면역검정 또는 단백질 마이크로어레이로부터 공개적으로 이용가능한 데이터에 의해 결정된, 관심 단백체 또는 하위단백체 내의 관심 단백질 i의 발현 수준일 수 있고, q는 공개적으로 이용가능한 단백질 발현 데이터를 사용하여 각각 평가된 관심 단백체 또는 하위단백체의 총 농도 또는 관심 단백체 또는 하위단백체 내에 함유된 모든 단백질(단백질 i 내지 c)의 총 예측된 발현 수준일 수 있다. 대안적으로, q i q는 mRNA 발현 데이터에 의해 결정될 수 있다. 유전자의 mRNA 발현 수준은 예를 들어 https://www.embopress.org/doi/full/10.15252/msb.20167144에 기재된 바와 같이, 유전자-특이적 RNA-대-단백질(RTP) 전환 계수를 사용하여 단백질의 발현 수준으로 전환될 수 있다. mRNA 발현 수준은 공공 데이터베이스, 예를 들어 인간 단백질 아틀라스 및 발현 아틀라스(Expression Atlas)로부터 이용가능하다. q는 이 방식으로 계산된 관심 단백체 또는 하위단백체 내의 모든 단백질(단백질 i 내지 c)의 발현 수준일 수 있다. 대안적으로, q i q는 알려진 구조적 모델로부터 계산될 수 있다. 예를 들어, 관심 단백체가 바이러스이면, q i 는 바이러스 구조 내의 단백질 i의 수일 수 있고(예를 들어, 코로나바이러스 스파이크 단백질의 수는 코로나바이러스 바이러스 캡시드 모델로부터 계산될 수 있음), q는 바이러스 구조 내의 모든 단백질(단백질 i 내지 c)의 수이다.
본원에 개시된 바와 같이, 바람직한 구현예에서, q i 는 바람직하게는 질량 분광법 데이터베이스로부터 공개적으로 이용가능한 데이터에 의해 결정된, 관심 단백체 또는 하위단백체 내의 관심 단백질 i의 발현 수준일 수 있고, q는 공개적으로 이용가능한 단백질 발현 데이터를 사용하여 각각 평가된 관심 단백체 또는 하위단백체의 총 농도 또는 관심 단백체 또는 하위단백체 내에 함유된 모든 단백질(단백질 i 내지 c)의 총 예측된 발현 수준일 수 있다. 이러한 구현예에서, 관심 단백체 또는 하위단백체 내의 관심 단백질 i에 대한 발현 수준(q i ), 및 관심 단백체 또는 하위단백체의 총 농도 또는 관심 단백체 또는 하위단백체 내에 함유된 모든 단백질(단백질 i 내지 c)의 총 예측된 발현 수준(q)은 질량 분광법 데이터베이스에 의해 제공된 공개적으로 이용가능한 단백질 발현 데이터를 사용하여 평가될 수 있다. 이를 달성하기 위해, 질량 분광법 데이터베이스에 제공된 단백질 정량화 데이터가 사용된다. 질량 분광법 데이터베이스의 무표지 정량화 데이터는 존재하는 단백질의 양(질량)에 비례하는 강도 값, int로 제공된다. 이러한 제공된 int 값은 개별 단백질에 대한 강도를 분자 질량으로 나누어 존재하는 단백질의 몰량에 비례하도록 전환할 수 있다. 일부 구현예에서, 방정식 11 내의 q i 는 방정식 13으로 제공된다:
Figure pct00145
여기서 int m 은 개별 단백질의 몰 강도이고, int는 개별 단백질의 제공된 강도이고, m r 은 개별 단백질의 분자 질량이다. 방정식 11에서 요구되는 바와 같이, int m 은 관심 참조 단백체 또는 하위단백체 내의 각 관심 단백질에 대해 계산된다. 일부 구현예에서, 이는 PowerBI; Microsoft® 분석 프로그램을 사용하여 계산된다.
방정식 11 내에서, qc 단백질을 함유하는 관심 단백체 또는 하위단백체 내의 모든 관심 단백질 i에 걸친 q i 값의 합이며, 다음을 의미한다:
Figure pct00146
int m 이 방정식 11 내에서 q i 의 한 가지 가능한 형태인 것처럼, Σint m 이 관심 하위단백체의 단백체에 대한 q의 한 가지 가능한 형태임을 따른다. 이 관계는 방정식 14로 공식화된다:
Figure pct00147
따라서,
Figure pct00148
은 본원에 개시된 방정식 11에서
Figure pct00149
의 한 가지 가능한 형태이다.
참조의 용이성을 위해,
Figure pct00150
은 질량 분광법 몰 강도 분율이라고 하며, MSIF m 으로 약칭된다. 이 관계는 방정식 15로 공식화된다:
Figure pct00151
질량 분광법 몰 강도 분율, MSIF m 은 상대적 양이며, 각 단백질이 관심 단백체 또는 하위단백체에 기여하는 몰 농도의 비율을 제공한다. 예를 들어, 단백질이 관심 단백체의 총 몰 단백질 농도의 몰 농도의 1%에 기여하는 경우, 그의 MSIF m 값은 0.01의 무단위 값이 될 것이다. 그러나, Σint m 은 상대적 양이 아니고 관심 단백체의 몰 단백질 농도에 관련될 수 있다. 이를 달성하기 위해, 질량 분광법을 통해 액세스가능한 Σint m 값은 동일한 관심 단백체에 대한 면역 검정 또는 펩티드 마이크로어레이 실험을 통해 액세스가능한 몰 또는 질량 농도 값과 관련된다. 예를 들어, 인간 혈장 단백체의 건강한 환자 하위단백체 내의 단백질의 총 몰 농도 및 총 질량 농도는 인간 단백질 아틀라스에 기탁된 공개적으로 이용가능한 데이터를 사용하여 계산되었다. 액세스된 데이터는 https://www.proteinatlas.org/humanproteome/blood/proteins+detected+by+immunoassay에서 이용가능하다. 표시된 인간 단백질 아틀라스 데이터베이스에 제공된 인간 유전자 명칭은 https://www.uniprot.org/uploadlists/에서 이용가능한 UniProt 데이터베이스 Retrieve/ID 맵핑 도구를 사용하여 UniProtKB 식별자에 대해 맵핑하였다. 각 단백질의 분자량을 다운로드하였다. 그런 다음, Microsoft Excel을 사용하여, 각 단백질의 질량 농도를 각 단백질의 분자량으로 나누어 인간 혈장 단백체 내의 각 단백질의 질량 농도를 계산하였다. 결과는 인간 혈장 단백체 내에 존재하는 모든 단백질에 걸쳐 합산하여, 1201.5 μM의 인간 혈장 단백체에 대한 총 몰 단백질 농도를 제공하였다. Σint m 값은 사용된 특이적 질량 분광법 기기에 따라 달라질 수 있지만, 인간 혈장 단백체의 건강한 하위단백체에 대한 총 몰 단백질 농도가 1201.5 μM인 것으로 알려져 있기 때문에, 주어진 질량 분광법 데이터세트에서 인간 혈장 단백체의 건강한 하위단백체에 대한 Σint m 값에 기반하여 각 질량분광법 데이터세트에 대한 관계를 확립할 수 있다. 이 변환을 수행하기 위해 질량 분광법 데이터세트의 Σint m 과 인간 혈장 단백체의 건강한 하위단백체에 대한 총 몰 단백질 농도 사이의 전환은 식 15를 계산하여 확립한다:
Figure pct00152
여기서 평균(Σint m )은 인간 혈장 단백체의 건강한 하위단백체의 모든 환자 샘플에 대한 Σint m 값의 평균이다.
추가로, 일부 구현예에서 질량 분광법 강도 값을 관심 단백체 또는 하위단백체의 몰 농도보다는, 관심 단백체 또는 하위단백체의 질량 농도 또는 양으로 전환하는 것이 바람직하다. 이 경우, 질량 분광법 몰 강도 분율을 계산하는 대신에, 질량 분광법 질량 강도 분율을 계산한다. 방정식 11에서
Figure pct00153
에 대한
Figure pct00154
을 계산하는 대신에, 제공된 질량 분광법 강도 값은 단백질 분자량으로 나누어 몰 강도로 전환되지 않는다. 대신, 질량 분광법 강도 값과 존재하는 단백질의 질량 사이의 고유한 비례 원칙은 질량 분광법 질량 강도 분율의 계산, 방정식 16에 활용된다:
Figure pct00155
여기서 int는 관심 단백체 또는 하위단백체 내의 주어진 단백질에 대한 질량 분광법 강도이고 Σint는 관심 단백체 또는 하위단백체 내의 모든 단백질에 걸친 강도 값의 합이다. MSIF m 값과 마찬가지로, MSIF 질량 값은 관심 단백체 또는 하위단백체 내의 각 단백질의 분율을 제공하는 상대적 양이다. 그들은 관심 단백체의 질량 단백질 농도 또는 관심 단백체 또는 하위단백체의 질량과 관련될 수 있다. 이를 달성하기 위해, 질량 분광법을 통해 액세스가능한 Σint 값은 동일한 관심 단백체에 대한 면역검정 또는 펩티드 마이크로어레이 실험을 통해 액세스가능한 질량 농도 값과 관련된다. 상기 기재된 바와 같은 인간 펩티드 아틀라스 질량 농도는 인간 혈장 단백체 내에 존재하는 모든 단백질에 걸쳐 합하여, 77453 μg/mL의 인간 혈장 단백체에 대한 총 질량 단백질 농도를 제공하였다. Σint 값은 사용되는 특이적 질량 분광법 기기에 따라 달라질 수 있지만, 인간 혈장 단백체의 건강한 하위단백체에 대한 총 질량 단백질 농도는 77453 μg/mL인 것으로 알려져 있기 때문에, 주어진 질량 분광법 데이터세트에서 인간 혈장 단백체의 건강한 하위단백체에 대한 Σint 값에 기반하여 각 질량 분광법 데이터세트에 대한 관계를 확립할 수 있다. 이 변환을 수행하기 위해 질량 분광법 데이터세트의 Σint와 인간 혈장 단백체의 건강한 하위단백체에 대한 총 몰 단백질 농도 사이의 전환은 식 17을 계산하여 확립한다:
Figure pct00156
여기서 평균(Σint)는 인간 혈장 단백체의 건강한 하위단백체의 모든 환자 샘플에 대한 Σint 값의 평균이다.
일부 구현예에서, 질량 분광법 데이터베이스에서 이용가능한 질량 분광법 총 몰 강도 값을 사용하여 존재하는 단백질의 몰 또는 질량을 계산하는 것이 바람직할 수 있다. 총 강도 값 Σint는 질량에 비례하므로, 예를 들어 표준화되었기 때문에 질량 분광법에 첨가된 총 단백질 농도가 알려져 있는 경우, 총 강도 값 Σint의 합은 총 단백질의 이 질량과 같다는 것이 알려져 있다. 따라서, 각 단백질의 강도를 샘플
Figure pct00157
에서 모든 단백질에 걸친 강도의 합으로 나누어 계산하면 샘플 내에서 개별 단백질의 분수 질량을 제공한다. 그런 다음 이를 샘플 당 제공되는 총 단백질 질량과 곱하여 각 샘플 내의 각 개별 단백질의 μg의 질량을 제공할 수 있다. 대안적으로, 몰량이 바람직한 경우, 각 샘플 내의 각 단백질에 대해, μg의 질량을 g/mol의 단백질 분자량(이는 본원에 개시된 바와 같이 Uniprot로부터 다운로드할 수 있음)으로 나누어, μmol의 몰량을 제공할 수 있다.
방정식 11에서, q i 는 관심 단백체 또는 하위단백체에서 단백질 i의 양의 척도이고, q는 관심 단백체 또는 하위단백체에서 모든 단백질의 총 양의 동등한 척도이다. 따라서, 각 샘플 내의 모든 단백질의 총 몰 또는 질량은 또한 방정식 11에서 q를 제공한다.
Figure pct00158
는 각 샘플 내의 각 단백질의 몰량을 각 샘플 내의 모든 단백질의 총 몰량으로 나누어 계산할 수 있고, 그런 다음 방정식 11은 w K , w W , w Y , 및 w c 값을 계산하는 데 사용될 수 있다.
대안적으로, 각 아미노산 유형의 아미노산의 가중 평균 수는 방정식 12로 결정될 수 있다:
Figure pct00159
여기서 w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, c는 관심 단백체 또는 하위단백체에서 단백질의 수이고, a n,i 는 관심 단백체 또는 하위단백체에서 단백질 i의 아미노산 유형 n의 아미노산 수이다. 결과의 선형 조합은 관심 단백체 또는 하위단백체의 단백질 i 내지 c에 대해 취한다. 이 구현예에서, 관심 단백체 또는 하위단백체 내의 모든 단백질은 관심 단백체 또는 하위단백체 내의 동등한 발현 또는 비율을 갖는 것으로 여기므로, 관심 단백체 또는 하위단백체 내의 각 관심 단백지에 대한 가중치는 같다.
대안적으로, 아미노산 유형 1의 아미노산의 가중 평균 수(w 1 )는 관심 단백체 또는 하위단백체에서 아미노산 유형 1의 아미노산 농도를 측정하고, 관심 단백체 또는 하위단백체의 총 농도를 당업계에 알려진 방법으로 측정하고, 아미노산 유형 1의 측정된 아미노산 농도를 본원에 개시된 바와 같은 관심 단백체 또는 하위단백체의 측정된 총 농도로 나눔으로써 계산된다. 아미노산 유형 2의 아미노산의 가중 평균 수(w 2 )는 관심 단백체 또는 하위단백체에서 아미노산 유형 2의 아미노산 농도를 측정하고, 관심 단백체 또는 하위단백체의 총 농도를 당업계에 알려진 방법으로 측정하고, 아미노산 유형 2의 측정된 아미노산 농도를 본원에 개시된 바와 같은 측정된 총 농도로 나눔으로써 계산된다. 아미노산 유형 n의 아미노산의 가중 평균 수(w n )는 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산 농도를 측정하고, 관심 단백체 또는 하위단백체의 총 농도를 당업계에 알려진 방법으로 측정하고, 아미노산 유형 n의 측정된 아미노산 농도를 본원에 개시된 바와 같은 측정된 총 농도로 나눔으로써 계산된다.
각 아미노산 유형의 이 아미노산의 가중 평균 수는 관심 단백체 또는 하위단백체에 대한 참조선을 제공하는 데 사용된다. 샘플에 대해 제공된 측정이 본원에 개시된 바와 같은 아미노산 유형 1, 아미노산 유형 2, 및 아미노산 유형 n에 대해 측정된 아미노산 농도인 경우, 참조선은 파라미터 방정식 2 세트로 설명된다:
Figure pct00160
여기서 p i 는 관심 단백체 또는 하위단백체이고, w 1 은 관심 단백체 또는 하위단백체에서 아미노산 유형 1의 아미노산의 가중 평균 수이고, w 2 는 관심 단백체 또는 하위단백체에서 아미노산 유형 2의 아미노산의 가중 평균 수이고, w j 는 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, t는 단백체/하위단백체 농도이고(여기서 단백체/하위단백체 농도는 단백체 또는 하위단백체를 포함하는 모든 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체 p i 의 총 몰 농도임), n 차원 각각에서 참조선을 집합적으로 명시하는 n 개의 함수 각각에서 공통 독립적 변수(또는 파라미터)이고, 여기서 t는 0보다 더 크거나 같은 모든 t에 대해 정의된다(
Figure pct00161
.
일부 구현예에서, 계산은 샘플에 대해 수행될 필요가 없으며; 샘플의 표지는 간단하게 측정될 수 있고,모든 계산은 대신 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대해 수행될 수 있다. 샘플의 측정의 직접 출력은 본 발명의 방법에서 표지되고 측정된 2 개 이상의 아미노산 유형 각각의 측정된 표지(예를 들어 표지의 신호)이고, 참조는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 용액의 농도의 함수로서 알려진 표지 값(예를 들어 알려진 표지의 신호)을 제공하도록 구성될 수 있다. 교정 곡선 또는 표준은 각 아미노산 유형에 대한 아미노산 농도와 각 아미노한 유형에 대한 알려진 표지 값(예를 들어 표지의 신호) 사이를 변환한다. 바람직하게는, 교정 곡선은 선형 함수이다. 교정 곡선 또는 표준은 예를 들어 하나 이상의 교정 아미노산 또는 교정 단백질에 의해 제공된 알려진 아미노산 농도의 하나 이상의 표준 용액을 측정함으로써 결정된다. 일부 구현예에서, 아미노산 농도는 nM 또는 μM과 같은 농도 단위로 제공되고, 표지의 신호는 AU와 같은 임의 단위로 측정된다.
f n 은 교정 곡선으로부터 파생된 교정 함수, 또는 아미노산 유형 n에 대한 교정 계수이고 알려진 아미노산 농도로부터 표지의 신호로 전환한다.
Figure pct00162
은 교정 곡선으로부터 파생된 교정 함수의 역수, 또는 아미노산 유형 n에 대한 교정 계수이고 표지의 측정된 신호로부터 아미노산 농도로 전환한다.
Figure pct00163
일부 구현예에서, 교정 곡선은 선형이며, 아미노산 유형 n의 표지 값이 아미노산 유형 n의 아미노산 농도와 선형으로 관련되고, 교정 함수가 교정 계수임을 의미한다. 대안적인 구현예에서, 교정 곡선은 비선형이고, 교정 함수는 교정 계수로 환원될 수 없는 데, 추가적인 변환이 요구되기 때문이다(예를 들어, 교정 함수는 멱함수 관계를 설명할 수 있다).
예를 들어, W 아미노산 유형의 알려진 아미노산 농도에 대한 표지 값이 측정되고 W 아미노산 유형의 아미노산 농도의 함수로 표시되었고, 선은 방정식 7에 맞춤화하였다("각 표지된 아미노산 유형의 측정" 섹션 내). W 아미노산 유형의 경우, 이는 다음을 제공한다:
Figure pct00164
교정 곡선은 선형이므로, 교정 계수가 결정될 수 있다. W 아미노산 유형에 대한 교정 계수, f w 는 교정 곡선의 기울기이고, 이 실시예에서
Figure pct00165
이다. 아미노산 유형 n에 대한 교정 계수는 f n 이라고 한다. 교정 곡선 또는 표준은 또한 "각 표지된 아미노산 유형의 농도 측정" 섹션에서 사용되는 역수이다. 교정 곡선 또는 표준의 역수는 아미노산 유형의 표지의 측정된 신호와 아미노산 유형의 아미노산 농도 사이를 반대 방향으로 변환한다. 아미노산 유형 n에 대한 교정 계수의 역수는
Figure pct00166
이라고 한다. 예를 들어, 상기 교정 계수의 역수는
Figure pct00167
이다:
Figure pct00168
Figure pct00169
은 교정이 샘플에서 취한 측정에서 수행되는 경우 사용되고, f j 는 참조를 계산할 때 교정이 수행되는 경우 사용된다.
샘플의 측정이 아미노산 유형 1, 아미노산 유형 2, 및 아미노산 유형 n의 측정된 표지(예를 들어 표지의 신호)의 측면에서 제공되는 경우, 관심 참조선 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체의 파라미터 방정식은 파라미터 방정식 3에 의해 주어진다:
Figure pct00170
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체이고, a 1 은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 아미노산 수이고, f 1 은 아미노산 유형 1에 대한 교정 계수 또는 교정 함수이고, a 2 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 2의 아미노산 수이고, f 2 는 아미노산 유형 2에 대한 교정 계수 또는 교정 함수이고, a n 은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이고, f n 은 아미노산 유형 n에 대한 교정 계수 또는 교정 함수이고, t는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체의 농도이고, n 차원 각각의 참조선을 집합적으로 명시하는 n 개의 함수 각각에서 공통 독립적 변수(또는 파라미터)이고, 여기서 t는 0보다 더 크거나 같은 모든 t에 대해 정의된다(
Figure pct00171
.
바람직한 경우, 참조, 또는 참조 데이터베이스의 생성에 사용되는 a 1 , a 2 a j 값 또는 w 1 , w 2 w j 값이 참조 데이터베이스에 제시된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 기능적 형태를 반영함을 보장하는 임의적인 처리 단계가 수행될 수 있다. 이러한 임의적인 처리 단계는 하기에 기재되어 있다.
일부 구현예에서, 샘플에 대해 측정된 값이 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 기능적 형태를 반영하는 참조와 비교하거나, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 하나 초과의 형태로 비교하도록 처리 단계가 수행될 수 있다. 예를 들어, 샘플에 대해 측정된 값이 번역 후 변형을 거치거나, 번역 후 변형을 거치거나 거치지 않은 관심 단백질을 반영하는 참조와 비교하도록 처리 단계가 수행될 수 있다.
일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 상응하는 아미노산 유형의 아미노산 수는 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열로부터 결정된다. 일부 구현예에서, 관심 단백질, 펩티드, 올리고펩티드 또는 폴리펩티드에서 각 아미노산 유형의 아미노산 수는 아미노산 서열에서 아미노산 유형의 발생 빈도를 지칭하고, 예를 들어, 컴퓨터 프로그램을 사용하여 관심 단백질, 펩티드, 올리고펩티드 또는 폴리펩티드에 대한 공개적으로 이용가능한 FASTA 서열 내의 아미노산 유형에 상응하는 특성의 발생 수를 구함으로써 결정될 수 있다. 번역 후 변형은 고려되지 않는다. 예를 들어, 암탉 알 흰자위 리소자임은 관심 단백질이다. 암탉 알 흰자위 리소자임의 하나의 분자의 아미노산 서열은 다음과 같다:
Figure pct00172
아미노산 유형 K는 단백질 서열에 6 번 나타난다(이탤릭체). 단백질 분자 당 K의 수는 6이며, 파라미터 방정식 세트 1에서 a 1 이다. 아미노산 유형 C는 단백질 서열에서 8 번 나타난다(굵게 표시됨). 단백질 분자 당 C의 수는 8이며, 파라미터 방정식 1 세트에서 a 2 이다. 아미노산 유형 W는 단백질 서열에서 6 번 나타난다(밑줄 침). 단백질 분자 당 W의 수는 6이며, 파라미터 방정식 1 세트에서 a 3 이다(3 개의 아미노산 유형이 표지되기 때문임, a n = a 3 ).
일부 구현예에서, 번역 후 변형은 참조, 또는 참조 데이터베이스의 생성에 사용된 a 1 , a 2 a n 값 또는 w 1 , w 2 w n 값을 계산하는 경우 고려된다. 일부 구현예에서, 관심 단백질 내의 아미노산 유형의 아미노산 수는 관심 단백질의 아미노산 서열 내의 해당 아미노산 유형의 발생 수에서 아미노산 유형이 표지와 반응하는 것을 방지하는 해당 아미노산 유형의 번역 후 변형의 수를 뺀 값이다. 바람직하게는, 관심 단백질에서 각 아미노산 유형의 아미노산 수는 아미노산 표지화에 사용되는 표지와 화학적으로 비반응성이게 되는 방식으로 아미노산 유형을 정의하는 R-기에 영향을 미치는 번역 후 변형(PTM)을 고려함으로써 조정된다. 단백질 서열에 영향을 미치는 PTM은 예를 들어 Uni Prot 또는 Swiss Prot 데이터베이스에서 공개적으로 이용가능하다. 아미노산 유형이 특이적 PTM에 의해 지시된 방식으로 변형된 경우, 이는 일련의 논리적 규칙으로 제공된, 관심 단백질 서열 내의 해당 아미노산 유형의 아미노산 수의 계산 동안 특정 계산이 수행되도록 표시될 수 있다. 가능한 규칙은 아무것도 하지 않거나(규칙 = 0), 하나를 빼거나(규칙 = -1), 단백질 서열 내에 함유된 해당 아미노산 유형의 수에 하나를 더하거나(규칙 = +1), 본 발명의 방법에서 또한 표지된 경우 단백질 서열 내에 함유된 또 다른 아미노산 유형의 수에 하나를 더한다(+1기타, 예를 들어 D 아미노산 유형이 또한 본 발명의 방법에서 표지되고 측정된 경우 +1D). 규칙은 아미노산 R-기와 본원에 개시된 특이적 표지 및 표지의 부류의 특이적 상호작용에 의해 지시되고, 표 4에 제공되어 있다. 규칙은 참조 데이터베이스에 포함될 수 있다.
표 4: 아미노산 유형 내에서 아미노산의 PTM에 대한 규칙
Figure pct00173
많은 PTM은 Edman 분해와 같은 고전적인 접근법 또는 플루오로시퀀싱과 같은 최신 접근법을 사용하여 관심 단백질을 서열분석할 가능성을 제거한다. PTM이 Edman 분해 및 플로우로서열분석을 사용하여 단백질을 서열분석할 가능성을 제거하는 경우, "Y"는 Edman 제거 열에서 발생한다. 그러나, 모든 PTM으로 변형된 단백질을 함유하는 샘플은 특히 아미노산 수가 본원에 개시된 규칙을 사용하여 계산될 때, 본 발명의 방법으로 식별될 수 있다.
일부 구현예에서, 참조는 특정 번역 후 변형을 거친 관심 단백질에 대해 제공될 수 있고, 또 다른 참조는 특정 번역 후 변형을 거치지 않은 관심 단백질에 대해 제공될 수 있다. 일부 구현예에서, 본 발명의 방법은 관심 단백질의 단백질 서열로부터 각 아미노산 유형의 아미노산 수를 결정할 때, PTM 규칙을 적용하는 관심 단백질에 대한 참조 값, 및 임의의 규칙을 적용하지 않은 추가적인 참조를 제공함으로써, 관심 단백질이 특이적 PTM을 거치거나, 거치지 않았는지 여부를 검출하는 데 사용된다. PTM은 단백질 거동의 동적 조절자일 수 있기 때문에, 이 결과는 질환을 나타낼 수 있다.
일부 구현예에서, 비변형된 아미노산 유형은 본 발명의 방법을 사용하여 표지되고 측정된다. 이 경우, 표 4의 규칙 열에 -1이 있고(규칙 = -1), 관심 단백질의 단백질 서열에서 해당 아미노산 유형의 아미노산의 발생 수로부터 1을 뺀다. 예를 들어, 리신(K) 아미노산 유형을 OPA 표지로 표지화하고 비변형된 리신 아미노산을 측정하고, 세린을 Fl-DIBO 표지로 표지화하고 비변형된 세린 아미노산을 측정한다. 일부 구현예에서, 아미노산 유형의 변형 및 비변형된 아미노산 둘 다는 본 발명의 방법을 사용하여 표지되고 측정된다. 이 경우, 표 4의 규칙 열에 0이 있고(규칙 = 0), 표시된 번역 후 변형이 관찰된 실험적 또는 이론적 데이터가 나타내는 경우 관심 단백질의 단백질 서열에서 해당 아미노산 유형의 아미노산의 발생 수로부터 어떤 값도 빼지 않는다. 예를 들어, 트립토판(W) 아미노산 유형을 TCE 표지로 표지화하고 비변형 및 변형된 트립토판 아미노산 둘 다를 측정하는 데, 방향족 고리에 치환기의 부착이 라디칼 매개된 TCE 화학에 대한 방향족 고리의 친핵성에 유의하게 영향을 미치지 않기 때문이다. 티로신(Y) 아미노산 유형을 TCE 표지로 표지화하고 비변형 및 변형된 티로신 아미노산 둘 다를 측정하는 데, 방향족 고리에 치환기의 부착이 라디칼 매개된 TCE 화학에 대한 방향족 고리의 친핵성에 유의하게 영향을 미치지 않기 때문이다. 표 4에 보고된 아미노산 유형 내의 모든(비변형 + 변형) 또는 비변형된 아미노산을 표지화하기 위한 이들 규칙을 요약하면, 비변형 및 변형된 아미노산 둘 다는 번역 후 변형이 아미노산 유형의 표지화를 위해 선택된 표지(예를 들어 염료)와 반응하는 R-기의 부분에 영향을 미치지 않은 경우 표지되고, 비변형된 아미노산만은 번역 후 변형이 아미노산 유형의 표지화를 위해 선택된 염료와 반응하는 R-기의 부분에 영향을 미치는 경우 표지된다.
일부 구현예에서, 아미노산 유형 내의 아미노산은 표지화 반응 내에서 그들의 변형된 형태와 비변형된 형태 사이에서 전환될 수 있다. 구체적으로, 변형된 아미노산은 비변형된 아미노산으로 전환될 수 있다. 이것은 아미노산 유형 내의 아미노산 유형(비변형된 + 변형된)의 모든 아미노산을 표지화할 수 있다. 이것은 표지와 반응 전에, 먼저 아미노산 유형의 변형된 아미노산을 화학적 반응으로 아미노산 유형의 비변형된 아미노산으로 전환함으로써 달성된다. 예를 들어, 변형된 아미노산은 트리스(2-카르복시에틸)포스핀(TCEP)으로의 환원을 통해 비변형된 시스테인 아미노산으로 전환될 수 있다. 또 다른 예로서, 글리코실화된(변형된) 세린, 트레오닌, 또는 아스파라긴 아미노산은 https://www.hindawi.com/journals/ijcc/2012/640923/에 기재된 바와 같이, 샘플 용액의 pH를, 예를 들어 pH 10.5까지 상승시킴으로써 비변형된 세린, 트레오닌, 또는 아스파라긴 아미노산으로 전환될 수 있다. 이것은 아미노산 R-기로부터 글리칸 잔기를 절단하여, 아미노산이 더 이상 변형되지 않도록 한다. 효소는 대안적으로 변형된 아미노산을 비변형된 아미노산으로 전환하는 데 사용될 수 있다. 표지화 방법이 표지와의 반응 전에 전환 단계를 혼입하여, 해당 아미노산 유형의 모든(비변형된 + 변형된) 아미노산이 표지와의 반응에 이용가능하도록 하는 경우, 논의된 PTM 규칙은 관심 단백질의 단백질 서열에서 해당 아미노산 유형의 아미노산 수를 계산하는 경우 적용되지 않는다. 예를 들어, 시스테인 아미노산 유형의 모든 (비변형된 + 변형된) 아미노산을 표지하는 경우, 이황화 결합에 참여하는 시스테인 아미노산의 수는 단백질 서열에서 나타난 C 아미노산 수로부터 빼지 않는 데, 변형된 시스테인 아미노산이 이미 환원을 통해 비변형된 아미노산으로 전환되었기 때문이다.
일부 구현예에서, TCEP가 샘플에서 시스테인 아미노산 유형의 표지화의 일부로서 사용되지 않아, 비변형된, 환원된 시스테인만이 표지화(CR)되는 경우, 배타적으로 시스테인 아미노산 유형의 환원된 형태를 제공하고 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체의 농도의 함수로서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 이 아미노산 유형의 표지 값, 아미노산 농도, 또는 수에 대한 참조를 생성하기 위해, 표 4에 설명된 바와 같이, 이황화 결합에 참여하는 시스테인 아미노산을 시스테인 아미노산의 총 수로부터 뺐다. 대안적으로, 기계 학습 접근법을 사용하여 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 CR 아미노산 유형의 아미노산 수를 계산하고 이에 따라 참조를 생성한다. 일부 구현예에서, 기계 학습 접근법은 DIANNA 기계 학습 접근법이다. 일부 구현예에서, 기계 학습 접근법은 Dinosolve, GDAP 또는 DBCP 기계 학습 접근법이다. Uniprot와 같은 공공 데이터베이스를 통해 또는 DiANNA와 같은 기계 학습 접근법을 통해 액세스된 단백질 이황화 결합에 대한 실험적 정보는 일반적으로 이황화 결합된 단백질 내의 시스테인 아미노산ㄱ과 같은 변형된 시스테인 아미노산의 수를 결정하는 데 사용된다. 환원된 시스테인(CR)의 수가 단백질 서열 및 공개적으로 이용가능한 PTM 정보 또는 기계 학습 접근법을 사용하여 결정되는 경우, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물 내의 환원된 시스테인의 수는 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물 내의 시스테인의 총 수에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 내의 이황화 결합된 시스테인의 수를 뺀 값이다.
일부 구현예에서, 관심 단백체 또는 하위단백체에 대한 w 1 , w 2 , w j 값은 공개적으로 이용가능한 단백체 전체 PTM 통계를 사용하여 계산된다. 비변형 또는 변형된 아미노산 수는 예를 들어 https://www.nature.com/articles/srep00090.pdf에 의해 기재되거나, http://ares.tamu.edu/PTMCuration/과 같은 공개적으로 이용가능한 온라인 리소스에 의해 제공되는 것과 같이, 공개적으로 이용가능한 단백체 전체 번역 후 변형 통계를 사용함으로써 관심 단백체 또는 하위단백체에 대해 계산될 수 있다. 이것은 관심 단백체 또는 하위단백체 내의 모든 단백질에 대한 PTM의 계산을 피한다. 일부 구현예에서, 이 정보는 필터링되어 원핵생물, 진핵생물, 및 인간을 포함한 포유동물에 특이적인 번역 후 변형 빈도를 제공한다. 일부 구현예에서, 바이러스는 번역 후 변형을 겪지 않은 것으로 처리되는 데, 그들은 번역 후 변형을 수행하는 효소를 코딩하는 유전자를 함유하지 않기 때문이다. 일부 구현예에서, 바이러스는 숙주 내의 단백질이 겪은 번역 후 변형 또는 번역 후 변형의 서브세트를 거치는 것으로 처리되는 데, 바이러스가 그들의 숙주 세포의 단백질 번역 기구를 장악하기 때문이다. 예를 들어, 박테리오파지는 원핵생물 번역 후 변형을 거치는 것으로 처리되고 진핵생물 또는 포유동물에 영향을 미치는 바이러스는 진핵생물 또는 포유동물 번역 후 변형을 거치는 것으로 처리된다. Swiss Prot 데이터베이스에서 관찰된 실험적, 추정적(예측됨), 또는 실험적 및 추정적 번역 후 변형의 총 수는 공개적으로 이용가능하다. 아미노산 유형의 비변형된 아미노산 수를 예측하거나, 아미노산 유형의 변형된 아미노산 수를 예측하기 위해, 해당 아미노산 유형의 변형 빈도는 해당 아미노산 유형에 영향을 미치는 모든 번역 후 변형을 합하고 Swiss Prot 데이터베이스에서 해당 아미노산 유형의 총 아미노산 수로 나눔으로써 결정된다. 아미노산 유형에 영향을 미치는 번역 후 변형은 예를 들어, 표 4에 제공된다. 이것은 유기체의 부류에 의해 상이할 수 있는 각 아미노산 유형에 대한 변형 인자를 나타낸다. 예를 들어, 원핵생물에서 아미노산 유형 리신(K)의 모든 아미노산에 대한 변형 인자(M F )는 리신 아미노산 유형에 영향을 미치는 모든 번역 후 변형의 보고된 빈도를 더한 다음 Swiss Prot 데이터베이스의 원핵생물 유기체 내의 리신 아미노산의 총 수로 나눔으로써 결정된다. 원핵생물에서 비변형된 리신 잔기의 분율은 1 - M F 이다. 따라서, 박테리아 단백체에 상응하는 대표적인 단백질 서열에서 리신 아미노산의 가중 평균 수를 계산하는 경우, 이 아미노산 수에 (1 - M F )를 곱하여 박테리아 단백체에 대해 예측된 비변형된 리신 아미노산의 수를 게산하거나, 이 아미노산 수에 MF를 곱하여 박테리아 단백체에 대해 예측된 변형된 리신 아미노산 수를 계산한다.
일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 서열에서 각 아미노산 유형의 아미노산 수를 결정하는 경우, 신호 서열 또는 생물학적으로 절단된 영역은 서열에서 각 아미노산 유형의 아미노산의 발생 수가 결정되고/되거나 PTM 규칙이 적용되기 전에 서열로부터 제거된다. 이것은 성숙한 단백질에서 각 아미노산 유형의 아미노산 수를 제공한다. 그러나, 이것은 하나 이상의 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 또는, 단백질, 펩티드, 폴리펩티드, 올리고펩티드의 혼합물이 성숙한 단백질이 아닌 경우 필요하지 않다.
일부 구현예에서, 관심 단백질 복합체가 있는 경우, 단백질 복합체의 각 하위단위에서 각 아미노산 유형의 아미노산 수를 단백질 복합체의 하나 이상의 나머지 하위단위에서 각 상응하는 아미노산 유형의 아미노산 수에 더한다. 예를 들어, 26S 프로테아좀 단백질 복합체에 대한 W 및 K 아미노산 유형의 아미노산 수를 계산하기 위해, W 아미노산 유형의 아미노산 수는 26S 프로테아좀의 모든 하위단위에 걸쳐 합하고 K 아미노산 유형의 아미노산 수는 26S 프로테아좀의 모든 하위단위에 걸쳐 합한다.
일부 구현예에서, a 1 , a 2 a j 또는 w 1 , w 2 , w j 값을 제공하여 참조를 생성하기 위해 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체, 또는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 혼합물에서 각 아미노산 유형의 아미노산 수를 결정하는 것은 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 단백질 서열 또는 단백질 서열들을 조사하는 것을 수반하지 않는다. 각 아미노산 유형의 아미노산 수는 본 발명의 방법을 사용하여 결정될 수 있다. 이것은 단백질의 생물학적으로 관련한 형태(예를 들어 절단된 신호 서열)를 자동으로 검출하고 표지와의 반응에 영향을 미칠 PTM으로 변형되지 않은 아미노산 유형 내의 아미노산에 기반한 참조를 구축한다. 예를 들어, 관심 단백체에 대한 비변형된 세린(S) 아미노산 수는 본 발명의 방법을 사용하여 관심 단백체를 측정함으로써 결정된다. 이 구현예에서, 예를 들어, 관심 단백체 내의 모든 단백질의 글리코실화 패턴은 알 필요는 없는 데, 관심 단백체가 단순히 측정되고 실험적 참조로서 제공되어, 파라미터 방정식 2 또는 파라미터 방정식 4 내의 w1, w2, 또는 wj와 같은, 관심 단백체 내의 비변형된 세린 아미노산 수를 나타낼 수 있기 때문이다. 이 접근법은 광범위한 번역 후 변형을 거친 관심 단백체에 바람직할 수 있고, 또한 관심 단백체 내의 개별 단백질의 비율을 제공하지 않고 관심 단백체 내의 아미노산의 가중치 수를 자동적으로 제공한다(예를 들어, 방정식 10 또는 방정식 11 사용). 일부 구현예에서, 하나 이상의 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물에서 각 아미노산 유형의 아미노산 수는 방법의 일부로서 결정될 수 있다. 예를 들어, 관심 SARS-CoV-2 단백체에 대한 참조를 결정하는 경우, SARS-CoV-2 단백체를 포함하는 단백질에 기반하여 SARS-CoV-2 단백체에 대한 w 1 , w 2 , 또는 w j 값을 계산하는 것에 대한 대안으로서, SARS-CoV-2 단백체는 SARS-CoV-2+ 환자 비강 분비물로부터 SARS-CoV-2 바이러스를 단리하고, 바이러스를 용해시키고, 본원에 개시된 방법을 사용하여 아미노산 유형(예를 들어 W 및 K 아미노산 유형)의 아미노산 농도를 측정하고, 당업계에 알려진 방법을 사용하여 mg/mL의 샘플의 총 몰 농도를 측정하고, 질량 농도를 SARS-CoV-2 단백체 내에 함유된 단백질에 대한 모든 단백질 서열의 조합된 분자량을 계산하는 것에 기반하여 몰 농도로 전환하고, W 및 K 아미노산 유형에 대해 측정된 아미노산 농도를 이 계산된 몰 농도로 나누어, SARS-CoV-2 단백체에 대한 w 1 , w 2 , 또는 w j 값을 제공함으로써 실험적으로 측정되어, 환자 샘플 내에서 관심 SARS-CoV-2 단백체의 존재 및/또는 농도 및/또는 양의 후속 결정을 위해 파라미터 방정식 2 세트를 실험적으로 제공할 수 있다.
대안적인 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 서열 또는 서열들은 방법의 일부로서 결정된다. 일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 서열 또는 서열들은 Edman 단백질 분해 또는 질량 분광법을 사용하여 결정된다. 모든 구현예에서, 샘플을 서열분석할 필요는 없다.
일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 단백질 서열 또는 단백질 서열들이 알려져 있다. 일부 구현예에서, 단백질 서열 또는 단백질 서열들이 알려져 있고 데이터베이스에 제공된다. 일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 서열은 데이터베이스에 제공된다. 바람직하게는, 데이터베이스는 UniProt 데이터베이스, UniProt Proteome 데이터베이스, Swiss Prot 데이터베이스, GenBank, Blast, NCBI Protein 데이터베이스 또는 GenBank Sequence Read Archive(SRA)이다.
일부 구현예에서, 구체적으로 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체, 또는 관심 하위단백체 또는 단백체를 포함하는 단백체의 서열은 데이터베이스에서 보이고 액세스된다. 이 데이터베이스는 모든 알려진 단백질 서열을 나열하는 UniProt 데이터베이스와 같은 큰 데이터베이스의 서브세트이다. 단백질 서열은 UniProt KB 식별자와 같은 식별자, 및 예를 들어 FASTA 형식으로 다운로드된 서열 정보를 사용하여 공개적으로 이용가능한 데이터베이스로부터 검색될 수 있다. 각 서열의 명칭 또는 식별자는 또한 이 더 작은 데이터베이스, 또는 단백질 서열 데이터베이스와 동일한 인덱싱으로 상응하는 데이터베이스에 저장되고 액세스될 수 있다. 이것은 예를 들어, 참조 데이터베이스 내의 10번째 관심 단백질(예를 들어 참조 데이터베이스의 10 행)이 테스트 2를 만족시켰기 때문에, 사용자가 관심 10번째 단백질이 샘플 내에 존재한다는 것을 발견한 경우, 사용자가 각 관심 단백질의 명칭 및/또는 식별자 및/또는 전체 단백질 서열을 함유하는 상응하는 데이터베이스의 10번째 항목(예를 들어 행)을 액세스함으로써 10번째 관심 단백질의 명칭 및/또는 식별자 및/또는 전체 단백질 서열에 편리하게 액세스할 수 있다는 것을 보장한다(본원에 제공된 샘플 표 참조). 일부 구현예에서, 단백질 서열 명칭 및/또는 식별자 및/또는 전체 단백질 서열의 데이터베이스는 임의적인 처리 단계가 예를 들어, 참조 데이터베이스에 반영될 단백질 복합체의 하위단위를 조합하도록(예를 들어 올리도록) 수행된 경우 업데이트된다.
일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 a 1 , a 2 , 및 a j , 또는, w 1 , w 2 ,w j 값은 이전에 결정되었고 데이터베이스에서 액세스될 수 있다. 일부 구현예에서, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물에서 각 아미노산 유형의 아미노산 수, 또는 관심 단백체 또는 하위단백체를 포함하는 단백질의 아미노산 수는 이전에 결정되었고 별도로 액세스될 수 있다. 이는 상기 논의된 상응하는 명칭 및/또는 식별자 및/또는 전체 아미노산 서열 데이터베이스와 동일한 인덱싱으로 데이터베이스에서 보이거나 액세스될 수 있다. 바람직하게는, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물에서 각 아미노산 유형의 아미노산 수가 데이터베이스에서 이용가능하다.
예를 들어, 데이터베이스는 인간 혈장 단백체 내의 모든 단백질에 대한 C, K, 및 W 아미노산 유형의 아미노산 수를 함유한다. 인간 혈장 단백체 내의 단백질은 예를 들어 단백질 아틀라스(Protein Atlas), 펩티드 아틀라스(Peptide Atlas) 또는 Proteome Xchange 데이터베이스를 통해 액세스되며, 이는 공개적으로 이용가능한 단백질 식별 및 정량화 데이터의 레퍼토리를 제공한다(https://www.nature.com/articles/nbt.2839, http://proteomecentral.proteomexchange.org/cgi/Getdataset). UniProt KB 식별자와 같이 제공되고 공개적으로 이용가능한 식별자는 각 식별자에 대한 단백질 서열을 검색하는 데 사용된다. 일단 단백질 서열이 검색되면, 성숙한 단백질에 존재하지 않는 신호 서열은 폐기되고, 단백질 복합체 내의 하위단위에 대한 아미노산 서열은 하나의 항목으로 조합된다. 일부 구현예에서, C, K, 및 W 아미노산 유형의 아미노산 수는 표 4에 제공된 규칙을 적용한 후 처리된 단백질 서열 내의 C, K, 및 W 아미노산 유형의 발생 수를 결정하여 표지와 반응하지 않을 아미노산 유형의 아미노산을 계수하는 것을 피함으로써 계산되는 데, 이들이 표지와 비방응성이 되는 방식으로 번역 후 변형되기 때문이다. 예를 들어, 리신 아미노산이 번역 후 변형되어 글루타민과의 이소펩티드 결합을 형성하고, 또 다른 리신 아미노산이 아세틸화되는 것으로 표시되면, 이 단백질의 단백질 서열 내의 K 아미노산 유형의 총 발생 수에서 2를 뺀다. 바람직하게는, 이 단계는 표 4에 요약된 논리적 규칙에 따라 단백질 서열을 처리하는 컴퓨터 프로그램으로 자동화된다. 아미노산 유형의 아미노산 수에서 1을 빼는 규칙은 변형된 아미노산 유형이 표지화 반응 동안 또는 전에 비변형된 아미노산 유형으로 전환되는 경우(아미노산 유형의 비변형된 + 변형된 아미노산 둘 다를 표지하는 것이 바람직한 경우) 무시될 수 있다. 예를 들어, 변형 및 비변형된 시스테인 아미노산 유형이 둘 다 표지된 경우, TCEP를 사용하여 샘플에 함유된 이황화 결합된 시스테인을 환원시키므로, 이황화 결합된 시스테인에 대한 논리적 규칙은 무시되고 단백질 서열 내의 C 아미노산 유형의 발생 수로부터 어떤 값도 빼지 않는다. 빈번하게, 단백질 서열 내의 비변형 및 변형된 아미노산 둘 다의 발생 수는 단백질 서열 내의 C 아미노산 유형의 모든 발생과 같은 데, 이황화 결합 형성 이외의 시스테인 아미노산에 대한 번역 후 변형이 드물기 때문이다.
또 다른 예로서, 이들 단계를 적용하면 데이터베이스에서 보여질 수 있는 C, K, 및 W 아미노산 유형에 대해 하기 아미노산 수가 생성되었다:
Figure pct00174
이 예에서, 사용자는 샘플에서 C, W 및 K의 아미노산 농도를 측정할 것이다. 참조 데이터베이스를 생성하기 위해, 파라미터 방정식 1이 데이터베이스의 각 행에 순차적으로 적용하여 임의의 단백질 농도, t의 함수로서 각 관심 단백질에 대한 참조를 생성한다:
Figure pct00175
각 관심 단백질, p 1 , p 2 , p 3 , p 4 , 및 p 5 에 대한 참조는 3-차원 공간에서 선이다. 각 관심 단백질에 대한 참조는 3-차원 공간에서 선인 데, 3 개 유형의 아미노산이 샘플에서 표지되고 측정되기 때문이며, C는 아미노산 유형 a 1 이고, 아미노산 유형 K는 아미노산 유형 a 2 이고, 아미노산 유형 W는 아미노산 유형 a 3 이다. 파라미터 방정식 1 세트는 모든 t ≥ 0에 대한 참조를 정의하기 때문에, 모든 참조선은 원점에서 교차한다(그리고 a 1 , a 2 , … a j 의 임의의 값에 0을 곱하면 0과 같다).
다른 구현예에서, 사용자가 C, K, 및 W 아미노산 유형의 표지 값을 측정하는 경우, 각 아미노산 유형에 대한 교정 계수, f n 은 참조 데이터베이스에 혼입된다.
예를 들어, C 아미노산 유형은 아미노산 유형 1이고, 선형 교정 곡선으로부터 결정된 C 아미노산 유형에 대한 교정 계수, f 1 은 다음과 같다:
Figure pct00176
K 아미노산 유형은 아미노산 유형 2이고, 선형 교정 곡선으로부터 결정된 K 아미노산 유형의 교정 계수, f 2 는 다음과 같다:
Figure pct00177
W 아미노산 유형은 아미노산 유형 3이고, 선형 교정 곡선으로부터 결정된 W 아미노산 유형의 교정 계수, f 3 은 다음과 같다:
Figure pct00178
참조 데이터베이스를 생성하기 위해, 파라미터 방정식 3을 데이터베이스의 각 행에 순차적으로 적용하여 단백질 농도, t의 함수로서 각 관심 단백질에 대한 참조를 생성한다:
Figure pct00179
샘플의 측정이 아미노산 유형 1, 아미노산 유형 2, 및 아미노산 유형 n의 측정된 표지(예를 들어 표지의 신호)의 측면에서 제공되는 경우, 관심 단백체 또는 하위단백체에 대한 참조선의 파라미터 방정식은 파라미터 방정식 4에 의해 주어진다:
Figure pct00180
여기서 n i 는 관심 단백체 또는 하위단백체이고, w 1 은 관심 단백체 또는 하위단백체에서 아미노산 유형 1의 아미노산의 가중 평균 수이고, f 1 은 아미노산 유형 1에 대한 교정 계수 또는 교정 함수이고, w 2 는 관심 단백체 또는 하위단백체에서 아미노산 유형 2의 아미노산의 가중 평균 수이고, f 2 는 아미노산 유형 2에 대한 교정 계수 또는 교정 함수이고, w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, f n 은 아미노산 유형 n에 대한 교정 계수 또는 교정 함수이고, tn 차원 각각에서 참조선을 집합적으로 명시하는 n 개의 함수 각각에서 공통 독립적 변수(또는 파라미터)인 관심 단백체 또는 하위단백체의 농도이며, 여기서 t는 0보다 더 크거나 같은 모든 t에 대해 정의된다(
Figure pct00181
.
혼합물
본 발명의 방법을 사용하여 단백질, 단백체, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 또는 하위단백체의 혼합물을 검출하는 경우, 참조는 단일 단백질, 단백체, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 또는 하위단백체에 대해 이 섹션에서 요약된 접근법을 사용하여 제공된다. 비교 단계 섹션에 요약된 바와 같이, 다수의 순수한 단백질, 단백체, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 또는 하위단백체의 존재가 샘플에서 검출되기 때문에 혼합물이 검출되고, 본 발명의 방법을 사용하여 혼합물 내의 각 구성요소의 비율 및 농도를 제공한다.
특별한 경우
일반적인 파라미터 방정식 세트의 형태로 기재된, 이들 구현예의 2 가지 특별한 경우가 있다;
특별한 경우 1에서, 샘플의 몰 농도는 알려져 있고, 이는 상수 SC이다. 따라서, 관심 단백질 n i 가 샘플 내에 존재하는 경우, 샘플의 몰 농도로 존재하므로, t = SC이다.
일반적인 파라미터 방정식 세트는
Figure pct00182
이다.
특별한 경우 1에서, 일반적인 파라미터 방정식 세트는 n 차원 공간에서 점으로 단순화된다:
Figure pct00183
이것은 공통 파라미(독립적 변수)의 함수가 아니기 때문에 더 이상 파라미터 방정식이 아닌 데, 변수 t가 상수 SC로 대체되었기 때문이다. 특별한 경우 1에서, 관심 단백질 p i 에 대한 참조는 다음에 의해 제공된다:
Figure pct00184
이것은 n 차원 공간에서 점을 기재하며, 여기서 n은 샘플에서 표지되고 측정된 아미노산 유형의 수이다.
특별한 경우 1에서, 테스트 1은 다음과 같도록 관심 단백질 p i 가 존재하는 경우 충족된다:
Figure pct00185
여기서 S 1 은 샘플에서 아미노산 유형 1에 대해 측정된 값(아미노산 농도 또는 표지의 신호)이고, S 2 는 샘플에서 아미노산 유형 2에 대해 측정된 값(아미노산 농도 또는 표지의 신호)이고, S n 은 샘플에서 아미노산 유형 n에 대해 측정된 값(아미노산 농도 또는 표지의 신호)이다,
특별한 경우 1에서, 테스트 1이 충족되면, 관심 단백질 p i 는 샘플 내에 존재한다.
특별한 경우 1에서, 샘플 점(S 1 , S 2 , S j )과 관심 단백질에 대한 참조 점(c 1 SC, c 2 SC, c n SC) 사이의 거리가 오차 한계, ε보다 작도록 관심 단백질 p i 가 존재하는 경우 테스트 2가 충족된다.
샘플 점(S 1 , S 2 , S n )과 관심 단백질에 대한 참조 점(c 1 SC, c 2 SC, c n SC) 사이의 거리는 Euclidean 거리와 같은 거리 공식을 사용하여 계산된다. 예를 들어, 거리 D는 다음을 사용하여 계산된다:
Figure pct00186
배타적으로 특별한 경우 1 내에서, 샘플에서 각 표지되고 측정된 아미노산 유형 내의 아미노산 수를 계산하는 것이 가능하다. 이것은 샘플의 각 아미노산 유형의 아미노산 수가 샘플의 해당 아미노산 유형의 아미노산 농도를 샘플의 알려진 몰 농도로 나눈 값과 같이 때문에 가능하다. 샘플에서 아미노산 유형 1의 아미노산 수는 N 1 이고, 샘플에서 아미노산 유형 2의 아미노산 수는 N 2 이고, 샘플에서 아미노산 유형 n의 아미노산 수는 N n 이다. 관심 단백질, 펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 아미노산 유형 1의 아미노산의 수 또는 평균 수는 RN 1 이고, 관심 단백질, 펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 아미노산 유형 2의 아미노산 수는 R N2 이고, 관심 단백질, 펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 아미노산 유형 n의 아미노산 수는 RN n 이다. 일부 구현예에서, 이러한 아미노산 수는 관심 단백질, 펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 단백질 서열 또는 단백질 서열들로부터 계산되며, 성숙한 단백질에서 생물학적으로 절단된 서열의 부분을 제거하고, 알킬화, 아세틸화, 또는 글리실-리실 이소펩티드 형성을 통해 리신 1차 아민을 2차 아민으로 전환하는 것과 같이, 아미노산 R-기의 반응성 부분의 번역 후 변형으로 인해및/또는 방정식 11 또는 방정식 12를 적용하여 관심 단백체 또는 하위단백체에서 아미노산의 가중 평균 수를 결정한다.
샘플에서 각 아미노산 유형의 아미노산 수가 특별한 경우 1 내에서 계산되는 경우, 다음과 같은 경우 테스트 1이 충족된다:
Figure pct00187
테스트 1은 샘플 점이 참조 점과 정확히 같은 경우 충족된다.
샘플에서 각 아미노산 유형의 아미노산 수가 특별한 경우 1 내에서 계산되는 경우, 관심 단백질, 펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 각 아미노산 유형의 아미노산 수가 샘플에서 각 아미노산 유형의 아미노산 수의 오차 한계, ε보다 작거나, 테스트 2가 충족된다. 이것은 샘플 점과 참조 점 사이의 거리, D, 예를 들어 Euclidean 거리를 결정함으로써 평가된다.
식은 다음과 같다:
Figure pct00188
특별한 경우 2에서, 샘플 내에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 하위단백체, 또는 단백체 n i 의 존재는 알려져 있지만, 샘플 내에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 하위단백체, 또는 단백체 n i 의 농도는 알려져 있지 않다. 이전과 같이, 아미노산 유형 1, 아미노산 유형 2, 및 아미노산 유형 n에 대한 값이 S 1 , S 2 , 및 S n 으로서 샘플에 대해 측정되었다.
일반적인 파라미터 방정식은
Figure pct00189
으로 유지된다.
그러나, 관심 단백질 p i 의 존재는 테스트 1을 사용하여 평가되지 않는 데, 샘플에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 하위단백체, 또는 단백체의 존재가 이미 알려져 있기 때문이다. 대신, 알려진 값은 테스트 1을 포함하는 방정식에 입력되고, 방정식은 t에 대해 푼다:
Figure pct00190
샘플 내에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 하위단백체, 또는 단백체 n i 의 존재가 알려져 있기 때문에, c 1 , c 2 , 및 c n 이 알려져 있다. S 1 , S 2 , 및 S n 은 측정되었기 때문에 알려져 있다. 따라서, 이들 값은 t에 대해 간단히 푼 테스트 1을 포함하는 방정식 1에 입력되고, t에 대한 n 값은 평균화되어(즉, 평균) 샘플 내의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 하위단백체, 또는 단백체 p i 의 농도의 측정을 제공한다. n 개의 아미노산 유형 각각을 표지화하는 것은 상이한 유형의 오류를 겪은 직교 화학을 수반하기 때문에, 이러한 직교 접근법을 통해 수득된 농도의 평균화는 농도의 매우 정확한 측정을 제공하며; 기존 접근법은 280 nm에서 흡광도(A 280 )를 측정하는 것과 같이 농도를 결정하는 한 가지 방법만을 사용한다. 이 방식으로 결정된 농도에 샘플의 부피를 곱하여 샘플 내의 관심 단백질 p i 의 양을 제공한다.
일부 구현예에서, 단리 단계가 샘플에 대해 수행된 경우, 동일한 단리 단계가 이론적 참조에 대해 수행되어야 한다. 예로서, 샘플에 대한 단리 단계는 원심분리 분자량 컷오프 필터를 혼입하는 Amicon 50 kDa 원심 필터 장치와 같은, 원심 필터 장치를 통한 여과를 포함할 수 있으며, 여기서 컷오프 필터의 분자량보다 작은 분자량을 갖는 단백질은 필터를 통해 여액으로 통과되고 컷오프 필터보다 더 큰 분자량을 갖는 단백질은 필터를 통과하지 않아 여액에 존재하지 않는다. 이 단계를 사용하여 본원에 개시된 바와 같이 샘플로부터 높은 풍부도의 고분자량 단백질을 고갈시킬 수 있다. 이 단계가 샘플에 대해 수행된 경우, 50 kDa보다 더 큰 분자량을 갖는 단백질이 또한 이론적 참조를 계산하는 데 사용되는 데이터베이스로부터 제거되어야 한다. 이것은 50 kDa보다 더 큰 분자량을 갖는 단백질이 여과 단계 후 존재하지 않는 상황을 모의한다. 여과 단계는 샘플 내에서 평균 단백질 서열의 각 아미노산 유형의 아미노산 수를 감소시킨다. 샘플 내에서 평균 단백질 서열의 분자량이 감소하는 데, 예를 들어 50 kDa보다 더 큰 분자량을 갖는 단백질이 더 이상 샘플에 포함되지 않고, 분자량 및 단백질 길이가 선형적으로 상관관계가 있기 때문이다.
비교
샘플의 각 표지된 아미노산 유형의 측정된 표지, 아미노산 농도, 및/또는 아미노산 수는 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 동일한 아미노산 유형의 알려진 표지 값, 아미노산 농도, 및/또는 수와 비교된다. 바람직하게는, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체, 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 동일한 아미노산 유형의 알려진 표지 값, 아미노산 농도, 및/또는 수는 참조이다. 일부 구현예에서, 샘플의 각 표지된 아미노산 유형의 측정된 표지, 아미노산 농도, 및/또는 아미노산 수가 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 동일한 아미노산 유형의 알려진 표지 값 및/또는 단백질 농도의 함수로서 아미노산 농도, 및/또는 수와 동일하거나, 이에 대한 오차 한계 내에 있는 경우, 샘플에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는 관심 단백질, 펩티드, 폴리펩티드 또는 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 존재 및/또는 농도 및/또는 양의 적극 식별이 이루어진다.
샘플의 각 표지된 아미노산 유형의 측정된 표지, 아미노산 농도, 및/또는 아미노산 수가 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 동일한 아미노산 유형의 알려진 표지 값 및/또는 단백질 농도의 함수로서 아미노산 농도, 및/또는 수에 대한 오차 한계를 벗어나는 경우, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는 관심 단백질, 펩티드, 폴리펩티드 또는 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 존재가 샘플에서 식별되지 않는다. 관심 단백질이 샘플에 존재하지 않는 경우, 샘플에 농도를 갖지 않을 수 있다. 일부 구현예에서, 샘플에서 관심 단백질의 존재가 이미 알려져 있는 경우, 단백질 농도는 단백질 농도(t)에 대한 참조 함수를 품으로써 결정된다. 일부 구현예에서, 관심 단백질의 양은 샘플의 부피에 샘플에서 식별된 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도를 곱하여 식별된다.
참조 섹션에 기재된 바와 같이, 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체는 참조에 의해 고유하게 기재될 수 있다. 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 대한 참조는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 농도, 또는 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 대한 각 아미노산 유형의 아미노산 수의 함수로서 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 대한 값(각 아미노산 유형의 측정된 표지 예를 들어 표지의 신호 및/또는, 각 아미노산 유형의 아미노산 농도)을 제공한다. 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 대한 참조는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 농도의 함수로서 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 대한 값(각 아미노산 유형의 측정된 표지, 예를 들어 표지의 신호, 각 아미노산 유형의 아미노산 농도)을 예측하는 함수의 그룹일 수 있다. 대안적으로, 샘플의 몰 단백질 농도가 알려져 있는 경우, 참조는 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 각 상응하는 아미노산 유형의 아미노산 수, 또는 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 샘플의 농도에서 각 상응하는 아미노산 유형의 아미노산 농도 또는 표지 값이다. 샘플에 대해 측정된 값(각 아미노산 유형의 측정된 표지, 예를 들어 표지의 신호, 각 아미노산 유형의 아미노산 농도, 및/또는 각 아미노산 유형의 아미노산 수)은 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 대한 참조에 의해 제공되는 값과 비교된다. 일부 구현예에서, 샘플에 대해 측정된 값이 참조에 의해 제공되는 값과 동일하거나, 이의 오차 한계 내에 있는 경우, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 존재 및/또는 농도 및/또는 양이 샘플에서 식별된다. 일부 구현예에서, 샘플에 대해 측정된 값이 참조에 의해 제공되는 값과 동일하거나, 이의 오차 한계 내에 있는 경우, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 존재가 샘플에서 식별된다. 일부 구현예에서, 샘플에 대해 측정된 값이 참조에 의해 제공되는 값에 대한 오차 한계를 벗어나는 경우, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 존재가 샘플에서 식별되지 않는다.
일부 구현예에서, 샘플의 2 개 이상의 아미노산 유형 각각의 측정된 표지(예를 들어 아미노산 유형 W 및 K의 형광 강도)는 관심 단백질의 동일한 아미노산 유형의 참조에 의해 제공된 알려진 표지 값(예를 들어 아미노산 유형 W 및 K의 형광 강도)과 비교된다. 샘플의 측정된 표지(예를 들어 아미노산 유형 W 및 K의 형광 강도)가 단백질 농도의 함수로서 관심 단백질에 대한 참조에 의해 제공되는 알려진 표지 값(예를 들어 아미노산 유형 W 및 K의 형광 강도)과 동일하거나, 이에 대한 오차 한계 내에 있는 경우, 샘플에서 해당 관심 단백질의 존재 및/또는 농도 및/또는 양의 적극 식별이 이루어진다. 샘플의 측정된 표지(예를 들어 아미노산 유형 W 및 K의 형광 강도)가 단백질 농도의 함수로서 관심 단백질에 대한 참조에 의해 제공된 알려진 표지 값(예를 들어 아미노산 유형 W 및 K의 형광 강도)과 동일하지 않거나, 이의 오차 한계를 벗어나는 경우, 해당 관심 단백질의 존재는 샘플에 존재하지 않는 것으로 식별된다. 해당 관심 단백질이 샘플에서 식별되지 않았기 때문에, 샘플 내에서 해당 관심 단백질의 농도 또는 양이 없다.
일부 구현예에서, 샘플의 2 개 이상의 아미노산 유형 각각의 아미노산 농도(예를 들어 아미노산 유형 W 및 K의 아미노산 농도)는 단백질 농도의 함수로서 관심 단백질에 대한 참조에 의해 제공된 동일한 아미노산 유형의 아미노산 농도(예를 들어 아미노산 유형 W 및 K의 아미노산 농도)와 비교된다. 샘플의 아미노산 농도(예를 들어 아미노산 유형 W 및 K의 아미노산 농도)가 단백질 농도의 함수로서 관심 단백질에 대한 참조에 의해 제공된 아미노산 농도(예를 들어 아미노산 유형 W 및 K의 아미노산 농도)와 동일하거나, 이에 대한 오차 한계 내에 있는 경우, 샘플에서 해당 관심 단백질의 존재 및/또는 농도 및/또는 양의 적극 식별이 이루어진다. 샘플의 아미노산 농도(예를 들어 아미노산 유형 W 및 K의 형광 강도)가 단백질 농도의 함수로서 관심 단백질의 참조에 의해 제공된 아미노산 농도(예를 들어 아미노산 유형 W 및 K의 형광 강도)와 동일하지 않거나, 이에 대한 오차 한계를 벗어나는 경우, 해당 관심 단백질이 샘플에 존재하지 않는 것으로 식별된다. 해당 관심 단백질이 샘플에서 식별되지 않았기 때문에, 샘플 내에서 해당 관심 단백질의 농도 또는 양이 없다.
일부 구현예에서, 샘플의 2 개 이상의 아미노산 유형 각각의 아미노산 수(예를 들어 아미노산 유형 W 및 K의 단백질 당 아미노산 수)는 관심 단백질의 동일한 아미노산 유형의 참조 아미노산 수(예를 들어 아미노산 유형 W 및 K의 단백질 당 아미노산 수)와 비교된다. 샘플의 각 아미노산 유형의 아미노산 수(예를 들어 아미노산 유형 W 및 K의 단백질 당 아미노산 수)가 관심 단백질의 각 아미노산 유형의 참조 아미노산 수(예를 들어 아미노산 유형 W 및 K의 단백질 당 아미노산 수)와 동일하거나, 이에 대한 오차 한계 내에 있는 경우, 샘플에서 해당 관심 단백질 존재의 적극 식별이 이루어진다. 샘플의 각 아미노산 유형의 아미노산 수(예를 들어 아미노산 유형 W 및 K의 단백질 당 아미노산 수)가 관심 단백질의 참조 아미노산 수(예를 들어 아미노산 유형 W 및 K의 단백질 당 아미노산 수)에 대한 오차 한계를 벗어나는 경우, 해당 관심 단백질은 샘플에 존재하지 않는 것으로 식별된다. 해당 관심 단백질이 샘플에서 식별되지 않았기 때문에, 샘플 내에서 해당 관심 단백질의 농도 또는 양이 없다. 샘플에서 각 아미노산 유형의 아미노산 수를 측정하는 것은 샘플의 몰 단백질 농도가 알려진 경우 배타적으로 이용가능하고 특별한 경우 1에 속하므로, 이 구현예에 특이적인 비교 단계가 논의된다.
참조의 일반적인 형태는 n 차원 공간에서 선이며, 여기서 n은 샘플에서 표지되고 측정된 아미노산 유형의 수이다. 참조는 각 좌표(아미노산 농도, 측정된 표지, 예를 들어 표지의 신호)가 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도, t의 함수로서 달라지는 방식을 명시하는 파라미터 방정식 세트로 기재될 수 있다. 특이적 파라미터 방정식은 참조 섹션에 제공되고 설명되었다. 일반적인 파라미터 방정식은 다음과 같다:
Figure pct00191
여기서 p i 는 관심 단백질, 단백체, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 또는 하위단백체이고, c 1 은 아미노산 유형 1에 대한 계수이고, c 2 는 아미노산 유형 2에 대한 계수이고, c n 은 샘플에서 표지되고 측정된 아미노산 유형 n에 대한 계수이며, 각각은 다음에 따라 제공된다(아미노산 유형 n의 예에 대해 설명될 뿐만 아니라 아미노산 유형 1 및 2에 적용됨):
ㆍ 샘플에 대한 측정이 아미노산 농도로 제공되고 참조선이 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체를 설명하는 경우, c n = a n , 여기서 a n 은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이며, a n 은 0보다 더 크거나 같은 정수임(
Figure pct00192
ㆍ 샘플에 대한 측정이 아미노산 농도로 제공되고 참조선이 관심 단백체 또는 하위단백체를 설명하는 경우, c n = w n , 여기서 w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수임
ㆍ 샘플에 대한 측정이 측정된 표지, 예를 들어 표지의 신호로 제공되고 참조선이 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체를 설명하는 경우. c n = a n f n , 여기서 a n 은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이며, a n 은 0보다 더 크거나 같은 정수이고(
Figure pct00193
, 여기서 f n 은 아미노산 농도와 아미노산 유형 n에 대한 측정된 표지, 예를 들어 표지의 신호 사이를 전환하는 교정 계수 또는 교정 함수임
ㆍ 샘플에 대한 측정이 측정된 표지, 예를 들어 표지의 신호로 제공되고 참조선이 관심 단백체 또는 하위단백체를 설명하는 경우, c n = w n f n , 여기서 w n 은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이며, 여기서 w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, 여기서 f n 은 아미노산 농도와 아미노산 유형 n에 대한 측정된 표지, 예를 들어 표지의 신호 사이를 전환하는 교정 계수 또는 교정 함수임.
여기서 t n 차원 각각에서 참조선을 집합적으로 명시하는 n 개의 함수 각각에서 공통 독립적 변수(또는 파라미터)인 참조를 함유하는 해의 단백질 농도이고, 여기서 t는 0보다 더 크거나 같은 모든 t에 대해 정의된다(
Figure pct00194
참조선은 대안적으로 n 차원 공간에서 벡터로서 기재될 수 있으며, 나중에 가설 테스트 2의 논의 내에서 설명될 것이다.
본 발명의 방법에서 표지되고 측정된 n 개의 아미노산 유형이 있다(n ≥ 2).샘플에 대해 측정된 값은 n 차원 공간에서 항상 점을 제공하는 데, 하나의 값이 n차원 각각에 대해 제공되기 때문이다. 점은 좌표(S 1 , S 2 ,…, S n )이며, 여기서 S 1 은 샘플에서 표지된 아미노산 유형 1에 대해 측정된 값이고, S 2 는 샘플에서 표지된 아미노산 유형 2에 대해 측정된 값이고, S n 은 샘플에서 임의적으로 표지된 아미노산 유형 n에 대해 임의적으로 측정된 값이다. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 대한 참조는 n 차원 공간에서 선일 수 있다.
관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 단백질 농도의 함수로서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 에 대한 참조를 제공하는, 상기 설명된 일반적인 파라미터 방정식은 다음과 같다:
Figure pct00195
파라미터 방정식 1, 2, 3, 또는 4 세트를 사용하여 참조 섹션에 설명된 바와 같이, 본 발명의 특이적 구현예에 대한 각 참조선을 생성한다.
비교 단계 내에서, 샘플 점에 대해 측정된 값은 참조와 비교된다. 일부 구현예에서, 샘플에 대해 측정된 값이 참조선에 의해 제공되는 값과 같은 경우, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 존재 및/또는 농도 및/또는 양이 샘플에서 식별된다. 이것은 샘플 점이 참조선 상에 있음을 의미한다. 샘플 점이 참조선 상에 있다면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체가 샘플에 존재한다는 가설은 참이다. 이 가설을 평가하기 위해, 테스트 1이 수행된다.
일부 구현예에서, 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 대한 참조는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 단백질 농도의 함수로서 샘플에서 표지되고 측정된 각 아미노산 유형에 대해 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 대한 값을 제공하는 함수의 그룹이다. 테스트 1은 샘플에 대해 측정된 값(S 1 , S 2 ,…, S n )을 참조를 포함하는 상응하는 함수와 동일하게 설정한다. 방정식에 대한 단일 해가 존재하면, 샘플 점은 참조선 상에 있고, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체는 샘플에 존재하고, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 단백질 농도는 방정식에 대한 해를 제공한 단일 단백질 농도이고, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 단백질 양은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 단백질 농도에 샘플의 부피를 곱한 값이다.
비교는 비공식적으로 또는 공식적으로 수행될 수 있다. 비공식적으로, 결과를 그래프화하거나 샘플에 대해 측정된 값을 참조 함수와 비교함으로써, 샘플 점이 참조선 상에 있는지 눈으로 확인하는 것이 일반적으로 가능하다. 예를 들어, 아미노산 유형 W 및 K는 샘플에서 표지되고 측정된다. W 아미노산 유형은 아미노산 유형 1이고 K 아미노산 유형은 아미노산 유형 2이다. 관심 단백질 리소자임(LYZ)에 대한 참조는 다음과 같다:
Figure pct00196
60 μM W 및 60 μM K의 아미노산 농도가 샘플에 대해 측정된다. 샘플에 대해 측정된 아미노산 농도를 참조와 비교하는 경우, 샘플 점이 참조선 상에 있고, 참조가 10 uM의 단백질 농도, t를 가지는 것이 분명하다(도 X).
공식적으로, 테스트 1은 샘플에 대해 측정된 각 값(S 1 , S 2 ,…, S n )을 참조에 대해 제공된 상응하는 참조 [c 1 t, c 2 t,…, c n t]와 같게 설정하고, t에 대한 해가 존재하는지 결정하는 것을 수반한다. 테스트 1은 모든 t ≥ 0 에 대해, 다음과 같도록 t의 값이 존재하는 경우 충족된다:
Figure pct00197
여기서 방정식의 수는 샘플에서 표지되고 측정된 아미노산 유형 n의 수와 같다. 테스트 1을 포함하는 n 개의 방정식이 t의 단일 값에 대해 풀 수 있는 경우, 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 는 단백질 농도 t로 샘플 내에 존재하는 데, 샘플 점이 참조선 상에 있기 때문이다.
일부 구현예에서, 이것은 다음과 같은 경우 테스트 1이 충족됨에 따라 공식적으로 언급될 수 있다:
Figure pct00198
이것은 모든 t ≥ 0의 경우, 모든 k = 1,2,…, n에 대해 S k = c k t이도록 t의 값이 존재하는 경우 테스트 1이 충족된다는 것을 말한다.
계속 예를 들면, 샘플에 대해 측정된 각 값은 참조를 포함하는 상응하는 함수와 동일하게 설정되고, t에 대한 단일 해가 존재하는지 여부가 결정된다.
Figure pct00199
모든 k = 1,2,…, n에 대해 S k = c k t이도록 t의 값이 존재하는 경우, t의 이 값은 샘플의 단백질 농도이다. 샘플의 단백질 양은 샘플의 단백질 농도에 샘플의 부피를 곱한 값이다. 본 예에서, LYZ의 단백질 농도는 10 μM이다. 샘플 부피가 100 μL였으므로, LYZ의 단백질 양은 10 μM x 100 μL = 1 nmol이다. LYZ의 존재는 샘플에서 식별되었고, LYZ의 분자량은 14.3 kDa이다. 따라서 샘플에서 LYZ의 질량은
Figure pct00200
이다
일부 구현예에서, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 존재 및/또는 농도 및/또는 양은 또한 샘플에 대해 측정된 값이 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 대한 참조에 의해 제공된 값의 오차 한계, ε 내에 있는 경우 식별될 수 있다. 이것은 실험 측정이 무한한 정확도도 무한한 정밀도도 갖지 않는다는 사실을 반영하므로, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 가 샘플 내에 함유되는 경우 샘플에 대해 측정된 점이 참조선 상에 항상 정확히 놓이지 않을 것이다.
테스트 2는 실험적 오류를 고려하고, 샘플 점이 참조선의 오차 한계, ε 내에 있는지 테스트함으로써 해당 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 가 샘플 내에 존재한다는 가설을 테스트한다. 이것은 샘플 점과 참조선 사이의 최단 거리를 구한 다음, 이 거리가 오차 한계보다 작은지 여부를 결정함으로써 달성된다. 샘플 점과 참조선 사이의 이 최단 거리가 오차 한계보다 작은 경우, 샘플 내에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 의 존재가 식별되고, 샘플 내에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 의 단백질 농도는 최단 거리를 제공하는 참조선 상의 정확한 점(단백질 농도)에 의해 제공된다.
점과 선 사이의 최단 거리는 점과 선 사이의 수직 거리이다. 참조선은, 예를 들어 일반적인 파라미터 방정식에 의해 파라미터적으로 기재된 것 외에도, 또한 벡터 형식으로 기재되어 내적을 통해 이 수직 거리를 산출하는 참조선 상의 정확한 점(단백질 농도)을 계산할 수 있다. 그런 다음, 거리 공식, 예를 들어 Euclidean 거리 공식을 사용하여 샘플 점과 이 수직 거리 점 사이의 거리를 구하고, 거리를 오차 한계, ε와 비교하여, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 가 샘플 내에 존재하는 지 여부를 결정한다. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 가 샘플 내에 존재하는 경우, 샘플 내에서 단백질 농도는 샘플 점이 수직인 참조선 상의 단백질 농도(점)이다.
선과 점 사이의 최단 거리는 항상 선과 점 사이의 수직 거리이다. 이것은 90도가 아닌 점과 선 사이의 임의의 다른 각도가 길이가 수직 거리보다 항상 더 긴 빗변을 형성하기 때문이다.
최단 거리, 즉, 수직 거리는 샘플 점과 참조선 상의 임의의 점 사이의 벡터로 참조선 방향의 내적을 구하고, 내적을 0으로 설정하고, 샘플 점과 참조선 사이의 수직선을 제공하는 참조선의 농도를 품으로써 계산된다. 내적은 2 개의 벡터 A와 B 사이의 각도 관계, 즉,
Figure pct00201
를 나타내는 스칼라 값이며, 여기서 값
Figure pct00202
Figure pct00203
는 각각 벡터 A 및 B의 길이를 나타내고, θ는 2 개 벡터 사이의 각도이다. A 및 B가 수직(즉, 서로에 90도)이면, 내적은 0인 데,
Figure pct00204
가 0이기 때문이다. 샘플 점과 참조선 사이의 이 거리가 계산되고, 이 거리가 오차 한계 보다 작거나 같으면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체는 수직(최소) 거리가 제공된 참조선 상의 단백질 농도로 존재하는 것으로 식별된다.
일부 구현예에서, 다른 거리 미터법, 예를 들어 시티블록(cityblock), 체비셰프(chebychev), 상관관계, 코사인(cosine), 해밍(hamming), 자카드(jaccard), 마할라노비스(mahalanobis), 민코프스키(minkowski), 표준 유클리드(seuclidean), 또는 스피어만(spearman)이 본 발명의 방법에서 사용된다.
테스트 2에 대한 일반적인 접근법은 다음과 같다:
9. R을 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 에 대한 참조선으로 두고, S를 이로부터 최단 거리를 구하기 위한 샘플 점으로 둔다
10. 참조선 R의 방정식을 벡터 형식으로 구한다
11. 참조선 R 상의 점 P의 일반 방정식을 구한다
12. S에서 P로의 벡터가 R에 수직이 되도록 Q라고 하는 참조선 R 상의 점 P의 정확한 위치를 구한다. 이것은 S와 Q 사이의 벡터가 수직을 제공하도록 참조선 R 상의 점 Q를 구하는 것을 의미한다. 이는 R의 방향으로 S에서 P로의 벡터의 내적(ㆍ)을 구하고, 이를 0으로 설정하고, t의 값을 제공하기 위해 t를 품으로써 달성되며, R 상의 점 P에 대한 일반 방정식으로 대체되는 경우, 수직 벡터를 산출한다. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 가 샘플 내에 함유되는 경우, t에 대한 이 해는 그의 단백질 농도이다.
13. 거리 공식을 사용하여 D라고 하는 Q와 S 사이의 거리를 구한다.
14. D가 오차 한계, ε보다 작은지 여부를 평가한다.
15. D > ε이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 는 샘플 내에 존재하지 않는다.
16. D ε이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 는 농도 t로 샘플 내에 존재한다.
테스트 2가 수행되는 방법을 예시하기 위해, 이 접근법은 이 섹션에서 논의된 일반적인 파라미터 방정식에 적용된다.
예를 들어, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 에 대한 참조선(R)의 일반적인 파라미터 형태는 다음과 같다:
Figure pct00205
참조선의 벡터 형태는
Figure pct00206
이다
참조선 상의 점(P)의 일반 방정식은
Figure pct00207
이다
본 발명의 측정된 샘플 점(S)은 좌표를 갖는다:
Figure pct00208
본 발명의 측정된 샘플 점(S)에서 참조선 상의 임의의 점(P)까지의 벡터는 P - S이다:
Figure pct00209
이 벡터가 수직이 되려면, 참조선의 방향 <c 1 ,c 2 ,…,c n >에 따라 이 벡터의 내적(ㆍ)은 0이어야 한다. 따라서, 본 발명자들은 다음을 설정한다:
Figure pct00210
t에 대한 이 해는 샘플과 참조선 사이의 거리가 가장 짧은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 의 단백질 농도이다. 따라서, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 가 샘플 내에 존재하는 경우, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 는 단백질 농도 t로 샘플 내에 존재한다.
관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 가 샘플 내에 존재하는지 여부를 결정하기 위해, 수직 거리를 제공하는 참조선 상의 점, Q를 구한다. Q = P(t).
Figure pct00211
Qt에 대한 해에 상응하는 참조에 대한 값의 세트인 점이다. S도 점이다.
거리 공식을 사용하여 SQ 사이의 거리, D를 구한다.
예를 들어, 점 S와 점 Q 사이의 Euclidean 거리 공식은 다음과 같다:
Figure pct00212
따라서, 본 발명자들은 다음을 갖는다:
Figure pct00213
ε는 예를 들어 사용자에 의해 제공된 오차 한계이다.
D > ε이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 는 샘플 내에 존재하지 않는다. 테스트 2는 음성이다.
Dε이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 는 단백질 농도로 샘플 내에 존재하고:
Figure pct00214
테스트 2는 양성이다. 이전과 같이, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 의 양은 단백질 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 의 농도에 샘플의 부피를 곱하여 계산된다.
LYZ 예로 돌아가서, 아미노산 유형 W 및 K는 샘플에서 표지되고 측정된다. W 아미노산 유형은 아미노산 유형 1이고 K 아미노산 유형은 아미노산 유형 2이다. 샘플에 대해 60 μM W 및 60 μM K의 아미노산 농도를 측정하는 대신, 샘플에 대해 56 μM W 및 62 μM K의 아미노산 농도가 측정된다. 사용자는 실험상의 오류를 설명하기 위해 샘플에 대해 측정된 값의 대략 10%에 상응하는 6 uM의 거리 임계값을 제공받았다. 일부 구현예에서, 오차 한계의 단위(즉, 아미노산 농도, 예를 들어 μM, 또는 표지 값, 예를 들어 A.U., 또는 아미노산 수, 예를 들어 스칼라)는 샘플에 대해 측정된 값과 동일한 단위이다.
관심 단백질 리소자임(LYZ)에 대한 참조는 파라미터 방정식 1 세트에 의해 제공된다:
Figure pct00215
기재된 바와 같이, 아미노산 농도가 샘플에 대해 측정되고 참조가 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체를 기재하는 경우,
Figure pct00216
참조선의 벡터 형태는
Figure pct00217
이다.
관심 단백질 LYZ의 경우, 이것은
Figure pct00218
이 된다.
참조선 상의 점(P)의 일반 방정식은
Figure pct00219
이다.
측정된 샘플 점(S)은 좌표를 갖는다: S = (56, 62)
측정된 샘플 점(S)에서 참조선 상의 임의의 점(P)까지의 벡터는 P - S이다:
Figure pct00220
이 벡터가 수직이 되려면, 참조선의 방향(6,6)에 따라 이 벡터의 내적(ㆍ)이 0이어야 한다. 따라서, 본 발명자들은 다음을 설정한다:
Figure pct00221
t에 대한 이 해는 샘플과 참조선 사이의 거리가 가장 짧은 관심 단백질, LYZ의 단백질 농도이다. 따라서, 관심 단백질 LYZ가 샘플 내에 존재하는 경우, LYZ는 단백질 농도 t로 샘플 내에 존재한다. t의 단위는 샘플의 측정된 아미노산 농도가 제공된 것과 동일한 단위이다. 샘플의 측정된 아미노산 농도가 μM로 제공된 경우, t의 단위는 μM이다. 샘플의 측정된 아미노산 농도가 nM로 제공된 경우, t의 단위는 nM이다. 샘플의 측정된 아미노산 농도가 pM로 제공된 경우, t의 단위는 pM이다. 여기서, 샘플의 측정된 아미노산 농도가 μM로 제공되므로, t의 단위는 μM이다. LYZ가 샘플 내에 존재하는 경우, 9.833 μM의 단백질 농도로 샘플 내에 존재한다.
관심 단백질, LYZ가 샘플 내에 존재하는지 여부를 결정하기 위해, 수직 거리를 제공하는 참조선 상의 점, Q를 구한다, Q = P(t).
Figure pct00222
Qt에 대한 해에 상응하는 참조에 대한 값의 세트인 점이다. S도 점이다.
거리 공식을 사용하여 SQ 사이의 거리, D를 구한다.
예를 들어, 점 S와 점 Q 사이의 Euclidean 거리 공식은 다음과 같다:
Figure pct00223
따라서, 본 발명자들은 다음을 갖는다:
Figure pct00224
사용자는 6의 오차 한계, ε를 지정하였다.
D > ε이면, 관심 단백질 LYZ는 샘플 내에 존재하지 않는다.
Dε이면, 관심 단백질 LYZ는 단백질 농도 t, 9.833 μM로 샘플 내에 존재한다.
Dε. 따라서, LYZ는 9.833 μM의 단백질 농도로 샘플 내에 존재한다
샘플 부피는 100 μL였으므로, LYZ의 단백질 양은 9.833 μM x 100 μL = 0.9833 nmol 이다. LYZ의 존재가 샘플에서 식별되었고, LYZ의 분자량은 14.3 kDa이다. 따라서, 샘플에서 LYZ의 질량은 14.06 ng이다.
바람직한 구현예에서, 오류 임계값의 사용자의 선택은 샘플에서 표지되고 측정된 아미노산 유형의 수, 및 샘플에서 측정된 값에 의해 안내된다. 거리 계산의 합
Figure pct00225
으로 인해, 샘플 점과 선 사이의 총 거리는 차원 수가 증가함에 따라 증가할 것이다. 추가로, 샘플에 대해 측정된 값이 표지의 신호 측면에서 제공되는 경우, 값은 교정 계수 또는 교정 함수에 따라 달라지고 아미노산 농도 값보다 상당히 더 클 수 있다. 알려진 W 농도(μM)에 대한 W 신호(AU)를 제공하는 교정 계수, f w 예는 다음과 같다:
Figure pct00226
따라서, 일부 구현예에서, 거리 계산을 반영하는 샘플 값 제곱의 제곱근을 곱한 사용자 입력 허용오차 값으로부터 오차 한계가 제공된다. 이것은 방정식 10에 의해 제공된다:
Figure pct00227
여기서 ε은 오차 한계이고,
Figure pct00228
는 사용자 입력 허용오차 값이고, S 1 은 아미노산 유형 1에 대한 샘플에 대해 측정된 값이고, S 2 는 아미노산 유형 1에 대한 샘플에 대해 측정된 값이고, S n 은 아미노산 유형 n에 대한 샘플에 대해 측정된 값이다. 일부 구현예에서,
Figure pct00229
는 0.001, 0.002, 0.003, 0.004, 0.005, 0.006, 0.007, 0.008, 0.009, 0.01, 0.02, 0.03, 0.04, 0.05, 0.06, 0.07, 0.08, 0.09, 또는 0.10이다.
대안적인 바람직한 구현예에서, 사용자는 샘플에서 다수의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 존재를 테스트한다. 예를 들어, 참조 섹션에 기재된 바와 같은 다수의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 참조 데이터베이스가 있다. 사용자는 샘플에 존재하는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 수를 의심한다. 샘플에 존재하는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 의심되는 수는 c이다.
예를 들어, 사용자는 하나의 관심 단백질이 샘플에 존재한다고 의심하므로, c = 1이다. 또 다른 예로서, 사용자는 2 개의 관심 단백체가 샘플에 존재한다고 의심하므로, c = 2이다. 이 경우, 사용자는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 각각에 대해 테스트 2를 수행하여, 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체 또는 하위단백체에 대한 각 참조선에 대해 거리, D를 생성한다. 예를 들어, 50 개의 관심 단백질이 있는 경우, 관심 단백질에 대한 50 개의 D 값이 있다 p i=1:50 . 관심 단백질 p i 를 설명하는 각 D 값의 인덱스(index), i가 또한 언급된다. 예를 들어, 이것은 50 x 2 행렬을 생성하며, 첫번째 열은 관심 단백질 p i 에 대한 D 값(D pi )으로 채워지고, 두번째 열은 해당 D 값의 인덱스, i로 채워진다. 그런 다음 행렬은 D 값으로 분류되며, 예를 들어 D 값의 오름차순으로 첫번째 열로 분류된다(행은 온전하게 유지되며, 이는 두번째 열 i 값이 첫번째 열 D pi 값과 함께 이동함을 의미함). c 개의 관심 단백질이 있는 것으로 의심되므로, 오류 임계값은 c번째 가장 큰 값으로 정의된다. 이것은 c 개의 관심 단백질이 테스트 2를 사용하여 샘플 내에 존재하는 것으로 식별되도록 c 개의 관심 단백질에 대해 Dε를 보장하고, c 개 초과의 관심 단백질이 테스트 2를 사용하여 샘플 내에 존재하지 않는 것으로 식별되도록 나머지 관심 단백질에 대해 D > ε를 보장한다.
이 접근법은 β를 참조 데이터베이스에서 모든 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 대해 계산된 D 값의 세트로 두도록 공식적으로 표현될 수 있다. 세트 β에는 α D 값이 있다. c번째 차수 통계(통계)는 세트의 c번째 가장 작은(c번째 최소) 값이다. βc번째 차수 통계는 β c 이다. ε = β c .
따라서, 참조 데이터베이스에서 c 개의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 경우 D ε이므로, c 개의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체가 샘플에서 식별된다.
c > 1인 경우, 또는 하나 초과의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체가 테스트 2 및 오류 임계값, ε를 사용하여 샘플에서 식별되는 경우, 접근법은 이 섹션 후반의 혼합물 하위섹션에서 설명된다.
일부 구현예에서, 테스트 1이 수행된다. 일부 구현예에서, 테스트 2가 수행된다. 일부 구현예에서, 테스트 1 및 테스트 2가 둘 다 수행된다. 일부 구현예에서, 테스트 1이 수행되고, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 의 존재 및/또는 농도 및/또는 양이 테스트 1에 따라 샘플에서 식별되지 않으면, 테스트 2가 수행된다. 테스트 2가 음성이면, D > ε이기 때문에, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 는 샘플 내에 존재하지 않는다. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 가 샘플 내에 존재하지 않으면, 정의에 따라 샘플 내에서 농도 및/또는 양은 0이다.
일부 구현예에서, 샘플의 각 표지된 아미노산 유형의 값(예를 들어 측정된 표지, 아미노산 농도 및/또는 아미노산 수)은 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체에 대해 동일한 2 개 이상의 아미노산 유형의 참조(즉, 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수)와 비교되고, 하나 초과의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체는 샘플 내에 존재하는 것으로 식별되는 데, 하나 초과의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체가 테스트 1 및/또는 테스트 2를 만족시키기 때문이다. 하나 초과의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재가 식별되므로, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 혼합물의 존재가 식별된다. 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 식별된 혼합물의 농도 및/또는 양은 또한 혼합물 섹션에서 기재된 바와 같이 샘플 점과 각 혼합물 구성요소 사이의 수직 거리를 사용하여 식별된다. 이 구현예는 혼합물이 단순한 혼합물, 예를 들어 5 개 이하의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 혼합물인 경우 바람직하다.
대안적인 구현예에서, 샘플의 각 표지된 아미노산 유형의 값(예를 들어 측정된 표지, 아미노산 농도 및/또는 아미노산 수)은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 혼합물에 대해 동일한 2 개 이상의 아미노산 유형의 참조(예를 들어 알려진 표지 값, 아미노산 농도 및/또는 아미노산 수)와 비교되고, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 혼합물은 샘플에 존재하는 것으로 식별되는 데, 참조가 테스트 1 또는 테스트 2를 만족시키기 때문이다. 이 구현예에서, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 혼합물의 단백질 농도, 및 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 혼합물은 테스트 1 또는 테스트 2를 만족시키는 t의 값으로 식별된다. 이러한 2 개의 구현예 사이의 차이는 이 구현예에서, 방정식 11 또는 방정식 12에 의해 제공된 아미노산의 가중 평균 수를 사용하여 혼합물에 대한 아미노산의 가중 평균 수를 생성하고, 파라미터 방정식 2 또는 4 세트 내에서 사용되어 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 혼합물에 대한 참조, 및 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 혼합물을 생성한다는 것이다. 이 구현예는 혼합물이 단순한 혼합물, 예를 들어 5 개 초과의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 혼합물이 아닌 경우 바람직하다.
일부 구현예에서, 샘플의 총 몰 단백질 농도는 알려져 있지 않다. 측정된 A280 값에서 샘플의 몰 단백질 농도로 전환하려면 샘플의 단백질 서열에 의해 결정되는 단백질-특이적 흡광 계수의 지식이 필요하다. 단백질 정체성이 알려져 있지 않기 때문에, 샘플의 단백질 서열은 알려져 있지 않고, 샘플의 흡광 계수는 알려져 있지 않다. 당업계에 알려진 기술을 사용하여 질량에 의해 측정된 샘플의 측정된 단백질 농도에서 샘플의 몰 단백질 농도로 전환하려면 알려져 있지 않은 샘플의 정확한 분자량의 지식이 필요한 데, 샘플의 단백질 서열 및 샘플의 정체성이 알려져 있지 않기 때문이다.
일부 구현예에서, 샘플의 총 몰 단백질 농도가 알려져 있지 않은 경우, 샘플에서 각 표지된 아미노산 유형의 아미노산의 아미노산 농도는 파라미터 방정식 1 세트를 사용하여 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에 대한 동일한(즉, 상응하는) 아미노산 유형의 아미노산 농도에 대해 생성된 참조와 비교된다. 일부 구현예에서, 샘플의 총 몰 단백질 농도가 알려져 있지 않은 경우, 샘플에서 각 표지된 아미노산 유형의 아미노산의 아미노산 농도는 파라미터 방정식 2 세트를 사용하여 하나 또는 관심 단백체 또는 하위단백체에 대한 동일한(즉, 상응하는) 아미노산 유형의 아미노산 농도에 대해 생성된 참조와 비교된다. 이것은 알려지지 않은 단백질 농도의 단백질의 식별, 및 단백질 농도의 동시 결정을 허용한다. 예를 들어, 샘플에서 W 및 K 아미노산 유형의 아미노산 농도는 관심 단백질 n i 에 대한 W 및 K 아미노산 유형의 아미노산 농도에 대해 제공된 참조와 비교된다. 일부 구현예에서, 단백질 농도의 함수로서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드 또는 올리고펩티드, 하위단백체 또는 단백체의 혼합물에 대한 상응하는 아미노산 유형의 아미노산 농도를 제공하는 함수의 그룹이 참조로서 제공된다. 일부 구현예에서, 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도의 함수로서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드 또는 올리고펩티드, 하위단백체 또는 단백체의 혼합물에 대한 상응하는 아미노산 유형의 아미노산 농도를 제공하는 함수의 그룹은 참조로서 제공된다.
하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드 또는 올리고펩티드, 하위단백체 또는 단백체의 혼합물에서 상응하는 아미노산 유형의 아미노산 농도가 측정되었을 수 있거나 파라미터 방정식 1 또는 2 세트를 사용하여 하나 이상의 관심 단백질에 각 아미노산 유형의 아미노산 수를 혼입하는 단백질 농도의 함수로서 제공될 수 있다. 파라미터 방정식 1 또는 2 세트는 이미 참조 섹션에 상세하게 기재되었고, 여기에서 재현된다.
파라미터 방정식 1 세트는 다음과 같다:
Figure pct00230
파라미터 방정식 2 세트는 다음과 같다:
Figure pct00231
샘플에서 각 표지된 아미노산 유형의 농도가 파라미터 방정식 1 또는 2 세트에 의해 단백질 농도의 함수로서 제공된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드 또는 올리고펩티드, 하위단백체 또는 단백체의 혼합물에 대한 동일한 아미노산 유형의 농도와 동일하거나, 이에 대한 오차 한계, ε 내에 있는 경우, 샘플 내에서 이들 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 존재 및/또는 농도 및/또는 양의 식별이 이루어질 수 있다. 테스트 1은 샘플에서 각 표지된 아미노산 유형의 농도가 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드 또는 올리고펩티드, 하위단백체 또는 단백체의 혼합물에 대한 동일한 아미노산 유형의 농도와 동일한지 여부를 평가하고, 테스트 2는 샘플에서 각 표지된 아미노산 유형의 농도가 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드 또는 올리고펩티드, 하위단백체 또는 단백체의 혼합물에 대한 동일한 아미노산 유형의 농도에 대한 오차 한계, ε 내에 있는지 여부를 평가한다. 예를 들어, 샘플에서 W 및 K의 아미노산 농도는 관심 단백질에 대한 단백질 농도의 함수로서 제공된 관심 단백질에서 W 및 K의 아미노산 농도와 비교된다. 샘플에서 W 및 K의 아미노산 농도가 관심 단백질의 단백질 농도의 함수로서 제공된 관심 단백질에서 W 및 K의 아미노산 농도와 동일하거나(테스트 1), 이에 대한 오차 한계 내에 있는 경우(테스트 2), 샘플에서 해당 관심 단백질의 존재는 양성으로 식별되고, 샘플에서 해당 관심 단백질의 농도 및/또는 양은 테스트 1 또는 테스트 2를 만족시킨 관심 단백질의 단백질 농도이다. 샘플에서 W 및 K의 아미노산 농도가 관심 단백질에 대한 단백질 농도의 함수로서 제공된 관심 단백질에서 W 및 K의 아미노산 농도에 대한 오차 한계를 벗어나는 경우, 샘플에서 해당 관심 단백질의 존재는 존재하지 않는다. 관심 단백질이 샘플 내에 존재하지 않기 때문에, 정의에 의해, 샘플 내에서 해당 관심 단백질의 단백질 농도 및/또는 양은 0이다.
일부 구현예에서, 단백체, 또는 하위단백체가 관심 대상인 경우, 샘플의 각 표지된 아미노산 유형의 측정된 표지, 각 표지된 아미노산 유형의 아미노산 농도 및/또는 각 아미노산 유형의 아미노산 수는 관심 단백체 또는 하위단백체의 상응하는 2 개 이상의 아미노산 유형의 알려진 표지 값, 상응하는 2 개 이상의 아미노산 유형의 평균 아미노산 농도, 또는 상응하는 2 개 이상의 아미노산 유형의 평균 아미노산 수를 제공하는 참조와 비교된다.
일부 구현예에서, 샘플의 각 표지된 아미노산 유형의 측정된 표지, 각 표지된 아미노산 유형의 아미노산 농도, 및/또는 각 표지된 아미노산 유형의 아미노산 수는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 단백체, 또는 하위단백체의 혼합물에서 표지값, 상응하는 2 개 이상의 아미노산 유형의 평균 농도, 또는 상응하는 2 개 이상의 아미노산 유형의 평균 아미노산 수를 제공하는 참조와 비교된다. 이 구현예는 본 발명의 방법이 혼합물 내의 구성요소의 상대 비율을 결정하는 데 사용되지 않는 경우 사용된다.
일부 구현예에서, 샘플의 표지된 아미노산 유형의 측정된 표지 도는 아미노산 농도는, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물에 대한 샘플 점과 참조선 사이의 거리를 계산함으로써, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 단백질 농도의 함수로서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 표지 값 또는 아미노산 농도를 제공하는 참조선과 샘플의 표지된 아미노산 유형의 측정된 표지 또는 농도 사이의 거리를 계산함으로써, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물에서 동일한 상응하는 아미노산 유형의 알려진 표지 값 또는 농도를 제공하는 참조선과 비교된다.
일부 구현예에서, 샘플에서 각 표지된 아미노산 유형의 측정된 표지는 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체의 단백질 농도의 함수로서 하나 이상의 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에 대한 동일한(즉, 상응하는) 아미노산 유형의 알려진 표지 값을 제공하는 참조와 비교되며, 참조는 파라미터 방정식 3 세트를 사용하여 생성된다. 파라미터 방정식 3 세트는 참조 섹션에서 상세하게 기재되었고, 여기에서 재현된다:
Figure pct00232
일부 구현예에서, 샘플에서 각 표지된 아미노산 유형의 측정된 표지는 각 관심 단백체 또는 하위단백체의 단백질 농도의 함수로서 하나 이상의 관심 단백체 또는 하위단백체에 대한 동일한(즉, 상응하는) 아미노산 유형의 알려진 표지 값을 제공하는 참조와 비교되며, 참조는 파라미터 방정식 4 세트를 사용하여 생성된다. 파라미터 방정식 4 세트는 이미 참조 섹션에서 상세하게 기재되었고, 여기에서 재현된다:
Figure pct00233
예를 들어, 샘플에서 표지된 아미노산 유형 W 및 K의 형광 강도는 관심 단백질의 단백질 농도의 함수로서 관심 단백질에 대한 W 및 K의 참조 형광 강도와 비교되며, 참조는 파라미터 방정식 3 세트를 사용하여 제공된다.
일부 구현예에서, 샘플에서 각 표지된 아미노산 유형의 측정된 표지가 관심 단백질, 펩티드 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 또는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 혼합물의 단백질 농도의 함수로서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물에 대한 동일한(즉, 상응하는) 아미노산 유형의 알려진 표지 값을 제공하는 참조와 동일하거나, 이에 대한 오차 한계 내에 있는 경우, 샘플 내에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 존재 및/또는 농도 및/또는 양의 식별이 이루어질 수 있다. 샘플의 단백질 농도는 표지 값이 샘플에서 측정된 동일한 아미노산 유형의 표지 값과 동일하거나, 이에 대한 오차 한계 내에 있는 참조의 단백질 농도이다. 예를 들어, 샘플에서 아미노산 유형 W 및 C의 형광 강도는 관심 단백질의 단백질 농도의 함수로서 관심 단백질에 대한 참조에 의해 제공된 아미노산 유형 W 및 C의 형광 강도와 비교된다. 샘플에서 아미노산 유형 W 및 C의 형광 강도가 관심 단백질의 단백질 농도의 함수로서 관심 단백질에 대한 참조에 의해 제공된 아미노산 유형 W 및 C의 형광 강도와 동일하거나, 이에 대한 오차 한계 내에 있는 경우, 샘플에서 해당 관심 단백질의 존재 및/또는 농도 및/또는 양은 양성으로 식별된다. 관심 단백질의 존재가 식별되고, 단백질 농도는 참조 함수를 통해 샘플에서 측정된 아미노산 유형 W 및 C와 동일하거나, 이에 대한 오차 한계 내에 있는 아미노산 유형 W 및 C의 형광 강도가 제공된 관심 단백질의 단백질 농도이다. 샘플에서 아미노산 유형 W 및 C의 형광 강도가 관심 단백질의 단백질 농도의 함수로서 관심 단백질에 대한 참조에 의해 제공된 아미노산 유형 W 및 C의 형광 강도에 대한 오차 한계를 벗어나는 경우, 샘플에서 해당 관심 단백질의 존재 및/또는 농도 및/또는 양은 존재하지 않는다. 관심 단백질의 존재는 샘플에 존재하지 않으므로, 샘플 내에서 해당 관심 단백질의 양 및/또는 농도가 없다.
관심 단백질 또는 단백체에서 각 상응하는 아미노산 유형의 알려진 표지 값(예를 들어 형광 강도)은 이전에 측정되었을 수 있으며, 관심 단백질의 단백질 농도의 함수로서 참조에 의해 제공될 수 있으며 참조는 파라미터 방정식 3 또는 4 세트를 사용하여 생성되거나, 방법의 일부로서 능동적으로 측정될 수 있다.
일부 구현예에서, 샘플에서 각 표지된 아미노산 유형의 농도는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 존재가 식별되는 경우 샘플의 알려지지 않은 총 단백질 농도를 결정하는 데 사용될 수 있으며; 샘플의 단백질 농도는 테스트 1 또는 테스트 2를 만족시킨 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 단백질 농도이다.
일부 구현예에서, 본원에 개시된 본 발명의 방법에 의해 결정된 샘플의 총 단백질 농도는 환자의 샘플 내의 총 바이러스 단백질 농도를 제공한다. 일부 구현예에서, 바이러스 단백체의 정체성은 동시에 결정되었다. 단일 바이러스 입자 당 총 단백질 농도는 일정하므로 환자의 샘플 내의 바이러스 단백체의 총 농도는 환자의 샘플 내의 바이러스의 상대적 바이러스 부하의 척도이다. 바람직하게는, 이것은 μM과 같은 몰 농도 단위로 보고된다. 일반적으로, 바이러스 부하는 샘플 mL 당 바이러스 입자의 수로 기재된다. 본 발명의 방법 내에서 계산된 바이러스 부하는 이론적으로 하나의 바이러스 입자 내의 단백질의 총 몰을 결정함으로써 이러한 단위로 전환될 수 있다. 이것은 몰 총 단백질 농도 측정값을 원하는 경우 샘플 mL 당 바이러스 입자의 표준 척도로 전환하는 데 사용될 수 있다. 그러나, 이것은 단지 본 발명의 방법을 통해 직접 수득된 값을 스칼라로 나누는 것을 수반하기 때문에, 바이러스 부하를 계산하는 두 방법은 환자 관리 및 모델링에 사용될 수 있는 동등한 정량적 정보를 제공한다.
일부 구현예에서, 샘플에 대해 표지된 아미노산 유형의 측정된 표지, 표지된 아미노산 유형의 아미노산 농도, 및/또는 각 표지된 아미노산 유형의 아미노산 수는 n 차원 공간을 사용하여 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체, 단백체의 혼합물의 동일한 아미노산 유형의 알려진 표지 값, 동일한 아미노산 유형의 아미노산 농도, 또는 동일한 아미노산 유형의 아미노산 수와 비교된다. 예를 들어 파라미터 방정식 1, 2, 3, 또는 4 세트로 구축 참조에 의해 제공된 화학 정보는 시각화의 용이성을 위해, 샘플 내에 표지된 n 개의 아미노산 유형 각각에 대한 n 차원 공간으로 투영되며, 여기서 n은 표지된 아미노산 유형의 수이다. 예를 들어, 2 개의 아미노산 유형이 샘플에서 표지되는 경우, 2-차원 공간이 있다. 3 개의 아미노산 유형이 샘플에서 표지되는 경우, 3-차원 공간이 있다. 4 개의 아미노산 유형이 샘플에서 표지되는 경우, 4-차원 공간이 있다. 이는 예를 들어 파라미터 방정식에 의해 제공된 참조 거동의 그래프 표현을 제공하지만, 이 단계는 본 발명의 방법이 수행되는 데 필요하지 않다.
n 차원 공간은 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체, 또는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 혼합물의 단백질 농도의 함수로서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 단백질 복합체, 하위단백체 또는 단백체의 혼합물의 n 개의 아미노산 유형의 알려진 표지 값 또는 아미노산 농도를 함유한다. 대안적으로, 샘플의 단백질 농도가 알려져 있는 경우, n 차원 공간은 샘플의 알려진 단백질 농도로 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 단백질 복합체, 하위단백체 또는 단백체의 혼합물의 표지 값, 아미노산 농도, 또는 아미노산 수를 제공한다. n 차원 공간에서 아미노산 유형은 샘플에서 표지된 동일한 아미노산 유형이다. 예를 들어, 4 개의 아미노산 유형, W, C, Y 및 K가 샘플에서 표지되면, n 차원 공간은 알려져 있는 경우 샘플의 단백질 농도로 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 W, C, Y 및 K의 알려진 표지 값, 아미노산 농도 또는 아미노산 수를 함유하거나, 샘플의 단백질 농도가 알려져 있지 않은 경우 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체, 또는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 혼합물의 단백질 농도의 함수로서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 표지 값 또는 아미노산 농도를 제공한다.
일부 구현예에서, 각 표지된 아미노산 유형의 아미노산 수는 참조를 계산하기 위해 일반 파라미터 방정식, 파라미터 방정식 1, 2, 3 또는 4 세트 내에서 사용되며, 이는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백체, 또는 하위단백체의 단백질 농도의 함수로서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백체, 또는 하위단백체에 대해 샘플에서 표지되고 측정된 각 아미노산 유형의 아미노산 농도 또는 각 아미노산 유형의 표지의 신호를 제공한다. 일반 파라미터 방정식, 파라미터 방정식 1, 2, 3 또는 4 세트 내에서, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백체, 또는 하위단백체의 단백질 농도는 변수 t이다. 이것은 n 차원 공간에서 선을 제공한다. 각 파라미터 방정식은 도메인,
Figure pct00234
을 가지며, 파라미터 방정식이 0보다 더 크거나 같은 단백질 농도의 모든 값에 대해 정의된다는 것을 의미한다. 이것은 0 미만의 단백질 농도가 불가능하기 때문이다. 따라서, 다수의 참조가 다수의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 대해 제공되는 경우, 참조선은 모두 원점에서 교차한다. n 차원 공간의 단일 차원에 따른 단백질 농도에 대한 각 참조선의 기울기는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백체, 또는 하위단백체의 단백질 농도의 함수로서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백체, 또는 하위단백체 내에서 해당 아미노산 유형의 아미노산의 수, 가중 평균 수, 교정 계수 또는 교정 함수를 곱한 수, 또는 교정 계수 또는 교정 함수를 곱한 가중 평균 수이다.
비교 단계는 제공된 특이적 예와 함께 일반적으로 기재되었다. 비교 단계는 이제 샘플에 대해 이용가능한 정보에 기반하여 각 구현예에서 수행되는 방법을 예시하면서 보다 상세하게 기재된다. 비교 단계는 샘플에 대해 이용가능한 정보가 샘플 내에서 2 개 이상의 아미노산 유형의 측정된 표지인 경우, 및 샘플에 대한 정보가 샘플에서 2 개 이상의 아미노산 유형의 농도인 경우 아래에 설명되며, 이는 샘플 내에서 2 개 이상의 아미노산 유형의 측정된 표지로부터 임의적으로 계산되었다. 각 경우는 관심 단백질 및 단백체를 참조하여 기재된다. 그러나, 관심 단백질에 대해 요약된 방법은 또한 관심 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체의 존재 및/또는 농도 및/또는 양의 식별에 적용될 수 있다. 관심 단백체에 대해 요약된 방법은 또한 관심 하위단백체의 존재 및/또는 농도 및/또는 양의 식별에, 또는 혼합물 내의 각 구성요소의 상대 비율이 알려져 있는 경우 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 혼합물에 적용될 수 있다. 이것은 혼합물의 각 구성요소의 상대 비율일 알려져 있지 않은 경우 단백질의 혼합물 또는 단백체를 식별하기 위해 본 발명의 방법을 사용하는 별개의 논의로 이어지고, 이는 방법의 일부로서 결정된다. 혼합물에서 각 구성요소의 상대 비율이 알려져 있지 않은 경우 단백질의 혼합물 또는 단백체에 대해 요약된 방법은 또한 관심 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 또는 하위단백체의 혼합물의 존재 및/또는 농도 및/또는 양의 식별에 적용가능하다. 마지막으로, 샘플에 대해 이미 알려진 일부 정보가 있는 2 가지 특별한 경우가 기재된다. 특별한 경우 1에서, 샘플의 몰 단백질 농도가 알려져 있으므로, 샘플의 2 개의 표지된 아미노산 유형 각각의 아미노산 수를 계산할 수 있다. 특별한 경우 2에서, 샘플 내에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체, 또는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 혼합물의 존재는 알려져 있고, 본 발명의 방법은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체, 또는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 혼합물의 농도 및/또는 양을 정확하게 결정하는 데 사용된다.
2 개 이상의 아미노산 유형, 관심 단백질의 표지의 신호
2 개 이상의 아미노산 유형의 표지(예를 들어 표지의 신호)가 샘플에서 측정되고, 이를 샘플의 2 개 이상의 아미노산 유형의 아미노산 농도로 전환하지 않은 경우, 파라미터 방정식 3 세트는 관심 단백질에 대한 참조를 제공하는 경우 사용된다. 파라미터 방정식 3 세트는 참조 섹션에서 완전히 설명되어 있으며, 여기에서 재현된다:
Figure pct00235
이 방정식에서, 교정 계수 또는 교정 함수(f 1 , f 2 , 및 f n )는 각 아미노산 유형에 대한 함수(a 1 f 1 t, a 2 f 2 t, 및 a n f n t) 내에서 사용된다.
일부 구현예에서, 참조 섹션에 기재된 각 아미노산 유형에 대한 아미노산 농도와 표지의 신호 사이를 전환하는 교정 함수, f가 선형이 아니거나, 특정 농도 범위, 예를 들어 높거나 낮은 아미노산 농도에 걸쳐 선형이 아닌 경우, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물 각각은 참조선이 아닌 표지 신호의 참조 곡선이다. 이 구현예에서, 샘플의 표지된 아미노산 유형의 측정된 표지는 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물에 대한 샘플 점과 참조 곡선 사이의 거리를 계산함으로써, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 단백질 농도의 함수로서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물에 대한 동일한 상응하는 아미노산 유형의 표지 값을 제공하는 참조 곡선과 샘플의 표지된 아미노산 유형의 측정된 표지 사이의 거리를 계산함으로써, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물에서 동일한 상응하는 아미노산 유형의 표지 값을 제공하는 참조 곡선과 비교된다. 샘플에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 존재는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 대한 참조 곡선 상의 샘플 점에서 식별된다. 이것은 각 아미노산 유형에 대한 참조 곡선을 포함하는 함수를 샘플에서 표지되고 측정된 각 아미노산 유형에 대한 표지의 상응하는 신호와 동일하게 설정하고 테스트 1에서와 같이 t에 대해 품으로써 평가된다. t에 대한 단일 해가 존재하는 경우, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 존재가 샘플에서 식별되고, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체의 단백질 농도가 방정식을 푸는 t에 대한 단일 해이다. 대안적으로, 샘플 점과 참조 곡선 사이의 최소 거리가 결정되고(예를 들어, 10.1109/TPCG.2003.1206938에 기재된 바와 같음), 테스트 2는 이 최소 거리가 오류 임계값, ε보다 작은지 여부를 평가한다. 샘플 점과 참조 곡선 사이의 최소 거리가 오류 임계값보다 작은 경우, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체는 최소 거리가 제공된 참조 곡선 상의 점의 단백질 농도로 샘플 내에 존재한다.
바람직하게는, 각 아미노산 유형에 대한 아미노산 농도와 표지의 신호 사이를 전환하는 교정 곡선은 선형이다. 이 경우, 교정 계수 f n 은 아미노산 유형 n에 대한 교정 곡선의 기울기이다. 예를 들어, C 아미노산 유형에 대한 교정 계수, f c
Figure pct00236
이고, 이는 μM 의 C 아미노산 유형의 아미노산 농도를 곱하여 AU의 C 아미노산 유형의 표지의 신호를 제공한다.
K 아미노산 유형에 대한 교정 계수, f k
Figure pct00237
이고, 이는 μM 의 K 아미노산 유형의 아미노산 농도를 곱하여 AU의 C 아미노산 유형의 표지의 신호를 제공한다.
W 아미노산 유형에 대한 교정 계수, f w
Figure pct00238
이고, 이는 μM의 W 아미노산 유형의 아미노산 농도를 곱하여 AU의 W 아미노산 유형의 표지의 신호를 제공한다.
일부 구현예에서, 교정 곡선은 실험을 위해 선택된 파라미터, 및 아미노산 농도가 보고되는 농도 단위에 따라 달라진다. 예를 들어, C 아미노산 유형에 대해 제공된 교정 곡선에 기반하여 다음과 같았다:
Figure pct00239
교정 계수는 교정 곡선의 기울기,
Figure pct00240
이다.
C 아미노산 유형의 아미노산 농도가 대신 nM로 보고된 경우, C 아미노산 유형에 대한 교정 곡선은 다음과 같을 것이며:
Figure pct00241
교정 곡선의 기울기인 교정 계수, f c
Figure pct00242
가 될 것이다.
바람직하게는, 각 아미노산 유형의 교정 곡선 또는 교정 계수는 동일한 단위로 제공된다(예를 들어 실험에서 표지되고 측정된 모든 아미노산 유형은 μM 단위의 교정 계수를 갖거나, 실험에서 표지되고 측정된 모든 아미노산 유형은 nM 단위의 교정 계수를 가짐). 각 아미노산 유형에 대한 교정 계수는 참조 섹션에 기재된 바와 같이, 각 관심 단백질에 대한 참조를 생성하는 데 사용된다. 예를 들어, C, K, 및 W 아미노산 유형이 샘플에서 표지된다. C 아미노산 유형(아미노산 유형 1)의 경우, 측정된 표지 값은 690이다. K 아미노산 유형(아미노산 유형 2)의 경우, 측정된 표지 값은 3938이다. W 아미노산 유형의 경우, 측정된 표지 값은 242이다. 파라미터 방정식 3 세트를 사용하여 루미칸에 대한 참조가 생성되었다. 참조는 다음과 같다:
Figure pct00243
샘플에서 관심 단백질의 존재 및/또는 농도 및/또는 양을 식별하기 위해, 샘플에 대해 이용가능한 값이 2 개 이상의 아미노산 유형의 표지 값인 경우, 테스트 1 및/또는 테스트 2를 수행한다.
테스트 1은 샘플에 대해 측정된 각 값(v 1 , v 2 , v n )을 참조에 대해 제공된 상응하는 함수 [a 1 f 1 t, a 2 f 2 t,…, a n f n t]와 동일하게 설정하고, t에 대한 해가 존재하는지 여부를 결정하는 것을 수반한다. 모든 t ≥ 0인 경우, 다음과 같도록 t에 대한 값이 존재하는 경우 테스트 1이 충족된다:
Figure pct00244
여기서 방정식의 수는 샘플에서 표지되고 측정된 아미노산 유형 n의 수와 같다. 테스트 1을 포함하는 n 개의 방정식이 t의 단일 값에 대해 풀 수 있는 경우, 관심 단백질 p i 가 단백질 농도 t로 샘플 내에 존재하는 데, 샘플 점이 참조선 상에 있기 때문이다. 여기서 본 발명자들은 다음을 갖는다:
Figure pct00245
테스트 1은 실패하였기 때문에, 샘플 점은 참조선 상에 없다.
테스트 2에 대한 접근법은 다음과 같다:
1. R을 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 에 대한 참조선으로 두고, S를 이로부터 최단 거리를 구하기 위한 샘플 점으로 둔다. S는 좌표(V1, V2, …, Vn)를 갖는다.
2. 벡터 형식으로 참조선 R의 방정식을 구한다. 이것은
Figure pct00246
이다.
3. 참조선 R 상의 점 P의 일반 방정식을 구한다. 이것은
Figure pct00247
이다
4. S에서 P로의 벡터는
Figure pct00248
이다. S에서 P로의 벡터가 R에 수직이 되도록 Q라고 하는 참조선 R 상의 점 P의 정확한 위치를 구한다. 이것은 S와 Q 사이의 벡터가 수직을 제공하도록 참조선 R 상의 점 Q를 구하는 것을 의미한다. 이는 R의 방향 <a 1 f 1 , a 2 f 2 , …, a n f n >으로 S에서 P로의 벡터 <a 1 f 1 t - V 1 , a 2 f 2 t - V 2 , …, a n f n t - V n >의 내적(ㆍ)을 구하고, 이를 0으로 설정하고, t의 값을 제공하기 위해 t를 품으로써 달성되며, R 상의 점 P에 대한 일반 방정식으로 대체되는 경우, 수직 벡터를 산출한다. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 가 샘플 내에 함유되면, t에 대한 이 해는 단백질 농도이다
5. 거리 공식을 사용하여 D라고 하는 Q와 S 사이의 거리를 구한다.
6. D가 오차 한계, ε보다 작은지 여부를 평가한다.
7. D > ε이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 는 샘플 내에 존재하지 않는다.
8. Dε이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 p i 는 단백질 농도 t로 샘플 내에 존재한다.
참조선의 벡터 형태는
Figure pct00249
이다.
관심 단백질 루미칸의 경우, 이는
Figure pct00250
이 된다.
참조선 상의 점(P)의 일반 방정식은
Figure pct00251
이다.
본 발명의 측정된 샘플 점(S)은 (690,3938,242)인 좌표 (V 1 , V 2 , V 3 )를 갖는다. 본 발명의 측정된 샘플 점(S)에서 참조선 상의 임의의 점(P)까지의 벡터는 P - S이다:
Figure pct00252
이 벡터가 수직이 되려면, 참조선의 방향 <300,1875,100>에 따라 이 벡터의 내적(ㆍ)은 0이어야 한다. 따라서, 본 발명자들은 다음을 설정한다:
Figure pct00253
t에 대한 이 해는 샘플과 참조선 사이의 거리가 가장 짧은 관심 단백질, 루미칸의 단백질 농도이다. 따라서, 관심 단백질 루미칸이 샘플 내에 존재하는 경우, LYZ가 단백질 농도 t로 샘플 내에 존재한다. t의 단위는 교정 계수에 사용된 동일한 단위이다. 교정 계수가 μM의 단위를 갖는 경우, t의 단위는 μM이다. 교정 계수가 nM의 단위를 갖는 경우, t의 단위는 nM이다. 교정 계수가 pM의 단위를 갖는 경우, t의 단위는 pM이다. 여기서, 교정 계수가 μM의 단위를 가지므로, t의 단위는 μM이다. 루미칸이 샘플 내에 존재하는 경우, 2.106 μM의 단백질 농도로 샘플 내에 존재한다.
관심 단백질, 루미칸이 샘플 내에 존재하는지 여부를 결정하기 위해, 수직 거리를 제공하는 참조선 상의 점, Q를 구한다. Q = P(t).
Figure pct00254
Qt에 대한 해에 상응하는 참조에 대한 값의 세트인 점이다. S도 점이다. 본 발명자들은 거리 공식을 사용하여 S Q 사이의 거리, D를 구한다.
예를 들어, 점 S와 점 Q 사이의 Euclidean 거리 공식은 다음과 같다:
Figure pct00255
따라서, 본 발명자들은 다음을 갖는다:
Figure pct00256
방정식 10에 의해 제공되는 오류 임계값은 다음과 같다:
Figure pct00257
2 개 이상의 아미노산 유형의 표지 값이 샘플에 대해 측정된 경우, S 1 = V 1 , S2 = V 2 , 및 S n = V n 이고 방정식 10은
Figure pct00258
이 된다.
사용자는 0.05의 허용오차 값,
Figure pct00259
을 지정한다.
따라서,
Figure pct00260
이다.
D > ε이면, 관심 단백질 루미칸은 샘플 내에 존재하지 않는다.
Dε이면, 관심 단백질 루미칸은 2.106 μM의 단백질 농도 t로 샘플 내에 존재한다.
66.997 ≤ 200.27이기 때문에 Dε이다. 따라서, 루미칸은 2.106 μM의 단백질 농도로 샘플 내에 존재한다.
샘플 부피는 100 μL였으므로, 루미칸의 단백질 양은 2.106 μM x 100 μL = 2.106 nmol이다. 루미칸의 존재는 샘플에서 식별되었고, 루미칸의 분자량은 36.66 kDa이다. 따라서, 샘플에서 루미칸의 질량은 77.21 ng이다.
2 개 이상의 아미노산 유형, 관심 단백체의 신호
관심 단백질에 대해 요약된 동일한 접근법이 관심 단백체에 적용된다. 차이는 관심 단백체에 대한 참조가 파라미터 방정식 3 세트가 아닌 참조 섹션에서 정의된 파라미터 방정식 4 세트를 사용하여 제공된다는 점이다. 파라미터 방정식 4 세트는 다음과 같다:
Figure pct00261
여기서 관심 단백체에서 각 아미노산 유형의 아미노산의 가중치 수는 방정식 11 또는 방정식 12를 사용하여 참조 섹션에서 설명된 바와 같이 정의된다. 상기 설명된 바와 같이, 샘플이 테스트 1 또는 테스트 2는 관심 단백체를 함유하는지 여부를 결정하는 데 사용되고, 관심 단백체의 존재가 샘플에서 식별되는 경우, 샘플 내에서 관심 단백체의 단백질 농도를 동시에 결정한다.
예를 들어, SARS-CoV-2 단백체에 대한 참조는 다음과 같이 파라미터 방정식 4 세트 내에서 W 및 K 아미노산 유형에 대한 기재된 교정 계수를 사용하여 제공되었다:
Figure pct00262
여기서 W 아미노산 유형은 아미노산 유형 1이고 K 아미노산 유형은 아미노산 유형 2이다. 동일한 아미노산 유형 및 교정 함수를 갖는 파라미터 방정식 4 세트를 사용하여, HIV 단백체에 대한 참조가 또한 제공되었다:
Figure pct00263
혈액 샘플을 취하고 바이러스 분획을 단리한다. 각각 W 및 K 아미노산 유형에 대해 측정된 표지의 신호는 327 AU 및 837 AU이며, n-차원 공간에서 점(327, 837)을 제공한다.
본원에 기재된 방법을 사용하여, 테스트 2를 수행한다. 관심 SARS-CoV-2 단백체의 경우 본 발명자들은 다음을 갖는다:
Figure pct00264
관심 HIV 단백체의 경우 본 발명자들은 다음을 갖는다:
Figure pct00265
거리 임계값을
Figure pct00266
로 설정하였다.
두 관심 단백체에 대해, D > ε이기 때문에, 두 관심 단백체는 환자의 샘플 내에 존재하지 않는 것으로 식별된다(각 관심 단백체의 부재는 환자의 샘플 내에서 식별됨).
또 다른 예로서, IL-6, IL1RN, 및 IL1RA가 MERS에 대해 관찰된 바와 같이, SARS-CoV-2 감염 후에 상승된 상태로 유지함이 보고되었다. 예를 들어 IL-6, IL1RN, 및 IL1RA를 포함하거나 SARS-CoV-2 감염 후 환자에 대한 비강 분비물 또는 혈장에 기반하여 실험적으로 결정된 관심 하위단백체는 샘플에서 표지되고 측정된 W 및 K 아미노산 유형의 형광 강도를 사용하여 식별되고 정량화될 수 있다. 이전에 SARS-CoV-2에 감염되지 않은 대조군에 비해 이 관심 하위단백체의 존재, 또는 상승은 항체 검사의 대안으로 이전 SARS-CoV-2 감염의 하위단백체 서명을 식별할 수 있다.
2 개 이상의 아미노산 유형, 관심 단백질의 아미노산 농도
이미 기재된 바와 같이, 2 개 이상의 아미노산 유형의 아미노산 농도는 각 아미노산 유형에 대한 교정 곡선의 역수를 사용하여 2 개 이상의 아미노산 유형의 표지 값으로부터 계산되었다. 예를 들어, C, K, 및 W 아미노산 유형의 아미노산 농도는 하기 역 교정 곡선을 사용하여 계산하였다:
Figure pct00267
하기 역 교정 계수를 기울기로 제공하였다:
Figure pct00268
관심 단백질 p i 에 대한 참조는 참조 섹션에 기재된 바와 같이, 파라미터 방정식 1 세트,
Figure pct00269
로 제공되었다. 테스트 1은 샘플에 대해 측정된 각 값(AAC 1 , AAC 2 , AAC n )을 참조에 대해 제공된 상응하는 함수 [a 1 t,a 2 t,…a n t]와 동일하게 설정하고, t에 대한 해가 존재하는지 여부를 결정하는 것을 수반한다. 모든 t ≥ 0에 대해, 다음과 같도록 t의 값이 존재하는 경우, 테스트 1이 충족된다:
Figure pct00270
테스트 2에 대한 접근법은 다음과 같다:
1. R을 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 에 대한 참조선으로 두고, S를 이로부터 최단 거리를 구하기 위한 샘플 점으로 둔다. S는 좌표(AAC1, AAC2 … AAC n )를 갖는다.
2. 벡터 형식으로 참조선 R을 구한다. 이것은
Figure pct00271
이다.
3. 참조선 R 상의 점 P의 일반 방정식을 구한다. 이것은
Figure pct00272
이다
4. S에서 P로의 벡터는
Figure pct00273
이다. S에서 P로의 벡터가 R에 수직이 되도록 Q라고 하는 참조선 R 상의 점 P의 정확한 위치를 구한다. 이것은 S와 Q 사이의 벡터가 수직을 제공하도록 참조선 R 상의 점 Q를 구하는 것을 의미한다. 이는 R의 방향 <a 1 ,a 2 ,…, a n >으로 S에서 P로의 벡터 <a 1 t - AAC 1 , a 2 t - AAC 2 , …, a n t - AAC n >의 내적(ㆍ)을 구하고, 이를 0으로 설정하고, t의 값을 제공하기 위해 t를 품으로써 달성되며, R 상의 점 P에 대한 일반 방정식으로 대체되는 경우, 수직 벡터를 산출한다. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 가 샘플 내에 함유되면, t에 대한 이 해는 단백질 농도이다.
5. 거리 공식을 사용하여 D라고 하는 Q와 S 사이의 거리를 구한다.
6. D가 오차 한계, ε보다 작은지 여부를 평가한다.
7. D > ε이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 는 샘플 내에 존재하지 않는다.
8. Dε이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 는 단백질 농도 t로 샘플 내에 존재한다.
아미노산 유형 C, K, 및 W는 샘플에서 표지된다. TCEP는 C 표지화 단계 동안 첨가되므로, 모든(비변형된 + 변형된) C 아미노산이 샘플에서 표지된다. K 아미노산 유형의 비변형된 아미노산(표 4에 나열된 임의의 PTM을 거치지 않은 K 아미노산 유형의 아미노산)이 샘플에서 표지된다. 모든(비변형된 + 변형된) W 아미노산이 샘플에서 표지된다. 37.4 μM C, 37.4 μM K, 및 22.0 μM W의 아미노산 농도가 샘플에서 측정된다. AAC 1 = 37.4 μM, AAC 2 = 43.2 μM, 및 AAC 3 = 22.0 μM.
참조 데이터베이스는 참조 섹션에 기재된 바와 같이 이미 구축되었고, 참조 데이터베이스가 C 아미노산 유형의 모든(비변형된 + 변형된) 아미노산, K 아미노산 유형의 비변형된(표 4에 나열된 임의의 PTM을 거치지 않은 K 아미노산 유형의 아미노산), 및 W 아미노산 유형의 모든(비변형된 + 변형된) 아미노산을 표지화하는 것을 반영하도록 표 4에 기재된 규칙을 사용한다. 결과는 다음과 같다:
Figure pct00274
S = (37.4, 43.2, 22)
테스트 1은 이미 기재되었고 이 예에서 적용되지 않는다.
테스트 2를 적용하면, S = (37.4, 43.2, 22)
p 1 , 아파민의 경우, 본 발명자들은 다음을 갖는다:
Figure pct00275
Figure pct00276
R의 방향은 <34, 49, 0>이다.
Figure pct00277
p 2 , 탈린-1에 대해 기재된 접근법을 적용하면, 본 발명자들을 다음을 갖는다:
Figure pct00278
p 3 , L-셀렉틴의 경우, 본 발명자들은 다음을 갖는다:
Figure pct00279
p 4 , C-반응성 단백질의 경우,
Figure pct00280
p 5 , 루미칸의 경우,
Figure pct00281
사용자는 허용오차 값을 정의하지 않았지만, 대신 1 개의 관심 단백질이 샘플 내에 존재한다고 의심하며, c = 1로 설정한다. 오차 한계는 βc번째 차수 통계로 정의된다, ε = β c .
β는 모든 관심 단백질, p 1-5 에 대해 계산된 D 값의 세트다.
Figure pct00282
β의 첫번째 차수 통계,β 1 = 3.030.
따라서, 관심 단백질, n 3 의 경우 D ε, 여기서 D = β 1 . p 3 은 L-셀렉틴이다. L-셀렉틴의 단백질 농도는 t에 대해 식별된 해이다, t = 3.030 μM.
관심 단백질 p i 에 대한 참조는 참조 섹션에 기재된 바와 같이 파라미터 방정식 1 세트에 의해 제공되었다,
Figure pct00283
. 0보다 더 크거나 같은 단백질 농도의 모든 값(
Figure pct00284
)에 대한 참조를 정의하기 보다, 샘플을 생물학적으로 관련한 농도 범위 내에서만 관심 단백질과 비교하는 것이 바람직한 경우, 참조는 대안적으로 단백질 농도의 특이적 값으로 제공될 수 있다. 예를 들어, 혈장 내에서 단백질의 단백질 농도는 10 자릿수 이상 달라진다. 참조는 관심 단백질 p i 가 혈장에서 발견되는 것 이상의 단백질 농도, t의 값에 대해 배타적으로 정의될 수 있다. 예를 들어, 인간 혈장에서 단백질-S의 단백질 농도는 3.4 mg/L인 것으로 결정되었다. 단백질-S의 분자량은 70645 g/mol이고, 혈장에서 단백질-S의 몰 단백질 농도는 48.3 nM이다. 단백질-S가 혈장에서 식별된 경우, 대략 48.3 nM, 예를 들어 10 nM 내지 70 nM의 몰 단백질 농도를 가져야 한다. 생물학적으로 관련된 농도 범위 내에서 배타적으로 단백질-S와의 비교를 달성하기 위해, 단백질-S의 C 및 W(비변형된 + 변형된) 아미노산 유형에 대한 참조는 다음과 같이 제공될 수 있다:
Figure pct00285
여기서 C 아미노산 유형(비변형된+변형된)은 아미노산 유형 1이고 W 아미노산 유형(비변형된+변형된)은 아미노산 유형 2이고, t의 값에 대한 제약 조건은 μM로 제공된다. 이 제약 조건은 비교 단계에 영향을 미친다. 비교 단계 동안, 관심 단백질의 단백질 농도가 식별된다. 제약 조건이 참조에 대해 적용되는 경우, 테스트 1 및/또는 테스트 2는 정상으로 수행되지만, 추가적인 단계가 수행된다. 관심 단백질에 대한 아미노산 농도가 샘플에 대해 측정된 아미노산 농도에 대한 오차 한계와 같거나(테스트 1) 오차 한계보다 작거나 같도록(테스트 2) 단백질 농도, t에 대한 해를 구한 경우, 테스트 3이 수행된다. 테스트 3에서, 단백질 농도에 대해 식별된 해는 단백질 농도 값의 제공된 범위와 비교된다. 단백질 농도 해가 참조에 대해 제공된 단백질 농도 값의 범위 내에 있다면, 관심 단백질의 존재는 이러한 해를 제공한 단백질 농도로 샘플에서 식별된다. 그러나, 단백질 농도 해가 참조에 대해 제공된 단백질 농도 값의 범위를 벗어나면, 관심 단백질의 존재는 샘플 내에서 식별되지 않는다. 대안적으로, 제공된 농도 범위에 대한 계산된 단백질 농도의 이 확인은 테스트 2에 혼입될 수 있다.
일부 구현예에서, 제약 조건이 적용되는 경우, 파라미터 방정식 1 세트는 다음과 같이 된다:
Figure pct00286
여기서 파라미터 방정식 1 세트는 공개적으로 이용가능한 실험적 데이터를 사용하여 제공될 수 있는, 세트
Figure pct00287
tω 내에 함유된 모든 t에 대해 정의되며,
Figure pct00288
는 단백질 농도 t에 대한 하한이고 ω는 단백질 농도 t에 대한 상한이다.
테스트 3에서,
Figure pct00289
≤테스트 1 또는 테스트 2를 사용하여 식별된 t에 대한 해≤ω이면, 관심 단백질 n i 는 단백질 농도 t로 샘플 내에 존재한다. 이 접근법은 아미노산 농도 및 관심 단백질의 측면에서 논의되고 있지만, 이 접근법은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체, 뿐만 아니라 2 개 이상의 아미노산 유형의 표지 값 또는 2 개 이상의 아미노산 유형의 아미노산 농도에 제공된 샘플에 대해 측정된 값을 포함하는 본 발명의 모든 구현예에 적용가능하다.
2 개 이상의 아미노산 유형, 관심 단백체의 아미노산 농도
동일한 접근법이 샘플에서 2 개 이상의 아미노산 유형의 아미노산 농도에 기반하여 샘플 내에서 관심 단백체의 검출에 적용된다. 파라미터 방정식 2 세트는 참조 섹션에 정의되었고 관심 단백체 또는 하위단백체에 대한 2 개 이상의 아미노산 유형의 아미노산 농도를 제공한다:
Figure pct00290
본원에 기재된 테스트(테스트 2 또는 테스트 1)는 샘플 내에서 관심 단백체 p i 의 존재 및/또는 농도 및/또는 양을 결정하기 위해 관심 단백체 p i 로부터 참조 함수의 그룹에 의해 제공된 값에 대해 수행된다.
예를 들어, HIV 단백체에 대한 참조는 또한 W(아미노산 유형 1) 및 K(아미노산 유형 2) 아미노산 유형에 대해 제공되었다:
Figure pct00291
혈액 샘플을 취하고 바이러스 분획을 단리한다. 각각 W 및 K 아미노산 유형에 대해 측정된 표지의 신호는 8.7 uM 및 19.5 uM이며, n-차원 공간에서 점을 제공한다(8.7, 19.5).
본원에 기재된 방법을 사용하여, 테스트 2를 수행한다. 본 발명자들은 다음을 갖는다:
Figure pct00292
거리 임계값은
Figure pct00293
로 설정되었다.
D ≤ ε이기 때문에, 관심 HIV 단백체가 1.134 μM의 t에 대한 해로 샘플에 존재하는 것으로 식별된다.
특별한 경우 1
특별한 경우 1에서, 샘플의 총 몰 단백질 농도는 알려져 있으므로, 샘플에 대한 2 개 이상의 아미노산 유형의 t의 아미노산 수를 계산하고, 참조로서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 2 개 이상의 아미노산 유형의 수를 제공하는 것이 가능하다. 대안적으로, 동일한 2 개 이상의 아미노산 유형의 아미노산 농도 또는 표지 값은 샘플의 단백질 농도로 제공될 수 있다. 각 관심 단백질에 대한 샘플 점과 참조선 사이의 최소 거리를 계산할 필요는 없는 데, 각 관심 단백질에 대한 참조가 n 차원 공간에서 선이 아닌 단순히 점이기 때문이다. 따라서 각 관심 단백질에 대한 샘플 점과 참조 점 사이의 거리는 본원에 기재된 바와 같은 방법을 사용하여 계산되며, 계산된 거리는 오차 한계, ε와 비교되며, 이는 혼합물이 c 개의 관심 단백질을 함유하는 것으로 의심되는 경우 계산된 거리의 c번째 차수 통계이거나, 방정식 10,
Figure pct00294
을 사용하는 것과 같이 샘플에 대해 측정된 값(측정된 표지 값, 아미노산 농도, 또는 아미노산 수)에 기반하여 제공될 수 있다. 관심 단백질 p i D i ≤ ε인 경우 혼합물 내에서 식별된다.
특별한 경우 1에서, 샘플의 몰 단백질 농도는 알려져 있고, 이는 상수 SC이다. 따라서, 관심 단백질 p i 가 샘플 내에 존재하면, 샘플의 몰 단백질 농도로 존재하므로, t = SC.
일반적 파라미터 방정식은
Figure pct00295
이다.
특별한 경우 1에서, 일반적 파라미터 방정식은 n 차원 공간에서 점으로 단순화된다
Figure pct00296
이것은 공통 파라미터(독립적 변수)의 함수가 아니기 때문에 더 이상 파라미터 방정식이 아닌 데, 변수 t가 상수 SC로 대체되었기 때문이다. 특별한 경우 1에서, 관심 단백질 p i 에 대한 참조는 다음에 의해 제공된다:
Figure pct00297
이것은 n 차원 공간에서 점을 설명하며, 여기서 n은 샘플에서 표지되고 측정된 아미노산 유형의 수이다.
특별한 경우 1에서, 다음과 같도록 관심 단백질 p i 가 존재하는 경우 테스트 1이 충족된다:
Figure pct00298
여기서 S 1 은 샘플에서 아미노산 유형 1에 대해 측정된 값(아미노산 농도 또는 표지의 신호)이고, S 2 는 샘플에서 아미노산 유형 2에 대해 측정된 값(아미노산 농도 또는 표지의 신호)이고, S n 은 샘플에서 아미노산 유형 n에 대해 측정된 값(아미노산 농도 또는 표지의 신호)이다,
특별한 경우 1에서, 테스트 1이 충족되면, 관심 단백질 p i 는 샘플 내에 존재한다.
특별한 경우 1에서, 샘플 점(S 1 ,S 2 ,…,S n )과 관심 단백질에 대한 참조 점(c 1 SC,c 2 SC,…,c n SC) 사이의 거리가 오차 한계, ε보다 작도록 관심 단백질 p i 가 존재하는 경우 테스트 2가 충족된다.
샘플 점(S 1 ,S 2 ,…,S n )과 관심 단백질에 대한 참조 점(c 1 SC,c 2 SC,…,c n SC) 사이의 거리는 Euclidean 거리와 같은 거리 공식을 사용하여 계산된다. 예를 들어, 거리 D
Figure pct00299
를 사용하여, S i , (S 1 , S 2 ,…, S n ), 및 c i SC, (c 1 SC, c 2 SC,…, c n SC)에 대해 제공된 값을 사용하여 계산된다. 배타적으로 특별한 경우 1 내에서, 샘플에서 각각의 표지되고 측정된아미노산 유형 내에서 아미노산 수를 계산하는 것이 이용가능하다. 이것은 샘플의 각 아미노산 유형의 아미노산 수가 샘플의 해당 아미노산 유형의 아미노산 농도를 샘플의 알려진 몰 단백질 농도로 나눈 값과 같기 때문에 이용가능하다. 샘플에서 아미노산 유형 1의 아미노산 수는 N 1 이고, 샘플에서 아미노산 유형 2의 아미노산 수는 N 2 이고, 샘플에서 아미노산 유형 n의 아미노산 수는 N n 이다. 참조에서 아미노산 유형 1의 아미노산의 아미노산 수는 RN 1 이고, 참조에서 아미노산 유형 2의 아미노산 수는 R n2 이고, 참조에서 아미노산 유형 n의 아미노산 수는 RN n 이다. 일부 구현예에서, 아미노산의 이러한 수는 참조의 단백질 서열 또는 단백질 서열들로부터 계산되며, 성숙한 단백질에서 생물학적으로 절단된 서열의 일부를 제거하고, 알킬화, 아세틸화, 또는 글리실-리실 이소펩티드 형성을 통해 리신 1차 아민을 2차 아민으로 전환하는 것과 같이, 아미노산 R-기의 반응성 부분의 번역 후 변형으로 인해 표지와 반응하지 않을 각 아미노산 유형의 아미노산 수를 뺀다.
샘플에서 각 아미노산 유형의 아미노산 수가 특별한 경우 1에서 계산되는 경우, 다음과 같을 경우 테스트 1이 충족된다:
Figure pct00300
샘플 점이 참조 점과 정확히 같을 경우 테스트 1이 충족된다.
샘플에서 각 아미노산 유형의 아미노산 수가 특별한 경우 1 내에서 계산되는 경우, 참조에서 각 아미노산 유형의 아미노산 수가 샘플에서 각 아미노산 유형의 아미노산 수의 오차 한계, ε 내에 있는 경우 테스트 2가 충족된다. 이것은 샘플 점과 참조 점 사이의 거리, D, 예를 들어 Euclidean 거리를 결정함으로써 평가된다.
식은 다음과 같다:
Figure pct00301
샘플에서 각 표지된 아미노산 유형에 대한 아미노산 수는 측정된 표지로부터 계산되고 아미노산 농도를 샘플의 총 몰 단백질 농도로 나누어 본원에 기재된 바와 같은 샘플에서 단백질 분자 당 각 아미노산 유형의 수를 제공한다.
일부 구현예에서, 참조는 계산되기 보다는 실험적으로 제공되고, 참조의 단백질 농도는 샘플의 알려진 단백질 농도와 같다. 그런 다음 샘플의 아미노산 농도는 참조 단백질 또는 관심 단백체의 아미노산 농도와 직접 비교될 수 있다. 다른 구현예에서, 참조는 계산되기 보다는 실험적으로 제공되고, 참조의 단백질 농도는 샘플의 알려진 단백질 농도와 같지 않다. 실험적 참조는 여러 알려진 단백질 농도로 제공되고 단백질 농도에 관한 각 아미노산 유형에 대한 아미노산 농도의 변화율이 계산된다. 이것은 원점을 통과하는 정보의 각 차원을 따라 n 차원 공간에서 선의 기울기와 동등하고, 또한 단일 관심 단백질에 대한 파라미터 방정식 1 세트 또는 관심 단백체에 대한 파라미터 방정식 2 세트의 각 상응하는 아미노산 유형에 대해 a 1 , a 2 ,a n 과 동등하다. 이것은 샘플의 알려진 단백질 농도에서 실험적 참조 단백질 또는 단백체에 대해 측정될 아미노산 농도를 예측하는 데 사용되고, 샘플의 신호는 그것과 비교된다.
또 다른 구현예에서, 샘플의 C의 측정된 표지 및 W의 측정된 표지가 측정된다. 관심 단백질 또는 단백체 각각에 대한 C 아미노산의 수 및 W 아미노산의 수는 샘플의 알려진 단백질 농도에서 관심 단백질 또는 단백체 각각에 대한 C의 아미노산 농도 및 W의 아미노산 농도로 변환되고, 관심 단백질 또는 단백체 각각에 대한 C의 아미노산 농도 및 W의 아미노산 농도는 각 아미노산 유형의 아미노산 농도에 각 아미노산 유형에 대한 교정 계수를 곱하여 관심 단백질 또는 단백체 각각에 대한 알려진 표지 값(예를 들어 신호, 예컨대 형광 강도)으로 변환된다. 이것은 샘플의 단백질 농도가 알려져 있기 때문에 선이 아닌 n-차원 공간에서 점을 제공한다.
일부 구현예에서, 참조는 계산되기 보다는 실험적으로 제공되고 관심 단백질의 단백질 농도는 샘플의 알려진 단백질 농도와 같다. 그런 다음 샘플의 측정된 표지(예를 들어 신호)는 관심 단백질의 알려진 표지 값(예를 들어 신호)과 직접 비교될 수 있다. 다른 구현예에서, 참조는 계산되기 보다는 실험적으로 제공되고, 관심 단백질의 단백질 농도는 샘플의 알려진 단백질 농도와 같지 않다. 실험적 참조는 관심 단백질의 여러 알려진 단백질 농도로 제공되고 단백질 농도에 관한 각 아미노산 유형에 대한 신호의 변화율이 계산된다. 이것은 원점을 통과하는 정보의 각 차원을 따라 n 차원 공간에서 선의 기울기와 동등하고, 관심 단백질에 대한 파라미터 방정식 3 세트의 a 1 f 1 , a 2 f 2 , 및 a n f n 및 관심 단백체에 대한 파라미터 방정식 4 세트의 w 1 f 1 , w 2 f 2 , 및 w n f n 을 제공한다. 이것은 샘플의 알려진 단백질 농도에서 관심 실험적 참조 단백질 또는 단백체에 대해 측정될 신호를 예측하는 데 사용되고, 샘플의 신호는 그것과 비교된다.
이러한 2 가지 추가적인 구현예 둘 다에서 변환은 유사성을 비교하게 하여, 샘플의 알려지지 않은 단백질과 각각의 참조 단백질 사이의 비교가 이루어지고 임의적으로 거리 계산을 사용하여 확인될 수 있도록 한다.
특별한 경우 2
특별한 경우 2에서, 샘플 내에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재가 알려져 있지만, 샘플 내에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 총 몰 단백질 농도는 알려져 있지 않다. 파라미터 방정식 1, 2, 3, 또는 4 세트는 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조 함수를 제공한다. 하나 초과의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체가 샘플 내에서 알려져 있으면, 파라미터 방정식 2 세트는 샘플 내에 있는 알려진 하나 초과의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 농도에 대한 참조를 제공하는 데 사용되고 파라미터 방정식 4 세트는 샘플 내에 있는 알려진 하나 초과의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 표지 값에 대한 참조를 제공하는 데 사용된다. 두 경우, 이것은 방정식 6 또는 방정식 7을 사용하여 제공될 수 있다.
특별한 경우 2에서, 테스트가 수행되지 않는 데, 가설이 테스트되지 않기 때문이다. 따라서, 테스트 1 또는 테스트 2가 수행되지 않는다. 대신, 샘플에서 표지된 2 개 이상의 아미노산 유형에 대해 측정된 값은 참조 함수에 의해 제공되는 상응하는 값과 동일하게 설정되고, 각 방정식은 t에 대해 풀고, 결과는 평균화(즉, 평균)된다.
특별한 경우 2에서, 샘플 내에서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 하위단백체, 또는 단백체 p i 의 존재는 알려져 있지만, 샘플 내에서 관심 단백질 p i 의 단백질 농도는 알려져 있지 않다. 이전과 같이, 아미노산 유형 1, 아미노산 유형 2, 및 아미노산 유형 n에 대한 값은 S 1 , S 2 ,S n 으로서 샘플에 대해 측정되었다.
일반적인 파라미터 방정식은
Figure pct00302
으로 유지된다.
그러나, 관심 단백질 p i 의 존재는 테스트 1을 사용하여 평가되지 않는다. 대신, 알려진 값은 테스트 1을 포함하는 방정식에 입력되고, 방정식은 t에 대해 푼다:
Figure pct00303
샘플 내에서 관심 단백질 p i 의 존재가 알려져 있기 때문에, a 1 , a 2 , 및 a n 이 알려져 있다. S 1 , S 2 ,및 S n 은 측정되었기 때문에 알려져 있다. 따라서, 이들 값은 t에 대해 간단히 푸는 테스트 1을 포함하는 방정식에 입력되고, tn 값은 샘플 내의 관심 단백질 p i 의 농도 측정을 제공하기 위해 평균화(즉, 평균)된다. n 개의 아미노산 유형 각각의 표지화는 상이한 유형의 오류를 겪은 직교 화학을 수반하기 때문에, 이러한 직교 접근법을 통해 수득된 단백질 농도를 평균화하면 단백질 농도의 매우 정확한 측정을 제공하며; 기존 접근법은 280 nm에서 흡광도(A280)를 측정하는 것과 같이 단백질 농도를 측정하는 한 가지 방법만 사용한다. 이 방식으로 결정된 단백질 농도에 샘플의 부피를 곱하여 샘플 내의 관심 단백질 p i 의 양을 제공한다.
2 내지 n 개의 아미노산 유형에 대해 측정된 아미노산 농도로부터 샘플의 단백질 농도를 계산하는 공식(여기서 i = 1, 2, … n)은 방정식 19에 따라 계산된다:
Figure pct00304
본 발명의 방법은 또한 단백질의 양을 계산하는 데 사용될 수 있는 데, 단백질 농도가 단백질의 양을 용액의 부피로 나눈 값과 같기 때문이다. 2 내지 n 개의 아미노산 유형에 대해 측정된 아미노산 농도로부터 샘플의 단백질 양을 계산하는 공식(여기서 i = 1, 2, … n)은 방정식 20에 따라 계산된다:
Figure pct00305
여기서 샘플 부피는 아미노산 유형 n이 표지된 용액의 부피와 같다. 일부 구현예에서, 계산된 단백질 양은 존재하는 단백질의 총 몰수이다. 이것은 몰 당 6.022 x 1023 분자인 아보가드로의 수를 곱하여 용액에 존재하는 단백질 분자의 총 수로 전환될 수 있다. 일부 구현예에서, 존재하는 단백질의 총 질량은 단백질 분자량에 의해 존재하는 단백질의 몰에 단백질 양을 곱하여 계산된다. 일부 구현예에서, 샘플이 관심 단백질이 아닌 관심 단백체를 함유하는 경우, 존재하는 단백체의 총 중량은 단백체 내의 모든 단백질 서열에 대한 모든 아미노산 잔기(배타적으로 표지된 아미노산 잔기가 아님)의 평균 또는 가중 평균 수를 반영하는 평균 단백질 서열에 대해 계산된 단백질 분자량에 의해 존재하는 단백질의 몰에 단백질 양을 곱하여 계산될 수 있다.
중복
드물게, 샘플은 참조로 식별될 수 있지만, 참조는 하나 초과의 관심 단백질로 지칭될 수 있다. 이것은 단백질 서열에서 2 개 이상의 아미노산 유형이 동일한 경우, 또는 하나의 단백질 서열에서 2 개 이상의 아미노산 유형의 수가 또 다른 단백질 서열에서 2 개 이상의 아미노산 유형의 수의 배수인 경우 발생한다. 하나의 관심 단백질 내의 2 개 이상의 아미노산 유형의 수가 또 다른 관심 단백질 내의 동일한 2 개 이상의 아미노산 유형의 수와 동일하면, 관심 단백질에 대한 참조선이 동일할 것이다. 이러한 경우, 샘플은 참조로 식별되지만, 참조는 하나 초과의 관심 단백질을 지칭할 수 있으며, 예를 들어 참조는 2 개의 관심 단백질을 지칭할 수 있다.
이러한 경우 중 어느 하나에 선호되는 접근법은 생물학적으로 관련된 관심 단백질의 단백질 농도로만 참조선을 제한함으로써 하나 초과의 관심 단백질을 언급하는 참조를 제거하는 것이다. 바람직하게는, 관심 단백질에 대한 참조가 관심 단백질에 대한 생물학적으로 관련된 농도 범위 내에서 배타적으로 정의되는 경우 하나 초과의 관심 단백질을 언급하는 참조의 문제를 피할 수 있다. 이것은 공간에서 참조선을 제한함으로써, 하나 초과의 관심 단백질을 언급하는 참조, 또는 구별할 수 없는 2 개의 참조선의 존재를 극적으로 감소시키는 것으로 발견되었다. 효과는 10 자릿수 단백질 농도 범위에 걸쳐 혈장에 대해 도 8에 제시된다. 10 자릿수 농도 범위의 정보 풍부도는 인간 혈장 단백체(3263 개의 단백질 및 펩티드) 내의 관심 단백질에 대한 동일하거나 구별할 수 없는 참조선의 존재를 극적으로 감소시킨다.
이 발견은 도 9에서 추가로 정량화되었으며, 여기에서 하나 초과의 관심 단백질을 언급하는 참조의 발생은 아미노산 유형의 다양한 조합(C 및 W, K 및 W, K 및 Y, K 및 S, K 및 P, L 및 S, L 및 K, E 및 L, G 및 L, C K 및 W, C K 및 Y, L K 및 S, E G 및 K, E G 및 S, R E P 및 T, 및 Q L K 및 V에 대해 인간 혈장 단백체에 걸쳐 정량화되었다. 하나 초과의 관심 단백질을 언급하는 참조의 발생 백분율은 고려되는 아미노산 유형에 걸쳐 상당히 달라지지만, 본 발명의 방법의 일부로서 이용가능한 관심 단백질의 단백질 농도가 관심 단백질에 대해 이용가능한 농도 한계와 비교되는 경우, 하나의 참조는 테스트되는 2, 3, 및 4 개의 아미노산 유형의 모든 조합에 대해 100.00% 시간으로 하나의 고유한 관심 단백질(아미노산 서열 / 단백질 서열)에 맵핑되는 것으로 밝혀졌다. 일부 구현예에서, 2 개 이상의 표지된 아미노산 유형 내의 표지 값 및/또는 아미노산의 아미노산 농도 및/또는 아미노산 수를 샘플에서 표지된 것과 동일한 2 개 이상의 아미노산에 대해 제공된 표지 값, 아미노산 농도, 또는 아미노산 수와 비교하고, 식별된 단백질 농도를 관심 단백질에 대한 알려진 단백질 농도 범위와 비교하여 관심 단백질의 농도 및/또는 양을 고유하게 식별하고 결정한다. 따라서, 샘플 내에서 2 개 이상의 표지된 아미노산 유형의 서명을 측정하고, 본 발명의 비교 단계를 수행하여, 임의의 관심 단백질을 함유하는 것과 같은 샘플을 고유하게 식별한다.
이 제약 조건은 비교 단계에 영향을 미친다. 비교 단계 동안, 관심 단백질의 단백질 농도가 식별된다. 제약 조건이 참조에 적용되는 경우, 테스트 1 및/또는 테스트 2가 정상적으로 수행되지만, 추가적인 단계가 수행된다. 관심 단백질에 대한 아미노산 농도가 샘플에 대해 측정된 아미노산 농도와 같거나(테스트 1) 이에 대한 오차 한계보다 작거나 같도록(테스트 2) 단백질 농도, t에 대한 해가 발견되면, 테스트 3이 수행된다. 테스트 3에서, 단백질 농도에 대해 식별된 해는 단백질 농도 값의 제공된 범위와 비교된다. 단백질 농도 해가 참조에 대해 제공된 단백질 농도 값의 범위 내에 있다면, 관심 단백질의 존재는 이러한 해가 제공된 단백질 농도로 샘플에서 식별된다. 그러나, 단백질 농도 해가 참조에 대해 제공된 단백질 농도 값의 범위를 벗어나면, 관심 단백질의 존재는 샘플 내에서 식별되지 않는다.
제약 조건이 적용되는 경우, 파라미터 방정식의 일반 형식은 다음과 같이 된다:
Figure pct00306
여기서 파라미터 방정식의 일반 형식은
Figure pct00307
≤t≤ω 내에 함유된 모든 t에 대해 정의되며,
Figure pct00308
는 단백질 농도 t에 대한 하한이고 ω는 단백질 농도 t에 대한 상한이며, 단백질 아틀라스와 같은 공개적으로 이용가능한 실험적 데이터를 사용하여 제공될 수 있다.
p i 는 관심 단백질, 단백체, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 또는 하위단백체이고, c 1 은 아미노산 유형 1에 대한 계수이고, c 2 는 아미노산 유형 2에 대한 계수이고, c n 은 샘플에서 표지되고 측정된 아미노산 유형 n에 대한 계수이며, 각각 다음에 따라 제공된다(아미노산 유형 n의 예에 대해 설명될 뿐만 아니라 아미노산 유형 1 및 2에 적용됨):
ㆍ 샘플에 대한 측정이 아미노산 농도로 제공되고 참조선이 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체를 설명하는 경우, c n = a n , 여기서 a n 은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이며, a n 은 0보다 더 크거나 같은 정수임(
Figure pct00309
ㆍ 샘플에 대한 측정이 아미노산 농도로 제공되고 참조선이 관심 단백체 또는 하위단백체를 설명하는 경우, c n = w n , 여기서 w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수임
ㆍ 샘플에 대한 측정이 표지의 신호로 제공되고 참조선이 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체를 설명하는 경우, c n = a n f n , 여기서 a n 은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이며, a n 은 0보다 더 크거나 같은 정수이고(
Figure pct00310
, 여기서 f n 은 아미노산 농도와 아미노산 유형 n에 대한 표지의 신호 사이를 전환하는 교정 계수 또는 교정 함수임
ㆍ 샘플에 대한 측정이 측정된 표지(예를 들어 표지의 신호)로 제공되고 참조선이 관심 단백체 또는 하위단백체를 설명하는 경우, c n = w n f n , 여기서 w n 은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이며, 여기서 w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, 여기서 f n 은 아미노산 농도와 아미노산 유형 n에 대한 표지의 신호 사이를 조정하는 교정 계수 또는 교정 함수임.
테스트 3에서,
Figure pct00311
≤테스트 1 또는 테스트 2를 사용하여 식별된 t에 대한 해(solution)≤ω이면, 관심 단백질 p i 는 단백질 농도 t로 샘플 내에 존재한다. 샘플의 양은 샘플의 단백질 농도에 샘플의 부피를 곱한 값이다.
대안적 또는 보완적 접근법으로서, 참조가 하나 초과의 관심 단백질(예를 들어 2 개의 관심 단백질)을 지칭하는 경우, 일부 정보는 관심 단백질이 샘플 내에 존재하는지 결정하는 데 이용가능한 데, 샘플이 수득된 방법에 대한 정보가 이용가능하기 때문이다. 예를 들어, 20,353-단백질 인간 단백체의 예 내에서(하위단위가 단백질 복합체에 드러나기 전에), 샘플은 혈장, 자궁내막 조직의 생검, 잠재적으로 암성 피부 성장, 타액, 또는 소변으로부터 수득될 수 있었다. 샘플이 참조로서 식별되지만, 참조가 하나 초과의 관심 단백질을 지칭하는 경우, 이 정보는 참조가 지칭하는 관심 단백질 및 이에 따라 관심 단백질이 샘플 내에 존재하는지 결정하는 데 사용된다. 이 과정은 분류기로 자동화될 수 있다. 예를 들어, 인간 단백체는 20,353 개의 단백질을 함유하지만, 단백질은 다양한 조직 유형 및 다양한 질환 상태에서 상이하게 발현된다. 따라서, 샘플에서 하나 이상의 관심 단백질의 정체성 및/또는 존재 및/또는 농도를 확인하고 범주형 조직 유형 내의 관심 단백질의 발현 데이터에 대해 훈련된 분류기는 샘플이 식별된 참조에 기반하여 참조가 지칭하는 관심 단백질, 및 샘플이 수득된 입력된 범주형 조직 유형을 식별하는 데 사용될 수 있다.
완화 단계가 적용되지 않는 경우에도, 가장 임상적으로 관련된 관심 단백체 또는 하위단백체 내에서 고유하지 않거나 구별가능하지 않은 참조가 빈번하게 발생하지 않는다. 도 10은 여러 임상적으로 관련된 단백체 및 하위단백체에 대한 이 거동을 분석한다. 도 10은 단백질 농도 또는 다른 분류에 대한 임의의 한계 또는 제약 조건의 적용 없이, 2 개의 아미노산 유형이 표지되고 비교되는 경우, 모든 참조가 구별가능하고 고려되는 대부분의 임상적으로 관련된 단백체 및 하위단백체(SARS-CoV-2, HIV, 엡스타인-바, 신경교종) 내에서 관심 단백질에 고유하게 맵핑되고 임상적으로 관련된 단백체 및 하위단백체 내에서 다수의 관심 단백질에 상응하지 않음을 나타낸다. 일부 구현예에서, 본 발명의 방법이 단백질 농도 제약 조건 없이 200 개 초과의 단백질을 함유하는 단백체 또는 하위단백체 내에 존재하는 모든 단백질을 함유하는 관심 단백질의 참조 세트로부터 샘플 내의 관심 단백질이 존재 및 농도를 식별하는 데 사용되는 경우, 3 개의 아미노산 유형이 표지된다. 도 10은 3 개의 아미노산 유형이 표지되고 비교되는 경우, 모든 참조가 구별가능하고 4000 개 미만의 단백질을 함유하는 모든 임상적으로 관련된 단백체 및 하위단백체 내에서 관심 단백질에 고유하게 맵핑된다는 것을 나타낸다.
대안적인 구현예에서, 하나의 관심 단백질 내에서 2 개 이상의 아미노산 유형의 수가 또 다른 관심 단백질 내의 2 개 이상의 아미노산 유형의 수의 배수이면, 참조선은 n 차원 공간 내에서 동일한 위치를 차지할 것이지만(즉, 이들은 서로의 위에 있을 것임), 상이한 파라미터화를 갖는다. 따라서, 샘플은 참조로서 식별되지만, 참조는 또 다른 참조와 중첩되어, 샘플이 어느 한 참조에 의해 언급되는 관심 단백질을 함유할 수 있도록 한다. 이 경우, 샘플의 질량 단백질 농도를 측정하는 것(예를 들어 A280/A205 비율을 사용하고 Scopes 방법을 통해 ε 205 을 제공하는 mg/mL의 샘플의 질량 단백질 농도, 또는 Bradford 검정을 사용하여 mg/mL의 샘플의 질량 단백질 농도 측정)은 참조가 중첩된 관심 단백질이 샘플에 존재하는지 식별할 수 있다. mg/mL의 샘플의 측정된 단백질 농도는 샘플이 중첩된 참조가 있는 관심 단백질 각각이라는 가설에 따라, 샘플의 가능한 몰 단백질 농도로 전환된다(참조선에 의해 언급되는 관심 단백질이 알려져 있기 때문에, 이의 분자량이 알려져 있으므로, 샘플의 질량 단백질 농도는 샘플의 몰 단백질 농도로 전환될 수 있음). 그런 다음, 샘플이 중첩된 참조선이 있는 관심 단백질 중 어느 하나인 경우, 샘플에 대해 측정된 아미노산 농도를 샘플의 가설적 몰 단백질 농도로 나눈다. 이것은 샘플에서 각 표지된 아미노산 유형의 아미노산 수를 나타낸다. 이것은 중첩된 참조가 있는 각 관심 단백질에 대한 각 아미노산 유형의 아미노산 수와 비교된다. 샘플은 중첩된 참조가 있는 관심 단백질 각각에 대한 아미노산 수와 동일하거나, 이에 대한 오차 한계, ε 내에 있거나, 가장 근접한 아미노산 수를 갖는 관심 단백질로서 식별된다. 샘플의 아미노산 수에 가장 근접한 아미노산 수를 갖는 관심 단백질을 식별하기 위해, 참조에 의해 기재된 각 관심 단백질의 각 아미노산 유형의 아미노산 수를 샘플의 각 아미노산 유형의 수에서 빼고, 각 아미노산 유형에 대해 값을 취하고, 결과를 합한다. 이것은 참조 및 샘플에 의해 기재된 각 관심 단백질 사이의 숫자 차이이다. 샘플은 샘플의 단백질 농도 및/또는 양이 이미 식별된, 숫자 차이가 가장 작은 참조에 의해 기재된 관심 단백질로서 식별된다.
일부 구현예에서, 표지화를 위해 선택된 아미노산 유형은 단백체 또는 하위단백체 내에서 하나 초과의 관심 단백질을 구별하거나 상응하지 않는 임의의 참조를 제거하거나 최소화하는 아미노산 유형일 수 있다. 2, 3, 4, 및 5 개의 아미노산 유형의 모든 가능한 조합에 의해 제공되는 정보 내용이 분석되었고 관심 단백질에 고유하게 상응하고 구별가능한 참조의 백분율이 대표적인 도 11에 제시된다. 도 11에서, 아미노산 유형 조합은 관심 단백질에 대한 고유한 맵핑의 백분율에 의해 순위가 매겨졌고 고유한 맵핑의 가장 높은 백분율을 갖는 아미노산 유형 조합이 제시되어 있으며; 아미노산 유형 조합의 크기는 고유한 맵핑의 상대적 백분율을 나타낸다. 예를 들어, 일반적으로, 2 개의 아미노산 유형에 대해, KW, CW, KC, KY, CY, WY, LS, LK, EL, GL, AL, DL, LS, LP, LV, KS, EL, AR, AE, AG, 및 AI 아미노산 유형 조합은 단백체 또는 하위단백체 내의 하나 초과의 관심 단백질에 맵핑하거나 구별할 수 없는 임의의 참조를 제거하거나 최소화한다.
흥미롭게도, 평균 값이 단백체 또는 하위단백체와 같은 혼합물에 걸쳐 취해지는 경우, 배수가 발생하지 않는다. 단백체 또는 하위단백체가 아미노산 수가 서로의 배수인 순수 단백질을 함유하는 경우에도, 전체 단백체 또는 하위단백체에 대한 평균 아미노산 수는 임의의 다른 단백체 또는 하위단백체에 대한 평균 아미노산 수의 배수가 아니다. 예를 들어, 이. 콜라이 단백체 내의 개별 순수 단백질은 서로의 배수인 아미노산 수를 함유하지만, 이. 콜라이 단백체는 임의의 다른 박테리아 단백체와 구별되는 평균 아미노산 수를 함유한다. 도 12는 UniProt 데이터베이스로부터 이용가능한 모든 7000 개 이상의 참조 박테리아 단백체가 2 개의 아미노산 유형만이 표지되는 경우에도, 모든 다른 박테리아 단백체의 평균 아미노산 수와 구별되는 평균 아미노산 수를 가짐을 나타낸다. 동일한 거동이 UniProt 데이터베이스로부터 이용가능한 9000 개 이상의 바이러스 단백체에 대해 발견된다.
놀랍게도, 단백체 또는 하위단백체와 같은 복합체 혼합물 내의 모든 단백질에 대한 2 개 이상의 아미노산 유형의 아미노산 수, 아미노산 농도, 또는 표지의 신호를 표지화하고 비교함으로써, 배수가 관찰되지 않음이 발견되었다. 따라서, 단백체가 일부 구성요소 단백질에 대해 관찰된 아미노산 수의 배수가 되어, 그들의 식별을 어렵게 만들기 때문에 모든 구성요소 단백질로부터 식별되지 않을 수 있는 경우에도, 전체 단백체는 단백체 내의 대표적인 단백질 서열에 대한 아미노산의 가중 평균 수에 기반하여 식별될 수 있다. 이것은 박테리아 및 바이러스 단백체에 걸친 평균 아미노산 수가 Benford의 법칙을 따르지 않는다는 발견으로 합리화되었다. 이는 이 숫자 세트가 특히 정보가 풍부하고, 도 4, 5, 및 6에 제시된 바와 같이, 자연적으로 발생하는 다른 숫자 세트에 비해 다양함을 의미한다.
관심 단백체, 박테리아 및 바이러스 단백체 내에서 단지 2 개의 아미노산 유형의 표지화 경우에도 서로 구별되어, 도 3에 제시된 바와 같이, 단지 2 개의 아미노산 유형의 표지화에 기반하여 박테리아 또는 바이러스 감염의 빠른 식별을 허용함이 발견되었다.
관심 단백체, 박테리아 및 바이러스 단백체 내에서 단지 2 개의 아미노산 유형의 표지화 경우에도 도 13에 제시된 바와 같이, 그들의 계통에 따라 함께 클러스터링됨이 발견되었다.
예를 들어, K 및 W 아미노산 유형의 표지화 경우, 코리네박테리아세아에, 레지오넬랄레스, 바실랄레스, 스트렙토마이세타세아에, 및 마이코플라스마타세아에 목의 박테리아는 뚜렷한 클러스터를 형성하고 비-중첩된 서명을 제공한다. K 및 W 표지화는 둘 다 대략 5 분 이내에 신속하게 진행될 수 있다. 따라서, 본 발명의 방법은 임의의 유형의 박테리아 감염의 신속 진단, 및 박테리아가 감수성을 가질 수 있는 적절한 항생체 치료의 선택에 사용될 수 있다. 박테리아 감염을 진단하는 전통적인 방법은 약 2-5일이 걸리는 배양 플레이트를 성장시키는 것을 수반하므로, 본 발명의 방법은 현재 기술 상태보다 500 내지 1500 배 더 빠른 박테리아 감염의 진단을 위한 방법을 제공한다.
혼합물
하기 측면은 단백질의 혼합과 관련하여 논의된다. 그러나, 본 발명의 이러한 측면은 단백질, 펩티드, 올리고펩티드, 단백질 복합체, 폴리펩티드, 하위단백체 또는 단백체 및 이의 임의의 조합의 임의의 혼합물이 동등하게 적용될 수 있다.
일부 구현예에서, 샘플이 단백질의 혼합물을 함유하거나, 함유하는 것으로 의심되는 경우, 각 표지된 아미노산 유형의 아미노산 수는 샘플 내의 단백질의 혼합물 중 모든 단백질에서 각 표지된 아미노산 유형의 평균 아미노산 수이다. 바람직하게는, 평균은 샘플 내의 단백질의 혼합물에 걸친 모든 단백질에서 각 표지된 아미노산 유형의 평균 아미노산 수이다. 일부 구현예에서, 평균은 샘플 내의 단백질의 혼합물에 걸친 모든 단백질에서 각 표지된 아미노산 유형의 아미노산의 가중 평균 수이다. 혼합물 또는 단백체 내의 각 단백질에서 각 표지된 아미노산 유형의 아미노산 수는 단백질의 혼합물 또는 단백체에 걸친 해당 단백질의 분율에 의해 가중치를 둔다. 이러한 가중치는 샘플 내의 단백체 또는 단백질의 혼합물에 걸친 모든 단백질에서 각 표지된 아미노산 유형의 평균 아미노산 수를 계산하는 경우 고려되고, 또한 단백질의 단순 혼합물과 같은 단백질의 혼합물에 대한 참조를 제공하는 데 사용될 수 있다.
바람직한 구현예에서, 본 발명의 방법은 샘플 내에 존재하는 하나 초과의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 식별하였다. 따라서, 본 발명의 방법은 샘플 내에 존재하는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 혼합물을 식별하였다. 샘플 내에 존재하는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 정체성은 참조선과 샘플 점 사이의 수직(최소) 거리가 오차 한계, ε보다 작거나 같도록본 발명의 방법을 통해 테스트 2를 수행하고 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 단백질 농도를 식별하는 것을 통해 이미 결정되었다. 혼합물 내의 구성요소의 수가 알려져 있거나 c인 것으로 의심되면, 오차 한계는 각 관심 단백질에 대해 측정된 거리(β) 세트의 c번째 차수 통계, β c 로서 정의될 수 있다. 혼합물 내의 구성요소의 수가 알려져 있지 않거나 의심되지 않으면, 오차 한계는 방정식 10에 의해 기재된 것과 같이, 사용자 지정 허용오차 값에 샘플 점의 제곱 값 합의 제곱근을 곱하여 정의되었을 수 있다:
Figure pct00312
이들 거리는 혼합물의 비례 조성을 식별하는 데 추가로 사용될 수 있는 있음이 발견되었다.
일부 구현예에서, 혼합물에서 각 구성요소의 비율이 식별된다. 예를 들어, 샘플이 2 개 단백질의 혼합물을 함유하는 경우, 샘플 내 혼합물 중 각 단백질의 비율이 결정된다. 예를 들어, 샘플은 단백질 A 및 B의 혼합물을 함유하고, 여기서 혼합물은 90% 단백질 A 및 10% 단백질 B를 함유하는 것으로 결정될 수 있다. 이는 샘플에 대한 측정값이 혼합물을 포함하는 순수 구성요소(예를 들어 순수 단백질 구성요소, 예를 들어 단백질 A 및 단백질 B)에 대한 참조 값 사이의 평균이기 때문이다. 샘플이 2 개 단백질; 단백질 A 및 B의 혼합물을 함유하는 경우, 샘플에 대한 측정값은 단백질 A 및 단백질 B에 대한 예상된 값 사이의 평균이다. 순수 단백질에 대한 참조 값에 대한 (수직) 거리가 가까울수록, 혼합물 내의 순수 단백질의 비율이 더 커지며, 따라서 거리가 역전된다.
본 발명의 일부 구현예에서, 혼합물의 정체성은 알려져 있지 않고, 혼합물의 단백질 농도 또한 알려져 있지 않다. 이것은 다음 모두가 알려지지 않음을 의미한다: 혼합물을 포함하는 단백질의 정체성, 혼합물 내의 각 단백질의 상대 비율, 혼합물의 총 단백질 농도, 및 혼합물 내의 각 혼합물 구성요소의 상대 농도. 혼합물을 식별하고 정량화하는 것은 알려지지 않은 혼합물에 대해 측정된 표지 값 또는 아미노산 농도를 알려지지 않은 혼합물 내에 함유될 수 있는 일련의 참조 단백질에 대해 측정될 표지 값 또는 아미노산 농도와 비교하는 것을 수반한다. 일부 구현예에서, 혼합물 내에 존재하는 단백질의 수가 제공된다. 다른 구현예에서, 혼합물 내에 존재하는 단백질의 수가 제공되지 않는다. 각 경우는 확장된 예로 기재된다.
혼합물 내에 존재하는 단백질의 수는 알려져 있거나 의심된다
일부 구현예에서, 혼합물 내에 존재하는 단백질의 수가 제공된다. 예를 들어, 샘플은 알려지지 않은 단백질의 혼합물이다. 샘플에 대한 정보의 각 차원에 대해 측정된 원시 신호는 아미노산 농도로 전환되었다. 3 개 차원의 정보가 있는 데, 3 개 유형의 아미노산이 표지되어 있기 때문이다. 파라미터 방정식 1 세트에 의해 제공된 관심 단백질 1, 관심 단백질 2, 관심 단백질 3, 관심 단백질 4, 관심 단백질 5, 및 관심 단백질 6에 대해 측정될 예상된 아미노산 농도는 도 14에 제시되어 있다.
샘플 점은 임의의 관심 단백질에 대한 참조선 상에 있지 않으므로, 테스트 2는 본원에 기재된 바와 같이 수행되고, 각 관심 단백질에 대한 샘플 점과 참조선 사이의 수직 거리가 최소화되도록 각 관심 단백질에 대한 t의 값을 구한다. 단백질 농도 t에서 샘플점과 각 참조선 사이의 수직 거리는 본원에 기재된 바와 같이 계산되어, 6 개의 거리 값, D 1 , D 2 , D 3 , D 4 , D 5 D 6 을 초래한다. βD 값의 세트이다. 혼합물에서 단백질의 수는 알려져 있거나 3인 것으로 의심되므로, β의 3번째 차수 통계를 거리 임계값, D = β 3 으로 설정한다.
3 개의 최소 거리는 D 1 , D 5 ,D 3 이다. 따라서, 알려지지 않은 혼합물은 관심 단백질 1, 관심 단백질 5, 및 관심 단백질 3을 포함하는 것으로 식별된다. 샘플에 대한 관심 단백질 1, 관심 단백질 5, 및 관심 단백질 3에 의해 제공된 아미노산 농도의 비율을 결정하는 것이 또한 가능하다. 원칙은 혼합물을 포함하는 순수 구성요소(예를 들어 순수 단백질)에 대해 예상된 값의 평균이라는 것이다. 거리가 가까울수록, 혼합물 내의 순수 구성요소(예를 들어 순수 단백질)의 비율이 더 커지므로, 거리는 역전된다. 거리는 또한 혼합물 내의 모든 구성요소 비율의 합이 1이 되도록 정규화되어야 한다. 따라서, 혼합물 내의 각 구성요소의 비율을 계산하기 위해:
ㆍ 거리는 가장 큰 거리를 모든 다른 거리로 나누어 역 정규화한다.
ㆍ 그런 다음 역 정규화된 거리를 합한다
ㆍ 마지막으로, 역 정규화된 거리를 모든 역 정규화된 거리의 합으로 나누어 혼합물 내의 각 구성요소의 분율을 계산한다.
이것은 관심 단백질의 세트 p i=1:a 로부터 공식적으로 언급되어 있으며, 여기서 a는 참조 세트에서 관심 단백질의 총 수이고, b 관심 단백질은 혼합물 내에서 식별되므로, 혼합물 내에서 식별된 관심 단백질은 p i=1:b 이다. 각 관심 단백질 p i=1:b 의 거리는 D i=1:b 로 측정된다. 최대(D i=1:b )를 구한다. 각 관심 단백질 p i=1:b 에 대해,
Figure pct00313
를 구한다. 각 관심 단백질 p i=1:b 에 대해, 혼합물 내의 이 관심 단백질의 분율은 공식적으로 방정식 18로 언급된다:
Figure pct00314
이 접근법을 예에 적용하면, 연구자는 D 1 = 14.1, D 3 = 32.1 및 D 5 = 19.7로 결정하였다. 최대 거리는 32.1이다.
따라서 아미노산 농도에 기반한 혼합물에서 관심 단백질 1의 백분율은
Figure pct00315
0.46이다.
아미노산 농도에 기반한 혼합물에서 관심 단백질 3의 백분율은
Figure pct00316
0.20이다.
아미노산 농도에 기반한 혼합물에서 관심 단백질 5의 백분율은
Figure pct00317
0.33이다.
일부 구현예에서, 측정된 표지(예를 들어 표지의 신호)가 샘플 및 참조 관심 단백질에 대해 제공되면, 이 단계는 아미노산 농도가 아닌 측정된 표지(예를 들어 표지의 신호)를 사용하여 수행된다. 측정된 표지(예를 들어 표지의 신호)는 아미노산 농도를 곱한 상수이기 때문에, 상기 나누기 단계에서 상수를 약분하고 아미노산 농도에 기반하여 혼합물 내의 각 구성요소의 비율을 나타내는 등가 비례 결과를 수득한다.
각 순수 구성요소(예를 들어 순수 단백질)의 겉보기 단백질 농도는 이미 식별되었으며, 이것은 관심 단백질이 샘플 내에서 식별되도록 테스트 2가 만족된 각 순수 구성요소에 대한 t에 대한 해이다. 그러나, 순수 구성요소(예를 들어 순수 단백질)는 혼합물 내에 함유되므로, t에 대한 각 식별된 해에 혼합물 내의 각 구성요소의 비율을 곱하여 샘플 내의 각 구성요소의 단백질 농도를 확인한다. 관심 단백질 1에 대한 t의 해는 t 1 이고, 관심 단백질 3에 대한 t의 해는 t 3 이고, 관심 단백질 5에 대한 t의 해는 t 5 이다. 관심 단백질 1의 단백질 농도는 0.46 x t 1 이고, 관심 단백질 3의 단백질 농도는 0.20 x t 3 이고, 관심 단백질 5의 단백질 농도는 0.33 x t 5 이다. 그런 다음 샘플의 총 단백질 농도는 0.46 x t 1 + 0.20 x t 3 + 0.33 x t 5 이다.
혼합물 내에 존재하는 단백질의 수는 제공되지 않는다
다른 구현예에서, 혼합물 내에 존재하는 단백질의 수는 알려져 있지 않거나 의심되지 않는다. 이 구현예에서, 제1 단계는 혼합물 내에 존재하는 단백질의 수는 알려져 있거나 의심된다 섹션 및 이것이 알려져 있거나 의심되는 경우에 대해 도 14에 기재된 것과 동일하다. 샘플 점은 임의의 관심 단백질에 대한 참조선 상에 있지 않으므로, 테스트 2는 본원에 기재된 바와 같이 수행되고, 값은 각 관심 단백질에 대한 샘플 점과 참조선 사이의 거리가 최소화되도록 각 관심 단백질에 대한 t의 값을 구하였다. 단백질 농도 t에서 샘플 점과 각 참조선 사이의 거리는 본원에 기재된 바와 같이 계산되어, 6 개의 거리 값, D 1 , D 2 , D 3 , D 4 , D 5 D 6 을 초래한다. 각 거리 값은 오차 한계, ε과 비교된다. 혼합물 내에 존재하는 단백질의 수가 제공되지 않는 경우, ε은 바람직하게는 예를 들어 방정식 10에 제공된 바와 같이, 측정된 샘플 값을 사용하여 정의된다:
Figure pct00318
이 경우, 사용자 지정 허용오차 값은 예를 들어 혼합물 내에 존재하는 것으로 식별된 관심 단백질의 수에 영향을 미친다. 관심 단백질 p i 의 존재는 이 관심 단백질에 대한 D 값, D i 가 오차 한계보다 작거나 같은 경우(D i ≤ ε) 혼합물 내에서 식별된다. n 차원 공간에 표시되는 경우, εn 차원 공간에서 구의 반지름을 정의한다. 2 개 유형의 아미노산이 표지되면, 정보의 2 개 차원이 고려되고 ε은 1-구(원)를 정의한다. 4 개 유형의 아미노산이 표지되면, 정보의 4 개 차원이 고려되고 ε은 3-구를 정의한다. 3-구는 4-차원 Euclidean 공간에서 구에 대한 명칭이다. 대안적인 구현예에서, 타원체 또는 과타원체는 표지된 각 아미노산(정보의 차원)에 대한 컷오프 거리(
Figure pct00319
)를 명시함으로써 제공될 수 있으며; 이것은 표지화 반응 중 하나가 다른 표지화 반응보다 더 많은 양의 실험상의 오류를 생성할 것으로 예상되는 경우 유용할 수 있다.
이 예에서, ε은 3-차원 공간에서 구(2-구로도 알려짐)를 정의한다. ε은 20이다. D 1 = 14.1, D 2 = 42.0, D 3 = 32.1, D 4 = 37.4, D 5 = 19.7 및 D 6 = 50.0. D 1 < ε, 및 D 5 < ε. 따라서, 관심 단백질 1 및 관심 단백질 5는 샘플에서 식별되었다.
그런 다음 혼합물 내에 존재하는 단백질의 수는 알려져 있거나 의심된다 섹션에 기재된 동일한 접근법은 샘플 내에서 관심 단백질 1 및 관심 단백질 5의 비율을 결정하는 데 적용된다. 원칙은 샘플에 대한 측정값이 혼합물을 포함하는 순수 구성요소(예를 들어 순수 단백질 구성요소)에 대한 예상된 값의 평균이라는 것이다. 거리가 가까울수록, 혼합물 내의 순수 구성요소(예를 들어 순수 단백질)의 비율은 더 커지므로, 거리는 역전된다. 거리는 또한 혼합물 내의 모든 구성요소 비율의 합이 1이 되도록 표준화되어야 한다. 따라서, 혼합물 내의 각 구성요소의 비율을 계산하기 위해:
ㆍ 거리는 가장 큰 거리를 모든 다른 거리로 나누어 역 정규화한다.
ㆍ 그런 다음 역 정규화된 거리를 합한다.
ㆍ 마지막으로, 역 정규화된 거리를 모든 역 정규화된 거리의 합으로 나누어 아미노산 농도에 기반한 혼합물 내의 각 구성요소의 분율을 계산한다.
공식적으로 다음과 같이 언급될 수 있다:
Figure pct00320
이 접근법을 예에 적용하면, 연구자는 D 1 = 14.1 및 D 5 = 19.7로 결정하였다. 최대 거리는 19.7이다.
따라서 아미노산 농도에 기반한 혼합물에서 관심 단백질 1의 백분율은
Figure pct00321
0.58이다.
아미노산 농도에 기반한 혼합물에서 관심 단백질 5의 백분율은
Figure pct00322
0.42이다.
일부 구현예에서, 측정된 표지(예를 들어 표지의 신호)가 샘플 및 참조 관심 단백질에 대해 제공되면, 이 단계는 아미노산 농도가 아닌 측정된 표지(예를 들어 표지의 신호)를 사용하여 수행된다. 표지의 신호는 아미노산 농도를 곱한 상수이기 때문에, 상기 나누기 단계에서 상수를 약분하고 아미노산 농도에 기반한 혼합물 내의 각 구성요소의 비율에 관한 등가 비례 결과를 수득한다.
각 순수 구성요소의 겉보기 단백질 농도는 이미 식별되었으며, 이것은 관심 단백질이 샘플 내에서 식별되도록 테스트 2가 만족된 각 순수 구성요소에 대한 t에 대한 해이다. 그러나, 순수 구성요소는 혼합물 내에 함유되므로, t에 대한 각 식별된 해에 혼합물 내의 각 구성요소의 비율을 곱하여 샘플 내의 각 구성요소의 단백질 농도를 확인한다. 관심 단백질 1에 대한 t의 해는 t 1 이고, 관심 단백질 5에 대한 t의 해는 t 5 이다. 관심 단백질 1의 단백질 농도는 0.58 x t 1 이고, 관심 단백질 5의 단백질 농도는 0.42 x t 5 이다. 그런 다음 샘플의 총 단백질 농도는 0.58 x t 1 + 0.42 x t 5 이다.
혼합물 내의 각 구성요소의 상대 비율 및 혼합물 내의 각 구성요소의 단백질 농도를 결정하기 위한 접근법은 혼합물 내의 단백질의 수가 의심되거나 의심되지 않은지 여부에 관계 없이 동일하며; 차이는 단순히 프로세스에 대한 입력으로, 오차 한계가 샘플에 대해 측정된 값에 기반하거나 혼합물 내에 존재하는단백질의 의심된 수에 기반하여 공급되었는지 여부이다.
특별한 경우 1에서, 샘플의 총 몰 단백질 농도는 알려져 있으므로, 샘플에 대한 2 개 이상의 아미노산 유형의 아미노산 수를 계산하고, 참조로서 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 2 개 이상의 아미노산 유형의 수를 제공하는 것이 가능하다. 대안적으로, 동일한 2 개 이상의 아미노산 유형의 표지 값 또는 아미노산 농도는 샘플의 단백질 농도로 제공될 수 있다. 각 관심 단백질에 대한 샘플 점과 참조선 사이의 최소 거리를 계산할 필요는 없는 데, 각 관심 단백질에 대한 참조가 선이 아닌, n 차원 공간에서 점이기 때문이다. 따라서 각 관심 단백질에 대한 샘플 점과 참조 점 사이의 거리는 본원에 기재된 바와 같은 방법을 사용하여 계산되며, 계산된 거리는 오차 한계, ε와 비교되며, 이는 혼합물이 관심 단백질 C를 함유하는 것으로 의심되는 경우 계산된 거리의 c번째 차수 통계이거나, 방정식 10,
Figure pct00323
을 사용하는 것과 같이 샘플에 대해 측정된 값(측정된 표지 값, 아미노산 농도, 또는 아미노산 수)에 기반하여 제공될 수 있다. 관심 단백질 p i D i ≤ ε인 경우 혼합물 내에서 식별된다. 그런 다음, 상기 기재된 바와 같은 동일한 접근법이 혼합물 내의 각 구성요소의 상대 비율을 결정하는 데 적용된다.
Figure pct00324
예를 들어, 샘플은 3 개의 단백질을 함유하는 것으로 의심되지만 혼합물의 구성요소 및 혼합물 내의 그들의 비율은 알려져 있지 않다. 아미노산 유형 W 및 C는 샘플에서 표지되고, W 및 C의 아미노산 수가 결정된다. 샘플에서 W 및 C의 아미노산 수는 각 관심 단백질에서 W 및 C 아미노산의 수와 비교된다(도 14 참조).
관심 단백질 1, 관심 단백질 3, 및 관심 단백질 4는 오차 한계 내에 속하므로 관심 단백질 1, 관심 단백질 3, 및 관심 단백질 4를 포함하는 것과 같은 혼합물의 적극 식별이 이루어진다. 이것은 샘플 점과 모든 참조 단백질에 상응하는 점 사이의 거리(예를 들어 Euclidean 거리)를 공식적으로 계산함으로써 확인된다.
Euclidean 거리는 각 관심 단백질에 대해 계산된다:
샘플 대 관심 단백질 1: D 1 = 2.24
샘플 대 관심 단백질 2: D 2 = 5.10
샘플 대 관심 단백질 3: D 3 = 2.24
샘플 대 관심 단백질 4: D 4 = 2.83
샘플 대 관심 단백질 5: D 5 = 7.07
샘플 대 관심 단백질 6: D 6 = 5.00
측정된 모든 거리의 세트는 β이다. 샘플은 3 개의 단백질을 함유하는 것으로 의심되기 때문에, β의 3번째 차수 통계는 거리 임계값, D = β 3 = 2.83으로 설정된다. 혼합물은 관심 단백질 1, 관심 단백질 3, 및 관심 단백질 4를 포함하는 것으로 확인되는 데, 이들이 3 개의 최소 Euclidean 거리이기 때문이다.
혼합물의 구성요소 각각의 백분율은 유클리드 거리 측정값을 역 정규화하고, 역 정규화된 거리를 합하고 역 정규화된 거리를 모든 역 정규화된 거리의 합으로 나누어 혼합물 내의 각 구성요소의 분율을 계산함으로써 D 1 , D 3 , 및 D 4 를 비교하는 것에 기반하여 결정될 수 있다.
D 1 = 2.24, D 3 = 2.24 및 D 4 = 2.83의 최대 거리는 2.83이다.
따라서, 혼합물에서 관심 단백질 1의 백분율은
Figure pct00325
0.36이다.
혼합물에서 관심 단백질 3의 백분율은
Figure pct00326
0.36이다.
혼합물에서 관심 단백질 4의 백분율은
Figure pct00327
0.28이다.
따라서, 샘플은 36% 단백질 1, 36% 단백질 3 및 28% 단백질 4를 함유하는 것으로 확인된다.
처리는 이것이 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체의 혼합물인지 여부와 관계 없이 동일하다. 본원의 방법에 기재된 바와 같이, 적절한 파라미터 방정식은 각 경우에 샘플에 대해 측정된 값과 일치하도록 참조 단백질에 대한 아미노산 농도 또는 신호를 제공한다.
분류기
일부 구현예에서, 비교 단계는 분류기에서 수행된다. 일부 구현예에서, 방법은 분류기에서 관심 단백질의 존재 및/또는 농도 및/또는 양의 식별을 확인하는 것을 추가로 포함한다.
일부 구현예에서, 샘플에서 관심 단백질의 존재 및/또는 농도 및/또는 양의 적극 식별은 샘플의 측정된 표지, 각 표지된 아미노산 유형의 농도, 또는 각 표지된 아미노산 유형의 아미노산 수를 분류기에 입력함으로써 확인된다. 이것은 본원에 기재된 바와 같이, 참조 함수를 분석적으로 푸는 것의 대안이다. 대신, 참조선은 불연속화되어 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 하위단백체, 또는 단백체의 다수의 특이적 단백질 농도에서 신호를 제공할 수 있다. 예를 들어, 50 개의 관심 단백질, 샘플에서 표지되고 측정된 3 개의 아미노산 유형, 및 각 관심 단백질에 대한 100 개의 단백질 농도가 있다. 파라미터 방정식 1 세트는 50 개의 관심 단백질 각각에 대해 사용되어, 3 개의 아미노산 유형 각각의 아미노산 수에 100 개의 단백질 농도를 곱한다. 불연속화된 참조선은 또한 원하는 경우 n 차원 공간에서 시각화될 수 있다. 이 구현예에서, t는 단백질 농도의 1 x 1 x 100 행렬이다. 결과는 50 x 3 x 100 크기인 데이터베이스에 저장된다(행렬은 또한 3 x 50 x 100 행렬, 50 x 100 x 3 행렬, 3 x 100 x 50 행렬, 100 x 50 x 3 행렬, 또는 100 x 3 x 50 행렬로 전치될 수 있음). 50 x 3 x 100 행렬에 대해 3 개의 인덱스가 있으며, i는 관심 단백질인 행렬 행의 인덱스이고, n은 아미노산 유형의 인덱스이고, k는 단백질 농도, t의 인덱스이다. 파라미터 방정식 1 세트는 모든 k = 1:100에 대해 이어서 모든 i = 1:50에 대해 작동함으로써 각 관심 단백질의 각 단백질 농도에 대해 측정된 아미노산 농도를 생성함으로써 이 데이터베이스를 채운다. 각 관심 단백질의 각 단백질 농도는 n 차원 공간, 여기서 3-차원 공간에서 점을 제공한다. 각 단백질 농도에서 각 관심 단백질에 상응하는 점은 (i,:,k)의 인덱스로, 데이터베이스에 저장된다.
K가 1인 K-최근접 이웃(KNN) 분류기와 같은 기계 학습 분류기를 사용하여 샘플 점에 가장 가까운 단일 참조 점(특이적 단백질 농도에서 관심 단백질)을 식별할 수 있다. KNN 분류기는 Euclidean 거리 함수와 같은 다양한 거리 미터법을 사용할 수 있다. KNN 분류기는 샘플이 가장 가까운 참조 점을 결정하며; 관심 단백질은 이 참조 점의 인덱스, i로 식별되고 단백질 식별은 이 참조 점에서 인덱스, k로 식별된다. 예를 들어, 샘플이 인덱스 i = 20, k = 40인 참조 점에 가장 가까우면, 샘플은 40번째 단백질 농도에서 20번째 관심 단백질로 식별된다. 그러나, 이 방법은 이미 기재된 분석적으로 푸는 방법보다 더 많은 양의 데이터를 생성하고 관심 단백질의 단백질 농도에 대한 정확한 해를 제공하지 않는다.
일부 구현예에서, 샘플에서 각 표지된 아미노산 유형의 측정된 표지, 각 표지된 아미노산 유형의 아미노산 수 및/또는 각 표지된 아미노산 유형의 농도는 단백질 식별 및 정량화를 구현하기 위해 분류기에 입력된다. 바람직하게는, 분류기는 또한 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물에서 동일한 2 개 이상의 아미노산 유형의 표지, 아미노산 수 및/또는 농도를 함유하여, 이에 의해 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 존재 및/또는 농도 또는 양을 식별한다. 분류기는 샘플에서 각 표지된 아미노산 유형의 측정된 표지, 각 표지된 아미노산 유형의 아미노산 수 및/또는 각 표지된 아미노산 유형의 농도를 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물에서 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 수 및/또는 농도를 비교하여, 이에 의해 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 존재 및/또는 양을 식별한다. 일부 구현예에서, 분류기는 더 큰 실험상의 오류가 있는 차원이 적은 실험상의 오류가 있는 차원보다 식별에서 더 적은 가중치를 부여받을 수 있도록 정보의 각 차원에 따라 직면하는 실험상의 오류를 고려한다. 일부 구현예에서, 10% 무작위 노이즈가 분류기에 삽입된다.
일부 구현예에서, 분류기는 서포트 벡터 머신(Support Vector Machine)이다. 서포트 벡터 머신은 상이한 클래스의 데이터포인트를 분리하면서 상이한 클래스의 데이터포인트 사이의 최대 분리를 달성하는 초평면(hyperplane)을 구한다. 일부 구현예에서, 분류기는 기계 학습 분류기이다. 일부 구현예에서, 분류기는 K-최근접 이웃 분류기이다. K-최근접 이웃 분류기는 K 최근접 이웃에 기반한 점의 클래스를 결정한다. 일부 구현예에서, 분류기는 앙상블(Ensemble) 분류기이다. 앙상블은 예측을 향상시키는 방식으로 상이한 하위공간에 대한 결과를 조합한다. 일부 구현예에서, 앙상블 분류기는 앙상블 하위공간 K-최근접 이웃 분류기이다. 바람직하게는, 분류기는 누락(Not a Number: NaN) 값을 혼입할 수 있다.
일부 구현예에서, 분류기는 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 또는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 하위단백체, 또는 단백체의 혼합물의 알려진 아미노산 서열로부터 아미노산 수, 아미노산 농도 또는 신호에 대해 훈련되어, 이에 의해 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체, 또는, 관심 단백질, 펩티드, 폴리펩티드 또는 올리고펩티드, 하위단백체 또는 단백체의 혼합물의 존재 및/또는 양을 식별한다. 일부 구현예에서, 분류기는 파라미터 방정식 1, 2, 3 또는 4 세트로부터 이산 출력(discrete output)의 서브세트에 대해 훈련되었다. 일부 구현예에서, 분류기는 UniProt 내에서 찾은 알려진 아미노산 서열로부터 계산된 알려진 값을 갖는다. 일부 구현예에서, 분류기는 데이터의 75%에 대해 훈련되었고 데이터의 나머지 25%는 검증을 위해 보류된다.
암의 검출 방법
본원에 개시된 방법은 샘플에서 다수의 유형의 암, 예를 들어; 췌장암, 인간 신경교종, 두경부암, 갑상선암, 폐암, 간암, 고환암, 전립선암, 위암, 결장/직장 암, 유방암, 자궁내막암, 난소암, 자궁경부암, 신장암, 비뇨기 및 방광암, 인간 흑색종, 뇌암, 자궁내막암, 백혈병, 요로상피암 및 이의 임의의 조합의 존재 및 부재를 식별하는 데 사용될 수 있다. 바람직한 구현예에서, 본원에 개시된 방법은 난소암, 췌장암, 결장직장암 또는 전립선암; 및 이의 임의의 조합 중 하나 이상의 존재 및 부재를 식별하는 데 사용될 수 있다. 이것은 상이한 유형의 암이 2 개 이상의 아미노산 유형 각각의 표지 값, 아미노산 농도 또는 아미노산 수에 기반하여 고유한 단백체 서명을 가지고 있기 때문이다. 따라서, 샘플에서 2 개 이상의 아미노산 유형 각각의 표지 값, 아미노산 농도 또는 아미노산 수는 알려진 암의 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수와 비교하여 샘플에서 이러한 암의 존재 및 양을 결정할 수 있다. 예를 들어, 본원에 개시된 방법은 100% 민감도 및 100% 특이성으로 혈장에서 난소암, 췌장암, 및 결장직장암의 존재를 결정하는 데 사용될 수 있다. 추가로, 본원에 개시된 방법은 100% 민감도 및 100% 특이성으로 소변에서 방광암, 전립선암, 및 신암의 존재를 결정하는 데 사용될 수 있다. 본원에 개시된 방법은 추가로 결장직장암 병기의 검출을 위한 최대 78% 민감도 및 결장직장암의 위치를 결정하기 위한 최대 100% 양성 예측 값으로 결장직장암의 병기 및 위치를 결정하는 데 사용될 수 있다.
관심 질환 하위단백체의 식별이 논의되는 경우, 이것은 또한 관심 질환 연관 단백체의 식별을 지칭하고 반대의 경우도 마찬가지이다.
바람직한 구현예에서, 샘플에서 암의 양은 샘플에서 암의 병기를 지칭한다. 암의 병기는 예를 들어 0기, I기, II기, III기, IV기로 수치로 설명될 수 있다. 0기는 비정상 세포가 존재하는 전암성 상태인 제자리 암종을 설명한다. I기 암은 작은 영역, 예를 들어 20 mm 미만 영역에서 다른 조직으로 전이된 암을 설명한다. II기 암은 국소로 전이된 암을 설명하며; 암은 예를 들어 림프절 침습이 있는 20-50 mm 영역 또는 림프절 침습이 없는 50 mm 초과 영역으로 더 많이 전이되었다. III기 암은 국부적으로 전이된 암을 설명하며; 암은 미만성 림프절 침습이 있는 50 mm 초과 영역으로 전이되었다. IV기 암은 멀리 전이된 암을 설명하며; 암은 신체의 적어도 하나의 다른 기관으로 전이되었다. 대안적으로, 병기는 T1, T2, T3, T4, N0, N1, N2, N3, M0 또는 M1과 같이, 종양(Tumor), 절(Node), 및 전이(Metastasis)에 대한 값을 제공하는 TNM 병기 시스템을 사용하여 결정될 수 있다. 본원에 사용된 바와 같이, 용어 "초기"는 암의 I기 및 II기를 지칭하고, "말기"는 암의 III기 및 IV기를 지칭한다. 용어 "초기"는 추가로 TNM 병기 시스템 내에서 1 및 2의 T 값, 0 및 1의 N 값, 및 0의 M 값을 지칭한다. TNM 값 중 하나가 제공된 컷오프 점보다 높으면, 이것은 본원에 개시된 방법에서 말기 암으로 간주된다. 예를 들어, T2N1M0은 초기 암이다. 또 다른 예로서, T1N0M0은 초기 암이다. 또 다른 예로서, T3N3M1은 말기 암이다. 추가 예로서, T2N3M1은 말기 암이다.  
바람직한 구현예에서, 샘플에서 암의 양은 암이 초기(I기 또는 II기) 또는 말기(III기 또는 IV기)인지 지칭한다.
바람직한 구현예에서, 샘플에서 암의 양은 암의 등급을 지칭한다. 암에는 1등급, 2등급, 및 3등급의 3 가지 등급이 있다. 1등급 암은 정상 조직과 유사하게 잘 분화된 암으로 구성되고 서서히 성장하고 전이될 가능성이 있다. 3등급 암은 잘 분화되지 않고, 정상 구조 및 조직 패턴이 결여된 세포로 구성되고 공격적으로 성장하고 전이될 가능성이 있다. 2등급 암은 1등급 암과 3등급 암 사이의 중간 등급이다. 암의 등급은 일반적으로 정성적으로 결정되지만, 일부 구현예에서 샘플에서 암의 양은 반-정량적으로 또는 정량적으로 결정된 암의 등급을 지칭한다. 본 발명의 방법에서, 1등급 암은 초기 암으로 간주된다(https://www.cancerresearchuk.org/about-cancer/what-is-cancer/cancer-grading 및 https://www.cancerresearchuk.org/about-cancer/what-is-cancer/stages-of-cancer).
본 발명의 방법은 2 개 이상의 아미노산 유형이 환자 샘플 내에서 표지될 때마다 하나 이상의 유형의 암의 존재 및 부재를 검출하는 데 사용될 수 있으며, 표지 값이 측정되고 임의적으로 측정된 표지로부터 각 표지된 아미노산 유형의 아미노산 농도로 전환되고/되거나 임의적으로 환자 샘플 내의 각 표지된 아미노산 유형의 아미노산 수를 계산하고, 하나 이상의 관심 암 하위단백체 또는 단백체의 존재 및/또는 부재는 샘플에서 각 표지된 아미노산 유형의 측정된 표지 및/또는 아미노산 농도를 하나 이상의 농도에서 하나 이상의 관심 건강한 또는 암 하위단백체 또는 단백체 각각의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도와 비교하거나, 샘플에서 각 표지된 아미노산 유형의 아미노산 수를 하나 이상의 관심 건강한 또는 암 하위단백체 또는 단백체 내의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 아미노산 수와 비교함으로써 샘플에서 식별된다.
일부 구현예에서, 암과 관련된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도는 본원에 개시된 바와 같은 방법을 사용하여 실험적으로 결정되거나, 암과 관련된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 내의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 아미노산 수는 본원에 개시된 방법을 사용하여 실험적으로 결정된다.
일부 구현예에서, 비교 단계에서, 하나 이상의 관심 건강한 또는 암 단백체 또는 하위단백체 각각의 존재 및/또는 농도 및/또는 양을 식별하는 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 및/또는 아미노산 농도, 및/또는 아미노산 수를 나타내는 정보는 참조이다.
일부 구현예에서, 암과 관련된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도 및/또는 아미노산 수는 참조이고, 참조는 본원에 개시된 방법을 사용하여 실험적으로 결정된다. 일부 구현예에서, 암과 관련된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도 및/또는 아미노산 수는 단일 참조이고 본원에 개시된 방법을 사용하여 실험적으로 결정된다.
참조는 데이터베이스로, 또는 데이터베이스에서 수행된 작업으로 제공될 수 있거나, 참조는 하나 이상의 총 단백질 농도에서 하나 이상의 관심 건강한 또는 암 하위단백체 또는 단백체에 대해 측정될 값을 제공하는 함수, 방정식, 함수 세트, 또는 방정식 세트를 사용하여 분석적으로 제공될 수 있다. 일부 구현예에서, 이들 함수는 벡터 함수 1-4 또는 파라미터 방정식 1-4 세트에 제공된 예와 같은 벡터 함수 또는 파라미터 방정식 세트, 또는 임의의 관심 암 또는 건강한 하위단백체 또는 단백체의 총 농도에 대한 한계 범위를 포함하고, N-차원 공간에서 다양한 점을 통과하는 그들의 임의의 변이이다. 대안적으로, 다른 구현예에서, 이들 함수, 방정식, 또는 방정식 세트는 멱함수 방정식, 지수 방정식, 다항식 방정식, 계단 함수 방정식을 포함하나 이에 제한되지 않는 임의의 형태의 비선형 방정식일 수 있다. 다른 구현예에서, 이들 함수 방정식 또는 함수 또는 방정식의 세트는 임의의 관심 암 또는 건강한 하위단백체 또는 단백체에 대해 측정되거나 측정될 값을 식별하는 표면 또는 부피를 기재할 수 있다.
비교 단계는 예를 들어 소변, 타액, 또는 혈청과 같은, 하나 이상의 관심 체액에서 측정된 관심 암 또는 건강한 단백체 또는 하위단백체에 대한 참조를 정의하는 함수, 방정식, 함수 세트, 또는 방정식 세트와 샘플 점 또는 샘플 점들 사이의 최소 거리를 구함으로써, 이들 함수, 방정식, 함수 세트, 또는 방정식 세트에 대한 참조로 분석적으로 수행될 수 있다. 비교 단계는 임의의 가설 테스트를 혼입할 수 있다.
대안적으로 또는 추가로, 비교 단계는 측정된 샘플을 관심 암 또는 건강한 하위단백체 또는 단백체에 상응하는 것으로 식별하기 위해 본원에 개시된 바와 같은 기계 학습 분류기와 같은 기계 학습 접근법을 혼입할 수 있다. 예를 들어 베이지안(Bayesian) 업데이트와 같은 당업계에 알려진 임의의 가설 업데이트 접근법 또는 예측-평가-보정-평가(Predict-Evaluate-Correct-Evaluate: PECE)와 같은 예측자 보정자 접근법을 통해 단독으로, 조합하여, 또는 최적화 또는 비최적화되거나, 정제된 임의의 기계 학습 분류기가 사용될 수 있다.
본원에 개시된 본 발명의 방법은 환자 체액 내에서 2 개 이상의 표지된 아미노산 유형의 측정을 통해 다중(즉, 2 개 이상, 3 개 초과, 4 개 초과, 5 개 초과, 6 개 초과, 7 개 초과, 8 개 초과, 9 개 초과 또는 10 개 초과, 11 개 초과, 12 개 초과, 13 개 초과, 14 개 초과, 15 개 초과, 16 개 초과, 17 개 초과, 18 개 초과, 19 개 초과, 20 개 초과, 21 개 초과, 22 개 초과, 23 개 초과, 24 개 초과, 25 개 초과, 26 개 초과, 27 개 초과, 28 개 초과, 29 개 초과, 30 개 초과, 또는, 2, 3, 4, 5, 6, 7, 8, 9 또는 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30 개) 유형의 암의 존재, 병기, 및 위치를 검출하는 데 사용될 수 있다. 바람직한 구현예에서, 난소암, 췌장암, 결장직장암, 방광암, 전립선암, 신암, 뇌암, 신경교종, 두경부암, 갑상선암, 폐암, 간암, 고환암, 위암, 유방암, 자궁내막암, 자궁경부암, 신장암, 흑색종, 백혈병, 소아 백혈병, 및 림프종으로부터 선택된 암 유형의 존재 및/또는 부재 및/또는 병기가 결정된다. 바람직한 구현예에서, 본 발명의 방법은 환자 혈장 또는 환자 소변으로부터 2 개 이상의 유형의 암의 존재 및/또는 부재 및/또는 병기를 검출하는 액체 생검 테스트로 사용된다. 일부 구현예에서, 다수의 환자 체액으로부터의 샘플은 암 진단 및 병기를 제공하기 위해 본 발명의 방법에 따라 측정되고 식별될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 난소암을 앓는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 난소암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 난소암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 난소암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 췌장암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 췌장암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 췌장암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 췌장암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 결장직장암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 결장직장암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 결장직장암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 결장직장암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 건강한 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 건강한 인간 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 건강한 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 건강한 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 전립선암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 전립선암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 전립선암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 전립선암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 방광암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 방광암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 방광암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 방광암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 신암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 신암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 신암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 신암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 백혈병을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 백혈병 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 백혈병 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 백혈병 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 흑색종을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 흑색종 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 흑색종 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 흑색종 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 신경교종을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 신경교종 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 신경교종 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 신경교종 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 림프종을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 림프종 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 림프종 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 림프종 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 위암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 위암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 위암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 위암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 폐암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 폐암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 폐암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 폐암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 뇌암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 뇌암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 뇌암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 뇌암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 유방암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 유방암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 유방암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 유방암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 두경부암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 두경부암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 두경부암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 두경부암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 갑상선암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 갑상선암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 갑상선암 단백체 및/또는 하위단백체의 존재 또는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 갑상선암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 자궁내막암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 자궁내막암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 자궁내막암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 자궁내막암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 요로상피암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 요로상피암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 요로상피암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 요로상피암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 난소암을 앓고 있는 인간의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 초기 난소암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 난소암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 난소암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 췌장암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 초기 췌장암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 췌장암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 췌장암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 결장직장암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 초기 결장직장암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 결장직장암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 결장직장암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 전립선암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 초기 전립선암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 전립선암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 전립선암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 방광암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 초기 방광암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 방광암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 방광암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 신암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 초기 신암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 신암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 신암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 백혈병을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 초기 백혈병 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 백혈병 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 백혈병 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 흑색종을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 초기 흑색종 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 흑색종 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 흑색종 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 신경교종을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 초기 신경교종 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 신경교종 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 신경교종 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 림프종을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 인간 관심 초기 림프종 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 림프종 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 림프종 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 위암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 초기 위암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 위암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 위암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 폐암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 초기 폐암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 폐암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 폐암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 뇌암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 초기 뇌암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 뇌암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 뇌암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 유방암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 초기 유방암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 유방암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 유방암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 두경부암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 초기 두경부암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 두경부암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 두경부암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 갑상선암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 초기 갑상선암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 갑상선암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 갑상선암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 자궁내막암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 초기 자궁내막암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 자궁내막암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 자궁내막암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 초기 요로상피암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 초기 요로상피암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 초기 요로상피암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 초기 요로상피암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 난소암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 난소암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 난소암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 난소암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 췌장암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 췌장암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 췌장암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 췌장암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 결장직장암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 결장직장암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 결장직장암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 결장직장암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 전립선암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 전립선암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 전립선암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 전립선암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 방광암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 방광암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 방광암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 방광암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 신암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 신암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 신암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 신암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 백혈병을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 백혈병 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 백혈병 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 백혈병 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 흑색종을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 흑색종 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 흑색종 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 흑색종 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 신경교종을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 신경교종 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 신경교종 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 신경교종 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 림프종을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 림프종 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 림프종 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 림프종 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 위암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 위암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 위암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 위암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 폐암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 폐암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 폐암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 폐암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 뇌암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 뇌암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 뇌암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 뇌암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 유방암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 유방암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 유방암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 유방암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 두경부암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 두경부암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 두경부암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 두경부암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 갑상선암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 갑상선암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 갑상선암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 갑상선암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 자궁내막암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 자궁내막암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 자궁내막암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 자궁내막암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
일부 구현예에서, 관심 단백체 및/또는 하위단백체는 말기 요로상피암을 앓고 있는 인간 대상체의 샘플로부터 유래한다. 일부 구현예에서, 활용되는 샘플은 인간 혈장이고, 이의 인간 혈장 단백체, 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 관심 단백체는 인간 혈소판 부족 혈장(PPP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 부족 혈장(PPP_50) 하위단백체이다. 일부 구현예에서, 관심 단백체는 혈소판 풍부 혈장(PRP) 단백체이다. 일부 구현예에서, 관심 하위단백체는 인간 여과된 혈소판 풍부 혈장(PRP_50) 하위단백체이다. 일부 구현예에서, 활용되는 샘플은 인간 혈청이고, 이의 인간 혈청 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 가래이고, 이의 인간 가래 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 대변이고, 이의 인간 대변 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 뇌척수액이고, 이의 인간 뇌척수액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 땀이고, 이의 인간 땀 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 소변이고, 이의 인간 소변 단백체 또는 하위단백체일 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 타액이고, 이의 인간 타액 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 다수의 상이한 단백체 및/또는 하위단백체 샘플 유형은 관심 인간 말기 요로상피암 단백체 및/또는 하위단백체에 대한 참조를 제공할 수 있고, 이들 상이한 단백체 및/또는 하위단백체 샘플 유형 각각은 주어진 환자에 대해 측정될 수 있고, 관심 말기 요로상피암 단백체 및/또는 하위단백체의 존재 또는 부재는 측정된 표지 값, 아미노산 농도, 또는 아미노산 수와 관심 말기 요로상피암 단백체 및/또는 하위단백체에 대한 참조 표지 값, 아미노산 농도, 또는 아미노산 수의 비교에 기반하여 식별될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 자궁경관 점액 또는 인간 월경 분비물이고, 이의 인간 자궁경관 점액 단백체 또는 하위단백체, 또는 이의 인간 월경 분비물 단백체 또는 하위단백체가 활용될 수 있다. 일부 구현예에서, 활용되는 샘플은 인간 양수이고, 인간 양수 단백체 또는 하위단백체가 활용될 수 있다.
바람직한 구현예에서, 샘플은 혈장 샘플이다. 바람직한 구현예에서, 샘플은 소변 샘플이다.
일부 구현예에서, 본원에 개시된 방법은 샘플에서 암의 병기를 식별하는 데 사용될 수 있다. 예를 들어, 본원에 개시된 방법은 샘플에 존재하는 암이 I기, II기, III기 또는 IV기인지 식별하는 데 사용될 수 있다. 이것은 암의 각 병기에 고유한 단백체 서명이 있기 때문이다.
일부 구현예에서, 본원에 개시된 방법은 암의 유형 및 병기를 둘 다 식별하는 데 사용될 수 있다. 예를 들어, 본 발명의 방법은 결장직장암의 존재 및 초기(II기)인지 말기(III기)인지 식별하는 데 사용될 수 있다.
일부 구현예에서, 본원에 개시된 방법은 암의 위치를 검출하는 데 사용될 수 있다. 예를 들어, 일부 구현예에서, 방법은 결장직장암의 위치를 검출하는 데 사용될 수 있다. 예를 들어, 본원에 개시된 방법은 종양이 혈장 단백체 서명에 기반하여 환자의 왼쪽 결장 또는 직장이 아닌 환자의 오른쪽 결장에 특이적으로 위치한다는 것을 식별하는 데 사용될 수 있다. 이것은 상이한 유형의 암이 2 개 이상의 아미노산 유형 각각의 표지 값, 아미노산 농도 또는 아미노산 수에 기반한 고유한 단백체 서명을 가지고 있기 때문이다. 이것은 암의 위치가 고유한 단백체 서명을 갖고 있기 때문이다.
일부 구현예에서, 참조는 각 관심 단백체(예를 들어 건강한 환자 혈소판 부족 혈장(PPP) 샘플, 난소암 혈장 샘플, 췌장암 혈장 샘플, 결장직장암 혈장 샘플)이다. 일부 구현예에서, 참조는 인간 단백질 아틀라스, 인간 펩티드 아틀라스 및/또는 Proteome Xchange로부터의 데이터를 사용하여 실험적으로 결정된다.
일부 구현예에서, 본원에 개시된 방법의 비교 단계는 기계 학습 분류기를 활용한다. 기계 학습 분류기는 암의 유형, 병기 및/또는 위치를 확인한다. 일부 구현예에서, 기계 학습 분류기는 선형 서포트 벡터 머신(SVM)이다.
일부 구현예에서, 본원에 개시된 방법은 액체 생검 샘플에서 암의 존재, 유형, 병기 및 위치를 검출하는 데 사용될 수 있다.
본 명세서 및 청구범위에서 사용되는 경우, 용어 "포함한다" 및 "포함하는" 및 이의 변형은 명시된 특징, 단계 또는 정수가 포함됨을 의미한다. 용어는 다른 특징, 단계 또는 구성요소의 존재를 배제하는 것으로 해석되지 않는다.
개시된 기능을 수행하기 위한 수단, 또는 적절한 경우, 개시된 결과를 획득하기 위한 방법 또는 과정의 측면에서, 또는 이들의 특이적 형태로 표현되는, 전술한 설명, 또는 하기 청구범위, 또는 첨부된 도면에 개시된 특징은 별도로, 또는 이러한 특징의 임의의 조합으로, 본 발명을 이의 다양한 형태로 실현하기 위해 활용될 수 있다.
본 발명의 특정 예시적 구현예가 기재되었지만, 첨부된 청구범위의 범위는 이들 구현예에만 제한되는 것으로 의도되지 않는다. 청구범위는 문자 그대로, 목적적으로, 및/또는 등가물을 포함하는 것으로 해석되어야 한다.
작업 실시예
본 발명은 하기 실시예에서 추가로 기재되며, 이는 청구범위에 기재된 본 발명의 범위를 제한하지 않는다.
실시예 1
2 개 이상의 아미노산 유형 표지화
아미노산 유형 시스테인(C)의 아미노산을 pH 7에서 5 mM HEPES 완충액 중 10 mM 트리스(2-카르복시에틸)포스핀(TCEP), 이어서 pH 10.5에서 80 mM 나트륨 카보네이트 완충액 중 5 mM 4-플루오로-7-술파모일벤조푸라잔(ABD-F), 4% 나트륨 도데실 술페이트(SDS)로 표지하였다.
아미노산 유형 환원된 시스테인(CR)의 아미노산을 pH 10.5에서 80 mM 나트륨 카보네이트 완충액 중 5 mM 4-플루오로-7-술파모일벤조푸라잔(ABD-F), 4% 나트륨 도데실 술페이트(SDS)로 표지하였다.
아미노산 유형 트립토판(W)의 아미노산을 pH 7에서 5 mM HEPES 중 0.2 M 트리클로로에탄올(TCE), 10 mM TCEP, 4% SDS로 표지하였다.
아미노산 유형 리신(K)의 아미노산을 pH 10.5에서 200 mM 나트륨 카보네이트 완충액 중 12 mM 오르토-프탈알데하이드(OPA), 18 mM 베타-머캅토에탄올(BME), 4% SDS로 표지하였다.
형광생성 표지화 반응 각각의 화학적 메커니즘은 도 16에 제시되어 있다.
표지화 용액을 빛으로부터 보호하고 -20℃에서 보관된 ABD-F 및 TCEP 용액을 제외하고 4℃에서 보관하였다.
단백질 용액
하기 단백질 용액을 제조하였다:
소 혈청 알부민(BSA): pH.7에서 5 mM HEPES 완충액 중 1 BSA
오브알부민(OVA): pH 7에서 5 mM HEPES 완충액 중 2 μM OVA
베타-락토글로불린(β-Lac, 베타-Lac): pH 7에서 5 mM HEPES 완충액 중 4 μM β-Lac
리소자임(LYZ): pH 7에서 5 mM HEPES 완충액 중 5 μM LYZ
하기 혼합 단백질 용액을 1:1 비율로 제조하였다:
50 μL 1 μM BSA + 50 μL 2 μM 베타-락토글로불린
형광 강도 측정
반응은 BMG 플레이트 판독기를 사용하여 수행하였다. 웰 당 100 μL 단백질 용액을 함유하는, UV 투과성(Corning 3370) 96웰 플레이트를 사용하였다. 모든 경우에, 1:1 희석을 위해(상기 나열된 최종 단백질 농도로) 100 μL 염료 용액을 단백질 용액에 첨가하였다. CR 아미노산 유형은 일반적으로 C 아미노산 유형보다 유의하게 더 낮은 신호를 제공하기 때문에, CR 아미노산 유형의 측정을 위한 이득 설정을 C 아미노산 유형의 측정을 위한 이득 설정의 2 배로 설정하였다.
트립토판 변형 반응을 위해, 100 μL의 트립토판 표지화 용액을 각 단백질 용액(또한 100 μL)에 첨가하였다. UV 광을 30분 동안 조사하여 반응을 광촉매화하였다. 약 320 nm에서 집중된 광범위한 스펙트럼 UV 광을 사용하였다. 30분 조사 후, 350-10 및 480-10 여기 및 방출 필터를 사용하여 형광을 측정함으로써 새로 형성된 형광단의 형광을 결정하였다.
리신 반응을 위해, 샘플 및 염료 용액을 혼합한 후 신속하게 형광을 측정하였다. 최적 결과를 제공하기 위해 시약 혼합 후 3초에 형광을 측정하였다.
시스테인 반응을 위해, 10 mM의 총 TCEP 농도가 되도록, 1 μL의 1 mM TCEP 스톡 용액을 각 100 μL 단백질 웰에 첨가하였다. 이황화 결합된 시스테인 아미노산 유형의 아미노산의 TCEP 환원이 이들 아미노산이 형광생성 염료에 의해 변형되기 전에 완료에 도달하도록 30분 동안 빛으로부터 보호하면서, 반응을 진행시켰다. 100 μL의 시스테인 염료 용액(환원된 시스테인 염료 용액과 동일)을 염료가 완충액에 첨가된 3 개의 대조군 웰과 함께, 각 웰에 첨가하였다. 웰 내의 반응물을 45-분 인큐베이션 시간 동안 빛으로부터 보호한 다음, 350-10 및 480-10 여기 및 방출 필터를 사용하여 형광을 판독하였다.
환원된 시스테인 반응을 위해, 100 μL의 환원된 시스테인 염료 용액을 염료가 완충액에 첨가된 3 개의 대조군 웰과 함께, 각 웰에 첨가하였다. 웰 내의 반응물을 45-분 인큐베이션 시간 동안 빛으로부터 보호한 다음, 350-10 및 480-10 여기 및 방출 필터를 사용하여 형광을 판독하였다.
배경 보정
임의적으로, 형광 배경은 샘플의 형광 강도에서 뺄 수 있다. 형광 배경을 계산하기 위해, 염료 용액을 단백질이 아닌 동일한 양의 완충액과 합하고, 형광 배경을 계산하기 위해 형광 강도 측정 하위섹션 하에 제공된 파라미터를 사용하여 형광 강도를 측정하였다. 예를 들어, 하기 형광 배경을 측정하였다:
C = 2177.5; W = 20632; CR = 9899
형광 배경을 샘플의 측정된 형광에서 빼서 "배경 보정된" 형광 강도를 생성할 수 있다.
교정 곡선 또는 표준
교정 곡선 또는 표준은 알려지지 않은 것을 알려진 농도의 표준 샘플의 세트, 또는 하나의 표준 샘플과 비교하여 알려지지 않은 샘플에서 물질의 농도를 결정하는 일반적인 방법이다. 알려진 아미노산 농도의 단백질의 형광 강도를 측정하여, 각 표지된 아미노산 유형에 대한 교정 곡선을 계산하였다. 이것은 임의 단위(AU)로 측정된 형광 강도와 아미노산 농도 사이의 관계를 확립한다. 또한 알려진 아미노산 농도의 단백질의 형광 강도를 측정하여 각 표지된 아미노산 유형에 대한 표준을 계산하였다. 교정 곡선 또는 표준을 샘플이 측정되는 각 실험의 부분을 포함하기 보다는, 수행된 모든 실험을 포괄하는 각 아미노산 유형에 대해 1 회 측정하였다.
각 경우에, 측정된 형광 강도를 각 아미노산 유형의 알려진 아미노산 농도의 함수로 플롯팅하였다.
측정된 데이터는 선형이었다. 선형 최소 제곱 맞춤을 수행하여, 교정 곡선에 대해 하기 최적 맞춤 방정식을 생성하였다:
Figure pct00328
방정식 1-3은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체에 대한 각 아미노산 유형의 아미노산(A.A.) 농도를 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체에 대한 각 아미노산 유형의 알려진 표지 값으로 전환시켰다.
C 아미노산 유형의 경우, 교정 계수를 최적 맞춤 선의 기울기로 결정하였다:
Figure pct00329
CR 아미노산 유형의 경우, 교정 계수를 최적 맞춤 선의 기울기로 결정하였다:
Figure pct00330
W 아미노산 유형의 경우, 교정 계수를 최적 맞춤 선의 기울기 + 최적 맞춤 선의 y-절편으로 결정하였다.
Figure pct00331
이것은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에서 W 아미노산 유형의 아미노산 농도가 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 W 아미노산 유형의 상응하는 알려진 표지 값으로 전환된 경우, W 아미노산 농도에 2362를 곱한 다음, 9859를 더하였음을 의미한다. 9859를 더한 것은 W 아미노산 농도와 무관하였다.
교정 곡선의 역수는 하기 역 최적 맞춤 방정식을 제공하였다:
Figure pct00332
방정식 4-6은 각 아미노산 유형에 대한 표지의 측정된 신호(형광 강도, AU)를 샘플에서 상응하는 아미노산 유형의 아미노산(A.A.) 농도로 전환시켰다.
C 아미노산 유형의 경우, 교정 계수를 선의 기울기로 결정하였다:
Figure pct00333
CR 아미노산 유형의 경우, 교정 계수를 선의 기울기로 결정하였다:
Figure pct00334
W 아미노산 유형의 경우, 교정 계수를 선의 기울기 + 선의 y-절편으로 결정하였다:
Figure pct00335
이것은 W 아미노산 유형의 아미노산 농도에 2362를 곱한 다음, 9859를 더하여 W 아미노산 유형에 대한 알려진 표지 값을 제공함을 의미한다.
표준은 대안적으로 각 아미노산 유형에 대해 계산될 수 있다. 이 경우, 알려진 아미노산 농도의 단일 단백질의 형광 강도를 사용하여 해당 아미노산 유형에 대한 아미노산 농도와 형광 강도 사이의 관계를 확립하였다. 예를 들어, K 아미노산 유형에 대한 표준을 측정하였다.
120 μM K 아미노산 농도(칼모듈린)을 함유하는 표준 용액은 86390 AU의 형광-강도를 가졌다. 따라서, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 단백체에서 아미노산 유형 K에 대한 알려진 표지 값은
Figure pct00336
이며 교정 계수
Figure pct00337
및 역 교정 계수
Figure pct00338
를 제공한다.
참조
본원에 개시된 바와 같이, 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대한 참조를 벡터 함수(또는 파라미터 방정식 세트)를 통해 단백질 농도의 함수로서 제공하였다. 벡터 함수 1을 샘플의 값이 2 개 이상의 표지된 아미노산 유형의 아미노산 농도인 관심 단백질에 대해 사용하였고, 벡터 함수 2를 샘플의 값이 2 개 이상의 표지된 아미노산 유형의 아미노산 농도인 관심 단백체에 대해 사용하였다. 벡터 함수 3을 샘플의 값이 2 개 이상의 표지된 아미노산 유형의 측정된 표지 값인 경우 관심 단백질에 대해 사용하였고, 벡터 함수 4를 샘플의 값이 2 개 이상의 표지된 아미노산 유형의 측정된 표지 값인 경우 관심 단백체에 대해 사용하였다.
각 벡터 함수(파라미터 방정식 세트와 동등)가 여기에 완전히 기재되어 있고, 벡터 함수는 아래에 제현되어 있다:
벡터 함수 1은 다음과 같다:
Figure pct00339
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대해 농도 t의 함수로서 제공된 아미노산 농도이고, <0,0,…0>은 원점이고, a 1 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 1의 아미노산 수이고, a 2 는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 2의 아미노산 수이고, a n 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이고, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된(
Figure pct00340
) 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체의 총 몰 농도이다. 대안적인 구현예에서, t는 농도 범위의 하한(c 1 ) 및 상한(c 2 ) 사이에 제공되고(
Figure pct00341
), 벡터는 농도 범위의 하한의 아미노 농도에서 시작한다, <a 1 c 1 , a 2 c 1 ,…, a n c 1 >.
벡터 함수 2는 다음과 같다:
Figure pct00342
여기서 p i 는 관심 단백체 또는 하위단백체 i에 대해 단백체 또는 하위단백체의 농도, t의 함수로서 제공된 아미노산 농도이고, <0,0,…,0>은 원점이고, w 1 은 관심 단백체 또는 하위단백체에서 아미노산 유형 1의 아미노산의 가중 평균 수이고, w 2 는 관심 단백체 또는 하위단백체에서 아미노산 유형 2의 아미노산의 가중 평균 수이고, w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산 수이고, t는 단백체 또는 하위단백체 농도이다(여기서 단백체 또는 하위단백체 농도는 관심 단백체 또는 하위단백체를 포함하는 모든 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체 p i 의 총 몰 또는 질량 농도임). 일부 구현예에서, 단백체 또는 하위단백체 농도 t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된다.
벡터 함수 3은 다음과 같다:
Figure pct00343
여기서 p i 는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 i에 대해 농도 t의 함수로서 제공된 알려진 표지 값이고, b 1 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 1에 대한 배경 값이고, b 2 는 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 2에 대한 배경 값이고, b n 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 n에 대한 배경 값이고, a 1 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 산 유형 1의 아미노산 수이고, a 2 는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 2의 아미노산 수이고, a n 은 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체에서 아미노산 유형 n의 아미노산 수이고, f 1 은 아미노산 유형 1에 대한 교정 함수 또는 교정 계수이고, f 2 는 아미노산 유형 2에 대한 교정 함수 또는 교정 계수이고, f n 은 아미노산 유형 n에 대한 교정 함수 또는 교정 계수이고, t는 관심 단백질, 펩티드, 폴리펩티드, 올리고펩티드, 또는 단백질 복합체의 몰 단백질 농도이다. 일부 구현예에서, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된다(
Figure pct00344
). 대안적인 구현예에서, t는 농도 범위의 하한(c 1 ) 및 상한(c 2 ) 사이에 제공되고(
Figure pct00345
), 벡터는 농도 범위의 하한의 표지 값에서 시작한다, <a 1 f 1 c 1 , a 2 f 2 c 1 , … a n f n c 1 >.
벡터 함수 4는 다음과 같다:
Figure pct00346
여기서 p i 는 관심 단백체 또는 하위단백체 i에 대해 농도 t의 함수로서 제공된 알려진 표지 값이고, b 1 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 1에 대한 배경 값이고, b 2 는 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 2에 대한 배경 값이고, b n 은 샘플에서 측정된 표지 값이 배경-보정된 경우 0인 아미노산 유형 n에 대한 배경 값이고, w 1 은 관심 단백체 또는 하위단백체에서 아미노산 유형 1의 아미노산의 가중 평균 수이고, w 2 는 관심 단백체 또는 하위단백체에서 아미노산 유형 2의 아미노산의 가중 평균 수이고, w n 은 관심 단백체 또는 하위단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, f 1 은 아미노산 유형 1에 대한 교정 함수 또는 교정 계수이고, f 2 는 아미노산 유형 2에 대한 교정 함수 또는 교정 계수이고, f n 은 아미노산 유형 n에 대한 교정 함수 또는 교정 계수이고, t는 관심 단백체 또는 하위단백체의 몰 농도이다. 일부 구현예에서, t는 0보다 더 크거나 같은 t의 모든 값에 대해 정의된다.
관심 단백질 내에서 아미노산 유형의 아미노산 수는 관심 단백질의 아미노산 서열 또는 서열들 내의 해당 아미노산의 발생 수에서 아미노산 유형이 표지와 반응하는 것을 방지할 해당 아미노산 유형의 번역 후 변형의 수를 뺀 값으로 계산하였다. 예를 들어, C 아미노산 유형의 경우, 아미노산 수는 비변형된(CR) 아미노산의 수인 데, C 아미노산 유형의 이황화 결합된 아미노산이 표지와 반응하지 않기 때문이다. 그러나, 변형된 아미노산은 표지와 반응하기 전에 시스테인 이황화(CD) 아미노산을 TCEP와 함께 환원된(CR) 아미노산으로 전환하는 것과 같이, 표지와의 반응에 이용가능한 비변형된 아미노산으로 전환될 수 있다. 따라서, TCEP를 포함하는 C 아미노산 유형 표지화 반응의 경우, 이황화 결합에 관여하는 C 아미노산의 발생 수를 단백질 서열 내의 C 아미노산의 발생 수에서 빼지 않았다. 단백질 서열은 UniProt 데이터베이스로부터 FASTA 형식으로 다운로드하였고 Python ProtParam 모듈과 같은 생물정보학 도구를 사용하여 각 아미노산 유형의 발생 수를 결정하였다.
관심 단백체의 경우, 관심 단백체를 포함하는 모든 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및/또는 단백질 복합체에 걸친 아미노산의 가중 평균 수를 계산하였다. 아미노산의 가중 평균 수는 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체 당 아미노산 수에 관심 단백체 내의 해당 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체의 비율을 곱한 선형 조합으로 계산하였다.
알려지지 않은 샘플의 단백질 당 아미노산 수를 측정하는 것은 일반적으로 가능하지 않은 데, 알려지지 않은 샘플의 몰 단백질 농도가 알려져 있지 않기 때문이다(이를 결정하기 위한 당업계의 표준 방법으로서, 예컨대 A280을 통해, 단백질 정체성이 알려져 있지 않은 경우 이용가능하지 않은 단백질-서열 특이적 흡광 계수에 의존함). 그러나 샘플의 몰 단백질 농도가 알려져 있는 경우, 참조는 대안적으로 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 2 개 이상의 아미노산 유형의 아미노산의 수/가중 평균수로 제공될 수 있다.
샘플의 측정된 값과 참조에 의해 제공된 값의 비교
샘플의 측정된 값(2 개 이상의 아미노산 유형의 표지 값, 아미노산 농도, 아미노산 수)은 항상 점을 제공하며, 이는 샘플에서 표지되고 측정된 n 개의 아미노산 유형에 대해 n 차원 공간에서 임의적으로 시각화될 수 있다. 비교 단계는 샘플에 대해 측정된 점을 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체에 대해 제공된 참조선과 비교하고 샘플 점과 참조선 사이의 최단 거리가 0이거나, 오차 한계보다 작거나 같은지 평가하는 것을 수반하였다. 샘플 점과 참조선 사이의 최단 거리가 오차 한계보다 작거나 같은 경우, 관심 단백질, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재는 샘플 내에서 식별되고, 그의 농도는 샘플 점까지 최단 거리를 제공한 참조 선 상의 정확한 점(농도)에 의해 결정된다.
점과 선 사이의 최단 거리는 항상 선과 점 사이의 수직 거리이다. 이것은 90도가 아닌 점과 선 사이의 임의의 다른 각도가 길이가 수직 거리보다 항상 더 긴 빗변을 형성하기 때문이다.
이것은 샘플 점과 참조선 상의 임의의 점 사이의 벡터로 참조선 방향의 내적을 구하고, 내적을 0으로 설정하고, 샘플 점과 참조선 사이의 수직선을 제공하는 참조선의 농도에 대해 품으로써 달성하였다. 내적은 2 개의 벡터 A와 B 사이의 각도 관계 즉,
Figure pct00347
를 나타내는 스칼라 값이며 여기서 값
Figure pct00348
Figure pct00349
는 각각 벡터 A 및 B의 길이를 나타내고, θ는 2 개의 벡터 사이의 각도이다. A 및 B가 수직이면(즉, 서로 90도) 내적은 0인 데,
Figure pct00350
가 0이기 때문이다. 샘플 점과 참조선 사이의 이 거리를 계산하고, 이 거리가 오차 한계보다 작거나 같으면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체가 수직(최소) 거리를 제공한 참조선 상의 단백질 농도로 존재하는 것으로 식별하였다.
여기서 사용되는 비교 접근법은 하기 접근법으로 요약된다:
1. R을 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 에 대한 참조선으로 두고, S를 이로부터 최단 거리를 구하기 위한 샘플 점으로 둔다
2. 벡터 형식으로 참조선 R의 방정식을 구한다
3. 참조선 R 상의 점 P의 일반 방정식을 구한다
4. S에서 P로의 벡터가 R에 수직이 되도록 Q라고 하는 참조선 R 상의 점 P의 정확한 위치를 구한다. 이것은 S와 Q 사이의 벡터가 수직을 제공하도록 참조선 R 상의 점 Q를 구하는 것을 의미한다. 이는 R의 방향으로 S에서 P로의 벡터의 내적(ㆍ)을 구하고, 이를 0으로 설정하고, t의 값을 제공하기 위해 t를 품으로써 달성되며, R 상의 점 P에 대한 일반 방정식으로 대체되는 경우, 수직 벡터를 산출한다. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 가 샘플 내에 함유되면, t에 대한 이 해는 단백질 농도이다.
5. 거리 공식을 사용하여 D라고 하는 Q와 S 사이의 거리를 구한다.
6. D가 오차 한계, ε보다 작은지 여부를 평가한다.
7. D > ε이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 는 샘플 내에 존재하지 않는다.
8. D ≤ ε이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 는 단백질 농도 t로 샘플 내에 존재한다.
참조선의 일반적 벡터 함수에 대해 하기 계산을 수행하고, 설명하고 요약하였다:
예를 들어, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 에 대한 참조선(R)의 일반 파라미터 형식은 다음과 같으며:
Figure pct00351
이는 대안적으로
Figure pct00352
으로 쓸 수 있다
참조선 상의 점(P)의 일반 방정식은 다음과 같다:
Figure pct00353
측정된 샘플 점(S)는 좌표를 갖는다:
Figure pct00354
측정된 샘플 점(S)에서 참조선 상의 임의의 점(P)까지의 벡터는 P - S이다:
Figure pct00355
이 벡터가 수직이 되려면, 참조선의 방향 <c 1 , c 2 ,…, c n >으로 이 벡터의 내적(ㆍ)은 0이어야 한다. 따라서, 내적은 0으로 설정하였고:
Figure pct00356
방정식을 t에 대해 풀었다. t에 대한 이 해는 샘플과 참조선 R 사이의 거리가 가장 짧은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 의 단백질 농도이다. 따라서, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 가 샘플 내에 존재하면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 가 단백질 농도 t로 샘플 내에 존재한다.
관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 가 샘플 내에 존재하는지 여부를 결정하기 위해, 수직 거리를 제공하는 참조선 상의 점, Q를 구하였다:
Figure pct00357
Qt에 대한 해에 상응하는 참조에 대한 값의 세트인 점이다. S도 점이다.
거리 공식을 사용하여 SQ 사이의 거리, D를 결정하였다.
S와 점 Q 사이의 Euclidean 거리 공식을 여기 제공된 작업 실시예에 사용하였다.
Figure pct00358
방정식은 아래와 같다:
Figure pct00359
ε은 오차 한계이다. 오차 한계는 2 가지 접근법 중 하나에 따라 제공되었다. 첫번째 접근법에서, 샘플에 함유된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 수가 의심되지 않으면, 거리 계산을 반영하여, 샘플 값 제곱의 제곱근을 곱한 허용오차를 사용하여 오차 한계를 제공하였다. 이것은 방정식 7에 의해 제공된다:
Figure pct00360
여기서 ε은 오차 한계이고,
Figure pct00361
는 허용오차 값이고, S 1 은 아미노산 유형 1에 대한 샘플에 대해 측정된 값이고, S 2 는 아미노산 유형 1에 대한 샘플에 대해 측정된 값이고, S n 은 아미노산 유형 n에 대한 샘플에 대해 측정된 값이다.
두번째 접근법에서, 샘플에 함유된 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 수가 의심되었다. 샘플이 k 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 것으로 의심되었다. 이 접근법에서, 계산된 수직 거리를 순위 매기고, k번째 가장 작은 값(k번째 차수 통계)을 샘플의 k 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체가 오차 한계보다 작거나 같은 수직 거리를 갖도록 오차 한계로 설정한다. 공식적으로, k번째 차수 통계는 계산된 수직 거리의 k번째 가장 작은(k번째 최소) 값이다. 예를 들어, 샘플 점과 각 참조선 사이의 모든 수직 거리의 세트는 β이고, βk번째 차수 통계는 β k 이다. ε = β k .
따라서, 참조 데이터베이스에서 c 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체에 대해 D ≤ ε이므로, c 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체를 샘플에서 식별한다
D > ε이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 는 샘플 내에 존재하지 않는다. 가설 테스트는 음성이었다.
D ≤ ε이면, 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 는 단백질 농도로 샘플 내에 존재한다:
Figure pct00362
샘플 내에 존재하는 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 의 양은 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 단백체, 또는 하위단백체 p i 의 단백질 농도에 샘플의 부피를 곱하여 계산하였다.
실시예 1에 기재된 방법을 이제 추가 실시예에 적용한다.
실시예 2 - 아미노산 농도에 기반하여 샘플에서 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체의 존재 및/또는 농도 및/또는 양 결정
테스트용 샘플을 수득하였다. 샘플은 알려지지 않은 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체를 함유할 수 있는 것으로 의심되었다. 샘플의 농도는 알려져 있지 않았다. 샘플은 1 회 측정하였다.
C 및 W 아미노산 유형을 실시예 1에서 요약된 형광생성 염료를 사용하여 형광으로 표지하였다.
각 아미노산 유형이 표지된 각 형광생성 염료의 형광 강도를 BMG 플레이트 판독기를 사용하여 측정하였다.
수득된 원시 형광 강도 값은 다음과 같았다:
C = 31191 AU; W = 34576 AU
수득된 원시 형광 강도 값을 실시예 1에 요약된 바와 같이 배경 보정하였다. 수득된 배경 보정된 형광 강도 값은 다음과 같았다:
C = 2177.5 AU; W = 20632 AU
배경 보정된 형광 강도 값을 다음을 사용하여 실시예 1에 요약된 바와 같이 아미노산 농도로 전환하였다:
Figure pct00363
이는 샘플에 대해 측정된 하기 아미노산 농도를 제공하였다:
Figure pct00364
아미노산 유형 C는 아미노산 유형 1, a1이었고, 아미노산 유형 W는 아미노산 유형 2, a2였다.
2-차원 공간에서 점인, 샘플에 대해 측정된 아미노산 농도를 관심 펩티드, 단백질, 올리고펩티드, 폴리펩티드, 및 단백질 복합체의 하기 선택을 위해 제공된 참조선과 비교하였다. 실시예 1에서 수행된 접근법의 결과가 하기 표에 제공되어 있다.
표 5: 실시예 1의 결과
Figure pct00365
테스트 2를 수행하였다. 샘플은 1 개의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체를 함유하는 것으로 의심되므로, 계산된 Euclidean 거리(D)의 최소 값은 0.62로 계산하였다. 오차 한계를 이와 동일하게 설정하였다, ε = 0.62. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체는 D ≤ ε인 경우 샘플 내에 존재하는 것으로 식별된다. BSA의 경우 D ≤ ε. 따라서, BSA의 존재를 샘플에서 식별하였다. 샘플에서 BSA의 농도는 가설 테스트를 만족시킨 t에 대한 해를 제공한 BSA의 농도였다. 이것은 1.17 μM이다. 이 농도에 샘플의 부피(200 μL)를 곱하여 샘플 내제 존재하는 BSA의 양을 수득한다. 결과는 하기 표에 요약되어 있다:
Figure pct00366
실시예 3 - 아미노산 농도에 기반하여 샘플에서 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체의 존재 및/또는 농도 및/또는 양 결정
테스트용 샘플을 수득한다. 샘플은 실험실 단백질을 함유할 수 있는 것으로 의심된다. 샘플의 정체성 및 농도는 알려져 있지 않다.
K 및 W 아미노산 유형을 실시예 1에 요약된 형광생성 염료를 사용하여 형광으로 표지하였다.
각 아미노산 유형이 표지된 각 형광생성 염료의 형광 강도를 플레이트 판독기를 사용하여 측정하였다.
수득된 원시 형광 강도 값을 실시예 1에 요약된 바와 같이 배경 보정하였다. 수득된 배경 보정된 형광 강도 값은 다음과 같았다:
K = 41804 AU; W = 29865 AU
배경 보정된 형광 강도 값을 실시예 1에 요약된 바와 같은 아미노산 농도로 전환하여, 하기 아미노산 농도를 제공하였다:
Figure pct00367
0.03의 허용오차 값을 선택하였다(
Figure pct00368
= 0.03). 따라서 오류 임계값을
Figure pct00369
로 정의하였다.
2-차원 공간에서 점인, 샘플에 대해 측정된 아미노산 농도를 기재된 접근법(테스트 2)을 사용하여 실험실 단백질의 하기 선택을 위해 제공된 참조선과 비교하였다.
표 6: 실시예 3의 결과
Figure pct00370
오차 한계는 1.76 μM로 제공되었다. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체는 D ≤ ε인 경우 샘플 내에 존재하는 것으로 식별하였다.
β-Lac의 경우에만 D ≤ ε. 따라서, β-Lac의 존재를 샘플에서 식별하였다. 샘플에서 β-Lac의 농도는 테스트 2를 만족시킨 t에 대한 해를 제공한 β-Lac의 농도였다. 이것은 3.88 μM이었다. 이 농도에 샘플의 부피(200 μL)를 곱하여 샘플 내에 존재하는 BSA의 양을 수득하였다. 결과는 하기 표에 요약되어 있다:
Figure pct00371
실시예 4 - 표지 값에 기반하여 샘플에서 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체의 존재 및/또는 농도 및/또는 양 결정
테스트용 샘플을 수득한다. 샘플은 실험실 단백질을 함유할 수 있는 것으로 의심된다. 샘플의 정체성 및 농도는 알려져 있지 않다.
K 및 C 아미노산 유형을 실시예 1에 요약된 형광생성 염료를 사용하여 형광으로 표지하였다.
각 아미노산 유형이 표지된 각 형광생성 염료의 형광 강도를 플레이트 판독기를 사용하여 측정하였다.
수득된 원시 형광 강도 값을 실시예 1에 요약된 바와 같이 배경 보정하였다.
Figure pct00372
그러나, 배경 보정된 형광 강도 값은 아미노산 농도로 전환되지 않았다. 대신, 벡터 함수 3에 기반한 K(a1) 및 W(a2) 아미노산 유형의 알려진 표지 값의 측면에서 각 관심 단백질에 대한 참조를 제공하였다.
표 7: 실시예 4의 결과
Figure pct00373
샘플은 관심 단일 단백질을 함유한 것으로 의심되었다. 따라서, 최소 수직 거리를 제공하는 샘플에서 관심 단백질의 존재를 식별하였다. 이것은 LYZ이다. 샘플에서 식별된 LYZ의 농도는 수직 거리의 이 최저 값을 제공하는 농도, sol t이다. 이것은 4.95 μM이었다.
실시예 5 - 표지 값에 기반하여 샘플에서 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체의 존재 및/또는 농도 및/또는 양 결정
테스트용 샘플을 수득한다. 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체를 함유할 수 있는 것으로 의심된다. 샘플의 정체성 및 농도는 알려져 있지 않다.
K 및 C 아미노산 유형을 실시예 1에 요약된 형광생성 염료를 사용하여 형광으로 표지하였다.
각 아미노산 유형이 표지된 각 형광생성 염료의 형광 강도를 플레이트 판독기를 사용하여 측정하였다.
수득된 원시 형광 강도 값을 실시예 1에 요약된 바와 같이 배경 보정하였다.
하기 배경 보정된 형광 강도 값을 수득하였다:
Figure pct00374
이러한 배경 보정된 형광 강도 값은 아미노산 농도 또는 아미노산 수로 전환되지 않았고; 대신 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체의 대형 데이터베이스의 K, C, 및 W 아미노산 유형에 대한 알려진 표지 값을 벡터 함수 3을 사용하여 생성하고, 가설 테스트 2를 적용하였다.
표 8: 실시예 5의 결과
Figure pct00375
샘플은 하나의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체를 함유하는 것으로 의심되므로, 오차 한계는 수직 거리의 최소 값으로 정의되어, 샘플 점에 가장 가까운 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체만이 샘플에 존재하는 것으로 식별되도록 하였다. 수직 거리의 이 최소 값은 5235였다. 따라서, 샘플에서 BSA의 존재는 이 수직 거리를 제공하는 단백질 농도인 0.99 μM로 식별되었다.
실시예 6 - 샘플에서 하나 초과의 관심 단백질의 존재 및/또는 농도 및/또는 양 결정
테스트용 샘플을 수득한다. 샘플은 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 또는 단백질 복합체를 함유할 수 있는 것으로 의심된다. 샘플의 정체성 및 농도는 알려져 있지 않다.
C 및 W 아미노산 유형을 실시예 1에 요약된 형광생성 염료를 사용하여 형광으로 표지하였다.
각 아미노산 유형이 표지된 각 형광생성 염료의 형광 강도를 플레이트 판독기를 사용하여 측정하였다. 원시 형광 강도는 다음과 같았다:
C = 24130 AU; W = 36947 AU
수득된 원시 형광 강도 값을 실시예 1에 요약된 바와 같이 배경 보정하여 하기 배경 보정된 형광 강도를 제공하였다:
C = 21679 AU; W = 16891 AU
알려진 아미노산 농도의 표준을 사용하여 C 아미노산 유형의 표지의 측정된 신호와 C 아미노산 유형의 아미노산 농도 사이를 전환하고, 알려진 아미노산 농도의 표준을 사용하여 C 아미노산 유형의 표지의 측정된 신호와 C 아미노산 유형의 아미노산 농도 사이를 전환하였다. 6 μM C 아미노산 농도(오브알부민)를 함유하는 표준 용액은 1322 AU의 형광-강도를 가졌으므로, 형광 강도(AU)와 μM 아미노산 농도 사이의 전환은
Figure pct00376
로 주어진다. 3 μM W 아미노산 농도(오브알부민)를 함유하는 표준 용액은 6888.7 AU의 형광-강도를 가졌으므로, 형광 강도(AU)와 μM 아미노산 농도 사이의 전환은
Figure pct00377
로 주어진다.
샘플에 대해 측정된 형광 강도를 하기 아미노산 농도로 전환하였다:
16.39 μM C; 2.45 μM W.
샘플 점은 (16.39, 2.45)이다.
C 아미노산 유형은 아미노산 유형 1(a1)이다. W 아미노산 유형은 아미노산 유형 2(a2)이다.
벡터 방정식 1을 사용하여 다양한 관심 단백질에 대한 단백질 농도, t의 함수로 정의된 아미노산 농도를 제공하였으며, 각각 참조선, R이 있다.
표 9: 실시예 6의 결과
Figure pct00378
실시예 1에 기재된 비교 단계를 수행하여, 제공된 수직 거리 값(D)을 생성하였다.
샘플은 2 개의 관심 단백질을 함유하는 것으로 의심되므로, 오차 한계를 수직 거리의 두번째 최소 값인 3.8로 설정하여, BSA 및 βLac에 대해서만 D ≤ ε이도록 하였다.
2 개의 관심 단백질을 혼합물에 존재하는 것으로 식별하였고, 그들의 수직 거리 값을 비교하여 혼합물 내의 구성요소의 비율을 식별하였다. 구체적으로, 원칙은 샘플에 대한 측정값이 혼합물을 포함하는 순수 구성요소(예를 들어 순수 단백질)에 대한 예상된 값의 평균이라는 것이다. 거리가 가까울수록, 혼합물 내의 순수 구성요소(예를 들어 순수 단백질)의 비율이 더 커지므로, 수직 거리가 역전된다. 수직 거리는 또한 혼합물 내의 모든 구성요소의 비율의 합이 1이 되도록 정규화되어야 한다. 따라서, 혼합물 내의 각 구성요소의 비율을 계산하기 위해:
ㆍ 거리는 가장 큰 거리를 모든 다른 거리로 나누어 역 정규화한다.
ㆍ 그런 다음 역 정규화된 거리를 합한다.
ㆍ 마지막으로, 혼합물 내의 각 구성요소의 분율을 역 정규화된 거리를 모든 역 정규화된 거리의 합으로 나누어 계산한다.
이것은 아래에 적용된다:
Figure pct00379
그런 다음, 혼합물 내의 각 구성요소의 비율에 순수 구성요소의 결정된 단백질 농도(sol t)를 곱하여, 혼합물 내의 해당 구성요소의 농도를 구한다.
샘플은 0.34 μM BSA 및 0.84 μM βLac을 포함하는, BSA 및 βLac의 혼합물을 함유하는 것으로 식별하였다.
실시예 7 - 2 개의 아미노산 유형을 사용하여 전체 인간 혈장 단백체(> 3000 개의 관심 단백질) 내의 관심 단백질의 존재 및/또는 농도 및/또는 양 결정
샘플을 인간 혈장에서 수득하였다. 샘플의 정체성 및 농도는 알려져 있지 않다. C(a1) 및 K(a2) 아미노산 유형을 실시예 1에 요약된 바와 같이 표지하였다.
C 및 K 아미노산 유형에 대한 원시 형광 강도를 실시예 1에 기재된 바와 같이 배경 보정하였다. 측정된 배경 보정된 형광 강도는 다음과 같았다:
CT: 227 AU; K: 1563 AU
배경 보정된 형광 강도를 실시예 1에 기재된 바와 같은 아미노산 농도로 전환하였다. 계산된 아미노산 농도는 다음과 같았다:
CT: 160 nM; K: 1125 nM
본원에 기재된 방법을 사용하여 3263-단백질 인간 혈장 단백체 내의 모든 단백질에 대해 참조 데이터베이스를 생성하였다.
작업 실시예의 전체 데이터베이스를 포함하는 것은 실용적이지 않지만, 50번째 행마다 대표적인 행은 아래 표 10에 제시되어 있다.
각 관심 단백질에 대한 샘플 점과 참조선 사이의 거리를 계산하였고, 그의 상응하는 단백질 농도를 구하였다. 각 단백질 농도를 관심 단백질에 대해 공개적으로 이용가능한 상부(UB) 및 하부(LB) 농도 범위와 비교하였다. 이 농도 범위는 공개적으로 이용가능한 Protein Atlas 데이터베이스로부터 액세스하였다. 농도 범위의 하한은 제공된 농도의 0.9 배로 설정하였고, 농도 범위의 상한은 제공된 농도의 1.1 배로 설정하였다. 이전과 같이, 본 발명의 방법을 적용하였고, 각 관심 단백질(샘플에 존재하는 경우)의 단백질 농도, t를 기재된 수직 거리 접근법을 사용하여 결정하였다. LB < t < UB인 경우, 참조 데이터베이스의 행은 논리적 출력으로 1을 수신하였다. 행렬 내의 LB, t, 및 UB 열은 강조 표시된다. 대표적인 행 표시에서, 관심 단백질 중 어느 것도 그들의 농도 한계 내에 없었다(따라서 1 개의 논리적 출력이 없었다).
표 10: 실시예 7의 결과
Figure pct00380
그런 다음, 행렬을 필터링하여 LB < t < UB에 대한 행만을 나타내었다. 계산된 거리를 오차 한계와 비교하였다.
표 11: 실시예 7의 결과 계속
Figure pct00381
샘플 내에 함유된 관심 단백질의 수는 의심되지 않았으므로, 오차 한계는 0.03의 허용오차 값에 기반하여 방정식 7에 따라 38.93으로 제공되었다. VCL만이 D ≤ ε를 가졌으므로, 관심 단백질 VCL은 14.45 nM의 단백질 농도로 샘플(3263 개의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 및 단백질 복합체의 참조 세트로부터) 내에서 식별되었다.
이 전략은 본 발명의 방법에 의해 결정된 단백질 농도(관심 단백질이 샘플에 존재하는 경우)와 10 자릿수 이상까지 달라지는 풍부한 데이터 세트와 비교함으로서, 하나 초과의 관심 단백질을 언급하는 참조선(R)의 임의의 예를 제거한다.
실시예 8 - 샘플에서 관심 단백체(SARS-CoV-2 또는 인플루엔자 A)의 존재 및/또는 농도 및/또는 양 결정
3 명이 환자는 마른 기침, 피로, 근육통, 및 발열을 보였다. 일반적인 인플루엔자 또는 코로나바이러스의 초기 단계를 암시하는 증상이 있다. 목표는 임의의 경우 각 환자가 어떤 감염을 가지고 있는지 신속하게 결정하고, 각 개별 환자가 얼마나 공격적으로 감염을 퍼트릴 수 있는지 평가하고/하거나 적절한 치료를 처방받을 수 있도록 바이러스에 대한 숙주의 반응을 예측하기 위해 각 개인에서 병원체의 풍부도를 결정하는 것이다.
각 환자의 샘플을 당업계에 알려진 방법을 통해 수집한다. 이것은 혈액 샘플, 비강 면봉, 비인두 흡인물, 또는 하기도 점액 흡인물 샘플을 포함할 수 있다. 적절한 경우, 샘플을 완충액 또는 담체 용액에 희석하고, 원심분리, 초원심분리, 아가로스 겔 전기영동, 또는 컬럼 크로마토그래피와 같은 당업계에 알려진 방법에 의해 분리하여 바이러스 크기의 입자에 상응하는 분획(약 80-350 nm 직경)을 단리한다. 샘플은 또한 동결건조 또는 셀룰로스 막 농축기와 같은 당업계에 알려진 방법을 사용하여 농축할 수 있다. 샘플의 정체성은 알려져 있지 않다. 샘플의 (단백질) 농도는 알려져 있지 않고 임의의 희석액 내에 함유된 (단백질) 농도는 알려져 있지 않다.
이 바이러스 분획을 나트륨 도데실 술페이트(SDS) +/- EDTA를 사용하는 것과 같이, 당업계에 알려진 방법을 통해 용해시킨다.
2 개의 아미노산 유형; K 및 C, 또는, C 및 W, 또는, K 및 W를 실시예 1에 요약된 형광생성 염료를 사용하여 형광으로 표지한다.
2 개의 아미노산 유형 K 및 C, 또는, C 및 W, 또는, K 및 W 각각의 모든 아미노산을 실시예 1에 요약된 형광생성 염료를 사용하여 형광으로 표지한다. 아미노산 유형의 이들 조합 각각의 진단 결과가 이 실시예에 제시되어 있다.
각 아미노산 유형이 표지된 각 형광생성 염료의 형광 강도를 플레이트 판독기를 사용하여 측정하고 실시예 1에 요약된 바와 같이 배경 보정한다. 배경 보정된 형광 강도(FI) 값은 다음과 같다:
Figure pct00382
각 환자의 샘플에서 2 개의 아미노산 유형(K 및 C, C 및 W, 또는 K 및 W)의 형광 강도를 선형 맞춤을 사용하여 형광 강도로부터 결정한다. 선형 맞춤은 실시예 1에 요약된 바와 같이, 형광 강도에 대한 표지된 아미노산의 알려진 농도와 관련한 교정 곡선에 기반하여 계산한다.
예를 들어, 실시예 1 및 구체적으로 방정식 4에 요약된 바와 같이, 환자 1에 대한 C 아미노산 농도는 환자 1에 대한 측정된 C FI를
Figure pct00383
으로 나누어 결정한다.
이것은 288 nM인 0.288 μM의 환자 1에 대한 C 아미노산 농도를 제공한다.
또 다른 예로서, 환자 1의 K 아미노산 농도는 환자 1의 배경 보정된 형광 강도에 실시예 1에 제공된 교정 계수의 역수,
Figure pct00384
를 곱하여 결정한다
따라서 환자 1의 K 아미노산 농도는 545 nM인 0.545 μM이다.
또 다른 예로서, 환자 1의 W 아미노산 농도는 방정식 6에 의해 제공된 바와 같이, 측정된 형광 강도에서 9859 AU를 빼고, 2362
Figure pct00385
로 나누어 결정한다,
Figure pct00386
이것은 106 nM W 아미노산 농도인 .106 μM W 아미노산 농도를 제공한다.
2 개의 표지된 아미노산 유형의 3 개의 조합 각각에 대한 이러한 방식으로 결정된 환자 1, 2, 및 3에 대한 아미노산 농도는 아래에 제시되어 있다.
Figure pct00387
인플루엔자 A H1N1 및 SARS-CoV-2(2019-nCoV로도 알려짐) 단백체를 구성하는 공개적으로 이용가능한 단백질 서열에 기반하여, 인플루엔자 A 단백체에서 K 및 C 아미노산의 가중 평균 수는 24.00 K 및 7.18 C인 반면, SARS-CoV-2 단백체에서 K 및 C 아미노산의 가중 평균 수는 60.57 K 및 31.36 C인 것으로 결정된다. 가중치는 방정식 12를 사용하여 제공하였다:
Figure pct00388
여기서 w n 은 관심 단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, c는 관심 단백체에서 단백질의 수이고, a n,i 는 관심 단백체 내의 단백질 i에서 아미노산 유형 n의 아미노산 수이다. 결과의 선형 조합은 관심 단백체의 단백질 i 내지 c에 대해 취한다. 이 구현예에서, 관심 단백체 내의 모든 단백질은 관심 단백체 내의 동등한 발현 또는 비율을 갖는 것으로 간주되므로, 관심 단백체 내의 각 관심 단백질에 대한 가중치는 동등하다.
대안적인 구현예에서 인플루엔자 A 단백체에서 C 및 W 아미노산의 평균 수는 7.18 C 및 6.91 W인 반면, SARS-CoV-2 단백체에서 C 및 W 아미노산의 평균 수는 31.36 C 및 11.29 W인 것으로 결정된다. 대안적인 구현예에서, 인플루엔자 A 단백체에서 K 및 W 아미노산의 평균 수는 24.00 K 및 6.91 W인 반면, SARS-CoV-2 단백체에서 K 및 W 아미노산의 평균 수는 60.57 K 및 11.29 W인 것으로 결정된다.
이들 값은 두 관심 단백체, 및 2 개의 아미노산 유형의 모든 조합에 대해 벡터 함수 2에서 w1 및 w2를 제공한다.
예를 들어, K 아미노산 유형이 w1이고 W 아미노산 유형이 w2인, 관심 SARS-CoV-2 단백체에 대한 벡터 함수 2는 다음과 같다:
Figure pct00389
반면에 관심 인플루엔자 A 단백체에 대한 벡터 함수 2는 다음과 같다:
Figure pct00390
이들 벡터 함수는 관심 SARS-CoV-2 및 인플루엔자 A H1N1 단백체에 대한 참조(벡터) 선을 정의한다. 실시예 1의 테스트 2에 기재된 접근법을 수행하며, 여기서 샘플 점에서 참조선까지의 수직 거리는 내적을 통해 결정되어, 참조선 상의 가장 가까운 점 및 참조선 상의 농도를 보여준다. 관심 SARS-CoV-2 및/또는 인플루엔자 A H1N1 단백체는 수직 거리가 오차 한계보다 작거나 같은 경우 환자 샘플에 존재하는 것으로 식별된다.
각 환자 및 각 구현예(C 및 K, C 및 W, 또는 K 및 W)에 대한 결과는 아래에 제공되어 있다.
C 및 K
Figure pct00391
C 및 W
Figure pct00392
K 및 W
Figure pct00393
모든 구현예(C 및 K, C 및 W, 및 K 및 W)에 대한 참조 함수의 결과는 n-차원 공간에 플롯팅된다(도 17 참조).
본 실시예의 모든 구현예에 걸쳐, 10.0의 오차 한계가 선택된다. 이것은 많은 환자 집단에 대한 실험 결과를 반영한다. 대안적으로, 오차 한계는 방정식 10을 사용하거나, k 관심 단백체가 샘플 내에 존재하는 것으로 의심되는 경우 오차 한계로 설정된 거리의 k번째 최소 값을 사용하여 정의될 수 잇다.
다음에 대해 D ≤ ε
C 및 K
환자 1, 9.04 nM 농도에서 SARS-CoV-2 단백체의 존재
환자 2, 5.13 nM 농도에서 SARS-CoV-2 단백체의 존재
환자 3, 22.19 nM 농도에서 인플루엔자 A 단백체의 존재
C 및 W
환자 1, 9.04 nM 농도에서 SARS-CoV-2 단백체의 존재
환자 2, 5.13 nM 농도에서 SARS-CoV-2 단백체의 존재
환자 3, 22.19 nM 농도에서 인플루엔자 A 단백체의 존재
K 및 W
환자 1, 9.01 nM 농도에서 SARS-CoV-2 단백체의 존재
환자 2, 5.08 nM 농도에서 SARS-CoV-2 단백체의 존재
환자 3, 22.06 nM 농도에서 인플루엔자 A 단백체의 존재
이 실시예의 모든 구현예에 걸쳐, 환자 1 및 2는 SARS-CoV-2에 대해 양성으로 테스트되었고, 환자 3은 인플루엔자 A에 대해 양성으로 테스트되었다. 환자 1은 환자 2보다 SARS-CoV-2 단백체의 유의하게 더 높은 (단백질) 농도를 가졌다. 이것은 바이러스 부하의 척도로 생각될 수 있는 데, 바이러스가 용해될 때 바이러스의 농도가 높을수록 바이러스 단백질의 총 농도가 높아지기 때문이다. 따라서 환자 2가 환자 1보다 SARS-CoV-2 바이러스를 더 많이 발산하고 환자 1보다 더 많은 접촉자에게 질환을 전파할 가능성이 더 높은 것으로 결론 내릴 수 있다. 이 정보는 SARS-CoV-2 또는 다른 인수공통 바이러스와 같은 전염병의 역학적 모델링, 뿐만 아니라 봉쇄 지침을 안내하는 실용적 용도에 유용할 수 있다. 추가로, 이 정보는 바이러스의 순환 부하가 더 높은 환자가 더 심각한 감염 및/또는 더 높은 합병증 가능성이 있는지 여부를 질문하는 데 도움이 될 수 있다.
실시예 9 - 특별한 경우 1
특별한 경우 1에서, 샘플의 몰 단백질 농도가 이용가능하다. 따라서, 2 개 이상의 아미노산 유형의 계산된 아미노산 농도를 용액의 알려진 몰 단백질 농도로 나누어 2 개 이상의 아미노산 유형의 아미노산 수를 계산하는 것이 가능하다.
하기 배경 보정된 형광 강도 값을 측정하였다:
W: 15890 AU; CR = 2371 AU
방정식 5를 사용하여 측정된 CR 배경 보정된 형광 강도를 CR 아미노산 유형의 아미노산 농도로 전환하였다:
Figure pct00394
방정식 6을 사용하여 측정된 W 배경 보정된 형광 강도를 W 아미노산 유형의 아미노산 농도로 전환하였다:
Figure pct00395
관심 단백질은 1 μM 단백질 농도로 샘플에 존재하는 것으로 알려져 있다. 따라서, 다음을 사용하여 각 아미노산 유형의 아미노산 수를 계산하는 것이 가능하다:
Figure pct00396
따라서, 샘플에서 CR 아미노산의 수는 0.838인 것으로 계산하였다. 샘플에서 W 아미노산의 수는 2.59인 것으로 계산하였다.
이 경우, 참조는 선이 아닌 점을 제공한다. 비교 단계는 하기 공식에 따라, 샘플 점과 각 참조 점 사이의 거리를 계산하는 것을 수반한다:
Figure pct00397
이것은 하기 거리 계산을 생성하였다:
Figure pct00398
샘플은 하나의 관심 단백질을 함유하는 것으로 의심된다. 따라서, 오류 임계값을 최소 거리로 설정한다. BSA의 존재가 샘플에서 식별되는 데, 이것은 참조 점까지 가장 작은 최소 거리를 제공하는 관심 단백질이기 때문이다.
실시예 10: 환자 체액 샘플로부터 관심 단백체 및 하위단백체의 측정 및 식별 방법
하기 3 개의 실시예에서, 환자 혈액 샘플 내의 2 개 이상의 아미노산 유형을 본원에 개시된 바와 같이 표지 및 측정하고, 본 발명의 방법을 사용하여 환자 혈액 샘플 내에서 하나 이상의 관심 단백체 또는 하위단백체의 존재 및/또는 농도 및/또는 양을 식별하였다.
환자 혈장 샘플이 제조된 방법에 따라, 2 개의 관심 단백체가 이용가능할 수 있다. 혈소판 부족 혈장 단백체는 혈소판이 고갈된 혈장을 설명한다. 대조적으로, 혈소판 풍부 혈장 단백체는 혈소판이 고갈되지 않은 혈장을 설명한다. 혈소판 풍부 혈장 샘플이 준비되면, 혈소판을 용해시켜 그들의 내용물을 혈장으로 방출시킴으로써, 혈소판에 의해 함유된 단백질은 혈소판 풍부 혈장 단백체의 일부가 된다. 본 발명의 방법에 대한 민감한 테스트로서, 하기 3 개의 작업 실시예는 본 발명의 방법이 혈소판 부족 혈장(PPP) 및 혈소판 풍부 혈장(PRP) 단백체의 단백체 서명에서 작은 차이를 검출하고 알려지지 않은 환자 샘플에 관심 PPP 단백체 또는 PRP 관심 단백체가 함유되어 있는지 여부를 결정할 수 있음을 확인시켜 준다. 실제로, 환자 샘플 내에서 관심 단백체의 존재 및/또는 농도 및/또는 양은 본 발명의 방법을 사용하여 정확하게 결정하였다. 본원에 개시된 바와 같이, 일부 구현예에서, 이 비교 단계는 기계 학습 분류기의 사용을 수반하며, 이는 샘플 내에서 관심 PPP 및 PRP 단백체의 존재 또는 부재의 식별에서 100% 민감도 및 100% 특이성을 달성할 수 있었다. 본 발명의 방법의 추가 테스트로서, 2 개의 추가 관심 단백체를 이들 혈장 샘플로부터 제조하였다. 나머지 관심 저분자량 혈소판 부족 혈장 하위단백체(PPP_50) 및 관심 저분자량 혈소판 풍부 혈장 하위단백체(PRP_50)를 서로 구별하고 100% 민감도 및 100% 특이성으로 본 발명의 방법을 사용하여 관심 PPP 및 PRP 단백체와 구별하였다.
본원에 개시된 바와 같이, 일부 구현예에서, 이 비교 단계는 참조선의 계산을 수반한다. 각 참조선은 관심 단백체를 고유하게 설명하며, 예를 들어 참조선은 관심 PPP 단백체를 고유하게 설명하고 또 다른 참조선은 관심 PRP 단백체를 고유하게 설명한다. 본 발명의 방법은 관심 단백체에 대한 이론적 및 실험적 참조선을 계산할 수 있다. 관심 PPP 단백체의 경우, 실험적 참조선은 실시예 11에서 계산하였고, 이 실험적 참조선을 실시예 12에서 관심 PPP 단백체에 대해 계산된 이론적 참조선과 비교하였고, 실험적 참조선과 이론적 참조선 사이의 강한 일치를 입증하였다. 이 일치는 관심 단백체 또는 하위단백체에 대해 본 발명의 방법을 사용하여 계산된 이론적 참조선이 관심 단백체 또는 하위단백체가 샘플 내에 존재할 때 본 발명의 방법을 사용하여 측정될 2 개 이상의 표지된 아민(amin)산 유형의 아미노산 농도, 표지 값, 또는 아미노산 수를 정확하게 예측한다는 것을 추가로 입증한다.
이 실시예에서, 연구 방법이 먼저 상세하게 기재될 것이다.
N = 25의 전혈 샘플을 동의한 건강한 성인 환자로부터 수득하였다. 환자는 추가 처리를 위해 전혈을 일반적으로 수집하는 재생 정형외과적 시술을 받고 있었고, 대략 15 mL의 전혈을 함유하는 추가의 진공채혈기 바이알을 의학 연구 목적을 위한 의료 폐기물로 수득하였다. 전혈을 혈장을 준비하기 위해 사용할 것이기 때문에, 전혈의 각 바이알은 당분야에서 표준으로서 대략 17.5% v/v 항응고제(산-시트레이트-덱스트로스, ACD-A)를 함유하였다. ACD-A는 100 mL 물 당 다음 구성요소 질량을 함유하도록 표준화된다: 20.59-22.75 g 시트르산, 23.28-25.73g 덱스트로스, 4.90-5.42g 나트륨.
2 개 유형의 혈장 제제가 이용가능하다: 혈소판 부족 혈장(PPP) 및 혈소판 풍부 혈장(PRP). PPP는 혈소판의 수가 매가 적은 혈장이다(대략 0.5 x 108 혈소판/mL). PRP는 혈소판의 수가 더 많은 혈장이다(대략 6 x 1011 혈소판/mL). 명시되지 않은 경우, 문헌에서 또는 생체자원은행(biobank)에서 이용가능한 "혈장"은 일반적으로 PPP를 지칭한다.
환자 혈액의 PRP 및 PPP 분획은 둘 다 2-단계 절차를 따른 경우 단일 환자 혈액 샘플에서 이용가능하다. 첫번째 단계에서, 전혈을 200 x g에서 10분 동안 원심분리하고, 백혈구 풍부 버피 코트 층 위의 혈소판-함유 혈장을 버피 코트를 건드리지 않도록 주의하면서 피펫을 통해 제거하였다. 두번째 단계에서, 이 단리물을 다시 2300 x g에서 10분 동안 원심분리하였다.
혈소판 풍부 혈장(PRP)을 200 x g에서 10분 동안 원심분리("소프트 스핀")한 후 다른 혈액 구성요소로부터 수동으로 분리하였다. 백혈구 풍부 버피 코트를 건드리지 않도록 PRP 단리 중에 주의를 기울여, 유핵 세포 오염을 최소화하였다. 단리된 PRP를 2300 x g에서 10 분 동안 2차 원심분리("하드 스핀")에 적용하여 혈소판 펠릿을 형성하였다. 부피의 상위 2/3를 혈소판의 낮은 농도로 인해 PPP로 수집하였다. 혈소판 펠릿을 부피의 하위 1/3에서 부드럽게 진탕하면서 재현탁하고, 이 분획을 혈소판의 높은 농도로 인해 PRP로서 수집하였다.
그런 다음 모든 혈장 샘플(PPP 및 PRP)을 액체 질소(N2)에 담궈 급속 동결시킨 후 -80℃에 보관하였다. 이 단계는 PRP 제제 내의 혈소판을 용해시켜, 그들의 내용물을 혈장 용액으로 방출시키도록 하는 데 추가로 사용하였다.
혈장은 중량 기준으로 대략 90% 알부민 및 글로불린(면역글로불린)이고, 둘 다 50 kDa 초과의 고분자량을 갖는다. 구체적으로 저분자량 혈장 하위단백체의 존재 및/또는 농도 및/또는 양을 검출하는 본 발명의 방법의 능력을 추가로 입증하기 위해, 본원에 기재된 바와 같은 단리 단계를 수행하여 PPP 및 PRP 샘플로부터 알부민 및 글로불린과 같은 높은 풍부도 단백질을 고갈시켰다. 이를 달성하기 위해, 본원에 개시된 바와 같은 원심 여과 단계를 사용하여, PPP 및 PRP 샘플로부터 50 kDa보다 큰 분자량을 갖는 알부민, 글로불린, 및 다른 단백질의 고갈을 초래하였다. 생성된 저분자량 혈장 샘플은 관심 저분자량 혈소판 부족 혈장 하위단백체(PPP_50) 및 관심 저분자량 혈소판 풍부 혈장 하위단백체(PRP_50)이다. 이것은 각 PPP 및 PRP 제제를 각각 2 개의 분획으로 분취함으로써 달성하였다. 하나의 분획은 본원에 개시된 바와 같은 단리 단계를 거치지 않았고, 다른 분획은 본원에 개시된 바와 같은 단리 단계를 거쳤다. 사용되는 샘플 제조 절차는 아래 표 12에 기재되어 있다.
표 12: PPP, PPP_50, PRP 및 PRP_50에 대한 샘플 제조 설명
Figure pct00399
샘플을 제공하는 각 환자에 대한 환자 정보를 수집하였다. 각 환자의 성별 및 연령을 추가로 기록하였고 표 13에 제시되어 있다. 표 13의 왼쪽에 있는 기호 설명 표에 제공된 각 샘플 유형에 대한 약어는 측정된 데이터가 제공될 때 이 실시예에서 나중에 사용된다.
표 13: 환자 정보
Figure pct00400
기호 설명표에 제공된 샘플 유형의 추가 예시로서, 샘플 7A는 43 세 생물학적 남성의 PPP 샘플인 반면, 샘플 23D는 67 세 생물학적 여성의 PRP_50 샘플이다.
샘플 제조는 예상된 바와 같이 진행되었지만 샘플 15B는 급속 동결 동안 N2로 오염되었고 샘플 8D의 유출액이 원심 여과 단계에서 사용된 Amicon 필터의 불이행을 나타내는 황색이었다는 것에 주목하였다. 집합적으로, 이들 2 개의 샘플은 샘플 제제 이상치로 기재될 것이다. 추가로, 샘플 3B, 8B, 12D, 및 15D가 유출액의 예상된 부피보다 더 적게 산출된다는 것에 주목하였다. 환자 샘플이 실험적 참조선을 계산하기 위해 식별되거나 사용되는 경우, 샘플 제제 이상치(15B, 8D)는 분석에서 배제되었다. 샘플 3B, 8B, 12D, 및 15D는 분석에서 배제되지 않았다.
표지화 용액 제조
이들 실시예 전반에 걸쳐, K, C, W, 및 Y 아미노산 유형의 아미노산을 본원에 개시된 바와 같이 표지하고 측정하였다. 이러한 모든 아미노산 유형이 표지되고 측정되었지만, 이러한 아미노산 유형의 선택된 조합을 사용하여 환자 샘플에서 관심 단백체의 존재 및/또는 농도 및/또는 양을 식별하고, 관심 단백체를 고유하게 식별하기 위해 2 개의 아미노산 유형만이 표지되고 측정될 필요가 있다는 본원에 개시된 본 발명의 특징을 예시하였다.
하기 표지화 용액을 본원에 개시된 바와 같이 제조하였다.
K 아미노산 유형의 환자 혈장 샘플 내의 아미노산을 표지하기 위해, K 표지화 용액을 제조하였다: 200 mM 카보네이트 완충액 중 12 mM OPA, 18 mM BME 및 4% w/v SDS, pH 10.5. 50 mL의 K 표지화 용액을 제조하기 위해: 80.5 mg OPA를 칭량하고 20 mL의 500 mM 카보네이트 완충액, pH 10.5를 첨가한 후 63.4 μL BME를 첨가하였다. 다음으로, 20 mL H2O 및 10 mL의 20% w/v SDS 스톡 용액을 첨가하였다. 용액을 빛으로부터 보호하고 65℃에서 10분 동안 가열하였다. K 표지화 용액을 실온으로 냉각시킨 후 0.45 μm 주사기 필터를 통해 여과하여 임의의 큰 입자를 제거하였다. 그런 다음 용액을 5 개의 10 mL 분취액으로 분취하였다. 모든 분취액을 파라핀으로 밀봉하고 빛으로부터 보호한 후 -20℃에서 보관하였다.
W 아미노산 유형 및 Y 아미노산 유형의 환자 혈장 샘플 내의 아미노산을 표지하기 위해, WY 표지화 용액을 제조하였다: 5 mM HEPES 중 0.2 M TCE, 10 mM TCEP, 4% w/v SDS, pH 7. 38.54 mL 5 mM HEPES 완충액에 500 μL 1 M TCEP 스톡 용액을 첨가한 후 964 μL TCE 및 10 mL 20% w/v SDS 스톡 용액을 첨가하였다. 그런 다음 용액을 5 개의 10 mL 분취액으로 분취하였다. 모든 분취액을 파라핀으로 밀봉하여 빛으로부터 보호한 후 -20℃에서 보관하였다.
C 아미노산 유형의 환자 혈장 샘플 내의 아미노산을 표지하기 위해, C 표지화 용액을 제조하였다: 160 mM pH 10.5 카보네이트 완충액 중 5 mM ABD-F, 4% w/v SDS. 제공된 바와 같은 10 mg의 ABD-F에, 1 mL 200 mM 카보네이트 완충액, pH 10.5를 첨가하였다. 바이알을 닫고 모든 ABD-F가 용해되도록 몇 분 동안 볼텍싱하였다. 그런 다음 ABD-F 함유 용액을 6.36 mL 200 mM 카보네이트 완충액과 조합하고, ABD-F 바이알을 카보네이트 완충액으로 세척하여 모든 ABD-F 용액이 조합되도록 하였다. 그런 다음, 1.84 mL 20% w/v SDS를 첨가하였다. 동일한 절차를 제공된 바와 같은 ABD-F의 추가의 10 mg 바이알에 대해 반복하였다. 용액을 합하고 5 개의 분취액으로 분취하고 사용할 때까지 -20℃에서 보관하였다.
이 실시예에서, 시스테인(C) 아미노산 유형의 환원된(CR) 아미노산 및 디술피드 결합된(CD) 아미노산 둘 다를 포함하는, 총 시스테인 아미노산 유형(C)이 표지되었다. 따라서, 본원에 개시된 바와 같이, 모든 시스테인 아미노산(C)의 표지화 전에 이황화 결합된 시스테인 암노(amno)산(CD)을 환원된 시스테인 아미노산(CR)으로 환원시키기 위해 시스테인 환원 용액을 또한 제조하였다. 제조된 환원 용액은 다음과 같았다: 5 mM HEPES 중 20 mM TCEP pH 7. 50 mL의 C 환원 용액을 제조하기 위해: 1 mL 1 M TCEP 스톡을 49 mL 5 mM HEPES에 첨가하였다. 생성된 용액을 10 mL 분취액으로 분취하였고, 모든 분취액을 빛으로부터 보호하고 사용하기 전에 -20℃에서 보관하였다.
여기 및 방출 필터
표지된 아미노산 유형의 모든 아미노산으로부터의 형광 강도를 본원에 개시된 바와 같은 특이적 여기 및 방출 필터를 사용하여 검출하였다.
표 14에 제시된 필터 쌍을 본 실시예에서 모든 실험에 대해 사용하였다.
표 14: 아미노산 유형 C, K, W 및 Y에 대한 여기 및 방출 파장 및 대역폭
Figure pct00401
본 실시예 및 하기 작업 실시예에 기재된 실험 전반에 걸쳐, 각 실험을 삼중으로 수행하였다(3 가지 기술적 복제물). 오차 막대가 제시되는 경우, 이들은 각 실험의 3 가지 기술적 복제물에 걸친 샘플 표준 편차이다. 오차 막대가 제시되는 경우, 이들은 각 실험의 3 가지 기술적 복제물의 평균 주위에 제시된다.
본 실시예 및 하기 실시예에서 모든 형광 측정은 표준 설정을 사용한 Thermo Fisher Flouroskan Ascent FL 플레이트 판독기를 사용하여 수행하였다. 이들은 자동 이득 선택, Ascent 소프트웨어를 사용한 필터 쌍 검증, 모든 측정 및 인큐베이션에 대한 정지(quiescent) 조건(예를 들어 진탕 또는 교반 없음), 대략 22℃의 실온, 정상 빔, 위로부터 측정 방향, 및 왼쪽에서 오른쪽으로 측정 순서를 포함하였다. 기본 20 ms 통합 시간이 아닌 200 ms 통합 시간을 사용하였다.
교정 곡선의 측정
본 발명의 방법에서, 샘플에서 각 표지된 아미노산 유형의 아미노산 농도는 측정된 표지로부터 계산할 수 있고 아미노산 농도는 하나 이상의 단백질 또는 아미노산의 하나 이상의 알려진 아미노산 농도의 측정된 표지 사용하여 샘플의 측정된 표지와 샘플에서 해당 아미노산 유형의 아미노산 농도 사이를 전환하는 교정 곡선 또는 표준을 사용하여 측정된 표지로부터 계산한다. 교정 곡선은 선형 또는 비선형일 수 있고 선형 또는 비선형 회귀를 사용하여 계산할 수 있다. 교정 곡선은 측정된 표지 값(임의 단위, AU)과 알려지지 않은 아미노산 농도(몰 농도, 예컨대 마이크로몰, μM) 사이의 관계를 결정하여 환자 샘플을 AU의 측정된 형광 강도에서 μM의 회합된 아미노산 농도로 전환할 수 있다. 본원에 개시된 바와 같이, 교정 곡선을 각 아미노산 유형에 대해 1 회만 계산한 다음 이 곡선을 연구 전반에 걸쳐 사용하였다.
교정 곡선을 생성하기 위해, 여러 단백질 용액을 제조하였다. 단백질 용액을 하기 요약된 단계에 따라 스톡 용액으로 제조한 다음, 표지화 반응을 수행하기 전에, PBS에 희석을 통해 명시된 농도로 희석하였다. 제조된 스톡 용액은 다음과 같으며, 각 스톡 용액으로부터 제조된 희석 용액은 다음과 같다.
PBS 중 300 μM BSA: 112 mg 소 혈청 알부민(BSA, MilliporeSigma의 제품 # A7030-10G)을 5 mL PBS에 용해시켰다. 이것은 PBS에 희석을 통해 300 μM로 하향 조정된 339 μM 스톡 용액을 제공하였다.
PBS 중 300 μM β-Lac: 30 mg β-락토글로불린(β-Lac, MilliporeSigma의 제품 # L0130-1G)을 5 mL PBS에 용해시켰다. 이것은 PBS의 첨가를 통해 300 μM로 희석된 329 μM 용액을 제공하였다.
PBS 중 600 μM LYZ: 46 mg 암탉 알 흰자위 리소자임(LYZ, MilliporeSigma의 제품 # 10837059001)을 5 mL PBS에 용해시켰다. 이것은 PBS의 첨가를 통해 600 μM로 희석된 643 μM 용액을 제공하였다.
추가로, 310 μL PBS에 82% 펩티드 함량을 갖는 제공된 50 μg PH를 용해시켜 14 μM 부갑상선 호르몬(PH, Millipore Sigma의 제품 # P7036-50UG)의 용액을 제조하였다. 이 스톡 용액으로부터, PBS에 희석을 통해 600 μL의 2.33 μM PH를 제조하였다. PH를 본원에 개시된 바와 같이, 트립토판 및 티로신 아미노산 유형으로부터 판독된 형광 신호를 검출 단계에서 분리하기 위한 디콘볼루션 표준으로 사용하였다.
상기 제공된 스톡 용액으로부터, 하기 희석된 단백질 용액을 PBS 완충액에 희석을 통해 제조하였다: 60 μM BSA, 50 μM BSA, 45 μM BSA, 30 μM BSA, 25 μM BSA, 20 μM BSA, 15 μM BSA, 5 μM BSA, 60 μM β-Lac, 50 μM β-Lac, 45 μM β-Lac, 30 μM β-Lac, 25 μM β-Lac, 20 μM β-Lac, 15 μM β-Lac, 5 μM β-Lac, 120 μM LYZ, 100 μM LYZ, 90 μM LYZ, 60 μM LYZ, 50 μM LYZ, 40 μM LYZ, 30 μM LYZ, 30 μM LYZ, 10 μM LYZ.
교정 곡선, 표지화 반응의 생성
실시예 1에 개시된 바와 같이, 표지화 반응은 많은 수의 반응을 동시에 수행하고 측정하게 하는 마이크로플레이트를 사용하여 높은 처리량으로 편리하게 수행할 수 있었다. K 표지화 반응을 하나의 마이크로플레이트에서 수행하였고, C 표지화 반응을 또 다른 마이크로플레이트에서 수행하였고, W 및 Y 표지화 반응을 세번째 마이크로플레이트에서 수행하였다. 디콘볼루션 표준을 사용하여 본원에 개시되고 본 실시예에 추가로 나중에 설명된 바와 같이, W 및 Y 아미노산 유형으로부터 형광 강도를 디콘볼루션하였다. 모든 경우에, 희석 단백질 용액(또는 완충 용액, 본원에 개시된 바와 같은 배경 보정을 위해) 및 표지화 용액을 동일한 부피로 조합하였다. 모든 희석 단백질 용액 및 완충 용액을 마이크로플레이트에 순차적으로 첨가한 후, 표지화 용액을 희석 단백질 용액 또는 완충 용액이 함유된 마이크로플레이트의 모든 웰에 첨가하였다. 이것은 화학 반응을 수행할 때 표준 관행이고 모든 반응이 거의 동일한 시간 동안 진행되도록 한다.
본원에 개시된 바와 같이, K 아미노산 유형의 아미노산을 표지하기 위해, 상기 100 μL의 희석 단백질 용액을 96-웰 마이크로플레이트(Grenier Bio One 카탈로그 # 655076 마이크로플레이트)의 각 웰에 첨가하였다. 논의된 바와 같이 표지화 반응을 삼중으로 수행하였으므로, 마이크로플레이트 당 3 가지 기술적 복제물 웰은 동일한 희석 단백질 용액을 함유하였다. 추가로, 3 개의 웰은 완충액(PBS)으로만 채웠는 데, 이들 웰이 본원에 개시된 바와 같이 배경 보정에 사용될 것이기 때문이다. 그런 다음, 100 μL의 K-표지화 용액을 마이크로플레이트의 모든 단백질 및 완충액 함유 웰에 첨가하였다. K-표지화 용액을 마이크로플레이트의 모든 단백질 또는 완충액 함유 웰에 첨가한 직후, 상기 기재된 설정 및 표 14에 제공된 필터 쌍(355 nm 여기, 460 nm 방출)을 사용하여 마이크로플레이트를 측정하여, K 아미노산 유형에 대한 일련의 측정된 값(원시 형광 강도)을 생성하였다.
본원에 개시된 바와 같이, 시스테인(C) 아미노산 유형의 모든 아미노산을 표지화하기 전에, 시스테인 아미노산 유형의 이황화 결합된 서브세트(CD)를 환원제(TCEP)를 사용하여 환원시켜 시스테인 아미노산 유형의 환원된 서브세트(CR)를 형성하였다. 이를 위해, 200 μL의 각 희석 단백질 용액을 마이크로튜브에서 200 μL C-환원 용액(TCEP)과 합하고 30분 동안 빛으로부터 보호하였다. 추가로, 200 μL 완충액을 마이크로튜브에서 200 μL C-환원 용액과 합하고 30분 동안 빛으로부터 보호하였다. 30분 후, 40 μL의 각 단백질 + C-환원 용액을 96-웰 마이크로플레이트(Grenier Bio One 카탈로그 # 655076 마이크로플레이트)의 각 웰에 첨가하였다. 논의된 바와 같이 표지화 반응을 삼중으로 수행하였으므로, 마이크로플레이트 당 3 가지 기술적 복제물 웰은 동일한 희석 단백질 + C-환원 용액을 함유하였다. 추가로, 3 개의 웰을 완충액(PBS) + C-환원 용액으로만 채웠는 데, 이들 웰이 본원에 개시된 바와 같이 배경 보정에 사용될 것이기 때문이다. 그런 다음, 40 μL의 C-표지화 용액(ABD-F)을 마이크로플레이트의 각 희석 단백질 + C-환원 용액 및 각 완충액(PBS) 단독 + C-환원 용액 웰에 첨가하였다. 마이크로플레이트를 빛으로부터 보호하고 반응을 45분 동안 진행시키고 광으로부터 보호한 후, 상기 기재된 설정 및 표 14에 제공된 필터 쌍(355 nm 여기, 510 nm 방출)을 사용하여 마이크로플레이트를 측정하였다.
본원에 개시된 바와 같이, W 및 Y 아미노산 유형의 모든 아미노산을 표지하기 위해, 120 μL의 각 희석 단백질 용액을 96-웰 마이크로플레이트(Grenier Bio One UV 투과성 플레이트 카탈로그 # 655801)에 첨가하였다. 논의된 바와 같이 표지화 반응을 삼중으로 수행하였으므로, 마이크로플레이트 당 3 가지 기술적 복제물 웰은 동일한 희석 단백질 용액을 함유하였다. 추가로, 3 개의 웰을 완충액(PBS)으로만 채웠는 데, 이들 웰이 본원에 개시된 바와 같은 배경 보정에 사용될 것이기 때문이다. 그런 다음, 120 μL의 WY-표지화 용액을 마이크로플레이트의 모든 단백질 및 완충액 함유 웰에 첨가하였다. 다음으로, 마이크로플레이트를 투과조명기(제품 # NEB-MLB-16)의 중심에 두고, 마이크로플레이트를 302 nm UB 파장 설정 및 100%(최대) 강도를 사용하여 30분 동안 조사하였다. 플레이트를 기재된 설정을 사용하고 순차적으로 표 14에 기재된 필터 쌍으로 측정하였고; 플레이트를 순차적으로 W 필터 쌍(355 nm 여기 및 510 nm 방출), Y 파장 쌍 1 필터 쌍(320 nm 여기 및 460 nm 방출), 및 Y 파장 쌍 2 필터 쌍(320 nm 여기 및 510 nm 방출)으로 측정하였다. 본원에 개시된 바와 같은 디콘볼루션 표준(부갑상선 호르몬, PH)을 사용한 W 및 Y 아미노산 유형으로부터의 형광 강도의 디콘볼루션은 Y 아미노산 유형에 대한 교정 곡선이 제시될 때 아래에 논의될 것이다.
본원에 개시된 바와 같이, 각 아미노산 유형의 측정된 표지는 배경 보정될 수 있다. 이것은 상기 기재된 바와 같이, 형광 염료 용액을 표지화 반응 동안 공급된 단백질-함유 용액의 부피와 동일한 부피의 완충액과 합한 다음, 각 염료 및 단백질 용액에 대해 검출된 형광 강도에서 염료 및 완충액 용액에서 검출된 형광 강도를 빼서 배경 보정된 형광 측정을 제공함으로써 달성하였다. 이 단계를 모든 표지화 반응에 대해 수행하였다. 모든 표지화 반응에 걸쳐 수행된 바와 같이 이 단계의 대표적인 예를 제공하기 위해, K 아미노산 유형을 표지화하기 위해 측정된 표지의 원시 값은 아래 표 15 및 16에 제공되어 있다:
표 15: K 아미노산 유형을 표지화할 때 단백질 용액 및 염료 용액에 대해 측정된 형광 강도 값
Figure pct00402
측정된 염료 형광 강도 값의 평균을 계산하였으며, 이는 3.156이었다. 그런 다음 염료 및 완충액 용액에서 검출된 형광 강도를 제공하는 이 값을 각 염료 및 단백질 용액에서 검출된 형광 강도에서 빼서 배경 보정된 형광 강도를 제공하였다. 3.156을 표 15에서 "단백질"로 표지된 모든 웰로부터 검출된 형광 강도에서 빼서, 표 16에서 하기 배경 보정된 형광 강도 값을 생성하였다.
표 16: K 아미노산 유형을 표지화할 때 단백질 용액에 대해 측정된 배경 보정된 형광 강도 값
Figure pct00403
측정된 모든 형광 강도의 배경 보정을 상기 예시된 바와 같이 수행하였다.
표지된 단백질 용액의 아미노산 농도를 각 아미노산 유형의 표지된 아미노산의 배경-보정 형광 강도에 대해 표시하였고 이 교정 플롯 데이터를 교정 곡선을 제공하기 위해 맞췄다. 각 표지된 단백질 용액의 각 아미노산 유형의 아미노산 농도는 단백질 용액의 단백질 농도에 단백질의 하나의 분자에서 표시된 아미노산 유형의 아미노산 수(단백질의 아미노산 서열에서 아미노산의 발생 수를 계수함으로써 제공됨)를 곱한 값이다. 각 아미노산 유형의 아미노산 농도와 각 아미노산 유형의 표지된 아미노산의 형광 강도 사이의 관계는 선형일 수 있고, 선형 교정 곡선은 선형 최적 맞춤을 제공하는 선형 회귀를 사용하여 계산될 수 있다. 본원에 개시된 바와 같이, 각 아미노산 유형의 아미노산 농도와 각 아미노산 유형의 표지된 아미노산의 형광 강도 사이의 관계는 대안적으로 비선형일 수 있고, 비선형 교정 곡선은 비선형 최적 맞춤을 제공하는 비-선형 회귀를 사용하여 계산될 수 있다. 교정 곡선을 사용하여 임의 단위(AU)의 값을 정량적 값(몰 농도, μM)으로 바꿀 수 있다.
교정 곡선은 본원에 개시된 바와 같이 생성되었다. 교정 플롯은 도 18-20에 제공되어 있고, 교정 곡선의 방정식이 아래에 추가로 제공된다.
K 아미노산 유형에 대한 교정 곡선은 도 18에 제공되어 있다. 비선형 회귀를 사용하여 다항식 맞춤을 계산하였다. 다항식 맞춤은 비선형 맞춤의 한 유형이다. 다른 유형의 비선형 맞춤은 지수, 멱함수, 및 시그모이드 맞춤을 포함한다. K 아미노산 유형의 경우, μM의 [K] 아미노산 농도와 임의 단위의 형광 강도 사이의 관계는 비선형 회귀를 사용하여 계산된 다항식 맞춤에 의해 잘 기재되었다. 다항식 맞춤은 [K(μM)] = a[K F.I. (AU)]4 + b[K F.I. (AU)]3 + c[K F.I. (AU)]2 + d[K F.I. (AU)] + e 형식이었고, 그의 계수는 아래와 같다:
Figure pct00404
따라서, 표지 값(형광 강도)기 이 실시예에서 나중에 환자 샘플에 대해 측정되었고, 교정 곡선을 사용하여 K 아미노산 유형의 측정된 표지 값과 K 아미노산 유형의 아미노산 농도 사이를 전환하였을 때, 하기 관계를 사용하여 임의 단위의 환자 샘플의 K 아미노산 유형에 대해 측정된 형광 강도를 K 아미노산 유형의 아미노산 농도로 전환하였다.
Figure pct00405
C 아미노산 유형에 대한 교정 곡선은 도 19에 제공되어 있다. [C] 아미노산 농도와 형광 강도 사이의 관계는 비선형 회귀를 사용하여 계산된 다항식 맞춤에 의해 잘 설명되었다. 다항식 맞춤은 [C(μM)] = a[C F.I. (AU)]2 + b[C F.I. (AU)] + c의 형식이었고, 그의 계수는 아래와 같다:
Figure pct00406
따라서, 표지 값(형광 강도)이 이 실시예에서 나중에 환자 샘플에 대해 측정되었고, 교정 곡선을 사용하여 C 아미노산 유형의 측정된 표지 값과 C 아미노산 유형의 아미노산 농도 사이를 전환하였을 때, 하기 관계를 사용하여 임의 단위의 환자 샘플의 C 아미노산 유형에 대해 측정된 형광 강도를 C 아미노산 유형의 아미노산 농도로 전환하였다.
Figure pct00407
W 아미노산 유형에 대한 교정 곡선은 도 20에 제공되어 있다. W 아미노산 유형의 경우, 데이터는 원점을 통과하는 선형 맞춤을 사용한 것일 수 있으며, [W(μM)] = a[W F.I. (AU)] 형식이고, 계수 a = 2.315이다.
따라서, 표지 값(형광 강도)이 이 실시예에서 나중에 환자 샘플에 대해 측정되었고, 교정 곡선을 사용하여 W 아미노산 유형의 측정된 표지 값과 W 아미노산 유형의 아미노산 농도 사이를 전환하였을 때, 하기 관계를 사용하여 임의 단위의 환자 샘플의 W 아미노산 유형에 대해 측정된 형광 강도를 W 아미노산 유형의 아미노산 농도로 전환하였다.
Figure pct00408
본원에 개시된 바와 같이, Y 아미노산은 2 개의 파장 쌍 및 디콘볼루션 표준을 사용하여 정량화한다. 파장 쌍 1에서, Y 및 W 아미노산 유형 둘 다의 형광이 관찰된 반면, 파장 쌍 2에서, W 아미노산 유형의 형광이 관찰된다. 여기서 사용된 파장 쌍은 Y 아미노산 유형에 비해 적색 편이된 방출 파장을 갖는 W 아미노산 유형의 이점을 취하므로, W 아미노산 유형은 510의 방출 파장으로 검출될 수 있는 반면 W 및 Y 아미노산 유형은 둘 다 460의 방출 파장으로 검출될 수 있다. 그러나, 별개의 여기 파장 및/또는 별개의 여기 및 방출 파장의 사용이 또한 가능하다. 디콘볼루션 표준은 인간 부갑상선 호르몬(PH)이며, 1 개의 트립토판 아미노산 및 0 개의 티로신 아미노산을 갖는다. 파장 쌍 2에서, 2.33 μM PH에 대해 측정된 0.83의 평균 형광 강도는 2.33 μM W 아미노산에 상응한다. 파장 쌍 1에서, 2.33 μM PH 웰(2.33 μM W 아미노산)에 대해 측정된 평균 형광 강도는 4.13이다. 따라서, 파장 쌍 1에서, W 아미노산의 동일한 농도는 파장 쌍 2에서보다
Figure pct00409
배 더 형광이다.
따라서 4.97을 파장 쌍 2에서 W 아미노산으로부터의 형광을 파장 쌍 1에서의 형광으로 전환하기 위한 파장 신호 전환으로 사용하였다. 파장 쌍 2에서 각 배경 보정된 형광 강도 값에 파장 신호 전환을 곱하였고, 이 결과를 파장 쌍 1에서 W 및 Y 아미노산에 대한 각 상응하는 배경 보정된 형광에서 뺐다. 이것은 파장 쌍 1에서 Y 아미노산 유형으로부터의 형광을 나타낸다.
이들 단계의 예로서, 배경 보정된 형광 강도 값을 파장 쌍 1 및 파장 쌍 2에서 BSA의 60 μM 용액에 대해 측정하였다. 파장 쌍 1에서 BSA의 이 용액의 배경 보정된 형광 강도는 297.26 AU였다. 파장 쌍 2에서 BSA의 동일한 용액의 배경 보정된 형광 강도는 38.88 AU였고, 이것은 BSA 내의 W 아미노산 유형의 잔기로부터의 형광을 제공하였다.
파장 쌍 2에서 이 값(38.88 AU)에 파장 신호 전환(4.97)을 곱하여 파장 쌍 1에서 BSA 내의 W 아미노산 유형의 잔기로부터의 형광을 제공하였으며, W 아미노산 유형 및 Y 아미노산 유형으로부터 두 형광이 검출된다. 38.88 AU x 4.97 = 193.23 AU는 파장 쌍 1에서 BSA의 W 아미노산 유형에 의해 제공된다. 그런 다음, 파장 쌍 1에서 W 아미노산 유형의 형광을 파장 쌍 1에서 W 및 Y 아미노산 유형의 형광에서 빼서, 파장 쌍 1에서 Y 아미노산 유형으로부터의 형광을 제공하였다. 297.26 AU - 193.23 AU = 103.90 AU.
Y 아미노산 유형의 아미노산 농도를 파장 쌍 1에서 이 방식으로 계산된 Y 아미노산 유형의 형광 강도에 대해 표시하고 선형 회귀를 파장 쌍 1에서 Y 아미노산 유형으로부터 형광 강도를 수행하여, Y 아미노산 유형의 아미노산 농도와 Y 아미노산 유형의 형광 강도 사이의 하기 관계를 생성하였다:
Figure pct00410
환자 샘플의 측정
이제 환자 샘플에 대해 측정된 임의 단위(AU)의 형광 강도를 환자 샘플에 대해 상응하는 몰 아미노산 농도(μM)로 변환하는 데 사용되는 교정 곡선을 계산하여, 환자 샘플의 측정을 논의한다.
환자 PPP, PRP, PPP_50, 및 PRP_50 샘플을 마이크로플레이트에서 K-표지화 용액, C-환원 용액 후 C-표지화 용액, 및 WY-표지화 용액을 사용하여 표지하였다. 표지화 단계는 교정 플레이트의 생성에 대해 이전에 기재된 것과 동일하다. 그러나 편의상 이들은 또한 사용된 특이적 마이크로플레이트 레이아웃에 따라, 아래에 표시되어 있다(그러나 이들은 당업계에 알려진 임의의 수단 및 임의의 형식에 의해 표지될 수 있음).
모든 환자 샘플용 플레이트 레이아웃은 표 17에 제공되어 있다.
표 17: 환자 샘플용 플레이트 레이아웃
Figure pct00411
표 17에서, 용어 "Pat. n"은, 여기서 n = 1:20이며, 표 13에 제공된 샘플 유형의 n번째 환자를 지칭한다. 예를 들어, PPP 샘플의 경우, Pat. 16은 19 세 여성의 샘플 16A이다. 또 다른 예로서, PRP 샘플의 경우, Pat. 16은 73 세 남성의 샘플 21C이다.
플레이트에 연회색으로 표시된 단백질은 스케일링(scaling)에 사용되는 데, 기본 자동 이득 선택 특징이 측정된 모든 플레이트에 대해 사용되었기 때문이다. 이들은 측정된 환자 샘플로부터 형광을 교정 플레이트(교정 곡선을 생성하는 데 사용됨) 상의 동등한 형광으로 변환하여, 표준 상수 이득 실험 설정에서 관찰되는 것으로 보정하는 데 사용된다. 그러나, 이들은 일정한 이득 특징이 사용될 때 표준 검정 작동에 필요하지 않는다.
표 12에 설명된 바와 같이, 환자 혈장 샘플을 표지화 반응을 수행하기 직전에 희석하여 형광 강도와 아미노산 농도 사이의 가장 정확한 전환을 위해 측정된 형광 강도의 범위를 교정 곡선에 의해 포괄된 범위로 가져왔다.이것은 임의적인 단계이며, 대안으로서 더 넓은 범위의 교정 곡선을 계산할 수 있다. 사용된 희석 계수는 표 18에 강조 표시되어 있다.
표 18: 표시된 표지화 반응 직전에 희석
Figure pct00412
모든(PPP, PRP, PPP_50, 및 PRP_50 K 표지화) 플레이트에 대한 각 표지화 반응을 수행하기 위해 수행된 단계:
1. 100 μL의 표시된 환자 샘플을 Grenier Bio One 카탈로그 # 655076 마이크로플레이트의 각 표지된 백색 웰에 첨가하였다
2. 100 μL의 표시된 단백질 용액을 각 연회색 웰에 첨가하였다
3. 100 μL PBS 완충액을 각 검정색 염료 웰에 첨가하였다
4. 100 μL의 표시된 환자 샘플 또는 PBS를 각 진회색 웰에 첨가하였다
5. 100 μL의 PBS를 각 진회색 웰에 첨가하였다
6. 100 μL의 K-표지화 용액을 각 검정색 웰에 첨가하였다
7. 100 μL의 K-표지화 용액을 각 연회색 웰에 첨가하였다
8. 100 μL의 K-표지화 용액을 각 표지된 백색 웰에 첨가하였다
9. 단계 8을 완료한 직후, 마이크로플레이트를 상기 기재된 설정 및 표 14에 제공된 필터 쌍(355 여기, 460 방출)을 사용하여 측정하였다.
모든(PPP, PRP, PPP_50, 및 PRP_50) C 표지화 플레이트에 대해:
1. 200 μL의 표시된 용액(백색 웰에 표시된 각 환자 샘플, 연회색 웰에 표시된 단백질, 및 검정색 웰의 경우 완충액)을 마이크로튜브에서 200 μL C-환원 용액과 합하고 빛으로부터 30분 동안 보호하였다. 진회색 웰에서 표시된 200 μL의 환자 샘플 또는 표시된 바와 같은 PBS를 또한 200 μL PBS와 합하고 빛으로부터 30분 동안 보호하였다.
2. 40 μL의 각 환자 샘플 용액(표시된 환자 샘플 + C-환원 용액)을 Grenier Bio One 카탈로그 # 655076 마이크로플레이트의 백색 웰에 첨가하였다
3. 40 μL의 각 단백질 용액(표시된 단백질 + C-환원 용액)을 연회색 웰에 첨가하였다
4. 40 μL의 완충액 + C-환원 용액을 검정색 웰에 첨가하였다
5. 40 μL의 표시된 환자 샘플 + PBS 용액 또는 PBS 용액을 진회색 웰에 첨가한 후, 각 웰에 또 다른 40 μL PBS를 첨가하였다
6. 40 μL C-표지화 용액을 검정색 웰에 첨가하였다
7. 40 μL C-표지화 용액을 각 검정색 웰에 첨가하였다
8. 40 μL C-표지화 용액을 각 연회색 웰에 첨가하였다
9. 40 μL C-표지화 용액을 각 표지된 백색 웰에 첨가하였다
10. 플레이트를 빛으로부터 보호한 정지 상태 하에 45분 동안 반응을 진행시켰다
11. 마이크로플레이트를 상기 기재된 설정 및 표 14에 제공된 필터 쌍(355 nm 여기, 510 nm 방출)을 사용하여 측정하였다
모든(PPP, PRP, PPP_50, 및 PRP_50) WY 표지화 플레이트에 대해:
1. 120 μL의 표시된 환자 샘플을 Grenier Bio One UV 투과성 플레이트 카탈로그 # 655801의 각 표지된 백색 웰에 첨가하였다
2. 120 μL의 표시된 단백질 용액을 각 연회색 웰에 첨가하였다
3. 120 μL의 PBS를 각 검정색 웰에 첨가하였다
4. 120 μL의 각 표시된 환자 샘플을 각 진회색 웰에 첨가하고 120 μL PBS를 완충액 웰에 첨가하였다
5. 120 μL의 PBS를 각 진회색 웰에 첨가하였다
6. 120 μL WY-표지화 용액을 각 검정색 웰에 첨가하였다
7. 120 μL WY-표지화 용액을 각 연회색 웰에 첨가하였다
8. 120 μL WY-표지화 용액을 각 표지된 백색 웰에 첨가하였다
9. 마이크로플레이트
10. 마이크로플레이트를 NEB-MLB-16 투과조명기의 중심에 두고, 마이크로플레이트를 정지 상태 하에 30분 동안 302 nm UB 파장 설정 및 100%(최대) 강도를 사용하여 조사하였다
11. 플레이트를 기재된 설정을 사용하고 순차적으로 표 14에 기재된 필터 쌍으로 측정하고; 플레이트를 W 필터 쌍(355 nm 여기 및 510 nm 방출), Y 파장 쌍 1 필터 쌍(320 nm 여기 및 460 nm 방출), 및 Y 파장 쌍 2 필터 쌍(320 nm 여기 및 510 nm 방출)로 순차적으로 측정하였다
모든 PPP 플레이트(K 아미노산 유형, C 아미노산 유형, W 및 Y 아미노산 유형)에 대해, 표 13에 기재된 샘플을 고려하여 취한 플레이트 레이아웃은 아래와 같았다:
Figure pct00413
모든 PRP 플레이트(K 아미노산 유형, C 아미노산 유형, W 및 Y 아미노산 유형)에 대해, 표 13에 기재된 샘플을 고려하여 취한 플레이트 레이아웃은 아래와 같았다:
Figure pct00414
모든 PPP_50 플레이트(K 아미노산 유형, C 아미노산 유형, W 및 Y 아미노산 유형)에 대해, 표 13에 기재된 샘플을 고려하여 취한 플레이트 레이아웃은 아래와 같았다:
Figure pct00415
모든 PRP_50 플레이트(K 아미노산 유형, C 아미노산 유형, W 및 Y 아미노산 유형)에 대해, 표 13에 기재된 샘플을 고려하여 취한 플레이트 레이아웃은 아래와 같았다:
Figure pct00416
하기 원시 형광 강도를 K 아미노산 유형의 표지화를 위해 측정하였다:
Figure pct00417
Figure pct00418
Figure pct00419
Figure pct00420
하기 원시 형광 강도를 C 아미노산 유형의 표지화를 위해 측정하였다:
Figure pct00421
Figure pct00422
Figure pct00423
Figure pct00424
하기 원시 형광 강도를 W 아미노산 유형의 표지화를 위해 측정하였다:
Figure pct00425
Figure pct00426
Figure pct00427
Figure pct00428
하기 원시 형광 강도를 Y 아미노산 유형에 대해 측정하였다:
Figure pct00429
Figure pct00430
Figure pct00431
Figure pct00432
실시예 11: 관심 환자 단백체 및 하위단백체에 대한 실험적 참조선의 결정
표지된 아미노산 유형의 아미노산 농도 계산
모든 환자 샘플 유형 및 모든 유형의 표지화 반응에 대해, 실시예 10에 제공된 원시 임상 데이터를 각 염료-함유 웰에서 환자 샘플과 혼합하지 않고 염료 단독에 대해 측정된 평균 형광 강도를 뺀 다음, 염료가 없는 특정 환자 샘플에 대해 측정된 형광 강도(이는 본원에 개시된 바와 같은 배경 보정 단계 동안 제거될 수 있는 자가형광을 제공함). 이것은 미반응된 염료로 인한 형광 강도 및 표시된 파장에서 환자 샘플의 임의의 자가형광으로 인한 형광 강도를 둘 다 제거하였다. 예를 들어, 실시예 10에서 PPP 샘플 내 K 아미노산 유형을 표지화하기 위해 제공된 원시 형광 강도 데이터는 플레이트 레이아웃과 함께, 아래에 재현된다:
Figure pct00433
Figure pct00434
원시 형광 강도 데이터를 배경 보정하기 위해, "염료" 웰의 평균을 계산하였으며, 이는 3.704였다. 먼저, 3.704를 염료를 받은 각 웰에서 뺐으며, 이 경우 K-표지화 용액이다. 미반응된 염료의 형광은 염료를 받지 않은 웰(진회색 웰)에서 빼지 않았다. 결과는 아래에 제시되어 있다.
Figure pct00435
다음으로, 각 표지되지 않은 혈장 샘플에서 임의의 자가형광을 제거하기 위해, 실시예 10(진회색 웰)에서 염료 아닌 완충액(PBS)을 받은 표시된 혈장 샘플로부터의 형광을 상기 표지된 환자 샘플의 모든 웰에서 뺐다. 예를 들어, K-표지화 용액을 받지 않은 샘플 1A는 1.68(웰 B10)의 원시 형광 강도를 가졌으며; 이는 K-표지화 용액을 받은 샘플 1A 웰(웰 A1-3)의 형광 강도에서 뺀 것이다. 결과는 웰 A1-3에 제공된 환자 1A에 대한 3 가지 기술적 복제물에 대해 1868.61, 1829.61, 및 1811.61이었다. 연회색의 단백질-함유 웰(E7-H9)은 임의의 혈장 샘플을 받지 않았기 때문에, 혈장 값을 이들 웰에서 빼지 않았다. 추가의 예로서, 이 접근법을 모든 환자 PPP K-표지화 샘플에 대해 수행하였고, 결과는 표 19에 재현되어 있다.
표 19: PPP 샘플의 K 아미노산 유형에 대한 배경 보정된 형광 강도
Figure pct00436
상기 예시된 배경 보정 단계를 실시예 10에 제공된 모든 원시 표지화 형광 강도 데이터에 대해 수행하였다. 이는 PPP, PRP, PPP_50, 및 PRP_50 샘플 유형을 포함하고 각 샘플 유형에 대해, K-표지화 마이크로플레이트, C-표지화 마이크로플레이트, W-표지화 마이크로플레이트, 및 Y-표지화 마이크로플레이트의 두 파장 쌍(파장 쌍 1 및 파장 쌍 2)을 포함한다.
자동 이득 조정이 선택되었기 때문에, 단백질-함유 웰을 사용하여 이 마이크로플레이트에서 단백질 용액에 대해 측정된 형광 강도 값을 K 아미노산 유형에 대한 교정 플레이트 상의 동일한 단백질 용액에 대해 측정된 형광 강도 값으로 스케일링하였다. 이것은 본 플레이트와 교정 곡선이 계산된 교정 플레이트 사이의 가변 이득을 균등화하는 데 사용되는 스케일링 계수를 제공하였다. 이 단계는 일반적으로 필요하지 않고 가변 이득 설정을 보상하기 위해 이 예에서 수행하였다. 결과는 PPP 샘플 유형의 K-표지화 플레이트에 대해 아래에 예시되어 있다.
Figure pct00437
1.02의 스케일링 계수는 교정 곡선을 계산하는 데 사용된 교정 플레이트에 대해 측정된 값이 본 플레이트에 대한 동일한 용액에 대해 측정된 값보다 2% 더 밝음을 나타내므로, 본 플레이트에 대해 측정된 값에 1.02를 곱하여 교정 곡선 플레이트를 스케일링하였다. 결과는 아래에 재현되어 있다.
Figure pct00438
상기 예시된 스케일링 단계는 실시예 10에 제공된 원시 표지화 형광 강도 데이터로부터 계산된 모든 배경 보정된 표지화 형광 강도 데이터에 대해 수행하였다. 이것은 PPP, PRP, PPP_50, 및 PRP_50 샘플 유형을 포함한다. 각 샘플 유형에 대해, 이는 K-표지화 형광 강도 데이터, C-표지화 형광 강도 데이터, W-표지화 형광 강도 데이터, 및 Y-표지화 형광 강도 데이터를 포함한다.
Y-표지화 형광 강도 데이터에 관하여, 본원에 개시되고 실시예 10에 예시된 접근법을 수행하였으며 여기서 파장 쌍 2에서 Y 아미노산 유형에 대한 배경 보정된 형광 강도 값에 신호 전환 계수(실시예 10에서 계산된 바와 같은 4.97)를 곱하고 그 결과를 파장 쌍 1에서 Y 아미노산 유형에 대한 배경 보정된 형광 강도 값에서 뺐다. 파장 쌍 1에서, Y 및 W 아미노산 유형으로부터의 두 형광이 관찰될 수 있고, 검출 단계 단계에서 이 디콘볼루션은 W 아미노산 유형의 형광에 대한 임의의 기여를 제거하여, Y-표지화 형광 강도 데이터를 배타적으로 나타낸다. 추가 예로서, Y-표지화 파장 쌍 1 및 파장 쌍 2에서 PRP 샘플 유형에 대한 배경 보정된 형광 강도 값은 아래에 제공되어 있다.
파장 쌍 1
Figure pct00439
파장 쌍 2
Figure pct00440
파장 쌍 2 형광 강도에 스케일링 계수, 4.97을 곱하여, 파장 쌍 1에서 W 아미노산 유형의 아미노산의 형광 강도를 나타내었다
Figure pct00441
그런 다음 이들 값을 제공된 파장 쌍 1 값(W 및 Y 아미노산 유형 둘 다의 기여 포함)을 빼서, 파장 쌍 1에서 Y 아미노산 유형으로부터 배타적으로 형광 강도 및 따라서 Y-표지화 형광 강도 데이터를 나타낸다.
Figure pct00442
그런 다음 Y-표지화 형광 강도 데이터를 K-표지화, C-표지화, 및 W-표지화 형광 강도 데이터와 동일한 방식으로 스케일링하였다.
형광 강도(C F.I., K F.I., W F.I., 및 Y F.I.)와 아미노산 농도([C(μM)], [K(μM)], [W(μM)], 및 [Y(μM)]) 사이의 관계는 실시예 10에서 각 아미노산 유형(K, C, W, 및 Y)에 대한 교정 곡선을 사용하여 확립하였다. 변형은 표 20에 요약되어 있다.
표 20: AU의 형광 강도와 μM의 아민(amin)산 농도 사이를 변환하기 위한 교정 곡선
Figure pct00443
표 20에 제공된 C 아미노산 유형 변환을 모든 샘플 유형(PPP, PRP, PPP_50, PRP_50)의 스케일링된 C 형광 강도 데이터에 적용하였다. 표 20에 제공된 K 아미노산 유형 변환을 모든 샘플 유형(PPP, PRP, PPP_50, PRP_50)의 스케일링된 K 형광 강도 데이터에 적용하였다. 표 20에 제공된 W 아미노산 유형 변환을 모든 샘플 유형(PPP, PRP, PPP_50, PRP_50)의 스케일링된 W 형광 강도 데이터에 적용하였다. 표 20에 제공된 Y 아미노산 유형 변환을 모든 샘플 유형(PPP, PRP, PPP_50, PRP_50)의 스케일링된 Y 형광 강도 데이터에 적용하였다.
예를 들어, C 아미노산 유형에 대한 스케일링된 PPP 데이터는 다음과 같다:
Figure pct00444
표 20에 제공된 C 아미노산 유형 변환을 수행하여 아래의 마이크로몰 C 아미노산 농도, [C(μM)]를 산출하였다
Figure pct00445
마지막으로, 각 아미노산 유형에 대해 계산된 아미노산 농도에 표 18에 제공된 희석 계수를 곱하였다. 이것은 희석되지 않은 혈장 용액의 아미노산 농도를 제공하였다. 예로서, PPP 샘플 유형, 환자 1(샘플 1A), 기술적 복제물 2에 대한 C 표지화 반응에 대해 측정된 희석된 아미노산 농도는 389였다. 표 24 및 30에 제공된 희석은 60이므로, 이 샘플의 이러한 기술적 복제물에 대한 (희석되지 않은 PPP 혈장의) 아미노산 농도는 389 μM x 60 = 23,340 μM이었다.
각 환자 샘플에 대한 아미노산 농도(μM)
지금까지, 상세하게 설명된 모든 단계는 환자(희석되지 않음) 혈장 혈장 샘플에 대한 μM의 아미노산 농도를 계산하는 데 사용되었다.
이들 단계 모두를 본원에 개시된 설명된 바와 같이 수행하고 각 환자, 기술적 복제물, 아미노산 유형, 및 샘플 유형에 대해 설명하였을 때, μM의 아미노산 농도는 아래에서 PPP에 대해 표 21.1 및 21.2, PRP에 대해 표 22.1 및 22.2, PPP_50에 대해 표 23.1 및 23.2, PRP_50에 대해 표 24.1 및 24.2에 제시된 바와 같았다.
표 21.1
Figure pct00446
표 21.2
Figure pct00447
표 22.1
Figure pct00448
표 22.2
Figure pct00449
표 23.1
Figure pct00450
표 23.2
Figure pct00451
표 24.1
Figure pct00452
표 24.2
Figure pct00453
N-차원 공간에서 아미노산 농도 결과를 표시하여 본 발명의 방법에 의해 개시된 참조선을 나타낸다
본 발명은 2 개 이상의 표지된 아미노산 유형의 아미노산 농도 또는 표지 값에 의해 제공된 관심 단백체 또는 하위단백체에 대한 참조가 관심 단백체 또는 하위단백체의 총 단백질 농도의 공통 파라미터의 함수라는 발견에 기반한다. 따라서, 관심 단백체 또는 하위단백체의 총 단백질 농도가 변화함에 따라, 선은 N-차원 공간에서 형성된다. 이 개념은 도 1 및 실시예 1-9에 설명되어 있고, 도 17에 추가로 예시되어 있다.
본 발명의 방법에 의해 교시된 N-차원 공간에서 선의 개념은 도 21에서 관심 PPP 단백체에 대해 제공된다. 표 21.1 및 21.2에서 각 기술적 복제물에 대해 제공된 아미노산 농도의 평균이 제시되며, 4번째 차원은 회색조로 비색적으로 표시된다. 도 21에서, N-차원 공간(N=4, 4-차원 공간)에서 선의 개념은 데이터세트를 통해 그려진 선으로 예시된다.
관심 PPP 단백체 및 다른 관심 단백체(예를 들어 PRP, PPP_50, 및 PRP_50)에 대한 N-차원 공간에서 선의 정확한 위치를 계산하기 위해, N-차원 공간에서 선의 방정식을 실험적으로 계산하였다. 나중에, N-차원 공간에서 이 실험적 선의 방정식을 관심 PPP 단백체에 대해 공개적으로 이용가능한 단백질 발현 데이터를 사용하여 계산된 N-차원 공간에서 이론적 선의 방정식과 비교하였다.
관심 PPP, PRP, PPP_50, 및 PRP_50 단백체 및 하위단백체에 대한 실험적 참조선 계산
본원에 개시된 본 발명의 방법에서, 관심 단백체 또는 하위단백체의 참조선을 정의하는 벡터 함수는 예를 들어 측정된 아미노산 농도를 당업계의 표준 방법을 사용하여 계산된 총 단백질 농도(예를 들어 질량 단백질 농도)로 나눔으로써, 실험적으로 계산될 수 있다. 이를 위해, 각 환자 샘플의 총 단백질 농도를 제조업체의 제공된 지침을 사용하여 비시초닌산 단백질 결정 키트(Product # BCA1-1KT, Millipore Sigma)를 사용하여 μg/mL로 측정하였다. 총 단백질 농도의 결정을 위해 비시초닌산(BCA) 표준 검정을 사용하였다. 간단히 말해서, 단백질 내의 펩티드 결합은 존재하는 단백질의 양에 비례하는 감소량에 따라 Cu2+를 Cu1+로 환원시킨다. 그런 다음 BCA는 알칼리성 환경에서 Cu1+와 보라색-청색 복합체를 형성하고, 이 복합체는 알려진 농도의 단백질에 대해 생성된 표준 곡선과의 비교에 의해 결정된 단백질 농도(질량 기준, 예컨대 μg/mL)로 562 nm에서 흡광도 측정을 통해 정량화되며, 여기서 1.00 mg/mL BSA이다.
제조업체의 지침에 따라 이 방식으로 측정된 각 환자 샘플의 총 단백질 농도에 대한 결과는 표 25에 제공되어 있다. 1:60 희석, 1:2 희석, 및 1:1 희석(순, 희석되지 않음)을 포괄하는 3 개의 총 단백질 농도를 각 샘플에 대해 제공한다. 표 12 및 표 18에 설명된 바와 같이, PPP 및 PRP 표지화 마이크로플레이트에 대해 1:60 희석을 사용하고, PPP_50 및 PRP_50 K 및 WY-표지화 마이크로플레이트(W 및 Y 아미노산 유형의 아미노산 농도를 나타내는 WY 표지화 마이크로플레이트)에 대해 1:2 희석을 사용하고, PPP_50 및 PRP_50 C 표지화 마이크로플레이트에 대해 1:1 희석을 사용하였다. 실험적 참조선을 계산할 때, 각 아미노산 유형의 아미노산 농도를 해당 아미노산 유형에 대한 아미노산 농도가 측정된 희석에서 총 단백질 농도에 대해 표시하였다. 표시된 희석은 참조의 용이성을 위해 표 25에 굵게 표시되어 있다.
표 25: 실험적 참조선의 계산을 위해 BCA 검정으로 측정된 각 환자 샘플의 각 단백질의 총 단백질 농도
Figure pct00454
Figure pct00455
Figure pct00456
본원에 개시된 본 발명의 방법에서, 관심 PPP, PRP, PPP_50 및 PRP_50 단백체에 대한 참조선은 본 발명의 방법을 사용하여 실험적으로 계산할 수 있다. 이를 달성하기 위해, 이 실시예에서 K, C, W, 및 Y 측정된 표지 값으로부터 계산된 아미노산 유형(K, C, W, 및 Y)의 측정된 아미노산 농도를 실시예 10에 제공된 각 샘플에 대한 μg/mL의 측정된 총 단백질 농도에 대해 표시하였고, 각 샘플 유형 및 각 아미노산 유형에 대한 선형 회귀를 수행하였다. PRP_50 샘플 유형을 제외한 모든 샘플 유형에 대해, 선형 회귀를 원점(0,0)을 통과하도록 제한하였다. 이 선형 회귀의 출력을 사용하여 μg/mL의 총 단백질 농도의 벡터 함수 형태로 각 관심 단백체 및 하위단백체에 대한 실험적 참조를 제공하였다.
결과를 도 22-28에 표시하였다. 도 22는 관심 PPP 및 PRP 단백체에 대한 실험적 참조선의 K 구성요소를 제공하고, 도 23은 관심 PPP 및 PRP 단백체에 대한 실험적 참조선의 C 구성요소를 제공하고, 도 24는 관심 PPP 및 PRP 단백체에 대한 실험적 참조선의 W 구성요소를 제공하고, 도 25는 관심 PPP 및 PRP 단백체에 대한 실험적 참조선의 Y 구성요소를 제공한다. 추가로, 도 26은 관심 PPP_50 및 PRP_50 하위단백체에 대한 실험적 참조선의 K 구성요소를 제공하고, 도 27은 관심 PPP_50 및 PRP_50 하위단백체에 대한 실험적 참조선의 C 구성요소를 제공하고, 도 28은 관심 PPP_50 및 PRP_50 하위단백체에 대한 실험적 참조선의 W 구성요소를 제공한다. 모든 경우에, 3 가지 기술적 복제물의 평균이 제시되며, 3 가지 기술적 복제물에 걸친 표준 편차가 또한 아미노산 농도의 계산 및 μg/mL의 총 단백질 농도의 계산 둘 다에 제공된다.
각 그래프에는, 최적선(best-fit-line)의 방정식이 포함되어 있다. 모든 샘플 유형에 걸쳐, 모든 아미노산 유형은 단백질 농도, t의 공통 파라미터의 함수이며, 여기서 μg/mL로 표현된다. 각 최적선은 각 관심 단백체 또는 하위단백체를 정의하는 파라미터 방정식 세트 내에서 하나의 파라미터 방정식(t의 함수)을 제공한다. 동등하게, 각 최적선은 각 관심 단백체 또는 하위단백체를 설명하는 벡터 함수(t의 함수)의 하나의 구성요소를 제공한다.
추가로, 벡터 함수는 관심 단백체 또는 하위단백체의 총 질량 농도가 아닌 총 몰 농도의 측면에서 제공될 수 있다. 이를 위해, 질량 단백질 농도와 몰 단백질 농도 사이의 변환을 각 관심 단백체 및 하위단백체에 대해 확립하였다. 먼저, 공개적으로 이용가능한 인간 단백질 아틀라스를 액세스하였고, 표적 단백질이 ELISA와 같은 면역검정을 사용하여 측정된 공개된 연구 논문에 기반하여 혈액으로 능동적으로 분비된 419 개의 단백질에 대한 참조 혈장 농도를 제공하는 표를 다운로드하였다(https://www.proteinatlas.org/humanproteome/blood/proteins+detected+by+immunoassa). 질량 기즌의 단백질 농도를 다양한 단위(g/L 내지 ng/L)로 제공하고 각 제공된 질량 단백질 농도를 μg/mL의 표준 단위로 전환하였다. 각 단백질의 몰 단백질 농도를 계산하기 위해, μg/mL 단백질 농도를 단백질 분자량으로 나눈 다음 1000을 곱하여 μg/mL의 단백질 농도를 몰 단백질 농도(μM)로 전환하였다. 이러한 총 몰 단백질 농도 값을 단백체 또는 하위단백체의 모든 단백질에 걸쳐 합하였다. 관심 PPP 및 PRP 단백체의 경우, 데이터세트 내 모든 단백질의 몰 농도를 합하였다. 원심 여과 단계로 인해 50 kDa 미만의 분자량을 갖는 단백질을 함유하지 않은 관심 PPP_50 및 PRP_50 저분자량 하위단백체의 경우, 50 kDa 초과의 분자량을 갖는 단백질은 합한 단백질 농도에 포함되지 않았다. 이것은 Microsoft Excel에서 논리적 플래그(logical flag)로 수행하였다.
μg/mL 및 μM의 총 혈장 단백체 농도는 아래 표 26에 제공되어 있다.
표 26
Figure pct00457
표 26은 추가로 환자 샘플에 대한 μg/mL의 측정된 총 단백질 농도를 몰 단백질 농도로 계산하는 데 사용되는 전환 계수를 제공한다: 관심 PPP 및 PRP 단백체의 경우 0.01551 μM /(μg/mL), 및 필터링된 관심 PPP_50 및 PRP_50 하위단백체의 경우 0.03132 μM /(μg/mL).
이러한 전환 계수가 사용되었을 때, 각 샘플 유형에 대해 측정된 아미노산 농도는 상응하는 관심 단백체의 총 몰 단백질 농도에 대해 표시될 수 있으며, 결과는 도 29-35에 제시된다. 도 29는 관심 PPP 및 PRP 단백체에 대한 실험적 참조선의 K 구성요소를 제공하고, 도 30은 관심 PPP 및 PRP 단백체에 대한 실험적 참조선의 C 구성요소를 제공하고, 도 31은 관심 PPP 및 PRP 단백체에 대한 실험적 참조선의 W 구성요소를 제공하고, 도 32는 관심 PPP 및 PRP 단백체에 대한 실험적 참조선의 Y 구성요소를 제공한다. 추가로, 도 33은 관심 PPP_50 및 PRP_50 하위단백체에 대한 실험적 참조선의 K 구성요소를 제공하고, 도 34는 관심 PPP_50 및 PRP_50 하위단백체에 대한 실험적 참조선의 C 구성요소를 제공하고, 도 35는 관심 PPP_50 및 PRP_50 하위단백체에 대한 실험적 참조선의 W 구성요소를 제공한다. 도 22-28에서는 희석된 아미노산 농도 및 단백질 농도가 제공된 반면, 도 29-35에서는 희석되지 않은 아미노산 농도 및 단백질 농도가 제공된다. μg/mL의 단백질 농도를 측정하기 전에 동일한 희석을 표지화 반응 전에 수행하였기 때문에, 이는 제공된 실험적 참조선의 기울기에서 제외되는 데, 분자 및 분모 둘 다에 동일한 상수를 곱하기 때문이다. 모든 경우에, 3 가지 기술적 복제물의 평균이 제시되며, 아미노산 농도의 계산을 위해 3 가지 기술적 복제물에 걸친 표준 편차가 또한 제공된다.
각 그래프에는, 최적선의 방정식이 포함된다. 모든 샘플 유형에 걸쳐, 모든 아미노산 유형은 총 단백질 농도, t의 공통 파라미터의 함수이며, 여기서 μM로 표현된다. 각 최적선은 각 관심 단백체 또는 하위단백체를 정의하는 파라미터 방정식 세트 내의 하나의 파라미터 방정식(t의 함수로서)을 제공한다. 동등하게, 각 최적선은 각 관심 단백체 또는 하위단백체를 설명하는 벡터 함수의 하나의 구성요소(t의 함수로서)를 제공한다.
각 아미노산 유형 및 샘플 유형에 대한 아미노산 농도 / 총 단백질 농도 데이터에 대한 선형 맞춤은 각 관심 단백체 또는 하위단백체를 설명하는 실험적으로 계산된 벡터 함수의 해당 아미노산 유형에 대한 계수를 제공한다. 각 아미노산 유형, 및 각 관심 단백체 또는 하위단백체에 대한 실험적 벡터 함수 계수는 아래 표 39-42에 제공되어 있다. 표 27은 관심 PPP 및 PRP 단백체에 대해 μg/mL의 총 단백질 농도 t에 대한 계수(w K , w C , w W ,w Y 값)를 제공한다. 표 40은 관심 PPP_50 및 PRP_50 하위단백체에 대해 μg/mL의 총 단백질 농도 t에 대한 계수(w C W W 값)를 제공한다. 표 41은 관심 PPP 및 PRP 단백체에 대해 μM의 총 단백질 농도 t에 대한 계수(w K , w C , w W ,w Y 값)를 제공한다. 표 42는 관심 PPP_50 및 PRP_50 하위단백체에 대해 μM의 총 단백질 농도 t에 대한 계수(w C W W 값)를 제공한다.
표 27
Figure pct00458
표 28
Figure pct00459
표 29
Figure pct00460
표 30
Figure pct00461
본원에 개시된 바와 같이, 이들 값은 각 관심 단백체 및 하위단백체를 기재하고 고유하게 식별하는 벡터 함수의 계수를 제공한다. 4 개의 표지된 아미노 표지된 아미노산 유형(K, C, W, Y)의 아미노산 농도에 대한 벡터 함수는 관심 PPP 및 PRP 단백체에 대해 아래에 제공되어 있으며, 여기서 관심 단백체의 총 단백질 농도는 몰 농도 단위로 제공되어 있다.
Figure pct00462
또 다른 예로서, 2 개의 표지된 아미노 표지된 아미노산 유형(C, W)의 아미노산 농도에 대한 벡터 함수는 관심 PPP_50 및 PRP_50 하위단백체에 대해 아래에 제공되어 있으며, 여기서 관심 하위단백체의 총 단백질 농도는 몰 농도 단위로 제공되어 있다.
Figure pct00463
이러한 결과는 관심 PRP 단백체 내의 단백질 서열 당 K, C, W, 및 Y 아미노산의 형균 수가 관심 PPP 단백체보다 지속적으로 약간 더 높다는 것을 나타낸다. 추가로, 예상된 바와 같이 관심 저분자량 PPP_50 및 PRP_50 하위단백체에 대한 단백질 서열 당 평균 아미노산 수는 관심 PPP 및 PRP 단백체에 대한 단백질 서열 당 평균 아미노산 수보다 유의하게 더 낮았다.
본 발명의 방법은 또한 참조선이 이론적으로 계산될 수 있음을 제공한다. 관심 PPP 단백체의 경우, 관심 PPP 단백체에 대한 이론적 참조선의 계산하고, 이론적 참조선과 실험적 참조선을 비교할 수 있는 (관심 PPP 단백체에 대해 측정된 데이터를 사용하여)공개적으로 이용가능한 데이터가 이용가능하였다. 공개적으로 이용가능한 데이터에 대해 본원에 개시된 본 발명의 방법을 사용하여 관심 PPP 단백체에 대한 이론적 참조선을 계산하였다.
공개적으로 이용가능한 인간 단백질 아틀라스 데이터를 액세스하고 상기 기재된 바와 같이 처리하였다. 추가로, 제공된 인간 유전자 명칭은 UniProt 데이터베이스를 사용하여 UniProtKB 식별자에 맵핑하였고, 각 맵핑된 UniProtKB 식별자의 아미노산 서열(단일 문자 약어 사용) 및 분자량을 다운로드하였다. 415 개의 유전자 명칭을 단백질에 성공적으로 맵핑하였고 이들 단백질을 추가 계산을 위해 선별하였다. C, K, W, 및 Y 아미노산 유형이 단백질 아미노산 서열 내에서 발생한 횟수를 계수하기 위해, 아미노산 서열 문자열 내에서 표시된 문자 "C", "K", "W", 또는 "Y"의 발생 수를 Microsoft Excel을 사용하여 계수하였다. 이것은 대안적으로 단순히 단백질 서열에서 아미노산이 반복되는 횟수를 계수하는 Python ProtParam 계수_아미노_산 함수를 사용하여 계산될 수 있다. 각 단백질의 몰 단백질 농도를 계산하기 위해, μg/mL 단백질 농도를 단백질 분자량으로 나눈 다음 1000을 곱하여 μg/mL의 단백질 농도를 몰 단백질 농도(μM)로 전환하였다. 그런 다음, 아미노산 서열 내의 각각 C, K, W, 또는 Y 아미노산의 수에 μM의 몰 단백질 농도를 곱하여 μM의 각 표지된 아미노산 유형(C, K, W, 및 Y)의 총 농도를 계산하였다. 이는 혈소판 부족 혈장(PPP) 내의 각 개별 단백질의 μM의 C, K, W, 및 Y 아미노산 농도를 제공하고, 혈소판 부족 혈장 내의 모든 단백질에 대해 μM의 C, K, W, 또는 Y 아미노산 유형의 아미노산 농도를 액세스하기 위해, C, K, W, 또는 Y 아미노산 유형의 개별 아미노산 농도를 합하였다. 유사하게, 혈소판 부족 혈장 내의 모든 단백질에 대한 μg/mL의 총 단백질 농도를 액세스하기 위해, μg/mL의 개별 단백질 농도를 합하였다. 이는 μM의 C 아미노산 유형의 총 농도([C(μM)]), μM의 K 아미노산 유형의 총 농도([K(μM)]), μM의 W 아미노산 유형의 총 농도([W(μM)]), μM의 Y 아미노산 유형의 총 농도([Y(μM)]), 및 μg/mL의 총 단백질 농도에 대한 단일 값([총 단백질(μg/mL)])을 초래하였다. 추가로, 혈소판 부족 혈장 내의 모든 단백질에 대한 μM의 총 단백질 농도에 액세스하기 위해, μM의 개별 단백질 농도를 합하여, μM의 총 단백질 농도에 대한 단일 값을 제공하였다.
각 값,
Figure pct00464
은 PPP 단백체를 정의하는 벡터 함수에 대한 C, K, W, 및 Y 구성요소의 이론적 계수를 제공하였다. 이들 이론적 계수를 선형 회귀를 사용하여 실시예 11에서 계산된 실험적 계수,
Figure pct00465
과 비교하였다. 결과는 표 31에 제시되어 있다.
표 31: 관심 PPP 단백체(관심 혈장 단백체)에 대한 이론적 및 실험적 벡터 함수 계수의 비교
Figure pct00466
추가로, 각 값,
Figure pct00467
은 PPP 단백체를 정의하는 벡터 함수에 대한 C, K, W, 및 Y 구성요소의 이론적 계수를 제공하였다. 이들 이론적 계수를 선형 회귀를 사용하여 실시예 11에서 계산된 실험적 계수,
Figure pct00468
와 비교하였다. 결과는 표 32에 제시되어 있다.
표 32
Figure pct00469
모든 경우에, 이론적 벡터 함수 계수와 실험 벡터 함수 계수 사이에 긴밀한 일치가 있었다. 이론적 벡터 함수 계수와 실험 벡터 함수 계수 사이의 백분율 차이를 계산하였다. 이론적 벡터 함수 계수를 본 발명의 방법을 사용하여 계산하여 공개적으로 이용가능한 데이터로부터 관심 PPP 단백체에 대해 측정될 참조를 기재하는 벡터 함수를 결정하였다. 이것은 본원에 개시된 바와 같이, 방정식 11을 사용하여 계산하였으며, 평균 서명을 통해 관심 단백체 또는 하위단백체를 기재하는 벡터 함수의 계수를 계산하는데 사용된다. 이를 위해, 방정식 11은 관심 단백체 또는 하위단백체 내의 각 단백질을 개별적으로 측정할 때(개별적으로 분리되거나 표적화되는 것을 포함할 수 있음) 수집된 공개적으로 이용가능한 데이터를 분리하지 않고 관심 단백체 또는 하위단백체 내의 개별 단백질을 표적화 또는 관심 단백체 또는 하위단백체 내의 특정 바이오마커를 특이적으로 찾고 측정하기 위한 테스트를 개발할 필요성 없이 측정될 수 있는 평균 식별 단백체 또는 하위단백체 서명으로 변환한다. 모든 실험적으로 측정된 벡터 함수 계수는 이론적으로 예측된 값의 11% 이내이며, 모든 포함된 벡터 함수 계수에 걸친 평균 백분율 차이는 몰 계수의 경우 0% 및 질량 계수의 경우 2%이다.
실험적 참조선과 이론적 참조선 사이의 이 긴밀한 일치는 평균 단백체 또는 하위단백체 서명(표지 값, 측정된 표지로부터 계산된 총 아미노산 농도, 또는 총 아미노산 농도로부터 계산된 아미노산 수를 통해)의 측정이 면역검정 또는 질량 분광법을 통해서와 같이, 단백체 또는 하위단백체 내의 각 단백질을 개별적으로 측정하고 단백질을 고심해서 식별하고 정량화한 수천 번은 아니더라고 수백 번의 실험 결과를 종합하는 것과 동등한 정보를 제공함을 확인시켜 준다. 본원에 개시된 바와 같이, 단백체 또는 하위단백체를 식별하고 정량화하기 위해 단백체 또는 하위단백체를 분리하거나, 단백체 또는 하위단백체 내의 개별 단백질, 펩티드, 올리고펩티드, 및 폴리펩티드를 별도로 검출할 필요가 없다.
더욱이, 본 발명의 방법이 세포 파편, 소분자, 이온, 자가형광 종, 및 고도의 분자 밀집도를 함유하는 혈장과 같은 복잡한 인간 체액에서 수행되는 경우에도, 예측된 결과로부터 유의한 편차는 없었다.
예측된 벡터 함수와 실험적 데이터 사이의 긴밀한 일치는 각 환자 샘플의 3 가지 기술적 복제물에 걸친 평균 측정된 아미노산 농도(별표) 및 표 31에 제공된 계수를 갖는 예측된 참조선(실선)을 나타내는 도 36에 표시된다.
본원에 개시된 벡터 함수 접근법을 사용한 식별 및 정량화는 후속 실시예에서 제공되어 있다.
Figure pct00470
분류기를 사용한 식별(임의적 단계)
본원에 개시된 바와 같이, 비교 단계는 대안적으로, 또는 추가로 기계 학습 분류기를 수반할 수 있다. 모든 25 명의 환자 PPP 및 PRP 샘플(샘플 제조 이상치 제외)의 3 가지 기술적 복제물의 완전한 데이터 세트를 2 개 세트로 무작위로 분배하였다. 첫번째 세트는 데이터 포인트의 25%를 샘플 점으로 포함하고 동일한 2 개 이상의 아미노산 유형(4 개의 아미노산 유형)의 측정된 표지로부터 계산된 2 개 이상의 아미노산 유형(4 개의 아미노산 유형)의 아미노산 농도를 제공하였다. 두번째 세트는 데이터 포인트의 75%를 포함하고 관심 PPP 및 PRP 단백체의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 아미노산 농도를 제공하였다. 두번째 세트(관심 PPP 및 PRP 단백체 내 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 아미노산 농도)을 사용하여 기계 학습 분류기, 구체적으로 결정 트리 모델(미세 K-최근접 이웃)을 훈련하였다. Euclidean 거리 미터법은 동일한 거리 가중치 및 데이터 표준화 및 기본 비용 행렬과 함께 사용하였다. 정확한 식별을 위해 분류기 최적화 또는 하이퍼파라미터 조정은 필요하지 않았다.
훈련 세트 및 테스트 세트 둘 다를 포함하는 사용된 데이터세트는 도 37에 제시되어 있고 테스트 세트에 대한 예측은 도 38에 제시되어 있다. 예측의 100%를 보정하였다.
이것은 도 39에 제시된 바와 같이, 개시된 본 발명의 방법을 사용한 환자 샘플 유형 및 2 개의 표지된 아미노산 유형 내의 관심 단백질의 식별에 대한 100% 참 양성률 및 0% 거짓 음성률을 초래하였다.
결과는 사용된 분류기의 유형에 확고하였다. 앙상블 배깅(ensemble bagged) 결정 트리 분류기를 또한 30 명 학습자의 119 개 분할 및 기본 비용 행렬을 사용하여 훈련하였고, 동등한 결과를 제공하였다. 도 40에 제시된 바와 같이, 개시된 본 발명의 방법을 사용한 환자 샘플 유형 및 2 개의 표지된 아미노산 유형 내의 관심 단백체의 식별을 위해 100% 참 양성률 및 0% 거짓 음성률을 달성하였다. 도 41에 제시된 바와 같이, 100% 양성 예측 값 및 0% 거짓 발견율을 또한 달성하였다.
환자 샘플에서 하나 이상의 관심 단백체의 식별을 위해 우수한 결과를 달성하였다.
환자 단백체 및 하위단백체 서명의 일반성 확인
본 발명은 진단 스크리닝 테스트를 제공할 수 있으므로, 임상 데이터를 수집할 때, 1차 진료 수준에서 진단 스크리닝 테스트를 위해 의도된 사용 환경을 대표하는 환자 집단을 선택하였다. 표 13에 요약된 바와 같이, 환자 집단은 50 세 이상의 다양한 남성 및 여성을 포함하였다. 환자 집단에서 이들 변이가 측정된 실험적 참조선에 어떠한 영향을 미치는지 테스트하기 위해, 상세한 분석을 수행하였다. 도 42-48에서, 모든 개별 남성 및 여성 환자에 대한 실험적 참조선의 계수를 환자 연령의 함수로서 표시하였다. 모든 단백체 및 하위단백체 샘플 유형을 측정하고 모든 아미노산 유형을 표지한 경우, 모든 경우에 각 환자에 대해 계산된 실험적 단백체 참조선의 계수에 대한 환자 성별 또는 연령의 영향은 없었다. 이것은 본 발명의 방법을 사용하여 측정된 단백체 및 하위단백체 서명이 임의의 환자 집단을 설명하고 성별 또는 연령에 특이적으로 영향을 미치지 않는다는 것을 확인시켜 준다. 이 결과는 본 발명의 방법이 개별 환자 변이에 대해 확고하고 건강한 환자가 단일 식별 단백체 및 하위단백체 서명을 나타낸다는 것을 확인시켜 준다.
하기 작업 실시예에서, 건강한 환자에 대한 단백체 서명을 다양한 유형의 암을 앓고 있는 환자에 대한 단백체 서명과 비교한다.
실시예 13: 실험적으로 측정된 질량 분광법 데이터가 이론적 참조선으로 전환되는 메커니즘 확립
작업 실시예 10-12에서, 관심 PPP 단백체에 대해 측정된 실험 값이 관심 PPP 단백체 이론적 참조선에 의해 예측된 값과 일치함을 입증하였다. 이론적 참조선은 혈장 내에서 측정된 개별 단백질에 대한 공개적으로 이용가능한 단백질 정량화 값의 데이터세트에서 작동하는, 본원에 개시된 벡터 함수에 의해 정의되고 이를 사용하여 계산하였다. PPP 혈장 단백체 샘플을 건강한 환자로부터 실험적으로 측정하였으므로, 건강한 환자 혈장(PPP) 단백체 서명을 제공한다.
건강한 환자 혈장(PPP) 단백체에 대한 참조선을 확립한 후, 하기 작업 실시예에서, 이론적 참조선을 암 환자의 혈장 내에서 측정된 개별 단백질에 대한 공개적으로 이용가능한 단백질 정량화 값의 데이터세트에서 작동하는 본원에 개시된 벡터 함수에 의해 정의하거나 이를 사용하여 계산한다. 이들 단백질을 이미 제시된 실험적 데이터에서 단백질 부족 혈장(PPP)에 동등한 혈소판이 고갈된 혈장으로부터 측정하였다.
따라서, 실험적으로 측정된 PPP 데이터를 암의 유형 및 병기가 다양한 환자에 대해 계산된 이론적 참조선과 비교한다. 그런 다음 본원에 개시된 기계 학습 및 최소 수직 거리 접근법을 사용하여 건강한 환자(건강한 환자 샘플은 작업 실시예 10-12에서 실험적으로 측정됨), 또는 암의 유형 및 병기가 다양한 환자에 상응하는 것으로 환자 샘플을 식별한다. 이 방식으로, 본원에 개시된 단백체 서명, 하위단백체 서명, 참조선, 벡터 함수, 및 식별 접근법을 사용하여 건강한 환자 또는 표시된 암 유형 및 병기를 가진 환자에 상응하는 것으로 샙플을 식별할 수 있다는 것을 확립한다.
암 환자의 혈장 내에서 측정된 개별 단백질에 대한 공개적으로 이용가능한 단백질 정량화 값을 Proteome Xchange 데이터베이스에 의해 제공하였다.
먼저, 난소암 데이터세트를 검사하였는 데, 이는 정량적 질량 분광법 데이터에서 벡터 함수를 작동하기 위해 본원에 개시된 접근법의 검증을 허용하는 건강한 대조군이 추가로 제공되었기 때문이다.
ProteomeXchange를 사용하여, PXD020557 원본 데이터세트를 http://proteomecentral.proteomexchange.org/cgi/GetDataSet?ID=PXD020557에서 다운로드하였다. PXD020557 원본 데이터세트가 파생된 이 연구의 목표는 질량 분광법을 사용하여 III기 또는 IV기 장액성 난소암을 앓고 있는 10 명의 환자(난소암 환자) 및 난소암이 없는 10 명의 환자(건강한 대조군 환자)의 혈장 샘플을 검사함으로써 혈장 내의 고등급 장액성 난소암에 대한 개별 대사 및 단백질 바이오마커를 찾는 것이었다. 탠덤(tandem)질량 분광법(LC-MS/MS)을 사용한 액체 크로마토그래피를 혈장 샘플 내의 단백질 식별에 사용하였다. LC-MS/MS 접근법에서, 복합체 샘플을 개별 단백질 구성요소로 분리하고, 이러한 개별 단백질 구성요소를 순차적으로 이온화하고 2 개의 질량 분석기로 보낸다. 첫번째 질량 분석기는 질량 대 전하 비율(m/z)에 의해 각 단백질 구성요소에 대한 이온을 분리한 다음 특정 m/z 비율의 이온을 선택하고, 더 작은 단편 이온으로 분할하며, 두번째 질량 분석기에서 단편 이온의 m/z비율에 의해 분리한 다음 검출한다. 환자 혈장 샘플을 분석하기 전에, 구체적으로 MARS14 친화성 컬럼을 사용하여 혈장에서 14 개의 높은 풍부도 단백질을 제거하기 위해 단리 단계를 수행하였다. 이 단리 단계는 혈장 샘플 내에서 알부민, a1-항트립신, a1-산 당단백질, 아포지단백질 A1, 아포지단백질 A2, a2-매크로글로불린, 보체 C3, 피브리노겐, 합토글로빈, IgA, IgG, IgM, 트랜스페린, 및 트랜스타이레틴을 고갈시켰고 제한된 기기 동적 범위로 인해 환자 단백체 샘플의 질량 분광법 분석의 기술 분야에서 통상적이다. MS/MS 단계는 나노-ESI 소스와 함께 Q Exactive Plus Hybrid Quadrupole-Orbitrap 질량 분광기를 사용하여 수행하였다. 무표지 정량화(LFQ)를 사용하여 혈장 샘플 내에 존재하는 것으로 식별된 각 단백질의 각 혈장 샘플 내의 풍부도를 계산하고 각 단백질의 고유하고 예리한 펩티드에 대한 피크 강도를 사용하여 수행하였다.
PXD020557에 대해 ProteomeXchange에 기탁된 파일 내에서, 각 혈장 샘플 내에서 검출된 각 단백질에 대한 수탁 번호가 제공되었다. 1385 개의 수탁 번호가 있었고 이 중 1382 개가 UniProt ID로 제공되었다. 각 혈장 샘플 내에서 검출된 각 단백질의 강도(풍부도)는 또한 무표지 정량화(LFQ)를 사용하여 계산된 강도로 제공되었다. 먼저, UniProt ID로서 제공된 1382 개의 수탁 번호를 Swiss-Protein 검토된 인간 단백질에 대한 1359 개의 UniProt KB ID에 맵핑하였다. 각 UniProt KB ID는 단백질을 설명한다. 이러한 1359 개의 UniProt KB ID를 각 Uniprot KB ID에 의해 기재된 단백질의 서열 및 분자량과 함께 다운로드하였다.
이론적 참조선 데이터는 C, K, W, 및 Y 아미노산 유형이 표지되고 측정된 실시예 10-12에 보고된 실험적 데이터와 비교될 것이기 때문에, w 1 , w 2 ,w n 값을 본원에 개시된 방정식 11을 사용하여 C, K, W, 및 Y 아미노산 유형에 대해 계산하였다. 방정식 11은 편의성을 위해 여기에 재현되어 있다:
Figure pct00471
여기서 w n 은 관심 단백체에서 아미노산 유형 n의 아미노산의 가중 평균 수이고, c는 관심 단백체에서 단백질의 수이고, a n,i 는 관심 단백체 내의 단백질 i에서 아미노산 유형 n의 아미노산 수이고, q i 는 관심 단백체 또는 하위단백체에서 단백질
Figure pct00472
의 양의 척도이고, q는 관심 단백체에서 모든 단백질(단백질 i 내지 c)의 총량의 동등한 척도이므로,
Figure pct00473
는 관심 단백체 내에서 단백질 i의 비율을 제공한다. 결과의 선형 조합은 관심 단백체의 단백질 i 내지 c에 대해 취해진다.
q i 는 바람직하게는 질량 분광법 데이터베이스로부터 공개적으로 이용가능한 데이터에 의해 결정된, 관심 단백체 또는 하위단백체 내의 관심 단백질 i의 발현 수준일 수 있고, q는 관심 단백체 또는 하위단백체의 총 농도 또는 공개적으로 이용가능한 단백질 발현 데이터를 사용하여 각각 평가된 관심 단백체 또는 하위단백체 내에 함유된 모든 단백질(단백질 i 내지 c)의 총 예측된 발현 수준일 수 있다.
질량 분광법 데이터베이스에서 무표지 정량화 데이터는 존재하는 단백질의 양(질량)에 비례하는 강도 값, int로 제공된다. 이러한 제공된 int 값은 개별 단백질에 대한 강도를 분자 질량으로 나누어 존재하는 단백질의 몰량에 비례하도록 전환될 수 있다.
Figure pct00474
int m 은 개별 단백질의 몰 강도이고, int는 개별 단백질의 제공된 강도이고, m r 은 개별 단백질의 분자 질량이다. 방정식 11에 위해 요구된 바와 같이, int m 은 참조 관심 단백체 또는 하위단백체 내의 각 관심 단백질에 대해 계산된다.
방정식 11 내에서, qc 단백질을 함유하는 관심 단백체 또는 하위단백체 내의 모든 관심 단백질 i에 걸친 q i 값의 합이며, 다음을 의미한다:
Figure pct00475
결과적으로 int m 이 방정식 11 내에서 q i 의 하나의 가능한 형태인 것처럼, Σint m 은 관심 하위단백체의 단백체에 대한 q의 하나의 가능한 형태이다:
Figure pct00476
따라서,
Figure pct00477
은 본원에 개시된 바와 같은 방정식 11에서
Figure pct00478
의 하나의 가능한 형태이다.
참조의 용이성을 위해,
Figure pct00479
은 질량 분광법 몰 강도 분율이라 하며, 약어로 MSIF m 이다.
Figure pct00480
방정식 11에서
Figure pct00481
에 대한 MSIF m 값을 사용하여, w K , w C , w W ,w Y 값을 PXD020557 데이터세트에 대해 계산하였고, 결과는 아래 표 33에 제공하였다.
표 33
Figure pct00482
방정식 11 내에서
Figure pct00483
로서 MSIF m 을 사용하여 추가로 검증하기 위해, 이 방식으로 계산된 건강한 환자 샘플에 대한 결과를 인간 펩티드 아틀라스에서 기탁된 면역검정을 사용하여 측정된 단백질 농도를 사용하여
Figure pct00484
값이 계산된 방정식 11을 사용하여 계산된 결과와 비교하였다. 실시예 12에 이미 기재된 접근법을 다시 적용하였지만, MARS 컬럼을 통한 질량 분광법 실험에서 검출된 단백질(혈장에서 14 개의 높은 풍부도 단백질을 제거하여 높은 풍부도 종이 질량 분광법 결과에 부정적으로 영향을 미치치 않도록 함)을 또한 인간 펩티드 아틀라스 데이터세트에서 제거하였다. 인간 단백질 아틀라스 데이터세트는 C, K, W, 및 Y 아미노산 유형이 단백질 아미노산 서열 내에서 발생한 횟수를 계수하는 것을 포함하는, 실시예 12에 이미 기재된 바와 같이 처리하였으며, 아미노산 서열 문자열 내에서 표시된 문자 "C", "K", "W", 또는 "Y"의 발생 수는 Microsoft Excel을 사용하여 계수하였다. 이것은 단순히 아미노산이 단백질 서열에서 반복되는 횟수를 계수하는 Python ProtParam 계수_아미노_산 함수를 사용하여 계산될 수 있다. 알부민, a1-항트립신, a1-산 당단백질, 아포지단백질 A1, 아포지단백질 A2, a2-매크로글로불린, 보체 C3, 피브리노겐, 합토글로빈, IgA, IgG, IgM, 트랜스페린, 및 트랜스타이레틴이 질량 분광법 실험 전에 혈장 샘플에서 제거되었기 때문에, 이들은 또한 추가 계산 전에 인간 펩티드 아틀라스 데이터세트에서 제거되었다. 질량 기준의 단백질 농도는 인간 펩티드 아틀라스 데이터베이스에서 다양한 단위(g/L 내지 ng/L)로 제공되었고, 각 제공된 질량 단백질 농도를 g/L의 표준 단위로 전환한 다음, g/L 농도를 단백질 분자량으로 나누어 몰 단백질 농도로 전환하였다. 그런 다음, 몰 농도를 혈장 데이터세트 내의 모든 단백질의 몰 농도의 합으로 나누어 혈장 데이터세트 내의 각 단백질에 대해
Figure pct00485
를 계산하였다. 그런 다음 방정식 11에 의해 정의된 바와 같이,
Figure pct00486
a n,i 를 곱하여 w n 값을 제공하였다.
그런 다음 MARS 14 컬럼 단백질이 고갈된 건강한 환자 질량 분광법 데이터세트에 대해 계산된 w n 값을 건강한 환자 인간 펩티드 아틀라스 면역검정 데이터세트에 대해 계산된 w n 값과 비교하였다. 결과는 표 34에 제공되어 있다. 모든 경우에, 질량 분광법 데이터에 대해 계산된 벡터 함수 계수는 면역검정 데이터에 대해 계산된 벡터 함수 계수와 일치하며, 이는 방정식 11 내에서
Figure pct00487
로서 MSIF m 을 사용하는 기재된 접근법을 검증한다. 면역검정 및 질량 분광법 결과의 일치는 또한 도 49에 그래픽으로 제시되어 있다.
방정식 11은 기본 데이터를 생성하는 데 상이한 실험 기술이 이용되었음에도 불구하고, 질량 분광법 및 면역검정 둘 다로부터 생성된 풍부도 데이터에 대해 확고하게 수행하여, 참조의 합동/통합 세트(벡터 함수)를 구축하는 수단을 제공한다. 기존 데이터 소스에 기반하여 구축할 프레임워크를 제공한다.
표 34
Figure pct00488
건강한 환자 혈장 샘플(MARS14 컬럼 단백질이 고갈됨)에 대한 질량 분광법 및 면역검정 데이터는 하기 벡터 함수에 의해 정의될 수 있다.
Figure pct00489
본원에 개시된 본 발명의 방법 이전에, 관심 단백체 또는 하위단백체의 측정은 관심 단백체 또는 하위단백체 내의 각 단백질을 개별적으로 측정하는 것을 필요로 하였다. 이것은 노동, 비용, 및 시간 집약적일 수 있는 데, 분석이 적합할 수 있기 전에 관심 단백체 또는 하위단백체를 많은 분획으로 분리하거나(예컨대 질량 분광법 실험에 필요), 관심 단백체 또는 하위단백체 내의 각 개별 단백질에 표적화된 면역검정에서 항체와 같은 결합제를 사용하는 것이 요구되기 때문이다. 관심 단백체 또는 하위단백체가 400 개의 단백질을 함유하는 경우, 본원에 개시된 본 발명 이전에 알려진 방법에 따라, 관심 단백체 또는 하위단백체를 측정하려면 관심 단백체 또는 하위단백체 내에 함유된 각 개별 단백질을 400 회 측정해야 한다(이것은 분석된 질량 분광법 및 면역검정 데이터의 경우였다).
대조적으로, 본원에 개시된 본 발명의 방법에서, 관심 단백체 또는 하위단백체 내의 2 개 이상의 표지된 아미노산 유형의 1 회 측정만을 통해 관심 단백체 또는 하위단백체를 식별하는 것이 가능하다. 본원에 개시된 접근법은 현재 최신 방법을 보완하고 체액 내의 단백질을 개별적으로 측정하거나 질환의 바이오마커를 식별할 필요 없이 단순한 평균 형광 강도 측정으로 질환 상태를 식별할 수 있는 방식을 제공한다. 정의에 의해 모든 바이오마커를 포괄하는 평균 서명이 측정되기 때문에, 관련 바이오마커의 사전 지식은 필요하지 않다.
또한, 2 개 이상의 아미노산 유형의 아미노산 농도는 질량 분광법 몰 강도 분율, MSIF m 이 상대적 양임을 인식함으로써 질량 분광법 데이터베이스로부터 계산하여, 각 단백질이 관심 단백체 또는 하위단백체에 기여하는 몰 농도의 비율을 제공한다. 예를 들어, 단백질이 관심 단백체의 총 몰 단백질 농도의 몰 농도의 1%에 기여한다면, 그의 MSIF m 값은 0.01의 무단위 값일 수 있다. 그러나, Σint m 은 상대적 양이 아니며 관심 단백체의 몰 단백질 농도와 관련될 수 있다. 이를 달성하기 위해, 질량 분광법을 통해 액세스가능한 Σint m 값은 동일한 관심 단백체에 대한 면역검정 또는 펩티드 마이크로어레이 실험을 통해 액세스가능한 몰 또는 질량 농도 값과 관련된다.
더욱이, MSIF m 값(
Figure pct00490
) 및 면역검정 몰 농도 값
Figure pct00491
를 사용하여 방정식 11에서
Figure pct00492
로서 사용될 때 동등한 결과를 제공한다는 것을 확립한다면, 결과적으로 다음과 같다:
Figure pct00493
따라서, 질량 분광법 데이터베이스에서 개별 환자에 대해 계산된 총 몰 강도(Σint m )는 단순히 a로 나누어 총 몰 단백질 농도로 변환될 수 있다. 바람직하게는, a의 값은 변환되는 특정 질량 분광법 데이터세트에 대해 계산되고, 고려되는 Σint m 의 값은 데이터세트의 전체 건강한 환자(또는 암 음성) 부분에 걸친 평균 값(평균(Σint m )이다. 바람직하게는, a의 값은 질량 분광법 실험에 존재하는 면역검정 농도 데이터(인간 펩티드 아틀라스 농도 데이터)의 서브세트를 참조하여 계산된다. 예를 들어, MARS 컬럼을 사용하여 질량 분광법 데이터세트 내의 매우 풍부한 단백질을 고갈시키면, 이들 단백질은 총 몰 단백질 농도를 계산하기 전에 면역검정 농도 데이터(인간 펩티드 아틀라스 농도 데이터)로부터 제거되어야 한다.
건강한 환자 혈장 샘플(PPP 샘플)에 대해 측정된 실험적 데이터로부터 계산된 벡터 함수 계수가 인간 펩티드 아틀라스에서 건강한 환자 혈소판 부족 혈장 샘플 내의 단백질의 면역검정 측정으로부터 계산된 벡터 함수 계수와 일치함이 이미 실시예 12에서 확립되었다.
건강한 환자로부터의 질량 분광법 벡터 함수가 면역검정 질량 분광법 데이터를 사용하여 계산된 벡터 함수와 일치한다는 것이 이 실시예에서 확립되었다. 건강한 환자 혈장 샘플로부터 측정된 실험적 데이터로부터 계산된 벡터 함수, 건강한 환자 혈장 샘플의 면역검정 데이터로부터 계산된 벡터 함수, 및 건강한 환자 혈장 샘플의 질량 분광법으로부터 계산된 벡터 함수가 모두 정량적으로 비교될 수 있다는 것을 확립한 후, 다음 작업 실시예에서, 건강한 환자 혈장 샘플에 대해 실시예 10-12에서 측정된 실험적 데이터를 다양한 암 유형 및 병기를 가지고 있는 환자의 혈장 샘플로부터 계산된 질량 분광법 데이터와 비교한다.
실시예 14: 건강한, 난소암, 또는 췌장암 혈장 단백체에 상응하는 환자 샘플의 식별
난소암 환자의 혈소판 부족 혈장 내에서 측정된 개별 단백질에 대한 단백질 정량화 데이터를 제공하는 데이터세트 PXD020557, 및 췌장암 환자의 혈소판 부족 혈장 내에서 측정된 개별 단백질에 대한 단백질 정량화 데이터를 제공하는 데이터세트 PXD005144를 각각 실시예 13에 설명된 바와 같이 처리하였다. 예를 들어, 총 몰 농도는 Σint m = aΣ몰 단백질 농도를 인식하여 계산하였으므로, 총 몰 단백질 농도는 총 몰 강도를 a로 나눈 값과 같다.
a는 건강한 환자에 대한 평균 총 몰 풍부도 값을 취하고, 이를 MARS14 컬럼을 사용한 질량 분광법 실험에서 고갈된 단백질을 제외한 인간 펩티드 아틀라스 면역검정 데이터세트 내 총 몰 단백질 농도로 나누어 계산하였다. 예를 들어, 난소암 데이터세트의 경우, a는 4.41 x 105 AU / μM인 것으로 계산되었으므로, 각 총 몰 강도 데이터 값을 a로 나누어 총 몰 농도 값을 제공하였다. AU로 여기에 제공된 강도 값은 형광 강도 값이 아니라, 본원에 개시된 바와 같은 질량 분광법 총 몰 강도 값이라는 점에 주목한다.
표 35
Figure pct00494
그런 다음, 벡터 함수 2에 의해 명시된 바와 같이, 총 몰 농도 값에 벡터 함수 계수 w K , w W , w Y , 및 w c 각각을 곱하여 표시된 총 몰 단백질 농도에서 측정될 수 있는 K, W, Y, 및 C 아미노산 유형의 총 아미노산 농도를 제공하였다.
난소암 데이터세트를 분석하는 데 사용된 동일한 접근법을 반복하여 http://proteomecentral.proteomexchange.org/cgi/GetDataset?ID=PXD005144에서 Proteome Xchange로부터도 이용가능한 췌장암 데이터세트(데이터세트 PXD005144)를 분석하였다.
반복된 단계의 예시적인 서브세트는 아래에 제공되어 있다.
표 36
Figure pct00495
이 데이터세트의 경우, 암이 없은 환자(만성 췌장염)에 대한 평균 총 몰 강도는 281.303이었으며 0.547의 a 값을 생성한 다음 총 몰 강도를 곱하여 μM의 총 몰 농도를 계산하였다.
K, C, W, 및 Y 아미노산 유형의 아미노산 농도의 두 세트에 대한 결과는 아래 표 37에 제시되어 있다
표 37
Figure pct00496
Figure pct00497
혈장으로부터 3 개의 암 서명을 식별하는 본 발명의 방법의 능력을 테스트하기 위한 목적으로, 추가적인 데이터세트를 첨가하였다. PXD013150 데이터세트는 http://proteomecentral.proteomexchange.org/cgi/GetDataset?ID=PXD013150에서 액세스하고 Proteome Xchange에서 다운로드하였다. 이 데이터세트는 임상 개입 전에, 결장직장암을 앓고 있는 환자의 혈장 샘플 내에서 측정된 단백질에 대한 정량적 질량 분광법 데이터를 제공하였다.
많은 단계가 반복되지만, 이 데이터세트의 처리는 약간 상이하기 때문에 설명된다. PXD013150 데이터세트가 파생된 이 연구에서, 저자들은 BCA 검정을 사용하여 각 혈장 샘플의 질량 기준의 총 단백질 농도를 측정하고, 각각이 질량 기준의 100 μg 총 단백질이 되도록 샘플을 표준화하였다. 이 특징은 본원에 개시된 방법을 이 데이터세트에 적용할 때 대안적인 정규화가 수행되게 한다. 질량 분광법 강도 값은 질량에 비례한다(https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3946283/). 각각에서 모든 단백질에 대한 총 질량 농도는 100 μg인 것으로 알려졌는 데, 이것은 BCA 검정을 사용하여 계산되었기 때문이었다. 질량 분광법 강도 값은 질량에 비례하기 때문에, 각 샘플에 대한 강도 값의 합은 100 μg 총 단백질과 같다. 따라서, 각 단백질의 강도를 샘플에서 모든 단백질에 걸친 강도의 합으로 나눈 값을 계산하면
Figure pct00498
는 샘플 내의 개별 단백질의 분수 질량을 제공한다. 그런 다음 이에 100 μg의 샘플 당 제공된 총 단백질 질량을 곱하여 각 샘플 내의 각 개별 단백질의 μg 질량을 제공하였다. 그런 다음, 각 샘플 내의 각 단백질에 대해, μg의 질량을 g/mol의 단백질 분자량(본원에 개시된 바와 같은 Uniprot에서 다운로드함)으로 나누어, μmol의 몰량을 제공하였다. 각 샘플 내의 모든 단백질의 몰량을 합하여, 표 38에 보고된, 각 샘플 내의 모든 단백질의 총 몰량을 제공하였다.
방정식 11에서, q i 는 관심 단백체 또는 하위단백체에서 단백질 i의 양의 척도이고, q는 관심 단백체 또는 하위단백체에서 모든 단백질의 총량의 동등한 척도이다. 따라서, 각 샘플 내의 모든 단백질의 총 몰량은 또한 방정식 11에서 q를 제공한다. 그런 다음 방정식 11에서 각 샘플 내의 각 단백질의 절대 몰량을 각 샘플 내의 모든 단백질의 총 몰량으로 나누어
Figure pct00499
를 계산하였다. 그런 다음, 방정식 11을 본원에 개시된 바와 같이 사용하여 각 환자 혈장 샘플에 대한 w K , w W , w Y ,w c 값을 계산하였다. 그런 다음 w K , w W , w Y , 및 w c 에 각 샘플 내의 모든 단백질의 절대 총 몰량인, 각 샘플에 대한 q 값을 각각 곱하여, 각 샘플 내의 K, C, W, 및 Y 아미노산 유형의 아미노산의 양을 계산하였다.
단계는 아래에 추가로 요약되어 있고 결과는 표 39에 보고되어 있다
Figure pct00500
= Proteome Xchange와 같은 질량 분광법 데이터베이스로부터 계산된 정규화된 강도(이는 분수이며, 단위는 AU임)
Figure pct00501
(분수, AU) x 100 μg 총 단백질 = 각 단백질의 질량(μg)
질량(μg) / 단백질의 질량(g/mol) = 몰량(μmol)
몰량(μmol)의 합은 총 몰량(μmol)을 제공한다
몰량(μmol) / 총 몰량(μmol)은 방정식 11에서
Figure pct00502
를 제공한다.
표 38: 결장직장암 데이터세트에 대한 총 몰량(nmol), K 양(nmol), C 양(nmol), W 양(nmol) 및 Y 양(nmol).
Figure pct00503
Figure pct00504
Figure pct00505
상기 결장직장암에 대해 상기 계산된 총 몰량 값은 모든 샘플에 대해 5 μL의 표준 부피를 가정함으로써 총 몰 농도 값으로 변환하였다. 이전에 설명된 바와 같이, 양을 농도로 전환하기 위해, 양을 부피로 나눈다. 이것은 결장직장암 총 몰량 값을 난소암 및 췌장암에 대해 계산된 총 몰 농도 값과 필적할 수 있는 총 몰 농도 값으로 변환하여, 가장 엄격하고 확고한 상황에서 평가될 환자 혈장 샘플로부터 하나 초과의 관심 질환 상태 단백체를 식별하였다.
상기 기재된 바와 같이 계산된 결장직장암 총 몰 농도 및 총 몰 아미노산 농도 값은 표 39에 제시되어 있다. 상기 설명된 바와 같이 계산된 μM의 총 몰 농도 값이 또한 이 표에 제공되어 있다. 추가로, 도 59-62에 제시된 바와 같이, 관심 결장직장암 하위단백체에 대한 아미노산 농도를 총 몰 단백질 농도의 함수로 표시하여 관심 결장직장암 하위단백체에 대한 참조선을 계산하였다.
표 39: 결장직장암 총 몰 농도 및 총 몰 아미노산 농도 값
Figure pct00506
Figure pct00507
마지막으로, 모든 이들 데이터세트를 건강한 환자 관심 하위단백체(PPP 샘플 유형)에 대해 실시예 10-12에서 측정된 실험 값과 함께, N-차원 공간에 표시하였다. 결과는 도 50에 제시되어 있다. 데이터의 선형 특성은 참조선을 편리하게 시각화한다.
이들 결과를 표지되고 측정된 아미노산의 4 개 유형에 대한 4-차원 공간(N-차원 공간)에 표시하였을 때, 4-차원 공간에서 건강한 환자(PPP, 작업 실시예 10-12), 난소암, 췌장암, 및 결장직장암 샘플의 위치에 대한 현저한 분화가 도 50에서 관찰된다. 추가로, 각 데이터 세트는 본원에 개시된 바와 같은 선의 형태를 취하고 참조선에 의해 잘 기재된다. 각 참조선의 방정식은 벡터 함수에 의해 제공된다.
많은 환자 샘플로부터 제공된 데이터를 사용하여 벡터 함수 2에 대한 각 벡터 함수 구성요소의 방향/계수를 계산하기 위해, 각 관심 단백체에 대한 각 아미노산 농도를 각 관심 단백체의 총 몰 단백질 농도의 함수로서 표시하였는 데, 각 관심 단백체의 총 단백질 농도는 각 관심 단백체에 대한 아미노산 농도 참조가 벡터 함수 2를 통해 대수적으로 표현되는 것을 통해 공통(파라미터/기본)이기 때문이다. 그런 다음, 선형 회귀를 수행하였고 이 기울기는 벡터 방향을 제공하였다. 선형 회귀는 도 51-62에 제시되어 있다. 대안적인 접근법으로서, 각 관심 단백체(건강한 PPP, 난소암, 췌장암, 결장직장암)에 대한 모든 환자 샘플에 걸친 w K , w C , w W , 및 w Y 값의 평균을 계산할 수 있었지만 여기에 제시된 접근법은 모든 데이터세트의 강력한 선형성을 예시한다.
각 참조선의 방정식은 벡터 함수 2에 의해 제공되고, 각각 K, C, W 및 Y 아미노산 유형에 대해 아래에 포함된다. 결장직장암, 췌장암, 및 난소암에 대한 참조선은 이론적으로 계산되었기 때문에, 건강한 환자 PPP 데이터세트에 대해 이론적으로 계산된 참조선이 또한 방법의 확고한 테스트를 위해 제공된다.
Figure pct00508
환자 샘플을 각 관심 단백체(건강한 PPP, 난소암 혈장, 췌장암 혈장, 결장직장암 혈장)에 대한 참조와 비교하였다. 본원에 개시된 바와 같이, 각 참조를 벡터 함수에 의해 임의의 총 단백질 농도/양으로 대수적으로 제공하였다. 본원에 개시된 바와 같이, 각 참조를 벡터 함수 2에 의해 제공하였다. 대안적으로, 각 참조를 파라미터 방정식 2 세트에 의해 제공하여 등등한 결과를 산출할 수 있다. 그런 다음, 테스트 2를 수행하여 각 샘플이 각 관심 단백체에 대한 벡터 함수 참조의 오차 한계 내에 있었는지 여부를 결정하였다. 각 연구에서, 하나 초과의 암 유형이 있는 환자는 제외되었다는 것이 알려졌기 때문에, 하나의 관심 단백체만이 각 환자 샘플에 존재하는 것으로 알려졌다. 따라서, 본원에 개시된 바와 같이, 오차 한계를 샘플 점과 각 참조선 사이의 수직 거리의 최소 값과 동일하게 설정하였다. 본원에 개시된 바와 같이, 샘플 점과 각 참조선 사이의 수직 거리는 내적을 사용하여 계산하였다(실시예 1-9). 오차 한계는 수직 거리의 최소 값과 동일하게 설정하였기 때문에, 각 샘플 점을 수직 거리의 최소 값을 제공하는 참조선에 의해 정의된 관심 단백체로서 식별하였다. 관심 단백체가 샘플 내에서 식별되었을 때, 샘플 내의 해당 관심 단백체의 총 농도를 또한 본원에 개시된 바와 같이, 수직 거리의 최소 값을 제공한 참조선 상의 특이적 점을 참아냄으로써 식별하였다. 결과는 아래 표 40에 제시되어 있고 도 63에 요약되어 있다.
표 40
Figure pct00509
Figure pct00510
Figure pct00511
Figure pct00512
Figure pct00513
Figure pct00514
본원에 기재된 벡터 함수 접근법은 혈장에서 결장직장암을 식별하는 데 100% 정확도(민감도), 혈장에서 난소암을 식별하는 데 90% 정확도(민감도), 혈장에서 췌장암의 식별하는 데 100% 정확도(민감도), 및 혈장에서 건강한 샘플(암 부재)을 식별하는 데 95% 정확도(특이성)를 갖는다.
추가로, 본원에 기재된 바와 같은 벡터 함수 접근법을 사용하여, 관심 단백체의 존재 또는 부재, 뿐만 아니라 관심 단백체의 양을 식별할 수 있다. 본 발명의 방법으로 이용가능한 확고한 정보를 예시하면, 관심 단백체의 총 단백질 농도에 대한 예측 값 대 실제 값이 아래 도 64에 제시되어 있다.
모든 환자 샘플은 선을 따라 떨어지며 y = x, 이는 식별된 관심 암 또는 건강한 단백체의 양이 정확하다는 것을 의미한다. 바람직한 구현예에서, 이 양은 암 병기와 상관관계가 있다.
대안적인 접근법으로서, 본원에 개시된 바와 같이 관심 단백체를 기계 학습 분류기를 사용하여 샘플 내에서 식별하였다. 구체적으로, 데이터세트를 2 개 부분으로 무작위로 나누었으며, 데이터의 75%는 분류기를 훈련하는 데 사용되는 각 관심 단백체에 대한 참조를 제공하였고, 데이터의 25%는 보류되고 일단 훈련된 분류기의 성능을 테스트하는 데 사용하였다. 박스 제약 조건 레벨 1, 일대일 멀티클래스 방법, 선형 커넬 함수, 자동 커널 스케일, 및 데이터 표준화에 따라, 선형 서포트 벡터 머신(SVM) 분류기를 훈련하였다. K, C, W 및 Y 아미노산 유형을 사용한 식별 결과는 도 65에 제시되어 있다. 각 관심 암 단백체(모든 암 환자 샘플) 뿐만 아니라 관심 건강한 단백체(모든 건강한 환자 샘플)에 대해 100% 양성 예측 값 및 0% 거짓 발견율을 수득하였다.
그러나, 본 발명의 방법은 3 또는 2 개의 아미노산 유형만이 표지되고 측정될 때 동등한 결과를 제공한다. 이를 예시하기 위해, 도 66은 선형 SVM 분류기를 상기 기재된 것과 동일한 설정을 사용하여 훈련하였을 때 결과를 제공하지만, 3 개의 아미노산 유형(K, C, 및 W)의 아미노산 농도에만 액세스하였다. 4 개의 아미노산 유형의 경우에서와 같이, 모든 관심 암 단백체에 걸쳐 100% 민감도 및 특이성을 수득하였다.
마지막으로, 선형 SVM 분류기를 훈련하였지만 이번에는 2 개의 아미노산 유형(K 및 C)의 아미노산 농도에만 액세스하였다. 3 및 4 개의 아미노산 유형의 경우에서와 같이, 도 67에 제시된 바와 같이 100% 민감도 및 100% 특이성을 수득하였다.
기계 학습은 컴퓨터 프로그램이 참조 훈련 세트에서 훈련되고, 올바르게 분류하는 것을 배우는 강력한 접근법이다. 가설 테스트를 수행하여 참조 함수에 의해 제공된 참조로서 샘플을 식별하기 위해 본원에 제시된 분석적으로 푸는 방법은 훈련 또는 학습 단계를 수반하지 않고, 혈장에서 다수의 암 유형의 식별을 위한 민감도 및 특이성이 분석 방법 및 기계 학습과 필적할만하다(평균 민감도 96.67% 및 특이성 95%)는 사실은 관심 단백체 또는 하위단백체를 참조선으로 설명하고, 이 참조에 대한 식별을 수행하는 능력의 견고성을 말한다. 추가로, 이 방법은 암 연관된 관심 단백체 또는 하위단백체의 농도 또는 양을 동시에 매우 정확하게(2% 오차 이내) 결정하게 한다.
실시예 15: 혈장으로부터 암 병기 및 위치 식별
이 데이터세트에서, 임상 개입 전에 II기 및 III기 결장직장암을 앓고 있는 환자로부터의 혈소판 부족 혈장 샘플 내의 단백질을 질량 분광법을 사용하여 정량화하였다. 환자를 결장직장암의 유형(결장암, 직장암) 및 암의 위치(왼쪽 및 오른쪽 결장)에 의해 추가로 그룹화하였다. 결과는 표 41에 제공되어 있다.
표 41: 암 병기 및 위치에 의해 그룹화된 결장직장암 환자의 아미노산 양.
Figure pct00515
Figure pct00516
벡터 함수에 의해 제공되는 표 41의 아미노산 양을 2 개 그룹으로 무작위로 나누었다. 아미노산 양의 80%를 함유하는 첫번째 그룹은 기계 학습 분류기를 훈련하는 데 사용되는 참조를 제공하였고, 참조 중 하나로서 검증을 위해 보류된 나머지 20% 아미노산 양의 식별에 대한 기계 학습 분류기의 성능을 평가하였다.
먼저, 아미노산 양을 사용하여 앙상블 하위공간 KNN 분류기를 훈련하여 혈장에서 결장직장암의 병기를 식별하였다. 분류기는 30 명의 학습자와 함께 최근접 이웃 학습자 유형, 2의 하위공간 차원, 및 기본 비용 행렬을 사용하였다. 78%의 경우, III기 결장직장암은 구체적으로 III기로 정확하게 식별되었다(도 68 참조).
추가로, 아미노산 양을 사용하여 선형 서포트 벡터 머신(SVM) 분류기를 훈련하여 혈장에서 결장직장암의 위치를 식별하였다. 분류기는 데이터 표준화, 자동 커넬 함수, 일대일 멀티클래스 방법, 1 개의 박스 제약 조건 레벨, 및 기본 비용 행렬을 사용하였다. 도 68 및 69에서 입증된 바와 같이, 환자의 결장직장암이 왼쪽 결장에 존재하는 경우, 분류기는 환자의 아미노산 양 및 왼쪽 결장의 아미노산 양을 정의한 참조에 기반하여 이를 정확하게 식별하였다. 유사하게, 환자의 결장직장암이 오른쪽 결장에 존재하는 경우, 분류기는 환자의 아미노산 양 및 오른쪽 결장의 아미노산 양을 정의한 참조에 기반하여 이를 정확하게 식별하였다. 마지막으로, 분류기가 환자의 아미노산 양을 직장 결장직장암 위치에 대한 참조에 상응하는 것으로 식별한 경우, 이 식별은 100% 경우로 정확하였다. 이러한 결과는 참 양성률, 거짓 음성률 혼동 행렬 및 양성 예측 값, 거짓 발견율 혼동 행렬에 요약되어 있다(도 68 및 69 참조).
실시예 16: 소변에서 다수의 유형의 암 식별
PXD008407 데이터세트를 http://proteomecentral.proteomexchange.org/cgi/GetDataset?ID=PXD008407에서 Proteome Xchange로부터 다운로드하였다. PXD008407 데이터세트에서, 임상 개입 전에 첫번째 아침 소변 샘플을 환자로부터 수집하고 각 샘플 내의 단백질을 질량 분광법을 사용하여 정량화하였다.
PXD008407 데이터세트의 저자는 BCA 검정을 사용하여 각 혈장 샘플의 질량 기준의 총 단백질을 정량화하였다. 이 경우, 농도를 표준화하여 각 단백질 샘플이 200 μg/mL의 총 질량 농도를 갖도록 하였다. 그런 다음 결장직장암 데이터세트에 대해 이전에 기재된 접근법을 적용하여,
Figure pct00517
에 200 μg/mL를 곱하여 각 샘플 내의 각 개별 단백질의 질량 농도를 계산하였다. 그런 다음, 각 샘플 내의 각 개별 단백질의 질량 농도에
Figure pct00518
를 곱하여 각 샘플 내의 각 개별 단백질의 몰 농도를 계산하였으며, 여기서 각 단백질의 분자량은 Uniport에서 다운로드하였다. 각 샘플 내의 각 개별 단백질의 몰 농도를 합하여 각 샘플 내의 각 개별 단백질의 총 몰 농도를 제공하였고 이들 값을 표 42에 보고하였다. 각 샘플 내의 모든 단백질의 총 몰 농도는 방정식 11에서 q를 제공한다. 그런 다음 각 샘플 내의 각 단백질의 몰 농도를 각 샘플 내의 모든 단백질의 총 몰 농도로 나누어 방정식 11에서
Figure pct00519
를 계산하였다. 그런 다음, 방정식 11을 본원에 개시된 바와 같이 사용하여 각 환자 혈장 샘플에 대한 w K , w W , w Y , 및 w c 값을 계산하였다. 그런 다음 각각 w K , w W , w Y , w c 에 각 샘플에 대한 q 값, 즉 각 샘플 내의 모든 단백질의 총 몰 농도를 곱하여, 각 샘플 내에서 K, C, W, 및 Y 아미노산 유형의 아미노산의 농도를 계산하였다. 결과는 표 42에 제공되어 있으며, 도 70에서 4 차원 공간에 그래프로 표시된다. 각 유형의 암은 표지된 아미노산 농도가 4 차원 공간에 표시될 때 참조에 의해 정의된 명확한 분포를 갖는다.
표 42: 소변에서 측정된 3 개의 암 유형에 대한 아미노산 농도
Figure pct00520
Figure pct00521
본원에 개시된 바와 같이 이 데이터 세트에 벡터 함수 2를 적용하면, 소변에서 방광암, 전립선암, 및 신암 단백체의 임의의 총 몰 단백질 농도에서 K, C, W 및 Y 아미노산 유형의 아미노산 농도를 제공하는 벡터 함수가 다음과 같이 계산되었다:
Figure pct00522
마지막으로, 소변 내에서 관심 방광암, 전립선암, 및 신암 단백체의 존재를 식별하기 위해, 큐빅 서포트 벡터 머신(SVM) 분류기를 참조를 제공한 데이터 포인트의 80%에 대해 훈련한 반면 훈련된 데이터세트를 보류된 데이터포인트의 나머지 무작위로 선택된 20%에 대해 테스트하였다. 큐빅 SVM은 데이터 표준화, 자동 커넬 스케일과 일대일 멀티클래스 방법, 박스 제약 조건 레벨 1, 및 기본 비용 행렬을 사용하였다.
도 71에 제시된 바와 같이, 100% 정확한 식별 및 0% 부정확한 식별을 달성하였으며, 본원에 개시된 방법을 사용하여 소변 샘플로부터 방광암, 전립선암, 및 신암의 식별에 대해 100% 참 양성률 및 0% 거짓 음성률을 제공한다.
본 발명의 방법은 다수의 체액으로부터 암의 존재 및 부재, 뿐만 아니라 다른 관심 질환을 검출할 수 있다.

Claims (26)

  1. 샘플 내에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 방법으로서,
    a) 샘플 내에서 2 개 이상의 아미노산 유형을 표지화하되, 상기 아미노산 유형은 아미노산의 R-기에 의해 정의되는 것인, 단계;
    b) 샘플에서 각 표지된 아미노산 유형의 표지를 측정하는 단계;
    c) 임의적으로 측정된 표지로부터 각 표지된 아미노산 유형의 아미노산 농도를 계산하는 단계;
    d) 임의적으로 각 표지된 아미노산 유형의 아미노산 수를 계산하는 단계; 및
    e) 샘플에서 각 표지된 아미노산 유형의 측정된 표지 및/또는 아미노산 농도를 하나 이상의 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도와 비교하거나, 샘플에서 각 표지된 아미노산 유형의 아미노산 수를 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 내의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 아미노산 수와 비교함으로써, 샘플에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도 및/또는 양을 식별하는 단계를 포함하는, 방법.
  2. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 2 개 이상의 아미노산 유형이 알라닌(A), 아르기닌(R), 아스파라긴(N), 아스파르트산(D), 시스테인(C), 글루탐산(E), 글루타민(Q), 글리신(G), 히스티딘(H), 이소류신(I), 류신(L), 리신(K), 메티오닌(M), 페닐알라닌(F), 프롤린(P), 피롤리신(O), 셀레노시스테인(U), 세린(S), 트레오닌(T), 트립토판(W), 티로신(Y) 및 발린(V) 또는 합성 아미노산 및 이의 임의의 조합으로 이루어진 군으로부터 선택되는 것인, 방법.
  3. 제1항 또는 제2항에 있어서, 상기 2 개 이상의 아미노산 유형이 아미노산 유형의 변형된 아미노산 및/또는 비변형된 아미노산을 포함하는 것인, 방법.
  4. 제3항에 있어서, 상기 아미노산 유형의 변형된 아미노산이 아미노산 유형의 번역 후 변형된 아미노산인, 방법.
  5. 제3항 또는 제4항에 있어서, 상기 아미노산 유형의 변형된 아미노산이 해당 아미노산 유형의 비변형된 아미노산과 독립적으로 표지되는 것인, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 아미노산 유형의 R-기가 표지되는 것인, 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 표지가 신호를 제공하는 것인, 방법.
  8. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 표지가 형광 표지인, 방법.
  9. 제7항에 있어서, 상기 형광 표지가 형광 염료, 형광생성 염료, 및/또는 아미노산 유형과 반응 시 형광이 되는 분자인, 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 샘플에서 각 표지된 아미노산 유형의 아미노산 농도가 측정된 표지로부터 계산되고 아미노산 농도가 하나 이상의 단백질 또는 아미노산의 하나 이상의 알려진 아미노산 농도의 측정된 표지를 사용하여 샘플의 측정된 표지와 샘플에서 상기 아미노산 유형의 아미노산 농도 사이를 전환하는 교정 곡선 또는 표준을 사용하여 측정된 표지로부터 계산되는 것인, 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 샘플에서 각 표지된 아미노산 유형의 아미노산 수가 계산되고, 샘플에서 각 표지된 아미노산 유형의 아미노산 수가 샘플에서 해당 아미노산 유형의 아미노산 농도를 샘플의 총 몰 농도로 나누어 계산되는 것인, 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도를 식별하는 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도, 및/또는 아미노산 수를 나타내는 정보가 데이터베이스로부터 수득되는 것인, 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도를 식별하는 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 및/또는 아미노산 농도, 및/또는 아미노산 수를 나타내는 정보가 참조인, 방법.
  14. 제13항에 있어서, 상기 참조가 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도를 농도의 공통 파라미터에 따라 파라미터 방정식 세트 또는 벡터 함수로서 제공하고/하거나, 상기 참조가 각 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 아미노산 수를 제공하는 것인, 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 샘플에서 각 표지된 아미노산 유형의 측정된 표지, 아미노산 농도 또는 아미노산 수가 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수와 동일하거나, 이에 대한 오차 한계보다 작거나 같은 경우, 단계 e)가 샘플에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 양 및/또는 농도를 식별하는 단계를 포함하는 것인, 방법.
  16. 제15항에 있어서, 상기 샘플에서 측정된 2 개 이상의 아미노산 유형의 측정된 표지 및/또는 아미노산 농도가 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도와 동일하거나, 이에 대한 오차 한계보다 작거나 같은 농도의 단일 값이 존재하는 경우, 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 존재 및/또는 농도가 샘플에서 식별되는 것인, 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 샘플에서 식별된 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 양이 샘플에서 식별된 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 농도에 샘플의 부피를 곱한 것인, 방법.
  18. 제15항 또는 제16항 중 어느 한 항에 있어서, 상기 방법의 단계 e)가 샘플의 표지된 아미노산 유형의 측정된 표지 및/또는 아미노산 농도 및/또는 아미노산 수와 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도 및/또는 아미노산 수 사이의 최소 거리를 계산하고 이 계산된 최소 거리에 대한 오차 한계를 비교하는 단계를 추가로 포함하는 것인, 방법.
  19. 제15항, 제16항, 또는 제18항 중 어느 한 항에 있어서, 상기 오차 한계가 사용자 지정 허용오차 값을 포함하거나, 샘플이 c 개의 별개의 관심 단백질, 펩티드, 단백질 복합체, 하위단백체, 또는 단백체를 함유하는 것으로 의심되는 경우, 거리가 정돈되고, 오차 한계가 거리의 c번째 가장 작은 값인, 방법.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 하나 이상의 농도에서 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도, 및/또는 아미노산 수가 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 아미노산 서열 또는 서열들 및/또는 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 번역 후 변형에 대한 실험적 정보로부터 계산되는 것인, 방법.
  21. 제1항에 있어서, 상기 단계 e)가 샘플에서 2 개 이상의 표지된 아미노산 유형의 각 표지된 아미노산 유형의 측정된 표지를 하나 이상의 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형 각각의 알려진 표지 값과 비교하는 단계, 또는 샘플에서 각 표지된 아미노산 유형의 아미노산 농도를 하나 이상의 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 아미노산 농도와 비교하는 단계, 또는 샘플에서 2 개 이상의 표지된 아미노산 유형의 각 표지된 아미노산 유형의 아미노산 수를 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 아미노산 수와 비교하는 단계를 포함하는 것인, 방법.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, 상기 단계 e)가 샘플에서 2 개 이상의 표지된 아미노산 유형의 각 표지된 아미노산 유형의 측정된 표지 및/또는 아미노산 농도 및/또는 아미노산 수를 농도의 함수로서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체 내의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도, 및/또는 n 개의 표지된 아미노산 유형에 상응하는 n-차원 공간을 사용하여 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체 또는 단백체의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 아미노산 수와 비교하는 것을 포함하는 것인, 방법.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 관심 단백체 또는 하위단백체 내의 샘플에서 표지된 아미노산 유형과 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도 및/또는 아미노산 수가 관심 단백체 또는 하위단백체 내에 함유된 모든 아미노산 서열의 각 아미노산 유형의 알려진 표지 값, 아미노산 농도 또는 아미노산 수의 가중 평균인, 방법.
  24. 제1항 내지 제23항 중 어느 한 항에 있어서, 상기 관심 단백체 및/또는 하위단백체가 HIV 단백체 및/또는 이의 하위단백체; 및/또는 SARS-CoV-2 단백체 및/또는 이의 하위단백체; 및/또는 인수공통 단백체 및/또는 이의 하위단백체; 및/또는 감염 단백체 및/또는 이의 하위단백체에 대한 숙주 반응; 및/또는 암 단백체 및/또는 이의 하위단백체인, 방법.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 방법이 샘플 내에서 하나 이상의 관심 암 단백체 및/또는 암 하위단백체의 존재 및/또는 농도 및/또는 양을 식별하는 단계를 포함하는 것인, 방법.
  26. 제1항 내지 제25항 중 어느 한 항에 있어서, 상기 단계 (e)가 샘플에서 각 표지된 아미노산 유형의 측정된 표지 및/또는 아미노산 농도를 기계 학습 분류기를 사용하여 하나 이상의 농도에서 하나 이상의 관심 단백질, 펩티드, 올리고펩티드, 폴리펩티드, 단백질 복합체, 하위단백체, 또는 단백체 각각의 샘플에서 표지된 동일한 2 개 이상의 아미노산 유형의 알려진 표지 값 및/또는 아미노산 농도와 비교하는 것을 포함하는 것인, 방법.
KR1020237008713A 2020-08-14 2021-08-12 단백질 또는 프로테옴의 존재 및/또는 농도 및/또는 양을 확인하는 방법 KR20230079354A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GB2012749.4 2020-08-14
GB2012749.4A GB2597997A (en) 2020-08-14 2020-08-14 Method of identifying the presence and/or concentration and/or amount of proteins or proteomes
GBGB2110514.3A GB202110514D0 (en) 2020-08-14 2021-07-21 Methods of identifying the presence and/or concentration and/or amount of proteins or proteomes
GB2110514.3 2021-07-21
PCT/GB2021/052101 WO2022034336A1 (en) 2020-08-14 2021-08-12 Methods of identifying the presence and/or concentration and/or amount of proteins or proteomes

Publications (1)

Publication Number Publication Date
KR20230079354A true KR20230079354A (ko) 2023-06-07

Family

ID=72615434

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237008713A KR20230079354A (ko) 2020-08-14 2021-08-12 단백질 또는 프로테옴의 존재 및/또는 농도 및/또는 양을 확인하는 방법

Country Status (12)

Country Link
US (1) US20240060991A1 (ko)
EP (1) EP4196797A1 (ko)
JP (1) JP2023539079A (ko)
KR (1) KR20230079354A (ko)
CN (1) CN117203527A (ko)
AU (1) AU2021324454A1 (ko)
BR (1) BR112023002580A2 (ko)
CA (1) CA3188307A1 (ko)
GB (2) GB2597997A (ko)
IL (1) IL300590A (ko)
MX (1) MX2023001706A (ko)
WO (1) WO2022034336A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112858713B (zh) * 2021-01-13 2022-11-15 中国工程物理研究院流体物理研究所 一种基于低回损半悬置式Asay膜探针的喷射物质测量方法
WO2024040189A1 (en) * 2022-08-18 2024-02-22 Seer, Inc. Methods for using a machine learning algorithm for omic analysis

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019217727A2 (en) * 2018-05-10 2019-11-14 The Board Of Trustees Of The Leland Stanford Junior University Methods for proteome labeling

Also Published As

Publication number Publication date
EP4196797A1 (en) 2023-06-21
US20240060991A1 (en) 2024-02-22
GB202110514D0 (en) 2021-09-01
GB2597997A (en) 2022-02-16
MX2023001706A (es) 2023-05-03
BR112023002580A2 (pt) 2023-05-02
CN117203527A (zh) 2023-12-08
IL300590A (en) 2023-04-01
GB202012749D0 (en) 2020-09-30
JP2023539079A (ja) 2023-09-13
CA3188307A1 (en) 2022-02-17
WO2022034336A1 (en) 2022-02-17
AU2021324454A1 (en) 2023-03-23

Similar Documents

Publication Publication Date Title
US20220252612A1 (en) Diagnostic method based on large scale identification of post-translational modification of proteins
Sigdel et al. Shotgun proteomics identifies proteins specific for acute renal transplant rejection
US20240060991A1 (en) Methods of identifying the presence and/or concentration and/or amount of proteins or proteomes
DK2209893T3 (en) The use of aptamers in proteomics
US20210239705A1 (en) Methods and applications of protein identification
Végvári et al. Biobank resources for future patient care: developments, principles and concepts
US20190234966A1 (en) Methods and compositions for tauopathy diagnosis and treatment
US20180100858A1 (en) Protein biomarker panels for detecting colorectal cancer and advanced adenoma
JP2023527149A (ja) ポリペプチドの処理および分析のための方法、システムおよびキット
US20110039277A1 (en) Methods of Labeling Proteins
Fedoryshchak et al. Discovery of lipid-mediated protein–protein interactions in living cells using metabolic labeling with photoactivatable clickable probes
Drabovich et al. Protein Biomarker Discovery: An Integrated Concept
Zubair et al. Contribution of proteomics in transplantation: identification of injury and rejection markers
Sigdel et al. Interpreting the proteome and peptidome in transplantation
JP6017724B1 (ja) 十二指腸液試料の膵液由来成分検出用試料としての適性評価方法
US20050019844A1 (en) Method of detecting malignant tumor and detection kit
US20230045066A1 (en) Biomarkers for diagnosing breast cancer and uses thereof
Lee et al. In Vitro Cancer Diagnostics
GR20160100569A (el) Μεθοδος για τη φθορισμομετρικη ανιχνευση και/ή ποροστικοποιηση των πρωτεϊνικων καρβονυλομαδων
Patel et al. Microbial Proteomics
Slaughter Article Watch: July, 2023
Subramanian et al. Cancer proteomics: New horizons and insights into therapeutic applications
Perez Development of Fast Photochemical Oxidation of Proteins for in Vivo Modification in Caenorhabditis elegans
Dahan et al. Antibody‐based Proteomics: From bench to bedside
JP2011209224A (ja) 抗原検索法及び抗体検出法