KR20170028322A - 상이한 생물학적 샘플의 혼합물에 포함된 화학적 화합물의 상대적인 정량화 방법 - Google Patents

상이한 생물학적 샘플의 혼합물에 포함된 화학적 화합물의 상대적인 정량화 방법 Download PDF

Info

Publication number
KR20170028322A
KR20170028322A KR1020167036573A KR20167036573A KR20170028322A KR 20170028322 A KR20170028322 A KR 20170028322A KR 1020167036573 A KR1020167036573 A KR 1020167036573A KR 20167036573 A KR20167036573 A KR 20167036573A KR 20170028322 A KR20170028322 A KR 20170028322A
Authority
KR
South Korea
Prior art keywords
sample
samples
normalization
matrix
present
Prior art date
Application number
KR1020167036573A
Other languages
English (en)
Inventor
디르크 발켄보르그
제프 후이베르그스
Original Assignee
비토 엔브이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 비토 엔브이 filed Critical 비토 엔브이
Publication of KR20170028322A publication Critical patent/KR20170028322A/ko

Links

Images

Classifications

    • G06F19/707
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7233Mass spectrometers interfaced to liquid or supercritical fluid chromatograph
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G06F19/703
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • G01N2030/8809Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample
    • G01N2030/8813Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials
    • G01N2030/8831Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials involving peptides or proteins
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2570/00Omics, e.g. proteomics, glycomics or lipidomics; Methods of analysis focusing on the entire complement of classes of biological molecules or subsets thereof, i.e. focusing on proteomes, glycomes or lipidomes

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Urology & Nephrology (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Hematology (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 샘플에 포함된 하나 이상의 화학적 화합물을 동시에 식별하기 위한 방법으로서, 둘 이상의 상기 샘플의 풀(pool)을 분석적으로 측정하며, 제1 및 제2 신호의 측정된 강도(intensity)는 각각 제1 샘플에서의 제1 및 제2 화학적 화합물의 존재량(abundance)을 나타내고, 제3 및 제4 제2 신호의 측정된 강도는 각각 제2 샘플에서의 제3 및 제4 화학적 화합물의 존재량을 나타내며, 상기 제1과 제3, 및 상기 제2와 제4 화합물은 동일하거나 상이할 수 있고, 상기 신호 강도는 m 열 및 n 행의 행렬 aij로 편성되며, 상기 n은 2 이상(n≥2)이고 풀의 화학적 화합물의 수에 대응하고, 상기 m은 2 이상(m≥2)이고 풀의 샘플 수에 대응하며, 상기 aij는 샘플 j에 존재하는 화합물 i에 대해 측정된 신호 강도에 대응하고, 하기 식 (1) 내지 (3)을 따른다.
Figure pct00055
(1)
Figure pct00056
(2)
Figure pct00057
(3)

Description

상이한 생물학적 샘플의 혼합물에 포함된 화학적 화합물의 상대적인 정량화 방법{A METHOD FOR THE RELATIVE QUANTIFICATION OF CHEMICAL COMPOUNDS CONTAINED IN A MIXTURE OF DIFFERENT BIOLOGICAL SAMPLES}
본 발명은 샘플(sample)에 포함된 하나 이상의 화학적 화합물을 동시에 식별(simultaneous identification)하고 정량화(quantification) 하는 방법에 관한 것으로, 둘 이상의 상기 샘플의 풀(pool)을 분석적으로 측정하며, 상기 제1 및 제2 신호의 측정된 강도(intensity)는 각각 제1 샘플에서의 제1 및 제2 화학적 화합물의 존재량(abundance)을 나타내고, 제3 및 제4 제2 신호의 측정된 강도는 각각 제2 샘플에서의 제3 및 제4 화학적 화합물의 존재량을 나타내며, 상기 제1과 제3, 및 상기 제2와 제4 화합물은 청구항 제1항의 전문에 따라 동일하거나 상이할 수 있다.
본 발명은 특히 오믹(omics) 분야, 즉 둘 이상의 생물학적 샘플의 풀(pool) 또는 혼합물(mixture)에 존재하는 각각의 생물학적 분자의 동시 특성 결정(simultaneous characterisation) 및 정량화(quantification)에 관한 것이다. 오믹(omics)은 대사체학(metabolomics), 지질체학(lipidomics), 유전체학(genomics) 및 단백질체학(proteomics) 등의 a.o.를 포함한다. 이러한 오믹의 결과는 생물학적 샘플의 구조, 기능 및 역동성을 반영한다.
예를 들어, 풀(pool)에 존재하는 생물학적 분자를 확인하고 정량화하기 위해 여러 가지 분석 기술이 존재하며, NMR 분광학(NMR spectroscopy), 질량 분석법(mass spectrometry), 마이크로어레이(microarrays) 및 차세대 시퀀싱(next-generation sequencing)이 가장 많이 사용된다. 화합물 분리, 식별(identification) 및 정량화(quantification)를 용이하게 하기 위해, 질량 분석법은 예를 들어, 액체 크로마토그래피 (LC), 가스 크로마토그래피 (GC) 또는 모세관 전기이동 (CE)과 결합될 수 있다. 각각의 방법은 전형적으로 다수의 상이한 생체분자 또는 생체분자 특징을 확인할 수 있다.
대사체학, 단백질체학, 지질체학, 유전체학 등의 a.o.에서 생성된 데이터는 보통 디지털화된 스펙트럼 또는 생체분자 수준의 리스트(lists)일 수 있다. 가장 간단한 형태로, 행렬(matrix)은 대상(subjects)으로서 식별된 생체분자에 해당하는 행(rows) 및 생체분자 수준(levels)에 해당하는 열(columns)로 생성된다. 예를 들어, 주성분 분석 및 최소자승 회귀와 같은 통계 프로그램은 이러한 데이터를 분석하는 데 사용할 수 있다. 일단 분자 조성을 결정하면, 데이터 축소 기술(data reduction techniques)을 사용하여 패턴(patterns) 및 관련성(connections)을 밝힐 수 있다.
상기에서 언급한 분석 기술, 특히 질량 분석법 및 NMR에서 여러 샘플을 한 번의 실험으로 풀링하고 측정할 수 있다는 사실과, 다른 샘플의 생물학적 화합물을 동시 식별 및/또는 정량화할 수 있다는 사실은, 풀의 모든 샘플 또는 즉, 모든 측정치가 동일한 양의 계측기(instrument) 변동성에 의해 영향을 받기 때문에 직접적인 통계적 평가에 도움이 된다.
예를 들어, 생물학적 분자의 상대적인 정량화를 하는 데 있어, 분석적 측정에 앞서 분자의 라벨링(labeling)을 많이 수행했는데, 그 이유는 라벨링이 샘플의 멀티플렉싱(multiplexing), 즉 복수의 생물학적 샘플의 풀링(pooling)을 가능하게 하여 다수의 생물학적 샘플의 생물학적 분자가 동시에 정량화될 수 있기 때문이다. 이 목적을 위해, 전구체 라벨링(precursor labeling) 및 동중 라벨링(isobaric labeling)으로 세분화할 수 있는 여러 가지 라벨링 방법론이 개발되었다. 전구체 라벨링의 예로는 대사, 효소 및 화학 라벨링 전략이 있다(Li et al 2012). 아미노산에 의한 안정적 동위원소 라벨링(SILAC)과 같은 대사 전략은 유망하지만 여전히 세포 배양이나 작은 동물에 국한되어 있다. 대안으로, 동위원소 코딩된 유사성 태그(isotope coded affinity tags tags)(Lottspeich et al, ICAT 참조)와 같은 화학적 동위원소 라벨링 접근법뿐만 아니라 O16/O18 효소 교환도 개발된다. 동중 라벨링 전략은 예를 들어, 화학적 라벨링 서브클래스(subclass)에 속하며 다른 아직 손상되지 않은 라벨이 동일한 질량을 가지므로 "동중(isobaric)"이라는 용어는 특별하다. 동중 라벨은 특히 단백질 연구에서 널리 사용되며, 이 태그는 하나의 LC-MS 실행(run)에서 최대 10개의 샘플을 멀티플렉싱할 수 있기 때문에 측정 시간이 단축되고 직접적인 실험 비교가 가능하다. 두 가지의 상용 키트는 탠덤 매스 태그(Tandem Mass Tag, TMT)(6-플렉스(plex) 또는 10-플렉스) 및 상대 및 절대 정량화를 위한 동중 태그(isobaric Tags for Relative and Absolute Quantification, iTRAQ)(4-플렉스 또는 8-플렉스)이다. TMT 및 iTRAQ 동중 태그는 모두 리포터(reporter) 그룹과 아미노 반응 그룹을 포함하며, 모든 태그에 대해 동중 질량 이동을 생성하는 밸런서(balancer) 그룹으로 간격을 둔다(Ross, 2004, Thompson 2003). 태그의 반응성 그룹은 N 말단 및 라이신(lysine)의 자유 아미노 그룹을 표적으로 하여 거의 모든 소화 펩티드(digested peptides)가 적어도 한번 라벨링된다. 라벨링 및 풀링된 펩티드(peptide)의 상대적 정량화는 펩티드 전구체의 단편화시 독특한 리포터 이온의 생성에 의해 달성된다. 이러한 역멀티플렉싱 때문에, 탠덤 질량 스펙트럼에서 이들 리포터 이온의 신호 강도는 멀티플렉스된 샘플에서 펩티드의 상대적 발현 차이를 결정하는 데 사용될 수 있다(Dayon 2008, Zhang 2010, Pichler 2011, Dephoure and Gygi 2012). 이러한 멀티플렉싱은 LC-MS 측정 시간을 상당히 줄여 줄뿐만 아니라 정량화 결과의 변화를 상당히 감소시킨다(Gygi).
그러나, 이 라벨링 프로토콜(protocol)은 샘플의 추가 처리(handling)를 포함하고 있어, 이 동중 라벨링 전략을 수립하고, 일반적으로 라벨링하며, 습식 실험실 수준에서 조직적인 영향(systematic effect)을 받기 쉽다. 예를 들어, 가장 일반적인 처리 오차(handling errors) 중 하나는 샘플 풀링시 발생하는 피펫팅 오차(pipetting errors)(Oberg and Mahoney, 2012) 또는 사전 소화(digestion)된 단백질 농도의 결정 오차다. 이러한 유형의 부정확성은 데이터 정규화(data normalization)로 해결할 수 있다.
이러한 계통오차(조직적인 오차)(systematic errors)를 수정하기 위해 마이크로어레이, LC-MS 또는 NMR 데이터 분석에서 차용한 데이터 정규화 방법이 많이 개발되었다(Ejigu et al 2013, Oberg and Mahoney 2012, bolstad 2003). 퀀타일 정규화(quantile normalization)와 같은 알고리즘(Keshamouni 2005, Jagtap 2006)은 동중 라벨링된 단백질체학(proteomic) 연구에 종종 적용된다. Quant (Boehm 2007); IsobariQ (Artnzen 2010); Isobar (Breitweiser 2011)를 포함하여 동중 라벨링된 데이터에 적합한 여러 소프트웨어 패키지는 글로벌(global) 정규화 방법을 사용한다. 여기서, 정량화 채널(channel) 내의 측정치의 강도 분포는 분포의 평균 또는 중앙 값이 정량화 채널을 통해 동일하도록 일정한 양만큼 이동된다. 다른 소프트웨어 패키지인 i-tracker는 양적 정보와 펩티드 식별을 쉽게 통합하고 iTRAQ 4-플렉스 리포터 이온 비율을 제공하기 위해 개발되었다(Shadford et al 2005).
1. Dayon, L., Hainard, A., Licker, V., Turck, N. et al. 6-플렉스 동중 태그를 이용한 MS/MS에 의한 인간 뇌척수액 내 단백질의 상대적 정량 분석 (Relative quantification of proteins in human cerebrospinal fluids by MS/MS using 6-plex isobaric tags). Anal. Chem. 2008, 80 (8), 2921-2931. 2. McAlister, G. C., Huttlin, E. L., Haas, W., Ting, L. et al. 리포터 이온 동위원소를 이용하여 동중 질량을 갖는 TMT의 멀티플렉싱 용량 증가 (Increasing the multiplexing capacity of TMTs using reporter ion isotopologues with isobaric masses). Anal. Chem. 2012, 84 (17), 7469-7478. 3. Ross, P. L., Huang, Y. N., Marchese, J. N., Williamson, B. et al. 아민 반응 동중 태깅 시약을 이용한 맥주효모균에서의 멀티플렉스된 단백질 정량 (Multiplexed protein quantitation in Saccharomyces cerevisiae using amine-reactive isobaric tagging reagents). Mol. Cell Proteomics 2004, 3 (12), 1154-1169. 4. Oberg, A. L., Mahoney, D. W., 정량 질량 분석법 단백질체학 실험을 위한 통계적 방법 (Statistical methods for quantitative mass spectrometry proteomic experiments with labelling). BMC. Bioinformatics. 2012, 13 Suppl 16, S7. 5. Ejigu, B. A., Valkenborg, D., Baggerman, G., Vanaerschot, M. et al. 대규모 LS-MS 기반 대사체학 프로파일링 실험을 위한 정규화 방법의 평가 (Evaluation of normalization methods to pave the way towards large-scale LC-MS-based metabolomics profiling experiments). OMICS. 2013, 17 (9), 473-485. 6. Bolstad, B. M., Irizarry, R. A., Astrand, M., Speed, T. P., 분산 및 바이어스 기반 고밀도 올리고뉴클레오티드 어레이 데이터에 대한 정규화 방법의 비교 (A comparison of normalization methods for high density oligonucleotide array data based on variance and bias). Bioinformatics. 2003, 19 (2), 185-193. 7. Keshamouni, V. G., Michailidis, G., Grasso, C. S., Anthwal, S. et al. 이동성/침습성 표현형을 나타내는 상피간엽이행을 겪고 있는 폐암 세포의 iTRAQ-2DLC-MS/MS에 의한 단백질 발현 프로파일링 차이 (Differential protein expression profiling by iTRAQ-2DLC-MS/MS of lung cancer cells undergoing epithelial-mesenchymal transition reveals a migratory/invasive phenotype). J. Proteome Res. 2006, 5 (5), 1143-1154. 8. Jagtap, P., Michailidis, G., Zielke, R., Walker, A. K. et al. 시간 경과에 따른 정량적인 단백질체학에 의해 밝혀진 탄저균의 초기 발병 (Early events of Bacillus anthracis germination identified by time-course quantitative proteomics). Proteomics 2006, 6 (19), 5199-5211. 9. Boehm, A. M., Putz, S., Altenhofer, D., Sickmann, A., Falk, M., iTRAQ를 이용한 펩티드 정량화 기반의 정확한 단백질 정량 (Precise protein quantification based on peptide quantification using iTRAQ). BMC. Bioinformatics. 2007, 8, 214. 10. Arntzen, M. O., Koehler, C. J., Barsnes, H., Berven, F. S. et al. IsobariQ: IPTL, iTRAQ, 및 TMT를 사용하는 동중 정량적 단백질체학용 소프트웨어 (IsobariQ: software for isobaric quantitative proteomics using IPTL, iTRAQ, and TMT). J. Proteome Res. 2011, 10 (2), 913-920. 11. Breitwieser, F. P., Muller, A., Dayon, L., Kocher, T. et al. 단백질 상대 표현 동중 태그로부터의 데이터의 일반적인 통계적 모델링 (General statistical modeling of data from protein relative expression isobaric tags). J. Proteome Res. 2011, 10 (6), 2758-2766. 12. Shadforth, I. P., Dunkley, T. P., Lilley, K. S., Bessant, C., i-Tracker: iTRAQ를 이용한 정량적인 단백질체학 (i-Tracker: for quantitative proteomics using iTRAQ). BMC. Genomics 2005, 6, 145. 13. Lahr, M., de Mesnard, L., 입출력 분석에서의 이중 기법: 표 갱신 및 구조 분석 (Biproportional Techniques in Input-Output Analysis: Table Updating and Structural Analysis). Economic Systems Research 2004, 16 (2), 115-134. 14. Deming, W. E., Stephan, F. F., 예상 한계 총계를 알고 있을 경우의 샘플 빈도 표의 최소자승 조정 (On a Least Squares Adjustment of a Sampled Frequency Table When the Expected Marginal Totals are Known). Ann. Math. Statist. 1940, 427-444. 15. Fienberg, S. E., 우연성 표의 추정을 위한 반복적인 절차 (An Iterative Procedure for Estimation in Contingency Tables). Ann. Math. Statist. 1970, 907-917. 16. Bortner, J. D., Jr., Richie, J. P., Jr., Das, A., Liao, J. et al. 담배 연기에 의한 ITI-HC3 및 VDBP의 하양 조절을 나타내는 iTRAQ에 의한 인간 혈장의 단백질체학 프로파일링 (Proteomic profiling of human plasma by iTRAQ reveals down-regulation of ITI-HC3 and VDBP by cigarette smoking). J. Proteome Res. 2011, 10 (3), 1151-1159. 17. Amelina, H., Sjodin, M. O., Bergquist, J., Cristobal, S., iTRAQ LC-MS/MS에 의한 쥐 간 괴산화물의 연령 관련 변화에 대한 정량학적 하위 조직 분석 (Quantitative subproteomic analysis of age-related changes in mouse liver peroxisomes by iTRAQ LC-MS/MS). J. Chromatogr. B Analyt. Technol. Biomed. Life Sci. 2011, 879 (30), 3393-3400. 18. Kall, L., Vitek, O., 전산 질량 분석법 기반 단백질체학 (Computational mass spectrometry-based proteomics). PLoS. Comput. Biol. 2011, 7 (12), e1002277. 19. Ting, L., Rad, R., Gygi, S. P., Haas, W., 동중 멀티플렉스된 정량적 단백질체학에서 비율 왜곡을 제거한 MS3 (MS3 eliminates ratio distortion in isobaric multiplexed quantitative proteomics). Nat. Methods 2011, 8 (11), 937-940.
그러나, 기존 정규화 방법은 샘플 처리 및 측정 프로토콜에 의해 유도된 조직적인 영향(systematic effect)을 완전히 보정(교정)(correct)할 수 없기 때문에 불충분하다고 입증되었다. 따라서, 본 발명은 샘플 처리 및 측정 프로토콜에 의해 유도되는 조직적인 영향이 기존의 정규화 기술에 의해 실제로 달성되는 것보다 더 효율적인 방식으로 제거될 수 있는 정규화 방법을 제공하는 것을 목적으로 한다.
본 발명은 청구항 제1항의 특징부의 기술적 특징을 나타내는 방법으로 달성된다.
본 발명의 방법은 샘플(sample)에 포함된 하나 이상의 화학적 화합물을 동시에 식별(simultaneous identification)하는 방법을 제공하는데, 둘 이상의 상기 샘플의 풀(pool)을 분석적으로 측정하며, 제1 및 제2 신호의 측정된 강도(intensity)는 각각 제1 샘플에서의 제1 및 제2 화학적 화합물의 존재량(abundance)을 나타내고, 제3 및 제4 제2 신호의 측정된 강도는 각각 제2 샘플에서의 제3 및 제4 화학적 화합물의 존재량을 나타내며, 상기 제1과 제3, 및 상기 제2와 제4 화합물은 동일하거나 상이할 수 있고,
상기 신호 강도는 m 열 및 n 행의 행렬 aij로 편성되며, 상기 n은 2 이상(n≥2)이고 풀(pool)의 화학적 화합물의 수에 대응(corresponds)하고, 상기 m은 2 이상(m≥2)이고 풀(pool)의 샘플 수에 대응하며, 상기 aij는 샘플 j에 존재하는 화합물 i에 대해 측정된 신호 강도에 대응하고, 상기 i는 1 내지 n이고, 상기 n은 2 이상(n≥2)이며, 상기 j는 1 내지 m이고, 상기 m은 2 이상(m≥2)이며,
Figure pct00001
(1)
상기 완전한(complete) 데이터 행렬 A의 행은 제1 스케일링 제한(first scaling constraint)을 받으며,
Figure pct00002
(2)
완전한 데이터 행렬 A의 열은 다음과 같도록 제2 정규화 제한(second normalisation constraint)에 적용되고,
Figure pct00003
(3)
제한된 최적화(constrained optimisation)를 해결할 수 있다.
사실, 본 발명은 샘플의 풀에 포함된 화합물의 정량화 데이터를 보다 정확하게 정규화할 수 있는 데이터-구동(data-driven) 정규화 방법을 제공한다. 본 발명은 특히, 데이터-의존(data-dependent) 방식의 정규화를 제공하여, 당 업계에 공지된 현재의 정규화 기술로 달성되는 계통오차를 보정 또는 제거하는 것보다, 풀에 포함된 화합물을 정량화하는 데 사용되는 분석 기술에 적절한 측정 프로토콜에 의해 유도된 계통오차를 보다 효율적으로 보정 또는 제거할 수 있게 한다. 결과적으로, 데이터에 존재하는 생물학적 정보를 모호하게 하는 위험이 최소한으로 줄어들 수 있다.
실제로, 본 발명의 방법은 측정에서의 모든 현재 신호의 평균이 1/m과 같도록 샘플의 풀의 분석적 측정 내에서 각 신호의 강도를 정규화하고, 여기서 m은 풀 내의 상이한 샘플의 수이다.
이러한 제한은 관측된 강도를 동일한 양으로 수정(보정)하는 동시에 제한된 자유도를 부여하여 비율을 조정하는 것을 목표로 한다.
본 발명의 방법에서,
- 화학적 화합물의 대부분은 샘플간에 변하지 않으며 정규화를 위한 기준 세트(reference set)로 사용될 수 있다.
- 상향 및 하향 조절된 신호 또는 화합물의 분포는 거의 대칭적이다.
- 계통오차가 발생하면 풀링된 샘플에서 측정된 모든 강도에 영향을 미치므로 모든 화합물의 강도 분포가 영향을 받는다.
- 특정 신호의 생성에 선호(preference)가 없다. 즉, 모든 화합물은 동일한 양호한(favorable) 단편화(fragmentation) 특성을 갖는다.
이는 특정 샘플에 대한 신호가 관찰되는 경우 특정 화합물에 대한 합계가 1과 같아지도록 모든 신호 강도를 재조정할 수 있다. 다시 말해서, 화학적 화합물은 현재 풀링된 샘플에서의 존재량을 반영하는 퍼센트 분포에 의해 정량화된다.
이러한 가정은 신호 강도 분포의 이동(shifts)이 생물학적 효과에 기인한 것이 아니라 조직적인 편차(systematic bias)에서 기인한다는 효과를 갖는다. 이에 따라 본 발명은 데이터-의존 방식으로 여러 샘플의 혼합물의 정확한 정규화를 수행할 수 있게 한다. 따라서, 정량화된 성분은 비율로, 예를 들어 샘플에 존재하는 6개 화합물의 식스플렉스 풀(sixplex pool)의 1/6 또는 10개 화합물의 텐플렉스 풀(ten-plex pool)의 1/10로 표시된다.
따라서 본 발명은
Figure pct00004
의 원래(original) 데이터로부터 최소한으로 벗어나는 '새로운(new)'행렬
Figure pct00005
를 제공하는 반면, 상기에서 설명된 실험 조건에 의해 부과된 한 세트의 동일성 제한 조건의 대상이 된다:
Figure pct00006
실제로, 본 발명의 상기 식 (2) 및 (3)은 누락된 관측치(observations)를 포함할 수 있고 명쾌한(elegant) 수학적 대칭을 반영하기 위해 개선된(refined) 형태로 재기입된 데이터를 처리하도록 일반화될 수 있다:
Figure pct00007
(4)
Figure pct00008
(5)
상기에 언급된 제한 조건의 최종 형태를 제공한다.
이러한 것들의 편리한 이점은 샘플에 포함된 각 화합물이 둘 이상의 샘플의 혼합물 또는 풀에서 대응하는 샘플의 상대적인 기여도(contribution)에 의해 정량화되기 때문에, 하류 통계 분석(downstream statistical analysis)이 화합물에 조건부로 수행될 필요가 없다는 것이다. 따라서, 하나의 샘플 내 화합물의 존재량은 서로 비교될 수 있으며 추가 데이터 처리 없이도 하나의 단일 샘플 내에서 화합물 강도로 나타내어질 수 있다. 이러한 것들이 없으면, 샘플의 정량화를 허용하기 위해 조건부 통계 분석이 요구될 것이다. 즉, 종래 기술에서 개개의 성분의 정량화는 실시예(practical) 샘플과 대조군(control) 사이의 성분비 수준에서 수행된다. 종래 기술에서 행해진 바와 같이 외부 표준을 사용하는 것은 실험 설계의 유연성(flexibility)에 중요한 제한을 부과하며, 이는 본 발명에 의해 현재 회피될 수 있다.
개별 구성 요소는 알려진 정규화 방법에서 수행되는 것처럼 각 측정에 대해 정규화될 뿐만 아니라 오히려 여러 샘플의 하나 또는 여러 개의 후속 풀에 대한 여러 후속 측정을 포함할 수 있는 전체 실험에서 정규화된다. 따라서, 본 발명은 상이한 실행(runs)에 걸쳐 상이한 샘플을 비교하는 것을 가능하게 하고, 본 발명의 방법을 기존의 정규화 접근법과 구별한다. 다시 말해서, 본 발명의 방법은 계통오차를 보정하면서 실험 조건과의 관련성(connections)을 유지할 수 있다는 이점을 제공한다. 결과적으로, 본 발명의 방법은 다른 분석 측정을 다른 분석 시점 또는 상이한 시점에서 수행하기 위해 사용될 수 있다. 따라서, 본 발명의 실험 내 정규화는 몇몇 분석 실행의 실험 간 비교를 가능하게 한다.
상기에서, 제1과 제3, 및 상기 제2와 제4 화합물은 동일하거나 상이할 수 있고, 제1, 제3, 제2 및 제4 신호는 동일하거나 상이할 수 있다. 또한 위의 경우 m ≥ 2이며 풀의 화학적 화합물의 수 및/또는 행렬에 사용된 신호 수에 해당한다.
당 업계에 공지된 퀀타일 정규화에서, 각각의 실험은 개별적으로 정규화된다. 이 알려진 개별 정규화는 실험 조건이 아닌 분석 측정의 클러스터링을 초래한다.
다른 한편으로, 본 발명은 각각이 동일하거나 상이할 수 있는 몇몇 화학적 화합물을 포함할 수 있는 여러 샘플의 풀을 처리(handling)할 수 있고, 분석 실행의 교차점에서 모든 분석 데이터를 하나의 정규화 절차(procedure)로 비교할 수 있다. 이 교차점은 실험 그룹을 기반으로 데이터 클러스터링을 유도한다. 결과적으로, 정규화된 신호 강도에 대해 직접적으로 추가 통계 분석을 수행할 수 있으므로 실험 그룹을 엄격하게 비교할 수 있다.
결론적으로, 본 발명의 정규화 절차는 둘 이상의 샘플의 단일 분석 측정 내에서 정규화를 수행할 가능성을 열어 두었을 뿐만 아니라, 다중 분석 실행의 상호 비교를 수행하는 것을 허용한다. 본 발명은 분석적으로 측정된 정량적 데이터로부터 조직적인 영향(systematic effect)을 제거할 수 있는 방법을 제공한다.
본 발명은 또한 분석 측정에서 누락된 데이터를 계산하는 것을 허용한다. 누락 또는 제로 값인 경우 제약 조건은 누락되지 않거나 제로가 아닌 값(비-누락 또는 비-제로 값)의 평균으로 간단하게 일반화된다. 행 i에서 ki 누락 값 및 열 j에서 kj 누락 값의 경우, 제한 조건은 다음으로 변환될 수 있다:
Figure pct00009
Figure pct00010
전술한 바와 같이 제한된 최적화를 해결하기 위해 당업자에게는 몇가지 방법이 사용 가능하다. 제한 조건에서의 대칭은 계량경제학(econometrics) 분야에서 비롯된 직접적 방법론을 사용할 수 있게 한다.
당업자에게 잘 알려진 적절한 방법은 RAS-방법(Stone et al, 1942; Bacharach, 1970) 또는 보다 일반적인 반복적 비례 적합 방법(Iterative Proportional Fitting procedure, IPFP)(Deming and Stephan, 1940; Fienberg, 1970)을 포함한다. 본 발명의 방법은 절차가 유일한 해결책으로 수렴되는 요건에 부합한다.
컴퓨터 과학에서 레이킹(raking)으로 알려진 RAS 절차(RAS procedure)는 원래 데이터 행렬을 변환하는 데 사용된 스케일(scale) 및 정규화 파라미터(parameters)를 나타내는 두 개의 대각선 행렬
Figure pct00011
Figure pct00012
을 추산한다. 대각선 행렬
Figure pct00013
는 각각의 식별된 펩티드 i에 대한 스케일링 파라미터를 포함하는 n × n 행렬이고, 대각선 행렬
Figure pct00014
은 각각의 정량화 채널 j에 대한 정규화 파라미터를 포함하는 m × m 행렬이다. 따라서, 제안된 제한 조건을 준수하도록 원래 데이터를 최적으로 변환하기 위해 m + n 자유도가 필요하다. 행렬 표기법:
Figure pct00015
(6)
이 절차는 수렴(convergence)이 얻어질 때까지 스케일링 단계 (2) 및 정규화 단계 (3) 사이에서 반복한다.
% 정규화 시작
1. 절차 초기화
Figure pct00016
%
Figure pct00017
,
Figure pct00018
에서 루프 시작. 여기서
Figure pct00019
는 수렴에 도달한 마지막 반복이다.
2. 스케일링 단계
스케일링 파라미터 계산:
Figure pct00020
스케일 데이터:
Figure pct00021
3. 정규화 단계
정규화 파라미터 계산:
Figure pct00022
정규화 데이터:
Figure pct00023
4.
Figure pct00024
가 작은 오차인
Figure pct00025
이면 루프를 멈추고,
Figure pct00026
이며, 아니면 t =t+1이다.
% 루프 종료
5. 최종 결과 지정
Figure pct00027
RAS 절차는 제한된 표준화된 데이터를 반환하지만 스케일 및 정규화 행렬의 대각선은 다음과 같이 쉽게 계산할 수 있다:
Figure pct00028
(7)
현재 행 합계가 사전 지정된 행 한계에서 얼마나 벗어 났는지에 따라, 그리고 열 합계가 열 주변(marginals)에서 얼마나 벗어 났는지에 따라 RAS 알고리즘의 단계별 진행이 측정된다. 이를 위해 L1-오차 기능이 도입되었다:
Figure pct00029
홀수(odd) 단계 t의 경우, 행은 사전 지정된 주변과 일치하고 행 오차 합계는 사라진다. 짝수(even) 단계 t의 경우에도, 주변에 이른 열 오차 합계는 제로(0, 영)이다.
알고리즘을 구현할 때 다음 중지 기준을 사용한다: err(t) <
Figure pct00030
여기서
Figure pct00031
는 일반적으로 1E-4 차수의 사용자 정의 임계 값이다. 데이터세트에서 알고리즘은 20회 반복 후 수렴에 도달한다. 이 반복 횟수는 데이터의 양, 데이터의 오차 및 사용자가 지정한 임계 값
Figure pct00032
에 따라 달라질 수 있다.
본 발명의 방법은 신호 강도가 샘플 내의 화학적 화합물의 존재량을 대표하는 다양한 분석 기술, 예를 들어 적외선 분광학, NMR 분광학 및 질량 분석법뿐만 아니라 SIMS, ESR 및 기타 알려진 분석 기술과 함께 사용하기에 적합하다. 본 발명이 질량 분석법을 사용하는 샘플 풀에서 화학적 화합물의 정량화에 사용되는 경우, 바람직하게는, 질량 분석기가 풀링된 샘플에 포함된 화합물의 분리를 허용하는 기술, 예를 들어 액체 크로마토그래피 (LC), 가스 크로마토그래피 (GC) 또는 모세관 전기이동(CE)이 선행된다(preceded).
하나 이상의 생체분자 화합물이 고분자 화합물의 하나 이상의 단편(fragments)에 대응한다는 것은 본 발명의 바람직한 구현예이다. 고분자 화합물은 가장 일반적인 방법, 즉 둘 이상의 빌딩 유닛(구성 단위)(building units)를 포함하는 임의의 분자로 이해되어야 한다. 예로는 유기 및 무기 화합물, 예를 들어 에스테르, 에테르, 폴리에스테르, 에테르, 폴리에테르, 지방산, 모노-, 디- 또는 트리글리세리드, 폴리알킬렌, 폴리옥시알킬렌, 실리케이트, 실록산, 폴리실록산, 미네랄, 알루미나실리케이트, 마그네슘실리케이트, 마그네슘알루미네이트, 유기 또는 무기 카보네이트, 클레임 미네랄(claim mineral), 제올라이트 또는 상기 언급된 화합물 중 둘 이상의 혼합물을 포함한다. 본 발명은 화학적 화합물 또는 그의 단편을 정량화하기 위한 목적으로 분석 측정에 적용될 수 있는 임의의 화학적 화합물과 함께 사용하기에 적합하다는 것을 이해해야 한다.
하나 이상의 화학적 화합물이 하나 이상의 생체분자 및 하나 이상의 생체분자의 하나 이상의 단편 또는 대사 물질 또는 전구체(precursors)로 이루어진 군으로부터 선택되는 것은 본 발명의 특히 바람직한 구현예이다.
본 발명은 오믹(omics), 즉 풀(pool) 또는 둘 이상의 생물학적 샘플의 혼합물에 존재하는 각각의 생물학적 분자의 동시 특성 결정 및 정량화에 사용하기에 특히 적합하다. 이러한 오믹의 결과는 생물학적 샘플의 구조, 기능 및 역동성을 반영한다. 본 발명은 특히 단백질 및 펩티드에 대한 대규모 연구인 단백질체학(proteomics); 지질의 경로 및 네트워크를 연구하는 지질에 대한 대규모 연구인 지질체학(lipidomics); 유전자 및 유전자 전사체(gene transcripts)에 대한 대규모 연구인 유전체학(genomics) 및 세포 과정의 화학적 지문(fingerprints)을 연구하는 대사물질에 대한 대규모 연구인 대사체학(metabolomics)에 사용하기에 적합하다. 대사체(metabolome)는 세포 과정으로부터 생기는 생물학적 세포, 조직, 기관 또는 유기체에서의 대사물질의 집합체를 나타내며, 생리학에 관한 정보, 특히 전술한 화합물의 화학적 구조에 관한 정보를 제공한다.
본 발명의 방법에서, 생체분자는 대사체(metabolome), 즉 소분자 대사물질일 수 있는데, 예를 들어, 생물학적 샘플, 특히 유기체(organism)로부터 유래된 대사중간체, 호르몬 또는 다른 신호 분자, 또는 2차 대사물질일 수 있다.
본 발명의 방법에 따르면, 둘 이상의 상이한 유기체의 둘 이상의 대사체가 단일 측정 또는 실험으로 분석될 수 있는데, 예를 들어 아미노산, 유기산, 핵산, 지방산, 아민, 당(sugars), 비타민, 보조인자, 안료, 항생제 등이 분석될 수 있다. 여기서 외인성 대사물질은 약물, 환경오염물질, 식품첨가제, 독소 및 유기체에 의해 자연적으로 생성되지 않는 기타 생체이물질(xenobiotics)로 이루어진 군으로부터 선택된 하나 이상의 화합물을 포함한다.
본 발명에 사용하기에 적합한 생체분자의 예로는 유전자 또는 그의 단편, DNA, mRNA, rRNA, tRNA 및 다른 비-코딩(non-coding) RNA 또는 이의 단편; 단백질, 폴리펩티드, 펩티드, 아미노산; 지질, 인지질, 트리글리세리드, 지방, 지방산; 탄수화물, 상기 언급된 생체분자의 대사물질 및 단편, 및 상기 언급된 생체분자 중 둘 이상의 혼합물을 포함한다.
생체분자는 광범위하게 변하는 원천(sources)으로부터 유래할 수 있으며, 예를 들어 조직 또는 체액(biofluid)으로부터 유래할 수있다. 생체분자는 내인성(endogeneous)일 수도 있고 외인성(exogeneous)일 수도 있다.
본 발명의 범위 내에서, 화학적 화합물은 그대로 분석될 수도 있고, 화학적 화합물을 예정된 분석 측정에 적용하기 전에 미리 라벨링(labeling)할 수도 있다. 라벨링 기술은 당업자에게 잘 알려져 있으며, 당업자는 화학적 화합물의 특성, 특히 분석하고자 하는 생물학적 분자를 고려하여 적절한 라벨링 기술을 선택할 수 있다. 라벨링을 적용하면, 분석 측정은 관련된 라벨 측정에 집중된다.
본 발명의 방법은 단백질 분석에 특히 적합하며, 이로써 LC-MS 분석에 앞서 단백질은 전구체 라벨링(precursor labeling) 또는 동중 라벨링(isobaric labeling) 받을 수 있다. 본 발명은 일련의 스케일 및 정규화 파라미터의 세트를 추산하기 위한 제약만족문제(constrained satisfaction problem)를 나타낸다. 단백질체학(proteomic) 연구에 사용되는 동중(Isobaric) 라벨은 하나의 LC-MS 실행에서 최대 10개의 샘플을 멀티플렉싱(multiplexing)할 수 있으므로 측정 시간이 단축되고 직접적인 실험 비교가 가능하다. 이는 정량적 실험에서 8개 또는 10개 이상의 생물학적 샘플 (iTRAQ / TMT)가 측정될 때 특히 유리하고, 예를 들어 충분한 통계 능력을 지닌 다른 펩티드를 검출하기 위한 정량적 단백질체학(proteomics) 실험에서 유리하다.
정규화 인자로서 사용될 수 있는 라벨링된 디자인에서 참조 샘플로서 풀을 추가하는 것은 당 업계에 공지되어 있다(참조 16, 17). 상기에서 설명한 바와 같이, 이 정규화 절차는 샘플 특유의 처리 오차와 같은 파라미터를 무시한다(참조 4). 퀀타일 정규화(quantile normalization) 및 싸이클릭 뢰스 정규화(Cyclic Loess normalisation)를 포함한, 존재량(abundance) 비율 대신 펩티드 수준 존재량 값으로 작동(working)하는 보다 진보된 기술은 하나의 TMT 멀티플렉스, 예를 들어 하나의 TPT 식스플렉스(sixplex) 실험에 대해 우수한 정규화 방법을 제공한다(참조 18). 그러나, 둘 이상의 멀티플렉스 실험을 비교해야 할 때, 이러한 방법에는 단점이 있다. 본 발명은 예를 들어 LC-MS 실행과 같은 상이한 각각의 측정 실행의 실험 간 비교를 용이하게 하는 본 발명의 실험 내 정규화에 의해 이러한 한계를 우회할 수 있다.
당 업계에 공지된 퀀타일 정규화에서, 각각의 TMT 실험은 개별적으로 정규화되며, 실험 조건의 클러스터링(clustering)보다는 TMT 실험의 클러스터링을 초래한다. 다른 한편으로, 본 발명은 측정되어야 하는 모든 샘플을 결합하여, 상이한 측정치의 교차점에 있는 모든 성분을 하나의 정규화 과정으로 비교하여, 실험 그룹에 기초한 클러스터링을 유도한다. 따라서, 추가의 통계 분석은 통계적 분석이 펩티드 비율에 대해 수행되지 않음을 의미하는 특정 화합물, 예를 들어 특정 단백질로부터의 정규화된 성분 강도, 예를 들어 펩티드 강도에 대해 직접 수행될 수 있으며, 이는 이들의 실험 그룹의 엄격한 비교를 용이하게 한다.
따라서, 본 발명은 정량적 정보를 얻기 위해 동중 라벨(isobaric labels)이 사용되는 2D- 및 1D-LC-MS/MS 실험의 분석을 위해 현재 존재하지 않는 생물학적 샘플의 조성을 결정하는 새로운 방법을 제공한다. 본 발명은 멀티플렉스 측정 방법이 수행될 수 있는 방법을 제공하지만, 또한 다수의 동중 측정, 특히 LC-MS/MS 실행의 상호비교를 수행하는 것을 허용한다.
본 발명은 샘플의 풀에 포함된 화합물의 정량화 데이터를 보다 정확하게 정규화할 수 있는 데이터-구동(data-driven) 정규화 방법을 제공한다. 본 발명은 특히, 데이터-의존(data-dependent) 방식의 정규화를 제공하여, 당 업계에 공지된 현재의 정규화 기술로 달성되는 계통오차 즉 풀에 포함된 화합물을 정량화하는 데 사용되는 분석 기술에 적절한 측정 프로토콜에 의해 유도된 계통오차를 보다 효율적으로 보정 또는 제거할 수 있다. 결과적으로, 데이터에 존재하는 생물학적 정보를 모호하게 하는 위험이 최소한으로 줄어들 수 있다.
아래의 도면에서, 도1 및 b는 본 발명에 따른 정규화 전(A) 및 후(B)의 6개의 TMT(Tandem Mass Tags) 리포터 이온의 로그 강도 분포를 나타낸다.
도 2는 퀀타일 정규화(quantile normalization) (A) 및 본 발명에 따른 정규화 (B)를 갖는 계층적 클러스터링(hierarchical clustering)을 나타낸다.
본 발명은 하기 실시예에서 추가로 설명된다.
실시예
샘플의 준비(Sample preparation)
각각 6개의 생물학적으로 독립적인 샘플로부터 유래된 3가지 유형의 면역 세포가 사용되었다.
3가지 다른 실험 조건에 해당하는 3가지 유형의 면역 세포에 대해, 1x HALT 프로테아제 억제제(protease inhibitor) 및 1x HALT 포스파타아제 억제제(phosphatase)(Thermo Scientific)가 포함된 200 ㎕ RIPA 완충액(1x)(Thermo Scientific, Waltham, MA)을 사용하여, 세포 펠릿(pellets)을 얼음에서 3 x 10 초 초음파 처리(sonication)(Branson Sonifier SLPe 초음파 호모지나이저, Labequip, Ontario, Canada)와 함께 용해시켰다. 14,000 g 및 4 ℃에서 15분 동안 샘플을 원심분리한 후, 세포 펠릿을 버렸다. 그런 다음, 피어스(Pierce) BCA 단백질 분석 키트(Thermo Scientific)를 사용하여 단백질 농도를 결정하였다.
다음으로, 각 단백질 샘플 15 ㎍을 100 ㎕의 100 mM 트리에틸암모늄카보네이트(TEAB)의 부피에서 TMT 라벨링 키트(Thermo Scientific으로부터 입수 가능함)가 제공된 50 mM 트리스(2-카르복시에틸)포스핀 2 ㎕를 사용하여 감소시키고, 55 ℃에서 1시간 동안 배양하였다. 375 mM 요오드아세트아미드(iodoacetamide)로 샘플을 알킬화하고, 어두운 데에서 30분 동안 배양한 후, 6(six) 부피의 얼음처럼 차가운 아세톤을 각 샘플에 첨가하였다. 그 후, 샘플을 -20 ℃에서 밤새 배양하였다. 다음날, 샘플을 6,000 g 및 4 ℃에서 10분 동안 원심분리한 후 아세톤을 제거하였다. 다음으로, 단백질 펠릿을 100 mM TEAB 용액 15 ㎕에 재현탁시켰다. 단백질의 추가 가용화를 향상시키고 효율적인 소화(digestion)를 보장하기 위해, 0.1 % Rapigest SF 계면활성제(Waters, Milford, MA)를 샘플에 첨가한 다음, 100 ℃에서 5분 동안 배양한다. 단백질을 소화시키기 위해, 효소 : 단백질의 비율을 1 : 20으로 하여 트립신 골드(Promega)를 첨가하고 샘플을 37 ℃에서 밤새 배양하였다. 그 다음날, Rapigest를 비활성화시키고 샘플에 200 mM HCl을 첨가하여 트립신 소화를 멈추고, 주위 온도에서 30분 동안 인큐베이션 하였다. 14,000 g에서 5분 동안 원심분리한 후, 상청액(supernatant)을 수집하여 추가 사용시까지 -80 ℃에서 보관하였다.
TMT 라벨링(TMT labeling)
태그(tags)의 재구성을 위해, TMT 라벨을 제조자의 프로토콜에 따라 41㎕ 아세토니트릴(acetonitrile)에 용해시켰다. 모든 샘플에서, 10 ㎍의 단백질을 아세토니트릴에 용해된 TMT 태그 4.1 ㎕로 라벨링하고, 모든 샘플을 주위 온도에서 1시간 동안 인큐베이션 하였다. 1 ㎕의 5 mM 히드록실아민(hydroxylamine)을 첨가하여 라벨링 반응을 중단시켰다. 15분 후, 단백질 농도가 1 : 1 : 1 : 1 : 1 : 1 의 비율로 라벨링된 샘플을 바탕으로 풀링된 시료를 제조하였다. 다음으로, 제조자의 지시에 따라 피어스(Pierce) C18 스핀 컬럼 (Thermo Scientific)을 사용하여 라벨링된 분해물을 탈염시켰다. 실험 설정(set-up)의 개요는 표 1에서 확인할 수 있다. 3가지 실험 조건 (A, B 및 C라고 하는 3가지 다른 세포 유형)에 속하는 18개의 샘플은 사용 가능한 TMT 라벨을 통해 블록 무작위화되어 각 조건의 2개의 생물학적 복제물(replicates)이 LC-MS 분석을 위한 풀링된 샘플에 존재한다는 점에 주목해야 한다.
표 1은 실험 설정의 개요를 나타낸다. 6개의 대상(subjects)으로부터 3가지 다른 실험 조건 (A, B 및 C)을 갖는다. 각각의 식스플렉스(sixplex)는 각 실험 그룹의 2개의 생물학적 복제물을 가지고 있다.
[표 1]
Figure pct00033
역상 액체 크로마토그래피 및 질량 분석법(Reversed-phase liquid chromatography and mass spectrometry)
복잡성을 줄이기 위해, Acquity 초고압 액체 크로마토그래피(UPLC) 시스템(Waters)을 사용하여 라벨링된 샘플을 오프라인(offline)으로 분획하였다. TMT-라벨링된 펩티드 혼합물을 30 ㎕의 이동상 A (2 % ACN, 1 % NH4OH, 0.25 % FA, pH = 9)로 재구성하였다. 샘플은 50 mm x 2.1 mm 및 5 ㎛ 입자 (Waters) 크기의 X-bridge BEH130 C18 컬럼에 로드되었다. 펩티드는 1.5 ㎖/분의 유속으로 10분에 걸쳐 2 % 이동상 B(95 % ACN, 4 % NH4OH, 0.5 % FA, pH = 9) 내지 60 % 이동상 B의 선형 구배로 용출되었다. 펩티드 용출은 포토다이오드 어레이로 λ = 214 nm에서의 흡광도를 측정하여 모니터링하였고, 분획은 1분 간격으로 수집하였다. 생성된 분획을 진공 농축기(Eppendorf)에서 건조시켰다.
Acclaim C18 분석 컬럼(75 ㎛ x 15 cm, 3 ㎛ 입자 크기)(Thermo Scientific, San Jose, CA)에 연결된 Acclaim C18 PepMap100 나노-트랩 컬럼(200 ㎛ x 2 cm)을 사용하는 Eksigent 나노-UPLC 시스템의 역상 크로마토그래피로 각 분획을 더 분리하였다. 로딩하기 전에, 샘플을 15 ㎕의 이동상 A(2 % 아세토니트릴 중 0.1 % 포름산)에 용해시키고 20 fmol 글루-1-피브리노펩티드 B(Glu-1-fibrinopeptide B)(Glu-fib, Protea Biosciences, Morgantown, WV)를 첨가하였다. 110분에서 2 내지 35 %의 이동상 B (98 % 아세토니트릴 중 0.1 % 포름산)의 선형 구배에 이어서 2분에서 95 % 이동상 B 로의 급격한 증가가 350 nl/분(nl/min)의 유속으로 사용되었다. 나노-LC는 나노스프레이 이온 소스(Thermo Scientific)에 연결된 피코팁 이미터(PicoTip Emitter)(New Objective, Woburn, MA)를 사용하여 질량 분석기와 온라인(online)으로 연결되었다.
LTQ Orbitrap Velos (Thermo Scientific, San Jose, CA)는 최대 스캔 스펙트럼(350 - 2000 m/z, 해상도 60,000) 다음에 최대 5개의 이중 CID/HCD 직렬 질량 스펙트럼(100-2000 m/z)이 있는 MS/MS 모드로 설정되었다. 탠덤 MS에 의해 추가 조사를 위해 선택된 펩티드 이온은 풀-스캔 질량 스펙트럼의 가장 강렬한 5 개의 피크였다. CID 스캔은 질량 분석기의 선형 이온 트랩에서 획득되었으며, HCD는 orbitrap에서 7500의 해상도로 스캔한다. 사용된 정규화된 충돌 에너지는 CID에서 40 % 및 HCD에서 55 %였다. 우리는 데이터-의존 획득을 위해 90초의 동적 제외 리스트를 적용하였다. 전체 습식 실험실 및 LC-MS 절차는 교란 요인(confounding factor)으로 제어되었다.
데이터 분석(Data analysis)
Proteome Discoverer (1.3) 소프트웨어(Thermo Scientific, San Jose, CA)는 Sequest 및 Mascot 알고리즘을 사용하여 IPI Human 3.87 데이터베이스에 대한 데이터베이스 검색을 수행하는 데 사용되었다. 다음 설정이 적용되었다: 전구체 질량 허용 오차는 10 ppm, 조각 질량 허용 오차는 0.8 Da이다. 트립신은 소화 효소로 지정되었고 두 번의 누락 절단이 허용되었다. 시스테인 카르바미도메틸화 및 TMT 변형(N-말단 및 라이신 잔기)은 고정된 변형으로 정의되고, 메티오닌 산화 및 세린, 트레오닌 및 티로신 잔기에 대한 인산화는 가변적인 변형으로 정의되었다. 결과는 다음과 같은 설정을 사용하여 필터링되었다: 글로벌 FDR <5 % 및 일급(first-ranked) 펩티드가 포함된 중간 및 높은 확실한(confident) 펩티드만이 결과에 포함되었다. TMT 정량화 작업흐름(workflow)에서 가장 확실한 중심 방법(centroid method)은 20 ppm의 적분 윈도우로 사용되었다. 리포터 이온 강도는 선형 방정식의 시스템을 풀고 데이터 시트로부터 알려진 라벨 순도 값을 사용함으로써, 동위원소 오염(isotope contamination)에 대해 보정되었다[12]. 이 연구에서, 이전에 언급된 요구사항과 일치하는 고유한 펩티드의 모든 서열 및 리포터 이온 강도를 추가 데이터 분석을 위해 쉼표로 구분된 값으로 내보냈다.
정규화 원리(Normalization principles)
동중 라벨링 절차에서, 데이터에 존재하는 생물학적 정보가 모호하지 않도록 조직적인 편차(systematic bias)를 제거하기 위한 정규화 방법이 필요하다. 그러므로, 우리는 동중 라벨링 과정(process)의 원칙을 활용하는 데이터 기반 정규화 접근법을 제시한다.
이 조직적인 영향을 정규화할 수 있는 알고리즘을 개발하기 위해, 다음과 같은 가정이 이루어졌다.
1) 대다수의 단백질은 샘플간에 변하지 않으며 정규화를 위한 기준 세트(reference set)로 사용된다. 결과적으로, 극한 실험 조건, 예를 들어 상이한 풀다운(pull-downs)으로부터의 발현 프로파일은 피해야만 한다.
2) 상향 및 하향 조절된 단백질의 분포는 거의 대칭적이다.
3) 계통오차가 발생하면, 풀링된 샘플의 모든 펩티드 강도에 영향을 미치므로 모든 펩티드의 강도 분포가 영향을 받는다.
이러한 가정은 리포터 강도 분포에서 관찰된 변화가 생물학적 효과에 기인한 것이 아니라 조직적인 편차에서 유래했을 가능성이 높다.
또한, 리포터 단편 이온의 생성이 바람직하지 않은 것으로, 즉 모든 동중 라벨이 동일한 유리한 단편화 특성을 갖는 것으로 가정하였다. 따라서, 리포터 강도는 풀링된 샘플에서 펩티드의 상대적 존재량을 반영한다고 가정되었다. 이러한 가정 때문에, 리포터 이온 강도는 상대적인 스케일로 제시될 수 있다. 이 목적을 위해, 특정 펩티드에 대한 그들의 합이 1과 같아지도록 강도를 재조정하였다. 다시 말하면, 펩티드는 풀링된 샘플에서의 존재량을 반영하는 퍼센트 기여도에 의해 정량화된다.
이상적인 상황에서는 소화(digestion)하기 전에 바이신코닉산 bicinchoninic acid, BCA) 단백질 농도 분석에 의해 풀에서 균등화되기 때문에 풀링된 샘플의 펩티드 농도가 동일해야 한다. 다시 말해서, 글로벌 단백질 농도가 리포터 채널에 걸쳐 동일하도록, 즉 1 : 1 : 1 : 1 : 1 : 1의 비율이되도록 샘플은 풀링된다. 풀링 전에 이 샘플 균등화는 동일한 리포터 강도 분포를 가져야하므로, m 라벨을 포함하는 동중 라벨링 실험의 경우 정량화 채널에서 펩티드 강도의 평균값은 1/로 설정한다. 글로벌 정규화와 같이 일반적으로 적용되는 정규화 방법은 강도 분포를 위 또는 아래로 이동하는 것과 일치하는 사용자 정의 값으로 강도를 중심에 맞춘다. 그러나, 분포를 1/m으로 이동시키는 정규화를 적용하면 풀에서 샘플의 퍼센트 기여도에 대한 해석이 무효화된다. 따라서, 데이터 정규화 중에 제한 조건을 적용해야 한다.
제한 조건은 리포터 강도의 합이 1과 같고 적용되고, 관찰된 강도 분포의 평균이 1/m이되도록 정규화되었다. 관찰된 강도를 동일한 양으로 수정하는 동시에 제한된 자유도를 부여함으로써 비율을 조절하는 것을 목표로 했다: 펩티드 당 하나의 계수와 리포터 채널 당 하나의 계수.
m-플렉스(m-plex) 동중 라벨링 실험에서 비롯된 데이터는 직사각형 데이터 형식으로 표현될 수 있다. 이 형식은 탠덤 매스 스펙트럼(tandem mass spectrum)으로부터 리포터 이온 강도에 대한 정보를 수집하는 방정식 (1)에 제시된 m × n 데이터 행렬
Figure pct00034
이다. 이 매트릭스의 열은 멀티플렉스된 샘플에 대응하는 m개의 정량화 채널을 나타내며, 행은 LC-MS 실험에서 확인된 n개의 펩티드를 나타낸다. 보다 공식적으로, 행렬
Figure pct00035
의 각 요소
Figure pct00036
는 리포터 채널 j에서의 펩티드 i의 절대 강도를 나타낸다.
Figure pct00037
(1)
여기서, i = 1,2, ..., n 및 j = 1,2, ..., m. 공식적으로, 우리는 원래의 데이터 행렬
Figure pct00038
.가 주어지면 새로운 정규화 행렬
Figure pct00039
를 생성하는 정규화 과정
Figure pct00040
를 고려한다. 이전 단락에서 설명한 실험 조건에 의해 부과된 결과 행렬
Figure pct00041
는 완전한 데이터 행렬(누락 값 없음)의 경우 다음 제한 조건을 충족해야 한다.
Figure pct00042
(2)
Figure pct00043
(3)
여기서
Figure pct00044
는 정규화된 데이터 행렬
Figure pct00045
의 요소이다. 이 2가지 제한 조건은 다음과 같다.
Figure pct00046
Figure pct00047
. 값이 누락된 경우 이는 누락되지 않은 값에 대한 평균으로 간단하게 일반화된다.
방정식 (2) 및 (3)은 스케일링 제한 및 정규화 제한으로 각각 표시된다. 방정식 (2)의 제한은 정규화된 강도가 특정 펩티드 에 대한 풀에서 샘플 j의 퍼센트 기여도로 해석될 수 있음을 상기한다. 방정식 (3)의 제한은 정규화된 강도의 분포를 1/m의 평균값으로 스케일링하여 각 멀티플렉스된 샘플의 리포터 강도가 풀의 단백질/펩티드 농도에서 동일한 기여도를 반영하도록 한다.
본 발명의 알고리즘의 강점을 나타내기 위해, 전술한 정규화 방법을 표준화된 TMT 식스플렉스(sixplex) 정량 실험에 적용하였고, 여기서 3 x 6 샘플(3개의 실험 그룹으로부터 18개의 생물학적으로 독립적인 샘플을 나타냄)을 랜덤화하며 TMT 식스플렉스 LC-MS 실험 3회에서 측정하였다. 실험 설정의 개요는 표 1에 나와 있다. 도 1은 정규화 전후의 데이터 비교를 나타낸다. 여기서 6 개의 리포터 채널(1에서 6까지 번호가 매겨지며 리포터 채널 TMT 126에서 TMT 131까지를 나타냄)의 로그 강도 분포는 박스플롯(boxplots)을 사용하여 시각화된다.
도 1은 정규화 전후의 데이터 비교를 나타낸다. 도 1a로부터, 작은 시스템 오차, 예를 들어, 피펫팅 오차는 샘플 내의 모든 펩티드의 강도 분포에 영향을 미친다. 샘플은 1 : 1 : 1 : 1 : 1 : 1의 비율로 모아졌기 때문에, 리포터 채널을 통해 그 강도 분포가 동일해야 한다. 식스플렉스 실험에 존재하는 조직적인 습식 실험실 오차는 리포터 채널의 변환된 강도 분포에서 교대로(위쪽 또는 아래쪽으로) 감지할 수 있다.
이 목적을 위해, 본 발명의 정규화는 그들의 리포터 강도의 합이 1과 같도록 강도를 재조정한다. TMT 식스플렉스의 경우, 풀링된 샘플의 펩티드 함량은 리포터 강도의 평균이 전체 샘플의 1/6과 같도록 정규화된다. 이 재조정은 도 1b에 설명되어 있다. 도 1b로부터, 강도 분포가 1/6 %에 집중되는 것을 관찰할 수 있다. 이 퍼센트 표현은 이미 Shadforth et al [12]에 의해 제안되었지만 정규화는 방정식 (3)의 제한 조건에 의해 제한되지 않았다. 이러한 것들의 편리한 산출물(artefact)은 풀링된 샘플에서 샘플의 상대적 기여도에 의해 각 펩티드가 정량화됨에 따라 하류 통계 분석(downstream statistical analysis)이 더 이상 펩티드에 대해 조건적으로 수행되지 않는다는 것이다. 따라서, 그들은 추가 처리 없이 단백질 강도로 비교되거나 조합될 수 있다. 이러한 것들이 없으면, 단백질 함량을 정량화하기 위해 조건부 통계 분석이 요구된다. 즉, 단백질 정량화는 케이스(case)와 대조군(control) 사이의 펩티드 비 수준에서 수행된다. 이 후자의 구성은 실험 설계의 유연성에 중요한 제한을 부과하며, 이는 본 발명의 표현에 의해 지금 회피된다.
본 발명에 따른 데이터의 제한 표준화는 RAS 알고리즘 [13] 또는 보다 일반적으로 알려진 반복 비례 피팅 절차 [14, 15]로 불리는 경제학 분야의 알고리즘 절차에 의해 실행된다.
다음으로, 본 발명의 방법은 마이크로어레이 데이터를 표준화하기 위해 종종 사용되는 대중적 퀀타일 정규화 기술과 비교된다. 정규화의 타당성은 연구에서 3 가지 TMT 식스플렉스 실험에 대해 측정된 펩티드 강도를 모으는 클러스터링 분석에 의해 평가된다. 클러스터링은 3개의 식스플렉스 LC-MS/MS 실험(교차점)에서 확인되고 정량화된 펩티드의 하위집합에서 수행된다는 점에 유의해야 한다. 퀀타일 정규화된 강도(quantile-normalized intensity)의 경우 (그림 2a), 클러스터링은 동일한 실험 그룹에 연결된 대상(subject)을 그룹화하지 못한다. 대신, 클러스터링 알고리즘은 동일한 멀티플렉스된 LC-MS 실험에서 풀링된 대상을 그룹화한다. 동일한 LC-MS 실험에 따라 대상을 그룹화하면 클러스터링이 데이터에 여전히 존재하는 계통오차에 의해 유도되고 생물학적 정보가 이러한 오차로 인해 흐려지는 것으로 나타난다. 그러나, 풀링된 샘플의 LC-MS 실험을 볼 때, 클러스터링은 서로 관련된 대상을 그룹화한다는 것을 알 수 있다. 따라서, 동중 라벨링 실험에서 샘플을 비교하기 위해서는 퀀타일 정규화가 충분할 것으로 보인다.
한편, 본 발명에 따라 정규화되고 클러스터링된 강도는 데이터를 나타내고, 그 데이터는 생물학적 서브클래스에 대응된다(도 2b). 이 보정된 그룹화는 LC-MS 측정의 조직적인 불필요한 요소가 제거되고, 생물학적 관련 정보가 유지되는 결과로 펩티드 강도에 대한 추가 통계 분석이 수행될 수 있음을 보여준다.

Claims (14)

  1. 샘플에 포함된 하나 이상의 화학적 화합물을 동시에 식별하기 위한 방법으로서, 둘 이상의 상기 샘플의 풀(pool)을 분석적으로 측정하며, 제1 및 제2 신호의 측정된 강도(intensity)는 각각 제1 샘플에서의 제1 및 제2 화학적 화합물의 존재량(abundance)을 나타내고, 제3 및 제4 제2 신호의 측정된 강도는 각각 제2 샘플에서의 제3 및 제4 화학적 화합물의 존재량을 나타내며,
    상기 제1과 제3, 및 상기 제2와 제4 화합물은 동일하거나 상이할 수 있고, 상기 신호 강도는 m 열 및 n 행의 행렬 aij로 편성되며, 상기 n은 2 이상(n≥2)이고 풀의 화학적 화합물의 수에 대응하고, 상기 m은 2 이상(m≥2)이고 풀의 샘플 수에 대응하며, 상기 aij는 샘플 j에 존재하는 화합물 i에 대해 측정된 신호 강도에 대응하고, 상기 i는 1 내지 n이고, 상기 n은 2 이상(n≥2)이며, 상기 j는 1 내지 m이고, 상기 m은 2 이상(m≥2)이며,
    Figure pct00048
    (1)
    상기 행렬 A의 행은 제1 스케일링 제한(first scaling constraint)을 받아 상기 행의 평균이 1/m과 동일하고:
    Figure pct00049
    (2)
    상기 행렬 A의 열은 제2 정규화 제한(second normalisation constraint)을 받아 상기 행렬 A의 열의 평균이 1/m과 동일하며:
    Figure pct00050
    (3)
    제한된 최적화(constrained optimisation)의 풀이(solving)는:
    Figure pct00051
    Figure pct00052
    인 방법.
  2. 제1항에 있어서,
    행렬 A의 누락(missing) 값 또는 제로(zero) 값은 다음과 같이 누락 또는 제로 값을 비-누락 또는 비-제로 값의 평균으로 일반화함으로써 계산되는 방법.
    Figure pct00053


    Figure pct00054

  3. 제1항 또는 제2항에 있어서,
    상기 신호 강도는 고분자 화합물의 하나 이상의 단편(fragments)에 대한 신호 강도에 대응하는 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 하나 이상의 화학적 화합물은 하나 이상의 생체분자 및 상기 하나 이상의 생체분자의 하나 이상의 단편(fragments) 또는 대사물질(metabolites) 또는 전구체(precursors)로 이루어진 군으로부터 선택된 것인 방법.
  5. 제4항에 있어서,
    상기 생체분자는 유전자, 단백질, 펩티드, 지질, 탄수화물, 및 상기 언급된 생체분자의 전구체, 대사물질 및 단편의 그룹으로부터 선택되고, 상기 언급된 생체분자 중 둘 이상의 혼합물을 포함하는 방법.
  6. 제4항 또는 제5항에 있어서,
    상기 대사물질은 생물학적 샘플, 특히 유기체(organism)로부터 유래된 대사중간체, 호르몬, 또는 다른 신호 분자, 또는 2차 대사물질로 이루어진 군으로부터 선택된 것인 방법.
  7. 제5항 또는 제6항에 있어서,
    상기 대사물질은 내인성, 외인성 또는 이종대사물질(xenometabolite), 또는 이들의 둘 이상의 혼합물인 방법.
  8. 제7항에 있어서,
    상기 내인성 대사물질은 아미노산, 유기산, 핵산, 지방산, 아민, 당(sugars), 비타민, 보조인자, 안료 및 항생제로 이루어진 군으로부터 선택된 하나 이상의 화합물을 포함하는 방법.
  9. 제7항에 있어서,
    상기 외인성 대사물질은 약물, 환경오염물질, 식품첨가제, 독소 및 유기체에 의해 자연적으로 생성되지 않는 기타 생체이물질(xenobiotics)로 이루어진 군으로부터 선택된 하나 이상의 화합물을 포함하는 방법.
  10. 제4항 또는 제5항에 있어서,
    상기 생체분자는 DNA, mRNA, rRNA, tRNA 및 다른 비-코딩(non-coding) RNA으로 이루어진 군으로부터 선택된 것인 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서,
    상기 샘플은 장기, 조직 또는 체액(biofluid) 또는 그의 일부인 방법.
  12. 제11항에 있어서,
    상기 체액은 소변(urine) 및 혈장(plasma) 중에서 선택된 것인 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서,
    상기 하나 이상의 화학적 화합물은 분석적 측정에 앞서 라벨링을 거친 방법.
  14. 제13항에 있어서,
    상기 생체분자는 단백질이고, 상기 단백질의 하나 이상의 펩티드는 전구체 라벨링(precursor labeling) 또는 동중 라벨링(isobaric labeling)을 거친 방법.
KR1020167036573A 2014-05-28 2015-05-28 상이한 생물학적 샘플의 혼합물에 포함된 화학적 화합물의 상대적인 정량화 방법 KR20170028322A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462003610P 2014-05-28 2014-05-28
US62/003,610 2014-05-28
PCT/EP2015/061823 WO2015181284A1 (en) 2014-05-28 2015-05-28 A method for the relative quantification of chemical compounds contained in a mixture of different biological samples

Publications (1)

Publication Number Publication Date
KR20170028322A true KR20170028322A (ko) 2017-03-13

Family

ID=53284235

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167036573A KR20170028322A (ko) 2014-05-28 2015-05-28 상이한 생물학적 샘플의 혼합물에 포함된 화학적 화합물의 상대적인 정량화 방법

Country Status (6)

Country Link
US (1) US10598642B2 (ko)
EP (1) EP3149635A1 (ko)
JP (1) JP6518269B2 (ko)
KR (1) KR20170028322A (ko)
CA (1) CA2950356A1 (ko)
WO (1) WO2015181284A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113624856B (zh) * 2021-06-21 2023-04-07 上海抚佳精细化工有限公司 一种测定聚醚改性硅油中各环氧化合物相对含量的方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6334099B1 (en) * 1999-05-25 2001-12-25 Digital Gene Technologies, Inc. Methods for normalization of experimental data
US6680203B2 (en) * 2000-07-10 2004-01-20 Esperion Therapeutics, Inc. Fourier transform mass spectrometry of complex biological samples
EP2270699A1 (en) * 2009-07-02 2011-01-05 BIOCRATES Life Sciences AG Method for normalization in metabolomics analysis methods with endogenous reference metabolites
WO2011125917A1 (ja) * 2010-03-31 2011-10-13 国立大学法人熊本大学 統合プロテオーム解析用データ群の生成方法ならびに同生成方法にて生成した統合プロテオーム解析用データ群を用いる統合プロテオーム解析方法、およびそれを用いた原因物質同定方法
BR112013022208A2 (pt) * 2011-03-02 2022-03-08 Berg Llc Ensaios baseados em investigação celular e usos destes

Non-Patent Citations (19)

* Cited by examiner, † Cited by third party
Title
1. Dayon, L., Hainard, A., Licker, V., Turck, N. et al. 6-플렉스 동중 태그를 이용한 MS/MS에 의한 인간 뇌척수액 내 단백질의 상대적 정량 분석 (Relative quantification of proteins in human cerebrospinal fluids by MS/MS using 6-plex isobaric tags). Anal. Chem. 2008, 80 (8), 2921-2931.
10. Arntzen, M. O., Koehler, C. J., Barsnes, H., Berven, F. S. et al. IsobariQ: IPTL, iTRAQ, 및 TMT를 사용하는 동중 정량적 단백질체학용 소프트웨어 (IsobariQ: software for isobaric quantitative proteomics using IPTL, iTRAQ, and TMT). J. Proteome Res. 2011, 10 (2), 913-920.
11. Breitwieser, F. P., Muller, A., Dayon, L., Kocher, T. et al. 단백질 상대 표현 동중 태그로부터의 데이터의 일반적인 통계적 모델링 (General statistical modeling of data from protein relative expression isobaric tags). J. Proteome Res. 2011, 10 (6), 2758-2766.
12. Shadforth, I. P., Dunkley, T. P., Lilley, K. S., Bessant, C., i-Tracker: iTRAQ를 이용한 정량적인 단백질체학 (i-Tracker: for quantitative proteomics using iTRAQ). BMC. Genomics 2005, 6, 145.
13. Lahr, M., de Mesnard, L., 입출력 분석에서의 이중 기법: 표 갱신 및 구조 분석 (Biproportional Techniques in Input-Output Analysis: Table Updating and Structural Analysis). Economic Systems Research 2004, 16 (2), 115-134.
14. Deming, W. E., Stephan, F. F., 예상 한계 총계를 알고 있을 경우의 샘플 빈도 표의 최소자승 조정 (On a Least Squares Adjustment of a Sampled Frequency Table When the Expected Marginal Totals are Known). Ann. Math. Statist. 1940, 427-444.
15. Fienberg, S. E., 우연성 표의 추정을 위한 반복적인 절차 (An Iterative Procedure for Estimation in Contingency Tables). Ann. Math. Statist. 1970, 907-917.
16. Bortner, J. D., Jr., Richie, J. P., Jr., Das, A., Liao, J. et al. 담배 연기에 의한 ITI-HC3 및 VDBP의 하양 조절을 나타내는 iTRAQ에 의한 인간 혈장의 단백질체학 프로파일링 (Proteomic profiling of human plasma by iTRAQ reveals down-regulation of ITI-HC3 and VDBP by cigarette smoking). J. Proteome Res. 2011, 10 (3), 1151-1159.
17. Amelina, H., Sjodin, M. O., Bergquist, J., Cristobal, S., iTRAQ LC-MS/MS에 의한 쥐 간 괴산화물의 연령 관련 변화에 대한 정량학적 하위 조직 분석 (Quantitative subproteomic analysis of age-related changes in mouse liver peroxisomes by iTRAQ LC-MS/MS). J. Chromatogr. B Analyt. Technol. Biomed. Life Sci. 2011, 879 (30), 3393-3400.
18. Kall, L., Vitek, O., 전산 질량 분석법 기반 단백질체학 (Computational mass spectrometry-based proteomics). PLoS. Comput. Biol. 2011, 7 (12), e1002277.
19. Ting, L., Rad, R., Gygi, S. P., Haas, W., 동중 멀티플렉스된 정량적 단백질체학에서 비율 왜곡을 제거한 MS3 (MS3 eliminates ratio distortion in isobaric multiplexed quantitative proteomics). Nat. Methods 2011, 8 (11), 937-940.
2. McAlister, G. C., Huttlin, E. L., Haas, W., Ting, L. et al. 리포터 이온 동위원소를 이용하여 동중 질량을 갖는 TMT의 멀티플렉싱 용량 증가 (Increasing the multiplexing capacity of TMTs using reporter ion isotopologues with isobaric masses). Anal. Chem. 2012, 84 (17), 7469-7478.
3. Ross, P. L., Huang, Y. N., Marchese, J. N., Williamson, B. et al. 아민 반응 동중 태깅 시약을 이용한 맥주효모균에서의 멀티플렉스된 단백질 정량 (Multiplexed protein quantitation in Saccharomyces cerevisiae using amine-reactive isobaric tagging reagents). Mol. Cell Proteomics 2004, 3 (12), 1154-1169.
4. Oberg, A. L., Mahoney, D. W., 정량 질량 분석법 단백질체학 실험을 위한 통계적 방법 (Statistical methods for quantitative mass spectrometry proteomic experiments with labelling). BMC. Bioinformatics. 2012, 13 Suppl 16, S7.
5. Ejigu, B. A., Valkenborg, D., Baggerman, G., Vanaerschot, M. et al. 대규모 LS-MS 기반 대사체학 프로파일링 실험을 위한 정규화 방법의 평가 (Evaluation of normalization methods to pave the way towards large-scale LC-MS-based metabolomics profiling experiments). OMICS. 2013, 17 (9), 473-485.
6. Bolstad, B. M., Irizarry, R. A., Astrand, M., Speed, T. P., 분산 및 바이어스 기반 고밀도 올리고뉴클레오티드 어레이 데이터에 대한 정규화 방법의 비교 (A comparison of normalization methods for high density oligonucleotide array data based on variance and bias). Bioinformatics. 2003, 19 (2), 185-193.
7. Keshamouni, V. G., Michailidis, G., Grasso, C. S., Anthwal, S. et al. 이동성/침습성 표현형을 나타내는 상피간엽이행을 겪고 있는 폐암 세포의 iTRAQ-2DLC-MS/MS에 의한 단백질 발현 프로파일링 차이 (Differential protein expression profiling by iTRAQ-2DLC-MS/MS of lung cancer cells undergoing epithelial-mesenchymal transition reveals a migratory/invasive phenotype). J. Proteome Res. 2006, 5 (5), 1143-1154.
8. Jagtap, P., Michailidis, G., Zielke, R., Walker, A. K. et al. 시간 경과에 따른 정량적인 단백질체학에 의해 밝혀진 탄저균의 초기 발병 (Early events of Bacillus anthracis germination identified by time-course quantitative proteomics). Proteomics 2006, 6 (19), 5199-5211.
9. Boehm, A. M., Putz, S., Altenhofer, D., Sickmann, A., Falk, M., iTRAQ를 이용한 펩티드 정량화 기반의 정확한 단백질 정량 (Precise protein quantification based on peptide quantification using iTRAQ). BMC. Bioinformatics. 2007, 8, 214.

Also Published As

Publication number Publication date
JP2017527774A (ja) 2017-09-21
US10598642B2 (en) 2020-03-24
WO2015181284A1 (en) 2015-12-03
EP3149635A1 (en) 2017-04-05
JP6518269B2 (ja) 2019-05-22
US20170074842A1 (en) 2017-03-16
CA2950356A1 (en) 2015-12-03

Similar Documents

Publication Publication Date Title
Zeki et al. Integration of GC–MS and LC–MS for untargeted metabolomics profiling
Slavov Single-cell protein analysis by mass spectrometry
Angel et al. Mass spectrometry-based proteomics: existing capabilities and future directions
Huffman et al. Comparative performance of four methods for high-throughput glycosylation analysis of immunoglobulin G in genetic and epidemiological research
Doneanu et al. Analysis of host-cell proteins in biotherapeutic proteins by comprehensive online two-dimensional liquid chromatography/mass spectrometry
Plebani Proteomics: the next revolution in laboratory medicine?
AU2018254394B2 (en) Mass spectrometry assay method for detection and quantitation of organic acid metabolites
Park et al. Characteristic changes in cell surface glycosylation accompany intestinal epithelial cell (IEC) differentiation: high mannose structures dominate the cell surface glycome of undifferentiated enterocytes
Sidoli et al. One minute analysis of 200 histone posttranslational modifications by direct injection mass spectrometry
Hsu et al. Analysis of urinary nucleosides as potential tumor markers in human breast cancer by high performance liquid chromatography/electrospray ionization tandem mass spectrometry
CA3110864A1 (en) Mass spectrometry assay method for detection and quantitation of microbiota-related metabolites
EP2761288A1 (en) Method for analysis of samples in targeted proteomics applications, computer program product and set of reference peptides
Zhou et al. The GlycoFilter: a simple and comprehensive sample preparation platform for proteomics, N-glycomics and glycosylation site assignment
Bringans et al. Comprehensive mass spectrometry based biomarker discovery and validation platform as applied to diabetic kidney disease
Savickas et al. Combinatorial degradomics: Precision tools to unveil proteolytic processes in biological systems
Quesada-Calvo et al. Comparison of two FFPE preparation methods using label-free shotgun proteomics: Application to tissues of diverticulitis patients
CN110678756B (zh) 使用质谱法对低丰度多肽进行绝对定量的方法
Deng et al. Carboxylate-modified magnetic bead (CMMB)-based isopropanol gradient peptide fractionation (CIF) enables rapid and robust off-line peptide mixture fractionation in bottom-up proteomics
Mörtstedt et al. Screening method using selected reaction monitoring for targeted proteomics studies of nasal lavage fluid
James et al. Basic design of MRM assays for peptide quantification
Wu et al. Application of SWATH proteomics to mouse biology
US10598642B2 (en) Method for relative quantification of chemical compounds contained in a mixture of different biological samples
CN112630344B (zh) 代谢标志物在脑梗死中的用途
US20190317047A1 (en) Chemical class compositions from collision cross-section fragment ions
Deng et al. Effects of pretreatment protocols on human amniotic fluid protein profiling with SELDI-TOF MS using protein chips and magnetic beads

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right