TW202314245A - 用於檢測大腸直腸癌的組合物與方法 - Google Patents

用於檢測大腸直腸癌的組合物與方法 Download PDF

Info

Publication number
TW202314245A
TW202314245A TW110136054A TW110136054A TW202314245A TW 202314245 A TW202314245 A TW 202314245A TW 110136054 A TW110136054 A TW 110136054A TW 110136054 A TW110136054 A TW 110136054A TW 202314245 A TW202314245 A TW 202314245A
Authority
TW
Taiwan
Prior art keywords
colorectal cancer
seq
group
blood sample
peptide composition
Prior art date
Application number
TW110136054A
Other languages
English (en)
Other versions
TWI838648B (zh
Inventor
張君照
蔡奕戎
林景堉
Original Assignee
臺北醫學大學
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 臺北醫學大學 filed Critical 臺北醫學大學
Priority to TW110136054A priority Critical patent/TWI838648B/zh
Priority claimed from TW110136054A external-priority patent/TWI838648B/zh
Publication of TW202314245A publication Critical patent/TW202314245A/zh
Application granted granted Critical
Publication of TWI838648B publication Critical patent/TWI838648B/zh

Links

Images

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本發明係用於檢測大腸直腸癌的組合物與方法,其中檢測大腸直腸癌的胜肽組合物係選自由SEQ ID NO:1、SEQ ID NO:2及SEQ ID NO:3的胺基酸序列任二以上組成的群組。而檢測方法包括(a)經一檢測方法檢測一待測個體的一待測血液樣品經一純化方法後獲得之一胜肽組合物的含量,其中該胜肽組合物係選自由SEQ ID NO:1、SEQ ID NO:2及SEQ ID NO:3的胺基酸序列任二以上組成的群組;(b) 比較經(a)測得之該胜肽組合物的含量,與一非大腸直腸癌個體的一血液樣品經該純化方法後獲得的該胜肽組合物的含量,判斷該待測個體是否罹患大腸直腸癌。

Description

用於檢測大腸直腸癌的組合物與方法
本發明關於一種檢測癌症的生物標記組合物和檢測方法,特別有關一種用於檢測大腸直腸癌的檢測方法與胜肽組合物。
根據GLOBOCAN 2018 (Bray F, Ferlay J, Soerjomataram I, Siegel RL, Torre LA, Jemal A. Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA Cancer J Clin. 2018 Nov;68(6):394-424. doi: 10.3322/caac.21492. Epub 2018 Sep 12. Erratum in: CA Cancer J Clin. 2020 Jul;70(4):313. PMID: 30207593.)的數據顯示,大腸直腸癌是世界盛行的癌症之一,全球死亡率是惡性腫瘤的第三名,每一年預計有180萬新增病例,並有881,000死亡病例。
根據106年國民健康署癌症登記報告,目前大腸直腸癌在台灣位居十大癌症發生率的第二名以及十大癌症死亡率的第三名。大腸直腸癌在台灣好發於40~50歲,且男性罹患大腸直腸癌的機率為所有癌症的15%,女性則為8%。根據衛福部癌症登記統計顯示,自84年起標準化發生率為每10萬人口有22.9人,95年大腸直腸癌人數首次超越肝癌,成為我國最多人罹患的癌症,人數已超過15,000人。而104年標準化的發生率為每10萬人口有43.0人,標準化發生率上升87.8%。
大腸直腸癌的危險因子,包括:有年齡、性別、遺傳學因子、罹患大腸直腸癌的一級親屬、缺乏運動、吸煙、肥胖和不健康的飲食習慣。
大腸直腸癌的癌症分期,依照2009國際抗癌聯盟(Union for international cancer control)與美國癌症聯合委員會(American joint committee on cancer, AJCC)發行之第七版TNM分期系統來分類:腫瘤侵犯深度(T)、淋巴結侵犯數目(N)、是否遠端轉移(M)。
大腸直腸癌早期沒有明顯的症狀,待檢測出為大腸直腸癌時,通常已是癌症晚期。常見的病徵包含了腹痛、腹瀉、便秘、直腸出血、糞便潛血或體重減輕。
目前大腸直腸癌檢測方法包含:糞便潛血試驗(Fecal occult blood test, FOBT),利用免疫法或化學法檢測血紅素,但該檢測方法的靈敏度約有50%~70%、肛門指診(Palpation),僅能診斷直腸附近的病灶處、乙狀結腸鏡(Sigmoidoscope),為侵入式檢查,檢測實行前需禁食並服用藥劑去除腸道中的糞便,且有其他風險存在,例如穿孔。鋇劑灌腸攝影檢查(Barium enema),可檢測整個結腸,但其靈敏度較差,可能會遺漏息肉等病灶處、大腸直腸內視鏡(Colonoscopy)能直接用來評估大腸狀況,為侵入式檢查,且有其他風險存在,例如穿孔。
目前臨床使用大腸直腸癌之血液腫瘤標記為癌胚抗原(carcinoembryonic antigen,CEA)與醣抗原 19-9(Carbohydrate Antigen 19-9,CA 19-9),其靈敏度分別為33.3~64.5%與33.3~47.8%,特異性分別為89.2~90.9%與90.5~95.9%。
Hermunend等人提出癌胚抗原與醣抗原 19-9對大腸直腸癌預後的用途(Acta Oncol, 2020. 59(12): p. 1416-1423),評估其靈敏度分別為97.0%與89%,特異性為31.0%與16%; 而合併使用癌胚抗原與醣抗原 19-9:癌胚抗原(≦5 μg/l)合併醣抗原 19-9 (≦26 kU/l)其靈敏度為88.0%,特異性為9.0%、癌胚抗原(>5 μg/l)合併醣抗原19-9 (≦26 kU/l)其靈敏度為100.0%,特異性為88.0%,因此目前臨床上沒有將癌胚抗原與醣抗原 19-9作為大腸直腸癌篩檢的生物標記,而是作為大腸直腸癌的預後評估的生物標記。
臨床使用的癌胚抗原與醣抗原19-9雖然用於大腸直腸癌術後追蹤的預後價值符合臨床需求,但對於篩檢大腸直腸癌的靈敏度低而不符臨床預期。因此目前臨床仍缺乏非侵入性且同時具備高靈敏度和高特異性的大腸直腸癌篩檢生物標記。
本發明之一目的,係為解決大腸直腸癌非侵入式生物標記檢測效能不足的問題。
根據本發明之目的,一種用於檢測大腸直腸癌的胜肽組合物,其中該胜肽組合物係選自由SEQ ID NO:1、SEQ ID NO:2及SEQ ID NO:3的胺基酸序列任二或任二以上組成之群組,其中該胜肽組合物係存在於血液樣品中。
其中,檢測大腸直腸癌的胜肽組合物,係通過一質譜分析檢測該胜肽組合物的含量。
其中,該血液樣品為一血清樣品或、一血漿樣品,或一全血樣品。
其中,該血液樣品經一麥胚芽凝集素進行純化。
根據本發明之目的,係提供一種用於檢測大腸直腸癌的檢測方法,步驟包括:(a)經一檢測方法檢測一待測側個體的一待測血液樣品經一純化方法後獲得之一胜肽組合物的含量,其中該胜肽組合物係選自由SEQ ID NO:1、SEQ ID NO:2及SEQ ID NO:3的胺基酸序列任二以上組成的群組;(b) 比較經(a)測得之該胜肽組合物的含量,與一非大腸直腸癌個體的一比較血液樣品經該純化方法後獲得的該胜肽組合物的含量,判斷該待測個體是否罹患大腸直腸癌。
其中,比較方法係選自由多元邏輯式迴歸、決策樹、隨機森林及支持向量機所組成之群組  。
其中,該檢測方法係選自質譜分析或免疫分析。
其中,該待測血液樣品與該比較血液樣品係皆為一血清樣品,或該待測血液樣品與該比較血液樣品係皆為一血漿樣品,或該待測血液樣品與該比較血液樣品係皆為一全血樣品。
其中,該純化方法為麥胚芽凝集素純化方法。
其中,該質譜分析係選自由基質輔助雷射脫附游離質譜分析、液相層析質譜分析、液相層析串聯質譜分析、及氣相層析質譜分析所組成之群組。
根據本研究方法,證實通過檢測該胜肽組合物,可以克服傳統檢測大腸直腸癌的生物標記的敏感度(Sensitivity)和特異性(Specificity)不足的問題。
為能更清楚理解本發明內容,以下結合附圖以詳細說明本發明的具體實施例。在本說明書中所提之「一」表示一種、至少一種、一個或至少一個。
請參見序列表,本發明提供一種用於檢測大腸直腸癌之胜肽組合物,該胜肽組合物係選自由SEQ ID NO:1、SEQ ID NO:2,以及SEQ ID NO:3之胺基酸序列任二以上組成之群組,且所述胜肽組合物係存在於一待測個體的血液樣品中。其中,由SEQ ID NO:1之胺基酸序列所構成之胜肽片段係屬於蛋白質血小板因子4(platelet factor, PF4)的第54個至第62個胺基酸。由SEQ ID NO:2之胺基酸序列所構成之胜肽片段係屬於蛋白質互聯α胰蛋白酶抑制劑4(inter-alpha-trypsin inhibitor heavy chain 4, ITIH4)的第429個至第438個胺基酸。由SEQ ID NO:3之胺基酸序列所構成之胜肽片段係屬於蛋白質脂蛋白E(apolipoprotein E, APOE)的第198個至第207個胺基酸。
在一實施例中,首先,鑑定與篩選混合血漿中具有信號強度差異的胜肽片段。再來,測定篩選的各個胜肽片段在個別血漿樣品中的信號強度差異。接著,建立根據胜肽片段含量檢測大腸直腸癌的方法。最後,以機器學習方法結合不同胜肽片段含量用於檢測大腸直腸癌的效能評估。
在鑑定與篩選混合血漿中具有信號強度差異的胜肽片段的步驟中:
本發明所使用的血漿樣品係經由臺北醫學大學人體試驗委員會審核通過(案件編號:N20130822和N202007061),從臺北醫學大學聯合人體生物資料庫申請286例大腸直腸癌待測個體的血漿樣品和120例非大腸直腸癌個體的血漿樣品。
本發明中大腸直腸癌的分期係根據2009年國際抗癌聯盟(Union for international cancer control)和美國癌症聯合委員會(American joint committee on cancer, AJCC)發行的第七版TNM分期系統進行分類,其中TMN分別為:腫瘤侵犯深度(T)、淋巴結侵犯數目(N)、是否遠端轉移(M)。
血漿樣品分組基本資料如圖2,從發現組中挑選大腸直腸癌I期、大腸直腸癌II期、大腸直腸癌III期、大腸直腸癌IV期各10例,以及非大腸直腸癌20例根據性別年齡進行配對,各分組血漿樣品進行定量混合,以獲得各分組的混合血漿樣品,用於鑑定與篩選在非大腸直腸癌與各分期大腸直腸癌中具有信號強度差異的胜肽片段。
各分組的混合血漿樣品,首先,以麥胚芽凝集素-瓊脂顆粒(Agarose-bound wheat germ agglutinin, WGA, Vector Laboratories, Burlingame, CA, USA)對各分組的混合血漿樣品進行蛋白質純化,以獲得各分組的混合血漿的蛋白質純化樣品。再來,對各分組的混合血漿樣品的蛋白質純化樣品進行溶液中分解(In-solution digestion),將蛋白質分解為胜肽片段,並通過奈米級液相層析串聯質譜儀(Orbitrap Elite hybrid mass spectrometer, Thermo Electron, Bremen, Germany)分析。接著,將奈米級液相層析串聯質譜儀分析蒐集的數據資料通過蛋白質體學質譜分析軟體(PEAKS 7軟體, Bioinformatics Solutions, Waterloo, ON, Canada)比對通用蛋白質資料庫(Universal Protein Knowledgebase,UniProt,18 January 2020),以鑑定各胜肽片段所屬的蛋白質、胜肽片段上的轉譯後修飾,以及非標記定量法(label-free quantification)對不同訊號強度的胜肽片段進行定量,並根據PEAKS 7軟體的分析資料篩選出具有信號強度差異的胜肽片段,篩選結果如圖3,最終篩選出3個不具轉譯後修飾的胜肽片段,包括: SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3。其中,SEQ ID NO:1滯留時間為5.9分鐘,挑選三個離子對,母離子荷質比(charge to mass ratio, m/z)皆為520.3,子離子荷質比分別為902.5, 789.4和251.1,碰撞能量為20.1電子伏特,加速電壓為130伏特。其中,SEQ ID NO:2滯留時間為6.2分鐘,挑選三個離子對,母離子荷質比皆為500.2,子離子荷質比分別為815.4, 702.3和587.3,碰撞能量為16.5電子伏特,加速電壓為130伏特。其中,SEQ ID NO:3滯留時間為4.4分鐘,挑選三個離子對,母離子荷質比皆為484.7,子離子荷質比分別為588.3, 489.2和360.1,碰撞能量為22電子伏特,加速電壓為130伏特。
其中,離子對係由一母離子和一子離子組成的群組,數值皆以荷質比表示,其中,荷質比係一個帶電粒子所帶電荷與其質量之比。
其中,麥胚芽凝集素為自植物小麥萃取的凝集素,對醣蛋白上的N-乙醯-D-葡萄糖胺(N‐acetyl‐D‐glucosamine, GlcNAc) 結構具有高特異性的結合能力。本實施例以麥胚芽凝集素-瓊脂顆粒純化混合血漿樣品步驟如下所述,首先,將100μL麥胚芽凝集素-瓊脂顆粒加入600μL的微量離心管中,之後加入20μL混合血漿樣品,並以搖臂式震盪器在常溫下充分混合。接著,將微量離心管離心後,以400μL磷酸鹽緩衝液(phosphate buffered saline, PBS)沖洗3次去除未吸附在麥胚芽凝集素-瓊脂顆粒上的蛋白質後,以50μL析出緩衝液(0.5 M N-acetylglucosamine dissolved in 1 mM acetic acid)沖洗2次,使麥胚芽凝集素-瓊脂顆粒上吸附的蛋白質析出,收集到另一個微量離心管後使用布萊德福分析(Bradford assay)進行蛋白質定量,並從各個樣品中各取出20μg析出之蛋白質至新的微量離心管中,再使用真空濃縮儀抽乾,最後獲得經麥胚芽凝集素-瓊脂顆粒純化的混合血漿的蛋白質純化樣品。
其中,溶液中分解步驟如下:首先,取10μg各分組的個別血漿的蛋白質純化樣品並加入20μL的含有0.1%甲酸的水溶液進行回溶。接著,加入1μL的550mM的二硫蘇糖醇(Dithiothreitol, DTT)在56°C反應45分鐘。接著,加入2μL的450mM碘乙醯胺(Iodoacetamide, IAM)在室溫避光反應45分鐘,再來,加入0.5μg的胰蛋白酶在37°C反應16小時,最後,加入適量1%甲酸水溶液使整體溶液最終甲酸濃度為0.1%,以終止酵素反應。
其中,奈米級液相層析串聯質譜儀分析用於分析經蛋白酶分解為胜肽片段的樣品。胜肽混合物以層析管柱(內徑:75µm,,長度:25cm, C18 BEH column,孔徑:130 Å,填充材料粒徑:1.7μm, Waters)進行分離,移動相(mobile phase) A:含0.1%甲酸的水溶液,移動相B:含0.1%甲酸的乙腈溶液,分離梯度為60分鐘內移動相B由5%增加至35%,移動相A梯度則隨著移動相B的百分比改變,由95%減少至65%,流速:300 nL/分鐘,管柱溫度:35°C。以奈米級液相層析串聯質譜儀分析獲得全掃瞄質譜圖(full-scan MS spectra),篩選設定包括:荷質比介於350-1600,自動增益控制(Automatic Gain Control, AGC)目標值為10 6。質譜儀系統解析度設定為120K(系統解析度數值由荷質比400提供)。前20個訊號最強的離子依序被分離至線性離子阱(linear ion trap)中通過碰撞誘發鍵解反應(collision-induced dissociation, CID)予以碎裂化獲得子離子質譜資料,自動增益控制目標值為10 4,動態排除時間為60秒。
其中,PEAKS 7軟體(Bioinformatics Solutions, Waterloo, ON, Canada)分析,設定參數如下:質譜容許度(MS tolerance):10 ppm,二次質譜容許度(MS/MS tolerance):0.6 Da,錯誤偵測率(false detection rate):1%。另外, PEAKS 7軟體的蛋白質定量附加工具(PEAKS Q)功能可以對資料庫檢索結果進行分析,通過總離子流(total ion current, TIC)標準化(normalization)和非標記定量法對不同訊號強度的蛋白質的胜肽序列進行定量分析,設定參數如下:質譜容許度(MS tolerance):10 ppm,滯留時間容許度(Retention time shift tolerance):60分鐘。使用PEAKS 7軟體的轉譯後修飾鑑定模塊(Peaks PTM)中設定辨識胜肽序列上的轉譯後修飾,包含醣基化(glycosylation)和甲基化(methylation),設定參數如下,Carbamidomethylation (C)/+57.0215 Da設定為固定(fixed),oxidation (M)/+15.9949 Da、醣基化相關轉譯後修飾和甲基化相關轉譯後修飾設定為可變(variables),其中醣基化相關的轉譯後修飾包括hexose modified CRKTW (+162.0528 Da), fucose modified TS (+146.0579 Da), O-GlcNac modified STN (+203.195 Da), Hex1HexNAc1 modified N (+511.1901 Da), Hex1HexNAc1NeuAc1 modified NTS (+656.2276 Da),以及Hex1HexNAc1NeuAc2 modified NTS (+947.3231 Da)。其中甲基化相關轉譯後修飾包括:methylation modified CDE-HIKLNQRST (+14.0156 Da), dimethylation modified KNR (+28.0313 Da), K (+32.0564 Da), K (+34.0631 Da), and trimethylation modified KAR (+43.0058 Da)。
其中,篩選具信號強度差異的胜肽片段,設定參數如下:統計檢定顯著差異值(-10lgP)小於13,等同於 p值小於0.05。並篩選具有信號強度差異的胜肽片段,其中,信號強度差異係個別胜肽片段在任一分期的大腸直腸癌組別的血漿樣品中的信號強度,須大於1.5倍非大腸直腸癌的血漿樣品中的信號強度,或是小於0.8倍非大腸直腸癌的血漿樣品中的信號強度。信噪比(signal-to-noise ratio, S/N)大於5,最後,排除錯誤切割的胜肽片段(mis-cleavage peptides),排除大於10個胺基酸的胜肽片段。
測定篩選的各個胜肽片段在個別血漿樣品中的信號強度差異:
在測定篩選的各個胜肽片段在個別血漿樣品中的信號強度差異的步驟中,針對個別樣品的具有信號強度差異的6個胜肽片段進行個別血漿樣品的驗證,包括3個不具轉譯後修飾的胜肽片段: SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3。血漿樣品分組基本資料如圖2,從發現組中挑選大腸直腸癌I期、大腸直腸癌II期、大腸直腸癌III期、大腸直腸癌IV期各10例,以及非大腸直腸癌20例根據性別年齡進行配對,並將大腸直腸癌I期和大腸直腸癌II期歸類為早期大腸直腸癌組,大腸直腸癌III期和大腸直腸癌IV期歸類為晚期大腸直腸癌組。
各分組的個別血漿樣品,首先以麥胚芽凝集素-瓊脂顆粒對個別血漿樣品進行蛋白質純化,以獲得個別血漿樣品的蛋白質純化樣品。再來,對個別血漿樣品的蛋白質純化樣品進行溶液中分解,將蛋白質分解為胜肽片段,並通過高校液相層析串聯質譜儀(UPLC-MS/MS)分析,針對圖3中的3個胜肽片段進行非標記定量法分析,並使用單因子變異數分析(one-way analysis of variance, one-way ANOVA)。
結果如圖4~圖6所示,其中圖4顯示在SEQ ID NO:1含量檢測中,非大腸直腸癌組信號強度為953.92±1257.19,早期大腸直腸癌組信號強度為2245.91±2046.9,晚期大腸直腸癌組信號強度為2920.63±3134.69。其中圖5顯示在SEQ ID NO:2組別中,非大腸直腸癌組信號強度為3144.23±3285,早期大腸直腸癌組信號強度為1536.31±1373.44,晚期大腸直腸癌組信號強度為1427.26±1386.54。其中圖6顯示在SEQ ID NO:3組別中,非大腸直腸癌組信號強度為3937±2082.73,早期大腸直腸癌組信號強度為2164.65±863.8,晚期大腸直腸癌組信號強度為1550.17±1405.8。
其中圖4顯示SEQ ID NO:1在早期大腸直腸癌組的信號強度和晚期大腸直腸癌組的信號強度皆比非大腸直腸癌組的信號強度高,其中早期大腸直腸癌組的信號強度為非大腸直腸癌組的2.35倍,晚期大腸直腸癌組的信號強度為非大腸直腸癌組的3.06倍。 其中圖5顯示SEQ ID NO:2在早期大腸直腸癌組的信號強度和晚期大腸直腸癌組的信號強度組皆較非大腸直腸癌組的信號強度低,其中早期大腸直腸癌組的信號強度為非大腸直腸癌組的0.48倍,晚期大腸直腸癌組的信號強度為非大腸直腸癌組的0.45倍。其中圖6顯示SEQ ID NO:3在早期大腸直腸癌組的信號強度和晚期大腸直腸癌組的信號強度組皆較非大腸直腸癌組的信號強度低,其中早期大腸直腸癌組的信號強度為非大腸直腸癌組的0.54倍,晚期大腸直腸癌組的信號強度為非大腸直腸癌組的0.39倍。
在建立根據胜肽片段含量量診斷大腸直腸癌的方法的步驟中:
根據本發明中,找出的三個具有信強度差異的胜肽片段,根據3個胜肽片段進行同位素標記多重反應監測技術(stable isotope-labeled MRM assay)分析。其中,3個胜肽片段包括: SEQ ID NO:1, SEQ ID NO:2與SEQ ID NO:3。
血漿樣品分組基本資料如圖2,從驗證組中挑選大腸直腸癌I期47例、大腸直腸癌II期53例、大腸直腸癌III期50例、大腸直腸癌IV期各56例,以及非大腸直腸癌80例根據性別年齡進行配對,並將大腸直腸癌I期和大腸直腸癌II期歸類為早期大腸直腸癌組,大腸直腸癌III期和大腸直腸癌IV期歸類為晚期大腸直腸癌組。另外,將大腸直腸癌I期、II期、III期和IV期合併的結果,歸類為全期大腸直腸癌組。
各分組的個別血漿樣品,首先以麥胚芽凝集素-瓊脂顆粒對個別血漿樣品進行蛋白質純化,以獲得個別血漿樣品的蛋白質純化樣品。再來,對個別血漿樣品的蛋白質純化樣品,先加入延長胜肽序列,再進行溶液中分解,將蛋白質分解為胜肽片段,並通過三段四極桿式質譜儀(triple quadrupole mass spectrometry, 1260 Infinity II Quaternary Pump LC system)分析,針對SEQ ID NO:1, SEQ ID NO:2與SEQ ID NO:3進行使用內添加標準品的定量分析,統計結果使用單因子變異數分析(one-way analysis of variance, one-way ANOVA)。
其中,同位素標記多重反應監測技術(stable isotope-labeled MRM assay)分析中,先加入延長胜肽序列,再進行溶液中分解的步驟如下:
首先,取10µg各分組的個別血漿的蛋白質純化樣品並加入20μL的含有0.1%甲酸的水溶液進行回溶。接著,加入1μL的內添加標準品(Internal standard),再來,加入1μL的550mM 二硫蘇糖醇(Dithiothreitol, DTT)在56°C反應45分鐘。接著,加入2μL的450mM碘乙醯胺(Iodoacetamide, IAM)在室溫避光反應45分鐘,再來,加入0.5μg的胰蛋白酶在37°C反應16小時,最後,加入適量1%甲酸水溶液使整體溶液最終甲酸濃度為0.1%,以終止酵素反應。
其中,使用內添加標準品的定量分析步驟如下:使用無同位素標記的延長胜肽序列1.95ng/mL~1000ng/mL定量的峰面積對具有同位素標記的延長胜肽序列分析所獲得的峰面積相除,獲得無同位素標記的延長胜肽序列/同位素標記的延長胜肽序列的比值與標準品濃度之關係,作為校正曲線。同時,血漿樣品中檢測的SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3與分析所獲得的同位素標記的延長胜肽序列分析峰面積相除,獲得的比值並透過校正曲線得出血漿樣品中的SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3濃度。
其中,三段四極桿式質譜儀分析中,胜肽混合物以層析管柱(C18 column,Phenomex, Kinetex,填充材料粒徑:2.6µm ,孔徑:100 Å ,長度:50公分,內徑:2.1 毫米),移動相A為含0.1%甲酸的水溶液,移動相B為含0.1%甲酸的乙腈溶液。整體層析時間為12分鐘,包括:0-1分鐘:95%移動相A,5%移動相B;1-8分鐘,45%移動相A和55%移動相B;8-9分鐘,100%B,後運轉時間(Post run time) 3 分鐘。每針樣品注射體積為5µL,移動相流速0.4mL/分鐘。 其中,同位素標記多重反應監測技術,係以胜肽片段SEQ ID NO:1、SEQ ID NO:2與SEQ ID NO:3的胺基酸序列為基礎序列,並根據基礎序列所屬蛋白質的胺基酸序列進行補回,在基礎序列頭尾各補回4個胺基酸,以模擬酵素切割的狀況,以下稱為延長胜肽片段。根據篩選出的SEQ ID NO:1、SEQ ID NO:2與SEQ ID NO:3合成的延長胜肽序列,包含:無同位素標記的延長胜肽序列,以及具有穩定的同位素標記的延長胜肽序列,延長胜肽序列如圖7所示,以下稱為內添加標準品。其中,以無同位素標記的延長胜肽序列製備1.95ng/mL~1000ng/mL濃度的標準品作為校正曲線,再於標準品和血漿樣品中加入等量具有穩定的同位素標記的延長胜肽序列,以備後續分析。
其中,同位素標記係以碳的同位素( 13C)和氮的同位素( 15N)進行標記。 結果如圖8~圖16所示。其中,圖8、圖9和圖10分別代表SEQ ID NO:1, SEQ ID NO:2和SEQ ID NO:3各個胜肽片段的三個離子對的滯留時間和信號強度。
其中,圖11、圖12和圖13分別代表SEQ ID NO:1, SEQ ID NO:2和SEQ ID NO:3的校正曲線圖,經由雞血清測定最低定量極限(lower limit of quantification, LLOQ)以及最高定量極限(upper limit of quantification, ULOQ),其中圖11顯示之SEQ ID NO:1定量範圍介於 3.90~1000 ng/mL,其中圖12顯示之SEQ ID NO:2定量範圍介於1.95~250 ng/mL,其中圖13顯示之SEQ ID NO:3定量範圍介於1.95~250 ng/mL。其中,圖14、圖15和圖16分別代表各個分組的個別樣品中各胜肽濃度含量結果點陣圖。其中,SEQ ID NO:1在各組的定量結果中,非大腸直腸癌組的濃度為9.59±27.14ng/mL,早期大腸直腸癌組的濃度為25.41±33.36ng/mL,晚期大腸直腸癌組的濃度為27.81±11.55ng/mL,全期大腸直腸癌組的濃度為26.61±33.82ng/mL。其中,SEQ ID NO:2在各組的定量結果中,非大腸直腸癌組的濃度為3.05±3.44ng/mL,早期大腸直腸癌組的濃度為2.07±0.27ng/mL,晚期大腸直腸癌組的濃度為2.10±1.56ng/mL,全期大腸直腸癌組的濃度為2.08±0.39ng/mL。其中,SEQ ID NO:3在各組的定量結果中,非大腸直腸癌組的濃度為24.79±13.58ng/mL,早期大腸直腸癌組的濃度為14.37±4.23ng/mL,晚期大腸直腸癌組的濃度為16.85±12.87ng/mL,全期大腸直腸癌組的濃度為15.61±3.75ng/mL。
定量結果如圖14、15、16所示,圖14顯示SEQ ID NO:1在各組的定量結果中,非大腸直腸癌組的濃度為9.59±27.14ng/mL,早期大腸直腸癌組的濃度為25.41±33.36ng/mL,晚期大腸直腸癌組的濃度為27.81±11.55ng/mL,全期大腸直腸癌組的濃度為26.61±33.82ng/mL,其中,早期大腸直腸癌組的含量為非大腸直腸癌組的0.68倍, SEQ ID NO:1在晚期大腸直腸癌組的含量為非大腸直腸癌組的0.69倍。圖15顯示SEQ ID NO:2在各組的定量結果,非大腸直腸癌組的濃度為3.05±3.44ng/mL,早期大腸直腸癌組的濃度為2.07±0.27ng/mL,晚期大腸直腸癌組的濃度為2.10±1.56ng/mL,全期大腸直腸癌組的濃度為2.08±0.39ng/mL,其中在SEQ ID NO:2組別中在早期大腸直腸癌組的含量為非大腸直腸癌組的2.65倍, SEQ ID NO:2在晚期大腸直腸癌組的含量為非大腸直腸癌組的2.90倍。圖16顯示SEQ ID NO:3在各組的定量結果中,非大腸直腸癌組的濃度為24.79±13.58ng/mL,早期大腸直腸癌組的濃度為14.37±4.23ng/mL,晚期大腸直腸癌組的濃度為16.85±12.87ng/mL,全期大腸直腸癌組的濃度為15.61±3.75ng/mL,其中SEQ ID NO:3在早期大腸直腸癌組的含量為非大腸直腸癌組的0.58倍, SEQ ID NO:3在晚期大腸直腸癌組的含量為非大腸直腸癌組的0.68倍。
在通過機器學習結合不同胜肽片段含量用於檢測大腸直腸癌的效能評估:
通過機器學習結合不同胜肽片段含量用於檢測大腸直腸癌的效能評估的步驟中,使用GraphPad Prism (vers. 5.0; GraphPad Software, SanDiego, CA, USA)繪製接收者操作特徵曲線(receiver operating characteristic curve, ROC curve)並計算曲線下面積和(area under curve, AUC),並根據約登指數(Youden index)作為判斷診斷效果的臨界值(cutoff value)顯示靈敏度(sensitivity)、特異性(specificity)、準確度(accuracy)、 p值,以及統計檢定力(power),其中 p值係使用學生t檢定計算組間是否達顯著差異。
另外,為了評估3個個別胜肽任一或任二以上組成的群組用於診斷大腸直腸癌的效能,將經內添加標準品進行定量的結果通過機器學習方法進行整合,包括:決策樹(decision tree, DT )、隨機森林(random forest, RF)、支持向量機(support vector machine, SVM),以及多元邏輯式迴歸(logistic regression, LR), 並使用生物醫學統計軟體(MedCalc Statistical Software, vers. 15.4; MedCalc Software, Ostend, Belgium)對任2個不同接收者操作特徵曲線進行配對比較(Pair-wise comparisons)。
其中,機器學習方法為使用scikit-learn (vers. 0.21.3)進行10折交叉驗證(10-fold cross validation),係將數據資料拆分為十等分,將其中十分之九的數據資料用於機器學習模型訓練,剩餘之十分之一的數據資料用於驗證機器學習模席訓練結果,參數調諧根據每次10折交叉驗證訓練組(training set)和驗證組(validation set)獲得的曲線下面積和數值進行調整,其中各個機器學習模型的最終參數如下:決策樹參數設置如下:決策樹深度(tree depth):10, 核心模型(kernel of the model)設置為吉尼(gini)。在隨機森林中參數設置如下:決策樹數量(tree value number):200,核心模型設置為gini。支持向量參數設置如下:γ值(value of gamma): 1×10 -10, C值(value of C): 1×10 -7,kernel of the model設置為徑向基底函數(radial basis function, RBF)。多元邏輯式迴歸使用默認設置(default)。最後通過曲線下面積和、靈敏度、特異性、準確度、學生t檢定,以及統計檢定力評估各個機器學習模型的表現,結果如圖17~圖22所示。
其中圖17為通過多元邏輯式迴歸和隨機森林評估胜肽組合物用於區分非大腸腸癌組和早期大腸直腸癌組的效能,其中,以SEQ ID NO:1含量區分的多元邏輯式迴歸曲線下面積和為0.67,以SEQ ID NO:2含量區分的多元邏輯式迴歸曲線下面積和為0.80,以SEQ ID NO:3含量區分的多元邏輯式迴歸曲線下面積和為0.82,合併SEQ ID NO:1, SEQ ID NO:2和SEQ ID NO:3區分的的多元邏輯式迴歸曲線下面積和為0.90,合併SEQ ID NO:1, SEQ ID NO:2和SEQ ID NO:3區分的的隨機森林曲線下面積和為0.88。其中圖18通過多元邏輯式迴歸和隨機森林評估胜肽組合物用於區分非大腸直腸癌組和晚期大腸直腸癌組的效能,其中,以SEQ ID NO:1含量區分的多元邏輯式迴歸曲線下面積和為0.63,以SEQ ID NO:2含量區分的多元邏輯式迴歸曲線下面積和為0.72,以SEQ ID NO:3含量區分的多元邏輯式迴歸曲線下面積和為0.70,合併SEQ ID NO:1, SEQ ID NO:2和SEQ ID NO:3區分的的多元邏輯式迴歸曲線下面積和為0.85,合併SEQ ID NO:1, SEQ ID NO:2和SEQ ID NO:3區分的的隨機森林曲線下面積和為0.88。以接收者操作特徵曲線表示,並計算曲線下面積和。其中圖19為通過多元邏輯式迴歸和隨機森林評估胜肽組合物用於區分非大腸直腸癌組和全期大腸直腸癌組的效能,其中,以SEQ ID NO:1含量區分的曲線下面積和為0.66以SEQ ID NO:2含量區分的曲線下面積和為0.77以SEQ ID NO:3含量區分的曲線下面積和為0.79,合併SEQ ID NO:1, SEQ ID NO:2和SEQ ID NO:3區分的多元邏輯式迴歸曲線下面積和為0.88,合併SEQ ID NO:1, SEQ ID NO:2和SEQ ID NO:3區分的隨機森林曲線下面積和為0.96。
其中圖20為檢測SEQ ID NO:1、SEQ ID NO:2,以及SEQ ID NO:3的個別含量用於檢測大腸直腸癌的效能,其中,SEQ ID NO:1的曲線下面積和為0.67(0.58~0.74),靈敏度為75.7%(67.1%-87.5%),特異性為56.5%(43.3%-69.0%),準確度為63.2%(55.9%-80.2%)。其中,SEQ ID NO:2的曲線下面積和為0.80(0.77-0.83),靈敏度為64.3%(51.9%-75.4%),特異性為87.1%(76.1%-95.3%),準確度為76.3%(72.7%-82.3%)。其中,SEQ ID NO:3的曲線下面積和為0.82(0.74-0.88),靈敏度為78.6%(67.1%-87.5%),特異性為74.2%(61.5%-84.5%),準確度為77.5%(73.3%-83.9%)。
其中圖21為檢測SEQ ID NO:1、SEQ ID NO:2,以及SEQ ID NO:3的個別含量,以任二者組成的群組用於檢測大腸直腸癌的效能。其中,以SEQ ID NO:1的含量和SEQ ID NO:2的含量用於檢測大腸直腸癌的效能,以決策樹、隨機森林、支持向量機與多元邏輯式迴歸,曲線下面積和介於0.76~0.85,靈敏度介於66.8%~83.2%,特異性介於62.3%~84.2%,準確度介於72.9%~78.7%。其中,以SEQ ID NO:1的含量和SEQ ID NO:3的含量用於檢測大腸直腸癌的效能,以決策樹、隨機森林、支持向量機與多元邏輯式迴歸,曲線下面積和介於0.76~0.86,靈敏度介於79.7%~86.1%,特異性介於66.9%~82.0%,準確度介於74.5%~80.2%。其中,以SEQ ID NO:2的含量和SEQ ID NO:3的含量用於檢測大腸直腸癌的效能,以決策樹、隨機森林、支持向量機與多元邏輯式迴歸,曲線下面積和介於0.77~0.87,靈敏度介於72.9%~85.9%,特異性介於75.0%~85.6%,準確度介於75.6%~82.5%。
其中圖22為檢測SEQ ID NO:1、SEQ ID NO:2,以及SEQ ID NO:3的個別含量,合併三者組成的群組用於檢測大腸直腸癌的效能,以決策樹、隨機森林、支持向量機與多元邏輯式迴歸,曲線下面積和介於0.78~0.97,靈敏度介於73.9%~89.2%,特異性介於77.8%~97.9%,準確度介於76.9%~92.3%。
經由上述實驗結果可得知,由SEQ ID NO:1, SEQ ID NO:2和SEQ ID NO:3任二以上組成的胜肽組合物用於檢測大腸直腸癌的效能,較單一胜肽檢測大腸直腸癌效能更佳,特異性表現相當外,靈敏度和準確度在大多數組合中皆有較佳的表現。
綜上所述,本發明提出的胜肽組合物,可賦予檢測高敏感度與高特異性,意即本發明所提的方法可為臨床上的檢測帶來應用價值。
惟以上所述者,僅為本發明的較佳實施例,但不能以此限定本發明的實施範圍;故,凡依本發明申請專利範圍及發明說明書內容所作之簡單的等效改變與修飾,皆仍屬本發明專利涵蓋的範圍內。
圖1為大腸直腸癌TNM分期系統。
圖2為待測個體的血漿樣品的分組資訊。
圖3為篩選的胜肽片段的多重反應監測離子對和質譜參數。
圖4為SEQ ID NO:1的胜肽片段在非大腸直腸癌組、早期大腸直腸癌組,以及晚期大腸直腸癌組中的質譜信號強度點陣圖。
圖5為SEQ ID NO:2的胜肽片段在非大腸直腸癌組、早期大腸直腸癌組,以及晚期大腸直腸癌組中的質譜信號強度點陣圖。
圖6為SEQ ID NO:3的胜肽片段在非大腸直腸癌組、早期大腸直腸癌組,以及晚期大腸直腸癌組中的質譜信號強度點陣圖。
圖7為篩選的胜肽片段的多重反應監測離子對和質譜分析參數。
圖8為SEQ ID NO:1的三個離子對的滯留時間和信號強度。
圖9為SEQ ID NO:2的三個離子對的滯留時間和信號強度。
圖10為SEQ ID NO:3的三個離子對的滯留時間和信號強度。
圖11為SEQ ID NO:1的校正曲線圖。
圖12為SEQ ID NO:2的校正曲線圖。
圖13為SEQ ID NO:3的校正曲線圖。
圖14為SEQ ID NO:1在各個分組的個別樣品中各胜肽濃度含量結果點陣圖。
圖15為SEQ ID NO:2在各個分組的個別樣品中各胜肽濃度含量結果點陣圖。
圖16為SEQ ID NO:3在各個分組的個別樣品中各胜肽濃度含量結果點陣圖。
圖17為通過多元邏輯式迴歸和隨機森林評估胜肽組合物用於區分非大腸直腸癌組和早期大腸直腸癌組的效能,其中胜肽組合物係選自由SEQ ID NO:1、SEQ ID NO:2,以及SEQ ID NO:3之胺基酸序列任一或任二以上組成之群組。以接收者操作特徵曲線表示。
圖18為通過多元邏輯式迴歸和隨機森林評估胜肽組合物用於區分非大腸直腸癌組和晚期大腸直腸癌組的效能,其中胜肽組合物係選自由SEQ ID NO:1、SEQ ID NO:2,以及SEQ ID NO:3之胺基酸序列任一或任二以上組成之群組。以接收者操作特徵曲線表示。
圖19為通過多元邏輯式迴歸和隨機森林評估胜肽組合物用於區分非大腸直腸癌組和全期大腸直腸癌組的效能,其中胜肽組合物係選自由SEQ ID NO:1、SEQ ID NO:2,以及SEQ ID NO:3之胺基酸序列任一或任二以上組成之群組。以接收者操作特徵曲線表示。
圖20為檢測SEQ ID NO:1、SEQ ID NO:2,以及SEQ ID NO:3的個別含量用於檢測大腸直腸癌的效能,以曲線下面積和、靈敏度、特異性、準確度、學生t檢定(Student’s t-test),以及統計檢定力進行評估。
圖21為檢測SEQ ID NO:1、SEQ ID NO:2,以及SEQ ID NO:3的個別含量,以任二者組成的群組用於檢測大腸直腸癌的效能,以曲線下面積和、靈敏度、特異性、準確度、學生t檢定,以及統計檢定力進行評估。
圖22為檢測SEQ ID NO:1、SEQ ID NO:2,以及SEQ ID NO:3的個別含量,合併三者組成的群組用於檢測大腸直腸癌的效能,以曲線下面積和、靈敏度、特異性、準確度、學生t檢定,以及統計檢定力進行評估。
Figure 12_A0101_SEQ_0001
Figure 12_A0101_SEQ_0002

Claims (10)

  1. 一種用於檢測大腸直腸癌的胜肽組合物,其中該胜肽組合物係選自由SEQ ID NO:1、SEQ ID NO:2及SEQ ID NO:3的胺基酸序列任二或任二以上組成之群組,其中該胜肽組合物係存在於血液樣品中。
  2. 如請求項第1項所述之用於檢測大腸直腸癌的胜肽組合物,係通過一質譜分析檢測該胜肽組合物的含量。
  3. 如請求項第1項所述之用於檢測大腸直腸癌的胜肽組合物,其中,該血液樣品為一血清樣品、一血漿樣品,或一全血樣品。
  4. 如請求項第1項所述之用於檢測大腸直腸癌的胜肽組合物,其中,該血液樣品經一麥胚芽凝集素進行純化。
  5. 一種檢測大腸直腸癌的方法,係包括: (a)經一檢測方法檢測一待測個體的一待測血液樣品經一純化方法後獲得之一胜肽組合物的含量,其中該胜肽組合物係選自由SEQ ID NO:1、SEQ ID NO:2及SEQ ID NO:3的胺基酸序列任二以上組成的群組; (b) 比較經(a)測得之該胜肽組合物的含量,與一非大腸直腸癌個體的一比較血液樣品經該純化方法後獲得的該胜肽組合物的含量,判斷該待測個體是否罹患大腸直腸癌
  6. 如請求項第5項所述之檢測大腸直腸癌的方法,其中比較方法係選自由多元邏輯式迴歸、決策樹、隨機森林及支持向量機所組成之群組。
  7. 如請求項第5項所述之檢測大腸直腸癌的方法,其中該檢測方法係選自質譜分析或免疫分析。
  8. 如請求項第5項所述之檢測大腸直腸癌的方法,其中,該待測血液樣品與該比較血液樣品係皆為一血清樣品,或該待測血液樣品與該比較血液樣品係皆為一血漿樣品,或該待測血液樣品與該比較血液樣品係皆為一全血樣品。
  9. 如請求項第5項所述之檢測大腸直腸癌的方法,其中,該純化方法為麥胚芽凝集素純化方法。
  10. 如請求項第5項所述之檢測大腸直腸癌的方法,其中,該質譜分析係選自由基質輔助雷射脫附游離質譜分析、液相層析質譜分析、液相層析串聯質譜分析、及氣相層析質譜分析所組成之群組。
TW110136054A 2021-09-28 用於檢測大腸直腸癌的組合物的用途與方法 TWI838648B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW110136054A TWI838648B (zh) 2021-09-28 用於檢測大腸直腸癌的組合物的用途與方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW110136054A TWI838648B (zh) 2021-09-28 用於檢測大腸直腸癌的組合物的用途與方法

Publications (2)

Publication Number Publication Date
TW202314245A true TW202314245A (zh) 2023-04-01
TWI838648B TWI838648B (zh) 2024-04-11

Family

ID=

Similar Documents

Publication Publication Date Title
US11499982B2 (en) Multi-protein biomarker assay for brain injury detection and outcome
EP2398918B1 (en) Methods for diagnosis and prognosis of colorectal cancer
AU2006291988B2 (en) Method for the diagnosis of colorectal cancer and ovarian cancer by the measurement of vitamin E-related metabolites
US10768183B2 (en) Metabolite panel for improved screening and diagnostic testing of cystic fibrosis
KR101484969B1 (ko) N-당쇄화된 당펩타이드를 이용한 암 진단방법
Zheng et al. New serum biomarkers for detection of endometriosis using matrix-assisted laser desorption/ionization time-of-flight mass spectrometry
KR101219519B1 (ko) 렉틴을 이용한 암 진단 방법
CN110799841A (zh) 用于检测大肠癌的生物标志物
CN111742222A (zh) 诊断遗传性血管性水肿的方法
US20100190183A1 (en) Protein labelling with tags comprising isotope-coded sub-tags and isobaric sub-tags
US20070087392A1 (en) Method for diagnosing head and neck squamous cell carcinoma
US11740245B2 (en) Mass spectrometry-based methods for the detection of circulating histones H3 and H2B in plasma from sepsis or septic shock (SS) patients
US20140147874A1 (en) Biomarkers of cardiac ischemia
KR20160146102A (ko) N-당쇄 질량분석을 이용한 대장암 진단방법
TW202314245A (zh) 用於檢測大腸直腸癌的組合物與方法
TWI838648B (zh) 用於檢測大腸直腸癌的組合物的用途與方法
US20110236993A1 (en) Pancreatic cancer markers
Papachristou et al. Serum proteomic patterns as a predictor of severity in acute pancreatitis
CN107817353B (zh) 预测肿瘤坏死因子抑制剂疗效的试剂和方法
US20150133342A1 (en) Mrm-ms signature assay
Sousa MALDI-TOF MS-based urinary proteomic/peptidomic signature of breast cancer as innovative diagnostic approach
KR20180117918A (ko) Mfap5 측정 제제를 포함하는 대장암 진단용 조성물, 키트, 및 이를 이용한 대장암 진단 방법
CN114705782B (zh) 用于诊断或监测结直肠癌的血浆代谢标志物组合及应用
CN117630384A (zh) 一种基于抗体富集的arv7质谱检测方法
Neprasova et al. Research Article Toward Noninvasive Diagnosis of IgA Nephropathy: A Pilot Urinary Metabolomic and Proteomic Study