TW202001246A

TW202001246A - 檢測微生物抗藥性方法

Info

Publication number: TW202001246A
Application number: TW107119698A
Authority: TW
Inventors: 黃采菽; 張福春; 吳冠陞; 李欣蓉
Original assignee: 高雄榮民總醫院; 國立中山大學
Priority date: 2018-06-07
Filing date: 2018-06-07
Publication date: 2020-01-01
Also published as: TWI652481B

Abstract

一種檢測微生物抗藥性方法，用以解決習知檢測抗藥性方法分析時間過於冗長，且無法透過質譜圖判斷微生物是否具有抗藥性的問題。係包含：輸入數個質譜圖；對該數個質譜圖執行一波峰對齊處理，以產生一質譜波峰清單；以一交叉驗證法將該質譜波峰清單所屬的數種菌株數據分為一測試集數據及一訓練集數據；以一檢測法分析該訓練集數據所屬的各該種菌株是否具有抗藥性，並由該訓練集數據中選擇前N個P值較小的波峰作為一訓練樣本組；對該訓練樣本組的各波峰執行加權計算；將加權後的訓練樣本組作為一訓練模型分類器的輸入變數，並以此建立該訓練模型；及輸入一待檢測菌株的質譜圖至該訓練模型，以分析該待檢測菌株是否對該抗生素具有抗藥性。

Description

檢測微生物抗藥性方法

本發明係關於一種檢測微生物抗藥性方法，尤其是一種基於機器學習檢測微生物是否具有抗藥性的檢測微生物抗藥性方法。

習知檢測微生物抗藥性方法，係建立在微生物在含有基質(抗生素)的培養基中能持續生長。具體而言，係將待檢測微生物添加於培養皿中，並靜待一段時間後觀察該待檢測微生物是否有持續生長。若該待檢測微生物呈現持續成長，則表示該待檢測微生物對該基質係具有抗藥性。

然而，上述習知檢測微生物抗藥性方法，研究人員需耗費許多時間在等待該待檢測微生物生長，方可得知該待檢測微生物是否具有抗藥性。故，習知檢測微生物抗藥性方法的檢測時間非常冗長，且容易造成延誤治療或無法即時隔離的問題。

有鑑於此，習知檢測微生物抗藥性方法確實仍有加以改善之必要。

為解決上述問題，本發明的目的是提供一種快速檢測微生物抗藥性方法，能透過分析微生物的質譜圖得知是否具有抗藥性，並以此提升整體檢驗效率者。

本發明的檢測微生物抗藥性方法，包含：輸入數個相對於一抗生素具有抗藥性之菌株的質譜圖，以及輸入數個相對於該抗生素不具有抗藥性之菌株的質譜圖；對該數個質譜圖執行一波峰對齊處理，以產生一質譜波峰清單；以一交叉驗證法將該質譜波峰清單所屬的數種菌株數據分為一測試集數據及一訓練集數據；以一檢測法分析該訓練集數據所屬的各該種菌株是否具有抗藥性，使該訓練集數據的各波峰分別產生一P值，再由該訓練集數據中選擇前N個P值較小的波峰作為一訓練樣本組，N為正整數且N大於0；以一主成分分析法對該訓練樣本組的各波峰執行加權計算；將加權後的訓練樣本組作為一訓練模型分類器的輸入變數，並以此建立該訓練模型；由該測試集數據中挑選與該訓練樣本組具有相同峰值的波峰，以產生一測試樣本組；將該測試樣本組執行與該實驗樣本組相同的加權計算，並將加權後的測試樣本組輸入至該訓練模型中驗證，以核對該訓練模型對該訓練樣本組是否具有抗藥性的判斷是否正確；及輸入一待檢測菌株的質譜圖至該訓練模型，以分析該待檢測菌株是否對該抗生素具有抗藥性。

據此，本發明的檢測微生物抗藥性方法，能夠透過機器學習分析微生物的質譜圖，以直接得知該微生物是否具有抗藥性，相較於習知檢驗方法，不須再對該微生物進一步的培養以及執行藥敏測試，本發明檢測微生物抗藥性方法可以達到提升整體檢驗效率的功效。

其中，該交叉驗證法係為一留一交叉驗證法。如此，係具有提升評估可靠性的功效。

其中，該訓練模型分類器的演算法係為一隨機森林演算法。如此，係具有提升辨識準確性的功效。

其中，該檢測法係為T檢測。如此，可以降低誤差的產生，係具有提升統計分析結果準確性的功效。

〔本發明〕

S1‧‧‧預處理步驟

S11‧‧‧輸入步驟

S12‧‧‧對齊步驟

S2‧‧‧交叉驗證步驟

S21‧‧‧分類步驟

S22‧‧‧降維步驟

S23‧‧‧模型訓練步驟

S231‧‧‧建模步驟

S232‧‧‧驗證步驟

S3‧‧‧檢驗步驟

A0‧‧‧敏感度

A1‧‧‧特異度

A2‧‧‧平均度

〔第1圖〕本發明一較佳實施例的方法流程圖。

〔第2圖〕本發明選擇隨機森林演算法，且訓練樣本組數量為70個的微生物抗藥性評估圖。

〔第3圖〕本發明選擇隨機森林演算法，且訓練樣本組數量為80個的微生物抗藥性評估圖。

〔第4圖〕本發明選擇隨機森林演算法，且訓練樣本組數量為90個的微生物抗藥性評估圖。

〔第5圖〕本發明選擇隨機森林演算法，且訓練樣本組數量為100個的微生物抗藥性評估圖。

為讓本發明之上述及其他目的、特徵及優點能更明顯易懂，下文特舉本發明之較佳實施例，並配合所附圖式，作詳細說明如下：請參照第1圖所示，其係本發明檢測微生物抗藥性方法的一較佳實施例，係包含一預處理步驟S1、一交叉驗證步驟S2及一檢驗步驟S3。

該預處理步驟S1係可以包含一輸入步驟S11及一對齊步驟S12。詳言之，該輸入步驟S11係輸入數個相對於一抗生素具有抗藥性之菌株的質譜圖，以及輸入數個相對於該抗生素不具有抗藥性之菌株的質譜圖，在本實施例中，該抗生素可以為青黴烯(Carbapenem)，該數種菌株可以為克雷伯氏肺炎菌(Klebsiella Pneumoniae)，各該質譜圖能以Saramis軟體產生，惟不以此為限。

該對齊步驟S12係對該數個質譜圖執行一波峰對齊處理，以產生一質譜波峰清單(Peak List)，在本實施例中，能以Mass-up軟體執行該波峰對齊處理，惟不以此為限。具體而言，由於質譜圖在產生的過程中會受質子與磁場強度的影響，而可能產生譜峰漂移(Peak Shift)，因此，容易使分析結果產生誤差，故，必須進行該波峰對齊處理，以調整該數種菌株的波峰峰值。舉例而言，該質譜波峰清單可以如下表一所示，若該菌株未出現在該波峰峰值時，則數值為0；反之，若該菌株出現在該波峰峰值時，則數值不為0。

該交叉驗證步驟S2係可以包含一分類步驟S21、一降維步驟S22及一模型訓練步驟S23。具體而言，該分類步驟S21係以一交叉驗證法將該質譜波峰清單所屬的數種菌株數據分為一測試集數據(Test Set)及一訓練集數據(Train Set)，在本實施例中，該交叉驗證法可以係為一留一交叉驗證(Leave One Out Cross Validation,LOOCV)，即每次由該質譜波峰清單的數種菌株數據中選取其中一種菌株數據作為該測試集數據，其餘菌株數據則作為該訓練集數據，直到各該種菌株均當過該測試集數據。

該降維步驟S22係能以一檢測法分析該訓練集數據中的各該種菌株是否具有抗藥性，使該訓練集數據的各波峰分別產生一P值(P value)。其中，該檢測法可以為Z檢測(Z-test)或T檢測(T-test)，在本實施例中，係以T檢測作為分析該數種菌株是否具有抗藥性。隨後，由該訓練集數據中選擇前N個P值較小的波峰作為一訓練樣本組，N為正整數且N大於0。

該降維步驟S22可以再以一主成分分析(Principal Components Analysis,PCA)對該訓練樣本組的各波峰執行加權計算，以將該訓練樣本組投影至一個新的座標系統中，以降低該訓練樣本組的數據維度。在本實施例中，該加權計算的方法係可以包含第一主分析(PC1)、第二主分析(PC2)、…或第X主分析(PCX)，惟不以此為限。

該模型訓練步驟S23係可以包含一建模步驟S231及一驗證步驟S232。具體而言，該建模步驟S231係將加權後的訓練樣本組作為一機器學習演算法之訓練模型分類器的輸入變數，並以此建立該訓練模型。其中，該分類器的演算法可以為一邏輯回歸(Logistic Regression,LR)演算法、一隨機森林(Random Forest,RF)演算法、一支持向量機(Support Vector Machine,SVM)演算法或一最近鄰居(Nearest Neighbor,NN)演算法。

該驗證步驟S232係由該測試集數據中挑選與該訓練樣本組具有相同峰值的波峰，以產生一測試樣本組。將該測試樣本組執行與該訓練樣本組相同的加權計算，並將加權後的測試樣本組輸入至該訓練模型中進行驗證，以核對該訓練模型對該訓練樣本組是否具有抗藥性的判斷是否正確。

該檢驗步驟S3係輸入一待檢測菌株的質譜圖至該訓練模型，以分析該待檢測菌株是否對該抗生素具有抗藥性。

舉例而言，在本發明檢測微生物抗藥性方法中，以上述表一為例，係輸入46個相對於青黴烯具有抗藥性之克雷伯氏肺炎菌的質譜圖，以及輸入49個相對於青黴烯不具有抗藥性之克雷伯氏肺炎菌的質譜圖。對上述95個克雷伯氏肺炎菌的質譜圖執行波峰對齊處理，以形成一質譜波峰清單，在本實施例中，該質譜波峰清單的波峰數量為1471個。

以留一交叉驗證由質譜波峰清單中先選取第一個菌株數據作為該測試集數據，並將其餘菌株數據作為該訓練集數據。隨後，再以T檢測法依據該訓練集數據中的各該種菌株是否具有抗藥性，使該訓練集數據的各波峰分別產生一P值。接著，再由該訓練集數據中選擇前N個P值較小的波峰作為該訓練樣本組。由數種加權計算的方法中，任意選取一種加權計算方法對該訓練樣本組進行加權，且將加權後的訓練樣本組作為該訓練模型分類器的輸入變數，該分類器再由上述數種演算法中選取其中一演算法分析該輸入變數以建立該訓練模型。由該測試集數據中挑選與該訓練樣本組具有相同峰值的波峰，以產生一測試樣本組。將該測試樣本組執行與該訓練樣本組相同的加權計算，並將加權後的測試樣本組輸入至該訓練模型進行中驗證，以核對該訓練模型對該訓練樣本組是否具有抗藥性的判斷是否正確。由該質譜波峰清單中選取第二個菌株數據作為該測試集數據，其餘菌株數據作為該訓練集數據，並以此重複上述程序，直到該質譜波峰清單中的每一個菌株數據均當過該測試集數據。藉此，取得該訓練模型對該訓練樣本組是否對抗生素具有抗藥性的敏感度及準確度。

請參照第2~5圖所示，其係本發明之訓練模型的分類器使用隨機森林演算法，且該訓練樣本組的數量分別為70、80、90及100個的分析結果。該訓練模型對該訓練樣本組是否對抗生素具有抗藥性的敏感度A0(Sensitivity)及特異度A1(Specificity)於不同加權計算方法下，均十分接近。其中，當該訓練樣本組的數量等於80，且該訓練樣本組執行PC14加權計算、該訓練樣本的數量等於90，且該訓練樣本組執行PC57加權計算，以及該訓練樣本的數量等於100，且該訓練樣本組執行PC81加權計算時，具有較高的敏感度分析結果。再者，本發明方法還可以將該質譜波峰清單的波峰數由習知的2000~20000個降至不超過100個，如此，可以大幅減少該質譜波峰清單的維度，係可以達到提升整體檢驗效率的效果。其中，平均度A2係為該敏感度A0與該特異度A1的平均值。

綜上所述，本發明的檢測微生物抗藥性方法，能夠透過機器學習分析微生物的質譜圖，以直接得知該微生物是否具有抗藥性，相較於習知檢驗方法，不須再對該微生物進一步的培養以及執行藥敏測試，本發明檢測微生物抗藥性方法可以達到提升整體檢驗效率的功效。

雖然本發明已利用上述較佳實施例揭示，然其並非用以限定本發明，任何熟習此技藝者在不脫離本發明之精神和範圍之內，相對上述實施例進行各種更動與修改仍屬本發明所保護之技術範疇，因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。