TW201506401A - 由液相層析質譜資料中萃取離子信號之方法與系統 - Google Patents
由液相層析質譜資料中萃取離子信號之方法與系統 Download PDFInfo
- Publication number
- TW201506401A TW201506401A TW102127707A TW102127707A TW201506401A TW 201506401 A TW201506401 A TW 201506401A TW 102127707 A TW102127707 A TW 102127707A TW 102127707 A TW102127707 A TW 102127707A TW 201506401 A TW201506401 A TW 201506401A
- Authority
- TW
- Taiwan
- Prior art keywords
- eic
- peak
- intensity
- peaks
- mass
- Prior art date
Links
Landscapes
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
此處揭示的方法係用以由原始液相層析質譜資料萃取樣本中目標分子之離子信號。首先,進行去背步驟以移除資料中的化學雜訊。接著,進行波峰強化步驟以改善本方法的波峰偵測能力。其後,採用強度標準化與波峰分段步驟,以重新組織資料點及其強度。之後針對標準化強度之積分計算一累積曲線分數,以進行波峰偵測。萃取出所偵測到的波峰及其滯留時間與強度,以建立目標波峰表。
Description
本發明是有關於一種用以處理液相層析質譜(liquid chromatography-mass spectrometry;簡稱LC-MS)資料的方法;且特別是有關於一種用以由LC-MS資料萃取目標分子之離子信號的方法。
液相層析質譜(LC-MS)是一種強大的分析技術,其結合了液相層析法(liquid chromatography,簡稱LC)的物理分離能力以及質譜分析法(mass spectrometry,簡稱MS)的質量分析能力。LC-MS有多種應用,包括對混合物中一或多種目標化合物的定性和/或定量分析以及對天然萃出物之製備性純化(preparative purification)。
液相層析法是一種重要的分析技術,可用以分離、鑑別與定量在複雜化合物終的待測物。進行液相層析分析時,藉由液態流動相(mobile phase)的流動,使混合物中的多種化學組成份通過固定相(stationary phase),並利用待測物和流動向與固定相之互動關係的
差異,達成分離之目的。
質譜分析法試用來測量離子質荷比(mass-to-charge ratio,簡稱m/z或m/q)的分析工具。通常可針對樣本中所含分子之質量建立一質譜(mass spectrum),以分析樣本的質量。此技術有多種應用領域,包括:利用未知化合物和/或其片段的質量來鑑別此化合物;決定一化合物的一或多種元素之同位素成分;藉由觀察化合物的片段來決定化合物結構;利用特定方法來定量樣本中一化合物的含量(質譜分析本身無法進行定量);研究氣相離子化學(gas phase ion chemistry)的基礎原理,如離子與中子在真空環境下的化學特性;利用多種其他方法來決定化合物的物理、化學甚至生物學特性。
飛行時間質譜分析(time-of-flight mass spectrometry,簡稱TOF-MS)是一種特殊的質譜分析方法,此方法將利用已知強度的電場來加速離子,之後藉由測量時間來決定每一離子的質荷比。LC-TOF-MS可提供較高的質量準確度,讓使用者能夠以較精確的單一同位素質量(monoisotopic masses)與同位素樣式來鑑別化合物。因此,LC-TOF-MS常用以偵測難以取得標準化合物的罕見化學藥品或代謝物。LC-TOF-MS技術在例如高通量毒理分析、代謝體學、藥物代謝學與藥物動力學研究等領域中,都是非常重要的研究工具。
對於毒物篩檢與代謝體學而言,若欲取得準確的結果,對一或多個目標化合物進行經且敏感的波峰
萃取,是非常重要的步驟。然而,在LC-TOF-MS分析時游離源(ionization sources)將無可避免地產生雜訊(noises),而模糊了目標化合物之波峰,且因而增加了波峰檢選過程的挑戰性。所述的雜訊通常可分為化學雜訊(chemical noise)與隨機雜訊(random noise);前者主要是由流動相與內生樣本矩陣(endogenous sample matrix)所造成,而後者(如儀器所致的雜訊(instrumental noise))則通常是由游離介面的熱變異或不穩定所致。相關領域已提出了多種去雜訊演算法,來降低所述的雜訊效應。
舉例來說,已發展出多種選擇方法,如元件偵測演算法(component detection algorithm,簡稱CODA)及基於坦賓-華生準則元件偵測演算法(component detection algorithm approach based on the Durbin Watson criterion,簡稱CODA_DW),其能夠消除品質較差的萃取離子層析圖(extracted ion chromatogram,簡稱EIC)以建立背景雜訊較少的總離子層析圖(total ion chromatogram,簡稱TIC)。
或者是,可利用去背(background subtraction)演算法從取自樣本的資料中移除不需要的成分,以避免將出現在空白樣本(blank sample)中的成分或化合物誤認為待測成分或化合物,因而能夠減少偽陽性的機率。既有的去背法包括設備製造商所附商業軟體中最常採用的圖譜減除(spectral subtraction);以及獨立的演算法,如完善的背景減除以及BgS-NoRA。
上述商業軟體,包括Agilent MassHunter Workstation Software的定性分析功能,要求使用者人工選擇並萃取在感興趣波峰附近的背景圖譜。然而,多數情形下,所述的人工選擇無法有效移除化學雜訊。相反地,所述的獨立演算法可針對空白注入液(blank injection)分析待測物掃瞄時期附近一指定時間視窗內的所有離子,以得到可能需由樣本中減除的離子。之後,這些演算法可移除背景離子,並藉由設定滯留時間(retention time,簡稱RT)位移(shift)與m/z誤差(error)的容忍值(tolerance)來克服LC-MS技術常見的滯留時間位移與質荷比(m/z)誤差等問題。然而,去背演算法可能錯誤地移除信號而產生人為分裂波峰(artificial split peak),因此,若未妥善選擇演算法所用的參數,將使得後續資料分析更為困難。
波峰擷取演算法(peak picking algorithm)例如來自XCMS的matchedFilter與centWave,以及波峰偵測演算法(peak detection algorithm)如MZmine2與MAVEN軟體套裝,亦可用來減少隨機雜訊,這些方法採用了平滑演算法(smoothing algorithm)如高斯平滑法(Gaussian filtering)。這些演算法能夠有效偵測許多小分子化合物;然而,若目標波峰並非高斯形狀(Gaussian shape)時,就可能出現偽陰性結果。
有鑑於上述問題,相關領域亟需一種改良的去雜訊與波峰擷取方法以偵測LC-MS資料中的真實波峰。
發明內容旨在提供本揭示內容的簡化摘要,以使閱讀者對本揭示內容具備基本的理解。此發明內容並非本揭示內容的完整概述,且其用意並非在指出本發明實施例的重要/關鍵元件或界定本發明的範圍。
本發明之一態樣是關於一種用以由原始液相層析質譜(LC-MS)資料萃取樣本中目標分子之離子信號的方法。本發明之一目的在於降低去雜訊和/或波峰擷取過程中,出現偽陽性與與偽陰性結果的機率。為達上述目的,本發明基於一種計分函式(scoring function)而能夠在去雜訊過程中實現較佳參數之選擇,以及遞迴式地(recursively)偵測萃取離子層析圖中的所有波峰。本發明所提出的方法能夠消除LC-MS分析中產生的化學與隨機雜訊,同時可強化波峰信號,進而能夠提升波峰偵測能力。
根據本發明一實施例,上述方法至少包含以下步驟:(a)針對一空白檔案中的每一空白離子(Ib),設定一滯留時間視窗(Tw),其中每一Ib有一滯留時間(Tb)、一第一質荷比(Xb)及一強度(Sc);(b)偵測一待測物檔案中的一相應離子(Ic),其中該Ic有一滯留時間(Tc)、一質荷比(Xc)及一強度(Sc),並滿足以下條件:(b-1)Xb*(1-δ)Xc Xb*(1+δ),其中δ為一使用者定義的質量誤差容忍值(δ),以及(b-2)Tb-Tw Tc Tb+Tw;(c)若Sc θ*Sb,由該待測物檔案移除該偵測到之相應離子(Ic),
以建立一組去背資料,其中θ為一使用者定義的強度誤差容忍值;(d)基於該目標分子之一質荷比,由該組去背資料建立一去雜訊萃取離子層析圖(extracted ion chromatogram;EIC)並由該原始液相層析質譜資料建立一原始EIC;(e)利用下列任一步驟強化該去噪EIC或該原始EIC之波峰強度,以建立一經強化EIC:(e-1)略過強度低於一強度閾值之資料點,(e-2)平均重複的EIC,(e-3)略過強度低於一強度閾值之資料點且之後平均重複的EIC,以及(e-4)平均重複的EIC且之後略過強度低於一強度閾值之資料點;(f)標準化該經強化EIC之強度值,其係藉由將該經強化EIC中每一資料點的強度值除以該經強化EIC中所有資料點的總強度值,以建立一組標準化資料;(g)將具有正標準化強度值的多個連續資料點分群為多個區段,其中二資料點之間最大的間隔為2秒;(h)將每一區段中第一個資料點的強度值取代為所屬區段的積分強度值,並將所屬區段中其他資料點的強度設定為0,以建立一組重組資料;(i)根據公式I或公式II計算該標準化強度之積分的一累積曲線分數(S(CCINI)):
S(CCINI)=0,其他情形..............................(公式II),其中CCINI(j)第j個點之CCINI值、i為經過步驟(e)至(g)之後的第i個資料點、n為用以計算CCINI之資料點的數目,Hz為該質譜儀的採集率、Wavg為一透過實驗估計的平均波峰寬度且Wmin為一使用者定義的最小波峰寬度;(j)將該EIC之S(CCINI)與一SCC閾值(ε)相
比較,且(j-1)當該S(CCINI)ε時,由該EIC萃取該滯留時間與該波峰強度,以建立一波峰移除EIC,並以該滯留時間與該經萃取波峰之強度來更新一波峰表;(j-2)當該0<S(CCINI)<ε時,基於步驟(j-2-1)、(j-2-2)、或(j-2-3)中所述的分類標準,進行其中任一步驟,其中:(j-2-1)當已進行步驟(e-1)時,進行步驟(e-2),且之後進行步驟(f),(j-2-2)當已進行步驟(e-2)或(e-3)時,進行步驟(e-4)且之後進行步驟(f),及(j-2-3)當已進行步驟(e-4)時,排除該EIC而不進行後續處理;以及(j-3)當S(CCINI)=0時,排除該EIC而不進行後續處理;(k)重複步驟(e)至(j),直到該EIC中沒有可偵測之為止;以及(I)由步驟(j-1)中所萃取之所有波峰,建立經萃取離子信號之一目標波峰表。
於本發明某些實施方式中,所述滯留時間視窗(Tw)為約0.5至25秒。舉例來說,所述滯留時間視窗(Tw)為約6、12或18秒。
根據本發明可任選的實施方式,所述質量誤差容忍值(δ)為約5至20ppm,譬如5、10或15ppm。
根據本發明多種實施方式,所述強度誤差容忍值(θ)為約1至2。於一實施例中,強度誤差容忍值(θ)為約1.5。
於本發明某些實施方式中,所述SCC閾值(ε)為約0.5至1。舉例來說,SCC閾值(ε)可為約0.75。
於多種可任選的實施方式中,此處提出的方法至少更包含一種用於偵測分裂波峰暨移除分裂波峰的
程序。舉例來說,當分裂波峰偵測步驟並未於去噪EIC中發現分裂波峰時,於步驟(e)中強化該去噪EIC之波峰強度。或者是,當分裂波峰偵測步驟在去噪EIC中發現至少一分裂波峰時,本方法至少更包含於步驟(d)之後,比較該去噪EIC中之波峰數目與該原始EIC中之波峰數目。若上述比較步驟的結果顯示去噪EIC中之波峰數目等於原始EIC中之波峰數目,於步驟(e)中強化該原始EIC之波峰強度;反之,若去噪EIC中之波峰數目異於原始EIC中之波峰數目,本方法更包含:利用一第二質荷比來重複步驟(a)至(d),以重新建立一去噪EIC,其中該第二質荷比大於該第一質荷比;其後在步驟(e)中強化該重新建立之去噪EIC的波峰強度。
本發明的另一態樣是關於一種實體的處理器可讀取儲存媒體,其上編碼有處理器可讀取的指令(譬如電腦程式或軟體),當一可編程裝置(如處理器或電腦)執行上述指令時,可使所述可編程裝置執行此處提出的離子信號萃取方法。當在可編程裝置中運行上述編碼指令時,能夠執行此處所述的根據本發明之各種或多種實施方式。
本發明的另一態樣是關於一種用以由原始LC-MS資料萃取樣本中目標分子之離子信號的系統。
根據本發明多種實施方式,所述系統至少包含一液相層析模組、一質譜分析模組與一控制單元。所述液相層析模組與質譜分析模組彼此通訊連接,且用以產生樣本的LC-MS資料。所述控制單元與液相層析模組
及質譜分析模組通訊連接,且包含至少一處理器與一記憶體,該記憶體用以儲存複數個指令,當該處理器執行該些指令時,使得該處理器能夠執行此處所述的離子信號萃取方法。此處理器能夠執行此處所述的根據本發明之各種或多種實施方式。
在參閱下文實施方式後,本發明所屬技術領域中具有通常知識者當可輕易瞭解本發明之基本精神及其他發明目的,以及本發明所採用之技術手段與實施態樣。
為讓本發明的上述與其他目的、特徵、優點與實施例能更明顯易懂,所附圖式之說明如下:第1圖為根據本發明多種實施方式之方法的流程圖;第2圖包含本發明實驗例2所得之去雜訊總離子層析圖(TIC);第3圖包含本發明實驗例2所得之強度散布圖;第4圖包含根據本發明實驗例2之目標分子與空白溶劑的萃取離子層析圖(EIC)(方格a至c)與TIC(方格d至f);第5圖為經過本發明實驗例3所述的不同程序處理後,所得之雜訊或目標波峰的EIC;第6圖為經過本發明實驗例3所述的不同程
序處理後,所得之雜訊或目標波峰的EIC;第7圖為根據本發明實驗例3,一標準樣本在去背之前(方格a)、之後(方格b)、以及經過波峰強化之後(方格c)的重複的EIC;第8圖為根據本發明實驗例4,一標準樣本在去背之後(方格a)、之前(方格b)的EIC、以及空白溶劑的EIC(方格c);以及另一標準樣本在經過去背之後(方格d)、之前(方格e)、以及於利用一較大背景質量誤差容忍值進行第二次去背之後(方格f)的EIC;以及第9圖為根據本發明實驗例5,一加料(spiked)尿液樣本在去背之前(方格a)、之後(方格b)、以及一血漿萃取物(plasma extract在去背之前(方格c)、之後(方格d)的EIC。
為了使本揭示內容的敘述更加詳盡與完備,下文針對了本發明的實施態樣與具體實施例提出了說明性的描述;但這並非實施或運用本發明具體實施例的唯一形式。實施方式中涵蓋了多個具體實施例的特徵以及用以建構與操作這些具體實施例的方法步驟與其順序。然而,亦可利用其他具體實施例來達成相同或均等的功能與步驟順序。
除非本說明書另有定義,此處所用的科學與技術詞彙之含義與本發明所屬技術領域中具有通常知識
者所理解與慣用的意義相同。此外,在不和上下文衝突的情形下,本說明書所用的單數名詞涵蓋該名詞的複數型;而所用的複數名詞時亦涵蓋該名詞的單數型。
雖然用以界定本發明較廣範圍的數值範圍與參數界是約略的數值,此處已盡可能精確地呈現具體實施例中的相關數值。然而,任何數值本質上不可避免地含有因個別測試方法所致的標準偏差。在此處,「約」通常係指實際數值在一特定數值或範圍的正負10%、5%、1%或0.5%之內。或者是,「約」一詞代表實際數值落在平均值的可接受標準誤差之內,視本發明所屬技術領域中具有通常知識者的考量而定。除了實驗例之外,或除非另有明確的說明,當可理解此處所用的所有範圍、數量、數值與百分比(例如用以描述材料用量、時間長短、溫度、操作條件、數量比例及其他相似者)均經過「約」的修飾。因此,除非另有相反的說明,本說明書與附隨申請專利範圍所揭示的數值參數皆為約略的數值,且可視需求而更動。至少應將這些數值參數理解為所指出的有效位數與套用一般進位法所得到的數值。
於本說明書中,「液相層析質譜分析」(LC-MS)一詞係指採用了任何液相層析法並搭配任何質譜分析法的技術。在典型的LC-MS分析中,會利用液相層析法將樣本分級(fractionated),再使用質譜分析來定性管柱沖提液(column eluent),以建立樣本之LC-MS資料。液相層析法之例示包括但不限於:反相液相層析法(reverse phase liquid chromatography,簡稱RPLC)、
高效能液相層析法(high performance liquid chromatography,簡稱HPLC)與高渦流液相層析法(high turbulence liquid chromatography,簡稱HTLC)。可用以進行質譜分析的適當設備包括但不限於:四極分析儀(quadrupole analyzer)、離子阱分析儀(ion traps analyzer)、磁場與電場分析儀(magnetic and electric sector analyzer)以及飛行時間分析儀(time-of-flight analyzer,簡稱TOF)。
在此處,「滯留時間」係指在LC-MS分析過程中,以波峰形式偵測到一樣本之特定成分或化合物所需的時間。具體而言,滯留時間是指在LC-MS設備中,從一樣本沿著一層析管柱開始擴散的時間開始,直到質譜儀偵測到一離子化分子或離子的時間為止。。於本說明書中,將「滯留時間視窗」一詞定義為一待測物之預期滯留時間附近的時段,而使得在滯留時間視窗內的波峰會被認定是相應的待測物。
「荷質比」或「m/z比」等詞在本說明書中係指質譜儀中偵測到之片段的分子量(即,質量)相對於該相同片段所帶電荷數的比值。
於本說明書中,「波峰」是一LC-MS回合中的一資料點,其可表彰樣本中至少一種化合物的存在。LC-MS資料中的每一個波峰都有獨特的綜合數值,以表彰其質荷比與滯留時間。
於本說明書中,「樣本」(sample)一詞係指多種化合物的混合物,其中可能含有欲確認的待測物
(analyte),若樣本中含有該待測物時,則可將其分離純化出來。根據本發明某些實施方式,所述樣本可為生物樣本(biolofical smaple),其係分離或衍生自動物、植物、細胞培養上清液、發酵細菌產物(fermenting bacterial product)、植物萃取物、原核細胞萃取物、真核單細胞(unicellular)萃取物與動物細胞萃取物等。生物樣本通常都是混和物,且除了目標物質(如,一代謝物)之外,可能還包含其他物質。舉例來說,所述生物樣本可分離自一哺乳類動物,包括但不限於齧齒類(如小鼠、大白鼠、頰鼠)、猿猴類、犬類與貓類。在較佳的情形中,所述生物樣本係分離自人類。在這些情形中,所述生物樣本係取自或衍生自哺乳類動物之體液,譬如血液(周邊血或全血)、組織間液(interstitial fluid)、血漿、尿液、血管外液(extravascular fluid)、腦脊髓液(cerebrospinal fluid,簡稱CSF)、滑液(synovial fluid)、關節液(joint fluid)、肋膜液(pleural fluid)、血清、淋巴液、精液與唾液。
如上所述,本發明是關於由LC-MS資料萃取離子信號的方法,此處將參照附隨圖式詳細說明之。
LC-MS分析所得到的質譜分析圖譜是一個樣本的化學指紋,其中包含了樣本中所有可偵測或所選化合物的分子訊息與結構訊息。將每一次掃瞄中,所觀察到的所有質量總和起來所得到的圖譜就是一總離子層析圖(TIC),其中不僅含有一或多目標化合物/成分之信號,還有由溶劑所造成的波峰。相反地,由該次掃瞄中一或
多中特定的m/z資料點所建立的萃取離子層析圖(EIC或XIC),僅呈現了一或多種感興趣的目標。
本發明提供了一種策略,用以處理傳統LC-MS分析中常見的化學與隨機雜訊。為達此一目的,此處提出了用以由LC-MS資料萃取離子信號的方法,還有實體的處理器可讀取儲存媒體,其中儲存了處理器可讀取的指令以執行所述方法。此處亦揭示了一種系統,其可藉由執行所述方法,由LC-MS資料萃取離子信號。第1圖概要闡釋了根據本發明某些實施方式所述的離子信號萃取方法100。
簡言之,此處提出的方法100至少包含兩個階段:去背(步驟105-115)與波峰擷取(步驟120-170)。在去背階段中,由至少一待測物分析所得的資料減去空白分析所得的資料,以移除m/z領域和層析時間(chromatographic time)領域中的化學背景。基於目標m/z值,由背景減除後之去背資料建立萃取離子層析圖(EIC)。之後,在波峰擷取階段中,此處提出的方法100基於一計分函式由EIC基於中選擇波峰,且之後藉由遞迴式波峰強化與波峰擷取程序可靠地在EIC中偵測所有的波峰,以便移除隨機雜訊。具體而言,為了減低此種隨機雜訊,此處提出的方法100可由重複分析的LC-MS資料中,萃取出目標m/z值的離子層析圖。此處提出的方法100亦可藉由暫時略過強度較低的資料點和/或藉由平均重複的EIC來進行波峰強化。此外,本發明一實施方式可利用三個重複EIC來進行波峰強化;這是因為多
數分析實驗室都會進行三個重複試驗。由於隨機雜訊的強度通常較小,且重複的實驗中隨機雜訊極少相同;因此,將多個EIC平均能夠有效地降低隨機雜訊並可強化真正的波峰信號。此處提出的方法100反覆施行上述波峰強化與波峰擷取程序,以識別出所有可偵測到的波峰。下文分別敘述第1圖所示之離子信號萃取方法的詳細步驟。
在LC-MS分析中,會進行至少一個待測物分析及至少一個空白分析。在此處,將由一待測物注入液所取得的資料組織為一待測物檔案,並將由一空白注入液(如,僅含有溶劑且無待測物的(s)空白溶劑,或並未添加標準品的空白尿液樣本)取得的資料組織為一空白檔案。因此,空白檔案中含有的資訊是關於空白注入液的複數個離子(又稱,空白離子),而待測物檔案中含有的資訊則是關於空白離子與待測物之離子(簡稱,待測物離子)。基於本發明之目的,上述與離子相關的資訊包含:每一離子的滯留時間、質荷比及強度(S)與其他。為了區別待測物檔案中的待測物離子及空白離子,利用此處提出的方法100來處理上述待測物檔案與空白檔案。
首先,在步驟105中,針對空白檔案的每一空白離子(Ib)設定一滯留時間視窗(Tw)。於本說明書中,每一空白離子(Ib)的滯留時間、質荷比與強度分別表示成Tb、Xb和Sc。
溶質的滯留時間是從將溶質注入的時間到該
溶質的波峰最大值析出時,所經過的時間;而滯留時間視窗則界定了在一特定滯留時間附近的一時期,以將層析過程中可能的變異或偏差納入考量。為了確保較為精確的波峰擷取結果,所設的滯留時間視窗範圍必須夠廣,而足以涵蓋正常波峰滯留偏差;但也應當夠窄,以防止錯誤視窗出現偽陽性的鑑別結果。根據本發明多種實施方式,滯留時間視窗(Tw)為約0.5至25秒。舉例來說,滯留時間視窗(Tw)可以是5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20秒。
接著,在步驟110中,於待測物檔案中搜尋與空白檔案中之空白離子(Ib)相對應的離子。於本說明書中,待測物檔案中每一相應離子(Ic)的滯留時間、質荷比與強度分別表示成Tc、Xc與Sc。為了進行識別,由使用者設定一質量誤差容忍值值(δ),且若該相應離子滿足以下條件,則認定此相應離子為一候選離子:(1)Xb*(1-δ)Xc Xb*(1+δ);以及(2)Tb-Tw Tc Tb+Tw。
質量誤差容忍值是用來補償質譜儀中可能的質量測量誤差/變異。質量誤差容忍值定義出一特定離子之質荷附近的一個範圍,而使得所述範圍內的強度被認定為該離子的強度。一般來說,質量誤差容忍值值通常取決於用來收集資料之設備的質量準確度(mass accuracy)與質量解析度(mass resolution)。於本說明書中,質量誤差容忍值(δ)為約5至20ppm。具體而言,質量誤差容忍值(δ)可以是5、6、7、8、9、10、
11、12、13、14、15、16、17、18、19或20ppm。
在識別出待測物檔案中的相應離子(Ic)之後,本方法進行到步驟115;於此步驟中若Sc θ*Sb,則將所偵測到之相應離子(Ic)由待測物檔案中移除(或減除);上述θ是由使用者定義的強度誤差容忍值。
此處將強度誤差容忍值表示成可容許之波峰強度變異的倍數。舉例來說,強度誤差容忍值(θ)為1.5意味著可允許的變異範圍是波峰強度的1.5倍。根據本發明多種實施方式,強度誤差容忍值(θ)為約1至2。舉例來說,強度誤差容忍值(θ)可以是1、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9或2。
步驟115中所述的減除步驟會產生一組去背資料,之後可在步驟120中利用該組資料來建立一去雜訊萃取離子層析圖(EIC)。具體而言,此處是基於目標分子的質荷(m/z)比來建立去噪EIC。此外,可基於該目標分子的同一個m/z比,由原始液相層析質譜資料建立一原始EIC。當可想見,可基於目標分子的不同m/z比來建立複數個去噪EIC和/或原始EIC。
根據本發明某些實施方式,可在於步驟120中產生去噪EIC之後,進行一種可任選的分裂波峰偵測與分裂波峰移除程序(圖中未繪示)。在此種可任選的程序中,先執行分裂波峰偵測步驟,以決定去噪EIC中是否有一或多個分裂波峰。若去噪EIC中並未發現分裂波峰,方法100就進行到波峰擷取階段,在該階段中藉由執行步驟125,來強化去噪EIC的波峰強度。若在去噪
EIC中發現了至少一個分裂波峰,方法100至少更包含一可任選的分裂波峰移除步驟。
在分裂波峰移除步驟中,此處提出的方法100首先會比較去噪EIC和原始EIC中的波峰數目。若此比較步驟指出去噪EIC中的波峰數目等於原始EIC中的波峰數目,則藉由執行步驟125來強化原始EIC中的波峰強度。相反地,若此比較步驟指出去噪EIC中的波峰數目異於原始EIC中的波峰數目,則先以第二質荷比來重複步驟(a)至(d)以重新建立一去噪EIC,其中第二質荷比大於第一質荷比;其後執行步驟125,以強化該重新建立之去噪EIC的波峰強度。
回到第1圖。在步驟120之後,或在上文所述之可任選的分裂波峰偵測和/或分裂波峰移除步驟之後,方法100進入到波峰擷取階段。
首先,在步驟125中,強化去噪EIC(包括在可任選的波峰移除步驟中重新建立的去噪EIC)或原始EIC的波峰強度。一般來說,可藉由略過資料點和/或平均重複的EIC,來達成波峰強化。具體而言,在步驟125中,可利用以下任一種方法來強化波峰強度:(1)略過強度低於一強度閾值之資料點(步驟125A);(2)平均重複的EIC(步驟125B);(3)略過強度低於一強度閾值之資料點且之後平均重複的EIC(步驟125C);以及(4)平均重複的EIC且之後略過強度低於一強
度閾值之資料點(步驟125D)。
步驟125中的波峰強化可由去噪EIC或原始EIC建立一個經強化的EIC。接著,在步驟130中,將上述經強化EIC之強度值標準化,以建立一組標準化資料。可利用各種已知的方法或演算法來進行此標準化步驟。於一實施例中,將每一資料點的強度值除以該經強化EIC中所有資料點的總強度值。
其後,在波峰分段(binning)步驟(步驟135)中,將具有正標準化強度值的多個連續資料點分群為多個區段。在進行波峰分段時,分群至同一區段中的兩個資料點之間最大的間隔為2秒。
再來,於步驟140中,重新組織每一區段之資料點。具體而言,將每一區段中第一個資料點的強度值替換成該區段的積分強度值,並將所屬區段中其他資料點的強度值都設定為0。
方法100接著進行到步驟145,以計算經標準化強度之積分(integral of the normalized intensity,即INI)的一累積曲線(cumulative curve,即,CC)分數,此分數以下簡稱為CCINI分數或S(CCINI)。一般來說,CCINI分數的計算基礎包括位於第j個點的CCINI值(CCINI(j))、用來計算CCINI的資料點之數目(n)、質譜儀的採集率(Hz)、使用者定義的最小波峰寬度(Wmin)和/或由實驗決定的平均波峰寬度(Wavg)。具體而言,當資料點數目(n)大於等於最小波峰寬度(Wmin)乘以採集率(Hz)時,根據以下公式I來計算CCINI分數:
其中i為經過步驟130至140處理後的第i個資料點。另一方面,當資料點數目(n)小於最小波峰寬度(Wmin)乘以採集率(Hz)時,則根據以下公式II來計算CCINI分數:S(CCINI)=0,其他情形..................(公式II)。
接著,在步驟150中決定該EIC的S(CCINI)是否大於等於一SCC閾值(ε)。根據本發明多種實施方式,SCC閾值(ε)為約0.5至1。舉例來說,SCC閾值(ε)為約0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95或1。
當S(CCINI)大於等於SCC閾值(ε),方法100接著進行到步驟160;否則方法100就進行到步驟152。
在步驟152中,決定S(CCINI)是否大於0。當在步驟152中決定S(CCINI)等於0時,方法100停止執行。另一方面,當在步驟152中決定S(CCINI)大於0時,方法100進行到步驟154。
在步驟154中,決定先前在步驟125中所採用的強化方法為何。若此處決定先前採用的是步驟125D,則方法100停止執行。若此處決定先前執行的是步驟125A,方法100進行到步驟125B,即第1圖中的路徑(I);然而,若決定先前所用的步驟是步驟125B或125C時,方法100則進行到步驟125D,即第1圖中的路徑(II)。
回到步驟150,經決定S(CCINI)大於等於SCC閾值(ε)時,代表偵測到至少一波峰。因此,方法100進行到步驟160,在此步驟中由該EIC移除(萃取)偵測到之波峰的滯留時間與強度(步驟160A)。由步驟160A中的波峰萃取步驟來建立波峰移除EIC,接著對波峰移除EIC進行步驟125的波峰強化程序;即,第1圖中的路徑(III)。此外,利用萃取出來的滯留時間與強度資料來更新一波峰表(160B)。
一旦方法100經由路徑(I)、(II)、(III)任一路徑回到步驟125,就會依序執行標準化步驟130、波峰分群步驟135與重新組織步驟140;且在每一回合執行完成之後,會在步驟145中重新計算CCINI分數。這種遞迴式的波峰擷取處理使得此處提出的方法100能夠穩健地識別出所有相關的波峰,包括拖尾峰(tailing peak)與前延峰(fronting peak)。
若方法100決定該EIC中不在有可偵測的波峰時,可從在步驟160B所更新的資料來建立一目標波峰表(步驟170)。其後,方法100就開始對下一個EIC進行波峰擷取。一般來說,可在沒有可供處理的EIC時,或視使用者偏好來終止方法100之執行。
本發明的一個創造性特徵在於此處提出的方法利用CCINI分數來鑑別波峰的強度。具體而言,CCINI分數是兩個面積的比值,具體來說,S(CCINI)的分母是涵蓋CCINI之最小直角三角形的面積,而其分子則是上述直角三角形之斜邊和CCINI之間的面積。根據本發明的原理
與規則,較大的S(CCINI)值代表目標化合物或其片段的存在。
可利用一種實體的處理器可讀取儲存媒體,來實作此處所述的方法標的,所述儲存媒體上儲存有處理器可讀取的指令,當一可編程裝置(programmable device)的處理器執行上述指令時,其可控制該可編程裝置執行根據本發明實施方式之方法。可用以實作此處所述之方法標的之例示性處理器可讀取儲存媒體包括,但不限於:隨機存取記憶體(RAM)、唯讀記憶體(ROM)、可抹除可程式化唯讀記憶體(EPROM)、電子可抹除可程式化唯讀記憶體(EEPROM)、快取記憶體(flash memory)或其他固態記憶體(solid state memory)技術、唯讀光碟(CD-ROM)、多功能數位影音光碟(DVD)、或其他光學記憶體、磁匣(magnetic cassettes)、磁帶(magnetic tape)、磁盤(magnetic disk)存儲或其他磁性存儲設備,以及任何其他可用來儲存所欲資訊且可供處理器存取的媒介。除此之外,用以實施所述方法標的之處理器可讀取儲存媒介,可以設置於一單一裝置或運算平台中或亦可分散於複數個裝置或運算平台上。
本發明另一態樣所述的標的為一種系統,其可用來由由LC-MS資料萃取目標分子的離子信號。上述系統至少包含一液相層析法模組、一質譜分析模組與一控制單元。所述液相層析模組與質譜分析模組彼此通訊連接,且用以產生樣本的LC-MS資料。所述控制單元與液相層析模組及質譜分析模組通訊連接,且可用以由
LC-MS資料中萃取目標分子的離子信號。具體來說,上述控制單元包含至少一處理器與一記憶體,該記憶體用以儲存複數個指令,當該處理器執行該些指令時,使得該處理器能夠執行此處所述的離子信號萃取方法。此處理器能夠執行根據本發明之一或多種實施方式。
可又多種不同的技術來具體實現液相層析模組、質譜分析模組和/或控制單元之間的通訊連接。舉例來說,此系統可包含一網路介面,使得液相層析模組、質譜分析模組及控制單元可透過一網路進行通訊連接;上述網路如:區域網路(local area network,簡稱LAN)、廣域網路(wide area network,簡稱WAN)、網際網路(Internet)或無線網路。在另一實施例中,此系統具有一系統匯流排(system bus),其可用以將多種系統元件包含液相層析模組和/或質譜分析模組連接至控制單元。於又一實施方式中,此系統可以含有一輸出裝置,以供液相層析模組和/或質譜分析模組輸出LC-MS資料;以及一輸入設備,以供將LC-MS資料輸入控制單元中。
下文提出多個實驗例來說明本發明的某些態樣,以利本發明所屬技術領域中具有通常知識者實作本發明,且不應將這些實驗例視為對本發明範圍的限制。據信習知技藝者在閱讀了此處提出的說明後,可在不需過度解讀的情形下,完整利用並實踐本發明。此處所引用的所有公開文獻,其全文皆視為本說明書的一部分。
實驗例1
樣本製備與及LC-MS分析
1.1化學藥劑
用於建立國立台灣大學代謝體核心實驗室標準品資料庫的標準品係購自Sigma-Aldrich(St.Louis,MO,USA)。鑑識藥品標準品係購自Cerilliant Corp.(Round Rock,TX,USA)。質譜分析用乙腈(acetonitrile;ACN)係購自J.T.Baker(Phillipsburg,NJ,USA)質譜分析用水與甲醇(MeOH)皆購自Shalau(Mas d’en Cisa,Barcelona,Spain)。乙酸係購自Merck(Darmstadt,Germany)。
1.2樣本製備
於分析用國立台灣大學代謝體核心實驗室標準品資料庫時,將標準品溶於有機溶劑中,濃度為500-2000ng/ml。共使用了466個化學標準品來建立用於品估的資料組,並以其中20個化學標準品在下文實驗例2所述的背景減除步驟中,進行參數最佳化。上述20種化學品包括::胞苷(cytidine)、腺嘌呤(adenine)、(inosine)、(cytosine)、(estriol)、(fumarate)、D-山梨醇(D-sorbitol)、琥珀酸(succinate)、檸檬酸(citric acid)、D-果糖(D-fructose)、甘菊花酸(tiglic acid)、β-丙胺酸(beta-alanine)、去氧核糖(deoxyribose)、乙醇酸(glycolic acid)、胸苷(thymidine)、十六醇(16-hexadecanol)、皮甾酮(cortexolone)、高香草酸(homovanillate)、2,3-吡啶二甲酸(2,3-pyridinedicarboxylic acid)及3-羥鄰氨苯甲酸
(3-hydroxyanthranilate)。
於鑑識藥物分析時,將族量的標準品溶液加入尿液中,以得到加料(spiked)尿液樣本。將加料尿液樣本(100ml)以400ml的去離子水稀釋後,以15,000g離心10分鐘。接著對上清液(200ml)進行LC-MS分析。不同鑑識藥物分析中所用的化學標準品如表1所示。
1.3 LC-MS分析
利用Agilent 1290 U-HPLC系統搭配6540-QTOF(皆購自Agilent Technologies,Santa Clara,CA,USA)來分析所有標準混合物與鑑識藥物。-QTOF(Agilent Technologies,Santa Clara,CA,USA)。本試驗所採的質量解析度與質量準確度分別為20,000與10ppm。
將466個化學標準品分成26批次來進行層析與質譜分析,並利用正離子化與負離子化模式進行分析。在所用的標準品中,LC/MS分析能夠清楚識別出其中297個標準品,這297個標準品可作為評估用資料組。具體而言,將2μm的標準混合物注入至ACQUITY UPLC HSS T3管柱(2.1mm X 100mm,1.8μm;購自Waters,Milford,MA,USA)。流動相係由0.1%甲酸水溶液(溶劑A)與ACN(溶劑B)。洗脫梯度過程如下:0-1.5分鐘:2%的B;1.5-9分鐘:由2%至50%線性梯度之B;9-14分鐘:由50%至95%線性梯度之B;14-15分鐘:95%的B。流速為每分鐘0.3ml。進行樣本離子化時,使用Jet Stream電噴灑離子化源(electrospray ionization source),在正離子化模式中所用毛細管電壓為4kV;在負離子化模式中所用毛細管電壓為3.5kV。質量掃瞄範圍是m/z=50-1700。
進行鑑識藥物分析時,將5μm的樣本注入Agilent Poroshell EC-C18管柱(2.1mm X 100mm,2.7μm)中。流動相係由0.1%的醋酸水溶液(溶劑C)與MeOH(溶劑D)所組成。洗脫梯度過程如下0-1分鐘:2%的B;1-10分鐘:由2%至50%線性梯度之D;10-15分鐘:由50%至90%線性梯度之D;15-17分鐘:90%的D。進行樣本離子化時,使用Jet Stream電噴灑離子化源,並以3kV的毛細管電壓在正離子化模式下操作。流速為每分鐘0.4ml。質料掃瞄範圍為m/z=50-950。
在進行此處提出的方法前,利用已知技術將
所取得之所有LC-MS資料轉換為總離子層析圖(TIC)。
實驗例2
利用背景減除降低化學雜訊
所用的標準混合物係由實驗例1.2所述的20種化合物所組成,並以實驗例1.3所述的方法建立原始TIC。接著利用此處提出之方法(參見,第1圖所示的步驟105至120)去背程序,來處理所得TIC,以評估此處提出的方法於降低化學雜訊之效果。在本實驗例中,利用九種參數組合進行去背以建立不同的去噪TIC。具體而言,所用的參數組合包括滯留時間視窗(T)為6、12或18秒,以及使用者定義的質量誤差容忍值(δ)為5、10或15ppm相對質量準確度。分析結果如第2、3圖所示。
第2圖所示的去噪TIC是以上述參數組合根據此處提出的方法將其中的化學背景移除。如第2圖所示,當質量誤差容忍值δ為5ppm時,去噪TIC的基線較高(第2圖,方格a至c);而當δ值大於等於10ppm時,去噪TIC的基線就相當低(第2圖,方格d至i)。
參照第3圖的強度散布圖,該些圖式係將標準混合物之資料利用上述參數組合去背後,再以滯留時間(x-軸)相對於質荷(m/z)比(y-軸)作圖。散布圖中的色彩可表示強度,其中紅色與黃色分別代表高強度與低強度。
第3圖的結果顯示,對m/z比而言,較高的質量誤差容忍值(δ)以及較大的滯留時間位移可得出較
清晰(clean)的圖譜。以第3圖的方格a、d及g為例,質譜會隨著質量誤差容忍值數值漸增而更趨清晰。然而,在此種情形中,錯誤移除移除正確離子的機率也會增加。舉例來說,在約9.6分鐘時,當增加滯留時間視窗及與質量容值時,m/z範圍在500至800間的信號會降低,因而導致錯誤地降低信號。在考量所有上述因素之後,後續分析中選用10ppm的質量誤差容忍值進行去背。
此處測試6至18秒之間的RT位移。當所用的滯留時間視窗為6秒時,在較晚析出的區段中,去噪TIC之背景雜訊仍然偏高(第2圖之方格a、d與g),而滯留時間視窗為12秒(第2圖之方格b、e與h)和18秒(第2圖之c、f及i)的結果則較為接近。因此,在後續分析中,採用12秒的滯留時間視窗進行去背。
第4圖的方格a、b分別是3-羥鄰氨苯甲酸之標準溶液與空白樣本的EIC。由第4圖的方格a可以看出,3-羥鄰氨苯甲酸標準溶液EIC呈現了兩個信號,其滯留時間分別是4.5與9分鐘。由由波峰高度來看,操作者可能會將在9分鐘的最大波峰認定為3-羥鄰氨苯甲酸。然而,此一波峰亦出現在空白樣本的EIC(第4圖之方格b)中。利用此處提出之方法,經過去背處理後,位於9分鐘的波峰消失了(第4圖方格c)。因此,對應於3-羥鄰氨苯甲酸的真正波峰應該是在4.5分鐘所偵測到的信號。
繼續參照第4圖,方格d與e分別是上述標準混合物樣本與空白樣本的TIC,而方格f則是由方格d
進行去背後所得到的去噪TIC。由方格d與e可以刊出,標準混合物和空白溶劑的TIC非常相似,意味著標準品的信號可能會被強烈的背景雜訊所掩蓋。然而,去背處理後的標準混合物之TIC(方格f)顯示此處提出的方法能夠明顯地降低化學雜訊以呈現出標準品的信號。
總結來說,這些結果顯示此處提出的方法能夠藉由進行背景減除(去背),而有效地改善滯留時間資訊的準確度。
實驗例3
利用波峰擷取降低隨機雜訊
在上文實驗例2所述的去背程序之後,接著對資料進行根據本發明的波峰擷取程序(參見,第1圖所示的步驟125至170)。本實驗例所選用的參數係基於實驗例2中所做分析以及發明人之經驗。舉例來說,先前的經驗指出大多數真實波峰的S(CCINI)值會等於或大於0.75的SCC閾值,且平均波峰寬度(Wavg)為12秒。在此處,利用Wavg來進行校正,以避免在一EIC中,發生在CCINI中僅出現單一資料點這種極端的單一波峰之情形。具體而言,對單一標準品之反覆波峰擷取步驟包含下列步驟:
(1)擷取一目標標準品之所有重複試驗的原始離子層析圖。利用使用者輸入的強度因子0.1以及平均波峰寬度12秒,來計算EIC的S(CCINI)值。若有三分之二的
S(CCINI)值大於或等於0.75,即認定偵測到波峰;若否,則處理程序進行到步驟(2)。
(2)對於每一重複的EIC,當可允許的波峰間隔為2秒時,若最大波峰的波峰寬度小於2秒,則認定該層析圖不包含真正的波峰。若有至少三分之二的重複EIC包含真正的波峰,處理程序進行到步驟(3);若否,則認定該層析圖中不含目標波峰。
(3)計算經強化EIC的S(CCINI)值。計算三個重複分析的平均來進行波峰強化。若平S(CCINI)值大於等於0.75,處理認定偵測到目標標準品的一層析波峰;若否,則處理程序進行到步驟(4)。
(4)以使用者輸入的強度因子0.1來計算經強化EIC的S(CCINI)值。若經強化EIC之S(CCINI)值大於等於0.75,認定偵測到目標化學品;若否,處理程序認定層析圖中不含目標化學品。
先前技術已提出可利用波峰強度之標準化來進行波峰擷取。為了了解此處提出的方法相較於既有標準化方法之效果,對標準化學品4-香豆酸(4-coumarate)(m/z 165.0546)與雜訊(m/z 165.0758)的去噪EIC進行此處提出的波峰擷取程序,或以經既有常標準化步
驟後利用此處的方法計算其分數。
第5圖的方格a、b分別是雜訊與4-香豆酸的去噪EIC。這些去噪EIC直接用於標準化處理(第1圖,步驟130)而未經過此處提出的波峰強化步驟(第1圖,步驟125)與波峰分群步驟(第1圖,步驟135及140)。其後,將經標準化之強度依升冪排序,以建立每一EIC的標準化強度之累積曲線(cumulative curve of normalized intensity,簡稱CNI)。根據公式I、II來計算每一EIC之CNI的分數。藉由比雜訊與波峰之CNI曲線下面積(圖中未示出),可以發現前者較大。然而,雜訊與波峰之分數間的差異較小(<0.5)。
此外,對第5圖方格a、b的去噪EIC進行波峰擷取程序(第1圖之步驟125至150)。雜訊與標準化學品經處理後的EIC分別如第5圖方格c、d所示,之後再經過處理以計算相對應的積分標準化強度之累積曲線(CCINI)(圖中未示出)。
當層析圖中不含目標波峰時,僅經過標準化所得到的累積曲線下面積與根據此處提出之方法所得之累積曲線下面積非常接近(圖中未示出)。因此,CNI分數(0.021)及CCINI分數(0.021)是相同的。相反地,當層析圖中出現目標波峰時,累積曲線下面積會大幅減少(圖中未示出)。這種大幅減低的現象會導致CCINI分數明顯變大(0.833),相較之下,CNI分數(0.505)的增幅則較為不顯著。如此一來,可以大幅提高雜訊及目標波峰之分數間的差異,因而能夠提供一種穩健的機制,
以區別目標波峰與雜訊。值得注意的是,此實施例計算得之CCINI分數大於預設的SCC(即,0.75),這意味著資料中出現了目標波峰。此外,應注意到本方法利用使用者輸入的強度因子(0.1),即可實質上移除隨機雜訊(參見,第5圖的方格b與d)。
第5圖所示與上文所述的結果顯示,雜訊與目標波峰之間分數差異的改變,是由於資料中目標波峰的存在與否所致。
為了了解本方法之波峰強化步驟與波峰分群步驟的重要性,對第5圖之方格a、b所示的EIC進行波峰強化步驟(第1圖,步驟125)或波峰分群步驟(第1圖,步驟135及140),而後再進行分數計算步驟(第1圖,步驟145)。
第6圖的方格a、b分別是依本方法之波峰分群步驟處理後之雜訊與目標波峰的EIC;之後再將處理兩個EIC以得到其累積強度圖(圖中未示出)。這些結果顯示,此處提出的波峰分群步驟不會顯著影響雜訊的累積強度;因此,在波峰分群步驟之前的CNI分數(0.021;第5圖方格a)與之後的CNI分數(0.021;第6圖方格a)並未改變。相較之下,此處提出的波峰分群步驟則會明顯改變目標波峰的累積強度,且因此,CNI的分數由0.505略微增加至0.719。然而,經過波峰分群之資料的CNI分數仍低於預設的SCC閾值(即,0.75),以上結果顯示,就波峰波峰擷取而言,上述分群步驟單獨使用的效果比不上此處所述的整體波峰擷取程序。
相似地,單獨採用波峰強化步驟也無法實質上改變雜訊的累積強度,且在波峰強化步驟之前的CNI分數(0.021;圖中未示出)與之後的CNI分數(0.021;圖中未示出)相同。至於目標波峰,處理後的CNI分數是0.227(圖中未示出),此一數值甚至低於由標準化資料計算所得之CNI分數(0.505;圖中未示出)。因此,單獨使用波峰強化步驟不像此處提出的方法一樣能夠改善波峰擷取效率。然而,以上結果顯示,波峰強化步驟能夠移除目標波峰之EIC中的隨機雜訊。
此處提出的方法之波峰擷取階段係由三種要素所組成,即:波峰強化、標準化與波峰分群。第5圖與第6圖所示的結果顯示,結合以上三種要素,可以得到最佳的波峰擷取結果。另一方面,若僅採用上述波峰擷取程序中的一或兩個要素,則無法得到理想的結果。
為了了解此處提出的方法,特別是其中的波峰強化步驟,由EIC移除隨機雜訊的能力,利用三個Y-己內酯(gamma-caprolactone)標準溶液(m/z 113.0608)的重複EIC來進行分析。
如第7圖的方格a所示,在三個重複的EIC中,背景雜訊的強度都很高。在經過此處提出的去背程序之後,這些EIC的雜訊都大幅減少(參見,第7圖的方格b),然而無法偵測到對應於Y-己內酯的波峰,因為三個重複EIC中僅有一個EIC的CCINI分數大於預設的SCC閾值(即,0.75)。至於另兩個重複EIC,其CCINI分數較小可能是因為這些重複EIC中的隨機雜訊較高所
致。藉由平均三個EIC,可以保持波峰強度但可大幅減少隨機雜訊(第7圖的方格c)。針對此一經強化EIC重新計算所得之S(CCINI)值為0.827,此一數值大於上述SCC閾值。此實驗例證實此處提出的方法能夠有效地強化真實波峰的信號強度,因而能夠改善偵測較小波峰之能力。
實驗例4
消除分裂波峰
根據本發明之方法至少更包含一可任選的演算法,用以偵測及移除層析圖中之分裂波峰。造成分裂波峰的兩大主因分別是儀器飽和(instrumental saturation)與去背程序中所用的數學處理(mathematical processing)。為了解決分裂波峰的問題,此處提出的方法首先比較去背之前與之後的EIC,接著調整EIC的質量及誤差容忍值。具體而言,當本發明偵測到背景減除EIC中有分裂波峰時,本方法會比較去背之前與之後的波峰數目。若原始離子層析圖中僅偵測到一波峰時,此處提出的方法選擇原始離子層析圖,而非去噪EIC,來進行後續資料處理。若原始離子層析圖具有類似的分裂波峰圖樣,此處提出的方法會利用較大的質量誤差容忍值針對目標m/z值重新萃取一離子層析圖,以決定所用的質量誤差容忍值對波峰形狀是否有影響。此一方式是基於已知當偵測器中的離子呈飽和時,質量準確度會降低。
舉例來說,利用此處提出的方法對肉鹼(carnitine)標準溶液之EIC(m/z 162.1125)進行去背程序處理後,所得EIC中出現兩個波峰(第8圖,方格a)。接著,此處提出的方法會比較背景減除EIC和原始EIC(第8圖,方格b)之波峰數目。比較結果顯示在背景減除之前,EIC中僅有一個波峰(第8圖,方格b)。因此,此處提出的方法決定方格a中的分裂波峰是由空白溶液(第8圖,方格c)在相同m/z中較小波峰所引起的。在此種情形中,使用未經過背景減除的層析圖來進行後續處理。
於另一實施例中,波峰分裂係由儀器飽和所致。利用此處提出的方法以10ppm的相對質量準確度來處理洛呱丁胺(loperamide)的標準溶液EIC(m/z 477.2303;第8圖之方格e),所得之EIC有兩個波峰(第8圖之方格d)。如第8圖之方格e所示,經過背景減除前的EIC樣本亦具有兩個波峰。因此,此處提出的方法會認定分裂波峰並非由背景減除所導致。所以,此處提出的方法會進行下一步驟,利用較大的質量誤差容忍值來萃取離子層析圖;如第8圖之方格f所示,將質量誤差容忍值調整至25ppm之後,分裂波峰會合併為單一波峰。接著對新產生的萃取EIC進行本發明所述的後續處理。
此外,將相對質量準確度之容忍值設定為10ppm,並分析上文實驗例1所述的297個EIC。在這些EIC中,在11個標準化學品的EIC中發現分裂波峰。之後以此處提出的方法(TIPick)與另外兩種既有波峰擷取
演算法(XCMS提供的matchFilter與centWave)來處理這11個EIC。表2摘要整理了實際滯留(實際RT)時間以及其與各方法決定之滯留時間(RT)之間的滯留時間差(RT差)。於此分析中,實際滯留時間係將三次重複試驗的滯留時間平均而得。當可想見,RT差可反應波峰擷取演算法的準確度,其中RT差較小代表準確度較高。
從表2所示的RT差來看,此處提出的方法(TIPick;方法1)比起matchedFilter(方法2)與
centWave(方法3)更為準確。具體而言,此處提出的方法可偵測到10個具有分裂波峰的EIC,其中有9個EIC的RT差小於0.17秒。相較之下,matchedFilter與centWave分別給出5個與2個具有分裂波峰的EIC,且其RT差皆大於0.3秒。
為了比較本方法(方法1)、matchFilter(方法2)與centWave(方法3)之效能,依以下方法分別計算這些演算法的靈敏度(又稱回現率;recall rate)、精確率(precision)與F-分數。若一波峰擷取演算法並未偵測到真實波峰,將其視為「未偵測到」(missed detection),即偽陰性(false negative;FN)。若偵測到之波峰的波峰寬度涵蓋實際滯留時間,將其視為正確(correct detection),即真實波峰(true peak;TP)。若偵測到之波峰的波峰寬度並未涵蓋實際滯留時間,將其視為錯誤偵測(erroneous detection),即偽陽性(false positive;FP)。回現率(R)的計算方式為R=TP/(TP+FN);而準確率(P)的計算方視為P=TP/(TP+FP)。可將回現率與準確率合併為單一數值,即F-分數,其計算方視為F-分數=2RP/(R+P)。計算結果如表3所示。當可想見,較大的回現率代表偵測到較多真實波峰,而較高的準確率代表所偵測到的實際陽性結果高於偽陽性。此外,完美的波峰擷取演算法之F-分數為1(即,100%)。
此處提出的方法(方法1;TIPick)之錯誤偵測數木與未偵測到數目分別是2與1,而方法2(matchedFilter)則有1個錯誤偵測與6個未偵測到;
方法3(centWave)則分別是8個與9個。此處提出的方法(TIPick)有較高的回現率(0.91)、精確率(0.83)與F-分數(0.87),相較之下,方法2的三種數值分別是0.45、0.83與0.59;而方法3則是0.18、0.20與0.19。
總結而論,實驗例4顯示此處提出的方法能夠有效處理與出現分裂波峰相關的問題,因而能夠增進波峰擷取程序的準確度。
實驗例5
毒物篩檢與代謝體分析
為了評估此處提出的方法於偵測真實波峰的效能,利用以下參數來根據此處提出的方法來處理台灣大學代謝體核心實驗室標準品資料庫的297個化學混合物的EIC:相對質量準確度10ppm、視窗大小(winSize)25、內部容忍值(Int_tolerance)1.5、最小波峰寬度(min_peak width)2、間隙容忍值(gap_tolerance)2、SCC閾值(SCC_thresh)0.75、重複閾值(rep_thresh)2/3以及相對質量準確度之分裂波峰回復容忍度(recovered tolerance)25ppm。將297個標準品分成
26個批次以進行LC-MS分析,並收集利用正離子模式與負離子化模式所得之資料。目標m/z值對應於正離子化模式中的質子化分子離子(protonated molecular ion)以及負離子化模式中去質子化分子離(deprotonated molecular ion)。亦利用上文實驗例4所述的方法以matchedFilter與centWave演算法來處理這些EIC。根據實驗例4所述的方法,分別計算每一演算法在正、負離子化模式下的回現率、精確率與F-分數,結果如表4所示。
表4中的資料指出,此處提出的TIPick法(方法1)之回現率、精確率與F-分數分別是0.99、0.97與0.98,代表此處提出的方法是一種敏感且又精確的目標分子之離子信號的萃取方法。
由於此處提出的方法能夠在複雜的基質中偵測一或多目標分子,本方法特別適合應用於毒物篩檢與目標分析。
為了評估此處提出的方法是否適用於毒物篩檢,根據上文實驗例1.2所述製備加料尿液樣本,而後
進行LC-MS分析。接著利用此處提出的方法來偵測LC-MS層析圖中的波峰。分析結果指出,此處提出的方法能夠偵測所用的共51種鑑識藥物。
舉例來說,丁基原啡因(m/z468.3108)的原始EIC有較高的背景雜訊(第9圖之方格a)且CCINI分數(0.517)較低。當可想見,較高的背景雜訊經常會使得目標分子的鑑定更顯困難。然而,在根據此處提出的方法以空白樣本(並未以任何鑑識藥物加料的尿液)進行背景減除後,可得到較為清晰的離子層析圖(第9圖之方格b)。此外,CCINI分數亦提高至0.812,此一數值大於預設的SCC閾值(即,0.75)。這些結果顯示此處提出的方法可用於毒物篩檢。
亦可將此處提出的方法運用於代謝體學的目標分析,以辨識樣本中的真實波峰。舉例來說,第9圖的方格c是取自一人類對象的血漿樣本之EIC(m/z 137.0244)。根據此處提出的方法進行背景減除後,此一波峰會消失(第9圖之方格d),這代表此處提出的方法能夠成功地降低化合物偵測的偽陽性(第一型誤差;type I error)。
上文提出的實驗分析結果顯示此處提出的方法能夠有效地移除LC-MS層析圖中的化學雜訊與隨機雜訊。此外,此處提出的方法,特別是其中的波峰擷取程序,能夠穩健地識別LC-MS層析圖中真正的波峰。此一特性至少來自此處所用的遞迴式波峰擷取處理。
上文提出的實作方式證實此處提出的方法能
夠更精確地由LC-MS層析圖中,擷取出樣本中之目標分子的離子信號。此一創新之演算法最重要的特徵之一在於波峰擷取程序中採用了標準化強度之積分的累積曲線分數S(CCINI)。
雖然在此揭示了特定步驟序列,需知,所述之步驟可以不同之順序、單獨或合併執行,除非另有其他相反的說明,且這些實施方式仍屬於本發明之範圍。
可將此處所述之操作實作為一方法、設備或製造物,譬如可利用一般程式設計和/或工程技術,來製造軟體、韌體、硬體或其組合。舉例而言,若操作者認為速度與精確性較為重要,就可以選擇以一硬體和/或韌體的載具為主;如果彈性較為重要,較可選擇軟體為主;或者可以選擇硬體、韌體或硬體之組合。因此,可利用多種不同的載具來實現此處所述的方法和/或裝置和/或其他技術,然其間並無優劣之分別,當可視其所應用之特定環境或操作者之考量(例如,速度、彈性或可預期性),而有所不同。
雖然上文實施方式中揭露了本發明的具體實施例,然其並非用以限定本發明,本發明所屬技術領域中具有通常知識者,在不悖離本發明之原理與精神的情形下,當可對其進行各種更動與修飾,因此本發明之保護範圍當以附隨申請專利範圍所界定者為準。
100‧‧‧方法
105-170‧‧‧步驟
Claims (21)
- 一種用以由原始液相層析質譜資料萃取一樣本中一目標分子之離子信號的方法,至少包含以下步驟:(a)針對一空白檔案中的每一空白離子(Ib),設定一滯留時間視窗(Tw),其中每一Ib有一滯留時間(Tb)、一第一質荷比(Xb)及一強度(Sc);(b)偵測一待測物檔案中的一相應離子(Ic),其中該Ic有一滯留時間(Tc)、一質荷比(Xc)及一強度(Sc),並滿足以下條件:(b-1)Xb*(1-δ)Xc Xb*(1+δ),其中δ為一使用者定義的質量誤差容忍值(δ),以及(b-2)Tb-Tw Tc Tb+Tw;(c)若Sc θ*Sb,由該待測物檔案移除該偵測到之相應離子(Ic),以建立一組去背資料,其中θ為一使用者定義的強度誤差容忍值;(d)基於該目標分子之一質荷比,由該組去背資料建立一去噪萃取離子層析圖(extracted ion層析圖;EIC)並由該原始液相層析質譜資料建立一原始EIC;(e)利用下列任一步驟強化該去噪EIC或該原始EIC之波峰強度,以建立一經強化EIC:(e-1)略過強度低於一強度閾值之資料點,(e-2)平均重複的EIC,(e-3)略過強度低於一強度閾值之資料點且之後平均重複的EIC,以及 (e-4)平均重複的EIC且之後略過強度低於一強度閾值之資料點;(f)標準化該經強化EIC之強度值,其係藉由將該經強化EIC中每一資料點的強度值除以該經強化EIC中所有資料點的總強度值,以建立一組標準化資料;(g)將具有正標準化強度值的多個連續資料點分群為多個區段,其中二資料點之間最大的間隔為2秒;(h)將每一區段中第一個資料點的強度值取代為所屬區段的積分強度值,並將所屬區段中其他資料點的強度設定為0,以建立一組重組資料;(i)根據公式I或公式II計算該標準化強度之積分的一累積曲線分數(S(CCINI)):
- 如請求項1所述之方法,其中該滯留時間視窗(Tw)為約5至20秒。
- 如請求項1所述之方法,其中該質量誤差容忍值(δ)為約5至20ppm。
- 如請求項1所述之方法,其中該強度誤差容忍值(θ) 為約1至2。
- 如請求項1所述之方法,其中該SCC閾值(ε)為約0.5至1。
- 如請求項1所述之方法,更包含一分裂波峰偵測步驟,以偵測該去噪EIC中至少一分裂波峰的存在,其中當該去噪EIC中沒有分裂波峰時,於步驟(e)中強化該去噪EIC之波峰強度。
- 如請求項1所述之方法,更包含一分裂波峰偵測步驟,以偵測該去噪EIC中至少一分裂波峰的存在,其中當該去噪EIC中有至少一分裂波峰時,該方法至少更包含於步驟(d)之後,比較該去噪EIC中之波峰數目與該原始EIC中之波峰數目。
- 如請求項7所述之方法,其中當該去噪EIC中之波峰數目等於該原始EIC中之波峰數目時,於步驟(e)中強化該原始EIC之波峰強度。
- 如請求項7所述之方法,其中當該去噪EIC中之波峰數目異於該原始EIC中之波峰數目時,該方法更包含:利用一第二質荷比來重複步驟(a)至(d),以重新建立一去噪EIC,其中該第二質荷比大於該第一質荷比;其 中於步驟(e)中強化該重新建立之去噪EIC的波峰強度。
- 一種實體的處理器可讀取儲存媒體,其上編碼有處理器可讀取的指令以執行如請求項1所述之方法。
- 如請求項10所述之實體的處理器可讀取儲存媒體,其中該滯留時間視窗(Tw)為約5至20秒、該質量誤差容忍值(δ)為約5至10ppm、該強度誤差容忍值(θ)為約1至2且該SCC閾值(ε)為約0.5至1。
- 如請求項10所述之實體的處理器可讀取儲存媒體,其中該方法更包含一分裂波峰偵測步驟,以偵測該去噪EIC中至少一分裂波峰的存在,其中當該去噪EIC中沒有分裂波峰時,於步驟(e)中強化該去噪EIC之波峰強度。
- 如請求項10所述之實體的處理器可讀取儲存媒體,其中該方法更包含一分裂波峰偵測步驟,以偵測該去噪EIC中至少一分裂波峰的存在,其中當該去噪EIC中有至少一分裂波峰時,該方法至少更包含於步驟(d)之後,比較該去噪EIC中之波峰數目與該原始EIC中之波峰數目。
- 如請求項13所述之實體的處理器可讀取儲存媒體,其中當該去噪EIC中之波峰數目等於該原始EIC中之波峰數目時,於步驟(e)中強化該原始EIC之波峰強度。
- 如請求項13所述之實體的處理器可讀取儲存媒體,其中當該去噪EIC中之波峰數目異於該原始EIC中之波峰數目時,該方法更包含:利用一第二質荷比來重複步驟(a)至(d),以重新建立一去噪EIC,其中該第二質荷比大於該第一質荷比;其中於步驟(e)中強化該重新建立之去噪EIC的波峰強度。
- 一種用以由原始液相層析質譜資料萃取一樣本中一目標分子之離子信號的系統,至少包含:一液相層析模組;一質譜分析模組,與該液相層析模組通訊連接,其中該液相層析模組與該質譜分析模組用以由該樣本取得該液相層析質譜資料;一控制單元,與該液相層析模組及該質譜分析模組通訊連接,其中該控制單元至少包含至少一處理器與一記憶體,該記憶體用以儲存複數個指令,當該處理器執行該些指令時,使得該處理器執行如請求項1所述之方法。
- 如請求項16所述之系統,其中該滯留時間視窗(Tw)為約5至20秒、該質量誤差容忍值(δ)為約5至10ppm、 該強度誤差容忍值(θ)為約1至2且該SCC閾值(ε)為約0.5至1。
- 如請求項16所述之系統,其中該方法更包含一分裂波峰偵測步驟,以偵測該去噪EIC中至少一分裂波峰的存在,其中當該去噪EIC中沒有分裂波峰時,於步驟(e)中強化該去噪EIC之波峰強度。
- 如請求項16所述之系統,其中該方法更包含一分裂波峰偵測步驟,以偵測該去噪EIC中至少一分裂波峰的存在,其中當該去噪EIC中有至少一分裂波峰時,該方法至少更包含於步驟(d)之後,比較該去噪EIC中之波峰數目與該原始EIC中之波峰數目。
- 如請求項19所述之系統,其中當該去噪EIC中之波峰數目等於該原始EIC中之波峰數目時,於步驟(e)中強化該原始EIC之波峰強度。
- 如請求項19所述之系統,其中當該去噪EIC中之波峰數目異於該原始EIC中之波峰數目時,該方法更包含:利用一第二質荷比來重複步驟(a)至(d),以重新建立一去噪EIC,其中該第二質荷比大於該第一質荷比;其中於步驟(e)中強化該重新建立之去噪EIC的波峰強度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW102127707A TW201506401A (zh) | 2013-08-02 | 2013-08-02 | 由液相層析質譜資料中萃取離子信號之方法與系統 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW102127707A TW201506401A (zh) | 2013-08-02 | 2013-08-02 | 由液相層析質譜資料中萃取離子信號之方法與系統 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW201506401A true TW201506401A (zh) | 2015-02-16 |
Family
ID=53019333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102127707A TW201506401A (zh) | 2013-08-02 | 2013-08-02 | 由液相層析質譜資料中萃取離子信號之方法與系統 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TW201506401A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110392829A (zh) * | 2017-03-16 | 2019-10-29 | 百特基公司 | 质量导向分离 |
TWI770190B (zh) * | 2017-07-21 | 2022-07-11 | 日商日立高新技術科學股份有限公司 | 質量分析裝置以及質量分析方法 |
-
2013
- 2013-08-02 TW TW102127707A patent/TW201506401A/zh unknown
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110392829A (zh) * | 2017-03-16 | 2019-10-29 | 百特基公司 | 质量导向分离 |
TWI770190B (zh) * | 2017-07-21 | 2022-07-11 | 日商日立高新技術科學股份有限公司 | 質量分析裝置以及質量分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7538321B2 (en) | Method of identifying substances using mass spectrometry | |
US10658165B2 (en) | Isotopic pattern recognition | |
US6936814B2 (en) | Median filter for liquid chromatography-mass spectrometry data | |
CN109828068B (zh) | 质谱数据采集及分析方法 | |
JP5590156B2 (ja) | 質量分析方法及び装置 | |
JP4676955B2 (ja) | クロマトグラフィ/質量分析/質量分析装置における動的信号選択 | |
US7880135B2 (en) | Mass spectrometer | |
JP5997650B2 (ja) | 分析システム | |
US20060006326A1 (en) | A-priori biomarker knowledge based mass filtering for enhanced biomarker detection | |
US8653447B2 (en) | Chromatograph mass spectrometer | |
CA2825280A1 (en) | Background subtraction-mediated data-dependent acquisition | |
CN108982729B (zh) | 用于提取质量迹线的系统和方法 | |
JP4857000B2 (ja) | 質量分析システム | |
JP2005528606A (ja) | クロマトグラフィ/分光測定データの解析でデータビンニングを用いる方法 | |
Ho et al. | True ion pick (TIPick): a denoising and peak picking algorithm to extract ion signals from liquid chromatography/mass spectrometry data | |
CN113227778A (zh) | 色谱仪质量分析装置 | |
JP2008542767A (ja) | クロマトグラフィ/質量分析のデータ依存データ収集における動的なバックグラウンド信号の排除 | |
TW201506401A (zh) | 由液相層析質譜資料中萃取離子信號之方法與系統 | |
CN112014514B (zh) | 利用提升列表操作质谱仪 | |
JP7205322B2 (ja) | 血液抗凝固剤の一斉分析方法 | |
JP2007121134A (ja) | タンデム質量分析システム | |
CN108663437B (zh) | 一种快速筛查标的物的方法 | |
CN107703243A (zh) | 用于代谢组学的气相色谱‑质谱分析处理方法和系统 | |
Theodoridis et al. | LC‐MS‐Based Nontargeted Metabolomics | |
Nam et al. | Automated Screening and Filtering Scripts for GC× GC-TOFMS Metabolomics Data. Separations 2021, 8, 84 |