TW201224428A - A method computer program and system to analyze mass spectra - Google Patents

A method computer program and system to analyze mass spectra Download PDF

Info

Publication number
TW201224428A
TW201224428A TW100120337A TW100120337A TW201224428A TW 201224428 A TW201224428 A TW 201224428A TW 100120337 A TW100120337 A TW 100120337A TW 100120337 A TW100120337 A TW 100120337A TW 201224428 A TW201224428 A TW 201224428A
Authority
TW
Taiwan
Prior art keywords
peak
peaks
mass
ion
mass spectrum
Prior art date
Application number
TW100120337A
Other languages
English (en)
Other versions
TWI493168B (zh
Inventor
Marcello Vitaletti
Original Assignee
Ibm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibm filed Critical Ibm
Publication of TW201224428A publication Critical patent/TW201224428A/zh
Application granted granted Critical
Publication of TWI493168B publication Critical patent/TWI493168B/zh

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Description

201224428 六、發明說明: 【發明所屬之技術領域】 本發明一般係關於質譜分析,尤其是本發明提供分析 化學溶液的質譜之方法。 【先前技術】 質譜儀原理由將化學元素離子化,產生將測量質荷比 的帶電分子或分子片段(m〇lecuie fragments)所構成。例如 溶液内離子的質譜利用質荷比,提供離子的分佈。質譜圖 的X軸代表一個離子的質荷比,y軸則代表這些離子所提 供的信號強度。一個離子的質譜圖賦予該離子的峰值 量對電荷、強度)資訊。針對内含不同離子的化學溶液, 該質譜圖的每個峰值可指出溶液内對應離子存在。 不過,質譜圖包含大量峰值並且針對每一峰 測量的該質量與該強度有糾,就無法輕織出化溶 質譜中的離子。例如:可能需要利用建立回歸模型,預 溶液内可溶性物質的濃度,該溶㈣某些離子 = 知而明確的物質濃度函數。在線性情況下, 質濃度存在係數關係,這隨不同離子而變。為了 ^ 模型,必須先找出對應於溶液内不同物料度的不同= 中相同離子之峰㈣度。物質職至錢分㈣,^皙= 終究可輕㈣別料離子。獨在麵分子轉於二 情況:,由於水巾較大分子的解離作用,因此所產液 的質譜可能包括數百種離子。 玍,合液 -種識麟應至溶㈣不⑽f濃度的不同質譜之 201224428 ,二技術解決方案,該資訊對應至相同離子,使用已知的 負料分級技術(data binning technique)。該資料分級技術可 降低輕微測量誤差⑽彡響:在射,#餘圍應該涵 蓋在統厂大小(通常是一個質量單位)的未重疊間隔(箱子 ^内,並且每一峰值的強度累積到相應箱子内。不過,假 設me為要分析來建立回歸模型的所有溶液之離子質測^ 量伴隨的誤差’㈣於誤差%的㈣彡響可逐漸損害 方法,即: 吸 -使用大小差不多(或小於)nie的箱子,可能不同 内已知離子的峰值會累積在不同箱子内; °曰 -使用大於me的箱子時,一般會發生擁有類似 的二或多個離子之峰值會累積在相同箱子内。不過因^ 前的影響,這鏡子在物質濃度上具有完全不_線=^ =性’相同的箱子可累積來自跨越不同光譜的不同離子之 需要一種在質譜圖内,識別對應至用不同已4 物質濃度準備的溶液之間相同實體離子之峰值之方法。° 【發明内容】 本發明的目的在於定義-種用可信射式 至不同質譜内相同離子的峰值之方法。 子應 專利範圍第Μ,利用分析來自—組質 棺案的質#及所㈣值之強度座標,含誤差測量,使g 201224428 以達到該目的,該 :法:實體離子,的特定濃度之溶液 内一第一質譜資料檔 案料播案 利用 -質譜資料該第 近來自該第-質譜的該等讀標選擇接 產生該::戶:::::數限制該相同類型實體離子所 序,包括來自可較分數最高的蜂值順 質譜的以的該魏峰細及來自每一其他 比率,則儲存序分數順序的比率高於一限制 並執行該料的—其他峰值座標 自該質譜的所有該等峰值,每=,直到已經讀取來 譜的峰值,識別為由—_ 序包括每一質 之方物"咖項 -抑制該等已料麟之_細任何子集,其發現 201224428 包括一相同質譜的一相同峰值。 如申請專利範圍第3項,使用如申請專利範圍第1項 或第2項之方法也可達成該目的,其中兩峰值之間的該距 離函數以及該評分函數都取決於該等兩峰值的該質量與 強度。 如申請專利範圍第4項,使用如申請專利範圍第i項 或第2項之方法也可達成該目的,其中兩峰值之間的該距 離函數取決於該等峰值的該質量,並且該評分函數取決於 該等峰值的該質量與該峰值濃度_強度關聯性之組合。 /如申請專利範圍第5項,使用如申請專利範圍第i項 ίΐ ί項之方法也可達成該目的,其中對應離子識別該等 Ϊ順序的第1項方法之步驟,運用都取決於該等峰 二量與強度之一第一距離和一第一評分函數,在針 十-已知e丨農度的一第—質譜集合上執行; 該方法另包括: 他二該等前述步驟,該第-與其 驟,所===?濃度執行的該等前述步 得每一漢度的-_^㈣度峰值座標,並且獲 將如申%專觀圍第丨項之方法的料步驟套用至 201224428 該虛擬質譜的集合,每一虛擬質譜對應至一濃度,每一虛 擬質譜包括該等計算過的虛擬峰值系列,使用取決於該等 峰值質量與該峰值濃度-強度關聯性組合的兩峰值間之一 第二距離函數,該等結果順序為對應至該不同「虛擬質譜」 内一離子的該等峰值,每一「虛擬質譜」都對應至一溶液 濃度。 如申請專利範圍第6項,使用如申請專利範圍第5項 之方法也可達成該目的,其中兩具有座標A和乃的質譜 峰值與具有座標;c2和乃的質譜峰值尸2間之該第一距離 d函數為: =7(¾ - ^)2 +0¾ ^ R為與該座標和X座標相關聯的該等相關誤差間之 比率。 如申請專利範圍第7項,使用如申請專利範圍第5項 和第6項任一項之方法也可達成該目的,其中一順序的該 第一評分為: 1/max d(pl, p2) 其中pi、p2為該順序内任兩峰值,並且d(pl,p2)為 之間的距離。 如申請專利範圍第8項,使用如申請專利範圍第5項 至第7項任一項之方法也可達成該目的,其中兩具有座標 X;和少7的質譜峰值P;與具有座標;^和乃的質譜峰值尸2 間之該第二距離ί/函數為: 201224428 d(Pl,P2)=絕對值(X1-X2). 如申請專利範圍第9項,使用如申請專利範圍第5項 至第8項任一項之方法也可達成該目的,其中一順序的該 第二評分為: ~ correlation_coefficient (cl, yl, c2, y2, .... CN, yN)/max d(pl, p2) 其中pl、p2為該順序内任兩峰值,並且d(pl,p2>^ 之間的距離。 ’ ‘ 如申請專利範圍第10項,使用一種内含用於執行如 刖述申凊專利範圍任一項之方法的該等步驟的裝置之系 統,也可達成該目的。 >如申請專利範圍第11項,使用一種内含用於執行如 申明專利範圍第1項至第9項任一項之方法的該等步驟的 指令之電腦程式,該電腦程式在一電腦上執行時也可達 該目的。 將該提案的兩階段篩選處理之該第一卩皆段套 一質譜儀麟㈣料,可獲料些伽。㈣Μ 隸县f優點為該方法提供與該f量值測量相關聯之誤 以及與該篩選光譜内維持所有這些峰值的該 強度值測量相關聯之誤差指示。 題的芯”么量料峰值可提供朗量當t品質問 曰不換5之,就是該等測量條件未完美標準化 9 201224428 =因狀態不穩定之下測量的 ^進-步為優 化關於已知溶液成份到所測量光譜的模型之此簡 根據本發明的第二態樣, 處理的該第二階段㈣至已經段筛選 得許多優點。 第p白奴之資料,獲
㈣點為由該溶液内濃度遠離在不同濃度上測I 濃度線性函數之離子所產生的 S 自$選先谱中去除。如此簡化關於 =從 譜的線性模型之建造讀絲到所測量光 t優點為大量忽略峰值可提供料料内品質問題 的早批不(例如因為在不同溫度之下 =測量的樣本),或指出「已識別離子」濃度== 2。在第7情況下,更受控制的處理可獲子的 ,並且避免運用到不精準資料的風險。在第二下, 需要建構非線性資料模型’同時可避免f料運用當月中假設 錯誤之風險。 【實施方式】 圖1顯示在一個化學溶液樣本上測量的第一質譜,以 及來自相同溶液不同樣本所獲得的五種質譜(a、b、C、d、 201224428 E)=覺化之細節。第一圖表(1〇〇)為内含5_化學物質的 ’峰值質量257」並且強度超出質譜儀輸出所用 單位四周的離子之部分質譜圖。整個光譜内含大約 5〇〇個峰值。第二質谱⑽)為使用相同儀器重複測量相 同樣本所獲得,與相同峰值相關的值在質#值方面有〇·1% =振盪j在強度值方面有10%的振盪。在第二3D圖(110) ,表相同離子。問題是若質扑值)與強= ^差,如何識別對應至相同離子的不同樣本内之峰值。該 誤差對於兩離子質測量量的影響超出其「真實」質量間= 差異時,就不可能找出屬於相同離子不同光譜内的兩峰 ,。即使誤差相當小,在電腦程式内實施鼓的「識別」 處理還是需要超越接近質量值的具體歧視條件。 圖2例示其中實施較佳具體實施例方法的環境。圖2 顯示本發明的範疇。利用產生資料檔案(光譜21〇)的質譜 儀(200),分析具有變化已知化學物質漢度的溶液。光譜^ 括一系列峰值,峰值由質譜儀所測量的質荷比與信號強度 值(圖型代表内的峰值座標)所描述。 亦請注意,若該方法套用至只内含一種物質的溶液, 此方法將幫助決定不同物質濃度上溶液的峰值,這幫助有 助於決定特定濃度上溶液内物質存在的線性模型。 在較佳具體實施例内’利用電腦(220)上執行的程式處 理質譜資料檔案。又在較佳具體實施例内,離子識別方法 包括一識別處理引擎(240),套用在兩階段處理程式(23 内。該離子識剌擎在每-階段中套用不同的歧視條件。 11 201224428 在第m該離子識則擎套聽後關於圖*說明文 件内描述的質里·強度型近接條件。該第—階段採用質譜 儀所產生的質譜檔案(21G)當成輸人並產生離子表(T1),一 列代表不同光譜内對應至―個離子的峰值。階段丨内處理 的質5酱為對應至内含特定化學物質濃度的溶液上所完成 的測量樣本集合之㈣,套用至—個樣本集合的該輸出為 -個離子表(Τ1)。針對對應至化學物質Ν個不同濃度的Ν 個質譜,合,重複操作。階段丨的輸出造成⑽離子表(τι 250) ’每個樣本集合—個,每—個都對應至溶液濃度。 在第二階段中,執行該離子識別引擎一次。針對峰值 識別’套用為經組合之質量近接與濃度強度關聯性條件 的歧視條件,如稍後關於圖4說明文件内之描述。該第二 階段使用階段丨建立雜子表當成輸人,轉換成「虛擬質 4」並且輸出一個已識別的離子表(T2 26〇)。輸出離子表 ^2提供用於溶液内已識別的每一離子,在每一列中,為 每一濃度的一系列峰值座標之參考。 在較佳具體實施例内,本發明實施為電腦程式產σ 其從電腦可錢或電腦可讀取_存取,提供電腦或:何 指令執行线所個或連接的程式碼^注意, ^ 採用整個硬體具體實施例、整個軟體具體實施例 = 體與軟體元件的具體實關之形式。在_具體實= :體本内實施,這包含但不受限於勒體, 圖3為根據較佳具體實施例可運用不同識別 子識別方法流程圖。該流程圖說明該離子識別方法,的離 / ,該方 12 201224428 法允許識別從溶液所獲得,對 離子類型的峰值,其中—個於不同光譜内相同 個物質存在於不同濃度中。 為了例示該離子識別方法,太 入。如此簡化該方法步驟的理解,:: 階段2内,輸人並非直接是質错而是丨=在 其轉換成「虛擬質譜广事實上,誃 識別表丁1 ’ 參照至對應已經用來當成輸入的;列 獲得「虛擬質譜」。 #值座‘的平均,以 在第一步驟(300)内,已經存取所有 f譜提供其x座標代表質荷比(以後稱為質 2號的強度(以後稱為強度)的峰值。所有質;|都對;至 量ίΓ容ΓΓί液内特定化學物質濃度的相同溶狀測 本’此物質需要經過分析。Μ光譜具有從i至Μ的 該質譜存取襄置,内含峰值座標的該等質議資料槽案 讀取’並且較佳儲存在記憶體内當成資料結構: <說明書内關於圖5的說明,來插述這種該離子識 別引f所用資料結構的—個範例。每-質譜都建立-個^ 格。每一表格列都可儲存該質譜峰值的座標。 二*在步驟305内,在一個M質譜上讀取一個峰值。其 中讀取一個峰值的一個質譜内含N1的峰值,編號從i至 N卜二並且開始所有這些峰值的反覆(請參閱稍後流程圖内 的測試360)。採用該讀取峰值,做為對應至剩餘光譜中峰 13 201224428 = 基礎。根據下列處理,分析代表此第-光 閱稍後流剩餘光譜的内部反覆(請參 中最^二^之間的適當「距離」函數,找出目前光譜 限制至悬^ 乂驟3G5⑽選峰值的特定數量峰值。利用 限數量二=距離d的距離’選擇至少—個峰值以及有 3 搜未發現峰值的預定距 b 不過明,主意,「距離」函數的選擇係 詈_、斤1^ π質量·強度型近接的條件以及階段2内的質 細描述該、^本㈣4的說明中更詳 ^用_所有光譜(執行測試㈣當中答案為否的迴 從2’ 來自該第—光譜的目前峰值以及該光譜内發現 順库^^料值’建錢躲峰值的财可能候選 序的總數等於n2Xn3XxnM的乘積,其中 卬為扣數「丨」的光譜内候選峰值之數量,並且m 順^内峰值的數量。在步驟335内,將適當評分函數套用 至^一频序,以計算-評分值。該函數必須經過選擇 =有峰值全都是相同離子類型表示的順序應獲得高 国汗分函數的選擇取決於所選之料識職件,猶後 於圖4說明文件内會更詳細描述該評分函數。 在下:步驟⑽)中’前述步_建立的順序依照步驟 内计算之對應分數值分類,最高分數對應至分類 清早内的第一位置。 々 201224428 在下一步驟(345)中,依照每一順序内第一分數與第二 分數間之比率,計算「比率」變數。步驟335内使用的評 分函數產生顯者尚於個體的比率變數值,以指出已經從競 爭當中產生單一順序獲勝者。步驟350内將計算出來的比 率值與預定門檻(限制比率)比較’低於門檻之值表示沒有 明顯的順序獲勝者,這意味不可能識別目前的離子。保留 具有最南为數值並且比率變數等於或大於限制比率的順 序,用於步驟305内讀取的此峰值。 一軌跡保留(357)該有效獲勝者順序(若有的話)的每 一順序成員之(X質量、Y強度)值,該順序的每一成員都 為每一光譜内的一個峰值,所有峰值都對應至相同離子。 此資訊保存在離子識別表(T1,T2)内,如猶後本說明書内 關於圖5或圖6的說明所描述。 菪一 的相同―^光it 試算法時(測 有峰值可姑且考慮_=勝麵序的—個光譜内所 該等結果卿,執行全r,子產生。利賴驗峰值的 值出現在每檢查_。只有若每-峰 是特定離子類型的矣-母一順序内峰值的結果順序才 值的順序。_可關^ Ξΐ/略具有共同—或多個峰 貝枓’以較高信賴度使用剩餘 201224428 的順序。事實上,每一順序的特徵在於儀器對於特定(不 過未知)離子類型存在的反應。在流程圖執行結尾上,該 最終離子識別表只含經由全體一致性檢查確認過的峰^ 順序之參照。不過,該全體一致性步驟為選擇性因 述步驟選擇的所有順序可能造成正確結果。 ⑴ 圖4為根據較佳具體實施例套用圖3的方法,識別對 至不同已知物質濃度的質譜内相同離子之方法的一般 流程圖。在此流程圖中,圖3中離子識別處理的兩互補^ 施連接於兩階段管路中。該管路的第-階段用來當成利用 ί Ϊ儀測量具有不同濃度的溶液所產生光譜之輸入系列 >、s該笞路的第二階段將該第一階段輸出的資料當成給 每—離子產生最錄ώ,就是每—濃度的峰值 在階段1 (400)内,該離子識別處理套用至從溶 === 的㈣)不同位準上内含相同〜: 針對濃度的母_位準,_在㈣樣本上重福 次,或利用採用Μ個同等樣本的測量,獲得 ^對-個溶液料所測量的每—樣本f 運用質量_強度型近接條件,識別具有—或多= t相同(已知或未知)濃度的溶液光譜間之離子。運= =„應光譜的M個峰值依據適當距離函數, 二1兩峰值的XM座標,q分m ^ 子濃度(y)測量的相對誤差之不同大小,= 近」時’則可稱其為「由相同離子產生」二 又的輸出包括每-已識別離子中以及每一濃度位準中, 16 201224428 Μ個峰值的順序。離子識別表T1為維持圖3中離子識別 方法資訊結果的方式之一個範例,稍後說明於本說明書中 與圖5相關之說明内。 根據質量-強度型近接條件,選擇分別在階段1内執 行的識別處理之步驟315和步驟335所使用的距離函數與 評分,數:兩「點」(峰值)之間任意「距離」函數d(pi,pj) 必須疋在i = j時d(pi,ρ」·)消失,否則總是為正值。與每一 峰值相關聯為兩座標(X和力代表離子質量 信 (y)二因此在原理上可根據兩峰值的x*y座標\、讓距離函 數採用二維空間内的標準歐氏距離。不過,這不適合無關 聯性的情况’因為並不負責關聯於—點(峰值)的X斑y座 標之不同比例與精準度。來自普通儀器的質譜試驗顯示質 量(X座標)值用大約〇.1%的相對誤差所決定,而強度(y座 標)用=跳的相對誤差所決定,因為高出兩個數量級。 將R =義為_於7座標與χ座標的相對誤差間之比率, 所ΓΐΓ函數如下’Xi、yi鱗值ρι的座標,並且 x2、y2為峰值p2的座標: 在峰值的每一「候選順皮 步驟335内評分值的計算:兮執:該離子識別處理 序内峰值集合的函數該評分函數為該候選順 的倒數。該評分函數為 1/max d(pl,p2) 兩相隔最遠的峰值之轉函二’此函數只是該順序内 一·〜m' 一 離函數(區塊315内所使用的函數) 其中pi和P2為該顺序内任兩個峰值。 201224428 因此’「彼此最罪近」為順序内的峰值,較高者為指 派給該順序的餅分值。發現上祕離函數與評分函數的 組合足夠用於階段1内執行的該離子識別處理,在此所有 光譜都取自於具有相同已知物f濃度的樣本。 圖4的流程圖程序繼續階段2(柳),其輸人為階段( 内建立的該離子識別表(例如τι)。 次該等離子識別表内含的資料等同於已經提過的質譜 對應至階段1内「已識別」離子的每—峰值順序都 ,擬」峰值有效取代,該虛擬峰值的質量與強度利用 2该順序所獲得。在階段2内,如圖3所例示流程圖所 田述該離子識別方法的處理套用(415)至這些虛擬峰值。其 =的在於「識別」相同離子產生的虛擬峰值,通過從具有 =物質濃度位準的樣本測量之光譜。運餘合的質量-,與濃度強度_性條件,識別—已知物f的L種不 二庠iff之溶液光譜間之離子。運用此方法,L峰值的 相同離子」’若最大化「最佳測量」來加權 γ X」與質量之乘積,與通過峰值的濃度C值與強度 值,_「線性襲性強度」。定義該距離與評分函數 二階段2的該離子識別條件列人考量。這些距離與評 c用途為㈣出該物^農度與該等強度值之間,未 離Iί ^線性關聯性的峰_序。階段2的輸出提供相同 同的b虛擬峰值」順序,每一「虛擬峰值」都對應至不 不屬^1準°如此’可#由多種應用運用從該f譜儀· 的模型H <中取得的資訊,目標在於建立該質譜 其中在許多選取峰值(通道)上觀察到的強度為一 201224428 或多個物質濃度之線性函數。離子識別表T2為維持圖3 中離子識別方法資訊結果的方式之一個範例,稍後說明於 本說明書中與圖6相關之說明内。 八根據組合的質量-近接與濃度-強度關聯性條件,選擇 刀別在階段2内執行的識別處理之步驟315和步驟335所 使用的距離函數與評分函數。在階段2内,無法預期相同 離子產生的峰值展現出通過光譜的類似強度值,因為在不 同物質遭度上會採用後者。因此,階段2内使用的該距離 函數只取決於峰值的X座標(離子質量): d(Pi,Ρ2) = abs h - χ2) ’其中abs()為絕對值函數。 在峰值的每一「候選順序」上,執行該離子識別處理 區塊335内評分值的計算。因此,該評分函數為該候選順 序内峰值集合的函數。在階段2内,原則上距離函數可採 用統計關聯性係數。想法為高關聯性係數(接近個體)只來 自於對應至相同實體離子的峰值(並展現出與物質濃度的 線性回應)。不過,使用真實資料所進行的實驗顯示,在 此情況下,最高評分順序上評分值之間的比率(等於關聯 性係數)通常非常接近個體,如此不可能決定清楚的「獲 勝者」。更適合的評分函數也應該將順序内所有峰值的質 量值近接性列入考慮。因此,建議的評分函數為兩項的乘 積。第一項為從順序峰值計算的關聯性係數,其中物質濃 度為獨立變數’並且峰值強度為相依變數。第二項為—順 序内兩相隔最遠的峰值之距離函數(區塊315内所使用的 函數)的倒數。 該評分函數為: 201224428 correlation_coefficient (cl,yl,c2, y2,.…cn,yN)/功αχ d(pl,p2),其中ph P2為順序内任兩峰值,並且d 為之間的距離。 ,Ρ2) 發現上面距離函數與評分函數的組合足夠用於階段2 内執行的該離子識別處理,在此所有光譜都取自於具有 同已知物質濃度的樣本。 圖5顯示輸入圖3 —般流程圖中階段1的資料結構, 以及根據較佳具體實施例輸出的階段1之資料結構。尤其 是如圖5内所描述的輸出表,為一種呈現階段丨運用根才康 質量-強度型近接條件的距離與評分函數之離子識別方 結果的方式。 針對該溶液樣本内物質的已知濃度,輸入(5〇〇)來自Μ 光谱’利用重複測量Μ次或利用將測量套用至Μ個一敢 樣本所獲得。電腦從資料檔案讀取的每一光譜資料都可以 表格=式儲存在記憶體内,該表格具有兩欄(X和Υ),其 中在每一列上,離子質量測量在χ欄内,並且對應的 強度在Υ欄内。 更 ——輸出(6G>G)可由Μ攔的表格(Τ1)呈現,每_輸出針對 2 ’則量光譜’並且列數等於階段i結尾上識別的離子。 光含對Γ峰值的指標器(515) ’假^由M個輪入 對:至離子所產生。每一列都内含 分比率獲得最S分Ϊ順柄指制,其以可接受的評 201224428 例如.列編號27 (27為表格内一個列指數值)在輸出 表内標示灰色背景’内含編號503、506、5〇2、5〇4、5〇4, 賦予已識別離子的輸入光譜内之位置。這表示 •第一輸入光譜的列503上之峰值, •第二輸入光譜的列506上之峰值, •等等 ^經由階段1處理「識別」,因此可安全假設已經由相同 貫體離子產生這些峰值。 、採用對應至輸出表中已知列的質量(X)與強度(Y)之Μ 值平均與展開,如此評估影響這些量級測量的誤差大小。 利用定義質量與強度值為該等Μ「已識別」峰值上對 應值的平均之「虛擬峰值」,可減少關聯於上述輸出表内 已知列的負訊。或者是,吾人可考慮每一列中質量與強度 =最小與最大值,如此制f量關隔[UK]以及 判用運㈣度的間隔[ymin,ymax]蚊義「虛擬峰值」。 :2寺別使用圖4内所描述套用的離子識別方法,允許使 ,結果建立線性模型,將已知溶液的成份關聯於所測 量光譜。在此情況下,階段1輸入為針對一個溶液所測量 的質譜,該溶液只包括具有不同已知濃度的單一物質。如 此,該離子識別表(T1 510)内含使用已知濃度的每一質譜 中其參考X、Y峰值所識別之離子。 針對每一溶液濃度建立這種離子識別表(T1,5〇〇),以 獲得質譜的集合。 21 201224428 圖ό顯示輸入圖4 —般流程圖中階段2的資料結構, 以及根據較佳具體實施例輸出的階段2之資料結構。如上 述’在用圖4流程圖所描述的方法中’所使用的階段2輸 入並非質譜,而是從離子識別表T1的輸出(當成階段i的 輸出所獲得)所產生之質譜同等資料。階段2的輸入由N 個表格(600)構成,階段1處理的每一輸出都套用至相同物 質的不同(已知)濃度。該等輸入表中每一列都可關聯於具 備已評估質量、強度與誤差的「虛擬」峰值,這些輸入可 在階段2内由離子識別方法處理成同等輸入資料(5〇〇),其 為圖1表格的輸入質譜。 ' 輸出可由具有N攔的表格(610)構成,每一輸出針對 物質的每一濃度,並且列數等於階段2結尾上識別的離 子。每一列都包含指標器:攔内關聯於已知濃度的指標器 (615)參照至該濃度的輸入表内一列。因此,階段2結尾上 產生的輸出表,允許將這些「虛擬」峰值稱為全都關聯於 相同實體離子。 【圖式簡單說明】 圖1顯示在一個化學溶液樣本上測量的第一質譜,以 及來自相同溶液不同樣本所獲得的五種質譜(a、b、c9、d、 E)視覺化之細節; 圖2例示其中實施較佳具體實施例方法的環境; 圖3為根據較佳具體實施例可運用不同識別條件 子識別方法流程圖; 圖4為根據較佳具體實施例套用圖3的方法,識別對 應至不同已知物質濃度的質譜内相同離子之方法的一般 22 201224428 流程圖; 圖5顯示輸入圖4 一般流程圖中階段1的資料結構, 以及根據較佳具體實施例輸出的階段1之資料結構; 圖6顯不輸入圖4 一般流程圖中階段2的資料結構’ 以及根據較佳具體實施例輸出的階段2之資料結構。 【主要元件符號說明】 100 第一圖表 110 第二質譜 115 峰值 200 質譜儀 210 光譜 220 電腦 230 兩階段處理程式 240 識別處理引擎 250 離子表 260 離子表 300-365 步驟 400 階段1 405 處理 410 階段2 415 套用 500 輸入 510 離子識別表 515 指標器 600 輸出 23 201224428 610 615 表格 指標器 24

Claims (1)

  1. 201224428 七、申請專利範圍: 1. 一種在一電腦上執行以識別包含至少一物質的一特定農 =液内,不同實體離子所產生峰值之方法質:方二 =自:質譜資料檔案集合的質量及所有峰值之強度座標,含 誤差測I’該方法包括: -讀取來自該組質譜資料檔案内一第一質譜資 峰值座標; 利科算—雜函數關兩峰朗之近接,從該第一質 檔案以外的每-該質譜資料檔案#中,選擇接近來自該 第質谱的該讀取峰值座標之峰值座標; 利用汁舁一分數函數限制該相同類型實體離子所產生該 内所有峰值的該可紐,決定分數最高的峰侧序,包括 來自該第—質譜職讀取峰值以及來自每—其他質譜的一選 取峰值; ' 只有若最尚分數/次高分數順序的比率高於一限劍比 率,則儲存該最高分數順序;及 =取來自該第-質譜資料難的—其他峰值座標並執行 =則述麵、決定與儲存步驟,直到已_取來自該質譜的 該等峰值,每,等結果順序包括每―質譜的峰值,識別 馬由一相同實體離子所產生。 2.如申請專利範圍第1項之方法,另包括: 其發現包括一 -抑制該已儲存順序之間順序的任何子集 相同質譜的一相同峰值。 3.如申請專利範圍第1項或第2項之方法,其中兩锋值之間 25 201224428 質量 錢叹雖分函_取決於該等兩峰值的該 4. 如申請專利範圍第1項或第 的該距離函數取決於該等峰值㈣質量^日^兩♦值之間 於該等峰值的嶋無峰喻韻卿2數取決 5. 如申請專利範圍第1項或第2 別該等結果峰值順序的第,=法’其中對應離子識 該方法另s第一質譜集合上執行; 譜集合重複該等前述步驟’該第-與其他質 產生自於針對每—溶液濃度執行的該等前述步驟,所 擬質:4:1 請,,第1項之方法的該等步驟套用至該虛 ^ **、虛擬峰值系列,使用取決於該等峰值質詈盥麻 函與該峰值濃度·強度關聯性組合的—第二評分 不同二距離純’該等結果順序為對應至該 對應至-溶液;ii子的該等峰值,每—「虛擬質譜」都 yi 6·如申請專利範圍第5項之方法,其中兩具有座^和 26 201224428 的質譜峰值Λ與具有座標a和少2的 離J函數為: 質譜峰值巧間之該第一距 R為與該y座標和續標相關聯的該等相關誤差間之該比 7.如申請專利範圍第5項或第6項任 序的該第一評分為: 1/max d(pl, p2) 一項之方法,其中一順 其中Pi、p2為該順序内任兩峰值 的該距離。 ’並且d(pl,p2)為之間 8.如申請專利範圍第5項至第7項任一項之方法,其中兩且有座標A和乃的質譜峰值與具有座標々和乃的質譜峰值 尸2間之該第二距離ί/函數為: d(Pi,Ρ2)=絕對值(Χι-Χ2)。 9.如申請專利範圍第5項至第8項任一項之方法,其中一順 序的該第二評分為: correlation^coefficient (cl, yl 〇2, y2>.. cN> yN)/max ^該^P1、P2為該順序内任兩峰值,並且佩⑻為之間 10. -種内含用於執行如前述 該等步驟的裝置之系統。 利範圍任一項之方法的 27 201224428 11. 一種内含用於執行如申請專利範圍第1項至第9項任一項 之方法的該等步驟的指令之電腦程式,該電腦程式在一電腦上 執行時也可達成該目的。 28
TW100120337A 2010-06-10 2011-06-10 分析質譜的方法、電腦程式及系統 TWI493168B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP10165533 2010-06-10

Publications (2)

Publication Number Publication Date
TW201224428A true TW201224428A (en) 2012-06-16
TWI493168B TWI493168B (zh) 2015-07-21

Family

ID=44582885

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100120337A TWI493168B (zh) 2010-06-10 2011-06-10 分析質譜的方法、電腦程式及系統

Country Status (6)

Country Link
US (2) US9773090B2 (zh)
EP (1) EP2580772B1 (zh)
JP (1) JP5719433B2 (zh)
CN (1) CN102906851B (zh)
TW (1) TWI493168B (zh)
WO (1) WO2011154219A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10859552B2 (en) 2017-06-20 2020-12-08 The Hong Kong Polytechnic University Edible oil analysis system and method

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5719433B2 (ja) 2010-06-10 2015-05-20 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 質量スペクトルを分析するための方法、コンピュータ・プログラム、およびシステム
US9666421B2 (en) * 2013-12-26 2017-05-30 Shimadzu Corporation Mass spectrometry data display device and mass spectrometry data display program
KR20230119729A (ko) * 2016-10-25 2023-08-16 리제너론 파아마슈티컬스, 인크. 크로마토그래피 데이터 분석을 위한 방법 및 시스템
JPWO2022270289A1 (zh) * 2021-06-24 2022-12-29

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62124456A (ja) 1985-11-26 1987-06-05 Jeol Ltd 質量分析デ−タのオ−トキヤリブレ−シヨン・システム
US5072115A (en) 1990-12-14 1991-12-10 Finnigan Corporation Interpretation of mass spectra of multiply charged ions of mixtures
US5440388A (en) 1993-08-02 1995-08-08 Erickson; Jon W. Chemical analysis and imaging by discrete fourier transform spectroscopy
US8188011B1 (en) 2000-02-08 2012-05-29 Isis Pharmaceuticals, Inc. Optimization of ligand affinity for RNA targets using mass spectrometry
US6996472B2 (en) 2000-10-10 2006-02-07 The United States Of America As Represented By The Department Of Health And Human Services Drift compensation method for fingerprint spectra
GB0031566D0 (en) * 2000-12-22 2001-02-07 Mets Ometrix Methods for spectral analysis and their applications
WO2003006678A2 (en) * 2001-07-13 2003-01-23 Syngenta Participations Ag System and method for storing mass spectrometry data
AU2002348060A1 (en) 2001-10-26 2003-05-12 Phytoceutica, Inc. Matrix methods for analyzing properties of botanical samples
CA2521034A1 (en) * 2003-04-02 2004-10-21 Merck & Co., Inc. Mass spectrometry data analysis techniques
GB0308278D0 (en) 2003-04-10 2003-05-14 Micromass Ltd Mass spectrometer
EP1623352B1 (en) 2003-04-28 2011-09-28 Cerno Bioscience LLC Computational methods and systems for multidimensional analysis
US20050255606A1 (en) * 2004-05-13 2005-11-17 Biospect, Inc., A California Corporation Methods for accurate component intensity extraction from separations-mass spectrometry data
US7473892B2 (en) * 2003-08-13 2009-01-06 Hitachi High-Technologies Corporation Mass spectrometer system
JP4191094B2 (ja) * 2004-06-08 2008-12-03 株式会社山武 マススペクトル解析装置、マススペクトル解析方法及びマススペクトル解析プログラム
US7735146B2 (en) * 2005-01-27 2010-06-08 The George Washington University Protein microscope
JP4569349B2 (ja) 2005-03-29 2010-10-27 株式会社島津製作所 飛行時間型質量分析装置
TWI334027B (en) * 2007-04-30 2010-12-01 Univ Nat Sun Yat Sen Mass spectrometric analysis for detecting analytes in a solid-state sample
JP5078456B2 (ja) * 2007-06-19 2012-11-21 キヤノン株式会社 質量分析用基板、質量分析方法および質量分析装置
US8073635B2 (en) 2008-02-15 2011-12-06 Dh Technologies Development Pte. Ltd. Method of quantitation by mass spectrometry
JP5719433B2 (ja) 2010-06-10 2015-05-20 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 質量スペクトルを分析するための方法、コンピュータ・プログラム、およびシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10859552B2 (en) 2017-06-20 2020-12-08 The Hong Kong Polytechnic University Edible oil analysis system and method

Also Published As

Publication number Publication date
CN102906851B (zh) 2015-09-16
JP5719433B2 (ja) 2015-05-20
US9773090B2 (en) 2017-09-26
US20130073219A1 (en) 2013-03-21
EP2580772B1 (en) 2015-03-11
WO2011154219A3 (en) 2012-03-08
JP2013528287A (ja) 2013-07-08
TWI493168B (zh) 2015-07-21
US20140052385A1 (en) 2014-02-20
EP2580772A2 (en) 2013-04-17
CN102906851A (zh) 2013-01-30
WO2011154219A2 (en) 2011-12-15
US9400868B2 (en) 2016-07-26

Similar Documents

Publication Publication Date Title
Letertre et al. Combined nuclear magnetic resonance spectroscopy and mass spectrometry approaches for metabolomics
Boccard et al. Harnessing the complexity of metabolomic data with chemometrics
JP6089345B2 (ja) 時および/または空間系列ファイルの多成分回帰/多成分分析
Vaudel et al. Peptide and protein quantification: a map of the minefield
Finck et al. Normalization of mass cytometry data with bead standards
Euceda et al. Preprocessing of NMR metabolomics data
Smith et al. Analysis of time-correlated single photon counting data: a comparative evaluation of deterministic and probabilistic approaches
CN107505346B (zh) 预测流体类别样本中特别是生物流体样本中nmr自旋系统的化学位移值的方法
JP2009530648A (ja) サンプル内の個々の要素を識別及び定量化するために分光測定データを分析するシステム、方法及びコンピュータプログラム製品
TW201224428A (en) A method computer program and system to analyze mass spectra
JP5945365B2 (ja) Nmrスペクトルから物質を同定するための方法
Purvine et al. Spectral quality assessment for high-throughput tandem mass spectrometry proteomics
Karaman et al. Sparse multi-block PLSR for biomarker discovery when integrating data from LC–MS and NMR metabolomics
Wang et al. Sodium abundances of AGB and RGB stars in Galactic globular clusters-II. Analysis and results of NGC 104, NGC 6121, and NGC 6809
JPWO2018134952A1 (ja) 分析データ解析方法および分析データ解析装置
Schwager et al. CCREPE: compositionality corrected by permutation and renormalization
Smirnov et al. Mass difference maps and their application for the recalibration of mass spectrometric data in nontargeted metabolomics
Gao et al. Deep representation features from DreamDIAXMBD improve the analysis of data-independent acquisition proteomics
WO2012132169A1 (ja) リスクプロファイル生成装置
CORNER The isber biorepository proficiency testing program: two successful years already, and new features to come
Stringer et al. An ergodic measure for Diffusion Monte Carlo ground state wavefunctions: Application to a hydrogen cluster with an isotopic impurity
Powell et al. The relationship between substructure in 2D X-ray surface brightness images and weak-lensing mass maps of galaxy clusters: a simulation study
US20230138086A1 (en) Data analysis system and computer program
Browning et al. Managing missing measurements in small-molecule screens
Skakun et al. Initial guesses generation for fluorescence intensity distribution analysis