JP2023518353A - 質量分析応答曲線における少なくとも1つのピークを識別するためのコンピュータによって実行される方法 - Google Patents

質量分析応答曲線における少なくとも1つのピークを識別するためのコンピュータによって実行される方法 Download PDF

Info

Publication number
JP2023518353A
JP2023518353A JP2022550921A JP2022550921A JP2023518353A JP 2023518353 A JP2023518353 A JP 2023518353A JP 2022550921 A JP2022550921 A JP 2022550921A JP 2022550921 A JP2022550921 A JP 2022550921A JP 2023518353 A JP2023518353 A JP 2023518353A
Authority
JP
Japan
Prior art keywords
peak
mass spectrometry
response curve
computer
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022550921A
Other languages
English (en)
Inventor
ルサコフ,ダニエル
ギュッター,クリストフ
タラソフ,キリル
ライヒェルト,アンドレアス
ベヌゴパル,ラガバン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of JP2023518353A publication Critical patent/JP2023518353A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8644Data segmentation, e.g. time windows
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8693Models, e.g. prediction of retention times, method development and validation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Neurology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

質量分析応答曲線における少なくとも1つのピークを識別するためのコンピュータによって実行される方法(110)が提案される。本方法は、以下のステップ、すなわち、a)少なくとも1つの質量分析装置(114)を使用することによって少なくとも1つの質量分析応答曲線を提供するステップ(112)、およびb)少なくとも1つの訓練済みモデルを使用することによって質量分析応答曲線を評価することにより、質量分析応答曲線の少なくとも1つのピークの始点および終点を識別するステップ(116)を含み、モデルは、深層学習回帰アーキテクチャ(118)を使用して訓練されている。【選択図】図1

Description

本発明は、質量分析応答曲線の少なくとも1つのピークを識別するためのコンピュータによって実行される方法およびサンプル中の少なくとも1つの被分析物を監視するための装置に関する。本提案の方法および装置は、質量分析の技術分野において、とりわけ液体クロマトグラフィ-質量分析に使用することが可能である。
現在の液体クロマトグラフィ-質量分析(LC-MS)データ処理においては、通常は、取得したすべてのデータについて手作業でデータをレビューし、次いで高いエラー率ゆえに結果のうちの約5~20%を手作業で訂正する必要がある。これは、何百ものクロマトグラフィプロットの退屈な視覚分析を通じて、訓練されたLC-MSオペレータによって行われる。
さらに、スペクトルのスペクトルピークを識別および特性評価するための自動的な方法が知られている。
国際公開第2012/047417号パンフレットおよび米国特許第8,428,889号明細書が、分析機器によって生成されたスペクトルのスペクトルピークを自動的に識別および特性評価する方法であって、分析機器によって生成されたスペクトルを受信するステップと、スペクトルからベースラインを自動的に減算して、ベースライン補正されたスペクトルを生成するステップと、ベースライン補正されたスペクトルのスペクトルピークを自動的に検出および特性評価するステップと、検出および特性評価されたスペクトルピークをユーザに報告するステップと、を含む方法を記載している。ユーザからの検出および特性評価のステップに対して行われるべき調整のリストが受信される。検出および特性評価のステップにおいて使用される出口値が、調整のリストに基づいて調整される。スペクトルピークの自動検出および特性評価が、同じスペクトルまたは異なる1つ以上のスペクトルにおいて繰り返される。
米国特許第7,219,038号明細書が、分光分析データにおける分析およびピーク識別のためのプロトコルを記載している。ベイズ法が、データセット内のピークを自動的に識別するために使用される。ピーク形状を識別した後に、この方法は、所与の数のピークが任意の所与のデータウィンドウ内で発見されるという仮説を検査する。所与のウィンドウ内でピークが識別された場合、ピーク位置および振幅を推定するために尤度関数が最大化される。
米国特許第7,720,612号明細書が、ピーク分解能値を使用してクロマトグラム内の入り組んだピークを1つ以上の成分ピークに分解するための方法を記載している。この発明のピーク方法は、データ中の「明確に定義」され、あるいは「分離した」ピークの経験的ピーク分解能値を決定し、次いで、これらの経験的分解能値を隣接領域のピークに外挿して、所与のピーク位置における成分ピークの数を予測する。予測されたピーク分解能値が、低分解能または入り組んだピークの観測されたピーク分解能値と比較され、入り組んだピークにおける成分ピークの数が決定される。
国際公開第2019/092836号パンフレットが、学習済みモデル記憶部に、正確なピーク情報および多数のクロマトグラムを撮像することによって得られた画像を学習データとして使用して深層学習を実行することによって構築されたモデルを、予め記憶することを記載している。LC測定部によって得られた目的の試料についてのクロマトグラムデータが入力されると、画像生成部がクロマトグラムを撮像し、得られた画像においてクロマトグラム曲線の両側の2つの領域のうちの一方が塗りつぶされた入力画像を生成する。ピーク位置推定部が、学習済みモデルを使用して入力画像のピクセル値をニューラルネットワークに入力し、ピークの始点および終点についての位置情報ならびにピーク検出精度を出力として取得する。ピーク決定部が、ピーク検出精度に基づいてピークの始点および終点を決定する。
欧州特許出願公開第3 467 493号明細書が、測定前に、入力部を介して測定終了条件として、分析者がピーク検出対象のクロマトグラム(特定波長または全波長にわたるクロマトグラム)を選択し、ピーク数の判定値を指定することを記載している。測定部による測定の実行時に、クロマトグラム生成部が、収集されたデータに基づいてクロマトグラムをほぼリアルタイムで生成し、ピーク検出部が、クロマトグラム上のピークを検出する。測定終了条件判定部が、検出されたピークの数をカウントし、カウントされた数がピーク数の判定値に達したときに測定終了条件が満たされたと判定し、測定終了タイミング判定部が、判定から所定の時間が経過したときに、分析制御部に対して測定を終了するように指示する。
Risum Anne Bechらの“Using deep learning to evaluate peaks in chromatographic data”,TALANTA,ELSEVIER,Amsterdam,NL,vol.204,22 May 2019,pages 255-260,XP085747637,ISSN:0039-9140,DOI:10.1016/J.TALANTA.2019.05.053が、非対象のガス-クロマトグラフィデータの分析に時間がかかり、データ分析の専門知識を必要とするいくつかの手作業によるステップが分析に依然として存在することを記載している。これらのうちの1つは、分解された各成分が積分に適したピークを表すか否かを定義する必要があることである。ピークは、形状および溶出時間軸上の位置の両方において変化し得るため、これは、PLS-DA(判別分析のための部分的最小二乗回帰)などの線形分類器の適用によっては容易に解決することができない問題を呈する。これらのシフトおよび形状の変化を処理するための畳み込みニューラルネットワーク分類器が説明されている。
既知の方法および装置の利点にもかかわらず、これらの既知の方法および装置は、ピークが存在するか否かの情報をもたらすにすぎない。しかし、ピークの下方の面積の確実な決定は保証されない。
したがって、質量分析応答曲線の少なくとも1つのピークを識別するためのコンピュータによって実行される方法およびサンプル中の少なくとも1つの被分析物を監視するための装置であって、上述の技術的課題に対処する方法および装置を提供することが望ましい。具体的には、質量分析応答曲線の少なくとも1つのピークを識別するための方法およびサンプル中の少なくとも1つの被分析物を監視するための装置であって、クロマトグラムにおける被分析物ピークのピーク面積の確実かつ自動的な決定を可能にする方法および装置が提供されるべきである。
この課題は、質量分析応答曲線の少なくとも1つのピークを識別するためのコンピュータによって実行される方法およびサンプル中の少なくとも1つの被分析物を監視するための装置であって、独立請求項の特徴を有する方法および装置によって対処される。単独の様相で実現されても、任意の組み合わせにて実現されてもよい有利な実施形態が、従属請求項に挙げられる。
以下で使用されるとき、用語「・・・を有する」、「・・・を備える」、または「・・・を含む」、あるいはこれらの任意の文法的変種は、非排他的なやり方で使用される。したがって、これらの用語は、この文脈において説明されるエンティティの中に、これらの用語によって導入される特徴の他にはさらなる特徴が存在しない状況、および1つ以上のさらなる特徴が存在する状況の両方を指すことができる。例として、「AはBを有する」、「AはBを備える」、および「AはBを含む」という表現は、AにB以外の他の要素が存在しない状況(すなわち、AがBのみでもっぱら構成される状況)、およびエンティティAに要素C、要素CおよびD、あるいはまたさらなる要素などのB以外の1つ以上のさらなる要素が存在する状況の両方を指すことができる。
さらに、特徴または要素が1回または複数回存在することができることを示す「少なくとも1つ」または「1つ以上」という用語、あるいは同様の表現が、典型的には、それぞれの特徴または要素を導入するときに一度だけ使用されることに留意されたい。以下では、ほとんどの場合に、それぞれの特徴または要素に言及するときに、それぞれの特徴または要素が1回または複数回存在できるという事実にもかかわらず、「少なくとも1つ」または「1つ以上」という表現は繰り返さない。
さらに、以下で使用されるとき、用語「好ましくは」、「より好ましくは」、「とくには」、「より詳しくは」、「具体的には」、または「より具体的には」、あるいは同様の用語は、代替の可能性を制限することなく、任意の特徴に関して使用される。したがって、これらの用語によって導入される特徴は、任意の特徴であり、決して特許請求の範囲の技術的範囲を制限することを意図したものではない。本発明は、当業者であれば理解できるとおり、代替の特徴を使用することによって実施されてもよい。同様に、「本発明の実施形態において」または同様の表現によって導入される特徴は、本発明の代替の実施形態に関するいかなる制限も伴わず、本発明の範囲に関するいかなる制限も伴わず、そのようなやり方で導入される特徴を本発明の他の任意または非任意の特徴と組み合わせる可能性に関するいかなる制限も伴わない任意の特徴であるように意図される。
本発明の第1の態様において、質量分析応答曲線における少なくとも1つのピークを識別するためのコンピュータによって実行される方法が開示される。
本明細書において使用されるとき、「コンピュータによって実行される方法」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、少なくとも1つのコンピュータおよび/または少なくとも1つのコンピュータネットワークが関与する方法を指すことができるが、それらに限られるわけではない。コンピュータおよび/またはコンピュータネットワークは、本発明による方法の方法ステップのうちの少なくとも1つを実行するように構成された少なくとも1つのプロセッサを備えることができる。好ましくは、方法ステップの各々が、コンピュータおよび/またはコンピュータネットワークによって実行される。本方法は、完全に自動的に、具体的にはユーザの相互作用を必要とせずに実行されてよい。本明細書において使用されるとき、「自動的に」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、とりわけ手動の動作および/またはユーザとの相互作用を必要とせずに、少なくとも1つのコンピュータおよび/またはコンピュータネットワークおよび/または機械によって完全に実行されるプロセスを指すことができるが、それらに限られるわけではない。
本明細書において使用されるとき、「質量分析」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、イオンの質量対電荷比を決定するための分析技術を指すことができるが、これに限られるわけではない。質量分析を、少なくとも1つの質量分析装置を使用して実行することができる。本明細書において使用されるとき、用語「質量分析装置」は、「質量分析器」とも呼ばれるが、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、質量対電荷比に基づいて少なくとも1つの被分析物を検出するように構成された分析器を指すことができるが、これに限られるわけではない。質量分析器は、少なくとも1つの四重極分析器であってよく、あるいは少なくとも1つの四重極分析器を備えることができる。本明細書において使用されるとき、「四重極質量分析器」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、質量フィルタとして少なくとも1つの四重極を備える質量分析器を指すことができるが、これに限られるわけではない。四重極質量分析器は、複数の四重極を備えることができる。例えば、四重極質量分析器は、三連四重極質量分析計であってよい。本明細書において使用されるとき、「質量フィルタ」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、質量フィルタに注入されたイオンをそれらの質量対電荷比m/zに従って選択するように構成された装置を指すことができるが、これに限られるわけではない。質量フィルタは、2対の電極を備えることができる。電極は、棒状であってよく、とくには円柱状であってよい。理想的な場合、電極は双曲線であってよい。電極は同一に設計されてよい。電極を、共通の軸、例えばz軸に沿って平行に延びるように配置することができる。四重極質量分析器は、質量フィルタの2対の電極間に少なくとも1つの直流(DC)電圧および少なくとも1つの交流(AC)電圧を印加するように構成された少なくとも1つの電源回路を備えることができる。電源回路を、各々の対向する電極対を同一の電位に保持するように構成することができる。電源回路を、特定の質量対電荷比m/zの範囲内のイオンについてのみ安定した軌道が可能であるように、電極対の電荷の符号を周期的に変化させるように構成することができる。質量フィルタにおけるイオンの軌道は、マシュー微分方程式によって記述することが可能である。異なるm/z値のイオンを測定するために、異なるm/z値を有するイオンを質量分析装置の検出器へと伝えることができるように、DCおよびAC電圧を時間につれて変更することができる。
質量分析装置は、少なくとも1つのイオン化源をさらに備えることができる。本明細書において使用されるとき、「イオン化源」という用語は、「イオン源」とも称されるが、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、例えば中性ガス分子からイオンを生成するように構成された装置を指すことができるが、これに限られるわけではない。イオン化源は、少なくとも1つの電子衝撃(EI)源または少なくとも1つの化学イオン化(CI)源などの少なくとも1つの気相イオン化源、少なくとも1つのプラズマ脱離(PDMS)源、少なくとも1つの高速原子衝撃(FAB)源、少なくとも1つの二次イオン質量分析(SIMS)源、少なくとも1つのレーザ脱離(LDMS)源、および少なくとも1つのマトリックス支援レーザ脱離(MALDI)源などの少なくとも1つの脱離イオン化源、少なくとも1つのサーモスプレー(TSP)源、少なくとも1つの大気圧化学イオン化(APCI)源、少なくとも1つのエレクトロスプレー(ESI)源、および少なくとも1つの大気圧イオン化(API)源などの少なくとも1つのスプレーイオン化源、からなる群から選択される少なくとも1つのイオン化源であってよく、あるいはそのようなソースを備えることができる。
質量分析装置は、少なくとも1つの検出器を備えることができる。本明細書において使用されるとき、「検出器」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、到来するイオンを検出するように構成された装置を指すことができるが、これに限られるわけではない。検出器を、荷電粒子を検出するように構成することができる。検出器は、少なくとも1つの電子増倍管であってよく、あるいは少なくとも1つの電子増倍管を備えることができる。
質量分析装置、とくには質量分析装置の検出器および/または少なくとも1つの評価装置を、検出されたイオンの少なくとも1つの質量スペクトルを決定するように構成することができる。本明細書において使用されるとき、「質量スペクトル」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、これに限られるわけではないが、電荷対質量比m/zに対する信号強度の二次元表現を指すことができ、信号強度は、それぞれのイオンの存在量に対応する。質量スペクトルは、ピクセルで構成された画像であってよい。得られる質量スペクトルのピクセルの強度を決定するために、特定のm/z範囲内の検出器によって検出された信号を積分することができるサンプル中の被分析物を、少なくとも1つの評価装置によって識別することができる。具体的には、評価装置は、既知の質量を識別された質量に相関させるように構成されてよく、あるいは特徴的なフラグメントパターンによって構成されてよい。
質量分析装置は、液体クロマトグラフィ質量分析装置であってよく、あるいは液体クロマトグラフィ質量分析装置を備えることができる。質量分析装置は、少なくとも1つの液体クロマトグラフに接続されてよく、かつ/または少なくとも1つの液体クロマトグラフを備えることができる。液体クロマトグラフを、質量分析装置のためのサンプル調製に使用することができる。少なくとも1つのガスクロマトグラフなど、サンプル調製の他の実施形態が可能であってよい。本明細書において使用されるとき、「液体クロマトグラフィ質量分析装置」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、これに限られるわけではないが、液体クロマトグラフィと質量分析との組み合わせを指すことができる。質量分析装置は、少なくとも1つの液体クロマトグラフを備えることができる。液体クロマトグラフィ質量分析装置は、少なくとも1つの高速液体クロマトグラフィ(HPLC)装置または少なくとも1つのマイクロ液体クロマトグラフィ(μLC)装置であってよく、あるいはこれらを備えることができる。液体クロマトグラフィ質量分析装置は、液体クロマトグラフィ(LC)装置と、この場合には質量フィルタである質量分析(MS)装置とを備えることができ、LC装置および質量フィルタは、少なくとも1つのインターフェースを介して連結される。LC装置とMS装置とを連結するインターフェースは、分子イオンを生成し、分子イオンを気相に移送するように構成されたイオン化源を備えることができる。インターフェースは、イオン化源と質量フィルタとの間に配置された少なくとも1つのイオン移動度モジュールをさらに備えることができる。例えば、イオン移動度モジュールは、高磁場非対称波形イオン移動度分光分析(FAIMS)モジュールであってよい。
本明細書において使用されるとき、「液体クロマトグラフィ(LC)装置」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、質量分析装置によって1つ以上の被分析物を検出するために、サンプルの目的の1つ以上の被分析物をサンプルの他の成分から分離するように構成された分析モジュールを指すことができるが、これに限られるわけではない。LC装置は、少なくとも1つのLCカラムを備えることができる。例えば、LC装置は、シングルカラム型のLC装置であってよく、あるいは複数のLCカラムを有するマルチカラム型のLC装置であってよい。LCカラムは、固定相を有することができ、目的の被分析物の分離および/または溶出および/または移送のために、移動相が固定相を通って圧送される。液体クロマトグラフィ質量分析装置は、少なくとも1つの目的の被分析物を各々が含むサンプルの自動的な前処理および調製のためのサンプル調製ステーションをさらに備えることができる。
本明細書において使用されるとき、「サンプル」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、生物学的サンプルおよび/または内部標準サンプルなどの任意の検査サンプルを指すことができるが、これらに限られるわけではない。サンプルは、1つ以上の目的の被分析物を含むことができる。例えば、検査サンプルは、血液、血清、血漿、唾液、眼水晶体液、脳脊髄液、汗、尿、乳、腹水、粘液、滑液、腹腔液、羊水、組織、細胞、などを含む生理学的流体からなる群から選択されてよい。サンプルは、それぞれのソースから得られたままで直接使用されても、前処理および/またはサンプル調製ワークフローに供されてもよい。例えば、サンプルを、内部標準の添加および/または別の溶液での希釈および/または試薬との混合などによって前処理することができる。例えば、目的の被分析物は、一般に、ビタミンD、依存性薬物、治療薬、ホルモン、および代謝産物であってよい。内部標準サンプルは、少なくとも1つの内部標準物質を既知の濃度で含むサンプルであってよい。サンプルに関するさらなる詳細については、例えば、その全開示が参照によって本明細書に取り入れられる欧州特許出願公開第3 425 369号明細書を参照されたい。他の目的の被分析物も可能である。
本方法は、例として、所与の順序で実行されてよい以下のステップを含む。しかしながら、異なる順序も可能であることに留意されたい。さらに、方法ステップのうちの1つ以上を、一回だけ行うこと、または繰り返し行うことも可能である。さらに、方法ステップのうちの2つ以上を、同時に行うこと、または時間的に重ねて行うことが可能である。本方法は、挙げられていないさらなる方法ステップを含んでもよい。
本方法は、以下のステップ、すなわち
a) 少なくとも1つの質量分析装置を使用することによって少なくとも1つの質量分析応答曲線を提供するステップ、および
b) 少なくとも1つの訓練済みモデルを使用することによって質量分析応答曲線を評価することにより、質量分析応答曲線の少なくとも1つのピークの始点および終点を識別するステップ
を含み、
モデルは、深層学習回帰アーキテクチャを使用して訓練されている。
本明細書において使用されるとき、「質量分析応答曲線」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、信号強度の一次元表現を指すことができるが、これに限られるわけではない。質量分析応答曲線は、一次元のみを有する。具体的には、「一次元」という用語は、時間軸を指すことができ、時間が唯一の独立変数であることを指すことができる。したがって、本明細書において使用されるとき、「一次元」という用語は、データ内の唯一の独立変数が「時間」であり、従属変数が「強度」であるという事実を指すことができる。とくには、本発明は、いくつかの質量分析データ処理技術の場合と異なり、2つの独立変数(例えば、「時間」および「質量対電荷比」)を必要としなくてもよい。通常は、本発明によって提案されるような一次元表現のみの使用と対照的に、畳み込みニューラルネットワークは、2つの独立変数(画像のx方向およびy方向)が存在する画像認識などの二次元のデータおよび用途に使用される。本明細書において使用されるとき、「提供する」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、とくには質量分析装置で少なくとも一回の測定を実行することによって、質量分析応答曲線を決定および/または生成および/または入手可能にするプロセスを指すことができるが、これに限られるわけではない。したがって、本明細書において使用されるとき、「少なくとも1つの質量分析装置を使用することによって少なくとも1つの質量分析応答曲線を提供する」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、質量分析装置から得られた質量分析応答曲線のデータを取り出し、とくには受け取ること、および/または質量分析装置で少なくとも1つの測定を行うことで、ステップb)でのさらなる評価に使用することができる質量分析応答曲線のデータを決定することを指すことができるが、これらに限られるわけではない。
本明細書において使用されるとき、「質量分析応答曲線を評価する」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、質量分析応答曲線の分析を指すことができるが、これに限られるわけではない。評価は、少なくとも1つのピークの識別ならびに/あるいはピークの始点および終点の決定ならびに/あるいはピークのピーク面積の決定を含むことができる。評価は、少なくとも1つのフィルタの適用および/またはバックグラウンド低減技術の使用および/または少なくとも1つのフィッティングルーティングの使用などを含むことができる。評価は、以下でさらに詳細に説明されるように、少なくとも1つの評価装置を使用して実行することができる。
本明細書において使用されるとき、質量分析応答曲線の「ピーク」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、質量分析応答曲線の少なくとも1つの極大値を指すことができるが、これに限られるわけではない。
本明細書において使用されるとき、ピークの「始点」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、これに限られるわけではないが、下側ピーク境界を指すことができる。始点は、下側ピーク境界を定める時間軸の点であってよい。始点の後に、質量分析応答曲線は極大値まで上昇する。始点は、ピーク積分の開始点であってよい。本明細書において使用されるとき、質量分析応答曲線の「終点」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、これに限られるわけではないが、上側ピーク境界を指すことができる。終点は、上側ピーク境界を定める時間軸の点であってよい。質量分析応答曲線は、終点においてノイズおよび/またはバックグラウンドレベルに達する前に低下する。終点は、ピーク積分の終了点であってよい。始点および終点は、ピークの限界として識別された時間軸上の点であってよい。以下でさらに詳細に説明される訓練データセットの始点および終点の値は、訓練されたユーザによる手動評価によって決定されてよい。訓練済みモデルは、さらなるデータの始点および終点を提供することができる。ピーク面積を、典型的には、始点と終点との間の応答曲線の積分と定義することができる。
本明細書において使用されるとき、「ピークの識別」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、ピークの有無などのピークの定性的決定および/またはピークのピーク面積の決定などのピークの定量的決定を指すことができるが、これらに限られるわけではない。ピーク面積の決定は、とりわけ質量分析応答曲線のピークによって囲まれたピーク面積を決定するための少なくとも1つの数学的演算および/または数学的アルゴリズムの使用によるピーク積分を含むことができる。具体的には、ピークの積分は、質量分析応答曲線の曲線特性の識別および/または測定を含むことができる。ピーク識別は、始点および/または終点の決定を含む。ピーク識別は、ピーク検出、ピーク発見、ピークフィッティング、ピーク評価、バックグラウンドの決定、およびベースラインの決定のうちの1つ以上をさらに含むことができる。ピーク積分は、ピーク面積、保持時間、ピーク高さ、およびピーク幅のうちの1つ以上の決定を可能にすることができる。ピーク識別は、自動ピーク識別、すなわち少なくとも1つのコンピュータおよび/またはコンピュータネットワークおよび/または機械によって実行されるピーク識別であってよい。具体的には、自動ピーク識別は、手動の動作またはユーザとの相互作用を伴わずに実行されてよい。
本明細書において使用されるとき、「訓練済みモデル」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、これに限られるわけではないが、訓練データとも呼ばれる少なくとも1つの訓練データセットで訓練された質量分析応答曲線のピークを識別するためのモデルを指すことができる。とくに、訓練済みモデルは、専門家によって事前に分類された既存のデータについて訓練されている。これにより、信頼性が高く、分散および誤差の影響を受けにくい自動化されたピーク識別を提供することができる。訓練済みモデルは、アーキテクチャと、アーキテクチャによって定義された種々のフィルタまたはノードの重み一式とを含むことができる。CNNのアーキテクチャは、応答曲線の形状とピークの始点および終点の位置との間の複雑な関係を反映することができる。
本方法は、少なくとも1つの訓練ステップを含むことができ、訓練ステップにおいて、訓練済みモデルは、少なくとも1つの訓練データセットで訓練される。訓練ステップは、オフライン訓練であってよいが、提案される方法のステップb)におけるピーク識別は、オンラインピーク識別であってよい。具体的には、訓練ステップは、ステップa)およびb)を実行する前に実行されてよい。本明細書において使用されるとき、「オンライン」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、これに限られるわけではないが、質量分析装置による測定プロセスの最中を指すことができる。
モデルは、深層学習回帰アーキテクチャを使用して訓練されている。本明細書において使用されるとき、「深層学習」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、これに限られるわけではないが、機械学習に関する少なくとも1つの方法を指すことができる。深層学習は、少なくとも1つの人工ニューラルネットワークに基づくことができる。本明細書において使用されるとき、「深層学習回帰アーキテクチャ」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、これに限られるわけではないが、回帰問題を解くように構成された深層学習アーキテクチャを指すことができる。
深層学習回帰アーキテクチャは、畳み込みニューラルネットワークを含むことができる。畳み込みニューラルネットワークは、多層畳み込みニューラルネットワークであってよい。畳み込みニューラルネットワークは、複数の畳み込み層を備えることができる。畳み込み層は、一次元層であり、すなわち畳み込みは、一次元の時間ドメインに適用される。一般に、畳み込み層は、畳み込みニューラルネットワークにおける標準的な基本構成要素であり、それ自体は当業者に知られている。数学的には、畳み込み層は、入力データを畳み込みカーネルで畳み込む操作に対応する(例えば、en.wikipedia.org/wiki/Convolutional_neural_networkを参照されたい)。本明細書において使用されるとき、「畳み込み層」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、これに限られるわけではないが、入力データを一次元畳み込みカーネルで畳み込む操作を指すことができる。畳み込み層の後に、複数の全結合層が続いてよい。畳み込みニューラルネットワークは、複数のプーリング層を備えることができる。畳み込みニューラルネットワークの構造は、例えばen.wikipedia.org/wiki/Convolutional_neural_network#Convolutionalなどから当業者に広く知られている。画像内の物体認識に畳み込みニューラルネットワークを使用することが、当業者に広く知られている。しかしながら、本発明は、1D信号分析のために畳み込みニューラルネットワークを使用する新規な手法を提案する。
畳み込みニューラルネットワーク(CNN)を、回帰問題を解くように構成することができる。回帰問題を解くために、畳み込みニューラルネットワークは、とくには通常の分類ソフトマックス層とは対照的に、回帰層を最終層として備えることができる。回帰層は、全結合層であってよい。回帰層は、線形またはシグモイド活性化を有することができる。したがって、本発明は、回帰フレームワークにおける一次元畳み込みニューラルネットワークの使用を提案する。具体的には、本発明は、入力をピーク位置へとマッピングする複雑な関数をフィッティングするために、畳み込みニューラルネットワークを使用することを提案する。しかしながら、畳み込みニューラルネットワークは、1D信号のカテゴリへの分類に使用されなくてもよい。
訓練ステップは、以下のサブステップ、すなわち
i) 複数の入力質量分析応答曲線と、対応する正解とを含む少なくとも1つの訓練データセットを提供するサブステップ、および
ii) 訓練データセットについて深層学習回帰アーキテクチャを使用することによって、少なくとも1つのモデルを決定するサブステップ
を含むことができ、
モデルを決定するサブステップは、モデルのモデルアーキテクチャおよび少なくとも1つのパラメータを決定することを含む。
ステップi)は、100を超え、好ましくは1000を超える入力質量分析応答曲線を提供することを含むことができる。例えば、モデルを、1270個のビタミンD3曲線を使用して訓練することができる。ステップi)において提供される複数の入力質量分析応答曲線を、質量分析装置を使用して複数の測定を実行することによって決定することができる。例えば、ステップi)において提供される複数の入力質量分析応答曲線は、ビタミンD2またはビタミンD3などの特定の被分析物からのLC-MSデータであってよく、あるいはそのようなデータを含むことができる。本明細書において使用されるとき、「正解」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、これに限られるわけではないが、対応する入力質量分析応答曲線のピークの始点および終点の実際の値または真の値を指すことができる。正解は、ピークの位置を示すことができる。例えば、正解は、ピーク位置あるいはピークの始点および終点の位置であってよい。正解を、訓練されたLC-MSオペレータが提供することができる。
質量分析装置への注入は、4つの質量分析応答曲線、すなわち2つの被分析物質量分析応答曲線および2つの内部標準質量分析応答曲線をもたらすことができる。訓練データセットを、集積時間ベクトルと、2つの被分析物質量分析応答曲線と、2つの内部標準質量分析応答曲線とを含む5チャネルベクトルとして提供することができる。4つの応答曲線の生の時間ベクトルは、曲線ごとに少なくともわずかにずれる時間ステップを含む。用語「集積時間ベクトル」は、4つのすべての応答曲線が同じ時間グリッド上に内挿される時間ベクトルを指すことができる。訓練データセットを、入力データとも呼ばれる入力として、畳み込みニューラルネットワークへと提供することができる。例えば、長さNの入力質量分析応答曲線を考えると、入力は2xNの行列であってよく、第1行は、クロマトグラムのy値などのN個の強度値を表し、第2行は、クロマトグラムのx値などのN個の時間値を表すことができる。集積により、畳み込みニューラルネットワークが、例えばピークが所与の被分析物曲線においてきわめて弱い場合に、他の曲線のピーク位置を使用して弱い曲線の位置を知らせることができるように、異なる質量分析応答曲線の間で情報を伝播させることを可能にできる。
モデルの訓練は、少なくとも1つの正規化ステップを含むことができる。正規化ステップは、入力データを時間に対して正規化することを含むことができる。正規化ステップは、予想保持時間がt=0に位置するように時間値を変換することを含むことができる。正規化ステップは、予想保持時間の周りの固定の時間ウィンドウへと入力データを切り取ることを含むことができる。正規化ステップは、強度値Y自体を、以下によって正規化することを含むことができる。
Figure 2023518353000002
モデルの訓練は、少なくとも1つの拡張ステップを含むことができる。被分析物間の一般化を達成するために、畳み込みニューラルネットワークを、質量分析応答曲線データのシフトおよびスケーリングの差を考慮する拡張データで訓練することができる。拡張ステップは、過訓練の回避を可能にすることができる。拡張ステップは、位置拡張および/またはスケール拡張を含むことができる。位置拡張は、ピーク位置を所定の一定値だけシフトさせることを含んでよい。位置拡張は、スライディング窓の使用を含むことができる。これにより、ピークが広がったり狭くなったりする可能性を考慮することができる。スケーリング拡張は、1.2などの所定の値によってピークをスケーリングすることを含むことができる。各々の入力質量分析応答曲線について、位置拡張を使用する3つの新しいデータセットおよびスケール拡張を使用する3つの新しいデータセットをランダムに生成することによって、訓練データセットを補足することができる。

本方法は、正規化および/または拡張された訓練データセットならびに正解について深層学習回帰アーキテクチャを使用することを含むことができる。
深層学習回帰アーキテクチャは、TensorFlowをバックエンドとしてPythonのKerasライブラリによって構築された畳み込みニューラルネットワーク(CNN)であってよい。TensorFlowによるPythonのKerasライブラリについては、https://www.tensorflow.org/、https://de.wikipedia.org/wiki/TensorFlow、ならびにhttps://keras.io/またはhttps://de.wikipedia.org/wiki/Kerasを参照されたい。例えば、以下の設定を使用することができる:オプティマイザとして、適応的モーメント推定(Adam)を使用することができる。損失関数は、平均二乗誤差であってよい。エポック数は500であってよく、バッチサイズは16であってよく、patienceによる早期停止は100であってよい。
訓練ステップは、少なくとも1つの検査データセットを使用する少なくとも1つの検査ステップをさらに含むことができる。検査ステップは、訓練済みモデルの検証を含むことができる。本明細書において使用されるとき、「検査データセット」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、これに限られるわけではないが、少なくとも1つの質量分析応答曲線と、訓練データセットに含まれていなかった対応する正解とを指すことができる。検査ステップは、決定されたモデルを使用して、検査データセットの質量分析応答曲線の少なくとも1つのピークの始点および終点を決定することを含むことができる。決定されたモデルの性能を、決定された始点および終点と、検査データセットの質量分析応答曲線の正解とに基づいて判断することができる。
本方法は、識別された始点および終点を使用することによって、ステップi)において提供された質量分析応答曲線のピークのピーク面積を、とくには自動的に決定することを含むことができる。
本発明のさらなる態様において、質量分析応答曲線における少なくとも1つのピークを識別するためのコンピュータプログラムが開示され、このコンピュータプログラムは、プログラムの実行時に、コンピュータまたはコンピュータネットワークに、上記開示の実施形態のうちのいずれか1つによる方法および/または以下でさらに詳細に開示される実施形態のうちのいずれか1つによる方法などの本発明による方法のステップa)およびb)を完全にまたは部分的に実行させる命令を含む。ステップa)は、サンプル調製のステップなど、ユーザによって少なくとも部分的に実行されてよいステップを含むことができる。しかしながら、本発明による方法のすべてのステップが完全に自動で実行される実施形態が可能である。したがって、具体的には、上述したような方法ステップa)およびb)の1つ、2つ以上、またはすべてを、コンピュータまたはコンピュータネットワークを使用して、好ましくはコンピュータプログラムを使用して実行することができる。具体的には、コンピュータプログラムは、コンピュータ可読データ担体および/またはコンピュータ可読記憶媒体に記憶されてよい。
同様に、実行時に、コンピュータまたはコンピュータネットワークに、上記開示の実施形態のうちのいずれか1つによる方法および/または以下でさらに詳細に開示される実施形態のうちのいずれか1つによる方法などの本発明による方法のステップa)およびb)を完全にまたは部分的に実行させる命令を含んでいるコンピュータ可読記憶媒体が開示される。
本明細書において使用されるとき、「コンピュータ可読記憶媒体」という用語は、具体的には、コンピュータ実行可能命令を記憶したハードウェア記憶媒体などの非一時的データ記憶手段を指すことができる。コンピュータ可読データ担体または記憶媒体は、具体的には、ランダムアクセスメモリ(RAM)および/または読み出し専用メモリ(ROM)などの記憶媒体であってよく、あるいはこれらを含むことができる。
さらに、コンピュータプログラムは、コンピュータプログラム製品として具現化されてもよい。本明細書において使用されるとき、コンピュータプログラム製品は、取引可能な製品としてのプログラムを指すことができる。製品は、一般に、紙フォーマットなどの任意のフォーマットで存在でき、あるいはコンピュータ可読データ担体および/またはコンピュータ可読記憶媒体上に存在できる。具体的には、コンピュータプログラム製品は、データネットワーク上で配信されてもよい。
例えばコンピュータまたはコンピュータネットワークの作業メモリまたはメインメモリなど、コンピュータまたはコンピュータネットワークへとロードされた後に、本明細書に開示の実施形態のうちの1つ以上による方法を実行することができるデータ構造を記憶したデータ担体が、本明細書においてさらに開示および提案される。
プログラムがコンピュータまたはコンピュータネットワーク上で実行されたときに、本明細書に開示の実施形態のうちの1つ以上による方法を実行するために、プログラムコード手段を機械可読担体上に記憶したコンピュータプログラム製品が、本明細書においてさらに開示および提案される。本明細書において使用されるとき、コンピュータプログラム製品は、取引可能な製品としてのプログラムを指す。製品は、一般に、紙フォーマットなどの任意のフォーマットで存在でき、あるいはコンピュータ可読データ担体および/またはコンピュータ可読記憶媒体上に存在できる。具体的には、コンピュータプログラム製品は、データネットワーク上で配信されてもよい。
最後に、本明細書に開示の実施形態のうちの1つ以上による方法を実行するためのコンピュータシステムまたはコンピュータネットワークにとって読み取り可能な命令を含む変調データ信号が、本明細書においてさらに開示および提案される。
本発明のコンピュータによって実行される態様に関して、本明細書に開示の実施形態のうちの1つ以上による方法の方法ステップのうちの1つ以上またはすべてを、コンピュータまたはコンピュータネットワークを使用することによって実行することができる。したがって、一般に、データの提供および/または操作を含む方法ステップのいずれも、コンピュータまたはコンピュータネットワークを使用することによって実行することができる。一般に、これらの方法ステップは、典型的にはサンプルの提供および/または実際の測定を実行する特定の態様などの手作業を必要とする方法ステップを除いて、あらゆる方法ステップを含むことができる。
具体的には、本明細書において、以下がさらに開示される。
- 少なくとも1つのプロセッサを備えているコンピュータまたはコンピュータネットワークであって、プロセッサが、本明細書に記載の実施形態のうちの1つによる方法を実行するように構成されているコンピュータまたはコンピュータネットワーク。
- コンピュータへとロード可能なデータ構造であって、コンピュータ上での実行時に本明細書に記載の実施形態のうちの1つによる方法を実行するように構成されたデータ構造。
- コンピュータ上での実行時に本明細書に記載の実施形態のうちの1つによる方法を実行するように構成されたコンピュータプログラム。
- コンピュータプログラムであって、このコンピュータプログラムがコンピュータ上またはコンピュータネットワーク上で実行されるときに本明細書に記載の実施形態のうちの1つによる方法を実行するためのプログラム手段を備えているコンピュータプログラム。
- 先行の実施形態によるプログラム手段を備えているコンピュータプログラムであって、プログラム手段がコンピュータにとって読み取り可能な記憶媒体上に記憶されているコンピュータプログラム。
- データ構造を記憶した記憶媒体であって、データ構造がコンピュータまたはコンピュータネットワークのメイン記憶部および/または作業記憶部へとロードされた後に本明細書に記載の実施形態のうちの1つによる方法を実行するように構成されている記憶媒体。
- コンピュータ上またはコンピュータネットワーク上で実行された場合に本明細書に記載の実施形態のうちの1つによる方法を実行するプログラムコード手段を有しており、プログラムコード手段は記憶媒体上に記憶可能または記憶されているコンピュータプログラム製品。
本発明のさらなる態様において、サンプル中の少なくとも1つの被分析物を監視するための装置が開示される。この装置は、
- 少なくとも1つの質量分析応答曲線を提供するように構成された少なくとも1つの質量分析装置と、
- 少なくとも1つの訓練済みモデルを使用することによって質量分析応答曲線を評価することにより、質量分析応答曲線の少なくとも1つのピークの始点および終点を識別するように構成された少なくとも1つの評価装置と
を備え、
モデルは、深層学習回帰アーキテクチャを使用して訓練されている。
この装置は、方法に関する先行の実施形態のいずれか1つによる質量分析応答曲線における少なくとも1つのピークを識別するための方法を実行するように構成されてよい。装置の特徴の定義および装置の任意の特徴に関して、上記で開示され、あるいは以下でさらに詳細に開示される方法の実施形態のうちの1つ以上を参照することができる。
本明細書において一般的に使用されるとき、「評価装置」という用語は、広義の用語であり、当業者にとっての通常かつ慣習的な意味が与えられるべきであり、特別な意味またはカスタマイズされた意味に限定されるべきではない。この用語は、具体的には、これに限られるわけではないが、挙げられた動作を実行するように構成された任意の装置を指すことができる。評価装置は、少なくとも1つの処理ユニットを備えることができる。処理ユニットは、コンピュータまたはシステムの基本的な動作を実行するように構成された任意の論理回路であってよく、かつ/または、一般に、計算または論理動作を実行するように構成された装置であってよい。とくには、処理ユニットは、コンピュータまたはシステムを駆動する基本的な命令を処理するように構成されてよい。例として、処理ユニットは、少なくとも1つの算術論理演算装置(ALU)、数値演算コプロセッサまたは数値コプロセッサなどの少なくとも1つの浮動小数点ユニット(FPU)、複数のレジスタ、具体的にはALUにオペランドを供給し、演算結果を格納するように構成されたレジスタ、ならびにL1およびL2キャッシュメモリなどのメモリを含むことができる。とくには、処理ユニットは、マルチコアプロセッサであってよい。具体的には、処理ユニットは、中央処理装置(CPU)であってよく、あるいはCPUを備えることができる。これに加え、あるいはこれに代えて、処理ユニットはマイクロプロセッサであってよく、あるいはマイクロプロセッサを備えることができ、したがって、具体的には、処理ユニットの要素が、1つの単一の集積回路(IC)チップに含まれてよい。これに加え、あるいはこれに代えて、処理ユニットは、1つ以上の特定用途向け集積回路(ASIC)および/または1つ以上のフィールドプログラマブルゲートアレイ(FPGA)などであってよく、あるいはこれらを備えることができる。処理ユニットは、具体的には、ソフトウェアプログラミングなどによって、1つ以上の評価動作を実行するように構成されてよい。
評価装置は、上記で詳細に説明され、あるいは以下でさらに詳しく説明されるように、本発明による方法のステップb)を実行するように構成されてよい。評価装置は、上記で詳細に説明され、あるいは以下でさらに詳しく説明される訓練ステップを実行するようにさらに構成されてよい。
要約すると、さらなる実施形態の可能性を排除することなく、以下の実施形態を想定することができる。
実施形態1:質量分析応答曲線における少なくとも1つのピークを識別するためのコンピュータによって実行される方法であって、以下のステップ、すなわち
a) 少なくとも1つの質量分析装置を使用することによって少なくとも1つの質量分析応答曲線を提供するステップ、および
b) 少なくとも1つの訓練済みモデルを使用することによって質量分析応答曲線を評価することにより、質量分析応答曲線の少なくとも1つのピークの始点および終点を識別するステップ
を含んでおり、
モデルは、深層学習回帰アーキテクチャを使用して訓練されている、方法。
実施形態2:深層学習回帰アーキテクチャは、畳み込みニューラルネットワークを備える、先行の実施形態による方法。
実施形態3:畳み込みニューラルネットワークは、多層畳み込みニューラルネットワークである、先行の実施形態による方法。
実施形態4:畳み込みニューラルネットワークは、複数の畳み込み層を備え、畳み込み層は、一次元層である、先行の実施形態による方法。
実施形態5:畳み込みニューラルネットワークは、回帰層を最終層として備え、回帰層は、線形またはシグモイド活性化を有する、先行の2つの実施形態のいずれか1つによる方法。
実施形態6:畳み込みニューラルネットワークは、複数のプーリング層を備える、先行の3つの実施形態のいずれか1つによる方法。
実施形態7:少なくとも1つの訓練ステップを備え、
訓練ステップは、以下のサブステップ、すなわち
i) 複数の入力質量分析応答曲線と、対応する正解とを含む少なくとも1つの訓練データセットを提供するサブステップ、および
ii) 訓練データセットについて深層学習回帰アーキテクチャを使用することによって、少なくとも1つのモデルを決定するサブステップ
を含み、
モデルを決定するサブステップは、モデルのモデルアーキテクチャおよび少なくとも1つのパラメータを決定することを含む、先行の実施形態のいずれか1つによる方法。
実施形態8:訓練データセットは、集積時間ベクトルと、2つの被分析物質量分析応答曲線と、2つの内部標準質量分析応答曲線とを含む5チャネルベクトルとして提供される、先行の実施形態による方法。
実施形態9:モデルの訓練は、少なくとも1つの正規化ステップおよび/または少なくとも1つの拡張ステップを含む、先行の2つの実施形態のいずれか1つによる方法。
実施形態10:訓練ステップは、少なくとも1つの検査データセットを使用する少なくとも1つの検査ステップをさらに含み、検査ステップは、決定されたモデルを使用して検査データセットの質量分析応答曲線の少なくとも1つのピークの始点および終点を決定することを含み、決定されたモデルの性能が、決定された始点および終点と、検査データセットの質量分析応答曲線の正解とに基づいて判定される、先行の2つの実施形態のいずれか1つによる方法。
実施形態11:識別された始点および終点を使用することによって質量分析応答曲線のピークのピーク面積を決定すること
を含む、先行の実施形態のいずれか1つによる方法。
実施形態12:コンピュータまたはコンピュータネットワーク上で実行されたときに、方法に関する先行の実施形態のいずれか1つによる質量分析応答曲線における少なくとも1つのピークを識別するための方法を、コンピュータまたはコンピュータネットワークに完全に、または部分的に実行させるように構成された、質量分析応答曲線における少なくとも1つのピークを識別するためのコンピュータプログラムであって、
方法に関する先行の実施形態のいずれか1つによる質量分析応答曲線における少なくとも1つのピークを識別するための方法の少なくともステップb)を実行するように構成された、コンピュータプログラム。
実施形態13:プログラムコード手段を有するコンピュータプログラム製品であって、
前記プログラムコード手段がコンピュータまたはコンピュータネットワーク上で実行されたときに、方法に関する先行の実施形態のいずれか1つによる質量分析応答曲線における少なくとも1つのピークを識別するための方法の少なくともステップb)を実行するため、プログラムコード手段は、記憶媒体上に格納可能または格納されている、コンピュータプログラム製品。
実施形態14:サンプル中の少なくとも1つの被分析物を監視するための装置であって、
- 少なくとも1つの質量分析応答曲線を提供するように構成された少なくとも1つの質量分析装置と、
- 少なくとも1つの訓練済みモデルを使用することによって質量分析応答曲線を評価することにより、質量分析応答曲線の少なくとも1つのピークの始点および終点を識別するように構成された少なくとも1つの評価装置と
を備え、
モデルは、深層学習回帰アーキテクチャを使用して訓練されている、装置。
実施形態15:方法に関する先行の実施形態のいずれか1つに記載の質量分析応答曲線における少なくとも1つのピークを識別するための方法を実行するように構成された、先行の実施形態による装置。
さらなる任意の特徴および実施形態が、好ましくは従属請求項と併せて、実施形態の後続の説明においてさらに詳細に開示される。その中で、それぞれの任意の特徴は、当業者であれば理解できるとおり、独立した様相ならびに任意の実行可能な組み合わせにて実現されてよい。本発明の範囲は、好ましい実施形態によって限定されるものではない。実施形態は、図面において概略的に示されている。その中で、これらの図における同一の参照番号は、同一の要素または機能的に同等の要素を指している。
図面において、
本発明による質量分析応答曲線における少なくとも1つのピークを識別するためのコンピュータによって実行される方法の実施形態を示している。 本発明によるサンプル中の少なくとも1つの被分析物を監視するための装置の実施形態を示している。 深層学習回帰アーキテクチャの実施形態を示している。 本発明による訓練ステップの実施形態を示している。 正規化および切り取りの実施形態を示している。 正規化および切り取りの実施形態を示している。 正規化および切り取りの実施形態を示している。 拡張およびスケーリングの実施形態を示している。 拡張およびスケーリングの実施形態を示している。 拡張およびスケーリングの実施形態を示している。
図1が、本発明による質量分析応答曲線における少なくとも1つのピークを識別するためのコンピュータによって実行される方法110の一実施形態のフローチャートをきわめて概略的に示している。この方法は、以下のステップ、すなわち
a) 少なくとも1つの質量分析装置114を使用することによって少なくとも1つの質量分析応答曲線を提供するステップ(参照番号112で示されている)、および
b) 少なくとも1つの訓練済みモデルを使用することによって質量分析応答曲線を評価することにより、質量分析応答曲線の少なくとも1つのピークの始点および終点を識別するステップ(参照番号116で示されている)
を含むことができ、
モデルは、深層学習回帰アーキテクチャ118を使用して訓練されている。
図2が、質量分析装置114を備える本発明によるサンプル中の少なくとも1つの被分析物を監視するための装置120の一実施形態を示している。質量分析装置114は、質量対電荷比に基づいて少なくとも1つの被分析物を検出するように構成されてよい。質量分析装置114は、少なくとも1つの四重極122を質量フィルタとして備える少なくとも1つの四重極分析器であってよく、あるいはそのような四重極分析器を備えることができる。四重極質量分析器は、複数の四重極を備えてもよい。例えば、四重極質量分析器は、三連四重極質量分析器であってよい。四重極質量分析器は、四重極の2対の電極間に少なくとも1つの直流(DC)電圧および少なくとも1つの交流(AC)電圧を印加するように構成された少なくとも1つの電源回路(ここでは、図示せず)を備えることができる。電源回路を、各々の対向する電極対を同一の電位に保持するように構成することができる。電源回路を、特定の質量対電荷比m/zの範囲内のイオンについてのみ安定した軌道が可能であるように、電極対の電荷の符号を周期的に変化させるように構成することができる。質量フィルタにおけるイオンの軌道を、マシュー微分方程式によって記述することができる。異なるm/z値のイオンを測定するために、異なるm/z値を有するイオンを質量分析装置114の検出器124へと伝えることができるように、DCおよびAC電圧を時間につれて変更することができる。
質量分析装置114は、少なくとも1つのイオン化源126をさらに備えることができる。イオン化源126を、例えば中性ガス分子からイオンを生成するように構成することができる。イオン化源126は、少なくとも1つの電子衝撃(EI)源または少なくとも1つの化学イオン化(CI)源などの少なくとも1つの気相イオン化源、少なくとも1つのプラズマ脱離(PDMS)源、少なくとも1つの高速原子衝撃(FAB)源、少なくとも1つの二次イオン質量分析(SIMS)源、少なくとも1つのレーザ脱離(LDMS)源、および少なくとも1つのマトリックス支援レーザ脱離(MALDI)源などの少なくとも1つの脱離イオン化源、少なくとも1つのサーモスプレー(TSP)源、少なくとも1つの大気圧化学イオン化(APCI)源、少なくとも1つのエレクトロスプレー(ESI)源、および少なくとも1つの大気圧イオン化(API)源などの少なくとも1つのスプレーイオン化源、からなる群から選択される少なくとも1つのソースであってよく、あるいはそのようなソースを備えることができる。
質量分析装置114は、検出器124を備えることができる。検出器を、到来するイオンを検出するように構成することができる。検出器124を、荷電粒子を検出するように構成することができる。検出器124は、少なくとも1つの電子増倍管であってよく、あるいは少なくとも1つの電子増倍管を備えることができる。
質量分析装置114、とくには質量分析装置114の検出器124および/または少なくとも1つの評価装置128を、検出されたイオンの少なくとも1つの質量スペクトルを決定するように構成することができる。質量スペクトルは、ピクセルで構成された画像であってよい。得られる質量スペクトルのピクセルの強度を決定するために、特定のm/z範囲内の検出器によって検出された信号を積分することができるサンプル中の被分析物を、少なくとも1つの評価装置128によって識別することができる。具体的には、評価装置128は、既知の質量を識別された質量に相関させるように構成されてよく、あるいは特徴的なフラグメントパターンによって構成されてよい。
質量分析装置114は、液体クロマトグラフィ質量分析装置であってよく、あるいは液体クロマトグラフィ質量分析装置を備えることができる。質量分析装置114は、少なくとも1つの液体クロマトグラフに接続されてよく、かつ/または少なくとも1つの液体クロマトグラフを備えることができる。液体クロマトグラフを、質量分析装置114のためのサンプル調製に使用することができる。少なくとも1つのガスクロマトグラフなど、サンプル調製の他の実施形態も可能であってよい。質量分析装置114は、少なくとも1つの液体クロマトグラフを備えることができる。液体クロマトグラフィ質量分析装置は、少なくとも1つの高速液体クロマトグラフィ(HPLC)装置または少なくとも1つのマイクロ液体クロマトグラフィ(μLC)装置であってよく、あるいはこれらを備えることができる。液体クロマトグラフィ質量分析装置は、液体クロマトグラフィ(LC)装置と、この場合には質量フィルタである質量分析(MS)装置とを備えることができ、LC装置および質量フィルタは、少なくとも1つのインターフェースを介して連結される。LC装置とMS装置とを連結するインターフェースは、分子イオンを生成し、分子イオンを気相に移送するように構成されたイオン化源を備えることができる。インターフェースは、イオン化源と質量フィルタとの間に配置された少なくとも1つのイオン移動度モジュールをさらに備えることができる。例えば、イオン移動度モジュールは、高磁場非対称波形イオン移動度分光分析(FAIMS)モジュールであってよい。
LC装置を、質量分析装置114によって1つ以上の被分析物を検出するために、サンプルの目的の1つ以上の被分析物をサンプルの他の成分から分離するように構成することができる。LC装置は、少なくとも1つのLCカラムを備えることができる。例えば、LC装置は、シングルカラム型のLC装置であってよく、あるいは複数のLCカラムを有するマルチカラム型のLC装置であってよい。LCカラムは、固定相を有することができ、目的の被分析物の分離および/または溶出および/または移送のために、移動相が固定相を通って圧送される。液体クロマトグラフィ質量分析装置は、少なくとも1つの目的の被分析物を各々が含むサンプルの自動的な前処理および調製のためのサンプル調製ステーションをさらに備えることができる。
サンプルは、生物学的サンプルおよび/または内部標準サンプルなどの任意の検査サンプルであってよい。サンプルは、1つ以上の目的の被分析物を含んでよい。例えば、検査サンプルは、血液、血清、血漿、唾液、眼水晶体液、脳脊髄液、汗、尿、乳、腹水、粘液、滑液、腹腔液、羊水、組織、細胞、などを含む生理学的流体からなる群から選択されてよい。サンプルは、それぞれのソースから得られたままで直接使用されても、前処理および/またはサンプル調製ワークフローに供されてもよい。例えば、サンプルを、内部標準の添加および/または別の溶液での希釈および/または試薬との混合などによって前処理することができる。例えば、目的の被分析物は、一般に、ビタミンD、依存性薬物、治療薬、ホルモン、および代謝産物であってよい。内部標準サンプルは、少なくとも1つの内部標準物質を既知の濃度で含むサンプルであってよい。サンプルに関するさらなる詳細については、例えば、その全開示が参照によって本明細書に取り入れられる欧州特許出願公開第3 425 369号明細書を参照されたい。他の目的の被分析物も可能である。
ステップa)112で提供される質量分析応答曲線は、信号強度の一次元表現であってよい。質量分析応答曲線は、一次元のみを有する。質量分析応答曲線を、とくには質量分析装置114で少なくとも一回の測定を実行することによって、質量分析応答曲線を決定および/または生成および/または入手可能にすることによって提供することができる。
ステップb)116における質量分析応答曲線の評価は、質量分析応答曲線の少なくとも1つの分析を実行することを含むことができる。評価116は、少なくとも1つのピークの識別ならびに/あるいはピークの始点および終点の決定ならびに/あるいはピークのピーク面積の決定を含むことができる。評価116は、少なくとも1つのフィルタの適用および/またはバックグラウンド低減技術の使用および/または少なくとも1つのフィッティングルーティングの使用などを含むことができる。
質量分析応答曲線のピークは、質量分析応答曲線の少なくとも1つの極大値であってよい。ピークの始点は、下側ピーク境界であってよい。始点は、下側ピーク境界を定める時間軸の点であってよい。始点の後に、質量分析応答曲線は極大値まで上昇する。始点は、ピーク積分の開始点であってよい。質量分析応答曲線の終点は、上側ピーク境界であってよい。終点は、上側ピーク境界を定める時間軸の点であってよい。質量分析応答曲線は、終点においてノイズおよび/またはバックグラウンドレベルに達する前に低下する。終点は、ピーク積分の終了点であってよい。始点および終点は、ピークの限界として識別された時間軸上の点であってよい。以下でさらに詳細に説明される訓練データセットの始点および終点の値は、訓練されたユーザによる手動評価によって決定されてよい。訓練済みモデルは、さらなるデータの始点および終点を提供することができる。ピーク面積を、典型的には、始点と終点との間の応答曲線の積分と定義することができる。
ステップb)116は、ピークの識別を含むことができる。ピークの識別は、ピークの有無などのピークの定性的決定および/またはピークのピーク面積の決定などのピークの定量的決定を含むことができる。ピーク面積の決定は、とりわけ質量分析応答曲線のピークによって囲まれたピーク面積を決定するための少なくとも1つの数学的演算および/または数学的アルゴリズムの使用によるピーク積分を含むことができる。具体的には、ピークの積分は、質量分析応答曲線の曲線特性の識別および/または測定を含むことができる。ピーク識別は、始点および/または終点の決定を含む。ピーク識別は、ピーク検出、ピーク発見、ピークフィッティング、ピーク評価、バックグラウンドの決定、およびベースラインの決定のうちの1つ以上をさらに含むことができる。ピーク積分は、ピーク面積、保持時間、ピーク高さ、およびピーク幅のうちの1つ以上の決定を可能にすることができる。ピーク識別は、自動ピーク識別、すなわち少なくとも1つのコンピュータおよび/またはコンピュータネットワークおよび/または機械によって実行されるピーク識別であってよい。具体的には、自動ピーク識別は、手動の動作またはユーザとの相互作用を伴わずに実行されてよい。
ステップb)116において使用される訓練済みモデルは、訓練データとも呼ばれる少なくとも1つの訓練データセットで訓練された質量分析応答曲線のピークを識別するためのモデルであってよく、あるいはそのようなモデルを備えることができる。とくに、訓練済みモデルは、専門家によって事前に分類された既存のデータについて訓練されている。これにより、信頼性が高く、分散および誤差の影響を受けにくい自動化されたピーク識別を提供することができる。訓練済みモデルは、アーキテクチャと、アーキテクチャによって定義された種々のフィルタまたはノードの重み一式とを含むことができる。CNNのアーキテクチャは、応答曲線の形状とピークの始点および終点の位置との間の複雑な関係を反映することができる。
方法110は、少なくとも1つの訓練ステップ130を含むことができ、訓練ステップ130において、訓練済みモデルは、少なくとも1つの訓練データセットで訓練される。訓練ステップ130は、オフライン訓練であってよいが、提案される方法のステップb)116におけるピーク識別は、オンラインピーク識別であってよい。具体的には、訓練ステップ130は、ステップa)112およびb)116を実行する前に実行されてよい。
モデルは、深層学習回帰アーキテクチャ118を使用して訓練されている。深層学習回帰アーキテクチャ118は、回帰問題を解くように構成された深層学習アーキテクチャであってよい。
深層学習回帰アーキテクチャ118は、畳み込みニューラルネットワークを含むことができる。畳み込みニューラルネットワークは、多層畳み込みニューラルネットワークであってよい。図3が、深層学習回帰アーキテクチャ118の一実施形態を示している。畳み込みニューラルネットワークは、少なくとも1つの特徴学習部132を備えることができる。特徴学習部は、複数の畳み込み層134を備えることができる。畳み込み層134は、一次元層であり、すなわち畳み込みは、一次元の時間ドメインに適用される。畳み込み層134の各々は、ReLUとも称される少なくとも1つの正規化線形ユニットを備えることができる。畳み込みニューラルネットワーク118は、複数のプーリング層136を備えることができる。畳み込みニューラルネットワークの構造は、例えばhttps://en.wikipedia.org/wiki/Convolutional_neural_network#Convolutionalなどから当業者に広く知られている。画像内の物体認識に畳み込みニューラルネットワークを使用することが、当業者に広く知られている。しかしながら、本発明は、1D信号分析のために畳み込みニューラルネットワークを使用する新規な手法を提案する。
畳み込みニューラルネットワーク118を、回帰問題を解くように構成することができる。回帰問題を解くために、畳み込みニューラルネットワーク118は、とくには通常の分類ソフトマックス層とは対照的に、回帰層138を最終層として備えることができる。畳み込みニューラルネットワーク118は、少なくとも1つの平坦化層140を備えることができる。
回帰層138は、全結合層139であってよい。回帰層138は、線形またはシグモイド活性化を有することができる。したがって、本発明は、回帰フレームワークにおける一次元畳み込みニューラルネットワークの使用を提案する。具体的には、本発明は、入力をピーク位置へとマッピングする複雑な関数をフィッティングするために、畳み込みニューラルネットワーク118を使用することを提案する。しかしながら、畳み込みニューラルネットワーク118は、1D信号のカテゴリへの分類に使用されなくてもよい。
図4が、訓練ステップ130の一実施形態を示している。訓練ステップは、以下のサブステップ、すなわち
i) 複数の入力質量分析応答曲線と、対応する正解とを含む少なくとも1つの訓練データセットを提供するサブステップ(参照番号142で示されている)、および
ii) 訓練データセットについて深層学習回帰アーキテクチャ118を使用することによって、少なくとも1つのモデルを決定するサブステップ(参照番号144で示されている)
を含み、
モデルを決定するサブステップは、モデルのモデルアーキテクチャおよび少なくとも1つのパラメータを決定することを含む。
ステップi)142は、100を超え、好ましくは1000を超える入力質量分析応答曲線を提供することを含むことができる。例えば、モデルを、1270個のビタミンD3曲線を使用して訓練することができる。ステップi)142において提供される複数の入力質量分析応答曲線を、質量分析装置を使用して複数の測定を実行することによって決定することができる。例えば、ステップi)142において提供される複数の入力質量分析応答曲線は、ビタミンD2またはビタミンD3などの特定の被分析物からのLC-MSデータであってよく、あるいはそのようなデータを含むことができる。正解は、対応する入力質量分析応答曲線のピークの始点および終点の実際の値または真の値であってよい。正解は、ピークの位置を示すことができる。正解を、訓練されたLC-MSオペレータが提供することができる。
質量分析装置114への注入は、4つの質量分析応答曲線、すなわち2つの被分析物質量分析応答曲線および2つの内部標準質量分析応答曲線をもたらすことができる。訓練データセットを、集積時間ベクトルと、2つの被分析物質量分析応答曲線と、2つの内部標準質量分析応答曲線とを含む5チャネルベクトルとして提供することができる。4つの応答曲線の生の時間ベクトルは、曲線ごとに少なくともわずかにずれる時間ステップを含む。集積時間ベクトルは、4つのすべての応答曲線が同じ時間グリッド上に内挿される時間ベクトルであってよい。訓練データセットを、入力データとも呼ばれる入力として、畳み込みニューラルネットワークへと提供することができる。例えば、長さNの入力質量分析応答曲線を考えると、入力は2xNの行列であってよく、第1行は、クロマトグラムのy値などのN個の強度値を表し、第2行は、クロマトグラムのx値などのN個の時間値を表すことができる。集積により、畳み込みニューラルネットワークが、例えばピークが所与の被分析物曲線においてきわめて弱い場合に、他の曲線のピーク位置を使用して弱い曲線の位置を知らせることができるように、異なる質量分析応答曲線の間で情報を伝播させることを可能にできる。
モデルの訓練130は、少なくとも1つの正規化ステップ146を含むことができる。正規化ステップ146は、入力データを時間に対して正規化することを含むことができる。正規化ステップ146は、予想保持時間が図5Bのt=0に位置するように時間値を変換することを含むことができる。正規化ステップ146は、予想保持時間の周りの固定の時間ウィンドウへと入力データを切り取ることを含むことができる。正規化ステップ146は、強度値Y自体を、以下によって正規化することを含むことができる。
Figure 2023518353000003
図5A~図5Cが、正規化および切り取りの実施形態を示している。図5Aは、元の入力データの時間(分)の関数としての強度Iを示している。図5Bは、時間に関する正規化の後の入力データを示しており、図5Cは、強度に関するさらなる正規化および切り取りの後の入力データを示している。円148が、ピークの始まりについての正解を示し、円150が、ピークの終わりの位置の正解を表している。
モデルの訓練130は、少なくとも1つの拡張ステップ152を含むことができる。被分析物間の一般化を達成するために、畳み込みニューラルネットワークを、質量分析応答曲線データのシフトおよびスケーリングの差を考慮する拡張データで訓練することができる。拡張ステップ152は、過訓練の回避を可能にすることができる。拡張ステップ152は、位置拡張および/またはスケール拡張を含むことができる。位置拡張は、ピーク位置を所定の一定値だけシフトさせることを含んでよい。位置拡張は、スライディング窓の使用を含むことができる。これにより、ピークが広がったり狭くなったりする可能性を考慮することができる。スケーリング拡張は、1.2などの所定の値によってピークをスケーリングすることを含むことができる。各々の入力質量分析応答曲線について、位置拡張を使用する3つの新しいデータセットおよびスケール拡張を使用する3つの新しいデータセットをランダムに生成することによって、訓練データセットを補足することができる。図6Bが、正解148および150を有する元の入力データを示している。図6Aが、位置拡張を示しており、元の曲線154および拡張された曲線156が描かれている。図6Cが、1.2によるスケール拡張を示している。
深層学習回帰アーキテクチャ118は、TensorFlowをバックエンドとしてPythonのKerasライブラリによって構築された畳み込みニューラルネットワーク(CNN)であってよい。TensorFlowによるPythonのKerasライブラリについては、https://www.tensorflow.org/、https://de.wikipedia.org/wiki/TensorFlow、ならびにhttps://keras.io/またはhttps://de.wikipedia.org/wiki/Kerasを参照されたい。例えば、以下の設定を使用することができる:オプティマイザとして、適応的モーメント推定(Adam)を使用することができる。損失関数は、平均二乗誤差であってよい。エポック数は500であってよく、バッチサイズは16であってよく、patienceによる早期停止は100であってよい。
訓練ステップ130は、正規化および/または拡張された訓練データセットならびに正解について深層学習回帰アーキテクチャ118を使用することを含むことができる。出力158として、モデルアーキテクチャおよびモデルの少なくとも1つのパラメータを提供することができる。
訓練ステップ130は、少なくとも1つの検査データセットを使用する少なくとも1つの検査ステップ160をさらに含むことができる。検査ステップ160は、訓練済みモデルの検証を含むことができる。検査データセットは、少なくとも1つ、好ましくは複数の質量分析応答曲線と、訓練データセットに含まれていなかった対応する正解とを含むことができる。検査ステップ160は、決定されたモデルを使用して、検査データセットの質量分析応答曲線の少なくとも1つのピークの始点および終点を決定することを含むことができる。決定されたモデルの性能を、決定された始点および終点と、検査データセットの質量分析応答曲線の正解とに基づいて判断することができる。
実験用の構成において、深層学習回帰アーキテクチャ118を、488個の固有のサンプルからのクロマトグラムの1462個の曲線、とりわけ断片曲線で訓練した。クロマトグラムは正解を含んでいた。検査ステップ160に関して、最終検証のために、10%または49個のサンプルを残した。検査ステップ160に関して、交差検証のために、488個のサンプルから439個のサンプルを使用してアルゴリズムを訓練した。交差検証のために、439個のサンプルを5つの群に分けた。5つのうち4つが訓練130に使用され、1つが検査160に使用される。これが、すべての可能な順列で行われる。本発明による方法110が、被分析物間で充分に普遍化し、自動ピーク識別の信頼性の向上を約束するLC-MSの精度を向上させることが明らかになった。
以下の表が、モデルを特定の被分析物および測定システム(拡張データシステム2と表記)で訓練し、別の被分析物および測定システム(拡張データシステム1と表記)に適用した場合の性能(ピーク位置のR)を示している。表は、同様の被分析物、すなわちビタミンD2およびビタミンD3、ならび全く異なる物質であるテストステロンを含む。
Figure 2023518353000004
110 方法
112 ステップa)
114 質量分析装置
116 ステップb)
118 深層学習回帰アーキテクチャ
120 装置
122 四重極
124 検出器
126 イオン化源
128 評価装置
130 訓練ステップ
132 特徴学習部
134 畳み込み層
136 プーリング層
138 回帰層
139 全結合層
140 平坦化層
142 ステップi)
144 ステップii)
146 正規化ステップ
148 円
150 円
152 拡張ステップ
154 元の曲線
156 拡張された曲線
158 出力
160 検査ステップ

Claims (14)

  1. 質量分析応答曲線における少なくとも1つのピークを識別するためのコンピュータによって実行される方法(110)であって、
    a) 少なくとも1つの質量分析装置(114)を使用することによって少なくとも1つの質量分析応答曲線を提供するステップ(112)と、
    b) 少なくとも1つの訓練済みモデルを使用することによって前記質量分析応答曲線を評価することにより、前記質量分析応答曲線の少なくとも1つのピークの始点および終点を識別するステップ(116)と
    を含んでおり、
    前記モデルは、深層学習回帰アーキテクチャ(118)を使用して訓練されている、方法(110)。
  2. 前記深層学習回帰アーキテクチャ(118)は、畳み込みニューラルネットワークを備える、請求項1に記載の方法(110)。
  3. 前記畳み込みニューラルネットワークは、多層畳み込みニューラルネットワークである、請求項2に記載の方法(110)。
  4. 前記畳み込みニューラルネットワークは、複数の畳み込み層(134)を備え、前記畳み込み層(134)は、一次元層である、請求項3に記載の方法(110)。
  5. 前記畳み込みニューラルネットワークは、回帰層(138)を最終層として備え、前記回帰層(138)は、線形またはシグモイド活性化を有する、請求項3または4に記載の方法(110)。
  6. 少なくとも1つの訓練ステップ(130)を備え、
    前記訓練ステップは、
    i) 複数の入力質量分析応答曲線と、対応する正解とを含む少なくとも1つの訓練データセットを提供するサブステップ(142)と、
    ii) 前記訓練データセットについて前記深層学習回帰アーキテクチャ(118)を使用することによって、少なくとも1つのモデルを決定するサブステップ(144)と
    を含み、
    前記モデルを決定するサブステップは、前記モデルのモデルアーキテクチャおよび少なくとも1つのパラメータを決定することを含む、請求項1~5のいずれか一項に記載の方法(110)。
  7. 前記訓練データセットは、集積時間ベクトルと、2つの被分析物質量分析応答曲線と、2つの内部標準質量分析応答曲線とを含む5チャネルベクトルとして提供される、請求項6に記載の方法(110)。
  8. 前記モデルの訓練(130)は、少なくとも1つの正規化ステップ(146)および/または少なくとも1つの拡張ステップ(152)を含む、請求項6または7に記載の方法(110)。
  9. 前記訓練ステップ(130)は、少なくとも1つの検査データセットを使用する少なくとも1つの検査ステップ(160)をさらに含み、前記検査ステップ(160)は、前記決定されたモデルを使用して前記検査データセットの前記質量分析応答曲線の少なくとも1つのピークの始点および終点を決定することを含み、前記決定されたモデルの性能が、前記決定された始点および終点と、前記検査データセットの前記質量分析応答曲線の正解とに基づいて判定される、請求項7または8に記載の方法(110)。
  10. 前記識別された始点および終点を使用することによって前記質量分析応答曲線の前記ピークのピーク面積を決定すること
    を含む、請求項1~9のいずれか一項に記載の方法(110)。
  11. コンピュータまたはコンピュータネットワーク上で実行されたときに、方法に関する請求項1~10のいずれか一項に記載の質量分析応答曲線における少なくとも1つのピークを識別するための方法(110)を、前記コンピュータまたはコンピュータネットワークに完全に、または部分的に実行させるように構成された、質量分析応答曲線における少なくとも1つのピークを識別するためのコンピュータプログラムであって、
    方法に関する請求項1~10のいずれか一項に記載の質量分析応答曲線における少なくとも1つのピークを識別するための方法(110)の少なくともステップb)を実行するように構成された、コンピュータプログラム。
  12. プログラムコード手段を有するコンピュータプログラム製品であって、
    前記プログラムコード手段がコンピュータまたはコンピュータネットワーク上で実行されたときに、方法に関する請求項1~10のいずれか一項に記載の質量分析応答曲線における少なくとも1つのピークを識別するための方法(110)の少なくともステップb)を実行するため、前記プログラムコード手段は、記憶媒体上に格納可能または格納されている、コンピュータプログラム製品。
  13. サンプル中の少なくとも1つの被分析物を監視するための装置(120)であって、
    - 少なくとも1つの質量分析応答曲線を提供するように構成された少なくとも1つの質量分析装置(114)と、
    - 少なくとも1つの訓練済みモデルを使用することによって前記質量分析応答曲線を評価することにより、前記質量分析応答曲線の少なくとも1つのピークの始点および終点を識別するように構成された少なくとも1つの評価装置(128)と
    を備え、
    前記モデルは、深層学習回帰アーキテクチャ(118)を使用して訓練されている、装置(120)。
  14. 方法に関する請求項1~10のいずれか一項に記載の質量分析応答曲線における少なくとも1つのピークを識別するための方法を実行するように構成された、請求項13に記載の装置(120)。
JP2022550921A 2020-03-27 2021-03-26 質量分析応答曲線における少なくとも1つのピークを識別するためのコンピュータによって実行される方法 Pending JP2023518353A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20166187 2020-03-27
EP20166187.3 2020-03-27
PCT/EP2021/057935 WO2021191421A1 (en) 2020-03-27 2021-03-26 Computer implemented method for identifying at least one peak in a mass spectrometry response curve

Publications (1)

Publication Number Publication Date
JP2023518353A true JP2023518353A (ja) 2023-05-01

Family

ID=70056863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022550921A Pending JP2023518353A (ja) 2020-03-27 2021-03-26 質量分析応答曲線における少なくとも1つのピークを識別するためのコンピュータによって実行される方法

Country Status (5)

Country Link
US (1) US20230003697A1 (ja)
EP (1) EP4127706A1 (ja)
JP (1) JP2023518353A (ja)
CN (1) CN115280143A (ja)
WO (1) WO2021191421A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114755357A (zh) * 2022-04-14 2022-07-15 武汉迈特维尔生物科技有限公司 一种色谱质谱自动积分方法、系统、设备、介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0395481A3 (en) * 1989-04-25 1991-03-20 Spectra-Physics, Inc. Method and apparatus for estimation of parameters describing chromatographic peaks
US7219038B2 (en) 2005-03-22 2007-05-15 College Of William And Mary Automatic peak identification method
EP1997050B1 (en) 2006-02-06 2016-08-10 Siemens Healthcare Diagnostics Inc. Methods for resolving convoluted peaks in a chromatogram
US8428889B2 (en) * 2010-10-07 2013-04-23 Thermo Finnigan Llc Methods of automated spectral peak detection and quantification having learning mode
EP3467493A4 (en) * 2016-05-30 2019-07-24 Shimadzu Corporation CHROMATOGRAPHIC DEVICE
ES2894840T3 (es) 2017-07-04 2022-02-16 Hoffmann La Roche Sistema y procedimiento de diagnóstico clínico automatizado
CN111373256B (zh) * 2017-11-09 2022-07-22 株式会社岛津制作所 波形分析装置
CN110895799B (zh) * 2018-09-13 2023-05-09 岛津分析技术研发(上海)有限公司 提高质谱谱图质量的方法、计算机存储介质、以及电子终端
CN110110743B (zh) * 2019-03-26 2019-12-31 中国检验检疫科学研究院 一种七类质谱谱图自动识别系统与方法
CN110838340B (zh) * 2019-10-31 2020-07-10 军事科学院军事医学研究院生命组学研究所 一种不依赖数据库搜索的蛋白质生物标志物鉴定方法

Also Published As

Publication number Publication date
US20230003697A1 (en) 2023-01-05
CN115280143A (zh) 2022-11-01
EP4127706A1 (en) 2023-02-08
WO2021191421A1 (en) 2021-09-30

Similar Documents

Publication Publication Date Title
Gika et al. A QC approach to the determination of day-to-day reproducibility and robustness of LC–MS methods for global metabolite profiling in metabonomics/metabolomics
CN104170052B (zh) 用于改进的质谱分析法定量作用的方法和装置
CN110214271B (zh) 分析数据解析方法以及分析数据解析装置
JP2022525427A (ja) 質量分析法データにおける境界の自動検出
CN108982729A (zh) 用于提取质量迹线的系统和方法
JP6748085B2 (ja) 干渉検出および着目ピークのデコンボルーション
WO2023031447A1 (en) Method for automated quality check of chromatographic and/or mass spectral data
Habchi et al. An innovative chemometric method for processing direct introduction high resolution mass spectrometry metabolomic data: Independent component–discriminant analysis (IC–DA)
US20230003697A1 (en) Computer-implemented method for identifying at least one peak in a mass spectrometry response curve
Yu et al. A chemometric-assisted method based on gas chromatography–mass spectrometry for metabolic profiling analysis
JP2023527062A (ja) 定量器-確認器比チェックのために顧客質量分析機器を較正するためのコンピュータ実装方法
KR20220029722A (ko) 자동 피크 통합을 위한 방법 및 장치
Gu et al. Solving signal instability to maintain the second-order advantage in the resolution and determination of multi-analytes in complex systems by modeling liquid chromatography–mass spectrometry data using alternating trilinear decomposition method assisted with piecewise direct standardization
JP7334788B2 (ja) 波形解析方法及び波形解析装置
Kehimkar et al. Targeted mass spectral ratio analysis: A new tool for gas chromatography—mass spectrometry
WO2024013240A1 (en) A method for quality check of at least one lc-ms measurement
US11913922B2 (en) Techniques for targeted compound analysis
JP2023541926A (ja) 少なくとも1つのクロマトグラムにおける少なくとも1つの干渉および/または少なくとも1つのアーチファクトを検出するためのコンピュータ実装方法
JP2023553964A (ja) 少なくとも1つの質量分析装置のパラメータ設定を最適化するための方法
Delabrière New approaches for processing and annotations of high-throughput metabolomic data obtained by mass spectrometry
Balogh Spectral interpretation, Part II: Tools of the trade
JP2023506285A (ja) 複数の反復ハードウェア構成要素を有する少なくとも1つの分析装置を較正するための方法
Dias et al. Evaluation of Cortisol Levels in Artificial Saliva by Paper Spray Mass Spectrometry
Guo Development of analytical methods and bioinformatic programs for data acquisition and data processing in LC-MS-based untargeted metabolomics
Khandaker Assessing the inter-instrument variation in clinical metabolic phenotyping workflows

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231005