JP7456665B2 - 核酸マススペクトル数値処理方法 - Google Patents

核酸マススペクトル数値処理方法 Download PDF

Info

Publication number
JP7456665B2
JP7456665B2 JP2022535644A JP2022535644A JP7456665B2 JP 7456665 B2 JP7456665 B2 JP 7456665B2 JP 2022535644 A JP2022535644 A JP 2022535644A JP 2022535644 A JP2022535644 A JP 2022535644A JP 7456665 B2 JP7456665 B2 JP 7456665B2
Authority
JP
Japan
Prior art keywords
peak
mass spectrum
mass
value
intensity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022535644A
Other languages
English (en)
Other versions
JP2023515296A (ja
Inventor
建▲偉▼ ▲樹▼
双▲紅▼ 相
松炯 汪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Digena Diagnosis Technology Co Ltd
Original Assignee
Zhejiang Digena Diagnosis Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Digena Diagnosis Technology Co Ltd filed Critical Zhejiang Digena Diagnosis Technology Co Ltd
Publication of JP2023515296A publication Critical patent/JP2023515296A/ja
Application granted granted Critical
Publication of JP7456665B2 publication Critical patent/JP7456665B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • G06F2218/06Denoising by applying a scale-space analysis, e.g. using wavelet analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks

Landscapes

  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Description

本発明は核酸マススペクトル(MASS SPECTRUM)技術分野に属し、具体的に核酸マススペクトル数値処理方法に関する。
マススペクトル技術は、迅速、正確、高感度などの利点があり、近年では、生物学的分析に広く使用されている。生命の基本物質である核酸は、生物体の生長、発育、繁殖、遺伝および変異などの重大生命現象において重要な役割を果たしている。現代バイオテクノロジーでは、大部分の生理的または疾患的性状がいずれも一連の核酸配列に存在する遺伝子調節によって発現されることを発見した。したがって、核酸に対して、正確なヌクレオチド(nucleotide)検測が特に重要である。マススペクトル数値処理は、ヌクレオチド検測の前に必要不可欠な部分として、その重要さは自明である。現在、類似な方法において、データ採取転化率が低く、データ不均衡などの問題が存在し、これらの問題がヌクレオチド検測の結果に深刻な影響を及ぼしており、この点についてはさらなる研究が必要である。
本発明の目的は、マススペクトルデータの採取プロセスに存在する低転化率、データ不均衡などの問題に対し、遺伝子分析前に信頼性の高い特徴値を抽出する核酸マススペクトル数値処理方法を提供することにある。当該方法は、先行技術の制限を改善し、ヌクレオチド検測の正確性を向上させることを目標とする核酸マススペクトル数値処理方法である。
本発明は、以下の技術方案を通じて実現したものである。
核酸マススペクトル数値処理方法は、ステップS1、ステップS2、ステップS3、ステップS4を含む。
ステップS1:単一のマススペクトルの再校正ステップであり、サンプルの各検測点に対し、検測点の異なる位置に対応する複数のマススペクトルを得る。各マススペクトルは、一組の予想質量電荷比を有する特殊なピークであるアンカーピークで再校正が行われる必要がある。
ステップS2:マススペクトルの合成ステップであり、ステップS1を基に、検測点の同じ位置に対応する複数のマススペクトルで当該検測点の単一マススペクトルを合成する。
ステップS3:ウェーブレットのフィルタリング(wavelet filtering)ステップであり、ステップS2を基に、ウェーブレットベースデジタルフィルターで高周波ノイズとベースライン(baseline)を除去する。
ステップS4:ピーク特徴値の抽出ステップであり、ステップS3を基に、ピークのフィット(peak fitting)を行い、マススペクトルのフィットされた曲線に基づいて、ピーク高さと、ピーク幅と、ピーク面積と、マスオフセットと、信号対ノイズ比(Signal to Noise ratio、SNR)とを得る。
好ましくは、上記ステップS1において、単一のマススペクトルに対して再校正を行うステップは、ステップS11乃至ステップS15を含む:
ステップS11:候補参照ピークの選択ステップであり、ピーク値が特定区間の質量範囲内に位置しなければらなないとの一つ目の基準と、特定区間の質量範囲内に隣接する参照ピークがないとの二つ目の基準で、全ての可能な予想ピークから一組の参照ピークを選択する。
ステップS12:ピークの位置決めステップであり、幅が9である重み行列畳み込みフィルターをマススペクトルに応用し、行列として(-4,0,1,2,2,2,1,0,-4)が好ましい。マススペクトルの所定点に対して、当該フィルタリングが応用された強度値が周囲9つの値の加重和に等しく、以下の式で示される。
Figure 0007456665000001
フィルタリング後の強度値に基づいて、総マススペクトルを特定点の間隔に分解し、各間隔に対して、局所ノイズを認識し、局所ノイズの4倍以上であり且つ全般の最小値以上の強度を有するものを候補ピークとして認識し、最小値として、0.01×最大局所最大値が好ましい。
ステップS13:マススペクトルのピークをフィットするステップである。
ステップS14:最終アンカーピークの選択ステップであり、検測されたピーク値リストに対して、まずカットオフSNR(cut-off SNR)である最小SNRを見つけて、検測されたピークを候補参照ピークリストとマッチングして、質量が候補参照ピークの特定範囲内にあり且つSNRがカットオフSNRより高いピークのみ選択する。
ステップS15:再校正するステップであり、得られたアンカーピーク及びこれらの予想質量に合わせ、非線性フィットの方法を利用して校正係数を算出する。ここで、質量分析計とm/z(質量電荷比)との間のマッピング関数がBruck関数(ブルカー関数)であり、関数形態が以下のとおりであると仮定する。
Figure 0007456665000002
さらに、上記ステップS13において、ピークフィットステップは、具体的にステップS131乃至ステップS136を含む:
ステップS131:予想線幅を確定する。
ステップS132:予想信号の領域がNN個の予想線幅の間隔内で遮蔽され、NNが4であることが好ましい。
ステップS133:MMλ区間内のマススペクトルの強度yの平均値をインプリシットベースラインとして算出し、ここでλは当該区間内の一番小さい推定線幅であり、ここでMMが80であることが好ましい。当該区間の遮蔽領域内において、線形補間でyの値を提供する。
ステップS134:(信号-ベースライン)の作動の有効値(Root Mean Square、RMS)をノイズレベルとして算出する。
ステップS135:点の遮蔽ステップであり、ピーク領域内において、SNR(ピーク高さとノイズの比をSNRとして算出する)が所定値より高く且つノイズが所定値より高い点がさらに遮蔽される。
ステップS136:各ピークの特定数の推定線幅内がフィット領域として確定され、重ねるピークがない場合、Levenberg-Marquardtアルゴリズムで単一のガウスピーク(Gaussian peak)をフィットし、指定パラメータを見つけて最適化関数を最小化させる。
さらに、上記ステップS131において、予想線幅を確定するステップは、具体的に、
λ=L+L・Mとの式で表し、
ここで、LとLがデフォルトパラメータであり、Mが所定のピーク値(Da)であるステップを含む。
さらに、上記ステップS136において、最適化関数は、以下のとおりである。
Figure 0007456665000003
ここで、総和は指定の区間において全ての{y,m}に対して和を求めるものであり、Hは点Mに対応するベースライン上方のフィット高度にであり、パラメータM、λはフィット質量、フィット線幅を示し、σは条件応じて特定のパラメータに所定する。
さらに好ましい態様として、上記ステップS4において、特徴値を抽出するステップは、具体的に、ステップS41乃至ステップS42を含む。
ステップS41:ピークをフィットするステップとして、ステップS13と同じである。
ステップS42:
一、フィットされたピーク値の中心のベースライン以上の高度Hと、
二、フィット線幅λと、
三、ピークオフセット(フィットされたピーク値の中心と予想ピーク値の中心の距離)であるδ=M-Mと、
四、4λ範囲内でフィットされたピークとベースラインとの間の面積Aと、
五、SNR=H/N(M)である信号対ノイズ比と、
六、V=A/SNRである面積分散と、
七、フィット面積差Δであるフィットされた強度と測定強度との二乗の差の和の平方根と、
の特徴を記録するステップである。
本発明には、以下のような利点がある。
1、本発明の核酸マススペクトル数値処理方法は、遺伝子分析前に信頼性の高い特徴値を抽出して、先行技術の制限を改善し、ヌクレオチド検測の正確性を向上させることを目標とする。
2、核酸マススペクトル数値処理方法は、核酸マススペクトルデータ採取の信頼性の向上させる。
図1はフィルタリング前のマススペクトルを示す図である。 図2はフィルタリング後のマススペクトルを示す図である。 図3はピーク値のフィット前後の対比図である。
次に、図と実施例を参照して、本発明の内容をさらに詳しく説明する。
本発明は、核酸マススペクトル数値処理方法であり、ステップS1乃至ステップS4を含む。
ステップS1:単一のマススペクトルの再校正ステップである。単一のサンプルに対し、サンプル検測点の異なる位置に対応する複数の(通常n=5)マススペクトルを得る。各マススペクトルは、実質上、複数回のレーザー励起(通常、n=20)のマススペクトルの和である。マススペクトルの初期係数は、質量分析計(Mass Spectrometer)とm/z(質量電荷比)との間のマッピング関数が二次関数(関数形式がm=At+Bt+Cである)であると仮定して生成されたもので、マススペクトルに対して和を算出する前に、マススペクトルの再校正を行う必要がある。再校正プロセスは、アンカーピーク(anchor peak)と呼ばれる一組の特殊認識ピークをその予想質量をマッチングすることで実現し、ステップS11乃至ステップS15に従って行う。
ステップS11:候補参照ピークの選択ステップであり、
1、ピーク値が4000Daと9000Daの質量範囲内に位置しなければならないとの基準と、
2、ピーク値が質量±分解能で定義された質量範囲内に隣接する参照ピークがないとの基準で、
全ての可能な予想ピークからクリーンな参照ピーク(clean reference peak)を一組選択する。
ステップS12:ピークの位置決めステップであり、幅が9である重み行列畳み込みフィルターをマススペクトルに応用し、行列として(-4,0,1,2,2,2,1,0,-4)が好ましい。マススペクトルの所定点について、当該フィルタリングが応用された強度値が周囲9つの値の加重和に等しく、以下の公式で示される。
Figure 0007456665000004
フィルタリング後の強度値に基づいて、比較的に小さなスライドウィンドウ(n=±3)を使用して局所最大値を認識する。その後、マススペクトル全体を500個点ごとに一つの区間に分けて、各区間に対して、周囲1500点ウィンドウ(±区間一つ)内の局所最大値の33%を局所ノイズとして認識する。局所ノイズの四倍以上であり且つ全般の最小値以上である強度を持つピークを候補ピークとして認識し、最小値が0.01×最大局所最大値であることが好ましい。認識されたピークリストに対して、一定の範囲内に隣接候補ピークが存在し、SNR(フィルタリング後の強度値と局所ノイズの比)≦2及び質量値が予め指定された候補参照ピーク範囲外であるピークが除去させる。最後に、原始強度に基づいてピーク値指数を調整する。フィルター応用前後のマススペクトルとして、図1、図2を参照する。
ステップS13:マススペクトルのピークをフィットするステップであり、図3を参照し、具体的な実現ステップとして、以下のようである。
ステップS131:予想線幅を確定するステップであり、予想線幅は、
λ=L+L・Mとの式で確定する。
ここで、LとLがデフォルトパラメータ(デフォルト値がそれぞれ2.5、0.0005である)であり、Mが所定のピーク値(Da)である。
ステップS132:予想信号の領域がNN個の予想線幅の間隔内で遮蔽され、NNが4であることが好ましい。
ステップS133:MMλ区間内のマススペクトルの強度yの平均値をインプリシットベースラインとして算出し、ここでλは当該区間内の一番小さい推定線幅であり、MMが80であることが好ましい。当該区間の遮蔽領域内において、線形補間を使用してyの値を提供する。
ステップS134:(信号-ベースライン)の作動の有効値(RMS)をノイズレベルとして算出する。
ステップS135:ピーク領域内において、SNR(ピーク高さとノイズの比をSNRとして算出する)が5を超え且つノイズが1を超える点がさらに遮蔽される。
ステップS136:各ピークの4個の推定線幅内がフィット領域として確定され、重ねるピークがない場合、Levenberg-Marquardtアルゴリズムで単一のガウスピークをフィットし、最適化関数(関数の原型は以下の通り)を最小化させるパラメータM、λ(フィット質量、フィット線幅)を見つける。
Figure 0007456665000005
総和は指定の区間において全ての{y,m}に対して和を求めるものであり、Hは点Mのベースライン上方のフィット高度に該当する。ピーク値の中心から0.5λ以内の点について、σを1とし、ピーク値の中心から0.5λ以外の点について、σを0.2または0.4とする。
ステップS14:最終アンカーピークの選択ステップであり、検測されたピーク値リストに対して、まずカットオフSNR(即ち最小SNR)を見つけ出し、検測されたピークを候補参照ピークリストとマッチングして、質量が候補参照ピーク±25Da内にあり且つSNRがカットオフSNRより高いピークのみ選択する。
ステップS15:再校正ステップであり、得られたアンカーピーク及びそれらの予想質量に合わせ、非線性フィットの方法を利用して校正係数を算出する。ここで、質量分析計とm/z(質量電荷比)との間のマッピング関数がBruck関数であり、関数形態が以下の通りであると仮定する。
Figure 0007456665000006
ステップS2:マススペクトルの合成ステップであり、ステップS1を基に、点の異なる位置に対応するいくつかのマススペクトルを総集して当該検測点の唯一なマススペクトルとする。複数のマススペクトルを合成する方法が「自己加重平均値(self-weighted average)」であり、以下の式で表現できる。
Figure 0007456665000007
ここで、nがマススペクトルの数であり、I が質量iの平均強度であり、Iijがj個目のマススペクトルの質量iに由来する強度である。当該マススペクトルが異なるの校正係数を有する場合、マススペクトルからアンカーピークが一番多い最優マススペクトルを選択する。最優マススペクトルで、加算されたマススペクトルを初期化する。当該校正係数と最優スペクトルの校正係数が条件(Aが1%内で変化する。Bが10%以内で変化する。Cが当該20Da以内で変化する)を満たす場合のみに、当該マススペクトルをもう一つのマススペクトルの絶対強度または平方強度と和を求める。
ステップS3:ウェーブレットフィルタリングステップであり、高周波ノイズとベースラインとを除去するために、ウェーブレットベースフィルタリングが合成されたマススペクトルで完成される。その後当該フィルタリング後のマススペクトルに対してもう一回の再校正を行う。今回の再校正の後、新たなABC係数を合成マススペクトルに分配し、これに合わせてm/z値を調整する。
ステップS4:ピーク特徴値の抽出ステップであり、図3を参照し、フィットプロセスは、以下のようなステップに従う。
ステップS41:ピークをフィットするステップとして、ステップS13と同様である。
ステップS42:フィットするには、
一、フィットされたピーク値の中心のベースライン以上の高度Hと、
二、フィット線幅λと、
三、ピークオフセット(フィットされたピーク値の中心と予想ピーク値の中心の距離)であるδ=M-Mと、
四、4λ範囲内において、フィットされたピークとベースラインとの間の面積Aと、
五、SNR=H/N(M)である信号対ノイズ比と、
六、V=A/SNRである面積分散と、
七、フィット面積差Δであるフィットされた強度と測定強度との二乗の差の和の平方根と、の特徴を成功的に記録する。
本発明の核酸マススペクトル数値処理方法は、遺伝子分析前に信頼性の高い特徴値を抽出し、先行技術の制限を改善し、ヌクレオチド検測の正確性を向上させることを目標とする。核酸マススペクトル数値処理方法は、核酸マススペクトルデータ採取の信頼性を向上させる。

Claims (8)

  1. 単一のマススペクトルを再校正するステップであって、サンプルの各検測点に対して、検測点の異なる位置に対応する複数のマススペクトルを得て、複数のマススペクトルの各マススペクトルは、一組の予想質量電荷比を有するアンカーピークで再校正が行われる、ステップS1と、
    マススペクトルを合成するステップであって、ステップS1を基に、検測点の異なる位置に対応する複数のマススペクトルを当該検測点の単一マススペクトルに合成するステップS2と、
    検測点の単一マススペクトルにおいてウェーブレットでフィルタリングするステップであって、ステップS2を基に、ウェーブレットベースデジタルフィルターで高周波ノイズとベースラインを除去するステップS3と、
    ピーク特徴値を抽出するステップであって、ステップS3を基に、ピークのフィットを行い、検測点の単一マススペクトルのフィットされた曲線を得て、前記フィットされた曲線に基づいて、ピーク高さと、ピーク幅と、ピーク面積と、ピークオフセットと、信号対ノイズ比とを得るステップS4と、を含み、
    単一マススペクトル中の強度値の数が、9以上であり、
    前記ステップS1の単一マススペクトルを再校正するステップは、
    一組の参照ピークの選択ステップであって、参照ピークのピーク値が必ず特定区間の質量範囲内の位置にあるとの一つ目の基準と、特定区間の質量範囲内に参照ピークに隣接する参照ピークがないとの二つ目の基準で、全ての可能な予想ピークから前記一組の参照ピークを選択するステップS11と、
    ピークの位置決めステップであって、総マススペクトルを得るために幅が9である重み行列畳み込みフィルターを単一マススペクトルに応用し、行列として(-4,0,1,2,2,2,1,0,-4)を用い、単一マススペクトルの所定点について、当該フィルタリングが応用されたフィルタリング後の強度値が所定点の周囲9点の9つの強度値の加重和に等しく、以下の式で示され、
    ここで、y' は、所定点のフィルタリング後の強度値を示し、I は、所定点の周囲9点の9つの強度値のうちのk番目の強度値を示し、y は、重み行列畳み込みフィルターのk番目の値を示し、iは、所定点の強度値を示し、所定点の周囲9点は、所定点よりも前の連続する4点、所定点よりも後の連続する4点、および所定点自体を含み、
    総マススペクトルにおいてフィルタリング後の強度値に基づいて、総マススペクトルを特定点の間隔に分解し、各特定点の間隔に対して、局所ノイズを認識し、総マススペクトル中で、局所ノイズの4倍以上であり且つ全般の最小値以上の強度を有するものを検測されたピーク値リストの候補ピークとして認識し、最小値として、0.01×最大局所最大値を用いるステップS12と、
    総マススペクトルをフィットするステップS13と、
    最終アンカーピークの選択ステップであって、検測されたピーク値リストに対して、まずカットオフ信号対ノイズ比を見つけて、検測されたピーク値リストの候補ピークを参照ピークリストとマッチングして、検測されたピーク値リストにおいて、質量が参照ピークのリストの任意の参照ピークの特定範囲内にあり且つ信号対ノイズ比がカットオフ信号対ノイズ比より高い候補ピークのみをアンカーピークとして選択し、予想質量電荷比を有する一組のアンカーピークの各アンカーピークは、ステップS14に従って選択され、予想質量電荷比を有する一組のアンカーピークは、ステップS14において選択されたアンカーピークを含む、ステップS14と、
    一マススペクトルにおいて再校正するステップであって、一組のアンカーピーク及び一組のアンカーピークの各アンカーピークの予想質量に合わせ、非線性フィットの方法を利用して算出された校正係数に従って行われ、ここで、質量分析計と質量電荷比との間のマッピング関数がBruck関数であり、関数形態が
    であり、A、B、及びCは校正係数、mはピークの質量電荷比、tは質量分析計に現れる信号の時間を示す、ステップS15と、を含む、核酸マススペクトル数値処理方法。
  2. 前記ステップS2は、
    自己加重平均値方法を使用して前記複数のマススペクトルを合成するステップを含み、
    自己加重平均値方法を使用して前記複数のマススペクトルを合成するステップは、
    当該マススペクトルが異なる校正係数を有する場合、マススペクトルからアンカーピークが一番多い最優マススペクトルを選択するステップと、
    複数のマススペクトルのうち、前記最優マススペクトルを除く、一つ以上のマススペクトルの校正係数と、前記最優マススペクトルの校正係数とが条件を満たす場合、一つ以上の処理されたマススペクトルを得るために、前記一つ以上のマススペクトルを前記最優マススペクトルで初期化するステップと、
    前記最優マススペクトルの絶対強度または平方強度と前記一つ以上の処理されたマススペクトルの絶対強度または平方強度との和を求めるステップと、を含む、請求項1に記載の核酸マススペクトル数値処理方法。
  3. 前記ステップS3は、高周波ノイズとベースラインとを除去してフィルタリング後のマススペクトルを得るために、ウェーブレットベースフィルタリングが検出点の単一マススペクトルで完成され、その後、前記フィルタリング後のマススペクトルに対して再校正をもう一回行い、これに合わせて質量電荷比値を調整する、請求項1に記載の核酸マススペクトル数値処理方法。
  4. 前記ステップS4は、
    単一マススペクトルのピークをフィットしてフィットされたピークを得るステップS41と、
    一、前記フィットされたピーク値の中心のベースライン以上の高度Hと、
    二、フィット線幅λと、
    三、ピークオフセットであるフィットされたピーク値の中心と予想ピーク値の中心の距離であるδ=M-Mと、
    四、4λ範囲内でフィットされたピークとベースラインとの間の面積Aと、
    五、SNR=H/N(M)である信号対ノイズ比と、
    六、V=A/SNRである面積分散と、
    七、フィット面積差Δであるフィットされた強度と測定強度との二乗の差の和の平方根と、の特徴を記録するステップS42と、を含む、請求項1に記載の核酸マススペクトル数値処理方法。
  5. 前記ステップS13の総マススペクトルをフィットするステップは、
    予想線幅を確定するステップS131と、
    予想信号の領域がNN個の予想線幅の間隔内で遮蔽され、NNが4であるステップS132と、
    MMλ区間内の単一のマススペクトルの強度yの平均値をインプリシットベースラインとして算出し、当該MMλ区間の遮蔽領域内において、線形補間でyの値を提供し、λが当該MMλ区間内の一番小さい推定線幅であり、MMが80であるステップS133と、
    信号-ベースラインの作動の有効値をノイズレベルとして算出するステップS134と、
    点の遮蔽ステップであって、ピーク領域内において、ピーク高さとノイズの比として算出する信号対ノイズ比が当該比の所定値より高く且つノイズが当該ノイズの所定値より高い点がさらに遮蔽されるステップS135と、
    各ピークの特定数の推定線幅内がフィット領域として確定され、重ねるピークがない場合、Levenberg-Marquardtアルゴリズムで単一のガウスピークをフィットし、指定パラメータを見つけて最適化関数を最小化させるステップS136と、を含む、請求項1に記載の核酸マススペクトル数値処理方法。
  6. 前記自己加重平均値方法は以下の式で表され、
    nがマススペクトルの数であり、I- が質量iの平均強度であり、Iijがj個目のマススペクトル質量iに由来する強度である、請求項2に記載の核酸マススペクトル数値処理方法。
  7. 前記ステップS131の予想線幅は、λ=L+L・Mとの式で表され、
    とLがデフォルトパラメータであり、Mが所定のピーク値である、請求項5に記載の核酸マススペクトル数値処理方法。
  8. 前記ステップS136の最適化関数は、以下の式で表され、
    総和は指定の区間において全ての{y,m}に対して和を求めるものであり、Hは点Mに対応するベースライン上方のフィット高度であり、パラメータM、λはフィット質量、フィット線幅を表し、σは条件に応じて特定のパラメータに所定する、請求項5に記載の核酸マススペクトル数値処理方法。
JP2022535644A 2020-02-10 2020-12-09 核酸マススペクトル数値処理方法 Active JP7456665B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202010084107.4A CN111325121B (zh) 2020-02-10 2020-02-10 一种核酸质谱数值处理方法
CN202010084107.4 2020-02-10
PCT/CN2020/134810 WO2021159833A1 (zh) 2020-02-10 2020-12-09 一种核酸质谱数值处理方法

Publications (2)

Publication Number Publication Date
JP2023515296A JP2023515296A (ja) 2023-04-13
JP7456665B2 true JP7456665B2 (ja) 2024-03-27

Family

ID=71172661

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022535644A Active JP7456665B2 (ja) 2020-02-10 2020-12-09 核酸マススペクトル数値処理方法

Country Status (5)

Country Link
US (1) US20220383979A1 (ja)
EP (1) EP4016379B1 (ja)
JP (1) JP7456665B2 (ja)
CN (1) CN111325121B (ja)
WO (1) WO2021159833A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111325121B (zh) * 2020-02-10 2024-02-20 浙江迪谱诊断技术有限公司 一种核酸质谱数值处理方法
CN112444556B (zh) * 2020-09-27 2021-12-03 浙江迪谱诊断技术有限公司 一种飞行时间核酸质谱参数确定方法
CN112378986B (zh) * 2021-01-18 2021-08-03 宁波华仪宁创智能科技有限公司 质谱分析方法
CN112877412B (zh) * 2021-02-05 2022-09-27 浙江迪谱诊断技术有限公司 一种检测核酸质谱设备性能的方法
CN113659961B (zh) * 2021-07-19 2024-01-30 广东迈能欣科技有限公司 一种应用于二氧化碳传感器的滤波算法
CN114487073B (zh) * 2021-12-27 2024-04-12 浙江迪谱诊断技术有限公司 一种飞行时间核酸质谱数据校准方法
CN114023379B (zh) * 2021-12-31 2022-05-13 浙江迪谱诊断技术有限公司 一种确定基因型的方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030180748A1 (en) 1999-10-13 2003-09-25 Andreas Braun Methods for generating databases and databases for identifying polymorphic genetic markers
US20090006002A1 (en) 2007-04-13 2009-01-01 Sequenom, Inc. Comparative sequence analysis processes and systems
US20140306104A1 (en) 2013-04-10 2014-10-16 Bruker Daltonik Gmbh High-throughput mass-spectrometric characterization of samples
US20160240359A1 (en) 2011-03-07 2016-08-18 Micromass Uk Limited Dynamic Resolution Correction of Quadrupole Mass Analyser
WO2019150576A1 (ja) 2018-02-05 2019-08-08 株式会社島津製作所 質量分析装置及び質量分析装置における質量較正方法
CN110196274A (zh) 2019-04-25 2019-09-03 上海裕达实业有限公司 可降低噪声的质谱装置及方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1469314B1 (en) * 2001-12-08 2008-08-06 Micromass UK Limited Method of mass spectometry
EP2160570A4 (en) * 2007-06-02 2012-12-05 Cerno Bioscience Llc SELF-CALIBRATION APPROACH FOR MASS SPECTROMETRY
CN105334279B (zh) * 2014-08-14 2017-08-04 大连达硕信息技术有限公司 一种高分辨质谱数据的处理方法
FR3035410B1 (fr) * 2015-04-24 2021-10-01 Biomerieux Sa Procede d'identification par spectrometrie de masse d'un sous-groupe de microorganisme inconnu parmi un ensemble de sous-groupes de reference
WO2017180652A1 (en) * 2016-04-11 2017-10-19 Applied Proteomics, Inc. Mass spectrometric data analysis workflow
CN107545213B (zh) * 2016-06-28 2021-04-02 株式会社岛津制作所 基于飞行时间质谱的信号处理方法、系统及电子设备
EP3805748A4 (en) * 2018-05-30 2021-06-23 Shimadzu Corporation SPECTRAL DATA PROCESSING DEVICE AND ANALYSIS DEVICE
CN109145873B (zh) * 2018-09-27 2022-03-22 广东工业大学 基于遗传算法的光谱高斯峰特征提取算法
CN109726667B (zh) * 2018-12-25 2021-03-02 广州市锐博生物科技有限公司 质谱数据处理方法和装置、计算机设备、计算机存储介质
CN109632860A (zh) * 2019-01-15 2019-04-16 中国科学院昆明植物研究所 一种解析混合物中单体化合物结构的方法
CN110441253A (zh) * 2019-07-22 2019-11-12 杭州华聚复合材料有限公司 一种快速检测PP-g-MAH接枝率的方法
CN111325121B (zh) * 2020-02-10 2024-02-20 浙江迪谱诊断技术有限公司 一种核酸质谱数值处理方法
CN114487072B (zh) * 2021-12-27 2024-04-12 浙江迪谱诊断技术有限公司 一种飞行时间质谱峰拟合方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030180748A1 (en) 1999-10-13 2003-09-25 Andreas Braun Methods for generating databases and databases for identifying polymorphic genetic markers
US20090006002A1 (en) 2007-04-13 2009-01-01 Sequenom, Inc. Comparative sequence analysis processes and systems
US20160240359A1 (en) 2011-03-07 2016-08-18 Micromass Uk Limited Dynamic Resolution Correction of Quadrupole Mass Analyser
US20140306104A1 (en) 2013-04-10 2014-10-16 Bruker Daltonik Gmbh High-throughput mass-spectrometric characterization of samples
WO2019150576A1 (ja) 2018-02-05 2019-08-08 株式会社島津製作所 質量分析装置及び質量分析装置における質量較正方法
CN110196274A (zh) 2019-04-25 2019-09-03 上海裕达实业有限公司 可降低噪声的质谱装置及方法

Also Published As

Publication number Publication date
EP4016379C0 (en) 2024-01-31
CN111325121A (zh) 2020-06-23
WO2021159833A1 (zh) 2021-08-19
CN111325121B (zh) 2024-02-20
US20220383979A1 (en) 2022-12-01
JP2023515296A (ja) 2023-04-13
EP4016379B1 (en) 2024-01-31
EP4016379A1 (en) 2022-06-22
EP4016379A4 (en) 2022-12-14

Similar Documents

Publication Publication Date Title
JP7456665B2 (ja) 核酸マススペクトル数値処理方法
EP1685517B1 (en) Methods for calibrating mass spectrometry (ms) and other instrument systems and for processing ms and other data
JP5068541B2 (ja) 液体クロマトグラフィ/質量分析データ中のピークを同定し、スペクトルおよびクロマトグラムを形成するための装置および方法
US20110282588A1 (en) Method to automatically identify peaks and monoisotopic peaks in mass spectral data for biomolecular applications
GB2439795A (en) Obtaining mass spectra from a time-of-flight mass spectrometer
WO2006000879A1 (en) Automatic background removal for input data
CN110763913B (zh) 一种基于信号分段分类的导数谱平滑处理方法
CN110298414B (zh) 基于去噪组合降维和引导滤波的高光谱图像分类方法
CN114487073B (zh) 一种飞行时间核酸质谱数据校准方法
CN114993891B (zh) 基于余弦相似度的颗粒物拉曼检测方法
CN114609319B (zh) 基于噪声估计的谱峰识别方法及系统
CN115984110A (zh) 一种基于Swin-Transformer的二阶光谱注意力高光谱图像超分辨率方法
CN113008815A (zh) 一种基于高光谱图像信息无损检测酸枣仁中总黄酮的方法
CN105718723B (zh) 一种质谱数据处理中谱峰位置检测方法
EP1971928A2 (en) Spectrometric data cleansing
Antoniadis et al. Peaks detection and alignment for mass spectrometry data
CN110378268B (zh) 高光谱快速目标检测方法及系统
CN117609831A (zh) 一种基于随机矩阵的变压器局放检测方法、介质及系统
CN116879409A (zh) 一种基于气体传感器的水果果实损伤的分析检测方法
CN114487072B (zh) 一种飞行时间质谱峰拟合方法
CN115359847A (zh) 蛋白质组学串联质谱图寻峰算法
CN112730373A (zh) 一种用于深度学习训练的拉曼光谱数据集分析方法
CN112150481A (zh) 一种白粉病图像分割方法
CN117647501B (zh) 基于icp光谱特征的食品中元素智能检测方法及系统
CN112161966B (zh) 一种含有荧光光谱的样本拉曼光谱的分离方法和装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220609

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220609

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230905

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240123

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240307

R150 Certificate of patent or registration of utility model

Ref document number: 7456665

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150