JP2021135083A - 統計的手法によるクロマトグラムの分類方法 - Google Patents

統計的手法によるクロマトグラムの分類方法 Download PDF

Info

Publication number
JP2021135083A
JP2021135083A JP2020029258A JP2020029258A JP2021135083A JP 2021135083 A JP2021135083 A JP 2021135083A JP 2020029258 A JP2020029258 A JP 2020029258A JP 2020029258 A JP2020029258 A JP 2020029258A JP 2021135083 A JP2021135083 A JP 2021135083A
Authority
JP
Japan
Prior art keywords
data
chromatogram data
chromatogram
value
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020029258A
Other languages
English (en)
Other versions
JP7443815B2 (ja
Inventor
原一 植松
Genichi Uematsu
原一 植松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tosoh Corp
Original Assignee
Tosoh Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tosoh Corp filed Critical Tosoh Corp
Priority to JP2020029258A priority Critical patent/JP7443815B2/ja
Publication of JP2021135083A publication Critical patent/JP2021135083A/ja
Application granted granted Critical
Publication of JP7443815B2 publication Critical patent/JP7443815B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】本発明の目的は、クロマトグラムのパターン推定から検体の特性を推測することを可能とする方法を提供する。【解決手段】液体クロマトグラフィにより得られる糖化ヘモグロビンのクロマトグラムデータに対して、前記クロマトグラムデータの開始点の出力値が0となるように一次加工を行い、一次加工されたクロマトグラムデータの特定成分ピークの出力値で任意の値を除算して得られる値を、前記一次加工されたクロマトグラムデータに乗算する二次加工を行い、二次加工されたクロマトグラムデータの出力値のうち、規定値を超えている点について前記規定値に置き換える三次加工を行い、得られた三次加工されたクロマトグラムデータのデータ群でクラスター解析することを特徴とする方法。【選択図】図4

Description

本発明は、クラスター解析を利用したクロマトグラムのパターン推定を行う方法に関するものである。
糖尿病の指標の1つであるヘモグロビン内の糖化ヘモグロビン量(s−A1c)は、臨床現場で多く使用されている。s−A1c%の測定に用いられる高効率液体クロマトグラフィー(HPLC)は、検体を分離し、定性/定量を行うもので、s−A1c%の値と、その分離パターン(クロマトグラム)を得ることができ、検体の特性等を見極め易いとされている。しかしながら、異常ヘモグロビン(鎌状赤血球症、サラセミア症など)と呼ばれる構成成分が通常とは異なるヘモグロビンはその種類も多く、さまざまな溶出パターンを示すため、正常なヘモグロビンと両者を判別することにはかなりの経験が必要とされる。
そこで、過去に蓄積された異常ヘモグロビン検体で得られたクロマトグラムをデータベースとして蓄積し、異常と思われた検体が発生した場合、データベースを検索し、正常か異常か、その種別は何かを推定する方法が提案されている(例えば、非特許文献1参照)。
また、サンプルのクロマトグラムと標準クロマトグラムの形状の類似性を定量的に把握するために、同じ保持時間に対応する両者の波形信号の相関係数を求めるという方法(例えば、特許文献1参照)、クロマトグラムの特徴点を事前に指定した上、データベース化し、取得したクロマトグラムとの類似性からヘモグロビン種を特定する方法(例えば、特許文献2参照)が提案されている。
しかしながら、上記いずれの方法も操作者に煩雑な目視比較を要求したり、ユーザーの習熟度に依存したりと十分な解決方法となっていなかった。
特開平9−251016号公報 特開2016−133486号公報
Philippe Joly他,Ann Biol Clin 2010;68(2)254−256.
本発明の目的は、クロマトグラムのパターン推定から検体の特性を推測することを可能とする方法を提供する。
前記課題を解決するために、本発明者らは鋭意検討を重ねた結果、本発明に到達した。
すなわち本発明の一態様は、液体クロマトグラフィにより得られる糖化ヘモグロビンのクロマトグラムデータに対して、前記クロマトグラムデータの開始点の出力値が0となるように一次加工を行い、一次加工されたクロマトグラムデータの特定成分ピークの出力値で任意の値を除算して得られる値を、前記一次加工されたクロマトグラムデータに乗算する二次加工を行い、二次加工されたクロマトグラムデータの出力値のうち、規定値を超えている点について前記規定値に置き換える三次加工を行い、得られた三次加工されたクロマトグラムデータのデータ群でクラスター解析することを特徴とする。
以下、本発明について詳細に説明する。
クロマトグラムデータのベースライン位置の違いは、パターンを比較する場合、障害となることがある。機器間差、バッファロット差、その他測定環境差等により、ベースラインの位置に違いが生じる。図1のように、同じようなクロマトグラムデータでも、測定開始時点でのベース位置がゼロの場合と、オフセットを持った場合がある。各成分の定性/定量結果には影響がないが、クロマトグラムデータをパターンとして比較する場合、両者は同類と判定され難くなる。測定開始時点でのベース位置は同じ位置であることが望ましい。
そこで、図1bのようなクロマトグラムデータについて開始点での出力値(Y1)を全データ点から差し引き、図1aのようなオフセットの無いクロマトグラムデータに統一する。すなわち、クロマトグラムデータに対して一次加工を行う。
次に、一次加工を行ったクロマトグラムデータに対して特定成分ピークを指定し、その出力値で任意の値を除算する。特定成分ピークとしては、A0ピーク以外の基準となるピークを指定することが好ましく、s−A1cピークが特に好ましい。任意の値は特定成分ピークの出力値を統一するための値であり、除算した結果が0.2〜0.6となるような値を選択するとよい。除算した結果をクロマトグラムデータの全データ点に対して乗算する。すなわち、クロマトグラムデータに対して二次加工を行う。
次に、二次加工を行ったクロマトグラムデータの出力値のうち、規定値を超えている点について当該規定値に置き換える。規定値は、ピークとして一番大きいs−A1cピークの値を参考に決めればよく、それ以外のピークが規定値を超えてしまわないように設定することが好ましい。上記のようにして、クロマトグラムデータに対して三次加工を行う。
Figure 2021135083
例えば、表1のようなクロマトグラムデータがあった場合、まず0.0分(#1)の出力値が0.0となるように、#1の出力値を#1〜22から減ずる(一次加工)。次に、特定成分ピークを4.5分(#10)に現れるs−A1cピークとし、任意の値を30.0とした場合、任意の値を特定成分ピークの出力値で除算すると、データ1は30.0/15.0=2.0、データ2の場合30.0/40.0=0.75となる。この比率を、#1〜22の出力値に乗算する(二次加工)。次に、規定値を100.0として、二次加工後の出力値が100.0を超えた場合、当該出力値は100.0に置き換える。データ1の場合、#15〜19が100.0を超えるため、これらの出力値はすべて100.0とする。データ2の場合、#16〜18が100.0を超えるため、これらの出力値はすべて100.0とする(三次加工)。
クロマトグラムデータについて一次加工、二次加工、三次加工を順次行う(以下、「規格化」と表現することがある)ことにより、特定成分ピーク(s−A1cピーク)の出力値は同じとなり、巨大なA0ピーク部は台形状の波形となる(図2b、3b参照)。この処理により、課題であったs−A1cを含め他の微小なピークの強度、形状、溶出位置の変化が僅かでも、クロマトグラムのパターンの違いを識別し易くなる。また、s−A1cピークの強度のみに違いがあるクロマトグラムであっても、異なるクロマトグラムパターンであると認識され難くなる。
上述の加工処理を行ったクロマトグラムデータ群に対して、クラスター解析を実施し、クラスター分類及び前記クラスターにおける「クラスター中心」を算出する。クラスター中心はそのクラスターに属するとされたクロマトグラムデータの平均を表す波形となる。
クラスター解析の手法及びそのパラメータは、多種存在するが、特に限定するものではない。一例として、「階層的クラスター解析」の手法で下記のパラメータを使用することでクロマトグラムデータの特徴を顕著に反映する結果が得られる。
クラスター :観測値
クラスター方法:最長距離
距離タイプ :コサイン距離
クラスター数 :n
未知検体についても、クロマトグラムデータを規格化することにより、クラスター解析を行って、各クラスターのクラスター中心と比較し、どのクラスター分類に最も近いかを判断することが可能となる。
クラスターの距離計算方法として「コサイン距離」を選択している場合、最も大きな値(1に近い値)を示したクラスターが、最も類似性が高いと判断することができる。
また、正常なクロマトグラムパターンと推測される特定のクラスターとのコサイン距離を算出し、その数値の大小で、未知検体のヘモグロビン種が正常なヘモグロビン種か異常なヘモグロビン種かを推定するという態様も利用可能である。
なお、(1)検体に劣化が無い、(2)検体そのものが正常なヘモグロビン種である、(3)装置、測定状態等のコンディションが良好であること、の全てが成立した場合、正常なクロマトグラムデータが得られる可能性が高いため、それらのデータ群が属しているクラスターを特定のクラスターに選択しておくことが好ましい。
さらに、クロマトグラムデータ群が多種大量にあり、各クラスターがどのような特性から分類されているかを推測できる情報が十分にあれば、未知検体のヘモグロビン種の種別を推定する、未知検体が正常な環境で測定されたものか異常な環境で測定されたものかを推定するといった態様も利用可能である。
本発明により、クロマトグラムのパターン推定から検体の特性を推測することが可能となる。
クロマトグラムデータの1次加工を模式的に示した図である。 クロマトグラムデータの2次加工、3次加工を模式的に示した図である。 クロマトグラムデータの2次加工、3次加工を模式的に示した図である。 実施例で用いたシステム構成を示した図である。 クロマトグラムデータの規格化の流れを示した図である。 クロマトグラムデータに対して、規格化を行う様子を示した図である。 実施例で得られた樹形図を模式的に示した図である。 実施例で得られたクラスター解析により得られた複数のクラスター中心を基に、未知検体がどのクラスターに属するかを計算する「クラスター解析ツール」の画面構成を示した図である。 「クラスター解析ツール」により、未知検体を解析した結果の一例を示した図である。 「クラスター解析ツール」により、未知検体を解析した結果の一例を示した図である。 「クラスター解析ツール」により、未知検体を解析し、「正常なクロマトグラムパターン」と推定された結果の一例を示した図である。 「クラスター解析ツール」により、未知検体を解析し、「異常なクロマトグラムパターン」と推定された結果の一例を示した図である。
以下に本発明の実施例を説明するが、本発明はこれら実施例により何ら制限されるものではない。
図4に検証に使用したシステム構成を示す。なお、検証には、東ソー(株)製「グリコヘモグロビン分析計GHbVIII」バリアント測定モードで得られたクロマトグラムを用いた。データ取得には、全て、東ソー(株)が提供している、同機種/モード用の専用溶離液、専用カラム、標準測定条件で実施した。クラスター解析にはOrigin2020(LightStorn社)と、独自に開発したクラスター解析ツールを使用した。
まず、データ記憶、管理プログラム「RP+」に保存された約4000件のクロマトグラムデータ(時間、出力)を無作為に抽出し、後述するデータ加工を行った。図5は規格化の流れを示した図である。
図6に示す2つのクロマトグラムを例として規格化の手順を示す。
一次加工としてデータ1、データ2のベースライン位置は約200となっている。データ収集開始点(0.00分)時の出力値を差し引き、ベースライン位置がどのデータでも0.0とした。
次に、二次加工として0.9分付近に溶出するs−A1cピークを同定し、その溶出時間での出力値を取得し(データ1:21.142、データ2:14.004)、任意の値を30.0として比率(データ1:1.419、データ2:2.142)を計算し、この比率を各々の一次加工後の出力値に乗じてs−A1cピークが30となるように調整した。
次に、三次加工として100.0を超えたデータ点は、全て100.0とした。
データ記憶、管理プログラムに保存された4000件のクロマトグラムデータ(時間、出力)に対して規格化を行った後、クラスター解析を実施し、クラスター分類及び前記クラスターにおけるクラスター中心(平均的なクロマトグラム)を算出した。なお、特定成分ピークが何らかの理由で特定できない場合は、「エラー」として、データ加工は行わなかった。
クラスター解析の条件は以下の通りである。
クラスター :観測値
クラスター方法:最長距離
距離タイプ :コサイン距離
標準化変数 :なし
コサイン距離(Y軸)を0.66とした場合、A1、A2、A3の3つのグループに分けることができた。更に、コサイン距離(Y軸)を0.52とした場合、前記A1のグループは3つ(B1、B2、B3)に分けられ、前記A3のグループは2つ(B5、B6)に分けられ、併せて6つのグループに分けることができた。更に、コサイン距離(Y軸)を0.18とした場合、併せて33個のグループに分けることができた(図7参照)。
(実施例1)
クラスター数を33として、クラスター中心による、未知検体#10159004のクラスター分けが正確に行われるか、クラスター解析ツール20を作成して検証を行った。
クラスター解析ツール20について説明する。
図8に「クラスター解析ツール」のメイン画面を示す。
(1)にて、クラスター中心を登録する。本例では、前述の33に分類されたクラスター中心を指定する。
(2)にて、「規格化処理」を行うか否かを指示する。
(3)にて、検査対象の未知データを指定する。
(4)にて、解析が実行される。
(5)指定された未知検体のクロマトグラムと各クラスター中心とのコサイン距離が1.00に近い順に、クラスター名、コサイン距離及び値が反映される棒グラフを表示する。
(6)指定された未知検体の定性/定量結果を表示する。
(7)コサイン距離が最も1.00に近い、クラスター名、コサイン距離を表示する。
(8)、(9)指定された未知検体のクロマトグラムとコサイン距離が最も1.00に近いクラスター中心を表示する。
解析の結果、第一位としてコサイン距離0.988でクラスター21が最も類似性があるとされた。クラスター21のクラスター中心と未知検体#10159004の加工後クロマトグラムデータを比べると、類似性が高いことが確認できた。
同様に、未知検体データ#11210017についても解析を実施した。解析の結果、コサイン距離0.933でクラスター22が最も類似性があるとされた(図9a参照)。また、比較として未知検体データ#11210017について1次加工のみを行ったクロマトグラムデータでもクラスター解析を実施した。この場合、コサイン距離0.994でクラスター4が最も類似性があるとされたが、クロマトグラムの前半部分(A1B〜Fの領域)で明らかな差異が確認できた(図9b参照)。
同様に、未知検体データ#10180013についても解析を実施した。解析の結果、コサイン距離0.983でクラスター31が最も類似性があるとされた(図10a参照)。また、比較として未知検体データ#10180013について1次加工のみを行ったクロマトグラムデータにでもクラスター解析を実施した。この場合、コサイン距離0.987でクラスター4が最も類似性があるとされたが、0.4分付近のFピーク領域でパターンが異なることが確認できた(図10b参照)。
(実施例2)
正常クロマトグラム波形と推測されるクラスター1と未知検体とのコサイン距離の大きさから、測定したデータが「正常な波形(クロマトグラム)」と「異常な波形(クロマトグラム)」とに分けることが可能か検証を行った。基準は、以下の通りとした。
コサイン距離≧0.90:正常なクロマト波形と推測
コサイン距離<0.90:正常クロマト波形とは異なると推測
図11はコサイン距離が0.90以上とされた未知検体のクロマトグラムデータの一部を示した図である。また、図12はコサイン距離が0.90未満とされた未知検体のクロマトグラムデータの一部を示した図である
図11から分かるように、コサイン距離が0.90以上とされたクロマトグラムと、指定のクラスター中心を比較すると、類似性が高いことが確認できた。
図12から分かるように、コサイン距離が0.90未満とされたクロマトグラムと、指定のクラスター中心を比較すると、明らかな差異が確認できた。
1.グリコヘモグロビン分析計
2.バッファ1
3.バッファ2
4.バッファ3
5.脱気装置
6.バッファ1用流路切り替え替機構
7.バッファ2用流路切り替え替機構
8.バッファ3用流路切り替え替機構
9.送液ポンプ
10.検体希釈/注入機構
11.ラインフィルタ
12.プレヒートコイル
13.分析カラム
14.可視光検出器
15.恒温槽
16.データ処理用PC
17.データ記憶、管理プログラム
18.クラスター解析用PC
19.クラスター解析プログラム
20.クラスター解析ツール

Claims (5)

  1. 液体クロマトグラフィにより得られる糖化ヘモグロビンのクロマトグラムデータに対して、
    前記クロマトグラムデータの開始点の出力値が0となるように一次加工を行い、
    一次加工されたクロマトグラムデータの特定成分ピークの出力値で任意の値を除算して得られる値を、前記一次加工されたクロマトグラムデータに乗算する二次加工を行い、
    二次加工されたクロマトグラムデータの出力値のうち、規定値を超えている点について前記規定値に置き換える三次加工を行い、
    得られた三次加工されたクロマトグラムデータのデータ群でクラスター解析することを特徴とする方法。
  2. 液体クロマトグラフィにより得られる未知検体の糖化ヘモグロビンのクロマトグラムデータに対して、請求項1に記載の方法でクラスター解析を行い、最も類似性の高いクラスターを推定する方法。
  3. 三次加工されたクロマトグラムデータから、未知検体のヘモグロビン種が正常なヘモグロビン種か異常なヘモグロビン種かを推定する、請求項2に記載の方法。
  4. 三次加工されたクロマトグラムデータから、未知検体のヘモグロビン種の種別を推定する、請求項2に記載の方法。
  5. 三次加工されたクロマトグラムデータから、未知検体が正常な環境で測定されたものか異常な環境で測定されたものかを推定する、請求項2に記載の方法。
JP2020029258A 2020-02-25 2020-02-25 統計的手法によるクロマトグラムの分類方法 Active JP7443815B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020029258A JP7443815B2 (ja) 2020-02-25 2020-02-25 統計的手法によるクロマトグラムの分類方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020029258A JP7443815B2 (ja) 2020-02-25 2020-02-25 統計的手法によるクロマトグラムの分類方法

Publications (2)

Publication Number Publication Date
JP2021135083A true JP2021135083A (ja) 2021-09-13
JP7443815B2 JP7443815B2 (ja) 2024-03-06

Family

ID=77660896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020029258A Active JP7443815B2 (ja) 2020-02-25 2020-02-25 統計的手法によるクロマトグラムの分類方法

Country Status (1)

Country Link
JP (1) JP7443815B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4581039B2 (ja) 2000-09-11 2010-11-17 オプト技研株式会社 高分子材料のグレード識別方法
CA2611340A1 (en) 2005-06-22 2007-01-04 The Johns Hopkins University Biomarker for ovarian cancer: ctap3-related proteins
US20070218505A1 (en) 2006-03-14 2007-09-20 Paul Kearney Identification of biomolecules through expression patterns in mass spectrometry
JP5948727B2 (ja) 2011-03-31 2016-07-06 東ソー株式会社 糖化ヘモグロビンの測定方法及び糖化ヘモグロビン測定装置
CN103620401B (zh) 2011-06-29 2017-04-12 株式会社岛津制作所 分析数据处理方法以及装置

Also Published As

Publication number Publication date
JP7443815B2 (ja) 2024-03-06

Similar Documents

Publication Publication Date Title
Dudzik et al. Quality assurance procedures for mass spectrometry untargeted metabolomics. a review
Katajamaa et al. Data processing for mass spectrometry-based metabolomics
US7606667B2 (en) Mass spectrometry analysis method and system
Burton et al. Instrumental and experimental effects in LC–MS-based metabolomics
JP2005308741A (ja) 少なくとも1つの成分および生成する生成物の観点でサンプルを特性付けし、特性付けデータを提供するための2つ以上の技術に基づいた少なくとも1つのサンプルの分析;方法、システムおよび指示プログラム
US7584162B2 (en) Manufacture data analysis method and manufacture data analyzer apparatus
Baccolo et al. From untargeted chemical profiling to peak tables–A fully automated AI driven approach to untargeted GC-MS
JP5757264B2 (ja) クロマトグラフ質量分析データ処理装置
JP5948727B2 (ja) 糖化ヘモグロビンの測定方法及び糖化ヘモグロビン測定装置
Jiang et al. An integrated metabonomic and proteomic study on Kidney-Yin Deficiency Syndrome patients with diabetes mellitus in China
CN117607277A (zh) 色谱分析性能的空白运行分析
EP4065975A1 (en) Automated chromatogram analysis for blood test evaluation
WO2018138901A1 (ja) スペクトルデータ処理装置
JP7443815B2 (ja) 統計的手法によるクロマトグラムの分類方法
Carlson et al. Improving feature detection and analysis of surface‐enhanced laser desorption/ionization‐time of flight mass spectra
JP3572327B2 (ja) 液体クロマトグラフィーを用いた診断装置のデータ処理方法
CN112415208A (zh) 一种评价蛋白组学质谱数据质量的方法
JP2011085427A (ja) 代謝物の異常度の取得方法、代謝異常の判定方法、及びそのプログラム、並びに、代謝物の異常度の取得装置、及び代謝異常の判定に基づく診断プログラム
JP2022056512A (ja) 統計的手法によるクロマトグラムの分類方法
JP7081385B2 (ja) クロマトグラムの類似度の計算方法
CN114944208B (zh) 质量控制方法、装置、电子设备及存储介质
JP2003029970A (ja) プログラム品質管理支援装置、プログラム品質管理支援方法、プログラム品質管理支援方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体、プログラム品質管理支援方法をコンピュータに実行させるためのプログラム
JP7452186B2 (ja) クロマトグラフの運転状態の推定方法
JP2014235023A (ja) 液体クロマトグラフィーを用いたヘモグロビンfの定量方法
KR20200046991A (ko) 바이오마커 동정을 위한 대사체 데이터 자동 분석 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240123

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240205

R151 Written notification of patent or utility model registration

Ref document number: 7443815

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151