JPWO2018207524A1 - 識別方法、分類分析方法、識別装置、分類分析装置および記憶媒体 - Google Patents
識別方法、分類分析方法、識別装置、分類分析装置および記憶媒体 Download PDFInfo
- Publication number
- JPWO2018207524A1 JPWO2018207524A1 JP2019517508A JP2019517508A JPWO2018207524A1 JP WO2018207524 A1 JPWO2018207524 A1 JP WO2018207524A1 JP 2019517508 A JP2019517508 A JP 2019517508A JP 2019517508 A JP2019517508 A JP 2019517508A JP WO2018207524 A1 JPWO2018207524 A1 JP WO2018207524A1
- Authority
- JP
- Japan
- Prior art keywords
- data
- pulse
- waveform
- time
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/483—Physical analysis of biological material
- G01N33/487—Physical analysis of biological material of liquid biological material
- G01N33/48707—Physical analysis of biological material of liquid biological material by electrical means
- G01N33/48721—Investigating individual macromolecules, e.g. by translocation through nanopores
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/26—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
- G01N27/416—Systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N99/00—Subject matter not provided for in other groups of this subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Pathology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Analytical Chemistry (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Medicinal Chemistry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medical Informatics (AREA)
- Nanotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Electrochemistry (AREA)
- Biophysics (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Food Science & Technology (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Marketing (AREA)
Abstract
Description
計測空間に分析物を含む試料を導入して検出したパルス状信号のデータから、分析物以外の要素に起因して検出された不適合データの識別をコンピュータ制御プログラムの実行によって行う識別方法であって、
前記コンピュータ制御プログラムは、正例集合の正例データと、正例負例のいずれかが不明である未知集合の未知データとから正負例を分類する分類器を学習する機械学習を用いた識別分析プログラムを有し、
前記計測空間に分析物を含まない試料を導入して計測する第1計測条件の下で得られるパルス状信号の第1種データと、前記計測空間に分析物を含む試料を導入して計測する第2計測条件の下で得られるパルス状信号の第2種データとを記憶する記憶手段を有し、
前記第1種データを前記正例データとし、前記第2種データを前記未知データとして、前記識別分析プログラムを実行することによって、前記第2種データに含まれる前記不適合データを識別することを特徴とする識別方法である。
第1の形態に係る識別方法により識別した不適合データを記憶する不適合データ記憶手段を有し、
計測空間に分析物を含む試料を導入して検出したパルス状信号のデータから、分析物以外の要素に起因して検出された前記不適合データを取り除いた被分析データの分類分析をコンピュータ制御プログラムの実行によって行う分類分析方法であって、
前記コンピュータ制御プログラムは、機械学習を用いた分類分析を行う分類分析プログラムを有し、
前記パルス状信号の波形形態の特徴を示す特徴量をあらかじめ求め、
あらかじめ求めた特徴量を前記機械学習のための学習データとし、前記不適合データを取り除いた被分析データのパルス状信号から得られる特徴量を変数にして、前記分類分析プログラムを実行することによって前記分析物に関する分類分析を行うことを特徴とする分類分析方法である。
前記特徴量は、
所定の時間幅内における波形の波高値、
パルス波長ta、
パルス開始からパルスピークに至るまでの時間tbとtaとの比tb/taで表わされるピーク位置比、
該波形の鋭さを表す尖度、
パルス開始からパルスピークに至る傾きを表す俯角、
波形を所定の時間毎に区分した時間区分面積の総和を表す面積、
パルス開始からパルスピークに至るまでの時間区分面積の和の、全波形面積に対する面積比、
パルス開始時点を中心にして前記時間区分面積を質量に、かつ該中心から前記時間区分面積に至る時間を回転半径に擬制したときに定まる時間慣性モーメント、
前記時間慣性モーメントに対し波高が基準値になるように規格化した場合の規格化された時間慣性モーメント、
波形を波高方向に等分割し、パルスピーク前後それぞれにおいて各分割単位毎に時刻値の平均値を算出し、同一波高位置の平均値をベクトルの成分とする平均値ベクトル、
前記平均値ベクトルに対し波長が基準値になるように規格化した場合の規格化された平均値ベクトル、
波形を波高方向に等分割し、パルスピーク前後それぞれにおいて各分割単位毎に時刻値の平均値を算出し、同一波高位置の平均値の差をベクトルの成分とする平均値の差ベクトルを質量分布と擬制して波形裾野の時間軸を回転中心にしたときに定まる波幅平均値慣性モーメント、
前記波幅平均値慣性モーメントに対し波長が基準値になるように規格化した場合の規格化された波幅平均値慣性モーメント、
波形を波高方向に等分割し、分割単位毎の時刻値から分散を求め、該分散をベクトルの成分とする分散ベクトルを質量分布と擬制して波形裾野の時間軸を回転中心にしたときに定まる波幅分散慣性モーメント、および
前記波幅分散慣性モーメントに対し波長が基準値になるように規格化した場合の規格化された波幅分散慣性モーメント、
のいずれか1または2以上である分類分析方法である。
計測空間に分析物を含む試料を導入して検出したパルス状信号のデータから、分析物以外の要素に起因して検出された不適合データの識別をコンピュータ制御プログラムの実行によって行う識別装置であって、
前記コンピュータ制御プログラムは、正例集合の正例データと、正例負例のいずれかが不明である未知集合の未知データとから正負例を分類する分類器を学習する機械学習を用いた識別分析プログラムを有し、
前記計測空間に分析物を含まない試料を導入して計測する第1計測条件の下で得られるパルス状信号の第1種データと、前記計測空間に分析物を含む試料を導入して計測する第2計測条件の下で得られるパルス状信号の第2種データとを記憶する記憶手段を有し、
前記第1種データを前記正例データとし、前記第2種データを前記未知データとして、前記識別分析プログラムを実行することによって、前記第2種データに含まれる前記不適合データを識別することを特徴とする識別装置である。
第4の形態に係る識別装置により識別した不適合データを記憶する不適合データ記憶手段を有し、
計測空間に分析物を含む試料を導入して検出したパルス状信号のデータから、分析物以外の要素に起因して検出された前記不適合データを取り除いた被分析データの分類分析をコンピュータ制御プログラムの実行によって行う分類分析装置であって、
前記コンピュータ制御プログラムは、機械学習を用いた分類分析を行う分類分析プログラムを有し、
前記パルス状信号の波形形態の特徴を示す特徴量をあらかじめ求め、
あらかじめ求めた特徴量を前記機械学習のための学習データとし、前記不適合データを取り除いた被分析データのパルス状信号から得られる特徴量を変数にして、前記分類分析プログラムを実行することによって前記分析物に関する分類分析を行うことを特徴とする分類分析装置。
前記特徴量は、
所定の時間幅内における波形の波高値、
パルス波長ta、
パルス開始からパルスピークに至るまでの時間tbとtaとの比tb/taで表わされるピーク位置比、
該波形の鋭さを表す尖度、
パルス開始からパルスピークに至る傾きを表す俯角、
波形を所定の時間毎に区分した時間区分面積の総和を表す面積、
パルス開始からパルスピークに至るまでの時間区分面積の和の、全波形面積に対する面積比、
パルス開始時点を中心にして前記時間区分面積を質量に、かつ該中心から前記時間区分面積に至る時間を回転半径に擬制したときに定まる時間慣性モーメント、
前記時間慣性モーメントに対し波高が基準値になるように規格化した場合の規格化された時間慣性モーメント、
波形を波高方向に等分割し、パルスピーク前後それぞれにおいて各分割単位毎に時刻値の平均値を算出し、同一波高位置の平均値をベクトルの成分とする平均値ベクトル、
前記平均値ベクトルに対し波長が基準値になるように規格化した場合の規格化された平均値ベクトル、
波形を波高方向に等分割し、パルスピーク前後それぞれにおいて各分割単位毎に時刻値の平均値を算出し、同一波高位置の平均値の差をベクトルの成分とする平均値の差ベクトルを質量分布と擬制して波形裾野の時間軸を回転中心にしたときに定まる波幅平均値慣性モーメント、
前記波幅平均値慣性モーメントに対し波長が基準値になるように規格化した場合の規格化された波幅平均値慣性モーメント、
波形を波高方向に等分割し、分割単位毎の時刻値から分散を求め、該分散をベクトルの成分とする分散ベクトルを質量分布と擬制して波形裾野の時間軸を回転中心にしたときに定まる波幅分散慣性モーメント、および
前記波幅分散慣性モーメントに対し波長が基準値になるように規格化した場合の規格化された波幅分散慣性モーメント、
のいずれか1または2以上である分類分析装置である。
(処理1−1)計測空間MSに分析物(DNA構成分子)を含まない試料(溶媒のみ)を導入して計測する第1計測条件の下で得られるパルス状信号の第1種データを記憶手段のRAM4に取り込んで記憶させる。
(処理1−2)計測空間MSに分析物(DNA構成分子)を含む試料(溶媒+DNA構成分子)を導入して計測する第2計測条件の下で得られるパルス状信号の第2種データを記憶手段のRAM4に取り込んで記憶させる。
(処理1−3)識別処理プログラムの入力形式に合わせるために、第1種データおよび第2種データの属性ベクトルが作成される。
(処理1−4)第1種データを正例データとし、第2種データを未知データとして、識別処理プログラムを実行する。
(処理1−5)識別処理プログラムの実行により、確率p(s=1|x)を抽出して求める。該確率データは、RAM4の所定エリアに記憶、保存される。なお、以下のPU法による解析において使用される属性ベクトルは、多次元データによるもので、ベクトル表記されるものであるが、以下の説明では、特にベクトル表記を省略している。
(処理1−6)該確率により、第2種データに含まれている、分析物以外の要素(前述の塩基分子由来のものでなく電極表面の金属原子のゆらぎや不純物)に起因して検出された不適合データを検出、識別する。検出した不適合データは、RAM4の所定エリアに記憶、保存される。
(V2)規格化しない波高ベクトル(hvRaw)
(V3)パルス波長時間を「1」に規格化した波長方向時間ベクトル(wvNrmd)
(V4)規格化しない波長方向時間ベクトル(wvRaw)
(V5)V1とV2を連結した(dh+2dw)次元ベクトル
(V6)V1とV4を連結した(dh+2dw)次元ベクトル
(V7)V2とV3を連結した(dh+2dw)次元ベクトル
(V8)V2とV4を連結した(dh+2dw)次元ベクトル
イズ除去ありの場合とでは、それぞれ、0.3〜0.6、0.5〜1.0の精度範囲で分布している。解析事例総数は、パルス抽出パラメータと属性ベクトルと分類器の各種組合せの3272である。
(a)所定の分析物(例えば、大腸菌Ecや枯草菌Bs)を含む流動性物質に対しナノポアデバイス8aによる計測の結果、各種別毎の検出信号として得られた貫通孔8bの分析物通過に対応するパルス状信号De、Dbの波形形態の特徴を示す特徴量をあらかじめ求める。パルス状信号De、Dbは、それぞれ大腸菌Ec、枯草菌Bsの貫通孔8b通過によって得られた信号である。
(b)コンピュータ解析部1aには、機械学習による分類分析を行う分類分析プログラムが内蔵されている。(a)においてあらかじめ求めた特徴量は、大腸菌Ec、枯草菌Bsの既知データから得られた特徴量であり、機械学習のための学習データとしてコンピュータ解析部1aにおいて使用される。
(c)例えば、大腸菌Ecおよび枯草菌Bsの含有比ないし含有数が不明の状態で流動性物質中に混入された混合物を被分類分析物Mbとした場合、(a)の既知データ取得の場合と同様に、ナノポアデバイス8cによる計測を行う。この計測により、被分類分析物Mbの貫通孔8d通過によって被分析データとしてパルス状信号Dmが得られる。
(d)既知データによる特徴量を学習データとし、被分析データのパルス状信号Dmから得られる特徴量を変数にして、分類分析プログラムを実行することによって、該被分析データにおける所定の分析物に関する分類分析を行うことができる。
本実施形態に係る分類分析装置は、個数分析プログラムの実行によって、分析対象として例えば、1種または2種以上の粒子(分析物の一例)を含む流動性物質(電解質溶液24)を隔壁11上側の一面側に供給し、粒子が貫通孔12を通過することにより生ずる電極13、14間の通電変化を検出した検出信号のデータ(計測電流データ)に基づいて粒子種別の個数ないし個数分布を分析する個数分析機能を有する。すなわち、PC1は、CPU2の制御によりROM3に格納した個数分析プログラムを実行することにより、データファイル記憶部5に格納、記憶した計測電流データに対する個数分析処理を行うことができる。個数分析処理は、検出信号に含まれ粒子通過に対応するパルス状信号の波形形態の特徴を示す特徴量に基づくデータ群から確率密度推定を行い、粒子種別の個数を導出する個数分析方法に基づいて、粒子種別個数の自動分析を行うことができる。
<特徴量について>
図17は、実施例の大腸菌と枯草菌につき実測した粒子通過によるパルス波形例を示す。図17の(4−1)〜(4−9)は、大腸菌の実測パルス波形例(9種類)を示し、(4−10)〜(4−18)は、枯草菌の実測パルス波形例(9種類)を示す。両者を外観で比較すると、両者間に波高や波長には差異はあまりないが、ピーク位置や波形尖度等の粒子通過パルス波形形態の属性に顕著な相違がみられる。例えば、大腸菌の場合、ピークが時間経過に伴い前倒し傾向にあり、全体的に波形が尖っている(波形尖度が大きい)。枯草菌の場合、ピークが時間経過に伴い後倒し傾向にあり、波形尖度が小さい。
所定の時間幅内における波形の波高値、
パルス波長ta、
パルス開始からパルスピークに至るまでの時間tbとtaとの比tb/taで表わされるピーク位置比、
該波形の鋭さ(ピーク波形の広がり)を表す尖度、
パルス開始からパルスピークに至る傾きを表す俯角、
波形を所定の時間毎に区分した時間区分面積の総和を表す面積、および
パルス開始からパルスピークに至るまでの時間区分面積の和の、全波形面積に対する面積比のいずれかである。
(2)波高|h|: h=xp−xo(BLのxoを基準にしてパルスピークPPのxpまでのパルス波形の高さ)
(3)ピーク位置比r: r=(tp−ts)/(te−ts)(パルス波長(=Δt)と、パルス開始からパルスピークppに至るまでの時間tb(=tp−ts)との比)
(4)ピーク尖度κ: 波高|h|=1、ts=0、te=1となるように正規化し、パルスピークPPから波高30%の水平線と交差する時刻の時刻集合[T]=[[ti]|i=1,・・・,m]を収集して、下記数2に示すように、時刻集合[T]のデータの分散をパルス波形広がりとしてκが求められる。
パルス開始時点を中心にして時間区分面積を質量に、かつ該中心から時間区分面積に至る時間を回転半径に擬制したときに定まる時間慣性モーメント、
時間慣性モーメントに対し波高が基準値になるように規格化した場合の規格化された時間慣性モーメント、
波形を波高方向に等分割し、パルスピーク前後それぞれにおいて各分割単位毎に時刻値の平均値を算出し、同一波高位置の平均値をベクトルの成分とする平均値ベクトル、
前記平均値ベクトルに対し波長が基準値になるように規格化した場合の規格化された平均値ベクトル、
波形を波高方向に等分割し、パルスピーク前後それぞれにおいて各分割単位毎に時刻値の平均値を算出し、同一波高位置の平均値の差をベクトルの成分とする平均値の差ベクトルを質量分布と擬制して波形裾野の時間軸を回転中心にしたときに定まる波幅平均値慣性モーメント、
波幅平均値慣性モーメントに対し波長が基準値になるように規格化した場合の規格化された波幅平均値慣性モーメント、
波形を波高方向に等分割し、分割単位毎の時刻値から分散を求め、該分散をベクトルの成分とする分散ベクトルを質量分布と擬制して波形裾野の時間軸を回転中心にしたときに定まる波幅分散慣性モーメント、および
波幅分散慣性モーメントに対し波長が基準値になるように規格化した場合の規格化された波幅分散慣性モーメントのいずれかである。
時刻値の平均値を算出して分割領域の同一波高位置の各平均値を成分としたベクトルであり、dw等分した場合、2dw次元の時刻ベクトルで表わされる。
<ベースラインの推定について>
一般に細菌等は微細に異なる形態を有する微小物体である。例えば、平均的な大腸菌の場合、2〜4μmの体長で外径が0.4〜0.7μmである。平均的な枯草菌の場合、2〜3μmの体長で外径が0.7〜0.8μmである。さらに、大腸菌などには20〜30nmの鞭毛が付随している。
行われたとき、下記数6の条件が満たされたか否かが判断される(ステップS53、S54)。単位時間は元データのサンプリング周波数により定まる値であり、あらかじめRAM23にセットされている。
<特徴量抽出について>
図26は、特徴量抽出プログラムの実行処理内容の概要を示す。
<最尤法(maxium likelihood estimation:統計学において与えられたデータからそれが従う確率分布の母数を点推定する方法である。)について>
今、実際のパルス推定結果として、データセット[D]=[x1,x2,x3,・・・xN]が得られているとする。推定されたj番目のパルス波高データが出現する尤度(尤もらしさ)は下記数13で表わされる。
<ラグランジュ未定乗数法(束縛条件のもとで最適化を行う解析学的方法であり、各束縛条件に対して未定乗数を用意し、これらを係数にする線形結合を新しい関数(未定乗数も新たな変数とする)として捉えることによって束縛問題を通常の極値問題として解く方法である。)について>
データセットDが出現する尤度を最大化することは、データセット[D]が出現する対数尤度を最大化することに等しい。下記数15はラグランジュ未定乗数法の適否を調べるための対数尤度を導出する過程を示す。
図27に示した粒子種推定処理において実行可能な、データファイル作成処理(ステップS1)、確率密度関数の推定処理(ステップS2)、粒子数の推定処理(ステップS3)および推定粒子種分布の算出処理(ステップS4)を以下に詳述する。
<特徴量による粒子種個数の分析精度の検証1について>
本発明者らは、上記実施例の大腸菌と枯草菌の計測電流データを用いて下記の評価条件下で粒子種個数の分析性能の検証1を行った。
<特徴量による粒子種個数の分析精度の検証2について>
上記実施例の大腸菌と枯草菌の計測電流データを用いて、検証1とは別の粒子種個数の分析性能の検証2を行った。検証2においては、検証1とは異なり、第1類型および第2類型の特徴量((1)〜(13)の13種類)を算出して用い、これらの組合せに係る特徴量とサンプリングデータ数との関連性および各組合せの分析性能を検証した。
(R1)図60および図63に示すように、全サンプリングデータを使用したときには、上位5種の組合せ、すなわち、波長Δt−慣性I、波長Δt−面積m、ピーク位置比r−慣性I、俯角θ−慣性I、慣性I−慣性I w(規格化)の特徴量の場合、高い個数推定精度を得ることができる。これらの特徴量の組合せによる個数推定精度(重み付き平均相対誤差)は、例えば、波長Δt−慣性Iで250〜1000kHzのサンプリング領域において約9〜10%、波長Δt−面積mで125〜250kHzのサンプリング領域において約9〜10%、波長Δt−慣性Iで16〜63kHzのサンプリング領域において約13〜15%である。
(R2)図61に示すように、全サンプリングデータより少ないが高密度なサンプリングデータを使用したときに高い個数推定精度が得られる特徴量は、上位5種の組合せで示せば、波長Δt−慣性I、波長Δt−面積m、ピーク位置比r−慣性I、慣性I−慣性I w、俯角θ−慣性Iの5種である。これらの特徴量の組合せによる個数推定精度(重み付き平均相対誤差)は、例えば、波長Δt−慣性Iで250〜1000kHzのサンプリング領域において約9〜10%、波長Δt−面積mで125〜250kHzのサンプリング領域において約9〜10%、波長Δt−慣性Iで16〜63kHzのサンプリング領域において約13〜15%である。
(R3)図62に示すように、高密度サンプリングデータと比べてさらに少ない低密度サンプリングデータを使用した場合に高い個数推定精度が得られる特徴量は、上位5種の組合せで示せば、波長Δt−面積m、波長Δt−慣性I、俯角θ−面積m、面積m−慣性I wv(規格化)、ピーク位置比r−面積mの5種である。これらの特徴量の組合せによる個数推定精度(重み付き平均相対誤差)は、波長Δt−慣性Iで250〜1000kHzのサンプリング領域において約9〜10%、波長Δt−面積mで125〜250kHzのサンプリング領域において約9〜10%、、波長Δt−慣性Iで16〜63kHzのサンプリング領域において約13〜16%である。
(R4)(R1)〜(R3)からわかるように、第1類型と第2類型の特徴量の組合せを使用しても高精度の個数推定を行うことができる。さらに、本発明に係る個数分析方法によれば、サンプリング数が十分に多くなくても、所定のサンプリング数が得られれば十分あるときと同程度の精度で個数分析を行うことができる。例えば、検証1で調べた尖度kとピーク位置比rとの組合せでは、12%の最大誤差を生じていたが、例えば、波長Δt−慣性Iの特徴量による場合には、全データを使用しなくとも1MHz〜125kHzでの高密度サンプリングデータを使用して、つまり部分的なデータであっても個数推定処理を約9%の高精度で行うことができる。したがって、本実施形態に係る個数分析機能は、定常的な個数分析にとどまらず、例えば、緊急性を要する検疫検査や医療現場において、菌類等の粒子有無や個数の判別に即応的実施に好適な検査ツールとして使用することができる。
<個数分析処理時間の検証3について>
個数推定には、Hasselblad法による反復計算に要する所要計算時間がかかるので、この所要計算時間とサンプリング周波数との関係について特徴量の比較検討を検証3で検証した。検証3の比較検討例には、図64の(51B)に示した、波長Δt−面積m、波長Δt−慣性I、尖度k−波高|h|、尖度k−ピーク位置比rの4種類の特徴量の組合せを使用した。これらの組合せは、他の組合せと比較して交差検定精度の良い組合せである。個数分析の計算に要する時間には、特徴量作成に要する時間と、Hasselblad法による反復計算に要する計算時間とが含まれるので、特徴量作成に要する計算時間CT1、Hasselblad法による反復計算に要する計算時間CT2およびそれらの合計計算時間CT3(=CT1+CT2)について比較検討を行った。この場合も、それぞれの所要計算時間は、50回の交差検定を行って得られた各計算時間の平均値である。
<分類分析処理の処理精度の検証>
上記の分類分析処理の処理精度について、種々の機械学習による分析手法を適用して分類分析を試行して本実施形態による分類分析処理の精度を検証した。
2 CPU
3 ROM
4 RAM
5 データファイル記憶部
6 入力手段
7 表示手段
8 マイクロ・ナノポアデバイス
9 チャンバー
10 基板
11 隔壁
12 貫通孔
13 電極
14 電極
15 電源
16 増幅器
17 オペアンプ
18 凹部
19 帰還抵抗
20 電圧計
21 検体
22 大腸菌
23 枯草菌
24 電解質溶液
MS 計測空間
D1 電極
D2 電極
ME 電流計測器
Claims (8)
- 計測空間に分析物を含む試料を導入して検出したパルス状信号のデータから、分析物以外の要素に起因して検出された不適合データの識別をコンピュータ制御プログラムの実行によって行う識別方法であって、
前記コンピュータ制御プログラムは、正例集合の正例データと、正例負例のいずれかが不明である未知集合の未知データとから正負例を分類する分類器を学習する機械学習を用いた識別分析プログラムを有し、
前記計測空間に分析物を含まない試料を導入して計測する第1計測条件の下で得られるパルス状信号の第1種データと、前記計測空間に分析物を含む試料を導入して計測する第2計測条件の下で得られるパルス状信号の第2種データとを記憶する記憶手段を有し、
前記第1種データを前記正例データとし、前記第2種データを前記未知データとして、前記識別分析プログラムを実行することによって、前記第2種データに含まれる前記不適合データを識別することを特徴とする識別方法。 - 請求項1に記載の識別方法により識別した不適合データを記憶する不適合データ記憶手段を有し、
計測空間に分析物を含む試料を導入して検出したパルス状信号のデータから、分析物以外の要素に起因して検出された前記不適合データを取り除いた被分析データの分類分析をコンピュータ制御プログラムの実行によって行う分類分析方法であって、
前記コンピュータ制御プログラムは、機械学習を用いた分類分析を行う分類分析プログラムを有し、
前記パルス状信号の波形形態の特徴を示す特徴量をあらかじめ求め、
あらかじめ求めた特徴量を前記機械学習のための学習データとし、前記不適合データを取り除いた被分析データのパルス状信号から得られる特徴量を変数にして、前記分類分析プログラムを実行することによって前記分析物に関する分類分析を行うことを特徴とする分類分析方法。 - 前記特徴量は、
所定の時間幅内における波形の波高値、
パルス波長ta、
パルス開始からパルスピークに至るまでの時間tbとtaとの比tb/taで表わされるピーク位置比、
該波形の鋭さを表す尖度、
パルス開始からパルスピークに至る傾きを表す俯角、
波形を所定の時間毎に区分した時間区分面積の総和を表す面積、
パルス開始からパルスピークに至るまでの時間区分面積の和の、全波形面積に対する面積比、
パルス開始時点を中心にして前記時間区分面積を質量に、かつ該中心から前記時間区分面積に至る時間を回転半径に擬制したときに定まる時間慣性モーメント、
前記時間慣性モーメントに対し波高が基準値になるように規格化した場合の規格化された時間慣性モーメント、
波形を波高方向に等分割し、パルスピーク前後それぞれにおいて各分割単位毎に時刻値の平均値を算出し、同一波高位置の平均値をベクトルの成分とする平均値ベクトル、
前記平均値ベクトルに対し波長が基準値になるように規格化した場合の規格化された平均値ベクトル、
波形を波高方向に等分割し、パルスピーク前後それぞれにおいて各分割単位毎に時刻値の平均値を算出し、同一波高位置の平均値の差をベクトルの成分とする平均値の差ベクトルを質量分布と擬制して波形裾野の時間軸を回転中心にしたときに定まる波幅平均値慣性モーメント、
前記波幅平均値慣性モーメントに対し波長が基準値になるように規格化した場合の規格化された波幅平均値慣性モーメント、
波形を波高方向に等分割し、分割単位毎の時刻値から分散を求め、該分散をベクトルの成分とする分散ベクトルを質量分布と擬制して波形裾野の時間軸を回転中心にしたときに定まる波幅分散慣性モーメント、および
前記波幅分散慣性モーメントに対し波長が基準値になるように規格化した場合の規格化された波幅分散慣性モーメント、
のいずれか1または2以上である請求項2に記載の分類分析方法。 - 計測空間に分析物を含む試料を導入して検出したパルス状信号のデータから、分析物以外の要素に起因して検出された不適合データの識別をコンピュータ制御プログラムの実行によって行う識別装置であって、
前記コンピュータ制御プログラムは、正例集合の正例データと、正例負例のいずれかが不明である未知集合の未知データとから正負例を分類する分類器を学習する機械学習を用いた識別分析プログラムを有し、
前記計測空間に分析物を含まない試料を導入して計測する第1計測条件の下で得られるパルス状信号の第1種データと、前記計測空間に分析物を含む試料を導入して計測する第2計測条件の下で得られるパルス状信号の第2種データとを記憶する記憶手段を有し、
前記第1種データを前記正例データとし、前記第2種データを前記未知データとして、前記識別分析プログラムを実行することによって、前記第2種データに含まれる前記不適合データを識別することを特徴とする識別装置。 - 請求項4に記載の識別装置により識別した不適合データを記憶する不適合データ記憶手段を有し、
計測空間に分析物を含む試料を導入して検出したパルス状信号のデータから、分析物以外の要素に起因して検出された前記不適合データを取り除いた被分析データの分類分析をコンピュータ制御プログラムの実行によって行う分類分析装置であって、
前記コンピュータ制御プログラムは、機械学習を用いた分類分析を行う分類分析プログラムを有し、
前記パルス状信号の波形形態の特徴を示す特徴量をあらかじめ求め、
あらかじめ求めた特徴量を前記機械学習のための学習データとし、前記不適合データを取り除いた被分析データのパルス状信号から得られる特徴量を変数にして、前記分類分析プログラムを実行することによって前記分析物に関する分類分析を行うことを特徴とする分類分析装置。 - 前記特徴量は、
所定の時間幅内における波形の波高値、
パルス波長ta、
パルス開始からパルスピークに至るまでの時間tbとtaとの比tb/taで表わされるピーク位置比、
該波形の鋭さを表す尖度、
パルス開始からパルスピークに至る傾きを表す俯角、
波形を所定の時間毎に区分した時間区分面積の総和を表す面積、
パルス開始からパルスピークに至るまでの時間区分面積の和の、全波形面積に対する面積比、
パルス開始時点を中心にして前記時間区分面積を質量に、かつ該中心から前記時間区分面積に至る時間を回転半径に擬制したときに定まる時間慣性モーメント、
前記時間慣性モーメントに対し波高が基準値になるように規格化した場合の規格化された時間慣性モーメント、
波形を波高方向に等分割し、パルスピーク前後それぞれにおいて各分割単位毎に時刻値の平均値を算出し、同一波高位置の平均値をベクトルの成分とする平均値ベクトル、
前記平均値ベクトルに対し波長が基準値になるように規格化した場合の規格化された平均値ベクトル、
波形を波高方向に等分割し、パルスピーク前後それぞれにおいて各分割単位毎に時刻値の平均値を算出し、同一波高位置の平均値の差をベクトルの成分とする平均値の差ベクトルを質量分布と擬制して波形裾野の時間軸を回転中心にしたときに定まる波幅平均値慣性モーメント、
前記波幅平均値慣性モーメントに対し波長が基準値になるように規格化した場合の規格化された波幅平均値慣性モーメント、
波形を波高方向に等分割し、分割単位毎の時刻値から分散を求め、該分散をベクトルの成分とする分散ベクトルを質量分布と擬制して波形裾野の時間軸を回転中心にしたときに定まる波幅分散慣性モーメント、および
前記波幅分散慣性モーメントに対し波長が基準値になるように規格化した場合の規格化された波幅分散慣性モーメント、
のいずれか1または2以上である請求項5に記載の分類分析装置。 - 請求項1に記載のコンピュータ制御プログラムを記憶したことを特徴とする識別用記憶媒体。
- 請求項2に記載のコンピュータ制御プログラムを記憶したことを特徴とする分類分析用記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017092075 | 2017-05-07 | ||
JP2017092075 | 2017-05-07 | ||
PCT/JP2018/014926 WO2018207524A1 (ja) | 2017-05-07 | 2018-04-09 | 識別方法、分類分析方法、識別装置、分類分析装置および記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018207524A1 true JPWO2018207524A1 (ja) | 2020-05-28 |
JP6807529B2 JP6807529B2 (ja) | 2021-01-06 |
Family
ID=64105353
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019517508A Active JP6807529B2 (ja) | 2017-05-07 | 2018-04-09 | 識別方法、分類分析方法、識別装置、分類分析装置および記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210140938A1 (ja) |
EP (1) | EP3623793B1 (ja) |
JP (1) | JP6807529B2 (ja) |
CN (1) | CN110720034B (ja) |
WO (1) | WO2018207524A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11781099B2 (en) * | 2015-12-25 | 2023-10-10 | Aipore Inc. | Number analyzing method, number analyzing device, and storage medium for number analysis |
WO2019092837A1 (ja) * | 2017-11-09 | 2019-05-16 | 富士通株式会社 | 波形解析装置 |
JP7309227B2 (ja) * | 2019-04-01 | 2023-07-18 | アイポア株式会社 | 細孔電気抵抗法による測定対象粒子の細孔通過にともなうイオン電流の過渡変化を計測し、そのパルス波形を解析するための機械学習プログラム、方法、および装置 |
US20220154243A1 (en) * | 2019-04-02 | 2022-05-19 | National Institute For Materials Science | Measurement apparatus, measurement method, program, and biosensor |
JP7220629B2 (ja) * | 2019-06-27 | 2023-02-10 | 株式会社Screenホールディングス | 画像判別モデル構築方法、画像判別装置、および画像判別方法 |
JP7173354B2 (ja) * | 2019-08-01 | 2022-11-16 | 株式会社村田製作所 | 検出装置、検出方法およびプログラム |
US11399312B2 (en) * | 2019-08-13 | 2022-07-26 | International Business Machines Corporation | Storage and retention intelligence in mobile networks |
WO2021070385A1 (ja) | 2019-10-11 | 2021-04-15 | アイポア株式会社 | 粒子の識別を行うためのセンサ、測定器、コンピュータ装置、およびシステム |
JP7188373B2 (ja) * | 2019-12-11 | 2022-12-13 | トヨタ自動車株式会社 | データ解析システム及びデータ解析方法 |
JP7396159B2 (ja) | 2020-03-26 | 2023-12-12 | 富士通株式会社 | 画像処理装置、画像認識システム及び画像処理プログラム |
US20220036134A1 (en) * | 2020-07-31 | 2022-02-03 | Netapp, Inc. | Methods and systems for automated document classification with partially labeled data using semi-supervised learning |
US20230268032A1 (en) * | 2020-07-31 | 2023-08-24 | Hitachi High-Tech Corporation | Method for generating trained model, method for determining base sequence of biomolecule, and biomolecule measurement device |
CN112326552B (zh) * | 2020-10-21 | 2021-09-07 | 山东大学 | 基于视觉和力觉感知的隧道掉块病害检测方法和系统 |
CN113779817B (zh) * | 2021-11-11 | 2022-03-11 | 长江空间信息技术工程有限公司(武汉) | 一种测量控制网基准稳定性分析方法 |
CN114916910B (zh) * | 2022-04-29 | 2024-04-09 | 无锡市华焯光电科技有限公司 | 脉象分类方法、分类模型训练方法、分类设备和存储介质 |
CN115374125B (zh) * | 2022-09-01 | 2024-05-10 | 无锡市华焯光电科技有限公司 | 脉象诊断分类方法、数据库构建方法、装置及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014136316A1 (ja) * | 2013-03-04 | 2014-09-12 | 日本電気株式会社 | 情報処理装置、情報処理方法、及びプログラム |
WO2016017533A1 (ja) * | 2014-07-29 | 2016-02-04 | 国立大学法人浜松医科大学 | 識別装置および識別方法 |
JP2016505836A (ja) * | 2012-12-19 | 2016-02-25 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 流体サンプル中の粒子の分類のためのシステム及び方法 |
WO2016053181A1 (en) * | 2014-10-01 | 2016-04-07 | Water Optics Technology Pte. Ltd | A sensor for particle detection in a fluid |
WO2017073737A1 (ja) * | 2015-10-28 | 2017-05-04 | 国立大学法人東京大学 | 分析装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2326727B1 (en) * | 2008-08-15 | 2016-05-04 | Litmus Rapid-B LLC | Flow cytometry-based systems and methods for detecting microbes |
SI23471A (sl) * | 2010-09-02 | 2012-03-30 | Krog-Mit D.O.O. | Naprava in informacijski sistem za samodejno interpretacijo rezultatov predtransfuzijksih preiskav |
WO2013136430A1 (ja) | 2012-03-13 | 2013-09-19 | 株式会社 東芝 | 一粒子解析装置および解析方法 |
US20150142327A1 (en) * | 2012-03-28 | 2015-05-21 | Arizona Board Of Regents On Behalf Of Arizona State University | Method for improving the accuracy of chemical identification in a recognition-tunneling junction |
CN103226088B (zh) * | 2013-04-08 | 2015-04-22 | 贵州茅台酒股份有限公司 | 一种颗粒物计数方法 |
JP6503382B2 (ja) * | 2014-06-16 | 2019-04-17 | シーメンス・ヘルスケア・ダイアグノスティックス・インコーポレーテッドSiemens Healthcare Diagnostics Inc. | 血液学用デジタルホログラフィ顕微鏡検査データ分析 |
CN104200114B (zh) * | 2014-09-10 | 2017-08-04 | 中国人民解放军军事医学科学院卫生装备研究所 | 流式细胞仪数据快速分析方法 |
EP3054279A1 (en) * | 2015-02-06 | 2016-08-10 | St. Anna Kinderkrebsforschung e.V. | Methods for classification and visualization of cellular populations on a single cell level based on microscopy images |
US20190204296A1 (en) * | 2016-08-18 | 2019-07-04 | The Regents Of The University Of California | Nanopore sequencing base calling |
US11435338B2 (en) * | 2016-10-24 | 2022-09-06 | Ontera Inc. | Fractional abundance of polynucleotide sequences in a sample |
US20200251184A1 (en) * | 2016-12-16 | 2020-08-06 | Osaka University | Classification analysis method, classification analysis device, and storage medium for classification analysis |
GB201707138D0 (en) * | 2017-05-04 | 2017-06-21 | Oxford Nanopore Tech Ltd | Machine learning analysis of nanopore measurements |
-
2018
- 2018-04-09 EP EP18798973.6A patent/EP3623793B1/en active Active
- 2018-04-09 CN CN201880029955.6A patent/CN110720034B/zh active Active
- 2018-04-09 WO PCT/JP2018/014926 patent/WO2018207524A1/ja unknown
- 2018-04-09 US US16/611,455 patent/US20210140938A1/en not_active Abandoned
- 2018-04-09 JP JP2019517508A patent/JP6807529B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016505836A (ja) * | 2012-12-19 | 2016-02-25 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 流体サンプル中の粒子の分類のためのシステム及び方法 |
WO2014136316A1 (ja) * | 2013-03-04 | 2014-09-12 | 日本電気株式会社 | 情報処理装置、情報処理方法、及びプログラム |
WO2016017533A1 (ja) * | 2014-07-29 | 2016-02-04 | 国立大学法人浜松医科大学 | 識別装置および識別方法 |
WO2016053181A1 (en) * | 2014-10-01 | 2016-04-07 | Water Optics Technology Pte. Ltd | A sensor for particle detection in a fluid |
WO2017073737A1 (ja) * | 2015-10-28 | 2017-05-04 | 国立大学法人東京大学 | 分析装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6807529B2 (ja) | 2021-01-06 |
EP3623793A4 (en) | 2020-06-17 |
US20210140938A1 (en) | 2021-05-13 |
EP3623793A1 (en) | 2020-03-18 |
EP3623793B1 (en) | 2022-09-07 |
WO2018207524A1 (ja) | 2018-11-15 |
CN110720034B (zh) | 2022-10-18 |
CN110720034A (zh) | 2020-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6807529B2 (ja) | 識別方法、分類分析方法、識別装置、分類分析装置および記憶媒体 | |
JP6971499B2 (ja) | 分類分析方法、分類分析装置および分類分析用記憶媒体 | |
Briane et al. | Statistical analysis of particle trajectories in living cells | |
CN110178012B (zh) | 分类分析方法、分类分析装置及分类分析用记录介质 | |
JP2022512633A (ja) | 粒子分析器のための適応ソーティング | |
CN116881634B (zh) | 用于清洗纳米孔信号数据的方法、设备和存储介质 | |
US20230393048A1 (en) | Optimized Sorting Gates | |
TW201321739A (zh) | 訊號分析裝置、訊號分析方法及電腦程式產品 | |
Li et al. | Emerging Data Processing Methods for Single‐Entity Electrochemistry | |
CN112424582A (zh) | 血液样本检测的方法、血液样本检测仪和存储介质 | |
US11781099B2 (en) | Number analyzing method, number analyzing device, and storage medium for number analysis | |
CN116704500A (zh) | 基于机器学习的细胞识别方法和系统 | |
Gupta et al. | Survey on Tea Discriminator | |
de Bruijn et al. | Determining particle size and position in a coplanar electrode setup using measured opacity | |
JP6678177B2 (ja) | 二項分類に対するエキスパート判断のキャラクタライゼーションおよび再現 | |
CN114746737A (zh) | 形状分析设备 | |
Bhattacharya et al. | An accurate DNA sensing and diagnosis methodology using fabricated silicon nanopores | |
Berkenbrock et al. | Fabrication of High-Aspect-Ratio Nanopores in Polymer Membranes: Analysis of Artifacts by Non-Destructive Testing | |
Brock et al. | Toolbox for chemical acoustic emission data acquisition and analysis | |
MATTON | Automating flow cytometry data analysis using clustering techniques | |
Jackson | Single‐channel recording | |
JP2021103139A (ja) | 情報処理装置、粒子測定装置、粒子測定システム、粒子分取装置、粒子分取システム、情報処理方法、及び情報処理プログラム | |
Mastrofini | Curve fitting and compensation for impedance cytometry signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191025 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20191018 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201006 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20201007 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20201007 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201104 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6807529 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |