WO2021193673A1

WO2021193673A1 - ゲート領域推定プログラム、ゲート領域推定方法、及びゲート領域推定装置

Info

Publication number: WO2021193673A1
Application number: PCT/JP2021/012094
Authority: WO
Inventors: 圭伍河野; 晴彦二田
Original assignee: 合同会社Ｈ．Ｕ．グループ中央研究所
Priority date: 2020-03-25
Filing date: 2021-03-24
Publication date: 2021-09-30
Also published as: CN115335681A; JPWO2021193673A1

Abstract

学習モデルにより、ゲート領域を推定する場合において、より精度の良い推定結果を出力するゲート領域推定プログラム等を提供すること。　ゲート領域推定プログラムは、測定項目が異なるフローサイトメトリーの測定より得た複数の散布図を含む散布図群を取得し、散布図群とゲート領域とを含む訓練データに基づき学習を行った複数の学習モデルそれぞれに、取得した散布図群を入力し、前記複数の学習モデルそれぞれから得た推定ゲート領域を出力する処理をコンピュータに行わせる。

Description

ゲート領域推定プログラム、ゲート領域推定方法、及びゲート領域推定装置

　本発明は、フローサイトメトリーにおけるゲート領域を推定するゲート領域推定プログラム等に関する。

　フローサイトメトリー（Flow Cytometry：ＦＣＭ）は、単一の細胞毎に複数の特徴量を測定できる技術である。ＦＣＭでは、流動する液体に懸濁した細胞が一列になるように流す。一個一個流れる細胞に光を当て、その光の散乱や蛍光具合により、細胞の大きさ、内部の複雑さ、構成物質などの指標が得られる。フローサイトメトリーは医療においては、例えば、細胞性免疫検査に利用されている。

　細胞性免疫検査では、フローサイトメトリーで得られた複数の指標値の解析を行い、検査結果として返却する。解析技術の１つにゲーティングがある。ゲーティングは得られたデータの中から特定の集団のみを選んで解析する技術である。従来、解析対象とする集団の特定は、検査士が２次元の散布図において、楕円形や多角形（「ゲート」という）を描くことにより指定していた。このようなゲートの設定は、検査士の経験や知識による所が大きい。そのため、経験や知識が少ない検査士が適切なゲート設定を行うことは困難である。

　それに対して、ゲート設定を自動化する技術が提案されている（特許文献１、２等）。しかしながら、従来技術は細胞の密度情報を用いた設定方法や、ルールベースによる手法での設定であり、検査士が蓄積してきた経験や知識が十分、活用されていない。

特許第６４８０９１８号公報特許第５０４７８０３号公報

　そこで、検査士が蓄積した経験や知識に基づくゲート設定データを訓練データとして深層学習を行った学習モデルにより、ゲート領域を推定することが考えられる。しかし、学習モデルによるゲート領域の推定は精度が十分でない。

　本発明はこのような状況に鑑みてなされたものである。その目的は、学習モデルにより、ゲート領域を推定する場合において、より精度の良い推定結果を出力するゲート領域推定プログラム等の提供である。

　本発明に係るゲート領域推定プログラムは、測定項目が異なるフローサイトメトリーの測定より得た複数の散布図を含む散布図群を取得し、散布図群とゲート領域とを含む訓練データに基づき学習を行った複数の学習モデルそれぞれに、取得した散布図群を入力し、前記複数の学習モデルそれぞれから得た推定ゲート領域を出力する処理をコンピュータに行わせることを特徴とする。

　本発明にあっては、複数の学習モデルを用いるアンサンブル学習により、精度の良いゲート領域の推定を行うことが可能となる。

検査システムの構成例を示す説明図である。処理部のハードウェア構成例を示すブロック図である。測定値ＤＢの例を示す説明図である。特徴情報ＤＢの例を示す説明図である。ゲートＤＢの例を示す説明図である。閾値ＤＢの例を示す説明図である。自信度ＤＢの例を示す説明図である。回帰モデルの生成処理に関する説明図である。回帰モデル生成処理の手順例を示すフローチャートである。閾値決定処理の手順例を示すフローチャートである。ゲート領域の推定結果例を示す説明図である。ゲート領域の推定結果例を示す説明図である。散布度の例を示す説明図である。散布度の例を示す説明図である。散布度の例を示す説明図である。ゲート領域推定処理の手順例を示すフローチャートである。自信度判定処理の手順例を示すフローチャートである。ゲート領域の推定結果例を示す説明図である。ゲート領域の推定結果例を示す説明図である。散布度の例を示す説明図である。散布度の例を示す説明図である。ゲート領域の推定結果例を示す説明図である。推定結果表示画面の例を示す説明図である。推定結果表示画面の例を示す説明図である。ＩＤ一覧画面の例を示す説明図である。ゲート領域推定処理の他の手順例を示すフローチャートである。外れ値ゲート領域の除外例を示す説明図である。外れ値ゲート領域の除外例を示す説明図である。１０個の小集団の例を示す説明図である。ゲート選択処理の手順例を示すフローチャートである。ゲート領域の選択例を示す説明図である。ゲート領域の選択例を示す説明図である。輝度情報によるゲート領域の選択例を示す説明図である。ゲート領域選択処理の他の手順例を示すフローチャートである。ゲート領域選択処理の他の手順例を示すフローチャートである。

　以下実施の形態を、図面を参照して説明する。以下の説明においては、白血病・リンパ腫解析（ＬＬＡ：Leukemia, Lymphoma Analysis）検査におけるＣＤ４５ゲーティングを例として説明する。最初に、ＬＬＡ検査の工程について説明する。ＬＬＡ検査は大まかに５つの工程を含む。１．分注、２．前処理、３．測定・描写、４．解析、５．報告である。

　分注工程では、一つの検体（以下、「ＩＤ」と記す。）を分ける工程である。ＬＬＡ検査では一つのＩＤを最大１０個に分注して検査を行う。分注した各検体をＳＥＱと記す。また、分注した１０の検体をＳＥＱ１、ＳＥＱ２、…、ＳＥＱ１０と記す。前処理工程では、各ＳＥＱに共通な処理（細胞濃度の調整など）を行い、個別に表面マーカを付ける。ＳＥＱ１はネガティブコントロールとする。ネガティブコントロールは、効果を検証したい対象と同一の条件で、既に陰性の結果が出ることが分かっている対象に検査を行うこと、あるいはその対象を意味する語である。陰性対照とも言う。検査においては、検証したい対象と、ネガティブコントロールにおける結果を比較することで、その相対的な差異から検査結果が解析される。

　測定・描写工程では、１０ＳＥＱをフローサイトメータで測定を行い、蛍光値を得る。各ＳＥＱ内の個々の細胞について、測定値を含めた５つの項目からなる情報が得られる。項目の内訳は、ＦＳＣ、ＳＳＣ、ＦＬ１、ＦＬ２、ＦＬ３である。ＦＳＣは前方散乱光（ＦＳＣ：Forward Scattered Light）の測定値を示す。ＦＳＣはレーザービームの光軸に対して前方で検出される散乱光の値を示す。ＦＳＣは細胞の表面積または大きさにほぼ比例するため、細胞の大きさを示す指標値となる。ＳＳＣは側方散乱光（ＳＳＣ：Side Scattered Light）の測定値を示す。側方散乱光は、レーザービームの光軸に対して９０°の角度で検出される光である。ＳＳＣは、その大部分が細胞内の物質に光が当たって散乱したものである。ＳＳＣは、細胞の顆粒性状、内部構造にほぼ比例するため、細胞の顆粒性状、内部構造を示す指標値となる。ＦＬは蛍光（Fluorescence）を示すが、ここではフローサイトメータが備える複数の蛍光用検出器を示す。数字は蛍光用検出器の順番号を示す。ＦＬ１は１番目の蛍光検出器を示すが、ここでは、マーカとして各ＳＥＱのマーカ情報が設定される項目の名称である。ＦＬ２は２番目の蛍光検出器を示すが、ここでは、マーカとして各ＳＥＱのマーカ情報が設定される項目の名称である。ＦＬ３は３番目の蛍光用検出器を示すが、ここでは、ＣＤ４５のマーカ情報が設定される項目の名称である。

　フローサイトメータは、各ＳＥＱで２つの散布図を作成し、散布図をディスプレイ等に表示する。例えば、一つの散布図は、一方の軸をＳＳＣとし、他方の軸をＦＬ３とする。もう一つの散布図は、一方の軸をＳＳＣとし、他方の軸をＦＳＣとする。

　解析工程では、散布図の様相より、検査士が疾患を推定し、各散布図上に疾患特定に有用なゲートを作成する。そして、ゲート範囲に存在する細胞のみからなるＦＬ１―ＦＬ２の散布図を各ＳＥＱで作成し、マーカ反応として観察する。報告工程では、特に有用なゲートを２つ報告用に決定し、報告書を作成する。

（実施の形態１）
　図１は検査システムの構成例を示す説明図である。検査システムはフローサイトメータ（ゲート領域推定装置）１０と学習サーバ３とを含む。フローサイトメータ１０と学習サーバ３とはネットワークＮを介して、通信可能に接続されている。フローサイトメータ１０は、装置全体の動作に関する種々の処理を行う処理部１と、検体を受け入れ、フローサイトメトリーによる測定を行う測定部２とを含む。

　学習サーバ３は、サーバコンピュータ、ワークステーション等で構成する。学習サーバ３は検査システムにおいて、必須の構成ではない。学習サーバ３は、主としてフローサイトメータ１０を補完する役目を担い、測定データや学習モデルをバックアップとして記憶する。また、フローサイトメータ１０に代わって、学習モデルの生成、学習モデルの再学習を行ってもよい。この場合、学習サーバ３は、学習モデルを特徴付けるパラメータ等をフローサイトメータ１０に送信する。なお、学習サーバ３の機能を、クラウドサービスで提供してもよい。

　図２は、処理部のハードウェア構成例を示すブロック図である。処理部１は制御部１１、主記憶部１２、補助記憶部１３、入力部１４、表示部１５、通信部１６、及び読み取り部１７を含む。制御部１１、主記憶部１２、補助記憶部１３、入力部１４、表示部１５、通信部１６、及び読み取り部１７はバスＢにより接続されている。処理部１はフローサイトメータ１０と別体としても良い。処理部１は、ＰＣ（Personal Computer）、ノートパソコン、タブレットコンピュータ等で構築する。処理部１を複数のコンピュータからなるマルチコンピュータ、ソフトウェアによって仮想的に構築された仮想マシン又は量子コンピュータで構成してもよい。

　制御部１１は、一又は複数のＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro-Processing Unit）、ＧＰＵ（Graphics Processing Unit）等の演算処理装置を有する。制御部１１は、補助記憶部１３に記憶された図示しないＯＳ（Operating System）や制御プログラム１Ｐ（ゲート領域推定プログラム）を読み出して実行することにより、フローサイトメータ１０に係る種々の情報処理、制御処理等を行う。また、制御部１１は取得部、出力部等の機能部を含む。

　主記憶部１２は、ＳＲＡＭ（Static Random Access Memory）、ＤＲＡＭ（Dynamic Random Access Memory）、フラッシュメモリ等である。主記憶部１２は主として制御部１１が演算処理を実行するために必要なデータを一時的に記憶する。

　補助記憶部１３はハードディスク又はＳＳＤ（Solid State Drive）等であり、制御部１１が処理を実行するために必要な制御プログラム１Ｐや各種ＤＢ（Database）を記憶する。補助記憶部１３は、測定値ＤＢ１３１、特徴情報ＤＢ１３２、ゲートＤＢ１３３、第１回帰モデル１３４１から第５回帰モデル１３４５、閾値ＤＢ１３５、及び自信度ＤＢ１３６を記憶する。補助記憶部１３はフローサイトメータ１０に接続された外部記憶装置であってもよい。補助記憶部１３に記憶する各種ＤＢ等を、ネットワークＮで接続されたデータベースサーバやクラウドストレージに記憶してもよい。

　本実施の形態においては、複数の学習モデルを用いるアンサンブル学習を行う。複数の学習モデルの出力結果を用いて、ゲート領域の推定結果について、自信度を求める。本実施の形態においては、アンサンブル学習を行うために第１回帰モデル１３４１から第５回帰モデル１３４５の５つの学習モデルを使用するが、それに限らない。学習モデルの数は２つから４つでもよいし、６つ以上としてもよい。

　入力部１４はキーボードやマウスである。表示部１５は液晶表示パネル等を含む。表示部１５は測定を行うための情報や測定結果、ゲート情報などを種々の情報を表示する。表示部１５は入力部１４と一体化したタッチパネルディスプレイでもよい。なお、表示部１５に表示する情報をフローサイトメータ１０の外部表示装置に表示を行ってもよい。

　通信部１６はネットワークＮを介して、学習サーバ３と通信を行う。また、制御部１１が通信部１６を用い、ネットワークＮ等を介して他のコンピュータから制御プログラム１Ｐをダウンロードし、補助記憶部１３に記憶してもよい。

　読み取り部１７はＣＤ（Compact Disc）－ＲＯＭ及びＤＶＤ（Digital Versatile Disc）－ＲＯＭを含む可搬型記憶媒体１ａを読み取る。制御部１１が読み取り部１７を介して、制御プログラム１Ｐを可搬型記憶媒体１ａより読み取り、補助記憶部１３に記憶してもよい。また、ネットワークＮ等を介して他のコンピュータから制御部１１が制御プログラム１Ｐをダウンロードし、補助記憶部１３に記憶してもよい。さらにまた、半導体メモリ１ｂから、制御部１１が制御プログラム１Ｐを読み込んでもよい。

　補助記憶部１３が記憶するデータベースについて説明する。図３は測定値ＤＢの例を示す説明図である。測定値ＤＢ１３１はフローサイトメータ１０による測定の測定値を記憶する。図３に示すのは測定値ＤＢ１３１に記憶される１レコードの例である。測定値ＤＢ１３１の各レコードは、基本部１３１１とデータ部１３１２とを含む。基本部１３１１は受付番号列、受付日列、検査番号列、検査日列、カルテ番号列、氏名列、性別列、年齢列、及び採取日列を含む。受付番号列は検査依頼を受け付けた際に発番する受付番号（識別情報）を記憶する。受付日列は、検査依頼を受け付けた日付を記憶する。検査番号列は検査を行う際に発番する検査番号を記憶する。検査日列は検査を実施した日付を記憶する。カルテ番号列は検査依頼に対応するカルテの番号を記憶する。氏名列は検体を提供した被検査者の氏名を記憶する。性別列は被検査者の性別を記憶する。例えば、被検査者が男性であれば、性別列はＭを記憶する。被検査者が女性であれば、性別列はＦを記憶する。年齢列は被検査者の年齢を記憶する。採取日列は被検査者から検体を採取した日付を記憶する。データ部１３１２において、各列は測定項目について、細胞毎の測定値を記憶する。各行は一つの細胞について、測定項目毎の測定値を記憶する。

　図４は特徴情報ＤＢの例を示す説明図である。特徴情報ＤＢ１３２は測定値から得られる特徴を示す情報（以下、「特徴情報」とも言う。）を記憶する。特徴情報は例えば、散布図やヒストグラムである。特徴情報ＤＢ１３２は、受付番号列、検査番号列、順番号列、種別列、横軸列、縦軸列、及び画像列を含む。受付番号列は、受付番号を記憶する。検査番号列は、検査番号を記憶する。順番号列は同一検査内での特徴情報の順番号を記憶する。種別列は特徴情報の種別を記憶する。例えば、種別は上述したように散布図やヒストグラムである。横軸列は散布図やヒストグラムにおいて横軸として採用した項目を記憶する。縦軸列は散布図において縦軸として採用した項目を記憶する。ヒストグラムの場合、縦軸は細胞数であるので、縦軸列は細胞数を記憶する。画像列は散布図やヒストグラムを画像として記憶する。

　図５はゲートＤＢの例を示す説明図である。ゲートＤＢ１３３は散布図に対して、設定されたゲートの情報（ゲート情報）を記憶する。ゲート情報はゲート領域を確定するための情報である。ゲート情報はゲート領域の外形線を示す図形の情報、ゲート領域に含まれる測定値の値範囲、ゲート領域に含まれる測定値の集合などである。散布図画像上において、ゲート領域に含まれる点のピクセル座標値でもよい。ここでは、ゲート情報はゲート領域の外形線を示す図形とし、その形状は楕円形状とするが、それに限られない。図形は複数の辺から構成される多角形や、複数の曲線を結んだ図形でもよい。ゲートＤＢ１３３は、受付番号列、検査番号列、横軸列、縦軸列、ゲート番号列、CX列、CY列、DX列、DY列、及びθ列を含む。受付番号列は受付番号を記憶する。検査番号列は検査番号を記憶する。横軸列は散布図において横軸として採用した項目を記憶する。縦軸列は散布図において縦軸として採用した項目を記憶する。ゲート番号列はゲートの順番号を記憶する。CX列は楕円の中心x座標値を記憶する。CY列は楕円の中心y座標値を記憶する。DX列は楕円の長径の値を記憶する。DY列は楕円の短径の値を記憶する。θ列は楕円の傾き角度を記憶する。例えば、傾き角度は横軸と楕円の長径とがなす角度である。ゲート形状として、多角形を設定可能とする場合、ゲートＤＢ１３３は多角形を形づくる複数点の座標列を記憶する。

　図６は閾値ＤＢの例を示す説明図である。閾値ＤＢ１３５はゲート領域を示す各項目値のバラつきの度合いを示す指標（散布度）に関する閾値を記憶する。当該閾値は、回帰モデルの自信度を判定する際に用いる。図６に示す例はゲート領域が楕円の場合である。閾値ＤＢ１３５はID列、横軸列、縦軸列、CX列、CY列、DX列、及びDY列を含む。ID列は閾値群を特定するＩＤを記憶する。横軸列は散布図において横軸とする項目を記憶する。縦軸列は散布図において縦軸とする項目を記憶する。CX列は楕円の中心x座標値に関する閾値を記憶する。CY列は楕円の中心y座標値に関する閾値を記憶する。DX列は楕円の長径の値に関する閾値を記憶する。DY列は楕円の短径の値に関する閾値を記憶する。CX列、CY列、DX列、及びDY列はそれぞれ、A列及びB列を含む。A列は閾値Ａを記憶する。B列は閾値Ｂを記憶する。Ｂ列の「－」は値が設定されていないことを示す。閾値Ａのみが設定されている場合、回帰モデルの自信度は、高又は低のいずれかとなる。閾値Ｂが設定されている場合は、自信度を数値で示す。例えば、閾値Ａより小さいならば自信度５０、更に閾値Ｂよりも小さいならば自信度７０とする。なお、閾値は３つ以上であってもよい。

　図７は自信度ＤＢの例を示す説明図である。自信度ＤＢ１３６は回帰モデルによるゲート領域の推定結果の自信度を記憶する。自信度ＤＢ１３６は受付番号列、検査番号列、ゲート番号列、CX列、CY列、DX列、DY列、ゲート全体列、及び全体列を含む。受付番号列は受付番号を記憶する。検査番号列は検査番号を記憶する。ゲート番号列はゲートの順番号を記憶する。受付番号列、検査番号列及びゲート番号列により、ゲートＤＢ１３３との対応付けが可能となる。CX列は楕円の中心x座標値の自信度を記憶する。CY列は楕円の中心y座標値の自信度を記憶する。DX列は楕円の長径長の自信度を記憶する。DY列は楕円の短径長の自信度を記憶する。ゲート全体列はゲート毎の自信度を記憶する。全体列は検査毎の自信度を記憶する。図７に示す例では、自信度の値は高又は低である。

　次に、準備工程について説明する。準備工程は実運用に入る前に行う工程である。図８は回帰モデルの生成処理に関する説明図である。第１回帰モデル１３４１から第５回帰モデル１３４５の５つの学習モデルを生成する。図８は、機械学習を行って第１回帰モデル１３４１から第５回帰モデル１３４５を生成する処理を示している。基本的な処理の内容は全ての学習モデルで同様である。基本的な処理について、第１回帰モデル１３４１を代表として説明する。

　本実施の形態にフローサイトメータ１０において、処理部１は、測定部２で得た測定結果に基づき作成した散布図画像に対する適切なゲートの特徴量を学習するディープラーニングを行うことで、複数の散布図画像（散布図群）を入力とし、ゲート情報を出力とする第１回帰モデル１３４１を生成する。複数の散布図画像とは、少なくとも１軸の項目が異なる複数の散布図画像である。例えば、横軸がＳＳＣで縦軸がＦＬ３の散布図画像、及び、横軸がＳＳＣで縦軸がＦＳＣの散布図画像からなる２つの散布図画像である。３つ以上の散布図画像を入力してもよい。ニューラルネットワークは例えばＣＮＮ（Convolution Neural Network）である。第１回帰モデル１３４１は、各散布図画像の特徴量をそれぞれ学習する複数の特徴抽出器と、各特徴抽出器が出力した特徴量を結合する結合器と、結合した特徴量に基づき、ゲート情報の各項目（中心Ｘ座標、中心Ｙ座標、長径、短径、傾斜角度）を推定し出力する複数の推定器とを有する。なお、第１回帰モデル１３４１に散布図画像ではなく、散布図の基になる測定値の集合を入力してもよい。

　各特徴抽出器は、入力層、中間層を含む。入力層は、散布図画像に含まれる各画素の画素値の入力を受け付ける複数のニューロンを有し、入力された画素値を中間層に受け渡す。中間層は複数のニューロンを有し、散布図画像内からの特徴量を抽出して出力層に受け渡す。例えば特徴抽出器がＣＮＮである場合、中間層は、入力層から入力された各画素の画素値を畳み込むコンボリューション層と、コンボリューション層で畳み込んだ画素値をマッピングするプーリング層とが交互に連結された構成を有し、画素情報を圧縮しながら最終的に画像特徴量を抽出する。散布図画像を入力する特徴抽出器を画像毎に設けるのではなく、１つの特徴抽出器に複数の散布図画像を入力する構成でもよい。

　なお、本実施の形態では第１回帰モデル１３４１がＣＮＮであるものとして説明するが、第１回帰モデル１３４１はＣＮＮに限定されず、ＣＮＮ以外のニューラルネットワーク、ベイジアンネットワーク、決定木など、他の学習アルゴリズムで構築された学習済みモデルであってもよい。

　処理部１は、複数の散布図画像と、散布図に対応したゲート情報の正解値とが対応付けられた訓練データを用いて学習を行う。例えば図８に示すように、訓練データは、複数の散布図画像に対し、ゲート情報がラベル付けされたデータである。なお、ここでは簡略のため、２種類の散布図を１組の散布図とする。また、１組の散布図に対して、１つのゲートを設けるものとして説明するが、複数のゲートを設けてもよい。この場合、ゲート情報には有用度を示す値を含める。

　処理部１は、訓練データである２つの散布図画像をそれぞれ異なる特徴抽出器に入力する。各特徴抽出器が出力した特徴量が結合器により結合される。結合器による結合は、単純に特徴量を結合する方法（Concatenate）、特徴量を示す値を加算する方法（Add）、特徴量の最大のものを選択する（Maxpool）方法などがある。

　結合された特徴量に基づき、各推定器は推定結果として、ゲート情報を出力する。各推定器が出力する値の組み合わせで、１組のゲート情報となる。出力するゲート情報は複数組であってもよい。この場合、複数組に応じた数の推定器を設ける。例えば、優先順位１位のゲート情報と、優先順位２位のゲート情報とを出力する場合、図８における推定器の数が５から１０個となる。

　処理部１は推定器から得たゲート情報を、訓練データにおいて散布図画像に対しラベル付けされた情報、すなわち正解値と比較し、推定器からの出力値が正解値に近づくように、特徴抽出器や推定器での演算処理に用いるパラメータを最適化する。当該パラメータは、例えばニューロン間の重み（結合係数）、各ニューロンで用いられる活性化関数の係数などである。パラメータの最適化の方法は特に限定されないが、例えば処理部１は誤差逆伝播法を用いて各種パラメータの最適化を行う。処理部１は、訓練データに含まれる検査毎のデータについて上記の処理を行い、第１回帰モデル１３４１を生成する。

　次に、処理部１の制御部１１が行う処理について説明する。図９は回帰モデル生成処理の手順例を示すフローチャートである。制御部１１は検査履歴を取得する（ステップＳ１）。検査履歴は過去の検査結果の蓄積であり、測定値ＤＢ１３１に記憶された過去の測定値である。制御部１１は処理対象とする１つの履歴を選択する（ステップＳ２）。制御部１１は選択した履歴に対応する特徴情報を取得する（ステップＳ３）。特徴情報は例えば散布図である。特徴情報は特徴情報ＤＢ１３２から取得する。特徴情報が記憶されていない場合、測定値から生成してもよい。制御部１１は選択した履歴に対応するゲート情報を取得する（ステップＳ４）。ゲート情報はゲートＤＢ１３３より取得する。制御部１１は取得した特徴情報とゲート情報とを訓練データとして、第１回帰モデル１３４１の学習を行う（ステップＳ５）。制御部１１は未処理の検査履歴があるか否かを判定する（ステップＳ６）。制御部１１は未処理の検査履歴があると判定した場合（ステップＳ６でＹＥＳ）、処理をステップＳ２に戻し、未処理の検査履歴に関する処理を行う。制御部１１は未処理の検査履歴がないと判定した場合（ステップＳ６でＮＯ）、第１回帰モデル１３４１を記憶し（ステップＳ７）、処理を終了する。

　図８及び図９を用いて説明した処理と同様な処理により、第２回帰モデル１３４２、第３回帰モデル１３４３、第４回帰モデル１３４４、第５回帰モデル１３４５を生成する。ただし、第１回帰モデル１３４１から第５回帰モデル１３４５のそれぞれは、例えば、訓練データ、ネットワーク構造、ハイパーパラメータを変えることにより、生成条件が異なる回帰モデルとする。訓練データについては、データ拡張やブートストラップ法で用いる復元抽出法によりデータ数を増やすことにより、５つの学習モデルの訓練データを異なるものとする。ネットワーク構造については、入力層、出力層の数を変える。また、Fine-tuningにより、ある学習モデルから、それと異なる学習モデルを生成する。ハイパーパラメータについては、中間層の層数、各層（レイヤ）のノード数、重み、損失関数、最適化関数、学習率、バッチサイズ等の設定を異なるものとする。

　第１回帰モデル１３４１から第５回帰モデル１３４５を生成した後、自信度を判定するための閾値を決定する。図１０は閾値決定処理の手順例を示すフローチャートである。制御部１１はテストデータを取得する（ステップＳ１１）。制御部１１は取得したテストデータを各回帰モデルに入力する（ステップＳ１２）。制御部１１は各回帰モデルから推定出力を取得する（ステップＳ１３）。推定出力は、各回帰モデルが推定したゲート領域を示すパラメータの値である。ゲート領域が楕円の場合、パラメータは中心座標（Ｃｘ，Ｃｙ）、長半径と短半径との長さ（Ｄｘ，Ｄｙ）、及び長半径とｘ軸とがなす角の角度（θ）である。ゲート領域が多角形の場合は、各頂点の座標値である。制御部１１は各回帰モデルから出力された値から、パラメータ毎に散布度を算出する（ステップＳ１４）。散布度の一例は標準偏差である。制御部１１は未処理のテストデータがあるか否かを判定する（ステップＳ１５）。制御部１１は未処理のテストデータがあると判定した場合（ステップＳ１５でＹＥＳ）、処理をステップＳ１１へ戻し、未処理のテストデータについての処理を行う。制御部１１は未処理のテストデータがないと判定した場合（ステップＳ１５でＮＯ）、パラメータ毎の閾値を決定する（ステップＳ１６）。閾値は許容できる出力値のバラつきの限度を意味する。閾値は統計手法により決定する。または、テストデータ毎の散布度の値から、例えばベテランの検査士が判断して、決定する。制御部１１は決定した閾値を記憶し（ステップＳ１７）、閾値決定処理を終了する。なお、閾値はフローサイトメータ１０が稼働する環境毎、例えば、検査機関毎に調整してもよい。散布度は標準偏差以外に、分散、不偏分散又は平均偏差でもよい。

　閾値決定処理の具体例を説明する。図１１Ａ及び図１１Ｂはゲート領域の推定出力例を示す説明図である。図１１はＣＤ４５ゲーティングにおける散布図の例である。図１１Ａは入力とする散布図の例を示す。図１１Ａは横軸がＳＳＣ（Side Scattered Light：側方散乱光）であり、縦軸がＦＬ３（ＦＬ＝Fluorescence：蛍光用検出器、３は３番目の意。）である。図１１Ｂは、入力された散布図におけるゲート領域を、５つの回帰モデルが推定したそれぞれの結果を示す。図１１Ｂの縦軸、横軸は図１１Ａと同様である。ここでは、楕円形のゲート領域を１つ推定する例を示す。図１１Ｂでは、入力された散布図にゲート領域が重ね書きされている。ＡＩ－１が第１回帰モデル１３４１の推定結果を示し、ＡＩ－２が第２回帰モデル１３４２の推定結果を示し、以下同様であり、ＡＩ－５が第５回帰モデル１３４５の推定結果を示す。散布図の下にゲート領域である楕円形のパラメータを記載している。上から順に中心Ｘ座標（Cx）、中心Ｙ座標（Cy）、長径の長さ（Dx）、短径の長さ（Dy）、傾斜角度（θ）である。

　図１２は散布度の例を示す説明図である。散布度は標準偏差（ＳＤ：standard deviation）とする。図１２の左表は、図１１Ｂに示した値を再掲載している。なお、傾斜角度は、ゲート領域の形状が正円形とした場合など、ＳＤが大きくなったとしても、推定結果の自信度に影響しないので、ＳＤの算出項目から除外している。ＳＤの閾値は、複数のテストデータに対する結果について算出し、算出結果に基づいて決定する。

　図１３Ａ及び図１３Ｂは散布度の例を示す説明図である。図１３Ａと図１３Ｂとは異なるテストデータを入力した場合の推定結果である。図１３Ａ及び１３Ｂともに、横軸はＳＳＣ、縦軸はＦＬ３である。図１３Ａ及び図１３Ｂでは、入力の散布図に５つの回帰モデルが出力したゲート領域を重ねて描いている。散布図右側の数値は楕円形を特定する中心座標、長短径のＳＤを示している。図１３Ａは推定結果のバラつきが小さい例であり、図１３Ｂは推定結果のバラつきが大きい例である。図１３Ａと図１３Ｂとからすると、Cx:5.6以上、Cy:10.9～36.8の間、Dx:12.3以上、Dy:6.4以上で閾値を決めるとよいと考えられる。２つのテストデータのみでなく、他のデータについてのＳＤを考慮して、パラメータ毎の最終的な閾値を決定することが望ましい。各パラメータの閾値が決定すれば、準備工程は終了である。なお、上述の閾値決定処理においては、各回帰モデルはゲート領域の推定結果として、１つのゲートを出力する前提で説明したが、複数であってもよい。複数の場合は、ゲート毎に閾値を決定する。ゲート領域として、第１ゲート、第２ゲート、第３ゲートが出力される場合、各回帰モデルの第１ゲートについて、散布度を求め、閾値を決定する。

　次に、運用工程について説明する。以下の説明では、散布度を標準偏差（ＳＤ）とする。また、ＳＤが閾値以下の場合、自信度を高とする。ＳＤが閾値を超えた場合、自信度を低とする。また、各回帰モデルは複数のゲート領域の推定結果を出力するものとする。

　図１４はゲート領域推定処理の手順例を示すフローチャートである。制御部１１は散布図を取得する（ステップＳ３１）。ここでの散布図は測定結果を示す点の座標列並びに、横軸の測定項目及び縦軸の測定項目である。制御部１１は取得した散布図を各回帰モデル入力する（ステップＳ３２）。制御部１１は各回帰モデルがゲート領域の推定出力を取得する（ステップＳ３３）。制御部１１は回帰モデル毎、ゲート毎、パラメータ毎に散布度、ここでは標準偏差を算出する（ステップＳ３４）。制御部１１は自信度の判定を行う（ステップＳ３５）。制御部１１は結果を記憶する（ステップＳ３６）。制御部１１はゲート領域の推定結果をゲートＤＢ１３３に記憶し、自信度を自信度ＤＢ１３６に記憶する。制御部１１はゲート領域判定処理を終了する。

　図１５は自信度判定処理の手順例を示すフローチャートである。自信度判定処理は図１４のステップＳ３５に対応する処理である。制御部１１は対象とするゲート領域を選択する（ステップＳ５１）。制御部１１は処理対象とするパラメータ（Cx、Cy、Dx、Dy等の変数）を選択する（ステップＳ５２）。制御部１１はパラメータの標準偏差が閾値以下であるか否かを判定する（ステップＳ５３）。制御部１１はパラメータの標準偏差が閾値以下であると判定した場合（ステップＳ５３でＹＥＳ）、全パラメータについて処理済みか否かを判定する（ステップＳ５４）。制御部１１は全パラメータについて処理済みでないと判定した場合（ステップＳ５４でＮＯ）、処理をステップＳ５２に戻し、未処理のパラメータについての処理を行う。制御部１１は全パラメータについて処理済みと判定した場合（ステップＳ５４でＹＥＳ）、処理対象としているゲートの自信度が高であることを、一時記憶領域に記憶する（ステップＳ５５）。一時記憶領域は主記憶部１２又は補助記憶部１３に設ける。制御部１１はパラメータの標準偏差が閾値を超えていると判定した場合（ステップＳ５３でＮＯ）、処理対象としているゲートの自信度が低であることを、一時記憶領域に記憶する（ステップＳ５６）。制御部１１は全ゲートについて処理済みか否かを判定する（ステップＳ５７）。制御部１１は全ゲートについて処理済みでないと判定した場合（ステップＳ５７でＮＯ）、処理をステップＳ５１に戻し、未処理のゲートについての処理を行う。制御部１１は全ゲートについて処理済みと判定した場合（ステップＳ５７でＹＥＳ）、一時記憶領域を参照し、全ゲートの自信度が高であるか否かを判定する（ステップＳ５８）。制御部１１は全ゲートの自信度が高であると判定した場合（ステップＳ５８でＹＥＳ）、処理対象としている散布図におけるゲート領域の推定結果に対する自信度（全体の自信度）が高であることを一時記憶領域に記憶する（ステップＳ５９）。制御部１１は全ゲートの自信度が高ではなく、一部のゲートの自信度が低であると判定した場合（ステップＳ５８でＮＯ）、処理対象としている散布図についての推定結果全体の自信度が低であることを一時記憶領域に記憶する（ステップＳ６０）。制御部１１は処理を呼び出し元に戻す。

　ゲート領域推定処理の具体例を説明する。図１６Ａ及び図１６Ｂは、ゲート領域の推定結果例を示す説明図である。図１６は図１１と同様に、ＣＤ４５ゲーティングにおける散布図の例である。図１６Ａは入力とする散布図の例であり、図１６Ｂは入力された散布図におけるゲート領域を、５つの回帰モデルが推定したそれぞれの結果を示す。図１６Ａ及び図１６Ｂにおいて、横軸はＳＳＣであり、縦軸はＦＬ３である。ここでは、推定結果として得たゲート領域の１つを表示している。図１６Ｂでは、入力された散布図にゲート領域が重ね書きされている。ＡＩ－１が第１回帰モデル１３４１の推定結果を示し、ＡＩ－２が第２回帰モデル１３４２の推定結果を示し、以下同様であり、ＡＩ－５が第５回帰モデル１３４５の推定結果を示す。散布図の下にゲート領域である楕円形のパラメータを記載している。上から順に中心Ｘ座標（Cx）、中心Ｙ座標（Cy）、長径の長さ（Dx）、短径の長さ（Dy）、傾斜角度（θ）である。

　図１７Ａ及び図１７Ｂは散布度の例を示す説明図である。図１７Ａと図１７Ｂとは異なる散布図を入力した場合の推定結果である。図１７Ａ及び１７Ｂともに、横軸はＳＳＣ、縦軸はＦＬ３である。図１７Ａは、図１６Ｂに示した５つの図を一つの図として描いたものである。すなわち、図１７Ａは入力の散布図に５つの回帰モデルが出力したゲート領域を重ねて描いている。図１７Ｂも図１７Ａと同様である。散布図右側の数値は楕円形を特定する中心座標、長短径のＳＤを示している。図１７Ａは推定結果のバラつきが小さい例であり、図１７Ｂは推定結果のバラつきが大きい例である。ここで、Cx、Cy、Dx、Dyの各ＳＤが２０以下ならば自信度を高、２０を超える項目が１つでも有るならば、自信度を低とする場合、図１７Ａに示す結果は、全てＳＤが２０以下であるので、自信度が高と判定される。一方、図１７Ｂに示す結果は、Cx及びDxのＳＤが２０を超えているため、自信度が低と判定される。

　続いて、複数のゲート領域を推定した場合の自信度の判定例を示す。図１８はゲート領域の推定結果例を示す説明図である。図１８はゲートＧ１からＧ３の３つのゲート領域の推定結果が描かれている。各ゲート領域は５つの回帰モデルが出力したゲート領域を重ねて散布図上に描いている。散布図の下の表は各パラメータのＳＤを示している。ゲートＧ１及びＧ２は、全てのＳＤが２０以下であるので、自信度は高と判定される。ゲートＧ３はCxのＳＤが２０を超えているため、自信度が低と判定される。複数のゲート領域を推定する場合、全てのゲート領域の推定結果の自信度が高である場合、全体の自信度を高とし、ゲート領域の推定結果の自信度に１つでも低がある場合、全体の自信度を低とする。この定義で判定するならば、図１８に示す推定結果は全体としては、自信度が低と判定される。

　次に、ゲート領域の推定結果の画面表示について説明する。図１９Ａ及び図１９Ｂは推定結果表示画面の例を示す説明図である。図１９Ａは自信度が高であるときの画面例である。図１９Ｂは自信度が低であるときの画面例である。推定結果表示画面は散布図１９１、自信度１９２、自信度アイコン１９３を含む。散布図１９１は散布図にゲート領域の推定結果を表示したものである。ここで、表示するゲート領域は、５つの回帰モデルが出力した５つの推定領域のうち、所定のアルゴリズムで選択された１つの領域である。自信度１９２は判定結果全体についての自信度を表示する。図１９では、自信度：高をHighで、自信度：低をLowで表示している。自信度アイコン１９３は自信度を顔アイコンで表現している。自信度が高であれば、笑顔のアイコンを表示し、自信度が低であれば、困った顔のアイコンを表示する。なお、散布図１９１において、表示するゲート領域を、図１３等と同様に５つの回帰モデルが出力した５つの推定領域全てとしてもよい。

　図２０はＩＤ一覧画面の例を示す説明図である。ＩＤ一覧画面は、検査毎に付されるＩＤとゲート領域の推定結果の自信度とを対応付けて一覧表示する。ＩＤ一覧画面は、ＩＤ表示２０１と自信度表示２０２とを含む。ＩＤ表示２０１は例えば受付番号を表示する。自信度表示２０２は例えば自信度が高い場合にＡを、自信度が低い場合にａを表示する。ＩＤ表示２０１の１つのＩＤを選択すると、図１９に示した推定結果表示画面を表示する。

　本実施の形態では、ゲート領域の推定結果に自信度を付して出力する。それにより、自信度表示２０２を参照して、「Ａ」は熟練度の高い検査士が優先して念入りにチェックする、間違っている可能性の高い「ａ」は時間を掛けて解析するなど、現場の運用環境に合わせた運用が可能となるという効果を奏する。

　本実施の形態において、各回帰モデルへ入力する散布図は１つとしたが、それに限らず２つ以上であってもよい。また、散布図は２次元に限らず、３次元以上であってもよい。

　散布度はゲート領域を表す図形のパラメータの標準偏差、楕円の場合は中心座標、長半径の長さの標準偏差としたが、それに限らない。５つの回帰モデルが推定したゲート領域の面積を散布度としても良い。例えば、散布図に５つの推定ゲート領域を重畳表示した場合に、５つの領域を包含する領域の面積と、５つが重なっている領域の面積とを算出し、前者の面積に占める後者の面積の割合を散布度とする。この場合、値が小さいほど、バラつきが大きいと判断する。１が最大値であり、５つの領域が全て一致するときである。

（実施の形態２）
　本実施の形態は、５つの回帰モデルが推定した５つのゲート領域のうち、ユーザに提示する１つのゲート領域を選択する手法に関する形態である。アンサンブル学習においては、複数の学習モデルの出力結果を組み合わせて最終的な結果を得る。アンサンブル学習では複数の学習モデルを用いるため、出力のぶれを低減させる効果がある。学習毎に精度のぶれが起きやすいニューラルネットワークにおいて、特に効果的であることが知られている。

　アンサンブル学習では、学習毎に精度のぶれが起きやすいニューラルネットワークにおいて特に効果的とされ、各種コンペで用いられる技術である。しかし、ゲート領域の推定を行う回帰モデルの出力は多出力であり、複合的に評価する必要がある。単純に複数のモデル間の平均などで各出力を組み合わせても精度は向上しにくい。異なる条件で学習した複数の回帰モデルそれぞれにより、ゲート領域を推定させた場合、学習の違いにより推定結果が異なる。そのため、各回帰モデルが出力した推定結果から各パラメータの平均値を求め、表示する最終的なゲート領域を決定した場合、検査士から見ると、散布図のどの部分を囲う目的のゲートであるのか不明瞭となる可能性が高い。そこで、本実施の形態では、５つの回帰モデルが推定した５つのゲート領域のうち、ユーザに提示する最適なゲート領域を１つ選択する。本実施の形態において、ハードウェア構成や第１回帰モデル１３４１から第５回帰モデル１３４５の生成処理等は、実施の形態１と同様である。以下の説明においては、主として実施の形態１と異なる点を説明する。

　準備工程は実施の形態１と同様であるので説明を省略する。以下、運用工程について説明する。図２１はゲート領域推定処理の他の手順例を示すフローチャートである。図１４に示した処理に、ゲート領域を選択するための処理が追加されている。制御部１１は散布図を取得する（ステップＳ７１）。制御部１１は取得した散布図を各回帰モデルへ入力する（ステップＳ７２）。制御部１１は各回帰モデルがゲート領域の推定出力を取得する（ステップＳ７３）。制御部１１は外れ値を含むゲート領域を選択対象から外す（ステップＳ７４）。５つの回帰モデルが出力したゲート領域の各パラメータについて、中央値を求める。１項目でも中央値から外れるゲート領域は選択対象から外す。なお、ステップＳ７４は必須の処理ではなく省略してもよい。制御部１１は、各ゲート領域について特徴量を算出する（ステップＳ７５）。特徴量はゲート内の細胞数、ゲート領域の面積、ゲート内の細胞密度、ゲート内の細胞純度等である。特徴量については、後に補足する。制御部１１は特徴量に基づき、最適ゲートを選択する（ステップＳ７６）。制御部１１は散布度を算出する（ステップＳ７７）。制御部１１は自信度の判定を行う（ステップＳ７８）。ステップＳ７７及びステップＳ７８の内容は、実施の形態１と同様であるから説明を省略する。制御部１１は選択したゲート領域及び自信度を記憶し（ステップＳ７９）、ゲート領域推定処理を終了する。

　次に、外れ値を含むゲート領域を選択対象から外す例を示す。図２２Ａ及び図２２Ｂは外れ値ゲート領域の除外例を示す説明図である。図２２Ａは５つの回帰モデルが出力したゲート領域を散布図に重畳したものである。ゲート領域のうち、ゲート領域Ｇｊは他のゲート領域とは大きさが異なるため、外れ値を含むゲート領域として選択対象から外れる。図２２Ｂは選択対象から外れたゲート領域Ｇｊのみを表示した散布図である。

　続いて、特徴量の１つである細胞純度について説明する。検査において、各ゲート内に含まれる細胞種は基本的には一種であることが望ましい。凡その細胞種はＦＳＣ、ＳＳＣ、ＣＤ４５の情報から推測できる。そこで、細胞集団をＦＳＣ、ＳＳＣ、ＦＬ３の情報から大まかにクラス分類し、対象ゲート内にどのクラスが最も多いか、またそのクラスの細胞の何割がゲート内に含まれるかを細胞純度と定義する。具体例には、ＦＳＣ、ＳＳＣ、ＦＬ３の分布において、３次元の自動クラスタリング手法、k-meansを適用し、ｎ個の小集団を作る。ｎは自然数である。ここではｎ＝１０である。図２３は１０個の小集団の例を示す説明図である。五角形のマークはk-meansに用いられる各小集団の中心を示す。図２３では横軸がＳＳＣ、縦軸がＦＬ３の２次元表示となっているが、実際は紙面法線方向の軸がＦＳＣである３次元のクラスタリングである。図２３において、ゲート領域Ｇ内には、クラスＣｂの細胞が多い。そこで、ゲート領域Ｇの細胞純度は、クラスＣｂのうち、ゲート領域Ｇに含まれる割合とする。すなわち、対象ゲート領域に最も多く含まれるクラスの細胞を求め、対象ゲート領域に含まれる当該クラスの細胞数を当該クラスの細胞全体の数で除した値が、細胞純度である。

　図２４はゲート選択処理の手順例を示すフローチャートである。ゲート選択処理は図２１のステップＳ７６に対応するものである。制御部１１は細胞のクラスタリングを行う（ステップＳ９１）。例えば上述のようにＦＳＣ、ＳＳＣ、ＦＬ３の分布において、k-meansによる３次元の自動クラスタリングを行い、細胞を１０個のクラスに分ける。制御部１１は５つの回帰モデルそれぞれが出力した５つのゲート領域の中で処理対象とするゲート領域を選択する（ステップＳ９２）。制御部１１は選択したゲート領域内に含まれるクラス毎の細胞数を求め、細胞数が最多のクラスを特定する（ステップＳ９３）。制御部１１は細胞純度を算出する（ステップＳ９４）。制御部１１は未処理のゲート領域が有るか否かを判定する（ステップＳ９５）。制御部１１は未処理のゲート領域が有ると判定した場合（ステップＳ９５でＹＥＳ）、処理をステップＳ９２に戻し、未処理のゲート領域についての処理を行う。制御部１１は未処理のゲート領域がないと判定した場合（ステップＳ９５でＮＯ）、出力するゲート領域を選択する（ステップＳ９６）。制御部１１は、５つのゲート領域の中から、細胞純度が最大のゲート領域を選択する。制御部１１はゲート選択処理を終了する。

　図２５Ａ及び図２５Ｂはゲート領域の選択例を示す説明図である。図２５Ａは５つの回帰モデルが出力したゲート領域を散布図に重畳したものである。図２５Ａの右側の数値は、各ゲート領域の細胞純度を示す。ここでは、ＡＩ－３すなわち第３回帰モデル１３４３が出力したゲート領域の細胞純度が０．６６で最も大きい値であるので、当該ゲート領域が選択される。図２５Ｂは選択したゲート領域のみを重畳表示した散布図の例である。複数個のゲート領域を出力する場合も同様な処理で可能である。詳細については後述する。

　次に、細胞純度以外の特徴量について補足する。細胞数は、ゲート領域に含まれる細胞の数である。面積は、２次元の散布図におけるゲート領域を示す図形の面積である。細胞密度は細胞数を面積で除した値である。

　特徴量として、解析軸以外の測定値を用いてもよい。解析軸とは２次元表示する散布図の横軸、縦軸である。フローサイトメトリー検査では、全次元の測定値から細胞腫の判別を行う。よってゲート内においても他次元（解析軸以外）の測定値は、細胞腫を絞った最適なゲートを決めるための指標となりうる。

　上述の例では、解析軸はＳＳＣとＦＬ３（ＣＤ４５）である。この場合、解析軸以外の測定値の例としては、ＦＳＣ、ＦＬ１（ＣＤ３４）である。このとき、ＦＬ１でＣＤ３４を測定し、その平均値を基準として、最適ゲートを選択する。例えば、ＡＩ－１の平均値が０．２１、ＡＩ－２の平均値が０．１６、ＡＩ－３の平均値が０．１８、ＡＩ－４の平均値が０．２０とする。ＡＩ－５が出力したゲート領域は外れ値ゲート領域として除外されている。このとき、ＡＩ－１が出力したゲート領域が選択される。

　特徴量として、画像情報を用いてもよい。ゲート内の細胞密度で最適ゲートを選択する場合、細胞分布の偏りに影響を受け適切なゲートを選択できない場合がある。これを避けるために分布状況を画像へ変換して特徴量を取得する。以下、処理例を説明する。散布図の内容を画像情報、ここでは輝度Ｌとして扱うために、細胞の存在する部分を黒ピクセル（Ｌ＜２５５）、それ以外を白ピクセル（Ｌ＝２５５）で表現する。

　図２６は輝度情報によるゲート領域の選択例を示す説明図である。図２６の上段左は、ＡＩ－１が出力したゲート領域を重畳表示した散布図である。図２６の下段左はＡＩ－１が出力したゲート領域の特徴量を示す。図２６の上段右は、ＡＩ－２が出力したゲート領域を重畳表示した散布図である。図２６の下段右は、ＡＩ－２が出力したゲート領域の特徴量を示す。なお、ＡＩ－３からＡＩ－５が出力したゲート領域は、その特徴量がＡＩ－１及びＡＩ－２が出力したゲート領域のものよりも小さく、何れも選択される可能性はないものとする。図２６の例において、選択すべきゲート領域は、ＡＩ－１が出力した領域である。

　図２６の例において、ゲート領域を選択するための特徴量として細胞密度を採用した場合、ＡＩ－１は１．０、ＡＩ－２は１．１であるから、ＡＩ－２が出力したゲート領域が選択されてしまう。しかし、ゲート領域を選択するための特徴量として黒白比（＝白ピクセル数/黒ピクセル数）を採用すると、ＡＩ－１は０．７、ＡＩ－２は０．５となり、ＡＩ－１が出力したゲート領域が選択される。図２６の例では、細胞分布に偏りがあるため、特徴量として細胞密度を用いると、不適切な選択がされてしまう。黒白比は細胞密度をある程度反映しつつ、細胞数による影響を低減できるので、適切な選択結果となる。

　本実施の形態について、上述では、１つのゲート領域を得る場合を説明した。複数個のゲート領域を得るためには、処理の拡張が必要となるが、その拡張方法には２つの方法が考えられる。方法１は、全ゲートを出力する複数個のＡＩからひとつ最適な出力を選ぶ方法である。例えば、全てのゲート領域について、ＡＩ－１の出力した推定結果を選択する方法である。

　図２７はゲート領域選択処理の他の手順例を示すフローチャートである。図２７は１つの散布図に複数個のゲート領域を設定する場合の選択処理であり、上述の方法１による処理である。制御部１１は処理対象とする回帰モデルを選択する（ステップＳ１１１）。制御部１１は選択した回帰モデルが出力した複数ゲート領域のうち、処理対象とするゲート領域を選択する（ステップＳ１１２）。制御部１１は選択したゲート領域の自信度を判定する（ステップＳ１１３）。自信度の判定は上述したとおりである。制御部１１は自信度を一時記憶領域に記憶する（ステップＳ１１４）。制御部１１は未処理のゲート領域があるか否かを判定する（ステップＳ１１５）。制御部１１は未処理のゲート領域があると判定した場合（ステップＳ１１５でＹＥＳ）、処理をステップＳ１１２に戻し、未処理のゲート領域についての処理を行う。制御部１１は未処理のゲート領域がないと判定した場合（ステップＳ１１５でＮＯ）、選択している回帰モデルが出力したゲート領域全体の自信度を判定する（ステップＳ１１６）。例えば、設定するゲート領域が３つであり、各ゲート領域の自信度が高、高、低の場合、高の個数２を全体の自信度とする。制御部１１は自信度を一時記憶領域に記憶する（ステップＳ１１７）。制御部１１は未処理対象の回帰モデルがあるか否かを判定する（ステップＳ１１８）。制御部１１は未処理の回帰モデルがあると判定した場合（ステップＳ１１８でＹＥＳ）、処理をステップＳ１１１に戻し、未処理の回帰モデルについての処理を行う。制御部１１は未処理の回帰モデルがないと判定した場合（ステップＳ１１８でＮＯ）、回帰モデル毎の自信度に基づき、回帰モデルを選択する（ステップＳ１１９）。制御部１１は選択した回帰モデルが出力したゲート領域を出力し（ステップＳ１２０）、処理を終了する。

　方法２は、全ゲートを出力する複数個のＡＩから各ゲートにひとつ最適な出力を選ぶ方法である。例えば、第１ゲートはＡＩ－１の出力した推定結果を選択し、第２ゲートはＡＩ－４の出力した推定結果を選択し、第３ゲートはＡＩ－５の出力した推定結果を選択する。方法１は、ひとつのＡＩが各ゲートを出力するため、ゲート間で重なることが少ないという長所が有る一方、ひとつのゲートがずれていると他ゲートもずれている可能性が高いという短所がある。方法２は、ゲート毎に選ぶため他ゲートのずれの影響は少ないという長所が有る一方、他ゲートの情報がない条件で選ぶとゲート同士が重なりやすいという短所がある。ただし、他ゲートの情報を工夫して加えることで当該短所の影響を軽減可能である。

　方法２における短所の影響を軽減する処理について説明する。ゲート選択において下記の条件を用いて、他ゲート情報を加えた場合とない場合での選択ゲートの比較を行う。条件１：最適ゲートを決める基準として特徴量「細胞純度」を用いる。条件２：有用度に従って、ゲートを選択する（一般的に解析ゲートには有用度があるため）。その際に他ゲートに含まれる細胞は特徴量の計算から除く。条件１のみを適用した場合と、条件１及び２を適用した場合とで、ゲートの選択を行う。何れか一方でゲートの重なりがなければ、当該選択結果を採用する。なお条件１における特徴量は、ゲート領域に関わるならば細胞純度以外の他の特徴量でも良い。

　図２８はゲート領域選択処理の他の手順例を示すフローチャートである。図２８は１つの散布図に複数個のゲート領域を設定する場合の選択処理であり、上述の方法２による処理である。制御部１１は複数個のゲート領域の中で、処理対象とするゲート領域を選択する（ステップＳ１３１）。例えば、３個のゲート領域を設定する場合、それぞれを第１ゲート、第２ゲート、第３ゲートとする。順番号は検査結果の報告において重要性が大きい順などの有用度で定める。このとき、制御部１１は第１ゲート、第２ゲート、第３ゲートの順に処理を行う。制御部１１は処理対象とする回帰モデルを選択する（ステップＳ１３２）。制御部１１は選択した回帰モデルが出力したゲート領域についての特徴量、例えば細胞純度を算出する（ステップＳ１３３）。制御部１１は未処理の回帰モデルがあるか否かを判定する（ステップＳ１３４）。制御部１１は未処理の回帰モデルがあると判定した場合（ステップＳ１３４でＹＥＳ）、処理をステップＳ１３２に戻し、未処理の回帰モデルについての処理を行う。制御部１１は未処理の回帰モデルがないと判定した場合（ステップＳ１３４でＮＯ）、特徴量に基づき、いずれかの回帰モデルが出力したゲート領域の中から、最終的に出力するゲート領域を選択する（ステップＳ１３５）。制御部１１は選択したゲート領域の情報を一時記憶領域に記憶する（ステップＳ１３６）。制御部１１は未処理のゲート領域があるか否かを判定する（ステップＳ１３７）。制御部１１は未処理のゲート領域があると判定した場合（ステップＳ１３７でＹＥＳ）、処理をステップＳ１３１に戻し、未処理のゲート領域についての処理を行う。制御部１１は未処理のゲート領域がないと判定した場合（ステップＳ１３７でＮＯ）、一時記憶領域に記憶した選択情報に基づき、すべてのゲート領域を出力し（ステップＳ１３８）、処理を終了する。

　本実施の形態においては、複数の回帰モデルが出力したゲート領域の推定結果から、最適なゲート領域を選択することが可能となる。なお、上述の実施の形態では、ＬＬＡにおけるＣＤ４５ゲーティングを例としたが、悪性リンパ腫解析（ＭＬＡ：Malignant Lymphoma Analysis）検査におけるＣＤ４５ゲーティングでも、同様な手順で実行可能である。

　各実施の形態で記載されている技術的特徴（構成要件）はお互いに組み合わせ可能であり、組み合わせすることにより、新しい技術的特徴を形成することができる。
　今回開示された実施の形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、請求の範囲によって示され、請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。

　１０　　　フローサイトメータ
　１　　　　処理部
　１１　　　制御部
　１２　　　主記憶部
　１３　　　補助記憶部
　１３１　　測定値ＤＢ
　１３２　　特徴情報ＤＢ
　１３３　　ゲートＤＢ
　１３４１　第１回帰モデル
　１３４２　第２回帰モデル
　１３４３　第３回帰モデル
　１３４４　第４回帰モデル
　１３４５　第５回帰モデル
　１３５　　閾値ＤＢ
　１３６　　自信度ＤＢ
　１４　　　入力部
　１５　　　表示部
　１６　　　通信部
　１７　　　読み取り部
　１Ｐ　　　制御プログラム
　１ａ　　　可搬型記憶媒体
　１ｂ　　　半導体メモリ
　２　　　　測定部
　３　　　　学習サーバ

Claims

　測定項目が異なるフローサイトメトリーの測定より得た複数の散布図を含む散布図群を取得し、
　散布図群とゲート領域とを含む訓練データに基づき学習を行った複数の学習モデルそれぞれに、取得した散布図群を入力し、
　前記複数の学習モデルそれぞれから得た推定ゲート領域を出力する
　処理をコンピュータに行わせることを特徴とするゲート領域推定プログラム。
　複数の前記推定ゲート領域に基づき、自信度を判定する
　ことを特徴とする請求項１に記載のゲート領域推定プログラム。
　複数の前記推定ゲート領域それぞれを示す各複数の変数の散布度に基づき自信度を判定する
　ことを特徴とする請求項２に記載のゲート領域推定プログラム。
　前記変数毎の散布度と所定の複数の閾値とを対照し、変数毎の自信度を複数段階で判定し、変数毎の自信度より、前記推定ゲート領域の前記自信度を判定する
　ことを特徴とする請求項３に記載のゲート領域推定プログラム。
　複数の検体それぞれの測定に対する推定ゲート領域の自信度を判定し、前記検体を特定する識別情報と判定した自信度とを対応付けて出力する
　ことを特徴とする請求項２から請求項４の何れか１項に記載のゲート領域推定プログラム。
　前記複数の学習モデルそれぞれから得た推定ゲート領域に基づき、１つの学習モデルを選択し、
　選択した前記学習モデルが出力した推定ゲート領域を出力する
　ことを特徴とする請求項１に記載のゲート領域推定プログラム。
　複数の前記学習モデルが出力した前記推定ゲート領域それぞれに含まれる細胞の数に基づき、学習モデルを選択する
　ことを特徴とする請求項６に記載のゲート領域推定プログラム。
　複数の前記学習モデルが出力した前記推定ゲート領域それぞれの面積に基づき、学習モデルを選択する
　ことを特徴とする請求項６に記載のゲート領域推定プログラム。
　複数の前記測定項目より得た散布図に基づき、測定された細胞のクラスタリングを行い、
　複数の前記学習モデルが出力した前記推定ゲート領域それぞれについて、当該クラスタリングの結果を用いて求めた細胞純度に基づき、学習モデルを選択する
　ことを特徴とする請求項６に記載のゲート領域推定プログラム。
　前記複数の学習モデルそれぞれから複数の推定ゲート領域を取得し、
　互いに関連する複数の前記推定ゲート領域を含むグループ毎に、１つの学習モデルを選択し、
　選択した学習モデルそれぞれの出力した推定ゲート領域を出力する
　ことを特徴とする請求項１から請求項９の何れか１項に記載のゲート領域推定プログラム。
　複数の前記推定ゲート領域に基づき、自信度を判定し、
　前記複数の学習モデルそれぞれから得た推定ゲート領域に基づき、１つの学習モデルを選択し、
　選択した前記学習モデルが出力した推定ゲート領域と、前記自信度とを出力する
　ことを特徴とする請求項１に記載のゲート領域推定プログラム。
　コンピュータが、
　測定項目が異なるフローサイトメトリーの測定より得た複数の散布図を含む散布図群を取得し、
　散布図群とゲート領域とを含む訓練データに基づき学習を行った複数の学習モデルそれぞれに、取得した散布図群を入力し、
　前記複数の学習モデルそれぞれから得た推定ゲート領域を出力する
　ことを特徴とするゲート領域推定方法。
　測定項目が異なるフローサイトメトリーの測定より得た複数の散布図を含む散布図群を取得する取得部と、
　散布図群とゲート領域とを含む訓練データに基づき学習を行った複数の学習モデルそれぞれに、取得した散布図群を入力し、前記複数の学習モデルそれぞれから得た推定ゲート領域を出力する出力部と
　を備えることを特徴とするゲート領域推定装置。