JP2021036224A

JP2021036224A - 情報処理装置、情報処理方法、プログラム及び情報処理システム

Info

Publication number: JP2021036224A
Application number: JP2020093877A
Authority: JP
Inventors: 山根　健治; Kenji Yamane; 健治山根; 潤一郎榎; Junichiro Enoki
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2019-08-23
Filing date: 2020-05-29
Publication date: 2021-03-04

Abstract

【課題】多色化により増大したデータを解析する。【解決手段】実施形態に係る情報処理装置は、それぞれ１以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数のスペクトルデータそれぞれに対して次元圧縮を実行する次元圧縮部と、前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定する初期値決定部と、前記初期値を用いて前記複数のスペクトルデータに対するクラスタリングを実行するクラスタリング部とを備える。【選択図】図１２

Description

本開示は、情報処理装置、情報処理方法、プログラム及び情報処理システムに関する。

医学または生化学等の分野では、大量の粒子の各々の特性を迅速に測定するために、フローサイトメータを用いることが一般的になっている。フローサイトメータは、フローセルを流れる細胞又はビーズ等の粒子に光線を照射することで、該粒子から発せられる蛍光又は散乱光などを検出し、粒子の各々の特性を光学的に測定する装置である。

特開２００７−１３２９２１号公報特表２０１６−５１１３９７号公報

近年のフローサイトメータでは、細胞などの粒子を複数の蛍光色素で染色する多色化が進められているが、多色化が進むと、一度に測定できる蛍光物質の数が増加して、組合せ爆発が発生する。その結果、処理すべきデータ量が増大して、解析が困難になるという課題が存在する。

そこで本開示では、多色化により増大したデータを解析することが可能な情報処理装置、情報処理方法、プログラム及び情報処理システムを提案する。

上記の課題を解決するために、本開示に係る一形態の情報処理装置は、それぞれ１以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数のスペクトルデータそれぞれに対して次元圧縮を実行する次元圧縮部と、前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定する初期値決定部と、前記初期値を用いて前記複数のスペクトルデータに対するクラスタリングを実行するクラスタリング部とを備える。

なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、又は上記の効果に代えて、本明細書に示されたいずれかの効果、又は本明細書から把握され得る他の効果が奏されてもよい。

第１の実施形態に係る情報処理システムの構成を示すブロック図である。蛍光スペクトルの一例を示す図である。プレ処理パラメータテーブルの一例を示す図である。スペクトルプロットの一例を示す図である。クラスタリング結果の一例を示す図である。蛍光分離処理を説明するための図である。解析結果の表示例を示す図である。プレ処理部によるプレ処理のフローを示すフローチャートである。クラスタリング処理部による処理のフローを示すフローチャートである。蛍光分離部による蛍光分離処理のフローを示すフローチャートである。ＦｌｏｗＳＯＭにおける初期化から学習までの一連の流れを説明するための模式図である。第２の実施形態に係る情報処理システムの構成を示すブロック図である。第２の実施形態に係るプレ処理／蛍光分離部の動作例を示すフローチャートである。第２の実施形態に係るクラスタリング処理部が実行するクラスタリング処理の一例を示すフローチャートである。図１４のステップＳ２２２で説明した、本実施形態に係る各代表ノードの代表ノードベクトルを初期化する際の動作を説明するための図である。図１４のステップＳ２２３で説明した、本実施形態に係るバッチ学習によるクラスタリングの一例を示すフローチャートである。図１４のステップＳ２２４で説明した、コンセンサスクラスタリングを用いてクラスタ数を決定する際の動作を説明するための図である。情報処理装置のハードウェア構成例を示すブロック図である。

以下に、本開示の実施形態について図面に基づいて詳細に説明する。また、以下に示す項目順序に従って本開示を説明する。
１．第１の実施形態
１．１情報処理システムの構成
１．２情報処理装置の動作
１．３作用・効果
２．第２の実施形態
２．１情報処理システムの構成
２．２情報処理装置の動作例
２．２．１プレ処理／蛍光分離部の動作例
２．２．２クラスタリング処理部の動作例
２．２．３代表ノードベクトルの初期化について
２．２．４バッチ学習によるクラスタリングについて
２．２．５コンセンサスクラスアリングを用いたクラスタ数の決定について
２．３作用・効果
３．情報処理装置のハードウェア構成

１．第１の実施形態
近年のフローサイトメータは、細胞などの粒子を複数の蛍光色素で染色して一度に多くの蛍光シグナルを測定することで、より豊富な情報を取得できるようになってきている。一方で、このようなフローサイトメータの多色化により、従来のような手動のゲーティングによる解析の限界が指摘されている。例えば、ｎ種類の蛍光色素を２次元の座標系にプロットする際の蛍光色素の組合せパターンは、ｎＣ２通りとなる。つまり、６色では１５通りに対し、２０色では１９０通りに増大する。

このような、増大したデータを解析する手法としては、従来の手動によるゲーティングに代えて、クラスタリングによる自動分類を採用し、データをクラスタリングにより分類してから解析する手法が考えられる。

ただし、一般的なクラスタリングでは、あるデータは何れかのクラスタに分類されるため、２つ以上のクラスタの境界に位置して判別が難しいデータであっても何れかのクラスタに分類されてしまう。そのため、フローサイトメータで取得されたデータをクラスタリングにより分類する場合、ある程度の誤分類が発生し得るという可能性がある。

一方で、フローサイトメータには、蛍光における１又は２以上の特定の波長の強度を検出するフィルタ方式と、蛍光色素それぞれから放射した蛍光を波長スペクトルとして検出することでより多くの情報を取得することが可能なスペクトル方式とが存在する。スペクトル方式では、波長ごとの蛍光強度が得られるため、一つの粒子（サンプルともいう）から多くの特徴量を取得することが可能である。そのため、スペクトル方式を採用することで、より詳細な解析が可能となる。

ただし、スペクトル方式で得られるスペクトルデータは、波長ごとの蛍光強度が線形ではなく指数関数的に変化する。そのため、スペクトルデータをユーザに認識しやすく表示するには、スペクトルデータをスケール変換する必要がある。一方、クラスタリングでは、データ間の距離に基づいて分類が行われる。そのため、波長ごとの蛍光強度が指数関数的に変化するスペクトルデータをそのままクラスタリングすると、蛍光強度の大きい部分の差がデータ間の距離全体に強く影響を及ぼすこととなり、誤分類が発生し得る。それにより、クラスタリング結果とスケール変換されて表示されるスペクトルデータとが正しく対応していない可能性がある。

そこで、本実施形態では、スペクトルデータの表示結果とクラスタリング結果とをより正しく対応させることを可能にする情報処理装置、情報処理方法、プログラム及び情報処理システムについて、例を挙げて説明する。

具体的には、フローサイトメータで取得したスペクトルデータに対してプレ処理としてｌｏｇｉｃｌｅ変換を行う。そして、ｌｏｇｉｃｌｅ変換が行われたスペクトルデータを用いてクラスタリングを行い、それにより得られたクラスタリング結果をユーザに表示する。それにより、本実施形態では、スペクトルデータのうち値の大きい部分でクラスタリングが行われることを可否することが可能となるため、スペクトルデータの表示結果とクラスタリング結果とがより正しく対応するようにクラスタリングを行うことが可能となる。以下、本実施形態に係る情報処理装置、情報処理方法、プログラム及び情報処理システムについて、図面を参照して詳細に説明する。

ただし、本開示に係る技術は、上述した課題のすべてを同時に解決している必要はない。したがって、後述する構成の一部又は全部を備えることで上述した課題の一部又は全部を解決しているものは、本開示の技術的範疇に含まれるものと解される。

１．１情報処理システムの構成
図１は、本実施形態に係る情報処理システムの構成を示すブロック図である。図１に示すように、情報処理システム４は、情報処理装置１と測定装置３を備える。

測定装置３は、測定対象の細胞等から各色の蛍光スペクトルを検出することが可能な測定装置である。測定装置３は、例えば、フローサイトメータである。フローサイトメータで測定される測定サンプルは、細胞、微生物及び生体関連粒子などの生体由来の粒子であってもよい。例えば、細胞は、動物細胞（例えば、血球系細胞など）、植物細胞などであってもよい。例えば、微生物は、大腸菌等の細菌類、タバコモザイクウイルス等のウイルス類、イースト等の菌類などであってもよい。生体関連粒子は、染色体、リポソーム、ミトコンドリア、各種オルガネラ（細胞小器官）などの細胞を構成する粒子であってもよい。なお、生体関連粒子には、核酸、タンパク質、脂質、糖鎖、これらの複合体などの生体関連高分子が含まれてもよい。これらの生体由来の粒子は、球形及び非球形のうちのいずれの形状であってもよく、大きさ及び質量についても特に限定されない。

また、測定サンプルは、ラテックス粒子、ゲル粒子、工業用粒子などの工業的に合成された粒子であってもよい。例えば、工業的に合成された粒子は、ポリスチレン、ポリメチルメタクリレートなどの有機樹脂材料、ガラス、シリカ、磁性体などの無機材料、又は、金コロイド、アルミニウムなどの金属で合成された粒子であってもよい。これらの工業的に合成された粒子についても、同様に、球形及び非球形のうちのいずれの形状であってもよく、大きさ及び質量についても特に限定されない。

測定サンプルは、蛍光スペクトルの測定に先立って、１種類以上の蛍光色素によって標識（染色）され得る。蛍光色素による測定サンプルの標識は、公知の手法によって行われてもよい。具体的には、測定サンプルが細胞である場合、細胞表面に存在する抗原に対して選択的に結合する蛍光標識抗体と、測定対象の細胞とを混合し、細胞表面の抗原に蛍光標識抗体を結合させることで、測定対象の細胞を蛍光色素にて標識することができる。または、特定の細胞に対して選択的に取り込まれる蛍光色素と、測定対象の細胞とを混合することで、測定対象の細胞を蛍光色素にて標識することも可能である。

蛍光標識抗体は、標識として蛍光色素を結合させた抗体である。蛍光標識抗体は、抗体に蛍光色素を直接結合させたものであってもよい。または、蛍光標識抗体は、ビオチン標識した抗体に、アビジンを結合させた蛍光色素をアビジン−ビオジン反応によって結合させたものであってもよい。なお、抗体には、ポリクローナル抗体及びモノクローナル抗体のうちのいずれを用いることも可能である。

細胞を標識するための蛍光色素は、特に限定されず、細胞等の染色に使用される公知の色素を少なくとも１つ以上用いることが可能である。例えば、蛍光色素として、フィコエリスリン（ＰＥ）、フルオレセインイソチオシアネート（ＦＩＴＣ）、ＰＥ−Ｃｙ５、ＰＥ−Ｃｙ７、ＰＥ−ＴｅｘａｓＲｅｄ（登録商標）、アロフィコシアニン（ＡＰＣ）、ＡＰＣ−Ｃｙ７、エチジウムブロマイド（ｅｔｈｉｄｉｕｍｂｒｏｍｉｄｅ）、プロピジウムアイオダイド（ｐｒｏｐｉｄｉｕｍｉｏｄｉｄｅ）、Ｈｏｅｃｈｓｔ（登録商標）３３２５８、Ｈｏｅｃｈｓｔ（登録商標）３３３４２、ＤＡＰＩ（４’，６−ｄｉａｍｉｄｉｎｏ−２−ｐｈｅｎｙｌｉｎｄｏｌｅ）、アクリジンオレンジ（ａｃｒｉｄｉｎｅｏｒａｎｇｅ）、クロモマイシン（ｃｈｒｏｍｏｍｙｃｉｎ）、ミトラマイシン（ｍｉｔｈｒａｍｙｃｉｎ）、オリボマイシン（ｏｌｉｖｏｍｙｃｉｎ）、ピロニン（ｐｙｒｏｎｉｎ）Ｙ、チアゾールオレンジ（ｔｈｉａｚｏｌｅｏｒａｎｇｅ）、ローダミン（ｒｈｏｄａｍｉｎｅ）１０１、イソチオシアネート（ｉｓｏｔｈｉｏｃｙａｎａｔｅ）、ＢＣＥＣＦ、ＢＣＥＣＦ−ＡＭ、Ｃ．ＳＮＡＲＦ−１、Ｃ．ＳＮＡＲＦ−１−ＡＭＡ、イクオリン（ａｅｑｕｏｒｉｎ）、Ｉｎｄｏ−１、Ｉｎｄｏ−１−ＡＭ、Ｆｌｕｏ−３、Ｆｌｕｏ−３−ＡＭ、Ｆｕｒａ−２、Ｆｕｒａ−２−ＡＭ、オキソノール（ｏｘｏｎｏｌ）、テキサスレッド（登録商標）、ローダミン１２３、１０−Ｎ−ノニ−アクリジンオレンジ、フルオレセイン（ｆｌｕｏｒｅｓｃｅｉｎ）、フルオレセインジアセテート（ｆｌｕｏｒｅｓｃｅｉｎｄｉａｃｅｔａｔｅ）、カルボキシフルオレセイン（ｃａｒｂｏｘｙｆｌｕｏｒｅｓｃｅｉｎ）、カルボキシフルオレセインジアセテート（ｃａｒｂｏｘｙｆｌｕｏｒｅｓｃｅｉｎｄｉａｃｅｔａｔｅ）、カルボキシジクロロフルオレセイン（ｃａｒｂｏｘｙｄｉｃｈｌｏｒｏｆｌｕｏｒｅｓｃｅｉｎ）、カルボキシジクロロフルオレセインジアセテート（ｃａｒｂｏｘｙｄｉｃｈｌｏｒｏｆｌｕｏｒｅｓｃｅｉｎｄｉａｃｅｔａｔｅ）等を用いることができる。また、上述した蛍光色素の誘導体等も使用することが可能である。

フローサイトメータは、測定サンプルＳに標識された蛍光色素を励起可能な波長を有するレーザ光を射出するレーザ光源と、測定サンプルＳを一方向に通流させるフローセルと、レーザ光が照射された測定サンプルＳからの蛍光、りん光及び散乱光のうちのいずれか１つ以上を受光する光検出器と、を備える。

レーザ光源は、例えば、所定の波長のレーザ光を出射する半導体レーザ光源である。レーザ光源は、複数設けられてもよい。レーザ光源が複数設けられる場合、フローセルにおいて、レーザ光源からのレーザ光が照射される位置は、同じであってもよく、異なっていてもよい。ただし、複数のレーザ光源からのレーザ光が異なる位置に照射される場合、測定サンプルＳからの光を異なる光検出器にて検出することも可能となるため、そのような場合には、近接波長の蛍光を発する色素を用いた場合でも混色せずにそれぞれの蛍光スペクトルを測定することが可能となる。なお、レーザ光源から出射されるレーザ光は、パルス光及び連続光のうちのいずれであってもよい。例えば、レーザ光源は、波長４８０ｎｍ及び波長６４０ｎｍのレーザ光をそれぞれ出射する複数の半導体レーザ光源であってもよい。

フローセルは、複数の測定サンプルＳを一方向に整列させて通流させる流路である。具体的には、フローセルは、測定サンプルＳを包み込んだシース液を層流として高速で流すことで、複数の測定サンプルＳを一方向に整列させて通流させる。フローセルはマイクロチップ又はキュベット内に形成されることができる。

光検出器は、レーザ光が照射された測定サンプルＳからの光を光電変換によって検出する。測定サンプルＳからの光には、蛍光、りん光及び散乱光のうちの少なくとも１つが含まれ得る。

例えば、光検出器は、測定サンプルＳからの前方散乱光及び側方散乱光を含む散乱光ＬＳを検出するディテクタと、測定サンプルＳからの蛍光を検出する受光素子アレイと、を含んでもよい。

ディテクタは、例えば、ＣＣＤ（ＣｈａｒｇｅＣｏｕｐｌｅｄＤｅｖｉｃｅ）、ＣＭＯＳ（ＣｏｍｐｌｅｍｅｎｔａｒｙＭｅｔａｌＯｘｉｄｅＳｅｍｉｃｏｎｄｕｃｔｏｒ）、フォトダイオードなどの公知の光電変換素子であってもよい。受光素子アレイは、例えば、検出する光の波長域が異なる独立した検出チャネルを複数配列することで構成され得る。具体的には、受光素子アレイは、検出する波長域が異なる複数のＰＭＴ（ＰｈｏｔｏＭｕｌｔｉｐｌｉｅｒＴｕｂｅ）又はフォトダイオードを一次元等に配列させた受光素子アレイや、画素が２次元格子状に配列したイメージセンサなどであってもよい。受光素子アレイは、プリズム又はグレーティングなどの分光素子によって、波長ごとに分光された測定サンプルＳからの蛍光を光電変換する。

以上のような構成を備えるフローサイトメータでは、まず、レーザ光源から出射されたレーザ光がフローセル内を流れる測定サンプルＳに照射される。レーザ光が照射されることで測定サンプルＳは、散乱光および蛍光（又はりん光）を発する。測定サンプルＳから発せられた散乱光は、ディテクタにて検出される。一方、測定サンプルＳから発せられた蛍光は、分光素子にて波長ごとの光に分光された後、受光素子アレイにて受光される。それにより、測定サンプルＳから発せられた蛍光のスペクトルが検出される。

なお、以下の説明では、測定対象は細胞であるとする。測定装置３は、例えば、蛍光染色した細胞をフローセルに高速で流し、流れる細胞に光線を照射することで、細胞から放射された蛍光色素ごとの蛍光スペクトルを検出するスペクトル型フローサイトメータである。図２は、蛍光スペクトルの一例を示す図である。図２に示すように、蛍光スペクトルは、波長に対応するチャネルごとの蛍光強度にて表現される。

測定装置３は、検出した蛍光スペクトルを測定データ２として出力する。測定データ２には、細胞ごとに、蛍光のスペクトルデータが含まれる。測定装置３は、測定データ２を例えば情報処理装置１に転送する。

情報処理装置１は、測定装置３で測定された測定データ２を取得して解析を行い、解析結果を表示する。なお、情報処理装置１と測定装置３とは、ネットワークで接続されてもよく、情報処理装置１は、ネットワークを介して測定データ２を取得してもよい。

情報処理装置１は、プレ処理部１１と、プレ処理パラメータテーブル１２と、スペクトル出力部１３と、クラスタリング処理部１４と、クラスタリング結果提示部１５と、蛍光分離部１６と、通常解析提示部１７とを有する。なお、これらの機能部の全て又は一部は、クラウドで実施されてもよい。例えば、プレ処理パラメータテーブル１２、クラスタリング処理部１４、蛍光分離部１６がクラウドで実施されてもよい。この場合、測定データ２は、クラウドにも転送される。

プレ処理部１１は、選択されたパラメータに応じて、スペクトルデータのプレ処理を行う。ここで、プレ処理とは、実際の観測値から、表示を行う座標変換のことである。変換は、例えば、単純にｌｏｇ１０変換でも良いし、観測装置の特性を考えたｌｏｇｉｃｌｅ変換のようなものでもよい。パラメータには、Ｗ、Ｔ、Ｍ及びＡがある。

Ｗは、ゼロ近辺の値をリニアに表示する値である。Ｔは、蛍光強度の最大値であり、例えば１０⁴である。Ｍは、変換後の表示座標の最大値である。Ａは、変換する最小のマイナス値である。

プレ処理パラメータテーブル１２は、プレ処理パラメータを記憶するテーブルである。図３は、プレ処理パラメータテーブル１２の一例を示す図である。図３に示すように、プレ処理パラメータテーブル１２は、Ｗ、Ｔ、Ｍ及びＡの値の複数の組み合わせ（パラメータセットともいう）を記憶する。パラメータＩＤは、パラメータの組み合わせを識別する識別子である。

プレ処理部１１は、ユーザによりプレ処理パラメータテーブル１２から選択されたＷ、Ｔ、Ｍ及びＡの組み合わせを用いてｌｏｇｉｃｌｅ変換を行う。なお、プレ処理部１１は、プレ処理パラメータテーブル１２からパラメータを選択する代わりに、デフォルト値を用いてもよい。あるいは、ユーザは、プレ処理パラメータテーブル１２が記憶する値以外の値を指定することもできる。プレ処理部１１は、ユーザがプレ処理パラメータを変更するごとにプレ処理を行う。なお、プレ処理部１１は、ｌｏｇｉｃｌｅ変換の代わりに、ｌｏｇ変換、ｂｉ−ｅｘｐｏｎｅｎｔｉａｌ変換等の非線形処理の変換を行ってもよい。

スペクトル出力部１３は、プレ処理部１１によりプレ処理が行われたスペクトルデータを用いてスペクトルプロットのイメージを生成し、生成したイメージを表示する。図４は、スペクトルプロットの一例を示す図である。スペクトルプロットは、横軸に検出波長（Wavelength）を、縦軸に蛍光強度を示し、微粒子の数（イベント数あるいは密度）に関する情報（ポピュレーション情報）を色の濃淡や色調等で表現したものである。

図４において、縦軸の「ＬＤ４８８」は、波長が４８８ｎｍ（ｎａｎｏｍｅｔｒｅ：ナノメートル）のレーザ光を照射した場合の蛍光であることを示し、「＿Ａ」は、測定値が累積強度であることを示す。また、図４において、微粒子の数の情報が網掛けで表現されているが、実際の画面では、微粒子の数の情報は色で表現される。

図４の縦軸に示すように、スペクトルプロットでは、蛍光強度に相当する縦軸がｌｏｇｉｃｌｅ変換されて表示される。このため、矢印９１と矢印９２とは、図４では同じ長さで表示されているが、それぞれが示す範囲は大きく異なる。すなわち、縦軸が線形の場合、長さが全く異なり、矢印９１の長さは矢印９２よりずっと長い。

クラスタリング処理部１４は、プレ処理部１１によりプレ処理が行われたスペクトルデータを用いて細胞のクラスタリングを行う。クラスタリング処理部１４は、例えば、Ｋ−ｍｅａｎｓのようにＫを指定されてスペクトルデータをＫ個のクラスタに分類する。あるいは、クラスタリング処理部１４は、ＦｌｏｗＳＯＭ（Self-Organizing Map）のように、分割数を自動決定してもよい。

あるいは、クラスタリング処理部１４は、例えば、Ｔ−ＳＮＥのように次元圧縮を行って、次元圧縮の結果に対してゲーティングを行うことでクラスタリングを行ってもよい。あるいは、クラスタリング処理部１４は、メタクラスタリングなどの２段階クラスタを行って、クラスタＩＤと、メタクラスタＩＤのようにクラスタの定義を２つ用いてもよい。ここで、メタクラスタとは、クラスタの集まりである。

クラスタリング処理部１４は、ｌｏｇｉｃｌｅ変換されたスペクトルデータを用いてクラスタリングを行うことで、スペクトルデータの表示結果とクラスタリング結果の対応付けを容易にすることができる。

クラスタリング結果提示部１５は、クラスタリング処理部１４によるクラスタリング結果を表示装置に表示する。クラスタリング結果提示部１５は、分類数、あるいは、どの細胞群がどの分類に所属しているかを可視化する。図５は、クラスタリング結果の一例を示す図である。図５は、ＦｌｏｗＳＯＭを用いてクラスタリングを行った場合を示す。図５において、丸はクラスタを示し、クラスタは網掛けの異なるメタクラスタＭ＃１〜Ｍ＃５に分類される。実際の表示では、メタクラスタＭ＃１〜Ｍ＃５は異なる色で表示される。クラスタリング結果を表示することで、ユーザは、クラスタやメタクラスタの分布を知ることができる。

蛍光分離部１６は、測定データ２を取得し、蛍光分離処理（アンミキシングともいう）を行う。図６は、蛍光分離処理を説明するための図である。図６（ａ）は、測定された蛍光スペクトルを示す。測定された蛍光スペクトルは、図６（ｂ）に示すように、例えば３つの蛍光の蛍光スペクトルが重ね合わされたものである。

そこで、蛍光分離部１６は、図６（ｃ）に示す参照スペクトルを用いて３つの蛍光＃１〜＃３のスペクトルに分離する。ここで、参照スペクトルは、蛍光ごとの蛍光スペクトルである。分離された蛍光＃１〜＃３のスペクトルを図６（ｄ）に示す。蛍光分離部１６は、蛍光ごとに分離されたスペクトルを用いて、例えば加重平均をとることで蛍光強度を計算する。図６（ｅ）は、蛍光分離部１６により計算された蛍光＃１〜＃３の強度を示す。

通常解析提示部１７は、蛍光分離部１６により分離された蛍光強度を用いて解析を行い、解析結果を表示装置に表示する。図７は、解析結果の表示例を示す図である。図７は、ＡＰＣ−Ｃｙ７：：ＣＤ２４とＰＥ−Ｄａｚｚｌｅ５９４：：ＣＤ３８を２つの軸とする２次元プロットを示す。ここで、ＡＰＣ−Ｃｙ７：：ＣＤ２４、ＰＥ−Ｄａｚｚｌｅ５９４：：ＣＤ３８は、蛍光強度の測定に使用された蛍光色素標識抗体である。「ＡＰＣ−Ｃｙ７」、「ＰＥ−Ｄａｚｚｌｅ５９４」は蛍光色素であり、「ＣＤ２４」、「ＣＤ３８」は抗体である。ユーザは、２次元プロットにより、２つの蛍光色素に関する細胞の分布を知ることができる。

なお、情報処理装置１は、ユーザによる二次元プロットの一部領域の選択に応じて、その領域に含まれる細胞群に対してプレ処理・クラスタリングを行い、クラスタリング結果を表示してもよい。また、情報処理装置１は、ユーザによるスペクトルプロットの一部領域の選択に応じて、その領域に含まれる細胞群に対してプレ処理・クラスタリングを行い、クラスタリング結果を表示してもよい。特に、スペクトルプロット内の密度が濃い部分等の特徴的な部分は、ユーザに選択されることが多い。

１．２情報処理装置の動作
次に、図８〜図１０を参照して、情報処理装置１の動作について説明する。図８は、プレ処理部１１によるプレ処理のフローを示すフローチャートである。図８に示すように、プレ処理部１１は、ユーザの指示に基づいてプレ処理パラメータを選択する（ステップＳ１）。

そして、プレ処理部１１は、プレ処理パラメータを用いてスペクトルデータのプレ処理を実施する（ステップＳ２）。そして、プレ処理部１１は、ユーザがプレ処理パラメータを変更したか否かを判定し（ステップＳ３）、変更した場合には、プレ処理パラメータを変更してスペクトルデータのプレ処理を実施し（ステップＳ４）、ステップＳ３に戻る。

一方、ユーザがプレ処理パラメータを変更しない場合には、プレ処理部１１は、全対象細胞を処理したか否かを判定し（ステップＳ５）、処理していない対象細胞がある場合には、ステップＳ２に戻り、別の細胞を処理する。一方、全対象細胞を処理した場合には、プレ処理部１１は、スペクトル出力部１３に、プレ処理後のスペクトルデータをユーザに提示するように指示する（ステップＳ６）。また、プレ処理部１１は、プレ処理後のスペクトルデータをクラスタリング処理部１４に渡す。

このように、プレ処理部１１がスペクトルデータのプレ処理を行うことで、クラスタリング処理部１４は、クラスタリング結果をスペクトルデータの表示結果と対応させることができる。

図９は、クラスタリング処理部１４による処理のフローを示すフローチャートである。図９に示すように、クラスタリング処理部１４は、プレ処理部１１から、プレ処理されたスペクトルデータを取得し（ステップＳ１１）、クラスタリング処理を実施する（ステップＳ１２）。そして、クラスタリング処理部１４は、クラスタリング結果提示部１５に、クラスタリング結果を提示するように指示する（ステップＳ１３）。

このように、クラスタリング処理部１４は、プレ処理されたスペクトルデータを用いてクラスタリングを行うので、クラスタリング結果をスペクトルデータの表示結果と対応させることができる。

図１０は、蛍光分離部１６による蛍光分離処理のフローを示すフローチャートである。図１０に示すように、蛍光分離部１６は、参照スペクトルを取得する（ステップＳ２１）。そして、蛍光分離部１６は、１つの細胞についてスペクトルデータを取得し（ステップＳ２２）、蛍光分離処理を行う（ステップＳ２３）。そして、蛍光分離部１６は、全細胞を処理したか否かを判定し（ステップＳ２４）、処理していない細胞がある場合には、ステップＳ２２に戻り、全細胞を処理した場合には、蛍光分離処理を終了する。

このように、蛍光分離部１６が蛍光分離処理を行うので、通常解析提示部１７は、蛍光データを解析して解析結果を表示することができる。

１．３作用・効果
以上のように、一実施形態によれば、プレ処理部１１が、スペクトルデータを取得してプレ処理としてｌｏｇｉｃｌｅ変換を行う。そして、クラスタリング処理部１４が、ｌｏｇｉｃｌｅ変換が行われたスペクトルデータを用いてクラスタリングを行う。そして、クラスタリング結果提示部１５が、クラスタリング結果を表示装置に表示する。したがって、情報処理装置１は、スペクトルデータのうち値の大きい部分でクラスタリングが行われることを防ぐことができる。このため、情報処理装置１は、スペクトルデータの表示結果とクラスタリング結果が対応するようにクラスタリングを行うことができる。

２．第２の実施形態
上述したように、近年のフローサイトメータでは、細胞などの粒子を複数の蛍光色素で染色するマルチスペクトル化が進められてきている。

フローサイトメータのマルチスペクトル化が進むと、一度に測定できる蛍光物質の数が増加し、その結果、組合せ爆発がおこるため、人間の手で解析を行うことが難しくなってしまう。例えば、Ｎ（Ｎは自然数）色を一度に計測する場合、各色を２次元で扱おうとすると、その組み合わせはｎ（ｎ−１）／２通りとなり、概ね、色数Ｎの２乗の半分に比例して増加する。

このような組み合わせ爆発によって増大したデータを解析する手法としては、上述したように、例えば、ＦｌｏｗＳＯＭなどのクラスタリングによってデータを分類してから解析する手法が考えられる。

図１１は、ＦｌｏｗＳＯＭにおける初期化から学習までの一連の流れを説明するための模式図である。図１１に示す例では、解析対象のデータ群９００に含まれる１００個のベクトル（座標値）が、初期状態において２次元座標系で３行３列に配列する９つの代表ノードＮ１１〜Ｎ３３に分類される場合が示されている。

図１１に示す例では、まず、データ群９００の中からランダムサンプリングにより所定数（本例では９つ）のデータが選択され、この選択されたデータが代表ノードＮ１１〜Ｎ３３の初期ノードベクトルＮ＿ｉｊとして設定される（ステップＳ１）。

次に、代表ノードＮ１１〜Ｎ３３それぞれの代表ノードベクトルＮ＿ｉｊを更新する学習が実行される。具体的には、まず、データ群９００からランダムサンプリングにより１つのデータが取得される（ステップＳ２）。

つづいて、取得されたデータ（ベクトル）が最も近い代表ノードに対して以下の式（１）に示される処理が実行されることで、この代表ノードの代表ノードベクトルＮ＿ｉｊが更新される（ステップＳ３）。なお、式（１）において、αは学習率ある。この学習率αは、経験則等に基づいて設定されてよく、例えば、０．１や０．０１などの値であってよい。
新代表ノードベクトルＮ＿ｉｊ＝（１−α）×旧代表ノードベクトルＮ＿ｉｊ＋α×取得したデータのベクトル（１）

つづいて、ステップＳ３で代表ノードベクトルＮ＿ｉｊが更新された代表ノードの周辺に位置する代表ノード（以下、周辺代表ノード）について、上記式（１）による変更にさらにβを乗算した以下の式（２）に示される処理が実行されることで、周辺代表ノードの代表ノードベクトル（以下、周辺代表ノードベクトルという）Ｎ＿ｉｊが更新される（ステップＳ４）。なお、式（２）において、β（ｒ）は、経験則に基づいて決定された、アルゴリズムのパラメータであってもよく、例えば、０．１や０．０１などの値であってよい。また、β（ｒ）は、固定値であってもよいし、学習回数に応じて変更されてもよい。例えば、１回目の学習時と、２回目の学習時とで、β（ｒ）値を変更してもよい。これは、αに対しても同様であってよい。
新周辺代表ノードベクトルＮ＿ｉｊ＝（１−β（ｒ））×旧周辺代表ノードベクトル＋β（ｒ）×取得したデータのベクトル（２）

なお、式（２）において、ｒは、更新対象のノードからの距離であってよく、βを距離に関連する関数で重み付けするための変数であってよい。例えば、隣接するノードの場合にはβ（ｒ）＝０．９とし、２つ隣りのノードに対してはβ（ｒ）＝０．５などとすることができる。このβ（ｒ）は、上述したように、学習回数に応じて変更してもよく、例えば、学習回数が増加するほどβの値を減らしていくようにしてもよい。

以降、データ群９００に含まれる全てのデータに対する処理が完了するまで、ステップＳ２〜Ｓ４の処理が繰り返し実行される。

ただし、このようなＦｌｏｗＳＯＭでは、ＳＯＭアルゴリズムを用いることから、以下のような課題が存在する。

第１に、ＳＯＭの代表ノード（以下、ＳＯＭノードともいう）の初期化では、上述したように、データのランダムサンプリングにより初期ノードベクトルが決定されるため（ステップＳ１）、実行ごとにクラスタリング結果が異なるという課題が存在する。

第２に、ＳＯＭアルゴリズムは、ランダムサンプリングで学習しながらクラスタリングが実行されるため（ステップＳ２〜Ｓ４）、サンプリングの順番次第で学習結果が異なり、それにより、実行ごとにクラスタリング結果が異なるという課題が存在する。

第３に、第２の課題からの派生として、ランダムサンプリングで逐次学習を行う（ステップＳ２〜Ｓ４）ことから、ＳＯＭノードのベクトルの更新が並列化（分割）できない不可分処理となり、それにより、処理の効率化や処理速度の向上ができないという課題が存在する。

また、フローサイトメータのマルチスペクトル化により、より詳細な解析が可能となるが、それと同時に扱うデータ量が増大するため、データをクラスタリングにより分類する際に、処理時間の増大や次元の呪いが生じ易いという課題も発生する。

さらに、近年では、フローサイトメータの計測速度の向上により解析対象のデータ数の増加も進んでいるが、データ数が増加すると、データ解析における描画時間が増大するだけでなく、ユーザによって生成されたクラスタを追加解析する際には、この描画時間の増大に加えて、単純に対象となるクラスタ数が増えることによる解析時間の増加という課題も発生する。

そこで、本実施形態では、実行ごとの結果のばらつきを抑制することが可能なクラスタリングを効率的に実行すること可能にする情報処理装置、情報処理方法、プログラム及び情報処理システムについて、例を挙げて説明する。

また、以下の説明において、上述した第１の実施形態と同様の構成、動作については、同一の符号を付し、その詳細な説明を省略する。

２．１情報処理システムの構成
図１２は、本実施形態に係る情報処理システムの構成を示すブロック図である。図１２に示すように、情報処理システム２００は、情報処理装置２０１と測定装置３とを備える。本実施形態において、測定装置３及び測定サンプルは、第１の実施形態において説明した測定装置３及び測定サンプルと同様であってよいため、ここでは詳細な説明を省略する。

情報処理装置２０１は、プレ処理／蛍光分離部２１１と、プレ処理パラメータテーブル１２と、スペクトル出力部１３と、クラスタリング処理部２１４と、クラスタリング結果提示部１５と、通常解析提示部１７とを備える。この構成において、プレ処理パラメータテーブル１２、クラスタリング結果提示部１５及び通常解析提示部１７は、第１の実施形態に係るそれらと同様であってよい。また、プレ処理／蛍光分離部２１１は、第１の実施形態に係るプレ処理部１１及び蛍光分離部１６の両方の機能を備えていてよい。なお、図１２ではスペクトル出力部１３が省略されているが、第１の実施形態と同様のスペクトル出力部１３が追加されてもよい。

プレ処理／蛍光分離部２１１は、第１の実施形態に係る蛍光分離部１６と同様に、参照スペクトルを用いることで、スペクトルデータである測定データ２を蛍光色素ごとの蛍光スペクトルに分離する。そして、プレ処理／蛍光分離部２１１は、アンミキシング後の蛍光スペクトルに対してＬｏｇｉｃｌｅ変換などのプレ処理を実行する。プレ処理された蛍光色素ごとの蛍光スペクトルは、通常解析提示部１７にてユーザに提示される。

なお、プレ処理で使用する変換パラメータのパラメータセットは、第１の実施形態と同様に、ユーザがプレ処理パラメータテーブル１２（図３参照）で管理されているパラメータセットから使用するパラメータセットを指定することで選択されてよい。また、プレ処理パラメータテーブル１２で管理されているパラメータセットは、ユーザが微調整可能であってもよい。

本実施形態に係るクラスタリング処理部２１４は、プレ処理／蛍光分離部２１１から出力されたプレ処理後の蛍光スペクトルに対して、クラスタリング処理を実行する。クラスタリング処理部２１４で生成されたクラスタリング結果は、クラスタリング結果提示部１５にてユーザに提示される。

２．２情報処理装置の動作例
次に、本実施形態に係る情報処理装置２０１の動作について説明する。

２．２．１プレ処理／蛍光分離部の動作例
まず、本実施形態に係るプレ処理／蛍光分離部２１１の動作例について説明する。図１３は、本実施形態に係るプレ処理／蛍光分離部の動作例を示すフローチャートである。図１３に示すように、本実施形態において、プレ処理／蛍光分離部２１１は、まず、図８のステップＳ１と同様に、ユーザの指示に基づいてプレ処理パラメータを選択する（ステップＳ２０１）。

次に、プレ処理／蛍光分離部２１１は、第１の実施形態において図１０を用いて説明した蛍光分離処理と同様に、測定データ２に含まれる全ての細胞のスペクトルデータに対して、参照スペクトルを用いた蛍光分離処理を実行する（ステップＳ２０２）。

次に、プレ処理／蛍光分離部２１１は、図８のステップＳ２〜Ｓ５と同様に、測定データ２に含まれる全ての細胞のスペクトルデータに対して、ユーザにより選択又は変更されたプレ処理パラメータを用いたプレ処理を実行する（ステップＳ２０３〜Ｓ２０６）。

その後、全ての細胞のスペクトルデータに対するプレ処理が完了すると（ステップＳ２０６のＹＥＳ）、プレ処理／蛍光分離部２１１は、プレ処理後のスペクトルデータをクラスタリング処理部２１４に入力し（ステップS２０７）、本動作を終了する。なお、プレ処理／蛍光分離部２１１は、例えば、図８のステップＳ６と同様に、プレ処理後のスペクトルデータをユーザに提示するよう、スペクトル出力部１３に指示してもよい。

なお、本動作では、測定データ２に含まれる全細胞のスペクトルデータを対象としているが、これに限らず、後述するクラスタリングにおけるノード分割数（以下、必要数ともいう）以上の数の細胞のスペクトルデータであればよい。これは、後述するクラスタリング処理部の動作についても同様であってよい。

２．２．２クラスタリング処理部の動作例
次に、本実施形態に係るクラスタリング処理部２１４の動作例について説明する。本実施形態に係るクラスタリング処理部２１４が実行する動作の基本的な流れは、例えば、第１の実施形態において図９を用いて説明した動作と同様であってよい。ただし、本実施形態では、図９のステップＳ１２で実行されるクラスタリング処理が、後述において図１４を用いて説明するクラスタリング処理に置き換えられる。

図１４は、本実施形態に係るクラスタリング処理部が実行するクラスタリング処理の一例を示すフローチャートである。なお、図１４に示すクラスタリング処理部２１４の動作からも分かるように、本実施形態に係るクラスタリング処理部２１４は、特許請求の範囲における、次元圧縮部、初期値決定部、クラスタリング部、平均値算出部、１以上の割当て部、更新部、ノード数変更部、メタクラスタリング部、分割部、及び、ノード設定部のうちの１つ以上としても機能し得る。

図１４に示すように、本実施形態では、クラスタリング処理部２１４は、まず、測定データ２に含まれる全て（又は必要数以上）の細胞のスペクトルデータに対して、主成分分析を実行する（ステップＳ２２１）。

なお、ステップＳ２２１において対象とするスペクトルデータは、蛍光分離後にプレ処理が実施されたスペクトルデータであってよい。また、本説明では、主成分数を２つとしているが、これに限定されず、３以上であってもよい。さらに、ステップＳ２２１では、主成分分析に限られず、Ｔ−ＳＮＥのような統計学上のデータ解析手法を用いた種々の次元圧縮が実行されてよい。

次に、クラスタリング処理部２１４は、ステップＳ２２１で決定した第１主成分及び第２主成分と、測定データ２に含まれる全細胞（又は必要数以上の細胞）の値（ベクトル）とに基づいて、ＳＯＭノードの代表ノードベクトルの初期値を決定する（ステップＳ２２２）。なお、ステップＳ２２２の詳細については、後述において図１５を用いて説明する。

次に、クラスタリング処理部２１４は、バッチ学習を行うことでＳＯＭクラスタリング処理を実行する（ステップＳ２２３）。なお、ステップＳ２２３の詳細については、後述において図１６を用いて説明する。

次に、クラスタリング処理部２１４は、ステップＳ２２３で実行したＳＯＭクラスタリング処理の結果に対して、例えば、コンセンサスクラスタリングなどの、クラスタ数を決定する処理（以下、メタクラスタリングという）を実行する（ステップＳ２２４）。これにより、クラスタリング処理におけるクラスタ数が決定される。なお、コンセンサスクラスタリングを用いた場合のステップＳ２２３の詳細については、後述において図１７を用いて説明する。

その後、クラスタリング処理部２１４は、クラスタリング結果提示部１５に、クラスタリング結果をユーザに提示するように指示する（ステップＳ２２５）。クラスタリング結果をユーザに提示するための可視化には、例えば、ＭＳＴ（Minimum Spanning Tree）法などを用いることが可能である。

２．２．３代表ノードベクトルの初期化について
図１５は、図１４のステップＳ２２２で説明した、本実施形態に係る各代表ノードの代表ノードベクトルを初期化する際の動作を説明するための図である。なお、図１５に示す例では、図１１に示した例と同様に、プレ処理／蛍光分離部２１１による蛍光分離及びプレ処理が実行された１００個の処理済みスペクトルデータ（ベクトル（座標値））が、初期状態において２次元座標系で３行３列に配列する９つの代表ノードＮ１１〜Ｎ３３に分類される場合が示されている。

図１５に示すように、本実施形態に係る代表ノードベクトルの初期化では、まず、クラスタリング処理部２１４は、蛍光分離及びプレ処理後のスペクトルデータ（以下、処理済みスペクトルデータという）を含むデータ群（以下、単にデータ群という）３０２を対象として、各次元の平均値を計算する（ステップＳ３０１）。例えば、データの次元数が１０である場合には、１次元から１０次元それぞれについて、データ群３０２に含まれる全ての処理済みスペクトルデータにおける各次元の値が合算され、その平均が計算される。なお、次元数とは、データの種類数に相当する値であり、例えば、スペクトルデータであればチャネル数に相当し得る。したがって、例えば受光素子アレイが３２チャネル、すなわち、受光素子アレイが検出範囲全体を３２つの波長帯に区切って蛍光を検出する場合には、この受光素子アレイで取得されるスペクトルデータの次元数は３２となる。

つづいて、クラスタリング処理部２１４は、データ群３０２に含まれる全ての処理済みスペクトルデータの次元圧縮を行うことで、第１固有値及び第２固有値と、第１固有値の分散及び第２固有値の分散とをそれぞれ求める（ステップＳ３０２）。データの次元圧縮には、例えば、主成分分析などの統計学上のデータ解析手法を用いることができる。なお、第１固有値及び第２固有値は、次元圧縮後の次元から所定の規則に従って又は任意に選択されてよく、また、その数も第１固有値及び第２固有値の２つに限定されず、例えば、１つ又は３つ以上であってもよい。

つづいて、クラスタリング処理部２１４は、各代表ノードＮ１１〜Ｎ３３の初期ノードベクトルを以下の式（３）を用いて計算する（ステップＳ３０３）。なお、式（３）では、座標（ｉ，ｊ）の代表ノードＮｉｊの代表ノードベクトルの初期値（初期ノードベクトル）がＮ＿ｉｊと表されている。式（３）において、行分割数とは、行方向に並ぶ代表ノードの数であり、本例では３である。同様に、列分割数とは、列方向に並ぶ代表ノードの数であり、本例では３である。
初期ノードベクトルＮ＿ｉｊ＝各次元の平均値＋（第１固有値／行分割数）×ｉ＋（第２固有値／列分割数）×ｊ（３）

以上のようにして各代表ノードの初期ノードベクトル（初期値）を決定することで、母集団が同一のデータ群３０２に対しては常に同じ初期ノードベクトルを設定することが可能となる。それにより、実行ごとにクラスタリング結果が異なること（上述した第１の課題に相当）を回避することが可能となる。

２．２．４バッチ学習によるクラスタリングについて
図１６は、図１４のステップＳ２２３で説明した、本実施形態に係るバッチ学習によるクラスタリングの一例を示すフローチャートである。なお、図１６に示す例では、図１５に示した例と同様に、プレ処理／蛍光分離部２１１による蛍光分離及びプレ処理が実行された１００個の処理済みスペクトルデータ（ベクトル（座標値））が、初期状態において２次元座標系で３行３列に配列する９つの代表ノードＮ１１〜Ｎ３３に分類される場合が示されている。

図１６に示すように、本実施形態に係るバッチ学習によるクラスタリングでは、まず、クラスタリング処理部２１４は、データ群３０２から処理済みスペクトルデータを１つずつ選択し、選択した処理済みスペクトルデータをこれに最も近い代表ノードに割り当てる処理を実行する（ステップＳ３０４）。この割当て処理は、データ群３０２における全て（又は必要数以上）の処理済みスペクトルデータの割り当てが完了するまで繰り返される。図１６に示す例では、細胞ＩＤが‘１’、‘３’である処理済みスペクトルデータが代表ノードＮ１１に割り当てられ、細胞ＩＤが‘２’である処理済みスペクトルデータが代表ノードＮ１２に割り当てられ、細胞ＩＤが‘１００’である処理済みスペクトルデータが代表ノードＮ３３に割り当てられている（細胞ＩＤ＝‘４’〜‘９９’については説明が省略されている）。

なお、細胞ＩＤとは、データ群３０２に登録された処理済みスペクトルデータに対応する細胞を一意に識別するための識別子であってよい。また、データ群３０２から処理済みスペクトルデータを選択する際の順番は特に限定されず、例えば、データ群３０２に登録された処理済みスペクトルデータの細胞を一意に識別するための細胞ＩＤの若い順や、データ群３０２への登録準など、種々の順番であってよい。

次に、クラスタリング処理部２１４は、それぞれの代表ノードＮ１１〜Ｎ３３に割り当てられた処理済みスペクトルデータに基づいて、代表ノードＮ１１〜Ｎ３３それぞれの代表ノードベクトルを更新する処理を実行する（ステップＳ３０５）。代表ノードベクトルの更新では、例えば、以下の式（４）に基づいて、更新後の新代表ノードベクトルが計算される。
新代表ノードベクトルＮ＿ｉｊ＝（１−α）×旧代表ノードベクトルＮ＿ｉｊ＋α×割り当てられた処理済みスペクトルデータの平均値（４）

次に、クラスタリング処理部２１４は、ステップＳ３０５で代表ノードベクトルＮ＿ｉｊが更新された代表ノードの周辺に位置する周辺代表ノードについて、上記式（４）による変更にさらにβを乗算した以下の式（５）に示される処理を実行することで、周辺代表ノードの周辺代表ノードベクトルＮ＿ｉｊを更新する（ステップＳ３０６）。なお、式（５）において、β（ｒ）は、上述した式（２）におけるβ（ｒ）と同様であってよい。
新周辺代表ノードベクトルＮ＿ｉｊ＝（１−β（ｒ））×旧周辺代表ノードベクトルＮ＿ｉｊ＋β（ｒ）×代表ノードに割り当てられた処理済みスペクトルデータの平均値（５）

本実施形態では、上述したステップＳ３０４〜Ｓ３０６の処理を所定回数（例えば、１回や２回以上）繰り返すことで、各代表ノードＮ１１〜Ｎ３３の代表ノードベクトルが更新される。なお、ステップＳ３０４〜Ｓ３０６の処理の繰り返しでは、繰り返すごとに学習率α及び／又はβが変化（例えば、減少又は増加）してもよい。

以上のように、解析対象とする処理済みスペクトルデータの全てを代表ノードＮ１１〜Ｎ３３の何れかに割り当てた後、各代表ノードＮ１１〜Ｎ３３に割り当てられた処理済みスペクトルデータを用いて各代表ノードＮ１１〜Ｎ３３の代表ノードベクトルを更新する手順とすることで、学習時のランダムサンプリングを排除することが可能となるため、実行ごとにクラスタリング結果が異なること（第２の課題に相当）を回避することが可能となる。

また、全ての処理済みスペクトルデータの割当てが完了した後に代表ノードベクトルの更新が実行されるため、処理済みスペクトルデータの割当てから代表ノードベクトルの更新までの処理を細分化して異なる情報処理装置に実行させることが可能となる。

例えば、データ群３０２に含まれる処理済みスペクトルデータを複数のグループに分割し、各グループに属するスペクトルデータの代表ノードへの割当てをそれぞれ異なる情報処理装置に実行させることが可能となる。例えば、本実施形態に係るクラスタリング処理部２１４は、複数の処理済みスペクトルデータを代表ノードＮ１１〜Ｎ３３の何れかに割り当てる割当て部を備え、クラスタリング処理部２１４が備える割当て部の数は、グループ数と同数又はそれ以下の数であってよく、各割当て部は、互いに異なる情報処理装置において実行されてもよい。

それにより、処理済みスペクトルデータの割当て処理を並列に実行することが可能となるため、処理の効率化や処理速度の向上等を達成することが可能となる。

また、処理の細分化により、各情報処理装置が担当するデータ量を縮小することが可能となるため、クラスタリングする際の処理時間の増大や次元の呪いなどの不具合の発生も抑制することが可能となる。

２．２．５コンセンサスクラスアリングを用いたクラスタ数の決定について
図１７は、図１４のステップＳ２２４で説明した、コンセンサスクラスタリングを用いてクラスタ数を決定する際の動作を説明するための図である。なお、図１７に示す例では、図１５及び図１６に示した例と同様に、プレ処理／蛍光分離部２１１による蛍光分離及びプレ処理が実行された１００個の処理済みスペクトルデータ（ベクトル（座標値））が、初期状態において２次元座標系で３行３列に配列する９つの代表ノードＮ１１〜Ｎ３３に分類される場合が示されている。

上述の説明では、図１７の（ａ）に示されているように、データ群３０２に含まれる処理済みスペクトルデータの分類先、すなわち代表ノードの数が、初期設定において９つと設定されている場合について例示したが、データ群３０２に含まれる処理済みスペクトルデータによっては、初期設定された代表ノードの数（９つ）が必ずしも最適であるとは限らない。

そこで本実施形態では、図１４のステップＳ２２４において、コンセンサスクラスタリングなどのメタクラスタリングを実行することで、図１７の（ｂ）に示すように、より適した分割数と、メタクラスタリング後の代表ノード（以下、メタ代表ノードという）を構成する代表ノードの組合せとを決定する。

図１７に示す例では、メタクラスタリングの結果、代表ノードＮ１１、Ｎ１２及びＮ２１で１つのメタ代表ノードＮＮ１が構成され、代表ノードＮ２２、Ｎ３１及びＮ３２で１つのメタ代表ノードＮＮ２が構成され、代表ノードＮ１３、Ｎ２３及びＮ３３で１つのメタ代表ノードＮＮ３が構成される場合について例示されている。

なお、本実施形態において、クラスタリングの実行時に設定されるノード分割数（本例では９つ）は、デフォルトで決定されている分割数であってもよいし、ユーザにより設定された分割数であってもよい。ユーザに当初のノード分割数を設定させる場合には、情報処理装置２０１は、ノード分割数をユーザに設定させるノード設定部として機能する操作入力部をさらに備えていてもよい。

２．３作用・効果
以上のように、本実施形態によれば、処理済みスペクトルデータの次元ごとの平均値と、処理済みスペクトルデータを次元圧縮することで得られた固有値とに基づいて、各代表ノードの初期ノードベクトル（初期値）が決定されるため、母集団が同一のデータ群３０２に対しては常に同じ初期ノードベクトルを設定することが可能となる。それにより、実行ごとにクラスタリング結果が異なることを回避することが可能となる。

また、本実施形態によれば、解析対象とする処理済みスペクトルデータの全てが代表ノードＮ１１〜Ｎ３３の何れかに割り当てられた後、各代表ノードＮ１１〜Ｎ３３に割り当てられた処理済みスペクトルデータを用いて各代表ノードＮ１１〜Ｎ３３の代表ノードベクトルが更新される手順であるため、実行ごとにクラスタリング結果が異なることを回避することが可能となる。

さらに、本実施形態では、全ての処理済みスペクトルデータの割当てが完了した後に代表ノードベクトルの更新が実行されるため、処理済みスペクトルデータの割当てから代表ノードベクトルの更新までの処理を細分化して異なる情報処理装置に実行させることが可能となる。

さらにまた、処理の細分化により、各情報処理装置が担当するデータ量を縮小することが可能となるため、クラスタリングする際の処理時間の増大や次元の呪いなどの不具合の発生も抑制することが可能となる。

なお、本実施形態では、蛍光分離後のスペクトルデータをクラスタリング処理部２１４によるクラスタリング対象とした場合を例示したが、これに限定されず、例えば、測定装置３で取得された測定データ２をクラスタリング処理部２１４によるクラスタリング対象とすることも可能である。その場合、プレ処理／蛍光分離部２１１は、測定データ２にプレ処理を実行し、それにより得られた蛍光分離前のスペクトルデータをクラスタリング処理部２１４に入力する。そして、クラスタリング処理部２１４は、入力された蛍光分離前のスペクトルデータに対して、上述したクラスタリング処理を実行する。

また、本実施形態では、プレ処理／蛍光分離部２１１が、測定データ２に含まれるスペクトルデータに対して蛍光分離処理を実行することで得られた蛍光色素ごとの蛍光スペクトルに対してプレ処理を実行する場合を例示したが、これに限定されず、例えば、プレ処理／蛍光分離部２１１が、測定データ２に含まれるスペクトルデータに対して先にプレ処理を実行してから蛍光分離処理を実行してもよい。

その他の構成、動作及び効果は、上述した第１の実施形態と同様で会ってよいため、ここでは詳細な説明を省略する。

３．情報処理装置のハードウェア構成
次に、図１８を参照して、上述した実施形態に係る情報処理装置１、２０１のハードウェア構成について説明する。図１８は、本開示の実施形態に係る情報処理装置のハードウェア構成例を示すブロック図である。なお、以下の説明では、情報処理装置１を例示するが、情報処理装置２０１に対しても同様に適用することが可能である。

図１８に示すように、情報処理装置１は、ＣＰＵ（Central Processing Unit）９０１、ＲＯＭ（Read Only Memory）９０３、及びＲＡＭ（Random Access Memory）９０５を含む。また、情報処理装置１は、ホストバス９０７、ブリッジ９０９、外部バス９１１、インタフェース９１３、入力装置９１５、出力装置９１７、ストレージ装置９１９、ドライブ９２１、接続ポート９２５、通信装置９２９を含む。情報処理装置１は、ＣＰＵ９０１に代えて、又はこれとともに、ＤＳＰ（Digital Signal Processor）又はＡＳＩＣ（Application Specific Integrated Circuit）と呼ばれるような処理回路を有してもよい。

ＣＰＵ９０１は、演算処理装置及び制御装置として機能し、ＲＯＭ９０３、ＲＡＭ９０５、ストレージ装置９１９、又はリムーバブル記録媒体９２３に記録された各種プログラムに従って、情報処理装置１内の動作全般又はその一部を制御する。例えば、ＣＰＵ９０１は、上記の実施形態における情報処理装置１に含まれる各機能部の動作全般を制御する。ＲＯＭ９０３は、ＣＰＵ９０１が使用するプログラムや演算パラメータ等を記憶する。ＲＡＭ９０５は、ＣＰＵ９０１の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一次記憶する。ＣＰＵ９０１、ＲＯＭ９０３、及びＲＡＭ９０５は、ＣＰＵバス等の内部バスにより構成されるホストバス９０７により相互に接続されている。さらに、ホストバス９０７は、ブリッジ９０９を介して、ＰＣＩ（Peripheral Component Interconnect/Interface）バス等の外部バス９１１に接続されている。

入力装置９１５は、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ及びレバー等、ユーザによって操作される装置である。入力装置９１５は、例えば、赤外線やその他の電波を利用したリモートコントロール装置であってもよいし、情報処理装置１の操作に対応した携帯電話等の外部接続機器９２７であってもよい。入力装置９１５は、ユーザが入力した情報に基づいて入力信号を生成してＣＰＵ９０１に出力する入力制御回路を含む。ユーザは、この入力装置９１５を操作することによって、情報処理装置１に対して各種のデータを入力したり処理動作を指示したりする。

出力装置９１７は、取得した情報をユーザに対して視覚的又は聴覚的に通知することが可能な装置で構成される。出力装置９１７は、例えば、ＬＣＤ、ＰＤＰ、ＯＥＬＤ等の表示装置、スピーカ及びヘッドホン等の音響出力装置、並びにプリンタ装置等でありうる。出力装置９１７は、情報処理装置１の処理により得られた結果を、テキスト又は画像等の映像として出力したり、音響等の音として出力したりする。

ストレージ装置９１９は、情報処理装置１の記憶部の一例として構成されたデータ格納用の装置である。ストレージ装置９１９は、例えば、ＨＤＤ（Hard Disk Drive）等の磁気記憶部デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等により構成される。このストレージ装置９１９は、ＣＰＵ９０１が実行するプログラムや各種データ、及び外部から取得した各種のデータ等を格納する。

ドライブ９２１は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体９２３のためのリーダライタであり、情報処理装置１に内蔵、あるいは外付けされる。ドライブ９２１は、装着されているリムーバブル記録媒体９２３に記録されている情報を読み出して、ＲＡＭ９０５に出力する。また、ドライブ９２１は、装着されているリムーバブル記録媒体９２３に記録を書き込む。

接続ポート９２５は、機器を情報処理装置１に直接接続するためのポートである。接続ポート９２５は、例えば、ＵＳＢ（Universal Serial Bus）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（Small Computer System Interface）ポート等でありうる。また、接続ポート９２５は、ＲＳ−２３２Ｃポート、光オーディオ端子、ＨＤＭＩ（登録商標）（High-Definition Multimedia Interface）ポート等であってもよい。接続ポート９２５に外部接続機器９２７を接続することで、情報処理装置１と外部接続機器９２７との間で各種のデータが交換されうる。

通信装置９２９は、例えば、通信ネットワークＮＷに接続するための通信デバイス等で構成された通信インタフェースである。通信装置９２９は、例えば、有線又は無線ＬＡＮ（Local Area Network）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、又はＷＵＳＢ（Wireless USB）用の通信カード等でありうる。また、通信装置９２９は、光通信用のルータ、ＡＤＳＬ（Asymmetric Digital Subscriber Line）用のルータ、又は、各種通信用のモデム等であってもよい。通信装置９２９は、例えば、インターネットや他の通信機器との間で、ＴＣＰ／ＩＰ等の所定のプロトコルを用いて信号等を送受信する。また、通信装置９２９に接続される通信ネットワークＮＷは、有線又は無線によって接続されたネットワークであり、例えば、インターネット、家庭内ＬＡＮ、赤外線通信、ラジオ波通信又は衛星通信等である。

なお、本開示の技術的範囲は、上述の実施形態そのままに限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、異なる実施形態及び変形例にわたる構成要素を適宜組み合わせてもよい。

例えば、上記実施形態では、情報処理システム４は情報処理装置１又は２０１と測定装置３とを備える構成であるとしたが、本技術はかかる例に限定されない。例えば、情報処理装置１又は２０１が測定装置３の有する機能（測定機能）を備えてもよい。この場合、情報処理システム４は、情報処理装置１又は２０１により実現される。また、測定装置３が情報処理装置１又は２０１の有する機能を備えてもよい。この場合、情報処理システム４は、測定装置３により実現される。また、情報処理装置１又は２０１の有する機能の一部を測定装置３が有してもよく、測定装置３の有する機能の一部を情報処理装置１又は２０１が有してもよい。

なお、本技術は以下のような構成も取ることができる。
（１）
それぞれ１以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数のスペクトルデータそれぞれに対して次元圧縮を実行する次元圧縮部と、
前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定する初期値決定部と、
前記初期値を用いて前記複数のスペクトルデータに対するクラスタリングを実行するクラスタリング部と、
を備える情報処理装置。
（２）
前記複数のスペクトルデータの次元ごとの平均値を算出する平均値算出部をさらに備え、
前記初期値決定部は、前記次元圧縮の結果に加え、前記複数のスペクトルデータの前記次元ごとの平均値に基づいて、前記複数のノードそれぞれの前記初期値を決定する
前記（１）に記載の情報処理装置。
（３）
前記クラスタリング部は、
前記複数のスペクトルデータそれぞれを前記複数のノードの何れかに割り当てる割当て部と、
前記複数のノードそれぞれに割り当てられた前記スペクトルデータに基づいて前記複数のノードそれぞれのノードベクトルを更新する更新部と、
を含む前記（１）又は（２）に記載の情報処理装置。
（４）
前記クラスタリング部は、
前記更新部により更新された前記複数のノードそれぞれの前記ノードベクトルに対してコンセンサスクラスタリングを実行することで、前記ノードの数を変更するノード数変更部と、
前記ノード数変更部による変更後のノードに対して変更前の前記複数のノードそれぞれの前記ノードベクトルに基づくメタクラスタリングを実行するメタクラスタリング部と、
をさらに備える前記（３）に記載の情報処理装置。
（５）
前記クラスタリング部は、前記複数のスペクトルデータを２以上のグループに分割する分割部をさらに備え、
前記割当て部は、前記２以上のグループごとに、前記複数のスペクトルデータそれぞれを前記複数のノードの何れかに割り当てる
前記（４）に記載の情報処理装置。
（６）
前記クラスタリング部は、前記グループの数と同数又はそれ以下の数の前記割当て部を備え、
前記割当て部それぞれは、互いに異なる情報処理装置に配置される
前記（５）に記載の情報処理装置。
（７）
前記クラスタリング部は、ＳＯＭ（Self-Organizing Map）アルゴリズムを用いたクラスタリングを実行する
前記（１）〜（６）の何れか１項に記載の情報処理装置。
（８）
前記ノードの数をユーザに設定させるノード設定部をさらに備える
前記（１）〜（７）の何れか１項に記載の情報処理装置。
（９）
前記次元圧縮部は、前記次元圧縮として、前記複数のスペクトルデータの主成分分析を実行する
前記（１）〜（８）の何れか１項に記載の情報処理装置。
（１０）
前記スペクトルデータは、スペクトル型のフローサイトメータにより測定されたスペクトルデータである
前記（１）〜（９）の何れか１項に記載の情報処理装置。
（１１）
前記複数のスペクトルデータそれぞれに対してスケール変換を実行するプレ処理部をさらに備え、
前記次元圧縮部は、前記スケール変換が実行された前記複数のスペクトルデータそれぞれに対して前記次元圧縮を実行する
前記（１）〜（１０）の何れか１項に記載の情報処理装置。
（１２）
前記複数のスペクトルデータそれぞれを前記蛍光色素ごとの蛍光スペクトルに分離する蛍光分離部をさらに備え、
前記プレ処理部は、複数の前記蛍光スペクトルそれぞれに対して前記スケール変換を実行する
前記（１１）に記載の情報処理装置。
（１３）
前記プレ処理部は、前記スケール変換として非線形処理の変換を行う
前記（１１）又は（１２）に記載の情報処理装置。
（１４）
前記プレ処理部は、前記スケール変換としてｌｏｇｉｃｌｅ変換、ｌｏｇ変換又はｂｉ−ｅｘｐｏｎｅｎｔｉａｌ変換を行う
前記（１３）に記載の情報処理装置。
（１５）
前記クラスタリング部により実施された前記クラスタリングの結果を表示する表示制御部をさらに備える
前記（１）〜（１４）の何れか１項に記載の情報処理装置。
（１６）
前記クラスタリング部により実施された前記クラスタリングの結果を表示する表示制御部をさらに備え、
前記表示制御部は、前記プレ処理部によりスケール変換が行われたデータを表示する
前記（１１）〜（１４）の何れか１項に記載の情報処理装置。
（１７）
それぞれ１以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数のスペクトルデータそれぞれに対して次元圧縮を実行し、
前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定し、
前記初期値を用いて前記複数のスペクトルデータに対するクラスタリングを実行する
ことを含む情報処理方法。
（１８）
コンピュータに、
それぞれ１以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数のスペクトルデータそれぞれに対して次元圧縮を実行する工程と、
前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定する工程と、
前記初期値を用いて前記複数のスペクトルデータに対するクラスタリングを実行する工程と、
を実行させるためのプログラム。
（１９）
それぞれ１以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数のスペクトルデータを検出する測定装置と、
前記測定装置で検出された前記複数のスペクトルデータをクラスタリングする情報処理装置と、
を備え、
前記情報処理装置は、
前記測定装置で検出された前記複数のスペクトルデータそれぞれに対して次元圧縮を実行する次元圧縮部と、
前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定する初期値決定部と、
前記初期値を用いて前記複数のスペクトルデータに対するクラスタリングを実行するクラスタリング部と、
を備える情報処理システム。

１，２０１情報処理装置
２測定データ
３測定装置
４，２００情報処理システム
１１プレ処理部
１２プレ処理パラメータテーブル
１３スペクトル出力部
１４，２１４クラスタリング処理部
１５クラスタリング結果提示部
１６蛍光分離部
１７通常解析提示部
２１１プレ処理／蛍光分離部
３０２データ群

Claims

それぞれ１以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数のスペクトルデータそれぞれに対して次元圧縮を実行する次元圧縮部と、
前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定する初期値決定部と、
前記初期値を用いて前記複数のスペクトルデータに対するクラスタリングを実行するクラスタリング部と、
を備える情報処理装置。
前記複数のスペクトルデータの次元ごとの平均値を算出する平均値算出部をさらに備え、
前記初期値決定部は、前記次元圧縮の結果に加え、前記複数のスペクトルデータの前記次元ごとの平均値に基づいて、前記複数のノードそれぞれの前記初期値を決定する
請求項１に記載の情報処理装置。
前記クラスタリング部は、
前記複数のスペクトルデータそれぞれを前記複数のノードの何れかに割り当てる割当て部と、
前記複数のノードそれぞれに割り当てられた前記スペクトルデータに基づいて前記複数のノードそれぞれのノードベクトルを更新する更新部と、
を含む請求項１に記載の情報処理装置。
前記クラスタリング部は、
前記更新部により更新された前記複数のノードそれぞれの前記ノードベクトルに対してコンセンサスクラスタリングを実行することで、前記ノードの数を変更するノード数変更部と、
前記ノード数変更部による変更後のノードに対して変更前の前記複数のノードそれぞれの前記ノードベクトルに基づくメタクラスタリングを実行するメタクラスタリング部と、
をさらに備える請求項３に記載の情報処理装置。
前記クラスタリング部は、前記複数のスペクトルデータを２以上のグループに分割する分割部をさらに備え、
前記割当て部は、前記２以上のグループごとに、前記複数のスペクトルデータそれぞれを前記複数のノードの何れかに割り当てる
請求項４に記載の情報処理装置。
前記クラスタリング部は、前記グループの数と同数又はそれ以下の数の前記割当て部を備え、
前記割当て部それぞれは、互いに異なる情報処理装置に配置される
請求項５に記載の情報処理装置。
前記クラスタリング部は、ＳＯＭ（Self-Organizing Map）アルゴリズムを用いたクラスタリングを実行する
請求項１に記載の情報処理装置。
前記ノードの数をユーザに設定させるノード設定部をさらに備える
請求項１に記載の情報処理装置。
前記次元圧縮部は、前記次元圧縮として、前記複数のスペクトルデータの主成分分析を実行する
請求項１に記載の情報処理装置。
前記スペクトルデータは、スペクトル型のフローサイトメータにより測定されたスペクトルデータである
請求項１に記載の情報処理装置。
前記複数のスペクトルデータそれぞれに対してスケール変換を実行するプレ処理部をさらに備え、
前記次元圧縮部は、前記スケール変換が実行された前記複数のスペクトルデータそれぞれに対して前記次元圧縮を実行する
請求項１に記載の情報処理装置。
前記複数のスペクトルデータそれぞれを前記蛍光色素ごとの蛍光スペクトルに分離する蛍光分離部をさらに備え、
前記プレ処理部は、複数の前記蛍光スペクトルそれぞれに対して前記スケール変換を実行する
請求項１１に記載の情報処理装置。
前記プレ処理部は、前記スケール変換として非線形処理の変換を行う
請求項１１に記載の情報処理装置。
前記プレ処理部は、前記スケール変換としてｌｏｇｉｃｌｅ変換、ｌｏｇ変換又はｂｉ−ｅｘｐｏｎｅｎｔｉａｌ変換を行う
請求項１３に記載の情報処理装置。
前記クラスタリング部により実施された前記クラスタリングの結果を表示する表示制御部をさらに備える
請求項１に記載の情報処理装置。
前記クラスタリング部により実施された前記クラスタリングの結果を表示する表示制御部をさらに備え、
前記表示制御部は、前記プレ処理部によりスケール変換が行われたデータを表示する
請求項１１に記載の情報処理装置。
それぞれ１以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数のスペクトルデータそれぞれに対して次元圧縮を実行し、
前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定し、
前記初期値を用いて前記複数のスペクトルデータに対するクラスタリングを実行する
ことを含む情報処理方法。
コンピュータに、
それぞれ１以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数のスペクトルデータそれぞれに対して次元圧縮を実行する工程と、
前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定する工程と、
前記初期値を用いて前記複数のスペクトルデータに対するクラスタリングを実行する工程と、
を実行させるためのプログラム。
それぞれ１以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数のスペクトルデータを検出する測定装置と、
前記測定装置で検出された前記複数のスペクトルデータをクラスタリングする情報処理装置と、
を備え、
前記情報処理装置は、
前記測定装置で検出された前記複数のスペクトルデータそれぞれに対して次元圧縮を実行する次元圧縮部と、
前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定する初期値決定部と、
前記初期値を用いて前記複数のスペクトルデータに対するクラスタリングを実行するクラスタリング部と、
を備える情報処理システム。