JP7392411B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP7392411B2
JP7392411B2 JP2019207396A JP2019207396A JP7392411B2 JP 7392411 B2 JP7392411 B2 JP 7392411B2 JP 2019207396 A JP2019207396 A JP 2019207396A JP 2019207396 A JP2019207396 A JP 2019207396A JP 7392411 B2 JP7392411 B2 JP 7392411B2
Authority
JP
Japan
Prior art keywords
cluster
clustering
evaluation value
information processing
processing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019207396A
Other languages
English (en)
Other versions
JP2020087465A (ja
Inventor
澪 村田
健治 山根
潤一郎 榎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Sony Group Corp
Original Assignee
Sony Corp
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp, Sony Group Corp filed Critical Sony Corp
Publication of JP2020087465A publication Critical patent/JP2020087465A/ja
Priority to JP2023197269A priority Critical patent/JP2024009155A/ja
Application granted granted Critical
Publication of JP7392411B2 publication Critical patent/JP7392411B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N15/1429Signal processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N15/1456Optical investigation techniques, e.g. flow cytometry without spatial resolution of the texture or inner structure of the particle, e.g. processing of pulse signals
    • G01N15/1459Optical investigation techniques, e.g. flow cytometry without spatial resolution of the texture or inner structure of the particle, e.g. processing of pulse signals the analysis being performed on a sample stream
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N2015/1006Investigating individual particles for cytology
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • G01N2015/1477Multiparameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Dispersion Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本開示は、情報処理装置、情報処理方法及びプログラムに関する。
医学又は生化学等の分野では、大量の細胞の特性を迅速に解析するために、フローサイトメータを用いることが一般的になっている。フローサイトメータは、フローセルを流れる細胞に光線を照射し、該細胞から発せられる蛍光又は散乱光などを検出することで、細胞の特性を光学的に解析する装置である。
ここで、フローサイトメータにて測定されたデータは、複数色の蛍光の強度情報を含む多次元データである。このような多次元データは、複数の観点から評価することが重要であるが、次元数の増加に伴って、人の手による解析が困難となっていた。
そこで、フローサイトメータにて測定された多次元データをクラスタリング技術によって解析することが検討されている。クラスタリング技術は、機械学習を用いて、対象となる集合を内的結合及び外的分離が達成された部分集合に分割する技術である。クラスタリング技術を用いることで、フローサイトメータにて分析した大量の細胞を複数の細胞集団に分割することが可能である。
例えば、下記の特許文献1には、フローサイトメータにて測定されたデータをクラスタリングするためのクラスタリング技術の一例が開示されている。
米国特許出願公開第2013/0060775号明細書
フローサイトメータによる測定結果をクラスタリング技術にて解析する場合、フローサイトメータにて測定される多次元データの特性を考慮することが重要となる。一方で、クラスタリング技術は、教師なし学習手法であるため、得られたクラスタリング結果の妥当性等を評価することは困難となる。したがって、得られたクラスタリング結果がフローサイトメータにて測定された多次元データの特性に対して妥当か否かを評価することは困難であった。
そこで、クラスタリングする多次元データの特性を考慮して、クラスタリング結果の妥当性を評価することが可能な技術が求められていた。
本開示によれば、多次元データをクラスタリングしたクラスタリング結果である第1クラスタの評価値、及び第1クラスタをさらにクラスタリングしたクラスタリング結果である第2クラスタの評価値を算出する評価値算出部と、前記第1クラスタの評価値と、前記第1クラスタをクラスタリングした前記第2クラスタの評価値とが所定の関係性を有するか否かを判定する判定部と、前記所定の関係性を有すると判定された前記第1クラスタ及び前記第2クラスタを特定する情報を出力する出力部と、を備え、前記出力部は、前記第2クラスタが前記第1クラスタを統合したクラスタである場合に、前記第1クラスタの集団の大きさに応じた大きさの、前記第1クラスタに基づくレーダチャートを、前記第1クラスタおよび前記第2クラスタの包含関係に応じて表示する、情報処理装置が提供される。
また、本開示によれば、演算装置によって、多次元データをクラスタリングしたクラスタリング結果である第1クラスタの評価値、及び第1クラスタをさらにクラスタリングしたクラスタリング結果である第2クラスタの評価値を算出することと、前記第1クラスタの評価値と、前記第1クラスタをクラスタリングした前記第2クラスタの評価値とが所定の関係性を有するか否かを判定することと、前記所定の関係性を有すると判定された前記第1クラスタ及び前記第2クラスタを特定する情報を出力することと、を含み、前記出力することは、前記第2クラスタが前記第1クラスタを統合したクラスタである場合に、前記第1クラスタの集団の大きさに応じた大きさの、前記第1クラスタに基づくレーダチャートを、前記第1クラスタおよび前記第2クラスタの包含関係に応じて表示する、情報処理方法が提供される。
また、本開示によれば、コンピュータを、多次元データをクラスタリングしたクラスタリング結果である第1クラスタの評価値、及び第1クラスタをさらにクラスタリングしたクラスタリング結果である第2クラスタの評価値を算出する評価値算出部と、前記第1クラスタの評価値と、前記第1クラスタをクラスタリングした前記第2クラスタの評価値とが所定の関係性を有するか否かを判定する判定部と、前記所定の関係性を有すると判定された前記第1クラスタ及び前記第2クラスタを特定する情報を出力する出力部と、として機能させ、前記出力部は、前記第2クラスタが前記第1クラスタを統合したクラスタである場合に、前記第1クラスタの集団の大きさに応じた大きさの、前記第1クラスタに基づくレーダチャートを、前記第1クラスタおよび前記第2クラスタの包含関係に応じて表示する、プログラムが提供される。
本開示によれば、複数段階のクラスタリングにおけるクラスタの各々の評価値を互いに比較することで、クラスタリングの妥当性が低い場合にメタ前クラスタ及びメタ後クラスタの間に生じる関係性の有無を判定することができる。
以上説明したように本開示によれば、クラスタリングする多次元データの特性を考慮して、クラスタリング結果の妥当性を評価することが可能である。
なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。
本開示の一実施形態に係る情報処理装置を含むシステムの構成例を概略的に示す模式図である。 同実施形態に係る情報処理装置の構成例を示すブロック図である。 情報処理装置によるクラスタリング結果を表す画像表示の一例を示す説明図である。 情報処理装置によるクラスタリング結果を表す画像表示の一例を示す説明図である。 情報処理装置によるクラスタリング結果を表す画像表示の一例を示す説明図である。 メタ前クラスタ及びメタ後クラスタの評価値をメタ後クラスタごとにプロットしたグラフ図である。 メタ後クラスタごとにメタ前クラスタ及びメタ後クラスタの評価値をプロットしたグラフから、選択されたクラスタの次元ごとの測定データを追加表示する様態を示す説明図である。 図3Aで示した画像表示に対して、所定の関係性を有すると判定された第1クラスタ及び第2クラスタを特定する表示を重畳した画像表示の一例を示す説明図である。 図3Bで示した画像表示に対して、所定の関係性を有すると判定された第1クラスタ及び第2クラスタを特定する表示を重畳した画像表示の一例を示す説明図である。 図3Cで示した画像表示に対して、所定の関係性を有すると判定された第1クラスタ及び第2クラスタを特定する表示を重畳した画像表示の一例を示す説明図である。 同実施形態に係る情報処理装置の動作例を示すフローチャート図である。 同実施形態の変形例に係る情報処理装置の構成例に模式的に示しブロック図である。 同実施形態の変形例に係る情報処理装置の動作例を示すフローチャート図である。 同実施形態に係る情報処理装置を病理画像の解析に適用する場合のフローチャート図である。 同実施形態に係る情報処理装置を適用する解析フローの流れを示すフロー図である。 同実施形態に係る情報処理装置を複数のサンプル間の比較解析に適用する場合のフローチャート図である。 同実施形態に係る情報処理装置のハードウェア構成例を示したブロック図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
なお、説明は以下の順序で行うものとする。
1.全体システムの構成例
2.情報処理装置の構成例
3.情報処理装置の動作例
4.変形例
5.適用例
6.ハードウェア構成例
<1.全体システムの構成例>
まず、図1を参照して、本開示の一実施形態に係る情報処理装置を含むシステム100の構成について説明する。図1は、本実施形態に係る情報処理装置を含むシステム100の構成例を概略的に示す模式図である。
図1に示すように、本実施形態に係るシステム100は、測定装置10と、情報処理装置20と、端末装置30、40と、を備える。測定装置10、情報処理装置20及び端末装置30、40は、ネットワークNを介して、相互に通信可能となるように接続されている。ネットワークNは、例えば、移動体通信網、インターネット又はローカルエリアネットワーク等の情報通信網であってもよく、又はこれらの複数種のネットワークの組み合わせであってもよい。
測定装置10は、測定対象の細胞等から各色の蛍光を検出することが可能な測定装置である。測定装置10は、例えば、蛍光染色した細胞をフローセルに高速で流し、流れる細胞に光線を照射することで、細胞から各色光の蛍光を検出するフローサイトメータであってもよい。または、測定装置は、染色された細胞を蛍光観察することで、細胞から各色光の蛍光を検出する蛍光顕微鏡又は共焦点レーザ顕微鏡などであってもよい。
情報処理装置20は、測定装置10にて測定された細胞の蛍光に関する情報に基づいて、測定対象の細胞の各々をクラスタリングする。これにより、情報処理装置20は、測定装置10にて測定された細胞の各々を複数の集団(すなわち、クラスタ)に分割することができる。また、情報処理装置20は、細胞の各々をクラスタリングした結果の妥当性を評価することができる。これにより、情報処理装置20は、クラスタリング結果が妥当ではないと判定したクラスタを特定する情報を端末装置30、40に送信することができる。情報処理装置20は、例えば、大容量のデータを高速で処理可能なサーバ等であってもよい。
端末装置30、40は、例えば、情報処理装置20によるクラスタリング結果が出力される表示装置等である。例えば、端末装置30、40は、情報処理装置20から受信した解析結果を画像又は文字等で表示する表示部を備えるコンピュータ、ラップトップ、スマートフォン又はタブレット端末などであってもよい。
本実施形態に係る情報処理装置20を含むシステム100では、まず、情報処理装置20は、病院、クリニック又は研究所の各々に設けられた測定装置10にて測定された測定データをネットワークN経由で取得する。その後、情報処理装置20は、取得した測定データをクラスタリングし、クラスタリング結果を端末装置30、40に出力する。さらに、情報処理装置20は、妥当性が低いと判定されるクラスタがクラスタリング結果に存在する場合、該クラスタを特定する情報を端末装置30、40に出力することができる。クラスタリングは、情報処理の負荷が高いため、専用のサーバ等で構成された情報処理装置20によって集中的に実行することで、システム100全体の効率性を向上させることができる。
情報処理装置20によるクラスタリングの具体的な方法、及びクラスタリング結果から妥当性が低いと判定されるクラスタを特定するための方法については、下記で詳述する。
なお、上記では、測定装置10、情報処理装置20及び端末装置30、40は、ネットワークNを介して相互に接続されているとしたが、本開示に係る技術は、かかる例示に限定されない。例えば、測定装置10、情報処理装置20及び端末装置30、40は、直接接続されていてもよい。
<2.情報処理装置の構成例>
次に、図2を参照して、本実施形態に係る情報処理装置20の構成例について説明する。図2は、本実施形態に係る情報処理装置20の構成例を示すブロック図である。
図2に示すように、情報処理装置20は、入力部201と、蛍光分離部203と、第1クラスタリング部205と、第2クラスタリング部207と、評価値算出部209と、判定部211と、出力部213と、を備える。なお、情報処理装置20の機能の一部(例えば、後述する蛍光分離部203の機能)は、測定装置10に備えられていてもよい。
入力部201は、測定装置10から細胞等のサンプルの測定結果を取得する。具体的には、入力部201は、細胞等のサンプルから測定された蛍光のスペクトル又は波長帯域ごとの強度に関する情報を測定装置10から取得する。入力部201は、例えば、ネットワークNを介して測定装置10から情報を取得するための接続ポート又は通信装置等を含む外部入力インタフェースにて構成されてもよい。
蛍光分離部203は、測定装置10から取得した蛍光のスペクトル又は波長帯域ごとの強度に関する情報から蛍光の各々を分離することで、蛍光の各々に対応する蛍光物質又は生体分子等の発現量を導出する。測定対象の細胞等は、複数の蛍光物質によって標識されており、各蛍光物質から発せられる蛍光の波長分布は、互いに重なり合っている。そのため、蛍光分離部203は、各蛍光物質から発せられる蛍光の相互の漏れ込み等を補正することで、各蛍光物質の発現量、及び各蛍光物質で標識した生体分子等の発現量を導出することができる。
これによれば、蛍光分離部203は、各蛍光の相互の漏れ込みを補正し、正味の蛍光物質の発現量を導出することができるため、後段の第1クラスタリング部205にて高い精度のクラスタリングを行うことが可能にする。ここで、高い精度でのクラスタリングとは、蛍光標識された大量のサンプルを適切なサンプル集団に分離できることをいう。また、蛍光分離部203は、蛍光のスペクトル又は波長帯域ごとの強度に関する情報から、各蛍光を発する蛍光物質の発現量を導出するため、後段の第1クラスタリング部205にてクラスタリングする際のデータの次元数を圧縮することができる。
具体的には、測定結果が特定の波長帯域ごとに区切られて検出された蛍光の強度である場合、蛍光分離部203は、まず、それぞれの波長帯域の間の蛍光の漏れ込み量を算出する。次に、蛍光分離部203は、算出した蛍光の漏れ込み量をそれぞれの波長帯域の蛍光の強度から減算することで、該蛍光を発する蛍光物質の発現量を導出することができる。これによれば、蛍光分離部203は、後段の第1クラスタリング部205にて高い精度のクラスタリングを行うことを可能にする。
また、測定結果がプリズム分光された蛍光を検出器アレイで検出した蛍光スペクトルである場合、蛍光分離部203は、まず、検出する各蛍光物質の蛍光のリファレンススペクトルを取得する。次に、蛍光分離部203は、検出された蛍光スペクトルから、各蛍光物質の蛍光のリファレンススペクトルの重ね合わせを推定することで、各蛍光物質の発現量を導出することができる。これによれば、蛍光分離部203は、スペクトルで表される測定結果から各蛍光物質の発現量を導出することができるため、測定データの次元数を圧縮することができる。
第1クラスタリング部205は、測定データに基づいて、測定対象である細胞をクラスタリングする。具体的には、第1クラスタリング部205は、蛍光分離部203にて導出した細胞の各蛍光物質の発現量に基づいて、測定対象である細胞をクラスタリングする。これにより、第1クラスタリング部205は、測定対象である細胞の集団を第1クラスタの各々に分割する。
測定対象の細胞は、複数の蛍光物質によって標識されており、細胞ごとに複数の蛍光物質の発現量(すなわち、蛍光物質で標識した生体分子の発現量)が異なる。そのため、測定対象である細胞を分割する場合、複数の蛍光物質の発現量という多次元データを用いることになる。このような多次元データを用いた分割は、機械学習に基づくクラスタリング技術を用いることで、マニュアルによる分割よりも迅速に実行することができる。
第1クラスタリング部205で用いられるクラスタリング手法は、特に限定されず、公知のクラスタリング手法であってもよい。例えば、第1クラスタリング部205は、ward法、群平均法、単リンク法、若しくはk-means法などの一般的なクラスタリング手法を用いてもよく、又は自己組織化マップ(self-organization map)法を用いてもよい。
第2クラスタリング部207は、第1クラスタリング部205によるクラスタリング結果をさらにクラスタリングする。具体的には、第2クラスタリング部207は、第1クラスタリング部205によるクラスタリングの結果、生成された第1クラスタを統合又は分割することで、第2クラスタを生成する。
例えば、第2クラスタリング部207は、上述した公知のクラスタリング手法を用いて第1クラスタを統合することで第2クラスタを生成してもよい。または、第2クラスタリング部207は、上述した公知のクラスタリング手法を用いて第1クラスタを分割することで第2クラスタを生成してもよい。
ここで、複数のクラスタを統合することで生成された上位クラスタのことをメタ後クラスタ(metaクラスタとも称する)と称し、上位クラスタに含まれる複数の下位クラスタのことをメタ前クラスタ(somクラスタとも称する)と称する。すなわち、第2クラスタリング部207が第1クラスタを統合することで第2クラスタを生成する場合、第1クラスタがメタ前クラスタとなり、第2クラスタがメタ後クラスタとなる。また、第2クラスタリング部207が第1クラスタを分割することで第2クラスタを生成する場合、第1クラスタがメタ後クラスタとなり、第2クラスタがメタ前クラスタとなる。
第1クラスタリング部205及び第2クラスタリング部207によるクラスタリング結果は、出力部213から端末装置30、40等に出力されてもよい。例えば、端末装置30、40等に出力されたクラスタリング結果は、端末装置30、40等にて画像表示として表示されてもよい。
具体的には、第1クラスタリング部205及び第2クラスタリング部207によるクラスタリング結果は、図3A~図3Cに示す画像表示にて表示されてもよい。図3A~図3Cは、情報処理装置20によるクラスタリング結果を表す画像表示の一例を示す説明図である。
例えば、図3Aに示すように、第1クラスタリング部205及び第2クラスタリング部207によるクラスタリング結果は、ツリー表示にて表されてもよい。
図3Aに示す表示では、「Data1」というサンプルは、「meta1」~「meta3」のメタ後クラスタ、及び「Som1」~「Som6」のメタ前クラスタにクラスタリングされている。また、図3Aでは、「meta1」~「meta3」のメタ後クラスタが「Som1」~「Som6」のメタ前クラスタを包含している構造が明示されている。具体的には、「meta1」のメタ後クラスタは、「Som2」及び「Som5」のメタ前クラスタを包含しており、「meta2」のメタ後クラスタは、「Som1」、「Som3」及び「Som6」のメタ前クラスタを包含しており、「meta1」のメタ後クラスタは、「Som4」のメタ前クラスタ包含している。このようなツリー表示は、メタ前クラスタ及びメタ後クラスタの階層関係を明示することができる。
例えば、図3Bに示すように、第1クラスタリング部205及び第2クラスタリング部207によるクラスタリング結果は、グリッド表示にて表されてもよい。
図3Bに示す表示では、複数の色で塗り分けられたレーダチャートがグリッド状に配列されている。ここで、各レーダチャートは、メタ前クラスタの各々を表しており、各色で塗り分けられた領域がメタ後クラスタの各々を表している。また、各レーダチャートの分布は、メタ前クラスタにおける各蛍光物質の発現量に対応する代表ベクトルを表し、各レーダチャートの大きさは、メタ前クラスタの集団の大きさを表している。例えば、同じ色(図3Bでは同じハッチング)で塗り分けられたレーダチャート(すなわち、メタ前クラスタ)は、同じメタ後クラスタに包含されている。このようなグリッド表示は、メタ前クラスタ及びメタ後クラスタの包含関係と、代表ベクトル等のメタ前クラスタの情報とを同時に示すことができる。
例えば、図3Cに示すように、第1クラスタリング部205及び第2クラスタリング部207によるクラスタリング結果は、ミニマムスパニングツリー(Minimum Spanning Tree)表示にて表されてもよい。
図3Cに示す表示では、複数の色で塗り分けられたレーダチャートが互いに接続された樹状に配列されている。ここで、各レーダチャートは、メタ前クラスタの各々を表しており、各色で塗り分けられた領域がメタ後クラスタの各々を表している。また、各レーダチャートの分布は、メタ前クラスタにおける各蛍光物質の発現量に対応する代表ベクトルを表し、各レーダチャートの大きさは、メタ前クラスタの集団の大きさを表している。例えば、同じ色(図3Cでは同じハッチング)で塗り分けられたレーダチャート(すなわち、メタ前クラスタ)は、同じメタ後クラスタに包含されている。
さらに、図3Cに示す表示では、表示上のレーダチャート間の距離が、レーダチャートで表されるメタ前クラスタ間の類似度に対応している。すなわち、互いに接近したレーダチャートのメタ前クラスタは、互いに類似しており、互いに離れたレーダチャートのメタ前クラスタは、互いに類似していないことを示している。このようなミニマムスパニングツリー表示は、メタ前クラスタ及びメタ後クラスタの包含関係に加えて、メタ前クラスタの互いの類似関係を同時に示すことができる。
評価値算出部209は、第1クラスタ及び第2クラスタの各々の評価値を算出する。クラスタの評価値とは、クラスタの分離度を表したものであり、クラスタリングされたデータの分布から算出される値である。具体的には、クラスタの評価値は、該クラスタに所属する要素(イベント)の分散、及び該クラスタと他のクラスタとの距離に基づいて算出することができる。より具体的には、クラスタの評価値は、クラスタに所属する要素と該クラスタの中心との距離、及び該クラスタの中心と他のクラスタの中心との距離に基づいて算出することができる。例えば、クラスタの各々の評価値とは、各クラスタのシルエット係数、DBindex、又はCOP係数などであってもよい。
なお、上述した距離とは、各要素の類似度を表したものである。例えば、距離とは、距離の公理を満たすように各要素の性質差に基づいて設定されたものであってもよい。具体的には、距離とは、各要素を性質に基づいて表した特徴量ベクトルの間のユークリッド距離、マンハッタン距離、ミンコフスキー距離、マハラノビス距離、又はコサイン距離であってもよい。
判定部211は、第1クラスタの評価値と、第2クラスタの評価値とが所定の関係性を有するか否かを判定する。具体的には、判定部211は、第1クラスタの評価値と、該第1クラスタを統合又は分割した第2クラスタの評価値とが所定の関係性を有するか否かを判定する。所定の関係性とは、第1クラスタ又は第2クラスタのいずれかのクラスタリングの妥当性が低い場合に、第1クラスタ及び第2クラスタの評価値の間に生じる関係性である。判定部211は、かかる所定の関係性の有無を判定することで、クラスタリングの妥当性が低い第1クラスタ又は第2クラスタを特定することができる。
ここで、上述した所定の関係性の一例について、図4を参照して説明する。図4は、メタ前クラスタ及びメタ後クラスタの評価値をメタ後クラスタごとにプロットしたグラフ図である。なお、図4の縦軸に示す評価値は、例えば、上述したDBindexであり、数値が0に近い程、クラスタリングの分離度が高く、クラスタリングの妥当性が高いことを示す。
図4に示すように、判定部211は、第1クラスタ及び第2クラスタの評価値を、メタ後クラスタと、メタ後クラスタに包含されるメタ前クラスタとの間で比較する。このとき、メタ後クラスタ番号4のように、メタ後クラスタの評価値が少なくとも1つ以上のメタ前クラスタの評価値よりも小さくなる(良好となる)場合、判定部211は、メタ前クラスタ及びメタ後クラスタが所定の関係性を有すると判定してもよい。統合によって、メタ後クラスタの評価値がメタ前クラスタの評価値よりも良好となる場合、判定部211は、統合前後のいずれかで妥当ではないクラスタリングが実行されたと判定することができる。
または、判定部211は、メタ後クラスタに包含されるメタ前クラスタの評価値の密集度又は離散度が閾値以上となる場合、メタ前クラスタ及びメタ後クラスタが所定の関係性を有すると判定してもよい。さらには、判定部211は、メタ前クラスタの評価値と、メタ後クラスタの評価値との差の大きさに基づいて、メタ前クラスタ及びメタ後クラスタが所定の関係性を有するか否かを判定してもよい。
なお、所定の関係性は、上述した以外の他の関係性であってもよい。所定の関係性とは、第1クラスタ及び第2クラスタにおいてクラスタリングの妥当性が低くなる場合の関係性をあらかじめ登録したものであってもよい。
また、判定部211は、ユーザからの入力に基づいて、第1クラスタの評価値と、第2クラスタの評価値とが所定の関係性を有するか否かを判定してもよい。具体的には、判定部211は、図5に示すように、メタ後クラスタごとにメタ前クラスタ及びメタ後クラスタの評価値をプロットしたグラフと、クラスタの次元ごとの測定データとをユーザに示すことで、所定の関係性を有する第1クラスタ及び第2クラスタをユーザに選択させてもよい。図5は、メタ後クラスタごとにメタ前クラスタ及びメタ後クラスタの評価値をプロットしたグラフから、選択されたクラスタの次元ごとの測定データを追加表示する様態を示す説明図である。
図5に示すように、判定部211は、出力部213を介して、メタ後クラスタごとにメタ前クラスタ及びメタ後クラスタの評価値をプロットしたグラフをユーザに提示してもよい。ユーザは、提示されたグラフを確認することで、メタ前クラスタの評価値と、メタ後クラスタの評価値とが所定の関係性を有するクラスタを特定してもよい。
また、メタ前クラスタ及びメタ後クラスタの評価値をプロットしたグラフでは、選択されたクラスタの次元ごとに測定データを追加で表示することができる。追加表示される測定データは、例えば、次元毎に、測定対象全体の分布に対して、該クラスタの測定対象の分布を示したデータであってもよい。これによれば、ユーザは、追加表示された測定データを参照し、メタ前クラスタの測定対象の分布と、メタ後クラスタの測定対象の分布の類似性を判断することで、メタ前クラスタ及びメタ後クラスタのクラスタリングが妥当か否かを判断してもよい。
例えば、図5に示す場合では、メタ前クラスタ及びメタ後クラスタの間で、左下の隅のグラフの測定対象の分布が大きく変化している。このように、統合前後で少なくとも1つ以上の次元の測定対象の分布が大きく変化する場合、メタ前クラスタ又はメタ後クラスタのクラスタリングのいずれかのクラスタリングの妥当性が低い可能性がある。そこで、ユーザは、クラスタの次元ごとの測定データを確認することで、第1クラスタの評価値と、第2クラスタの評価値とが所定の関係性を有するような、クラスタリングの妥当性が低いクラスタを特定することができる。
さらに、判定部211は、ユーザによるクラスタリングの妥当性が低いクラスタの特定を支援するために、メタ前クラスタ及びメタ後クラスタの間で測定対象の分布が大きく変化しているグラフを強調表示させてもよい。具体的には、判定部211は、メタ前クラスタ及びメタ後クラスタの間で測定対象の分布が大きく変化しているグラフが表示される領域の色を変えたり、枠線で囲ったり、アラートを示す表示を追加したりしてもよい。なお、メタ前クラスタ及びメタ後クラスタの間で測定対象の分布が大きく変化しているグラフは、例えば、測定対象の分布の各ピークの幅、ピーク高さ、又はピーク位置が統合前後で閾値以上変化しているか否かを判断することで特定することができる。
出力部213は、判定部211によって所定の関係性を有すると判定された第1クラスタ及び第2クラスタを特定する情報を端末装置30、40等に出力する。具体的には、出力部213は、第1クラスタリング部205及び第2クラスタリング部207によるクラスタリング結果を示す画像表示に、判定部211にて判定された第1クラスタ及び第2クラスタを特定する画像表示を重畳させる情報を端末装置30、40に出力してもよい。
より具体的には、出力部213は、判定部211にて所定の関係性を有すると判定された第1クラスタ及び第2クラスタを特定するために、図6A~図6Cに示す画像表示に関する情報を端末装置30、40に出力してもよい。端末装置30、40は、図6A~図6Cに示す画像表示を表示することで、所定の関係性を有すると判定された第1クラスタ及び第2クラスタをユーザに明示することができる。図6A~図6Cは、図3A~図3Cで示した画像表示に対して、所定の関係性を有すると判定された第1クラスタ及び第2クラスタを特定する表示を重畳した画像表示の一例を示す説明図である。
例えば、図6Aに示すように、クラスタリング結果がツリー表示で表示される場合、出力部213は、所定の関係性を有すると判定された第1クラスタ及び第2クラスタの表示色又は表示文字を変更してもよい。または、出力部213は、所定の関係性を有すると判定された第1クラスタ及び第2クラスタにエクスクラメーションマーク等の特定のマークを表示してもよい。具体的には、メタ後クラスタ「meta2」とメタ前クラスタ「som6」が所定の関係を有すると判断された場合、メタ後クラスタ「meta2」はエクスクラメーションマークと共に表示され、「meta2」と「som6」は強調表示される。これによれば、出力部213は、クラスタリングの妥当性が低く、所定の関係性を有する第1クラスタ及び第2クラスタをユーザに明示し、ユーザに注意喚起を行うことができる。
例えば、図6Bに示すように、クラスタリング結果がグリッド表示で表示される場合、出力部213は、所定の関係を有すると判定された第1クラスタ及び第2クラスタに対応するレーダチャートを枠線で囲んでもよい。具体的には、4つのメタ前クラスタを含むメタ後クラスタとそのメタ後クラスタに含まれるメタ前クラスタとが所定の関係を有すると判断された場合、メタ後クラスタを表す色の領域を枠線で囲い、所定の関係を有するメタ前クラスタに対応するレーダチャートが強調表示される。これによれば、出力部213は、クラスタリングの妥当性が低く、所定の関係性を有する第1クラスタ及び第2クラスタをユーザに明示することで、ユーザに注意喚起を行うことができる。
例えば、図6Cに示すように、クラスタリング結果がスパニングミニマムツリー表示で表示される場合、出力部213は、所定の関係を有すると判定された第1クラスタ及び第2クラスタに対応するレーダチャートを枠線で囲んでもよい。具体的には、4つのメタ前クラスタを含むメタ後クラスタとそのメタ後クラスタに含まれるメタ前クラスタとが所定の関係を有すると判断された場合、メタ後クラスタを表す色の領域を枠線で囲い、所定の関係を有するメタ前クラスタに対応するレーダチャートが強調表示される。これによれば、出力部213は、クラスタリングの妥当性が低く、所定の関係性を有する第1クラスタ及び第2クラスタをユーザに明示することで、ユーザに注意喚起を行うことができる。
以上の構成によれば、情報処理装置20は、第1クラスタリング部205及び第2クラスタリング部207のクラスタリングの妥当性を評価し、妥当性が低いと判定した第1クラスタ及び第2クラスタをユーザに提示することができる。これによれば、ユーザは、クラスタリングを見直すべきクラスタ、又はクラスタリングの精度が高いクラスタを判断することができる。よって、情報処理装置20は、測定対象の解析効率を向上させることができる。
なお、第2クラスタリング部207による第1クラスタの分割又は統合による第2クラスタの生成は、ユーザからの入力に基づいて実行されてもよい。すなわち、情報処理装置20では、第2クラスタは、第1クラスタリング部205によるクラスタリングにて生成された第1クラスタをユーザが編集することで生成されてもよい。このとき、情報処理装置20は、上述した構成と同様の構成によって、ユーザによるクラスタリングの妥当性を評価してもよい。
<3.情報処理装置の動作例>
次に、図7を参照して、本実施形態に係る情報処理装置20の動作例について説明する。図7は、本実施形態に係る情報処理装置20の動作例を示すフローチャート図である。
図7に示すように、まず、入力部201は、測定装置10から測定データを取得する(S101)。測定データは、例えば、フローサイトメータにて測定された細胞の蛍光のスペクトル又は波長帯域ごとの強度に関する情報であってもよい。次に、蛍光分離部203は、測定データを蛍光分離することで、蛍光の各々を発する蛍光物質の発現量を導出する(S103)。
続いて、第1クラスタリング部205は、蛍光分離部203にて蛍光分離された各蛍光物質の発現量に基づいて、測定された細胞の各々をクラスタリングすることで、第1クラスタを生成する(S105)。次に、第2クラスタリング部207は、クラスタリングによって、第1クラスタリング部にて生成された第1クラスタをさらに統合又は分割することで、第2クラスタを生成する(S107)。その後、評価値算出部209は、第1クラスタ及び第2クラスタの評価値を算出する(S109)。例えば、評価値算出部209は、第1クラスタ及び第2クラスタのシルエット係数、DBindex又はCOP係数を算出してもよい。
次に、判定部211は、第1クラスタの評価値と、第2クラスタの評価値とが所定の関係性を有するか否かを判定する(S111)。具体的には、判定部211は、第1クラスタの評価値と、第2クラスタの評価値とが所定の関係性を有するか否かを判定することで、クラスタリングの妥当性が低い第1クラスタ及び第2クラスタを特定する。所定の関係性を有する第1クラスタ及び第2クラスタが存在しない場合(S111/No)、出力部213は、第1クラスタリング部205及び第2クラスタリング部207によるクラスタリング結果を端末装置30、40に出力する。これにより、該クラスタリング結果をユーザに提示する。出力部213は、クラスタリング結果をユーザに提示することができる。
一方、所定の関係性を有する第1クラスタ及び第2クラスタが存在する場合(S111/Yes)、出力部213は、第1クラスタリング部205及び第2クラスタリング部207によるクラスタリング結果と併せて、所定の関係性を有する第1クラスタ及び第2クラスタを特定する情報を端末装置30、40に出力する(S113)。これにより、出力部213は、クラスタリングの妥当性が低いと判断される第1クラスタ及び第2クラスタをユーザに提示することができる。
以上の動作によれば、本実施形態に係る情報処理装置20は、クラスタリング結果と共に該クラスタリング結果の信頼性に関する情報をユーザに提示することが可能である。具体的には、情報処理装置20は、クラスタリングの妥当性が低いと判断されるクラスタを特定し、特定したクラスタをユーザに提示することが可能である。
<4.変形例>
続いて、図8及び図9を参照して、本実施形態に係る情報処理装置21の変形例について説明する。図8は、本変形例に係る情報処理装置21の構成例に模式的に示すブロック図であり、図9は、本変形例に係る情報処理装置21の動作例を示すフローチャート図である。
図8に示すように、本変形例に係る情報処理装置21は、クラスタリング再設定部215をさらに備える点が図2で示した情報処理装置20と異なる。以下では、本変形例にて特徴的なクラスタリング再設定部215について説明し、図2で示した情報処理装置20と実質的に同様のその他の構成については説明を省略する。
クラスタリング再設定部215は、クラスタの評価値に基づいて、メタ前クラスタを包含するメタ後クラスタを再設定する。具体的には、クラスタリング再設定部215は、クラスタの評価値を参照することで、指示されたメタ前クラスタが包含されるメタ後クラスタを再検討する。
例えば、クラスタリング結果を参照し、メタ後クラスタに対する一部のメタ前クラスタの包含が妥当ではないと判断したユーザは、該メタ前クラスタを包含するメタ後クラスタを再設定するように、クラスタリング再設定部215に指示する。このとき、クラスタリング再設定部215は、ユーザから指示されたメタ前クラスタをメタ後クラスタの各々に統合した場合の全クラスタの評価値を判定部211に網羅的に算出させる。続いて、クラスタリング再設定部215は、指示されたメタ前クラスタの統合によってクラスタの評価値が最も良好となるメタ後クラスタを特定し、該メタ後クラスタに指示されたメタ前クラスタを統合させる。なお、クラスタの評価値が最も良好となるとは、例えば、DBindexでは、メタ後クラスタのすべての評価値の合計が最も小さくなることを表す。
これによれば、情報処理装置21は、ユーザによるメタ前クラスタ及びメタ後クラスタのクラスタリングの編集を支援し、より妥当性が高いクラスタリング結果を提示することができる。なお、ユーザによるメタ前クラスタの選択は、図3A~図3C又は図6A~図6Cに示すような、クラスタリング結果及び妥当性の判定結果を表す画像表示から実行されてもよい。ユーザによるメタ前クラスタの選択は、図4又は図5に示すような、メタ前クラスタ及びメタ後クラスタの評価値をプロットしたグラフを表す画像表示から実行されてもよい。
次に、図9を参照して、本変形例に係る情報処理装置21の動作例について説明する。図9は、本変形例に係る情報処理装置21の動作例を示すフローチャート図である。
図9に示すように、まず、入力部201は、測定装置10から測定データを取得する(S101)。測定データは、例えば、フローサイトメータにて測定された細胞の蛍光のスペクトル又は波長帯域ごとの強度に関する情報であってもよい。次に、蛍光分離部203は、測定データを蛍光分離することで、蛍光の各々を発する蛍光物質の発現量を導出する(S103)。
続いて、第1クラスタリング部205は、蛍光分離部203にて蛍光分離された各蛍光物質の発現量に基づいて、測定された細胞の各々をクラスタリングすることで、第1クラスタを生成する(S105)。次に、第2クラスタリング部207は、クラスタリングによって、第1クラスタリング部205にて生成された第1クラスタをさらに統合することで、第2クラスタを生成する(S121)。
その後、包含される第2クラスタを再設定する第1クラスタがユーザ等によって選択される(S123)。続いて、判定部211は、選択された第1クラスタを第2クラスタの各々に統合させた場合の各クラスタの評価値をそれぞれ算出する(S125)。次に、クラスタリング再設定部215は、算出された各クラスタの評価値の合計を第2クラスタごとに比較し、評価値の合計が最も良好となる第2クラスタに、選択された第1クラスタを統合する(S127)。
以上の動作によれば、本変形例に係る情報処理装置21は、ユーザによって選択された第1クラスタをより妥当性が高い第2クラスタに統合することを支援することができる。
<5.適用例>
続いて、図10~図12を参照して、本実施形態に係る情報処理装置20の適用例について説明する。
まず、図10を参照して、本実施形態に係る情報処理装置20を病理画像の解析に適用する例について説明する。図10は、本実施形態に係る情報処理装置20を病理画像の解析に適用する場合のフローチャート図である。
図10に示すように、まず、情報処理装置20は、顕微鏡又は内視鏡等から細胞を含む病理画像を取得する(S11)。次に、情報処理装置20は、病理画像から細胞を含む画像領域を特定し、該画像領域を切り出す(S13)。具体的には、病理画像が核染色された細胞の画像であれば、情報処理装置20は、エッジ抽出を行うことで染色された核を認識し、認識した核の周囲画素を細胞とみなしてもよい。または、情報処理装置20は、深層学習(deep learning)などを用いることで、病理画像から細胞を認識してもよい。
その後、情報処理装置20は、切り出した画像領域の画素値を細胞の特徴量を示す多次元データとして取得する(S15)。具体的には、画素値は、各画素のRGB値(赤、緑及び青)の中央値、平均値又は最頻値であってもよく、各画素のRGB値から色空間の座標を変換することで導出されたHSV値であってもよい。また、情報処理装置20は、細胞の特徴量として、面積、真円度、幅、長さ、幅/長さの比率、軸方向若しくは径方向における対称性、又は緊密さ等のモーフォロジ特徴を取得してもよい。さらに、情報処理装置20は、細胞の特徴量として、スポット、ホール、エッジ、峰部、谷部、鞍部、輝点又は暗点等の構造的特徴を取得してもよく、いわゆるHaralick特徴又はGabor特徴等を取得してもよい。
これにより、情報処理装置20は、上述した入力部201にて取得される測定データを取得することができる。以後の動作例については、上述したとおりであるため、ここでの説明は省略する。
次、図11及び図12を参照して、本実施形態に係る情報処理装置20を解析に用いる例について説明する。図11は、本実施形態に係る情報処理装置20を適用する解析フローの流れを示すフロー図である。図12は、本実施形態に係る情報処理装置20を複数のサンプル間の比較解析に適用する場合のフローチャート図である。
図11に示すように、サンプルの解析フローに本実施形態に係る情報処理装置20を適用する場合、まず、測定したサンプルに対して、系全体の信頼度が問題ないことが確認される(S201)。ここで、信頼度は評価値算出部209で算出された評価値に基づき評価される。次に、クラスタリングした各クラスタの信頼度が十分に高いことが確認される(S203)。ここで、クラスタリングした各クラスタの信頼度が十分に高くない場合(S203/No)、再度、クラスタの分割、統合又は削除が行われた(S205)後、各クラスタの信頼度が十分に高いことが確認される(S207)。クラスタリングした各クラスタの信頼度が十分に高くなるまでクラスタの分割、統合又は削除が繰り返された後、信頼度が十分に高くなったクラスタに対して、ランドマークノードが設定される(S209)。具体的には、クラスタの分割、統合又は削除の妥当性は、メタ後クラスタとメタ前クラスタが所定の関係性を有しているかどうかで評価されることができる。
ランドマークノードとは、例えば、スキャフォールドマップ(Scaffold Map)のような可視化方法において可視化の起点となるクラスタ、又は複数のサンプル間を比較する場合の基準点となるクラスタである。ランドマークノードとなるクラスタには、高い信頼度が求められる。
ランドマークノードとなるクラスタが設定された後、スキャフォールドマップ等を用いて、各クラスタの可視化確認が行われる(S211)。可視化確認において所望の結果が得られない場合は、再度、クラスタの分割、統合又は削除(S213)と、各クラスタの信頼度確認(S215)とが行われ、所望の結果が得られるようにランドマークノードとなるクラスタが再設定される。
図11で示すような解析フローにおいて、本実施形態に係る情報処理装置20は、各クラスタの信頼度を確認するS203、S207、S209又はS215の処理のいずれかに適用されてもよい。
また、図12に示すように、複数のサンプル間の比較解析に本実施形態に係る情報処理装置20を適用する場合、まず、第1サンプルのクラスタリングが行われる(S251)。次に、第1サンプルでクラスタリングされた各クラスタの信頼度が評価される(S253)。ここで、信頼度は評価値算出部209で算出された評価値に基づき評価されることができる。続いて、各クラスタの信頼度が閾値以上か否かが判断され(S255)、各クラスタの信頼度が閾値以上ではない場合(S255/No)、再度、第1サンプルのクラスタリング及び各クラスタの信頼度の評価が実行される。一方、各クラスタの信頼度が閾値以上である場合(S255/Yes)、信頼度が閾値以上のクラスタがランドマークノードに設定される(S257)。
次に、別途、第2サンプルがクラスタリングされる(S259)。ここで、第1サンプルで設定されたランドマークノードに対して、第2サンプルでクラスタリングされた各クラスタを力学的モデルによってマッピングする(S261)。これにより、ユーザは、第1サンプル及び第2サンプルの各クラスタの対応関係を知覚し、第1サンプル及び第2サンプルの間の比較解析を行うことができる。
なお、力学的モデルとしては、例えば、Force-Directグラフ、Kamada-Kawaiアルゴリズム、又はFruchterman-Reingoldアルゴリズム等を用いることができる。また、力学的モデルの対象データとしては、各ランドマークノードの中央値、平均値又は最頻値のいずれを用いてもよい。
図12で示すような複数のサンプル間の比較解析において、本実施形態に係る情報処理装置20は、各クラスタの信頼度を評価するS253、又はS257の処理のいずれかに適用されてもよい。
<6.ハードウェア構成例>
続いて、図13を参照して、本実施形態に係る情報処理装置20のハードウェア構成について説明する。図13は、本実施形態に係る情報処理装置20のハードウェア構成例を示したブロック図である。
図13に示すように、情報処理装置20は、CPU(Central Processing Unit)901と、ROM(Read Only Memory)902と、RAM(Random Access Memory)903と、ブリッジ907と、内部バス905および906と、インタフェース908と、入力装置911と、出力装置912と、ストレージ装置913と、ドライブ914と、接続ポート915と、通信装置916と、を備える。
CPU901は、演算処理装置及び制御装置として機能し、ROM902等に記憶された各種プログラムに従って、情報処理装置20の動作全般を制御する。ROM902は、CPU901が使用するプログラム、演算パラメータを記憶し、RAM903は、CPU901の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。例えば、CPU901は、蛍光分離部203、第1クラスタリング部205、第2クラスタリング部207、評価値算出部209及び判定部211の機能を実行してもよい。
これらCPU901、ROM902及びRAM903は、ブリッジ907、内部バス905及び906等により相互に接続されている。また、CPU901、ROM902及びRAM903は、インタフェース908を介して入力装置911、出力装置912、ストレージ装置913、ドライブ914、接続ポート915及び通信装置916とも接続されている。
入力装置911は、タッチパネル、キーボード、マウス、ボタン、マイクロフォン、スイッチ及びレバーなどの情報が入力される入力装置を含む。また、入力装置911は、入力された情報に基づいて入力信号を生成し、CPU901に出力するための入力制御回路なども含む。入力装置911は、例えば、入力部201の機能を実行してもよい。
出力装置912は、例えば、CRT(Cathode Ray Tube)表示装置、液晶表示装置及び有機EL(Organic ElectroLuminescence)表示装置などの表示装置を含む。さらに、出力装置912は、スピーカ及びヘッドホンなどの音声出力装置を含んでもよい。出力装置912は、例えば、出力部213の機能を実行してもよい。
ストレージ装置913は、情報処理装置20のデータ格納用の記憶装置である。ストレージ装置913は、記憶媒体、記憶媒体にデータを記憶する記憶装置、記憶媒体からデータを読み出す読み出し装置、及び記憶されたデータを削除する削除装置を含んでもよい。
ドライブ914は、記憶媒体用リードライタであり、情報処理装置20に内蔵又は外付けされる。例えば、ドライブ914は、装着されている磁気ディスク、光ディスク、光磁気ディスク又は半導体メモリ等のリムーバブル記憶媒体に記憶されている情報を読み出し、RAM903に出力する。ドライブ914は、リムーバブル記憶媒体に情報を書き込むことも可能である。
接続ポート915は、例えば、USB(Universal Serial Bus)ポート、イーサネット(登録商標)ポート、IEEE802.11規格ポート及び光オーディオ端子等のような外部接続機器を接続するための接続ポートで構成された接続インタフェースである。
通信装置916は、例えば、ネットワークNに接続するための通信デバイス等で構成された通信インタフェースである。また、通信装置916は、有線または無線LAN対応通信装置であっても、有線によるケーブル通信を行うケーブル通信装置であってもよい。通信装置916及び接続ポート915は、例えば、入力部201及び出力部213の機能を実行してもよい。
なお、情報処理装置20に内蔵されるCPU、ROMおよびRAMなどのハードウェアに対して、上述した本実施形態に係る情報処理装置の各構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、該コンピュータプログラムを記憶させた記憶媒体も提供することが可能である。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
多次元データをクラスタリングしたクラスタリング結果である第1クラスタの評価値、及び第1クラスタをさらにクラスタリングしたクラスタリング結果である第2クラスタの評価値を算出する評価値算出部と、
前記第1クラスタの評価値と、前記第1クラスタをクラスタリングした前記第2クラスタの評価値とが所定の関係性を有するか否かを判定する判定部と、
前記所定の関係性を有すると判定された前記第1クラスタ及び前記第2クラスタを特定する情報を出力する出力部と、
を備える、情報処理装置。
(2)
前記評価値は、各クラスタの分離度に関する指標である、前記(1)に記載の情報処理装置。
(3)
前記評価値算出部は、クラスタ間の距離、及びクラスタ内の各イベントとクラスタ中心との距離に基づいて前記評価値を算出する、前記(2)に記載の情報処理装置。
(4)
前記距離は、前記多次元データの各要素の性質差に基づいて設定される、前記(3)に記載の情報処理装置。
(5)
前記第2クラスタは、前記第1クラスタを統合したクラスタである、前記(1)~(4)のいずれか一項に記載の情報処理装置。
(6)
前記判定部は、前記第1クラスタの評価値と、該第1クラスタを統合した前記第2クラスタの評価値とが前記所定の関係性を有するか否かを判定する、前記(5)に記載の情報処理装置。
(7)
前記判定部は、統合後の前記第2クラスタの評価値が少なくとも1つ以上の統合前の前記第1クラスタの評価値よりも良好となる場合、前記第1クラスタ及び前記第2クラスタは、前記所定の関係性を有すると判定する、前記(6)に記載の情報処理装置。
(8)
選択された前記第1クラスタが統合される前記第2クラスタを再設定するクラスタリング再設定部をさらに備え、
前記評価値算出部は、前記選択された第1クラスタを複数の前記第2クラスタの各々に統合した場合における前記第2クラスタの評価値をそれぞれ算出し、
前記クラスタリング再設定部は、算出された前記評価値に基づいて、前記選択された第1クラスタが統合される前記第2クラスタを再設定する、前記(5)~(7)のいずれか一項に記載の情報処理装置。
(9)
前記第2クラスタは、前記第1クラスタを分割したクラスタである、前記(1)~(4)のいずれか一項に記載の情報処理装置。
(10)
前記判定部は、分割前の前記第1クラスタの評価値が少なくとも1つ以上の分割後の前記第2クラスタの評価値がよりも良好となる場合、前記第1クラスタ及び前記第2クラスタは、前記所定の関係性を有すると判定する、前記(9)に記載の情報処理装置。
(11)
前記多次元データをクラスタリングすることで、前記第1クラスタを導出する第1クラスタリング部と、
前記第1クラスタをクラスタリングすることで、前記第2クラスタを導出する第2クラスタリング部と、をさらに備える、前記(1)~(10)のいずれか一項に記載の情報処理装置。
(12)
前記第2クラスタリング部は、ユーザからの入力に基づいて前記第1クラスタをクラスタリングする、前記(11)に記載の情報処理装置。
(13)
前記多次元データは、細胞からセンシングした光を複数の蛍光に分離したデータである、前記(1)~(12)のいずれか一項に記載の情報処理装置。
(14)
演算装置によって、多次元データをクラスタリングしたクラスタリング結果である第1クラスタの評価値、及び第1クラスタをさらにクラスタリングしたクラスタリング結果である第2クラスタの評価値を算出することと、
前記第1クラスタの評価値と、前記第1クラスタをクラスタリングした前記第2クラスタの評価値とが所定の関係性を有するか否かを判定することと、
前記所定の関係性を有すると判定された前記第1クラスタ及び前記第2クラスタを特定する情報を出力することと、
を含む、情報処理方法。
(15)
コンピュータを、
多次元データをクラスタリングしたクラスタリング結果である第1クラスタの評価値、及び第1クラスタをさらにクラスタリングしたクラスタリング結果である第2クラスタの評価値を算出する評価値算出部と、
前記第1クラスタの評価値と、前記第1クラスタをクラスタリングした前記第2クラスタの評価値とが所定の関係性を有するか否かを判定する判定部と、
前記所定の関係性を有すると判定された前記第1クラスタ及び前記第2クラスタを特定する情報を出力する出力部と、
として機能させる、プログラム。
(16)
少なくとも1つのハードウェアプロセッサーと、
機械可読記憶媒体であって、前記少なくとも1つのハードウェアプロセッサーに、
複数の細胞から取得される多次元データを受け取ることと、
前記多次元データの少なくとも一部を共有する第1クラスタと第2クラスタを含む複数のクラスタを示すクラスタリング結果を生成するため、前記多次元データをクラスタリングすることと、
前記クラスタリング結果の信頼性を示す情報を出力すること
を含む方法を実行させる命令を格納する、
機械可読記憶媒体と、を含み、
前記クラスタリング結果の信頼性を示す前記情報は、前記第1クラスタと前記第2クラスタとの間の関係性を示す情報処理装置。
(17)
前記クラスタリング結果の信頼性を示す前記情報は第1クラスタの第1評価値と第2クラスタの第2評価値とを決定することにより取得され、
前記情報は前記第1評価値と前記第2評価値との関係性を示す
前記(16)に記載の情報処理装置。
(18)
前記第1評価値は第1クラスタの分離度に関する指標である、前記(17)に記載の情報処理装置。
(19)
前記第1クラスタは前記多次元データのうちのイベントセットに対応し、
前記第1評価値を決定することは更にクラスタ間の距離、及びクラスタ内の各イベントとクラスタ中心との距離を決定することを含む、前記(17)又は(18)に記載の情報処理装置。
(20)
前記第2クラスタは、前記第1クラスタを統合したクラスタである、前記(16)~(19)のいずれか一項に記載の情報処理装置。
(21)
前記第1評価値と前記第2評価値との間の前記関係性は、前記第1評価値が前記第2評価値より大きいことである、前記(20)に記載の情報処理装置。
(22)
前記第2クラスタは、前記第1クラスタを分割したクラスタである、前記(16)~(19)のいずれか一項に記載の情報処理装置。
(23)
前記第1評価値と前記第2評価値との間の前記関係性は、前記第2評価値が前記第1評価値より大きいことである、前記(22)に記載の情報処理装置。
(24)
前記多次元データをクラスタリングすることは更に、
前記多次元データの中のイベントセットに対応する前記第1クラスタを含むクラスタの第1グループを生成するため、前記多次元データをクラスタリングすることと、
前記第2クラスタを含むクラスタの第2グループを生成するため、前記イベントセットをクラスタリングすることと、を含む前記(16)~(19)のいずれか一項に記載の情報処理装置。
(25)
前記イベントセットのそれぞれは前記複数の細胞のうち一つから取得された検出データに対応する、前記(19)又は(24)に記載の情報処理装置。
(26)
前記情報を出力することは更に、
前記第1クラスタと前記第2クラスタとの間の関係性を可視化して表示すること、を含む前記(16)~(25)のいずれか一項に記載の情報処理装置。
(27)
前記情報を出力することは更に、
前記複数のクラスタに対応するレーダチャートと前記第2クラスタを含む前記第1クラスタを示すクラスタ集団に対応する枠線で囲まれたレーダチャートとを表示すること、を含む前記(16)~(19)のいずれか一項に記載の情報処理装置。
10 測定装置
20、21 情報処理装置
30、40 端末装置
100 システム
201 入力部
203 蛍光分離部
205 第1クラスタリング部
207 第2クラスタリング部
209 評価値算出部
211 判定部
213 出力部
215 クラスタリング再設定部

Claims (13)

  1. 多次元データをクラスタリングしたクラスタリング結果である第1クラスタの評価値、及び第1クラスタをさらにクラスタリングしたクラスタリング結果である第2クラスタの評価値を算出する評価値算出部と、
    前記第1クラスタの評価値と、前記第1クラスタをクラスタリングした前記第2クラスタの評価値とが所定の関係性を有するか否かを判定する判定部と、
    前記所定の関係性を有すると判定された前記第1クラスタ及び前記第2クラスタを特定する情報を出力する出力部と、
    を備え
    前記出力部は、
    前記第2クラスタが前記第1クラスタを統合したクラスタである場合に、
    前記第1クラスタの集団の大きさに応じた大きさの、前記第1クラスタに基づくレーダチャートを、前記第1クラスタおよび前記第2クラスタの包含関係に応じて表示する、
    情報処理装置。
  2. 前記出力部は、
    前記情報の出力を、前記所定の関係性を有すると判定された前記第1クラスタ及び前記第2クラスタに対応する前記レーダチャートを強調表示することで行う、
    請求項1に記載の情報処理装置。
  3. 前記評価値は、各クラスタの分離度に関する指標である、請求項1に記載の情報処理装置。
  4. 前記評価値算出部は、クラスタ間の距離、及びクラスタ内の各イベントとクラスタ中心との距離に基づいて前記評価値を算出する、請求項に記載の情報処理装置。
  5. 前記距離は、前記多次元データの各要素の性質差に基づいて設定される、請求項に記載の情報処理装置。
  6. 前記判定部は、前記第1クラスタの評価値と、該第1クラスタを統合した前記第2クラスタの評価値とが前記所定の関係性を有するか否かを判定する、請求項に記載の情報処理装置。
  7. 前記判定部は、統合後の前記第2クラスタの評価値が少なくとも1つ以上の統合前の前記第1クラスタの評価値よりも良好となる場合、前記第1クラスタ及び前記第2クラスタは、前記所定の関係性を有すると判定する、請求項6に記載の情報処理装置。
  8. 選択された前記第1クラスタが統合される前記第2クラスタを再設定するクラスタリング再設定部をさらに備え、
    前記評価値算出部は、前記選択された第1クラスタを複数の前記第2クラスタの各々に統合した場合における前記第2クラスタの評価値をそれぞれ算出し、
    前記クラスタリング再設定部は、算出された前記評価値に基づいて、前記選択された第1クラスタが統合される前記第2クラスタを再設定する、請求項に記載の情報処理装置。
  9. 前記多次元データをクラスタリングすることで、前記第1クラスタを導出する第1クラスタリング部と、
    前記第1クラスタをクラスタリングすることで、前記第2クラスタを導出する第2クラスタリング部と、をさらに備える、請求項1に記載の情報処理装置。
  10. 前記第2クラスタリング部は、ユーザからの入力に基づいて前記第1クラスタをクラスタリングする、請求項に記載の情報処理装置。
  11. 前記多次元データは、細胞からセンシングした光を複数の蛍光に分離したデータである、請求項1に記載の情報処理装置。
  12. 演算装置によって、多次元データをクラスタリングしたクラスタリング結果である第1クラスタの評価値、及び第1クラスタをさらにクラスタリングしたクラスタリング結果である第2クラスタの評価値を算出することと、
    前記第1クラスタの評価値と、前記第1クラスタをクラスタリングした前記第2クラスタの評価値とが所定の関係性を有するか否かを判定することと、
    前記所定の関係性を有すると判定された前記第1クラスタ及び前記第2クラスタを特定する情報を出力することと、
    を含み、
    前記出力することは、
    前記第2クラスタが前記第1クラスタを統合したクラスタである場合に、
    前記第1クラスタの集団の大きさに応じた大きさの、前記第1クラスタに基づくレーダチャートを、前記第1クラスタおよび前記第2クラスタの包含関係に応じて表示する、
    情報処理方法。
  13. コンピュータを、
    多次元データをクラスタリングしたクラスタリング結果である第1クラスタの評価値、及び第1クラスタをさらにクラスタリングしたクラスタリング結果である第2クラスタの評価値を算出する評価値算出部と、
    前記第1クラスタの評価値と、前記第1クラスタをクラスタリングした前記第2クラスタの評価値とが所定の関係性を有するか否かを判定する判定部と、
    前記所定の関係性を有すると判定された前記第1クラスタ及び前記第2クラスタを特定する情報を出力する出力部と、
    として機能させ、
    前記出力部は、
    前記第2クラスタが前記第1クラスタを統合したクラスタである場合に、
    前記第1クラスタの集団の大きさに応じた大きさの、前記第1クラスタに基づくレーダチャートを、前記第1クラスタおよび前記第2クラスタの包含関係に応じて表示する、
    プログラム。
JP2019207396A 2018-11-16 2019-11-15 情報処理装置、情報処理方法及びプログラム Active JP7392411B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023197269A JP2024009155A (ja) 2018-11-16 2023-11-21 システム及び情報処理方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018215289 2018-11-16
JP2018215289 2018-11-16

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023197269A Division JP2024009155A (ja) 2018-11-16 2023-11-21 システム及び情報処理方法

Publications (2)

Publication Number Publication Date
JP2020087465A JP2020087465A (ja) 2020-06-04
JP7392411B2 true JP7392411B2 (ja) 2023-12-06

Family

ID=68766805

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019207396A Active JP7392411B2 (ja) 2018-11-16 2019-11-15 情報処理装置、情報処理方法及びプログラム
JP2023197269A Pending JP2024009155A (ja) 2018-11-16 2023-11-21 システム及び情報処理方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023197269A Pending JP2024009155A (ja) 2018-11-16 2023-11-21 システム及び情報処理方法

Country Status (5)

Country Link
US (1) US20220003656A1 (ja)
EP (1) EP3867768A1 (ja)
JP (2) JP7392411B2 (ja)
CN (1) CN112771510A (ja)
WO (1) WO2020101023A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021081342A (ja) * 2019-11-20 2021-05-27 ソニーグループ株式会社 情報処理システムおよび情報処理装置
EP4222719A1 (en) 2020-11-19 2023-08-09 Sony Group Corporation Classification workflow for flexible image based particle sorting
CN115579065B (zh) * 2022-12-09 2023-03-31 百图生科(苏州)智能科技有限公司 数据的聚类处理方法、装置、电子设备和存储介质
CN117215589A (zh) * 2023-09-12 2023-12-12 北京优特捷信息技术有限公司 一种云原生状态评估方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132558A (ja) 1998-10-22 2000-05-12 Nri & Ncc Co Ltd 分類ルール探求式クラスター分析装置
JP2005275556A (ja) 2004-03-23 2005-10-06 Toshiba Solutions Corp 分割クラスタリング装置及び分割データ数決定方法
JP2006271385A (ja) 2001-03-14 2006-10-12 Dna Chip Research Inc 大腸癌の予測方法
JP2006330988A (ja) 2005-05-25 2006-12-07 Toshiba Corp データ分割装置、データ分割方法およびプログラム
JP2006350730A (ja) 2005-06-16 2006-12-28 Toshiba Corp クラスタリング装置、クラスタリング方法およびプログラム
US20130060775A1 (en) 2010-12-27 2013-03-07 The Board Of Trustees Of The Leland Stanford Junior University Spanning-tree progression analysis of density-normalized events (spade)

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101226190B (zh) * 2007-01-17 2013-07-03 深圳迈瑞生物医疗电子股份有限公司 流式细胞术的自动分类方法和装置
US8549002B2 (en) * 2008-05-15 2013-10-01 Oracle International Corporation Cluster health indicator with dynamic load correlation
KR20160103175A (ko) * 2011-07-19 2016-08-31 오비지오 이미징 시스템스 엔.브이. 세포 샘플에서의 암 세포들의 검출 및/또는 분류를 위한 방법 및 시스템
US20130207980A1 (en) * 2012-02-13 2013-08-15 Anil Babu Ankisettipalli Visualization of data clusters
WO2013147114A1 (ja) * 2012-03-30 2013-10-03 公益財団法人神奈川科学技術アカデミー イメージングセルソーター
KR101700340B1 (ko) * 2012-04-06 2017-01-26 에스케이플래닛 주식회사 대용량 데이터의 클러스터 결과 분석 시스템 및 방법
JP5866534B2 (ja) * 2013-07-11 2016-02-17 パナソニックIpマネジメント株式会社 画像計測装置及び画像計測方法
JP6647703B2 (ja) * 2015-03-14 2020-02-14 国立大学法人千葉大学 手術トレーニングプログラム
JP6710512B2 (ja) * 2015-09-14 2020-06-17 シスメックス株式会社 血液分析装置、血液分析方法及びコンピュータプログラム
CN107358268A (zh) * 2017-07-20 2017-11-17 北京京东尚科信息技术有限公司 用于数据聚类分组的方法、装置、电子设备及可读介质
CN108376982B (zh) * 2017-11-24 2021-03-26 上海泰豪迈能能源科技有限公司 负载相序的识别方法及装置
CN108681973A (zh) * 2018-05-14 2018-10-19 广州供电局有限公司 电力用户的分类方法、装置、计算机设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132558A (ja) 1998-10-22 2000-05-12 Nri & Ncc Co Ltd 分類ルール探求式クラスター分析装置
JP2006271385A (ja) 2001-03-14 2006-10-12 Dna Chip Research Inc 大腸癌の予測方法
JP2005275556A (ja) 2004-03-23 2005-10-06 Toshiba Solutions Corp 分割クラスタリング装置及び分割データ数決定方法
JP2006330988A (ja) 2005-05-25 2006-12-07 Toshiba Corp データ分割装置、データ分割方法およびプログラム
JP2006350730A (ja) 2005-06-16 2006-12-28 Toshiba Corp クラスタリング装置、クラスタリング方法およびプログラム
US20130060775A1 (en) 2010-12-27 2013-03-07 The Board Of Trustees Of The Leland Stanford Junior University Spanning-tree progression analysis of density-normalized events (spade)

Also Published As

Publication number Publication date
JP2020087465A (ja) 2020-06-04
CN112771510A (zh) 2021-05-07
WO2020101023A1 (en) 2020-05-22
JP2024009155A (ja) 2024-01-19
US20220003656A1 (en) 2022-01-06
EP3867768A1 (en) 2021-08-25

Similar Documents

Publication Publication Date Title
JP7392411B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP7241723B2 (ja) 免疫スコアを計算するためのシステム及び方法
US11151716B2 (en) Methods and systems for assessing cell morphology
JP6222584B2 (ja) 細胞ベースの組織解析
US8779387B2 (en) Method and system for detecting fluorochromes in a flow cytometer
JP5870851B2 (ja) 情報処理装置、情報処理方法、及びプログラム
EP1922695B1 (en) Method of, and apparatus and computer software for, performing image processing
JP6598838B2 (ja) 細胞画像処理装置および細胞画像の特性を定量化する方法
Ganapathy et al. CometQ: An automated tool for the detection and quantification of DNA damage using comet assay image analysis
JP2024084811A (ja) 情報処理方法、情報処理装置及びシステム
EP3882603A1 (en) Information processing device, information processing method, and computer program
EP2332073B1 (en) Shape parameter for hematology instruments
US20220283073A1 (en) Information processing device, information processing method, program, and information processing system
TWI834429B (zh) 模型選定方法以及圖像處理方法
US20240119065A1 (en) Automatic analyzer of multidimensional cytometry data
US20220317019A1 (en) Particle analysis system having autofluorescence spectrum correction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221013

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231024

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231106

R151 Written notification of patent or utility model registration

Ref document number: 7392411

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151