JP2016189701A - 細胞分析用情報生成装置、細胞分析用情報生成方法及びプログラム - Google Patents

細胞分析用情報生成装置、細胞分析用情報生成方法及びプログラム Download PDF

Info

Publication number
JP2016189701A
JP2016189701A JP2015070319A JP2015070319A JP2016189701A JP 2016189701 A JP2016189701 A JP 2016189701A JP 2015070319 A JP2015070319 A JP 2015070319A JP 2015070319 A JP2015070319 A JP 2015070319A JP 2016189701 A JP2016189701 A JP 2016189701A
Authority
JP
Japan
Prior art keywords
information
cell
feature
analysis
feature group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015070319A
Other languages
English (en)
Inventor
竜司 加藤
Ryuji Kato
竜司 加藤
慧 蟹江
Kei Kanie
慧 蟹江
佐々木 寛人
Hiroto Sasaki
寛人 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nagoya University NUC
Original Assignee
Nagoya University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nagoya University NUC filed Critical Nagoya University NUC
Priority to JP2015070319A priority Critical patent/JP2016189701A/ja
Priority to US15/563,155 priority patent/US10900950B2/en
Priority to EP16772843.5A priority patent/EP3275993B8/en
Priority to PCT/JP2016/060146 priority patent/WO2016158962A1/ja
Priority to SG11201708082RA priority patent/SG11201708082RA/en
Publication of JP2016189701A publication Critical patent/JP2016189701A/ja
Priority to HK18109585.2A priority patent/HK1250169A1/zh
Pending legal-status Critical Current

Links

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

【課題】細胞分析用の情報を効率的に生成すること。【解決手段】特徴群情報生成部42は、複数の細胞からなる細胞集団を被写体として撮像された細胞画像の中から、所定条件により選定された1枚以上の細胞画像を単位として、当該単位に含まれる1以上の細胞画像のデータに基づいて、細胞単体の形態的特徴又は細胞集団の形態的特徴に関するN種類(Nは1以上の整数値)の特徴パラメータの値を含む情報を、特徴群情報として生成する。分析モデル生成部44又は評価対象情報取得部46は、細胞に関する所定の分析を行うときに用いる情報として、特徴群情報に含まれるN種類の特徴パラメータのうち少なくとも1種類に基づいて、M種類(MはNとは独立した整数値)のパラメータの値から構成される情報を取得する。【選択図】図2

Description

本発明は、細胞分析用情報生成装置、細胞分析用情報生成方法及びプログラムに関する。
従来、がん研究における自然発生がんの検出、再生医療における治療用細胞以外の異種細胞の検出、間葉系幹細胞(MSC)の臨床研究等の分野において、細胞を染色する技術が広く用いられてきた。
このような細胞を染色する技術を適用すると、染色によって細胞が破壊されてしまう。さらに、染色試薬は高価であり、細胞の染色自体が面倒である。
そこで、本発明者らは、非破壊で細胞に関する分析を行う技術について、安価かつ簡便に実現できるように研究開発をし続けている(特許文献1乃至5参照)。
特開2011−232051号公報 特開2011−229413号公報 特開2011−229410号公報 特開2011−229409号公報 再表2010/098105号公報
しかしながら、細胞に関する分析を行う技術と一口にいっても、その分析内容は多岐に渡り、同一の分析内容であっても分析手法や条件も多種多様に存在する。このため、分析内容、分析手法、各種条件毎に異種類の分析モデルを夫々生成しておく必要がある。
各種の分析モデル毎に、適合する細胞分析用情報は異なる場合が多い。つまり、各種分析モデル毎に、細胞分析用情報の構造や種類が異なる場合が多い。ここで、細胞分析用情報とは、分析モデルを生成する際に必要なサンプルの細胞に関する情報や、分析対象の細胞に関する情報をいう。
このため、各種の分析モデル毎に適合する細胞分析用情報を効率的に生成することが要求されていた。
本発明は、このような状況に鑑みてなされたものであり、各種の分析モデル毎に適合する細胞分析用情報を効率的に生成することを目的とする。
上記目的を達成するため、本発明の一態様の細胞分析用情報生成装置は、
複数の細胞からなる細胞集団を被写体として撮像された細胞画像の中から、所定条件により選定された1枚以上の細胞画像を単位として、前記単位に含まれる1以上の細胞画像のデータに基づいて、前記細胞の単体の形態的特徴又は前記細胞集団の形態的特徴に関するN種類(Nは1以上の整数値)の特徴パラメータの値を含む情報を、特徴群情報として生成する特徴群情報生成手段と、
細胞に関する所定の分析を行うときに用いる分析用情報として、前記特徴群情報に含まれる前記N種類の特徴パラメータのうち少なくとも1種類に基づいて、M種類(MはNとは独立した整数値)のパラメータの値から構成される情報を取得する情報取得手段と
を備える。
本発明の一態様の細胞分析用情報生成方法及びプログラムは、上述の本発明の一態様の細胞分析用情報生成装置に対応する方法及びプログラムである。
本発明によれば、各種の分析モデル毎に適合する細胞分析用情報を効率的に生成することが実現可能になる。
本発明の一実施形態に係る細胞分析装置のハードウェアの構成を示すブロック図である。 図1の細胞分析装置1の機能的構成のうち、細胞分析処理を実行するための機能的構成を示す機能ブロック図である。 図2の細胞分析装置1の機能的構成のうち、特徴群情報生成部の機能的構成の詳細を示す機能ブロック図である。 図3の特徴群情報生成部の画像数値化部の処理を説明する模式図である。 特徴パラメータの具体的な10種類を説明する図である。 特徴群情報の生成の基になる細胞画像の一例を示す図である。 特徴群情報の一部を具体的に示す図である。 特徴群情報の一部を具体的に示す図である。 特徴群情報として、分析評価のために抽出される要素の違いを説明するための模式図である。 細胞集団における特徴量のうち有効なものの強調と組合せに基づいて、細胞画像から生成される特徴群情報を模式的に示す図である。 分布中の情報強調のパターンの各種具体例を示している。 経時変化という点を考慮した集団データの加工手法の各種具体例を示している。 ヘテロ性情報付加という点を考慮した集団情報の加工手法の各種具体例を示す図である。 ヘテロ性情報付加及び経時変化を考慮した加工がなされた特徴群情報の一例を示す図である。 従来のサンプルデータと、本実施形態の特徴群情報から生成されるサンプルデータとの違いを示す図である。 細胞品質変化を予測するための分析モデルの生成に用いるサンプルデータの一例を示す図である。 図16のサンプルデータを用いて細胞品質変化を予測したときの予測精度を示す図である。 図17の標準化タイプEのサンプルデータを用いて生成された分析モデルにより、実際に細胞品質変化を予測した結果を示す図である。 所定の分析モデルの生成に用いられる、複数のサンプルデータの一例を示す図である。 図19のサンプルデータを用いて、所定の分析モデルを生成する手法の2つの例を示している。 図17乃至図19で説明した例とは別の分析モデルの表現形態の一例を示している。 分析モデルの表現形態の一例であって、図21とは異なる例を示す図である。 分析モデルの表現形態の一例であって、図21や図22とは異なる例を示す図である。 分析モデルの表現形態の一例であって、図21乃至図23とは異なる例を示す図である。 サンプルデータ及び評価対象情報の生成の基になる特徴群情報の構成例を示す図である。 時間変化を考慮した図25の特徴群情報の構成例を示す図である。 図26の構成の特徴群情報を用いて、サンプルデータ及び評価対象情報を比較する手法の一例を説明する図である。 出力情報を示す画面の一例を示す図である。 出力情報を示す画面の一例を示す図である。
以下、本発明の実施形態について、図面を用いて説明する。
図1は、本発明の一実施形態に係る細胞分析装置1のハードウェアの構成を示すブロック図である。
細胞分析装置1は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、バス14と、入出力インターフェース15と、出力部16と、入力部17と、記憶部18と、通信部19と、ドライブ20とを備えている。
CPU11は、ROM12に記録されているプログラム、又は、記憶部18からRAM13にロードされたプログラムに従って各種の処理を実行する。
RAM13には、CPU11が各種の処理を実行する上において必要なデータ等も適宜記憶される。
CPU11、ROM12及びRAM13は、バス14を介して相互に接続されている。このバス14にはまた、入出力インターフェース15も接続されている。入出力インターフェース15には、出力部16、入力部17、記憶部18、通信部19、及びドライブ20が接続されている。
出力部16は、ディスプレイやスピーカ等で構成され、各種情報を画像や音声で出力する。
入力部17は、キーボードやマウス等で構成され、各種情報を入力する。
記憶部18は、ハードディスクやDRAM(Dynamic Random Access Memory)等で構成され、各種データを記憶する。
通信部19は、図示せぬネットワークを介して他の装置(本実施形態では後述の図2の外部装置81や前処理装置82)との間で行う通信を制御する。
ドライブ20には、必要に応じて、リムーバブルメディア31が適宜装着される。ドライブ20によってリムーバブルメディア31から読み出されたプログラムは、必要に応じて記憶部18にインストールされる。また、リムーバブルメディア31は、記憶部18に記憶されている各種データも、記憶部18と同様に記憶することができる。
図2は、図1の細胞分析装置1の機能的構成のうち、細胞分析処理を実行するための機能的構成を示す機能ブロック図である。
細胞分析処理とは、1以上の細胞を被写体として含む画像(以下、「細胞画像」と呼ぶ)のデータと、所定の分析モデルとに基づいて、当該細胞に関する所定の分析を行い、その分析結果を出力するまでの一連の処理をいう。
ここで、細胞に関する所定の分析とは、当該細胞を被写体とする細胞画像に基づく分析であれば足りる意である。即ち、細胞に関する所定の分析は、当該細胞の種類や状態を分析することは勿論のこと、当該細胞の外部(周囲環境等)を分析することも含む広義な概念である。
細胞分析処理が実行される場合には、主にCPU11においては、図2に示すように、細胞画像入力部41と、特徴群情報生成部42と、ノイズ除去部43と、分析モデル生成部44と、評価対象情報取得部45と、評価対象情報取得部46と、分析部47と、出力情報生成部48とが機能する。
また、記憶部18の一領域には、特徴群情報DB61、細胞評価DB62、及び分析モデル保持部63が設けられる。
細胞画像入力部41は、細胞画像のデータを入力する。ここで、細胞画像の提供元は、特に限定されず、図示せぬインターネット等を介して接続する外部装置81であってもよいし、細胞分析装置1の管理人等が保有する前処理装置82であってもよい。
つまり、細胞画像を提供する者を、以下、「ユーザ」と呼ぶならば、ユーザは、細胞分析装置1を保有しない場合等には、外部装置81を操作して、インターネット等を介して細胞画像のデータを細胞分析装置1に提供する。一方、ユーザは、細胞分析装置1を保有する場合等には、さらに前処理装置82も保有し、当該前処理装置82で生成した細胞画像のデータを細胞分析装置1に提供する。
前処理装置82は、細胞を調整する細胞調整部71と、当該細胞を撮影して細胞画像のデータとして出力する細胞撮影部72とを有している。
特徴群情報生成部42は、細胞画像のデータを2値化し、その結果得られるデータ(以下、「2値化データ」と呼ぶ)から細胞オブジェクトを抽出し、当該細胞オブジェクトの1種類以上の形態的特徴の夫々を示すパラメータの各値から構成されるデータ、即ち数値化データを生成する。
なお、以下、所定の形態的特徴を示すパラメータを、特に、「特徴パラメータ」と呼ぶ。また、特徴パラメータの値は、「形態的特徴量」とも呼ばれている。
ここで、1枚の細胞画像は、複数の細胞からなる細胞集団、例えば同一容器内で培養される細胞集団(時間と共に細胞の個数が変化する場合もある)が被写体として撮像されたものである場合が多い。この場合、1枚の細胞画像には複数個の細胞オブジェクトが含まれており、複数個の細胞オブジェクト毎に1種類以上の特徴パラメータの各値が算出される。
このような細胞集団を被写体とする細胞画像の場合、細胞単体の特徴パラメータの値(形態的特徴量)も有意情報であるが、細胞集団についての特徴パラメータに関する情報(以下、「集団情報」と呼ぶ)も有用な情報である。
集団情報としては、例えば、細胞集団における所定の特徴パラメータのヒストグラムや、細胞集団における所定の特徴パラメータの統計値(平均値や分散値等の数値)が含まれる。
本実施形態では、細胞単体の特徴パラメータの値(細胞単体の形態的特徴量)と、集団情報をまとめて、以下、「特徴群情報」と呼ぶ。
ここで、特徴群情報は、1枚の細胞画像から得られた数値のみから構成されるとは限らない。
例えば所定の容器内の細胞集団が被写体とされ、時間経過と共に複数回細胞画像が撮像される場合がある。このような場合、撮像時刻が異なる複数枚の細胞画像の各データに基づいて、特徴群情報が生成される場合もある。
また例えば、異なる容器(ウェル等)で別々に培養された同一種類の細胞について、異なる容器毎に別々に撮影された複数枚の細胞画像の各データに基づいて、特徴群情報が生成される場合もある。
このように、特徴群情報は、任意の枚数の細胞画像の各データに基づいて生成され得る。
ノイズ除去部43は、分析モデルの生成に用いるサンプルデータとして、ノイズとなるデータを除去する。
ノイズとなるデータは、例えば、細胞の培養時において手技が不良であった際の細胞画像のデータ、即ち、当該細胞画像のデータに基づいて生成された特徴群情報等から抽出されるサンプルデータである。
分析モデル生成部44は、特徴群情報DB61に格納されている特徴群情報の少なくとも一部に基づいて、サンプルデータを生成する。
ここで、「特徴群情報の少なくとも一部に基づいて、サンプルデータを生成」するとは、特徴群情報の構成要素(特徴パラメータの値)の一部を単に抽出することのみならず、任意の個数の任意の種類の構成要素を用いて新たなデータを生成することも意味する。
分析モデル生成部44は、1以上のサンプルデータを用いて、細胞画像内の細胞に関する所定の分析を行うためのモデル(以下、「分析モデル」と呼ぶ)を生成する。
ここで、細胞に関する所定の分析と一口にいっても、その分析内容は多岐に渡る。例えば、代表的な分析内容を挙げるだけでも、細胞の種類を分類する種類、培養されている細胞の状態を判断する種類、及び、細胞が培養されている外部環境を分析する種類という3種類が存在する。
従って、分析内容の種類毎に、分析モデルも複数種類存在する可能性がある。つまり、細胞の種類を分析するための分析モデルと、培養されている細胞の状態を判断するための分析モデルと、細胞が培養されている外部環境を分析するための分析モデルとの夫々では、異なる種類が採用されている場合が多い。
また、分析内容が同一種類であっても、多種多様な分析手法や各種条件等が存在する。従って、分析手法や各種条件によっても異なる種類の分析モデルが用いられる場合が多い。
分析モデルの種類が異なれば、その生成に用いられるサンプルデータの種類や構造も異なる場合が多い。
つまり、特徴群情報に含まれる全ての種類の特徴パラメータの値が、そのままサンプルデータとして常に用いられるわけではない。
即ち、分析内容、分析手法、各種条件等毎に、特徴パラメータの種類や個数が異なる組合せが抽出され、抽出された夫々の組合せに基づいて、サンプルデータが生成される場合もある。
具体的には例えば、細胞集団における大きさの平均値(第1特徴パラメータ)と、細胞集団における大きさの分散値(第2特徴パラメータ)と、細胞集団における長さの平均値(第3特徴パラメータ)と、細胞集団における長さの分散値(第4特徴パラメータ)とを含む特徴群情報があったとする。
この場合、細胞の種類を分類する分析モデルの生成用に、第1特徴パラメータと第3特徴パラメータとの各値から、サンプルデータが生成される場合もある。
一方、培養されている細胞の状態を判断する分析モデルの生成用に、第2特徴パラメータと、第3特徴パラメータと、第4特徴パラメータとの各値から、サンプルデータが生成される場合もある。
ここで、サンプルデータの構成要素は、特徴群情報の特徴パラメータの値がそのまま用いられる場合もある。しかしながら、図25乃至図27を参照して後述するが、特徴群情報の特徴パラメータとは別のパラメータの値が、サンプルデータの構成要素として新たに生成される場合もある。
つまり、特徴群情報のN種類(Nは1以上の整数値)の特徴パラメータに基づいて、M種類(MはNとは独立した1以上の整数値)のパラメータの各値から構成されるサンプルデータが生成される。
このM種類のパラメータは、N種類の特徴パラメータとは独立した概念である。即ち、分析内容、分析手法、各種条件等毎に、サンプルデータを構成するM種類のパラメータの種類や個数が異なる場合が多い。
さらに、サンプルデータの基になる特徴群情報は、1枚の細胞画像から生成されるとは限らない。つまり、所定の条件で選択された1枚以上の細胞画像を単位として、当該単位から特徴群情報は生成される。
ここで、所定の条件は、特に限定されず、例えば「同一容器内の時刻t1乃至t5の夫々の細胞画像」という条件を採用してもよい。この条件が採用された場合、同一容器内の時刻t1乃至t5の夫々の5枚の細胞画像から得られた特徴群情報に基づいて、1のサンプルデータが生成される。
従って、サンプルデータには、異なる時刻々のデータ(数値)が含まれ得る。
具体的には例えば、上述の例の第1特徴パラメータ乃至第4特徴パラメータを含む特徴群情報があったとする。
そして、細胞の種類を分類する分析モデルの生成用に対しても、培養されている細胞の状態を判断する分析モデルの生成用に対しても、第3特徴パラメータの値が、サンプルデータのパラメータの値として採用されるものとする。
この場合であっても、細胞の種類を分類する分析モデルの生成用については、時刻t1と時刻t2との各値がサンプルデータに含められる一方で、培養されている細胞の状態を判断する分析モデルの生成用については、時刻t4の値がサンプルデータに含められる場合もある。
即ち、同じ特徴パラメータであっても時刻が異なる値は、夫々違う意味を持つ独立したデータである。このため、分析内容、分析手法、各種条件等毎の時間変化の違いを考慮して、サンプルデータが生成される場合がある。
以上まとめると、特徴群情報は、N種の特徴パラメータを少なくとも要素として含む、N次元以上の多次元情報である。
このような特徴群情報に含まれるN種類の特徴パラメータのうち少なくとも1種類に基づいて生成される、M種類のパラメータの値から構成されるデータが、サンプルデータである。
つまり、サンプルデータのM種類のパラメータは、N種類の特徴パラメータとは独立したものであり、当然ながらN種類の特徴パラメータのうち幾種類かの特徴パラメータを含み得るが、それとは別のパラメータも含み得る。
ここで、特徴パラメータ以外の別のパラメータを、以下、「付帯パラメータ」と呼ぶ。付帯パラメータとしては、例えば時間のパラメータを採用することができる。また例えば、外部環境や各種条件等で定義されるパラメータも、付帯パラメータである。また例えば、後述の図25乃至図27の例のサンプルデータでは、所定の3次元空間を構築する各軸を示すパラメータが構成要素になっている。この各軸を示すパラメータもまた、付帯パラメータの一種である。
このように、本実施形態では、分析モデルの生成に際し、特徴群情報自体をそのままサンプルデータとして用いるのではなく、特徴群情報とは独立したM種類のパラメータを要素とするサンプルデータが用いられる。
このM種類のパラメータとしては、分析内容、分析手法、各種条件等に応じて、任意な種類の任意の個数の組み合わせを採用することができる。つまり、1の特徴群情報から、分析内容、分析手法、所定条件等に夫々適した異種類で異構造のサンプルデータを個別に生成することができる。その結果、分析内容、分析手法、所定条件等に夫々適した分析モデルの生成が可能になる。つまり、各種の分析モデル毎に適合するサンプルデータ(細胞分析用情報の1種)を効率的に生成することができる。
これにより、各種各様な分析内容、分析手法、所定条件等の夫々について、細胞に関する分析を総合的に行うことが容易かつ適切に可能になる。
つまり、図2の分析モデル生成部44は、分析内容、分析手法、各種条件等毎に、サンプルの細胞集団についての特徴群情報を特徴群情報DB61から検索し、当該特徴群情報に含まれるN種類の特徴パラメータのうち少なくとも1種類に基づいて、M種類のパラメータの各値を要素とするサンプルデータを生成する。
そして、分析モデル生成部44は、分析内容、分析手法、各種条件等毎に種類や構造が異なるサンプルデータを1個以上用いて、分析内容、分析手法、各種条件等毎に複数の分析モデルを夫々生成する。
これらの各分析モデルは、各サンプルデータの種類や構造を示す情報と対応付けられて、分析モデル保持部63に保持される。
なお、分析モデル保持部63に保持された各種分析モデルは、新たな細胞画像についての特徴群情報が特徴群情報DB61に格納されると、その後適当なタイミングで、分析モデル生成部44によって適宜更新される。
評価対象情報取得部45は、細胞画像に対応する評価対象情報を、外部装置81や、前処理装置82の細胞調整部71から取得して、細胞評価DB62に格納する。
細胞画像に対応する評価対象情報とは、当該細胞画像の被写体となる細胞集団(例えば所定容器内の細胞集団)に対して、所定の評価法を用いて行った破壊的細胞評価の結果を示す情報である。つまり、所定の細胞集団に対して、細胞画像とは別の手段で分析評価された情報が、評価対象情報である。
破壊的細胞評価は、特に限定されず、ゲノム、遺伝子発現、タンパク質、代謝産物、相互詐称、生体移植結果、治療成績等任意のものを採用することができる。
なお、評価対象情報は、数値化情報として細胞評価DB62に格納されると好適である。評価対象情報の値を、所定の分析モデルを生成する際のサンプルデータ(多次元情報)の要素値(所定のパラメータの値)として含めることができるからである。
評価対象情報取得部46は、分析評価の対象となる細胞の特徴群情報を、分析評価用の分析モデルに適合した形態で特徴群情報DB61から取得する。なお、このようにして評価対象情報取得部46により取得された情報を、以下、「評価対象情報」と呼ぶ。
分析評価用の分析モデルに適合した形態とは、当該分析モデルが生成される際に用いられたサンプルデータの形態と同様な形態(つまり、パラメータのM種類が夫々同一種類である形態)をいう。
即ち、上述したように、分析モデルの種類毎に、生成時に用いられたサンプルデータの形態が異なる場合がある。
従って、評価対象情報も、利用対象の分析モデルの生成時に用いられたサンプルデータと同様な形態である必要がある。
つまり、評価対象情報取得部46は、分析評価の対象となる細胞の特徴群情報を特徴群情報DB61から検索し、当該特徴群情報に含まれるN種類の特徴パラメータのうち少なくとも1種類に基づいて、M種類のパラメータの値から構成される情報を、評価対象情報として取得する。
この場合、「当該特徴群情報に含まれるN種類の特徴パラメータのうち少なくとも1種類」や、「M種類のパラメータ」は、利用対象の分析モデルのサンプルデータが生成されたときのものと同一種類である。
分析部47は、評価対象情報と分析モデルとに基づいて、分析評価対象の細胞に関する分析処理を実行する。上述したように、分析内容、分析手法、各種条件等は、特に限定されず、各種各様な分析が可能になる。
出力情報生成部48は、分析評価対象の細胞に関する情報(例えば評価対象情報)と、当該細胞に対する分析処理結果を含む情報を、出力情報として生成する。そして、出力情報生成部48は、出力情報を出力部16や外部装置81に出力する。
なお、出力情報の具体例については、図28及び図29を参照して後述する。
以上図2を参照して、細胞分析装置1の機能的構成例について説明した。
次に、このような図2の機能的構成を有する細胞分析装置1のうち、特徴群情報生成部42の詳細な構成について、図3を参照して説明する。
図3は、図2の細胞分析装置1の機能的構成のうち、特徴群情報生成部42の機能的構成の詳細を示す機能ブロック図である。
図3に示すように、特徴群情報生成部42において、画像数値化部91と、複数画像特徴群情報生成部92と、ヘテロ性情報付加部93と、経時変化情報付加部94と、特徴群情報出力部95とがCPU11(図1)において機能する。
また、記憶部18(図1)の一領域には、数値化情報蓄積部101と、第1特徴群情報蓄積部102と、第2特徴群情報蓄積部103と、第3特徴群情報蓄積部104とが設けられる。
画像数値化部91は、1枚の細胞画像のデータを処理単位として、処理単位のデータに対して所定の画像処理を施すことで、処理単位についての特徴群情報を生成する。
1枚の細胞画像から生成された特徴群情報、即ち、当該細胞画像に含まれる細胞オブジェクトの夫々の各種特徴パラメータの値(数値)の集合体からなる情報は、数値化情報蓄積部101に蓄積される。即ち、数値化情報蓄積部101は、1枚の細胞画像を単位として、複数単位の特徴群情報を蓄積する。
図4は、画像数値化部91の処理を説明する模式図である。
図4の例では、1枚の細胞画像G1のデータが処理単位として画像数値化部91に与えられる。
画像数値化部91は、細胞画像G1のデータから2値化データG2を生成する。画像数値化部91は、2値化データから「XXX」個(XXXは、任意の整数値)の細胞オブジェクト候補を抽出する。ここで、細胞オブジェクトとせずに候補としたのは、細胞ではないノイズとなるオブジェクト(以下、「ノイズオブジェクト」と呼ぶ)が含まれるからである。
画像数値化部91は、各細胞オブジェクト候補の夫々に対して一意のID(Cell ID)を付し、各種特徴パラメータを夫々求める。即ち、各細胞オブジェクトが数値化されることになる。図4の例では、各細胞オブジェクト毎に、9種類の特徴パラメータ(Parameter1乃至9)の値が求められている。
このような各細胞オブジェクト毎の9種類の特徴パラメータの値(数値化データ)が網羅されたリストが、細胞画像G1の特徴群情報I1である。
ただし、細胞画像G1の特徴群情報I1には、ノイズオブジェクトについての数値化データ(9種類の特徴パラメータの値)も含まれている。
そこで、ステップS1において、画像数値化部91は、適当なアルゴリズムに従って、細胞オブジェクト候補からノイズオブジェクトを判定し、当該ノイズオブジェクトの数値化データを除外する。
図4の例では、IDが「Cell 001」及び「Cell 002」の細胞オブジェクト候補がノイズオブジェクトと判定されている。このため、細胞画像G1の特徴群情報I1から、当該ノイズオブジェクトについての数値化データが除外され、細胞画像G1の特徴群情報I2が生成される。
さらに、ステップS2において、画像数値化部91は、ステップS1とは異なる適当なアルゴリズムに従って、細胞オブジェクト候補からノイズオブジェクトを判定し、当該ノイズオブジェクトの数値化データを除外する。
図4の例では、IDが「Cell 003」及び「Cell 004」の細胞オブジェクト候補がノイズオブジェクトと判定されている。このため、細胞画像G1の特徴群情報I1から、当該ノイズオブジェクトについての数値化データが除外され、細胞画像G1の特徴群情報I3が生成される。
ステップS3において、画像数値化部91は、ノイズオブジェクトが除外された細胞オブジェクト候補を細胞オブジェクトとして確定して、細胞画像G1の特徴群情報I3を、数値化情報蓄積部101に記憶させる。
なお、図4の例では、特徴パラメータの種類は、9種類とされたが、特にこれに限定されない。
例えば図5は、特徴パラメータの具体的な10種類を説明する図である。
図5において、1行は所定の種類の特徴パラメータを示している。1列目の項目は、パラメータ番号を示している。2列目の項目は、特徴パラメータの名称を示している。3列目の項目は、特徴パラメータの例(求め方)を示している。4列目の項目は、特徴パラメータの説明を示している。
「Total area」は、細胞(より正確には「細胞オブジェクト」であるが、本段落では単に「細胞」と呼ぶ)の面積を示す特徴パラメータである。
「Area」は、細胞内のHoleを除く面積を示す特徴パラメータである。ここで、Holeは、コントラストによって、細胞画像の明るさが閾値以上となる部分(位相差観察では白に近い状態となる箇所)である。
「Perimeter」は、細胞の外周の長さを示す特徴パラメータである。
「Length」は、細胞を横切る線のうちの最大値(細胞の全長)を示す特徴パラメータである。
「Breadth」は、「Length」に直交する線のうちの最大値(細胞の横幅)を示す特徴パラメータである。
「Inner radius」は、細胞の内周の半径を示す特徴パラメータである。
「Elliptical form factor」は、「Length」の値を「Breadth」で除した特徴パラメータである。
「Fiber Breadth」は、細胞を擬似的に線状と仮定した場合の幅(Fiber Lengthと直交する方向の長さ)を示す特徴パラメータである。
「Fiber Length」は、細胞を擬似的に線状と仮定した場合の長さを示す特徴パラメータである。
「Shape Factor」は、細胞の円形度(細胞の丸さ)を示す特徴パラメータである。
なお、図5の例の特徴パラメータは例示に過ぎず、細胞オブジェクトから数値化可能な所定の形態的特徴を示すパラメータであれば、任意の種類を採用することができる。
また、1枚の細胞画像には、細胞集団が含まれているため、図示はしないが集団情報も求められ、特徴群情報に含められる。例えば上述の「Total area」の平均値や分散値等が、特徴群情報に含められ得る。
また、複数個の細胞の所定の形態的特徴量のヒストグラムが求められ、そのヒストグラム内の各ビンの値等が、特徴群情報に含められ得る。
図3に戻り、複数画像特徴群情報生成部92は、所定の規則に従って、複数枚の細胞画像からなる第1処理単位を決定して、第1処理単位に含まれる特徴群情報を数値化情報蓄積部101から取得する。
所定の規則は、特に限定されないが、ここでは、同一条件及び同一時間に撮像された複数の細胞画像が第1処理単位になるという規則が採用されている。
次に、複数画像特徴群情報生成部92は、数値化情報蓄積部101から取得した各特徴群情報について、各数値化データを結合したり整理することによって、第1処理単位の特徴群情報を生成する。
第1処理単位の特徴群情報は、第1特徴群情報蓄積部102に蓄積される。
ヘテロ性情報付加部93は、所定の規則に従って、複数枚の細胞画像からなる第2処理単位を決定して、第2処理単位に含まれる各特徴群情報を第1特徴群情報蓄積部102から取得する。
所定の規則は、特に限定されないが、ここでは、複数条件及び同一時間に撮像された複数の細胞画像が第2処理単位になるという規則が採用されている
次に、ヘテロ性情報付加部93は、取得した各特徴群情報について、各数値化データを結合したり整理することによって、ヘテロ性情報が付加された第2処理単位の特徴群情報を生成する。なお、ヘテロ性情報や第2処理単位の特徴群情報の具体例については、図12を参照して後述する。
第2処理単位の特徴群情報は、第2特徴群情報蓄積部103に蓄積される。
経時変化情報付加部94は、所定の規則に従って、複数枚の細胞画像からなる第3処理単位を決定して、第3処理単位に含まれる各特徴群情報を第2特徴群情報蓄積部103から取得する。
所定の規則は、特に限定されないが、ここでは、複数条件及び複数時間(時間変化する相異なる時間)に撮像された複数の細胞画像が第3処理単位になるという規則が採用されている
次に、経時変化情報付加部94は、取得した各特徴群情報について、各数値化データを結合したり整理することによって、経時変化の概念が付加された第3処理単位の特徴群情報を生成する。なお、経時変化の概念が付加された第3処理単位の特徴群情報の具体例については、図9乃至図12を参照して後述する。
第3処理単位の特徴群情報は、第3特徴群情報蓄積部104に蓄積される。
特徴群情報出力部95は、適当なタイミングで、特徴群情報を第3特徴群情報蓄積部104から取得して、ノイズ除去や、タグ情報付加等をしたうえで、特徴群情報DB61に記憶する。
以上図3を参照して特徴群情報生成部42の詳細について説明したように、単一の細胞画像のデータは、画像数値化部91において画像処理が施されることで、数値化された特徴群情報となる。
従って、複数画像特徴群情報生成部92乃至特徴群情報出力部95の処理対象は、画像のデータ(イメージデータ)ではなく、数値化データたる特徴群情報である。従って、複数画像特徴群情報生成部92乃至特徴群情報出力部95をまとめて、「数値化情報処理部111」と適宜呼ぶ。
ここで、図6乃至図8を参照して、特徴群情報DB61に記憶される特徴群情報の具体例について説明する。
図6は、特徴群情報の生成の基になる細胞画像の一例を示している。
細胞画像CAは、同一容器で培養された種類「CA」の細胞集団を撮像したたものである。
細胞画像CBは、同一容器で培養された種類「CB」の細胞集団を撮像したものである。
細胞画像CCは、同一容器で培養された種類「CC」の細胞集団を撮像したものである。
細胞画像CDは、同一容器で培養された種類「CD」の細胞集団を撮像したものである。
なお、図6の例では、各種類「CA」乃至「CD」について、1枚の細胞画像しか示されていないが、実際には、各種類毎に、別々の時刻t1乃至t10の各タイミングにおいて夫々撮像された10枚の細胞画像が存在するものとする。
なお、ここでいう「時刻」は、絶対的な時刻(世界標準時刻)ではなく、例えば培養開始から1時間後等、所定の基準時(培養開始時刻)からの相対的な時刻を意味する。
図7及び図8は、特徴群情報の一部を具体的に示している。
特徴群情報の単位は上述したように特に限定されないが、図7及び図8の例では、細胞の種類が1単位とされ、4単位の特徴群情報が各列に夫々配置されている。
即ち、種類「CA」の細胞の特徴群情報の一部は、(項目名を抜かすと)左から第1列に配置されている。種類「CB」の細胞の特徴群情報の一部は、左から第2列に配置されている。種類「CC」の細胞の特徴群情報の一部は、左から第3列に配置されている。種類「CD」の細胞の特徴群情報の一部は、左から第4列に配置されている。
図7の例では、特徴群情報のうち、各細胞画像の細胞集団における所定特徴パラメータの統計値を要素とする一部が示されている。図7の一番左の列には、特徴群情報の要素名が含まれている。
ここで、「pas」とは(相対的な)時刻を示す。即ち、kpas(kは1乃至10の任意の整数値)は、時刻kに撮像された細胞画像から得られた値であることを示している。
「AVE」は平均値を、「SD」は標準偏差を、夫々示している。
例えば上から1番目の行の要素(Normal_Area_AVE_01pas)は、時刻t1の細胞画像に含まれるノーマルの細胞集団の「Area」の平均値を示している。
また例えば上から12番目の行の要素(Normal_Area_SD_02pas)は、時刻t2の細胞画像に含まれるノーマルの細胞集団の「Area」の標準偏差を示している。
図8の例では、特徴群情報のうち、各細胞画像の細胞集団における所定特徴パラメータについてのヒストグラムのビンを要素とする一部が示されている。図8の一番左の列には、特徴群情報の要素名が含まれている。
ここで、「bin」とはビンの番号を示す。番号の付し方は特に限定されないが、図8の例では、ヒストグラムが12分割(12ビン)から構成されるものとして、左から順に番号が付されている。
例えば上から1番目の行の要素(Area_1pas_1bin)は、時刻t1の細胞画像に含まれる細胞集団の「Area」のヒスグラムのうち、左から1番目のビンの値を示している。
ここで、図7及び図8においては、特徴群情報の各要素(各特徴パラメータ)は、その数値に応じて異なる色及び濃淡がつけられている。
とある領域の色や濃淡のパターンは、細胞の種類「CA」乃至「CD」毎に異なっていたり、特徴的であったりする。
ここで、「とある領域」とは、列方向にみて、連続している複数の項目からなる連続領域の場合もあるし、非連続となっている複数の項目から形成される領域の場合もある。例えば、図7の上から1乃至10行の連続領域(Normal_Area_AVEの部分)が「とある領域」であってもよい。また例えば、時刻t1,t3の非連続な部分(01pass1,03pass3という項目名を有する非連続な領域)が「とある領域」であってもよい。
ここで例えば、特徴群情報の「とある部分」では、細胞の種類「CA」乃至「CD」の分類が容易に可能となるような、色や濃淡のパターンが存在しているものとする。この場合、「とある領域」の色や濃淡のパターンを見比べる(実際の処理では類似度等の演算をする)ことで、細胞の種類「CA」乃至「CD」の分類を容易に行うことができる。
即ち、細胞の種類「CA」乃至「CD」を分類する分析モデルの生成や更新時には、「とある領域」の各項目値(各特徴パラメータの値)に基づいて、サンプルデータが生成される。
また、未知な細胞を被写体とする細胞画像が評価対象となり、当該未知な細胞を種類「CA」乃至「CD」の何れかに分類する場合、評価対象の特徴群情報のうち「とある領域」の各項目値(各特徴パラメータの値)に基づいて、評価対象情報が取得される。つまり、サンプルデータと同一形態の評価対象情報が取得される。
繰り返しになるが、特徴群情報における「とある領域」とは、分析モデルの種類に応じて、即ち、分析内容、分析手法、各種条件等に応じて、異なるものである。
ここで、特徴群情報のデータ量について考える。
特徴群情報の次元数N(データの容量)に特に制限がない場合には、細胞画像から得られるあらゆる特徴パラメータのあらゆる値の集合情報(以下、「全体情報」と呼ぶ)を、特徴群情報として採用することができる。
しかしながら、実際には、特徴群情報の次元数N(データの容量)に制限がある場合もある。このような場合には、細胞画像から得られるあらゆる特徴パラメータのあらゆる値の集合情報の一部を、特徴群情報として採用する必要がある。
一方で、情報量を絞り過ぎた特徴群情報では、高精度の分析の妨げになる。
つまり、考えられ得る全組合せの種類の集団情報の中から、分析内容、分析手法、各種条件等にとって好適な集団情報を含むような特徴群情報を生成する必要がある
図9は、特徴群情報として、分析評価のために抽出される要素の違いを説明するための模式図である。
例えば、図9の例では、細胞の種類「A」、「B」、及び「C」を分類する場合が想定されている。
図9(A)の例では、全体情報のうち、2個の細胞単体の特徴パラメータの値が、形としては恣意的に選抜され、時間方向ではランダムに抽出されたものが特徴群情報として採用されている。具体的には例えば、種類「A」の細胞の特徴群情報は、時間的に早いタイミングで撮像された細胞画像内の多数個の細胞(オブジェクト)から2個の細胞単体(オブジェクト)が恣意的に選抜され、当該2個の細胞単体の特徴パラメータの値が抽出されたものから生成されている。
この場合、同一の種類「A」であったとしても、1枚の細胞画像には多数の細胞オブジェクトが含まれており、特徴パラメータの値は夫々バラついている。従って、恣意的に抽出された2個の細胞単体の特徴パラメータの値は、種類「A」の代表値とは限らない。また、特徴パラメータの値は時間変化する場合もあり、ランダムな時間タイミングで抽出された2個の細胞単体の特徴パラメータの値が、種類「A」の代表的値とは限らない。
以上のことから、時間変化を考慮せずに、恣意的に選抜された幾つかの細胞単体の特徴パラメータの値のみを特徴群情報とした場合、細胞の種類「A」、「B」、及び「C」を精度よく分類することは困難な場合が多い。
そこで、例えば、1枚の細胞画像に含まれる細胞集団という観点と、時間変化という観点とに基づいて各特徴パラメータの値を抽出して、それらの集合体を特徴群情報とするよい。
例えば図9(B)の例では、全体情報のうち、形としては、細胞集団における特徴量の代表値が抽出され、時間的には、当該特徴量の代表値が定期的に抽出された場合の経時情報(時間方向の集合体)が、特徴群情報として採用される。
例えば図9(C)の例では、全体情報のうち、形としては、細胞集団における特徴量の情報全体が抽出され、時間的には、当該特徴量の情報全体が定期的に抽出された場合の経時情報(時間方向の集合体)が、特徴群情報として採用される。
ここで、図9に示すように、図9(A)→図9(B)→図9(C)に従って特徴群情報の情報量(次元Nの数)が増加していくことになる。
しかしながら、上述したように、特徴群情報の次元数N(データの容量)に制限がある場合が多い。このような制限に対応するためには、全体情報に対して、情報の整理と選抜により好適なパラメータの値を抽出して、図9(D)の例のような特徴群情報を生成する必要がある。
即ち、例えば図9(D)の例に示すように、全体情報のうち、形としては、細胞集団における特徴量のうち有効なものの強調と組合せによる加工がなされたものが抽出され、時間的には、当該細胞集団における特徴量のうち有効なものの強調と組合せによる加工がなされたものが定期的に抽出された場合の経時情報(時間方向の集合体)が、特徴群情報として採用される。
さらに、図10乃至図12を参照して、細胞集団における特徴量のうち有効なものの強調と組合せに基づく特徴群情報の生成手法について説明する。
図10は、細胞集団における特徴量のうち有効なものの強調と組合せに基づいて、細胞画像から生成された特徴群情報を模式的に示す図である。
図10の例では、同一種類の細胞集団が所定容器で培養され、時間と共に細胞数も増加するものとする。
つまり、図10には、細胞画像Gaには1つの細胞のみが図示され、細胞画像Gbには2つの細胞のみが図示され、細胞画像Gcには4つの細胞のみが図示されていようにみえるが、当然ながら、図10の細胞画像Gに示すように、実際には細胞集団が所定容器に含まれている。つまり、図10の細胞は、1個の細胞を示しているのではなく、時間毎に増加する割合(=1:2:4)を示している。
第1時刻で撮影された細胞画像Gaからは、特徴群情報Iaが得られている。特徴群情報Iaは、N種類の特徴パラメータ(要素)として、各細胞毎の形、動き、及び表面という3つの形態的特徴量と、細胞集団の集団情報とを少なくとも含んでいる。ここで、集団情報としては、平均値や分散値等の統計値や、ヒストグラムのビンの値等がある。
例えば、集団情報として、細胞集団の「形」のヒストグラムから得られる数値データIka、細胞集団の「動き」のヒストグラムから得られる数値データIua、及び、細胞集団の「表面」のヒストグラムから得られる数値データIhaが、特徴群情報Iaに含まれている。
ここで、各ヒストグラムを構成するビンのうち、ハッチングがかけられたビンが、特徴群情報Iaに含まれる情報(1つのビンを1つの要素とすれば、所定の1種類の特徴パラメータ)である。
ここで、細胞集団の「形」のヒストグラムでは、中央左側の3つのビンが、「形」を特徴づけるものである。換言すると、ヒストグラム全体では、「形」の特徴が薄らいでしまうため、「形」の特徴を「強調」すべく中央左側の3つのビンが抽出されている。
一方、「動き」の特徴を「強調」すべきビンとしては、「形」とは異なり、右側の5つのビンが抽出されている。また、「表面」の特徴を「強調」すべきビンとしては、「形」や「動き」とは異なり、両端の6つのビンが抽出されている。
これらの各特徴(形、動き、表面)毎に強調された情報(抽出されたビン)の夫々が、数値データIka、数値データIua、及び、数値データIhaの夫々である。
そして、これら数値データIka、数値データIua、及び、数値データIhaの「組合せ」により、特徴群情報Iaがつくられている。
第2時刻で撮影された細胞画像Gbからは、特徴群情報Ibが得られている。特徴群情報Ibは、N種類の特徴パラメータ(要素)として、各細胞毎の形、動き、及び表面という3つの形態的特徴量と、細胞集団の集団情報とを少なくとも含んでいる。
例えば、集団情報として、細胞集団の「形」のヒストグラムから得られる数値データIkb、細胞集団の「動き」のヒストグラムから得られる数値データIub、及び、細胞集団の「表面」のヒストグラムから得られる数値データIhbが、特徴群情報Ibに含まれている。
つまり、各特徴(形、動き、表面)毎に強調された情報(抽出されたビン)の夫々が、数値データIkb、数値データIub、及び、数値データIhbの夫々である。そして、これら数値データIkb、数値データIub、及び、数値データIhbの「組合せ」により、特徴群情報Ibがつくられている。
第3時刻で撮影された細胞画像Gcからは、特徴群情報Icが得られている。特徴群情報Icは、N種類の特徴パラメータ(要素)として、各細胞毎の形、動き、及び表面という3つの形態的特徴量と、細胞集団の集団情報とを少なくとも含んでいる。
例えば、集団情報として、細胞集団の「形」のヒストグラムから得られる数値データIkc、細胞集団の「動き」のヒストグラムから得られる数値データIuc、及び、細胞集団の「表面」のヒストグラムから得られる数値データIhcが、特徴群情報Icに含まれている。
つまり、各特徴(形、動き、表面)毎に強調された情報(抽出されたビン)の夫々が、数値データIkc、数値データIuc、及び、数値データIhcの夫々である。そして、これら数値データIkc、数値データIuc、及び、数値データIhcの「組合せ」により、特徴群情報Icがつくられている。
このように、各特徴(形、動き、表面)毎に、分布中の情報強調のパターン、即ちヒストグラム中のどのビンを抽出して強調するするのかというパターンは異なっている。
このようなパターンは、図10の例の3種類に限定されず、任意の種類を設定することができる。
図11は、分布中の情報強調のパターンの各種具体例を示している。
図11(A)は、ヒストグラムの全分布情報を用いるパターンを示している。
ここで、ヒストグラムとして、個数での絶対値情報(図11の細胞画像Gから得られた各個数をそのままヒストグラム化したもの)と、データベース内の標準値を用いた標準正規化情報(図11の細胞画像Gから得られた各個数を正規化してヒストグラム化したもの)との両者を選択的に採用することができる。
図11(B)は、ヒストグラムの平均値・中央値を用いるパターンを示している。
図11(C)は、ヒストグラム(分布)中の80%信頼区間以内の情報を用いるパターンを示している。
図11(D)は、ヒストグラム(分布)中の平均値より上の情報を用いるパターンを示している。
図11(E)は、分布中の80%信頼区間以外の情報を用いるパターンを示している。
特徴群情報の生成に際し(或いは後述するサンプルデータの抽出に際し)、これらの全パターンの中から、各特徴(形、動き、表面)にとって、或いは分析内容、分析手法、各種条件にとって最適な指標(パターン)と経時点の組合せが用いられる。なお、経時点については、図12を参照して後述する。
ここで、図10の特徴群情報Ia乃至Icの夫々は、図3の例でいえば、画像数値化部91において単一の細胞画像から作られた数値化情報であり、数値化情報蓄積部101に蓄積されるものである。
従って、図3を用いて上述したように、同一時間で同一条件の他の細胞画像(例えば複数のウェルの細胞画像)が存在するならば、複数画像特徴群情報生成部92により、当該他の細胞画像の特徴群情報と結合したり整理されたりし、その結果得られる第1単位の特徴群情報が第1特徴群情報蓄積部102に蓄積される。
ヘテロ性情報付加部93については、図12を参照して後述するものとして、経時変化情報付加部94の処理について説明する。
経時変化情報付加部94は、特徴群情報Ia乃至Icの夫々のうち、集団情報について、経時変化という点を考慮した加工(結合や整理等)をすることによって、第3処理単位の特徴群情報を生成する。
図12は、経時変化という点を考慮した集団データの加工手法の各種具体例を示している。
なお、上述の図12は、3つの異なるタイミングの細胞画像に基づく例とされているのに対して、この図12は4つの異なるタイミング(24h、48h、72h、及び96h)の細胞画像Ga,Gb,Gc,Gdに基づく例とされている。しかしながら、図12に示す各加工手法の考え方は図10の例にも同様に当てはまる。
図12の例では、先ず、標準化整理タイプAと、標準化整理タイプBとを選択的に採用することができるようになっている。
標準化整理タイプAとは、分布(ヒストグラム)として、上述の図11に示す、個数での絶対値情報(図11の細胞画像Gから得られた各個数をそのままヒストグラム化したもの)を採用するパターンである。
標準化整理タイプBとは、上述の図11に示す、データベース内の標準値を用いた標準正規化情報(図11の細胞画像Gから得られた各個数を正規化してヒストグラム化したもの)を採用するパターンである。
図12(A)は、図11(A)のヒストグラムの全分布情報を用いるパターンを採用した場合の、時刻t1乃至t5の経時変化を考慮した特徴群情報を模式的に示したものである。
図12(B)は、図11(B)のヒストグラムの平均値・中央値を用いるパターンを採用した場合の、時刻t1乃至t5の経時変化を考慮した特徴群情報を模式的に示したものである。
図12(C)は、図11(C)のヒストグラム(分布)中の80%信頼区間以内の情報を用いるパターンを採用した場合の、時刻t1乃至t5の経時変化を考慮した特徴群情報を模式的に示したものである。
図12(D)は、図11(D)のヒストグラム(分布)中の平均値より上の情報を用いるパターンを採用した場合の、時刻t1乃至t5の経時変化を考慮した特徴群情報を模式的に示したものである。
図12(E)は、図11(E)の分布中の80%信頼区間以外の情報を用いるパターンを採用した場合の、時刻t1乃至t5の経時変化を考慮した特徴群情報を模式的に示したものである。
次に、図13を参照して、図3のヘテロ性情報付加部93について具体的に説明する。
図13は、ヘテロ性情報付加という点を考慮した集団情報の加工手法の各種具体例を示している。
ヘテロ性情報付加とは、複数条件及び同一時間に撮像された複数の細胞画像の関係性を示す情報を付加することをいう。即ち、複数条件及び同一時間に撮像された複数の細胞画像から夫々得られた特徴群情報について、条件変化という点を考慮した加工(結合や整理等)をすることをいう。
図13には、同一種類Aの細胞(異なる3つの容器)に対して、培養条件A、培養条件B、及び培養条件Cが夫々課された上で、培養された例が示されている。
つまり、培養条件Aについては、時刻t1における特徴群情報IgAt1,時刻t2における特徴群情報IgAt2,時刻t3における特徴群情報IgAt3がまとめられて(加工されて)、特徴群情報IgAが構成される。
同様に、培養条件Bについては、時刻t1における特徴群情報IgBt1,時刻t2における特徴群情報IgBt2,時刻t3における特徴群情報IgBt3がまとめられて(加工されて)、特徴群情報IgBが構成される。
培養条件Cについては、時刻t1における特徴群情報IgCt1,時刻t2における特徴群情報IgCt2,時刻t3における特徴群情報IgCt3がまとめられて(加工されて)、特徴群情報IgcC構成される。
さらに、培養条件Aの特徴群情報IgA,培養条件Bの特徴群情報IgB,培養条件Cの特徴群情報IgCの夫々が高次情報にまとめられて、特徴群情報Ig1が構成される。
つまり、培養条件という条件変化という点を考慮したヘテロ性情報が付加されたことになる。
さらに、高次情報における優先順位付けが行われて、細胞品質(ここでは細胞Aの品質)を表現する高次元情報としての特徴群情報Ig2が得られる。
所定の1条件の所定の1時刻の特徴群情報(例えば培養条件Aの時刻t1の特徴群情報IgAt1)と比較すると、特徴群情報Ig2は、ヘテロ性情報付加及び経時変化が考慮されている点で、細胞Aの品質をより良く表した情報となっている。
なお、図13の例では、経時変化を考慮した加工(結合や整理等)の後、ヘテロ性情報付加が行われているように説明したが、各時刻t1乃至t3毎にヘテロ性情報付加をした後に、それらをまとめるといった経時変化を考慮した加工(結合や整理等)をしてもよい。
つまり、図3の機能ブロック図は、後者の例の機能ブロック図となっているが、図13に併せて、経時変化情報付加部94とヘテロ性情報付加部93との配置順番を入れ替えても良い。
図14は、このようにして、ヘテロ性情報付加及び経時変化を考慮した加工がなされた各細胞品質を表す特徴群情報について、240種類集めたもの、即ち複数の細胞の品質を表す特徴群情報の一例を示している。
即ち、図14の例では、所定の1列が、1つの種類の細胞品質を表現する高次元情報としての特徴群情報となっている。
なお、図14の例では、240種類の細胞品質を表現する高次元情報を単に並べたものではなく、後述するクラスタリング等によって高次情報の類似度が近いもの同士が近くなるように配置されたものである。そういった点で、類似度の近い/遠いを示す分岐図は分析モデルの一種であると把握することもできるし、そのように把握した場合、図14のデータは、当該分析モデルを導出したサンプルデータ群と把握することもできる。
以上、図10乃至図14を参照して、特徴群情報の生成の一連の流れの具体例について説明した。
次に、図15乃至図27を参照して、当該特徴群情報からサンプルデータを生成して、当該サンプルデータを用いて分析モデルを生成するまでの一連の流れについて具体的に説明する。
図15は、従来のサンプルデータと、本実施形態の特徴群情報から生成されるサンプルデータとの違いを示す図である
図15の例のサンプルデータは、細胞品質変化を予測するための分析モデルを生成するために用いられるものとする。
従来においても、本発明者らは、細胞集団の特徴の経時変化を考慮したサンプルデータP12を用いていた。ただし、サンプルデータP12は、各時刻の細胞画像Gから得られる、細胞集団の細胞形態の平均値の各時刻のデータ群P11を単に時系列順に並べられものである。
これに対して、本実施形態では、細胞集団の細胞形態の分布(ヒストグラム)から、図11に示す各パターン毎の情報が各時刻毎に抽出された集合体P21が得られる。当該集合体P21に基づいて特徴群情報P22が生成される。そして、当該特徴群情報P22がまとめられ(必要に応じて整理や加工がされて)、高次元の特徴群情報P23が得られる。
この特徴群情報P23から、任意の個数の任意の組合せのデータをサンプルデータとして採用することができる。
図16は、細胞品質変化を予測するための分析モデルの生成に用いるサンプルデータの一例を示している。
図16の例では、品質A乃至Eの夫々についてのサンプルデータの一例が示されている。
図16において、少数特徴量情報P1とは、図15の従来のサンプルデータP12に対応するものである。
高次元特徴量情報P2とは、図15の本実施形態の高次元の特徴群情報P23に対応するものである。
図17は、図16のサンプルデータを用いて細胞品質変化を予測したときの予測精度を示している。
「細胞形態の平均」とは、図16の少数特徴量情報P1(図15の従来のサンプルデータP12)を用いた場合の予測精度を示している。
「標準化タイプA」とは、図16の高次元特徴量情報P2(図15の高次元の特徴群情報P23)のうち、図12(A)のヒストグラムの全分布情報を用いるパターンの時系列情報の部分をサンプルデータとして抽出し、当該サンプルデータを用いた場合の予測精度を示している。
「標準化タイプB」とは、図16の高次元特徴量情報P2(図15の高次元の特徴群情報P23)のうち、図12(B)のヒストグラムの平均値・中央値を用いるパターンの時系列情報の部分をサンプルデータとして抽出し、当該サンプルデータを用いた場合の予測精度を示している。
「標準化タイプC」とは、図16の高次元特徴量情報P2(図15の高次元の特徴群情報P23)のうち、図12(C)のヒストグラム(分布)中の80%信頼区間以内の情報を用いるパターンの時系列情報の部分をサンプルデータとして抽出し、当該サンプルデータを用いた場合の予測精度を示している。
「標準化タイプD」とは、図16の高次元特徴量情報P2(図15の高次元の特徴群情報P23)のうち、図12(D)のヒストグラム(分布)中の平均値より上の情報を用いるパターンの時系列情報の部分をサンプルデータとして抽出し、当該サンプルデータを用いた場合の予測精度を示している。
「標準化タイプE」とは、図16の高次元特徴量情報P2(図15の高次元の特徴群情報P23)のうち、図12(E)の分布中の80%信頼区間以外の情報を用いるパターンの時系列情報の部分をサンプルデータとして抽出し、当該サンプルデータを用いた場合の予測精度を示している。
図17の例では、標準化タイプEが最も予測精度が良いことがわかる。
つまり、本実施形態では、高次元の特徴群情報P23から、任意の個数の任意の組合せ(全個数含む。つまり高次元の特徴群情報P23そのものを含む)の情報群をサンプルデータとして用いることができる。
従って、所定の分析モデルを生成するに際し、その分析モデルが用いられる分析内容、分析手法、各種条件等に適合したサンプルデータ(図17の例では標準化タイプE)を見つけることができれば、当該サンプルデータを用いて、分析内容、分析手法、各種条件等に適合した分析モデルを生成することが可能になる。
このようにして、図17の標準化タイプEのサンプルデータを用いて生成された分析モデルにより、実際に細胞品質変化を予測した結果が図18に示されている。
図18において、行方向は正答のラベルを示し、列方向は分析結果のラベルを示している。
所定種類(品質)の細胞・所定細胞培養条件の組に対して、55回の分析が行われ、その分析結果が四角印で示されている。つまり、正答のラベルと分析結果のラベルが一致する項目に、分析結果の四角印が付されている場合、予測が成功したことを示している。
図18に示すように、非常に高精度の予測ができていることがわかる。
図19は、図15乃至図18で説明した例とは別の所定の分析モデルの生成に用いられる、複数のサンプルデータの一例を示している。
複数のサンプルデータIga乃至Igjは、上述したように、イメージデータではなく数値化データであり、具体的にはM種類のパラメータを要素として含む多次元情報である。
ここで、サンプルデータを構成する1要素の数値単体も、細胞の形態的特徴量等を示す値であり、有意情報である。
しかし、これらの各要素の組合せからなるサンプルデータIga乃至Igjは全体として、他のサンプルデータとの比較においてさらに特徴的な有意情報となる。
図19の例では、各要素はその値に応じた色や濃度で夫々表されており、これらの各要素の色や濃度の集合として形成される「模様」が、各サンプルデータIga乃至Igjの特徴をよく表す有意情報となっていることがわかる。
ここで、複数のサンプルデータIga乃至Igjの夫々に対して、所定の観点で総合的なスコアが与えられるものとする。
所定の観点は特に限定されないが、説明の便宜上例えば、細胞の種類を種類Aと種類Bとを分類するという観点が採用されているものとする。そして、スコアが100に近くなる程、種類Aに特有な特徴を多く含んでいる(種類Bに特有な特徴は少なくなっている)ものとする。逆に、スコアが0に近くなるほど種類Bに特有な特徴を多く含んでいる(種類Aに特有な特徴は少なくなっている)ものとする。
つまり、図19の例では、サンプルデータIgaは、スコアが「90」と最高値のため、種類Aに特有な特徴を多く含むデータである。逆に、サンプルデータIge乃至Ighは、スコアが「0」と最低値のため、種類Bに特有な特徴を多く含むデータである。サンプルデータIgiは、スコアが「50」と中央値のため、種類Aに特有な特徴も含むし、種類Bに特有な特徴を含むデータである。
なお、複数のサンプルデータIga乃至Igjの夫々に対してスコアの与え方は、特に限定されない。
例えば複数のサンプルデータIga乃至Igjの夫々に対して、対応する評価対象情報(破壊テスト等別評価で得られた既知情報)が図2の細胞評価DB62に格納されている場合、当該評価対象情報に基づいてスコアを与える手法を採用してもよい。
図20は、このような図19のサンプルデータIga乃至Igjを用いて、所定の分析モデルを生成する手法の2つの例を示している。
具体的には上記の例にあわせると、図20の例は、細胞の種類を種類Aと種類Bに分類するための分析モデルの生成例になる。
図20(A)は、機械学習を用いた分析モデルの生成例である。
図20(A)の例では、分析モデル生成部44は、複数のサンプルデータIga乃至Igjを用いて機械学習を実行することにより、サンプルデータのM個のパラメータの各値Xを入力パラメータとしてスコアYを出力する関数(同図の例では、Y=aX+bX+cX)を生成又は更新する。
ここで、未知の種類の細胞を被写体として含む細胞画像から特徴群情報が生成されて、特徴群情報DB61(図2)に格納されたものとする。
評価対象情報取得部46は、当該特徴群情報から、サンプルデータIga乃至Igjと同形態(M個のパラメータが同一)のデータを、評価対象情報として評価対象情報取得部46から取得する。
この場合、分析部47は、評価対象情報のM個のパラメータの各値Xを入力パラメータとして上記関数に代入することで、評価対象情報のスコアYを算出する。
当該評価対象情報のスコアYが100に近い場合、当該評価対象情報に対応する細胞は、種類Aの可能性が高いと分析されたことになる。
当該評価対象情報のスコアYが0に近い場合、当該評価対象情報に対応する細胞は、種類Bの可能性が高いと分析されたことになる。
当該評価対象情報のスコアYが中間値の場合、当該評価対象情報に対応する細胞は、種類Aとも種類Bとも判断できないと分析されたことになる。
つまり、「評価対象情報のM個のパラメータの各値Xを入力パラメータとして、当該評価対象情報のスコアYを出力する関数」は、細胞の種類を種類Aと種類Bに分類するための分析モデルの一例である。
図20(B)は、クラスタリング手法を用いた分析モデルの生成例である。
図20(B)の例では、分析モデル生成部44は、複数のサンプルデータIga乃至Igjを、所定のアルゴリズムを用いてクラス分類する。クラス分類の結果できるクラスの種類や個数は、複数のサンプルデータIga乃至Igjや所定のアルゴリズムに依存するが、ここでは、3つのクラスCA,CB,CNに分類されたものとする。
ここで、図20(A)の上述の例と同様に、未知の種類の細胞を被写体として含む細胞画像から特徴群情報が生成されて、特徴群情報DB61(図2)に格納されているものとする。
評価対象情報取得部46は、当該特徴群情報から、サンプルデータIga乃至Igjと同形態(M個のパラメータが同一)のデータを、評価対象情報として評価対象情報取得部46から取得する。
この場合、分析部47は、当該評価対象情報を3つのクラスCA,CB,CNのうちの何れかに分類する。
当該評価対象情報がクラスCAに分類された場合、当該評価対象情報に対応する細胞は、種類Aの可能性が高いと分析されたことになる。
当該評価対象情報がクラスCBに分類された場合、当該評価対象情報に対応する細胞は、種類Bの可能性が高いと分析されたことになる。
また、当該評価対象情報がクラスCNに分類された場合、当該評価対象情報に対応する細胞は、種類Aとも種類Bとも判断できないと分析されたことになる。
つまり、「評価対象情報を3つのクラスCA,CB,CNのうちの何れかに分類するモデル」が、細胞の種類を種類Aと種類Bに分類するための分析モデルの一例である。
ここで、クラス分類の手法は特に限定されず、例えば、サンプルデータIga乃至Igjの夫々と評価対象情報との類似度等を夫々求め、類似度等に基づいて当該評価対象情報を分類する、という手法を採用することもできる。この手法が採用された場合、「複数のサンプルデータIag乃至Igと、これらに基づいて生成された3つのクラスCA,CB,CN」により分析モデルは表される。
なお、図20(B)では、説明の便宜上、単純なクラス分類の話をした。
実際の分析モデルは、例えば図21に示すような、各サンプルデータに基づく領域(図21の楕円状の実線の領域)が積み重なって表される。
即ち、図21は、分析モデルの表現形態の一例を示している。
この分析モデル内の丸印は、サンプルデータ又は評価対象情報を示す。
評価対象情報qaは、種類Aの全細胞のサンプルデータに基づく領域内に含まれている。従って、当該評価対象情報qaに対応する細胞は、種類Aの可能性が非常に高いと分析されたことになる。
評価対象情報qbは、種類Aの多くの細胞のサンプルデータに基づく領域内に含まれている。従って、当該評価対象情報qbに対応する細胞は、種類Aの可能性が高い(ただし、評価対象情報qaと比較すると低い)と分析されたことになる。
一方、評価対象情報qcは、種類Bの全細胞のサンプルデータに基づく領域内に含まれている。従って、当該評価対象情報qcに対応する細胞は、種類Bの可能性が非常に高いと分析されたことになる。
評価対象情報qdは、種類Bの多くの細胞のサンプルデータに基づく領域内に含まれている。従って、当該評価対象情報qcに対応する細胞は、種類Bの可能性が高い(ただし、評価対象情報qcと比較すると低い)と分析されたことになる。
また、評価対象情報qeは、種類Aの細胞のサンプルデータに基づく領域と、種類Bの細胞のサンプルデータに基づく領域との重複領域に含まれている。従って、評価対象情報qeに対応する細胞は、種類Aとも種類Bとも判断できないと分析されたことになる。
以上説明したように、細胞に関する分析は、分析内容、分析手法、各種条件等という点で多岐に渡る。従って、分析内容、分析手法、各種条件等に適合したサンプルデータや評価対象情報を用いる必要があり、本実施形態ではこれを可能にしている。
換言すると、本実施形態のサンプルデータは、特徴群情報を単にそのまま抽出したものではなく、分析内容、分析手法、各種条件等に適合するように、その形態(パラメータ数Mやパラメータの種類の組合せ等)が変化する。
そして、分析内容、分析手法、各種条件等に適合する1以上のサンプルデータから、分析モデルが生成される。従って、当該分析モデルもまた、分析内容、分析手法、各種条件等に適合するものとなっている。
そして、未知の細胞に関する分析が行われる場合、当該未知の細胞のデータとしては、サンプルデータと同一形態の評価対象情報が評価対象情報取得部46により取得される。つまり、分析内容、分析手法、各種条件等に適合した評価対象情報が取得される。
分析部47は、分析内容、分析手法、各種条件等に夫々適合した評価対象情報と分析モデル(サンプルデータ)とを用いて、当該未知の細胞に関する分析処理を実行する。
このようにして、分析内容、分析手法、各種条件等の違いによらず、未知の細胞に関する分析が容易かつ適切に行われる。
つまり、
さらに以下、分析部47による分析処理と、出力情報生成部48から出力される出力情報とについて、さらに詳しく説明する。
ここで、サンプルデータは、上述したように、M種類のパラメータ(各種の特徴パラメータや各種の付帯パラメータ)の数値の集合体、即ち数値化情報である。従って、複数のサンプルデータの集合体から生成される分析モデルもまた、数値化情報として表現することは容易である。
また、分析対象の細胞についても、評価対象情報が用いられる。この評価対象情報は、サンプルデータと同一形態の数値化情報である。
従って、このような評価対象情報と分析モデル(サンプルデータ)を利用した分析処理の結果を示す出力情報を、数値化情報の羅列(リスト等)で生成することは容易である。
しかしながら、細胞に関する分析を依頼したユーザにとっては、このような数値化情報の羅列(リスト等)だけが提示されても、分析結果等を容易に認識することはできない。
つまり、ユーザへの出力形態としては、数値化情報の羅列(リスト等)のみでは不十分であり、視認しやすい形態もあると好適である。
このようなユーザにとって視認しやすい出力形態を可能にするためには、分析モデルの表現形態が重要になってくる。
例えば上述の図21に示す分析モデルの表現形態、即ち、各サンプルデータに基づく領域(図21の楕円状の実線の領域)を積み重ねて分析モデルを表す形態は、ユーザにとって視認しやすい出力形態の一例である。
図22は、分析モデルの表現形態の一例であって、図21とは異なる例を示す図である。
図22の例では、所定の2軸(X軸、Y軸)から構成される平面上に、各サンプルデータが点としてプロットされている。各サンプルデータは、自己が属するグループに応じて色分け(同図では異なるハッチングで分類)されている。つまり、同色のサンプルデータが分布する周辺領域が、当該色に対応するグループの領域を示している。
例えば、同図中第4象限においては、サンプルデータSAの付近には、第1色(同図では間隔が一番狭い斜線)のサンプルデータが集中している。
つまり、同図中第4象限の領域は主に、第1色に対応する第1グループの領域であるといえる。
同様に、同図中第1象限の領域(サンプルデータSBの周辺領域)は主に、第2色(同図では間隔が2番目に狭い斜線)に対応する第2グループの領域であるといえる。
Y軸の正側の周辺領域(サンプルデータSCの周辺領域)は主に、第3色(同図では間隔が一番広い斜線)に対応する第3グループの領域であるといえる。
X軸の負側の周辺領域(サンプルデータSDの周辺領域)は主に、第4色(同図では白抜き)に対応する第4グループの領域であるといえる。
さらに、評価対象情報qも、図22の分析モデルを示す平面上にプロットすることが可能である。
これにより、ユーザは、評価対象情報qの配置位置はY軸の正側の周辺領域であるので、評価対象情報qに対応する細胞は第3グループに属する可能性が高い、と容易かつ即座に視認することができる。
ここで、サンプルデータや評価対象情報の各プロットの表現形態(色やシンボルの形状等)は、任意に可変できる。さらに、同一の細胞画像群から得られたサンプルデータであれば、分析内容、分析手法、各種条件等に応じて任意に表現形態を可変することができる。
例えば細胞の種類を分類するための分析モデルを表現する場合、各プロット点を種類毎に色分けをするという表現形態を採用することができる。
一方、例えば細胞の状態を判断するための分析モデルを表現する場合、各プロット点を状態毎にシンボルの形状を変えるという別の表現形態を採用することができる。例えば状態が、「良」では「〇」(丸印)となり、「中」では「△」(三角印)となり、「悪」では「△」になるような表現形態を採用することができる。
この場合、ユーザは、プロット点の色を見比べることで細胞の種類を比較することが容易かつ即座にできるし、プロットのシンボルの形状を見比べることで細胞の状態を比較することが容易かつ即座にできる。
さらにまた、X軸とY軸は任意の可変軸であり、ユーザの操作等により、容易に変更することが可能である。
具体的には、上述したように、サンプルデータ及び評価対象情報は、M種のパラメータを要素とする、M次元の多次元情報であると把握することができる。
従って、サンプルデータや評価対象情報のM種のパラメータに基づいて、2個の要素X,Yを生成するだけで、図22の平面へのプロット点が容易に決定される。
ここで、X軸とY軸とは、特に限定されず、任意でよい。
例えば、サンプルデータや評価対象情報のM次元のうち任意の2次元の軸をそのまま、X軸とY軸として採用することもできる。
また例えば、M次元のうち、任意の数の任意の次元を組合せて新たなX軸を生成し、それとは独立して、任意の数の任意の次元を組合せて新たなY軸を生成することもできる。
さらに、分析モデルの表現形態は、2次元空間である必要は特になく、任意の次元の空間でよい。
例えば図23は、分析モデルの表現形態の一例であって、図21や図22とは異なる例を示す図である。
即ち、分析モデルは、図21や図22の例では2次元空間で表されていたのに対して、図23の例では3次元空間で表されている。
ここで、3次元空間を構築する3軸については、2次元の場合と全く同様に、任意の可変軸であり、ユーザの操作等により、容易に変更することが可能である。
次元の削減は、原則として、元の情報に対する情報量削減(欠落)を意味している。つまり、図21乃至図23の何れの空間も、サンプルデータのM種のパラメータからなるM次元空間(Mが4以上の場合)が射影等されたものであり、元のサンプルデータに対して何らかの情報が欠落した空間となっている。従って、図21や図22の2次元空間と比較して、図23の3次元空間では、その次元数が多い分だけ情報の欠落量も少なくなるため、より多くの情報量をユーザは容易かつ即座に得ることができる。
さらにまた、分析モデルの表現形態は、サンプルデータや評価対象情報が点としてプロットされる空間である必要は特になく、サンプルデータや評価対象情報の類似度が視認可能な形態であれば足りる。
ここで、2つのデータの類似度は、例えば2つのデータ間の距離として表すことができる。つまり、距離が近いデータ程類似していることになる。
このような距離感を容易に視認可能な表現形態が空間上の点(プロット)であることから、先ず、上述の図21乃至図23の分析モデルの表現形態について説明した。
次に、サンプルデータや評価対象情報の類似度が容易に視認可能となる別の表現形態について、図24を参照して説明する。
図24は、分析モデルの表現形態の一例であって、図21乃至図23とは異なる例を示す図である。
図24の例では、終端がある1本の線が、1つのデータを表している。
つまり、複数のサンプルデータの夫々を示す各線の集合体(以下、線を「枝」と呼び、枝の集合体の表現形態を「枝分岐図」と呼ぶ)は、当該複数のサンプルデータを用いて生成された分析モデルを表している。
上述したように、距離が近いほど類似しているので、距離が近い枝の集合体を、1つのグループとして把握することができる。
ここで、図22に示されるように枝の分岐ポイントが幾つか存在するので、枝の分岐ポイントの単位毎に、階層化したグループを生成することも容易にできる。
例えば図24の例では、第1階層においては、通常細胞と老化細胞に分類される。
さらに、夫々の第2階層においては、培養条件の違いにより複数のグループに分類されている。
さらに、評価対象情報qも、図24の分析モデルを表す枝分岐図に対して、1つの枝としてプロットすることが容易に可能である。
これにより、ユーザは、枝分岐図における評価対象情報qの枝のプロット位置から、評価対象情報qに対応する細胞は、通常細胞のうち培養条件Aのグループに属する可能性が高い、と容易かつ即座に視認することができる。
ここで、注意すべきは、図21乃至図24の例は、あくまでも各サンプルデータ(分析モデルの概要)と、評価対象情報との位置関係を、ユーザが容易に視認可能になるという観点で表現したものである。
つまり、上述したように、サンプルデータと評価対象情報とは、本来M次元の多次元情報である。このM次元を2次元や3次元に圧縮した空間として表現されたものが、図21乃至図24の例である。
つまり、図2の分析部47は、実際には、2次元や3次元のデータによる類似度を演算するのではなく、M次元の各サンプルデータと、M次元の評価対象情報との類似度を演算している。
ただし、説明の便宜上M=3として、各サンプルデータと評価対象情報との類似度の演算手法の概要について、図25乃至図27を参照して説明する。
つまり、図25乃至図27の例ででは、たまたまM=3次元の空間になったに過ぎず、本来的には図23の3次元空間とは異なるものである点に注意を要する。
図25は、サンプルデータ及び評価対象情報の生成の基になる特徴群情報の構成例を示している。
図25において、同図中横方向の項目は、所定細胞の細胞集団における所定観点(平均値、バランス、分布の形)での各要素(特徴パラメータ)を示している。即ち、サンプルデータの基になる特徴群情報には、図中横方向の各項目の値が、各要素の値として夫々含まれている。
同図中縦方向の項目は、所定細胞における個々の要素(特徴パラメータ)を示している。即ち、サンプルデータの基になる特徴群情報には、図中縦方向の各項目の値が、各要素の値として夫々含まれている。
なお、図25の例では、所定容器で培養される同一種類の細胞集団を被写体として、所定の時刻に撮像された細胞画像についての、特徴群情報ICtが示されている。
この特徴群情報ICtは、細胞集団における所定観点の要素を示す横軸と、細胞の個々の要素を示す縦軸とからなる2次元空間の情報として構成されている。
ここで、単位情報Iuは、所定細胞についての、所定時刻における、当該所定細胞の個についての特徴パラメータの値群(縦軸の情報群)と、当該所定細胞を含む細胞集団における所定観点での特徴パラメータの値群(横軸の情報群)とに基づいて生成された情報である。
このような単位情報Iuを利用することで、所定細胞についての、所定時刻における、所定観点での細胞集団における位置付けを把握することができる。
例えば図25の左上端の斜線が引かれた単位情報Iuからは、細胞1(所定細胞)の各特徴パラメータの値(例えば長さ)についての、所定時刻における、集団細胞の各特徴パラメータの平均値といった観点(例えば集団全体の長さの平均値という観点)での比較が可能になる。
ここで、同一容器に含まれる細胞集団に対しては、時間方向にn回(時刻t1乃至時刻tnの夫々)に分けて細胞画像がその都度撮像されるものとする。
この場合、図25の特徴群情報ICtは、同一容器に含まれる細胞集団に対して、所定の時刻tk(kは、1乃至nの範囲内の任意の整数値)に撮像された細胞画像の様子を示すものである。
つまり、図26に示すように、同一容器に含まれる細胞集団に対して、時刻t1乃至tnの夫々に撮像された細胞画像の様子を示す、n個の特徴群情報ICt1乃至ICtnが得られる。
これらn個の特徴群情報ICt1乃至ICtnを時間方向に順次積層することで、特徴群情報ICが構成される。
つまり、細胞の個々の情報を示す縦軸、細胞集団の所定観点での情報を示す横軸、及び時間変化を示す奥行軸で構成される3次元空間に、単位情報Iuが1以上配置された情報群が、特徴群情報ICである。
ここで、単位情報Iuの形態は、特に限定されないが、説明の便宜上、「有意情報(1)」であるか、「有意情報でない(0)」のかを示す2値を取る形態とする。
例えば、細胞の種類を分類する等の所定の分析内容が使われる場合において、各単位情報Iuにおける各要素(各種特徴パラメータ)の値の中に、細胞の種類を分類する際に支援となる値が含まれている可能性がある。このような値が含まれていれば、当該単位情報Iuは「有意情報(1)」となる。一方、細胞の種類を分類する際に支援となる値が含まれていなければ、当該単位情報Iuは「有意情報でない(0)」となる。
つまり、同一容器に含まれる同一種類の細胞であっても、個々の細胞の特徴、細胞集団の中での所定観点での位置付け、時間変化等に応じて、「有意情報(1)」になる場合もあるし、「有意情報でない(0)」となる場合もある。
分析モデル生成部44(図2)は、同一容器に含まれる同一種類の細胞について時刻t1乃至tnの夫々に撮像されたn枚の細胞画像を1つの単位として、1つの特徴群情報ICを構築し、その1単位の特徴群情報ICの中から、「有意情報(1)」となる単位情報Iuのみを抽出する。
分析モデル生成部44は、このようにして抽出した複数個の単位情報Iuの集合体を、サンプルデータとして生成する。
ここで、単位情報Iuは、図26に示すように、特徴群情報ICを構築する3次元空間上の位置座標、つまり3次元情報で表すことができる。
即ち、図27に示すように、特徴群情報Icを構築する3次元空間上に夫々配置された、「有意情報(1)」の単位情報Iu(図27ではハッチングが付された単位情報Iu)の集合体が、サンプルデータになる。
例えば、図27の右上のサンプルデータICS1が、種類Aを示すものであるとする。また例えば、図27の中央下のサンプルデータICS2が、種類Bを示すものであるとする。
つまり、これらサンプルデータICS1,ICS2等の集合体が、細胞の種類を種類Aと種類Bに分類する分析モデルとなる。
換言すると、単位情報Iuとは、図25の例でいえば、所定細胞単体の10個の要素(特徴パラメータ)と、集団情報の所定観点の10個の要素(特徴パラメータ)とを少なくとも含む特徴群情報が基礎となっている。これの各要素が、「有意情報(1)」か「有意情報でないか(0)」の観点でまとめられて、「有意情報(1)」の単位情報Iuが夫々、特徴群情報ICを構築する3次元空間上の位置座標、つまり3軸の要素で表されるようになったものである。
即ち、少なくとも20次元以上の特徴群情報から3次元のサンプルデータが抽出されたことと等価になる。
ここで、同一容器に含まれる未知の種類の細胞集団についても、時刻t1乃至tnの夫々に撮像されたn枚の細胞画像が1単位となり、この1単位が分析対象として与えられたものとする。
この場合、評価対象情報取得部46は、上述のサンプルデータICS1,ICS2と全く同様の手法で構築されるデータを、図27の左上に示す評価対象情報Ictとして取得する。
分析部47は、評価対象情報IctとサンプルデータICS1との距離を算出することで類似度を求める。同様に、分析部47は、評価対象情報IctとサンプルデータICS2との距離を算出することで類似度を求める。
距離の算出手法は、特に限定されず、例えばユークリッド距離やマハラノビスの距離の手法を採用することができる。
図27の例では、評価対象情報IctとサンプルデータICS2との距離の方が、評価対象情報IctとサンプルデータICS1との距離よりも近いので、評価対象情報IctはサンプルデータICS2に類似していると判断される。
即ち、評価対象情報Ictに対応する細胞は、サンプルデータICS2が示す種類Bの可能性が高いと分析されたことになる。
出力情報生成部48は、このようにして分析部47により分析された結果と、評価対象情報取得部46により取得された評価対象情報とを含む出力情報を生成して、出力部16や外部装置81に出力する。
図28は、出力情報を示す画面の一例を示している。
図28の例の画面G0には、分析対象の細胞(培養中の細胞)の種類等の分析結果が、数値を羅列したリストだけではなく、ユーザに視認しやすい所属スペースマップや所属マップとして表示される。
所属スペースマップは、図23を用いて上述したように、任意の軸の3次元空間上に、各種サンプルデータと、分析対象の細胞(培養中の細胞)を示す評価対象情報とを点でプロットしたマップである。図28の例では「Query」と記載されたプロット点(丸印)が、評価対象情報を示している。
画面G0においては、図29に示すように、所属スペースマップの代わりに、所属マップを表示させることも可能である。
所属マップは、図23を用いて上述したように、各種サンプルデータを1つの枝(線)と見立てて、近い枝ほど類似している様子を示す枝分岐図である。図27の例では「Query」と記載されたプロット点(丸印)が、評価対象情報を示している。
このように、ユーザは、所属スペースマップや所属マップをみるだけで、評価対象の細胞の分析結果(どのような種類に属する可能性が高いのか等)を即時かつ容易に視認することができるので、便宜である。
その他特徴的なことは、分類結果を確率(可能性)で提示していることである。
つまり、種類Aと断定するのではなく、種類Aのサンプルとの類似度(種類Aになる確率)という観点で提示している。
これにより、ユーザにとってはより正確で有意な情報が得られる。例えば、上述したように、種類Aと種類Bの両方の可能性がある場合に、種類Aの可能性が少し高いだけなのに種類Aと断定された結果が提示されたとする。この場合、実際には種類Bであるとすると間違った分析結果を伝えたことになり、ユーザにとって後々困ったことが起こり得る。
これに対して、本実施形態では、種類Aと種類Bの両方の可能性があることが提示される。これにより、種類Bとなる可能性も考慮してユーザは検討できるので、実際に種類Bであった場合にも容易に対処することができる。
別な特徴的なこととしては、種類(細胞腫)を示す「評価確率」のみならず、「相同性スコア」も提示していることである。
即ち、説明の便宜上、細胞の種類を分類する分析手法を主に説明してきたが、サンプルデータと評価対象情報を同様に比較して分析することにより、「由来」の類似度も出力することが可能である。この「由来」の類似度が、相同性スコアである。
例えばランキング2位と3位のサンプルデータを比較すると、評価確率(種類の類似度)は2位のサンプルデータが「78」であるのに対して、3位のサンプルデータが「75」と大差ない。しかしながら、相同性スコア(由来の類似度)では、2位のサンプルデータが「80」であるのに対して、3位のサンプルデータが「70」と差が大きい。従って、ユーザは、分析対象の細胞の「由来」は、「脂肪」ではなく「骨髄」であるとある程度判断することが容易にできる。
以上本発明の一実施形態について説明したが、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものである。
換言すると、本発明が適用される細胞分析用データ生成装置は、次のような構成を取れば足り、その実施の形態は特に限定されない。つまり、上述の細胞分析装置1は、細胞分析用データ生成装置の一例である。
つまり、本発明が適用される細胞分析用データ生成装置は、
複数の細胞からなる細胞集団を被写体として撮像された細胞画像の中から、所定条件により選定された1枚以上の細胞画像を単位として、前記単位に含まれる1以上の細胞画像のデータに基づいて、
前記細胞の単体の形態的特徴又は前記細胞集団の形態的特徴に関するN種類(Nは1以上の整数値)の特徴パラメータの値を含む情報を、特徴群情報として生成する特徴群情報生成手段(例えば図2の特徴群情報生成部42)と、
細胞に関する所定の分析を行うときに用いる情報として、前記特徴群情報に含まれる前記N種類の特徴パラメータのうち少なくとも1種類に基づいて、M種類(MはNとは独立した整数値)のパラメータの値から構成される情報(例えば分析モデル生成時のサンプルデータ、当該分析モデルを用いて分析される対象の評価対象情報)を取得する情報取得手段(例えば分析モデル生成部44や評価対象情報取得部45)と
を備える細胞分析用データ生成装置である。
これにより、各種の分析モデル毎に適合する細胞分析用情報を効率的に生成することができる。
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば汎用のパーソナルコンピュータであってもよい。
このようなプログラムを含む記録媒体は、ユーザにプログラムを提供するために装置本体とは別に配布される図1のリムーバブルメディア31により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成される。リムーバブルメディア31は、例えば、磁気ディスク(フロッピディスクを含む)、光ディスク、又は光磁気ディスク等により構成される。光ディスクは、例えば、CD−ROM(Compact Disk−Read Only Memory),DVD(Digital Versatile Disk)等により構成される。光磁気ディスクは、MD(Mini−Disk)、等により構成される。また、装置本体に予め組み込まれた状態でユーザに提供される記録媒体は、例えば、プログラムが記録されている図3のROM112,図5のROM212や、図2の記憶部118,図5の記憶部216に含まれるハードディスク等で構成される。
なお、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理をも含むものである。
1・・・細胞分析装置、11・・・CPU、16・・・出力部、18・・・記憶部、31・・・リムーバブルメディア、41・・・細胞画像入力部、42・・・特徴群情報生成部、43・・・ノイズ除去部、44・・・分析モデル生成部、45・・・評価対象情報取得部、46・・・評価対象情報取得部、47・・・分析部、48・・・出力情報生成部、61・・・特徴群情報DB、62・・・細胞評価DB、63・・・分析モデル保持部、81・・・外部装置、82・・・前処理装置、91・・・画像数値化部、92・・・複数画像特徴群情報生成部、93・・・ヘテロ性情報付加部、94・・・経時変化情報付加部、95・・・特徴群情報出力部95、101・・・数値化情報蓄積部、102・・・第1特徴群情報蓄積部、103・・・第2特徴群情報蓄積部、104・・・第3特徴群情報蓄積部104

Claims (5)

  1. 複数の細胞からなる細胞集団を被写体として撮像された細胞画像の中から、所定条件により選定された1枚以上の細胞画像を単位として、前記単位に含まれる1以上の細胞画像のデータに基づいて、前記細胞の単体の形態的特徴又は前記細胞集団の形態的特徴に関するN種類(Nは1以上の整数値)の特徴パラメータの値を含む情報を、特徴群情報として生成する特徴群情報生成手段と、
    細胞に関する所定の分析を行うときに用いる分析用情報として、前記特徴群情報に含まれる前記N種類の特徴パラメータのうち少なくとも1種類に基づいて、M種類(MはNとは独立した整数値)のパラメータの値から構成される情報を取得する情報取得手段と
    を備える細胞分析用情報生成装置。
  2. 前記N種類の特徴パラメータは、前記細胞集団における所定観点での特徴パラメータを1種類以上含んでおり、
    前記情報取得手段は、前記細胞集団における所定観点での前記特徴パラメータを少なくとも含む1種類以上の特徴パラメータに基づいて、前記分析用情報を取得する、
    請求項1に記載の細胞分析用情報生成装置。
  3. 前記特徴群情報の生成元となる前記単位を構成する前記細胞画像の少なくとも一部は、撮像タイミングが異なっており、
    前記分析用情報は、前記細胞画像の撮像タイミングを特定可能な時間情報を、前記M種類のパラメータの値の1つとして含む、
    請求項1又は2に記載の細胞分析用情報生成装置。
  4. 細胞に関する所定の分析を行うときに用いる情報を生成する細胞分析用情報生成装置が実行する細胞分析用情報生成方法であって、
    複数の細胞からなる細胞集団を被写体として撮像された細胞画像の中から、所定条件により選定された1枚以上の細胞画像を単位として、前記単位に含まれる1以上の細胞画像のデータに基づいて、前記細胞の単体の形態的特徴又は前記細胞集団の形態的特徴に関するN種類(Nは1以上の整数値)の特徴パラメータの値を含む情報を、特徴群情報として生成する特徴群情報生成ステップと、
    細胞に関する所定の分析を行うときに用いる情報として、前記特徴群情報に含まれる前記N種類の特徴パラメータのうち少なくとも1種類に基づいて、M種類(MはNとは独立した整数値)のパラメータの値から構成される情報を取得する情報取得ステップと
    を含む細胞分析用情報生成方法。
  5. 細胞に関する所定の分析を行うときに用いる情報を生成するコンピュータに、
    複数の細胞からなる細胞集団を被写体として撮像された細胞画像の中から、所定条件により選定された1枚以上の細胞画像を単位として、前記単位に含まれる1以上の細胞画像のデータに基づいて、前記細胞の単体の形態的特徴又は前記細胞集団の形態的特徴に関するN種類(Nは1以上の整数値)の特徴パラメータの値を含む情報を、特徴群情報として生成する特徴群情報生成ステップと、
    細胞に関する所定の分析を行うときに用いる情報として、前記特徴群情報に含まれる前記N種類の特徴パラメータのうち少なくとも1種類に基づいて、M種類(MはNとは独立した整数値)のパラメータの値から構成される情報を取得する情報取得ステップと
    を含む制御処理を実行させるプログラム。
JP2015070319A 2015-03-30 2015-03-30 細胞分析用情報生成装置、細胞分析用情報生成方法及びプログラム Pending JP2016189701A (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2015070319A JP2016189701A (ja) 2015-03-30 2015-03-30 細胞分析用情報生成装置、細胞分析用情報生成方法及びプログラム
US15/563,155 US10900950B2 (en) 2015-03-30 2016-03-29 Apparatus and analytical evaluation methods using morphological feature parameters of a cell or cell population
EP16772843.5A EP3275993B8 (en) 2015-03-30 2016-03-29 Device for producing information for cell analysis, method for producing information for cell analysis, and program
PCT/JP2016/060146 WO2016158962A1 (ja) 2015-03-30 2016-03-29 細胞分析用情報生成装置、細胞分析用情報生成方法及びプログラム
SG11201708082RA SG11201708082RA (en) 2015-03-30 2016-03-29 Device for producing information for cell analysis, method for producing information for cell analysis, and program
HK18109585.2A HK1250169A1 (zh) 2015-03-30 2018-07-24 產生用於細胞分析的信息的裝置、產生用於細胞分析的信息的方法以及程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015070319A JP2016189701A (ja) 2015-03-30 2015-03-30 細胞分析用情報生成装置、細胞分析用情報生成方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2016189701A true JP2016189701A (ja) 2016-11-10

Family

ID=57244889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015070319A Pending JP2016189701A (ja) 2015-03-30 2015-03-30 細胞分析用情報生成装置、細胞分析用情報生成方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2016189701A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010098105A1 (ja) * 2009-02-26 2010-09-02 国立大学法人名古屋大学 培養状態評価装置、培養状態評価方法、インキュベータおよびプログラム
JP2011030494A (ja) * 2009-07-31 2011-02-17 Kirin Brewery Co Ltd 細胞形態定量値を用いる酵母の生理状態の評価方法
JP2012175946A (ja) * 2011-02-28 2012-09-13 Nagoya Univ 細胞培養環境評価方法及びその装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010098105A1 (ja) * 2009-02-26 2010-09-02 国立大学法人名古屋大学 培養状態評価装置、培養状態評価方法、インキュベータおよびプログラム
JP2011030494A (ja) * 2009-07-31 2011-02-17 Kirin Brewery Co Ltd 細胞形態定量値を用いる酵母の生理状態の評価方法
JP2012175946A (ja) * 2011-02-28 2012-09-13 Nagoya Univ 細胞培養環境評価方法及びその装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SASAKI, H., ET AL.: "Label-free morphology-based prediction of multiple differentiation potentials of human mesenchymal s", PLOS ONE, vol. vol.9, issue 4, JPN6016024335, 2014, pages 93952, ISSN: 0004275257 *

Similar Documents

Publication Publication Date Title
KR102178295B1 (ko) 결정 모델 구성 방법 및 장치, 컴퓨터 장치 및 저장 매체
US8595233B2 (en) Data processing apparatus, data processing method, program, and integrated circuit
Ziamtsov et al. Machine learning approaches to improve three basic plant phenotyping tasks using three-dimensional point clouds
JP6158623B2 (ja) データベース分析装置及び方法
CN109241741B (zh) 一种基于图像纹理指纹的恶意代码分类方法
CN109815987B (zh) 一种人群分类方法和分类系统
JP2011243188A (ja) 画像処理装置、細胞分類装置、インキュベータ、画像処理方法、細胞分類方法、画像処理プログラムおよび細胞分類プログラム
De Stefano et al. Layout measures for writer identification in mediaeval documents
JP2013246732A (ja) 手書き文書検索装置、方法及びプログラム
JP2016189702A (ja) 細胞分析モデル生成装置及び細胞分析モデル生成方法、細胞分析装置及び細胞分析方法、並びにプログラム
WO2016158962A1 (ja) 細胞分析用情報生成装置、細胞分析用情報生成方法及びプログラム
JP2011154500A (ja) 学習装置、学習方法、識別装置、識別方法、及びプログラム
JP5765583B2 (ja) 多クラス識別器、多クラス識別方法、及びプログラム
JP6721895B2 (ja) 細胞分析結果出力装置、細胞分析結果出力方法及びプログラム
KR20090069874A (ko) 지식맵 분석을 위한 키워드 선정 및 유사도계수 선정 방법및 그 시스템과 그 방법에 대한 컴퓨터 프로그램을 저장한기록매체
JP2014109852A5 (ja)
JP5716966B2 (ja) データ分析装置、データ分析方法及びプログラム
JP2016076115A (ja) 情報処理装置、情報処理方法及びプログラム
JP7131351B2 (ja) 学習方法、学習プログラムおよび学習装置
JP5892275B2 (ja) 多クラス識別器生成装置、データ識別装置、多クラス識別器生成方法、データ識別方法、及びプログラム
JP6356015B2 (ja) 遺伝子発現情報解析装置、遺伝子発現情報解析方法、及びプログラム
JP2016189701A (ja) 細胞分析用情報生成装置、細胞分析用情報生成方法及びプログラム
Wang et al. A novel trace clustering technique based on constrained trace alignment
CN113313213B (zh) 一种加速目标检测算法训练的数据集处理方法
Rahul et al. Data cleaning mechanism for big data and cloud computing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191105

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200602