JP2016189701A

JP2016189701A - 細胞分析用情報生成装置、細胞分析用情報生成方法及びプログラム

Info

Publication number: JP2016189701A
Application number: JP2015070319A
Authority: JP
Inventors: 竜司加藤; Ryuji Kato; 慧蟹江; Kei Kanie; 佐々木　寛人; Hiroto Sasaki; 寛人佐々木
Original assignee: Nagoya University NUC
Current assignee: Nagoya University NUC
Priority date: 2015-03-30
Filing date: 2015-03-30
Publication date: 2016-11-10

Abstract

【課題】細胞分析用の情報を効率的に生成すること。【解決手段】特徴群情報生成部４２は、複数の細胞からなる細胞集団を被写体として撮像された細胞画像の中から、所定条件により選定された１枚以上の細胞画像を単位として、当該単位に含まれる１以上の細胞画像のデータに基づいて、細胞単体の形態的特徴又は細胞集団の形態的特徴に関するＮ種類（Ｎは１以上の整数値）の特徴パラメータの値を含む情報を、特徴群情報として生成する。分析モデル生成部４４又は評価対象情報取得部４６は、細胞に関する所定の分析を行うときに用いる情報として、特徴群情報に含まれるＮ種類の特徴パラメータのうち少なくとも１種類に基づいて、Ｍ種類（ＭはＮとは独立した整数値）のパラメータの値から構成される情報を取得する。【選択図】図２

Description

本発明は、細胞分析用情報生成装置、細胞分析用情報生成方法及びプログラムに関する。

従来、がん研究における自然発生がんの検出、再生医療における治療用細胞以外の異種細胞の検出、間葉系幹細胞（ＭＳＣ）の臨床研究等の分野において、細胞を染色する技術が広く用いられてきた。

このような細胞を染色する技術を適用すると、染色によって細胞が破壊されてしまう。さらに、染色試薬は高価であり、細胞の染色自体が面倒である。
そこで、本発明者らは、非破壊で細胞に関する分析を行う技術について、安価かつ簡便に実現できるように研究開発をし続けている（特許文献１乃至５参照）。

特開２０１１−２３２０５１号公報特開２０１１−２２９４１３号公報特開２０１１−２２９４１０号公報特開２０１１−２２９４０９号公報再表２０１０／０９８１０５号公報

しかしながら、細胞に関する分析を行う技術と一口にいっても、その分析内容は多岐に渡り、同一の分析内容であっても分析手法や条件も多種多様に存在する。このため、分析内容、分析手法、各種条件毎に異種類の分析モデルを夫々生成しておく必要がある。
各種の分析モデル毎に、適合する細胞分析用情報は異なる場合が多い。つまり、各種分析モデル毎に、細胞分析用情報の構造や種類が異なる場合が多い。ここで、細胞分析用情報とは、分析モデルを生成する際に必要なサンプルの細胞に関する情報や、分析対象の細胞に関する情報をいう。
このため、各種の分析モデル毎に適合する細胞分析用情報を効率的に生成することが要求されていた。

本発明は、このような状況に鑑みてなされたものであり、各種の分析モデル毎に適合する細胞分析用情報を効率的に生成することを目的とする。

上記目的を達成するため、本発明の一態様の細胞分析用情報生成装置は、
複数の細胞からなる細胞集団を被写体として撮像された細胞画像の中から、所定条件により選定された１枚以上の細胞画像を単位として、前記単位に含まれる１以上の細胞画像のデータに基づいて、前記細胞の単体の形態的特徴又は前記細胞集団の形態的特徴に関するＮ種類（Ｎは１以上の整数値）の特徴パラメータの値を含む情報を、特徴群情報として生成する特徴群情報生成手段と、
細胞に関する所定の分析を行うときに用いる分析用情報として、前記特徴群情報に含まれる前記Ｎ種類の特徴パラメータのうち少なくとも１種類に基づいて、Ｍ種類（ＭはＮとは独立した整数値）のパラメータの値から構成される情報を取得する情報取得手段と
を備える。

本発明の一態様の細胞分析用情報生成方法及びプログラムは、上述の本発明の一態様の細胞分析用情報生成装置に対応する方法及びプログラムである。

本発明によれば、各種の分析モデル毎に適合する細胞分析用情報を効率的に生成することが実現可能になる。

本発明の一実施形態に係る細胞分析装置のハードウェアの構成を示すブロック図である。図１の細胞分析装置１の機能的構成のうち、細胞分析処理を実行するための機能的構成を示す機能ブロック図である。図２の細胞分析装置１の機能的構成のうち、特徴群情報生成部の機能的構成の詳細を示す機能ブロック図である。図３の特徴群情報生成部の画像数値化部の処理を説明する模式図である。特徴パラメータの具体的な１０種類を説明する図である。特徴群情報の生成の基になる細胞画像の一例を示す図である。特徴群情報の一部を具体的に示す図である。特徴群情報の一部を具体的に示す図である。特徴群情報として、分析評価のために抽出される要素の違いを説明するための模式図である。細胞集団における特徴量のうち有効なものの強調と組合せに基づいて、細胞画像から生成される特徴群情報を模式的に示す図である。分布中の情報強調のパターンの各種具体例を示している。経時変化という点を考慮した集団データの加工手法の各種具体例を示している。ヘテロ性情報付加という点を考慮した集団情報の加工手法の各種具体例を示す図である。ヘテロ性情報付加及び経時変化を考慮した加工がなされた特徴群情報の一例を示す図である。従来のサンプルデータと、本実施形態の特徴群情報から生成されるサンプルデータとの違いを示す図である。細胞品質変化を予測するための分析モデルの生成に用いるサンプルデータの一例を示す図である。図１６のサンプルデータを用いて細胞品質変化を予測したときの予測精度を示す図である。図１７の標準化タイプＥのサンプルデータを用いて生成された分析モデルにより、実際に細胞品質変化を予測した結果を示す図である。所定の分析モデルの生成に用いられる、複数のサンプルデータの一例を示す図である。図１９のサンプルデータを用いて、所定の分析モデルを生成する手法の２つの例を示している。図１７乃至図１９で説明した例とは別の分析モデルの表現形態の一例を示している。分析モデルの表現形態の一例であって、図２１とは異なる例を示す図である。分析モデルの表現形態の一例であって、図２１や図２２とは異なる例を示す図である。分析モデルの表現形態の一例であって、図２１乃至図２３とは異なる例を示す図である。サンプルデータ及び評価対象情報の生成の基になる特徴群情報の構成例を示す図である。時間変化を考慮した図２５の特徴群情報の構成例を示す図である。図２６の構成の特徴群情報を用いて、サンプルデータ及び評価対象情報を比較する手法の一例を説明する図である。出力情報を示す画面の一例を示す図である。出力情報を示す画面の一例を示す図である。

以下、本発明の実施形態について、図面を用いて説明する。

図１は、本発明の一実施形態に係る細胞分析装置１のハードウェアの構成を示すブロック図である。
細胞分析装置１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１１と、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１２と、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１３と、バス１４と、入出力インターフェース１５と、出力部１６と、入力部１７と、記憶部１８と、通信部１９と、ドライブ２０とを備えている。

ＣＰＵ１１は、ＲＯＭ１２に記録されているプログラム、又は、記憶部１８からＲＡＭ１３にロードされたプログラムに従って各種の処理を実行する。
ＲＡＭ１３には、ＣＰＵ１１が各種の処理を実行する上において必要なデータ等も適宜記憶される。

ＣＰＵ１１、ＲＯＭ１２及びＲＡＭ１３は、バス１４を介して相互に接続されている。このバス１４にはまた、入出力インターフェース１５も接続されている。入出力インターフェース１５には、出力部１６、入力部１７、記憶部１８、通信部１９、及びドライブ２０が接続されている。

出力部１６は、ディスプレイやスピーカ等で構成され、各種情報を画像や音声で出力する。
入力部１７は、キーボードやマウス等で構成され、各種情報を入力する。
記憶部１８は、ハードディスクやＤＲＡＭ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）等で構成され、各種データを記憶する。
通信部１９は、図示せぬネットワークを介して他の装置（本実施形態では後述の図２の外部装置８１や前処理装置８２）との間で行う通信を制御する。

ドライブ２０には、必要に応じて、リムーバブルメディア３１が適宜装着される。ドライブ２０によってリムーバブルメディア３１から読み出されたプログラムは、必要に応じて記憶部１８にインストールされる。また、リムーバブルメディア３１は、記憶部１８に記憶されている各種データも、記憶部１８と同様に記憶することができる。

図２は、図１の細胞分析装置１の機能的構成のうち、細胞分析処理を実行するための機能的構成を示す機能ブロック図である。
細胞分析処理とは、１以上の細胞を被写体として含む画像（以下、「細胞画像」と呼ぶ）のデータと、所定の分析モデルとに基づいて、当該細胞に関する所定の分析を行い、その分析結果を出力するまでの一連の処理をいう。
ここで、細胞に関する所定の分析とは、当該細胞を被写体とする細胞画像に基づく分析であれば足りる意である。即ち、細胞に関する所定の分析は、当該細胞の種類や状態を分析することは勿論のこと、当該細胞の外部（周囲環境等）を分析することも含む広義な概念である。

細胞分析処理が実行される場合には、主にＣＰＵ１１においては、図２に示すように、細胞画像入力部４１と、特徴群情報生成部４２と、ノイズ除去部４３と、分析モデル生成部４４と、評価対象情報取得部４５と、評価対象情報取得部４６と、分析部４７と、出力情報生成部４８とが機能する。
また、記憶部１８の一領域には、特徴群情報ＤＢ６１、細胞評価ＤＢ６２、及び分析モデル保持部６３が設けられる。

細胞画像入力部４１は、細胞画像のデータを入力する。ここで、細胞画像の提供元は、特に限定されず、図示せぬインターネット等を介して接続する外部装置８１であってもよいし、細胞分析装置１の管理人等が保有する前処理装置８２であってもよい。
つまり、細胞画像を提供する者を、以下、「ユーザ」と呼ぶならば、ユーザは、細胞分析装置１を保有しない場合等には、外部装置８１を操作して、インターネット等を介して細胞画像のデータを細胞分析装置１に提供する。一方、ユーザは、細胞分析装置１を保有する場合等には、さらに前処理装置８２も保有し、当該前処理装置８２で生成した細胞画像のデータを細胞分析装置１に提供する。
前処理装置８２は、細胞を調整する細胞調整部７１と、当該細胞を撮影して細胞画像のデータとして出力する細胞撮影部７２とを有している。

特徴群情報生成部４２は、細胞画像のデータを２値化し、その結果得られるデータ（以下、「２値化データ」と呼ぶ）から細胞オブジェクトを抽出し、当該細胞オブジェクトの１種類以上の形態的特徴の夫々を示すパラメータの各値から構成されるデータ、即ち数値化データを生成する。

なお、以下、所定の形態的特徴を示すパラメータを、特に、「特徴パラメータ」と呼ぶ。また、特徴パラメータの値は、「形態的特徴量」とも呼ばれている。

ここで、１枚の細胞画像は、複数の細胞からなる細胞集団、例えば同一容器内で培養される細胞集団（時間と共に細胞の個数が変化する場合もある）が被写体として撮像されたものである場合が多い。この場合、１枚の細胞画像には複数個の細胞オブジェクトが含まれており、複数個の細胞オブジェクト毎に１種類以上の特徴パラメータの各値が算出される。

このような細胞集団を被写体とする細胞画像の場合、細胞単体の特徴パラメータの値（形態的特徴量）も有意情報であるが、細胞集団についての特徴パラメータに関する情報（以下、「集団情報」と呼ぶ）も有用な情報である。
集団情報としては、例えば、細胞集団における所定の特徴パラメータのヒストグラムや、細胞集団における所定の特徴パラメータの統計値（平均値や分散値等の数値）が含まれる。

本実施形態では、細胞単体の特徴パラメータの値（細胞単体の形態的特徴量）と、集団情報をまとめて、以下、「特徴群情報」と呼ぶ。

ここで、特徴群情報は、１枚の細胞画像から得られた数値のみから構成されるとは限らない。
例えば所定の容器内の細胞集団が被写体とされ、時間経過と共に複数回細胞画像が撮像される場合がある。このような場合、撮像時刻が異なる複数枚の細胞画像の各データに基づいて、特徴群情報が生成される場合もある。
また例えば、異なる容器（ウェル等）で別々に培養された同一種類の細胞について、異なる容器毎に別々に撮影された複数枚の細胞画像の各データに基づいて、特徴群情報が生成される場合もある。
このように、特徴群情報は、任意の枚数の細胞画像の各データに基づいて生成され得る。

ノイズ除去部４３は、分析モデルの生成に用いるサンプルデータとして、ノイズとなるデータを除去する。
ノイズとなるデータは、例えば、細胞の培養時において手技が不良であった際の細胞画像のデータ、即ち、当該細胞画像のデータに基づいて生成された特徴群情報等から抽出されるサンプルデータである。

分析モデル生成部４４は、特徴群情報ＤＢ６１に格納されている特徴群情報の少なくとも一部に基づいて、サンプルデータを生成する。
ここで、「特徴群情報の少なくとも一部に基づいて、サンプルデータを生成」するとは、特徴群情報の構成要素（特徴パラメータの値）の一部を単に抽出することのみならず、任意の個数の任意の種類の構成要素を用いて新たなデータを生成することも意味する。

分析モデル生成部４４は、１以上のサンプルデータを用いて、細胞画像内の細胞に関する所定の分析を行うためのモデル（以下、「分析モデル」と呼ぶ）を生成する。

ここで、細胞に関する所定の分析と一口にいっても、その分析内容は多岐に渡る。例えば、代表的な分析内容を挙げるだけでも、細胞の種類を分類する種類、培養されている細胞の状態を判断する種類、及び、細胞が培養されている外部環境を分析する種類という３種類が存在する。
従って、分析内容の種類毎に、分析モデルも複数種類存在する可能性がある。つまり、細胞の種類を分析するための分析モデルと、培養されている細胞の状態を判断するための分析モデルと、細胞が培養されている外部環境を分析するための分析モデルとの夫々では、異なる種類が採用されている場合が多い。
また、分析内容が同一種類であっても、多種多様な分析手法や各種条件等が存在する。従って、分析手法や各種条件によっても異なる種類の分析モデルが用いられる場合が多い。

分析モデルの種類が異なれば、その生成に用いられるサンプルデータの種類や構造も異なる場合が多い。
つまり、特徴群情報に含まれる全ての種類の特徴パラメータの値が、そのままサンプルデータとして常に用いられるわけではない。
即ち、分析内容、分析手法、各種条件等毎に、特徴パラメータの種類や個数が異なる組合せが抽出され、抽出された夫々の組合せに基づいて、サンプルデータが生成される場合もある。

具体的には例えば、細胞集団における大きさの平均値（第１特徴パラメータ）と、細胞集団における大きさの分散値（第２特徴パラメータ）と、細胞集団における長さの平均値（第３特徴パラメータ）と、細胞集団における長さの分散値（第４特徴パラメータ）とを含む特徴群情報があったとする。
この場合、細胞の種類を分類する分析モデルの生成用に、第１特徴パラメータと第３特徴パラメータとの各値から、サンプルデータが生成される場合もある。
一方、培養されている細胞の状態を判断する分析モデルの生成用に、第２特徴パラメータと、第３特徴パラメータと、第４特徴パラメータとの各値から、サンプルデータが生成される場合もある。

ここで、サンプルデータの構成要素は、特徴群情報の特徴パラメータの値がそのまま用いられる場合もある。しかしながら、図２５乃至図２７を参照して後述するが、特徴群情報の特徴パラメータとは別のパラメータの値が、サンプルデータの構成要素として新たに生成される場合もある。
つまり、特徴群情報のＮ種類（Ｎは１以上の整数値）の特徴パラメータに基づいて、Ｍ種類（ＭはＮとは独立した１以上の整数値）のパラメータの各値から構成されるサンプルデータが生成される。
このＭ種類のパラメータは、Ｎ種類の特徴パラメータとは独立した概念である。即ち、分析内容、分析手法、各種条件等毎に、サンプルデータを構成するＭ種類のパラメータの種類や個数が異なる場合が多い。

さらに、サンプルデータの基になる特徴群情報は、１枚の細胞画像から生成されるとは限らない。つまり、所定の条件で選択された１枚以上の細胞画像を単位として、当該単位から特徴群情報は生成される。
ここで、所定の条件は、特に限定されず、例えば「同一容器内の時刻ｔ１乃至ｔ５の夫々の細胞画像」という条件を採用してもよい。この条件が採用された場合、同一容器内の時刻ｔ１乃至ｔ５の夫々の５枚の細胞画像から得られた特徴群情報に基づいて、１のサンプルデータが生成される。

従って、サンプルデータには、異なる時刻々のデータ（数値）が含まれ得る。
具体的には例えば、上述の例の第１特徴パラメータ乃至第４特徴パラメータを含む特徴群情報があったとする。
そして、細胞の種類を分類する分析モデルの生成用に対しても、培養されている細胞の状態を判断する分析モデルの生成用に対しても、第３特徴パラメータの値が、サンプルデータのパラメータの値として採用されるものとする。
この場合であっても、細胞の種類を分類する分析モデルの生成用については、時刻ｔ１と時刻ｔ２との各値がサンプルデータに含められる一方で、培養されている細胞の状態を判断する分析モデルの生成用については、時刻ｔ４の値がサンプルデータに含められる場合もある。
即ち、同じ特徴パラメータであっても時刻が異なる値は、夫々違う意味を持つ独立したデータである。このため、分析内容、分析手法、各種条件等毎の時間変化の違いを考慮して、サンプルデータが生成される場合がある。

以上まとめると、特徴群情報は、Ｎ種の特徴パラメータを少なくとも要素として含む、Ｎ次元以上の多次元情報である。
このような特徴群情報に含まれるＮ種類の特徴パラメータのうち少なくとも１種類に基づいて生成される、Ｍ種類のパラメータの値から構成されるデータが、サンプルデータである。
つまり、サンプルデータのＭ種類のパラメータは、Ｎ種類の特徴パラメータとは独立したものであり、当然ながらＮ種類の特徴パラメータのうち幾種類かの特徴パラメータを含み得るが、それとは別のパラメータも含み得る。
ここで、特徴パラメータ以外の別のパラメータを、以下、「付帯パラメータ」と呼ぶ。付帯パラメータとしては、例えば時間のパラメータを採用することができる。また例えば、外部環境や各種条件等で定義されるパラメータも、付帯パラメータである。また例えば、後述の図２５乃至図２７の例のサンプルデータでは、所定の３次元空間を構築する各軸を示すパラメータが構成要素になっている。この各軸を示すパラメータもまた、付帯パラメータの一種である。

このように、本実施形態では、分析モデルの生成に際し、特徴群情報自体をそのままサンプルデータとして用いるのではなく、特徴群情報とは独立したＭ種類のパラメータを要素とするサンプルデータが用いられる。
このＭ種類のパラメータとしては、分析内容、分析手法、各種条件等に応じて、任意な種類の任意の個数の組み合わせを採用することができる。つまり、１の特徴群情報から、分析内容、分析手法、所定条件等に夫々適した異種類で異構造のサンプルデータを個別に生成することができる。その結果、分析内容、分析手法、所定条件等に夫々適した分析モデルの生成が可能になる。つまり、各種の分析モデル毎に適合するサンプルデータ（細胞分析用情報の１種）を効率的に生成することができる。
これにより、各種各様な分析内容、分析手法、所定条件等の夫々について、細胞に関する分析を総合的に行うことが容易かつ適切に可能になる。

つまり、図２の分析モデル生成部４４は、分析内容、分析手法、各種条件等毎に、サンプルの細胞集団についての特徴群情報を特徴群情報ＤＢ６１から検索し、当該特徴群情報に含まれるＮ種類の特徴パラメータのうち少なくとも１種類に基づいて、Ｍ種類のパラメータの各値を要素とするサンプルデータを生成する。
そして、分析モデル生成部４４は、分析内容、分析手法、各種条件等毎に種類や構造が異なるサンプルデータを１個以上用いて、分析内容、分析手法、各種条件等毎に複数の分析モデルを夫々生成する。
これらの各分析モデルは、各サンプルデータの種類や構造を示す情報と対応付けられて、分析モデル保持部６３に保持される。

なお、分析モデル保持部６３に保持された各種分析モデルは、新たな細胞画像についての特徴群情報が特徴群情報ＤＢ６１に格納されると、その後適当なタイミングで、分析モデル生成部４４によって適宜更新される。

評価対象情報取得部４５は、細胞画像に対応する評価対象情報を、外部装置８１や、前処理装置８２の細胞調整部７１から取得して、細胞評価ＤＢ６２に格納する。
細胞画像に対応する評価対象情報とは、当該細胞画像の被写体となる細胞集団（例えば所定容器内の細胞集団）に対して、所定の評価法を用いて行った破壊的細胞評価の結果を示す情報である。つまり、所定の細胞集団に対して、細胞画像とは別の手段で分析評価された情報が、評価対象情報である。
破壊的細胞評価は、特に限定されず、ゲノム、遺伝子発現、タンパク質、代謝産物、相互詐称、生体移植結果、治療成績等任意のものを採用することができる。
なお、評価対象情報は、数値化情報として細胞評価ＤＢ６２に格納されると好適である。評価対象情報の値を、所定の分析モデルを生成する際のサンプルデータ（多次元情報）の要素値（所定のパラメータの値）として含めることができるからである。

評価対象情報取得部４６は、分析評価の対象となる細胞の特徴群情報を、分析評価用の分析モデルに適合した形態で特徴群情報ＤＢ６１から取得する。なお、このようにして評価対象情報取得部４６により取得された情報を、以下、「評価対象情報」と呼ぶ。

分析評価用の分析モデルに適合した形態とは、当該分析モデルが生成される際に用いられたサンプルデータの形態と同様な形態（つまり、パラメータのＭ種類が夫々同一種類である形態）をいう。
即ち、上述したように、分析モデルの種類毎に、生成時に用いられたサンプルデータの形態が異なる場合がある。
従って、評価対象情報も、利用対象の分析モデルの生成時に用いられたサンプルデータと同様な形態である必要がある。

つまり、評価対象情報取得部４６は、分析評価の対象となる細胞の特徴群情報を特徴群情報ＤＢ６１から検索し、当該特徴群情報に含まれるＮ種類の特徴パラメータのうち少なくとも１種類に基づいて、Ｍ種類のパラメータの値から構成される情報を、評価対象情報として取得する。
この場合、「当該特徴群情報に含まれるＮ種類の特徴パラメータのうち少なくとも１種類」や、「Ｍ種類のパラメータ」は、利用対象の分析モデルのサンプルデータが生成されたときのものと同一種類である。

分析部４７は、評価対象情報と分析モデルとに基づいて、分析評価対象の細胞に関する分析処理を実行する。上述したように、分析内容、分析手法、各種条件等は、特に限定されず、各種各様な分析が可能になる。

出力情報生成部４８は、分析評価対象の細胞に関する情報（例えば評価対象情報）と、当該細胞に対する分析処理結果を含む情報を、出力情報として生成する。そして、出力情報生成部４８は、出力情報を出力部１６や外部装置８１に出力する。
なお、出力情報の具体例については、図２８及び図２９を参照して後述する。

以上図２を参照して、細胞分析装置１の機能的構成例について説明した。
次に、このような図２の機能的構成を有する細胞分析装置１のうち、特徴群情報生成部４２の詳細な構成について、図３を参照して説明する。

図３は、図２の細胞分析装置１の機能的構成のうち、特徴群情報生成部４２の機能的構成の詳細を示す機能ブロック図である。

図３に示すように、特徴群情報生成部４２において、画像数値化部９１と、複数画像特徴群情報生成部９２と、ヘテロ性情報付加部９３と、経時変化情報付加部９４と、特徴群情報出力部９５とがＣＰＵ１１（図１）において機能する。
また、記憶部１８（図１）の一領域には、数値化情報蓄積部１０１と、第１特徴群情報蓄積部１０２と、第２特徴群情報蓄積部１０３と、第３特徴群情報蓄積部１０４とが設けられる。

画像数値化部９１は、１枚の細胞画像のデータを処理単位として、処理単位のデータに対して所定の画像処理を施すことで、処理単位についての特徴群情報を生成する。
１枚の細胞画像から生成された特徴群情報、即ち、当該細胞画像に含まれる細胞オブジェクトの夫々の各種特徴パラメータの値（数値）の集合体からなる情報は、数値化情報蓄積部１０１に蓄積される。即ち、数値化情報蓄積部１０１は、１枚の細胞画像を単位として、複数単位の特徴群情報を蓄積する。

図４は、画像数値化部９１の処理を説明する模式図である。
図４の例では、１枚の細胞画像Ｇ１のデータが処理単位として画像数値化部９１に与えられる。
画像数値化部９１は、細胞画像Ｇ１のデータから２値化データＧ２を生成する。画像数値化部９１は、２値化データから「ＸＸＸ」個（ＸＸＸは、任意の整数値）の細胞オブジェクト候補を抽出する。ここで、細胞オブジェクトとせずに候補としたのは、細胞ではないノイズとなるオブジェクト（以下、「ノイズオブジェクト」と呼ぶ）が含まれるからである。

画像数値化部９１は、各細胞オブジェクト候補の夫々に対して一意のＩＤ（ＣｅｌｌＩＤ）を付し、各種特徴パラメータを夫々求める。即ち、各細胞オブジェクトが数値化されることになる。図４の例では、各細胞オブジェクト毎に、９種類の特徴パラメータ（Ｐａｒａｍｅｔｅｒ１乃至９）の値が求められている。
このような各細胞オブジェクト毎の９種類の特徴パラメータの値（数値化データ）が網羅されたリストが、細胞画像Ｇ１の特徴群情報Ｉ１である。

ただし、細胞画像Ｇ１の特徴群情報Ｉ１には、ノイズオブジェクトについての数値化データ（９種類の特徴パラメータの値）も含まれている。
そこで、ステップＳ１において、画像数値化部９１は、適当なアルゴリズムに従って、細胞オブジェクト候補からノイズオブジェクトを判定し、当該ノイズオブジェクトの数値化データを除外する。
図４の例では、ＩＤが「Ｃｅｌｌ００１」及び「Ｃｅｌｌ００２」の細胞オブジェクト候補がノイズオブジェクトと判定されている。このため、細胞画像Ｇ１の特徴群情報Ｉ１から、当該ノイズオブジェクトについての数値化データが除外され、細胞画像Ｇ１の特徴群情報Ｉ２が生成される。

さらに、ステップＳ２において、画像数値化部９１は、ステップＳ１とは異なる適当なアルゴリズムに従って、細胞オブジェクト候補からノイズオブジェクトを判定し、当該ノイズオブジェクトの数値化データを除外する。
図４の例では、ＩＤが「Ｃｅｌｌ００３」及び「Ｃｅｌｌ００４」の細胞オブジェクト候補がノイズオブジェクトと判定されている。このため、細胞画像Ｇ１の特徴群情報Ｉ１から、当該ノイズオブジェクトについての数値化データが除外され、細胞画像Ｇ１の特徴群情報Ｉ３が生成される。

ステップＳ３において、画像数値化部９１は、ノイズオブジェクトが除外された細胞オブジェクト候補を細胞オブジェクトとして確定して、細胞画像Ｇ１の特徴群情報Ｉ３を、数値化情報蓄積部１０１に記憶させる。

なお、図４の例では、特徴パラメータの種類は、９種類とされたが、特にこれに限定されない。
例えば図５は、特徴パラメータの具体的な１０種類を説明する図である。
図５において、１行は所定の種類の特徴パラメータを示している。１列目の項目は、パラメータ番号を示している。２列目の項目は、特徴パラメータの名称を示している。３列目の項目は、特徴パラメータの例（求め方）を示している。４列目の項目は、特徴パラメータの説明を示している。

「Ｔｏｔａｌａｒｅａ」は、細胞（より正確には「細胞オブジェクト」であるが、本段落では単に「細胞」と呼ぶ）の面積を示す特徴パラメータである。
「Ａｒｅａ」は、細胞内のＨｏｌｅを除く面積を示す特徴パラメータである。ここで、Ｈｏｌｅは、コントラストによって、細胞画像の明るさが閾値以上となる部分（位相差観察では白に近い状態となる箇所）である。
「Ｐｅｒｉｍｅｔｅｒ」は、細胞の外周の長さを示す特徴パラメータである。
「Ｌｅｎｇｔｈ」は、細胞を横切る線のうちの最大値（細胞の全長）を示す特徴パラメータである。
「Ｂｒｅａｄｔｈ」は、「Ｌｅｎｇｔｈ」に直交する線のうちの最大値（細胞の横幅）を示す特徴パラメータである。
「Ｉｎｎｅｒｒａｄｉｕｓ」は、細胞の内周の半径を示す特徴パラメータである。
「Ｅｌｌｉｐｔｉｃａｌｆｏｒｍｆａｃｔｏｒ」は、「Ｌｅｎｇｔｈ」の値を「Ｂｒｅａｄｔｈ」で除した特徴パラメータである。
「ＦｉｂｅｒＢｒｅａｄｔｈ」は、細胞を擬似的に線状と仮定した場合の幅（ＦｉｂｅｒＬｅｎｇｔｈと直交する方向の長さ）を示す特徴パラメータである。
「ＦｉｂｅｒＬｅｎｇｔｈ」は、細胞を擬似的に線状と仮定した場合の長さを示す特徴パラメータである。
「ＳｈａｐｅＦａｃｔｏｒ」は、細胞の円形度（細胞の丸さ）を示す特徴パラメータである。

なお、図５の例の特徴パラメータは例示に過ぎず、細胞オブジェクトから数値化可能な所定の形態的特徴を示すパラメータであれば、任意の種類を採用することができる。
また、１枚の細胞画像には、細胞集団が含まれているため、図示はしないが集団情報も求められ、特徴群情報に含められる。例えば上述の「Ｔｏｔａｌａｒｅａ」の平均値や分散値等が、特徴群情報に含められ得る。
また、複数個の細胞の所定の形態的特徴量のヒストグラムが求められ、そのヒストグラム内の各ビンの値等が、特徴群情報に含められ得る。

図３に戻り、複数画像特徴群情報生成部９２は、所定の規則に従って、複数枚の細胞画像からなる第１処理単位を決定して、第１処理単位に含まれる特徴群情報を数値化情報蓄積部１０１から取得する。
所定の規則は、特に限定されないが、ここでは、同一条件及び同一時間に撮像された複数の細胞画像が第１処理単位になるという規則が採用されている。
次に、複数画像特徴群情報生成部９２は、数値化情報蓄積部１０１から取得した各特徴群情報について、各数値化データを結合したり整理することによって、第１処理単位の特徴群情報を生成する。
第１処理単位の特徴群情報は、第１特徴群情報蓄積部１０２に蓄積される。

ヘテロ性情報付加部９３は、所定の規則に従って、複数枚の細胞画像からなる第２処理単位を決定して、第２処理単位に含まれる各特徴群情報を第１特徴群情報蓄積部１０２から取得する。
所定の規則は、特に限定されないが、ここでは、複数条件及び同一時間に撮像された複数の細胞画像が第２処理単位になるという規則が採用されている
次に、ヘテロ性情報付加部９３は、取得した各特徴群情報について、各数値化データを結合したり整理することによって、ヘテロ性情報が付加された第２処理単位の特徴群情報を生成する。なお、ヘテロ性情報や第２処理単位の特徴群情報の具体例については、図１２を参照して後述する。
第２処理単位の特徴群情報は、第２特徴群情報蓄積部１０３に蓄積される。

経時変化情報付加部９４は、所定の規則に従って、複数枚の細胞画像からなる第３処理単位を決定して、第３処理単位に含まれる各特徴群情報を第２特徴群情報蓄積部１０３から取得する。
所定の規則は、特に限定されないが、ここでは、複数条件及び複数時間（時間変化する相異なる時間）に撮像された複数の細胞画像が第３処理単位になるという規則が採用されている
次に、経時変化情報付加部９４は、取得した各特徴群情報について、各数値化データを結合したり整理することによって、経時変化の概念が付加された第３処理単位の特徴群情報を生成する。なお、経時変化の概念が付加された第３処理単位の特徴群情報の具体例については、図９乃至図１２を参照して後述する。
第３処理単位の特徴群情報は、第３特徴群情報蓄積部１０４に蓄積される。

特徴群情報出力部９５は、適当なタイミングで、特徴群情報を第３特徴群情報蓄積部１０４から取得して、ノイズ除去や、タグ情報付加等をしたうえで、特徴群情報ＤＢ６１に記憶する。

以上図３を参照して特徴群情報生成部４２の詳細について説明したように、単一の細胞画像のデータは、画像数値化部９１において画像処理が施されることで、数値化された特徴群情報となる。
従って、複数画像特徴群情報生成部９２乃至特徴群情報出力部９５の処理対象は、画像のデータ（イメージデータ）ではなく、数値化データたる特徴群情報である。従って、複数画像特徴群情報生成部９２乃至特徴群情報出力部９５をまとめて、「数値化情報処理部１１１」と適宜呼ぶ。

ここで、図６乃至図８を参照して、特徴群情報ＤＢ６１に記憶される特徴群情報の具体例について説明する。
図６は、特徴群情報の生成の基になる細胞画像の一例を示している。
細胞画像ＣＡは、同一容器で培養された種類「ＣＡ」の細胞集団を撮像したたものである。
細胞画像ＣＢは、同一容器で培養された種類「ＣＢ」の細胞集団を撮像したものである。
細胞画像ＣＣは、同一容器で培養された種類「ＣＣ」の細胞集団を撮像したものである。
細胞画像ＣＤは、同一容器で培養された種類「ＣＤ」の細胞集団を撮像したものである。
なお、図６の例では、各種類「ＣＡ」乃至「ＣＤ」について、１枚の細胞画像しか示されていないが、実際には、各種類毎に、別々の時刻ｔ１乃至ｔ１０の各タイミングにおいて夫々撮像された１０枚の細胞画像が存在するものとする。
なお、ここでいう「時刻」は、絶対的な時刻（世界標準時刻）ではなく、例えば培養開始から１時間後等、所定の基準時（培養開始時刻）からの相対的な時刻を意味する。

図７及び図８は、特徴群情報の一部を具体的に示している。
特徴群情報の単位は上述したように特に限定されないが、図７及び図８の例では、細胞の種類が１単位とされ、４単位の特徴群情報が各列に夫々配置されている。
即ち、種類「ＣＡ」の細胞の特徴群情報の一部は、（項目名を抜かすと）左から第１列に配置されている。種類「ＣＢ」の細胞の特徴群情報の一部は、左から第２列に配置されている。種類「ＣＣ」の細胞の特徴群情報の一部は、左から第３列に配置されている。種類「ＣＤ」の細胞の特徴群情報の一部は、左から第４列に配置されている。

図７の例では、特徴群情報のうち、各細胞画像の細胞集団における所定特徴パラメータの統計値を要素とする一部が示されている。図７の一番左の列には、特徴群情報の要素名が含まれている。
ここで、「ｐａｓ」とは（相対的な）時刻を示す。即ち、ｋｐａｓ（ｋは１乃至１０の任意の整数値）は、時刻ｋに撮像された細胞画像から得られた値であることを示している。
「ＡＶＥ」は平均値を、「ＳＤ」は標準偏差を、夫々示している。
例えば上から１番目の行の要素（Ｎｏｒｍａｌ＿Ａｒｅａ＿ＡＶＥ＿０１ｐａｓ）は、時刻ｔ１の細胞画像に含まれるノーマルの細胞集団の「Ａｒｅａ」の平均値を示している。
また例えば上から１２番目の行の要素（Ｎｏｒｍａｌ＿Ａｒｅａ＿ＳＤ＿０２ｐａｓ）は、時刻ｔ２の細胞画像に含まれるノーマルの細胞集団の「Ａｒｅａ」の標準偏差を示している。

図８の例では、特徴群情報のうち、各細胞画像の細胞集団における所定特徴パラメータについてのヒストグラムのビンを要素とする一部が示されている。図８の一番左の列には、特徴群情報の要素名が含まれている。
ここで、「ｂｉｎ」とはビンの番号を示す。番号の付し方は特に限定されないが、図８の例では、ヒストグラムが１２分割（１２ビン）から構成されるものとして、左から順に番号が付されている。
例えば上から１番目の行の要素（Ａｒｅａ＿１ｐａｓ＿１ｂｉｎ）は、時刻ｔ１の細胞画像に含まれる細胞集団の「Ａｒｅａ」のヒスグラムのうち、左から１番目のビンの値を示している。

ここで、図７及び図８においては、特徴群情報の各要素（各特徴パラメータ）は、その数値に応じて異なる色及び濃淡がつけられている。
とある領域の色や濃淡のパターンは、細胞の種類「ＣＡ」乃至「ＣＤ」毎に異なっていたり、特徴的であったりする。
ここで、「とある領域」とは、列方向にみて、連続している複数の項目からなる連続領域の場合もあるし、非連続となっている複数の項目から形成される領域の場合もある。例えば、図７の上から１乃至１０行の連続領域（Ｎｏｒｍａｌ＿Ａｒｅａ＿ＡＶＥの部分）が「とある領域」であってもよい。また例えば、時刻ｔ１，ｔ３の非連続な部分（０１ｐａｓｓ１，０３ｐａｓｓ３という項目名を有する非連続な領域）が「とある領域」であってもよい。
ここで例えば、特徴群情報の「とある部分」では、細胞の種類「ＣＡ」乃至「ＣＤ」の分類が容易に可能となるような、色や濃淡のパターンが存在しているものとする。この場合、「とある領域」の色や濃淡のパターンを見比べる（実際の処理では類似度等の演算をする）ことで、細胞の種類「ＣＡ」乃至「ＣＤ」の分類を容易に行うことができる。
即ち、細胞の種類「ＣＡ」乃至「ＣＤ」を分類する分析モデルの生成や更新時には、「とある領域」の各項目値（各特徴パラメータの値）に基づいて、サンプルデータが生成される。
また、未知な細胞を被写体とする細胞画像が評価対象となり、当該未知な細胞を種類「ＣＡ」乃至「ＣＤ」の何れかに分類する場合、評価対象の特徴群情報のうち「とある領域」の各項目値（各特徴パラメータの値）に基づいて、評価対象情報が取得される。つまり、サンプルデータと同一形態の評価対象情報が取得される。

繰り返しになるが、特徴群情報における「とある領域」とは、分析モデルの種類に応じて、即ち、分析内容、分析手法、各種条件等に応じて、異なるものである。

ここで、特徴群情報のデータ量について考える。
特徴群情報の次元数Ｎ（データの容量）に特に制限がない場合には、細胞画像から得られるあらゆる特徴パラメータのあらゆる値の集合情報（以下、「全体情報」と呼ぶ）を、特徴群情報として採用することができる。
しかしながら、実際には、特徴群情報の次元数Ｎ（データの容量）に制限がある場合もある。このような場合には、細胞画像から得られるあらゆる特徴パラメータのあらゆる値の集合情報の一部を、特徴群情報として採用する必要がある。
一方で、情報量を絞り過ぎた特徴群情報では、高精度の分析の妨げになる。
つまり、考えられ得る全組合せの種類の集団情報の中から、分析内容、分析手法、各種条件等にとって好適な集団情報を含むような特徴群情報を生成する必要がある

図９は、特徴群情報として、分析評価のために抽出される要素の違いを説明するための模式図である。
例えば、図９の例では、細胞の種類「Ａ」、「Ｂ」、及び「Ｃ」を分類する場合が想定されている。

図９（Ａ）の例では、全体情報のうち、２個の細胞単体の特徴パラメータの値が、形としては恣意的に選抜され、時間方向ではランダムに抽出されたものが特徴群情報として採用されている。具体的には例えば、種類「Ａ」の細胞の特徴群情報は、時間的に早いタイミングで撮像された細胞画像内の多数個の細胞（オブジェクト）から２個の細胞単体（オブジェクト）が恣意的に選抜され、当該２個の細胞単体の特徴パラメータの値が抽出されたものから生成されている。
この場合、同一の種類「Ａ」であったとしても、１枚の細胞画像には多数の細胞オブジェクトが含まれており、特徴パラメータの値は夫々バラついている。従って、恣意的に抽出された２個の細胞単体の特徴パラメータの値は、種類「Ａ」の代表値とは限らない。また、特徴パラメータの値は時間変化する場合もあり、ランダムな時間タイミングで抽出された２個の細胞単体の特徴パラメータの値が、種類「Ａ」の代表的値とは限らない。
以上のことから、時間変化を考慮せずに、恣意的に選抜された幾つかの細胞単体の特徴パラメータの値のみを特徴群情報とした場合、細胞の種類「Ａ」、「Ｂ」、及び「Ｃ」を精度よく分類することは困難な場合が多い。

そこで、例えば、１枚の細胞画像に含まれる細胞集団という観点と、時間変化という観点とに基づいて各特徴パラメータの値を抽出して、それらの集合体を特徴群情報とするよい。
例えば図９（Ｂ）の例では、全体情報のうち、形としては、細胞集団における特徴量の代表値が抽出され、時間的には、当該特徴量の代表値が定期的に抽出された場合の経時情報（時間方向の集合体）が、特徴群情報として採用される。
例えば図９（Ｃ）の例では、全体情報のうち、形としては、細胞集団における特徴量の情報全体が抽出され、時間的には、当該特徴量の情報全体が定期的に抽出された場合の経時情報（時間方向の集合体）が、特徴群情報として採用される。
ここで、図９に示すように、図９（Ａ）→図９（Ｂ）→図９（Ｃ）に従って特徴群情報の情報量（次元Ｎの数）が増加していくことになる。

しかしながら、上述したように、特徴群情報の次元数Ｎ（データの容量）に制限がある場合が多い。このような制限に対応するためには、全体情報に対して、情報の整理と選抜により好適なパラメータの値を抽出して、図９（Ｄ）の例のような特徴群情報を生成する必要がある。
即ち、例えば図９（Ｄ）の例に示すように、全体情報のうち、形としては、細胞集団における特徴量のうち有効なものの強調と組合せによる加工がなされたものが抽出され、時間的には、当該細胞集団における特徴量のうち有効なものの強調と組合せによる加工がなされたものが定期的に抽出された場合の経時情報（時間方向の集合体）が、特徴群情報として採用される。

さらに、図１０乃至図１２を参照して、細胞集団における特徴量のうち有効なものの強調と組合せに基づく特徴群情報の生成手法について説明する。

図１０は、細胞集団における特徴量のうち有効なものの強調と組合せに基づいて、細胞画像から生成された特徴群情報を模式的に示す図である。
図１０の例では、同一種類の細胞集団が所定容器で培養され、時間と共に細胞数も増加するものとする。
つまり、図１０には、細胞画像Ｇａには１つの細胞のみが図示され、細胞画像Ｇｂには２つの細胞のみが図示され、細胞画像Ｇｃには４つの細胞のみが図示されていようにみえるが、当然ながら、図１０の細胞画像Ｇに示すように、実際には細胞集団が所定容器に含まれている。つまり、図１０の細胞は、１個の細胞を示しているのではなく、時間毎に増加する割合（＝１：２：４）を示している。

第１時刻で撮影された細胞画像Ｇａからは、特徴群情報Ｉａが得られている。特徴群情報Ｉａは、Ｎ種類の特徴パラメータ（要素）として、各細胞毎の形、動き、及び表面という３つの形態的特徴量と、細胞集団の集団情報とを少なくとも含んでいる。ここで、集団情報としては、平均値や分散値等の統計値や、ヒストグラムのビンの値等がある。
例えば、集団情報として、細胞集団の「形」のヒストグラムから得られる数値データＩｋａ、細胞集団の「動き」のヒストグラムから得られる数値データＩｕａ、及び、細胞集団の「表面」のヒストグラムから得られる数値データＩｈａが、特徴群情報Ｉａに含まれている。

ここで、各ヒストグラムを構成するビンのうち、ハッチングがかけられたビンが、特徴群情報Ｉａに含まれる情報（１つのビンを１つの要素とすれば、所定の１種類の特徴パラメータ）である。
ここで、細胞集団の「形」のヒストグラムでは、中央左側の３つのビンが、「形」を特徴づけるものである。換言すると、ヒストグラム全体では、「形」の特徴が薄らいでしまうため、「形」の特徴を「強調」すべく中央左側の３つのビンが抽出されている。
一方、「動き」の特徴を「強調」すべきビンとしては、「形」とは異なり、右側の５つのビンが抽出されている。また、「表面」の特徴を「強調」すべきビンとしては、「形」や「動き」とは異なり、両端の６つのビンが抽出されている。
これらの各特徴（形、動き、表面）毎に強調された情報（抽出されたビン）の夫々が、数値データＩｋａ、数値データＩｕａ、及び、数値データＩｈａの夫々である。
そして、これら数値データＩｋａ、数値データＩｕａ、及び、数値データＩｈａの「組合せ」により、特徴群情報Ｉａがつくられている。

第２時刻で撮影された細胞画像Ｇｂからは、特徴群情報Ｉｂが得られている。特徴群情報Ｉｂは、Ｎ種類の特徴パラメータ（要素）として、各細胞毎の形、動き、及び表面という３つの形態的特徴量と、細胞集団の集団情報とを少なくとも含んでいる。
例えば、集団情報として、細胞集団の「形」のヒストグラムから得られる数値データＩｋｂ、細胞集団の「動き」のヒストグラムから得られる数値データＩｕｂ、及び、細胞集団の「表面」のヒストグラムから得られる数値データＩｈｂが、特徴群情報Ｉｂに含まれている。
つまり、各特徴（形、動き、表面）毎に強調された情報（抽出されたビン）の夫々が、数値データＩｋｂ、数値データＩｕｂ、及び、数値データＩｈｂの夫々である。そして、これら数値データＩｋｂ、数値データＩｕｂ、及び、数値データＩｈｂの「組合せ」により、特徴群情報Ｉｂがつくられている。

第３時刻で撮影された細胞画像Ｇｃからは、特徴群情報Ｉｃが得られている。特徴群情報Ｉｃは、Ｎ種類の特徴パラメータ（要素）として、各細胞毎の形、動き、及び表面という３つの形態的特徴量と、細胞集団の集団情報とを少なくとも含んでいる。
例えば、集団情報として、細胞集団の「形」のヒストグラムから得られる数値データＩｋｃ、細胞集団の「動き」のヒストグラムから得られる数値データＩｕｃ、及び、細胞集団の「表面」のヒストグラムから得られる数値データＩｈｃが、特徴群情報Ｉｃに含まれている。
つまり、各特徴（形、動き、表面）毎に強調された情報（抽出されたビン）の夫々が、数値データＩｋｃ、数値データＩｕｃ、及び、数値データＩｈｃの夫々である。そして、これら数値データＩｋｃ、数値データＩｕｃ、及び、数値データＩｈｃの「組合せ」により、特徴群情報Ｉｃがつくられている。

このように、各特徴（形、動き、表面）毎に、分布中の情報強調のパターン、即ちヒストグラム中のどのビンを抽出して強調するするのかというパターンは異なっている。
このようなパターンは、図１０の例の３種類に限定されず、任意の種類を設定することができる。
図１１は、分布中の情報強調のパターンの各種具体例を示している。
図１１（Ａ）は、ヒストグラムの全分布情報を用いるパターンを示している。
ここで、ヒストグラムとして、個数での絶対値情報（図１１の細胞画像Ｇから得られた各個数をそのままヒストグラム化したもの）と、データベース内の標準値を用いた標準正規化情報（図１１の細胞画像Ｇから得られた各個数を正規化してヒストグラム化したもの）との両者を選択的に採用することができる。
図１１（Ｂ）は、ヒストグラムの平均値・中央値を用いるパターンを示している。
図１１（Ｃ）は、ヒストグラム（分布）中の８０％信頼区間以内の情報を用いるパターンを示している。
図１１（Ｄ）は、ヒストグラム（分布）中の平均値より上の情報を用いるパターンを示している。
図１１（Ｅ）は、分布中の８０％信頼区間以外の情報を用いるパターンを示している。

特徴群情報の生成に際し（或いは後述するサンプルデータの抽出に際し）、これらの全パターンの中から、各特徴（形、動き、表面）にとって、或いは分析内容、分析手法、各種条件にとって最適な指標（パターン）と経時点の組合せが用いられる。なお、経時点については、図１２を参照して後述する。

ここで、図１０の特徴群情報Ｉａ乃至Ｉｃの夫々は、図３の例でいえば、画像数値化部９１において単一の細胞画像から作られた数値化情報であり、数値化情報蓄積部１０１に蓄積されるものである。
従って、図３を用いて上述したように、同一時間で同一条件の他の細胞画像（例えば複数のウェルの細胞画像）が存在するならば、複数画像特徴群情報生成部９２により、当該他の細胞画像の特徴群情報と結合したり整理されたりし、その結果得られる第１単位の特徴群情報が第１特徴群情報蓄積部１０２に蓄積される。
ヘテロ性情報付加部９３については、図１２を参照して後述するものとして、経時変化情報付加部９４の処理について説明する。
経時変化情報付加部９４は、特徴群情報Ｉａ乃至Ｉｃの夫々のうち、集団情報について、経時変化という点を考慮した加工（結合や整理等）をすることによって、第３処理単位の特徴群情報を生成する。

図１２は、経時変化という点を考慮した集団データの加工手法の各種具体例を示している。
なお、上述の図１２は、３つの異なるタイミングの細胞画像に基づく例とされているのに対して、この図１２は４つの異なるタイミング（２４ｈ、４８ｈ、７２ｈ、及び９６ｈ）の細胞画像Ｇａ，Ｇｂ，Ｇｃ，Ｇｄに基づく例とされている。しかしながら、図１２に示す各加工手法の考え方は図１０の例にも同様に当てはまる。

図１２の例では、先ず、標準化整理タイプＡと、標準化整理タイプＢとを選択的に採用することができるようになっている。
標準化整理タイプＡとは、分布（ヒストグラム）として、上述の図１１に示す、個数での絶対値情報（図１１の細胞画像Ｇから得られた各個数をそのままヒストグラム化したもの）を採用するパターンである。
標準化整理タイプＢとは、上述の図１１に示す、データベース内の標準値を用いた標準正規化情報（図１１の細胞画像Ｇから得られた各個数を正規化してヒストグラム化したもの）を採用するパターンである。

図１２（Ａ）は、図１１（Ａ）のヒストグラムの全分布情報を用いるパターンを採用した場合の、時刻ｔ１乃至ｔ５の経時変化を考慮した特徴群情報を模式的に示したものである。
図１２（Ｂ）は、図１１（Ｂ）のヒストグラムの平均値・中央値を用いるパターンを採用した場合の、時刻ｔ１乃至ｔ５の経時変化を考慮した特徴群情報を模式的に示したものである。
図１２（Ｃ）は、図１１（Ｃ）のヒストグラム（分布）中の８０％信頼区間以内の情報を用いるパターンを採用した場合の、時刻ｔ１乃至ｔ５の経時変化を考慮した特徴群情報を模式的に示したものである。
図１２（Ｄ）は、図１１（Ｄ）のヒストグラム（分布）中の平均値より上の情報を用いるパターンを採用した場合の、時刻ｔ１乃至ｔ５の経時変化を考慮した特徴群情報を模式的に示したものである。
図１２（Ｅ）は、図１１（Ｅ）の分布中の８０％信頼区間以外の情報を用いるパターンを採用した場合の、時刻ｔ１乃至ｔ５の経時変化を考慮した特徴群情報を模式的に示したものである。

次に、図１３を参照して、図３のヘテロ性情報付加部９３について具体的に説明する。
図１３は、ヘテロ性情報付加という点を考慮した集団情報の加工手法の各種具体例を示している。
ヘテロ性情報付加とは、複数条件及び同一時間に撮像された複数の細胞画像の関係性を示す情報を付加することをいう。即ち、複数条件及び同一時間に撮像された複数の細胞画像から夫々得られた特徴群情報について、条件変化という点を考慮した加工（結合や整理等）をすることをいう。

図１３には、同一種類Ａの細胞（異なる３つの容器）に対して、培養条件Ａ、培養条件Ｂ、及び培養条件Ｃが夫々課された上で、培養された例が示されている。

つまり、培養条件Ａについては、時刻ｔ１における特徴群情報ＩｇＡｔ１，時刻ｔ２における特徴群情報ＩｇＡｔ２，時刻ｔ３における特徴群情報ＩｇＡｔ３がまとめられて（加工されて）、特徴群情報ＩｇＡが構成される。
同様に、培養条件Ｂについては、時刻ｔ１における特徴群情報ＩｇＢｔ１，時刻ｔ２における特徴群情報ＩｇＢｔ２，時刻ｔ３における特徴群情報ＩｇＢｔ３がまとめられて（加工されて）、特徴群情報ＩｇＢが構成される。
培養条件Ｃについては、時刻ｔ１における特徴群情報ＩｇＣｔ１，時刻ｔ２における特徴群情報ＩｇＣｔ２，時刻ｔ３における特徴群情報ＩｇＣｔ３がまとめられて（加工されて）、特徴群情報ＩｇｃＣ構成される。

さらに、培養条件Ａの特徴群情報ＩｇＡ，培養条件Ｂの特徴群情報ＩｇＢ，培養条件Ｃの特徴群情報ＩｇＣの夫々が高次情報にまとめられて、特徴群情報Ｉｇ１が構成される。
つまり、培養条件という条件変化という点を考慮したヘテロ性情報が付加されたことになる。
さらに、高次情報における優先順位付けが行われて、細胞品質（ここでは細胞Ａの品質）を表現する高次元情報としての特徴群情報Ｉｇ２が得られる。

所定の１条件の所定の１時刻の特徴群情報（例えば培養条件Ａの時刻ｔ１の特徴群情報ＩｇＡｔ１）と比較すると、特徴群情報Ｉｇ２は、ヘテロ性情報付加及び経時変化が考慮されている点で、細胞Ａの品質をより良く表した情報となっている。

なお、図１３の例では、経時変化を考慮した加工（結合や整理等）の後、ヘテロ性情報付加が行われているように説明したが、各時刻ｔ１乃至ｔ３毎にヘテロ性情報付加をした後に、それらをまとめるといった経時変化を考慮した加工（結合や整理等）をしてもよい。
つまり、図３の機能ブロック図は、後者の例の機能ブロック図となっているが、図１３に併せて、経時変化情報付加部９４とヘテロ性情報付加部９３との配置順番を入れ替えても良い。

図１４は、このようにして、ヘテロ性情報付加及び経時変化を考慮した加工がなされた各細胞品質を表す特徴群情報について、２４０種類集めたもの、即ち複数の細胞の品質を表す特徴群情報の一例を示している。
即ち、図１４の例では、所定の１列が、１つの種類の細胞品質を表現する高次元情報としての特徴群情報となっている。
なお、図１４の例では、２４０種類の細胞品質を表現する高次元情報を単に並べたものではなく、後述するクラスタリング等によって高次情報の類似度が近いもの同士が近くなるように配置されたものである。そういった点で、類似度の近い／遠いを示す分岐図は分析モデルの一種であると把握することもできるし、そのように把握した場合、図１４のデータは、当該分析モデルを導出したサンプルデータ群と把握することもできる。

以上、図１０乃至図１４を参照して、特徴群情報の生成の一連の流れの具体例について説明した。
次に、図１５乃至図２７を参照して、当該特徴群情報からサンプルデータを生成して、当該サンプルデータを用いて分析モデルを生成するまでの一連の流れについて具体的に説明する。

図１５は、従来のサンプルデータと、本実施形態の特徴群情報から生成されるサンプルデータとの違いを示す図である
図１５の例のサンプルデータは、細胞品質変化を予測するための分析モデルを生成するために用いられるものとする。

従来においても、本発明者らは、細胞集団の特徴の経時変化を考慮したサンプルデータＰ１２を用いていた。ただし、サンプルデータＰ１２は、各時刻の細胞画像Ｇから得られる、細胞集団の細胞形態の平均値の各時刻のデータ群Ｐ１１を単に時系列順に並べられものである。
これに対して、本実施形態では、細胞集団の細胞形態の分布（ヒストグラム）から、図１１に示す各パターン毎の情報が各時刻毎に抽出された集合体Ｐ２１が得られる。当該集合体Ｐ２１に基づいて特徴群情報Ｐ２２が生成される。そして、当該特徴群情報Ｐ２２がまとめられ（必要に応じて整理や加工がされて）、高次元の特徴群情報Ｐ２３が得られる。
この特徴群情報Ｐ２３から、任意の個数の任意の組合せのデータをサンプルデータとして採用することができる。

図１６は、細胞品質変化を予測するための分析モデルの生成に用いるサンプルデータの一例を示している。
図１６の例では、品質Ａ乃至Ｅの夫々についてのサンプルデータの一例が示されている。
図１６において、少数特徴量情報Ｐ１とは、図１５の従来のサンプルデータＰ１２に対応するものである。
高次元特徴量情報Ｐ２とは、図１５の本実施形態の高次元の特徴群情報Ｐ２３に対応するものである。

図１７は、図１６のサンプルデータを用いて細胞品質変化を予測したときの予測精度を示している。
「細胞形態の平均」とは、図１６の少数特徴量情報Ｐ１（図１５の従来のサンプルデータＰ１２）を用いた場合の予測精度を示している。
「標準化タイプＡ」とは、図１６の高次元特徴量情報Ｐ２（図１５の高次元の特徴群情報Ｐ２３）のうち、図１２（Ａ）のヒストグラムの全分布情報を用いるパターンの時系列情報の部分をサンプルデータとして抽出し、当該サンプルデータを用いた場合の予測精度を示している。
「標準化タイプＢ」とは、図１６の高次元特徴量情報Ｐ２（図１５の高次元の特徴群情報Ｐ２３）のうち、図１２（Ｂ）のヒストグラムの平均値・中央値を用いるパターンの時系列情報の部分をサンプルデータとして抽出し、当該サンプルデータを用いた場合の予測精度を示している。
「標準化タイプＣ」とは、図１６の高次元特徴量情報Ｐ２（図１５の高次元の特徴群情報Ｐ２３）のうち、図１２（Ｃ）のヒストグラム（分布）中の８０％信頼区間以内の情報を用いるパターンの時系列情報の部分をサンプルデータとして抽出し、当該サンプルデータを用いた場合の予測精度を示している。
「標準化タイプＤ」とは、図１６の高次元特徴量情報Ｐ２（図１５の高次元の特徴群情報Ｐ２３）のうち、図１２（Ｄ）のヒストグラム（分布）中の平均値より上の情報を用いるパターンの時系列情報の部分をサンプルデータとして抽出し、当該サンプルデータを用いた場合の予測精度を示している。
「標準化タイプＥ」とは、図１６の高次元特徴量情報Ｐ２（図１５の高次元の特徴群情報Ｐ２３）のうち、図１２（Ｅ）の分布中の８０％信頼区間以外の情報を用いるパターンの時系列情報の部分をサンプルデータとして抽出し、当該サンプルデータを用いた場合の予測精度を示している。

図１７の例では、標準化タイプＥが最も予測精度が良いことがわかる。
つまり、本実施形態では、高次元の特徴群情報Ｐ２３から、任意の個数の任意の組合せ（全個数含む。つまり高次元の特徴群情報Ｐ２３そのものを含む）の情報群をサンプルデータとして用いることができる。
従って、所定の分析モデルを生成するに際し、その分析モデルが用いられる分析内容、分析手法、各種条件等に適合したサンプルデータ（図１７の例では標準化タイプＥ）を見つけることができれば、当該サンプルデータを用いて、分析内容、分析手法、各種条件等に適合した分析モデルを生成することが可能になる。

このようにして、図１７の標準化タイプＥのサンプルデータを用いて生成された分析モデルにより、実際に細胞品質変化を予測した結果が図１８に示されている。
図１８において、行方向は正答のラベルを示し、列方向は分析結果のラベルを示している。
所定種類（品質）の細胞・所定細胞培養条件の組に対して、５５回の分析が行われ、その分析結果が四角印で示されている。つまり、正答のラベルと分析結果のラベルが一致する項目に、分析結果の四角印が付されている場合、予測が成功したことを示している。
図１８に示すように、非常に高精度の予測ができていることがわかる。

図１９は、図１５乃至図１８で説明した例とは別の所定の分析モデルの生成に用いられる、複数のサンプルデータの一例を示している。
複数のサンプルデータＩｇａ乃至Ｉｇｊは、上述したように、イメージデータではなく数値化データであり、具体的にはＭ種類のパラメータを要素として含む多次元情報である。
ここで、サンプルデータを構成する１要素の数値単体も、細胞の形態的特徴量等を示す値であり、有意情報である。
しかし、これらの各要素の組合せからなるサンプルデータＩｇａ乃至Ｉｇｊは全体として、他のサンプルデータとの比較においてさらに特徴的な有意情報となる。
図１９の例では、各要素はその値に応じた色や濃度で夫々表されており、これらの各要素の色や濃度の集合として形成される「模様」が、各サンプルデータＩｇａ乃至Ｉｇｊの特徴をよく表す有意情報となっていることがわかる。

ここで、複数のサンプルデータＩｇａ乃至Ｉｇｊの夫々に対して、所定の観点で総合的なスコアが与えられるものとする。
所定の観点は特に限定されないが、説明の便宜上例えば、細胞の種類を種類Ａと種類Ｂとを分類するという観点が採用されているものとする。そして、スコアが１００に近くなる程、種類Ａに特有な特徴を多く含んでいる（種類Ｂに特有な特徴は少なくなっている）ものとする。逆に、スコアが０に近くなるほど種類Ｂに特有な特徴を多く含んでいる（種類Ａに特有な特徴は少なくなっている）ものとする。
つまり、図１９の例では、サンプルデータＩｇａは、スコアが「９０」と最高値のため、種類Ａに特有な特徴を多く含むデータである。逆に、サンプルデータＩｇｅ乃至Ｉｇｈは、スコアが「０」と最低値のため、種類Ｂに特有な特徴を多く含むデータである。サンプルデータＩｇｉは、スコアが「５０」と中央値のため、種類Ａに特有な特徴も含むし、種類Ｂに特有な特徴を含むデータである。

なお、複数のサンプルデータＩｇａ乃至Ｉｇｊの夫々に対してスコアの与え方は、特に限定されない。
例えば複数のサンプルデータＩｇａ乃至Ｉｇｊの夫々に対して、対応する評価対象情報（破壊テスト等別評価で得られた既知情報）が図２の細胞評価ＤＢ６２に格納されている場合、当該評価対象情報に基づいてスコアを与える手法を採用してもよい。

図２０は、このような図１９のサンプルデータＩｇａ乃至Ｉｇｊを用いて、所定の分析モデルを生成する手法の２つの例を示している。
具体的には上記の例にあわせると、図２０の例は、細胞の種類を種類Ａと種類Ｂに分類するための分析モデルの生成例になる。

図２０（Ａ）は、機械学習を用いた分析モデルの生成例である。
図２０（Ａ）の例では、分析モデル生成部４４は、複数のサンプルデータＩｇａ乃至Ｉｇｊを用いて機械学習を実行することにより、サンプルデータのＭ個のパラメータの各値Ｘを入力パラメータとしてスコアＹを出力する関数（同図の例では、Ｙ＝ａＸ＋ｂＸ＋ｃＸ）を生成又は更新する。

ここで、未知の種類の細胞を被写体として含む細胞画像から特徴群情報が生成されて、特徴群情報ＤＢ６１（図２）に格納されたものとする。
評価対象情報取得部４６は、当該特徴群情報から、サンプルデータＩｇａ乃至Ｉｇｊと同形態（Ｍ個のパラメータが同一）のデータを、評価対象情報として評価対象情報取得部４６から取得する。

この場合、分析部４７は、評価対象情報のＭ個のパラメータの各値Ｘを入力パラメータとして上記関数に代入することで、評価対象情報のスコアＹを算出する。
当該評価対象情報のスコアＹが１００に近い場合、当該評価対象情報に対応する細胞は、種類Ａの可能性が高いと分析されたことになる。
当該評価対象情報のスコアＹが０に近い場合、当該評価対象情報に対応する細胞は、種類Ｂの可能性が高いと分析されたことになる。
当該評価対象情報のスコアＹが中間値の場合、当該評価対象情報に対応する細胞は、種類Ａとも種類Ｂとも判断できないと分析されたことになる。

つまり、「評価対象情報のＭ個のパラメータの各値Ｘを入力パラメータとして、当該評価対象情報のスコアＹを出力する関数」は、細胞の種類を種類Ａと種類Ｂに分類するための分析モデルの一例である。

図２０（Ｂ）は、クラスタリング手法を用いた分析モデルの生成例である。
図２０（Ｂ）の例では、分析モデル生成部４４は、複数のサンプルデータＩｇａ乃至Ｉｇｊを、所定のアルゴリズムを用いてクラス分類する。クラス分類の結果できるクラスの種類や個数は、複数のサンプルデータＩｇａ乃至Ｉｇｊや所定のアルゴリズムに依存するが、ここでは、３つのクラスＣＡ，ＣＢ，ＣＮに分類されたものとする。

ここで、図２０（Ａ）の上述の例と同様に、未知の種類の細胞を被写体として含む細胞画像から特徴群情報が生成されて、特徴群情報ＤＢ６１（図２）に格納されているものとする。
評価対象情報取得部４６は、当該特徴群情報から、サンプルデータＩｇａ乃至Ｉｇｊと同形態（Ｍ個のパラメータが同一）のデータを、評価対象情報として評価対象情報取得部４６から取得する。

この場合、分析部４７は、当該評価対象情報を３つのクラスＣＡ，ＣＢ，ＣＮのうちの何れかに分類する。
当該評価対象情報がクラスＣＡに分類された場合、当該評価対象情報に対応する細胞は、種類Ａの可能性が高いと分析されたことになる。
当該評価対象情報がクラスＣＢに分類された場合、当該評価対象情報に対応する細胞は、種類Ｂの可能性が高いと分析されたことになる。
また、当該評価対象情報がクラスＣＮに分類された場合、当該評価対象情報に対応する細胞は、種類Ａとも種類Ｂとも判断できないと分析されたことになる。

つまり、「評価対象情報を３つのクラスＣＡ，ＣＢ，ＣＮのうちの何れかに分類するモデル」が、細胞の種類を種類Ａと種類Ｂに分類するための分析モデルの一例である。
ここで、クラス分類の手法は特に限定されず、例えば、サンプルデータＩｇａ乃至Ｉｇｊの夫々と評価対象情報との類似度等を夫々求め、類似度等に基づいて当該評価対象情報を分類する、という手法を採用することもできる。この手法が採用された場合、「複数のサンプルデータＩａｇ乃至Ｉｇと、これらに基づいて生成された３つのクラスＣＡ，ＣＢ，ＣＮ」により分析モデルは表される。

なお、図２０（Ｂ）では、説明の便宜上、単純なクラス分類の話をした。
実際の分析モデルは、例えば図２１に示すような、各サンプルデータに基づく領域（図２１の楕円状の実線の領域）が積み重なって表される。
即ち、図２１は、分析モデルの表現形態の一例を示している。
この分析モデル内の丸印は、サンプルデータ又は評価対象情報を示す。

評価対象情報ｑａは、種類Ａの全細胞のサンプルデータに基づく領域内に含まれている。従って、当該評価対象情報ｑａに対応する細胞は、種類Ａの可能性が非常に高いと分析されたことになる。
評価対象情報ｑｂは、種類Ａの多くの細胞のサンプルデータに基づく領域内に含まれている。従って、当該評価対象情報ｑｂに対応する細胞は、種類Ａの可能性が高い（ただし、評価対象情報ｑａと比較すると低い）と分析されたことになる。

一方、評価対象情報ｑｃは、種類Ｂの全細胞のサンプルデータに基づく領域内に含まれている。従って、当該評価対象情報ｑｃに対応する細胞は、種類Ｂの可能性が非常に高いと分析されたことになる。
評価対象情報ｑｄは、種類Ｂの多くの細胞のサンプルデータに基づく領域内に含まれている。従って、当該評価対象情報ｑｃに対応する細胞は、種類Ｂの可能性が高い（ただし、評価対象情報ｑｃと比較すると低い）と分析されたことになる。

また、評価対象情報ｑｅは、種類Ａの細胞のサンプルデータに基づく領域と、種類Ｂの細胞のサンプルデータに基づく領域との重複領域に含まれている。従って、評価対象情報ｑｅに対応する細胞は、種類Ａとも種類Ｂとも判断できないと分析されたことになる。

以上説明したように、細胞に関する分析は、分析内容、分析手法、各種条件等という点で多岐に渡る。従って、分析内容、分析手法、各種条件等に適合したサンプルデータや評価対象情報を用いる必要があり、本実施形態ではこれを可能にしている。
換言すると、本実施形態のサンプルデータは、特徴群情報を単にそのまま抽出したものではなく、分析内容、分析手法、各種条件等に適合するように、その形態（パラメータ数Ｍやパラメータの種類の組合せ等）が変化する。
そして、分析内容、分析手法、各種条件等に適合する１以上のサンプルデータから、分析モデルが生成される。従って、当該分析モデルもまた、分析内容、分析手法、各種条件等に適合するものとなっている。
そして、未知の細胞に関する分析が行われる場合、当該未知の細胞のデータとしては、サンプルデータと同一形態の評価対象情報が評価対象情報取得部４６により取得される。つまり、分析内容、分析手法、各種条件等に適合した評価対象情報が取得される。
分析部４７は、分析内容、分析手法、各種条件等に夫々適合した評価対象情報と分析モデル（サンプルデータ）とを用いて、当該未知の細胞に関する分析処理を実行する。
このようにして、分析内容、分析手法、各種条件等の違いによらず、未知の細胞に関する分析が容易かつ適切に行われる。
つまり、

さらに以下、分析部４７による分析処理と、出力情報生成部４８から出力される出力情報とについて、さらに詳しく説明する。

ここで、サンプルデータは、上述したように、Ｍ種類のパラメータ（各種の特徴パラメータや各種の付帯パラメータ）の数値の集合体、即ち数値化情報である。従って、複数のサンプルデータの集合体から生成される分析モデルもまた、数値化情報として表現することは容易である。
また、分析対象の細胞についても、評価対象情報が用いられる。この評価対象情報は、サンプルデータと同一形態の数値化情報である。
従って、このような評価対象情報と分析モデル（サンプルデータ）を利用した分析処理の結果を示す出力情報を、数値化情報の羅列（リスト等）で生成することは容易である。
しかしながら、細胞に関する分析を依頼したユーザにとっては、このような数値化情報の羅列（リスト等）だけが提示されても、分析結果等を容易に認識することはできない。
つまり、ユーザへの出力形態としては、数値化情報の羅列（リスト等）のみでは不十分であり、視認しやすい形態もあると好適である。
このようなユーザにとって視認しやすい出力形態を可能にするためには、分析モデルの表現形態が重要になってくる。
例えば上述の図２１に示す分析モデルの表現形態、即ち、各サンプルデータに基づく領域（図２１の楕円状の実線の領域）を積み重ねて分析モデルを表す形態は、ユーザにとって視認しやすい出力形態の一例である。

図２２は、分析モデルの表現形態の一例であって、図２１とは異なる例を示す図である。
図２２の例では、所定の２軸（Ｘ軸、Ｙ軸）から構成される平面上に、各サンプルデータが点としてプロットされている。各サンプルデータは、自己が属するグループに応じて色分け（同図では異なるハッチングで分類）されている。つまり、同色のサンプルデータが分布する周辺領域が、当該色に対応するグループの領域を示している。
例えば、同図中第４象限においては、サンプルデータＳＡの付近には、第１色（同図では間隔が一番狭い斜線）のサンプルデータが集中している。
つまり、同図中第４象限の領域は主に、第１色に対応する第１グループの領域であるといえる。
同様に、同図中第１象限の領域（サンプルデータＳＢの周辺領域）は主に、第２色（同図では間隔が２番目に狭い斜線）に対応する第２グループの領域であるといえる。
Ｙ軸の正側の周辺領域（サンプルデータＳＣの周辺領域）は主に、第３色（同図では間隔が一番広い斜線）に対応する第３グループの領域であるといえる。
Ｘ軸の負側の周辺領域（サンプルデータＳＤの周辺領域）は主に、第４色（同図では白抜き）に対応する第４グループの領域であるといえる。

さらに、評価対象情報ｑも、図２２の分析モデルを示す平面上にプロットすることが可能である。
これにより、ユーザは、評価対象情報ｑの配置位置はＹ軸の正側の周辺領域であるので、評価対象情報ｑに対応する細胞は第３グループに属する可能性が高い、と容易かつ即座に視認することができる。

ここで、サンプルデータや評価対象情報の各プロットの表現形態（色やシンボルの形状等）は、任意に可変できる。さらに、同一の細胞画像群から得られたサンプルデータであれば、分析内容、分析手法、各種条件等に応じて任意に表現形態を可変することができる。
例えば細胞の種類を分類するための分析モデルを表現する場合、各プロット点を種類毎に色分けをするという表現形態を採用することができる。
一方、例えば細胞の状態を判断するための分析モデルを表現する場合、各プロット点を状態毎にシンボルの形状を変えるという別の表現形態を採用することができる。例えば状態が、「良」では「〇」（丸印）となり、「中」では「△」（三角印）となり、「悪」では「△」になるような表現形態を採用することができる。
この場合、ユーザは、プロット点の色を見比べることで細胞の種類を比較することが容易かつ即座にできるし、プロットのシンボルの形状を見比べることで細胞の状態を比較することが容易かつ即座にできる。

さらにまた、Ｘ軸とＹ軸は任意の可変軸であり、ユーザの操作等により、容易に変更することが可能である。
具体的には、上述したように、サンプルデータ及び評価対象情報は、Ｍ種のパラメータを要素とする、Ｍ次元の多次元情報であると把握することができる。
従って、サンプルデータや評価対象情報のＭ種のパラメータに基づいて、２個の要素Ｘ，Ｙを生成するだけで、図２２の平面へのプロット点が容易に決定される。
ここで、Ｘ軸とＹ軸とは、特に限定されず、任意でよい。
例えば、サンプルデータや評価対象情報のＭ次元のうち任意の２次元の軸をそのまま、Ｘ軸とＹ軸として採用することもできる。
また例えば、Ｍ次元のうち、任意の数の任意の次元を組合せて新たなＸ軸を生成し、それとは独立して、任意の数の任意の次元を組合せて新たなＹ軸を生成することもできる。

さらに、分析モデルの表現形態は、２次元空間である必要は特になく、任意の次元の空間でよい。
例えば図２３は、分析モデルの表現形態の一例であって、図２１や図２２とは異なる例を示す図である。
即ち、分析モデルは、図２１や図２２の例では２次元空間で表されていたのに対して、図２３の例では３次元空間で表されている。
ここで、３次元空間を構築する３軸については、２次元の場合と全く同様に、任意の可変軸であり、ユーザの操作等により、容易に変更することが可能である。
次元の削減は、原則として、元の情報に対する情報量削減（欠落）を意味している。つまり、図２１乃至図２３の何れの空間も、サンプルデータのＭ種のパラメータからなるＭ次元空間（Ｍが４以上の場合）が射影等されたものであり、元のサンプルデータに対して何らかの情報が欠落した空間となっている。従って、図２１や図２２の２次元空間と比較して、図２３の３次元空間では、その次元数が多い分だけ情報の欠落量も少なくなるため、より多くの情報量をユーザは容易かつ即座に得ることができる。

さらにまた、分析モデルの表現形態は、サンプルデータや評価対象情報が点としてプロットされる空間である必要は特になく、サンプルデータや評価対象情報の類似度が視認可能な形態であれば足りる。
ここで、２つのデータの類似度は、例えば２つのデータ間の距離として表すことができる。つまり、距離が近いデータ程類似していることになる。
このような距離感を容易に視認可能な表現形態が空間上の点（プロット）であることから、先ず、上述の図２１乃至図２３の分析モデルの表現形態について説明した。
次に、サンプルデータや評価対象情報の類似度が容易に視認可能となる別の表現形態について、図２４を参照して説明する。

図２４は、分析モデルの表現形態の一例であって、図２１乃至図２３とは異なる例を示す図である。
図２４の例では、終端がある１本の線が、１つのデータを表している。
つまり、複数のサンプルデータの夫々を示す各線の集合体（以下、線を「枝」と呼び、枝の集合体の表現形態を「枝分岐図」と呼ぶ）は、当該複数のサンプルデータを用いて生成された分析モデルを表している。
上述したように、距離が近いほど類似しているので、距離が近い枝の集合体を、１つのグループとして把握することができる。
ここで、図２２に示されるように枝の分岐ポイントが幾つか存在するので、枝の分岐ポイントの単位毎に、階層化したグループを生成することも容易にできる。
例えば図２４の例では、第１階層においては、通常細胞と老化細胞に分類される。
さらに、夫々の第２階層においては、培養条件の違いにより複数のグループに分類されている。

さらに、評価対象情報ｑも、図２４の分析モデルを表す枝分岐図に対して、１つの枝としてプロットすることが容易に可能である。
これにより、ユーザは、枝分岐図における評価対象情報ｑの枝のプロット位置から、評価対象情報ｑに対応する細胞は、通常細胞のうち培養条件Ａのグループに属する可能性が高い、と容易かつ即座に視認することができる。

ここで、注意すべきは、図２１乃至図２４の例は、あくまでも各サンプルデータ（分析モデルの概要）と、評価対象情報との位置関係を、ユーザが容易に視認可能になるという観点で表現したものである。
つまり、上述したように、サンプルデータと評価対象情報とは、本来Ｍ次元の多次元情報である。このＭ次元を２次元や３次元に圧縮した空間として表現されたものが、図２１乃至図２４の例である。
つまり、図２の分析部４７は、実際には、２次元や３次元のデータによる類似度を演算するのではなく、Ｍ次元の各サンプルデータと、Ｍ次元の評価対象情報との類似度を演算している。
ただし、説明の便宜上Ｍ＝３として、各サンプルデータと評価対象情報との類似度の演算手法の概要について、図２５乃至図２７を参照して説明する。
つまり、図２５乃至図２７の例ででは、たまたまＭ＝３次元の空間になったに過ぎず、本来的には図２３の３次元空間とは異なるものである点に注意を要する。

図２５は、サンプルデータ及び評価対象情報の生成の基になる特徴群情報の構成例を示している。
図２５において、同図中横方向の項目は、所定細胞の細胞集団における所定観点（平均値、バランス、分布の形）での各要素（特徴パラメータ）を示している。即ち、サンプルデータの基になる特徴群情報には、図中横方向の各項目の値が、各要素の値として夫々含まれている。
同図中縦方向の項目は、所定細胞における個々の要素（特徴パラメータ）を示している。即ち、サンプルデータの基になる特徴群情報には、図中縦方向の各項目の値が、各要素の値として夫々含まれている。
なお、図２５の例では、所定容器で培養される同一種類の細胞集団を被写体として、所定の時刻に撮像された細胞画像についての、特徴群情報ＩＣｔが示されている。

この特徴群情報ＩＣｔは、細胞集団における所定観点の要素を示す横軸と、細胞の個々の要素を示す縦軸とからなる２次元空間の情報として構成されている。
ここで、単位情報Ｉｕは、所定細胞についての、所定時刻における、当該所定細胞の個についての特徴パラメータの値群（縦軸の情報群）と、当該所定細胞を含む細胞集団における所定観点での特徴パラメータの値群（横軸の情報群）とに基づいて生成された情報である。
このような単位情報Ｉｕを利用することで、所定細胞についての、所定時刻における、所定観点での細胞集団における位置付けを把握することができる。
例えば図２５の左上端の斜線が引かれた単位情報Ｉｕからは、細胞１（所定細胞）の各特徴パラメータの値（例えば長さ）についての、所定時刻における、集団細胞の各特徴パラメータの平均値といった観点（例えば集団全体の長さの平均値という観点）での比較が可能になる。

ここで、同一容器に含まれる細胞集団に対しては、時間方向にｎ回（時刻ｔ１乃至時刻ｔｎの夫々）に分けて細胞画像がその都度撮像されるものとする。
この場合、図２５の特徴群情報ＩＣｔは、同一容器に含まれる細胞集団に対して、所定の時刻ｔｋ（ｋは、１乃至ｎの範囲内の任意の整数値）に撮像された細胞画像の様子を示すものである。
つまり、図２６に示すように、同一容器に含まれる細胞集団に対して、時刻ｔ１乃至ｔｎの夫々に撮像された細胞画像の様子を示す、ｎ個の特徴群情報ＩＣｔ１乃至ＩＣｔｎが得られる。
これらｎ個の特徴群情報ＩＣｔ１乃至ＩＣｔｎを時間方向に順次積層することで、特徴群情報ＩＣが構成される。

つまり、細胞の個々の情報を示す縦軸、細胞集団の所定観点での情報を示す横軸、及び時間変化を示す奥行軸で構成される３次元空間に、単位情報Ｉｕが１以上配置された情報群が、特徴群情報ＩＣである。
ここで、単位情報Ｉｕの形態は、特に限定されないが、説明の便宜上、「有意情報（１）」であるか、「有意情報でない（０）」のかを示す２値を取る形態とする。
例えば、細胞の種類を分類する等の所定の分析内容が使われる場合において、各単位情報Ｉｕにおける各要素（各種特徴パラメータ）の値の中に、細胞の種類を分類する際に支援となる値が含まれている可能性がある。このような値が含まれていれば、当該単位情報Ｉｕは「有意情報（１）」となる。一方、細胞の種類を分類する際に支援となる値が含まれていなければ、当該単位情報Ｉｕは「有意情報でない（０）」となる。
つまり、同一容器に含まれる同一種類の細胞であっても、個々の細胞の特徴、細胞集団の中での所定観点での位置付け、時間変化等に応じて、「有意情報（１）」になる場合もあるし、「有意情報でない（０）」となる場合もある。

分析モデル生成部４４（図２）は、同一容器に含まれる同一種類の細胞について時刻ｔ１乃至ｔｎの夫々に撮像されたｎ枚の細胞画像を１つの単位として、１つの特徴群情報ＩＣを構築し、その１単位の特徴群情報ＩＣの中から、「有意情報（１）」となる単位情報Ｉｕのみを抽出する。
分析モデル生成部４４は、このようにして抽出した複数個の単位情報Ｉｕの集合体を、サンプルデータとして生成する。
ここで、単位情報Ｉｕは、図２６に示すように、特徴群情報ＩＣを構築する３次元空間上の位置座標、つまり３次元情報で表すことができる。
即ち、図２７に示すように、特徴群情報Ｉｃを構築する３次元空間上に夫々配置された、「有意情報（１）」の単位情報Ｉｕ（図２７ではハッチングが付された単位情報Ｉｕ）の集合体が、サンプルデータになる。
例えば、図２７の右上のサンプルデータＩＣＳ１が、種類Ａを示すものであるとする。また例えば、図２７の中央下のサンプルデータＩＣＳ２が、種類Ｂを示すものであるとする。
つまり、これらサンプルデータＩＣＳ１，ＩＣＳ２等の集合体が、細胞の種類を種類Ａと種類Ｂに分類する分析モデルとなる。

換言すると、単位情報Ｉｕとは、図２５の例でいえば、所定細胞単体の１０個の要素（特徴パラメータ）と、集団情報の所定観点の１０個の要素（特徴パラメータ）とを少なくとも含む特徴群情報が基礎となっている。これの各要素が、「有意情報（１）」か「有意情報でないか（０）」の観点でまとめられて、「有意情報（１）」の単位情報Ｉｕが夫々、特徴群情報ＩＣを構築する３次元空間上の位置座標、つまり３軸の要素で表されるようになったものである。
即ち、少なくとも２０次元以上の特徴群情報から３次元のサンプルデータが抽出されたことと等価になる。

ここで、同一容器に含まれる未知の種類の細胞集団についても、時刻ｔ１乃至ｔｎの夫々に撮像されたｎ枚の細胞画像が１単位となり、この１単位が分析対象として与えられたものとする。
この場合、評価対象情報取得部４６は、上述のサンプルデータＩＣＳ１，ＩＣＳ２と全く同様の手法で構築されるデータを、図２７の左上に示す評価対象情報Ｉｃｔとして取得する。

分析部４７は、評価対象情報ＩｃｔとサンプルデータＩＣＳ１との距離を算出することで類似度を求める。同様に、分析部４７は、評価対象情報ＩｃｔとサンプルデータＩＣＳ２との距離を算出することで類似度を求める。
距離の算出手法は、特に限定されず、例えばユークリッド距離やマハラノビスの距離の手法を採用することができる。
図２７の例では、評価対象情報ＩｃｔとサンプルデータＩＣＳ２との距離の方が、評価対象情報ＩｃｔとサンプルデータＩＣＳ１との距離よりも近いので、評価対象情報ＩｃｔはサンプルデータＩＣＳ２に類似していると判断される。
即ち、評価対象情報Ｉｃｔに対応する細胞は、サンプルデータＩＣＳ２が示す種類Ｂの可能性が高いと分析されたことになる。

出力情報生成部４８は、このようにして分析部４７により分析された結果と、評価対象情報取得部４６により取得された評価対象情報とを含む出力情報を生成して、出力部１６や外部装置８１に出力する。

図２８は、出力情報を示す画面の一例を示している。
図２８の例の画面Ｇ０には、分析対象の細胞（培養中の細胞）の種類等の分析結果が、数値を羅列したリストだけではなく、ユーザに視認しやすい所属スペースマップや所属マップとして表示される。

所属スペースマップは、図２３を用いて上述したように、任意の軸の３次元空間上に、各種サンプルデータと、分析対象の細胞（培養中の細胞）を示す評価対象情報とを点でプロットしたマップである。図２８の例では「Ｑｕｅｒｙ」と記載されたプロット点（丸印）が、評価対象情報を示している。

画面Ｇ０においては、図２９に示すように、所属スペースマップの代わりに、所属マップを表示させることも可能である。
所属マップは、図２３を用いて上述したように、各種サンプルデータを１つの枝（線）と見立てて、近い枝ほど類似している様子を示す枝分岐図である。図２７の例では「Ｑｕｅｒｙ」と記載されたプロット点（丸印）が、評価対象情報を示している。
このように、ユーザは、所属スペースマップや所属マップをみるだけで、評価対象の細胞の分析結果（どのような種類に属する可能性が高いのか等）を即時かつ容易に視認することができるので、便宜である。

その他特徴的なことは、分類結果を確率（可能性）で提示していることである。
つまり、種類Ａと断定するのではなく、種類Ａのサンプルとの類似度（種類Ａになる確率）という観点で提示している。
これにより、ユーザにとってはより正確で有意な情報が得られる。例えば、上述したように、種類Ａと種類Ｂの両方の可能性がある場合に、種類Ａの可能性が少し高いだけなのに種類Ａと断定された結果が提示されたとする。この場合、実際には種類Ｂであるとすると間違った分析結果を伝えたことになり、ユーザにとって後々困ったことが起こり得る。
これに対して、本実施形態では、種類Ａと種類Ｂの両方の可能性があることが提示される。これにより、種類Ｂとなる可能性も考慮してユーザは検討できるので、実際に種類Ｂであった場合にも容易に対処することができる。

別な特徴的なこととしては、種類（細胞腫）を示す「評価確率」のみならず、「相同性スコア」も提示していることである。
即ち、説明の便宜上、細胞の種類を分類する分析手法を主に説明してきたが、サンプルデータと評価対象情報を同様に比較して分析することにより、「由来」の類似度も出力することが可能である。この「由来」の類似度が、相同性スコアである。
例えばランキング２位と３位のサンプルデータを比較すると、評価確率（種類の類似度）は２位のサンプルデータが「７８」であるのに対して、３位のサンプルデータが「７５」と大差ない。しかしながら、相同性スコア（由来の類似度）では、２位のサンプルデータが「８０」であるのに対して、３位のサンプルデータが「７０」と差が大きい。従って、ユーザは、分析対象の細胞の「由来」は、「脂肪」ではなく「骨髄」であるとある程度判断することが容易にできる。

以上本発明の一実施形態について説明したが、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものである。

換言すると、本発明が適用される細胞分析用データ生成装置は、次のような構成を取れば足り、その実施の形態は特に限定されない。つまり、上述の細胞分析装置１は、細胞分析用データ生成装置の一例である。

つまり、本発明が適用される細胞分析用データ生成装置は、
複数の細胞からなる細胞集団を被写体として撮像された細胞画像の中から、所定条件により選定された１枚以上の細胞画像を単位として、前記単位に含まれる１以上の細胞画像のデータに基づいて、
前記細胞の単体の形態的特徴又は前記細胞集団の形態的特徴に関するＮ種類（Ｎは１以上の整数値）の特徴パラメータの値を含む情報を、特徴群情報として生成する特徴群情報生成手段（例えば図２の特徴群情報生成部４２）と、
細胞に関する所定の分析を行うときに用いる情報として、前記特徴群情報に含まれる前記Ｎ種類の特徴パラメータのうち少なくとも１種類に基づいて、Ｍ種類（ＭはＮとは独立した整数値）のパラメータの値から構成される情報（例えば分析モデル生成時のサンプルデータ、当該分析モデルを用いて分析される対象の評価対象情報）を取得する情報取得手段（例えば分析モデル生成部４４や評価対象情報取得部４５）と
を備える細胞分析用データ生成装置である。
これにより、各種の分析モデル毎に適合する細胞分析用情報を効率的に生成することができる。

一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えば汎用のパーソナルコンピュータであってもよい。

このようなプログラムを含む記録媒体は、ユーザにプログラムを提供するために装置本体とは別に配布される図１のリムーバブルメディア３１により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成される。リムーバブルメディア３１は、例えば、磁気ディスク（フロッピディスクを含む）、光ディスク、又は光磁気ディスク等により構成される。光ディスクは、例えば、ＣＤ−ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｋ−ＲｅａｄＯｎｌｙＭｅｍｏｒｙ），ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋ）等により構成される。光磁気ディスクは、ＭＤ（Ｍｉｎｉ−Ｄｉｓｋ）、等により構成される。また、装置本体に予め組み込まれた状態でユーザに提供される記録媒体は、例えば、プログラムが記録されている図３のＲＯＭ１１２，図５のＲＯＭ２１２や、図２の記憶部１１８，図５の記憶部２１６に含まれるハードディスク等で構成される。

なお、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的或いは個別に実行される処理をも含むものである。

１・・・細胞分析装置、１１・・・ＣＰＵ、１６・・・出力部、１８・・・記憶部、３１・・・リムーバブルメディア、４１・・・細胞画像入力部、４２・・・特徴群情報生成部、４３・・・ノイズ除去部、４４・・・分析モデル生成部、４５・・・評価対象情報取得部、４６・・・評価対象情報取得部、４７・・・分析部、４８・・・出力情報生成部、６１・・・特徴群情報ＤＢ、６２・・・細胞評価ＤＢ、６３・・・分析モデル保持部、８１・・・外部装置、８２・・・前処理装置、９１・・・画像数値化部、９２・・・複数画像特徴群情報生成部、９３・・・ヘテロ性情報付加部、９４・・・経時変化情報付加部、９５・・・特徴群情報出力部９５、１０１・・・数値化情報蓄積部、１０２・・・第１特徴群情報蓄積部、１０３・・・第２特徴群情報蓄積部、１０４・・・第３特徴群情報蓄積部１０４

Claims

複数の細胞からなる細胞集団を被写体として撮像された細胞画像の中から、所定条件により選定された１枚以上の細胞画像を単位として、前記単位に含まれる１以上の細胞画像のデータに基づいて、前記細胞の単体の形態的特徴又は前記細胞集団の形態的特徴に関するＮ種類（Ｎは１以上の整数値）の特徴パラメータの値を含む情報を、特徴群情報として生成する特徴群情報生成手段と、
細胞に関する所定の分析を行うときに用いる分析用情報として、前記特徴群情報に含まれる前記Ｎ種類の特徴パラメータのうち少なくとも１種類に基づいて、Ｍ種類（ＭはＮとは独立した整数値）のパラメータの値から構成される情報を取得する情報取得手段と
を備える細胞分析用情報生成装置。
前記Ｎ種類の特徴パラメータは、前記細胞集団における所定観点での特徴パラメータを１種類以上含んでおり、
前記情報取得手段は、前記細胞集団における所定観点での前記特徴パラメータを少なくとも含む１種類以上の特徴パラメータに基づいて、前記分析用情報を取得する、
請求項１に記載の細胞分析用情報生成装置。
前記特徴群情報の生成元となる前記単位を構成する前記細胞画像の少なくとも一部は、撮像タイミングが異なっており、
前記分析用情報は、前記細胞画像の撮像タイミングを特定可能な時間情報を、前記Ｍ種類のパラメータの値の１つとして含む、
請求項１又は２に記載の細胞分析用情報生成装置。
細胞に関する所定の分析を行うときに用いる情報を生成する細胞分析用情報生成装置が実行する細胞分析用情報生成方法であって、
複数の細胞からなる細胞集団を被写体として撮像された細胞画像の中から、所定条件により選定された１枚以上の細胞画像を単位として、前記単位に含まれる１以上の細胞画像のデータに基づいて、前記細胞の単体の形態的特徴又は前記細胞集団の形態的特徴に関するＮ種類（Ｎは１以上の整数値）の特徴パラメータの値を含む情報を、特徴群情報として生成する特徴群情報生成ステップと、
細胞に関する所定の分析を行うときに用いる情報として、前記特徴群情報に含まれる前記Ｎ種類の特徴パラメータのうち少なくとも１種類に基づいて、Ｍ種類（ＭはＮとは独立した整数値）のパラメータの値から構成される情報を取得する情報取得ステップと
を含む細胞分析用情報生成方法。
細胞に関する所定の分析を行うときに用いる情報を生成するコンピュータに、
複数の細胞からなる細胞集団を被写体として撮像された細胞画像の中から、所定条件により選定された１枚以上の細胞画像を単位として、前記単位に含まれる１以上の細胞画像のデータに基づいて、前記細胞の単体の形態的特徴又は前記細胞集団の形態的特徴に関するＮ種類（Ｎは１以上の整数値）の特徴パラメータの値を含む情報を、特徴群情報として生成する特徴群情報生成ステップと、
細胞に関する所定の分析を行うときに用いる情報として、前記特徴群情報に含まれる前記Ｎ種類の特徴パラメータのうち少なくとも１種類に基づいて、Ｍ種類（ＭはＮとは独立した整数値）のパラメータの値から構成される情報を取得する情報取得ステップと
を含む制御処理を実行させるプログラム。