JP4761838B2 - タンパク質溶液の析出物を判定する方法及びシステム - Google Patents

タンパク質溶液の析出物を判定する方法及びシステム Download PDF

Info

Publication number
JP4761838B2
JP4761838B2 JP2005157108A JP2005157108A JP4761838B2 JP 4761838 B2 JP4761838 B2 JP 4761838B2 JP 2005157108 A JP2005157108 A JP 2005157108A JP 2005157108 A JP2005157108 A JP 2005157108A JP 4761838 B2 JP4761838 B2 JP 4761838B2
Authority
JP
Japan
Prior art keywords
image
protein solution
feature amount
precipitate
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005157108A
Other languages
English (en)
Other versions
JP2006258785A (ja
Inventor
邦明 川端
一 淺間
六徳 ▲高橋▼
佳奈子 齊藤
健稔 三島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
RIKEN Institute of Physical and Chemical Research
Original Assignee
RIKEN Institute of Physical and Chemical Research
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by RIKEN Institute of Physical and Chemical Research filed Critical RIKEN Institute of Physical and Chemical Research
Priority to JP2005157108A priority Critical patent/JP4761838B2/ja
Publication of JP2006258785A publication Critical patent/JP2006258785A/ja
Application granted granted Critical
Publication of JP4761838B2 publication Critical patent/JP4761838B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Analysing Materials By The Use Of Radiation (AREA)
  • Image Processing (AREA)

Description

本発明は、タンパク質溶液におけるタンパク質結晶生成を自動化するための方法及びシステムに関し、特に、タンパク質溶液の析出物がX線構造解析法により解析可能な状態であるか否かを判定する方法及びシステムに関する。
近年、構造ゲノム科学においては、創薬や生命活動の理解のためにタンパク質の構造と機能を解明することが主要な課題となっている。そこで、大量のタンパク質の結晶構造を、高速で解析することが望まれる。従来より、タンパク質の結晶構造を解析するためにX線結晶構造解析法が用いられている。かかる構造解析法においては、構造解析対象のサンプルとなるタンパク質の良質な結晶を得るために、構造解析サンプル作成の準備として、タンパク質の水溶液から水分を蒸発させて結晶を生成する方法(結晶化法)が用いられている。この際、タンパク質溶液から結晶がえられているかどうかを判定(観察)する作業が行われている。
従来のこの判定作業では、結晶状態を顕微鏡画像から人の目で逐次検討し、そのサンプルの結晶生成の様子を判定している。この判定においては、サンプルのタンパク質溶液が、溶液のままであるか、沈殿を起こしているか、微結晶が得られているか、あるいは、結晶が得られているかが判定される。表1に、このスクリーニングにおいて用いられる判定基準を示す。
Figure 0004761838
表1において、「透明」とは、タンパク質溶液が何らの結晶も生成しない様子を表している。また、「沈殿」は、4つに分類される。即ち、粒が見られず黒ずんでいたり褐色を示すもの(沈殿(i))、点状の組織が観察されるもので白色にみえ、少し点々があるもの(沈殿(ii))、アモルファス様の組織で透明に見えることがあるもの(沈殿(iii))、大きなアモルファス様の組織で粒子が見えることがあるもの(沈殿(iv))に分類される。また、結晶が生成されているものは、5つに分類される。即ち、50μm程度以下の結晶で頂点が観察されるもの(微結晶)、針状結晶が観察されるもの(結晶(i))、板状結晶が観察されるもの(結晶(ii))、重なり合った結晶が観察されるもの(結晶(iii))、良質な結晶が観察されるもの(結晶(iv))というように分類される。便宜的に、各分類に対してスコアとなる数字が割り当てられて分類されることもある。ただし、タンパク質の結晶の成長過程に従ってこのスコアが順次増してゆくように変化するものとは限らない。このように分類される画像の様式図を、スコアごとに図1に示す。タンパク質溶液の結晶化実験においてサンプル数は多数であるため、これらに分類することは、大変有用な手段となる。
従来の人の観察を基礎とする判定作業では、観察者はトレーニングによって養成されて、経験的にこのような分類を行うことができるようになる。そして、養成された観察者が多数のサンプルについて得た顕微鏡画像を観察して選別を行なう。このときに判定された分類は、それ自体も、X線構造解析向けのサンプルについての有用な情報であり、タンパク質の構造解析や性質の決定に際して重要な指標となっている。
この結晶を得るための手法においては、例えば、沈殿剤を加えた微量のタンパク質溶液をオイル層中に静置させて蒸発を行う手法(マイクロバッチ法)、タンパク質溶液をカバーガラスの下面に下垂させて蒸発を行う手法(ハンギングドロップ蒸気拡散法)、タンパク質溶液を蒸発容器の上に載置させて蒸発を行う手法(シッティングドロップ蒸気拡散法)等が用いられる。
表1に示した透明、沈殿(i)、沈殿(ii)、沈殿(iii)に未知タンパク質溶液のサンプルが分類されることが多いが、これ等に分類されるサンプルは、いまだ結晶が生成されておらず、観察者がこれらを全て観察するのは、効率が悪い。ここで、顕微鏡画像に対してテクスチャ解析の手法を用いて、機械化したタンパク質溶液の結晶化状態判定方法が、本願発明者の一部により見出されている。(特許文献1を参照)しかし、依然として、結晶が生成された、沈殿(iv)、微結晶、結晶(i)、結晶(ii)、結晶(iii)、及び結晶(iv)については、それぞれの判別が困難である。
特開2005−9949号公報
上記従来のタンパク質溶液の結晶化状態判定方法では、人の目による分類が欠かせず、判定作業で処理できるサンプルの数に限界がある。また、その分類基準についても、観察者ごとに判定が異なる場合があり、同じ観察者であっても繰り返し同じ判定が行えない場合がある。ここでは、多数のサンプルの判定を行なうために、自動分注等がしやすく、1つのサンプルに必要な試料の容量が少量でよい手法が望まれる。
本発明は、従来のタンパク質溶液の結晶化状態判定方法を、顕微鏡画像に対して機械化することを課題とし、より具体的には、タンパク質溶液内に何らかの結晶状のものが析出した際に、X線構造解析法により解析可能なものであるか否かを判定する方法及びシステムを提供する。また、機械化されて自動撮影される顕微鏡画像においても良好に判定が行なえる判定方法を提供し、撮影から判定までを機械化することができるような効率の高い安定したタンパク質の結晶化状態の判定を可能にする方法やシステムを提供することを課題とする。
上記目的を達成するために、本発明に係るタンパク質溶液の析出物の結晶構造解析可能性の判定方法は、タンパク質溶液の電子画像を取得して原画像とする原画像取得ステップと、前記原画像における析出物の輪郭線を抽出し、2値エッジ検出画像を作成する前処理ステップと、前記2値エッジ検出画像の画素の状態を、ある角度で走査して順次決定し、該角度を変化させて走査と決定を繰り返し、それぞれの角度に対して前記輪郭線の一部となる線分に関するデータを求めて、該データから前記析出物の結晶化状態を反映する特徴量を求める特徴量抽出ステップと、前記特徴量に基づいて、タンパク質溶液の前記電子画像を判別する判別ステップとを含むものである。また、前記特徴量抽出ステップは、前記2値エッジ検出画像における析出物の輪郭線に含まれる線分の本数とそれらの線分のもつ最大長とを求めることを含むことができる。さらに、前記特徴量抽出ステップは、前記2値エッジ検出画像における析出物の輪郭線を抽出し、該輪郭線をある間隔で区切ることによって複数の線分にし、該線分間がなす角度を計測することによって、該輪郭線に対して、直線状に接続された区間の割合を求めることを含むこともできる。
さらに、本発明に係るタンパク質溶液の析出物の結晶構造解析可能性の判定方法は、予め、学習用画像より判定基準を設定する。つまり、判別すべきカテゴリがわかっている複数の学習用画像よりタンパク質溶液の析出物の結晶状態を反映する特徴量を予め抽出し、特徴量の分布を取得するステップと、前記学習用画像の特徴量の分布に基づいて、タンパク質溶液の析出物の結晶状態を複数のカテゴリに判別する識別境界を設定するステップとを含むことが好適である。ここで、識別境界の設定ステップは、各カテゴリの学習用画像の特徴量の分布に対して、マハラノビス距離が等しくなる特徴量空間における線又は面を求めて前記識別境界とするステップであることがさらに好適である。また、本発明では、コンピュータ装置がモニター上に前記識別境界を表示する、又は、コンピュータ装置が前記識別境界より析出物の結晶構造解析可能性を判定する。
また、本発明に係るタンパク質溶液の析出物の結晶構造解析可能性の判定方法は、前記前処理ステップが、カラー画像である前記原画像をグレースケール画像に変換するステップと、前記グレースケール化された画像に対して、タンパク質溶液部の領域を切り出すステップと、前記タンパク質溶液部の領域の画像をSobel変換して析出物の輪郭線画像を得るステップと、前記輪郭線画像を2値化して2値エッジ検出画像を得るステップとを含むことが好適である。
上記目的を達成するために、本発明に係るタンパク質溶液の析出物の結晶構造解析可能性の判定システムは、タンパク質溶液の電子画像を取得して原画像とする原画像取得手段と、前記原画像における析出物の輪郭線を抽出し、2値エッジ検出画像を作成する前処理手段と、前記2値エッジ検出画像の画素の状態を、ある角度で走査して順次決定し、該角度を変化させて走査と決定を繰り返し、それぞれの角度に対して前記輪郭線の一部となる線分に関するデータを求めて、該データから前記析出物の結晶化状態を反映する特徴量を求める特徴量抽出手段と、前記特徴量に基づいて、タンパク質溶液の前記電子画像を判別する判別手段とを含むものである。また、前記特徴量抽出手段は、前記2値エッジ検出画像における析出物の輪郭線に含まれる線分の本数とそれらの線分のもつ最大長とを求める処理を行うことができる。さらに、前記特徴量抽出手段は、前記2値エッジ検出画像における析出物の輪郭線を抽出し、該輪郭線をある間隔で区切ることによって複数の線分にし、該線分間がなす角度を計測することによって、該輪郭線に対して、直線状に接続された区間の割合を求める処理を行うことができる。
さらに、本発明に係るタンパク質溶液の析出物の結晶構造解析可能性の判定システムは、予め、学習用画像より判定基準を設定する。つまり、判別すべきカテゴリがわかっている複数の学習用画像よりタンパク質溶液の析出物の結晶状態を反映する特徴量を予め抽出し、特徴量の分布を取得する手段と、前記学習用画像の特徴量の分布に基づいて、タンパク質溶液の析出物の結晶状態を複数のカテゴリに判別する識別境界を設定する手段とを含むことが好適である。ここで、識別境界の設定手段は、各カテゴリの学習用画像の特徴量の分布に対して、マハラノビス距離が等しくなる特徴量空間における線又は面を求めて前記識別境界とする手段であることがさらに好適である。また、本発明では、コンピュータ装置がモニター上に前記識別境界を表示する、又は、コンピュータ装置が前記識別境界より析出物の結晶構造解析可能性を判定する。
また、本発明に係るタンパク質溶液の析出物の結晶構造解析可能性の判定システムは、前記前処理ステップが、カラー画像である前記原画像をグレースケール画像に変換するステップと、前記グレースケール化された画像に対して、タンパク質溶液部の領域を切り出すステップと、前記タンパク質溶液部の領域の画像をSobel変換して析出物の輪郭線画像を得るステップと、前記輪郭線画像を2値化して2値エッジ検出画像を得るステップとを含むことが好適である。
本発明では、タンパク質溶液の原画像より特徴量を抽出し、該特徴量より析出物のカテゴリを判別することによって、タンパク質溶液の析出物がX線構造解析によって解析可能であるか否かを良好に判定することができる。さらに本発明の解析システムに、タンパク質溶液の析出物の自動観察手段を組み合わせれば、タンパク質の観察とそのタンパク質の析出物の判定とを連続して自動で行なうタンパク質結晶状態観察解析システムを構築することができる。
具体的には、本発明は、析出した結晶状のものが、沈殿(iv)及び微結晶である状態と、結晶(i)、結晶(ii)、結晶(iii)及び結晶(iv)である状態とに判別することができる。
本発明は、コンピュータ装置を用いて実施される。このコンピュータには、適当な画像入力手段が接続されている。その画像入力手段は、例えば顕微鏡に備えられたCCD(電荷結合デバイス)などの撮像装置、A/Dコンバータ、適当なメモリなどによって電子的な画像を取得し、コンピュータに入力する。また、コンピュータには、演算装置、記憶装置、表示装置、通信装置などの通常の装置が備えられる。本発明の各ステップや各手段は、演算装置に実現された機能ブロックとして処理が行われ、機能が実現される。例えば、判定ステップや判定手段は、演算装置において、記憶装置から読み込まれたプログラムが必要なレジスタやメモリによって構成される記憶動作と演算処理動作によって判定を行なう機能として実現される。本発明は、このようなコンピュータを用いて、画像処理及び画像の分類を用いて、タンパク質溶液の析出物が、構造解析により結晶構造が解析可能であるか否かを判定する方法と手段とを提供するものである。
[実施形態1]
以下、図面を参照して、本発明の第1の実施の形態について説明する。図2は、本発明において観察対象の溶液においてタンパク質の結晶化(析出)をさせるための説明図である。本実施形態においては、タンパク質の結晶を得るためにマイクロバッチ法を用いた。
まず、沈殿剤を加えた微量のタンパク質溶液1を、オイル層中2に静置させる(図2(a))。続いて、沈殿剤を加えた微量のタンパク質溶液1内において、タンパク質の結晶3の有無を確認する。マイクロバッチ法は、図2(b)に示すように、微量試料でも適用可能なように改良されたバッチ法のバッチ効果4だけでなく、沈殿剤を加えた微量のタンパク質溶液1のオイル層への水分拡散効果5も生じさせ、溶解度曲線6の上側においてタンパク質の結晶3を得る方法である。
このようなサンプルでは、数日から数ヶ月の時間をかけて、溶液中の水分が減少してゆき、タンパク質の飽和溶解度に達すると、徐々にタンパク質の結晶が成長してゆくことがある。タンパク質の種類によっては、全く結晶を生成しない場合や、沈殿を生じる場合もある。
図3は、本実施形態の結晶化状態判定システム100の構成を説明する構成図である。本システムには、原画像取得部42、前処理部10、特徴量抽出部20、及び判別部30が備えられている。さらに、前処理部10には、グレースケール化部12、画像切り出し部14、Sobel変換部16、及び2値化部18が備えられており、特徴量抽出部20には、全方向線分計測部22、及び抽出部26が備えられており、判別部30には、判別作業部32が備えられている。さらに本システムは、学習データの特徴量分布の取得部44、識別面の設定部45、及び判定基準格納部46を備えている。本システムは、タンパク質溶液の画像について、外部にある撮影装置40から電子画像のデータ41を取得し、そのタンパク質溶液の析出物がいずれのカテゴリであるかを判別し、その析出物状態のデータ47を出力する。
原画像取得部42は、例えば顕微鏡に備えられた撮影装置40によって撮影され、デジタル化された電子画像のデータ41を取得して、その電子画像を調整して原画像データ43とする。ここでの調整とは、デジタル化されたデータの明度等を適切な範囲に調整したり、計算に十分な範囲で階調の削減を行ったり、必要な領域を切り出す処理などの一般的な処理を指している。
本発明では、前処理部10により、高い精度の判別結果を得るために、原画像データ43を予め調節する。この前処理部10によって、さらに、原画像取得部42から原画像データ43を取得した後、グレースケール化部12、画像切り出し部14、Sobel変換部16、及び2値化部18を用いて、析出物の輪郭線の2値エッジ検出画像を作成する。以下では、前処理部10の構成要素を順次説明していく。
[グレースケール化]
本発明は、計算処理過程において、原画像データ43の色情報を必要としない。グレースケール化部12は、例えば、RGB各色が256階調である原画像データ43を、256階調のグレースケール画像に変換する。
[画像の切り出し]
本発明のタンパク質結晶状態を判定する方法及びシステムは、グレースケール化を行った画像データに対して、処理対象の領域、すなわち、画像中のタンパク質溶液部分のみを切り出す。画像切り出し部14は、例えば、画像サイズが1392×1040画素である画像データを、処理対象の領域として450×450画素の画像サイズに切り出す。
[Sobel変換]
次に、前処理部10は、画像の切り出しを行った画像データに対して画像中の析出物の輪郭線を検出する代表的な手法の一つであるSobel変換を行なう。Sobel変換部16は、図4(a)に示すように、画像の各画素値を、処理前の画像の対応するスターで示す画素52の画素値とその周囲の近傍にある8つの黒丸で示す画素54の画素値との総合的な差(勾配の大きさを表わす)に置き換えることができる。従って、図4(b)に示すように、処理前の画像中にある析出物と背景の境界といったような、急激に画素値が変化する部分56において勾配は大きな値となり、その部分の画素値も大きくなる。なお、勾配の大きさが、グレースケール画像で表現できる最大階調値である255以上の値となった場合には、勾配の大きさは255とする。
[2値化]
次に、前処理部10により、その2値化部18を用いて、Sobel変換を行った画像を2値エッジ検出画像とする。具体的には、2値化部18では、ある閾値を設けることで、閾値以上の値をもつ画素を白画素、閾値未満の値をもつ画素を黒画素とし、処理前の画素において析出物の輪郭線を示す画素(エッジ画素)を白、背景を示す画素(背景画素)を黒とする。
クリア(スコア0)はタンパク質溶液に析出物が何も存在していない状態を示すものである。しかし、Sobel変換を行なうと、溶液の部分的な濃度差等も微小な勾配として検出されてしまう。このような計測対象とすべきでない微小な勾配は、その後の処理におけるノイズとなる。そこで、クリア(スコア0)の100枚程度の多くのサンプル画像に対する勾配の大きさの分布を前もって調べ、この分布より微小な勾配を遮断するために十分な閾値を求める。前処理部10においては、例えば、2値化閾値を勾配の大きさを示す値として29とすることができる。
さらに、特徴量抽出部20は、前処理部10で得た2値エッジ検出画像を取り込み、析出物の輪郭の一部となる線分の最大長Lmaxとその線分の総本数Nallとを求める。この場合、特徴量抽出部20は、全方向線分計測部22と抽出部26とで構成される。
[全方向線分計測]
2値エッジ検出画像における線分の方向がランダムであるため、全方向線分計測部22は、画像を構成する画素の状態を、一定の角度で一画素ずつ順次に決定していく。次に、全方向線分計測部22は、例えば、前記一定の角度を1度ずつ変化させ、それぞれの角度に対して輪郭線の一部となる線分の長さと各長さの線分の本数とを求める。図5に示すように対象画像に対して0〜179度の範囲で1度ずつずらしながらラスタ走査を行っていく。つまり、一般にラスタ走査では、対象画像の左上端から水平右方向に走査して行き、画素の右端に行き着いた場合には、一段下がった行の左端から、再び水平右方向に走査して行く。
次に、全方向線分計測部22は、走査線上においてエッジ画素64を発見した場合、その画素を線分nの始点Sn(xsn,ysn)とする。さらに、全方向線分計測部22は、線分nに対するエッジ画素の連結性をみてゆき、エッジ画素が途切れた場合、最後のエッジ画素を線分nの終点En(xen,yen)とする。そして全方向線分計測部22は、始点と終点より長さLを計算し、長さ別に線分の本数をカウントする(図6)。なお線分の長さLは、
Figure 0004761838
とする。以上より、図7に示す2値エッジ検出画像の線分の長さの分布を示すヒストグラムを作成することができる。
[特徴量抽出]
抽出部26は、求めたヒストグラムより、特徴量である最大長と総本数とを求める。最大長と総本数は、それぞれ、
Figure 0004761838
Figure 0004761838
により求められる。
さらに、本発明では、学習データの特徴量分布の取得部44と識別面の設定部45とを用いて、予め識別面68を設定する。
[学習データの特徴量分布の取得]
学習データの特徴量分布の取得部44では、X線構造解析法により解析可能であることがわかっている析出物の複数の画像(学習データ)に対して、特徴量である最大長と総本数とを予め求める。次に、求めた特徴量を、図8に示すように、横軸を最大長、縦軸を総本数として空間(特徴量空間)にプロットする。
[識別面の設定]
続いて、識別面の設定部45では、学習データの特徴量分布の取得部44で求めた学習データの特徴量群に対して、マハラノビスの汎距離による判別分析を行なう。マハラノビスの汎距離による判別分析とは、判別したい2つのカテゴリ分布が特徴量空間にある場合、どちらかのカテゴリに属する新しいデータに対して誤判別される確立率を出来る限り小さくするための識別面68を、特徴量空間に設定するものである。例えば、判別器を構成するために用いるカテゴリAとカテゴリBに属する学習データについて、カテゴリAに属する学習データは、最大長の平均を
Figure 0004761838
とし、総本数の平均を
Figure 0004761838
とし、最大長・総本数の分散共分散行列を
Figure 0004761838
とする。同様に、カテゴリBに属する学習データは、最大長の平均を
Figure 0004761838
とし、総本数の平均を
Figure 0004761838
とし、最大長・総本数の分散共分散行列を
Figure 0004761838
とする。ここで、正解カテゴリ未知のデータXの最大長をLmax,x、総本数をNall,xとすると、データXとカテゴリAとのマハラノビスの汎距離は、
Figure 0004761838
で求めることができ、同様に、データXとカテゴリBとのマハラノビスの汎距離は、
Figure 0004761838
で求めることができる。ここで、マハラノビスの汎距離による判別分析が、DA 2<DB 2である場合、データXはカテゴリAに属すると判別でき、DA 2>DB 2である場合は、データXはカテゴリBに属すると判別できる。さらに、DA 2=DB 2である場合は、データXは、カテゴリAとカテゴリBとを分ける識別面上にあると判別することができる。図9に示すように、特徴量空間に設定された識別面68が、カテゴリを判別する境界線である。
判別部30は、判別作業部32を含み、正解未知の画素データを入力として受けとり、X線構造解析法により解析可能であるか否かを判定する。
[判別作業]
判別作業部32は、正解未知である画像データの特徴量を、特徴量空間にブロットし、判別されたカテゴリよりX線構造解析法により解析可能であるか否かの判別を行なうことができる。
次に、本発明の実施の形態における結晶化状態判定システムの学習時の処理のフローチャートを図12に示す。本発明の実施の形態では、まず、タンパク質溶液の画像を取得して原画像とする(ステップ70)。次に、原画像をグレースケール画像に変換し(ステップ71)、前記グレースケール画像に対して、タンパク質溶液部の領域を切り出し(ステップ72)、続いてタンパク質溶液部の領域の画像をSobel変換する(ステップ73)。さらに、Sobel変換の画像から2値エッジ検出画像を得る(ステップ74)。次いで、前記2値エッジ検出画像より、析出物の特徴量を抽出する(ステップ75)。そして、その特徴量をプロットし、特徴量の分布を作成する(ステップ77)。続いて、特徴量の分布に基づいて、識別境界を設定する(ステップ78)。以上の処理を、複数の学習用画像に対して行う。
また、本発明の実施の形態における結晶化状態判定システムを用いて、タンパク質溶液を分類する処理のフローチャートを図13に示す。まず、学習によって得た識別境界を読み込む(ステップ80)。次のステップ81〜86は、先に説明した学習時の処理のステップ70〜75と同様であり、これらのステップにより、タンパク質溶液の画像から、析出物の特徴量を抽出する。続いて、抽出した特徴量と既に設定した識別境界とを用いて、タンパク質溶液の画像を判別する(ステップ87)。
[実施形態2]
次に本発明の第2の実施形態について説明する。図10に示すように、本実施形態の結晶化状態判定システムは、全方向線分計測部22と、輪郭計測部24と、抽出部26とを用いて特徴量抽出部20を構成することもできる。本実施形態の結晶化状態判定システムのそれ以外の構成は、実施形態1の構成と同様であるため省略する。ここで、特徴量抽出部20は、全方向線分計測部22と、輪郭計測部24と、抽出部26とを用いて構成されるため、析出物の輪郭の一部となる線分の最大長Lmaxと、その線分の総本数Nallと、輪郭線における直線の割合Rlsecとを求めることができる。以下、輪郭計測部24を含む第2の実施形態の結晶化状態判定システムについて説明する。
[輪郭計測]
輪郭計測部24は、2値エッジ検出画像における析出物の輪郭線を抽出し、ある一定間隔dで前記輪郭線を多数の区間に区切る。一定間隔dで区切られた区間smを、始点画素をp1 m、終点画素をpd mとして、以下のように表す。
Figure 0004761838
同様に、その他の区間sm+1と区間sm+2も以下のように表すことができる。
Figure 0004761838
Figure 0004761838
次に、輪郭計測部24は、この区切られた輪郭線において、3つの区間がなす角度を計測する。まず、図11に示すように、輪郭計測部24は、始点を画素p1 m、終点を画素p1 m+1とした線分l1 mと、始点を画素p1 m+1、終点を画素p1 m+2とした線分l1 m+1とのなす角度θ1 を算出する。続いて、一定数の画素をずらして、始点を画素p2 m、終点を画素p2 m+1とした線分l2 mと、始点を画素p2 m+1、終点を画素p2 m+2とした線分l2 m+1とのなす角度θ2 を計測する。輪郭計測部24は,区間smの始点p1 mから終点pd mまで線分l1 mの始点を変更しながら、なす角度θを算出する。そして、算出したなす角度の平均値を3区間sm〜sm+2の平均角度とする。
Figure 0004761838
ここで、3区間の平均角度が、例えば、170°≦θ≦180°である場合には、それぞれの区間を直線状区間とする。
さらに、図12(a)に示すように、現在の評価対象区間に対して、区間を1つずらし、同様の算出を行っていく。このようにして、輪郭計測部24は、すべての析出物において、輪郭線における直線状区間の数Lsecと、輪郭線の長さCとを算出して、輪郭線における直線状区間の割合Rlsecを次式によって算出する。
Figure 0004761838
ここで、図12(b)に示すように、一定の間隔dで区切られた輪郭において、最終区間uが、一定の間隔dより小さい場合には、u/d個として計測する。さらに、この場合、最終区間uに、1番目の区間の画素が繋がっているものとする。
抽出部26は、求めたヒストグラムより特徴量である線分の最大長と線分の総本数、及び輪郭線における直線状に接続された区間(直線状区間)の割合を取得する。
本実施の形態においても、実施の形態1と同様に、学習データの特徴量分布の取得部44と識別面の設定部45とを用いて、予め識別面69を設定する。また、学習データの特徴量分布の取得部44においては、実施形態1と同様に複数の画像(学習データ)に対して特徴量を予め求める。ここで、本実施の形態における特徴量は、最大長と総本数に加え、直線状区間の割合を有する3次元の量である。図13では、主成分分析を用いて、求めた3変量の特徴量を2変量の特徴量に圧縮して、プロットしている。
続いて、実施形態1と同様に、識別面の設定部45が、学習データの特徴量分布の取得部44で求めた学習データの特徴量群に対して、マハラノビスの汎距離による判別分析を行なう。カテゴリAに属する学習データは、最大長の平均を
Figure 0004761838
とし、総本数の平均を
Figure 0004761838
とし、直線区間の平均割合を
Figure 0004761838
とし、最大長・総本数の分散共分散行列を
Figure 0004761838
とする。同様に、カテゴリBに属する学習データは、最大長の平均を
Figure 0004761838
とし、総本数の平均を
Figure 0004761838
とし、直線区間の平均割合を
Figure 0004761838
とし、最大長・総本数の分散共分散行列を
Figure 0004761838
とする。ここで、正解カテゴリ未知のデータXの最大長をLmax,x、総本数をNall,x、直線区間の平均割合をRlsec,Aとすると、データXとカテゴリAとのマハラノビスの汎距離DA 3は、
Figure 0004761838
で求めることができ、同様に、データXとカテゴリBとのマハラノビスの汎距離DB 3は、
Figure 0004761838
で求めることができる。ここで、マハラノビスの汎距離による判別分析が、DA 3<DB 3である場合、データXはカテゴリAに属すると判別でき、DA 3>DB 3である場合は、データXはカテゴリBに属すると判別できる。さらに、DA 3=DB 3である場合は、データXは、カテゴリAとカテゴリBとを分ける識別面上にあると判別することができる。図14に示すように、特徴量空間に設定された識別面69が、カテゴリを判別する境界線である。
本実施例は、実施形態1における結晶構造解析可能性判定システムの実施例である。学習用画像とテスト画像とを用いて、本発明のタンパク質溶液の析出物の結晶構造解析可能性の判定システムの性能を確認した。本実施例では、実施形態1に係るものであるため、特徴量抽出部20は、方向線分計測部22と抽出部26とを用いて構成される。まず、学習用画像である、カテゴリAに属する画像200枚とカテゴリBに属する画像100に基づいて、取得部44と設定部45により特徴量空間に識別面を設定した。続いて、テストデータである、カテゴリAに属する画像166枚とカテゴリBに属する画像300を判定したところ、本発明の判定システムは、正解率78.0%であった。特徴量のプロットの結果を図17に示す。
次に、実施例2として、輪郭計測部24を備える実施形態2に係る結晶構造解析可能性の判定システムの性能を確認した。まず、実施例1とは異なる学習用画像250枚を準備した。この学習用画像に基づいて、取得部44と設定部45により特徴量空間に識別面を設定した。このときの正解率は、83.1%であった。ここで、学習用画像により求めた識別面に対して、250枚のテスト画像から抽出した特徴量を特徴量空間にプロットした。本発明の判定システムの正解率は、74.2%であった。特徴量のプロットの結果を図18に示す。なお、実施例2に用いた学習用画像とテスト画像は、実施例1のものと異なるため、これらの学習用画像とテスト画像を用いて、実施形態1と同様に判定したところ、学習用画像に対しては76.4%の正解率となり、テスト画像に対しては64.8%の正解率となった。
タンパク質溶液の結晶状態の画像による分類を模式的に示す説明図である。 (a)本発明の実施の形態におけるサンプルの構成を示す説明図である。(b)マイクロバッチ法におけるタンパク質の相変化を説明するグラフである。 本発明の実施の形態における結晶化状態判定システムの構成を示す構成図である。 本発明の実施の形態におけるSobel変換を示す説明図である。 本発明の実施の形態における、0度から179度方向へのラスタ走査の態様を示す説明図である。 本発明の実施の形態において、線分の長さの算出方法を示す説明図である。 本発明の実施の形態における抽出された線分の長さの分布を示すヒストグラムである。 本発明の実施の形態における特徴量空間での学習データの分布を示すグラフである。 本発明の実施の形態における特徴量空間での学習データの分布の上に識別面を描いたグラフである。 本発明の実施の形態における輪郭計測部を含む結晶化状態判定システムの特徴量抽出部を示す構成図である。 本発明の実施の形態における線分間のなす角度の計測方法を説明する図である。 (a)本発明の実施の形態における対象区間の遷移方法を説明する図である。(b)本発明の実施の形態における最終区間を決定する方法を説明する図である。 本発明の実施の形態における特徴量空間での学習データの分布を示すグラフである。 本発明の実施の形態における特徴量空間での学習データの分布の上に識別面を描いたグラフである。 本発明の実施の形態における結晶化状態判定システムの識別面の設定に関するフローチャートである。 本発明の実施の形態における結晶化状態判定システムのタンパク質溶液の画像の判別に関するフローチャートである。 本発明の実施例1におけるテスト画像の分布と識別面とを示すグラフである。 本発明の実施例2におけるテスト画像の分布と識別面とを示すグラフである。
符号の説明
1 沈殿剤を加えた微量のタンパク質溶液
2 オイル層
3 タンパク質の結晶
4 バッチ効果
5 水分拡散効果
6 溶解度曲線
100 結晶化状態判定システム
10 前処理部
12 グレースケール化部
14 画像切り出し部
16 Sobel変換部
18 2値化部
20 特徴量抽出部
22 全方向線分計測部
24 輪郭計測部
26 抽出部
30 判定部
32 判別作業部
40 撮影装置
41 電子画像のデータ
42 原画像取得部
43 原画像データ
44 取得部
45 設定部
46 判定基準格納部
47 析出物状態のデータ
52 処理前の画像の対応する画素
54 画素値とその周囲8近傍の画素
56 急激に画素値が変化する部分
62 走査線
64 エッジ画素
66 背景画素
68、69 識別面

Claims (10)

  1. タンパク質溶液の電子画像を取得して原画像とする原画像取得ステップと、
    前記原画像における析出物の輪郭線を抽出し、2値エッジ検出画像を作成する前処理ステップと、
    前記2値エッジ検出画像の画素をそれぞれの角度で走査し前記輪郭線の一部となる線分に関するデータを求めて、該データから前記析出物の結晶化状態を反映する特徴量を求める特徴量抽出ステップであって、前記特徴量は、前記2値エッジ検出画像における析出物の輪郭線に含まれる線分の本数と、それらの線分の最大長とを含む、ステップと、
    前記特徴量に基づいて、タンパク質溶液の前記電子画像を判別する判別ステップと
    を含む、タンパク質溶液の析出物の結晶構造解析可能性の判定方法。
  2. 前記特徴量抽出ステップにおける特徴量は、前記輪郭線に含まれる直線部の割合をさらに含む、請求項に記載の方法。
  3. 判別すべきカテゴリがわかっている複数の学習用画像よりタンパク質溶液の析出物の結晶状態を反映する特徴量を予め抽出し、特徴量の分布を取得するステップと、
    前記学習用画像の特徴量の分布に基づいて、タンパク質溶液の析出物の結晶状態を複数のカテゴリに判別する識別境界を設定するステップと
    をさらに含む、請求項1に記載の方法。
  4. 前記識別境界の設定ステップは、各カテゴリの学習用画像の特徴量の分布に対して、マハラノビス距離が等しくなる特徴量空間における線又は面を求めて前記識別境界とするステップである、請求項に記載の方法。
  5. 前記前処理ステップは、
    カラー画像である前記原画像をグレースケール画像に変換するステップと、
    前記グレースケール化された画像に対して、タンパク質溶液部の領域を切り出すステップと、
    前記タンパク質溶液部の領域の画像をSobel変換して析出物の輪郭線画像を得るステップと、
    前記輪郭線画像を2値化して2値エッジ検出画像を得るステップと
    を含む、請求項1からのいずれかに記載の方法。
  6. タンパク質溶液の電子画像を取得して原画像とする原画像取得手段と、
    前記原画像における析出物の輪郭線を抽出し、2値エッジ検出画像を作成する前処理手段と、
    前記2値エッジ検出画像の画素をそれぞれの角度で走査し前記輪郭線の一部となる線分に関するデータを求めて、該データから前記析出物の結晶化状態を反映する特徴量を求める特徴量抽出手段であって、前記特徴量は、前記2値エッジ検出画像における析出物の輪郭線に含まれる線分の本数と、それらの線分の最大長とを含む、ステップと、
    前記特徴量に基づいて、タンパク質溶液の前記電子画像を判別する判別手段と
    を含む、タンパク質溶液の析出物の結晶構造解析可能性の判定システム。
  7. 前記特徴量抽出手段における特徴量は、前記輪郭線に含まれる直線部の割合をさらに含む、請求項に記載の方法。
  8. 判別すべきカテゴリがわかっている複数の学習用画像よりタンパク質溶液の析出物の結晶状態を反映する特徴量を予め抽出し、特徴量の分布を取得する手段と、
    前記学習用画像の特徴量の分布に基づいて、タンパク質溶液の析出物の結晶状態を複数のカテゴリに判別する識別境界を設定する手段と
    をさらに含む、請求項に記載のシステム。
  9. 前記識別境界の設定手段は、各カテゴリの学習用画像の特徴量の分布に対して、マハラノビス距離が等しくなる特徴量空間における線又は面を求めて前記識別境界とする手段である、請求項に記載のシステム。
  10. 前記前処理手段は、
    カラー画像である前記原画像をグレースケール画像に変換する手段と、
    前記グレースケール化された画像に対して、タンパク質溶液部の領域を切り出す手段と、
    前記タンパク質溶液部の領域の画像をSobel変換して析出物の輪郭線画像を得る手段と、
    前記輪郭線画像を2値化して2値エッジ検出画像を得る手段と
    を含む、請求項からのいずれかに記載のシステム。
JP2005157108A 2005-02-15 2005-05-30 タンパク質溶液の析出物を判定する方法及びシステム Expired - Fee Related JP4761838B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005157108A JP4761838B2 (ja) 2005-02-15 2005-05-30 タンパク質溶液の析出物を判定する方法及びシステム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005037411 2005-02-15
JP2005037411 2005-02-15
JP2005157108A JP4761838B2 (ja) 2005-02-15 2005-05-30 タンパク質溶液の析出物を判定する方法及びシステム

Publications (2)

Publication Number Publication Date
JP2006258785A JP2006258785A (ja) 2006-09-28
JP4761838B2 true JP4761838B2 (ja) 2011-08-31

Family

ID=37098195

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005157108A Expired - Fee Related JP4761838B2 (ja) 2005-02-15 2005-05-30 タンパク質溶液の析出物を判定する方法及びシステム

Country Status (1)

Country Link
JP (1) JP4761838B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6937508B2 (ja) * 2017-06-08 2021-09-22 国立大学法人 筑波大学 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1181548B1 (en) * 1999-04-06 2007-03-21 The University of Alabama at Birmingham Research Foundation Method for screening crystallization conditions in solution crystal growth
JP3759891B2 (ja) * 2001-09-27 2006-03-29 独立行政法人理化学研究所 タンパク質の結晶化方法及び装置
JP4123931B2 (ja) * 2002-12-25 2008-07-23 株式会社日立製作所 損傷の評価方法
JP3966220B2 (ja) * 2003-04-28 2007-08-29 松下電器産業株式会社 蛋白質結晶観察装置
JP3898667B2 (ja) * 2003-04-28 2007-03-28 松下電器産業株式会社 蛋白質結晶検出方法および蛋白質結晶検出装置ならびに蛋白質結晶検出プログラム
JP4300327B2 (ja) * 2003-06-18 2009-07-22 独立行政法人理化学研究所 タンパク質結晶化状態判定方法およびそのシステム
JP3840546B2 (ja) * 2004-02-13 2006-11-01 大学共同利用機関法人 高エネルギー加速器研究機構 微小物体の観察装置

Also Published As

Publication number Publication date
JP2006258785A (ja) 2006-09-28

Similar Documents

Publication Publication Date Title
WO2021139258A1 (zh) 基于图像识别的细胞识别计数方法、装置和计算机设备
US8600143B1 (en) Method and system for hierarchical tissue analysis and classification
JP5481696B2 (ja) 受精卵品質評価支援システム、受精卵品質評価支援装置および受精卵品質評価支援方法
US20190220981A1 (en) Systems and methods for adaptive histopathology image unmixing
CN113962976B (zh) 用于病理玻片数字图像的质量评估方法
WO2012169088A1 (ja) 画像処理装置、画像処理方法及び画像処理システム
WO2017150194A1 (ja) 画像処理装置、画像処理方法及びプログラム
US10860835B2 (en) Image processing device, cell recognition device, cell recognition method, and cell recognition program
CN112464802B (zh) 一种玻片样本信息的自动识别方法、装置和计算机设备
CN110763677A (zh) 甲状腺冰冻切片诊断方法及系统
CN108961301A (zh) 一种基于无监督逐像素分类的角毛藻图像分割方法
CN110176020A (zh) 一种融合2d和3d图像的燕窝杂质分拣方法
EP1267305B1 (en) Cell lineage extracting method
JP5182689B2 (ja) 眼底画像解析方法およびその装置とプログラム
JP4761838B2 (ja) タンパク質溶液の析出物を判定する方法及びシステム
US20030108231A1 (en) Nuclear area and recognizing method and nuclear genealogy creating method
JP3431883B2 (ja) 細胞系譜抽出方法
CN116228706A (zh) 基于深度学习的细胞自噬免疫荧光图像分析系统和方法
JP4300327B2 (ja) タンパク質結晶化状態判定方法およびそのシステム
JP4740686B2 (ja) タンパク質結晶化状態判別システムおよびその方法
Antal et al. Improving microaneurysm detection in color fundus images by using an optimal combination of preprocessing methods and candidate extractors
JP3679680B2 (ja) 細胞系譜抽出方法
CN113158996A (zh) 一种基于扫描电子显微镜图像和人工智能的硅藻两步识别和分类方法
CN114359539B (zh) 一种生鱼片中寄生虫高光谱图像智能识别方法
Marini et al. Automatic fish counting from underwater video images: performance estimation and evaluation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101214

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110524

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110607

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140617

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees