JP4527841B2 - ゲノムプロフィリング画像から特徴点を抽出する方法、並びに該方法で得られた特徴点群を用いた遺伝子型による種同定方法および類縁性同定方法 - Google Patents
ゲノムプロフィリング画像から特徴点を抽出する方法、並びに該方法で得られた特徴点群を用いた遺伝子型による種同定方法および類縁性同定方法 Download PDFInfo
- Publication number
- JP4527841B2 JP4527841B2 JP2000123448A JP2000123448A JP4527841B2 JP 4527841 B2 JP4527841 B2 JP 4527841B2 JP 2000123448 A JP2000123448 A JP 2000123448A JP 2000123448 A JP2000123448 A JP 2000123448A JP 4527841 B2 JP4527841 B2 JP 4527841B2
- Authority
- JP
- Japan
- Prior art keywords
- point
- mobility
- feature
- temperature
- feature points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
【発明の属する技術分野】
本発明は、ゲノムプロフィリング画像から特徴点を抽出する方法、並びに該方法で得られた特徴点群を用いた遺伝子型による種同定方法および類縁性同定方法に関するものである。
【0002】
【従来の技術】
たとえば、所定の条件においてランダムPCRで微生物の遺伝子を増幅し、増幅したDNAをTGGEまたはDGGEにより電気泳動させることにより、電気泳動物が得られる。この電気泳動物を撮像した画像は、ゲル電気泳動画像あるいはゲノムプロフィリング画像と呼ばれている。
【0003】
【発明が解決しようとする課題】
2つの微生物が同一種に属する場合、2つの微生物についてそれぞれ得られる2つのゲノムプロフィリング画像の全体的な形態が非常に良く似ていることが知られている。しかしながら、ゲノムプロフィリング画像の全体的な形態に基づく定性的な手法では、遺伝子型による微生物の種の同定を正確に行うことができなかった。
【0004】
本発明は、前述の課題に鑑みてなされたものであり、遺伝子型による微生物の種の同定を定量的な手法で正確に且つ簡便に行うことを可能にするための中間的な処理方法として、ゲノムプロフィリング画像から特徴点を抽出する方法を提供することを目的とする。
【0005】
また、本発明は、上述の特徴点抽出方法で得られた特徴点群を用いた定量的な手法で、微生物の種の同定および同一種の微生物における個体間の類縁性の同定を正確に且つ簡便に行うことのできる、遺伝子型による種同定方法および類縁性同定方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
前記課題を解決するために、本発明の第1発明では、生物の遺伝子を増幅し、増幅して得たDNAをTGGE(Temperature Gradient Gel Electrophoresis)またはDGGE(Denaturant Gradient Gel Electrophoresis)により電気泳動させて得られるゲル電気泳動物をゲノムプロフィリング画像として取り込む取込工程と、前記取込工程を介して取り込んだゲノムプロフィリング画像を温度方向および移動度方向に沿ってそれぞれ規格化する規格化工程と、前記規格化工程を介して規格化されたゲノムプロフィリング画像の各バンドに対応して複数の肉付き線分を抽出する肉付き線分抽出工程と、前記肉付き線分抽出工程を介して抽出された複数の肉付き線分の各々について複数の特徴点を抽出する特徴点抽出工程とを含むこと、並びに前記特徴点抽出工程では、変性前における融解の開始に対応する融解開始点、変性前において移動度が最小値に達する最小移動度点、および変性後の一本鎖状態の移動度に終着する移動度終着点から選択された複数の点を特徴点として抽出すること、および前記DGGEによる電気泳動で使用される変性剤が尿素であり、かつ前記DGGEにおける温度方向に沿った規格化は尿素濃度を温度換算した還元温度で行うことを特徴とする特徴点抽出方法を提供する。
【0008】
また、第1発明の好ましい態様によれば、前記肉付き線分抽出工程は、
ゲノムプロフィリング画像の各バンド上の点を局所参照点として指示する局所参照点指示工程と、
前記局所参照点指示工程で指示された局所参照点の周囲の点の色の濃淡を判定し、所定の域値内の色の濃さを有する点を新たに局所参照点として設定する二次局所参照点設定工程とを含み、
前記二次局所参照点設定工程を介して新たに設定された二次局所参照点にシフトし、該二次局所参照点に対して色の濃さが一定の変動範囲に収まるような新たな局所参照点を設定する工程を繰り返すことにより、各バンドに対応する肉付き線分を抽出する。
【0009】
さらに、第1発明の好ましい態様によれば、前記肉付き線分抽出工程を介して抽出された各肉付き線分について、1つの温度点に対して複数の移動度点が対応する状態から、1つの温度点に対して1つの移動度点が対応する状態へスリム化するスリム化工程と、前記スリム化工程を介して得られた各スリム化線分を所定の関数で近似する関数化工程とをさらに含み、前記特徴点抽出工程では、前記関数化工程を介して関数化された各バンド曲線について複数の特徴点を抽出する。
【0010】
この場合、前記スリム化工程は、1つの温度点に対応する複数の移動度点の重心点を検出する重心点検出工程と、連続する多数の温度点について前記重心点検出工程を繰り返す検出繰返工程と、前記検出繰返工程を介して得られた多数の重心点の連鎖によりスリム化線分を形成するスリム化線分形成工程とを含むことが好ましい。また、この場合、前記スリム化線分形成工程は、滑らかな曲線からなるスリム化線分を得るために、ある重心点の移動度方向の座標と両側に隣接する重心点の移動度方向の座標との平均座標を、その重心点における移動度方向の座標と設定するスムージング処理工程を含むことが好ましい。
【0011】
また、第1発明の好ましい態様によれば、前記関数化工程は、ニュートン・ラプソン(Newton-Raphson)法を用いて各スリム化線分を適当な次数のn次斉関数に近似する近似工程を含む。
【0012】
さらに、第1発明の好ましい態様によれば、前記規格化工程では、塩基配列のわかっている参照試料であって本来の試料とともに電気泳動させた内部参照試料の特徴点および実験条件パラメータなどに基づいて、移動度方向に沿って0と1との間で無次元化するとともに、尿素を温度換算した還元温度で温度方向に沿って規格化する。
【0013】
また、第1発明の好ましい態様によれば、前記規格化工程に先立って、前記取込工程を介して取り込んだゲノムプロフィリング画像のゆがみを補正するゆがみ補正工程をさらに含む。この場合、前記ゆがみ補正工程では、ゲルの4隅を定義し、定義された4隅に基づいて補正処理を行うことが好ましい。あるいは、前記ゆがみ補正工程では、塩基配列のわかっている参照試料であって本来の試料とともに電気泳動させた内部参照試料の特徴点を認識し、認識した特徴点に基づいて補正処理を行うことが好ましい。
【0014】
本発明の第2発明では、特徴点群に関する登録情報を参照するために比較対象ゲノムの選択を行う選択工程と、前記選択工程を介して選択された比較対象ゲノムの特徴点群に関する登録情報を参照し、第1発明の方法により試料生物について抽出された特徴点群から対応特徴点群を決定する特徴点群対応付け工程と、前記比較対象ゲノムの特徴点群と前記試料生物の対応特徴点群との比較に基づいて、前記試料生物の種の同定を行う種同定工程とを含むことを特徴とする種同定方法を提供する。
【0015】
本発明の第3発明では、特徴点群に関する登録情報を参照するために比較対象ゲノムの選択を行う選択工程と、前記選択工程を介して選択された比較対象ゲノムの特徴点群に関する登録情報を参照し、第1発明の方法により試料生物について抽出された特徴点群から対応特徴点群を決定する特徴点群対応付け工程と、前記比較対象ゲノムの特徴点群と前記試料生物の対応特徴点群との比較に基づいて、前記試料生物について同一種の個体間における類縁性の同定を行う類縁性同定工程とを含むことを特徴とする種同定方法を提供する。
【0016】
第2発明および第3発明において、比較対象ゲノムのn個の特徴点P0iの位置ベクトルをV0iとし、試料生物のn個の特徴点P1iの位置ベクトルをV1iとしたとき、以下の式(1)で規定されるPaSSの値に基づいて、前記試料生物の種の同定または前記試料生物について同一種の個体間における類縁性の同定を行うことが好ましい。
PaSS=1−{Σγ(i)}/n (1)
ここで、Σはi=1〜nまでの総和記号であり、γ(i)は以下の式(2)で表される。
γ(i)=|V1i−V0i|/(|V1i|+|V0i|) (2)
【0017】
あるいは、第2発明および第3発明において、比較対象ゲノムのn個の特徴点P0iの温度をT0iとし、試料生物のn個の特徴点P1iの温度をT1iとし、比較対象ゲノムのn個の特徴点P0iの移動度をM0iとし、試料生物のn個の特徴点P1iの移動度をM1iとし、特徴点の現れる温度範囲幅に相当する温度規格化因子をTwとし、移動度変化と温度変化の両方の「重み」の相対値をαとしたとき、以下の式(4)で規定されるPaSSの値に基づいて、前記試料生物の種の同定または前記試料生物について同一種の個体間における類縁性の同定を行うことが好ましい。
PaSS=1−{Σr(i)}/n (4)
ここで、Σはi=1〜nまでの総和記号であり、r(i)は以下の式(5)で表される。
【数3】
【0018】
この場合、前記PaSSを用いて、以下の式(3)で規定されるゲノム準距離dsの値に基づいて、前記試料生物の種の同定または前記試料生物について同一種の個体間における類縁性の同定を行うことがさらに好ましい。
ds=(1−PaSS)/PaSS (3)
【0019】
【発明の実施の形態】
本発明の実施形態を、添付図面に基づいて説明する。
図1は、本発明の実施形態にかかる特徴点の抽出方法、すなわちゲノムプロフィリング画像から特徴点を抽出する方法について、その全体的な処理フローを示すフローチャートである。
所定の条件においてランダムPCR(Random Polymerase Chain Reaction)できればスペルを記入してください)で微生物の遺伝子を増幅し、増幅したDNAをTGGE(Temperature Gradient Gel Electrophoresis)またはDGGE(Denaturant Gradient Gel Electrophoresis)により電気泳動させることにより、電気泳動物が得られる。
【0020】
本実施形態では、この電気泳動物を、適当な撮像手段を介して、情報処理手段の適当な電子記録媒体にカラー画像やグレースケール画像として取り込む。具体的には、電気泳動物を、たとえばデジタルカメラを介して撮像した後に、コンピュータのハードディスクなどに、ゲル電気泳動画像すなわちゲノムプロフィリング画像として取り込む(S101)。あるいは、電気泳動物を、アナログカメラを介して撮像し、次いでスキャナーを介してイメージスキャニングした後に、ゲノムプロフィリング画像として取り込む。または、蛍光イメージャーを用い、蛍光性バンドとして得られたゲル中の試料を撮像する。
【0021】
図2は、典型的なゲノムプロフィリング画像を模式的に示す図である。
図1のゲノムプロフィリング画像は、白黒で模式的に示されている。しかしながら、銀染色法によって得られた実際のゲノムプロフィリング画像の背景(図1中白い部分)は、たとえば濃い黄色である。また、図1のゲノムプロフィリング画像において黒い部分はバンドと呼ばれるが、その色は実際には黒に近い色と薄茶色に近い色との間で変化している。ここで、黒に近い色のバンドが明瞭に現れているバンドである。また、蛍光染色法では、色素ごとに励起・発光波長が異なり、それぞれ異なる色素で染め分けられたバンドを蛍光イメージャーで取り込んだ後に、コンピュータにより多色表示する。
【0022】
本実施形態では、取り込まれたゲノムプロフィリング画像に対して、必要に応じてゆがみの補正処理を行う(S102)。そして、必要に応じてゆがみの補正処理がなされたゲノムプロフィリング画像に対して、規格化処理を行う(S103)。ここで、ゆがみの補正処理とは、取り込まれたゲノムプロフィリング画像が例えば台形状に歪んでいた場合に、矩形状に形状補正する画像処理である。取り込まれたゲノムプロフィリング画像のゆがみが通常の誤差範囲であれば、すなわち許容範囲内であれば、ゆがみの補正処理を省略することができる。
【0023】
具体的に、ゆがみの補正処理に際して、ゲルの4隅を定義し、定義された4隅に基づいて補正処理を行う隅4点補正方式を用いることができる。この場合、実験者がゲルの4隅を定義する手動補正方式と、ゲルの4隅を情報処理装置で自動判別して処理する自動補正方式とがある。
【0024】
また、ゆがみの補正処理に際して、内部参照試料(塩基配列のわかっている参照試料であって本来の試料とともに電気泳動させたもの)の特徴点を認識し、認識した特徴点に基づいて補正処理を行う内部参照特徴点方式を用いることができる。この場合、実験者が特徴点を目視で認識する手動補正方式と、特徴点を情報処理装置で自動認識して処理する自動補正方式とがある。なお、たとえば2種類の参照試料を使用し、各参照試料からそれぞれ2つ以上の特徴点(合計で4つ以上の特徴点)を参照特徴点として得ることが好ましい。
【0025】
一方、規格化処理とは、内部参照試料の特徴点および実験条件パラメータなどに基づいて縦軸(Y軸:移動度)方向および横軸(X軸:温度)方向を規格化する画像処理である。規格化処理により、移動度Mは0から1までの間で無次元化される。また、温度Tとして、たとえば尿素を温度換算した温度すなわち還元温度が適用される。
【0026】
次いで、必要に応じてゆがみ補正され且つ規格化処理されたゲノムプロフィリング画像の各バンドに対して、肉付き線分抽出処理を行う(S104)。具体的には、肉付き線分抽出処理の開始に際して、実験者がバンド上の1つの点を局所参照点として指示する。情報処理装置では、指示された局所参照点の周囲の点(ピクセル:画素)の色の濃淡を判定し、所定のスレッショルド(閾値)の範囲内(例えば変動10%)の色の濃さを有する点を新たに二次局所参照点として設定する。
【0027】
そして、新たに設定された二次局所参照点にシフトし、この二次局所参照点に対して色の濃さが一定の変動範囲に収まるように、その周囲の点の色の濃淡に基づいて、さらに新たな局所参照点を設定する。こうして、順次設定される局所参照点についてその周囲の点に対する色の濃淡判定および局所参照点の設定を繰り返す。その結果、いわゆる連形成参照点シフト方式により、ゲノムプロフィリング画像から各バンドに対応する肉付き線分が抽出される。
【0028】
なお、変性前から変性後にかけて、すなわち低温領域から高温領域の全体に亘ってバンドが連続的である場合、上述の1点指定方式により所望の肉付き線分が自動抽出される。しかしながら、変性前と変性後とでバンドが不連続になる場合、たとえば変性前のバンド上の1点を指定しただけでは、変性前のバンドに対応する肉付き線分は自動抽出されるが、変性後のバンドに対応する肉付き線分は抽出されないことになる。したがって、変性前と変性後とでバンドが不連続になる場合には、変性前のバンド上において1つの点を指定し且つ変性後のバンド上においてもう1つの点を指定する2点指定方式を用いることにより、変性前のバンドに対応する肉付き線分および変性後のバンドに対応する肉付き線分の双方を自動抽出することができる。
【0029】
ところで、上述の説明では、連形成参照点シフト方式によりゲノムプロフィリング画像の各バンドから肉付き線分を抽出している。しかしながら、たとえばグレースケールで取り込んだゲノムプロフィリング画像を所定のスレッショルドに基づいて白黒画像に二値化する二値化方式により、ゲノムプロフィリング画像から各バンドに対応する肉付き線分を抽出することもできる。また、ゲノムプロフィリング画像の各バンドには、いくつかの典型的な形状を有するパターンが部分的に現れる。そこで、多数のパターンセグメントから選択された複数のパターンセグメントを組み合わせて、いわゆるパターンイメージ合成法により、ゲノムプロフィリング画像から各バンドに対応する肉付き線分を抽出することもできる。
【0030】
次いで、ゲノムプロフィリング画像から各バンドに対応して抽出された各肉付き線分に対して、スリム化処理を行う(S105)。図3に示すように、肉付き線分31では、横軸(X方向)に沿った1つの温度点Tiに対して縦軸(Y方向)に沿って複数の移動度点Mi(i=1〜n)が対応し、いわゆる多価関数となっている。スリム化処理とは、横軸に沿った1つの温度点に対して1つの移動度点が対応するように、肉付き線分をいわゆる1価関数のスリム化線分へ変換する処理である。
【0031】
肉付き線分のスリム化処理に際しては、図3に示すように、横軸に沿った1つの温度点Tiに対応する複数の移動度点Miの重心点Mgを求める。ここで、1つの温度点に対応する複数の移動度点がY方向に沿って連続して配列されている場合には、複数の移動度点の重心点を求めることは、連続する複数の移動度点の幾何学的中心点を求めることに他ならない。一方、1つの温度点に対応する複数の移動度点がY方向に沿って断続的に配列されている場合には、複数の移動度点の重心点はその幾何学的中心点とは異なるものとなるのが一般的である。
【0032】
複数の移動度点Miの重心点Mgを求める処理は、横軸に沿った多数の温度点Ti(i=1〜m)に対して繰り返される。こうして、図4に示すように、横軸に沿った多数の温度点Ti(i=1〜m)に対応して多数の重心点Mgi(i=1〜m)が得られる。ここで、得られた多数の重心点Mgiを単に連結すると、滑らかなスリム化線分を得ることができない場合がある。その場合、たとえばランニングアベレージ法を用いて、ある重心点のY座標と両側に隣接する重心点のY座標との平均座標をその重心点におけるY座標と設定するスムージング処理により、多数の重心点からなる滑らかな連鎖を、ひいては滑らかな曲線からなるスリム化線分が得られる。
【0033】
こうして、滑らかな曲線状に得られたスリム化線分に対して、関数化処理を行う(S106)。関数化処理では、たとえばニュートン・ラプソン(Newton-Raphson)法を用いて、各スリム化線分を適当な次数(たとえば10次)のn次斉関数に近似する。あるいは、各スリム化線分を三角関数近似することもできる。
【0034】
次いで、スリム化処理および関数化処理を介して得られた各バンド曲線について特徴点抽出処理を行う(S107)。特徴点抽出処理では、特徴点として、たとえば融解開始点Pini、最小移動度点Pmin、移動度終着点Pendを抽出する。ここで、融解開始点Piniは、変性前における融解の開始に対応するバンド曲線上の点である。また、最小移動度点Pminは、変性前において移動度が最小値に達するバンド曲線上の点である。さらに、移動度終着点Pendは、変性後の一本鎖状態の移動度に終着するバンド曲線上の点である。
【0035】
図5は、第1の典型的なバンド曲線の形態を示す図である。
図5に示すように、典型的な第1バンド曲線51では、融解が開始する温度Tiniよりも低い温度において移動度Mは温度Tに関してほぼ線形的に増大する。融解開始点Piniに対応する温度Tiniに達して融解が開始すると、移動度Mは温度Tに関してほぼ線形的に減少した後に、その減少率が漸減しながら、やがて最小移動度点Pminに達する。
【0036】
最小移動度点Pminに対応する温度Tminに達した後、温度の上昇に対して移動度Mが急増し、やがて変性後の一本鎖状態の移動度すなわち移動度終着点Pendに達する。移動度終着点Pendに対応する温度Tendよりも高い温度では、移動度Mは再び温度Tに関してほぼ線形的に増大する。これは温度上昇に伴う粘度の低下のためであって、形態の変化はほとんどないと考えられている。なお、最小移動度点Pminが不連続点となり、最小移動度点Pminに対応する温度Tminと移動度終着点Pendに対応する温度Tendよりもわずかに低い温度との間でバンド曲線が不連続になることが多い。
【0037】
図6は、第2の典型的なバンド曲線の形態を示す図である。
図6に示すように、典型的な第2バンド曲線61では、第1バンド曲線51と同様に、融解が開始する温度Tiniよりも低い温度において移動度Mは温度Tに関してほぼ線形的に増大し、融解開始点Piniに対応する温度Tiniに達して融解が開始すると移動度Mは温度Tに関してほぼ線形的に減少する。しかしながら、第1バンド曲線51の場合とは異なり、やがて最小移動度点Pminに達した後、最小移動度点Pminに対応する温度Tminよりも高い温度では、移動度Mは再び温度Tに関してほぼ線形的に増大する。すなわち、第2バンド曲線61では、最小移動度点Pminと移動度終着点Pendとが一致し、バンド曲線が不連続になることはない。
【0038】
本実施形態では、関数化処理を介して得られたバンド曲線の一次微分、二次微分、その不連続点などの情報に基づいて、たとえば融解開始点Pini、最小移動度点Pmin、移動度終着点Pendを特徴点として抽出する。
具体的には、融解開始点Piniは、2つの直線部分52(62)と53(63)とによって挟まれた曲線部分の中間点として抽出される。したがって、融解開始点Piniは、バンド曲線51(61)の一次微分値および二次微分値に基づいて求められる。
【0039】
また、最小移動度点Pminは、第1バンド曲線51の場合、たとえば曲線上の不連続点として抽出される。一方、第2バンド曲線61の場合、最小移動度点Pminは、移動度終着点Pendと同じ点として後述のように求められる。
さらに、移動度終着点Pendは、直線部分54(64)を−X方向に沿って見ると直線部分から離れる点として、バンド曲線51(61)の一次微分値および二次微分値に基づいて求められる。
【0040】
以上の特徴点抽出処理は、明瞭なバンドすなわち明瞭に線分化されたバンド曲線から順に行われ、全体として所定数の特徴点が得られるまで行われる。なお、試料微生物の種が予め分かっており、特徴点を抽出すべき指定バンドが自明である場合には、それらの指定バンドについて特徴点抽出処理を行う。図7では、3つのバンド曲線から抽出された合計8個の特徴点Pj(j=1〜8)すなわち特徴点群を模式的に示している。実際には、3つよりも多くのバンド曲線から8個よりも多くの特徴点を抽出する。
【0041】
なお、上述の説明では、スリム化処理および関数化処理を介して得られたバンド曲線から特徴点を抽出しているが、スリム化処理および関数化処理を行うことなく、各肉付け線分から直接的に特徴点を抽出することもできる。
【0042】
図8は、本発明の実施形態にかかる種同定方法、すなわち本発明の特徴点抽出方法で得られた特徴点群を用いた遺伝子型による種同定方法について、その全体的な処理フローを示すフローチャートである。
本実施形態の種同定方法では、比較対象ゲノムの選択を行い、その特徴点群(spiddo: species identification dots)に関するデータベース上の登録情報を参照する(S201)。
【0043】
まず、試料微生物の種が予め分かっている場合、その種を比較対象とし、その特徴点群に関する登録情報を参照する。
また、試料微生物の種が未知である場合、ゲノムプロフィリング画像の全体的な形態に基づいて予め選定された代表種(たとえば数十種)を仮の比較対象とし、その特徴点群に関する登録情報を参照する。
【0044】
あるいは、試料微生物の種が未知である場合、上述の特徴点抽出処理により得られた各特徴点について類似する特徴点(たとえば図7において原点Oから各特徴点までの距離の差異が5%以内)を有する種を順次リストアップする。そして、リストアップされた種を仮の比較対象とし、その特徴点群に関する登録情報を参照する。
【0045】
次いで、比較対象ゲノムの特徴点群に関する登録情報を参照しながら、上述の特徴点抽出処理で得られた特徴点群から対応特徴点(たとえば10点)を決定する(S202)。
第1の決定方法として、実験者指定方式がある。実験者指定方式では、比較対象ゲノムの特徴点群に関する登録情報を参照しながら、実験者がコンピュータディスプレー上で対応特徴点を1つづつ手動で指定する。ここで、対応特徴点とは、比較対象ゲノムの特徴点群の各特徴点に対して位置的に対応する特徴点である。
【0046】
第2の決定方法として、自動割当方式がある。自動割当方式では、比較対象ゲノムの特徴点群の各特徴点が属する座標ゾーン(XY座標において二次元的な所定の面積を占める領域)を決定し、その座標ゾーンに属する試料特徴点を対応特徴点として順次自動的に割り当てる。
【0047】
第3の決定方法として、最適対応付け自動計算法がある。最適対応付け自動計算法では、対応特徴点数を適当に設定し、比較対象ゲノムの特徴点群および抽出された試料特徴点からそれぞれ対応特徴点数だけ任意に選択する。そして、対応付けを組み合わせ論的に行い、後に定義するPaSSが最も大きくなる組み合わせに基づいて対応特徴点を自動的に求める。
【0048】
こうして、図9に示すように、比較対象ゲノムのn個の特徴点P0i(i=1〜n)に対応して、試料微生物についてn個の特徴点P1i(i=1〜n)が得られる。ここで、各特徴点Pi(比較対象ゲノムのn個の特徴点P0i および試料微生物についてn個の特徴点P1i)は、位置ベクトルVi(比較対象ゲノムのn個の特徴点の位置ベクトルV0iおよび試料微生物についてn個の特徴点の位置ベクトルV1i)を有する。なお、位置ベクトルViの原点として、たとえばM=0でT=最小温度の点Oを採用することができる。
【0049】
本実施形態では、各特徴点Piの位置ベクトルViを用いて、以下の式(1)で規定されるPaSSという概念を導入する。
PaSS=1−{Σγ(i)}/n (1)
ここで、Σはi=1〜nまでの総和記号であり、γ(i)は以下の式(2)で表される。
γ(i)=|V1i−V0i|/(|V1i|+|V0i|) (2)
【0050】
なお、上述の説明では、ベクトル(依存)型の計算法にしたがってPaSSの値を求めているが、以下に示すようにスカラー型の計算法に基づいてPaSSの値を求めることもできる。
PaSS=1−{Σr(i)}/n (4)
ここで、Σはi=1〜nまでの総和記号であり、r(i)は以下の式(5)で表される。
【数4】
【0051】
ここで、T0iは比較対象ゲノムのn個の特徴点P0iの温度であり、T1iは試料生物のn個の特徴点P1iの温度である。また、M0iは比較対象ゲノムのn個の特徴点P0iの移動度であり、M1iは試料生物のn個の特徴点P1iの移動度である。さらに、Twは、特徴点の現れる温度範囲幅(たとえば約60°C)に相当する温度規格化因子である。また、αは、移動度変化と温度変化の両方の「重み」の相対値であって、通常は1である。ところで、式(5)の分母部分(α2+12)1/2は、第2の規格化因子(r(i)の値を1以下にするための)を構成している。
【0052】
また、式(1)または(4)に基づいて得られるPaSSを用いて、以下の式(3)で規定されるゲノム準距離dsという概念を導入する。
ds=(1−PaSS)/PaSS (3)
一般に、試料微生物の種と比較対象ゲノムの種とが同じ場合、PaSSの値(スコア)は1に近くなり、ゲノム準距離dsの値は0に近くなる。
【0053】
試料微生物の種が未知である場合、各比較対象ゲノムに対してPaSSおよび必要に応じてゲノム準距離dsを計算する(S203)。そして、PaSSの値が標準値(たとえば0.96)を上回るまで、あるいはゲノム準距離dsの値が標準値(たとえば0.04)を下回るまで、他の対象ゲノムとの比較を繰り返す(S204)。こうして、PaSSの値またはゲノム準距離dsの値に基づいて試料微生物の種の同定を行う(S205)。
【0054】
一方、試料微生物の種が既知である場合、PaSSの値またはゲノム準距離dsの値に基づいて同一種における個体間の類縁性を判定することができる。すなわち、同一種に属する2つの試料微生物についてPaSSまたはゲノム準距離dsを求め、2つのPaSSの値が十分に近い場合または2つのゲノム準距離dsの値が十分に近い場合には2つの試料微生物が同一種であってその個体間の類縁性が高いものと判定される。
【0055】
さらに、ある一定のゲノム準距離以内にある種や個体の集合を近隣情報としてゲノム配列空間にプロットすることにより保存することが好ましい。
こうして、ゲノムプロフィリング画像、特徴点群、判断情報、近隣情報などは、適当なデータベースに登録され、随時利用可能に構成されることが好ましい。
【0056】
以上のように、本実施形態では、変性前における融解の開始に対応する融解開始点、変性前において移動度が最小値に達する最小移動度点、および変性後の一本鎖状態の移動度に終着する移動度終着点を特徴点としてゲノムプロフィリング画像から抽出している。その結果、得られた特徴点群を用いた定量的な手法で、微生物の種の同定および同一種の微生物における個体間の類縁性の同定を正確に且つ簡便に行うことができる。
【0057】
なお、上述の実施形態では、遺伝子型による微生物の種同定方法および類縁性同定方法について説明している。しかしながら、微生物に限定されることなく、一般の生物の種同定方法および類縁性同定方法に本発明を適用することができることはいうまでもない。
【0058】
【発明の効果】
以上説明したように、本発明のゲノムプロフィリング画像から特徴点を抽出する方法では、遺伝子型による微生物の種の同定を定量的な手法で正確に且つ簡便に行うことを可能にするための中間的な処理を実現することができる。
【0059】
また、本発明の遺伝子型による種同定方法および類縁性同定方法では、上述の特徴点抽出方法で得られた特徴点群を用いた定量的な手法で、微生物の種の同定および同一種の微生物における個体間の類縁性の同定を正確に且つ簡便に行うことができる。
【図面の簡単な説明】
【図1】本発明の実施形態にかかる特徴点の抽出方法、すなわちゲノムプロフィリング画像から特徴点を抽出する方法について、その全体的な処理フローを示すフローチャートである。
【図2】典型的なゲノムプロフィリング画像を模式的に示す図である。
【図3】肉付き線分では、横軸に沿った1つの温度点に対して縦軸に沿って複数の移動度点が対応し、いわゆる多価関数となっていることを示す図である。
【図4】横軸に沿った多数の温度点に対応して多数の重心点が得られる様子を示す図である。
【図5】第1の典型的なバンド曲線の形態を示す図である。
【図6】第2の典型的なバンド曲線の形態を示す図である。
【図7】複数のバンド曲線からそれぞれ抽出された特徴点群を模式的に示す図である。
【図8】本発明の実施形態にかかる種同定方法、すなわち本発明の特徴点抽出方法で得られた特徴点群を用いた遺伝子型による種同定方法について、その全体的な処理フローを示すフローチャートである。
【図9】比較対象ゲノムにかかる特徴点群と試料微生物にかかる特徴点群とを模式的に示す図である。
【符号の説明】
T 温度
M 移動度
O 原点
Pini 融解開始点
Pmin 最小移動度点
Pend 移動度終着点
31 肉付き線分
51 第1バンド曲線
61 第2バンド曲線
Claims (18)
- 生物の遺伝子を増幅し、増幅して得たDNAをTGGE(Temperature Gradient Gel Electrophoresis)またはDGGE(Denaturant Gradient Gel Electrophoresis)により電気泳動させて得られるゲル電気泳動物をゲノムプロフィリング画像として取り込む取込工程と、前記取込工程を介して取り込んだゲノムプロフィリング画像を温度方向および移動度方向に沿ってそれぞれ規格化する規格化工程と、前記規格化工程を介して規格化されたゲノムプロフィリング画像の各バンドに対応して複数の肉付き線分を抽出する肉付き線分抽出工程と、前記肉付き線分抽出工程を介して抽出された複数の肉付き線分の各々について複数の特徴点を抽出する特徴点抽出工程とを含むこと、但し、肉付き線分とは幅のある線分を意味する、並びに前記特徴点抽出工程では、変性前における融解の開始に対応する融解開始点、変性前において移動度が最小値に達する最小移動度点、および変性後の一本鎖状態の移動度に終着する移動度終着点から選択された複数の点を特徴点として抽出すること、および前記DGGEによる電気泳動で使用される変性剤が尿素であり、かつ前記DGGEにおける温度方向に沿った規格化は尿素濃度を温度換算した還元温度で行うことを特徴とする特徴点抽出方法。
- 前記肉付き線分抽出工程は、ゲノムプロフィリング画像の各バンド上の点を局所参照点として指示する局所参照点指示工程と、前記局所参照点指示工程で指示された局所参照点の周囲の点の色の濃淡を判定し、所定の域値内の色の濃さを有する点を新たに局所参照点として設定する二次局所参照点設定工程とを含み、前記二次局所参照点設定工程を介して新たに設定された二次局所参照点にシフトし、該二次局所参照点に対して色の濃さが一定の変動範囲に収まるような新たな局所参照点を設定する工程を繰り返すことにより、各バンドに対応する肉付き線分を抽出することを特徴とする請求項1に記載の方法。
- 前記肉付き線分抽出工程を介して抽出された各肉付き線分について、1つの温度点に対して複数の移動度点が対応する状態から、1つの温度点に対して1つの移動度点が対応する状態へスリム化するスリム化工程と、前記スリム化工程を介して得られた各スリム化線分を所定の関数で近似する関数化工程とをさらに含み、前記特徴点抽出工程では、前記関数化工程を介して関数化された各バンド曲線について複数の特徴点を抽出することを特徴とする請求項1乃至2のいずれか1項に記載の方法。
- 前記スリム化工程は、1つの温度点に対応する複数の移動度点の重心点を検出する重心点検出工程と、連続する多数の温度点について前記重心点検出工程を繰り返す検出繰返工程と、前記検出繰返工程を介して得られた多数の重心点の連鎖によりスリム化線分を形成するスリム化線分形成工程とを含むことを特徴とする請求項3に記載の方法。
- 前記スリム化線分形成工程は、滑らかな曲線からなるスリム化線分を得るために、ある重心点の移動度方向の座標と両側に隣接する重心点の移動度方向の座標との平均座標を、その重心点における移動度方向の座標と設定するスムージング処理工程を含むことを特徴とする請求項4に記載の方法。
- 前記関数化工程は、ニュートン・ラプソン(Newton-Raphson)法を用いて各スリム化線分を適当な次数のn次斉関数に近似する近似工程を含むことを特徴とする請求項3乃至5のいずれか1項に記載の方法。
- 前記規格化工程では、塩基配列のわかっている参照試料であって本来の試料とともに電気泳動させた内部参照試料の特徴点および実験条件パラメータなどに基づいて、移動度方向に沿って0と1との間で無次元化することを特徴とする請求項1乃至6のいずれか1項に記載の方法。
- 前記規格化工程に先立って、前記取込工程を介して取り込んだゲノムプロフィリング画像のゆがみを補正するゆがみ補正工程をさらに含むことを特徴とする請求項1乃至7のいずれか1項に記載の方法。
- 前記ゆがみ補正工程では、ゲルの4隅を定義し、定義された4隅に基づいて補正処理を行うことを特徴とする請求項8に記載の方法。
- 前記ゆがみ補正工程では、塩基配列のわかっている参照試料であって本来の試料とともに電気泳動させた内部参照試料の特徴点を認識し、認識した特徴点に基づいて補正処理を行うことを特徴とする請求項8に記載の方法。
- 特徴点群に関する登録情報を参照するために比較対象ゲノムの選択を行う選択工程と、前記選択工程を介して選択された比較対象ゲノムの特徴点群に関する登録情報を参照し、請求項1乃至10のいずれか1項に記載の方法により試料生物について抽出された特徴点群から対応特徴点群を決定する特徴点群対応付け工程と、前記比較対象ゲノムの特徴点群と前記試料生物の対応特徴点群との比較に基づいて、前記試料生物の種の同定を行う種同定工程とを含むことを特徴とする種同定方法。
- 前記種同定工程において、比較対象ゲノムのn個の特徴点P0iの位置ベクトルをV0iとし、試料生物のn個の特徴点P1iの位置ベクトルをV1iとしたとき、以下の式(1)で規定されるPaSSの値に基づいて、前記試料生物の種の同定を行うことを特徴とする請求項11に記載の方法。
PaSS=1−{Σγ(i)}/n (1)
ここで、Σはi=1〜nまでの総和記号であり、γ(i)は以下の式(2)で表される。
γ(i)=|V1i−V0i|/(|V1i|+|V0i|) (2) - 前記PaSSを用いて、以下の式(3)で規定されるゲノム準距離dsの値に基づいて、前記試料生物の種の同定を行うことを特徴とする請求項12または13に記載の方法。
ds=(1−PaSS)/PaSS (3) - 特徴点群に関する登録情報を参照するために比較対象ゲノムの選択を行う選択工程と、前記選択工程を介して選択された比較対象ゲノムの特徴点群に関する登録情報を参照し、請求項1乃至10のいずれか1項に記載の方法により試料生物について抽出された特徴点群から対応特徴点群を決定する特徴点群対応付け工程と、前記比較対象ゲノムの特徴点群と前記試料生物の対応特徴点群との比較に基づいて、前記試料生物について同一種の個体間における類縁性の同定を行う類縁性同定工程とを含むことを特徴とする種同定方法。
- 前記類縁性同定工程において、比較対象ゲノムのn個の特徴点P0iの位置ベクトルをV0iとし、試料生物のn個の特徴点P1iの位置ベクトルをV1iとしたとき、以下の式(1)で規定されるPaSSの値に基づいて、前記試料生物について同一種の個体間における類縁性の同定を行うことを特徴とする請求項15に記載の方法。
PaSS=1−{Σγ(i)}/n (1)
ここで、Σはi=1〜nまでの総和記号であり、γ(i)は以下の式(2)で表される。
γ(i)=|V1i−V0i|/(|V1i|+|V0i|) (2) - 前記類縁性同定工程において、比較対象ゲノムのn個の特徴点P0iの温度をT0iとし、試料生物のn個の特徴点P1iの温度をT1iとし、比較対象ゲノムのn個の特徴点P0iの移動度をM0iとし、試料生物のn個の特徴点P1iの移動度をM1iとし、特徴点の現れる温度範囲幅に相当する温度規格化因子をTwとし、移動度変化と温度変化の両方の「重み」の相対値をαとしたとき、以下の式(4)で規定されるPaSSの値に基づいて、前記試料生物について同一種の個体間における類縁性の同定を行うことを特徴とする請求項15に記載の方法。
PaSS=1−{Σr(i)}/n (4)
ここで、Σはi=1〜nまでの総和記号であり、r(i)は以下の式(5)で表される。
- 前記PaSSを用いて、以下の式(3)で規定されるゲノム準距離dsの値に基づいて、前記試料生物について同一種の個体間における類縁性の同定を行うことを特徴とする請求項16または17に記載の方法。
ds=(1−PaSS)/PaSS (3)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000123448A JP4527841B2 (ja) | 2000-04-25 | 2000-04-25 | ゲノムプロフィリング画像から特徴点を抽出する方法、並びに該方法で得られた特徴点群を用いた遺伝子型による種同定方法および類縁性同定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000123448A JP4527841B2 (ja) | 2000-04-25 | 2000-04-25 | ゲノムプロフィリング画像から特徴点を抽出する方法、並びに該方法で得られた特徴点群を用いた遺伝子型による種同定方法および類縁性同定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001305104A JP2001305104A (ja) | 2001-10-31 |
JP4527841B2 true JP4527841B2 (ja) | 2010-08-18 |
Family
ID=18633748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000123448A Expired - Fee Related JP4527841B2 (ja) | 2000-04-25 | 2000-04-25 | ゲノムプロフィリング画像から特徴点を抽出する方法、並びに該方法で得られた特徴点群を用いた遺伝子型による種同定方法および類縁性同定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4527841B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05503351A (ja) * | 1989-08-19 | 1993-06-03 | キアゲン・ゲーエムベーハー | 温度勾配ゲル電気泳動による混合物成分の分離・検出方法および装置 |
JPH07506483A (ja) * | 1992-01-24 | 1995-07-20 | アプリジェン エス.アー. | 光架橋によって安定させた2本鎖dnaの変性勾配電気泳動による突然変異検出方法 |
WO1999040421A1 (en) * | 1998-02-03 | 1999-08-12 | Perkin-Elmer Corporation | Lane tracking system and method |
JP2001299398A (ja) * | 2000-04-25 | 2001-10-30 | Taitec Kk | 遺伝子型による生物の同定方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03285157A (ja) * | 1990-03-30 | 1991-12-16 | Shimadzu Corp | 塩基配列決定装置 |
JPH06273320A (ja) * | 1993-03-19 | 1994-09-30 | Olympus Optical Co Ltd | 電気泳動像の自動分析方法および表示方法 |
JP3574811B2 (ja) * | 1994-07-22 | 2004-10-06 | 株式会社北里サプライ | 電気泳動用多段階温度勾配透明プレートおよび電気泳動装置 |
-
2000
- 2000-04-25 JP JP2000123448A patent/JP4527841B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05503351A (ja) * | 1989-08-19 | 1993-06-03 | キアゲン・ゲーエムベーハー | 温度勾配ゲル電気泳動による混合物成分の分離・検出方法および装置 |
JPH07506483A (ja) * | 1992-01-24 | 1995-07-20 | アプリジェン エス.アー. | 光架橋によって安定させた2本鎖dnaの変性勾配電気泳動による突然変異検出方法 |
WO1999040421A1 (en) * | 1998-02-03 | 1999-08-12 | Perkin-Elmer Corporation | Lane tracking system and method |
JP2001299398A (ja) * | 2000-04-25 | 2001-10-30 | Taitec Kk | 遺伝子型による生物の同定方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2001305104A (ja) | 2001-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112419250B (zh) | 路面裂缝数字图像提取、裂缝修补及裂缝参数计算方法 | |
US7979212B2 (en) | Method and system for morphology based mitosis identification and classification of digital images | |
WO2018068600A1 (zh) | 图像处理方法及系统 | |
CN107491730A (zh) | 一种基于图像处理的化验单识别方法 | |
CN113723573A (zh) | 基于自适应比例学习的肿瘤组织病理分类系统及方法 | |
WO2005076197A2 (en) | Method and system for morphology based mitosis identification and classification of digital images | |
CN110490836B (zh) | dPCR微阵列图像信息处理方法 | |
CN112785579A (zh) | 基于图像处理技术的混凝土裂缝识别方法 | |
CN106934829A (zh) | 一种表面裂缝的检测方法及系统 | |
CN113724243B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN104732520A (zh) | 一种胸部数字影像的心胸比测量算法及系统 | |
CN114049330A (zh) | 一种荧光原位杂交图像中荧光特征融合方法及系统 | |
CN114648511A (zh) | 一种大肠杆菌轮廓的精确提取及识别方法 | |
US5400249A (en) | Apparatus for assessing relatedness from autoradiograms | |
Wang et al. | A rule-based computer scheme for centromere identification and polarity assignment of metaphase chromosomes | |
CN114881965A (zh) | 一种基于人工智能和图像处理的木板节子检测方法 | |
CN117252786A (zh) | 一种基因检测数据增强处理方法 | |
JP4527841B2 (ja) | ゲノムプロフィリング画像から特徴点を抽出する方法、並びに該方法で得られた特徴点群を用いた遺伝子型による種同定方法および類縁性同定方法 | |
CN112184696B (zh) | 一种细胞核和细胞器计数及其面积计算方法与系统 | |
CN108256475B (zh) | 一种票据图像倒置检测方法 | |
CN116434920A (zh) | 一种胃肠上皮化生进展风险预测方法与装置 | |
Abeykoon et al. | An automated system for analyzing agarose and polyacrylamide gel images | |
CN106909897B (zh) | 一种文本图像倒置快速检测方法 | |
JP7254283B2 (ja) | 閾値決定方法、画像処理方法、標本画像の評価方法、コンピュータプログラムおよび記録媒体 | |
Koprowski et al. | Automatic analysis of 2D polyacrylamide gels in the diagnosis of DNA polymorphisms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20040628 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040628 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040823 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070402 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091023 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091221 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20091221 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20091221 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20091221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100309 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100407 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100601 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100604 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130611 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4527841 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130611 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |