JP2002330768A - プローブ設計方法及びバイオチップ - Google Patents

プローブ設計方法及びバイオチップ

Info

Publication number
JP2002330768A
JP2002330768A JP2001142170A JP2001142170A JP2002330768A JP 2002330768 A JP2002330768 A JP 2002330768A JP 2001142170 A JP2001142170 A JP 2001142170A JP 2001142170 A JP2001142170 A JP 2001142170A JP 2002330768 A JP2002330768 A JP 2002330768A
Authority
JP
Japan
Prior art keywords
probe
node
target
biopolymer
species
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001142170A
Other languages
English (en)
Inventor
Shingo Ueno
紳吾 上野
Akira Nakashige
亮 中重
Yasuyuki Nozaki
康行 野崎
Toshiko Matsumoto
俊子 松本
Takuro Tamura
卓郎 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP2001142170A priority Critical patent/JP2002330768A/ja
Priority to US10/076,932 priority patent/US20020160401A1/en
Publication of JP2002330768A publication Critical patent/JP2002330768A/ja
Priority to US10/857,909 priority patent/US20040219593A1/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 バイオチップで生物種の識別を厳密に行う方
法、種以上のレベルでの生物種の識別を可能にする方法
を提供する。また、多数の生物種間での特異的プローブ
の選択を容易にする。 【解決手段】 ターゲットの系統樹に基づき、あるノー
ド以下のリーフで共通した塩基配列があれば、それをそ
のノードに固有のプローブとして設計する。このプロー
ブとリーフに固有のプローブをセットにして使用するこ
とにより、生物種の識別を厳密に行うことができ、ま
た、種以上のレベルでの生物種の識別も可能になる。リ
ーフに相当する塩基配列が同じもしくは似ていても、ノ
ードに相当する配列が異なればプローブとして使用可能
であるため、多数の生物種間での特異的プローブの選択
が容易になる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、サンプル中に含ま
れる複数種類のDNAを判別することを目的とするバイオ
チップ及びそのバイオチップにスポットするプローブの
設計方法に関する。
【0002】
【従来の技術】近年の遺伝子解析技術の発展によって、
遺伝子の機能や構造が次第に明らかになってきた。中で
も、DNAチップまたはDNAマイクロアレイ(以下、本明細
書ではバイオチップという)の技術は、遺伝子解析に有
効な手段であるとして注目されている。バイオチップと
は、ガラス、シリコン、プラスチックなどの基板上に多
数の異なったプローブを高密度に整列化してスポットし
たものである。プローブとしては、通常cDNAや、20〜30
mer程度の短鎖ヌクレオチドなどが用いられる。バイオ
チップの原理は、DNAを構成する4つの塩基A(アデニ
ン)、T(チミン)、G(グアニン)、C(シトシン)に
おいて、AとT、GとCが互いに水素結合する性質、すなわ
ちハイブリダイゼーションに基づいている。このバイオ
チップ上に蛍光物質などで標識したDNAやRNAなどのター
ゲットを注ぎ、プローブとハイブリダイゼーションさせ
ることにより、ターゲットを捕獲する。捕獲されたDNA
やRNAなどのターゲットは各プローブスポットからの蛍
光シグナルとして検出され、これをコンピュータでデー
タ解析することにより、ターゲット中の数千から数万の
DNAやRNAの状況を一挙に観測することが可能となる。
【0003】バイオチップの利用方法のひとつとして、
ターゲットとなる遺伝子(またはDNA断片)を捕獲する
ことで、調べたいターゲットのDNAがサンプル中に含ま
れているか検定したり、捕獲したDNAの配列を読み取っ
たり、SNPなどのDNAの多型部分を調べる利用法(SBH
法)がある。
【0004】バイオチップの具体的な応用例の一つとし
て、生物種の識別方法について説明する。生物種の同定
には通常サンプル中のターゲットDNAの16SrDNA領域を使
うことが多い。16SrDNAはその生物に特異的なDNA配列
で、かつ変異が起こりにくい領域であるので生物種の同
定に使用するのに適しているからである。そして、プロ
ーブはその領域に合わせて設計する。実際の実験では16
SrDNAを特異的に増幅させ、プローブとハイブリダイズ
させることで生物種を識別していく。
【0005】図1は、バイオチップを用いた細菌同定の
方法を模式的に示す説明図である。まず、細菌のDNA配
列を格納したデータベース10から各細菌P,Q,R,
…に特異的な16SrDNA領域の塩基配列をプローブ11,
12,13,…として選択し、プローブ設計を行う。そ
のプローブ設計に従って各細菌に対応するプローブを作
製し、それを基板上に縦横に並べてスポットし、バイオ
チップ14を作製する。そのバイオチップ14上に、患
者の血液、痰などから抽出し蛍光標識したDNAをターゲ
ット15として注ぎ、バイオチップ14上のプローブと
ハイブリダイゼーションさせる。その結果、図の中央に
示すように、(横No1:縦No2)のスポットと(横No
3:縦No5)のスポットからシグナルが観測されたとす
る。このとき、バイオチップ上のスポット位置と細菌と
の対応表から細菌[Actinobacillusactinomycetemcomita
ns]と[Klebsiella oxytoca]がターゲットに混入してい
る(可能性がある)ことがわかる。この場合、検出され
るシグナルと菌種とは一対一の関係にある。
【0006】
【発明が解決しようとする課題】従来のバイオチップの
プローブ設計法は、ターゲットとプローブとを一対一に
対応づけるものである。しかし、このようなプローブ設
計法は必ずしも満足のいくものではなかった。まず第1
に、生物種のDNAとプローブが一対一の関係では、突然
変異や実験誤差によって生物種の判定が厳密に行えない
場合がある。
【0007】実験誤差の例として、ターゲットのDNA断
片が、バイオチップ上の対応する相補的な配列のプロー
ブと結合しなかったり、あるいは対応しないプローブと
結合したりすることがある。対応するプローブと結合し
ない場合の例として、ターゲットのDNA配列がプローブ
設計時に参照したパブリックデータベースの配列とは異
なることがある。例えば図2に示すように、バイオチッ
プに注ぐターゲット22のDNAに変異が起きていて、1
塩基置換や1塩基挿入が起こっていると、プローブ21
とハイブリダイズしない。図2は、ターゲット22に位
置23で1塩基挿入があって結合しない場合を示してい
る。
【0008】対応しないプローブと結合する場合のひと
つとしては、クロスハイブリダイゼーションがある。ク
ロスハイブリダイゼーションとは、図3に示すように、
ターゲットの遺伝子(またはDNA断片)33,34と、
バイオチップ上のプローブ31,32とが類似したDNA
配列を持つとき、部分的に結合される状態をいう。 文
献(Michael D. Kane et al.: Assessment of the sens
itivity and specificity of oligonucleotide (50mer)
microarrays: Nucleic Acids Res.,28(22),4552-4557,
2000)によると、配列の類似度が75%以上のもの、ある
いは類似度がそれほど高くない場合(50〜75%)でも、
長さ15mer以上の連続した相補文字列があれば、クロス
ハイブリダイゼーションする可能性があるとの報告があ
る。
【0009】一方、クロスハイブリダイゼーションを起
こさないようにするための試みとして、配列に特異的な
プローブを選別する方法(Ken-ichi Kurata et al.: Pr
obeDesign for DNA Chips: Genome Informatics 1999,
225-6,1999)などがあるが、確実にクロスハイブリダイ
ゼーションしないレベルには至っていない。また、ある
程度のクロスハイブリダイゼーションが起こっていると
して、そこから本来の蛍光シグナルがどの程度あるかを
予測する方法(Mitsuteru Nakao et al.: Quantitative
Estimation of Cross-Hybridization in DNA Microarr
ays Based ona Linear Model: Genome Informatics 200
0, 231-232,2000)も考えられているが、これも実用レ
ベルには至っていない。
【0010】クロスハイブリダイゼーション以外にも、
ハイブリダイゼーション反応のときの温度やターゲット
溶液のpHといった実験条件、実験機器の状態、ターゲッ
トやプローブの濃度などにより、本来該当しないスポッ
トから蛍光シグナルが観測されてしまう可能性はいくつ
もある。現在のバイオチップでは、同じDNA配列のプロ
ーブをチップ上に複数個スポットすることによって、実
験に再現性があるかを確かめてはいるが、この方法では
上に述べた実験誤差に対応することが出来ない。
【0011】第2に、ターゲットとプローブとを一対一
に対応づけたバイオチップでは、種以上のレベルでの生
物種の同定ができない。従来の生物種同定チップでは、
生物の種ではなく属や科のレベルで分類を行いたい場合
のような大まかなレベルの検出に対する要望には応える
ことができなかった。例えば、ある生物の特徴が種レベ
ルではほとんど差がないため属レベルで生物の分類を行
いたい場合、従来のバイオチップでは対応できない。
【0012】第3に、多数の生物種それぞれに対して特
異的なプローブを選出しようとすると、生物種が多くな
るにつれ、特異的なプローブの選出に限界が生じてく
る。図4は、例えば50個のプローブを選出しようとし
たとき、選出されたプローブNo.1〜No.50の中にDNA
配列が互いに似ているプローブが多くなり、プローブの
選出が非常に困難になる状況を模式的に示している。ま
た、配列が類似していること以外にも、たくさんのプロ
ーブをとるとプローブ間のTm値が揃わないといった問題
もある。Tm値は2本鎖のDNAが解離して1本鎖になる温度
である。ハイブリダイゼーション反応は、高温下では2
本鎖DNAが解離して1本鎖になり、低温下では再び2本鎖
を形成するDNAの性質を利用している。従って、バイオ
チップにおいてはスポットするプローブのTm値を均一に
する必要がある。
【0013】本発明は、このような従来技術の問題点に
鑑み、ターゲットの遺伝子(またはDNA断片)をより高
精度かつ確実に検出することのできるバイオチップ及び
プローブ設計方法を提供することを目的とする。また、
本発明は、大まかなレベルでの生物種の同定を可能にす
るバイオチップ及びそのプローブ設計方法を提供するこ
とを目的とする。さらに、本発明は、多数の生物種間で
の種特異的プローブの選出を容易にするプローブ設計方
法を提供することを目的とする。
【0014】
【課題を解決するための手段】上記目的を達成するため
に、本発明では、分子系統樹による生物の分類に基づい
た複数の特徴的なプローブを設計することで、ターゲッ
ト中のDNAがどの生物種由来のものであるかを判定する
ことと、多数の生物種間での種特異的プローブの選出を
容易にする。ここで、分子系統樹とは、生物種の生体高
分子配列の相同性に基づいて作られた樹状図のことであ
り、同一のノード以下に分類される生物種は近縁であり
生物学的に似た性質を持つ。
【0015】複数の特徴的なプローブを設計する際の方
針は、従来のような生物種との一対一の関係だけでプロ
ーブを設計するのではなく、いくつかのターゲットに共
通するDNA配列をプローブとして選択することである。
その際、分子系統樹を入力データとして各ノードに対応
するプローブを設計していく。つまり、分子系統樹のあ
るノード以下の細菌に共通し、かつ、他の細菌にはない
塩基配列があれば、それをそのノードに固有のプローブ
として設計する。
【0016】図5は、分子系統樹に基づいてプローブを
設計した例を示す説明図である。図のI,J,K,Lに
対応するノードに固有のプローブがとれた状況を示して
いる。図5の例の場合、塩基配列Iは、分子系統樹のノ
ードI以下の細菌1,2,3に共通し、しかも他の細菌
にはない塩基配列である。従って、ノードIに対応する
プローブとして塩基配列Iを選定する。同様に、塩基配
列Jは、分子系統樹のノードJ以下の細菌4,5に共通
し、他の細菌にはない塩基配列であるため、ノードJに
対応するプローブとする。塩基配列Kは、分子系統樹の
ノードK以下の細菌7,8に共通し、他の細菌にはない
塩基配列であるため、ノードKに対応するプローブとす
る。塩基配列Lは、分子系統樹のノードL以下の細菌4
〜8に共通し、他の細菌にはない塩基配列であるため、
ノードLに対応するプローブとする。なお、塩基配列
A,B,C,…,Hは、細菌1〜8に固有の塩基配列で
あり、細菌1〜8に一対一対応する各細菌に固有のプロ
ーブとして選出される。
【0017】このように分子系統樹のノードに対応する
プローブを設計すると、検出されたスポットの菌名だけ
でなく、それらの近縁関係がわかるため、ターゲットに
含まれている細菌をより精密に識別することができる。
実際、分子系統樹はDNA配列の相同性に基づいて作られ
ているが、形態学的に作製された進化系統樹とほぼ一致
する。そのため、進化系統樹に基づく種や属といった分
類法は分子系統樹のノードとリーフの関係と一致するこ
とが多い。
【0018】また、図5のように分子系統樹による分類
に準じたプローブを用意するプローブ設計法は、1つの
ターゲットに対して固有なプローブを数種類用意する方
法に対して、バイオチップ上に設けるスポットの数量も
削減でき、コスト面と労力面共にメリットがある。そし
て、単に細菌に特異的なプローブを複数用意することに
比べて、多くのスポットからのシグナルで細菌の混入具
合を判別するので、より正確な判定を行うことが出来
る。
【0019】図6は、図5で選択したプローブA〜Kを
スポットしたバイオチップにターゲットをハイブリダイ
ゼーションさせたときの結果の例を示す模式図である。
図6に示した例では、プローブA,C,G,I,K,L
から信号が検出されており、細菌1、細菌3、細菌7が
混入していることが、細菌に固有なプローブ(A,C,
G)と、分子系統樹の中間ノードに対応するプローブ
(I,K,L)から判断することが出来る。このように
中間ノードからのシグナルを利用することにより精度の
高い検出が可能になる。
【0020】また、図7のように、種に相当するスポッ
トGからのシグナルが検出されているにもかかわらず中
間ノードに相当するスポットK,Lからのシグナルが検
出されていない場合は、種に相当するスポットGでクロ
スハイブリが起こっていると考えられる。つまり、中間
ノードに相当するスポットによりハイブリ反応が正常に
行われたかどうかを判別できる。このような検出手法を
用いることにより一層精度の高い検出が可能となる。ま
た逆に、種に相当するスポットA,B,Cからのシグナ
ルが検出されず、中間ノードに相当するスポットIから
のシグナルが検出されている場合は、未知種または突然
変異した種のDNAがサンプル中に存在していると考えら
れる。この場合は、種レベルまでは識別できなくてもそ
の上位レベルまでは識別することができ、未知のものを
推定する手がかりとなる。
【0021】菌種を同定するプローブを各菌の16SrDNA
配列から選定するとき、それぞれのプローブは互いに似
ていてはいけない。その結果、菌種が増加してくると互
いに似ていない塩基配列を選ぶことは困難になってく
る。しかし、図8のように、種に相当する塩基配列が同
じもしくは似ていても、中間ノードに相当する配列が異
なれば、中間ノードに相当する配列と組み合わせること
でプローブとして使用可能である。図8の例では、細菌
1〜3はα属に、細菌48〜50はβ属に属している。
プローブNo.1とNo.49は非常に良く似た配列である。
このような状況でも、属に相当するプローブαやβを種
に相当するプローブと同時に使用することにより、本来
なら互いに非常に似ているため使用できない配列No.1
とNo.49も種のプローブとして利用可能になる。ター
ゲットの検出に当たっては、図6にて説明したように
種、中間ノードそれぞれに相当する複数のプローブから
のシグナルから総合的に判断する。
【0022】本発明によるプローブの設計方法、バイオ
チップ、ターゲット検出方法の特徴をまとめると、以下
の通りである。 (1)サンプル中に含まれる複数種類のターゲット生体
高分子を判別するためのプローブの設計方法において、
前記複数種類のターゲット生体高分子を含む生体高分子
群の分子系統樹のノードに対応するプローブとして、そ
のノード以下の生体高分子とのみ共通してハイブリダイ
ズするプローブを設計することを特徴とするプローブの
設計方法。
【0023】(2)サンプル中に含まれる複数種類のタ
ーゲット生体高分子を判別するためのプローブの設計方
法において、前記複数種類のターゲット生体高分子とそ
れぞれ特異的にハイブリダイズするプローブと、前記複
数種類のターゲット生体高分子を含む生体高分子群の分
子系統樹のノードに対応するプローブとして、そのノー
ド以下の生体高分子とのみ共通してハイブリダズするプ
ローブとを設計することを特徴とするプローブの設計方
法。
【0024】(3)サンプル中に含まれる複数種類のタ
ーゲット生体高分子を判別するためのプローブの設計方
法において、前記複数種類のターゲット生体高分子を含
む生体高分子群の分子系統樹のノードに対応するプロー
ブとして、そのノード以下の生体高分子とのみ共通して
ハイブリダズするプローブと、前記ノード以下のターゲ
ット生体高分子とそれぞれ特異的にハイブリダイズする
プローブとを設計することを特徴とするプローブの設計
方法。
【0025】(4)複数種類のターゲット生体高分子を
判別するために基板上に複数のプローブをスポットした
バイオチップにおいて、前記複数種類のターゲット生体
高分子を含む生体高分子群の分子系統樹のノードに対応
するプローブとして当該ノード以下の生体高分子とのみ
共通してハイブリダイズするプローブをスポットしたこ
とを特徴とするバイオチップ。
【0026】(5)複数種類のターゲット生体高分子を
判別するために基板上に複数のプローブをスポットした
バイオチップにおいて、前記複数種類のターゲット生体
高分子とそれぞれ特異的にハイブリダイズするプローブ
と、前記複数種類のターゲット生体高分子を含む生体高
分子群の分子系統樹のノードに対応するプローブとして
当該ノード以下の生体高分子とのみ共通してハイブリダ
ズするプローブとをスポットしたことを特徴とするバイ
オチップ。
【0027】(6)複数種類のターゲット生体高分子を
判別するために基板上に複数のプローブをスポットした
バイオチップにおいて、前記複数種類のターゲット生体
高分子を含む生体高分子群の分子系統樹のノードに対応
するプローブとして当該ノード以下の生体高分子とのみ
共通してハイブリダズするプローブと、前記ノード以下
のターゲット生体高分子とそれぞれ特異的にハイブリダ
イズするプローブとをスポットしたことを特徴とするバ
イオチップ。
【0028】(7)プローブとのハイブリダイゼーショ
ン反応に基づいてターゲット生体高分子の存在を検出す
るターゲット検出方法において、ターゲットとなるべき
複数種類の生体高分子を含む生体高分子群に対する分子
系統樹の所定のノード以下の生体高分子とのみ共通して
ハイブリダズするプローブとのハイブリダイゼーション
反応と、前記所定のノード以下の生体高分子とそれぞれ
特異的にハイブリダイズするプローブとのハイブリダイ
ゼーション反応とをもとにターゲット生体高分子の存在
を検出することを特徴とするターゲット検出方法。
【0029】
【発明の実施の形態】以下、本発明を実施する場合の一
形態を図面を参照して具体的に説明する。図9は、バイ
オチップの作製、蛍光シグナルの検出、シグナルデータ
の解析を行うバイオチップシステムの構成例を示すブロ
ック図である。このバイオチップシステムは、配列デー
タの入出力及び実験データの解析等を行う中央処理装置
900、中央処理装置900での処理に必要なプログラ
ムを格納するプログラムメモリ910、キャラクタ及び
グラフィック画面を表示する表示装置901、本システ
ムへの値の入力や選択の操作を行うためのキーボード9
02およびマウス903、プローブDNA配列の設計に使
うターゲットDNAの情報が格納されている配列データベ
ース904、ノード用プローブの設計に使う系統樹の情
報が格納されている系統樹データ909を備える。
【0030】ここで、配列データベース904はローカ
ルなデータベースであってもよいし、ネットワーク等を
介して遠隔地に設置されたサーバーコンピュータが管理
しているデータベースであってもよい。系統樹データ9
09は既に作成されたデータであってもよいし、新たに
配列データベース904から作成したデータであっても
よい。また、系統樹データ909はローカルなコンピュ
ータにあるデータであってもよいし、ネットワーク等を
介して遠隔地に設置されたサーバコンピュータが管理し
ているデータであってもよい。中央処理装置900はコ
ンピュータとそのプログラムによって具体化されるもの
である。
【0031】プログラムメモリ910は、配列データベ
ース904のデータを処理する配列データ処理部91
1、系統樹データ909を解析する系統樹データ解析処
理部912、キーボード902やマウス903からの入
力を処理する入力データ処理部911、配列データ処理
部911の処理結果と系統樹データ解析処理部912の
解析結果をもとにプローブの選択処理を行うプローブ選
択処理部914、設計したプローブを表示するプローブ
表示処理部915からなる。
【0032】中央処理装置900は、設計したプローブ
DNA配列から実際のチップに載せるプローブを作製する
プローブ作製装置905、プローブ作製装置で作製した
プローブを入れるウェル906からプローブを取り出し
てチップ908上の所定の位置に載せるスポッタ907
の制御も行う。
【0033】図10は、本システムが管理するターゲッ
トDNA配列データの例を示したものである。配列情報
は、dnaSeq[i](i = 1,2,…,sNum)という長さsNum個の構
造体の配列に格納する。ただしsNumはプローブ選別で対
象とするターゲットDNAの個数である。配列dnaSeq[]
は、配列名(1000)、DNA配列(1001)、DNA配
列の配列長(1002)、そしてこの配列がどのプロー
ブで検出されるのかを示すPROBE_ID(1003)からな
る。PROBE_IDには、このターゲットDNAを識別すること
が可能な各プローブの識別子が入る。この識別子は後述
する配列probe[]の識別子を指している。また、これら
の属性に加えて、配列を取り出した生体組織(器官)の
名前、生物種名、属名、配列データベースに関する情報
などをdnaSeq[]の属性として加えてもよい。
【0034】図11は、本システムが管理するプローブ
DNA配列データの例を示したものである。プローブDNA配
列データは、probe[i](i = 1,2,…,pNum)という長さpNu
m個の構造体の配列に格納されている。ここでpNumは、
チップ上に載せるプローブの総数である。配列probe[]
は、チップ上でのプローブの座標位置(1100)、検
出器で観測された蛍光シグナル強度(1101)、プロ
ーブのDNA配列(1102)、このプローブによって検
出することが可能なターゲットのリストを表すTARGET_I
D(1103)からなる。TARGET_IDには、前に述べた配
列dnaSeq[]のインデックスをターゲットの識別子として
入力する。
【0035】図12は、本システムの入力データである
系統樹データの例を示したものである。系統樹データは
ファイル形式になっており、系統樹のリーフの部分をdn
aSeq[]の識別子に対応させ、一組の括弧を一つの中間ノ
ードに対応させている。そして中間ノードが(系統樹上
でリーフに近い)中間ノードを持つときは、入れ子構造
で表現する形式をとっている。すなわち、BNF記法で書
くと次のようになる。
【0036】 ノード::=(ノード,ノード)|dnaSeq[]の識別子 そして、系統樹データには、このルートに対応するノー
ドがかかれている。図12で示した系統樹データの例で
は、(1,2)はノードAに対応しており、((1,
2),3)はノードBに対応している。
【0037】図13は、本システムが管理するNode構造
体を示す図である。Node構造体は系統樹における各ノー
ドおよびリーフを示したものである。Nodeはリーフ識別
子1300、左子ノードへのポインタ1301、右子ノ
ードへのポインタ1302からなる。リーフの識別子1
300にはNodeが系統樹における中間ノードのときNode
の下に属するリーフの識別子(dnaSeq[]のインデック
ス)が登録され、Node自体がリーフのときは、リーフの
識別子1300には対応するdnaSeq[]のインデックスが
登録される。また、Nodeがリーフのときは、左子ノード
のポインタ、右ノードのポインタにはNULLを入れる。
【0038】図14はNode構造体の間の関係を示したも
ので、左子ノードと右子ノードへのポインタをつなぎ合
わせることで系統樹のツリー構造を再生している。図1
5は、本発明の概略処理フローを示した図である。ま
ず、配列データベース904からプローブ選別で対象と
するターゲットDNA配列データを読み込み、dnaSeq[]に
登録する(ステップ1500)。次に、系統樹データ9
09から系統樹データを読み込み、Node構造体に登録す
る。系統樹データ909は既に作成されたデータであっ
てもよいし、新たに配列データベースから作成したデー
タであってもよい。入力された系統樹データは、図14
のように樹状図の形状に合わせて、Node構造体のリンク
を構築していく(ステップ1501)。
【0039】次に、プローブ選別の基準を、キーボード
902やマウス903を用いて入力する。すなわち、何
merのプローブを作製するのか、プローブのTm値(DNAの
2本鎖が1本鎖に分離する温度)、他のターゲットDNA
との配列類似度の限界値など、プローブDNA配列選別の
要件に関する情報を設定していく。入力方法はこの他に
も、予めプローブ作製に関する情報が入っているファイ
ルを読み込む利用形態がある(ステップ1502)。そ
の後、dnaSeq[]及びNodeを用いて、系統樹のノード及び
種に対応するプローブDNA配列を決める(ステップ15
03)。この処理については後で詳しく述べる。この処
理によりプローブが配列probe[i](i= 1,…,pNum)に格納
される。
【0040】これをプローブ作製装置905に送り、実
際にプローブを作る(ステップ1504)。作ったプロ
ーブをウェル906に調整し、ウェルからスポッタ90
7でバイオチップを作製する(ステップ1505)。最
後に樹状図に対応したプローブの選別結果を図17のよ
うに表示装置901に表示する(ステップ1506)。
図17については後で詳しく述べる。
【0041】図16は、図15におけるプローブDNA配
列を決める処理(ステップ1503)の詳細フローであ
る。図15のステップ1503では、引数として系統樹
のルートを与えてコールする。図16において、まず、
引数として与えられたNode構造体のデータを読み込む
(ステップ1600)。次に、このNodeに子ノードが存
在するかどうか調べる(ステップ1601)。子ノード
が存在しないのであれば、Nodeは系統樹の種に対応して
いる。存在するのであれば、系統樹のノードに対応して
いる。
【0042】Nodeに子ノードが存在しないとき、まず、
このNodeのリーフの識別子メンバ1300に対応するタ
ーゲットに対するプローブDNA配列を選別する。ターゲ
ットDNA配列から、プローブの長さ分のDNA部分配列(プ
ローブ候補)を取り出し、プローブ候補が、全DNA配列
でユニークであるか、基準となるTm値を満たしている
か、他のDNA配列との配列類似度が限界値を超えていな
いか、クロスハイブリを起こしやすい配列ではないか、
などを調べる。これらの基準を満たし、かつ最も望まし
いプローブ候補をターゲットDNAに固有なプローブとし
て選択する。そして、選別したプローブDNA配列をprobe
[]のDNA配列1102に登録し、Nodeのリーフの識別子
メンバをTARGET_ID1103に追加する(ステップ16
02)。Nodeのリーフ識別子メンバに対応するdnaSeq[]
のPROBE_IDメンバ1003に選別したプローブの識別子
を追加する(ステップ1603)。
【0043】ステップ1601において、Nodeに子ノー
ドが存在するとき、まず、このNodeに対応するプローブ
DNA配列を選別する。Nodeに対応するプローブは、Node
の下の種とは反応し、それ以外の種とは反応しないもの
でなくてはならない。そこで、まず、Nodeのリーフの識
別子メンバで示される識別子のターゲットDNA配列には
含まれ、それ以外のターゲットDNA配列には含まれない
ような、プローブの長さ分の部分配列をプローブ候補と
して求める。その後、Tm値や配列類似度は基準を満たし
ているかなどを調べ、最も望ましいプローブ候補をDNA
配列に固有なプローブとして選別する。選別したプロー
ブDNA配列をprobe[]のDNA配列1102に登録し、Node
のリーフの識別子メンバをTARGET_ID1103に追加す
る(ステップ1604)。Nodeのリーフ識別子メンバに
対応するdnaSeq[]のPROBE_IDメンバ1003に選別した
プローブの識別子を追加する(ステップ1605)。
【0044】その後、引数をNodeの左右の子ノードとし
て、ステップ1600から処理を繰返す(ステップ16
06、1607)。このようにして、系統樹の全てのノ
ード及び種を巡回しながらプローブを選択していく。ま
た、望ましいプローブ候補が得られなかったときは、そ
のことを表示装置901に出力する。
【0045】図17は、本システムが選別したプローブ
の情報を表示する表示装置901の画面の例を示す図で
ある。系統樹データ909が読み込まれ表示画面170
0に表示されると、マウス903のカーソル1701を
用いて系統樹のノードを選択する。ノードの選択は、マ
ウス903の他、キーボード902を用いて行っても良
い。すると1702、1703,1704,1705が
表示される。1702は、マウスカーソル1701で選
択したノードに属する生物種(ここではStr. sanguini
とStr. CanisとEnt. aviumの3つ)のマルチプルアライ
メントの結果である。網掛けの部分は、三つの生物種で
DNA配列が一致する部分である。網掛けでない部分は、
少なくとも一つの生物種でDNA配列が異なる部分であ
る。1703は、カーソル1701で選択したノードに
対応するプローブの一つである。1704は、そのプロ
ーブのDNA配列中における位置を示す。配列1703は7
塩基目から始まるので、マルチプルアライメントの7塩
基目から表示される。1705は、カーソル1701で
選択したノードに対応するプローブの一覧表である。こ
こではプローブの番号、配列、DNA配列中における位
置、反応温度を表示しているが、自分自身で絡み合う度
合いや他の条件を表示しても良い。以上の処理によっ
て、調べたいターゲットDNAの由来する生物種の判別を
対象としたプローブをうまく選別することが可能とな
る。
【0046】
【発明の効果】本発明によると、ターゲットの遺伝子
(又はDNA断片)を高精度に、あるいは所望の分類レベ
ルで検出することのできるバイオチップを得ることがで
きる。また、調べたいターゲットDNAの種類が増加して
もプローブの選別が容易に行える。それぞれのプローブ
は系統樹のノードとリーフの関係に対応しているので、
ハイブリダイゼーション反応やシグナル読み取りにおけ
るエラーチェックの役割も果たす。
【図面の簡単な説明】
【図1】バイオチップを用いた細菌同定の方法を模式的
に示す説明図。
【図2】ターゲットDNAが対応するプローブと結合しな
い例を示す図。
【図3】ターゲットDNAが対応しないプローブと結合す
る例を示す図。
【図4】菌種が多数の場合、プローブの選別が困難にな
ることを説明する図。
【図5】分子系統樹に対応したプローブの設計例を示す
図。
【図6】本発明のバイオチップを用いた実験結果の例を
示す図。
【図7】本発明のバイオチップを用いた実験結果の他の
例を示す図。
【図8】種に相当する塩基配列が同じもしくは似ていて
も、中間ノードに相当する配列が異なればプローブとし
て使用可能であることを示す図。
【図9】本発明によるバイオチップシステムの構成例を
示すブロック図。
【図10】ターゲットDNA配列データのデータ構造を示
す図。
【図11】プローブDNA配列データのデータ構造を示す
図。
【図12】系統樹データの構造を示した図。
【図13】Node構造体のデータ構造を示した図。
【図14】Node構造体のリンク関係を示した図。
【図15】本発明の概略処理フローを示す図。
【図16】プローブ配列決定の詳細フローを示す図。
【図17】プローブ選別結果表示画面例を示す図。
【符号の説明】
10…配列データベース、11〜13…プローブ、14
…バイオチップ、15…ターゲット、21…プローブ、
22…ターゲット、31,32…プローブ、33,34
…ターゲット、900…中央処理装置、901…表示装
置、902…キーボード、903…マウス、904…配
列データベース、909…系統樹データ、910…プロ
グラムメモリ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 中重 亮 神奈川県横浜市中区尾上町6丁目81番地 日立ソフトウエアエンジニアリング株式会 社内 (72)発明者 野崎 康行 神奈川県横浜市中区尾上町6丁目81番地 日立ソフトウエアエンジニアリング株式会 社内 (72)発明者 松本 俊子 神奈川県横浜市中区尾上町6丁目81番地 日立ソフトウエアエンジニアリング株式会 社内 (72)発明者 田村 卓郎 神奈川県横浜市中区尾上町6丁目81番地 日立ソフトウエアエンジニアリング株式会 社内 Fターム(参考) 4B024 AA19 AA20 CA01 CA09 CA11 HA11 HA12 4B029 AA07 AA23 BB20 FA15 4B063 QA13 QQ05 QQ42 QR08 QR42 QR56 QS25 QS34 QS39 QX02

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 サンプル中に含まれる複数種類のターゲ
    ット生体高分子を判別するためのプローブの設計方法に
    おいて、 前記複数種類のターゲット生体高分子を含む生体高分子
    群の分子系統樹のノードに対応するプローブとして、そ
    のノード以下の生体高分子とのみ共通してハイブリダイ
    ズするプローブを設計することを特徴とするプローブの
    設計方法。
  2. 【請求項2】 サンプル中に含まれる複数種類のターゲ
    ット生体高分子を判別するためのプローブの設計方法に
    おいて、 前記複数種類のターゲット生体高分子とそれぞれ特異的
    にハイブリダイズするプローブと、 前記複数種類のターゲット生体高分子を含む生体高分子
    群の分子系統樹のノードに対応するプローブとして、そ
    のノード以下の生体高分子とのみ共通してハイブリダズ
    するプローブとを設計することを特徴とするプローブの
    設計方法。
  3. 【請求項3】 サンプル中に含まれる複数種類のターゲ
    ット生体高分子を判別するためのプローブの設計方法に
    おいて、 前記複数種類のターゲット生体高分子を含む生体高分子
    群の分子系統樹のノードに対応するプローブとして、そ
    のノード以下の生体高分子とのみ共通してハイブリダズ
    するプローブと、 前記ノード以下のターゲット生体高分子とそれぞれ特異
    的にハイブリダイズするプローブとを設計することを特
    徴とするプローブの設計方法。
  4. 【請求項4】 複数種類のターゲット生体高分子を判別
    するために基板上に複数のプローブをスポットしたバイ
    オチップにおいて、 前記複数種類のターゲット生体高分子を含む生体高分子
    群の分子系統樹のノードに対応するプローブとして当該
    ノード以下の生体高分子とのみ共通してハイブリダイズ
    するプローブをスポットしたことを特徴とするバイオチ
    ップ。
  5. 【請求項5】 複数種類のターゲット生体高分子を判別
    するために基板上に複数のプローブをスポットしたバイ
    オチップにおいて、 前記複数種類のターゲット生体高分子とそれぞれ特異的
    にハイブリダイズするプローブと、前記複数種類のター
    ゲット生体高分子を含む生体高分子群の分子系統樹のノ
    ードに対応するプローブとして当該ノード以下の生体高
    分子とのみ共通してハイブリダズするプローブとをスポ
    ットしたことを特徴とするバイオチップ。
  6. 【請求項6】 複数種類のターゲット生体高分子を判別
    するために基板上に複数のプローブをスポットしたバイ
    オチップにおいて、 前記複数種類のターゲット生体高分子を含む生体高分子
    群の分子系統樹のノードに対応するプローブとして当該
    ノード以下の生体高分子とのみ共通してハイブリダズす
    るプローブと、前記ノード以下のターゲット生体高分子
    とそれぞれ特異的にハイブリダイズするプローブとをス
    ポットしたことを特徴とするバイオチップ。
  7. 【請求項7】 プローブとのハイブリダイゼーション反
    応に基づいてターゲット生体高分子の存在を検出するタ
    ーゲット検出方法において、 ターゲットとなるべき複数種類の生体高分子を含む生体
    高分子群に対する分子系統樹の所定のノード以下の生体
    高分子とのみ共通してハイブリダズするプローブとのハ
    イブリダイゼーション反応と、前記所定のノード以下の
    生体高分子とそれぞれ特異的にハイブリダイズするプロ
    ーブとのハイブリダイゼーション反応とをもとにターゲ
    ット生体高分子の存在を検出することを特徴とするター
    ゲット検出方法。
JP2001142170A 2001-03-29 2001-05-11 プローブ設計方法及びバイオチップ Pending JP2002330768A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2001142170A JP2002330768A (ja) 2001-05-11 2001-05-11 プローブ設計方法及びバイオチップ
US10/076,932 US20020160401A1 (en) 2001-03-29 2002-06-24 Biochip and method of designing probes
US10/857,909 US20040219593A1 (en) 2001-03-29 2004-06-02 Biochip and method of designing probes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001142170A JP2002330768A (ja) 2001-05-11 2001-05-11 プローブ設計方法及びバイオチップ

Publications (1)

Publication Number Publication Date
JP2002330768A true JP2002330768A (ja) 2002-11-19

Family

ID=18988521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001142170A Pending JP2002330768A (ja) 2001-03-29 2001-05-11 プローブ設計方法及びバイオチップ

Country Status (1)

Country Link
JP (1) JP2002330768A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004079627A1 (ja) * 2003-03-07 2004-09-16 Kabushikikaisha Dynacom 遺伝子を同定するための作用要素の選択方法
JP2007209305A (ja) * 2006-02-13 2007-08-23 Hitachi Software Eng Co Ltd 進化過程を考慮した保存領域検出システム
JP2009291199A (ja) * 2003-09-25 2009-12-17 Third Wave Technologies Inc Hpvの検出法
US7657381B2 (en) 2004-09-14 2010-02-02 Samsung Electronics Co., Ltd. Method of designing probe set, microarray having substrate on which probe designed by the method is immobilized, and computer readable medium on which program for executing the method is recorded
US8080381B2 (en) 2003-04-02 2011-12-20 Canon Kabushiki Kaisha Infectious etiologic agent detection probe and probe set, carrier, and genetic screening method

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004079627A1 (ja) * 2003-03-07 2004-09-16 Kabushikikaisha Dynacom 遺伝子を同定するための作用要素の選択方法
JPWO2004079627A1 (ja) * 2003-03-07 2006-06-08 株式会社ダイナコム 遺伝子を同定するための作用要素の選択方法
US8080381B2 (en) 2003-04-02 2011-12-20 Canon Kabushiki Kaisha Infectious etiologic agent detection probe and probe set, carrier, and genetic screening method
JP2009291199A (ja) * 2003-09-25 2009-12-17 Third Wave Technologies Inc Hpvの検出法
US8765418B2 (en) 2003-09-25 2014-07-01 Third Wave Technologies, Inc. Detection of HPV
US7657381B2 (en) 2004-09-14 2010-02-02 Samsung Electronics Co., Ltd. Method of designing probe set, microarray having substrate on which probe designed by the method is immobilized, and computer readable medium on which program for executing the method is recorded
JP2007209305A (ja) * 2006-02-13 2007-08-23 Hitachi Software Eng Co Ltd 進化過程を考慮した保存領域検出システム

Similar Documents

Publication Publication Date Title
Lucito et al. Representational oligonucleotide microarray analysis: a high-resolution method to detect genome copy number variation
Graves Powerful tools for genetic analysis come of age
Li et al. Bacterial strain typing in the genomic era
US7897750B2 (en) Strategies for gene expression analysis
RU2390561C2 (ru) Виртуальные наборы фрагментов нуклеотидных последовательностей
Chicurel Faster, better, cheaper genotyping
WO2020220615A1 (zh) 一种基于竞争性等位pcr构建水稻分子标记图谱的方法及利用其进行育种的应用
JP5171254B2 (ja) 多重プローブターゲット相互作用パターンの自動分析:パターンマッチング及び対立遺伝子同定
US7732138B2 (en) Rapid genotyping analysis and the device thereof
WO2003087409A1 (en) Detection of polymorphisms
Watson et al. The “chip” as a specific genetic tool
US20110105346A1 (en) Universal fingerprinting chips and uses thereof
JP2016165286A (ja) 転写物測定値数が減少した、遺伝子発現プロファイリング
CN115198023B (zh) 一种海南黄牛液相育种芯片及其应用
CN109524060B (zh) 一种遗传病风险提示的基因测序数据处理系统与处理方法
CN114790483A (zh) 一种与细毛羊净毛率相关的snp位点组合及其应用
CN105209637B (zh) 非侵入性胎儿性别确定
US20020160401A1 (en) Biochip and method of designing probes
Carpentier et al. The operons, a criterion to compare the reliability of transcriptome analysis tools: ICA is more reliable than ANOVA, PLS and PCA
JP2002330768A (ja) プローブ設計方法及びバイオチップ
JP2002296279A (ja) バイオチップ及びプローブ設計方法
US20080027654A1 (en) Systems and methods for probe design
Buchholz et al. Use of DNA arrays/microarrays in pancreatic research
US6994965B2 (en) Method for displaying results of hybridization experiment
Kuo et al. Gene expression profiling by DNA microarrays and its application to dental research

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060110

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060509