JP2004016070A - オーソログ遺伝子発現分布測定用オリゴヌクレオチドアレイ - Google Patents
オーソログ遺伝子発現分布測定用オリゴヌクレオチドアレイ Download PDFInfo
- Publication number
- JP2004016070A JP2004016070A JP2002174208A JP2002174208A JP2004016070A JP 2004016070 A JP2004016070 A JP 2004016070A JP 2002174208 A JP2002174208 A JP 2002174208A JP 2002174208 A JP2002174208 A JP 2002174208A JP 2004016070 A JP2004016070 A JP 2004016070A
- Authority
- JP
- Japan
- Prior art keywords
- species
- oligonucleotide
- gene
- ortholog
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
【課題】実験動物の遺伝子発現分布データをヒトに外挿する方法を提供する。また進化の度合いが異なる生物種同士のデータ比較を行うことで、進化の過程に対応する遺伝子機能の変化を研究するための方法を提供する。
【解決手段】塩基配列の異なる複数のオリゴヌクレオチドを支持体上の異なる位置に固定化したアレイであって、生物種Aと生物種Bのオーソログ遺伝子の部分配列をプローブとし、かつクロスハイブリダイゼーションを実質上無視できる程度に低減させたオリゴヌクレオチドアレイ。
【選択図】 図1
【解決手段】塩基配列の異なる複数のオリゴヌクレオチドを支持体上の異なる位置に固定化したアレイであって、生物種Aと生物種Bのオーソログ遺伝子の部分配列をプローブとし、かつクロスハイブリダイゼーションを実質上無視できる程度に低減させたオリゴヌクレオチドアレイ。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、従来複数の異なるアレイを用いて測定する必要があった複数生物種の遺伝子発現分布測定を1枚のアレイで評価するためのオリゴヌクレオチドアレイ、及び該オリゴヌクレオチドアレイを用いたオーソログ遺伝子発現分布測定方法に関する。
【0002】
【従来の技術】
創薬の過程において、毒性及び薬理作用の実験に用いられるラットやマウスなどの生物と、実際に医薬を服用するヒトとの生物種差をどのように克服するかが問題となっている。すなわち、ラットやマウスから得られた薬効や毒性データをヒトへ外挿する方法論がいまだに確立されていない。このためラットやマウスに対しては毒性がないのに、ヒトに対しては副作用が認められた結果、発売開始後の薬剤が販売停止になった例も数多い。
【0003】
一方、近年、DNAマイクロアレイを用いた発現分布測定により毒性、副作用予測を行うことが提案されている。Gerhold D et al., Monitoring expression of genes involved in drug metabolism and toxicology using DNA microarrays, Physiol Genomics, vol.5, pp.161−170 (2001)、Thomas R.S. et al., Identification of toxicologically predictie gene sets using cDNA microarrays, Molecular Pharmacology, vol.60, pp.1189−1194 (2001)を参照。DNAマイクロアレイを用いることで、例えば実験動物として代表的なラットにおける毒性や薬効予測の精度は大幅に向上できる可能性が高い。しかし、たとえラットに対する毒性や薬効予測が高精度で得られたとしても、その結果を生物種の異なるヒトに外挿する方法は依然確立されていない。
【0004】
【発明が解決しようとする課題】
毒性や薬効予測に優れた性能を有するDNAチップを用いて、実験動物(例えばラットやマウス)における毒性・薬効予測のデータをヒトに外挿することを可能とするオリゴヌクレオチドアレイ及びこれを用いた方法を提供する。またラット・マウスとヒトの組み合わせ以外でも、例えば、大腸菌、線虫、分裂酵母、出芽酵母、ショウジョウバエ、ラット、マウス、メダカ、ゼブラフィッシュ、ゴリラ、チンパンジー、ヒト、シロイヌナズナなどの異なる生物種のうちいずれか2種のDNAチップデータ比較を行うことで、進化の過程に対応する遺伝子機能の変化を研究するためのオリゴヌクレオチドアレイ及びこれを用いた方法を提供する。
【0005】
【課題を解決するための手段】
生物種A(例えばラット)と生物種B(例えばヒト)由来のRNAサンプルを異なる蛍光試薬を用いて標識した後、同一のDNAチップとハイブリダイズさせて、生物種Aと生物種Bの発現分布を直接比較することで上記課題を解決する。
【0006】
すなわち、本発明は以下の1)〜9)を提供する。
1) 異なる生物種のオーソログ遺伝子由来の複数のオリゴヌクレオチドを支持体上に固定化してなるオリゴヌクレオチドアレイ。
2) 上記異なる生物種が2種であり、片方がヒトである、上記1)に記載のオリゴヌクレオチドアレイ。
【0007】
3) 塩基配列の異なる複数のオリゴヌクレオチドを支持体上の異なる位置に固定化したアレイであって、前記オリゴヌクレオチドの各々が生物種A及び生物種Bのオーソログ遺伝子のいずれかの部分配列であり、
(1)生物種Aの該オーソログ遺伝子以外の遺伝子と前記オリゴヌクレオチドとの配列マッチ度が70%未満、
(2)生物種Bの該オーソログ遺伝子と前記オリゴヌクレオチドとの配列マッチ度が70%未満、かつ
(3)生物種A及び生物種Bのオーソログ遺伝子と前記オリゴヌクレオチドとの配列マッチ度がいずれも70%以上、
であることを特徴とするオリゴヌクレオチドアレイ。
【0008】
4) 塩基配列の異なる複数のオリゴヌクレオチドを支持体上の異なる位置に固定化したアレイであって、前記オリゴヌクレオチドの各々が生物種A及び生物種Bのオーソログ遺伝子のいずれかの部分配列であり、
(1)生物種Aの該オーソログ遺伝子以外の遺伝子と前記オリゴヌクレオチドとの配列相同性がBLAST等のホモロジーサーチアルゴリズムを用いて計算される統計的有意水準値で0.1以上、
(2)生物種Bの該オーソログ遺伝子以外の遺伝子と前記オリゴヌクレオチドとの配列相同性がBLAST等のホモロジーサーチアルゴリズムを用いて計算される統計的有意水準値で0.1以上、かつ
(3)生物種A及び生物種Bのオーソログ遺伝子と前記オリゴヌクレオチドとの配列相同性がBLAST等のホモロジーサーチアルゴリズムを用いて計算される統計的有意水準値でいずれも0.1未満
であることを特徴とするオリゴヌクレオチドアレイ。
【0009】
5) 塩基配列の異なる複数のオリゴヌクレオチドを支持体上の既知の異なる位置に固定化したアレイであって、前記オリゴヌクレオチドの各々が生物種A及び生物種Bのオーソログ遺伝子のいずれかの部分配列であり、
(1)生物種Aの該オーソログ遺伝子以外の遺伝子と前記オリゴヌクレオチドとの融解温度差異の実測値もしくは計算値が20℃以上、
(2)生物種Bの該オーソログ遺伝子以外の遺伝子と前記オリゴヌクレオチドとの融解温度差異の実測値もしくは計算値が20℃以上、かつ、
(3)生物種A及び生物種Bのオーソログ遺伝子と前記オリゴヌクレオチドとの融解温度差異の実測値もしくは計算値がいずれも20℃未満
であることを特徴とするオリゴヌクレオチドアレイ。
【0010】
6) 上記1)〜5)のいずれかに記載のオリゴヌクレオチドアレイであって、2種以上の生物種の遺伝子発現分布測定を同時に行うことができることを特徴とするオリゴヌクレオチドアレイ。
7) 上記1)〜5)のいずれかに記載のオリゴヌクレオチドアレイを用いた、異なる生物種におけるオーソログ遺伝子の発現分布測定方法。
8) 薬剤投与に対するオーソログ遺伝子の発現変化を比較するための、上記7)に記載のオーソログ遺伝子の発現分布測定方法。
9) 異なる生物種におけるオーソログ遺伝子の機能の変化を比較するための、上記7)に記載のオーソログ遺伝子の発現分布測定方法。
以下、本発明について具体的に説明する。
【0011】
本明細書において、共通の祖先の遺伝子から種分化によって進化した異なる種の遺伝子を「オーソログ遺伝子」という。オーソログ遺伝子は進化の過程で同じ機能を保持することが多いことが知られており、お互いに類似した遺伝子機能を有すると考えられる。本発明者等は、一般的にオーソログ遺伝子同士が、コードしている蛋白質配列、塩基配列同士の類似性が高いことから、類似配列部分をプローブ配列として用いて本発明を完成させることができることに着目し、生物種Aと生物種Bとで類似した機能を有すると考えられるオーソログ遺伝子と相補結合を形成するプローブを固定化したチップを作製した。以後、本明細書において、本発明で用いるチップを「オーソログチップ」と呼ぶ。尚、本明細書において、「オリゴヌクレオチドアレイ」、「チップ」または「DNAチップ」は、支持体上でオリゴヌクレオチドを合成するものと、増幅した遺伝子断片(オリゴヌクレオチド)を支持体上にスポットして得られるもののいずれをも含み、名称によって製法が特定されることを意図するものではない。
【0012】
まず、薬物投与によるオーソログ発現分布測定を例として、異なる生物種AとBのDNAチップによる測定について、従来のDNAチップを用いて行う場合と本発明により行う場合の相違を図1に示す。従来のDNAチップでは、図1(A)に示すように生物種Aの薬物投与サンプル(AS:A sample)と、生物種Aの薬物非投与サンプル(AC:A control)を生物種Aチップとハイブリダイズ(相補結合形成)させる。生物種Bについても同様である。仮に生物種AのサンプルASやACを生物種Bにおける検出のみを目的として作製されたチップとハイブリダイズさせても蛍光信号を得ることができるが、その蛍光信号の意味を解釈することは困難である。何故なら生物種Bに対して設計されたプローブに対して生物種Aのサンプルがハイブリダイズしたとしても、それがオーソログの関係にある遺伝子の発現解析にとって十分ではないからである。
【0013】
実際に生物種Aをヒト、生物種Bをマウスとした図1Aの実験を行った。ヒトとマウスのオーソログに関する情報は、米国NCBIのMGD mapsやHomoloGeneを検索すれば、得ることができる。しかし、このオーソログ同士の遺伝子発現を比較したところ、ヒトとマウスとで驚くほど低い相関(30%程度)しか得られなかった。この低い相関しか得られない原因の一つは、実験で用いたヒトチップとマウスチップとが配列や基板が全く異なるチップであるためである。この問題を解決するには、図1Bのように、生物種AとBに対して使用可能に設計されたオーソログチップに、生物種A薬物投与サンプル(AS)と生物種B薬物投与サンプル(BS)をそれぞれ異なる蛍光試薬で標識した後、同時にハイブリダイズさせることで、チップ間差をキャンセルすることが有効である。
【0014】
図2に、従来のチップとオーソログチップの測定誤差の比較式を示す。図2(A)は従来のチップの測定誤差(σ)を、図2(B)は本発明のオーソログチップの測定誤差(σ)を示す。生物種Aと生物種Bの違いを両者の比として得る場合、測定誤差はσAS/BSとなる。図2(A)と(B)を比較すると、(B)は同一チップを用いるため測定誤差が原理的に小さいことがわかる。尚、図2に示された測定誤差の比較は、予想される測定誤差の最小値であって、実際には、プローブ配列が全く異なるなどの理由から、より測定誤差は大きくなる。
【0015】
つまり、生物種AとBに対する薬物投与による遺伝子発現変化を測定するために2枚のオーソログチップを用いた図3の場合でも、図3(A)では生物種Aチップと生物種Bチップとで、全く異なるプローブ配列であるのに対し、図3(B)では同一のプローブ配列であるので、測定誤差をより小さくすることができる。
【0016】
図4と図5にオーソログチップ用プローブ設計方法を示す。オーソログチップ用プローブ配列を設計するには、まずGENBANKなどの塩基配列データベース、ないしはEST(Expressed Sequence Tag)配列データベース等の公共もしくは商用データベースから、生物種Aと生物種BのゲノムDNA或いはメッセンジャーRNA配列を取得する。プローブはDNAで構成することが多いので、メッセンジャーRNA配列の代わりに、メッセンジャーRNA配列と相補的な配列であるcDNA配列を取得してもよい。これら取得したゲノムもしくはcDNA配列を、図4,5に示すようにプローブ設計における出発点とする。このゲノム・cDNA配列上の部分配列が求めたいプローブ配列47に相当する。図4に示したプローブ設計工程では、まず、生物種Aと生物種Bのオーソログ上において類似した配列を検索する、類似配列検索工程43をおこなう。続いてプローブ候補を列挙するプローブ候補リスト作成工程(リストアップ工程)44により作成したプローブ候補リスト45から、プローブに適さない不適合候補を除外する工程(フィルタリング工程)46を経るという、2つの工程を経ている。フィルタリング工程46に合格したものが、DNAアレイに使用可能なプローブ配列47である。
【0017】
フィルタリング工程46は、例えば(1)プローブの融解温度(Tm)がある一定の範囲内であること、(2)1本鎖DNAであるプローブが安定な二次構造を持たないこと、(3)非特異的配列を生じやすい反復配列を持たないこと、(4)他遺伝子と相同性の高い類似配列をもたないこと、(5)他遺伝子とクロスハイブリダイゼーションを生じないこと等をチェックする複数の工程からなる。クロスハイブリダイゼーションのチェックでは、配列同士の一致度(配列マッチ度(Identity):何%の塩基が一致するか)、BLASTアルゴリズム等のホモロジーサーチアルゴリズムで算出した統計的有意水準値(p値)を用いる。BLASTにおいてはE値がこの統計的有意水準値に相当する。p値は確率論的な指標であり、大抵は、例えばあるプローブ候補と他遺伝子配列に対し、ブラストアルゴリズムで計算したp値が0.1以下の場合、比較された二者のDNA配列のホモロジーは十分に高い(危険率10%以下)として、そのプローブ候補を棄却することができる。こうしてクロスハイブリダイゼーションを十分に低減させることができる。
【0018】
しかし、遺伝子のほぼ全領域にわたって、塩基配列が類似している場合、例えば同一のスーパーファミリーに属しているような、シトクロムP450のCYP2C8、CYP2C9、CYP2C18、CYP2C19などの遺伝子では、確率論的指標だけではプローブとして用いることができるのか否かの明確な判定が難しいプローブ候補が多数存在する。なぜなら相同性検索において用いられるE値やp値は、配列マッチ度が同一でも、配列の長さにより異なる値を示すことがあるためである。例えばブラストアルゴリズムにより算出されるp値で1.0、すなわち比較対象の二者の相同性が確率的にはほぼゼロの場合でも、配列マッチ度で約40%〜約75%までの値を示すことがある。相同性検索の目的は、あるDNA配列がデータベース中に格納されている遺伝子配列と一致しないとした場合(帰無仮説)、その仮説が正しい確率を示す。配列マッチ度が75%とは、25%の配列が異なるということである。配列長さにもよるが、25%も配列が異なれば、比較している2配列は異なる遺伝子である確率が高い。そのためp値がほぼ1.0となり相同性はゼロと判定される。しかし実際には、配列マッチ度が75%の配列同士は、ハイブリダイゼーションを行う温度が約30℃のTmより低ければハイブリダイゼーションしてしまう。このようにハイブリダイゼーションが生じるか否かについてホモロジーサーチのアルゴリズムは直接的な解答を与えない。そのためプローブとターゲットの間のハイブリダイゼーションという物理化学的反応をより直接的に表す、熱力学的指標、例えば融解温度や自由エネルギーといった指標をホモロジーサーチから得られるE値やp値に加えて用いるのが望ましい。そこで、フィルタリング工程46では融解温度の差、自由エネルギーの差といった、熱力学的指標に基づいて、プローブ候補を棄却するフィルターを設けても良い。
【0019】
図5と図4の相違は、図4では生物種Aと生物種Bの類似配列を検索したのちにリストアップ工程とフィルタリング工程を行うのに対し、図5では片方の生物種(例えば生物種A)のみに対しリストアップ工程とフィルタリング工程を行った後に、生物種Bと類似した配列のみを検索してプローブ配列47とする点である。図4と図5のどちらのアルゴリズムを用いてもオーソログチップ用プローブを設計することができる。従って、オーソログチップの作製のために設計するオリゴヌクレオチドは、生物種A及び生物種Bのオーソログ遺伝子のうち、いずれかまたは双方の部分配列となり得るが、双方の部分配列と完全に一致しないが下記(1)〜(3)、(1’)〜(3’)、または(1”)〜(3”)の条件を満たすものであれば良い。
【0020】
なおリストアップ工程44とフィルタリング工程46とを同一工程にした場合、ゲノム、cDNA配列41,42の全ての部分配列に対し、融解温度、二次構造、クロスハイブリダイゼーションの可能性をチェックしなくてはならない。リストアップ工程44によりプローブ候補リスト45を作成すれば、融解温度、二次構造、クロスハイブリダイゼーションの可能性のチェックを、リスト45に対してのみ行えばよいので、計算時間の短縮が行える。
【0021】
配列マッチ度とクロスハイブリダイゼーションの関係を調べるために実験を行った。実験のため塩基長が80bp、配列が異なる合成DNA(オリゴヌクレオチドDNA,もしくはオリゴDNA)を5本用意した。これら5種類のオリゴDNAをプローブとして用いる。5本のDNAは組み合わせを変えることで互いの配列マッチ度が異なるようになっている。実験では、12時間、62℃でハイブリダイゼーションさせ、蛍光標識由来の蛍光信号強度は蛍光スキャナーにより数値化した。5種類のターゲットDNAのそれぞれに対し3回ずつ実験を行った結果を整理し、図6に示した。図6の横軸は配列マッチ度を、縦軸は標的由来信号を未標的由来信号で割った商を示す。エラーバーは標準偏差を示す。標的由来信号とは配列マッチ度が100%のターゲットDNAとプローブDNA間のハイブリダイゼーションによる信号強度を示す。そして未標的由来信号とは、標的由来信号を除く、配列マッチ度が90、80,70,60,50%のターゲットDNAとプローブDNA間のハイブリダイゼーションによる信号強度である。本明細書において、「配列マッチ度」とは、2つのヌクレオチド配列またはアミノ酸配列を比較した際の配列が一致する度合いのことをいう。具体的には、配列を構成する全塩基数(またはアミノ酸数)を100としたときに配列が一致する塩基数(またはアミノ酸数)に相当する。図6において、配列マッチ度が100%の場合、縦軸(標的由来信号/未標的由来信号)が1.0であり、標的由来信号と未標的由来信号の強度が等しいことを示す。このとき、クロスハイブリダイゼーション(本来ハイブリダイズすべきでないハイブリダイゼーション)が本来のターゲット−プローブ間ハイブリダイゼーションと同程度に生じていることになり、そのプローブは遺伝子ごとの発現を分離して測定していないので、DNAチップのプロ−ブとして用いることができない。図6によると、配列マッチ度が50、60、70%では、標準偏差を考慮するとクロスハイブリダイゼーションは有意でないが、配列マッチ度が70%で平均約1割、配列マッチ度が80%で平均約2割のクロスハイブリダイゼーションが見られた。図6の結果は、プローブの長さや、ハイブリダイゼーション温度や、洗浄の仕方によっても大きく変わるので、全てのチップに対してあてはまるわけではない。しかしクロスハイブリダイゼーションを防ぐための設計指針を与えてくれる。つまり図6の結果は、全てのDNAチップにはそのままあてはまる保証はないものの、大雑把に言って、配列マッチ度が70%を超えた場合にクロスハイブリダイゼーションが生じる危険性が高いと言える。予備検討の結果、この配列マッチ度が70%という値は、統計的有意水準値(p値)で約0.1、融解温度差で約20℃に相当する。そこで、オーソログチップとして、各プローブのオリゴヌクレオチドが、
(1)生物種Aの他遺伝子(目的のオーソログ遺伝子以外の遺伝子)と前記オリゴヌクレオチドとの配列一致度(配列マッチ度)が70%未満、
(2)生物種Bの他遺伝子と前記オリゴヌクレオチドとの配列マッチ度が70%未満、かつ
(3)生物種Aと生物種Bの目的のオーソログ遺伝子と前記オリゴヌクレオチドとの配列マッチ度がそれぞれ70%以上
の3条件を満たせば、クロスハイブリダイゼーションを実質上無視することができる。更に、目的のオーソログ遺伝子と前記オリゴヌクレオチドとの配列マッチ度が90%以上のものを選択すれば、良好な測定結果を得る上で更に好ましい。
【0022】
同様に、各プローブのオリゴヌクレオチドが、
(1’)生物種Aの他遺伝子と前記オリゴヌクレオチドとの配列相同性がBLAST等のホモロジーサーチアルゴリズムを用いて計算される統計的有意水準値(p値、もしくはBLASTで出力されるE値)が0.1以上、
(2’)生物種Bの他遺伝子と前記オリゴヌクレオチドとの配列相同性がBLAST等のホモロジーサーチアルゴリズムを用いて計算される統計的有意水準値(p値、もしくはBLASTで出力されるE値)が0.1以上、かつ
(3’)生物種Aと生物種Bの目的のオーソログ遺伝子と前記オリゴヌクレオチドとの配列相同性がBLAST等のホモロジーサーチアルゴリズムを用いて計算される統計的有意水準値(p値、もしくはBLASTで出力されるE値)がそれぞれ0.1未満、
という条件を満たす場合であってもよい。
【0023】
また、各プローブのオリゴヌクレオチドが、
(1”)生物種Aの他遺伝子と前記オリゴヌクレオチドとの融解温度差異の実測値もしくは計算値が20℃以上、
(2”)生物種Bの他遺伝子と前記オリゴヌクレオチドとの融解温度差異の実測値もしくは計算値が20℃以上、かつ
(3”)生物種Aと生物種Bの目的のオーソログ遺伝子と前記オリゴヌクレオチドとの融解温度差異の実測値もしくは計算値がそれぞれ20℃未満、
の3条件を満たす場合であってもよい。
【0024】
更に、上記(1)〜(3)、(1’)〜(3’)、または(1”)〜(3”)と同様の条件を満たす限りにおいて、3種以上の生物種由来のオーソログ遺伝子の発現を検出することも可能である。例えば、生物種A、B、及びC由来のオーソログ遺伝子の発現を同時に検出しようとする場合、各プローブのオリゴヌクレオチドが、
(1)生物種Aの他遺伝子(目的のオーソログ遺伝子以外の遺伝子)と前記オリゴヌクレオチドとの配列一致度(配列マッチ度)が70%未満、
(2)生物種Bの他遺伝子と前記オリゴヌクレオチドとの配列マッチ度が70%未満、
(3)生物種Cの他遺伝子と前記オリゴヌクレオチドとの配列マッチ度が70%未満、かつ
(4)生物種A、生物種B及び生物種Cの目的のオーソログ遺伝子と前記オリゴヌクレオチドとの配列マッチ度がいずれも70%以上
の4条件を満たせば、クロスハイブリダイゼーションを実質上無視することができるオーソログチップが作製できる。
【0025】
上記条件を満たすように選択された各プローブを、公知の方法に従って支持体上に固定する。具体的には、選択されたプローブのヌクレオチド配列に基づいて支持体上で合成することができる。あるいは、予め調製された各プローブを支持体上の異なる位置にスポットすることによって固定化することができる。プローブの長さは、20〜100塩基、好ましくは60〜80塩基である。
【0026】
選択されたプローブは、一枚の支持体上に20個以上、好ましくは50個以上、更に好ましくは100個以上固定する。ヒトにおいて機能する蛋白質の種類は約10万とも言われており、これらをコードする遺伝子の発現を網羅的に検出するために、一枚の支持体上に数百〜数千個のオーソログ遺伝子を固定しても良く、その数はオーソログ遺伝子由来のオリゴヌクレオチドを固定した本発明のオリゴヌクレオチドアレイの用途に応じて適宜選択することができる。
【0027】
本発明のオーソログチップを用いた遺伝子発現の測定は、設計されたオーソログチップの由来となる2種以上の生物種由来のサンプルからRNAを抽出し、PCRで増幅する際にそれぞれ標識を行う。標識は、蛍光色素やローダミン等の当分野で使用されるものであればいずれでも良く、特に限定するものではないが、検出の簡便さ等からCy3、Cy5等の蛍光色素を用いることが特に好ましい。Molecular Probe社(米国)等から種々の蛍光色素が市販されており、目的に応じて適宜選択することができ、例えば互いに識別可能な3種または4種の色素を用い、3種または4種のサンプル由来のRNAを同時に測定することも可能である。
【0028】
標識されたサンプルを、次いでオーソログチップとストリンジェントな条件下でハイブリダイズさせる。この場合、サンプルを別々のチップとハイブリダイズさせても良いが、測定誤差を最小にするため等の理由から、異なるサンプル由来の標的配列を同じチップに同時にかけることが好ましい。一枚のチップに2種のサンプルをかける場合には、RNA重量を揃えておくことが好ましい。
【0029】
上記のように、本発明のオリゴヌクレオチドアレイを用い、異なる生物種におけるオーソログ遺伝子の発現分布測定が可能である。本方法は、例えば薬剤投与に対するオーソログ遺伝子の発現変化を比較するために行うことができる。この場合、実験動物において得られたデータをヒトに外挿するためには、異なる生物種を2種とし、一方がヒトとすることができる。また、異なる生物種におけるオーソログ遺伝子の機能の変化を比較するために行うこともできる。
【0030】
【発明の実施の形態】
Unigeneに登録されている4274個のラット既知遺伝子、12810個のヒト既知遺伝子に対し110個のオーソログを選択し、80塩基長のオリゴヌクレオチドプローブを設計した(配列番号1〜110)。選択した110個のオーソログのUnigene番号とSymbol名のリストを表1から4に示した。またそれぞれのオーソログに対するプローブ配列を表5から8に示した。
【0031】
【表1】
【0032】
【表2】
【0033】
【表3】
【0034】
【表4】
【0035】
【表5】
【0036】
【表6】
【0037】
【表7】
【0038】
【表8】
【0039】
図7は選択した110個のプローブの融解温度を示した図である。図7の横軸はプローブ番号を、図7の縦軸はプローブの融解温度(℃)を示す。設計時のプローブ融解温度の目標値は75℃とした。フィルタリング工程の全条件を満たした上で、最も目標値に近い融解温度を持つ配列がプローブとして選択されている。110個のプローブ融解温度の平均値とその標準偏差は75.1±0.9℃であった。
【0040】
図8は110個のプローブのクロスハイブリダイゼーションの可能性について、最類似遺伝子断片との一致度(%)を示した図である。プローブ配列は、そのプローブと本来ハイブリダイズする遺伝子と100%一致する配列を有する。その一方、Unigeneに登録されている4274個のラット既知遺伝子、12810個のヒト既知遺伝子のなかで、プローブが本来ハイブリダイズする遺伝子を除いて、最も類似した80塩基の部分配列を有する遺伝子配列との一致度を図8は示している。図8によると最も類似した遺伝子配列との一致度(最類似遺伝子断片一致度)は、ヒトでもラットでも70%未満である。最類似遺伝子断片一致度(%)の平均値とその標準偏差は、ラット遺伝子間で56.0±5.0%、ヒト遺伝子間で57.8±6.7%であった。
尚、図8において、70%のライン上にあるポイントは、数値データでは全て70%未満のものである。
【0041】
図9は110個のプローブがヒトとラットのオーソログとハイブリダイズするかを示した図である。ヒトとラットのオーソログに対し、プローブ配列との一致度は全て95%以上であり、その平均値と標準偏差は96.7±1.7%であった。図6の結果から、選択した110個のプローブを用い、異なる生物種であるラットとヒトのオーソログに十分にハイブリダイズし、かつ、クロスハイブリダイゼーションは実質上無視できるオーソログチップが作製できることがわかる。
【0042】
上記のようにして得られたオーソログチップを用いた異なる生物種におけるオーソログ遺伝子発現分布測定方法は、特に限定するものではないが、具体的には例えば以下のようにして行うことができる。
【0043】
サンプルは異なる生物種それぞれの組織または細胞から通常用いられる方法に従ってmRNAを抽出し、ポリdTを鋳型としたPCRによって増幅すると同時に、Cy3、Cy5等の当分野において通常用いられる蛍光色素によって標的RNAを標識する。この場合、生物種によって標識を変えておくことによって、混合したサンプル由来のオーソログ遺伝子の発現を同時に検出することが可能である。2つのサンプル間での発現量の量比は、2種の蛍光色素由来の蛍光強度の比率から推定できる。図1(B)に示す例においては、同一の薬物を投与した生物種A(AS)及び生物種B(BS)におけるオーソログ遺伝子の発現を蛍光強度の測定によって同時に検出することができ、同じ薬物の投与によるオーソログ遺伝子発現を異なる生物種で直接比較することができる。
【0044】
別の態様として、図3(B)に示す例のように、同一の構成を有する2枚のオーソログチップを用い、一方では生物種Aの薬物未投与サンプル(AC)及び薬物投与サンプル(AS)におけるオーソログ遺伝子の発現を同時に検出し、他方では生物種Bの薬物未投与サンプル(BC)及び薬物投与サンプル(BS)におけるオーソログ遺伝子の発現を同時に検出することによって、生物種A及びBにおける薬物投与によるオーソログ遺伝子の発現の変化及び種間比較を容易に行うことができる。
【0045】
あるいはまた、互いに識別可能な4種の標識、例えば蛍光色素を用いて、生物種Aの薬物未投与サンプル(AC)及び薬物投与サンプル(AS)、並びに生物種Bの薬物未投与サンプル(BC)及び薬物投与サンプル(BS)をそれぞれ標識し、これらのサンプルにおけるオーソログ遺伝子の発現を一枚のオーソログチップ上で同時に検出し、それぞれの種における薬物投与の効果(AS/ACとBS/BC)を直接比較することも可能である。それによって、チップの配列が同一であり、チップ自体も同一であり、更に実験操作によるバイアスもかからないため、測定誤差を最小限にすることができる。
【0046】
【発明の効果】
2種以上の異なる生物種の遺伝子発現分布を同一のDNAチップで測定することで、チップ間差をキャンセルし、測定の信頼性を向上させることができる。そのため実験動物のデータをヒトに外挿する有効な方法を提供できる。また進化の度合いが異なる生物種同士のデータ比較を行うことで、進化の過程に対応する遺伝子機能の変化を研究するための方法を提供できる。
【0047】
【配列表】
【図面の簡単な説明】
【図1】従来のチップ(A)と本発明のチップ(オーソログチップ)(B)を用いた測定の比較を示す。
【図2】従来のチップ(A)とオーソログチップ(B)の測定誤差を算出する式を示す。
【図3】従来のチップ(A)と本発明のチップ(オーソログチップ)(B)を用いた測定の比較を示す。
【図4】オーソログチップ用プローブ配列決定アルゴリズムの一例を示す。
【図5】オーソログチップ用プローブ配列決定アルゴリズムの一例を示す。
【図6】配列マッチ度とクロスハイブリダイゼーションの関係の一例を示す。
【図7】本プローブ配列決定アルゴリズムで設計したプローブの融解温度を示す。
【図8】同一種内におけるプローブ配列相同性を示す。(A)ラット遺伝子、(B)ヒト遺伝子
【図9】オーソログ間におけるプローブ配列相同性を示す。
【符号の説明】
41.生物種Aのゲノム、cDNA配列、もしくはEST配列、42.生物種Bのゲノム、cDNA配列、もしくはEST配列、43.類似配列検索工程、44.リストアップ工程、45.プローブ候補リスト、46.フィルタリング工程、47.プローブ配列、51.プローブ候補1次リスト、52.プローブ候補2次リスト
【発明の属する技術分野】
本発明は、従来複数の異なるアレイを用いて測定する必要があった複数生物種の遺伝子発現分布測定を1枚のアレイで評価するためのオリゴヌクレオチドアレイ、及び該オリゴヌクレオチドアレイを用いたオーソログ遺伝子発現分布測定方法に関する。
【0002】
【従来の技術】
創薬の過程において、毒性及び薬理作用の実験に用いられるラットやマウスなどの生物と、実際に医薬を服用するヒトとの生物種差をどのように克服するかが問題となっている。すなわち、ラットやマウスから得られた薬効や毒性データをヒトへ外挿する方法論がいまだに確立されていない。このためラットやマウスに対しては毒性がないのに、ヒトに対しては副作用が認められた結果、発売開始後の薬剤が販売停止になった例も数多い。
【0003】
一方、近年、DNAマイクロアレイを用いた発現分布測定により毒性、副作用予測を行うことが提案されている。Gerhold D et al., Monitoring expression of genes involved in drug metabolism and toxicology using DNA microarrays, Physiol Genomics, vol.5, pp.161−170 (2001)、Thomas R.S. et al., Identification of toxicologically predictie gene sets using cDNA microarrays, Molecular Pharmacology, vol.60, pp.1189−1194 (2001)を参照。DNAマイクロアレイを用いることで、例えば実験動物として代表的なラットにおける毒性や薬効予測の精度は大幅に向上できる可能性が高い。しかし、たとえラットに対する毒性や薬効予測が高精度で得られたとしても、その結果を生物種の異なるヒトに外挿する方法は依然確立されていない。
【0004】
【発明が解決しようとする課題】
毒性や薬効予測に優れた性能を有するDNAチップを用いて、実験動物(例えばラットやマウス)における毒性・薬効予測のデータをヒトに外挿することを可能とするオリゴヌクレオチドアレイ及びこれを用いた方法を提供する。またラット・マウスとヒトの組み合わせ以外でも、例えば、大腸菌、線虫、分裂酵母、出芽酵母、ショウジョウバエ、ラット、マウス、メダカ、ゼブラフィッシュ、ゴリラ、チンパンジー、ヒト、シロイヌナズナなどの異なる生物種のうちいずれか2種のDNAチップデータ比較を行うことで、進化の過程に対応する遺伝子機能の変化を研究するためのオリゴヌクレオチドアレイ及びこれを用いた方法を提供する。
【0005】
【課題を解決するための手段】
生物種A(例えばラット)と生物種B(例えばヒト)由来のRNAサンプルを異なる蛍光試薬を用いて標識した後、同一のDNAチップとハイブリダイズさせて、生物種Aと生物種Bの発現分布を直接比較することで上記課題を解決する。
【0006】
すなわち、本発明は以下の1)〜9)を提供する。
1) 異なる生物種のオーソログ遺伝子由来の複数のオリゴヌクレオチドを支持体上に固定化してなるオリゴヌクレオチドアレイ。
2) 上記異なる生物種が2種であり、片方がヒトである、上記1)に記載のオリゴヌクレオチドアレイ。
【0007】
3) 塩基配列の異なる複数のオリゴヌクレオチドを支持体上の異なる位置に固定化したアレイであって、前記オリゴヌクレオチドの各々が生物種A及び生物種Bのオーソログ遺伝子のいずれかの部分配列であり、
(1)生物種Aの該オーソログ遺伝子以外の遺伝子と前記オリゴヌクレオチドとの配列マッチ度が70%未満、
(2)生物種Bの該オーソログ遺伝子と前記オリゴヌクレオチドとの配列マッチ度が70%未満、かつ
(3)生物種A及び生物種Bのオーソログ遺伝子と前記オリゴヌクレオチドとの配列マッチ度がいずれも70%以上、
であることを特徴とするオリゴヌクレオチドアレイ。
【0008】
4) 塩基配列の異なる複数のオリゴヌクレオチドを支持体上の異なる位置に固定化したアレイであって、前記オリゴヌクレオチドの各々が生物種A及び生物種Bのオーソログ遺伝子のいずれかの部分配列であり、
(1)生物種Aの該オーソログ遺伝子以外の遺伝子と前記オリゴヌクレオチドとの配列相同性がBLAST等のホモロジーサーチアルゴリズムを用いて計算される統計的有意水準値で0.1以上、
(2)生物種Bの該オーソログ遺伝子以外の遺伝子と前記オリゴヌクレオチドとの配列相同性がBLAST等のホモロジーサーチアルゴリズムを用いて計算される統計的有意水準値で0.1以上、かつ
(3)生物種A及び生物種Bのオーソログ遺伝子と前記オリゴヌクレオチドとの配列相同性がBLAST等のホモロジーサーチアルゴリズムを用いて計算される統計的有意水準値でいずれも0.1未満
であることを特徴とするオリゴヌクレオチドアレイ。
【0009】
5) 塩基配列の異なる複数のオリゴヌクレオチドを支持体上の既知の異なる位置に固定化したアレイであって、前記オリゴヌクレオチドの各々が生物種A及び生物種Bのオーソログ遺伝子のいずれかの部分配列であり、
(1)生物種Aの該オーソログ遺伝子以外の遺伝子と前記オリゴヌクレオチドとの融解温度差異の実測値もしくは計算値が20℃以上、
(2)生物種Bの該オーソログ遺伝子以外の遺伝子と前記オリゴヌクレオチドとの融解温度差異の実測値もしくは計算値が20℃以上、かつ、
(3)生物種A及び生物種Bのオーソログ遺伝子と前記オリゴヌクレオチドとの融解温度差異の実測値もしくは計算値がいずれも20℃未満
であることを特徴とするオリゴヌクレオチドアレイ。
【0010】
6) 上記1)〜5)のいずれかに記載のオリゴヌクレオチドアレイであって、2種以上の生物種の遺伝子発現分布測定を同時に行うことができることを特徴とするオリゴヌクレオチドアレイ。
7) 上記1)〜5)のいずれかに記載のオリゴヌクレオチドアレイを用いた、異なる生物種におけるオーソログ遺伝子の発現分布測定方法。
8) 薬剤投与に対するオーソログ遺伝子の発現変化を比較するための、上記7)に記載のオーソログ遺伝子の発現分布測定方法。
9) 異なる生物種におけるオーソログ遺伝子の機能の変化を比較するための、上記7)に記載のオーソログ遺伝子の発現分布測定方法。
以下、本発明について具体的に説明する。
【0011】
本明細書において、共通の祖先の遺伝子から種分化によって進化した異なる種の遺伝子を「オーソログ遺伝子」という。オーソログ遺伝子は進化の過程で同じ機能を保持することが多いことが知られており、お互いに類似した遺伝子機能を有すると考えられる。本発明者等は、一般的にオーソログ遺伝子同士が、コードしている蛋白質配列、塩基配列同士の類似性が高いことから、類似配列部分をプローブ配列として用いて本発明を完成させることができることに着目し、生物種Aと生物種Bとで類似した機能を有すると考えられるオーソログ遺伝子と相補結合を形成するプローブを固定化したチップを作製した。以後、本明細書において、本発明で用いるチップを「オーソログチップ」と呼ぶ。尚、本明細書において、「オリゴヌクレオチドアレイ」、「チップ」または「DNAチップ」は、支持体上でオリゴヌクレオチドを合成するものと、増幅した遺伝子断片(オリゴヌクレオチド)を支持体上にスポットして得られるもののいずれをも含み、名称によって製法が特定されることを意図するものではない。
【0012】
まず、薬物投与によるオーソログ発現分布測定を例として、異なる生物種AとBのDNAチップによる測定について、従来のDNAチップを用いて行う場合と本発明により行う場合の相違を図1に示す。従来のDNAチップでは、図1(A)に示すように生物種Aの薬物投与サンプル(AS:A sample)と、生物種Aの薬物非投与サンプル(AC:A control)を生物種Aチップとハイブリダイズ(相補結合形成)させる。生物種Bについても同様である。仮に生物種AのサンプルASやACを生物種Bにおける検出のみを目的として作製されたチップとハイブリダイズさせても蛍光信号を得ることができるが、その蛍光信号の意味を解釈することは困難である。何故なら生物種Bに対して設計されたプローブに対して生物種Aのサンプルがハイブリダイズしたとしても、それがオーソログの関係にある遺伝子の発現解析にとって十分ではないからである。
【0013】
実際に生物種Aをヒト、生物種Bをマウスとした図1Aの実験を行った。ヒトとマウスのオーソログに関する情報は、米国NCBIのMGD mapsやHomoloGeneを検索すれば、得ることができる。しかし、このオーソログ同士の遺伝子発現を比較したところ、ヒトとマウスとで驚くほど低い相関(30%程度)しか得られなかった。この低い相関しか得られない原因の一つは、実験で用いたヒトチップとマウスチップとが配列や基板が全く異なるチップであるためである。この問題を解決するには、図1Bのように、生物種AとBに対して使用可能に設計されたオーソログチップに、生物種A薬物投与サンプル(AS)と生物種B薬物投与サンプル(BS)をそれぞれ異なる蛍光試薬で標識した後、同時にハイブリダイズさせることで、チップ間差をキャンセルすることが有効である。
【0014】
図2に、従来のチップとオーソログチップの測定誤差の比較式を示す。図2(A)は従来のチップの測定誤差(σ)を、図2(B)は本発明のオーソログチップの測定誤差(σ)を示す。生物種Aと生物種Bの違いを両者の比として得る場合、測定誤差はσAS/BSとなる。図2(A)と(B)を比較すると、(B)は同一チップを用いるため測定誤差が原理的に小さいことがわかる。尚、図2に示された測定誤差の比較は、予想される測定誤差の最小値であって、実際には、プローブ配列が全く異なるなどの理由から、より測定誤差は大きくなる。
【0015】
つまり、生物種AとBに対する薬物投与による遺伝子発現変化を測定するために2枚のオーソログチップを用いた図3の場合でも、図3(A)では生物種Aチップと生物種Bチップとで、全く異なるプローブ配列であるのに対し、図3(B)では同一のプローブ配列であるので、測定誤差をより小さくすることができる。
【0016】
図4と図5にオーソログチップ用プローブ設計方法を示す。オーソログチップ用プローブ配列を設計するには、まずGENBANKなどの塩基配列データベース、ないしはEST(Expressed Sequence Tag)配列データベース等の公共もしくは商用データベースから、生物種Aと生物種BのゲノムDNA或いはメッセンジャーRNA配列を取得する。プローブはDNAで構成することが多いので、メッセンジャーRNA配列の代わりに、メッセンジャーRNA配列と相補的な配列であるcDNA配列を取得してもよい。これら取得したゲノムもしくはcDNA配列を、図4,5に示すようにプローブ設計における出発点とする。このゲノム・cDNA配列上の部分配列が求めたいプローブ配列47に相当する。図4に示したプローブ設計工程では、まず、生物種Aと生物種Bのオーソログ上において類似した配列を検索する、類似配列検索工程43をおこなう。続いてプローブ候補を列挙するプローブ候補リスト作成工程(リストアップ工程)44により作成したプローブ候補リスト45から、プローブに適さない不適合候補を除外する工程(フィルタリング工程)46を経るという、2つの工程を経ている。フィルタリング工程46に合格したものが、DNAアレイに使用可能なプローブ配列47である。
【0017】
フィルタリング工程46は、例えば(1)プローブの融解温度(Tm)がある一定の範囲内であること、(2)1本鎖DNAであるプローブが安定な二次構造を持たないこと、(3)非特異的配列を生じやすい反復配列を持たないこと、(4)他遺伝子と相同性の高い類似配列をもたないこと、(5)他遺伝子とクロスハイブリダイゼーションを生じないこと等をチェックする複数の工程からなる。クロスハイブリダイゼーションのチェックでは、配列同士の一致度(配列マッチ度(Identity):何%の塩基が一致するか)、BLASTアルゴリズム等のホモロジーサーチアルゴリズムで算出した統計的有意水準値(p値)を用いる。BLASTにおいてはE値がこの統計的有意水準値に相当する。p値は確率論的な指標であり、大抵は、例えばあるプローブ候補と他遺伝子配列に対し、ブラストアルゴリズムで計算したp値が0.1以下の場合、比較された二者のDNA配列のホモロジーは十分に高い(危険率10%以下)として、そのプローブ候補を棄却することができる。こうしてクロスハイブリダイゼーションを十分に低減させることができる。
【0018】
しかし、遺伝子のほぼ全領域にわたって、塩基配列が類似している場合、例えば同一のスーパーファミリーに属しているような、シトクロムP450のCYP2C8、CYP2C9、CYP2C18、CYP2C19などの遺伝子では、確率論的指標だけではプローブとして用いることができるのか否かの明確な判定が難しいプローブ候補が多数存在する。なぜなら相同性検索において用いられるE値やp値は、配列マッチ度が同一でも、配列の長さにより異なる値を示すことがあるためである。例えばブラストアルゴリズムにより算出されるp値で1.0、すなわち比較対象の二者の相同性が確率的にはほぼゼロの場合でも、配列マッチ度で約40%〜約75%までの値を示すことがある。相同性検索の目的は、あるDNA配列がデータベース中に格納されている遺伝子配列と一致しないとした場合(帰無仮説)、その仮説が正しい確率を示す。配列マッチ度が75%とは、25%の配列が異なるということである。配列長さにもよるが、25%も配列が異なれば、比較している2配列は異なる遺伝子である確率が高い。そのためp値がほぼ1.0となり相同性はゼロと判定される。しかし実際には、配列マッチ度が75%の配列同士は、ハイブリダイゼーションを行う温度が約30℃のTmより低ければハイブリダイゼーションしてしまう。このようにハイブリダイゼーションが生じるか否かについてホモロジーサーチのアルゴリズムは直接的な解答を与えない。そのためプローブとターゲットの間のハイブリダイゼーションという物理化学的反応をより直接的に表す、熱力学的指標、例えば融解温度や自由エネルギーといった指標をホモロジーサーチから得られるE値やp値に加えて用いるのが望ましい。そこで、フィルタリング工程46では融解温度の差、自由エネルギーの差といった、熱力学的指標に基づいて、プローブ候補を棄却するフィルターを設けても良い。
【0019】
図5と図4の相違は、図4では生物種Aと生物種Bの類似配列を検索したのちにリストアップ工程とフィルタリング工程を行うのに対し、図5では片方の生物種(例えば生物種A)のみに対しリストアップ工程とフィルタリング工程を行った後に、生物種Bと類似した配列のみを検索してプローブ配列47とする点である。図4と図5のどちらのアルゴリズムを用いてもオーソログチップ用プローブを設計することができる。従って、オーソログチップの作製のために設計するオリゴヌクレオチドは、生物種A及び生物種Bのオーソログ遺伝子のうち、いずれかまたは双方の部分配列となり得るが、双方の部分配列と完全に一致しないが下記(1)〜(3)、(1’)〜(3’)、または(1”)〜(3”)の条件を満たすものであれば良い。
【0020】
なおリストアップ工程44とフィルタリング工程46とを同一工程にした場合、ゲノム、cDNA配列41,42の全ての部分配列に対し、融解温度、二次構造、クロスハイブリダイゼーションの可能性をチェックしなくてはならない。リストアップ工程44によりプローブ候補リスト45を作成すれば、融解温度、二次構造、クロスハイブリダイゼーションの可能性のチェックを、リスト45に対してのみ行えばよいので、計算時間の短縮が行える。
【0021】
配列マッチ度とクロスハイブリダイゼーションの関係を調べるために実験を行った。実験のため塩基長が80bp、配列が異なる合成DNA(オリゴヌクレオチドDNA,もしくはオリゴDNA)を5本用意した。これら5種類のオリゴDNAをプローブとして用いる。5本のDNAは組み合わせを変えることで互いの配列マッチ度が異なるようになっている。実験では、12時間、62℃でハイブリダイゼーションさせ、蛍光標識由来の蛍光信号強度は蛍光スキャナーにより数値化した。5種類のターゲットDNAのそれぞれに対し3回ずつ実験を行った結果を整理し、図6に示した。図6の横軸は配列マッチ度を、縦軸は標的由来信号を未標的由来信号で割った商を示す。エラーバーは標準偏差を示す。標的由来信号とは配列マッチ度が100%のターゲットDNAとプローブDNA間のハイブリダイゼーションによる信号強度を示す。そして未標的由来信号とは、標的由来信号を除く、配列マッチ度が90、80,70,60,50%のターゲットDNAとプローブDNA間のハイブリダイゼーションによる信号強度である。本明細書において、「配列マッチ度」とは、2つのヌクレオチド配列またはアミノ酸配列を比較した際の配列が一致する度合いのことをいう。具体的には、配列を構成する全塩基数(またはアミノ酸数)を100としたときに配列が一致する塩基数(またはアミノ酸数)に相当する。図6において、配列マッチ度が100%の場合、縦軸(標的由来信号/未標的由来信号)が1.0であり、標的由来信号と未標的由来信号の強度が等しいことを示す。このとき、クロスハイブリダイゼーション(本来ハイブリダイズすべきでないハイブリダイゼーション)が本来のターゲット−プローブ間ハイブリダイゼーションと同程度に生じていることになり、そのプローブは遺伝子ごとの発現を分離して測定していないので、DNAチップのプロ−ブとして用いることができない。図6によると、配列マッチ度が50、60、70%では、標準偏差を考慮するとクロスハイブリダイゼーションは有意でないが、配列マッチ度が70%で平均約1割、配列マッチ度が80%で平均約2割のクロスハイブリダイゼーションが見られた。図6の結果は、プローブの長さや、ハイブリダイゼーション温度や、洗浄の仕方によっても大きく変わるので、全てのチップに対してあてはまるわけではない。しかしクロスハイブリダイゼーションを防ぐための設計指針を与えてくれる。つまり図6の結果は、全てのDNAチップにはそのままあてはまる保証はないものの、大雑把に言って、配列マッチ度が70%を超えた場合にクロスハイブリダイゼーションが生じる危険性が高いと言える。予備検討の結果、この配列マッチ度が70%という値は、統計的有意水準値(p値)で約0.1、融解温度差で約20℃に相当する。そこで、オーソログチップとして、各プローブのオリゴヌクレオチドが、
(1)生物種Aの他遺伝子(目的のオーソログ遺伝子以外の遺伝子)と前記オリゴヌクレオチドとの配列一致度(配列マッチ度)が70%未満、
(2)生物種Bの他遺伝子と前記オリゴヌクレオチドとの配列マッチ度が70%未満、かつ
(3)生物種Aと生物種Bの目的のオーソログ遺伝子と前記オリゴヌクレオチドとの配列マッチ度がそれぞれ70%以上
の3条件を満たせば、クロスハイブリダイゼーションを実質上無視することができる。更に、目的のオーソログ遺伝子と前記オリゴヌクレオチドとの配列マッチ度が90%以上のものを選択すれば、良好な測定結果を得る上で更に好ましい。
【0022】
同様に、各プローブのオリゴヌクレオチドが、
(1’)生物種Aの他遺伝子と前記オリゴヌクレオチドとの配列相同性がBLAST等のホモロジーサーチアルゴリズムを用いて計算される統計的有意水準値(p値、もしくはBLASTで出力されるE値)が0.1以上、
(2’)生物種Bの他遺伝子と前記オリゴヌクレオチドとの配列相同性がBLAST等のホモロジーサーチアルゴリズムを用いて計算される統計的有意水準値(p値、もしくはBLASTで出力されるE値)が0.1以上、かつ
(3’)生物種Aと生物種Bの目的のオーソログ遺伝子と前記オリゴヌクレオチドとの配列相同性がBLAST等のホモロジーサーチアルゴリズムを用いて計算される統計的有意水準値(p値、もしくはBLASTで出力されるE値)がそれぞれ0.1未満、
という条件を満たす場合であってもよい。
【0023】
また、各プローブのオリゴヌクレオチドが、
(1”)生物種Aの他遺伝子と前記オリゴヌクレオチドとの融解温度差異の実測値もしくは計算値が20℃以上、
(2”)生物種Bの他遺伝子と前記オリゴヌクレオチドとの融解温度差異の実測値もしくは計算値が20℃以上、かつ
(3”)生物種Aと生物種Bの目的のオーソログ遺伝子と前記オリゴヌクレオチドとの融解温度差異の実測値もしくは計算値がそれぞれ20℃未満、
の3条件を満たす場合であってもよい。
【0024】
更に、上記(1)〜(3)、(1’)〜(3’)、または(1”)〜(3”)と同様の条件を満たす限りにおいて、3種以上の生物種由来のオーソログ遺伝子の発現を検出することも可能である。例えば、生物種A、B、及びC由来のオーソログ遺伝子の発現を同時に検出しようとする場合、各プローブのオリゴヌクレオチドが、
(1)生物種Aの他遺伝子(目的のオーソログ遺伝子以外の遺伝子)と前記オリゴヌクレオチドとの配列一致度(配列マッチ度)が70%未満、
(2)生物種Bの他遺伝子と前記オリゴヌクレオチドとの配列マッチ度が70%未満、
(3)生物種Cの他遺伝子と前記オリゴヌクレオチドとの配列マッチ度が70%未満、かつ
(4)生物種A、生物種B及び生物種Cの目的のオーソログ遺伝子と前記オリゴヌクレオチドとの配列マッチ度がいずれも70%以上
の4条件を満たせば、クロスハイブリダイゼーションを実質上無視することができるオーソログチップが作製できる。
【0025】
上記条件を満たすように選択された各プローブを、公知の方法に従って支持体上に固定する。具体的には、選択されたプローブのヌクレオチド配列に基づいて支持体上で合成することができる。あるいは、予め調製された各プローブを支持体上の異なる位置にスポットすることによって固定化することができる。プローブの長さは、20〜100塩基、好ましくは60〜80塩基である。
【0026】
選択されたプローブは、一枚の支持体上に20個以上、好ましくは50個以上、更に好ましくは100個以上固定する。ヒトにおいて機能する蛋白質の種類は約10万とも言われており、これらをコードする遺伝子の発現を網羅的に検出するために、一枚の支持体上に数百〜数千個のオーソログ遺伝子を固定しても良く、その数はオーソログ遺伝子由来のオリゴヌクレオチドを固定した本発明のオリゴヌクレオチドアレイの用途に応じて適宜選択することができる。
【0027】
本発明のオーソログチップを用いた遺伝子発現の測定は、設計されたオーソログチップの由来となる2種以上の生物種由来のサンプルからRNAを抽出し、PCRで増幅する際にそれぞれ標識を行う。標識は、蛍光色素やローダミン等の当分野で使用されるものであればいずれでも良く、特に限定するものではないが、検出の簡便さ等からCy3、Cy5等の蛍光色素を用いることが特に好ましい。Molecular Probe社(米国)等から種々の蛍光色素が市販されており、目的に応じて適宜選択することができ、例えば互いに識別可能な3種または4種の色素を用い、3種または4種のサンプル由来のRNAを同時に測定することも可能である。
【0028】
標識されたサンプルを、次いでオーソログチップとストリンジェントな条件下でハイブリダイズさせる。この場合、サンプルを別々のチップとハイブリダイズさせても良いが、測定誤差を最小にするため等の理由から、異なるサンプル由来の標的配列を同じチップに同時にかけることが好ましい。一枚のチップに2種のサンプルをかける場合には、RNA重量を揃えておくことが好ましい。
【0029】
上記のように、本発明のオリゴヌクレオチドアレイを用い、異なる生物種におけるオーソログ遺伝子の発現分布測定が可能である。本方法は、例えば薬剤投与に対するオーソログ遺伝子の発現変化を比較するために行うことができる。この場合、実験動物において得られたデータをヒトに外挿するためには、異なる生物種を2種とし、一方がヒトとすることができる。また、異なる生物種におけるオーソログ遺伝子の機能の変化を比較するために行うこともできる。
【0030】
【発明の実施の形態】
Unigeneに登録されている4274個のラット既知遺伝子、12810個のヒト既知遺伝子に対し110個のオーソログを選択し、80塩基長のオリゴヌクレオチドプローブを設計した(配列番号1〜110)。選択した110個のオーソログのUnigene番号とSymbol名のリストを表1から4に示した。またそれぞれのオーソログに対するプローブ配列を表5から8に示した。
【0031】
【表1】
【0032】
【表2】
【0033】
【表3】
【0034】
【表4】
【0035】
【表5】
【0036】
【表6】
【0037】
【表7】
【0038】
【表8】
【0039】
図7は選択した110個のプローブの融解温度を示した図である。図7の横軸はプローブ番号を、図7の縦軸はプローブの融解温度(℃)を示す。設計時のプローブ融解温度の目標値は75℃とした。フィルタリング工程の全条件を満たした上で、最も目標値に近い融解温度を持つ配列がプローブとして選択されている。110個のプローブ融解温度の平均値とその標準偏差は75.1±0.9℃であった。
【0040】
図8は110個のプローブのクロスハイブリダイゼーションの可能性について、最類似遺伝子断片との一致度(%)を示した図である。プローブ配列は、そのプローブと本来ハイブリダイズする遺伝子と100%一致する配列を有する。その一方、Unigeneに登録されている4274個のラット既知遺伝子、12810個のヒト既知遺伝子のなかで、プローブが本来ハイブリダイズする遺伝子を除いて、最も類似した80塩基の部分配列を有する遺伝子配列との一致度を図8は示している。図8によると最も類似した遺伝子配列との一致度(最類似遺伝子断片一致度)は、ヒトでもラットでも70%未満である。最類似遺伝子断片一致度(%)の平均値とその標準偏差は、ラット遺伝子間で56.0±5.0%、ヒト遺伝子間で57.8±6.7%であった。
尚、図8において、70%のライン上にあるポイントは、数値データでは全て70%未満のものである。
【0041】
図9は110個のプローブがヒトとラットのオーソログとハイブリダイズするかを示した図である。ヒトとラットのオーソログに対し、プローブ配列との一致度は全て95%以上であり、その平均値と標準偏差は96.7±1.7%であった。図6の結果から、選択した110個のプローブを用い、異なる生物種であるラットとヒトのオーソログに十分にハイブリダイズし、かつ、クロスハイブリダイゼーションは実質上無視できるオーソログチップが作製できることがわかる。
【0042】
上記のようにして得られたオーソログチップを用いた異なる生物種におけるオーソログ遺伝子発現分布測定方法は、特に限定するものではないが、具体的には例えば以下のようにして行うことができる。
【0043】
サンプルは異なる生物種それぞれの組織または細胞から通常用いられる方法に従ってmRNAを抽出し、ポリdTを鋳型としたPCRによって増幅すると同時に、Cy3、Cy5等の当分野において通常用いられる蛍光色素によって標的RNAを標識する。この場合、生物種によって標識を変えておくことによって、混合したサンプル由来のオーソログ遺伝子の発現を同時に検出することが可能である。2つのサンプル間での発現量の量比は、2種の蛍光色素由来の蛍光強度の比率から推定できる。図1(B)に示す例においては、同一の薬物を投与した生物種A(AS)及び生物種B(BS)におけるオーソログ遺伝子の発現を蛍光強度の測定によって同時に検出することができ、同じ薬物の投与によるオーソログ遺伝子発現を異なる生物種で直接比較することができる。
【0044】
別の態様として、図3(B)に示す例のように、同一の構成を有する2枚のオーソログチップを用い、一方では生物種Aの薬物未投与サンプル(AC)及び薬物投与サンプル(AS)におけるオーソログ遺伝子の発現を同時に検出し、他方では生物種Bの薬物未投与サンプル(BC)及び薬物投与サンプル(BS)におけるオーソログ遺伝子の発現を同時に検出することによって、生物種A及びBにおける薬物投与によるオーソログ遺伝子の発現の変化及び種間比較を容易に行うことができる。
【0045】
あるいはまた、互いに識別可能な4種の標識、例えば蛍光色素を用いて、生物種Aの薬物未投与サンプル(AC)及び薬物投与サンプル(AS)、並びに生物種Bの薬物未投与サンプル(BC)及び薬物投与サンプル(BS)をそれぞれ標識し、これらのサンプルにおけるオーソログ遺伝子の発現を一枚のオーソログチップ上で同時に検出し、それぞれの種における薬物投与の効果(AS/ACとBS/BC)を直接比較することも可能である。それによって、チップの配列が同一であり、チップ自体も同一であり、更に実験操作によるバイアスもかからないため、測定誤差を最小限にすることができる。
【0046】
【発明の効果】
2種以上の異なる生物種の遺伝子発現分布を同一のDNAチップで測定することで、チップ間差をキャンセルし、測定の信頼性を向上させることができる。そのため実験動物のデータをヒトに外挿する有効な方法を提供できる。また進化の度合いが異なる生物種同士のデータ比較を行うことで、進化の過程に対応する遺伝子機能の変化を研究するための方法を提供できる。
【0047】
【配列表】
【図面の簡単な説明】
【図1】従来のチップ(A)と本発明のチップ(オーソログチップ)(B)を用いた測定の比較を示す。
【図2】従来のチップ(A)とオーソログチップ(B)の測定誤差を算出する式を示す。
【図3】従来のチップ(A)と本発明のチップ(オーソログチップ)(B)を用いた測定の比較を示す。
【図4】オーソログチップ用プローブ配列決定アルゴリズムの一例を示す。
【図5】オーソログチップ用プローブ配列決定アルゴリズムの一例を示す。
【図6】配列マッチ度とクロスハイブリダイゼーションの関係の一例を示す。
【図7】本プローブ配列決定アルゴリズムで設計したプローブの融解温度を示す。
【図8】同一種内におけるプローブ配列相同性を示す。(A)ラット遺伝子、(B)ヒト遺伝子
【図9】オーソログ間におけるプローブ配列相同性を示す。
【符号の説明】
41.生物種Aのゲノム、cDNA配列、もしくはEST配列、42.生物種Bのゲノム、cDNA配列、もしくはEST配列、43.類似配列検索工程、44.リストアップ工程、45.プローブ候補リスト、46.フィルタリング工程、47.プローブ配列、51.プローブ候補1次リスト、52.プローブ候補2次リスト
Claims (9)
- 異なる生物種のオーソログ遺伝子由来の複数のオリゴヌクレオチドを支持体上に固定化してなるオリゴヌクレオチドアレイ。
- 上記異なる生物種が2種であり、片方がヒトである、請求項1に記載のオリゴヌクレオチドアレイ。
- 塩基配列の異なる複数のオリゴヌクレオチドを支持体上の異なる位置に固定化したアレイであって、前記オリゴヌクレオチドの各々が生物種A及び生物種Bのオーソログ遺伝子のいずれかの部分配列であり、
(1)生物種Aの該オーソログ遺伝子以外の遺伝子と前記オリゴヌクレオチドとの配列マッチ度が70%未満、
(2)生物種Bの該オーソログ遺伝子と前記オリゴヌクレオチドとの配列マッチ度が70%未満、かつ
(3)生物種A及び生物種Bのオーソログ遺伝子と前記オリゴヌクレオチドとの配列マッチ度がいずれも70%以上、
であることを特徴とするオリゴヌクレオチドアレイ。 - 塩基配列の異なる複数のオリゴヌクレオチドを支持体上の異なる位置に固定化したアレイであって、前記オリゴヌクレオチドの各々が生物種A及び生物種Bのオーソログ遺伝子のいずれかの部分配列であり、
(1)生物種Aの該オーソログ遺伝子以外の遺伝子と前記オリゴヌクレオチドとの配列相同性がBLAST等のホモロジーサーチアルゴリズムを用いて計算される統計的有意水準値で0.1以上、
(2)生物種Bの該オーソログ遺伝子以外の遺伝子と前記オリゴヌクレオチドとの配列相同性がBLAST等のホモロジーサーチアルゴリズムを用いて計算される統計的有意水準値で0.1以上、かつ
(3)生物種A及び生物種Bのオーソログ遺伝子と前記オリゴヌクレオチドとの配列相同性がBLAST等のホモロジーサーチアルゴリズムを用いて計算される統計的有意水準値でいずれも0.1未満、
であることを特徴とするオリゴヌクレオチドアレイ。 - 塩基配列の異なる複数のオリゴヌクレオチドを支持体上の既知の異なる位置に固定化したアレイであって、前記オリゴヌクレオチドの各々が生物種A及び生物種Bのオーソログ遺伝子のいずれかの部分配列であり、
(1)生物種Aの該オーソログ遺伝子以外の遺伝子と前記オリゴヌクレオチドとの融解温度差異の実測値もしくは計算値が20℃以上、
(2)生物種Bの該オーソログ遺伝子以外の遺伝子と前記オリゴヌクレオチドとの融解温度差異の実測値もしくは計算値が20℃以上、かつ、
(3)生物種A及び生物種Bのオーソログ遺伝子と前記オリゴヌクレオチドとの融解温度差異の実測値もしくは計算値がいずれも20℃未満、
であることを特徴とするオリゴヌクレオチドアレイ。 - 請求項1〜5のいずれか1項に記載のオリゴヌクレオチドアレイであって、2種以上の生物種の遺伝子発現分布測定を同時に行うことができることを特徴とするオリゴヌクレオチドアレイ。
- 請求項1〜5のいずれか1項に記載のオリゴヌクレオチドアレイを用いた、異なる生物種におけるオーソログ遺伝子の発現分布測定方法。
- 薬剤投与に対するオーソログ遺伝子の発現変化を比較するための、請求項7に記載のオーソログ遺伝子の発現分布測定方法。
- 異なる生物種におけるオーソログ遺伝子の機能の変化を比較するための、請求項7に記載のオーソログ遺伝子の発現分布測定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002174208A JP2004016070A (ja) | 2002-06-14 | 2002-06-14 | オーソログ遺伝子発現分布測定用オリゴヌクレオチドアレイ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002174208A JP2004016070A (ja) | 2002-06-14 | 2002-06-14 | オーソログ遺伝子発現分布測定用オリゴヌクレオチドアレイ |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004016070A true JP2004016070A (ja) | 2004-01-22 |
Family
ID=31173238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002174208A Pending JP2004016070A (ja) | 2002-06-14 | 2002-06-14 | オーソログ遺伝子発現分布測定用オリゴヌクレオチドアレイ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004016070A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100772897B1 (ko) | 2006-05-02 | 2007-11-05 | 삼성전자주식회사 | 향상된 잡음률을 나타내는 올리고머 프로브 어레이 및 그제조 방법 |
JP2010531333A (ja) * | 2007-06-26 | 2010-09-24 | セヴァ サンテ アニマル | ヒトを除く哺乳類動物の心不全の治療用組成物および治療方法 |
-
2002
- 2002-06-14 JP JP2002174208A patent/JP2004016070A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100772897B1 (ko) | 2006-05-02 | 2007-11-05 | 삼성전자주식회사 | 향상된 잡음률을 나타내는 올리고머 프로브 어레이 및 그제조 방법 |
US8546130B2 (en) | 2006-05-02 | 2013-10-01 | Samsung Electronics Co., Ltd. | Oligomer probe array with improved signal-to-noise ratio fabrication method thereof |
JP2010531333A (ja) * | 2007-06-26 | 2010-09-24 | セヴァ サンテ アニマル | ヒトを除く哺乳類動物の心不全の治療用組成物および治療方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7013221B1 (en) | Iterative probe design and detailed expression profiling with flexible in-situ synthesis arrays | |
CA2786565C (en) | Partition defined detection methods | |
CN103582887B (zh) | 提供核苷酸序列数据的方法和测序装置 | |
WO2001088188A2 (en) | Method for examining ischemic conditions | |
CA2795554C (en) | Gene-expression profiling with reduced numbers of transcript measurements | |
CN114606309A (zh) | 使用机器学习和高维转录数据的诊断系统和方法 | |
US20070264635A1 (en) | Probe, probe set and information acquisition method using the same | |
US10619195B2 (en) | Gene-expression profiling with reduced numbers of transcript measurements | |
JP2004504059A (ja) | 転写された遺伝子を分析、及び同定するための方法、及びフインガープリント法 | |
Negi et al. | Applications and challenges of microarray and RNA-sequencing | |
US6892141B1 (en) | Primer design system | |
EP1889924B1 (en) | Method of designing probes for detecting target sequence and method of detecting target sequence using the probes | |
Akiyama et al. | A set of external reference controls/probes that enable quality assurance between different microarray platforms | |
US7371516B1 (en) | Methods for determining the specificity and sensitivity of oligonucleo tides for hybridization | |
JP2004016070A (ja) | オーソログ遺伝子発現分布測定用オリゴヌクレオチドアレイ | |
US7085652B2 (en) | Methods for searching polynucleotide probe targets in databases | |
JP2003052385A (ja) | Dnaアレイ向けプローブ配列決定システム | |
US20050282174A1 (en) | Methods and systems for selecting nucleic acid probes for microarrays | |
JP2011239708A (ja) | 核酸標準物質検出用プローブの設計方法、核酸標準物質検出用プローブ及び当該核酸標準物質検出用プローブを有する核酸検出系 | |
US20030194718A1 (en) | Probing sequence determination system for DNA arrays | |
WO2005030959A1 (ja) | 神経芽細胞腫予後診断のためのマイクロアレイと神経芽細胞腫予後診断方法 | |
Lockhart et al. | DNA arrays and gene expression analysis in the brain | |
WO2019016292A1 (en) | SYSTEM AND METHOD FOR SCREENING AND PRENATAL DIAGNOSIS | |
US20100092958A1 (en) | Methods for Determining Collateral Artery Development in Coronary Artery Disease | |
US20040126800A1 (en) | Regulatory single nucleotide polymorphisms and methods therefor |