JP2003052385A - Dnaアレイ向けプローブ配列決定システム - Google Patents

Dnaアレイ向けプローブ配列決定システム

Info

Publication number
JP2003052385A
JP2003052385A JP2002111490A JP2002111490A JP2003052385A JP 2003052385 A JP2003052385 A JP 2003052385A JP 2002111490 A JP2002111490 A JP 2002111490A JP 2002111490 A JP2002111490 A JP 2002111490A JP 2003052385 A JP2003052385 A JP 2003052385A
Authority
JP
Japan
Prior art keywords
sequence
probe
dna
similar
hybridization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2002111490A
Other languages
English (en)
Inventor
Hiroyuki Tomita
裕之 富田
Toshiro Saito
俊郎 斎藤
Masatoshi Narahara
正俊 奈良原
Koichi Kato
宏一 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2002111490A priority Critical patent/JP2003052385A/ja
Priority to US10/229,058 priority patent/US20030194718A1/en
Publication of JP2003052385A publication Critical patent/JP2003052385A/ja
Abandoned legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】DNAアレイ用プローブ配列として、測定感
度、再現性を保証するためには、クロスハイブリダイゼ
ーションがなく、均等化したTmを有し、二次構造をと
ることが少ないプローブ配列を実現する必要がある。 【解決手段】ゲノムもしくはcDNA配列の部分配列か
らなるDNAプローブアレイ向けプローブ候補リストを
作成する工程(リストアップ工程)と、前記プローブ候
補リストのうち、融解温度が予め定められた範囲を逸脱
する、もしくは二次構造の安定性が高い、もしくはクロ
スハイブリダイゼーションの可能性がある候補を除外す
る工程(フィルタリング工程)の、少なくとも2つの工
程を経ることでDNAアレイ向けプローブ配列を決定す
る。 【効果】DNAプローブアレイ上に固定化するプローブ
DNAの配列設計方法を提供する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、生理サンプルにお
ける遺伝子発現分布を測定するためのDNAプローブア
レイもしくはDNAチップと呼ばれている装置のDNA
プローブの配列設計方法に関する。
【0002】
【従来の技術】生体内でDNA分子上の遺伝子に記述さ
れた遺伝情報は、RNAに転写され、リボゾーム内でた
んぱく質に翻訳される。このRNAへの転写、たんぱく
質への翻訳までの過程を遺伝子発現と呼ぶ。細胞分裂、
ホメオスタシス、外部刺激に対する反応、老化、アポト
ーシスなどの種々の活動ごとに、異なる遺伝子発現分布
を示すことが知られている。前述の遺伝子発現分布は、
例えば疾患の有無、悪性度によっても異なると言われて
いる。遺伝病などの一部の疾患を除けば、生活習慣病や
アレルギー、ストレスといった多因子性疾患には、複数
の遺伝子の異常が関与している。そこで複数の遺伝子の
異常を同時に見ることが疾患の診断には必要である。遺
伝子の異常は、例えば遺伝子発現量の増加ないしは減少
といった、遺伝子発現量の変化に現れることが多いと考
えられる。つまり複数の遺伝子発現量分布を同時に見る
技術が、疾患の診断等に有用かつ不可欠であるといえ
る。数百から数万の遺伝子の発現量変化を同時に見るこ
とができるDNAアレイ法(Duggan, D.J.
ら、Expression profiling us
ing cDNA microarrays, Nat
ure geneticssupplement, v
ol.21, p10−14, 1999)と呼ばれる
技術は複数の遺伝子発現分布を見ることができるので、
例えば多因子性疾患の診断に優れている。また簡便な測
定が可能、高スループット、低コストを同時に達成でき
る実用性も高い。一般に、DNAアレイはガラススライ
ドの上に、メッセンジャーRNAと相補的な配列を有す
る相補DNA(complementary DNAも
しくはcDNA)をプローブとして固定化したものであ
る(Lockhart, D.J.ら、Express
ion monitoring by hybridi
zation to high−density ol
igonucleotidearrays, Natu
re biotechnology, vol.14,
p.1675−1680, 1996)。実験者は、
細胞や臓器等からメッセンジャーRNAを取り出した
後、逆転写酵素と蛍光標識物質を用いて、メッセンジャ
ーRNAから蛍光標識されたcDNAを合成する。その
後、蛍光標識付cDNAを、DNAアレイ上にふりかけ
る。続いて、DNAアレイを一定時間一定温度に保持し
て、蛍光標識付cDNAとDNAアレイとを塩基配列相
補結合(ハイブリダイズ)させる。その後、DNAアレ
イを洗浄し、非特異的に結合している蛍光標識付cDN
Aを洗い流す(非特異的に結合しているcDNAは、特
異的に結合しているcDNAと比較して相補結合力が弱
い。)最後に、DNAアレイ上に固定化された個々のプ
ローブに対応する蛍光信号強度を測定する。メッセンジ
ャーRNA量は対応するプローブとハイブリダイズした
蛍光信号強度に比例する。こうして臓器や細胞内の種々
の遺伝子に対応するメッセンジャーRNA量を測定する
ことができる。例えば、薬剤投与後の経過時間ごとに細
胞あるいは臓器からメッセンジャーRNAを取り出し
て、DNAアレイ法で測定することで、遺伝子ごとのメ
ッセンジャーRNA量の時間変化を見ることができる。
メッセンジャーRNA量が増加することは、DNA分子
からの遺伝情報が活発に転写されることを意味し、遺伝
子の働きが増加することに対応する。この遺伝子の働き
の時間変化を解析することで、疾患に関連した遺伝子異
常の情報が得られる。
【0003】
【発明が解決しようとする課題】DNAアレイは、複数
の遺伝子発現分布を同時に簡便に測定する方法として優
れているが、測定再現性や測定下限が他の医療機器、例
えば生化学分析装置、免疫分析装置と比較して満足でき
るレベルに達していない。例えば生化学分析装置や免疫
分析装置の測定再現性は1±0.05倍(CV値で5
%)のレベルであるのに対し、DNAアレイの測定再現
性は約2倍(もしくは1/2倍、CV値で100%)で
ある。測定再現性が低い理由の一つに、クロスハイブリ
ダイゼーションが考えられる。クロスハイブリダイゼー
ション(クロスハイブリと短縮する場合もある)とは、
本来1対1に対応すべきサンプルのメッセンジャーRN
AやcDNAと、基板に固定化されたDNAプローブと
が、多対1対応(もしくは1対多対応)になる現象であ
る。異なる遺伝子由来のメッセンジャーRNAでも、互
いに類似した配列があるので(例えば同一スーパーファ
ミリーに属する遺伝子同士は類似配列部位を多く有す
る)、この類似配列を包含するプローブは、例えば同一
スーパーファミリーに属する多くの遺伝子由来のメッセ
ンジャーRNAとハイブリダイズしてしまう。このた
め、仮に測定対象となる遺伝子の発現強度が同一であっ
ても、類似配列を有する遺伝子の発現強度が異なれば、
測定対象の遺伝子の発現強度は変化したと誤って観測さ
れ、ひいては測定再現性の低下を引き起こす。また、p
UC18,19やM13mp18などのクローニングベ
クターにインサートされたcDNAから、ポリメラーゼ
連鎖反応(PCR:Polymerase Chain
Reaction)法により、プローブDNAを増幅
する際、しばしばクローニングベクターの配列の一部を
プライマー(以後、共通プライマーと呼ぶ)として用い
る場合がある。クローニングベクターにインサートされ
たcDNA(平均して約千〜二千塩基)を共通プライマ
ーにより増幅すると、類似配列を含んだインサートcD
NAの全長が得られる。そのインサートcDNAを基板
上に固定化すると、例えば、類似配列部位を多く有する
同一スーパーファミリーに属する複数の遺伝子がハイブ
リダイズすることでクロスハイブリダイゼーションが生
じることがある。そのためプローブDNAはクロスハイ
ブリダイゼーションがないように配列設計する必要があ
る。そして、DNAアレイ上に固定化された各DNA断
片と試料由来DNA断片間での、ハイブリダーゼーショ
ンを高精度(ないしは高ストリンジェント、highl
y stringent)に行うためには、ハイブリダ
イゼーション温度(Th, hybridizatio
n temperature)と固定化DNA断片の融
解温度(Tm, melting temperatu
re)の関係が重要である。なぜなら、DNA同士の配
列相同性とTmには次の関係が知られているからであ
る。それは、2つのDNA間での1%の塩基配列違い
(ミスマッチ)により、両DNAのTmは約1.4℃低
下するという関係である。すなわち、固定化DNA断片
のTmイコールThの時、固定化DNA断片の塩基配列
と100%マッチ(配列マッチ度が100%9する試料
由来DNA断片がハイブリダイゼーションする。なお配
列マッチ度とは、比較している2つのDNA塩基配列が
何パーセント両者で等しいかを表す値で、二者の全塩基
が全て等しい場合の配列マッチ度を100%と定義す
る。ThとTmが10℃異なるとき、 100%−(10℃/1.4℃)=92.9% より、固定化DNA断片の塩基配列と約93%〜100
%の配列マッチ度を有する試料由来DNA断片がハイブ
リダイゼーションする。同様にThとTmが20℃異な
るときは配列マッチ度で85.7%〜100%、Thと
Tmが30℃異なるときは、配列マッチ度で78.6%
〜100%のDNA同士がハイブリダイゼーションする
と予想される。高精度で分離を行う際は、配列マッチ度
で例えば、少なくとも80%〜100%のみがハイブリ
ダイズすることが望ましい。ThとTmの差異が30℃
以下になるとは、プローブのTmがある目標値(しばし
ばプローブ全体の平均値)プラスマイナス15℃以下と
なると言い換えてもよい。このように固定化DNA断片
の融解温度とハイブリダイゼーション温度との差異を考
慮することがハイブリダイゼ−ションを高精度で行うた
めに必要である。以後、DNAプローブアレイ上に固定
化するDNA断片をプローブDNAと呼ぶ。そして、細
胞や臓器等からメッセンジャーRNAを取り出した後、
逆転写酵素を用いてメッセンジャーRNAから合成した
cDNA、もしくは細胞から取り出したメッセンジャー
RNAをターゲットもしくは、ターゲットDNAやター
ゲットRNAとよぶ。ターゲットは例えば蛍光標識等で
標識することが多いが、ターゲットは必ずしも標識して
ある必要はない。以後、本願明細書ではターゲットとし
てDNAを用いることを仮定して記述するが、ターゲッ
トがRNAの場合でも本願明細書で開示する方法でプロ
ーブDNA配列を設計することができる。プローブDN
Aは、1本鎖DNAの状態でターゲットとハイブリダイ
ゼーションを行う。一方、1本鎖DNAは溶液において
自らの水素結合による高次構造を形成している。この高
次構造のことを二次構造とよぶ。プローブ−ターゲット
間のハイブリダイゼーションは、二次構造の形成と競合
する過程である。すなわち、ターゲット濃度が同一の場
合は、二次構造の安定性が小さいほど、プローブ−ター
ゲット間のハイブリダイゼーション頻度が高くなるた
め、ハイブリダイゼーションの信号強度は大きくなる。
このためプローブDNAの二次構造安定性が小さいこと
が望ましい。以上の記述より、DNAプローブアレイに
用いるプローブDNAは相互に特異性が高く、Tmがそ
ろっていて、二次構造をとることが少ない必要がある。
本願明細書の以下の記述では、DNAアレイ上に固定化
したプローブが相互に特異性が高く、均等化したTmを
有し、二次構造をとることが少ないプローブ配列を実現
するための手段を記す。
【0004】
【課題を解決するための手段】DNAアレイ用プローブ
配列を設計するには、まずGENBANKなどの塩基配
列データベース、ないしはEST(Expressed
Sequence Tag)配列データベース等の公
共もしくは商用データベースから、ゲノムDNA或いは
メッセンジャーRNA配列を取得する。プローブはDN
Aで構成することが多いので、メッセンジャーRNA配
列の代わりに、メッセンジャーRNA配列と相補的な配
列であるcDNA配列を取得してもよい。これら取得し
たゲノムもしくはcDNA配列を、図1に示すようにプ
ローブ設計における出発点とする。このゲノム・cDN
A配列上の部分配列が求めたいプローブ配列15に相当
する。発明が解決しようとする課題にて記載したよう
に、プローブ配列15はゲノム・cDNA配列11の部
分配列でありかつ、他遺伝子配列と相同性が低く、Tm
が設定範囲内であり、二次構造をとることが少ないこと
を特徴とする。これらの条件を満足するように、ゲノム
・cDNA配列11からプローブ配列15を決定するこ
とを、以後、プローブ設計と呼ぶ。端的には、ゲノム・
cDNA配列11の部分配列は全てプローブとなりう
る。以後、プローブとなりうるゲノム・cDNA配列1
1の部分配列をプローブ候補と呼ぶ。しかしプローブ候
補が全てプローブとして適しているわけではない。なぜ
なら他遺伝子配列と相同性が高かったり、Tmが設定範
囲外であったり、二次構造をとりやすい場合があるから
である。そこで、プローブ設計工程フローは、まず、プ
ローブ候補を列挙するプローブ候補リスト作成工程(リ
ストアップ工程)12により作成したプローブ候補リス
ト13から、プローブに適さない不適合候補を除外する
工程(フィルタリング工程)14を経るという、2つの
工程を経ることが望ましい。リストアップ工程12とフ
ィルタリング工程14とを同一工程にした場合、ゲノ
ム、cDNA配列11の全ての部分配列に対し、融解温
度、二次構造、クロスハイブリ可能性をチェックしなく
てはならない。リストアップ工程12によりプローブ候
補リスト13を作成すれば、融解温度、二次構造、クロ
スハイブリ可能性のチェックを、リスト13に対しての
み行えばよいので、計算時間の短縮が行える。フィルタ
リング工程14に合格したものが、DNAアレイに使用
可能なプローブ配列15である。図1が最も単純なプロ
ーブ設計フローであるが、フィルタリング工程14に時
間がかかりすぎる場合は、図2に示すように、リストア
ップ工程12を経て作成したプローブ候補1次リスト2
1、更にフィルタリング工程14を経て作成したプロー
ブ候補2次リスト22に対し、再検査を行う工程(再検
査工程23)を行うことで、プローブ配列15を作成し
てもよい。図2の順でプローブ設計を行うことの利点
は、一般に時間のかかるフィルタリング工程14からプ
ローブ配列15の決定までの工程を、フィルタリング工
程14と再検査工程23の二者に分割し、例えばフィル
タリング工程14を計算機A、再検査工程23を計算機
Bに処理を分けることで、プローブ設計時間を短縮する
ことが可能な点である。なお図2のプローブ候補1次リ
スト21は、図1のプローブ候補リスト13と同一リス
トであるが、図2ではリストが2段階あることを強調す
るために名称を変更した。図3に示すようにリストアッ
プ工程12は更に、類似配列部位除外工程31と、プロ
ーブ長切り取り工程32から成る。類似配列部位除外工
程31とは、予めプローブ候補リスト13を作成する前
に、他遺伝子と類似配列を有する部位、例えばモチーフ
部位や、反復配列部位など含むプローブ候補をプローブ
候補リスト13から除外するための工程である。他遺伝
子と類似配列を有する部位を隠して(マスク)して、プ
ローブとして用いないためにマスキング工程31とも呼
ばれる。このマスキング工程31はプローブ設計におい
て必ずしも必要でないが、他遺伝子と類似配列を有する
配列をプローブ候補リスト13から除外することで、フ
ィルタリング工程14をより高速に行うことができるの
で、可能であれば、マスキング工程31を行うべきであ
る。なおモチーフとは構造やパターンの要素のことであ
るが、ここでは各種のタンパク質のアミノ酸配列中に認
められる一定の構造を指す。モチーフは互いに機能が異
なる幅広いタンパク質に共通して見られる構造である。
なおタンパク質にはドメインと呼ばれる構造があるが、
タンパク質のドメインはモチーフの種々の組み合わせで
できている。本願明細書のモチーフとは、タンパク質の
ドメインよりは小さい構造単位である。モチーフには、
例えばヘリックス−ターン−ヘリックスやジンクフィン
ガーと呼ばれるDNA結合構造モチーフなどがある。マ
スキング工程31に続く32とは、長さL1塩基対のゲ
ノム・cDNA配列から、長さL2塩基対の部分配列で
あるプローブ候補を得る(切り取る)工程である。例え
ばL1=1000塩基対、L2=100塩基対とした場
合、切り取られるプローブ候補数は、L1−L2+1=
1000−100+1=901個ある。なお、ここでは
単純のためにマスキング工程31は行わないとした。こ
れら901個の部分配列すなわちプローブ候補をリスト
化するのがプローブ長切り取り工程32である。図4に
示すようにフィルタリング工程14も、複数の工程に分
けられる。フィルタリング工程14の複数の工程はそれ
ぞれ、プローブ配列15が備えるべき条件に対応してい
る。プローブ配列15が備えるべき条件とは、例えば
(1)プローブの融解温度(Tm)がある一定の範囲内
であること、(2)1本鎖DNAであるプローブが安定
な二次構造を持たないこと、(3)非特異的配列を生じ
やすい反復配列を持たないこと、(4)他遺伝子と相同
性の高い類似配列をもたないこと、(5)他遺伝子とク
ロスハイブリダイゼーションを生じないこと等である。
そこでフィルタリング工程14は例えば、前述(1)か
ら(5)のそれぞれに対応した、融解温度フィルタ4
1、二次構造フィルタ42、反復配列フィルタ43、類
似配列フィルタ44、クロスハイブリフィルタ45の5
工程から成る。融解温度フィルタ41とは、プローブ候
補リスト13のそれぞれのプローブ候補に対し、配列よ
り見積もった融解温度が予め定められたある一定の範囲
内にあるかを判定し、一定の範囲内であれば次へ、一定
の範囲外であればそれをプローブ候補リスト13より棄
却するフィルタである。また二次構造フィルタ42と
は、溶液内でとる二次構造の安定性(自由エネルギーΔ
G(二次構造))を見積もり、本来望まれるプローブと
ターゲット間のハイブリダイゼーションの安定性(自由
エネルギーΔG(プローブ―ターゲット間ハイブリ))
とを比較した結果、二次構造の安定性が十分に低ければ
次へ、二次構造の安定性があるしきい値を超えて安定な
場合にそれをプローブ候補リスト13より棄却するフィ
ルタである。二次構造の安定性が十分低いとは、例え
ば、以下の式1を満足することである。 ΔG(二次構造)<α×ΔG(プローブ―ターゲット間ハイブリ) (式1) 但しαは、例えば0.01〜0.5 二次構造予測には例えばNussinovのアルゴリズ
ムやZukerのアルゴリズム(R.Durbin他
編、Biological Sequence Ana
lysis、Cambride University
Press,第10章、1998)を用いればよい。
二次構造予測の基本原理は、構造エネルギー最小化であ
る。これは式2に示すボルツマン関数の一種であるモレ
キュラーパーティション関数(Molecular Partition Fu
nction)qの大小により評価できる。q=Σgi*exp(−ε
i/kT) (式2)但し、 εi=i番目のエネルギーレベル gi=εiのエネルギー k=ボルツマン定数 T=絶対温度 しかし式2を直接用いて二次構造エネルギー最小化を行
うには多大の計算時間を要する。そこで、式3〜5に示
すZukerの方式に従って計算時間を短縮する。全て
の二次構造SはDNA、RNAをユニークにループ化さ
せた構造をとっている。このことを定式化すると式3に
なる。 R= ∪ L(i・j) (式3) i,j∈S 但し、 R=ベースペアセット i, j=二つのベースペア S=二次構造 DNA,RNAは相補結合により二本鎖を形成して安定
する(自由エネルギーは減少する)が、二次構造により
形成される一本鎖部分は反対に不安定化する。この不安
定化は、自由エネルギー増大と言い換えることができ
る。この自由エネルギー増加量δδGは、一本鎖部分の
塩基長lsが30ベースペア以下の場合は式4により、
長lsが30ベースペア以上の場合は式5により定式化
できる。 δδG=1.75*RT*ln(ls) (式4) 但し、 δδG=ループ構造による自由エネルギー増加量 R=ガス定数 T=絶対温度 ls=1本鎖部分の塩基数長 δδG=δδG30+1.75*RT*ln(ls/30) (式5) 二次構造の自由エネルギーΔG(二次構造)は、二本鎖
部分の安定化エネルギーΔG(二本鎖部分)と、一本鎖
部分の不安定化エネルギーδδGの和として計算でき
る。 ΔG(二次構造)=ΔG(二本鎖部分)+δδG (式6) なお二次構造フィルタ42は基板上に固定化されるプロ
ーブDNAが一本鎖(Single Strand D
NA)である場合には行うことが望ましいが、固定化さ
れるプローブDNAが二本鎖(Double Stra
nd DNA)である場合には、二次構造フィルタ42
を省略することもできる。なぜならプローブDNAは溶
液中で二本鎖を形成したり、その一部がほどけて一本鎖
となったりする平衡状態にあると考えられるため、二次
構造の安定性を単純に見積もることが難しいためであ
る。また二次構造フィルタ42として、ミニヘアピン配
列を検索して、ミニヘアピン配列を有するプローブ候補
をリスト13から棄却することも望ましい。ミニヘアピ
ンとは例えば、 GCGAAGC (配列1) GCGAAAGC (配列2) のように短いながらも高い安定性(融解温度が70度を
超える)を有する短配列のことである。ミニヘアピンの
部分が立体障害となるのでプローブとターゲット間のハ
イブリダイゼーションを阻害することが予想される。こ
れらのミニヘアピンはNussinovのアルゴリズム
やZukerのアルゴリズムのみで評価すると時として
見落とす場合があるので注意が必要である。次の反復配
列フィルタ43とは、2塩基リピート、例えばATやG
Cなどの2塩基が繰り返される配列や、3塩基リピー
ト、例えばCXGリピート(但しXはA,T,G,Cの
いずれか)、ヒトAlu反復配列などの反復配列を有す
るプローブ候補をプローブ候補リスト13から棄却する
フィルタである。反復配列を含む部位は、同様の反復配
列部位を含む他遺伝子由来のターゲットとハイブリダイ
ゼーションする可能性があるため、クロスハイブリダイ
ゼーションを生じる確率が高くなる。また2塩基リピー
トや3塩基リピートは、2塩基ないしは3塩基ずれても
同じ配列となるので、プローブの選択性が低くなる原因
にもなる。続く類似配列フィルタ44は、プローブ候補
が、他遺伝子と類似配列を有していないかを、他遺伝子
配列と比較して検索する工程であり、もしプローブ候補
が他遺伝子配列と類似配列を有していれば、それをプロ
ーブ候補リスト13から棄却するフィルタである。他遺
伝子と配列比較をする工程は、相同性検索(ホモロジー
サーチ)とも呼ばれ、ブラスト(blast)アルゴリズ
ム、ファスタ(FASTA)アルゴリズムなどの探索的
(heuristic)アルゴリズムを用いてもよいし、
スミスウォータマン(Smith−Waterman)法
などのローカルアライメント(local align
ment)アルゴリズムや、隠れマルコフモデル(Hid
den Markov model)を用いたアルゴリ
ズムなどを用いても良い。遺伝子配列データベースのサ
イズが大きいため、一般に、類似配列フィルタ44がプ
ローブ設計において最も時間のかかる工程である。そこ
で計算速度を向上させるために文字列をいったん数字に
変換しビットシフト計算等を行ってもよい。フィルタリ
ング工程14の最後の工程は、クロスハイブリフィルタ
工程45である。このクロスハイブリフィルタ45と類
似配列フィルタ44との相違を説明する。類似配列フィ
ルタ44により比較した配列がどの程度類似しているか
は、期待値E,もしくは統計的有意水準(p値)で表現
される。例えばKarlinとAltschulの定式
化に従えば、式7でp値が計算できる。(Karli
n、SとAltschul、S.F,Methods
for assessing the statist
ical significance of mole
cular sequence features b
y using general scoring s
cheme,Proc.Natl.Acad.Sci.
USA,Vol.87,pp.2264−2268,1
990) p値=1−exp[−K*N*M*exp(−λ*S)] (式7) 但し、 N=配列Aの塩基長 M=配列Bの塩基長 λ=ln(q/p) K=(q−p)2 /q p=スコア1が生じる確率 q=スコア−1が生じる確率 このp値は確率論的な指標であり、大抵は、例えばある
プローブ候補と他遺伝子配列に対し、ブラストアルゴリ
ズムで計算したp値が10%以下の場合、比較された二
者のDNA配列のホモロジーは十分に高い(危険率10
%以下)とし、プローブ候補を候補リスト13から棄却
することでクロスハイブリダイゼーションを十分に低減
させることができる。しかし、遺伝子のほぼ全領域にわ
たって、塩基配列が類似している場合、例えば同一のス
ーパーファミリーに属しているような、シトクロムP4
50のCYP2C8、CYP2C9、CYP2C18、
CYP2C19などの遺伝子では、確率論的指標だけで
はプローブとして用いることができるのか否かの明確な
判定が難しいプローブ候補が多数存在する。なぜなら相
同性検索において用いられるE値、やp値は、配列マッ
チ度が同一でも、配列の長さにより異なる値を示すこと
があるためである。例えばブラストアルゴリズムにより
算出されるp値で1.0、すなわち比較対象の二者の相
同性が確率的にはほぼゼロの場合でも、配列マッチ度で
約40%〜約75%までの値を示すことがある。相同性
検索の目的は、あるDNA配列がデータベース中に格納
されている遺伝子配列と一致しないとした場合(帰無仮
説)、その仮説が正しい確率を示す。配列マッチ度が7
5%とは、25%の配列が異なるということである。配
列長さにもよるが、25%も配列が異なれば、比較して
いる2配列は異なる遺伝子である確率が高い。そのため
p値がほぼ1.0となり相同性はゼロと判定される。し
かし実際には、配列マッチ度が75%の配列同士は、ハ
イブリダイゼーションを行う温度が約30度Tmより低
ければハイブリダイゼーションする。このようにハイブ
リダイゼーションが生じるか否かについてホモロジーサ
ーチのアルゴリズムは直接的な解答を与えない。そのた
めプローブとターゲットの間のハイブリダイゼーション
という物理化学的反応をより直接的に表す、熱力学的指
標、例えば融解温度や自由エネルギーといった指標をホ
モロジーサーチから得られるE値やp値に加えて用いる
のが望ましい。クロスハイブフィルタ45では、融解温
度の差、自由エネルギーの差といった、熱力学的指標に
基づいて、プローブ候補を棄却する。なお図4の融解温
度フィルタ41、二次構造フィルタ42、反復配列フィ
ルタ43、類似配列フィルタ44、クロスハイブリフィ
ルタ45の順序は、図4に限らない。例えば、二次構造
フィルタ42が先頭にきてもよいし、反復配列フィルタ
43が先頭にきてもよい。但し一般に計算時間のかかる
類似配列フィルタ44は、フィルタリング工程14の後
半にくることが望ましい。最後の再検査工程23も図5
に示すように複数の工程に分けることができる。再検査
工程23は類似配列フィルタ44を補完するための工程
であり、選択的スプライシング(オールタナティブスプ
ライシング)塩基配列対象類似配列検索工程51と全塩
基配列対象類似配列検索工程52等よりなる。オールタ
ナティブスプライシングとは、同一の遺伝子から複数の
転写産物(RNA)が産出される現象である。複数の転
写産物同士は同一の遺伝子を元にしているので、配列の
大部分が類似していることが多い。DNAチップでは、
オールタナティブスプライシングをそれぞれ分離して測
定する場合があるが、その場合、より高精度の配列検索
アルゴリズムが必要になる。そこでオールタナティブス
プライシング塩基配列対象類似配列検索工程51を設け
ることが望ましい。但しオールタナティブスプライシン
グを分離して測定する必要がない場合は、工程51は省
略することが可能である。全塩基配列対象類似配列検索
工程52は、GENBANKなどの塩基配列データベー
ス、dbESTなどのESTデータベース等に登録され
ている全ての塩基配列に対して、類似配列検索を行う工
程である。同一の種内だけの検索にとどまらず、ヒト、
マウス、ラットなど複数種に対して類似検索を行っても
よい。配列マッチ度とクロスハイブリダイゼーションの
関係を調べるために実験を行った。実験のため塩基長が
50bp、配列が異なる合成DNA(オリゴヌクレオチ
ドDNA,もしくはオリゴDNA)を5本用意した。こ
れら5種類のオリゴDNAをプローブとして用いる。図
6に用意したオリゴDNAの塩基配列をしめす。図6の
右欄は種々の組み合わせにおける配列マッチ度を示す。
実験では、各オリゴと相補配列を有するオリゴDNA末
端に蛍光標識を付けたターゲットDNAを、5種類の中
から1種類選択し、そのターゲットDNAを、図6のオ
リゴDNA1から5が同一基盤上に固定化されたDNA
チップに振り掛けて、12時間、62℃でハイブリダイ
ゼーションさせた。蛍光標識由来の蛍光信号強度は蛍光
スキャナーにより数値化した。5種類のターゲットDN
Aのそれぞれに対し3回ずつ実験を行った結果を整理
し、図7に示した。図7の横軸は配列マッチ度を、縦軸
は標的由来信号を未標的由来信号で割った商を示す。エ
ラーバーは標準偏差を示す。標的由来信号とは配列マッ
チ度が100%のターゲットDNAとプローブDNA間
のハイブリダイゼーションによる信号強度を示す。たと
えば図6のオリゴ1とその相補配列を有するターゲット
による信号強度である。そして未標的由来信号とは、標
的由来信号を除く、配列マッチ度が80,70,60,
50,40%のターゲットDNAとプローブDNA間の
ハイブリダイゼーションによる信号強度である。従っ
て、図7の縦軸(標的由来信号/未標的由来信号)が
1.0のとき、標的由来信号と未標的由来信号の強度が
等しいことを示す。このとき、クロスハイブリダイゼー
ション(本来ハイブリダイズすべきでないハイブリダイ
ゼーション)が本来のターゲット−プローブ間ハイブリ
ダイゼーションと同程度に生じていることになり、その
プローブは遺伝子ごとの発現を分離して測定していない
ので、DNAチップのプロ−ブとして用いることができ
ない。図7によると、配列マッチ度が40、50、60
%では、標準偏差を考慮するとクロスハイブリダイゼー
ションは有意でないが、配列マッチ度が70%で平均約
4割、配列マッチ度が80%で平均約6割のクロスハイ
ブリダイゼーションが見られた。図7の結果は、ハイブ
リダイゼーション温度や、洗浄の仕方によっても大きく
変わる。洗浄を厳しく(Stringent)行えばク
ロスハイブリダイゼーションは小さくなる。従って、図
7の結果は、全てのDNAチップにはそのままあてはま
らないが、大雑把に言って、配列マッチ度が80%を超
えた場合にクロスハイブリダイゼーションが生じる危険
性が高いと言える。前述のように、モチーフは異なる遺
伝子間で、比較的類似した配列を有する部位である。モ
チーフは通常、たんぱく質配列によって定義されること
が多い。しかしDNA配列をコドン(3塩基長配列)ご
とに区切ってアミノ酸に置き換えたものがたんぱく質配
列なので、モチーフ領域においてはたんぱく質配列のみ
ならずDNA配列も類似していると考えられる。そこ
で、1000個のたんぱく質配列をGENBANKから
無作為に取得し、PROSITEを用いたモチーフ検索
を行った。その結果得られた、たんぱく質モチーフ部位
のDNA配列を、同一モチーフを有する遺伝子同士で相
互比較した。その比較結果を表1から3に示す。
【0005】
【表1】
【表2】
【表3】 表の左から、モチーフ名称、モチーフ塩基長、前述の1
000個のたんぱく質配列中で該当モチーフを有する遺
伝子の数(該当遺伝子数)、該当遺伝子から2種類をラ
ンダムに選択した際の配列マッチ度最小値(配列マッチ
度最小値)、該当遺伝子全てで平均した配列マッチ度
(配列マッチ度平均値)、配列マッチ度最大値をそれぞ
れ示す。表1から表3は、配列マッチ度に対して降順に
並んでいる。表1から3より、モチーフ部位ではたんぱ
く質配列のみならず、DNA配列においても配列類似度
が高いことが分かる。約3分の1以上のモチーフで配列
マッチ度が70%を超えるほか、約半数のモチーフで配
列マッチ度が60%を超えている。図6,7および表
1,2,3の結果より、モチーフ部位をプローブとして
用いた場合、約3分の1程度の頻度で有意なクロスハイ
ブリダイゼーションが生じる恐れがあることが分かる。
従って、モチーフ部位はDNAチップ用プローブとして
用いないことが望ましい。但し、意図的にモチーフ部位
のみを固定化したDNAチップの場合は例外である。モ
チーフ部位を故意にプローブとすることで、該モチーフ
を有する既知および未知の複数遺伝子のターゲットDN
A断片をハイブリダイズさせることができる。一旦ハイ
ブリダイズさせたターゲットDNAを超音波および熱処
理などの方法で、プローブよりはがした後、ターゲット
DNAの塩基配列を決定することで、該モチーフを有す
る新規遺伝子をクローニングすることが可能である。同
一モチーフを有する遺伝子同士は、類似の機能を有して
いる可能性が大きいので、同一モチーフを有する既知遺
伝子の機能から新規遺伝子の機能を予測することは比較
的容易である。このように類似機能を有する新規遺伝子
のクローニングを目的としたDNAチップにおいては、
モチーフ部位を一部もしくは全体を含んだプローブを用
いることがある。しかし、既知の遺伝子やESTの発現
分布を測定するDNAチップを作成する場合、モチーフ
部位を含まないようにすることはクロスハイブリダイゼ
ーションを防止するために有益な設計要件である。また
プローブ設計時間を短縮するためにも、図3のマスキン
グ工程31においてモチーフ部位を含まないよう予めマ
スクしておくことが有益である。モチーフ部位をマスク
することによるプローブ設計時間短縮についての詳細
は、発明の実施の形態において記す。
【0006】本発明の特長の一つは、フィルタリング工
程により予め複数の遺伝子同士で類似する配列部位をマ
スクすることで計算速度を向上させている点である。本
発明では例えば、モチーフ部位を含む領域をマスクする
ことにした。この理由は、ヒト、マウス、ラットなどす
べてのcDNA配列が決定されていない生物種でも、モ
チーフ部位は高い確率で、複数の遺伝子で類似している
と予想できるためである。但し、大腸菌や酵母など全配
列が決定されている場合は、例えばBLASTなどのホ
モロジーサーチアルゴリズムを用いて、配列一致度を計
算し、類似配列部位を同定することができる。本発明で
は、モチーフによる方法とホモロジーサーチのよる方法
のいずれかを用いたフィルタリング工程を行う。
【0007】配列マッチ度のみを用いてクロスハイブリ
の評価を行うことは大変に危険である。なぜなら、比較
対照の2配列におけるミスマッチの分布が、配列全体に
渡って一様に分布しているのか、それとも局所的に分布
しているのかを区別することができないからである。例
えば40塩基対が完全にマッチした配列(相補結合を形
成する配列)であってかつ、残りの40塩基対が完全に
ミスマッチした配列の場合、80塩基対の配列マッチ度
は50%である。そして1塩基ごとにマッチ、ミスマッ
チが交互に分布している80塩基対の配列マッチ度も5
0%である。これは極端な例だが、配列マッチ度が50
%であっても、クロスハイブリの可能性は明らかに前者
が高い。またBlast等のホモロジーサーチにより計算さ
れる配列マッチ度(% Identity)や統計的有意水準値
(p値、もしくはE値)は、それぞれ意味することが異
なるので、たとえ配列マッチ度が同一であってもp値が
異なることがある。その反対にp値が同一であっても配
列マッチ度が異なることもある。従って、これら配列マ
ッチ度や、統計的有意水準値のどちらを用いてクロスハ
イブリの評価を行ったかによって、評価結果が異なるこ
とになる。このあいまいさは、Tm差、ΔG差という物理
化学的指標を用いることで排除することができる。本発
明の特長の一つは、プローブのクロスハイブリダイゼー
ションの可能性を、融解温度差や自由エネルギー差とい
う物理化学的指標をもとに判定する点である。例えばB
LASTなどのホモロジーサーチを用いる方法では、単
にATGCという文字の並びのみを根拠にクロスハイブ
リ可能性を判定することになる。本発明の指標を用いる
ことにより、現象からみてより根拠のある判定ができ
る。プローブ設計において実際に得られた配列マッチ
度、統計的有意水準値、Tm差、ΔG差の例を表5に示
す。表5のプローブ設計対象遺伝子の列には、プローブ
設計を試みた遺伝子のUnigeneシンボル名が、最も類似
した他遺伝子の列には、プローブ設計対象遺伝子と最も
類似した配列を有する他遺伝子のUnigeneシンボル名が
記載されている。その右側の列は、プローブ設計対象遺
伝子に対して設計されたプローブ配列と、それと最も類
似した他遺伝子における、プローブ配列と最もホモロジ
ーの高い遺伝子断片配列との配列マッチ度、統計的有意
水準値、Tm差、ΔG差が記載されている。表1のケース
1から3は、配列マッチ度が等しくても、統計的有意水
準値が異なる例である。また表1のケース4から7は、
統計的有意水準値が等しくても、配列マッチ度が異なる
例である。しかし、Tm差やΔG差を用いることでケース
1から7の全てにわたって、クロスハイブリのし易さの
順番を正確に評価することができる。
【0008】
【表4】
【発明の実施の形態】課題を解決するための手段におい
て開示した方法に従って構築した、DNAプローブアレ
イ用プローブ設計ソフトウェアのフローチャートの一例
を図8に示す。図8のフローチャートは図2のプローブ
候補2次リスト22を作成するまで示している。図8で
は図2中の工程に加えて、リストアップ工程12におい
てモチーフ部位をマスキングするためのモチーフ情報入
力工程81、またフィルタリング工程14において融解
温度、反復配列、二次構造を計算するために必要な設計
条件入力工程82が記されている。しかし工程81、8
2とも図2の工程12、工程14に必要な情報を入力し
ている工程にすぎないので、図8は図2と同一であると
いえる。なおボックス形状は異なるものの図8の融解温
度フィルタ83が図4の融解温度フィルタ41に相当す
る。図8のThはハイブリダイゼーション温度、Th+
αが融解温度の設定下限値、Th+βが融解温度の設定
上限値をそれぞれ示す。α、βはそれぞれ正負のいずれ
の値でもよい。そして図8の二次構造フィルタ85は図
4の二次構造フィルタ42に、図8の類似配列フィルタ
87は図4の類似配列フィルタ44、図8のクロスハイ
ブリフィルタ88は図4のクロスハイブリフィルタ45
にそれぞれ相当する。なお図4の反復配列フィルタ43
は、図8では、ミニヘアピン・反復配列フィルタ84と
長反復配列フィルタ86の二工程に分割されている。こ
の分割の理由は計算速度の向上である。工程84と工程
86を同一アルゴリズムにより処理するよりも、工程8
4と工程85を別アルゴリズムで行う方が計算上好都合
なこと、工程85より計算時間のかからない工程86を
工程85の前に、工程85より計算時間のかかる工程8
6を工程85の後ろにすることが計算速度を向上させる
ために好ましかったことにより、図8の各工程の順序が
定められている。ただし、工程83から工程88までの
各工程の順序は、フィルタリング工程14を通じて計算
時間が最も短くなるようにすればよく、図4や図8の順
番に各工程を行う必要はない。図8のフローチャートの
順番に従って、以下詳細に説明する。ゲノム、cDNA
配列11は、例えば図9に示すように、FASTA形式
と呼ばれる形式などで記述されたテキストファイルを読
み取ることで、プローブ設計システムに入力される。図
9はヒトcDNA配列を約4万格納したファイルの冒頭
部分を示している。なおゲノム、cDNA配列11のフ
ァイルは1つないしは複数の圧縮形式もしくは未圧縮形
式ファイルでよい。また、FASTA形式以外の、例え
ば、GenBank,EMBL、DDBJ形式といった
異なる形式のファイルのいずれでもよい。そして図9の
ように必ず塩基配列が格納されている必要はなく、例え
ばGenBankのアクセション番号や、Unigen
eのID番号、GI番号といった、塩基配列を参照可能
なID番号等が格納されたファイルであればよい。モチ
ーフ情報入力工程81は、例えば図10に示すような形
式でモチーフ情報を格納したテキストファイルを読み取
る工程である。図10は左列からcDNA配列のGI番
号、cDNA配列中に含まれるモチーフ数、モチーフ
名、あるモチーフの開始塩基位置(番号)、あるモチー
フの終了塩基位置(番号)のそれぞれに対応する。そし
て図10の各行は、図9ファイルの各配列のそれぞれに
対応する。図10に記載されたモチーフ開始位置と終了
位置に基づき、図9ファイルの塩基配列のなかでモチー
フに相当する領域をマスクする。なお図10に示すファ
イルを用意しなくても、図9のゲノム、cDNA配列1
1のファイルに記載されているGI番号などに基づき、
Genbank等のDNA配列、たんぱく質配列モチー
フ情報をデータベースにより検索することも可能であ
る。すなわち、図9中に含まれる例えば、Genban
kのアクセション番号等からDNAもしくは、たんぱく
質配列をデータベースから取得して、そのDNAもしく
は、たんぱく質配列からモチーフ部位を計算等の手段に
より取得することができれば、図10のファイルは必ず
しも必要でない。5000個のDNAプローブを設計し
た際に、モチーフ部位を予めマスクすることによる計算
時間短縮の効果を表4に示す。
【0009】
【表5】 モチーフ部位をマスクすることにより、計算時間が約3
分の1に短縮された。これは、予めモチーフ部位という
複数の遺伝子において類似した部位をマスクしておくこ
とで、後のフィルタリング工程14の類似配列フィルタ
87を約1回で合格する頻度が増えたためである。フィ
ルタリング工程14で除外されるプロ−ブ候補が多い場
合は、無駄な計算をしていることになるが、予めモチー
フ部位をマスクしておくことは、この無駄な計算をなく
す上で有益である。設計条件入力工程82で入力する設
計条件とは例えば、プローブ塩基長、ハイブリダイゼ−
ション溶液の塩濃度、ハイブリダイゼーション温度、プ
ローブ融解温度の上限値、下限値、目標値などである。
またプローブの融解温度や二次構造の安定性を計算する
ためのパラメータは、例えば図11のようなファイルか
ら読み取ればよい。図11は、最近接塩基法(Near
est Neighbor法;NN法)により融解温度
を計算する際の熱力学パラメータである(SantaL
ucia,J, Jr. A unified vie
w of polymer, dumbbell, a
nd oligonucleotide DNAnea
rest−neighbor thermodynam
ics, Porc. Natl. Acad. Sc
i. USA, vol.95, p.1460−14
65, 1998)。図11の左列からΔH、ΔS、Δ
G(37℃)である。図11の第1行は、コメント欄に
よると、AA/TTの2塩基配列のΔH、ΔS、ΔG
(37℃)であることが分かる。なお融解温度(Tm)
とΔH、ΔSの関係は式8で表される。 Tm=ΔH/(ΔS+R*ln(Ct)) (式8) 但し、 R=ガス定数 Ct=オリゴヌクレオチド濃度 最近接塩基法によりΔGを計算する例を式9にしめす。
例えば塩基配列が以下の場合、 5‘ C-G-T-T-G-A 3’ 3‘ G-C-A-A-C-T 5’ 最近接塩基法(NN法)で計算した自由エネルギーΔG
(NN)は、 ΔG(NN)=ΔG(CG/GC)+Δ(GT/CA)+ΔG(TT/AA) +ΔG(TG/AC)+ΔG(GA/CT)+ΔG(init) =−2.17−1.44−1.00−1.45−1.30+0.98+1.0 3 =−5.35 kcal/mol (式9) 各数値は数表の形で論文に記載されている。ΔS、ΔH
も式9と同様に計算できる。更に溶液の塩濃度による補
正を例えば式10で行うことで、溶液中の相補結合の安
定性(自由エネルギー)ΔG(溶液中)を計算すること
ができる。 ΔG(溶液中)=ΔG(NN)−0.175*ln[Na+] −0.20 (式10) 但し、 [Na] =塩濃度 なおDNA配列のTmの計算には、前述の最近接塩基法
と、経験式に基づく方法(Wetmure, J.
G., DNA probes: Applicati
ons of the principles of
nucleic acid hybridizatio
n, Criti. Rev in Biochem.
And Mol. Biol., vol.26,
p.227−259, 1991)の2つがある。経験
式に基づくTmの計算式は、DNA−DNAハイブリダ
イゼーションの場合は式11、DNA−RNAハイブリ
ダイゼーションの場合は式12、RNA−RNAハイブ
リダイゼーションの場合は式13である。 Tm=81.5+16.6*log([Na+]/(1+0.7[Na+]))+0.41*(%GC)− 500/length (式11) 但し、 [Na] =塩濃度 %GC=GC比率 length=塩基長 Tm=67+16.6*log([Na+]/(1+0.7[Na+]))+0.8*(%GC)−500/ length (式12) 但し、 [Na] =塩濃度 %GC=GC比率 length=塩基長 Tm=78+16.6*log([Na+]/(1+0.7[Na+]))+0.7*(%GC)−500/ length (式13) 但し、 [Na] =塩濃度 %GC=GC比率 length=塩基長 50塩基対以下のDNA配列については式8、9、10
の最近接塩基法がよく合致し、50塩基対以上のDNA
配列に対しては式11,12,13の経験式に基づく方
法がよく合致するという報告もある。しかし前記J.S
antaLucia,Jr.の論文によると、最近接塩
基法も改良されており、配列長さによらず計算できるこ
とが示唆されている。そこで、DNA配列のTm計算に
は、塩基長さに応じて最近接塩基法もしくは経験式に基
づく方法のいずれか片方をもちいる、あるいは両者の方
法で計算して得られた値の例えば平均値などを用いれば
良い。モチーフ情報入力工程81で得られたモチーフ部
位を、図3のマスキング工程31にてマスクする。続い
て、設計条件入力工程82により入力されたプローブ塩
基長に基づき、図3のプローブ長切り取り工程32を実
施することで、プローブ候補1次リスト21を作成す
る。その次の融解温度フィルタ83では、プローブ候補
1次リスト21中のプローブ候補の一つ一つについて融
解温度(Tm)を計算し、そのTmがハイブリダイゼー
ション温度(Th)と比較してある一定の範囲、例えば
Th+αからTh+β(但しα、βの値は正負のどちら
の値でもよい)を外れているDNA配列をプローブ候補
1次リスト21から棄却する。その後、プローブ候補1
次リスト21に残されたそれぞれのプローブ候補とプロ
ーブ融解温度目標値との差を計算し、プローブ融解温度
目標値に近いプローブ候補ほどプローブ候補1次リスト
の先頭にくるようにソートすることもできる。このソー
トは必ずしも必要でないが、プローブ融解温度目標値に
近いプローブをより短い計算時間で設計する際には有用
な処理である。続くミニヘアピン、単純反復配列フィル
タ84について説明する。1本鎖DNAは通常、溶液中
ではその一部が折れ曲がって数個の相補的な塩基対を形
成しているが、この構造はヘアピン構造と呼ばれる。こ
のヘアピン構造のうち、配列1や配列2のように異常に
熱安定性が高いヘアピン構造が存在することが分かって
いる(平尾と三浦、1本鎖DNAの特殊構造異常に熱安
定性が高いミニヘアピン構造、蛋白質核酸酵素、vo
l.40,p.1583−1592,1995)。配列
1のTmは76℃にも達する。この76℃という温度は
一般のハイブリダイゼーション温度(40℃から62
℃)と比較して有意に高い。このため、配列1が固定化
DNA断片中に含まれた場合、ハイブリダイゼーション
時、その配列部分ないしはより広範囲の領域で相補結合
を形成しない確率が非常に高い。相補結合を形成しない
状態とは、ある意味でミスマッチの状態と同一である。
前述のように、2つのDNA間でミスマッチがあれば、
両DNAのTmが低下し、ハイブリダイゼーション精度
が低下することになる。このため例えば配列1や配列2
のようなミニヘアピン構造はできる限り、固定化DNA
断片中に含まれない方がよい。また配列1,2以外にハ
イブリダイゼーション精度を低下させうる配列に、単純
反復配列がある。単純反復配列とは例えば2塩基リピー
ト、3塩基リピートである。2塩基リピートは例えば、 AT[AT]nAT(但しn=0,1,2…) (配列3) GC[GC]nGC(但しn=0,1,2…) (配列4) といった2塩基が何度も繰り返される配列である。そし
て3塩基リピートとは例えば、 CXG[CXG]nCXG(但しX=A,T,G,Cのいずれか、n=0,1, 2…) (配列5) といった3塩基が何度も繰り返される配列である。工程
84では例えば、文字列のパターンマッチングアルゴリ
ズムを用いて、2塩基リピートや3塩基リピートを検索
して、それらのハイブリダイゼーション精度を低下させ
る可能性のある配列を有するプローブ候補を、プローブ
候補1次リストより棄却する。パターンマッチングの対
象としては、ミニヘアピン、リピート配列の相補配列
(GCGAAAGCであれば、CGCTTTCG)、反
転配列(GCGAAAGCであれば、CGAAAGC
G)、相補反転配列(GCGAAAGCであれば、GC
TTTCGC)について対象としてもよい。計算速度を
向上させるために文字列をいったん数字に変換しビット
シフト計算等により比較してもよい。工程84では、例
えば図12に示すようなパターンマッチングの対象とな
るパターン配列(検索対象パターン)を格納したファイ
ルを読み取ることでパターンマッチングを行えばよい。
図12では、複数の検索対象パターンが格納され、各検
索対象パターンは改行により区切られている。続く二次
構造フィルタ85について説明する。溶液中の1本鎖D
NAは、ヘアピン構造以外にも、塩基間の水素結合力に
より多様な高次構造をとることが知られているが、ヘア
ピン構造を含めこれらの高次構造は、二次構造と呼ばれ
る。もしもプローブ候補が取りうる二次構造の安定性
が、プローブ−ターゲット間ハイブリダイゼーションの
安定性と比較して無視できない場合は、そのプローブ候
補は、プローブ候補1次リスト21より棄却される。二
次構造には例えば、ヘアピンループ構造、インターナル
ループ構造、バルジループ構造といった構造がある。予
測された二次構造が有意に安定か否かは、例えば式1の
ように、熱力学的計算により計算された二次構造のΔG
と、プローブ−ターゲット間ハイブリダイゼーションの
ΔGと比較することで判定できる。続く長反復配列フィ
ルタ86について説明する。ヒトDNAにはヒト特有
の、Alu配列と呼ばれる、反復配列を多く含む配列の
存在が知られている。このAlu配列はヒトDNAに数
多く含まれている。またAlu配列は、メッセンジャー
RNA内、特に5‘非翻訳領域または3’非翻訳領域に
も存在する。仮に、測定対象のメッセンジャーRNAサ
ンプル中にDNA分子が混入していた場合、メッセンジ
ャーRNAを鋳型として蛍光標識をする工程中、混入D
NA内もAlu配列部分の存在により蛍光標識されてし
まう可能性がある。そしてAlu配列部分を含む標識さ
れた混入DNAと、固定化DNA断片とが相補結合する
ことも考えられる。本来メッセンジャーRNAのみを測
定すべきが、DNAをも測定してしまう恐れがある。こ
の混入DNAによる誤った解析を避けるためには、固定
化DNA断片中にAlu配列と相同性が有意に高い部分
が含まれないことが望ましい。またAlu配列には反復
構造が多く含まれるので、溶液中で、高次構造をとる可
能性があり、前記のミニヘアピン構造と同様にミスマッ
チを引き起こすことが十分に考えられる。この意味でも
固定化DNA断片中にAlu配列と相同性が有意に高い
部分が含まれないことが望ましい。例えば、Alu配列
と固定化DNA断片とのホモロジーがブラストアルゴリ
ズムで算出した統計的有意水準(p値)で10%を超え
るようにすれば、配列相同性が有意に低くなると考えら
れる。ブラストアルゴリズムは、Altschul,
S.F.ら、Basic local alignme
nt search tool, J.Mol.Bio
l.Vol.215, p.403−410, 199
0を用いればよい。Alu配列との相同性検索の結果、
Alu配列との相同性が大きいプローブ候補は、プロー
ブ候補1次リスト21より棄却する。ヒトではAlu配
列のほかに、LINE(Long Intersper
sed Elements)、SINE(Short
Interspersed Elements)、LT
Rレトロトランスポゾン、DNAトランスポゾンなどの
反復配列が知られている。またヒト以外でもAlu配列
に相当するいくつかの反復配列が知られている。これら
の反復配列についても同様に、プローブ候補と相同性検
索を行い、相同性が高いプローブ候補はプローブ候補1
次リスト21より除外すればよい。相同性検索に用いる
配列は、例えば図13に示すような、Alu配列等をF
ASTA形式で格納したファイルを読み込むなどすれば
よい。続く類似配列フィルタ87では、1枚のDNAプ
ローブアレイ上に固定化するプローブ配列ないしはプロ
ーブ配列を含む遺伝子配列(ゲノム配列、cDNA配
列)同士の相同性検索を行う。プローブ候補のうち、他
プローブ配列や遺伝子配列と相同性が高いプローブ候補
は、クロスハイブリダイゼーションの可能性があるの
で、プローブ候補リスト21より棄却する。また工程8
7では、例えばヒトの場合、ヒトでは約4万個あると考
えられている全ての遺伝子配列、ヒトでは約10万個あ
ると考えられている全ての転写産物、もしくはヒト全ゲ
ノム配列との相同性を計算してもよい。測定対象試料に
は、固定化DNA断片と本来ハイブリダイズする遺伝子
以外にも、数多くの別遺伝子が含まれている。それら別
遺伝子がハイブリダイズした場合、本来、個々の固定化
DNA断片がハイブリダイズすべき遺伝子のみの測定が
できなくなる。そこで、DNAプローブアレイ上に固定
化するDNA断片候補の配列と、測定対象試料に含まれ
ている可能性のある遺伝子群のDNA配列とを比較し
て、相同性が有意に高いDNA配列は、固定化DNA断
片としては選択しないことが望ましい。GENBANK
等の遺伝子配列データベースには現在までに知られてい
るヒトないしはげっ歯類、酵母、大腸菌などの配列が全
て格納されている。固定化DNA断片と、例えばGEN
BANK等のヒトなどの遺伝子配列とのDNA配列相同
性が、ブラストアルゴリズムにより算出した統計的有意
水準(p値)で10%を超えることとすれば、より高精
度の測定が行える。また図2に示すように時間のかかる
他遺伝子との相同性検索を、類似配列フィルタ87では
高速アルゴリズム(高速だが精度が低いアルゴリズム、
例えばブラストアルゴリズム)で行い、図5の再検査工
程23において低速アルゴリズム(低速だが精度が高い
アルゴリズム、例えばスミスウォーターマンアルゴリズ
ム)による相同性検索を行ってもよい。フィルタリング
工程の最後であるクロスハイブリダイゼーションフィル
タ88について説明する。前述のように相同性検索は必
ずしもプローブ−ターゲット間ハイブリダイゼーション
という物理化学的過程を考慮していない。そのため、類
似配列フィルタ87に合格した1つないしは複数のプロ
ーブ候補に対し、クロスハイブリダイゼーションの可能
性を調べる。例えばプローブ候補と最も配列相同性が高
い他遺伝子配列との配列マッチ度、融解温度差(Tm
差)、自由エネルギー差(ΔG差)を計算する。他遺伝
子との配列マッチ度が有意に高いプローブ候補はプロー
ブ候補1次リスト21より棄却する。配列マッチ度が有
意に高いとは例えば、図7に示すように配列マッチ度が
80%を超えることである。他遺伝子とのTm差が有意
に小さいプローブ候補はプローブ候補1次リスト21よ
り棄却する。Tm差が有意に小さいとは、例えば、Tm
差が15℃以下のことである。そして他遺伝子とのΔG
差が有意に小さいプローブ候補はプローブ候補1次リス
ト21より棄却する。こうしてクロスハイブリダイゼー
ションの生じる可能性を物理化学的指標により評価する
ことで、作成されたDNAプローブアレイのクロスハイ
ブリダイゼーションをほぼゼロにすることが可能だと考
えられる。図8に示す一連の工程により設計されたプロ
ーブ2次候補は、図14に示すようにプローブ2次候補
リスト22として、リスト化される。この後、再検査工
程23等を経て、最終的にプローブ配列15が決定され
る。図15に本発明のインターフェースの一例を示す。
インターフェースのハードウェアは、例えば表示装置1
51、CPU152、入力装置153より構成される。
表示装置151には、選択ボタン154、表示ボタン1
55、チェックボタン156などのボタン群が配置さ
れ、本発明の使用者が、入力装置153により、各ボタ
ンをクリックするなどの操作により、条件入力を行え
る。選択ボタン154は選択可能な選択肢を予め全て使
用者に提示した後、使用者に望みの選択肢を選択させる
ボタンである。例えば、入力配列がゲノムDNAなのか
cDNAなのか、あるいはモチーフ部位をマスキングす
るのかなどを選択させる。表示ボタン155をクリック
することにより、より詳細な入力画面や、ヘルプ画面を
参照できる。チェックボタン156はトグルになってお
り、チェックされた工程は実行され、チェックされない
工程は省略される。使用者が行った条件入力をもとに、
本発明のリストアップ工程12、フィルタリング工程1
4、再検査工程23の組み合わせや、各工程の順序を自
動最適化して、ソフトウェア処理を行うことができる。
こうしてソフトウェア内部を熟知しない使用者でも、様
々な設計条件において、最速のソフトウェア処理を行う
ことができる。本発明を実施することで、クロスハイブ
リダイゼーションがなく、均等化したTmを有し、二次
構造をとることが少ないプローブ配列を実現することが
できる。
【0010】Unigeneに登録されている4274
個のラット既知遺伝子に対し、80塩基のオリゴヌクレ
オチドプローブを設計した。その結果、4274個の9
8.6%に相当する4216遺伝子についてプローブ配
列を決定することができた。4216個のプローブ配列
の特性について図16から図19に記す。図16は42
16個のプローブの融解温度を示した図である。図16
の横軸はプローブ番号を、図16の縦軸はプローブの融
解温度(℃)を示す。設計時のプローブ融解温度の目標
値は75℃とした。フィルタリング工程の全条件を満た
した上で、最も目標値に近い融解温度を持つ配列がプロ
ーブとして選択されている。4216個のプローブ融解
温度の平均値とその標準偏差は75.0±0.72℃で
あった。図17は4216個のプローブのクロスハイブ
リダイゼーション可能性について、最類似遺伝子断片と
の一致度(%)を示した図である。プローブ配列は、そ
のプローブと本来ハイブリダイズする遺伝子とは100
%一致する配列である。その一方、Unigeneに登
録されている4274個のラット既知遺伝子のなかで、
プローブが本来ハイブリダイズする遺伝子を除いて、最
も類似した80塩基の部分配列を有する遺伝子配列との
一致度を図17は示している。図17によると最も類似
した遺伝子配列との一致度は70%以下である。421
6個のプローブの最類似遺伝子断片との一致度(%)の
平均値とその標準偏差は、55.1±4.52%であ
る。この配列一致度は、単にATGCの並びが一致する
か否かを示すだけであって、ハイブリダイゼーションと
いう物理化学的現象を直接反映した指標とはいえない。
そこで、図18に4216個のプローブのクロスハイブ
リダイゼーション可能性について、最類似遺伝子断片と
の融解温度差(℃)を、図19に最類似遺伝子断片との
自由エネルギー差(kcal/mol)を示した。図18による
とプローブと本来ハイブリダイズする遺伝子と、Uni
geneに登録されている4274個のラット既知遺伝
子のなかで、プローブが本来ハイブリダイズする遺伝子
を除いて、最も類似した80塩基の部分配列とでは、少
なくとも20℃以上、融解温度が異なっている。421
6個の平均値とその標準偏差は、75.6±24.3%
である。核酸同士がハイブリダイゼーションを行う際の
代表的メルティングカーブによると、ほぼ10〜15℃
異なれば、クロスハイブリダイゼーションが防止できる
と予想される。この融解温度20℃以上という差は、ク
ロスハイブリダイゼーションをほぼ100%防止できる
差異だと考えられる。また図19によるとプローブと本
来ハイブリダイズする遺伝子と、Unigeneに登録
されている4274個のラット既知遺伝子のなかで、プ
ローブが本来ハイブリダイズする遺伝子を除いて、最も
類似した80塩基の部分配列とでは、少なくとも40kc
al/mol以上安定性(自由エネルギー)が異なっているこ
とが分かる。すなわち、プローブと本来ハイブリダイズ
する遺伝子とがハイブリダイズする安定性は、プローブ
と最類似遺伝子断片とがクロスハイブリする安定性より
も、40kcal/mol以上、平均で73.3±8.01kcal
安定であることが分かる。配列一致度という指標と比べ
て、融解温度差や自由エネルギー差という指標は、プロ
ーブの塩基配列とハイブリダイゼーションという物理化
学的現象を直接反映しているので、より好ましい。本発
明を用いることで、融解温度が均一でかつクロスハイブ
リの可能性が実用上十分に低いプローブ配列が決定でき
ることが分かる。なお4274個のラット既知遺伝子に
対し、プローブ配列を決定できなかった遺伝子配列65
個は、そのcDNA全体に渡って、遺伝子相互の配列ホ
モロジーが80%以上の類似遺伝子が1つ以上存在する
ことを確認した。プローブ配列をより短くするしか、ク
ロスハイブリのないプローブを決めることはできない。
すなわち遺伝子配列そのものに問題があるのであって、
本発明のアルゴリズムでは決定できるプローブ配列は全
て決定できていることが分かる。
【0011】図20に全体の工程を表したインターフェ
ースの一例を示す。まず、ゲノム又はcDNA配列のデ
ータベース中からプローブ候補の部分配列を選択し、選
択された部分配列の中から、モチーフ部位又は反復配列
部位を含む部分配列を除外するマスキング処理手段を経
て、プローブ候補リスト1を作成する。そして、プロー
ブ候補リスト1の中から、プローブに適さない不適合候
補をTm、二次構造、反復配列、類似配列、ΔG差・T
m差に基づいてフィルタリングし、プローブ候補リスト
2を作成する。その後、再検査工程を経てプローブ配列
を決定する。
【0012】
【発明の効果】DNAプローブアレイ上に固定化するプ
ローブDNAの配列設計方法を提供する。
【図面の簡単な説明】
【図1】プローブ設計フローチャートの全体構成の一
例。
【図2】プローブ設計フローチャートの全体構成の一
例。
【図3】リストアップ工程のフローチャートの一例。
【図4】フィルタリング工程のフローチャートの一例。
【図5】再検査工程のフローチャートの一例。
【図6】実験に用いたオリゴDNA配列と相互の配列マ
ッチ度。
【図7】配列マッチ度と標的由来信号/未標識由来信号
の関係。
【図8】プローブ設計フローチャートの全体構成の一
例。
【図9】ゲノム・cDNA配列ファイルの一例。
【図10】モチーフ情報ファイルの一例。
【図11】熱力学計算用パラメータファイルの一例。
【図12】パターンマッチング対象パターンファイルの
一例。
【図13】反復配列ファイルの一例。
【図14】プローブ候補2次リストの一例。
【図15】プローブ設計システムインターフェースの一
例。
【図16】プローブの融解温度を示した図。
【図17】プローブのクロスハイブリダイゼーション可
能性について、最類似遺伝子断片との一致度を示した
図。
【図18】プローブのクロスハイブリダイゼーション可
能性について、最類似遺伝子断片との融解温度差を示し
た図。
【図19】最類似遺伝子断片との自由エネルギー差を示
した図。
【図20】全体の工程を表したインターフェースの一例
である。
【符号の説明】
11.ゲノム、cDNA配列、12.プローブ候補リス
ト作成工程(リストアップ工程)、13.プローブ候補
リスト、14.不適合候補除外工程(フィルタリング工
程)、15.プローブ配列、21.プローブ候補1次リ
スト、22.プローブ候補2次リスト、23.再検査工
程、31.類似配列部位除外工程(マスキング工程)、
32.プローブ長切り取り工程、41.融解温度フィル
タ、42.二次構造フィルタ、43.反復配列フィル
タ、44.類似配列フィルタ、45.クロスハイブリフ
ィルタ、51.オールタナティブスプライシング塩基配
列対象類似配列検索工程、52.全塩基配列対象類似配
列検索工程、81.モチーフ情報入力工程、82.設計
条件入力工程、83.融解温度フィルタ、84.ミニヘ
アピン、単純反復配列フィルタ、85.二次構造フィル
タ、86.長反復配列フィルタ、87.類似配列フィル
タ、88.クロスハイブリフィルタ、151.表示装
置、152.CPU,153.入力装置、154.選択
ボタン、155.表示ボタン、156.チェックボタ
ン。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 斎藤 俊郎 東京都千代田区神田駿河台四丁目6番地 株式会社日立製作所ライフサイエンス推進 事業部内 (72)発明者 奈良原 正俊 東京都千代田区神田駿河台四丁目6番地 株式会社日立製作所ライフサイエンス推進 事業部内 (72)発明者 加藤 宏一 東京都千代田区神田駿河台四丁目6番地 株式会社日立製作所ライフサイエンス推進 事業部内 Fターム(参考) 2G045 AA35 DA12 DA13 JA01 4B024 AA11 AA20 CA04 CA09 HA12 4B063 QA13 QQ42 QR32 QR55

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】ゲノム又はcDNA配列のデータベースか
    らプローブ候補の部分配列を選択する手段と、 前記選択されたプローブ候補の部分配列の中から、モチ
    ーフ部位及び反復配列部位を含む部分配列を除外するマ
    スキング処理手段と、 前記マスキング処理の結果を、第1のプローブ候補リス
    トとして作成する手段と、 前記第1のプローブ候補リストの中から、所定のプロー
    ブ候補を除外するフィルタリング手段と、 前記フィルタリング処理の結果を、第2のプローブ候補
    リストとして作成する手段からなることを特徴とするプ
    ローブ配列決定システム。
  2. 【請求項2】請求項1記載のプローブ配列決定システム
    において、前記マスキング処理されたプローブ候補の中
    からさらに、第1の長さの塩基対のゲノム及びcDNA
    配列から、前記第1の長さよりも短い第2の長さの塩基
    対の部分配列であるプローブ候補を取得するプローブ配
    列切り取り処理手段を有し、前記プローブ配列切り取り
    処理の結果を、第1のプローブ候補リストとして作成す
    ることを特徴とするプローブ配列決定システム。
  3. 【請求項3】請求項1記載のプローブ配列決定システム
    において、前記フィルタリング手段は、熱力学的指標で
    ある融解温度差、自由エネルギー差のいずれか1つ以上
    に基づいてプローブ候補を棄却する手段を有することを
    特徴とするプローブ配列決定システム。
  4. 【請求項4】請求項3記載のプローブ配列決定システム
    において、前記第2のプローブ候補リストの中から、一
    の遺伝子から複数の転写産物が産出された場合に配列を
    選択する選択的スプライシング塩基配列対象類似配列検
    索と、データベースに登録されている塩基配列に対して
    類似配列検索を行う塩基配列対象類似配列検索をする再
    検査手段を有し、プローブ配列を決定することを特徴と
    するプローブ配列決定システム。
  5. 【請求項5】請求項4記載のプローブ配列決定方法にお
    いて、前記類似配列検索は、複数種に対して類似類似検
    索を行うことを特徴とするプローブ配列決定システム。
  6. 【請求項6】ゲノム又はcDNA配列のデータベースか
    らプローブ候補の部分配列を選択する手段と、 前記選択されたプローブ候補の部分配列の中から、所定
    の部位を含む部分配列を除外するマスキング手段と、 前記マスキング処理の結果を、第1のプローブ候補リス
    トとして作成する手段と、 前記第1のプローブ候補リストの中から、熱力学的指標
    である融解温度差、自由エネルギー差のいずれか1つ以
    上に基づいてプローブ候補を除外するフィルタリング手
    段と、 前記フィルタリング処理の結果を、第2のプローブ候補
    リストとして作成する手段からなることを特徴とするプ
    ローブ配列決定システム。
  7. 【請求項7】請求項6記載のプローブ配列決定システム
    において、前記フィルタリング手段は、さらに融解温
    度、二次構造、反復配列、類似配列のいずれか1つ以上
    に基づいてプローブ候補を棄却する手段を有することを
    特徴とするプローブ配列決定システム。
  8. 【請求項8】請求項7記載のプローブ配列決定方法にお
    いて、前記二次構造は、ミニヘアピン配列による二次構
    造であることを特徴とするプローブ配列決定システム。
  9. 【請求項9】請求項7記載のプローブ配列決定システム
    において、前記反復配列は、ミニヘアピン配列、単純反
    復配列、長反復配列のいずれか1つ以上であることを特
    徴とするプローブ配列決定システム。
JP2002111490A 2001-06-04 2002-04-15 Dnaアレイ向けプローブ配列決定システム Abandoned JP2003052385A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002111490A JP2003052385A (ja) 2001-06-04 2002-04-15 Dnaアレイ向けプローブ配列決定システム
US10/229,058 US20030194718A1 (en) 2002-04-15 2002-08-28 Probing sequence determination system for DNA arrays

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001167611 2001-06-04
JP2001-167611 2001-06-04
JP2002111490A JP2003052385A (ja) 2001-06-04 2002-04-15 Dnaアレイ向けプローブ配列決定システム

Publications (1)

Publication Number Publication Date
JP2003052385A true JP2003052385A (ja) 2003-02-25

Family

ID=26616255

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002111490A Abandoned JP2003052385A (ja) 2001-06-04 2002-04-15 Dnaアレイ向けプローブ配列決定システム

Country Status (1)

Country Link
JP (1) JP2003052385A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006033484A1 (ja) * 2004-09-24 2006-03-30 Kyushu University, National University Corporation 核酸マイクロアレイ及び核酸プローブの設計方法並びに遺伝子検出方法
JP2007295872A (ja) * 2006-05-01 2007-11-15 Sony Corp プローブ核酸配列設計方法、プローブ核酸、検出表面、プログラム、情報記憶媒体、並びにプローブ核酸設計システム
JP2008507297A (ja) * 2004-07-26 2008-03-13 エンゾン ファーマシューティカルズ,インコーポレーテッド 最適化されたインターフェロンβ遺伝子
JP2010522571A (ja) * 2007-03-28 2010-07-08 ザ チルドレンズ マーシー ホスピタル 少コピー数の核酸セグメントを同定および選択する方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008507297A (ja) * 2004-07-26 2008-03-13 エンゾン ファーマシューティカルズ,インコーポレーテッド 最適化されたインターフェロンβ遺伝子
WO2006033484A1 (ja) * 2004-09-24 2006-03-30 Kyushu University, National University Corporation 核酸マイクロアレイ及び核酸プローブの設計方法並びに遺伝子検出方法
JP2007295872A (ja) * 2006-05-01 2007-11-15 Sony Corp プローブ核酸配列設計方法、プローブ核酸、検出表面、プログラム、情報記憶媒体、並びにプローブ核酸設計システム
JP2010522571A (ja) * 2007-03-28 2010-07-08 ザ チルドレンズ マーシー ホスピタル 少コピー数の核酸セグメントを同定および選択する方法

Similar Documents

Publication Publication Date Title
US20210108262A1 (en) Error suppression in sequenced dna fragments using redundant reads with unique molecular indices (umis)
US6303297B1 (en) Database for storage and analysis of full-length sequences
CN104903468B (zh) 用于帕金森氏病的新诊断MiRNA标志物
Tomiuk et al. Microarray probe selection strategies
CN103582887B (zh) 提供核苷酸序列数据的方法和测序装置
JP7054133B2 (ja) 配列解析方法、配列解析装置、参照配列の生成方法、参照配列生成装置、プログラム、および記録媒体
CN110997944A (zh) 用于检测brca1/2中的大片段重排方法和系统
KR20020075265A (ko) 임상 진단 서비스를 제공하는 방법
KR20200058457A (ko) 압축된 분자 태깅된 핵산 서열 데이터를 사용하여 융합을 검출하는 방법
US20020064792A1 (en) Database for storage and analysis of full-length sequences
JP7067896B2 (ja) 品質評価方法、品質評価装置、プログラム、および記録媒体
EP2923293A1 (en) Efficient comparison of polynucleotide sequences
Faccioli et al. From single genes to co-expression networks: extracting knowledge from barley functional genomics
Mussack et al. MIQE-compliant validation of microRNA biomarker signatures established by small RNA sequencing
JP2003052385A (ja) Dnaアレイ向けプローブ配列決定システム
JP5229895B2 (ja) 核酸標準物質
CN101457254A (zh) 肝癌预后
Akiyama et al. A set of external reference controls/probes that enable quality assurance between different microarray platforms
Fitzpatrick et al. Use of genomic DNA as an indirect reference for identifying gender-associated transcripts in morphologically identical, but chromosomally distinct, Schistosoma mansoni cercariae
US20200318175A1 (en) Methods for partner agnostic gene fusion detection
WO2011145614A1 (ja) 核酸標準物質検出用プローブの設計方法、核酸標準物質検出用プローブ及び当該核酸標準物質検出用プローブを有する核酸検出系
US20030194718A1 (en) Probing sequence determination system for DNA arrays
WO2017009718A1 (en) Automatic processing selection based on tagged genomic sequences
JP2004016070A (ja) オーソログ遺伝子発現分布測定用オリゴヌクレオチドアレイ
Lockhart et al. DNA arrays and gene expression analysis in the brain

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050830

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051027

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060328

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060419

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060425

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060515

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20060602

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20070906