核酸マイクロアレイ及び核酸プローブの設計方法並びに遺伝子検出方法 技術分野
本発明は、 検出対象の核酸ターゲットにハイブリダィズする核酸プローブを固 定した核酸マイクロアレイ (チップ)、核酸プローブの設計方法及び核酸ターゲッ トの調製方法並びに当該核酸マイクロアレイを用いた遺伝子検出方法に関する。
明 背景技術
書
所謂、 核酸マイクロアレイは、 基板上に複数のオリゴ核酸 (核酸プローブ) を 固定してなり、 当該オリゴ DNAと相補的な核酸ターゲットを検出することができ る。 なお、 本明細書において使用する用語 "核酸マイクロアレイ" は、 一般に使 用されている用語 " DNAアレイ"、 "DNAマイクロアレイ"、 "DNAマクロアレイ" 及 ぴ " DNAチップ"の総称を意味する。 よって、 本明細書において使用する用語 "核 酸マイクロアレイ" は、 半導体集積回路製造用のフォ トリソグラフィー技術を応 用した高密度 DNAァレイのみを意味するものではない。
核酸マイクロアレイとしては、 従来、 既知の遺伝子の発現レベルを検出するこ とを目的として、 当該既知の遺伝子由来の核酸ターゲットに特異的にハイブリダ ィズする核酸プローブを固定化したものが知られている。 この核酸マイクロアレ ィを用いた遺伝子検出方法では、 先ず、 ある生体試料から mRNA を抽出し、 当該 mRNA を鏡型とする逆転写反応により蛍光標識を取り込んだ核酸ターゲット群を 調製し、 次に、 調製した核酸ターゲット群を核酸マイクロアレイに接触させる。 このとき、 核酸ターゲット群に検出対象の遺伝子に由来する核酸ターゲットが含 まれていれば、 核酸マイクロアレイ上の核酸プローブと目的の核酸ターゲットと がハイブリダィズすることとなる。 よって、 核酸マイクロアレイ上の蛍光をスキ ヤンすることによって、 生体試料における検出対象の遺伝子に関して発現の有無 及び発現レベルを検出することができる。
一方、 近年、 凡用マイクロアレイシステム (Universal i croarray System) と
称される転写解析プラットホームが紹介されている (非特許文献 1 )。 この非特許 文献 1には、 6塩基長の領域を有し、 アデニン ( 、 グァニン (G)、 チミン (T) 及ぴシトシン (C) からなる塩基の全ての組合せ (46=4096) からなる 4096種類の 核酸プローブを固定化した核酸マイクロアレイが開示されている。 非特許文献 1 に開示された核酸マイクロアレイにおいて、 核酸プローブは、 基板に固定化する 末端側から順に、 C6アミノ酸修飾リンカー、 C18スぺーサー及び上記 6塩基長の 領域を有している。 また、 上記 6塩基長の領域は、 C18 スぺーサ一の端部と 7番 目の塩基 (C/T 混合) を介して結合されている。 なお、 この 7番目の塩基は C18 スぺーサ一と共有結合によって結合している。
以上のように構成された核酸マイクロアレイによれば、 遺伝子が未知であって も、 遺伝子の発現の有無や発現レベルを解析することができる。 ところが、 非特 許文献 1に開示された核酸マイクロアレイにおいては、 上記 6塩基長の領域のみ が核酸ターゲットとのハイプリダイズに寄与する。 核酸マイクロアレイにおいて 上記 6塩基長の領域には、 GC含量の高い配列もあれば、 CG含量の低い配列もある。 CG含量の相違は、 ハイブリダイズにおける Tm値 {·こ大きく影響することが知られ ている。したがって、非特許文献 1に開示された核酉変マイクロアレイにおいては、 上記 6塩基長の領域の Tm値の違いに起因するクロスハイプリダイゼーシヨ ンを 確実に防止することができない。 言い換えると、 特許文献 1に開示された DNA チップにおいては、 クロスハイブリダィゼーシヨンが生じるため、 未知或いは既 知の遺伝子を正確に検出することができないといった問題がある。
非特許文献 1 Nature Biotechnology, Vol . 22, No. 4, 418—426, 2004 発明の開示
そこで、 本発明は上述したような実状に鑑み、 クロスハイプリダイゼーシヨン を確実に防止し、 検出感度に優れた核酸マイクロアレイを提供することを B的と する。 また、 本発明は、 クロスハイブリダィゼーシヨ ンを確実に防止できる核酸 プローブの設計方法を提供することを目的とする。 さらに、 本発明は、 - クロスハ イブリダィゼーションを確実に防止できる核酸ターゲットの調製方法を提供する' ことを目的とする。 さらにまた、 本発明は、. クロスハイプリダイゼーシヨンを確
実に防止し、 検出感度に優れた遺伝子検出方法を提供することを目的とする。 上述した 0的を達成した本発明は、 以下を包含する。
(1) 基板と、
ハイブリダィズに寄与しない塩基配列からなる非相補領域と、 ハイブリダィズ に寄与する塩基配列からなり、 検出対象の核酸ターゲット群のうち特定の核酸タ ーゲットに対して特異的にハイブリダィズする選択領域及び検出対象の核酸ター ゲットが共通して有するリンカー配列の全部または一部に対して相補 ή勺な調節領 域からなる相補領域とを含み、 上記基板上に固定された複数の核酸プローブとを 備え、
上記調節領域の長さは、上記複数の核酸プローブにおける相補領域の Tm値を近 づけるように設計されたことを特徵とする核酸マイクロアレイ。
上記(1)の核酸マイクロアレイにおいて、上記複数の核酸プローブにおける相補 領域の Tm値はほぼ一定の範囲内であることが好ましい。 また、 上記(1)の核酸マ イクロアレイにおいて、 上記選択領域が n個の塩基からなり、 アデニン、 グァニ ン、 チミン及びシトシンの全ての組合せに相当する 4n種類の選択領域 有するこ とが好ましい。 さらに、 上記(1)の核酸マイクロアレイにおいて、 上記核酸プロ一 ブは、 上記調節領域が上記選択領域を挟み込み、 上記非相補領域が上 f己相補領域 を挟み込むように構成されたものであることが好ましい。 また、 上記調節領域が 上記選択領域を挟み込むように構成された核酸プローブにおいて、 上言己選択領域 の 3 ' 末端側に位置する調節領域の長さと、 上記選択領域の 5 ' 末端側に位置する 調節領域の長さとが異なっていてもよい。上記(1)の核酸マイクロアレイ において、 上記複数の核酸プローブは全て同じ長さであることが好ましレ、。上記(1) の核酸マ イクロアレイにおいて、 上記リンカ一配列は例えば、 配列番号 1記載の塩基配列 とすることができる。
また、 本発明は以下を包含する。
(2) 生体試料由来のユニーク配列と、他の核酸ターゲットと共通する リンカ一 配列とを含む核酸プローブに対してハイブリダイズする核酸プローブであって、 ハイブリダイズに寄与しない塩基配列からなる非相捕領域と、 ハイブリ ダイズに 寄与する塩基配列からなり、 上記ユニーク配列に特異的にハイプリダイズする選
択領域及び上記リンカー配列の全部または一部に対して相補的な調節領域からな る相補領域とを含む核酸プローブの塩基配列を設計する方法であって、
複数の核酸プローブにおける上記選択領域の塩基配列を、 各核酸プローブにお ける選択領域が異なる塩基配列を有するように設計する工程と、
異なる選択領域を有する複数の核酸プローブにおける、各相補領域の Tm値が近 づくように上記リンカ一配列の塩基配列及び上記調節領域の長さを設計する工程 とを含む核酸プローブの設計方法。
上記(2)の設計方法において、 上記選択領域の塩基配列を設計する工程では、 n 個の塩基からなる選択領域に対して、 アデニン、 グァニン、 チミン及ぴシトシン の全ての組合せに相当する 4"種類の塩基配列を設計し、 4 "種類の核酸プローブに おける相補領域の Tm値がほぼ一定の範囲になるように、調節領域の長さを核酸プ ローブ毎に決定することが好ましい。 また、上記(2)の設計方法において、 上記調 節領域の長さを設計する工程は、 複数の核酸プローブにおける各選択領域のグァ ニン及びシトシン含量 (GC含量) の偏りを評価する工程を含み、 選択領域の GC 含量に偏りがある場合には、 当該選択領域の 3 ' 末端側に設計する調節領域の長 さと、 当該選択領域の 5 ' 末端側に設計する調節領域の長さとを異ならせるよう に設計することもできる。
さらに、 本発明は以下を包含する。
(3) 生体試料由来のユニーク配列と、他の核酸ターゲットと共通するリンカ一 配列とを含む核酸ターゲットを含む溶液を、 ハイプリダイズに寄与しない塩基配 列からなる非相補領域と、 ハイプリダイズに寄与する塩基配列からなり、 上記ュ ニーク配列に特異的にハイプリダイズする選択領域及び上記リンカー配列の全部 または一部に対して相補的な調節領域からなる相補領域とを含む核酸プローブを 基板上に固定してなる核酸マイクロアレイに対して接触させる工程と、
上記核酸マイクロアレイの核酸プローブにハイブリダイズした核酸ターゲット を検出する工程とを含む遺伝子検出方法。
上記(3)の遺伝子検出方法において、上記複数の核酸プローブにおける相補領域 の Tm値はほぼ一定の範囲内であることが好ましい。 また、 上記(3)の遺伝子検出 方法において、 上記選択領塽が n個の塩基からなり、 アデニン、 グァニン、 チミ
ン及びシトシンの全ての組合せに相当する 4"種類の選択領域を有することが好 ましい。 さらに、 上記(3)の遺伝子検出方法において、 _h記核酸プローブは、 上記 調節領域が上記選択領域を挟み込み、 上記非相補領域力 S上記相捕領域を挾み込む ように構成されたものであることが好ましレ、。上記 (3)の遺伝子検出方法において、 上記複数の核酸プローブは全て同じ長さであることが好ましい。上記(3)の遺伝子 検出方法において、 上記リンカ一配列は例えば、 配列番号 1記載の塩基配列にお ける 25〜32番目の領域を除く塩基配列とすることができる。
本明細書は本願の優先権の基礎である日本国特許出願 2004- 278122号の明細書 および Zまたは図面に記載される内容を包含する。 図面の簡単な説明
図 1は、 本発明に係る核酸マイクロアレイを模式的に示す要部断面図である。 図 2は、 本発明に係る核酸マイクロアレイを模式的に示す斜視図である。
図 3は、 本発明に係る核酸マイクロアレイを模式的 ^こ示す要部断面図である。 図 4は、 核酸ターゲットの構成を模式的に示す構成図である。
図 5は、 本発明に係る核酸マイクロアレイを模式的に示す要部断面図である。 図 6は、 297 種類の核酸プローブにおけるハイブリタ、'ィズを核酸ターゲッ ト 1
0の蛍光標識から検出した結果を示す写真である。
図 7は、 本発明に係る核酸ターゲットの調製方法のフローチャートである。 図 8— 1は、 本発明に係る核酸ターゲットの調製方法を説明するための模式図 である。
図 8— 2は、 本発明に係る核酸ターゲットの調製方 を説明するための模式図 である。
図 9 A、 B及ぴ Cは、 実施例 1の実験結果。 全酵母の 0RFに由来するユニーク 配列のチップを用いコントロール酵母、 エタノールス卜レス酵母を用いた実施例 におけるスキヤン画像の一部とシグナル強度の散布図である。
図 1 0 A、 B及び Cは、 実施例 2の実験結果。 4 8信のユニーク配列のチップ を用いコントロール酵母、 エタノールストレス酵母を用いた実施例におけるスキ ヤン画像の一部とシグナル強度の散布図である。
発明を実施するための最良の形態
以下、 本発明を詳細に説明する。
本発明に係る核酸マイクロアレイは、 図 1に示すように、 基板 1と、 基板 1上 に種類毎に固定化された核酸プローブ 2とから構成され、 核酸プローブ 2の種類 毎に区画されたスポッ ト 3を有している。 スポッ ト 3は、 図 2に示すように、 基 板 1の一主面においてマトリックス状に配されている。
基板 1 としては、 核酸プローブを固定化できれば特に限定されず、 ガラス板及 び樹脂板等を使用することができる。 樹脂板としては、 ポリエチレン、 ポリプロ ピレン、 ポリスチレン、 ナイロン及びシリ コーン等のプラステイク板、 ニトロセ ルロース及びセルロースァセテ一ト等のセルロース板等を使用することができる, なお、 核酸プローブ 2の固定化方法によっては、 一主面に表面処理を施した基板 1を使用することもできる。 例えば、一主面をポリ L-リシンでコーティングした ガラス板を使用することができる。 また、 基板の形状は、 板状のものに限定した ものではなく、 球状のもの (ビーズ) などがある。
核酸プローブ 2は、 図 3に示すように、 ハイブリダィズに寄与しない塩基配列 からなる非相補領域 4と、 ハイブリダィズに寄与する塩基配列からなり、 核酸タ ーゲッ トに対して特異的にハイブリダィズする選択領域 5及ぴ検出対象の核酸タ ーゲッ トが共通して有するリンカー配列の全部または一部に対して相補的な調節 領域 6からなる相補領域 7とを含む。 また、 核酸プローブ 2は、 非相補領域 4及 び相補領域 7以外に、 基板 1 との間に配されるスぺーサー領域 8を有するような 構成であっても良い。
本発明に係る核酸マイクロアレイにおいて、 選択領域 5が n個の塩基からなる 場合、 アデニン、 グァニン、 チミン及びシトシンの全ての組合せに相当する 4Π種 類の選択領域 5を設計することができる。 すなわち、 核酸プローブ 2としては、
4"種類の選択領域 5に対応して 4 "種類を設計することができる。 一例として図 3 に示すように、 選択領域 5が 8塩基の長さからなる場合、 65536 通りの塩基配列 を設計することができ、 65536 通りの核酸プローブ 2を設計することができる。 なお、 選択領域の塩基長は 8個に限定されず、 如何なる数でもよい。 但し、 選択
領域 5が 5塩基長では 1024種類しか設計できないこととなり、核酸マイクロアレ ィを用いた遺伝子の発現解析には不十分であると考えられる。 一方、 選択領域 5 が 1 0塩基長では 1048576種類を設計することとなり、 ヒ トの遺伝子が約 32000 種類であると推定されていることからすると、約 90%の遺伝子を一意的に選択す ることができると考えられる。 したがって、 選択領域 5は、 6〜1 0塩基長であ ることが望ましい。 '
なお、 本発明に係る核酸マイクロアレイは、 核酸プローブ 2として、 選択領域 5の全ての組合せに相当する種類を有することが望ましいが、 必ずしも全ての組 合せに相当する種類を有していなくても良い。 例えば、 選択領域 5が 8塩基長か らなる場合、 65536 通りの核酸プローブ 2のうち 9 5 %、 好ましくは 9 7 %、 よ り好ましくは 9 9 %の核酸プローブ 2を有していれば、 核酸マイクロアレイとし ては、 優れた検出能で遺伝子発現解析を行うことができる。 より具体的に、 選択 領域 5が 8塩基長からなる場合、 選択領域 5が全てアデニンのみからなる核酸プ ローブ 2や、 他の核酸プローブ 2と比較して選択領域 5の末端 1塩基のみが相違 する核酸プローブ 2等を除いた、 核酸プローブ 2を有する核酸マイクロアレイで あっても、 優れた検出能で遺伝子発現解析を行うことができる。
また、 核酸プローブ 2に含まれる調節領域 6は、 詳細を後述する核酸ターゲッ トが共通して有するリンカー配列の全部または一部に対して相補的な塩基配列を 有している。 ここで、 核酸ターゲットの一例として、 図 4に示すように、 核酸タ ーゲッ ト 1 0を例示して説明する。 核酸ターゲッ ト 1 0は、 細胞や組織等の生体 試料から抽出した mRNAに由来するユニーク配列 1 1 と、ユニーク配列 1 1を挟み 込む第 1のリンカ一 1 2及び第 2のリンカ一 1 3 (まとめて単に 「リンカ一」 と 称する場合もある。) とを備えている。 核酸ターゲッ ト 1 0において、 ユニーク配 列 1 1は、 生体試料に由来する多種類の mRNAに由来しているため、 mRNAの種類 毎に異なる配列となる。 一方、 リンカ一配列は、 全ての核酸ターゲット 1 0にお いて共通する配列である。
リンカ一の塩基配列は、 特に限定されずいかなる配列であってもよい。 また、 リンカ一における GC含量は 35〜65%が好ましく、 40〜60%がより好ましく、 45
〜55°/。が最も好ましい。第 1のリンカー 1 2の一例としては配列番号 1の塩基配列、
第 2のリンカー 1 3の一例としては配列番号 2の塩基配列を挙げることができる。 リンカー配列としては、例えば、配列番号 1記載の塩基配列における 25〜32番目 の領域を除く塩基配列を例示することができる。 なお、 核酸ターゲッ トの調製方 法及びリンカ一の塩基配列設計方法については後述する。
調節領域 6は、 第 1のリンカー 1 2及び第 2のリンカー 1 3に相補的な塩基配 列からなり、 選択領域 5を挟み込むように分割されている。 すなわち、 調節領域 6の一方は第 1のリンカ一 1 2に相補的な塩基配列からなり、 調節領域 6の他方 は第 2のリンカ一 1 3に相補的な塩基配列からなる。
また、 図 5に示すように、 調節領域 6は異なる長さである場合がある。 すなわ ち、 調節領域 6は、 リンカ一の一部と相補的な塩基配列からなる場合がある。 本 発明に係る核酸マイクロアレイにおいては、 調節領域 6及び選択領域 5からなる 相補領域 7の Tm値が、 複数の核酸プローブ 2において、 近くなるように、 調節領 域 6の長さが決定されている。
仮に、 上述したように予め決定されている選択領域 5のみを核酸ターゲッ ト 1 0とハイブリダィズさせ、 核酸ターゲット 1 0のユニーク配列 1 1を検出するこ とを想定した場合、 各ハイブリダイズにおいて、 選択領域 5の塩基配列に応じて 異なる Tm値となる。一方で、核酸マイクロアレイは、各スポット 3を同一条件(温 度、 塩濃度、 pH等) で処理するため、 各スポッ ト 3におけるハイブリダィズを安 定して形成することができない。
これに対して、 本発明に係る核酸マイクロアレイにおいては、 調節領域 6の長 さを適宜調節して設計することで、 ハイブリダィズに寄与する相補領域 7の Tm 値を全ての核酸プローブ 2において近くすることができる。 これにより、 本発明 に係る核酸マイクロアレイによれば、 選択領域 5の塩基配列が異なる場合でも、 核酸プローブ 2と核酸ターゲッ ト 1 0とのハイプリダイズを安定して形成するこ とができ、 クロスハイブリダィゼーションを確実に防止することができる。
以下、 調節領域 6の長さを設計する方法について説明する。 調節領域 6の長さ を設計する際には、 先ず、 設計した複数の核酸プローブ 2における各選択領域 5 のグァニン及びシトシン含量 (GC含量) を算出する。 次に、 算出した GC含量に 基づいて、 GC 含量と最適な調節領域 6の長さとを関連付けたデータベースから、
各選択領域 5に最適な調節領域 6の長さを検索する。このデータベースによれば、 選択領域 5の GC含量が高い場合には調節領域 6の長さを短く設計し、選択領域 5 の GC含量が低い場合には調節領域 6の長さを長く設計すること となる。
ここで、 GC含量と最適な調節領域 6の長さとを関連付けたデータベースの作製 方法の一例を、 実験例とともに説明する。 本例では、 選択領域 5が 8塩基長、 す なわちユニーク配列 1が 8塩基長である場合を例示する。 本実験では、 表 1に 示す塩基配列を有する 1 1種類の核酸断片を合成し、これら核酸断片を铸型として T7RNAポリメラーゼを用いた RNA鎖合成反応を行い、 得られた RNA鎖を核酸ター ゲット 1 0としている。 なお、 得られた核酸ターゲット 1 0は、 蛍光標識 CTPを 用いた RNA鎖合成により蛍光標識されている。
表 1
名称 塩基配列 ユニーク酉己列 GC含量
GCOtarg CGGATGTTCGAATAATATTAGCTTGTAGCG ΑΤΑΑΓΑΤΤ 0/8
GCltarg CGGATGTTCGATATCATAAAGCTTGTAGCG TATCA.TAA 1/8
GC2targ CGGATGTTCGAAATCATGAAGCTTGTAGCG AATCA.TGA 2/8
GC3targ CGGATGTTCGAGTATGTTCAGCTTGTAGCG GTATG-TTC 3/8
GC4mmtarg CGGATGTTCGACGAAAGAGAGCTTGTAGCG CGAAA.GAG 4/8
GC4medtarg CGGATGTTCGATCATGCTGAGCTTGTAGCG TCATG-CTG 4/8
GC4maxtarg CGGATGTTCGATCCCCTTTAGCTTGTAGCG TCCCC TTT 4/8
GC5targ CGGATGTTCGACTGCAGGAAGCTTGTAGCG CTGCA.GGA 5/8
GC6targ CGGATGTTCGACAGGCTGCAGCTTGTAGCG CAGGCTGC 6/8
GC7targ CGGATGTTCGACGCAGGCCAGCTTGTAGCG CGCA&GCC 7/8
GC8targ CGGATGTTCGACGGCCCGCAGCTTGTAGCG CGGCCCGC 8/8 一方、 核酸プローブ 2としては、 表 1に示したユニーク配列に相補的な選択領 域 5を有し、 選択領域 5の両端にリンカーに相補的な 2〜10塩基の調節領域 6を 有するものを準備する。 すなわち、 上記 11種類のユニーク配列【こ対応する 1 1種 類の選択領域 5から選ばれる 1の選択領域 5について、 2〜10 基の調節領域 6 を有する 9種類の核酸プローブ 2を準備する。 よって、上記 11種類のユニーク配 列に対応する 11種類の選択領域 5について、 99種類の核酸プローブ 2を準備す
ることとなる。 さらに、 これら 99種類の核酸プローブ 2全てについて、 1塩基ミ スマッチを有する 2種類の核酸プローブ 2も準備する。 よって、上記 11 種類のュ ニーク配列に対応する 11種類の選択領域 5について、合計で 297種類 O核酸プロ ーブ 2を準備することとなる。
そして、 これら 297種類の核酸プローブ 2を固定した核酸マイクロ T"レイに上 記 11種類の核酸ターゲット 1 0を接触させ、核酸プローブ 2と核酸ターゲット 1 0 とのハイブリダイゼーションを行う。 ハイブリダイゼーションの条件は Buffer; 6xSSC+50%ホルムアミ ド、 25度である。 297種類の核酸プローブにおける ハイブリダィズを核酸ターゲット 1 0の蛍光標識から検出した結果を図 6に示す 図 6中、横軸は選択領域 5の GC含量を意味しており、縦軸は調節領 6の長さ を意味している。 例えば図 6中 「GC0」 は、 表 1中 GC含量 0/8のユニーク配列に 相補的な選択配列 5を有する核酸プローブの列を意味する。 図 6中 「GC4min」 は 表 1における 「GC4mintarg」 のユニーク配列に相補的な選択配列 5を有する核酸 プローブの列を意味し、 「GC4med」 は表 1における 「GC4medtarg」 のユニーク配列 に相補的な選択配列 5を有する核酸プローブの列を意味し、 「GC4max」は表 1にお ける 「GC4maxtarg」 のユニーク配列に相補的な選択配列 5を有する核酸プローブ の列を意味する。 「GC4min」、 「GC4med」 及び 「GC4max」 は、 選択領域 5 における GC含量が 4/8と同じ値である力 S、グァニンとシトシンの存在位置により異なる Tm 値を示すものである。 「GC4min」 は GC含量が 4/8であり、最も低い Tm値を示すも のであり、 「GC4max」 は GC含量が4 /8であり、 最も高い Tm値を示すものである。 「GC4med」 は GC含量が 4/8であり、 中間程度の Tm値を示すものである。
また、図 6中、所定の GC含量の核酸プローブを意味する列に 3つのスポッ トが あるが、 左側のスポットが核酸ターゲット 1 0と完全にマッチする核酸プローブ のスポッ トであり、 中心及ぴ右側のスポットは核酸ターゲット 1 0と 1塩基ミス マッチする核酸プローブのスポットである。
よって、 図 6中、所定の GC含量の選択配列 5を意味する列において、左側のス ポッ トが強く検出されるとともに中央及び右側のスポッ トが検出されない長さ
(縦軸) 、 当該 GC含量の選択配列 5にとつて最適であることが判明する。 図 6 に示したスポッ ト検出結果に基づいて、 完全マッチ核酸プローブの蛍光シグナル
を 1塩基ミスマッチ核酸プローブの蛍光シグナルで割って相対化した結果を表 2 に示す。
表 2
GC0 GC1 GC2 GC3 GC4min GC4med GC4max GC5 GC6 GC7 GC8
+ 表 2中、太枠で囲ったセルは、所定の GC含量の選択領域 5を有する完全マッチ 核酸プローブにおいて、 相対シグナルが最も高い値を示したセルを意味する。 ま た、影付きのセルは、太枠で囲ったセルの値より劣るが、所定の &C含量の選択領 城 5を有する完全マッチ核酸プローブにおいて、 相対シグナルが ヒ較的に優れた 値を示したセルを意味する。
図 6及び表 2に示した結果から、 8塩基長からなる選択領域 5に含まれる GC含 量と最適な調節領域 6の長さとを関連付けたデータベースを構築することができ る。 データベースは例えば表 3のように表すことができる。
表 3
- 11 - 差替え用紙(規則 26)
GC含量 調節領域の塩基長
0 9
1 8
2 7
3 6
4 6
5 5
6 5
7 4
8 4
表 3に示したデータベースを用いれば、 設計した複数の核酸プローブ 2におけ る 8塩基長からなる各選択領域 5の GC含量に基づいて、調節領域 6の長さを具体 的に設計することができる。 なお、 核酸プローブ 2における選択領域 5が 8塩基 長以外であっても同様にデータベースを構築し、 調節領域 6の長さを具体的に設 計することができる。
ところで、選択領竑 5における GC含量が同じ値であっても、 グァニンとシトシ ンの存在位置によっては大きく異なる Tm値を示す場合がある。例えば、選択領域 5における GC含量が 4の配列の組合せは、 17920種類あり、 Nearest- Neighbor 法 (RNA - DNA hybrid) にて Tm値を計算すると 25. 02〜57. 94という広がりを持つ ている。
したがって、 調節鎮域 6の長さを設計する方法においては、 上述したように、 選択領域 5の GC含量を算出した後、 算出した GC含量が同じである複数の選択領 域 5の全てについて Tm値を算出し、 Tm値の平均値よりも高い Tm値を示す選択領 域 5については調節煩域 6の長さを短く設計し、 Tm値の平均値よりも低い Tm値
を示す選択領域 5につレ、ては調節領域 6の長さを長く設計するように処理するこ とが好ましい。
ここで、 Tm値の算出方法としては、 特に限定されず公知の算出方法を適宜使用 することができる力 正孩性が高いと評価されている Nearest- Neighbor法で計算 することが好ましい。 Nearest-Neighbor法によれば Tm値は下記式により与えら れる。 .
[数 1 ]
Τπι=1000ΔΗ/ {-10.8+AS+R ln(Ct/4)} - 273.15+16.6 log10[Na+]
ここで、 ASはノヽイブリットにおける隣接ェントロビー変化の合計 (cal/mol · K) を意味し、 Δ H はノヽイブリ ッ トにおける隣接ェンタルピー変化の合計 (Kcal/raol) を意味し、 Rは気体定数 (1.987cal/deg · mol) を意味し、 Ctはオリ ゴの total mol濃度 (mol/1) を意味し、 Na+は Na+のモ^^濃度を意味する。 本例 では、 Ct=0.5 M、 [Na+] =50mMとして計算している。 また、 3及び八11は表4で 与えられる。
表 4
AH(Kcal/mol) AS{cal/mol-k)
AA -9.1 -24
AG -7.8 -20.8
AC -6.5 -17.3
AT - 8.6 -23.9
GA - 5.6 -13.5
GG -11 -26.6
GC -11.1 - 26.7
GT - 6.5 -17.3
TA - 6 - 16.9
TG - 5.8 - 12.9
TC -5.6 -13.5
TT -9.1 -24
CA -5.8 -12.9
CG -11.9 -27.8
CC -11 -26.6
CT -7.8 -20.8
例えば、 塩基配列 "AGCTATGC" の Tmは、 Nearest- Neighbor 法で以下のように 計算される。 まずこの塩基配列を隣接 2塩基ずつにすると、 "AG"、 "GC"、 "CT"、 "TA"、 "AT"、 "TG" 及び " GC" となる。 よって、 ΔΗ及び AS 以下のように算出 さ る。
ΔΗ=-7.8—11.1—7.8-6.0—8.6-5.8—11.1= - 58.2kcal/mol
AS=-20.8-26.7-20.8-16.9—23.9—12.9—26.7= 148.7cal/mol · k
これを上記式に代入すると Tm = 9.83°Cとなる。
このようにして、上記式及び表 3から選択領域 5の Tm値を算出することができ
る。 そして、 同じ GC含量である複数の選択領域 5の全 Tm f直から平均値 (中央値) を算出する。 その後、 各選択領域 5の Tm値と当該平均値 (中央値) とを比較し、 各選択領域 5の Tm値が平均値(中央値) よりも高い場合には調節領域 6の長さを 短く設計し、逆に低い場合には調節領域 6の長さを長く設 Ifする。より具体的に、 表 3に示した 8塩基長からなる選択領域 5に含まれる GC含量と最適な調節領域 6 の長さとを関連付けたデータベースは、 例えば、 表 5に示すようになる。
表 5
選択配列の
Tm値と中央値との比較 調節領域の長さ
GC含量
GCO Tm値中央値以下 9
GCO Tm値中央値以上 8
GC 1 Tm値中央値以下 8
GC 1 Tm値中央値以上 7
GC2 Tm値中央値以下 8
GC2 Tm値中央値以上 7
GC3 Tm値中央値以下 6
GC3 Tm値中央値以上 5
GC4 Tm値中央値以下 6
GZ4 Tm値中央値以上 5
GC5 Tm値中央値以下 5
GC5 Tm値中央値以上 4
GC6 Tm値中央値以下 4
GC6 Tm値中央値以上 3
GC7 Tm値中央値以下 4
GC7 Tm値中央値以上 3
GC8 Tm値中央値以下 4
GC8 Tm値中央値以上 3
5に示すデータベースを使用して調節領域の長さを設計することによって、
選択領域 5及び調節領域 6からなる相補領域の Tm値を、複数 核酸プローブ 2に おいてより近づけることができる。
以上のように、 調節領域 6の長さを設計することができる。 例えば、 選択領域 5の長さが 8塩基で、 選択領域 5の塩基配列として全ての組 せ (65536 通り) を設計した場合には、 第 1のリンカ一 1 2として配列番号 1における 1〜24番目 の塩基配列、第 2のリンカ一 1 3として配列番号 1における 33〜45番目の塩基配 列を例示することができる。
非相補領域 4は、 核酸ターゲット 1 0と相補鎖を形成しない塩基配列から構成 される。 非相補領域 4の塩基配列としては、 核酸ターゲット 1 0と相補鎖を形成 しなければ特に限定されない。 また、 非相補領域 4としては、 ターゲッ トのリン カー配列と同一の塩基になるように非相補領域を設定すれば、 最もハイプリ ッド 鎖を形成しにくいので、 より好ましい。
また、 調節領域 6の長さを設計する際には、 先ず、 核酸プローブ 2における各 選択領域 5の GC含量の偏りを評価する。 具体的には、 選択領域 5の中央から 3 ' 末端側の領域における GC含量と選択領域 5の中央から 5 '末端側の領域における GC含量とを比較して、 2倍以上の差がある場合には、 その選尺領域 5には GC含 量の偏りがあると評価する。 例えば、 選択領域 5の塩基配列が" GCGCATATA" であ る場合、 選択領域 5の中央から 3 ' 末端側の領域における GC含量が小さく、 選択 領域 5の中央から 5 ' 末端側の領域における GC含量が高くなつており、 この選択 領域 5に GC含量の偏りがあると評価する。
そして、 GC含量に偏りがあると評価された選択領域 5については、 GC含量が高 い側の調節領域 6の長さを短くするように設計する。 これによつて、 より GC含量 のバランスを考えた精密なハイプリダイゼーションを行うことも可能である。 一方、 上述したように設計された核酸プローブ 2は、 核酸合咸装置によって化 学的に合成することができる。 核酸合成装置としては、 DNA シンセサイザー、 全 自動核酸合成装置、核酸自動合成装置等と呼ばれる装置を使用することができる。 核酸プローブ 2を合成した後、 いわゆるスポッター装置を用いて、 基板 1上に核 酸プローブ 2を固定化することができる。 本発明に係る核酸マイクロアレイにお いては、 基板 1上への核酸プローブ 2の固定化には何ら限定されないため、 従来
公知のスポッター装置いずれも使用することができる。 ここで、 核酸プローブの 固定化密度は、 スポッター装置の性能に依存して適宜調節することができる。 例 えば、 1インチ X 3インチ (25mm X 75mm) のスライ ドガラス型の基板 1上に数百万 個のスポッ ト 3を配置することができる。
例えば、 上述したように、 選択領域 5を 8塩基長とした場合には 65536種類の 核酸プローブ 2を合成し、 各核酸プローブ 2に対して 65536個のスポッ ト 3が必 要となる。 1枚の基板 1上にこれら全てのスポッ ト 3を形成できない場合には、 複数枚の基板 1を用いて全てのスポッ ト 3を形成すればよい。 すなわち、 選択領 域 5の全ての組合せは、 複数の核酸マイクロアレイのうちいずれか 1の核酸マイ クロアレイに含まれていることとなる。 この場合には、 全てのスポッ ト 3が形成 された複数の核酸マイクロアレイを核酸マイクロアレイセッ トとして、 一連の遺 伝子解析試験に使用することができる。 ·
次に、 上述した核酸マイクロアレイに使用される核酸ターゲッ トの調製方法に ついて、 図 7に示すフローチャートを参照して説明する。 また、 核酸ターゲッ ト の調製方法を図 8— 1及び図 8— 2に模式的に示す。
先ずステップ 1 (図 7において 「S1」 と表記する。 以下のステップも同様に表 記する。) において、 生体試料から解析対象を抽出する。
生体試料としては、 例えば特定の疾患に罹患している患者から採取したヒ ト細 胞、 特定の条件下に置かれた生体由来の細胞、 ゲノムのシーケンスが未知な生体 由来の細胞、 及び、 これら細胞に対する対照となる細胞を挙げることができる。 対象とする生物は真核生物のみならず原核生物も含めたすべての生物となる。 生 体試料としては、 何ら限定されるものではない。
解析対象は生体試料に含まれる核酸である。 これには DNAと RNAが含まれる。 DNAにはゲノム DNAゃミ トコンドリァといった細胞小器官がもつ DNA等が含まれ、 何ら限定されるものではない。 また、 RNAには mRNAや tRNA、 リボソーム RNAや miRNA 等がすべて含まれるものであり、 機能上の分類には何ら制約されるもので はない。
生体試料から解析対象を抽出する手法としては、 何ら限定されず、 公知の手法 を使用することができる。例えば解析対象を mRNAとした場合、抽出方法としては
グ ァ ニ ジ ン 一 塩 ィ匕 セ シ ウ ム 超 遠 心 法 、 AGPC 法 ( Acid guanid inium- Phenol- Chloroform法)、 ISOGEN法 (RNA抽出用キッ ト、 二ツボンジ ーン社製) 等を挙げることができる。 RNA試料にはリボソーム RNAが多量に含ま れるが、 これが解析対象でない場合には除去することが望ましい。 この場合、 生 体試料が真核生物のものであれば Ol igotex- dT30 (第一化学薬品社製) や Dynabeads 01 igo (dT) 25 (DYNAL社製) を使用した poly (A) RNA精製法等を挙げる ことができる。 生体試料が原核生物由来であれば、 MICROBExpress (Ambion社製) 等を使用した精製法が挙げることができる。
なお、 以下においては、 一例として、 生体試料が真核生物であり、 解析対象を mRNA とする場合を説明する。 しかしながら、本発明では、 DNAや、 mRNA以外の RNA を含む核酸を解析対象とすることができる。 特に、 生体試料が原核生物である場 合には、 解析対象としてトータル RNAを抽出することとなる。 生体試料が原核生 物である場合には、以下の説明において mRNAがトータル RNAとなる以外は、 同様 な工程を採ることができる。
次に、 ステップ 2において、 抽出した mRNAを逆転写酵素にて cDNAにし、 さら に DNAポリメラーゼ等を用いて二本鎖の DNAにする。 この二本鎖 DNAを第 1の制 限酵素で処理し、 この断片の一方端部は制限酵素認識配列となる。 ここで、 ステ ップ 1で抽出した mRNAの一方端部 (例えば、 3 ' 末端側の端部) を、 第 1の制限 酵素処理に先立って担体に付着させておく ことが好ましいが、 逆転写後の cDNA の一方端部 (例えば、 3 ' 末端側の端部) あるいは二本鎖合成後の cDNAの一方端 部 (例えば、 3 ' 末端側の端部)、 第一の制限酵素処理後の断片における一方端部 (例えば、 3 ' 末端側の端部) を担体に付着させても今後の処理上、 同様の効果 を得ることができる。 ステップ 1で抽出した核酸の一方端部を担体に付着させて おくことによって、 その後の操作において、 一方端部側の核酸断片を容易に分離 することができる。 担体としては、 特に限定されないが、 例えば、 ストレブトァ ビジンビーズ、 磁性ビーズ等を使用することができる。
ステップ 2において使用する第 1の制限酵素としては、 4塩基を認識配列とす る制限酵素を使用することが好ましい。 4塩基を認識配列とする制限酵素は、 認 識配列の出現頻度が 5塩基以上を認識とする制限酵素より高いため、 より多くの
種類の核酸ターゲッ トを準備することが可能となり、 より詳細な遺伝子発現解析 を行うことができる。 第 1の制限酵素としては、 特に限定されないが、 Taql (T i CGA)、 Nlal l l (CATG | )、 Mbol ( i GATC)、 Alul (AG I CT)、 Rsal (GT I AC)、 Msel (T J, TAA) , Mspl (C i CGG) , Acil (C | CGC) などがある。 また、 第 1の制限酵素を複 数種類用いても構わない。
また、 望ましくはステップ 2において、 担体に付着した mRNA断片を除く mRNA 断片を除去する。 あるいは担体に付着した二本鎖合成後の cDNA断片を除く、核酸 の断片、 例えば、 第 1の制限酵素による処理を行った後、 担体を回収し、 回収し た担体を洗浄液で洗浄することによって、 担体に付着した二本鎖合成後の cDNA 断片を除く、 核酸の断片を除去することができる。
次に、 ステップ 3において、 一方端部に第 1の制限酵素認識配列を有する cDNA 断片に対して、 第 1のリンカ一 1 2を結合 (ライゲーション) する。 ここで、 第 1のリンカ一 1 2は、 上述したように、 一方端に第 1の制限酵素認識配列、 中途 部に Typells制限酵素の認識配列を有するように設計した後、 核酸合成装置によ つて合成して準備しておくことができる。 本ステップ 3によって、 一方端部に第 1のリンカー 1 2を結合した cDNA断片が作製されることとなる。 なお、 ステップ 2において担体を使用した場合には、 mRNAにおける担体を付着した端部とは反対 側の端部に第 1のリンカー 1· 2を結合した cDNA断片が作製されることとなる。 次に、 ステップ 4においては、 ステップ 3で作製した第 1のリンカ一 1 2を有 する cDNA断片を、 Typells制限酵素により切断する。 第 1のリンカ一 1 2には所 定の位置に Typells制限酵素の認識配列が存在するため、 Typells制限酵素で処 理すると、 生体試料由来の mRNAに由来する cDNAが所定の位置で切断されること となる。 ここで、 Typells 制限酵素とは、 認識配列の外側の数塩基〜~ H数塩基の 位置を切断する制限酵素であり、例えば、 FokI (GGATG 9/13)、 MboII (GAAGA 8/7)、
BsmFI (GGGAC 10/14)などがある。 また、 同様に離れたところ切断する TypellGの 制限酵素である Mmel (TCCRAC 20/18)、 Bsgl (GTGCAG 16/14) なども使用するこ とができる。認識部位から一定の長さ離れた箇所を切断できる制限酵素であれば、 限定してものではない。
また、 ステップ 4では、 第 1のリンカー 1 2を有する mRNA断片を除いて、 担体
に付着した cDNAを含む cDNA断片を除去する。 例えば、 Typells制限酵素処理を 行った後の溶液から、 担体を回収することによって、 第 1のリンカ一 1 2を有す る cDNA断片以外の cDNA断片を除去することができる。
さらに、 ステップ 4では、 Typel ls 制限酵素により切断された部分が突出 端 となる場合には平滑化処理を行う。 平滑化処理としては、 公知の手法を使用する ことができるが、 例えば、 3'末端の突出が生じる場合には Klenow fragmentを用 いた平滑化処理、 また 5'末端の突出が生じる場合には T4 DNA polymeraseを月い て突出部分を削ることで平滑化する方法を使用することができる。
次に、 ステップ 5において、 平滑化した末端に対して第 2のリンカ一 1 3を結 合 (ライゲーシヨン) する。 ここで、 第 2のリンカ一 1 3には、 調節領域 6 に対 応する塩基配列の他にプロモータ領域が結合していてもよい。 プロモータ領: t或と しては、 特に限定されないが、 T7 RNAプロモータを使用することができる。 この ステップ 5によって、 第 1のリンカー 1 2、生体試料由来の cDNAの一部 (生ィ本試 料由来のユニーク配列 1 1 )、第2のリンカー1 3及びプロモータ領域を含む核酸 断片を合成することができる。 この核酸断片において、 ユニーク配列 1 1は: 斤 対象の細胞における遺伝子に由来する配列であり、 第 1のリンカ一 1 2及び第 2 のリンカ一 1 3はユニーク配列 1 1の種類に拘わらず共通する配列である。おた、 ユニーク配列 1 1は、解析対象の細胞における遺伝子の発現の有無及び/又は 現 レベルを反映している。
次に、 ステップ 6では、 第 2のリンカ一 1 3に結合したプロモータ領域を禾 J用 して、 蛍光標識 RNA鎖を合成する。 具体的には、 ステップ 5で得られた第 1のリ ンカー 1 2、 生体試料由来のユニーク配列 1 1及ぴ第 2のリンカー 1 3から よる 核酸断片を铸型とし、 リボヌクレオチド、 蛍光標識リボヌクレオチド及び RKTAポ リメラーゼを含む溶液中で RNA鎖を合成 (転写反応) する。 これにより、 スラッ プ 5で得られた核酸断片の一方の差に相補的で、 蛍光標識された RNA鎖を得るこ とができる。 すなわち、 本ステップ 6によって、 第 1のリンカ一 1 2、 ユニーク 配列 1 1及び第 2のリンカ一 1からなる核酸タ一ゲット 1 0が蛍光標識 RNA と して合成されることとなる。
ここで、 蛍光標識ヌクレオチドとしては、 一般的に使用されている、 Cy3— UTP
或レ、は Cy5 - UTPを使用することができる。 例えば、 Cy3-UTPを使用して解す斤対象 の糸 胞由来の蛍光標識 RNA断片を合成し、 Cy5- UTPを使用して対照となる糸 01胞由 来の蛍光標識 RNA断片を合成することもできる。 ただし、 蛍光は Cy3や Cy5に限 定したものではなく、 蛍光標識ヌクレオチドは、 UTP だけではなく、 ATP、 GTP、 CTPでも構わない。 あるいは複数種類の標識リボヌクレオチを用いても構わなレ、。 上述したように、 核酸ターゲット 1 0を蛍光標識 RNA鎖とすることによって、 収 量の増加及びシグナルの改善を達成することができる。
または、 蛍光標識リボヌクレオチドを用いずに未標識リボヌクレオチドまたは ビ才チン標識、 アミノアリル標識リボヌタレチドを用いて RNAを合成し、 合成後 にィ匕学反応、 酵素反応等によって蛍光を標識し核酸ターゲッ トとしても い。 Lab el i t™などの核酸標識キットを使えば可能である。
以上で説明した核酸ターゲット 1 0の調製方法では、 ステップ 6において合成 した蛍光標識 RNA鎖を核酸ターゲット 1 0とする例である。 しかしながら、 ステ ップ 6において蛍光標識 DNA鎖を合成して、 得られた蛍光標識 DNA鎖を核酸ター ゲット 1 0としてもよい。
また、 ステップ 5において得られた核酸断片のうち一方の鎖を核酸ターゲット 1 Oとして使用することもできる。 この場合、 予め蛍光標識ヌクレオチドを含有 するように第 1のリンカー 1 2及び/又は第 2のリンカー 1 3を調製しておく。そ して、 ステップ 5で得られた核酸断片を熱処理によって一本鎖とし、 得ら た一 本鎖の核酸断片を核酸ターゲット 1 0として使用することができる。
一方、 本発明に係る遺伝子検出方法は、 核酸ターゲット 1 0を含む溶液を、 核 酸プローブ 2を有する核酸マイクロアレイに対して接触させる工程と、 そ O後、 核酸マイクロアレイの核酸プローブ 2にハイブリダィズした核酸ターゲッ卜 1 0 を検出する工程とを含む。 ここで遺伝子検出方法とは、 遺伝子の発現の有無を検 出する方法、 遺伝子の発現レベルを解析する方法、 遺伝子の発現変化を解す斤する 方法等を含む包括的な意味である。 また、 遺伝子としては、機能及び/又は:^基配 列が既知の遺伝子に限定されず、機能及び/又は塩基配列が未知の遺伝子を含む意 味である。
また、 本遺伝子検出方法は、 如何なる生物由来の遺伝子を検出対象とす こと
ができる。 言い換えると、 遺伝子検出方法においては、 上述した核酸マイクロア レイを用いることによって、 生物種を何ら限定することなく、 如何なる生物由来 の遺伝子を検出対象とすることができる。
本発明に係る遺伝子検出方法では、 例えば、 ある生物種の 2つの状態における 遺伝子の発現レベルを比較するといつた遺伝子発現解析を行うことができる。 生 物種の 2つの状態としてま、例えば、ヒ ト健常者と及び所定の疾患を患った患者、 癌細胞及ぴ正常細胞、 所定の条件下にある細胞及び当該条件下にない細胞等を挙 げることができる。
具体的には、 各状態にある生物種から核酸ターゲット 1 0をそれぞれ、 上述し たように調製する。このと き、各核酸ターゲット 1 0は、互いに異なる蛍光標識、 例えば Cy3及び Cy5をそ ぞれ有するように調製される。 そして、 これら 2種類 の核酸ターゲッ ト 1 0を含む溶液を核酸マイクロアレイに接触させて、 核酸プロ ーブ 2に対して 2種類の核酸ターゲット 2がいわゆる競合的ハイブリダィゼーシ ョンする条件下におく。
特に、 本発明に係る核酸マイクロアレイにおいては、 核酸ターゲット 1 0とハ イブリダイズする核酸プローブ 2の相補領域 7の Tm値が、複数の核酸プローブ 2 において近くなるように構成されている。 したがって、 核酸プローブ 2に対して 2種類の核酸ターゲット 2をハイプリダズする際に、 クロスハイブリダィゼーシ ヨンを確実に防止することができる。 これにより、 本遺伝子検出方法によれば、 生物種の 2つの状態における遺伝子の発現レベルを正確に比較することができる。 以下、 実施例を用いて本発明をより詳細に説明するが、 本発明の技術的範囲は 以下の実施例に限定されるものではなレ、。
〔実施例 1〕
本実施例では、 全酵母遺伝子のゲノムデータベースから全 0RF (オープン ' リ ーデイング ' フレーム) ίこ関してユニーク配列を検索し、 当該ユニーク配列と相 補的な塩基配列からなる選択領域を有する核酸プ口一ブを設計した。 本実施例で は、 作製した核酸マイクロアレイを用いて、 酵母におけるエタノールス トレス下 での遺伝子発現解析を行った。 .
先ず、 酵母の全ての 0RFデータベースから、 0RF内に存在する制限酵素 Taqlの
認識配列(TCGA)の中で最も 3 ' 側にある認識配列の場所、 その場所から 3 ' 側の 8 塩基 (認識部位を含むと 12 基、 ユニーク配列に相当する) を、 コンピューター を用いて集計し、 酵母のユニーク配列データベースを作成した。 すなわち、 酵母 のユニーク配列データベース こは、制限酵素 Taqlの認識配列(TCGA)と、 当該認識 配列に続く 8塩基とからなる、 計 1 2塩基のユニーク配列が含まれている。
また、 0RF内に Taql認識酉己列がない遺伝子については、 3 ' UTR (0RFの 3 ' 側 の非翻訳領域) 200bp以内に Taq I認識配列があるものについてはこれらもタグ として、 ユニーク配列データベースに格納した。 ユニーク配列の集計は、 独自に プロダラミングしたユニーク酉己列設計プロダラミングである。 このプロダラミン グは、 指定した制 ^酵素 (今回は Taql) をもとに 0RF の塩基配歹 IJを切断し、 0RF 内の認識配列のうち最も 3' 倜に位置する認識配列を検索し、 検索された認識配 列から所定の塩基数 (今回は 8塩基) を塩基配列から抜き出し、 データとして格 納する基本プログミグからなり、 一度に数万個の配列を処理が可 で、 得られた データを市販のデータベースソフ トで処理を行った。 0RF内に Ta q I認識部位が ない 910遺伝子のうち、 355遺伝子については 3 'UTRの 200bp以内に Taq I認ヽ識 部位があり、 これらがタグである可能性もあることから、 今回のチップに加える こととした。 実際には、 タグ酉己列に重複があるため、 今回のチップには、 5335種 類のタグ配列 (6120遺伝子に相当) を配置した。
次に、 ユニーク配列データベースから、 独自に作成したプローブ設計プロダラ ミングによってプローブの設言十を行った。 このプロダラミングはユニーク配列か ら、 配列中の GC含量を計算し、 GC含量ごとに、 表 3に従いユニーク配列ごとに 調節領域の長さを決定すると同時に非調節領域の長さ、 全体の配歹 IJの設計、 調節 領域 +ユニーク配列の Tm値の計算も同時に設計する。これをもとにプロ一ブ配列 データベースを作成した。 次に、 プローブ配列データベースの配列全てを核酸自動合成機にて合成オリゴ ヌクレオチドを作成し、これらの全てを 1枚のスライドグラス上にスポッ トした。 スポットの方法は、 アジレン ト社によるインクジエツト方式にて行った。
一方、 核酸ターゲットを調製するため、 酵母は何も刺激を与えないコントロー ル酵母とエタノールス トレス酵母を用いた。 エタノールス トレスは対数増幅期に
ある酵母をエタノール濃度 7%下で 30分曝露する条件を加えた。 各々の酵母を遠 心分離し回収し、 ホットフエノーノレ法にて RNAを分離した。 得られた RNAをオリ ゴ dTダイナビーズにて mRNAを回収した後、 ク口ンテック社の smar t cDNA合成キ ッ トにて 3 ' ピオチン化 cDNAの合成を行い、 制限酵素 Taqlで切断を行った。 切 断後ス トレブトアビジン磁気ビーズを加え、 3 ' ビォチン化断片を回収した。 第 1 のリンカーをライゲーションし、 Typells制限酵素 Foklにて処理し、 第 1のリン カーと mRNA由来の配列 (ユニーク配列) を含む断片が得られ、 その断片を平滑末 端化した後、 第 2のリンカ一をライゲーシヨンする。 第 1のリンカ一と第 2のリ ンカーをライゲーシヨンした産物 (タグ) をリンカー上に配置したプライマーを 用いた PCR反応にて増幅し、 ポリアクリルアミ ドゲルに電気泳動し、 タグのサイ ズの確認及ぴタグに相当するバン ドを切り出し、 精製を行う。 次に、 この精製し た断片を鎵型に T7 RNAポリメラーゼを用いた in vitro transcription反応を行 う。 この反応は ambion社の RNA合成キット (Megascript™) を用いて行った。 合 成時に、 Cy3及び Cy5標識 UTPを朱標識 UTPの 1/3モル量加えるこ と蛍光標識を 行った。 合成した蛍光標識 RNAは、 カラムを用いて精製し、 チップへのハイブリ ダイゼーシヨンに用レ、た。
次に、 作成した蛍光標識 RNAの濃度を測定し、 それぞれ 1 n mol を 50 μ 1 のハ ィプリダイゼーションバッファー tこ溶角?した。 ハイプリダイゼーシ ヨンのパッフ ァ一は最終濃度が、 6 X SSC、 50°/。ホルムアミ ドの濃度からなる。 70 度で 5分熱変 性後、室温になったのち、 DNAチップ上に 50 μ 1 のこの蛍光標識 RNA溶液を加え、 力パーグラスをかけた。 密封でき るハイブリダィゼーシヨンチャンバ一内に DNA チップを静置し、 25度、 16時間、 ノ、イブリダィゼーシヨンを行った。 16時間後、 DNAチップを 2xSSC + 0. 2%SDS溶 ί 、 室温、 洗浄 15分、 次いで 0. 2x SSC + 0. 2%SDS 溶液、 室温、 洗浄 15分、 次いで O. 2xSSC + 0. 2%SDS溶液、 37度、 洗浄 15分、 次 いで、 0. 2xSSC、 室温、 洗浄 4分 ί亍つた。 DNAチップを遠心し、 水分を飛ばして乾 燥後、 フジフィルムの DNAチップスキャナーで観察を行った。
次に、 フジフィルムの DNAチップスキャナ一にてチップのスキヤ ンを つた。 取り込んだ画像は、 16ビッ トの TIFF画像に変換し、 DNAチップ解折ソフ トにて、 シグナルの数値化を行った。 DNA チップ解析ソフ トは米国スタンフォード大学の
Michael Ei senの開発した Scan Alyzeを用いた。 得られたデータは標準化を行い total intens i ty法にて行った。 Total intens i ty法は、 比較対象となる 2群間の 遺伝子について、 半分が発現上昇し、 半分が発現低下するとィ反定して標準化を行 う。 標準化を行った後、 コントロール群とエタノールス トレス群とで、 シグナル の比をもって、 遺伝子発現の比とした。 3 倍以上遺伝子が変 1¾したものを変動し ていると評価した。 (図 9 A、 B及び Cに結果を示す。)
その結果、 エタノールストレスに応答して発現が特異的に変化する約 2 0 0個 の遺伝子を同定することができた。 エタノールス トレスに応答して発現が特異的 に上昇した遺伝子のなかでこれまでの報告と合致した遺伝子を表 6に示す。
表 6
ユニーク S列 ORF Name Functionl Functions Log2(Cy5/Cy3) 変動
TTCCATTG Y R093W PTR2 transport 1.64 EtOH UP
ATGGGCAC YHL024W 匪 4 molecular— function unknown 1.61 EtOH UP
TGCATTAT YDR406W PDR15 1.42 EtOH UP
CCTTCTAA YJL089W SIP4 transcription factor 1.30 EtOH UP
SRP-dependent, co-translational
CAGCAGAC YOL031C membrane targeting, molecular_function unknown 1.21 EtOH UP translocation*
CAGCATTG YJL016W biological_process unknown molecular_function unknown 1.10 EtOH UP
CAGGCAGT YOL083W biological_process unknown molecular_fu notion unknown 1.10 EtOH UP
TTGACTTC YOL157C bio]ogical— process unknown 0.97 EtOH UP
ATGACATC YOR173W biological_process unknown raolecular_function unknown 0.97 EtOH UP
AGGCGTAT YMR007W biological_process unknown molecular— function unknown 0.95 EtOH UP
TAGATTCC YLR177W biological— process unknown molecular— firaction unknown 0.91 EtOH UP
CAC2VAATG YDR490C PKH1 biological_process unknown 0.88 EtOH UP
AAAAGAAG YJR059W PTK2 polyamine transport 0.85 EtOH UP
TTCCTCAA YIR014W biological_process unknown mokcular一 function unknown 0.77 EtOH UP
TCCTGTCA YLE022C biological_process unknown molscular一 function unknown 0.76 EtOH UP
GGCCAAAT YML070W DAK1 glycerone kinase 0.74 EtOH UP
TAAAGAAT YNL009W IDP3 fatty acid beta-oxidation* isocitrate dehydrogenase (NADP+) 0.59 EtOH UP
ATTGTATG YML029W USA1 biological_process unknown molecular_function unknown 0.58 EtOH UP
ATTTATCA YDR518W EUG1 protein disulfide isomerase 0.57 EtOH UP
TCTACGAC YMR169C ALD3 stress response aldehyde dehydrogenase 0.48 EtOH UP
ATACTATC YDRrilGC biological— process unknown molecular— fonction unknown 0.46 EtOH UP
エタノールストレスに応答して発現が特異的に低下した遺伝子のなかでこれま での報告と合致した遺伝子を表 7に示す。
表 7
unique O F Name Ftmctionl Function^ Log2(Cy5/Cy3) 変動
TGACTCTG YGR200C ELP2 transcription -0.97262305 EtOH Down
TAGAGGCA YKL172W EBP2 rRNA processing molecular— function unknown -0.968914568 EtOH Down
AAAAAAAT YCR016W biological_pToc;ess unknown molecular— function unknown -0.960858881 EtOH Down
ATAAAAAA YHR066W SSFl molecular一 function unknown -0.889779389 EtOH Down
ATAAAAAA YHR066W SSFl molecular_function unknown -0.889779389 EtOH Down
TGTCGGTG YLR441C RPS1A protein biosynthesis structural protein of ribosome -0.773682847 EtOH Down
TAAATAAA YGR085C RPL11B protein biosynthesis* structural protein of ribosome ■0.714987695 EtOH Down
TAAATAAA YGR085C RPL11B protein biosynthesis* structural protein of ribosome •0.714987695 EtOH Down
TGCTTTCG YOR146W biological_proeess unknown raolecular_function unknown •0.630784571 EtOH Down
TTTTTTCT YLR198C biologicaljirocess unknown molecular— function unknown •0.548967183 EtOH Down
CAAGTCTG YPE.112C MRD1 biological_process unknown molecular_fanction unknown •0.436093122 EtOH Down
ATCTGATG YMR260C TIF11 protein synthesis initiation translation initiation factor -0.416561633 EtOH Down
また、 これまで報告されたエタノールス トレス応答性遺伝子とは合致しなかつ たが、 エタノールス トレスに対して発現量が有意に変化した遺伝子のユニーク配 列を表 8に示す。
表 8 unique Log2(Cy5/Cy3) unique Log2(Cy5/Cy3)
GAAGCAAA 8.79 CTCTGTAC 3.18
CAAGTAAT 8.07 AGTAGCAC 2.95
CGAATAAA 7.92 ACCAACGC 2.93
AATACTCC 7.47 ACGGGGCT 9.71
AATTACCA 7.33 GCAGGTGC 7.74
TACACTCA 7.09 GCCTTGCT 6.87
AGCTGTGA 4.04 CTCGTCCT 6.20
ACGACCTT 3.86 TCCCATGC 6.04
TTTGTAGG 3.29 TTACCGGG 6.03
ACATGCTC 3.18 CCCTATCG 5.98
表 8に示したユニーク配列を有する遺伝子は、 エタノールス トレス応答性遺伝 子としては報告されていないが、 新規なエタノールス トレス応答性遺伝子の候補 となり うる。 表 8に示したユニーク配列をプローブとして、 当該ユニーク配列を 有する遺伝子を同定することができる。 同定した遺伝子は、 遺伝子の機能解析実 験に供されることで、 その機能を詳細に解析することができる。
〔実施例 2〕
本実施例では、 8塩基長の選択領域を有する核酸プローブを、 全ての組合せに ついて設計し、 65536 種類の核酸プローブを固定した核酸マイクロアレイを作製 した。
プローブの設計
4 8種類 (65536種類) のユニーク配列をコンピューター用いて準備し、 各ュニ ーク配列ごとに GC含量を計算し、 表 3に従い、 調節領域の長さ (リンカ一長)、
非調節領域の長さを決定し、 プローブの配列を設計した。 これらはすべて独自に 設計したプログミングに基づくプローブ設計ソフトを用いて行った。 プローブ設 計時に各配列の Tm値も計算した。
チップの設計
Tm値が小さい順に、 チップ上に配置するように設計した。 今回のチップは 1枚 に 22000スポッ トしか配置できないため、 3枚のチップを用い、 Tm値の順に配置 した。 これらの配置に関するプログラムも設計し、 チップ上のユニーク配列とス ポッ トの場所 (座標)、 対象としている生物 (今回の実験では酵母) のユニーク配 列、 遺伝子、 機能などの情幸! ¾を有機的に結びつけるデータベースも同時に作成し た。
酵母からのターゲッ ト作成
酵母は何も刺激を与えないコントロール酵母とエタノールス トレス酵母を用い た。
エタノールストレスは対数増幅期にある酵母をエタノール濃度 7%下で 30分曝露 する条件を加えた。各々の酵母を遠心分離し回収し、ホッ トフヱノール法にて RNA を分離した。 得られた RNAをオリゴ dTダイナビーズにて mRNAを回収した後、 ク ロンテック社の smart cDNA合成キッ トにて 3 ' ビォチンィ匕 cDNAの合成を行い、 制限酵素 Taqlで切断を行った。切断後ストレプトアビジン磁気ビーズを加え、 3 ' ビォチン化断片を回収した。 第一リンカ一をライゲーシヨンし、 Typells 制限酵 素 Foklにて処理し、 第 1のリンカ一と mRNA由来の配列 (ユニーク配列) を含む 断片が得られ、 その断片を平滑末端化した後、 第 2のリンカ一をライゲーシヨン した。 第 1のリンカ一と第 2 のリンカーをライゲーションした産物 (タグ) をリ ンカー上に配置したプライマーを用いた PCR反応にて増幅し、 ポリアクリルアミ ドゲルに電気泳動し、タグのサイズの確認及びタグに相当するバンドを切り出し、 精製を行った。
次に、 この精製した断片を鎳型に T7 RNA ポリメラーゼを用いた in vitro transcript ion反応を行う。この反応は ambion社の RNA合成キッ 卜 (Megascript™) を用いて行った。 合成時に、 Cy3及び Cy5標識 UTPを未標識 UTPの 1/3モル量加 えることで蛍光標識を行った。合成した蛍光標識 RNAは、カラムを用いて精製し、
チップへのハイブリダイゼーションに用いた。
チップを用いたハイブリ実験の手順
作成した蛍光標識 RNAの濃度を測定し、 それぞれ 1 n mo lを 50 1のハイブリ ダイゼーションバッファ一に溶角军した。 ハイブリダイゼーションのバッファーは 最終濃度が、 6 X SSC、 50%ホルムアミ ドの濃度からなる。 70度で 5分熱変性後、 室温になったのち、 DNAチップ上に 50 1 のこの蛍光標識 RNA溶液を加え、 カバ 一グラスをかけた。 密封できるハイブリダイゼーションチヤンノく一内に DMAチッ プを静置し、 25 度、 16 時間、 ハイブリダィゼーシヨンを行う。 16 時間後、 DNA チップを 2xSSC + 0. 2%SDS溶液、室温、洗浄 15分、次いで 0. 2xSSC + 0. 2%SDS溶液、 室温、 洗浄 15分、 次いで 0. 2xSSC + 0. 2%SDS溶液、 37度、 洗浄 15分、 次レ、で、 0. 2xSSC, 室温、 洗浄 4分行った。 DNAチップを遠心し、 水分を飛ばして ¾燥後、 フジフィルムの DNAチップスキャナーで観察を行った。
シグナルの検出、 基準の設定と検出結果の評価
フジフイノレムの DNAチップスキャナ一にてチップのスキャンを行った。 取り込 んだ画像は、 16ビットの TIFF画像に変換し、 DNAチップ解析ソフトにて、 シグナ ルの数値化を行った。 DNAチップ解析ソフトは米国スタンフォード大学の Mi chae l Ei sen の開発した Scan Alyze を用いた。 得られたデータは標準化を行い tota l intens i ty法にて行った。 Total intens i ty法は、 比較対象となる 2群間の遺伝子 について、 半分が発現上昇し、 半分が発現低下すると仮定して標準化を行う。 標 準化を行った後、 コントロール群とエタノールス トレス群とで、 シグナルの比を もって、 遺伝子発現の比とした。 3倍以上遺伝子が変動したものを変動している と評価した。 遺伝子の同定は、 チップ設計時に作成したデータベースを用レ、て行 つた。 (図 1 0 A、 B及び Cに結果を示す。) 産業上の利用可能性
本発明に係る核酸マイクロアレイでは、 クロスハイブリダィゼーションを確実 に防止することができ、 優れた検出感度を達成することができる。 また、 本発明 に係る核酸プローブの設計方法では、 検出感度に優れた核酸マイクロアレイに固 定化することができる、 クロスハイブリダィゼーションを確実に防止できる核酸
プローブを設計することができる。 さらに、 本発明に係る遺伝子検出方法で 、 クロスハイプリダイゼーションを確実に防止でき、 優れた検出感度で遺伝子を検 出することができる。
本明細書で引用した全ての刊行物、 特許および特許出願をそのまま参考として本 明細書にとり入れるものとする。