WO2006033484A1

WO2006033484A1 - 核酸マイクロアレイ及び核酸プローブの設計方法並びに遺伝子検出方法

Info

Publication number: WO2006033484A1
Application number: PCT/JP2005/018222
Authority: WO
Inventors: Hiroyuki Sasaki; Tadafumi Iino; Shinichi Mizuno; Hidetoshi Ozawa; Kosuke Tashiro
Original assignee: Kyushu University, National University Corporation; Inter-University Research Institute, Research Organization Of Information And Systems
Priority date: 2004-09-24
Filing date: 2005-09-26
Publication date: 2006-03-30
Also published as: JPWO2006033484A1

Abstract

クロスハイブリダイゼーションを確実に防止する　(1)基板と、(2)ハイブリダイズに寄与しない塩基配列からなる非相補領域と、ハイブリダイズに寄与する塩基配列からなり、検出対象の核酸ターゲット群のうち特定の核酸ターゲットに対して特異的にハイブリダイズする選択領域及び検出対象の核酸ターゲットが共通して有するリンカー配列の全部または一部に対して相補的な調節領域からなる相補領域とを含み、上記基板上に固定された複数の核酸プローブとを備え、上記調節領域の長さは、上記複数の核酸プローブにおける相補領域のTm値を近づけるように設計されたことを特徴とする核酸マイクロアレイ。

Description

核酸マイクロアレイ及び核酸プローブの設計方法並びに遺伝子検出方法技術分野

本発明は、検出対象の核酸ターゲットにハイブリダィズする核酸プローブを固定した核酸マイクロアレイ（チップ）、核酸プローブの設計方法及び核酸ターゲットの調製方法並びに当該核酸マイクロアレイを用いた遺伝子検出方法に関する。

明背景技術

書

所謂、核酸マイクロアレイは、基板上に複数のオリゴ核酸（核酸プローブ）を固定してなり、当該オリゴ DNAと相補的な核酸ターゲットを検出することができる。なお、本明細書において使用する用語 "核酸マイクロアレイ" は、一般に使用されている用語 " DNAアレイ"、 "DNAマイクロアレイ"、 "DNAマクロアレイ" 及ぴ " DNAチップ"の総称を意味する。よって、本明細書において使用する用語 "核酸マイクロアレイ" は、半導体集積回路製造用のフォトリソグラフィー技術を応用した高密度 DNAァレイのみを意味するものではない。

核酸マイクロアレイとしては、従来、既知の遺伝子の発現レベルを検出することを目的として、当該既知の遺伝子由来の核酸ターゲットに特異的にハイブリダィズする核酸プローブを固定化したものが知られている。この核酸マイクロアレィを用いた遺伝子検出方法では、先ず、ある生体試料から mRNA を抽出し、当該 mRNA を鏡型とする逆転写反応により蛍光標識を取り込んだ核酸ターゲット群を調製し、次に、調製した核酸ターゲット群を核酸マイクロアレイに接触させる。このとき、核酸ターゲット群に検出対象の遺伝子に由来する核酸ターゲットが含まれていれば、核酸マイクロアレイ上の核酸プローブと目的の核酸ターゲットとがハイブリダィズすることとなる。よって、核酸マイクロアレイ上の蛍光をスキヤンすることによって、生体試料における検出対象の遺伝子に関して発現の有無及び発現レベルを検出することができる。

一方、近年、凡用マイクロアレイシステム (Universal i croarray System) と称される転写解析プラットホームが紹介されている（非特許文献 1 )。この非特許文献 1には、 6塩基長の領域を有し、アデニン（、グァニン（G)、チミン（T) 及ぴシトシン（C) からなる塩基の全ての組合せ（4⁶=4096) からなる 4096種類の核酸プローブを固定化した核酸マイクロアレイが開示されている。非特許文献 1 に開示された核酸マイクロアレイにおいて、核酸プローブは、基板に固定化する末端側から順に、 C6アミノ酸修飾リンカー、 C18スぺーサー及び上記 6塩基長の領域を有している。また、上記 6塩基長の領域は、 C18 スぺーサ一の端部と 7番目の塩基（C/T 混合）を介して結合されている。なお、この 7番目の塩基は C18 スぺーサ一と共有結合によって結合している。

以上のように構成された核酸マイクロアレイによれば、遺伝子が未知であっても、遺伝子の発現の有無や発現レベルを解析することができる。ところが、非特許文献 1に開示された核酸マイクロアレイにおいては、上記 6塩基長の領域のみが核酸ターゲットとのハイプリダイズに寄与する。核酸マイクロアレイにおいて上記 6塩基長の領域には、 GC含量の高い配列もあれば、 CG含量の低い配列もある。 CG含量の相違は、ハイブリダイズにおける Tm値 {·こ大きく影響することが知られている。したがって、非特許文献 1に開示された核酉変マイクロアレイにおいては、上記 6塩基長の領域の Tm値の違いに起因するクロスハイプリダイゼーシヨンを確実に防止することができない。言い換えると、特許文献 1に開示された DNA チップにおいては、クロスハイブリダィゼーシヨンが生じるため、未知或いは既知の遺伝子を正確に検出することができないといった問題がある。

非特許文献 1 Nature Biotechnology, Vol . 22, No. 4, 418—426, 2004 発明の開示

そこで、本発明は上述したような実状に鑑み、クロスハイプリダイゼーシヨンを確実に防止し、検出感度に優れた核酸マイクロアレイを提供することを B的とする。また、本発明は、クロスハイブリダィゼーシヨンを確実に防止できる核酸プローブの設計方法を提供することを目的とする。さらに、本発明は、 - クロスハイブリダィゼーションを確実に防止できる核酸ターゲットの調製方法を提供する' ことを目的とする。さらにまた、本発明は、. クロスハイプリダイゼーシヨンを確実に防止し、検出感度に優れた遺伝子検出方法を提供することを目的とする。上述した 0的を達成した本発明は、以下を包含する。

(1) 基板と、

ハイブリダィズに寄与しない塩基配列からなる非相補領域と、ハイブリダィズに寄与する塩基配列からなり、検出対象の核酸ターゲット群のうち特定の核酸ターゲットに対して特異的にハイブリダィズする選択領域及び検出対象の核酸ターゲットが共通して有するリンカー配列の全部または一部に対して相補 ή勺な調節領域からなる相補領域とを含み、上記基板上に固定された複数の核酸プローブとを備え、

上記調節領域の長さは、上記複数の核酸プローブにおける相補領域の Tm値を近づけるように設計されたことを特徵とする核酸マイクロアレイ。

上記（1)の核酸マイクロアレイにおいて、上記複数の核酸プローブにおける相補領域の Tm値はほぼ一定の範囲内であることが好ましい。また、上記（1)の核酸マイクロアレイにおいて、上記選択領域が _n個の塩基からなり、アデニン、グァニン、チミン及びシトシンの全ての組合せに相当する 4ⁿ種類の選択領域有することが好ましい。さらに、上記（1)の核酸マイクロアレイにおいて、上記核酸プロ一ブは、上記調節領域が上記選択領域を挟み込み、上記非相補領域が上 f己相補領域を挟み込むように構成されたものであることが好ましい。また、上記調節領域が上記選択領域を挟み込むように構成された核酸プローブにおいて、上言己選択領域の 3 ' 末端側に位置する調節領域の長さと、上記選択領域の 5 ' 末端側に位置する調節領域の長さとが異なっていてもよい。上記（1)の核酸マイクロアレイにおいて、上記複数の核酸プローブは全て同じ長さであることが好ましレ、。上記（1) の核酸マイクロアレイにおいて、上記リンカ一配列は例えば、配列番号 1記載の塩基配列とすることができる。

また、本発明は以下を包含する。

(2) 生体試料由来のユニーク配列と、他の核酸ターゲットと共通するリンカ一配列とを含む核酸プローブに対してハイブリダイズする核酸プローブであって、ハイブリダイズに寄与しない塩基配列からなる非相捕領域と、ハイブリダイズに寄与する塩基配列からなり、上記ユニーク配列に特異的にハイプリダイズする選択領域及び上記リンカー配列の全部または一部に対して相補的な調節領域からなる相補領域とを含む核酸プローブの塩基配列を設計する方法であって、

複数の核酸プローブにおける上記選択領域の塩基配列を、各核酸プローブにおける選択領域が異なる塩基配列を有するように設計する工程と、

異なる選択領域を有する複数の核酸プローブにおける、各相補領域の Tm値が近づくように上記リンカ一配列の塩基配列及び上記調節領域の長さを設計する工程とを含む核酸プローブの設計方法。

上記（2)の設計方法において、上記選択領域の塩基配列を設計する工程では、 n 個の塩基からなる選択領域に対して、アデニン、グァニン、チミン及ぴシトシンの全ての組合せに相当する 4"種類の塩基配列を設計し、 4 "種類の核酸プローブにおける相補領域の Tm値がほぼ一定の範囲になるように、調節領域の長さを核酸プローブ毎に決定することが好ましい。また、上記（2)の設計方法において、上記調節領域の長さを設計する工程は、複数の核酸プローブにおける各選択領域のグァニン及びシトシン含量（GC含量）の偏りを評価する工程を含み、選択領域の GC 含量に偏りがある場合には、当該選択領域の 3 ' 末端側に設計する調節領域の長さと、当該選択領域の 5 ' 末端側に設計する調節領域の長さとを異ならせるように設計することもできる。

さらに、本発明は以下を包含する。

(3) 生体試料由来のユニーク配列と、他の核酸ターゲットと共通するリンカ一配列とを含む核酸ターゲットを含む溶液を、ハイプリダイズに寄与しない塩基配列からなる非相補領域と、ハイプリダイズに寄与する塩基配列からなり、上記ュニーク配列に特異的にハイプリダイズする選択領域及び上記リンカー配列の全部または一部に対して相補的な調節領域からなる相補領域とを含む核酸プローブを基板上に固定してなる核酸マイクロアレイに対して接触させる工程と、

上記核酸マイクロアレイの核酸プローブにハイブリダイズした核酸ターゲットを検出する工程とを含む遺伝子検出方法。

上記（3)の遺伝子検出方法において、上記複数の核酸プローブにおける相補領域の Tm値はほぼ一定の範囲内であることが好ましい。また、上記（3)の遺伝子検出方法において、上記選択領塽が n個の塩基からなり、アデニン、グァニン、チミン及びシトシンの全ての組合せに相当する 4"種類の選択領域を有することが好ましい。さらに、上記（3)の遺伝子検出方法において、 _h記核酸プローブは、上記調節領域が上記選択領域を挟み込み、上記非相補領域力 S上記相捕領域を挾み込むように構成されたものであることが好ましレ、。上記 (3)の遺伝子検出方法において、上記複数の核酸プローブは全て同じ長さであることが好ましい。上記（3)の遺伝子検出方法において、上記リンカ一配列は例えば、配列番号 1記載の塩基配列における 25〜32番目の領域を除く塩基配列とすることができる。

本明細書は本願の優先権の基礎である日本国特許出願 2004- 278122号の明細書および Zまたは図面に記載される内容を包含する。図面の簡単な説明

図 1は、本発明に係る核酸マイクロアレイを模式的に示す要部断面図である。図 2は、本発明に係る核酸マイクロアレイを模式的に示す斜視図である。

図 3は、本発明に係る核酸マイクロアレイを模式的 ^こ示す要部断面図である。図 4は、核酸ターゲットの構成を模式的に示す構成図である。

図 5は、本発明に係る核酸マイクロアレイを模式的に示す要部断面図である。図 6は、 297 種類の核酸プローブにおけるハイブリタ、'ィズを核酸ターゲット 1

0の蛍光標識から検出した結果を示す写真である。

図 7は、本発明に係る核酸ターゲットの調製方法のフローチャートである。図 8— 1は、本発明に係る核酸ターゲットの調製方法を説明するための模式図である。

図 8— 2は、本発明に係る核酸ターゲットの調製方を説明するための模式図である。

図 9 A、 B及ぴ Cは、実施例 1の実験結果。全酵母の 0RFに由来するユニーク配列のチップを用いコントロール酵母、エタノールス卜レス酵母を用いた実施例におけるスキヤン画像の一部とシグナル強度の散布図である。

図 1 0 A、 B及び Cは、実施例 2の実験結果。 4 ⁸信のユニーク配列のチップを用いコントロール酵母、エタノールストレス酵母を用いた実施例におけるスキヤン画像の一部とシグナル強度の散布図である。発明を実施するための最良の形態

以下、本発明を詳細に説明する。

本発明に係る核酸マイクロアレイは、図 1に示すように、基板 1と、基板 1上に種類毎に固定化された核酸プローブ 2とから構成され、核酸プローブ 2の種類毎に区画されたスポット 3を有している。スポット 3は、図 2に示すように、基板 1の一主面においてマトリックス状に配されている。

基板 1 としては、核酸プローブを固定化できれば特に限定されず、ガラス板及び樹脂板等を使用することができる。樹脂板としては、ポリエチレン、ポリプロピレン、ポリスチレン、ナイロン及びシリコーン等のプラステイク板、ニトロセルロース及びセルロースァセテ一ト等のセルロース板等を使用することができる, なお、核酸プローブ 2の固定化方法によっては、一主面に表面処理を施した基板 1を使用することもできる。例えば、一主面をポリ L-リシンでコーティングしたガラス板を使用することができる。また、基板の形状は、板状のものに限定したものではなく、球状のもの（ビーズ）などがある。

核酸プローブ 2は、図 3に示すように、ハイブリダィズに寄与しない塩基配列からなる非相補領域 4と、ハイブリダィズに寄与する塩基配列からなり、核酸ターゲットに対して特異的にハイブリダィズする選択領域 5及ぴ検出対象の核酸ターゲットが共通して有するリンカー配列の全部または一部に対して相補的な調節領域 6からなる相補領域 7とを含む。また、核酸プローブ 2は、非相補領域 4及び相補領域 7以外に、基板 1 との間に配されるスぺーサー領域 8を有するような構成であっても良い。

本発明に係る核酸マイクロアレイにおいて、選択領域 5が n個の塩基からなる場合、アデニン、グァニン、チミン及びシトシンの全ての組合せに相当する 4^Π種類の選択領域 5を設計することができる。すなわち、核酸プローブ 2としては、

4"種類の選択領域 5に対応して 4 "種類を設計することができる。一例として図 3 に示すように、選択領域 5が 8塩基の長さからなる場合、 65536 通りの塩基配列を設計することができ、 65536 通りの核酸プローブ 2を設計することができる。なお、選択領域の塩基長は 8個に限定されず、如何なる数でもよい。但し、選択領域 5が 5塩基長では 1024種類しか設計できないこととなり、核酸マイクロアレィを用いた遺伝子の発現解析には不十分であると考えられる。一方、選択領域 5 が 1 0塩基長では 1048576種類を設計することとなり、ヒトの遺伝子が約 32000 種類であると推定されていることからすると、約 90%の遺伝子を一意的に選択することができると考えられる。したがって、選択領域 5は、 6〜1 0塩基長であることが望ましい。 '

なお、本発明に係る核酸マイクロアレイは、核酸プローブ 2として、選択領域 5の全ての組合せに相当する種類を有することが望ましいが、必ずしも全ての組合せに相当する種類を有していなくても良い。例えば、選択領域 5が 8塩基長からなる場合、 65536 通りの核酸プローブ 2のうち 9 5 %、好ましくは 9 7 %、より好ましくは 9 9 %の核酸プローブ 2を有していれば、核酸マイクロアレイとしては、優れた検出能で遺伝子発現解析を行うことができる。より具体的に、選択領域 5が 8塩基長からなる場合、選択領域 5が全てアデニンのみからなる核酸プローブ 2や、他の核酸プローブ 2と比較して選択領域 5の末端 1塩基のみが相違する核酸プローブ 2等を除いた、核酸プローブ 2を有する核酸マイクロアレイであっても、優れた検出能で遺伝子発現解析を行うことができる。

また、核酸プローブ 2に含まれる調節領域 6は、詳細を後述する核酸ターゲットが共通して有するリンカー配列の全部または一部に対して相補的な塩基配列を有している。ここで、核酸ターゲットの一例として、図 4に示すように、核酸ターゲット 1 0を例示して説明する。核酸ターゲット 1 0は、細胞や組織等の生体試料から抽出した mRNAに由来するユニーク配列 1 1 と、ユニーク配列 1 1を挟み込む第 1のリンカ一 1 2及び第 2のリンカ一 1 3 (まとめて単に「リンカ一」と称する場合もある。）とを備えている。核酸ターゲット 1 0において、ユニーク配列 1 1は、生体試料に由来する多種類の mRNAに由来しているため、 mRNAの種類毎に異なる配列となる。一方、リンカ一配列は、全ての核酸ターゲット 1 0において共通する配列である。

リンカ一の塩基配列は、特に限定されずいかなる配列であってもよい。また、リンカ一における GC含量は 35〜65%が好ましく、 40〜60%がより好ましく、 45

〜55°/。が最も好ましい。第 1のリンカー 1 2の一例としては配列番号 1の塩基配列、第 2のリンカー 1 3の一例としては配列番号 2の塩基配列を挙げることができる。リンカー配列としては、例えば、配列番号 1記載の塩基配列における 25〜32番目の領域を除く塩基配列を例示することができる。なお、核酸ターゲットの調製方法及びリンカ一の塩基配列設計方法については後述する。

調節領域 6は、第 1のリンカー 1 2及び第 2のリンカー 1 3に相補的な塩基配列からなり、選択領域 5を挟み込むように分割されている。すなわち、調節領域 6の一方は第 1のリンカ一 1 2に相補的な塩基配列からなり、調節領域 6の他方は第 2のリンカ一 1 3に相補的な塩基配列からなる。

また、図 5に示すように、調節領域 6は異なる長さである場合がある。すなわち、調節領域 6は、リンカ一の一部と相補的な塩基配列からなる場合がある。本発明に係る核酸マイクロアレイにおいては、調節領域 6及び選択領域 5からなる相補領域 7の Tm値が、複数の核酸プローブ 2において、近くなるように、調節領域 6の長さが決定されている。

仮に、上述したように予め決定されている選択領域 5のみを核酸ターゲット 1 0とハイブリダィズさせ、核酸ターゲット 1 0のユニーク配列 1 1を検出することを想定した場合、各ハイブリダイズにおいて、選択領域 5の塩基配列に応じて異なる Tm値となる。一方で、核酸マイクロアレイは、各スポット 3を同一条件（温度、塩濃度、 pH等）で処理するため、各スポット 3におけるハイブリダィズを安定して形成することができない。

これに対して、本発明に係る核酸マイクロアレイにおいては、調節領域 6の長さを適宜調節して設計することで、ハイブリダィズに寄与する相補領域 7の Tm 値を全ての核酸プローブ 2において近くすることができる。これにより、本発明に係る核酸マイクロアレイによれば、選択領域 5の塩基配列が異なる場合でも、核酸プローブ 2と核酸ターゲット 1 0とのハイプリダイズを安定して形成することができ、クロスハイブリダィゼーションを確実に防止することができる。

以下、調節領域 6の長さを設計する方法について説明する。調節領域 6の長さを設計する際には、先ず、設計した複数の核酸プローブ 2における各選択領域 5 のグァニン及びシトシン含量（GC含量）を算出する。次に、算出した GC含量に基づいて、 GC 含量と最適な調節領域 6の長さとを関連付けたデータベースから、各選択領域 5に最適な調節領域 6の長さを検索する。このデータベースによれば、選択領域 5の GC含量が高い場合には調節領域 6の長さを短く設計し、選択領域 5 の GC含量が低い場合には調節領域 6の長さを長く設計することとなる。

ここで、 GC含量と最適な調節領域 6の長さとを関連付けたデータベースの作製方法の一例を、実験例とともに説明する。本例では、選択領域 5が 8塩基長、すなわちユニーク配列 1が 8塩基長である場合を例示する。本実験では、表 1に示す塩基配列を有する 1 1種類の核酸断片を合成し、これら核酸断片を铸型として T7RNAポリメラーゼを用いた RNA鎖合成反応を行い、得られた RNA鎖を核酸ターゲット 1 0としている。なお、得られた核酸ターゲット 1 0は、蛍光標識 CTPを用いた RNA鎖合成により蛍光標識されている。

表 1

名称塩基配列ユニーク酉己列 GC含量

GCOtarg CGGATGTTCGAATAATATTAGCTTGTAGCG ΑΤΑΑΓΑΤΤ 0/8

GCltarg CGGATGTTCGATATCATAAAGCTTGTAGCG TATCA.TAA 1/8

GC2targ CGGATGTTCGAAATCATGAAGCTTGTAGCG AATCA.TGA 2/8

GC3targ CGGATGTTCGAGTATGTTCAGCTTGTAGCG GTATG-TTC 3/8

GC4mmtarg CGGATGTTCGACGAAAGAGAGCTTGTAGCG CGAAA.GAG 4/8

GC4medtarg CGGATGTTCGATCATGCTGAGCTTGTAGCG TCATG-CTG 4/8

GC4maxtarg CGGATGTTCGATCCCCTTTAGCTTGTAGCG TCCCC TTT 4/8

GC5targ CGGATGTTCGACTGCAGGAAGCTTGTAGCG CTGCA.GGA 5/8

GC6targ CGGATGTTCGACAGGCTGCAGCTTGTAGCG CAGGCTGC 6/8

GC7targ CGGATGTTCGACGCAGGCCAGCTTGTAGCG CGCA&GCC 7/8

GC8targ CGGATGTTCGACGGCCCGCAGCTTGTAGCG CGGCCCGC 8/8 一方、核酸プローブ 2としては、表 1に示したユニーク配列に相補的な選択領域 5を有し、選択領域 5の両端にリンカーに相補的な 2〜10塩基の調節領域 6を有するものを準備する。すなわち、上記 11種類のユニーク配列【こ対応する 1 1種類の選択領域 5から選ばれる 1の選択領域 5について、 2〜10 基の調節領域 6 を有する 9種類の核酸プローブ 2を準備する。よって、上記 11種類のユニーク配列に対応する 11種類の選択領域 5について、 99種類の核酸プローブ 2を準備することとなる。さらに、これら 99種類の核酸プローブ 2全てについて、 1塩基ミスマッチを有する ₂種類の核酸プローブ ₂も準備する。よって、上記 11 種類のュニーク配列に対応する 11種類の選択領域 5について、合計で 297種類 O核酸プローブ 2を準備することとなる。

そして、これら 297種類の核酸プローブ 2を固定した核酸マイクロ T"レイに上記 11種類の核酸ターゲット 1 0を接触させ、核酸プローブ 2と核酸ターゲット 1 0 とのハイブリダイゼーションを行う。ハイブリダイゼーションの条件は Buffer； 6xSSC+50%ホルムアミド、 25度である。 297種類の核酸プローブにおけるハイブリダィズを核酸ターゲット 1 0の蛍光標識から検出した結果を図 6に示す図 6中、横軸は選択領域 5の GC含量を意味しており、縦軸は調節領 6の長さを意味している。例えば図 6中「GC0」は、表 1中 GC含量 0/8のユニーク配列に相補的な選択配列 5を有する核酸プローブの列を意味する。図 6中「GC4min」は表 1における「GC4mintarg」のユニーク配列に相補的な選択配列 5を有する核酸プローブの列を意味し、「GC4med」は表 1における「GC4medtarg」のユニーク配列に相補的な選択配列 5を有する核酸プローブの列を意味し、「GC4max」は表 1における「GC4maxtarg」のユニーク配列に相補的な選択配列 5を有する核酸プローブの列を意味する。「GC4min」、「GC4med」及び「GC4max」は、選択領域 5 における GC含量が 4/8と同じ値である力 S、グァニンとシトシンの存在位置により異なる Tm 値を示すものである。「GC4min」は GC含量が 4/8であり、最も低い Tm値を示すものであり、「GC4max」は GC含量が⁴ /8であり、最も高い Tm値を示すものである。「GC4med」は GC含量が 4/8であり、中間程度の Tm値を示すものである。

また、図 6中、所定の GC含量の核酸プローブを意味する列に 3つのスポットがあるが、左側のスポットが核酸ターゲット 1 0と完全にマッチする核酸プローブのスポットであり、中心及ぴ右側のスポットは核酸ターゲット 1 0と 1塩基ミスマッチする核酸プローブのスポットである。

よって、図 6中、所定の GC含量の選択配列 5を意味する列において、左側のスポットが強く検出されるとともに中央及び右側のスポットが検出されない長さ

(縦軸）、当該 GC含量の選択配列 5にとつて最適であることが判明する。図 6 に示したスポット検出結果に基づいて、完全マッチ核酸プローブの蛍光シグナルを 1塩基ミスマッチ核酸プローブの蛍光シグナルで割って相対化した結果を表 2 に示す。

表 2

GC0 GC1 GC2 GC3 GC4min GC4med GC4max GC5 GC6 GC7 GC8

+ 表 2中、太枠で囲ったセルは、所定の GC含量の選択領域 5を有する完全マッチ核酸プローブにおいて、相対シグナルが最も高い値を示したセルを意味する。また、影付きのセルは、太枠で囲ったセルの値より劣るが、所定の &C含量の選択領城 5を有する完全マッチ核酸プローブにおいて、相対シグナルがヒ較的に優れた値を示したセルを意味する。

図 6及び表 2に示した結果から、 8塩基長からなる選択領域 5に含まれる GC含量と最適な調節領域 6の長さとを関連付けたデータベースを構築することができる。データベースは例えば表 3のように表すことができる。

表 3

- 11 - 差替え用紙（規則 26) GC含量調節領域の塩基長

0 9

1 8

2 7

3 6

4 6

5 5

6 5

7 4

8 4

表 3に示したデータベースを用いれば、設計した複数の核酸プローブ 2における 8塩基長からなる各選択領域 5の GC含量に基づいて、調節領域 6の長さを具体的に設計することができる。なお、核酸プローブ 2における選択領域 5が 8塩基長以外であっても同様にデータベースを構築し、調節領域 6の長さを具体的に設計することができる。

ところで、選択領竑 5における GC含量が同じ値であっても、グァニンとシトシンの存在位置によっては大きく異なる Tm値を示す場合がある。例えば、選択領域 5における GC含量が 4の配列の組合せは、 17920種類あり、 Nearest- Neighbor 法（RNA - DNA hybrid) にて Tm値を計算すると 25. 0²〜⁵⁷. 94という広がりを持つている。

したがって、調節鎮域 6の長さを設計する方法においては、上述したように、選択領域 5の GC含量を算出した後、算出した GC含量が同じである複数の選択領域 5の全てについて Tm値を算出し、 Tm値の平均値よりも高い Tm値を示す選択領域 5については調節煩域 6の長さを短く設計し、 Tm値の平均値よりも低い Tm値を示す選択領域 5につレ、ては調節領域 6の長さを長く設計するように処理することが好ましい。

ここで、 Tm値の算出方法としては、特に限定されず公知の算出方法を適宜使用することができる力正孩性が高いと評価されている Nearest- Neighbor法で計算することが好ましい。 Nearest-Neighbor法によれば Tm値は下記式により与えられる。 .

[数 1 ]

Τπι=1000ΔΗ/ {-10.8+AS+R ln(Ct/4)} - 273.15+16.6 log₁₀[Na+]

ここで、 ASはノヽイブリットにおける隣接ェントロビー変化の合計（cal/mol · K) を意味し、 Δ H はノヽイブリットにおける隣接ェンタルピー変化の合計 (Kcal/raol) を意味し、 Rは気体定数（1.987cal/deg · mol) を意味し、 Ctはオリゴの total mol濃度（mol/1) を意味し、 Na+は Na+のモ^^濃度を意味する。本例では、 Ct=0.5 M、 [Na+] =50mMとして計算している。また、 3及び八11は表4で与えられる。

表 4

AH(Kcal/mol) AS{cal/mol-k)

AA -9.1 -24

AG -7.8 -20.8

AC -6.5 -17.3

AT - 8.6 -23.9

GA - 5.6 -13.5

GG -11 -26.6

GC -11.1 - 26.7

GT - 6.5 -17.3

TA - 6 - 16.9

TG - 5.8 - 12.9

TC -5.6 -13.5

TT -9.1 -24

CA -5.8 -12.9

CG -11.9 -27.8

CC -11 -26.6

CT -7.8 -20.8

例えば、塩基配列 "AGCTATGC" の Tmは、 Nearest- Neighbor 法で以下のように計算される。まずこの塩基配列を隣接 2塩基ずつにすると、 "AG"、 "GC"、 "CT"、 "TA"、 "AT"、 "TG" 及び " GC" となる。よって、 ΔΗ及び AS 以下のように算出さる。

ΔΗ=-7.8—11.1—7.8-6.0—8.6-5.8—11.1= - 58.2kcal/mol

AS=-20.8-26.7-20.8-16.9—23.9—12.9—26.7= 148.7cal/mol · k

これを上記式に代入すると Tm = 9.83°Cとなる。

このようにして、上記式及び表 3から選択領域 5の Tm値を算出することができる。そして、同じ GC含量である複数の選択領域 5の全 Tm f直から平均値（中央値) を算出する。その後、各選択領域 5の Tm値と当該平均値（中央値）とを比較し、各選択領域 5の Tm値が平均値（中央値）よりも高い場合には調節領域 6の長さを短く設計し、逆に低い場合には調節領域 6の長さを長く設 Ifする。より具体的に、表 3に示した 8塩基長からなる選択領域 5に含まれる GC含量と最適な調節領域 6 の長さとを関連付けたデータベースは、例えば、表 5に示すようになる。

表 5

選択配列の

Tm値と中央値との比較調節領域の長さ

GC含量

GCO Tm値中央値以下 9

GCO Tm値中央値以上 8

GC 1 Tm値中央値以下 8

GC 1 Tm値中央値以上 7

GC2 Tm値中央値以下 8

GC2 Tm値中央値以上 7

GC3 Tm値中央値以下 6

GC3 Tm値中央値以上 5

GC4 Tm値中央値以下 6

GZ4 Tm値中央値以上 5

GC5 Tm値中央値以下 5

GC5 Tm値中央値以上 4

GC6 Tm値中央値以下 4

GC6 Tm値中央値以上 3

GC7 Tm値中央値以下 4

GC7 Tm値中央値以上 3

GC8 Tm値中央値以下 4

GC8 Tm値中央値以上 3

5に示すデータベースを使用して調節領域の長さを設計することによって、選択領域 5及び調節領域 6からなる相補領域の Tm値を、複数核酸プローブ 2においてより近づけることができる。

以上のように、調節領域 6の長さを設計することができる。例えば、選択領域 5の長さが 8塩基で、選択領域 5の塩基配列として全ての組せ（65536 通り）を設計した場合には、第 1のリンカ一 1 2として配列番号 1における 1〜24番目の塩基配列、第 2のリンカ一 1 3として配列番号 1における 33〜45番目の塩基配列を例示することができる。

非相補領域 4は、核酸ターゲット 1 0と相補鎖を形成しない塩基配列から構成される。非相補領域 4の塩基配列としては、核酸ターゲット 1 0と相補鎖を形成しなければ特に限定されない。また、非相補領域 4としては、ターゲットのリンカー配列と同一の塩基になるように非相補領域を設定すれば、最もハイプリッド鎖を形成しにくいので、より好ましい。

また、調節領域 6の長さを設計する際には、先ず、核酸プローブ 2における各選択領域 5の GC含量の偏りを評価する。具体的には、選択領域 5の中央から 3 ' 末端側の領域における GC含量と選択領域 5の中央から 5 '末端側の領域における GC含量とを比較して、 2倍以上の差がある場合には、その選尺領域 5には GC含量の偏りがあると評価する。例えば、選択領域 5の塩基配列が" GCGCATATA" である場合、選択領域 5の中央から 3 ' 末端側の領域における GC含量が小さく、選択領域 5の中央から 5 ' 末端側の領域における GC含量が高くなつており、この選択領域 5に GC含量の偏りがあると評価する。

そして、 GC含量に偏りがあると評価された選択領域 5については、 GC含量が高い側の調節領域 6の長さを短くするように設計する。これによつて、より GC含量のバランスを考えた精密なハイプリダイゼーションを行うことも可能である。一方、上述したように設計された核酸プローブ 2は、核酸合咸装置によって化学的に合成することができる。核酸合成装置としては、 DNA シンセサイザー、全自動核酸合成装置、核酸自動合成装置等と呼ばれる装置を使用することができる。核酸プローブ 2を合成した後、いわゆるスポッター装置を用いて、基板 1上に核酸プローブ 2を固定化することができる。本発明に係る核酸マイクロアレイにおいては、基板 1上への核酸プローブ 2の固定化には何ら限定されないため、従来公知のスポッター装置いずれも使用することができる。ここで、核酸プローブの固定化密度は、スポッター装置の性能に依存して適宜調節することができる。例えば、 1インチ X 3インチ（25mm X 75mm) のスライドガラス型の基板 1上に数百万個のスポット 3を配置することができる。

例えば、上述したように、選択領域 5を 8塩基長とした場合には 65536種類の核酸プローブ 2を合成し、各核酸プローブ 2に対して 65536個のスポット 3が必要となる。 1枚の基板 1上にこれら全てのスポット 3を形成できない場合には、複数枚の基板 1を用いて全てのスポット 3を形成すればよい。すなわち、選択領域 5の全ての組合せは、複数の核酸マイクロアレイのうちいずれか 1の核酸マイクロアレイに含まれていることとなる。この場合には、全てのスポット 3が形成された複数の核酸マイクロアレイを核酸マイクロアレイセットとして、一連の遺伝子解析試験に使用することができる。 ·

次に、上述した核酸マイクロアレイに使用される核酸ターゲットの調製方法について、図 7に示すフローチャートを参照して説明する。また、核酸ターゲットの調製方法を図 8— 1及び図 8— 2に模式的に示す。

先ずステップ 1 (図 7において「S1」と表記する。以下のステップも同様に表記する。）において、生体試料から解析対象を抽出する。

生体試料としては、例えば特定の疾患に罹患している患者から採取したヒト細胞、特定の条件下に置かれた生体由来の細胞、ゲノムのシーケンスが未知な生体由来の細胞、及び、これら細胞に対する対照となる細胞を挙げることができる。対象とする生物は真核生物のみならず原核生物も含めたすべての生物となる。生体試料としては、何ら限定されるものではない。

解析対象は生体試料に含まれる核酸である。これには DNAと RNAが含まれる。 DNAにはゲノム DNAゃミトコンドリァといった細胞小器官がもつ DNA等が含まれ、何ら限定されるものではない。また、 RNAには mRNAや tRNA、リボソーム RNAや miRNA 等がすべて含まれるものであり、機能上の分類には何ら制約されるものではない。

生体試料から解析対象を抽出する手法としては、何ら限定されず、公知の手法を使用することができる。例えば解析対象を mRNAとした場合、抽出方法としてはグァニジン一塩ィ匕セシウム超遠心法、 AGPC 法（ Acid guanid inium- Phenol- Chloroform法）、 ISOGEN法（RNA抽出用キット、二ツボンジーン社製）等を挙げることができる。 RNA試料にはリボソーム RNAが多量に含まれるが、これが解析対象でない場合には除去することが望ましい。この場合、生体試料が真核生物のものであれば Ol igotex- dT30 (第一化学薬品社製）や Dynabeads 01 igo (dT) 25 (DYNAL社製）を使用した poly (A) RNA精製法等を挙げることができる。生体試料が原核生物由来であれば、 MICROBExpress (Ambion社製）等を使用した精製法が挙げることができる。

なお、以下においては、一例として、生体試料が真核生物であり、解析対象を mRNA とする場合を説明する。しかしながら、本発明では、 DNAや、 mRNA以外の RNA を含む核酸を解析対象とすることができる。特に、生体試料が原核生物である場合には、解析対象としてトータル RNAを抽出することとなる。生体試料が原核生物である場合には、以下の説明において mRNAがトータル RNAとなる以外は、同様な工程を採ることができる。

次に、ステップ 2において、抽出した mRNAを逆転写酵素にて cDNAにし、さらに DNAポリメラーゼ等を用いて二本鎖の DNAにする。この二本鎖 DNAを第 1の制限酵素で処理し、この断片の一方端部は制限酵素認識配列となる。ここで、ステップ 1で抽出した mRNAの一方端部（例えば、 3 ' 末端側の端部）を、第 1の制限酵素処理に先立って担体に付着させておくことが好ましいが、逆転写後の cDNA の一方端部（例えば、 3 ' 末端側の端部）あるいは二本鎖合成後の cDNAの一方端部（例えば、 3 ' 末端側の端部）、第一の制限酵素処理後の断片における一方端部 (例えば、 3 ' 末端側の端部）を担体に付着させても今後の処理上、同様の効果を得ることができる。ステップ 1で抽出した核酸の一方端部を担体に付着させておくことによって、その後の操作において、一方端部側の核酸断片を容易に分離することができる。担体としては、特に限定されないが、例えば、ストレブトァビジンビーズ、磁性ビーズ等を使用することができる。

ステップ 2において使用する第 1の制限酵素としては、 4塩基を認識配列とする制限酵素を使用することが好ましい。 4塩基を認識配列とする制限酵素は、認識配列の出現頻度が 5塩基以上を認識とする制限酵素より高いため、より多くの種類の核酸ターゲットを準備することが可能となり、より詳細な遺伝子発現解析を行うことができる。第 1の制限酵素としては、特に限定されないが、 Taql (T i CGA)、 Nlal l l (CATG | )、 Mbol ( i GATC)、 Alul (AG I CT)、 Rsal (GT I AC)、 Msel (T J, TAA) , Mspl (C i CGG) , Acil (C | CGC) などがある。また、第 1の制限酵素を複数種類用いても構わない。

また、望ましくはステップ 2において、担体に付着した mRNA断片を除く mRNA 断片を除去する。あるいは担体に付着した二本鎖合成後の cDNA断片を除く、核酸の断片、例えば、第 1の制限酵素による処理を行った後、担体を回収し、回収した担体を洗浄液で洗浄することによって、担体に付着した二本鎖合成後の cDNA 断片を除く、核酸の断片を除去することができる。

次に、ステップ 3において、一方端部に第 1の制限酵素認識配列を有する cDNA 断片に対して、第 1のリンカ一 1 2を結合 (ライゲーション) する。ここで、第 1のリンカ一 1 2は、上述したように、一方端に第 1の制限酵素認識配列、中途部に Typells制限酵素の認識配列を有するように設計した後、核酸合成装置によつて合成して準備しておくことができる。本ステップ 3によって、一方端部に第 1のリンカー 1 2を結合した cDNA断片が作製されることとなる。なお、ステップ 2において担体を使用した場合には、 mRNAにおける担体を付着した端部とは反対側の端部に第 1のリンカー 1· 2を結合した cDNA断片が作製されることとなる。次に、ステップ 4においては、ステップ 3で作製した第 1のリンカ一 1 2を有する cDNA断片を、 Typells制限酵素により切断する。第 1のリンカ一 1 2には所定の位置に Typells制限酵素の認識配列が存在するため、 Typells制限酵素で処理すると、生体試料由来の mRNAに由来する cDNAが所定の位置で切断されることとなる。ここで、 Typells 制限酵素とは、認識配列の外側の数塩基〜~ H数塩基の位置を切断する制限酵素であり、例えば、 FokI (GGATG 9/13)、 MboII (GAAGA 8/7)、

BsmFI (GGGAC 10/14)などがある。また、同様に離れたところ切断する TypellGの制限酵素である Mmel (TCCRAC 20/18)、 Bsgl (GTGCAG 16/14) なども使用することができる。認識部位から一定の長さ離れた箇所を切断できる制限酵素であれば、限定してものではない。

また、ステップ 4では、第 1のリンカー 1 2を有する mRNA断片を除いて、担体に付着した cDNAを含む cDNA断片を除去する。例えば、 Typells制限酵素処理を行った後の溶液から、担体を回収することによって、第 1のリンカ一 1 2を有する cDNA断片以外の cDNA断片を除去することができる。

さらに、ステップ 4では、 Typel ls 制限酵素により切断された部分が突出端となる場合には平滑化処理を行う。平滑化処理としては、公知の手法を使用することができるが、例えば、 3'末端の突出が生じる場合には Klenow fragmentを用いた平滑化処理、また 5'末端の突出が生じる場合には T4 DNA polymeraseを月いて突出部分を削ることで平滑化する方法を使用することができる。

次に、ステップ 5において、平滑化した末端に対して第 2のリンカ一 1 3を結合（ライゲーシヨン）する。ここで、第 2のリンカ一 1 3には、調節領域 6 に対応する塩基配列の他にプロモータ領域が結合していてもよい。プロモータ領: t或としては、特に限定されないが、 T7 RNAプロモータを使用することができる。このステップ 5によって、第 1のリンカー 1 2、生体試料由来の cDNAの一部（生ィ本試料由来のユニーク配列 1 1 )、第2のリンカー1 3及びプロモータ領域を含む核酸断片を合成することができる。この核酸断片において、ユニーク配列 1 1は：斤対象の細胞における遺伝子に由来する配列であり、第 1のリンカ一 1 2及び第 2 のリンカ一 1 3はユニーク配列 1 1の種類に拘わらず共通する配列である。おた、ユニーク配列 1 1は、解析対象の細胞における遺伝子の発現の有無及び/又は現レベルを反映している。

次に、ステップ 6では、第 2のリンカ一 1 3に結合したプロモータ領域を禾 J用して、蛍光標識 RNA鎖を合成する。具体的には、ステップ 5で得られた第 1のリンカー 1 2、生体試料由来のユニーク配列 1 1及ぴ第 2のリンカー 1 3からよる核酸断片を铸型とし、リボヌクレオチド、蛍光標識リボヌクレオチド及び RKTAポリメラーゼを含む溶液中で RNA鎖を合成（転写反応）する。これにより、スラップ 5で得られた核酸断片の一方の差に相補的で、蛍光標識された RNA鎖を得ることができる。すなわち、本ステップ 6によって、第 1のリンカ一 1 2、ユニーク配列 1 1及び第 2のリンカ一 1からなる核酸タ一ゲット 1 0が蛍光標識 RNA として合成されることとなる。

ここで、蛍光標識ヌクレオチドとしては、一般的に使用されている、 Cy3— UTP 或レ、は Cy5 - UTPを使用することができる。例えば、 Cy3-UTPを使用して解す斤対象の糸胞由来の蛍光標識 RNA断片を合成し、 Cy5- UTPを使用して対照となる糸 01胞由来の蛍光標識 RNA断片を合成することもできる。ただし、蛍光は Cy3や Cy5に限定したものではなく、蛍光標識ヌクレオチドは、 UTP だけではなく、 ATP、 GTP、 CTPでも構わない。あるいは複数種類の標識リボヌクレオチを用いても構わなレ、。上述したように、核酸ターゲット 1 0を蛍光標識 RNA鎖とすることによって、収量の増加及びシグナルの改善を達成することができる。

または、蛍光標識リボヌクレオチドを用いずに未標識リボヌクレオチドまたはビ才チン標識、アミノアリル標識リボヌタレチドを用いて RNAを合成し、合成後にィ匕学反応、酵素反応等によって蛍光を標識し核酸ターゲットとしてもい。 Lab el i t™などの核酸標識キットを使えば可能である。

以上で説明した核酸ターゲット 1 0の調製方法では、ステップ 6において合成した蛍光標識 RNA鎖を核酸ターゲット 1 0とする例である。しかしながら、ステップ 6において蛍光標識 DNA鎖を合成して、得られた蛍光標識 DNA鎖を核酸ターゲット 1 0としてもよい。

また、ステップ 5において得られた核酸断片のうち一方の鎖を核酸ターゲット 1 Oとして使用することもできる。この場合、予め蛍光標識ヌクレオチドを含有するように第 1のリンカー 1 2及び/又は第 2のリンカー 1 3を調製しておく。そして、ステップ 5で得られた核酸断片を熱処理によって一本鎖とし、得らた一本鎖の核酸断片を核酸ターゲット 1 0として使用することができる。

一方、本発明に係る遺伝子検出方法は、核酸ターゲット 1 0を含む溶液を、核酸プローブ 2を有する核酸マイクロアレイに対して接触させる工程と、そ O後、核酸マイクロアレイの核酸プローブ 2にハイブリダィズした核酸ターゲッ卜 1 0 を検出する工程とを含む。ここで遺伝子検出方法とは、遺伝子の発現の有無を検出する方法、遺伝子の発現レベルを解析する方法、遺伝子の発現変化を解す斤する方法等を含む包括的な意味である。また、遺伝子としては、機能及び/又は:^基配列が既知の遺伝子に限定されず、機能及び/又は塩基配列が未知の遺伝子を含む意味である。

また、本遺伝子検出方法は、如何なる生物由来の遺伝子を検出対象とすことができる。言い換えると、遺伝子検出方法においては、上述した核酸マイクロアレイを用いることによって、生物種を何ら限定することなく、如何なる生物由来の遺伝子を検出対象とすることができる。

本発明に係る遺伝子検出方法では、例えば、ある生物種の 2つの状態における遺伝子の発現レベルを比較するといつた遺伝子発現解析を行うことができる。生物種の 2つの状態としてま、例えば、ヒト健常者と及び所定の疾患を患った患者、癌細胞及ぴ正常細胞、所定の条件下にある細胞及び当該条件下にない細胞等を挙げることができる。

具体的には、各状態にある生物種から核酸ターゲット 1 0をそれぞれ、上述したように調製する。このとき、各核酸ターゲット 1 0は、互いに異なる蛍光標識、例えば Cy3及び Cy5をそぞれ有するように調製される。そして、これら 2種類の核酸ターゲット 1 0を含む溶液を核酸マイクロアレイに接触させて、核酸プローブ 2に対して 2種類の核酸ターゲット 2がいわゆる競合的ハイブリダィゼーションする条件下におく。

特に、本発明に係る核酸マイクロアレイにおいては、核酸ターゲット 1 0とハイブリダイズする核酸プローブ 2の相補領域 7の Tm値が、複数の核酸プローブ 2 において近くなるように構成されている。したがって、核酸プローブ 2に対して 2種類の核酸ターゲット 2をハイプリダズする際に、クロスハイブリダィゼーシヨンを確実に防止することができる。これにより、本遺伝子検出方法によれば、生物種の 2つの状態における遺伝子の発現レベルを正確に比較することができる。以下、実施例を用いて本発明をより詳細に説明するが、本発明の技術的範囲は以下の実施例に限定されるものではなレ、。

〔実施例 1〕

本実施例では、全酵母遺伝子のゲノムデータベースから全 0RF (オープン ' リーデイング ' フレーム） ίこ関してユニーク配列を検索し、当該ユニーク配列と相補的な塩基配列からなる選択領域を有する核酸プ口一ブを設計した。本実施例では、作製した核酸マイクロアレイを用いて、酵母におけるエタノールストレス下での遺伝子発現解析を行った。 .

先ず、酵母の全ての 0RFデータベースから、 0RF内に存在する制限酵素 Taqlの認識配列（TCGA)の中で最も 3 ' 側にある認識配列の場所、その場所から 3 ' 側の 8 塩基（認識部位を含むと 12 基、ユニーク配列に相当する）を、コンピューターを用いて集計し、酵母のユニーク配列データベースを作成した。すなわち、酵母のユニーク配列データベースこは、制限酵素 Taqlの認識配列（TCGA)と、当該認識配列に続く 8塩基とからなる、計 1 2塩基のユニーク配列が含まれている。

また、 0RF内に Taql認識酉己列がない遺伝子については、 3 ' UTR (0RFの 3 ' 側の非翻訳領域） 200bp以内に Taq I認識配列があるものについてはこれらもタグとして、ユニーク配列データベースに格納した。ユニーク配列の集計は、独自にプロダラミングしたユニーク酉己列設計プロダラミングである。このプロダラミングは、指定した制 ^酵素（今回は Taql) をもとに 0RF の塩基配歹 IJを切断し、 0RF 内の認識配列のうち最も 3' 倜に位置する認識配列を検索し、検索された認識配列から所定の塩基数（今回は 8塩基）を塩基配列から抜き出し、データとして格納する基本プログミグからなり、一度に数万個の配列を処理が可で、得られたデータを市販のデータベースソフトで処理を行った。 0RF内に Ta q I認識部位がない 910遺伝子のうち、 355遺伝子については 3 'UTRの 200bp以内に Taq I認ヽ識部位があり、これらがタグである可能性もあることから、今回のチップに加えることとした。実際には、タグ酉己列に重複があるため、今回のチップには、 5335種類のタグ配列（6120遺伝子に相当）を配置した。

次に、ユニーク配列データベースから、独自に作成したプローブ設計プロダラミングによってプローブの設言十を行った。このプロダラミングはユニーク配列から、配列中の GC含量を計算し、 GC含量ごとに、表 3に従いユニーク配列ごとに調節領域の長さを決定すると同時に非調節領域の長さ、全体の配歹 IJの設計、調節領域 +ユニーク配列の Tm値の計算も同時に設計する。これをもとにプロ一ブ配列データベースを作成した。次に、プローブ配列データベースの配列全てを核酸自動合成機にて合成オリゴヌクレオチドを作成し、これらの全てを 1枚のスライドグラス上にスポットした。スポットの方法は、アジレント社によるインクジエツト方式にて行った。

一方、核酸ターゲットを調製するため、酵母は何も刺激を与えないコントロール酵母とエタノールストレス酵母を用いた。エタノールストレスは対数増幅期にある酵母をエタノール濃度 7%下で 30分曝露する条件を加えた。各々の酵母を遠心分離し回収し、ホットフエノーノレ法にて RNAを分離した。得られた RNAをオリゴ dTダイナビーズにて mRNAを回収した後、ク口ンテック社の smar t cDNA合成キットにて 3 ' ピオチン化 cDNAの合成を行い、制限酵素 Taqlで切断を行った。切断後ストレブトアビジン磁気ビーズを加え、 3 ' ビォチン化断片を回収した。第 1 のリンカーをライゲーションし、 Typells制限酵素 Foklにて処理し、第 1のリンカーと mRNA由来の配列（ユニーク配列）を含む断片が得られ、その断片を平滑末端化した後、第 2のリンカ一をライゲーシヨンする。第 1のリンカ一と第 2のリンカーをライゲーシヨンした産物（タグ）をリンカー上に配置したプライマーを用いた PCR反応にて増幅し、ポリアクリルアミドゲルに電気泳動し、タグのサイズの確認及ぴタグに相当するバンドを切り出し、精製を行う。次に、この精製した断片を鎵型に T7 RNAポリメラーゼを用いた in vitro transcription反応を行う。この反応は ambion社の RNA合成キット（Megascript™) を用いて行った。合成時に、 Cy3及び Cy5標識 UTPを朱標識 UTPの 1/3モル量加えること蛍光標識を行った。合成した蛍光標識 RNAは、カラムを用いて精製し、チップへのハイブリダイゼーシヨンに用レ、た。

次に、作成した蛍光標識 RNAの濃度を測定し、それぞれ 1 n mol を 50 μ 1 のハィプリダイゼーションバッファー tこ溶角？した。ハイプリダイゼーシヨンのパッファ一は最終濃度が、 6 X SSC、 50°/。ホルムアミドの濃度からなる。 70 度で 5分熱変性後、室温になったのち、 DNAチップ上に 50 μ 1 のこの蛍光標識 RNA溶液を加え、力パーグラスをかけた。密封できるハイブリダィゼーシヨンチャンバ一内に DNA チップを静置し、 25度、 16時間、ノ、イブリダィゼーシヨンを行った。 16時間後、 DNAチップを 2xSSC + 0. 2%SDS溶 ί 、室温、洗浄 15分、次いで 0. 2x SSC + 0. 2%SDS 溶液、室温、洗浄 15分、次いで O. 2xSSC + 0. 2%SDS溶液、 37度、洗浄 15分、次いで、 0. 2xSSC、室温、洗浄 4分 ί亍つた。 DNAチップを遠心し、水分を飛ばして乾燥後、フジフィルムの DNAチップスキャナーで観察を行った。

次に、フジフィルムの DNAチップスキャナ一にてチップのスキヤンをつた。取り込んだ画像は、 16ビットの TIFF画像に変換し、 DNAチップ解折ソフトにて、シグナルの数値化を行った。 DNA チップ解析ソフトは米国スタンフォード大学の Michael Ei senの開発した Scan Alyzeを用いた。得られたデータは標準化を行い total intens i ty法にて行った。 Total intens i ty法は、比較対象となる 2群間の遺伝子について、半分が発現上昇し、半分が発現低下するとィ反定して標準化を行う。標準化を行った後、コントロール群とエタノールストレス群とで、シグナルの比をもって、遺伝子発現の比とした。 3 倍以上遺伝子が変 1¾したものを変動していると評価した。（図 9 A、 B及び Cに結果を示す。）

その結果、エタノールストレスに応答して発現が特異的に変化する約 2 0 0個の遺伝子を同定することができた。エタノールストレスに応答して発現が特異的に上昇した遺伝子のなかでこれまでの報告と合致した遺伝子を表 6に示す。

表 6

ユニーク S列 ORF Name Functionl Functions Log2(Cy5/Cy3) 変動

TTCCATTG Y R093W PTR2 transport 1.64 EtOH UP

ATGGGCAC YHL024W 匪 4 molecular— function unknown 1.61 EtOH UP

TGCATTAT YDR406W PDR15 1.42 EtOH UP

CCTTCTAA YJL089W SIP4 transcription factor 1.30 EtOH UP

SRP-dependent, co-translational

CAGCAGAC YOL031C membrane targeting, molecular_function unknown 1.21 EtOH UP translocation*

CAGCATTG YJL016W biological_process unknown molecular_function unknown 1.10 EtOH UP

CAGGCAGT YOL083W biological_process unknown molecular_fu notion unknown 1.10 EtOH UP

TTGACTTC YOL157C bio]ogical— process unknown 0.97 EtOH UP

ATGACATC YOR173W biological_process unknown raolecular_function unknown 0.97 EtOH UP

AGGCGTAT YMR007W biological_process unknown molecular— function unknown 0.95 EtOH UP

TAGATTCC YLR177W biological— process unknown molecular— firaction unknown 0.91 EtOH UP

CAC2VAATG YDR490C PKH1 biological_process unknown 0.88 EtOH UP

AAAAGAAG YJR059W PTK2 polyamine transport 0.85 EtOH UP

TTCCTCAA YIR014W biological_process unknown mokcular一 function unknown 0.77 EtOH UP

TCCTGTCA YLE022C biological_process unknown molscular一 function unknown 0.76 EtOH UP

GGCCAAAT YML070W DAK1 glycerone kinase 0.74 EtOH UP

TAAAGAAT YNL009W IDP3 fatty acid beta-oxidation* isocitrate dehydrogenase (NADP+) 0.59 EtOH UP

ATTGTATG YML029W USA1 biological_process unknown molecular_function unknown 0.58 EtOH UP

ATTTATCA YDR518W EUG1 protein disulfide isomerase 0.57 EtOH UP

TCTACGAC YMR169C ALD3 stress response aldehyde dehydrogenase 0.48 EtOH UP

ATACTATC YDRrilGC biological— process unknown molecular— fonction unknown 0.46 EtOH UP

エタノールストレスに応答して発現が特異的に低下した遺伝子のなかでこれまでの報告と合致した遺伝子を表 7に示す。

表 7

unique O F Name Ftmctionl Function^ Log2(Cy5/Cy3) 変動

TGACTCTG YGR200C ELP2 transcription -0.97262305 EtOH Down

TAGAGGCA YKL172W EBP2 rRNA processing molecular— function unknown -0.968914568 EtOH Down

AAAAAAAT YCR016W biological_pToc;ess unknown molecular— function unknown -0.960858881 EtOH Down

ATAAAAAA YHR066W SSFl molecular一 function unknown -0.889779389 EtOH Down

ATAAAAAA YHR066W SSFl molecular_function unknown -0.889779389 EtOH Down

TGTCGGTG YLR441C RPS1A protein biosynthesis structural protein of ribosome -0.773682847 EtOH Down

TAAATAAA YGR085C RPL11B protein biosynthesis* structural protein of ribosome ■0.714987695 EtOH Down

TAAATAAA YGR085C RPL11B protein biosynthesis* structural protein of ribosome •0.714987695 EtOH Down

TGCTTTCG YOR146W biological_proeess unknown raolecular_function unknown •0.630784571 EtOH Down

TTTTTTCT YLR198C biologicaljirocess unknown molecular— function unknown •0.548967183 EtOH Down

CAAGTCTG YPE.112C MRD1 biological_process unknown molecular_fanction unknown •0.436093122 EtOH Down

ATCTGATG YMR260C TIF11 protein synthesis initiation translation initiation factor -0.416561633 EtOH Down

また、これまで報告されたエタノールストレス応答性遺伝子とは合致しなかつたが、エタノールストレスに対して発現量が有意に変化した遺伝子のユニーク配列を表 8に示す。

表 8 unique Log2(Cy5/Cy3) unique Log2(Cy5/Cy3)

GAAGCAAA 8.79 CTCTGTAC 3.18

CAAGTAAT 8.07 AGTAGCAC 2.95

CGAATAAA 7.92 ACCAACGC 2.93

AATACTCC 7.47 ACGGGGCT 9.71

AATTACCA 7.33 GCAGGTGC 7.74

TACACTCA 7.09 GCCTTGCT 6.87

AGCTGTGA 4.04 CTCGTCCT 6.20

ACGACCTT 3.86 TCCCATGC 6.04

TTTGTAGG 3.29 TTACCGGG 6.03

ACATGCTC 3.18 CCCTATCG 5.98

表 8に示したユニーク配列を有する遺伝子は、エタノールストレス応答性遺伝子としては報告されていないが、新規なエタノールストレス応答性遺伝子の候補となりうる。表 8に示したユニーク配列をプローブとして、当該ユニーク配列を有する遺伝子を同定することができる。同定した遺伝子は、遺伝子の機能解析実験に供されることで、その機能を詳細に解析することができる。

〔実施例 2〕

本実施例では、 8塩基長の選択領域を有する核酸プローブを、全ての組合せについて設計し、 65536 種類の核酸プローブを固定した核酸マイクロアレイを作製した。

プローブの設計

4 ⁸種類（65536種類）のユニーク配列をコンピューター用いて準備し、各ュニーク配列ごとに GC含量を計算し、表 3に従い、調節領域の長さ（リンカ一長）、非調節領域の長さを決定し、プローブの配列を設計した。これらはすべて独自に設計したプログミングに基づくプローブ設計ソフトを用いて行った。プローブ設計時に各配列の Tm値も計算した。

チップの設計

Tm値が小さい順に、チップ上に配置するように設計した。今回のチップは 1枚に 22000スポットしか配置できないため、 3枚のチップを用い、 Tm値の順に配置した。これらの配置に関するプログラムも設計し、チップ上のユニーク配列とスポットの場所（座標）、対象としている生物（今回の実験では酵母）のユニーク配列、遺伝子、機能などの情幸! ¾を有機的に結びつけるデータベースも同時に作成した。

酵母からのターゲット作成

酵母は何も刺激を与えないコントロール酵母とエタノールストレス酵母を用いた。

エタノールストレスは対数増幅期にある酵母をエタノール濃度 7%下で 30分曝露する条件を加えた。各々の酵母を遠心分離し回収し、ホットフヱノール法にて RNA を分離した。得られた RNAをオリゴ dTダイナビーズにて mRNAを回収した後、クロンテック社の smart cDNA合成キットにて 3 ' ビォチンィ匕 cDNAの合成を行い、制限酵素 Taqlで切断を行った。切断後ストレプトアビジン磁気ビーズを加え、 3 ' ビォチン化断片を回収した。第一リンカ一をライゲーシヨンし、 Typells 制限酵素 Foklにて処理し、第 1のリンカ一と mRNA由来の配列（ユニーク配列）を含む断片が得られ、その断片を平滑末端化した後、第 2のリンカ一をライゲーシヨンした。第 1のリンカ一と第 2 のリンカーをライゲーションした産物 (タグ）をリンカー上に配置したプライマーを用いた PCR反応にて増幅し、ポリアクリルアミドゲルに電気泳動し、タグのサイズの確認及びタグに相当するバンドを切り出し、精製を行った。

次に、この精製した断片を鎳型に T7 RNA ポリメラーゼを用いた in vitro transcript ion反応を行う。この反応は ambion社の RNA合成キッ卜 (Megascript™) を用いて行った。合成時に、 Cy3及び Cy5標識 UTPを未標識 UTPの 1/3モル量加えることで蛍光標識を行った。合成した蛍光標識 RNAは、カラムを用いて精製し、チップへのハイブリダイゼーションに用いた。

チップを用いたハイブリ実験の手順

作成した蛍光標識 RNAの濃度を測定し、それぞれ 1 n mo lを 50 1のハイブリダイゼーションバッファ一に溶角军した。ハイブリダイゼーションのバッファーは最終濃度が、 6 X SSC、 50%ホルムアミドの濃度からなる。 70度で 5分熱変性後、室温になったのち、 DNAチップ上に 50 1 のこの蛍光標識 RNA溶液を加え、カバ一グラスをかけた。密封できるハイブリダイゼーションチヤンノく一内に DMAチップを静置し、 25 度、 16 時間、ハイブリダィゼーシヨンを行う。 16 時間後、 DNA チップを 2xSSC + 0. 2%SDS溶液、室温、洗浄 15分、次いで 0. 2xSSC + 0. 2%SDS溶液、室温、洗浄 15分、次いで 0. 2xSSC + 0. 2%SDS溶液、 37度、洗浄 15分、次レ、で、 0. 2xSSC, 室温、洗浄 4分行った。 DNAチップを遠心し、水分を飛ばして ¾燥後、フジフィルムの DNAチップスキャナーで観察を行った。

シグナルの検出、基準の設定と検出結果の評価

フジフイノレムの DNAチップスキャナ一にてチップのスキャンを行った。取り込んだ画像は、 16ビットの TIFF画像に変換し、 DNAチップ解析ソフトにて、シグナルの数値化を行った。 DNAチップ解析ソフトは米国スタンフォード大学の Mi chae l Ei sen の開発した Scan Alyze を用いた。得られたデータは標準化を行い tota l intens i ty法にて行った。 Total intens i ty法は、比較対象となる 2群間の遺伝子について、半分が発現上昇し、半分が発現低下すると仮定して標準化を行う。標準化を行った後、コントロール群とエタノールストレス群とで、シグナルの比をもって、遺伝子発現の比とした。 3倍以上遺伝子が変動したものを変動していると評価した。遺伝子の同定は、チップ設計時に作成したデータベースを用レ、て行つた。（図 1 0 A、 B及び Cに結果を示す。）産業上の利用可能性

本発明に係る核酸マイクロアレイでは、クロスハイブリダィゼーションを確実に防止することができ、優れた検出感度を達成することができる。また、本発明に係る核酸プローブの設計方法では、検出感度に優れた核酸マイクロアレイに固定化することができる、クロスハイブリダィゼーションを確実に防止できる核酸プローブを設計することができる。さらに、本発明に係る遺伝子検出方法で、クロスハイプリダイゼーションを確実に防止でき、優れた検出感度で遺伝子を検出することができる。

本明細書で引用した全ての刊行物、特許および特許出願をそのまま参考として本明細書にとり入れるものとする。

Claims

請求の範囲

1 . 基板と、

ハイプリダイズに寄与しなレ、塩基配列からなる非相ネ甫領域と、ハイプリダイズに寄与する塩基配列からなり、検出対象の核酸ターゲット群のうち特定の核酸ターゲットに対して特異的にハイブリダィズする選択領域及び検出対象の核酸ターゲットが共通して有するリンカー配列の全部または一 §I こ対して相補的な調節領域からなる相補領域とを含み、上記基板上に固定された複数の核酸プローブとを備え、

上記調節領域の長さは、上記複数の核酸プローブにおける相補領域の Tm値を近づけるように設計されたことを特徴とする核酸マイクロアレイ。

2 . 上記選択領域が n個の塩基からなり、アデニン、グァニン、チミン及びシトシンの全ての組合せに相当する 4ⁿ種類の選択領域を有することを特徴とする請求項 1 記載の核酸マイクロアレイ。

3 . 上記核酸プローブは、上記調節領域が上記選択領域を挟み込み、上記非相捕領域が上記相補領域を挟み込むように構成されたことを特徴とする請求項 1 記載の核酸マイクロアレイ。

4 . 上記選択領域の 3 ' 末端側に位置する調節領域の長さと、上記選択領域の 5 ' 末側に位置する調節領域の長さとが異なることを特徴とする請求項 3記載の核酸マイクロアレイ。

5 . 上記複数の核酸プローブは全て同じ長さであることを特徴とする請求項 1記載の核酸マイクロアレイ。

6 . 上記リンカー配列は配列番号 1記載の塩基配歹 IIにおける 25〜32番目の領域を除く^:基配列であることを特徴とする請求項 1記載の核酸マイクロアレイ。

7 . 請求項 1、 3、 4、 5及び 6のいずれか一項言己載の DNAチップにおける選択領域が n個の塩基からなり、アデニン、グァニン、チミン及びシトシンの全ての組合せに相当する 4ⁿ種類の選択領域の一部を有する、複数の核酸マイクロアレイから構成され、

上記 4"種類の選択領域は、上記複数の核酸マイクロアレイのうちいずれか 1の核酸マイクロアレイに含まれていること特徴とする核酸マイクロアレイセット。

8 . 生体試料由来のユニーク配列と、他の核酸ターゲットと共通するリンカ一配列とを含む核酸ターゲットに対してハイブリダイズする核酸プローブであつて、ハイブリダィズに寄与しない塩基配列からなる非相補領域と、ハイブリダィズに寄与する塩基配列からなり、上記ユニーク配列に特異的にノ、イブリダィズする選択領域及び上記リンカ一配列の全部または一部に対して相浦的な調節領域からなる相補領域とを含む核酸プロ一ブを設計する方法であって、

異なる選択領域を有する複数の核酸プローブにおける、各相補領域の Tra値が近づくように上記調節領域の長さを設計する工程とを含む核酸プローブの設計方法。

9 . 上記選択領域の塩基配列を設計する工程では、 n 個の塩基からなる選択領域に対して、アデニン、グァニン、チミン及びシトシンの全ての組合せに相当する 4ⁿ種類の塩基配列を設計することを特徴とする請求項 8言己載の核酸プ口一ブの設計方法。

1 0 . 上記調節領域の長さを設計する工程は、複数の核酸プローブにおける各選択領域のグァニン及びシトシン含量（GC含量）を算出するェ程を含み、選択領域の GC含量が高い場合には調節領域の長さを短く設計し、選尺領域の GC含量が低い場合には調節領域の長さを長く設計することを特徴とする請求項 8記載の核酸プ口一プの設計方法。

1 1 . 上記調節領： !·或の長さを設計する工程は、上記 GC含量を算出する工程の後、算出した GC含量が同じである複数の選択領域の全てについて Tm値を算出し、値の平均値よりも高い Tm値を示す選択領域については調節鎮域の長さを短く設計し、 Tm値の平均値よりも低い Tm値を示す選択領域については調節領域の長さを長く設計することを特徴とする請求項 1 0記載の核酸プローブの設計方法。

1 2 . 上記調節領域の長さを設計する工程は、複数の核酸プローブにおける各選択領域のグァニン及びシトシン含量（GC含量）の偏りを評価する工程を含み、選択領域の GC含量に偏りがある場合には、当該選択領域の 3 ' 端側に設計する調節領域の長さと、当該選択領域の 5 ' 末端側に設計する調節慎域の長さとを異ならせるように設計することを特徴とする請求項 8記載の核酸プローブの設計方法。

1 3 . 生体試料から核酸を抽出する工程と、

抽出した核酸又は当該核酸を用いて合成された cDNA を第 1の制限酵素により切断する工程と、

Typells 制限酵素認識酉己列を有する第 1のリンカ一を、上記第 1の制限酵素による処理で形成された核酸又は cDNAの端部に結合する工程と、

第 1のリンカーを結合した核酸又は cDNAを、認識部位から一定の長さ離れた箇所を切断できる Typells制」限酵素により切断して、当該第 1のリンカー及び上記核酸又は cDNAの一部を有する核酸断片を調製する工程と、

上記核酸断片における Typells制限酵素処理末端に第 2 のリンカーを結合する工程とを含み、

生体試料由来のユニーク配列と第 1のリンカー及び第 2 のリンカーからなるリンカーとを含む核酸ターゲットを調製する核酸ターゲットの調製方法。

1 4 . 上記第 1の制限酵素により切断する工程に先立って、生体試料から抽出した核酸又は当該核酸を用いて合成された cDNA における一方端部を担体に付着する工程と、

上記第 1の制限酵素により切断する工程の後、上記担体に付着した核酸又は cDNAを分離する工程とを: Sに含み、

上記第 1 のリンカーを、上記担体に付着した核酸又は cDNAの端部に結合することを特徴とする請求項 1 3記載の核酸ターゲットの調製方法。

1 5 . 上記第 2のリンカ一を結合する工程に先立って、上記核酸又は cDNA を付着した担体を除去する工程を更に含むことを特徴とする請求項 1 3記載の核酸ターゲットの調製方法。

1 6 . 上記第 2のリンカーに含まれるプロモータからの転写により蛍光標識 RNA 鎖を合成する工程を更に含むことを特徴とする請求項 1 3記載の核酸ターグットの調製方法。

1 7 . 生体試料由来のユニーク配列と、他の核酸ターゲットと共通するリンカー配列とを含む核酸ターゲットを含む溶液を、ハイプリダイズに寄与しない塩基配列からなる非相補領域と、ハイブリダィズに寄与する塩基配列からなり、上記ユニーク配列に特異的にハイブリダイズする選択領及ぴ上記リンカー配列の全部または一部に対して相補的な調節領域からなる相植領域とを含む核酸プロ一ブを基板上に固定してなる核酸マイクロアレイに対して接触させる工程と、上記核酸マイクロアレイの核酸プローブにハイブリダイズした核酸ターゲットを検出する工程とを含む遺伝子検出方法。

1 8 . 上記選択領域が n個の塩基からなり、アデニン、グァニン、チミン及ぴシトシンの全ての組合せに相当する 4ⁿ種類の選択領域を有することを特徴とする請求項 1 7記載の遺伝子検出方法。

1 9 . 上記核酸プローブは、上記調節領域が上記選択領域を挟み込み、上記非相補領域が上記相補領域を挟み込むように構成されたことを特徴とする請求項 1 7記載の遺伝子検出方法。

2 0 . 上記複数の核酸プローブは全て同じ長さであることを特徴とする請求項 1 7記載の遺伝子検出方法。

2 1 . 上記リンカ一配列は配列番号 1記載の塩基配歹 IJにおける 25〜32番目の領域を除く塩基配列であることを特徴とする請求項 1 7記載の遺伝子検出方法。