JPH10272000A

JPH10272000A - コンピュータを利用した生物学的配列の解析技術

Info

Publication number: JPH10272000A
Application number: JP9369833A
Authority: JP
Inventors: Teresa A Webster; ・ウェブスターテレサ・エー．; Macdonald S Morris; モリス・エス．・マクドナルド; Michael P Mittmann; マイケル・ピー．・ミットマン; David J Lockhart; デビット・ジェイ．・ロックハート; Ming-Hsiu Ho; ミン−スー・ホー; Derek Bernhart; デレク・バーンハート; Luis C Jevons; ルイス・シー．・ジェボンス
Original assignee: Affymetrix Inc
Current assignee: Affymetrix Inc
Priority date: 1996-12-12
Filing date: 1997-12-11
Publication date: 1998-10-13
Also published as: EP0848067A2; US6600996B2; US20020183933A1; EP0848067A3

Abstract

(57)【要約】【課題】核酸のような生物学的配列を解析するための
コンピュータ支援技術を提供する。【解決手段】コンピュータシステムは、核酸プローブ
と検体核酸配列との間のハイブリッド形成親和性を示す
ハイブリッド形成強度を解析して、検体配列における塩
基を呼び出す（塩基コールを行う）。複数の塩基コール
を組み合わせることにより、単一の塩基コールを形成す
る。また、コンピュータシステムは、ハイブリッド形成
強度を解析することによって、遺伝子発現を監視した
り、あるいは、基準からの遺伝子発現の変化を監視した
りする。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、コンピュータシス
テムの分野に関する。更に詳しくは、本発明は、核酸配
列等の生物学的配列を解析するためのコンピュータシス
テムに関する。

【０００２】

【従来の技術】基質上で物質の配列（アレイ）を形成
し、利用するための装置やコンピュータシステムが知ら
れている。例えば、本明細書に組み込まれるＰＣＴ出願
ＷＯ９２／１０５８８には、核酸等の物質の配列を決定
し、あるいは、その配列をチェックする手法が述べられ
ている。このような操作を実行するための配列（アレ
イ）は、本明細書に組み込まれる米国特許第５，１４
３，８５４号および米国特許出願第０８／２４９，１８
８号に開示されているパイオニア的手法等の方法に従っ
て形成される。

【０００３】これらにおいて説明されている手法に従っ
て、核酸プローブの配列（アレイ）を、基質あるいはチ
ップ上の既知の位置に形成する。次に、蛍光標識された
核酸をチップに接触させて、標識された核酸がチップに
結合している位置を示すイメージファイル（イメージフ
ァイルは処理されてセルファイルになる）をスキャナー
で生成する。このセルファイルと所定の位置におけるプ
ローブの強度とに基づいて、ＤＮＡあるいはＲＮＡのモ
ノマー配列のような情報を得ることが可能になる。この
ようなシステムを用いることにより、例えば、膵嚢胞性
線維症に関係する突然変異、（所定の癌に関係する）Ｐ
５３遺伝子、ＨＩＶ等の遺伝子特性の研究および検出に
利用可能なＤＮＡの配列（アレイ）が形成される。

【０００４】

【発明が解決しようとする課題】本明細書に組み込まれ
る米国特許出願第０８／５３１，１３７号（代理人事件
番号１６５２８Ｘ−００８２１０）、第０８／５２８，
６５６号（代理人事件番号１６５２８Ｘ−０１７６０
０）、および、第０８／６１８，８３４号（代理人事件
番号１６５２８−０１６４００）に、塩基呼び出しを行
うための革新的なコンピュータ利用技術が開示されてい
る。しかし、これらのパイオニア的手法によって現在利
用され、また、利用可能になっている膨大な量の情報を
評価・解析処理するためには、更に、コンピュータシス
テムおよび方法を改良することが必要となる。

【０００５】更に、遺伝子発現を監視するためのコンピ
ュータ利用技術の改良も必要である。多くの病態は、遺
伝子ＤＮＡの複製回数の変化あるいは所定の遺伝子の
（例えば、開始、ＲＮＡ前駆体の供給、ＲＮＡプロセッ
シング等の制御による）転写レベルの変化に起因する種
々の遺伝子の発現レベルにおける相違によって特徴づけ
ることができる。例えば、遺伝物質の損失および獲得
は、悪性の形態変換及び進行に重要な役割を果たす。ま
た、（例えば、腫瘍遺伝子あるいは腫瘍抑制遺伝子等
の）所定の遺伝子の発現（転写）レベルの変化は、種々
の癌の存在および進行を示す指標として働く。

【０００６】病気や細胞周期及び細胞発育の制御も、所
定の遺伝子の転写レベルの変化によって特徴づけられ
る。例えば、ウィルス感染は、所定のウィルスの遺伝子
の発現増強によって特徴づけられることが多い。例え
ば、単純ヘルペスウィルス感染、（伝染性単核症等の）
エプスタイン−バールウィルス感染、サイトメガロウィ
ルス感染、水痘−帯状ヘルペスウィルス感染、パルボウ
ィルス感染、ヒトパピローマウィルス感染等の発生は、
すべて、それぞれのウィルスに存在する種々の遺伝子の
発現増強によって特徴づけられる。特徴的なウィルス遺
伝子の増強発現レベルを検出することによって、その病
態を効果的に診断することが可能になる。特に、単純ヘ
ルペスウィルス等のウィルスは、長い潜伏期間を経て、
突然、短い時間で、爆発的に複製される。特徴的なウィ
ルス遺伝子の発現レベルを検出することによって、この
ような活動的な増殖（おそらくは、その結果としての感
染）状態を検出することが可能になる。

【０００７】

【課題を解決するための手段およびその作用・効果】本
発明は、核酸配列等の生物学的配列（生体配列）を解析
するための革新的なシステムおよび方法を提供する。コ
ンピュータシステムは、検体配列における塩基を呼び出
すために、核酸プローブと検体の核酸配列とのハイブリ
ッド形成親和性を示すハイブリッド形成強度を解析する
ことができる。複数の塩基コールは、単一の塩基コール
を形成するために組み合わせるようにしてもよい。更
に、コンピュータシステムは、遺伝子発現、あるいは、
基準（基線）と比較された遺伝子発現の変化を監視する
ために、ハイブリッド形成強度を解析するようにしても
よい。

【０００８】本発明の一態様によれば、検体の核酸配列
における未知の塩基を呼び出すためのコンピュータによ
る方法は、複数組の核酸プローブに関するハイブリッド
形成強度であって、それぞれ核酸プローブと前記検体の
核酸配列との間のハイブリッド形成親和性を示すハイブ
リッド形成強度を受け取る工程と、各組のプローブに関
して前記未知の塩基に対する塩基コールを演算する工程
と、前記複数組のプローブに関して最も発生頻度の高い
前記未知の塩基に対する塩基コールに従って、前記複数
組のプローブに関する単一の塩基コールを演算する工程
と、を備える。典型的には、この単一塩基コールがスク
リーンディスプレイ上に表示され、ユーザは、この単一
塩基コールの由来である複数の塩基コールを表示するか
あるいは表示しないかを選択できる。

【０００９】本発明の別の態様によれば、コンピュータ
による塩基呼び出し処理に関するパラメータを動的に変
更する方法は、ユーザによって変更可能なパラメータを
含む前記塩基呼び出し処理を利用して、検体の核酸配列
の少なくとも一部に関する複数の塩基コールを生成する
工程と、前記検体の核酸配列の少なくとも一部に関する
前記複数の塩基コールを表示する工程と、前記塩基呼び
出し処理のパラメータを表示する工程と、前記塩基呼び
出し処理のパラメータに対する新しい値を特定する入力
をユーザーから受け取る工程と、前記塩基呼び出し処理
と前記パラメータに対する新しい値とを用いて、前記検
体の核酸配列の少なくとも一部に対する更新された塩基
コールを生成する工程と、前記検体の核酸配列の少なく
とも一部に対する前記更新された塩基コールを表示する
工程と、を備える。典型的には、ユーザーによって変更
可能なパラメータは、定数、閾値、または、範囲であ
る。

【００１０】本発明の更に別の態様によれば、検体の核
酸配列において遺伝子の発現を監視するコンピュータに
よる方法は、前記遺伝子に対して完全に相補的である完
全対合プローブ（パーフェクトマッチプローブ）と前記
遺伝子に対して不対合な塩基を少なくとも一つ備える不
対合プローブ（ミスマッチプローブ）との複数のプロー
ブ対に関する複数のハイブリッド形成強度であって、前
記完全対合および不対合プローブと前記検体の核酸配列
との間のハイブリッド形成親和性を示すハイブリッド形
成強度を入力する工程と、各対の完全対合プローブと不
対合プローブのハイブリッド形成強度を比較する工程
と、前記検体の核酸配列の遺伝子発現コールを生成する
工程と、を備える。好ましい実施例においては、発現コ
ールは、発現している、どちらともいえない、または、
発現していない、として示される。

【００１１】本発明の別の態様によれば、検体の核酸配
列において遺伝子の発現変化を監視するコンピュータに
よる方法は、前記遺伝子に対して完全に相補的である完
全対合プローブと前記遺伝子に対して不対合な塩基を少
なくとも一つ備える不対合プローブとの複数のプローブ
対に関する複数のハイブリッド形成強度であって、前記
完全対合および不対合プローブと前記検体の核酸配列と
の間のハイブリッド形成親和性を示すハイブリッド形成
強度を入力する工程と、前記検体の核酸配列の遺伝子発
現レベルを生成するために、各対の完全対合プローブと
不対合プローブのハイブリッド形成強度を比較する工程
と、前記遺伝子発現レベルを、基準の遺伝子発現レベル
と比較することにより発現変化を決定する工程と、を備
える。発現の変化を、ディスプレイスクリーン上にグラ
フとして表示するようにしてもよい。

【００１２】本発明の性質及び利点を更に理解するため
に、以下に、図面に基づいて、本発明を詳細に説明す
る。

【００１３】

【発明の実施の形態】概要本発明は、検体の核酸配列においてヌクレオチドを同定
し（即ち、塩基を呼び出し）、遺伝子発現を監視するた
めの革新的な方法を提供する。以下に、本発明の好適な
実施例を説明する。但し、以下の実施例は、例示に過ぎ
ず、発明の範囲を限定するものではない。

【００１４】図１は、本発明のソフトウェアを実行する
ために用いられるコンピュータシステムの例を示す。図
１に示すコンピュータシステム１は、モニタ３、スクリ
ーン５、キャビネット７、キーボード９、および、マウ
ス１１を備える。マウス１１は、マウスボタン１３等の
一つあるいは複数のボタンを有する。キャビネット７に
は、本発明のコンピュータコードを含むソフトウェアプ
ログラムを記憶して検索するために用いられるＣＤ−Ｒ
ＯＭドライブ１５及び（図示しない）ハードドライブが
収容されている。この実施例では、ＣＤ−ＲＯＭ１７が
コンピュータ読み取り可能な媒体として示されている
が、フロッピーディスク、ＤＲＡＭ、ハードドライブ、
フラッシュメモリ、テープ等、他のコンピュータ読み取
り可能な媒体を用いることもできる。キャビネット７に
は、更に、プロセッサ、メモリ等の（図示しない）周知
のコンピュータ構成部品が収容されている。

【００１５】図２は、本発明のソフトウェアを実現する
ために用いられるコンピュータシステム１を示すシステ
ムブロック図である。図１に示すように、コンピュータ
システム１は、モニタ３とキーボード９を備える。コン
ピュータシステム１は、更に、中央処理装置５０、シス
テムメモリ５２、入出力制御装置５４、ディスプレイア
ダプタ５６、リムーバブルディスク５８、固定ディスク
６０、ネットワークインターフェース６２、スピーカ６
４等のサブシステムを備える。リムーバブルディスク５
８は、フロッピー、テープ、ＣＤ−ＲＯＭ、可動ハード
ドライブ、フラッシュメモリ等の取り外し可能なコンピ
ュータ読み取り可能な媒体を示す。また、固定ディスク
６０は、内蔵ハードドライブ等を示す。更に、コンピュ
ータシステムに、本発明の実現に適した他のサブシステ
ムを備えるようにしてもよい。例えば、コンピュータシ
ステムに２つ以上の処理装置５０を備えるようにしても
よいし（即ち、マルチプロセッサシステム）、メモリキ
ャッシュを備えるようにしてもよい。

【００１６】６６等の矢印は、コンピュータシステム１
のシステムバス・アーキテクチャを示す。但し、この矢
印は、サブシステムを連結するあらゆる結合スキームを
示すものである。例えば、ディスプレイアダプタ５６が
ローカルバスを介して中央処理装置５０に接続されるよ
うにすることもできるし、あるいは、システムがメモリ
キャッシュを備えるようにすることもできる。図２に示
されるコンピュータシステム１は、本発明の実現に適し
たコンピュータシステムの一例に過ぎず、当業者に周知
のように、サブシステムの他の構成において本発明を実
現することも可能である。コンピュータシステムの一例
として、サン・マイクロシステムズ社のワークステーシ
ョンを用いることもできる。

【００１７】ＶＬＳＩＰＳ技術（商標）は、非常に小さ
なチップ上に、非常に大きなオリゴヌクレオチドプロー
ブの配列（アレイ）を形成するための方法である。詳細
は、本明細書に組み込まれる米国特許第５，１４３，８
５４号およびＰＣＴ特許公報ＷＯ９０／１５０７０およ
び９２／１００９２を参照のこと。チップ上のオリゴヌ
クレオチドプローブを用いて、対象となる検体核酸（以
下、「標的」核酸）の相補的核酸配列を検出する。

【００１８】本発明は、ハイブリッド形成された核酸プ
ローブを含むチップに関してハイブリッド形成強度ファ
イルを解析する方法を提供する。本実施例において、こ
のファイルは、生物学的配列から得られる蛍光データを
表しているが、放射性強度データ等の他のデータを表す
ようにしてもよい。即ち、本発明は、ハイブリッド形成
の蛍光測定値の解析に限定されるものではなく、ハイブ
リッド形成の他の測定値の解析にも容易に適用可能であ
る。

【００１９】本発明は、チップマスクを設計し、チップ
上でプローブを合成し、核酸を標識して、ハイブリッド
形成された核酸プローブを走査するコンピュータシステ
ムの一部として説明する。このようなシステムは、本明
細書に組み込まれる米国特許出願第０８／２４９，１８
８号に詳細に説明されている。但し、本発明は、例えば
遠隔位置に置かれたシステムによって生成されるデータ
を解析するために、全体システムとは独立に利用するこ
とも可能である。

【００２０】図３は、ＲＮＡやＤＮＡ等の生体物質の配
列（アレイ）を形成し、解析するコンピュータ化された
システムを示す。コンピュータ１００は、ＲＮＡあるい
はＤＮＡ等の生体高分子の配列（アレイ）を設計するた
めに用いられる。ここで、コンピュータ１００は、図１
及び図２に示すように、例えば、適当なメモリとＣＰＵ
を備え、ウィンドウズＮＴ環境下にある適当にプログラ
ムされたＩＢＭパーソナルコンピュータ互換機である。
コンピュータシステム１００には、対象となる遺伝子の
特性に関するユーザーからの情報、および、その配列
（アレイ）の所望の特性に関する情報が入力される。あ
るいは、ＧｅｎＢａｎｋ等の外部あるいは内部データベ
ース１０２から、対象となる所定の遺伝子配列に関する
情報を入力するようにしてもよい。コンピュータシステ
ム１００は、ＰＣＴ出願ＷＯ９２／１００９２に記載さ
れているような転換行列の形で一組のチップ設計コンピ
ュータファイル１０４および他の関連コンピュータファ
イルを出力する。

【００２１】チップ設計ファイルは、ＤＮＡ等の分子配
列の形成に用いられるリソグラフィックマスクを設計す
るためのシステム１０６に与えられる。システムあるい
はプロセス１０６が、マスク１１０の製造に必要なハー
ドウェア、および、効率よくマスク上にマスクパターン
を配置するために必要なコンピュータハードウェア並び
にソフトウェア１０８を備えるようにしてもよい。図３
の他の特性と同様に、このような構成要素を物理的に同
一の位置に配置させてもさせなくてもよいが、図示の便
宜上、図３では同じところに表示している。システム１
０６は、マスク１１０、あるいは、クロム−ガラスマス
ク等、高分子配列（アレイ）の形成に用いられる他の合
成パターンを生成する。

【００２２】合成システム１１２では、マスク１１０お
よびシステム１００から入力されるチップ設計に関する
所定の情報が用いられる。合成システム１１２は、基質
あるいはチップ１１４上に高分子配列（アレイ）を形成
するために必要なハードウェアおよびソフトウェアを備
える。例えば、合成装置１１２は、光源１１６および基
質あるいはチップ１１４が載置される化学フローセル１
１８を備える。マスク１１０を光源と基質／チップとの
間に置いて、チップの所定領域から保護剤を除去するた
めに、適当な回数、基質とマスクとの間を相対的に並進
させる。所定の薬剤をフローセル１１８から流して、保
護除去された領域への結合、および、洗浄等の操作を行
う。このような操作は、全て、適当にプログラムされた
コンピュータ１１９によって実行される構成が望まし
い。ここで、コンピュータ１１９は、マスク設計及びマ
スク形成に用いられたコンピュータと同じコンピュータ
でも違うものでもよい。

【００２３】合成システム１１２によって形成された基
質をより小さなチップに分割して、マークされた標的に
曝すようにしてもよい。ここで、標的は、基質上の一つ
あるいは複数の分子に対して相補的であってもよく、あ
るいはそうでなくてもよい。また、標的は、（図３に＊
印で示す）蛍光標識等の標識でマークされ、走査システ
ム１２０内に配置される。走査システム１２０は、適当
にプログラムされたデジタルコンピュータ１２２によっ
て制御される。このデジタルコンピュータ１２２も、合
成、マスク形成、およびマスク設計に用いられたコンピ
ュータと同じコンピュータでも違うものでもよい。スキ
ャナ１２０は、標識された標的（＊）が基質に結合した
位置を検出するために用いられる共焦顕微鏡あるいはＣ
ＣＤ（電荷結合素子）等の検出装置１２４を備える。ス
キャナ１２０は、蛍光標識された標的の場合には、基質
上の位置の関数として蛍光強度（フォトン数あるいは電
圧のような他の関係する測定値）を示すイメージファイ
ル１２４を出力する。標識された標的が高分子配列（ア
レイ）とより強固に結合している部分ではフォトン数が
大きくなり、また、基質上の高分子中のモノマー配列は
位置の関数として既知であるため、標的と相補的な基質
上の高分子の配列を決定することができる。

【００２４】イメージファイル１２４は、本発明の視覚
化および解析方法を組み込んだ解析システム１２６に入
力される。この解析システムも種々のコンピュータシス
テムのいずれでもよい。本発明は、チップ設計ファイル
およびイメージファイルを解析して、適当な出力１２８
を与える様々な方法を提供する。また、本発明を用い
て、ＤＮＡあるいはＲＮＡ等の標的における所定の突然
変異を同定するようにしてもよい。

【００２５】図４は、本発明の一実施例で用いられる全
体的なソフトウェアシステムの概要を示す。図４に示さ
れるように、システムは、まず、ステップ２０２で、所
定の解析の対象となる遺伝子配列、即ち、標的を同定す
る。対象となる配列は、例えば、遺伝子の正常部分ある
いは突然変異部分、遺伝を決定づけるあるいは修辞的情
報を与える遺伝子等である。テキストファイルの手動入
力によって配列を選択してもよいし、あるいは、Ｇｅｎ
Ｂａｎｋ等の外部資源から選択するようにしてもよい。
ステップ２０４では、システムが遺伝子の評価を行うこ
とにより、チップ上でどのプローブが望ましいかを決定
し、あるいは、ユーザーが決定するための情報を与え、
チップ上でのプローブの適当な「レイアウト」を求め
る。

【００２６】チップは、通常、既知の配列を有する標準
核酸配列に対して相補的なプローブを備える。野生型プ
ローブは、参照配列（標準配列）と理想的にハイブリッ
ド形成するプローブであり、野生型遺伝子（チップ野生
型とも称される）は、従って、チップ上の野生型プロー
ブと理想的にハイブリッド形成する。標的配列は、突然
変異、挿入、欠失等の存在を除いては、参照配列とほぼ
同じである。このレイアウトは、遺伝配列の「読み込
み」及び／あるいは周縁効果の最小化、合成の容易さ等
を可能にするチップ上の構成を含む所望の特性を実現す
るものである。

【００２７】図５は、チップの全体的なレイアウトを示
す。チップ１１４は、複数のユニットから成り、各ユニ
ットには、一つの野生型配列あるいは複数の野生型配列
が様々な配置で並べられている。図にはユニット１の詳
細を示してあるが、このように、各ユニットは、プロー
ブを含むチップ上の領域である複数のセルから形成され
ている。各ユニットは、複数組の関連するセルを含む。
ここで、セルは、一つあるいは複数の分子（例えば、核
酸プローブ）の多くの複製を含む基質上の領域を意味す
る。

【００２８】各ユニットは、縦横（横は「レーン」）に
配置された複数のセルから成る。例えば、５つの関連セ
ルから成る組には、野生型セル２２０、「突然変異」セ
ル２２２、「ブランク」セル２２４が含まれる。セル２
２０は、野生型配列の一部の補体である野生型プローブ
を含む。セル２２２は、野生型配列に対する「突然変
異」プローブを含む。例えば、野生型プローブが３'−
ＡＣＧＴである場合、３'−ＡＣＡＴ、３'−ＡＣＣＴ
、３'−ＡＣＧＴ、および、３'−ＡＣＴＴは「突然
変異」プローブである。セル２２４は、プローブを含ま
ない「ブランク」セルである（「ブランク」プローブと
も称される）。ブランクセルにはプローブが含まれない
ため、標識された標的はこの領域でチップに結合しな
い。このため、ブランクセルの領域を用いて、バックグ
ラウンド強度の測定が行われる。

【００２９】図４に戻って、ステップ２０６で、合成用
のマスクが設計される。ステップ２０８では、ソフトウ
ェアがマスク設計およびレイアウト情報を利用すること
により、ＤＮＡ等の高分子チップが形成される。このソ
フトウェア２０８は、基質とマスクとの相対的な並進、
所望の薬剤のフローセル内における流れ、フローセル内
の合成温度等のパラメータを制御する。ステップ２１０
では、他のソフトウェアを用いて、以上のようにして合
成され、標識された標的に曝されたチップを走査する。
ソフトウェアは、チップの走査を制御して、後に配列情
報を得るために用いられるファイルに得られたデータを
格納する。

【００３０】ステップ２１２で、コンピュータシステム
は、レイアウト情報と蛍光情報とを用いて、チップ上で
ハイブリッド形成された核酸プローブの評価を行う。Ｄ
ＮＡチップから得られる重要な情報としては、突然変異
標的の同定、及び、特定の標的の遺伝子配列の決定が挙
げられる。

【００３１】図６は、特定の標的ＤＮＡがＤＮＡプロー
ブ１１４の配列（アレイ）に結合している状態を示す。
この簡単な例に示されるように、配列中に以下のプロー
ブが形成される（野生型プローブに関しては一つのプロ
ーブだけが示されている）。

【００３２】

【００３３】これらのプローブでは、それぞれ、一つの
塩基のみが異なっている。即ち、調査位置において単一
の塩基不対合が存在する。従って、核酸配列中のこの調
査位置における塩基を同定するように、プローブが設計
される。即ち、ここでは、１つのユニットとは、複数組
の関連するプローブのことを言い、各組には、調査位置
における単一の塩基不対合が異なる複数のプローブが含
まれる。

【００３４】５'−ＴＣＴＴＧＣＡの配列を有する蛍光
標識された（あるいは別の方法でマークされた）標的を
ＤＮＡプローブの配列（アレイ）に曝した場合、これ
は、３'−ＡＧＡＡＣＧＴプローブのみに相補的であ
り、フルオレセインは、３'−ＡＧＡＡＣＧＴが位置す
るチップ表面上で主に観察される。一つの塩基のみがそ
れぞれ異なる各組のプローブに関するイメージファイル
には、各々プローブに対応する４つの蛍光強度が含まれ
る。即ち、蛍光強度は、各々、他のプローブとは異なる
各プローブのヌクレオチドあるいは塩基に結びつけられ
る。更に、イメージファイルには、バックグラウンドの
蛍光強度として用いられる「ブランク」セルが含まれ
る。特定の塩基位置に関する５つの蛍光強度を解析する
ことにより、ここに開示される本発明の方法を用いて、
このような配列（アレイ）から配列（シーケンス）情報
を得ることができる。

【００３５】図７は、チップ上に列で配置されたプロー
ブを示す。参照配列（即ち野生型チップの配列）を下つ
きの数字で示された５つの調査位置と共に示す。調査位
置は、多くの場合、標的配列が突然変異を含む、即ち、
標的配列が参照配列と異なっているような、参照配列中
の塩基位置である。チップには、それぞれの調査位置に
対応する５つのプローブセルが含まれる。プローブセル
には、各々、調査位置に共通の塩基を有するプローブの
組が含まれる。例えば、参照配列は、第一の調査位置Ｉ
₁に塩基Ｔを有する。この調査位置に関する野生型のプ
ローブは、３'−ＴＧＡＣであり、プローブ中の塩基Ａ
は、参照配列における調査位置の塩基に対して相補的で
ある。

【００３６】この第一の調査位置Ｉ₁に関しては、４つ
の「突然変異」プローブセルが存在する。４つの突然変
異プローブは、それぞれ、３'−ＴＧＡＣ、３'−ＴＧ
ＣＣ、３'−ＴＧＧＣ、３'−ＴＧＴＣである。４つの
突然変異プローブは、それぞれ調査位置において一つの
塩基のみが異なっている。図示するように、野生型のプ
ローブと突然変異プローブはチップ上に列配置されてい
る。突然変異プローブのうちの一つ（この場合には、
３'−ＴＧＡＣ）は、野生型のプローブと等しいため、
突然変異を証明するものとはならない。但し、図８に示
すように、冗長性により突然変異を視覚的に示すことが
できる。

【００３７】図７に示すように、チップは、他の調査位
置Ｉ₂−Ｉ₅の各々に関しても、野生型プローブと突然
変異プローブを有している。それぞれの場合において、
野生型プローブは突然変異プローブの一つと等価であ
る。

【００３８】図８は、チップ上の標的と図７の参照配列
とのハイブリッド形成パターンを示している。比較のた
めに、チップの一番上に参照配列を示している。チップ
には、ＷＴ列（野生型）、Ａ列、Ｃ列、Ｇ列、Ｔ（また
はＵ）列が含まれる。各列は、プローブを含むセル列で
ある。ＷＴ列のセルは、参照配列に相補的なプローブを
含む。Ａ列、Ｃ列、Ｇ列、Ｔ列のセルは、それぞれ、列
の名称となっている塩基が調査位置に存在することを除
けば参照配列に対して相補的であるプローブを含んでい
る。

【００３９】一実施例においては、セル内のプローブの
ハイブリッド形成は、標識された標的配列の結合に起因
するセルの蛍光強度（例えば、フォトン数）によって決
定される。蛍光強度はセルによって大きく異なる。単純
化するために、図８では、領域を塗りつぶすことによっ
て、セルが高度のハイブリッド形成をしていることを示
す。ＷＴ列を観察すると、調査位置Ｉ₄において野生型
セルの領域が塗りつぶされていないため、この位置Ｉ₄
に突然変異が存在することが容易にわかる。Ｃ列のセル
は塗りつぶされているため、ＴからＧへの突然変異であ
ることがわかる（突然変異プローブは相補的であるた
め、ＣセルはＧ突然変異を示す）。好ましい実施例で
は、ＷＴ列は利用されず、調査位置の塩基を呼び出すた
めに、（「ブランク」セルを含まない）４つのセルが使
用される。

【００４０】実際には、突然変異が存在する調査位置近
傍のセルの蛍光強度は相対的に低く、突然変異の周囲は
「暗い領域」となる。このように蛍光強度が低くなるの
は、突然変異近辺の調査位置のセルは、標的配列と完全
に相補的なプローブを含んでおらず、その結果、これら
のプローブと標的配列とのハイブリッド形成率が低いか
らである。例えば、調査位置Ｉ₃及びＩ₅において、そ
れらの位置に存在するプローブはどれも標的配列に相補
的でないため、セルの相対的強度が比較的低くなる。蛍
光強度が低いとデータの解像度も低くなるが、本発明の
方法を用いることによって、突然変異周囲の暗い領域で
も精度よく塩基を呼び出すことができ、暗い領域内に存
在する他の突然変異を同定することができる。

【００４１】図９は、チップ上における標準タイル構造
及び代替タイル構造を示す。図示するように、チップに
は１２のユニット（ユニット_1-12）が含まれている。ユ
ニット_1-4は、同一の参照配列に相補的なプローブを含
むようにタイル状に構成されている（即ち、チップ上で
設計され、合成されている）。以下、このユニットグル
ープを標準グループと称する。本発明では、他に明記し
ない限り、標的配列に関する塩基コールには標準グルー
プが用いられる。

【００４２】ユニット_5-8は、標準グループの参照配列
とは異なった同一の参照配列に相補的であるプローブを
含むようにタイル状に構成される。以下、このユニット
グループを代替グループと称する。ユニット_9-12は、標
準グループ及び第一の代替グループの参照配列とは異な
った参照配列に基づく別の代替グループを構成してい
る。これらの参照配列は、互いに異なってはいるが、多
くの場合、かなり似ている。例えば、参照配列を、少し
ずつ異なったＨＩＶの突然変異としてもよい。本発明の
実施例は、標的配列の塩基コールには通常用いられない
ような参照配列に基づくタイル構成からの情報を評価
し、利用する。

【００４３】あるグループ内の複数のユニットは同一の
プローブを備えるようにしてもよいし、異なった構造の
プローブを備えるようにしてもよいし、あるいは、一つ
または複数の別のチップに由来するプローブを備えるよ
うにしてもよい。例えば、１つのユニットが、プローブ
の第三位置に調査位置を有する５量体プローブを備える
ようにしてもよい。また、別のユニットが、第六位置に
調査位置を有する１０量体プローブを備えるようにして
もよい。更に、これらのユニットを同一のチップ上に配
置してもよいし、異なったチップ上に配置してもよい。

【００４４】図９左下の拡大図に示すように、ユニット
の各ブロックには、通常、Ａ、Ｃ、Ｇ、Ｔで示される４
つのセルが含まれる。セル内の各プローブの調査位置に
どの塩基があるかを、この塩基表示によって示してい
る。各セルには、普通、何百、何千という同一の核酸プ
ローブが存在する。

【００４５】好適な実施例では、セルは、参照配列に沿
って、順番に互いに隣接して配置されているが、チップ
上での位置さえ確定されている限り、特定の位置にセル
を配置しなければならないという決まりはない。更に、
実験を首尾一貫したものにするためには、単一のチップ
上で異なったグループを合成することが望ましいが、本
発明の方法を、異なったチップ上の異なった構成から得
られるデータに適用することもできる。

【００４６】標的配列の解析図１０は、チップから得られたハイブリッド形成強度を
表示する画面である。解析が行われる場合、システムに
は、ハイブリッド形成されたチップを走査した画像を含
むイメージファイルが入力される。ここで、イメージフ
ァイルが、蛍光強度と、標識された標的核酸配列あるい
はその切片がチップに結合する位置を示すようにする構
成も望ましい。

【００４７】画面表示（スクリーンディスプレイ）２６
０には、周知のウィンドウ用ＧＵＩ（グラフィカルユー
ザーインターフェース）が用いられている。ユーザーの
選択に従って、イメージファイルが表示される。ユーザ
ーがイメージファイルの表示を選択すると、イメージフ
ァイルを含むウィンドウ２６２が表示される。図示され
ているイメージファイルには、Ａ列、Ｃ列、Ｇ列、Ｔ列
の複数の列が含まれる。

【００４８】ユーザーが表示されているイメージファイ
ル上にカーソルを動かすと、ステータスバー２６４に、
カーソルのＸ、Ｙ座標の位置とその位置における蛍光強
度が示される。また、ポインティング・デバイスを用い
て、イメージファイルの矩形の領域を選択することによ
り、サブイメージを処理することも可能である。例え
ば、サブイメージを拡大して、個々のセルがもっとはっ
きりと見えるようにすることもできる。更に、強度のコ
ントラストを調整することによって、現在のコントラス
トの設定でははっきりしないハイブリッド形成強度の差
異を明確にすることもできる。

【００４９】図１１は、関連するプローブのハイブリッ
ド形成強度に基づいて塩基呼び出し処理を行う方法を示
すフローチャートである。ここで、「関連するプロー
ブ」とは、調査位置におけるヌクレオチド塩基が異なる
プローブを示す。通常、これらのプローブは調査位置を
除いて同一の構成をしているが、更に、別の塩基位置で
も異なる構成にしてもよい。即ち、関連するプローブで
は、少なくとも一つの塩基が異なっている。

【００５０】ステップ３０２で、バックグラウンド強
度、即ち「ブランク」セル強度を差し引くことによっ
て、４つの関連するプローブのハイブリッド形成強度を
調整する。引き算の結果ハイブリッド形成強度がゼロ以
下になる場合には、小さな正の数をハイブリッド形成強
度に設定することが望ましい。このように設定すること
により、以降の計算で、ゼロあるいは負の数での割り算
を避けることができる。

【００５１】ステップ３０４では、ハイブリッド形成強
度を強度順に並べる。次に、ステップ３０６で、最大強
度を、所定のバックグラウンド差分限界値と比較する。
バックグラウンド差分限界値は、未知の塩基を正しく呼
び出すために、最高強度を有するプローブが超えなけれ
ばならないハイブリッド形成強度を示す数値である。即
ち、バックグラウンド調整後の塩基強度は、バックグラ
ウンド差分限界値より大きくなければならない。そうで
ない場合には、未知の塩基を正確に呼び出すことができ
なくなる可能性がある。

【００５２】関連するプローブで最も高いハイブリッド
形成強度がバックグラウンド差分限界値以下の場合に
は、ステップ３０８で、（不十分な強度を示す）コード
Ｎを未知の塩基に割り当てる。そうでない場合には、ス
テップ３１０で、最高のハイブリッド形成強度と二番目
に高いハイブリッド形成強度との比を計算する。

【００５３】次に、ステップ３１２で、ステップ３１０
で計算した比を、所定の比限界値と比較する。比限界値
は、未知の塩基を同定するために必要な比を示す数値で
ある。好ましい実施例においては、比限界値は１．２で
ある。計算された比が比限界値より大きければ、最高の
ハイブリッド形成強度を有するプローブに従って、未知
の塩基が呼び出される。具体的には、ステップ３１４
で、最高強度のプローブ内の調査位置における塩基の補
体を未知の塩基として呼び出す。一方、計算された比が
比限界値以下である場合には、ステップ３１６で、二番
目に高いハイブリッド形成強度と三番目に高いハイブリ
ッド形成強度との比を計算する。

【００５４】次に、ステップ３１８で、ステップ３１６
で計算した比を比限界値と比較する。計算された比が比
限界値より大きい場合には、ステップ３２０で、一番目
と二番目に高いハイブリッド形成強度を有するプローブ
の調査位置における塩基の補体を規定する不確定コード
を、未知の塩基として呼び出す。一方、計算された比が
比限界値以下である場合には、ステップ３２２で、三番
目に高いハイブリッド形成強度と四番目に高いハイブリ
ッド形成強度との比を計算する。

【００５５】次に、ステップ３２４で、ステップ３２２
で計算した比を比限界値と比較する。計算された比が比
限界値より大きい場合には、ステップ３２６で、一番目
ないし三番目に高いハイブリッド形成強度を有するプロ
ーブの調査位置における塩基の補体を規定する不確定コ
ードを、未知の塩基として呼び出す。一方、計算された
比が比限界値以下である場合には、ステップ３２８で、
（不十分な区別を示す）コードＸを未知の塩基に割り当
てる。

【００５６】図１２は、関連するプローブのハイブリッ
ド形成強度に基づいて塩基呼び出し処理を行う他の方法
を示すフローチャートである。このフローチャートで
は、関連するプローブが示すハイブリッド形成強度に基
づいて処理が行われる。即ち、塩基コール処理により、
調査位置における一つの塩基の不対合だけが互いに異な
る複数のプローブ内の調査位置に対応するような、標的
内の塩基が呼び出される。ステップ４０２で、システム
は、標的配列に対して最高のハイブリッド形成強度を有
するプローブが一つだけ存在するかどうかを判定する。
存在しない場合には、不確定を意味するＮを塩基に割り
当てる。例えば、２つのプローブが同じ最高強度を有し
ている場合（即ち、同強度である場合）、その塩基にＮ
を割り当てる。

【００５７】標的に対して最高のハイブリッド形成強度
を有するプローブが一つだけ存在する場合には、ステッ
プ４０６で、そのプローブに従って塩基の呼び出しが行
われる。プローブは標的配列に相補的であるため、プロ
ーブの調査位置における塩基に相補的な塩基（Ｃ／Ｇ、
Ａ／Ｔ）を呼び出すようにしてもよい。

【００５８】次に、ステップ４０８で、システムは、塩
基コール（呼び出された塩基）が突然変異であるかどう
かを判定する。即ち、参照配列の塩基と異なっているか
どうかを判定する。塩基コールが突然変異塩基コールで
ない場合には、塩基コールを確定する。一方、塩基コー
ルが突然変異塩基コールの場合には、システムは、ステ
ップ４１０で所定の「突然変異」条件を満たしているか
どうかを判定し、満たしていない場合には、ステップ４
１２で、Ｎを塩基に割り当てる。

【００５９】以下に突然変異条件の例を説明するが、説
明をわかりやすくするために、関連するプローブのハイ
ブリッド形成強度を次のようにラベルする。HighInt は
最高のハイブリッド形成強度を、SecondInt は二番目に
高いハイブリッド形成強度を、ThirdIntは三番目に高い
ハイブリッド形成強度を、LowIntは最も低いハイブリッ
ド形成強度をそれぞれ示す。

【００６０】例えば、呼び出された塩基が突然変異であ
ると規定する突然変異条件は、以下の３つのテスト全て
を満足させるものでなければならない。第一のテスト
は、HighInt とSecondInt との差が差分限界値より大き
いかどうかを判定するものである。即ち、システムは、
（HighInt−SecondInt）が所定の値より大きいかどうか
を判定する。この所定の値は、最高のハイブリッド形成
強度が次に高いハイブリッド形成強度よりも所望の量だ
け大きい場合にのみ、呼び出された塩基が突然変異塩基
の可能性があると認めるように選択されたものである。

【００６１】第二のテストは、第一の比が第一の比限界
値未満であるかどうかを判定するものである。第一の比
は以下のように規定される。

【００６２】{SecondInt-√(ThirdInt*LowInt)}/ {High
Int-√(ThirdInt*LowInt)}

【００６３】システムは、この第一の比が所定の値未満
であるかどうかを判定する。この所定の値は、２つのよ
り低いハイブリッド形成強度を差し引いた後でも、最高
のハイブリッド形成強度が、次に高いハイブリッド形成
強度に対して所望の比より大きい場合にのみ、呼び出さ
れた塩基が突然変異塩基の可能性があると認めるように
選択されたものである。

【００６４】第三のテストは、隣接比が隣接比限界値よ
り大きいかどうかを判定するものである。隣接比は以下
のように規定される。

【００６５】HighInt_n /｛HighInt_n-√(HighInt_n+1* Hi
ghInt_n-1)｝

【００６６】ここで、添え字のｎは、呼び出されている
対象の塩基位置における値を示す。また、ｎ＋１及びｎ
−１は、隣接する塩基位置における値を示す。システム
は、この隣接比が所定の値より大きいかどうかを判定す
る。この所定の値は、最高のハイブリッド形成強度が、
隣接する最高のハイブリッド形成強度を引いた後の最高
ハイブリッド形成強度に対して所望の比より大きい場合
にのみ、呼び出された塩基が突然変異塩基の可能性があ
ると認めるように選択されたものである。

【００６７】このように、突然変異条件の全てが満たさ
れた場合にのみ、呼び出された塩基が突然変異塩基と規
定される。突然変異はかなりまれであるため、突然変異
が存在する可能性が高い場合にのみ突然変異塩基を呼び
出すようにする。突然変異条件が満たされない場合に
は、呼び出された塩基は不確定であるか、あるいは、標
準塩基と同一である（統計的に、正しい塩基コールの可
能性がある）。

【００６８】この実施例では、３つの突然変異条件を用
いたが、突然変異条件を一つのみ（例えば、上述の条件
のどれが一つ）とすることもできる。また、参照文献と
して先に挙げた米国特許出願に記載されているような塩
基呼び出し方法を利用することもできる。

【００６９】図１３は、一つのユニットグループに関し
て塩基呼び出し処理を行う方法を示すフローチャートで
ある。上述したように、一つのユニットには、複数組の
関連セルが含まれ、関連セルは、調査位置における一つ
の塩基がそれぞれ異なっているプローブを含む。システ
ムは、まず、（例えば、ハイブリッド形成されたチップ
を走査するスキャナによって生成されたイメージデータ
ファイルから）ハイブリッド形成強度を入力し、更に、
このハイブリッド形成強度に対応するプローブの構造を
入力する。次に、バックグラウンド強度（例えば、「ブ
ランク」セルの強度、あるいは、プローブを含まないチ
ップの別の領域において測定された強度）を入力された
ハイブリッド形成強度から引く。ここで、バックグラウ
ンド引き算後のハイブリッド形成強度の最低値を１（フ
ォトン数１）に設定しておいてもよい。

【００７０】ハイブリッド形成強度は、プローブ（ある
いはプローブの複数の複製）と標的配列との間で測定さ
れるハイブリッド形成の度合いを意味する。例えば、測
定されたセルのフォトン数の平均をハイブリッド形成強
度としてもよい。ここで、フォトン数は、セル内のプロ
ーブに結合し、フルオレセインで標識された標的配列に
由来する。

【００７１】ステップ４５２で、システムは、コール処
理の対象となる標的配列の塩基位置を入力する。次に、
ステップ４５４で、グループの各ユニットに関してその
塩基位置における塩基コール処理を実行する。具体的に
は、その塩基位置における各ユニットの関連セルのハイ
ブリッド形成強度を解析する。この解析を行うことによ
り（解析処理の詳細に関しては、図１１及び図１２で既
に説明した）、システムは、各ユニットに関する塩基コ
ールを求める。例えば、グループ内に５つのユニットが
存在する場合には、５つの塩基コールが生成される。

【００７２】システムは、ステップ４５６で、そのグル
ープのユニットに関する複数の塩基コールを解析して、
そのグループの塩基コールを一つ決定する。具体的に
は、そのグループのユニットから呼び出される頻度が一
番高かった塩基を、そのグループの塩基として呼び出す
ように構成してもよい。例えば、５つのユニットが存在
し、各ユニットが次のような塩基コールがなされたとす
る。

【００７３】「Ｔ」−３ユニット「Ｇ」−１ユニット「Ｎ」−１ユニット

【００７４】この場合には、５ユニットのうち３ユニッ
トが呼び出しているＴが、塩基として呼び出される。同
じ頻度で呼び出された塩基が複数ある場合には、塩基を
呼び出すユニットの最高平均ハイブリッド形成強度等の
他のファクターを考慮する。本発明の実施例において
は、図１５に示される方法が用いられる。

【００７５】ステップ４５８で、解析を実行すべき次の
塩基位置が存在するかどうかを判定する。本発明の方法
を適用して、標的核酸配列の全ての塩基位置に関して塩
基コール処理を実行することもできるし、不必要な塩基
位置をスキップして、所定の塩基位置においてのみ塩基
コール処理を実行することもできる。

【００７６】図１４は、複数のユニットグループに関し
て塩基呼び出し処理を行う方法を示すフローチャートで
ある。図９に示したように、解析対象となる一つあるい
は複数のチップ上に複数のグループが存在する場合があ
る。複数のグループは、異なった参照配列に従って配置
されていてもよい。但し、これは、複数のグループのハ
イブリッド形成に関する情報が利用されない可能性を示
すものではない。通常、標準グループの参照配列が標的
配列と一致する可能性が最も高いが、代替グループの一
つの方が一致の可能性が高い場合には（即ち、塩基コー
ル処理により適している場合には）、そのグループを用
いて塩基処理を行う。

【００７７】ステップ５０２で、システムは、標準グル
ープ及び代替グループのユニットに関して塩基コール処
理を実行する。塩基コール処理は、例えば、先に図１３
で説明したように行われる。

【００７８】次に、ステップ５０４で、各ユニットグル
ープに関して塩基コールを一つ求める。ここで、ユニッ
トからの呼び出し頻度が最も高かった塩基を塩基コール
としてもよいし、あるいは、図１５に従って後に詳細を
説明する方法で、各グループの塩基コールを決定するよ
うにしてもよい。

【００７９】各ユニットグループ（即ち、標準グループ
と代替グループ）に関して一つの塩基コールをもとめた
後、ステップ５０６で、塩基位置が入力される。次に、
入力された塩基位置に関して塩基コールを実行するため
に最適のユニットグループを選択する。具体的には、例
えば、調査位置近傍、即ち、調査位置周囲のウィンドウ
において、標的配列に対する不対合が最も少ないグルー
プの参照配列を求めることにより、最適グループの選択
が行われる。調査位置近傍において不対合が最も少ない
ユニットグループは、最も精度の高い塩基コールを生成
する可能性が高い。最適グループを選択する処理に関す
る詳細は、図１６を参照して後述する。

【００８０】次に、ステップ５１０で、最適のユニット
グループに従って、入力された塩基位置における塩基の
呼び出し処理を行う（即ち、ステップ５０４で決定され
たそのグループの最適コールを用いる）。塩基コールが
決定されると、処理は次のステップに移り、塩基コール
処理を実行すべき次の塩基位置が存在するかどうかの判
定が行われる。次の塩基位置が存在する場合には、ステ
ップ５０６に戻り、次の塩基位置に関して塩基コール処
理を実行する。

【００８１】図１５は、一つのユニットグループに関し
て塩基呼び出し処理を行う方法を示すフローチャートで
ある。ステップ６０２で、システムは、所定の塩基位置
において大部分のユニットが同じ塩基を呼び出している
かどうかを判定する。この場合、（不確定を示すコード
Ｎが割り当てられたものを除き）塩基を呼び出すユニッ
トのみが判定の対象となる。例えば、７つのユニットが
存在し、各ユニットが次のような塩基コールを実行した
とする。

【００８２】「Ｇ」−３ユニット「Ｔ」−１ユニット「Ｎ」−４ユニット

【００８３】この場合には、４つの確定塩基コールのう
ち３つがＧを呼び出しているため、まず、そのユニット
グループに関してＧを塩基として呼び出す。例外規則が
適用される場合を除いて、ステップ６０４で、この塩基
が多数塩基として呼び出される。

【００８４】例外規則は、そのユニットグループに関し
てどの塩基を呼び出すかを決める条件を規定したもので
ある。この例外規則は、多数塩基コールを変える条件
や、大多数のユニットによって呼び出される塩基が存在
しないような状況に対処する条件を規定する。例外規則
の一例として、（一つのユニットがある塩基を呼び出
し、他のユニットが別の塩基を呼び出すような場合に適
用される）隣接するプローブのハイブリッド形成強度を
解析するタイブレーク規則が挙げられる。また、別の例
として、３つのユニットがそれぞれ別の塩基を呼び出
し、そのうちの一つが標準塩基を呼び出すものである場
合、標準塩基をそのユニットグループの塩基コールとす
る例外規則が挙げられる。他の例外規則に関しては、補
遺に示す。

【００８５】ステップ６０６で、例外規則が適用される
かどうかの判定がなされる。例外規則が適用されると判
定された場合には、ステップ６０８で例外規則が適用さ
れる。

【００８６】図１６は、塩基コール処理を実行するため
に最適のユニットグループを選択する方法を示すフロー
チャートである。上述したように、調査位置近傍におい
て、標的配列に対する不対合が最も少ないグループの参
照配列を求めることにより、最適グループの選択が行わ
れる。調査位置近傍において不対合が最も少ないユニッ
トグループは、最も精度の高い塩基コールを生成する可
能性が高い。解析の対象となる調査位置近傍のウィンド
ウは、所定の値に設定してもよく、あるいは、プローブ
構造に従って設定してもよい。例えば、全てのグループ
のプローブに関して、調査位置からの最大距離が、調査
位置の一方の側に対しては８塩基位置、また、もう一方
の側に対しては１０塩基位置である場合、この範囲の塩
基位置を含むようにウィンドウを設定してもよい。

【００８７】ステップ７０２で、システムは、標準ユニ
ットグループおよび代替ユニットグループに関して不対
合得点を計算する。不対合得点は、標的配列に対する参
照配列の不対合の数を示すものである。不対合得点を求
めるために、参照配列のうち少なくとも２つが異なって
いる塩基位置のみを解析するようにしてもよい。全ての
参照配列が或る塩基位置において同一である場合には、
この塩基配列をスキップすることができる。

【００８８】少なくとも２つの参照配列が異なっている
各塩基位置において、あるグループに関して呼び出され
た塩基（標的配列における有望な塩基を示す塩基コー
ル）が参照配列の対応する塩基と異なっているかどうか
を判定する。ここで、塩基コールと参照配列の対応する
塩基とが異なっている場合には、不対合得点に１が加え
られる。各グループに関する不対合得点は、最初にゼロ
に設定される。

【００８９】不対合得点は、標的配列と異なっている参
照配列部分の塩基位置の数を示すものだと考えることが
できる（全ての参照配列において同一である塩基位置を
除くようにしてもよい）。この概念をさらに説明するた
めに、以下に簡単な例を挙げる。この例では、以下のよ
うな１つの標準グループと２つの代替グループが存在す
る。

【００９０】標準グループ不対合得点参照ＡＣＧＧＡＴＧＡＧＡＴＡＣＧＡ１塩基コールＡＣＴＧＡＴＧＡＧＡＴＡＣＧＡ

【００９１】代替グループ１不対合得点参照ＡＣＴＧＡＴＧＡＧＡＴＡＣＧＡ０塩基コールＡＣＴＧＡＴＧＡＧＡＴＡＣＧＡ

【００９２】代替グループ２不対合得点参照ＡＣＧＧＡＴＧＡＧＡＴＡＣＧＴ２塩基コールＡＣＴＧＡＴＧＡＧＡＴＡＣＧＡ

【００９３】下線を引いた塩基が、解析されている塩基
位置に対応する。また、太字の塩基位置は、少なくとも
２つの参照配列において異なっている塩基位置を示す。
これら太字の塩基位置の中で、（塩基コールで示され
る）標的配列と参照配列とが異なっている塩基位置は、
標準グループでは１つ存在する。このため、不対合得点
は１となる。同様にして、第一の代替グループでは不対
合得点が０に、第二の代替グループでは不対合得点が１
になる。

【００９４】代替グループ１の不対合得点が一番低いの
で、解析されている塩基位置における塩基の呼び出し
に、このグループが用いられる。上記の簡単な例は、最
適グループの選択方法を説明するためのものなので、塩
基コールは全てのグループで同一である。しかし、ここ
で、重要なことは、塩基位置近傍での不対合が多くなれ
ばなるほど塩基コールの精度が下がるということであ
る。参照配列と標的配列との間の不対合により、塩基位
置近傍においてプローブが単一の塩基不対合を含む結果
となる。単一の塩基不対合はハイブリッド形成強度を低
下させ、この結果、精度を下げる可能性がある。

【００９５】ステップ７０４で、標準グループの不対合
得点が代替グループの不対合得点以下であるかどうかが
判定される。標準グループの不対合得点の方が低いかあ
るいは等しければ、標準グループに従って塩基コール処
理が実行される。

【００９６】ステップ７０８で、代替グループのいずれ
かの不対合得点が最低であるかどうかの判定がなされ
る。最低である場合には、ステップ７１０で、その代替
グループを用いて、塩基コール処理が実行される。そう
でなければ、２以上の代替グループが同じ不対合得点を
持つことになる。このような場合には、ステップ７１２
で、ある塩基を最も首尾一貫して呼び出したユニットを
含む代替グループを選択する。例えば、２つの代替グル
ープが同じ最低の不対合得点を有し、一つのグループの
ユニットが全て同じ塩基を呼び出す一方、もう一つのグ
ループのユニットの塩基コールが分散している場合に
は、同じ塩基を呼び出す代替グループを用いて処理が行
われる。不対合得点が同じ場合に最適のグループを選択
する方法はこれに限定されるものではなく、他の方法を
適用することもできる。

【００９７】図１７は、一つあるいは複数のチップにお
ける実験に基づきヌクレオチドを解析するためのスクリ
ーンディスプレイを示す。スクリーンディスプレイ８０
２は、ユーザーに様々な情報を表示する複数のスクリー
ン領域を備える。スクリーン領域８０４には、参照配列
名が表示される。この例では、ＰＲＴ４４０Ａで、これ
は、ＨＩＶウィルスのアンチセンス領域（プロテアーゼ
逆転写酵素）である。参照配列は、通常、検体配列と比
較される基準（基線）として用いられる。スクリーンに
表示されている参照配列は、野生株のチップ配列である
が、これに限定されるものではない。

【００９８】スクリーン領域８０６には、プローブ配列
（アレイ）における標準のヌクレオチド配列が表示され
る。各ヌクレオチドの塩基位置がスクリーン領域８０６
上に示されている。スクリーン領域８０６には、さら
に、ユーザーインターフェースで「拡大された」各ユニ
ットの参照配列も表示される。

【００９９】スクリーン領域８０８には、現在解析中の
チップファイルおよび複合ファイルが表示される。チッ
プファイル（例えば、．ＣＨＰの拡張子で示される）に
は、一つのチップから入力されるデータが含まれ、複合
ファイルには（例えば、．ＣＭＰの拡張子で示される）
には、複数のチップから入力されたデータが含まれる。
ユーザーが解析を行うためにチップファイルまたは複合
ファイルを開くと、そのファイルのパスネームがスクリ
ーン領域８０８に表示される。

【０１００】チップファイルおよび複合ファイルから入
力された情報をスクリーン領域８１０及び８１２に表示
するようにしてもよい。スクリーン領域８１０には、チ
ップファイルあるいは複合ファイルから得られた、現在
解析中の検体配列の名称が表示される。通常、ユーザー
が簡単に検体配列を認識できるようなものが、検体配列
の名称として選択される。スクリーン領域８１２には、
検体のヌクレオチド配列が表示される。スクリーン領域
８１２における各ヌクレオチドの塩基位置は、スクリー
ン領域８０６上に表示されたものと同様である。従っ
て、簡単に解析を行うことができるように、参照配列と
検体配列とが自動的に並べられる。

【０１０１】図１７は、スクリーンディスプレイの配置
を簡単に示すものであるが、図１８に示すように、チッ
プファイル及び複合ファイルから入力された情報を出さ
ないようにしたり（非表示にしたり）、まとめたりする
こともできる。例えば、ユーザーが、スクリーン領域８
０８において、複合ファイルのファイル名の前につけら
れているスクリーンアイコンの＋マークを「クリックす
る」、即ち起動した場合には、その複合ファイルに関す
る詳細な情報が表示される。図示されるように、チップ
ファイルから入力された情報を組み合わせるために用い
られた方法を、個々のチップファイルと共に表示するよ
うにしてもよい。

【０１０２】また、ユーザーが、スクリーン領域８０８
において、チップファイルのファイル名の前につけられ
ているスクリーンアイコンの＋マークを起動した場合に
は、塩基の呼び出しに用いられた工程あるいは方法を含
むチップファイルに関する詳細な情報が表示される。図
１８の例では、図１０に基づいて説明した「比に基づく
アルゴリズム」が塩基呼び出し処理に用いられている。
さらに、ユーザーは、スクリーン上に表示されている塩
基コールに直ちに反映される塩基呼び出し処理パラメー
タを変更することもできる。例えば、この例では、比の
限界値（「Ratio 」）が１．２に設定されているが、ユ
ーザーがこの比の限界値を１．４に増加させた場合に
は、そのチップに関する塩基コールを再演算して、新し
い塩基コールをスクリーン領域８１２に表示する。塩基
コール処理パラメータは、定数、閾値、範囲等のいずれ
の値でもよい。

【０１０３】図１８に示すように、ユーザーが理解しや
すいように、（様々な構成を含む）複数の実験から得ら
れたデータを組み合わせることができる。図１７に示さ
れる検体配列４４０−２Ａは、図１８では拡大されて、
この塩基コールが複数の実験から得られたものであるこ
とがわかる。ここで、複数の実験から得られたデータ
は、一つのチップに関するものでも、あるいは、複数の
チップに関するものでもよい。言いかえると、図１７お
よび図１８で検体配列４４０−２Ａとして示されるヌク
レオチド配列は、一つの実験結果を示すものではなく、
複数の実験結果を組み合わせた、あるいは、まとめたも
のである。図１８に示すように、ユーザーは、それぞれ
の実験から得られたデータをまとめることができる。図
１８の例では、それぞれの塩基に関するハイブリッド形
成強度が表示されている。塩基位置１００に示すよう
に、解析中の塩基位置を反転表示することもできる。

【０１０４】図１７に示すように、検体配列４４０−２
Ａの名称の前にもスクリーンアイコンの＋マークが表示
されている。このスクリーンアイコンを起動することに
より、複合塩基コールを構成する個々の塩基コールを表
示することができる。また、図１８に示すように、複合
塩基コールは、複数の塩基コールから誘導されている。
この複数の塩基コールは、塩基位置に従って、複合塩基
コールと並べられる。本発明の構成により、ユーザー
は、配列を解析する際に、必要に応じて、データを表示
したり、非表示にしたり、あるいは、まとめたりするこ
とができる。

【０１０５】遺伝子発現の監視図１９は、複数対の完全対合プローブと不対合プローブ
のハイブリッド形成強度を比較することにより遺伝子の
発現を監視する方法を示すフローチャートである。「完
全対合プローブ」は、所定の標的配列に完全に相補的な
配列を有するプローブを意味する。テストプローブは、
通常、標的配列の一部（サブ配列）に完全に相補的であ
る。また、「不対合対照」あるいは「不対合プローブ」
は、所定の標的配列に完全に相補的でないように故意的
に選択された配列を有するプローブを意味する。高密度
配列（アレイ）における不対合（ＭＭ）対照には、それ
ぞれ、同じ所定の標的配列に対して完全に相補的な対応
する完全対合（ＰＭ）プローブが存在する。

【０１０６】基質表面あるいはチップ表面に望ましくは
共有結合的に結合されている、複数対の完全対合プロー
ブ及び不対合プローブのハイブリッド形成強度が比較さ
れる。核酸プローブの密度としては、基質１ｃｍ2 当た
りに約６０個以上の異なった核酸プローブが含まれる構
成が最も望ましい。図１９のフローチャートでは、各ス
テップが順に示されているが、必ずしも、これらのステ
ップをこの順番で実行しなくてもよい。当業者に周知の
ように、本発明の範囲から逸脱することなく、これらの
ステップの順番を変えたり、組み合わせたり、あるいは
いくつかのステップを除くこともできる。

【０１０７】まず最初に、標的配列（あるいは遺伝子）
に相補的な核酸プローブを選択する。これらのプローブ
は完全対合プローブである。次に、標的配列に対して完
全に相補的でないように構成されたプローブを選択す
る。これらのプローブは不対合プローブであり、不対合
プローブには、それぞれ、完全対合プローブに対して少
なくとも一つのヌクレオチド不対合が含まれる。従っ
て、不対合プローブおよびそれに対応する完全対合プロ
ーブにより、一対のプローブが形成される。上述したよ
うに、不対合プローブの中心付近にヌクレオチド不対合
が存在するような構成が望ましい。

【０１０８】完全対合プローブの長さは、通常、標的配
列に対する高いハイブリッド形成親和性を示すように選
択される。例えば、核酸配列を全て２０量体としてもよ
い。また、不確定さを排除する等様々な理由により、基
質上で、異なった長さのプローブを合成するようにして
もよい。

【０１０９】上述したように、標的配列は、分割され、
標識されて、核酸プローブを含む基質に曝される。核酸
プローブのハイブリッド形成強度を測定して、コンピュ
ータシステムに入力する。ここで用いられるコンピュー
タシステムは、基質のハイブリッド形成を指示するシス
テムと同じものでも異なったものでもよい。いずれのコ
ンピュータシステムを用いるにしても、遺伝子名、遺伝
子配列、プローブ配列、基質上でのプローブ位置等、他
の実験の詳細もシステムに入力される。

【０１１０】図１９に示すように、ハイブリッド形成
後、ステップ９０２で、コンピュータシステムに、複数
対の完全対合プローブと不対合プローブのハイブリッド
形成強度が入力される。ハイブリッド形成強度は、核酸
プローブと（遺伝子に対応する）標的核酸との間のハイ
ブリッド形成親和性を示すものである。各対には、標的
核酸の一部に完全に相補的な完全対合プローブと、少な
くとも一つのヌクレオチドが完全対合プローブと異なっ
ている不対合プローブとが含まれる。

【０１１１】ステップ９０４で、コンピュータシステム
が、各対の完全対合プローブと不対合プローブのハイブ
リッド形成強度を比較する。遺伝子が発現している場合
には、完全対合プローブのハイブリッド形成強度（即ち
親和性）は、対応する不対合プローブの強度よりも有意
に高い。一般に、対のプローブのハイブリッド形成強度
がほとんど同じであれば、遺伝子が発現されていないと
考えられる。但し、一対のプローブに基づいて判定を行
うわけではなく、多数対のプローブの解析に基づいて、
遺伝子が発現しているかどうかの判定が行われる。複数
対のプローブのハイブリッド形成強度を比較する具体的
な方法の詳細に関しては、図２０を参照して説明する。

【０１１２】完全対合プローブと不対合プローブのハイ
ブリッド形成強度を比較した後、ステップ９０６で、遺
伝子の発現状態を表示する。例えば、遺伝子が存在して
いる（発現している）、どちらともいえない、あるい
は、存在していない（発現していない）ことを示す発現
コールをユーザーに表示するようにしてもよい。

【０１１３】図２０は、決定行列を用いて遺伝子が発現
しているかどうかを判定する方法を示すフローチャート
である。ステップ９５２で、コンピュータシステムに、
Ｎ対の完全対合プローブと不対合プローブに関する生の
走査データを入力する。好適な実施例において、ハイブ
リッド形成強度は、基質上でプローブにハイブリッド結
合されるフルオレセイン標識標的から得られるフォトン
数である。以下、完全対合プローブのハイブリッド形成
強度をＩpmで示し、不対合プローブのハイブリッド形成
強度をＩmmで示す。

【０１１４】ステップ９５４で、一対のプローブのハイ
ブリッド形成強度を検索する。次のステップ９５６で、
バックグラウンド信号強度を、その対の各ハイブリッド
形成強度から差し引く。全ての生走査データから同時に
バックグラウンドを差し引くようにしてもよい。

【０１１５】ステップ９５８で、プローブ対のハイブリ
ッド形成強度を差分閾値（Ｄ）および比の閾値（Ｒ）と
比較する。即ち、プローブ対のハイブリッド形成強度の
差（Ｉpm−Ｉmm）が差分閾値以上であるかどうか、且
つ、プローブ対のハイブリッド形成強度の比（Ｉpm／Ｉ
mm）が比の閾値以上であるかどうかが判定される。これ
らの閾値は、通常、一つあるいは複数の遺伝子の発現状
態を精度よく監視できるようにユーザーが定義した値で
ある。例えば、差分閾値を２０に比の閾値を１．２に設
定するようにしてもよい。

【０１１６】Ｉpm−Ｉmm＞＝Ｄ、及び、Ｉ_pm／Ｉ_mm＞＝
Ｒの場合には、ステップ９６０でＮＰＯＳを１増加させ
る。ＮＰＯＳは、遺伝子が発現する可能性が高いことを
示すハイブリッド形成強度を有するプローブ対の数を示
す値である。即ち、遺伝子の発現状態の決定に、ＮＰＯ
Ｓが用いられる。

【０１１７】ステップ９６２では、Ｉmm−Ｉpm＞＝Ｄ及
びＩmm／Ｉpm＞＝Ｒが成立するかどうかの判定がなされ
る。この式が成り立つ場合には、ステップ９６４でＮＮ
ＥＧを１増加させる。ＮＮＥＧは、遺伝子が発現しない
可能性が高いことを示すハイブリッド形成強度を有する
プローブ対の数を示す値である。ＮＰＯＳと同様に、Ｎ
ＮＥＧも遺伝子の発現状態の決定に用いられる。

【０１１８】遺伝子が発現していることを示す、あるい
は、発現していないことを示すハイブリッド形成強度を
有する各プローブ対に関して、ステップ９６６で、比の
対数値（ＬＲ）と強度差値（ＩＤＩＦ）を計算する。Ｌ
Ｒは、プローブ対のハイブリッド形成強度の比（Ｉpm／
Ｉmm）の対数をとることにより求められる。また、ＩＤ
ＩＦは、プローブ対のハイブリッド形成強度の差（Ｉpm
−Ｉmm）をとることにより求められる。ステップ９６８
で次のプローブ対のハイブリッド形成強度が存在すると
判定されれば、処理をステップ９５４に戻して、検索を
行う。

【０１１９】ステップ９７２で、決定行列を用いて、遺
伝子が発現しているかどうかを判定する。決定行列で
は、Ｎ、ＮＰＯＳ、ＮＮＥＧ、ＬＲ（複数のＬＲ）の値
が用いられ、次の計算が行われる。

【０１２０】Ｐ１＝ＮＰＯＳ／ＮＮＥＧＰ２＝ＮＰＯＳ／ＮＰ３＝（１０＊ＳＵＭ（ＬＲ））／（ＮＰＯＳ＋Ｎ
ＮＥＧ）

【０１２１】これらのＰ値を用いて、遺伝子が発現して
いるかどうかを判定する。

【０１２２】説明のために、Ｐ値をいくつかの範囲に分
割する。Ｐ１が２．１以上であれば、Ａが真である。Ｐ
１が２．１未満で１．８以上であれば、Ｂが真である。
それ以外の場合には、Ｃが真である。即ち、Ｐ１は、
Ａ、Ｂ、Ｃの３つの範囲に分割される。これは、発明の
理解を深めることを目的としてなされるものである。こ
のようにして、全てのＰ値を以下のようにいくつかの範
囲に分割する。

【０１２３】Ａ＝（Ｐ１＞＝２．１）Ｂ＝（２．１＞Ｐ１＞＝１．８）Ｃ＝（Ｐ１＜１．８）

【０１２４】Ｘ＝（Ｐ２＞＝０．３５）Ｙ＝（０．３５＞Ｐ２＞＝０．２０）Ｚ＝（Ｐ２＜０．２０）

【０１２５】Ｑ＝（Ｐ３＞＝１．５）Ｒ＝（１．５＞Ｐ３＞＝１．１）Ｓ＝（Ｐ３＜１．１）

【０１２６】上記のブール値に従ってＰ値を所定の範囲
に分割した後、遺伝子発現の判定を行う。

【０１２７】ここで、遺伝子の発現状態は、存在（発
現）、どちらともいえない、不存在（発現しない）のい
ずれかで示される。式「A and (X or Y) and (Q or R)
」が成り立つ場合には、遺伝子が発現していると見な
される。言いかえると、Ｐ１＞＝２．１、Ｐ２＞＝０．
２０、Ｐ３＞＝１．１が成り立つ場合には、遺伝子が発
現していると考えられる。また、式「B and X and Q 」
が成り立つ場合にも、遺伝子が発現していると見なされ
る。

【０１２８】以上の説明に基づいて、遺伝子の発現状態
を以下にまとめる。

【０１２９】存在 A and (X or Y) and (Q or R) B and X and Q

【０１３０】どちらともいえない A and X and S B and X and R B and Y and (Q or R)

【０１３１】不存在それ以外の場合（例えば、Ｃの組み合わせ）

【０１３２】ステップ９７４で、ユーザーに結果が表示
される。例えば、存在をＰ、どちらともいえないをＭ、
不存在をＡのように出力するようにしてもよい。

【０１３３】全てのプローブ対を処理して、遺伝子の発
現状態を表示した後、ステップ９７５で、ＬＲを１０倍
した値の平均値を計算する。さらに、ＮＰＯＳ及びＮＮ
ＥＧを増加させたプローブに関するＩＤＩＦ値の平均を
計算する。この平均値を、発現レベルを示す値として用
いることもできる。また、これらの値を用いて、この実
験と他の実験の定量的な比較を行うようにしてもよい。

【０１３４】ステップ９７６で定量的な測定を行う。一
例として、現在の実験データを前の実験データと比較す
る（この場合、例えば、ステップ９７０で計算された値
を用いる）。別の例として、生物検体中に存在する（バ
クテリア由来等の）既知量のＲＮＡのハイブリッド形成
強度と実験データを比較することもできる。このように
して、遺伝子発現状態の表示即ちコールが正しいかどう
かを証明することもできるし、閾値を修正することもで
きるし、さらに、先に行われた実験の修正を行うことも
可能である。

【０１３５】説明を簡単にするために、図２０では一つ
の遺伝子に関する処理だけを説明したが、生物検体に含
まれる複数の遺伝子の処理にこの方法を適用することも
できる。従って、一つの遺伝子の解析に関する説明は、
その方法を複数の遺伝子の処理に拡張できないことを示
すものではない。

【０１３６】図２１は、遺伝子発現監視ソフトウェアの
画面表示（スクリーンディスプレイ）のレイアウト（構
成）を示す。スクリーンディスプレイ１０００は、グラ
フィックス表示領域１００２とデータ表示領域１００４
の２つの部分に分割される。グラフィックス表示領域に
は、ユーザーがデータを解釈する助けとなるグラフが表
示される。また、データ表示領域には、ユーザーが遺伝
子発現に関する基礎データを評価できるように、基礎デ
ータが表示される。

【０１３７】以下のスクリーンディスプレイの例に示す
ように、データ表示領域を縦欄と横列で表示される表形
式にすることが望ましい。各縦欄には、その欄に含まれ
るデータを示す見出しがつけられる。また、各横列に
は、ある遺伝子に関する一つの実験あるいは実験の組み
合わせから得られたデータが表示される。本明細書にお
いて、「実験」は、データを生成する工程を意味する。
例えば、ハイブリッド結合されたチップの一つのイメー
ジファイルから、多くの遺伝子に関する多くの「実験」
データが生成される。また、実験は、異なったチップか
らデータを生成するものでもよい。

【０１３８】図２２は、選択された遺伝子の解析結果を
示すスクリーンディスプレイである。スクリーンディス
プレイ１０３０のグラフィックス表示領域には、選択さ
れた遺伝子の各塩基位置における完全対合プローブと不
対合プローブのハイブリッド形成強度が棒グラフの形で
示されている。選択された遺伝子は、データ表示領域１
０３４に反転表示されている。

【０１３９】データ表示領域には、複数の縦欄の見出し
が表示されている。「Experiment Name 」は、その実験
に関してユーザーが定義した名称を意味する。「Gene N
ame」は、その遺伝子の名称を意味する。「Positive」
及び「Negative」の数は、図２０で説明したＮＰＯＳ及
びＮＮＥＧの値を示す。「Pairs 」は、その遺伝子の解
析に用いられた完全符号プローブと不対合プローブのプ
ローブ対の数を示す。また、「Pos Fraction」は、遺伝
子発現がポジティブであると判定されたプローブ対の割
合（即ち、Positive／Pairs ）を示す。

【０１４０】「Avg Ratio 」欄は、ある遺伝子の全ての
プローブに関するＩpm／Ｉmmの平均を示す。「_Log A
v_g」欄は、ｌｏｇ（Ｉpm／Ｉmm）の平均を示す。「PM
E_xcess」欄は、ユーザーが規定した閾値より大きなハイ
ブリッド形成強度を示す完全対合プローブの数を示す。
「MM Excess 」欄は、ユーザーが規定した閾値より大き
なハイブリッド形成強度を示す不対合プローブの数を示
す。図２３に示される「Pos/Neg 」欄は、「Positive」
欄と「Negative」欄の比を示す（「Negative」欄がゼロ
を含む場合には、「Inf」と表示される）。「Avg Dif
f」欄は、その遺伝子に関する平均強度差を示す。平均
強度差は、図２０のステップ９７５で計算された値であ
る（即ち、（ＩＤＩＦ）平均）。

【０１４１】「Abs Call」欄は、その実験に関する遺伝
子発現コールを示す。この欄の値Ｐ、Ｍ、Ａは、それぞ
れ、存在、どちらともいえない、不存在を表す。好適な
実施例の遺伝子発現コールに関する詳細は、図２０のス
テップ９７４を参照して既に説明した。

【０１４２】ユーザーが実験を選択すると、グラフィッ
クス表示領域にユーザーがデータを解釈する助けとなる
グラフが表示される。ユーザーは、ボタンバー１０３４
を用いて、グラフィックス表示領域に表示されるべき一
つあるいは複数のグラフを選択できる。さらに、所定の
欄における値に従って、データ表示領域でデータを並べ
変えることができる。

【０１４３】図２４は、選択された遺伝子の解析結果を
表す別のスクリーンディスプレイを示す。スクリーンデ
ィスプレイ１０６０のグラフィックス表示領域１０６２
には、各塩基位置における完全対合プローブと不対合プ
ローブのハイブリッド形成強度の比のグラフが表示され
ている。ｘ軸は塩基位置を、ｙ軸は、ハイブリッド形成
強度の比を表す。また、グラフには統計学的な比の閾値
がプロットされているが、この例では、閾値は１．２で
ある。ユーザーは、このグラフを用いて、閾値より上及
び下のプローブ対の数（Ｉpm／Ｉmm）を解析することが
できる。このグラフには、さらに遺伝子名と実験名が表
示されている。

【０１４４】図２５は、選択された複数の遺伝子に関す
る実験結果の比較を表すスクリーンディスプレイを示
す。スクリーンディスプレイ１１６０には、グラフィッ
クス表示領域１０６２とデータ表示領域１１６４が含ま
れる。グラフィックス表示領域には、データ表示領域で
選択された実験／遺伝子の各々に関して、各塩基位置に
おける完全対合プローブと不対合プローブのハイブリッ
ド形成強度の比のグラフが表示されている。好適な実施
例では、選択された複数の遺伝子間の差異がはっきりと
わかるように、実験名、遺伝子名及びデータプロットを
遺伝子ごとに異なった色で示す。

【０１４５】図２６は、選択された複数の遺伝子に関す
る実験結果の比較を表す別のスクリーンディスプレイを
示す。スクリーンディスプレイ１２００のグラフィック
ス表示領域１２０２には、データ表示領域１２０４で選
択された遺伝子の発現レベルが表示されている。選択さ
れた遺伝子の発現レベルは、棒グラフの形で示されてい
る。好適な実施例では、発現レベルは、平均強度差とし
て表される（図２０の（ＩＤＩＦ）平均を参照）。この
グラフには、さらに遺伝子名と実験名が表示されてい
る。

【０１４６】図２７は、選択された複数の遺伝子に関す
る実験結果の比較を、グラフィックス表示領域に、いく
つかのグラフの形で表示する、さらに別のスクリーンデ
ィスプレイを示す。スクリーンディスプレイ１２３０の
グラフィックス表示領域１２３２には、データ表示領域
１２３４で選択された遺伝子を解析した結果のグラフが
いくつか示されている。この例では、選択された遺伝子
に関する発現レベルグラフ１２３６、平均強度差グラフ
１２３８、及び、ハイブリッド形成強度グラフ１２４０
が表示されている。

【０１４７】図２８及び図２９は、基準走査データと実
験走査データとを比較することにより、遺伝子の発現状
態を判定する工程を示すフローチャートである。例え
ば、遺伝子が発現していることがわかっている生物検体
から基準走査データをとるようにしてもよい。即ち、こ
の走査データを別の生物検体と比較することにより、そ
の遺伝子が発現しているかどうかを判定する。また、有
機生命体において遺伝子の発現が時間とともにどのよう
に変化するかを判定することもできる。ここで、「基準
（基線）」は、標準点として用いられるものであること
を意味する。

【０１４８】ステップ１３０２で、コンピュータシステ
ムに、基準から得られたＮ対の完全対合プローブと不対
合プローブの生の走査データが入力される。基準から得
られた完全対合プローブのハイブリッド形成強度をＩpm
で表し、同じく基準から得られた不対合プローブのハイ
ブリッド形成強度をＩmmで表す。ステップ１３０４で、
バックグラウンドの信号強度を各対の基準走査データの
ハイブリッド形成強度から差し引く。

【０１４９】一方、ステップ１３０６で、コンピュータ
システムに、実験の標的である生物検体から得られたＮ
対の完全対合プローブと不対合プローブの生の走査デー
タが入力される。実験検体から得られた完全対合プロー
ブのハイブリッド形成強度をＪpmで表し、同じく実験検
体から得られた不対合プローブのハイブリッド形成強度
をＪmmで表す。ステップ１３０８で、バックグラウンド
の信号強度を各対の実験走査データのハイブリッド形成
強度から差し引く。

【０１５０】次に、ステップ１３１０で、Ｉ−Ｊ対のハ
イブリッド形成強度を正規化する。例えば、Ｉ−Ｊ対の
ハイブリッド形成強度を、対照プローブのハイブリッド
形成強度で割るようにしてもよい。

【０１５１】ステップ１３１２で、プローブのＩ−Ｊ対
のハイブリッド形成強度を差分閾値（ＤＤＩＦ）および
比の閾値（ＲＤＩＦ）と比較する。具体的には、ある対
（Ｊpm−Ｊmm）のハイブリッド形成強度と別の対（Ｉpm
−Ｉmm）のハイブリッド形成強度の差が差分閾値以上で
あるかどうか、また、ある対（Ｊpm−Ｊmm）のハイブリ
ッド形成強度と別の対（Ｉpm−Ｉmm）のハイブリッド形
成強度の比が比の閾値以上であるかどうかの判定がなさ
れる。これらの閾値は、通常、一つあるいは複数の遺伝
子の発現監視を精度よく行えるようにユーザーが規定し
た値である。

【０１５２】（Ｊpm−Ｊmm）−（Ｉpm−Ｉmm）＞＝ＤＤ
ＩＦ、且つ、（Ｊpm−Ｊmm）／（Ｉpm−Ｉmm）＞＝ＲＤ
ＩＦが成立する場合には、ステップ１３１４でＮＩＮＣ
を１増加させる。一般に、ＮＩＮＣは、実験検体のプロ
ーブ対の遺伝子発現が基準検体の遺伝子発現よりも大き
い（即ち、増加している）可能性が高いことを示す値で
ある。ＮＩＮＣを用いて、基準検体と比較して実験検体
の遺伝子発現が大きい（即ち、増加している）か、小さ
い（即ち、減少している）か、あるいは、変化なしかの
判定がなされる。

【０１５３】ステップ１３１６で、（Ｊpm−Ｊmm）−
（Ｉpm−Ｉmm）＞＝ＤＤＩＦ、且つ、（Ｊpm−Ｊmm）／
（Ｉpm−Ｉmm）＞＝ＲＤＩＦが成立するかどうかの判定
がなされる。この式が成り立つ場合には、ＮＤＥＣを１
増加させる。一般に、ＮＤＥＣは、実験検体のプローブ
対の遺伝子発現が基準検体の遺伝子発現よりも小さい
（即ち、減少している）可能性が高いことを示す値であ
る。ＮＤＥＣを用いて、基準検体と比較して実験検体の
遺伝子発現が大きい（即ち、増加している）か、小さい
（即ち、減少している）か、あるいは、変化なしかの判
定がなされる。

【０１５４】実験検体の遺伝子発現が大きいか、あるい
は、小さいかを示すハイブリッド形成強度を有する各対
のプローブに関して、ＮＰＯＳ、ＮＮＥＧ、及びＬＲ値
を計算する。これらの値の計算に関しては、図２０を参
照して前述した。それぞれの値の後ろにＢあるいはＥを
つけて、その値が基準検体のものか実験検体のものかを
示す。ステップ１３２２でハイブリッド形成強度を有す
る別のプローブ対が存在すると判定された場合には、上
述と同様の方法で処理を行う。

【０１５５】次に、処理は図２９に移って、ステップ１
３２４で、基準検体と実験検体の両方に関して、絶対決
定演算を実行する。絶対決定演算は、基準検体と実験検
体の各々に関して、遺伝子が発現しているか、どちらと
もいえないか、あるいは、発現していないか、を示すも
のである。従って、好適な実施例では、各検体に関して
図２０のステップ９７２と９７４を実行することによ
り、このステップの処理が実現される。この処理を行う
ことによって、各検体の遺伝子発現状態が示される。

【０１５６】次のステップ１３２６では、決定行列を用
いて、２つの検体間の遺伝子発現の差を求める。この決
定行列では、上記のように計算された値Ｎ、ＮＰＯＳ
Ｂ、ＮＰＯＳＥ、ＮＮＥＧＢ、ＮＮＥＧＥ、ＮＩＮＣ、
ＮＤＥＣ、ＬＲＢ、ＬＲＥが用いられる。決定行列の計
算は、ＮＩＮＣがＮＤＥＣ以上であるかどうかによって
変わる。即ち、以下のような計算が行われる。

【０１５７】ＮＩＮＣ＞＝ＮＤＥＣの場合には、次の４
つのＰ値が求められる。

【０１５８】Ｐ１＝ＮＩＮＣ／ＮＤＥＣＰ２＝ＮＩＮＣ／ＮＰ３＝（（ＮＰＯＳＥ−ＮＰＯＳＢ）−（ＮＮＥＧＥ−
ＮＮＥＧＢ））／ＮＰ４＝１０＊ＳＵＭ（ＬＲＥ−ＬＲＢ）／Ｎ

【０１５９】これらのＰ値を用いて、２つの検体間の遺
伝子発現の差を求める。

【０１６０】上記と同様に、説明のために、Ｐ値を所定
の範囲に分割する。Ｐ値は、全て、以下のような範囲に
分割される。

【０１６１】Ａ＝（Ｐ１＞＝２．８）Ｂ＝（２．８＞Ｐ１＞＝２．０）Ｃ＝（Ｐ１＜２．０）

【０１６２】Ｘ＝（Ｐ２＞＝０．３４）Ｙ＝（０．３４＞Ｐ２＞＝０．２４）Ｚ＝（Ｐ２＜０．２４）

【０１６３】Ｍ＝（Ｐ３＞＝０．２０）Ｎ＝（０．２０＞Ｐ３＞＝０．１２）Ｏ＝（Ｐ３＜０．１２）

【０１６４】Ｑ＝（Ｐ４＞＝０．９）Ｒ＝（０．９＞Ｐ４＞＝０．５）Ｓ＝（Ｐ４＜０．５）

【０１６５】上記のブール値に従ってＰ値を所定の範囲
に分割した後、２つの検体間の遺伝子発現の差を求め
る。

【０１６６】この場合、ＮＩＮＣ＞＝ＮＤＥＣであるた
め、遺伝子発現の変化は、増加、増加傾向、あるいは、
変化なしで表される。以下に、遺伝子発現状態をまとめ
て示す。

【０１６７】増加 A and (X or Y) and (Q or R) and (M or N or O) A and (X or Y) and (Q or R or S) and (M or N) B and (X or Y) and (Q or R) and (M or N) A and X and (Q or R or S) and (M or N or O)

【０１６８】増加傾向 A or Y or S or O B and (X or Y) and (Q or R) and O B and (X or Y) and S and (M or N) C and (X or Y) and (Q or R) and (M or N)

【０１６９】変化なしそれ以外の全ての場合（例えば、あらゆるＺの組み合わせ）

【０１７０】ユーザーへの出力は、増加をＩ、増加傾向
をＭＩ、変化なしをＮＣのように示してもよい。

【０１７１】ＮＩＮＣ＜ＮＤＥＣの場合には、次の４つ
のＰ値が求められる。

【０１７２】Ｐ１＝ＮＤＥＣ／ＮＩＮＣＰ２＝ＮＤＥＣ／ＮＰ３＝（（ＮＮＥＧＥ−ＮＮＥＧＢ）−（ＮＰＯＳＥ−
ＮＰＯＳＢ））／ＮＰ４＝１０＊ＳＵＭ（ＬＲＥ−ＬＲＢ）／Ｎ

【０１７３】これらのＰ値を用いて、２つの検体間の遺
伝子発現の差を求める。

【０１７４】これらのＰ値は、上記のＮＩＮＣ＞＝ＮＤ
ＥＣの場合と同じいくつかの範囲に分割する。Ｐ値は上
述と同じ範囲に分割されるので、ここでは簡略化のため
に説明を繰り返さない。但し、以下に説明するように、
これらの範囲は、通常、２つの検体間の遺伝子発現の異
なった変化状態を示す。

【０１７５】この場合、ＮＩＮＣ＜ＮＤＥＣであるた
め、遺伝子発現の変化は、減少、減少傾向、あるいは、
変化なしで表される。以下に、遺伝子発現状態をまとめ
て示す。

【０１７６】減少 A and (X or Y) and (Q or R) and (M or N or O) A and (X or Y) and (Q or R or S) and (M or N) B and (X or Y) and (Q or R) and (M or N) A and X and (Q or R or S) and (M or N or O)

【０１７７】減少傾向 A or Y or S or O B and (X or Y) and (Q or R) and O B and (X or Y) and S and (M or N) C and (X or Y) and (Q or R) and (M or N)

【０１７８】変化なしそれ以外の全ての場合（例えば、あらゆるＺの組み合わせ）

【０１７９】ユーザーへの出力は、減少をＤ、減少傾向
をＤＩ、変化なしをＮＣのように示してもよい。

【０１８０】このようにして、基準検体と実験検体との
間の遺伝子発現の相対的な差を求めることができる。
（例えば、ステップ１３２４で）両方の検体において遺
伝子が発現状態であると表示され、且つ、以下の式が全
て成立する場合には、追加試験を行って、Ｉ、ＭＩ、Ｄ
Ｍ、Ｄ（即ちＮＣ以外の）コールをＮＣに変更するよう
に構成してもよい。

【０１８１】（ＩＤＩＦＢ）の平均＞＝２００（ＩＤＩＦＥ）の平均＞＝２００１．４＝｛（ＩＤＩＦＥ）の平均｝／｛（ＩＤＩＦＢ）
の平均｝＞＝０．７

【０１８２】即ち、両方の検体で遺伝子が発現して場合
に、各検体の平均強度差が比較的大きいか、あるいは、
両方の検体の平均強度差がほとんど同じであれば、増加
あるいは減少のコールは（それが傾向に留まっているか
どうかに係わらず）変化なしコールに変更される。ＩＤ
ＩＦＢ及びＩＤＩＦＥは、各検体に関するＩＤＩＦの総
和をＮで割ることにより計算される。

【０１８３】次に、ステップ１３２８で、定量的な差の
評価を行うための値を計算する。各対に関して、（（Ｊ
pm−Ｊmm）−（Ｉpm−Ｉmm））の平均を計算する。ま
た、Ｊpm−Ｊmmの平均とＩpm−Ｉ_mmの平均の比を計算す
る。ステップ１３３０で、これらの値を用いて、他の実
験結果との比較を行うことができる。

【０１８４】図３０は、２つの実験における遺伝子発現
の変化を表すスクリーンディスプレイを示す。スクリー
ンディスプレイ１４００には、グラフィックス表示領域
１４０２とデータ表示領域１４０４が含まれる。ユーザ
ーがある所定の遺伝子に関して２つの実験を選択するこ
とにより、その実験結果の比較が行われる。ここでは、
説明をわかりやすくするために、基準データと実験デー
タの２つを呼び出して、それらのデータの比較を行う場
合を考える。例えば、ユーザーは、「ｇ１８２５０６」
と名付けられた遺伝子に関して２つの実験を選択する。
２つの実験結果の比較自体が実験であるため、ユーザー
は、図３０のデータ表示領域に「foo 」と表示されてい
るように、実験名を入力することができる。図３１は、
２つの実験における遺伝子発現の変化を表す別のスクリ
ーンディスプレイを示す。

【０１８５】システムは、図３２で説明した方法に従っ
て、選択された２つの実験における遺伝子発現の変化を
求める。データ表示領域には、この比較によって生成さ
れたデータが表形式で示されている。「Experiment Nam
e 」は、比較実験に対してユーザーが規定した名称を示
す。「Gene Name 」は、遺伝子の名称を示す。「Inc」
及び「Dec 」の数値は、図２８を参照して説明したよう
に、ＮＩＮＣおよびＮＤＥＣの値を示す。具体的には、
「Inc 」は、完全対合プローブと不対合プローブのハイ
ブリッド形成強度の差及び比が実験データにおいて有意
に大きいような遺伝子における塩基位置の数を示す。

【０１８６】「Inc Ratio 」欄は、ハイブリッド形成強
度が増加した塩基位置の数を解析対象の遺伝子における
全ての塩基位置の数で割った値を示す。「Dec Ratio 」
欄は、ハイブリッド形成強度が減少した塩基位置の数を
解析対象の遺伝子における全ての塩基位置の数で割った
値を示す。「Pos Change」欄は、実験データと基準デー
タにおいて正の得点を有するプローブ対の数の差を示
す。「Neg Change」欄は、実験データと基準データにお
いて負の得点を有するプローブ対（完全対合プローブと
不対合プローブ）の数の差を示す。

【０１８７】「Inc/Dec 」欄は、実験データにおいてハ
イブリッド形成強度が増加したプローブ対の数とハイブ
リッド形成強度が減少したプローブ対の数の比を示す。
「Avg Diff」欄は、実験データにおける平均強度差を示
す。

【０１８８】（図示されていない）「Diff Call 」欄
は、所定の遺伝子に関する２つの実験における発現レベ
ルの変化を示す。この欄において、Ｉは遺伝子発現の増
加を、ＭＩは遺伝子発現の増加傾向を、Ｄは遺伝子発現
の減少を、ＭＤは遺伝子発現の減少傾向を、ＮＣは変化
なしを、？は未知であることを、それぞれ示す。好適な
実施例において、発現レベルの変化は、図２９のステッ
プ１３２６を参照して説明したように計算される。

【０１８９】遺伝子発現の変化の演算に加えて、ユーザ
ーは、データ解析のためにグラフを選択することもでき
る。グラフィックス表示領域１４０２には、基準データ
と実験データを示す３つのグラフが表示されている。

【０１９０】図３２は、２つの実験における遺伝子発現
の変化を３次元棒グラフの形で示したスクリーンディス
プレイを示す。スクリーンディスプレイ１４４０のグラ
フィックス表示領域１４４２には、データ表示領域１４
４４で選択された遺伝子の発現レベルを示す３次元棒グ
ラフが表示されている。ユーザーは、一つあるいは複数
の遺伝子をデータ表示領域で選択して、これら遺伝子の
発現レベルを示す３次元棒グラフを作成するようにシス
テムに命令する。好適な実施例において、発現レベル
は、平均強度差（即ち、（ＩＤＩＦ）の平均）として与
えられる。３次元棒グラフにより、ユーザーは、簡単
に、複数の遺伝子の発現レベルを調べることができる。
また、複数の実験結果から選択された、同じ遺伝子に関
するデータを同時に示して回転させることにより、発現
レベルの差を表示するようにすることもできる。

【０１９１】結語上述の説明は例示を目的としたもので、何ら発明を限定
するものではない。当業者に明らかなように、この開示
に基づき、本発明を様々に変更することができる。例え
ば、本発明では、（天然のものも人工のものも含めて）
ＤＮＡの評価に関して説明しているが、本発明の方法
を、ＲＮＡのような他の物質が合成されたチップの解析
に適用することも可能である。従って、本発明の範囲
は、先の説明によって決まるものではなく、特許請求の
範囲およびそれと等価と考えられる全範囲によって決定
される。

【図面の簡単な説明】

【図１】本発明のソフトウェアを実行するために用いら
れるコンピュータシステムの例を示す図。

【図２】典型的なコンピュータシステムを示すシステム
ブロック図。

【図３】ＤＮＡやＲＮＡ等の生体物質の配列（アレイ）
を形成し、解析するための全体的なシステムをを示す
図。

【図４】全体的なシステムに関するソフトウェアの実施
例を示す図。

【図５】全体的なシステムで形成されたチップの全体的
な構成を示す図。

【図６】チップ上の核酸プローブが標識された標的に結
合する様子を概念的に示す図。

【図７】チップ上に列で配置された核酸プローブを示す
図。

【図８】図７のような参照配列と共に、チップ上の標的
のハイブリッド形成パターンを示す図。

【図９】標準構造及び代替構造を示す図。

【図１０】チップから得られたハイブリッド形成強度を
表すスクリーンディスプレイを示す図。

【図１１】関連するプローブのハイブリッド形成強度か
ら塩基コールを演算する方法を示すフローチャート。

【図１２】関連するプローブのハイブリッド形成強度か
ら塩基コールを演算する別の方法を示すフローチャー
ト。

【図１３】一つのユニットグループにおいて塩基コール
処理を行う方法を示すフローチャート。

【図１４】複数のユニットグループにおいて塩基コール
処理を行う方法を示すフローチャート。

【図１５】一つのユニットグループに関して一つの塩基
を呼び出す方法を示すフローチャート。

【図１６】塩基コール処理を実行するために最適のユニ
ットグループを選択する方法を示すフローチャート。

【図１７】一つあるいは複数のチップから得られた実験
データに基づきヌクレオチドを解析するためのスクリー
ンディスプレイを示す図。

【図１８】一つあるいは複数のチップから得られた実験
データに基づきヌクレオチドを解析するためのスクリー
ンディスプレイを示す図。

【図１９】完全対合プローブと不対合プローブ対のハイ
ブリッド形成強度を比較することにより、ある遺伝子の
発現状態を監視する方法を示すフローチャート。

【図２０】決定行列を用いて遺伝子が発現しているかど
うかを判定する方法を示すフローチャート。

【図２１】遺伝子発現を監視するソフトウェアのスクリ
ーンディスプレイの配置を示す図。

【図２２】選択された遺伝子の解析結果を表すスクリー
ンディスプレイを示す図。

【図２３】選択された遺伝子の解析結果を表すスクリー
ンディスプレイを示す図。

【図２４】選択された遺伝子の解析結果を表す別のスク
リーンディスプレイを示す図。

【図２５】選択された複数の遺伝子に関する実験結果の
比較を表すスクリーンディスプレイを示す図。

【図２６】選択された複数の遺伝子に関する実験結果の
比較を表す別のスクリーンディスプレイを示す図。

【図２７】選択された複数の遺伝子に関する実験結果の
比較をグラフィックス表示領域における複数のグラフを
用いて表す別のスクリーンディスプレイを示す図。

【図２８】基準走査データと実験走査データとを比較す
ることにより、ある遺伝子の発現状態を決定する方法を
示すフローチャート。

【図２９】基準走査データと実験走査データとを比較す
ることにより、ある遺伝子の発現状態を決定する方法を
示すフローチャート。

【図３０】２つの実験における遺伝子発現の変化を表す
スクリーンディスプレイを示す図。

【図３１】２つの実験における遺伝子発現の変化を表す
スクリーンディスプレイを示す図。

【図３２】２つの実験における遺伝子発現の変化を３次
元棒グラフの形で表すスクリーンディスプレイを示す
図。

───────────────────────────────────────────────────── フロントページの続き (72)発明者モリス・エス．・マクドナルドアメリカ合衆国カリフォルニア州94305 スタンフォード，ソノマ・テラス，843 (72)発明者マイケル・ピー．・ミットマンアメリカ合衆国カリフォルニア州94303 パロ・アルト，セイント・フランシス・ドライブ，2377 (72)発明者デビット・ジェイ．・ロックハートアメリカ合衆国カリフォルニア州94041 マウンテン・ビュー，マウンテン・ビュー・アベニュー，610 (72)発明者ミン−スー・ホーアメリカ合衆国カリフォルニア州95133 サン・ホセ，フォックスリッジ・ウェイ，922 (72)発明者デレク・バーンハートアメリカ合衆国カリフォルニア州94087 サニーヴェール，シラス・ウェイ，422 (72)発明者ルイス・シー．・ジェボンスアメリカ合衆国カリフォルニア州94087 サニーヴェール，ロマーナ・アベニュー， 701

Claims

【特許請求の範囲】

【請求項１】コンピュータシステムにおいて、検体の
核酸配列を解析するための方法であって、前記検体の核酸配列の少なくとも一部分に沿った各塩基
位置に対して、複数の塩基コールを入力する工程と、各塩基位置に対して、前記複数の塩基コールを解析して
単一塩基コールを生成する工程と、前記検体の核酸配列の少なくとも一部分に沿った複数の
塩基位置に対する複数の単一塩基コールであって、前記
検体の核酸配列における特定の塩基位置に対する前記複
数の塩基コールからそれぞれ導かれた単一塩基コールを
表示する工程と、を備える方法。
【請求項２】請求項１記載の方法であって、前記解析工程は、各塩基位置に対して、前記複数の塩基コールの中から最
も発生頻度の高い塩基コールを求める工程と、前記単一塩基コールを、前記塩基位置において最も発生
頻度の高い塩基コールとして生成する工程と、を備える
方法。
【請求項３】請求項１記載の方法であって、更に、ユーザーによる起動に応じて各塩基位置に前記複数の塩
基コールを表示させるためのスクリーンアイコンを表示
する工程、を備える方法。
【請求項４】請求項１記載の方法であって、更に、ユーザーによる起動に応じて各塩基位置に前記複数の塩
基コールを表示させないためのスクリーンアイコンを表
示する工程、を備える方法。
【請求項５】請求項１記載の方法であって、更に、塩基位置に従って、前記単一塩基コールと並べて各塩基
における前記複数の塩基コールを表示する工程、を備え
る方法。
【請求項６】請求項５記載の方法であって、更に、前記複数の塩基コールの各々と共に、プローブと前記検
体の核酸配列とのハイブリッド形成親和性を示すハイブ
リッド形成強度を表示する工程を備え、各塩基コールは前記ハイブリッド形成強度の解析により
求められる、方法。
【請求項７】コンピュータシステムにおいて、検体の
核酸配列における未知の塩基を呼び出すための方法であ
って、複数組の核酸プローブに関するハイブリッド形成強度で
あって、それぞれ核酸プローブと前記検体の核酸配列と
の間のハイブリッド形成親和性を示すハイブリッド形成
強度を入力する工程と、各組のプローブに関して前記未知の塩基に対する塩基コ
ールを演算する工程と、前記複数組のプローブに関して最も発生頻度の高い前記
未知の塩基に対する塩基コールに従って、前記複数組の
プローブに対する単一塩基コールを演算する工程と、を
備える方法。
【請求項８】請求項７記載の方法であって、各組のプローブが同一の参照配列に従って生成されたも
のである、方法。
【請求項９】請求項７記載の方法であって、更に、所定の条件下で、前記複数組の核酸プローブに関する前
記単一塩基コールを特定する例外規則をチェックする工
程、を備える方法。
【請求項１０】コンピュータシステムにおいて、コン
ピュータによる塩基呼び出し処理に関するパラメータを
動的に変更する方法であって、ユーザによって変更可能なパラメータを含む前記塩基呼
び出し処理を利用して、検体の核酸配列の少なくとも一
部に関する塩基コールを生成する工程と、前記検体の核酸配列の少なくとも一部に関する複数の塩
基コールを表示する工程と、前記塩基呼び出し処理のパラメータを表示する工程と、前記塩基呼び出し処理のパラメータに対する新しい値を
規定する入力をユーザーから受け取る工程と、前記塩基呼び出し処理と前記パラメータに関する新しい
値とを用いて、前記検体の核酸配列の少なくとも一部に
関して更新された塩基コールを生成する工程と、前記検体の核酸配列の少なくとも一部に関して前記更新
された塩基コールを表示する工程と、を備える方法。
【請求項１１】請求項１０記載の方法であって、更
に、前記塩基呼び出し処理のための、複数のユーザ変更可能
なパラメータを表示する工程、を備える方法。
【請求項１２】請求項１０記載の方法であって、前記パラメータが、定数、閾値、および、範囲から成る
グループから選択される、方法。
【請求項１３】コンピュータシステムにおいて、検体
の核酸配列における遺伝子の発現を監視する方法であっ
て、前記遺伝子に対して完全に相補的である完全対合プロー
ブと前記遺伝子に対して不対合な塩基を少なくとも一つ
備える不対合プローブとの複数のプローブ対に関する複
数のハイブリッド形成強度であって、前記完全対合およ
び不対合プローブと前記検体の核酸配列との間のハイブ
リッド形成親和性を示すハイブリッド形成強度を入力す
る工程と、前記検体の核酸配列の遺伝子発現コールを生成するため
に、各対の完全対合プローブと不対合プローブのハイブ
リッド形成強度を比較する工程と、前記遺伝子発現コールを表示する工程と、を備える方
法。
【請求項１４】請求項１３記載の方法であって、更
に、或る塩基位置における完全対合プローブと不対合プロー
ブのハイブリッド形成強度の差分を、差分の閾値と比較
する工程、を備える方法。
【請求項１５】請求項１３記載の方法であって、更
に、或る塩基位置における完全対合プローブと不対合プロー
ブのハイブリッド形成強度の比を、比の閾値と比較する
工程、を備える方法。
【請求項１６】請求項１３記載の方法であって、更
に、決定行列を用いて前記遺伝子発現コールを決定する工
程、を備える方法。
【請求項１７】請求項１３記載の方法であって、前記遺伝子発現コールが、発現している、どちらともい
えない、発現していない、から成るグループから選択さ
れる、方法。
【請求項１８】コンピュータシステムにおいて、検体
の核酸配列における遺伝子の発現を監視する方法であっ
て、前記遺伝子に対して完全に相補的である完全対合プロー
ブと前記遺伝子に対して不対合な塩基を少なくとも一つ
備える不対合プローブとの複数のプローブ対に関する複
数のハイブリッド形成強度であって、前記完全対合およ
び不対合プローブと前記検体の核酸配列との間のハイブ
リッド形成親和性を示すハイブリッド形成強度を入力す
る工程と、各対の完全対合プローブと不対合プローブのハイブリッ
ド形成強度を比較する工程と、前記検体の核酸配列の遺伝子発現コールを生成する工程
と、を備える方法。
【請求項１９】請求項１８記載の方法であって、更
に、或る塩基位置における完全対合プローブと不対合プロー
ブのハイブリッド形成強度の差分を、差分の閾値と比較
する工程、を備える方法。
【請求項２０】請求項１８記載の方法であって、更
に、或る塩基位置における完全対合プローブと不対合プロー
ブのハイブリッド形成強度の比を、比の閾値と比較する
工程、を備える方法。
【請求項２１】請求項１８記載の方法であって、更
に、決定行列を用いて前記遺伝子発現コールを求める工程、
を備える方法。
【請求項２２】請求項１８記載の方法であって、前記遺伝子発現コールが、発現している、どちらともい
えない、発現していない、から成るグループから選択さ
れる、方法。
【請求項２３】コンピュータシステムにおいて、検体
の核酸配列における遺伝子の発現変化を監視する方法で
あって、前記遺伝子に対して完全に相補的である完全対合プロー
ブと前記遺伝子に対して不対合な塩基を少なくとも一つ
備える不対合プローブとの複数のプローブ対に関する複
数のハイブリッド形成強度であって、前記完全対合およ
び不対合プローブと前記検体の核酸配列との間のハイブ
リッド形成親和性を示すハイブリッド形成強度を入力す
る工程と、前記検体の核酸配列の遺伝子発現レベルを生成するため
に、各対の完全対合プローブと不対合プローブのハイブ
リッド形成強度を比較する工程と、前記遺伝子発現レベルを、基準の遺伝子発現レベルと比
較することにより発現変化を求める工程と、前記検体の核酸配列における前記遺伝子の発現変化を表
示する工程と、を備える方法。
【請求項２４】請求項２３記載の方法であって、前記発現変化がグラフで表示される、方法。
【請求項２５】請求項２３記載の方法であって、更
に、請求項２３の前記入力工程と前記比較工程に従って、前
記基準の遺伝子発現レベルを生成する工程、を備える方
法。
【請求項２６】請求項２３記載の方法であって、更
に、前記検体の核酸配列とハイブリッドを形成する完全対合
および不対合プローブのハイブリッド形成強度と、基準
配列とハイブリッドを形成する完全対合および不対合プ
ローブのハイブリッド形成強度とを、差分の閾値に対し
て比較する工程、を備える方法。
【請求項２７】請求項２３記載の方法であって、更
に、前記検体の核酸配列とハイブリッドを形成する完全対合
および不対合プローブのハイブリッド形成強度と、基準
配列とハイブリッドを形成する完全対合および不対合プ
ローブのハイブリッド形成強度とを、比の閾値に対して
比較する工程、を備える方法。
【請求項２８】請求項２３記載の方法であって、更
に、決定行列を用いて前記検体の核酸配列における前記遺伝
子の発現変化を決定する工程、を備える方法。
【請求項２９】請求項２３記載の方法であって、前記検体の核酸配列における前記遺伝子の発現変化が、
増加、増加傾向、減少、減少傾向、変化なし、から成る
グループから選択される、方法。
【請求項３０】コンピュータシステムにおいて、検体
の核酸配列における遺伝子の発現変化を監視する方法で
あって、前記遺伝子に対して完全に相補的である完全対合プロー
ブと前記遺伝子に対して不対合な塩基を少なくとも一つ
備える不対合プローブとの複数のプローブ対に関する複
数のハイブリッド形成強度であって、前記完全対合およ
び不対合プローブと前記検体の核酸配列との間のハイブ
リッド形成親和性を示すハイブリッド形成強度を入力す
る工程と、前記検体の核酸配列の遺伝子発現レベルを生成するため
に、各対の完全対合プローブと不対合プローブのハイブ
リッド形成強度を比較する工程と、前記遺伝子発現レベルを、基準の遺伝子発現レベルと比
較することにより発現変化を求める工程と、を備える方
法。
【請求項３１】請求項３０記載の方法であって、更
に、請求項３０の前記入力工程と前記比較工程に従って、前
記基準の遺伝子発現レベルを生成する工程、を備える方
法。
【請求項３２】請求項３０記載の方法であって、更
に、前記検体の核酸配列とハイブリッドを形成する完全対合
および不対合プローブのハイブリッド形成強度と、基準
配列とハイブリッドを形成する完全対合および不対合プ
ローブのハイブリッド形成強度とを、差分の閾値に対し
て比較する工程、を備える方法。
【請求項３３】請求項３０記載の方法であって、更
に、前記検体の核酸配列とハイブリッドを形成する完全対合
および不対合プローブのハイブリッド形成強度と、基準
配列とハイブリッドを形成する完全対合および不対合プ
ローブのハイブリッド形成強度とを、比の閾値に対して
比較する工程、を備える方法。
【請求項３４】請求項３０記載の方法であって、更
に、決定行列を用いて、前記検体の核酸配列における前記遺
伝子の発現変化を決定する工程、を備える方法。
【請求項３５】請求項３０記載の方法であって、前記検体の核酸配列における前記遺伝子の発現変化が、
増加、増加傾向、減少、減少傾向、変化なし、から成る
グループから選択される、方法。