JP2003532367A - ポリマーの識別、確認、マッピングおよび分類手法 - Google Patents

ポリマーの識別、確認、マッピングおよび分類手法

Info

Publication number
JP2003532367A
JP2003532367A JP2000511907A JP2000511907A JP2003532367A JP 2003532367 A JP2003532367 A JP 2003532367A JP 2000511907 A JP2000511907 A JP 2000511907A JP 2000511907 A JP2000511907 A JP 2000511907A JP 2003532367 A JP2003532367 A JP 2003532367A
Authority
JP
Japan
Prior art keywords
hybridization
nucleic acid
polymer
allele
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000511907A
Other languages
English (en)
Inventor
ガンドール,ガッサン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Affymetrix Inc
Original Assignee
Affymetrix Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Affymetrix Inc filed Critical Affymetrix Inc
Publication of JP2003532367A publication Critical patent/JP2003532367A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism

Abstract

(57)【要約】 核酸配列などのサンプル・ポリマーを識別し、確認し、マッピングし、分類するシステムおよび方法を提供する。ポリマー・サンプル中の第1のポリマーと第2のポリマーの比率の推定値は、第1のポリマーと相補関係にあるポリマー・プローブに対するポリマー・サンプルのハイブリダイゼーション親和性を指示する第1のハイブリダイゼーション値を入力し、第2のポリマーと相補関係にあるポリマー・プローブに対するポリマー・サンプルのハイブリダイゼーション親和性を指示する第2のハイブリダイゼーション値を入力することによって計算することができる。ポリマー・サンプル中の第1のポリマーと第2のポリマーの比率の推定値は次いで、第1のハイブリダイゼーション値を、第1のハイブリダイゼーション値と第2のハイブリダイゼーション値の和で除すことによって計算することができる。サンプル中の対立遺伝子の比率の推定値をクラスタ化して、サンプル核酸の識別、確認、マッピングおよび遺伝子型決定に使用することができる比率パターンを形成することができる。

Description

【発明の詳細な説明】
【0001】 本出願は、参照によって本明細書に組み込まれる1997年9月5日出願の米
国暫定出願第60/057957号の利益を主張する。
【0002】 (政府権利通知) この明細書の資料の部分は、Advanced Technology Pr
ogramにおけるアフィメトリックス社(Affymetrix,Inc.)
と米国商務省の間の協力契約書70NANABSH1031に基づいて作成され
たものである。
【0003】 (発明の背景) 本発明は、ポリマーの差異の検出に関する。詳細には本発明は、サンプル核酸
配列の識別、確認、マッピングおよび遺伝子型決定手法に関する。
【0004】 チップまたは基板上に材料のアレイを形成し、これを使用する装置およびコン
ピュータ・システムが知られている。例えば、ともに参照によって本明細書に組
み込まれるPCT出願WO92/10588号および95/11995号には、
核酸およびその他の材料の配列決定または配列チェック手法が記載されている。
これらの操作を実行するためのアレイは、例えば、参照によって全ての目的のた
めに本明細書に組み込まれる米国特許第5445934号、第5384261号
および第5571639号に開示されている先駆的手法の方法に基づいて構成す
ることができる。
【0005】 これらの特許に記載されている手法の一態様によれば、核酸プローブのアレイ
をチップ上の既知の位置に製作する。次いで標識した核酸をチップと接触させ、
スキャナを用いて、標識した核酸がチップと結合した位置を指示するイメージフ
ァイルを生成する。このイメージファイルおよび特定の位置のプローブの識別に
基づいて、DNA、RNAのヌクレオチドまたはモノマー配列などの情報を抽出
することが可能である。このようなシステムは、例えば、遺伝病、癌、感染症、
HIVおよびその他の遺伝的特徴に関連した突然変異の研究および検出に使用す
ることができるDNAアレイの形成に使用されている。
【0006】 VLSIPSTM技術は、非常に小さなチップ上に非常に大きなオリゴヌクレオ
チド・プローブ・アレイを製作する方法を提供する。これについては、いずれも
参照によって全ての目的のために本明細書に組み込まれる、米国特許第5143
854号ならびにPCT特許出願WO90/15070号および92/1009
2号を参照されたい。このDNAプローブ・アレイ上のオリゴヌクレオチド・プ
ローブは、関心のサンプル核酸(「標的」核酸)中の相補的核酸配列の検出に使
用される。
【0007】 配列チェック用途では、チップは特定の標的核酸配列用にタイル状に分割され
る。一例では、チップは、標的配列と完全に相補的なプローブを含み、かつ標的
配列とは1つの塩基がミスマッチしたプローブを含む。de novoの配列決
定用途では、チップは特定の長さの可能な全てのプローブを含む。プローブはチ
ップ上に、それぞれのセルが特定のプローブの複数のコピーを含むセルの行およ
び列の形態に配置される。さらに、プローブを含まない「ブランク」セルをチッ
プ上に設けてもよい。ブランク・セルはプローブを含まないので、標識された標
的は、チップのこの領域とは特異的に結合しない。したがってブランク・セルは
背景強度の基準となる。
【0008】 ヒトゲノム計画が、ヒトの染色体の完全な基準配列を最初に生み出そうとして
いる一方で、既に、個人間の配列の変動に注目が集まっている。遺伝的多様性は
、罹病性の遺伝的変動の基礎を説明する可能性があり、また、ヒトの遺伝的移動
の記録を内包しているため、関心を集めている。
【0009】 ヒトの遺伝子変動の最も一般的なタイプは、1つの位置で2つの代替塩基がヒ
ト集団中かなりの頻度(例えば1%超)で生じる単一ヌクレオチド多型(SNP
:single-nucleotide polymorphism)である。SNPには、少し挙げただけでも
、家族の連鎖研究、隔離集団の連鎖不平衡、患者と対照の関連解析、および腫瘍
のヘテロ接合性なし(loss-of-heterozygosity)研究によって病気遺伝子を識別
するための遺伝マーカとしての利用を含め、多くの利用法がある。マッピングさ
れたSNPの大規模なコレクションは、ヒト遺伝子研究の強力なツールとなると
考えられている。個々のSNPは、従来の遺伝マーカに比べ情報は少ないが、S
NPのほうが、量的に豊富であり、自動化に対してより大きな可能性を秘めてい
る。
【0010】 したがって、核酸などのポリマーを識別、確認、マッピング、および分類する
革新的な手法が求められている。
【0011】 (発明の概要) 本発明は、核酸などのポリマーを識別し、確認し、マッピングし、分類する革
新的なシステムおよび方法を提供する。ポリマー・サンプルを解析して、サンプ
ル中の異なるポリマーの比率の推定値を求めることができる。次いで、推定値を
クラスタ化して比率パターンを形成する。これらのサンプル中のポリマーの識別
、確認、マッピングおよび/または分類をより正確にするため、以降のサンプル
のデータの解釈にこの比率パターンを利用することができる。本発明のいくつか
の実施態様を以下に記載する。
【0012】 一実施態様において本発明は、ポリマー・サンプル中の第1のポリマーと第2
のポリマーの比率を推定する方法を提供する。第1のポリマーと相補関係にある
ポリマー・プローブに対するポリマー・サンプルのハイブリダイゼーション親和
性を指示する第1のハイブリダイゼーション値を入力する。第2のポリマーと相
補関係にあるポリマー・プローブに対するポリマー・サンプルのハイブリダイゼ
ーション親和性を指示する第2のハイブリダイゼーション値を入力する。第1の
ハイブリダイゼーション値を、第1のハイブリダイゼーション値と第2のハイブ
リダイゼーション値の和で除すことによって、ポリマー・サンプル中の第1のポ
リマーと第2のポリマーの比率の推定値を計算する。
【0013】 他の実施態様において本発明は、核酸サンプル中の対立遺伝子の比率を推定す
る方法を提供する。第1の対立遺伝子の一部分と相補関係にある核酸プローブに
対する核酸サンプルのハイブリダイゼーション親和性を指示する第1のハイブリ
ダイゼーション値を入力する。第2の対立遺伝子の一部分と相補関係にある核酸
プローブに対する核酸サンプルのハイブリダイゼーション親和性を指示する第2
のハイブリダイゼーション値を入力する。第1のハイブリダイゼーション値を、
第1のハイブリダイゼーション値と第2のハイブリダイゼーション値の和で除す
ことによって、核酸サンプル中の第1の対立遺伝子と第2の対立遺伝子の比率の
推定値を計算する。
【0014】 他の実施態様において本発明は、核酸サンプルの遺伝子型を決定する方法を提
供する。複数の核酸サンプル中の第1の対立遺伝子と第2の対立遺伝子の比率の
複数の推定値を生成する。複数の推定値をクラスタ化して、比率パターン形成す
る。核酸サンプル中の第1の対立遺伝子と第2の対立遺伝子の比率の推定値を計
算し、核酸サンプル中の第1の対立遺伝子と第2の対立遺伝子の比率の推定値を
比率パターンと比較することによって核酸サンプルの遺伝子型を決定する。一例
として比率パターン中のクラスタは、第1の対立遺伝子のホモ接合、第2の対立
遺伝子のホモ接合、および両方の対立遺伝子のヘテロ接合を表す。
【0015】 本発明のその他の特徴および利点は、以下の詳細な説明を添付図面に関連させ
て検討することによって容易に明白となろう。
【0016】 (好ましい実施形態の詳細な説明) 以下に、VLSIPSTM技術を利用してチップ上に非常に大きなオリゴヌクレ
オチド・プローブ・アレイを製作する好ましい実施形態に関して本発明を説明す
る。しかし、本発明は核酸またはこの技術に限定されるものではなく、その他の
ポリマーおよび製造プロセスにも有利に適用することができる。したがって、以
下の実施形態の説明は例示が目的であって、限定を目的としたものではない。
【0017】 図1に、本発明の実施形態のソフトウェアを実行する目的に使用することがで
きるコンピュータ・システムの例を示す。図1は、ディスプレイ3、スクリーン
5、キャビネット7、キーボード9およびマウス11を含むコンピュータ・シス
テム1を示している。マウス11は、グラフィカル・ユーザ・インタフェースと
対話するための1つまたは複数のボタンを有する。キャビネット7は、本発明を
実装するコンピュータ・コードが組み込まれたソフトウェア・プログラムや本発
明で使用するデータなどの記憶および取出しに利用することができるCD−RO
Mドライブ13、システム・メモリおよびハード・ドライブ(図2参照)を収容
する。例示的なコンピュータ可読記憶媒体としてCD−ROM15を示したが、
フロッピー・ディスク、テープ、フラッシュ・メモリ、システム・メモリおよび
ハード・ドライブを含むその他のコンピュータ可読記憶媒体も利用することがで
きる。さらに、(例えばインターネットを含むネットワーク内で)搬送波中に埋
め込まれたデータ信号をこのコンピュータ可読記憶媒体とすることもできる。
【0018】 図2に、本発明の実施形態のソフトウェアを実行する目的に使用されるコンピ
ュータ・システム1のシステム・ブロック図を示す。図1に示したとおり、コン
ピュータ・システム1は、モニタ3、キーボード9およびマウス11を含む。コ
ンピュータ・システム1はさらに、中央処理装置51、システム・メモリ53、
固定記憶装置55(例えばハード・ドライブ)、取り外し可能な記憶装置57(
例えばCD−ROMドライブ)、ディスプレイ・アダプタ59、サウンド・カー
ド61、スピーカ63、ネットワーク・インタフェース65などのサブシステム
を含む。本発明での使用に適したコンピュータ・システムにはこの他、これより
も少ない数のサブシステムを含むもの、または追加のサブシステムを含むものが
ある。例えば、別のコンピュータ・システムは、2つ以上の処理装置51(すな
わちマルチプロセッサ・システム)またはキャッシュ・メモリを含む。
【0019】 コンピュータ・システム1のシステム・バス・アーキテクチャは矢印67で表
されている。しかし、これらの矢印は、サブシステムを連結する働きをする任意
の相互接続方式を表す。例えば、ローカル・バスを利用して、中央処理装置をシ
ステム・メモリおよびディスプレイ・アダプタに接続することができる。図2に
示したコンピュータ・システム1は、本発明での使用に適したコンピュータ・シ
ステムの一例に過ぎない。異なるサブシステム構成を有するその他のコンピュー
タ・アーキテクチャを利用することもできる。
【0020】 例示のため、本発明を、チップ・マスクを設計し、チップ上でプローブを合成
し、核酸を標識し、ハイブリダイゼーションさせた核酸プローブを走査するコン
ピュータ・システムの部分として説明する。このようなシステムは、参照によっ
て全ての目的のために本明細書に組み込まれる先に挙げた米国特許第55716
39号に詳細に記載されている。しかし、本発明を全体システムとは別個に使用
して、このようなシステムが生成したデータを解析するようにしてもよい。
【0021】 図3に、RNA、DNAなどの生物学的材料のアレイを形成し解析するコンピ
ュータ化システムを示す。コンピュータ100は、RNA、DNAなどの生物学
的ポリマーの設計に使用される。コンピュータ100は例えば、図1および2に
示した適当なメモリおよびCPUを含み、適当にプログラムされたSun Wo
rkstation、あるいはIBM PC同等機などのパーソナル・コンピュ
ータまたはワークステーションである。コンピュータ・システム100はユーザ
から、関心の遺伝子の特性に関する入力および所望のアレイの特徴に関するその
他の入力を得る。コンピュータ・システムは任意選択で、関心の特定の遺伝子配
列に関する情報をGenBankなどの外部または内部データベース102から
得ることができる。コンピュータ・システム100の出力は、例えばPCT出願
WO92/10092号に記載されているスイッチ・マトリックスの形態の一組
のチップ設計コンピュータ・ファイル104およびその他の関連コンピュータ・
ファイルである。
【0022】 チップ設計ファイルは、DNAなどの分子のアレイの製造に使用するリソグラ
フィック・マスクを設計するシステム106に渡される。システムまたはプロセ
ス106は、マスク110を製造するのに必要なハードウェア、ならびにマスク
上にマスク・パターンを効率よくレイアウトするのに必要なコンピュータ・ハー
ドウェアおよびソフトウェア108を含む。図3のその他の機能と同様に、これ
らの機器は、同じ物理サイトに配置してもよいし、そうしなくてもよいが、図を
平易にするために図3では同じ場所に示した。システム106は、ポリマー・ア
レイの製造に使用するガラスにクロムを形成させたマスクなどのマスク110ま
たはその他の合成パターンを生成する。
【0023】 マスク110ならびにチップ設計に関係したシステム100からの選択情報は
、合成システム112で使用される。合成システム112は、基板またはチップ
114上にポリマーのアレイを製作するのに必要なハードウェアおよびソフトウ
ェアを含む。合成器112は例えば、光源116および化学フロー・セル118
を含み、化学フロー・セル118の上に基板またはチップ114が置かれる。マ
スク110は、光源と基板/チップの間に置かれ、これら2つは、チップの選択
領域の脱保護のために互いに対して適当な回数、平行移動される。脱保護された
領域に結合させるため、ならびに洗浄およびその他の操作のために、選択した化
学試薬をフロー・セル118に通す。全ての操作は、適当にプログラムされたコ
ンピュータ119によって指図されることが好ましい。コンピュータ119は、
マスク設計およびマスク製作に使用したものと同じコンピュータでもよいし、別
のものでもよい。
【0024】 合成システム112で製作した基板を、任意選択でより小さなチップにダイシ
ングし、マークした標的に露出させる。標的は、基板上の1種または複数種の分
子と相補関係にある場合もあるし、そうでない場合もある。標的を、フルオレセ
イン標識などの標識(図3ではアスタリスクで示す)を用いてマークし、走査シ
ステム120の中に置く。好ましい実施形態では蛍光マーカを利用するが、異な
る放射強度、光散乱、屈折率、伝導率、エレクトロルミネセンスまたはその他の
大分子検出データを提供するその他のマーカを利用してもよい。したがって本発
明は、ハイブリダイゼーションの蛍光測定値の分析に限定されるものではなく、
ハイブリダイゼーションのその他の測定値を分析するのにも容易に利用すること
ができる。
【0025】 走査システム120もやはり、適当にプログラムされたディジタル・コンピュ
ータ122の指示の下で動作する。ディジタル・コンピュータ122も、合成、
マスク製作およびマスク設計に使用したものと同じコンピュータでもよいし、別
のものでもよい。スキャナ120は、標識された標的(*)が基板と結合した位
置を検出するのに使用するコンフォーカル顕微鏡、CCD(電荷結合デバイス)
などの検出装置124を含む。スキャナ120の出力は、フルオレセインで標識
した標的の場合、蛍光強度(光子カウント、または電圧などのその他の関係測定
値)を基板上の位置の関数として示すイメージファイル124である。標識され
た標的がポリマーのアレイ(例えば基板上のDNAプローブ)と強く結合するほ
ど高い光子カウントが観測され、基板上のポリマーのモノマー配列が位置の関数
として既知であるため、標的と相補関係にある基板上のポリマーの配列を決定す
ることができる。
【0026】 イメージファイル124は、本発明の合成完全性評価手法が組み込まれた解析
システム126に入力として渡される。この解析システムもやはり、さまざまな
コンピュータ・システムのうちのいずれでもよいが、好ましい実施形態では、こ
の解析システムが、Windows NTワークステーションまたは同等機に基
づくシステムである。この解析システムはイメージファイルを解析し、DNA、
RNAなどの標的中の特定の突然変異の識別など、適当な出力128を生成する
ことができる。
【0027】 図4に、特定の標的DNAとDNAプローブのアレイ114との結合を示す。
この単純な例に示すように、アレイには以下のプローブが形成されている。 3’−AGAACGT AGACCGT AGAGCGT AGATCGT ・ ・ ・ 図示のように、フルオロセインで標識した(あるはマークした)標的5’−TC
TTGCAをアレイに対して露出させると、これは、プローブ3’−AGAAC
GTに対してのみ相補的であり、フルオレセインは、チップの表面の3’−AG
AACGTが位置する場所に主に見られる。チップは、特定のプローブのコピー
を複数含むセルを含み、セルは、チップ上の正方形の領域とすることができる。
【0028】 以下の説明では、本発明をSNPに関して説明する。したがってサンプル核酸
は一般に、これらのSNP位置に2つの対立遺伝子の一方または両方を含む。こ
れらの2つの対立遺伝子を総称してA対立遺伝子およびB対立遺伝子と呼ぶこと
にする。ある位置にSNPがある場合、複数の個体のプールでは、そのうちの何
個体かはホモ接合AAであり、別の何個体かはホモ接合BBであり、残りの何個
体かはヘテロ接合ABであることが期待される。本発明はSNPに関して説明さ
れるが、本発明はこれに限定されるものではなく、挿入、欠失、複数位置(mult
i-position)多型、複数塩基(multi-base)多型および複数対立遺伝子位置を含
む、その他の多型条件に有利に適用することができる。
【0029】 図5に、サンプル核酸の識別、確認、マッピングおよび/または遺伝子型決定
に利用することができるタイル状に分割されたチップの一部分を示す。チップは
一般に、核酸プローブがチップに結合した数千個のセルを含む。チップは、チッ
プ上にタイル状に配置された、特定の用途(例えば、HIV治療での薬物療法に
対する耐性の変化を示す突然変異の検出など)向けの異なるプローブを有するチ
ップか、または(例えば、可能な全ての八量体プローブを有した)汎用チップで
ある。さらにセルは、多くの方法でチップ上にレイアウトすることができる。例
えば、セルを、セル間の干渉が低減することによって走査データが改善される位
置、利用するマスクの数が減ることによって製造コストが低減される位置、また
は利用者によるデータの解釈が容易になる位置に配置することができる。
【0030】 遺伝子型決定チップの一部分の好ましいレイアウトを図5を参照して説明する
。レイアウトは一般に、利用者によるデータの解釈および後述するチップ上のプ
ローブの構造の理解が容易になるように編成される。しかし本発明は、特定のチ
ップ・レイアウトまたはプローブ構造に限定されないことを理解されたい。本発
明は、その他のチップ・レイアウトにも有利に適用することができる。
【0031】 A対立遺伝子が配列5’−CCTCGCATを含み、B対立遺伝子が配列5
’−CCTCGCATを含むと仮定する。下線を引いたヌクレオチドは、対立
遺伝子を区別するSNPを表す。議論の目的上、対立遺伝子中のヌクレオチドの
位置を変数dで指定する。SNPではd=0であり、dは、SNPの左に向かっ
て低減し、右に向かって増大する。図5は、SNPの付近の5つの位置を含むブ
ロック201を示す。ブロック201に含まれる位置の数は、図示を目的に選択
したものであり、この数は用途によって変動する。
【0032】 図5の最上部に対立遺伝子の配列を示す。d=0でクレオチドがG/Aと示さ
れているのは、A対立遺伝子とB対立遺伝子を区別するSNPを表すためである
。図示のようにブロック201は、A対立遺伝子用に配置された4段のセル、お
よびB対立遺伝子用に配置された4段のセルを含む。セルの段は、その段の核酸
プローブの問合せ位置のヌクレオチドを表すヌクレオチドT、G、CおよびAに
よって設計されている。ブロック201をさらに、関心の対立遺伝子と完全にマ
ッチする1つの完全マッチ・プローブ、およびをゼロまたはそれ以上のミスマッ
チ・プローブを有する一組のセル(およびそれらの対応するプローブ)を表すミ
ニブロック203に分割することができる。一実施形態ではミニブロックをチッ
プ上の列として示すが、ミニブロックがチップ上の特定の方向に並んでいなけれ
ばならないというわけではない。
【0033】 対立遺伝子の配列が5’−CCTCGCATであることを想起されたい。ク
エスチョン・マークはSNPを指示しており、GまたはAのいずれかである。チ
ップ上のプローブが、中央のヌクレオチドが問合せ位置である五量体であると仮
定すると、チップ上のプローブは以下のようになろう。
【表1】 プローブ中の問合せ位置のヌクレオチドには下線が引かれている。さらに、それ
ぞれのプローブのSNPヌクレオチド、すなわちA対立遺伝子の場合のCおよび
B対立遺伝子の場合のTは、太字で示されている。見て分かるとおり、d=0の
ミニブロックでは、上半分と下半分が同一であり、したがってこの位置にはどち
らか半分だけを配置することも可能である。
【0034】 ミニブロックは、完全マッチ・プローブ(すなわち標的対立遺伝子と完全に相
補的なプローブ)およびミスマッチが1つだけある複数のプローブを含む。問合
せ位置がSNPと同じなのは中央のミニブロックだけである。したがって、中央
のミニブロックのミスマッチ・プローブでは、両方の対立遺伝子に対して塩基が
1つだけミスマッチしている。これに対して中央以外のミニブロックのミスマッ
チ・プローブでは、一方の対立遺伝子に対して1つの塩基がミスマッチしており
、他方の対立遺伝子に対しては2つの塩基がミスマッチしている。
【0035】 図5に戻る。セルは以下のように標識されている。 PMa−A対立遺伝子と完全にマッチする PMb−B対立遺伝子と完全にマッチする Ma−A対立遺伝子とは1つの塩基がミスマッチしている Mb−B対立遺伝子とは1つの塩基がミスマッチしている M*−A対立遺伝子とB対立遺伝子の両方に対して1つの塩基がミスマッチし
ている 図5は、中央以外のミニブロックが、2つの完全マッチ・プローブ、およびそれ
ぞれの対立遺伝子に対して2つずつ合計4つのミスマッチ・プローブを含むこと
を示している。中央ミニブロックは、それぞれの対立遺伝子に対する完全マッチ
・プローブおよび両方の対立遺伝子に対する2つのミスマッチ・プローブを含む
。以下の議論では、これらの標識を利用して本発明の実施形態を説明する。
【0036】 図6に、複数のポリマーを有するサンプル中のポリマーの比率を推定する流れ
図を示す。好ましい実施形態ではこのポリマーが核酸であるが、ペプチド、オリ
ゴ糖などを含むその他のポリマーを利用することもできる。したがって本発明は
、本明細書に記載の特定の実施形態に限定されない。
【0037】 ステップ301で、第1のポリマーに対するポリマー・サンプルのハイブリダ
イゼーション親和性を指示する第1のハイブリダイゼーション値を入力する。ポ
リマー・サンプルは、第1のポリマーと相補関係にあるポリマー配列を含む、複
数の異なるポリマー配列を有する。ステップ303で、第2のポリマーに対する
ポリマー・サンプルのハイブリダイゼーション親和性を指示する第2のハイブリ
ダイゼーション値を入力する。第1および第2のハイブリダイゼーション値は、
第1および第2のポリマーと相補関係にあるポリマーのサンプルの比率に基づい
て変動することが予想される。
【0038】 ステップ305で、第3のハイブリダイゼーション値を、第1および第2のハ
イブリダイゼーション値から減じる。第3のハイブリダイゼーション値を利用し
て、第1および第2のハイブリダイゼーション値を正規化することができる。後
述するように好ましい実施形態では、第3のハイブリダイゼーション値がミスマ
ッチ核酸プローブから導かれ、これによって不必要な背景値を取り去ることがで
きる。
【0039】 正規化した第1のハイブリダイゼーション値を、正規化した第1のハイブリダ
イゼーション値と正規化した第2のハイブリダイゼーション値の和で除すことに
よって、ポリマー・サンプル中の第1のポリマーと第2のポリマーの比率の推定
値を計算する。このようにすると推定値は一般に、0と1の間を変化する。1は
、第1のポリマーと相補関係にあるポリマーの濃度が非常に高いことを指示し、
0は、第2のポリマーと相補関係にあるポリマーの濃度が非常に高いことを指示
する。
【0040】 3種類以上のポリマーまたは対立遺伝子を解析する実施形態では、分母が3つ
以上のハイブリダイゼーション値を含む。したがって本発明は、2種類のポリマ
ーまたは対立遺伝子の解析だけに限定されない。
【0041】 好ましい実施形態の核酸プローブの標識に戻る。核酸プローブのサンプルが、
A対立遺伝子のホモ接合である個体からとったものである場合、中央ミニブロッ
クではPMa>PMb=M*となることが期待される。同様に、核酸プローブの
サンプルが、B対立遺伝子のホモ接合である個体からとったものである場合、中
央ミニブロックではPMb>PMa=M*となることが期待される。個体がヘテ
ロ接合である場合には、中央ミニブロックではPMa≒PMb>M*となること
が期待される。
【0042】 図6に示した比率の推定を、それぞれのミニブロックについて以下の通りとす
ることができる。 p−hat=(PMa−MM)/((PMa−MM)+(PMb−MM)) 上式で、p−hatは比率の推定値を表し、MMはミスマッチ・プローブM*
MaまたはMbから求める。MMは例えば以下のように計算される。 中央ミニブロック:MM=min(M*,M*) 中央以外のミニブロック:MM=max(median(Ma,Ma,Ma)
,median(Mb,Mb,Mb)) 一実施形態では中央ミニブロックに対して最小値が利用される。これは、2つの
異なったM*ミスマッチ・プローブのみがあり、クロスハイブリダイゼーション
に起因する非常に大きな値が含まれるのを避けるのが望ましいためである。
【0043】 前記のMMの式は、利用可能な式の例に過ぎない。他の式を利用することもで
き、特定の用途に応じて使い分けることが好ましい。一例として、ミスマッチ・
プローブを1つだけ有するミニブロックを配置することができる。このような場
合、MMは、単一のミスマッチ・セルのプローブから測定したハイブリダイゼー
ション親和性となる。ミスマッチ・プローブは必須ではないが、これがあると計
算がロバストになることが分かっている。
【0044】 前記p−hatの式から、PMaまたはPMbがMMよりも小さい場合には、
p−hatが負となったり、またはゼロで割らなくてはならなくなる可能性があ
ることが明らかである。したがっていくつかの実施形態では、(PMa−MM)
または(PMb−MM)の計算が負になる場合、この計算の結果をゼロと置く。
したがって、Da=max(PMa−MM,0)、Db=max(PMb−MM
,0)と置くと、前記p−hatの式は次のように書くことができる。 p−hat=Da/(Da+Db) 分母がゼロとなる可能性は依然として残るが、後に詳細に説明するように、品質
フィルタがこのようなデータを不良データとして拒絶し、そのため、不法な操作
は実施されない。別の代替方法として、負(またはゼロ)の計算結果を、例えば
0.00001のような非常に小さな数に置き換えることが考えられる。
【0045】 他の実施形態では、比率の推定値が複数のミニブロックから計算される。例え
ば、これらのミニブロックの完全マッチ・プローブPMaのハイブリダイゼーシ
ョン親和性の和をとり、完全マッチ・プローブPMbのハイブリダイゼーション
親和性の和をとる。これらの和をそれぞれ、前記式のPMaまたはpMbとして
利用し、比率の推定値p−hatを生成する。この実施形態の1つの利点は、完
全マッチ・プローブのハイブリダイゼーション親和性に基づいて、ミニブロック
が効果的に重み付けされることである。このことはいくつかの用途で望ましい。
【0046】 図7に、複数の核酸のサンプルを解析するプロセスの流れ図を示す。ステップ
351で、ハイブリダイゼーション親和性データの品質検査を実行する。本明細
書のその他の全ての流れ図と同様に、本発明の趣旨から逸脱することなく削除、
追加、結合および変更が可能な多くのステップがある。全ての実施形態で品質検
査が必要であるわけではないが、品質検査は、誤ったハイブリダイゼーション親
和性データ(例えば、チップに不備がある場合、またはチップのハイブリダイゼ
ーションさせた領域を走査する間に誤差が生じた場合)を除去する意味で有用で
ある。利用可能な品質検査の1つが、(PMa−MM)および(PMb−MM)
がある所定のしきい値(例えば15光子カウント)よりも大きくなければならな
いとするものである。他の品質検査は、最も高いハイブリダイゼーション親和性
が、完全マッチ・プローブPMaまたはPMbのものでなければならないとする
ものである。
【0047】 (PMa/max(Ma))<1かつ(PMb/max(Mb))<1の場合
にそのミニブロックを失敗とする他の品質検査も可能である。その他の品質検査
を考案し、利用することもできる。さらに、これらの品質検査を組み合わせて、
2つ以上の検査を通らなければ以降の処理に進めないことにすることもできる。
望ましければ品質検査を、複数のブロック全体に実行することもできる。
【0048】 ステップ353で、複数のサンプルについて対立遺伝子の比率の推定値を複数
、生成する。それぞれのサンプル中の核酸の比率の推定値は、図6に示した、ま
たは先に説明したプロセスに基づいて計算することができる。これらのサンプル
は、合理的な大きさおよび多様性を有する個体グループからとることができる。
ステップ355で、これらのサンプル中の対立遺伝子の比率の複数の推定値をク
ラスタ化して、比率パターンを形成する。クラスタ化は、参照によって本明細書
に組み込まれるW.L.G.Koontzet al.IEEE Trans.
,Comp.C−21,171(1972)に記載のバレー・シーキング・クラ
スタリング・テクニック(valley seeking clusterin
g technique)を含む従来の方法で実行することができる。その他の
クラスタ化手法を本発明で利用することもできる。以下に説明するように、続い
てこの比率パターンを利用して、核酸サンプルの識別、確認、マッピングおよび
/または遺伝子型決定を実施することができる。
【0049】 ステップ357で、サンプルを解析し、サンプル中の対立遺伝子の比率の推定
値を計算する。推定値は、図6に示し、先に説明したプロセスに基づいて計算す
ることができる。ステップ359で、対立遺伝子の比率の推定値を比率パターン
と比較する。この比較から、SNPを識別し、その存在を確認し、標的をマッピ
ングし、および/またはサンプル(またはサンプルを得た個体)の遺伝子型を決
定することができる。
【0050】 本発明の実施形態を用いて実行した実験から得たデータをここで説明すること
は有益であろう。図5に関して説明したものと同様の構造を有する遺伝子型決定
チップを、41個体から得たサンプルとハイブリダイゼーションさせた。チップ
は、約600のSNPを含んでいた。図8に、最初の45SNPについて実験結
果を表にまとめたものを示す。
【0051】 表375は複数の列を含む。列376は、表の指定の行に示したSNP(1〜
45)の番号である。列377は、SNPの識別名(またはマーカ)である。混
乱を避けるため、核酸を1方向しかないように論じてきたが、好ましい実施形態
では、センス・ストランドとアンチセンス・ストランドの両方のサンプル核酸お
よびプローブを利用する。列378は、データがどちらのストランドのものかを
指定する。「A」はセンス・ストランドを表し、「Z」はアンチセンス・ストラ
ンドを表す。
【0052】 列379は、その特定のSNPに対して利用しなかった(例えば、データが品
質フィルタを通らなかった)サンプルの数を示す。列380はホモ接合AAであ
る個体数、列381はヘテロ接合ABである個体数、列382はホモ接合BBで
ある個体数をそれぞれ指示する。列383は、ホモ接合AA個体に対応する比率
パターンのクラスタの中心を指示し、列384は、ヘテロ接合AB個体に対応す
る比率パターンのクラスタの中心を指示し、列385は、ホモ接合BB個体に対
応する比率パターンのクラスタの中心を指示する。便宜上、比率の推定値には1
00を乗じ、表に示すように、比率パターンの値が約0〜100の範囲で変動す
るようにした。
【0053】 ホモ接合AA個体のクラスタの中心は100、ヘテロ接合AB個体のクラスタ
の中心は50、ホモ接合BB個体のクラスタの中心は0となることが期待される
。表375をよく見ると、このようなことは実際のデータでは滅多に起こらない
ことが分かる。行391のデータは、列383ないし385に示したクラスタの
中心が99、48、1と期待される値に非常に近く、非常に良いデータである。
しかし行393は、列383ないし385に示したクラスタの中心が97、71
、10であり、期待されるものとは非常に異なったデータを含んでいる。
【0054】 行393に示したようなデータは、それが、厳密な100、50、0のスケー
ルに基づく遺伝子型に完全に正確であるとは限らないことを示している。比率パ
ターンは、それぞれのSNPに対して固有である。比率パターンは例えば、SN
Pの近くの特定の核酸配列、ハイブリダイゼーション中の核酸の相互作用など結
果である。本発明の実施形態では、行393に対応するSNPでサンプル(また
は個体)の遺伝子型を決定する目的に、比率パターン97、71、10を利用す
る。したがって、サンプルの対立遺伝子の比率の推定値が予め定義した71の範
囲に含まれる場合には、このサンプルの遺伝子型がヘテロ接合として決定される
。したがって推定値75から、ヘテロ接合の遺伝子型コールが生成されうるが、
100、50、0スケールを使用するとノンコールまたは誤ったコールがおそら
く生成される。
【0055】 3つのクラスタの存在および相対的な位置を利用して、SNPの識別および/
または確認をすることができる。SNPは、参照によって本明細書に組み込まれ
る1998年8月14日提出の「Polymorphism Detectio
n Utilizing Clustering Analysis」という名
称の米国特許出願第 号(代理人事件整理番号AFFYP010号)に
記載の革新的な手法に基づいて識別し、確認することもできる。ゲル・ベースの
従来の手法を含むその他の手法を利用して、SNPを識別し確認することもでき
る。
【0056】 行395に2つのクラスタしか示されていないのは、ホモ接合BBのクラスタ
がないためである。これは、ホモ接合BBである個体からのサンプルがなかった
ことが原因である。しかし、異常なクラスタ化パターンが、SNPがその位置に
ないこと、またはより複雑な突然変異が起こっていることを示していることもあ
る。例えば、クラスタが1つだけの場合は、SNPがその位置にないことを指示
し、一方、4つ以上のクラスタがある場合は、核酸中に単一多型よりも多い相違
があることを示す。
【0057】 図9Aないし9Cにそれぞれ、行391、393および395の比率パターン
を示す。図示のとおり図9Aは、クラスタが十分に間隔を置いて配置されており
、ほとんど理想的であるように(すなわち期待される通りに)見える。しかし図
9Bの比率パターンでは、2つのクラスタがかなり近くに位置している。最後の
図9Cの比率パターンは、クラスタが2つしかない。クラスタの大きさは、クラ
スタ中のサンプルの相対的な数を示すものではなく、SNPに応じてクラスタの
中心がどれくらい異なるか、および比率パターンがどのくらい変動するかを示す
ために示したものである。
【0058】 1個体の比率パターンの相対的な変化を経時的に監視することができる。例え
ば、腫瘍の原因となるSNPを監視して、腫瘍の原因であると考えられている対
立遺伝子の相対濃度が治療によって低下するかどうかを判定する。
【0059】 図10に、単一のストランド遺伝子型コールを生成するプロセスの流れ図を示
す。ステップ401で、2つ以上のミニブロックが不良データを有するかどうか
を判定するチェックを実行することができる。例えば、SNPに対する2つ以上
のミニブロックが、図7のステップ351の品質検査を通らなかったとする。ス
テップ403で、不良データを有するミニブロックが2つ以上あった場合、ステ
ップ405で、遺伝子型コールは「失敗」となる。そうでない場合には、ステッ
プ407で、ミニブロックからの最も共通した遺伝子型コールが1つまたは複数
の検査を通るかどうかを判定するチェックを実行する。ステップ401ではチェ
ックを2つ以上のミニブロックに関して説明したが、この数は、用途に応じて変
更することができる。しかし、検査するミニブロックの数をミニブロックの数に
比例して変更する(すなわち、ミニブロックの数が増えるにつれて検査する数も
増やす)のが有利である。
【0060】 検査をn>(N−s)/2とすることができる。上式で、Nはミニブロック数
、nは最も共通した遺伝子型コールを生成したミニブロックの数、sは、不良デ
ータを有する、または品質検査を通らなかったミニブロックの数である。検査を
m<2とすることもできる。上式で、mは、2番目に共通した遺伝子型コールを
生成したミニブロックの数である。さらに、n−m≧(N−s)/2とする検査
も可能である。ステップ409で、ミニブロックが、1つの検査または検査の組
合せに通らなかった場合、(例えば、すべて式が真である場合)遺伝子型コール
は、ステップ411で「ノー・コール」となる。その他の検査および検査の組合
せを考案し、利用することもできる。ミニブロックがこの1つまたは複数の検査
に通った場合、ステップ413で、遺伝子型コールは、ミニブロックによって生
成された最も共通した遺伝子型コールとなる。
【0061】 図11に、ストランド遺伝子型コールを結合するプロセスの流れ図を示す。図
10に示したプロセスによって複数のストランド遺伝子型コールが生成されるこ
とがある。簡潔にするために図11の流れ図は、2つのストランドに関して説明
する。しかしこのプロセスを、3つ以上のストランドからの遺伝子型コールの結
合、および異なる実験の結果に有利に適用することができる。
【0062】 ステップ451で、両方のストランドが「ノー・コール」を生成したかどうか
を判定するチェックを実施する。ステップ453で両方のストランドが「ノー・
コール」を生成していた場合には、これらを結合したステップ455でのコール
は「ノー・コール」となる。そうでない場合には、一方のストランドが「ノー・
コール」を、他方のストランドが遺伝子型コール(例えばホモ接合AA)を生成
したかどうかを判定するチェックを実施する。ストランドが混合された「ノー・
コール」を有する場合、ステップ461でこの遺伝子型コールが生成される。
【0063】 ステップ463で、両方のストランドが遺伝子型コールを生成し、それらが一
致するかどうかを判定するチェックを実施する。両方のストランドが異なる遺伝
子型コールを生成した場合には、ステップ467でコールは「ノー・コール」と
なる。そうでない場合には、ステップ469で、両方のストランドの遺伝子型コ
ールが一致した遺伝子型コールとして生成される。
【0064】 本発明の実施形態は、単一の遺伝子型決定チップを利用して同時に500のS
NPの遺伝子型を決定する。参照によって本明細書に組み込まれる「Large
−Scale Identification,Mapping,and Ge
notyping of Single−Nucleotide Polymo
rphisms in the Human Genome」,David G
.Wang et al.,Science,Vol.280,pp.1077
−1082,1998年5月15日を参照されたい。その結果は、本発明の実施
形態を利用してSNPの大規模な識別および解析が可能であることを示している
【0065】 以上に、本発明の好ましい実施形態を完全に説明したが、さまざまな代替、変
更および等価形態が可能である。以上に記載した実施形態を適当に変更すること
によって、本発明を等しく適用することができることが明らかである。例えば、
本発明を、チップ上に合成した核酸プローブに関して説明してきたが、本発明を
、その他のモノマー(例えばアミノ酸および糖)、ならびにプローブを基板に取
り付けないものを含むその他のハイブリダイゼーション手法に有利に適用するこ
とができる。したがって、以上の説明を、添付の請求項の境界ならびに等価物の
完全な範囲によって定義される本発明の範囲を限定するものとしてとらえてはな
らない。
【図面の簡単な説明】
【図1】 本発明の実施形態のソフトウェアを実行する目的に利用することができるコン
ピュータ・システムの例を示す図である。
【図2】 図1のコンピュータ・システムのシステム・ブロック図である。
【図3】 DNA、RNAなどの生物学的材料のアレイを形成し解析する全体システムを
示す図である。
【図4】 チップ上でのプローブの結合を概念的に示す図である。
【図5】 遺伝子型決定チップの一実施形態の一部分を示す図である。
【図6】 ポリマーの比率を推定するプロセスの流れ図である。
【図7】 核酸サンプルを分析するプロセスの流れ図である。
【図8】 本発明の一実施形態に基づく実験データおよび結果を示す表である。
【図9A】 図8の表の比率パターンの1つを示す図である。
【図9B】 図8の表の比率パターンの1つを示す図である。
【図9C】 図8の表の比率パターンの1つを示す図である。
【図10】 単一のストランドから遺伝子型コールを生成するプロセスの流れ図である。
【図11】 ストランド遺伝子型コールを結合して単一の遺伝子型コールとするプロセスの
流れ図である。
【手続補正書】
【提出日】平成12年8月2日(2000.8.2)
【手続補正1】
【補正対象書類名】図面
【補正対象項目名】全図
【補正方法】変更
【補正の内容】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図10】
【図11】
───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号 09/148,210 (32)優先日 平成10年9月5日(1998.9.5) (33)優先権主張国 米国(US) (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SZ,UG,ZW),EA(AM ,AZ,BY,KG,KZ,MD,RU,TJ,TM) ,AL,AM,AT,AU,AZ,BA,BB,BG, BR,BY,CA,CH,CN,CU,CZ,DE,D K,EE,ES,FI,GB,GE,GH,GM,HR ,HU,ID,IL,IS,JP,KE,KG,KP, KR,KZ,LC,LK,LR,LS,LT,LU,L V,MD,MG,MK,MN,MW,MX,NO,NZ ,PL,PT,RO,RU,SD,SE,SG,SI, SK,SL,TJ,TM,TR,TT,UA,UG,U S,UZ,VN,YU,ZW Fターム(参考) 4B024 AA11 AA20 CA01 CA09 CA11 HA11 HA14 4B063 QA01 QQ42 QQ52 QR42 QR55 QR66 QS34 QS39 QX02

Claims (25)

    【特許請求の範囲】
  1. 【請求項1】 ポリマー・サンプル中の第1のポリマーと第2のポリマーの
    比率を推定する方法であって、 第1のポリマーと相補関係にあるポリマー・プローブに対するポリマー・サン
    プルのハイブリダイゼーション親和性を指示する第1のハイブリダイゼーション
    値を入力するステップ、 第2のポリマーと相補関係にあるポリマー・プローブに対するポリマー・サン
    プルのハイブリダイゼーション親和性を指示する第2のハイブリダイゼーション
    値を入力するステップ、および 第1のハイブリダイゼーション値を第1のハイブリダイゼーション値と第2の
    ハイブリダイゼーション値の和で除すことによって、ポリマー・サンプル中の第
    1のポリマーと第2のポリマーの比率の推定値を計算するステップ を含む方法。
  2. 【請求項2】 第1のポリマーと第2のポリマーのどちらとも異なる少なく
    とも1種のモノマーを含むポリマー・プローブに対するポリマー・サンプルのハ
    イブリダイゼーション親和性を指示する第3のハイブリダイゼーション値を第1
    および第2のハイブリダイゼーション値から減ずるステップをさらに含む請求項
    1に記載の方法。
  3. 【請求項3】 第1のポリマーと第2のポリマーのどちらとも異なる少なく
    とも1種のモノマーを含むポリマー・プローブに対するポリマー・サンプルのハ
    イブリダイゼーション親和性をそれぞれ指示する複数のハイブリダイゼーション
    値の中から第3のハイブリダイゼーション値を選択するステップをさらに含む請
    求項2に記載の方法。
  4. 【請求項4】 第3のハイブリダイゼーション値を選択するステップが、ポ
    リマー・サンプルに対して最も低いハイブリダイゼーション親和性を指示するハ
    イブリダイゼーション値を選択するステップを含む請求項3に記載の方法。
  5. 【請求項5】 減算後の第1および第2のハイブリダイゼーション値がゼロ
    よりも小さい場合に、これらの値をゼロに等しくなるようにセットする請求項2
    に記載の方法。
  6. 【請求項6】 複数のポリマー・サンプル中の第1のポリマーと第2のポリ
    マーの比率の複数の推定値を生成するステップ、および 複数の推定値をクラスタ化して、比率パターン形成するステップ をさらに含む請求項1に記載の方法。
  7. 【請求項7】 ポリマー・サンプル中の第1のポリマーと第2のポリマーの
    比率を推定するコンピュータ・プログラム製品であって、 第1のポリマーと相補関係にあるポリマー・プローブに対するポリマー・サン
    プルのハイブリダイゼーション親和性を指示する第1のハイブリダイゼーション
    値を受け取るコンピュータ・コード、 第2のポリマーと相補関係にあるポリマー・プローブに対するポリマー・サン
    プルのハイブリダイゼーション親和性を指示する第2のハイブリダイゼーション
    値を受け取るコンピュータ・コード、 第1のハイブリダイゼーション値を第1のハイブリダイゼーション値と第2の
    ハイブリダイゼーション値の和で除すことによって、ポリマー・サンプル中の第
    1のポリマーと第2のポリマーの比率の推定値を計算するコンピュータ・コード
    、および 前記コンピュータ・コードを記憶したコンピュータ可読媒体 を含むコンピュータ・プログラム製品。
  8. 【請求項8】 コンピュータ可読媒体が、フロッピー・ディスク、テープ、
    フラッシュ・メモリ、システム・メモリ、ハード・ドライブ、および搬送波中に
    具体化されたデータ信号から成るグループから選択される請求項7に記載のコン
    ピュータ・プログラム製品。
  9. 【請求項9】 核酸サンプル中の対立遺伝子の比率を推定する方法であって
    、 第1の対立遺伝子の一部分と相補関係にある核酸プローブに対する核酸サンプ
    ルのハイブリダイゼーション親和性を指示する第1のハイブリダイゼーション値
    を入力するステップ、 第2の対立遺伝子の一部分と相補関係にある核酸プローブに対する核酸サンプ
    ルのハイブリダイゼーション親和性を指示する第2のハイブリダイゼーション値
    を入力するステップ、および 第1のハイブリダイゼーション値を第1のハイブリダイゼーション値と第2の
    ハイブリダイゼーション値の和で除すことによって、核酸サンプル中の第1の対
    立遺伝子と第2の対立遺伝子の比率の推定値を計算するステップ を含む方法。
  10. 【請求項10】 第1の対立遺伝子と第2の対立遺伝子のどちらとも異なる
    少なくとも1種のヌクレオチドを含む核酸プローブに対する核酸サンプルのハイ
    ブリダイゼーション親和性を指示する第3のハイブリダイゼーション値を第1お
    よび第2のハイブリダイゼーション値から減ずるステップをさらに含む請求項9
    に記載の方法。
  11. 【請求項11】 第1の対立遺伝子と第2の対立遺伝子のどちらとも異なる
    少なくとも1種のヌクレオチドを含む核酸プローブに対する核酸サンプルのハイ
    ブリダイゼーション親和性をそれぞれ指示する複数のハイブリダイゼーション値
    の中から第3のハイブリダイゼーション値を選択するステップをさらに含む請求
    項10に記載の方法。
  12. 【請求項12】 第3のハイブリダイゼーション値を選択するステップが、
    核酸サンプルに対して最も低いハイブリダイゼーション親和性を指示するハイブ
    リダイゼーション値を選択するステップを含む請求項11に記載の方法。
  13. 【請求項13】 第1の対立遺伝子とは異なる少なくとも1種のヌクレオチ
    ドを含む核酸プローブに対する核酸サンプルのハイブリダイゼーション親和性を
    指示する複数のハイブリダイゼーション値の第1の中央値を計算するステップ、 第2の対立遺伝子とは異なる少なくとも1種のヌクレオチドを含む核酸プロー
    ブに対する核酸サンプルのハイブリダイゼーション親和性を指示する複数のハイ
    ブリダイゼーション値の第2の中央値を計算するステップ、および 核酸サンプルに対して最も高いハイブリダイゼーション親和性を指示する第1
    または第2の中央値と等しくなるように第3のハイブリダイゼーション値を選択
    するステップ、 をさらに含む請求項10に記載の方法。
  14. 【請求項14】 減算後の第1および第2のハイブリダイゼーション値がゼ
    ロよりも小さい場合に、これらの値をゼロに等しくなるようにセットする請求項
    10に記載の方法。
  15. 【請求項15】 複数の核酸サンプル中の第1の対立遺伝子と第2の対立遺
    伝子の比率の複数の推定値を生成するステップ、および 複数の推定値をクラスタ化して、比率パターン形成するステップ をさらに含む請求項9に記載の方法。
  16. 【請求項16】 核酸サンプル中の対立遺伝子の比率を推定するコンピュー
    タ・プログラム製品であって、 第1の対立遺伝子の一部分と相補関係にある核酸プローブに対する核酸サンプ
    ルのハイブリダイゼーション親和性を指示する第1のハイブリダイゼーション値
    を受け取るコンピュータ・コード、 第2の対立遺伝子の一部分と相補関係にある核酸プローブに対する核酸サンプ
    ルのハイブリダイゼーション親和性を指示する第2のハイブリダイゼーション値
    を受け取るコンピュータ・コード、 第1のハイブリダイゼーション値を第1のハイブリダイゼーション値と第2の
    ハイブリダイゼーション値の和で除すことによって、核酸サンプル中の第1の対
    立遺伝子と第2の対立遺伝子の比率の推定値を計算するコンピュータ・コード、
    および 前記コンピュータ・コードを記憶したコンピュータ可読媒体 を含むコンピュータ・プログラム製品。
  17. 【請求項17】 コンピュータ可読媒体が、フロッピー・ディスク、テープ
    、フラッシュ・メモリ、システム・メモリ、ハード・ドライブ、および搬送波中
    に具体化されたデータ信号から成るグループから選択される請求項16に記載の
    コンピュータ・プログラム製品。
  18. 【請求項18】 核酸サンプルの遺伝子型を決定する方法であって、 複数の核酸サンプル中の第1の対立遺伝子と第2の対立遺伝子の比率の複数の
    推定値を生成するステップ、 複数の推定値をクラスタ化して、比率パターン形成するステップ、 核酸サンプル中の第1の対立遺伝子と第2の対立遺伝子の比率の推定値を計算
    するステップ、および 核酸サンプル中の第1の対立遺伝子と第2の対立遺伝子の比率の推定値を比率
    パターンと比較することによって核酸サンプルの遺伝子型を決定するステップ を含む方法。
  19. 【請求項19】 比率の推定値を計算するステップが、 第1の対立遺伝子の一部分と相補関係にある核酸プローブに対する核酸サンプ
    ルのハイブリダイゼーション親和性を指示する第1のハイブリダイゼーション値
    を入力するステップ、 第2の対立遺伝子の一部分と相補関係にある核酸プローブに対する核酸サンプ
    ルのハイブリダイゼーション親和性を指示する第2のハイブリダイゼーション値
    を入力するステップ、および 第1のハイブリダイゼーション値を第1のハイブリダイゼーション値と第2の
    ハイブリダイゼーション値の和で除すことによって、核酸サンプル中の第1の対
    立遺伝子と第2の対立遺伝子の比率の推定値を計算するステップ を含む請求項18に記載の方法。
  20. 【請求項20】 核酸サンプルの遺伝子型を決定するステップが、核酸サン
    プル中の第1の対立遺伝子と第2の対立遺伝子の比率の推定値が比率パターン中
    の1つのクラスタの所定の範囲にあるかどうかを判定するステップを含む請求項
    18に記載の方法。
  21. 【請求項21】 比率パターンが、第1の対立遺伝子のホモ接合、第1の対
    立遺伝子と第2の対立遺伝子のヘテロ接合、および第2の対立遺伝子のホモ接合
    のクラスタを含む請求項18に記載の方法。
  22. 【請求項22】 比率パターン中のクラスタの数に基づいて、問合せ位置で
    の単一ヌクレオチド多型を識別するステップをさらに含む請求項18に記載の方
    法。
  23. 【請求項23】 比率パターン中のクラスタの数に基づいて、問合せ位置で
    の単一ヌクレオチド多型現象の存在を確認するステップをさらに含む請求項18
    に記載の方法。
  24. 【請求項24】 核酸サンプルの遺伝子型を決定するコンピュータ・プログ
    ラム製品であって、 複数の核酸サンプル中の第1の対立遺伝子と第2の対立遺伝子の比率の複数の
    推定値を生成するコンピュータ・コード、 複数の推定値をクラスタ化して、比率パターンを形成するコンピュータ・コー
    ド、 核酸サンプル中の第1の対立遺伝子と第2の対立遺伝子の比率の推定値を計算
    するコンピュータ・コード、 核酸サンプル中の第1の対立遺伝子と第2の対立遺伝子の比率の推定値を比率
    パターンと比較することによって核酸サンプルの遺伝子型を決定するコンピュー
    タ・コード、および 前記コンピュータ・コードを記憶したコンピュータ可読媒体 を含むコンピュータ・プログラム製品。
  25. 【請求項25】 コンピュータ可読媒体が、フロッピー・ディスク、テープ
    、フラッシュ・メモリ、システム・メモリ、ハード・ドライブ、および搬送波中
    に具体化されたデータ信号から成るグループから選択される請求項24に記載の
    コンピュータ・プログラム製品。
JP2000511907A 1997-09-05 1998-09-08 ポリマーの識別、確認、マッピングおよび分類手法 Pending JP2003532367A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US5795797P 1997-09-05 1997-09-05
US60/057,957 1997-09-05
US14881398A 1998-09-04 1998-09-04
US09/148,813 1998-09-04
US14821098A 1998-09-05 1998-09-05
US09/148,210 1998-09-05
PCT/US1998/018873 WO1999014369A1 (en) 1997-09-05 1998-09-08 Techniques for identifying, confirming, mapping and categorizing polymers

Publications (1)

Publication Number Publication Date
JP2003532367A true JP2003532367A (ja) 2003-11-05

Family

ID=27369361

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000511907A Pending JP2003532367A (ja) 1997-09-05 1998-09-08 ポリマーの識別、確認、マッピングおよび分類手法

Country Status (7)

Country Link
EP (1) EP1019538B1 (ja)
JP (1) JP2003532367A (ja)
AT (1) ATE291638T1 (ja)
AU (1) AU9476998A (ja)
CA (1) CA2302193A1 (ja)
DE (1) DE69829493T2 (ja)
WO (1) WO1999014369A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019500706A (ja) * 2015-10-18 2019-01-10 アフィメトリックス インコーポレイテッド 一塩基多型及びインデルの複対立遺伝子遺伝子型決定

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006007648A1 (en) * 2004-07-20 2006-01-26 Conexio 4 Pty Ltd Method and apparatus for analysing nucleic acid sequence

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5549805A (en) * 1984-03-29 1996-08-27 The Board Of Regents Of The University Of Nebraska Digital DNA typing
IS1355B6 (is) * 1984-11-12 1989-04-19 Lister Institute Of Preventive Medicine Fjölkjarna kannar
US6228575B1 (en) * 1996-02-08 2001-05-08 Affymetrix, Inc. Chip-based species identification and phenotypic characterization of microorganisms

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019500706A (ja) * 2015-10-18 2019-01-10 アフィメトリックス インコーポレイテッド 一塩基多型及びインデルの複対立遺伝子遺伝子型決定

Also Published As

Publication number Publication date
DE69829493D1 (de) 2005-04-28
ATE291638T1 (de) 2005-04-15
AU9476998A (en) 1999-04-05
EP1019538B1 (en) 2005-03-23
WO1999014369A1 (en) 1999-03-25
CA2302193A1 (en) 1999-03-25
EP1019538A1 (en) 2000-07-19
EP1019538A4 (en) 2002-08-21
DE69829493T2 (de) 2005-07-28

Similar Documents

Publication Publication Date Title
US8204695B2 (en) Techniques for identifying, confirming, mapping, and categorizing polymers
EP1019536B1 (en) Polymorphism detection utilizing clustering analysis
Chanock Candidate genes and single nucleotide polymorphisms (SNPs) in the study of human disease
Fareed et al. Single nucleotide polymorphism in genome-wide association of human population: a tool for broad spectrum service
US6291182B1 (en) Methods, software and apparati for identifying genomic regions harboring a gene associated with a detectable trait
CN105143466B (zh) 通过大规模平行rna测序分析母亲血浆转录组
US20070067111A1 (en) Computer-aided visualization of expression comparison
US20050282227A1 (en) Treatment discovery based on CGH analysis
WO2008079374A2 (en) Methods and compositions for selecting and using single nucleotide polymorphisms
CA3160566A1 (en) Systems and methods for predicting homologous recombination deficiency status of a specimen
WO2007115095A2 (en) Systems and methods for using molecular networks in genetic linkage analysis of complex traits
Ellsworth et al. The emerging importance of genetics in epidemiologic research II. Issues in study design and gene mapping
Zheng et al. Spatially resolved transcriptomics provide a new method for cancer research
US6699659B2 (en) Products and methods for analyzing nucleic acids including identification of substitutions, insertions and deletions
CN109524060A (zh) 一种遗传病风险提示的基因测序数据处理系统与处理方法
US20110160092A1 (en) Methods for Selecting a Collection of Single Nucleotide Polymorphisms
JP2003532367A (ja) ポリマーの識別、確認、マッピングおよび分類手法
US20040219567A1 (en) Methods for global pattern discovery of genetic association in mapping genetic traits
US20060259251A1 (en) Computer software products for associating gene expression with genetic variations
US20040259125A1 (en) Methods, systems and apparatus for identifying genetic differences in disease and drug response
Satagopan et al. Statistical methods in genomics research
Zehnbauer et al. Molecular Epidemiology: Beyond Gene Discovery to Clinical Diagnostic Tools
Uengwetwanit et al. An Analytical Process for Screening Susceptibility Genes of Type 2 Diabetes Mellitus Using Pooled DNA Microarray Data
Zehnbauer et al. Molecular Epidemiology: Beyond
Chanock Genomics and Chip Technology

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060228

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060529

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060605

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061107