JP2002357606A - 核酸のハイブリダイゼーション親和性を予測するための方法およびコンピューターソフトウエア製品 - Google Patents

核酸のハイブリダイゼーション親和性を予測するための方法およびコンピューターソフトウエア製品

Info

Publication number
JP2002357606A
JP2002357606A JP2001355292A JP2001355292A JP2002357606A JP 2002357606 A JP2002357606 A JP 2002357606A JP 2001355292 A JP2001355292 A JP 2001355292A JP 2001355292 A JP2001355292 A JP 2001355292A JP 2002357606 A JP2002357606 A JP 2002357606A
Authority
JP
Japan
Prior art keywords
probe
computer software
software product
hybridization
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001355292A
Other languages
English (en)
Inventor
Nathaniel Hunt
ハント ナサニエル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Affymetrix Inc
Original Assignee
Affymetrix Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Affymetrix Inc filed Critical Affymetrix Inc
Publication of JP2002357606A publication Critical patent/JP2002357606A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation

Abstract

(57)【要約】 【課題】 核酸ハイブリダイゼーション親和性を予測す
るための方法およびコンピューターソフトウエア製品を
提供することである。 【解決手段】 核酸ハイブリダイゼーション親和性を予
測するための方法およびコンピューターソフトウエア製
品を提供する。1つの実施形態において、ハイブリダイ
ゼーション強度(I)は、I=exp[Σiii]を
使用して決定される。ここでPiはi番目パラメーター
の値であり、Siはプローブの配列に由来する値であ
る。本発明の方法は、変異体検出、プローブ選択および
プローブアレイ製造品質調節を増強するために使用され
得る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、米国国立衛生研究
所から助成金番号 で政府の援助の下でなされた。
従って、米国政府は、本発明において一定の権利を有す
る。
【0002】本発明は、DNAマイクロアレイデータを
解析するための方法、およびDNAマイクロアレイを設
計するための方法に関する。
【0003】
【従来の技術】米国特許第5,424,186号は、特
に、オリゴヌクレオチド、RNA、ペプチド、多糖、お
よび他の物質のような分子の高密度アレイを形成し、そ
して使用するための草分けとなる技術を記載する。本特
許は、本明細書によって、あらゆる目的のために参考と
して援用される。
【0004】例えば、オリゴヌクレオチドまたはペプチ
ドのアレイは、表面から光除去可能な基を逐次的に除去
し、モノマーを表面の露出領域にカップリングし、そし
てこのプロセスを反復することにより、表面上に形成さ
れる。これらの技術は、オリゴヌクレオチド、ペプチ
ド、および他の物質の極度に密なアレイを形成するため
に使用されてきた。本発明と関連した合成技術は、「V
LSIPTM」または「非常に大規模な固定化ポリマー合
成(Very Large Scale Immobi
lized Polymer Synthesis)」
技術として知られるようになった。
【0005】このようなアレイを形成し、そして使用す
るためのさらなる技術は、米国特許第5,384,26
1号および同第6,040,193号(これらもまた、
あらゆる目的のために参考として援用される)に記載さ
れている。このような技術は、基材(またはチップ)の
部分を機械的に保護するためのシステム、および材料を
選択的に脱保護し/基材にカップリングするためのシス
テムを含む。アレイ合成のためのなおさらなる技術が、
米国特許出願第08/327,512号(これもまた、
本明細書中にあらゆる目的のために参考として援用され
る)において提供される。
【0006】核酸プローブアレイは、遺伝子発現モニタ
リング、遺伝子型分類、および変異検出における広範な
適用が見出された。例えば、核酸アレイ技術を用いる大
規模並行遺伝子発現モニタリング法が、多数の遺伝子の
発現をモニタリングするために開発された(例えば、米
国特許第5,871,928号、同第5,800,99
2号および同第6,040,138号;de Saiz
ieuら,1998,Bacteria Transc
ript Imaging by Hybridiza
tion of total RNA to Olig
onucleotide Arrays,NATURE
BIOTECHNOLOGY, 16:45−48;
Wodickaら,1997,Genome−wide
Expression Monitoring in
Saccharomycescerevisiae,
NATURE BIOTECHNOLOGY 15:1
359−1367;Lockhartら,1996,E
xpression Monitoring by H
ybridization to High Dens
ity Oligonucleotide Array
s.NATUREBIOTECHNOLOGY 14:
1675−1680;Lander,1999, Ar
ray of Hope, NATURE−GENET
ICS, 21(補遺),at 3,(これら全ては、
本明細書中にあらゆる目的のために参考として援用され
る))。高密度オリゴヌクレオチドアレイ(DNAチッ
プ)を用いる高スループット変異解析のためのハイブリ
ダイゼーションに基づく方法が開発された(Hacia
ら,1996,Detection of heter
ozygous mutations in BRCA
1 usinghigh density oligo
nucleotide arraysand two−
color fluorescence analys
is.Nat.Genet.14:441−447,H
aciaら,New approaches to B
RCA1 mutation detection,B
reast Disease 10:45−59 an
d Ramsey1998,DNA chips:St
ate−of−Art,Nat Biotechno
l.16:40−44を参照のこと、これら全ては、本
明細書中にあらゆる目的のために参考として援用され
る)。オリゴヌクレオチドアレイは、例えば、CFTR
遺伝子(米国特許第6,027,880号、Croni
nら,1996,Cystic fibrosis m
utation detection by hybr
idization to light−genera
ted DNA probe arrays.Hum.
Mut.7:244−255(両方とも、参考として援
用される))、ヒト免疫不全ウイルス(HIV−1)逆
転写酵素およびプロテアーゼ遺伝子(米国特許第5,8
62,242号、およびKozalら,1996,Ex
tensive polymorphisms obs
erved in HIV−1 clade B pr
oteasegene using high den
sity oligonucleotide arra
ys.Nature Med.1:735−759(両
方とも、本明細書中にあらゆる目的のために参考として
援用される))、ミトコンドリアゲノム(Cheeら、
1996,Accessing genetic in
formation with high densi
ty DNA arrays.Science 27
4:610−614)およびBRCA1遺伝子(米国特
許第6,013,449号(これは、本明細書中にあら
ゆる目的のために参考として援用される)における配列
のバリエーションをスクリーニングするために使用され
てきた。
【0007】
【発明が解決しようとする課題】本発明は、DNAマイ
クロアレイデータを解析するための方法、およびDNA
マイクロアレイを設計するための方法に関する。
【0008】
【課題を解決するための手段】本発明は、遺伝子発現を
モニタリングするプローブを選択するためのコンピュー
ターで実行される方法に関し、方法は、a)複数の候補
プローブおよびそれらの対応するコントロールプローブ
のハイブリダイゼーション強度を予測する工程;および
b)その対応するコントロールプローブに対して最も高
い強度差を有する候補プローブを選択する工程、を包含
する。
【0009】好適な実施形態においては、上記ハイブリ
ダイゼーション強度(I)が、以下の式:
【0010】
【数5】 を使用して決定される方法であって、ここでPiが、i
番目のパラメーターの値であり、そしてSiが、そのプ
ローブの配列に由来する値である。
【0011】好適な実施形態においては、上記Piが、
A、C、GおよびTからなる群より選択される参照塩基
に比較しての、上記配列の所定の位置における塩基の自
由エネルギーである。
【0012】好適な実施形態においては、上記Siが上
記配列の汎関数である。
【0013】好適な実施形態においては、上記Piが経
験的に決定される。
【0014】好適な実施形態においては、上記Piが、
トレーニングデータセットを使用する最小二乗フィット
によって決定される。
【0015】好適な実施形態においては、Piが、Ch
olesky分解を使用して決定される。
【0016】好適な実施形態においては、所定のヌクレ
オチド型についての上記Siが、プローブ塩基数の平滑
化関数で置換される。
【0017】好適な実施形態においては、上記平滑化関
数が多項関数である。
【0018】好適な実施形態においては、所定のヌクレ
オチド型についての上記Siが、中心位置に対する塩基
の差の平滑化関数で置換される。
【0019】好適な実施形態においては、上記平滑化関
数が多項関数である。
【0020】好適な実施形態においては、上記式が、プ
ローブ−プローブハイブリダイゼーションを記述する少
なくとも1つのパラメーターを含む。
【0021】好適な実施形態においては、上記式が、ヘ
アピン形成を記述する少なくとも1つのパラメーターを
含む。
【0022】好適な実施形態においては、上記式が、最
隣接相互作用を記述するパラメーターを含む。
【0023】好適な実施形態においては、上記Piが特
異値分解を使用して決定される。
【0024】本発明はまた、その標的に対するプローブ
のハイブリダイゼーション親和性を予測するためのコン
ピューターで実行される方法に関し、方法は、以下の
式:
【0025】
【数6】 を使用してハイブリダイゼーション強度(I)を計算す
る工程を包含し、ここで、Piがi番目のパラメーター
の値であり、そしてSiがそのプローブの配列に由来す
る値である。
【0026】好適な実施形態においては、上記Piが、
A、C、GおよびTからなる群より選択される参照塩基
に比較しての、上記配列の所定の位置における塩基の自
由エネルギーである。
【0027】好適な実施形態においては、上記Siが上
記配列の汎関数である。
【0028】好適な実施形態においては、上記Piが経
験的に決定される。
【0029】好適な実施形態においては、上記Piが、
トレーニングデータセットを使用する最小二乗フィット
によって決定される。
【0030】好適な実施形態においては、Piが、Ch
olesky分解を使用して決定される。
【0031】好適な実施形態においては、所定のヌクレ
オチド型についての上記Siが、プローブ塩基数の平滑
化関数で置換される。
【0032】好適な実施形態においては、上記平滑化関
数が多項関数である。
【0033】好適な実施形態においては、所定のヌクレ
オチド型についての上記Siが、中心位置に対する塩基
の差の平滑化関数で置換される。
【0034】好適な実施形態においては、上記平滑化関
数が多項関数である。
【0035】好適な実施形態においては、上記式が、プ
ローブ−プローブハイブリダイゼーションを記述する少
なくとも1つのパラメーターを含む。
【0036】好適な実施形態においては、上記式が、ヘ
アピン形成を記述する少なくとも1つのパラメーターを
含む。
【0037】好適な実施形態においては、上記式が、最
隣接相互作用を記述するパラメーターを含む。
【0038】好適な実施形態においては、上記Piが特
異値分解を使用して決定される。
【0039】好適な実施形態においては、上記プローブ
が固相基材上に固定化される。
【0040】本発明はまた、その標的に対するプローブ
のハイブリダイゼーション親和性を予測するためのコン
ピューターソフトウエア製品に関し、製品は、以下の
式:
【0041】
【数7】 を使用してハイブリダイゼーション強度(I)を計算す
るためのコンピュータープログラムコード、ここでPi
がi番目のパラメーターの値であり、そしてSiがその
プローブの配列に由来する値であり;およびコンピュー
タープログラムコードを格納するコンピューターで読み
取り可能な媒体、を備えるコンピューターソフトウエア
製品に関する。
【0042】好適な実施形態においては、上記Piが、
A、C、GおよびTからなる群より選択される参照塩基
に比較しての、上記配列の所定の位置における塩基の自
由エネルギーである。
【0043】好適な実施形態においては、上記Siが上
記配列の汎関数である。
【0044】好適な実施形態においては、上記Piが経
験的に決定される。
【0045】好適な実施形態においては、上記Piが、
トレーニングデータセットを使用する最小二乗フィット
によって決定される。
【0046】好適な実施形態においては、Piが、Ch
olesky分解を使用して決定される。
【0047】好適な実施形態においては、所定のヌクレ
オチド型についての上記Siが、プローブ塩基数の平滑
化関数で置換される。
【0048】好適な実施形態においては、上記平滑化関
数が多項関数である。
【0049】好適な実施形態においては、所定のヌクレ
オチド型についての上記Siが、中心位置に対する塩基
の差の平滑化関数で置換される。
【0050】好適な実施形態においては、上記平滑化関
数が多項関数である。
【0051】好適な実施形態においては、上記式が、プ
ローブ−プローブハイブリダイゼーションを記述する少
なくとも1つのパラメーターを含む。
【0052】好適な実施形態においては、上記式が、ヘ
アピン形成を記述する少なくとも1つのパラメーターを
含む。
【0053】好適な実施形態においては、上記式が、最
隣接相互作用を記述するパラメーターを含む。
【0054】好適な実施形態においては、上記Piが特
異値分解を使用して決定される。
【0055】本発明はまた、遺伝子発現をモニタリング
するプローブを選択するためのコンピューターソフトウ
エア製品に関し、製品は、複数の候補プローブおよびそ
れらの対応するコントロールプローブのハイブリダイゼ
ーション強度を予測するためのコンピュータープログラ
ムコード;対応するコントロールプローブに対して最も
強い強度差を有する候補プローブを選択するためのコン
ピュータープログラムコード;およびコードを格納する
ためのコンピューターで読み取り可能な媒体、を備える
コンピューターソフトウエア製品に関する。
【0056】好適な実施形態においては、コンピュータ
ーソフトウエア製品に関し、ここでハイブリダイゼーシ
ョン強度(I)を予測するための上記コンピューターコ
ードが、以下の式:
【0057】
【数8】 を使用して計算するためのコードを備え、ここで、Pi
がi番目のパラメーターの値であり、そしてSiがその
プローブの配列に由来する値である、コンピューターソ
フトウエア製品に関する。
【0058】好適な実施形態においては、上記Piが、
A、C、GおよびTからなる群より選択される参照塩基
に比較しての、上記配列の所定の位置における塩基の自
由エネルギーである。
【0059】好適な実施形態においては、上記Siが上
記配列の汎関数である。
【0060】好適な実施形態においては、上記Piが経
験的に決定される。
【0061】好適な実施形態においては、上記Piが、
トレーニングデータセットを使用する最小二乗フィット
によって決定される。
【0062】好適な実施形態においては、Piが、Ch
olesky分解を使用して決定される。
【0063】好適な実施形態においては、所定のヌクレ
オチド型についての上記Siが、プローブ塩基数の平滑
化関数で置換される。
【0064】好適な実施形態においては、上記平滑化関
数が多項関数である。
【0065】好適な実施形態においては、所定のヌクレ
オチド型についての上記Siが、中心位置に対する塩基
の差の平滑化関数で置換される。
【0066】好適な実施形態においては、上記平滑化関
数が多項関数である。
【0067】好適な実施形態においては、上記式が、プ
ローブ−プローブハイブリダイゼーションを記述する少
なくとも1つのパラメーターを含む。
【0068】好適な実施形態においては、上記式が、ヘ
アピン形成を記述する少なくとも1つのパラメーターを
含む。
【0069】好適な実施形態においては、上記式が、最
隣接相互作用を記述するパラメーターを含む。
【0070】好適な実施形態においては、上記Piが特
異値分解を使用して決定される。
【0071】
【発明の実施の形態】(発明の要旨)本発明は、その標
的に対する核酸プローブのハイブリダイゼーション親和
性を推定するための方法およびソフトウェア製品を提供
する。好ましい実施形態では、プローブは、固体基材上
に固定化される。最も好ましい実施形態では、プローブ
は、核酸プローブアレイの一部であり、例えば、ガラス
基材上、光ファイバーまたはビーズ上の合成オリゴヌク
レオチドである。本方法およびソフトウェアは、変異検
出を増強すること、プローブアレイのためのプローブを
選択すること、およびプローブアレイ製造プロセスの品
質管理を増強することにおいて広い適用を有する。
【0072】本発明の1つの局面では、その標的に対し
てプローブのハイブリダイゼーション親和性を予測する
ためのコンピューター実行方法が提供される。この方法
は、ハイブリダイゼーション強度(I)を以下の式を用
いて計算する工程:
【0073】
【数9】 (ここで、Piは、i番目のパラメーターの値であり、
そしてSiは、プローブの配列に由来する値である)を
含む。いくつかの実施形態では、Piは、A、C、G、
およびTからなる群から選択される参照塩基に比較し
た、配列の所定の位置における塩基の自由エネルギーで
ある。Siは、上記配列の汎関数(functiona
l)であり得る。Piは、経験的に、例えば、トレーニ
ングデータセットの最小二乗フィットを用いて、決定さ
れ得る。Pi値は、Cholesky分解を用いて決定
され得る。いくつかの実施形態では、所定のヌクレオチ
ド型についてのSiは、プローブ塩基数の平滑化関数で
置換される。この平滑化関数は、多項関数であり得る。
いくつかの他の実施形態では、所定のヌクレオチド型に
ついてのSiは、中心位置に対する塩基の差の平滑化関
数で置換される。いくつかのさらなる実施形態では、こ
の式は、プローブ−プローブハイブリダイゼーションを
記述する少なくとも1つのパラメーターおよび/または
ヘアピン形成を記述する少なくとも1つのパラメーター
を含む。いくつかの他の好ましい実施形態では、式は、
最隣接相互作用を記述するパラメーターを含む。このよ
うな実施形態では、Pi値は、特異値分解を用いて決定
され得る。
【0074】本発明の別の局面では、遺伝子発現モニタ
リングについてのプローブを選択するためのコンピュー
ター実行方法が提供される。この方法は、複数の候補プ
ローブおよびそれらの対応するコントロールプローブの
ハイブリダイゼーション強度を予測する工程;ならびに
その対応するコントロールプローブを超える最も高い強
度差を有する候補プローブを選択する工程を含む。ある
いは、この強度差は、直接的に予測され得る。
【0075】ハイブリダイゼーション強度(I)は、以
下の式を用いて決定される:
【0076】
【数10】 ここでPiはi番目のパラメーターの値であり、Si
は、プローブの配列に由来する値である。Piは、A、
C、G、およびTからなる群より選択される参照塩基と
比較した、上記配列の所定の位置の塩基の自由エネルギ
ーである。Siは、プローブの配列の汎関数である。P
iは、経験的に、例えば、トレーニングデータセットの
最小二乗フィットを用いて決定される。Pi値は、Ch
olesky分解を用いて決定され得る。いくつかの実
施形態において、所定のヌクレオチド型についてのSi
は、プローブ塩基数の平滑化関数で置換される。典型的
な平滑化関数には、多項関数が含まれる。いくつかの他
の実施形態において、所定のヌクレオチド型についての
Siは、中心位置に対する塩基の差の平滑化関数で置換
される。いくつかのさらなる実施形態において、この式
は、プローブ−プローブハイブリダイゼーションを記述
する少なくとも1つのパラメーター、ヘアピン形成を記
述する少なくとも1つのパラメーター、および/または
最隣接相互作用を記述するパラメーターを含む。この式
が最隣接相互作用を記述するパラメーターを含む場合、
Pi値は、特異値分解を使用して決定され得る。
【0077】本発明の別の局面において、その標的に対
するプローブのハイブリダイゼーション親和性を予測す
るためのコンピュータソフトウェア製品が提供される。
そのソフトウェアは、種々の適切なコンピュータプログ
ラミング言語(例えば、C、C++、Fortran、
Basic、およびJava(登録商標))のいずれか
で書かれ得る。ソフトウェアコンポーネント(例えば、
Java(登録商標)Beans、enterpris
e Java(登録商標) Beansなど)は、本発
明のソフトウェア製品のアーキテクチャの一部として使
用され得る。
【0078】そのソフトウェア製品は、以下の式:
【0079】
【数11】 を用いて、ハイブリダイゼーション強度(I)を計算す
るためのコンピュータプログラムコードを含み、ここで
Piはi番目のパラメーターの値であり、Siはプロー
ブの配列およびコンピュータプログラムコードを格納す
るためのコンピュータ読みとり可能な媒体に由来する値
である。当業者は、計算の結果を示すコードもまた含ま
れ得ることを理解する。Piは、A、C、G、およびT
からなる群より選択される参照塩基と比較した、上記配
列の所定の位置の塩基の自由エネルギーである。Siは
配列の汎関数である。Piは、経験的に、例えば、トレ
ーニングデータセットを用いる最小二乗フィットによっ
て、Cholesky分解を用いて決定される。いくつ
かの実施形態において、所定のヌクレオチド型について
のSiは、プローブ塩基数の平滑化関数(例えば、多項
関数)で置換される。いくつかの他の実施形態におい
て、所定のヌクレオチド型についてのSiは、中心位置
に対する塩基の差の平滑化関数で置換される。いくつか
の実施形態において、この式は、プローブ−プローブハ
イブリダイゼーションを記述する少なくとも1つのパラ
メーター、ヘアピン形成を記述する少なくとも1つのパ
ラメーター、および/または最隣接相互作用を記述する
パラメーターを含む。この式が最隣接相互作用を記述す
るパラメーターを含む場合、Pi値は、特異値分解を使
用して決定される。
【0080】本発明のなお別の局面において、遺伝子発
現モニタリングのためにプローブを選択するためのコン
ピュータソフトウェア製品が提供される。このソフトウ
ェア製品は、複数の候補プローブおよびそれらの対応す
るコントロールプローブのハイブリダイゼーション強度
を予測するためのコンピュータプログラムコード;対応
するコントロールプローブを超えて最も高い強度差を有
する候補プローブを選択するためのコンピュータプログ
ラムコード;およびそのコードを格納するためのコンピ
ュータ読みとり可能な媒体を含む。ハイブリダイゼーシ
ョン強度(I)を予測するためのコンピュータコード
は、以下の式:
【0081】
【数12】 を用いて計算するためのコードを含み、ここでPiはi
番目のパラメーターの値であり、Siは上記プローブの
配列に由来する値である。いくつかの実施形態におい
て、Piは、A、C、G、およびTからなる群より選択
される参照塩基と比較した、上記配列の所定の位置の塩
基の自由エネルギーである。Siは、プローブの配列の
汎関数である。Pi値は、経験的に、例えば、Chol
esky分解を用いるトレーニングデータセットの最小
二乗フィットによって決定される。所定のヌクレオチド
型についてのSiは、プローブ塩基数の平滑化関数で置
換される。その平滑化関数は、多項関数であり得る。他
の実施形態において、所定のヌクレオチド型についての
Siは、中心位置に対する塩基の差の平滑化関数で置換
される。いくつかの実施形態において、この式は、プロ
ーブ−プローブハイブリダイゼーションを記述する少な
くとも1つのパラメーター、ヘアピン形成を記述する少
なくとも1つのパラメーター、および/または最隣接相
互作用を記述するパラメーターを含み得る。この式が最
隣接相互作用を記述するパラメーターを含む場合、Pi
値は、特異値分解を使用して決定され得る。
【0082】(好適な実施形態の詳細な説明)ここで、
本発明の好適な実施形態を詳細に述べる。本発明は、好
適な実施形態に関連して記載されるが、そのことが本発
明をこれらの実施形態に限定することを意図するもので
はないことが理解される。逆に、本発明は、本発明の精
神および範囲に包含され得る、代替物、変更物、および
均等物を網羅することが意図される。
【0083】当業者に理解されるように、本発明は、方
法、データ処理システム、またはプログラム製品として
具現化され得る。したがって、本発明は、データ解析シ
ステム、方法、解析ソフトウエア、などの形態を採り得
る。本発明に従って記述されたソフトウエアは、ある種
の形態のコンピュータで読み取り可能な媒体(例えば、
メモリまたはCD ROM)に格納されるか、またはネ
ットワーク上で伝送され、そしてプロセッサにより実行
されべきである。
【0084】コンピュータソフトウエア製品は、種々の
適切なプログラミング言語(例えば、C、C++、Fo
rtran、およびJava(登録商標))のうちの任
意のもので記述され得る。コンピュータソフトウエア製
品はデータ入力およびデータディスプレイモジュールを
有する独立のアプリケーションであり得る。あるいは、
コンピュータソフトウエア製品は、配布されたオブジェ
クトとしてインスタンス化され得るクラスであり得る。
コンピュータソフトウエア製品はまた、コンポーネント
ソフトウエア(例えば、Java(登録商標) Bea
ns、Enterprise Java(登録商標)
Beans(EJB)、Microsoft(登録商
標)COM/DCOMなど)であり得る。
【0085】図1は、本発明の実施形態のソフトウエア
を実行するために使用され得るコンピュータシステムの
例を示す。図1は、ディスプレイ3、スクリーン5、キ
ャビネット7、キーボード9、およびマウス11を備え
るコンピュータシステム1を示す。マウス11は、グラ
フィカルユーザーインターフェイスでインターラクトす
るため1またはそれ以上のボタンを有し得る。キャビネ
ット7は、本発明を実施するコンピュータコード組み込
みソフトウエアプログラム、本発明と共に使用するため
のデータなどを格納および取り出すために利用され得
る、CD−ROMまたはDVD−ROMドライブ13、
システムメモリおよびハードドライブ(図2を参照)を
収納する。CD15は例示的なコンピュータ読み取り可
能媒体として示されるが、他のコンピュータ読み取り可
能記録媒体(フロッピー(登録商標)ディスク、テー
プ、フラッシュメモリ、システムメモリ、およびハード
ドライブを含む)が利用され得る。さらに、(例えば、
インターネットを含むネットワークにおいて)搬送波中
に具現化されるデータ信号が、コンピュータ読み取り可
能記録媒体であり得る。
【0086】図2は、本発明の実施形態のソフトウエア
を実行するために使用されるコンピュータシステム1の
システムブロック線図を示す。図1のように、コンピュ
ータシステム1は、モニタ3、キーボード9、およびマ
ウス11を備える。コンピュータシステム1はさらにサ
ブシステム(例えば、中央処理装置51、システムメモ
リ53、固定記憶装置55(例えば、ハードドライ
ブ)、取り外し可能記憶装置57(例えば、CD−RO
M)、ディスプレイアダプタ59、サウンドカード6
1、スピーカ63、およびネットワークインターフェー
ス65)を備える。本発明と共に使用するに適切な他の
コンピュータシステムは、追加のサブシステムを備えて
もよいし、より少ないサブシステムを備えていてもよ
い。例えば、別のコンピュータシステムは、1より多い
プロセッサ51を備えてもよいし、キャッシュメモリを
備えていてもよい。本発明と共に使用するに適切なコン
ピュータシステムはまた、測定器具に組み込まれ得る。
【0087】(I.用語解説)「核酸」は、本発明に従
えば、ヌクレオシドまたはヌクレオチド(ピリミジン塩
基およびプリン塩基、好ましくはそれぞれ、シトシン、
チミン、およびウラシル、ならびに、アデニンおよびグ
アニンを含む)の任意のポリマーもしくはオリゴマーを
含み得る。Albert L.Lehninger,P
RINCIPLES OF BIOCHEMISTR
Y、793−800頁(Worth Pub.198
2)を参照。確かに、本発明は、任意のデオキシリボヌ
クレオチド、リボヌクレオチドまたはペプチド核酸成
分、およびそれらの任意の化学的改変体(例えば、メチ
ル化、ヒドロキシメチル化またはグルコシル化形態のこ
れらの塩基)などを企図する。ポリマーまたはオリゴマ
ーは、組成において不均質であり得るし、均質でもあり
得、そして天然に存在する供給源から単離され得るか、
または人工的もしくは化学的に製造され得る。米国特許
出願第08/630,427号(あらゆる目的のために
その全体が参考として本明細書中で援用される)を参
照。さらに、核酸は、DNAもしくはRNA、またはそ
れらの混合物であり得、そして一本鎖もしくは二本鎖の
形態(ホモ二重鎖、ヘテロ二重鎖、およびハイブリッド
状態を含む)で永続的もしくは一過性に存在し得る。オ
リゴヌクレオチドおよびポリヌクレオチドはこの定義に
含まれ、そしてポリヌクレオチド中の2以上の核酸を指
す。
【0088】「プローブ」は、本明細書中で使用される
場合、1以上の型の化学結合により、通常は相補的塩基
対形成により、通常は水素結合形成により、相補的配列
の標的核酸に結合し得る核酸(例えば、オリゴヌクレオ
チド)として定義される。本明細書中で使用される場
合、プローブは天然塩基(すなわち、A、G、U、C、
またはT)または改変塩基(7−デアザグアノシン、イ
ノシンなど)を含み得る。さらに、プローブ中の塩基
は、それがハイブリダイゼーションを妨げない限り、ホ
スホジエステル結合以外の連結により結合され得る。し
たがって、プローブは、構成塩基がホスホジエステル連
結よりむしろペプチド結合により結合されているペプチ
ド核酸であり得る。
【0089】「標的核酸」は、これに対し特異的にハイ
ブリダイズするようプローブが設計された核酸(しばし
ば生物学的サンプルに由来する)をいう。検出されるべ
きは標的核酸の存在または不在であるか、または定量さ
れるべきは標的核酸の量である。標的核酸は、その標的
に指向させた対応するプローブの核酸配列に相補的であ
る配列を有する。用語標的核酸は、プローブを指向させ
た、より長い核酸の特異的な部分配列をいってもよい
し、またはその発現レベルを検出することが所望される
全体配列(例えば、遺伝子またはmRNA)をいっても
よい。用法の差は文脈から明らかになる。
【0090】「アレイ」は、固体支持体に付着したペプ
チドまたは核酸プローブを有するその固体支持体を含み
得る。アレイは、代表的には、基材の表面に異なる既知
の位置に結合した、複数の異なる核酸またはペプチドプ
ローブを含む。これらのアレイ(「マイクロアレイ」ま
たは口語表現では「チップ」とも記述される)は、当該
分野において、例えば、米国特許第5,143,854
号、同第5,445,934号、同第5,744,30
5号、同第5,677,195号、同第6,040,1
93号、同第5,424,186号、およびFodor
ら、Science,251:767−777(199
1)に一般的に記載されている。これらのそれぞれがあ
らゆる目的のためにその全体が参考として援用される。
これらのアレイは、一般に、機械的合成法、または写真
平板法と固相合成法との組合せを組み入れる光指向合成
法を使用して作製され得る。機械的合成法を使用するこ
れらアレイの合成技術は、例えば、米国特許第5,38
4,261号および同第6,040,193号(これら
はあらゆる目的のためにその全体が本明細書中で参考と
して援用される)に記載されている。平面アレイ表面が
好ましいが、アレイは、実質的に任意の形状の表面上
に、あるいは複数の表面上にさえ組み立てられ得る。ア
レイは、ビーズ、ゲル、ポリマー性表面、ファイバー
(例えば、光ファイバー)、ガラス、または任意の他の
適切な基材(米国特許第5,770,358号、同第
5,789,162号、同第5,708,153号、同
第6,040,193号および同第5,800,992
号(あらゆる目的のためにその全体が本明細書によって
参考として援用される)を参照)上のペプチドまたは核
酸であり得る。アレイは、全てを含んだデバイス(例え
ば、米国特許第5,856,174号および同第5,9
92,591号および同第5,945,334号(あら
ゆる目的のためにその全体が本明細書中で参考として援
用される)を参照)における診断またはその他の操作を
可能にする様式でパッケージされ得る。アレイ、その製
造、およびその特徴に関するさらなる情報については、
米国特許出願第09/545,207号(あらゆる目的
のためにその全体が本明細書中で参考として援用され
る)もまた参照。これはあらゆる目的のためにその全体
が本明細書中で参考として援用される。
【0091】(II.モデルおよびコンピュータによる
方法)本発明は、部分的に、核酸ハイブリダイゼーショ
ンの配列依存性のモデルに基づく。本発明の1つの局面
は、核酸プローブ間のハイブリダイゼーション親和性を
予測するための方法、システムおよびソフトウェア製品
を提供する。この方法、システムおよびソフトウェア製
品は、ヘテロ接合性変異の検出のためにフットプリント
のシグナル損失を増強するため、および遺伝子発現チッ
プの設計のためにプローブ強度を予測するために、特に
有用である。この研究はまた、他の強度標準化アプリケ
ーション、チップ製造の品質管理、およびチップ上のハ
イブリダイゼーションの熱力学の基礎的理解における広
範な適用を見出す。
【0092】ハイブリダイゼーションの傾向が、プロー
ブ配列に由来するエネルギーパラメーターによって記載
され得、そしてハイブリダイゼーションのバリエーショ
ンおよびチップ製造条件が、検出され得、そして補正さ
れ得る、これらのパラメーターにおける変化を生じる。
【0093】本発明の1つの局面において、核酸ハイブ
リダイゼーションの親和性を予測するかまたはフィット
するための、エネルギーパラメーターを使用するモデル
を開発する。核酸ハイブリダイゼーションは、プローブ
および標的核酸を含み得る。プローブとは、一般に、標
的核酸を定性的または定量的に決定するために使用され
る核酸をいう。標的核酸は、目的の核酸である。標的分
子は、都合の良い自由エネルギーΔG(配列の関数であ
る)で、プローブとハイブリダイズする。プローブ分子
と標的分子との間のハイブリダイゼーション親和性は、
特定の測定値を反映し得る。例えば、プローブが固体基
材上に固定される場合、標的がマーカーで標識され得、
そして固定化基材と接触させられ得、そしてハイブリダ
イゼーションが起こり得る。ハイブリダイゼーション親
和性は、基材を洗浄した後に残存するマーカーの相対的
レベルを決定することによって測定され得る。好ましい
実施形態において、標的分子が、蛍光マーカーを用いて
標識される。蛍光強度を決定することによって、洗浄後
に残存する蛍光マーカーの量、従って、ハイブリダイゼ
ーション親和性が、決定され得る。なぜなら、この残存
する強度は、ハイブリダイゼーション親和性と比例する
からである。
【0094】ハイブリダイゼーション親和性は、ボルツ
マンの式exp(ΔG/RT)で与えられ得、ここでT
は、絶対温度であり、そしてRは気体定数である。従っ
て、強度の対数Iは、ΔGに線形で相関する: log(I)=c+ΔG (式1) ここで、cは、定数であり、標的の濃度の対数と比例
し、そしてRTの単位に変換され得る(本明細書を通じ
て、「対数」とは、底eを有する自然対数をいう)。
【0095】プローブ配列に対するΔGの依存性は、非
常に複雑であり得るが、ΔGについての比較的単純なモ
デルが、良好な結果を生じている。一般に、ΔGは、以
下の形式のプローブ配列の関数である: ΔG(seq)=ΣiiI(式2) ここで、和を、1からパラメーターの数まで行う;以下
に説明するように、Piは、i番目のパラメーターの値
であり、そしてSIは、プローブ配列に由来する値に対
応する。多次元空間中の点に対して、スカラー量の値を
割り当てる関数を、空間の汎関数と呼ぶ。SIの関数
は、プローブ配列の汎関数である。
【0096】例えば、Sの値を与えることによって、5
マーのプローブについて使用し得る。パラメーターを各
プローブ配列位置およびヌクレオチドのタイプに割り当
てる場合、GACTA配列を有するプローブについて、
以下のSの値について試み得る:
【0097】
【表1】 このモデルおよびデータは、相対的な自由エネルギーの
推定を可能にする。数学的には、上記のSについての選
択は、配列を過剰に特定し、そして特異的な方程式を生
じる。各プローブ位置は、4つのヌクレオチドのタイプ
の1つを有するので、プローブの1つの位置について3
つの自由度のみが存在する。この問題に関して、多くの
可能な方法が存在する。いくつかの実施形態において、
この問題は、1つのヌクレオチドのタイプを参照として
選択して、より少ないパラメーターを使用することによ
って解決される。塩基Tを参照として選択する場合、S
値は、以下の通りである:
【0098】
【表2】 この説明において、Piは、所定の位置における、同一
の位置でのTと比較した塩基の自由エネルギーである。
【0099】ΔG(seq)について選択された解析表
を用いて(すなわち、選択した関数Siのセットを用い
て)、チップから1セットのデータにおける観察された
強度にベストフィットを与えるパラメーターの値を決定
し得る。フィット強度Ifitは、以下の式
【0100】
【化1】 のIfitである。
【0101】ここで、合計が全体にわたる場合、パラメ
ーターPiおよびSiは、プローブ配列に対応する関数で
ある。このPiは、以下の式
【0102】
【化2】 を最小にするように選択される。
【0103】ここで、Imdsは測定強度、Piは決定され
るパラメーターであり、そしてSiは、各プローブ配列
から得られる。これは、測定強度の対数に対する最小二
乗フィットである。上記のようにIfitを選択すること
により、線形最小二乗法がパラメーターを推定するため
に使用され得る。
【0104】Piを決定するための最小二乗フィット
は、Cholesky分解(例えば、Gene H.G
olub and Charles F.van Lo
an:Matrix Computations 第2
版、The John Hoplins Univer
sity Press,1989(全ての目的のため
に、本明細書中で援用される)を参照のこと)を使用す
る正規方程式の直接解により、典型的なチップからの数
万のデータポイントに関して計算的に扱いやすい。いく
つかの数値的な方法のテキストが正規方程式の直接解に
対して警告するが、本発明者は、パラメーターが適切に
見積もられた場合に、単精度であったとしてもこれらが
模範的であることを見出した。好ましい実施形態では、
倍精度が使用され、そして数値的な問題は観測されなか
った。
【0105】いくつかの実施形態において、ハイブリダ
イゼーション親和性の測定値であるハイブリダイゼーシ
ョン強度は、以下の式:
【0106】
【数13】 を使用して推定される。このPi値は、例えば、トレー
ニングデータセットを使用して得られる。一旦Pi値が
得られると、プローブのハイブリダイゼーション強度
は、式1を使用して計算される。当業者は、Pi値がハ
イブリダイゼーション条件(例えば、ハイブリダイゼー
ションおよび引き続く洗浄温度、イオン強度など)に依
存し得ることを理解する。従って、所定のPi値は、所
定のハイブリダイゼーション条件にのみ適用可能であり
得る。
【0107】(II.モデルの改良)当業者は、上記で
概要を述べたハイブリダイゼーションモデルについての
多くの可能性のある改変が存在することを理解する。第
1は、データを記載するのに必要とされるパラメーター
数を減少するための多項式フィットの使用である。第2
は、標的分子に対するヘアピン形成を記載するパラメー
ターの追加である。第3の改良は、ハイブリダイゼーシ
ョンの記載を改良するための「最隣接(nearest
neighbor)」パラメーターの使用である。
【0108】(A.パラメーターの数の減少)特定の適
用およびデータのサイズに依存して、このフィットにお
けるパラメーターの数を減少することが所望され得る。
パラメーターを減少する1つの方法は、パラメーターの
セットをプローブ塩基数の平滑化関数を用いて、所定の
ヌクレオチド型に置き換えることである。5マーの例お
よび配列GACTAを有するプローブに戻るために、二
次式にフィットするように選択し得る。各ヌクレオチド
型についてのエネルギー性パラメーターは、塩基数の二
次関数になるように採用される。Sの値は以下である:
【0109】
【表3】 この提示は、5マーのプローブについてのパラメーター
の数を16から10に減少する。
【0110】数値的な理由から、1つの好ましい実行
は、上で与えられた実行とはわずかに異なる。このフィ
ットは、プローブの位置に対してではなく、中央位置か
らの差に対してなされ、そして単純な冪級数ではなく、
ルジャンドルの多項式が使用される。
【0111】25マーのプローブについて、いくつかの
好ましい実施形態では、4次のルジャンドルの多項式が
使用され、多項式フィットを用いない場合の76とは対
照的に、合計16のパラメーターを生じた。
【0112】(B.プローブ−プローブハイブリダイゼ
ーションおよびヘアピン情報)データが上記規定にフィ
ットする場合、フィットされかつ測定された強度が一致
しない顕著な領域が存在する。これらの領域の多くは、
プローブハイブリダイゼーションまたは標的もしくはプ
ローブのいずれかにおけるヘアピン形成に起因する。本
発明の1つの局面では、プローブ−プローブスコアおよ
びヘアピンスコアを使用して、これらの現象のハイブリ
ダイゼーション強度に対する効果を記載する。この配列
における2つのスコアの差は、ヘアピンを形成するため
に少なくとも4つの塩基のループを有するはずである
が、一方、2分子のプローブ−プローブ相互作用のため
にそのような必要性は存在しない。
【0113】(C.最隣接パラメーター)ハイブリダイ
ゼーションの自由エネルギーは、関与する塩基の個性だ
けでなく、それらの順序にも依存する。特に、連続する
塩基間に有意なスタッキング効果が存在する。これらの
効果は、「最隣接」相互作用と呼ばれ、そしてこれら
は、異なるジヌクレオチド型に対して異なるハイブリダ
イゼーションの自由エネルギーを評価することにより定
量化され得る。従って、DNA−RNAハイブリダイゼ
ーションは、通常、AA、AC、AG、AT、C
A、...、TG、TTについての16の異なる自由エ
ネルギーを用いて記載される。DNA−DNAハイブリ
ダイゼーション(溶液中)は、二本鎖の間の対称性に起
因して、8つのパラメーターしか必要としない。
【0114】フィットハイブリダイゼーションデータに
対して最隣接記載を適用することは、数学的な変化を必
要とする。上記モデルが、最隣接効果を含むように拡張
され、そして1−2位についてパラメーターをAA、A
C、AG、AT、CA、...、TC、TGに当てはめ
(かつTTは基準としてそのままにする)、次いで24
−25位までの全ての位置について同じことを行う場
合、得られる正規方程式は、1つである。このことは、
パラメーターが、真の配列の空間より大きい空間を記載
することに起因する。例えば、1−2位にAAを、そし
て2−3位にGGを同時に有することは可能ではない
が、パラメーターはそのような状況を記載し得る。
【0115】1つの解は、Cholesky分解以外の
特異値分解を用いて正規方程式を解くことである。実際
には、コンピューターが、不可能な配列に対応するヌル
空間を排除する基礎セットを構築し、そして低次元空間
を保ったまま最適な解を見出す。
【0116】本発明の1つの局面では、コンピューター
ソフトウェア製品が提供され、ハイブリダイゼーション
強度予測を実行する。このソフトウェア製品は、以下の
式:
【0117】
【数14】 を使用する予測を実行するコードを含む。このコード
は、適切な媒体に格納され得、そして適切なデジタルコ
ンピューターにおいて実行され得る。いくつかの実施形
態では、この式は、プローブ−プローブ相互作用、ヘア
ピン形成、最隣接効果を説明するように改変され得る。
この式はまた、上記のようにパラメーターの数を減少す
るように改変され得る。
【0118】このソフトウェアは、Siを入力するコー
ドを含み得る。このSiは、プローブの配列に関与する
パラメーターである。S値の代入値を、表1〜3に例示
する。このソフトウェアはまた、Pi値を入力するため
のコードを含み得る。このPi値は、上記のように経験
的に決定される。さらに、このソフトウェアは、プロー
ブに関して得られた強度値を表示するためのコードを含
み得る。1つの例示的なソフトウエア製品では、ソフト
ウェアは、プローブの配列を入力し、配列に基づくS値
を代入するようにコードが実行され、Pi値は、リレー
ショナルデータベースまたはフラットファイルから入力
される。強度値は計算され、そしてディスプレイに出力
されるか、またはソフトウェアの構成要素に使用され
る。例えば、強度値は、ソフトウェア製品の別のモジュ
ールにおけるプローブ選択(以下に記載される)のため
に使用され得る。
【0119】(III.変異体検出への適用)本発明の
1つの局面において、上記で開発したハイブリダイゼー
ションのモデル、核酸ハイブリダイゼーションを予測す
るための方法およびコンピューターソフトウェアを、改
変して、2つの核酸プローブアレイの間のハイブリダイ
ゼーション条件または製造条件下でのバリエーションを
補正する。いくつかの実施形態において、この方法およ
びコンピューターソフトウェアを用いて変異体、特にヘ
テロ接合性変異体の検出を改善する。いくつかの好まし
い実施形態において、この方法およびソフトウェアを用
いて、所定の野生型配列のすべての可能性のある変異体
(置換、挿入および欠失)に対して感受性のシグナル損
失(loss−of−signal)アッセイの解析を
改善し得る。しかし、この方法およびソフトウェアはま
た、この変異型がタイル方式検出および変異体検出のよ
り詳細な記述のためにタイル化される場合、シグナルの
利得を検出するために適用され得る。例えば、以下を参
照のこと:タイル化プローブセットを設計、選択および
作製するための方法は、例えば、1995年5月4日公
開、WO95/11995(全ての目的のために参考と
して本明細書において援用される)に記載されている。
Haciaら(1996,「Detection of
heterozygous mutations i
n BRCA1 using high densit
y oligonucleotide arrays
and two−color fluorescenc
e analysis」Nat.Genet.14:4
41〜447)は、オン−チップ参照およびオフ−チッ
プ参照ならびに2つの異なる蛍光標識を利用するシグナ
ル損失アッセイを記載している。この「二色(two−
color)」アッセイにおいて、未知の標的サンプル
を1つの型の蛍光標識(例えば、赤)で標識するが、一
方、野生型の参照を、第2の蛍光標識(例えば、緑)で
標識する。第2のチップにおいて、野生型標的を赤およ
び緑の両方で標識し、そしてこのチップにハイブリダイ
ズする。標的に対して相補的であるように設計される各
々の完全マッチ(perfect−match)プロー
ブについて、強度の比を、以下の式で算出する: 比=[I(1,wt,green)I(2,wt,re
d)]/[I(1,unk,red)I(2,wt,g
reen)](式4) ここで、I(1,unk,red)は、チップ1上の未
知の標的の強度であり、I(1,wt,green)
は、同じチップ上の野生型参照の強度であり、I(2,
wt,red)は、参照チップ上の赤で標識した野生型
サンプルの強度であり、そしてI(2,wt,gree
n)は、参照チップ上の緑で標識した野生型サンプルの
強度である。この比を、チップ間のバリエーションの効
果、および2つの型の蛍光標識の間の差に起因する効果
を無効にするように構築する。次いで、Haciaら
は、変異体の存在のシグナルに対する、この比の五つの
位置の移動するウインドウの平均をとった。変異体を示
すために、域値をこえるウインドウ−平均化比の値をと
った。
【0120】配列に基づく標準化スキームは、上記のエ
ネルギー性のパラメーターと比を(一色または二色のい
ずれかで)フィットさせる工程を包含する。ハイブリダ
イゼーション条件における差は、配列−標準化比が形成
される場合、大部分は無効にされる。ここで、Piは、
比に対するフィットのi番目のパラメーターであり、そ
してSiは、プローブ配列の値または機能に対応する。 標準化比=比*exp[−[ΣiiI] (式5) これを示す別の方法は、標準化比が比に対するフィット
で測定された比を割ったもの(すなわち、残存率)であ
るということである。この標準化は、一色アッセイの能
力の大いなる改善、および二色アッセイの能力における
より小幅な改善を生じる。配列に基づく標準化を用いる
一色アッセイの結果により、7つのサンプル中7つの真
の陽性のうち6つを生じた。この各々は、MSH2およ
びMLH1遺伝子の35エキソンおよび5.5kbの配
列から構成される。これらの結果は、この方法が、予備
的スクリーニング(必要とされる、ゲルに基づく配列決
定の量を大きく制限する)として、その現在の形態にお
いて非常に有用であり得ることを示唆する。完全マッチ
プローブの複数のコピーを組み込む新しいチップ設計に
より、能力のさらなる改善が可能である。
【0121】二色アッセイは、配列に基づく標準化なし
に、非常に良好に実行する。誤差の率は十分低いようで
ある。それを特定するのに、そしてまたどんな改良型の
配列に基づく標準化が生じるかを特定するために、かな
り大量のデータ(おそらく数百サンプル)を必要とす
る。それにもかかわらず、シグナル対ノイズ比に基づ
く、配列に基づく標準化は、二色アッセイの誤差率を同
様に減らすようである。
【0122】(IV.遺伝子発現のためのプローブ選択
への適用)本明細書において開発されたモデルは、遺伝
子発現のためのプローブ選択に有用なプローブ強度の予
想を行い得る。
【0123】遺伝子発現モニタリングアレイの1つの実
行において(全ての目的のために参考として本明細書に
おいて援用される、米国特許第5,800,922号お
よび同第6,040,138号を参照のこと)。それぞ
れの遺伝子をプローブ対の群により問い合わせる。それ
ぞれのプローブ対は、その標的に相補的であるように設
計されている(完全マッチ)プローブ、およびその標的
に対するミスマッチを含むように設計されているミスマ
ッチプローブから構成される。各プローブ対の強度の差
(完全マッチ−ミスマッチ)を、上記のモデルを用いて
推定する。図8は、このストラテジーの有効性を示す。
このデータは、遺伝子発現チップに対してハイブリダイ
ズされた酵母mRNA由来である。強度差をBRCA1
データに対する最隣接フィットに基づいて予測する。こ
のプロットは、遺伝子発現チップの設計のためのプロー
ブを選択する手段として、予測された強度の差を用いる
効果を示す。強度の差が大きいプローブ対が所望され
る。ゼロ百分位数カットオフ値は、全てのプローブ対が
含まれることを意味するが、50thのパーセンタイル
カットオフ値は、推定の上位半分中の推定強度を有する
プローブ対のみが含まれることを意味する。現実の強度
差における2倍の因子は、この方法により容易に得られ
る。
【0124】(V.チップ製造品質管理への適用)一般
に、パラメーターおよびハイブリダイゼーションの強度
はまた、チップ製造プロセスにおけるバリエーションを
反映する。合成工程のカップリング効率性におけるバリ
エーションは、ハイブリダイゼーション自由エネルギー
におけるバリエーション同様、プローブ強度に対して乗
法的効果を有するはずである。例えば、0.9のカップ
リング効率性を有する合成工程後の0.85効率性を有
する合成工程は、0.9×0.85のプローブ(両方の
合成工程を首尾よく完了させる)を生じる。エネルギー
性項を有する場合にそうであるように、絶対的な効率性
ではなく、相対的な効率性のみが本明細書に示される方
法により検出され得る。
【0125】シフトマスク(shift−mask)プ
ロセスを用いて製造されたチップについて、プローブ配
列数および塩基型に対応するエネルギー性パラメーター
はまた、製造プロセスにおける特定のサイクルに対応す
る。図1bにおけるパラメーターは、この場合の例であ
る。他よりも効率が実質的に低い合成工程が存在した場
合、当業者は、図1bにおけるその工程に対応するパラ
メーターで落下(dip)を予期する。シフトマスクで
作製してないチップについては、特定のサイクルに対応
するパラメーターがまた構築され得る。低収率のサイク
ルは、測定された強度をフィットさせることに由来する
対応するパラメーター中の比較的低い値により検出可能
であるはずである。
【0126】
【実施例】BRCA1遺伝子における変異を調査する実
験からのデータを用いて、本発明の方法のいくつかの実
施形態を検討した。
【0127】BRCA1における生殖細胞系列変異体
は、乳ガンおよび卵巣ガンを有する近親者の50〜60
%に存在し、一般の集団における全ての乳癌の約2〜5
%の症例の原因であり得る(Hallら、Scienc
e 250,1684〜1689(1990)、Nar
odら、Lancet 338、82〜83(199
1)、Eastonら、Am.J.Hum.Gene
t.52、678〜701(1993)、Rowell
ら、Am.J.Hum.Genet.55,861〜8
65(1994))。ヘテロ接合性キャリアは、早期の
乳癌ガンおよび卵巣ガンに著しく罹りやすく、そしてま
た、結腸ガンおよび前立腺ガンを発症する中程度に増加
した危険性がある(Fordら、Lancet 34
3、692〜695(1994))。BRCA1のタン
パク質コード領域は、ゲノムDNAの100kbにわた
って広がったコードしている22のエキソン中に5,5
92bpを含む(Mikiら、Science 26
6、66〜71(1994))。この遺伝子全体に分布
された111を超える特有のBRCA1変異体は、文献
中に記載されている(Shattuck−Eidens
ら、Am.Med.Assoc.273,535〜54
1(1995)およびBreast Cancer I
nformation Core Database
(the World Wide Web at ht
tp://www.nchgr.nih−gov/In
tramural−research/Lab−tra
nsfer/Bic/.にある))。これらのほとんど
は、正常なリーディングフレーム(読み取り枠)の破壊
を生じるフレームシフト改変体、ノンセンス改変体、ま
たはスプライシング改変体である。2つの変異体がBR
CA1改変のほとんどの原因である、Ashkenaz
i Jewish集団を除いて(Struewing
ら、AmJ.Hum.Genet.57,1〜7(19
95);Struewingら,Nature Gen
et.11,198〜200(1995);Tonin
ら、Am.J.Hum.Genet.57、189(1
995);Friedmanら、Am.J.Hum.G
enet.57、1284〜1297(1995);F
itzGeraldら、N.Engl.J.Med.3
34、143〜149(1996);Offitら、L
ancet 347、1643〜1645(199
6))、対立遺伝子異質性は、以前に記載された変異体
の有限のセットのみを検出する方法(例えば、対立遺伝
子特異的オリゴヌクレオチド[ASO]ハイブリダイゼ
ーション)により、BRCA1変異体キャリアを同定す
る能力を混同する。
【0128】(A.方法) (a)ゲノムDNAおよびRNA標的調製物からのPC
R 以下のプライマー:11FT3 5’−ATTAACC
CTCACTAAAGGGAATTAAATGAAAG
AGTATGAGC−3’および11RT75’−TA
ATACGACTCACTATAGGGAGTGCTC
CCAAAAGCATAAA−3’(それぞれ、T3お
よびT7 RNAポリメラーゼプロモーター配列を含
む)を備えるEXPANDTMLong Range P
CR Kit(Boehringer Mannhei
m)を用いて、ゲノムサンプルにおいて、PCR反応を
実施した。参照サンプルおよび試験サンプルとして、そ
れぞれ、T3 RNAポリメラーゼ転写緩衝液(Pro
mega)、0.7MMのATP、CTP、GTPおよ
びUTP、10MM DTT、0.7 MM フルオレ
セイン−12−UTPまたは0.15 MMビオチン−
16−UTP(Boehringer Mannhei
m)を、そして示されるように1OU T3またはT7
RNAポリメラーゼを用いて、10 Lの反応溶液中
で、これらのエキソン11アンプリコンテンプレートか
らのインビトロ転写反応を実行した。
【0129】(b)標的調製および解析 参照テンプレートを、BRCA1 cDNAクローン由
来のエキソン11のPCR増幅から作製した。参照転写
産物および試験サンプル転写産物を、25lの30mm
MgCl2溶液中に最終濃度100nMで希釈した。反
応物を94℃で70分間インキュベートし、標的をフラ
グメント化した(Lipshutzら、BioTech
niques 19、442−447(1995);K
ozalら、Nature Med.2、753−75
9(1996))。同時にフラグメント化した標的を、
300plの容量のハイブリダイゼーション緩衝液(3
MTMAC−Cl(塩化テトラメチルアンモニウム)、
1×TE pH7.4、0.001% Triton
X−100、1nM 5’−フルオレセイン標識化コン
トロールオリゴヌクレオチド5’−CGGTAGCAT
CTTGAC−3’)に100倍に希釈した。このコン
トロールオリゴヌクレオチドを、イメージアライメント
を助けるために特定の表面プローブにハイブリダイズす
るように設計する。標的を、250lの容量においてこ
のチップと35℃で4時間ハイブリダイズした。このチ
ップ表面を、10mlの洗浄緩衝液(6×SSPE、
0.001% Triton X−100)を用いて洗
浄し、そしてフィコエリトリン−ストレプトアビジン結
合体(Molecular Probes)(洗浄緩衝
液中2μg/ml)を用いて室温で5分間染色した。こ
のチップを、10mlの洗浄緩衝液で洗浄し、そして記
載のようにスキャンした(Lipshutzら、Bio
Techniques 19,442−447(199
5);Kozalら、Nature Med.2,75
3−759(1996))。ハイブリダイゼーションシ
グナルを、それぞれフルオレセイン参照サンプル(緑)
およびビオチン試験サンプル(赤)について515nm
〜545nmの帯域通過放出フィルターおよび560n
mの長通過(longpass)放出フィルターを用い
て光電子増倍管によって検出した(Croninら、H
um.Mut.7,244−255(1996);Ch
eeら、Science 274,610−614(1
996))。
【0130】(d)ジデオキシ配列決定解析 PCRプライマーの4つの対
【0131】
【化3】 を設計し、4つの部分的に重複するアンプリコンを生成
した。このアンプリコンは、エキソン11の全配列をカ
バーし、そしていずれかの鎖の5’末端においてM13
順方向配列およびM13逆方向配列を含む。解析される
べき領域に依存して、4つアンプリコンのうち1つを、
推奨プロトコルを用いるEXPANDTMLong Ra
nge PCR kit(Boehringer Ma
nnheim)を用いて適切なゲノムサンプルから生成
した。色素プライマージデオキシ配列決定反応を、推奨
プロトコルを用いるAmpliTaq DNA Pol
ymerase FS kit(Perkin Elm
er)およびM13順方向またはM13逆方向のいずれ
かのDYEnamicTMエネルギー移動色素プライマー
(Amersham Life Science)を用
いて実行した。
【0132】(d)データ解析 光電子増倍管出力シグナルを、GeneChip(登録
商標)ソフトウェア(Affymetrix,In
c.,Santa Clara,CA)を用いて、比例
する、空間的に指定されたピクセル値に変換し、計数化
した蛍光イメージを作製した。参照標的および試験標的
の、各々のプローブシグナルに対する相対的寄与を、実
験での緑参照イメージおよび赤試験イメージの各セット
から抽出し、そしてMicrosoft Excel
7.0aワークシートに取り込んだ。
【0133】(B.結果) (a)ハイブリダイゼーション親和性の予測 図3aは、BRCA1チップからの実験データおよびフ
ィット(予測)した強度のサブセットを示す。BRCA
1配列の(全5.6kbの中からの)400塩基につい
て測定された強度およびフィットした強度(ハイブリダ
イゼーション親和性の測定)を示す。フィットしたパラ
メーターを、図3bに示す。97のパラメーターを、こ
のフィットにおいて使用する−−75個の塩基型および
位置のパラメーター(25個のプローブの位置の各々に
おける各非T塩基についてのパラメーター)および22
個のエキソンの各々についての1つの標準化パラメータ
ー。各々のエキソンについての別個の標準化パラメータ
ーは、異なるエキソンが、おそらく異なる濃度で存在し
ているという事実を考慮する。この全配列にわたるI
fitおよびImsdの(自然)対数の平方二乗平均(r.
m.s.)偏差は、0.8565であり、この値は、フ
ィットを示す。
【0134】図3bにおけるパラメーターは、単純な解
釈を有する。例えば、10番目の位置のCは、約0.4
6の値を有する。これは、10番目の位置においてCを
有するプローブについてのIfitの対数が、10番目の
位置におけるTおよび他の24個の位置全てにおいて同
一の塩基を有するプローブについてのIfitの対数より
も0.46大きいことを意味する。このデータにおい
て、標的がRNAである場合、一般的にこのプローブに
おけるCが、最も好都合なハイブリダイゼーション自由
エネルギーを有し、続いてG、A、ついでTが好都合な
ハイブリダイゼーション自由エネルギーを有すること
を、図3bを検討することによって理解し得る。
【0135】図3bにおける曲線の形状は、点変異に起
因するフットプリントの形状(または「スマイルプロッ
ト」)と大まかに一致している。フットプリントから理
解されるように、この曲線の頂点は、プローブ配列の中
央に近く、これは、この中央に近い位置が、ハイブリダ
イゼーションの際に最も大きな影響を有することを示
す。
【0136】(b)パラメーターの減少 図4bは、図4aにおいて使用されたフィットパラメー
ターから導いた塩基依存性ハイブリダイゼーション自由
エネルギーおよび位置依存性ハイブリダイゼーション自
由エネルギーを示す。各曲線は、フィットパラメーター
のうちの5つによって特定された4次式である。37個
のパラメーターを、このフィットにおいて使用する−−
15個は、ハイブリダイゼーションの塩基依存性および
位置依存性を説明している3つの4次式を特定し、そし
て残りの22個は、22個のエキソンの各々についての
標準化パラメーターである。これらの曲線は、図3bに
おいて示された曲線のより低い情報量バージョンであ
る。この全配列にわたるIfi tおよびImsdの対数のr.
m.s.偏差は、0.8712である。パラメーター数
の大きな減少にもかかわらず、このフィットの質はほと
んど低下しない。
【0137】(c)プローブ−プローブハイブリダイゼ
ーションおよびヘアピン形成 図5aおよび5bは、プローブ−プローブスコアおよび
ヘアピンスコアに対応するパラメーターがまた、このフ
ィットにおいて含まれたことを除いては、図4aおよび
4bと同一である。39個のパラメーターを、このフィ
ットにおいて使用する−−37個のパラメーターは、図
4において見られ、そして2つのさらなるパラメーター
は、プローブ−プローブ相互作用およびヘアピン形成を
説明する。この全配列にわたるIfitおよびImsdの対数
のr.m.s.偏差は、0.8274である。このフィ
ットを改善する、1つの領域は、配列番号1980周辺
である。位置1980の周辺の配列の試験は、プローブ
−プローブ相互作用およびヘアピンの両方が、おそらく
存在することを示す。
【0138】(d)最隣接パラメーター 図6a〜dは、最隣接自由エネルギーに対する4次式フ
ィットを用いる特異値分解方法を用いる結果を示す。9
9個のパラメーターを、このフィットにおいて使用する
−−75個は、非参照最隣接項の各々の塩基依存性およ
び位置依存性を説明する15個の4次式を特定し、2個
は、プローブ−プローブ相互作用およびヘアピン形成を
説明し、そして22個は、22個のエキソンの各々につ
いての標準化パラメーターである。この全配列にわたる
fitおよびImsdの対数のr.m.s.偏差は、0.7
436である。図6b〜dは、図6aにおいて使用され
るフィットパラメーターから導かれる塩基依存性最隣接
ハイブリダイゼーション自由エネルギーおよび位置依存
性最隣接ハイブリダイゼーション自由エネルギーを示
す。
【0139】(e)変異検出における適用 図7aは、BRCA1の配列の一部についての一色の比
に対する配列に基づく標準化の効果を示す。この配列に
基づく標準化は、可能性のある偽陽性からのシグナルを
減少するが、位置2798における真の変異からのシグ
ナルは、減少しない。図7bは、野生型BRCA1サン
プルの、配列に基づく標準化による偽陽性の排除を示
す。
【0140】(d)遺伝子発現のためのプローブ選択 図8は、プローブ強度の予測に基づくプローブ選択の有
効性を示す。このデータは、遺伝子発現チップに対して
ハイブリダイズした酵母mRNAのデータである。各プ
ローブ対の強度の差(完全な一致からミスマッチを引
く)を、BRCA1データに対する最隣接フィットに基
づいて予測する。このプロットは、遺伝子発現チップの
設計のためのプローブを選択する手段として予測された
強度の差を用いることが効果的であることを示す。大き
な強度の差を有するプローブ対が望ましい。ゼロ百分位
数カットオフとは、全てのプローブ対が含まれることを
意味するが、50百分位数カットオフ手段とは、予測さ
れた強度を有するこれらのプローブ対であってこの予測
の上位半分あるもののみを含むことを意味する。実際の
強度の差の2倍の増加因数は、この方法によって容易に
得られる。 (結論)本発明は、核酸ハイブリダイゼーション親和性
を予測するため、変異を検出するため、プローブを選択
するため、およびプローブアレイ製造の品質管理を改善
するための方法およびコンピューターソフトフェア製品
を提供する。上記は、例示であって、そして制限ではな
いことを意図することが理解される。本発明の多くのバ
リエーションは、上記を検討することで当業者に明らか
である。例示を目的として、本発明は、主に高密度オリ
ゴヌクレオチドアレイの使用に関して記載されている
が、この方法が、他の固定化プローブ(例えば、光ファ
イバーもしくはその他の支持体上に固定化されているプ
ローブ)のハイブリダイゼーション親和性を予測するた
めに使用され得ることは、当業者によって容易に認識さ
れる。本発明のこの基本的な方法およびコンピューター
ソフトウェアをまた使用して溶液に基づくハイブリダイ
ゼーションを予測し得る。従って、本発明の範囲は、上
記を参照せずに決定されるべきであるが、その代わり
に、添付の特許請求の範囲に対して権利として与えられ
る等価物の全範囲とともに添付の特許請求の範囲を参照
して決定されるべきである。
【0141】
【発明の効果】核酸ハイブリダイゼーション親和性を予
測するための方法およびコンピューターソフトウエア製
品を提供する。1つの実施形態において、ハイブリダイ
ゼーション強度(I)は、以下の式:
【0142】
【数15】 を使用して決定される。ここでPiはi番目のパラメー
ターの値であり、Siはプローブの配列に由来する値で
ある。本発明の方法は、変異体検出、プローブ選択およ
びプローブアレイ製造品質調節を増強するために使用さ
れ得る。
【図面の簡単な説明】
本明細書に援用されかつ本明細書の一部を形成する添付
の図面は、本発明の実施形態を例証し、そして本明細書
の記載と一緒に、本発明の原理を記述する役割を果た
す。
【図1】図1は、本発明の1つの実施形態のソフトウェ
アを実行するために使用され得るコンピュータシステム
の一例を図示する。
【図2】図2は、図1のコンピュータシステムのシステ
ムブロック図を図示する。
【図3a】図3aは、BRCA1配列の(全部で5.6
kbのうちの)400塩基についての測定されかつフィ
ットした強度を示す。フィットにおいて97のパラメー
タを使用する−75の塩基型および位置パラメータ(2
5プローブ位置の各々において各Tでない塩基について
のパラメータ)および22エキソンの各々についての1
つの標準化パラメータ。各エキソンについての別々の標
準化パラメータは、異なるエキソンが異なる濃度で存在
し得るという事実を許容する。配列全体にわたるIfit
およびImsdの(自然)対数の平方根二乗平均(r.
m.s.)偏差は、0.8565である。
【図3b】図3bは、図3aにおいてフィットした強度
を計算するために使用した75の塩基および位置特異的
パラメータを示す。
【図4a】図4aは、BRCA1配列の部分についての
測定されかつフィットした強度を示す。フィットにおい
て37のパラメータを使用する−15は、ハイブリダイ
ゼーションの塩基依存性および位置依存性を記述する3
つの4次多項式を特定し、そして残りの22は、22エ
キソンの各々についての標準化パラメータである。配列
全体にわたるIfitおよびImsdの対数のr.m.s.偏
差は、0.8712である。
【図4b】図4bは、図4aにおいて使用されたフィッ
ティングパラメータに由来する、塩基および位置依存的
ハイブリダイゼーション自由エネルギーを示す。各曲線
は、5のフィッティングパラメータによって特定される
4次多項式である。これらの曲線は、図3bに示される
曲線のより少ない情報量のバージョンである。
【図5a】図5aは、BRCA1配列の部分についての
測定されかつフィットした強度を示す。フィットにおい
て39のパラメータを使用する−それらのうちの37は
図4に示された通りであり、そして2つのさらなるパラ
メータは、プローブ−プローブ相互作用およびヘアピン
形成を記述する。配列全体にわたるIfitおよびIm sd
対数のr.m.s.偏差は、0.8274である。
【図5b】図5bは、図5aにおいて使用されたフィッ
ティングパラメータに由来する、塩基および位置依存的
ハイブリダイゼーション自由エネルギーを示す。
【図6a】図6aは、BRCA1配列の部分についての
測定されかつフィットした強度を示す。フィットにおい
て99のパラメータを使用する−75は、非参照最隣接
タームの各々の塩基依存性および位置依存性を記述する
15の4次多項式を特定し、2つはプローブ−プローブ
相互作用およびヘアピン形成を記述し、そして22は、
22エキソンの各々についての標準化パラメータであ
る。配列全体にわたるIfitおよびImsdの対数のr.
m.s.偏差は、0.7436である。
【図6b】図6bは、図6aにおいて使用されたフィッ
ティングパラメータに由来する、塩基および位置依存的
最隣接ハイブリダイゼーション自由エネルギーを示す。
【図6c】図6cは、図6aにおいて使用されたフィッ
ティングパラメータに由来する、塩基および位置依存的
最隣接ハイブリダイゼーション自由エネルギーを示す。
【図6d】図6dは、図6aにおいて使用されたフィッ
ティングパラメータに由来する、塩基および位置依存的
最隣接ハイブリダイゼーション自由エネルギーを示す。
【図7a】図7aは、BRCA1配列の部分についての
標準化されてない一色比(one−color rat
io)および配列に基づいて標準化された一色比を示
す。配列に基づく標準化は、図5において用いられた同
じ37のパラメータ型を使用した。1.3より上の比が
変異と呼ばれる。配列に基づく標準化は、2798位の
真の変異のシグナルを減少しないままで、配列数230
0よりすぐ下の擬陽性を除外する。
【図7b】図7bは、BRCA1配列の部分についての
規格化していないおよび配列に基づいて規格化した一色
比(one−color ratio)を示す。規格化
スキームは図7aと同様である。配列に基づく規格化
は、この野生型サンプルのいくつかの偽陽性を消去す
る。規格化比曲線の破断は、エキソン境界に生じる。
【図8】図8は、推定強度差が、大きな強度差を有する
プローブ対を選択するために使用されることを示す。強
度差は、BRCA1データセットから導かれる最隣接パ
ラメータを使用して推定される。カットオフ値を超える
推定強度差を有するプローブ対が選択される。ここで、
カットオフは全ての推定強度差の百分位数として表現さ
れる。0位の百分位数でのカットオフが、推定強度差に
かかわらず、全てのプローブ対を受容することに合致す
る。50位の百分位数のカットオフが、全ての推定強度
差のうちの上位半分の推定強度差を有するプローブ対の
みを選択することに合致する。測定される強度差は、遺
伝子発現チップにハイブリダイズしたmRNAに由来す
る。大きな推定強度差を有するプローブ対を選択するこ
とによって、より大きな実際の強度差を有するプローブ
対が得られる。

Claims (59)

    【特許請求の範囲】
  1. 【請求項1】 遺伝子発現をモニタリングするプローブ
    を選択するためのコンピューターで実行される方法であ
    って、該方法は、 a)複数の候補プローブおよびそれらの対応するコント
    ロールプローブのハイブリダイゼーション強度を予測す
    る工程;および b)その対応するコントロールプローブに対して最も高
    い強度差を有する候補プローブを選択する工程、を包含
    する、方法。
  2. 【請求項2】 前記ハイブリダイゼーション強度(I)
    が、以下の式: 【数1】 を使用して決定される、請求項1に記載の方法であっ
    て、ここで該Piが、i番目のパラメーターの値であ
    り、そしてSiが、そのプローブの配列に由来する値で
    ある、方法。
  3. 【請求項3】 前記Piが、A、C、GおよびTからな
    る群より選択される参照塩基に比較しての、前記配列の
    所定の位置における塩基の自由エネルギーである、請求
    項2に記載の方法。
  4. 【請求項4】 前記Siが前記配列の汎関数である、請
    求項3に記載の方法。
  5. 【請求項5】 前記Piが経験的に決定される、請求項
    3に記載の方法。
  6. 【請求項6】 前記Piが、トレーニングデータセット
    を使用する最小二乗フィットによって決定される、請求
    項5に記載の方法。
  7. 【請求項7】 Piが、Cholesky分解を使用し
    て決定される、請求項5に記載の方法。
  8. 【請求項8】 所定のヌクレオチド型についての前記S
    iが、プローブ塩基数の平滑化関数で置換される、請求
    項7に記載の方法。
  9. 【請求項9】 前記平滑化関数が多項関数である、請求
    項8に記載の方法。
  10. 【請求項10】 所定のヌクレオチド型についての前記
    Siが、中心位置に対する塩基の差の平滑化関数で置換
    される、請求項7に記載の方法。
  11. 【請求項11】 前記平滑化関数が多項関数である、請
    求項8に記載の方法。
  12. 【請求項12】 前記式が、プローブ−プローブハイブ
    リダイゼーションを記述する少なくとも1つのパラメー
    ターを含む、請求項7に記載の方法。
  13. 【請求項13】 前記式が、ヘアピン形成を記述する少
    なくとも1つのパラメーターを含む、請求項7に記載の
    方法。
  14. 【請求項14】 前記式が、最隣接相互作用を記述する
    パラメーターを含む、請求項7に記載の方法。
  15. 【請求項15】 前記Piが特異値分解を使用して決定
    される、請求項7に記載の方法。
  16. 【請求項16】 その標的に対するプローブのハイブリ
    ダイゼーション親和性を予測するためのコンピューター
    で実行される方法であって、該方法は、以下の式: 【数2】 を使用してハイブリダイゼーション強度(I)を計算す
    る工程を包含し、ここで、該Piがi番目のパラメータ
    ーの値であり、そしてSiがそのプローブの配列に由来
    する値である、方法。
  17. 【請求項17】 前記Piが、A、C、GおよびTから
    なる群より選択される参照塩基に比較しての、前記配列
    の所定の位置における塩基の自由エネルギーである、請
    求項16に記載の方法。
  18. 【請求項18】 前記Siが前記配列の汎関数である、
    請求項17に記載の方法。
  19. 【請求項19】 前記Piが経験的に決定される、請求
    項18に記載の方法。
  20. 【請求項20】 前記Piが、トレーニングデータセッ
    トを使用する最小二乗フィットによって決定される、請
    求項19に記載の方法。
  21. 【請求項21】 Piが、Cholesky分解を使用
    して決定される、請求項20に記載の方法。
  22. 【請求項22】 所定のヌクレオチド型についての前記
    Siが、プローブ塩基数の平滑化関数で置換される、請
    求項21に記載の方法。
  23. 【請求項23】 前記平滑化関数が多項関数である、請
    求項22に記載の方法。
  24. 【請求項24】 所定のヌクレオチド型についての前記
    Siが、中心位置に対する塩基の差の平滑化関数で置換
    される、請求項21に記載の方法。
  25. 【請求項25】 前記平滑化関数が多項関数である、請
    求項24に記載の方法。
  26. 【請求項26】 前記式が、プローブ−プローブハイブ
    リダイゼーションを記述する少なくとも1つのパラメー
    ターを含む、請求項21に記載の方法。
  27. 【請求項27】 前記式が、ヘアピン形成を記述する少
    なくとも1つのパラメーターを含む、請求項21に記載
    の方法。
  28. 【請求項28】 前記式が、最隣接相互作用を記述する
    パラメーターを含む、請求項20に記載の方法。
  29. 【請求項29】 前記Piが特異値分解を使用して決定
    される、請求項28に記載の方法。
  30. 【請求項30】 前記プローブが固相基材上に固定化さ
    れる、請求項16に記載の方法。
  31. 【請求項31】 その標的に対するプローブのハイブリ
    ダイゼーション親和性を予測するためのコンピューター
    ソフトウエア製品であって、該製品は、以下の式: 【数3】 を使用してハイブリダイゼーション強度(I)を計算す
    るためのコンピュータープログラムコード、ここで該P
    iがi番目のパラメーターの値であり、そしてSiがそ
    のプローブの配列に由来する値であり;および該コンピ
    ュータープログラムコードを格納するコンピューターで
    読み取り可能な媒体、を備えるコンピューターソフトウ
    エア製品。
  32. 【請求項32】 前記Piが、A、C、GおよびTから
    なる群より選択される参照塩基に比較しての、前記配列
    の所定の位置における塩基の自由エネルギーである、請
    求項31に記載のコンピューターソフトウエア製品。
  33. 【請求項33】 前記Siが前記配列の汎関数である、
    請求項32に記載のコンピューターソフトウエア製品。
  34. 【請求項34】 前記Piが経験的に決定される、請求
    項33に記載のコンピューターソフトウエア製品。
  35. 【請求項35】 前記Piが、トレーニングデータセッ
    トを使用する最小二乗フィットによって決定される、請
    求項34に記載のコンピューターソフトウエア製品。
  36. 【請求項36】 Piが、Cholesky分解を使用
    して決定される、請求項35に記載のコンピューターソ
    フトウエア製品。
  37. 【請求項37】 所定のヌクレオチド型についての前記
    Siが、プローブ塩基数の平滑化関数で置換される、請
    求項36に記載のコンピューターソフトウエア製品。
  38. 【請求項38】 前記平滑化関数が多項関数である、請
    求項37に記載のコンピューターソフトウエア製品。
  39. 【請求項39】 所定のヌクレオチド型についての前記
    Siが、中心位置に対する塩基の差の平滑化関数で置換
    される、請求項36に記載のコンピューターソフトウエ
    ア製品。
  40. 【請求項40】 前記平滑化関数が多項関数である、請
    求項39に記載のコンピューターソフトウエア製品。
  41. 【請求項41】 前記式が、プローブ−プローブハイブ
    リダイゼーションを記述する少なくとも1つのパラメー
    ターを含む、請求項36に記載のコンピューターソフト
    ウエア製品。
  42. 【請求項42】 前記式が、ヘアピン形成を記述する少
    なくとも1つのパラメーターを含む、請求項36に記載
    のコンピューターソフトウエア製品。
  43. 【請求項43】 前記式が、最隣接相互作用を記述する
    パラメーターを含む、請求項35に記載のコンピュータ
    ーソフトウエア製品。
  44. 【請求項44】 前記Piが特異値分解を使用して決定
    される、請求項18に記載のコンピューターソフトウエ
    ア製品。
  45. 【請求項45】 遺伝子発現をモニタリングするプロー
    ブを選択するためのコンピューターソフトウエア製品で
    あって、該製品は、 複数の候補プローブおよびそれらの対応するコントロー
    ルプローブのハイブリダイゼーション強度を予測するた
    めのコンピュータープログラムコード;対応するコント
    ロールプローブに対して最も強い強度差を有する候補プ
    ローブを選択するためのコンピュータープログラムコー
    ド;および該コードを格納するためのコンピューターで
    読み取り可能な媒体、を備えるコンピューターソフトウ
    エア製品。
  46. 【請求項46】 請求項45に記載のコンピューターソ
    フトウエア製品であって、ここでハイブリダイゼーショ
    ン強度(I)を予測するための前記コンピューターコー
    ドが、以下の式: 【数4】 を使用して計算するためのコードを備え、ここで、該P
    iがi番目のパラメーターの値であり、そしてSiがそ
    のプローブの配列に由来する値である、コンピューター
    ソフトウエア製品。
  47. 【請求項47】 前記Piが、A、C、GおよびTから
    なる群より選択される参照塩基に比較しての、前記配列
    の所定の位置における塩基の自由エネルギーである、請
    求項46に記載のコンピューターソフトウエア製品。
  48. 【請求項48】 前記Siが前記配列の汎関数である、
    請求項47に記載のコンピューターソフトウエア製品。
  49. 【請求項49】 前記Piが経験的に決定される、請求
    項47に記載のコンピューターソフトウエア製品。
  50. 【請求項50】 前記Piが、トレーニングデータセッ
    トを使用する最小二乗フィットによって決定される、請
    求項49に記載のコンピューターソフトウエア製品。
  51. 【請求項51】 Piが、Cholesky分解を使用
    して決定される、請求項50に記載のコンピューターソ
    フトウエア製品。
  52. 【請求項52】 所定のヌクレオチド型についての前記
    Siが、プローブ塩基数の平滑化関数で置換される、請
    求項51に記載のコンピューターソフトウエア製品。
  53. 【請求項53】 前記平滑化関数が多項関数である、請
    求項52に記載のコンピューターソフトウエア製品。
  54. 【請求項54】 所定のヌクレオチド型についての前記
    Siが、中心位置に対する塩基の差の平滑化関数で置換
    される、請求項52に記載のコンピューターソフトウエ
    ア製品。
  55. 【請求項55】 前記平滑化関数が多項関数である、請
    求項52に記載のコンピューターソフトウエア製品。
  56. 【請求項56】 前記式が、プローブ−プローブハイブ
    リダイゼーションを記述する少なくとも1つのパラメー
    ターを含む、請求項51に記載のコンピューターソフト
    ウエア製品。
  57. 【請求項57】 前記式が、ヘアピン形成を記述する少
    なくとも1つのパラメーターを含む、請求項51に記載
    のコンピューターソフトウエア製品。
  58. 【請求項58】 前記式が、最隣接相互作用を記述する
    パラメーターを含む、請求項51に記載のコンピュータ
    ーソフトウエア製品。
  59. 【請求項59】 前記Piが特異値分解を使用して決定
    される、請求項58に記載のコンピューターソフトウエ
    ア製品。
JP2001355292A 2000-11-21 2001-11-20 核酸のハイブリダイゼーション親和性を予測するための方法およびコンピューターソフトウエア製品 Pending JP2002357606A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US72104200A 2000-11-21 2000-11-21
US09/721,042 2000-11-21

Publications (1)

Publication Number Publication Date
JP2002357606A true JP2002357606A (ja) 2002-12-13

Family

ID=24896287

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001355292A Pending JP2002357606A (ja) 2000-11-21 2001-11-20 核酸のハイブリダイゼーション親和性を予測するための方法およびコンピューターソフトウエア製品

Country Status (4)

Country Link
US (1) US20060178842A1 (ja)
EP (1) EP1209612A3 (ja)
JP (1) JP2002357606A (ja)
CA (1) CA2363518A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005003676A (ja) * 2003-05-19 2005-01-06 Canon Inc 情報処理装置および情報処理方法ならびに記憶媒体、プログラム
JP2008507297A (ja) * 2004-07-26 2008-03-13 エンゾン ファーマシューティカルズ,インコーポレーテッド 最適化されたインターフェロンβ遺伝子

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1480155A3 (en) * 2003-05-19 2008-12-03 Canon Kabushiki Kaisha Information processing apparatus, information processing method, storage medium and program
US20050079509A1 (en) * 2003-10-14 2005-04-14 Shannon Karen W. Methods for identifying suitable nucleic acid normalization probe sequences for use in nucleic acid arrays
JP2010011791A (ja) * 2008-07-03 2010-01-21 Toshiba Corp 複数核酸の検出方法
ES2364166B1 (es) * 2009-12-31 2012-07-10 Centro De Investigaciones Energéticas, Medioambientales Y Tecnológicas (Ciemat) Huella genómica como predictor de respuesta a tratamiento.
KR102030369B1 (ko) 2012-03-28 2019-10-10 보레알리스 아게 다중모드 고분자

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6600996B2 (en) * 1994-10-21 2003-07-29 Affymetrix, Inc. Computer-aided techniques for analyzing biological sequences
US6251588B1 (en) * 1998-02-10 2001-06-26 Agilent Technologies, Inc. Method for evaluating oligonucleotide probe sequences
US6461816B1 (en) * 1999-07-09 2002-10-08 Agilent Technologies, Inc. Methods for controlling cross-hybridization in analysis of nucleic acid sequences
US6403314B1 (en) * 2000-02-04 2002-06-11 Agilent Technologies, Inc. Computational method and system for predicting fragmented hybridization and for identifying potential cross-hybridization
US6510391B2 (en) * 2000-11-22 2003-01-21 Affymetrix, Inc. Computer software products for nucleic acid hybridization analysis

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005003676A (ja) * 2003-05-19 2005-01-06 Canon Inc 情報処理装置および情報処理方法ならびに記憶媒体、プログラム
JP4579577B2 (ja) * 2003-05-19 2010-11-10 キヤノン株式会社 情報処理装置および情報処理方法ならびに記憶媒体、プログラム
JP2008507297A (ja) * 2004-07-26 2008-03-13 エンゾン ファーマシューティカルズ,インコーポレーテッド 最適化されたインターフェロンβ遺伝子

Also Published As

Publication number Publication date
EP1209612A3 (en) 2007-04-04
CA2363518A1 (en) 2002-05-21
US20060178842A1 (en) 2006-08-10
EP1209612A2 (en) 2002-05-29

Similar Documents

Publication Publication Date Title
US8521441B2 (en) Method and computer program product for reducing fluorophore-specific bias
Dalma‐Weiszhausz et al. [1] The Affymetrix GeneChip® Platform: An Overview
Nguyen et al. DNA microarray experiments: biological and technological aspects
Alkan et al. Genome structural variation discovery and genotyping
Deyholos et al. High‐density microarrays for gene expression analysis
US8036835B2 (en) Probe design methods and microarrays for comparative genomic hybridization and location analysis
JP2006520206A (ja) プローブ、バイオチップおよびそれらの使用方法
JP2002525127A (ja) 遺伝子型決定およびdna分析に関する、方法および生成物
US7396646B2 (en) Alien sequences
JP2002357606A (ja) 核酸のハイブリダイゼーション親和性を予測するための方法およびコンピューターソフトウエア製品
Drmanac et al. Sequencing by hybridization arrays
JP2009232707A (ja) 一塩基多型の検出法及びプローブ固定担体
Wang et al. Robust detection and genotyping of single feature polymorphisms from gene expression data
US20060259251A1 (en) Computer software products for associating gene expression with genetic variations
Baaj et al. A highly specific microarray method for point mutation detection
KR100442839B1 (ko) 최적 탐침 설계를 위한 탐침의 점수화 및 선택에 관한 방법
Stafford et al. Expression technology-a review of the performance and interpretation of expression microarrays
WO2017120750A1 (zh) 一种针对东亚人群全基因组范围内的非编码区的SNPs的DNA芯片
CN113416775A (zh) 一种心血管疾病相关snp位点引物组合物及应用
Ambrosino et al. A Combinatorial Approach to Gene Expression Analysis: DNA Microarrays Lucia Altucci and Alessandro Weisz
Karakach Analysis of gene expression microarray data by multivariate curve resolution.
Boutros Fun with Microarrays Part I: Of Probes and Platforms
Schaffrath et al. Gene arrays
Zhang et al. Genechip-detecting mutations in exon 8 in cTnI gene associated with FHCM
JP2005511006A (ja) 遺伝子発現、タンパク質又は代謝産物のレベルをプロファイリングする方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041118

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061027

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070322