JP2012065674A - 生物学的特徴を検出するためのシステムおよび方法 - Google Patents

生物学的特徴を検出するためのシステムおよび方法 Download PDF

Info

Publication number
JP2012065674A
JP2012065674A JP2012000820A JP2012000820A JP2012065674A JP 2012065674 A JP2012065674 A JP 2012065674A JP 2012000820 A JP2012000820 A JP 2012000820A JP 2012000820 A JP2012000820 A JP 2012000820A JP 2012065674 A JP2012065674 A JP 2012065674A
Authority
JP
Japan
Prior art keywords
model
item
biological
test
organism
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2012000820A
Other languages
English (en)
Inventor
Glenda G Anderson
ジー. アンダーソン グレンダ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PATHWORK DIAGNOSTICS Inc
Original Assignee
PATHWORK DIAGNOSTICS Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/861,177 external-priority patent/US8321137B2/en
Priority claimed from US10/861,216 external-priority patent/US20050069863A1/en
Application filed by PATHWORK DIAGNOSTICS Inc filed Critical PATHWORK DIAGNOSTICS Inc
Publication of JP2012065674A publication Critical patent/JP2012065674A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/30Microarray design

Abstract

【課題】生物学的特徴を検出するシステムおよび方法の提供。
【解決手段】メモリを有するコンピュータが、データを受け取るための命令を記憶し、このデータは、ある1つの種の試験生物内または種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む。このメモリは、複数のモデルのうちのある1つのモデルを演算するための命令を記憶しており、試験生物内または試験生体標本内の生物学的特徴の存在の有無を表すモデルスコアによって特性づけられる。このモデルの演算は、複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用してモデルスコアを決定することを含む。このメモリはさらに、演算するための命令を1回または数回繰り返すための命令を記憶しており、それによって複数のモデルが演算される。このメモリはさらに、演算されたモデルスコアを通信するための命令を記憶している。
【選択図】なし

Description

本出願は、米国特許法119条(e)のもとで、その全体が参照によって本明細書に組み込ま
れる2004年6月5日出願の米国特許仮出願第60/577,416号の恩典を主張するものである。本
出願はまた、米国特許法119条(e)のもとで、その全体が参照によって本明細書に組み込ま
れる2003年9月29日出願の米国特許仮出願第60/507,381号の恩典を主張するものである。
本出願はまた、米国特許法119条(e)のもとで、その全体が参照によって本明細書に組み込
まれる2003年9月29日出願の米国特許仮出願第60/507,445号の恩典を主張するものである
。本出願は、その全体が参照によって本明細書に組み込まれる2004年6月4日出願の米国特
許出願第10/861,216号の一部継続出願である。本出願はまた、その全体が参照によって本
明細書に組み込まれる2004年6月4日出願の米国特許出願第10/861,177号の一部継続出願で
ある。
本発明の分野は、生体標本内の生物学的特徴、例えば病気を識別するためのコンピュー
タシステムおよび方法に関する。
病気を合理的に治療する第一歩は、ある1つの病気分類に照らして患者を評価すること
であり、その結果は、患者の持つ病気の種類を決定し、さまざまな治療に対する患者の反
応を予測するのに使用される。この過程の有効性はその分類の質に左右される。少なくと
も癌の場合には、癌細胞の分類を洗練し向上させるために、腫瘍細胞のDNA、RNAまたはタ
ンパク質を解析するマイクロアレイ法の使用が始まっている。例えばGolub et al., 1999
, Science 286,p. 531を参照されたい。
さらに、van'tVeer et al., 2002, Nature 415, p. 530は、このような「分子プロフ
ァイリング」が癌分類をどのように向上させているかを例示している。van't Veer et al
.は、外科的に除去された後に実施された乳房腫瘍の遺伝子発現プロファイリングの結果
を使用して、どの患者が臨床的転移(他の部位への腫瘍の広がり。そこで2次的な腫瘍が発
生する)を持つようになるのかを予測することができることを示している。個々の乳癌患
者に対する治療法は、腫瘍の広がりの程度(腫瘍サイズを決定することを含む)、癌細胞が
副(auxiliary)リンパ節に広がっているかどうか、どのくらいの数のリンパ節が含まれる
か、遠隔臨床転移が存在するどうかなど、さまざまな基準に従って選択される。転移の形
跡のない女性において、乳癌の治癒を目指す治療の主柱は腫瘍の除去および放射線治療で
ある。残念なことにこれらの患者の一部は後に臨床的転移を発症する。したがって、手術
後に、原発腫瘍からすでに広がっているかもしれない癌細胞の顕微的沈着に対する追加の
療法(「補助(adjuvant)」療法)が必要な女性を識別することが求められている。例えば、
Caldas andAparicio, 2002, Nature 415, p. 484およびGoldhirsch et al. 1998, J. Na
tl. CancerInst. 90, p. 1601を参照されたい。
補助療法は、例えば血流によって癌細胞に到達するエストロゲンモジュレータ、細胞傷
害性薬物などの薬剤を使用する。このような治療はしばしば有毒な副作用を有する。この
ような治療が必要かもしれない女性の識別は伝統的に、さまざまな臨床的および組織病理
学的な指標(例えば、患者の年齢、癌細胞が正常細胞に似ている程度、「腫瘍グレード(tu
mor grade)」、および癌細胞がエストロゲンレセプタを発現しているかどうか)に依拠し
てきた。しかし、これらを全て合わせてみても、これらの指標は予測因子として不十分で
ある。そのため、かなりとはいえ小さなパーセンテージの生命を救うために、手術および
放射線治療のみによって治癒したと考えられる多くの患者がその後に不必要で有毒な補助
治療を受けている。
van'tVeer et al., 2002, Nature 415, p. 530および他の研究の結果が、患者の生体
標本(例えば腫瘍)を複数の生物学的サンプルクラス(例えば補助療法が必要な乳癌と補助
療法の必要のない乳癌)に特性づけるようとする分類体系において使用され始めている。t
he Avon Foundation、MillenniumPharmaceuticals、the European Organization for Re
search andTreatment of Cancer、the National Cancer Instituteなどの企業および機
関による資金助成を受けて、このような分類体系を見い出しその妥当性を確認するための
いくつかの臨床試験が現在進行中である。例えばBranca, 2003, Science 300, p. 238を
参照されたい。
乳癌に対してはいくつかの生物学的分類体系が使用可能である。例えば Ramaswamy et
al., 2003,Nature Genetics 33, p. 49は、転移性腺癌から原発性腺癌を識別する遺伝子
発現サイン(signature)を提供している。Suet al., 2001, Cancer Research 61, p. 738
8には、大規模RNAプロファイリングおよび教師あり機械学習(supervisedmachine-learni
ng)アルゴリズムを使用して、前立腺、乳房、肺、卵巣、結腸直腸、腎臓、膵臓、膀胱/尿
管および胃食道の癌を識別するための第一世代の分子分類体系を構築することが記載され
ている。Su etal.の分子分類体系は、原発腫瘍の起源が決定されていない転移癌を診断
する際に有用である。Wilson et al., 2002, American Journal of Pathology 161は、節
陽性(node-positive)乳癌患者の生存の低減と相関したHER2/neu陽性組織の発現サイン特
性を提供している。Richeret al., 2002, The Journal of Biological Chemistry 277,
p. 5209は、プロゲステロンレセプタ-A(PR-A)を過剰発現しているヒト乳癌細胞の遺伝子
サイン、およびプロゲステロンレセプタ-B(PR-B)を過剰発現しているヒト乳癌細胞の遺伝
子サインを提供している。Richer et al., 2002によって指摘されているとおり、これら
のPRアイソフォーム(isoform)のどちらか一方の過剰は、これらの2つのPRアイソフォーム
の等モル濃度を有する腫瘍とは異なる予後兆候およびホルモン応答プロファイルを有する
腫瘍を生じることがある。Gruvberger et al., 2001, Cancer Research 61, p. 5979は、
エストロゲンレセプタの状態に基づいて腫瘍を識別することができる、DNAマイクロアレ
イデータに基づく分子分類を提供している。
以上に概説した生物学的分類体系は、乳癌に対して使用可能な多くの生物学的分類体系
の一部に過ぎない。また、乳癌は、関心の多くの生物学的分類の1つを表すに過ぎない。
他の代表的な生物学的分類には癌一般の診断が含まれ、より一般的には病気の診断が含ま
れる。これらの生物学的分類体系の1つの課題は、これらの体系がそれぞれ、専用の入力(
例えば形式化されたマイクロアレイデータ)を必要とすることである。したがって、生体
標本を特性づける際には、それぞれの生物学的分類体系の専用の入力および出力を解読し
なければならない。このような障害のため、一般に医療専門家は、このような生物学的分
類体系のうちの限られた一部を使用するだけにとどまっている。
したがって、以上の背景を考慮すると、当技術分野において求められているのは、標本
を生物学的クラスに分類する目的に使用可能な生物学的分類体系を構築するための改良さ
れた方法である。
本明細書におけるある参考文献の議論または引用をもって、その参考文献が本発明の先
行技術であることを本明細書が認めたものと解釈してはならない。
本発明の第1の実施形態は、中央処理装置とこの中央処理装置に結合されたメモリとを
有するコンピュータを提供する。このメモリは、データを受け取るための命令を記憶して
おり、このデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で
測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む。
このメモリはさらに、複数のモデルのうちのある1つのモデルを演算するための命令を記
憶しており、このモデルは、前記試験生物内または前記試験生体標本内の生物学的特徴の
存在の有無を表すモデルスコアによって特性づけられる。このモデルの演算は、前記複数
の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記モデ
ルスコアを決定することを含む。このメモリはさらに、演算するための前記命令を1回ま
たは数回繰り返すための命令を記憶しており、それによって前記複数のモデルが演算され
る。このメモリにはさらに、演算されたそれぞれの前記モデルスコアを通信するための命
令が記憶されている。
いくつかの実施形態では、通信するための前記命令によって2つ以上のモデルスコアが
通信され、これらの2つ以上のモデルスコアのうちのそれぞれのモデルスコアが前記複数
のモデルのうちの異なるモデルに対応する。いくつかの実施形態では、通信するための前
記命令によって5つ以上のモデルスコアが通信され、これらの5つ以上のモデルスコアのう
ちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに対応する。
いくつかの実施形態では、データを受け取るための前記命令が、前記データをリモート
コンピュータから、インターネットなどのワイドエリアネットワークを介して受け取るた
めの命令を含む。いくつかの実施形態では、通信するための前記命令が、それぞれの前記
モデルスコアをリモートコンピュータに、インターネットなどのワイドエリアネットワー
クを介して伝送するための命令を含む。
いくつかの実施形態では、前記試験生物または前記試験生体標本が、前記モデルスコア
が第1の値範囲にあるときに、前記複数のモデルのうちのある1つのモデルによって表され
る前記生物学的特徴を持つとみなされ、前記モデルスコアが第2の値範囲にあるときに、
前記モデルによって表される前記生物学的特徴を持たないとみなされる。いくつかの実施
形態では、前記生物学的特徴が、癌(例えば乳癌、肺癌、前立腺癌、結腸直腸癌、卵巣癌
、膀胱癌、胃癌、直腸癌など)などの病気である。
いくつかの実施形態では、前記複数のモデルが、第1のモデルスコアによって特性づけ
られる第1のモデルと、第2のモデルスコアによって特性づけられる第2のモデルとを含み
、前記第1のモデルスコアを演算するためにその1つまたは複数の特性が使用される細胞成
分の識別が、前記第2のモデルスコアを演算するためにその1つまたは複数の特性が使用さ
れる細胞成分の識別とは異なる。
いくつかの実施形態では、前記複数のモデルのうちのある1つのモデルの前記モデルス
コアを決定するために使用される1つまたは複数の細胞成分の前記1つまたは複数の特性の
うちの1つの特性が、前記種の前記試験生物内または前記種の生物の前記試験生体標本内
の前記1つまたは複数の細胞成分の存在量を含む。いくつかの事例では、前記種がヒトで
ある。いくつかの事例では、前記試験生体標本が、腫瘍、血液、骨、乳房、肺、前立腺、
結腸直腸、卵巣、膀胱、胃または直腸の生検材料または他の形態の試料である。
いくつかの実施形態では、前記1つまたは複数の特性が細胞成分存在量を含み、前記デ
ータが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内の少なく
とも100個、少なくとも500個、少なくとも5,000個、または1,000から20,000個の細胞成分
の細胞成分存在量を含む。いくつかの実施形態では、前記複数の細胞成分のうちの1つの
細胞成分がmRNA、cRNAまたはcDNAである。
本発明のいくつかの実施形態では、前記1つまたは複数の細胞成分のうちの1つの細胞成
分が核酸またはリボ核酸であり、前記細胞成分の前記1つまたは複数の特性のうちの1つの
特性が、前記試験生物内または前記試験生体標本内の前記細胞成分の全部または一部の転
写状態を測定することによって得られる。いくつかの実施形態では、前記1つまたは複数
の細胞成分のうちの1つの細胞成分がタンパク質であり、前記細胞成分の前記1つまたは複
数の特性のうちの1つの特性が、前記試験生物内または前記試験生体標本内の前記細胞成
分の翻訳状態を測定することによって得られる。いくつかの実施形態では、前記複数の細
胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試
験生物から得られた試料または前記試験生体標本を使用した前記細胞成分の同位体コード
付け親和性標識付けおよびその後のタンデム質量分析を使用して決定される。いくつかの
実施形態では、前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性の
うちの1つの特性が、前記試験生物から得られた試料内または前記試験生体標本内の前記
細胞成分の活性または翻訳後修飾を測定することによって決定される。
いくつかの実施形態では、前記生物学的特徴が薬物に対する感受性である。いくつかの
実施形態では、演算するための前記命令の事例によってそれらのモデルスコアが演算され
る前記複数のモデルが集合的に、2つ以上のそれぞれの生物学的特徴の存在の有無を表す
。いくつかの実施形態では、前記2つ以上の生物学的特徴のうちのそれぞれの生物学的特
徴が癌の起源である。いくつかの実施形態では、前記2つ以上の生物学的特徴が第1の病気
および第2の病気を含む。
いくつかの実施形態では、演算するための前記命令の事例によってそれらのモデルスコ
アが演算される前記複数のモデルが集合的に、5つ以上のそれぞれの生物学的特徴の存在
の有無を表す。いくつかの事例では、前記5つ以上の生物学的特徴がそれぞれ、異なる癌
起源を表す。いくつかの事例では、前記5つ以上の生物学的特徴が第1の病気および第2の
病気を含む。
いくつかの実施形態では、演算するための前記命令の事例によってそれらのモデルスコ
アが演算される前記複数のモデルが集合的に、2つから20個の生物学的特徴の存在の有無
を表す。いくつかの実施形態では、前記2つから20個の生物学的特徴のうちのそれぞれの
生物学的特徴が癌の起源である。いくつかの実施形態では、前記2つから20個の生物学的
特徴が第1の病気および第2の病気を含む。
本発明の他の態様は、中央処理装置とこの中央処理装置に結合されたメモリとを有する
コンピュータを含む。このメモリは、データを受け取るための命令を記憶しており、この
データは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された
複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む。このメモリ
はさらに、(ii)複数のモデルを演算するための命令を記憶しており、前記複数のモデルの
うちのそれぞれのモデルは、前記試験生物内または前記試験生体標本内の生物学的特徴の
存在の有無を表すモデルスコアによって特性づけられる。前記複数のモデルのうちのそれ
ぞれのモデルの演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまた
は複数の特性を使用して前記それぞれのモデルに関連した前記モデルスコアを決定するこ
とを含む。このメモリはさらに、演算するための前記命令の事例において演算されたそれ
ぞれのモデルスコアを通信するための命令を記憶している。
本発明の他の態様は、コンピュータシステムとともに使用されるコンピュータプログラ
ム製品を含む。このコンピュータプログラム製品は、コンピュータ可読記憶媒体と、その
中に埋め込まれたコンピュータプログラム機構とを含む。このコンピュータプログラム機
構はデータを受け取るための命令を含む。このデータは、ある1つの種の試験生物内また
は前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成
分の1つまたは複数の特性を含む。このコンピュータプログラム機構はさらに、複数のモ
デルのうちのある1つのモデルを演算するための命令を含む。このモデルは、前記試験生
物内または前記試験生体標本内の生物学的特徴の存在の有無を表すモデルスコアによって
特性づけられ、このモデルの演算は、前記複数の細胞成分のうちの1つまたは複数の細胞
成分の1つまたは複数の特性を使用して前記モデルスコアを決定することを含む。このコ
ンピュータプログラム製品はさらに、演算するための前記命令を1回または数回繰り返す
ための命令を含み、それによって前記複数のモデルが演算される。このコンピュータプロ
グラム製品はさらに、演算するための前記命令の事例において演算されたそれぞれのモデ
ルスコアを通信するための命令を含む。
本発明の他の態様は、コンピュータシステムとともに使用されるコンピュータプログラ
ム製品を含む。このコンピュータプログラム製品は、コンピュータ可読記憶媒体と、その
中に埋め込まれたコンピュータプログラム機構とを含む。このコンピュータプログラム機
構はデータを受け取るための命令を含む。このデータは、ある1つの種の試験生物内また
は前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成
分の1つまたは複数の特性を含む。このコンピュータプログラム機構はさらに、複数のモ
デルを演算するための命令を含む。前記複数のモデルのうちのそれぞれのモデルは、前記
試験生物内または前記試験生体標本内の生物学的特徴の存在の有無を表すモデルスコアに
よって特性づけられ、前記複数のモデルのうちのそれぞれのモデルの演算は、前記複数の
細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記それぞ
れのモデルに関連した前記モデルスコアを決定することを含む。このコンピュータプログ
ラム機構はさらに、演算するための前記命令の事例において演算されたそれぞれのモデル
スコアを通信するための命令を含む。
本発明の他の態様は、データが得られる方法を含む。このデータは、ある1つの種の試
験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれ
ぞれの細胞成分の1つまたは複数の特性を含む。この方法はさらに、複数のモデルのうち
のある1つのモデルを演算するステップを含む。このモデルは、前記試験生物内または前
記試験生体標本内の生物学的特徴の存在の有無を表すモデルスコアによって特性づけられ
る。前記モデルの演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つま
たは複数の特性を使用して前記モデルスコアを決定することを含む。この方法はさらに、
前記演算を1回または数回繰り返すステップであって、それによって前記複数のモデルを
演算するステップを含む。この方法はさらに、前記演算の事例において演算されたそれぞ
れのモデルスコアを通信するステップを含む。
本発明の他の態様はデータを受け取るステップを含む。このデータは、ある1つの種の
試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそ
れぞれの細胞成分の1つまたは複数の特性を含む。複数のモデルが演算される。前記複数
のモデルのうちのそれぞれのモデルは、前記試験生物内または前記試験生体標本内の生物
学的特徴の存在の有無を表すモデルスコアによって特性づけられ、前記複数のモデルのう
ちのそれぞれのモデルの演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分
の1つまたは複数の特性を使用して前記それぞれのモデルに関連した前記モデルスコアを
決定することを含む。次いで、演算の事例において演算されたそれぞれのモデルスコアが
通信される。
本発明の他の態様は、中央処理装置とこの中央処理装置に結合されたメモリとを有する
コンピュータを提供する。このメモリは、データを送るための命令を記憶している。この
データは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された
複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む。このメモリ
はさらに、複数のモデルスコアを受け取るための命令を記憶している。それぞれのモデル
スコアは複数のモデルのうちの1つのモデルに対応する。前記複数のモデルのうちのそれ
ぞれのモデルは、前記試験生物内または前記試験生体標本内の生物学的特徴の存在の有無
を表すモデルスコアによって特性づけられ、前記モデルの演算は、前記複数の細胞成分の
うちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決
定することを含む。
本発明の他の態様は、中央処理装置とこの中央処理装置に結合されたメモリとを有する
コンピュータを提供する。このメモリはデータを受け取るために命令を記憶しており、こ
のデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定され
た複数の細胞成分のうちのそれぞれの細胞成分の生物学的状態の1つまたは複数の態様を
含む。このメモリはさらに、複数のモデルのうちのある1つのモデルを演算するための命
令を記憶している。演算するための前記命令は、前記種の前記試験生物または前記種の前
記生物の前記試験生体標本が生物学的サンプルクラスのメンバであるかどうかを指示する
前記モデルのモデル特性付けを生み出す。前記モデルを演算するための前記命令は、前記
複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態の1つまたは複数の態様
を使用して前記モデルを特性づけることを含む。このメモリはさらに、演算するための前
記命令を1回または数回繰り返すための命令を記憶しており、それによって前記複数のモ
デルが演算される。このメモリはさらに、演算するための前記命令の事例において演算さ
れたそれぞれのモデル特性付けを通信するための命令を記憶している。いくつかの実施形
態では、データを受け取るための前記命令が、前記データをリモートコンピュータから、
インターネットなどのワイドエリアネットワークを介して受け取るための命令を含む。い
くつかの実施形態では、前記生物学的サンプルクラスが癌などの病気である。
本発明の他の態様は、中央処理装置とこの中央処理装置に結合されたメモリとを有する
コンピュータを提供する。このメモリはデータを受け取るための命令を記憶している。こ
のデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定され
た複数の細胞成分のうちのそれぞれの細胞成分の生物学的状態の1つまたは複数の態様を
含む。このメモリはさらに、複数のモデルを演算するための命令を記憶している。この演
算は、前記種の前記試験生物または前記種の前記生物の前記試験生体標本が生物学的サン
プルクラスのメンバであるかどうかを指示する前記複数のモデルのうちのそれぞれのモデ
ルのモデル特性付けを生み出す。前記演算は、前記複数の細胞成分のうちの1つまたは複
数の細胞成分の生物学的状態の1つまたは複数の態様を使用して前記複数のモデルのうち
のそれぞれのモデルを特性づけることを含む。このメモリはさらに、演算するための前記
命令によって演算されたそれぞれのモデル特性付けを通信するための命令を記憶している
本発明の他の態様は、コンピュータシステムとともに使用されるコンピュータプログラ
ム製品を提供する。このコンピュータプログラム製品は、コンピュータ可読記憶媒体と、
その中に埋め込まれたコンピュータプログラム機構とを含む。このコンピュータプログラ
ム機構はさらに、データを受け取るための命令を含む。このようなデータは、ある1つの
種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうち
のそれぞれの細胞成分の生物学的状態の1つまたは複数の態様を含む。このコンピュータ
プログラム機構はさらに、複数のモデルのうちのある1つのモデルを演算するための命令
を含む。このような演算は、前記種の前記試験生物または前記種の前記生物の前記試験生
体標本が生物学的サンプルクラスのメンバであるかどうかを指示する前記モデルのモデル
特性付けを生み出す。前記モデルの前記演算は、前記複数の細胞成分のうちの1つまたは
複数の細胞成分の生物学的状態の1つまたは複数の態様を使用して前記モデルを特性づけ
ることを含む。このコンピュータプログラム機構はさらに、演算するための前記命令を1
回または数回繰り返すための命令であって、それによって前記複数のモデルを演算する命
令を含む。このコンピュータプログラム機構はさらに、演算するための前記命令の事例に
おいて演算されたそれぞれのモデル特性付けを通信するための命令を含む。
本発明の他の態様は、コンピュータシステムとともに使用されるコンピュータプログラ
ム製品を含む。このコンピュータプログラム製品は、コンピュータ可読記憶媒体と、その
中に埋め込まれたコンピュータプログラム機構とを含む。このコンピュータプログラム機
構は、データを受け取るための命令を含む。このデータは、ある1つの種の試験生物内ま
たは前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞
成分の生物学的状態の1つまたは複数の態様を含む。このコンピュータプログラム機構は
さらに、複数のモデルを演算するための命令を含む。前記演算は、前記種の前記試験生物
または前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバであるか
どうかを指示する前記複数のモデルのうちのそれぞれのモデルのモデル特性付けを生み出
す。前記演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態
の1つまたは複数の態様を使用して前記複数のモデルのうちのそれぞれのモデルを特性づ
けることを含む。このコンピュータプログラム機構はさらに、演算するための前記命令に
よって演算されたそれぞれのモデル特性付けを通信するための命令を含む。
本発明の他の態様は、データを受け取るステップを含む方法を提供する。このようなデ
ータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複
数の細胞成分のうちのそれぞれの細胞成分の生物学的状態の1つまたは複数の態様を含む
。複数のモデルのうちのある1つのモデルが演算される。前記演算は、前記種の前記試験
生物または前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバであ
るかどうかを指示する前記モデルのモデル特性付けを生み出す。前記モデルの前記演算は
、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態の1つまたは複数
の態様を使用して前記モデルを特性づけることを含む。前記演算は1回または数回繰り返
され、それによって前記複数のモデルが演算される。次いで、前記演算の事例において演
算されたそれぞれの前記モデル特性付けが通信される。
本発明の他の態様は、データを受け取るステップを含む。このデータは、ある1つの種
の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちの
それぞれの細胞成分の生物学的状態の1つまたは複数の態様を含む。複数のモデルが演算
される。このような演算は、前記種の前記試験生物または前記種の前記生物の前記試験生
体標本が生物学的サンプルクラスのメンバであるかどうかを指示する前記複数のモデルの
うちのそれぞれのモデルのモデル特性付けを生み出す。前記演算は、前記複数の細胞成分
のうちの1つまたは複数の細胞成分の生物学的状態の1つまたは複数の態様を使用して前記
複数のモデルのうちのそれぞれのモデルを特性づける。演算されたそれぞれのモデル特性
付けは通信される。
例えば、本願発明は以下の項目を提供する。
(項目1)
中央処理装置と、
前記中央処理装置に結合されたメモリと
を備え、前記メモリが、
(i)データを受け取るための命令であって、前記データが、ある1つの種の試験生物内
または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細
胞成分の1つまたは複数の特性を含む命令と、
(ii)複数のモデルのうちのある1つのモデルを演算するための命令であって、前記モ
デルが、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表すモデル
スコアによって特性づけられ、前記モデルの前記演算が、前記複数の細胞成分のうちの1
つまたは複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定する
ことを含む命令と、
(iii)演算するための前記命令を1回または数回繰り返すための命令であって、それに
よって前記複数のモデルを演算する命令と、
(iv)演算するための前記命令の事例において演算されたそれぞれの前記モデルスコア
を通信するための命令と
を記憶した
コンピュータ。
(項目2)
通信するための前記命令によって2つ以上のモデルスコアが通信され、前記2つ以上のモ
デルスコアのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに
対応する、項目1に記載のコンピュータ。
(項目3)
通信するための前記命令によって5つ以上のモデルスコアが通信され、前記5つ以上のモ
デルスコアのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに
対応する、項目1に記載のコンピュータ。
(項目4)
データを受け取るための前記命令が、前記データをリモートコンピュータからワイドエ
リアネットワークを介して受け取るための命令を含む、項目1に記載のコンピュータ。
(項目5)
前記ワイドエリアネットワークがインターネットである、項目4に記載のコンピュータ。
(項目6)
通信するための前記命令が、それぞれの前記モデルスコアをリモートコンピュータにワ
イドエリアネットワークを介して伝送するための命令を含む、項目1に記載のコンピュータ。
(項目7)
前記ワイドエリアネットワークがインターネットである、項目6に記載のコンピュータ。
(項目8)
前記試験生物または前記試験生体標本は、前記モデルスコアが第1の値範囲にあるときに、前記複数のモデルのうちのある1つのモデルによって表される前記生物学的特徴を持
つとみなされ、
前記試験生物または前記試験生体標本は、前記モデルスコアが第2の値範囲にあるときに、前記モデルによって表される前記生物学的特徴を持たないとみなされる、
項目1に記載のコンピュータ。
(項目9)
前記生物学的特徴が病気である、項目1に記載のコンピュータ。
(項目10)
前記病気が癌である、項目9に記載のコンピュータ。
(項目11)
前記病気が、乳癌、肺癌、前立腺癌、結腸直腸癌、卵巣癌、膀胱癌、胃癌または直腸癌である、項目9に記載のコンピュータ。
(項目12)
前記複数のモデルが、第1のモデルスコアによって特性づけられる第1のモデルと、第2のモデルスコアによって特性づけられる第2のモデルとを含み、
前記第1のモデルスコアを演算するためにその1つまたは複数の特性が使用される細胞成分の識別が、前記第2のモデルスコアを演算するためにその1つまたは複数の特性が使用される細胞成分の識別とは異なる、
項目1に記載のコンピュータ。
(項目13)
前記複数のモデルのうちのある1つのモデルの前記モデルスコアを決定するために使用される1つまたは複数の細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記種の前記試験生物内または前記種の生物の前記試験生体標本内の前記1つまたは複数の細胞成分の存在量を含む、項目1に記載のコンピュータ。
(項目14)
前記種がヒトである、項目1に記載のコンピュータ。
(項目15)
前記試験生体標本が、腫瘍、血液、骨、乳房、肺、前立腺、結腸直腸、卵巣、膀胱、胃
または直腸の生検材料または他の形態の試料である、項目1に記載のコンピュータ。
(項目16)
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験
生物内または前記種の前記生物の前記試験生体標本内の少なくとも100個の細胞成分の細
胞成分存在量を含む、項目1に記載のコンピュータ。
(項目17)
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験
生物内または前記種の前記生物の前記試験生体標本内の少なくとも500個の細胞成分の細
胞成分存在量を含む、項目1に記載のコンピュータ。
(項目18)
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験
生物内または前記種の前記生物の前記試験生体標本内の少なくとも5,000個の細胞成分の
細胞成分存在量を含む、項目1に記載のコンピュータ。
(項目19)
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験
生物内または前記種の前記生物の前記試験生体標本内1,000から20,000個の細胞成分の細
胞成分存在量を含む、項目1に記載のコンピュータ。
(項目20)
前記複数の細胞成分のうちの1つの細胞成分がmRNA、cRNAまたはcDNAである、項目1に記載のコンピュータ。
(項目21)
前記1つまたは複数の細胞成分のうちの1つの細胞成分が核酸またはリボ核酸であり、前
記細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記
試験生体標本内の前記細胞成分の全部または一部の転写状態を測定することによって得ら
れる、項目1に記載のコンピュータ。
(項目22)
前記1つまたは複数の細胞成分のうちの1つの細胞成分がタンパク質であり、前記細胞成
分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記試験生体
標本内の前記細胞成分の翻訳状態を測定することによって得られる、項目1に記載のコンピュータ。
(項目23)
前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの
特性が、前記試験生物から得られた試料または前記試験生体標本を使用した前記細胞成分
の同位体コード付け親和性標識付け(isotope-coded affinity tagging)およびその後のタ
ンデム質量分析(tandem mass spectrometry analysis)を使用して決定される、項目1に記載のコンピュータ。
(項目24)
前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの
特性が、前記試験生物から得られた試料内または前記試験生体標本内の前記細胞成分の活
性または翻訳後修飾を測定することによって決定される、項目1に記載のコンピュータ。
(項目25)
前記生物学的特徴が薬物に対する感受性である、項目1に記載のコンピュータ。
(項目26)
演算するための前記命令の事例によってそれらのモデルスコアが演算される前記複数の
モデルが集合的に、2つ以上のそれぞれの生物学的特徴の可能性を表す、項目1に記載のコンピュータ。
(項目27)
前記2つ以上の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、項目26に記載のコンピュータ。
(項目28)
前記2つ以上の生物学的特徴が第1の病気および第2の病気を含む、項目26に記載のコンピュータ。
(項目29)
演算するための前記命令の事例によってそれらのモデルスコアが演算される前記複数のモデルが集合的に、5つ以上のそれぞれの生物学的特徴の可能性を表す、項目1に記載のコンピュータ。
(項目30)
前記5つ以上の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、項目29に記載のコンピュータ。
(項目31)
前記5つ以上の生物学的特徴が第1の病気および第2の病気を含む、項目29に記載のコンピュータ。
(項目32)
演算するための前記命令の事例によってそれらのモデルスコアが演算される前記複数のモデルが集合的に、2つから20個の生物学的特徴の独立した可能性を表す、項目1に記載のコンピュータ。
(項目33)
前記2つから20個の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、項目32に記載のコンピュータ。
(項目34)
前記2つから20個の生物学的特徴が第1の病気および第2の病気を含む、項目32に記載のコンピュータ。
(項目35)
中央処理装置と、
前記中央処理装置に結合されたメモリと
を備え、前記メモリが、
(i)データを受け取るための命令であって、前記データが、ある1つの種の試験生物内
または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細
胞成分の1つまたは複数の特性を含む命令と、
(ii)複数のモデルを演算するための命令であって、前記複数のモデルのうちのそれぞ
れのモデルが、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表す
モデルスコアによって特性づけられ、前記複数のモデルのうちのそれぞれのモデルの演算
が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用
して前記それぞれのモデルに関連した前記モデルスコアを決定することを含む命令と、
(iii)演算するための前記命令によって演算されたそれぞれの前記モデルスコアを通
信するための命令と
を記憶した
コンピュータ。
(項目36)
コンピュータシステムとともに使用されるコンピュータプログラム製品であって、コン
ピュータ可読記憶媒体と、その中に埋め込まれたコンピュータプログラム機構とを含み、
前記コンピュータプログラム機構が、
(i)データを受け取るための命令であって、前記データが、ある1つの種の試験生物内
または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細
胞成分の1つまたは複数の特性を含む命令と、
(ii)複数のモデルのうちのある1つのモデルを演算するための命令であって、前記モ
デルが、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表すモデル
スコアによって特性づけられ、前記モデルの前記演算が、前記複数の細胞成分のうちの1
つまたは複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定する
ことを含む命令と、
(iii)演算するための前記命令を1回または数回繰り返すための命令であって、それに
よって前記複数のモデルを演算する命令と、
(iv)演算するための前記命令の事例において演算されたそれぞれの前記モデルスコア
を通信するための命令と
を含む
コンピュータプログラム製品。
(項目37)
通信するための前記命令によって2つ以上のモデルスコアが通信され、前記2つ以上のモ
デルスコアのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに
対応する、項目36に記載のコンピュータプログラム製品。
(項目38)
通信するための前記命令によって5つ以上のモデルスコアが通信され、前記5つ以上のモ
デルスコアのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに
対応する、項目36に記載のコンピュータプログラム製品。
(項目39)
前記試験生物または前記試験生体標本は、前記モデルスコアが第1の値範囲にあるとき
に、前記複数のモデルのうちのある1つのモデルによって表される前記生物学的特徴を持
つとみなされ、
前記試験生物または前記試験生体標本は、前記モデルスコアが第2の値範囲にあるとき
に、前記モデルによって表される前記生物学的特徴を持たないとみなされる、
項目36に記載のコンピュータプログラム製品。
(項目40)
前記生物学的特徴が病気である、項目36に記載のコンピュータプログラム製品。
(項目41)
前記病気が癌である、項目40に記載のコンピュータプログラム製品。
(項目42)
前記病気が、乳癌、肺癌、前立腺癌、結腸直腸癌、卵巣癌、膀胱癌、胃癌または直腸癌
である、項目40に記載のコンピュータプログラム製品。
(項目43)
前記複数のモデルが、第1のモデルスコアによって特性づけられる第1のモデルと、第2
のモデルスコアによって特性づけられる第2のモデルとを含み、
前記第1のモデルスコアを演算するためにその1つまたは複数の特性が使用される細胞成
分の識別が、前記第2のモデルスコアを演算するためにその1つまたは複数の特性が使用さ
れる細胞成分の識別とは異なる、
項目36に記載のコンピュータプログラム製品。
(項目44)
前記複数のモデルのうちのある1つのモデルの前記モデルスコアを決定するために使用
される1つまたは複数の細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記
種の前記試験生物内または前記種の生物の前記試験生体標本内の前記1つまたは複数の細
胞成分の存在量を含む、項目36に記載のコンピュータプログラム製品。
(項目45)
前記種がヒトである、項目36に記載のコンピュータプログラム製品。
(項目46)
前記試験生体標本が、腫瘍、血液、骨、乳房、肺、前立腺、結腸直腸、卵巣、膀胱、胃
または直腸の生検材料または他の形態の試料である、項目36に記載のコンピュータプロ
グラム製品。
(項目47)
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験
生物内または前記種の前記生物の前記試験生体標本内の少なくとも100個の細胞成分の細
胞成分存在量を含む、項目36に記載のコンピュータプログラム製品。
(項目48)
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験
生物内または前記種の前記生物の前記試験生体標本内の少なくとも500個の細胞成分の細
胞成分存在量を含む、項目36に記載のコンピュータプログラム製品。
(項目49)
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験
生物内または前記種の前記生物の前記試験生体標本内の少なくとも5,000個の細胞成分の
細胞成分存在量を含む、項目36に記載のコンピュータプログラム製品。
(項目50)
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験
生物内または前記種の前記生物の前記試験生体標本内1,000から20,000個の細胞成分の細
胞成分存在量を含む、項目36に記載のコンピュータプログラム製品。
(項目51)
前記複数の細胞成分のうちの1つの細胞成分がmRNA、cRNAまたはcDNAである、項目36
に記載のコンピュータプログラム製品。
(項目52)
前記1つまたは複数の細胞成分のうちの1つの細胞成分が核酸またはリボ核酸であり、前
記細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記
試験生体標本内の前記細胞成分の全部または一部の転写状態を測定することによって得ら
れる、項目36に記載のコンピュータプログラム製品。
(項目53)
前記1つまたは複数の細胞成分のうちの1つの細胞成分がタンパク質であり、前記細胞成
分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記試験生体
標本内の前記細胞成分の翻訳状態を測定することによって得られる、項目36に記載のコ
ンピュータプログラム製品。
(項目54)
前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの
特性が、前記試験生物から得られた試料または前記試験生体標本を使用した前記細胞成分
の同位体コード付け親和性標識付けおよびその後のタンデム質量分析を使用して決定され
る、項目36に記載のコンピュータプログラム製品。
(項目55)
前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの
特性が、前記試験生物から得られた試料内または前記試験生体標本内の前記細胞成分の活
性または翻訳後修飾を測定することによって決定される、項目36に記載のコンピュータ
プログラム製品。
(項目56)
前記生物学的特徴が薬物に対する感受性である、項目36に記載のコンピュータプログ
ラム製品。
(項目57)
コンピュータシステムとともに使用されるコンピュータプログラム製品であって、コン
ピュータ可読記憶媒体と、その中に埋め込まれたコンピュータプログラム機構とを含み、
前記コンピュータプログラム機構が、
(i)データを受け取るための命令であって、前記データが、ある1つの種の試験生物内
または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細
胞成分の1つまたは複数の特性を含む命令と、
(ii)複数のモデルを演算するための命令であって、前記複数のモデルのうちのそれぞ
れのモデルが、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表す
モデルスコアによって特性づけられ、前記複数のモデルのうちのそれぞれのモデルの演算
が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用
して前記それぞれのモデルに関連した前記モデルスコアを決定することを含む命令と、
(iii)演算するための前記命令の事例において演算されたそれぞれの前記モデルスコ
アを通信するための命令と
を含む
コンピュータプログラム製品。
(項目58)
データを受け取るステップであって、前記データが、ある1つの種の試験生物内または
前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分
の1つまたは複数の特性を含むステップと、
複数のモデルのうちのある1つのモデルを演算するステップであって、前記モデルが、
前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表すモデルスコアに
よって特性づけられ、前記モデルの前記演算が、前記複数の細胞成分のうちの1つまたは
複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定することを含
むステップと、
前記演算を1回または数回繰り返すステップであって、それによって前記複数のモデル
を演算するステップと、
前記演算の事例において演算されたそれぞれの前記モデルスコアを通信するステップと
を含む方法。
(項目59)
前記通信ステップによって2つ以上のモデルスコアが通信され、前記2つ以上のモデルス
コアのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに対応す
る、項目58に記載の方法。
(項目60)
前記通信ステップによって5つ以上のモデルスコアが通信され、前記5つ以上のモデルス
コアのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに対応す
る、項目58に記載の方法。
(項目61)
前記試験生物または前記試験生体標本は、前記モデルスコアが第1の値範囲にあるとき
に、前記複数のモデルのうちのある1つのモデルによって表される前記生物学的特徴を持
つとみなされ、
前記試験生物または前記試験生体標本は、前記モデルスコアが第2の値範囲にあるとき
に、前記モデルによって表される前記生物学的特徴を持たないとみなされる、
項目58に記載の方法。
(項目62)
前記生物学的特徴が病気である、項目58に記載の方法。
(項目63)
前記病気が癌である、項目62に記載の方法。
(項目64)
前記病気が、乳癌、肺癌、前立腺癌、結腸直腸癌、卵巣癌、膀胱癌、胃癌または直腸癌
である、項目62に記載の方法。
(項目65)
前記複数のモデルが、第1のモデルスコアによって特性づけられる第1のモデルと、第2
のモデルスコアによって特性づけられる第2のモデルとを含み、
前記第1のモデルスコアを演算するためにその1つまたは複数の特性が使用される細胞成
分の識別が、前記第2のモデルスコアを演算するためにその1つまたは複数の特性が使用さ
れる細胞成分の識別とは異なる、
項目58に記載の方法。
(項目66)
前記複数のモデルのうちのある1つのモデルの前記モデルスコアを決定するために使用
される1つまたは複数の細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記
種の前記試験生物内または前記種の生物の前記試験生体標本内の前記1つまたは複数の細
胞成分の存在量を含む、項目58に記載の方法。
(項目67)
前記種がヒトである、項目58に記載の方法。
(項目68)
前記試験生体標本が、腫瘍、血液、骨、乳房、肺、前立腺、結腸直腸、卵巣、膀胱、胃
または直腸からの生検材料または他の形態の試料である、項目58に記載の方法。
(項目69)
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験
生物内または前記種の前記生物の前記試験生体標本内の少なくとも100個の細胞成分の細
胞成分存在量を含む、項目58に記載の方法。
(項目70)
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験
生物内または前記種の前記生物の前記試験生体標本内の少なくとも500個の細胞成分の細
胞成分存在量を含む、項目58に記載の方法。
(項目71)
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験
生物内または前記種の前記生物の前記試験生体標本内の少なくとも5,000個の細胞成分の
細胞成分存在量を含む、項目58に記載の方法。
(項目72)
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験
生物内または前記種の前記生物の前記試験生体標本内1,000から20,000個の細胞成分の細
胞成分存在量を含む、項目58に記載の方法。
(項目73)
前記複数の細胞成分のうちの1つの細胞成分がmRNA、cRNAまたはcDNAである、項目58
に記載の方法。
(項目74)
前記1つまたは複数の細胞成分のうちの1つの細胞成分が核酸またはリボ核酸であり、前
記細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記
試験生体標本内の前記細胞成分の全部または一部の転写状態を測定することによって得ら
れる、項目58に記載の方法。
(項目75)
前記1つまたは複数の細胞成分のうちの1つの細胞成分がタンパク質であり、前記細胞成
分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記試験生体
標本内の前記細胞成分の翻訳状態を測定することによって得られる、項目58に記載の方
法。
(項目76)
前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの
特性が、前記試験生物から得られた試料または前記試験生体標本を使用した前記細胞成分
の同位体コード付け親和性標識付けおよびその後のタンデム質量分析を使用して決定され
る、項目58に記載の方法。
(項目77)
前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの
特性が、前記試験生物から得られた試料内または前記試験生体標本内の前記細胞成分の活
性または翻訳後修飾を測定することによって決定される、項目58に記載の方法。
(項目78)
前記生物学的特徴が薬物に対する感受性である、項目58に記載の方法。
(項目79)
前記演算の事例によってそれらのモデルスコアが演算される前記複数のモデルが集合的
に、2つ以上のそれぞれの生物学的特徴の可能性を表す、項目58に記載の方法。
(項目80)
前記2つ以上の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、項目79に記載の方法。
(項目81)
前記2つ以上の生物学的特徴が第1の病気および第2の病気を含む、項目79に記載の方
法。
(項目82)
前記演算の事例によってそれらのモデルスコアが演算される前記複数のモデルが集合的
に、5つ以上のそれぞれの生物学的特徴の可能性を表す、項目58に記載の方法。
(項目83)
前記5つ以上の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、項目82に記載の方法。
(項目84)
前記5つ以上の生物学的特徴が第1の病気および第2の病気を含む、項目82に記載の方
法。
(項目85)
前記演算の事例によってそれらのモデルスコアが演算される前記複数のモデルが集合的
に、2つから20個の生物学的特徴の独立した可能性を表す、項目58に記載の方法。
(項目86)
前記2つから20個の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、項目85に記載の方法。
(項目87)
前記2つから20個の生物学的特徴が第1の病気および第2の病気を含む、項目85に記載の方法。
(項目88)
データを受け取るステップであって、前記データが、ある1つの種の試験生物内または
前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分
の1つまたは複数の特性を含むステップと、
複数のモデルを演算するステップであって、前記複数のモデルのうちのそれぞれのモデ
ルが、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表すモデルス
コアによって特性づけられ、前記複数のモデルのうちのそれぞれのモデルの演算が、前記
複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記
それぞれのモデルに関連した前記モデルスコアを決定することを含むステップと、
前記演算の事例において演算されたそれぞれの前記モデルスコアを通信するステップと
を含む方法。
(項目89)
中央処理装置と、
前記中央処理装置に結合されたメモリと
を備え、前記メモリが、
(i)データを送るための命令であって、前記データが、ある1つの種の試験生物内また
は前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成
分の1つまたは複数の特性を含む命令と、
(ii)複数のモデルスコアを受け取るための命令であって、それぞれのモデルスコアが
複数のモデルのうちの1つのモデルに対応し、前記複数のモデルのうちのそれぞれのモデ
ルが、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表すモデルス
コアによって特性づけられ、前記モデルの前記演算が、前記複数の細胞成分のうちの1つ
または複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定するこ
とを含む命令と
を記憶した
コンピュータ。
(項目90)
前記複数のモデルスコアが2つ以上のモデルスコアからなり、前記2つ以上のモデルスコ
アのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに対応する
、項目89に記載のコンピュータ。
(項目91)
前記複数のモデルスコアが5つ以上のモデルスコアからなり、前記5つ以上のモデルスコ
アのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに対応する
、項目89に記載のコンピュータ。
(項目92)
データを送るための前記命令が、前記データをリモートコンピュータへワイドエリアネ
ットワークを介して送るための命令を含む、項目89に記載のコンピュータ。
(項目93)
前記ワイドエリアネットワークがインターネットである、項目92に記載のコンピュータ。
(項目94)
受け取るための前記命令が、前記複数のモデルスコアをリモートコンピュータからワイ
ドエリアネットワークを介して受け取るための命令を含む、項目89に記載のコンピュータ。
(項目95)
前記ワイドエリアネットワークがインターネットである、項目94に記載のコンピュータ。
(項目96)
前記試験生物または前記試験生体標本は、前記モデルスコアが第1の値範囲にあるとき
に、前記複数のモデルのうちのある1つのモデルによって表される前記生物学的特徴を持
つとみなされ、
前記試験生物または前記試験生体標本は、前記モデルスコアが第2の値範囲にあるとき
に、前記モデルによって表される前記生物学的特徴を持たないとみなされる、
項目89に記載のコンピュータ。
(項目97)
前記生物学的特徴が病気である、項目89に記載のコンピュータ。
(項目98)
前記病気が癌である、項目97に記載のコンピュータ。
(項目99)
前記病気が、乳癌、肺癌、前立腺癌、結腸直腸癌、卵巣癌、膀胱癌、胃癌または直腸癌
である、項目97に記載のコンピュータ。
(項目100)
前記複数のモデルが、第1のモデルスコアによって特性づけられる第1のモデルと、第2
のモデルスコアによって特性づけられる第2のモデルとを含み、
前記第1のモデルスコアを演算するためにその1つまたは複数の特性が使用される細胞成
分の識別が、前記第2のモデルスコアを演算するためにその1つまたは複数の特性が使用さ
れる細胞成分の識別とは異なる、
項目89に記載のコンピュータ。
(項目101)
前記複数のモデルのうちのある1つのモデルの前記モデルスコアを決定するために使用
される1つまたは複数の細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記
種の前記試験生物内または前記種の生物の前記試験生体標本内の前記1つまたは複数の細
胞成分の存在量を含む、項目89に記載のコンピュータ。
(項目102)
前記種がヒトである、項目89に記載のコンピュータ。
(項目103)
前記試験生体標本が、腫瘍、血液、骨、乳房、肺、前立腺、結腸直腸、卵巣、膀胱、胃または直腸からの生検材料または他の形態の試料である、項目89に記載のコンピュータ。
(項目104)
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験
生物内または前記種の前記生物の前記試験生体標本内の少なくとも100個の細胞成分の細
胞成分存在量を含む、項目89に記載のコンピュータ。
(項目105)
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験
生物内または前記種の前記生物の前記試験生体標本内の少なくとも500個の細胞成分の細
胞成分存在量を含む、項目89に記載のコンピュータ。
(項目106)
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験
生物内または前記種の前記生物の前記試験生体標本内の少なくとも5,000個の細胞成分の
細胞成分存在量を含む、項目89に記載のコンピュータ。
(項目107)
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験
生物内または前記種の前記生物の前記試験生体標本内1,000から20,000個の細胞成分の細
胞成分存在量を含む、項目89に記載のコンピュータ。
(項目108)
前記複数の細胞成分のうちの1つの細胞成分がmRNA、cRNAまたはcDNAである、項目89に記載のコンピュータ。
(項目109)
前記1つまたは複数の細胞成分のうちの1つの細胞成分が核酸またはリボ核酸であり、前
記細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記
試験生体標本内の前記細胞成分の全部または一部の転写状態を測定することによって得ら
れる、項目89に記載のコンピュータ。
(項目110)
前記1つまたは複数の細胞成分のうちの1つの細胞成分がタンパク質であり、前記細胞成
分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記試験生体
標本内の前記細胞成分の翻訳状態を測定することによって得られる、項目89に記載のコンピュータ。
(項目111)
前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの
特性が、前記試験生物から得られた試料または前記試験生体標本を使用した前記細胞成分
の同位体コード付け親和性標識付けおよびその後のタンデム質量分析を使用して決定され
る、項目89に記載のコンピュータ。
(項目112)
前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの
特性が、前記試験生物から得られた試料内または前記試験生体標本内の前記細胞成分の活
性または翻訳後修飾を測定することによって決定される、項目89に記載のコンピュータ。
(項目113)
前記生物学的特徴が薬物に対する感受性である、項目89に記載のコンピュータ。
(項目114)
前記複数のモデルが集合的に、2つ以上のそれぞれの生物学的特徴の可能性を表す、項目89に記載のコンピュータ。
(項目115)
前記2つ以上の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、項目114に記載のコンピュータ。
(項目116)
前記2つ以上の生物学的特徴が第1の病気および第2の病気を含む、項目114に記載のコンピュータ。
(項目117)
前記複数のモデルが集合的に、5つ以上のそれぞれの生物学的特徴の可能性を表す、項目89に記載のコンピュータ。
(項目118)
前記5つ以上の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、項目117に記載のコンピュータ。
(項目119)
前記5つ以上の生物学的特徴が第1の病気および第2の病気を含む、項目117に記載のコンピュータ。
(項目120)
演算するための前記命令の事例によってそれらのモデルスコアが演算される前記複数のモデルが集合的に、2つから20個の生物学的特徴の独立した可能性を表す、項目89に記載のコンピュータ。
(項目121)
前記2つから20個の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、項目120に記載のコンピュータ。
(項目122)
前記2つから20個の生物学的特徴が第1の病気および第2の病気を含む、項目120に記載のコンピュータ。
(項目123)
コンピュータシステムとともに使用されるコンピュータプログラム製品であって、コン
ピュータ可読記憶媒体と、その中に埋め込まれたコンピュータプログラム機構とを含み、
前記コンピュータプログラム機構が、
(i)データを送るための命令であって、前記データが、ある1つの種の試験生物内また
は前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成
分の1つまたは複数の特性を含む命令と、
(ii)複数のモデルスコアを受け取るための命令であって、それぞれのモデルスコアが
複数のモデルのうちの1つのモデルに対応し、前記複数のモデルのうちのそれぞれのモデ
ルが、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表すモデルス
コアによって特性づけられ、前記モデルの前記演算が、前記複数の細胞成分のうちの1つ
または複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定するこ
とを含む命令と
を含む
コンピュータプログラム製品。
(項目124)
(i)データを送るステップであって、前記データが、ある1つの種の試験生物内または前
記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の
1つまたは複数の特性を含むステップと、
(ii)複数のモデルスコアを受け取るステップであって、それぞれのモデルスコアが複数
のモデルのうちの1つのモデルに対応し、前記複数のモデルのうちのそれぞれのモデルが
、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表すモデルスコア
によって特性づけられ、前記モデルの前記演算が、前記複数の細胞成分のうちの1つまた
は複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定することを
含むステップと
を含む方法。
(項目125)
前記生物学的特徴が療法に対する感受性または抵抗性を含む、項目58に記載の方法。
(項目126)
前記療法が薬物の投与である、項目125に記載の方法。
(項目127)
前記生物学的特徴が療法の組合せに対する感受性または抵抗性を含む、項目58に記載の方法。
(項目128)
前記療法の組合せが薬物の組合せの投与である、項目127に記載の方法。
(項目129)
前記生物学的特徴が、病気可能性または再発の転移可能性を含む、項目58に記載の方法。
(項目130)
中央処理装置と、
前記中央処理装置に結合されたメモリと
を備え、前記メモリが、
(i)データを受け取るための命令であって、前記データが、ある1つの種の試験生物内
または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細
胞成分の生物学的状態の1つまたは複数の態様を含む命令と、
(ii)複数のモデルのうちのある1つのモデルを演算するための命令であって、前記演
算が、前記種の前記試験生物または前記種の前記生物の前記試験生体標本が生物学的サン
プルクラスのメンバであるかどうかを指示する前記モデルのモデル特性付けを生み出し、
前記モデルの前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物
学的状態の1つまたは複数の態様を使用して前記モデルを特性づけることを含む命令と、
(iii)演算するための前記命令を1回または数回繰り返すための命令であって、それに
よって前記複数のモデルを演算する命令と、
(iv)演算するための前記命令の事例において演算されたそれぞれの前記モデル特性付
けを通信するための命令と
を記憶した
コンピュータ。
(項目131)
データを受け取るための前記命令が、前記データをリモートコンピュータからワイドエ
リアネットワークを介して受け取るための命令を含む、項目130に記載のコンピュータ。
(項目132)
前記ワイドエリアネットワークがインターネットである、項目131に記載のコンピュータ。
(項目133)
前記生物学的サンプルクラスが病気である、項目130に記載のコンピュータ。
(項目134)
前記病気が癌である、項目133に記載のコンピュータ。
(項目135)
中央処理装置と、
前記中央処理装置に結合されたメモリと
を備え、前記メモリが、
(i)データを受け取るための命令であって、前記データが、ある1つの種の試験生物内
または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細
胞成分の生物学的状態の1つまたは複数の態様を含む命令と、
(ii)複数のモデルを演算するための命令であって、前記演算が、前記種の前記試験生
物または前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバである
かどうかを指示する前記複数のモデルのうちのそれぞれのモデルのモデル特性付けを生み
出し、前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状
態の1つまたは複数の態様を使用して前記複数のモデルのうちのそれぞれの前記モデルを
特性づけることを含む命令と、
(iii)演算するための前記命令によって演算されたそれぞれの前記モデル特性付けを
通信するための命令と
を記憶した
コンピュータ。
(項目136)
コンピュータシステムとともに使用されるコンピュータプログラム製品であって、コン
ピュータ可読記憶媒体と、その中に埋め込まれたコンピュータプログラム機構とを含み、
前記コンピュータプログラム機構が、
(i)データを受け取るための命令であって、前記データが、ある1つの種の試験生物内
または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細
胞成分の生物学的状態の1つまたは複数の態様を含む命令と、
(ii)複数のモデルのうちのある1つのモデルを演算するための命令であって、前記演
算が、前記種の前記試験生物または前記種の前記生物の前記試験生体標本が生物学的サン
プルクラスのメンバであるかどうかを指示する前記モデルのモデル特性付けを生み出し、
前記モデルの前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物
学的状態の1つまたは複数の態様を使用して前記モデルを特性づけることを含む命令と、
(iii)演算するための前記命令を1回または数回繰り返すための命令であって、それに
よって前記複数のモデルを演算する命令と、
(iv)演算するための前記命令の事例において演算されたそれぞれの前記モデル特性付
けを通信するための命令と
を含む
コンピュータプログラム製品。
(項目137)
コンピュータシステムとともに使用されるコンピュータプログラム製品であって、コン
ピュータ可読記憶媒体と、その中に埋め込まれたコンピュータプログラム機構とを含み、
前記コンピュータプログラム機構が、
(i)データを受け取るための命令であって、前記データが、ある1つの種の試験生物内
または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細
胞成分の生物学的状態の1つまたは複数の態様を含む命令と、
(ii)複数のモデルを演算するための命令であって、前記演算が、前記種の前記試験生
物または前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバである
かどうかを指示する前記複数のモデルのうちのそれぞれのモデルのモデル特性付けを生み
出し、前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状
態の1つまたは複数の態様を使用して前記複数のモデルのうちのそれぞれの前記モデルを
特性づけることを含む命令と、
(iii)演算するための前記命令によって演算されたそれぞれの前記モデル特性付けを
通信するための命令と
を含む
コンピュータプログラム製品。
(項目138)
データを受け取るステップであって、前記データが、ある1つの種の試験生物内または
前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分
の生物学的状態の1つまたは複数の態様を含むステップと、
複数のモデルのうちのある1つのモデルを演算するステップであって、前記演算が、前
記種の前記試験生物または前記種の前記生物の前記試験生体標本が生物学的サンプルクラ
スのメンバであるかどうかを指示する前記モデルのモデル特性付けを生み出し、前記モデ
ルの前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態
の1つまたは複数の態様を使用して前記モデルを特性づけることを含むステップと、
前記演算を1回または数回繰り返すステップであって、それによって前記複数のモデル
を演算するステップと、
前記演算の事例において演算されたそれぞれの前記モデル特性付けを通信するステップ

を含む方法。
(項目139)
データを受け取るステップであって、前記データが、ある1つの種の試験生物内または
前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分
の生物学的状態の1つまたは複数の態様を含むステップと、
複数のモデルを演算するステップであって、前記演算が、前記種の前記試験生物または
前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバであるかどうか
を指示する前記複数のモデルのうちのそれぞれのモデルのモデル特性付けを生み出し、前
記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態の1つま
たは複数の態様を使用して前記複数のモデルのうちのそれぞれの前記モデルを特性づける
ことを含むステップと、
演算されたそれぞれの前記モデル特性付けを通信するステップと
を含む方法。
生体標本を分類するための本発明の一実施形態に基づくコンピュータシステムを示す図である。 複数の分類機構を使用して標本を分類するための本発明の一実施形態に基づく処理ステップを示す図である。 複数のモデル(分類機構)を記憶する本発明の一実施形態に基づくデータ構造を示す図である。 全図面を通じて同様の参照符号は同様の部分を指す。
図1は、本発明の一実施形態に従って操作されるシステム10を示す。図3は、本発明で使
用されるデータを記憶するのに有用なデータ構造を示す。図2は、複数のモデルを試験す
るために使用される本発明の一実施形態に基づく処理ステップを示す。このようなモデル
は、図2に概略的に示した処理ステップを使用して、標本が1つまたは複数の生物学的特徴
を有するかどうかを判定することができる。このセクションではこれらの図を参照して本
発明の利点および特徴を開示する。代表的な生物学的特徴はセクション5.4で開示される
システム10は、少なくとも1つのコンピュータ20(図1)を含む。コンピュータ20は、中央
処理装置22、プログラムモジュールおよびデータ構造を記憶するためのメモリ24、ユーザ
入出力装置26、通信ネットワーク(図示せず)を介してコンピュータ20をシステム10の他の
コンピュータまたはその他のコンピュータに結合するためのネットワークインタフェース
カード28、ならびにこれらのコンポーネントを相互接続する1つまたは複数のバス33を含
む標準コンポーネントを含む。ユーザ入出力装置26は、マウス36、ディスプレイ38、キー
ボード34などの1つまたは複数のユーザ入出力コンポーネントを含む。コンピュータ20は
さらに、ディスクコントローラ30によって制御されたディスク32を含む。メモリ24とディ
スク32は協力して、本発明で使用されるプログラムモジュールおよびデータ構造を記憶す
る。
メモリ24は、本発明に従って使用されるいくつかのモジュールおよびデータ構造を含む
。このシステムの動作中の任意の時点において、メモリ24に記憶されるモジュールおよび
/またはデータ構造の一部はランダムアクセスメモリに記憶され、モジュールおよび/また
はデータ構造の他の部分は不揮発性記憶装置32に記憶されることを理解されたい。一般的
な一実施形態では、メモリ24がオペレーティングシステム50を含む。オペレーティングシ
ステム50は、さまざまな基本システムサービスを処理するための手続き、およびハードウ
ェア依存タスクを実行するための手続きを含む。メモリ24はさらに、ファイル管理のため
のファイルシステム(図示せず)を含む。いくつかの実施形態ではこのファイルシステムが
オペレーティングシステム50の一コンポーネントである。
本発明に基づく例示的なコンピュータシステムの概要に続いて、次のセクション5.1で
は、本発明の一実施形態に従って使用される例示的なデータ構造の概要を示す。セクショ
ン5.2では、このような例示的なデータ構造を使用して複数のモデルを試験するための処
理ステップを詳細に説明する。セクション5.3では、本発明によって提供された結果の例
を提示する。
5.1. 例示的なデータ構造
本発明の一実施形態において使用される例示的なデータ構造を図1に示す。モデル試験
アプリケーション52はランタイムデータベース120を使用する。ランタイムデータベース1
20は、ランタイム解析スキーマ(schema)300およびランタイムモデルスキーマ200を含むよ
うにモデル化されている。これらのスキーマは、ランタイムデータベース120内の異なる
いくつかのタイプのテーブルの編成を記述する。好ましい実施形態ではデータベース120
が任意の形態のデータ記憶装置であり、これには、フラットファイル、リレーショナルデ
ータベース(SQL)およびOLAPデータベース(MDXおよび/またはその異形)が含まれる。ただ
しこれらに限定されるわけではない。特定のいくつかの実施形態ではデータベース120が
階層型OLAPキューブ(cube)である。特定のいくつかの実施形態ではデータベース120が、
キューブとして記憶されるのではなしに、階層を定義するディメンションテーブル(dimen
sion table)を有するスター(star)スキーマを含む。さらに、いくつかの実施形態ではデ
ータベース120が、その下のデータベースまたはデータベーススキーマにおいては明示的
に分割されていない(例えばディメンションテーブルが階層的に配置されていない)階層を
有する。。いくつかの実施形態ではデータベース120が、Oracle、MS Access 95/97/2000
またはこれらの改良物、Informix、Sybase、Interbase、IBM DB2、Paradox、dBase、SQL
Anywhere、Ingres、MsSQL、MSSQL server、ANSI Level 2、PostgreSQLなどのフォーマッ
トのデータベースである。いくつかの実施形態ではランタイムデータベース120がランタ
イムモデルスキーマ200およびランタイム解析スキーマ300を含む。
ランタイムモデルスキーマ200によって指定される基本テーブルタイプはモデル202であ
る。モデル202の目的は、生体標本(例えば腫瘍)が生物学的特徴(例えば乳癌、肺癌など)
を有する可能性を判定することを試みることである。そのため、モデル202はそれぞれ生
物学的特徴に関連づけられている。本明細書では生物学的特徴が、1つまたは複数の生体
標本が提示する識別可能な表現型である。例えば本発明の一応用では生物学的特徴がそれ
ぞれ、起源ないし原発腫瘍タイプを指す。癌と診断された患者の約4パーセントが、原発
腫瘍の起源が確定されていない転移性腫瘍を有すると推定されている。例えばHillen, 20
0, Postgrad. Med.J. 76, p. 690を参照されたい。病理分析後も転移性腫瘍の原発部位
がはっきりしないこともある。したがって、これらのいくつかの癌の起源の原発腫瘍部位
を予測することは臨床上の重要な目的である。原発起源が不明の腫瘍の場合、代表的な生
物学的サンプルクラスには、前立腺、乳房、結腸直腸、肺(腺癌および扁平上皮癌)、肝臓
、胃食道、膵臓、卵巣、腎臓および膀胱/尿管の癌腫が含まれ、米国ではこれらを合わせ
ると全ての癌関連死の約70パーセントを占める。例えばGreenlee et al., 2001, CA Canc
er J. Clin. 51,p. 15を参照されたい。セクション5.4では、本発明に基づく生物学的サ
ンプルクラスの追加の例を示す。
モデル202を使用して、生体標本が生物学的サンプルクラスのメンバ(member)である可
能性を判定する方法を例示するため、ある生物学的サンプルが肺癌を有する可能性を表す
特定のモデル202のケースを考える。この肺癌モデルは生体標本に適用され、試験の結果
は、生体標本が肺癌を有する可能性が高いことを指示すると仮定する。いくつかの実施形
態では、ランタイムデータベース120内のそれぞれのモデル202が、それぞれのモデルを一
意的に識別するモデル識別子110を含む。さらに、それぞれのモデル202は1つまたは複数
の計算(calculation)204(試験とも呼ぶ)を指定する。いくつかの実施形態では1つのモデ
ル202が2つから1000個の計算を指定する。より好ましい実施形態では、それぞれのモデル
202が3つから500個、3つから100個または3つから50個の計算を指定する。
モデル202のそれぞれの計算204は、ある細胞成分(cellularconstituent)の識別を指定
する。例えば一例では、それぞれの計算204が、第1の細胞成分および第2の細胞成分を指
定する。例示のため、モデル202が、表1に示す4つの計算204を含むケースを考える。
Figure 2012065674
計算1は第1の細胞成分AAAおよび第2の細胞成分DDDを指定する。以下同様である。
計算204の指定に加え、それぞれのモデル202は、そのモデルのそれぞれの計算204を適
用するために使用される計算アルゴリズム212を指定する。計算アルゴリズム212は、モデ
ル202の計算204を演算するときの細胞成分存在量(アバンダンス:abundance)値間の演算
関係を指定する。細胞成分存在量値は、モデル202が分類する生体標本から測定される。
計算アルゴリズム212の一例は、生体標本の第1の細胞成分の存在量によって分子が決ま
り、生体標本の第2の細胞成分の存在量によって分母が決まる比である。この場合、計算
アルゴリズム212は、これらの2つの細胞成分存在量値間の比をとることを指定し、計算20
4は、計算アルゴリズム212に従って計算204を演算するときに使用される試験生体標本中
の細胞成分の実際の識別を指定する。例えば1つの計算アルゴリズム212は、第1の細胞成
分の存在量(分子)と第2の細胞成分の存在量(分母)の比をとることを指定する。この計算
アルゴリズム212は、例示的なモデル202のそれぞれの計算204で使用される。表1の計算番
号1の場合、例示的な計算アルゴリズム212は、遺伝子AAAと遺伝子DDDの比をとることを指
定し、計算番号2の場合、計算アルゴリズム212は遺伝子CCCと遺伝子DDDの比をとることを
指定する。以下同様である。
本発明は、第1の細胞成分と第2の細胞成分の比にとどまらず、広範囲の計算アルゴリズ
ム212を包含する。例えばいくつかの実施形態では、計算アルゴリズム212が、第1の細胞
成分の存在量値に第2の細胞成分の存在量値を乗じる(A×B)ことを指定することができる
。実際、計算アルゴリズム212は、最初の2つの細胞成分の存在量値の積に第3の細胞成分
の存在量値を乗じる(A×B×C)ことを指定することができる。あるいは計算アルゴリズム2
12は、最初の2つの細胞成分の存在量値の積を第3の細胞成分の存在量値で除する[(A×B)/
C)]ことを指定することもできる。これらの例が示すとおり、計算アルゴリズムは、任意
の組合せの細胞成分の任意の数値演算(例えば乗算、除算、対数など)または数値演算の集
合である。計算アルゴリズム212は、所与の計算204を演算するために使用される細胞成分
の実際の識別を指示しない。一方、計算204は一組の細胞成分を指定するが、計算204を演
算するために使用される細胞成分間の演算関係を指示しない。計算アルゴリズム212を計
算204に適用することによって、計算204を、本発明の方法に従って演算することができる
いくつかの実施形態では、それぞれの計算204が、その計算が属するモデル202を指定す
るモデル識別子110を含む。さらに、計算がそれぞれしきい値114を含む。例えば、いくつ
かの実施形態では、それぞれの計算204が下しきい値および上しきい値を含む。このよう
な実施形態では、モデル202の計算アルゴリズム212を前述のようにそれぞれの計算に適用
することによって、モデル202のそれぞれの計算204が演算される。演算された計算204が
下しきい値よりも小さいとき、その計算は陰性と特性づけられる。演算された計算204が
上しきい値よりも大きいとき、その計算は陽性と特性づけられる。演算された計算204が
下しきい値と上しきい値の間にあるとき、その計算は不確定と特性づけられる。このよう
なしきい値を演算する方法についての追加の情報、モデルのより詳細な例および本発明に
基づくそれらの使用については、「Systems and Methods for Analyzing Gene Expressio
n Data ForClinical Diagnostics」という名称のAndersonの同時係属米国特許出願第60/
507,381号、ならびに2004年6月4日出願の「Systemsand Methods for Analyzing Gene Ex
pression Datafor Clinical Diagnostics」という名称のMoraledaおよびAndersonの米国
特許出願(番号未定)を参照されたい。
上および下しきい値が使用される計算(試験)を例示するため、生体標本中の遺伝子AAA
の存在量([AAA])が1000、DDDの存在量([DDD])が100である場合の表1の計算1を考える。さ
らに、計算1は下しきい値0.8を指定し、上比しきい値は5である。計算1を含むモデル202
の計算アルゴリズム212は、第1の遺伝子と第2の遺伝子の比をとることを指示する。この
計算アルゴリズム212を計算204に適用すると、演算された計算(比[AAA]/[DDD])は値10(10
00/100)を有する。この比は上比しきい値よりも大きいので、計算204は「陽性」と特性づ
けられる。
他の例では、ある生体標本の[AAA]が値70を有し、[DDD]が値100を有する。さらに、計
算1は下しきい値0.8および上しきい値5を指定する。このような例では比[AAA]/[DDD]が値
0.7(70/100)を有する。この比は下しきい値よりも小さいので、この計算は「陰性」と特
性づけられる。
他の例では、ある生体標本の[AAA]が値120を有し、[DDD]が値100を有する。さらに、計
算1は下しきい値0.8および上しきい値5を指定する。このような例では比[AAA]/[DDD]が値
1.2(120/100)を有する。この比は下しきい値よりも大きく、上しきい値よりも小さいので
、この計算は「不確定」と特性づけられる。
計算アルゴリズム212の他に、モデル202はそれぞれ、所与のモデル202を特性づける(演
算する)ためにそのモデル202の計算204をどのように組み合わせるかを指定する集約(aggr
egation)アルゴリズム214を含む。集約アルゴリズム214の一例は、演算したときにモデル
202の中の陽性の計算の数が陰性の計算の数よりも多い場合にそのモデル202が高い確率ま
たは可能性を有すると特性づけられる投票方式(voting scheme)である。例えば、上表1の
計算に計算アルゴリズム212が適用され、計算1および2が陽性、計算3が不確定、計算4が
陰性であるケースを考える。これが結果のとき、表1の計算からなるモデルを使用して試
験された生物は、このモデルに関連づけられた生物学的特徴を有する可能性を有すると特
性づけられる。
任意選択でモデル202はそれぞれモデル前提条件116を含む。モデル前提条件116は、そ
のモデルの計算204に計算アルゴリズム212が適用される前に満たされていなければならな
い要件を指定する。モデル前提条件116の一例は、前提条件116に関連づけられたモデル20
2の計算204が演算される前に所定の別のモデル202の計算204が演算される必要があること
である。例えば、肺癌のためのモデル202および肺腺癌のための他のモデル202があるケー
スを考える。肺癌のためのモデルは、特定の腫瘍が肺癌に関して陽性かどうかを判定する
ために使用される。この場合、肺腺癌のためのモデル202は、肺腺癌のためのモデルが実
行される前に肺癌のためのモデルが実行される必要があるという前提条件116を有するこ
とができる。前提条件116はさらに、肺癌試験のためのモデルが陽性の場合に肺腺癌のた
めのモデルを実行することを要求することができる。
ランタイムモデルスキーマ200は、モデル202テーブルタイプの他に、階層的な別のテー
ブルを指定する。この階層の最上位には手続きタイプ220がある。手続きタイプ220はそれ
ぞれ、計算アルゴリズム212および集約アルゴリズム214を指定する。さらに、それぞれの
手続きタイプ220は任意選択で手続き識別子221を含む。
1つまたは複数のモデル202を手続きタイプ220に関連づけることができる。モデル202が
手続きタイプ220に関連づけられているとき、そのモデルは、手続きタイプ220によって指
定された計算アルゴリズム212および集約アルゴリズム214を使用する。一例では、モデル
202が、そのモデルが使用する手続き220の手続き識別子221を含む。このような例では、
モデル202は、そのモデルが使用する計算アルゴリズム212および集約アルゴリズム214に
ついての明示の情報を含む必要がない。このような情報は、モデル202の手続き識別子フ
ィールド221によって指定された手続き220から得ることができるからである。
図1に例示し先に論じたとおり、モデル202はそれぞれ1つまたは複数の計算204を含む。
実際、いくつかの実施形態では、それぞれの計算204が、ランタイムモデルスキーマ200の
中の他の形態のテーブルに記憶される。計算204はそれぞれ、1つまたは複数の細胞成分存
在量値(図示せず)を指定する。さらに、それぞれの計算204は任意選択で、その計算204が
関連づけられたモデル202を識別するモデル識別子110を含むことができる。例えばモデル
識別子110は、計算204-1がモデル202-1に関連づけられていることを指示することができ
る。さらに、計算204はそれぞれ、計算識別子112およびしきい値114を有することができ
る。それぞれの計算204がモデル識別子110を含むケースでは、ランタイムデータベース12
0のモデル202は、このようなモデルの一部分である計算204を明示的に記述する必要がな
い。所与のモデル202に対する計算204が欲しい場合、このような計算204は、ランタイム
データベース120内の計算204の中からその所与のモデルに合致するモデル識別子110を有
する計算を見つけ出すことによって識別することができる。
図1に例示し先に論じたとおり、モデル202はそれぞれ1つまたは複数のモデル前提条件2
24を含む。実際、それぞれのモデル前提条件224は、ランタイムモデルスキーマ200の中の
他の形態のデータ構造である。前提条件224はそれぞれ、その前提条件に関連づけられた
モデルが実行される前に満たされる前提条件116を指定する。さらに、それぞれのモデル
前提条件224は任意選択で、その前提条件が関連づけられたモデル202を識別するモデル識
別子110を含むことができる。例えばモデル識別子110は、前提条件224-1がモデル202-1に
関連づけられていることを指示することができる。それぞれの前提条件224がモデル識別
子110を含むケースでは、ランタイムデータベース120のモデル202は、このようなモデル
の一部分である前提条件224を明示的に記述する必要がない。このような例では、所与の
モデル202にどの前提条件224を適用するのかを決定するため、ランタイムデータベース12
0内の前提条件の中からその所与のモデルに合致するモデル識別子110を有する前提条件を
見つけ出す探索が実施される。
5.2. 例示的な処理ステップ
セクション5.1では本発明の一実施形態に基づく例示的なデータ構造を紹介した。この
セクションでは、このような新規のデータ構造を使用して複数のモデル202を試験する方
法を説明する。セクション5.3ではこのような計算の結果が説明される。
ステップ402
ステップ402では細胞成分特性データを得る。細胞成分特性データは一般に、遠隔地の
臨床医によって提出された細胞成分存在量データファイルの形態をとる。いくつかの事例
では、このデータファイルが提出されると、コンピュータ20はネットワークインタフェー
スカード28を介してこのファイルを受け取る。一般的な実施形態では、リモートコンピュ
ータがこのデータを、インターネットなどのワイドエリアネットワーク(WAN)を介してコ
ンピュータ20に伝送する。
細胞成分特性データファイルは一般に、複数の細胞成分のうちのそれぞれの細胞成分の
生物学的状態の態様(特性とも呼ぶ)を含む。例えばいくつかの実施形態では、細胞成分特
性ファイルが、所与の生体標本または生物内のいくつかの細胞成分の存在量データを含む
。細胞成分存在量データファイルは、所与の生体標本内の100個を超える細胞成分のデー
タを含むことができる。実際、細胞成分存在量データファイルは、所与の生体標本内の50
0個超、1000個超、10,000個超または15,000個超の細胞成分のデータを含むことができる
。いくつかの実施形態では、1つの細胞成分存在量データファイルが複数の生体標本のデ
ータを含む。このような実施形態では、このデータファイルが、ファイル内にあるそれぞ
れの細胞成分存在量レベルにどの生体標本が関連しているのかを明確に指示する。
いくつかの実施形態では、細胞成分特性データファイルのフォーマットが、Affymetrix
社(米カリフォルニア州SantaClara)のGeneChipプローブアレイ用に設計されたフォーマ
ット(例えばAffymetrixMAS4.0ソフトウェアおよびU95AまたはU133遺伝子チップを使用し
て生成されたCHPエクステンション付きのAffymetrixチップファイル)、Agilent社(米カリ
フォルニア州PaloAlto)のDNAマイクロアレイ用に設計されたフォーマット、Amersham社(
英LittleChalfont)のCodeLinkマイクロアレイ用に設計されたフォーマット、Imaging Re
search社(カナダSt. Catharines)によるArrayVisionファイルフォーマット、Axon社(米カ
リフォルニア州UnionCity)のGenePixファイルフォーマット、BioDiscovery社(米カリフ
ォルニア州Marinadel Rey)のImaGeneファイルフォーマット、Rosetta社(米ワシントン州
Kirkland)の遺伝子発現マークアップ言語(GEML)ファイルフォーマット、Incyte社(米カリ
フォルニア州PaloAlto)のGEMマイクロアレイ用に設計されたフォーマット、またはMolec
ular Dynamics社(米カリフォルニア州Sunnyvale)のcDNAマイクロアレイ用に開発されたフ
ォーマットである。
いくつかの実施形態では、細胞成分特性ファイルが、生体標本の処理済みのマイクロア
レイ画像を含む。例えばこのような実施形態ではこのファイルが、アレイ上に表示された
それぞれの細胞成分の細胞成分存在量情報、任意選択の背景信号情報、およびそれぞれの
細胞成分に対して使用されるプローブを記述した任意選択の関連注釈情報を含む。いくつ
かの実施形態では、細胞成分存在量測定値が、セクション5.5で説明する転写状態測定値
である。
本発明のいくつかの実施形態では、翻訳状態、活性状態などの転写状態以外の生物学的
状態の態様(特性)または生物学的状態の態様の混合物が、細胞成分特性ファイルの中に表
現される。例えばセクション5.6を参照されたい。例えばいくつかの実施形態では、細胞
成分特性ファイルが、調査対象の生体標本内のさまざまなタンパク質のタンパク質レベル
を含む。特定のいくつかの実施形態では、細胞成分特性ファイルが、調査対象の生体標本
の組織内の細胞成分の量または濃度、生体標本の1つまたは複数の組織内の細胞成分の活
性レベル、あるいは生体標本の1つまたは複数の細胞成分の修飾(例えばリン酸化)状態を
含む。
本発明の一態様では生体標本内の遺伝子の発現レベルが、調査対象の生体標本の1つま
たは複数の細胞内のその遺伝子に対応する少なくとも1つの細胞成分の量を測定すること
によって決定される。一実施形態では、測定される少なくとも1つの細胞成分の量が、生
体標本の1つまたは複数の細胞内に存在する少なくとも1つのRNA種の存在量を含む。この
ような存在量は、遺伝子転写産物アレイ(gene transcript array)を、その生物の1つまた
は複数の細胞のRNAまたはそれから得られたcDNAと接触させることを含む方法によって測
定することができる。遺伝子転写産物アレイは、核酸または核酸ミミック(mimic)を付着
させた表面を含む。これらの核酸または核酸ミミックは、RNA種またはそのRNA種から得ら
れたcDNAとハイブリッドを形成する能力を有する。特定の一実施形態ではRNAの存在量が
、遺伝子転写産物アレイを、調査対象の生物の1つまたは複数の細胞のRNAあるいはそのRN
Aから得られた核酸と接触させることによって測定され、この遺伝子転写産物アレイは、
核酸または核酸ミミックを付着させた、位置によってアドレス指定可能な表面を含み、こ
の核酸または核酸ミミックは、RNA種またはそのRNA種から得られた核酸とハイブリッドを
形成する能力を有する。
いくつかの実施形態では、細胞成分特性ファイルが、複数の遺伝子(またはそれらの複
数の遺伝子に対応する細胞成分)の遺伝子発現データを含む。一実施形態では、それらの
複数の遺伝子が少なくとも5つの遺伝子を含む。他の実施形態ではそれらの複数の遺伝子
が、少なくとも100個、少なくとも1,000個または少なくとも20,000個の遺伝子を含み、あ
るいは30,000個超の遺伝子を含む。いくつかの実施形態ではそれらの複数の遺伝子が5,00
0個から20,000個の遺伝子を含む。
ステップ402のいくつかの実施態様では存在量データが前処理される。いくつかの実施
形態では、この前処理が、所与の生体標本の全ての細胞成分特性値を、その生体標本に対
して測定されたメジアン細胞成分存在量値で除する標準化を含む。いくつかの実施形態で
は、所与の生体標本または生物の全ての細胞成分存在量値を、その生体標本に対して測定
された細胞成分存在量値の第25百分位数(percentile)と第75百分位数の平均で除する。
細胞成分存在量測定値の起源がマイクロアレイである場合には、ミスマッチプローブ測
度が完全マッチプローブよりも大きいときに負の細胞成分存在量値が得られる。これは一
般に、(細胞成分を表す)1次遺伝子が低レベルで発現されたときに起こる。代表的ないく
つかのケースでは、所与の細胞成分の存在量ファイル中の存在量値の30パーセント程度が
負である。本発明の前処理のいくつかの例では、0以下の値を有する全ての細胞成分の存
在量値をある固定値に置き換える。細胞成分存在量測定値の起源がAffymetrix GeneChip
MAS 5.0である場合、いくつかの実施形態では、負の細胞成分存在量値を20、100などの固
定値に置き換えることができる。より一般には、いくつかの実施形態では、0以下の値を
有する全ての細胞成分存在量値を、所与の生体標本のメジアン細胞成分存在量値の0.001
から0.5までの間の固定値(例えば0.1または0.01)に置き換える。いくつかの実施形態では
、全ての細胞成分の存在量値を、置き換えられている細胞成分存在量値の絶対値に反比例
してメジアンと0の間を変化する値の変換によって置き換える。いくつかの実施形態では
、0未満の値を有する全ての細胞成分存在量値を、それらの最初の負値の絶対値の関数に
基づいて決定される値に置き換える。いくつかの例ではこの関数がS字形関数である。
いくつかの実施形態では、コンピュータ20上のウェブページまたはコンピュータ20によ
ってアドレス指定可能なウェブページによってステップ402が容易になる。このウェブペ
ージは、どのモデルを実行するかをリモートユーザが選択することを可能にし、遠隔地か
らコンピュータ20への細胞成分データファイルの転送を容易にする。いくつかの実施形態
では、このウェブページが以下の任意の情報の転送を可能にする:
1つまたは複数のモデルの計算を要求している研究室の所在地、
細胞成分特性データファイルを使用して実行する1つまたは複数のモデル(モデルの組)
の識別、
提出された標本を識別する一意の標本識別子、
細胞成分特性データを測定するために使用したマイクロアレイフォーマットを識別する
識別子、
細胞成分特性データファイルが表す患者を識別する識別子、
細胞成分特性ファイルの細胞成分特性データを得た生体標本の説明、および/または
生体標本に対してモデルを実行するよう指示した医師または他の保健専門家の識別。
いくつかの実施形態では、ウェブページベースのインタフェースを使用する代わりに、
またはウェブページベースのインタフェースを使用する他に、起源リモートコンピュータ
上でソフトウェアモジュール(図示せず)が実行される。このソフトウェアモジュールは、
ファイル転送プロトコル、インターネットプロトコルまたは他のタイプのファイル共有技
法を使用して、遠隔の臨床医が必要なデータをコンピュータ20にアップロードすることを
可能にする。いくつかの実施形態では、秘密鍵暗号法、ハッシュ、メッセージダイジェス
トおよび/または公開鍵アルゴリズムなどの当技術分野で知られている暗号化アルゴリズ
ムを使用して、ステップ402(およびステップ424)のコンピュータ20間の全ての通信が暗号
化される。このような技法は例えば、それぞれその全体が参照によって本明細書に組み込
まれるKaufman,Network Security, 1995, Prentice-Hall, New JerseyおよびSchneier,
AppliedCryptography: Protocols, Algorithms, and Source Code in C, Second Editio
n, John-Wiley& Sons, Inc.に含まれている。
ステップ404および406
ステップ404では、どのモデル202を実行(演算)するのかについての決定がなされる。例
えば、いくつかのケースでは、ランタイムデータベース120内のモデル202が、複数のモデ
ルの組に分割される。一例では、原発不明癌の試験のための一組のモデルがあり、肺癌の
試験のために特に設計された他の一組のモデルがある。以下同様である。それぞれのモデ
ル202の組は1つまたは複数のモデルを含む。したがっていくつかの事例では、ステップ40
4が、ユーザによって要求されたモデル202の組を決定することを含む。ステップ406では
、ステップ404で選択された一組のモデルの中から1つのモデルが選択される。
ステップ408
ステップ408は任意である。いくつかの実施形態では、ステップ408が実行されず、ステ
ップ402でリモートユーザによって指定された全てのモデル(例えば選択された一組のモデ
ルの中の全てのモデル)が実行される。任意選択のステップ408では、ステップ406で選択
されたモデル202のモデル前提条件116が満たされているかどうかについての判定が実施さ
れる。例えば、いくつかの実施形態では、モデル前提条件116が、ステップ406の最後の事
例で選択されたモデルよりも広い生物学的サンプルクラス(例えばより一般的な表現型)を
示すモデル202を、相対的に狭い生物学的サンプルクラスを示すあるモデル202が実行され
る前に実行しなければならないことを指定することができる。例えば、特定の形態の肺癌
を指示する第1のモデル202のモデル前提条件116は、第1のモデルを実行する前に、肺癌一
般を指示する第2のモデル202が陽性と評価されることを要求することができる。さらに、
この第2のモデル202は、このモデルを実行する前に、癌を指示する第3のモデルが陽性と
評価されることを要求するモデル前提条件116を有することができる。いくつかの実施形
態では、モデル前提条件116が、選択されたモデルを試験する前に複数のモデルの中の他
のモデルが陰性、陽性または不確定と識別される要件を含む。前提条件116を使用してモ
デル202を階層に配置する方法の追加の2、3の例を以下に示す。
第1の例では、モデルBの前提条件が、モデルBが実行される前にモデルAが特定の結果を
有することを要求する。例えば、モデルAが実行されたが、モデルAが、モデルBが要求す
る特定の結果を与えなかったケースが考えられる。この場合、モデルBは実行されない。
しかし、モデルAが実行され、モデルAが、モデルBが要求する特定の結果を与えた場合、
モデルBは実行される。この例は以下のように表すことができる。
if (A=結果),then Bを実行することができる。
第2の例では、モデルCの前提条件116が、モデルCを実行する前に、モデルAが特定の結
果を有するか、またはモデルBが特定の結果を有することを要求する。
この例は以下のように表すことができる。
if ((A=第1の結果)or (B=第2の結果)), then Cを実行することができる。
例えば、モデルCは、モデルCが実行される前に、モデルAが実行され、モデルAが癌に対
して陽性と評価されるか、またはモデルBが実行され、モデルBが肺癌に対して陽性と評価
されることを要求することができる。あるいは、モデルCの前提条件116は、モデルAとモ
デルBの両方が特定の結果を達成することを要求することができる。
if ((A=第1の結果)and (B=第2の結果)), then Cを実行することができる。
他の例では、モデルDの前提条件116が、モデルDが実行される前にモデルCが特定の結果
を有することを要求する。モデルCの前提条件116は、モデルCが実行される前に、モデルA
が第1の結果を有し、モデルBが第2の結果を有することを要求する。この例は以下のよう
に表すことができる。
If ((A=第1の結果)and (B=第2の結果)), then Cを実行することができる。
If (C=第3の結果),then Dを実行することができる。
これらの例はモデル前提条件116が提供する利点を示す。本発明のこれらの新規の前提
条件116のため、モデル202を、特定のモデル202が実行されてから他のモデル202が実行さ
れる階層構造として配置することができる。最初に実行されるモデル202はしばしば、広
い生体標本クラス(例えば広い表現型)に生体標本を分類するように設計される。生物学的
サンプルが広く分類された後、後続のモデル202が実行されて、この予備的な分類が、よ
り狭い生物学的サンプルクラス(例えばより具体的な生物学的サンプルクラス)に再分類さ
れる。
ステップ406で選択されたモデル202のモデル前提条件116が満たされると(408-Yes)、プ
ロセス制御はステップ410に移る。モデル202のモデル前提条件116が満たされないと(408-
No)、プロセス制御はステップ406に戻り、ステップ404で識別された一組のモデルの中か
ら別のモデル202が選択される。
ステップ410
ステップ410ではこのモデルの計算204が選択される。計算204は、調査対象の生体標本
内でそれらの特性(細胞成分の生物学的状態の態様)が試験される2つ以上の細胞成分を識
別する。例えば計算204は、遺伝子AAAおよびBBBの細胞成分存在量値を指定することがで
きる。いくつかの実施形態では、計算が、ステップ406の最後の事例で選択されたモデル2
02によって表される生物学的特徴を有する標本内において、モデル202によって表される
生物学的特徴を持たない生体標本内および/または異なる生物学的特徴を有する生体標本
内に比べてアップレギュレートまたはダウンレギュレートされる少なくとも1つの細胞成
分を指定する。
ある生物学的特徴を有する標本内において他の生物学的特徴を有する標本内に比べてア
ップレギュレートまたはダウンレギュレートされる細胞成分は、ルーチンの実験によって
、または発表された参考文献から得ることができる。例えばSu et al. 2001, Cancer Res
earch 61, p.7388は、(i)特定の原発性腫瘍タイプにおいてアップレギュレートされ、(i
i)このような腫瘍タイプを予測する遺伝子の名称を提供している。Suet al.は、前立腺
腫瘍で、表2に記載された細胞成分の発現を識別した。
Figure 2012065674
いくつかの実施形態では、その生物学的特徴を有する生体標本内のその細胞成分の存在
量が、複数の細胞成分存在量測定が実施されたその生物学的特徴を有する生体標本内の細
胞成分の少なくとも60パーセント、少なくとも70パーセント、少なくとも80のパーセント
または少なくとも90のパーセントの存在量よりも大きいときに、その細胞成分は、生物学
的特徴を有する標本内においてアップレギュレートされているとみなされる。いくつかの
実施形態では、その生物学的特徴を有する生体標本内のその細胞成分の存在量が平均して
、その生物学的特徴を持たない生体標本内のその細胞成分の存在量よりも高いときに、そ
の細胞成分は、その生物学的特徴を有する標本においてその生物学的特徴を持たない生体
標本に比べてアップレギュレートされているとみなされる。いくつかの実施形態では、そ
の生物学的特徴を有する生体標本内のその細胞成分の存在量が、複数の細胞成分存在量測
定が実施されたその生物学的特徴を有する生体標本内の細胞成分の少なくとも40パーセン
ト、少なくとも30パーセント、少なくとも20のパーセントまたは少なくとも10のパーセン
トの存在量よりも小さいときに、その細胞成分は、その生物学的特徴を有する標本におい
てダウンレギュレートされているとみなされる。いくつかの実施形態では、その生物学的
特徴を有する生体標本内のその細胞成分の存在量が平均して、その生物学的特徴を持たな
い生体標本内のその細胞成分の存在量よりも低いときに、その細胞成分は、その生物学的
サンプルまたは生物において、その生物学的特徴を持たない生物学的サンプルまたは生物
に比べてダウンレギュレートされているとみなされる。
いくつかの実施形態では、計算204の中に指定された細胞成分がそれぞれ核酸またはリ
ボ核酸であり、生体標本内のこれらの細胞成分の存在量が、生体標本内の第1の細胞成分
および第2の細胞成分の全部または一部の転写状態を測定することによって得られる。い
くつかの実施形態では、計算204によって指定された細胞成分がそれぞれ独立に、mRNA、c
RNAまたはcDNAの全体または断片である。いくつかの実施形態では、計算204によって指定
された細胞成分がそれぞれタンパク質であり、これらの細胞成分の存在量が、細胞成分の
全部または一部の翻訳状態を測定することによって得られる。いくつかの実施形態では、
計算204によって指定された細胞成分の存在量が、細胞成分の活性または翻訳後修飾を測
定することによって決定される。
ステップ412
ステップ412では、ステップ410の最後の事例で選択された計算204の中に指定された細
胞成分特性値を、ステップ402で提出された細胞成分特性から得る。したがって、計算204
が遺伝子AAAおよび遺伝子BBBを指定する例では、遺伝子AAAおよび遺伝子BBBに対する細胞
成分存在量値(または計算によって指定された他のいくつかの特性)を、細胞成分存在量フ
ァイルから得る。
ステップ414
ステップ414では、ステップ410の最後の事例において選択された計算204を、そのモデ
ルの中に指定された計算アルゴリズム212に従って演算する。例えばこの計算アルゴリズ
ムは、例示的な計算204の中に指定された第1の細胞成分の存在量値と例示的な計算204の
中に指定された第2の細胞成分の存在量値との比をとることを指定することができる。計
算アルゴリズム214に従って計算204を演算する追加の例は先のセクション5.1で説明した
。これらの例は、計算204が演算された後で、演算されたこの計算の値に基づいて、この
計算のしきい値に関して対して計算204を特性づける方法を説明する。例えば、演算され
た計算204は、その計算の真の最小値よりも大きい値を有する場合、演算された計算204は
陽性と特性づけられる。
ステップ416
ステップ416では、最後の計算204の演算の結果を記憶する。いくつかの実施形態では、
この記憶が、計算204が実行されたモデル202を識別するモデル識別子、モデル202のどの
バージョンが実行されたのかを指示するモデルバージョン識別子、計算204を演算するた
めに使用された細胞成分特性値を供給した細胞成分特性データファイルを識別する発現デ
ータファイル識別子、計算204に関連付けられた計算識別子112 (図1)、および計算結果コ
ード(例えば「可能性が極めて高い(extremelylikely)」、「可能性が低い(not likely)
」など)の記憶を含む。
ステップ418
ステップ418では、モデル202の全ての計算204がそのモデルの計算アルゴリズム212に従
って演算されたかどうかについての判定が実施される。まだ演算されていない場合(418-N
o)、プロセス制御はステップ410に戻り、そのモデル202の別の計算(試験)202が演算のた
めに選択される。全て演算された場合(418-Yes)、ネットワーク制御はステップ420に移る
ステップ420
ステップ420では、ステップ406の最後の事例で選択されたモデルに関して実行された全
ての計算(試験)204を、モデル202によって指定された集約アルゴリズム214に従って集約
する。このような集約によって、そのモデルのモデル特性付け(model characterization)
が得られる。このモデル特性付けは、その種の試験生物またはその種のその生物の試験生
体標本が生物学的サンプルクラスのメンバであるかどうかを指示する。
一実施形態では、ステップ406の最後の事例で選択されたモデル202のモデル識別子と一
致したモデル識別子を有するテーブル318の中のそれぞれの行の結果コードが集められる
。例えばモデル202が5つの計算204を含むケースを考える。それぞれの計算204はステップ
414の事例で演算されており、その結果は記憶されている。しきい値がそれぞれの計算204
に関連づけられている場合、計算の結果は、その計算が陽性か、陰性かまたは不確定かに
関する指示である。
モデル202が5つの計算(試験)204を含むケースを考える。計算結果テーブル318には、5
つのそれぞれの計算204に対して1つ、合計5つの行がある。これらの5つの行はそれぞれ結
果コードを含む。このユーザケースシナリオでは、それぞれの結果コードが陽性、陰性ま
たは不確定である。次に、このモデル202に関連付けられた集約アルゴリズムが、このモ
デル202を特性づけるためにこれらの5つの結果コードをどのように組み合わせるのかを指
定する。例えばこの集約アルゴリズムは、5つの結果コードを投票方式で組み合わせるよ
う指定することができ、その場合には、このモデルの演算された陽性の計算の数が陰性の
計算の数よりも多い場合にモデル202は陽性とみなされる(陽性として特性づけられる)。
集約アルゴリズム214の一例は、演算されたときにモデルの中の陽性の計算の数が陰性
の計算の数よりも多い場合にモデル202が陽性として特性づけられる投票方式である。例
えば、上表1の計算に計算アルゴリズム212が適用され、計算1および2が陽性、計算3が不
確定、計算4が陰性であるケースを考える。これが結果のとき、表1の中の計算からなるモ
デルは陽性として特性づけられる。しかし、本発明のいくつかの実施形態では、モデルの
それぞれの陽性の計算に、そのモデルのそれぞれの陰性の計算とは異なる重みを与える重
み付け方式を使用することができる。例えば、モデルの陽性の計算にはそれぞれ重み3.0
を与えることができ、モデルの陰性の計算にはそれぞれ重み1.0を与えることができる。
この重み付け方式では、モデルが1つの陽性の計算と2つの陰性の計算からなるときでも、
そのモデルは陽性として特性づけられる。
好ましい実施形態では、特性づけられたそれぞれのモデルが、生体標本または生物がそ
のモデルによって表される生物学的特徴を有する可能性を与える。この可能性は、演算さ
れたモデルのモデルスコア(model score)を表す。言い換えると、特性づけられたそれぞ
れのモデルは、種の試験生物または種のその生物の試験生体標本が生物学的サンプルクラ
スのメンバであるかどうかを指示するモデル特性付け(例えばモデルスコア)を生み出す。
いくつかの実施形態では、モデルスコアが高いほど、モデルを演算するためにそれらの細
胞成分値が使用された生体標本または生物が、(i)そのモデルによって表される生物学的
特徴を有し、または(ii)そのモデルによって表される生物学的サンプルクラスのメンバで
ある可能性が高い。いくつかの実施形態では、モデルが、生体標本または生物が、そのモ
デルに関連した生物学的特徴を有し、またはその試験によって表される生物学的サンプル
クラスのメンバである可能性が極めて高く(extremely likely)、可能性が高く(likely)、
不確定(indeterminate)であり、可能性が低く(notlikely)、または可能性が非常に低い(
very unlikely)と判定する。いくつかの実施形態では、モデルによって表される生物学的
特徴が、療法の組合せに対する感受性および/または抵抗性である。いくつかの実施形態
では、モデルによって表される生物学的特徴が、生物における特定の病気の転移の可能性
および/またはその病気の再発の可能性である。いくつかの実施形態では、モデルによっ
て表される生物学的サンプルクラスが、癌および/またはセクション5.4で示される例示的
な生物学的特徴である。病気の再発の可能性を追跡する実施形態では、モデルスコアを「
感受性」、「低リスク」または「高リスク」などとすることができる。病気の転移の可能
性を追跡する実施形態では、モデルスコアを「悪性」、「不確定」、または「非悪性」な
どとすることができる。病気の攻撃性を評価する実施形態では、モデルスコアを「攻撃的
」、「不確定」または「不活性」などとすることができる。
ステップ422および424
ステップ422では、所与の細胞成分存在量ファイル上の実行(演算)しなければならない
一組のモデルの全てのモデルが実行されたかどうかについての判定が実施される。実行さ
れていない場合(422-No)、プロセス制御はステップ406に戻り、別のモデル202が選択され
る。全てのモデルが実行された場合には、その結果が報告される(ステップ424)。いくつ
かの実施形態では、報告される結果が、複数のモデルの中のそれぞれのモデルの特性付け
である。
一般的な実施形態では、報告される結果が、実行された一組のモデルのそれぞれのモデ
ル202の特性付けである。実行されたモデル202はそれぞれ、そのモデルのそれぞれの集約
アルゴリズム214に従って特性づけられる。一般的な実施形態では、おおもとの細胞成分
存在量ファイルを提出したリモートクライアントコンピュータに結果が報告される。ステ
ップ424で実施される例示的な報告がセクション5.3において説明される。
5.3. 例示的な結果
いくつかの実施形態では、ステップ424で作成された報告が、コンピュータ20から、図2
のステップ402で細胞成分特性データファイルを提供したリモートコンピュータへ送られ
る。いくつかの実施形態ではこの報告が、以下の情報を提供するヘッダを有する。
1つまたは複数のモデルの演算を要求した研究室の所在地、
この要求の一意の発注識別子、
提出された標本を識別する一意の標本識別子、
細胞成分特性データを測定するために使用したマイクロアレイフォーマットを識別する
識別子、
ステップ402で細胞成分特性データファイルがコンピュータ20に提出された日付、
ステップ424の報告が作成された日付、
細胞成分特性データファイルが表す患者を識別する識別子、
細胞成分特性ファイルの細胞成分特性データを得た生体標本の説明、および/または
生体標本に対してモデルを実行するよう指示した医師または他の保健専門家の識別。
下表3および4は集合的に、一組の前立腺モデルセットに対して提供された報告の一例を
表す。表3および4の行はそれぞれ異なるモデルを表す。表3では、報告されたそれぞれの
モデルが、そのモデルが試験するものを指示する臨床試験名、そのモデルを試験するため
の細胞成分を選択する際の科学的基礎を提供する研究論文(または他の形態の臨床試験)へ
の1つまたは複数の参照、モデル結果およびモデル結果の臨床的説明を有する。表3は、(i
)患者が前立腺癌の再発を被る可能性の程度または(ii)特定の形態の治療に対する患者の
感受性を指示するモデルを提供する。表4は表3とは異なり、それぞれの行(モデル)が、患
者が前立腺癌を有するか否かを確認する確認試験を表す。
Figure 2012065674

Figure 2012065674
表5および6は、本発明の他の事例においてステップ424で送られた他のタイプの報告に
見られた化学感受性モデルを説明する。
Figure 2012065674

Figure 2012065674
表7および8は、本発明の他の事例においてステップ424で送られた他のタイプの報告に
見られた結腸直腸モデルを説明する。
Figure 2012065674

Figure 2012065674
表9は、本発明の他の実施形態においてステップ424で送られた他のタイプの報告に見ら
れた一組の起源部位モデルセットを説明する。
Figure 2012065674
5.4. 例示的な生物学的特徴
本発明を使用して、複数の生物学的特徴のうちのいずれかを生体標本が有するかどうか
を判定するモデルを開発することができる。言い換えると、本発明を使用して、ある1つ
の種の試験生物またはある1つの種の生物の試験生体標本が生物学的サンプルクラスのメ
ンバであるかどうかを指示するモデルを開発することができる。幅広い生物学的特徴(例
えば生物学的サンプルクラス)のアレイが企図される。一例では、2つのそれぞれの生物学
的特徴が、(i)野生型(wildtype)状態と(ii)病気(diseased)状態である。他の例では、2
つのそれぞれの生物学的特徴が、(i)第1の病気態と第2の病気状態である。他の例では、2
つのそれぞれの生物学的特徴が、(i)薬物反応(drug respondent)状態と(ii)薬物非反応(d
rugnon-respondent)状態である。このような事例では、第1のモデル202が、第1の生物学
的サンプル特徴の存在の有無を試験し、第2のモデル202が、第2の生物学的サンプル特徴
の存在の有無を試験する。本発明は、2つの生物学的特徴の存在の有無に関してサンプル
を試験する事例に限定されない。実際、本発明の方法、本発明のコンピュータおよび本発
明のコンピュータプログラム製品を使用して、任意の数の生物学的特徴(例えば1つの生物
学的特徴、2つ以上の生物学的特徴、3つから10個の生物学的特徴、5つから20個の生物学
的特徴、25個超の生物学的特徴など)を試験することができる。このような事例では一般
に、このようなそれぞれの生物学的特徴の存在の有無を試験する(例えば、その標本が、
その生物学的特徴の存在によって特性づけられる生物学的サンプルクラスのメンバである
のか、またはその生物学的特徴の不在によって特性づけられる生物学的サンプルクラスの
メンバであるのかを判定する)ために、それぞれ異なるモデル202が使用される。いくつか
の実施形態では、同じ生物学的特徴の存在の有無を複数のモデルが試験する。言い換える
と、ある生物学的サンプルが特定の生物学的サンプルクラスのメンバであるかどうかを複
数のモデルが試験する。このセクションでは例示的な生物学的特徴を説明する。所与の生
物学的特徴を有する生物は、対応する生物学的サンプルクラスのメンバであるとみなすこ
とができる。
5.4.1 乳癌
Pusztaiet al. 乳癌の治療においては異なるいくつかの補助的化学治療法(adjuvant c
hemotherapy regimen)が使用される。全ての治療方法が、全ての患者に対して等しく有効
であるとは限らない。現在、特定の個人に対して最も有効な治療方法を選択することは不
可能である。乳癌における化学療法後の再発のない長期生存の代用として受け入れられて
いる1つのものは、新補助療法に対する完全病理学的反応(completepathologic response
:pCR)である。Pusztaiet al., ASCO 2003 abstract 1は、週1回のパクシタキセル-FAC逐
次新補助化学療法(T/FAC)後のpCRを予測する遺伝子発現プロファイルの発見を報告してい
る。Pusztaiet al.の予測マーカは、24例の早期乳癌の微細針吸引液から生成された。24
人の患者のうち6人がpCRを達成した(25パーセント)。Pusztaiel al.では、それぞれのサ
ンプルからのRNAを、30,000のヒト転写産物からcDNAマイクロアレイ上でプロファイリン
グした。pCR群と残存病気(residualdisease:RD)群との間で差別的に発現された遺伝子を
、信号対雑音比によって選択した。リーブワンアウトクロスバリデーション(leave-one o
ut crossvalidation)を使用して、最良のクラス予測アルゴリズムおよび結果予測に必要
な最適な遺伝子数を定義するために、いくつかの教師あり学習法が評価された。5つの遺
伝子(3つのEST、核性因子11Aおよびヒストンアセチルトランスフェラーゼ)を使用したサ
ポートベクターマシン(support vector machine)が、推定される最大の正確さを与えた。
この予測マーカセットを、T/FAC新補助療法を受けた独立の症例に対して試験した。Puszt
ai et al.は、バリデーションの中に含まれる21人の患者に対する結果を報告した。遺伝
子発現プロファイルに基づくPusztai et al.の反応予測の正確さは全体で81パーセントで
あった。無病正診率は全体で93パーセントであった。有病正診率は50パーセントであった
(6例のpCRのうち3例がRDとして誤分類された)。Pusztaiet al.は、T/FAC手術前化学療法
に対してpCRを達成すると予測された患者がpCRを経験する可能性は75パーセントであり、
それに対して選択されなかった患者ではその可能性が25〜30パーセントと予想されること
を見い出した。このPusztaiet al.の所見を使用して、T/FAC補助的化学療法の利益を得
る可能性が最も高い個々の患者を医師が選択するのを助けるモデル202を構築することが
できる。
Cobleighet al. 10個以上の陽性節(positive node)を有する乳癌患者は予後不良をき
たすが、一部は長期生存する。Cobleigh et al., ASCO 2003 abstract 3415は、この高リ
スク患者群のディスタントディジーズフリーサバイバル(distant disease-free survival
:DDFS)の予測因子を識別しようとした。1979年から1999年に診断された浸潤性の乳癌およ
び10以上の陽性節を持つ患者が識別された。3つの10ミクロン切片からRNAを抽出し、7つ
の基準遺伝子および185の癌関連遺伝子の発現をRT-PCRを使用して定量化した。これらの
遺伝子は、発表文献およびマイクロアレイ実験の結果に基づいて選択した。合計79人の患
者が調べられた。患者の54パーセントはホルモン療法を受け、80パーセントは化学療法を
受けた。メジアンフォローアップは15.1年であった。2002年8月現在、患者の77のパーセ
ントは遠隔再発または乳癌死を経験した。臨床的変量の一変量Cox生存率分析によれば、
含まれる節の数はDDFSと有意に関連していた(p=0.02)。Cobleighet al.は、年齢、腫瘍
サイズ、含まれる節、腫瘍等級、補助ホルモン療法および化学療法を含む多変量モデルを
適用し、それは、DDFS時間の分散の13のパーセントを説明した。185の癌関連遺伝子の一
変量Cox生存率分析によれば、いくつかの遺伝子がDDFSと関連していた(5つの遺伝子はp<0
.01、16個の遺伝子はp<0.05)。HER2アダプタGrb7およびマクロファージマーカCD68に関し
て、より高い発現はより短いDDFSと関連していた(p<0.01)。TP53BP2(腫瘍タンパク質p53
結合タンパク質2)、PrおよびBc12に関しては、より高い発現はより長いDDFSと関連してい
た(p<0.01)。5つの遺伝子を含む多変量モデルは、DDFS時間の分散の45のパーセントを説
明した。多変量解析はさらに、遺伝子発現は、臨床的変量に対する制御後の有意な予測因
子であることを指示した。このCobleigh et al.の所見を使用して、どの患者がDDFSと関
連している可能性が高く、どの患者がDDFSと関連している可能性が低いのかを判定する助
けとして使用することができるモデル202を構築することができる。
van'tVeer. 同じ病期の乳癌患者が、著しく異なる治療反応および全体的な予後を示す
ことがある。転移(予後不良)の予測因子、例えばリンパ節状態や組織学的等級は、それら
の臨床的挙動に従って乳房腫瘍を正確に分類することができない。この欠点に対処するた
め、van'tVeer 2002, Nature 415, 530-535は、117人の患者の原発性乳房腫瘍に対してD
NA微量分析を使用し、教師あり分類を適用して、診断において局所リンパ節に腫瘍細胞の
ない(リンパ節陰性の)患者の遠隔転移までの短い間隔を強力に予測する遺伝子発現サイン
(「予後不良」のサイン)を識別した。さらにvan'tVeerは、BRCA1キャリヤの腫瘍を識別
するサインを確立した。これらのvan't Veerの所見を使用して、患者予後を判定する助け
として使用することができるモデル202を構築することができる。
他の参考文献 乳癌検出用のモデル202の構築に使用することができる追加の乳癌研究
の代表的な例には、Souleet al., ASCO 2003 abstract 3466、Ikeda et al., ASCO 2003
abstract34、Schneider et al., 2003, British Journal of Cancer 88, p. 96、Long
et al. ASCO2003 abstract 3410およびChang et al., 2002, PeerView Press, Abstract
1700,"Gene Expression Profiles for Docetaxel Chemosensitivity"が含まれる。ただ
しこれらに限定されるわけではない。
5.4.2 肺癌
Rosell-Costaet al. ERCC1 mRNAレベルは、DNA修復能力(DNA repair capacity:DRC)
およびシスプラチンに対する臨床的抵抗性と相関する。ゲムシタビン損傷後のDNA修復中
にリボヌクレオチドレダクターゼ(RR)のM1またはM2サブユニットの酵素活性および遺伝子
発現の変化が観察される。Rosell-Costa et al., ASCO 2003 abstract 2590は、gem/cis
対gem/cis/vrb対gem/vrbおよびvrb/ifosに対してランダム化される570人の患者の試験(Al
berola et al,ASCO 2001 abstract 1229)に含まれる100人のステージIV (NSCLC)患者の
腫瘍生検材料から分離されたRNAの定量的PCRによって、ERCC1およびRRM1 mRNAレベルを評
価した。81人の患者のERCC1およびRRM1データが使用可能であった。これらの81人の患者
に対する全体反応速度、進行までの時間(time to progression:TTP)およびメジアン生存(
MS)は、570人の全患者に対する結果と同様であった。ERCC1レベルとRRM1レベルの間の強
い相関が見られた(P=0.00001)。gem/cisアームではERCC1およびRRM1レベルに基づく予後
の有意な差が見られたが、他のアームでは見られなかった。gem/cisアームにおいて、TTP
は、低いERCC1を有する患者では8.3カ月、高いERCC1を有する患者では5.1カ月であり(P=0
.07)、低いRRM1を有する患者では8.3カ月、高いRRM1を有する患者では2.7カ月であり(P=0
.01)、低いERCC1およびRRM1を有する患者にでは10カ月、高いERCC1およびRRM1を有する患
者では4.1カ月であった(P=0.009)。MSは、低いERCC1を有する患者では13.7カ月、高いERC
C1を有する患者では9.5カ月であり(P=0.19)、低いRRM1を有する患者では13.7カ月、高いR
RM1を有する患者では3.6カ月であり(P=0.009)、低いERCC1およびRRM1を有する患者では到
達せず、高いERCC1およびRRM1を有する患者では6.8カ月であった(P=0.004)。低いDRCを指
示する低いERCC1およびRRM1レベルを有する患者は、gem/cisに対する理想的な候補であり
、高いERCC1およびRRM1レベルを有する患者はより不良な予後を有する。したがって、ERC
C1およびRRM1を含む比を使用して、肺癌患者にどの種類の療法を与えるべきかを決定する
モデル202を構築することができる。
Hayes etal. 肺癌の高い有病率にもかかわらず、予後および治療反応による患者のロ
バストな層化(stratification)は依然としてわかりにくい。肺癌遺伝子発現アレイの初期
の研究は、以前には認められていない腺癌のサブクラスが存在するかもしれないことを示
唆した。これらの研究は繰り返されておらず、臨床的予後とサブクラスの関連は依然とし
て不完全である。最も大きな3つのケース系列によって示唆されるサブクラスを比較する
ため、Hayeset al., ASCO 2003 abstract 2526によって、366の腫瘍および正常組織サン
プルを含むそれらの遺伝子発現アレイが、プールされたデータセットで解析された。共通
の発現データセットをリスケールし、遺伝子フィルタリングを使用して、全てのサンプル
にわたって複製対間で整合した可変の発現を有する遺伝子のサブセットを選択した。この
共通データセットに対して階層クラスタリングを実行し、結果として生じたクラスタを、
原著の著者によって提案されたクラスタと比較した。原分類方式と直接に比較するため、
分類機構を構築し、366腫瘍のプールからのバリデーションサンプルに適用した。それぞ
れの解析ステップで、このバリデーションと最初に発表されたクラスとの間のクラスタリ
ングの一致は統計的に有意だった。追加のバリデーションステップでは、最初に発表され
たサブクラスを記述している遺伝子のリストが分類方式にわたって比較された。再び、腺
癌サブタイプを記述するために使用される遺伝子のリストには統計学的に有意の重なりが
あった。最後に、生存曲線は、一貫して低減する生存を有する腺癌の1つのサブタイプを
証明した。Hayeset al.の解析は、mRNA発現プロファイリングに基づいて再生可能な腺癌
サブタイプを記述することができることを確立するのを助ける。したがって、Hayes et a
l.の結果を使用して、腺癌サブタイプを識別するために使用することができるモデル202
を構築することができる。
5.4.3 前立腺癌
Li etal. タキソテール(Taxotere)は、前立腺癌を含む充実性腫瘍に対して抗腫瘍活性
を示す。しかし、タキソテールの作用の分子機構は完全には解明されていない。ホルモン
非感受性(PC3)および感受性(LNCaP)の前立腺癌細胞でのタキソテールの分子作用機構を確
立するため、AffymetrixHuman Genome U133Aアレイを使用することによって、包括的な
遺伝子発現プロファイルが得られた。Li et al. ASCO 2003 abstract 1677を参照された
い。無処理の細胞ならびに2nMタキソテールで6、36および72時間処理した細胞の全RNAを
マイクロアレイ解析にかけ、Microarray Suite and Data Mining、Cluster and TreeView
ならびにOnto-expressソフトウェアを使用してデータを解析した。6時間という早い時期
に遺伝子の発現のオルタネーション(alternation)が観察され、より多くの遺伝子がより
長い処理で変更された。さらに、タキソテールは、LNCaP細胞とPC3細胞の間で、遺伝子発
現プロファイル対する差動効果(differential effect)を示した。6、36および72時間後に
PC3細胞ではそれぞれ合計166、365および1785の遺伝子が、57、823および964遺伝子のLNC
aP細胞に比べて>2倍の変化を示した。Liet al.は、アンドロゲン受容体に対する効果を
認めなかったが、ステロイド独立のAR活性化に関与するいくつかの遺伝子(IGFBP2、FGF13
、EGF8など)のアップレギュレーションがLNCaP細胞では観察された。クラスタリング解析
は、両方の細胞系統で、細胞増殖および細胞周期(サイクリンおよびCDK、Ki-67など)、信
号変換(IMPA2、ERBB2IPなど)、転写因子(HMG-2、NFYB、TRIP13、PIRなど)、および腫瘍形
成(STK15、CHK1、サバイビン(Survivin)など)に対する遺伝子のダウンレギュレーション
を示した。対照的に、タキソテールは、アポトーシスの誘導(GADD45A、FasApo-1など)、
細胞周期停止(p21CIPI、p27KIP1など)および腫瘍抑制に関係した遺伝子をダウンレギュレ
ートした。これらの結果から、Li et al.は、タキソテールは、多数の遺伝子の変化を引
き起こし、それらの多くが、タキソテールが前立腺癌細胞に影響を及ぼす分子機構に寄与
する可能性があると結論づけた。この情報をさらに利用して、転移性前立腺癌の治療に対
するタキソテールの治療効果を最適化する戦略を考案することができる。
このセクションで説明した結果を使用すると、タキソテールおよび関連治療方法に対し
てさまざまな程度の反応(例えばタキソテールに非常に反応する第1の生物学的特徴、タキ
ソテールに反応しない第2の生物学的特徴など)を有する群に患者を層化するモデル202を
開発することができる。他の方法では、ステージD2前立腺癌において生存予測因子として
の役目を果たすために、Cox-2発現に部分的に基づいて生物学的特徴を開発することがで
きる。
5.4.4 結腸直腸癌
Kwan etal. 結腸直腸発癌現象の発生に関与する一組の遺伝子を識別するため、Kwon e
t al. ASCO 2003abstract 1104は、対応する非癌性結腸上皮を有する12の腫瘍からの結
腸直腸癌細胞の遺伝子発現プロファイルを、4,608の遺伝子を表すcDNAマイクロアレイに
よって解析した。Kwanet al.は、2方向クラスタリング解析によってサンプルと遺伝子の
両方を分類し、癌組織と非癌組織の間で差別的に発現された遺伝子を識別した。逆トラン
スクリプターゼPCR(RT-PCR)によって、選択された遺伝子の遺伝子発現レベルの変化が確
認された。リンパ節転移に基づく遺伝子発現プロファイルが、教師あり学習法を用いて評
価された。腫瘍の75パーセント超で、122の遺伝子、すなわち77のアップレギュレートさ
れた遺伝子および45個のダウンレギュレートされた伝子について発現変化が観察された。
最も頻繁に変化した遺伝子は、信号変換(19パーセント)、代謝(17パーセント)、細胞構造
/運動性(14パーセント)、細胞周期(13のパーセント)および遺伝子タンパク質発現(13の
パーセント)の機能カテゴリに属した。ランダムに選択された遺伝子のRT-PCR解析は、cDN
Aマイクロアレイ中のそれと矛盾しない所見を示した。Kwonet al.は、クロスバリデーシ
ョンループを用いて12人の患者のうちの10人の患者のリンパ節転移を予測することができ
た。これらのKwonet al.の結果を使用して、患者が結腸直腸癌を有するかどうかを判定
するためのモデル202を開発することができる。さらに、Kwonet al.の結果を使用して、
結腸直腸癌のサブクラスを識別するように拡張することもできる。
結腸直腸癌用のモデル202(結腸直腸癌を有する生体標本を識別するモデルおよび結腸直
腸癌のサブグループを予測する追加のモデルを含む)の開発に使用することができる追加
の研究には、COX-2の高い発現が腫瘍誘導および進行に関連していることを見つけた研究
が要約されたNasiret al., 2002, In Vivo. 16, p. 501、Longley et at., 2003 Clin.
ColorectalCancer. 2, p. 223、McDermott et al., 2002, Ann Oncol. 13, p. 235およ
びLongleyet al., 2002, Pharmacogenomics J. 2, p. 209が含まれる。ただしこれらに
限定されるわけではない。
5.4.5 卵巣癌
Spentzoset al. 上皮性卵巣癌(EOC)における臨床的予後に関連した発現プロファイル
を識別するため、Spentzoset al. ASCO 2003 abstract 1800は、最前線の白金/タキサン
ベースの化学療法を受けたEOCの患者の38の腫瘍サンプルを評価した。RNAプローブは、逆
転写され、蛍光標識され、12675のヒト遺伝子および発現された配列タグを含むオリゴヌ
クレオチドアレイにハイブリッド形成された。化学感受性、無病生存(disease-free surv
ival:DFS)および全体生存(overallsurvival:OS)を予測するサインに関して発現データを
解析した。ベイズモデルを使用して、異なる化学感受性および生存の腫瘍間の差動発現の
確率に従って遺伝子をソートした。異なる予後を有する腫瘍サブグループ間で差別的に発
現される最も高い確率を有する遺伝子がそれぞれのサインには含まれた。Spentzos et al
.は、化学療法抵抗性腫瘍の中で過剰発現された一組の遺伝子、および化学療法感受性腫
瘍の中で過剰発現された別の一組の遺伝子を見い出した。Spentzos et al.は、短い無病
生存(DFS)に関連した腫瘍内で過剰発現された45の遺伝子、および長いDFSに関連した腫瘍
内で過剰発現された18の遺伝子を見つけた。これらの遺伝子は、メジアンDFS7.5カ月と30
.5カ月(p<0.00001)の2つの群に患者母集団を分けた。Spentzoset al.は、短い全体生存(
OS)を有する腫瘍内で過剰発現された20の遺伝子、および長いOSを有する遺伝子内で過剰
発現された29の遺伝子を見つけた(メジアンOSは2カ月および40カ月、p=0.00008)。Spentz
os et al.によって識別された過剰発現された遺伝子を使用して、生体標本を、化学療法
抵抗性卵巣癌、化学療法感受性卵巣癌、短DFS卵巣癌、長DFS卵巣癌、短OS卵巣癌、長OS卵
巣癌などの生物学的クラスに分類するモデル202を構築することができる。
卵巣癌用のモデル202の開発に使用することができる追加の研究には、Presneauet al.
, 2003,Oncogene 13, p. 1568およびTakano et al. ASCO 2003 abstract 1856が含まれ
る。ただしこれらに限定されるわけではない。
5.4.6 膀胱癌
Wulfinget al. アラキドン酸代謝に関与する誘導酵素Cox-2は、さまざまなヒト癌の中
で一般的に過剰発現されることが示されている。最近の研究によれば、Cox-2発現は、あ
る腫瘍実体に対する放射線または化学療法を受けている患者において予後値(prognostic
value)を有する。膀胱癌では、Cox-2発現が、生存データとあまり相関していない。これ
に対処するため、Wulfinget al. ASCO 2003 abstract 1621は、浸潤性膀胱癌の根治的膀
胱切除を受けた157人の患者を調べた。これらのうち、61人の患者は、補助セッティング
においてまたは転移性の病気のためにシスプラチンを含む化学療法を受けていた。モノク
ローナルCox-2抗体を適用しているパラフィン埋込み組織ブロックに標準免疫組織化学を
実行した。半定量的結果は、臨床的および病理的データ、長期生存率(3〜177カ月)および
化学療法上の詳細と相関した。26ケース(16.6パーセント)がCox-2陰性であった。全ての
陽性ケース(n=131、83.4パーセント)のうち、59ケース(37.6パーセント)は低いCox-2発現
を示し、53ケース(33.8パーセント)は中程度のCox-2発現を示し、19ケース(12.1パーセン
ト)は強いCox-2発現を示した。発現は、TNMステージングおよび組織学的グレーディング
とは独立していた。Cox-2発現は、腫瘍の組織学的タイプと有意に相関した(尿路上皮癌対
扁平上皮癌、P=0.01)。調べた全てのケースで、カプラン-マイヤー(Kaplan-Meier)解析は
、全体生存および無病生存に対する統計的な相関を示さなかった。しかし、シスプラチン
を含む化学療法を受けた患者のサブグループ解析によって、Cox-2発現は、不良な全体生
存期間と有意に関係していた(P=0.03)。Wulfing et al.によれば、Cox-2の免疫組織化学
過剰発現は膀胱癌において非常に一般的な事象である。化学療法を受けている患者は、腫
瘍内でCox-2を過剰発現するときにより悪い生存率を有するようである。したがってWulfi
ng et al.は、Cox-2発現は、シスプラチンベースの化学療方法を用いて治療された膀胱癌
の患者に対する追加の予後情報を提供することができ、これを、個々の患者における
より攻撃的な療法または選択的Cox-2阻害薬を使用したリスク適応標的療法(risk-adapted
targetedtherapy)の基礎とすることができることを論証した。Wulfing et al.の結果を
使用して、膀胱癌母集団を治療群に層化するモデル202を開発することができる。
5.4.7 胃癌
Terashimaet al. ヒトの胃癌の化学療法抵抗性関連遺伝子を検出するため、Terashima
et al.,ASCO 2003 abstract 1161は、DNAマイクロアレイを使用して遺伝子発現プロフ
ァイルを調べ、結果をin vitro薬物感受性と比較した。合計16人の胃癌患者から新鮮な腫
瘍組織を得、次いで、12,000のヒト遺伝子およびEST配列を含むGeneChip Human U95Av2ア
レイ(Affymetrix、米カリフォルニア州SantaClara)を使用して遺伝子発現プロファイル
を調べた。その所見を、ATPアッセイによって決定されたin vitro薬物感受性の結果と比
較した。調べた薬物および薬物濃度は、シスプラチン(CDDP)、ドキソルビシン(DOX)、マ
イトマイシンC(MMC)、エトポシド(ETP)、イリノテカン(CPT、SN-38として)、5-フルオロ
ウラシル(5-FU)、ドキシフルリジン(5'-DFUR)、パクシタキセル(TXL)およびドセタキセル
(TXT)である。薬物は、それぞれの薬物のCmaxの濃度で72時間加えた。薬物感受性は、薬
物処理群のATP含量と対照群のATP含量の比(T/Cパーセント)として表した。相対的な遺伝
子発現量とT/Cパーセントの間のピアソン相関を評価し、さらに、この相関によって選択
された遺伝子を使用してクラスタリング解析を実行した。これらの解析から、CDDPで51遺
伝子、DOXで34遺伝子、MMCで26遺伝子、ETPで52遺伝子、CPTで51遺伝子、5-FUで85遺伝子
、5'-DFURで42遺伝子、TXLで11遺伝子およびTXTで32遺伝子が薬物抵抗性腫瘍内でアップ
レギュレートされた。これらの遺伝子の大部分は、細胞成長、細胞周期調節、アポトーシ
ス、熱ショックタンパク質またはユビキチン-プロテアソーム経路に関係した。しかし、
リボソームタンパク質、CD44および伸長因子αなどのいくつかの遺伝子は、それぞれの薬
剤抵抗性腫瘍内で特異的にアップレギュレートされた。Terashima et al.によって識別さ
れたアップレギュレートされたこれらの遺伝子を使用して、胃癌の患者を診断するだけで
なく、患者が薬剤抵抗性胃部腫瘍を有するかどうかの指示、および薬剤抵抗性胃部腫瘍を
有する場合にはその種類を与えるモデル202を開発することができる。
胃癌用のモデル202の開発に使用することができる追加の参考文献には、Kimet al. AS
CO 2003abstract 560、Arch-Ferrer et al. ASCO 2003 abstract 1101、Hobday ASCO 20
03 abstract1078、Song et al. ASCO 2003 abstract 1056(Rb遺伝子の過剰発現は、再発
のない生存を予測する独立の予後因子である)、Leichman el al., ASCO 2003 abstract 1
054 (食道癌/胃癌のケモベネフィット(chemobenefit)予測因子としてのチミジル酸シンタ
ーゼ発現)が含まれる。ただしこれらに限定されるわけではない。
5.4.8 直腸癌
Lenz etal. 局所再発は、直腸癌の患者の臨床上の重大問題である。Lenz el al. ASCO
2003abstract 1185は、補助的化学放射線で治療した直腸癌の患者の骨盤再発(pelvic r
ecurrence)を予測する遺伝子プロファイルを確立することを追求した。1991〜2000年に、
局所的に進んだ直腸癌を有するメジアン年齢52.1才の女性25人、男性48人、合計73人の患
者を治療した。組織学的ステージングは22人の患者をステージT2として、51人の患者をス
テージT3として分類した。合計35人の患者はリンパ節陰性であり、38人の患者は1つまた
は複数のリンパ節転移を有した。全ての患者は、癌切除を受け、その後に5-FU+骨盤放射
線治療を受けた。ホルマリン固定され、パラフィンで包埋され、レーザキャプチャマイク
ロ切開された(laser-capture-microdissected)組織からRNAを抽出した。Lenz et al.は
、腫瘍および隣接する正常組織の5FU経路(TS、DPD)、脈管形成(VEGF)およびDNA修復(ERCC
1、RAD51)に関与する遺伝子のmRNAレベルを定量的RT-PCR(Taqman)によって決定した。Le
nz et al.は、局所腫瘍再発と隣接する正常組織内でのERCC1およびTSのより高いmRNA発現
レベルとの間の有意な関連が、5-FU経路ならびにDNA修復および脈管形成の標的遺伝子の
遺伝子発現レベルが、骨盤再発の危険性がある患者を識別するのに有用である可能性があ
ることを示唆していることを発見した。これらのLenz et al.の結果を使用して、骨盤再
発の危険性がある患者を識別するモデル202を開発することができる。
5.4.9 追加の例示的な生物学的特徴
代表的な追加の生物学的特徴には、アクネ、先端巨大症、急性胆嚢炎、アジソン病、腺
筋症、成人性成長ホルモン欠損症、成人性軟部組織肉腫、アルコール依存症、アレルギー
性鼻炎、アレルギー、脱毛症、アルツハイマー病、羊水穿刺、心不全における貧血、貧血
、狭心症、強直性脊椎炎、不安障害、卵巣男性胚細胞腫、不整脈、関節炎、関節炎に関係
した眼の問題、喘息、アテローム性動脈硬化症、アトピー性湿疹、萎縮性膣炎、注意欠陥
障害、注意障害、自己免疫疾患、亀頭包皮炎、禿頭症、バルトリン膿瘍、出生時欠損、出
血障害、骨癌、脳および脊髄腫瘍、脳幹神経膠腫、脳腫瘍、乳癌、乳癌発癌リスク、乳房
疾患、癌、腎臓癌、心筋症、頚動脈疾患、頚動脈内膜切除、手根管症候群、脳性麻痺、子
宮頚癌、軟性下疳、水痘、小児期ネフローゼ症候群、クラミジア、慢性下痢、慢性心不全
、跛行、結腸、大腸または直腸癌、結腸直腸癌、感冒、コンジローム(性器いぼ)、先天性
甲状腺腫、うっ血性心不全、結膜炎、角膜疾患、角膜潰瘍、冠状動脈性心疾患、クリプト
スポリジウム症、クッシング症候群、嚢胞性線維症、膀胱炎、膀胱鏡検査または尿管鏡検
査、ドケルヴァン病、痴呆、うつ病、躁病、糖尿病、尿崩症、真性糖尿病、糖尿病性網膜
症、ダウン症候群、青年期月経困難症、性交疼痛症、耳アレルギー、耳感染症、摂食障害
、湿疹、気腫、心内膜炎、子宮内膜癌、子宮内膜症、小児期遺尿症、精巣上体炎、癲癇、
会陰切開、勃起性機能不全、眼癌、致死性精神集中(fatal abstraction)、便失禁、女性
性機能障害、胎児奇形、胎児性アルコール症候群、線維筋痛症、インフルエンザ、毛包炎
、真菌感染、ガードネレラバジナリス(gardnerella vaginalis)、性器カンジダ症、陰部
ヘルペス、妊娠糖尿病、緑内障、糸球体の病気、淋病、痛風および偽痛風、成長障害、ゴ
ム病(gumdisease)、毛髪の疾患、口臭、ハンブルゲル病(Hamburger disease)、血友病、
肝炎、B型肝炎、遺伝性大腸癌、ヘルペス感染、ヒト胎盤性ラクトゲン、副甲状腺機能亢
進症、高血圧症、甲状腺機能亢進症、低血糖症、性腺機能低下症、尿道下裂、甲状腺機能
低下症、子宮摘出、インポテンス、不妊症、炎症性腸疾患、鼠径ヘルニア、遺伝性臓不整
、眼内黒色腫、過敏性腸症候群、カポージ肉腫、白血病、肝臓癌、肺癌、肺疾患、マラリ
ア、躁うつ病、麻疹、記憶喪失、小児期髄膜炎、月経過多、中皮腫、ミクロアルブミン、
片頭痛、中間痛、口腔癌、運動障害、耳下腺炎、ナーボト嚢胞、ナルコレプシー、鼻アレ
ルギー、鼻腔および副鼻腔癌、神経芽細胞腫、神経線維腫症、神経障害、新生児黄疸、肥
満症、強迫性障害、精巣炎または精巣上体炎、口腔顔面筋機能障害、変形性関節症、骨粗
鬆症、骨粗鬆症、骨肉腫、卵巣癌、卵巣嚢胞、膵臓癌、嵌頓包茎、パーキンソン病、部分
癲癇、骨盤腹膜炎、消化性潰瘍、産褥性心筋症、ペーロニー病、多嚢胞性卵巣症候群、子
癇前症、プレグナンジオール、月経前症候群、有痛性持続勃起症、プロラクチノーマ、前
立腺癌、乾癬、リウマチ熱、唾液腺癌、SARS、性病、性腸感染症、性感染症、シーハン症
候群、副鼻腔炎、皮膚癌、睡眠障害、痘瘡、嗅覚障害、いびき、社会恐怖、二分脊椎、胃
癌、梅毒、精巣癌、甲状腺癌、甲状腺疾患、扁桃炎、歯の疾患、トリコモナス症、結核、
腫瘍、II型糖尿病、潰瘍性大腸炎、尿路感染症、泌尿器癌、子宮フィブロイド、膣癌、膣
嚢胞、外陰部痛および外陰膣炎が含まれる。ただしこれらに限定されるわけではない。
5.5 転写状態の測定
このセクションでは、細胞成分の一型である遺伝子発現レベルを測定するための例示的
ないくつかの方法を提供する。複数の生物のうちのそれぞれの生物の遺伝子発現レベルを
測定する以下の特定の方法に本発明が限定されないことを当業者は理解されたい。
5.5.1 マイクロアレイを使用した転写産物アッセイ
このセクションで説明される技法は、複数の遺伝子の発現レベルの同時決定を提供する
ために使用することができるポリヌクレオチドプローブアレイの提供を含む。これらの技
法はさらに、このようなポリヌクレオチドプローブアレイを設計し製作するための方法を
提供する。
遺伝子内のヌクレオチド配列の発現レベルは任意の高スループット技法によって測定す
ることができる。どのように測定されるにせよ、結果は、存在量または存在量比を表す値
を含む、転写産物または反応データの絶対量または相対量である。発現プロファイルの測
定は、このサブセクションで説明される転写産物アレイへのハイブリッド形成によって実
施されることが好ましい。一実施形態では、「転写産物アレイ」または「プロファイリン
グアレイ」が使用される。転写産物アレイを使用して、細胞サンプルの発現プロファイル
を解析し、特に、特定の組織タイプまたは発達状態の細胞サンプルの発現プロファイルを
測定し、あるいは関心の薬物に暴露した細胞サンプルの発現プロファイルを測定すること
ができる。
一実施形態では、発現プロファイルが、細胞内に存在するmRNA転写産物のヌクレオチド
配列を表す検出可能に標識されたポリヌクレオチド(例えば全細胞mRNAから合成された蛍
光標識されたcDNA)をマイクロアレイとハイブリッド形成させることによって得られる。
マイクロアレイは、細胞または生物のゲノム中のヌクレオチド配列の多く、好ましくはほ
とんどの遺伝子またはほぼ全ての遺伝子を表す、位置によってアドレス指定可能な支持体
上の結合(例えばハイブリッド形成)部位のアレイである。このような結合部位はそれぞれ
、支持体上の所定の領域に結合されたポリヌクレオチドプローブからなる。マイクロアレ
イはいくつかの方法で製作することができ、そのうちのいくつかを後に説明する。どのよ
うに製作されるにせよ、マイクロアレイはある特性を共有する。マイクロアレイは再生産
可能であり、所与のアレイの複数のコピーを製作し、互いを容易に比較することができる
。マイクロアレイは、結合(例えば核酸ハイブリッド形成)条件下で安定な材料から製作さ
れることが好ましい。マイクロアレイは小さいことが好ましく、例えば1cm2から25cm2
好ましくは1から3cm2であることが好ましい。しかし、これよりも大きなアレイおよびこ
れよりも小さなアレイも企図され、これらは例えば、非常に多数のまたは非常に少数の異
なるプローブを同時に評価するのに好ましい。
マイクロアレイ内の所与の結合部位または一意の結合部位セットは、細胞または生物の
単一の遺伝子内のヌクレオチド配列(例えば特定のmRNAまたはそれから得られた特定のcDN
Aのエキソン)と特異的に結合する(例えばハイブリッドを形成する)ことが好ましい。
使用されるマイクロアレイは、1つまたは複数の試験プローブを含むことができ、それ
らはそれぞれ、検出するRNAまたはDNAの部分配列に相補的なポリヌクレオチド配列を有す
る。それぞれのプローブは一般に異なる核酸配列を有し、アレイの固体表面上のそれぞれ
のプローブの位置は通常、既知である。実際、マイクロアレイはアドレス指定可能なアレ
イであることが好ましく、位置によってアドレス指定可能なアレイであることがより好ま
しい。アレイ(例えば支持体または表面)上のそれぞれのプローブの位置からそれぞれのプ
ローブの識別(例えば配列)を決定することができるように、アレイのそれぞれのプローブ
は、固体支持体上の所定の既知の位置に位置することが好ましい。いくつかの実施形態で
はアレイが順序付きアレイ(ordered array)である。
マイクロアレイまたは一組のマイクロアレイ上のプローブの密度は、異なる(例えば同
一でない)プローブが1cm2あたり100個以上ある密度であることが好ましい。より好ましく
は、本発明の方法で使用されるマイクロアレイが1cm2あたり少なくとも550個、1cm2あた
り少なくとも1,000個、1cm2あたり少なくとも1,500個、1cm2あたり少なくとも2,000個、1
cm2あたり少なくとも8,000個または1cm2あたり少なくとも15,000個のプローブを有し、あ
るいは1cm2あたり15,000個超のプローブを有する。したがって、本発明で使用されるマイ
クロアレイは、異なる(例えば同一でない)プローブを、少なくとも25,000個、少なくとも
50,000個、少なくとも100,000個、少なくとも150,000個、少なくとも200,000個、少なく
とも250,000個、少なくとも500,000個または少なくとも550,000個含むことが好ましい。
一実施形態ではマイクロアレイが、アレイのそれぞれの位置が、遺伝子によってコード
された転写産物のヌクレオチド配列(例えばmRNAまたはそれから得られたcDNAのエキソン)
が結合するための別個の結合部位を表すアレイ(例えばマトリックス)である。マイクロア
レイ上の結合部位の集合は、複数の遺伝子のための結合部位のセットを含む。例えば、さ
まざまな実施形態では本発明のマイクロアレイが、生物のゲノム中の50パーセント未満の
遺伝子によってコードされた産物が結合するための結合部位を含むことができる。あるい
は、本発明のマイクロアレイは、生物のゲノム中の少なくとも50パーセント、少なくとも
75パーセント、少なくとも85パーセント、少なくとも90パーセント、少なくとも95パーセ
ント、少なくとも99パーセントまたは100パーセントの遺伝子によってコードされた産物
が結合するための結合部位を有することができる。他の実施形態では、本発明のマイクロ
アレイが、生物の細胞によって発現される50パーセント未満、少なくとも50パーセント、
少なくとも75パーセント、少なくとも85パーセント、少なくとも90パーセント、少なくと
も95パーセント、少なくとも99パーセントまたは100パーセントの遺伝子によってコード
された産物が結合するための結合部位を有することができる。結合部位は、特定のRNAが
それと特異的にハイブリッドを形成することができるDNAまたはDNA類似体とすることがで
きる。DNAまたはDNA類似体は例えば合成オリゴマーまたは遺伝子断片、例えばエキソンに
対応する合成オリゴマーまたは遺伝子断片とすることができる。
本発明のいくつかの実施形態では、遺伝子またはエキソンの異なる配列セグメントに相
補的な異なるポリヌクレオチドを有するプローブを含む一組の結合部位によって、遺伝子
または遺伝子内のエキソンがプロファイリングアレイの中に表現される。このようなポリ
ヌクレオチドの長さは好ましくは15から200塩基、より好ましくは20から100塩基、最も好
ましくは40〜60塩基である。プローブ配列はそれぞれ、その標的配列に相補的な配列に加
えてリンカー配列をさらに含むことができる。本明細書で使用されるとき、リンカー配列
は、その標的配列に相補的な配列と支持体の表面との間の配列である。例えば、好ましい
実施形態では、本発明のプロファイリングアレイが、それぞれの標的遺伝子またはエキソ
ンに特異的な1つのプローブを含む。しかし、所望ならば、プロファイリングアレイは、
いくつかの標的遺伝子またはエキソンに特異的な少なくとも2つ、5つ、10個、100個また
は1000個のプローブを含み、あるいは1000個を超えるプローブを含むことができる。例え
ばこのアレイは、1つの遺伝子の最も長いmRNAアイソフォームの配列を横切って一塩基ス
テップで配置されたプローブを含むことができる。
本発明の特定の実施形態では、エキソンが選択的にスプライシングされた複数の変異体
(variant)を有するとき、エキソンプロファイリングアレイの中に、エキソンの最も長い
変異体を含むゲノム領域を横切るオーバラップした連続配列、すなわちタイルドシーケン
ス(tiledsequence)からなる一組のポリヌクレオチドプローブを含めることができる。こ
の一組のポリヌクレオチドプローブは、所定の塩基間隔で、例えば1、5または10塩基間隔
で、オーバラップした連続配列を含むことができ、または最も長い変異体を含むmRNAにま
たがることができ、または最も長い変異体を含むmRNAを横切ってタイリングされる(tiled
)。したがってこのようなプローブのセットを使用して、エキソンの全ての変異体を含む
ゲノム領域を走査し、エキソンの発現された1つまたは複数の変異体を決定し、エキソン
の発現された1つまたは複数の変形を決定することができる。あるいは、またはこれに加
えて、エキソン特異プローブおよび/または変異体結合プローブ(variant junction probe
)を含む一組のポリヌクレオチドプローブを、エキソンプロファイリングアレイに含める
ことができる。本明細書で使用されるとき、変異体結合プローブは、特定のエキソン変異
体と近隣のエキソンの接合領域に特異的なプローブを指す。いくつかのケースでは、この
プローブセットが、エキソンの全ての異なるそれぞれのスプライス部位配列と特異的にハ
イブリッド形成可能な変異体結合プローブを含む。他のケースでは、このプローブセット
が、エキソンの全ての異なる変異体の中の共通配列と特異的にハイブリッドを形成するこ
とができるエキソン特異プローブ、および/またはエキソンの全ての異なるスプライス部
位配列と特異的にハイブリッドを形成することができる変異体結合プローブを含む。
いくつかのケースでは、完全長エキソンに相補的なポリヌクレオチドを含むプローブに
よって、エキソンプロファイリングアレイの中にエキソンが表現される。このような事例
では、エキソンが、プロファイリングアレイ上の単一の結合部位によって表現される。好
ましいいくつかのケースでは、エキソンが、プロファイリングアレイ上の1つまたは複数
の結合部位によって表現され、結合部位はそれぞれ、標的エキソンのかなりの部分である
RNA断片に相補的なポリヌクレオチド配列を有するプローブを含む。このようなプローブ
の長さは通常15〜600塩基であり、好ましくは20〜200塩基、より好ましくは30〜100塩基
、最も好ましくは40〜80塩基である。エキソンの平均長は約200塩基である(例えばLewin,
Genes V,Oxford University Press, Oxford, 1994を参照されたい)。長さ40〜80のプロ
ーブは、これよりも短いプローブよりも特異的なエキソンの結合を可能にし、それによっ
て標的エキソンに対するプローブの特異性を増大させる。ある種の遺伝子では、1つまた
は複数の標的エキソンが、40〜80塩基よりも短い配列を有する。このようなケースでは、
標的エキソンよりも長い配列を有するプローブを使用する場合、プローブ配列がmRNA内の
対応する配列セグメントに相補的であるように、構成的にスプライシングされた(constit
utivelyspliced)隣接する1つまたは複数のエキソンからの配列が両側に位置する標的エ
キソン全体を含む配列を含むプローブを設計することが望ましい。ゲノムフランキング配
列、すなわちイントロン配列ではなく、構成的にスプライシングされた隣接する1つまた
は複数のエキソンからのフランキング配列を使用することは、同じ長さの他のプローブと
の比較可能なハイブリッド形成ストリンジェンシー(stringency)を可能にする。使用され
るフランキング配列は、オルタナティブ経路(alternative pathway)に含まれていない構
成的にスプライシングされた隣接する1つまたは複数のエキソンからのフランキング配列
であることが好ましい。交差ハイブリッド形成を最小限に抑えることができるように、使
用されるフランキング配列は、隣接する1つまたは複数のエキソンの配列のかなりの部分
を含まないことがより好ましい。いくつかの実施形態では、所望のプローブ長よりも短い
標的エキソンが選択的スプライシングに含まれるときに、選択的にスプライシングされた
異なるmRNAの中のフランキング配列を含むプローブが、選択的にスプライシングされた異
なるmRNAの中で発現されたエキソンの発現レベルを測定できるように設計される。
いくつかの事例では、選択的スプライシング経路および/または別個の遺伝子内のエキ
ソン複製が区別されるとき、DNAアレイまたはアレイセットはさらに、2つの隣接するエキ
ソンの接合領域をまたぐ配列に相補的なプローブを含むことができる。交差ハイブリッド
形成を最小限に抑えることができるように、このようなプローブが、それぞれの個々のエ
キソンに対するプローブと実質的にオーバラップされていない2つのエキソンからの配列
を含むことが好ましい。2つ以上のエキソンからの配列を含むプローブは、1つまたは複数
の選択的にスプライシングされたmRNAおよび/あるいは複製されたエキソンを含む1つまた
は複数の分離された遺伝子内にそれらのエキソンがあり、他の選択的にスプライシングさ
れたmRNAおよび/または複製されたエキソンを含む他の遺伝子の中にエキソンがない場合
に、選択的スプライシング経路および/または別個の遺伝子内の複製されたエキソンの発
現を区別するのに有用である。あるいは、別個の遺伝子の複製エキソンに関して、異なる
遺伝子からのエキソンが配列相同性のかなりの差を示す場合には、異なる遺伝子からのエ
キソンを区別できるように異なるプローブを含むことが好ましい。
複数の遺伝子の発現プロファイルをより正確に決定できるように、上記の任意のプロー
ブ構成を組み合わせて、同じプロファイリングアレイ上および/または同じプロファイリ
ングアレイセット内の異なるアレイ上に配置することができることは当業者には明白であ
る。プロファイリングの異なるレベルの正確さに対してこれらの異なるプローブ構成を使
用できることも当業者には明白であろう。例えば、それぞれのエキソンに対する小さなプ
ローブセットを含むプロファイリングアレイまたはアレイセットを使用して、関連遺伝子
および/またはある特定の条件下でのRNAスプライシング経路を決定することができる。次
いで、関心のエキソンに対するより大きなプローブセットを含むアレイまたはアレイセッ
トを使用して、このような特定の条件下でのエキソン発現プロファイルをより正確に決定
する。異なるプローブ構成のより有利な使用を可能にする他のDNAアレイ戦略も包含され
る。
本発明で使用されるマイクロアレイは、関心の薬物の作用に関連する、あるいは関心の
生物学的経路中の1つまたは複数の遺伝子のエキソンのセットに対する結合部位(すなわち
プローブ)を有することが好ましい。以前に論じたとおり、「遺伝子」は、RNAポリメラー
ゼによって転写されたDNAの一部として識別され、5非翻訳領域(「UTR」)、イントロン、
エキソンおよび3UTRを含む。ゲノム内の遺伝子の数は、細胞または生物によって発現され
るmRNAの数から推定し、またはゲノムのよく特性づけされた部分の外挿によって推定する
ことができる。関心の生物のゲノムが配列決定されると、ORFの数を決定し、そのDNA配列
の解析によってmRNAコード領域を識別することができる。例えば、Saccharomycescerevi
siaeのゲノムは完全に配列決定されており、それは、99アミノ酸残基よりも長い配列をコ
ードする約6275のORFを有すると報告されている。これらのORFの解析は、タンパク質生成
物をコードしそうな5,885のORFがあることを指示する(Goffeauet al., 1996, Science 2
74: 546-567)。対照的に、ヒトゲノムは、約30,000から130,000の遺伝子を含むと推定さ
れている(Crolliuset al., 2000, Nature Genetics 25:235-238、Ewing et al., 2000,
Nature Genetics25:232-234を参照されたい)。キイロショウジョウバエ(Drosophila)、C
. elegans、植物、例えばイネおよびシロイヌナズナ(Arabidopsis)、ならびに哺乳類、例
えばマウスおよびヒトを含む他の生物のゲノム配列も完成またはほとんど完成されている
。したがって、本発明の好ましい実施形態では、生物のゲノム内の既知のまたは予測され
る全てのエキソンに対するプローブを全体で含むアレイセットが提供される。非限定的な
例として、本発明は、ヒトゲノム中のそれぞれの既知のまたは予測されるエキソンに対す
る1つまたは2つのプローブを含むアレイセットを提供する。
細胞のRNAに相補的なcDNAが製作され、適当なハイブリッド形成条件下でマイクロアレ
イにハイブリッド形成されているとき、任意の特定の遺伝子のエキソンに対応するアレイ
内の部位に対するハイブリッド形成レベルは、その遺伝子から転写されたエキソンを含む
1つまたは複数のmRNAのその細胞における有病率(prevalence)を反映することを理解され
たい。例えば、全細胞mRNAに相補的な検出可能に標識された(例えば蛍光団を有する) cDN
Aがマイクロアレイにハイブリッド形成されたとき、転写されずまたは細胞のRNAスプライ
シング中に除去された遺伝子のエキソンに対応する(例えば遺伝子発現の1つまたは複数の
産物と特異的に結合する能力を有する)アレイ上の部位は、信号(例えば蛍光信号)をほと
んどまたは全く発せず、エキソンを発現しているコードされたmRNAが優勢である遺伝子の
エキソンは比較的に強い信号を発する。次いで、選択的スプライシングによって同じ遺伝
子から生み出された異なるmRNAの相対的な存在量が、その遺伝子に対する監視されたエキ
ソンの完全セットを横切る信号強度パターンによって決定される。
一実施形態では、2つの異なる条件に由来する細胞サンプルのcDNAが、2色プロトコルを
使用してマイクロアレイの結合部位にハイブリッド形成される。薬物反応の場合、1つの
細胞サンプルが薬物に暴露され、同じタイプの他の細胞サンプルは薬物に暴露されない。
経路反応の場合、1つの細胞が経路摂動(perturbation)に暴露され、同じタイプの他の細
胞サンプルは経路摂動に暴露されない。これらの2つのそれぞれの細胞タイプから得られ
たcDNAは、互いに区別できるように異なる方法で(例えばCy3およびCy5で)標識される。一
実施形態では、例えば、薬物で処理された(または経路摂動に暴露された)細胞に由来する
cDNAが、フルオレセインで標識されたdNTPを使用して合成され、薬物に暴露されていない
第2の細胞からのcDNAが、ローダミンで標識されたdNTPを使用して合成される。これらの2
つのcDNAが混合され、マイクロアレイにハイブリッド形成されると、それぞれのcDNAセッ
トからの相対的な信号強度が、アレイ上のそれぞれの部位に関して決定され、特定のエキ
ソンの存在量の相対的な差が検出される。
先に説明した例では、薬物処理した(経路摂動に暴露した)細胞からのcDNAは蛍光団が刺
激されたときに緑の蛍光を発し、無処理の細胞からのcDNAは赤い蛍光を発する。その結果
、細胞内の特定の遺伝子の転写および/または転写後スプライシングに対して薬物処理が
直接または間接の効果を持たないとき、両方の細胞のエキソン発現パターンは区別できず
、逆転写後、赤く標識されたcDNAと緑に標識されたcDNAは等しく優勢である。マイクロア
レイにハイブリッド形成されると、そのRNA種に対する結合部位は両方の蛍光団に特徴的
な波長を発する。対照的に、薬物暴露された細胞が、細胞内の特定の遺伝子の転写および
/または転写後スプライシングを直接または間接に変化させる薬物で処理されるとき、そ
れぞれのエキソン結合部位に対する緑と赤の蛍光の比によって表現されるエキソン発現パ
ターンが変化する。薬物がmRNAの有病率を増大させるとき、そのmRNAの中で発現されるそ
れぞれのエキソンに対するこれらの比は増大し、薬物がmRNAの有病率を低下させるとき、
そのmRNAの中で発現されるそれぞれのエキソンに対するこれらの比は低下する。
2色蛍光標識/検出方式を使用して遺伝子発現の変化を定義することは、mRNAの検出に関
して、例えばあらゆる目的のためにその全体が参照によって組み込まれるSchena et al.,
1995,Quantitative monitoring of gene expression patterns with a complementary
DNA microarray,Science 270:467-470に記載されている。この方式は、エキソンの標識
化および検出に等しく適用可能である。2つの異なる蛍光団で標識されたcDNAを使用する
利点は、2つの細胞状態にあるそれぞれの遺伝子に対応するmRNAまたはエキソン発現レベ
ルの内部的に制御された直接比較を実施でき、実験条件(例えばハイブリッド形成条件)の
小さな違いに起因する変動が以降の解析に影響を及ぼさないことである。しかし、単一の
細胞からのcDNAを使用し、例えば薬物処理または経路摂動を与えた細胞と未処理の細胞と
で例えば特定のエキソンの絶対量を比較することもできることを理解されたい。さらに本
発明では3色以上を用いた標識化も企図される。本発明のいくつかの実施形態では、異な
る色の少なくとも5、10、20または100種の染料を標識化に使用することができる。このよ
うな標識化は、区別可能に標識されたcDNA母集団の同じアレイへの同時ハイブリッド形成
を可能にし、したがって3つ以上のサンプルから得られたmRNA分子の発現レベルを測定し
、任意選択で比較することを可能にする。使用することができる染料には、フルオレセイ
ンおよびその誘導体、ローダミンおよびその誘導体、テキサスレッド(texas red)、5カル
ボキシフルオレセイン(「FMA」)、2,7-ジメトキシ-4,5-ジクロロ-6-カルボキシフルオレ
セイン(「JOE」)、N,N,N',N'-テトラメチル-6-カルボキシローダミン(「TAMRA」)、6カル
ボキシ-X-ローダミン(「ROX」)、HEX、TET、IRD40およびIRD41、Cy3、Cy3.5およびCy5を
含むシアニン染料、BODIPY-FL、BODIPY-TR、BODIPY-TMR、BODIPY-630/650およびBODIPY-6
50/670を含むBODIPY染料、ALEXA-488、ALEXA-532、ALEXA-546、ALEXA-568およびALEXA-59
4を含むALEXA染料、ならびに当業者に知られている他の蛍光染料が含まれる。ただしこれ
らに限定されるわけではない。
本発明のいくつかの実施形態では、ハイブリッド形成レベルの平衡状態への漸進的変化
を決定できるように、ハイブリッド形成データが、異なる複数のハイブリッド形成時刻に
測定される。このような実施形態では、混合物が平衡状態に近く、ハイブリッドが、拡散
ではなく親和力および存在量に依存した濃度にあるように、ハイブリッド形成レベルが、
時刻ゼロから標識されたポリヌクレオチドによって結合されたポリヌクレオチド(すなわ
ち1つまたは複数のプローブ)のサンプリングの必要な時間を十分に越える時刻までの範囲
にまたがるハイブリッド形成時刻に測定されることが最も好ましい。しかし、標識された
ポリヌクレオチドとプローブおよび/または表面との間の不可逆的な結合相互作用が起こ
らず、または少なくとも限定されるように、ハイブリッド形成時間は十分に短いことが好
ましい。例えば、ポリヌクレオチドアレイを使用して、断片化されたポリヌクレオチドの
複雑な混合物を精査する実施形態では、一般的なハイブリッド形成時間が約0〜72時間で
ある。他の実施形態のための適当なハイブリッド形成時間は、使用される特定のポリヌク
レオチド配列およびプローブに依存し、当業者はこの時間を決定することができる (例え
ばSambrooket al., Eds., 1989, Molecular Cloning: A Laboratory Manual, 2nd ed.,
Vol. 1-3, ColdSpring Harbor Laboratory, Cold Spring Harbor, New Yorkを参照され
たい)。
一実施形態では、異なるハイブリッド形成時刻のハイブリッド形成レベルが、異なる全
く同じマイクロアレイ上で別々に測定される。このようなそれぞれの測定では、ハイブリ
ッド形成レベルが測定されるときに、マイクロアレイが、好ましくは室温で、高濃度から
中濃度の塩濃度(例えば0.5から3M塩濃度)を有する水溶液中で、結合されまたはハイブリ
ッド形成された全てのポリヌクレオチドを保持し、結合していない全てのポリヌクレオチ
ドを除去する条件下で、簡単に洗浄される。次いで、それぞれのプローブ上のハイブリッ
ド形成された残存ポリヌクレオチド分子上の検出可能な標識を、使用される特定の標識化
法に対して適当な方法によって測定する。次いで結果として生じたハイブリッド形成レベ
ルを組み合わせてハイブリッド形成曲線を形成する。他の実施形態では、ハイブリッド形
成レベルが単一のマイクロアレイを使用してリアルタイムで測定される。この実施形態で
は、このマイクロアレイを中断なしにサンプルにハイブリッド形成させることができ、こ
のマイクロアレイは、それぞれのハイブリッド形成時刻に非侵襲的に問い合わされる。他
の実施形態では、1つのアレイを使用し、短い時間ハイブリッド形成させ、洗浄し、ハイ
ブリッド形成レベルを測定し、同じサンプルに戻り、別の期間ハイブリッド形成し、洗浄
し、再び測定して、ハイブリッド形成時刻曲線を得ることができる。
2つの異なるハイブリッド形成時刻の少なくとも2つのハイブリッド形成レベル、すなわ
ち交差ハイブリッド形成平衡のタイムスケールに近いハイブリッド形成時刻における第1
のハイブリッド形成レベルと、第1の時刻よりも長いハイブリッド形成時刻において測定
される第2のハイブリッド形成レベルが測定されることが好ましい。交差ハイブリッド形
成平衡のタイムスケールはとりわけサンプル構成およびプローブ配列に依存し、当業者は
これを決定することができる。好ましい実施形態では、第1のハイブリッド形成レベルが1
時間から10時間までの間に測定され、第2のハイブリッド形成レベルが、第1のハイブリッ
ド形成時間の2、4、6、10、12、16、18、48または72倍の時間で測定される。
5.5.1.1 マイクロアレイ用のプローブの調製
先に述べたとおり、エキソンなどの特定のポリヌクレオチド分子が特異的にハイブリッ
ドを形成する本発明に基づく「プローブ」は相補的なポリヌクレオチド配列である。それ
ぞれの標的エキソンに対して1つまたは複数のプローブが選択されることが好ましい。例
えば、エキソンの検出のために最低限の数のプローブが使用されるとき、プローブは通常
、40塩基よりも長いヌクレオチド配列を含む。あるいは、エキソンに対して大きな冗長プ
ローブセットが使用されるとき、プローブは通常、40〜60塩基のヌクレオチド配列を含む
。プローブはさらに、完全長エキソンに相補的な配列を含むことができる。エキソンの長
さは50塩基未満から200塩基超の範囲をとる。したがって、エキソンよりも長いプローブ
が使用されるときには、プローブ配列が標的エキソンを含む連続mRNA断片に相補的となる
ように、構成的にスプライシングされた隣接するエキソン配列でエキソン配列を増大させ
ることが好ましい。これは、エキソンプロファイリングアレイのプローブの中で比較可能
なハイブリッド形成ストリンジェンシーを可能にする。プローブ配列はそれぞれ、その標
的配列に相補的な配列に加えてリンカー配列をさらに含むことができることを理解された
い。
プローブは、生物のゲノム内のそれぞれの遺伝子のそれぞれのエキソンの一部に対応す
るDNAまたはDNA「ミミック」(例えば誘導体および類似体)を含むことができる。一実施形
態では、マイクロアレイのプローブが相補RNAまたはRNAミミックである。DNAミミックは
、DNAと特異的にワトソン-クリック型のハイブリッドを形成することができ、またはRNA
と特異的にハイブリッドを形成することができるサブユニットからなるポリマーである。
核酸は、塩基部分、糖部分またはリン酸主鎖で修飾されることができる。例示的なDNAミ
ミックは例えばホスホロチオアートを含む。DNAは例えば、ゲノムDNA、cDNA(例えばRT-PC
Rによる)またはクローン配列からのエキソンセグメントのポリメラーゼ連鎖反応(PCR)増
幅によって得ることができる。PCRプライマーは、固有の断片(例えばマイクロアレイ上の
他の断片と、連続した全く同じ配列を10塩基を超えて共有しない断片)の増幅を与えるエ
キソンまたはcDNAの既知の配列に基づいて選択されることが好ましい。Oligoversion 5.
0(NationalBiosciences)などの当技術分野ではよく知られているコンピュータプログラ
ムは、必要な特異性および最適の増幅特性を有するプライマーの設計において有用である
。マイクロアレイ上のそれぞれのプローブの長さは一般に20塩基から600塩基であり、通
常は30から200塩基である。PCR法は当技術分野ではよく知られており、例えばInniset a
l., eds., 1990,PCR Protocols: A Guide to Methods and Applications, Academic Pre
ss Inc., San Diego,CA.に記載されている。制御されたロボットシステムが、核酸を分
離し増幅するために有用であることは当業者には明白である。
マイクロアレイのポリヌクレオチドプローブを生成する好ましい代替手段は、例えばN-
ホスホナートまたはホスホルアミダイト(phosphoramidite)ケミストリを使用した合成ポ
リヌクレオチドまたはオリゴヌクレオチドの合成である(Froehler et al., 1986, Nuclei
c Acid Res. 14:5399-5407、McBride et al., 1983, Tetrahedron Lett. 24:246-248)。
合成配列の長さは一般に15から600塩基、より一般的には20から100塩基、最も好ましくは
40から70塩基である。いくつかの実施形態では合成核酸が、イノシンなどの非天然塩基を
含む。ただしイノシンに限定されるわけではない。先に述べたとおり、ハイブリッド形成
のための結合部位として核酸類似体を使用することができる。適当な核酸類似体の例はペ
プチド核酸である (例えばEgholmet al., 1993, Nature 363:566-568および米国特許第5
,539,083号を参照されたい)。
代替実施形態では、ハイブリッド形成部位(すなわちプローブ)が、遺伝子、cDNA(例え
ば発現された配列タグ)またはそれに由来する挿入断片のプラスミドまたはファージクロ
ーンから作られる(Nguyenet al., 1995, Genomics 29:207-209)。
5.5.1.2.固体表面への核酸の付着
前もって形成されたポリヌクレオチドプローブを支持体上に付着させてアレイを形成す
ることができる。あるいは、支持体上でポリヌクレオチドプローブを直接に合成してアレ
イを形成することもできる。プローブは固体支持体または表面に付着され、固体支持体ま
たは表面は、例えばガラス、プラスチック(例えばポリプロピレン、ナイロン)、ポリアク
リルアミド、ニトロセルロース、ゲルあるいは他の多孔質または非多孔質材料から製作す
ることができる。
表面に核酸を付着させる好ましい1つの方法は、Schena et al., 1995, Science 270:46
7-470に全般的に説明されている、ガラス板上にプリントする方法である。この方法は、c
DNAのマイクロアレイを調製するのに特に有用である(DeRisiet al, 1996, Nature Genet
ics 14:457-460、Shalonet al., 1996, Genome Res. 6: 639-645およびSchena et al.,
1995, Proc.Natl. Acad. Sci. U.S.A. 93:10539-11286も参照されたい)。
マイクロアレイを製作する好ましい第2の方法は、高密度ポリヌクレオチドアレイを製
作する方法である。insitu合成のためのフォトリソグラフィ技法 (Fodor et al., 1991,
Science251:767-773、Lockhart et al., 1996, Nature Biotechnology 14:1675、米国
特許第5,578,832号、5,556,752号および5,510,270号参照)または定義されたオリゴヌク
レオチドの急速合成および付着のための他の方法(Blanchard et al., Biosensors & Bioe
lectronics11:687-690)を使用して、定義された配列に相補的な数千個のオリゴヌクレオ
チドを含むアレイを表面上の定義された位置に製作する技法は知られている。これらの方
法が使用されるときには、誘導体化されたガラススライドなどの表面に、既知の配列のオ
リゴヌクレオチド(例えば60量体)が直接に合成される。生み出されるアレイは、エキソン
ごとにいくつかのポリヌクレオチド分子を有する冗長アレイとすることができる。
マスキング(Maskosand Southern, 1992, Nucl. Acids. Res. 20: 1679-1684)など、マ
イクロアレイを製作する他の方法を使用することもできる。原則として、先に述べたとお
り、任意のタイプのアレイ、例えばナイロンハイブリッド形成膜上のドットブロット(前
掲Sambrooket al.参照)を使用することができる。しかし、当業者には理解されるように
、ハイブリッド形成体積がより小さくなるので、非常に小さなアレイがしばしば好ましい
特に好ましい一実施形態では、オリゴヌクレオチド合成用のインクジェットプリンティ
ング装置によって本発明のマイクロアレイが製造され、これには例えば1998年9月24日公
開のBlanchardの国際特許公開番号WO98/41531、Blanchard et al., 1996, Biosensors a
ndBioelectronics 11:687-690、Blanchard, 1998, in Synthetic DNA Arrays in Geneti
c Engineering,Vol. 20, J.K. Setlow, Ed., Plenum Press, New York at pages 111-12
3およびBlanchardの米国特許第6,028,189号に記載された方法およびシステムが使用され
る。具体的には、このようなマイクロアレイ上のポリヌクレオチドプローブが、炭酸プロ
ピレンなどの高表面張力溶媒の「微小液滴(microdroplet)」中の個々のヌクレオチド塩基
を順次付着させることによって、例えばガラススライド上のアレイとして合成されること
が好ましい。微小液滴は小さな体積(例えば100pl以下、より好ましくは50pl以下)を有し
、(例えば疎水性ドメインによって)マイクロアレイ上で互いから分離されて、アレイ要素
(例えば異なるプローブ)の位置を画定する円形の表面張力ウェル(well)を形成する。ポリ
ヌクレオチドプローブは通常、ポリヌクレオチドの3末端での共有結合によって表面に付
着される。あるいは、ポリヌクレオチドの5'末端での共有結合によってポリヌクレオチド
プローブを表面に付着させることもできる (例えばBlanchard, 1998, in Synthetic DNA
Arrays inGenetic Engineering 20, Setlow, Ed., Plenum Press, New York at pages 1
11-123を参照されたい)。
5.5.1.3.標的ポリヌクレオチド分子
本発明の方法および構成によって解析することができる標的ポリヌクレオチドには、メ
ッセンジャーRNA(mRNA)分子、リボソームRNA(rRNA)分子、cRNA分子(すなわち体内(inviv
o)で転写されたcDNA分子から調製されたRNA分子)およびこれらの断片などのRNA分子が含
まれる。ただし解析することができるRNA分子はこれらに限定されるわけではない。本発
明の方法および構成によって解析することができる標的ポリヌクレオチドにはさらに、ゲ
ノムDNA分子などのDNA分子、cDNA分子、オリゴヌクレオチド、およびEST、STSなどを含む
これらの断片が含まれる。ただしこれに限定されるわけではない。
標的ポリヌクレオチドは任意の起源のポリヌクレオチドとすることができる。標的ポリ
ヌクレオチド分子は例えば、生物から分離されたゲノムDNAまたはゲノム外DNA分子、生物
から分離されたmRNA分子などのRNA分子などの天然核酸分子とすることができる。あるい
は標的ポリヌクレオチド分子は、例えば酵素によって体内(in vivo)または対外(in vitro
)で合成されたcDNA分子などの核酸分子、またはPCRによって合成されたポリヌクレオチド
分子、体外(invitro)転写によって合成されたRNA分子などを含む合成ポリヌクレオチド
分子とすることもできる。標的ポリヌクレオチドのサンプルは、DNA分子、RNA分子または
DNAとRNAの共重合体分子を含むことができる。好ましい実施形態では、本発明の標的ポリ
ヌクレオチドが、特定の遺伝子または特定の遺伝子転写産物(細胞内で発現された特定のm
RNA配列またはこのようなmRNA配列から得られた特定のcDNA配列)に対応する。しかし多く
の実施形態、特にポリヌクレオチド分子が哺乳類の細胞から得られる実施形態では、標的
ポリヌクレオチドが、遺伝子転写産物の特定の断片に対応することができる。例えば標的
ポリヌクレオチドは、例えばその遺伝子の異なるスプライス変異体を検出し、かつ/また
は解析することができるように、同じ遺伝子の異なるエキソンに対応することができる。
好ましい実施形態では、解析される標的ポリヌクレオチドが、細胞から抽出された核酸
から体外(invitro)で調製される。例えば一実施形態では、細胞からRNA(例えば全細胞RN
A、poly(A)+メッセンジャーRNAまたはこれらの部分)が抽出され、メッセンジャーRNAが、
抽出された全RNAから精製される。全RNAおよびpoly(A)+RNAを調製する方法は当技術分野
でよく知られており、例えば前掲Sambrook et al.に全般的に説明されている。一実施形
態では、RNAが、本発明の関心のさまざまなタイプの細胞から、グアニジニウムチオシア
ナート溶解ならびにその後のCsCl遠心処理およびオリゴdt精製(Chirgwin et al., 1979,
Biochemistry18:5294-5299)を使用して抽出される。他の実施形態では、RNAが、グアニ
ジニウムチオシアナート溶解およびその後のRNeasyカラム(Qiagen)上での精製を使用して
細胞から抽出される。次いで、精製されたmRNAから、例えばoligo-dTまたはランダムプラ
イマーを使用してcDNAが合成される。好ましい実施形態では、標的ポリヌクレオチドが、
細胞から抽出され精製されたメッセンジャーRNAから調製されたcRNAである。本明細書で
はcRNAが、起源RNAに相補的なRNAと定義される。抽出されたRNAは、RNAポリメラーゼプロ
モータに結合されたプライマーを使用してRNAから2本鎖cDNAが、アンチセンスRNAの転写
を導くことができる方向に合成されるプロセスを使用して増幅される。次いで、RNAポリ
メラーゼを使用して、この2本鎖cDNAの第2の鎖からアンチセンスRNAまたはcRNAが転写さ
れる(例えば米国特許第5,891,636号、5,716,785号、5,545,522号および6,132,997号、さ
らに米国特許第6,271,002号、ならびにZiman他によって2000年11月28日に出願された米国
仮特許出願番号60/253,641を参照されたい)。RNAポリメラーゼプロモータまたはその補体
を含む、オリゴdTプライマー(米国特許第5,545,522号および6,132,997号)またはランダム
プライマー(Ziman他によって2000年11月28日に出願された米国仮特許出願番号60/253,641
)を使用することができる。標的ポリヌクレオチドは、細胞の本来の核酸母集団を表す短
くかつ/または断片化されたポリヌクレオチド分子であることが好ましい。
本発明の方法および構成によって解析される標的ポリヌクレオチドは検出可能に標識さ
れることが好ましい。例えばcDNAは、例えばヌクレオチド類似体を用いて直接に標識し、
または例えば第1の鎖をテンプレートとして使用して標識された第2のcDNA鎖を合成するこ
とによって間接的に標識することができる。あるいは、2本鎖cDNAをcRNAに転写し、標識
することもできる。
検出可能な標識は、例えばヌクレオチド類似体の取込みによる蛍光標識であることが好
ましい。本発明で使用するのに適した他の標識には、ビオチン、イミノビオチン、抗原、
補因子、ジニトロフェノール、リポ酸、オレフィン化合物、検出可能なポリペプチド、高
電子分子、基質に対する作用によって検出可能な信号を生成することができる酵素、およ
び放射性同位元素が含まれる。ただしこれらに限定されるわけではない。好ましい放射性
同位元素には32P、35S、14C、15Nおよび125Iが含まれる。本発明に適した蛍光分子には、
フルオレセインおよびその誘導体、ローダミンおよびその誘導体、テキサスレッド、5カ
ルボキシフルオレセイン(FMA」)、2,7-ジメトキシ-4,5-ジクロロ-6-カルボキシフルオレ
セイン(「JOE」)、N,N,N',N'-テトラメチル-6-カルボキシローダミン(「TAMRA」)、6カル
ボキシ-X-ローダミン(「ROX」)、HEX、TET、IRD40およびIRD41が含まれる。ただしこれら
に限定されるわけではない。本発明に適した蛍光分子にはさらに、Cy3、Cy3.5およびCy5
を含むシアミン染料、BODIPY-FL、BODIPY-TR、BODIPY-TMR、BODIPY-630/650およびBODIPY
-650/670を含むBODIPY染料;ALEXA-488、ALEXA-532、ALEXA-546、ALEXA-568およびALEXA-
594を含むALEXA染料、ならびに当業者に知られている他の蛍光染料が含まれる。ただしこ
れらに限定されるわけではない。本発明に適した高電子インジケータ分子には、フェリチ
ン、ヘモシアニンおよびコロイド金が含まれる。ただしこれらに限定されるわけではない
。あるいは、より好ましくない実施形態では、標的ポリヌクレオチドを第1の基で特異的
に錯体化することによって標的ポリヌクレオチドを標識することもできる。第1の基に対
して親和性を有し、インジケータ分子に共有結合した第2の基を使用して、標的ポリヌク
レオチドを間接的に検出することができる。このような一実施形態では、第1の基として
使用するのに適した化合物に、ビオチンおよびイミノビオチンが含まれる。ただしこれら
に限定されるわけではない。第2の基として使用するのに適した化合物にはアビジンおよ
びストレプトアビジンが含まれる。た
だしこれらに限定されるわけではない。
5.5.1.4.マイクロアレイとのハイブリッド形成(ハイブリダイゼイション)
前述のとおり、核酸ハイブリッド形成条件および洗浄条件は、本発明によって解析され
るポリヌクレオチド分子(本明細書では「標的ポリヌクレオチド分子」と呼ぶ)が、アレイ
の相補ポリヌクレオチド配列、好ましくはその相補DNAが位置する特定のアレイ部位に特
異的に結合し、またはこれと特異的にハイブリダイズするように選択される。
2本鎖プローブDNAをその表面に含むアレイは、標的ポリヌクレオチド分子と接触させる
前にDNAを1本鎖にするために、変性条件にかけることが好ましい。1本鎖プローブDNA(例
えば合成オリゴデオキシリボ核酸)を含むアレイは、例えば自己相補列に起因して形成す
るヘアピンまたはダイマーを除去するために、標的ポリヌクレオチド分子と接触させる前
に変性させる必要がある場合がある。
最適なハイブリッド形成条件は、プローブおよび標的核酸の長さ(例えばオリゴマーお
よび200塩基超のポリヌクレオチド)およびタイプ(例えばRNAまたはDNA)に依存する。核酸
に対する特異的な(すなわちストリンジェントな)ハイブリッド形成条件のための一般的な
パラメータは、Sambrooket al.(前掲)およびAusubel et al., 1987, Current Protocols
inMolecular Biology, Greene Publishing and Wiley-Interscience, New Yorkに記載
されている。Schenaet al.のcDNAマイクロアレイが使用されるとき、一般的なハイブリ
ッド形成条件は、65℃の5X SSC+0.2%SDS中で4時間ハイブリッド形成させ、次いで25℃の
低ストリンジェンシー洗浄緩衝液(1 X SSC+0.2%SDS)中で洗浄し、次いで25℃の高ストリ
ンジェンシー洗浄緩衝液(0.1 X SSC+0.2%SDS)中で10分間洗浄する条件である(Schena et
al., 1996,Proc. Natl. Acad. Sci. U.S.A. 93:10614)。有用なハイブリッド形成条件は
、例えばTijessen,1993, Hybridization With Nucleic Acid Probes, Elsevier Science
PublishersB.V.およびKricka, 1992, Nonisotopic DNA Probe Techniques, Academic P
ress, SanDiego, CA.にも出ている。
本発明のスクリーニングおよび/またはシグナリングチップとともに使用される特に好
ましいハイブリッド形成条件は、プローブの平均融解温度またはその付近(例えば5℃C以
内、より好ましくは2℃以内)の温度の1MNaCl、50mM MES緩衝液(pH6.5)、0.5%ナトリウム
サルコシンおよび30パーセントホルムアミド中でのハイブリッド形成を含む。
5.5.1.5.信号検出およびデータ解析
細胞のRNAに相補的な標的配列、例えばcDNAまたはcRNAが製作され、適当なハイブリッ
ド形成条件下でマイクロアレイにハイブリッド形成されているとき、任意の特定の遺伝子
のエキソンに対応するアレイ内の部位に対するハイブリッド形成レベルは、その遺伝子か
ら転写されたエキソンを含む1つまたは複数のmRNAのその細胞における有病率を反映する
ことを理解されたい。例えば、全細胞mRNAに相補的な検出可能に標識された(例えば蛍光
団を有する)cDNAがマイクロアレイにハイブリッド形成されたとき、転写されずまたは細
胞のRNAスプライシング中に除去された遺伝子のエキソンに対応する(すなわち遺伝子発現
の1つまたは複数の産物と特異的に結合する能力を有する)アレイ上の部位は、信号(例え
ば蛍光信号)をほとんどまたは全く発せず、エキソンを発現しているコードされたmRNAが
優勢である遺伝子のエキソンは比較的に強い信号を発する。次いで、選択的スプライシン
グによって同じ遺伝子から生み出された異なるmRNAの相対的な存在量が、その遺伝子に対
する監視されたエキソンの完全セットを横切る信号強度パターンによって決定される。
好ましい実施形態では、2つの異なる細胞からの標的配列、例えばcDNAまたはcRNAが、
マイクロアレイの結合部位にハイブリッド形成される。薬物反応の場合、1つの細胞サン
プルが薬物に暴露され、同じタイプの他の細胞サンプルは薬物に暴露されない。経路反応
の場合、1つの細胞が経路摂動(perturbation)に暴露され、同じタイプの他の細胞サンプ
ルは経路摂動に暴露されない。これらの2つのそれぞれの細胞タイプから得られたcDNAま
たはcRNAは、互いに区別できるように異なる方法で標識される。一実施形態では、例えば
、薬物で処理された(または経路摂動に暴露された)細胞に由来するcDNAが、フルオレセイ
ンで標識されたdNTPを使用して合成され、薬物に暴露されていない第2の細胞からのcDNA
が、ローダミンで標識されたdNTPを使用して合成される。これらの2つのcDNAが混合され
、マイクロアレイにハイブリッド形成されると、それぞれのcDNAセットからの相対的な信
号強度が、アレイ上のそれぞれの部位に関して決定され、特定のエキソンの存在量の相対
的な差が検出される。
先に説明した例では、薬物処理した(経路摂動に暴露した)細胞からのcDNAは蛍光団が刺
激されたときに緑の蛍光を発し、無処理の細胞からのcDNAは赤い蛍光を発する。その結果
、細胞内の特定の遺伝子の転写および/または転写後スプライシングに対して薬物処理が
直接または間接の効果を持たないとき、両方の細胞のエキソン発現パターンは区別できず
、逆転写後、赤く標識されたcDNAと緑に標識されたcDNAは等しく優勢である。マイクロア
レイにハイブリッド形成されると、そのRNA種に対する結合部位は両方の蛍光団に特徴的
な波長を発する。対照的に、薬物暴露された細胞が、細胞内の特定の遺伝子の転写および
/または転写後スプライシングを直接または間接に変化させる薬物で処理されるとき、そ
れぞれのエキソン結合部位に対する緑と赤の蛍光の比によって表現されるエキソン発現パ
ターンが変化する。薬物がmRNAの有病率を増大させるとき、そのmRNAの中で発現されるそ
れぞれのエキソンに対するこれらの比は増大し、薬物がmRNAの有病率を低下させるとき、
そのmRNAの中で発現されるそれぞれのエキソンに対するこれらの比は低下する。
2色蛍光標識/検出方式を使用して遺伝子発現の変化を定義することは、mRNAの検出に関
して、例えばあらゆる目的のためにその全体が参照によって組み込まれるSchena et al.,
1995,Science 270:467-470に記載されている。この方式は、エキソンの標識化および検
出に等しく適用可能である。2つの異なる蛍光団で標識された標的配列、例えばcDNAまた
はcRNAを使用する利点は、2つの細胞状態にあるそれぞれの遺伝子に対応するmRNAまたは
エキソン発現レベルの内部的に制御された直接比較を実施でき、実験条件(例えばハイブ
リッド形成条件)の小さな違いに起因する変動が以降の解析に影響を及ぼさないことであ
る。しかし、単一の細胞からのcDNAを使用し、例えば薬物処理または経路摂動を与えた細
胞と未処理の細胞とで例えば特定のエキソンの絶対量を比較することもできることを理解
されたい。
蛍光標識されたプローブが使用される場合、転写産物アレイのそれぞれの部位での蛍光
放射は、走査共焦点レーザ顕微鏡によって検出することができる。一実施形態では、使用
される2つのそれぞれの蛍光団に対して、適当な励起線を使用した別個の走査が実施され
る。あるいは、2つの蛍光団に特異的な波長の同時標本照射を可能にするレーザを使用す
ることもでき、2つの蛍光団からの放射を同時に解析することができる(Shalonet al., 1
996, GenomeRes, 6:639-645参照)。好ましい一実施形態では、コンピュータ制御のX-Yス
テージおよび顕微鏡対物レンズを有するレーザ蛍光スキャナでアレイが走査される。これ
らの2つの蛍光団の順次励起が、マルチライン混合ガスレーザによって達成され、放出光
は波長によって分割され、2つの光電子増倍管で検出される。このような蛍光レーザ走査
装置は例えばSchenaet al., 1996, Genome Res. 6: 639-645に記載されている。あるい
は、Fergusonet al., 1996, Nature Biotech. 14:1681-1684によって記述されている光
ファイバ束を使用して、多数の部位でmRNA存在量レベルを同時に監視することもできる。
信号は記録され、好ましい一実施形態では、信号が、例えば12ビットアナログ-ディジ
タルボードを使用してコンピュータによって解析される。一実施形態では、走査画像が、
グラフィックスプログラム(例えばHijaak Graphics Suite)を使用してスペックル除去(de
speckling)され、走査画像は次いで、それぞれの部位のそれぞれの波長の平均ハイブリッ
ド形成のスプレッドシートを作成する画像グリド(image gridding)プログラムを使用して
解析される。必要ならば、2つの蛍光体のチャネル間の「クロストーク」(またはオーバラ
ップ)の実験的に決定された補正を実施することができる。転写産物アレイ上の任意の特
定のハイブリッド形成部位に関して、これらの2つの蛍光団の放出光の比を計算すること
ができる。この比は、同種(cognate)遺伝子の絶対発現レベルから独立しているが、薬物
投与、遺伝子欠失または他の任意の試験事象によって発現が相当に調整された遺伝子に対
して有用である。
本発明の方法によれば、2つの細胞または細胞系統内のmRNAおよび/またはmRNA内で発現
されたエキソンの相対存在量が、摂動(すなわち試験されたmRNAの2つの起源において存在
量が異なる)と記録され、または非摂動(すなわち相対存在量が同じ)と記録される。本明
細書では、RNAの2つの起源間の差が、少なくとも25パーセント(例えば一方の起源のRNAの
存在量が他方の起源のそれよりも25高い)、通常は50パーセント、しばしば2倍(例えば存
在量が2倍)、3倍(存在量が3倍)または5倍(存在量が5倍)であると摂動と記録される。現行
の検出方法は1.5倍から3倍程度の差の信頼できる検出が可能である。
しかし、2つの細胞または2つの細胞系統内のmRNAおよび/またはmRNAの中に発現された
エキソンの存在量の相対的な差の絶対値を決定することも有利である。先に述べたとおり
、これは、差動標識化のために使用される2つの蛍光団の放出光の比を計算することによ
って、または当業者に容易に明らかな類似の方法によって実施することができる。
5.5.2 転写状態の他の測定方法
細胞の転写状態は、当技術分野で知られている他の遺伝子発現技術によっても測定する
ことができる。2重制限酵素消化をフェージングプライマー(phasingprimer)と組み合わ
せる方法(例えばZabeau他によって1992年9月24日に出願された欧州特許第534858A1号を
参照されたい)、定義されたmRNA末端に最も近い部位を有する制限断片を選択する方法(例
えばPrasharet al., 1996, Proc. Natl. Acad. Sci. USA 93:659-663を参照されたい)な
ど、このようないくつかの技術は、電気泳動解析に対する限定された複雑さの制限断片の
プールを生み出す。他の方法は、例えば、複数のそれぞれのcDNAの中の十分な塩基(例え
ば20〜50塩基)を配列決定してそれぞれのcDNAを識別することによって、または定義され
たmRNA末端に対して既知の位置に生成された短いタグ(例えば9〜10塩基)を配列決定する
ことによって(例えばVelculescu,1995, Science 270:484-487を参照されたい)、cDNAプ
ールを統計学的にサンプリングする。
細胞の転写状態は、逆転写ポリメラーゼ連鎖反応(RT-PCR)によって測定することもでき
る。RT-PCRはmRNAの検出および定量化のための技法である。RT-PCRは、単一の細胞からの
RNAの定量化を可能にする十分な感度を有する。例えばPfaffland Hageleit, 2001, Biot
echnologyLetters 23, 275-282、Tadesse et al., 2003, Mol Genet Genomics 269, p.
789-796およびKabirand Shimizu, 2003, J. Biotech. 9, p. 105を参照されたい。
5.6 生物学的状態の他の態様の測定
本発明のさまざまな実施形態では、翻訳状態、活性状態、混合態様などの転写状態以外
の生物学的状態の態様を測定することができる。したがって、このような実施形態では、
細胞成分の存在量データが、翻訳状態の測定値またはタンパク質発現の測定値を含むこと
ができる。このセクションでは、転写状態以外の生物学的状態の態様の詳細を説明する。
5.6.1 翻訳状態の測定
翻訳状態の測定はいくつかの方法によって実行することができる。例えば、結合部位が
、細胞ゲノムによってコードされた複数のタンパク質種に特異的な固定された抗体、好ま
しくはモノクローナル抗体を含むマイクロアレイを構築することによって、タンパク質の
全ゲノムモニタリング(例えば「プロテオーム」)を実施することができる。コードされた
タンパク質のかなりの部分に対して、または少なくとも関心の薬物の作用に関連するタン
パク質に対して抗体が存在することが好ましい。モノクローナル抗体を産生するための方
法はよく知られている (例えばあらゆる目的のためにその全体が本明細書に組み込まれる
Harlow andLane, 1988, Antibodies: A Laboratory Manual, Cold Spring Harbor, New
Yorkを参照されたい)。一実施形態では、モノクローナル抗体が、細胞のゲノム配列に基
づいて設計された合成ペプチド断片に対して生み出される。このような抗体アレイを用い
て、その細胞のタンパク質をアレイに接触させ、当技術分野で知られているアッセイでそ
れらの結合を分析する。
あるいは、2次元ゲル電気泳動系によってタンパク質を分離することもできる。2次元ゲ
ル電気泳動法は当技術分野ではよく知られており、一般に、第1の次元に沿った等電点電
気泳動、およびその後の第2の次元に沿ったSDS-PAGE電気泳動を含む。例えばFlames el a
l., 1990, GelElectrophoresis of Proteins: A Practical Approach, IRL Press, New
York、Shevchenkoet al., 1996, Proc. Natl. Acad. Sci. USA 93:1440-1445、Sagliocc
o et al., 1996,Yeast 12:1519-1533、Lander, 1996, Science 274:536-539を参照され
たい。その結果得られる電気泳動図は、質量分析法、ポリクローナルおよびモノクローナ
ル抗体を使用したウェスタンブロット法および免疫ブロット解析、ならびに内部およびN
末端マイクロシークエンシングを含む多数の技法によって解析することができる。これら
の技法を使用して、薬物に暴露された細胞(例えば酵母)内あるいは例えば特定の遺伝子の
欠失または過剰発現によって修飾された細胞内を含む所与の生理的条件下で産生された全
てのタンパク質のかなりの部分を識別することができる。
5.6.2 他のタイプの細胞成分存在量測定
本発明の方法は、監視することができる任意の細胞成分に適用可能である。例えば、タ
ンパク質の活性を測定できる場合、本発明の実施形態はこのような測定を使用することが
できる。活性の測定は、特性付けようとする特定の活性に対して適当な任意の機能的、生
化学的または物理的手段によって実行することができる。活性が化学変化(chemical tran
sformation)を含む場合、細胞タンパク質を天然の基質と接触させ、化学変化の速度を測
定することができる。活性が、マルチマー単位(multimeric unit)におけるアソシエーシ
ョン(association)、例えばDNAとの活性化されたDNA結合複合体のアソシエーションを含
む場合には、アソシエートされたタンパク質の量、または転写されたmRNAの量などのその
会合の2次的な結果を測定することができる。さらに、機能的活性、例えば細胞周期制御
の機能的活性だけが知られている場合、その機能の性能を観察することができる。どのよ
うに知られ、測定されるにせよ、タンパク質活性の変化は、本発明の上記の方法によって
解析される反応データを形成する。
本発明のいくつかの実施形態では、細胞表現型技法から細胞成分の測定が得られる。こ
のような1つの細胞表現型技法は、汎用リポータとして細胞呼吸を使用する。一実施形態
では、それぞれのウェル(well)が固有の化学的性質(chemistry)を含む96ウェルマイクロ
タイタープレートが提供される。それぞれの固有の化学的性質は、特定の表現型を試験す
るように設計されている。関心の生物からの細胞がそれぞれのウェルの中へピペットで移
される。細胞が適当な表現型を示す場合、細胞は呼吸し、テトラゾリウム染料を活発に還
元し、強い紫色を形成する。弱い表現型はより明るい色を形成する。無色は、細胞がその
特定の表現型を持たないことを意味する。色変化は1時間に数回記録することができる。1
回のインキュベーションの間に5,000超の表現型を試験することができる。例えばBochner
et al.,2001, Genome Research 11, p. 1246を参照されたい。
本発明のいくつかの実施形態では、細胞表現型技法から細胞成分の測定が得られる。こ
のような1つの細胞表現型技法は、汎用リポータとして細胞呼吸を使用する。一実施形態
では、それぞれのウェルが固有の化学的性質を含む96ウェルマイクロタイタープレートが
提供される。それぞれの固有の化学的性質は、特定の表現型を試験するように設計されて
いる。関心の生体標本からの細胞がそれぞれのウェルの中へピペットで移される。細胞が
適当な表現型を示す場合、細胞は呼吸し、テトラゾリウム染料を活発に還元し、強い紫色
を形成する。弱い表現型はより明るい色を形成する。無色は、細胞がその特定の表現型を
持たないことを意味する。色変化は1時間に数回記録することができる。1回のインキュベ
ーションの間に5,000超の表現型を試験することができる。例えばBochneret al., 2001,
GenomeResearch 11, p. 1246-55を参照されたい。
本発明のいくつかの実施形態では、測定される細胞成分が代謝産物である。代謝産物に
はアミノ酸、金属、可溶性糖、糖リン酸および複合糖質が含まれる。ただしこれらに限定
されるわけではない。このような代謝産物は、例えば熱分解質量分析(Irwin, 1982, Anal
yticalPyrolysis: A Comprehensive Guide, Marcel Dekker, New York、Meuzelaar et a
l., 1982,Pyrolysis Mass Spectrometry of Recent and Fossil Biomaterials, Elsevie
r, Amsterdam)、フーリエ変換赤外分光分析(Griffiths and de Haseth,1986, Fourier t
ransforminfrared spectrometry, John Wiley, New York、Helm et al., 1991, J. Gen.
Microbiol.137, 69-79、Naumann et al., 1991, Nature 351, 81-82、Naumann et al.,
1991, In:Modern techniques for rapid microbiological analysis, 43-96, Nelson,
W.H., ed., VCHPublishers, New York)、ラマン分光法、ガスクロマトグラフィー-質量
分析法(GC-MS) (Fiehnet al., 2000, Nature Biotechnology 18, 1157-1161, capillar
yelectrophoresis (CE)/MS, high pressure liquid chromatography/mass spectroscopy
(HPLC/MS))ならびに液体クロマトグラフィー(LC)-エレクトロスプレーおよびキャップ-L
C-タンデムエレクトロスプレー質量分析法などの方法を使用して全細胞レベルで測定する
ことができる。密接に関連した複数のサンプルを区別するために、このような方法を、人
工神経ネットワークおよび遺伝子プログラミングを利用する確立されたケモメトリック(c
hemometric)法と組み合わせることができる。
5.7 解析キット
一実施形態では、生物学的分類機構を開発し使用するためのキットを使用することによ
って本発明の方法を実現することができる。このようなキットは、以前のサブセクション
で説明したものなどのマイクロアレイを含む。このようなキットの中に含まれるマイクロ
アレイは、固相、例えば表面を含み、この固相の既知の位置にはプローブがハイブリッド
形成されまたは結合されている。これらのプローブは、既知の異なる配列の核酸からなり
、これらの核酸はそれぞれRNA種またはRNA種から得られたcDNA種とハイブリッドを形成す
る能力を有することが好ましい。特定の一実施形態では、本発明のキットに含まれるプロ
ーブが、関心の生物から集められた細胞内のRNA種から得られた核酸配列と特異的にハイ
ブリッドを形成する能力を有する核酸である。
好ましい一実施形態では、本発明のキットがさらに、図1〜3に示して以前に説明した、
コンピュータ可読媒体上にコードされた1つまたは複数のデータ構造および/またはソフト
ウェアモジュール、ならびに/あるいはネットワーク化されたリモートコンピュータから
前述のデータベースを使用するためのアクセス許可を含む。
好ましい他の実施形態では、本発明のキットが、図1に示した前述のコンピュータシス
テムなどのコンピュータシステムのメモリにロードすることができるソフトウェアを含む
。本発明のキットに含まれるソフトウェアは、図1に関して先に説明したソフトウェアと
本質的に同じものである。
本発明の解析方法を実現するための代替キットは当業者には明白であり、これらも添付
の請求項の範囲に含まれる。
6. 引用文献
本明細書に引用された全ての参考文献は、それぞれの個々の出版物または特許または特
許出願があたかも、あらゆる目的のためにその全体が参照によって本明細書に組み込まれ
ると明確かつ個別に指示されているのと同じ程度に、あらゆる目的のためにその全体が参
照によって本明細書に組み込まれる。
本発明は、コンピュータ可読記憶媒体に埋め込まれたコンピュータプログラム機構を含
むコンピュータプログラム製品として実現することができる。例えばこのコンピュータプ
ログラム製品は、図1に示したプログラムモジュールおよび/または図2および3に示したデ
ータベーススキーマを含むことができる。これらのプログラムモジュールは、CD-ROM、磁
気ディスク記憶製品、あるいは他のコンピュータ可読データまたはプログラム記憶製品上
に記憶することができる。コンピュータプログラム製品中のソフトウェアモジュールはさ
らに、搬送波上の(その中にソフトウェアモジュールが埋め込まれた)コンピュータデータ
信号の伝送によって、インターネットなどを介して電子的に配布することができる。
本発明の趣旨および範囲から逸脱することなく本発明の多くの修正および変更を実施す
ることができることは当業者には明白である。本明細書に記載された具体的な実施形態は
単に例示のために提供されたものであり、本発明は、添付の請求項の用語およびこのよう
な請求項が資格を与える同等物の完全な範囲のみによって限定される。

Claims (1)

  1. 本願明細書に記載された発明。
JP2012000820A 2003-09-29 2012-01-05 生物学的特徴を検出するためのシステムおよび方法 Withdrawn JP2012065674A (ja)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US50738103P 2003-09-29 2003-09-29
US50744503P 2003-09-29 2003-09-29
US60/507,381 2003-09-29
US60/507,445 2003-09-29
US10/861,177 US8321137B2 (en) 2003-09-29 2004-06-04 Knowledge-based storage of diagnostic models
US10/861,216 2004-06-04
US10/861,177 2004-06-04
US10/861,216 US20050069863A1 (en) 2003-09-29 2004-06-04 Systems and methods for analyzing gene expression data for clinical diagnostics
US57741604P 2004-06-05 2004-06-05
US60/577,416 2004-06-05

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2006528327A Division JP2007507770A (ja) 2003-09-29 2004-09-29 生物学的特徴を検出するためのシステムおよび方法

Publications (1)

Publication Number Publication Date
JP2012065674A true JP2012065674A (ja) 2012-04-05

Family

ID=34382268

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2006528327A Withdrawn JP2007507770A (ja) 2003-09-29 2004-09-29 生物学的特徴を検出するためのシステムおよび方法
JP2012000820A Withdrawn JP2012065674A (ja) 2003-09-29 2012-01-05 生物学的特徴を検出するためのシステムおよび方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2006528327A Withdrawn JP2007507770A (ja) 2003-09-29 2004-09-29 生物学的特徴を検出するためのシステムおよび方法

Country Status (8)

Country Link
US (3) US20050071087A1 (ja)
EP (2) EP2469439A2 (ja)
JP (2) JP2007507770A (ja)
KR (1) KR20060120063A (ja)
AU (1) AU2004285103A1 (ja)
CA (1) CA2540167A1 (ja)
IL (1) IL174599A0 (ja)
WO (1) WO2005042760A2 (ja)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7755757B2 (en) * 2007-02-14 2010-07-13 Chemimage Corporation Distinguishing between renal oncocytoma and chromophobe renal cell carcinoma using raman molecular imaging
EP2469439A2 (en) 2003-09-29 2012-06-27 Pathwork Diagnostics, Inc. Systems and methods for detecting biological features
US20050069863A1 (en) * 2003-09-29 2005-03-31 Jorge Moraleda Systems and methods for analyzing gene expression data for clinical diagnostics
US8321137B2 (en) * 2003-09-29 2012-11-27 Pathwork Diagnostics, Inc. Knowledge-based storage of diagnostic models
US8135595B2 (en) * 2004-05-14 2012-03-13 H. Lee Moffitt Cancer Center And Research Institute, Inc. Computer systems and methods for providing health care
US20060252082A1 (en) * 2005-05-04 2006-11-09 University Of South Florida Predicting treatment response in cancer subjects
EP2024901A2 (en) 2006-05-25 2009-02-18 Elminda Ltd. Neuropsychological spatiotemporal pattern recognition
US20140214730A9 (en) * 2007-02-05 2014-07-31 Goded Shahaf System and method for neural modeling of neurophysiological data
AU2008266048A1 (en) * 2007-06-15 2008-12-24 University Of South Florida Methods of diagnosing and treating cancer
CN101329348A (zh) * 2007-06-18 2008-12-24 许洋 检测胃癌特征蛋白的优化质谱模型及其制备方法和应用
WO2009035946A1 (en) * 2007-09-13 2009-03-19 Chemimage Corporation Distinguishing between invasive ductal carcinoma and invasive lobular carcinoma using raman molecular imaging
CA2706643A1 (en) * 2007-11-29 2009-06-04 Elminda Ltd. Clinical applications of neuropsychological pattern analysis and modeling
US9168173B2 (en) 2008-04-04 2015-10-27 Truevision Systems, Inc. Apparatus and methods for performing enhanced visually directed procedures under low ambient light conditions
US9226798B2 (en) 2008-10-10 2016-01-05 Truevision Systems, Inc. Real-time surgical reference indicium apparatus and methods for surgical applications
US10117721B2 (en) 2008-10-10 2018-11-06 Truevision Systems, Inc. Real-time surgical reference guides and methods for surgical applications
US9173717B2 (en) 2009-02-20 2015-11-03 Truevision Systems, Inc. Real-time surgical reference indicium apparatus and methods for intraocular lens implantation
EP2430579A2 (en) * 2009-05-11 2012-03-21 Koninklijke Philips Electronics N.V. Device and method for comparing molecular signatures
US8784443B2 (en) 2009-10-20 2014-07-22 Truevision Systems, Inc. Real-time surgical reference indicium apparatus and methods for astigmatism correction
WO2011119868A2 (en) * 2010-03-24 2011-09-29 Nodality, Inc. Hyper-spatial methods for modeling biological events
JP5631682B2 (ja) 2010-09-30 2014-11-26 オリンパス株式会社 顕微鏡システムおよび配信システム
CN104704128A (zh) * 2012-05-22 2015-06-10 纳米线科技公司 预测乳腺癌结果的nano46基因和方法
US9552660B2 (en) * 2012-08-30 2017-01-24 Truevision Systems, Inc. Imaging system and methods displaying a fused multidimensional reconstructed image
JP6164135B2 (ja) * 2014-03-27 2017-07-19 株式会社豊田自動織機 圧縮機
FR3024546B1 (fr) * 2014-07-29 2018-08-24 Universite De Reims Champagne-Ardenne Procede de detection et de quantification de la fibrose
US10917543B2 (en) 2017-04-24 2021-02-09 Alcon Inc. Stereoscopic visualization camera and integrated robotics platform
US11083537B2 (en) 2017-04-24 2021-08-10 Alcon Inc. Stereoscopic camera with fluorescence visualization
US10299880B2 (en) 2017-04-24 2019-05-28 Truevision Systems, Inc. Stereoscopic visualization camera and platform
AU2020274091A1 (en) 2019-05-14 2021-12-09 Tempus Ai, Inc. Systems and methods for multi-label cancer classification
CN111639203B (zh) * 2020-05-28 2023-07-07 神华包神铁路集团有限责任公司 隧道病害定位方法、装置、计算机设备和存储介质
WO2022260740A1 (en) 2021-06-10 2022-12-15 Alife Health Inc. Machine learning for optimizing ovarian stimulation

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5545522A (en) 1989-09-22 1996-08-13 Van Gelder; Russell N. Process for amplifying a target polynucleotide sequence using a single primer-promoter complex
WO1993006239A1 (en) 1991-09-24 1993-04-01 Keygene N.V. Selective restriction fragment amplification: a general method for dna fingerprinting
US6389305B1 (en) * 1993-12-15 2002-05-14 Lifeline Biotechnologies, Inc. Method and apparatus for detection of cancerous and precancerous conditions in a breast
US5578832A (en) 1994-09-02 1996-11-26 Affymetrix, Inc. Method and apparatus for imaging a sample on a device
US5539083A (en) 1994-02-23 1996-07-23 Isis Pharmaceuticals, Inc. Peptide nucleic acid combinatorial libraries and improved methods of synthesis
US5989811A (en) 1994-09-29 1999-11-23 Urocor, Inc. Sextant core biopsy predictive mechanism for non-organ confined disease status
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
EP0880598A4 (en) * 1996-01-23 2005-02-23 Affymetrix Inc RAPID EVALUATION OF NUCLEIC ACID ABUNDANCE DIFFERENCE, WITH A HIGH-DENSITY OLIGONUCLEOTIDE SYSTEM
US6303301B1 (en) 1997-01-13 2001-10-16 Affymetrix, Inc. Expression monitoring for gene function identification
US6028189A (en) 1997-03-20 2000-02-22 University Of Washington Solvent for oligonucleotide synthesis and methods of use
AU751956B2 (en) 1997-03-20 2002-09-05 University Of Washington Solvent for biopolymer synthesis, solvent microdroplets and methods of use
US6420108B2 (en) 1998-02-09 2002-07-16 Affymetrix, Inc. Computer-aided display for comparative gene expression
US6912524B2 (en) 1998-05-20 2005-06-28 Lucent Technologies, Inc. Join synopsis-based approximate query answering
US6468476B1 (en) 1998-10-27 2002-10-22 Rosetta Inpharmatics, Inc. Methods for using-co-regulated genesets to enhance detection and classification of gene expression patterns
US6263287B1 (en) 1998-11-12 2001-07-17 Scios Inc. Systems for the analysis of gene expression data
US6453241B1 (en) 1998-12-23 2002-09-17 Rosetta Inpharmatics, Inc. Method and system for analyzing biological response signal data
US6351712B1 (en) 1998-12-28 2002-02-26 Rosetta Inpharmatics, Inc. Statistical combining of cell expression profiles
US20020115070A1 (en) 1999-03-15 2002-08-22 Pablo Tamayo Methods and apparatus for analyzing gene expression data
US6647341B1 (en) 1999-04-09 2003-11-11 Whitehead Institute For Biomedical Research Methods for classifying samples and ascertaining previously unknown classes
US7324926B2 (en) 1999-04-09 2008-01-29 Whitehead Institute For Biomedical Research Methods for predicting chemosensitivity or chemoresistance
US6502039B1 (en) 2000-05-24 2002-12-31 Aventis Pharmaceuticals Mathematical analysis for the estimation of changes in the level of gene expression
US6132997A (en) 1999-05-28 2000-10-17 Agilent Technologies Method for linear mRNA amplification
US6505125B1 (en) 1999-09-28 2003-01-07 Affymetrix, Inc. Methods and computer software products for multiple probe gene expression analysis
US6271002B1 (en) 1999-10-04 2001-08-07 Rosetta Inpharmatics, Inc. RNA amplification method
US20010049393A1 (en) 1999-12-07 2001-12-06 Whitehead Institute For Biomedical Research Methods for defining MYC target genes and uses thereof
AU2088801A (en) 1999-12-10 2001-06-18 Dana-Farber Cancer Institute, Inc. Metastasis genes and uses thereof
JP2002063278A (ja) * 2000-08-22 2002-02-28 Shotaro Katsuki 健康度評価システム及びその記録媒体並びに健康度評価方法
AU2001292802A1 (en) 2000-09-19 2002-04-02 Dana-Farber Cancer Institute Inc. Genetic markers for tumors
US20030194701A1 (en) 2000-11-20 2003-10-16 Golub Todd R. Diffuse large cell lymphoma diagnosis and outcome prediction by expression analysis
EP1425413A2 (en) 2001-01-23 2004-06-09 Irm, Llc Genes overexpressed in prostate disorders as diagnostic and therapeutic targets
EP1356114A2 (en) 2001-01-31 2003-10-29 Whitehead Institute For Biomedical Research Brain tumor diagnosis and outcome prediction
US6832069B2 (en) * 2001-04-20 2004-12-14 Educational Testing Service Latent property diagnosing procedure
WO2002101357A2 (en) 2001-06-10 2002-12-19 Irm Llc Molecular signatures of commonly fatal carcinomas
US7171311B2 (en) 2001-06-18 2007-01-30 Rosetta Inpharmatics Llc Methods of assigning treatment to breast cancer patients
US20030087865A1 (en) 2001-07-13 2003-05-08 Whitehead Institute For Biomedical Research Leukemogenic transcription factors
AU2002354941A1 (en) 2001-07-17 2003-03-03 Dana-Farber Cancer Institute, Inc. Mll translocations specify a distinct gene expression profile, distinguishing a unique leukemia
US20040110193A1 (en) 2001-07-31 2004-06-10 Gene Logic, Inc. Methods for classification of biological data
WO2003021229A2 (en) 2001-09-05 2003-03-13 The Brigham And Women's Hospital, Inc. Diagnostic and prognostic tests
US7622260B2 (en) 2001-09-05 2009-11-24 The Brigham And Women's Hospital, Inc. Diagnostic and prognostic tests
WO2003029273A2 (en) 2001-09-28 2003-04-10 Whitehead Institute For Biomedical Research Classification of lung carcinomas using gene expression analysis
WO2003041562A2 (en) 2001-11-14 2003-05-22 Whitehead Institute For Biomedical Research Molecular cancer diagnosis using tumor gene expression signature
US20040009495A1 (en) 2001-12-07 2004-01-15 Whitehead Institute For Biomedical Research Methods and products related to drug screening using gene expression patterns
US20040010481A1 (en) 2001-12-07 2004-01-15 Whitehead Institute For Biomedical Research Time-dependent outcome prediction using neural networks
US6949342B2 (en) 2001-12-21 2005-09-27 Whitehead Institute For Biomedical Research Prostate cancer diagnosis and outcome prediction by expression analysis
US20030215835A1 (en) 2002-01-15 2003-11-20 Zairen Sun Differentially-regulated prostate cancer genes
US7774143B2 (en) * 2002-04-25 2010-08-10 The United States Of America As Represented By The Secretary, Department Of Health And Human Services Methods for analyzing high dimensional data for classifying, diagnosing, prognosticating, and/or predicting diseases and other biological states
EP1504123A4 (en) 2002-05-01 2006-11-08 Irm Llc METHOD FOR DISCOVERING BIOLOGICAL TUMOR MARKERS AND TUMOR DIAGNOSIS
US20040098367A1 (en) 2002-08-06 2004-05-20 Whitehead Institute For Biomedical Research Across platform and multiple dataset molecular classification
US20050069863A1 (en) 2003-09-29 2005-03-31 Jorge Moraleda Systems and methods for analyzing gene expression data for clinical diagnostics
US8321137B2 (en) 2003-09-29 2012-11-27 Pathwork Diagnostics, Inc. Knowledge-based storage of diagnostic models
EP2469439A2 (en) 2003-09-29 2012-06-27 Pathwork Diagnostics, Inc. Systems and methods for detecting biological features

Also Published As

Publication number Publication date
EP1671121A2 (en) 2006-06-21
US20150161327A1 (en) 2015-06-11
US8977506B2 (en) 2015-03-10
CA2540167A1 (en) 2005-05-12
KR20060120063A (ko) 2006-11-24
EP2469439A2 (en) 2012-06-27
WO2005042760A3 (en) 2005-09-09
US20120215514A1 (en) 2012-08-23
JP2007507770A (ja) 2007-03-29
WO2005042760A2 (en) 2005-05-12
AU2004285103A1 (en) 2005-05-12
EP1671121A4 (en) 2007-12-19
US20050071087A1 (en) 2005-03-31
IL174599A0 (en) 2006-08-20

Similar Documents

Publication Publication Date Title
JP2012065674A (ja) 生物学的特徴を検出するためのシステムおよび方法
US8321137B2 (en) Knowledge-based storage of diagnostic models
JP6854792B2 (ja) ゲノムモデルに関するデータ統合を用いたパスウェイ認識アルゴリズム(paradigm)
Shen et al. Prognostic meta-signature of breast cancer developed by two-stage mixture modeling of microarray data
JP4619350B2 (ja) 乳癌患者の診断および予後
ES2692333T3 (es) Resolución de fracciones de genoma usando recuento de polimorfismos
JP5237076B2 (ja) 乳癌患者の診断および予後
US20120115138A1 (en) Method for in vitro diagnosing a complex disease
US20130332083A1 (en) Gene Marker Sets And Methods For Classification Of Cancer Patients
JP2019004907A (ja) メラノーマ癌の予後予測
Miecznikowski et al. Comparative survival analysis of breast cancer microarray studies identifies important prognostic genetic pathways
KR20130105764A (ko) 직장결장암용 예후 예측
JP2008536094A (ja) 乳癌患者における化学療法反応性を予測する方法
Zhu et al. Understanding prognostic gene expression signatures in lung cancer
JP2008520251A (ja) 固形腫瘍の予後および処置のための方法およびシステム
US20100280987A1 (en) Methods and gene expression signature for assessing ras pathway activity
Farber et al. Integrating global gene expression analysis and genetics
US20050069863A1 (en) Systems and methods for analyzing gene expression data for clinical diagnostics
Buness et al. Classification across gene expression microarray studies
CN1886658A (zh) 用于检测生物学特征的系统和方法
Kim et al. Standardized genetic alteration score and predicted score for predicting recurrence status of gastric cancer
HAYATA et al. FINDING GENE EXPRESSION CHANGES USING MICROARRAY TECHNOLOGY
Eggle Using whole-genome wide gene expression profiling for the establishment of RNA fingerprints

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120105

A072 Dismissal of procedure [no reply to invitation to correct request for examination]

Free format text: JAPANESE INTERMEDIATE CODE: A073

Effective date: 20130627

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20130702