JP2006501857A - Ffpe試料から得られた遺伝子発現プロファイル - Google Patents

Ffpe試料から得られた遺伝子発現プロファイル Download PDF

Info

Publication number
JP2006501857A
JP2006501857A JP2004543735A JP2004543735A JP2006501857A JP 2006501857 A JP2006501857 A JP 2006501857A JP 2004543735 A JP2004543735 A JP 2004543735A JP 2004543735 A JP2004543735 A JP 2004543735A JP 2006501857 A JP2006501857 A JP 2006501857A
Authority
JP
Japan
Prior art keywords
data
rna
expression
sample
gene expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004543735A
Other languages
English (en)
Inventor
マーク ジー. アーランダー、
ラネル サランガ、
Original Assignee
アークトゥラス バイオサイエンス インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アークトゥラス バイオサイエンス インコーポレイテッド filed Critical アークトゥラス バイオサイエンス インコーポレイテッド
Publication of JP2006501857A publication Critical patent/JP2006501857A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1096Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Pathology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

固定化され包埋されている組織試料に由来する遺伝子発現データの作成および使用に関わる方法および組成物を提供する。データは電子的に格納し、処理することができ、ならびに疾患の診断および治療を増強するために使用できる。

Description

(関連出願の相互参照)
本出願は2003年12月23日に出願された米国特許出願第10/329,282号および2002年10月11日に出願された米国特許仮出願第60/418,103号の優先権を主張し、両特許出願は参照によりその全体が本明細書に組み込まれる。
(技術分野)
本発明はホルマリン、ホルムアルデヒドまたはパラホルムアルデヒドに固定されている試料中で発現された核酸分子の増幅に関する。試料はワックス中に包埋および/または長期間保存されたものであってよい。
本発明はまた、この試料中の遺伝子発現レベルを測定するための増幅された核酸分子の使用および種々の疾患および状態へのその相関に関する。遺伝子発現レベルに関する情報はコンピュータ上に格納でき、疾患の診断および治療において助力するように使用できる。
(背景技術)
種々の腫瘍型(乳癌、肺癌、前立腺癌および結腸癌)の遺伝子発現の分析は各々の解剖学的に定義された癌のうちの腫瘍の多くのサブタイプが存在することを明らかにしている。更にまた、これらの研究の一部においては、種々のサブタイプが特定の予後に関連していた。例えば、Wigle等(1)およびBeer等(2)は、非小細胞肺癌における種々の無病生存率に相関付けられている遺伝子の特定のクラスターの存在を明らかにしている。これらの報告は、遺伝子発現プロファイルにより定義される腫瘍の分子の「構成(make−up)」が無疾患生存のような臨床上のエンドポイントに対して直接相関を有することを明らかにしている。これらの遡及的な研究は、予測的治験を進める際、患者が所定の治療に対して応答するか応答しないかと所定の腫瘍分子構成が直接相関するということに、大いに有望であることを強力に示唆している。
遡及的な研究を行う1つの手段は2つの主要な型の臨床試料、即ち凍結試料およびホルマリン固定またはパラフィン包埋されている試料の使用による。しかしながら、臨床試料の遺伝子発現分析を完了する際には、少なくとも3つの主要な要因を考慮しなければならない。第1に、マイクロアレイ実験での凍結試料の使用は大量の組織を要し、大部分の研究者等により使用されている現在の実験設計および方法において、単一のマイクロアレイ実験は全生検材料を「消耗(use up)」してしまい、これによりマイクロアレイ後の立証実験、異なる内容の別のマイクロアレイ、または、他の型の研究(例えばプロテオミックス分析)のための材料の使用を大きく制限する。
第2に、今日までのマイクロアレイ研究は一般的に均質化した生検試料で開始され、即ち、本研究は試料中の細胞の不均質性の量を最小限にするために腫瘍に関して高度にリッチとされている試料のみを用いて作業をしなければならない。残念ながらこれは、臨床治験の「真の世界(real world)」の状態ではない、つまり生検のどの一部を次に調べるかを選択することができない。レーザーキャプチャーマイクロダイセクション(laser capture microdissection)(Emmert−Buck等、3)の使用は、腫瘍負荷に関わらず所望の細胞型の選択と捕捉(capture)を可能にすることにより、この問題をなくしている。「真の世界」の試料は腫瘍負荷が極めて低値(即ち10%)であるものを包含し、従って、試料は生検試料中に存在する種々の細胞型の総数に関して不均質である場合があり、または、試料は大量の浸潤性の炎症細胞を含有する場合がある。
最後に、臨床環境における試料の日常的処理は、研究室において実施されるものとは大きく異なっている。特に、臨床環境から得た生検試料の日常的分析については、組織はホルマリン固定し、その後パラフィン包埋することにより処理される。この処理は病理分野において現在の標準である高度に効率的な方法である。残念ながら凍結試料のみが現在マイクロアレイ分析により利用されており、その理由は全般的なmRNAの発現分析に関し(即ちcDNAまたはオリゴマイクロアレイへのハイブリダイゼーションに関し)ホルマリン固定試料からmRNAを取得することが一般的には技術的に困難であるためである。例えば、Lewis等(5)はmRNAからのポリAテールの消失が「逆転写工程の失敗の主な原因」であるとしている。
後に続く実験にcDNAを作製してホルマリン固定組織を利用する他の試みで、様々な結果が得られている。例えば、Karsten等(4)はチラミドシグナル増幅(TSA)系によるcDNAマイクロアレイにおける使用に関し、凍結組織対ホルマリン固定組織の使用を比較しており、「ホルマリン誘導RNAはcDNA合成のための良好な基質ではなく、明らかに、我々のマイクロアレイ実験においては信頼性のあるハイブリダイゼーションをもたらさなかった」と結論している。一方、Cohen等(9)はランダムヘキサマーおよびリアルタイム定量的RT−PCRを用いた逆転写を使用して2種のケモカイン(chemokine)を増幅し発現の検出を行う記載を示している。個々の遺伝子配列の増幅および発現検出のため逆転写PCRの同様の使用はLewis等(5)、Lehmann等(6)、Specht等(8)、Masuda等(10)およびDanenberg等(11)により記載されている。抽出された核酸の全般的増幅および例えばマイクロアレイを使用した重複解析によるその後の分析により細胞レベルで遺伝子発現を分析する手段は報告されていない。
本明細書に記載した文献の引用は、何れも従来技術に関わるものとして受け入れたわけではない。期日に関する記載または文献の内容に関する表示は全て、出願人が入手可能な情報に基づいており、期日または文献の内容の正確さに関していずれの承認をも構成しない。
(発明の開示)
本発明は、固定され場合により包埋されている細胞における種々の核酸配列の発現を分析する手段を提供する。固定の作業は、固定の時点で細胞中に存在する発現レベルを「凍結(freezing)」するものとして捕らえてよい。即ち、種々の配列、特にmRNA分子の細胞内における発現レベルは、時間的に凍結されているものとして考えてよい。即ち、細胞遺伝子発現の動的場面は種々の遺伝子配列の発現レベルを時間毎に表示する静止した分子として捕らえられる。本発明は細胞のmRNA集団から複数のcDNA分子を同時に生成させることにより、これらの発現レベルを定量する、または、その場面(scene)を観察する手段を提供する。mRNA発現のこの「全般的(global)」な分析の後にこのcDNAの転写を行ってアレイのためのRNA分子を生成してよい。
伝統的な写真工程と概ね同様にして固定により捕獲された発現レベルの「場面」を使用することで、マイクロアレイなどのアレイ(またはアレイ性)フォーマットに基づくもののような試験に用いる増幅RNA分子を産生するcDNA「ネガ」を作成する。即ち、増幅RNA分子にハイブリダイズすることができる配列の複数を含みえるアレイは、細胞内の遺伝子発現を示す「写真(photograph)」となる。
即ち本発明は、固定され包埋された組織試料中の遺伝子発現データを「ロック解除(unlock)」する(またはそのような試料中の細胞における発現レベルを観察する)手段を、この細胞内にメッセンジャーRNA分子を調製し、そのレベルを分析するための技術を用いることにより、提供するものである。好ましい実施形態においては、本発明は1つ以上の核酸配列の発現のレベルを測定するために定量的に使用する。あるいは、本発明は定性的に使用してもよい。
一般的に固定細胞含有組織試料は本発明の実施のための細胞含有材料の入手源となる。試料は好ましくは切片化され、RNAの抽出および調製のために使用され、場合によりその前に顕微切断(microdissection)および/または包埋材料の除去を行う。抽出されたRNAは場合により加熱することにより理論的に脱修飾され、RNAをより天然な固定前の状態に戻す。次にポリアデニル化RNAを、まず、好ましくはcDNAの転写を指向できるプロモーター配列に作動可能に連結したオリゴdTプライマーの使用により、選別することなく、cDNAに変換することにより増幅する。プロモーターは1本鎖配列(第2のcDNA鎖の合成時に2本鎖配列に変換される)または2本鎖であってよい。その後、cDNAを転写して抽出されたRNA物質と同様、または、相補である配列を有する増幅RNAを生成する。増幅RNAはそれが何れか特定の遺伝子配列の選択ではなくむしろポリアデニル化に基づいているため、「全般的」である。しかしなお、RNAは、マイクロアレイなどのアレイ(またはソータブルアレイ)フォーマット上の配列へのハイブリダイゼーションによるなどして、細胞内の核酸の発現に相当する配列の測定、または有無の分析のために使用してよい。あるいは、cDNAは直接増幅(例えば、限定はしないが、以下で議論するようなPCR)を含む他の方法により分析してよい。
最初の態様において、本発明はプロテイナーゼ処理とその後のRNA抽出およびシリカマトリックスとの接触の組み合わせを用いた、固定細胞法から得られたRNAの最初の抽出および調製を提供する。抽出は好ましくはグアニジニウム含有化合物の使用またはタンパク質を変性するためのそのような化合物のカオトロピックな作用をもたらす他の手段により実施する。これによりその後の分析のためのRNAの状態を改善できる。
第2の態様において、本発明は加熱することにより逆転写のためのRNAを調製する進歩した方法を提供する。理論に制約されないが、これは、細胞の固定の間に修飾されたRNA塩基の脱修飾をもたらすと考えられる。これによりその後の使用のためのRNAの状態が改善される。
第3の態様において、本発明は3’末端にポリA配列を含むRNA分子の増幅に基づいた増幅方法を提供する。このような分子は、以前は逆転写のための鋳型として機能する能力を超えて分解されるとされていた(5)。増幅は、場合によりプロモーター配列の作動可能に連結した1本鎖または2本鎖の配列を含むオリゴdTプライマーを用いて鋳型ポリアデニル化RNAをまず逆転写することにより可能となる。ポリアデニル化RNAの逆転写は一般的に細胞の鋳型ポリアデニル化RNA分子のレベルを反映する複数のcDNA分子を同時生成することを可能とする。本発明はまた固定組織試料中に存在する病原体により発現されるポリアデニル化RNA分子の増幅にも適用してよい。
本発明の特に好ましい実施形態においては、本発明のこれらの態様の3点全てが組み合わされ、共に使用されることにより固定された組織試料中の遺伝子発現に関わる情報を作り出す。
cDNA分子は鋳型ポリアデニル化RNAの配列を含むRNA分子を転写するため、または、このような配列に相補的なRNA分子を転写するために使用してよい。これらの転写分子は場合により標識され、例えばマイクロアレイ上に存在するもののような相補配列へのハイブリダイゼーションのために使用してよく、これにより、鋳型ポリアデニル化RNAの単離元である細胞における種々の配列の発現を検出し、場合により定量してよい。あるいは、転写された分子を用いてアレイへのハイブリダイゼーションのための標識cDNA分子を生成する。鋳型ポリアデニル化RNAから調製されたcDNA、その後の増幅されたmRNA、および、場合によりその後のcDNAは、全て場合によりマイクロアレイ上でハイブリダイズされていてよく、これらは本発明の生成物である。
鋳型ポリアデニル化RNAから調製されたcDNA分子はまた、核酸分析の他の方法において使用してもよい。非限定的な例としては、PCRおよび定量的またはリアルタイムのPCR増幅を行うことにより特定のプライマーを用いて特定の配列の発現レベルを測定、またはその有無を分析する方法を包含する。増幅はマイクロアレイへのハイブリダイゼーションと組み合わせて実施してよいが、この方法は、PCR工程が、分析のために一部の配列を選択的に増幅する1種以上のプライマーにおける特定の配列の使用を必要とするため、「全般的」とはいえない。このような方法は以下に記載する結果と相関するものとして特定される特定の遺伝子配列の発現レベルを測定するために使用してよい。
別の態様において、本発明は、疾患または他の望ましくない状態に罹患しているか、または、有することが疑われる対象、好ましくはヒトから得た組織の固定試料と組み合わせて使用される。同様の疾患または望ましくない状態を有する対象から得た試料は、好ましくは1つ以上の疾患またはその治療または結果の態様と相関するものとして遺伝子配列の発現レベルを特定するために組み合わせて使用される。このような試料は長年にわたり収集されており、しばしば試料を採取した後の対象の疾患、状態、治療および/または結果に関する詳細な情報を伴っている。このような情報の非限定的な例は、固定のための試料の採取の後長期間にわたり対象により経験された診断、予後、治療、治療への応答および/または実際の結果に関するものを包含する。別の態様において、遺伝子配列の発現レベルは組織試料採取の前に対象の状態に相関付けてよい。非限定的な例は、既存の疾患または望ましくない状態、疾患発症時の年齢、感染性物質による感染、突然変異または毒性物質への曝露または遺伝子的障害を包含する。このような相関は、予測的な性質であり生じるべき結果への相関とは反対に、遡及的な性質である。更にまた、遺伝子配列の発現レベルは、遺伝子発現レベルを測定するために使用される試料を得た後の対象の疾患、状態、治療および/または結果に関する情報と相関付けてよい。即ち本発明は試料の採取元となった対象から得た遡及的並びに予測的な情報に遺伝子発現を相関付けるために使用してよい。相関は遺伝子発現レベルと結果との間の相関の応用により臨床診断の参考となるモデルを作るために使用してよい。
更に別の態様において、本発明は固定試料の細胞における複数の核酸配列の発現レベルに関わる情報をデータ構造へ組み込むことを提供する。データ構造は場合により固体の媒体または他の製造品、例えば、限定はしないが、コンピューター読み取り可能な、または、他の電子的に読み取り可能な媒体に包埋する。好ましくはデータ構造の配置は疾患またはその治療または結果の態様と組み合わせた発現レベルの情報を解釈して利用する方法において使用されるべき発現レベルに関する情報の容易な利用を可能にする。疾患またはその治療または結果の態様との遺伝子発現レベルの相関は同じデータ構造の部分として、または、別個のデータ構造として格納してよい。
本発明はまた、別の対象の試料から得た遺伝子発現情報にこれらの相関を適用することにより、この試料を同じ発現レベルを有しているものとして、対象を同じ態様の疾患を有するか同じ治療への感受性またはその結果を示す可能性がある者として発見する能力を与える。他の対象由来のこのような試料には、固定されていないもの、限定はされないが、例えば新鮮試料または凍結試料が包含される。このような他の試料から得られた発現レベルの情報は本発明の実施により得る必要はなく、むしろ他の手段、例えば、限定はされないが、個々の遺伝子配列のRT−PCR増幅および発現された配列によるタンパク質のコード化の発現を検出することを含んでよい。このような解釈と利用の方法は場合によりコンピューター処理される。
このようなデータ構造における核酸発現情報は好ましくは6ヶ月〜100年を超える過去からの1個以上の固定組織試料より得た情報を備え、好ましくは試料の採取元である対象の固定後の治療および/または結果に関わる情報を備える。複数の対象から得た複数の試料の情報は相関付けられ、疾患の特徴または対象の固定後の治療および/または結果に関連するような1つ以上の遺伝子配列の特異的な発現レベルを特定する。この情報は対象における疾患または望ましくない状態の臨床的な定義または同定の全てまたは部分を形成するために全体または部分を適用してよい。この情報を使用し、他の対象が経験するおこりそうな結果について、それらの対象の組織試料での同じ発現プロファイルを用いることで予見することもできる。その情報はまた、発現レベルに相関付けられた診断、予後、治療、治療への応答、および/または実際の結果に基づいてより大きい群の集団またはサブ集団を定義するものとして1つ以上の配列の発現レベルを用いるために適用してよい。また1つ以上の配列の発現との関係に基づいて、疾患またはその治療の新しい特徴を特定するために、その情報を用いてよい。
本発明の別の態様はこの情報を適用または問い合わせる(interrogate)方法を備えるが、これによって同じ発現レベルを有し、従ってある母集団または小集団に属する別の対象から得た試料を含む細胞を特定することができる。別の対象から得たこの試料は、固定される必要はないが、この限りではないが、新鮮試料または凍結試料であってよい。これらの方法は場合によりコンピューター処理されることにより、診断、予後、治療、治療への応答および/または実際の結果に発現レベルを相関付ける情報の有益な適用を最大限にしてよい。これらの方法は患者の治療および/または相談を行う医師および他の医療担当者を支援するために本発明の臨床適用において有利である。
(本発明を実施する形態)
本発明は、ホルマリン固定(FF)および場合によりパラフィン包埋(FFPE)された(日常的)臨床生検試料から得られた細胞の全般的mRNAプロファイリングを備える。換言すれば、本発明はFF試料細胞中の全般的mRNA発現の分析を備える。本発明は、生検試料の細胞内の種々の遺伝子の発現を決定し、ならびに細胞内のタンパク質発現の指標として役目を果たすのに適用してよい。
1つの実施形態においては、本発明は場合によりホルマリン固定組織試料から細胞を単離するための顕微切断技術、次いでRNA抽出プロトコルおよびその後のmRNAの増幅を利用することにより全般的mRNA発現プロファイリングを可能とする。単離された細胞は好ましくは非正常と思われるものである。正常細胞もまた単離して対照細胞として使用してよい。次に特定された発現プロファイルを用いて、その発現が細胞およびそれが置かれている状態に関する分子発現シグニチャーを定義するような遺伝子配列を特定する。このような状態は例えば、限定はされないが、疾患の状態、型、状況、段階および/またはサブ段階またはサブタイプを包含する。好ましい実施形態においては、シグニチャー(または発現レベル)を組織試料の採取元である対象に関わる歴史的データと共に使用して細胞を特定し、従って対象は種々の治療プロトコルに対して感受性または耐性であるような細胞を含む。次にこの情報は、同じシグニチャーを有する細胞を有するものとして同定された別の対象またはヒト患者における治療を方針付けるため(より有効な治療を利用するため)に使用する。別の実施形態においては、発現レベルを試料の採取元となった対象から得た予測的データと共に使用する。
本発明の特定の例においては、FFPE試料から遺伝子発現データを得るための工程を備え、その方法は下記工程を含む:
(1)例えば顕微切断(例えば、限定はされないが、レーザー顕微切断)により細胞含有部分のFFPE試料を単離すること、
(2)試料を抽出してmRNA含有画分を採取すること、
(3)場合によりmRNAを精製すること、
(4)mRNAを増幅し、場合により下記を含む方法を用いること、:つまり
a.ポリ(またはオリゴ)dT領域およびプロモーター部分の両方を含むプライマーを用いた逆転写による第1の鎖DNAの合成、
b.外因的に供給されたランダムプライマーを用いた第2の鎖の合成、
c.FFPE試料中のmRNAに相補的な配列を含むRNA分子のマルチコピーを生成するためにこのプライマー(場合によりこの第2の鎖合成を介して2本鎖にされているもの)中に存在するプロモーターから開始されるインビトロ転写(IVT)、そして
(5)種々の遺伝子配列の配列を含むマイクロアレイへのIVT転写RNAのハイブリダイゼーションを介した試料中の遺伝子発現(mRNAレベルとして示されるもの)の分析。
本発明は当該分野で既知の種々の方法により固定および包埋された試料を用いて実施してよい。つまりこのような方法は通常は疾患または他の望ましくない状態に罹患しているか、またはこれを有すると疑われる患者から得た細胞含有組織を用いて開始する。組織試料の非限定的な例は、コア生検試料、摘出腫瘍組織および細胞学的試料を包含する。他の非限定的な実施例は微小針吸引物(FNA)、針生検試料および管洗浄試料を包含する。組織型の非限定的な例は膵臓、大腸、大腸癌、筋肉、膀胱、腎臓、肺、脳、リンパ腫および多細胞生物の他の何れかの組織を包含する。
試料は迅速に固定手段、例えばタンパク質交差結合活性を有する溶液、例えば、限定はされないが、ホルムアルデヒド溶液、グルタルアルデヒド溶液、ホルムアルデヒドアルコール混合溶液、アルコール溶液、Bouin溶液、Zenker溶液、Hely溶液、浸透圧酸溶液、Carnoy溶液およびこれらの等価物中に浸積する。固定用アルコールの非限定的な例は、エタノールおよびイソプロパノールを包含する。これは、好ましくは採取後固定前に起こる可能性のある細胞の変化を最小限にするために可能な限り迅速に行う。固定はまた、組織およびその中の細胞の微細構造を維持する。
固定剤は好ましくはホルムアルデヒドまたはパラホルムアルデヒドまたは他の組織試料固定手段を含む。好ましい固定剤は、緩衝ホルムアルデヒド、例えば緩衝ホルムアルデヒド溶液またはホルムアルデヒドまたはパラホルムアルデヒドを緩衝する他の手段を包含する。固定された試料は「湿潤アーカイブ」の部分と考えられる「湿潤試料」として維持してよく、または、場合によりパラフィンまたは他のワックス様炭化水素のような包埋手段を用いて処理する。他の固定剤、例えばアセトン、Clark溶液、Canoy溶液、グルタルアルデヒド、塩化第二水銀含有ホルムアルデヒド製剤およびBouin固定剤も使用してよいが、本発明は好ましくはホルマリン固定およびパラフィン包埋(FFPE)されたアーカイブ組織試料の多数と共に実施される。固定剤は場合によりマグネシウムカチオンを含有してよい。
固定の時間は好ましくは約4℃〜室温の温度で16〜48または72時間である。約16、約20、約24、約28、約32、約36、約40、約44、約48、約52、約56、約60、約64、約68および約72時間を本発明の実施において使用してよい。あるいは、約3、約4、約5、約7、約8、約9、約10、約12、約14および約15時間のより短い時間を使用してよい。このようなより短い時間はより小さい試料、例えばFNAまたは針生検試料の場合により適切である。約4、約8、約12、約16、約20、約24および約26℃の温度を使用してよい。本発明はまた他の時間、例えば4、5、6、7または8日間、そして本明細書に開示したものとは異なる温度で固定した試料を用いて実施してよい。固定後、試料を包埋のための標準的な手法および手段を用いてパラフィン中に包埋し、その後当該分野で使用されている条件下、例えば約4℃〜室温の温度で保存してよい。
固定され包埋された試料の齢(age)は、試料の採取元である患者の実際の結果と発現レベルを相関するための本発明の実施に関し、好ましくは約6ヶ月〜約100年である。当然ながら、約6ヶ月未満の試料も本発明の実施において使用してよいが、時間間隔が短いため採取元の患者の実際の結果にその試料における発現レベルを相関付けることができない場合がある。しかしなお、関連する結果の情報がない試料の発現レベルは、より古い試料と共に本発明を用いて得られた発現レベルおよび相関付けされた結果との比較において使用してよい。
実際の結果に発現レベルを相関付けるための好ましい古い試料は、約6ヶ月、約1年、約2年、約3年、約4年、約5年、約6年、約7年、約8年、約9年、約10年、約11年、約12年、約13年、約14年、約15年、約16年、約17年、約18年、約19年、約20年、約25年、約30年、約40年、約50年、約60年、約70年、約75年、約80年、約90年または約100年経過したものである。
固定された試料の切片は、好ましくは本発明において使用され、その後の使用のために、固定された試料の材料を保存する。切片化はまた、後に記載する顕微切断の任意の使用と組み合わせて使用してよい。切片の調製は切片化のための何れかの技術および手段によってよい。1つの実施形態においては、パラフィンブロックをミクロトームを用いてスライスし切片化する。好ましくはミクロトームを慎重に洗浄して外来性の核酸分子または核酸分解物質が混入する可能性を除去または低減しておく。非限定的な例は、切片化過程と組み合わせて用いられるプラスチック器具の処理のために3%次亜塩素酸塩の使用と共に無害のチロール代替物を使用することを包含する。
切片化は、場合により、ただし好ましくは、当該分野で既知の操作法により脱パラフィン処理して試料から大部分のパラフィンを除去する。脱パラフィン処理のための種々の手法が知られており、何れかの適当な技術を本発明の実施において使用してよい。このような方法には例えば、限定はされないが、有機溶媒またはパラフィンを溶解する薬剤による洗浄が包含される。適当な溶媒の非限定的な例はベンゼン、トルエン、エチルベンゼン、キシレン、D−リモネン、オクタンおよびこれらの混合物である。これらの溶媒は好ましくは高純度、通常は99%超のものとする。
パラフィンを有機性の溶媒または物質で洗浄することにより除去し、その後それ自体を除去する。使用する有機溶媒の容量および必要な洗浄回数は試料の大きさおよび除去すべきパラフィンの量により異なる。試料は1〜約10回、または約2〜約4回洗浄してよい。有機溶媒の典型的な容量は組織試料10μm当たり約500μLである。脱パラフィン処理のための他の方法も使用してよい。
脱パラフィンの後、試料は好ましくは例えば漸減濃度の水性の低級アルコール溶液で段階的に洗浄することによるなどして再水和する。エタノールが再水和のための好ましい低級アルコールであるが他のアルコールも使用してよい。非限定的な例はメタノール、イソプロパノールおよび他のC1−C5アルコールを包含する。あるいは試料をアルコール溶液と激しく混合した後にこれを除去する。1つの実施形態においては、アルコールの濃度は各段階において約10%以下の低下となるように約3〜5段階に渡って水中約100%から約70%まで段階的に低下させ、例えば100%、95%、90%、80%、70%の段階としてよい。脱パラフィンおよび再水和はまた当該分野で既知の他の試薬を用いて行ってもよい。
脱パラフィンの有無に関わらず、切片は場合により好ましくはRNAの損失をもたらさない手段の使用により染色し、切片中の細胞を可視化する。本発明の一部の実施形態において、特に、1つ以上の個々の細胞を単離するための任意の顕微切断工程をその後使用する場合には、ヘマトキシリンおよびエオシン(H&E)染色を行ってよい。染色によりまた、RNAの抽出のために好ましくは用いられない夾雑細胞の存在または非存在に基づいて、その後の顕微切断が必要であるかどうかを決定するための切片の評価が可能となる。癌細胞内の遺伝子発現が最大関心事である癌細胞試料中に過剰な浸潤免疫細胞が存在することは、使用するための癌細胞を単離する顕微切断が望ましい状況の一例である。
組織切片の顕微切断はそのために適する何れかの手段により実施してよい。非限定的な例はレーザーキャプチャーマイクロダイセクション(LCM)またはレーザー顕微切断(LMD)を包含する。細胞の単離は好都合にも、例えば、限定はされないが、浸潤免疫細胞のような未関連の細胞型の除外、並びに他の起源および/または表現型の細胞の除外を可能とする。顕微切断は本発明の実施において好都合に使用してよく、その理由は、夾雑の非疾患関連細胞(例えば浸潤リンパ球または他の免疫系細胞)が固定および包埋組織試料または切片から除去されることにより目的の細胞内の遺伝子発現の測定への影響を回避できるためである。このような夾雑の非限定的な例は、生検試料を固定し、その後、切片を調製するために使用する場合にありえる。約100〜1000以上の細胞を捕捉することが本発明の実施のためには好適であるが、より少ない細胞の使用も可能である。
脱パラフィンされていない顕微切断された試料に、場合により上記した方法を用いてパラフィン除去をほどこしてよい。
本明細書においては切片化および顕微切断は共に本発明において利用される細胞由来のRNAの抽出前の任意の工程である。本発明は種々の抽出プロトコル、例えば酸グアニジンチオシアネート/フェノール−クロロホルム、種々の温度および種々の回数によるプロテイナーゼK消化、およびオリゴdT系のクロマトグラフィー、およびグアニジニウムチオシアネート溶解の後のガラスビーズまたは他のシリカ系マトリックスへの結合と共に実施してよい(文献13〜15参照)。しかしながら、本発明はまた以下に記載するもののようなRNA抽出の新しい方法も提供する。この方法は意外にも固定された試料から抽出されるRNAの量および質において向上をもたらすことが判った。
本発明はまたホルムアルデヒドを用いた固定のため、しばしば修飾されてしまう核酸塩基を脱修飾すると考えられている任意の過熱工程を可能にする。しかしながら本発明はこの理論に制約されるわけではなく、これは本発明を理解しやすくするものであり、これを限定するものではない。理論的な修飾は種々の比率におけるモノメチロール(−CHOH)基の付加である。修飾された塩基は改変された塩基対形成能を有し、このため、試料中のRNA分子がプライミングおよび核酸重合過程、例えば逆転写の間など他の核酸にハイブリダイズしなければならないような本発明の何れかの態様に対して有害な影響を及ぼす場合がある。
特に本発明はRNA分子の有害な分解を伴うことがないより長い加熱時間の使用を備える。好ましくは、加熱は少なくとも1時間、好ましくは60分超、例えば120分または180分、70℃または約70℃の温度で行うが、8時間までの時間を使用してよい。即ち加熱時間は60分超〜約75分、約90分、約105分、約120分、約135分、約150分、約165分、約180分、約4時間、約5時間、約6時間、約7時間または約8時間であってよい。最も好ましくは約3時間、例えば150〜210分、または、165分〜195分の加熱を用いる。そして、種々の緩衝溶液中で行ってよく、例えば、限定はされないが、10mMトリス塩酸、pH8.0またはそのあたりを用いてよい。同等の酢酸塩緩衝液も使用してよい。このような条件を利用できるのは、RNAの分解および収率低下が70℃での加熱60分の場合に起こるという証拠を考慮にいれると、意外な発見である(Masuda等(6)参照)。
本発明はポリまたはオリゴdTプライマーを用いることにより、固定試料の細胞由来のポリアデニル化RNAを全般的に増幅する手段を提供する。プライマーは第1のcDNA鎖の合成に関するmRNA分子のポリAテールにハイブリダイズするために使用する。このような鎖は比較的短く、約100〜400塩基対のオーダーであるか、または、より長く、例えば1〜6キロ塩基であってよい。これは固定試料から抽出されたmRNAのポリAテールが分解されすぎてポリまたはオリゴdTプライマーによる逆転写ができないという、当該分野の理解に基づけば意外な結果を反映している(Lewis等(5)参照)。種々のdT系のプライミング方法を本発明において使用してよく、非限定的な例は、米国特許第5,545,522号、5,716,785号および5,891,636号に記載されているものを包含し、この文献においては、第2のcDNA鎖の合成は外来性プライマーを使用することなく実施されている。好ましい方法は国際公開第02/052031号(2001年12月21日出願のPCT/US01/50340に相当)に記載されており、第2のcDNA鎖の合成のためにランダムプライマーを利用している。
cDNAは遺伝子発現の直接分析のために使用してよく、例えば、、限定はされないが、標識されたポリヌクレオチドプローブにハイブリダイズするか、または、検出のために標識された後にプローブにハイブリダイゼーションしてよい。または、cDNAはPCR法による増幅とその後の検出により間接的に分析してよい。あるいは、cDNAは国際公開第02/052031号に記載の方法によりインビトロ転写(IVT)のために使用してよい。つまり第1の鎖のcDNAは第1のcDNA鎖を合成するのに用いられるポリまたはオリゴdTプライマーへの作動可能な連結を介して導入された1本鎖または2本鎖の形態のプロモーター配列を含む。得られた2本鎖のcDNAはこのプロモーターからの開始により転写され、mRNA転写産物を生成する。これらの転写産物はcDNAを生成するために使用されるポリアデニル化RNAの配列とは相補的な配列を含む。本発明のプライマー連結プロモーターは好ましくはT7プロモーターであるが、他の非限定的な例はT3およびSP6プロモーターを包含する。
別のIVT実施形態においては、プロモーター配列は第2のcDNA鎖の合成に使用されるランダムプライマーへの作動可能な連結を介して導入してよい。得られる2本鎖cDNAはこのプロモーターからの開始により転写され、cDNAを生成するために使用されるポリアデニル化RNAの配列を含むmRNA転写産物を生成する。上記IVT実施形態のいずれかにおいて、転写された(または増幅された)RNAは標識されたポリヌクレオチドプローブへのハイブリダイゼーションにより直接分析するか、検出のために標識した後にプローブにハイブリダイズしてよい。転写されたRNAはPCR法によるか、または上記したとおり分析されるcDNAへの変換によるかして、増幅後に間接的に分析してもよい。これらの後者の手法の両方とも、当然ながら、cDNAの末端の配列に相補的なプライマーの使用に依存している。
特に好ましい実施形態においては、増幅されたRNAの一部を用いて標識されたヌクレオチドを使用するなどして蛍光染料にコンジュゲートされた標識cDNAを生成する。第2のそして適合する蛍光染料を用いて比較対照増幅RNAを標識する。両方の標識cDNAの等量をマイクロアレイの異なる位置に個々に位置する種々の核酸配列のマイクロアレイにハイブリダイズさせる。ハイブリダイゼーションおよび洗浄の後、マイクロアレイをスキャンし、マイクロアレイ上の各配列に対するハイブリダイゼーションシグナル強度に関して定量する。正規化後の蛍光強度は比較対照増幅RNAに対する各増幅RNAの比として表示することにより、各増幅RNAの配列の遺伝子発現レベルを示すことができる。あるいは、増幅RNAはそれが生成された状態で標識する。標識された増幅RNAは場合により断片化し、例えばその限りではないが、マイクロアレイ上に固定化されたプローブにハイブリダイズさせる。RNAは検出のために例えば蛍光または放射標識ヌクレオチドによるなどして検出のために直接標識するか、または、蛍光または放射標識ストレプトアビジンを用いて検出されるビオチニル化ヌクレオチドによるなどして間接的に標識してよい。従って、本発明の増幅RNAに相当するDNAおよびRNAの分子は共にプローブとして使用してよい。間接的標識の別の形態は、蛍光染料などのような標識を核酸分子に結合するためのアリルアミンの使用である(例えば後述する実施例1参照)。
好ましくはマイクロアレイ上の配列は、本発明の使用により分析した場合のFFPE試料の細胞中に発現される種々の遺伝子配列の3’部分のものである。当業者に明らかなように、3’部分はポリアデニル化部位に最も近接しており、即ち、逆転写される可能性が最も高く、即ち本発明の実施において得られるcDNA中に存在する。
例えば、限定はされないが、上記した蛍光強度の比のような種々の配列の発現レベルに関する情報は、当業者が好適と考える適切な手段を介して格納してよい。本発明の好ましい実施形態においては、情報は磁気的または電子的に、より好ましくはコンピューター読み取り可能な形態で格納される。発現レベルのデータは生データとして、または、処理されたデータ(例えば、限定はされないが、正規化、補正された、または比の形態)として、またはその組み合わせとして格納してよい。好ましくは処理されたデータは試料の各遺伝子配列に対する発現値または発現指数に変換されている生の発現レベルの形態である。好ましい実施形態においては、情報はデータセットおよび/またはデータ構造として格納される。1つの非限定的な例は、格納されたレコードを有するテーブルとしての記憶装置である。テーブル格納手段は対象識別子(対象のFFまたはFFPE試料の種々の配列の発現レベルに関する情報の有無に関わらない)および/または遺伝子配列識別子のような情報を格納するデータフィールドとして捕らえてよい。これらの識別子はまた各フィールドに対する記述的名称としても機能する。好ましくは、対象識別子と遺伝子配列識別子のフィールドの両方がレコードを独自に識別するために使用される第1の「キー」とされる。本発明のテーブル状の情報格納手段は好ましくは疾患または望ましくない状態に特異的なものであり、コンピューター読み取り可能な媒体上に格納してよい。それらはまた、本発明により与えられる特異的な操作、「ルックアップ(look up)」またはアプリケーション機能を支援するデータ構造であってよい。
本発明の特に好ましい実施形態においては、遺伝子発現レベルの情報をFFまたはFFPE試料の採取元であるドナーに関する他の情報と組み合わせる。好ましくは、対象はヒト患者であり、このような他の情報には、例えば、限定はされないが、医療上または臨床上の処置に関連して通常得られるものが包含される。非限定的な例は、齢、体重、身長、病歴並びに健康状態および/または症状または疾患の型または試料採取時の状況である。さらなる例は試料の病理学的検討から得られる情報である。後者の項目は疾患または他の望ましくない状態に罹患しているか、それを疑われる患者に関して妥当なものである。このような更なる情報もまた、上記したテーブル上の格納手段を用いて、または、別個の格納手段に格納してよい。
入手可能な場合、他の情報はまた、試料の単離の後の患者の診断および治療に関わる情報を包含する。一般的に、このような情報は、治療と結果(その後の疾患の発症、根絶または後退を含む)並びに担当医の記録および/または所見を記録するために長年にわたり患者の病歴中に順当に維持されるものである。後者の非限定的な例は、患者の異常な遺伝子的構成の症例、明確な診断名または治療過程を決定する困難さ、および/または、治療にも関わらず進行する異常疾患を包含する。このようなさらなる情報の他の非限定的な例には患者の診断および/または予後、適用した治療、この治療に対する患者および疾患の応答性、この治療の副作用の有無、対象の死亡の原因および年齢、およびこの患者および疾患に関わる他の結果が包含される。本発明の特に好ましい実施形態においては、適用する治療および結果に関する情報を遺伝子発現レベルに関わる情報と組み合わせる。
結果に関する好ましい情報は長年にわたり収集されたもの、例えば、限定はされないが、その後の疾患の発症、根絶または後退、治療の成功または失敗、および、治療後の患者の寿命である。このさらなる情報はまた上記したテーブル状の格納手段を用いて、または、個別の保存手段中に格納してよい。あるいは、テーブル状の格納手段と組み合わせて用いられるレシーバーオブジェクト内に導入することにより上記したテーブル状格納手段と組み合わせてよい。この組み合わせは好ましくは同じ媒体内に格納される。
遺伝子配列の発現レベルに相関付けてよい他の情報は組織試料採取時の対象のものを包含する。非限定的な例は既存の疾患、例えば自己免疫不全疾患、望ましくない状態、例えば過剰な炎症、および、細菌、ウイルスまたはカビ病原体による感染を包含する。更にまた、試料の単離後に対象に関して収集した同じ型の情報も相関付けてよい。このようなデータは予測的な性質を有し、非限定的な例として臨床治験から得られるものを包含する。即ち本発明はFFまたはFFPE試料単離の時点と比較して遡及的および予測的であるデータの使用を伴いながら実施してよい。更に、本発明はRNA抽出およびcDNA調製の時点と比較して遡及的および予測的であるデータと共に実施してよい。
FFまたはFFPE試料中の種々の遺伝子配列の発現レベルを測定できることは長年にわたる疾患および患者の結果に関わる情報に発現レベルを関係付ける独特な手段を備えるものであり、これはFFまたはFFPE試料が結果を相関付けるもととなる時間の比較対照点として機能できるためである。即ち、長年にわたる疾患および患者の結果に関わるデータと組み合わせられるほど十分に古いFFまたはFFPE試料は、疾患の進行および結果に遺伝子発現を相関付けるために照会することができるアーカイブである。
本発明は、個々の遺伝子配列の分析に基づいた発現データの他の個々の小単位とは対照的に、そこに格納された全般的遺伝子発現データへの接触を可能とすることによりアーカイブを「ロック解除」する。単一の試料中の遺伝子配列発現レベルの複数を同時に評価できる能力により、これらのレベルに関わるデータをその後の使用、分析および操作のためのデータ構造となるようにコンパイル(compile)できるようになる。
一般的に、データのコンパイルの手段は当該分野で知られているが、本発明は本明細書に記載している対象または患者に関わるさらなる情報とのFFまたはFFPE試料から得た遺伝子発現データの組み合わせのための手段を提供する。この即時の発明により提供される手段およびその結果の組み合わせは、部分的には疾患に関する分子モデル、並びに疾患の診断および治療の参考になる予測的モデルを作成する能力を提供する。この組み合わせのデータの発生および使用は後に記載する。
結果に相関付けられた遺伝子発現レベルの「プロファイル」を適用または問い合わせる方法は、対象から得られた試料における遺伝子発現と本発明により作成される1つ以上のプロファイルとの比較により、全体または部分的な疾患を有すると疑われるその対象を診断することを包含する。同じかまたは同様の遺伝子発現プロファイルは同じ疾患の存在を示す。即ちプロファイルは、疾患の定義の部分として、または診断から他の疾患または望ましくない状態を排除するための示差的診断のためのツールとして捕らえてよい。プロファイルはまた同じかまたは同様の細胞の遺伝子発現プロファイルを有する対象1つ以上の特性を定義するものと考えてよい。これらの特性は本明細書に記載した種々の結果並びにこれから認識するべきものを包含する。
プロファイルをまた、上記したように得られた診断を用いることによる対象への治療を決定する方法において使用し、治療を決定してよい。あるいはプロファイルは、プロファイルを作成するために試料を使用した対象の治療結果に基づく有効な治療の指摘を含んでよい。治療を探索中かそれが必要な対象から得た試料中の遺伝子発現レベルの同じか同様のプロファイルは、プロファイルを作成するのに試料を使用した対象に対して有効であることが判っている治療の使用を指摘する。
本発明のプロファイルはまた、疾患に罹患した対象の予後およびカウンセリングに関する情報を与えるために使用してよい。本発明の遺伝子発現レベルに関連していた疾患の結果に関する情報は、その組織試料が同じか同様の遺伝子発現レベルを有することが判っている対象に提供されてよい。
RNAの抽出
RNAは酸グアニジニウムチオシアネート/フェノール−クロロホルム、プロテイナーゼK消化、オリゴdT系クロマトグラフィーおよびグアニジニウムチオシアネート溶解の後のシリカ系媒体への結合を用いたプロトコルを介して、FFPE試料の細胞から抽出してよい。通常はEDTA存在下のプロテイナーゼK消化の使用の後、RNAの単離のために分解したタンパク質性物質並びにプロテイナーゼKタンパク質を除去するために、フェノールまたはフェノール−クロロホルムを用いた抽出工程を通常は行う。当業者に明らかなとおり、タンパク質性物質は水相中に残存するRNAを含む核酸から非水性フェノール系の相の存在を介して分離される。
本発明はプロテイナーゼKの使用と、その後の夾雑タンパク質性物質を変性するためのカオトロピック剤としてのグアニジニウム含有化合物を用いた変性を含む、RNA抽出の進歩した方法を提供する。次にRNAを夾雑タンパク質性物質に結合しないシリカ系マトリックスへの結合により単離する。これは部分的には、グアニジニウム含有化合物がプロテイナーゼKを変性し、これにより離れたRNAを精製することが可能であるという意外な発見に基づいている。次に結合RNAを従来の手段を用いてシリカ系マトリックスから溶出し、その後の操作に付してよい。
グアニジニウム含有化合物の非限定的な例は、グアニジニウムイソチオシアネート(GITCまたはグアニジニウムチオシアネート、GSCN)および塩酸グアニジニウムを包含する。これらは当業者が適切なものを選択してよい種々のアニオン系対イオンを用いて使用してよい。本発明において使用されるグアニジニウム溶液は、一般的に約1〜約5Mの範囲の濃度を有し、好ましい値は約4Mであり、好ましくはトリス塩酸のような適当な生化学的緩衝剤を用いて約3〜約6、より好ましくは約4にまで緩衝する。グアニジニウム含有溶液は場合により1種以上のRNAse阻害剤を含有してよい。
グアニジニウム含有化合物の活性を有する他のカオトロピック剤も、グアニジニウム含有化合物を用いた場合と等価な量でFFPE試料から有効濃度のRNAが精製される限り、使用してよい。このような薬剤の非限定的な例は、尿素、ホルムアミド、ヨウ化カリウム、カリウムチオシアネートおよびこれらの等価物である。
好ましくはEDTA存在下のプロテイナーゼK処理は好ましくは42℃またはおよそ60℃までの温度で、少なくとも8時間、好ましくは少なくとも16時間、より好ましくは少なくとも24時間行う。他の条件はRNA抽出に適すれば如何なるものでもよい。非限定的な例は10mMトリス塩酸、pH8.0程度、2%SDSおよび100〜500μg/mlプロテイナーゼKである。
上記は、試料の固定細胞をプロテイナーゼKで処理することにより細胞溶解物を調製し、これよりタンパク質性物質を除去した後に核酸物質に対するその後の調製作業を行う本発明の実施形態を示している。上記したフェノールまたはGITCの使用の他にタンパク質性物質の除去工程の非限定的な例としては、タンパク質性物質および/または2価のカチオンに結合するアニオン系の多電解質物質の水溶液の使用である。このような物質は、粒子状の性質を有し、そして/またはAmbionから入手可能なもののようにスラリーとして適用してよい。タンパク質性物質の除去の後、試料は場合によりDNase処理し、その後RNA増幅に用いる。任意のDNaseを使用する場合は、タンパク質性物質の除去および/または変性工程はRNA増幅のための工程の前に用いることができる。
遺伝子発現レベルデータの作成および使用
本発明の方法の実施により得られるFFまたはFFPE試料の遺伝子発現レベルデータは、好ましくは複数のデータフィールドを含むコンピューター読み取り可能な媒体の1つ以上のデータフィールドに組織化される。好ましくはデータは、試料ドナーから得た他のデータに相関付けてよい発現値または指数の形態である。データフィールドは、場合により1つ以上のデータセットおよび/または1つ以上のデータ構造に組織化してよい。データフィールドはこのコンピューター読み取り可能な媒体の一定範囲のアドレス内に格納され、FFPE試料からの遺伝子発現レベルデータを示すものとして処理してよい。
遺伝子発現データの生成は好ましくは本明細書に記載したマイクロアレイのようなアレイへのハイブリダイゼーションを使用することにより行う。種々の遺伝子配列を含む核酸プローブをマイクロアレイの所定の位置に個別に配置する。プローブは好ましくはマイクロアレイ上に固定化され、場合により共通性を有する種々の遺伝子または遺伝子フラグメントを示す。共通性の非限定的な例は、それらが所定の細胞型、組織または臓器において発現されるという推定;疾患状況または望ましくない状態における発現;同様の生物学的機能を包含し;またはある生物に関する全ての発現遺伝子である。あるいは、本発明はIlluminaから入手できるもののようなアレイ中に分類可能な物質の使用と共に実施してよい。
マイクロアレイの製造に関しては種々の手法が知られており、それらは種々の密度において配置されたプローブよりなってよい。非限定的な例には、平方センチメートル当たり約10〜約500,000プローブ(即ち遺伝子配列)を包含する。このようなマイクロアレイのプローブを本明細書に記載したFFまたはFFPE試料から誘導した標識核酸分子にハイブリダイズさせる。個々のプローブへのハイブリダイゼーションの観察される強度が、FFまたはFFPE試料中の個々の配列の発現レベルまたはデータを反映する。
一般的には既知の原料および/または量のmRNAから誘導した対照試料、および、本明細書に記載したFFまたはFFPE試料のmRNAから誘導した被験試料が存在する。対照試料の1つの非限定的な例は、好ましくは非正常細胞を含有する被験試料のために使用したものと同じFFまたはFFPE試料から得た正常細胞である。正常および非正常細胞は本明細書に記載され、当該分野で一般的に使用されている、顕微切断の使用により単離することができる。
対照および/または被験試料は種々の配列の発現に関わる1つ以上の非ゼロシグナルを有するマイクロアレイ実験の間の対照として機能するもののような比較対照mRNAと組み合わせて使用する。非限定的な例にはStratageneより入手でできるヒト、ラット、およびマウスのUniversal Reference RNAが包含される。被験試料は疾患に罹患した、または薬剤または他の物質を処方された対象のFFまたはFFPE試料から得たものであってよい。試料はまた、特定の治療または薬剤使用に応答する腫瘍から得たもの、および、そのように応答しないものであってよい。このような種々の試料中の遺伝子発現レベルはまた、相互に、または対照に対して評価することにより、ある試料とは相関するが他のものとは相関しない遺伝子発現レベルを特定してよい。
好ましくは、種々の試料のハイブリダイゼーションは同じ条件下において実施し、特に好ましい実施形態においては、対照および被験試料は異なる標識を施し、同じマイクロアレイにハイブリダイズする。好ましい標識は蛍光標識、例えば、限定はされないが、核酸分子を直接または間接的に標識するために使用されているAmershamより入手可能なレッドおよびグリーン(例えばCy5およびCy3)モノ反応性染料である。各ハイブリダイゼーションで得られたデータは、生ハイブリダイゼーションシグナル強度として、または、例えば、限定はされないが、スポットフィルター処理、バックグラウンド補正および/または正規化のような操作後のものとして、本明細書に記載するとおりコンピューター読み取り可能な媒体に格納してよい。好ましくは、データは対照試料(比較対照RNA)の強度に対する被験試料強度の正規化比として格納するが、処理データの他の形態は、試料および生発現レベルデータにおける統計学的変数に関して調節することにより、股使用される発現値または指数を作り出すものが包含される。データは好ましくはデータフィールドにロードすることによりFFPE試料の採取元である対象に関わる他の情報への比較における結果の分析を容易にする。他のデータ、例えば各試料、ハイブリダイゼーション条件、およびマイクロアレイ情報に関するものは場合により上記データと共に格納する。
ハイブリダイゼーションシグナル強度は、好ましくはマイクロアレイリーダー/アナライザーにより測定される。これは一般的には、ハイブリダイゼーション実験と共に使用する種々の既知のハードウエアおよびソフトウエアの要素を用いて実施され、このマイクロアレイリーダー/アナライザーはマイクロアレイの各部位またはエレメントに関して生または処理された発現データを出力する。データはマイクロアレイ上の各エレメントに関する蛍光強度値を含んでよい。処理されたデータは、場合により対照に対する比としての個々の遺伝子配列の発現または非発現の測定を可能にする。場合により何れかの発現のレベルは、所定の遺伝子配列に関するマルチプローブのような所定の配列に対する同じかまたは異なるプローブを有するマルチサイトから得られたハイブリダイゼーションデータに基づくことができる。処理されたレベルは、使用前に平均してよい。
遺伝子発現データは、限定はされないが、例えばマイクロアレイ上に提示された遺伝子配列の位置および名称、FFまたはFFPEドナーの情報、マイクロアレイ設計の情報、生物学的情報、データソース、FFまたはFFPE試料の情報、実験試料の説明およびさらなる実験データ、および、ハイブリダイゼーション情報のような、他のデータと共に同じかまたは異なるファイルに格納してよい。
ハイブリダイゼーションシグナル強度(生データ)または発現指標(生強度の比等)として表示される遺伝子発現に関する情報は、「発現データ」であり、FFまたはFFPE試料内の種々の遺伝子配列の発現を反映している。発現データは場合により、発現データ、データの入手元であるFFまたはFFPE、または試料の採取元である対象に関するさらなる情報のエントリーを指示するメッセージおよび/または一連のプロンプトを含んでよい。非限定的な例は試料の採取元である対象の結果データ、例えば長年にわたり対象が経験した診断、予後、治療、治療への応答および/または実際の結果を含む。発現データおよびプロンプトは、コンピューター読み取り可能な媒体の一連のアドレス内に格納されたデータフィールドの形態であってよい。
発現データを含むコンピューター読み取り可能な媒体は、場合によりさらに発現データを含むのみならず、FFまたはFFPE試料、即ち発現データの入手元である試験対象の結果データを受け取る情報の中央ユニットとして機能する「結果データ」オブジェクトを含んでよい。結果データはまた、試料ドナーの表現型データと考えてよく、これにはドナーの年齢、人工統計学的特徴および履歴;病歴;診断歴;適用された治療およびそれへの応答;死亡率;疾患の再発、例えば再発時の疾患の形態の変化;および上記した他の情報が含まれる。結果データオブジェクトは、発現データとは別個の一定範囲のアドレス、または発現データを提示しているデータフィールドをやはり格納する一定範囲のアドレスに格納してよい。この結果データオブジェクトを作成する場合、これは対象が経験した結果の表現型情報を格納するために別途確保する場所を有する。これは、結果オブジェクトもまた発現データを含むため、結果の情報を格納するのみであるデータベースとは異なる方法である。これにより、結果オブジェクトを用いて発現データを表現型データ/結果と相関付けることができ、これにより1つ以上の表現型の結果に連結するものとして特定の遺伝子配列の発現を特定できるため、以前には得られなかった利点を与える。これはまた1つ以上の結果に関係する全ての情報を含むいっぽうでオブジェクトを1つの位置またはソースから別のものへ受け渡すことを可能にする。これらの利点により失われた情報の可能性を最小限にしながらより簡便で迅速な使用が可能となる。
結果データオブジェクトの作成の後、ユーザーまたは他のソースから種々の表現型および結果の情報を受け取る状態にある。好ましい実施形態においては、結果データは電子的に導入される。結果データオブジェクトの発現データは随時更新してよい。このような更新は、必然的に更新された結果データオブジェクトをもたらし、場合によりこれは更新中の発現データのソースに相当するソースから結果データを受けとることが可能である。このような更新された発現データは、前の発現データを更新し、置き換えてよい。
ユーザーは、結果情報に対するプロンプトに応答して結果データオブジェクト内に結果データを入力してよく、結果情報は発現データから表示される。結果情報は、結果データを受け取り格納するために適合された結果データオブジェクトのデータフィールド内に格納され、この結果データはテキストまたは数字の形態であってよい。結果データオブジェクトはまた、場合により結果情報に限定されないさらなる情報をユーザーが入力することを可能とする。
結果データを受け取った後、発現データおよび結果データを用いて遺伝子配列の1つ以上の発現を1つ以上の結果に関連するものとして相関付けてよい。換言すれば、発現データ(例えば種々の遺伝子配列に関わる発現指数)は種々の指数および遺伝子配列を結果に相関するものとして同定するための表現型データに関連する。発現指数は、個々のFFまたはFFPE試料の個々の遺伝子配列に関する個々の指数を示す表のようなデータマトリックス中に配置してよい。次に個々の試料の識別子を用いて、試料ドナーからの表現型データを発現指数に関連付ける。この関連付けの過程はまた、個々の試料の発現指数と表現型データとの間の相関を説明するためのモデルまたは発現プロファイルを構築するものとして説明してよい。本発明のこの態様において使用してよい2種の一般的なモデリング方法は、統計学的モデルおよび人工知能に基づくものである。前者の非限定的な例は、ロジスティック回帰および分類樹状図を包含する。これらを用いて特定の発現指数が表現型結果を予測するものであるかどうかを予測してよい。後者の非限定的な例は、ニューラルネットワーク(neural network)である。
モデル構築は発現指数および表現型データに基づいた管理された学習として捉えてよく、これはモデルまたはプロファイルの構築の基となる学習セットとして使用してよい。得られたモデルまたはプロファイルは、好ましくは例えば発現指数が予測的なものとして特定されるような信頼性/確率/尤度のレベルを上昇させることによるなどして、誤差比率を最小限にするように構築される。このことはモデルまたはプロファイルの最適化といってよく、これはまた結果を予測するものとして含められる発現指数の実際の数を結果として低減させる。本発明は、全てが比較、および可能な用法の選択に付される前に最適化してよい同じ発現データおよび表現型データから複数のモデルまたはプロファイルを構築する能力を提供する。
モデルの構築および選択は、好ましくは探索すべきモデルまたはプロファイルに対する関連性または重要性の認識に基づいてデータを採用または除外するための、ドメイン知識の適用により行う。非限定的な例として、遺伝子配列「A」がタンパク質産物「A’」を発現し、順にこれが遺伝子配列「B」の発現を制御するという認識は、表現型データに相関付けることができる独立した指数としてよりもむしろ「A」の発現の同様の増加または低減に相当するものとして「B」の発現の増加または低減を説明するように、モデルを潜在的に調節するためのモデル構築に関連する。ドメイン知識はまた、モデル構築において使用するために好適とされるデータ分析手法の重要性の認識も指している。非限定的な例として、多くの場合において直線的関係として表現型データに遺伝子発現指数を関係付けるPearsonの相関(Pearson Product Moment Correlation)の使用が挙げられる。
選択後のモデルまたはプロファイルは、FFまたはFFPE試料のさらなる発現データおよび表現型データを使用することにより立証することができる。非限定的な例として、モデルが遺伝子配列「X」の発現の低下が患者の24ヶ月以内の死亡に相関するように構築され選択される場合、モデルは遺伝子配列「X」の発現の同様の低下を試料が有する場合に試料のドナーの24ヶ月以内の死亡という表現型の結果を予測するその能力に基づいて、立証することができる。いったん立証されると、モデルまたはプロファイルは特定の遺伝子発現指数に基づいて種々の表現型の結果について予測的であると考えてよい。当然ながら、モデルは既存の学習セットに導入されることになる様々な学習セットまたはさらなるデータ、または、異なる選択基準または異なるドメイン知識の適用を用いることにより精緻化または改変し、その後、再立証してよい。本発明により作成されたモデルは好ましくは、単一の遺伝子配列または2〜5または5〜10個の遺伝子配列の発現レベルが表現型の結果を予測するものであるが、10〜20、20〜30、30〜40、40〜50または50超の遺伝子配列の使用もまたモデル中で使用してよい。
本発明の好ましい実施形態においては、発現データは同じ疾患、望ましくない状態または生物学的状況を有する対象に由来する複数のFFまたはFFPE試料からの遺伝子発現情報を含む。表現型または結果のデータは好ましくは発現データを作成するために使用されるFFまたはFFPE試料のドナーから得た1つ以上の結果に関する情報である。
本発明の理解を促進するためであって本発明の範囲を制限する意図ではない例示によれば、発現データと相関付けるべき結果は特定の治療方法に対する癌の、例えば、タモキシフェンに対する乳癌の応答性であってよい。結果はタモキシフェン治療開始後の種々の時点における疾患の状況(罹患または無疾患)であってよい。この結果のデータを用いて、(上昇または低下した)発現レベルが治療開始後の種々の時点におけるタモキシフェン治療の成功または失敗の何れかに関連する1つ以上の遺伝子配列を相関付けるために使用してよい。相関は、(上昇または低下した)発現レベルが、このような発現レベルを有する対象集団を定義し、タモキシフェンによる治療が有利または有利ではないものと判断する1つ以上の遺伝子配列を発見するために用いてよい。集団はまた、タモキシフェンに対して感受性があるかまたは耐性がある乳癌患者とみなしてよい。
相関を用いてタモキシフェン治療による長期または短期の回復に関わる遺伝子配列レベルを有する対象のようなサブ集団を特定するために使用してよい。このようなサブ集団はまた、種々の期待(または推定)生存期間を有する対象として捕らえてよい。
他の非限定的な例は、ER(+)、結節(−)および2cm未満の腫瘍(最大寸法で)の50歳超の女性から得たFFPE標本(摘出生検試料)から得られた学習データセットの使用である。好ましくは、各群の女性から少なくとも10試料を使用し;より好ましくは少なくとも15試料、少なくとも20試料、少なくとも25試料または少なくとも50試料を各群から使用する。女性は手術を受けており、5年間タモキシフェンを投与されているものとする。これらの女性のある一部は、疾患の再発が起こり、ある一部では起こらないものとする。疾患の再発のなかったものと比較して再発した女性達の一部においてモデルを構築(遺伝子発現プロファイリング)することにより、発現がこのような患者集団における乳癌の再発または非再発を予測するものである遺伝子配列の発見を可能にする。再発が起こったか、または起こらなかった患者は、本発明により与えられるサブ集団である。
当業者には明らかなように、上記した実施例は典型的性質を有し、他の薬品または治療方法、例えばその限りではないが、放射線療法または複合放射線療法および化学療法などに対する応答性は、本発明の適用における焦点であってよい。更にまた、本発明の態様は治療の結果の分析に限定されない。例えば、平均余命または転移の発生との相関付けもまた本発明を用いて実施してよい。
即ち結果データオブジェクトは、発現データおよび結果データの分析と比較のための情報の単一のまとまった単位を提供する。オブジェクトとの類似点は、発現に対する結果の相関に関する全ての情報をおくことのできるフォルダまたはファイルである。次にファイルを1つの個体または位置から他に運び、そこにあるデータの分析に付すか、または、さらなる発現および/または結果のデータを導入することができる。発現レベルのデータは本発明により与えられるFFまたはFFPE中の非選択ポリアデニル化mRNAレベルから得られるため、発現データはより完全なものとなり、これにより結果と相関付けられた遺伝子配列発現レベルのより包括的な発見が可能となる。
結果データオブジェクトを用いることによりまた、広範な種類の選択肢が可能となる。上記したとおり、オブジェクトを用いて遺伝子発現レベルおよび1つ以上の結果を相関付け、この結果に関連する遺伝子発現レベルを含む遺伝子の「発現プロファイル」を定義することができる。「発現プロファイルデータ」は、ハイブリダイゼーションシグナル強度またはその比、または結果に関連する他の発現指数の形態において、場合により発現レベルの範囲を示す。発現プロファイルデータは、場合によりメッセージおよび/または、予測的モデルとして使用される発現プロファイルと比較するための試料の発現レベルのようなさらなる情報のエントリーを指示する一連のプロンプトを包含する。発現プロファイルデータおよびプロンプトは、コンピューター読み取り可能な媒体のアドレスのある範囲に格納されたデータフィールドの形態であってよい。この媒体は発現データおよび結果データオブジェクトを含むものと同じかまたは異なっていてよい。
本発明はまた、発現プロファイルデータを含むコンピューター読み取り可能な媒体を提供し、これは場合により更に「プロファイルデータ」オブジェクトを含む。プロファイルデータオブジェクトは、発現プロファイルデータを含むのみならず被験試料から発現データを受け取る情報の中央ユニットとして機能する。被験試料は立証目的のために結果を特定する発現プロファイルデータの能力を試験するための既知結果を有するFFPE試料であってよい。あるいは、被験試料は、疾患に罹患している、または、対象の結果を予測するため、または、発現プロファイルデータとの比較により種々の治療の薬効に関する情報を得るために治療を模索している患者から得た新鮮な、凍結された、または、最近のFFまたはFFPE組織試料であってよい。
非限定的な例として、本発明は、異型乳管過形成(ADH)、非浸潤性乳管癌(DCIS)および浸潤性乳管癌(IDC)のような乳癌の種々の段階に関連する遺伝子発現プロファイルを特定するための手段を提供する。これらの段階の各々に関連する発現プロファイルデータは、乳癌を有するかそれが疑われる患者の被験試料から得た発現データを受け取ることのできる乳癌プロファイルデータオブジェクトの部分であってよい。被験試料の遺伝子発現レベルおよびプロファイルの比較により、患者が乳癌において上記した段階の何れも有さないか、何れか1つを有するか、組み合わせを有するかが決定できるようになる。被験試料の発現データは、本明細書に記載した(全般的)ポリアデニル化mRNA増幅の使用によるか、または、乳癌の発現プロファイルにその発現がかかわっている遺伝子配列のPCR系増幅の使用により作成してよい。得られる被験試料の発現データは、全般的mRNA増幅の使用により他の発現プロファイルと比較して分析できるようになる。
プロファイルデータオブジェクトは、発現プロファイルデータから分かれたアドレスの範囲内に、または、発現プロファイルデータを示すデータフィールドも格納しているアドレスの範囲内に格納してよい。プロファイルデータオブジェクトが作成されれば、それは1つ以上の被験試料の発現レベルデータを格納するために確保されている位置を有する。発現レベルデータは好ましくは、受け取り用の発現プロファイルデータとの容易な比較のために適合されているオブジェクトの1つ以上のデータフィールド内に受け取られる。これにより遺伝子発現レベルに基づいた結果、およびFFおよび/またはFFPE試料のアーカイブとそれに関連する歴史的結果の相関を予測する能力が与えられる。
プロファイルデータオブジェクトの作成の後、ユーザーまたは他のソースから種々の発現レベルの情報またはデータを受け取ることができる。好ましい実施形態においては、被験試料の発現レベルデータをマイクロアレイリーダーから電子的に直接導入する。プロファイルデータオブジェクトの発現プロファイルデータは随時更新してよい。このような更新は必然的に更新されたプロファイルデータオブジェクトをもたらし、これは以前のオブジェクトの何れかを更新し、これに置き換えてよい。発現プロファイルデータは本発明により提供される未選択のポリアデニル化mRNAレベルを反映している発現レベルデータから発生しているため、発現プロファイルデータは、より完全であり包括的である。即ち本発明は発現レベルが結果に関連している複数の遺伝子配列を与えることができる。本発明はまた、発現プロファイルの一部を同定し、さらなる結果に相関付けることができる。
本発明の別の実施形態において、発現プロファイルデータは、プロファイルデータの検討のため、また場合により被験試料の発現データを用いた比較と分析のために表計算プログラムに適合させてよい。プログラムは好ましくは、発現データに関連する結果を調べるためのプロファイルデータとの比較において、発現データを分析することができるように適合させる。他の分析モジュール(ソフトウエア)を用いるか、または開発することにより、被験試料に結果を関連付けるために適合されたプロファイルデータを利用してよい。
従って本発明は、媒体上に格納された複数のデータフィールドを有し、発現データまたは発現プロファイルデータのようなデータ構造を示すコンピューター読み取り可能な媒体を提供し、これは入力された(結果データまたは被験試料発現データの)情報に相関付けられるかこれを用いて分析されるべき(発現または発現プロファイルの)データを提示する第1のデータフィールドを含み、ただしこの第1のデータフィールドはこのコンピューター読み取り可能な媒体内のアドレスのある範囲に格納されたもの;この入力情報を受け取る1つ以上のレシーバーオブジェクト、ただし各レシーバーオブジェクトはこのコンピューター読み取り可能な媒体中のアドレスのある範囲に格納されたものを包含し、ここで各レシーバーオブジェクトはこの第1のデータフィールドを用いた相関付けまたは分析のための入力情報を格納するために適合されたデータフィールドを含む。
別の実施形態においては、第1のデータフィールドは、レシーバーオブジェクトの1つにより使用されるアドレスのある範囲に格納される。更にまた、コンピューター読み取り可能な媒体は場合により情報の入力を誘導するための1つ以上のデータプロンプトを格納するために適合されたプロンプトフィールドを含み、これはFFPE試料の入手元であるヒト患者から得られ、この発現データの作成のために使用される結果の情報であってよい。
本発明の好ましい実施形態は、コンピュータ読み取り可能な媒体であり、この媒体は、媒体上に格納された複数のデータフィールドを含み、データ構造を示し、一連のアドレスに格納された発現プロファイルデータを示す少なくとも1つのデータフィールドを含む遺伝子発現プロファイルと、この発現プロファイルとの相関付けに関し、遺伝子発現データを受け取るプロファイルデータレシーバーオブジェクトを備える。このレシーバーオブジェクトは、別個の一連のアドレス内、または、少なくとも1つのデータフィールドをやはり格納するアドレス内のいずれかに格納される。この媒体は、場合により入力情報のエントリーを促す1つ以上のデータプロンプトを格納するために適合されたプロンプトフィールドを含み、これはヒト患者由来の組織試料の細胞から得た発現データであってよい。
本発明はまた、コンピューター読み取り可能な媒体中に含めるための発現データの作成に関するシステムおよび方法を提供し、この媒体は発現データとの相関付けのための結果情報を受け取るためのレシーバーオブジェクトを場合により含む。本発明は更に1つ以上の遺伝子配列がこの結果に関連するか連結しているように、この結果情報とこの発現データを相関付けるためのシステムおよび方法を提供する。更にまた、本発明はコンピューター読み取り可能な媒体中に含めるための、結果を相関付けられる遺伝子発現プロファイルの作成に関するシステムおよび方法を提供する。この媒体は、場合によりこの遺伝子発現プロファイルを用いた比較および分析のために被験試料の発現データを受け取るレシーバーオブジェクトを含む。この比較および分析に関するシステムおよび方法も提供される。好ましくは、本発明のシステムおよび方法は、コンピューター処理可能であり、場合によりコンピューター読み取り可能な媒体上のコンピューター実行指示書として格納される。
さらに以下に記載する通り、本発明は、レシーバーオブジェクトにより受け取られる情報と共に使用するべきデータを含むデータ構造またはデータセットを提供する。本発明の実施形態は、このデータ構造およびデータセット、ならびにこのオブジェクトをつくるための手段を包含する。好ましくは、データ構造およびデータセットは直接、または、FFおよび/またはFFPE試料由来のポリアデニル化mRNA中にあるとおり遺伝子発現の分析を介して間接的に構築される。遺伝子発現データの構築は、本発明の最初の活動ブロックである。活動は入力情報のためのプロンプトの構築ならびにこの情報を受け取るためのレシーバーオブジェクトの創生を包含してよい。本発明の鍵となる特徴は、中央レポジトリとしてのレシーバーオブジェクトと組み合わせたポリアデニル化mRNAレベルを示す発現データの使用である。
入力情報を受け取った後、次の活動ブロックは発現データ中に存在するものとしての1つ以上の遺伝子配列の発現レベルにこの情報を相関付けることである。相関付けの結果は、次の活動ブロックにおけるさらなるデータ構造またはデータセットのためのデータとして使用される。データ構造またはセットは、1つ以上のさらなるレシーバーオブジェクトにより受け取られる情報と共に使用すべき遺伝子発現プロファイルデータを含む。このデータ構造またはセットを構築するための手段もまた、本発明の実施形態に包含され、本発明の別の活動として実施される。この活動は、入力情報のためのプロンプトの構築ならびにこのような情報を受け取るためのこのレシーバーオブジェクトの構築を包含する。本発明の重要な特徴は、試料の入手元である対象の結果を予測するために被験試料から得た発現プロファイルデータおよび入力発現データを使用する能力である。予測は、試料採取後の対象の結果に相関付けられたFFおよび/またはFFPE試料から得た発現データ(ポリアデニル化mRNAレベル)に基づく。
ユーザに対して表示されるプロンプトまたはプロンプトの配列は、要求された情報のエントリーを指向するために適切な如何なるものであってもよい。結果情報に関する非限定的な例は、疾患または状態、並びにそのサブタイプまたはその段階であってよい状態;使用する治療プロトコル;治療の結果;経時的な疾患の進行;試料採取後の生存期間(妥当な死因に基づく);およびその後の疾患(例えば原発癌に続く転移癌)を包含する。被験試料発現データ情報に関連する非限定的な例には、発現データ(生、処理済みまたは正規化済み)のためのプロンプト;使用するマイクロアレイおよびプローブ配列;疑われる疾患または状態;および試料の型および/または齢が包含される。1つの実施形態においては、プロンプトはユーザーに表示されるテキストフィールドである。一般的に、プロンプトにより要求される情報は、実際には本明細書に記載する発現プロファイリングのタスクの妥当性によってのみ制限される。即ち、種々の情報がプロンプトにより要求され得る。
本明細書に記載するとおり、レシーバーオブジェクトにより、発現データまたは発現プロファイルデータに関係する相関付けおよび分析のために受け取られる情報はオブジェクトの部分として格納できるようになる。即ちレシーバーオブジェクトは、受け取られた何れかの適切な情報を格納するために必要とされるデータフィールドを含む。あるいは、レシーバーオブジェクトは本明細書に記載する相関付け、分析および/または他の比較機能を実施するために適合された分析オブジェクトの部分であってよい。あるいは、分析モジュールを使用する場合は、レシーバーオブジェクトは、このような分析モジュールが該当する情報を抽出し、ユーザによる分析のためにこのような情報を分析または表示することができるようにする情報を含んでよい。分析は、好ましくは発現データまたは発現分析データに対し、受け取られた情報を分析または比較するために適合された分析モジュールの何れかの型により実施される。
1つの実施形態において分析モジュールは、受け取られた情報のこのデータを用いた相関付け、分析および/または他の比較を可能にする適合された表計算プログラムである。非限定的な例として、データはデータと共に使用するために要求された特定の情報項目を特定する複数のプロンプトを含んでよい。各プロンプトは、表計算プログラムにおける行を示し、ユーザーから受け取る各情報項目は表計算の列内においてよい。行は特定の結果、例えば特定の薬剤投与に対する疾患の感受性を示し、いっぽうで列は使用すべき発現データを作成するために使用された各FFPE試料に対するこの結果情報を示す。この場合の分析モジュールは、本明細書に記載するモデルを構築するための1つ以上の遺伝子配列発現レベルと結果情報を相関付けるように適合させる。
レシーバーオブジェクトにより受け取られる情報は、オブジェクトに伝達されなければならないため、本発明の一部の実施形態は電子的手段による情報の伝達手段を含む。これは場合により、伝達すべき情報を含む電子装置(例えば、限定はされないが、結果情報を含むデータベースまたはマイクロアレイリーダー/アナライザー/イメージプロセッサ)に直接連結した伝達プロセッサにより実施してよい。
本発明の別の実施形態において、FFまたはFFPE発現情報処理システムが提供される。システムは好ましくは、導入したコンピューターであり、本明細書に記載したデータフィールドおよびデータ構造および場合によりオブジェクトを含む。システムは好ましくは、マイクロアレイハイブリダイゼーションから得られた発現データを処理し、これを本明細書に記載したコンピューター読み取り可能な媒体に格納する方法および手順のための説明書も含む。
本発明の別の実施形態は、マイクロアレイハイブリダイゼーションから得られるもののような発現データを格納するコンピューターに関する指示を含む、コンピューター読み取り可能な媒体である。指示は好ましくは、少なくとも1つのマイクロアレイからの発現シグナル強度から発現データを作成すること、および、データを含むデータセットまたはストラクチャーの少なくとも1つを格納することを包含する。指示は場合により、指示も同様に格納すること;生または処理済または正規化済みのデータを格納すること;または要約方法を用いた発現データの要約を含む。
本発明はまた、1つ以上のマイクロアレイのハイブリダイゼーションシグナル強度からこのデータを発生させるための手段および/またはこの発生データを格納するための手段を含む発現データまたは発現プロファイルデータを格納するシステムを提供する。
本発明を実施するための好ましい発現データは、疾患または望ましくない状態に罹患した対象に由来するFFPE試料から誘導され、ここにおいて対象の細胞は異常または改変された遺伝子発現(細菌、マイコバクテリアおよびカビのような感染に対する応答を含む)を有する。非限定的な例は癌、ウイルス感染、自己免疫疾患、関節炎、糖尿病および他の代謝疾患を包含する。
(本明細書において使用する用語の定義)
本明細書においては、「配列」または「遺伝子配列」とは、ヌクレオチド塩基の個別な順列よりなる核酸分子またはポリヌクレオチドである。この用語はRNAまたはタンパク質様の性質を有する個々の生成物をコードする塩基の順列(すなわち「コーディング領域」)、ならびに「コーディング領域」の前後の順列した塩基を包含する。後者の非限定的な例は、遺伝子の5’および3’未翻訳領域を包含する。当然ながら、2つ以上のポリヌクレオチドが別個の生成物をコードすることができることが認識される。また、開示した配列の対立遺伝子および多形も存在し、本発明の実施においては開示した配列または対立遺伝子または多形の発現レベルを特定するために使用してよい。対立遺伝子および多形の特定は部分的には、染色体の位置、および有糸分裂間の組み換え能力に依存している。
「相関付ける」または「相関」またはこれらと同等のものは、本明細書に記載した方法の使用により1つ以上の他の状況を除いて、1つ以上の配列の発現と細胞の生理学的状態の間の関連を指す。本発明は、遺伝子配列発現レベルの変化と、FFPE試料の入手元である対象が遭遇する結果および治療との間の相関を備える。増加および低減は、非正常細胞と正常細胞の発現の比の形態で容易に表示でき、1の比は差がないことを示し、2および0.5の比は2倍の量、半分の量の発現が非正常細胞対正常細胞においてそれぞれ存在すること示す。正常および非正常細胞は、好ましくはFFPE試料に由来する。発現レベルは後に記載する定量的方法により容易に測定できる。
「ポリヌクレオチド」は何れかの長さのヌクレオチド、即ちホスホジエステル結合により連結したリボヌクレオチドまたはデオキシリボヌクレオチドの重合体形態であり、本明細書に開示した一定の配列の鎖ならびに一定の配列の相補鎖を包む。この用語は分子の一次構造のみを指す。即ち、この用語は2本鎖および1本鎖のDNAおよびRNA並びに非ホスホジエステル骨格を含むその類縁体を包含する。また、当該分野で既知の標識、メチル化、「キャップ」、類縁体による1個以上の天然ヌクレオチドの置換、および未荷電連結(例えばホスホロチオエート、ホスホロジチオエート等)のようなヌクレオチド間の修飾、ならびにポリヌクレオチドの未修飾形態を含む、既知の修飾型を包含する。
「増幅する」という用語は、広範な意味において、DNAまたはRNAポリメラーゼにより酵素的に生成され得る増幅産物を生成することを意味する。「増幅」とは本明細書においては一般的に、所望の配列、特に試料の配列のマルチコピーを生成する過程を指す。「増幅」はまた、細胞ゲノム内のコーディング配列のコピーが増加するようなDNA増幅の意味において使用してよい。「マルチコピー」とは少なくとも2コピーを指す。「コピー」とは必ずしも鋳型配列との完全な配列相補性または同一性を意味しない。mRNAの増幅方法は一般に当該分野で知られており、逆転写PCR(RT−PCR)および本明細書に記載するものを包含する。
相当することは、核酸分子が別の核酸分子とかなりの量の配列同一性を共有していることを意味する。かなりの量とは、少なくとも95%、通常は少なくとも98%、そしてより通常は少なくとも99%であり、配列同一性はAltschulら, (1990), J.Mol.Biol.215:403−410に記載のBLASTアルゴリズム(公開されたデフォルトセッティング、即ちパラメーターw=4、t=17を用いる)を用いて測定される。あるいは、RNAは当該分野で既知の方法により相当するcDNAとして直接標識してよい。
「マイクロアレイ」とは、好ましくは各々が例えば、限定はされないが、ガラスプラスチックまたは合成メンブレンのような固体支持体の表面上に形成された定義された領域を有する各領域の、1次または2次元のアレイである。マイクロアレイ上の個別の領域の密度は、単一の固相支持体の表面上で検出されるべき固定化ポリヌクレオチドの総数により決定され、好ましくは少なくとも約50/cm、より好ましくは少なくとも約100/cm、更に好ましくは少なくとも約500/cm、または少なくとも約1000/cmである。一部の実施態様においては、アレイは総数で約500、約1000、約1500、約2000、約2500または約3000の固定化されたポリヌクレオチドを含む。本明細書において、DNAマイクロアレイは、試料から得られた増幅され、またはクローニングされたポリヌクレオチドにハイブリダイズするのに使用されるチップまたは他の表面上に置かれたオリゴヌクレオチドまたはポリヌクレオチドのアレイである。アレイ中でのプローブの各特定の基の位置が分かっているので、試料ポリヌクレオチドの同一性はマイクロアレイ中の特定の位置へのその結合に基づいて決定できる。
本発明は、過剰または過少発現される配列の発見に基づいているので、本発明の1つの実施形態は、開示された配列のポリヌクレオチドに対する試料のmRNAまたはその増幅またはクローニングされたかたちのもののハイブリダイゼーションによる発現の測定を包含する。この型の好ましいポリヌクレオチドは、他のヒト配列には存在しない配列の連続する塩基、少なくとも約20個、少なくとも約22個、少なくとも約24個、少なくとも約26個、少なくとも約28個、少なくとも約30個、少なくとも約32個、少なくとも約34個、少なくとも約36個、少なくとも約38個、少なくとも約40個、少なくとも約42個、少なくとも約44個または少なくとも約46個を含む。上記した文において使用した「約」という用語は、記載した数値から1の増減を指す。より長いポリヌクレオチドは、当然ながら試料の核酸へのハイブリダイゼーションに影響しない僅かなミスマッチ(例えば突然変異の存在による)を含んでよい。このようなポリヌクレオチドは、その検出が容易になるように標識されてよく;あるいは、このようなポリヌクレオチドがハイブリダイズする核酸を標識してもよい。このようなポリヌクレオチドはまた、例えば固体支持体への結合によるなどして固定化してもよい。
更により好ましいものは、ヒトゲノム中の他の配列内には存在しない配列の連続塩基で少なくとも約50個、少なくとも約100個、少なくとも約150個、少なくとも約200個、少なくとも約250個、少なくとも約300個、少なくとも約350個、少なくとも約400個、少なくとも約450個または少なくとも約500個のポリヌクレオチドである。本明細書においては「約」という用語は、記載した数値より10%の増減を指す。好ましくは配列は、発現されたmRNAのポリAテールのすぐ上流の3’部分中に存在する。ポリヌクレオチドは当然ながら試料の核酸へのハイブリダイゼーションに影響しない僅かなミスマッチを含んでよい。
本発明の別の実施形態において、開示した配列の全てまたは部分はポリメラーゼ連鎖反応(PCR)およびその変法、例えば、限定はされないが、定量的PCR(QPCR)、逆転写PCR(RT−PCR)、およびリアルタイムPCR、場合によりリアルタイムのRT−PCRのような方法により増幅し検出してよい。このような方法は、開示した配列部分に相補的な1個または2個のプライマーを利用しており、ここでプライマーは核酸合成をプライミングするために使用する。新しく合成された核酸は、場合により標識し、直接、または本発明のポリヌクレオチドへのハイブリダイゼーションにより検出してよい。新しく合成された核酸は、そのハイブリダイゼーションを可能にする条件下で本発明のポリヌクレオチド(含有配列)と接触させてよい。
「標識」という用語は、標識された分子の存在を示す検出可能なシグナルを発生させることができる組成物を指す。適当な標識は、放射性同位体、ヌクレオチド発色団、酵素、基質、蛍光分子、化学発光部分、磁気粒子、生物発光部分等を包含する。それ自身、標識は分光光度的、光化学的、生化学的、免疫化学的、電気的、光学的または化学的な手段により検出可能な組成物である。
「発現」および「遺伝子発現」は、本発明の配列のような核酸物質の転写、並びに、転写された配列が翻訳される可能性を示す。(遺伝子)発現の「レベル」は発現の量を示し、これは発現の対照または正常レベルと比較して増減があってよい。増減はmRNA生成の相対的レベルにより容易に測定してよいが、減少はまた減少した発現を示すことがわかった配列のプロモーターの状態(メチル化または他の型の不活性化)により測定してもよい。
本明細書においては、「含む」という用語およびその同属語は、その包括的な意味において使用し;即ち、「包含する」という用語およびその相当する同属語と等しい。
ハイブリダイゼーション、鎖伸長等の、ある事象が起こることを「可能にする」条件、または、ある事象が起こるために「適当な」条件、または、「適当な」条件は、そのような事象が起こることを妨げない条件である。即ちこれらの条件は、事象を増強し、促進することを可能とし、および/または事象を誘導する。当該分野で知られており、本明細書にも記載しているこのような条件は、例えば、ヌクレオチドの配列の性質、温度、および、緩衝条件に依存している。これらの条件はまた、ハイブリダイゼーション、切断、鎖伸長または転写などのような、どのような事象が望まれるかによる。
本明細書において配列の「突然変異」は、比較対照配列との比較において、目的となる本明細書に開示した遺伝子の配列における任意の配列の改変を示す。配列突然変異は、置換、欠失または挿入のようなメカニズムによる、配列内の単一ヌクレオチド変化または1ヌクレオチドより多い改変を包含する。単一ヌクレオチド多形(SNP)もまた、本明細書においては配列突然変異である。本発明は、配列発現の増減に基づいているため、遺伝子のコーディング領域および非コーディング領域における突然変異は、本発明の実施において評価してもよい。
「検出」または「検出する」とは、遺伝子発現およびその変化の直接的および間接的な検出を含む何れかの検出手段を含む。例えば「検出可能に少ない」発現は直接的または間接的に観測されてよく、この用語は何れかの減少(検出可能なシグナルの非存在を含む)を示す。同様に、「検出可能により多い」生成物は、直接的または間接的に観測される何れかの増加を意味する。
オリゴまたはポリdT配列またはプライマーは、ポリヌクレオチド中の少なくとも約8連続dT塩基の存在を指す。好ましくは約8〜約20、約21または約30連続dT塩基である。約30連続dT塩基を超えるものも使用してよい。
ランダムプライマーは、核酸鎖の合成に関するプライマーとしてのランダム配列の少なくとも約6連続塩基の使用を示す。好ましくは、プライマーは6、7、8、9または10連続塩基である。当業者に明らかなように、短すぎるプライマーはポリヌクレオチドの重合をプライミングするための鋳型鎖に安定してハイブリダイズすることができない。長すぎるプライマーは相補配列の十分な数量からの合成をプライミングできるほど十分迅速に拡散しない。
「疾患」は、生物の生理学的機能の性能を損なう生体またはその組織または臓器の正常な状態の変化を示す。疾患は、環境因子(例えば、限定はされないが、化学物質または放射線)、感染性物質(例えば、限定はされないが、細菌、ウイルスまたは寄生虫)、生物の先天的欠陥(例えば、限定はされないが、環境因子との組み合わせ、または生物の生存期間中の様々な時期において起こりえる遺伝子的な突然変異)への曝露の結果であってよい。疾患はまた上記したものの組み合わせによるもの、並びに関連疾患のセットを記述するものであってよい。後者の非限定的な例は「乳癌」という用語を使用することであり、これは乳房組織における癌性疾患のグループならびに乳癌のサブタイプのグループを示す。
特段の記載が無い限り、本明細書において使用する全ての技術的および科学的用語は、本発明が属する当該分野の技術者により一般的に理解されているものと同様の意味を有する。本発明の実施においては、特段の記載が無い限り、当業者のよく知る分子生物学(組み換え技術を含む)、微生物学、細胞生物学、生化学および免疫学の従来の手法を用いる。このような手法は「Molecular Cloning: A Laboratory Mannual」, 第二版(Sambrookら, 1989); 「Oligonucleotide Synthesis」(M.J.Gait,編, 1984);「Animal Cell Culture」(R.I.Freshney,編,1987);「Methods in Enzymology」(Academic Press, Inc.);「Current Protocols in Molecular Biology」(F.M.Ausubelら,編 1987 and periodic updates); PCR:「The Polymerase Chain Reaction」(Mullisら,編,1994)のような文献に詳細に説明されている。本発明において使用するプライマー、オリゴヌクレオチドおよびポリヌクレオチドは、当該分野で知られている標準的手法を用いて得ることができる。
本発明を以上のように詳述したが、これは例示のみを目的とし、特段の記載が無い限り、本発明を限定する意図のない以下の実施例を参照することにより更に容易に理解できる。
(実施例1)
選択された材料および方法
RNA抽出前のプロテイナーゼK消化:
冷凍処理したスライド上に搭載された厚み5〜10μmのホルマリン固定パラフィン包埋(FFPE)組織切片を脱パラフィン処理し、H&E染色および水和を行った。PixCellIIシステム(Arcturus,Mountain View, CA)を用いて得た約3000〜5000個の全切片またはレーザーキャプチャー細胞から調製した組織溶解物を、42℃で少なくとも16時間10mMトリスpH8.0、RNA等級プロテイナーゼK(100または500μg/ml、Invitrogen,Carlsbad,CA)、2%SDS(Invitrogen,Carlsbad,CA)よりなる溶液で処理した。
逆転写:
定量的RT−PCR分析単独用、または、RNA増幅用のcDNAを生成するために、試料から得た脱修飾RNAをオリゴdTまたはランダムプライマーのいずれかを用いて、50mMトリス塩酸、37.5mMKCl、1.5mMMgCl、10mMDTT、0.5mMdNTPs(Pharmacia,Piscataway,NJ)、40単位のRNasin(Promega,Madison,WI)、200単位のSuperscriptRTII(Invitrogen,Carlsbad,CA)よりなる反応混合物中で逆転写した。
RNA増幅の簡易な代表例:
各RNA調製物のmRNA成分をRiboAmp(登録商標)RNA増幅キット(Arcturus,Mountain View,CA)の改訂版を用いて線状に増幅した。つまり、各試料のRNAを、T7プロモーター配列を含むオリゴdTプライマー20ナノグラムを用いてプライミングし、逆転写し、次にランダムプライマーを用いて2本鎖cDNAに変換した。次にcDNA鋳型を、T7RNAポリメラーゼを用いたインビトロ転写反応において使用することにより、アンチセンス方向に増幅されたRNA(aRNA)(cDNA合成用の鋳型として使用したmRNAの配列に相補的な配列を有するもの)を生成した。増幅の第2の経路を行うことにより、更にaRNAを生成し、これをその後に鋳型として使用してハイブリダイゼーション用の蛍光標識cDNAプローブを調製した。
プローブ標識およびマイクロアレイハイブリダイゼーション:
各試料から増幅したRNAの一部を、Fair Play Kit(Stratagene,La Jolla,CA)による5−(3−アミノアリル)−2’−デオキシウリジン−5’−トリホスフェート(アミノアリル−dUTP)を用いたcDNA標識反応において、使用した。Cy3またはCy5モノ反応性染料(Amersham,Piscataway,NJ)を精製cDNAに結合させ、QiaQuick PCR精製カラム(Qiagen,Valencia,CA)を用いて更に精製した。蛍光標識cDNAを生成するために、各被験試料から得たaRNAについてはCy5染料を用い、比較対照aRNAについてはCy3染料を使用した(Universal Human Reference RNA,Stratagene,La Jolla,CA)。等量の精製されたCy5標識被験試料cDNAをCy3標識比較対照cDNAとともに湿度60%超42℃で17時間プローブ濃度25ng/μlで40μlハイブリダイゼーション溶液(5xSSC、0.1μg/μlCOT−1 DNA、0.2%SDS、50%ホルムアミド)中22,000特徴までを含むマイクロアレイに同時ハイブリダイズした。
発現データの取得:
ハイブリダイゼーションの後、マイクロアレイスライドを洗浄し、スキャンし、ハイブリダイゼーションシグナル強度について定量した。スポットフィルタリング/バックグラウンド補正および正規化の後、Cy5およびCy3の蛍光強度をCy5/Cy3の正規化した比として表示することにより、普遍的な比較対照RNAに対して相対的に被験試料の遺伝子発現レベルを示した。
(実施例2)
FFPE試料およびその増幅におけるRNAの安定性
5μm組織切片を1、4および8日間ホルマリン固定し、次にパラフィン包埋した。切片を脱パラフィン処理し、段階的濃度のエタノールを用いて再水和し、次に10mMトリス塩酸pH8.0;2%SDS中で4時間42℃で500μg/mlのプロテイナーゼKで処理した。
凍結組織試料を比較のためにプロテイナーゼKで同様に消化した。
図1は、ホルマリン固定組織から得たRNAが、1〜8日間ホルマリン中に固定された組織中で未損傷であったことを示すRNAゲル電気泳動の結果を示す。試料は2連で泳動した。「M」はRNAマーカーレーンを示す。
図2Aは1、4または8日間固定した組織試料並びに新しく凍結した組織のRNA増幅の結果を示す。試料をプロテイナーゼKで消化し、その後、GITC含有溶液を用いて抽出し、シリカカラム上で精製した。RNAを上記したとおり増幅した。レーン1〜7はRNAマーカー、1日FFPE、1日FFPE、4日FFPE,8日FFPEおよび0時/新凍結をそれぞれ示す。
図2Bは4日間固定し、6レーンで分析した組織試料のRNA増幅の結果を示す。第1のレーンはRNAマーカーを含む。
(実施例3)
アーカイブ乳癌FFPE試料からのRNA増幅
約1〜2年経過したアーカイブFFPE乳房コア生検試料を、実施例2において上記したとおり処理した。以下の表1は、試料およびこれより増幅したRNAの収量を総括したものである。結果は図3Aに示すとおりであり、ここでMはRNAマーカーを示す。
Figure 2006501857
図3Bは4検体の6年経過アーカイブFFPE乳房コア生検試料からのRNA増幅の結果を示す。試料は2連で分析した。以下の表2は、試料およびこれより増幅したRNAの収量を総括したものである。「DCIS」は非浸潤性乳管癌を指し;「IDC」は浸潤性乳管癌を示す。
Figure 2006501857
(実施例4)
アーカイブ膀胱癌FFPE試料から得たRNA増幅
約1〜4年経過したアーカイブFFPEヒト膀胱試料を実施例2において上記したとおり処理した。以下の表3は、試料およびこれより増幅したRNAの収量を総括したものである。T1、Ta、HG、LGおよびCISはそれぞれ、一見浸潤性、インサイチュ乳頭様、ハイグレード、ローグレードおよび扁平上皮内癌を示す。
結果は図4に示す通りであり、ここでMはRNAマーカーを示す。レーン1、4および15は次善の増幅の結果を示す。
Figure 2006501857
(実施例5)
FFPE試料における遺伝子発現のコンシステンシー
患者からえたFFPE試料を、2つの独立したレーザーキャプチャーマイクロダイセクション(LCM)に用い、その後、実施例2に記載するとおり個別のmRNA増幅に付した。増幅したRNAを用いて、17296オリゴヌクレオチド遺伝子配列プローブを含むマイクロアレイのハイブリダイゼーションのための標識cDNAを生成した。2つの独立した実験による各プローブに関する(log)ハイブリダイゼーションシグナル強度のスキャッタープロット(scatter−plot)を図5に示す。2連のハイブリダイゼーションの間で2倍を超える変異を示したのは、僅か148遺伝子(全体の0.8%)であった。全体の相関係数は0.96であった。
(実施例6)
FFPEおよび凍結試料における遺伝子発現の比較
同じ患者の生検試料のFFPEおよび凍結試料を切片化し、レーザーキャプチャーマイクロダイセクションを行うことなく実施例2に記載したとおりmRNA増幅のために使用した。増幅したRNAを用いて、マイクロアレイのハイブリダイゼーションのための標識cDNAを生成した。FFPEおよび凍結試料から得られたマイクロアレイの各プローブ配列に関する(log)ハイブリダイゼーションシグナル強度のスキャッタープロットを、図6に示す。全体の相関係数は0.912であった。
1、4または8日間ホルマリン中に固定されていたパラフィン包埋切片から増幅されたRNAの同様の実験では、遺伝子発現パターンの同様の再現性が観察された。これらの試料の間の強度の相関は表4に示すとおりである。
Figure 2006501857
(実施例7)
FFPE試料におけるRNAの脱修飾
パラフィンに包埋する前、4または8日間ホルマリン中に固定しておいたFFPE試料を用いてRNA抽出を行い、その後、様々な時間にわたり70℃で脱修飾した。次に試料をベータアクチンmRNAのポリA部位から上流の約110塩基を増幅するために位置づけられたプライマーを用いて、RT−PCRにより増幅した。増幅の相対収量は図7に示すとおりであり、ここでは3〜8時間の脱修飾時間が良好な収量をもたらした。
試料はまたベータアクチンmRNAのポリA部位から上流約1000塩基を増幅するために位置づけられたプライマーを用いて、RT−PCRにより増幅した。増幅の相対収量は図8に示すとおりであり、ここでは3〜8時間の脱修飾時間が良好な収量をもたらした。
包埋前1日間ホルマリン中に固定したFFPE試料を用いた場合にも同様の結果が得られた。
(実施例8)
RNA増幅手法の比較
24時間ホルマリン中に固定し、その後パラフィン包埋したRNAを用いて、実施例2に記載する通り増幅用の全RNAを調製した。全RNAは第2のcDNA鎖を生成するための外部から供給されたランダムプライマーの使用によりオリゴdT−T7プライマーを用いて2本鎖cDNA(第一ラウンド)に変換するか、またはランダムプライマーを用いることなく第2のcDNAを生成するために「内因性プライミング」を使用した。産物cDNAをインビトロ転写(IVT)のために(第1ラウンド)使用して増幅RNAを生成し、これを用いて第1ラウンドと同様の方法にて第2ラウンドにおけるcDNAを生成した。得られたcDNAは第2ラウンドのIVTのために使用し、ここではビオチンを増幅RNA中に取り込んでマイクロアレイ上のプローブ標的用のaRNAを生成した。
ハイブリダイゼーションの前に、ビオチニル化aRNA10〜20μgを35分間95℃に加熱し、その後冷却した20mMトリス酢酸塩、pH8.1、50mMKOAc、15mMMgOAcよりなる緩衝液中でフラグメント化した。フラグメント化したaRNAをその後精製し、45℃で16時間100mMMES、1M[Na+]、20mMEDTA、0.01%ツイーン−20、0.1mg/mlニシン精子DNA、0.5mg/mlアセチル化BSAよりなる緩衝液中0.05μg/μlの濃度でマイクロアレイにハイブリダイズした。マイクロアレイプローブ位置におけるシグナル強度を示す得られたスキャッターグラフを図9に示す。X軸はランダムプライマーを用いない場合であり、Y軸はランダムプライマーを用いた場合を示す。相関係数は0.9173787であり、両方の方法とも本発明において使用するためのFFPE試料からRNAを増幅できることを示している。
(参考文献)
Figure 2006501857
本明細書において引用した全ての参考文献は、以前に特に組み込まれていたか否かに関わらず、参照によりその全体が本明細書に組み込まれる。本明細書においては「ある(a,an)」および「何れかの(any)」という表現は単数および複数の双方を含む。
本発明を以上の通り詳述したが、本発明は当業者に明らかなように特に実験を行うことなく本発明の精神および範囲を外れることなく広範な同等のパラメーター、濃度および条件の範囲内で実施できる。本発明はその特定の実施形態との関連において記載したが、更に変更ができるものと考えられる。本出願は本発明の原理に一般的に従った、本発明が関わる技術内での既知のまたは慣例的な実施の範囲内に属する、本明細書に記載した本質的特徴に適用してよい本発明の開示からの変更を含む、本発明の如何なる変法、使用または適合も包含するものとする。
1〜8日間ホルマリン中に固定した組織から抽出したRNAを示す。 1、4または8日間ホルマリン中に固定した組織から増幅したRNAを示す。 4日間固定した組織試料のさらなる結果を示す。 約1〜2年間経過したアーカイブFFPE試料からのRNA増幅を示す。 4検体の6年経過アーカイブFFPE乳房コア部の生検試料由来のRNA増幅の結果である。 約1〜4年経過した膀胱癌FFPE試料からのRNA増幅を示す。 FFPE試料から増幅したRNAの2つの独立したハイブリダイゼーションから得られたシグナル強度のスキャッタープロットである。 FFPE対凍結試料のシグナル強度のスキャッタープロットである。 熱による脱修飾後の、種々の時点に関するホルマリン中に固定されたFFPE試料の3’配列のRNA増幅の相対的収率を示す。 熱による脱修飾後の、種々の時点に関するホルマリン中に固定されたFFPE試料のより長い3’配列のRNA増幅の相対的収率を示す。 ランダムプライマーの使用により、またはランダムプライマー非存在下において、調製したcDNAから調製した増幅RNAを使用することで作成されたマイクロアレイデータの比較を示す。

Claims (20)

  1. FFPE試料の細胞から得られたポリアデニル化RNAからのcDNAを合成する方法であって、:
    a)前記RNAを前記細胞から抽出すること;および、
    b)前記抽出されたRNAに相補的な第1のcDNA鎖の合成を結果的にもたらす条件下でオリゴdT配列を含むプライマーと前記抽出されたRNAを接触させること;
    を含む方法。
  2. 前記プライマーと前記RNAを接触させる前に、前記細胞から抽出された前記RNAを約70℃で加熱することを更に含む、請求項1記載の方法。
  3. 前記細胞からのRNAの前記抽出が:
    前記試料から前記細胞を得ること;
    前記細胞をプロテイナーゼKで消化して消化物を生成すること;
    この消化物をグアニジニウム含有化合物と接触させて混合物を生成すること;
    この混合物をシリカマトリックスと接触させてマトリックスへのRNAの結合を可能とすること;および、
    未結合物を除去後、結合RNAを溶出すること、
    を含む、請求項1記載の方法。
  4. 前記加熱を約3〜約8時間行う、請求項2または3記載の方法。
  5. 前記加熱を約3時間行う、請求項4記載の方法。
  6. ランダムプライマーを用いることによる、第2のcDNA鎖の合成を更に含む、請求項1記載の方法。
  7. ランダムプライマー非存在下での、第2のcDNA鎖の合成を更に含む、請求項1記載の方法。
  8. 前記プライマーがプロモーター配列に作動可能に連結している、前記請求項のいずれかに記載の方法。
  9. 前記ランダムプライマーが六量体、七量体、八量体または九量体である、請求項6記載の方法。
  10. 前記細胞からのRNAの前記抽出が:
    前記試料から前記細胞を得ること;
    前記細胞をプロテイナーゼKで消化して消化物を生成すること;
    この消化物をグアニジニウム含有化合物と接触させて混合物を生成すること;
    この混合物をシリカマトリックスと接触させてマトリックスへのRNAの結合を可能とすること;および、
    未結合物の除去後、結合RNAを溶出すること、
    を含む請求項2記載の方法。
  11. 前記加熱を約3〜約8時間行う、請求項10記載の方法。
  12. 前記加熱を約3時間行う、請求項11記載の方法。
  13. 患者を診断する方法であって:
    前記患者の1つ以上の細胞から遺伝子発現データを得ること、
    1つ以上のFFPE試料から得られた遺伝子発現データにより作成された遺伝子発現プロファイルと前記データを比較すること、および、
    前記遺伝子発現プロファイルにより定義された疾患を有するものとして、前記患者を診断すること、
    を含む上記方法。
  14. 前記遺伝子発現プロファイルが前記FFPE試料から得られたポリアデニル化mRNAの増幅により作成される、請求項13記載の方法。
  15. データ構造として提示される遺伝子発現プロファイルを含むコンピューター読み取り可能な媒体であって、前記媒体は媒体上に格納された複数のデータフィールドを有し、:
    分析すべき遺伝子発現プロファイルデータを提示する第1のデータフィールド、ただし前記第1のデータフィールドは前記コンピューター読み取り可能な媒体中のアドレスの範囲内に格納されているもの;
    前記遺伝子発現プロファイルデータを用いた分析に関し、被験試料発現データを受け取る1つ以上のレシーバーオブジェクト、ただし各々のレシーバーオブジェクトは前記コンピューター読み取り可能な媒体中のアドレスの別個の範囲内に格納されているもの;
    を含み、
    ここで各レシーバーオブジェクトは前記第1のデータフィールドを用いた相関付けまたは分析のための入力情報を格納するために適合されたデータフィールドを含む、媒体。
  16. 前記第1のデータフィールドが1つ以上の前記レシーバーオブジェクトにより使用されるアドレスの範囲内に格納される、請求項15記載の媒体。
  17. 被験試料発現データのエントリーを誘導する1つ以上のデータプロンプトを格納するために適合されたプロンプトフィールドを更に含む、請求項15記載の媒体。
  18. 前記被験試料発現データをヒト患者から得られた試料を含む組織の細胞から得る、請求項15記載の媒体。
  19. 前記遺伝子発現プロファイルデータが1つ以上のFFPE試料から得られたポリアデニル化mRNAの増幅により誘導される、請求項15記載の媒体。
  20. 前記試料の採取元となった対象が経験した疾患または治療結果にFFPE試料から得られた遺伝子発現データを相関付けるためのシステムであって:
    前記FFPE試料から得られたポリアデニル化mRNAの増幅により前記遺伝子発現データを作成するための手段;
    前記対象が経験した疾患または治療結果に相関する1つ以上の遺伝子発現レベルを特定するための手段;
    を含むシステム。
JP2004543735A 2002-10-11 2003-10-10 Ffpe試料から得られた遺伝子発現プロファイル Pending JP2006501857A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US41810302P 2002-10-11 2002-10-11
US10/329,282 US7364846B2 (en) 2002-10-11 2002-12-23 Gene expression profiling from FFPE samples
PCT/US2003/032345 WO2004033660A2 (en) 2002-10-11 2003-10-10 Gene expression profiling from ffpe samples

Publications (1)

Publication Number Publication Date
JP2006501857A true JP2006501857A (ja) 2006-01-19

Family

ID=32072932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004543735A Pending JP2006501857A (ja) 2002-10-11 2003-10-10 Ffpe試料から得られた遺伝子発現プロファイル

Country Status (9)

Country Link
US (10) US7364846B2 (ja)
EP (3) EP1549769B1 (ja)
JP (1) JP2006501857A (ja)
AT (1) ATE527377T1 (ja)
AU (1) AU2003282608A1 (ja)
CA (1) CA2500603A1 (ja)
MX (1) MXPA05003818A (ja)
NZ (1) NZ539124A (ja)
WO (1) WO2004033660A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011132726A1 (ja) * 2010-04-22 2011-10-27 東レ株式会社 aRNAの調製方法および遺伝子発現の解析方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7364846B2 (en) * 2002-10-11 2008-04-29 Molecular Devices Corporation Gene expression profiling from FFPE samples
MY138544A (en) * 2003-06-26 2009-06-30 Neuramatix Sdn Bhd Neural networks with learning and expression capability
EP1654361B2 (en) 2003-07-25 2023-01-18 Life Technologies Corporation Methods and compositions for preparing rna from a fixed sample
EP1899484B1 (en) 2005-06-03 2015-08-12 bioTheranostics, Inc. Identification of tumors and tissues
US7451122B2 (en) * 2006-03-29 2008-11-11 Honeywell International Inc. Empirical design of experiments using neural network models
JP2008043332A (ja) * 2006-08-17 2008-02-28 Panomics Inc 組織スライドからの核酸定量
TWI425977B (zh) 2010-11-24 2014-02-11 Ind Tech Res Inst 將福馬林固定石蠟包埋之組織進行脫蠟的方法與其套組
EP2468862A1 (en) 2010-12-23 2012-06-27 Qiagen GmbH Method and kit for processing wax-embedded biological samples
WO2013010074A1 (en) 2011-07-13 2013-01-17 Primeradx, Inc. Multimodal methods for simultaneous detection and quantification of multiple nucleic acids in a sample
US8852919B2 (en) 2011-11-17 2014-10-07 Rheonix, Inc. Microfluidic apparatus, method, and applications
CN105051514B (zh) * 2013-01-24 2017-09-01 霍夫曼-拉罗奇有限公司 对从染色的FFPET切片显微切割的材料的RT‑qPCR分析
US20140349856A1 (en) 2013-03-15 2014-11-27 Biotheranostics, Inc. Neuroendocrine Tumors
US20170045421A1 (en) 2015-08-10 2017-02-16 Life Technologies Corporation Devices and methods for laser capture microdissection
CN111528219B (zh) * 2020-05-13 2022-03-15 上海市计量测试技术研究院 一种用于t淋巴细胞亚群计数标准物质的冻干保护剂及其应用

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4675297A (en) * 1981-02-23 1987-06-23 The Regents Of The University Of California Genes encoding bovine prolactin
US5545522A (en) 1989-09-22 1996-08-13 Van Gelder; Russell N. Process for amplifying a target polynucleotide sequence using a single primer-promoter complex
US5155018A (en) * 1991-07-10 1992-10-13 Hahnemann University Process and kit for isolating and purifying RNA from biological sources
DE4321904B4 (de) * 1993-07-01 2013-05-16 Qiagen Gmbh Verfahren zur chromatographischen Reinigung und Trennung von Nucleinsäuregemischen
CA2153215A1 (en) * 1994-07-06 1996-01-07 Lu Wang Treatment of paraffin embedded tissue for gene analysis
US5698410A (en) * 1995-06-07 1997-12-16 Mount Sinai School Of Medicine Of The City University Of New York Highly sensitive immunocytochemical method for diagnosis of malignant effusions
US5981235A (en) * 1996-07-29 1999-11-09 Promega Corporation Methods for isolating nucleic acids using alkaline protease
WO1998047920A1 (fr) * 1997-04-18 1998-10-29 Chugai Research Institute For Molecular Medicine, Inc. Regulateur de transcription
US6183995B1 (en) * 1997-09-05 2001-02-06 Lifespan Biosciences, Inc. Methods of measuring gene expression using wax-embedded tissue specimens
US5932451A (en) * 1997-11-19 1999-08-03 Incyte Pharmaceuticals, Inc. Method for unbiased mRNA amplification
ATE260989T1 (de) * 1997-12-19 2004-03-15 Affymetrix Inc Erkenntnisse der genomforschung für die suche nach neuartigen wirkstoffen
US6136537A (en) * 1998-02-23 2000-10-24 Macevicz; Stephen C. Gene expression analysis
US6218122B1 (en) * 1998-06-19 2001-04-17 Rosetta Inpharmatics, Inc. Methods of monitoring disease states and therapies using gene expression profiles
DE19856064C2 (de) * 1998-12-04 2000-11-30 Invitek Gmbh Universelles Verfahren zur Isolierung von DNA aus beliebigen Ausgangsmaterialien
US6429027B1 (en) * 1998-12-28 2002-08-06 Illumina, Inc. Composite arrays utilizing microspheres
US6248535B1 (en) * 1999-12-20 2001-06-19 University Of Southern California Method for isolation of RNA from formalin-fixed paraffin-embedded tissue specimens
JP2003529774A (ja) * 2000-03-31 2003-10-07 ジェネンテック・インコーポレーテッド 遺伝子発現を検出し定量するための構成物及び方法
MXPA02011092A (es) * 2000-05-10 2004-08-19 David A Sirbasku Composiciones y metodos para demostrar la regulacion del sistema inmune secretor del crecimiento de la celula de cancer que responde a la hormona esteroidea.
WO2002002804A1 (en) * 2000-06-30 2002-01-10 Aros Applied Biotechnology Aps Gene expression in biological conditions
US6713257B2 (en) * 2000-08-25 2004-03-30 Rosetta Inpharmatics Llc Gene discovery using microarrays
US6794141B2 (en) 2000-12-22 2004-09-21 Arcturus Bioscience, Inc. Nucleic acid amplification
JP2002262882A (ja) * 2001-03-12 2002-09-17 Nisshinbo Ind Inc Rnaの増幅法
WO2002074979A2 (en) * 2001-03-20 2002-09-26 Ortho-Clinical Diagnostics, Inc. Expression profiles and methods of use
IL160000A0 (en) * 2001-07-24 2004-06-20 Univ Yale Methods, compositions and kits relating to chitinases and chitinase-like molecules and imflammatory disease
US9201067B2 (en) 2003-03-05 2015-12-01 Posco Size-controlled macromolecule
EP2799555B1 (en) * 2002-03-13 2017-02-22 Genomic Health, Inc. Gene expression profiling in biopsied tumor tissues
US7364846B2 (en) * 2002-10-11 2008-04-29 Molecular Devices Corporation Gene expression profiling from FFPE samples

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011132726A1 (ja) * 2010-04-22 2011-10-27 東レ株式会社 aRNAの調製方法および遺伝子発現の解析方法
JP4840542B1 (ja) * 2010-04-22 2011-12-21 東レ株式会社 aRNAの調製方法および遺伝子発現の解析方法

Also Published As

Publication number Publication date
US20200362393A1 (en) 2020-11-19
EP2330217A1 (en) 2011-06-08
US20150152478A1 (en) 2015-06-04
US20120316084A1 (en) 2012-12-13
US20150225776A1 (en) 2015-08-13
US7723039B2 (en) 2010-05-25
US8895269B2 (en) 2014-11-25
MXPA05003818A (es) 2005-10-05
US20040072305A1 (en) 2004-04-15
EP1549769A4 (en) 2007-04-25
US8435739B2 (en) 2013-05-07
EP2484777A1 (en) 2012-08-08
US20100197511A1 (en) 2010-08-05
US8012688B2 (en) 2011-09-06
ATE527377T1 (de) 2011-10-15
EP1549769A2 (en) 2005-07-06
WO2004033660A3 (en) 2004-08-26
US20110034346A1 (en) 2011-02-10
US7879555B2 (en) 2011-02-01
US20090082215A1 (en) 2009-03-26
EP1549769B1 (en) 2011-10-05
WO2004033660A2 (en) 2004-04-22
NZ539124A (en) 2008-12-24
CA2500603A1 (en) 2004-04-22
US7364846B2 (en) 2008-04-29
AU2003282608A1 (en) 2004-05-04
US20120245046A1 (en) 2012-09-27
US20180094297A1 (en) 2018-04-05

Similar Documents

Publication Publication Date Title
US20200362393A1 (en) Gene expression profiling from ffpe samples
Singh et al. Mechanisms and measurement of changes in gene expression
Wilson et al. Amplification protocols introduce systematic but reproducible errors into gene expression studies
EP1899484B1 (en) Identification of tumors and tissues
US10538816B2 (en) Identification of tumors
US20180068058A1 (en) Methods and compositions for sample identification
US7108969B1 (en) Methods for detecting and diagnosing oral cancer
WO2013002750A2 (en) Determining tumor origin
CN100374576C (zh) 来自ffpe样品的基因表达分布图
US7052835B2 (en) Method of screening a gene
Ready RNA-SEQ Analysis of Localized MST1/STK4 Expression in Prostate Cancer
Nelson et al. The Single Prostate Cell Transcriptome as Biological Assay