JP2002508845A - 転移性腫瘍および非転移性腫瘍を識別する方法 - Google Patents

転移性腫瘍および非転移性腫瘍を識別する方法

Info

Publication number
JP2002508845A
JP2002508845A JP50581199A JP50581199A JP2002508845A JP 2002508845 A JP2002508845 A JP 2002508845A JP 50581199 A JP50581199 A JP 50581199A JP 50581199 A JP50581199 A JP 50581199A JP 2002508845 A JP2002508845 A JP 2002508845A
Authority
JP
Japan
Prior art keywords
tissue
dna
score
cancer
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP50581199A
Other languages
English (en)
Inventor
シー. マリンズ,ドナルド
Original Assignee
パシフィック ノースウェスト リサーチ インスティテュート
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パシフィック ノースウェスト リサーチ インスティテュート filed Critical パシフィック ノースウェスト リサーチ インスティテュート
Publication of JP2002508845A publication Critical patent/JP2002508845A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • G01J3/45Interferometric spectrometry
    • G01J3/453Interferometric spectrometry by correlation of the amplitudes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N2021/3595Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using FTIR
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light

Abstract

(57)【要約】 腫瘍または転移状態への腫瘍の進行についてスクリーニングする方法を開示する。このスクリーニング法は、DNAサンプルのフーリエ変換−赤外分光によって得られたスペクトルデータの主成分分析によるDNAの特徴付けに基づく。この方法は、広範なDNAサンプルおよびガンタイプに適用可能である。多変量正規分布方程式および弁別分析を使用して開発されたモデルは、原発性ガン性組織を転移性ガン性組織と区別するために特に良好に適切である。

Description

【発明の詳細な説明】 転移性腫瘍および非転移性腫瘍を識別する方法 技術分野 本発明は、一般に、腫瘍の検出および特徴付けを含む、腫瘍の同定に関する。 本発明は、より詳細には、腫瘍、または転移状態への腫瘍の進行についてスクリ ーニングするために、DNAサンプルのフーリエ変換−赤外分光によって得られ るスペクトルデータの主成分分析に基づいて、DNAを特徴づけることに関する 。 発明の背景 最近の25年以上にわたる財政上および人的資源の両方についての莫大な出費に もかかわらず、新たな腫瘍もしくは腫瘍の再発の検出は、人類の実現されていな い目標のままである。特に、初期段階で検出された場合、多くのガンは処置可能 であるが、信頼できるスクリーニング手順の欠如のために多くの患者において検 出されされないで進行するという事実がいらだたしい。さらに、非転移性原発性 腫瘍(または非ガン性疾患状態)を転移性腫瘍と区別するか、または転移性状態へ の進行を予測する信頼できるスクリーニング手順に対する必要性は、深刻である 。腫瘍の転移は、ガン患者における処置不成功の主な原因である。それは、原発 性新生物からの細胞の脱離、循環中への侵入、そして局所の離れた組織部位での 最終的な定着を含む複雑なプロセスである。 しばしば、医師は、どうしても、用心のあまり間違い、そして、転移性状態へ 進行する傾向を有する腫瘍として疾患状態を同定することなく、患者のクオリテ ィー・オブ・ライフに劇的な影響を与える外科的手順または他の手順を患者が受 けることを求める。例示の目的のために、2つの特定のガン(前立腺ガンおよび 乳ガン)が、より詳細に記載され、そして新たなアプローチ(これは、本明細書中 で開示される発明が提供する)を必要とするガンの代表である。 前立腺ガンは、男性における主な死亡原因である。したがって、この疾患の病 因ならびに発ガンの初期にその発生を予測するための技術の開発に熱心な関心が 、 存在する。前立腺ガン(その最も一般的な形態は、腺ガンである)の病因は、ほと んど知られていない。しかし、いくつかの研究は、可能性のある因子として腫瘍 サプレッサー遺伝子TP53の不活化および変化したDNAメチル化パターンに集中 している。さらに、フリーラジカル(これは、ホルモンの酸化還元サイクルから 発生する)が、最近、前立腺ガンに関連づけられている。これは、水酸基ラジカ ル(・OH)(例えば、種々の研究で発ガン性に結びつけられてきた、8-ヒドロキシ グアニン(8-OH-Gua)および8-ヒドロキシアデニン(8-OH-Ade))が、DNAに変異 原性変化を生じることを示す証拠と一致する。これらの知見にもかかわらず、D NAの・OH修飾と前立腺ガンとの間の可能性のある関連性の理解は、実質的には 存在しない。 前立腺組織は、良性の前立腺肥大(BPH)の領域を含み得る。それは、しばし ば、前立腺ガンを伴うが、悪性前病変として認められていない。BPHの病因は 知られていなし、前立腺ガンとの関係も同じである。前立腺ガンの診断への現時 のアプローチにおける困難さに起因して、当該分野で改善された方法に対する必 要性が存在する。本発明はこの必要性を満たし、そして他の関連する利点をさら に提供する。 乳ガンは、女性における主な死亡原因であり、そして女性における最も通常の 悪性腫瘍である。乳ガンを発症する発生率は上昇している。9人の女性のうち1 人は、この疾患と診断される。乳ガンを処置するための標準的なアプローチは、 外科手術、放射線および化学療法の組合せに集中している。特定の悪性腫瘍にお いて、これらのアプローチは成功し、そして治癒を達成している。しかし、診断 が特定の段階を過ぎる場合、乳ガンは最も頻繁に不治である。浸潤性腺管ガンは 、転移し得る乳ガンの通常の形態である。早期の検出のための代替のアプローチ が必要とされる。乳ガンの診断への現時のアプローチにおける困難性に起因して 、当該分野で改善された方法についての必要性が存在する。本発明は、この必要 性を満たし、そして他の関連する利点をさらに提供する。 DNAは微小環境因子によって絶えず改変されており、したがって膨大な数の 改変された構造が作成される(参考文献1、2)。例えば、転移状態への原発性乳 ガンの進行は、数十億もの多くの新たなDNA形態を含むと推測された。これら の多くは、ヒドロキシラジカル(・OH)誘導構造変化から生じるようである(参考 文献2)。低質量オリゴヌクレオチド(<1×103塩基対)の分析において進歩がな された(参考文献3)。しかし、細胞性DNA(約6×106塩基対)の複雑性および 高質量が、構造的解明を妨げてきた。結果的に、これらのDNAの理解は、重要 な生物学的特性を潜在的に有するインタクトな構造についての情報をほとんど提 供しない、破壊的技術(化学的または酵素的)を使用することによって主に得なけ ればならなかった。 進歩したコンピュータソフトウェアと組み合わせた赤外顕微鏡分光計の開発( 図14)により、数マイクログラムの細胞性DNA(例えば、生検標本由来)から のフーリエ変換−赤外(FT−IR)スペクトルを得ることが可能になった。 発明の要旨 簡潔に述べると、本発明は、組織の状態を規定する方法、および環境の遺伝子 毒性を評価する方法を提供する。本発明の方法は、T-1(原発性非転移性)腫瘍を 転移性腫瘍と区別するために、特に良好に適切である。本発明は、広範な種々の DNAサンプルおよびガンに、ならびに広範な種々の遺伝子毒性環境に適用可能 である。 一つの局面において、本発明は、いわゆる「重心」モデル(「S字曲線モデル」と も呼ばれ得る;これを用いて組織サンプルが分析される)を用いる。重心モデル に従って、以下の工程:(a)DNAサンプルをフーリエ変換−赤外(FT−IR) 分光に供し、FT−IRスペクトルデータを作成する工程;(b)主成分分析(P CA)によって工程(a)のFT−IRスペクトルデータを分析する工程;および( c)工程(b)のPCAを、非ガン性、非転移性腫瘍もしくは転移性腫瘍サンプル 由来のDNAサンプルのFT−IRスペクトルのPCAと比較する工程、を包含 する、腫瘍または転移性状態への腫瘍進行についてスクリーニングする方法が提 供される。 別の局面において、本発明は、組織の状態を特徴付けるためのいわゆる「楕円 モデル」を提供する。この局面において、本発明は、目的の組織の種々の規定さ れた状態に対応する数学的記載(すなわち、モデル)を提供する。組織の規定され た状態は、例えば、正常な前立腺組織、良性前立腺肥大、および転移性前立腺ガ ンを含む。ここで、「正常」、「良性肥大」および「転移性」は、3つの「規定された 状態」であり、そして前立腺組織が「目的の組織」である。 簡潔には、楕円モデルによれば、本発明は、組織の状態(例えば、生理学的状 態)を規定するための方法を提供し、この方法は、 (a)第1の複数の組織サンプルからのDNAをフーリエ変換−赤外(FT−IR) 分光にかけて、FT−IRスペクトルデータを作成する工程; (b)工程(a)のFT−IRスペクトルデータを主成分分析(PCA)により分析し て、主要成分(PC)スコアを提供する工程; (c)クラスター分析を工程(b)のPCスコアに適用して、域外値および非域外値 の組織サンプルを識別する工程;および (d)非域外値組織サンプルからのPC値に最良に適合する多変量型の正規ベル型 曲線を規定する、第1の方程式と呼ばれる方程式を作成する工程であって、第1 の方程式が第1の複数の組織サンプルの状態を規定する、工程を包含する。 別の実施態様において、本方法は、第2の複数の組織サンプルを用いて、上記 工程(a)から(d)を繰り返して、第2の方程式を提供する工程であって、第2の 方程式が、第2の複数の組織サンプルの状態を規定する、工程をさらに包含する 。別の実施態様において、本方法は、多変量弁別分析を第1および第2の方程式 に適用して、それぞれ第1および第2の確率方程式を提供する工程をさらに包含 する。別の実施態様において、本方法は、(e)目的の状態を有する組織からのD NAサンプルをFT−IR分光にかけて、FT−IRスペクトルデータを作成す る工程;(f)工程(e)のFT−IRスペクトルデータをPCAにより分析して、 PCスコアのセットを提供する工程;および(g)工程(f)のPCスコアを、第1 および第2の確率方程式のそれぞれと組み合わせて、それぞれ第1および第2の 確率スコアを提供する工程をさらに包含する。 好ましい実施態様において、本発明の方法は、組織由来のDNAを規定し(特 徴付け)、したがって組織自体を規定するための手段を提供する。ここで、本方 法は、以下の工程: (a)目的の組織の「n」個の規定された状態のうちの第1の状態からの複数 (「m」個)のDNAサンプル(例えば、「m」個の異なる個体からの正常前立腺組織 のサンプル)それぞれを、フーリエ変換−赤外(FT−IR)分光にかけて、FT −IRスペクトルデータを作成する工程; (b)工程(a)の各サンプル由来のFT−IRスペクトルデータを、主要成分分 析(PCA)により独立して分析して、「m」個のFT−IRスペクトルのそれぞれ からの複数(「o」個)の主要成分(PC)スコア(すなわち、PC1スコア、PC2 スコア、PC3スコア...PCoスコア)を提供して、「m」セットのPCスコ アを提供する工程であって、すべてのサンプルが、FT−IRスペクトルデータ の同一処理により得られるような、同数のPCスコアにより特徴付けられ、そし て各セットは、「o」個の値を含む、工程; (c)クラスター分析を、サンプルのすべてから得られるような、目的の組織の「 n」個の規定された状態からのPCスコアのセット(すなわち、「m」個のDNA サンプルのFT−IRスペクトルから得られるPC1スコア〜PCoスコアのす べて)に適用して、域外値および非域外値の組織サンプルを同定する工程; (d)第1の規定された状態にあるすべてのサンプルについて非域外値PC1.. PCo値に最良に適合する多変量型の正規ベル型曲線を規定する方程式を作成す る工程; (e)工程(b)から得られたPCスコアのセットそれぞれについて工程(c)およ び(d)を繰り返して、「n」個の方程式のセットを規定する工程であって、「n」個 の方程式それぞれが、「n」個のセットのPCスコアのそれぞれに対応する多変量 型の正規ベル型曲線を規定する、工程;および (f)多変量弁別分析を、工程(e)の多変量型の正規ベル型曲線を規定する「n」 個の方程式に適用して、目的の組織の「n」個の規定された状態のそれぞれについ ての確率方程式を規定する工程を包含する。 上記に概説される手順(工程(a)〜(f))に従って、目的の特定の組織について の目的の規定された状態それぞれに対応する確率方程式が作成される。ここで、 これら「n」個の確率方程式が、組み合わせで、モデルを規定する。 次いで、未知の規定された状態を有する目的の組織のサンプルは、FT−IR により分析され、これによって得られるスペクトルデータを主要成分分析にかけ て、「o」個のPCスコアを規定する。次いで、これら「o」個のPCスコアは、目 的の同じ組織についてのモデル内の種々の規定された状態に対応する「n」個の確 率方程式のそれぞれに「挿入され」て、規定された状態の数に対応する複数(「n」 個)の確率スコア(これから、モデルが構築された)を提供する。したがって、確 率スコアは、このモデルの規定された状態のそれぞれについて得られる。より高 い確率スコアは、目的の組織が、確率方程式に対応する規定された状態によって 適切に特徴づけられるより高い可能性を示す。例えば、PCスコアを正常組織に 対応する確率方程式に挿入することにより、「w」の確率スコアが提供され、その 同じPCスコアを転移性ガンに対応する確率方程式に挿入することにより、「x」 の確率スコアが提供され、そして「x」<「w」である場合、そのサンプルは転移性 ガンより正常組織である可能性が高い。 したがって、本発明は、以下の工程を包含する方法をさらに提供する: (1)上記工程(a)〜(f)を実施して、目的の特定の組織について多く(「n」個) の規定された状態に対応する多く(「n」個)の確率方程式を包含するモデルを提供 する工程; (2)工程(g)〜(j)を以下のとおりに実施する工程: (g)未知の規定された状態を有する目的の組織からのDNAサンプルを、フー リエ変換−赤外(FT−IR)分光にかけて、FT−IRスペクトルデータを作成 する工程; (h)工程(g)のFT−IRスペクトルデータを主要成分分析(PCA)により分 析して、複数(「o」個)の主要成分(PC)スコア(すなわち、PC1スコア、PC 2スコア、PC3スコア...PCoスコア)を提供して、「o」個のPCスコア のセットを提供する工程; (i)工程「h」の「o」個のPCスコアのセットを、工程「f」のモデルを構成する「 n」個の確率方程式のそれぞれに「挿入し」、「n」個の規定された状態のそれぞれ に対応する確率スコアを得る工程;および (j)未知の規定された状態を有する組織がメンバーである可能性が最も高い規 定された状態を決定するために、工程(i)からの「n」個の確率スコアを互いに比 較する工程。 上記方法の任意のものにおいて、組織は、乳房、泌尿生殖器、肝臓、腎臓、膵 臓、肺、血液、脳、または結腸直腸組織であり得る。1つの実施態様において、 組織はガン性、例えば、ガン性の乳房、前立腺、卵巣または子宮内膜組織である 。 別の実施態様において、本発明は、環境の遺伝子毒性を評価する方法を提供す る。この方法は以下の工程を包含する; (a)第1の環境中の複数の第1の生物からのDNAを、フーリエ変換−赤外( FT−IR)分光にかけて、FT−IRスペクトルデータを作成する工程; (b)工程(a)のFT−IRスペクトルデータを主要成分分析(PCA)により分 析して、主要成分(PC)スコアを提供する工程; (c)クラスター分析を工程(b)のPCスコアに適用して、域外値生物および非 域外値生物を識別する工程;および (d)非域外値生物からのPC値に最良に適合する多変量型の正規ベル型曲線を 規定する第1の方程式と呼ばれる方程式を作成する工程であって、この第1の方 程式が、第1の環境中の第1の生物を規定する、工程。 1つの実施態様において、本発明は、第2の環境から採取した第2の生物由来 のDNAサンプルを用いて上記工程(a)〜(d)を繰り返して、第2の方程式を提 供する工程をさらに包含する。ここで、第2の方程式は、第2の環境中の第2の 生物の状態を規定する。別の実施態様において、本発明は、多変量弁別分析を、 第1および第2の方程式に適用して、それぞれ第1および第2の確率方程式を提 供する工程をさらに包含する。別の実施態様において、本発明は、以下の工程を さらに包含する方法を提供する:(e)目的の環境からの目的の生物のDNAサン プルをFT−IR分光にかけて、FT−IRスペクトルデータを作成する工程; (f)工程(e)のFT−IRスペクトルデータをPCAにより分析して、PCスコ アのセットを提供する工程;および(g)工程(f)のPCスコアを、第1および第 2の確率方程式のそれぞれと組み合わせて、それぞれ第1および第2の確率スコ アを提供する工程。 随意の実施態様において、第1および第2の環境のうちの少なくとも1つは、 汚染された環境である。別の随意の実施態様において、第1および第2の生物は 、非同一であるが、第1および第2の環境は同一である。別の随意の実施態様に お いて、第1および第2の生物は同一であるが、第1および第2の環境が非同一で ある。 したがって、好ましい実施態様において、本発明は、環境の遺伝子毒性を評価 する方法を提供する。この方法は、本質的には上記に記載された通りであり、す なわち、重心または楕円モデルを使用するが、DNAサンプルは種々の環境から 採取された生物由来である。一例として、環境は、種々の程度の汚染に冒されて いてもよい。いずれにしても、重心モデルによれば、本方法は、以下の工程を包 含する:(a)環境中の第1の生物のDNAサンプルを、フーリエ変換−赤外(F T−IR)分光にかけて、FT−IRスペクトルデータを作成する工程;(b)工 程(a)のFT−IRスペクトルデータを主要成分分析(PCA)により分析する工 程;および(c)工程(b)のPCAを、(1)工程(a)の環境中に導入前の第1の生 物、または(2)非汚染環境中の第2の生物のDNAサンプルについてのFT−I RスペクトルのPCAと比較する工程。楕円モデルも同様に、環境の遺伝子毒性 を評価する方法に使用され得る。 本発明のこれらおよび他の局面は、以下の詳細な説明および添付の図面を参照 することにより、明らかになる。 図面の簡単な説明 図1は、PCA/FT−IRスペクトル分析によって導出された二次元PCプ ロットを示す。これは、正常点、良性前立腺肥大(「BPH」)点、および前立腺ガ ン点の異なるクラスター化を示す。明らかに、前立腺病変の両群が、正常前立腺 のDNAの点の右側に現れる。 図2は、前立腺ガン対正常組織(図2A)、BPH対正常組織(図2B)および前 立腺ガン対BPH(図2C)の平均スペクトルの比較を示す。各パネル(A〜C)の 下側のプロットは、不等分散t検定に基づく、各波数における平均吸光度の差の 統計的有意性を示す。P値はlog10スケールにプロットされている。 図3は、DNAが、正常組織対前立腺ガン(図3A)、正常組織対BPH(図3 B)、およびBPH対前立腺ガン(図3C)として分類される確率を示すS字曲線 を示す。この曲線は、下記の表2に示されるロジスティック回帰モデルに基づく 。 予測される確率は、狭い範囲で非常に急激に上昇する。これは、群間の高度の識 別を反映し、そして正常からBPHへの進行、および正常から前立腺ガンへの進 行に関連するDNA構造における急激な変化を反映する。各サンプルをその予測 される確率にプロットする。 図4は、PC1、2、3の三次元プロットである。ここで各球は、DNA吸光 度スペクトルを表し、そして球の位置は、スペクトルの「形状」(これは、吸光度 ピータの高さ、幅、および位置を含む)によって決定される。プロットの上部の 乳房の非浸潤性腺管ガン(「IDC」)球(内側に点)のコアクラスターは、より分 散的であり、かつより大きなIDCmクラスター(球の内側に縦線)より有意に小 さく、そして乳房縮小形成組織(「RMT」)クラスターおよび転移性浸潤性腺管ガ ン(「IDCm」)クラスターは実質的に重なり、そしてサイズには統計学的に差は ない。 図5Aは、2つの空間的に近位のIDCスペクトル(三次元PCAプロット上 のAおよびBを示す矢印を参照)を示す。ここで、図5Bにおいて示される2つ の重ね書きされたスペクトルは、規格化吸光度が平均でわずか3%異なる。この ことは、PCAの高い特異性、および、空間的に近位の球がほとんど同一のスペ クトルプロフィールを有するという事実を示す。 図6Aおよび6Bは、平均IDCコアクラスターのスペクトルプロフィールと 比較した2つのIDC域外値(図5で同定された)のスペクトルプロフィールを示 す;「1」は、多病巣性ガンを示し(一つの病巣は、高度な悪性印環細胞ガンであ る)、そして「2」は、両側性乳ガンを示す。各症例において、平均スペクトルと 域外値スペクトルとの間の劇的な差は、PC分析に関連する顕著な構造的特異性 を示すスペクトル領域のほとんどにわたって明らかである(波数−構造の関係に ついては本文を参照)。 図7は、PC2対PC1をプロットするグラフでRMT、IDC、およびID Cm標本についてのスペクトルの重心計算を示し、そしてRMT重心からIDC 重心への方向ベクトルおよびIDC重心からIDCm重心への方向ベクトルを示 す。 図8は、平均RMT、IDC、およびIDCm種についての重心スペクトルの 重ね書きを示す。 図9は、平均を引いた後の平均RMT、IDC、およびIDCm種についての 重心スペクトルの重ね書きを示す。従って、これは、種間のスペクトル差を強調 する。 図10は、FT−IR方法論に基づくガンの予測確率を示す。 図11は、最初の3つのPCスコア導出される点のクラスターの三次元投射を 示す。これは、本質的に清潔なコントロール環境に住むイギリス人の一人(QM H群)または化学的に汚染された都会の環境に住むイギリス人の一人(DUW群) からのDNAのスペクトルの特徴をまとめる。 図12A〜12Cは、QMH群およびDUW群の各々についての平均スペクト ルの比較を示す。各パネルの下側のプロットは、不等分散t検定に基づく、各波 数での平均吸光度の差の統計学的有意性を示す。P値を、log10スケールでプ ロットする。 図13は、QMH群およびDUW群の個々のスペクトルのオーバーレイを示す 。 図14は、FT−IR微小分光計の写真および模式図を提供する。図14Aは 、2つの重ね書きされた総平均スペクトル(grand mean spectra)を示し、他方、 図14Bは、不等分散t検定を使用して各波数について得られたP値を提供する 。 図15Aは、「a」および「b」と名付けられた、非常に類似するPCスコアを有 する2つの標本を含む、乳ガン(IDC)クラスターの三次元PCプロットを示す 。2つの域外値もまた存在する:「c」は、両側に乳ガンを有する患者からのID C組織のDNAを表し、そして「d」は、1つの病巣が高度な悪性印環細胞ガンで ある、多病巣性ガンのDNAを表す。 図15Bは、スペクトル「a」および「b」が平均規格化吸光度の僅か3%しか異 ならないことを示す。2つのスペクトルは実質的に同一であるが、対応するPC 点は空間的に異なり、しがたって、高いスペクトル特異性がPCAを用いて達成 されたことを実証する。 図15Cは、IDCコアクラスター(域外値を有さない)の平均スペクトルと比 較した、(図15Aからの)域外値「c」のスペクトルを提供する。 図15Dは、IDCコアクラスター(域外値を有さない)の平均スペクトルと比 較した、(図15Aからの)域外値「d」のスペクトルを示す。平均スペクトルと域 外値スペクトルとの間の劇的な差は、ほとんどのスペクトル領域にわたって明ら かであり、主要なクラスターから大きく離れた2つの対応するPC点を生じる。 図16Aは、正常乳房組織(n=21)および乳ガン組織(IDC;n=37)に 由来するDNAのPCスコアの三次元プロットである。これは、図15Aに示さ れる2つの域外値(cおよびd)と共に、各群の異なるクラスター化を示す。 図16Bは、正常乳房および乳ガンについて、危険度スコアとガンの確率のプ ロットである。ガンサンプルは、ガンの確率が>61.5%である、S字曲線の 上部に主に位置する。他方、正常乳房サンプルはより下方の部分に主に位置する 。PCスコアは、群間を識別しないという帰無仮説は、P<0.0001で棄却 される。 図16Cは、正常前立腺(n=5)、BPH(n=18)、および前立腺ガン(腺 ガン;n=8)に由来するDNAのPCスコアの二次元プロットである。ここで 、クラスター化は異なる(4)。 図16Dは、正常前立腺および前立腺ガンについての、ガンの確率対危険度ス コアのプロットである。PCスコアは、群間を識別しないという帰無仮説は、P =0.04で棄却される。図16Cのプロットの右側のガン域外値は、確率曲線 において、正常からガンへの進行と同じ方向である。このことは、この域外値に より表されるDNAが、高度の構造的改変を有することを示唆する。 図17は、IDCおよびIDCMについてのDNAスペクトルの三次元図であ る(図16Aと同様に、正常乳房組織および乳ガンについての類似の三次元図を 提供する)。 図18は、転移性乳ガン(IDCM)および乳房縮小形成組織(RMT)を識別す るための二成分楕円モデルから得られたプロットである。 図19は、原発性乳ガン(IDC)および転移性乳ガン(IDCM)を識別するた めの二成分楕円モデルから得られたプロットである。 図20は、IDC、IDCM、およびRMT組織を識別するための三成分楕円 モデルから得られたプロットである。 図21は、正常(RMT)、原発性(IDC)、と転移性(IDCM)乳ガンの間を 識別するための三成分楕円モデルから得られたプロットである。 図22は、多変量正規モデル(すなわち、楕円モデル)に基づく、100のシミ ュレーションされた正常、IDCおよびIDCM症例のプロットを示す。 発明の詳細な説明 上記のように、本発明は、ある局面において、腫瘍または転移状態への腫瘍進 行についてスクリーニングする方法に関する。この方法はDNAの分析に基づく 。DNAはすべての生物において遍在しているので、本発明の方法は、特定のD NAサンプルの使用に限定されない。したがって、広範なガンがスクリーニング され得る。ガンの代表例には、乳ガン、泌尿生殖器ガン、メラノーマ、肝臓ガン 、腎臓ガン、膵臓ガン、肺ガン、循環系ガン、神経系ガン、または結腸直腸ガン が含まれる。泌尿生殖器ガンには、前立腺ガン、子宮頸部ガン、卵巣ガン、膀胱 ガンまたは子宮内膜ガンが含まれる。循環系ガンにはリンパ腫が含まれる。神経 系ガンには脳ガンが含まれる。 本明細書中で使用される場合、用語「〜についてスクリーニング」には、検出す ること、モニターすること、診断すること、または予知すること(予想すること) が含まれる。DNAは、本明細書に記載のとおりに分析され、腫瘍についてスク リーニングされる。本明細書中で使用される場合、「腫瘍」は、初めて存在しても よいし、または再発でもよく、あるいは発生もしくは再発の過程にあってもよい 。最後のシナリオ(すなわち、過程)は、臨床的発現の前に、ガンの危険の評価お よびガンの危険への洞察の機会を表わす。本発明は、たとえ、ガン細胞が、なお 現在利用可能な方法論に基づいて出現しなければならなくても、それが形成され る可能性を予測するために使用され得る。DNAはまた、本明細書に記載のとお りに、分析され、転移状態への腫瘍の進行についてスクリーニングされる。転移 状態への腫瘍の進行とは、終点(すなわち、転移状態)および終点への途上の任意 の中間点をいう。 用語「スクリーニング」はさらに、転移性腫瘍および非転移性腫瘍を区別するこ とを包含する。本明細書中に記載されるような、いわゆる楕円モデルは、スクリ ーニングのこの局面に特に好ましい。事実、楕円モデルを使用して、正常組織を 89%(18サンプル中16)で正確に同定し、他方、ガン組織を、97%(32 サンプル中31)で正確に同定した。さらに、楕円モデルを使用して、原発性(I DC)ガンを100%(10サンプル中10)で正確に同定し、他方、転移性(ID CM)ガンを82%で同定した。 「DNAサンプル」は、任意の供給源中のDNAまたは任意の供給源に由来する DNAである。DNAは、種々の供給源(組織供給源または液体供給源を含む)か ら取り出され得る。組織供給源には、器官または膜あるいは皮膚からの組織が含 まれる。液体供給源には、全血、血清、血漿、尿、滑液、唾液、喀痰、脳脊髄液 、またはそれらの画分が含まれる。組織サンプルに関して、例えば、組織は、生 検(例えば、細針生検)により生物から取り出され得、そしてDNAが抽出され得 る(すべて当業者に周知の技術による)。同様に、DNAは、公知の技術を使用 して液体供給源から抽出され得る。DNAの抽出/単離が好ましくあり得るが、 DNAは、本発明を実施するために、抽出/単離される必要はない。フーリエ変 換−赤外(FT−IR)分光を使用してDNAを直接調べることが可能である。例 えば、IRスキャンを細胞核に特異的に限定することによって、高濃度のスペク トルプロフィールを作成し得る。したがって、DNAサンプルは抽出/単離され たDNAであってもよいし、またはサンプルがDNAを含んでもよい。 DNAの後の分析のために組織を保存することが可能である。例えば、摘出さ れた組織は、液体窒素中で直ぐに凍結され、そして−80℃に維持され得る。この ような組織からのDNAの単離後、DNAは、通常、脱イオン水に溶解され、そ してFT−IR分光のために部分に分注される。代表的には、アリコートを、凍 結乾燥により完全に乾燥させ、純粋窒素でパージし、そして真空密封ガラスバイ アルに保存する。 本発明において、DNAサンプルをFT−IR分光にかけ、そしてFT−IR スペクトルデータを主成分分析により分析する。サンプル中のDNAの特徴付け の出発点は、1セットのIRスペクトルである。各スペクトルは、それぞれの整 数波数(すなわち、一般には、4000〜700cm-1、そして代表的には、2 000〜700cm-1)における数値的吸光度を示す。DNAサンプルの赤外(I R)スペクトルを、IR顕微鏡および広範囲水銀−テルル化カドミウム−検出 器を備えたフーリエ変換−IR分光計(例えば、Perkin−Elmer S ystem 2000(The Perkin−Elmer Corp.,No rwalk,CT))を用いて得る。DNAを、一般に、相対湿度約60%未満の 雰囲気下のフッ化バリウム上に置き、平坦化して透明フィルムを作製する。IR 顕微鏡を肉眼観察モードで使用して、サンプルの均一で透明な部分を選択して、 透過スペクトルを得る際の散乱またはウェッジ効果を避ける。一般に、各分析を 、3〜5μgのDNAについて3連で実行し、そしてスペクトルをコンピュータ で平均する。一般に、4cm-1の分解能での256スキャンを、各分析について 実行し、4000〜700cm-1の周波数範囲でスペクトルを得る。代表的には 、ガラスバイアルを破壊してから各IRスペクトルを得るまで3〜5分が経過す る。代表的には、DNA標本は、厚さが変化し、多様なセットの吸光度またはス ペクトル強度を生じる。どのIRスペクトルも、特異的な塩基対合を暗示する1 703cm-1バンドを示さない。この事実は、サンプルが異常形態であるD形状 を獲得したことを示す。 IRスペクトルを透過単位で得、そしてデータ処理のために吸光度単位に変換 する。例えば、分光計を制御しIRスペクトルを得るために、Infrared Data Managerソフトウエアパッケージ(The Perkin− Elmer Corp.)を使用し得る。さらに、運転後のスペクトログラフデ ータ分析を実行するために、GRAMS/2000ソフトウエアパッケージ(G alactic Industries Corp.,Salem,NH)を使 用し得る。各スペクトルを、4000〜700cm-1のすべての波数についての 特異的吸光度を含むスプレッドシート形式に変換する。 IRデータを処理する際に、一般に、バックグランドの吸光度の影響を除去す るために、すべてのスペクトルについてベースライン調整を使用する。これをな すために、(例えば、範囲2000〜700cm-1について)最低点を中心にした 11波数にわたる平均吸光度を、すべての周波数の吸光度から差し引く。さらに 、一般に、IRデータを規格化する。規格化に有用な周波数範囲2000〜70 0cm-1における十分に確立した参照ピークが存在しないので、一般には、規格 化は、すべての吸光度を、目的の範囲での一定の平均強度に変換することに よって達成される。例えば、1750〜700cm-1の領域(1051波数のス パン)は、代表的には、分析のための主要領域として、本発明において選択され る。なぜなら、それが広範囲に変化する吸光度を含むからである。上記のベース ラインの除去後、スペクトル中のすべての波数における吸光度を、そのスペクト ルについての1750〜700cm-1の範囲の平均吸光度で割り、すべての標本 について平均スペクトル強度1.0を得る。一般に、すべてのさらなる分析を、 これらのベースラインとされた規格化スペクトルについて実行される(しかし、 平均が除去されていない分析もまた可能である)。 本発明では、スペクトル間の変動およびこの変動のサブグループ(例えば、ガ ン対非ガン)に対する関係を研究するために、因子分析が使用される。特に、F T−IR分光により獲得されたスペクトルデータを、主成分分析(PCA)統計学 的アプローチを使用して分析する。PCAは、互いに独立し、そして元の長い変 数リスト中のほとんどの情報を捕捉する数個の変数(主成分スコアまたはPC)を 明らかにする目的で単一セットの変数に適用される統計学的手順である(例えば 、Timm,N.H.,Multivalent Analysis,Timm ,N.H.編、1975,Brooks/Cole,Monterey,CA, 528〜570頁)。PCAは、スペクトルを通じて変化する主要な特徴をまと める数個のPCを生じる。PCAは、赤外スペクトル全体にわたる、吸光度−波 数値間の百万を超える相関に基づき得る。複雑なスペクトル関係を含む多くの変 数を、数個のPCスコアに減らす。各PCスコアは、総平均スペクトルからのあ るスペクトルの波数毎の偏差の重み付けした総和である。各PCスコアは、二次 元および三次元のPCプロットで点として出現し、異なりそして高度に識別力の あるDNAの構造的特性の1群を表す。 例えば、5個の主成分(すなわち、五次元)は、FT−IRスペクトルの105 1次元(すべてのスペクトルの総平均が各スペクトルから差し引かれている)を記 述するに十分であり得、そして二次元または三次元の視覚的図表で足りる。PC Aは、多くの基本的で進歩した統計学的プログラム(例えば、SASおよびS− Plus)において利用可能である。 全体分析は、一般に、3群(非ガン性サンプル、非転移性腫瘍サンプル、およ び転移性腫瘍サンプル由来のDNA)のそれぞれからのコアクラスターを用いて 実施されるが、3群すべてを使用しない可能性も3群以外の群も使用する可能性 がある(例えば、3群のうちの2群、または非ガン性サンプル対すべての腫瘍サ ンプル(転移性か否かにかかわらず))。クラスター分析を使用して、コア群にお いて他のものとは離れて位置する特定の群のメンバーを同定する。この隔離され た群のメンバーはすべて、一般的に、平均規格化吸光度で少なくとも12%の差 を表すユークリッド距離で、その群中の他のものから離れて位置する。この差は 、スペクトルを従来の方法でプロットした場合、肉眼で気づく差である。コアク ラスターは、より通常に遭遇するDNAの構造的表現型であると考えられ得る。 一方、隔離された群のメンバー(「域外値」)は、そのサンプルを用いて研究するに 十分大きな数では存在しないが、含まれる場合には分析に過剰に影響する、頻繁 でない表現型を表す。 コアクラスター分析を使用して、PCスコアは、「域外値」および「域内値」に関 してこのように特徴付けられる。「域内値」であるPCスコアは、次いで、重心モ デルまたは楕円モデルのいずれかに従って操作され得る。重心モデルを下記にお いて最初に議論し、続いて楕円モデルを議論する。 非ガン性手法(NC)が非転移性腫瘍(NMT)へ進行するためのDNA構造変化 が非転移性腫瘍(NMT)が、転移性腫瘍(MT)へ進行するための変化と同一であ るかどうかの決定を、点の群から統計学的に導出される重心に基づいて検定する 。この重心は、1750から700cm-1までの1051の個々の波数の平均吸 光度のベクトルである。2つの進行が同様である場合、3群の重心は、二次元空 間および三次元空間において一列にならぶ。 公式には、cos(θ)=1.0という仮説を検定する。ここで、θは、NCの 重心からNMTの重心までを示すベクトルxと、NMTの重心からMTの重心ま でを示すベクトルyとの間の角度である。cos(θ)は、cos(θ)=xy/(| x|・|y|)によって規定される。ベクトルxは波数によって示され、そして各波 数でNMTスペクトルの平均規格化吸光度とNCスペクトルの平均規格化吸光度 との間の差を含む。ベクトルyは、MTスペクトル−NMTスペクトルについて の対応する差を示す。角度θ=0[これはcos(θ)=1.0と等価である]は、 MTが、NC→NMT進行の「実質的に一直線に前進する」持続であること、およ び重心が一直線にならぶことを示す。一方、θ≠0は、NMT→MT進行が、異 なる組のスペクトル(構造)変化を含むことを示す。cos(θ)=1.0という仮 説を、ブートストラップ法(EfronおよびGong,Am.Stat.37 :36−48,1983)を使用して検定した。ブートストラップ法は、NC、 NMT、およびMTのコアクラスターからの置換を伴う再サンプリングおよび各 再サンプリングについてのcos(θ)の計算を包含する。 NCおよびNMTコアクラスターが引き出される集団が、異なる重心(すなわ ち、異なる平均吸光度スペクトル)を有するかどうかを決定するために、NC重 心とNMT重心との間の距離について、NCサンプルとNMTサンプルとの間で 標識をランダムに置換し、そして重心間の距離を再計算して置換検定を実行する 。同様な置換検定を、NMT重心とMT重心との間の距離について実行する。最 後に、3つのコアクラスターのサイズを、各スペクトルからそのクラスター重心 までの距離についてKruskal−Wallis ANOVA検定およびMa nn−Whitney(MW)検定を使用して比較する。(Kruskal−Wa llis検定およびMW検定のP値は、サンプル値がそれらのサンプル平均と比 較される場合に導入されるいくらかの統計学的依存性のために、概算である。) 主成分分析により分析したDNAの赤外スペクトルの波数−吸光度関係(すな わち、FT−IRスペクトルデータのPCA)を、空間中の点として表現し得る 。各点は、DNA構造の高度に識別可能な尺度を表わす。これらのPCスコアを 2次元プロットおよび3次元プロットにプロットし得る。プロット中のスペクト ルの位置は、そのスペクトルが、いかにそのプロット中の他のスペクトルと異な るかまたは同様であるかを記述する。異なる群のスペクトルについての異なるプ ロット記号またはクラスターは、スペクトルのクラスター化を強調するのを助け る。さらに、2群のスペクトルを分析する場合、ロジスティック回帰を使用して 、それらのPCスコアに基づいてスペクトルを分類するためのモデルを開発し得 る。ロジスティック回帰は、分類のために通常使用される方法であり、多くの統 計学的ソフトウエアパッケージ(例えば、SASおよびS−Plus)において利 用可能である。PCスコアは予測子であり、その結果は標本を分類するために使 用さ れ得る方程式(モデル)である。各標本を、(例えば)非ガン群に対してガン群であ る数値確率でタグする。この分析の結果を、予測方程式を使用して、ガンの危険 スコア(推定確率のロジット(logit))がX軸上で、推定確率がY軸上である S字状曲線としてプロットし得る。新たな標本についての確率もまた計算し得る 。カット点(例えば、0.5以上の確率)を選択することによって、すべての標本 を、(例えば)ガンまたは非ガンとして分類し得る。分類の感度および特異性もま た標準的な方法を使用して計算し得る。 FT−IR分光と統計学との組合せ FT−IRスペクトルはDNA構造の高感度な表現である(参考文献2、4〜 6)。微妙な変化、例えば、フリーラジカルにより誘導される酸化還元状態にお ける微妙な変化(参考文献1、5、6)は、振動運動および回転運動に影響し、し たがって波数−吸光度関係を変化させる可能性が高い。2群のDNAの間の構造 的差異を、(例えば、図14Aに示される)総平均スペクトルについてt検定を使 用して同定し得る。得られるP値が図14Bに与えられる(参考文献14)。t検 定は、各波数の平均吸光度の差異についてのP値を提供する。対照的に、PCA は、スペクトル全体にわたる吸光度−波数値間の百万を超える相関に基づく(参 考文献2)。複雑なスペクトル関係を含む多くの変数が考慮され、互いに独立し た数個のPCスコアに減らされる。各PCスコアは、総平均スペクトルからのあ るスペクトルの波数ごとの偏位の重み付けられた総和である。本質的には、PC スコアは、DNAの異なるスペクトル(したがって、構造的)特性の一群を表す。 通常、最初の2つまたは3つのPCスコアが、分散全体の約80%を含む。三 次元プロット(図15A、16A)または二次元プロット(図16C)は、これらス コアに基づいて構築され得、各スペクトルは、その空間的配向がDNA構造の高 度に識別可能な尺度である単一の点によって表される。実質的に同一のスペクト ル(図15B)が、PCプロット(図15A、aおよびb)中の点として分離され得 る。さらに、平均スペクトル(図15C、D)とは顕著に異なるスペクトルを表す 2つの域外点(図15A、cおよびd)は、主要なクラスターから十分に離れて位 置する。 ロジスティック回帰または識別分析は、標本の「ガン確率」を、そのPCスコア に基づいて、0.0(非ガン)と1.0(ガン)との間で推定する。PCスコアを使用 してモデルから導出された、予想されたガン確率を、計算した危険度スコアに対 してプロットする(図16B、D)。正常組織のものと形質転換組織のものとの間 の確率値は、種々の程度のガン危険度を表す(参考文献2、4〜6)。確率−危険 度関係は、スクリーニングおよび予知試行についての見込みのある基礎を構成す る。 FTIR/統計学的技術の適用 乳ガンの研究において(参考文献2、5、6)、主要なスペクトルの差異が、正 常乳房→乳ガンへの進行について見出された(浸潤腺管ガン;IDC)。三次元PC プロットは、各群のDNAを表す点の異なる明確なクラスターを明らかにした(図16 A)。IDC群のPC点が選択され、図15Aに提供された。両側性乳ガンを有する患者 のDNAを表すC点は、単一の乳ガンを有する患者のDNAを示す主要クラスター から完全に分離された(参考文献2)。組織の病変における差異が、PC点の位置 を著しくシフトすることが見出された。印環細胞ガンの第二の病巣、高度に悪性 の病変を含む標本を示すd点は、主要クラスターから十分に分離される。これら の例は、FT-IR/統計学的技術が、種々の生物学的状態との関連においてDNAの構 造変化を解明するための潜在的に高度な能力を有することを証明する。 全54サンプルについて正常および乳ガンPCスコアが、ロジスティック回帰を使 用して分析し、得られるガンの確率対危険性スコアS字曲線(図16B)は、非ガン とガンとの間に多くの移行値を示した。サンプル(4つのさらなる明確な域外値 を含む)の分類において、予測モデルは、カット点として61.5%の確率を使用し て、86%の感受性(正確に分類されたガンを有する患者のパーセント)および81 %の特異性(正確に分類されたガンを有さない患者のパーセント)を有した。( このカット点は、感受性と特異性を共に最高にするように選択され、そして疾患 および群の間で変わり得る。)モデルの能力は、独立した試験によって実証され た。11人の女性(予測モデルに含まれない)の乳ガン近傍からの分光学的に正常 な組織(MNT)のスペクトルを分析し、そして対応するPCスコアを計算した。ス コアをモデルで使用した場合、11のうちの10(91%)は、75%を超える予測され るガン可能性を有した。従って、DNA構造に基づいて、MNTは、「非常に危険」と 分類された。これは、乳ガン付近の組織が、第二の病変を発現する高い危険性を 有することを示すデータによって支持される(参考文献6)。 原発性乳ガン→転移性乳ガンへの進行についての総平均スペクトルの比較は、 ヌクレオチド塩基およびデオキシリボースに割り当てられたスペクトル領域にお ける明白な差異によって示唆されるように、DNAの構造が、著しく変化する(参 考文献2)ことを示した。DNAとの・OHの反応の増加に主に起因する、これらの変 化は、構造上の多様性(これは、以前に記載される(参考文献2)ようなPCスコ アに基づいて計算された)における実質的な増加を生じた。多様性の決定は、フ リーラジカルによって生じるような、DNAへの構造的損傷の有用な尺度を提供す る。 正常前立腺→前立腺ガンへの進行(図14A)および正常前立腺→良性前立腺肥 大(BPH)への進行における総平均スペクトルの比較は、形質転換がDNAにおける有 意な構造的変化に関連するということを初めて示した(参考文献4)。最初の2 つのPCスコア(全分散の76%)を、2次元プロットのために使用した(図16C)。 この群は、明らかなクラスター化を示した。前立腺病変クラスターは、正常前立 腺のクラスターの右に位置し、そしてBPHクラスターは、ガンクラスターの右に 位置した。空間的配置は、仮定の進行BPH→前立腺ガン(参考文献7)がありそ うにないことを示唆する。なぜならこれは、正常→BPH形質転換と比較して構造 的な逆行を必要とするからである(参考文献4)。これは、病変のそれぞれの型 が、独立して生物学的に誘導されるか、またはガンへの進行において逆転を模倣 するBPHのDNAにおけるさらなる変化が存在することを意味する。 弁別分析を介して得られた前立腺ガンの可能性を、危険性スコア(確率のロジ ット(logit))に対してプロットし、そしてこれは群の分離付近を明らかにした (図16D)。弁別モデル(合計12のガンおよび非ガンサンプルを使用して計算し た)は、多変量正規分布としてクラスターを表した。サンプル(1つのさらなる ガン域外値を含む)の分類において、予測モデルは、カット点として50%の確率 を使用して、88%の感受性および80%の特異性を有した。この技術は、前立腺ガン のさらなる研究のために、前立腺上皮内腫瘍形成(PIN)と腺ガンとの推定の病因 学的関係および前立腺特異的抗原(PSA)試験結果とガン確率値との関連性を含 む、見込みのある機会をもたらす(参考文献7)。 楕円モデル(これはまた、「多変数正規モデル」または「MNM」とも呼ばれ得 る)に従って、PCスコアは、FT-IRスペクトルにおける変動のパターンを捕捉す る。ここで各PCスコアは、上記のように、波数により吸光度の重み付けられた総 和である。各PCスコアは、特定のスペクトル領域を強調し、ここでPCスコアのセ ット(約6スコアが通常十分であるが、より少ない数のスコアもまた、満足し得 る)は、非常に良好に、各スペクトルを表す。PCスコアは、スペクトルを横切っ て変化し、そしてスペクトル間の差異を強調する。一般に、6PCスコアは、スペ クトル間の総変動の少なくとも約90%を捕捉するに十分である。 クラスター(例えば、IDCM)についてのPCスコアのセットは、統計学的モデル によって近似され得る。各PCスコア(例えば、PC1)は、「ベル型曲線」(すな わち、ガウス分布)によって近似され得る。従って、(6つのPCスコアが存在す る場合)PC1、PC2、....、PC6の各々は、ベル型曲線によって、別々に近似され 得る。いくつかの状熊が、一緒に分析される場合、PC1、PC2などは、通常、所定 の状態(例えば、IDCM)内で相関付けられる。完全モデルは、多変数正規分布( これは数式である)である。 このモデルは、PC1、PC2、....、PC6などの無限に多くの組合わせとして見な され得るが、いくつかの組合わせは、他のものよりもさらに可能である。このモ デルから無作為のサンプルを引き出すことは可能であり、そしてこれを実施する ために本来のデータを有することは必要でない(モデルは十分である)。サンプ ルをプロトする場合(例えば、PC2対PC1)、プロットは、高密度(ここで数学的 モデルは、スペクトルがより高い可能性で生じることを示す)を示す。 モデルはまた、モデルから、90%以上(または任意の所望のパーセンテージ )の無限確率を捕捉する楕円の構築を可能にする。数学的には、数値的方法を使 用して、モデル関数を積分する。ここで、90%楕円の内側を積分することにより 、-∞から+∞にわたって積分することによって得られる値の90%を得る。この 楕円は、確率の90%を含む。例えば、無作為に選択されたIDCMスペクトルは、 IDCMデータから作成された楕円の内側へ入る可能性が90%を超える。3次元楕 円の長さ、幅、高さは、このクラスター(例えばIDCM)について、各々PCスコア 1、PCスコア2、PCスコア3の標準偏差に比例する。実際の計算は、カイ二乗分 布を使用して計算される。 まとめると、楕円モデルに従って、本発明は、以下の工程からなる方法を提供 する: (a)目的の組織の「n」個の規定された状態のうちの第1の状態からの複数(「m」 個)のDNAサンプル(例えば、「m」個の異なる個体からの正常前立腺組織のサ ンプル)それぞれを、フーリエ変換−赤外(FT−IR)分光にかけて、FT−I Rスペクトルデータを作成する工程; (b)工程(a)の各サンプル由来のFT−IRスペクトルデータを、主要成分分 析(PCA)により独立して分析して、「m」個のFT−IRスペクトルのそれぞれ からの複数(「o」個)の主要成分(PC)スコア(すなわち、PC1スコア、PC2 スコア、PC3スコア...PCoスコア)を提供して、「m」セットのPCスコ アを提供する工程であって、すべてのサンプルが、FT−IRスペクトルデータ の同一処理により得られるような、同数のPCスコアにより特徴付けられ、そし て各セットは、「o」個の値を含む、工程; (c)クラスター分析を、サンプルのすべてから得られるような、目的の組織の「 n」個の規定された状態からのPCスコアのセット(すなわち、「m」個のDNA サンプルのFT−IRスペクトルから得られるPC1スコア〜PCoスコアのす べて)に適用して、域外値および非域外値の組織サンプルを同定する工程; (d)第1の規定された状態にあるすべてのサンプルについて非域外値PC1.. PCo値に最良に適合する多変量型の正規ベル型曲線を規定する方程式を作成す る工程; (e)工程(b)から得られたPCスコアのセットそれぞれについて工程(c)およ び(d)を繰り返して、「n」個の方程式のセットを規定する工程であって、「n」個 の方程式それぞれが、「n」個のセットのPCスコアのそれぞれに対応する多変量 型の正規ベル型曲線を規定する、工程;および (f)多変量弁別分析を、工程(e)の多変量型の正規ベル型曲線を規定する「n」 個の方程式に適用して、目的の組織の「n」個の規定された状態のそれぞれについ ての確率方程式を規定する工程を包含する。 上記に概説される手順(工程(a)〜(f))に従って、目的の特定の組織について の目的の規定された状態それぞれに対応する確率方程式が作成される。ここで、 これら「n」個の確率方程式が、組み合わせで、モデルを規定する。 次いで、未知の規定された状態を有する目的の組織のサンプルは、FT−IR により分析され、これによって得られるスペクトルデータを主要成分分析にかけ て、「o」個のPCスコアを規定する。次いで、これら「o」個のPCスコアは、目 的の同じ組織についてのモデル内の種々の規定された状態に対応する「n」個の確 率方程式のそれぞれに「挿入され」て、規定された状態の数に対応する複数(「n」 個)の確率スコア(これから、モデルが構築された)を提供する。したがって、確 率スコアは、このモデルの規定された状熊のそれぞれについて得られる。より高 い確率スコアは、目的の組織が、確率方程式に対応する規定された状態によって 適切に特徴づけられるより高い可能性を示す。例えば、PCスコアを正常組織に 対応する確率方程式に挿入することにより、「w」の確率スコアが提供され、その 同じPCスコアを転移性ガンに対応する確率方程式に挿入することにより、「x」 の確率スコアが提供され、そして「x」<「w」である場合、そのサンプルは転移性 ガンより正常組織である可能性が高い。 したがって、本発明は、以下の工程を包含する方法をさらに提供する: (1)上記工程(a)〜(f)を実施して、目的の特定の組織について多く(「n」個) の規定された状態に対応する多く(「n」個)の確率方程式を包含するモデルを提供 する工程; (2)工程(g)〜(j)を以下のとおりに実施する工程: (g)未知の規定された状態を有する目的の組織からのDNAサンプルを、フー リエ変換−赤外(FT−IR)分光にかけて、FT−IRスペクトルデータを作成 する工程; (h)工程(g)のFT−IRスペクトルデータを主要成分分析(PCA)により分 析して、複数(「o」個)の主要成分(PC)スコア(すなわち、PC1スコア、PC 2スコア、PC3スコア...PCoスコア)を提供して、「o」個のPCスコア のセットを提供する工程; (i)工程「h」の「o」個のPCスコアのセットを、工程「f」のモデルを構成する「 n」個の確率方程式のそれぞれに「挿入し」、「n」個の規定された状態のそれぞれ に対応する確率スコアを得る工程;および (j)未知の規定された状態を有する組織がメンバーである可能性が最も高い規 定された状態を決定するために、工程(i)からの「n」個の確率スコアを互いに比 較する工程。 図18、19、20および21に見られるように、楕円は重複する。実際、これら2つ または3つのクラスターのための完全なモデルは、至る所で重複する。言い換え ると、三次元空間の任意の所定の位置について、この点のためのスペクトルが、 例えばRMTに属する可能性、これがIDCに属する別の可能性、そしてこれがIDCMに 属する別の可能性が存在する。しかし、各群(IDC、IDCM、およびRMT)は、いく つかの位置で、他の群よりも高い密度を有する。所定のサンプルについて、これ は、そのサンプルの位置(PCスコア)で最も高い密度を有する群に割り当てられる 。それゆえ、90%のIDC楕円が90%IDCM楕円の内側に埋もれる場合でさえ、I DCは、これらの内部点の多くのまたはほとんどで、より高い密度を有する可能性 がある。従って、この重複空間内に生じるPCデータを提供するサンプルは、IDC である可能性がより高い。 一般に、本発明の楕円モデルは、正常、IDC、およびIDCMのスペクトル/組織を 表すためのモデルの構築を可能にする。上記のようにPCスコアを得た後、PCスコ アの相関関係および多様性が決定される。次いで、選択されたデータは、多変数 性型のベル型曲線に基づいて、同じ相関関係および多様性を有する統計学的モデ ルに適合される。このモデルは、各群の集合推定90%を含む楕円によって表され 得る。 本発明は、乳房組織の形質転換の予測を可能にする。楕円モデルに従って、乳 房組織のサンプルからのPCスコアが使用され、3つの可能性が計算され得る:組 織が正常である可能性、組織がIDCである可能性、および組織がIDCMである可能 性。組織は、最も高い可能性を与える群に割り当てられる。事実、楕円モデルを 使用して、正常組織を89%(18サンプル中16)で正確に同定し、他方、ガン 組織を、97%(32サンプル中31)で正確に同定した。さらに、楕円モデルを 使用して、原発性(IDC)ガンを100%(10サンプル中10)で正確に同定し 他方、転移性(IDCM)ガンを82%で同定した。従って、楕円モデルは、原発 性ガン組織(97%で正確に同定された)および転移性ガン(82%で正確に同定さ れた)を正確に分類および識別するために特に良好に適合している。 本発明は、FT-IRスペクトルデータのPCAによってDNAサンプルを分析し、そし て驚くべきことに、非転移性腫瘍(「原発性腫瘍」)DNAへの非ガン性(「正常 」)DNAの進行の方向が、転移性腫瘍への原発性腫瘍の進行の方向とは有意に異 なるということを示す。既知の非ガン性腫瘍、非転移性腫瘍および転移性腫瘍サ ンプル由来のDNAサンプルのFT-IRスペクトルのPCAと、目的のDNAサンプルのFT-I RスペクトルのPCAとの比較によって、目的のサンプルが、これら3つの状態の1 つであるか、または腫瘍状態の1つへ向けて進行中であるかどうかを決定し得る 。 例えば、本発明は、前立腺ガンの検出のための方法を提供する。本発明は、正 常前立腺、良性前立腺肥大(BPH)および腺ガン由来のDNAに対して、フーリエ変換 -赤外(FT-IR)分光の主成分分析(PCA)(PCA/FT-IR技術)を使用する技術を適用 する。以下に詳細に記載されるように、これらの組織のそれぞれに由来するDNA を表す点のクラスターは、主成分(PC)スコアの二次元プロットにおいて、ほぼ完 全に分離された。これは、DNA中の有意なそして特異的な構造的改変が、正常組 織のBPHへの進行、および正常組織の前立腺ガンへの進行において生じ、そして この改変は2つの進行のそれぞれに特有であることを示す。構造的変化は、主に 、核酸、ホスホジエステルおよびデオキシリボース構造の振動を表すスペクトル 領域に反映される。BPHまたは腺ガンに対する正常前立腺の分離および分類は、 赤外スペクトルのロジスティック回帰モデルを使用して、示される。同様に、DN Aスペクトルのロジスティック回帰モデルを本明細書中で使用して、BPHと前立腺 ガンとの間の関係を評価する。 前立腺組織由来のDNAの本特徴付けにおいて、主成分分析(PCA)により分析され る赤外スペクトルの波数−吸光度関係を、空間中の点として表わす。各点は、DN Aの機能的な群の振動運動および回転運動を変化させ、したがってこの点の空間 的配向を変化させる、DNAの構造的改変の高度に識別可能な尺度を表わす。前立 腺組織へのPCA/FT-IR技術の適用は、正常な前立腺組織、BPHおよび腺ガン(前立 腺ガン)由来のDNAを表す点のクラスターの実質的に完全な分離を提供する。BPH および前立腺ガンへの正常な前立腺組織の進行は、明確に異なるDNAにおける構 造的変化を包含するようである。赤外スペクトルデータのロジスティック回帰に 基づくモデルを使用して、組織がBPHまたは腺ガンである確率を計算する。驚く べきことに、このモデルは、正常対ガンおよび正常対BPHの分類に関しては100% の感受性および特異性を、そしてBPH対ガンに関しては100%近い感度および特異 性を有する。したがって、本発明は、PCA/FT-IR技術が、危険予知および臨床適 用についての適用可能性を有する、正常な前立腺組織、BPHおよび前立腺ガンの 間を識別するに強力な手段であることを示す。 本発明の最もポピュラーな使用は、ガンに関して個々の生物の健康を評価する ことであり得るようであるが、他の使用も存在することは種々の分野の当業者に 明らかである。例えば、本発明は、環境災害(environmental hazard)の分析を可 能にする。遺伝子毒性が未知である環境へ曝された後の生物のDNAを(本明細書に 記載のとおりに)分析し、そしてそのプロフィールを、その環境への導入前のそ の生物のDNAから得られるプロフィールと比較すること(または、非汚染環境中の 生物と比較すること)によって、その環境の遺伝子毒性の評価を行い得る。好ま しい実施態様において、非汚染環境中の生物の種は、遺伝子毒性が未知である環 境中の生物の種と同一である。本明細書中で使用する場合、用語「非汚染環境」に は、化学的に汚染されていないかまたは特定の汚染物質が存在しないことを包含 する。 重要なことに、実施例は、FT-IR/統計学的技術の使用が、形質転換された細胞 の出現前に、DNAにおける構造的変化を同定することについて、かなりの見込み を有することを示す。これらの変化が使用され、生物学および医学における潜在 的に広範な適用を有する疾患確率モデルを確立し得る。 他の適用 本明細書中に記載されるFT-IR/統計学的技術は、生物学的システム(ここでは 、 DNA構造における変化が、疾患の進展において重要な役割を果すことが知られる かまたはそのように疑われる)に集中している。本発明の方法が向けられ得る注 目すべき例は、種々の形態のガン(参考文献2、4-6、8、9)、アルツハイ マー病(参考文献10)、糖尿病(参考文献11)心臓病(参考文献12)およびパー キンソン病ならびに他の神経変性疾患(参考文献13)を含む。DNA変化はまた、 電磁場とガンとの間の推定上の関係(参考文献14)、不妊症(参考文献15)、放 射能の影響(参考文献16)、老齢化(参考文献17)、薬物の薬物動態学的評価( 参考文献18)、および培養細胞における遺伝的変異(参考文献14)において潜在 的に重要である。さらに、異なる塩基配置を有するオリゴヌクレオチドをその対 応するスペクトル特性(統計学的モデルによって明らかにされるような)に関連 付けする研究は、遺伝的変化の理解における技術の範囲を広げるために使用され 得る。 限定のためでなく例示のために以下の実施例を提供する。 実施例 実施例において、データの分析を、重心(「S字型」とも称される)モデルに 従った。しかし、PCスコアに関するデータ取得および特徴付け、ならびにクラス ター分析は、楕円モデルと同じである。楕円モデルにおいて、「域内値」PCスコ ア(クラスター分析によって同定されるような)を多変数正規分布(これは、本 質的に、正規(ガウス)ベル型曲線の多変数一般化である)に適合させ、次いで 特定の組織型から得られるベル型曲線を記載する種々の方程式を、判別分析にか け、確率方程式を提供する。市販の統計学プログラム(例えば、SAS)は、適切 なモデルを作成し得、そして生データ(PCスコア)が提供される場合、必要な弁 別分析を実施し得る。より多くのデータが利用可能になるにつれて、SASプログ ラムはより正確な確率方程式を生成する。SASプログラムはまた、未知の定義さ れた状態を有するサンプルからPCスコアを受け取り得、そして次いでこれらの値 を、確率方程式に「挿入して」、そのサンプルのスコアが所定の定義された状態 を有する確率を提供する。多くの統計学の教科書もまた、弁別分析および多変量 正規ベル型曲線の構築の説明を提供する。 図14は、顕微鏡分光計(System 2000、Perkin-Elmer Corp.,Norwalk,CT)の FT-IRの写真および模式図、ならびにDNA構造を解明するためのその使用を提供す る。引き裂いた組織から抽出したDNA(10〜15μg)を凍結乾燥する。乾燥してフ ワフワしたDNAを、メスで剥離される薄く、透明なフィルムを形成するように顕 微鏡スライド上に圧延し、そしてBaF2ウィンドー上に置く。可視ビームが光路上 に導入される場合、顕微鏡を、フィルムへ焦点を合わせる。開口部へ挿入して、 直径>100μmの10の均一な領域を選択する。赤外ビームを光路上で切り換えそし て各領域を通して焦点を合わせ、BaF2ウィンドー上のバックグラウンドスキャン 後、2000と700cm-1との間でスキャンする。検出器中に記録された干渉写真は、 吸光度スペクトルヘフーリエ変換されている。各スペクトルに基準線を引き(20 00と1700cm-1との間の最小吸光度を中心とする、11の波数に亘る平均吸光度が、 全吸光度から減算される)、そして次いでサンプルの光学特性(例えば、フィル ム厚に関連する)について調整するために規格化する(基準線を引いたスペクト ル吸光度全体は、1750と700cm-1との間の平均で除算される)。これらの手順は 、S-PLUS統計学的パッケージ(Mathsoft Corp.,Analysis Products Division,S eattle,WA)における単純な機能によって実施され得る。究極的に、総平均は、1 つの型の組織(例えば、健康な前立腺)のDNAについて得られる。これは、別の 型の組織(例えば、前立腺ガン)の総平均と統計学的に比較され得る(4)。( 図14A)2つの重ねられた総平均スペクトル。1700と1450cm-1との間の吸光度値を 、ヌクレオチド塩基のC-O伸び振動およびNH2曲げ振動に割り当て、そして、1450 〜1300cm-1を、NH振動およびCH平面内変形に割り当てる。PO2 -構造の非対称伸び 振動は、約1240cm-1で生じ、デオキシリボースの振動は、一般に1150と950cm-1 との間の吸光度値に割り当てられる(6);(図14B)P値を不等分散t検定を使 用して各波数について得た。P値≦0.05(1590〜1510cm-1および1060〜1010cm-1 の領域 に示される)は、DNAサンプル間のスペクトル上/構造上の差異について明らか である。 実施例1 前立腺ガン A.組織入手、DNA単離およびPCA/FT-IRスペクトル分析:摘出後、各組織を液 体窒素中で素早く冷凍した(flash frozen)。全ての組織を、使用に先立って−80 ℃に保ち、そして酸化を防ぐために抽出手順の間、純窒素雰囲気下でDNAを保持 した。DNAをこの組織から単離し、そしてFT-IR分光用にアリコート(約20μl)に 分割した。各DNAサンプルを、凍結乾燥により完全に乾燥し、純窒素でパージし 、そして真空密閉ガラスバイアル中に−80℃で貯蔵した。合計31の組織サンプル を使用した。事故死した個体から得た前立腺組織の5つのサンプルを、組織学的 に検査し、そして正常であることを確認した。これらはコントロールとして用い た。良性の前立腺肥大(BPH)の18のサンプルと、腺ガン(ガン)の8つのサンプル を試験サンプルとして用い、各サンプルは組織学的に同定された病変の部分を含 む。全てのサンプルを、Cooperative Human Tissue Network,Cleveland,OH、 から関連の病理データとともに得た。 I-series顕微鏡を備えるPerkin-Elmer System 2000(The Perkin-Elmer Corp. ,Norwalk,CT)を用いてIRスペクトルを得た。PCA/FT-IRスペクトル分析に関し て、各スペクトルを、上記のように1750〜700cm-1の範囲にわたって規格化した 。これにより、平均が1.0である各波数に関する相対吸光度値を得た。ユークリ ッド距離を、全体のスペクトルに関してか、または準領域(sub-region)かどちら かの1対のスペクトル間の差を定義するために用いた。この基準距離測定を、考 慮した波数(例えば、全体のスペクトル領域1750〜700cm-1に関して1051)それぞ れにおけるスペクトル間の吸光度の差の平方和の平方根として定義する。ユーク リッド距離はまた、パーセントとしてより記述的な形式で表現され得る。このパ ーセントの分子は、所定の領域に関する波数の数の平方根で除されたユークリッ ド距離である。任意の領域について、このパーセントに関してここで用いられる 分母は、1750〜700cm-1の間の平均規格化吸光度であり、これはどの場合におい ても1. 0である。 主成分(PC)分析(PCA)を、変数(各波数におけるスペクトル吸光度)の元の長い リスト中のほとんどの情報を捕捉する数個の変数(成分)を同定するために用いた 。この変数の数の減少は、多くの個人のテストの点数(例えば、読解と算術)が単 一の学業成績に統合される、教育の試験方法に類似している。4つのPCスコア( 例えば、4次元)は、規格化されたスペクトルの1051次元を記述するのに十分で あることが見出された。PCスコアは、各スペクトルから減算された全てのスペク トルの総平均を用いて計算された。ノンパラメトリックSpearman相関係数は、患 者の年齢およびGleasonスコアとのPCスコアの関連を評価するために用いられた 。ノンパラメトリック分析は、いくつかの分布が歪んでいるか、または正規分布「 ベル型」ではないために使用され、この歪みはPearson相関係数から推定される 場合、統計学的有意性に偏りを導き得る。 2つの症例(これは域外値であった)を、これらの分析から除外し、29の症例を 残した。除外されたBPHサンプルおよび除外されたガンサンプルは、含まれた症 例とは大きく異なるスペクトルを有していた。最も類似するスペクトルからのそ れらのユークリッド距離は、それぞれ52%および41%であった。他のスペクトル の全ては、それらの「最近傍の」スペクトルと、せいぜい21%異なり、スペクトル の大半は11%未満だけ異なっていた。2つの域外値スペクトルは、1650cm-1の付 近の領域に劇的に減少した吸光度を示し、核酸の振動を表していた。 Kruskal-Wallis検定およびMann-Whitney検定を、3群が類似の多様性を有する かどうかを決定するために用いた。多様性を、その群の重心までのスペクトルの 平均距離として定義した。順列検定を、3群が別々にクラスターを形成する(群 におけるスペクトル特性の内部類似性を表す)傾向があるかどうかを決定するた めに用いた。自身の群(正常、BPHまたはガンのいずれか)内で、その最近傍のも のまでの各スペクトルの距離を計算し、そして全てのスペクトルに関して、これ らの最近傍距離の平均を検定統計量とした。この検定を、群のメンバーとしての 標識を102回ランダムに並べ替えて、各回ごとに検定統計量を再計算することに より実行した。群のランダムな再標識によって得られたものより小さな最近傍ス ペクトルまでの測定距離は、クラスター形成の指標である。この検定のノンパラ メトリックな順位をベースとするものを、順位として各距離を表現することによ り実行した。各スペクトルに関して、他のスペクトルまでの距離を順位付けし、 そして順列検定を、距離を順位に置き換えたこと以外は上記のように行った。こ の検定統計量は平均順位である。再度、ランダムな並び換えから得られた平均よ り小さな観察された平均順位は、クラスター形成の指標である。距離を用いた検 定および順位を用いた検定の両方を全体のスペクトル(1750〜700cm-1)およびい くつかの準領域に関して実行した。 最終的に、ロジスティック回帰分析を、PCスコアがDNA群の対(正常対BPH、正 常対ガン、およびBPH対ガン)の間で識別するために用いられ得るかどうかを決定 するためのモデルとして用いた。ロジスティック回帰分析は危険スコア(これは PCスコアの線形結合である)、およびサンプルが、想定された2群のうちの1つ である予想確率(例えば、BPHが正常と比較された場合にBPHである確率)を与える 。これらの予想確率は、選択された確率カット点とともに、サンプルを分類する ために使用され得、そして感度および特異性、または正確に分類されたサンプル の割合の推定値を提供し得る。各分析に関して、カット点は感度および特異性を 共に最大にするように選択された。 B.PCプロットにおけるクラスター形成:PCA/FT-IRスペクトル分析は、1051 の波数にわたってスペクトル変動の合計90%を説明する4つの成分(1症例当た り4つのPCスコア)を与えた。すなわち、29のスペクトルの特徴の大半は、4つ のPCスコア(PC1、PC2、PC3、PC4と称される)で記述され得る。最初の2つのPCス コアは変動の76%を説明し、そして2次元表示(図1)に関して適切であった。図 1は、3群が異なってクラスター形成されたことを示す。この分析から除外され た2つの域外値もまたこのプロットに表示され、そして主要なクラスターの右に 現れる。 域外値点から他の点までの実際の距離は、他の次元によって表される差のため に、この2次元プロットに示される距離よりも大きい。群のクラスター形成の順 列検定(1750〜700cm-1)は、距離計測に基づて、P=0.1を与え、そしてノンパラ メトリック順位技法を用いた場合、P=0.01を与えた(表1)。順位法によって得 られたより大きな有意性は、それらの群のコアから1つまたは2つの症例の相対 的分離(順位計測以上に距離計測に影響する配置)に起因する(図1)。これらの技 法を用いて、有意なクラスター形成が2つのスペクトル領域に関して得られる: 1174〜l000cm-1(ホスホジエステル-デオキシリボース構造のPO2 -およびC-O基の 強い伸張振動に割り当てられる)および1499〜1310cm-1(核酸の弱いNH振動および CH面内変形に割り当てられる)。これらの領域に関する平均距離および平均順位 のP値は、0.02〜<0.001の範囲であった(表1)。得られた有意水準は、3群の 観測されたクラスター形成が偶然起こったという帰無仮説を強く棄却する。全体 として、この発見は、DNAがクラスター形成を生じるように変化し、そして結果 的に正常な前立腺、BPHおよび前立腺ガンDNAの間の識別を示す(図1;表1およ び2)。 詳細な比較は以下の対の群のスペクトル間でなされた:正常対ガン、正常対BP H、およびBPH対ガン。群間での平均規格化吸光度における差の統計学的有意性は 、不等分散t検定を用いて、1750〜700cm-1間の各波数に関して評価された(図2 ;A〜C)。このプロットは2群のそれぞれに関する平均スペクトルの比較および t検定からのP値を示す。P≦0.05である領域は、P>0.05である領域より、偶然 に起因する可能性がさらに少ない群間(例えば、正常対ガン)の差を表す。群間の スペクトル比較のそれぞれは、ホスホジエステル-デオキシリボース構造および 核酸の振動に割り当てられるスペクトル領域における統計学的有意差を示す。ホ スホジエステル-デオキシリボース構造に関する吸光度に有意差を有するスペク トル領域は類似している(約1050〜1000cm-1);しかし、核酸に関連する吸光度は 群間で変化する。すなわち、正常−ガン比較に関して、有意差の領域は主に約14 75〜1400cm-1(C=O伸張およびNH屈曲振動)であるが、一方、正常−BPH比較に関し ては、それは約1600〜1500cm-1である。BPH−ガンに関する比較は約1500cm-1に 集中する。正常−BPH比較およびBPH−ガン比較に関して、有意差は約1175〜1120 cm-1の間に見られ、この領域はPO2基の対称伸張振動を恐らく含む。これらのス ペクトル領域の全ての平均の差は、図2の群当たりの平均スペクトルのプロット から明らかである。構造的な改変は、PCプロット(図1)およびクラスター間の明 確な識別(表1)における、点の空間的な分布の中心である。表1 同じ群の最近傍までの平均距離および非ランダムクラスター形成に関する順列 検定。距離はスペクトル間の%差として表される;102の順列が各スペクトル準 領域に関して行われた。 1同じ群の最近傍までの平均ユークリッド距離を、パーセントとして表した。2 同じ群の最近傍までの各スペクトルのユークリッド距離の平均順位。 C.クラスターの多様性:群の重心までの平均距離として表される3群の多様 性は、有意には異なっていなかった(p=0.8)。しかし、正常前立腺群は、BPH群( 平均距離=14.5%)または前立腺ガン群(平均距離=13.9%)よりわずかに多様で はなかった(平均距離=11.7%)。原発性腫瘍に生じた増加した構造的多様性は、 おそらく悪性の細胞集団を潜在的に引き起こすDNA形態を選択することにおいて 重要な要因である。 D.群の分類:PCスコアは、ロジスティック回帰を用いて群の対を比較する場 合に、患者を数群に分類するために容易に用いられ得る。ロジスティック回帰モ デル(表2)は、PCスコアの値をこの方程式に代入した場合に、危険スコア「R」を 与える方程式である。Rは以下の標準統計方程式によって確率に変換される:確 率=exp(R)/[1+exp(R)]。カット点が選択され、そして確率がこのカット点を上 回った場合、この症例はBPHとして分類される。実際のカット点を以下に記す。 表2に示されるように、正常対ガンおよび正常対BPHに関するモデルは、各群を1 00%および全体として100%正確に分類する(各症例のP値は<0.001であった)。 0.1以上の予想確率について「ガン」と指摘することに基づけば、ガン対BPHに関す る正確な分類率は、90%に近かった。(0.15〜0.41の確率カット点は、BPH対ガ ンの比較において同様の正確な分類率を達成する。)表2のモデルに基づいた予 想確率を図3に示す。個々の危険スコアは適切なPCモデル(表2)を基にし、そし て上記のように、予想確率は危険スコアの数学的関数である。全てのBPHおよび ガンの症例は1.0に極めて近い予想確率を有し、そして全ての正常症例は、BPHま たはガンを正常症例に比較した場合、0.002以下の予想確率を有する。予想確率 におけるこれらの顕著な識別は、図1に示すように、群の明確な分離を確認する 。ガンをBPHと比較する場合、予想されるガン確率は0.42〜1.00の範囲であり、 そして予想されるBPH確率は0.00〜0.65の範囲であった。 分析から省略された2つの域外値は、この発見を支持する傾向にある。域外値 BPHおよびガン点はPCプロットの右にある(図1)。これは、正常からBPHおよび正 常からガンへの進行で見られる同じ方向であり、域外値DNAがより高い構造改変 を有することを示唆する。表2に示されるモデルが2つの域外値を分類するため の用いられる場合、BPH域外値は、正常対BPHのモデルを用いて、1.0に近い予想B PH確率で正確に分類される。ガン域外値もまた、1.0に近い予想BPH確率で正常対 ガンのモデルにおいて正確に分類される。BPH対ガンのモデルにおいて、BPH域外 値は0に近い予想ガン確率で正確に分類される;しかし、ガン域外値は0に近 いガン確率でBPHとして誤って分類される。表2 BPH(対正常)、ガン(対正常)およびガン(対BPH)の確率に関するロジスティック回 帰モデル。正常、n=5。BPH、n=17。P値は、各モデルが群メンバーを予測し ないという帰無仮説に基づく。P値は、偏差値の変化に基づいてカイ2乗検定か ら計算される。 *症例の確率が特定の群に分けられるという帰無仮説に関するP値は、PCスコア に無関係である。 E.年齢とGleasonスコアとの関係:年齢は、これらの群間の顕著な識別の生 成に関する因子ではないようである。しかし、前立腺ガンの発生は、50歳を超え ると顕著に増加する。これらの3群の年齢の範囲は、正常について16〜73歳(n =5);BHD、58〜73(n=17);およびガン、61〜76(n=7)であった。年齢と4 つのPCスコアの各々とのSpearman相関の間には、統計的有意性はなかった(P<0 .05)。全てにおいて、これら3群の各々において、ならびにこれらの群の全ての 対(例えば、正常とBPH組織との組み合せにおける各PCスコアに相関する年齢)に おいて、および29症例のプールされたセット全体において、各PCスコアに相関す る年齢からなる28の相関が考慮された。Spearman相関は、大きさが0.01〜0.59の 範囲(P=0.09〜P=1.0)であった。最も有意な相関は、正常とガンとを組み合 わせた群における年齢とPC4との間でr=−0.51であった(P=0.09)。PC4がロジ スティック回帰分析から除外され、そしてモデルがPC1〜PC3に基づく場合、表2 のP値に対応するP値は、上から下へ、P<0.001、P<0.001およびP=0.005 であり、これは、これらの群間の非ランダムな識別を再度支持した。PC4に基づ くこれらの結果、および年齢と他のPCスコアとの間の弱いまたは有意でない相関 は、これらの群間を識別するためのスペクトルの使用可能性における、年齢のい かなる役割も支持しない。 腫瘍の状態を分類するための微視的に表される構成的変化を使用するGleason スコアは、PCスコアとほとんど関連性を有さなかった。しかし、n=7のガン症 例に基づけば、強い関連性以外を検出する制限された力が存在した。PCスコア1 〜4とGleasonスコアとのSpearman相関は、−0.49〜+0.26の範囲(P=0.2〜0.8 )であった。 F.確率のロジスティック回帰モデル:前立腺についてのS字状曲線(図3)は 、正常状態およびガン状態と正常状態およびBPH状態との間で急激な移行を示す 。これらの移行は、中間的確率の症例の欠如により特徴づけられ、これは、図1 におけるこれらの群の明確な分離に対応する。従って、DNAの修飾におけるいく つかの点で、ガン確率の急速な増加を導く重要な構造変化が、明らかに起きる。 BPHは、前立腺ガンに病因学的に関連することは知られていない。しかし、BPH 対前立腺ガン曲線(図3C)が中間的確率を有するいくつかの場合を示すことは興 味深い。図1における症例の相対的配置はまた、BPHが前立腺ガンの直接の前兆 であるという議論のある見解に対するいくつかの洞察を提供する。この知見は、 正常群から始まり、BPH群がガン群を「超えて」位置するというこのコンセプトを 支持しない。この位置付けは、BPHからガンへの移行が、ガンと関連することが 示されているいくつかのスペクトル遷移の逆転を伴うこと、またはガンへの進行 における逆転を模倣するBPH DNAのさらなる変化が存在することを示唆する。あ るいは、修飾により、種々の非新生物病変(BPHを含む)を導くDNA構造をもたらし 得る。BPHは、前立腺ガンの直接の前兆であり得ないが、PCA/FT-IRスペクトル分 析は、BPH DNAの構造的状態に基づいて、前立腺ガンの発生を予期する有望な手 段を提供し得る。 正常対ガンの曲線および正常対BPHの曲線における移行状態の不在は、興味深 い。これは、0%と100%確率との間のDNA値を有する「移行」組織(図3、A〜C) が本研究の部分でなかった事実のためのようである。 前立腺での証拠は、DNA構造が、微環境における因子(特に・OH)に応答して進 行的に変化することを示唆し、この因子は、議論上、細胞病変、前立腺腫瘍(腺 ガン)およびBPHの発達に病因学的に関連するようである。これらの組織の遺伝的 不安定性または同様にガンの危険性の増加を未然に防ぐか治すための介入は、細 胞のレドックス状態および・OH濃度を制御することに焦点を当てるべきである。 これらのアプローチは、H2O2から・OHへの鉄触媒転化の制御(Imlayら、Science 2 40:640-642,1998);ホルモンのレドックスサイクルによる・OH生成の調節(Hanお よびLiehr carcinogenesis 16:2571-2574,1995)および環境的生体異物(Bagchi ら、Toxicology 104:129-140,1995);ならびに抗酸化剤/還元剤治療(Amesら,P roc.Natl.Acad.Sci.USA 90:7915-7922,1993;Bastら、Am.J.Med.91(Supp l.3C):2S-13S,1991)を含み得る。 実施例2 乳ガン A.組織獲得、DNA単離、およびPCA/FT-IRスペクトル分析:組織を、Seattle 病院およびCooperative Human Tissue Network(Cleveland,OH)から得た。胸部 の侵襲性腺管ガンを有するがリンパ節の関与を有さない(IDC)12人の患者から計1 2の組織を得た。これらのうち、1つは多巣性(第2の病巣は、印環細胞ガンであ り、これは評価されなかった)であり、そして1つは、両側性の乳ガン(その一方 を評価した)。侵襲性腺管ガンを有し、転移性ガンに関して陽性の1以上のリン パ節を有する(IDCm)25人の患者から計25の組織を得た。記載された2つのIDCを 除いて、非転移性群および転移性群には、異常な組織学は起こらなかった。腫瘍 サイズは、病理学報告で記録したように、腫瘍の最大寸法を基準とした。ガンで ない乳組織(RMT)を、乳腺肥大手術(乳房縮小形成術)を経験した21人の患者から 得た。ルーティン的な病理学は、これらの組織にところどころの非新生物(例え ば、線維性嚢胞)病変以外の細胞変化を示さなかった。 摘出後、各組織を液体窒素中でフラッシュ凍結(flash frozen)し、そして−8 0℃で保存した。この組織からDNAを単離し、脱イオン水に溶解し、そしてFT-IR 分光用のアリコートとした(約20μg)。各DNAサンプルを、凍結乾燥により完全に 乾燥し、純粋な窒素でパージし、そして−80℃で、脱気され密封されたガラスバ イアル中に保存した。全てのサンプルを、FT-IR分析で分析した。 IRスペクトルを、1-シリーズ顕微鏡を備えるPerkin-Elmer System 2000(The P erkin-Elmer Corp.,Norwalk CT)を用いて得た。各スペクトルを、2000〜700cm- 1 の各整数波数での吸収により特定した。1750から700cm-1までの間隔(これは、 スペクトルの中の主要な変化を全て含む)のみを、この分析に含ませた。ベース ライン調整および規格化を行った。1つのRMTを2つのセクションで表した。こ れらの2つの調整され規格化されたスペクトルの平均をこれらの分析において使 用した。乗法規格化因子を、1750〜700cm-1での吸光度に適用した。重水素交換 を用いても、吸湿性がDNAのスペクトル特性に寄与することの示唆は見出されな かった。 B.統計的分析:FT-IR分析を用いる全DNA構造の分析のために、主成分分析(P CA)を用いた。PCA方法論は、互いに独立であり、かつ変数のオリジナルの長いリ スト中の大部分の情報を捕捉するいくつかの変数(成分)を発見する目的で、1セ ットの変数に適用される統計的手順である。この方法論は、関係する変数の数を 著しく減少させ得る。PCは、全母集団に対する分散の最大量を占める第1のPC( 変数の一次結合)を見出すことにより総分散を分配する。次いで、PCA方法論は、 第1のPCに依存しない二次結合を見出し、それによってそれは分散の次に大きな 量を占める。この手順は、多くの独立するPCAが、総分散の重要な部分を説明す ることが見出されるまで続けられる。この文脈内で、PCAは、スペクトルの集合 にわたる吸光度−波数変化の主要な特徴を同定し、そしてその変化を簡潔に記述 するための方法であった。 PCAを用いると、スペクトルに対して「構築ブロック(building block)」として 作用するいくつかの成分を同定し得る。PCAの後、各スペクトルは、いくつかのP Cスコアにより表され得る。PCAを、個々のスペクトルから減じられる総平均スペ クトルを用いて行った。分析の前に、データセットの(平均値付近の)総変化の少 なくとも90%を説明するのに十分な成分を保つことを決定した。スペクトル間の 差のいくらかが年齢によるものであるかどうかを決定するために、年齢と各PCス コアとの間の相関を計算した。ガン群および非ガン群(IDCm、IDCおよびRMT)のス ペクトルの関係を視覚化するために、最初の3つのPCスコアに基づいてプロット を構築した。これらの2次元および3次元プロットは、任意の単一の標本データ セットの最も有意な成分のうちの2または3を同時に試験することを可能し、そ して、互いの各データセットの意義ある比較を可能にする。 C.スペクトルプロフィールの主成分分析:スペクトルプロフィールは、IDCm 群のかなりの多様性およびIDC群の同質性を明らかにした。図4は、PCAに基づく スペクトルの3次元表記を示す。このプロットにおける位置は、主にピークの高 さ、幅、および位置として表される吸収スペクトルにより決定される。このプロ ットの上部にはIDCのコアクラスターが存在する(黄色の丸で示される)。このプ ロットの左下部には2つのIDCがコアクラスターから十分に離れた域外値である 。特に、1)印環細胞ガンの第2の病巣を有するIDC、および2)両側性の乳ガン が存在する。このプロットから明らかなように、IDCmクラスター(マゼンタ)およ びRTMクラスター(青)は、コアIDCクラスターよりかなり大きく、これは、かなり のスペクトル多様性を示す。 クラスターのサイズは測定され得、そしてそのスペクトルの多様性は、クラス ターの重心からのメンバーまでの平均距離により表され得る。この距離は、クラ スターメンバーと、そのクラスターの平均スペクトル(その重心に位置する)との 間の、波数当たりの規格化された吸光度におけるおよその%差として表され得る 。%差として表される距離は、以下のように計算される:a)1750〜700cm-1の波 数にわたる規格化された吸光度における差の二乗平均を100%に合わせ、次いで これを、b)1.0(大部分のスペクトルに対する近似平均規格化吸光度)で割る。ク ラスターサイズの比較のために、各群の重心から異常に離れた距離に位置する3 つのRMT、3つのIDCmおよび2つのIDCを、RTM、IDCmおよびIDCのコアクラスター を規定するために除いた。全ての域外値は、これらのクラスターの任意のメンバ ーとは少なくとも20%の差を有した。残りの症例の重心および距離に基づいて、 スペクトル多様性(重心からの平均距離)は、IDCm群について12.4%、IDC群につ いて7.3%、およびRMT群について9.2%であった。群間の多様性の差についての およそのP値は、域外値を除いた中心までの距離を比較するMann-Whitney検定に 基づいた:IDC対IDCmについてP=0.003、RMT対IDCmについてP=0.04、およびR MT対IDCについてP=0.4。(これらのP値は、距離間の依存性が、共有重心の計 算により導入されるので近似値である。) 58サンプル(RMT、N=21;IDCm、N=25;IDC、N=12)の初期PCAに基づいて 、4つの域外値を検出した。すなわち、FT-IRスペクトルが群の残りのものから 著しく離れ、かつ域外値のPCスコアを有した標本を検出した。PCAを繰り返して 、まずこれらの4つの域外値を除去した。次いで、PCスコアを、他と同様の方法 でこれらの域外値について計算した(54サンプルの総平均スペクトルを減じ、次 いで各々の残余のスペクトルをPC固有ベクトルに投影する)。54サンプルの吸光 度における変化の91%が最初の5つの成分により説明されることが見出された。 これは、スペクトル間の変化が高度に体系化されることを意味する。1750から70 0cm-1までの1051の波数は、1051次元の変化を潜在的に構成する。この変化の90 %超が、わずか5次元により表され得る。 PCスコアと年齢との弱い相関のみが存在したが、いくつかの相関は、組合わさ れた全てのサンプルについて統計的に有意であった。年齢とPCスコアとの間の相 関は、以下の通りであった:成分および年齢についてr=0.21(P=0.1)、成分2 についてr=0.29(P=0.003)、成分3についてr=0.03(P=0.8)、成分4につ いてr=0.25(P=0.06)、および成分5についてr=0.30(P=0.02)。これらの 相関の小ささは、年齢によるスペクトル構造への影響は非常に小さいことを示唆 する。さらに、統計的に有意な相関(PC-2およびPC-5)でさえ、人為的結果である ようである。なぜなら、ガン群および非ガン群それぞれにおけるPCスコアと年齢 との間の相関は、非常に弱く(大きさが0.18未満)、そして有意でない(最小P=0 .4)からである。実質的に真の相関の検出を可能にするべく全ての群について年 齢の範囲が広い:全てのサンプルについて17〜89、ガン(IDCmおよびIDC)につい て26〜89、およびRMTについて17〜63。PCスコアと陽性のリンパ節の数または割 合との統計的に有意な相関もなかった。 図5Aは、図5Bに示される3次元PCAプロット上にて近接して位置する2つ の「域外値」(図4における「A」および「B」)の重ねたスペクトルを示す。実際の ス ペクトルは、規格化された吸光度平均でわずか3%異なり、スペクトル表現型の 特徴付けにおいて高い精度を示唆する。前述の2つのIDC域外値はまた、スペク トルプロフィールがコアIDCクラスターとは異なる。図6Aおよび6Bは、IDCコ アクラスターの平均規格化スペクトル上に重ね書きされたこれら2つのスペクト ルを示す。スペクトル領域の大部分にわたって差異が著しいが、特に以下の領域 において差異が著しい:1700〜1350cm-1、約1240cm-1でのピーク、および約1180 〜900cm-1。これらの領域は、一般的にその塩基のN-HおよびC-O振動、ホスホジ エステル基のPO2非対称伸縮振動、およびデオキシリボースのC-O振動を表す。 関連するデータセット(例えば、IDC標本)の重心が計算され得、ここで、その 重心は特定の種の標本に関連するスペクトルの加重平均とみなされることは、上 記された。このような活量は、分析された3つのタイプの標本のPC1およびおよ びPC2値について図7に示される。この図において、RMT標本の重心からIDC標本 の重心へのベクトルが、このグラフの左側に示され、そしてRMT状態からIDC状態 へのスペクトルプロフィールのシフトを表す。この方向は、初期の方向を継続し 、そしてIDC重心からIDCm重心へのベクトルとの比較のための参照を確立する。 ベクトル回転の程度(RMT-IDCベクトルと比較して)を表3に示す。 表3 従って、IDC状態からIDCm状態へのDNAへの効果が、分析されたスペクトルにわ たって広がるだけでなく、比較的一貫性があることが理解され得る。さらに、こ の方向の変化の暗示は、DNAへの攻撃が続くにつれて、明確な、定量可能な、 そして予想可能なDNAスペクトルプロフィールの、1つの状態から別の状態への 動きがあるという主張に支持を与える。 図8および9は、標本の3つの種の間におけるスペクトルの区別を強調するた めに提供されている。図8において、それぞれの種についてのそれぞれの重心に 対するスペクトルが示される。これらの曲線から総平均を引算した後、図9にお いて最もよく示されるように、それぞれの種についての平均の偏差が、種の間で 特徴的な固有のスペクトルを容易に識別可能にする。 図10においては、FT-IRで得られたデータセットを用いて、一般的にS字形 の曲線が確立される。非ガンからガンへの移行はシャープであり、このことは、 曲線上のサンプルの「位置」に依存して、ガンの発現は、究極的には比較的小さい 刺激により開始され得ることを示している。 D.組織獲得および長期間貯蔵のための別の手段:FT-IR分析のための種を得 るためおよび保存するための上記の方法に対する代替的手段としては、獲得およ び初期の調製の後に、種をパラフィンブロックに包埋することが望ましい場合が ある。標本の分析が望ましい場合、パラフィンに包埋された組織(PET)は、脱ワ ックスされ、そして通常の技術(例えば、フェノールおよび/またはクロロホル ム溶液の適用)を用いることにより、DNAが単離される。標本の純度を測定した後 、FT-IRによる分析のために、DNAは、水溶液中に配置され、真空下で乾燥され、 そしてフッ化バリウムウインドウに塗布される。 スペクトル分析のためのPET標本の使用は、DNA分析のために利用可能なサンプ ルの数を非常に増大させる。なぜならそれは、分析のための特殊なバイオプシー を待ち、そして得ることを必要とせず(標本は、最近においては、容易に貯蔵さ れ得そして取り出され得る)、そして同一組織標本の遡及的なフォローアップ研 究が迅速かつ経済的に行われることを可能にするからである。 実施例3 肝臓ガン A.材料および方法:比較的清浄な田舎の環境[Quartermaster Harbor、WA]お よび化学的に汚染された都会的な環境[Duwamish River、Seattle、WA]から、イ ングリッシュソウル(English sole)を得た。それらの肝臓を組織学的に試験し、 そしてガンがないことが分かった。しかしそれらは、汚染された環境由来の魚に 特徴的な様々な非腫瘍性の病変を含んでいた。 Duwamish Riverは、重工業地帯を通って、Puget Soundに流れ込む。沈殿物は 様々な発ガン物質および他の生体異物(例えば、多核芳香族炭化水素および塩素 化除草剤残留物)を含む。しかし、修復プログラムは、沈殿物汚染を減少させる ように進行中である。 2つのソウルの群(DUW93、n=8;およびDUW95、n=10)を、Duwamish Riverから 得た。修復プログラムのために、DUW95サンプルは、DUW93サンプルよりも顕著に 少ないが、QMHサンプルよりは多い沈殿物汚染を反映することが予想される。Qua rtermaster Harbor、WAからの魚は、コントロールとしての役割をした(QMH、n=7 )。QMH、DUW95およびDUW93の魚の長さ±SDは、それぞれ、29.5±4.2cm、23.6±1 .6cm、および24.1±0.8cmであった。重量は、254.3±115.0g、125.6±16.2g、お よび125.0±22.5gであった。 肝臓組織からのDNAの単離およびFT-IRスペクトルのPCA分析を、上記のように 行った。それぞれのFT-IRスペクトルを、1750〜700cm-1の範囲にわたって規格化 した。PCAを使用して、オリジナルの、長いリストの変数(1750から700cm-1まで の1051の波数のそれぞれでのスペクトル吸収)のほとんどの情報を捕捉するいく つかの変数(成分)を同定した。PCスコアは、それぞれのスペクトルから引き算さ れた全てのスペクトルの総平均で計算された。従って、PCスコアは、総平均スペ クトルから異なるにつれて、スペクトルの(構造的な)特徴の変動を示す。Kruska l-Wallis(KW)検定およびMann-Whitney(MW)検定を使用して、PCスコアの群間の相 違の統計的な有意性を計算した。同じ手順を用いてスペクトル多様性の相違につ いて検定し、これは、群について、スペクトルから群重心までの平均距離として 規定された。不等分散t検定を用いて群間の平均規格化吸収を比較した。t検定 は、1750から700cm-1までの1051の波数のそれぞれにおいて行われた。長さおよ び質量に反映される魚の年齢は、強力に交絡する変数であり、そしてこの可能性 は、分析にアドレスされた。 B.結果:図11は、汚染されていないことがわかっている場所から得た標本 (青い球−PC2ラインの左の暗い球);汚染されていることがわかっている領域か ら得た標本(黄色い球−PC2ラインの左の明るい球);および汚染沈殿物を除去す るための有意な清掃および/または環境運動の前の汚染されていることがわかっ ている同一の領域から得た標本(えび茶色の球−PC2ラインの右の中程度の濃さの 球)を用いた、最初の3つのPCスコアについてのPCAを示す。図の精査により理解 され得るように、胸組織において遭遇する分布に似た分布が、魚の肝臓のDNAに 存在する。 最初の3つのPCスコアに由来する点のクラスターは、QMHおよびDUW群からのDN Aのスペクトルの特徴を要約し、3次元投影図に示される(図11)。すべての群がP Cスコアの同一の平均値(従って、同様のスペクトル)を有するという仮説は、棄 却され(KW P値<0.001)、そして任意の2群がPCスコアの同一の平均値を有する という仮説も棄却される(MW P値0.04〜<0.001)。3群は、重なることなく別々 である(図11)。PC1およびPC2は、合わされて、スペクトル変動の94%の割合を占 め、従って遭遇するスペクトルの多様性を示すための良好な手段を提供する。PC 3は、表示目的のために使用される(図11)が、それは、スペクトル変動の3%を 説明するに過ぎない。 群間の相違は、多くの頻度で発生する。図12の各パネルの上部は、2群(QMH-D UW93;QMH-DUW95;およびDUW95-DUW93)のそれぞれについての平均スペクトルを 示す。パネルの底部は、1波数につき1つのP値で、各スペクトル比較について のP値を示す。比較は、1051の波数の78〜87%で、P<0.05を得、従って、DUW93 およびDUW95群からのDNAの構造が、互いに、そしてQMH群から顕著に異なること を実証している。従って、この発見は、実質的に、平均の、規格化されたスペク トルが群間で同じである、という帰無仮説を無効にする。スペクトル相違は、PO2 構造の非対称伸縮振動(≒1240cm-1)に関して顕著である。このスペクトル領域 におけるバンドは、QMH群に存在するが、DUW93およびDUW95群でのスペクトルで は実質的に失われている。他の主要な相違は、核酸(≒1700〜1450cm-1)およびデ オキシリボース(≒1150cm〜950cm-1)に関する振動を示すスペクトル領域におい て明らかである。 PCスコアを基にして、サンプルが100%正確に群に分類され得る(分離される) ことが自明である(図11、表4)。 表4 群による主成分のスコアおよび 群間相違の統計的有意性 図11は、QMH群と比較して、DUW93およびDUW95の群において、スペクトルの多 様性(点の広がりに注意)が実質的に大きいことを示す。群間で変動する多様性お よびそれらを分離するスペクトル相違はまた、図13において明らかである。図13 では、個々のスペクトルまたはそれぞれの群が重ね書きされている。QMHスペク トルの密接性(tightness)およびQMHからDuwamish River群へのスペクトル多様性 の増加は、およそ1700〜1450cm-1の領域で顕著であり、これは、核酸の強力なC- O伸縮およびNH2屈折振動を含む。また、DUW93群において、他の群と比較して、 核酸の弱いNH振動およびCH平面内変形に帰属される、1400cm-1領域での吸収およ びスペクトル多様性の明白な増加がある。およそ1150〜950cm-1の領域は、デオ キシリボースに関する強力な伸縮振動を含み、QMHからDUW95に、スペクトル多様 性が増加するが、DUW93群では、密接している(tighten)。スペクトル特性間の相 違は、表4に示される群間の区別およびおよび図11における増加するクラスター の多様性と一致する。 多様性相違に関する形式的な検定(すべての群が群重心からの同じ平均距離を 有するという帰無仮説についてのKW検定)は、P=0.002を得、群間の等しくない 多様性を強力に示唆している。重心までのこれらの平均距離は、多様性を測定す る尺度を提供する。より大きな平均距離は、群がより広がっていること(図11); すなわち、スペクトルがより多様性であることを示す。DUW95群は、QMH群の平均 距離の4倍の平均距離を有し、4倍大きい多様性を示す(表5)。3つのうち2つ のペア(pairwise)の多様性の比較は有意である(p<0.05);しかしながら、DUW95 およびDUW93の群間の比較は、有意ではない(MW P値=0.2)が、DUW93群(最も変更 された塩基構造を有するDNAを表す)は、DUW95群よりも多様性である。 表5 3群についてのスペクトル多様性 P値についての帰無仮説:(1)3群はすべて、同じ平均多様性、KW P値=0.0 02を有する;(2)平均QMH=平均DUW95、MW P値=0.003;(3)平均QMH=平均DU W95、MW P値=0.2 群の多様性が変化することは、年齢の変数によるものではないようである。QM H群は、長さおよび質量において最も多様性であったが、最小のスペクトル多様 性を示す。QMH群は、DUW95およびDUW93群のそれよりも2〜5倍長い、長さSD、 および5〜7倍大きい、質量SDを示す。しかし、QMHスペクトルからそれらの重 心までの平均距離は、Duwarmish群のそれよりも2〜4倍小さい。年齢がスペク トル多様性の有意な因子であるならば、これらの結果は、非常に矛盾する。長さ および質量もまた、場所によりもたらされるスペクトルの相違における影響をほ とんど有さないようである(図11)。回帰分析において、長さおよび質量の組合せ は、PC1の変動の7%およびPC2の変動の40%を説明するだけである。スペクトル の多様性を説明する際に、PC1は、非常に、より重要な成分である。長さおよび 質量は、全体のスペクトル変動の約9%を説明するに過ぎないが、場所は、77% を説明する。 QMH、DUW95およびDUW93の魚から単離されたDNA構造は、PCプロットが完全なク ラスターの分離を明らかにする(図11)ということにおいてそれぞれ独特である。 さらに、露出された群からのDNAは、実質的に、コントロール群のものよりも多 様性であり、そしてDUW93群は、DUW95群よりも多様性である(表5、図11)。これ らの区別は、有意に年齢関連ではないが、異なる環境因子によりDNA中に誘導さ れる構造的特徴から起こり易い。環境因子の中で、クラスター分離および多様性 の相違に寄与しやすいのは、沈殿物の毒性化学物質への露出のタイプ、程度およ び期間である。スペクトルの領域において3群間に発生する著しい相違は、核酸 およびホスホジエステル-デオキシリボース構造に帰属され(図12および13)、こ れらの構造の変化がクラスターの分離および群間の多様性の相違に実質的に寄与 したことを示唆している。 2つのDuwamish River群を代表するクラスターの多様性には、参照群の密な(t ight)クラスターと比較して、統計的に有意な増加があった(図11、表5)。増加 した多様性は、それが悪性の細胞表現型を生じるDNA形態の選択のためのステー ジを設定するという点で、発ガンにおいて特に重要であり得る。露出された魚群 の高度の多様性は、同じ機能を果たし得る。 PCプロットのクラスター分離は、上記、前立腺ガン(実施例1)および乳ガン( 実施例2)の研究で記載された。例えば、前立腺において、正常組織からのDNAお よび腺ガン組織からのDNAの間で完全な区別が達成された。同様に、本実施例に おいてもクラスター間での完全な区別が得られ、これによりDNA構造が、DNAの新 しい形態を示す独特な特性を有することが実証された。Duwamish Riverの魚が肝 臓腫瘍になり易いことを考慮すると、DUW95およびDUW93群に見いだされたDNAの 明確に異なる形態は、ガンの進行において、重要なステージを構築するようであ る。 本実施例は、環境化学物質に露出されたイングリッシュソウルのDNAへの損傷 が、DNAの新たな、多様な形態を導くことを示している。これらの新たな形態は 、 発ガンにおいて中心的な役割を果たし得、そして究極的には、魚の集団における 肝臓ガンの発生に寄与し得る。さらに、この結果は、環境化学物質が、上記の、 乳ガンおよび前立腺ガンに見いだされるDNAの新たな形態を生成する役割を果た すかどうかの問題を提起する。 本明細書中に記載されたすべての刊行物および特許出願は、本明細書中におい て、同じ範囲において、それぞれの個々の刊行物または特許出願が特別にそして 個々に参考として援用されるかのように、参考として援用される。 前述したことから、説明の目的のために、本発明の特定の実施態様が本明細書 中に記載されたが、様々な改変が、本発明の精神および範囲から離れることなく なされ得ることが明らかである。

Claims (1)

  1. 【特許請求の範囲】 1.組織の状態を規定する方法であって: (a)第1の複数の組織サンプル由来のDNAをフーリエ変換−赤外(FT−I R)分光にかけてFT−IRスペクトルデータを作成する工程; (b)工程(a)のFT−IRスペクトルデータを主成分分析(PCA)により分析 して、主成分(PC)スコアを提供する工程; (c)クラスター分析を工程(b)のPCスコアに適用して、域外値および非域外 値の組織サンプルを識別する工程;および (d)非域外値組織サンプルからのPC値と最良に適合する多変量型の正規ベル 型曲線を規定する、第1の方程式と呼ばれる、方程式を作成する工程であって、 該第1の方程式は、該第1の複数の組織サンプルの状態を規定する を包含する、方法。 2.第2の複数の組織サンプルを用いて工程(a)〜(d)を繰り返して、第2の方 程式を提供する工程をさらに包含し、該第2の方程式が、該第2の複数の組織サ ンプルの状態を規定する、請求項1に記載の方法。 3.多変量弁別分析を前記第1および第2の方程式に適用して、それぞれ第1お よび第2の確率方程式を提供する工程をさらに包含する、請求項2に記載の方法 。 4.請求項3に記載の方法であって、 (e)目的の状態を有する組織からのDNAサンプルを、FT−IR分光にかけ て、FT−IRスペクトルデータを作成する工程; (f)工程(e)のFT−IRスペクトルデータをPCAによって分析して、1セ ットのPCスコアを提供する工程;および (g)工程(f)のPCスコアを、前記第1および第2の確率方程式のそれぞれと 組み合わせて、それぞれ第1および第2の確率スコアを提供する工程 をさらに包含する、方法。 5.前記組織が、乳房、泌尿生殖器、肝臓、腎臓、膵臓、肺、血液、脳または結 腸直腸の組織である、請求項1に記載の方法。 6.前記組織がガン性組織である、請求項1に記載の方法。 7.前記組織が、ガン性の乳房、前立腺、卵巣、または子宮内膜組織である、請 求項6に記載の方法。 8.環境の遺伝子毒性を評価する方法であって: (a)第1の環境における複数の第1の生物に由来するDNAを、フーリエ変換 −赤外(FT−IR)分光にかけて、FT−IRスペクトルデータを作成する工 程; (b)工程(a)のFT−IRスペクトルデータを主成分分析(PCA)により分析 して、主要成分(PC)スコアを提供する工程; (c)クラスター分析を工程(b)のPCスコアに適用して、域外値および非域外 値の生物を識別する工程;および (d)非域外値生物からのPC値に最良に適合する多変量型の正規ベル型曲線を 規定する、第1の方程式と呼ばれる方程式を作成する工程であって、該第1の方 程式が該第1の環境中の該第1の生物を規定する、工程 を包含する、方法。 9.請求項8に記載の方法であって、 第2の環境からの第2の生物を用いて、工程(a)〜(d)を繰り返して、第2の 方程式を提供する工程であって、該第2の方程式が該第2の環境中の該第2の生 物の状態を規定する、工程 をさらに包含する、方法。 10.請求項9に記載の方法であって、 多変量弁別分析を、前記第1および第2の方程式に適用して、それぞれ第1お よび第2の確率方程式を提供する工程 をさらに包含する、方法。 11.請求項10に記載の方法であって、 (e)目的の環境に由来する目的の生物のDNAサンプルを、FT−IR分光に かけて、FT−IRスペクトルデータを作成する工程; (f)工程(e)のFT−IRスペクトルデータをPCAにより分析して、1セッ トのPCスコアを提供する工程;および (g)工程(f)のPCスコアを、前記第1および第2の確率方程式のそれぞれと 組み合わせて、それぞれ第1および第2の確率スコアを提供する工程 をさらに包含する、方法。 12.前記第1および第2の環境のうちの少なくとも一方が、汚染された環境で ある、請求項9に記載の方法。 13.前記第1および第2の生物は非同一であるが、前記第1および第2の環境 が同一である、請求項9に記載の方法。 14.前記第1および第2の生物は同一であるが、前記第1および第2の環境が 非同一である、請求項9に記載の方法。
JP50581199A 1997-06-27 1998-06-25 転移性腫瘍および非転移性腫瘍を識別する方法 Pending JP2002508845A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US5111097P 1997-06-27 1997-06-27
US60/051,110 1997-06-27
PCT/US1998/013386 WO1999000660A1 (en) 1997-06-27 1998-06-25 Methods of differentiating metastatic and non-metastatic tumors

Publications (1)

Publication Number Publication Date
JP2002508845A true JP2002508845A (ja) 2002-03-19

Family

ID=21969414

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50581199A Pending JP2002508845A (ja) 1997-06-27 1998-06-25 転移性腫瘍および非転移性腫瘍を識別する方法

Country Status (6)

Country Link
US (3) US6214550B1 (ja)
EP (1) EP0991932A1 (ja)
JP (1) JP2002508845A (ja)
AU (1) AU8172998A (ja)
CA (1) CA2294242A1 (ja)
WO (1) WO1999000660A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006038511A (ja) * 2004-07-23 2006-02-09 Tokyo Univ Of Agriculture & Technology 土壌分析方法及び土壌分析装置
JP2010151823A (ja) * 2007-04-02 2010-07-08 Univ Hospital Of North Staffordshire Nhs Trust Copdの判定方法およびそれに使用する装置
JP2010538273A (ja) * 2007-08-31 2010-12-09 エムディーエス アナリティカル テクノロジーズ 相関する変数および畳み込みピークを識別する方法、およびシステム
JP2018534587A (ja) * 2015-09-10 2018-11-22 ビームライン ダイアグノスティックス リミテッドBeamLine Diagnostics Ltd 細胞それぞれが産生するftirスペクトルによって細胞を同定又は分類することから成る、サンプルを分析するための方法、コンピュータプログラム、及びシステム

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6214550B1 (en) * 1997-06-27 2001-04-10 Pacific Northwest Research Institute Methods of differentiating metastatic and non-metastatic tumors
WO2002071040A2 (en) * 2001-02-16 2002-09-12 Missouri Board Of Curators, University Of Missouri Use of infrared spectroscopy in genotypic analysis
US20030028504A1 (en) * 2001-05-08 2003-02-06 Burgoon David A. Method and system for isolating features of defined clusters
JP2005524124A (ja) * 2001-10-17 2005-08-11 コモンウェルス サイエンティフィック アンド インダストリアル リサーチ オーガニゼーション システムの診断構成要素を識別するための方法および装置
IL146521A0 (en) * 2001-11-15 2002-07-25 Univ Ben Gurion Novel optical method for diagnosis and grading of premalignant and malignant human colonic tissues
DE10315877B4 (de) 2003-04-08 2005-11-17 Roche Diagnostics Gmbh Krankheitsverlaufkontrolle
US20060269972A1 (en) * 2003-08-14 2006-11-30 Ian Smith Method of diagnosing colorectal adenomas and cancer using infrared spectroscopy
US7533070B2 (en) * 2006-05-30 2009-05-12 Honeywell International Inc. Automatic fault classification for model-based process monitoring
US7782202B2 (en) * 2006-10-31 2010-08-24 Corning Cable Systems, Llc Radio frequency identification of component connections
US9606057B2 (en) 2010-06-01 2017-03-28 Todos Medical Ltd. Biochemical analysis of PBMC
EP2707710B1 (en) * 2011-05-11 2022-08-17 Todos Medical Ltd. Diagnosis of cancer based on infrared spectroscopic analysis of dried blood plasma samples
JP5448224B1 (ja) * 2013-03-12 2014-03-19 日本分光株式会社 クロマトグラフィーシステム、信号処理装置、クロマトグラフィー・データ処理端末およびプログラム
EP3004870B1 (en) 2013-05-28 2019-01-02 Todos Medical Ltd. Differential diagnosis of benign tumors
CN105277506B (zh) * 2014-07-18 2018-03-30 重庆医科大学 一种人体大肠癌组织的近红外漫反射光谱快速识别方法
US20190206528A1 (en) * 2017-12-29 2019-07-04 Wipro Limited Method and system for monitoring a patient

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2008831C (en) 1990-01-29 1996-03-26 Patrick T.T. Wong Method of detecting the presence of anomalies in biological tissues and cells in natural and cultured form by infrared spectroscopy
CA2035603C (en) * 1991-02-04 1998-08-04 Patrick T.T. Wong A method of detecting the presence of anomalies exfoliated cells using infrared spectroscopy
US5596992A (en) 1993-06-30 1997-01-28 Sandia Corporation Multivariate classification of infrared spectra of cell and tissue samples
US5440388A (en) * 1993-08-02 1995-08-08 Erickson; Jon W. Chemical analysis and imaging by discrete fourier transform spectroscopy
US5435309A (en) 1993-08-10 1995-07-25 Thomas; Edward V. Systematic wavelength selection for improved multivariate spectral analysis
CA2186751A1 (en) * 1994-03-28 1995-10-05 Donald C. Malins Methods for determining oxidative injury to dna
US5733739A (en) * 1995-06-07 1998-03-31 Inphocyte, Inc. System and method for diagnosis of disease by infrared analysis of human tissues and cells
US5626627A (en) * 1995-07-27 1997-05-06 Duke University Electroconvulsive therapy method using ICTAL EEG data as an indicator of ECT seizure adequacy
US6214550B1 (en) * 1997-06-27 2001-04-10 Pacific Northwest Research Institute Methods of differentiating metastatic and non-metastatic tumors

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006038511A (ja) * 2004-07-23 2006-02-09 Tokyo Univ Of Agriculture & Technology 土壌分析方法及び土壌分析装置
JP2010151823A (ja) * 2007-04-02 2010-07-08 Univ Hospital Of North Staffordshire Nhs Trust Copdの判定方法およびそれに使用する装置
JP2010523964A (ja) * 2007-04-02 2010-07-15 ザ ユニバーシティ ホスピタル オブ ノース スタフォードシャー エヌエイチエス トラスト Copdの判定方法およびそれに使用する装置
JP2010538273A (ja) * 2007-08-31 2010-12-09 エムディーエス アナリティカル テクノロジーズ 相関する変数および畳み込みピークを識別する方法、およびシステム
JP2018534587A (ja) * 2015-09-10 2018-11-22 ビームライン ダイアグノスティックス リミテッドBeamLine Diagnostics Ltd 細胞それぞれが産生するftirスペクトルによって細胞を同定又は分類することから成る、サンプルを分析するための方法、コンピュータプログラム、及びシステム
JP7013376B2 (ja) 2015-09-10 2022-01-31 ビームライン ダイアグノスティックス リミテッド それぞれの細胞が生成するftirスペクトルによって細胞を同定することを含む、サンプルを分析するための方法、コンピュータプログラム、及びシステム

Also Published As

Publication number Publication date
US20010000150A1 (en) 2001-04-05
AU8172998A (en) 1999-01-19
US20040089809A1 (en) 2004-05-13
CA2294242A1 (en) 1999-01-07
US6214550B1 (en) 2001-04-10
EP0991932A1 (en) 2000-04-12
WO1999000660A1 (en) 1999-01-07

Similar Documents

Publication Publication Date Title
JP2002508845A (ja) 転移性腫瘍および非転移性腫瘍を識別する方法
US5945675A (en) Methods of screening for a tumor or tumor progression to the metastatic state
Kelly et al. Biospectroscopy to metabolically profile biomolecular structure: a multistage approach linking computational analysis with biomarkers
Kwak et al. Multimodal microscopy for automated histologic analysis of prostate cancer
Trevisan et al. Extracting biological information with computational analysis of Fourier-transform infrared (FTIR) biospectroscopy datasets: current practices to future perspectives
Baker et al. Investigating FTIR based histopathology for the diagnosis of prostate cancer
Backhaus et al. Diagnosis of breast cancer with infrared spectroscopy from serum samples
US8478534B2 (en) Method for detecting discriminatory data patterns in multiple sets of data and diagnosing disease
Verdonck et al. Characterization of human breast cancer tissues by infrared imaging
Nallala et al. Infrared imaging as a cancer diagnostic tool: introducing a new concept of spectral barcodes for identifying molecular changes in colon tumors
Kwak et al. Automated prostate tissue referencing for cancer detection and diagnosis
Sattlecker et al. Current trends in machine-learning methods applied to spectroscopic cancer diagnosis
Kwak et al. Analysis of variance in spectroscopic imaging data from human tissues
Siqueira et al. A decade (2004–2014) of FTIR prostate cancer spectroscopy studies: An overview of recent advancements
Zheng et al. Sensitivity map of laser tweezers Raman spectroscopy for single-cell analysis of colorectal cancer
Salman et al. Early detection of colorectal cancer relapse by infrared spectroscopy in “normal” anastomosis tissue
Maitra et al. Raman spectral discrimination in human liquid biopsies of oesophageal transformation to adenocarcinoma
GB2545877A (en) Method
Lin et al. Identification of pulmonary edema in forensic autopsy cases of fatal anaphylactic shock using Fourier transform infrared microspectroscopy
Ali et al. A simple model for cell type recognition using 2D-correlation analysis of FTIR images from breast cancer tissue
Lilo et al. Raman hyperspectral imaging coupled to three-dimensional discriminant analysis: Classification of meningiomas brain tumour grades
Khwaja et al. A deep autoencoder system for differentiation of cancer types based on DNA methylation state
Ragazzi et al. Multivariate analysis approach to the plasma protein profile of patients with advanced colorectal cancer
Sammon et al. Spectral Pathology: general discussion
Lancia et al. Learning models for classifying Raman spectra of genomic DNA from tumor subtypes