TW201500553A

TW201500553A - 用於黑色素癌之預後預測之裝置的用途

Info

Publication number: TW201500553A
Application number: TW103127682A
Authority: TW
Inventors: Michael Alan Black; Jonathan Cebon; Parry John Guilford; Thomas John
Original assignee: Pacific Edge Biotechnology Ltd; Ludwig Inst Cancer Res
Priority date: 2007-05-24
Filing date: 2008-05-23
Publication date: 2015-01-01
Also published as: JP2017079765A; AR066725A1; CL2008001517A1; EP3176270B1; JP2015061528A; PT3176270T; TWI582236B; US20100136553A1; NZ555363A; TWI609967B; AU2008253836B2; PT2158332T; UY31105A1; EP2158332A4; EP2158332A1; US8822149B2; SG10201912289SA; SG10201509568QA; EP2158332B1; CA2725602A1

Abstract

本發明係關於預後標記物及預後表徵(signatures)，以及用於測定患者癌症(特別是黑色素瘤)之預後的組合物及方法。本發明特別關於遺傳及蛋白標記物在基於標記物及標記物表徵用於預測諸如黑色素瘤等癌症之進展風險的用途。在各態樣中，本發明提供基於癌症預後標記物(特別是黑色素瘤預後標記物)之方法、組合物、套組及裝置以協助癌症之預後及治療。

Description

黑色素癌之預後預測

本發明係關於用於測定患者癌症(特定言之，係黑色素瘤)之預後的方法及組合物。具體而言，本發明係關於遺傳及蛋白質組標記物之用途，其用於基於預後表徵(signatures)來測定諸如黑色素瘤等癌症之預後。

本申請案主張2007年5月24日申請之紐西蘭臨時專利申請案第555363號之權利，該案之全文以引用的方式併入本文中。

在工業國家裏，黑色素瘤之發病率在過去25年裏穩定地上升，在世界上，澳大利亞之發病率為最高¹。儘管已知「流行性黑色素瘤」最可能代表較多檢測到的薄黑色素瘤²，但黑色素瘤主要影響年輕人群體，並導致生殖壽命(productive-life years)之喪失，其中更以兒童惡性腫瘤及睪丸癌症居先^3,4。黑色素瘤在很大程度上對細胞毒性化學療法⁵、生物製劑^6,7及各種疫苗接種策略⁸無響應。一小分組患者似乎可受益於生物及/或細胞毒性化學療法，但預先識別此等患者在目前尚不可能，此必然會使許多患者暴露於顯著毒性與較低受益可能性。

當黑色素瘤轉移至局部淋巴結時，70%患者會在5年內死亡⁹。可長期存活之患者分組代表一獨特的群體。目前尚無輔助療法可提供總體存活益處，且儘管某些臨床醫師提供干擾素α以改善無病生存¹⁰，但許多國際中心在臨床試驗外尚未提供有效輔助治療。預測不管是否使用輔助療法均能夠保持良好狀態之患者可預防不必要的毒性且能夠研發靶向彼等更有可能獲益者之更佳治療策略。在佐劑臨床試驗中對患者之較佳分級可減少I型及II型錯誤。在ECOG 1684研究及其他隨機化研究後之最近12年間已表明干擾素α可改良TTP但不會改良III期黑色素瘤之總體存活^5,10,11。現在已能良好識別但不能夠加以控制的患者群體之固有異源性可能會使人們對初始ECOG 1684研究¹⁰及其他較小型II期研究中所見的對存活之有利作用感到疑惑。對彼等更有可能復發之患者分級可平衡此異源性且可更精確地比較治療。

人們需要可預測黑色素瘤之預後的其他工具。本發明提供基於癌症預後標記物(具體而言，係黑色素瘤預後標記物)之方法、組合物、套組及裝置以助於癌症之預後及治療。

在某些實施例中，提供一組經識別以在具有良好預後之黑色素瘤及具有較差預後之黑色素瘤中不同表現之標記物基因。此組基因可用於產生能夠預測患者黑色素瘤之進展速度的預後表徵，包括兩種或更多種標記物。

該等個別標記物可受到不同表現，視腫瘤進展是否迅速而定。可藉由將該等標記物一起組合成一預後表徵，提供較單一基因分析更有效之個別測試來增強預測精確度。本發明亦應用諸如下列等技術以產生預測模型：與預後表徵相關之統計學、機器學習、人工智能及數據挖掘。在另一實施例中，存於患者腫瘤中特定預後表徵的標記物表現程度隨後可應用於預測模型以測定該預後。

在某些實施例中，可使用微陣列方法、定量聚合酶鏈反應(qPCR)或免疫測定來確定該等標記物之表現程度。

具體而言，本發明提供用於測定患者黑色素瘤之預後的方法，其包括如下步驟：(i)測定黑色素瘤預後標記物(MPM)或包括兩種或更多種MPM之預後表徵在患者黑色素瘤試樣中之表現程度，(ii)應用一預測模型，該模型係藉由將一預測方法應用於該MPM或該預測表徵在預後良好及較差腫瘤試樣中的表現程度而建立，(iii)確定預後。

或者，本發明亦提供一種測定黑色素瘤患者對藥物試驗之適宜性的方法，其包括如下步驟：(i)測定MPM或包括兩種或更多種MPM之預後表徵在患者黑色素瘤試樣中之表現程度，(ii)應用一預測模型，該模型係藉由將一預測方法應用於該MPM或該預測表徵在預後良好及較差腫瘤試樣中的表現程度而建立，(iii)確定該患者對試驗之適宜性。

該等方法之MPM可選自表1。該預測方法可選自由下列組成之群：線性模型、支持向量機、神經網路、分類與回歸樹、集成學習方法、判別分析、近鄰法、貝葉斯網路(bayesian network)、獨立分量分析。

可藉由檢測每一基因之mRNA表現程度來測定MPM或預後表徵之表現程度，例如，使用qPCR方法使用正向引物及反向引物。亦可藉由檢測每一基因之cDNA表現程度來測定MPM或預後表徵之表現程度，例如，藉由使用與至少一部分該cDNA互補之核苷酸。進而言之，可藉由檢測每一標記物之蛋白表現程度或藉由檢測每一標記物之肽表現程度來測定MPM或預後表徵之表現程度，例如，藉由使用針對每一標記物之抗體(例如，單株抗體或多株抗血清)來測定。可使用三明治型免疫測定方法或ELISA分析。

本發明亦提供用於測定黑色素瘤進展之風險的預後表徵，其包括兩種或更多種黑色素瘤預後標記物(MPM)。該預後表徵之MPM可選自表1。

在另一態樣中，本發明提供一種用於測定黑色素瘤之預後的裝置，其包括：基板，其上具有一個或多個位置，每一位置上具有兩種或更多種寡核苷酸，每一寡核苷酸選自一種或多種MPM。

該兩種或更多種寡核苷酸可為選自表1之MPM。

本發明亦提供試劑之用途，其在製造用於預測患者黑色素瘤之預後的套組中用於檢測MPM或包括兩種或更多種MPM之預後表徵的表現。該等MPM可選自表1。

該試劑可藉由檢測MPM mRNA或MM cDNA之表現來檢測一種或多種MPM之表現程度。該試劑可為與至少一部分MPM mRNA或cDNA互補之寡核苷酸。或者，該試劑可藉由檢測MPM蛋白或肽之表現來檢測一種或多種MPM之表現程度。該試劑可為抗體，例如，多株抗血清之單株抗體。

該套組可適用於進行三明治型免疫測定或ELISA分析。

參照本發明之具體實施例及附圖來闡述本發明，其中：圖1繪示用於創立預測評分之22種基因(「黑色素瘤標記物」)。使用Mann-Whitney測試選擇基因。

圖2繪示不同表現之基因的基因本體(Gene Ontology)分組及相關顯著性。藉由在各種類間交疊之基因的數量(即，此許多基因在基因列表及類別中重合之可能性)來確定最具顯著性之本體。

圖3試驗方案包括訓練集及兩個獨立應用的驗證集A(使用qPS)及驗證集B(使用aPS)。該訓練集用於產生預測基因，該等預測基因隨後應用於驗證集A(使用qPS)及驗證集B(使用aPS)。

圖4繪示用於產生參考cDNA之RNA，該參考cDNA用於陣列實驗(array experiment)及用作qPCR分析之比較。

圖5繪示用於使用Universal Probe Library探針之qPCR之分析。

圖6繪示測試集及驗證集A之患者特徵。

圖7繪示使用所有基因(A)及不同表現之基因(B)的主要分量分析(Principal Components Analysis)，表明該15種基因分開良好預後組(實心方框)與較差預後組(空心方框)之能力。此等基因用於產生基於該陣列及qPCR之預測器。

圖8繪示aPS(a-b)及qPS(c-d)在訓練集中之應用，表明其與TTP及總體存活率之關係。aPS僅使用在陣列數據與qPCR數據間具有最強相關之15種基因且qPS使用對兩個組具有最大分離能力的5種基因。

圖9繪示應用於訓練集及驗證集A之qPS邏輯回歸算法。在平均數值處劃一水平線。

圖10繪示第三獨立集之良好及較差預後分組之qPS評分的分佈。

定義

在詳細地闡述本發明實施例之前，提供某些本文所用術語之定義可為有用的。

術語「標記物」係指在數量上或在性質上與生物現象之存在有關的分子。「標記物」之實例包括聚核苷酸，例如，基因或基因片段、RNA或RNA片段；或基因產物，包括多肽，例如，肽、寡肽、蛋白或蛋白片段；或任何相關代謝產物、副產物或任何其他識別分子，例如，抗體或抗體片段，與該現象所涉及機制直接抑或間接相關。本發明之標記物包括如本文所揭示核苷酸序列(例如，GenBank序列)，特定言之，係全長序列、任一編碼序列、任一片段或其任一補體及其任一可量測標記物，如本文所定義。

術語「MPM」或「黑色素瘤預後標記物」或「MPM家族成員」係指具有與本文所述特定預後有關之變化表現(例如，癌症發展到較晚期之較高或較低可能性)的標記物，但可能不包括先前技術已知與黑色素瘤預後有關之分子。應理解術語MPM並不需要該標記物僅對黑色素瘤具有特異性。而且，可改變其他類別腫瘤(包括惡性腫瘤)之MPM表現。

術語「預後表徵」、「表徵」及諸如此類係指在作為一組一起分析時能夠測定或預測一事件(例如，黑色素瘤之預後結果)的一組(兩種或更多種)標記物，例如，MPM。使用包括兩種或更多種標記物之表徵可降低個別變量之作用並進行更為健壯之預測。MPM之非限制性實例陳述於XX中。在本發明之上下文中，所提及在任一特定組(例如，任一表徵)中所列示標記物之「至少一種」、「至少兩種」、「至少五種」等意指所列示標記物之任一種或任一及所有組合。

術語「預測方法」定義為涵蓋可用於規定預測模型之統計學、機器學習、人工智能及數據挖掘領域之更廣義方法。該術語亦包括適用於預測結果之任一方法且包括不僅使用多個標記物之複雜分析的方法而且亦包括需直接比較單一標記物或表徵之表現與對照組織之表現(或與預定閾值)以預測結果的方法。此等進一步闡述於具體實施方式部分。

術語「預測模型」係指藉由應用預測方法來收集數據所獲得特定數學模型。在本文所詳述實例中，此等數據集係由取自具有良好或較差預後之黑色素瘤患者的組織試樣中的基因活性之量測值構成，其中每一試樣之類別(良好或較差)為已知。此等模型可用於(1)將未知預後狀態之試樣歸類為良好組或較差組，或(2)進行表示未知試樣具有良好預後之可能性的概率預測(即，產生可解釋為幾率之比例或百分比)，基於特定基因集合在未知試樣中之mRNA表現程度或表現產物的量測。關於如何組合此等基因特異性量測以進行分類及概率預測之確切的細節應視用於構建該模型之預測方法的特定機制而定。該術語亦包括任一適用於預測結果之模型且不僅包括使用多個標記物之複雜分析的模型而且亦包括涉及直接比較單一標記物或表徵之表現與對照組織之表現(或與預定閾值)以預測結果的模型。

「敏感性」、「特異性」(或「選擇性」)及「分類率」在應用於闡述預測模型之功效時意謂下列：「敏感性」意謂藉由該模型亦預測為陽性之真正陽性試樣的比例。在黑色素瘤預後測試中，應為具有良好預後(藉由該模型預測為良好)之腫瘤的比例。「特異性」或「選擇性」意謂藉由該模型亦預測為陰性之真正陰性試樣的比例。在黑色素瘤預後測試中，此等同於具有較差預後(藉由模型預測為較差)之試樣的比例。「分類率」係可藉由預測模型進行恰當地歸類之所有試樣(陽性或陰性)的比例。

如本文所用「抗體」及類似術語係指免疫球蛋白分子及免疫球蛋白(Ig)分子(即，含有特異性地結合抗原(與抗原免疫反應)之抗原結合位點的分子)之免疫活性部分。此等包括但不限於多株、單株、嵌合、單鏈Fc、Fab、Fab'及Fab₂片段以及Fab表現文庫。抗體分子係與任一類別之IgG、IgM、IgA、IgE及IgD有關，此等類別彼此間之差別在於存於該分子中之重鏈的性質。此等亦包括諸如IgG1、IgG2及其他等亞類別。輕鏈可為κ鏈或λ鏈。本文所提及抗體包括所提及的所有類別、亞類別及類型。亦包括嵌合抗體，例如，對一種以上源(例如，小鼠或人類序列)具有特異性之單株抗體或其片段。進一步包括駱駝抗體、鯊魚抗體或納諾抗體。

術語「癌症」及「癌性」係指或闡述通常以異常或不可調控細胞生長為特徵之哺乳動物的生理狀況。癌症及癌症病理學可能與(例如)下列有關：轉移、干擾相鄰細胞之正常功能、以異常程度釋放細胞因子或其他分泌產物、抑制或加劇炎症反應或免疫應答、贅瘤形成、癌變前期、惡性腫瘤、對周圍或遠處組織或器官(例如，淋巴結等)之侵襲。具體而言，癌症包括黑色素瘤。

術語「黑色素瘤」係指源自發現於皮膚以及其他位點(例如，口腔及肛門生殖黏膜表面、食道、腦膜及眼睛)中之黑素細胞的腫瘤。此等腫瘤能夠轉移至任一器官。

術語「受到不同表現」、「不同表現」及類似短語係指基因標記物在具有病況(具體而言，係癌症，例如，黑色素瘤)之受試者(例如，測試試樣)中的表現被激活至較其在對照受試者(例如，參照試樣)中的表現為高或為低之程度。該等術語亦包括在同一病況之不同階段；在具有良好或較差預後之疾病中；或在具有較高或較低增生程度之細胞中其表現被激活至更高或更低程度之標記物。不同表現之標記物可在聚核苷酸層面或多肽層面上受到激活或抑制或者可經受交替剪接以產生不同的多肽產物。例如，此等不同可藉由在mRNA量之變化、多肽之表面表現、分泌或其他分離來證實。

不同表現可包括兩種或更多種標記物(例如，基因或其基因產物)之表現的比較；或兩種或更多種標記物(例如，基因或其基因產物)之表現比率的比較；或相同標記物之兩種經不同處理之產物(例如，轉錄物或多肽)的比較，此不同在正常受試者與患病受試者之間、或在相同疾病之各階段之間、或在具有良好或較差預後之疾病之間、或在具有較高及較低增生程度之細胞之間、或在正常組織與患病組織(具體而言，係癌症或黑色素瘤)之間。不同表現包括在(例如)正常與患病細胞中或在經受不同的疾病事件或疾病階段之細胞中或在具有不同程度增生之細胞中基因或其表現產物之時序或細胞表現型式之數量以及性質上的差異。

術語「表現」包括聚核苷酸及多肽之生成，特定言之，係RNA (例如，mRNA)自基因或一部分基因的生成且包括藉由RNA編碼之多肽或基因或部分基因的生成以及與表現相關之可檢測材料的出現。舉例而言，複合體自(例如)多肽-多肽相互作用、多肽-核苷酸相互作用或諸如此類的形成屬於術語「表現」之範圍。另一實例係諸如雜交探針或抗體等結合配體與基因或其他聚核苷酸或寡核苷酸、多肽或蛋白片段之結合以及該結合配體之可視化。因此，微陣列、諸如北方點漬等雜交點漬、或諸如西方點漬等免疫印迹、或微珠陣列、或PCR分析之點漬強度屬於主要生物分子之術語「表現」的範圍。

術語「表現閾值」及「所界定表現閾值」可互換使用且係指所述標記物之含量，在其之外，聚核苷酸或多肽用作患者存活之預測標記物。該閾值應視所建立預測模型而定，所建立預測模型係以實驗方式自諸如彼等闡述於下列實例中者等臨床研究獲得。視所用預測模型而定，可設定該表現閾值以達成最大敏感性或最大特異性或最小誤差(最大分類率)。舉例而言，可設定較高閾值以達成最小誤差，但此可導致較低敏感性。因此，對於任一給定預測模型而言，可使用臨床研究來設定通常可達成最高敏感性同時具有最小誤差率之表現閾值。表現閾值在任意情況下之測定為彼等熟習此項技術者所熟知。

術語「長期存活」在本文中用於指在外科手術或其他治療後可存活至少5年，更佳存活至少8年，最佳存活至少10年。

術語「微陣列」係指捕獲試劑(較佳為聚核苷酸(例如，探針)或多肽)在基質上之有序或無序排列。參見，例如，Microarray Analysis,M.Schena,John Wiley & Sons,2002；Microarray Biochip Technology,M.Schena編輯，Eaton Publishing,2000；Guide to Analysis of DNA Microarray Data,S.Knudsen,John Wiley & Sons,2004；及Protein Microarray Technology,D.Kambhampati編輯，John Wiley & Sons,2004。

術語「寡核苷酸」係指聚核苷酸，通常為探針或引物，包括但不限於單鏈脫氧核糖核苷酸、單鏈或雙鏈核糖核苷酸、RNA：DNA雜合體及雙鏈DNA。諸如單鏈DNA探針寡核苷酸等寡核苷酸經常藉由化學方法合成，例如，使用可購得或藉由各種其他方法(包括活體外表現系統、重組技術及在細胞及有機體中表現)獲得的自動寡核苷酸合成劑。

術語「聚核苷酸」在以單數或複數使用時通常係指任一聚核糖核苷酸或聚脫氧核糖核苷酸，其可為未經修飾RNA或DNA或經修飾RNA或DNA。此包括但不限於單鏈及雙鏈DNA、包括單鏈及雙鏈區之DNA、單鏈及雙鏈RNA及包括單鏈及雙鏈區之RNA、包含DNA及RNA(可為單鏈或(更通常地)雙鏈或包括單鏈及雙鏈區)之雜合體分子。亦包括包含RNA或DNA或包含RNA及DNA二者之三鏈區。具體而言，包括mRNA、cDNA及基因組DNA、及其任一片段。該術語包括含有一個或多個經修飾鹼基(例如，氚標記之鹼基或不常見鹼基，例如，肌苷)之DNA及RNA。本發明之聚核苷酸可涵蓋編碼或非編碼序列，或同義或反義序列。應理解本文所提及每一「聚核苷酸」或類似術語可包括全長序列以及其任一片段、衍生物或變體。

如本文所用「多肽」係指寡肽、肽、或蛋白序列或其片段以及天然、重組、合成或半合成分子。當「多肽」在本文中闡述為指天然蛋白分子之胺基酸序列時，則「多肽」及類似術語並非意欲將該胺基酸序列限於全長分子之完全天然胺基酸序列。應理解在本文中所提及每一「多肽」或類似術語可包括全長序列以及其任一片段、衍生物或變體。

術語「預後」係指醫療結果之預測，例如，較差或良好結果(例如，長期存活之可能性)；陰性預後或較差結果，包括復發、疾病進展(例如，腫瘤生長或轉移或藥物抗性)或死亡率之預測；陽性預後或良好結果，包括疾病消退(例如，無病狀態)、改善(例如，腫瘤退行)或穩定之預測。

術語「增生」係指導致細胞增大或細胞數量增多之過程且可包括下列過程中的一個或多個：腫瘤或細胞生長、血管發生、神經支配及轉移。

術語「qPCR」或「QPCR」係指如在(例如)PCR技術中所述定量聚合酶鏈反應：Quantitative PCR,J.W.Larrick編輯，Eaton Publishing,1997及A-Z of Quantitative PCR,S.Bustin編輯，IUL Press,2004。

術語「腫瘤」係指所有惡性或良心贅瘤細胞生長及增生，以及所有癌前及癌性細胞及組織。

雜交反應之「嚴格度」可由一名普通技術者容易地測定且通常係取決於探針長度、洗滌溫度及鹽濃度之經驗計算值。概言之，較長探針需要較高溫度以進行適當的退火，而較短探針需要較低溫度。雜交通常視變性DNA在互補鏈存於低於其熔融溫度之環境中時再退火的能力而定。探針與可雜交序列間之期望同源程度愈高，則可使用的相對溫度愈高。因此，由此得出結論：較高相對溫度往往會要求較嚴格的反應條件，而較低溫度對反應條件要求較低。關於雜交反應嚴格度之其他詳細說明及闡釋可發現於(例如)Ausubel等人，Current Protocols in Molecular Biology,Wiley Interscience Publishers,(1995)中。

如本文所定義「嚴格條件」或「高度嚴格條件」通常為：(1)採用低離子強度及高洗滌溫度，例如，0.015M氯化鈉/0.0015M檸檬酸鈉/0.1%十二烷基硫酸鈉，在50℃下；(2)在雜交期間採用變性劑，例如，甲醯胺，例如，50%(v/v)甲醯胺與0.1%牛血清白蛋白/0.1%蔗聚糖/0.1%聚乙烯基吡咯啶酮/50mM磷酸鈉緩衝液(在pH 6.5下)及750 mM氯化鈉，75mM檸檬酸鈉，在42℃下；或(3)採用50%甲醯胺，5X SSC(0.75M NaCl，0.075M檸檬酸鈉)，50mM磷酸鈉(pH 6.8)，0.1%焦磷酸鈉，5X，登哈特溶液(Denhardt's solution)，經超聲波處理之鮭魚精子DNA(50μg/ml)，0.1% SDS及10%硫酸葡聚糖，於42℃下；在42℃下在0.2X SSC(氯化鈉/檸檬酸鈉)中及在50%甲醯胺中於55℃下洗滌，繼而在55℃下進行高嚴格度洗滌，包括含有EDTA之0.1X SSC。

「中等嚴格條件」可按照在Sambrook等人，Molecular Cloning：A Laboratory Manual,New York：Cold Spring Harbor Press,1989中所述來識別且包括使用洗滌溶液及不如彼等上文所述者嚴格之雜交條件(例如，溫度、離子強度及% SDS)。中等嚴格條件之實例係在37℃下於包含下列之溶液中培育過夜：20%甲醯胺，5X SSC(150mM NaCl,15mM三檸檬酸鈉)，50mM磷酸鈉(pH 7.6)，5X登哈特溶液，10%硫酸葡聚糖及20mg/ml變性剪切之鮭魚鏡子DNA，繼而在約37-50℃下於1X SSC中洗滌過濾器。彼等熟習此項技術者應瞭解如何按照需要調節溫度、離子強度等以適應諸如探針強度及諸如此類等因素。

除非另有說明，否則在實踐本發明時，可採用熟習此項技術者已知的分子生物學(包括重組技術)、微生物學、細胞生物學及生物化合物之習知技術。此等技術全面地闡釋於諸如下列等文獻中：Molecular Cloning：A Laboratory Manual，第2版，Sambrook等人，1989；Oligonucleotide Synthesis,MJ Gait編輯，1984；Animal Cell Culture,R.I.Freshney編輯，1987；Methods in Enzymology,Academic Press公司；Handbook of Experimental Immunology，第4版，D.M.Weir & CC.Blackwell編輯，Blackwell Science公司，1987；Gene Transfer Vectors for Mammalian Cells,J.M.Miller & M.P.Calos編輯，1987；Current Protocols in Molecular Biology,F.M.Ausubel等人編輯，1987；及PCR：The Polymerase Chain Reaction,Mullis等人編輯， 1994。

本發明實施例之說明

本發明揭示微陣列在識別及測定特定預後標記物及表徵在黑色素瘤之特定預後作用中的用途。本文所示基於微陣列之研究建立可用於預測黑色素瘤患者之良好或較差預後之標記物。特定言之，本文所示基於微陣列之研究及qPCR分析表明特定不同表現之基因可用作與特定預後有關之預後表徵。因此，本發明可用於識別可能具有侵襲性疾病之患者。

本發明提供用於測定疾病預後之標記物。使用本發明方法，發現標記物與黑色素瘤之預後有關且可用於預測結果。對取自黑色素瘤各階段之患者的試樣進行微陣列分析，獲得令人吃驚的發現：標記物表現之特定形式與癌症預後有關。因此，本發明提供一組表1中所示之基因，彼等差異表現於具有良好或不良結果之黑色素瘤中。表1所示基因提供一組黑色素瘤預後標記物(MPMs)。

舉例而言，某些黑色素瘤預後標記物(MPMs)之減少可表明一種特定預後。相反地，其他MPMs之增加表明一種特定預後。特定預後可包括疾病進展速度。例如，可藉由比較測試試樣(例如患者之腫瘤試樣)與參照試樣(例如與已知預後有關之試樣)來測定表現之減少或增加。特定言之，取自具有良好預後之患者的一個或多個試樣可用作參照試樣。

舉例而言，為了獲得預後，可比較患者試樣(例如腫瘤試樣)與具有已知結果之患者試樣的表現程度。倘若患者試樣與具有不良結果(疾病進展迅速)之試樣相比顯示一種或多種MPMs表現增加或減少，則表明為不良預後。倘若患者試樣與具有良好結果(疾病進展緩慢)之試樣相比顯示一種或多種MPMs表現相當，則表明為良好預後。

作為其他實例，可比較患者試樣(例如腫瘤試樣)與已知具有良好或不良預後之癌症試樣中包含兩種或多種MPMs之預後表徵的表現程度。倘若患者之試樣顯示較具有良好預後之試樣增加或減少之MPMs表現及/或與不良預後之試樣相當的表現，則表明為陰性預後。倘若患者之試樣顯示與良好預後之試樣具有相當的MPMs表現及/或較具有不良預後之試樣低或高之表現，則表明為陽性或良好預後。

作為一種方法，可對一組標記物(在表1中所示MPM組)應用一預測方法以產生預測模型。此涉及產生包括兩種或更多種MPM之預後表徵。

因此，在表1中所揭示MPM提供一組有用的標記物，其用以產生用於測定癌症預後並確立專門針對該腫瘤之治療方案或治療形式之預測表徵。特定言之，患者可使用陽性預後以決定尋求特定治療選擇。患者可使用陰性預後以決定終止治療或尋求高度侵襲性或實驗性治療。另外，患者可根據自預後標記物(例如，MPM)表現預測得預後來選擇治療。

可使用任一適宜技術檢測腫瘤組織、鄰近腫瘤之組織、淋巴結試樣、血樣、血清試樣、尿樣或糞便試樣之MPM含量，該技術可包括但不限於寡核苷酸探針、定量PCR或針對該等標記物產生的抗體。應理解：藉由分析呈預測表徵形式之複數種MPM的存在及表現數量並構建預後表徵，可增強預後之敏感性及精確度。因此，本發明之多種標記物可用於測定癌症之預後。

本發明包括存檔石蠟包埋之活檢材料在該組標記物之分析中的用途且因此該活檢材料應與廣泛有售的活檢材料類型相容。其亦應與若干不同的腫瘤組織收穫方法相容，例如，藉由中心活組織檢查或細針抽吸活檢。在某些態樣中，自固定的蠟包埋之患者癌症組織樣本分離RNA。可藉由業內已知任一技術實施分離，例如，自中心活組織檢查組織或細針抽吸細胞分離。

在一個態樣中，本發明係關於一種預測預後(例如，癌症患者在治療後之長期存活可能性)之方法，其包括測定一種或多種預後標記物或其表現產物在自該患者所獲得試樣中的表現程度，相對於該試樣中之其他RNA轉錄物或其產物的表現程度或一組參考RNA轉錄物或其表現產物的表現程度進行標準化。在特定態樣中，該預後標記物係一種或多種在表1中所列示標記物，或作為一種或多種源自在表1中所列示標記物之預後表徵納入。

在其他態樣中，測定預後標記物或其表現產物(例如，在表1中所列示標記物及源自在表1中所列示標記物之預後表徵)之表現程度。在另一態樣中，該方法包括測定一整組預後標記物或其表現產物(例如，在表1中所列示標記物或源自在表1中所列示標記物之預後表徵)之表現程度。

在另一態樣中，本發明係關於包括與兩種或更多種標記物(例如，在表1中所列示標記物或源自在表1中所列示標記物之預後表徵)雜交之聚核苷酸的陣列(例如，微陣列)。在特殊態樣中，該陣列包括與源自在表1中所列示標記物之預後表徵雜交之聚核苷酸。在另一特定態樣中，該陣列包括與全組標記物(例如，在表1中所列示標記物)雜交之聚核苷酸。

對於此等測試而言，該等聚核苷酸可為cDNA或寡核苷酸且可放置該等聚核苷酸之實體表面可為(例如)玻璃。該等聚核苷酸可與本文所揭示一種或多種標記物(例如，全長序列、任一編碼序列、任一片段、或其任一補體)雜交。在特殊態樣中，一種或多種MPM之表現程度增加或減少表明長期存活之可能性降低(例如，由於癌症復發)而一種或多種MPM之表現程度增加或減少的缺乏表明長期存活之可能性增加，無癌症復發。

預後標記物檢測之一般方法

下列方法係可用於檢測增生標記物(包括MPM家族成員)之非限制性方法：微陣列方法，使用MPM之選擇性寡核苷酸探針；對腫瘤試樣實施實時qPCR，使用MPM特異性引物及探針；對淋巴結、血液、血清、糞便或尿試樣實施實時qPCR，使用MPM特異性引物及探針；酶聯免疫分析(ELISA)；免疫組織化學，使用抗標記物抗體；及陣列或qPCR數據之分析，使用計算機。

其他有用的方法包括北方點漬分析及原地雜交(Parker及Barnes，Methods in Molecular Biology 106：247-283(1999))；RNase保護分析(Hod,BioTechniques 13：852-854(1992))；逆轉錄聚合酶鏈反應(RT-PCR；Weis等人，Trends in Genetics 8：263-264(1992))；基因表現之系列分析(SAGE；Velculescu等人，Science 270：484-487(1995)；及Velculescu等人，Cell 88：243-51(1997))，MassARRAY技術(Sequenom,San Diego,CA)及藉由大規模平行表徵測序實施的基因表現分析(MPSS；Brenner等人，Nature Biotechnology 18：630-634(2000))。或者，可採用能夠識別特異性複合體(包括DNA雙螺旋體、RNA雙螺旋體及DNA-RNA雜交雙螺旋體或DNA-多肽雙螺旋體)之抗體。

可收集原始數據並實施倍數變化分析，例如，藉由比較腫瘤組織與非腫瘤組織之標記物表現程度；藉由比較標記物表現程度與在復發腫瘤與非復發腫瘤中所測定得程度；藉由比較標記物表現程度與在具有或不具有轉移之腫瘤中所測定得程度；藉由比較標記物表現程度與在不同階段之腫瘤中所測定程度；或藉由比較標記物表現程度與在具有不同增生程度之細胞中所測定程度。根據此分析，確定陰性或陽性預後。腫瘤標記物表現之其他分析包括匹配彼等呈現增加或減少表現之標記物與已知表現譜之黑色素瘤腫瘤以提供預後。

得出表現增加結論之閾值應視特殊標記物以及欲應用特殊預測模型而定。通常應設定該閾值以達成最高敏感性及選擇性以及最低誤差率，但對於特殊臨床情況而言可能需要有所變動。期望閾值係藉由分析足夠大小的群體同時考慮任一預測模型之統計差異性來確定且自用於產生預測模型之試樣大小計算而得。此同樣適用於測定得出表現減少結論之閾值。應理解，其他閾值或確立閾值、得出表現增加或減少結論之方法已出現且可在不背離本發明範圍時加以選擇。

亦可能的是，預測模型可產生一數值作為其輸出，例如，分值、可能性數值或機率。在此等情況下，可將閾值應用於預測模型所產生之結果，且在此等情況下，同樣適用與彼等用於設定表現值閾值者類似的原則。

當獲得預測模型、預測表徵在腫瘤試樣中之表現程度或輸出時，隨後可測定癌症復發之可能性。

根據所識別標記物，包含一種或多種MPM之預後表徵可用於測定癌症之預後，藉由比較一種或多種標記物與所揭示預後表徵之表現程度。藉由比較一種或多種MPM在腫瘤試樣中與所揭示預後表徵的表現，可測定癌症復發之可能性。可藉由應用如前文所述預測模型來實施用以確立預後之預後表徵表現程度的比較。

測定癌症復發之可能性對於醫學實踐者而言頗具價值。腫瘤對治療無響應之高可能性意謂應考慮較長或較高劑量治療或者可完全放棄治療。精確的預後對患者而言亦十分有益。亦應由患者以及其配偶、家人及朋友決定是否治療以及決定其將來及生活方式變化。因此，本發明亦提供一種確立特定癌症之治療方案的方法，該方法係基於藉由匹配標記物在腫瘤試樣中之表現與不同表現表徵而確立的預後。

應理解：所選擇標記物或所構建預後表徵並不一定限於本文表1中所揭示MPM，但可涉及使用一種或多種取自所揭示表徵之MPM，或者可使用選自所揭示標記物列表之MPM確立新穎表徵。對任一表徵之要求係其可以足夠精確度預測迅速疾病進展之可能性以幫助醫療實踐者確立治療方案。

逆轉錄PCR(RT-PCR)

在上文所列示技術中，最敏感且最靈活的定量方法係RT-PCR，其可用於比較正常及腫瘤組織(接受藥物治療或未接受藥物治療)之不同試樣群體的RNA含量以表徵表現型式、判別密切相關的RNA及分析RNA結構。

對於RT-PCR，第一步係自目標試樣分離RNA。初始材料通常為分別自人類腫瘤或腫瘤細胞系及對應正常組織或細胞系分離得總RNA。RNA可自諸如腫瘤試樣等試樣分離，該等腫瘤試樣可取自胸、肺、結腸(例如，大腸或小腸)、皮膚、結腸直腸、胃、食管、肛門、直腸、前列腺、腦、肝、腎、胰腺、脾、胸腺、睪丸、卵巢、子宮等組織；原發腫瘤或腫瘤細胞系；及自健康供體獲得的混合試樣。倘若RNA之來源係腫瘤，則可自(例如)冷凍或存檔石蠟包埋且固定(例如，經甲醛固定)之組織試樣提取RNA。

藉由RT-PCR描繪基因表現之第一步係RNA模板至cDNA的逆轉錄，繼而其在PCR反應中進行指數擴增。兩種最常用的逆轉錄酶係鳥類成髓細胞過多症病毒逆轉錄酶(AMV-RT)及莫洛尼(Moloney)鼠科白血病病毒逆轉錄酶(MMLV-RT)。該逆轉錄步驟通常使用特定引物，隨機六聚體或寡-dT引物引發，視環境及表現繪圖之目標而定。舉例而言，所提取RNA可使用基因Amp RNA PCR套組(Perkin Elmer,CA,USA)按照生產商說明進行逆轉錄。所產生cDNA隨後可在後續PCR反應中用作模板。

儘管該PCR步驟可使用各種熱穩定性DNA依賴性DNA聚合酶，但其通常採用具有5'-3'核酸酶活性但缺乏3'-5'校讀內切核酸酶活性之 Taq DNA聚合酶。因此，TaqMan(q)PCR通常利用Taq或Tth聚合酶之5'核酸酶活性來水解結合其目標擴增子之雜交探針，但可使用任一具有等效5'核酸酶活性之酵素。

使用兩種寡核苷酸引物來產生PCR反應常用的擴增子。將第三寡核苷酸或探針設計為檢測位於該兩個PCR引物之間的核苷酸序列。該探針藉由Taq DNA聚合酶酵素不可伸長且用報告螢光染劑及淬滅螢光染劑標記之。當該兩種染劑在該探針上靠在一起時，可藉由該淬滅染劑來淬滅報告染劑之任一雷射誘發的發射。在擴增反應期間，該Taq DNA聚合酶酵素以模板依賴方式解離該探針。所得探針片段在溶液中離解且來自解離報告染劑之信號不會受到第二螢光團之淬滅作用。對於所合成的每一新穎分子，均釋放一分子報告染劑，且未淬滅報告染劑之檢測為數據定量解釋提供依據。

可使用諸如ABI PRISM 7700序列檢測系統(Perkin-Elmer-Applied Biosystems,Foster City,CA,USA)或Lightcycler(Roche Molecular Biochemicals,Mannheim，德國)等市售設備來實施TaqMan RT-PCR。在較佳實施例中，使用諸如ABI PRISM 7700tam序列檢測系統等實時定量PCR裝置運行5'核酸酶程序。該系統係由熱循環儀、雷射儀、電荷耦合裝置(CCD)、攝錄機及計算機構成。該系統藉助熱循環儀以96-孔規格擴增試樣。在擴增期間，藉由所有96孔之光纖電纜實時收集雷射誘發之螢光信號並在CCD處檢測。該系統包括用於運行該設備及分析數據之軟體。

5'核酸酶分析數據開始表現為Ct或閾值循環。如上文所述，在每一循環期間記錄螢光數值且該等螢光數值表示在擴增反應中擴增至該點之產物的量。螢光信號被首次記錄為統計學顯著時之點係閾值循環。

為了最小化試樣與試樣變化間之誤差及作用，通常使用內部標樣實施RT-PCR。理想的內部標樣在不同組織中以恆定程度表現且不受實驗處理的影響。最經常用於歸一化基因表現型式之RNA係用於持家基因甘油醛-3-磷酸-脫氫酶(GAPDH)及-肌動蛋白之mRNA。

實時定量PCR(qPCR)

RT-PCR技術之最新變化形式係實時定量PCR，其藉由雙標示螢光探針(即，TaqMan探針)量測PCR產物累積。實時PCR與數量競爭性PCR及數量競爭性PCR二者相容。前者使用用於歸一化之每一目標序列的內部競爭物，而後者使用在該試樣中所含歸一化基因或用於RT-PCR之持家基因。其他詳細說明由(例如)Held等人，Genome Research 6：986-994(1996)提供。

可使用固定的石蠟包埋之組織作為RNA來源來測定表現程度。按照本發明之一個態樣，根據存於擬擴增基因中之內含子序列設計PCR引物及探針。在此實施例中，引物/探針設計之第一步係該等基因內之內含子序列的繪示。此可藉由諸如藉由Kent,W.J.,Genome Res.12(4)：656-64(2002)開發的DNA BLAT軟體等可公開獲得的軟體或藉由BLAST軟體(包括其變化形式)實施。在確立PCR引物及探針設計方法後，實施後續步驟。

為了避免非特異性信號，在設計該等引物及探針時遮蔽該等內含子內之重複序列可為有用的。此可藉由使用通過Baylor College of Medicine可在線獲得的Repeat Masker程式容易地達成，該程式可針對重複單元文庫篩選DNA序列並返回其中該等重複單元被遮蔽之詢問序列。該等遮蔽序列隨後可用於設計引物及探針序列，使用任一市售或其他可公開獲得的引物/探針設計包，例如，Primer Express(Applied Biosystems)；MGB assay-by-design(Applied Biosystems)；Primer 3(Steve Rozen及Helen J.Skaletsky(2000)Primer 3，在WWW上，供普通使用者使用且供生物學程式員使用：Krawetz S,Misener S(eds) Bioinformatics Methods and Protocols：Methods in Molecular Biology.Humana Press,Totowa,NJ，第365-386頁)。

在PCR引物設計中所考慮到的最重要因素包括引物長度、熔融溫度(T_m)及G/C含量、特異性、互補引物序列及3'端序列。概言之，最佳PCR引物通常長為17-30個鹼基且含有約20-80%(例如，約50-60%)G+C鹼基。介於50℃與80℃(例如，約50℃至70℃)間之熔融溫度通常為較佳。關於PCR引物及探針設計之其他指導，參見，例如，Dieffenbach,C.W.等人，General Concepts for PCR Primer Design(PCR Primer,A Laboratory Manual,Cold Spring Harbor Laboratory Press,New York,1995，第133-155頁)；Innis及Gelfand,Optimization of PCR(PCR Protocols,A Guide to Methods and Applications,CRC Press,London,1994，第5-11頁)；及Plasterer,T.N.Primerselect：Primer and probe design.Methods Mol.Biol.70：520-527(1997)，該等文獻之全部揭示內容均已引用方式明確併入本文中。

微陣列分析

亦可使用微陣列技術來識別或確認不同表現。因此，可使用微陣列技術量測新鮮或石蠟包埋之腫瘤組織的MPM表現譜。在此方法中，在微芯片基板上放置或排列相關聚核苷酸序列(包括cDNA及寡核苷酸)。所排列序列(即，捕獲探針)隨後與來自相關細胞或組織之特定聚核苷酸(即，靶)雜交。正如在RT-PCR方法中，RNA之來源通常為自人類腫瘤或腫瘤細胞系及對應的正常組織或細胞系分離得總RNA。因此，可自各種原發腫瘤或腫瘤細胞系分離RNA。倘若RNA之來源係原發腫瘤，則可自(例如)冷凍或存檔甲醛固定、石蠟包埋之(FFPE)組織試樣及固定(例如，經甲醛固定)之組織試樣提取RNA，該等組織試樣在日常臨床實驗中以常規方式製備及保存。

在微陣列技術之特定實施例中，將cDNA選殖體之PCR擴增插入片段應用於基板。該基板可包括多達1、2、5、10、15、20、25、30、35、40、45、50或75個核苷酸序列。在其他態樣中，該基板可包括至少10,000個核苷酸序列。固定在微芯片上之微陣列序列適於在嚴格條件下雜交。作為其他實施例，微陣列之鈀的長度可為至少50、100、200、400、500、1000或2000個鹼基；或長度為50-100、100-200、100-500、100-1000、100-2000或500-5000個鹼基。作為其他實施例，該等微陣列之捕獲探針的長度可為至少10、15、20、25、50、75、80或100個鹼基；或長度為10-15、10-20、10-25、10-50、10-75、10-80或20-80個鹼基。

可通過藉由逆轉錄自相關組織提取的RNA納入螢光核苷酸來產生螢光標記之cDNA探針。應用於芯片之經標記cDNA探針特異性地與該陣列之每一DNA點雜交。在嚴格洗滌以去除未經特異性結合之探針後，藉由聚焦雷射儀顯微鏡或藉由另一檢測方法(例如，CCD攝錄機)掃描該芯片。每一陣列元素雜交之定量可評定對應的mRNA豐度。就雙色螢光而言，自兩個RNA來源產生的分別標記之cDNA探針成對地與該陣列雜交。因此，以類似方式測定對應於每一特定基因兩個來源之轉錄物的相對豐度。

小規模的雜交可方便及迅速地評定大量基因之表現型。此等方法已顯示具有檢測稀少轉錄物(該等轉錄物以每個細胞若干拷貝表現)所需的敏感性且可以再現方式檢測至少約2倍的表現程度差異(Schena等人，Proc.Natl.Acad.Sci.USA 93(2)：106-149(1996))。微陣列分析可藉由市售設備按照生產商方案實施，例如，藉由使用Affymetrix GenChip技術、Illumina微陣列技術或Incyte's微陣列技術。用於大規模地分析基因表現之微陣列方法的研發使系統地搜尋用於在各種腫瘤中進行癌症分類及結果預測之分子標記物成為可能。

RNA分離、純化及擴增

用於mRNA提取之一般方法為此項技術所熟知且揭示於分子生物學之標準教科書(包括Ausubel等人，Current Protocols of Molecular Biology,John Wiley and Sons(1997))中。自石蠟包埋之組織提取RNA的方法揭示於(例如)Rupp及Locker,Lab Invest.56：A67(1987)及De Sandres等人，BioTechniques 18：42044(1995)中。特定言之，可使用純化套組、緩衝組及自諸如Qiagen等生產商獲得的蛋白酶按照生產商說明實施RNA分離。舉例而言，可使用Qiagen RNeasy微型管柱分離來自培養物細胞之總RNA。其他市售RNA分離套組包括MasterPure Complete DNA及RNA Purification Kit(EPICENTRE(D,Madison,WI)以及Paraffin Block RNA Isolation Kit(Ambion公司)。可使用RNA Stat-60(Tel-Test)分離來自組織試樣的總RNA。例如，藉由氯化銫密度梯度離心分離自腫瘤製備得RNA。

使用固定石蠟包埋之組織作為RNA來源描繪基因表現之代表性方案的步驟(包括mRNA分離、純化、引物伸長及擴增)在各種期刊文獻(例如：T.E.Godfrey等人，J.Molec.Diagnostics 2：84-91(2000)；K.Specht等人，Am.J.Pathol.158：419-29(2001))中給出。簡而言之，代表性方法以切割約10μm厚的石蠟包埋之腫瘤組織試樣部分開始。隨後提取RNA並去除蛋白及DNA。在分析RNA濃度後，倘若需要，則可實施RNA修復及/或擴增步驟，且使用基因特異性啟動子來逆轉錄RNA，繼而實施RT-PCR。最後，分析該等數據以根據在所檢查腫瘤試樣中識別的特徵基因表現型來確定可用於該患者之最佳治療選擇。

免疫組織化學及蛋白質組學

免疫組織化學方法亦適用於檢測本發明增生標記物之表現程度。因此，抗體或抗血清(較佳為多株抗血清且最佳為對每一標記物具有特異性之單株抗體)可用於檢測表現。可藉由用(例如)放射性標籤、螢光標籤、半抗原標籤(例如，生物素)或酵素(例如，辣根過氧化物酶或鹼性磷酸酶)直接標示抗體自身來檢測該等抗體。或者，未經標示一級抗體結合經標示二級抗體使用，該經標示二級抗體包括對該一級抗體具有特異性之抗血清、多株抗血清或單株抗體。免疫組織化學方案及套組為此項技術所熟知且可購得。

蛋白質組學可用於分析在某時間點時存於試樣(例如，組織、器官或細胞培養物)中之多肽。特定言之，蛋白質組學技術可用於評定試樣之多肽表現的總體變化(亦稱作表現蛋白質組學)。蛋白質組學分析通常包括：(1)藉由2-D凝膠電泳(2-D PAGE)分離存於試樣中之個別多肽；(2)藉由(例如)質譜或N-端序列測定識別自凝膠回收得個別多肽，及(3)使用生物信息學分析數據。蛋白質組學方法係其他基因表現描繪方法之頗具價值的補充且可單獨或與其他方法組合使用以檢測本發明增生標記物之產物。

在評定一種或多種預後標記物在腫瘤試樣中之表現程度後，隨後可測定癌症響應治療之可能性。本發明者已在各患者數據集中識別出許多標記物，該等標記物在響應治療之黑色素瘤(良好預後)中與在不響應治療之黑色素瘤(較差預後)中受到不同的表現。該等標記物展示於表1及下列實例中。

受到不同表現之基因的選擇

被視為有意義的早期基因選擇方法涉及簡單地觀看給定基因在兩個相關組之間的「倍數」變化。儘管此方法針對的是看似變化最明顯之基因，但基礎統計學考慮使得人們認識到倘若差異(或雜訊位準)很高(如在微陣列實驗中所常見者)，則似乎大倍數變化通常僅會意外地發生。

諸如彼等本文所述者等微陣列實驗通常涉及成千上萬個基因的同時量測。倘若人們要比較兩個組(例如，良好預後及較差預後腫瘤) 間之特定基因的表現程度，則典型的顯著性測試(例如，t-測試)並不適合。此乃因在由成千上萬個實驗(在此上下文中，每一基因構成一「實驗」)構成的整體中，至少一個實驗意外地通過顯著性通用標準之機率基本上為1。在顯著性測試中，人們通常計算「零假設」成立之機率。在比較兩個組時，零假設係在兩個組之間無差別時之情況。倘若統計學測試產生低於某一閾值(通常為0.05或0.01)之零假設的機率，則可聲明我們可拒絕零假設並接受兩個組明顯不同之假設。顯然，在此測試中，預計意外零假設之拒絕率可為1/20(或1/100)。t-測試或其他類似顯著性統計學測試並不適用於微陣列情形，此乃因該等測試會產生過多假陽性結果(或I型誤差)。

在此種情況下，當人們要同時測試多個假設時，人們可應用典型的多重比較法，例如，Bonferroni方法¹²。然而，此等測試對於大多數微陣列實驗而言過於保守，此乃因該等測試會產生過多假陰性(II型)誤差。

最新方法意欲避免試圖對給定測試應用較大機率及建立一種選擇一小組實驗之方法以便控制I型誤差(或錯誤發現率；¹³)之預期比例。此方法已藉由各種實施方案用於此研究，即，為該等方法提供BRB Array Tools¹⁴及Bioconductor之limma^15,16包(使用R統計學環境；^17,18)。

數據挖掘之一般方法：預後表徵之產生

數據挖掘係用於闡述「知識」之提取，換言之，自(通常)大量數據(數據集)獲得「技能(know-how)」或預測能力之術語。其為此研究用於產生預後表徵之方法。對於此研究而言，「技能」係自一組基因表現測量值或「表徵」(如此部分中所概述且更具體地闡述於實例部分)精確地預測預後之能力。

此研究所用方法之具體詳情闡述於實例17-20中。然而，任一數據挖掘方法(闡述於實例中者及闡述於本文中者)之應用可遵循此一般方案。

數據挖掘¹⁹及相關局部機器學習²⁰係一項複雜之重複性數學任務，涉及使用一個或多個適當的計算機軟體包(參見下文)。使用軟體之優勢在於一方面無需完全熟習每一技術背後之複雜理論以成功地使用數據挖掘技術，只要堅守正確的方法。缺點為數據挖掘之應用通常可能視為「黑箱」：輸入數據並接受答案。如何達成通常為最終使用者所不知(所述許多技術正是如此情況)，且通常可影響數據挖掘所選統計學方法。舉例而言，神經網路及支持向量機具有特別複雜的執行過程，致使最終使用者提出用於產生決定之「規則」十分困難。另一方面，k-近鄰及線性判別分析具有十分透明的決定過程，並不會隱瞞使用者。

有兩種用於數據挖掘之方法：監管式及非監管式方法。在監管式方法中，與該等數據聯結之資訊為已知，例如分類數據(如良好及不良預後)。所需要的是聯結所觀測到之反應(例如良好及不良預後)與輸入變量之能力。在非監管式方法中，屬於該數據集之類別預先未知，且採用數據挖掘方法以試圖發現屬於該數據集之類別或結構。

在本實例中，使用監管式方法並詳細地論述，但應理解可使用任一其他技術。

總體方案包括下列步驟：

˙數據表示。此涉及將數據轉化成最可能成功地配合所選數據挖掘技術之形式。當數據係數值時，例如，在其中所研究數據表示基因表現之相對程度的此研究中，此轉化相當簡單。倘若數據涵蓋較大動態範圍(即，許多數量級)，經常採取數據之對數。倘若數據涵蓋藉由若干獨立的研究者在若干獨立日量測的若干獨立試樣之量測值，則應特別小心以確保系統誤差最小化。系統誤差(即，由方案差別、機器差別、操作者差別及其他可量化因素產生的誤差)之最小化係在本文中稱作「歸一化」之過程。

˙特徵選擇。通常，該數據集含有較實際用以日常量測之數據為多的數據元，以及許多並不提供產生預測模型所需資訊之數據元。預測模型闡述數據集之實際能力源自全維數數據集之某一子集。此等維數係數據集之最重要的分量(或特徵)。注意，在微陣列數據情形中，數據集之維數係個別基因。在本文所述上下文中，特徵選擇涉及發現彼等受到最「不同表現」之基因。在更一般的意義上，特徵選擇涉及彼等通過某一顯著性統計學測試之群組，即，在所研究的一個組或其他組中，特定變量值始終較高或較低。有時，該等特徵係彼等呈現最大差異之變量(或維數)。

特徵選擇之應用完全獨立於用於創造預測模型之方法且涉及大量達成期望結果之實驗。在本發明中，需要對所選擇大量基因進行特徵選擇。另外，可對該數據集應用數據縮減方法(例如，主要分量分析)。

˙訓練。當確立數據集之類別(例如，良好/較差預後)及特徵且該數據集表示為作為數據挖掘輸入值可接受之形式後，對所選預測模型應用縮減數據集(如藉由特徵所述)。此模型之輸入值通常呈與輸出資訊(類別標記或響應)有關之多維輸入數值(稱作向量)形式。在該訓練過程中，將所選數據依序(在諸如神經網路等技術中)或作為一整體(在應用某回歸形式之技術中，例如，在線性模型、線性判別分析、支持向量機)輸入預測模型中。在某些情況(例如，k-近鄰)下，數據集(或在特徵選擇後所獲得數據集之子集)本身即模型。如所述，可在對具體數學瞭解最少時藉由使用各種軟體包來確立有效模型，在該等軟體包中該模型之參數已由專業分析人員以最可能產生成功結果之方式預先測定。

˙驗證。此係數據挖掘方案之關鍵組成且不適當地應用此驗證經常會產生誤差。除特徵選擇及訓練外，應留出部分數據集以測試預測模型之成功。進而言之，倘若使用驗證之結果來實施特徵選擇及模型訓練，則人們可獲得另一驗證集以在該模型應用於實時情況前測試之。倘若此方法並未嚴格依附該模型，則其在實際情況中可能失敗。驗證方法更詳細地闡述於下文中。

˙應用。在構建並驗證該模型後，必須以最終使用者可接達之某一方式封裝該模型。此經常涉及構建其中嵌入該模型之某一形式的電子試算表、編製統計學軟體包或藉由資訊技術人員將該模型重構入硬編碼應用程式中。

經常使用的軟體包之實例係：

- Spreadsheet plugins，自多個供應商獲得。

- R統計學環境。

- 市售軟體包MatLab、S-plus、SAS、SPSS、STATA。

- 免費開放軟體，例如，Octave(MatLab clone)

- 許多各種各樣的C++文庫，其可用於在商業閉源環境中構建預測模型。

數據挖掘方法之實例

˙可藉由首先進行數據挖掘步驟(上文)且隨後應用適當已知軟體包來實施本發明之方法。關於數據挖掘方法之其他描述詳細闡述於許多著名的文本¹⁹中。

˙線性模型^19,21：該等數據被視為線性回歸模型之輸入值，該線性回歸模型輸出類別標記或響應變量。必須將類別標記或其他分類數據轉化成數值(通常為整數)。在普遍的線性模型中，類別標記或響應變量自身相對於輸入數據並非為線性但可藉由使用「聯繫函數」轉化。邏輯回歸係普遍線性模型之最常見形式。

˙線性判別分析^19,22,23。倘若該等數據係線性可分的(即，可藉由超平面對數據進行分組或歸類，該超平面係一閾值之n-維延伸)，則可應用此技術。使用變量組合來分類以最大化組間差異並最小化組內差異。此舉之副作用係形成分類規則。將此規則應用於未知類別的試樣可預測適合彼試樣之類別成員或對其進行分類。線性判別分析有許多種，諸如常用於微陣列分析之近收縮形心(nearest shrunken centroid)。

˙支持向量機²⁴：一變量集合結合一權重集合使用以確定可最大化各類別在彼等加權變量方面之差距的模型。將此模型應用於試樣，隨後產生該試樣類別成員之分類或對其之預測。

˙神經網路²³：數據被視為節點網路之輸入值，該等節點表面上與生物神經元相似，其將所有節點之輸入值應用於與該等節點連接者並將輸入值轉化成輸出值。經常地，神經網路使用「乘法及加法」算法以將來自多個連接輸入節點之輸入值轉化成單一輸出值。一節點不一定產生一輸出值，除非彼節點之輸入值超過某一閾值。每一節點使用來自若干其他節點之輸出值作為其輸入值，最終輸出節點通常與分類變量相關聯。節點之數量及節點之拓撲可以近乎無限之方式變化，從而提供劃分不能夠以其他方式歸類之雜訊數據的能力。神經網路之最常見構建方案係多層感知器(perceptron)。

˙分類與回歸樹²⁵：在此等情況下，變量可用於界定可以逐步方式實行以測定試樣類別之規則階層。該典型方法創造一組可產生特定輸出值之規則或不能夠辨別之特別聲明。實例分類樹係算法之執行方法，例如：倘若基因A>x且基因Y>x且基因Z=z

則為

類別A

否則倘若基因A=q

則為

類別B

˙近鄰方法^22,23。藉由比較一試樣(未知類別)與彼等在其周圍者(已知類別)來進行預測或分類，其中緊密度藉由距離函數來界定。可能會界定許多不同的距離函數。經常使用的函數係歐幾裏德距離(Euclidean distance)(將畢達哥拉斯距離(Pythagorean distance)擴展至n-維，如在三角量測中)，各種形式的校正(包括皮爾遜相關係數(Pearson Correlation co-efficient))。亦有將通常不可藉由有意義的距離量度互聯之數據點轉化成歐幾裏得空間(euclidean space)之轉化函數以便隨後可應用歐幾裏德距離(例如，馬哈拉諾比斯距離(Mahalanobis distance))。儘管該距離量度可能十分複雜，但k-近鄰之基本前提係十分簡單的，基本上需聲明「找出與未知輸入值最類似的k-數據向量，明確其對應於哪一類別並表決未知輸入值之類別」。

˙其他方法：

- 貝葉斯網路。使用直接非循環圖表示一變量集合以及其聯合機率分佈，該聯合機率分佈隨後可用於測定一試樣類別成員之機率。

- 獨立分量分析，其中自一變量集合再分離獨立的信號(例如，類別成員)形成若干分量。此等分量隨後可用於實現試樣類別成員之分類或預測。集成學習方法，其中組合一預測方法集合以實現試樣類別成員之聯合分類或預測。

可探究的此等方法有許多變化形式¹⁹且經常界定及研發許多新穎方法。應理解：可應用此等方法中的任一種以獲得可接受之結果。必須特別小心以避免過適(overfitting)，藉由確保所有結果藉由綜合驗證方案來測試。

驗證

所述任一預測方法之應用涉及在可將該方法應用於新穎數據集(例如，自臨床試驗獲得的數據)之前進行訓練及交叉-驗證^12,26。訓練涉及採用相關數據集之子集(在此情況下，量測黑色素瘤之基因表現)以便在所測試各類別中分層(在此情況下腫瘤具有迅速發展之良好或較差可能性)。此訓練集用於產生預測模型(上文所定義)，以其餘數據(測試集)測試該預測模型。

可能會改變預測模型之參數以在測試集中獲得更佳性能，然而，此可能造成稱作過適之情況，其中預測模型可影響訓練數據集但不會影響任一外部數據集。為了規避此情況，進行驗證過程。通常應用兩種主要的驗證，第一種(持續驗證(hold-out validation))涉及將數據集分成三組：測試組、訓練組及驗證組。無論如何，該驗證集不具有訓練過程之輸入值以致於必須在應用於該測試集(而非驗證集)期間進行任何參數或其他改進方案調整。第二主要類別係交叉-驗證，其可以若干不同方式應用，如在下文中所述。

交叉-驗證有兩個主要亞類：K-折交叉-驗證(K-fold cross-validation)及留一法交叉-驗證(leave-one-out cross-validation)。

K-折交叉-驗證：將數據集分成K個子試樣，每個子試樣含有與初始試樣大致相同比例的類別組。

在每一輪驗證中，保留K個子試樣中的一個並使用其餘數據集完成訓練。藉由剩餘組分類之正確性來確定該輪訓練之效力。將此程序重複K次並藉由比較預測類別與已知類別來確定總體效力。

留一法交叉-驗證：K-折交叉驗證之經常使用的變化形式，其中K=n，其中n係試樣之數量。

諸如彼等上文在表1中所述者等MPMS之組合可用於構建預後之預測模型。

預後表徵

包含一種或多種此等標記物之預後表徵可藉由應用一個或多個源自該表徵之預測模型來測定患者之結果。特定言之，臨床醫師或研究員可測定一種或多種標記物在該表徵中的不同表現(例如，增加或減少表現)，應用預測模型進而預測患者之陰性預後(例如，疾病復發之可能性)或陽性預後(持續好轉)之可能性。

已經研發出預後表徵。如在下文實例中所述，已經自一組具有黑色素瘤之患者確立包含22各基因之預後表徵(表1)。藉由獲得患者試樣(例如，腫瘤試樣)並匹配一種或多種標記物在該試樣中的表現程度與不同的表現譜，可測定癌症迅速進展之可能性。

藥物試驗

本發明亦可用於選擇用於特殊藥物試樣之個體。藉由確立具有黑色素瘤之個體的預後，隨後可更佳地決定患者是否應經受其可能產生響應的習知治療或者患者是否應參與針對特殊腫瘤類型或階段之特殊藥物試驗。

對於短期預測疾病進展之患者的選擇亦應能夠縮短藥物試驗過程並使少量患者參與以獲得在統計學上顯著的藥物響應數據。

實例

本文所述實例出於闡明本發明實施例之目的。其他實施例、方法及分析類別屬於分子診斷技術之普通業內人員所知範圍且無需在本文中詳細地闡述。屬於此項技術範圍之其他實施例被視為本發明之一部分。

為了研究可能影響III期黑色素瘤臨床結果之腫瘤的生物學機制，在IIIB期及IIIC期黑色素瘤淋巴結切除術後，對29個黑色素瘤樣本(來自具有不同臨床結果之患者)之初始測試集實施基因表現描繪。此隨後用於前瞻性地預測臨床結果，根據包含10名及14名患者之兩個獨立驗證集的分子譜。使用此分子資訊，亦可識別在兩患者組之間受到不同調節的細胞途徑及網路且該等細胞途徑及網路係治療干預之可能目標。

材料及方法 微陣列分析之樣本採集及選擇

所實施實驗之總體圖解表示於圖3中。選擇來自29名患者之體內黑色素瘤組織來進行微陣列分析，該等患者在1997年與2004期間因在臨床上可觸知的淋巴結而在Austin Health經受外科淋巴結切除術。遵循由Austin Health Human Research Ethics Committee批准之組織獲取方案並在取得每一患者之書面知情同意後採集所有樣本。將速凍樣本包埋於最佳切割溫度化合物(OCT)中並作為組織塊於Ludwig/Austin組織存儲庫內在-80℃下儲存。所有病例之診斷均由病理學家證實。

根據腫瘤發展所需時間(TTP)(自第III階段到第IV階段疾病)選擇用於微陣列分析之患者試樣且該等試樣包括16名「較差」(平均TTP係4個月)預後患者及13名「良好」(平均TTP係42個月)預後患者。在淋巴結切除術後開始12個月內在專門黑色素瘤病房中按月實施術後觀察，接下來按照臨床要求在此後每隔三個月及6個月，直至第4年，此後每年觀察一次。按照臨床猜疑或通常每3-6個月實施分期調查。

倘若存在最小壞死且腫瘤細胞佔總細胞群之至少60%，則認為該組織對於此研究而言是可接受的。在RNA提取時，切割兩個5μm部分並用蘇木素及伊紅染色以確保所提取組織之完整性。

RNA提取及cDNA合成

對29名入選患者以常見參考設計實施cDNA合成及雜交，一式兩份。藉由在Tri-reagent(Molecular Research Center,Cincinnati,OH)中浸沒並勻質化組織部分以自OCT包埋之組織提取總RNA。向該勻漿中添加1.5mL氯仿，離心該試樣並去除頂相且與100%乙醇混合。按照生產商說明(Qiagen,Valencia,CA)使用RNeasy管柱實施純化。基於260：280之吸光度比率確認RNA品質且使用甲醛-瓊脂糖凝膠檢查相對於rRNA標準標記物之完整性。於寡(dT)及胺基烯丙基脫氧核苷酸存在下，自20μg RNA合成cDNA。Cy染劑(Amersham Biosciences,Buckinghamshire,UK)與並行產生的腫瘤cDNA及參考cDNA偶聯。自來自各種腫瘤及細胞系(包括黑色素瘤)以及正常組織之混合RNA合成參考cDNA(參見圖4)。

寡核苷酸分析及數據分析

自MWG Biotech(Erbesberg，德國)獲得30,888個表示個別及內部控制之寡核苷酸探針並使用Omnigrid robot(Gene Machines,San Carlos,CA)點布為高密度陣列。將經標記腫瘤/參考cDNA共雜交並使用Genepix 4000A微陣列掃描儀(Axon Instruments,Union City,CA)掃描之。將矩陣疊加(matrix overlay)與所掃描影像對準並使用Gene Pix v6.0軟體(Axon Instruments,Foster City,CA)實施特徵提取。使用GeneSpring v7.2(Silicon,Redwood City,CA)分析原始數據。對點樣組(print-tip group)實施數據歸一化且隨後對中值進行歸一化。簡而言之，將lowess曲線與log-強度及log-比率圖擬合。使用20%之數據來計算每一點之lowess擬合。使用此曲線來調節每一量測之對照數值。隨後藉由每一基因在所有試樣中之量測值的中值來劃分該基因。

藉由Array Express公開數據存儲庫：http：//www.ebi.ac.uk/arrayexpress/可獲得EORTC黑色素瘤研究²⁷之獨立驗證集B的數據。將該等數據加載至Genespring v7.2中並針對每一點、每一芯片及每一基因歸一化。簡而言之，所量測每一基因之強度除以其在每一試樣中之對照信道值且隨後除以該試樣所有量測值之50%。最後，藉由每一基因在所有試樣中之量測值的中值來劃分該基因。使用受到不同表現之基因的表現值來計算預測評分，如在下文中所述。

統計方法

首先使基因表現數據經一過濾器處理，其中不包括未存於所有試樣中之探針。在所考慮的初始30,888個探針中，18,807個通過此過濾器且用於差異分析、分層群集及主要分量分析。藉由實施Wilcoxon-Mann-Whitney測試來發現經不同表現之基因，使用Benjamini及Hochberg錯誤發現率控制方法²⁸基於0.05之p-值截止值進行多重測試校正(multiple testing correction)。使用Spearman相關係數作為距離函數及平均數聯結(average linkage)來實施試樣之分層群集。

定量實時PCR(qPCR)

使用經不同表現之基因實施qPCR以證實陣列結果，且隨後使用驗證集A驗證預測器。自2μg使用隨機六聚體引物(Promega,Madison,WI)提取的用於陣列實驗之總RNA合成第一cDNA鏈。藉由省略逆轉錄酶獲得陰性對照。藉助Universal Probe Library分析設計中心https：//www.roche-applied-science.com/(Roche,Mannheim，德國)設計用於qPCR之跨內含子多重分析(參見用於分析設計之圖5)。使用ABI 7700序列檢測器(Applied Biosystems,Foster City,CA)實施所有反應，一式兩份。熱循環條件係如下：50℃，歷時2分鐘，95℃，歷時10分鐘，繼而進行40個循環：94℃，歷時20秒，及60℃，歷時45秒。所有結果歸一化為18S擴增(Applied Biosystems,Foster City,CA)。我們使用參考目標閾值(C_T)作為我們的比較器²⁹來計算相對表現。

隨後繪製個別基因之相對表現值對歸一化log₂比率陣列數值之圖形並計算校正係數。

結果

列示在測試集及驗證集A中所包括患者之臨床及病理特徵(參見圖6)。所有患者具有關於初始診斷時之年齡、性別及陽性淋巴結轉移之數量和位置的資訊。在我們的醫院裏，並非所有患者具有其初始診斷且因此在某些情況下我們不能夠確定患者原發黑色素瘤中是否存在潰瘍。原發潰瘍係獨立的預後因素，倘若存在，則其會促使疾病自IIIB發展到IIIC³⁰。

「良好」預後組之平均TTP係40個月，而「較差」組之平均TTP係4個月。在年齡中位數與性別方面兩個組在統計學上沒有明顯的差別，但「良好」組似乎出現於年輕人中且含有較多女性。其他已知預後特徵(包括AJCC分期、佐劑干擾素之使用及腫瘤浸潤性淋巴細胞之存在)在統計學上沒有明顯的差別，但對試樣大小有所限制。

一名患者具有限定於遺留脾之孤立IV期疾病，但即使如此，其保持無病狀態，包括此試樣。排除此試樣並不改變基因表現譜。

經不同表現之基因可分開兩個預後組

無監督分層群集並不揭示與預後或另一臨床資訊(預計在兩試樣間具有相似性)相關之黑色素瘤的分組。為了搜尋可有效地分開預後組之基因，研究不同的基因表現。在兩個組之間有2,140個基因受到不同表現，然而多測試校正之嚴格應用可將此減少至具有高度明顯不同表現之22個基因(圖1)。使用qPCR進一步在訓練集中驗證這22個基因且選擇在兩個平臺(r>0.5,p<0.05)之間具有最高相關係數之基因以供進一步分析(數據未示出)。在初始22個基因中，有15個基因呈現高交叉-平臺相關性且此等用於研發預測評分。主要組成分析表明該15個基因分開各預後組之能力(圖7)。

預測評分之研發

初始測試集用於研發預測器，藉助兩個獨立的驗證集測試該預測器。依次基於陣列數據及qPCR數據研發兩種預測算法：

1.為了計算陣列數據(aPS)之預測評分，使用在陣列與qPCR之間具有最顯著相關性之15個基因。藉由將數值升高至2的冪來轉化歸一化之log₂表現比率。在「良好」預後組中基因下調被認為是陰性值。隨後藉由所有15個基因之數值的總和來計算最終評分。陽性評分與改良結果相關。

2.對於qPCR數據(qPS)，將15個最相關基因之ΔΔ C_T數值應用於邏輯回歸算法，該邏輯回歸算法利用Akaike Information Criterion來隻選擇彼等產生類別區分之基因。此選擇5種重要的基因，該等基因隨後用於下列等式：qPS=[1328.15-187.42(IDH)+137.10(MFG8)+73.61(PILRA)+211.22(HLA-E)+143.94(TXNDC5)]x-1

對於aPS而言亦為如此，陽性評分與使用此方法之改良結果有關。

與TTP及存活率相關之預測評分

如所預期，應用於測試集之aPS及qPS能夠區別兩個預後組。個別評分與TTP及總體存活率之強相關性係明顯的以致於個別評分(aPS之高評分及qPS之陰性評分)之數量與qPS及aPS之改良結果相關(圖8，Spearman等級相關r=0.7908,p<0.0001)。此表明此等經不同表現之基因的表現程度係與潛在的生物作用機制相關，該等生物學作用機制直接影響臨床結果，強調其預後相關性。

對3個獨立集應用預測評分

隨後將該等結果應用於獨立產生的數據。識別與我們自己相似患者之分組的一個公開數據集。在參與此研究之83名患者中²⁷，14名具有需長期追蹤觀察之III期疾病。在此分組中，使用應用於我們的測試集之類似標準，有10名患者被歸為「較差」(平均TTP為10個月)且四名被歸為「良好」(平均TTP為62個月)。當將aPS算法應用於此等試樣時，所有10名「較差」患者及四名「良好」患者中的兩名均受到正確地預測，產生85%之總體正確分類率。

接下來，我們將qPS算法應用於一獨立組(10個)來自Ludwig/Austin組織庫之腫瘤，使用5個最具預測力的基因對該組實施qPCR分析。該預測器可正確地歸類所有5個「良好」預後腫瘤但將5個「較差」試樣中的一個誤歸類(圖9)。該錯誤地歸類之「較差」試樣表示具有簡短TTP但具有長達6年之轉移性疾病總體存活率的患者。

該五個基因qPS亦可應用於第3組獨立的3期黑色素瘤試樣。此等試樣包括在3期疾病診斷後具有不足18個月之存活率的19名患者且在自3期診斷後可存活四年以上之18名患者。此等良好及較差預後組之qPS評分的分佈明顯不同(p=0.02)且示於圖10中。

討論

此實例顯示使用源自微陣列基因表現數據及qPCR之表現譜可成功地預測另一無差別的III期黑色素瘤患者組之臨床結果。在兩個獨立的集中，已經確定基於15個經不同表現之基因的兩個研發預測評分算法可應用於微陣列及qPCR數據以前瞻性地預測具有IIIB/C期黑色素瘤之患者的臨床結果。

選擇具有類似階段疾病之患者且若干研究已經表明，在不同階段取出的自體試樣之基因表現較具有類似階段疾病之患者間的基因表現更具相似性^27,31,32。在可用於以高達92%精確度前瞻性地預測結果之各組間觀測到受到不同表現之基因強調了該等基因之重要性。進而言之，預測器與TTP及總體存活率之相關性亦突出該預測器之用途以致於評分差別之量級直接與臨床結果相關。

其中在說明書中提及整數或具有已知等效值之分量時，此等等效值如同個別地陳述一般併入本文中。儘管藉助實例並參照其可能的實施例闡述本發明，但應理解可在不背離本發明範圍之情況下對其進行改良及/或修飾。

工業應用性

基於預後癌症標記物(具體而言，係黑色素瘤預後標記物)之本發明方法、組合物、套組及裝置可用於癌症(特定言之，係黑色素瘤)之預後及治療。

參考文獻

1. Australian Institute of Health and Welfare (AIHW): Cancer in Australia 2001. Canberra, Australian Institute of Health and Welfare Australasian Association of Cancer Registries (AACR), 2004

2. Florez A, Cruces M: Melanoma epidemic: true or false? Int J Dermatol 43:405-7, 2004

3. Thursfield V, Farrugia H, Giles G: Cancer in Victoria 2004, Canstat. Victoria, Cancer Epidemiology Centre, 2006,第32頁

4. Thompson JF, Scolyer RA, Kefford RF: Cutaneous melanoma. Lancet 365:687-701, 2005

5. Verma S, Quirt I, McCready D等人：Systematic review of systemic adjuvant therapy for patients at high risk for recurrent melanoma. Cancer 106:1431-42, 2006

6. Hersey P: Adjuvant therapy for high-risk primary and resected metastatic melanoma. Intern Med J 33:33-43, 2003

7. Kirkwood JM, Manola J, Ibrahim J等人：A pooled analysis of eastern cooperative oncology group and intergroup trials of adjuvant high-dose interferon for melanoma. Clin Cancer Res 10:1670-7, 2004

8. Sondak VK, Sabel MS, Mule JJ: Allogeneic and autologous melanoma vaccines: where have we been and where are we going? Clin Cancer Res 12:2337s-2341s, 2006

9. Balch CM, Sober AJ, Soong SJ等人：The new melanoma staging system. Semin Cutan Med Surg 22:42-54, 2003

10. Kirkwood JM, Strawderman MH, Ernstoff MS等人：Interferon alfa-2b adjuvant therapy of high-risk resected cutaneous melanoma: the Eastern Cooperative Oncology Group Trial EST 1684. J Clin Oncol 14:7-17, 1996

11. Kirkwood JM, Ibrahim JG, Sondak VK等人：High- and low-dose interferon alfa-2b in high-risk melanoma: first analysis of intergroup trial E1690/S9111/C9190. J Clin Oncol 18:2444-58, 2000

12. Efron, B.及Tibshirani, R. An Introduction to the Bootstrap. Chapman & Hall. 2005

13. McLaughlan GJ, Do K, Ambroise C Analyzing Microarray Gene Expression Data (Wiley Series in Probability and Statistics) 2004

14. Wright GW, Simon RM A random variance model for detection of differential gene expression in small microarray experiments. Bioinformatics 2003; 19:2448-2455.

15. Smyth GK. Linear models and empirical Bayes methods for assessing differential expression in microarray experiments. Statistical Applications in Genetics and Molecular Biology 2004; 3:Article 3.

16. Lönnstedt I.及Speed TP. Replicated microarray data. Statistica Sinica 2002; 12:31-46.

17. Ihaka R, Gentleman R. R: A language for data analysis and graphics. Journal of Computational and Graphical Statistics 1996; 5:299-314.

18. Becker RA, Chambers, JM and Wilks AR The New S Language. Wadsworth & Brooks/Cole 1988.

19. Hastie T, Tibshirani R, Friedman J The Elements of Statistical Learning Data Mining, Inference and Prediction Springer 2003

20. Gentleman R., Carey VJ, Huber W., Irizarry RA, Dudoit S. Bioinformatics and Computational Biology Solutions Using R and Bioconductor. Springer 2005.

21. Neter J, Kutner MH, Wasserman W, Nachtsheim CJ, Applied Linear Statistical Models McGraw-Hill/Irwin 1996

22. Venables, WN, Ripley, BD Modern Applied Statistics with S.(第4版) Springer 2002.

23. Ripley, B. D. Pattern Recognition and Neural Networks Cambridge University Press 1996

24. Cristianini N, Shawe-Taylor J An Introduction to Support Vector Machines (and other kernel-based learning methods) Cambridge University Press 2000

25. Breiman L, Friedman J, Stone CJ, Olshen RA Classification and Regression Trees Chapman & Hall/CRC 1984

26. Good, PI Resampling Methods: A Practical Guide to Data Analysis Birkhauser 1999

27. Winnepenninckx V, Lazar V, Michiels S等人：Gene expression profiling of primary cutaneous melanoma and clinical outcome. J Natl Cancer Inst 98:472-82, 2006

28. Benjamini Y, Hochberg Y: Controlling the false discovery rate: a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society 57:289-300, 1995

29. Livak KJ, Schmittgen TD: Analysis of relative gene expression data using real-time quantitative PCR and the 2(-Delta Delta C(T)) Method. Methods 25:402-8, 2001

30. Balch CM, Sober AJ, Soong SJ等人：The new melanoma staging system. Semin Cutan Med Surg 22:42-54, 2003

31. Wang E, Miller LD, Ohnmacht GA等人：Prospective molecular profiling of melanoma metastases suggests classifiers of immune responsiveness. Cancer Res 62:3581-6, 2002

32. Ramaswamy S, Ross KN, Lander ES等人：A molecular signature of metastasis in primary solid tumors. Nat Genet 33:49-54, 2003

<110> 1.紐西蘭商太平洋愛吉生技股份有限公司 2.美國樂威格癌症研究協會

<120> 黑色素癌之預後預測

<130> 227282TW

<140> 097119301

<141> 2008-05-23

<150> NZ555363

<151> 2007-05-24

<160> 34

<170> PatentIn version 3.3

<210> 1

<211> 20

<212> DNA

<213> 人工序列

<400> 1

<210> 2

<211> 20

<212> DNA

<213> 人工序列

<400> 2

<210> 3

<211> 20

<212> DNA

<213> 人工序列

<400> 3

<210> 4

<211> 20

<212> DNA

<213> 人工序列

<400> 4

<210> 5

<211> 19

<212> DNA

<213> 人工序列

<400> 5

<210> 6

<211> 21

<212> DNA

<213> 人工序列

<400> 6

<210> 7

<211> 23

<212> DNA

<213> 人工序列

<400> 7

<210> 8

<211> 20

<212> DNA

<213> 人工序列

<400> 8

<210> 9

<211> 20

<212> DNA

<213> 人工序列

<400> 9

<210> 10

<211> 20

<212> DNA

<213> 人工序列

<400> 10

<210> 11

<211> 21

<212> DNA

<213> 人工序列

<400> 11

<210> 12

<211> 21

<212> DNA

<213> 人工序列

<400> 12

<210> 13

<211> 27

<212> DNA

<213> 人工序列

<400> 13

<210> 14

<211> 24

<212> DNA

<213> 人工序列

<400> 14

<210> 15

<211> 18

<212> DNA

<213> 人工序列

<400> 15

<210> 16

<211> 20

<212> DNA

<213> 人工序列

<400> 16

<210> 17

<211> 21

<212> DNA

<213> 人工序列

<400> 17

<210> 18

<211> 18

<212> DNA

<213> 人工序列

<400> 18

<210> 19

<211> 20

<212> DNA

<213> 人工序列

<400> 19

<210> 20

<211> 22

<212> DNA

<213> 人工序列

<400> 20

<210> 21

<211> 20

<212> DNA

<213> 人工序列

<400> 21

<210> 22

<211> 20

<212> DNA

<213> 人工序列

<400> 22

<210> 23

<211> 20

<212> DNA

<213> 人工序列

<400> 23

<210> 24

<211> 20

<212> DNA

<213> 人工序列

<400> 24

<210> 25

<211> 21

<212> DNA

<213> 人工序列

<400> 25

<210> 26

<211> 19

<212> DNA

<213> 人工序列

<400> 26

<210> 27

<211> 22

<212> DNA

<213> 人工序列

<400> 27

<210> 28

<211> 22

<212> DNA

<213> 人工序列

<400> 28

<210> 29

<211> 20

<212> DNA

<213> 人工序列

<400> 29

<210> 30

<211> 18

<212> DNA

<213> 人工序列

<400> 30

<210> 31

<211> 20

<212> DNA

<213> 人工序列

<400> 31

<210> 32

<211> 21

<212> DNA

<213> 人工序列

<400> 32

<210> 33

<211> 20

<212> DNA

<213> 人工序列

<400> 33

<210> 34

<211> 21

<212> DNA

<213> 人工序列

<400> 34

Claims

一種裝置之用途，其係用於測定黑色素瘤之預後，該裝置包括：一個基板，其上具有一個或多個位置，各位置上具有兩種或多種寡核苷酸，各寡核苷酸選自一種或多種MPM，其中至少一種MPM為MFGE8。
如請求項1之用途，其中該裝置為陣列(array)或其中其他MPM之一係選自含有硫氧還蛋白結構域之蛋白5、2型成對免疫球蛋白樣受體α、主要組織相容性複合體，I類，E、kiaa1067、肌苷三磷酸酶(三磷酸核苷焦磷酸酶)、聯絲蛋白(Desmuslin)、GTP結合蛋白2、可溶性異檸檬酸脫氫酶1(NADP+)、線粒體核糖體蛋白S5、可溶性結合半乳糖苷之凝集素7(半乳凝素7)、Kv通道相互作用蛋白2、碳水化合物(N-乙醯基葡萄糖胺6-O)磺基轉移酶4、整體基因掃描預測、人類獨立於磷酸酪胺酸之配體、存於B細胞抑制劑中之κ輕鏈多肽基因增強子的核因子β、線粒體載體同系物2(線蟲)、ADP-核糖基化因子相關蛋白1、白樺花粉過敏原特異性免疫球蛋白γ鏈、微管蛋白α1b、部分n-myc外顯子3及神經叢蛋白(Plexin)B2。
如請求項2之用途，其中該陣列為微陣列。