TW523699B

TW523699B - Method and computer program product for designing combinatorial arrays

Info

Publication number: TW523699B
Application number: TW090104949A
Authority: TW
Inventors: Dimitris K Agrafiotis; Victor S Lobanov; Francis R Salemme
Original assignee: Dimensional Pharm Inc
Priority date: 2000-02-29
Filing date: 2001-03-01
Publication date: 2003-03-11
Also published as: US6671627B2; AR027586A1; AU2001241800A1; WO2001065462A3; WO2001065462A2; US20010029026A1

Description

523699 A7 B7 五、發明説明〇 ) 發明背景 1. 發明領域 (請先閲讀背面之注意事項再填寫本頁) 本發明，一般而言，係相關於組合化學的領域，尤其 .是相關於一種用於設計組合陣列之方法及電腦程式產品。 2. 相關技術經濟部智慧財產局員工消費合作社印製從歷史觀點來看，藥品的發現是基於一連串且有系統的化學結構修正，此修正是遵行「相似性質原理」，亦即，假設結構上相似的化合物易於表現出相似的物理化學及生物性質。新的治療劑通常是經由確認一種先導化合物，再以有系統且直接的方式創造該化合物的變體而產生。第一階段的過程，即所謂的先導生代，是由在大量的化合物中隨機篩選而完成。這樣的化合物挑選可包含天然物種、人工物種，等等。第二階段的過程，即所謂的先導最佳化，代表藥品發現上的限速步驟。此步驟包含環繞先導化合物之充分的結構活性關係（SAR )的細節及其藥理槪要的精確性。在組合化學還未被使用之前，此過程指一簡單的合成目標之優先化，其以早已存在之結構活性資料、合成可行性、經驗與直覺爲基礎。近來在合成及篩選技術上的改進已使得同步合成及包含數百至數萬個化合物之化學資料庫中的生物評估成爲可能。隨著固相與液相化學知識的擴展，以及基礎自動硬體的不斷改進，組合化學已經走出了它在傳統上用於大量篩選時當做一個化合物資源的角色，而今它慣常被應用在先導最佳化及SAR的精確性上。此導致對組合資料庫的槪念 -4- 本紙張尺度適用中國國家標準（CNS ) Α4規格（210X297公釐） 523699 Α7 Β7 五、發明説明（2 ) 一分爲二：（1 )具有與目標無關且被設計以測量各種類別之物理化學及結構特性的探索性或綜合性資料庫，以及（2 )偏向某一特定目標、結構類別、或已知之藥效基團的專一性或應用性資料庫。有兩種因用來設計組合實驗而聞名的方法。第一種叫做「單一法」或「稀疏陣列法」，其意指某些生成物的一個子集合’這些生成物也許代表或也許不代表一組特定試劑之所有可能的組合。第二種叫做「全陣列法」或簡稱「陣列法」’其代表在反應圖示指定之所有可能的組合中結合一特定試劑子集合而衍生的所有生成物。這兩種問題的組合本質有極大的不同。就單一法來說，我們必須考慮的可能數量（一個η集合中之各種k子集合的數量）是由下列二項式來表示 (請先閱讀背面之注意事項再填寫本頁) η! ⑴ 反之，從一個

導出的各種k! X (n-k)lkl X n2 X…nR之R-成份組合資料庫中所 …kR陣列的數量是由下列式子來表示 (2) 經濟部智慧財產局員工消費合作社印製對一個10x10之雙成份組合資料庫而言，共有1〇25個包含25個化合物之不同的子集合（單一法），而且只有63,5〇ζ 個不同的5x5陣列。對一個ιοοχίοο的資料庫及一個 1 00/1 Οχ 1 0的挑選方式而言，那些數字對單一法和陣列法分別增加至1〇241及1 0 2 6。請注意在本文中，「陣列」基本上相等於以生成物的特性爲基礎而做的試劑挑選，而且未必指的是實際的實驗安排及執行。大體上，雖然就達成設計目本紙張尺度適用中國國家標準（CNS ) Α4規格（2丨0X 297公釐） _ 5 _ 523699 A7 B7 五、發明説明（3 ) 標來說陣列法較差，但其需要的試劑較少且實際上也較容易合成。 (請先閲讀背面之注意事項再填寫本頁) 產生組合陣列之常見的方法包含試劑運用法及以隨機抽樣爲基礎的生成物運用法。試劑運用法檢驗每個變異點且不受組合資料庫中其他變異點的影響。變異點是指允許在組合結構中建多區塊之組合核心上的一個點。例如，在一個雙成份組合資料庫中，此設計是經由分別在R丨與R2 中各挑選出一串具有指定特性的試劑而完成，然後，將從 R 1中挑選出的試劑與從R2中挑選出的試劑化合以產生—串生成物，構成組合陣列。雖然這種方法藉由檢驗各個試劑池而簡化了挑選過程且不受其他試劑池的影響，但最重要的生成物特性卻從未被明確地考量。這種方法反而是以希望選定之試劑能產生具有指定特性的一串生成物·爲出發點 0 經濟部智慧財產局員工消費合作社印製以生成物特性爲基準的試劑挑選方式在傳統上藉由具有推測本質的演算法來達成。例如，在一個雙成份組合資料庫中，從R 1及R2中隨機地挑選出一些試劑。將從R 1中挑選出的試劑與從R2中挑選出的試劑化合，進而對照某設計目標以評估所產生的生成物。例如，倘若設計目標是要獲得本質上與某已知之藥物分子相似的生成物，該生成物則會以其與該已知之藥物分子的相似度爲基準而被評估，從而產生某個數値。接著，在一變異點上隨機地挑選出其中一個選定試劑，再用另一個從該變異點上之候選試劑中隨機挑選出的試劑來取代之。較好或較差的情況都可能會發本紙張尺度適用中國國家標準（CNS ) A4規格（210X 297公釐） -6 - 523699 A7 一 B7 五、發明説明（4 ) (請先閱讀背面之注意事項再填寫本頁) f °重複進行此過程直到達到某收斂性判定標準或期限爲止’譬如說，直到相對於該已知藥物分子而產生之相似度數値無法再提升爲止。因此，隨機抽樣的方法需要有一定數量的試驗，直到獲得一個滿意的結果爲止。我們所需要的是一個用於設計組合陣列的演算法，此胃算法利用目標函數可分解或近乎可分解成個別的分子貢獻時的最佳結構並允許用一種有利的方式挑選出最佳或將近最佳的陣列。我們近一步所需要的是一種用於設計組合陣列的方法，此方法以與一或多個參考化合物之相似度，抑或’依據一或多個QSAR、藥效基團或感應器結合模型對於一或多個生物目標之預測的活性及/或選擇性、對一或多個疑問或探索之一致程度、在某些性質界限內之包含性，寺寺爲基礎 ° 發明之槪述經濟部智慧財產局員工消費合作社印製本發明藉由提供一種用於設計組合陣列之貪心法及電腦程式產品以解決上述問題。此貪心法特別適用於當目標函數可分解或近乎可分解成個別的分子貢獻時之情況。本發明利用一種啓發式的方法，使能獨立評估組合資料庫中每個變異點上的候選試劑並對其做等級的排列。此貪心法被執行時是收歛的且以一種有利的方式產生組合陣列。由貪心法所產生的組合陣列解是比得上且常常優於那些由本質上更爲複雜且更需要密集計算之隨機抽樣技術所導出的解。可修正成此方法之設計目標的典型範例包含與一或多個參考化合物之相似度、依據一或多個結構活性或感應器 ^紙張尺度適用中國國家標準（CNS ) A4規格（210X 297公釐）~7^ 523699 A7 B7_____ 五、發明説明（5 ) (請先閱讀背面之注意事項再填寫本頁) 結合模型之預測的活性及/或選擇性、對一或多個疑問或探索之一致程度、在某些分子性質界限內之包含性，以及其他種種。根據本發明之貪心法，最初隨機地或以某種其他技術從一組合資料庫中挑選出一系列的試劑並評估其適合度（亦即，其滿足設計目標的程度）。藉由一嚴格交替順序來處理組合資料庫中每個變異點上的試劑列表，反覆地進行使此最初的挑選結果更精確。在每一步驟中，由檢測中之變異點上的各候選試劑與資料庫中剩餘之變異點上的選定試劑結合所產生的每個次陣列會被評估且其適合度會被記錄下來。對該變異點而言，產生最佳（最適合）次陣列的候選試劑會被挑選出來，而下一個變異點則以相似的方式處理。當所得之組合陣列的適合度無法再提高時，此過程便會終止。此過程可能會重複進行好幾次，每次都從一個不同的起始陣列開始。在觀念上，此過程適用於當適合度函數可分解或近乎可分解成個別的分子貢獻時之情況。經濟部智慧財產局員工消費合作社印製關於本發明進一步的特色與優點’以及本發明之結構及各實施例的操作，將在以下與附件圖式有關的內文中詳加敘述。在圖式中，像參考號碼是用來指出相同的及/或功能上相似的元素。再者，在參考號碼最左邊的數字是用來指出第一次提及相關元素時的圖式。圖示簡要說明於此倂入並成爲本說明書之一部分的附件圖式，以圖例加上描述來說明本發明，進一步爲本發明之原理提供解本纸張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） _ 8 - 523699 Α7 Β7 五、發明説明（6 ) 釋並使熟習相關技術者能善加利用本發明。圖1 A爲一圖表，說明以單一法（稀疏陣列法）格式從一假定的雙成分組合資料庫中挑選出化合物。圖1 B爲一圖表，說明以陣列法（全陣列法）格式從一假定的雙成分組合資料庫中挑選出化合物。圖2A及2B爲一用於產生組合陣列之方法的流程圖。圖2C-2H爲簡化範例，用來說明反覆地以貪心法從一 10x10組合資料庫中挑選出一 3x2陣列。圖3爲一圖表，說明還原胺化資料庫之合成順序。圖4爲一圖表，說明用於製作二胺資料庫之合成順序。圖5爲一圖表，說明用於從還原胺化資料庫中挑選相似度的一參照結構。圖6爲一長條圖，說明根據與一參照結構之最大相似度 ’從一還原胺化資料庫中挑選出1 00個化合物之相似度比數的平均値及標準差。圖7A爲一圖表，說明根據與一參照結構之最大相似度，從一還原胺化資料庫中挑選出一 10x10陣列之化合物的分佈情況。圖7 B爲一圖表，說明根據與一參照結構之最大相似度，從一還原胺化資料庫中挑選出1 00個稀疏陣列之化合物的分佈情況。圖8爲一圖表，說明根據與一參照結構之最大相似度’ 從一還原胺化資料庫中挑選出構成一 1 Οχ 10最佳化陣列之月安試劑及醛試劑。本紙張尺度適用中國國家標準（CNS ) A4規格（210X 297公釐） —ς> - (請先閱讀背面之注意事項再填寫本頁) .裝· 訂經濟部智慧財產局員工消費合作社印製 523699 A7 _ B7 _______ 五、發明説明（7 ) (請先閲讀背面之注意事項再填寫本頁) 圖9爲一圖表，顯示以模擬退火法及本發明之貪心法，從一還原胺化資料庫中挑選出1 00個不同的隨機先導物之最佳1 Ox 1 0陣列的相似度比數之比較情形。圖1 0爲一圖表，說明用於從一還原胺化資料庫中做相似性應用之多目標挑選的一參照結構。圖1 1 A爲一圖表，說明根據與一參照結構之最大相似度，從一還原胺化資料庫中挑選出一1 Ox 1 0陣列的化合物之差異空間的分佈情況。圖1 1 B爲一圖表，說明根據與一參照結構之最大相似度，從一還原胺化資料庫中挑選出一 10x10陣列的化合物之分子量對計算出之log P的分佈情況。圖12爲一圖表，說明根據與一參照結構之最大相似度，從一還原胺化資料庫中挑選出構成一 1 Ox 1 0陣列之試劑。圖13A爲一圖表1 300，說明根據一參照結構及方程式（ 9 )(列於後文），從一還原胺化資料庫中挑選出一 1 〇x 1 0 陣列的化合物之差異空間的分佈情況。經濟部智慧財產局員工消費合作社印製圖1 3B爲一圖表，說明根據一參照結構及方程式（9 ) (列於後文），從一還原胺化資料庫中挑選出一 10x10陣列的化合物之分子量與計算出之log P的分佈情況。圖14爲一圖表，說明根據一參照結構1 000及方程式（9 )(列於後文），從一還原胺化資料庫中挑選出構成一 10x10陣列之試劑。圖15爲一長條圖，說明根據與一最佳化收集超過100次的隨機挑選結構（5x5x5陣列，125個稀疏陣列）之最大相 $紙張尺度適用中國國家標準( CNS ) A4規格（210X 297公釐） 7]〇1 523699 A7 B7 五、發明説明（8 ) 似度，從一個二胺資料庫中挑選丨2 5個化合物之相似度比數的平均値及標準差。 (請先閱讀背面之注意事項再填寫本頁) 圖16爲一圖表1 600，說明根據與1〇〇個隨機先導物之最大相似度，以模擬退火法及本發明之貪心法，從一個二胺資料庫中挑選出最佳5x5x5陣列的相似度比數之比較情形。圖1 7爲一長條圖，說明以本發明之貪心法分別從還原胺化資料庫及二胺資料庫中挑選出1〇〇、400、1 600、6400及 2 5 6 0 0個化合物時所需之c p u時間。圖1 8爲一電腦系統之範例實作。涉及如全面地指出對應元素之參考特性的圖式時，本發明之特色、目標及優點會從下文中所提出之詳細的敘述中變得更加明顯。在圖式中，像參考號碼通常是用來指出相同的、功能上相似的及/或結構上相似的元素。’對應的參考號碼之最左邊的數字指出某元素第一次出現時的圖式。主要元件對照 1 方格網 5 第二網點 2 列 6 方格 3 行 7 黑色的方格 4 第一網點 8 黑色的方格較佳實施例之詳細描述經濟部智慧財產局員工消費合作社印製雖然在此描述之本發明與用以說明特殊用途之實施例有關，但應瞭解本發明並非局限於這些實施例。獲取本處所提供的教學之熟習此項技術者會認可額.外的修正、應用本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） -1 1 - r523699 Α7 Β7 五、發明説明（9 ) ’以及本發明之範圍內和附加領域中的實施例，這些都將使本發明表現出重要的實用性。 1.槪要本發明是一種用於設計組合陣列之方法及電腦程式產品，尤其，本發明是以一種能滿足一或多個設計目標至某特定程度的方式，從一組合資料庫之一或多個變異點上的試劑中挑選出一組試劑子集合的一種方法及電腦程式產品。當目標函數（亦即，測量一組特別挑選出之化合物能滿足設計目標之程度的函數）可分解或近乎可分解成個別的分子貢獻時，可應用本發明之方法。本發明利用一種啓發式的方法’使能獨立評估組合資料庫中每個變異點上的候選試劑並對其做等級的排列。此方法相當快速且收斂。由採用本發明之方法所產生的組合陣列解是比得上且常常優於那些由上述之本質上更複雜且更需要密集計算之隨機抽樣技術所導出的解。可修正成但非局限於此方法之設計目標的範例包含與一或多個參考化合物之相似度、依據一或多個結構活性或感應器結合模型之預測的活性及/或選擇性、對一或多個疑問或探索之一致程度、在某些分子性質界限內之包含性，以及其他種種。用於設計組合實驗的兩個知名的方法爲「單一法」（ •亦指「稀疏陣列法」）及「全陣列法」（或簡稱「陣列法」）。單一法意指某些生成物的一個子集合，這些生成物也許代表或也許不代表一組特定試劑之所有可能的組合。本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐）， -Ί X - (請先閲讀背面之注意事項再填寫本頁) >裝· ,· 經濟部智慧財產局員工消費合作社印製 523699 Α7 Β7 五、發明説明（10 ) 全陣列法代表在反應圖示指定之所有可能的組合中結合一特定試劑子集合而衍生的所有生成物。 (請先閲讀背面之注意事項再填寫本頁) 圖1A爲一圖表，說明以單一法格式從一假定的雙成分組合資料庫中挑選出化合物。一方格網1 〇2代表一虛擬資料庫。對物理合成及/或試驗而言’虛擬資料庫的主要功能在於能挑選較小的次資料庫。方格網1 〇2由9個列10 4與17個行 106組成。雖然一 9x1 7大小的方格網被用於圖1 A，但這僅做爲示範之用。熟習此技術者會瞭解虛擬資料庫在本發明的範圍之內可大可小。每個行1 〇 6代表第一網點10 8上的一個不同的試劑R1，譬如說，每個試劑R1代表一個不同的乙醛。每個列1 04是第二網點110上的一個不同的試劑R2，譬如說，每個試劑R2代表一個不同的胺。方格網102的每個方格 11 2代表一個不同的生成物，例如，由一特定的胺R2與一特定的乙醛R1化合所產生的生成物。經濟部智慧財產局員工消費合作社印製在此範例中，9個化合物透過單一法的使用被挑選出來且以黑色的方格114來表示。該單一法挑選化合物橫跨9列8 行，因此，被選定之化合物使用9個不同的乙醛與8個不同的胺。利甩單一法來設計組合實驗不但需要考慮很多可能，也需要使用很多試劑。不管是由人工或機器來執行合成 ’以單一法格式來合成化合物通常是費力且耗時的。雖然這方法最可能符合我們的設計目標，但幾乎總會導致極其、昂貴且難以執行的實驗。因此，爲了控制成本並簡化合成，即使陣列法就達成主要設計目標來說一般較差，但通常仍以陣列法格式來合本紙張尺度適用中國國家標準（CNS ) M規格（21〇χ 297公釐） ~ ' -- 523699 Α7 Β7 五、發明説明（Μ ) (請先閲讀背面之注意事項再填寫本頁) 成組合資料庫。圖1 Β爲一圖表，說明以陣列法格式從—假定的雙成分組合資料庫中挑選出化合物。9個化合物透過陣列法的使用被挑選出來且以黑色的方格11 6來表示。胃@歹υ 法挑選化合物橫跨3列3行。與用於設計組合實驗的單—法相反之陣列法只運用3個不同的乙醛與3個不同的胺，因而導致所需使用的試劑較少。不管是由人工或機器來執行合成，以陣列法格式來合成化合物通常是較容易實行的。本發明之方法被用於從組合資料庫之所有可能的陣列中挑選能滿足一組設計目標至某特定程度之一陣列。 2. 設計目標經濟部智慧財產局員工消費合作社印製爲示範之用，必須考慮三種設計目標或挑選標準，亦即（1 )與一特定先導物或一組特定先導物之最大相似度（相似度）（2 )與一組指定的特性限制之最大適合度（限制 )(3 )對一特定生物目標之的最大活性及/或選擇性（活性/選擇性）。雖然只敘述三種設計目標，但本發明並非局限於此三種設計目標，也可使用其他可分解或近乎可分解成個別的分子貢獻之設計目標。在一實施例中，可單獨使用每一個設計目標及/或結合另一個設計目標來使用。 3. 相似度一組特定的化合物C與一組先導物之相似度被定義爲一化合物至其最近之先導物的平均距離：本紙張尺度適用中國國家標準（CNS ) Α4規格（210X297公釐） 523699 經濟部智慧財產局員工消費合作社印製 A7 _B7 __ 五、發明説明（12 )S(C) =适如〜) ⑶ 其中，N爲C的基數，L爲先導物的數量且du爲某分子描述符空間中第1個化合物與第j個先導物之間的距離。較高的相似度比數指出距離先導物更遠且與其較不相似的大量化合物。因此，把S縮減至最小限度即可得到專一性資料庫。倘若先導物的數量龐大，方程式（3 )中最內部的迴圈可藉由 D.K. Agrafiotis et al·，39 J· Chem. Inf. Computer SC1.，5 1 -8 ( 1 999)中所描述的k-d樹狀演算法來計算，此處所表示之該演算法乃出自於對該文的全面性參考。 4.限制此設r目標測量指定範圍內之一組特定化合物之特性的適合度，被定義爲： />(〇 =去 2 S maxU;•娜 _ %％巧酿，〇) ⑷ N i j v.:“ rr . 其中，XU爲第i個化合物之第j個特性，而x/in及x/aX爲分別受限於第J個特性的最小値及最大値。此函數値隨著越來越多的化合物落於欲得特性的範圍之外而增加。因此，把P 縮減至最小限度即可得到受限性資料庫。在一採用多種特性的實施例中，我們必須將特性標準化或將其加權以做出、有意義的比較。在一欲得特性必須達到一特定目標値（亦即，就一退化範圍而言）的實施例中，方程式（4 )可被改寫成：本紙張尺度適用中.國國家標準（CNS ) A4規格（210X297公釐） (請先閱讀背面之注意事項再填寫本頁) 一裝- 訂 f -15- 523699 A7 B7 五、發明説明（13 ) p(c)=士 ΣΣ—(w) (5) » j (請先閱讀背面之注意事項再填寫本頁) 其中，χ/表示第」個特性的目標値。 5.活性/選擇性資料庫設計中的一共通目標在於產生化合物之陣列，此陣列依據某定量的結構活性或感應器結合模型對一預先定義的目標而言被預測具有最大活性。當個別化合物之預測活性總計如下時，此目標藉由表現一組特定的化合物C 之預測活性來完成： 2“c)=告(6) i 其中，ai是‘ C中第i個化合物之預測活性的某個基準。一相似的函數可用來測量對一組生物目標之選擇性： 2:(C) = 士Σ(〜Ux(〜)） (7) 經濟部智慧財產局員工消費合作社印製其中，au是對第j個目標之第i個化合物的預測活性，而k 是分子被挑選時應該對應的目標。當化合物變得更具活性/ 選擇性時，QA/QS之値增大。因此，將其標準分別增加至最大限度即可得到活性/選擇性資料庫。 • 6.多目標設計在一實施例中，個別的設計目標，例如但不限於之前所描述的設計目標，可以相互結合以產生滿足多種設計目本纸張尺度適用中國國家標準（CNS ) A4規格（210X297公着7 -16- 523699 A7 B7 經濟部智慧財產局員工消費合作社印製五、發明説明（14 ) 標之陣列，此導致一多目標適合度函數，其被定義爲： F(C) = f(Fl(C\F2(C)^) (8) 其中，F(C)是整體效率測量，而Fi(C)爲與C集合有關的個別標準。在最後的挑選中，此函數的正確形式及與個別設計目標有關的係數決定了每個設計目標的影響度。 7 .本發明之貪食法如前所述，本發明最適用於目標函數被描述成個別分子的貢獻之情況。本發明允許以一種有利的方式挑選最佳的或近乎最佳的陣列。本發明利用下列之最佳化啓發法。使目標函數達到最大値的I試劑，在被給予一含有C個成份的組合資'料庫、一 i 6 [ 1，C]的點及一特別選出的心試劑（其中j zz 1，2，.··，i-1，i+1，·.·，C)之後，藉由建構並評估Ri 中之單一試劑與中所有選定之試劑組合而產生之所有可能的次陣列，並且從中挑選具有最佳適合度（亦即，其滿足設計目標的程度）的次陣列，此Ri試劑便得以被確定。此過程始於一隨機選取之陣列，然後按先後次序對每一變異點做最佳化直到不可能再有進一步的改進爲止。例如，考慮從一 10x10x10組合資料庫中挑選出一 5x5x5 陣列的情形。此過程始於從每一變異點隨機選出5個試劑並 •評估產生之陣列的適合度。藉由一嚴格交替順序來處理每一個試劑列表，反覆地進行使此最初的挑選結果更精確。首先，將Ri中的各試劑與R2及R3中的選定試劑結合以建構本紙張尺冬適用中國國家標準（CNS ) A4規格（210X29?公釐） -17- (請先閱讀背面之注意事項再填寫本頁) 【裝、訂 f 523699 A7 ________B7 _ 五、發明説明（15 ) (請先閲讀背面之注意事項再填寫本頁) 10個1x5x5的次陣列。針對設計目標來評估所得之化合或生成物以決疋其適合度。R i中的各試劑依次被評估，而得分最高的5個試劑從L中被挑選出來。接著，對R2重複進行此過程。R2中的各試劑被用來與1^及R3中的選定試劑結合以建構一 5x1x5的次陣列，而對該變異點而言，產生最佳適合度的5個R2試劑被挑選出來。然後，以相似的方式來處理r3 ，如此便完成了一個精確化的週期。一旦所有的試劑列表都被處理過了，從各變異點所選定的試劑將被組合，而產生出之全陣列的適合度會受到評估並與前一個週期最後所選出的適合度做比較。假如適合度有改進，則精確化過程將由L開始重複進行；若無改進，則此過程停止進行。圖2 A與2 B爲一用於產生組合陣列之方法的流程圖。組合資料庫中‘替代點的數量以C來表示。試劑的總數量及所需之陣列在第i點的大小則分別以Ni及Ki來表示。由圖2A開始，此過程始於步驟202，再直接進入步驟 204 ° 經濟部智慧財產局員工消費合作社印製在步驟204中，試劑列表被起始爲{Ru =： j; j = l，2，...，Ni; i = 1，2，·.·，C}。試劑列表的數量等於組合資料庫中替代點的數量C。本過程進入步驟206。在步驟206中，各Ri試劑列表中的試劑順序是隨機排列的。在步驟208中，評估並記錄所產生之陣列的適合度。接著，本過程進入步驟210。在步驟2 1 0中，藉由一嚴格交替順序來處理每一個試劑 -18- ^紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐了 523699 A7 B7 五、發明説明（16 ) 列表的反覆過程由此開始。 (請先閱讀背面之注意事項再填寫本頁) 在步驟2 1 2中，從步驟2 1 0已確定的試劑列表中處理每一試劑之內部反覆迴圈由此開始。在步驟214中，將從步驟210已確定的試劑列表中在步驟2 12已確定之試劑與其他變異點中所選定之試劑組合，產生次陣列並評估其適合度。接著，本過程返回進入步驟2 1 2 以評估步驟2 1 0所確定之試劑列表中的下一個試劑，已確定之試劑列表中的各試劑在步驟214中依次被評估。當已確定之試劑列表中的所有試劑都被評估過後，則本過程進入圖 2B的步驟216。經濟部智慧財產局員工消費合作社印製在步驟216中，選出具有最佳適合度的試劑。此步驟要求將步驟210已確定之試劑列表中的試劑以適合度由大至小的順序重新排列，具有最佳適合度的試劑將被排在試劑列表中的第一位。然後，本過程返回進入圖2A的步驟2 10以重新開始下一個試劑列表的反覆過程。每個試劑列表都會重複進行步驟2 1 2-2 1 6。當所有試劑列表都被處理過後，便完成了一個精確化的週期。一個精確化的週期一旦完成，本過程便進入步驟218。在步驟218中，組合從各變異點所選定的試劑並評估產生之全陣列的適合度。本過程繼而進入決定步驟220。在決定步驟220中，將產生之全陣列的適合度與前一個 •週期最後所選出的適合度做比較。假如產生之全陣列的適合度大於前一個週期最後所選出的適合度，則適合度有改進。本適合度將被步驟221中的下一個精確化的週期認定爲 -19· 本紙張尺度適用中國國家標準（CNS ) A4規格（21〇Χ：297公釐） 523699 經濟部智慧財產局員工消費合作社邱製 A7 ___ B7 ___-五、發明説明（17 ) 前一次的適合度。接著，本過程返回進入圖2A的步驟210以執行另一個精確化的週期。返回至圖2B的決定步驟220，假如產生之全陣列的適合度小於或等於前一個週期最後所選出的適合度，則適合度沒有改進，而本過程進入步驟222。在步驟222中，產生之組合陣列被視爲輸出結果，而本過程結束。爲了將計算量減到最少.，貪心法的一個實施例預先爲整個資料庫中的每個化合物計算出其對目標函數的個別貢獻並將之儲存在工作陣列中。此步驟只需執行一次且其級數爲〇（N)。在最佳化期間，僅加入預先計算出之組成該陣列的分子之個別貢獻即可對任何一特定陣列或次陣列的適合度做評估4。貪心法偶爾會陷入只獲得局部最小値的情況，爲此，本過程可由一不同的亂數種子（亦即，不同的、隨機選取的起始陣列）開始重複進行幾次，而具有最佳適合度的陣列則被挑選出來。在另一種修正較少的實施例中，此貪心法可被用來從一個特定之虛擬資料庫的大陣列中挑選出較小的次陣列。又另一種實施例中，構成最後陣列的一或多個試劑可能會被預先選出，在此情況下，此貪心演算法會嘗試去塡滿組合陣列，亦即，指出哪些試劑需要被加入預先選出的試劑中以產生一最佳的或近乎最佳的陣 -歹[]0 圖2C-2H爲簡化範例，用來說明反覆地以貪心法從一 10x10組合資料庫中挑選出一 3x3陣列。本紙張尺冬適用中.國國家標準（CNS ) A4規格（210X297公釐） -20- (请先閱讀背面之注意事項再填寫本頁) •装· 訂 523699 A7 __ B7 ___ 五、發明説明（18 ) 圖2C顯示R 1與R2試劑列表中的起始等級排列。 (請先閲讀背面之注意事項再填寫本頁) 圖2D顯示試劑於隨機排列之後在R1與R2試劑列表中的排列順序。此陣列被測出之適合度的數値爲6。圖2E顯示試劑在R2的前3個試劑與R1的各試劑組合後於R 1與R2試劑列表中的排列順序、爲適合度而估算出的組合，以及重新排序之後在R1中的試劑。圖2F顯示試劑在R1的前3個試劑與R2的各試劑組合後於R 1與R2試劑列表中的排列順序、爲適合度而估算出的組合，以及重新排序之後在R2中的試劑，如此便完成了一個精確化的週期。產生之3x3陣列被測出的適合度爲8，因爲8 比6大，故此過程必須重複進行，而新的前一次之適合度則被設爲8。圖2G顯示試劑在R2的前3個試劑與R1的各試劑組合後於R 1與R2試劑列表中的排列順序、爲適合度而估算出的組合，以及重新排序之後在R1中的試劑。經濟部智慧財產局員工消費合作社印製圖2H顯示試劑在R1的前3個試劑與R2的各試劑組合後於R 1與R2試劑列表中的排列順序、爲適合度而估算出的組合，以及重新排序之後在R2中的試劑，如此便完成了一個精確化的週期。產生之全陣列被測出的適合度爲8，因爲新的適合度數値8並未大於前一次的適合度數値8，故產生之全陣列爲一輸出結果且本過程結束。 *« 8.用以提供組合陣列之貪心法的應用爲了測試此貪心法的效率，一模擬退火法被用來做比本紙張尺度適用中國國家標準（CNS) A4規格（210X297公釐） -21 - 523699 A7 _ _ B7 五、發明説明（19 ) (請先閲讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製較。此模擬退火法在設計組合資料庫時被判定爲非常有效率的方法，其包含二個主要部分：一搜尋引擎及一目標函數。此搜尋引擎從一虛擬集合（亦被稱爲一狀態）中產生一含有k個化合物的列表，接著用一目標函數來評估這些化合物以產生其品質或適合度的一個估計數値。此目標函數針對實驗之設計目標做編碼，例如化合物的本質差異或其與一組預先定義之先導物的相似度。此適合度之數値會被回傳至搜尋引擎，搜尋引擎再以一種控制方式修正其狀態並產生一新的化合物列表。接著，再以上述方式針對設計目標標準依次對這些化合物做評估。這個過程會被重複進行直到不可能再改進，或者，直到已達某些預定的收斂標準或時間限制爲止。在手邊的例子中，此挑選歷經30個溫度週期後完成，每一週期使用1000次抽樣步驟、一高斯冷卻進度表，以及梅卓布理斯驗收標準（P = e _AE/KptT )，這些都是熟習相關技術者所熟知的。對陣列挑選而言，一個步驟即代表組合陣列中單一試劑的取代。在模擬期間內不斷地更新轉換能的平均値並持續調整Kb的數値，因此玻耳茲曼的^常數」Kb是以一種適應性的方式被調整，致使在最後溫度時之平均上升轉換的驗收機率爲0.001。在D.K. Agrafiotis, J. Chem. Inf. Computer Sci., 576-90, 84 1 -5 1 ( 1997)中，可找到此演算法的細節，此處所表示之該演算法 •乃出自於對該文的全面性參考。 9.資料集本纸張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） -22- 523699 A7 B7 五、發明説明（20 ) (請先閲讀背面之注意事項再填寫本頁) 有兩個資料集被用來測試本發明的效用。第一個資料集是一個以還原胺化反應爲基礎的雙成分組合資料庫，圖3 說明還原胺化資料庫之一合成順序300。藉由將主要或次要胺的溶液加入至1，2 -二氯乙烷/二甲基甲醯胺內之等莫耳比的乙醛來執行該反應。於反應玻璃瓶中加入1 0 %的醋酸 /DMF 內之 Sodium tracetoxyborohydride ( 2 當量）。在 2 5 °C 的狀態下攪拌該反應混合物12個小時，繼而密集地加入甲醇，產生高純度之生成物。經濟部智慧財產局員工消費合作社印製從可用的化學路徑中隨機選取一組300胺類與300醛類，該可用的化學路徑是由加州San Leandro的MDL Information Systems, Inc·來銷售，而這些利用 DirectedDiversity®工具箱之資料庫列舉類別的胺類與醛類被用來產生一含有90,000個生成物的虛擬資料庫。 DirectedDiversity® 工具箱由 3-Dimensional Pharmaceuticals, Inc.，Exton，PA (1994-2000)取得版權，此處所述乃出自於對該資料的全面性參考。這些列舉類別將以SDF或SMILES格式供應的試劑列表與以SMARTS及擴大至直述語言Tel爲基礎之某專屬語言寫成的一反應圖示視爲輸出結果。在這個含有90,000個生成物的虛擬資料庫中，每個化合物具有用〇^〇^(10“^5^©工具箱計算出之一組標準的117 個位相描述符的特徵。這些描述符包含一組已確立的位相 •指數，其在結構活性的交互作用上，例如分子連接法指數、K型指數、子圖總計、資訊理論指數、Bonchev-Trinajstis指數與位相態指數，具有悠久、成功的歷史。請 -23- 本紙張尺冬適用中國國家標準（CNS ) A4規格（210X297公釐） 523699 Μ Β7 五、發明説明（21 ) (請先閱讀背面之注意事項再填寫本頁) 參見 L.H. Hall et al·，The Molecular Connectivity Chi Indexes and Kappa Shape Indexes in Structure-Property Relations, Reviews of Computational Chemistry; D. B. Boyd et al·，Eds.; VCH: Weinheim, Germany (1991); Chapter 9, pp. 367-422’ 此處所述乃出自於對該文的全面性參考。也請參見D. Bonchev et al.，67 J. Chem. Phys.，45 1 7-3 3 ( 1 977)，此處所述乃出自於對該文的全面性參考。這些描述符顯示出適當的“社區行爲”（在 D.E. Patterson et al·，39 J. Med. Chem·， 3049-59 (1996)中有明確的定義，此處所述乃出自於對該文的全面性參考），因此，非常適用於差異分析及相似度搜尋。請參見 V.S. Lobanov et al·，40 J. Chem. Inf. Computer Sci.，460-7 0 (2000)，此處所述乃出自於對該文的全面性參考。 · 經濟部智慧財產局員工消費合作社印製隨後，利用熟習相關技術者所熟知的主成份分析，使這1 17個分子描述符標準化並減低其關聯性。這個過程產生一由23個潛在變數構成的正交集，說明了資料中99%的總變化量。爲了簡化此分析及對結果的解釋，利用一非常快速之非線性映像演算法，使這個23維資料集進而變成二維，此非線性映像演算法敘述於D. K. A g r a f i 〇 t i s e t a 1.，J. C h e m. Inf. Computer Sci., 40, 1 356- 1 362 (2000) ' D.N. Rassokhin et al·，J· Comput. Chem·，22(4), 373-386 (200 1 )，以及 D.K。 Agrafiotis et al., J. Comput. Chem., 22(5), 488-500 (200 1) ^ 此處所述乃出自於對該文的全面性參考。此投影以此方式執行致使該23維主成份空間中點與點之間的距離儘可能地本紙張尺冬適用中國國家標準（CNS ) A4規格（210X297公釐） ~ " 523699 A7 ____B7 五、發明説明（22 ) (請先閱讀背面之注意事項再填寫本頁) 被保存在該二維映像中。產生之映像具有一 0.187的Kruskal 應力且被用以顯現挑選物，而其皆在該23維主成份空間中被挑選出來。爲了排除資料中重複、多餘的狀況，此主成份分析之預先處理步驟是不可缺少的，而圖解理論描述符通常具有這種資料中重複、多餘的特徵。最後，除了這117個位相描述符之外，利用Ghose-Grippen approach以獨立計算分子量及各個化合物的辛醇水分佈係數（Log P )，此 Ghose-Grippen approach 敘述於 A.K. Ghose et al.，102 J. Phys· Chem. A，3762-72 (199 8)，此處所述乃出自於對該文的全面性參考，如在 DirectedDiversity®工具箱中所執行的一般，而且被用以當做所有限制設計的目標變數。用來評估相似度的描述符集中，並未包&含這個參數。所有的挑選物皆爲10x10陣列。經濟部智慧財產局員工消費合作社印製第二個例子是出自 Cramer et al·，38 Chem. Inf. Computer Sci.，1010-23 (1 998)中的一個三成份資料庫，此處所述乃出自於對該文的全面性參考。將一包含兩個一級或二級胺的二胺分子當做中央支架並利用一醯化劑、反應鹵化物或易受還原胺化影響的碳基使之從其兩側衍生。必需產生此資料庫之合成順序包含選擇性地保護其中一個胺並引進第一支鏈，緊接著是去保護並引進第二支鏈。圖4爲一圖表，說明用於製作二胺資料庫之合成順序400。只使用商 -業上可取得之試劑（包含Π50個HNXNH型之試劑與26700 個RX型之試劑的1996可用的化學路徑）將會產生超過1〇12 個的潛在生成物。由於此作業目標是要使陣列選擇的方法 -25- 本紙張尺度適用中國國家標準（CNS ) A4規格（210 X 297公釐) 523699 A7 B7 五、發明説明（23 ) (請先閲讀背面之注意事項再填寫本頁) 生效，故產生了一個利用50個商業上可取得之二胺及50個氯酸與烷化劑化合爲1 25000個化合物所組成的資料庫。如同前一個資料集一般，每個化合物由被用以獲取分子圖表之主要特點的117個位相指數來描述，隨後，這117個位相指數與22個主成份之間的關聯性減低了，並且說明了資料中9 9 %的總變化量。這些主成份被用來當作輸入至一非線性維度精簡技術以產生一個二維映像，其在主成份空間中將兩兩化合物之間的距離複製爲一 0.1 67的Kruskal應力，此映像僅用於顯現設計，每個設計皆以所有22個非相關的描述符爲基礎。挑選物皆爲5x5x5陣列。 10.成果與討論經濟部智慧財產局員工消費合作社印製此問題'之組合性本質不允許在這些集合之任何一個中窮舉每種可能的陣列。對還原胺化資料庫而言，由方程式2 所決定之不同的10x10陣列的數量約爲2· 1 0 3 6 ’但對二胺資料庫而言，不同的5x5x5陣列的數量約爲2_1019。在未知整體最小値之前，有三個參考點被用以估計透過本發明之方法所得之解的品質。第一個爲挑選由等量化合物構成之一稀疏陣列的適合度，並且表示目標函數對一特定挑選物之大小的上限。因爲全陣列挑選法爲一稀疏陣列挑選法再加上一些額外的限制，所以全陣列挑選法永遠不會超過一單 •純之稀疏陣列挑選法設計的品質。以確定性的方式藉由評估每個化合物與其最接近之先導物的相似度、以相似度由大至小的順序來排列化合物’以及從該列表中挑選出排名本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） \ 2Q - 523699 A7 B7 五、發明説明（24 ) (請先閲讀背面之注意事項再填寫本頁) 最前的k個化合物，稀疏陣列則被挑選出來。另外二個參考點，其一爲一隨機陣列的平均適合度，其二爲來自於前述退火優化法之陣列的適合度。對還原胺化資料庫而言，相似度的挑選被限制在100個化合物（100個稀疏陣列，10x10全陣列）之內，並且利用方程式3中的相似度適合度函數與一隨機挑選該資料庫之一成員爲一「先導物」來完成。圖5爲一圖表，說明用於從還原胺化資料庫中挑選相似度的一參照結構500 °因爲這些方法沒有一個是完全確定性的，所以這些挑選會被重複進行 100次，每次從一不同的隨機起始配置（亂數種子）開始。經濟部智慧財產局員工消費合作社印製圖6爲一長條圖600，說明根據與一參照結構500之最大相似度，從一還原胺化資料庫中挑選出1〇〇個化合物之相似度比數的平均値及標準差。長條圖600顯示一隨機或際遇法 602、一退火法604、貪心法606及稀疏陣列法608的結果。貪心法606已證明是極爲收斂的：每單一次執行都會產生一 0.594之比數的相同結果且是此作業行使中所有已發現之陣列裡的最佳陣列。反之，模擬退火法604在100次試驗中只有60次會收斂至該解，雖然一般來說其執行效率分別滿足試驗之82%及98%而導致小於0.60及0.61的比數及一個〇·597 ±0.004的整體平均値。這些解比那些用際遇法602 ( —隨機陣列的平均比數爲1.8 5 5 ± 0.086 )所獲得的解更好，而且非 •常適合與擁有0.533之比數的稀疏陣列法608相比較。圖7A爲一圖表700，說明根據與一參照結構500之最大相似度，從一還原胺化資料庫中挑選出一 10x10陣列之化合本紙張尺卑適用中國國家標準（CNS ) A4規格（210X297公釐） 523699 A7 B7 五、發明説明（25 ) (請先閲讀背面之注意事項再填寫本頁) 物的分佈情況。圖7 B爲一圖表7 1 0，說明根據與一參照結構 5 00之最大相似度，從一還原胺化資料庫中挑選出100個稀疏陣列之化合物的分佈情況。圖7 B被用以當做一參考。大正方格（分別爲圖7A中的702及圖7B中的704 )與小正方格 .(分別爲圖7A中的708及圖7B中的706 )分別代表參考化合物（先導物）與被選定之化合物。圖7A及7B中之圖表爲23 個主成份之二維非線性投影，說明了資料中99%的總變化量，並且以一種儘可能保存物.件之接近値（相似度）的方式來製圖。挑選物以所有23個主成份爲基礎且單純地被照亮以突顯於該映像上。維度上的激烈精簡作用難免會失真，而這可由化合物似乎比被選出者更靠近先導物的情況上看出。然而，此失真因非線性映像之故而分佈在整個資料空間上，結桌即使是稀疏陣列與全陣列之間相當小的差異，也明白地顯示在映像上·。實際..的挑選物大部分是由在先導化合物的兩個支鏈上找到之融合環系統的各種雜環類似物組成。經濟部智慧財產局員工消費合作社印製圖8爲一圖表800，說明根據與一參照結構500之最大相似度，從一還原胺化資料庫中挑選出構成一 10x10最佳化陣列之胺試劑與醛試劑。爲了確定先導.化合物之挑選與位置是否會影響貪心法偵測一適當之解的能力，利用從胺化資料庫·中隨機挑選出 •的100個參照結構，來比較貪心法與模擬退火法的執行效率。實驗中隨機挑選100個化合物、以本發明之方法及模擬退火法爲每一個化合物挑選最相似之1 0 X 1 0陣列，然後比較產本紙張尺尽適用中國國家標準（CNS ) A4規格（210X297公釐） 523699 A7 B7 五、發明説明（26 ) (請先閲讀背面之注意事項再填寫本頁) 生之設計的比數。在100個案例中的1 3個案例裡，模擬退火法產生一較差的陣列，而在其餘的87個案例中，兩種方法均產生同一結果。圖9爲一圖表900，顯示以模擬退火法及本發明之貪心法，從一還原胺化資料庫中挑選出1 〇〇個不同的隨機先導物之最佳1 Ox 1 0陣列的相似度比數之比較情形。如圖9中之分離點902所示，在其中5個案例中，這二種技術的差異是顯而易見的。因此，雖然我們.不能肯定最佳解已被確認，但很明顯地，貪心法非常適合與更複雜且更需要計算之模擬退火法相比較且似乎可達到整體最佳化。經濟部智慧財產局員工消費合作社印製前一個例子說明以一包含單一目標（相似度）之函數來使用貪心法的情形。事實上，以任何可被描述爲許多個別分子貢獻之目標函數來使用貪心法，同樣都有效。圖10 爲一圖表，說明用於從一還原胺化資料庫中做相似性應用之多目標挑選的一參照結構1000。此化合物擁有一 360.3的分子量及一預測之6.46的log P値，而且落在Lip inski 「規則5」所定義的範圍之外，C.A. Lipinski et al.，Adv. Drug Delivery Rev·, 2 3, 3-25 ( 1 997)中曾描述此「規則5」，此處所述乃出自於對該文的全面性參考。此規則是由世界藥物指標的一項分析所導出，說明對於非生物輸送者之基質的化合物而言，當有超過5個氫鏈捐贈者、超過1〇個氫鏈接受者、分子量大於500或log P的値大於5時，不良的吸收和滲透很可能會發生。圖11 A爲一圖表11 0 0，說明根據與一參照結構1 〇〇〇之最本紙張尺度適用中國國家標準（CNS ) A4規格（210 X 297公釐） 523699 A7 B7 五、發明説明（27 ) (請先閱讀背面之注意事項再填寫本頁) 大相似度，從一還原胺化資料庫中挑選出10x10陣列的化合物之差異空間的分佈情況。圖1 1 B爲一圖表1 1 1 0，說明根據與一參照結構1000之最大相似度，從一還原胺化資料庫中挑選出1 Ox 1 0陣列的化合物之分子量對計算出之log P的分佈情況。大正方格（分別爲圖11 A中的11 02及圖1 1 B中的 1 104 )與小正方格（分別爲圖1 1 A中的1 108及圖1 1B中的 1106 )分別代表參考化合物（先導物）與被選定之化合物。如圖1 1 B所示，以此「先導物」之最大相似度爲基礎所挑選出的10x10陣列是由平均log P値= 5·47±0·85之化合物所構成，其中有77個化合物的log Ρ値大於5。經濟部智慧財產局員工消費合作社印製圖12爲一圖表1 200，說明根據與參照結構1〇〇〇之最大相似度，從還原胺化資料庫中挑選出構成10x10陣列之試劑。被選定之試劑是由鹵化安息香醒及包含兩個六元環的疏水性胺類所組成，這兩個六元環被一小連結物所區隔。爲了降低這些化合物的疏水性並同時保存整體結構的相似度，可將方程式3中之分子相似度標準與定義於Lipin ski box (log P = 5, MW = 500 )的範圍之上的方程式4中之限制標準結合。圖13A爲一圖表1 300，說明根據參照結構1〇〇〇及方程式 (9 )(列於後文），從還原胺化資料庫中挑選出1 〇x 1 〇陣列的化合物之差異空間的分佈情況。圖13B爲一圖表1310 ’ .說明根據參照結構1000及方程式（9)(列於後文）’從還原胺化資料庫中挑1出10x10陣列的化合物在以分子量與計算出之log P所定義之空間上的分佈情況。再一次’大正方 30- 本紙張尺度適用中.國國家標準（CNS ) A4規格（210X297公釐） 523699 Α7 Β7 經濟部智慧財產局員工消費合作社印製五、發明説明（28 ) 格（分別爲圖13A中的1 302及圖13B中的1 304 )與小正方格 (分別爲圖11A中的1108及圖11B中的11〇6)分別代表參考化合物（先導物）與被選定之化合物。圖13A與圖13B顯示以10x10格式挑選出100個化合物，使目標函數減至最小： /(C)-5(C) + 2-P(C) (9) 其中，S(C)及P(C)分別得自方程式3及方程式4。重量決定了在最後設計中每個標準.之相對影響，而且是以D.N. Rassokhin et al., J. Mol. Graphics Model, 1 8(4-5), 370-384 (2000)中所描述的一簡單圖示爲基礎被挑選出來，此處所述之簡單圖示乃出自於對該文的全面性參考。產生之陣列是由平均log P値=4.5 8±0.72的化合物組成，而且包含圖14中所顯示的試劑。圖14爲一圖表1400，說明根據參照結構 1000及方程式（9 )，從還原胺化資料庫中挑選出構成 10x10陣列之試劑。在圖12及圖14的兩個挑選中’有9個共同的試劑（8個胺及1個醛）。原始挑選中的二個疏水性胺類被帶有甲氧基之位相上相似的結構所取代’而數個多_ 化安息香醛被含有較少量鹵素置換基及其中4個案例中之S 基的試劑所取代。因此，只要小心選擇參數’此種多目標的方法便能夠將一挑選引導至更令人滿意的化1學空胃範11 而不用破壞實驗的主目標，在此狀況下，該主目標β[]胃、系列與已知的先導物密切相關之類似物的設計° 爲了確保本發明之方法的執行效率不會因較複雜的組合資料庫而降低，重複對上述之3成份二胺資料庫進行相同本紙張尺度適用中國國家標準（CNS ) Α4規格（210Χ297公釐） -31 - (請先閲讀背面之注意事項再填寫本頁) 一裝. 訂 523699 A7 B7 五、發明説明（29 ) (請先閲讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製型態的分析。此結果槪述於圖1 5及圖1 6。圖1 5爲一長條圖 1 500，說明根據與一最佳化收集超過100次的隨機挑選結構 (5x5x5陣列，125個稀疏陣列）之最大相似度，從二胺資料庫中挑選1 25個化合物之相似度比數的平均値及標準差。此結果是用來顯示一隨機或際遇法1 502、一模擬退火法 1 504、貪心法1 506，以及稀疏陣列法1 508。再一次，貪心法極爲堅固，產生了三個不同但非常相似的解，其具有一 0.4833±0.0001的平均適合度.；100個試驗中有79個收斂至一具有比數爲0.4832的陣列，而其餘的21個試驗收斂至二個具有同一比數爲0.4835的不同陣列。模擬退火法顯示一稍微較高的變化性並收斂至8個不同的解’這些解具有範圍從 0.48 32(爲進行21次的貪心法所確定之同一陣列）到0.503的適合度數値以及一〇.4859±0.0043的平均値。如同胺化資料庫一般，此實驗是以二胺集合中一隨機選取的「先導物」爲基礎。接著，對1〇〇個隨機選取之參考化合物重複進行此過程，其結果槪述於圖16。圖16爲一圖表1600，說明根據與100個隨機先導物之最大相似度’以模擬退火法及本發明之貪心法，從二胺資料庫中挑選出最佳5x5x5陣列的相似度比數之比較情形。由貪心法產生的解在這些試驗中有57個稍微好些，有1 6個稍微差些’而在剩餘的27個中則相同’ 差異範圍從-0.059到0.0033。使用貪心法的一項最重要的優點爲其執行速度。圖17 爲一長條圖，說明在一 400Mhz Intel Pentium II處理器上以本發明之貪心法分別從還原胺化資料庫及=胺資料庫中挑 -32- 本纸張尺尽適用中國國家標準（CNS ) A4規格（210X297公釐） 523699 A7 B7 五、發明説明（3〇 ) (請先閲讀背面之注意事項再填寫本頁) 選出 100 ( 17 02 )、400 ( 1 704 )、1 600 ( 1 706 )、6400 ( 1708)及25600 ( 1710)個化合物時所需之cpu時間。貪心法只需要些微的計算，而且即使是最大量的挑選亦可在次秒的時間片段內完成，有一大部分的時間是花在預先處理的步驟中計算每個候選物與各自的先導物之間的歐式距離上，這些時間與虛擬資料庫的大小成線性比。貪心法本身與試劑的總數量成線性比，而產生的解是比得上且常常優於那些由更複雜之推測方法所導出的解。 11.本發明之實作經濟部智慧財產局員工消費合作社印製本發明可利用硬體、軟體或其組合來賓作，而且可在一或多個電腦系統或其他處理系統上來實作。事實上，在一實施例中，此發明指向一或多個能夠執行文中所述之功能的電腦系統。圖1 8顯示一電腦系統1 800之範例實作。就此示範性的電腦系統1 800來說已描述了各種實施例。讀完該敘述之後，熟習相關技術者很明顯地會懂得如何使用其他的電腦系統及/或電腦結構以實作本發明。電腦系統1 800 包含一或多個處理器，例如處理器1 803。處理器1 803連接至一通訊匯流排1 8 0 2。電腦系統1 800也包含一個主記憶體1 805，更可說是隨機存取記憶體（RAM )，而且也可以包含一個輔助記憶體、1810。舉例來說，輔助記憶體1810可包含一個硬碟機1812及 /或一個抽取式儲存機1 8 1 4，代表一軟碟機、一磁帶機、一光碟機，等等。抽取式儲存機1814以一已知的方式從抽取本紙張尺率適用中.國國家標準（CNS ) A4規格（210X297公釐） -33- 523699 A7 _________ B7 五、發明説明（31 ) (請先閲讀背面之注意事項再填寫本頁) 式儲存器18 18讀取及/或寫入此儲存器1818。抽取式儲存器 18 18代表一軟碟機、一磁帶機、一光碟機，等等，這些被抽取式儲存機1814讀取及寫入。如眾所知，抽取式儲存器 181 8包含一個電腦可用儲存媒體.，其中已儲存電腦軟體及/ 或資料。在另一個實施例中，輔助記憶體1810可包含用於使電腦程式或別的指令被下載至電腦系統1 800之其他相似的裝置。舉例來說，該裝置可包含一個抽取式儲存器1 822及一介面1 820。像這樣的範例可能包含一個程式盒與盒式介面 (例如視訊遊戲裝置中所具備的）、一個抽取式記億晶片 (例如可消除程式化唯讀記憶體（EPROM )或程式可控唯讀儲存器（PROM ))與串聯插槽，以及別的抽取式儲存器1 822與允軟體及資料從抽取式儲存器1 822轉換至電腦系統1 800的介面1 820。經濟部智慧財產局員工消費合作社印製電腦系統1 800也可以包含一個通訊介面1 824。通訊介面1 824允許軟體及資料在電腦系統1 800與外部裝置之間轉換。通訊介面1 824的範例可能包含一數據機、一網路介面 (例如一個乙太網路卡）、一通訊連接埠、一 PCMCIA插槽及卡、一無線區域網路介面，等等。軟體及資料以信號 1 828的形式經由通訊介面1 824來轉換，這些信號1 824可能是電子的、電磁的、光學的或其他能被通訊介面1 824接收的 •信號。這些信號1 828經由一通訊路徑（亦即，通道）1826 而被提供給通訊介面1824。此通道1 826攜帶信號1 8 24且可利用電纜或有線電視、光纖、電話線、大哥大連結、無線連本紙張尺度適用中國國家標準（CNS ) A4規格（210X29*7公釐） -34- 523699 A7 ___B7_ 五、發明説明（32 ) " 結，以及其他通訊通道來實作。在此文件中，「電腦程式產品」這個術語意指抽取式儲存器1818、1 822及信號1 828。這些電腦程式產品爲用來對電腦系統1 800提供軟體的裝置。此發明指向該電腦程式產電腦程式（亦稱爲電腦控制邏輯）被儲存在主記憶體 1 805及/或輔助記憶體18 10中及/或在電腦程式產品中。電腦程式也可以經由通訊介面18.24而被接收。執行該電腦程式時，會使電腦系統1 800執行如文中所述之本發明的特色。尤其，執行該電腦程式時，會使處理器1 803執行本發明的特色。因此，該電腦程式代表電腦系統1 800的控制者。在一使用軟體實作此發明的實施例中，該軟體可被儲存在一電腦程式產品中並被下載至使用抽取式儲存機1814 、硬碟機1812或通訊介面1 824的電腦系統1 800中。當控制邏輯（軟體）由處理器1 803來執行時，會使處理器1 803執行如文中所述之本發明的功能。在另一個實施例中，主要以使用硬體來實作此發明，例如，如特殊用途積體電路（ASICs )的硬體元件。熟習相關技術者將淸楚地瞭解硬體狀態機之實作，以便執行文中所述之功能。在又另一個實施例中，使用一硬體與軟體之組合以實 •作此發明。 12.結論 (請先閲讀背面之注意事項再填寫本頁) -裝· P. 經濟部智慧財產局員工消費合作社印製 -35 A7

523699 五、發明説明（33 ) 雖然上文中已描述本發明之種種實施例，但我們應瞭解這些實施例僅爲示範性而非限制性之描述。熟習此技術者會瞭解在不違反附加的申請專利範圍中所定義之本發明的精神及範圍之情況下，在其中也可以做各種形式及細節上的改變。因此，本發明之廣泛性及範圍不應該被上述任何一個示範性的實施例所限制，而應該僅依據下列申請專利範圍及其同等事項來定義之。 (請先閲讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製本紙張尺〆適用中國國家標準（CNS ) A4規格（210X297公釐）

Claims

523699 A8 B8 C8 D8 六、申請專利範圍 1. 一種用於設計組合陣列之方法，包含以下步驟： (請先閱讀背面之注意事項再填寫本頁) (1) 從一組合資料庫中之眾多變異點上決定所要挑選出的一些試劑，其中該些試劑的數量少於或等於該組合資料庫中之每個該變異點上的候選試劑之數量； (2) 從該組合資料庫中每個該變異點上的眾多候選試劑中，挑選出該數量的試劑； (3) 評估經由步驟（2)中挑選出之該數量的試劑之有系統的組合所得組合陣列之適合度（Γ); (4) 藉由鑑定由該組合資料庫中每個該變異點上之各該多數候選試劑與其中所有其他的該變異點上之選定試劑的有系統的組合所產生的組合次陣列，而獨立評估該組合資料庫中該變異點之其中一點上的多數候選試劑； (5) 以步驟（4 )中所得的結果爲基礎，排列該組合資料庫中該變異點之該其中一點上的該多數候選試劑中之各該候選試劑；經濟部智慧財產局員工消費合作社印製 (6) 以該等級排列之步驟的結果爲基礎，從該組合資料庫中該變異點之該其中一點上的該多數候選試劑中，挑選一組新試劑； (7) 對該組合資料庫中之各該變異點，重複進行步驟（4 )、（5 )及（6 ); (8) 評估一組合陣列之適合度（f )，而該組合陣列產生自該組合資料庫中各該變異點上之選定試劑的有系統的組合； (9) 倘若f爲優於Γ的適合度，則設定Γ等於f且重複步本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） Γ37 -~ 523699 A8 B8 C8 D8 ____ •一, m 六、申請專利範圍驟（4)至（8);及 (請先閲讀背面之注意事項再填寫本頁) (ίο)倘若f爲不優於f，的適合度，則從步驟（8)輸出該組合陣列。 2. 如申請專利範圍第1項之方法，其中以一或多個目標函數爲基礎，評估步驟（3 ) 、（ 4 )及（8 ) ° 3. 如申請專利範圍第1項之方法，其中以包含該組合陣列及/或該組合次陣列之化合物與至少一個特定之參考化合物的相似度爲基礎，評估步驟（3 ) 、（ 4 )及（8 ) ° 4. 如申請專利範圍第1項之方法，其中以包含該組合陣列及/或該組合次陣列之化合物與至少一個疑問或探索的一致程度爲基礎，評估步驟（3 ) 、（ 4 )及（8 )。 5 .如申請專利範圍第1項之方法，其中以至少一個包含該組合陣列及/或該組合次陣列之化合物的特性爲基礎’評估步驟（3) 、（ 4)及（8) ° 6.如申請專利範圍第5項之方法，其中該至少一個包含該組合陣列及/或該組合次陣列之化合物的特性爲一計算特性。經濟部智慧財產局員工消費合作社印製 7 ·如申請專利範圍第1項之方法，其中步驟（2 )包含從該組合資料庫中每個該變異點上的該多數候選試劑中隨機地挑選出該數量的試劑的步驟。 8·如申請專利範圍第1項之方法，其中步驟（2)包含從該組合資料庫中每個該變異點上的該多數候選試劑中有系統地或部份有系統地挑選出該數量的試劑的步驟。 9·如申請專利範圍第1項之方法，其中至少重複進行兩本紙張尺專逋用中國國家橾準（CNS ) A4規格（210X297公釐） Γ38- ^----- 523699 A8 B8 C8 D8 六、申請專利範圍次步驟（2 )〜（10 )。 (請先閱讀背面之注意事項再填寫本頁) 1 0.如申請專利範圍第1項之方法，其中步驟（2 )包含從該組合資料庫中每個該變異點上的該多數候選試劑中挑選出該數量的試劑的步驟，致使從該變異點之至少其中一點上所選定的試劑至少含有一個特定試劑。 11. 如申請專利範圍第1項之方法，其中步驟（6 )以步驟（5 )中已確定的等級排列爲基礎，包含從該組合資料庫中每個該變異點上之該多數候選試劑中挑選出該組新試劑的步驟，致使該組合資料庫中該變異點之該其中一點上的該組新選定試劑至少含有一個特定試劑。 12. —種用於使電腦能夠設計組合陣列之電腦程式產品，其包含一載有電腦程式邏輯之電腦可用媒體，該電腦程式邏輯包含” 一確定方法，用於使一處理器能夠確定從一組合資料庫中多數變異點上挑選出一些試劑，其中該試劑少於或等於該組合資料庫中每個該變異點上的一些候選試劑；經濟部智慧財產局員工消費合作社印製一挑選方法，用於使一處理器能夠從該組合資料庫中每個該變異點上的多數候選試劑中挑選出該數量的試劑；一第一評估方法，用於使一處理器能夠評估一組合陣列之適合度（Γ)，該組合陣列產生自由該挑選方法取得之該數量的試劑的有系統的組合；一獨立評估方法，用於使一處理器能夠藉由鑑定由該組合資料庫中每個該變異點上之各該多數候選試劑與其中所有其他的該變異點上之選定試劑的有系統的組合所產生本紙張尺尽適用中國國家標準( CNS ) A4規格（210X297公釐) 39 - 523699 A8 B8 C8 D8 六、申請專利範圍 ^、的組合次陣列，獨立評估該組合資料庫中該變異點之其中一點上之多數候選試劑；一等級排列方法，用於使一處理器能夠以該獨立評估方法中所得的結果爲基礎，排列該組合資料庫中該變異點之該其中一點上的該多數候選試劑中之各該候選試劑；一挑選方法，用於使一處理器能夠以該等級排列方法的結果爲基礎，從該組合資料庫中該變異點之該其中〜點上的該多數候選試劑中挑選一組新試劑；一等級排列與挑選方法，用於使一處理器能夠依次排列並挑選該組合資料庫中每個該變異點上之試劑；一第二評估方法，用於使一處理器能夠評估該組合陣列之適合度（f )，該組合陣列產生自該組合資料庫中每個該變異點上之選定試劑的有系統的組合；一用於使一處理器能夠判定適合度f是否優於適合度Γ 的方法；一用於使一處理器能夠重新設計該組合陣列直到適合度f不優於適合度Γ爲止的方法；一用於使一處理器能夠在適合度f優於適合度f’時設定 Γ等於f的設定方法，及一用於使一處理器能夠輸出該組合陣列的輸出方法。 13.如申請專利範圍第12項之電腦程式產品，其中以一或多個目標函數爲基礎，評估該第一評估方法、該獨立評估方法及該第二評估方法。 1 4.如申請專利範圍第1 2項之電腦程式產品’其中以包本紙張尺冬適用中國國家揉準（CNS ) A4規格（210X297公釐1 - 40- " f請先閲讀背面之注意事項再填寫本頁} -訂 f 經濟部智慧財產局員工消費合作社印製 523699 A8 B8 C8 D8 六、申請專利範圍含該組合陣列及/或該組合次陣列之化合物與至少一個特定之參考化合物的相似度爲基礎，評估該第一評估方法、該獨立評估方法及該第二評估方法。 15. 如申請專利範圍第12項之電腦程式產品，其中以包含該組合陣列及/或該組合次陣列之化合物與至少一個疑問或探索的一致程度爲基礎，評估該第一評估方法、該獨立評估方法及該第二評估方法。 16. 如申請專利範圍第12項之電腦程式產品，其中以至少一個包含該組合陣列及/或該組合次陣列之化合物的特性爲基礎，評估該第一評估方法、該獨立評估方法及該第二評估方法。 17. 如申請專利範圍第16項之電腦程式產品，其中該至少一個包含該組合陣列及/或該組合次陣列之化合物的特性爲.一計算特性。 18. 如申請專利範圍第12項之電腦程式產品，其中用於使一處理器能夠從該組合資料庫中每個該變異點上的多數候選試劑中挑選出該數量的試劑的該挑選方法，另包含用於使一處理器能夠從該組合資料庫中每個該變異點上的多數候選試劑中隨機地挑選出該數量的試劑的方法。 19. 如申請專利範圍第12項之電腦程式產品，其中用於使一處理器能夠從該組合資料庫中每個該變異點上的多數候選試劑中挑選出該數量的試劑的該挑選方法，另包含用於使一處理器能夠從該組合資料庫中每個該變異點上的該多數候選試劑中有系統地或部份有系統地挑選出該數量的本紙張尺度適用中國國家標準( CNS ) A4規格（210X297公釐） -41 - (請先閲讀背面之注意事項再填寫本頁) 一裝· •Γ. 經濟部智慧財產局員工消费合作社印製 523699 A8 B8 C8 D8 X、申請專利範圍試劑的方法。 20.如申請專利範圍第12項之電腦程式產品，其中用於使一處理器能夠從該組合資料庫中每個該變異點上的多數候選試劑中挑選出該數暈的試劑的該挑選方法，另包含用於使一處理器能夠從該組合資料庫中每個該變異點上的該多數候選試劑中挑選出該數量的試劑的方法，致使從該變異點之至少其中一點上所選定的試劑至少含有一個特定試劑。 2 1.如申請專利範圍第1 2項之電腦程式產品，其中用於使一處理器能夠以該等級排列方法的結果爲基礎，從該組合資料庫中該變異點之該其中一點上的該多數候選試劑中挑選一組新試劑的該挑選方法，另包含用於使一處理器能夠以該等級排列方法爲基礎，從該組合資料庫中每個該變異點上之該多數候選試劑中挑選出該組新試劑的方法，致使該組合資料庫中該變異點之該其中一點上的該組新選定試劑至少含有一個特定試劑。 (請先閱讀背面之注意事項再填寫本頁) 一裝- 訂 f 經濟部智慧財產局員工消費合作社印製本紙張尺度逋用中國國家標準（CNS ) A4規格（210X297公釐） -42 -