TW523699B - Method and computer program product for designing combinatorial arrays - Google Patents
Method and computer program product for designing combinatorial arrays Download PDFInfo
- Publication number
- TW523699B TW523699B TW090104949A TW90104949A TW523699B TW 523699 B TW523699 B TW 523699B TW 090104949 A TW090104949 A TW 090104949A TW 90104949 A TW90104949 A TW 90104949A TW 523699 B TW523699 B TW 523699B
- Authority
- TW
- Taiwan
- Prior art keywords
- reagents
- array
- combination
- database
- candidate
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
- G16C20/62—Design of libraries
Landscapes
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Physics & Mathematics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Computing Systems (AREA)
- Medicinal Chemistry (AREA)
- Library & Information Science (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Description
523699 A7 B7 五、發明説明〇 ) 發明背景 1. 發明領域 (請先閲讀背面之注意事項再填寫本頁) 本發明,一般而言,係相關於組合化學的領域,尤其 .是相關於一種用於設計組合陣列之方法及電腦程式產品。 2. 相關技術 經濟部智慧財產局員工消費合作社印製 從歷史觀點來看,藥品的發現是基於一連串且有系統 的化學結構修正,此修正是遵行「相似性質原理」,亦即 ,假設結構上相似的化合物易於表現出相似的物理化學及 生物性質。新的治療劑通常是經由確認一種先導化合物, 再以有系統且直接的方式創造該化合物的變體而產生。第 一階段的過程,即所謂的先導生代,是由在大量的化合物 中隨機篩選而完成。這樣的化合物挑選可包含天然物種、 人工物種,等等。第二階段的過程,即所謂的先導最佳化 ,代表藥品發現上的限速步驟。此步驟包含環繞先導化合 物之充分的結構活性關係(SAR )的細節及其藥理槪要的 精確性。在組合化學還未被使用之前,此過程指一簡單的 合成目標之優先化,其以早已存在之結構活性資料、合成 可行性、經驗與直覺爲基礎。 近來在合成及篩選技術上的改進已使得同步合成及包 含數百至數萬個化合物之化學資料庫中的生物評估成爲可 能。隨著固相與液相化學知識的擴展,以及基礎自動硬體 的不斷改進,組合化學已經走出了它在傳統上用於大量篩 選時當做一個化合物資源的角色,而今它慣常被應用在先 導最佳化及SAR的精確性上。此導致對組合資料庫的槪念 -4- 本紙張尺度適用中國國家標準(CNS ) Α4規格(210X297公釐) 523699 Α7 Β7 五、發明説明(2 ) 一分爲二:(1 )具有與目標無關且被設計以測量各種類別 之物理化學及結構特性的探索性或綜合性資料庫,以及(2 )偏向某一特定目標、結構類別、或已知之藥效基團的專 一性或應用性資料庫。 有兩種因用來設計組合實驗而聞名的方法。第一種叫 做「單一法」或「稀疏陣列法」,其意指某些生成物的一 個子集合’這些生成物也許代表或也許不代表一組特定試 劑之所有可能的組合。第二種叫做「全陣列法」或簡稱「 陣列法」’其代表在反應圖示指定之所有可能的組合中結 合一特定試劑子集合而衍生的所有生成物。這兩種問題的 組合本質有極大的不同。就單一法來說,我們必須考慮的 可能數量(一個η集合中之各種k子集合的數量)是由下列 二項式來表示 (請先閱讀背面之注意事項再填寫本頁) η! ⑴ 反之,從一個
導出的各種k! X (n-k)lkl X n2 X…nR之R-成份組合資料庫中所 …kR陣列的數量是由下列式子來表示 (2) 經濟部智慧財產局員工消費合作社印製 對一個10x10之雙成份組合資料庫而言,共有1〇25個包 含25個化合物之不同的子集合(單一法),而且只有63,5〇ζ 個不同的5x5陣列。對一個ιοοχίοο的資料庫及一個 1 00/1 Οχ 1 0的挑選方式而言,那些數字對單一法和陣列法分 別增加至1〇241及1 0 2 6。請注意在本文中,「陣列」基本上相 等於以生成物的特性爲基礎而做的試劑挑選,而且未必指 的是實際的實驗安排及執行。大體上,雖然就達成設計目 本紙張尺度適用中國國家標準(CNS ) Α4規格(2丨0X 297公釐) _ 5 _ 523699 A7 B7 五、發明説明(3 ) 標來說陣列法較差,但其需要的試劑較少且實際上也較容 易合成。 (請先閲讀背面之注意事項再填寫本頁) 產生組合陣列之常見的方法包含試劑運用法及以隨機 抽樣爲基礎的生成物運用法。試劑運用法檢驗每個變異點 且不受組合資料庫中其他變異點的影響。變異點是指允許 在組合結構中建多區塊之組合核心上的一個點。例如, 在一個雙成份組合資料庫中,此設計是經由分別在R丨與R2 中各挑選出一串具有指定特性的試劑而完成,然後,將從 R 1中挑選出的試劑與從R2中挑選出的試劑化合以產生—串 生成物,構成組合陣列。雖然這種方法藉由檢驗各個試劑 池而簡化了挑選過程且不受其他試劑池的影響,但最重要 的生成物特性卻從未被明確地考量。這種方法反而是以希 望選定之試劑能產生具有指定特性的一串生成物·爲出發點 0 經濟部智慧財產局員工消費合作社印製 以生成物特性爲基準的試劑挑選方式在傳統上藉由具 有推測本質的演算法來達成。例如,在一個雙成份組合資 料庫中,從R 1及R2中隨機地挑選出一些試劑。將從R 1中挑 選出的試劑與從R2中挑選出的試劑化合,進而對照某設計 目標以評估所產生的生成物。例如,倘若設計目標是要獲 得本質上與某已知之藥物分子相似的生成物,該生成物則 會以其與該已知之藥物分子的相似度爲基準而被評估,從 而產生某個數値。接著,在一變異點上隨機地挑選出其中 一個選定試劑,再用另一個從該變異點上之候選試劑中隨 機挑選出的試劑來取代之。較好或較差的情況都可能會發 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) -6 - 523699 A7 一 B7 五、發明説明(4 ) (請先閱讀背面之注意事項再填寫本頁) f °重複進行此過程直到達到某收斂性判定標準或期限爲 止’譬如說,直到相對於該已知藥物分子而產生之相似度 數値無法再提升爲止。因此,隨機抽樣的方法需要有一定 數量的試驗,直到獲得一個滿意的結果爲止。 我們所需要的是一個用於設計組合陣列的演算法,此 胃算法利用目標函數可分解或近乎可分解成個別的分子貢 獻時的最佳結構並允許用一種有利的方式挑選出最佳或將 近最佳的陣列。我們近一步所需要的是一種用於設計組合 陣列的方法,此方法以與一或多個參考化合物之相似度, 抑或’依據一或多個QSAR、藥效基團或感應器結合模型對 於一或多個生物目標之預測的活性及/或選擇性、對一或多 個疑問或探索之一致程度、在某些性質界限內之包含性, 寺寺爲基礎 ° 發明之槪述 經濟部智慧財產局員工消費合作社印製 本發明藉由提供一種用於設計組合陣列之貪心法及電 腦程式產品以解決上述問題。此貪心法特別適用於當目標 函數可分解或近乎可分解成個別的分子貢獻時之情況。本 發明利用一種啓發式的方法,使能獨立評估組合資料庫中 每個變異點上的候選試劑並對其做等級的排列。此貪心法 被執行時是收歛的且以一種有利的方式產生組合陣列。由 貪心法所產生的組合陣列解是比得上且常常優於那些由本 質上更爲複雜且更需要密集計算之隨機抽樣技術所導出的 解。可修正成此方法之設計目標的典型範例包含與一或多 個參考化合物之相似度、依據一或多個結構活性或感應器 ^紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐)~7^ 523699 A7 B7_____ 五、發明説明(5 ) (請先閱讀背面之注意事項再填寫本頁) 結合模型之預測的活性及/或選擇性、對一或多個疑問或探 索之一致程度、在某些分子性質界限內之包含性,以及其 他種種。 根據本發明之貪心法,最初隨機地或以某種其他技術 從一組合資料庫中挑選出一系列的試劑並評估其適合度( 亦即,其滿足設計目標的程度)。藉由一嚴格交替順序來 處理組合資料庫中每個變異點上的試劑列表,反覆地進行 使此最初的挑選結果更精確。在每一步驟中,由檢測中之 變異點上的各候選試劑與資料庫中剩餘之變異點上的選定 試劑結合所產生的每個次陣列會被評估且其適合度會被記 錄下來。對該變異點而言,產生最佳(最適合)次陣列的 候選試劑會被挑選出來,而下一個變異點則以相似的方式 處理。當所得之組合陣列的適合度無法再提高時,此過程 便會終止。此過程可能會重複進行好幾次,每次都從一個 不同的起始陣列開始。在觀念上,此過程適用於當適合度 函數可分解或近乎可分解成個別的分子貢獻時之情況。 經濟部智慧財產局員工消費合作社印製 關於本發明進一步的特色與優點’以及本發明之結構 及各實施例的操作,將在以下與附件圖式有關的內文中詳 加敘述。在圖式中,像參考號碼是用來指出相同的及/或功 能上相似的元素。再者,在參考號碼最左邊的數字是用來 指出第一次提及相關元素時的圖式。 圖示簡要說明 於此倂入並成爲本說明書之一部分的附件圖式,以圖 例加上描述來說明本發明,進一步爲本發明之原理提供解 本纸張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) _ 8 - 523699 Α7 Β7 五、發明説明(6 ) 釋並使熟習相關技術者能善加利用本發明。 圖1 A爲一圖表,說明以單一法(稀疏陣列法)格式從 一假定的雙成分組合資料庫中挑選出化合物。 圖1 B爲一圖表,說明以陣列法(全陣列法)格式從一 假定的雙成分組合資料庫中挑選出化合物。 圖2A及2B爲一用於產生組合陣列之方法的流程圖。 圖2C-2H爲簡化範例,用來說明反覆地以貪心法從一 10x10組合資料庫中挑選出一 3x2陣列。 圖3爲一圖表,說明還原胺化資料庫之合成順序。 圖4爲一圖表,說明用於製作二胺資料庫之合成順序。 圖5爲一圖表,說明用於從還原胺化資料庫中挑選相似 度的一參照結構。 圖6爲一長條圖,說明根據與一參照結構之最大相似度 ’從一還原胺化資料庫中挑選出1 00個化合物之相似度比數 的平均値及標準差。 圖7A爲一圖表,說明根據與一參照結構之最大相似度 ,從一還原胺化資料庫中挑選出一 10x10陣列之化合物的分 佈情況。 圖7 B爲一圖表,說明根據與一參照結構之最大相似度 ,從一還原胺化資料庫中挑選出1 00個稀疏陣列之化合物的 分佈情況。 圖8爲一圖表,說明根據與一參照結構之最大相似度’ 從一還原胺化資料庫中挑選出構成一 1 Οχ 10最佳化陣列之月安 試劑及醛試劑。 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) —ς> - (請先閱讀背面之注意事項再填寫本頁) .裝· 訂 經濟部智慧財產局員工消費合作社印製 523699 A7 _ B7 _______ 五、發明説明(7 ) (請先閲讀背面之注意事項再填寫本頁) 圖9爲一圖表,顯示以模擬退火法及本發明之貪心法, 從一還原胺化資料庫中挑選出1 00個不同的隨機先導物之最 佳1 Ox 1 0陣列的相似度比數之比較情形。 圖1 0爲一圖表,說明用於從一還原胺化資料庫中做相 似性應用之多目標挑選的一參照結構。 圖1 1 A爲一圖表,說明根據與一參照結構之最大相似度 ,從一還原胺化資料庫中挑選出一1 Ox 1 0陣列的化合物之差 異空間的分佈情況。 圖1 1 B爲一圖表,說明根據與一參照結構之最大相似度 ,從一還原胺化資料庫中挑選出一 10x10陣列的化合物之分 子量對計算出之log P的分佈情況。 圖12爲一圖表,說明根據與一參照結構之最大相似度 ,從一還原胺化資料庫中挑選出構成一 1 Ox 1 0陣列之試劑。 圖13A爲一圖表1 300,說明根據一參照結構及方程式( 9 )(列於後文),從一還原胺化資料庫中挑選出一 1 〇x 1 0 陣列的化合物之差異空間的分佈情況。 經濟部智慧財產局員工消費合作社印製 圖1 3B爲一圖表,說明根據一參照結構及方程式(9 ) (列於後文),從一還原胺化資料庫中挑選出一 10x10陣列 的化合物之分子量與計算出之log P的分佈情況。 圖14爲一圖表,說明根據一參照結構1 000及方程式(9 )(列於後文),從一還原胺化資料庫中挑選出構成一 10x10陣列之試劑。 圖15爲一長條圖,說明根據與一最佳化收集超過100次 的隨機挑選結構(5x5x5陣列,125個稀疏陣列)之最大相 $紙張尺度適用中國國家標準( CNS ) A4規格(210X 297公釐) 7]〇1 523699 A7 B7 五、發明説明(8 ) 似度,從一個二胺資料庫中挑選丨2 5個化合物之相似度比數 的平均値及標準差。 (請先閱讀背面之注意事項再填寫本頁) 圖16爲一圖表1 600,說明根據與1〇〇個隨機先導物之最 大相似度,以模擬退火法及本發明之貪心法,從一個二胺 資料庫中挑選出最佳5x5x5陣列的相似度比數之比較情形。 圖1 7爲一長條圖,說明以本發明之貪心法分別從還原 胺化資料庫及二胺資料庫中挑選出1〇〇、400、1 600、6400及 2 5 6 0 0個化合物時所需之c p u時間。 圖1 8爲一電腦系統之範例實作。 涉及如全面地指出對應元素之參考特性的圖式時,本 發明之特色、目標及優點會從下文中所提出之詳細的敘述 中變得更加明顯。在圖式中,像參考號碼通常是用來指出 相同的、功能上相似的及/或結構上相似的元素。’對應的參 考號碼之最左邊的數字指出某元素第一次出現時的圖式。 主要元件對照 1 方格網 5 第二網點 2 列 6 方格 3 行 7 黑色的方格 4 第一網點 8 黑色的方格 較佳實施例之詳細描述 經濟部智慧財產局員工消費合作社印製 雖然在此描述之本發明與用以說明特殊用途之實施例 有關,但應瞭解本發明並非局限於這些實施例。獲取本處 所提供的教學之熟習此項技術者會認可額.外的修正、應用 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -1 1 - r523699 Α7 Β7 五、發明説明(9 ) ’以及本發明之範圍內和附加領域中的實施例,這些都將 使本發明表現出重要的實用性。 1.槪要 本發明是一種用於設計組合陣列之方法及電腦程式產 品,尤其,本發明是以一種能滿足一或多個設計目標至某 特定程度的方式,從一組合資料庫之一或多個變異點上的 試劑中挑選出一組試劑子集合的一種方法及電腦程式產品 。當目標函數(亦即,測量一組特別挑選出之化合物能滿 足設計目標之程度的函數)可分解或近乎可分解成個別的 分子貢獻時,可應用本發明之方法。本發明利用一種啓發 式的方法’使能獨立評估組合資料庫中每個變異點上的候 選試劑並對其做等級的排列。此方法相當快速且收斂。由 採用本發明之方法所產生的組合陣列解是比得上且常常優 於那些由上述之本質上更複雜且更需要密集計算之隨機抽 樣技術所導出的解。可修正成但非局限於此方法之設計目 標的範例包含與一或多個參考化合物之相似度、依據一或 多個結構活性或感應器結合模型之預測的活性及/或選擇性 、對一或多個疑問或探索之一致程度、在某些分子性質界 限內之包含性,以及其他種種。 用於設計組合實驗的兩個知名的方法爲「單一法」( •亦指「稀疏陣列法」)及「全陣列法」(或簡稱「陣列法 」)。單一法意指某些生成物的一個子集合,這些生成物 也許代表或也許不代表一組特定試劑之所有可能的組合。 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) , -Ί X - (請先閲讀背面之注意事項再填寫本頁) >裝· ,· 經濟部智慧財產局員工消費合作社印製 523699 Α7 Β7 五、發明説明(10 ) 全陣列法代表在反應圖示指定之所有可能的組合中結合一 特定試劑子集合而衍生的所有生成物。 (請先閲讀背面之注意事項再填寫本頁) 圖1A爲一圖表,說明以單一法格式從一假定的雙成分 組合資料庫中挑選出化合物。一方格網1 〇2代表一虛擬資料 庫。對物理合成及/或試驗而言’虛擬資料庫的主要功能在 於能挑選較小的次資料庫。方格網1 〇2由9個列10 4與17個行 106組成。雖然一 9x1 7大小的方格網被用於圖1 A,但這僅做 爲示範之用。熟習此技術者會瞭解虛擬資料庫在本發明的 範圍之內可大可小。每個行1 〇 6代表第一網點10 8上的一個 不同的試劑R1,譬如說,每個試劑R1代表一個不同的乙醛 。每個列1 04是第二網點110上的一個不同的試劑R2,譬如 說,每個試劑R2代表一個不同的胺。方格網102的每個方格 11 2代表一個不同的生成物,例如,由一特定的胺R2與一特 定的乙醛R1化合所產生的生成物。 經濟部智慧財產局員工消費合作社印製 在此範例中,9個化合物透過單一法的使用被挑選出來 且以黑色的方格114來表示。該單一法挑選化合物橫跨9列8 行,因此,被選定之化合物使用9個不同的乙醛與8個不同 的胺。利甩單一法來設計組合實驗不但需要考慮很多可能 ,也需要使用很多試劑。不管是由人工或機器來執行合成 ’以單一法格式來合成化合物通常是費力且耗時的。雖然 這方法最可能符合我們的設計目標,但幾乎總會導致極其 、昂貴且難以執行的實驗。 因此,爲了控制成本並簡化合成,即使陣列法就達成 主要設計目標來說一般較差,但通常仍以陣列法格式來合 本紙張尺度適用中國國家標準(CNS ) M規格(21〇χ 297公釐) ~ ' -- 523699 Α7 Β7 五、發明説明(Μ ) (請先閲讀背面之注意事項再填寫本頁) 成組合資料庫。圖1 Β爲一圖表,說明以陣列法格式從—假 定的雙成分組合資料庫中挑選出化合物。9個化合物透過陣 列法的使用被挑選出來且以黑色的方格11 6來表示。胃@歹υ 法挑選化合物橫跨3列3行。與用於設計組合實驗的單—法 相反之陣列法只運用3個不同的乙醛與3個不同的胺,因而 導致所需使用的試劑較少。不管是由人工或機器來執行合 成,以陣列法格式來合成化合物通常是較容易實行的。本 發明之方法被用於從組合資料庫之所有可能的陣列中挑選 能滿足一組設計目標至某特定程度之一陣列。 2. 設計目標 經濟部智慧財產局員工消費合作社印製 爲示範之用,必須考慮三種設計目標或挑選標準,亦 即(1 )與一特定先導物或一組特定先導物之最大相似度( 相似度)(2 )與一組指定的特性限制之最大適合度(限制 )(3 )對一特定生物目標之的最大活性及/或選擇性(活 性/選擇性)。雖然只敘述三種設計目標,但本發明並非局 限於此三種設計目標,也可使用其他可分解或近乎可分解 成個別的分子貢獻之設計目標。在一實施例中,可單獨使 用每一個設計目標及/或結合另一個設計目標來使用。 3. 相似度 一組特定的化合物C與一組先導物之相似度被定義爲 一化合物至其最近之先導物的平均距離: 本紙張尺度適用中國國家標準(CNS ) Α4規格(210X297公釐) 523699 經濟部智慧財產局員工消費合作社印製 A7 _B7 __ 五、發明説明(12 )S(C) =适如〜) ⑶ 其中,N爲C的基數,L爲先導物的數量且du爲某分子描 述符空間中第1個化合物與第j個先導物之間的距離。較高 的相似度比數指出距離先導物更遠且與其較不相似的大量 化合物。因此,把S縮減至最小限度即可得到專一性資料 庫。倘若先導物的數量龐大,方程式(3 )中最內部的迴圈 可藉由 D.K. Agrafiotis et al·,39 J· Chem. Inf. Computer SC1.,5 1 -8 ( 1 999)中所描述的k-d樹狀演算法來計算,此處所 表示之該演算法乃出自於對該文的全面性參考。 4.限制 此設r目標測量指定範圍內之一組特定化合物之特性 的適合度,被定義爲: />(〇 =去 2 S maxU;•娜 _ %% 巧酿,〇) ⑷ N i j v.:“ rr . 其中,XU爲第i個化合物之第j個特性,而x/in及x/aX爲分 別受限於第J個特性的最小値及最大値。此函數値隨著越來 越多的化合物落於欲得特性的範圍之外而增加。因此,把P 縮減至最小限度即可得到受限性資料庫。在一採用多種特 性的實施例中,我們必須將特性標準化或將其加權以做出 、有意義的比較。在一欲得特性必須達到一特定目標値(亦 即,就一退化範圍而言)的實施例中,方程式(4 )可被改 寫成: 本紙張尺度適用中.國國家標準(CNS ) A4規格(210X297公釐) (請先閱讀背面之注意事項再填寫本頁) 一裝- 訂 f -15- 523699 A7 B7 五、發明説明(13 ) p(c)=士 ΣΣ—(w) (5) » j (請先閱讀背面之注意事項再填寫本頁) 其中,χ/表示第」個特性的目標値。 5.活性/選擇性 資料庫設計中的一共通目標在於產生化合物之陣列, 此陣列依據某定量的結構活性或感應器結合模型對一預先 定義的目標而言被預測具有最大活性。當個別化合物之預 測活性總計如下時,此目標藉由表現一組特定的化合物C 之預測活性來完成: 2“c)=告(6) i 其中,ai是‘ C中第i個化合物之預測活性的某個基準。一相 似的函數可用來測量對一組生物目標之選擇性: 2:(C) = 士Σ(〜Ux(〜)) (7) 經濟部智慧財產局員工消費合作社印製 其中,au是對第j個目標之第i個化合物的預測活性,而k 是分子被挑選時應該對應的目標。當化合物變得更具活性/ 選擇性時,QA/QS之値增大。因此,將其標準分別增加至最 大限度即可得到活性/選擇性資料庫。 • 6.多目標設計 在一實施例中,個別的設計目標,例如但不限於之前 所描述的設計目標,可以相互結合以產生滿足多種設計目 本纸張尺度適用中國國家標準(CNS ) A4規格(210X297公着7 -16- 523699 A7 B7 經濟部智慧財產局員工消費合作社印製 五、發明説明(14 ) 標之陣列,此導致一多目標適合度函數,其被定義爲: F(C) = f(Fl(C\F2(C)^) (8) 其中,F(C)是整體效率測量,而Fi(C)爲與C集合有關的個 別標準。在最後的挑選中,此函數的正確形式及與個別設 計目標有關的係數決定了每個設計目標的影響度。 7 .本發明之貪食法 如前所述,本發明最適用於目標函數被描述成個別分 子的貢獻之情況。本發明允許以一種有利的方式挑選最佳 的或近乎最佳的陣列。本發明利用下列之最佳化啓發法。 使目標函數達到最大値的I試劑,在被給予一含有C個成 份的組合資'料庫、一 i 6 [ 1,C]的點及一特別選出的心試 劑(其中j zz 1,2,.··,i-1,i+1,·.·,C)之後,藉由建構並評估Ri 中之單一試劑與中所有選定之試劑組合而產生之所有可 能的次陣列,並且從中挑選具有最佳適合度(亦即,其滿 足設計目標的程度)的次陣列,此Ri試劑便得以被確定。 此過程始於一隨機選取之陣列,然後按先後次序對每一變 異點做最佳化直到不可能再有進一步的改進爲止。 例如,考慮從一 10x10x10組合資料庫中挑選出一 5x5x5 陣列的情形。此過程始於從每一變異點隨機選出5個試劑並 •評估產生之陣列的適合度。藉由一嚴格交替順序來處理每 一個試劑列表,反覆地進行使此最初的挑選結果更精確。 首先,將Ri中的各試劑與R2及R3中的選定試劑結合以建構 本紙張尺冬適用中國國家標準(CNS ) A4規格(210X29?公釐) -17- (請先閱讀背面之注意事項再填寫本頁) 【裝 、訂 f 523699 A7 ________B7 _ 五、發明説明(15 ) (請先閲讀背面之注意事項再填寫本頁) 10個1x5x5的次陣列。針對設計目標來評估所得之化合或生 成物以決疋其適合度。R i中的各試劑依次被評估,而得分 最高的5個試劑從L中被挑選出來。接著,對R2重複進行此 過程。R2中的各試劑被用來與1^及R3中的選定試劑結合以 建構一 5x1x5的次陣列,而對該變異點而言,產生最佳適合 度的5個R2試劑被挑選出來。然後,以相似的方式來處理r3 ,如此便完成了一個精確化的週期。一旦所有的試劑列表 都被處理過了,從各變異點所選定的試劑將被組合,而產 生出之全陣列的適合度會受到評估並與前一個週期最後所 選出的適合度做比較。假如適合度有改進,則精確化過程 將由L開始重複進行;若無改進,則此過程停止進行。 圖2 A與2 B爲一用於產生組合陣列之方法的流程圖。組 合資料庫中‘替代點的數量以C來表示。試劑的總數量及所 需之陣列在第i點的大小則分別以Ni及Ki來表示。 由圖2A開始,此過程始於步驟202,再直接進入步驟 204 ° 經濟部智慧財產局員工消費合作社印製 在步驟204中,試劑列表被起始爲{Ru =: j; j = l,2,...,Ni; i = 1,2,·.·,C}。試劑列表的數量等於組合資料庫中替代點 的數量C。本過程進入步驟206。 在步驟206中,各Ri試劑列表中的試劑順序是隨機排列 的。 在步驟208中,評估並記錄所產生之陣列的適合度。接 著,本過程進入步驟210。 在步驟2 1 0中,藉由一嚴格交替順序來處理每一個試劑 -18- ^紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐了 523699 A7 B7 五、發明説明(16 ) 列表的反覆過程由此開始。 (請先閱讀背面之注意事項再填寫本頁) 在步驟2 1 2中,從步驟2 1 0已確定的試劑列表中處理每 一試劑之內部反覆迴圈由此開始。 在步驟214中,將從步驟210已確定的試劑列表中在步 驟2 12已確定之試劑與其他變異點中所選定之試劑組合,產 生次陣列並評估其適合度。接著,本過程返回進入步驟2 1 2 以評估步驟2 1 0所確定之試劑列表中的下一個試劑,已確定 之試劑列表中的各試劑在步驟214中依次被評估。當已確定 之試劑列表中的所有試劑都被評估過後,則本過程進入圖 2B的步驟216。 經濟部智慧財產局員工消費合作社印製 在步驟216中,選出具有最佳適合度的試劑。此步驟要 求將步驟210已確定之試劑列表中的試劑以適合度由大至小 的順序重新排列,具有最佳適合度的試劑將被排在試劑列 表中的第一位。然後,本過程返回進入圖2A的步驟2 10以重 新開始下一個試劑列表的反覆過程。每個試劑列表都會重 複進行步驟2 1 2-2 1 6。當所有試劑列表都被處理過後,便完 成了 一個精確化的週期。一個精確化的週期一旦完成,本 過程便進入步驟218。 在步驟218中,組合從各變異點所選定的試劑並評估產 生之全陣列的適合度。本過程繼而進入決定步驟220。 在決定步驟220中,將產生之全陣列的適合度與前一個 •週期最後所選出的適合度做比較。假如產生之全陣列的適 合度大於前一個週期最後所選出的適合度,則適合度有改 進。本適合度將被步驟221中的下一個精確化的週期認定爲 -19· 本紙張尺度適用中國國家標準(CNS ) A4規格(21〇Χ:297公釐) 523699 經濟部智慧財產局員工消費合作社邱製 A7 ___ B7 ___-五、發明説明(17 ) 前一次的適合度。接著,本過程返回進入圖2A的步驟210以 執行另一個精確化的週期。 返回至圖2B的決定步驟220,假如產生之全陣列的適合 度小於或等於前一個週期最後所選出的適合度,則適合度 沒有改進,而本過程進入步驟222。 在步驟222中,產生之組合陣列被視爲輸出結果,而本 過程結束。 爲了將計算量減到最少.,貪心法的一個實施例預先爲 整個資料庫中的每個化合物計算出其對目標函數的個別貢 獻並將之儲存在工作陣列中。此步驟只需執行一次且其級 數爲〇(N)。在最佳化期間,僅加入預先計算出之組成該陣 列的分子之個別貢獻即可對任何一特定陣列或次陣列的適 合度做評估4。貪心法偶爾會陷入只獲得局部最小値的情況 ,爲此,本過程可由一不同的亂數種子(亦即,不同的、 隨機選取的起始陣列)開始重複進行幾次,而具有最佳適 合度的陣列則被挑選出來。在另一種修正較少的實施例中 ,此貪心法可被用來從一個特定之虛擬資料庫的大陣列中 挑選出較小的次陣列。又另一種實施例中,構成最後陣列 的一或多個試劑可能會被預先選出,在此情況下,此貪心 演算法會嘗試去塡滿組合陣列,亦即,指出哪些試劑需要 被加入預先選出的試劑中以產生一最佳的或近乎最佳的陣 -歹[]0 圖2C-2H爲簡化範例,用來說明反覆地以貪心法從一 10x10組合資料庫中挑選出一 3x3陣列。 本紙張尺冬適用中.國國家標準(CNS ) A4規格(210X297公釐) -20- (请先閱讀背面之注意事項再填寫本頁) •装· 訂 523699 A7 __ B7 ___ 五、發明説明(18 ) 圖2C顯示R 1與R2試劑列表中的起始等級排列。 (請先閲讀背面之注意事項再填寫本頁) 圖2D顯示試劑於隨機排列之後在R1與R2試劑列表中的 排列順序。此陣列被測出之適合度的數値爲6。 圖2E顯示試劑在R2的前3個試劑與R1的各試劑組合後 於R 1與R2試劑列表中的排列順序、爲適合度而估算出的組 合,以及重新排序之後在R1中的試劑。 圖2F顯示試劑在R1的前3個試劑與R2的各試劑組合後 於R 1與R2試劑列表中的排列順序、爲適合度而估算出的組 合,以及重新排序之後在R2中的試劑,如此便完成了一個 精確化的週期。產生之3x3陣列被測出的適合度爲8,因爲8 比6大,故此過程必須重複進行,而新的前一次之適合度則 被設爲8。 圖2G顯示試劑在R2的前3個試劑與R1的各試劑組合後 於R 1與R2試劑列表中的排列順序、爲適合度而估算出的組 合,以及重新排序之後在R1中的試劑。 經濟部智慧財產局員工消費合作社印製 圖2H顯示試劑在R1的前3個試劑與R2的各試劑組合後 於R 1與R2試劑列表中的排列順序、爲適合度而估算出的組 合,以及重新排序之後在R2中的試劑,如此便完成了一個 精確化的週期。產生之全陣列被測出的適合度爲8,因爲新 的適合度數値8並未大於前一次的適合度數値8,故產生之 全陣列爲一輸出結果且本過程結束。 *« 8.用以提供組合陣列之貪心法的應用 爲了測試此貪心法的效率,一模擬退火法被用來做比 本紙張尺度適用中國國家標準(CNS) A4規格(210X297公釐) -21 - 523699 A7 _ _ B7 五、發明説明(19 ) (請先閲讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 較。此模擬退火法在設計組合資料庫時被判定爲非常有效 率的方法,其包含二個主要部分:一搜尋引擎及一目標函 數。此搜尋引擎從一虛擬集合(亦被稱爲一狀態)中產生 一含有k個化合物的列表,接著用一目標函數來評估這些 化合物以產生其品質或適合度的一個估計數値。此目標函 數針對實驗之設計目標做編碼,例如化合物的本質差異或 其與一組預先定義之先導物的相似度。此適合度之數値會 被回傳至搜尋引擎,搜尋引擎再以一種控制方式修正其狀 態並產生一新的化合物列表。接著,再以上述方式針對設 計目標標準依次對這些化合物做評估。這個過程會被重複 進行直到不可能再改進,或者,直到已達某些預定的收斂 標準或時間限制爲止。在手邊的例子中,此挑選歷經30個 溫度週期後完成,每一週期使用1000次抽樣步驟、一高斯 冷卻進度表,以及梅卓布理斯驗收標準(P = e _AE/KptT ), 這些都是熟習相關技術者所熟知的。對陣列挑選而言,一 個步驟即代表組合陣列中單一試劑的取代。在模擬期間內 不斷地更新轉換能的平均値並持續調整Kb的數値,因此玻 耳茲曼的^常數」Kb是以一種適應性的方式被調整,致使 在最後溫度時之平均上升轉換的驗收機率爲0.001。在D.K. Agrafiotis, J. Chem. Inf. Computer Sci., 576-90, 84 1 -5 1 ( 1997)中,可找到此演算法的細節,此處所表示之該演算法 •乃出自於對該文的全面性參考。 9.資料集 本纸張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -22- 523699 A7 B7 五、發明説明(20 ) (請先閲讀背面之注意事項再填寫本頁) 有兩個資料集被用來測試本發明的效用。第一個資料 集是一個以還原胺化反應爲基礎的雙成分組合資料庫,圖3 說明還原胺化資料庫之一合成順序300。藉由將主要或次要 胺的溶液加入至1,2 -二氯乙烷/二甲基甲醯胺內之等莫耳比 的乙醛來執行該反應。於反應玻璃瓶中加入1 0 %的醋酸 /DMF 內之 Sodium tracetoxyborohydride ( 2 當量)。在 2 5 °C 的狀態下攪拌該反應混合物12個小時,繼而密集地加入甲 醇,產生高純度之生成物。 經濟部智慧財產局員工消費合作社印製 從可用的化學路徑中隨機選取一組300胺類與300醛類 ,該可用的化學路徑是由加州San Leandro的MDL Information Systems, Inc·來銷售,而這些利用 DirectedDiversity®工具箱之資料庫列舉類別的胺類與醛類 被用來產生一含有90,000個生成物的虛擬資料庫。 DirectedDiversity® 工具箱由 3-Dimensional Pharmaceuticals, Inc.,Exton,PA (1994-2000)取得版權,此處所述乃出自於對 該資料的全面性參考。這些列舉類別將以SDF或SMILES格 式供應的試劑列表與以SMARTS及擴大至直述語言Tel爲基 礎之某專屬語言寫成的一反應圖示視爲輸出結果。 在這個含有90,000個生成物的虛擬資料庫中,每個化合 物具有用〇^〇^(10“^5^©工具箱計算出之一組標準的117 個位相描述符的特徵。這些描述符包含一組已確立的位相 •指數,其在結構活性的交互作用上,例如分子連接法指數 、K型指數、子圖總計、資訊理論指數、Bonchev-Trinajstis指數與位相態指數,具有悠久、成功的歷史。請 -23- 本紙張尺冬適用中國國家標準(CNS ) A4規格(210X297公釐) 523699 Μ Β7 五、發明説明(21 ) (請先閱讀背面之注意事項再填寫本頁) 參見 L.H. Hall et al·,The Molecular Connectivity Chi Indexes and Kappa Shape Indexes in Structure-Property Relations, Reviews of Computational Chemistry; D. B. Boyd et al·,Eds.; VCH: Weinheim, Germany (1991); Chapter 9, pp. 367-422’ 此 處所述乃出自於對該文的全面性參考。也請參見D. Bonchev et al.,67 J. Chem. Phys.,45 1 7-3 3 ( 1 977),此處所 述乃出自於對該文的全面性參考。這些描述符顯示出適當 的“社區行爲”(在 D.E. Patterson et al·,39 J. Med. Chem·, 3049-59 (1996)中有明確的定義,此處所述乃出自於對該文 的全面性參考),因此,非常適用於差異分析及相似度搜 尋。請參見 V.S. Lobanov et al·,40 J. Chem. Inf. Computer Sci.,460-7 0 (2000),此處所述乃出自於對該文的全面性參 考。 · 經濟部智慧財產局員工消費合作社印製 隨後,利用熟習相關技術者所熟知的主成份分析,使 這1 17個分子描述符標準化並減低其關聯性。這個過程產生 一由23個潛在變數構成的正交集,說明了資料中99%的總變 化量。爲了簡化此分析及對結果的解釋,利用一非常快速 之非線性映像演算法,使這個23維資料集進而變成二維, 此非線性映像演算法敘述於D. K. A g r a f i 〇 t i s e t a 1.,J. C h e m. Inf. Computer Sci., 40, 1 356- 1 362 (2000) ' D.N. Rassokhin et al·,J· Comput. Chem·,22(4), 373-386 (200 1 ),以及 D.K。 Agrafiotis et al., J. Comput. Chem., 22(5), 488-500 (200 1) ^ 此處所述乃出自於對該文的全面性參考。此投影以此方式 執行致使該23維主成份空間中點與點之間的距離儘可能地 本紙張尺冬適用中國國家標準(CNS ) A4規格(210X297公釐) ~ " 523699 A7 ____B7 五、發明説明(22 ) (請先閱讀背面之注意事項再填寫本頁) 被保存在該二維映像中。產生之映像具有一 0.187的Kruskal 應力且被用以顯現挑選物,而其皆在該23維主成份空間中 被挑選出來。爲了排除資料中重複、多餘的狀況,此主成 份分析之預先處理步驟是不可缺少的,而圖解理論描述符 通常具有這種資料中重複、多餘的特徵。 最後,除了這117個位相描述符之外,利用Ghose-Grippen approach以獨立計算分子量及各個化合物的辛醇水 分佈係數(Log P ),此 Ghose-Grippen approach 敘述於 A.K. Ghose et al.,102 J. Phys· Chem. A,3762-72 (199 8),此 處所述乃出自於對該文的全面性參考,如在 DirectedDiversity®工具箱中所執行的一般,而且被用以當 做所有限制設計的目標變數。用來評估相似度的描述符集 中,並未包&含這個參數。所有的挑選物皆爲10x10陣列。 經濟部智慧財產局員工消費合作社印製 第二個例子是出自 Cramer et al·,38 Chem. Inf. Computer Sci.,1010-23 (1 998)中的一個三成份資料庫,此處 所述乃出自於對該文的全面性參考。將一包含兩個一級或 二級胺的二胺分子當做中央支架並利用一醯化劑、反應鹵 化物或易受還原胺化影響的碳基使之從其兩側衍生。必需 產生此資料庫之合成順序包含選擇性地保護其中一個胺並 引進第一支鏈,緊接著是去保護並引進第二支鏈。圖4爲一 圖表,說明用於製作二胺資料庫之合成順序400。只使用商 -業上可取得之試劑(包含Π50個HNXNH型之試劑與26700 個RX型之試劑的1996可用的化學路徑)將會產生超過1〇12 個的潛在生成物。由於此作業目標是要使陣列選擇的方法 -25- 本紙張尺度適用中國國家標準(CNS ) A4規格(210 X 297公釐) 523699 A7 B7 五、發明説明(23 ) (請先閲讀背面之注意事項再填寫本頁) 生效,故產生了一個利用50個商業上可取得之二胺及50個 氯酸與烷化劑化合爲1 25000個化合物所組成的資料庫。如 同前一個資料集一般,每個化合物由被用以獲取分子圖表 之主要特點的117個位相指數來描述,隨後,這117個位相 指數與22個主成份之間的關聯性減低了,並且說明了資料 中9 9 %的總變化量。這些主成份被用來當作輸入至一非線性 維度精簡技術以產生一個二維映像,其在主成份空間中將 兩兩化合物之間的距離複製爲一 0.1 67的Kruskal應力,此映 像僅用於顯現設計,每個設計皆以所有22個非相關的描述 符爲基礎。挑選物皆爲5x5x5陣列。 10.成果與討論 經濟部智慧財產局員工消費合作社印製 此問題'之組合性本質不允許在這些集合之任何一個中 窮舉每種可能的陣列。對還原胺化資料庫而言,由方程式2 所決定之不同的10x10陣列的數量約爲2· 1 0 3 6 ’但對二胺資 料庫而言,不同的5x5x5陣列的數量約爲2_1019。在未知整 體最小値之前,有三個參考點被用以估計透過本發明之方 法所得之解的品質。第一個爲挑選由等量化合物構成之一 稀疏陣列的適合度,並且表示目標函數對一特定挑選物之 大小的上限。因爲全陣列挑選法爲一稀疏陣列挑選法再加 上一些額外的限制,所以全陣列挑選法永遠不會超過一單 •純之稀疏陣列挑選法設計的品質。以確定性的方式藉由評 估每個化合物與其最接近之先導物的相似度、以相似度由 大至小的順序來排列化合物’以及從該列表中挑選出排名 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) \ 2Q - 523699 A7 B7 五、發明説明(24 ) (請先閲讀背面之注意事項再填寫本頁) 最前的k個化合物,稀疏陣列則被挑選出來。另外二個參 考點,其一爲一隨機陣列的平均適合度,其二爲來自於前 述退火優化法之陣列的適合度。 對還原胺化資料庫而言,相似度的挑選被限制在100個 化合物(100個稀疏陣列,10x10全陣列)之內,並且利用 方程式3中的相似度適合度函數與一隨機挑選該資料庫之一 成員爲一「先導物」來完成。圖5爲一圖表,說明用於從還 原胺化資料庫中挑選相似度的一參照結構500 °因爲這些方 法沒有一個是完全確定性的,所以這些挑選會被重複進行 100次,每次從一不同的隨機起始配置(亂數種子)開始。 經濟部智慧財產局員工消費合作社印製 圖6爲一長條圖600,說明根據與一參照結構500之最大 相似度,從一還原胺化資料庫中挑選出1〇〇個化合物之相似 度比數的平均値及標準差。長條圖600顯示一隨機或際遇法 602、一退火法604、貪心法606及稀疏陣列法608的結果。貪 心法606已證明是極爲收斂的:每單一次執行都會產生一 0.594之比數的相同結果且是此作業行使中所有已發現之陣 列裡的最佳陣列。反之,模擬退火法604在100次試驗中只 有60次會收斂至該解,雖然一般來說其執行效率分別滿足 試驗之82%及98%而導致小於0.60及0.61的比數及一個〇·597 ±0.004的整體平均値。這些解比那些用際遇法602 ( —隨機 陣列的平均比數爲1.8 5 5 ± 0.086 )所獲得的解更好,而且非 •常適合與擁有0.533之比數的稀疏陣列法608相比較。 圖7A爲一圖表700,說明根據與一參照結構500之最大 相似度,從一還原胺化資料庫中挑選出一 10x10陣列之化合 本紙張尺卑適用中國國家標準(CNS ) A4規格(210X297公釐) 523699 A7 B7 五、發明説明(25 ) (請先閲讀背面之注意事項再填寫本頁) 物的分佈情況。圖7 B爲一圖表7 1 0,說明根據與一參照結構 5 00之最大相似度,從一還原胺化資料庫中挑選出100個稀 疏陣列之化合物的分佈情況。圖7 B被用以當做一參考。大 正方格(分別爲圖7A中的702及圖7B中的704 )與小正方格 .(分別爲圖7A中的708及圖7B中的706 )分別代表參考化合 物(先導物)與被選定之化合物。圖7A及7B中之圖表爲23 個主成份之二維非線性投影,說明了資料中99%的總變化量 ,並且以一種儘可能保存物.件之接近値(相似度)的方式 來製圖。挑選物以所有23個主成份爲基礎且單純地被照亮 以突顯於該映像上。維度上的激烈精簡作用難免會失真, 而這可由化合物似乎比被選出者更靠近先導物的情況上看 出。然而,此失真因非線性映像之故而分佈在整個資料空 間上,結桌即使是稀疏陣列與全陣列之間相當小的差異, 也明白地顯示在映像上·。實際..的挑選物大部分是由在先導 化合物的兩個支鏈上找到之融合環系統的各種雜環類似物 組成。 經濟部智慧財產局員工消費合作社印製 圖8爲一圖表800,說明根據與一參照結構500之最大相 似度,從一還原胺化資料庫中挑選出構成一 10x10最佳化陣 列之胺試劑與醛試劑。 爲了確定先導.化合物之挑選與位置是否會影響貪心法 偵測一適當之解的能力,利用從胺化資料庫·中隨機挑選出 •的100個參照結構,來比較貪心法與模擬退火法的執行效率 。實驗中隨機挑選100個化合物、以本發明之方法及模擬退 火法爲每一個化合物挑選最相似之1 0 X 1 0陣列,然後比較產 本紙張尺尽適用中國國家標準(CNS ) A4規格(210X297公釐) 523699 A7 B7 五、發明説明(26 ) (請先閲讀背面之注意事項再填寫本頁) 生之設計的比數。在100個案例中的1 3個案例裡,模擬退火 法產生一較差的陣列,而在其餘的87個案例中,兩種方法 均產生同一結果。 圖9爲一圖表900,顯示以模擬退火法及本發明之貪心 法,從一還原胺化資料庫中挑選出1 〇〇個不同的隨機先導物 之最佳1 Ox 1 0陣列的相似度比數之比較情形。如圖9中之分 離點902所示,在其中5個案例中,這二種技術的差異是顯 而易見的。因此,雖然我們.不能肯定最佳解已被確認,但 很明顯地,貪心法非常適合與更複雜且更需要計算之模擬 退火法相比較且似乎可達到整體最佳化。 經濟部智慧財產局員工消費合作社印製 前一個例子說明以一包含單一目標(相似度)之函數 來使用貪心法的情形。事實上,以任何可被描述爲許多個 別分子貢獻之目標函數來使用貪心法,同樣都有效。圖10 爲一圖表,說明用於從一還原胺化資料庫中做相似性應用 之多目標挑選的一參照結構1000。此化合物擁有一 360.3的 分子量及一預測之6.46的log P値,而且落在Lip inski 「規 則5」所定義的範圍之外,C.A. Lipinski et al.,Adv. Drug Delivery Rev·, 2 3, 3-25 ( 1 997)中曾描述此「規則5」,此處 所述乃出自於對該文的全面性參考。此規則是由世界藥物 指標的一項分析所導出,說明對於非生物輸送者之基質的 化合物而言,當有超過5個氫鏈捐贈者、超過1〇個氫鏈接受 者、分子量大於500或log P的値大於5時,不良的吸收和滲 透很可能會發生。 圖11 A爲一圖表11 0 0,說明根據與一參照結構1 〇 〇 〇之最 本紙張尺度適用中國國家標準(CNS ) A4規格(210 X 297公釐) 523699 A7 B7 五、發明説明(27 ) (請先閱讀背面之注意事項再填寫本頁) 大相似度,從一還原胺化資料庫中挑選出10x10陣列的化合 物之差異空間的分佈情況。圖1 1 B爲一圖表1 1 1 0,說明根據 與一參照結構1000之最大相似度,從一還原胺化資料庫中 挑選出1 Ox 1 0陣列的化合物之分子量對計算出之log P的分 佈情況。大正方格(分別爲圖11 A中的11 02及圖1 1 B中的 1 104 )與小正方格(分別爲圖1 1 A中的1 108及圖1 1B中的 1106 )分別代表參考化合物(先導物)與被選定之化合物 。如圖1 1 B所示,以此「先導物」之最大相似度爲基礎所挑 選出的10x10陣列是由平均log P値= 5·47±0·85之化合物所構 成,其中有77個化合物的log Ρ値大於5。 經濟部智慧財產局員工消費合作社印製 圖12爲一圖表1 200,說明根據與參照結構1〇〇〇之最大 相似度,從還原胺化資料庫中挑選出構成10x10陣列之試劑 。被選定之試劑是由鹵化安息香醒及包含兩個六元環的疏 水性胺類所組成,這兩個六元環被一小連結物所區隔。爲 了降低這些化合物的疏水性並同時保存整體結構的相似度 ,可將方程式3中之分子相似度標準與定義於Lipin ski box (log P = 5, MW = 500 )的範圍之上的方程式4中之限制標準 結合。 圖13A爲一圖表1 300,說明根據參照結構1〇〇〇及方程式 (9 )(列於後文),從還原胺化資料庫中挑選出1 〇x 1 〇陣 列的化合物之差異空間的分佈情況。圖13B爲一圖表1310 ’ .說明根據參照結構1000及方程式(9)(列於後文)’從還 原胺化資料庫中挑1出10x10陣列的化合物在以分子量與計 算出之log P所定義之空間上的分佈情況。再一次’大正方 30- 本紙張尺度適用中.國國家標準(CNS ) A4規格(210X297公釐) 523699 Α7 Β7 經濟部智慧財產局員工消費合作社印製 五、發明説明(28 ) 格(分別爲圖13A中的1 302及圖13B中的1 304 )與小正方格 (分別爲圖11A中的1108及圖11B中的11〇6)分別代表參考 化合物(先導物)與被選定之化合物。圖13A與圖13B顯示 以10x10格式挑選出100個化合物,使目標函數減至最小: /(C)-5(C) + 2-P(C) (9) 其中,S(C)及P(C)分別得自方程式3及方程式4。重量決定 了在最後設計中每個標準.之相對影響,而且是以D.N. Rassokhin et al., J. Mol. Graphics Model, 1 8(4-5), 370-384 (2000)中所描述的一簡單圖示爲基礎被挑選出來,此處所述 之簡單圖示乃出自於對該文的全面性參考。產生之陣列是 由平均log P値=4.5 8±0.72的化合物組成,而且包含圖14中 所顯示的試劑。圖14爲一圖表1400,說明根據參照結構 1000及方程式(9 ),從還原胺化資料庫中挑選出構成 10x10陣列之試劑。在圖12及圖14的兩個挑選中’有9個共 同的試劑(8個胺及1個醛)。原始挑選中的二個疏水性胺 類被帶有甲氧基之位相上相似的結構所取代’而數個多_ 化安息香醛被含有較少量鹵素置換基及其中4個案例中之S 基的試劑所取代。因此,只要小心選擇參數’此種多目標 的方法便能夠將一挑選引導至更令人滿意的化1學空胃範11 而不用破壞實驗的主目標,在此狀況下,該主目標β[]胃 、系列與已知的先導物密切相關之類似物的設計° 爲了確保本發明之方法的執行效率不會因較複雜的組 合資料庫而降低,重複對上述之3成份二胺資料庫進行相同 本紙張尺度適用中國國家標準(CNS ) Α4規格(210Χ297公釐) -31 - (請先閲讀背面之注意事項再填寫本頁) 一裝. 訂 523699 A7 B7 五、發明説明(29 ) (請先閲讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 型態的分析。此結果槪述於圖1 5及圖1 6。圖1 5爲一長條圖 1 500,說明根據與一最佳化收集超過100次的隨機挑選結構 (5x5x5陣列,125個稀疏陣列)之最大相似度,從二胺資 料庫中挑選1 25個化合物之相似度比數的平均値及標準差。 此結果是用來顯示一隨機或際遇法1 502、一模擬退火法 1 504、貪心法1 506,以及稀疏陣列法1 508。再一次,貪心法 極爲堅固,產生了三個不同但非常相似的解,其具有一 0.4833±0.0001的平均適合度.;100個試驗中有79個收斂至一 具有比數爲0.4832的陣列,而其餘的21個試驗收斂至二個具 有同一比數爲0.4835的不同陣列。模擬退火法顯示一稍微較 高的變化性並收斂至8個不同的解’這些解具有範圍從 0.48 32(爲進行21次的貪心法所確定之同一陣列)到0.503的適 合度數値以及一 〇.4859±0.0043的平均値。如同胺化資料 庫一般,此實驗是以二胺集合中一隨機選取的「先導物」 爲基礎。接著,對1〇〇個隨機選取之參考化合物重複進行此 過程,其結果槪述於圖16。圖16爲一圖表1600,說明根據 與100個隨機先導物之最大相似度’以模擬退火法及本發明 之貪心法,從二胺資料庫中挑選出最佳5x5x5陣列的相似度 比數之比較情形。由貪心法產生的解在這些試驗中有57個 稍微好些,有1 6個稍微差些’而在剩餘的27個中則相同’ 差異範圍從-0.059到0.0033。 使用貪心法的一項最重要的優點爲其執行速度。圖17 爲一長條圖,說明在一 400Mhz Intel Pentium II處理器上以 本發明之貪心法分別從還原胺化資料庫及=胺資料庫中挑 -32- 本纸張尺尽適用中國國家標準(CNS ) A4規格(210X297公釐) 523699 A7 B7 五、發明説明(3〇 ) (請先閲讀背面之注意事項再填寫本頁) 選出 100 ( 17 02 )、400 ( 1 704 )、1 600 ( 1 706 )、6400 ( 1708)及25600 ( 1710)個化合物時所需之cpu時間。貪心 法只需要些微的計算,而且即使是最大量的挑選亦可在次 秒的時間片段內完成,有一大部分的時間是花在預先處理 的步驟中計算每個候選物與各自的先導物之間的歐式距離 上,這些時間與虛擬資料庫的大小成線性比。貪心法本身 與試劑的總數量成線性比,而產生的解是比得上且常常優 於那些由更複雜之推測方法所導出的解。 11.本發明之實作 經濟部智慧財產局員工消費合作社印製 本發明可利用硬體、軟體或其組合來賓作,而且可在 一或多個電腦系統或其他處理系統上來實作。事實上,在 一實施例中,此發明指向一或多個能夠執行文中所述之功 能的電腦系統。圖1 8顯示一電腦系統1 800之範例實作。就 此示範性的電腦系統1 800來說已描述了各種實施例。讀完 該敘述之後,熟習相關技術者很明顯地會懂得如何使用其 他的電腦系統及/或電腦結構以實作本發明。電腦系統1 800 包含一或多個處理器,例如處理器1 803。處理器1 803連接 至一通訊匯流排1 8 0 2。 電腦系統1 800也包含一個主記憶體1 805,更可說是隨 機存取記憶體(RAM ),而且也可以包含一個輔助記憶體 、1810。舉例來說,輔助記憶體1810可包含一個硬碟機1812及 /或一個抽取式儲存機1 8 1 4,代表一軟碟機、一磁帶機、一 光碟機,等等。抽取式儲存機1814以一已知的方式從抽取 本紙張尺率適用中.國國家標準(CNS ) A4規格(210X297公釐) -33- 523699 A7 _________ B7 五、發明説明(31 ) (請先閲讀背面之注意事項再填寫本頁) 式儲存器18 18讀取及/或寫入此儲存器1818。抽取式儲存器 18 18代表一軟碟機、一磁帶機、一光碟機,等等,這些被 抽取式儲存機1814讀取及寫入。如眾所知,抽取式儲存器 181 8包含一個電腦可用儲存媒體.,其中已儲存電腦軟體及/ 或資料。 在另一個實施例中,輔助記憶體1810可包含用於使電 腦程式或別的指令被下載至電腦系統1 800之其他相似的裝 置。舉例來說,該裝置可包含一個抽取式儲存器1 822及一 介面1 820。像這樣的範例可能包含一個程式盒與盒式介面 (例如視訊遊戲裝置中所具備的)、一個抽取式記億晶片 (例如可消除程式化唯讀記憶體(EPROM )或程式可控唯 讀儲存器(PROM ))與串聯插槽,以及別的抽取式儲存 器1 822與允軟體及資料從抽取式儲存器1 822轉換至電腦 系統1 800的介面1 820。 經濟部智慧財產局員工消費合作社印製 電腦系統1 800也可以包含一個通訊介面1 824。通訊介 面1 824允許軟體及資料在電腦系統1 800與外部裝置之間轉 換。通訊介面1 824的範例可能包含一數據機、一網路介面 (例如一個乙太網路卡)、一通訊連接埠、一 PCMCIA插槽 及卡、一無線區域網路介面,等等。軟體及資料以信號 1 828的形式經由通訊介面1 824來轉換,這些信號1 824可能是 電子的、電磁的、光學的或其他能被通訊介面1 824接收的 •信號。這些信號1 828經由一通訊路徑(亦即,通道)1826 而被提供給通訊介面1824。此通道1 826攜帶信號1 8 24且可利 用電纜或有線電視、光纖、電話線、大哥大連結、無線連 本紙張尺度適用中國國家標準(CNS ) A4規格(210X29*7公釐) -34- 523699 A7 ___B7_ 五、發明説明(32 ) " 結,以及其他通訊通道來實作。 在此文件中,「電腦程式產品」這個術語意指抽取式 儲存器1818、1 822及信號1 828。這些電腦程式產品爲用來對 電腦系統1 800提供軟體的裝置。此發明指向該電腦程式產 電腦程式(亦稱爲電腦控制邏輯)被儲存在主記憶體 1 805及/或輔助記憶體18 10中及/或在電腦程式產品中。電腦 程式也可以經由通訊介面18.24而被接收。執行該電腦程式 時,會使電腦系統1 800執行如文中所述之本發明的特色。 尤其,執行該電腦程式時,會使處理器1 803執行本發明的 特色。因此,該電腦程式代表電腦系統1 800的控制者。 在一使用軟體實作此發明的實施例中,該軟體可被儲 存在一電腦程式產品中並被下載至使用抽取式儲存機1814 、硬碟機1812或通訊介面1 824的電腦系統1 800中。當控制邏 輯(軟體)由處理器1 803來執行時,會使處理器1 803執行如文 中所述之本發明的功能。 在另一個實施例中,主要以使用硬體來實作此發明, 例如,如特殊用途積體電路(ASICs )的硬體元件。熟習 相關技術者將淸楚地瞭解硬體狀態機之實作,以便執行文 中所述之功能。 在又另一個實施例中,使用一硬體與軟體之組合以實 •作此發明。 12.結論 (請先閲讀背面之注意事項再填寫本頁) -裝· P. 經濟部智慧財產局員工消費合作社印製 -35 A7
523699 五、發明説明(33 ) 雖然上文中已描述本發明之種種實施例,但我們應瞭 解這些實施例僅爲示範性而非限制性之描述。熟習此技術 者會瞭解在不違反附加的申請專利範圍中所定義之本發明 的精神及範圍之情況下,在其中也可以做各種形式及細節 上的改變。因此,本發明之廣泛性及範圍不應該被上述任 何一個示範性的實施例所限制,而應該僅依據下列申請專 利範圍及其同等事項來定義之。 (請先閲讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 本紙張尺〆適用中國國家標準(CNS ) A4規格(210X297公釐)
Claims (1)
- 523699 A8 B8 C8 D8 六、申請專利範圍 1. 一種用於設計組合陣列之方法,包含以下步驟: (請先閱讀背面之注意事項再填寫本頁) (1) 從一組合資料庫中之眾多變異點上決定所要挑選出 的一些試劑,其中該些試劑的數量少於或等於該組合資料 庫中之每個該變異點上的候選試劑之數量; (2) 從該組合資料庫中每個該變異點上的眾多候選試劑 中,挑選出該數量的試劑; (3) 評估經由步驟(2)中挑選出之該數量的試劑之有系 統的組合所得組合陣列之適合度(Γ); (4) 藉由鑑定由該組合資料庫中每個該變異點上之各該 多數候選試劑與其中所有其他的該變異點上之選定試劑的 有系統的組合所產生的組合次陣列,而獨立評估該組合資 料庫中該變異點之其中一點上的多數候選試劑; (5) 以步驟(4 )中所得的結果爲基礎,排列該組合資料 庫中該變異點之該其中一點上的該多數候選試劑中之各該 候選試劑; 經濟部智慧財產局員工消費合作社印製 (6) 以該等級排列之步驟的結果爲基礎,從該組合資料 庫中該變異點之該其中一點上的該多數候選試劑中,挑選 一組新試劑; (7) 對該組合資料庫中之各該變異點,重複進行步驟(4 )、(5 )及(6 ); (8) 評估一組合陣列之適合度(f ),而該組合陣列產 生自該組合資料庫中各該變異點上之選定試劑的有系統的 組合; (9) 倘若f爲優於Γ的適合度,則設定Γ等於f且重複步 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) Γ37 -~ 523699 A8 B8 C8 D8 ____ •一, m 六、申請專利範圍 驟(4)至(8);及 (請先閲讀背面之注意事項再填寫本頁) (ίο)倘若f爲不優於f,的適合度,則從步驟(8)輸出該 組合陣列。 2. 如申請專利範圍第1項之方法,其中以一或多個目標 函數爲基礎,評估步驟(3 ) 、( 4 )及(8 ) ° 3. 如申請專利範圍第1項之方法,其中以包含該組合陣 列及/或該組合次陣列之化合物與至少一個特定之參考化合 物的相似度爲基礎,評估步驟(3 ) 、( 4 )及(8 ) ° 4. 如申請專利範圍第1項之方法,其中以包含該組合陣 列及/或該組合次陣列之化合物與至少一個疑問或探索的一 致程度爲基礎,評估步驟(3 ) 、( 4 )及(8 )。 5 .如申請專利範圍第1項之方法,其中以至少一個包含 該組合陣列及/或該組合次陣列之化合物的特性爲基礎’評 估步驟(3) 、( 4)及(8) ° 6.如申請專利範圍第5項之方法,其中該至少一個包含 該組合陣列及/或該組合次陣列之化合物的特性爲一計算特 性。 經濟部智慧財產局員工消費合作社印製 7 ·如申請專利範圍第1項之方法,其中步驟(2 )包含從 該組合資料庫中每個該變異點上的該多數候選試劑中隨機 地挑選出該數量的試劑的步驟。 8·如申請專利範圍第1項之方法,其中步驟(2)包含從 該組合資料庫中每個該變異點上的該多數候選試劑中有系 統地或部份有系統地挑選出該數量的試劑的步驟。 9·如申請專利範圍第1項之方法,其中至少重複進行兩 本紙張尺專逋用中國國家橾準(CNS ) A4規格(210X297公釐) Γ38- ^----- 523699 A8 B8 C8 D8 六、申請專利範圍 次步驟(2 )〜(10 )。 (請先閱讀背面之注意事項再填寫本頁) 1 0.如申請專利範圍第1項之方法,其中步驟(2 )包含 從該組合資料庫中每個該變異點上的該多數候選試劑中挑 選出該數量的試劑的步驟,致使從該變異點之至少其中一 點上所選定的試劑至少含有一個特定試劑。 11. 如申請專利範圍第1項之方法,其中步驟(6 )以步 驟(5 )中已確定的等級排列爲基礎,包含從該組合資料庫 中每個該變異點上之該多數候選試劑中挑選出該組新試劑 的步驟,致使該組合資料庫中該變異點之該其中一點上的 該組新選定試劑至少含有一個特定試劑。 12. —種用於使電腦能夠設計組合陣列之電腦程式產品 ,其包含一載有電腦程式邏輯之電腦可用媒體,該電腦程 式邏輯包含” 一確定方法,用於使一處理器能夠確定從一組合資料 庫中多數變異點上挑選出一些試劑,其中該試劑少於或等 於該組合資料庫中每個該變異點上的一些候選試劑; 經濟部智慧財產局員工消費合作社印製 一挑選方法,用於使一處理器能夠從該組合資料庫中 每個該變異點上的多數候選試劑中挑選出該數量的試劑; 一第一評估方法,用於使一處理器能夠評估一組合陣 列之適合度(Γ),該組合陣列產生自由該挑選方法取得 之該數量的試劑的有系統的組合; 一獨立評估方法,用於使一處理器能夠藉由鑑定由該 組合資料庫中每個該變異點上之各該多數候選試劑與其中 所有其他的該變異點上之選定試劑的有系統的組合所產生 本紙張尺尽適用中國國家標準( CNS ) A4規格(210X297公釐) 39 - 523699 A8 B8 C8 D8 六、申請專利範圍 ^、 的組合次陣列,獨立評估該組合資料庫中該變異點之其中 一點上之多數候選試劑; 一等級排列方法,用於使一處理器能夠以該獨立評估 方法中所得的結果爲基礎,排列該組合資料庫中該變異點 之該其中一點上的該多數候選試劑中之各該候選試劑; 一挑選方法,用於使一處理器能夠以該等級排列方法 的結果爲基礎,從該組合資料庫中該變異點之該其中〜點 上的該多數候選試劑中挑選一組新試劑; 一等級排列與挑選方法,用於使一處理器能夠依次排 列並挑選該組合資料庫中每個該變異點上之試劑; 一第二評估方法,用於使一處理器能夠評估該組合陣 列之適合度(f ),該組合陣列產生自該組合資料庫中每個 該變異點上之選定試劑的有系統的組合; 一用於使一處理器能夠判定適合度f是否優於適合度Γ 的方法; 一用於使一處理器能夠重新設計該組合陣列直到適合 度f不優於適合度Γ爲止的方法; 一用於使一處理器能夠在適合度f優於適合度f’時設定 Γ等於f的設定方法,及 一用於使一處理器能夠輸出該組合陣列的輸出方法。 13.如申請專利範圍第12項之電腦程式產品,其中以一 或多個目標函數爲基礎,評估該第一評估方法、 該獨立評估方法及該第二評估方法。 1 4.如申請專利範圍第1 2項之電腦程式產品’其中以包 本紙張尺冬適用中國國家揉準(CNS ) A4規格(210X297公釐1 - 40- " f請先閲讀背面之注意事項再填寫本頁} -訂 f 經濟部智慧財產局員工消費合作社印製 523699 A8 B8 C8 D8 六、申請專利範圍 含該組合陣列及/或該組合次陣列之化合物與至少一個特定 之參考化合物的相似度爲基礎,評估該第一評估方法、該 獨立評估方法及該第二評估方法。 15. 如申請專利範圍第12項之電腦程式產品,其中以包 含該組合陣列及/或該組合次陣列之化合物與至少一個疑問 或探索的一致程度爲基礎,評估該第一評估方法、該獨立 評估方法及該第二評估方法。 16. 如申請專利範圍第12項之電腦程式產品,其中以至 少一個包含該組合陣列及/或該組合次陣列之化合物的特性 爲基礎,評估該第一評估方法、該獨立評估方法及該第二 評估方法。 17. 如申請專利範圍第16項之電腦程式產品,其中該至 少一個包含該組合陣列及/或該組合次陣列之化合物的特性 爲.一計算特性。 18. 如申請專利範圍第12項之電腦程式產品,其中用於 使一處理器能夠從該組合資料庫中每個該變異點上的多數 候選試劑中挑選出該數量的試劑的該挑選方法,另包含用 於使一處理器能夠從該組合資料庫中每個該變異點上的多 數候選試劑中隨機地挑選出該數量的試劑的方法。 19. 如申請專利範圍第12項之電腦程式產品,其中用於 使一處理器能夠從該組合資料庫中每個該變異點上的多數 候選試劑中挑選出該數量的試劑的該挑選方法,另包含用 於使一處理器能夠從該組合資料庫中每個該變異點上的該 多數候選試劑中有系統地或部份有系統地挑選出該數量的 本紙張尺度適用中國國家標準( CNS ) A4規格(210X297公釐) -41 - (請先閲讀背面之注意事項再填寫本頁) 一裝· •Γ. 經濟部智慧財產局員工消费合作社印製 523699 A8 B8 C8 D8 X、申請專利範圍 試劑的方法。 20.如申請專利範圍第12項之電腦程式產品,其中用於 使一處理器能夠從該組合資料庫中每個該變異點上的多數 候選試劑中挑選出該數暈的試劑的該挑選方法,另包含用 於使一處理器能夠從該組合資料庫中每個該變異點上的該 多數候選試劑中挑選出該數量的試劑的方法,致使從該變 異點之至少其中一點上所選定的試劑至少含有一個特定試 劑。 2 1.如申請專利範圍第1 2項之電腦程式產品,其中用於 使一處理器能夠以該等級排列方法的結果爲基礎,從該組 合資料庫中該變異點之該其中一點上的該多數候選試劑中 挑選一組新試劑的該挑選方法,另包含用於使一處理器能 夠以該等級排列方法爲基礎,從該組合資料庫中每個該變 異點上之該多數候選試劑中挑選出該組新試劑的方法,致 使該組合資料庫中該變異點之該其中一點上的該組新選定 試劑至少含有一個特定試劑。 (請先閱讀背面之注意事項再填寫本頁) 一裝- 訂 f 經濟部智慧財產局員工消費合作社印製 本紙張尺度逋用中國國家標準(CNS ) A4規格(210X297公釐) -42 -
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US18570000P | 2000-02-29 | 2000-02-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW523699B true TW523699B (en) | 2003-03-11 |
Family
ID=22682096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW090104949A TW523699B (en) | 2000-02-29 | 2001-03-01 | Method and computer program product for designing combinatorial arrays |
Country Status (5)
Country | Link |
---|---|
US (1) | US6671627B2 (zh) |
AR (1) | AR027586A1 (zh) |
AU (1) | AU2001241800A1 (zh) |
TW (1) | TW523699B (zh) |
WO (1) | WO2001065462A2 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001013283A1 (en) * | 1999-08-13 | 2001-02-22 | Mpower.Com, Inc. | A system, method, and computer program product for configuring stochastic simulation models in an object oriented environment |
US20030018598A1 (en) * | 2001-07-19 | 2003-01-23 | Cawse James Norman | Neural network method and system |
US7635564B2 (en) | 2002-10-25 | 2009-12-22 | Agilent Technologies, Inc. | Biopolymeric arrays having replicate elements |
US20080155235A1 (en) * | 2006-10-02 | 2008-06-26 | Dewey Douglas W | Instructions Capable of Preventing Incorrect Usage of UContext Functions in a Multi-Process Environment |
Family Cites Families (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61223941A (ja) | 1985-03-29 | 1986-10-04 | Kagaku Joho Kyokai | 化学構造の検索方法 |
US4773099A (en) | 1985-10-10 | 1988-09-20 | The Palantir Corporation | Pattern classification means for use in a pattern recognition system |
US4908773A (en) | 1987-04-06 | 1990-03-13 | Genex Corporation | Computer designed stabilized proteins and method for producing same |
US4859736A (en) | 1987-03-30 | 1989-08-22 | Ciba-Geigy Corporation | Synthetic polystyrene resin and its use in solid phase peptide synthesis |
US4939666A (en) | 1987-09-02 | 1990-07-03 | Genex Corporation | Incremental macromolecule construction methods |
US4935875A (en) | 1987-12-02 | 1990-06-19 | Data Chem, Inc. | Chemical analyzer |
US5147608A (en) | 1988-04-29 | 1992-09-15 | Millipore Corporation | Apparatus and process for performing repetitive chemical processing |
US5010175A (en) | 1988-05-02 | 1991-04-23 | The Regents Of The University Of California | General method for producing and selecting peptides with specific properties |
DE58906153D1 (de) | 1988-08-24 | 1993-12-16 | Siemens Ag | Verfahren zur chemischen Dekontamination der Oberfläche eines metallischen Bauteils einer Kernreaktoranlage. |
US5025388A (en) | 1988-08-26 | 1991-06-18 | Cramer Richard D Iii | Comparative molecular field analysis (CoMFA) |
US5265030A (en) | 1990-04-24 | 1993-11-23 | Scripps Clinic And Research Foundation | System and method for determining three-dimensional structures of proteins |
US5723289A (en) | 1990-06-11 | 1998-03-03 | Nexstar Pharmaceuticals, Inc. | Parallel selex |
IE66205B1 (en) | 1990-06-14 | 1995-12-13 | Paul A Bartlett | Polypeptide analogs |
US5650489A (en) | 1990-07-02 | 1997-07-22 | The Arizona Board Of Regents | Random bio-oligomer library, a method of synthesis thereof, and a method of use thereof |
US5167009A (en) | 1990-08-03 | 1992-11-24 | E. I. Du Pont De Nemours & Co. (Inc.) | On-line process control neural network using data pointers |
US5181259A (en) | 1990-09-25 | 1993-01-19 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | General method of pattern classification using the two domain theory |
US5155801A (en) | 1990-10-09 | 1992-10-13 | Hughes Aircraft Company | Clustered neural networks |
US5331573A (en) | 1990-12-14 | 1994-07-19 | Balaji Vitukudi N | Method of design of compounds that mimic conformational features of selected peptides |
US5260882A (en) | 1991-01-02 | 1993-11-09 | Rohm And Haas Company | Process for the estimation of physical and chemical properties of a proposed polymeric or copolymeric substance or material |
US5499193A (en) | 1991-04-17 | 1996-03-12 | Takeda Chemical Industries, Ltd. | Automated synthesis apparatus and method of controlling the apparatus |
WO1993001484A1 (en) | 1991-07-11 | 1993-01-21 | The Regents Of The University Of California | A method to identify protein sequences that fold into a known three-dimensional structure |
JPH07117950B2 (ja) | 1991-09-12 | 1995-12-18 | 株式会社エイ・ティ・アール視聴覚機構研究所 | パターン認識装置およびパターン学習装置 |
US5270170A (en) | 1991-10-16 | 1993-12-14 | Affymax Technologies N.V. | Peptide library and screening method |
US5240680A (en) | 1991-12-19 | 1993-08-31 | Chiron Corporation | Automated apparatus for use in peptide synthesis |
US6037135A (en) | 1992-08-07 | 2000-03-14 | Epimmune Inc. | Methods for making HLA binding peptides and their uses |
EP0555024B1 (en) | 1992-02-07 | 2000-05-17 | Canon Kabushiki Kaisha | Method and apparatus for pattern recognition |
US5573905A (en) | 1992-03-30 | 1996-11-12 | The Scripps Research Institute | Encoded combinatorial chemical libraries |
US5288514A (en) | 1992-09-14 | 1994-02-22 | The Regents Of The University Of California | Solid phase and combinatorial synthesis of benzodiazepine compounds on a solid support |
US5565325A (en) | 1992-10-30 | 1996-10-15 | Bristol-Myers Squibb Company | Iterative methods for screening peptide libraries |
JP2513395B2 (ja) | 1992-11-09 | 1996-07-03 | 株式会社島津製作所 | ペプチドアミド合成用リンカ― |
US5703792A (en) | 1993-05-21 | 1997-12-30 | Arris Pharmaceutical Corporation | Three dimensional measurement of molecular diversity |
WO1994028504A1 (en) | 1993-05-21 | 1994-12-08 | Arris Pharmaceutical | A machine-learning approach to modeling biological activity for molecular design and to modeling other characteristics |
US5544352A (en) | 1993-06-14 | 1996-08-06 | Libertech, Inc. | Method and apparatus for indexing, searching and displaying data |
US5679582A (en) | 1993-06-21 | 1997-10-21 | Scriptgen Pharmaceuticals, Inc. | Screening method for identifying ligands for target proteins |
ES2165880T3 (es) | 1993-06-21 | 2002-04-01 | Selectide Corp | Conectores segmentables selectivamente basados en enlaces ester de acido iminodiacetico. |
US5585277A (en) | 1993-06-21 | 1996-12-17 | Scriptgen Pharmaceuticals, Inc. | Screening method for identifying ligands for target proteins |
US5434796A (en) | 1993-06-30 | 1995-07-18 | Daylight Chemical Information Systems, Inc. | Method and apparatus for designing molecules with desired properties by evolving successive populations |
JP2948069B2 (ja) | 1993-09-20 | 1999-09-13 | 株式会社日立製作所 | 化学分析装置 |
EP0754238A4 (en) | 1994-04-05 | 1998-01-28 | Pharmagenics Inc | DETERMINATION AND IDENTIFICATION OF ACTIVE SUBSTANCES IN SUBSTANCE LIBRARIES |
US5602938A (en) | 1994-05-20 | 1997-02-11 | Nippon Telegraph And Telephone Corporation | Method of generating dictionary for pattern recognition and pattern recognition method using the same |
US5549974A (en) | 1994-06-23 | 1996-08-27 | Affymax Technologies Nv | Methods for the solid phase synthesis of thiazolidinones, metathiazanones, and derivatives thereof |
EP0694855B1 (en) | 1994-07-28 | 2002-05-02 | International Business Machines Corporation | Search/sort circuit for neural networks |
US5463564A (en) | 1994-09-16 | 1995-10-31 | 3-Dimensional Pharmaceuticals, Inc. | System and method of automatically generating chemical compounds with desired properties |
US5574844A (en) | 1994-09-22 | 1996-11-12 | International Business Machines Corporation | Computer system and method for processing atomic data to calculate and exhibit the properties and structure of matter |
US5553225A (en) | 1994-10-25 | 1996-09-03 | International Business Machines Corporation | Method and apparatus for combining a zoom function in scroll bar sliders |
US5712171A (en) | 1995-01-20 | 1998-01-27 | Arqule, Inc. | Method of generating a plurality of chemical compounds in a spatially arranged array |
US5807754A (en) | 1995-05-11 | 1998-09-15 | Arqule, Inc. | Combinatorial synthesis and high-throughput screening of a Rev-inhibiting arylidenediamide array |
US5602755A (en) | 1995-06-23 | 1997-02-11 | Exxon Research And Engineering Company | Method for predicting chemical or physical properties of complex mixtures |
EP0791008A4 (en) | 1995-09-08 | 2003-04-23 | Anadys Pharmaceuticals Inc | SCREENING METHOD FOR CONNECTIONS HAVING AN AFNESS TO RNS |
US5811241A (en) | 1995-09-13 | 1998-09-22 | Cortech, Inc. | Method for preparing and identifying N-substitued 1,4-piperazines and N-substituted 1,4-piperazinediones |
CA2184195C (en) | 1995-10-25 | 2002-04-16 | Andrew Pakula | Screening method for identifying ligands for target proteins |
EP0865502A4 (en) | 1995-12-07 | 2000-08-16 | Scriptgen Pharm Inc | FLUORESCENT-BASED DETECTION METHOD FOR LIGANDS |
US5712564A (en) | 1995-12-29 | 1998-01-27 | Unisys Corporation | Magnetic ink recorder calibration apparatus and method |
WO1997027559A1 (en) | 1996-01-26 | 1997-07-31 | Patterson David E | Method of creating and searching a molecular virtual library using validated molecular structure descriptors |
US6185506B1 (en) | 1996-01-26 | 2001-02-06 | Tripos, Inc. | Method for selecting an optimally diverse library of small molecules based on validated molecular structural descriptors |
US6014661A (en) | 1996-05-06 | 2000-01-11 | Ivee Development Ab | System and method for automatic analysis of data bases and for user-controlled dynamic querying |
EP0818744A3 (en) | 1996-07-08 | 1998-07-08 | Proteus Molecular Design Limited | Process for selecting candidate drug compounds |
WO1998020459A1 (en) | 1996-11-04 | 1998-05-14 | 3-Dimensional Pharmaceuticals, Inc. | System, method, and computer program product for the visualization and interactive processing and analysis of chemical data |
US5861532A (en) | 1997-03-04 | 1999-01-19 | Chiron Corporation | Solid-phase synthesis of N-alkyl amides |
US5908960A (en) | 1997-05-07 | 1999-06-01 | Smithkline Beecham Corporation | Compounds |
US5933819C1 (en) | 1997-05-23 | 2001-11-13 | Scripps Research Inst | Prediction of relative binding motifs of biologically active peptides and peptide mimetics |
US6049797A (en) | 1998-04-07 | 2000-04-11 | Lucent Technologies, Inc. | Method, apparatus and programmed medium for clustering databases with categorical attributes |
-
2001
- 2001-02-28 US US09/794,106 patent/US6671627B2/en not_active Expired - Lifetime
- 2001-02-28 AU AU2001241800A patent/AU2001241800A1/en not_active Abandoned
- 2001-02-28 WO PCT/US2001/006217 patent/WO2001065462A2/en active Application Filing
- 2001-03-01 TW TW090104949A patent/TW523699B/zh active
- 2001-03-01 AR ARP010100966A patent/AR027586A1/es unknown
Also Published As
Publication number | Publication date |
---|---|
WO2001065462A2 (en) | 2001-09-07 |
US20010029026A1 (en) | 2001-10-11 |
AU2001241800A1 (en) | 2001-09-12 |
AR027586A1 (es) | 2003-04-02 |
US6671627B2 (en) | 2003-12-30 |
WO2001065462A3 (en) | 2002-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Crampin et al. | Mathematical and computational techniques to deduce complex biochemical reaction mechanisms | |
Brown | Chemoinformatics—an introduction for computer scientists | |
Bunin et al. | Chemoinformatics theory | |
Georgiou | Supersaturated designs: A review of their construction and analysis | |
US6421612B1 (en) | System, method and computer program product for identifying chemical compounds having desired properties | |
EP1021780B1 (en) | System and method for structure-based drug design that includes accurate prediction of binding free energy | |
US8374828B1 (en) | Computer implemented system for protein and drug target design utilizing quantified stability and flexibility relationships to control function | |
US20050177280A1 (en) | Methods and systems for discovery of chemical compounds and their syntheses | |
JP2003529843A (ja) | 化学資源データベース | |
Oprea et al. | Chemical information management in drug discovery: optimizing the computational and combinatorial chemistry interfaces | |
US20040083060A1 (en) | Method of operating a computer system to perform a discrete substructural analysis | |
US20240029834A1 (en) | Drug Optimization by Active Learning | |
Zhou et al. | Allosteric mechanism of the circadian protein Vivid resolved through Markov state model and machine learning analysis | |
Wang et al. | Pmptce-hnea: Predicting metabolic pathway types of chemicals and enzymes with a heterogeneous network embedding algorithm | |
TW523699B (en) | Method and computer program product for designing combinatorial arrays | |
Pittman et al. | Bayesian analysis of binary prediction tree models for retrospectively sampled outcomes | |
Winkler et al. | Application of neural networks to large dataset QSAR, virtual screening, and library design | |
US20230335228A1 (en) | Active Learning Using Coverage Score | |
Smalter et al. | Gpm: A graph pattern matching kernel with diffusion for chemical compound classification | |
Carlson et al. | BEAM: a beam search algorithm for the identification of cis-regulatory elements in groups of genes | |
Andersson et al. | Design of small libraries for lead exploration | |
US20220406404A1 (en) | Adversarial framework for molecular conformation space modeling in internal coordinates | |
Schüller et al. | Identification of hits and lead structure candidates with limited resources by adaptive optimization | |
James | Cheminformatics in the service of GPCR drug discovery | |
Root et al. | Global analysis of large-scale chemical and biological experiments |