TW523699B - Method and computer program product for designing combinatorial arrays - Google Patents

Method and computer program product for designing combinatorial arrays Download PDF

Info

Publication number
TW523699B
TW523699B TW090104949A TW90104949A TW523699B TW 523699 B TW523699 B TW 523699B TW 090104949 A TW090104949 A TW 090104949A TW 90104949 A TW90104949 A TW 90104949A TW 523699 B TW523699 B TW 523699B
Authority
TW
Taiwan
Prior art keywords
reagents
array
combination
database
candidate
Prior art date
Application number
TW090104949A
Other languages
English (en)
Inventor
Dimitris K Agrafiotis
Victor S Lobanov
Francis R Salemme
Original Assignee
Dimensional Pharm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dimensional Pharm Inc filed Critical Dimensional Pharm Inc
Application granted granted Critical
Publication of TW523699B publication Critical patent/TW523699B/zh

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry
    • G16C20/62Design of libraries

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Computing Systems (AREA)
  • Medicinal Chemistry (AREA)
  • Library & Information Science (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

523699 A7 B7 五、發明説明〇 ) 發明背景 1. 發明領域 (請先閲讀背面之注意事項再填寫本頁) 本發明,一般而言,係相關於組合化學的領域,尤其 .是相關於一種用於設計組合陣列之方法及電腦程式產品。 2. 相關技術 經濟部智慧財產局員工消費合作社印製 從歷史觀點來看,藥品的發現是基於一連串且有系統 的化學結構修正,此修正是遵行「相似性質原理」,亦即 ,假設結構上相似的化合物易於表現出相似的物理化學及 生物性質。新的治療劑通常是經由確認一種先導化合物, 再以有系統且直接的方式創造該化合物的變體而產生。第 一階段的過程,即所謂的先導生代,是由在大量的化合物 中隨機篩選而完成。這樣的化合物挑選可包含天然物種、 人工物種,等等。第二階段的過程,即所謂的先導最佳化 ,代表藥品發現上的限速步驟。此步驟包含環繞先導化合 物之充分的結構活性關係(SAR )的細節及其藥理槪要的 精確性。在組合化學還未被使用之前,此過程指一簡單的 合成目標之優先化,其以早已存在之結構活性資料、合成 可行性、經驗與直覺爲基礎。 近來在合成及篩選技術上的改進已使得同步合成及包 含數百至數萬個化合物之化學資料庫中的生物評估成爲可 能。隨著固相與液相化學知識的擴展,以及基礎自動硬體 的不斷改進,組合化學已經走出了它在傳統上用於大量篩 選時當做一個化合物資源的角色,而今它慣常被應用在先 導最佳化及SAR的精確性上。此導致對組合資料庫的槪念 -4- 本紙張尺度適用中國國家標準(CNS ) Α4規格(210X297公釐) 523699 Α7 Β7 五、發明説明(2 ) 一分爲二:(1 )具有與目標無關且被設計以測量各種類別 之物理化學及結構特性的探索性或綜合性資料庫,以及(2 )偏向某一特定目標、結構類別、或已知之藥效基團的專 一性或應用性資料庫。 有兩種因用來設計組合實驗而聞名的方法。第一種叫 做「單一法」或「稀疏陣列法」,其意指某些生成物的一 個子集合’這些生成物也許代表或也許不代表一組特定試 劑之所有可能的組合。第二種叫做「全陣列法」或簡稱「 陣列法」’其代表在反應圖示指定之所有可能的組合中結 合一特定試劑子集合而衍生的所有生成物。這兩種問題的 組合本質有極大的不同。就單一法來說,我們必須考慮的 可能數量(一個η集合中之各種k子集合的數量)是由下列 二項式來表示 (請先閱讀背面之注意事項再填寫本頁) η! ⑴ 反之,從一個
導出的各種k! X (n-k)lkl X n2 X…nR之R-成份組合資料庫中所 …kR陣列的數量是由下列式子來表示 (2) 經濟部智慧財產局員工消費合作社印製 對一個10x10之雙成份組合資料庫而言,共有1〇25個包 含25個化合物之不同的子集合(單一法),而且只有63,5〇ζ 個不同的5x5陣列。對一個ιοοχίοο的資料庫及一個 1 00/1 Οχ 1 0的挑選方式而言,那些數字對單一法和陣列法分 別增加至1〇241及1 0 2 6。請注意在本文中,「陣列」基本上相 等於以生成物的特性爲基礎而做的試劑挑選,而且未必指 的是實際的實驗安排及執行。大體上,雖然就達成設計目 本紙張尺度適用中國國家標準(CNS ) Α4規格(2丨0X 297公釐) _ 5 _ 523699 A7 B7 五、發明説明(3 ) 標來說陣列法較差,但其需要的試劑較少且實際上也較容 易合成。 (請先閲讀背面之注意事項再填寫本頁) 產生組合陣列之常見的方法包含試劑運用法及以隨機 抽樣爲基礎的生成物運用法。試劑運用法檢驗每個變異點 且不受組合資料庫中其他變異點的影響。變異點是指允許 在組合結構中建多區塊之組合核心上的一個點。例如, 在一個雙成份組合資料庫中,此設計是經由分別在R丨與R2 中各挑選出一串具有指定特性的試劑而完成,然後,將從 R 1中挑選出的試劑與從R2中挑選出的試劑化合以產生—串 生成物,構成組合陣列。雖然這種方法藉由檢驗各個試劑 池而簡化了挑選過程且不受其他試劑池的影響,但最重要 的生成物特性卻從未被明確地考量。這種方法反而是以希 望選定之試劑能產生具有指定特性的一串生成物·爲出發點 0 經濟部智慧財產局員工消費合作社印製 以生成物特性爲基準的試劑挑選方式在傳統上藉由具 有推測本質的演算法來達成。例如,在一個雙成份組合資 料庫中,從R 1及R2中隨機地挑選出一些試劑。將從R 1中挑 選出的試劑與從R2中挑選出的試劑化合,進而對照某設計 目標以評估所產生的生成物。例如,倘若設計目標是要獲 得本質上與某已知之藥物分子相似的生成物,該生成物則 會以其與該已知之藥物分子的相似度爲基準而被評估,從 而產生某個數値。接著,在一變異點上隨機地挑選出其中 一個選定試劑,再用另一個從該變異點上之候選試劑中隨 機挑選出的試劑來取代之。較好或較差的情況都可能會發 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) -6 - 523699 A7 一 B7 五、發明説明(4 ) (請先閱讀背面之注意事項再填寫本頁) f °重複進行此過程直到達到某收斂性判定標準或期限爲 止’譬如說,直到相對於該已知藥物分子而產生之相似度 數値無法再提升爲止。因此,隨機抽樣的方法需要有一定 數量的試驗,直到獲得一個滿意的結果爲止。 我們所需要的是一個用於設計組合陣列的演算法,此 胃算法利用目標函數可分解或近乎可分解成個別的分子貢 獻時的最佳結構並允許用一種有利的方式挑選出最佳或將 近最佳的陣列。我們近一步所需要的是一種用於設計組合 陣列的方法,此方法以與一或多個參考化合物之相似度, 抑或’依據一或多個QSAR、藥效基團或感應器結合模型對 於一或多個生物目標之預測的活性及/或選擇性、對一或多 個疑問或探索之一致程度、在某些性質界限內之包含性, 寺寺爲基礎 ° 發明之槪述 經濟部智慧財產局員工消費合作社印製 本發明藉由提供一種用於設計組合陣列之貪心法及電 腦程式產品以解決上述問題。此貪心法特別適用於當目標 函數可分解或近乎可分解成個別的分子貢獻時之情況。本 發明利用一種啓發式的方法,使能獨立評估組合資料庫中 每個變異點上的候選試劑並對其做等級的排列。此貪心法 被執行時是收歛的且以一種有利的方式產生組合陣列。由 貪心法所產生的組合陣列解是比得上且常常優於那些由本 質上更爲複雜且更需要密集計算之隨機抽樣技術所導出的 解。可修正成此方法之設計目標的典型範例包含與一或多 個參考化合物之相似度、依據一或多個結構活性或感應器 ^紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐)~7^ 523699 A7 B7_____ 五、發明説明(5 ) (請先閱讀背面之注意事項再填寫本頁) 結合模型之預測的活性及/或選擇性、對一或多個疑問或探 索之一致程度、在某些分子性質界限內之包含性,以及其 他種種。 根據本發明之貪心法,最初隨機地或以某種其他技術 從一組合資料庫中挑選出一系列的試劑並評估其適合度( 亦即,其滿足設計目標的程度)。藉由一嚴格交替順序來 處理組合資料庫中每個變異點上的試劑列表,反覆地進行 使此最初的挑選結果更精確。在每一步驟中,由檢測中之 變異點上的各候選試劑與資料庫中剩餘之變異點上的選定 試劑結合所產生的每個次陣列會被評估且其適合度會被記 錄下來。對該變異點而言,產生最佳(最適合)次陣列的 候選試劑會被挑選出來,而下一個變異點則以相似的方式 處理。當所得之組合陣列的適合度無法再提高時,此過程 便會終止。此過程可能會重複進行好幾次,每次都從一個 不同的起始陣列開始。在觀念上,此過程適用於當適合度 函數可分解或近乎可分解成個別的分子貢獻時之情況。 經濟部智慧財產局員工消費合作社印製 關於本發明進一步的特色與優點’以及本發明之結構 及各實施例的操作,將在以下與附件圖式有關的內文中詳 加敘述。在圖式中,像參考號碼是用來指出相同的及/或功 能上相似的元素。再者,在參考號碼最左邊的數字是用來 指出第一次提及相關元素時的圖式。 圖示簡要說明 於此倂入並成爲本說明書之一部分的附件圖式,以圖 例加上描述來說明本發明,進一步爲本發明之原理提供解 本纸張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) _ 8 - 523699 Α7 Β7 五、發明説明(6 ) 釋並使熟習相關技術者能善加利用本發明。 圖1 A爲一圖表,說明以單一法(稀疏陣列法)格式從 一假定的雙成分組合資料庫中挑選出化合物。 圖1 B爲一圖表,說明以陣列法(全陣列法)格式從一 假定的雙成分組合資料庫中挑選出化合物。 圖2A及2B爲一用於產生組合陣列之方法的流程圖。 圖2C-2H爲簡化範例,用來說明反覆地以貪心法從一 10x10組合資料庫中挑選出一 3x2陣列。 圖3爲一圖表,說明還原胺化資料庫之合成順序。 圖4爲一圖表,說明用於製作二胺資料庫之合成順序。 圖5爲一圖表,說明用於從還原胺化資料庫中挑選相似 度的一參照結構。 圖6爲一長條圖,說明根據與一參照結構之最大相似度 ’從一還原胺化資料庫中挑選出1 00個化合物之相似度比數 的平均値及標準差。 圖7A爲一圖表,說明根據與一參照結構之最大相似度 ,從一還原胺化資料庫中挑選出一 10x10陣列之化合物的分 佈情況。 圖7 B爲一圖表,說明根據與一參照結構之最大相似度 ,從一還原胺化資料庫中挑選出1 00個稀疏陣列之化合物的 分佈情況。 圖8爲一圖表,說明根據與一參照結構之最大相似度’ 從一還原胺化資料庫中挑選出構成一 1 Οχ 10最佳化陣列之月安 試劑及醛試劑。 本紙張尺度適用中國國家標準(CNS ) A4規格(210X 297公釐) —ς> - (請先閱讀背面之注意事項再填寫本頁) .裝· 訂 經濟部智慧財產局員工消費合作社印製 523699 A7 _ B7 _______ 五、發明説明(7 ) (請先閲讀背面之注意事項再填寫本頁) 圖9爲一圖表,顯示以模擬退火法及本發明之貪心法, 從一還原胺化資料庫中挑選出1 00個不同的隨機先導物之最 佳1 Ox 1 0陣列的相似度比數之比較情形。 圖1 0爲一圖表,說明用於從一還原胺化資料庫中做相 似性應用之多目標挑選的一參照結構。 圖1 1 A爲一圖表,說明根據與一參照結構之最大相似度 ,從一還原胺化資料庫中挑選出一1 Ox 1 0陣列的化合物之差 異空間的分佈情況。 圖1 1 B爲一圖表,說明根據與一參照結構之最大相似度 ,從一還原胺化資料庫中挑選出一 10x10陣列的化合物之分 子量對計算出之log P的分佈情況。 圖12爲一圖表,說明根據與一參照結構之最大相似度 ,從一還原胺化資料庫中挑選出構成一 1 Ox 1 0陣列之試劑。 圖13A爲一圖表1 300,說明根據一參照結構及方程式( 9 )(列於後文),從一還原胺化資料庫中挑選出一 1 〇x 1 0 陣列的化合物之差異空間的分佈情況。 經濟部智慧財產局員工消費合作社印製 圖1 3B爲一圖表,說明根據一參照結構及方程式(9 ) (列於後文),從一還原胺化資料庫中挑選出一 10x10陣列 的化合物之分子量與計算出之log P的分佈情況。 圖14爲一圖表,說明根據一參照結構1 000及方程式(9 )(列於後文),從一還原胺化資料庫中挑選出構成一 10x10陣列之試劑。 圖15爲一長條圖,說明根據與一最佳化收集超過100次 的隨機挑選結構(5x5x5陣列,125個稀疏陣列)之最大相 $紙張尺度適用中國國家標準( CNS ) A4規格(210X 297公釐) 7]〇1 523699 A7 B7 五、發明説明(8 ) 似度,從一個二胺資料庫中挑選丨2 5個化合物之相似度比數 的平均値及標準差。 (請先閱讀背面之注意事項再填寫本頁) 圖16爲一圖表1 600,說明根據與1〇〇個隨機先導物之最 大相似度,以模擬退火法及本發明之貪心法,從一個二胺 資料庫中挑選出最佳5x5x5陣列的相似度比數之比較情形。 圖1 7爲一長條圖,說明以本發明之貪心法分別從還原 胺化資料庫及二胺資料庫中挑選出1〇〇、400、1 600、6400及 2 5 6 0 0個化合物時所需之c p u時間。 圖1 8爲一電腦系統之範例實作。 涉及如全面地指出對應元素之參考特性的圖式時,本 發明之特色、目標及優點會從下文中所提出之詳細的敘述 中變得更加明顯。在圖式中,像參考號碼通常是用來指出 相同的、功能上相似的及/或結構上相似的元素。’對應的參 考號碼之最左邊的數字指出某元素第一次出現時的圖式。 主要元件對照 1 方格網 5 第二網點 2 列 6 方格 3 行 7 黑色的方格 4 第一網點 8 黑色的方格 較佳實施例之詳細描述 經濟部智慧財產局員工消費合作社印製 雖然在此描述之本發明與用以說明特殊用途之實施例 有關,但應瞭解本發明並非局限於這些實施例。獲取本處 所提供的教學之熟習此項技術者會認可額.外的修正、應用 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -1 1 - r523699 Α7 Β7 五、發明説明(9 ) ’以及本發明之範圍內和附加領域中的實施例,這些都將 使本發明表現出重要的實用性。 1.槪要 本發明是一種用於設計組合陣列之方法及電腦程式產 品,尤其,本發明是以一種能滿足一或多個設計目標至某 特定程度的方式,從一組合資料庫之一或多個變異點上的 試劑中挑選出一組試劑子集合的一種方法及電腦程式產品 。當目標函數(亦即,測量一組特別挑選出之化合物能滿 足設計目標之程度的函數)可分解或近乎可分解成個別的 分子貢獻時,可應用本發明之方法。本發明利用一種啓發 式的方法’使能獨立評估組合資料庫中每個變異點上的候 選試劑並對其做等級的排列。此方法相當快速且收斂。由 採用本發明之方法所產生的組合陣列解是比得上且常常優 於那些由上述之本質上更複雜且更需要密集計算之隨機抽 樣技術所導出的解。可修正成但非局限於此方法之設計目 標的範例包含與一或多個參考化合物之相似度、依據一或 多個結構活性或感應器結合模型之預測的活性及/或選擇性 、對一或多個疑問或探索之一致程度、在某些分子性質界 限內之包含性,以及其他種種。 用於設計組合實驗的兩個知名的方法爲「單一法」( •亦指「稀疏陣列法」)及「全陣列法」(或簡稱「陣列法 」)。單一法意指某些生成物的一個子集合,這些生成物 也許代表或也許不代表一組特定試劑之所有可能的組合。 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) , -Ί X - (請先閲讀背面之注意事項再填寫本頁) >裝· ,· 經濟部智慧財產局員工消費合作社印製 523699 Α7 Β7 五、發明説明(10 ) 全陣列法代表在反應圖示指定之所有可能的組合中結合一 特定試劑子集合而衍生的所有生成物。 (請先閲讀背面之注意事項再填寫本頁) 圖1A爲一圖表,說明以單一法格式從一假定的雙成分 組合資料庫中挑選出化合物。一方格網1 〇2代表一虛擬資料 庫。對物理合成及/或試驗而言’虛擬資料庫的主要功能在 於能挑選較小的次資料庫。方格網1 〇2由9個列10 4與17個行 106組成。雖然一 9x1 7大小的方格網被用於圖1 A,但這僅做 爲示範之用。熟習此技術者會瞭解虛擬資料庫在本發明的 範圍之內可大可小。每個行1 〇 6代表第一網點10 8上的一個 不同的試劑R1,譬如說,每個試劑R1代表一個不同的乙醛 。每個列1 04是第二網點110上的一個不同的試劑R2,譬如 說,每個試劑R2代表一個不同的胺。方格網102的每個方格 11 2代表一個不同的生成物,例如,由一特定的胺R2與一特 定的乙醛R1化合所產生的生成物。 經濟部智慧財產局員工消費合作社印製 在此範例中,9個化合物透過單一法的使用被挑選出來 且以黑色的方格114來表示。該單一法挑選化合物橫跨9列8 行,因此,被選定之化合物使用9個不同的乙醛與8個不同 的胺。利甩單一法來設計組合實驗不但需要考慮很多可能 ,也需要使用很多試劑。不管是由人工或機器來執行合成 ’以單一法格式來合成化合物通常是費力且耗時的。雖然 這方法最可能符合我們的設計目標,但幾乎總會導致極其 、昂貴且難以執行的實驗。 因此,爲了控制成本並簡化合成,即使陣列法就達成 主要設計目標來說一般較差,但通常仍以陣列法格式來合 本紙張尺度適用中國國家標準(CNS ) M規格(21〇χ 297公釐) ~ ' -- 523699 Α7 Β7 五、發明説明(Μ ) (請先閲讀背面之注意事項再填寫本頁) 成組合資料庫。圖1 Β爲一圖表,說明以陣列法格式從—假 定的雙成分組合資料庫中挑選出化合物。9個化合物透過陣 列法的使用被挑選出來且以黑色的方格11 6來表示。胃@歹υ 法挑選化合物橫跨3列3行。與用於設計組合實驗的單—法 相反之陣列法只運用3個不同的乙醛與3個不同的胺,因而 導致所需使用的試劑較少。不管是由人工或機器來執行合 成,以陣列法格式來合成化合物通常是較容易實行的。本 發明之方法被用於從組合資料庫之所有可能的陣列中挑選 能滿足一組設計目標至某特定程度之一陣列。 2. 設計目標 經濟部智慧財產局員工消費合作社印製 爲示範之用,必須考慮三種設計目標或挑選標準,亦 即(1 )與一特定先導物或一組特定先導物之最大相似度( 相似度)(2 )與一組指定的特性限制之最大適合度(限制 )(3 )對一特定生物目標之的最大活性及/或選擇性(活 性/選擇性)。雖然只敘述三種設計目標,但本發明並非局 限於此三種設計目標,也可使用其他可分解或近乎可分解 成個別的分子貢獻之設計目標。在一實施例中,可單獨使 用每一個設計目標及/或結合另一個設計目標來使用。 3. 相似度 一組特定的化合物C與一組先導物之相似度被定義爲 一化合物至其最近之先導物的平均距離: 本紙張尺度適用中國國家標準(CNS ) Α4規格(210X297公釐) 523699 經濟部智慧財產局員工消費合作社印製 A7 _B7 __ 五、發明説明(12 )S(C) =适如〜) ⑶ 其中,N爲C的基數,L爲先導物的數量且du爲某分子描 述符空間中第1個化合物與第j個先導物之間的距離。較高 的相似度比數指出距離先導物更遠且與其較不相似的大量 化合物。因此,把S縮減至最小限度即可得到專一性資料 庫。倘若先導物的數量龐大,方程式(3 )中最內部的迴圈 可藉由 D.K. Agrafiotis et al·,39 J· Chem. Inf. Computer SC1.,5 1 -8 ( 1 999)中所描述的k-d樹狀演算法來計算,此處所 表示之該演算法乃出自於對該文的全面性參考。 4.限制 此設r目標測量指定範圍內之一組特定化合物之特性 的適合度,被定義爲: />(〇 =去 2 S maxU;•娜 _ %% 巧酿,〇) ⑷ N i j v.:“ rr . 其中,XU爲第i個化合物之第j個特性,而x/in及x/aX爲分 別受限於第J個特性的最小値及最大値。此函數値隨著越來 越多的化合物落於欲得特性的範圍之外而增加。因此,把P 縮減至最小限度即可得到受限性資料庫。在一採用多種特 性的實施例中,我們必須將特性標準化或將其加權以做出 、有意義的比較。在一欲得特性必須達到一特定目標値(亦 即,就一退化範圍而言)的實施例中,方程式(4 )可被改 寫成: 本紙張尺度適用中.國國家標準(CNS ) A4規格(210X297公釐) (請先閱讀背面之注意事項再填寫本頁) 一裝- 訂 f -15- 523699 A7 B7 五、發明説明(13 ) p(c)=士 ΣΣ—(w) (5) » j (請先閱讀背面之注意事項再填寫本頁) 其中,χ/表示第」個特性的目標値。 5.活性/選擇性 資料庫設計中的一共通目標在於產生化合物之陣列, 此陣列依據某定量的結構活性或感應器結合模型對一預先 定義的目標而言被預測具有最大活性。當個別化合物之預 測活性總計如下時,此目標藉由表現一組特定的化合物C 之預測活性來完成: 2“c)=告(6) i 其中,ai是‘ C中第i個化合物之預測活性的某個基準。一相 似的函數可用來測量對一組生物目標之選擇性: 2:(C) = 士Σ(〜Ux(〜)) (7) 經濟部智慧財產局員工消費合作社印製 其中,au是對第j個目標之第i個化合物的預測活性,而k 是分子被挑選時應該對應的目標。當化合物變得更具活性/ 選擇性時,QA/QS之値增大。因此,將其標準分別增加至最 大限度即可得到活性/選擇性資料庫。 • 6.多目標設計 在一實施例中,個別的設計目標,例如但不限於之前 所描述的設計目標,可以相互結合以產生滿足多種設計目 本纸張尺度適用中國國家標準(CNS ) A4規格(210X297公着7 -16- 523699 A7 B7 經濟部智慧財產局員工消費合作社印製 五、發明説明(14 ) 標之陣列,此導致一多目標適合度函數,其被定義爲: F(C) = f(Fl(C\F2(C)^) (8) 其中,F(C)是整體效率測量,而Fi(C)爲與C集合有關的個 別標準。在最後的挑選中,此函數的正確形式及與個別設 計目標有關的係數決定了每個設計目標的影響度。 7 .本發明之貪食法 如前所述,本發明最適用於目標函數被描述成個別分 子的貢獻之情況。本發明允許以一種有利的方式挑選最佳 的或近乎最佳的陣列。本發明利用下列之最佳化啓發法。 使目標函數達到最大値的I試劑,在被給予一含有C個成 份的組合資'料庫、一 i 6 [ 1,C]的點及一特別選出的心試 劑(其中j zz 1,2,.··,i-1,i+1,·.·,C)之後,藉由建構並評估Ri 中之單一試劑與中所有選定之試劑組合而產生之所有可 能的次陣列,並且從中挑選具有最佳適合度(亦即,其滿 足設計目標的程度)的次陣列,此Ri試劑便得以被確定。 此過程始於一隨機選取之陣列,然後按先後次序對每一變 異點做最佳化直到不可能再有進一步的改進爲止。 例如,考慮從一 10x10x10組合資料庫中挑選出一 5x5x5 陣列的情形。此過程始於從每一變異點隨機選出5個試劑並 •評估產生之陣列的適合度。藉由一嚴格交替順序來處理每 一個試劑列表,反覆地進行使此最初的挑選結果更精確。 首先,將Ri中的各試劑與R2及R3中的選定試劑結合以建構 本紙張尺冬適用中國國家標準(CNS ) A4規格(210X29?公釐) -17- (請先閱讀背面之注意事項再填寫本頁) 【裝 、訂 f 523699 A7 ________B7 _ 五、發明説明(15 ) (請先閲讀背面之注意事項再填寫本頁) 10個1x5x5的次陣列。針對設計目標來評估所得之化合或生 成物以決疋其適合度。R i中的各試劑依次被評估,而得分 最高的5個試劑從L中被挑選出來。接著,對R2重複進行此 過程。R2中的各試劑被用來與1^及R3中的選定試劑結合以 建構一 5x1x5的次陣列,而對該變異點而言,產生最佳適合 度的5個R2試劑被挑選出來。然後,以相似的方式來處理r3 ,如此便完成了一個精確化的週期。一旦所有的試劑列表 都被處理過了,從各變異點所選定的試劑將被組合,而產 生出之全陣列的適合度會受到評估並與前一個週期最後所 選出的適合度做比較。假如適合度有改進,則精確化過程 將由L開始重複進行;若無改進,則此過程停止進行。 圖2 A與2 B爲一用於產生組合陣列之方法的流程圖。組 合資料庫中‘替代點的數量以C來表示。試劑的總數量及所 需之陣列在第i點的大小則分別以Ni及Ki來表示。 由圖2A開始,此過程始於步驟202,再直接進入步驟 204 ° 經濟部智慧財產局員工消費合作社印製 在步驟204中,試劑列表被起始爲{Ru =: j; j = l,2,...,Ni; i = 1,2,·.·,C}。試劑列表的數量等於組合資料庫中替代點 的數量C。本過程進入步驟206。 在步驟206中,各Ri試劑列表中的試劑順序是隨機排列 的。 在步驟208中,評估並記錄所產生之陣列的適合度。接 著,本過程進入步驟210。 在步驟2 1 0中,藉由一嚴格交替順序來處理每一個試劑 -18- ^紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐了 523699 A7 B7 五、發明説明(16 ) 列表的反覆過程由此開始。 (請先閱讀背面之注意事項再填寫本頁) 在步驟2 1 2中,從步驟2 1 0已確定的試劑列表中處理每 一試劑之內部反覆迴圈由此開始。 在步驟214中,將從步驟210已確定的試劑列表中在步 驟2 12已確定之試劑與其他變異點中所選定之試劑組合,產 生次陣列並評估其適合度。接著,本過程返回進入步驟2 1 2 以評估步驟2 1 0所確定之試劑列表中的下一個試劑,已確定 之試劑列表中的各試劑在步驟214中依次被評估。當已確定 之試劑列表中的所有試劑都被評估過後,則本過程進入圖 2B的步驟216。 經濟部智慧財產局員工消費合作社印製 在步驟216中,選出具有最佳適合度的試劑。此步驟要 求將步驟210已確定之試劑列表中的試劑以適合度由大至小 的順序重新排列,具有最佳適合度的試劑將被排在試劑列 表中的第一位。然後,本過程返回進入圖2A的步驟2 10以重 新開始下一個試劑列表的反覆過程。每個試劑列表都會重 複進行步驟2 1 2-2 1 6。當所有試劑列表都被處理過後,便完 成了 一個精確化的週期。一個精確化的週期一旦完成,本 過程便進入步驟218。 在步驟218中,組合從各變異點所選定的試劑並評估產 生之全陣列的適合度。本過程繼而進入決定步驟220。 在決定步驟220中,將產生之全陣列的適合度與前一個 •週期最後所選出的適合度做比較。假如產生之全陣列的適 合度大於前一個週期最後所選出的適合度,則適合度有改 進。本適合度將被步驟221中的下一個精確化的週期認定爲 -19· 本紙張尺度適用中國國家標準(CNS ) A4規格(21〇Χ:297公釐) 523699 經濟部智慧財產局員工消費合作社邱製 A7 ___ B7 ___-五、發明説明(17 ) 前一次的適合度。接著,本過程返回進入圖2A的步驟210以 執行另一個精確化的週期。 返回至圖2B的決定步驟220,假如產生之全陣列的適合 度小於或等於前一個週期最後所選出的適合度,則適合度 沒有改進,而本過程進入步驟222。 在步驟222中,產生之組合陣列被視爲輸出結果,而本 過程結束。 爲了將計算量減到最少.,貪心法的一個實施例預先爲 整個資料庫中的每個化合物計算出其對目標函數的個別貢 獻並將之儲存在工作陣列中。此步驟只需執行一次且其級 數爲〇(N)。在最佳化期間,僅加入預先計算出之組成該陣 列的分子之個別貢獻即可對任何一特定陣列或次陣列的適 合度做評估4。貪心法偶爾會陷入只獲得局部最小値的情況 ,爲此,本過程可由一不同的亂數種子(亦即,不同的、 隨機選取的起始陣列)開始重複進行幾次,而具有最佳適 合度的陣列則被挑選出來。在另一種修正較少的實施例中 ,此貪心法可被用來從一個特定之虛擬資料庫的大陣列中 挑選出較小的次陣列。又另一種實施例中,構成最後陣列 的一或多個試劑可能會被預先選出,在此情況下,此貪心 演算法會嘗試去塡滿組合陣列,亦即,指出哪些試劑需要 被加入預先選出的試劑中以產生一最佳的或近乎最佳的陣 -歹[]0 圖2C-2H爲簡化範例,用來說明反覆地以貪心法從一 10x10組合資料庫中挑選出一 3x3陣列。 本紙張尺冬適用中.國國家標準(CNS ) A4規格(210X297公釐) -20- (请先閱讀背面之注意事項再填寫本頁) •装· 訂 523699 A7 __ B7 ___ 五、發明説明(18 ) 圖2C顯示R 1與R2試劑列表中的起始等級排列。 (請先閲讀背面之注意事項再填寫本頁) 圖2D顯示試劑於隨機排列之後在R1與R2試劑列表中的 排列順序。此陣列被測出之適合度的數値爲6。 圖2E顯示試劑在R2的前3個試劑與R1的各試劑組合後 於R 1與R2試劑列表中的排列順序、爲適合度而估算出的組 合,以及重新排序之後在R1中的試劑。 圖2F顯示試劑在R1的前3個試劑與R2的各試劑組合後 於R 1與R2試劑列表中的排列順序、爲適合度而估算出的組 合,以及重新排序之後在R2中的試劑,如此便完成了一個 精確化的週期。產生之3x3陣列被測出的適合度爲8,因爲8 比6大,故此過程必須重複進行,而新的前一次之適合度則 被設爲8。 圖2G顯示試劑在R2的前3個試劑與R1的各試劑組合後 於R 1與R2試劑列表中的排列順序、爲適合度而估算出的組 合,以及重新排序之後在R1中的試劑。 經濟部智慧財產局員工消費合作社印製 圖2H顯示試劑在R1的前3個試劑與R2的各試劑組合後 於R 1與R2試劑列表中的排列順序、爲適合度而估算出的組 合,以及重新排序之後在R2中的試劑,如此便完成了一個 精確化的週期。產生之全陣列被測出的適合度爲8,因爲新 的適合度數値8並未大於前一次的適合度數値8,故產生之 全陣列爲一輸出結果且本過程結束。 *« 8.用以提供組合陣列之貪心法的應用 爲了測試此貪心法的效率,一模擬退火法被用來做比 本紙張尺度適用中國國家標準(CNS) A4規格(210X297公釐) -21 - 523699 A7 _ _ B7 五、發明説明(19 ) (請先閲讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 較。此模擬退火法在設計組合資料庫時被判定爲非常有效 率的方法,其包含二個主要部分:一搜尋引擎及一目標函 數。此搜尋引擎從一虛擬集合(亦被稱爲一狀態)中產生 一含有k個化合物的列表,接著用一目標函數來評估這些 化合物以產生其品質或適合度的一個估計數値。此目標函 數針對實驗之設計目標做編碼,例如化合物的本質差異或 其與一組預先定義之先導物的相似度。此適合度之數値會 被回傳至搜尋引擎,搜尋引擎再以一種控制方式修正其狀 態並產生一新的化合物列表。接著,再以上述方式針對設 計目標標準依次對這些化合物做評估。這個過程會被重複 進行直到不可能再改進,或者,直到已達某些預定的收斂 標準或時間限制爲止。在手邊的例子中,此挑選歷經30個 溫度週期後完成,每一週期使用1000次抽樣步驟、一高斯 冷卻進度表,以及梅卓布理斯驗收標準(P = e _AE/KptT ), 這些都是熟習相關技術者所熟知的。對陣列挑選而言,一 個步驟即代表組合陣列中單一試劑的取代。在模擬期間內 不斷地更新轉換能的平均値並持續調整Kb的數値,因此玻 耳茲曼的^常數」Kb是以一種適應性的方式被調整,致使 在最後溫度時之平均上升轉換的驗收機率爲0.001。在D.K. Agrafiotis, J. Chem. Inf. Computer Sci., 576-90, 84 1 -5 1 ( 1997)中,可找到此演算法的細節,此處所表示之該演算法 •乃出自於對該文的全面性參考。 9.資料集 本纸張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -22- 523699 A7 B7 五、發明説明(20 ) (請先閲讀背面之注意事項再填寫本頁) 有兩個資料集被用來測試本發明的效用。第一個資料 集是一個以還原胺化反應爲基礎的雙成分組合資料庫,圖3 說明還原胺化資料庫之一合成順序300。藉由將主要或次要 胺的溶液加入至1,2 -二氯乙烷/二甲基甲醯胺內之等莫耳比 的乙醛來執行該反應。於反應玻璃瓶中加入1 0 %的醋酸 /DMF 內之 Sodium tracetoxyborohydride ( 2 當量)。在 2 5 °C 的狀態下攪拌該反應混合物12個小時,繼而密集地加入甲 醇,產生高純度之生成物。 經濟部智慧財產局員工消費合作社印製 從可用的化學路徑中隨機選取一組300胺類與300醛類 ,該可用的化學路徑是由加州San Leandro的MDL Information Systems, Inc·來銷售,而這些利用 DirectedDiversity®工具箱之資料庫列舉類別的胺類與醛類 被用來產生一含有90,000個生成物的虛擬資料庫。 DirectedDiversity® 工具箱由 3-Dimensional Pharmaceuticals, Inc.,Exton,PA (1994-2000)取得版權,此處所述乃出自於對 該資料的全面性參考。這些列舉類別將以SDF或SMILES格 式供應的試劑列表與以SMARTS及擴大至直述語言Tel爲基 礎之某專屬語言寫成的一反應圖示視爲輸出結果。 在這個含有90,000個生成物的虛擬資料庫中,每個化合 物具有用〇^〇^(10“^5^©工具箱計算出之一組標準的117 個位相描述符的特徵。這些描述符包含一組已確立的位相 •指數,其在結構活性的交互作用上,例如分子連接法指數 、K型指數、子圖總計、資訊理論指數、Bonchev-Trinajstis指數與位相態指數,具有悠久、成功的歷史。請 -23- 本紙張尺冬適用中國國家標準(CNS ) A4規格(210X297公釐) 523699 Μ Β7 五、發明説明(21 ) (請先閱讀背面之注意事項再填寫本頁) 參見 L.H. Hall et al·,The Molecular Connectivity Chi Indexes and Kappa Shape Indexes in Structure-Property Relations, Reviews of Computational Chemistry; D. B. Boyd et al·,Eds.; VCH: Weinheim, Germany (1991); Chapter 9, pp. 367-422’ 此 處所述乃出自於對該文的全面性參考。也請參見D. Bonchev et al.,67 J. Chem. Phys.,45 1 7-3 3 ( 1 977),此處所 述乃出自於對該文的全面性參考。這些描述符顯示出適當 的“社區行爲”(在 D.E. Patterson et al·,39 J. Med. Chem·, 3049-59 (1996)中有明確的定義,此處所述乃出自於對該文 的全面性參考),因此,非常適用於差異分析及相似度搜 尋。請參見 V.S. Lobanov et al·,40 J. Chem. Inf. Computer Sci.,460-7 0 (2000),此處所述乃出自於對該文的全面性參 考。 · 經濟部智慧財產局員工消費合作社印製 隨後,利用熟習相關技術者所熟知的主成份分析,使 這1 17個分子描述符標準化並減低其關聯性。這個過程產生 一由23個潛在變數構成的正交集,說明了資料中99%的總變 化量。爲了簡化此分析及對結果的解釋,利用一非常快速 之非線性映像演算法,使這個23維資料集進而變成二維, 此非線性映像演算法敘述於D. K. A g r a f i 〇 t i s e t a 1.,J. C h e m. Inf. Computer Sci., 40, 1 356- 1 362 (2000) ' D.N. Rassokhin et al·,J· Comput. Chem·,22(4), 373-386 (200 1 ),以及 D.K。 Agrafiotis et al., J. Comput. Chem., 22(5), 488-500 (200 1) ^ 此處所述乃出自於對該文的全面性參考。此投影以此方式 執行致使該23維主成份空間中點與點之間的距離儘可能地 本紙張尺冬適用中國國家標準(CNS ) A4規格(210X297公釐) ~ " 523699 A7 ____B7 五、發明説明(22 ) (請先閱讀背面之注意事項再填寫本頁) 被保存在該二維映像中。產生之映像具有一 0.187的Kruskal 應力且被用以顯現挑選物,而其皆在該23維主成份空間中 被挑選出來。爲了排除資料中重複、多餘的狀況,此主成 份分析之預先處理步驟是不可缺少的,而圖解理論描述符 通常具有這種資料中重複、多餘的特徵。 最後,除了這117個位相描述符之外,利用Ghose-Grippen approach以獨立計算分子量及各個化合物的辛醇水 分佈係數(Log P ),此 Ghose-Grippen approach 敘述於 A.K. Ghose et al.,102 J. Phys· Chem. A,3762-72 (199 8),此 處所述乃出自於對該文的全面性參考,如在 DirectedDiversity®工具箱中所執行的一般,而且被用以當 做所有限制設計的目標變數。用來評估相似度的描述符集 中,並未包&含這個參數。所有的挑選物皆爲10x10陣列。 經濟部智慧財產局員工消費合作社印製 第二個例子是出自 Cramer et al·,38 Chem. Inf. Computer Sci.,1010-23 (1 998)中的一個三成份資料庫,此處 所述乃出自於對該文的全面性參考。將一包含兩個一級或 二級胺的二胺分子當做中央支架並利用一醯化劑、反應鹵 化物或易受還原胺化影響的碳基使之從其兩側衍生。必需 產生此資料庫之合成順序包含選擇性地保護其中一個胺並 引進第一支鏈,緊接著是去保護並引進第二支鏈。圖4爲一 圖表,說明用於製作二胺資料庫之合成順序400。只使用商 -業上可取得之試劑(包含Π50個HNXNH型之試劑與26700 個RX型之試劑的1996可用的化學路徑)將會產生超過1〇12 個的潛在生成物。由於此作業目標是要使陣列選擇的方法 -25- 本紙張尺度適用中國國家標準(CNS ) A4規格(210 X 297公釐) 523699 A7 B7 五、發明説明(23 ) (請先閲讀背面之注意事項再填寫本頁) 生效,故產生了一個利用50個商業上可取得之二胺及50個 氯酸與烷化劑化合爲1 25000個化合物所組成的資料庫。如 同前一個資料集一般,每個化合物由被用以獲取分子圖表 之主要特點的117個位相指數來描述,隨後,這117個位相 指數與22個主成份之間的關聯性減低了,並且說明了資料 中9 9 %的總變化量。這些主成份被用來當作輸入至一非線性 維度精簡技術以產生一個二維映像,其在主成份空間中將 兩兩化合物之間的距離複製爲一 0.1 67的Kruskal應力,此映 像僅用於顯現設計,每個設計皆以所有22個非相關的描述 符爲基礎。挑選物皆爲5x5x5陣列。 10.成果與討論 經濟部智慧財產局員工消費合作社印製 此問題'之組合性本質不允許在這些集合之任何一個中 窮舉每種可能的陣列。對還原胺化資料庫而言,由方程式2 所決定之不同的10x10陣列的數量約爲2· 1 0 3 6 ’但對二胺資 料庫而言,不同的5x5x5陣列的數量約爲2_1019。在未知整 體最小値之前,有三個參考點被用以估計透過本發明之方 法所得之解的品質。第一個爲挑選由等量化合物構成之一 稀疏陣列的適合度,並且表示目標函數對一特定挑選物之 大小的上限。因爲全陣列挑選法爲一稀疏陣列挑選法再加 上一些額外的限制,所以全陣列挑選法永遠不會超過一單 •純之稀疏陣列挑選法設計的品質。以確定性的方式藉由評 估每個化合物與其最接近之先導物的相似度、以相似度由 大至小的順序來排列化合物’以及從該列表中挑選出排名 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) \ 2Q - 523699 A7 B7 五、發明説明(24 ) (請先閲讀背面之注意事項再填寫本頁) 最前的k個化合物,稀疏陣列則被挑選出來。另外二個參 考點,其一爲一隨機陣列的平均適合度,其二爲來自於前 述退火優化法之陣列的適合度。 對還原胺化資料庫而言,相似度的挑選被限制在100個 化合物(100個稀疏陣列,10x10全陣列)之內,並且利用 方程式3中的相似度適合度函數與一隨機挑選該資料庫之一 成員爲一「先導物」來完成。圖5爲一圖表,說明用於從還 原胺化資料庫中挑選相似度的一參照結構500 °因爲這些方 法沒有一個是完全確定性的,所以這些挑選會被重複進行 100次,每次從一不同的隨機起始配置(亂數種子)開始。 經濟部智慧財產局員工消費合作社印製 圖6爲一長條圖600,說明根據與一參照結構500之最大 相似度,從一還原胺化資料庫中挑選出1〇〇個化合物之相似 度比數的平均値及標準差。長條圖600顯示一隨機或際遇法 602、一退火法604、貪心法606及稀疏陣列法608的結果。貪 心法606已證明是極爲收斂的:每單一次執行都會產生一 0.594之比數的相同結果且是此作業行使中所有已發現之陣 列裡的最佳陣列。反之,模擬退火法604在100次試驗中只 有60次會收斂至該解,雖然一般來說其執行效率分別滿足 試驗之82%及98%而導致小於0.60及0.61的比數及一個〇·597 ±0.004的整體平均値。這些解比那些用際遇法602 ( —隨機 陣列的平均比數爲1.8 5 5 ± 0.086 )所獲得的解更好,而且非 •常適合與擁有0.533之比數的稀疏陣列法608相比較。 圖7A爲一圖表700,說明根據與一參照結構500之最大 相似度,從一還原胺化資料庫中挑選出一 10x10陣列之化合 本紙張尺卑適用中國國家標準(CNS ) A4規格(210X297公釐) 523699 A7 B7 五、發明説明(25 ) (請先閲讀背面之注意事項再填寫本頁) 物的分佈情況。圖7 B爲一圖表7 1 0,說明根據與一參照結構 5 00之最大相似度,從一還原胺化資料庫中挑選出100個稀 疏陣列之化合物的分佈情況。圖7 B被用以當做一參考。大 正方格(分別爲圖7A中的702及圖7B中的704 )與小正方格 .(分別爲圖7A中的708及圖7B中的706 )分別代表參考化合 物(先導物)與被選定之化合物。圖7A及7B中之圖表爲23 個主成份之二維非線性投影,說明了資料中99%的總變化量 ,並且以一種儘可能保存物.件之接近値(相似度)的方式 來製圖。挑選物以所有23個主成份爲基礎且單純地被照亮 以突顯於該映像上。維度上的激烈精簡作用難免會失真, 而這可由化合物似乎比被選出者更靠近先導物的情況上看 出。然而,此失真因非線性映像之故而分佈在整個資料空 間上,結桌即使是稀疏陣列與全陣列之間相當小的差異, 也明白地顯示在映像上·。實際..的挑選物大部分是由在先導 化合物的兩個支鏈上找到之融合環系統的各種雜環類似物 組成。 經濟部智慧財產局員工消費合作社印製 圖8爲一圖表800,說明根據與一參照結構500之最大相 似度,從一還原胺化資料庫中挑選出構成一 10x10最佳化陣 列之胺試劑與醛試劑。 爲了確定先導.化合物之挑選與位置是否會影響貪心法 偵測一適當之解的能力,利用從胺化資料庫·中隨機挑選出 •的100個參照結構,來比較貪心法與模擬退火法的執行效率 。實驗中隨機挑選100個化合物、以本發明之方法及模擬退 火法爲每一個化合物挑選最相似之1 0 X 1 0陣列,然後比較產 本紙張尺尽適用中國國家標準(CNS ) A4規格(210X297公釐) 523699 A7 B7 五、發明説明(26 ) (請先閲讀背面之注意事項再填寫本頁) 生之設計的比數。在100個案例中的1 3個案例裡,模擬退火 法產生一較差的陣列,而在其餘的87個案例中,兩種方法 均產生同一結果。 圖9爲一圖表900,顯示以模擬退火法及本發明之貪心 法,從一還原胺化資料庫中挑選出1 〇〇個不同的隨機先導物 之最佳1 Ox 1 0陣列的相似度比數之比較情形。如圖9中之分 離點902所示,在其中5個案例中,這二種技術的差異是顯 而易見的。因此,雖然我們.不能肯定最佳解已被確認,但 很明顯地,貪心法非常適合與更複雜且更需要計算之模擬 退火法相比較且似乎可達到整體最佳化。 經濟部智慧財產局員工消費合作社印製 前一個例子說明以一包含單一目標(相似度)之函數 來使用貪心法的情形。事實上,以任何可被描述爲許多個 別分子貢獻之目標函數來使用貪心法,同樣都有效。圖10 爲一圖表,說明用於從一還原胺化資料庫中做相似性應用 之多目標挑選的一參照結構1000。此化合物擁有一 360.3的 分子量及一預測之6.46的log P値,而且落在Lip inski 「規 則5」所定義的範圍之外,C.A. Lipinski et al.,Adv. Drug Delivery Rev·, 2 3, 3-25 ( 1 997)中曾描述此「規則5」,此處 所述乃出自於對該文的全面性參考。此規則是由世界藥物 指標的一項分析所導出,說明對於非生物輸送者之基質的 化合物而言,當有超過5個氫鏈捐贈者、超過1〇個氫鏈接受 者、分子量大於500或log P的値大於5時,不良的吸收和滲 透很可能會發生。 圖11 A爲一圖表11 0 0,說明根據與一參照結構1 〇 〇 〇之最 本紙張尺度適用中國國家標準(CNS ) A4規格(210 X 297公釐) 523699 A7 B7 五、發明説明(27 ) (請先閱讀背面之注意事項再填寫本頁) 大相似度,從一還原胺化資料庫中挑選出10x10陣列的化合 物之差異空間的分佈情況。圖1 1 B爲一圖表1 1 1 0,說明根據 與一參照結構1000之最大相似度,從一還原胺化資料庫中 挑選出1 Ox 1 0陣列的化合物之分子量對計算出之log P的分 佈情況。大正方格(分別爲圖11 A中的11 02及圖1 1 B中的 1 104 )與小正方格(分別爲圖1 1 A中的1 108及圖1 1B中的 1106 )分別代表參考化合物(先導物)與被選定之化合物 。如圖1 1 B所示,以此「先導物」之最大相似度爲基礎所挑 選出的10x10陣列是由平均log P値= 5·47±0·85之化合物所構 成,其中有77個化合物的log Ρ値大於5。 經濟部智慧財產局員工消費合作社印製 圖12爲一圖表1 200,說明根據與參照結構1〇〇〇之最大 相似度,從還原胺化資料庫中挑選出構成10x10陣列之試劑 。被選定之試劑是由鹵化安息香醒及包含兩個六元環的疏 水性胺類所組成,這兩個六元環被一小連結物所區隔。爲 了降低這些化合物的疏水性並同時保存整體結構的相似度 ,可將方程式3中之分子相似度標準與定義於Lipin ski box (log P = 5, MW = 500 )的範圍之上的方程式4中之限制標準 結合。 圖13A爲一圖表1 300,說明根據參照結構1〇〇〇及方程式 (9 )(列於後文),從還原胺化資料庫中挑選出1 〇x 1 〇陣 列的化合物之差異空間的分佈情況。圖13B爲一圖表1310 ’ .說明根據參照結構1000及方程式(9)(列於後文)’從還 原胺化資料庫中挑1出10x10陣列的化合物在以分子量與計 算出之log P所定義之空間上的分佈情況。再一次’大正方 30- 本紙張尺度適用中.國國家標準(CNS ) A4規格(210X297公釐) 523699 Α7 Β7 經濟部智慧財產局員工消費合作社印製 五、發明説明(28 ) 格(分別爲圖13A中的1 302及圖13B中的1 304 )與小正方格 (分別爲圖11A中的1108及圖11B中的11〇6)分別代表參考 化合物(先導物)與被選定之化合物。圖13A與圖13B顯示 以10x10格式挑選出100個化合物,使目標函數減至最小: /(C)-5(C) + 2-P(C) (9) 其中,S(C)及P(C)分別得自方程式3及方程式4。重量決定 了在最後設計中每個標準.之相對影響,而且是以D.N. Rassokhin et al., J. Mol. Graphics Model, 1 8(4-5), 370-384 (2000)中所描述的一簡單圖示爲基礎被挑選出來,此處所述 之簡單圖示乃出自於對該文的全面性參考。產生之陣列是 由平均log P値=4.5 8±0.72的化合物組成,而且包含圖14中 所顯示的試劑。圖14爲一圖表1400,說明根據參照結構 1000及方程式(9 ),從還原胺化資料庫中挑選出構成 10x10陣列之試劑。在圖12及圖14的兩個挑選中’有9個共 同的試劑(8個胺及1個醛)。原始挑選中的二個疏水性胺 類被帶有甲氧基之位相上相似的結構所取代’而數個多_ 化安息香醛被含有較少量鹵素置換基及其中4個案例中之S 基的試劑所取代。因此,只要小心選擇參數’此種多目標 的方法便能夠將一挑選引導至更令人滿意的化1學空胃範11 而不用破壞實驗的主目標,在此狀況下,該主目標β[]胃 、系列與已知的先導物密切相關之類似物的設計° 爲了確保本發明之方法的執行效率不會因較複雜的組 合資料庫而降低,重複對上述之3成份二胺資料庫進行相同 本紙張尺度適用中國國家標準(CNS ) Α4規格(210Χ297公釐) -31 - (請先閲讀背面之注意事項再填寫本頁) 一裝. 訂 523699 A7 B7 五、發明説明(29 ) (請先閲讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 型態的分析。此結果槪述於圖1 5及圖1 6。圖1 5爲一長條圖 1 500,說明根據與一最佳化收集超過100次的隨機挑選結構 (5x5x5陣列,125個稀疏陣列)之最大相似度,從二胺資 料庫中挑選1 25個化合物之相似度比數的平均値及標準差。 此結果是用來顯示一隨機或際遇法1 502、一模擬退火法 1 504、貪心法1 506,以及稀疏陣列法1 508。再一次,貪心法 極爲堅固,產生了三個不同但非常相似的解,其具有一 0.4833±0.0001的平均適合度.;100個試驗中有79個收斂至一 具有比數爲0.4832的陣列,而其餘的21個試驗收斂至二個具 有同一比數爲0.4835的不同陣列。模擬退火法顯示一稍微較 高的變化性並收斂至8個不同的解’這些解具有範圍從 0.48 32(爲進行21次的貪心法所確定之同一陣列)到0.503的適 合度數値以及一 〇.4859±0.0043的平均値。如同胺化資料 庫一般,此實驗是以二胺集合中一隨機選取的「先導物」 爲基礎。接著,對1〇〇個隨機選取之參考化合物重複進行此 過程,其結果槪述於圖16。圖16爲一圖表1600,說明根據 與100個隨機先導物之最大相似度’以模擬退火法及本發明 之貪心法,從二胺資料庫中挑選出最佳5x5x5陣列的相似度 比數之比較情形。由貪心法產生的解在這些試驗中有57個 稍微好些,有1 6個稍微差些’而在剩餘的27個中則相同’ 差異範圍從-0.059到0.0033。 使用貪心法的一項最重要的優點爲其執行速度。圖17 爲一長條圖,說明在一 400Mhz Intel Pentium II處理器上以 本發明之貪心法分別從還原胺化資料庫及=胺資料庫中挑 -32- 本纸張尺尽適用中國國家標準(CNS ) A4規格(210X297公釐) 523699 A7 B7 五、發明説明(3〇 ) (請先閲讀背面之注意事項再填寫本頁) 選出 100 ( 17 02 )、400 ( 1 704 )、1 600 ( 1 706 )、6400 ( 1708)及25600 ( 1710)個化合物時所需之cpu時間。貪心 法只需要些微的計算,而且即使是最大量的挑選亦可在次 秒的時間片段內完成,有一大部分的時間是花在預先處理 的步驟中計算每個候選物與各自的先導物之間的歐式距離 上,這些時間與虛擬資料庫的大小成線性比。貪心法本身 與試劑的總數量成線性比,而產生的解是比得上且常常優 於那些由更複雜之推測方法所導出的解。 11.本發明之實作 經濟部智慧財產局員工消費合作社印製 本發明可利用硬體、軟體或其組合來賓作,而且可在 一或多個電腦系統或其他處理系統上來實作。事實上,在 一實施例中,此發明指向一或多個能夠執行文中所述之功 能的電腦系統。圖1 8顯示一電腦系統1 800之範例實作。就 此示範性的電腦系統1 800來說已描述了各種實施例。讀完 該敘述之後,熟習相關技術者很明顯地會懂得如何使用其 他的電腦系統及/或電腦結構以實作本發明。電腦系統1 800 包含一或多個處理器,例如處理器1 803。處理器1 803連接 至一通訊匯流排1 8 0 2。 電腦系統1 800也包含一個主記憶體1 805,更可說是隨 機存取記憶體(RAM ),而且也可以包含一個輔助記憶體 、1810。舉例來說,輔助記憶體1810可包含一個硬碟機1812及 /或一個抽取式儲存機1 8 1 4,代表一軟碟機、一磁帶機、一 光碟機,等等。抽取式儲存機1814以一已知的方式從抽取 本紙張尺率適用中.國國家標準(CNS ) A4規格(210X297公釐) -33- 523699 A7 _________ B7 五、發明説明(31 ) (請先閲讀背面之注意事項再填寫本頁) 式儲存器18 18讀取及/或寫入此儲存器1818。抽取式儲存器 18 18代表一軟碟機、一磁帶機、一光碟機,等等,這些被 抽取式儲存機1814讀取及寫入。如眾所知,抽取式儲存器 181 8包含一個電腦可用儲存媒體.,其中已儲存電腦軟體及/ 或資料。 在另一個實施例中,輔助記憶體1810可包含用於使電 腦程式或別的指令被下載至電腦系統1 800之其他相似的裝 置。舉例來說,該裝置可包含一個抽取式儲存器1 822及一 介面1 820。像這樣的範例可能包含一個程式盒與盒式介面 (例如視訊遊戲裝置中所具備的)、一個抽取式記億晶片 (例如可消除程式化唯讀記憶體(EPROM )或程式可控唯 讀儲存器(PROM ))與串聯插槽,以及別的抽取式儲存 器1 822與允軟體及資料從抽取式儲存器1 822轉換至電腦 系統1 800的介面1 820。 經濟部智慧財產局員工消費合作社印製 電腦系統1 800也可以包含一個通訊介面1 824。通訊介 面1 824允許軟體及資料在電腦系統1 800與外部裝置之間轉 換。通訊介面1 824的範例可能包含一數據機、一網路介面 (例如一個乙太網路卡)、一通訊連接埠、一 PCMCIA插槽 及卡、一無線區域網路介面,等等。軟體及資料以信號 1 828的形式經由通訊介面1 824來轉換,這些信號1 824可能是 電子的、電磁的、光學的或其他能被通訊介面1 824接收的 •信號。這些信號1 828經由一通訊路徑(亦即,通道)1826 而被提供給通訊介面1824。此通道1 826攜帶信號1 8 24且可利 用電纜或有線電視、光纖、電話線、大哥大連結、無線連 本紙張尺度適用中國國家標準(CNS ) A4規格(210X29*7公釐) -34- 523699 A7 ___B7_ 五、發明説明(32 ) " 結,以及其他通訊通道來實作。 在此文件中,「電腦程式產品」這個術語意指抽取式 儲存器1818、1 822及信號1 828。這些電腦程式產品爲用來對 電腦系統1 800提供軟體的裝置。此發明指向該電腦程式產 電腦程式(亦稱爲電腦控制邏輯)被儲存在主記憶體 1 805及/或輔助記憶體18 10中及/或在電腦程式產品中。電腦 程式也可以經由通訊介面18.24而被接收。執行該電腦程式 時,會使電腦系統1 800執行如文中所述之本發明的特色。 尤其,執行該電腦程式時,會使處理器1 803執行本發明的 特色。因此,該電腦程式代表電腦系統1 800的控制者。 在一使用軟體實作此發明的實施例中,該軟體可被儲 存在一電腦程式產品中並被下載至使用抽取式儲存機1814 、硬碟機1812或通訊介面1 824的電腦系統1 800中。當控制邏 輯(軟體)由處理器1 803來執行時,會使處理器1 803執行如文 中所述之本發明的功能。 在另一個實施例中,主要以使用硬體來實作此發明, 例如,如特殊用途積體電路(ASICs )的硬體元件。熟習 相關技術者將淸楚地瞭解硬體狀態機之實作,以便執行文 中所述之功能。 在又另一個實施例中,使用一硬體與軟體之組合以實 •作此發明。 12.結論 (請先閲讀背面之注意事項再填寫本頁) -裝· P. 經濟部智慧財產局員工消費合作社印製 -35 A7
523699 五、發明説明(33 ) 雖然上文中已描述本發明之種種實施例,但我們應瞭 解這些實施例僅爲示範性而非限制性之描述。熟習此技術 者會瞭解在不違反附加的申請專利範圍中所定義之本發明 的精神及範圍之情況下,在其中也可以做各種形式及細節 上的改變。因此,本發明之廣泛性及範圍不應該被上述任 何一個示範性的實施例所限制,而應該僅依據下列申請專 利範圍及其同等事項來定義之。 (請先閲讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 本紙張尺〆適用中國國家標準(CNS ) A4規格(210X297公釐)

Claims (1)

  1. 523699 A8 B8 C8 D8 六、申請專利範圍 1. 一種用於設計組合陣列之方法,包含以下步驟: (請先閱讀背面之注意事項再填寫本頁) (1) 從一組合資料庫中之眾多變異點上決定所要挑選出 的一些試劑,其中該些試劑的數量少於或等於該組合資料 庫中之每個該變異點上的候選試劑之數量; (2) 從該組合資料庫中每個該變異點上的眾多候選試劑 中,挑選出該數量的試劑; (3) 評估經由步驟(2)中挑選出之該數量的試劑之有系 統的組合所得組合陣列之適合度(Γ); (4) 藉由鑑定由該組合資料庫中每個該變異點上之各該 多數候選試劑與其中所有其他的該變異點上之選定試劑的 有系統的組合所產生的組合次陣列,而獨立評估該組合資 料庫中該變異點之其中一點上的多數候選試劑; (5) 以步驟(4 )中所得的結果爲基礎,排列該組合資料 庫中該變異點之該其中一點上的該多數候選試劑中之各該 候選試劑; 經濟部智慧財產局員工消費合作社印製 (6) 以該等級排列之步驟的結果爲基礎,從該組合資料 庫中該變異點之該其中一點上的該多數候選試劑中,挑選 一組新試劑; (7) 對該組合資料庫中之各該變異點,重複進行步驟(4 )、(5 )及(6 ); (8) 評估一組合陣列之適合度(f ),而該組合陣列產 生自該組合資料庫中各該變異點上之選定試劑的有系統的 組合; (9) 倘若f爲優於Γ的適合度,則設定Γ等於f且重複步 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) Γ37 -~ 523699 A8 B8 C8 D8 ____ •一, m 六、申請專利範圍 驟(4)至(8);及 (請先閲讀背面之注意事項再填寫本頁) (ίο)倘若f爲不優於f,的適合度,則從步驟(8)輸出該 組合陣列。 2. 如申請專利範圍第1項之方法,其中以一或多個目標 函數爲基礎,評估步驟(3 ) 、( 4 )及(8 ) ° 3. 如申請專利範圍第1項之方法,其中以包含該組合陣 列及/或該組合次陣列之化合物與至少一個特定之參考化合 物的相似度爲基礎,評估步驟(3 ) 、( 4 )及(8 ) ° 4. 如申請專利範圍第1項之方法,其中以包含該組合陣 列及/或該組合次陣列之化合物與至少一個疑問或探索的一 致程度爲基礎,評估步驟(3 ) 、( 4 )及(8 )。 5 .如申請專利範圍第1項之方法,其中以至少一個包含 該組合陣列及/或該組合次陣列之化合物的特性爲基礎’評 估步驟(3) 、( 4)及(8) ° 6.如申請專利範圍第5項之方法,其中該至少一個包含 該組合陣列及/或該組合次陣列之化合物的特性爲一計算特 性。 經濟部智慧財產局員工消費合作社印製 7 ·如申請專利範圍第1項之方法,其中步驟(2 )包含從 該組合資料庫中每個該變異點上的該多數候選試劑中隨機 地挑選出該數量的試劑的步驟。 8·如申請專利範圍第1項之方法,其中步驟(2)包含從 該組合資料庫中每個該變異點上的該多數候選試劑中有系 統地或部份有系統地挑選出該數量的試劑的步驟。 9·如申請專利範圍第1項之方法,其中至少重複進行兩 本紙張尺專逋用中國國家橾準(CNS ) A4規格(210X297公釐) Γ38- ^----- 523699 A8 B8 C8 D8 六、申請專利範圍 次步驟(2 )〜(10 )。 (請先閱讀背面之注意事項再填寫本頁) 1 0.如申請專利範圍第1項之方法,其中步驟(2 )包含 從該組合資料庫中每個該變異點上的該多數候選試劑中挑 選出該數量的試劑的步驟,致使從該變異點之至少其中一 點上所選定的試劑至少含有一個特定試劑。 11. 如申請專利範圍第1項之方法,其中步驟(6 )以步 驟(5 )中已確定的等級排列爲基礎,包含從該組合資料庫 中每個該變異點上之該多數候選試劑中挑選出該組新試劑 的步驟,致使該組合資料庫中該變異點之該其中一點上的 該組新選定試劑至少含有一個特定試劑。 12. —種用於使電腦能夠設計組合陣列之電腦程式產品 ,其包含一載有電腦程式邏輯之電腦可用媒體,該電腦程 式邏輯包含” 一確定方法,用於使一處理器能夠確定從一組合資料 庫中多數變異點上挑選出一些試劑,其中該試劑少於或等 於該組合資料庫中每個該變異點上的一些候選試劑; 經濟部智慧財產局員工消費合作社印製 一挑選方法,用於使一處理器能夠從該組合資料庫中 每個該變異點上的多數候選試劑中挑選出該數量的試劑; 一第一評估方法,用於使一處理器能夠評估一組合陣 列之適合度(Γ),該組合陣列產生自由該挑選方法取得 之該數量的試劑的有系統的組合; 一獨立評估方法,用於使一處理器能夠藉由鑑定由該 組合資料庫中每個該變異點上之各該多數候選試劑與其中 所有其他的該變異點上之選定試劑的有系統的組合所產生 本紙張尺尽適用中國國家標準( CNS ) A4規格(210X297公釐) 39 - 523699 A8 B8 C8 D8 六、申請專利範圍 ^、 的組合次陣列,獨立評估該組合資料庫中該變異點之其中 一點上之多數候選試劑; 一等級排列方法,用於使一處理器能夠以該獨立評估 方法中所得的結果爲基礎,排列該組合資料庫中該變異點 之該其中一點上的該多數候選試劑中之各該候選試劑; 一挑選方法,用於使一處理器能夠以該等級排列方法 的結果爲基礎,從該組合資料庫中該變異點之該其中〜點 上的該多數候選試劑中挑選一組新試劑; 一等級排列與挑選方法,用於使一處理器能夠依次排 列並挑選該組合資料庫中每個該變異點上之試劑; 一第二評估方法,用於使一處理器能夠評估該組合陣 列之適合度(f ),該組合陣列產生自該組合資料庫中每個 該變異點上之選定試劑的有系統的組合; 一用於使一處理器能夠判定適合度f是否優於適合度Γ 的方法; 一用於使一處理器能夠重新設計該組合陣列直到適合 度f不優於適合度Γ爲止的方法; 一用於使一處理器能夠在適合度f優於適合度f’時設定 Γ等於f的設定方法,及 一用於使一處理器能夠輸出該組合陣列的輸出方法。 13.如申請專利範圍第12項之電腦程式產品,其中以一 或多個目標函數爲基礎,評估該第一評估方法、 該獨立評估方法及該第二評估方法。 1 4.如申請專利範圍第1 2項之電腦程式產品’其中以包 本紙張尺冬適用中國國家揉準(CNS ) A4規格(210X297公釐1 - 40- " f請先閲讀背面之注意事項再填寫本頁} -訂 f 經濟部智慧財產局員工消費合作社印製 523699 A8 B8 C8 D8 六、申請專利範圍 含該組合陣列及/或該組合次陣列之化合物與至少一個特定 之參考化合物的相似度爲基礎,評估該第一評估方法、該 獨立評估方法及該第二評估方法。 15. 如申請專利範圍第12項之電腦程式產品,其中以包 含該組合陣列及/或該組合次陣列之化合物與至少一個疑問 或探索的一致程度爲基礎,評估該第一評估方法、該獨立 評估方法及該第二評估方法。 16. 如申請專利範圍第12項之電腦程式產品,其中以至 少一個包含該組合陣列及/或該組合次陣列之化合物的特性 爲基礎,評估該第一評估方法、該獨立評估方法及該第二 評估方法。 17. 如申請專利範圍第16項之電腦程式產品,其中該至 少一個包含該組合陣列及/或該組合次陣列之化合物的特性 爲.一計算特性。 18. 如申請專利範圍第12項之電腦程式產品,其中用於 使一處理器能夠從該組合資料庫中每個該變異點上的多數 候選試劑中挑選出該數量的試劑的該挑選方法,另包含用 於使一處理器能夠從該組合資料庫中每個該變異點上的多 數候選試劑中隨機地挑選出該數量的試劑的方法。 19. 如申請專利範圍第12項之電腦程式產品,其中用於 使一處理器能夠從該組合資料庫中每個該變異點上的多數 候選試劑中挑選出該數量的試劑的該挑選方法,另包含用 於使一處理器能夠從該組合資料庫中每個該變異點上的該 多數候選試劑中有系統地或部份有系統地挑選出該數量的 本紙張尺度適用中國國家標準( CNS ) A4規格(210X297公釐) -41 - (請先閲讀背面之注意事項再填寫本頁) 一裝· •Γ. 經濟部智慧財產局員工消费合作社印製 523699 A8 B8 C8 D8 X、申請專利範圍 試劑的方法。 20.如申請專利範圍第12項之電腦程式產品,其中用於 使一處理器能夠從該組合資料庫中每個該變異點上的多數 候選試劑中挑選出該數暈的試劑的該挑選方法,另包含用 於使一處理器能夠從該組合資料庫中每個該變異點上的該 多數候選試劑中挑選出該數量的試劑的方法,致使從該變 異點之至少其中一點上所選定的試劑至少含有一個特定試 劑。 2 1.如申請專利範圍第1 2項之電腦程式產品,其中用於 使一處理器能夠以該等級排列方法的結果爲基礎,從該組 合資料庫中該變異點之該其中一點上的該多數候選試劑中 挑選一組新試劑的該挑選方法,另包含用於使一處理器能 夠以該等級排列方法爲基礎,從該組合資料庫中每個該變 異點上之該多數候選試劑中挑選出該組新試劑的方法,致 使該組合資料庫中該變異點之該其中一點上的該組新選定 試劑至少含有一個特定試劑。 (請先閱讀背面之注意事項再填寫本頁) 一裝- 訂 f 經濟部智慧財產局員工消費合作社印製 本紙張尺度逋用中國國家標準(CNS ) A4規格(210X297公釐) -42 -
TW090104949A 2000-02-29 2001-03-01 Method and computer program product for designing combinatorial arrays TW523699B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US18570000P 2000-02-29 2000-02-29

Publications (1)

Publication Number Publication Date
TW523699B true TW523699B (en) 2003-03-11

Family

ID=22682096

Family Applications (1)

Application Number Title Priority Date Filing Date
TW090104949A TW523699B (en) 2000-02-29 2001-03-01 Method and computer program product for designing combinatorial arrays

Country Status (5)

Country Link
US (1) US6671627B2 (zh)
AR (1) AR027586A1 (zh)
AU (1) AU2001241800A1 (zh)
TW (1) TW523699B (zh)
WO (1) WO2001065462A2 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001013283A1 (en) * 1999-08-13 2001-02-22 Mpower.Com, Inc. A system, method, and computer program product for configuring stochastic simulation models in an object oriented environment
US20030018598A1 (en) * 2001-07-19 2003-01-23 Cawse James Norman Neural network method and system
US7635564B2 (en) 2002-10-25 2009-12-22 Agilent Technologies, Inc. Biopolymeric arrays having replicate elements
US20080155235A1 (en) * 2006-10-02 2008-06-26 Dewey Douglas W Instructions Capable of Preventing Incorrect Usage of UContext Functions in a Multi-Process Environment

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61223941A (ja) 1985-03-29 1986-10-04 Kagaku Joho Kyokai 化学構造の検索方法
US4773099A (en) 1985-10-10 1988-09-20 The Palantir Corporation Pattern classification means for use in a pattern recognition system
US4908773A (en) 1987-04-06 1990-03-13 Genex Corporation Computer designed stabilized proteins and method for producing same
US4859736A (en) 1987-03-30 1989-08-22 Ciba-Geigy Corporation Synthetic polystyrene resin and its use in solid phase peptide synthesis
US4939666A (en) 1987-09-02 1990-07-03 Genex Corporation Incremental macromolecule construction methods
US4935875A (en) 1987-12-02 1990-06-19 Data Chem, Inc. Chemical analyzer
US5147608A (en) 1988-04-29 1992-09-15 Millipore Corporation Apparatus and process for performing repetitive chemical processing
US5010175A (en) 1988-05-02 1991-04-23 The Regents Of The University Of California General method for producing and selecting peptides with specific properties
DE58906153D1 (de) 1988-08-24 1993-12-16 Siemens Ag Verfahren zur chemischen Dekontamination der Oberfläche eines metallischen Bauteils einer Kernreaktoranlage.
US5025388A (en) 1988-08-26 1991-06-18 Cramer Richard D Iii Comparative molecular field analysis (CoMFA)
US5265030A (en) 1990-04-24 1993-11-23 Scripps Clinic And Research Foundation System and method for determining three-dimensional structures of proteins
US5723289A (en) 1990-06-11 1998-03-03 Nexstar Pharmaceuticals, Inc. Parallel selex
IE66205B1 (en) 1990-06-14 1995-12-13 Paul A Bartlett Polypeptide analogs
US5650489A (en) 1990-07-02 1997-07-22 The Arizona Board Of Regents Random bio-oligomer library, a method of synthesis thereof, and a method of use thereof
US5167009A (en) 1990-08-03 1992-11-24 E. I. Du Pont De Nemours & Co. (Inc.) On-line process control neural network using data pointers
US5181259A (en) 1990-09-25 1993-01-19 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration General method of pattern classification using the two domain theory
US5155801A (en) 1990-10-09 1992-10-13 Hughes Aircraft Company Clustered neural networks
US5331573A (en) 1990-12-14 1994-07-19 Balaji Vitukudi N Method of design of compounds that mimic conformational features of selected peptides
US5260882A (en) 1991-01-02 1993-11-09 Rohm And Haas Company Process for the estimation of physical and chemical properties of a proposed polymeric or copolymeric substance or material
US5499193A (en) 1991-04-17 1996-03-12 Takeda Chemical Industries, Ltd. Automated synthesis apparatus and method of controlling the apparatus
WO1993001484A1 (en) 1991-07-11 1993-01-21 The Regents Of The University Of California A method to identify protein sequences that fold into a known three-dimensional structure
JPH07117950B2 (ja) 1991-09-12 1995-12-18 株式会社エイ・ティ・アール視聴覚機構研究所 パターン認識装置およびパターン学習装置
US5270170A (en) 1991-10-16 1993-12-14 Affymax Technologies N.V. Peptide library and screening method
US5240680A (en) 1991-12-19 1993-08-31 Chiron Corporation Automated apparatus for use in peptide synthesis
US6037135A (en) 1992-08-07 2000-03-14 Epimmune Inc. Methods for making HLA binding peptides and their uses
EP0555024B1 (en) 1992-02-07 2000-05-17 Canon Kabushiki Kaisha Method and apparatus for pattern recognition
US5573905A (en) 1992-03-30 1996-11-12 The Scripps Research Institute Encoded combinatorial chemical libraries
US5288514A (en) 1992-09-14 1994-02-22 The Regents Of The University Of California Solid phase and combinatorial synthesis of benzodiazepine compounds on a solid support
US5565325A (en) 1992-10-30 1996-10-15 Bristol-Myers Squibb Company Iterative methods for screening peptide libraries
JP2513395B2 (ja) 1992-11-09 1996-07-03 株式会社島津製作所 ペプチドアミド合成用リンカ―
US5703792A (en) 1993-05-21 1997-12-30 Arris Pharmaceutical Corporation Three dimensional measurement of molecular diversity
WO1994028504A1 (en) 1993-05-21 1994-12-08 Arris Pharmaceutical A machine-learning approach to modeling biological activity for molecular design and to modeling other characteristics
US5544352A (en) 1993-06-14 1996-08-06 Libertech, Inc. Method and apparatus for indexing, searching and displaying data
US5679582A (en) 1993-06-21 1997-10-21 Scriptgen Pharmaceuticals, Inc. Screening method for identifying ligands for target proteins
ES2165880T3 (es) 1993-06-21 2002-04-01 Selectide Corp Conectores segmentables selectivamente basados en enlaces ester de acido iminodiacetico.
US5585277A (en) 1993-06-21 1996-12-17 Scriptgen Pharmaceuticals, Inc. Screening method for identifying ligands for target proteins
US5434796A (en) 1993-06-30 1995-07-18 Daylight Chemical Information Systems, Inc. Method and apparatus for designing molecules with desired properties by evolving successive populations
JP2948069B2 (ja) 1993-09-20 1999-09-13 株式会社日立製作所 化学分析装置
EP0754238A4 (en) 1994-04-05 1998-01-28 Pharmagenics Inc DETERMINATION AND IDENTIFICATION OF ACTIVE SUBSTANCES IN SUBSTANCE LIBRARIES
US5602938A (en) 1994-05-20 1997-02-11 Nippon Telegraph And Telephone Corporation Method of generating dictionary for pattern recognition and pattern recognition method using the same
US5549974A (en) 1994-06-23 1996-08-27 Affymax Technologies Nv Methods for the solid phase synthesis of thiazolidinones, metathiazanones, and derivatives thereof
EP0694855B1 (en) 1994-07-28 2002-05-02 International Business Machines Corporation Search/sort circuit for neural networks
US5463564A (en) 1994-09-16 1995-10-31 3-Dimensional Pharmaceuticals, Inc. System and method of automatically generating chemical compounds with desired properties
US5574844A (en) 1994-09-22 1996-11-12 International Business Machines Corporation Computer system and method for processing atomic data to calculate and exhibit the properties and structure of matter
US5553225A (en) 1994-10-25 1996-09-03 International Business Machines Corporation Method and apparatus for combining a zoom function in scroll bar sliders
US5712171A (en) 1995-01-20 1998-01-27 Arqule, Inc. Method of generating a plurality of chemical compounds in a spatially arranged array
US5807754A (en) 1995-05-11 1998-09-15 Arqule, Inc. Combinatorial synthesis and high-throughput screening of a Rev-inhibiting arylidenediamide array
US5602755A (en) 1995-06-23 1997-02-11 Exxon Research And Engineering Company Method for predicting chemical or physical properties of complex mixtures
EP0791008A4 (en) 1995-09-08 2003-04-23 Anadys Pharmaceuticals Inc SCREENING METHOD FOR CONNECTIONS HAVING AN AFNESS TO RNS
US5811241A (en) 1995-09-13 1998-09-22 Cortech, Inc. Method for preparing and identifying N-substitued 1,4-piperazines and N-substituted 1,4-piperazinediones
CA2184195C (en) 1995-10-25 2002-04-16 Andrew Pakula Screening method for identifying ligands for target proteins
EP0865502A4 (en) 1995-12-07 2000-08-16 Scriptgen Pharm Inc FLUORESCENT-BASED DETECTION METHOD FOR LIGANDS
US5712564A (en) 1995-12-29 1998-01-27 Unisys Corporation Magnetic ink recorder calibration apparatus and method
WO1997027559A1 (en) 1996-01-26 1997-07-31 Patterson David E Method of creating and searching a molecular virtual library using validated molecular structure descriptors
US6185506B1 (en) 1996-01-26 2001-02-06 Tripos, Inc. Method for selecting an optimally diverse library of small molecules based on validated molecular structural descriptors
US6014661A (en) 1996-05-06 2000-01-11 Ivee Development Ab System and method for automatic analysis of data bases and for user-controlled dynamic querying
EP0818744A3 (en) 1996-07-08 1998-07-08 Proteus Molecular Design Limited Process for selecting candidate drug compounds
WO1998020459A1 (en) 1996-11-04 1998-05-14 3-Dimensional Pharmaceuticals, Inc. System, method, and computer program product for the visualization and interactive processing and analysis of chemical data
US5861532A (en) 1997-03-04 1999-01-19 Chiron Corporation Solid-phase synthesis of N-alkyl amides
US5908960A (en) 1997-05-07 1999-06-01 Smithkline Beecham Corporation Compounds
US5933819C1 (en) 1997-05-23 2001-11-13 Scripps Research Inst Prediction of relative binding motifs of biologically active peptides and peptide mimetics
US6049797A (en) 1998-04-07 2000-04-11 Lucent Technologies, Inc. Method, apparatus and programmed medium for clustering databases with categorical attributes

Also Published As

Publication number Publication date
WO2001065462A2 (en) 2001-09-07
US20010029026A1 (en) 2001-10-11
AU2001241800A1 (en) 2001-09-12
AR027586A1 (es) 2003-04-02
US6671627B2 (en) 2003-12-30
WO2001065462A3 (en) 2002-03-07

Similar Documents

Publication Publication Date Title
Crampin et al. Mathematical and computational techniques to deduce complex biochemical reaction mechanisms
Brown Chemoinformatics—an introduction for computer scientists
Bunin et al. Chemoinformatics theory
Georgiou Supersaturated designs: A review of their construction and analysis
US6421612B1 (en) System, method and computer program product for identifying chemical compounds having desired properties
EP1021780B1 (en) System and method for structure-based drug design that includes accurate prediction of binding free energy
US8374828B1 (en) Computer implemented system for protein and drug target design utilizing quantified stability and flexibility relationships to control function
US20050177280A1 (en) Methods and systems for discovery of chemical compounds and their syntheses
JP2003529843A (ja) 化学資源データベース
Oprea et al. Chemical information management in drug discovery: optimizing the computational and combinatorial chemistry interfaces
US20040083060A1 (en) Method of operating a computer system to perform a discrete substructural analysis
US20240029834A1 (en) Drug Optimization by Active Learning
Zhou et al. Allosteric mechanism of the circadian protein Vivid resolved through Markov state model and machine learning analysis
Wang et al. Pmptce-hnea: Predicting metabolic pathway types of chemicals and enzymes with a heterogeneous network embedding algorithm
TW523699B (en) Method and computer program product for designing combinatorial arrays
Pittman et al. Bayesian analysis of binary prediction tree models for retrospectively sampled outcomes
Winkler et al. Application of neural networks to large dataset QSAR, virtual screening, and library design
US20230335228A1 (en) Active Learning Using Coverage Score
Smalter et al. Gpm: A graph pattern matching kernel with diffusion for chemical compound classification
Carlson et al. BEAM: a beam search algorithm for the identification of cis-regulatory elements in groups of genes
Andersson et al. Design of small libraries for lead exploration
US20220406404A1 (en) Adversarial framework for molecular conformation space modeling in internal coordinates
Schüller et al. Identification of hits and lead structure candidates with limited resources by adaptive optimization
James Cheminformatics in the service of GPCR drug discovery
Root et al. Global analysis of large-scale chemical and biological experiments