JP2003529843A - 化学資源データベース - Google Patents

化学資源データベース

Info

Publication number
JP2003529843A
JP2003529843A JP2001573237A JP2001573237A JP2003529843A JP 2003529843 A JP2003529843 A JP 2003529843A JP 2001573237 A JP2001573237 A JP 2001573237A JP 2001573237 A JP2001573237 A JP 2001573237A JP 2003529843 A JP2003529843 A JP 2003529843A
Authority
JP
Japan
Prior art keywords
chemical
information
database
reaction
chemical synthesis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001573237A
Other languages
English (en)
Inventor
ブーニン・バリー・エー.
Original Assignee
ライブラリア・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ライブラリア・インコーポレーテッド filed Critical ライブラリア・インコーポレーテッド
Publication of JP2003529843A publication Critical patent/JP2003529843A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry
    • G16C20/64Screening of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry

Abstract

(57)【要約】 【課題】 【解決手段】 化学ソフトウェアツールは、データベースと、データベースに基づいて、反応化学によって系統的に分類された化学情報を蓄積・操作・調査するためのシステムと、を利用する。所定の手順や方法を、所定の反応に対応づけておく。このようなツールにより、個々の反応(138)に対する信頼性の評価を行い、考えられる様々な反応群(138、139)の中から望ましい反応を特定することができる。たとえば、所定のベンジルアミン(141)は、アミド(145)形成能力に関して、他の芳香族第一級アミンよりも優れているため、高い信頼性評価が与えられる。また、ソフトウェアツールを用いて、所定の前駆物質、所定の種類の前駆物質、あるいは所定の反応化学に関する多様なライブラリを自動的に提案・作成することも可能である。所定の前駆物質あるいは所定の種類の前駆物質に関する手順や方法に基づいて、自由度の高い一連の反応化学を自動的に形成することにより、このようなライブラリを作成することができる。これらのソフトウェアツールは、人および/あるいは人工知能システムからのフィードバックにより、絶えず改良・改善可能なように設計されることが望ましい。

Description

【発明の詳細な説明】
【0001】
【従来の技術】
現代の有機化学者は、無数のソフトウェアツールを自在に使いこなしている。
このソフトウェアツールには、化学構造から活性を予測するためのツール(「構
造活性相関」ツールあるいはSARツールと称される)や、市販されている試薬
を注文するためのツール、文献へのリンクを含む膨大な量の化学情報を蓄積した
データベースなどが含まれる。これらのツールのうち大部分は、新しい電子イン
フラ設備や電子商取引を利用する目的で最近開発されたものである。また、かつ
ては解決困難だった問題を解決する(あるいは、解決に近づける)ためにコンピ
ュータ能力を利用する目的で開発されたものもある。
【0002】 もっとも普及しているオンラインデータベースのなかには、かつては図書館の
棚のテキストを調査するツールであった索引データを電子化して提供しているも
のもある(例えば、ベイルステイン、ケミカル・アブストラクト等)。このよう
なデータベースは、種々の近代的な電子特性が付与されてはいるものの、根本的
には、伝統的手法で集められた化学情報を電子データベースとして再フォーマッ
トしたものにすぎない。これら既存のデータベースは、基本的に、ある文献を入
手するべきかどうかを化学者が判断する助けとなる情報を備えた、文献の索引リ
ストであって、現代の化学者の研究を容易にする目的で最適化されたものではな
い。
【0003】 既存の化学ソフトウェアを用いた場合の大きな問題は、反応条件の範囲が狭め
られてしまうことである。また、データベースに含まれる、反応性や化学反応経
路に関する詳細な情報へのアクセスにも問題がある。これは、特に、ハイスルー
プット化学で問題となる。多くの場合、研究設備や化学測定機器の特有の性質に
よって、反応条件の範囲が狭められている。例えば、コンビナトリアル・ケミス
トリの研究設備やパラレル合成の研究設備でこの問題が生じる。通常、このよう
な装置は、化学合成に関して広い範囲の反応条件を提供することはできなかった
。なぜなら、このような装置は、多くの化学合成を同時に、かつ、非常に小さな
反応スケールで実行するように設計されているためである。このため、装置が非
常に複雑になっており、この複雑さ故に、加熱・冷却、不活性雰囲気、高反応性
試薬供給等に関して、様々な条件に設定することが困難であった。また、対象と
なる分子の中には、熱および/あるいは光に対して不安定なものも多い。ソフト
ウェアツールを用いて、役立つ可能性のある活性を備える化合物を提示された場
合、実現可能な合成条件下で、この化合物が安定であるか否か(さらには、実際
に合成可能であるか否か)を知りたいという要望が出てくる。しかしながら、従
来のツールはこのような情報を提供するものではなかった。さらに、既存のデー
タベースは、化学反応条件や反応化学に基づいて化学情報を効果的に系統分類し
たものでもなかった。
【0004】 また、化学者が、新しい分野の研究を始め、なじみのない合成化学を利用する
必要性が生じた場合には、別の問題が生じる。このような場合、比較的容易に合
成できる化合物から始めるのが一般的である。特定の反応の対象となる一連の前
駆物質がある場合、そのうちのいくつかの前駆物質が関連する反応が、他のもの
に比べて信頼性(反応が起こり得る可能性)が高いということは、頻繁に起こり
える。その分野に不慣れな化学者からは、どの前駆物質が最も信頼性が高いのか
を知りたいという要望がある。また、その分野に詳しい化学者でも、直観的には
進むはずの化学反応が実際には進まないという事態に頻繁に遭遇する。信頼性評
価と結びついた反応化学は、合成化学者の強力なツールとなり、無駄な実験に費
やされる時間やお金を節約することにつながる。しかしながら、従来のソフトウ
ェアツールは、信頼性に関するデータを簡便に与えるものではなかった。
【0005】 さらに、化学者が薬剤開発や他の製品開発研究のために、化合物の多様なライ
ブラリを形成しようとする場合にも、問題に直面する。文献やデータベースは、
いずれも、限定されたものであり、開発のための可能な経路をすべて示すことは
できなかった。通常、化合物の部分(化合物フラグメント)が、所望の活性に少
なくとも部分的に関係すると考えられる。このような知見は、たとえば、ファー
マコフォア研究から得られる。開発工程においては、対象となる化合物フラグメ
ント、あるいはその変異体を含む化合物ライブラリを作成することが必要となる
。この目的のために、コンビナトリアル・ケミストリを利用して、大きな化合物
ライブラリが作成される。コンビナトリアル・ケミストリでは、所望の化合物フ
ラグメントを備える複数の前駆物質を、一つあるいは複数の合成経路で合成する
。結果として得られる化合物ライブラリは、多様ではあるものの、化学者に周知
の反応化学、あるいは既存のデータベースを検索することで見い出すことの可能
な反応化学の範囲に限定されてしまう。文献に限定されることなく、反応化学に
関して更なるバリエーションを提供できれば、多様性をもっと高めることが可能
である。
【0006】
【発明が解決しようとする課題】
しかし、化学の研究がどんどん進んでいく状況のなかで、上述したソフトウェ
アの限界に関する問題は看過しえなくなってきている。日々、新しい合成法が開
発され、試験が繰り返されている。有機化学、構造生物学、薬剤開発に関する新
たな知見も次々と生まれている。このような進歩と歩調をあわせて化学情報を電
子的に蓄積するのは、非常に困難なこととなっている。
【0007】 そこで、化学研究が容易になるような化学研究者のためのソフトウェアツール
が求められている。
【0008】
【課題を解決するための手段およびその作用・効果】
上記の目的を達成するために、本発明は、データベースと、データベースに基
づいて、反応化学に従い系統的に分類された化学情報を蓄積・操作・調査するた
めのシステムと、を利用する改良ソフトウェアツールを提供する。このようなツ
ールにより、個々の反応に対する信頼性の評価を行い、考えられる様々な反応群
の中から望ましい反応を特定することができる。また、このようなツールを用い
ることにより、ユーザは、化学反応条件をフィルタとして用いた反応化学の検索
や、出発物質をフィルタとして用いた構造の検索が可能になる。簡単な例で言え
ば、所定のベンジルアミンは、アミド形成能力(対象となる反応化学)が他の芳
香族第一級アミンよりも優れているため、高い信頼性評価を得る。また、もっと
複雑な例では、信頼性の評価により、所定の反応条件をフィルタとして用いて、
信頼性を複数の範囲に分類することが可能である。さらに、ソフトウェアツール
を用いて、所定の前駆物質、所定の種類の前駆物質、あるいは様々な反応化学に
関する多様なライブラリを自動的に提案・作成することも可能である。所定の前
駆物質あるいは所定の種類の前駆物質に関して、フレキシブルな一連の反応化学
を自動的に作成することにより、このようなライブラリを形成することができる
。これらのソフトウェアツールは、人および/あるいは人工知能システムからの
フィードバックにより、絶えず改良・改善可能なように設計されることが望まし
い。
【0009】 本発明の一つの態様は、化学合成に関する情報を提供する化学情報システムに
関する。この化学情報システムは、(a)化学合成法によって系統的に分類され
た化学情報を蓄積したデータベースと、(b)ユーザからの検索指示に応じて、
前記化学合成法に関する情報を返信するように構成されたロジックと、を備える
ことを特徴とする。ここで、データベースには、種類ごとに分類された反応のみ
でなく、反応条件も含まれている。本発明の態様において、ロジックは、所定の
化合物に関して複数の反応化学を自動的に作成するものでもよい。たとえば、あ
る種の前駆物質から25種類の異なった反応が導かれることが示される。本発明
のシステムは、周知の反応を利用して反応生成物(ライブラリ)を自動的に作成
するものでもよい。さらに、作成された複数の反応化学を、一定の反応条件で限
定するようにしてもよい。たとえば、一連の出発物質と一定の反応条件を検索条
件として入力することもできる。本発明のロジックは、出発物質から想定可能で
あり、かつ、一定の反応条件下で様々な異なった生成物を与えるような、すべて
の種類の反応を作成する。一定の反応条件とは、たとえば、温度範囲が摂氏25
度から40度といった条件である。反応化学を作成するための検索条件の一部と
して、一定の反応条件を利用することができるので、反応条件をフィルタとして
用いて出力をフィルタリングするために、貴重な演算時間が費やされることはな
い。ただし、後述するように、反応条件をフィルタとして用いた出力のフィルタ
リング自体は、有効なツールである。
【0010】 上記のシステムに備えられるロジックは、様々な種類の装置でハードウェアお
よび/あるいはソフトウェアとして実現可能である。ロジックを検索エンジンや
決定ルールとして機能させることもできる。上記システムで用いられる化学情報
は、実験および/あるいは化学文献、特に、ピア・レビュー(peer-review )の
対象となる文献等の多様なソースから集められる。日進月歩の反応化学の成果を
充分に活用するために、上記システムが、一つあるいは複数の他の化学データベ
ースに接続され、ここから情報を入手できるように構成されることが望ましい。
【0011】 化学情報システムが、さらに、データベースから一つあるいは複数の化合物の
活性を予測するSARツールのような他のツールやフィルタを備えるようにして
もよい。このようなツールを用いることにより、構造生物学や薬剤開発など、様
々な分野でシステムが利用可能になる。
【0012】 データベースで用いられる化学合成法は、種々のソースから集められる。たと
えば、有機化学、コンビナトリアル・ケミストリ、ポリマー合成、酵素法などの
合成法を含む。データベースで用いられる化学合成法が、信頼性の評価を含むよ
うに構成することが望ましい。
【0013】 本発明の別の態様は、ユーザに化学合成情報を提供する化学情報システムの利
用法に関する。この方法は、通常、コンピュータ装置上で実現され、(a)化合
物あるいは化学合成に関する検索指示を受信するステップと、(b)前記検索指
示に応じて、化学合成法によって系統的に分類され、かつ、前記化学合成法に関
する信頼性評価を含む化学情報を蓄積したデータベースを検索するステップと、
(c)前記検索指示に対して、化学合成に関する情報を返信するステップと、を
備えることを特徴とする。信頼性評価は、たとえば、再現性、適切な処理条件の
範囲、収率等の因子に基づいて、反応をランク分けする。対象となる合成法は、
コンビナトリアル・ケミストリ、ポリマー合成、酵素反応などに利用されるもの
である。この方法は、特に、構造生物学や薬剤開発などの分野で有効である。
【0014】 一例として、ユーザからの検索指示に応じて、システムが、化学合成に関係す
る化合物のライブラリを特定するように構成することも可能である。ここで特定
されるライブラリは、実際に合成された特定のライブラリでも、各化合物すべて
が独立した信頼性の高い経路で合成されたライブラリでも、あるいは、信頼性の
置ける化学反応データに基づく仮想ライブラリでもよい。また、化学情報システ
ムを、販売事業の一部として構成することも可能である。この場合、システムは
、顧客に対して、個々の化合物、ライブラリ用の試薬セット、あるいは、化学情
報システムを用いて特定される化合物のライブラリを実際に提供することができ
る。
【0015】 本発明の態様として、前記化学情報システムの利用法が、ユーザに追加の情報
を提供するようにしてもよい。たとえば、前記方法が、化学情報システムを用い
て同定された化合物の前駆物質を特定するようにしてもよいし、あるいは、前記
方法が、化合物に関係する構造活性相関ツリーを提供するようにしてもよい。ま
た、ユーザに提供される化学合成情報に関するフィルタとして、これらの特徴を
利用することも可能である。
【0016】 前記化学情報システムの利用法が、直観的リンクによる内部データベースから
の情報のみでなく、化学情報を備える外部データベースとも自動的にクロス・リ
ファレンス可能な構成も好適である。たとえば、対象となる分子を作成する正確
な手順を、(類似性、基礎構造、出発物質対応表などの)構造特性あるいは存在
論的に定義された化学を介してリンクさせる。化学反応の特性をより明確に表現
可能な、より直観的な方式や合成化学者の主観的思考や分類にそって、自動的に
合成情報を系統分類するようにしてもよい。このような例として、出発物質の種
類による(例:第一級芳香族アミン化学反応)化学反応の系統的分類や、反応条
件の種類による(例:室温、一晩放置)化学反応の系統的分類が挙げられるが、
これらは、従来のデータベース検索方式と比較して、分子の特性を最適化する合
成スキームの直観的な選択に、はるかに有効である。このような構成の一部とし
て、前記方法が、内部データベースの反応パラメータのみでなく、外部データベ
ースの反応パラメータも特定する文献引用を返信するようにしてもよい。
【0017】 本発明のさらに別の態様は、化学合成情報を提供するエキスパート・システム
の開発方法に関する。この場合、エキスパート・システムが、単純に、データベ
ースと、前記データベースを変更し、これを検索するための関連ロジックから構
成されるものでもよい。エキスパート・システムは、ひとつあるいは複数のソー
スからのフィードバックによって進化し、改良される。この開発方法は、(a)
化学合成法によって系統的に分類された化学情報を蓄積したデータベースを提供
するステップと、(b)前記データベースを用いて、ユーザからの検索指示に対
して、化学合成情報を特定するステップと、(c)ユーザからの検索指示に対す
る回答に基づき、化学合成情報を提供する前記エキスパート・システムの適合性
を増大させるように修正された、前記エキスパート・システム内の情報あるいは
法則を特定するステップと、(d)前記ステップ(c)で特定された情報を用い
て、前記エキスパート・システムを改良するステップと、を備えることを特徴と
する。たとえば、エキスパート・システムが、化学合成およびSARツールを含
み、これらを改良するようにしてもよい。
【0018】 また、化学合成情報に関するフィードバックを行う人工知能システムを利用し
て、改良することも可能である。さらに、既にデータベースに存在する化学合成
情報を改良するのみでなく、新たな化学合成情報をデータベースに追加するよう
な構成も好適である。たとえば、前記方法によって、新たなコンビナトリアル合
成法をデータベースに追加するようにしてもよいし、あるいは、(望ましくは、
ピア・レビューされた)化学文献に記載された化学合成法をデータベースに追加
するようにしてもよい。データベース(およびエキスパート・システム)の統合
性を確保するために、新たな化学合成法を追加する前に、これらを検証および/
あるいは書式設定するようにしなければならない。
【0019】 上述した方法の少なくとも一部を実現するためのプログラムを記憶したコンピ
ュータ読み取り可能な媒体を含むコンピュータプログラム製品として、本発明を
構成することも可能である。本発明の方法のいずれも、その全部あるいは一部を
、コンピュータ読み取り可能な媒体上で提供可能なプログラムとして構成するこ
とができる。さらに、上述したように作成および/あるいは利用されるデータお
よびデータ構造の種々の組み合わせとして本発明を構成することも可能である。
【0020】
【発明の実施の形態】
【0021】 上記したものを含め、本発明の特徴や利点を、図面を参照しながら、以下で、
さらに詳細に説明する。
【0022】 緒言: 合成化学の分野は、一世紀以上にわたって、科学者たちが観測したり実験する
ことによって発展してきた。化学合成情報は、一次文献や数多くの参照テキスト
に記録されてきた。近年、特に、ここ10年で、合成化学の一分野として、コン
ビナトリアル・ケミストリが急速に発展してきた。コンビナトリアル・ケミスト
リは、ハイスループット合成(HTS)のための最も一般的で信頼性の高い方法
であると考えられる。この技術は、多くの場合、自動化されており、最終的に合
成化学に適合する産業革命にもなぞらえられてきた。この技術は、化学者が(高
容量スクリーニングHCSと関連付けられている)構造活性相関を迅速に解明す
る助けとなるものであるが、多くの理由により、充分には活用されていない。ラ
イブラリ作成のために必要となる、信頼性の高い方法に関する充分な情報が欠如
していること、また、高収率で所望の生成物が得られるように反応条件を最適化
することが困難であること、などが、その主な理由である。以下に詳述するよう
に、本発明の化学情報データベースおよびソフトウェアは、望ましくは、実験デ
ータおよび/あるいは他の情報に基づいて信頼性評価を行った状態で、合成手順
を備えている。また、本発明により、コンビナトリアル・ケミストリに関連する
合成情報のデータベースを作成し、構築し、検索し、進化させ、実際に利用する
ことが可能となる。コンビナトリアル・ケミストリの概要に関しては後述する。
【0023】 化学合成法によって系統的に分類されたデータベース: ユーザが反応化学および処理条件によって検索を行う場合の自由度を高くする
ため、本発明は、化学合成法によって系統的に分類された化学情報のデータベー
スを提供する。一般的には、これは、反応の種類ごとに分類された情報を意味す
る。また、なんら限定するものではないが、このデータベースが、関係データベ
ースであることが望ましい。本発明のデータベースにおいては、種類、反応情報
、反応に利用される特定の手順や方法、生成物の収率、信頼性評価によって化学
反応を分類し、官能基や利用可能な合成法によって化学試薬を分類する。たとえ
ば、関係データベースの表において、特定の化学反応/処理情報を一次キーある
いは外部キーとして用いる。実際、反応の種類(たとえば、還元的アミノ化反応
)と反応物質あるいは生成物の組み合わせを、データベースの表で一次キーとし
て用いることができる。また、反応の種類と関連する所定の反応条件(たとえば
、温度範囲、溶媒の種類、圧力範囲など)をデータベースのキーとして用いるこ
ともできる。個々のデータベース記録の属性あるいは項目として、最低でも、反
応の種類や反応条件が与えられる。当業者には自明のことであるが、数多くのデ
ータベース・スキーマを利用して、以下に説明する機能を実現することができる
【0024】 従来の化学データベース検索エンジンは、ユーザからの検索指示に応じて、反
応形式の例を提供するものであった。たとえば、ユーザが一般的に(たとえば、
構造あるいは基本構造によって)エステル化反応を検索する場合、従来のシステ
ムは、特定の順序やランク付けをすることなく、文献に基づくエステル化反応の
リストを提供する。より限定した検索条件を入力することにより、より関係の深
い例、そして、望ましくは、妥当な程度に短くなったリストが提供されることに
なる。ただし、構造上の条件を厳しくして検索したとしても、最も有用な情報を
得られるかどうかはわからなかった。
【0025】 一例として、ユーザが従来のデータベースに下記の化学式の検索を指示したと
考えてみよう。この検索では、基本構造を用いる。基本構造とは、ユーザの検索
対象となる主要構造モチーフを定義するフラグメントである。
【化1】 この例でいえば、検索により、生成物を調製するためにアミンフラグメントに加
えられるアルデヒドフラグメントが特定される。この場合の化学反応は、還元的
アミノ化反応である。上述したように、従来のデータベースでは、この種の検索
指示に対して、基本構造フラグメントに一致するデータベース中のすべての反応
(場合によっては、数百以上にのぼる)が提示される。もっと短いリストが欲し
い場合には、ユーザは、構造をより詳細に定義して、制限した検索を行わなけれ
ばならない。ユーザは、構造条件を制限することによって、もっと処理しやすい
反応リストを入手することができる。ただし、このリストは、データベースにロ
ードされた文献に記載された反応のリストにすぎず、したがって、潜在的に価値
のある反応データを見逃してしまう可能性がある。
【0026】 種類ごとに分類された化学反応のデータベースや官能基および利用可能な合成
法に従って分類された化学試薬のデータベースを利用することにより、本発明は
、文献に記載されている反応例のリストを提供するのみでなく、先行文献に基づ
いて反応の例を作成することも可能である。これは、ユーザに直観的でない情報
を提供するものであり、たとえ、ユーザがその分野に経験のある化学者だったと
しても考慮しなかったであろうバリエーション(多様性)の情報を提供するもの
である。
【0027】 多様性の最大化: 化学合成の自動化の急速な進歩は、製薬研究に大きな影響を与えている。自動
化を生体外での(in vitro)テストと組み合わせることによって高容量スクリー
ニングが可能になる。これにより、もっと大規模な化学ライブラリをテストする
必要が生じ、さらに、より化学的に多様性のあるライブラリの作成が必要となる
。化合物構造の多様性は、合成プロトコルを多様化することにより実現される。
本発明は、多様な合成プロトコルの作成を容易にするものである。
【0028】 本発明のデータベースの設計においては、文献に記載されるような完全な合成
経路(反応スキーマとも称される)は、経路を構成する個々の反応に分けられる
。個々の反応は、データベース中に別個に格納されるか、あるいは、データベー
ス中で別個の指標をつけられる。これに対して、従来の化学データベースには、
文献に記載された完全な合成経路のみが含まれる。本発明は、化学反応をもっと
広範囲に提示するものであり、本発明のデータベースは、個々の化学反応ステッ
プの混合と適合を容易にし、新たな合成経路の開発につなげるものである。従っ
て、本発明のロジックは、先行文献からの新規な合成スキームの作成を容易にす
るものである。
【0029】 図1Aのブロック図101は、本発明のロジックが、先行文献に基づいて、新
規な反応シーケンスを作成する処理を示す。反応シーケンス103および105
は、文献に記載された合成手順の2つの例を示すものであり、本発明のデータベ
ースでは、それぞれ、別個の反応ステップにより特徴づけられる。各ステップで
は、所定の条件が設定され、そのステップが実行される。シーケンス103は、
ステップ107ないし115から成り、生成物117が製造される。同様に、シ
ーケンス105は、ステップ119ないし129から成り、生成物131が製造
される。従来のデータベースを用いた場合、適切な検索指示がなされれば、反応
シーケンス103および105の個々のステップ(反応)がユーザに提示される
。しかし、多くの場合、反応シーケンスの個々のステップが提示されるというよ
りは、反応物質、生成物、および、2以上のステップおよび関連する処理条件の
説明が、矢印と共に示されるにすぎない。一方、本発明のデータベースにおいて
は、シーケンスは個々のステップによって特徴づけられ、各ステップは、反応の
種類によって分類されるため、本発明のロジックは、このステップを参照して、
周知のシーケンスを外挿して、新規なシーケンスを作成することができる。たと
えば、点線の矢印で示すように、本発明のロジックにより、ステップ107,1
23,112,127から成る新規なシーケンス133が作成される。この新し
いシーケンスは、「混合・適合」アルゴリズムにより作成され、新規生成物13
5を製造する。文献によって周知となっている何千という化学変化から、数多く
の新規なシーケンスを作成することが可能である。また、詳細に後述するように
、所定の処理条件、信頼性の評価、薬物動態学的パラメータなどをフィルタとし
て用いることにより、化学情報の確度をあげることができる。
【0030】 本発明は、また、パラレル合成にも好適に用いられ、所定種類の試薬に関する
検索指示に応じて、数多くの分岐合成プロトコルを特定することができる。図1
Bは、合成スキーム127のシステムを示す。本発明のロジックにより、自動的
に、種々の反応スキームがユーザに提示される。すなわち、多様性を最大にする
ように、数多くの反応シーケンスが提示される。たとえば、一般的なアルデヒド
138を反応出発物として入力したとする。本発明のロジックは、138が反応
して生成物を与えるのに適した合成経路を作成する。一例として、アルデヒド1
38は、アミン139と反応して、イミン141を生成する。これは、アルデヒ
ド138からの反応経路の一例にすぎない。アルデヒド138を出発物質として
、いくつもの反応が進み、様々な生成物149が製造される。これらの生成物(
149および141)の各々は、アルデヒド138から一段階の反応で製造され
る。これらの化合物をさらに反応させて、別の生成物を製造することも可能であ
る。たとえば、イミン生成物141を、イミンに適合した化学反応143の出発
物質として用いることもできる。さらに、イミン141を還元してアミン145
を生成することも可能である。アミン145は、アルデヒド138から二段階の
反応を経て得られる生成物である。さらに、アミン145を反応させて、アミン
に適合した化学反応147を実施することもできる。このように直線的および分
岐して伸びる合成プロトコルによって、アルデヒド138に由来する、大きく多
様な化合物プールが作成される。また、アルデヒド138は、アルデヒド類を示
すものであり、その類に含まれる各化合物が各反応経路に従って個別の生成物を
製造するため、さらに多様性が増加する。さらに、138から得られる生成物お
よび138と反応する反応物質も、すべて、対応する化合物類を示すものである
【0031】 図示されるように、いずれの種類の反応物質からも多くの分岐が可能である。
また、特に示してはいないが、図示される反応から生成される、新規で化学的に
多様な中間物質および生成物自体を、合成プロトコルにおいて、アルデヒド13
8(および、適当な経路に沿った中間物質)との反応の出発物質として用いるこ
とにより、さらに多様性を増大させることが可能である。たとえば、138から
合成されるアミン145をアルデヒド138と反応させることができる。これは
、フィードバック多様性を与えるものである。
【0032】 さらに、上記の合成プロトコルに適した反応条件を変化させることにより、多
様性を増大させることができる。たとえば、ある反応では、反応時間や反応温度
によって、異なった生成物が支配的となる。したがって、上述したように個々の
ステップで反応を特徴づけることにより、本発明のロジックで、反応物、中間物
質、および生成物を合成ステップならびに反応条件と混合・適合させる場合の多
様性を最大にすることが可能となる。また、信頼性の評価を行うことにより、本
発明の方法に付加価値を与えることができ、ユーザは、所定のシーケンスが有効
である可能性に関するデータを得られる。
【0033】 処理条件および活性フィルタ: 前述したように、既存の化学ソフトウェアを使って、反応(処理)条件の範囲
を限定することは容易ではない。合成装置の限界や合成で用いる試薬や生成物の
不安定性に起因した理由で反応条件を限定しなければならない場合、本発明の処
理条件フィルタは、ユーザ独自の処理制限条件に応じた化学情報を提供すること
が可能である。これにより、不必要な方法を研究する手間を省くことができ、時
間と貴重な資源が節約できる。さらに、反応条件フィルタを反応の種類で分類さ
れた反応データと共に用いることによって、ユーザは、特にパラレル合成装置に
対する制限に基づいた新しいライブラリを設計可能である。たとえば、室温かつ
不活性雰囲気の不在下で反応する装置がある場合、これらを反応制約条件として
入力することができる。さらに、反応物質や生成物に関する制約を入力すること
もできる。たとえば、反応出発物質となる試薬は、第二級アミンとするなどであ
る。化学者(ユーザ)がこれらの制約条件を入力することにより、室温で、かつ
、不活性雰囲気の不在下で進む第二級アミンの反応のリストが(文献に由来する
もの、並びに、ロジックから作成されたものを含めて)提供される。
【0034】 また、反応をその種類ごとに分類することが可能なため、同じ種類の反応を見
つけるために、ユーザが手作業でリストを厳密に調べる必要性はない。すなわち
、本発明で提供されるリストあるいはリストから選択されるサブセットに含まれ
る反応を用いて合成された化合物から成る化合物ライブラリが作成される。また
、データベースに含まれる反応は種類ごとに分類されているため、その反応を構
成する反応物質や生成物も種類ごとにタグがつけられている。これは、アルデヒ
ド、ケトン、アミンなど、所定の種類に属する各試薬に、データベースで標識(
タグ)がつけられていることを意味する。ユーザは、反応リストに含まれる試薬
タグを集めて、所定の種類の試薬を含むリストを作成することができる。このよ
うに構成することにより、試薬を、ライブラリ合成でより簡便に利用し、種類ご
とに保存することができる。たとえば、酸塩化物には揮発性のものも多く、冷却
保存や換気が必要となる。また、もっと害の少ない試薬は、より緩和された保存
プロトコルに従って、保存することができる。
【0035】 本発明のソフトウェアツールは、化合物が所定のレベルの活性を備えることを
フィルタとして用いることもできる。このようなツールの例として、ファーマコ
フォア解析およびSARツールが挙げられる。これらのツールを用いることによ
り、たとえば、標的との結合に基づく効果を予測することが可能となる。また、
他のツールを用いて、ADMET(吸収、分配、代謝、排泄、毒性)特性を予測
することもできる。一つのソフトウェアツールで提示された化合物を、構造から
活性を予測する一つあるいは複数のフィルタツールを用いて解析する。提示され
た化合物の予想活性がフィルタで指定された活性閾値に合致しない場合には、こ
の化合物を却下するようにしてもよいし、あるいは、システムによる優先順位を
低くするようにしてもよい。
【0036】 ADMET関連フィルタでは、たとえば、標準的な経験則に応じて、可能性の
ある化合物を選択するようにしてもよい。製薬会社は、通常、経口投与可能な薬
剤を求めている。これは、経口投与が一般に最も受け入れられやすい形態であり
、経口投与可能な薬剤は、「錠剤」の形に製造し、投与することが可能だからで
ある。いずれの化合物も、経口投与可能な薬剤候補となりうるかどうかを考慮す
る前に、薬物動態学的特徴を測定する必要がある。利用可能な薬理学的データか
ら、構造パラメータの関数として化合物の生体利用効率を求める法則を公式化す
ることができる。この法則は、「リピンスキの5の法則」として知られており、
内臓壁を通した化合物の体内への吸収を、化合物の分子量、ヘテロ原子の数、親
油性等と一般に相関させるものである。この法則およびその他の構造予測に関連
する薬理学的傾向をユーザは追加フィルタとして利用可能であり、化合物あるい
は化合物ライブラリの設計に別の価値を与えることができる。この構成により、
ユーザに信頼性データと関連づけた合成データを与えるのみでなく、信頼性の高
い反応化学をフィルタとして、薬理学的に適切な化合物のみを作成させることが
できる。これは、貴重な化学および薬理学的資源の節約につながる。
【0037】 信頼性評価: 本発明の一態様として、化学反応や反応物質の信頼性評価を行うことができる
。既知の信頼できる化学反応データ、ピア・レビューされた化学文献、進行中の
信頼性試験に基づいて、化学反応および反応物質と、関連する信頼性データとの
対応表を作成する。これらのデータは、信頼性評価、すなわち、再現性、適切な
処理条件の範囲、収率等に基づく反応のランク付けの基礎となる。
【0038】 前述したように、本発明は、先行文献に基づいて反応例を作成することができ
る。このアルゴリズムに信頼性データを組み込むことにより、所定の反応化学が
有効な信頼限界をユーザに提供することができる。たとえば、許容可能な所望の
信頼性レベルをフィルタとして入力するようにしてもよい。この場合、出力され
るリストに含まれる反応は、許容可能な信頼性評価を満たす反応のみになる。す
べての反応を、反応の種類のみでなく、ソースによっても、すなわち、文献に記
載された反応例か本発明のロジックにより作成された反応であるかを、分類する
ようにしてもよい。ロジックにより作成された反応データには、外挿されたエラ
ー確率因子を考慮した信頼性評価が含まれている。
【0039】 信頼性評価は、ユーザにとって、化学反応全体を記述する指標として重要なだ
けでなく、所定の反応出発試薬を用いる場合にユーザが利用可能な反応の種類を
特定する予測指標としても重要である。たとえば、最初の検索指示に応じて、反
応を実際に検索あるいは作成することなく、複数種類の反応を確実に行うことの
できる所定の前駆物質あるいは所定種類の前駆物質を提示する。ユーザは、予測
情報を利用して、自分のライブラリ設計プランにより適切なもの、たとえば、そ
の時点で入手可能だと考えられる試薬のみを提示するように、次の検索指示を調
整する。
【0040】 化学データベースおよびエキスパート・システムを進化させるためのフィードバ
ックシステム: 本発明の別の態様として、エキスパート・システムと人工知能を利用すること
ができる。人工知能のルーツは、コンピュータ・インテリジェンス用の有名なチ
ューリング・テスト(Turingテスト)に遡ることができる。基本的な必要条件は
、コンピュータが思考できるかどうかを問うのではなく、一連の質問に対して、
質問者がタイプで打った答えを作成したのが人間であるのかコンピュータである
のかを判定できるかどうかという、もっとテストしやすい問いである。この分野
における初期の研究の成果は、最初は1963年にマグローヒル出版社から出版
された古典的な本「コンピュータと思考」("Computer and Thought" AAAI Pres
s Edition, 1995, Menlo Park )に記載されている。この引例全体を、本明細書
中において、参照して、組み込む。
【0041】 皮肉なことに、AIを用いた最初の応用例(エキスパート・システム)の一つ
は、質量分析データに基づいて分子構造の同定を支援するデンドラル・プロジェ
クトであった。デンドラル・プロジェクトでは、フェイゲンバウム、レーダーバ
ーグ、ブキャナン、およびジェラッシの間で共同研究が始められ、化学構造の高
水準な解明が行われた。分子式、分光学的データ、有機化学者のコード化された
発見的知識を与えると、デンドラルの対話型プログラムが、正しい構造を検索す
る過程で、可能な分子の立体配置を調査する。このプロジェクトは、仮説形成と
評価の基本的なメカニズムの一部を解明する手助けとなった。プロジェクトの結
果、これらのシステムでは、知識が推論と同じくらい重要であることが示された
。いずれにしても、今日では、成功の度合いこそ様々であるが、人工知能を利用
したエキスパート・システムの作成は頻繁に行われている。
【0042】 エキスパート・システムは、限られた分野で、人間の専門家(エキスパート)
の意志決定過程を再現する試みである。これは、知識ベース、決定ルール、推論
機構という、3つの構成要素から成っている。上述したデータベースおよび知識
ベースは、本発明のエキスパート・システムで利用可能である。開発途上の技術
のいずれにも言えることであるが、適切な問題なくしては、その技術は学問的な
試みにとどまる。本当の有用性は、その技術(本発明では、人工知能とコンビナ
トリアル・ケミストリの発展型技術)が所定の問題に対してどう適用されるかで
示される。
【0043】 本発明のデータベースに対するフィードバックを目的とした最適化に利用可能
な先進技術の例として、ウェブ産業技術、マルチエージェント・チーム、ヒト/
コンピュータ・インターフェース、およびフレキシブルな仮説空間における帰納
的学習が挙げられる。MITのCBCLおよびAI研究所が共同開催した「脳と
機械セミナー2000年春」2月23日トム・ミッチェル「標識されていないデ
ータからの監視学習」(Tom Mitchell "Supervised Learning from Unlabeled D
ata")、Kaminka, G.A., Tambe, M. J. Artificial Intelligence 2000, 12, 1
05-147、「情報システムにおけるヒューマン ・ファクタ:ある組織的展望」("
Human Factors in Information Systems: An Organizational Perspective")J
.M.カーリー編、ニュージャージー州ノーウッド、アブレックス出版社199
1年、「帰納的バイアス学習のモデル」("A Model of Inductive Bias Learnin
g")J. Artificial Intelligence 2000, 12, 149-198参照。化学データベースの
推論機構にこのような先進技術を利用する場合、少なくとも最初のうちは、人に
よる検査や調整を必要とする。これらの引例は、それぞれ、本明細書中において
、参照し、組み込む。
【0044】 本発明のシステムのいくつかは、(最も一般的で信頼性の高い合成法である)
コンビナトリアル・ケミストリから始められた、科学者チームと人工知能の能力
とを用いて、情報データベースを成長させ、情報データベースを検索するもので
ある。これらのシステムは、両方のグループの学習を手助けするフィードバック
・ループを採用している。各ステップの関連度を維持するように、所定の仕事に
対してどちらがより適しているかが明らかになるまで、人間とコンピュータプロ
グラムとが情報の評価と補正を行う。この場合、両方のチームは、情報を交換す
ることにより、協力し合い、かつ、競争する。各段階で、情報システムが実用的
であれば実際の役に立つ(たとえば、ライブラリや個々の化合物の合成)。
【0045】 システムを拡張する鍵となるのは、システムをオープンにして外部のグループ
と相互利用可能にすることである。データベースの開発、検索エンジンの開発、
(AIおよび化学の両方に関する)基礎技術の開発、および、他のデータベース
との交流等に、このアプローチを利用することができる。このアプローチの典型
例がインターネットである。こうすれば、内容、基礎研究、ソフトウェア・アー
キテクチャに、第三者が寄与することができる。ソフトウェア・アーキテクチャ
には、提案と付加的寄与のフィルタが含まれる。
【0046】 書物は、固定的なデータベースである。書物には、情報が含まれているが、い
ったん印刷された後には、その内部構造を進化させることはできない。中間的な
レベルのものとしては、ソフトウェア・データベースが挙げられる。ソフトウェ
ア・データベースは、複数の選択可能な選択肢や質問に対する回答を提供する。
本発明の、より先進的なエキスパート・システムは、フィードバック・ループに
より継続的に進化を続ける。たとえば、(以下に参照して組み込まれる)エレク
トロニック・コンビナトリアル・インデックス由来の化学情報から元々構成され
ていたデータベースを進化させて、より大きなものにすることができる。コンビ
ナトリアル・ケミストリは、合成のサブセットであり、合成は、薬剤開発の一断
面であり、薬剤開発は、化学および生物学の一断面である。関係アーキテクチャ
は、多段階の手順・処理(情報)と出力(サービス)の両方を備えている。胎児
の脳が発達していくように、使えば使うほど、また、外部との接続が増えれば増
えるほど、内部の接続が強固なものになっていく。
【0047】 進化の階層において、中心位置は、一連の信頼性の高いハイスループット・コ
ンビナトリアル合成法で占められている。これは、すべての合成法とコンビナト
リアル合成との関係に類似している。前述したように、コンビナトリアル合成は
、広範囲の官能基に対して対応可能という特質を備えるため、最も一般的で、便
利で、且つ好適な合成法である。コンビナトリアル法に関する文献にあるように
、中心位置は時間と共に成長していくが、化学合成の成熟した分野にも触角を伸
ばしていくことにより、データベースの真の成長が成し遂げられる。
【0048】 第二の位置は、最も広く用いられている化学文献の中から慎重に選択されたも
のが占めている。主要文献に記載されている手順や処理が、もっと一般的なハイ
スループット合成法との関係とともに、第二位置に含まれている。なんら限定す
るものではないが、以下に、第二サークルに適当な参照文献の例を挙げる。「マ
ーチの最新有機化学:反応、メカニズム、および構造」第五版("March's Advan
ced Organic Chemistry: Reactions, Mechanisms, and Structure")Smith, M.B
., March, J.、ジョン・ワイリー&サンズ社、ニューヨーク、2001年、「有
機合成における保護基」("Protective Groups in Organic Synthesis")Wuts,
P.G.M., Greene, T.W.、ジョン・ワイリー&サンズ社、ニューヨーク、1999
年、「ペプチド合成法」("The Practice of Peptide Synthesis")Bodanszky,
M., Bodanszky, A.、シュプリンガー出版、ハイデルベルグ、1984年、「有
機合成試薬辞典」("Encyclopedia of Reagents for Organic Synthesis")L.
A.パケット編、ジョン・ワイリー&サンズ社、英国チチェスター、1995年
。人間とコンピュータプログラムの両方が簡単にアクセス可能なように、また、
著作権による規制を避けるためにも、文献に記載されている事実や情報は、すべ
て、共通の簡単な書式に再フォーマットされる。なんら限定されるものではない
が、以下の文献も第二サークルに含めてもよい。「有機合成」("Organic Synth
eses")J.P.フリーマン編、ジョン・ワイリー&サンズ社、「有機反応」("
Organic Reactions")L.A.パケット編、ジョン・ワイリー&サンズ社、「複
素環式化学概論」(Comprehensive Heterocyclic Chemistry")Katritzky, A.R.
、ペルガモン出版。本段落に記載した文献は、それぞれ、全体として、本明細書
中に引用され、組み込まれる。
【0049】 第三サークルには、最初の二つのサークルに含まれていた主要参照文献を含む
ようにしてもよい。これにより、場合によっては、文献の鎖が形成される。また
、第四サークルには、定期刊行物中の化学文献の一部あるいはすべてを系統的に
再構成したものを含むようにしてもよい。共通のフォーマットで情報を再構成す
れば、エンドユーザにはとても便利である。これは、一見すると、ケミカル・ア
ブストラクトによるフォーマッティングに似ているようであるが、手順・処理に
重点を置いている点、および/あるいは、手順・処理をサービスに関連づけてい
る点、さらに、手順・処理を進化するデータベースの一部としている点で異なっ
ている。共通フォーマットで構造情報および反応情報を格納することにより、化
学者もAIプログラムも、システムを改善して、関係を作り出す処理に慣れるこ
とができる。人間の専門家が新しい関係を見つけるたびに、コンピュータプログ
ラムにそれが通知され、また、逆の場合も同様の通知が行われる。
【0050】 内部サークルの情報量があるレベル以上に増えなくなった時点で、外部データ
ベースを導入するようにしてもよい。好適な検索エージェントをプロジェクトの
初期段階で用いて、他のデータベースを検索するようにしてもよいし、その逆で
もよい。この場合、実用性の鍵となるのは、データベースの構成と検索エンジン
の簡便さ(と非常に高い自由度)である。さらに、システムが検索エージェント
を備え、情報を検索するようにしてもよい。化学データベースの掘り起こしに関
しては、人工知能プログラムによる誘導と人間の専門家による誘導の両方が行わ
れる。
【0051】 本明細書に記載したデータベースの構成、表示、および使用法は、関連する知
識分野にも関連しない知識分野にも適用可能である。
【0052】 補助的特性: 信頼性評価と共に合成手順等の情報を提供する以外に、本発明の化学情報ツー
ルは、様々なサービスを含めた種々の補助的特性も有している。一回クリックす
るだけで、「リスクを分かち合う」可能性からも通関手続きからも開放され、す
べての化学情報を見ることができる。サービスとしては、なんら限定するもので
はないが、個々の化合物、小規模ライブラリ(10ないし100のブックエンド
・ライブラリ)や大規模ライブラリ(1000ないし100,000)の提供が
挙げられる。
【0053】 ツールの備える全般的多様性や標的ライブラリを用いて、実際のライブラリや
仮想ライブラリの第一世代を提供することができる。ライブラリには、後続ライ
ブラリを記述するSARツリー用のソフトウェアを搭載するようにしてもよい。
また、他のソフトウェアを用いて、既知構造の情報に基づいて後続ライブラリを
記述するSARツリーにバイアスを掛けることも可能である。また、同一の反応
に関する後続ライブラリ(科学的にも物流的にもこれが最も簡単なアプローチで
はあるが)の代わりに、ソフトウェア・プログラムおよび/あるいは人間が、信
頼性評価を行った広範囲な化学反応の中から、多様な、あるいは、標的となる、
ライブラリとそのサービスのセットを選択するようにしてもよい。
【0054】 たとえば、平均して2000個の化合物(2Dライブラリ)および6000個
の化合物(3Dライブラリ)から成る各セットに、SARに基づく第二世代ライ
ブラリ用のオプション、あるいは、顧客がSARを隠すことを希望する場合には
、(分割・混合フォーマット等を用いて)完全に断片化したライブラリを備える
ようにしてもよい。人間とAIチームは、協力し、かつ、競争しながら、反応条
件最適化およびSAR最適化の問題を解決することができる。
【0055】 情報パッケージを、クロスリファレンス・ネットワークに接続して、合成に関
係する化合物のセットを提示するようにしてもよい。たとえば、マーチの有機化
学の書物の一部から、所定の反応条件を提示する一連の文献を導き出すようにし
てもよい。コンピュータも人間も「主要文献」のパターンを見つけ出すことがで
きる。上述したように、このパターンが、信頼性の評価と関連するものでもよい
。出力されるデータは、望ましくは、ベイルステイン等、既存の化学データベー
スにより提供される文献、言葉、スキームを含む。さらに、手順ならびに、(リ
スクを分かち合う可能性につながる)顧客向けに作成され配信された文献に、あ
る化合物が記載されている可能性等に関する追加データも出力可能である。顧客
は、情報のみの利用、合成サービスのみの利用、2つを組み合わせての利用を自
由に選択できる。
【0056】 情報およびデータベースサービスを拡張して、分析データ(理論データおよび
/あるいは実験データ)、分子に関する構造データ、もっと複雑な問題に関する
生体構造データ、化学薬品発注情報、ウェブ提供情報などを含むようにしてもよ
い。これらは、すべて、薬剤開発の関連分野である。
【0057】 外部データを活用するオープンなシステムを実用化した例も数多くある。化学
の分野では、最近の例として、(ノースカロライナ州リサーチトライアングルパ
ークの)SciQuest、(カリフォルニア州サンディエゴの)ChemNavigator 、(マ
サチューセッツ州ケンブリッジの)Cambridge Softのウェブポータルが挙げられ
る。歴史的には、アルドリッチ・ケミカル社のカタログがあり、これには、顧客
にとってはどちらでも同じことであるが、他社から購入し瓶詰めしなおした化学
薬品や自社で製造した化学薬品のリストが記載されている。適度な範囲として、
本発明が提供可能なサービスは、顧客の要求範囲を考慮して、適当な解決に向け
て、合成情報の世界的データベースを検索するものである。
【0058】 情報をサービスと関連づける別の方法として、文献に記載されている構造基準
に基づいて(C.LipinskiらおよびM.Murckoら参照)、自由度の高い前駆物質のセ
ットを構成するようにしてもよい。ライブラリ作成(上述したような個々のライ
ブラリあるいはライブラリ群の両方)のために、一定の、かつ、比類なく高い自
由度をあたえるように入力データ変数を配列することにより、このような構造基
準を構成することが可能である。たとえば、前駆物質を、業界標準である96穴
マイクロタイタープレート等のグリッドの行と列に配列することも可能であるし
、バーコード化することも可能である。内部利用あるいは外部利用に先立ち、溶
解度データ、信頼性評価(+/−あるいは1−10)、芳香族/脂肪族、多様/
標的、疎水性/親水性、アルファ/ベータ置換、o−、m−、p−置換、環の大
きさ、二環式/溶融等の補足情報を前駆物質のセットに追加するようにしてもよ
い。顧客は、ソフトウェアツールを用いて選択を行うこともできるし、自前で選
択をすることもできる。前駆物質のサブセットを用いて自社の研究所(一つの場
所)で反応化学をテストした後、適当な前駆物質の入力データを慎重に予備配列
および予備選択することにより、サービス・プロバイダに全ライブラリ(第二の
場所)を作成させることも可能である。このような前駆物質セットの予備配列に
より、新しい反応化学に対する前駆物質の適合性に関して、「リスク分担の」可
能性の調査を迅速かつ容易に実施することができる。
【0059】 合成情報と構造的に関係する前駆物質のセットとを予備的に分類することによ
り、さらに自由度の高い化学サービスを提供することが可能になる。これには、
個々の化合物の合成から、小規模なセット(ブックエンド)、大規模なセット(
全ライブラリ)までが含まれる。理にかなうように配列された自由度の高い化学
情報を備える大規模なデータベースあるいはエキスパート・システムがあれば、
非常に広範囲なサービスの提供が可能となる。他の関連分野あるいは非関連分野
に対しても、この指針は適用可能である。
【0060】 ソフトウェア/ハードウェア: 本発明の実施態様では、一つないし複数のコンピュータシステムに格納される
データ、あるいは、コンピュータシステムを介して送信されるデータの様々な処
理が行われる。また、本発明の別の実施態様は、このような処理を実行する装置
に関するものである。この装置は、必要な目的のために特別に構成されるもので
もよいし、あるいは、コンピュータに格納されたコンピュータプログラムおよび
/あるいはデータ構造により選択的に駆動され、再構成される汎用コンピュータ
でもよい。本発明の処理は、いかなる特定のコンピュータにも、あるいは、それ
以外の装置にも特有のものではない。本明細書の技術に従って書かれたプログラ
ムと共に、種々の汎用装置を利用するようにしてもよいし、あるいは、所望の処
理工程を実現するために専用装置を構築するようにすれば、さらに便利である。
このような様々な装置の構造例に関しては、以下に詳述する。
【0061】 さらに、本発明の別の実施態様は、コンピュータに種々の処理を実現させるた
めのプログラム命令および/あるいは(データ構造を含む)データを備える、コ
ンピュータ読み取り可能な媒体やコンピュータプログラム製品に関するものであ
る。なんら限定するものではないが、コンピュータ読み取り可能な媒体の例とし
ては、ハードディスク、フレキシブルディスク、磁気テープ等の磁気媒体、CD
−ROMディスク等の光学媒体、光磁気媒体、半導体記憶装置、リード・オンリ
ー・メモリ(ROM)やランダム・アクセス・メモリ(RAM)等、プログラム
命令を格納し、実行するように特別に構成されたハードウェア装置が挙げられる
。また、本発明のデータおよびプログラム命令を、搬送波や他の輸送媒体に具現
化するものでもよい。プログラム命令は、コンパイラによって作成されるような
マシンコードでもよいし、インタープリタを利用してコンピュータで実行可能な
、高レベルのコードを含むファイルでもよい。
【0062】 図2に、適切に構成・設計された場合に、本発明の画像解析装置として働く典
型的なコンピュータシステムの概略ブロック図を示す。コンピュータシステム2
00は、任意の数のプロセッサ202(中央処理装置、CPUとも称する)と、
プロセッサに接続される、一次記憶装置206(典型的にはランダム・アクセス
・メモリ、RAM)と一次記憶装置204(典型的にはリード・オンリー・メモ
リ、ROM)を含む記憶装置と、を備える。CPU202は、マイクロコントロ
ーラでも、マイクロプロセッサでもよく、(CPLDやFPGAのような)プロ
グラム可能な装置でも、ゲートアレイASICや汎用マイクロプロセッサのよう
なプログラム不能な装置でもよい。当業者に周知のように、一次記憶装置204
は、CPUにデータおよび命令を単方向に送信可能であり、一方、一次記憶装置
206は、通常、データおよび命令を双方向に送信可能である。これらの一次記
憶装置が、上述したような、任意の適当なコンピュータ読み取り可能な媒体を備
えるようにしてもよい。大容量記憶装置208もCPU202に双方向に接続さ
れ、データ記憶容量を増大させ、また、上述したような、任意のコンピュータ読
み取り可能な媒体を備えるようにしてもよい。大容量記憶装置208には、プロ
グラム、データ等が格納され、一般的には、ハードディスクをはじめとする二次
記憶媒体に対応する。必要に応じて、大容量記憶装置208内部に保持される情
報を、仮想記憶として、一次記憶媒体206の一部として標準的な方法で組み込
むことができる。さらに、CD−ROM214のような特定の大容量記憶装置は
、データをCPUに単方向に転送可能である。
【0063】 CPU202は、さらに、一つあるいは複数の入力/出力装置に接続されたイ
ンターフェース210に連結される。入力/出力装置の例としては、ビデオモニ
タ、トラックボール、マウス、キーボード、マイクロフォン、タッチセンシティ
ブ・ディスプレイ、トランスデューサ・カードリーダ、磁気あるいは紙テープリ
ーダ、タブレット、スタイラス、音声あるいは手書き文字認識装置、他のコンピ
ュータ等、その他周知の入力装置が挙げられる。さらに、CPU202が、デー
タベースやコンピュータ等の外部装置に接続されるようにしてもよいし、図に2
12で示される外部接続を用いて、電気通信ネットワークに接続されるようにし
てもよい。このように接続することにより、CPUは、ネットワークから情報を
入力することができ、さらに、本明細書に記載される処理ステップを実行する際
には、ネットワークに情報を出力することも可能である。
【0064】 コンピュータシステム200を、本明細書に記載したように構成される化学情
報用のデータベースならびにデータベース管理システムとして構築するようにし
てもよい。化学情報は、種々のソースから得られる。リモート化学情報ソースか
らは、インターフェース212を介して、システム200に情報が提供される。
【0065】 装置200においては、一次記憶装置206あるいは大容量記憶装置208の
ような記憶装置に化学情報が格納される。さらに、データを解析し、提示するた
めの種々のルーチンおよび/あるいはプログラムを記憶装置が格納するようにし
てもよい。このようなプログラム/ルーチンには、データベース管理システムや
、新しい化学情報をデータベースに追加するためのプログラムや、データベース
の性能を改良するためのツール等が含まれる。
【0066】 コンビナトリアル・ケミストリの概要: 以下の説明は、一般に広く用いられている、コンビナトリアル・ケミストリに
関するテキストである「コンビナトリアル・インデックス」("The Combinatori
al Index")Bunin, B.A.、1998年、アカデミック出版の最初のほうの章の記
載に基づくものである。このテキスト全体を、本明細書において引用し、組み込
む。
【0067】 非生物学的オリゴマーおよび非重合体性有機化合物(「小分子」)のライブラ
リの合成およびスクリーニングは、集中的な研究の対象となっている。現在、固
相合成を利用して、多くのコンビナトリアル・ライブラリが構築されている。担
体上で進む反応の多くは、高収率であるが、コンビナトリアル・ライブラリの構
築に利用するのに充分有効で一般的なものにするためには、多くの場合、大幅な
最適化が必要となる。置換、環化、濃縮、スズキ式カップリング等、信頼性の高
い反応方法は、様々な状況で利用可能であるため、特に本発明に有用である。
【0068】 溶液中で利用可能な技術と比較すれば、固体上で利用可能な分析および精製技
術は限られたものであるため、固体担体上で有機化学反応を行うのは、目隠しを
して作業するようなものである。これが、溶液中でのライブラリ構築が好まれる
理由の一つである。担体上で所定の反応条件を評価する最も直接的な方法は、担
体上で原料を分解して、得られた生成物を厳密に特徴づける方法である。しかし
、残念ながら、中間物質が開裂条件に対して不安定な場合も多いので、この方法
がいつも可能なわけではない。さらに、特に多段階シーケンスでは、多くの場合
、所定の反応が有効であったか否かを判定するのに、もっと速い方法が存在する
(FMOC評価)。
【0069】 溶液ライブラリに関する報告は、増え続けている。ライブラリが、担体上で作
成されるか、溶液内で作成されるかは、多くの場合、生じた化学反応の種類によ
り決定される(あるいは、逆に言えば、ライブラリが担体上で作成されるか、溶
液内で作成されるかによって、生じる化学反応の種類が決定される)。固相抽出
や液相抽出のようなハイスループットな精製技術が、スクリーニングに有用な溶
液ライブラリの作成に重要な役割を果たすことも多い。溶液ライブラリを構築す
る場合の課題(たとえば、溶解度や精製度)は、固相でのコンビナトリアル合成
に伴う課題(たとえば、反応の進行やスケールアップのモニタ)とは、まったく
異なっている。ライブラリ作成のための戦略は液相と固相で多くの相違があるが
、いずれの場合にも、合成の際に問題と成るのは、一般的で、かつ、高い収率を
得られる反応条件を見つけることである。
【0070】 コンビナトリアル合成の目立った特徴は、比較的少数のビルディング・ブロッ
クから大きな多様性が生み出されることである。3種類のビルディング・ブロッ
クA、B、Cから、固体担体上で形成される簡単なコンビナトリアル・ライブラ
リを例としてみてみよう。各ビルディング・ブロックがたった10個の誘導体し
か持たない場合でも、1000個の三量体から成るライブラリが形成される。各
ビルディング・ブロックの誘導体の数が100個になれば、誘導される化合物の
数は、1,000,000個になる。このように膨大な数の化合物に短時間でア
クセスできるようになると、次に、いずれの化合物を製造するのが最も有効か、
そして、作成された膨大な情報のトラックをどのように維持するか、というよう
な問題が生じる。
【0071】 現在、生体外(in vitro)でコンビナトリアル・ライブラリを作成するための
アプローチは数多く存在する。化合物は、空間的に分離された形態で合成するこ
ともできるし、混合物のプールとして合成することもできる。混合物プールの中
から活性のある化合物を特定する方法も、数多く提案されている。当然のことな
がら、化合物を空間的に分離した形態で合成した場合には、活性のある化合物を
特定することは容易である。
【0072】 ライブラリ解析のための最も単純なアプローチは、異なった化合物(あるいは
他の変数)をパラレルに配列させて、空間的に分離しておくことである。化合物
を空間的に分離しておく手法の主な利点は、化合物プールとして形成した場合に
生じるあいまいさの何割かを除去できることである。化合物が空間的に分離され
ている場合には、生物学的評価から直接的な構造活性相関が得られる。また、化
合物が空間的に分離されている場合には、化合物の化学的整合性の解析的評価も
簡単になる。空間的に分離したライブラリの主な欠点は、合成可能な化合物の数
が限定されることである。
【0073】 最初のコンビナトリアル・ライブラリは、1984年、ガイゼンおよびその共
同研究者によって、空間的に分離された形態で作成されたGeysen, H.M., Meloen
, R.H., Barteling, S.J., Proc. Natl. Acad. Sci. USA. 1984, 81, 3998-4002
。彼らは、固相ペプチド合成およびエピトープ(抗原決定基)解析のための機能
ピンを開発した。ピンは、96穴マイクロタイタープレートに合致するように作
られていた。ピン法は、他の分野の化学にも適用可能なように、様々なポリマー
を利用する、ローディング・レベルを上げる、機能リンカーを利用するなどの手
法で、改良されてきた。アフィマックスのフォーダーおよびその共同研究者は、
シリコンウェハー上で大きなライブラリを構築するフォトリソグラフィ法を開発
したFodor, S.P.A., Read, J.L., Pirrung, M.C., Stryer, L, Lu, A.T., Solas
, D., Science 19991, 251, 767-773 。この方法で、空間的に分離された大規模
なライブラリ(100,000個の化合物から成る)を形成することができる。
ただし、この方法は、光変化しやすい保護基と担体に結合した状態でのバイオア
ッセイが必要となるため、現在では、主に、DNA診断テストに用いられている
。樹脂上で、また、溶液中で、空間的に分離されたライブラリを作成するための
新しい技術も、数多く、開発されつつある。
【0074】 化合物プールを用いた場合の戦略も、種々提案されてきた。この中で最も古い
ものは、フルカ、ラム、ホートンによって独立に開発された手法で、スプリット
混合法を用いて、ペプチドの混合物プールを作成するものであった;Furka, A.,
Sebestyen, F., Asgedom, M., Dibo, G., Int. J. Pept. Protein Res. 1991,
37, 487-493:Lam, K.S., Salmon, S.E., Hersh, E.M., Hruby, V.J., Kazmiers
uki, W.M., Knapp, R.J., Nature 1991, 351, 82-84:Houghten, R.A., Pinilla
, C., Blondelle, S.E., Appel, 7,R., Dooley, C.T., Cuervo, J.H., Nature 1
991, 354, 84-86 。スプリット合成では、ある量の樹脂を同量ずつ分けて、別々
の反応容器に入れて、それぞれ、別々のモノマーと反応させる。反応が完了した
後、樹脂を集めたプールを作り、完全に混合する。次に、一つの反応容器内で、
共通の保護基を外す、あるいは、共通の形質転換を行う。第二のモノマーとカッ
プリングさせるために、樹脂を再び分ける。コンビナトリアル合成が終了するま
で、この処理を繰り返す。活性化アミノ酸など、種々のビルディング・ブロック
とカップリングさせるためには、樹脂を別々の反応容器に分けて、異なった反応
速度で反応を完了させる必要がある。
【0075】 スプリット合成によって作成されたライブラリから、生物学的に活性な化合物
を特定するための手法も、種々提案されている。反復合成や小さなプールの評価
等を行うデコンヴォルーション法により、化合物プールの中から活性な化合物を
単離することができる。各ステップで樹脂の一部を取っておき、反復合成を容易
にするようにしてもよい。オルトゴナル・ライブラリ、ポジショナル・ライブラ
リ、インデックスド・ライブラリでは、必要なデコンヴォルーションの量が最小
になるプール手法が用いられる。
【0076】 元々はペプチド合成のために開発されたコンビナトリアル法は、人工バイオポ
リマーや小さな分子のコンビナトリアル合成にも用いられてきた。たとえば、多
様なペプトイド・ライブラリのスプリット合成から、7−膜貫通−G−タンパク
質結合レセプター(7TM/GPCR)が同定された。
【0077】 スプリット合成が完了した時点では、理論的には、個々のビーズが単一の生成
物を含んでいるはずである。これは、いずれのビーズでも、そのすべての部位に
おいて、同じ合成試薬によって処理されるためである。時間をくう反復合成に頼
ることなく、バイオアッセイで活性な化合物を同定するために、「ワンコンパウ
ンド・ワンビーズ」手法が開発された。担体に結合した化合物のアッセイでは、
放射性同位体で標識されたレセプターあるいは蛍光物質で標識されたレセプター
と結合させて、単一の樹脂ビーズから活性化合物を同定する。担体上で活性化合
物を検出・単離した後、担体結合ペプチドを同定するエドマン分解等の方法で、
単離された活性化合物の化学構造を決定するようにしてもよい。溶液中で生物学
的評価を行うために、担体から化合物を部分的に解離させる方法も開発された。
生物学的評価の後、樹脂ビーズ上に残った化合物を構造決定に用いることもでき
る。
【0078】 分子タグ法は、スプリット合成で作成されたライブラリから活性化合物をデコ
ンヴォルーションするための別の手法である。この手法では、反応シーケンスを
エンコードする読み取り可能なタグを樹脂につける。生体内で自然に行われてい
ることからもわかるように、DNAは、明らかにエンコードの標的となる。しか
し、残念ながら、有機合成で通常用いられている反応条件の多くの下では、DN
Aは、化学的に安定ではない。この問題を避けるために、比較的不活性な側鎖、
あるいは、通常用いられる反応条件の多くに対して不活性なGC−ECタグを有
するアミノ酸から合成されるペプチドをエンコードに用いた。スティルおよび共
同研究者によって開発されたGC−ECタグの利点は、0.1pmol 未満の量で検出
可能であり、カルベン反応により直接ポリスチレンにつけられることである;Oh
lmeyer, M.H., Swanson, R.N., Dillard, L.W., Reader, J.C., Asouline, G.,
Kobayashi, R., Wigler, M., Still, W.C., Proc. Natl. Acad. Sci., USA. 199
3, 90,10922-10926 。すなわち、この方法は、オルトゴナルな保護処理を必要と
しない。また、樹脂上でライブラリをエンコードするための別の方法として、ラ
ジオ周波数タグ法も開発された。遺伝的アルゴリズムをはじめとして、コンビナ
トリアル・ライブラリを作成し、生物学的活性を最適化するための種々の手法が
、現在、研究されている。
【0079】 ライブラリが作成される形態と、少なくとも同程度に重要なのは、アクセス可
能な化合物の種類である。本発明は、その一つの態様として、「コンビナトリア
ル・インデックス」("The Combinatorial Index" )から得られた化学反応情報
を、ソフトウェア製品やサービスに拡大するものである。本発明は、また、あら
ゆる合成化学を組み入れるように、コンビナトリアル・ケミストリに関する初期
のデータベースを拡張するものである。さらに、ソフトウェア・パッケージの一
部として、自由度の高いサービスを組み込んだことも、その大きな特徴である。
また、データベースを進化させる手法も、その態様の一つである。これは、人工
知能の新しい分野とも密接に関連している。
【0080】 結語: 以上、本発明を所定の処理や装置に従って説明したが、本発明は、広範囲に適
用可能である。特に、本発明を、コンビナトリアル・ケミストリおよび化学合成
経路の観点から説明したが、これは、なんら本発明をこれらの分野に限定するも
のではない。本明細書に記載したデータベースやソフトウェアシステムは、薬剤
開発や構造生物学の分野に広く適用可能であり、さらに、心理学、法律、エンジ
ニアリング、建築、ジャーナリズム、経済、歴史、ビジネス、エレクトロニクス
、インターネット等、他の分野にも適用可能である。また、当業者には自明のこ
とであるが、それ以外の変更、修正、変形も可能である。
【図面の簡単な説明】
【図1A】 本発明のロジックにより、新規の反応シーケンスを作成する過
程を示すブロック図である。
【図1B】 本発明のロジックにより、多様性を最大にするための反応シー
ケンスをユーザに提供する過程を示す合成スキームである。
【図2】 本発明の種々の形態を実現するために利用可能なコンピュータシ
ステムの概略を示すブロック図である。
【符号の説明】
103…シーケンス 105…シーケンス 117…生成物 127…合成スキーム 131…生成物 133…シーケンス 135…新規生成物 138…アルデヒド 139…アミン 141…イミン 143…化学反応 145…アミン 147…化学反応 149…生成物 200…コンピュータシステム 202…CPU 204…一次記憶装置 206…一次記憶装置 208…大容量記憶装置 210…インターフェース 212…インターフェース 214…ROM
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE,TR),OA(BF ,BJ,CF,CG,CI,CM,GA,GN,GW, ML,MR,NE,SN,TD,TG),AP(GH,G M,KE,LS,MW,MZ,SD,SL,SZ,TZ ,UG,ZW),EA(AM,AZ,BY,KG,KZ, MD,RU,TJ,TM),AE,AG,AL,AM, AT,AU,AZ,BA,BB,BG,BR,BY,B Z,CA,CH,CN,CR,CU,CZ,DE,DK ,DM,DZ,EE,ES,FI,GB,GD,GE, GH,GM,HR,HU,ID,IL,IN,IS,J P,KE,KG,KP,KR,KZ,LC,LK,LR ,LS,LT,LU,LV,MA,MD,MG,MK, MN,MW,MX,MZ,NO,NZ,PL,PT,R O,RU,SD,SE,SG,SI,SK,SL,TJ ,TM,TR,TT,TZ,UA,UG,US,UZ, VN,YU,ZA,ZW Fターム(参考) 5B075 MM01 MM04 MM11 ND20 ND34 PP02 PP03 PP04 PP07 PQ02 QT06 UU18 UU40 【要約の続き】 あるいは人工知能システムからのフィードバックによ り、絶えず改良・改善可能なように設計されることが望 ましい。

Claims (37)

    【特許請求の範囲】
  1. 【請求項1】 化学合成情報を提供するためのエキスパート・システムの開
    発方法であって、 (a)化学合成法に従って系統的に分類された化学情報を蓄積したデータベー
    スを提供するステップと、 (b)ユーザからの検索指示に応じて、前記データベースを用いて化学合成に
    関する情報を特定するステップと、 (c)前記エキスパート・システムが化学合成情報をより適切に提供可能なよ
    うに修正された、該エキスパート・システム内の情報あるいはルールを、ユーザ
    からの検索指示に対する回答に基づいて特定するステップと、 (d)前記ステップ(c)で特定された情報を用いて、前記エキスパート・シ
    ステムを改良するステップと を備えるエキスパート・システムの開発方法。
  2. 【請求項2】 前記化学合成法に従って系統的に分類された化学情報が、反
    応条件ならびに出発物質を含んでいる請求項1記載の開発方法。
  3. 【請求項3】 人工知能を用いて前記化学合成情報にフィードバックを行う
    ことによって、前記データベースの改良を行う請求項1記載の開発方法。
  4. 【請求項4】 前記化学合成法が、コンビナトリアル合成法を含んでいる請
    求項1記載の開発方法。
  5. 【請求項5】 請求項1記載の方法であって、さらに、 新しいコンビナトリアル合成法を前記データベースに追加するステップを備え
    る開発方法。
  6. 【請求項6】 請求項1記載の方法であって、さらに、 化学文献に記載されている化学合成法を前記データベースに追加するステップ
    を備える開発方法。
  7. 【請求項7】 前記化学文献が、ピア・レビューの対象となる文献である請
    求項6記載の開発方法。
  8. 【請求項8】 請求項6記載の方法であって、さらに、 新しい化学合成法を検証後、前記データベースに追加するステップを備える開
    発方法。
  9. 【請求項9】 請求項6記載の方法であって、さらに、 化学合成法を前記データベースに追加する前に、前記化学合成法の書式を整え
    るステップを備える開発方法。
  10. 【請求項10】 前記エキスパート・システムが、SARツールを含んでい
    る請求項1記載の開発方法。
  11. 【請求項11】 請求項10記載の方法であって、 前記SARツールは、前記エキスパート・システム内で特定され、且つ該エキ
    スパート・システムがより適切な化学合成情報を提供するように修正可能な情報
    あるいはルールに基づいて、改良されるツールである開発方法。
  12. 【請求項12】 化学合成に関する情報を提供する化学情報システムであっ
    て、 化学合成法に従って系統的に分類された化学情報を蓄積したデータベースと、 ユーザからの検索指示に応じて、前記化学合成法に関する情報を返すとともに
    、所定の化合物に対して考えられる複数の反応化学を自動的に生成可能なロジッ
    クと を備える化学情報システム。
  13. 【請求項13】 前記データベースシステムが、化学情報を含む他のデータ
    ベースと相互に通信可能なデータベースシステムである請求項12記載の化学情
    報システム。
  14. 【請求項14】 請求項12記載の化学情報システムであって、さらに、 化学情報を含む一つあるいは複数の他の化学データベースへのリンクを備えて
    いる化学情報システム。
  15. 【請求項15】 前記化学合成法が、コンビナトリアル・ケミストリ法を含
    んでいる請求項12記載の化学情報システム。
  16. 【請求項16】 前記化学情報の少なくとも一部は、化学文献を出典とする
    情報である請求項12記載の化学情報システム。
  17. 【請求項17】 請求項16記載の方法であって、 前記化学文献がピア・レビューの対象となる文献である方法。
  18. 【請求項18】 前記データベースで用いられる前記化学合成法が、信頼性
    評価を含んでいる請求項12記載の化学情報システム。
  19. 【請求項19】 請求項12記載の化学情報システムであって、さらに、 前記データベースから、一つあるいは複数の化合物の活性を予測するSARツ
    ールを備える化学情報システム。
  20. 【請求項20】 前記化学合成法が、ポリマー合成法を含んでいる請求項1
    2記載の化学情報システム。
  21. 【請求項21】 前記化学合成法が、酵素調節法を含んでいる請求項12記
    載の化学情報システム。
  22. 【請求項22】 前記ロジックが、検索エンジンを含んでいる請求項12記
    載の化学情報システム。
  23. 【請求項23】 前記ロジックが、決定ルールを含んでいる請求項12記載
    の化学情報システム。
  24. 【請求項24】 前記ユーザからの検索指示が、一定の反応条件に制限され
    ている請求項12記載の化学情報システム。
  25. 【請求項25】 ユーザに化学情勢情報を提供する化学情報システムの利用
    方法であって、 (a)化合物あるいは化学合成に関する検索指示を受け取るステップと、 (b)化学合成法に従って系統的に分類され、且つ、前記化学合成法に関する
    信頼性評価を含む化学情報を蓄積したデータベースを、前記検索指示に応じて検
    索するステップと、 (c)前記検索指示に応じて、化学合成に関する情報を返すステップと を備える利用方法。
  26. 【請求項26】 請求項25記載の方法であって、さらに、 化学合成に関する化合物ライブラリを特定するステップを備える利用方法。
  27. 【請求項27】 請求項26記載の方法であって、さらに、 前記化合物ライブラリを顧客に提供するステップを備える利用方法。
  28. 【請求項28】 請求項25記載の方法であって、さらに、 前記化学情報システムを用いて同定された個々の化合物を提供するステップを
    備える利用方法。
  29. 【請求項29】 請求項25記載の方法であって、さらに、 前記化学情報システムを用いて同定された化合物の前駆物質を特定するステッ
    プを備える利用方法。
  30. 【請求項30】 請求項25記載の方法であって、さらに、 構造活性相関ツリーを顧客に提供するステップを備える利用方法。
  31. 【請求項31】 前記化学合成法が、コンビナトリアル合成法を含んでいる
    請求項25記載の利用方法。
  32. 【請求項32】 請求項25記載の方法であって、さらに、 化学情報を蓄積した外部データベースを自動的にクロス・リファレンスするス
    テップを備える利用方法。
  33. 【請求項33】 請求項32記載の方法であって、さらに、 前記外部データベースから反応パラメータを特定する文献引用を入手するステ
    ップを備える利用方法。
  34. 【請求項34】 請求項25記載の方法であって、さらに、 直感的なリンクに従って、自動的に前記データベースをクロス・リファレンス
    するステップを備える利用方法。
  35. 【請求項35】 請求項25記載の方法であって、さらに、 前記データベースを、反応パラメータに従って構成するステップを備える利用
    方法。
  36. 【請求項36】 前記化学合成法が、ポリマー合成法を含んでいる請求項2
    5記載の利用方法。
  37. 【請求項37】 前記化学合成法が、酵素調節法を含んでいる請求項25記
    載の利用方法。
JP2001573237A 2000-04-03 2001-04-03 化学資源データベース Pending JP2003529843A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US19433800P 2000-04-03 2000-04-03
US60/194,338 2000-04-03
US19848200P 2000-04-18 2000-04-18
US60/198,482 2000-04-18
PCT/US2001/010978 WO2001075625A1 (en) 2000-04-03 2001-04-03 Chemistry resource database

Publications (1)

Publication Number Publication Date
JP2003529843A true JP2003529843A (ja) 2003-10-07

Family

ID=26889915

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001573237A Pending JP2003529843A (ja) 2000-04-03 2001-04-03 化学資源データベース

Country Status (5)

Country Link
US (1) US20020049548A1 (ja)
EP (1) EP1285343A1 (ja)
JP (1) JP2003529843A (ja)
AU (1) AU2001251309A1 (ja)
WO (1) WO2001075625A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023080061A1 (ja) * 2021-11-02 2023-05-11 株式会社レゾナック 情報処理システム、情報処理方法、および情報処理プログラム

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7199809B1 (en) * 1998-10-19 2007-04-03 Symyx Technologies, Inc. Graphic design of combinatorial material libraries
US7912689B1 (en) 1999-02-11 2011-03-22 Cambridgesoft Corporation Enhancing structure diagram generation through use of symmetry
US7295931B1 (en) * 1999-02-18 2007-11-13 Cambridgesoft Corporation Deriving fixed bond information
US7216113B1 (en) * 2000-03-24 2007-05-08 Symyx Technologies, Inc. Remote Execution of Materials Library Designs
US7272509B1 (en) * 2000-05-05 2007-09-18 Cambridgesoft Corporation Managing product information
US7356419B1 (en) * 2000-05-05 2008-04-08 Cambridgesoft Corporation Deriving product information
DE10028875A1 (de) * 2000-06-10 2001-12-20 Hte Gmbh Rechnergestützte Optimierung von Substanzbibliotheken
US6996550B2 (en) * 2000-12-15 2006-02-07 Symyx Technologies, Inc. Methods and apparatus for preparing high-dimensional combinatorial experiments
US7085773B2 (en) * 2001-01-05 2006-08-01 Symyx Technologies, Inc. Laboratory database system and methods for combinatorial materials research
US20020143725A1 (en) * 2001-01-29 2002-10-03 Smith Robin Young Systems, methods and computer program products for determining parameters for chemical synthesis and for supplying the reagents, equipment and/or chemicals synthesized thereby
US7250950B2 (en) * 2001-01-29 2007-07-31 Symyx Technologies, Inc. Systems, methods and computer program products for determining parameters for chemical synthesis
US20030229477A1 (en) * 2002-02-22 2003-12-11 Libraria, Inc. Separation of matching and mapping in chemical reaction transforms
WO2003083609A2 (en) * 2002-03-25 2003-10-09 Synthematix, Inc. Systems, methods and computer program products for determining parameters for chemical synthesis
US7213034B2 (en) * 2003-01-24 2007-05-01 Symyx Technologies, Inc. User-configurable generic experiment class for combinatorial materials research
US20050130229A1 (en) * 2003-12-16 2005-06-16 Symyx Technologies, Inc. Indexing scheme for formulation workflows
US20050278308A1 (en) * 2004-06-01 2005-12-15 Barstow James F Methods and systems for data integration
GB2414834A (en) * 2004-06-03 2005-12-07 Mdl Information Systems Inc Visual programming with automated features
US7818666B2 (en) * 2005-01-27 2010-10-19 Symyx Solutions, Inc. Parsing, evaluating leaf, and branch nodes, and navigating the nodes based on the evaluation
WO2007022110A2 (en) * 2005-08-12 2007-02-22 Symyx Technologies, Inc. Event-based library process design
US8538983B2 (en) * 2010-09-21 2013-09-17 Cambridgesoft Corporation Systems, methods, and apparatus for facilitating chemical analyses
US9977876B2 (en) 2012-02-24 2018-05-22 Perkinelmer Informatics, Inc. Systems, methods, and apparatus for drawing chemical structures using touch and gestures
US9946847B2 (en) 2012-09-22 2018-04-17 Bioblocks Inc. Libraries of compounds having desired properties and methods for making and using them
US9535583B2 (en) * 2012-12-13 2017-01-03 Perkinelmer Informatics, Inc. Draw-ahead feature for chemical structure drawing applications
US8854361B1 (en) 2013-03-13 2014-10-07 Cambridgesoft Corporation Visually augmenting a graphical rendering of a chemical structure representation or biological sequence representation with multi-dimensional information
WO2014163749A1 (en) 2013-03-13 2014-10-09 Cambridgesoft Corporation Systems and methods for gesture-based sharing of data between separate electronic devices
US9430127B2 (en) 2013-05-08 2016-08-30 Cambridgesoft Corporation Systems and methods for providing feedback cues for touch screen interface interaction with chemical and biological structure drawing applications
US9751294B2 (en) 2013-05-09 2017-09-05 Perkinelmer Informatics, Inc. Systems and methods for translating three dimensional graphic molecular models to computer aided design format
US10943194B2 (en) * 2013-10-25 2021-03-09 The Boeing Company Product chemical profile system
CN104504152B (zh) * 2015-01-09 2017-08-29 常州三泰科技有限公司 提高化学工艺效率和促进化学信息分享的装置和方法
US10726944B2 (en) 2016-10-04 2020-07-28 International Business Machines Corporation Recommending novel reactants to synthesize chemical products
US10430395B2 (en) 2017-03-01 2019-10-01 International Business Machines Corporation Iterative widening search for designing chemical compounds
CA3055172C (en) 2017-03-03 2022-03-01 Perkinelmer Informatics, Inc. Systems and methods for searching and indexing documents comprising chemical information
US11132621B2 (en) * 2017-11-15 2021-09-28 International Business Machines Corporation Correction of reaction rules databases by active learning
CN108733971A (zh) * 2018-07-09 2018-11-02 上海华堇生物技术有限责任公司 一种基于云平台的有机合成系统
US11500528B2 (en) * 2019-07-01 2022-11-15 Palantir Technologies Inc. System architecture for cohorting sensor data
US11854670B2 (en) * 2020-08-18 2023-12-26 International Business Machines Corporation Running multiple experiments simultaneously on an array of chemical reactors
CN115171807B (zh) * 2022-09-07 2022-12-06 合肥机数量子科技有限公司 一种分子编码模型训练方法、分子编码方法和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY107650A (en) * 1990-10-12 1996-05-30 Exxon Res & Engineering Company Method of estimating property and / or composition data of a test sample
US5819259A (en) * 1992-12-17 1998-10-06 Hartford Fire Insurance Company Searching media and text information and categorizing the same employing expert system apparatus and methods
US6340588B1 (en) * 1995-04-25 2002-01-22 Discovery Partners International, Inc. Matrices with memories
US5724254A (en) * 1996-01-18 1998-03-03 Electric Power Research Institute Apparatus and method for analyzing power plant water chemistry
US6389380B1 (en) * 1997-09-16 2002-05-14 Evolving Logic Associates System and method for performing compound computational experiments

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023080061A1 (ja) * 2021-11-02 2023-05-11 株式会社レゾナック 情報処理システム、情報処理方法、および情報処理プログラム

Also Published As

Publication number Publication date
US20020049548A1 (en) 2002-04-25
EP1285343A1 (en) 2003-02-26
AU2001251309A1 (en) 2001-10-15
WO2001075625A1 (en) 2001-10-11

Similar Documents

Publication Publication Date Title
JP2003529843A (ja) 化学資源データベース
Nicolaou et al. The proximal lilly collection: Mapping, exploring and exploiting feasible chemical space
Leach et al. The in silico world of virtual libraries
US20050177280A1 (en) Methods and systems for discovery of chemical compounds and their syntheses
US6625585B1 (en) Method and system for artificial intelligence directed lead discovery though multi-domain agglomerative clustering
Hu et al. Molecular scaffolds with high propensity to form multi-target activity cliffs
Saven Combinatorial protein design
AU2002215028B2 (en) Method of operating a computer system to perform a discrete substructural analysis
Rackovsky Quantitative organization of the known protein x‐ray structures. I. Methods and short‐length‐scale results
Marcotte et al. Exploiting big biology: integrating large-scale biological data for function inference
Chen et al. How will bioinformatics impact signal processing research?
Pikalyova et al. Chemical library space: definition and DNA-encoded library comparison study case
US6678619B2 (en) Method, system, and computer program product for encoding and building products of a virtual combinatorial library
Kolpak et al. Enhanced SAR maps: expanding the data rendering capabilities of a popular medicinal chemistry tool
Van Drie et al. Addressing the challenges posed by combinatorial chemistry: 3D databases, pharmacophore recognition and beyond
Hu et al. Combining horizontal and vertical substructure relationships in scaffold hierarchies for activity prediction
JP2004500614A (ja) レセプタ選択性マッピング
Smalter Hall et al. An overview of computational life science databases & exchange formats of relevance to chemical biology research
US20030087334A1 (en) Method of flexibly generating diverse reaction chemistries
Swanson The entrance of informatics into combinatorial chemistry
US20140171332A1 (en) System for the efficient discovery of new therapeutic drugs
Heffelfinger et al. Carbon Sequestration in Synechococcus Sp.: from molecular machines to hierarchical modeling
WO2003044219A1 (en) Method of flexibly generating diverse reaction chemistries
Cosgrove et al. BOOMSLANG: a program for combinatorial structure generation
Oduguwa et al. An overview of soft computing techniques used in the drug discovery process