JP2002513979A - 多次元空間において近接データを表すシステム、方法、およびコンピュータプログラムプロダクト - Google Patents

多次元空間において近接データを表すシステム、方法、およびコンピュータプログラムプロダクト

Info

Publication number
JP2002513979A
JP2002513979A JP2000547590A JP2000547590A JP2002513979A JP 2002513979 A JP2002513979 A JP 2002513979A JP 2000547590 A JP2000547590 A JP 2000547590A JP 2000547590 A JP2000547590 A JP 2000547590A JP 2002513979 A JP2002513979 A JP 2002513979A
Authority
JP
Japan
Prior art keywords
objects
distance
relationship
subset
modifying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000547590A
Other languages
English (en)
Inventor
ディミトリス ケイ. アグラフィオティス,
ビクター エス. ロバノフ,
フランシス アール. サレミ,
Original Assignee
3−ディメンショナル ファーマシューティカルズ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 3−ディメンショナル ファーマシューティカルズ, インコーポレイテッド filed Critical 3−ディメンショナル ファーマシューティカルズ, インコーポレイテッド
Publication of JP2002513979A publication Critical patent/JP2002513979A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2137Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on criteria of topology preservation, e.g. multidimensional scaling or self-organising maps
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/0068Means for controlling the apparatus of the process
    • B01J2219/00686Automatic
    • B01J2219/00689Automatic using computers
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/0068Means for controlling the apparatus of the process
    • B01J2219/007Simulation or vitual synthesis
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/80Data visualisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Geometry (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Image Generation (AREA)
  • Stacking Of Articles And Auxiliary Devices (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Knitting Machines (AREA)
  • Digital Computer Display Output (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Complex Calculations (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Sewing Machines And Sewing (AREA)
  • Circuits Of Receivers In General (AREA)

Abstract

(57)【要約】 対象を表す多次元空間内の点間の距離として、対象間の類似性/非類似性(関係)の正確または不正確な測度結果を表すシステム、方法およびコンピュータプログラムプロダクト。確率的関係/距離の誤差を用いて、点の初期(ランダムまたは部分的に順番の)配置を反復的に細分するために、自己編成原理が用いられる。データは、完全であってもよいし、不完全であってもよいし(即ち、対象間の関係のいくつかは既知でなくてもよい)、的確であってもよいし、不的確であってもよいし(即ち、いくつかのまたは全ての関係が許容の範囲または極限によって与えられ得る)、対称であってもよいし、非対称であってもよいし(即ち、対象Aの対象Bとの関係は、対象Bの対象Aとの関係と同じでなくてもよい)、定誤差または確率的誤差を含んでいてもよい。対象間の関係は、観測、測度、事前の知識、または直感から直接的に導かれ得るか、あるいは近接(関係)データを導く任意の適切な技術を用いて、間接的に判定され得る。本発明は、対象を表す多次元空間において対象の部分集合を表すために、対象の部分集合を反復的に解析する。例示的な実施形態において、本発明は、従来の多次元的尺度構成法または非線形写像アルゴリズムを用いて、対象の部分集合を反復的に解析する。別の例示的な実施形態において、関係は、対象の対間の対の関係または対の類似性/非類似性として定義され、本発明は、同時に対象の対を反復的に解析する。好適には、部分集合は、二重のネスティングループとして、対で評価される。

Description

【発明の詳細な説明】
【0001】 (発明の背景) (発明の分野) 本発明は、データ解析に関し、より具体的には多次元空間内の近接データの表
現に関する。
【0002】 (関連技術) 多次元的尺度構成法(MDS)および非線形写像(NLM)は、対象間の距離
が対象間の関係を表す、対象の、非線形写像を含む、表示写像を生成する技術で
ある。
【0003】 MDSおよびNLMは、Torgerson、Phychometrika、
17:401 (1952)、Kruskal、Psychometrika、
29:115 (1964)、およびSammon、IEEE Trans.
Comput.、C−18:401(1969)によって、心理学的データの低
次元表現を生成する手段として導入される。多次元的尺度構成法および非線形写
像は、Schiffman、ReynoldsおよびYoungの、Intro
duction to Multidimensional Scaling、
Academic Press、New York(1981)、Youngお
よびHamerのMultidimensional Scaling: Hi
story, Theory and Applications、Erlba
um Associates, Inc.、Hillsdale,NJ(198
7)、ならびにCox and Coxの、Multidimensional
Scaling、Monographs in Statistics an
d Applied ProbabilityのNumber 59、Chap
man−Hall(1994)において検討される。これらの出版物の内容は、
その全文を通じて本明細書中で参考として援用される。
【0004】 MDSおよびNLM(これらは、概して同じであり、以下では、集合的にMD
Sと呼ぶ)は、低次元ユークリッド空間における点の距離によって、対象の近接
関係を視覚化する方法の集合を表す。近接測度は、Hartigan、J. A
m. Statist. Ass.、62:1140(1967)において検討
され、この文献は、その全文を通じて本明細書中で参考として援用される。
【0005】 特に、ベクトルまたは他のサンプルの有限集合A={ai,i=l,...,
k}、Aにおけるi番目とj番目との対象間の類似性または非類似性を測定する
、ai,aj∈Aの関係関数rij=r(ai,aj)、ならびに、m次元表示平面上
のAの像の集合
【0006】
【数1】 (ただし、
【0007】
【数2】 は実数のm次元ベクトルの空間である)とすると、目的は、それらのユークリッ
ド距離dij=‖xi−xj‖が可能な限り対応値rijに近くなるように、xiを表
示平面上に位置付けることである。多くの場合単に近くにされ得る、この射影は
、オリジナルrijと射影dij(これらは、オリジナルと射影されたベクトル集合
の距離行列である)との差を測定する誤差関数を最小化することによって、反復
様式で実行される。
【0008】 このような誤差関数がいくつか提案されてきたが、多くは最小二乗タイプであ
り、Kruskalの「応力」:
【0009】
【数3】 Sammonの誤差基準:
【0010】
【数4】 およびLingoesの無相関度係数:
【0011】
【数5】 が含まれる。ただし、dij=‖xi−xj‖は、表示平面上の像xiとxjとのユー
クリッド距離である。
【0012】 概して、解は、以下によって反復様式で求められる。
【0013】 (1)関係rijを計算またはデータベースから取り出すステップ (2)像xiを初期化するステップ (3)像dijの距離および誤差関数の値を計算するステップ(例えば、上記の
EQ.1〜3のS、E、またはK) (4)像xiの新たな配置を、Kruskalの線形回帰、またはGuttm
anのランク像置換等の勾配降手順を用いて計算するステップ (5) 誤差が指定された許容範囲内に最小化されるまでステップ3および4
を繰返すステップ 例えば、Sammonアルゴリズムは、EQ.4を用いて座標xiを反復的に
更新することによって、EQ.2を最小化する。 xpq(m+1)=xpq(m)−λΔpq(m) EQ.4 ただし、mは反復数であり、xpqはp番目の像xpのq番目の座標であり、λは
学習速度であり、
【0014】
【数6】 である。EQ.5における偏導関数は、
【0015】
【数7】 によって与えられる。
【0016】 写像は、EQ.2の繰返し値をによって得られ、その後、誤差が指定された許
容範囲内になるまで、EQ.4および5を用いて座標が修正される。
【0017】 上記の一般的な細分パラダイムは、比較的小さいデータ集合に適するが、大き
いデータ集合については非実用的にさせる重要な制限を1つ有する。この制限は
、勾配の計算に必要な計算の努力(即ち、上記のステップ(4))はデータ集合
のサイズの二乗に尺度化するという事実から生じる。比較的大きいデータ集合に
ついて、この二次時間計算量により、部分細分でさえも処理しにくいものになる
【0018】 必要なのは、複数の対象を好適に尺度化し、小さいデータ集合と大きいデータ
集合との両方に適用され得る、近接データを多次元空間内に表すシステム、方法
およびコンピュータプログラムプロダクトである。さらに、必要なのは、欠けて
いるデータおよび/または有界または非有界の不確定性、ノイズまたは誤差を含
むデータに対して効率的であり得る、システム、方法およびコンピュータプログ
ラムプロダクトである。
【0019】 (発明の要旨) 本発明は、好適には、対象を表す多次元空間内の点間の距離として、対象間の
類似性/非類似性(関係)の正確または不正確な測度結果を表すシステム、方法
およびコンピュータプログラムプロダクトである。アルゴリズムは、確率的関係
/距離の誤差を用いて、点の初期(ランダムまたは部分的に順番に)配置を反復
的に細分するために、自己編成原理を用いる。データは、完全であってもよいし
、不完全であってもよいし(即ち、対象間の関係のいくつかは既知でなくてもよ
い)、的確であってもよいし、不的確であってもよいし(即ち、いくつかのまた
は全ての関係が許容の範囲または極限によって与えられ得る)、対称であっても
よいし、非対称であってもよいし(即ち、対象Aの対象Bとの関係は、対象Bの
対象Aとの関係と同じでなくてもよい)、定誤差または確率的誤差を含んでいて
もよい。
【0020】 対象間の関係は、観測、測度、事前の知識、または直感から直接的に導かれ得
るか、あるいは近接(関係)データを導く任意の適切な技術を用いて、直接的も
しくは間接的に決定され得る。
【0021】 本発明は、対象間の関係を表す多次元空間において対象の部分集合を表すため
に、対象の部分集合を反復的に解析する。
【0022】 例示的な実施形態において、本発明は、従来の多次元的尺度構成法または非線
形写像アルゴリズムを用いて、対象の部分集合を反復的に解析する。
【0023】 別の例示的な実施形態において、関係は、対象の対間の対の関係または対の類
似性/非類似性として定義され、本発明は、同時に対象の対を反復的に解析する
。好適には、部分集合は、二重のネスティングループとして、対で評価される。
【0024】 以下の説明において、用語「関係」、「類似性」または「非類似性」は、対象
の対間の関係を示すために用いられる。用語「表示写像」は、オリジナルの対象
を表すn次元空間上の像の集合を示すために用いられる。用語「距離」は、その
対象に対応する表示写像上の像間の距離を示すように用いられる。
【0025】 化合物データおよび関係と共に実現される本発明の実施例を含む、本発明の実
施例が、本明細書中に提供されている。しかし、本発明は本明細書中に記載の実
施例に限定されないことが理解されるべきである。本発明は、様々な適用例にお
いて実現され得る。
【0026】 例えば、本明細書中に記載の特定の実施形態が、対象間の類似性/非類似性を
表すために、点間の距離を利用するが、本発明は、対象間の類似性/非類似性を
表すために、任意の表示属性を利用するように意図され、適合される。任意の表
示属性には、フォント、サイズ、色、グレースケール、斜体、下線、太字、アウ
トライン、ボーダー等が含まれるが、これらに限定はされない。例えば、2つの
対象間の類似性/非類似性は、対象を表す点の相対的なサイズによって表される
【0027】 本発明のさらなる特徴および利点は、本発明の様々な実施形態の構造および動
作と共に、添付の図面を参照しながら以下でより詳細に記載される。
【0028】 本特許のファイルは、少なくとも1つのカラーで描かれた図面を含む。カラー
図面を有する本特許の写しは、請求され、必要な手数料が支払らわれれば特許庁
によって提供される。
【0029】 本発明は、添付の図面を参照しながら説明される。
【0030】 図面において、同一の参照番号は、同一のまたは機能的に同様の要素を示す。
また、参照番号の左端の数字は、関連付けられた要素が最初に現れる図面を示す
【0031】 (好適な実施形態の詳細な説明) (目次) I.本発明の概略..........................12 II.部分集合選択.........................14 III.不確定性のない完全な対の関係行列..............15 IV.不確定性のない疎な対の関係行列................18 V.有界不確定性を有する対の関係行列................18 VI.非有界の不確定性を有する対の関係行列(不正データ)......21 VII.基本的なアルゴリズムの変形例................21 VIII.評価特性(特徴)、関係および距離測度...........23 A.連続または離散している実数値を有する評価特性.......23 1.評価特性の値が連続または離散している実数の場合の関係また は距離測度.............................24 B.バイナリ値を有する評価特性................25 1.評価特性の値がバイナリである場合の距離測度.....26 C.評価特性の尺度構成法...................28 IX.本発明の実行.........................30 A.概略...........................30 B.コンピュータプログラムプロダクトにおける本発明の実行...32 C.本発明の動作.......................35 X.本発明の実施例.........................37 A.例示的な実施形態の動作..................39 XI.結論.............................42 (I.本発明の概略) 本発明は、対象を表す多次元空間内の点間の距離として(あるいは他の表示属
性または技術を用いて)、対象間の類似性/非類似性(関係)の正確または不正
確な測度結果を表すシステム、方法およびコンピュータプログラムプロダクトで
ある。アルゴリズムは、確率的関係/距離誤差を用いて、点の初期(ランダムま
たは部分的に順番の)配置を反復的に細分するために、自己編成原理を用いる。
データは、完全であってもよいし、不完全であってもよいし(即ち、対象間の関
係のいくつかは既知でなくてもよい)、的確であってもよいし、不的確であって
もよいし(即ち、いくつかのまたは全ての関係が許容の範囲または極限について
与えられ得る)、対称であってもよいし、非対称であってもよいし(即ち、対象
Aの対象Bとの関係は、対象Bの対象Aとの関係と同じでなくてもよい)、定誤
差または確率的誤差を含んでいてもよい。
【0032】 対象間の関係は、観測、測度、事前の知識、または直感から直接的に導かれ得
るか、あるいは近接(関係)データを導く任意の適切な技術を用いて、直接的も
しくは間接的に決定され得る。
【0033】 本発明は、対象を表す多次元空間において対象の部分集合を表すために、対象
の部分集合を反復的に解析する。
【0034】 例示的な実施形態において、本発明は、従来の多次元的尺度構成法または非線
形写像アルゴリズムを用いて、対象の部分集合を反復的に解析する。
【0035】 別の例示的な実施形態において、関係は、対象の対間の対の関係または対の類
似性/非類似性として定義され、本発明は、同時に対象の対を反復的に解析する
。好適には、部分集合は、二重のネスティングループとして、対で評価される。
【0036】 さらに別の実施形態において、関係は、複数の対象間のNの関係またはNの類
似性/非類似性として定義され、本発明は、複数の対象を同時に反復的に解析す
る。ただし、Nは、好適には、1より大きい。この別の実施形態の実行は、関連
技術の当業者にとっては明らかである。
【0037】 用語「対象」は、任意のエンティティ、データ、プロパティ、属性、コンポー
ネント、要素、成分(ingredient)、項目等のことであり、これらは
、任意のこのようなエンティティ、データ、プロパティ、属性、コンポーネント
、要素、成分、項目等のインスタンスまたは異なるものの間の類似性/非類似性
を表すために有用である。限定するものではないが、例示として、対象は、例え
ば、化合物、プロセス、機械、合成物、製造品、電気的装置、機械的装置、金融
データ、金融証書、金融傾向、金融関連形質および特徴、ソフトウェア製品、人
間的形質および特徴、科学的特性、形質、および特徴等を含む。1実施形態にお
いて、本発明は、化合物を除き、任意のエンティティ、データ、プロパティ、属
性、コンポーネント、要素、成分、項目等で動作する。
【0038】 (II.部分集合選択) 本発明は、対象間の関係を表す多次元空間において対象の部分集合を表すため
に、対象の部分集合を反復的に解析する。例示的な実施形態において、本発明は
、従来の多次元的尺度構成法または非線形写像アルゴリズムを用いて、対象の部
分集合を反復的に解析する。この実施形態において、選択された部分集合におけ
る対象は、例えば、上記のような、しかしそれらに限定されない、従来のアルゴ
リズムを用いて、群として解析される。具体的には、その部分集合を包含する対
象に対応する像の座標は、従来の多次元的尺度構成法、非線形写像、または任意
の他の適切なアルゴリズム、あるいは以下で説明する対の細分アルゴリズムを用
いて、細分される。
【0039】 この実施形態において、対象の部分集合は、ランダムに、半ランダムに、系統
的に、または部分的に系統的等に選択され得る。対象の部分集合が解析され、こ
れらの距離が修正され、対象の集合は、自己編成しやすくなる。このようにして
、大きなデータ集合が、従来の多次元的尺度構成法または非線形写像アルゴリズ
ムに適合され得る。
【0040】 別の例示的な実施形態において、関係は、対象の対間の対の関係または対の類
似性/非類似性として定義され、本発明は、同時に対象の対を反復的に解析する
。対象の対は、ランダムに、半ランダムに、系統的に、または部分的に系統的等
に選択され得る。対の解析の新規なアルゴリズムおよび技術が、以下のセクショ
ンで提供される。この実施形態は、本発明を例示する目的としてのみ説明され、
限定はしない。
【0041】 別の実施形態において、関係は、複数の対象間のNの関係またはNの類似性/
非類似性として規定され、本発明は、複数の対象を同時に反復的に解析する。た
だし、Nは、好適には、1より大きい。この別の実施形態の実行は、当業者にと
っては明らかである。
【0042】 (III.不確定性のない完全な対の関係行列) 本明細書中で採用される好適なアプローチは、確率的または瞬間誤差に基づい
て、反復的な細分を用いることである。このセクションの記載では、全ての対の
関係が既知であり、全て正確であると仮定される。従来のMDSと同様に、その
方法は、ランダムに、または他の何らかの手順(以下を参照)によって生成され
る点の初期的な配置で開始する。この初期的な配置は、その後、2点i、jをラ
ンダムに繰返し選択することによって、且つEQ.8により、表示写像上のそれ
らの座標を修正することによって、連続的に細分される。 xi(t+1)=f(t,xi(t),xj(t),rij) EQ.8 ただし、tは現在の反復、xi(t)およびxj(t)は、表示写像上のi番目お
よびj番目の点の現在の座標、xi(t+1)は、表示写像上のi番目の点の新
たな座標、rijは、表示写像上で近似しようとする(以上を参照)i番目および
j番目の対象間の対の関係である。
【0043】 上記のEQ.8におけるf(.)は、任意の関数形式を取り得る。理想的には
、この関数は、i番目およびj番目の点の間の、実際の距離と終点の距離との差
を最小化するようにしなければならない。例えば、f(.)は、EQ.9によっ
て与えられ得る。
【0044】
【数8】 ただし、tは反復数、dij=‖xi(t)−xj(t)‖であり、λ(t)は調節
可能なパラメータであり、以下では、ニューラルネットワークの専門用語を借り
て、「学習速度」と呼ばれる。このプロセスは、固定された数の周期で繰返され
るか、またはいくつかの大域的誤差基準が、指定された許容範囲内まで最小化さ
れるまで繰返される。多数の反復が、典型的には、統計的精度を得るために必要
とされる。
【0045】 上記の方法は、ニューラルネットワークのバックプロパゲーショントレーニン
グ(Werbos、Beyond Regression: New Tool
s for Prediction and Analysis in the
Behavioral Sciences、PhD Thesis、Harv
ard University、Cambridge、MA(1974)ならび
にRumelhartおよびMcClelland編、Parallel Di
stributed Processing: Explorations i
n the Microstructure of Cognition.、V
ol. 1、MIT Press、Cambridge、MA(1986))お
よびKohonenの自己編成原理(Kohonen、Biological
Cybernetics、43:59(1982))を思わせるものである。
【0046】 EQ.9における学習速度λ(t)は、収束を確実にする場合に重要な役割を
果たす。λが小さすぎる場合、座標更新は小さく、収束は遅い。反対に、λが大
きすぎる場合、学習の速度は加速され得るが、表示写像は、不安定(即ち、振動
的)になり得る。典型的に、λは間隔[0,1]内で固定され得るか、または、
細分プロセスの間単調に減少し得る。さらに、λは、また、i、j、および/ま
たはrijの関数であり得、異なる重みをある特定の対象および/または関係に適
用するために用いられ得る。例えば、λは、
【0047】
【数9】 によって計算され得る。ただし、λmaxおよびλminは、λmax,λmin∈[0,1
]となるように(重み付けされていない)開始学習速度および終了学習速度であ
り、tは細分ステップ(反復)の総数であり、tは現在の反復数であり、αは一
定の尺度構成因子である。EQ.10および11は、大きな分離での訂正を減少
する効果を有し、従って、短距離相互作用を、長距離相互作用より、より忠実に
保護する表示写像を作製する。重み付けについては、以下でより詳細に記載する
【0048】 このアプローチの主たる利点の1つは、部分細分を可能にすることである。対
の関係が、データの一般的な構造およびトポロジーを明らかにする程度に近く表
されれば、充分であることが多い。従来のMDSとは異なり、このアプローチは
、細分プロセスの非常に細かい制御を可能にする。さらに、表示写像が自己編成
するので、対の細分は、協同的となり、問題の二次的性質を部分的に軽減する。
【0049】 上記の埋め込み手順は、大域最小値までの収束(即ち、最小二乗の意味で、最
も忠実な埋め込み)を保証しない。所望の場合、細分プロセスは、異なる開始配
置および/または乱数種から、複数回繰返され得る。概して、表示写像における
絶対的な座標は、物理的な重要性を持たない。重要なことは、点間の相対距離、
およびデータの一般的な構造およびトポロジー(クラスタの存在、密度、および
分離等)である。
【0050】 上記の方法は、理想的には、メトリックおよびノンメトリック尺度構成法の両
方に適する。後者は、対の関係が距離公準に従わない場合、具体的には、三角不
等式の場合、特に有用である。対の関係行列が正の定符号である場合にしか、「
正確な」射影が可能でないにも関わらず、この基準を満たさない場合でさえ意義
のある写像が得られ得る。上記のように、射影の全体の質は、EQ.1〜3に示
したような、誤差関数二乗和によって決定される。
【0051】 上記の一般的なアルゴリズムは、対の関係行列が不完全な場合、即ち、対の関
係のいくつかが未知であるか、または対の関係のいくつかが不確定もしくは不正
であるか、あるいは上記の両方が当てはまる場合にも適用され得る。これらの場
合について以下で別々に記載する。
【0052】 (IV.不確定性のない疎な対の関係行列) 上記の一般的なアルゴリズムは、対の関係行列が不完全な場合、即ち、対の関
係のいくつかが未知である場合にも適用され得る。この場合、関係が既知である
点の対に関してアルゴリズムが反復するということを除いて、上記のものと同様
のアルゴリズムが用いられ得る。この場合、アルゴリズムは、既知の対の関係を
満たす空間における配置を識別し、未知の対の関係は、細分の間に適合し、結果
的に既知の関係の満足な埋め込みに導く値をとる。
【0053】 欠けているデータの数に依存して、オリジナルの関係行列の2つ以上の満足な
埋め込み(写像)があってもよい。この場合、異なる配置(写像)は、異なる開
始配置または乱数種から得られ得る。分子の立体配置空間の探索のようないくつ
かの適用例において、この特徴は、他のいくつかの技術に対して、有意な利点を
提供する。オリジナルのアルゴリズム(以下のセクションを参照)の全ての変形
例は、このコンテキストにおいて、用いられ得る。
【0054】 (V.有界不確定性を有する対の関係行列) 上記の一般的なアルゴリズムは、対の関係が有界不確定性を有する場合、即ち
、対の関係のいくつかが、ある特定の固定された許容範囲内でのみ既知である(
例えば、関係が、指定された上界および下界を有する範囲または範囲の集合内に
あることが既知である)場合にも適用され得る。この場合、表示写像上の距離が
、対応する点が所定の境界の外にある場合にしか、訂正されないことを除いて、
上記のものと同様のアルゴリズムが用いられ得る。例えば、2つの対象、iとj
との間の関係が、上界および下界、それぞれ、rmaxおよびrminについて与えら
れると仮定する。この対象の対は、細分の間に選択され、表示写像上の対応する
像の距離が計算され、dijとして示される。dijがrmaxより大きい場合、像の
座標は、rmaxを終点距離として用いて更新される(EQ.12)。 xi(t+1)=f(t,xi(t),xj(t),rmax) EQ.12 反対に、dijがrminより小さい場合、像の座標は、rminを終点距離として用
いて更新される(EQ.13)。 xi(t+1)=f(t,xi(t),xj(t),rmin) EQ.13 dijが上界と下界との間にある場合
【0055】
【数10】 訂正は行われない。即ち、アルゴリズムは、現在の像間の距離が上界より大きい
場合には上界を、現在の像間の距離が下界より低い場合には下界を一致させるよ
うに試みる。像間の距離が上界および下界の間にある場合、訂正は行われない。
【0056】 このアルゴリズムは、対の関係のいくつかが許容離散値の有限集合によって、
または値の範囲の集合か、あるいは、それらの組合せによって与えられる場合、
拡大され得る。以下の記載のために、ゼロ幅の範囲として離散値を考慮する(例
えば、2の離散値は、範囲[2,2]として表され得る)。
【0057】 1つの仮説的対の関係、および表示写像上の対応する像の現在の距離の様々な
可能性を、図5に示す。図5において、陰を付けた領域510、512、および
514は、所与の対の関係について許容値域を示す。距離d1〜d5は、表示写
像上の対応する像間の現在の距離について、5つの異なる可能性を示す。矢印5
16、518、520、および522は、写像上の像に適用されなければならな
い訂正の方向を示す。矢印518および522は、左を向いて、表示写像上の同
伴像の座標が、像が互いに近くなるように更新されなければならないことを示す
。矢印516および520は、右を向いて、同伴像の座標が、像がより遠くなる
ように更新されなければならないことを示す。
【0058】 1つの範囲の場合のように、表示写像上の選択された対の像の現在の距離が任
意の指定された範囲内にある場合、座標は更新されない(即ち、図5のd1の場
合)。そうでない場合、最も近い範囲の境界を終点距離として用いて、訂正され
得る(即ち、図5のd2〜d5の場合)。例えば、所与の対象の対間の関係が範
囲[1,2]、[3,5]、および[6,7]内にあり、それぞれの像の現在の
距離が2.9である場合(図5のd5)、訂正は、3をEQ.8の終点距離(r ij )として用いて行われる。しかし、現在の距離が2.1である場合、座標は、
2をEQ.8の終点距離(rij)として用いて更新される。
【0059】 この決定的基準は、終点距離がランダムに、または現在の距離と2つの最も近
い範囲境界との間の差に依存する確率で選択される、確率的または確率論的基準
によって置き換えられ得る。上記の例(図5のd5)において、終点距離のよう
な2と3との間の確率論的選択が、例えば、それぞれ0.1および0.9の確率
で(即ち、2は、確率0.1で、終点距離として選択され、3は、確率0.9で
、選択され得る)、行われ得る。このような確率を得るために任意の方法が用い
られ得る。あるいは、2または3のいずれも、ランダムに終点距離として、選択
され得る。
【0060】 例えば、対の関係における、有界不確定性は、確率的誤差または定誤差、ある
いは物理測定結果と関連付けられたノイズを表し得、概して、対の関係ごとに異
なり得る。典型的な例として、多次元的な核磁気共鳴分光法における、核オーバ
ーハウザー効果(NOE)がある。
【0061】 不確定性を扱う別のアルゴリズムは、関係が不確定であると考えられる対象の
対の訂正の大きさを減少する。この理論体系において、訂正の大きさは、例えば
、EQ.9の学習速度によって決定されて、関係が不確定であると考えられる対
の関係に対して減少される。訂正の大きさは、対応する対の関係と関連付けられ
た不確定性の度合に依存し得る(例えば、訂正の大きさは、対応する対の関係と
関連付けられた不確定性と反比例し得る)。誤差の存在および/または大きさが
未知である場合、誤差は、アルゴリズムによって自動的に決定され得る(以下の
セクションVを参照)。
【0062】 (VI.非有界の不確定性を有する対の関係行列(不正データ)) 前述のセクションにおいて説明される概念は、対の関係のいくつかが不正デー
タを含むと考えられる場合、即ち、対の関係のいくつかが不正確で本質的に実測
値への関係を有さない場合に、適用され得る。この場合、アルゴリズムの間、「
問題のある」関係が検出されて、続くプロセスから取り除かれ得る。即ち、目的
は不正エントリを識別し、関係行列からこれらを取り除くことである。このプロ
セスによって、疎な関係行列が得られ、これは、上記のセクション1.2のアル
ゴリズムを用いて細分され得る。
【0063】 (VII.基本的なアルゴリズムの変形例) 多くの場合において、上記のアルゴリズムは、適切な統計的方法を用いてデー
タを予め順番にすることによって、加速され得る。例えば、近接度が、ベクトル
形式またはバイナリ形式で利用可能なデータから得られる場合、表示写像上の点
の初期配置は、主成分分析法を用いて計算され得る。好適な実施形態において、
初期配置は、特徴行列の最初の3つの主成分(即ち、データの多くの分散の原因
である、3つの潜在的変数)から構成され得る。実際には、この技術は、細分の
スピードに対して重大な効果を有し得る。実際、ランダムな初期配置が用いられ
る場合、トレーニング時間のかなりの部分が、典型的に大きな再構成によって特
徴付けられる表示写像の一般的な構造およびトポロジーを確立するために費やさ
れる。反対に、入力配置が部分的に順番にされている場合、誤差基準は比較的速
く許容レベルまで減少され得る。
【0064】 データが非常にクラスタ化している場合、サンプリングプロセスによって、低
密度領域が高密度領域より、非効率的に細分され得る。例示的な実施形態におい
て、この傾向は、低密度領域におけるサンプリング確率を増加させる、オリジナ
ルのアルゴリズムに対する修正によって、部分的に補償され得る。1つの実施形
態において、表示写像の重心が識別され、その点を中心とする同心のシェルが構
成される。一連の規則的な細分反復が、その後、実行され、そのたびにこれらの
シェルの中または間から点を選択する。このプロセスは、指定された数の周期で
繰返される。この段階には、その後、大域サンプリングを用いる規則的な細分の
段階が続き、プロセスが繰返される。
【0065】 概して、基本的なアルゴリズムは、短距離型の距離を、長距離型の距離と区別
しない。EQ.10および11は、重み付けを用いて、短距離型の距離が、長距
離型の距離よりも、より忠実に保護されることを確実にする方法を説明する。
【0066】 別の(補足的な)アプローチは、分離の近い点が、分離の長い点より、より広
範囲に渡ってサンプリングされることを確実にすることである。例えば、上記で
説明したものと同様の、大域細分および局所細分の周期が交代するシーケンスが
、採用され得る。この実施形態において、大域細分の段階が初期的に実行され、
その後、得られる表示写像が、規則的なグリッドに仕切られる。グリッドの各セ
ル内の点(対象)が、その後、局所細分の段階にかけられる(即ち、同じセル内
の点のみが比較され、細分される)。好適には、各セル内のサンプリングステッ
プの数が、そのセル内に含まれる点の数に比例しなければならない。このプロセ
スは、極めて平行可能である。この局所細分段階には、その後、他の大域細分段
階が続き、プロセスは指定された数の周期で繰返されるか、または指定された許
容範囲内に埋め込み誤差が最小化されるまで、繰返される。あるいは、グリッド
方法は、例えば、k−dツリーのような、近接点を識別する他の適切な方法によ
って置き換えられ得る。
【0067】 本明細書中に記載の方法は、増分細分に用いられる。それは、点の集合の編成
された表示写像から開始され、点の新たな集合は、オリジナルの写像を修正する
ことなしに加えられ得る。厳密に言えば、点の新たな集合がオリジナルの集合よ
り大幅に小さい場合、これは統計的に許容できる。例示的な実施形態において、
点の新たな集合は、上記の基本的なアルゴリズムの修正を用いて、存在する写像
に「拡散」され得る。具体的には、EQ.8および9は、入来する点のみを更新
するために用いられ得る。さらに、サンプリング手順は、選択された対が、入来
する集合から少なくとも1つの点を含むことを確実にする。即ち、これらの点の
うちの少なくとも1つが入来する集合に属するように、2点がランダムに選択さ
れる。あるいは、新たな点の各々が、上記のアプローチを用いて、独立的に拡散
され得る。
【0068】 (VIII.評価特性(特徴)、関係および距離測度) 例示的な実施形態において、対象間の関係は、表示写像上の対象間の類似性/
非類似性として表され得、対象に関連付けられた特性または特徴から得られ得る
。任意の類似性測度が、表示写像を構成するために用いられ得る。類似性または
非類似性を評価するために用いられる特性または特徴を、本明細書中で集合的に
「評価特性」と呼ぶこともある。
【0069】 例えば、対象が化合物である場合、対象間の類似性は、構造的類似性、化学的
類似性、物理的類似性、生物学的類似性、および/または化合物の構造または同
一性から得られ得る、いくつかの他のタイプの類似性測度に基づき得る。
【0070】 (A.連続または離散実数を有する評価特性) 類似性測度は、対象の集合と関連付けられる評価特性のリストから得られ得る
。例えば、対象が化合物である場合、評価特性は、化合物の集合と関連付けられ
る、物理的、化学的、および/または生物学的特性であり得る。この形式主義の
下では、対象はベクトルとして多変量特性空間において表され、それらの類似性
はいくつかの幾何学的距離測度によって計算され得る。
【0071】 例示的な実施形態において、特性空間は、1つ以上の特徴または記述子を用い
て規定される。化合物の例において、特性空間は、1つ以上の分子の特徴または
記述子を用いて規定され得る。このような分子の特徴には、トポロジーの指数、
物理化学的特性、静電界パラメータ、体積および表面パラメータ等が含まれ得る
。これらの特徴は、分子の体積および表面積、双極モーメント、オクタノール−
水分配係数、モル屈折度、生成熱、全エネルギー、イオン化ポテンシャル、分子
連結指数、2Dおよび3D自動相関ベクトル、3D構造および/またはファルマ
コフォリック(pharmacophoric)パラメータ、電場等を含み得る
が、これらに限定されない。
【0072】 しかし、本発明がこの実施形態に限定されないことが理解されるべきである。
例えば、分子の特徴は、酵素または受容体のような生物学的標的の配列(親和性
フィンガープリントとしても公知である)に対しての化合物の集合の観察された
生物活動を含み得る。実際に、化学データの任意のベクトルの表現が、本発明に
おいて用いられ得る。
【0073】 本発明は、化合物対象との適用例に限定されないことも理解されるべきである
。代わりに、本発明は、連続または離散実数を有する、評価特性に関連付けられ
た対象を含む、任意のデータ集合または対象と共に実現され得る。
【0074】 (1.評価特性の値が連続または離散実数の場合の関係または距離測度) 「距離測度」は、選択された評価特性に基づき、対象間の関係を決定するため
に用いられる、アルゴリズムまたは技術の一部である。任意の所与の状況におい
て用いられる特定の距離測度は、少なくとも部分的に、評価特性がとり得る値の
集合に依存する。
【0075】 例えば、評価特性が値として実数を取り得る場合、適切な距離測度は、EQ.
14に示す、ミンコフスキー計量である。
【0076】
【数11】 ただし、kは特性ベクトルの要素を示すために用いられ、r∈[1,∞]である
。r=1.0の場合、EQ.14は、シティブロックまたはマンハッタン計量で
ある。r=2.0の場合、EQ.14は、通常のユークリッド計量である。r=
∞の場合、EQ.14は、絶対座標距離の最大値であり、「優性」計量、「サッ
プ(sup)」計量、または「超計量」距離とも呼ばれる。r∈[1,∞]の任
意の値の場合、ミンコフスキー計量が真の計量であること、即ち、ミンコフスキ
ー計量は、距離公準、具体的には三角不等式に従うことが示され得る。
【0077】 (B.バイナリ値を有する評価特性) あるいは、対象の評価特性は、ビットが、特徴または特質の存在または不在、
あるいは潜在的な存在または不在を示すために用いられる、バイナリ形式で表さ
れ得る。
【0078】 例えば、対象が化学化合物の場合、対象は、各ビットが、標的分子における特
定の構造的特徴またはパターンの存在または不在を示す、下部構造のキーを用い
て、符号化され得る。このような特徴は、特定の要素の出現の存在、不在、また
は最小数(例えば、少なくとも1、2または3個の窒素原子の存在)、異常なま
たは重要な電子配置および原子タイプ(例えば、二重結合した窒素または芳香炭
素)、アルコール、アミン等の共通の官能基、ある特定の基本および複合リング
、3次元空間における、特定の分離でのファルマコフォリック群の対または三つ
組、および、個別のビットに値しない程まれであるが、起こる場合には極めて重
要である、異常な特徴の「離接」を含み得るが、これらに限定されない。典型的
には、これらの異常な特徴は、パターンのいずれか1つが標的の分子内に存在す
る場合に設定される、共通のビットを割り当てられる。
【0079】 あるいは、化合物の評価特性は、ビットの割り当てを行うための事前に定義さ
れた断片または特徴ディクショナリに依存しない、バイナリフィンガープリント
の形式で符号化され得る。代わりに、事前に定義された極限までの、分子内の全
てのパターンが、系統的に列挙され、ビット写像内の疑似乱数位置で少数のビッ
トをオンにする、ハッシングアルゴリズムに対する入力として機能を果たす。2
つの異なる分子が正確に同じフィンガープリントを有し得ることが考えられるが
、このようなことが起こる可能性は、最も単純な場合にも関わらず、極度に低い
。経験は、これらのフィンガープリントが、意義のある類似性の比較を可能にす
るように、分子構造についての十分な情報を、含むことを示唆する。
【0080】 (1.評価特性の値がバイナリである場合の距離測度) 複数の関係測度がバイナリ記述子と共に用いられ得る(ただし、評価特性はバ
イナリまたはバイナリフィンガープリントである)。最も頻繁に用いられるもの
は、xとyとの間で異なるビット数を測定する、正規化されたハミング距離:
【0081】
【数12】 2つの分子が共通に有し得る下部構造の数と比較して、2つの分子によって共有
される下部構造の数の測度である、TanimotoまたはJaccard係数
【0082】
【数13】 およびDice係数:
【0083】
【数14】 である。
【0084】 上記の等式において、AND(x,y)は、バイナリ集合xおよびy(両方の
集合において「オン」であるビット)の共通部分であり、IOR(x,y)は、
xおよびyの和または「包含的or」(xまたはyのいずれかにおいて「オン」
であるビット)であり、XORは、xおよびyの「排他的or」(xまたはyの
両方ではなく、いずれかにおいて「オン」であるビット)であり、|x|は、x
において「オン」であるビット数であり、Nは、ビットにおいて測定されるバイ
ナリ集合の長さ(定数)である。
【0085】 他の一般的な計量は、バイナリ集合の場合、以下の形式で計算し直される、ユ
ークリッド計量である。
【0086】
【数15】 ただし、NOT(y)は、yのバイナリ補数を示す。式|XOR(x,NOT(
y))|は、xおよびyにおいて同一であるビット数(1または0のいずれか)
を表す。ユークリッド距離は、バイナリ集合が比較的リッチ(rich)である
場合、類似性の良好な測度であり、類似性が相対感度で測定される状況において
、主に用いられる。
【0087】 化合物の例において、対象間の距離は、バイナリまたは多変量の表現を用いて
決定され得る。しかし、本発明は、この実施形態に限定されない。
【0088】 例えば、2つの化合物の間の類似性は、適切な3次元アラインメント法を用い
て分子の形を比較することによって決定され得るか、または指定された手順によ
り規定される類似性モデルによって推測され得る。例えば、このような類似性モ
デルの1つが、適切に符号化された対の化合物を与えられて類似性係数を予測す
るようにトレーニングされたニューラルネットワークであり得る。このようなニ
ューラルネットワークは、例えばユーザ入力によって決定されるような、構造対
のトレーニング集合およびこのような対の既知の類似性係数を用いて、トレーニ
ングされ得る。
【0089】 (C.評価特性の尺度構成法) 再びEQ.14を参照すると、特徴(即ち、評価特性)は、化合物間の関係を
評価するときに、それらの相対的貢献度を反映するように、異なって尺度構成さ
れる。例えば、特性Aは、2の重みを割り当てられ得、特性Bは、10の重みを
割り当てられ得る。従って、特性Bは、特性Aの5倍の影響を関係計算に対し有
する。
【0090】 従って、EQ.14は、EQ.19によって置き換えられ得る。
【0091】
【数16】 ただし、wkは、k番目の特性の重みである。このような重み付け因子の一例は
、正規化係数である。しかし、他の重み付け方式を用いてもよい。
【0092】 尺度構成(重み)は、写像全体を通じて均一である必要はない、即ち、得られ
る写像は同型である必要はない。以下では、均一の重みから得られる写像は、大
域的に重み付けされる(同型)と呼ばれ、不均一の重みから得られる写像は、局
所的に重み付けされる(非同型)と呼ばれる。局所的に重み付けされた写像上に
おいて、表示写像上の関係(または距離)は、類似性の局所測度を反映する。即
ち、表示写像の1つの領域において、類似性を決定するものが、表示写像の他の
領域において、類似性を決定するものと同じである必要はない。
【0093】 例えば、局所的に重み付けされた写像は、局所的に重み付けされた事例に基づ
く学習アルゴリズムから得られる類似性を反映するように用いられ得る。局所的
に重み付けされた学習は、トレーニングデータを平均化し、補間し、補外し、さ
もなければ結合するように、局所的に重み付けされたトレーニングを用いる。ほ
とんどの学習方法(モデル化または予測法とも呼ばれる)は、全てのトレーニン
グデータに合うように、1つのモデルを構成する。他方、局所モデルは、クエリ
の位置の周りの局所領域において、トレーニングデータを合わせるように試みる
。局所モデルの例には、最隣接、重み付けされた平均、および局所的に重み付け
された回帰が含まれる。局所的に重み付けされた学習は、VapnikのAdv
ances in Neural Information Processi
ng Systems、4:831、Morgan−Kaufman、San
Mateo,CA(1982)、BottouおよびVapnikのNeura
l Computation 4(6):888(1992)、ならびにVap
nikおよびBottouのNeural Computation 5(6)
:893 (1993)において、検討される。これらの文献全てが、その全文
を通じて本明細書中で参考として援用される。
【0094】 表示写像は、また、厳密に対称でない関係行列、即ち、rij≠rjiの関係行列
から構成され得る。このアプローチの潜在的な使用は、関係(即ち、関係関数)
が、例えば、点に基づく局所距離関数を用いて局所的に重み付けされたモデルに
おいて、局所的に規定される状況にある。この実施形態において、トレーニング
の各事例は、距離関数および対応するパラメータの値と関連付けられている。好
適には、これらの局所距離関係を反映する表示写像を構成するために、2点間の
距離が、それぞれの点の局所距離関数を用いて2度評価される。得られる距離は
、平均化され、上記の表示写像アルゴリズムにおける入力として用いられる。点
に基づく局所距離関数が、特徴空間を通じて連続的または半連続的な様態で変動
する場合、このアプローチは、潜在的に意義のある射影に導かれ得る。
【0095】 (IX.本発明の実行) (A.概略) 本発明は、様々なアルゴリズムを用いて様々な方法で実現され得、ハードウェ
ア、ソフトウェア、ファームウェア、およびそれらの任意の組合せを用いて実現
され得る。図6を参照すると、例示的なブロック図は、本発明を実現する、シス
テム610に含まれ得るモジュールおよびデータフローを示す。図6のブロック
図は、本発明の理解を助けるように意図される。本発明は、図6のブロック図に
示す例示的な実施形態に限定されない。
【0096】 システム610は、対象と関連付けられた関係データ630を格納する関係型
データベース612を含む。関係型データベース612によって収容され得る、
データのタイプおよび同伴関係は、本発明が、関係が規定され得る任意のタイプ
のデータと共に実現され得るように、境界を有さない。
【0097】 関係データ630は、1つ以上の様々なソースから提供され得る。例えば、評
価特性636に基づいて、関係630aは、外部ソース632から提供され得、
関係630bは、他のソース640から提供され得、関係データ630nは、オ
プションの関係発生器モジュール634によって発生され得る。オプションの関
係発生器モジュール634は、例えば、1つ以上の等式14〜19のような1つ
以上のアルゴリズムを実行する、ハードウェア、ソフトウェア、ファームウェア
、またはそれらの任意の組合せを含み得る。
【0098】 関係データ630は、座標モジュール616に提供される。例示的な実施形態
において、関係630は、座標モジュール616に、好適には、関係データベー
ス612からの任意の量の関係データ630を格納する行列である、関係行列6
14として提供される。
【0099】 座標モジュール616は、初期座標を、関係データ630によって関連するデ
ータ点または対象に割り当てる。初期座標は、ランダムに、または任意の他の技
術で割り当てられ得る。例えば、データは、予め順番に、または部分的に順番に
され得る。座標は、表示写像を包含する。表示写像は、線形またはディスプレイ
の表示写像であり得る。表示写像は、n次元の表示写像である。
【0100】 関係/座標部分集合618および同伴関係620は、座標修正モジュール62
2に提供される。例示的な実施形態において、一度に1つの関係/座標部分集合
618が、座標修正モジュール622に提供される。
【0101】 部分集合セレクタモジュール638が設けられて、座標修正モジュール622
に提供される関係/座標部分集合618を選択し得る。部分集合セレクタモジュ
ール638は、ランダムに、または、上記の方法のうち1つ以上を含む任意の他
の適切な方法で、関係/座標部分集合618を選択し得る。
【0102】 座標修正モジュール622は、類似性/非類似性(関係620)の正確または
不正確な測度結果に基づいて、表示写像上の対象の位置を修正する(即ち、座標
618を修正する)。より詳細には、座標修正モジュール622は、表示写像上
の対象間の距離を測定し、それらを同伴関係620と比較する。座標修正モジュ
ール622は、その後、この比較に基づいて、座標618を修正する。このよう
な距離は、直接的に、または他の表示属性を修正するように、用いられ得る。
【0103】 座標修正モジュール622は、上記の、1つ以上の従来の多次元的尺度構成法
または非線形写像アルゴリズムを実行する、ハードウェア、ソフトウェア、ファ
ームウェア、またはこれらの任意の組合せを含み得る。それに加えて、または、
代わりに、座標修正モジュール622は、例えば、1つ以上の等式8〜13、ま
たはそれらの変形のような、対の解析用の、1つ以上の新規なアルゴリズムを実
行する、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の
組合せを含み得る。
【0104】 座標修正モジュール622が、上述したように対の解析を行う場合、関係/座
標部分集合618および同伴関係620における座標間の距離の収束を確実にす
るように、学習速度λを適用し得る。座標修正モジュール622は、類似性/非
類似性(関係620)の正確または不正確な測度結果を表すように設計され得る
。例えば、座標修正モジュール622は、不確定性のない完全な対の行列、不確
定性のない疎な対の行列、有界不確定性を含む対の行列、非有界の不確定性を含
む対の行列(即ち、不正データ)、またはそれらの任意の組合せを処理するよう
にプログラムされ得る。座標修正モジュール622は、また、上述のように、さ
らなる対象またはデータ点を対象の集合に拡散するようにプログラムされ得る。
【0105】 座標修正モジュール622は、座標モジュール616に戻され、修正された座
標624を生成する。このプロセスは、座標618のさらなる部分集合および同
伴関係620ついて、繰返され、好適には、指定された許容範囲または何らかの
他の基準が満たされるまで、同じ関係/座標部分集合618および同伴関係62
0について繰返される。
【0106】 例示的な実施形態において、対象間の関係の視覚化が所望される場合、座標6
26は、ディスプレイ用のオプションの視覚化モジュール628に提供され得る
。本発明の反復プロセスが続く限り、修正された座標626は、オプションの視
覚化モジュール628に提供される。
【0107】 (B.コンピュータプログラムプロダクトにおける本発明の実行) 本発明は、1つ以上のコンピュータを用いて実現され得る。図2を参照すると
、例示的なコンピュータ202は、プロセッサ204のような、1つ以上のプロ
セッサを含む。プロセッサ204は、通信バス206に接続されている。様々な
ソフトウェア実施形態が、コンピュータシステムのこの例について説明されてい
る。この説明によって、他のコンピュータシステムおよび/またはコンピュータ
アーキテクチャを用いて本発明を実現する方法が、当業者にとって明らかになる
【0108】 コンピュータ202は、また、好適には、ランダムアクセスメモリ(RAM)
である、メインメモリ208を含み、1つ以上の二次記憶装置210も含み得る
。二次記憶装置210は、例えば、ハードディスクドライブ212および/また
はフロッピーディスクドライブ、磁気テープドライブ、光ディスクドライブ等を
表す、リムーバブル記憶ドライブ214を含み得る。リムーバブル記憶ドライブ
214は、周知の様態でリムーバブル記憶装置216から読み出すか、リムーバ
ブル記憶装置216に書き込む。リムーバブル記憶装置216は、リムーバブル
記憶ドライブ214によって読み出され、且つ書き込まれるフロッピーディスク
、磁気テープ、光ディスク等を表す。リムーバブル記憶装置216は、コンピュ
ータソフトウェアおよび/またはデータを格納したコンピュータ使用可能記憶媒
体を含む。
【0109】 別の実施形態において、コンピュータ202は、コンピュータプログラムまた
は他の命令がコンピュータ202にロードされることを可能にする、他の同様の
手段を含み得る。このような手段は、例えば、リムーバブル記憶装置220およ
びインターフェース218を含み得る。このようなものの例には、プログラムカ
ートリッジおよびカートリッジインターフェース(ビデオゲーム装置において見
受けられるようなもの)、リムーバブルメモリチップ(EPROMまたはPRO
M等)および関連付けられたソケット、ならびに、ソフトウェアおよびデータが
リムーバブル記憶装置220からコンピュータ202に転送されることを可能に
する他のリムーバブル記憶装置220およびインターフェース218が含まれ得
る。
【0110】 コンピュータ202は、また、通信インターフェース222を含み得る。通信
インターフェース222は、ソフトウェアおよびデータがコンピュータ202と
外部装置との間で転送されることを可能にする。通信インターフェース222の
例には、モデム、ネットワークインターフェース(イーサネットカード等)、通
信ポート、PCMCIAスロットおよびカード等が含まれるが、これらに限定さ
れない。通信インターフェース222を介して転送されるソフトウェアおよびデ
ータは、信号の形式(典型的には、搬送波上のデータ)であるが、この信号の形
式は、電子的、電磁気的、光学的、または通信インターフェース222によって
受信され得る他の信号であり得る。
【0111】 この文書において、用語「コンピュータプログラムプロダクト」は、概して、
リムーバブル記憶装置216、220、コンピュータ202から取り除かれ得る
ハードドライブ212、ならびに通信インターフェース222が受信するソフト
ウェアを搬送する信号等の媒体のことである。これらのコンピュータプログラム
プロダクトは、コンピュータ202にソフトウェアを提供する手段である。
【0112】 コンピュータプログラム(コンピュータ制御ロジックとも呼ばれる)は、メイ
ンメモリおよび/または二次記憶装置210に格納される。コンピュータプログ
ラムは、また、通信インターフェース222を介して受信され得る。このような
コンピュータプログラムは、実行される場合、コンピュータ202が本明細書中
に記載の本発明の特徴を行うことを可能にする。具体的には、コンピュータプロ
グラムは、実行される場合、プロセッサ204が本発明の特徴を行うことを可能
にする。従って、このようなコンピュータプログラムは、コンピュータ202の
コントローラを表す。
【0113】 本発明がソフトウェアを用いて実現される実施形態において、ソフトウェアは
、リムーバブル記憶装置214、ハードドライブ212、および/または通信イ
ンターフェース222を用いて、コンピュータプログラムプロダクトに格納され
、コンピュータ202にロードされ得る。制御ロジック(ソフトウェア)は、プ
ロセッサ204によって実行される場合、プロセッサ204が本明細書中に記載
の機能を行うことを可能にする。
【0114】 他の実施形態において、本発明の自動化された部分が、例えば、特定用途向け
集積回路(ASIC)等のハードウェアコンポーネントを用いて、ハードウェア
において、主に、または全体的に実現される。本明細書中に記載の機能を行うよ
うなハードウェア状態マシンの実行は、当業者にとって明らかである。
【0115】 さらに別の実施形態において、本発明は、ハードウェアおよびソフトウェアの
両方の組合せを用いて実現され得る。
【0116】 コンピュータ202は、グラフィカルユーザインターフェースおよびウィンド
ウ環境をサポートするオペレーティングシステムを実行する、コンピュータシス
テムのような任意の適切なコンピュータであり得る。適切なコンピュータシステ
ムは、Silicon Graphics, Inc.(SGI)のワークステ
ーション/サーバ、Sunのワークステーション/サーバ、DECのワークステ
ーション/サーバ、IBMのワークステーション/サーバ、IBMの互換性PC
、AppleのMacintosh、あるいは、Pentium Pro、また
はPentiumII等のIntelのPentium系の中から1つ以上のプ
ロセッサを用いているもののような、任意の他の適切なコンピュータである。適
切なオペレーティングシステムには、IRIX、OS/Solaris、Dig
ital Unix、AIX、Microsoft Windows95/NT
、Apple Mac OS、または他のオペレーティングシステムが含まれる
が、これらに限定されない。例えば、例示的な実施形態において、プログラムは
、IRIX6.4オペレーティングシステムを実行する、Silicon Gr
aphicsのOctaneワークステーション上で、X Window Sy
stemに基づくMotifグラフィカルユーザインターフェースを用いて、実
現および実行され得る。
【0117】 (C.本発明の動作) 図7を参照すると、本発明の動作がプロセスフローチャート700に示されて
いる。本発明の動作を、関係行列614が不確定性のない完全な対の関係行列で
ある、一般的な場合について示す。当業者であれば、上記の記載およびプロセス
フローチャート700に基づいて、例えば、関係行列614が不確定性のない疎
なnのまたは対の関係行列である場合、関係行列614が有界不確定性を有する
nのまたは対の関係行列である場合、関係行列614が非有界不確定性を有する
対の関係行列(即ち、不正データ)である場合等の他の状況に適応するように、
プロセスフローチャート700を改変することが可能である。
【0118】 関係行列614が不確定性のない完全な対の関係行列である、一般的な場合の
プロセスは、座標モジュール616が関係行列614を関係データベース612
から受信するステップ702から開始される。
【0119】 ステップ704において、座標モジュール616は、初期座標を、関係行列6
14内の関係と関連付けられた対象に割り当てる。初期座標の割り当ては、ラン
ダムに行われ得る。あるいは、初期座標は、予め順番にされるか、部分的に予め
順番にされ得る。
【0120】 ステップ706において、関係/座標部分集合618は、関係行列614から
修正のため選択され得る。部分集合618は、部分集合セレクタ638によって
、ランダムに、反ランダムに、系統的に、または部分的に系統的、等に選択され
得る。
【0121】 ステップ708において、選択された部分集合618および同伴関係620は
、座標修正モジュール622に提供される。座標修正モジュール622は、同伴
関係620に基づいて、関係/座標部分集合618内の座標を修正する。
【0122】 ステップ710において、座標修正をする他の部分集合を選択するかどうかの
判定が行われる。他の関係/座標部分集合618が修正される場合、プロセスは
ステップ706に戻って、他の関係/座標部分集合618が選択される。さもな
ければ、プロセスはステップ712で停止する。
【0123】 任意の例示的な実施形態において、ステップ714で座標626がディスプレ
イ用のオプションの視覚化モジュール628に提供される。ステップ714は、
ステップ706〜712のうちの1つ以上の間の任意の時間に行われ得る。
【0124】 他の任意の例示的な実施形態において、関係データ630は、ステップ702
の前に生成される。このオプションの例示的な実施形態において、評価特性63
6がステップ716で受信される。ステップ718で、関係発生器634は、評
価特性から関係データ630を生成する。ステップ720で、関係データ630
は、関係データベース612に提供される。
【0125】 プロセスは、関係データ630が関係行列614の形式で座標モジュールに提
供される、ステップ702に進む。
【0126】 (X.本発明の実施例) 本発明は、様々な適用例において、様々なタイプのデータと共に実現され得る
。例示的な実施形態において、本発明は、多次元空間における対象間の距離が、
何らかの指定された方法で計算された、対応する化合物の類似性および/または
非類似性(化合物の選択された特性または特徴に関連する)を表す、化合物に関
連するデータを視覚化およびインタラクティブに解析する、システム、方法、お
よび/またはコンピュータプログラムプロダクトとして実現され得る。得られる
写像は、適切なグラフィックス装置(例えば、グラフィックス端末)上に表示さ
れ、データ間の関係を明らかにするように、およびこれらの化合物に関連するタ
スクのアレイを開始するように、インタラクティブに解析される。
【0127】 ユーザは、写像する複数の化合物、および選択された化合物間の類似性/非類
似性を評価する方法を選択し得る。表示写像は、選択された化合物および選択さ
れた方法によって、生成され得る。表示写像は、選択された化合物の各々につい
て点を有し、任意の2点間の距離が対応する化合物間の類似性/非類似性を表す
。表示写像の一部分が、その後表示される。ユーザが、表示写像上に表れた化合
物をインタラクティブに解析することが可能になる。あるいは、全ての点(po
int)が、それぞれ複数の化合物または対象と対応し得る。
【0128】 図1は、本発明の例示的な実施形態による、計算環境102のブロック図であ
る。
【0129】 化学データの視覚化およびインタラクティブ解析モジュール104は、写像発
生モジュール106および1つ以上の補助ユーザインターフェースコンポーネン
ト108を含む。写像発生モジュール106は、化合物の1つ以上の選択された
特性または特徴(本明細書中で評価特性または特徴と呼ばれることもある)と関
連する化合物間の類似性を判定する。写像発生モジュール106は、1つ以上の
データベース120から、化合物および試薬についてのデータを取り出し、解析
することによって、この機能を果たす。
【0130】 化学データの視覚化およびインタラクティブ解析モジュール104は、通信媒
体118を介して1つ以上のデータベース120と通信する。通信媒体118は
、好適には、データバス、コンピュータネットワーク等のデータ通信手段の任意
のタイプである。
【0131】 ユーザインターフェースモジュール108は、好適には、2Dまたは3D表示
写像を適切なグラフィックス装置上に表示する。ユーザインターフェースモジュ
ール108は、人間のオペレータが、データ間の関係を明らかにするように、お
よび対応する化合物に関連するタスクのアレイを開始するように、表示写像内の
情報をインタラクティブに解析し、処理することを可能にする。
【0132】 ユーザインターフェースモジュール108は、ユーザが化合物を収集(例えば
、組合せのライブラリを表す)として編成することを可能にする。化合物収集に
属する情報は、好適には、1つ以上のデータベース120に格納される。
【0133】 入力装置114は、入力(データ、コマンド、クエリ等)を、人間のオペレー
タから受信し、このような入力を、例えば、化学データの視覚化およびインタラ
クティブ解析モジュール104に、通信媒体118を介して転送する。キーボー
ド、ポインティング装置(マウス、ローラーボール、トラックボール、ライトペ
ン等)、タッチスクリーン、音声認識等の、任意の、周知で適切な入力装置が、
本発明において用いられ得る。ユーザ入力は、また、格納され、その後、データ
/コマンドファイルから適切に取り出され得る。
【0134】 出力装置116は、人間のオペレータに情報を出力する。モニタ、プリンタ、
フロッピーディスクドライブ、または他の記憶装置、テキスト音声合成器等の任
意の、周知で適切な出力装置が、本発明において用いられ得る。
【0135】 化合物データの視覚化およびインタラクティブ解析モジュール104は、通信
媒体118を介して1つ以上の計算モジュール122とインタラクトし得る。
【0136】 図1の計算環境102に示されるコンポーネント(化学データの視覚化および
インタラクティブ解析モジュール104等)は、図2に示す例示的なコンピュー
タ202のような、1つ以上のコンピュータを用いて実現され得る。
【0137】 (A.例示的な実施形態の動作) 表示写像内の化合物を視覚化し、インタラクティブに処理するために実現され
る本発明の動作を、次に、図3に示すフローチャート302を参照しながら説明
する。特に記載されていない場合、以下に記載のユーザとのインタラクションは
、ユーザインターフェースモジュール108(図1)の動作によって得られる。
【0138】 ステップ304で、ユーザは、新たな表示写像に写像する1つ以上の化合物を
選択する。ユーザは、ファイルから化合物のリストを取り出すことによって、化
合物のリストに手動でタイプすることによって、および/またはグラフィカルユ
ーザインターフェース(GUI)を用いることによって、写像する化合物を選択
し得る。本発明は、ユーザが表示写像に表示する化合物を特定することを可能に
する他の手段を構想に入れている。
【0139】 ステップ306で、ユーザは、ステップ304で選択された化合物間の分子の
類似性/非類似性を評価するために用いられる方法を選択する。1つの実施形態
において、ステップ304で選択された化合物間の類似性/非類似性は、指定さ
れた評価特性の集合に基づいて、決定される(ステップ308)。上述したよう
に、評価特性は、ステップ304で選択された化合物の構造、機能、アイデンテ
ィティに関連する任意の特性であり得る。評価特性は、ステップ304で選択さ
れた化合物の構造上の性質、機能的性質、化学的性質、物理的性質、生物学的性
質等を含むが、これらに限定されない。
【0140】 本発明の1つの実施形態において、選択された評価特性は、2つの化合物間の
近接度(即ち、類似性/非類似性)を評価するときに、それらの相対的重要性を
反映するように、異なって尺度構成され得る。従って、ステップ306では、ま
た、ユーザは、選択された評価特性の各々について、尺度構成因子を選択する。
このような尺度構成因子の選択は任意であることに留意すべきである。ユーザは
、選択された評価特性の各々について、尺度構成因子を選択する必要はない。ユ
ーザが、所与の評価特性について尺度構成因子を選択しない場合、その評価特性
は、ユニティ(unity)のようなデフォルトの尺度構成因子を与えられる。
【0141】 あるいは、ステップ306で、ユーザは、ステップ304で選択された化合物
に属する類似性/非類似性の値を、データベース等のソースから取り出すことを
選択し得る。データベースにおけるこれらの類似性/非類似性の値は、予め生成
される。他の実施形態において、ユーザは、ステップ306で、類似性/非類似
性の値を任意の周知の技術または手順を用いて判定することを選択し得る。
【0142】 ステップ308で、写像発生モジュール106は、新たな表示写像を生成する
。この新たな表示写像は、ステップ304で選択された化合物の各々についての
点を含む。また、この新たな表示写像において、任意の2点間の距離は、対応す
る化合物の類似性/非類似性を表す。写像発生モジュール106が新たな表示写
像を生成する様態は、次に、図4のフローチャート402を参照しながら、さら
に説明される。
【0143】 ステップ404で、ステップ304で選択された化合物に対応する点の新たな
表示写像上の座標が初期化される。
【0144】 ステップ406で、ステップ304で選択された化合物i、jのうち2つが処
理のために選択される。
【0145】 ステップ408で、化合物i、j間の類似性/非類似性rijが、ステップ30
6でユーザが選択した方法に基づいて、判定される。
【0146】 ステップ410で、ステップ408で判定された類似性/非類似性rijに基づ
いて、表示写像上の化合物i、jに対応する点の座標が得られる。
【0147】 ステップ412で、トレーニング/学習パラメータが更新される。
【0148】 ステップ414で、終了するか否かの決定がされる。この時点で終了しないと
いう判定がされた場合、制御は、ステップ406に戻る。さもなければ、ステッ
プ416が行われる。
【0149】 ステップ416で、表示写像が出力される(即ち、表示写像の生成が完了する
)。
【0150】 フローチャート402のステップについての詳細は、上記に記載した。
【0151】 再度図3を参照すると、ステップ312で、写像ビューア112は、新たな表
示写像を出力装置116(コンピュータグラフィックスモニタ等)上に表示する
【0152】 ステップ314で、ユーザインターフェースモジュール108は、オペレータ
が表示された表示写像に表される化合物をインタラクティブに解析し、処理する
ことを可能にする。
【0153】 本発明は、ユーザが、存在する化合物視覚化表示写像(用語「化合物視覚化表
示写像」は、ここでは、表された表示写像を指す)を修正することを可能にする
。例えば、ユーザは、さらなる化合物を写像に加えたり、写像から化合物を取り
除いたり、写像上の化合物を強調表示したり等し得る。このような場合、フロー
チャート302の適切な機能的ステップが繰返される。例えば、ステップ304
(写像する化合物の選択)、ステップ310(表示写像の生成)、およびステッ
プ312(写像の表示)は、ユーザが存在する写像に新たな化合物を加えること
を選択する場合に繰返される。しかし、本発明の1実施形態によると、写像は、
存在する化合物視覚化表示写像に化合物を加える場合、ステップ310および3
12で増分的に細分され、表示される(この増分的な細分は、上述した)。
【0154】 上記の化合物の例は、任意の化学的エンティティを視覚化し、インタラクティ
ブに処理する場合にも有用である。このような化学的エンティティには、小さな
分子、ポリマー、ペプチド、タンパク質等が含まれるが、これらに限定はされな
い(しかしこれらのために用いられ得る)。上記の化合物の例は、また、これら
の化合物間の異なる類似性関係を表示するためにも用いられ得る。
【0155】 (XI.結論) 本発明は、特定の機能および関係の動作を示す機能的ビルディングブロック(
building block)の助けと共に、説明されてきた。これらの機能
的ビルディングブロックの境界は、説明の簡便化のために本明細書中で任意に規
定されてきた。特定の機能および関係が適切に行われる限り、代替の境界が規定
され得る。任意のこのような代替の境界は、本発明の範囲および精神の範囲内で
あり、当業者にとって明らかである。
【0156】 これらの機能的ビルディングブロックは、分離したコンポーネント、特定用途
向け集積回路、適切なソフトウェアを実行するプロセッサ、ならびに同等のもの
またはこれらの任意の組合せによって、実現され得る。これらの機能的ビルディ
ングブロックを実現する適切な回路部および/またはソフトウェアを発展させる
ことは、充分に当業者の範囲内である。
【0157】 上記の記載および実施例に基づいて、当業者であれば、本発明の範囲内にある
、広範で多様な適用例で本発明を実現し得る。
【0158】 本発明の様々な実施形態が上述されてきたが、例示する目的のみで提供され、
本発明を限定しないことが理解されるべきである。従って、本発明の広がりおよ
び範囲は、上記の例示的な実施形態のいずれによっても限定されるべきではなく
、特許請求の範囲およびその均等物によってのみ規定されるべきである。
【図面の簡単な説明】
【図1】 図1は、本発明の実施形態による、計算環境のブロック図である。
【図2】 図2は、本発明のコンポーネントを実現するために有用なコンピュータのブロ
ック図である。
【図3】 図3は、本発明の実施形態による、表示写像を視覚化およびインタラクティブ
に処理する際の本発明の動作を表すフローチャートである。
【図4】 図4は、本発明の実施形態による、表示写像が生成される様態を表すフローチ
ャートである。
【図5】 図5は、関係がある特定の許容範囲内で既知である、対象間の関係を概念的に
示す。
【図6】 図6は、対象間の関係を表すシステムのブロック図である。
【図7】 図7は、対象間の関係を表す方法を示すプロセスのフローチャートである。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,UG,ZW),E A(AM,AZ,BY,KG,KZ,MD,RU,TJ ,TM),AE,AL,AM,AT,AU,AZ,BA ,BB,BG,BR,BY,CA,CH,CN,CU, CZ,DE,DK,EE,ES,FI,GB,GD,G E,GH,GM,HR,HU,ID,IL,IN,IS ,JP,KE,KG,KP,KR,KZ,LC,LK, LR,LS,LT,LU,LV,MD,MG,MK,M N,MW,MX,NO,NZ,PL,PT,RO,RU ,SD,SE,SG,SI,SK,SL,TJ,TM, TR,TT,UA,UG,UZ,VN,YU,ZA,Z W (72)発明者 ロバノフ, ビクター エス. アメリカ合衆国 ペンシルベニア 19067, ヤードレー, コーナーストーン ドラ イブ 24305 (72)発明者 サレミ, フランシス アール. アメリカ合衆国 ペンシルベニア 19067, ヤードレー, ティンバー レイクス 1970 Fターム(参考) 4H006 AA02 AC90 5B046 AA00 HA09 5B080 DA06

Claims (26)

    【特許請求の範囲】
  1. 【請求項1】 対象間の関係を表示写像上の互いの距離として表す方法であ
    って、 (1)該対象を該表示写像に配置するステップと、 (2)該対象の部分集合を選択するステップであって、該選択された対象の部
    分集合が、該選択された部分集合内の対象間の同伴関係を有する、ステップと、 (3)該表示写像上の対象間の距離を、該対象間の関係および該距離に基づい
    て、修正するステップと、 (4)該対象の集合からのさらなる対象の部分集合について、該ステップ(2
    )および(3)を繰り返すステップと、 を包含する方法。
  2. 【請求項2】 前記ステップ(2)が、 (a)同伴の対の関係を有する対象の対を選択するステップ、 を包含する、請求項1に記載の方法。
  3. 【請求項3】 1つ以上の対象の対間の前記関係が未知であり、 (4)同伴関係が既知である対象の対についてのみ、前記ステップ(2)から
    (4)までを行うステップと、 (5)関係が既知でない前記表示写像上の対象間の距離が、該ステップ(2)
    から(4)までが行われる間に適合することを可能にするステップと、 をさらに包含する、請求項2に記載の方法。
  4. 【請求項4】 1つ以上の対象の対が有界不確定性によって関連し、 (5)関係値の許容範囲の集合として、有界不確定性を有する関係によって関
    連する、対象の対間の前記表示写像上の前記距離を、該距離が規定範囲を越えた
    場合にのみ修正するステップ、 をさらに包含する、請求項2に記載の方法。
  5. 【請求項5】 1つ以上の対象の対が有界不確定性によって関連し、 (5)許容できる関係値の上限として規定される、有界不確定性を有する関係
    によって関連する、対象の対間の表示写像上の前記距離を、該距離が規定された
    上限より高い場合にのみ修正するステップ、 をさらに包含する、請求項2に記載の方法。
  6. 【請求項6】 1つ以上の対象の対が有界不確定性によって関連し、 (5)許容できる関係値の下限集合として規定される、有界不確定性を有する
    関係によって関連する、対象の対間の前記表示写像上の前記距離を、該距離が規
    定範囲を越えた場合にのみ修正するステップ、 をさらに包含する、請求項2に記載の方法。
  7. 【請求項7】 1つ以上の対象の対が非有界不確定性によって関連し、 (5)前記対応する関係が非有界不確定性を含む、対象の対を識別するステッ
    プと、 (6)該非有界不確定性を含む関係を取り除くステップと、 (7)該対応する関係が取り除かれた対象間の距離が、前記ステップ(2)か
    ら(4)までが行われる間に適合することを可能にするステップと、 をさらに包含する、請求項2に記載の方法。
  8. 【請求項8】 前記ステップ(3)が、 (a)学習速度に基づいて、前記距離を修正するステップ、 を包含する、請求項2に記載の方法。
  9. 【請求項9】 前記ステップ(3)が、 (a)固定された学習速度に基づいて、前記距離を修正するステップ、 を包含する、請求項2に記載の方法。
  10. 【請求項10】 前記ステップ(3)が、 (a)適応学習速度に基づいて、前記距離を修正するステップ、 を包含する、請求項2に記載の方法。
  11. 【請求項11】 前記ステップ(3)が、 (a)動的学習速度に基づいて、前記距離を修正するステップ、 を包含する、請求項2に記載の方法。
  12. 【請求項12】 前記ステップ(3)が、 (a)前記選択された対象の対間の関係の関数である、学習速度に基づいて、
    前記距離を修正するステップ、 を包含する、請求項2に記載の方法。
  13. 【請求項13】 前記ステップ(3)が、 (a)1つ以上の前記選択された対象の関数である、学習速度に基づいて、前
    記距離を修正するステップ、 を包含する、請求項2に記載の方法。
  14. 【請求項14】 前記ステップ(3)が、 (a)前記選択された対の関数である、学習速度に基づいて、前記距離を修正
    するステップ、 を包含する、請求項2に記載の方法。
  15. 【請求項15】 前記ステップ(3)が、 (a)従来の多次元的尺度構成技術を用いて、前記距離を修正するステップ、 を包含する、請求項1に記載の方法。
  16. 【請求項16】 前記ステップ(3)が、 (a)従来の非線形尺度構成技術を用いて、前記距離を修正するステップ、 を包含する、請求項1に記載の方法。
  17. 【請求項17】 前記ステップ(3)が、 (a)従来技術を用いて、誤差関数を計算するステップと、 (b)勾配降手順を用いて、前記距離を修正するステップと、 を包含する、請求項1に記載の方法。
  18. 【請求項18】 前記対象が、化学的対象でないことが提供される、請求項
    1に記載の方法。
  19. 【請求項19】 対象間の関係を表示写像上の互いの距離として表す方法で
    あって、 (1)該対象を該表示写像に配置するステップと、 (2)該対象の部分集合を選択するステップであって、該選択された対象の部
    分集合が、該選択された部分集合内の対象間の同伴関係を有する、ステップと、 (3)該選択された部分集合から対象の対、同伴対の関係を有する対象の対を
    選択するステップと、 (3)該表示写像上の対象の対間の距離を、該対象の対間の関係および該距離
    に基づいて、修正するステップと、 (4)該選択された対象の集合からのさらなる対象の部分集合について、該ス
    テップ(3)および(4)を繰り返すステップと、 を包含する方法。
  20. 【請求項20】 (5)第2の対象の部分集合を選択するステップと、 (6)該第2の選択された対象の部分集合における、対象の対について、前記
    ステップ(3)および(4)を反復的に繰返すステップと、 をさらに包含する、請求項19に記載の方法。
  21. 【請求項21】 対象の集合における、対象間の関係を表示写像上に互いの
    距離として表すシステムであって、 該対象を表示写像に配置する座標モジュールと、 対象の部分集合を、対象間の該距離を修正するために選択する部分集合セレク
    タと、 該選択された部分集合における対象間の該距離を、該距離および対応する関係の
    差に基づいて、修正する座標修正モジュールと、 を備える、システム。
  22. 【請求項22】 対象の対を、対象間の前記距離を修正するために選択する
    、部分集合セレクタ、 をさらに備える、請求項21に記載のシステム。
  23. 【請求項23】 3つ以上の対象を、その間の距離を修正するために選択す
    る、部分集合セレクタと、 従来の技術を用いて、選択された部分集合内の対象間の該距離を受け取る、座
    標修正モジュールと、 をさらに備える、請求項21に記載のシステム。
  24. 【請求項24】 従来の技術を用いて誤差関数値を計算し、勾配降手順を用
    いて前記距離を修正する、座標修正モジュール、 をさらに備える、請求項23に記載のシステム。
  25. 【請求項25】 従来の多次元的尺度構成技術を用いて誤差関数値を計算す
    る、座標修正モジュール、 をさらに備える、請求項23に記載のシステム。
  26. 【請求項26】 従来の非線形尺度構成技術を用いて誤差関数値を計算する
    、座標修正モジュール、 をさらに備える、請求項23に記載のシステム。
JP2000547590A 1998-05-07 1999-05-07 多次元空間において近接データを表すシステム、方法、およびコンピュータプログラムプロダクト Withdrawn JP2002513979A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/073,845 1998-05-07
US09/073,845 US6453246B1 (en) 1996-11-04 1998-05-07 System, method, and computer program product for representing proximity data in a multi-dimensional space
PCT/US1999/009963 WO1999057686A1 (en) 1998-05-07 1999-05-07 System, method, and computer program product for representing proximity data in a multi-dimensional space

Publications (1)

Publication Number Publication Date
JP2002513979A true JP2002513979A (ja) 2002-05-14

Family

ID=22116149

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000547590A Withdrawn JP2002513979A (ja) 1998-05-07 1999-05-07 多次元空間において近接データを表すシステム、方法、およびコンピュータプログラムプロダクト

Country Status (16)

Country Link
US (1) US6453246B1 (ja)
EP (1) EP1078333B1 (ja)
JP (1) JP2002513979A (ja)
KR (1) KR20010043417A (ja)
CN (1) CN1306650A (ja)
AT (1) ATE259981T1 (ja)
AU (1) AU3887899A (ja)
CA (1) CA2331351A1 (ja)
DE (1) DE69914896T2 (ja)
DK (1) DK1078333T3 (ja)
EA (1) EA003796B1 (ja)
ES (1) ES2214854T3 (ja)
IL (1) IL139527A0 (ja)
PT (1) PT1078333E (ja)
WO (1) WO1999057686A1 (ja)
ZA (1) ZA200006388B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005250721A (ja) * 2004-03-03 2005-09-15 Hitachi High-Technologies Corp 蛋白質または高分子複合体の検索・照合方法及び装置
JP2012164301A (ja) * 2011-01-27 2012-08-30 Raytheon Co 等価検証のためのデジタル回路の状態素子をマッピングするためのシステム及び方法
JP2016537622A (ja) * 2013-10-01 2016-12-01 ソフトバンク・ロボティクス・ヨーロッパSoftbank Robotics Europe 音源の位置を特定する方法、および当該方法を用いる人型ロボット

Families Citing this family (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69333319T2 (de) * 1992-09-18 2004-09-16 Hitachi, Ltd. Datenverarbeitungssystem mit synchronem, dynamischem Speicher in integrierter Schaltkreistechnik
US6571227B1 (en) * 1996-11-04 2003-05-27 3-Dimensional Pharmaceuticals, Inc. Method, system and computer program product for non-linear mapping of multi-dimensional data
US20040186071A1 (en) 1998-04-13 2004-09-23 Bennett C. Frank Antisense modulation of CD40 expression
US7321828B2 (en) * 1998-04-13 2008-01-22 Isis Pharmaceuticals, Inc. System of components for preparing oligonucleotides
US20030228597A1 (en) * 1998-04-13 2003-12-11 Cowsert Lex M. Identification of genetic targets for modulation by oligonucleotides and generation of oligonucleotides for gene modulation
US7318051B2 (en) * 2001-05-18 2008-01-08 Health Discovery Corporation Methods for feature selection in a learning machine
AU745157B2 (en) * 1998-10-02 2002-03-14 Canon Kabushiki Kaisha Method and apparatus for generating a geometric skeleton of a polygonal shape
US6631211B1 (en) * 1999-07-08 2003-10-07 Perkinelmer Las, Inc. Interactive system for analyzing scatter plots
US20050158736A1 (en) * 2000-01-21 2005-07-21 Shaw Sandy C. Method for studying cellular chronomics and causal relationships of genes using fractal genomics modeling
US7366719B2 (en) 2000-01-21 2008-04-29 Health Discovery Corporation Method for the manipulation, storage, modeling, visualization and quantification of datasets
US20050079524A1 (en) * 2000-01-21 2005-04-14 Shaw Sandy C. Method for identifying biomarkers using Fractal Genomics Modeling
EP1252588B1 (en) * 2000-01-21 2007-06-27 Health Discovery Corporation Method for the manipulation, storage, modeling, visualization and quantification of datasets
US20050026199A1 (en) * 2000-01-21 2005-02-03 Shaw Sandy C. Method for identifying biomarkers using Fractal Genomics Modeling
US7624074B2 (en) * 2000-08-07 2009-11-24 Health Discovery Corporation Methods for feature selection in a learning machine
US6571228B1 (en) * 2000-08-09 2003-05-27 Po-Tong Wang Hybrid neural networks for color identification
US6778946B1 (en) * 2000-10-17 2004-08-17 International Business Machines Corporation Methods and apparatus for processing ranked fuzzy cartesian queries
US7174304B1 (en) * 2000-12-05 2007-02-06 Ims Health Incorporated System and method for estimating product distribution using a product specific universe
US7167851B2 (en) * 2001-01-31 2007-01-23 Accelrys Software Inc. One dimensional molecular representations
US7089592B2 (en) * 2001-03-15 2006-08-08 Brighterion, Inc. Systems and methods for dynamic detection and prevention of electronic fraud
US6721737B2 (en) * 2001-04-04 2004-04-13 International Business Machines Corporation Method of ranking items using efficient queries
KR100483321B1 (ko) * 2001-10-17 2005-04-15 한국과학기술원 하이퍼사각형 기반의 다차원 데이터 세그먼테이션을이용한 유사성 검색 장치와 그 방법
JP2003141159A (ja) * 2001-11-06 2003-05-16 Fujitsu Ltd 距離インデクスを用いた検索装置および方法
US7363311B2 (en) * 2001-11-16 2008-04-22 Nippon Telegraph And Telephone Corporation Method of, apparatus for, and computer program for mapping contents having meta-information
US20040034612A1 (en) * 2002-03-22 2004-02-19 Nick Mathewson Support vector machines for prediction and classification in supply chain management and other applications
US20040019432A1 (en) * 2002-04-10 2004-01-29 Sawafta Reyad I. System and method for integrated computer-aided molecular discovery
US8120618B2 (en) * 2002-06-11 2012-02-21 Hewlett-Packard Development Company, L.P. System and method for visualization of objects using energy minimization of customized potential functions
AU2003276998A1 (en) * 2002-09-27 2004-04-19 Carnegie Mellon University A sensitivity based pattern search algorithm for component layout
US7103609B2 (en) * 2002-10-31 2006-09-05 International Business Machines Corporation System and method for analyzing usage patterns in information aggregates
WO2005006179A1 (en) * 2003-07-10 2005-01-20 Health Discovery Corporation A method for identifying biomarkers using fractal genomics modeling
US20050114331A1 (en) * 2003-11-26 2005-05-26 International Business Machines Corporation Near-neighbor search in pattern distance spaces
JP2005234994A (ja) * 2004-02-20 2005-09-02 Fujitsu Ltd 類似度判定プログラム、マルチメディアデータ検索プログラム、類似度判定方法、および類似度判定装置
US20050222828A1 (en) * 2004-04-02 2005-10-06 Ehtibar Dzhafarov Method for computing subjective dissimilarities among discrete entities
CN101019122A (zh) * 2004-07-12 2007-08-15 阿托米斯蒂克斯公司 在非平衡条件下用于分子的量子化学模拟的方法和计算机系统
US20060052943A1 (en) * 2004-07-28 2006-03-09 Karthik Ramani Architectures, queries, data stores, and interfaces for proteins and drug molecules
US20060089812A1 (en) * 2004-10-25 2006-04-27 Jacquez Geoffrey M System and method for evaluating clustering in case control data
US8078488B2 (en) * 2005-01-25 2011-12-13 Ims Software Services Ltd. System and method for determining trailing data adjustment factors
US20060190288A1 (en) * 2005-01-22 2006-08-24 Ims Software Services Ltd. System and method for allocating prescriptions to non-reporting outlets
US8744897B2 (en) * 2005-01-22 2014-06-03 Ims Software Services Ltd. Sample store forecasting process and system
US20060290697A1 (en) * 2005-06-24 2006-12-28 Tom Sawyer Software System for arranging a plurality of relational nodes into graphical layout form
WO2007034096A1 (fr) * 2005-09-20 2007-03-29 France Telecom Procede de tri d'un ensemble de documents electroniques
US20070112667A1 (en) * 2005-10-31 2007-05-17 Dun And Bradstreet System and method for providing a fraud risk score
US7313454B2 (en) * 2005-12-02 2007-12-25 Mks Instruments, Inc. Method and apparatus for classifying manufacturing outputs
US20080133496A1 (en) * 2006-12-01 2008-06-05 International Business Machines Corporation Method, computer program product, and device for conducting a multi-criteria similarity search
US8271103B2 (en) 2007-05-02 2012-09-18 Mks Instruments, Inc. Automated model building and model updating
US8645440B2 (en) 2007-06-11 2014-02-04 Guy Rosman Acceleration of multidimensional scaling by vector extrapolation techniques
JP5052985B2 (ja) * 2007-07-31 2012-10-17 住友重機械工業株式会社 分子シミュレーション方法、分子シミュレーション装置、分子シミュレーションプログラム、及び該プログラムを記録した記録媒体
US8520906B1 (en) 2007-09-24 2013-08-27 Videomining Corporation Method and system for age estimation based on relative ages of pairwise facial images of people
ES2641290T3 (es) 2007-11-20 2017-11-08 Ionis Pharmaceuticals, Inc Modulación de la expresión de CD40
JP2011508320A (ja) * 2007-12-21 2011-03-10 エム ケー エス インストルメンツ インコーポレーテッド 部分的最小二乗分析(pls−ツリー)を用いたデータの階層編成
US8494798B2 (en) * 2008-09-02 2013-07-23 Mks Instruments, Inc. Automated model building and batch model building for a manufacturing process, process monitoring, and fault detection
US8499284B2 (en) * 2008-09-11 2013-07-30 Microsoft Corporation Visualizing relationships among components using grouping information
RU2382407C1 (ru) * 2008-11-21 2010-02-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ и система для обнаружения лица
US9069345B2 (en) * 2009-01-23 2015-06-30 Mks Instruments, Inc. Controlling a manufacturing process with a multivariate model
US8086327B2 (en) 2009-05-14 2011-12-27 Mks Instruments, Inc. Methods and apparatus for automated predictive design space estimation
US8577480B2 (en) 2009-05-14 2013-11-05 Mks Instruments, Inc. Methods and apparatus for automated predictive design space estimation
JP2011160379A (ja) * 2010-02-04 2011-08-18 Sony Corp 画像処理装置および方法、並びにプログラム
US8855804B2 (en) 2010-11-16 2014-10-07 Mks Instruments, Inc. Controlling a discrete-type manufacturing process with a multivariate model
US8577876B2 (en) * 2011-06-06 2013-11-05 Met Element, Inc. System and method for determining art preferences of people
US9429939B2 (en) 2012-04-06 2016-08-30 Mks Instruments, Inc. Multivariate monitoring of a batch manufacturing process
US9541471B2 (en) 2012-04-06 2017-01-10 Mks Instruments, Inc. Multivariate prediction of a batch manufacturing process
CN102789490B (zh) * 2012-07-04 2014-11-05 苏州大学 一种数据可视化方法及系统
US9336302B1 (en) 2012-07-20 2016-05-10 Zuci Realty Llc Insight and algorithmic clustering for automated synthesis
US10163034B2 (en) 2013-06-19 2018-12-25 Oracle International Corporation Tripoint arbitration for entity classification
US10896421B2 (en) 2014-04-02 2021-01-19 Brighterion, Inc. Smart retail analytics and commercial messaging
US20180053114A1 (en) 2014-10-23 2018-02-22 Brighterion, Inc. Artificial intelligence for context classifier
US10992675B2 (en) 2014-04-14 2021-04-27 Oracle International Corporation Anomaly detection using tripoint arbitration
US20150032589A1 (en) 2014-08-08 2015-01-29 Brighterion, Inc. Artificial intelligence fraud management solution
US20150339673A1 (en) 2014-10-28 2015-11-26 Brighterion, Inc. Method for detecting merchant data breaches with a computer network server
US20160055427A1 (en) 2014-10-15 2016-02-25 Brighterion, Inc. Method for providing data science, artificial intelligence and machine learning as-a-service
US20150066771A1 (en) 2014-08-08 2015-03-05 Brighterion, Inc. Fast access vectors in real-time behavioral profiling
US20160071017A1 (en) 2014-10-15 2016-03-10 Brighterion, Inc. Method of operating artificial intelligence machines to improve predictive model training and performance
US20160078367A1 (en) 2014-10-15 2016-03-17 Brighterion, Inc. Data clean-up method for improving predictive model training
US20160063502A1 (en) 2014-10-15 2016-03-03 Brighterion, Inc. Method for improving operating profits with better automated decision making with artificial intelligence
US10546099B2 (en) 2014-10-15 2020-01-28 Brighterion, Inc. Method of personalizing, individualizing, and automating the management of healthcare fraud-waste-abuse to unique individual healthcare providers
US11080709B2 (en) 2014-10-15 2021-08-03 Brighterion, Inc. Method of reducing financial losses in multiple payment channels upon a recognition of fraud first appearing in any one payment channel
US10290001B2 (en) 2014-10-28 2019-05-14 Brighterion, Inc. Data breach detection
US10671915B2 (en) 2015-07-31 2020-06-02 Brighterion, Inc. Method for calling for preemptive maintenance and for equipment failure prevention
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
US11416129B2 (en) 2017-06-02 2022-08-16 The Research Foundation For The State University Of New York Data access interface
US10229092B2 (en) 2017-08-14 2019-03-12 City University Of Hong Kong Systems and methods for robust low-rank matrix approximation
US20190342297A1 (en) 2018-05-01 2019-11-07 Brighterion, Inc. Securing internet-of-things with smart-agent technology
US10721256B2 (en) 2018-05-21 2020-07-21 Oracle International Corporation Anomaly detection based on events composed through unsupervised clustering of log messages
US11178161B2 (en) 2019-04-18 2021-11-16 Oracle International Corporation Detecting anomalies during operation of a computer system based on multimodal data

Family Cites Families (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61223941A (ja) 1985-03-29 1986-10-04 Kagaku Joho Kyokai 化学構造の検索方法
US4773099A (en) * 1985-10-10 1988-09-20 The Palantir Corporation Pattern classification means for use in a pattern recognition system
US4908773A (en) 1987-04-06 1990-03-13 Genex Corporation Computer designed stabilized proteins and method for producing same
US4859736A (en) 1987-03-30 1989-08-22 Ciba-Geigy Corporation Synthetic polystyrene resin and its use in solid phase peptide synthesis
US4939666A (en) 1987-09-02 1990-07-03 Genex Corporation Incremental macromolecule construction methods
US4935875A (en) 1987-12-02 1990-06-19 Data Chem, Inc. Chemical analyzer
US5147608A (en) 1988-04-29 1992-09-15 Millipore Corporation Apparatus and process for performing repetitive chemical processing
US5010175A (en) 1988-05-02 1991-04-23 The Regents Of The University Of California General method for producing and selecting peptides with specific properties
EP0355628B1 (de) 1988-08-24 1993-11-10 Siemens Aktiengesellschaft Verfahren zur chemischen Dekontamination der Oberfläche eines metallischen Bauteils einer Kernreaktoranlage
US5025388A (en) 1988-08-26 1991-06-18 Cramer Richard D Iii Comparative molecular field analysis (CoMFA)
US5265030A (en) 1990-04-24 1993-11-23 Scripps Clinic And Research Foundation System and method for determining three-dimensional structures of proteins
US5723289A (en) 1990-06-11 1998-03-03 Nexstar Pharmaceuticals, Inc. Parallel selex
IE66205B1 (en) 1990-06-14 1995-12-13 Paul A Bartlett Polypeptide analogs
US5650489A (en) 1990-07-02 1997-07-22 The Arizona Board Of Regents Random bio-oligomer library, a method of synthesis thereof, and a method of use thereof
US5167009A (en) 1990-08-03 1992-11-24 E. I. Du Pont De Nemours & Co. (Inc.) On-line process control neural network using data pointers
US5181259A (en) * 1990-09-25 1993-01-19 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration General method of pattern classification using the two domain theory
US5155801A (en) 1990-10-09 1992-10-13 Hughes Aircraft Company Clustered neural networks
US5331573A (en) 1990-12-14 1994-07-19 Balaji Vitukudi N Method of design of compounds that mimic conformational features of selected peptides
US5260882A (en) 1991-01-02 1993-11-09 Rohm And Haas Company Process for the estimation of physical and chemical properties of a proposed polymeric or copolymeric substance or material
US5499193A (en) 1991-04-17 1996-03-12 Takeda Chemical Industries, Ltd. Automated synthesis apparatus and method of controlling the apparatus
AU2408292A (en) 1991-07-11 1993-02-11 Regents Of The University Of California, The A method to identify protein sequences that fold into a known three-dimensional structure
JPH07117950B2 (ja) * 1991-09-12 1995-12-18 株式会社エイ・ティ・アール視聴覚機構研究所 パターン認識装置およびパターン学習装置
US5270170A (en) 1991-10-16 1993-12-14 Affymax Technologies N.V. Peptide library and screening method
US5240680A (en) 1991-12-19 1993-08-31 Chiron Corporation Automated apparatus for use in peptide synthesis
US6037135A (en) 1992-08-07 2000-03-14 Epimmune Inc. Methods for making HLA binding peptides and their uses
DE69328640T2 (de) * 1992-02-07 2000-09-28 Canon K.K., Tokio/Tokyo Verfahren und Einrichtung zur Mustererkennung
US5573905A (en) 1992-03-30 1996-11-12 The Scripps Research Institute Encoded combinatorial chemical libraries
US5288514A (en) 1992-09-14 1994-02-22 The Regents Of The University Of California Solid phase and combinatorial synthesis of benzodiazepine compounds on a solid support
US5565325A (en) 1992-10-30 1996-10-15 Bristol-Myers Squibb Company Iterative methods for screening peptide libraries
JP2513395B2 (ja) 1992-11-09 1996-07-03 株式会社島津製作所 ペプチドアミド合成用リンカ―
WO1994028504A1 (en) 1993-05-21 1994-12-08 Arris Pharmaceutical A machine-learning approach to modeling biological activity for molecular design and to modeling other characteristics
US5703792A (en) 1993-05-21 1997-12-30 Arris Pharmaceutical Corporation Three dimensional measurement of molecular diversity
US5544352A (en) 1993-06-14 1996-08-06 Libertech, Inc. Method and apparatus for indexing, searching and displaying data
US5679582A (en) 1993-06-21 1997-10-21 Scriptgen Pharmaceuticals, Inc. Screening method for identifying ligands for target proteins
US5585277A (en) 1993-06-21 1996-12-17 Scriptgen Pharmaceuticals, Inc. Screening method for identifying ligands for target proteins
AU689116B2 (en) 1993-06-21 1998-03-26 Aventisub Ii Inc. Selectively cleavable linkers based on iminodiacetic acid ester bonds
US5434796A (en) 1993-06-30 1995-07-18 Daylight Chemical Information Systems, Inc. Method and apparatus for designing molecules with desired properties by evolving successive populations
JP2948069B2 (ja) 1993-09-20 1999-09-13 株式会社日立製作所 化学分析装置
US5598510A (en) 1993-10-18 1997-01-28 Loma Linda University Medical Center Self organizing adaptive replicate (SOAR)
JPH09511828A (ja) 1994-04-05 1997-11-25 ファーマジェニクス,インコーポレイテッド 化合物ライブラリー内の活性化合物の確認と識別
US5602938A (en) * 1994-05-20 1997-02-11 Nippon Telegraph And Telephone Corporation Method of generating dictionary for pattern recognition and pattern recognition method using the same
US5549974A (en) 1994-06-23 1996-08-27 Affymax Technologies Nv Methods for the solid phase synthesis of thiazolidinones, metathiazanones, and derivatives thereof
EP0694855B1 (en) * 1994-07-28 2002-05-02 International Business Machines Corporation Search/sort circuit for neural networks
US5463564A (en) 1994-09-16 1995-10-31 3-Dimensional Pharmaceuticals, Inc. System and method of automatically generating chemical compounds with desired properties
US5574844A (en) 1994-09-22 1996-11-12 International Business Machines Corporation Computer system and method for processing atomic data to calculate and exhibit the properties and structure of matter
US5553225A (en) 1994-10-25 1996-09-03 International Business Machines Corporation Method and apparatus for combining a zoom function in scroll bar sliders
US5712171A (en) 1995-01-20 1998-01-27 Arqule, Inc. Method of generating a plurality of chemical compounds in a spatially arranged array
US5845225A (en) 1995-04-03 1998-12-01 Mosher; Frederick A. Microcomputer controlled engine cleaning system
US5807754A (en) 1995-05-11 1998-09-15 Arqule, Inc. Combinatorial synthesis and high-throughput screening of a Rev-inhibiting arylidenediamide array
US5602755A (en) 1995-06-23 1997-02-11 Exxon Research And Engineering Company Method for predicting chemical or physical properties of complex mixtures
US6337183B1 (en) 1995-09-08 2002-01-08 Scriptgen Pharmaceuticals, Inc. Screen for compounds with affinity for nucleic acids
US5811241A (en) 1995-09-13 1998-09-22 Cortech, Inc. Method for preparing and identifying N-substitued 1,4-piperazines and N-substituted 1,4-piperazinediones
US5734796A (en) 1995-09-29 1998-03-31 Ai Ware, Inc. Self-organization of pattern data with dimension reduction through learning of non-linear variance-constrained mapping
CA2184195C (en) 1995-10-25 2002-04-16 Andrew Pakula Screening method for identifying ligands for target proteins
CA2236339A1 (en) 1995-12-07 1997-06-12 Robert T. Sauer A fluorescence-based screening method for identifying ligands
US5712564A (en) 1995-12-29 1998-01-27 Unisys Corporation Magnetic ink recorder calibration apparatus and method
WO1997027559A1 (en) 1996-01-26 1997-07-31 Patterson David E Method of creating and searching a molecular virtual library using validated molecular structure descriptors
US5995938A (en) 1996-02-27 1999-11-30 Whaley; Susan S. Medication compliance system
US6014661A (en) 1996-05-06 2000-01-11 Ivee Development Ab System and method for automatic analysis of data bases and for user-controlled dynamic querying
US6026397A (en) 1996-05-22 2000-02-15 Electronic Data Systems Corporation Data analysis system and method
EP0818744A3 (en) 1996-07-08 1998-07-08 Proteus Molecular Design Limited Process for selecting candidate drug compounds
WO1998020437A2 (en) 1996-11-04 1998-05-14 3-Dimensional Pharmaceuticals, Inc. System, method and computer program product for identifying chemical compounds having desired properties
US5861532A (en) 1997-03-04 1999-01-19 Chiron Corporation Solid-phase synthesis of N-alkyl amides
US5908960A (en) 1997-05-07 1999-06-01 Smithkline Beecham Corporation Compounds
US5933819C1 (en) 1997-05-23 2001-11-13 Scripps Research Inst Prediction of relative binding motifs of biologically active peptides and peptide mimetics
US5960443A (en) 1997-07-25 1999-09-28 Young; David E. Quantitative visual system for comparing parameters which characterize multiple complex entities
US6049797A (en) 1998-04-07 2000-04-11 Lucent Technologies, Inc. Method, apparatus and programmed medium for clustering databases with categorical attributes

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005250721A (ja) * 2004-03-03 2005-09-15 Hitachi High-Technologies Corp 蛋白質または高分子複合体の検索・照合方法及び装置
JP2012164301A (ja) * 2011-01-27 2012-08-30 Raytheon Co 等価検証のためのデジタル回路の状態素子をマッピングするためのシステム及び方法
JP2016537622A (ja) * 2013-10-01 2016-12-01 ソフトバンク・ロボティクス・ヨーロッパSoftbank Robotics Europe 音源の位置を特定する方法、および当該方法を用いる人型ロボット
US10222447B2 (en) 2013-10-01 2019-03-05 Softbank Robotics Europe Method for locating a sound source, and humanoid robot using such a method

Also Published As

Publication number Publication date
AU3887899A (en) 1999-11-23
EA003796B1 (ru) 2003-10-30
IL139527A0 (en) 2001-11-25
PT1078333E (pt) 2004-07-30
WO1999057686A1 (en) 1999-11-11
DE69914896T2 (de) 2004-12-09
ES2214854T3 (es) 2004-09-16
EP1078333B1 (en) 2004-02-18
EA200001159A1 (ru) 2001-06-25
DK1078333T3 (da) 2004-06-07
ATE259981T1 (de) 2004-03-15
DE69914896D1 (de) 2004-03-25
EP1078333A1 (en) 2001-02-28
CA2331351A1 (en) 1999-11-11
CN1306650A (zh) 2001-08-01
US6453246B1 (en) 2002-09-17
KR20010043417A (ko) 2001-05-25
ZA200006388B (en) 2001-05-23

Similar Documents

Publication Publication Date Title
JP2002513979A (ja) 多次元空間において近接データを表すシステム、方法、およびコンピュータプログラムプロダクト
Kwon et al. What would a graph look like in this layout? a machine learning approach to large graph visualization
US7139739B2 (en) Method, system, and computer program product for representing object relationships in a multidimensional space
US6295514B1 (en) Method, system, and computer program product for representing similarity/dissimilarity between chemical compounds
Bar-Joseph et al. Continuous representations of time-series gene expression data
CN100429650C (zh) 在计算机上执行的用于处理多维数据的方法
Thompson et al. Predicting solvent accessibility: higher accuracy using Bayesian statistics and optimized residue substitution classes
JP2002543525A (ja) 多次元データの非線形マッピングのための方法、システムおよびコンピュータプログラム製品
US20060052943A1 (en) Architectures, queries, data stores, and interfaces for proteins and drug molecules
EP3779733A1 (en) Information retrieval method
CA2942106A1 (en) Aligning and clustering sequence patterns to reveal classificatory functionality of sequences
DasGupta et al. Models and algorithms for biomolecules and molecular networks
Mirceva et al. Efficient approaches for retrieving protein tertiary structures
US7054757B2 (en) Method, system, and computer program product for analyzing combinatorial libraries
Dubey et al. Usage of clustering and weighted nearest neighbors for efficient missing data imputation of microarray gene expression dataset
JP2002537605A (ja) マッチングエンジン
Xue et al. Cell-based partitioning
US20060178831A1 (en) Methods, systems, and computer program products for representing object realtionships in a multidimensional space
Kirchoff et al. Utilizing Low-Dimensional Molecular Embeddings for Rapid Chemical Similarity Search
MXPA00010727A (en) System, method,and computer program product for representing proximity data in a multi-dimensional space
Blanchet et al. A model-based approach to gene clustering with missing observation reconstruction in a Markov random field framework
JP2001265788A (ja) 文書分類方法及び装置及び文書分類プログラムを格納した記録媒体
JPWO2002050767A1 (ja) 多変量で記述された大量情報を高精度に分類する方法およびシステム
Singh Surface similarity-based molecular query-retrieval
CN116959589A (zh) 蛋白质索引的生成方法、蛋白质片段的查询方法及装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060801