JP3235763B2

JP3235763B2 - 共通構造抽出装置

Info

Publication number: JP3235763B2
Application number: JP01080595A
Authority: JP
Inventors: 聖一相川; 史子松澤; 真弓冨川
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1994-02-28
Filing date: 1995-01-26
Publication date: 2001-12-04
Anticipated expiration: 2016-12-04
Also published as: JPH07287717A; US6453064B1

Description

【発明の詳細な説明】

【０００１】（目次）産業上の利用分野従来の技術（図７９）発明が解決しようとする課題課題を解決するための手段（図１）作用（図１）実施例（Ａ）本実施例の基本的な構成の説明（図２〜図４，図
８０）（Ｂ）本実施例の基本的な動作の説明（図５〜図４４）（Ｃ）本実施例の装置を適用したシステムの説明（図４
５〜図７８）（Ｄ）本実施例の効果の説明発明の効果

【０００２】

【産業上の利用分野】本発明は、順序付けられた点集合
により形成された二つの立体構造から共通構造を抽出す
る共通構造抽出装置に関し、特に、複数の立体構造を持
つ物質から類似する共通部分を抽出・検索する装置に関
する。物理，化学等の分野では新しい（未知の）物質の
性質を調べたり、新しい物質を人工的に創製するため
に、分子構造を分析し、物質の持つ機能の発現メカニズ
ムの解明が行なわれている。

【０００３】これまでの研究成果により、物質の持つ機
能と立体構造との間には密接な関係があることが知られ
ており、構造的に類似した部分（あるいは特異的な部
分）が物質の機能に大きく関与すると考えられている。
そこで、Ｘ線結晶解析やＮＭＲ(Nuclear Magnetic Reso
nance;核磁気共鳴）等の手法で物質の立体構造を決定
し、その結果明らかになった立体構造のデータベース化
がはかられている。

【０００４】研究者はそのようなデータベースから立体
構造中の類似部分を抽出したり検索する場合、一連の面
倒な作業を行なう必要があったが、自動的に抽出および
検索することができれば、これら一連の作業の負担を軽
減することができる。

【０００５】

【従来の技術】近年、新規物質の解明，創製や既知の物
質の機能改変を行なうため、Ｘ線結晶解析やＮＭＲ等の
手法で目的とする物質の立体構造を決定し、決定された
立体構造をデータベースに蓄積する作業が進められてい
る。その代表的なデータベースとしてタンパク質，リボ
核酸（ＲＮＡ）等の立体構造を登録したプロテイン・デ
ータ・バンク（ＰＤＢ:Protein Data Bank）が世界的に
普及している。また、化学物質が登録されているデータ
ベースとしては、ケンブリッジ・ストラクチャー・デー
タベース（ＣＳＤ：Cambridge Structural Database)が
知られている。

【０００６】タンパク質は、複数のアミノ酸がペプチド
結合によって一本の鎖のように連結し、この鎖が生体内
で折たたまることによって立体構造を形成し、各種の機
能を発現している。各アミノ酸は、Ｎ（窒素）末端から
Ｃ（炭素）末端に向けて１から順に番号付けることによ
って表現される。これらの番号は、アミノ酸番号，アミ
ノ酸残基番号など等と呼ばれている。

【０００７】タンパク質は、通常、２０種あまりのアミ
ノ酸から成り、αヘリックス構造をなす部分，ジクザグ
の直線的に伸びたベータ構造の部分，無秩序なランダム
コイル構造（糸巻き構造）の部分を各種の割合で含んで
安定的に配置される。また、各アミノ酸は、その種類に
応じて複数の原子により構成される。従って、ＰＤＢに
は、タンパク質の名前，管理番号，タンパク質を形成す
るアミノ酸番号，各アミノ酸を構成する各原子の種類と
三次元座標等の情報が登録されている。

【０００８】これまでの研究成果により、物質の立体構
造とその機能との間には密接な関係があることが知られ
ており、機能と構造との関係を解明するための作業が進
められている。その中でも、同じ機能を持つ物質間で構
造的に類似した部分（あるいは特異的な部分）が物質の
機能に大きく関与すると考えられるため、立体構造中に
共通に存在する類似な構造を捜し出すことは必要不可欠
である。

【０００９】しかし、現状では、物質の立体構造の三次
元座標から直接特徴的な部分を取り出す手法が無いた
め、研究者が、各立体構造を３Ｄ（３次元）グラフィッ
クシステムで表示することにより人手で特徴的な部分を
探している。一般に、物質には定まった向きの決め方が
無く、一方の物質を基準としてもう一方の物質を回転さ
せながら特徴的な部分を探し出すため、これらの作業に
はかなりの時間を要している。

【００１０】研究者が類似な立体構造を探す際、物質の
立体構造の類似性の尺度としてｒｍｓｄ(root mean squ
are distance) 値を使用している。このｒｍｓｄ値は、
互いに対応付けられた物質の構成要素間の平均二乗距離
の平方根を表す値である。経験的には、物質間のｒｍｓ
ｄ値が１Å（オングストローム）以下の場合は、それら
の物質はきわめて類似していると考えられている。

【００１１】図７９（Ａ）〜（Ｄ）により、ｒｍｓｄ値
の一般的な算出手法を説明する。例えば、図７９（Ａ）
に示すような点集合Ｐ＝｛ｐ₁，ｐ₂…，ｐ_i…，
ｐ_N｝で表される物質Ａと、図７９（Ｂ）に示すような
点集合Ｔ＝｛ｔ₁，ｔ₂…，ｔ_j…，ｔ_N｝で表される
物質Ｂとがあるものとする。これらの物質Ａと物質Ｂを
構成する要素（点）を、図７９（Ｃ）に示すように互い
に対応付け、対応付けられた要素間のｒｍｓｄ値が最小
になるように、図７９（Ｄ）に示すごとく物質Ｂを回転
あるいは移動させて物質Ａに重ね合わせる。ｒｍｓｄ値
は、対応付ける点の数をＮ、回転行列をＵ、対応付けら
れた各点の重みをｗ_kとすると、次式で算出される。

【００１２】

【数１】

【００１３】なお、この対応付けられた点同士間でｒｍ
ｓｄ値を最小化する物質の回転，移動を求める手法はカ
ブシュ(Kabsh）等により提案され、現在広く利用されて
いる。しかし、この手法は同数の点同士を比較するた
め、一方の物質中のどの構成要素を他方の物質のどの構
成要素に対応付けるとｒｍｓｄ値が最小になるかは、研
究者が試行錯誤しながら求めているのが現状である。

【００１４】また、新しい物質を創製するためには、既
存の物質を調べる必要がある。例えば、ある物質の耐熱
性を強化したい場合には、耐熱性の強い物質に共通する
構造を探し出し、そのような構造を新たに作成する物質
に付加することによって機能の強化がはかられていく。
従って、データベースの中から必要な構造を検索する機
能が必要になるが、前述の理由により同様にコンピュー
タグラフィックシステムを用いて研究者が試行錯誤しな
がら構造をデータベースから探し出しているのが現状で
ある。

【００１５】さらに、近年、タンパク質の設計，改良に
おいても類似構造の重要性が認識されている。その例の
一つとして、Human Lysozyme（ＨＬ）の機能の改良実験
がある。カルシウムイオンを結合する活性を持たないタ
ンパク質ＨＬの立体構造中に、カルシウムイオンを結合
するタンパク質αラクトアルブミン（Lactalbumin)と類
似な構造が存在することが分かった。

【００１６】そこで、ＨＬ中の該当部分のアミノ酸の種
類を遺伝子組み替え操作で置換する実験を行なった結
果、カルシウムイオンと結合するようになったという報
告がある〔Kuroki,R. et. al. Proc.Natl.Acad.Sci.US
A, 86,6903-6907,(1989) 〕。この例からも分かるよう
に、構造の類似性に着目することにより、タンパク質の
設計，改良を行なう上で非常に重要な情報が得られる。

【００１７】本発明の出願人は、立体構造を形成する点
集合，順序関係のある点集合および部分的に対応付けら
れた点集合同士をｒｍｓｄ値が最適な値になるように重
ね合わせることや、タンパク質の立体構造データベース
から類似性の高い構造を探し出すことを目的とした発明
「立体構造処理装置」を提案している（特願平４−３３
１７０３号，平成４年１２月１１日出願；特開平６−１
８０７３７号公報参照）。

【００１８】上述した既出願の発明によれば、点集合で
表す一定個数の３次元座標の点の組み合わせが検索キー
（プローブ）として用意され、この点集合に対してデー
タベースに格納された複数の物質の各立体構造を表す点
集合について検索を行ない、プローブとなる点集合と同
じまたは類似の構造が、物質の立体構造の中の一部の構
造としてそなえられているかどうか検索するものであ
る。

【００１９】そのために、二つの点集合の各要素を対応
付ける際に、対象をずらして対応付けたり、木構造によ
り点の対応付けの組み合わせを作る等の方法が用いられ
る。そして、幾何学的な関係による候補（対応が付いた
と判定する点）の絞り込み、所定の閾値条件による候補
の絞り込み、または点の属性による候補の絞り込み等を
行ない、これらを満たす要素の組み合わせを生成する。
この後、生成された組み合わせの中で各点間の距離の平
均（ｒｍｓｄ値に対応）が小さくなる点集合間の対応付
けを探し出すことにより、二つの立体構造の最も一致す
る重ね合わせのための位置と方向を算出し、算出された
重ね合わせの結果を検索結果として出力することを基本
とする。

【００２０】上記の幾何学的な関係による候補の絞り込
みは、下記項目〜に記載するような手法にて行なわ
れ、また、上記の所定の閾値条件による候補の絞り込み
は、下記項目に記載するような手法にて行なわれ、上
記の点の属性による候補の絞り込みは、下記項目に記
載するような手法にて行なわれる。距離関係による候補の絞り込み：対応付けを行なう時
に、点集合Ａ内の一つの要素と該要素に近接するｓ個の
要素との間に成り立つ距離関係と、点集合Ｂ内の一つの
要素と該要素に近接するｓ個の要素との間の距離関係と
が許容誤差内の関係にある点集合のみを選択して、候補
を絞り込む。

【００２１】角度による候補の絞り込み：点集合Ａの
一つの要素と該要素に近接するｓ個の要素との間に成り
立つ角度に対し、点集合Ｂ内の一つの要素と該要素に近
接するｓ個の要素との間に成り立つ角度が許容誤差範囲
内である点のみを選択して、候補を絞り込む。重心からの距離および角度による候補の絞り込み：選
択した点間で重心を算出し、前記，と同様の手法で
重心についての距離，角度を比較することにより候補を
絞り込む。

【００２２】閾値条件による候補の絞り込み：所定の
閾値を設定し、候補の持つ属性値が閾値よりも大きい時
には探索の枝刈りを行なう。この場合、ｎｉｌ（対応す
る点が存在しない点）の数を制限して、点集合Ａと点集
合Ｂとの各要素間の対応付けの際に、ｎｉｌの総数があ
る閾値以上になると、それを組み合わせの候補から外し
て無駄な候補の生成を避ける。また、点集合Ａの要素ａ
_iに点集合Ｂの要素ｂ _jを対応付けた時に全点間のｒｍ
ｓｄ値が極端に悪くなる場合にはそれを候補から除外す
るのが望ましいので、ｒｍｓｄ値用の閾値を設けてお
き、ｒｍｓｄ値が閾値以下ならばその点を候補とし、ｒ
ｍｓｄ値が閾値を超えるならばその点を候補から除外す
ることにより、対応付ける点の候補を効率良く絞り込
む。

【００２３】点の属性による候補の絞り込み：各点の
属性として、例えば原子，原子団，分子の種類や、親水
性，疎水性，電荷の正負等を挙げることができる。これ
らが一致するかどうかを調べることにより、候補に加え
るか否かを判定する。

【００２４】

【発明が解決しようとする課題】上述したように、物質
の構成要素の対応付けを自動化することができれば、デ
ータベースから同じ機能を持つ物質間に共通に存在する
類似構造を検索して抽出することができるが、従来のＣ
ＳＤや、ＰＤＢを利用して物質の立体構造を解析する場
合には、大量のデータからの構造的な検索・比較を手作
業で行なっているため、多くの時間や労力を要し、作業
者の負担となっていた。

【００２５】また、上記の先に出願された立体構造処理
装置では、予め構造が分かっている一定規模の点集合か
らなる部分構造が、他の物質の立体構造の中に共通構造
として存在するかどうかを検索することができる。しか
し、機能が似ていて共通構造を持つ二つの立体構造を全
体として重ね合わせた時に立体構造全体のどの部分が共
通構造であるかを抽出することは、検索のキーとなる部
分（プローブ）が未知であるため、上記の先に出願され
た立体構造処理装置によっては困難であるという課題が
ある。

【００２６】部分対応付けを行なって重ね合わせた時に
構造的に似ている共通構造を抽出することができれば、
一方の立体構造の持つ機能と同じ機能を、他の立体構造
を持つ物質も有していることが分かる。さらに、機能が
類似していること等により共通の部分構造を持つことが
分かっている立体構造の間で複数の共通構造がある場
合、どの部分が中心となる（核となる）のか分からない
ことがある。その場合、重ね合わせの中心となる部分構
造（キーとなる構造）を誤って判断すると、その部分構
造を核として重ね合わせた時に、実際には類似な共通構
造が存在していてもその共通構造を検出することができ
ない。そのため、中心となる共通構造を的確に判別する
ことが課題となっている。

【００２７】本発明は、このような課題に鑑み創案され
たもので、立体構造中の類似部分を計算機で自動的に抽
出できるようにすることによってコンピュータグラフィ
ックシステムにおける立体構造の重ね合わせ表示の自動
化やデータベースからの類似立体構造の検索等を可能に
して、共通構造の検索・抽出作業に要する時間，人員や
コストの削減をはかり、共通構造の検索・抽出作業の効
率化をはかった共通構造抽出装置を提供することを目的
とする。

【００２８】

【課題を解決するための手段】図１は本発明の原理ブロ
ック図で、この図１において、１は本発明の共通構造抽
出装置で、この共通構造抽出装置１は、それぞれ立体構
造を形成する順序付けられた二つの点集合Ａ，Ｂから、
これら二つの点集合Ａ，Ｂの間で共通する部分の点集合
を、二つの立体構造間の共通構造として抽出するもので
ある。

【００２９】そして、共通構造抽出装置１は、全体構造
重合部１０，共通部分長さ算出部１１，累積距離算出部
１２および共通部分抽出部１３を有して構成されてい
る。ここで、全体構造重合部１０は、二つの点集合Ａ，
Ｂを部分的に対応付けるべく予め既知のデータとして与
えられる部分対応付け情報ＳＡ，ＳＢに基づいて、二つ
の点集合Ａ，Ｂの全体を平行移動／回転移動させて重ね
合わせるものである。

【００３０】共通部分長さ算出部１１は、全体構造重合
部１０により重ね合わされた二つの点集合Ａ，Ｂの共通
部分として対になる点（集合要素）の数を共通部分長さ
（要素数）として算出するものである。累積距離算出部
１２は、全体構造重合部１０により重ね合わされた二つ
の点集合Ａ，Ｂの共通部分として対になる点間の距離を
累積した累積距離情報を算出するものである。

【００３１】共通部分抽出部１３は、共通部分長さ算出
部１１により算出された共通部分長さが最長で、且つ、
累積距離算出部１２により算出された累積距離情報が最
小になる二つの点集合Ａ，Ｂの共通部分を、共通構造と
して抽出するものである。そして、二つの点集合Ａ，Ｂ
の共通部分として対になる点間の距離に基づくコスト関
数を導入するとともに、二つの点集合Ａ，Ｂの共通部分
として同一の最長共通部分長さを有する複数の経路が存
在する場合に累積距離算出部１２が累積距離情報を算出
すべく各経路を成す点を順次探索する際、各経路を成す
点が順次探索される都度、当該点でのコスト関数の値を
算出するコスト関数演算部をそなえる。このとき、累積
距離算出部１２が、ある点を探索した時に、当該点にお
いてコスト関数演算部により算出されたコスト関数の新
値と、当該点において以前にコスト関数演算部により算
出されたコスト関数の旧値とを比較し、新値が旧値以上
である場合には、当該経路についての探索を中止して次
の経路の探索へ移行する一方、新値が旧値よりも小さい
場合には、当該経路についての探索を継続して実行する
ことにより、該前記同一の最長共通部分長さを有する複
数の経路の中から、前記コスト関数の値が最小になる経
路が共通構造として抽出される（請求項１）。なお、前
記コスト関数としては、各経路の始点から探索点までの
各点において対になる点間の距離の二乗値を累積加算す
るものを用いることができる（請求項２）。また、本発
明の共通構造抽出装置は、部分対応付け情報として予め
与えられる既知のデータを用いて共通部分抽出部１３に
より共通構造が抽出された後、抽出された共通構造を部
分対応付け情報として用い、全体構造重合部１０，共通
部分構造長さ算出部１１，累積距離算出部１２および共
通部分抽出部１３による一連の処理を、二つの点集合
Ａ，Ｂの共通部分として対になる点の数に変化がなくな
るまで再帰的に繰り返して最適な共通構造を抽出するよ
うに構成する（請求項３，４）。このとき、全体構造重
合部１０は、部分対応付け情報ＳＡ，ＳＢにより対応付
けられる二つの点集合Ａ，Ｂにおける部分集合の重心を
それぞれ算出する重心算出部と、この重心算出部により
算出された二つの重心が一致するように二つの点集合
Ａ，Ｂを平行移動する平行移動部と、二つの点集合Ａ，
Ｂにおける部分集合を重ね合わせるために必要な前記重
心まわりの回転角を算出する回転角算出部と、この回転
角算出部により算出された回転角に基づいて一方の点集
合の全体を回転することにより二つの点集合Ａ，Ｂの全
体を重ね合わせる回転重合部とにより構成することがで
きる（請求項５）。

【００３２】また、共通部分長さ算出部１１は、全体構
造重合部１０により重ね合わされた二つの点集合Ａ，Ｂ
の共通部分として対応付けられる可能性のある点の組合
せを格納する対応テーブルを作成する対応テーブル作成
部と、この対応テーブル作成部により作成された対応テ
ーブルに基づいて二つの点集合Ａ，Ｂの共通部分として
対応付けられる点集合において対になる点の数を最長共
通部分長さとして算出する最長共通部分長さ算出部とに
より構成することができる（請求項６）。

【００３３】さらに、累積距離算出部１２は、全体構造
重合部１０により重ね合わされた二つの点集合Ａ，Ｂの
共通部分として対になる点間の距離についての平均二乗
値の平方根を、累積距離情報として算出するように構成
することができる（請求項７）。

【００３４】

【００３５】

【００３６】また、二つの点集合Ａ，Ｂのうちの一方の
点集合をその順序に従って先頭から順に一定個数の部分
集合に分割し、各部分集合に類似する点集合を二つの点
集合Ａ，Ｂのうちの他方の点集合から類似構造として検
索する類似構造検索部をそなえ、この類似構造検索部に
より検索された類似構造を、部分対応付け情報として用
い、共通構造を抽出するように構成してもよい（請求項
８）。

【００３７】さらに、二つの点集合Ａ，Ｂから、これら
の二つの点集合Ａ，Ｂを適切に重ね合わせるための核と
なる点集合を核構造として抽出する核構造抽出部をそな
え、この核構造抽出部が、二つの点集合Ａ，Ｂのうちの
一方の点集合を、その順序に従って先頭の点から１点ず
つずらしながら一定の長さのセグメントに分割し、分割
された各セグメントに類似する点集合を、二つの点集合
Ａ，Ｂのうちの他方の点集合から類似構造として検索
し、検索された類似構造のうち最も類似するものを核構
造として選択し、その核構造を部分対応付け情報として
出力するように構成してもよい（請求項９）。

【００３８】この場合、核構造抽出部は、二つの点集合
Ａ，Ｂ間に存在する類似構造の分布を把握すべく、二つ
の点集合Ａ，Ｂを成す各点をその順序に従ってそれぞれ
行と列とに割り当てるとともに、検索された類似構造
の、二つの点集合Ａ，Ｂ上でのそれぞれの位置に応じた
行および列の交点上に所定データを設定することにより
類似構造マップを作成し、その類似構造マップを参照し
て核構造を抽出することもできる（請求項１０）。

【００３９】また、共通部分抽出部１３により抽出され
た共通構造に基づいて、二つの点集合Ａ，Ｂによりそれ
ぞれ形成される二つの立体構造を重ね合わせて表示する
表示部をそなえてもよく（請求項１１）、この場合、表
示部が、二つの立体構造を３次元グラフィックとして表
示するように構成する（請求項１２）。さらに、共通部
分抽出部１３により抽出された共通構造を構成する二つ
の点集合Ａ，Ｂの各点に関する情報を、各点集合Ａ，Ｂ
における順序に従って並置した状態で出力するアライメ
ント出力部（請求項１３）や、共通部分抽出部１３によ
り抽出された共通構造を三次元座標情報として出力する
モデル構造出力部（請求項１４）をそなえて構成しても
よい。

【００４０】ところで、二つの点集合Ａ，Ｂのうちの一
方の点集合に関する情報として部分構造情報を入力する
データ入力部と、二つの点集合Ａ，Ｂのうちの他方の点
集合に関する情報として立体構造に関する情報を予め格
納する立体構造データベースと、データ入力部から入力
された部分構造情報に類似する立体構造を立体構造デー
タベースから類似構造として検索する類似構造検索部
と、この類似構造検索部により検索された類似構造に関
する情報と当該類似構造を部分対応付け情報として用い
て共通部分抽出部１３により抽出された共通構造に関す
る情報とを出力する類似構造出力部とをそなえて構成す
ることもできる（請求項１５）。

【００４１】また、二つの点集合Ａ，Ｂのうちの一方の
点集合に関する情報として既知の機能を有する部分構造
に関する情報を入力するデータ入力部と、二つの点集合
Ａ，Ｂのうちの他方の点集合に関する情報として立体構
造に関する情報を予め格納する立体構造データベース
と、ある機能とその機能に関連する立体構造との関係を
格納する機能部位データベースと、データ入力部から入
力された既知の機能を有する部分構造に類似する立体構
造を立体構造データベースから類似構造として検索する
類似構造検索部と、この類似構造検索部により検索され
た類似構造に関する情報，当該類似構造を前記部分対応
付け情報として用いて共通部分抽出部１３により抽出さ
れた共通構造に関する情報および所定機能に関する情報
を機能部位データベースに出力して登録する機能部位デ
ータベース作成部とをそなえて構成してもよい（請求項
１６）。

【００４２】さらに、二つの点集合Ａ，Ｂのうちの一方
の点集合に関する情報として未知の機能を有する対象立
体構造に関する情報を入力するデータ入力部と、ある機
能とその機能に関連する立体構造との関係を格納する機
能部位データベースと、この機能部位データベースに格
納された立体構造に類似する構造をデータ入力部から入
力された対象立体構造から検索する類似構造検索部と、
この類似構造検索部により検索された類似構造を部分対
応付け情報として用いて共通部分抽出部１３により抽出
された共通構造に基づいて対象立体構造の有する機能と
その機能に関連する構造とを特定して出力する機能部位
出力部とをそなえて構成することもできる（請求項１
７）。

【００４３】またさらに、前記核構造抽出部により抽出
された核構造を部分対応付け情報として用いて共通部分
抽出部１３により抽出された共通構造について当該共通
構造を成す二つの点集合Ａ，Ｂの類似性を判定する類似
性判定部と、この類似性判定部により当該共通構造を成
す二つの点集合Ａ，Ｂの類似性が高いと判定された場合
に当該共通構造を表示する表示部とをそなえて構成して
もよい（請求項１８）。

【００４４】さらにまた、二つの点集合Ａ，Ｂのうちの
一方の点集合に関する情報として既知の機能を有する立
体構造に関する情報を入力するとともに二つの点集合
Ａ，Ｂのうちの他方の点集合に関する情報として未知の
機能を有する立体構造に関する情報とを入力するデータ
入力部と、ある機能とその機能に関連する立体構造との
関係を格納する機能部位データベースと、データ入力部
から入力された既知の機能を有する立体構造と未知の機
能を有する立体構造とについて前記核構造抽出部により
抽出された核構造を部分対応付け情報として用いて共通
部分抽出部１３により抽出された共通構造に基づいて機
能部位データベースを参照し未知の機能を有する立体構
造についての機能予測を行なう機能予測部と、この機能
予測部により予測された未知の機能を有する立体構造の
機能部位を表示する表示部とをそなえて構成することも
できる（請求項１９）。

【００４５】なお、前記立体構造は、物質の立体構造
（請求項２０）やタンパク質の立体構造（請求項２１）
とすることができる。このとき、物質の立体構造を形成
する点集合は、当該物質を構成する分子もしくは原子を
点とみなし、所定配列に従う分子もしくは原子の順序集
合として捉えられるものであり、タンパク質の立体構造
を形成する点集合は、当該タンパク質を構成するアミノ
酸を点とみなし、アミノ酸の配列番号に従うアミノ酸の
順序集合として捉えられるものである。

【００４６】

【作用】図１にて上述した本発明の共通構造抽出装置で
は、二つの点集合Ａ，Ｂの全体が、全体構造重合部１０
により部分対応付け情報に基づいて平行移動／回転移動
されて重ね合わせられ、共通部分長さ算出部１１により
算出された共通部分長さが最長で、且つ、累積距離算出
部１２により算出された累積距離情報が最小になる二つ
の点集合Ａ，Ｂの共通部分が、共通部分抽出部１３によ
り抽出される。

【００４７】従って、二つの立体構造間の共通構造の部
分を、計算機を用いて自動的に抽出することができる。
また、立体構造の一部の構造が機能的に分かっている時
にその部分を重ね合わせの場所（部分対応付け情報）と
して用いて二つの立体構造の重ね合わせを行ない、その
重ね合わせ箇所以外の部分構造について類似な構造を有
しているかについて予測・判定することができる（請求
項１〜７）。

【００４８】また、累積距離算出部１２により、累積距
離情報を算出すべく各経路を成す点を順次探索する際、
各経路を成す点を順次探索する都度、当該点においてコ
スト関数演算部により算出されたコスト関数の新値と、
当該点において以前にコスト関数演算部により算出され
たコスト関数の旧値とが比較され、新値が旧値よりも小
さい場合のみ当該経路についての探索が継続される。従
って、他の経路として探索済の点を新たに探索した場
合、累積距離情報が最小にならないと予測される経路に
ついては直ちに探索を中断して、次の経路の探索に移行
し、無駄な探索を行なうのを防止することができる（請
求項１，２）。

【００４９】一方、共通構造抽出装置１による一連の処
理を、二つの点集合Ａ，Ｂの共通部分を成す点の数に変
化がなくなるまで再帰的に繰り返すことにより、共通部
分として最適なものを抽出することができる（請求項
３，４）。また、二つの共通構造について機能的に分か
っている部分が無い場合または共通な部分構造が分から
ない場合、つまり部分対応付け情報が予め明確になって
いない場合、類似構造検索部により二つの点集合Ａ，Ｂ
における類似構造が検索され、その類似構造が部分対応
付け情報として用いられるので、部分対応付け情報を自
動的に確定して、共通構造の抽出を行なうことができる
（請求項８）。

【００５０】同様に部分対応付け情報が予め明確になっ
ていない場合、核構造抽出部により重ね合わせの中心と
なる核構造が効率的に抽出され、その核構造が部分対応
付け情報として用いられるので、部分対応付け情報を自
動的かつ効率的に確定して、共通構造の抽出を行なうこ
とができる（請求項９，１０）。また、表示部により二
つの立体構造を重ね合わせた状態が自動的に表示され、
オペレータ等は、その表示部を参照するだけで、その二
つの立体構造の共通構造や特異的な構造を判別すること
ができる（請求項１１，１２）。

【００５１】同様に、アライメント出力部により共通構
造に関する情報を自動的に出力したり（請求項１３）、
モデル構造出力部により共通構造の三次元座標情報を自
動的に出力したりすることで、オペレータ等は、その出
力結果を参照するだけで、その二つの立体構造の共通構
造や特異的な構造を判別することができる（請求項１
４）。

【００５２】ところで、本発明の共通構造抽出装置１
は、前述したデータ入力部，立体構造データベース，類
似構造検索部および類似構造出力部をそなえることによ
り、立体構造検索装置としての機能を提供することがで
きる。つまり、類似構造検索部により、データ入力部か
らの部分構造情報に類似する立体構造が立体構造データ
ベースから類似構造として検索され、類似構造出力部に
より、その類似構造に関する情報と当該類似構造を部分
対応付け情報として用いて抽出された共通構造に関する
情報とが自動的に出力される（請求項１５）。

【００５３】また、本発明の共通構造抽出装置１は、前
述したデータ入力部，立体構造データベース，機能部位
データベース，類似構造検索部および機能部位データベ
ース作成部をそなえることにより、機能部位データベー
ス生成装置としての機能を提供することができる。つま
り、類似構造検索部により、データ入力部からの既知の
機能を有する部分構造に類似する立体構造が立体構造デ
ータベースから類似構造として検索され、機能部位デー
タベース作成部により、その類似構造に関する情報，当
該類似構造を前記部分対応付け情報として用いて抽出さ
れた共通構造に関する情報および所定機能に関する情報
が機能部位データベースに自動的に出力され登録される
（請求項１６）。

【００５４】さらに、本発明の共通構造抽出装置１は、
前述したデータ入力部，機能部位データベース，類似構
造検索部および機能部位出力部をそなえることにより、
機能予測装置としての機能を提供することができる。つ
まり、類似構造検索部により、機能部位データベースに
格納された立体構造に類似する構造がデータ入力部から
の対象立体構造から検索され、機能部位出力部により、
検索された類似構造を部分対応付け情報として用いて抽
出された共通構造に基づいて、対象立体構造の有する機
能とその機能に関連する構造とが特定されて自動的に出
力される（請求項１７）。

【００５５】またさらに、類似性判定部により、核構造
抽出部により抽出された核構造を部分対応付け情報とし
て用いて抽出された共通構造についてその類似性を判定
し、その判定結果を表示部に表示することで、オペレー
タ等は、その表示部を参照するだけで、共通構造の類似
性を把握することができる（請求項１８）。さらにま
た、本発明の共通構造抽出装置１は、前述したデータ入
力部，機能部位データベース，核構造抽出部，機能予測
部および表示部をそなえることにより、核構造抽出を用
いた機能予測装置としての機能を提供することができ
る。つまり、核構造抽出部により、データ入力部からの
既知の機能を有する立体構造と未知の機能を有する立体
構造とについて核構造が抽出され、機能予測部により、
その核構造を部分対応付け情報として用いて抽出された
共通構造に基づいて機能部位データベースが参照され、
未知の機能を有する立体構造についての機能予測が行な
われる。そして、その予測結果が表示部に自動的に表示
されるので、オペレータ等は、その表示部を参照するだ
けで、未知の機能を有する立体構造の機能を把握するこ
とができる（請求項１９）。

【００５６】なお、抽出対象の立体構造を、物質の立体
構造やタンパク質の立体構造とすることで、その立体構
造の検索や、立体構造の類似性に基づく機能予測等を行
なうことが可能になる（請求項２０，２１）。

【００５７】

【実施例】以下、図面を参照して本発明の実施例を説明
する。（Ａ）本実施例の基本的な構成の説明まず、図２〜図４により、本実施例の共通構造抽出装置
の基本的な構成について説明する。図２は本発明の一実
施例としての共通構造抽出装置の基本構成を示すブロッ
ク図、図３は本実施例の共通構造抽出装置に付設される
類似構造検索部の構成を示すブロック図、図４は本実施
例の共通構造抽出装置に付設される核構造抽出部の構成
を示すブロック図である。

【００５８】図２において、１は共通構造抽出部１Ａを
有する本実施例の共通構造抽出装置で、図１にて説明し
たものと同様、共通構造抽出部１Ａは、それぞれ立体構
造を形成する順序付けられた二つの点集合Ａ，Ｂから、
これら二つの点集合Ａ，Ｂの間で共通する部分の点集合
を、二つの立体構造間の共通構造として抽出するもので
あり、全体構造重合部１０，共通部分長さ算出部１１，
累積距離算出部１２および共通部分抽出部１３を有して
構成されている。

【００５９】ここで、全体構造重合部１０は、二つの点
集合Ａ，Ｂを部分的に対応付ける部分対応付け情報Ｓ
Ａ，ＳＢに基づいて、二つの点集合Ａ，Ｂの全体を平行
移動／回転移動させて重ね合わせるものであり、本実施
例の全体構造重合部１０は、重心算出部１０ａ，平行移
動部１０ｂ，回転角算出部１０ｃおよび回転重合部１０
ｄを有して構成されている。

【００６０】重心算出部１０ａは、部分対応付け情報Ｓ
Ａ，ＳＢにより対応付けられる二つの点集合Ａ，Ｂにお
ける部分集合の重心をそれぞれ算出するものであり、平
行移動部１０ｂは、重心算出部１０ａにより算出された
二つの重心が一致するように二つの点集合Ａ，Ｂを平行
移動するものである。また、回転角算出部１０ｃは、二
つの点集合Ａ，Ｂにおける部分集合を重ね合わせるため
に必要な前記重心まわりの回転角を算出するものであ
り、回転重合部１０ｄは、回転角算出部１０ｃにより算
出された回転角に基づいて一方の点集合の全体を回転す
ることにより二つの点集合Ａ，Ｂの全体を重ね合わせる
ものである。

【００６１】また、共通部分長さ算出部１１は、図５に
より後述するごとく対応テーブル作成部１１ａおよびＬ
ＣＳ算出部１１ｂを有して構成されるもので、全体構造
重合部１０により重ね合わされた二つの点集合Ａ，Ｂの
共通部分として対になる点（集合要素）の数を共通部分
長さ（要素数）として算出するものである。さらに、累
積距離算出部１２は、全体構造重合部１０により重ね合
わされた二つの点集合Ａ，Ｂの共通部分として対になる
点間の距離についての平均二乗値の平方根（以下、ｒｍ
ｓｄ値という）を、累積距離情報として算出するもので
ある。

【００６２】そして、共通部分抽出部１３は、共通部分
長さ算出部１１により算出された共通部分長さが最長
で、且つ、累積距離算出部１２により算出されたｒｍｓ
ｄ値が最小になる二つの点集合Ａ，Ｂの共通部分を、共
通構造として抽出するものである。一方、本実施例の累
積距離算出部１２には、図１５〜図３０によりその動作
を詳述するコスト関数演算部１２ａがそなえられてい
る。本実施例では、二つの点集合Ａ，Ｂの共通部分とし
て同一の最長共通部分長さを有する複数の経路が存在す
る場合に累積距離算出部１２がｒｍｓｄ値を算出すべく
各経路を成す点を順次探索する際、各経路を成す点が順
次探索される都度、当該点でのコスト関数の値がコスト
関数演算部１２ａにより算出されるようになっている。
ここで、コスト関数としては、各経路の始点から探索点
までの各点において対になる点間の距離の二乗値を累積
加算したものとする。

【００６３】そして、本実施例の累積距離算出部１２
は、ある点を探索した時に、当該点においてコスト関数
演算部１２ａにより算出されたコスト関数の新値と、当
該点において以前にコスト関数演算部１２ａにより算出
されたコスト関数の旧値とを比較し、新値が旧値以上で
ある場合には、当該経路についての探索を中止して次の
経路の探索へ移行する一方、新値が旧値よりも小さい場
合には、当該経路についての探索を継続して実行するよ
うになっている。

【００６４】なお、本実施例の共通構造抽出装置１は、
共通部分抽出部１３により抽出された共通構造を部分対
応付け情報として用い、全体構造重合部１０，共通部分
構造長さ算出部１１，累積距離算出部１２および共通部
分抽出部１３による一連の処理を、二つの点集合Ａ，Ｂ
の共通部分として対になる点の数に変化がなくなるまで
再帰的に繰り返して最適な共通構造を抽出するように構
成されている。

【００６５】また、図３において、２は一方の点集合Ａ
の構成要素（部分構造）により他方の点集合Ｂを順次検
索する類似構造検索部で、二つの点集合Ａ，Ｂについて
の部分対応付け情報が予め明確になっていない場合に
は、この類似構造検索部２による検索結果が、部分対応
付け情報として共通構造抽出部１Ａへ出力されるように
なっている。

【００６６】この類似構造検索部２は、二つの立体構造
を表す点集合Ａ，Ｂを入力されると、一方の点集合Ａを
点の順序関係に従った一定の構成要素（部分集合）毎に
分割し、各構成要素に類似するもの（類似構造）を他方
の点集合Ｂから検索するものである。また、類似構造検
索部２は構成要素検索部２ａを有しており、この構成要
素検索部２ａが、分割された各構成要素をプローブ（検
索キー）として、点集合Ｂの全体について類似構造を検
索する機能を果たしている。このとき、類似性の判断
は、前述した幾何学的な関係，閾値条件，または点の属
性等に基づいて、対応すべき二つの点についての対応関
係の有無を判定して行なっている。そして、構成要素検
索部２ａにより検索された類似構造が、部分対応付け情
報として共通構造抽出部１Ａに与えられるようになって
いる。

【００６７】さらに、図４において、３は二つの点集合
Ａ，Ｂについての部分対応付け情報が予め明確になって
いない場合にこれらの二つの点集合Ａ，Ｂを適切に重ね
合わせるための核となる点集合を核構造として抽出する
核構造抽出部で、この核構造抽出部３は、セグメント分
割部３ａ，セグメント検索部３ｂ，類似性判別部３ｃお
よび核構造選択部３ｄを有して構成されている。

【００６８】ここで、セグメント分割部３ａは、一方の
点集合Ａを、その順序に従って先頭の点から１点ずつず
らしながら一定の長さ（Ｌ）で分割してセグメント化す
るものであり、セグメント検索部３ｂは、セグメント分
割部３ａにより分割された各セグメントに類似する点集
合をプローブ（検索キー）として、他方の点集合Ｂから
類似構造を検索するものである。

【００６９】また、類似性判別部３ｃは、セグメント検
索部３ｂにより検索された類似構造の類似性を判別する
ものであり、核構造選択部３ｄは、類似性判別部３ｃに
よる類似性判別結果に従って、検索された類似構造のう
ち最も類似するものを核構造として選択し、その核構造
を部分対応付け情報として共通構造抽出部１Ａへ出力す
るものである。

【００７０】なお、核構造抽出部３による核構造抽出手
順の詳細については、図３１〜図４４により後述する。
また、図２〜図４に示した本実施例の各構成要素は、入
出力部，ＣＰＵ，メモリ，データベース（後述する立体
構造等のデータを保持するもの）を有し、情報処理機能
をそなえた装置（全体的なシステム構成については後述
する）により実現される。

【００７１】（Ｂ）本実施例の基本的な動作の説明上述した本実施例の共通構造抽出装置１では、三次元空
間に配置される点集合からなる二つの立体構造につい
て、部分的に対応付けることができることが分かってい
る部分対応付け情報に基づいて全体構造を重ね合わせ、
重なり合う共通部分の長さ〔点（要素）の数〕を算出
し、さらに最長かつ最小のｒｍｓｄ値をもつ共通部分の
点集合を、二つの立体構造間の共通構造として抽出して
いる。ここで抽出された共通構造は、点集合ＡとＢによ
り表される二つの立体構造がそなえる共通な構造（部分
対応付け情報で表す構造を除く）を表し、共通な構造を
持つことにより両者の立体構造は共通な機能を持つこと
が予測される。

【００７２】また、類似構造検索部２を用いることによ
り、二つの立体構造の点集合Ａ，Ｂにおいて、一方の点
集合Ａの構成要素をプローブ（検索キー）とし、他方の
点集合Ｂ（ターゲット）について類似構造を検索し、検
索された類似構造を部分対応付け情報として用い、上述
と同様の手順（詳細手順は後述）で共通構造を抽出す
る。そして、同様の検索・抽出処理を、一方の点集合Ａ
を分割して得られた核構成要素毎に順次繰り返すること
により、二つの立体構造間の共通構造が自動抽出され
る。

【００７３】つまり、点集合Ａの全ての構成要素につい
て点集合Ｂを検索し、点集合Ａの構成要素と類似な構造
を点集合Ｂの成す構造から検索する。複数個の類似構造
が検索されると、最も類似性の高いものを選択する。こ
のような検索処理により類似構造が得られると、その類
似構造を部分対応付け情報として共通構造抽出部１Ａへ
供給する。共通構造抽出部１Ａにおいては、全体構造重
合部１０により二つの点集合Ａ，Ｂの全体が部分対応付
け情報を基準にして重ね合わせられ、共通部分の抽出が
行なわれるが、その抽出処理は点集合Ａの各構成要素に
ついて順に行なわれ、全ての組み合わせの中から最長と
なる構造が抽出される。

【００７４】さらに、二つの立体構造の重ね合わせの中
心となる共通部分（核構造）が分かっていない場合に
は、核構造抽出部３により、一方の立体構造をセグメン
ト化して他方の立体構造からセグメントと類似した構造
を検索して対応づけることにより、中心となる核構造が
抽出される。この核構造抽出部３により、二つの立体構
造を表す点集合Ａ，Ｂの重ね合わせの中心となる構造
（核構造）を抽出する場合、セグメント分割部３ａによ
り、一方の点集合Ａを一定の長さ（Ｌ）で分割してセグ
メント化する。次に、セグメント検索部３ｂにより立体
構造を構成する要素（点）の順序を考慮し、分割された
セグメントの構造に類似した構造を他方の立体構造（点
集合Ｂ）から検索する。

【００７５】そして、類似性判別部３ｃにより、各セグ
メントに対応した点集合Ｂの類似構造（検索結果）に対
し、検索のキーとなるセグメントを含む立体構造（点集
合Ａ）と検索された類似構造を含む立体構造（点集合
Ｂ）とを総合して類似性を判別し、両立体構造の核構造
を順次形成する。全セグメントについての核構造が得ら
れると、核構造選択部３ｄにより核構造が一定長以上の
ものを選択し、その核構造を部分対応付け情報として用
いて共通構造抽出部１Ａによる処理を行なう。複数の核
構造が選択されるた場合には、各核構造について共通構
造抽出処理を行なう。

【００７６】(B1)順序付けられた点集合の定義以下に、本実施例の動作をより詳細に説明するが、ここ
で、まず以下の説明で使用する立体構造を表す順序付け
られた点集合について定義する。二つの立体構造は、各
々、点集合Ａ＝｛ａ₁，ａ₂，…，ａ_i，…，ａ_NA｝
（１≦ｉ≦ＮＡ）と、点集合Ｂ＝｛ｂ₁，ｂ₂，…，ｂ
_j，…，ｂ_NB｝（１≦ｊ≦ＮＢ）とにより形成され、各
点（各要素）は、ａ_i＝(x_i，ｙ_i，ｚ_i），ｂ_j＝(x
_j，ｙ_j，ｚ_j）からなる三次元座標で表される。な
お、ＮＡ，ＮＢはそれぞれ点集合Ａ，Ｂにおける全要素
の数である。

【００７７】点集合Ａでは、ａ₁＜ａ₂＜…＜ａ_NA（ま
たはａ₁＞ａ₂＞…＞ａ_NA）なる順序関係が成り立ち、
同様に点集合Ｂでもｂ₁＜ｂ₂＜…＜ｂ_NB（またはｂ₁
＞ｂ ₂＞…＞ｂ_NB）なる順序関係が成り立つものとす
る。このような点集合としては、例えば、各種のタンパ
ク質の立体構造を表す点集合（アミノ酸を点とみなした
集合）等がある。

【００７８】(B2)全体構造の重ね合わせそして、図２に示す本実施例の共通構造抽出部１Ａにお
いて、共通構造の抽出を行なう場合、二つの立体構造を
表す点集合Ａ，Ｂについて予め既知のデータとして部分
的に共通な構造が分かっている場合、全体構造重合部１
０は、その部分対応付け情報（点集合Ａ，Ｂに対応して
それぞれＳＡ，ＳＢとする）に基づき、順序付けられた
二つの点集合Ａ，Ｂの全体を重ね合わせる。なお、部分
対応付け情報は、順序付けられた点集合Ａ，Ｂの部分集
合により構成される。

【００７９】ここで、点集合Ａ，Ｂの部分対応付け情報
ＳＡ，ＳＢは、それぞれ、Ｍ個の点から成る部分集合Ｓ
Ａ＝｛ａ_ma(1)，ａ_ma(2)…，ａ_ma(M)｝，ＳＢ＝｛ｂ
_mb(1 ₎，ｂ_mb(2)…，ｂ_mb(M)｝として表される、順序
付けられた点集合とする〔１≦ma(1) ＜ma(2) ＜…＜ma
(M) ≦ＮＡ，１≦mb(1) ＜mb(2) ＜…＜mb(M) ≦Ｎ
Ｂ〕。

【００８０】また、これらの二つの部分集合ＳＡ，ＳＢ
の各要素は、先頭から順に対応付けられているものとす
る。即ち、ａ_ma(1)とｂ_mb(1)，ａ_ma(2)とｂ_mb(2)，
…，ａ_ma(M)とｂ_mb(M)がそれぞれ対応付けられてい
る。この時、各部分集合ＳＡ，ＳＢの要素間では、点集
合Ａ，Ｂの順序関係に基づいて順序関係が成り立ち、順
序関係が逆転するような対応関係は許されないものとす
る。

【００８１】上述のごとく指定された対応付け情報Ｓ
Ａ，ＳＢに基づいて、全体構造重合部１０により、二つ
の点集合Ａ，Ｂの各要素が最も多くの部分で重なるよう
に回転角を算出し、算出した回転角に基づいて点集合を
回転させ、二つの点集合Ａ，Ｂの全体を重ね合わせる
が、その手順〜を以下に説明する。重心算出部１０ａにより、部分対応付け情報ＳＡ，Ｓ
Ｂに基づいて各部分集合の重心Ｇ_SA，Ｇ_SBを算出する。

【００８２】重心算出部１０ａで算出した重心Ｇ_SA，
Ｇ_SBを三次元座標系の原点とするように、平行移動部１
０ｂにより、点集合Ａ，Ｂを平行移動し、これらの重心
Ｇ_SA，Ｇ_SBを一致させる。この際、部分対応付け情報Ｓ
Ａ，ＳＢを構成する各点の座標も平行移動される。部分対応付け情報ＳＡ，ＳＢを最適に重ね合わせる回
転角Ｕを、回転角算出部１０ｃにより算出する。ここで
は、部分対応付け情報ＳＡを回転し、部分対応付け情報
ＳＢに最適に重ね合わせるものとする。回転角Ｕを算出
する手法としては、従来から知られた手法を利用する
〔例えば、Wolfgang Kabsh et.al. Acta Cryst.(1976).
A32,922 に記載されている〕。

【００８３】回転角算出部１０ｃにより算出した回転
角Ｕに基づいて、回転重合部１０ｄにより点集合Ａを回
転させる。この時、部分対応付け情報ＳＡを構成する各
点の座標も回転させる。この時点で、二つの点集合Ａ，
Ｂは、部分対応付け情報ＳＡ，ＳＢに基づいて空間的に
重ね合わされた状態になる。このようにして、最適な回
転角Ｕで、二つの点集合Ａ，Ｂの全体構造が重ね合わさ
れると、次に、共通部分長さ算出部１１により、重ね合
わされた点どうしの距離に基づいて空間的に隣接する点
どうしを識別し、共通部分の長さ〔共通構造を成す点
（要素）の数〕を算出するとともに、累積距離算出部１
２により、共通構造のｒｍｓｄ値を算出する。そして、
共通部分の長さ〔最長共通構造長さ：ＬＣＳ(Longest C
ommon Structure)〕およびｒｍｓｄ値に基づいて、共通
部分抽出部１３により共通構造の抽出が行なわれる。

【００８４】(B3)最長共通構造長さ（ＬＣＳ）の算出共通部分長さ算出部１１の構成例を図５に示し、また、
共通部分長さ算出部１１，累積距離算出部１２および共
通部分抽出部１３の動作を、図６〜図１４により説明す
る。図５に示すように、本実施例の共通構造抽出部１Ａ
における共通部分長さ算出部１１は、対応テーブル作成
部１１ａおよびＬＣＳ算出部（最長共通部分長さ算出
部）１１ｂを有して構成されている。

【００８５】ここで、対応テーブル作成部１１ａは、全
体構造重合部１０により重ね合わされた二つの点集合
Ａ，Ｂの共通部分として対応付けられる可能性のある点
の組合せを格納する対応テーブルを作成するもので、よ
り具体的には、全体構造重合部１０により重ね合わせた
点どうしの距離を考慮して、図７〜図９にて後述する手
順に従い、図１１〜図１４に示すような対応テーブルを
作成するものである。

【００８６】また、ＬＣＳ算出部１１ｂは、対応テーブ
ル作成部１１ａにより作成された対応テーブルに基づい
て、二つの点集合Ａ，Ｂの共通部分として対応付けられ
る点集合において対になる点の数（要素数）を最長共通
構造長さとして算出するものである。さて、二つの点集
合Ａ，Ｂを重ね合わされた部分（共通部分）の中で、所
定の閾値ERROR 以下の距離に位置する点集合Ａ（プロー
ブ）の要素ａ_iと点集合Ｂ（ターゲット）の要素ｂ_jと
を点対とすると、全ての点対に対して以下の計算スキー
マを適用することによって、最長共通部分の長さ（ＬＣ
Ｓ）が算出される。

【００８７】下記関数ＬＣＳ（ｉ，ｊ）は、点集合Ａ中
の１〜ｉ番目までの点と、点集合Ｂ中の１〜ｊ番目まで
の点とから構成される最長共通部分の長さとする。従っ
て、ＬＣＳ（ＮＡ，ＮＢ）は、二つの点集合Ａ，Ｂの全
体での最長共通部分の長さを表すことになる。ここで、
全ての点対は、予めｉまたはｊの大きさの順にソートさ
れているものとする。以下では、便宜上、ｉの順番にソ
ートされているものと考える。

【００８８】

【数２】

【００８９】上記計算スキーマでは、ｉ₀＜ｉかつｊ₀
＜ｊなる点対（ｉ₀，ｊ₀）が存在しない場合、その点
対（ｉ，ｊ）の最長共通部分の長さＬＣＳ（ｉ，ｊ）は
１になる。また、ｉ₀＜ｉかつｊ₀＜ｊなる点対
（ｉ₀，ｊ₀）が存在する場合、その点対の中で最長共
通部分の長さが最大となる点対（ｉ₀，ｊ₀）の長さＬ
ＣＳ（ｉ₀，ｊ₀）に１を加算したものが、最長共通部
分の長さＬＣＳ（ｉ，ｊ）になる。

【００９０】(b1)対応テーブルの作成対応テーブルの作成に際して、重ね合わされた点集合
Ａ，Ｂの点対の距離をdistance(a_i,b_j) とする。この
距離distance(a_i,b_j) が、指定された閾値ERROR 以内
の点対は隣接するものと考え、点集合Ａ，Ｂ間で空間的
に隣接する点対を登録した対応テーブルを作成する。

【００９１】図６に対応テーブルの構成を示す。ここ
で、対応テーブルに登録されているデータのエントリ数
を“max ”とする。この“max ”は、点集合Ｂに隣接す
る点を持つ点集合Ａの要素数である。そして、対応テー
ブルの各エントリに登録されるデータの各要素は (i,j,
d,c,p)で表される。

【００９２】ここで、ｉは点集合Ａの要素の添字で、点
対を成す点集合Ａの要素がｉ番目の点ａ_iであることを
示す。同様に、ｊは点集合Ｂの要素の添字で、点ａ_iと
点対を成す点集合Ｂの要素がｊ番目の点ｂ_jであること
を示す。また、ｄは点ａ_iと点ｂ_jとの間の距離（各点
ａ_i，ｂ_jの三次元座標から算出されるもの）、ｃはコ
スト関数演算部１２ａにより算出される累積コスト値で
ある。この累積コスト値ｃの初期値としては、∞（無限
大値）、即ち実際のコスト値に対して充分に大きな値が
設定されている。この累積コスト値ｃの演算について
は、図１５〜図３０により後述する。

【００９３】さらに、ｐは次の要素へのポインタで、次
の要素が存在しない場合、このポインタｐには“NULL”
が格納される。上述のような対応テーブルに対して、対
応テーブル作成部１１ａにより初期値を設定するための
手順（初期テーブル作成手順）を、図７に示すフローチ
ャート（ステップＳ１〜Ｓ１４）に従って説明する。

【００９４】なお、図７において、“index ”はエント
リ番号〔図６におけるｋ（＝０〜max-1)〕、“NULL”
は、前述した通り、各エントリ（点集合Ａの各要素に対
応）に対応する点集合Ｂの要素として次に続く要素が無
い場合にポインタｐの部分に格納されるデータである。
また、“first ”は、最初は“TRUE”に設定されるが、
各エントリに対し点集合Ａの要素に対応する点集合Ｂの
要素（両者間の距離ｄがERROR 以内の要素）が一つでも
見つかってポインタｐが更新されると“FALSE ”に変更
されて、そのエントリにおける要素が設定されたことを
表すものである。

【００９５】初期テーブル作成に際しては、図７に示す
ように、まず、ｉ＝０，ｊ＝０，index （エントリ番号
ｋ）＝０に設定し（ステップＳ１）、点集合Ａの要素の
添字ｉが点集合Ａの要素数ＮＡよりも小さいか否かを判
定する（ステップＳ２）。ｉ＜ＮＡであれば、初期デー
タを登録すべき領域（エントリ）を指定する“next”と
して“ table〔index 〕”を設定するとともに、“firs
t ”として前述の通り“TRUE”を設定する（ステップＳ
３）。

【００９６】ついで、点集合Ｂの要素の添字ｊが点集合
Ｂの要素数ＮＢよりも小さいか否かを判定する（ステッ
プＳ４）。ｊ＜ＮＢであれば、点ａ_iと点ｂ_jとの間の
距離ｄ＝distance(a_i,b_j) を算出し（ステップＳ
５）、その距離ｄが所定の閾値ERROR 以内かどうかを判
定する（ステップＳ６）。ｄ≦ERROR であれば、“nex
t”により指定される対応テーブルのエントリ番号“ind
ex ”の領域“ table〔index 〕”に格納されている末
尾の要素であるポインタを、（i,j,d,∞,NULL)を格納デ
ータとする要素を指すように更新する（ステップＳ
７）。

【００９７】この後、“first ”の設定が“TRUE”であ
るか否かを判定し（ステップＳ８）、“first ＝TRUE”
であれば、“first ”を“FALSE ”に設定してから（ス
テップＳ９）、点集合Ｂの要素の添字ｊに１だけ加算し
（ステップＳ１０）、ステップＳ４へ戻る。なお、ステ
ップＳ６にてｄ＞ERROR と判定された場合や、ステップ
Ｓ８にて“first ≠TRUE”と判定された場合にも、ステ
ップＳ１０による処理の後、ステップＳ４へ戻る。

【００９８】ステップＳ４にてｊ≧ＮＢと判定された場
合には、“first ”の設定が“FALSE ”であるか否かを
判定し（ステップＳ１１）、“first ＝FALSE ”である
場合には、エントリ番号“index ”に１だけ加算する
（ステップＳ１２）。これにより、次のエントリへの初
期データ登録に移行することになり、点集合Ａの要素の
添字ｉに１だけ加算してから（ステップＳ１３）、ステ
ップＳ２へ戻る。

【００９９】また、ステップＳ１１にて“first ≠FALS
E ”つまり“first ＝TRUE”と判定された場合には、要
素ａ_iに対応する点集合Ｂの要素が一つも見つかってい
ない状態であるので、エントリ番号の更新処理（ステッ
プＳ１２）を行なうことなく、ステップＳ１３に移行
し、点集合Ａの要素の添字ｉに１だけ加算してから、ス
テップＳ２へ戻る。

【０１００】ステップＳ２にてｉ≧ＮＡと判定された場
合には、点集合Ａの全ての要素についての登録を終了し
たものと判断し、“max ＝index ”と設定して（ステッ
プＳ１４）、初期テーブル作成処理を終了する。このよ
うな図７に示すアルゴリズムにより、図６に示す対応テ
ーブルに初期データを設定した初期テーブルが作成さ
れ、各エントリ毎に点集合Ａの各要素に対応して一定距
離内に存在する点集合Ｂの一つまたは複数の要素が、エ
ントリ順に設定されることになる。

【０１０１】図１０に、順序付けられた二つの点集合の
具体的な配置例を示し、図１１に、図１０に示す二つの
点集合について作成された初期テーブルの例を示す。図
１０に示す例では、一方の点集合Ｐ（プローブ；前記点
集合Ａに対応）＝｛Ｐ１，Ｐ２，Ｐ３，Ｐ４，Ｐ５｝
と、他方の点集合Ｔ（ターゲット；前記点集合Ｂに対
応）＝｛Ｔ１，Ｔ２，Ｔ３，Ｔ４，Ｔ５，Ｔ６，Ｔ７｝
とを重ね合わせた状態が示されている。そして、点Ｐ１
から所定の閾値ERROR 以内の範囲には点集合Ｔの要素は
存在せず、点Ｐ２から所定の閾値ERROR 以内の範囲には
点Ｔ１が存在し、点Ｐ３から所定の閾値ERROR 以内の範
囲には点Ｔ１，Ｔ２が存在し、点Ｐ４から所定の閾値ER
ROR 以内の範囲には点Ｔ５，Ｔ６が存在し、点Ｐ５から
所定の閾値ERROR 以内の範囲には点Ｔ６，Ｔ７が存在す
るものとする。

【０１０２】この図１０に示すような二つの点集合Ｐ，
Ｔについて、図７に示す手順で初期テーブルを作成する
と、図１１に示すような初期テーブル（各点の隣接関係
を表す対応テーブルの初期状態）が作成されることにな
る。この図１１において、各エントリに距離ｄとして設
定される値は、例えば、Ｄ２１＝０．３，Ｄ３１＝１．
０，Ｄ３２＝０．５，Ｄ４５＝０．４，Ｄ４６＝１．
２，Ｄ５６＝０．６，Ｄ５７＝１．４とする。また、各
エントリには、累積コスト値ｃ（Ｃ２１，Ｃ３１，Ｃ３
２，Ｃ４５，Ｃ４６，Ｃ５６，Ｃ５７）の初期値とし
て、全て∞（充分に大きな値）が設定される。

【０１０３】(b2)最長共通部分の長さの算出上述のごとく初期テーブルが作成されると、図５のＬＣ
Ｓ算出部１１ｂは、作成した対応テーブルを初期状態か
ら更新しながら、ＬＣＳ（Longest Common Structure；
対応付けられた点集合の要素数）を算出する。ＬＣＳ算
出部１１ｂによるＬＣＳ算出手順を、図８に示すフロー
チャート（ステップＳ１５〜Ｓ２４）および図９に示す
フローチャート（ステップＳ２５〜Ｓ３３）に従って説
明する。

【０１０４】なお、図８は、対応テーブルの更新による
ＬＣＳ算出手順を説明するためのフローチャートであ
り、図９は、ＬＣＳ算出に際して必要となる関数“chec
k pair(k,i,j) ”のアルゴリズム（対応する要素の探索
処理）を説明するためのフローチャートである。また、
図中、ｋは図６にて前述したエントリ番号、“parent”
は対応テーブルのｋ番目のエントリへのポインタが格納
される領域である。

【０１０５】図８に示すアルゴリズムでは、エントリ番
号ｋ＝１からmax-1 までの各要素に対して以下の処理を
施すことによってＬＣＳを算出する。まず、初期値とし
てlcs ＝０およびｋ＝１を設定し（ステップＳ１５）、
エントリ番号ｋが“max ”（対応テーブルに登録されて
いるデータのエントリ数）よりも小さいか否かを判定す
る（ステップＳ１６）。

【０１０６】ｋ≧max であれば、処理を終了するが、ｋ
＜max であれば、対応テーブル中のｋ番目のエントリの
先頭要素へのポインタを領域parentへ格納し、その代わ
りに対応テーブルのｋ番目のエントリには要素が無いこ
とを表す“NULL”を設定する〔ステップＳ１７；図１２
(a),図１３(a),図１４(a) 参照〕。そして、領域parent
のポインタが指すデータが“NULL”であるか否かを判定
し（ステップＳ１８）、“parent＝NULL”であれば、エ
ントリ番号ｋに１だけ加算してから（ステップＳ１
９）、ステップＳ１６に戻る一方、“parent≠NULL”で
あれば、領域parentのポインタが指す要素を先頭から順
に取り出し、エントリ番号ｋ０＝ｋ−１番目の各要素に
対し以下の処理を行なう。なお、領域parentのポインタ
が指す要素の値を（i,j,d,c,p)とする。

【０１０７】即ち、対応テーブルのエントリ番号ｋ０
（ｋ０≧０）番目の要素を先頭から順に参照し、エント
リ番号ｋ０から０までの間で、領域parentのポインタが
指す要素の添字ｉ，ｊよりも小さい値の添字を持ち、且
つ、最大のエントリ番号ｋ０を持つ要素を検索し、対応
する要素が存在するか否かを、関数check pairによりチ
ェックする（ステップＳ２０）。

【０１０８】このチェックでは、対応する要素の探索を
行なう関数check pair(k,i,j）が実行され、そのアルゴ
リズムを図９に示す。関数check pair(k,i,j）によるチ
ェックの開始時には、関数check pair(k,i,j）のｋとし
てｋ０を設定してから（ステップＳ２５）、ｋ０≧０で
あるか否かを判定する（ステップＳ２６）。ｋ０＜０で
あれば、関数check pair(k-1,i,j）の値として−１をス
テップＳ２０へ返す（ステップＳ２７）。

【０１０９】一方、ｋ０≧０であれば、対応テーブルの
ｋ０番目のエントリの先頭要素へのポインタを領域next
に格納する（ステップＳ２８）。このとき、領域nextの
ポインタが指す要素の値を(pi,pj,pd,pc,pp)とする。そ
して、領域nextのポインタが指すデータが“NULL”であ
るか否かを判定し（ステップＳ２９）、“next＝NULL”
であれば、ｋ０から１だけ減算してから（ステップＳ３
０）、ステップＳ２６に戻る一方、“next≠NULL”であ
れば、pi＜ｉ且つpj＜ｊであるか否かを判定する（ステ
ップＳ３１）。

【０１１０】このステップＳ３１の条件を満たす場合に
は、その時のｋ０を関数check pair(k-1,i,j）の値とし
てステップＳ２０へ返す一方（ステップＳ３２）、ステ
ップＳ３１の条件が満たされない場合には、次の要素へ
のポインタppを領域nextに格納してから（ステップＳ３
３）、ステップＳ２９に戻る。図９にて上述した手順に
よれば、対応要素が検索されると、対応テーブルのｋ０
＋１番目のエントリの要素の最後に、領域parentのポイ
ンタが指す要素を追加する。つまり、対応テーブルのｋ
０＋１番目のエントリの要素の末尾に登録されている要
素のポインタを、(i,j,d,c,NULL)をを格納データとする
要素を指すように更新する（図８のステップＳ２１）。

【０１１１】また、対応要素がなければ、ｋ０番目のエ
ントリにおける次の要素を取り出して、同様の処理を繰
り返し行なう。もし、ｋ０番目のエントリに該当する要
素がなければ、対応テーブルのｋ０−１番目のエントリ
に対して同様の処理を繰り返し行なう。ステップＳ２６
でｋ０＜０と判定された場合には、関数check pair(k-
1,i,j）の値として−１が出力されるので、ステップＳ
２１の処理により、対応テーブルの０番目のエントリの
末尾に要素が追加されることになる。

【０１１２】そして、ステップＳ２１の処理を終了した
時点で、ｋ０＋１＞lcs であるか否かを判定し（ステッ
プＳ２２）、ｋ０＋１≦lcs である場合には、領域pare
ntのポインタが現在指している要素におけるポインタｐ
を、領域parentに格納し（ステップＳ２３）、ステップ
Ｓ１８に戻り上述と同様の処理を繰り返し行なう。一
方、ステップＳ２２でｋ０＋１＞lcs と判定された場合
には、要素を登録した最大のエントリ番号をlcs に格納
する。つまり、lcs ＝ｋ０＋１とする（ステップＳ２
４）。

【０１１３】この時点で、lcs は対応テーブルで要素が
登録されているエントリ番号の最大値を示しているの
で、実際のＬＣＳ（最大共通構造長さ，対応付けられた
点集合の要素数）は、lcs に１だけ加算したものとなる
（ＬＣＳ＝lcs ＋１）。図１０に示すような二つの点集
合Ｐ，Ｔについて作成された初期テーブル（図１１参
照）に対し、図８，図９にて説明した処理を順次実行し
た結果を、図１２〜図１４に示す。

【０１１４】図１２(a),(b) では、ｋ＝１の場合の処理
が示されており、図１２(a) に示すように、ｋ＝１のエ
ントリにおける要素を領域parentに格納して、上述の処
理を行なうことで、結果として図１２(b) に示すように
対応テーブルの更新が行なわれる。つまり、ｋ＝１のエ
ントリにおける最初の要素がｋ＝０のエントリの末尾に
追加されている。

【０１１５】同様に、図１３(a),(b) では、ｋ＝２の場
合の処理が示されており、図１３(a) に示すように、ｋ
＝２のエントリにおける要素を領域parentに格納して、
上述の処理を行なうことで、結果として図１３(b) に示
すように対応テーブルの更新が行なわれる。実際には、
図１３(a),(b) に示す例では、更新前と更新後との変化
はない。

【０１１６】同様に、図１４(a),(b) では、ｋ＝３の場
合の処理が示されており、図１４(a) に示すように、ｋ
＝３のエントリにおける要素を領域parentに格納して、
上述の処理を行なうことで、結果として図１４(b) に示
すように対応テーブルの更新が行なわれる。実際には、
図１４(a),(b) に示す例でも、更新前と更新後との変化
はない。

【０１１７】なお、図１２〜図１４に示す対応テーブル
では、累積コスト値に対する処理は何も行なわないの
で、その累積コスト値の表示は省略されている。そし
て、図１０〜図１４に示す例では、最終的にｋ＝３のエ
ントリまで要素が格納されていることから、前述したlc
s の値は３であり、最長共通構造長さＬＣＳは４（＝lc
s ＋１）となり、この値がＬＣＳ算出部１１ｂから出力
される。

【０１１８】(B4)共通構造（最長共通部分）の抽出処理ＬＣＳ算出部１１ｂによりＬＣＳを算出するために作成
・更新された図１４に示す最終的な対応テーブルは、lc
s 番目のエントリに登録されている要素から逆順に、lc
s-1,lcs-2,…，０番目のエントリにおける要素により構
成される要素数lcs ＋１個の最長共通部分が存在するこ
とを示している。

【０１１９】そこで、図２に示す本実施例の累積距離算
出部１２（コスト関数演算部１２ａ）および共通部分抽
出部１３では、図１５〜図１７に示すアルゴリズムに基
づいて対応テーブルを探索し、順序関係を満たす最長の
共通部分で、且つ、ｒｍｓｄ値が最小の組合せを検出し
ている。ｒｍｓｄ値は、対応テーブルの各要素に登録さ
れている距離ｄ_kの平均二乗距離の平方根であり、次式
により算出される。

【０１２０】

【数３】

【０１２１】以下に、本実施例における最長共通部分抽
出手順を、図１５に示すフローチャート（ステップＳ３
４〜Ｓ３９）に従って説明する。なお、図１６は、図１
５に示す処理において実行される関数“align(i,j,k,su
m)”の処理内容を説明するためのフローチャート（ステ
ップＳ４０〜Ｓ５０）、図１７は、図１６に示す処理に
おいて実行される関数“look for pair(temp,i,j,su
m）”の処理内容を説明するためのフローチャート（ス
テップＳ５１〜Ｓ５５）である。

【０１２２】図１５に示すように、最長共通部分の抽出
に際しては、まず、例えば図１４に示すように作成・更
新された対応テーブルのlcs 番目のエントリに登録され
ている先頭要素へのポインタを、領域rootに格納する
（ステップＳ３４）。そして、領域rootのポインタが指
すデータが“NULL”であるか否かを判定し（ステップＳ
３５）、“root＝NULL”であれば、後述する配列best c
a,best cb,best cd に格納されている値を表示して（ス
テップＳ３９）、処理を終了する。

【０１２３】なお、配列best ca には、点集合Ａ（点集
合Ｐ）における最長共有部分の添字ｉが格納され、配列
best cb には、点集合Ｂ（点集合Ｔ）における最長共有
部分の添字ｊが格納され、配列best cd には、点ａ_iと
点ｂ_jとの間の距離が格納される。一方、ステップＳ３
５で“root≠NULL”であると判定された場合には、領域
rootのポインタが指す要素の値（i,j,d,c,p)における累
積コスト値ｃを更新するとともに、その要素の各値を各
配列および変数に格納する（ステップＳ３６）。つま
り、ｃ＝ｄ²，ca k ＝ｉ，cb k ＝ｊ，cd k ＝ｄ，
sum ＝ｄ²と設定する。

【０１２４】この後、図１６に示すフローチャートに従
って処理される関数align(i,j,lcs-1,sum)を実行し、残
りの最長共有部分を決定する（ステップＳ３７）。ここ
で、図１６により関数align(i,j,k,sum)の処理内容を説
明する。図１６に示すように、まず、ｋ（＝lcs-1)＜０
であるか否かを判定する（ステップＳ４０）。

【０１２５】ｋ＜０であれば、ｒｍｓｄ値を、 sum/(l
cs+1) ^1/2により算出し（ステップＳ４１）、そのｒｍ
ｓｄ値が変数best rmsd(最小のｒｍｓｄ値）よりも小さ
いか否かを判定する（ステップＳ４２）。best rmsd ≦
rmsdであれば、関数align(i,j,k,sum)の処理を終了する
一方、best rmsd ＞rmsdであれば、変数best sum（最小
のsum)として今回のsum を設定するとともに、変数best
rmsd として、ステップＳ４１にて算出されたｒｍｓｄ
値を設定する。また、０≦ｋ≦lcs に対して、配列best
ca k ，best cb k として、ca k ,cb k を設定する
（ステップＳ４３）。

【０１２６】一方、ステップＳ４０でｋ≧０であると判
定された場合には、今回のsum が現在の変数best sumよ
りも小さいか否かを判定する（ステップＳ４４）。sum
≧best sumであれば、関数align(i,j,k,sum)の処理を終
了する。また、ステップＳ４４でsum ＜best sumであれ
ると判定された場合には、対応テーブルのｋ番目のエン
トリの先頭要素へのポインタを、領域tempに格納してか
ら（ステップＳ４５）、図１７に示すフローチャートに
従って処理される関数look for pair(temp,i,j,sum）を
実行し、その関数による処理結果を領域elemに設定する
（ステップＳ４６）。

【０１２７】図１７により関数look for pair(temp,i,
j,sum）の処理内容を説明する。このとき、領域tempの
ポインタが指す要素の値を(ti,tj,td,tc,tp)とする。図
１７に示すように、まず、領域tempのポインタが指すデ
ータが“NULL”であるか否かを判定し（ステップＳ５
１）、“temp＝NULL”であれば、“NULL”を関数look f
or pair(temp,i,j,sum）の値としてステップＳ４６へ返
す（ステップＳ５２）。

【０１２８】これに対し、ステップＳ５１で“temp≠NU
LL”であると判定された場合には、ti＜ｉ，tj＜ｊであ
り且つtc＞sum+td²であるか否かを判定する（ステップ
Ｓ５３）。ステップＳ５３の条件を満たしている場合に
は、“temp”を関数look for pair(temp,i,j,sum）の値
としてステップＳ４６へ返す一方（ステップＳ５４）、
ステップＳ５３の条件が満たされていない場合には、領
域tempに現在格納されているポインタが指す要素のもつ
次の要素へのポインタtpを、領域tempに格納してから
（ステップＳ５５）、ステップＳ５１に戻る。

【０１２９】このようにして得られた関数look for pai
r(temp,i,j,sum）の値が領域elemに設定されると、図１
６に示すように、領域elemのデータが“NULL”であるか
否かを判定し（ステップＳ４７）、“elem＝NULL”であ
れば、関数align(i,j,k,sum)の処理を終了する。ステッ
プＳ４７で“elem≠NULL”であると判定された場合（つ
まり“elem＝temp”）には、領域elemのポインタが指す
要素の値(pi,pj,pd,pc,pp)の累積コスト値pcを更新する
とともに、各値を一時記憶領域に保存する（ステップＳ
４８）。つまり、pc＝sum ＋pd²，ca k ＝pi，cb k
＝pj，cd k ＝pdと設定する。

【０１３０】この後、関数align(i,j,k-1,sum)を実行
し、残りの最長共有部分を決定してから（ステップＳ４
９）、領域elemに現在格納されているポインタが指す要
素のもつ次の要素へのポインタppを、領域tempに格納し
てから（ステップＳ５０）、ステップＳ４６に戻る。関
数align(i,j,k,sum)について、上述のような処理を行な
い、その処理を終了すると、図１５のステップＳ３７か
らステップＳ３８へ移行し、領域rootに現在格納されて
いるポインタが指す要素のもつ次の要素へのポインタｐ
を、領域rootに格納してから（ステップＳ３８）、ステ
ップＳ３５に戻る。

【０１３１】そして、最終的に、ステップＳ３５にて
“root＝NULL”であると判定された時に、配列best ca,
best cb,best cd に格納されている値が、最長共有部分
として表示・抽出されることになる（ステップＳ３
９）。次に、図１５〜図１７にて上述した本実施例の最
長共通部分抽出処理について、より簡単に説明する。対
応テーブルはネットワーク構造であるため、最長共通部
分を探索する際には、同一要素を何度もノードとして巡
回することになる。しかし、最長共通部分の探索に際し
ては、ｒｍｓｄ値が最小となる経路を選択すればよいた
め、これまでに各ノード（要素）を巡回した際の各要素
間の距離の二乗和を累積コスト値ｃ（コスト関数）とす
ると、新たに探索する経路の累積コスト値がこれまでの
累積コスト値よりも小さくなる場合のみ探索を行なえば
よいことになる。

【０１３２】そこで、本実施例では、対応テーブルにお
ける経路の探索では、最長共有部分を形成する各要素の
累積コスト値ｃをコスト関数演算部１２ａにて算出する
ことにより、新たに探索する経路の累積コスト値がこれ
までの累積コスト値よりも小さくなる場合（図１７のス
テップＳ５３でＹＥＳ判定の場合）のみ経路探索を継続
し、同一ノードの重複巡回という無駄な探索を防止し
て、最長共通部分（共通構造）の抽出処理の高速化を実
現している。

【０１３３】図１４に示す最終的な対応テーブルに対
し、図１５〜図１７にて上述した最長共通部分の抽出処
理を行なった具体例を図１８〜図２８に示す。図１８
は、図１４の対応テーブルに、各要素の距離および累積
コスト値として、前述した具体的な初期値を設定した初
期状態を示している。そして、図１９に示すように、ｋ
＝３のエントリにおける先頭要素から、最長共有部分の
探索を開始する。このとき、その要素の累積コスト値Ｃ
５６として、∞に代えて点対Ｐ５，Ｔ６間の距離Ｄ５６
（＝０．６）の二乗値０．３６を格納する。

【０１３４】図２０に示すように、ｋ＝３のエントリに
おける点対Ｐ５，Ｔ６を含む要素から、ｋ＝２のエント
リにおける先頭要素を探索する。その先頭要素における
点対Ｐ４，Ｔ５の添字は、それぞれ点対Ｐ５，Ｔ６の添
字よりも小さい。また、点対Ｐ４，Ｔ５間の距離Ｄ４５
（＝０．４）の二乗値０．１６と、一つ前の要素までの
累積コスト値０．３６とを加算し、累積コスト値０．５
２を算出する。そして、今回算出された累積コスト値
０．５２と、現在累積コスト値Ｃ４５として格納されて
いる∞とを比較すると、明らかに累積コスト値０．５２
の方が小さいので、今回算出された累積コスト値０．５
２を新たな累積コスト値Ｃ４５として格納する。

【０１３５】同様に、図２１に示すように、ｋ＝２のエ
ントリにおける点対Ｐ４，Ｔ５を含む要素から、ｋ＝１
のエントリにおける先頭要素を探索する。その先頭要素
における点対Ｐ３，Ｔ２の添字は、それぞれ点対Ｐ４，
Ｔ５の添字よりも小さい。また、点対Ｐ３，Ｔ２間の距
離Ｄ３２（＝０．５）の二乗値０．２５と、一つ前の要
素までの累積コスト値０．５２とを加算し、累積コスト
値０．７７を算出する。そして、今回算出された累積コ
スト値０．７７と、現在累積コスト値Ｃ３２として格納
されている∞とを比較すると、明らかに累積コスト値
０．７７の方が小さいので、今回算出された累積コスト
値０．７７を新たな累積コスト値Ｃ３２として格納す
る。

【０１３６】同様に、図２２に示すように、ｋ＝１のエ
ントリにおける点対Ｐ３，Ｔ２を含む要素から、ｋ＝０
のエントリにおける先頭要素を探索する。その先頭要素
における点対Ｐ２，Ｔ１の添字は、それぞれ点対Ｐ３，
Ｔ２の添字よりも小さい。また、点対Ｐ２，Ｔ１間の距
離Ｄ２１（＝０．３）の二乗値０．０９と、一つ前の要
素までの累積コスト値０．７７とを加算し、累積コスト
値０．８６を算出する。そして、今回算出された累積コ
スト値０．８６と、現在累積コスト値Ｃ２１として格納
されている∞とを比較すると、明らかに累積コスト値
０．８６の方が小さいので、今回算出された累積コスト
値０．８６を新たな累積コスト値Ｃ２１として格納す
る。

【０１３７】次に、図２３に示すように、ｋ＝１のエン
トリにおける点対Ｐ３，Ｔ２を含む要素から、ｋ＝０の
エントリにおける２番目の要素を探索する。その２番目
の要素における点Ｐ３は、一つ前の要素の点Ｐ３と一致
しているため、当該探索経路は不適なものと判断され
る。そして、図２４に示すように、ｋ＝３のエントリに
おける点対Ｐ５，Ｔ６を含む要素から、ｋ＝２のエント
リにおける２番目の要素を探索する。その２番目の要素
における点Ｔ６は、一つ前の要素の点Ｔ６と一致してい
るため、当該探索経路は不適なものと判断される。

【０１３８】以上の処理により、ｋ＝３のエントリにお
ける先頭要素を始点とする探索は終了し、次に、図２５
に示すように、ｋ＝３のエントリにおける２番目の要素
を起点として、最長共有部分の探索を開始する。このと
き、その要素の累積コスト値Ｃ５７として、∞に代えて
点対Ｐ５，Ｔ７間の距離Ｄ５７（＝１．４）の二乗値
１．９６を格納する。

【０１３９】図２６に示すように、ｋ＝３のエントリに
おける点対Ｐ５，Ｔ７を含む要素から、ｋ＝２のエント
リにおける先頭要素を探索する。その先頭要素における
点対Ｐ４，Ｔ５の添字は、それぞれ点対Ｐ５，Ｔ７の添
字よりも小さい。また、点対Ｐ４，Ｔ５間の距離Ｄ４５
（＝０．４）の二乗値０．１６と、一つ前の要素までの
累積コスト値１．９６とを加算し、累積コスト値２．１
２を算出する。そして、今回算出された累積コスト値
２．１２と、現在累積コスト値Ｃ４５として格納されて
いる０．５２とを比較すると、明らかに今回算出された
累積コスト値２．１２の方が大きいので、当該探索経路
は不適なものと判断される。

【０１４０】図２７に示すように、ｋ＝３のエントリに
おける点対Ｐ５，Ｔ７を含む要素から、ｋ＝２のエント
リにおける２番目の要素を探索する。その２番目の要素
における点対Ｐ４，Ｔ６の添字は、それぞれ点対Ｐ５，
Ｔ７の添字よりも小さい。また、点対Ｐ４，Ｔ６間の距
離Ｄ４６（＝１．２）の二乗値１．４４と、一つ前の要
素までの累積コスト値１．９６とを加算し、累積コスト
値３．４を算出する。そして、今回算出された累積コス
ト値３．４と、現在累積コスト値Ｃ４６として格納され
ている∞とを比較すると、明らかに累積コスト値３．４
の方が小さいので、今回算出された累積コスト値３．４
を新たな累積コスト値Ｃ４６として格納する。

【０１４１】図２８に示すように、ｋ＝２のエントリに
おける点対Ｐ４，Ｔ６を含む要素から、ｋ＝１のエント
リにおける先頭要素を探索する。その先頭要素における
点対Ｐ３，Ｔ２の添字は、それぞれ点対Ｐ４，Ｔ６の添
字よりも小さい。また、点対Ｐ３，Ｔ２間の距離Ｄ３２
（＝０．５）の二乗値０．２５と、一つ前の要素までの
累積コスト値３．４とを加算し、累積コスト値３．６５
を算出する。そして、今回算出された累積コスト値３．
６５と、現在累積コスト値Ｃ３２として格納されている
０．７７とを比較すると、明らかに今回算出された累積
コスト値３．６５の方が大きいので、当該探索経路は不
適なものと判断される。

【０１４２】図２９は、図１８〜図２８により上述した
具体的な処理手順を一つの木構造にまとめて図示したも
のである。図１４に示すごとく得られた対応テーブルか
らは、ＬＣＳ＝４の最長共通部分の組合せを３通り抽出
することができる（図３０参照）。その３通りの点対の
組合せは、(P5,T6)-(P4,T5)-(P3,T2)-(P2,T1) ；(P
5,T7)-(P4,T5)-(P3,T2)-(P2,T1) ；(P5,T7)-(P4,T6)-
(P3,T2)-(P2,T1) である。

【０１４３】しかし、本実施例の最長共通部分抽出処理
では、コスト関数（点対間の距離の二乗和）を導入する
ことにより、最適化探索が行なわれ、コスト関数の値
（累積コスト値）が最小になる組合せ（経路）、つまり
はｒｍｓｄ値が最小になる組合せが、上記３通りの組合
せの中から最長共通部分（共通構造）として抽出される
ことになる。

【０１４４】上述のようなコスト関数を導入しない場
合、つまり全解探索を行なった場合には、図３０に示す
ように、ＬＣＳ＝４の最長共通部分の組合せを３通り全
て抽出した後、各組合せ毎にｒｍｓｄ値を算出し、その
ｒｍｓｄ値が最小になるものを選択・抽出しなければな
らないので、前記最適化探索を行なう場合に比べて、処
理時間は極めて長くなる。

【０１４５】なお、図２９，図３０において、◎は適切
な経路として選択された点対を表し、×は不適な経路と
判断された点対を表している。 (B5)共通構造の自動抽出次に、本実施例における共通構造の自動抽出処理（図３
に示す類似構造検索部２の機能）について説明する。

【０１４６】順序付けられた点集合Ａ，Ｂにおいて、点
集合Ａの構成要素をプローブ（検索キー）として、点集
合Ｂから共通構造を抽出する。その抽出処理に際して
は、点集合Ａの順序関係に基づいて、先頭から順にＬ個
の要素（部分集合）を取り出し、各部分集合の類似構造
を点集合Ｂから検索する。この検索手法としては、本出
願人が先に出願した前記発明（特開平６−１８０７３７
号）に記載されたものと同様の技術が用いられる。

【０１４７】そして、検索された類似構造を部分対応付
け情報として用い、図５〜図２９にて上述した手法によ
り最長共通部分を抽出し、全ての組み合わせの中で最長
となる構造が、点集合Ａ，Ｂ間の最長共通部分つまり共
通構造となる。以下に、その共通構造の自動抽出手順を
示す。即ち、点集合Ａを要素ａ_i（１≦ｉ≦ＮＡ）とし
た場合、ｉ＝１，Ｌ＋１，２Ｌ＋１，…，ＮＡ−Ｌ＋１
（ＮＡはＬの倍数とする）について、順次下記の処理
，を繰り返し行なう。

【０１４８】点集合Ａの部分集合｛ a_i，…,
a_i+L-1｝をプローブとして用い、そのプローブに類似
する構造（類似構造）を点集合Ｂから検索する。による検索結果を部分対応付け情報として用い、点
集合Ａ，Ｂ間の最長共通部分を抽出する。上述した，の処理を、全要素に対して繰り返し適用
することにより、最長の共通部分（最適な共通構造）を
決定することができる。

【０１４９】(B6)核構造抽出次に、図４に示した核構造抽出部３の動作について、図
３１〜図４４を参照しながら説明する。この核構造抽出
部３による核構造抽出処理は、二つの点集合（各点は順
序付けられた三次元座標）からなる立体構造について、
核構造（二つの点集合を適切に重ね合わせるための核と
なる点集合）を抽出する処理である。なお、以下の説明
では、二つの立体構造が、それぞれ点集合Ａ，Ｂからな
るタンパク質ＰＡ，ＰＢであるものとして説明するが、
立体座標を持つ二つの点集合であれば同様の処理により
核構造抽出を行なえることは言うまでもない。また、立
体構造がタンパク質である場合、点集合Ａ，Ｂは、それ
ぞれ、タンパク質ＰＡ，ＰＢを構成するアミノ酸を点と
みなし、そのアミノ酸の配列番号に従うアミノ酸の順序
集合として捉えられる。

【０１５０】本実施例における核構造抽出処理の手順
（アルゴリズム）を、図３１に示すフローチャート（ス
テップＳ６１〜Ｓ７０）に従って説明する。基本的な手
順としては、セグメント分割部３ａにより、タンパク質
ＰＡを成す点集合Ａを、一定の長さＬの複数のセグメン
トに分割しておいてから、セグメント検索部３ｂによ
り、タンパク質ＰＡのセグメントを先頭から一つずつ取
り出し、そのセグメントを検索キーとしてタンパク質Ｐ
Ｂに対し、後述する検索処理（ステップＳ６３）を行な
う。

【０１５１】図３１中において、“start ”は、タンパ
ク質ＰＢについて前回に検索された核構造Ｂ０の最後の
要素（点）の番号に１を加算した値を表し、“no seg”
は、タンパク質ＰＡの分割されたセグメントの中で現在
のプローブ（検索キー）となるセグメントの番号を示
す。図３１に示す処理は各セグメント毎に開始され、前
のサイクルで既に核構造Ｂ０が得られている場合は、核
構造Ｂ０の最後の要素の次の要素を検索開始位置“star
t ”とする（ステップＳ６１）。なお、核構造Ｂ０が得
られていない場合には、“start ＝１”となる。

【０１５２】そして、プローブセグメントの番号“no s
eg”がセグメントの総数よりも小さく、且つ、検索開始
位置を示す番号“start ”がタンパク質ＰＢの最後の要
素を示す番号よりも小さいか否かを判定する（ステップ
Ｓ６２）。これらの条件をいずれも満たす場合には、検
索処理が実行される（ステップＳ６３）。このステップ
Ｓ６３における検索処理のアルゴリズムを、図３２に示
すフローチャート（ステップＳ７１〜Ｓ７９）に従って
説明する。図３２に示すように、この検索処理では、ま
ず、番号ｉとして前述した検索開始位置を示す番号“st
art ”を設定し（ステップＳ７１）、その番号ｉを、点
集合Ｂの要素（点）を指定する番号ｋとして設定してか
ら（ステップＳ７２）、点集合Ｂの点Ｂ（ｋ）〔前述し
たｂ_kに対応する要素〕が制約条件を満たすか否かを判
定する（ステップＳ７３）。

【０１５３】制約条件を満たす場合には、点Ｂ（ｋ）
を、現在プローブとして選択されているセグメント（Ｌ
個の要素からなる点集合Ａの部分集合）と対応付ける
（ステップＳ７４）。この対応付けは、点Ｂ（ｋ）と点
集合Ａのセグメントの要素との幾何学的な関係，閾値条
件等を考慮することによって行なわれる。そして、番号
ｋがｉ＋（Ｌ−１）以下であるか否かを判定して（ステ
ップＳ７５）、ｋ≦ｉ＋（Ｌ−１）であれば、番号ｋに
１を加算し（ステップＳ７６）、ステップＳ７３に戻
る。

【０１５４】これらのステップＳ７３〜Ｓ７６による処
理を繰り返すことで、点Ｂ（ｉ）を始点とする点集合Ｂ
のＬ個の要素について、点集合Ａのセグメントの要素と
の対応付けが行なわれる。ステップＳ７３にて点Ｂ
（ｋ）が制約条件を満たさないと判定された場合には、
番号ｉに１を加算してから（ステップＳ７９）、ステッ
プＳ７２に戻って、点集合Ｂの始点要素を一つだけずら
して点集合Ａのセグメントとの対応付けを行なう。

【０１５５】ステップＳ７５でｋ＞ｉ＋（Ｌ−１）と判
定された場合には、点Ｂ（ｉ）を始点とする点集合Ｂの
Ｌ個の要素が点集合ＡのセグメントのＬ個の要素と対応
付けられたことになるので、その点Ｂ（ｉ）を、位置リ
ストとして用意された領域に加える（ステップＳ７
７）。この後、点Ｂ（ｉ＋Ｌ−１）がタンパク質ＰＢの
最後の要素であるか否かを判定し（ステップＳ７８）、
最後の要素でなければ、ステップＳ７９に戻り、前述と
同様の処理を繰り返す一方、最後の要素であれば、今回
の点集合Ａのセグメントについての検索処理を終了し、
図３１のステップＳ６４へ移行する。

【０１５６】上述した図３２に示す検索処理により、タ
ンパク質ＰＢを構成する点集合Ｂから構成要素順序に従
ってＬ個ずつ要素が選択され、点集合ＢのＬ個の要素と
点集合Ａのセグメントの各要素との対応付けが行なわれ
る。そして、点集合Ａのセグメントの全ての要素と点集
合ＢのＬ個の要素とが対応付けられた場合（類似構造が
検索された場合）、点集合Ａのセグメントの最初の要素
と対応付けられた点集合Ｂの要素Ｂ（ｉ）が位置リスト
として用意された領域に加えられる。

【０１５７】さて、ステップＳ６３による検索処理を終
了すると、その検索処理により類似構造が検索されたか
否かを判定し（ステップＳ６４）、類似構造が検索され
ている場合つまり位置リストに点集合Ｂの要素が記録さ
れている場合には、その位置リストに記録された全類似
構造に基づいて、立体構造の類似性を調べる。即ち、今
までに得られた核構造Ａ０，核構造Ｂ０と、今回検索キ
ーとしたセグメントと、それに対応する類似構造とを合
わせて、立体構造の類似性を、類似性判別部３ｃにより
調べる。このとき、予め設定したｒｍｓｄ値の閾値条件
を考慮するほか、核構造Ａ０とセグメントとを合わせた
構造を構成する点集合と、核構造Ｂ０とセグメントに対
応する類似構造（点集合Ｂの部分集合）とを合わせた構
造を構成する点集合との幾何学的な関係を考慮する（ス
テップＳ６５）。

【０１５８】そして、ステップＳ６５による類似性の調
査結果に基づいて、ｒｍｓｄ値の閾値条件や幾何学的関
係が満たされたか否かを判定し（ステップＳ６６）、こ
れらの条件が満たされている場合には、今回のセグメン
トと、このセグメントに対応する点集合Ｂにおける類似
構造とを、核構造選択部３ｄにより選択して、それぞれ
核構造Ａ０，核構造Ｂ０に付け加え（ステップＳ６
７）、次のセグメントによる核構造抽出処理へ移行すべ
く、プローブセグメントの番号“no seg”に１を加算し
てから（ステップＳ６８）、ステップＳ６１に戻り、前
述と同様の処理を繰り返す。

【０１５９】なお、ステップＳ６４で類似構造が検索さ
れていないと判定された場合や、ステップＳ６６で所定
条件が満たされていないと判定された場合には、直ちに
ステップＳ６８へ移行し、次のセグメントによる核構造
抽出処理を行なう。最後のセグメントまで核構造抽出処
理を行なった場合や、検索開始位置がタンパク質ＰＢの
最後の要素になった場合には、前述したステップＳ６２
での条件が満たされなくなり、ステップＳ６９へ移行す
る。

【０１６０】このステップＳ６９では、抽出された核構
造の長さが一定値以上であるか否かが判定され、一定値
以上でなければ処理を終了する一方、一定値以上であれ
ば、その核構造を部分対応付け情報として用い、図２〜
図３０により前述した共通構造抽出処理を実行する（ス
テップＳ７０）。複数の核構造が得られた場合には、そ
れぞれの核構造について共通構造抽出処理が実行される
ことになる。

【０１６１】図３１，図３２にて説明した核構造抽出処
理について、その具体例を図３３〜図３８に示す。ま
ず、図３３に示すように、タンパク質ＰＡ（２４個の点
からなる点集合Ａ）を一定の長さＬ（＝６）の４つのセ
グメントに分割し、各セグメントに１〜４の番号（前述
した“no seg”）を付す。なお、タンパク質ＰＡの点集
合Ａは、このタンパク質ＰＡを構成するアミノ酸の配列
番号１〜２４にて示される各要素（点）から構成され、
セグメント１には配列番号１〜６の要素が含まれ、セグ
メント２には配列番号７〜１２の要素が含まれ、セグメ
ント３には配列番号１３〜１８の要素が含まれ、セグメ
ント４には配列番号１９〜２４の要素が含まれる。

【０１６２】このように分割されたタンパク質ＰＡの各
セグメントをキーとして用い、タンパク質ＰＢから類似
な構造を検索する。なお、図３４〜図３８の各図におい
て、（Ａ）はタンパク質ＰＡの構造を示し、（Ｂ）はタ
ンパク質ＰＢの構造を示している。最初に、図３４
（Ａ），（Ｂ）に示すように、タンパク質ＰＡのセグメ
ント１に類似する構造を、タンパク質ＰＢから検索す
る。このとき、図３４（Ｂ）に示すように、タンパク質
ＰＢを構成するアミノ酸の配列番号１〜６の要素が、セ
グメント１の類似構造１として検索されたものとする
と、下記の通り、セグメント１を構成するアミノ酸の配
列番号を核構造Ａ０に登録するとともに、類似構造１を
構成するアミノ酸の配列番号を核構造Ｂ０に登録する。

【０１６３】核構造Ａ０＝｛1,2,3,4,5,6 ｝核構造Ｂ０＝｛1,2,3,4,5,6 ｝次に、図３５（Ａ），（Ｂ）に示すように、タンパク質
ＰＡのセグメント２に類似する構造を、タンパク質ＰＢ
から検索する。この場合は、図３５（Ｂ）に示すよう
に、セグメント２に類似する構造がタンパク質ＰＢから
検索されないので、核構造Ａ０，Ｂ０の内容は、図３４
（Ａ) ，（Ｂ）にて説明したものと同様である。

【０１６４】ついで、図３６（Ａ），（Ｂ）に示すよう
に、タンパク質ＰＡのセグメント３に類似する構造を、
タンパク質ＰＢから検索し、図３６（Ｂ）に示すよう
に、タンパク質ＰＢを構成するアミノ酸の配列番号１５
〜２０の要素が、セグメント３の類似構造２として検索
されたものとする。このとき、核構造Ａ０，Ｂ０が既に
登録されているので、セグメント３と核構造Ａ０とを合
わせた構造と、類似構造２と核構造Ｂ０とを合わせた構
造との類似性を調べる（図３１のステップＳ６５の処
理）。

【０１６５】この類似性の判断の結果、ｒｍｓｄ値の閾
値条件とそれぞれの構造を構成する点集合の幾何学的条
件とが満たされていれば、セグメント３および類似構造
２をそれぞれ核構造Ａ０と核構造Ｂ０にそれぞれ加え
る。この結果、各核構造Ａ０，Ｂ０は下記の通りにな
り、これらの核構造Ａ０，Ｂ０をそれぞれ図３７
（Ａ），（Ｂ）に図形的に表示する。

【０１６６】核構造Ａ０＝｛1,2,3,4,5,6,13,14,15,16,17,18 ｝核構造Ｂ０＝｛1,2,3,4,5,6,15,16,17,18,19,20 ｝そして、最後に、図３８（Ａ），（Ｂ）に示すように、
タンパク質ＰＡのセグメント４に類似する構造を、タン
パク質ＰＢから検索する。この場合は、図３８（Ｂ）に
示すように、セグメント４に類似する構造がタンパク質
ＰＢから検索されないので、核構造Ａ０，Ｂ０の内容は
変化しない。これにより、最後のセグメントによる検索
処理が終了したので、最終的に求められた核構造は上記
の通りである。

【０１６７】(B7)類似構造マップの作成図３１，図３２により上述した核構造抽出処理では、セ
グメントに類似する構造として検索された核構造Ａ０，
Ｂ０は、上記の通り、各要素を表す番号の集合として抽
出されているが、以下に、二つの立体構造の類似構造
（核構造を含む）の関係を表示する類似構造マップを作
成し、その類似構造マップを用いて核構造を抽出する場
合について、図３９〜図４４を参照しながら説明する。

【０１６８】まず、本実施例における類似構造マップ作
成処理の手順（アルゴリズム）を、図３９に示すフロー
チャート（ステップＳ７９〜Ｓ８７）に従って説明す
る。この図３９により説明する手順では、共通構造抽出
の対象となる２つのタンパク質ＰＡおよびタンパク質Ｐ
Ｂを構成する要素の数（アミノ酸の数）を、それぞれ
ｍ，ｎとする。また、セグメント化を開始する位置を
“start ”、類似構造の存在位置を記憶する二次元配列
（類似構造マップ）を“position［ｍ］［ｎ］”とす
る。

【０１６９】図３９に示すように、まず、二次元配列
“position［ｍ］［ｎ］”を０、セグメント化開始位置
“start ”を１に初期化してから（ステップＳ７９）、
セグメント化開始位置start の要素から、タンパク質Ｐ
Ａを一定の長さＬのセグメントに分割する（ステップＳ
８０）。このとき、分割されたセグメントの総数を“se
g max ”として登録する。

【０１７０】そして、セグメントを指定する番号ｉに１
を設定し（ステップＳ８１）、ｉ番目のセグメントを検
索のキーとして（ステップＳ８２）、検索処理が実行さ
れる（ステップＳ８３）。このステップＳ８３における
検索処理のアルゴリズムを、図４０に示すフローチャー
ト（ステップＳ８８〜Ｓ９８）に従って説明する。図４
０に示すように、この検索処理も、図３２にて説明した
検索処理とほぼ同様に実行され、まず、番号ｉとして１
を設定し（ステップＳ８８）、その番号ｉを、点集合Ｂ
の要素（点）を指定する番号ｋとして設定してから（ス
テップＳ８９）、点集合Ｂの点Ｂ（ｋ）が制約条件を満
たすか否かを判定する（ステップＳ９０）。

【０１７１】制約条件を満たす場合には、点Ｂ（ｋ）
を、現在プローブとして選択されているセグメント（Ｌ
個の要素からなる点集合Ａの部分集合）と対応付ける
（ステップＳ９１）。この対応付けは、点Ｂ（ｋ）と点
集合Ａのセグメントの要素との幾何学的な関係，閾値条
件等を考慮することによって行なわれる。そして、番号
ｋがｉ＋（Ｌ−１）以下であるか否かを判定して（ステ
ップＳ９２）、ｋ≦ｉ＋（Ｌ−１）であれば、番号ｋに
１を加算し（ステップＳ９３）、ステップＳ９０に戻
る。

【０１７２】これらのステップＳ９０〜Ｓ９３による処
理を繰り返すことで、点Ｂ（ｉ）を始点とする点集合Ｂ
のＬ個の要素について、点集合Ａのセグメントの要素と
の対応付けが行なわれる。ステップＳ９０にて点Ｂ
（ｋ）が制約条件を満たさないと判定された場合には、
番号ｉに１を加算してから（ステップＳ９８）、ステッ
プＳ８９に戻って、点集合Ｂの始点要素を一つだけずら
して点集合Ａのセグメントとの対応付けを行なう。

【０１７３】ステップＳ９２でｋ＞ｉ＋（Ｌ−１）と判
定された場合には、点Ｂ（ｉ）を始点とする点集合Ｂの
Ｌ個の要素が点集合ＡのセグメントのＬ個の要素と対応
付けられたことになる。この場合、番号ｊに１を設定し
（ステップＳ９４）、ステップＳ９０〜Ｓ９３の処理に
よって点集合Ａのセグメントに対応付けられたＬ個の点
Ｂ（ｋ）〔ｉ≦ｋ≦ｉ＋（Ｌ−１）〕と、点集合Ａのセ
グメントのＬ個の要素との対応関係を、１つずつ二次元
配列“position［Ａ］［Ｂ］”上に登録する（ステップ
Ｓ９５）。

【０１７４】つまり、図４１により後述するごとく、二
次元配列“position［Ａ］［Ｂ］”上で、点集合Ａのセ
グメントに対応付けられたＬ個の点Ｂ（ｋ）の位置（配
列番号）と、点集合ＡのセグメントのＬ個の要素の位置
（配列番号）との交点上に所定データ“１”を設定す
る。なお、このとき、１つの対応関係を登録すると番号
ｊに１を加算し、その番号ｊがＬ以下か否かを判定し
（ステップＳ９６）、ｊ≦Ｌであれば、ステップＳ９５
に戻る。ステップＳ９５，Ｓ９６の処理を繰り返すこと
により、今回対応付けられたＬ対の要素の対応関係が、
二次元配列“position［Ａ］［Ｂ］”上に登録される。

【０１７５】この後、点Ｂ（ｉ＋Ｌ−１）がタンパク質
ＰＢの最後の要素であるか否かを判定し（ステップＳ９
７）、最後の要素でなければ、ステップＳ９８に戻り、
前述と同様の処理を繰り返す一方、最後の要素であれ
ば、今回の点集合Ａのセグメントについての検索処理を
終了し、図３９のステップＳ８４へ移行する。上述した
図４０に示す検索処理により、タンパク質ＰＢを構成す
る点集合Ｂから構成要素順序に従ってＬ個ずつ要素が選
択され、点集合ＢのＬ個の要素と点集合Ａのセグメント
の各要素との対応付けが行なわれる。そして、点集合Ａ
のセグメントの全ての要素と点集合ＢのＬ個の要素とが
対応付けられた場合（類似構造が検索された場合）、点
集合Ａのセグメントの各要素と、点集合Ａの要素に対応
付けられた点集合Ｂの要素Ｂ（ｉ）との対応関係が二次
元配列“position［Ａ］［Ｂ］”上に登録される。つま
り、その対応関係に応じて、類似構造の分布を記録する
類似構造マップ上の二次元配列位置（position) ［タン
パク質ＰＡの要素位置］，［タンパク質ＰＢの要素位
置］に“１”が設定される。

【０１７６】さて、ステップＳ８３による検索処理を終
了すると、セグメント指定番号ｉに１を加算し（ステッ
プＳ８４）、新たな番号ｉがセグメントの総数“seg ma
x ”以下であるか否かを判定し（ステップＳ８５）、ｉ
≦seg max であれば、ステップＳ８２に戻り、点集合Ａ
の次のセグメントについて、図４０にて前述した通りの
検索処理を実行する。

【０１７７】一方、ステップＳ８５にてｉ＞seg max と
判定された場合には、今回、セグメント化開始位置star
t を始点として分割された全てのセグメントについての
検索処理を終了したものと判断して、セグメント化開始
位置“start ”に１を加算し（ステップＳ８６）、新た
なセグメント化開始位置“start ”がＬ以下であるか否
かを判定する（ステップＳ８７）。

【０１７８】start ＞Ｌである場合には、類似構造マッ
プ作成処理を終了するが、start ≦Ｌであれば、ステッ
プＳ８０に戻って、前述と同様の処理を繰り返し実行す
る。つまり、セグメント開始位置“start ”を１つだけ
ずらして、セグメントの分割を行なって、類似構造の抽
出，類似構造マップの作成を実行する。このような処理
を行なうことで、図３１，図３２にて説明した核構造抽
出処理のように分割したセグメント〔切り初め位置（セ
グメント化開始位置）が固定〕を用いる場合よりも精密
に、点集合Ａ，Ｂ間の対応付けを行なうことができる。

【０１７９】次に、図３９，図４０により上述した手順
で作成された類似構造マップの具体例を図４１（Ａ），
（Ｂ）に示す。図４１（Ａ）は類似構造マップを初期化
した状態を示すもので、この図４１（Ａ）に示すよう
に、本実施例の類似構造マップでは、タンパク質ＰＡを
構成するアミノ酸配列番号が行方向（長さｍ）に設定さ
れ、タンパク質ＰＢを構成するアミノ酸配列番号が列方
向（長さｎ）に設定されている。そして、初期化状態で
は、二次元配列“position［ｍ］［ｎ］”は全て“０”
に設定されている。

【０１８０】タンパク質ＰＡおよびタンパク質ＰＢが図
３３〜図３８により前述した構造をそなえている場合
に、図３９，図４０にて説明した類似構造マップ作成処
理を行なった結果、作成される類似構造マップを図４１
（Ｂ）に示す。即ち、最初にタンパク質ＰＡのセグメン
ト１（アミノ酸配列番号１〜６）に対してタンパク質Ｐ
Ｂのアミノ酸番号１〜６が類似構造１として対応付けら
れ、図４１（Ｂ）に示すように、セグメント１と類似構
造１とのアミノ酸配列番号の対応する位置（交点上）に
“１”が設定される。

【０１８１】この後、タンパク質ＰＡのセグメントの切
り初めを１つずつずらして対応付けを行なうことによ
り、図３６に示した例と同様に、セグメント３と類似構
造２とが対応付けられ、図４１（Ｂ）に示すように、セ
グメント３と類似構造２とのアミノ酸配列番号の対応す
る位置（交点上）に“１”が設定される。なお、図４１
（Ｂ）中の空欄には“０”が設定されている。

【０１８２】(B8)類似構造マップに基づいた核構造抽出図３９，図４０に示した手順により類似構造マップが作
成されると、以下のようにして、核構造の抽出が行なわ
れる。本実施例における類似構造マップに基づいた核構
造抽出処理の手順（アルゴリズム）を、図４２に示すフ
ローチャート（ステップＳ１０１〜Ｓ１０９）に従って
説明する。

【０１８３】ここで、共通構造抽出の対象となる二つの
タンパク質を、タンパク質ＰＡおよびタンパク質ＰＢと
し、これらのタンパク質ＰＡ，ＰＢの立体構造を最も良
く重ね合わせるための中心となる構造をそれぞれ核構造
Ａ０，核構造Ｂ０とし、類似構造部位のうちタンパク質
ＰＡ，ＰＢの構造をそれぞれ類似構造Ａ１，Ｂ１とす
る。また、類似構造の分布を記録する二次元配列を“po
sition［ｍ］［ｎ］”とし、この二次元配列“position
［ｍ］［ｎ］”の探索開始位置を“ａ start”，“ｂ s
tart”とする。

【０１８４】図４２に示すように、まず、探索開始位置
“ａ start”，“ｂ start”が、それぞれ、タンパク質
ＰＡ，ＰＢの最後の要素であるか否かを判定し（ステッ
プＳ１０１）、いずれの探索開始位置“ａ start”，
“ｂ start”もタンパク質ＰＡ，ＰＢの最後の要素でな
ければ、類似部位探索処理を実行する（ステップＳ１０
２）。

【０１８５】このステップＳ１０２における類似部位探
索処理のアルゴリズムを、図４３に示すフローチャート
（ステップＳ１１１〜Ｓ１２０）に従って説明する。こ
こで、類似部位のうち、タンパク質ＰＡの構造の類似部
位をＡ［ｋ］、タンパク質ＰＢの類似部位をＢ［ｍ］と
する。また、前述した通り、類似構造の分布を記録する
二次元配列は“position［ｍ］［ｎ］”とし、その探索
開始位置は“ａ start”，“ｂ start”とする。

【０１８６】図４３に示すように、この類似部位探索処
理では、まず、ｋ＝１，ｍ＝１に初期設定し（ステップ
Ｓ１１１）、番号ｉとしてタンパク質ＰＡの探索開始位
置“ａ start”を設定してから（ステップＳ１１２）、
その番号ｉがタンパク質ＰＡの最後の要素であるか否か
を判定する（ステップＳ１１３）。番号ｉがタンパク質
ＰＡの最後の要素であれば、類似部位探索処理を終了
し、図４２のステップＳ１０３へ移行する。一方、番号
ｉがタンパク質ＰＡの最後の要素でなければ、番号ｊと
してタンパク質ＰＢの探索開始位置“ｂ start”を設定
する（ステップＳ１１４）。

【０１８７】そして、番号ｊがタンパク質ＰＢの最後の
要素であるか否かを判定し（ステップＳ１１５）、番号
ｊがタンパク質ＰＡの最後の要素であれば、番号ｉに１
を加算してから（ステップＳ１１６）、ステップＳ１１
３に戻る一方、番号ｊがタンパク質ＰＢの最後の要素で
なければ、類似構造マップ（二次元配列）の“position
［ｉ］, ［ｊ］”（最初は１行目の１列）が“１”か否
かを判別する（ステップＳ１１７）。

【０１８８】二次元配列“position［ｉ］, ［ｊ］”が
“１”でなければ即ち“０”であれば、ステップＳ１１
５に戻る一方、二次元配列“position［ｉ］, ［ｊ］”
が“１”であれば、タンパク質ＰＡ，ＰＢの類似部位と
してそれぞれＡ［ｋ］＝ｉ，Ｂ［ｍ］＝ｊを設定し、番
号ｋ，ｍ，ｉ，ｊにそれぞれ１を加算し（ステップＳ１
１９）、次の配列位置（前の位置の１行下で１列右の位
置）である“position［ｉ］, ［ｊ］”が“１”か否か
を判別する（ステップＳ１２０）。

【０１８９】そして、ステップＳ１２０による判別の結
果、“position［ｉ］, ［ｊ］”が“１”であればステ
ップＳ１１９に戻って上述と同様にして類似部位を探索
し、“１”でなければ即ち“０”であれば、類似部位探
索処理を終了し、図４２のステップＳ１０３へ移行す
る。さて、ステップＳ１０２による類似部位探索処理を
終了すると、その処理の結果得られた類似構造Ａ１，Ｂ
１と、今までに得られた核構造Ａ，Ｂとをそれぞれ合わ
せて、立体構造の類似性を調べる。その際、予め設定し
たｒｍｓｄ値の閾値条件を考慮するほか、核構造Ａ０と
類似構造Ａ１とを合わせた構造を構成する点集合と、核
構造Ｂ０と類似構造Ｂ１とを合わせた構造を構成する点
集合との幾何学的関係を考慮する（ステップＳ１０
３）。

【０１９０】そして、ステップＳ１０３による類似性の
調査結果に基づいて、ｒｍｓｄ値の閾値条件や幾何学的
関係が満たされたか否かを判定し（ステップＳ１０
４）、これらの条件が満たされている場合には、類似構
造Ａ１，Ｂ１をそれぞれ核構造Ａ０，Ｂ０に付け加える
（ステップＳ１０５）。この後、探索開始位置“ａ sta
rt”，“ｂ start”として、それぞれ核構造Ａ０，Ｂ０
の最後の要素の次の要素を設定してから（ステップＳ１
０６）、ステップＳ１０１に戻り、前述と同様の処理を
繰り返す。

【０１９１】一方、ステップＳ１０４にて所定条件が満
たされていないと判定された場合には、類似構造Ａ１，
Ｂ１を核構造Ａ０，Ｂ０に加えることなく、タンパク質
ＰＡの探索開始位置“ａ start”として類似構造Ａ１の
最初の要素を設定するとともに、タンパク質ＰＢの探索
開始位置“ｂ start”として類似構造Ｂ１の２番目の要
素を設定してから（ステップＳ１０７）、ステップＳ１
０１に戻り、前述と同様の処理を繰り返す。

【０１９２】上述の処理を繰り返し行ない、ステップＳ
１０１で探索開始位置“ａ start”，“ｂ start”がタ
ンパク質ＰＡ，ＰＢの最後の要素であると判定された場
合には、抽出された核構造の長さが一定値以上であるか
否かが判定され（ステップＳ１０８）、一定値以上でな
ければ処理を終了する一方、一定値以上であれば、その
核構造を部分対応付け情報として用い、図２〜図３０に
より前述した共通構造抽出処理を実行する（ステップＳ
１０９）。複数の核構造が得られた場合には、それぞれ
の核構造について共通構造抽出処理が実行されることに
なる。

【０１９３】(B9)幾何学的な関係による候補の絞り込み上述した核構造抽出処理（図３１，図４２等）におい
て、幾何学的な関係に基づいて点集合Ａ，Ｂの要素を対
応付けることにより、無駄な組み合わせの生成を防止す
ることができ、効率良く点集合Ａ，Ｂを対応させること
ができる。以下に、この幾何学的な制約について説明す
る。

【０１９４】要素の対応付けを行なう際に、点集合Ａ内
の要素ａ_iと近接するｓ個（１≦ｓ≦ｉ−１）の点間に
成り立つ距離関係｜ａ_i−ａ_i-s｜と、点集合Ｂ内の要
素ｂ _j（１≦ｓ≦ｊ−１）と近接するｓ個の要素間の距
離関係｜ｂ_j−ｂ_j-s｜との差が許容誤差範囲Δｄ以内
(｜｜ａ_i−ａ_i-s｜−｜ｂ_j−ｂ_j-s｜｜≦Δｄ)で
ある点のみを選択し、対応付けることによって対応付け
る候補を絞り込むことができる。

【０１９５】図４４（Ａ），（Ｂ）に、点集合Ａ内の要
素ａ_iに対応する点集合Ｂ内の点ｂ _jを選択する場合に
幾何学的な関係による候補の絞り込みを適用した例を示
す。図４４（Ａ）に示す点集合Ａでは、その点集合Ａ内
の要素ａ_iと近接するｓ＝２個の点ａ_i-1, ａ_i-2との
間に成り立つ距離関係はそれぞれ｜ａ_i−ａ_i-1｜＝
２．０，｜ａ_i−ａ_i-2｜＝３．０である。

【０１９６】そして、図４４（Ｂ）に示す点集合Ｂの中
から要素ａ_iに対応する点を対応付ける際に、その点集
合Ｂ内の候補となる要素ｂ_p，ｂ_qと近接する２個の要
素ｂ _j-1，ｂ_j-2との間の距離関係｜ｂ_j−ｂ_j-s｜を
求め、図４４（Ａ）に示した距離関係｜ａ_i−ａ_i-1｜
＝２．０，｜ａ_i−ａ_i-2｜＝３．０との差が許容誤差
範囲Δｄ＝０．５以内になる点のみを選択し、候補の絞
り込みを行なう。

【０１９７】図４４（Ｂ）に示す例では、｜ｂ_q−ｂ
_j-1｜＝２．８，｜ｂ_q−ｂ_j-2｜＝５．５；｜ｂ_p−
ｂ_j-1｜＝２．２，｜ｂ_p−ｂ_j-2｜＝３．３であるた
め、幾何学的関係として、対応する点相互間の距離を比
較した結果、点ｂ_pのみが、前記許容誤差範囲Δｄ＝
０．５以内という条件を見たし、要素ａ_iに対応する点
ｂ _jの候補として絞り込まれる。

【０１９８】(B10) 閾値条件による候補の絞り込みまた、上述した核構造抽出処理（図３１，図４２等）の
処理において、適当な閾値を予め設定しておき、候補の
持つ属性値が閾値よりも大きい場合に、その候補を除外
することにより、点集合Ａ，Ｂの対応付けを効率良く行
なうことができる。

【０１９９】例えば、ｒｍｓｄ値の制限により候補の絞
り込みを行なう。つまり、点集合Ａの要素ａ_iに点集合
Ｂの要素ｂ_jを対応付けることによって、これまでに対
応付けられた全点間のｒｍｓｄ値が極端に悪くなる場合
には、点ｂ_jを対応付けの候補から除外することが望ま
しい。そこで、要素ａ_iに要素ｂ_jを対応付けた場合の
全点間のｒｍｓｄ値を算出し、ｒｍｓｄ値が所定の閾値
以下ならば点ｂ_jを対応付けの候補とする一方、ｒｍｓ
ｄ値が所定の閾値を超える場合には、点ｂ_jを対応付け
の候補から除外することによって、対応付ける点の候補
を効率良く絞り込んで生成することができる。

【０２００】（Ｃ）本実施例の装置を適用したシステム
の説明まず、図８０により、本実施例の共通構造抽出装置を実
現するための計算機システムの構成例を説明する。図８
０において、１００はＣＰＵ、１０１はＣＰＵ１００の
処理動作に際してワークエリア等として用いられるＲＡ
Ｍ、１０２は後述する共通構造抽出処理のために必要な
プログラムや各種データを格納するＲＯＭである。

【０２０１】１０３は後述するデータ入力部（キーボー
ド，マウス等）５１との間のインターフェイス処理を行
なうインターフェイス部、１０４は後述するディスプレ
イ６２（６２ａ〜６２ｃ）における表示状態を制御する
表示制御部、１０５は上述したＣＰＵ１００，ＲＡＭ１
０１，ＲＯＭ１０２，インターフェイス部１０３および
表示制御部１０４の相互間を接続するバスである。

【０２０２】また、バス１０５には、後述するデータベ
ース（ＤＢ）５２，５４，６３が接続されており、ＣＰ
Ｕ１００からバス１０５を介してデータベース５２，５
４，６３におけるデータの検索を行なえるようになって
いる。そして、ＣＰＵ１００は、ＲＯＭ１０２に格納さ
れたプログラム（ソフトウエア）を実行することによ
り、後述する類似構造検索部５３，共通構造抽出部５
５，核構造抽出部６４，類似性判定部６５，機能予測部
６７等としての機能を果たすものである。従って、図８
０に示すような計算機システムにより、本実施例の共通
構造抽出装置を実現することができる。

【０２０３】さて、図４５は、前述した本実施例による
共通構造抽出部および類似構造検索部を用いて構成され
るシステムの構成を示すブロック図である。以下の説明
では、共通構造を抽出すべき立体構造として、タンパク
質の立体構造を対象とする。ただし、基本的には、抽出
対象となる立体構造は、立体座標をもつ構造であれば特
に限定されない。例えば、リボ核酸（ＲＮＡ）等の立体
構造も、順序付けられた点集合と考えられるので、その
ような構造における共通部分抽出にも本手法をそのまま
適用することができるほか、一般の分子構造についても
本手法を適用することができる。

【０２０４】なお、実際の演算に際しては、タンパク質
を構成する各アミノ酸のα炭素（Ｃα）の座標をアミノ
酸の位置として使用し、アミノ酸残基番号（アミノ酸配
列番号）としてＰＤＢ（Protein Data Bank)に登録され
ているＣαの通し番号を使用する。このため、アミノ酸
配列番号は、本来のアミノ酸残基番号と異なる場合があ
る。

【０２０５】図４５に示すシステムは、実際には情報処
理装置を用いて構成され、図示しないＣＰＵ，メモリ
（データおよびプログラムを格納）のほか、入出力装置
（各種のデータを入力するためのキーボード，マウス等
や、立体構造の三次元表示，タンパク質のアミノ酸のア
ライメント表示，テキストデータ表示等を行なうための
ディスプレイ，プリンタ等），データベース５２，５４
を構成するファイル記憶装置等を有して構成されてい
る。そして、図４５により後述する本システムの各構成
部分の機能は、ＣＰＵと各構成部分がそなえる制御処理
（アルゴリズム）とにより実行することができる。

【０２０６】このシステム構成の各部分を組み合わせる
ことにより、次の項目〜の機能をそなえる各共通構
造抽出装置（各装置の詳細な構成および動作は後述す
る）を個別に構成することができる。同様に、これら
〜の複数の機能を組み合わせた装置を構成することが
できることも明らかである。立体構造表示を行なう共通構造抽出装置アラインメント表示を行なう共通構造抽出装置モデリング支援を行なう共通構造抽出装置立体構造検索を行なう共通構造抽出装置機能部位データベースの生成を行なう共通構造抽出装
置機能予測を行なう共通構造抽出装置図４５において、５０ａ〜５０ｅはそれぞれ用途に対応
して入力される各種の入力データで、具体的には、共通
構造抽出対象となる二つの物質（タンパク質）Ｐ，Ｔの
名称や、部分対応付け情報，部分構造情報，立体構造の
データなどである。

【０２０７】５１は入力データ５０ａ〜５０ｅを入力す
るためのデータ入力部で、これらの入力データ５０ａ〜
５０ｅを各構成部分へ供給するインタフェースとして機
能するもので、実際にはキーボード，マウス等により構
成される。５２は物質の立体構造のデータ（例えば、各
種のタンパク質を構成するアミノ酸基の三次元座標デー
タ等）を予め格納する立体構造データベース、５３は二
つの物質（タンパク質）の間の類似構造を検索する類似
構造検索部で、この類似構造検索部５３は、図３におい
て符号２を付して前述したものと同一機能を果たすもの
である。

【０２０８】５４は物質の機能とその機能に関連する立
体構造（機能部位）とを予め登録された機能部位データ
ベース、５５は図２，図５〜図３０において符号１Ａを
付して前述したものと同一機能を果たす共通構造抽出部
である。また、５６は共通構造抽出部５５により抽出し
た共通構造を表示すべくその表示データを出力する共通
構造出力部（立体構造表示装置用）、５７は物質の立体
構造（共通構造抽出部５５により抽出した共通構造）を
構成する要素の配列（アライメント）データを出力する
アライメント出力部（アライメント装置用）、５８は共
通構造抽出部５５により抽出した共通構造を三次元座標
情報として出力するモデル構造出力部（モデリング支援
装置用）である。

【０２０９】５９は類似構造検索部５３による検索結果
と共通構造抽出部５５による抽出結果とに基づいて類似
な構造の属性，ｒｍｓｄ値および最長共通部分の長さを
出力する類似構造出力部（立体構造検索装置用）、６０
は機能部位データベース作成部（機能部位データベース
生成装置用）であり、この機能部位データベース作成部
６０は、類似構造検索部５３による検索結果と共通構造
抽出部５５による抽出結果とに基づいて、物質の機能と
その機能に関連する立体構造（機能部位）とを機能部位
データベース６３に出力して登録するものである。

【０２１０】なお、機能部位データベース作成部６０に
よりデータを登録する機能部位データベース６３は、前
述した機能部位データベース５４と別個のものとして説
明しているが、これらの機能部位データベース５４，６
３は、同一のものとし、機能部位データベース作成部６
０により作成された機能部位データベース６３をそのま
ま機能部位データベース５４として使用できるように構
成してもよい。

【０２１１】６１は機能予測装置用の機能部位出力部で
あり、この機能部位出力部６１は、共通構造抽出部５５
による抽出結果に基づき、未知の機能を有する立体構造
について、その立体構造の有する機能とその機能に関連
する構造（機能部位）とを特定して出力するものであ
る。６２ａ〜６２ｃはいずれも本実施例の装置により抽
出された立体構造に関する情報を表示するためのディス
プレイ（表示部）である。

【０２１２】例えば、ディスプレイ６２ａは、共通構造
出力部５６，モデル構造出力部５８や類似構造出力部５
９からのデータを受けて、物質の立体構造，モデル構
造，類似構造等を三次元グラフィックとして表示するも
のである。また、ディスプレイ６２ｂは、アライメント
出力部５７からの配列データを受けて、物質の立体構
造，モデル構造，類似構造等を配列表示（アライメント
表示；立体構造を構成する各点に関する情報を、配列順
序に従って並置した状態で表示）するものである。

【０２１３】さらに、ディスプレイ６２ｃは、機能部位
出力部６１からのデータを受けて、タンパク質の機能部
位のテキスト表示を行なうものである。なお、これらの
ディスプレイ６２ａ〜６２ｃは、それぞれ別個のものと
として説明しているが、同一のものとして構成してもよ
い。以下に、図４５に示すシステム中の構成要素を組み
合わせて実現される各種装置（〜にて前述した装
置）の構成例について、図４６〜図６３を参照しながら
説明する。

【０２１４】(C1)立体構造表示を行なう共通構造抽出装
置（アライメント表示を行なう共通構造抽出装置，モデ
リング支援を行なう共通構造抽出装置）一般に、物質の構造と機能との関係を分析する際には、
各物質の構造を重ね合わせ、共通な構造や特異的な構造
を判別しながら分析作業を進めるため、各物質を簡単に
重ね合わせて共通構造を表示することが可能な装置が必
要である。

【０２１５】本実施例では、このような装置を図４６に
示すごとく構成することができる。この図４６は、立体
構造表示を行なう共通構造抽出装置として機能する構成
部分を抽出して示すブロック図である。この立体構造表
示を行なう装置の主要部の構成は、アライメント表示や
モデリング支援を行なう装置と同じであるので、図４６
には、アライメント表示を行なう共通構造抽出装置およ
びモデリング支援を行なう共通構造抽出装置も合わせて
図示されている。

【０２１６】以下に、立体構造表示を行なう装置として
動作する図４６に示す装置の主要部の機能や動作につい
て詳細に説明する。データ入力部５１には、入力データ
５０ａ〜５０ｃを入力するためのインタフェースがそな
えられ、このデータ入力部５１から、重ね合わせて共通
構造を抽出すべき物質Ｐ，Ｔの名称が入力データ５０
ａ，５０ｂとして入力されるとともに、重ね合わせを行
なう位置を指定する部分対応付け情報が入力データ５０
ｃとして入力され、これらの入力データ５０ａ〜５０ｃ
が共通構造抽出部５５へ送られる。

【０２１７】立体構造データベース５２には、物質の立
体構造に関する情報として、物質の名称や、物質を構成
する原子の種類（タンパク質であればアミノ酸の種類）
や、原子，アミノ酸の三次元座標等が格納されている。
そして、共通構造抽出部５５では、データ入力部５１か
ら入力された二つの物質Ｐ，Ｔの名称に対応する物質の
立体構造（三次元座標）を、立体構造データベース５２
から取り出し、部分対応付け情報に基づいてこれら二つ
の立体構造（点集合）を重ね合わせ、その中から最長
で、且つｒｍｓｄ値が最小となる共通構造を、図２，図
５〜図３０により説明した手順で抽出し、その抽出結果
を共通構造出力部５６に送る。その抽出処理では、タン
パク質を構成するアミノ酸の配列順序に基づいて、タン
パク質の立体構造を、順序付けられた点集合とみなし、
上述した処理により共通構造を抽出する。

【０２１８】共通構造出力部５６は、共通構造抽出部５
５により抽出した結果に基づいて、共通構造を３次元グ
ラフィックで表示すべく、表示データを作成し、ディス
プレイ６２ａ上に表示させる。このとき、ディスプレイ
６２ａ上では、二つの点集合によりそれぞれ形成される
二つの立体構造が重ね合わされて表示される。また、デ
ィスプレイ６２ａ上で、これらの立体構造を回転させな
がら見ることによって、どの部分がどのように重なって
いるか、また立体構造中のどの部分が共通構造を形成し
ているかを視覚的に判別することができる。

【０２１９】ところで、図４６に示す構成の装置を、ア
ライメント表示を行なう共通構造抽出装置として用いる
場合、共通構造出力部５６の代わりに、点線で示すアラ
イメント出力部５７を設ける。このアライメント出力部
５７は、共通構造抽出部５５により抽出した共通構造に
対応するアミノ酸に関する情報を、配列順序に従って並
置した形式でディスプレイ６２ｂに出力するもので、デ
ィスプレイ６２ｂ上でその配列表示が行なわれる。

【０２２０】また、図４６に示す構成の装置を、モデリ
ング支援を行なう共通構造抽出装置として用いる場合、
共通構造出力部５６やアライメント出力部５７の代わり
に、点線で示すモデル構造出力部５８を設ける。このモ
デル構造出力部５８は、共通構造抽出部５５により抽出
した共通構造を三次元座標情報としてディスプレイ６２
ａ，６２ｂへ出力し、ディスプレイ６２ａ，６２ｂ上で
その三次元座標情報が表示され、タンパク質の三次元モ
デルの作成を共通構造の抽出により支援することができ
る。

【０２２１】なお、上述した例では、配列表示や三次元
座標情報をディスプレイ６２ａ，６２ｂ上に表示する場
合について説明しているが、これらのデータを、プリン
タ等により印字して表示出力するようにしてもよい。次
に、上述した立体構造表示（アライメント表示，モデリ
ング支援）を行なう装置により共通構造の抽出を行なっ
た具体例について、図４７〜図５８を参照しながら説明
する。

【０２２２】図４７はタンパク質の一つであるトリプシ
ン（ＰＤＢでのファイル名は４ＰＴＰの立体構造を示
し、図４８はアルファ・リティック・プロテアーゼ（al
pha-lytic protease：ＰＤＢでのファイル名は２ＡＬ
Ｐ) の立体構造を示す。これらのトリプシンとアルファ
・リティック・プロテアーゼとは、ポリペプチド鎖を分
解するという共通の機能を有するタンパク質であるが、
アミノ酸配列の相同性（ホモロジー）が低く、また全体
構造も異なるものである。これまでの研究成果から、活
性中心は、ヒスチジン（Ｈ），アスパラギン酸（Ｄ）お
よびセリン（Ｓ）から形成されることが知られている
（これらの構造は触媒トライアードと呼ばれている）。

【０２２３】そこで、トリプシンとアルファ・リティッ
ク・プロテアーゼとの活性中心の構造を比較するため、
図４６に示す本実施例の装置を用いて、トリプシンのヒ
スチジンの周辺構造を中心にしてこれらのタンパク質の
共通構造を表示させることにする。まず、トリプシンの
ヒスチジン活性部位に類似する構造をアルファ・リティ
ック・プロテアーゼから検索し、検索された類似構造を
部分対応付け情報として用い共通構造を共通構造抽出部
５５により抽出する。この抽出処理に際して使用する部
分対応付け情報を図５０に示す。

【０２２４】この図５０や、後述するアライメント表示
状態を示す図において、“＜target＞”に対応する位置
には、検索対象のタンパク質の構造のアミノ酸配列が表
示され、例えばＫ，Ｇ，Ｆ，Ｖ…の各アルファベット一
文字でぞれぞれ種類の異なるアミノ酸が表現されてい
る。そして、“(serial)”に対応する位置には、各アミ
ノ酸に付与されアミノ酸配列番号（図５０に示す例で
は、29,30 …，37) が表示される。また、“＜target
＞”の場合と同様に、“＜probe ＞”に対応する位置に
は、検索キーとなるタンパク質の構造のアミノ酸配列が
表示されるとともに、“(serial)”に対応する位置に、
各アミノ酸の配列番号が表示される。

【０２２５】図５０に示すような部分対応付け情報に基
づいて、トリプシンの立体構造とアルファ・リティック
・プロテアーゼの立体構造とを重ね合わせ、共通構造抽
出部５５により抽出された共通構造をアミノ酸配列を並
置した形式（アライメント形式）で表示した具体例を、
図５１，図５２に示す。これらの図５１，図５２におい
て、各アミノ酸が表示位置の下方において、“(distanc
e)”に対応する位置に表示される数値は、アミノ酸（Ｃ
α）間の距離を表し、図中の下線部分は触媒トライアー
ドの部分を表している。

【０２２６】抽出された触媒トライアードの構造を図４
９に示す。この図４９において、Ｎ（窒素）端からＣ
（炭素）端への方向を矢印で示し、短い線はα炭素（Ｃ
α）と側鎖のβ炭素（Ｃβ）との位置を表している。ま
た、各タンパク質の全体構造における触媒トライアード
の位置が、図４７，図４８においては太線で表示されて
いる。

【０２２７】このようにヒスチジン（Ｈ）を中心に重ね
合わせた結果、他の触媒部位であるアスパラギン酸
（Ｄ），セリン（Ｓ）も共通構造として抽出されること
から、これらのタンパク質の配列の類似性は低いが、立
体構造的には同じ構造の触媒トライアードを有し、ポリ
ペプチド鎖を分解するメカニズムも類似していることが
予測される。実際に、その予測結果は生化学的な実験結
果と一致することが分かった。

【０２２８】これにより、アミノ酸配列の相同性も低
く、かつ全体構造も異なる場合でも、タンパク質の機能
に関する構造は保存されていることが分かる。また、活
性中心の一部分の構造が分かれば、その他の活性中心を
形成する構造も本装置により判別することができる。一
方、モデル構造出力部５８をそなえて構成される、モデ
リング支援を行なう共通構造抽出装置は、立体構造が未
知のタンパク質（対象タンパク質）の立体構造を予測す
る装置として使用される。立体構造を予測するために現
在採用されている手法は、ホモロジー（相同性）モデリ
ングと呼ばれ、対象タンパク質のアミノ酸配列と相同性
が高く、かつ立体構造が既知のタンパク質（参照タンパ
ク質）を探し出し、参照タンパク質間で共通に保存され
ている構造を核構造とし、残りの構造をエネルギー計算
やコンホメーションの類似性から予測してモデリングを
行なう。参照タンパク質のアミノ酸配列との相同性は経
験的には５０％以上とされている。

【０２２９】このようなモデリングシステムにおいて、
重要となるのが核構造の決定方法であるが、核構造は、
図３により上述した共通構造抽出の技術を使用するか、
図３および図３１〜図４４により上述した核構造抽出の
技術を使用して決定することができる。モデリングの具
体例を以下に説明する。図４７に示したトリプシンと、
このトリプシンとアミノ酸配列の類似性が高い図５３に
示すような立体構造を持つタンパク質エラスターゼ（Ｐ
ＤＢでのファイル名は３ＥＳＴ）とから共通構造を抽出
した例を、図５４〜図５８に示す。図５４はエラスター
ゼの立体構造を示し、図５５はトリプシンとエラスター
ゼとの共通構造を示し、図５６〜図５８はトリプシンと
エラスターゼとの全体構造上の共通構造の位置をアライ
メント形式で表示した例を示す。

【０２３０】なお、図５６〜図５８に示す表示例では、
ユーザが構造の対応付け情報を与えて、その情報に基づ
いて算出した結果が示されており、この手法（マニュア
ル方式）によれば、ユーザの望んだ通りに、二つの立体
構造を重ね合わせることができる。また、後述する図６
７〜図６９に示す表示例も、トリプシンとエラスターザ
との全体構造上の共通構造の位置をアライメント形式で
表示したものであるが、この表示例では、核構造抽出の
技術を使用して共通構造を抽出した結果が示されてい
る。

【０２３１】この図５６〜図５８に示す例では、前述し
た類似構造検索の技術によりトリプシンとタンパク質エ
ラスターゼとの活性中心であるヒスチジン活性部位に類
似する構造をエラスターゼから検索し、その検索結果を
部分対応付け情報として指定し、共通構造を抽出してい
る。また、ここに示す例では、対応付ける点どうしの距
離（distance）の閾値ERROR を１．５オングストローム
とした時、ｒｍｓｄ値が０．７８オングストロームで１
７１残基から構成される核構造を抽出することができ
（図５８の最下部の表示参照）、双方の活性中心が一致
するという結果が得られた。

【０２３２】図５４〜図５８には、便宜上、アライメン
ト形式および３次元グラフィックで共通構造を表示した
例が示されているが、実際のモデリング支援を行なう装
置では、構築したモデルに対して最終的にエネルギー計
算による構造の精緻化が行なわれるため、抽出された共
通構造は、モデル構造出力部５８により三次元座標で出
力される。

【０２３３】(C2)立体構造検索を行なう共通構造抽出装
置（機能部位データベース生成を行なう共通構造抽出装
置）さて、一般に、新薬の開発のように新しい機能を持つ物
質を開発したり、既に存在する物質の機能の強化をはか
るためには、物質の機能とその物質の構造との相関関係
を解明することが必要不可欠である。このような作業を
進めるに当たっては、類似な立体構造を持つ物質を多数
参照する必要が生じる。

【０２３４】そのため、立体構造データベース５２から
立体構造の類似した物質を簡単に取り出すことの可能
な、立体構造検索を行なう装置が必要になる。また、こ
のような装置により、機能に関連する立体構造を収集し
て機能部位データベース６３を作成することができる。
本実施例では、このような装置を図５９に示すごとく構
成することができる。この図５９は、立体構造検索を行
なう共通構造抽出装置として機能する構成部分を抽出し
て示すブロック図である。この立体構造検索を行なう装
置の主要部の構成は、機能部位データベース生成を行な
う装置と同じであるので、図５９には、機能部位データ
ベース生成を行なう共通構造抽出装置も合わせて図示さ
れている。

【０２３５】以下に、立体構造検索を行なう装置として
動作する図５９に示す装置の主要部の機能や動作につい
て詳細に説明する。データ入力部５１には、入力データ
５０ａ，５０ｂを入力するためのインタフェースがそな
えられ、このデータ入力部５１から、立体構造検索の対
象となる物質Ｐの名称が入力データ５０ａとして入力さ
れるとともに、物質Ｐ中でプローブ（検索キー）として
使用する構造の位置を表す部分構造情報が入力データ５
０ｄとして入力され、これらの入力データ５０ａ，５０
ｄが共通構造抽出部５５へ送られる。

【０２３６】また、立体構造データベース５２には、図
４７により前述した立体構造表示を行なう共通構造抽出
装置にそなえられるものと同様の情報が格納されてい
る。類似構造検索部５３では、プローブとして指定され
た物質（タンパク質）の部分構造情報に類似する構造を
持つ物質を立体構造データベース５２から検索し、その
検索の結果得られた、類似構造を持つタンパク質が、共
通構造抽出部５５に送られる。このとき、類似性の尺度
としてはｒｍｓｄ値を使用する。

【０２３７】共通構造抽出部５５は、類似構造検索部５
３の検索結果である物質の立体構造とプローブの物質の
立体構造とを入力され、部分構造情報を部分対応付け情
報として使用し、各物質の立体構造（三次元座標）から
最長共通部分の長さを算出し、その算出結果を類似構造
出力部５９に送る。共通構造抽出部５５での抽出処理に
際しては、タンパク質を構成するアミノ酸の配列順序に
基づいてタンパク質の立体構造を順序付けられた点集合
とみなし、上述した処理により共通構造の最長の長さを
算出する。

【０２３８】そして、類似構造出力部５９により、類似
構造検索部５３による検索結果と共通構造抽出部５５に
よる抽出結果とに基づいて、類似する構造のアミノ酸残
基番号，アミノ酸の種類，ｒｍｓｄ値および最長共通部
分の長さが出力される。ところで、図５９に示す立体構
造検索を行なう共通構造抽出装置を、機能部位データベ
ース生成装置として構成するには、類似構造出力部５９
の代わりに、点線で示す機能部位データベース作成部６
０を設ける。この機能部位データベース作成部６０は、
前述した通り、類似構造検索部５３による検索結果と共
通構造抽出部５５による抽出結果とに基づいて、物質の
機能とその機能に関連する立体構造（機能部位）とを機
能部位データベース６３に対し出力して登録するもので
ある。

【０２３９】このような立体構造検索を行なう共通構造
抽出装置による検索の具体例を以下に説明する。上述し
た立体構造表示を行なう装置の場合と同様、トリプシン
のヒスチジン活性部位（図４７）をプローブとしてこれ
と類似な構造をアルファ・リティックプロテアーゼ（図
４８）から検索した結果を図６０に示す。

【０２４０】この図６０から分かるように、この場合、
ｒｍｓｄ値が１．５オングストローム以下の構造が
（１）〜（４）の４件検索され、そのうちの２件
（１），（２）は各々ｒｍｓｄ値が０．７６９，０．４
８３であり、プローブとした構造に極めて類似する構造
であった。本実施例では、各検索結果として、最長共通
部分の長さＬＣＳ（図６０中では“lcs ”として表記）
も合わせて出力されており、この最長共通部分の長さＬ
ＣＳを参照することにより、立体構造全体の一致状態を
判断することができる。

【０２４１】図６０に示す例について最長共通部分の長
さＬＣＳを参照すると、ｒｍｓｄ値＝０．７６９の構造
（１）はlcs ＝１０で、プローブの構造の長さ（アミノ
酸の個数）が９であることから、一部分しか一致してい
ないのに対して、ｒｍｓｄ値＝０．４８３の構造（２）
はlcs ＝７２で、全体的にもかなり一致する構造である
ことが分かる。

【０２４２】また、検索された構造のアミノ酸配列を比
較すると、トリプシンの活性中心であるヒスチジン
（Ｈ）に対応するアミノ酸の種類がヒスチジンである構
造は、ｒｍｓｄ値＝０．４８３の構造（２）のみである
ことからも、この構造（２）が有意な類似構造であるこ
とが分かる。このように立体構造検索を行なう共通構造
抽出装置を使用すれば、プローブとなる物質の立体構造
を指定して物質の立体構造を格納した立体構造データベ
ース５２から類似構造を検索できるとともに、最長共通
部分の長さＬＣＳを参照することにより、プローブとし
たタンパク質と検索されたタンパク質との間で検索され
た構造以外の部分における類似性も判別できる。このた
め、局所的にのみ類似しているものか、または全体的に
も類似しているものかを簡単に判別でき、偶然に一致し
た構造を排除することができ、作業を効率化することが
できる。

【０２４３】(C3)機能予測を行なう共通構造抽出装置一般に、タンパク質が、ある機能を発現する場合、その
タンパク質は、その機能に特異的な立体構造を持ってい
ると考えられている。従って、機能とその機能に関連す
る特異的な立体構造との関係を保持するデータベースと
して機能部位データベース５４，６３を作成しておき、
Ｘ線結晶解析やＮＭＲ等の手法で新規物質の立体構造が
決定された際に、その立体構造と機能部位データベース
５４，６３に登録されている構造とを照合することによ
って、新規物質がどのような機能を持っており、その機
能は立体構造中のどの部分（これを機能部位と呼ぶ）に
位置するかを予測することができる。

【０２４４】図６１は、このような機能予測を行なう共
通構造として機能する構成部分を抽出して示すブロック
図である。以下に、機能予測を行なう装置として動作す
る図６１に示す装置の主要部の機能や動作について詳細
に説明する。データ入力部５１には、入力データ５０ｅ
を入力するためのインタフェースがそなえられ、このデ
ータ入力部５１から、新規物質の立体構造のデータが入
力データ５０ｅとして入力され、この入力データ５０ｅ
が類似構造検索部５３へ送られる。

【０２４５】機能部位データベース５４には、物質の機
能と、その機能に特異的な立体構造（機能部位）に関す
る情報とが予め格納されており、より具体的には、機能
の名称，その機能に特異的な立体構造を構成する原子の
三次元座標等が格納されている。そして、類似構造検索
部５３は、機能部位データベース５４に登録されている
各機能部位に類似する構造を新規物質の立体構造から検
索し、その検索結果を共通構造抽出部５５に送る。この
とき、類似性の尺度としてはｒｍｓｄ値を使用する。

【０２４６】また、共通構造抽出部５５では、プローブ
として使用した機能部位の構造と類似構造検索部５３で
検索された構造とを部分対応付け情報として用い、各物
質の立体構造（三次元座標）に基づいて、最長な共通構
造の長さを算出し、その算出結果を類似構造出力部５９
に送る。この共通構造抽出部５５による抽出処理は、タ
ンパク質を構成するアミノ酸の配列順序に基づいてタン
パク質の立体構造を順序付けられた点集合とみなし、図
２，図５〜図３０により説明した手順で行なわれる。

【０２４７】さらに、機能部位出力部６１により、共通
構造抽出部５５からの抽出結果に基づいて、機能部位デ
ータベース５４に登録されている機能名と、その機能名
に対応する機能部位のアミノ酸配列名およびアミノ酸残
基番号とが出力されるとともに、類似性の尺度としてｒ
ｍｓｄ値が出力され、これらの情報がディスプレイ６２
ｃ上に表示される。

【０２４８】このような機能予測を行なう共通構造抽出
装置による予測動作の具体例を以下に説明する。タンパ
ク質のラスプロテイン（ras protein : ＰＤＢでのファ
イル名は５Ｐ２１）のＧＴＰ（グアノシン３リン酸）の
リン酸結合部位（アミノ酸残基番号１０〜１７）とＭｇ
²⁺結合部位（アミノ酸残基番号５６〜５８）とに類似す
る構造を、タンパク質アデニル酸キナーゼ（adenylate
kinase：ＰＤＢでのファイル名は３ＡＤＫ）から検索し
た結果、アデニル酸キナーゼのアミノ酸残基番号１５〜
２２および９２〜９４が、上記２つの機能部位にそれぞ
れ類似する構造であることが分かった。

【０２４９】これらの結果に基づいて、ラスプロテイン
とアデニル酸キナーゼとから共通構造を抽出した結果を
図６２，図６３に示す。これらの図６２，図６３により
明らかなように、機能部位データベース５４に登録され
ている機能部位に類似する構造を持ち、且つ、全体とし
て６７残基にわたって共通な構造が存在することが分か
る。従って、これらのタンパク質間の類似性は偶然とは
考えにくく、むしろ同じ機構で基質を結合することが示
唆される。

【０２５０】なお、図６２の上部には、部分対応付け情
報として用いられる、前述した２つの機能部位の構造
と、対応する点間の距離および部分対応付け情報につい
てのｒｍｓｄ値（０．６００）とが示されている。ま
た、図６２の部分対応付け情報の表示部分の下方から図
６３には、ラスプロテインとアデニル酸キナーゼとの共
通構造の抽出結果が表示されている。図６３の下方に
は、類似構造となる残基の数６７と、この共通構造全体
についてのｒｍｓｄ値１．６５９とが表示されている。

【０２５１】一方、これまでの実験結果からアデニル酸
キナーゼはＡＴＰ（アデノシン３リン酸）と結合し、且
つ、その結合の際にはＭｇ²⁺が介在することが知られて
いる。既にリン酸結合部位は同定されており、本実施例
の機能予測による上記の予測結果と一致する。ただし、
Ｍｇ²⁺の結合部位は同定されておらず、現在実験が進め
られているが、例えば、遺伝子組み替え操作によって上
述したアスパラギン酸を他のアミノ酸に置換した変異体
を作成し、Ｍｇ²⁺介在下でのＡＴＰ結合能（活性）を測
定することによって、上述の予測結果の実証が可能であ
る。

【０２５２】このように、本実施例の機能予測を行なう
装置を使用すれば、既知の立体構造および実験によって
同定された機能部位との類似性に基づいて、新規に決定
された構造の機能およびその機能部位を予測することが
できる。このため、従来試行錯誤しながら進められてき
たタンパク質の機能の解明や、改良の作業に対して、そ
の機能を予め予測し、その予測結果を実験によって証明
するという研究開発サイクルを確立でき、作業の効率化
をはかることができる。

【０２５３】(C4)核構造抽出を用いた共通構造抽出装置上述した項目(C1)〜(C3)の各装置は、二つの立体構造間
で予め既知の部分対応付け情報を用い、その他の部分に
おける共通構造を抽出する装置（図４６に示す立体構造
表示を行なう共通構造抽出装置）や、二つの立体構造の
類似構造を類似構造検索部５３により検索し、得られた
類似構造を部分対応付け情報として用い、その他の部分
における共通構造を抽出する装置（図５９に示す立体構
造検索を行なう共通構造抽出装置，図６１に示す機能予
測を行なう共通構造抽出装置）である。

【０２５４】これらの装置のうち図５９および図６１に
示す装置における類似構造検索部５３は、二つの立体構
造の重ね合わせの中心となる核構造が分からない場合に
は、検索された類似構造（類似の程度に対応して複数存
在する）を部分対応付け情報として用い、共通構造抽出
部５６により試行錯誤的に共通構造を抽出することにな
るが、重ね合わせの中心となる核構造を抽出する技術を
使用することにより、共通機能および共通構造が分から
ない二つの立体構造について共通構造抽出，類似構造検
索および機能予測を効率よく行なえる装置を構成するこ
とができる。なお、核構造抽出の詳細な手順等について
は、図４および図３１〜図４４により前述した通りであ
る。

【０２５５】この核構造抽出を用いた共通構造抽出装置
について、以下、図６４〜図７６を参照しながら説明す
る。図６４は本実施例における核構造抽出を用いた共通
構造抽出装置の構成を示すブロック図である。この図６
４に示す共通構造抽出装置において、立体構造データベ
ース５２，データ入力部５１，共通構造抽出部５５，共
通構造出力部５６およびディスプレイ６２（グラフィッ
ク表示および配列表示の両方または、何れか一方を表示
する表示部）は、図４５に示すシステム（図４６，図５
９，図６１に示す装置を含むシステム）にそなえられる
ものと同様構成である。

【０２５６】図６４に示す共通構造抽出装置と図４５に
示すシステムとで異なる点は、図４および図３１〜図４
４により上述した核構造抽出処理を実行する核構造抽出
部６４がそなえられた点のみである。以下、立体構造の
物質が、三次元座標の点集合により構成されるタンパク
質である場合を例として説明する。このように核構造抽
出部５４をそなえた装置の動作を説明すると、まず、ユ
ーザが、入力データ５０ｆとして共通構造抽出の対象と
なる物質Ａ，物質Ｂの名称を入力コマンドに基づいて入
力する。データ入力部５１は、入力コマンドに基づい
て、立体構造データベース５２に登録されている各物質
Ａ，Ｂの立体構造データを読み込んで、核構造抽出部６
４に送る。

【０２５７】核構造抽出部６４は、前述した通り、一方
の立体構造をセグメント化し、タンパク質を構成するア
ミノ酸配列順序に基づいて、他方の立体構造と空間的に
対応付けて、二つの立体構造を適切に重ね合わせるため
の中心となる核構造を抽出し、その抽出結果（核構造）
を共通構造抽出部５５へ送る。共通構造抽出部５５は、
核構造抽出部６４により抽出された核構造に基づいて、
二つの立体構造を重ね合わせることにより二つの構造に
存在する共通構造を抽出する。

【０２５８】そして、核構造抽出部６４からの核構造に
基づいて抽出され共通構造は、共通構造出力部５６によ
り、セグメント化したタンパク質のアミノ酸名およびア
ミノ酸配列番号に対して、他方のタンパク質の共通部分
のアミノ酸名およびアミノ酸配列番号をアライメント形
式で出力され、ディスプレイ６２上で表示される。な
お、同時に、抽出され共通構造の類似性の尺度としてｒ
ｍｓｄ値もディスプレイ６２上に表示される。

【０２５９】図６４に示す核構造抽出を用いた共通構造
抽出装置による抽出動作の例を、図６５，図６６により
説明する。図６５はタンパク質のトリプシンのアミノ酸
配列を示し、図６６はエラスターゼのアミノ酸配列であ
り、それぞれの立体構造の表示は図４７，図５３に示さ
れている。なお、図６５，図６６に示すアミノ酸残基番
号（図中、左側に表示される“Serial No.”１，２１，
４１，６１…）は、ＰＤＢに記載されているアミノ酸に
対して単純に１から番号を割りふったものなので、本来
のアミノ酸配列番号とは異なっており、この点は以降の
例についても同様である。また、図６５，図６６の下側
に表示された“Missing residues”よりも下方には、ア
ミノ酸が存在することが分かっているが、その立体構造
上の座標位置がＸ線解析等により分からないアミノ酸残
基番号が表示されている。

【０２６０】図６５，図６６に示すタンパク質はセリン
プロテアーゼと呼ばれるタンパク質分解酵素の仲間で、
活性部位にヒスチジン，セリン，アスパラギン酸が必要
不可欠な要素である。これらの酵素の基質特異性は全く
ことなるが、構造および触媒等の点で類似していること
から進化的に一群の酵素であると考えられている。これ
らのトリプシンとエラスターゼとについて、核構造抽出
部６４により核構造を抽出して、これを部分対応付け情
報として用い共通構造抽出部５５により共通構造を抽出
した結果を、図６７〜図６９に示し、図７０に、抽出さ
れた共通構造のグラフィック表示状態を示す。

【０２６１】なお、この図６７〜図６９に示す例は、前
述した図５６〜図５８に示す例とは処理方法が異なり、
計算機により核構造抽出が行なわれ、重ね合わせに使用
する対応付け情報が異なるため、抽出結果も異なってい
る。また、図７０では、二つのタンパク質の立体構造を
重ね合わせて、共通部分を太線で表わしている。図６７
〜図６９を参照すると、トリプシンの持つ３つの活性中
心である４０残基目のヒスチジン，８４残基目のアスパ
ラギン酸，１７７残基目のセリンに対して、それぞれ、
エラスターゼの４５残基目のヒスチジン，９３残基目の
アスパラギン酸，１８８残基目のセリンが対応付けられ
たことが分かる。これらの結果は、生化学的な実験で得
られた結果と合致している。

【０２６２】このように、核構造抽出を用いた共通構造
抽出装置によって共通構造抽出の対象となる二つの立体
構造を指定することにより、自動的に核構造を抽出する
ことができるため、共通構造を抽出する際に、重ね合わ
せのための中心となる活性中心などの構造が分からない
タンパク質からも共通構造を抽出することが可能とな
る。

【０２６３】図６４に示した構成は、立体構造データベ
ース５２に格納された二つの立体構造から共通構造を取
り出した結果を、グラフィック表示することにより立体
構造表示装置として使用することができる。また、図４
５に示す構成は、モデリング支援を行なう共通構造抽出
装置として使用することができる。モデリングの代表的
手法である相同性モデリングでは、タンパク質のファミ
リー要素間の構造と配列の類似性に基づいて、構造が未
知のタンパク質の立体構造を予測することができる。こ
の手法では、目的とするタンパク質の構造を構築するた
めに少なくとも、一つの構造が既知の参照タンパク質が
必要である。しかし、単一の参照タンパク質を用いた場
合、制度の高いモデリングを行なうことができず、既知
の立体構造の類似性を有効に利用することが必要になっ
てきた。

【０２６４】このモデリング支援を行なう装置では、複
数の参照タンパク質の間で構造的に保存されている共通
構造を抽出することにより、制度の高いモデリングを行
なうことができる。さらに、上記図４５の構成は立体構
造のアライメント表示を行なう共通構造抽出装置として
使用することができる。新しく解析されたタンパク質の
機能や構造を調べるには、既知のタンパク質との比較が
必要となる。立体構造のアライメント表示を行なう装置
では、二つの立体構造に共通な構造を抽出し、抽出され
た部分をアライメントとして表示する。

【０２６５】図７１は本実施例における核構造抽出を用
いた類似構造検索を行なう共通構造抽出装置の構成を示
すブロック図である。この図７１において、立体構造デ
ータベース５２，データ入力部５１，核構造抽出部６
４，共通構造抽出部５５，およびディスプレイ６２は、
図６４に示す装置にそなえられるものと同様構成であ
る。

【０２６６】ただし、図７１に示す装置には、類似性判
定部６５および判定結果出力部６６が新たにそなえられ
ている。ここで、類似性判定部６５は、共通構造抽出部
５５で共通構造として抽出された構造を構成する残基数
と二つの立体構造を構成する残基数の平均との比が、設
定された値以上かどうかによって二つの立体構造（共通
部分）の類似性を判定するものである。

【０２６７】また、判定結果出力部６６は、類似性判定
部６５により二つの立体構造（共通部分）の類似性が高
いと判定された場合、抽出された共通構造を、一方のタ
ンパク質のアミノ酸名およびアミノ酸配列番号に対し
て、他方のタンパク質の共通部分のアミノ酸名およびア
ミノ酸配列番号を並置する形式で出力し、ディスプレイ
６２上で表示させるものである。なお、同時に、抽出さ
れた共通構造の類似性の尺度としてｒｍｓｄ値もディス
プレイ６２上に表示されるようになっている。

【０２６８】図７１にて上述した装置の動作を説明する
と、まず、ユーザが、入力データ５０ｇとして、類似構
造検索の対象となる物質Ａを入力コマンドにより入力す
る。データ入力部５１は、入力された物質Ａの立体構造
およびデータベース５２に登録されている立体構造のデ
ータを一つずつ読み込み、それぞれについて核構造抽出
部６４に送る。

【０２６９】核構造抽出部６４は、一方の立体構造をセ
グメント化し、タンパク質を構成するアミノ酸配列順序
に基づいて他方の立体構造と空間的に対応付けてゆくこ
とにより、二つの立体構造を重ね合わせるための中心と
なる核構造を抽出する。共通構造抽出部５５は、抽出さ
れた核構造に基づいて二つの立体構造を重ね合わせるこ
とにより、二つの立体構造に共通に存在する立体構造を
抽出する。

【０２７０】そして、抽出された共通構造の類似性を、
類似構造判定部６５により判定し、二つの立体構造（共
通部分）の類似性が高いと判定された場合、抽出された
共通構造が、判定結果出力部６６からディスプレイ６２
へ出力されて、このディスプレイ６２上で表示される。
図７２は本実施例における核構造抽出による機能予測を
行なう共通構造抽出装置の構成を示すブロック図であ
る。

【０２７１】この図７２において、立体構造データベー
ス５２，データ入力部５１，機能部位データベース５４
は図４５に示す同一符号を付して説明した部分と同一の
ものである。図７２に示す装置では、機能予測部６７お
よび予測結果出力部６８が新たにそなえられている。な
お、図７２に示す装置では、前述した共通構造抽出部５
５および核構造抽出部６４としての機能が、機能予測部
６７に含まれているものとする。

【０２７２】ここで、機能予測部６７は、既知の機能を
有する立体構造と未知の機能を有する立体構造とについ
て、核構造抽出部６４としての機能により核構造を抽出
し、その核構造を部分対応付け情報として用いながら共
通構部分出部５５としての機能により共通構造を抽出
し、その共通構造に基づき機能部位データベース５４の
情報を参照して、所定機能を果たす機能部位が、未知の
機能を有する立体構造に含まれているか否かを判断し、
その立体構造の機能予測を行なうものである。

【０２７３】また、予測結果出力部６８は、機能予測部
６７により予測された結果を、予測機能に対応する機能
部位についてのアミノ酸名およびアミノ酸配列番号とし
て出力し、これらの情報をディスプレイ６２上に表示さ
せるものである。この図７２に示す機能予測を行なう共
通構造抽出装置は、図６１により上述したように、機能
が解明されているタンパク質と未知のタンパク質との共
通構造を抽出して、未知のタンパク質の機能や立体構造
中の機能部位を予測するものであり、データ入力部５１
に機能が未知である物質Ａを指定する入力データ５０ｈ
が入力コマンドにより入力されると、機能予測部６７が
動作を開始するようになっている。

【０２７４】この機能予測部６７の動作を、図７３に示
すフローチャート（ステップＳ１２１〜Ｓ１２７）に従
って説明する。ここで、図７３において、タンパク質Ｐ
Ａの機能は未知であり、タンパク質ＰＢ_iは、機能部位
データベース５４にｉ番目（１≦ｉ≦Ｎ）のデータとし
て登録された機能既知のものである。また、共通構造の
長さの基準をＬ、機能部位を格納する領域“site”とし
て示す。

【０２７５】図７３に示すように、まず、機能部位デー
タベース５４における機能既知のタンパク質ＰＢ_iを指
定する番号ｉに１を設定して初期化を行なってから（ス
テップＳ１２１）、立体構造データベース５２から機能
が既知のｉ番目のタンパク質ＰＢ_iを取り込むととも
に、このタンパク質ＰＢ_iの機能部位の範囲（ＳＴ）を
領域“site”に読み込むためのＩＤ（機能部位の名称、
即ち機能部位データベース５４におけるエントリ番号）
を機能部位データベース５４から読み込む（ステップＳ
１２２）。

【０２７６】次に、タンパク質ＰＡとタンパク質ＰＢｉ
との共通構造を抽出する（ステップＳ１２３）。この共
通構造の抽出処理に際しては、前述した通り、核構造抽
出処理（セグメント化により類似構造を検索する処理）
により求めた核構造が部分対応付け情報として用いら
れ、その核構造を中心とした重ね合わせを行なう。そし
て、共通構造抽出処理により求められた共通構造の長さ
が一定の長さＬ（セグメントの長さ）よりも長く、且
つ、共通構造の中に機能部位が含まれているか否か判断
し（ステップＳ１２４）、このような条件を満たす場合
には、タンパク質ＰＢｉのＩＤおよび求められた共通構
造を出力し（ステップＳ１２５）、番号ｉに１を加算し
て（ステップＳ１２６）、機能部位データベース５４に
登録されている次のタンパク質ＰＢ_iについて同様の処
理を行なう。

【０２７７】このステップＳ１２２〜Ｓ１２６による処
理は、ステップＳ１２７にてｉ＞Ｎと判定されるまで、
つまり機能部位データベース５４に登録されている全て
のタンパク質と、タンパク質ＰＡとの共通構造抽出処理
を終了するまで繰り返し行なわれる。なお、機能データ
ベース５４に登録されるタンパク質ＰＢ_iのデータは、
例えば図７４に示すようなものである。図７４では、例
えば、“ID”の項目に機能部位の名称が登録され、“S
T”の項目にこのタンパク質ＰＢ_iの機能部位の範囲が
アミノ酸残基番号により登録されている。

【０２７８】以下に、核構造抽出による機能予測を行な
う共通構造抽出装置の具体的な動作例について、図７５
〜図７８を参照しながら説明する。図７５（Ａ）はλフ
ァージＣｒｏタンパク質のアミノ酸配列を示し、図７５
（Ｂ）はλファージＣｒｏタンパク質の立体構造を示し
ている。また、図７６（Ａ）はλファージリプレッサー
のアミノ酸配列を示し、図７６（Ｂ）はλファージリプ
レッサーの立体構造を示している。

【０２７９】λファージＣｒｏタンパク質にはＤＮＡが
結合し、その結合部位はアミノ酸残基番号１６〜３５で
あることが知られている。λファージＣｒｏタンパク質
とλファージリプレッサーとから共通構造を抽出した結
果をアライメント形式で表示した例を図７７に示し、そ
のグラフィック表示例を図７８に示す。図７７に示すよ
うに、λファージＣｒｏタンパク質のアミノ酸残基番号
１６〜３５に対して、１残基だけ対応付けられていない
アミノ酸が存在してはいるが、λファージリプレッサの
アミノ酸残基番号２８〜４７のアミノ酸が対応付けられ
たことが分かる。また、λファージリプレッサーもＤＮ
Ａと結合することが知られており、上述した結果は、生
化学的な実験で得られた結果と合致するものである。

【０２８０】このように、図７２に示す装置を用いて、
機能が既知の物質の立体構造と未知の機能をもつの物質
の立体構造との共通構造を抽出することにより、新規物
質の持つ機能を予測することができる。（Ｄ）本実施例の効果の説明このように、本実施例の共通構造抽出装置によれば、部
分対応付けができる複数の立体構造を重ね合わせて、他
に存在する共通構造を正確に且つ迅速に抽出することが
でき、グラフィックシステムによる共通構造の表示，立
体構造データベース５２からの類似な立体構造の検索，
構造の類似性に基づく機能予測等を行なうことが可能に
なる。

【０２８１】従って、タンパク質等の物質の機能の解明
や機能強化のための改良に当たり、従来研究者が試行錯
誤しながら進めてきた作業が、構造に基づく機能を予測
しその予測結果を実験によって実証するという研究開発
サイクルとして確立・実行されるので、その作業を大幅
に効率化することができる。また、核構造抽出の技術に
より、二つの立体構造に対して重ね合わせの中心となる
核構造を自動的に抽出し、得られた核構造に基づいて共
通構造を抽出することで、上記と同様にタンパク質等の
物質の立体構造と機能の解明や予測等の作業の効率化に
大きく寄与する。

【０２８２】さらに、本実施例では、コスト関数の導入
により、タンパク質等の物質の共通構造の抽出処理時に
無駄な検索処理を行なうのを防止でき、共通構造の抽出
処理を極めて効率よく実行でき、さらには広範囲に亘っ
て共通構造を抽出でき抽出精度の向上にも大きく寄与す
る。以下に、本実施例で、コスト関数の導入による最適
化探索手法を採用したことによる効果を、より詳細に説
明する。

【０２８３】共通構造の抽出処理に際しては、対応付け
る点間の距離の閾値“ERROR ”の大きさに比例して、一
つの点に対応付く点の数が増加し、その結果、最長共通
部分を形成する要素の組合せ数が指数関数的に増加す
る。そこで、本発明の共通構造抽出装置では、図１５〜
図３０にて説明した累積コストによる最適化探索手法を
導入することによって、探索処理の高速化をはかり、閾
値“ERROR ”の値に関係なく、最長共通部分を算出でき
るように改良されている。

【０２８４】下記の表１および表２に、種々の閾値“ER
ROR ”に対する、累積コストによる最適化探索手法を導
入した場合としない場合とでの計算時間と、算出された
共通構造の長さとを示す。表１には、トリプシン（４Ｐ
ＴＰ；図４７参照）とエラスターゼ（３ＥＳＴ；図５３
参照）との共通構造を抽出した際に、最適化探索を行な
った場合の処理実行時間と、最適化探索を行なわずに全
解探索を行なう場合の処理実行時間と、抽出される最長
共通部分の長さとが、種々の閾値“ERROR ”毎に示され
ている。この表１に示す例では、全体構造の類似性が高
い二つの立体構造間の共通構造を抽出している。

【０２８５】また、表２には、ラスプロテイン（５Ｐ２
１）とアデニル酸キナーゼ（３ＡＤＫ）との共通構造を
抽出した際に、最適化探索を行なった場合の処理実行時
間と、最適化探索を行なわずに全解探索を行なう場合の
処理実行時間と、抽出される最長共通部分の長さとが、
種々の閾値“ERROR ”毎に示されている。この表２に示
す例では、全体構造の類似性が低い二つの立体構造間の
共通構造を抽出している。

【０２８６】

【表１】

【０２８７】

【表２】

【０２８８】これらの表１，表２を参照して明らかなよ
うに、最適化探索を行なわずに全解探索を行なった場
合、閾値“ERROR ”の増加に伴って計算時間が指数関数
的に増加するのに対して、最適化探索を行なった場合に
は、閾値“ERROR ”の増加に関係なく、一定時間で計算
を終了することができる。また、最適化探索を行なわず
に全解探索を行なった場合、全体構造の類似性が高けれ
ば閾値“ERROR ”＝４．０Åが抽出処理の限界であり、
全体構造の類似性が低ければ閾値“ERROR ”＝３．０Å
が抽出処理の限界であったが、最適化探索を行なうこと
により、より大きな閾値“ERROR ”で抽出処理を行なう
ことが可能になり、広範囲に亘る共通構造を抽出でき、
抽出精度が大幅に向上することになる。

【０２８９】なお、上述した実施例では、共通構造がタ
ンパク質である場合について説明したが、本発明は、こ
れに限定されるものではなく、共通構造の抽出対象とな
る立体構造は、立体座標をもつ構造であれば特に限定さ
れず、順序付けられた点集合と見なすことのできる、Ｒ
ＮＡ等の立体構造や一般の分子構造等についても本手法
を適用し、上記実施例と同様の作用効果を得ることがで
きる。

【０２９０】ただし、立体構造が物質である場合には、
当該物質を構成する分子もしくは原子を点とみなし、そ
の立体構造を、所定配列に従う分子もしくは原子の順序
集合として捉える。

【０２９１】

【発明の効果】以上詳述したように、本発明の共通構造
抽出装置によれば、部分的に対応付けすることのできる
二つの立体構造を重ね合わせて、他に存在する共通構造
を正確に且つ迅速に抽出できるので、二つの立体構造に
おける類似構造や構造に基づく機能などの解明作業に要
する時間，人員やコストが削減され、その作業の効率化
に大きく寄与する（請求項１〜７）。

【０２９２】また、コスト関数を導入することにより、
共通構造の抽出処理時に無駄な検索処理を行なうのを防
止できるので、共通構造の抽出処理を極めて効率よく実
行することができる（請求項１，２）。一方、共通構造
抽出のための一連の処理を再帰的に繰り返すことによ
り、最適な共通部分を抽出でき、二つの立体構造におけ
る全ての共通部分を確実に抽出することができる（請求
項３，４）。

【０２９３】また、二つの共通構造の部分対応付け情報
が予め明確になっていなくても、二つの共通構造の類似
構造の検索あるいは核構造の抽出を行ない、共通構造を
正確に且つ迅速に抽出できるので、複数の立体構造にお
ける類似構造や構造に基づく機能などの解明作業の効率
化に大きく寄与する（請求項８〜１０）。さらに、二つ
の立体構造の重ね合わせた状態の表示や、共通構造に関
する情報のアライメント出力や、共通構造の三次元座標
情報の出力を行なうことにより、オペレータ等は、二つ
の立体構造の共通構造や特異的な構造を容易に判別で
き、共通構造についての解明作業の効率化に大きく寄与
する（請求項１１〜１４）。

【０２９４】ところで、本発明の共通構造抽出装置によ
れば、二つの立体構造における類似構造に関する情報と
その類似構造を部分対応付け情報として用いて抽出され
た共通構造に関する情報とを自動的に出力する立体構造
検索装置としての機能を提供でき、二つの立体構造にお
ける類似構造や構造に基づく機能などの解明作業の効率
化に大きく寄与する（請求項１５）。

【０２９５】また、本発明の共通構造抽出装置によれ
ば、二つの立体構造の共通部分を抽出する機能を用いて
機能部位データベースを作成する機能部位データベース
生成装置としての機能を提供でき、未知の機能を有する
立体構造の機能を解明する際に必要になる機能部位デー
タベースを容易に作成することができ、立体構造の機能
の解明作業の効率化に大きく寄与する（請求項１６）。

【０２９６】さらに、本発明の共通構造抽出装置によれ
ば、二つの立体構造の共通部分を抽出する機能を用いて
未知の機能を有する立体構造の機能を予測する機能予測
装置としての機能を提供でき、立体構造の機能の解明作
業の効率化に大きく寄与する（請求項１７）。またさら
に、核構造に基づいて抽出された共通構造の類似性を表
示することにより、オペレータ等は、共通構造の類似性
を把握して、立体構造の機能の解明等に際しての各種判
断に生かすことができる（請求項１８）。

【０２９７】さらにまた、本発明の共通構造抽出装置に
よれば、二つの立体構造の核構造を抽出して未知の機能
を有する立体構造の機能を予測する機能予測装置として
の機能を提供でき、立体構造の機能の解明作業の効率化
に大きく寄与する（請求項１９）。なお、抽出対象の立
体構造を、物質の立体構造やタンパク質の立体構造とす
ることで、各種物質やタンパク質の立体構造の検索や、
その立体構造の類似性に基づく機能予測等が可能にな
り、各種物質やタンパク質の機能の解明作業の効率化に
大きく寄与する（請求項２０，２１）。

【０２９８】上述した本発明の共通構造抽出装置による
総合的な効果について以下に説明する。つまり、本発明
の共通構造抽出装置によれば、部分対応付けができる複
数の立体構造を重ね合わせて、他に存在する共通構造を
正確に且つ迅速に抽出することができ、グラフィックシ
ステムによる共通構造の表示，データベースからの類似
な立体構造の検索，構造の類似性に基づく機能予測等を
行なうことが可能になる。

【０２９９】従って、物質（タンパク質）の機能の解明
や機能強化のための改良に当たって、従来研究者が試行
錯誤しながら進めてきた作業を、構造に基づく機能を予
測しその予測結果を実験によって実証するという研究開
発サイクルとして確立・実行できるので、その作業を大
幅に効率化することができる。また、本発明の核構造抽
出の技術により、二つの立体構造に対して重ね合わせの
中心となる核構造を自動的に抽出し、得られた核構造に
基づいて共通構造を抽出することで、上記と同様に物質
（タンパク質）の立体構造と機能の解明や予測等の作業
の効率化に大きく寄与する。

【０３００】さらに、コスト関数の導入により、物質
（タンパク質）の共通構造の抽出処理時に無駄な検索処
理を行なうのを防止でき、共通構造の抽出処理を極めて
効率よく実行でき、さらには広範囲に亘って共通構造を
抽出でき抽出精度の向上にも大きく寄与する。

【図面の簡単な説明】

【図１】本発明の原理ブロック図である。

【図２】本発明の一実施例としての共通構造抽出装置の
基本構成を示すブロック図である。

【図３】本実施例の共通構造抽出装置に付設される類似
構造検索部の構成を示すブロック図である。

【図４】本実施例の共通構造抽出装置に付設される核構
造抽出部の構成を示すブロック図である。

【図５】本実施例の共通構造抽出装置における共通部分
長さ算出部の構成を示すブロック図である。

【図６】本実施例における対応テーブルの構成を示す図
である。

【図７】本実施例における初期テーブル作成手順を説明
するためのフローチャートである。

【図８】本実施例における対応テーブルの更新によるＬ
ＣＳ算出手順を説明するためのフローチャートである。

【図９】本実施例における対応要素の探索処理を説明す
るためのフローチャートである。

【図１０】順序付けられた二つの点集合の具体的な配置
例を示す図である。

【図１１】図１０に示す点集合について作成された初期
テーブルの例を示す図である。

【図１２】（ａ），（ｂ）は対応テーブルの更新例を示
す図である。

【図１３】（ａ），（ｂ）は対応テーブルの更新例を示
す図である。

【図１４】（ａ），（ｂ）は対応テーブルの更新例を示
す図である。

【図１５】本実施例における最長共通部分抽出手順を説
明するためのフローチャートである。

【図１６】本実施例の最長共通部分抽出処理に際して実
行される関数“align ”の処理内容を説明するためのフ
ローチャートである。

【図１７】本実施例の最長共通部分抽出処理に際して実
行される関数“look for pair ”の処理内容を説明する
ためのフローチャートである。

【図１８】本実施例の最長共通部分抽出処理の具体例を
説明すべく、対応テーブル上での探索状態を示す図であ
る。

【図１９】本実施例の最長共通部分抽出処理の具体例を
説明すべく、対応テーブル上での探索状態を示す図であ
る。

【図２０】本実施例の最長共通部分抽出処理の具体例を
説明すべく、対応テーブル上での探索状態を示す図であ
る。

【図２１】本実施例の最長共通部分抽出処理の具体例を
説明すべく、対応テーブル上での探索状態を示す図であ
る。

【図２２】本実施例の最長共通部分抽出処理の具体例を
説明すべく、対応テーブル上での探索状態を示す図であ
る。

【図２３】本実施例の最長共通部分抽出処理の具体例を
説明すべく、対応テーブル上での探索状態を示す図であ
る。

【図２４】本実施例の最長共通部分抽出処理の具体例を
説明すべく、対応テーブル上での探索状態を示す図であ
る。

【図２５】本実施例の最長共通部分抽出処理の具体例を
説明すべく、対応テーブル上での探索状態を示す図であ
る。

【図２６】本実施例の最長共通部分抽出処理の具体例を
説明すべく、対応テーブル上での探索状態を示す図であ
る。

【図２７】本実施例の最長共通部分抽出処理の具体例を
説明すべく、対応テーブル上での探索状態を示す図であ
る。

【図２８】本実施例の最長共通部分抽出処理の具体例を
説明すべく、対応テーブル上での探索状態を示す図であ
る。

【図２９】本実施例の最長共通部分抽出処理（最適化探
索）の具体例を一つの木構造にまとめて示す図である。

【図３０】全解探索による最長共通部分抽出処理の具体
例を一つの木構造にまとめて示す図である。

【図３１】本実施例における核構造抽出処理の手順を説
明するためのフローチャートである。

【図３２】本実施例の核構造抽出処理に際して実行され
る検索処理の手順を説明するためのフローチャートであ
る。

【図３３】本実施例の核構造抽出処理の具体例を示す図
である。

【図３４】（Ａ），（Ｂ）は本実施例の核構造抽出処理
の具体例を示す図である。

【図３５】（Ａ），（Ｂ）は本実施例の核構造抽出処理
の具体例を示す図である。

【図３６】（Ａ），（Ｂ）は本実施例の核構造抽出処理
の具体例を示す図である。

【図３７】（Ａ），（Ｂ）は本実施例の核構造抽出処理
の具体例を示す図である。

【図３８】（Ａ），（Ｂ）は本実施例の核構造抽出処理
の具体例を示す図である。

【図３９】本実施例における類似構造マップ作成処理の
手順を説明するためのフローチャートである。

【図４０】本実施例の類似構造マップ作成処理に際して
実行される検索処理の手順を説明するためのフローチャ
ートである。

【図４１】（Ａ），（Ｂ）は本実施例の類似構造マップ
作成処理により作成された類似構造マップの具体例を示
す図である。

【図４２】本実施例における類似構造マップに基づいた
核構造抽出処理の手順を説明するためのフローチャート
である。

【図４３】本実施例の類似構造マップに基づいた核構造
抽出処理に際して実行される類似部位探索処理の手順を
説明するためのフローチャートである。

【図４４】（Ａ），（Ｂ）は幾何学的な関係（ｎ点間の
距離関係）による候補の絞り込みを説明するための図で
ある。

【図４５】本実施例による共通構造抽出部および類似構
造検索部を用いて構成されるシステムの構成を示すブロ
ック図である。

【図４６】立体構造表示を行なう共通構造抽出装置とし
て機能する構成部分を抽出して示すブロック図である。

【図４７】トリプシン（４ＰＴＰ) の立体構造を示す図
である。

【図４８】アルファ・リティック・プロテアーゼ（２Ａ
ＬＰ) の立体構造を示す図である。

【図４９】抽出された触媒トライアードの構造を示す図
である。

【図５０】抽出処理に際して使用する部分対応付け情報
を示す図である。

【図５１】抽出された共通構造をアライメント形式で表
示した例を示す図である。

【図５２】抽出された共通構造をアライメント形式で表
示した例を示す図である。

【図５３】エラスターゼの立体構造を示す図である。

【図５４】トリプシンとエラスターゼとの共通構造を示
す図である。

【図５５】トリプシンとエラスターゼとの共通構造（全
体構造上の位置）を示す図である。

【図５６】トリプシンとエラスターゼとの共通構造をア
ライメント形式で表示した例を示す図である。

【図５７】トリプシンとエラスターゼとの共通構造をア
ライメント形式で表示した例を示す図である。

【図５８】トリプシンとエラスターゼとの共通構造をア
ライメント形式で表示した例を示す図である。

【図５９】立体構造検索を行なう共通構造抽出装置とし
て機能する構成部分を抽出して示すブロック図である。

【図６０】トリプシンのヒスチジン活性部位をプローブ
として用い、その類似構造をアルファ・リティック・プ
ロテアーゼから検索した結果を示す図である。

【図６１】機能予測を行なう共通構造抽出装置として機
能する構成部分を抽出して示すブロック図である。

【図６２】ラスプロテインとアデニル酸キナーゼとから
共通構造を抽出した結果を、アライメント形式で表示し
た例を示す図である。

【図６３】ラスプロテインとアデニル酸キナーゼとから
共通構造を抽出した結果を、アライメント形式で表示し
た例を示す図である。

【図６４】本実施例における核構造抽出を用いた共通構
造抽出装置の構成を示すブロック図である。

【図６５】タンパク質のトリプシンのアミノ酸配列を示
す図である。

【図６６】エラスターゼのアミノ酸配列を示す図であ
る。

【図６７】核構造抽出結果を用いてトリプシンとエラス
ターゼとの共通構造を抽出した結果を、アライメント形
式で表示した例を示す図である。

【図６８】核構造抽出結果を用いてトリプシンとエラス
ターゼとの共通構造を抽出した結果を、アライメント形
式で表示した例を示す図である。

【図６９】核構造抽出結果を用いてトリプシンとエラス
ターゼとの共通構造を抽出した結果を、アライメント形
式で表示した例を示す図である。

【図７０】核構造抽出結果を用いてトリプシンとエラス
ターゼとから抽出された共通構造のグラフィック表示状
態を示す図である。

【図７１】本実施例における核構造抽出を用いた類似構
造検索を行なう共通構造抽出装置の構成を示すブロック
図である。

【図７２】本実施例における核構造抽出による機能予測
を行なう共通構造抽出装置の構成を示すブロック図であ
る。

【図７３】本実施例の機能予測部の動作を説明するため
のフローチャートである。

【図７４】本実施例の機能部位データベースの登録例を
示す図である。

【図７５】（Ａ）はλファージＣｒｏタンパク質のアミ
ノ酸配列を示す図、（Ｂ）はλファージＣｒｏタンパク
質の立体構造を示す図である。

【図７６】（Ａ）はλファージリプレッサーのアミノ酸
配列を示す図、（Ｂ）はλファージリプレッサーの立体
構造を示す図である。

【図７７】λファージＣｒｏタンパク質とλファージリ
プレッサーとの共通構造の抽出結果を、アライメント形
式で表示した例を示す図である。

【図７８】λファージＣｒｏタンパク質とλファージリ
プレッサーとの共通構造の抽出結果のグラフィック表示
状態を示す図である。

【図７９】（Ａ）〜（Ｄ）はｒｍｓｄ値の一般的な算出
手法を示す図である。

【図８０】本実施例の共通構造抽出装置を実現するため
の計算機システムの構成例を示すブロック図である。

【符号の説明】

１共通構造抽出装置１Ａ共通構造抽出部２類似構造検索部２ａ構成要素検索部３核構造抽出部３ａセグメント分割部３ｂセグメント検索部３ｃ類似性判別部３ｄ核構造選択部１０全体構造重合部１０ａ重心算出部１０ｂ平行移動部１０ｃ回線角算出部１０ｄ回転重合部１１共通部分長さ算出部１１ａ対応テーブル作成部１１ｂＬＣＳ算出部（最長共通部分長さ算出部）１２累積距離算出部１２ａコスト関数演算部１３共通部分抽出部５０ａ〜５０ｈ入力データ５１データ入力部５２立体構造データベース５３類似構造検索部５４機能部位データベース５５共通構造抽出部５６共通構造出力部５７アライメント出力部５８モデル構造出力部５９類似構造出力部６０機能部位データベース作成部６１機能部位出力部６２，６２ａ〜６２ｃディスプレイ（表示部）６３機能部位データベース６４核構造抽出部６５類似性判定部６６判定結果出力部６７機能予測部６８予測結果出力部１００ＣＰＵ１０１ＲＡＭ１０２ＲＯＭ１０３インターフェイス部１０４表示制御部１０５バス

フロントページの続き (56)参考文献特開昭62−44897（ＪＰ，Ａ) 特開平５−219932（ＪＰ，Ａ) 特開昭63−259598（ＪＰ，Ａ) 特開平４−45781（ＪＰ，Ａ) ＡＬＥＸＡＮＤＲＯＶ，Ｎ．Ｎ．ｅｔ．ａｌ ”ＣｏｍｍｏｎＳｐａｔｉａｌＡｒｒａｎｇｅｍｅｎｔｓｏｆＢａｃｋｂｏｎｅＦｒａｇｍｅｎｔｓｉｎＨｏｍｏｌｏｇｏｕｓａｎｄＮｏｎ−ｈｏｍｏｌｏｇｏｕｓＰｒｏｔｅｉｎｓ”ＪｏｕｒｎａｌｏｆＭＯＬＥＣＵＬＡＲＢＩＯＬＯＧＹ，Ｖｏｌ．225，Ｎｏ．１，ｐｐ．５ −９，1992（平４−５−５) 板井「コンピュータを用いた医薬分子設計の現状」，薬学図書館，Ｖｏｌ. 36，Ｎｏ．１，1991年，ｐ．10−23 ＧＶｒｉｅｎｄａｎｄＣＳａｎｄｅｒ，”ＤｅｔｅｃｔｉｏｎｏｆＣｏｍｍｏｎＴｈｒｅｅ−ＤｉｍｅｎｓｉｏｎａｌＳｕｂｓｔｒｕｃｔｕｒｅｓｉｎＰｒｏｔｅｉｎｓ”，ＰＲＯＴＥＩＮＳ：Ｓｔｒｕｃｔｕｒｅ，ＦｕｎｃｔｉｏｎａｎｄＧｅｎｅｔｉｃｓ，Ｖｏｌ．11，Ｎｏ．１, 1991年，ｐ．52−58 板井、富岡，「リードジェネレーションを指向したコンピューターグラフィックス」，現代化学増刊，Ｖｏｌ．13, 1987年，ｐ．57−72 富岡，板井「分子設計と分子モデリング」ＰＩＸＥＬ，Ｎｏ．64，1988，ｐ. 64，65，43（昭63−１−１) ＡＫＵＴＳＵ，Ｔ．，”ＰＲＯＴＥＩＸ：ＡｎＩｎｔｅｅｅｒａｃｔｉｖｅＤａｔａｂａｓｅＳｙｓｔｅｍｆｏｒＴｈｒｅｅＤｉｍｅｎｓｉｏｎａｌＰｒｏｔｅｉｎＳｔｒｕｃｔｕｒｅｓ”，ＰｒｏｃｅｅｄｉｎｇｓｏｆＧｅｎｏｍｅＩｎｆｏｒｍａｔｉｃｓＷｏｒｋｓｈｏｐＩＶ，1993, ｐ．430−443（平５−12−13) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06F 17/30 G06F 17/50 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】それぞれ立体構造を形成する順序付けら
れた二つの点集合から、該二つの点集合の間で共通する
部分の点集合を、二つの該立体構造間の共通構造として
抽出する共通構造抽出装置であって、該二つの点集合を部分的に対応付けるべく予め既知のデ
ータとして与えられる部分対応付け情報に基づいて、該
二つの点集合の全体を平行移動／回転移動させて重ね合
わせる全体構造重合部と、該全体構造重合部により重ね合わされた該二つの点集合
の共通部分として対になる点の数を共通部分長さとして
算出する共通部分長さ算出部と、該全体構造重合部により重ね合わされた該二つの点集合
の共通部分として対になる点間の距離を累積した累積距
離情報を算出する累積距離算出部と、該共通部分長さ算出部により算出された共通部分長さが
最長で、且つ、該累積距離算出部により算出された累積
距離情報が最小になる該二つの点集合の共通部分を、共
通構造として抽出する共通部分抽出部とがそなえられ、該二つの点集合の共通部分として対になる点間の距離に
基づくコスト関数を導入するとともに、該二つの点集合の共通部分として同一の最長共通部分長
さを有する複数の経路が存在する場合に該累積距離算出
部が前記累積距離情報を算出すべく各経路を成す点を順
次探索する際、各経路を成す点が順次探索される都度、
当該点での前記コスト関数の値を算出するコスト関数演
算部をそなえ、該累積距離算出部が、ある点を探索した時に、当該点に
おいて該コスト関数演算部により算出された前記コスト
関数の新値と、当該点において以前に該コスト関数演算
部により算出された前記コスト関数の旧値とを比較し、
前記新値が前記旧値以上である場合には、当該経路につ
いての探索を中止して次の経路の探索へ移行する一方、
前記新値が前記旧値よりも小さい場合には、当該経路に
ついての探索を継続して実行することにより、該前記同
一の最長共通部分長さを有する複数の経路の中から、前
記コスト関数の値が最小になる経路が共通構造として抽
出されることを特徴とする、共通構造抽出装置。
【請求項２】前記コスト関数が、各経路の始点から探
索点までの各点において対になる点間の距離の二乗値を
累積加算するものであることを特徴とする、請求項１記
載の共通構造抽出装置。
【請求項３】該共通部分抽出部により抽出された共通
構造を前記部分対応付け情報として用い、該全体構造重合部，該共通部分長さ算出部，該累積距離
算出部および該共通部分抽出部による一連の処理を、該
二つの点集合の共通部分として対になる点の数に変化が
なくなるまで再帰的に繰り返して最適な共通構造を抽出
することを特徴とする、請求項１もしくは請求項２に記
載の共通構造抽出装置。
【請求項４】それぞれ立体構造を形成する順序付けら
れた二つの点集合から、該二つの点集合の間で共通する
部分の点集合を、二つの該立体構造間の共通構造として
抽出する共通構造抽出装置であって、該二つの点集合を部分的に対応付ける部分対応付け情報
に基づいて、該二つの点集合の全体を平行移動／回転移
動させて重ね合わせる全体構造重合部と、該全体構造重合部により重ね合わされた該二つの点集合
の共通部分として対になる点の数を共通部分長さとして
算出する共通部分長さ算出部と、該全体構造重合部により重ね合わされた該二つの点集合
の共通部分として対になる点間の距離を累積した累積距
離情報を算出する累積距離算出部と、該共通部分長さ算出部により算出された共通部分長さが
最長で、且つ、該累積距離算出部により算出された累積
距離情報が最小になる該二つの点集合の共通部分を、共
通構造として抽出する共通部分抽出部とがそなえられ、前記部分対応付け情報として予め与えられる既知のデー
タを用いて該共通部分抽出部により共通構造が抽出され
た後、抽出された当該共通構造を前記部分対応付け情報
として用い、該全体構造重合部，該共通部分長さ算出部，該累積距離
算出部および該共通部分抽出部による一連の処理を、該
二つの点集合の共通部分として対になる点の数に変化が
なくなるまで再帰的に繰り返して最適な共通構造を抽出
することを特徴とする、共通構造抽出装置。
【請求項５】該全体構造重合部が、該部分対応付け情報により対応付けられる該二つの点集
合における部分集合の重心をそれぞれ算出する重心算出
部と、該重心算出部により算出された二つの該重心が一致する
ように該二つの点集合を平行移動する平行移動部と、該二つの点集合における部分集合を重ね合わせるために
必要な該重心まわりの回転角を算出する回転角算出部
と、該回転角算出部により算出された該回転角に基づいて一
方の点集合の全体を回転することにより、該二つの点集
合の全体を重ね合わせる回転重合部とをそなえて構成さ
れていることを特徴とする、請求項１〜請求項４のいず
れか一項に記載の共通構造抽出装置。
【請求項６】該共通部分長さ算出部が、該全体構造重合部により重ね合わされた該二つの点集合
の共通部分として対応付けられる可能性のある点の組合
せを格納する対応テーブルを作成する対応テーブル作成
部と、該対応テーブル作成部により作成された対応テーブルに
基づいて、該二つの点集合の共通部分として対応付けら
れる点集合において対になる点の数を、最長共通部分長
さとして算出する最長共通部分長さ算出部とをそなえて
構成されていることを特徴とする、請求項１〜請求項４
のいずれか一項に記載の共通構造抽出装置。
【請求項７】該累積距離算出部が、該全体構造重合部により重ね合わされた該二つの点集合
の共通部分として対になる点間の距離についての平均二
乗値の平方根を、前記累積距離情報として算出すること
を特徴とする、請求項１〜請求項４のいずれか一項に記
載の共通構造抽出装置。
【請求項８】該二つの点集合のうちの一方の点集合を
その順序に従って先頭から順に一定個数の部分集合に分
割して、各部分集合に類似する点集合を、該二つの点集
合のうちの他方の点集合から類似構造として検索する類
似構造検索部をそなえ、該類似構造検索部により検索された類似構造を、前記部
分対応付け情報として用い、前記共通構造を抽出するこ
とを特徴とする、請求項１〜請求項７のいずれかに記載
の共通構造抽出装置。
【請求項９】該二つの点集合から、該二つの点集合を
適切に重ね合わせるための核となる点集合を核構造とし
て抽出する核構造抽出部をそなえ、該核構造抽出部が、該二つの点集合のうちの一方の点集合を、その順序に従
って先頭の点から１点ずつずらしながら一定の長さのセ
グメントに分割し、分割された各セグメントに類似する
点集合を、該二つの点集合のうちの他方の点集合から類
似構造として検索し、検索された該類似構造のうち最も
類似するものを核構造として選択し、該選択した核構造
を前記部分対応付け情報として出力することを特徴とす
る、請求項１〜請求項７のいずれかに記載の共通構造抽
出装置。
【請求項１０】該核構造抽出部が、該二つの点集合間に存在する類似構造の分布を把握すべ
く、該二つの点集合を成す各点をその順序に従ってそれ
ぞれ行と列とに割り当てるとともに、検索された該類似
構造の、該二つの点集合上でのそれぞれの位置に応じた
行および列の交点上に所定データを設定することにより
類似構造マップを作成し、該類似構造マップを参照して前記核構造を抽出すること
を特徴とする、請求項９記載の共通構造抽出装置。
【請求項１１】該共通部分抽出部により抽出された前
記共通構造に基づいて、該二つの点集合によりそれぞれ
形成される二つの立体構造を重ね合わせて表示する表示
部をそなえたことを特徴とする、請求項１〜請求項１０
のいずれかに記載の共通構造抽出装置。
【請求項１２】該表示部が、前記二つの立体構造を３
次元グラフィックとして表示することを特徴とする、請
求項１１記載の共通構造抽出装置。
【請求項１３】該共通部分抽出部により抽出された前
記共通構造を構成する該二つの点集合の各点に関する情
報を、各点集合における順序に従って並置した状態で出
力するアライメント出力部をそなえたことを特徴とす
る、請求項１〜請求項１０のいずれかに記載の共通構造
抽出装置。
【請求項１４】該共通部分抽出部により抽出された前
記共通構造を三次元座標情報として出力するモデル構造
出力部をそなえたことを特徴とする、請求項１〜請求項
１０のいずれかに記載の共通構造抽出装置。
【請求項１５】該二つの点集合のうちの一方の点集合
に関する情報として、部分構造情報を入力するデータ入
力部と、該二つの点集合のうちの他方の点集合に関する情報とし
て、立体構造に関する情報を予め格納する立体構造デー
タベースと、該データ入力部から入力された前記部分構造情報に類似
する立体構造を、該立体構造データベースから類似構造
として検索する類似構造検索部と、該類似構造検索部により検索された類似構造に関する情
報と、当該類似構造を前記部分対応付け情報として用い
て該共通部分抽出部により抽出された前記共通構造に関
する情報とを出力する類似構造出力部とをそなえたこと
を特徴とする、請求項１〜請求項７のいずれかに記載の
共通構造抽出装置。
【請求項１６】該二つの点集合のうちの一方の点集合
に関する情報として、既知の機能を有する部分構造に関
する情報を入力するデータ入力部と、該二つの点集合のうちの他方の点集合に関する情報とし
て、立体構造に関する情報を予め格納する立体構造デー
タベースと、ある機能とその機能に関連する立体構造との関係を格納
する機能部位データベースと、該データ入力部から入力された前記既知の機能を有する
部分構造に類似する立体構造を、該立体構造データベー
スから類似構造として検索する類似構造検索部と、該類似構造検索部により検索された類似構造に関する情
報と、当該類似構造を前記部分対応付け情報として用い
て該共通部分抽出部により抽出された前記共通構造に関
する情報と、前記所定機能に関する情報とを、該機能部
位データベースに出力して登録する機能部位データベー
ス作成部とをそなえたことを特徴とする、請求項１〜請
求項７のいずれかに記載の共通構造抽出装置。
【請求項１７】該二つの点集合のうちの一方の点集合
に関する情報として、未知の機能を有する対象立体構造
に関する情報を入力するデータ入力部と、ある機能とその機能に関連する立体構造との関係を格納
する機能部位データベースと、該機能部位データベースに格納された立体構造に類似す
る構造を、該データ入力部から入力された前記対象立体
構造から検索する類似構造検索部と、該類似構造検索部により検索された類似構造を前記部分
対応付け情報として用いて該共通部分抽出部により抽出
された、前記対象立体構造と該機能部位データベースに
格納された立体構造との共通構造に基づいて、前記対象
立体構造の有する機能とその機能に関連する構造とを特
定して出力する機能部位出力部とをそなえたことを特徴
とする、請求項１〜請求項７のいずれかに記載の共通構
造抽出装置。
【請求項１８】該核構造抽出部により抽出された核構
造を前記部分対応付け情報として用いて該共通部分抽出
部により抽出された前記共通構造について、当該共通構
造を成す該二つの点集合の類似性を判定する類似性判定
部と、該類似性判定部により当該共通構造を成す該二つの点集
合の類似性が高いと判定された場合に当該共通構造を表
示する表示部とをそなえたことを特徴とする、請求項９
または請求項１０に記載の共通構造抽出装置。
【請求項１９】該二つの点集合のうちの一方の点集合
に関する情報として既知の機能を有する立体構造に関す
る情報を入力するとともに、該二つの点集合のうちの他
方の点集合に関する情報として未知の機能を有する立体
構造に関する情報とを入力するデータ入力部と、ある機能とその機能に関連する立体構造との関係を格納
する機能部位データベースと、該データ入力部から入力された前記既知の機能を有する
立体構造と前記未知の機能を有する立体構造とについ
て、該核構造抽出部により抽出された核構造を前記部分
対応付け情報として用いて該共通構部分出部により抽出
された前記共通構造に基づいて該機能部位データベース
を参照し、前記未知の機能を有する立体構造についての
機能予測を行なう機能予測部と、該機能予測部により予測された、前記未知の機能を有す
る立体構造の機能部位を表示する表示部とをそなえたこ
とを特徴とする、請求項９または請求項１０に記載の共
通構造抽出装置。
【請求項２０】前記立体構造が物質の立体構造であ
り、前記の各点集合が、当該物質を構成する分子もしく
は原子を点とみなし、所定配列に従う該分子もしくは該
原子の順序集合として捉えられるものであることを特徴
とする、請求項１〜請求項１９のいずれかに記載の共通
構造抽出装置。
【請求項２１】前記立体構造がタンパク質の立体構造
であり、前記の各点集合が、当該タンパク質を構成する
アミノ酸を点とみなし、該アミノ酸の配列番号に従う該
アミノ酸の順序集合として捉えられるものであることを
特徴とする、請求項１〜請求項１９のいずれかに記載の
共通構造抽出装置。