JP2003196575A - 蛋白質構造予測装置、蛋白質構造予測方法、プログラム、および、記録媒体 - Google Patents

蛋白質構造予測装置、蛋白質構造予測方法、プログラム、および、記録媒体

Info

Publication number
JP2003196575A
JP2003196575A JP2001398569A JP2001398569A JP2003196575A JP 2003196575 A JP2003196575 A JP 2003196575A JP 2001398569 A JP2001398569 A JP 2001398569A JP 2001398569 A JP2001398569 A JP 2001398569A JP 2003196575 A JP2003196575 A JP 2003196575A
Authority
JP
Japan
Prior art keywords
fragment
sequence
matrix
query
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001398569A
Other languages
English (en)
Other versions
JP4084040B2 (ja
Inventor
Seiji Saito
静司 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Celestar Lexico Sciences Inc
Original Assignee
Celestar Lexico Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Celestar Lexico Sciences Inc filed Critical Celestar Lexico Sciences Inc
Priority to JP2001398569A priority Critical patent/JP4084040B2/ja
Priority to EP02792060A priority patent/EP1460559A4/en
Priority to PCT/JP2002/013832 priority patent/WO2003056461A1/ja
Publication of JP2003196575A publication Critical patent/JP2003196575A/ja
Priority to US10/846,622 priority patent/US20050026217A1/en
Application granted granted Critical
Publication of JP4084040B2 publication Critical patent/JP4084040B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

(57)【要約】 【課題】 相関の複雑な多様体や相関の確信度をも表現
可能なように、部分配列から部分構造の相関を計算し、
構造を予測することができるシステム等を提供すること
を課題とする。 【解決手段】 本発明は、ある配列Aの周りに存在する
この配列に似ている配列が、構造空間上でどの構造クラ
スターに属するか(どのような似方をしていれば、どの
構造クラスターに属するか)を計算し、この配列の周り
に仮想的なクラスターを作成する。そして、本発明は、
ある未知構造配列断片Xが与えられたとき、これが配列
Aに似ている、配列Cに似ているなどの情報を取得し、
これらの情報に基づいて仮想クラスターを組み合わせ
て、最終的に配列がどの構造クラスターに属するかを予
測する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、蛋白質構造予測装
置、蛋白質構造予測方法、プログラム、および、記録媒
体に関し、特に、配列と構造の相関により蛋白質の立体
構造を予測する蛋白質構造予測装置、蛋白質構造予測方
法、プログラム、および、記録媒体に関する。
【0002】
【従来の技術】蛋白質の立体構造は、配列情報から一意
に決まると言われている。つまり、配列空間と構造空間
との間には何らかの相関があるということである。ここ
で、配列空間と構造空間(ネイティブ構造の空間)の大
きさを比較してみると、配列空間の方が大きいと言え
る。なぜなら、進化的に見ると、配列が多少変化したと
しても構造はあまり変化しているようには見えないから
である。このことを換言すると、構造の方が配列よりも
進化的に保守性が強いとも言える。
【0003】また、近年の進化的に良く似た蛋白質の構
造解析によって、似たような配列をもつ蛋白質は、似た
ような全体構造をもつということが明らかになってき
た。全体は部分の組み合わせから作られていると考える
と、蛋白質の全体構造に対して成り立つであろう上記の
ような経験則が、蛋白質の一部を切り出した部分に関し
てもある程度成り立つのではないかと考えることができ
る。
【0004】実際に、蛋白質の似たような部分配列は似
たような部分構造となるという部分配列と部分構造とに
相関のあるものが存在している。最近の研究では、部分
配列と部分構造との相関を利用して、部分配列から全体
構造を組み立てるという試みが試されてきている。
【0005】例えば、Kim T.Simons等
「Assembly of Protein Tert
iary Structures from Frag
ments with Similar Local
Sequences using Simulated
Annealing and Bayesian S
coring Functions」J.Mol.Bi
ol.(1997)268,209p−225p(以下
「文献1」という)や、ChristopherBys
troff等「Predection of Loca
l Structure in Proteins U
sing a Library ofSequence
−Structure Motifs」J.Mol.B
iol.(1998)281,565p−577p(以
下「文献2」という)により開示された研究において
は、部分配列に対応する構造をクラスタリングすること
により、広大な構造(folding)空間を狭めるこ
とが可能となり、フォールディング・シミュレーション
の計算時間の短縮にも繋がっている。
【0006】ここで、文献1には、localな配列に
よってlocal構造は特定の偏った構造に制限される
ので構造空間は小さくなること、その構造は配列上近い
蛋白質の構造に類似していること、配列のプロファイル
をマルチプルアラインメントにより求め、問合せ(qu
ery)配列との距離の近さを求めることなどが開示さ
れている。
【0007】また、文献2には、断片構造と配列の相関
がある場合には、断片の配列傾向から限られた数の構造
の候補がとりだせること、構造に関しては二つの構造指
標を用いてクラスタリングを行い、また、配列について
はfrequency profileの距離を使って
計算し、クラスター作成は配列が似ているものの中から
構造が似ているものを探してクラスター化することによ
り実際に配列−構造断片のクラスターを作成することが
開示されている。
【0008】従来技術による構造クラスター作成過程を
図1および図2を用いて説明する。ここで、図1は、従
来技術により配列をプロファイルで表現した場合の一例
を示す図であり、図2は、従来技術による構造クラスタ
ー作成イメージを示す図である。
【0009】まず、配列をプロファイルで表現する。こ
こで、図1(a)に示すように、配列(AGGED)に
対応するアミノ酸に「1」を設定することにより、プロ
ファイルを作成する。また、例えば配列(AGGED)
と(ADGDD)が一つのクラスターを構成していると
きには、このクラスターのプロファイルを図1(b)の
ように作成する。すなわち、クラスター内に属する配列
に関して、ある位置に存在するアミノ酸の頻度を設定す
ることにより、プロファイルを作成する。プロファイル
で比較することにより、配列一つとクラスター間の類似
度が計算できる。
【0010】そして、配列プロファイルの似ているもの
が同じクラスター(図2の(a)における1から5)に
入るように、配列空間においてクラスタリングする(図
2の(a))。すなわち、配列プロファイルの類似度を
計算して、配列全体の類似度を計算することにより、等
方向的なクラスターが作成される。
【0011】そして、その配列が構造空間においてどの
点に対応するかの相関を見て(図2の(b)では、クラ
スター1について構造空間との相関をとっている)、配
列−構造間の相関が大きいものをクラスター化する(図
2の(c))。すなわち、図2(b)の配列空間のクラ
スターに含まれる一つ一つの配列について、構造空間の
点が近いもの(構造が似ているもの)を抽出し、構造が
似ていないものは捨てる。このように作成されたクラス
ターと、捨てられた配列とを用いて、処理を繰返すこと
により、構造クラスターを作成する。
【0012】
【発明が解決しようとする課題】しかしながら、これら
の従来の手法においては、配列プロファイルを用いた静
的な配列と構造との相関クラスターを作っているが、実
際には配列空間と構造空間との相関は複雑な多様体を形
成していると思われ、プロファイルといういわば空間上
で等方向的な相関の取り方では不十分であるという問題
点を有していた。
【0013】また、全体構造は部分構造から作られると
はいえ、当然のことながら部分的に相関の大きいもの、
小さいもの、または、相関が見えないものなどがあるは
ずであり、従来の手法においては、それらの定量化も不
十分であるという問題点を有していた。
【0014】本発明は上記問題点に鑑みてなされたもの
で、相関の複雑な多様体や相関の確信度をも表現可能な
ように、部分配列から部分構造の相関を計算することの
できる、蛋白質構造予測装置、蛋白質構造予測方法、プ
ログラム、および、記録媒体を提供することを目的とし
ている。
【0015】
【課題を解決するための手段】このような目的を達成す
るため、請求項1に記載の蛋白質構造予測装置は、蛋白
質の配列情報および立体構造情報に基づいて、配列情報
を所定の長さに分割した断片配列とそれに対応する断片
構造とを作成し、当該断片構造の類似度に基づいて断片
構造クラスターを作成する断片構造クラスター作成手段
と、上記断片配列について配列空間上における周囲の上
記断片配列と配列類似性検索を行う断片配列類似性検索
手段と、上記断片配列の類似配列が上記断片構造クラス
ターに属する確率である確信度を、上記断片配列と上記
構造クラスターとの行列で表示する確信度マトリックス
を作成する確信度マトリックス作成手段と、利用者に問
合せ配列を入力させる問合せ配列入力手段と、上記問合
せ配列入力手段にて入力された上記問合せ配列を所定の
長さに分割して問合せ断片配列を作成する問合せ断片配
列作成手段と、上記問合せ断片配列作成手段にて作成さ
れた上記問合せ断片配列について、上記断片配列と配列
類似性検索を行う問合せ断片配列類似性検索手段と、上
記確信度マトリックス作成手段にて作成した上記確信度
マトリックスと、上記問合せ断片配列類似性検索手段の
検索結果とに基づいて、上記問合せ断片配列が上記断片
構造クラスターに属する確率を計算する断片構造確率計
算手段と、上記断片構造確率計算手段にて計算された上
記確率に基づいて、上記問合せ配列の上記断片構造を予
測する断片配列構造予測手段とを備えたことを特徴とす
る。
【0016】この装置によれば、蛋白質の配列情報およ
び立体構造情報に基づいて、配列情報を所定の長さに分
割した断片配列とそれに対応する断片構造とを作成し、
当該断片構造の類似度に基づいて断片構造クラスターを
作成し、断片配列について配列空間上における周囲の断
片配列と配列類似性検索を行い、断片配列の類似配列が
断片構造クラスターに属する確率である確信度を、断片
配列と構造クラスターとの行列で表示する確信度マトリ
ックスを作成する。そして、利用者に問合せ配列を入力
させ、入力された問合せ配列を所定の長さに分割して問
合せ断片配列を作成し、作成された問合せ断片配列につ
いて、断片配列と配列類似性検索を行い、作成した確信
度マトリックスと検索結果とに基づいて、問合せ断片配
列が断片構造クラスターに属する確率を計算し、計算さ
れた確率に基づいて、問合せ配列の断片構造を予測する
ので、相関の複雑な多様体や相関の確信度をも表現可能
なように、部分配列から部分構造の相関を計算し、その
部分構造を予測することができるようになる。すなわ
ち、本発明は、構造を計算する際、相関の度合に応じて
複数の構造候補の確率(確信度)を与えて持たせておく
(確信度の関数を構造変化の確率として用いる)ことが
できる。
【0017】また、蛋白質立体構造を相関の大きな部分
構造のブロックとして考える手法は以前からあるが、本
装置ではまず部分構造のクラスターを作り、構造配列相
関多様体の複雑な形を考慮して、問合せ(query)
配列が与えられた後に動的に配列相関クラスターを作る
ことができる。
【0018】また、本装置は、構造クラスターを違う観
点から(例えば、断片配列の長さ、断片構造の解像度、
構造クラスターの大きさ、相関の度合い等)いくつも作
り、それぞれのデータセットからの構造予測結果を統合
して構造を計算することができるようになる。
【0019】また、請求項2に記載の蛋白質構造予測装
置は、請求項1に記載の蛋白質構造予測装置において、
上記断片配列類似性検索手段により上記断片配列に関し
て類似性検索をした結果を、断片配列の行列で表示した
類似性マトリックスを作成する類似性マトリックス作成
手段と、上記断片配列がどの上記断片構造クラスターに
属しているかを示す構造クラスター情報を、上記断片配
列と上記構造クラスターの行列で表示した構造クラスタ
ー情報マトリックスを作成する構造クラスター情報マト
リックス作成手段とをさらに備え、上記確信度マトリッ
クス作成手段は、上記類似性マトリックス作成手段にて
作成した上記類似性マトリックスと、上記構造クラスタ
ー情報マトリックス作成手段にて作成した上記構造クラ
スター情報マトリックスとに基づいて、上記確信度マト
リックスを作成することを特徴とする。
【0020】これは確信度マトリックスの作成の一例を
一層具体的に示すものである。この装置によれば、断片
配列に関して類似性検索をした結果を、断片配列の行列
で表示した類似性マトリックスを作成する類似性マトリ
ックス作成手段と、断片配列がどの断片構造クラスター
に属しているかを示す構造クラスター情報を、断片配列
と構造クラスターの行列で表示した構造クラスター情報
マトリックスを作成し、作成した類似性マトリックスと
構造クラスター情報マトリックスとに基づいて、確信度
マトリックスを作成するので、行列演算手法を用いて類
似性検索結果に基づいて簡易かつ精緻に確信度を計算す
ることができるようになる。
【0021】また、請求項3に記載の蛋白質構造予測装
置は、請求項1または2に記載の蛋白質構造予測装置に
おいて、最大の上記確信度を持つ上記断片構造にて決定
された初期全体構造について所定の最適化を行う全体構
造最適化手段をさらに備えたことを特徴とする。
【0022】この装置によれば、最大の確信度を持つ断
片構造にて決定された初期全体構造について所定の最適
化を行うので、まず、初期構造を作成する際に様々な可
能な断片配列に分割しそれらの最適な予測結果を統合す
ることができるようになる。また、初期構造をさらに最
適化を行うことにより、全体構造予測の精度をさらに上
げることができるようになる。
【0023】また、本発明は蛋白質構造予測方法に関す
るものであり、請求項4に記載の蛋白質構造予測方法
は、蛋白質の配列情報および立体構造情報に基づいて、
配列情報を所定の長さに分割した断片配列とそれに対応
する断片構造とを作成し、当該断片構造の類似度に基づ
いて断片構造クラスターを作成する断片構造クラスター
作成ステップと、上記断片配列について配列空間上にお
ける周囲の上記断片配列と配列類似性検索を行う断片配
列類似性検索ステップと、上記断片配列の類似配列が上
記断片構造クラスターに属する確率である確信度を、上
記断片配列と上記構造クラスターとの行列で表示する確
信度マトリックスを作成する確信度マトリックス作成ス
テップと、利用者に問合せ配列を入力させる問合せ配列
入力ステップと、上記問合せ配列入力ステップにて入力
された上記問合せ配列を所定の長さに分割して問合せ断
片配列を作成する問合せ断片配列作成ステップと、上記
問合せ断片配列作成ステップにて作成された上記問合せ
断片配列について、上記断片配列と配列類似性検索を行
う問合せ断片配列類似性検索ステップと、上記確信度マ
トリックス作成ステップにて作成した上記確信度マトリ
ックスと、上記問合せ断片配列類似性検索ステップの検
索結果とに基づいて、上記問合せ断片配列が上記断片構
造クラスターに属する確率を計算する断片構造確率計算
ステップと、上記断片構造確率計算ステップにて計算さ
れた上記確率に基づいて、上記問合せ配列の上記断片構
造を予測する断片配列構造予測ステップとを含むことを
特徴とする。
【0024】この方法によれば、蛋白質の配列情報およ
び立体構造情報に基づいて、配列情報を所定の長さに分
割した断片配列とそれに対応する断片構造とを作成し、
当該断片構造の類似度に基づいて断片構造クラスターを
作成し、断片配列について配列空間上における周囲の断
片配列と配列類似性検索を行い、断片配列の類似配列が
断片構造クラスターに属する確率である確信度を、断片
配列と構造クラスターとの行列で表示する確信度マトリ
ックスを作成する。そして、利用者に問合せ配列を入力
させ、入力された問合せ配列を所定の長さに分割して問
合せ断片配列を作成し、作成された問合せ断片配列につ
いて、断片配列と配列類似性検索を行い、作成した確信
度マトリックスと検索結果とに基づいて、問合せ断片配
列が断片構造クラスターに属する確率を計算し、計算さ
れた確率に基づいて、問合せ配列の断片構造を予測する
ので、相関の複雑な多様体や相関の確信度をも表現可能
なように、部分配列から部分構造の相関を計算し、その
部分構造を予測することができるようになる。すなわ
ち、本発明は、構造を計算する際、相関の度合いに応じ
て複数の構造候補の確率(確信度)を与えて持たせてお
く(確信度の関数を構造変化の確率として用いる)こと
ができる。
【0025】また、蛋白質立体構造を相関の大きな部分
構造のブロックとして考える手法は以前からあるが、本
方法ではまず部分構造のクラスターを作り、構造配列相
関多様体の複雑な形を考慮して、問合せ(query)
配列が与えられた後に動的に配列相関クラスターを作る
ことができる。
【0026】また、本方法は、構造クラスターを違う観
点から(例えば、断片配列の長さ、断片構造の解像度、
構造クラスターの大きさ、相関の度合い等)いくつも作
り、それぞれのデータセットからの構造予測結果を統合
して構造を計算することができるようになる。
【0027】また、請求項5に記載の蛋白質構造予測方
法は、請求項4に記載の蛋白質構造予測方法において、
上記断片配列類似性検索ステップにより上記断片配列に
関して類似性検索をした結果を、断片配列の行列で表示
した類似性マトリックスを作成する類似性マトリックス
作成ステップと、上記断片配列がどの上記断片構造クラ
スターに属しているかを示す構造クラスター情報を、上
記断片配列と上記構造クラスターの行列で表示した構造
クラスター情報マトリックスを作成する構造クラスター
情報マトリックス作成ステップとをさらに含み、上記確
信度マトリックス作成ステップは、上記類似性マトリッ
クス作成ステップにて作成した上記類似性マトリックス
と、上記構造クラスター情報マトリックス作成ステップ
にて作成した上記構造クラスター情報マトリックスとに
基づいて、上記確信度マトリックスを作成することを特
徴とする。
【0028】これは確信度マトリックスの作成の一例を
一層具体的に示すものである。この方法によれば、断片
配列に関して類似性検索をした結果を、断片配列の行列
で表示した類似性マトリックスを作成する類似性マトリ
ックス作成ステップと、断片配列がどの断片構造クラス
ターに属しているかを示す構造クラスター情報を、断片
配列と構造クラスターの行列で表示した構造クラスター
情報マトリックスを作成し、作成した類似性マトリック
スと構造クラスター情報マトリックスとに基づいて、確
信度マトリックスを作成するので、行列演算手法を用い
て類似性検索結果に基づいて簡易かつ精緻に確信度を計
算することができるようになる。
【0029】また、請求項6に記載の蛋白質構造予測方
法は、請求項4または5に記載の蛋白質構造予測方法に
おいて、最大の上記確信度を持つ上記断片構造にて決定
された初期全体構造について所定の最適化を行う全体構
造最適化ステップをさらに含むことを特徴とする。
【0030】この方法によれば、最大の確信度を持つ断
片構造にて決定された初期全体構造について所定の最適
化を行うので、まず、初期構造を作成する際に様々な可
能な断片配列に分割しそれらの最適な予測結果を統合す
ることができるようになる。また、初期構造をさらに最
適化を行うことにより、全体構造予測の精度をさらに上
げることができるようになる。
【0031】また、本発明はプログラムに関するもので
あり、請求項7に記載のプログラムは、蛋白質の配列情
報および立体構造情報に基づいて、配列情報を所定の長
さに分割した断片配列とそれに対応する断片構造とを作
成し、当該断片構造の類似度に基づいて断片構造クラス
ターを作成する断片構造クラスター作成ステップと、上
記断片配列について配列空間上における周囲の上記断片
配列と配列類似性検索を行う断片配列類似性検索ステッ
プと、上記断片配列の類似配列が上記断片構造クラスタ
ーに属する確率である確信度を、上記断片配列と上記構
造クラスターとの行列で表示する確信度マトリックスを
作成する確信度マトリックス作成ステップと、利用者に
問合せ配列を入力させる問合せ配列入力ステップと、上
記問合せ配列入力ステップにて入力された上記問合せ配
列を所定の長さに分割して問合せ断片配列を作成する問
合せ断片配列作成ステップと、上記問合せ断片配列作成
ステップにて作成された上記問合せ断片配列について、
上記断片配列と配列類似性検索を行う問合せ断片配列類
似性検索ステップと、上記確信度マトリックス作成ステ
ップにて作成した上記確信度マトリックスと、上記問合
せ断片配列類似性検索ステップの検索結果とに基づい
て、上記問合せ断片配列が上記断片構造クラスターに属
する確率を計算する断片構造確率計算ステップと、上記
断片構造確率計算ステップにて計算された上記確率に基
づいて、上記問合せ配列の上記断片構造を予測する断片
配列構造予測ステップとを含む蛋白質構造予測プログラ
ムをコンピュータに実行させることを特徴とする。
【0032】このプログラムによれば、蛋白質の配列情
報および立体構造情報に基づいて、配列情報を所定の長
さに分割した断片配列とそれに対応する断片構造とを作
成し、当該断片構造の類似度に基づいて断片構造クラス
ターを作成し、断片配列について配列空間上における周
囲の断片配列と配列類似性検索を行い、断片配列の類似
配列が断片構造クラスターに属する確率である確信度
を、断片配列と構造クラスターとの行列で表示する確信
度マトリックスを作成する。そして、利用者に問合せ配
列を入力させ、入力された問合せ配列を所定の長さに分
割して問合せ断片配列を作成し、作成された問合せ断片
配列について、断片配列と配列類似性検索を行い、作成
した確信度マトリックスと検索結果とに基づいて、問合
せ断片配列が断片構造クラスターに属する確率を計算
し、計算された確率に基づいて、問合せ配列の断片構造
を予測するので、相関の複雑な多様体や相関の確信度を
も表現可能なように、部分配列から部分構造の相関を計
算し、その部分構造を予測することができるようにな
る。すなわち、本発明は、構造を計算する際、相関の度
合に応じて複数の構造候補の確率(確信度)を与えて持
たせておく(確信度の関数を構造変化の確率として用い
る)ことができる。
【0033】また、蛋白質立体構造を相関の大きな部分
構造のブロックとして考える手法は以前からあるが、本
プログラムではまず部分構造のクラスターを作り、構造
配列相関多様体の複雑な形を考慮して、問合せ(que
ry)配列が与えられた後に動的に配列相関クラスター
を作ることができる。
【0034】また、本プログラムは、構造クラスターを
違う観点から(例えば、断片配列の長さ、断片構造の解
像度、構造クラスターの大きさ、相関の度合い等)いく
つも作り、それぞれのデータセットからの構造予測結果
を統合して構造を計算することができるようになる。
【0035】また、請求項8に記載のプログラムは、請
求項7に記載のプログラムにおいて、上記断片配列類似
性検索ステップにより上記断片配列に関して類似性検索
をした結果を、断片配列の行列で表示した類似性マトリ
ックスを作成する類似性マトリックス作成ステップと、
上記断片配列がどの上記断片構造クラスターに属してい
るかを示す構造クラスター情報を、上記断片配列と上記
構造クラスターの行列で表示した構造クラスター情報マ
トリックスを作成する構造クラスター情報マトリックス
作成ステップとをさらに含み、上記確信度マトリックス
作成ステップは、上記類似性マトリックス作成ステップ
にて作成した上記類似性マトリックスと、上記構造クラ
スター情報マトリックス作成ステップにて作成した上記
構造クラスター情報マトリックスとに基づいて、上記確
信度マトリックスを作成することを特徴とする。
【0036】これは確信度マトリックスの作成の一例を
一層具体的に示すものである。このプログラムによれ
ば、断片配列に関して類似性検索をした結果を、断片配
列の行列で表示した類似性マトリックスを作成する類似
性マトリックス作成ステップと、断片配列がどの断片構
造クラスターに属しているかを示す構造クラスター情報
を、断片配列と構造クラスターの行列で表示した構造ク
ラスター情報マトリックスを作成し、作成した類似性マ
トリックスと構造クラスター情報マトリックスとに基づ
いて、確信度マトリックスを作成するので、行列演算手
法を用いて類似性検索結果に基づいて簡易かつ精緻に確
信度を計算することができるようになる。
【0037】また、請求項9に記載のプログラムは、請
求項7または8に記載のプログラムにおいて、最大の上
記確信度を持つ上記断片構造にて決定された初期全体構
造について所定の最適化を行う全体構造最適化ステップ
をさらに含むことを特徴とする。
【0038】このプログラムによれば、最大の確信度を
持つ断片構造にて決定された初期全体構造について所定
の最適化を行うので、まず、初期構造を作成する際に様
々な可能な断片配列に分割しそれらの最適な予測結果を
統合することができるようになる。また、初期構造をさ
らに最適化を行うことにより、全体構造予測の精度をさ
らに上げることができるようになる。
【0039】また、本発明は記録媒体に関するものであ
り、請求項10に記載の記録媒体は、上記請求項7から
9のいずれか一つに記載されたプログラムを記録したこ
とを特徴とする。
【0040】この記録媒体によれば、当該記録媒体に記
録されたプログラムをコンピュータに読み取らせて実行
することによって、請求項7から9のいずれか一つに記
載されたプログラムをコンピュータを利用して実現する
ことができ、これら各プログラムと同様の効果を得るこ
とができる。
【0041】
【発明の実施の形態】以下に、本発明にかかる蛋白質構
造予測装置、蛋白質構造予測方法、プログラム、およ
び、記録媒体の実施の形態を図面に基づいて詳細に説明
する。なお、この実施の形態によりこの発明が限定され
るものではない。
【0042】[本発明の概要]以下、本発明の概要につ
いて説明し、その後、本発明の構成および処理等につい
て詳細に説明する。図3は本発明の基本原理を示す概念
図である。本発明は、概略的に、以下の基本的特徴を有
する。すなわち、本発明は、相関の複雑な多様体を表現
し、相関の大きさの度合い(確信度)をも計算すること
ができる、部分配列から部分構造への相関の新しい計算
手法を提案する。
【0043】本発明は、まず様々なデータセットから様
々な大きさの構造クラスターを作り、その中から配列の
類似性データを取り出す。そして、利用者から問合せ
(query)配列が与えられた後に、様々な部分配列
への分割に対して様々な大きさの構造クラスターを用い
て、疑似的に動的な配列から構造への相関クラスターを
作成して、部分配列との相関の大きさを計算する。その
相関クラスターから、部分構造の予測を行う。
【0044】本発明におけるクラスター作成過程を以下
に説明する。まず、本発明は、配列断片の構造分類を行
う。すなわち、既知の蛋白質構造データベースなどに格
納された配列情報および構造情報に基づいて、典型的な
断片構造を抽出し、それらの断片構造を分類する。
【0045】そして、図3(a)に示すように、ある断
片配列の配列空間における周辺がどのような構造をとっ
ているかをみる。そして、図3(b)に示すように、そ
れぞれの断片配列の周りでどのような典型構造が得られ
るかをみることにより、配列−構造間の仮想的なクラス
ターを作成することができる。すなわち、本発明は、あ
る配列Aの周りに存在するこの配列に似ている配列が、
構造空間上でどの構造クラスターに属するか(どのよう
な似方をしていれば、どの構造クラスターに属するか)
を計算し、この配列の周りに仮想的なクラスターを作成
する。そして、本発明は、ある未知構造配列断片Xが与
えられたとき、これが配列Aに似ている、配列Cに似て
いるなどの情報を取得し、これらの情報に基づいて仮想
クラスターを組み合わせて、最終的に配列がどの構造ク
ラスターに属するかを予測する。
【0046】本発明の全体構造の予測は、次の手順で行
う。まず、得られた部分構造の候補から、相関の強さの
度合い(確信度)を比較し、相関の強く、部分配列の長
い部分構造を用いて行う。相関の弱い部分構造も、確率
と共にデータとして保持しておく。そして、保持したデ
ータを用いて、これを次の構造の候補として構造を変化
させていくことによりフォールディング・シミュレーシ
ョン(foldingsimulation)を行う。
そして、構造のトポロジーが完成したら全原子系での構
造精密化(最適化)を行う。
【0047】[システム構成]まず、本システムの構成
について説明する。図4は、本発明が適用される本シス
テムの構成の一例を示すブロック図であり、該構成のう
ち本発明に関係する部分のみを概念的に示している。本
システムは、概略的に、蛋白質構造予測装置100と、
蛋白質構造情報等に関する外部データベースやホモロジ
ー検索等の外部プログラム等を提供する外部システム2
00とを、ネットワーク300を介して通信可能に接続
して構成されている。
【0048】図4においてネットワーク300は、蛋白
質構造予測装置100と外部システム200とを相互に
接続する機能を有し、例えば、インターネット等であ
る。
【0049】図4において外部システム200は、ネッ
トワーク300を介して、蛋白質構造予測装置100と
相互に接続され、利用者に対して蛋白質構造情報等に関
する外部データベースやホモロジー検索等の外部分析プ
ログラムを実行するウェブサイトを提供する機能を有す
る。
【0050】ここで、外部システム200は、WEBサ
ーバやASPサーバ等として構成してもよく、そのハー
ドウェア構成は、一般に市販されるワークステーショ
ン、パーソナルコンピュータ等の情報処理装置およびそ
の付属装置により構成してもよい。また、外部システム
200の各機能は、外部システム200のハードウェア
構成中のCPU、ディスク装置、メモリ装置、入力装
置、出力装置、通信制御装置等およびそれらを制御する
プログラム等により実現される。
【0051】図4において蛋白質構造予測装置100
は、概略的に、蛋白質構造予測装置100の全体を統括
的に制御するCPU等の制御部102、通信回線等に接
続されるルータ等の通信装置(図示せず)に接続される
通信制御インターフェース部104、入力装置112や
出力装置114に接続される入出力制御インターフェー
ス部108、および、各種のデータベースやテーブル
(蛋白質構造データベース106a〜確信度マトリック
ス106d)を格納する記憶部106を備えて構成され
ており、これら各部は任意の通信路を介して通信可能に
接続されている。さらに、この蛋白質構造予測装置10
0は、ルータ等の通信装置および専用線等の有線または
無線の通信回線を介して、ネットワーク300に通信可
能に接続されている。
【0052】記憶部106に格納される各種のデータベ
ースやテーブル(蛋白質構造データベース106a〜確
信度マトリックス106d)は、固定ディスク装置等の
ストレージ手段であり、各種処理に用いる各種のプログ
ラムやテーブルやファイルやデータベースやウェブペー
ジ用ファイル等を格納する。
【0053】これら記憶部106の各構成要素のうち、
蛋白質構造データベース106aは、アミノ酸配列情報
(1次構造)と立体構造情報とを対応付けて記録した蛋
白質構造情報を格納したデータベースである。蛋白質構
造データベース106aは、配列冗長性を排除したもの
であるものが好ましい。蛋白質構造データベース106
aは、インターネットを経由してアクセスする外部の蛋
白質構造データベース(例えば、PDB_SELECT
等)であってもよく、また、これらのデータベースをコ
ピーしたり、オリジナルの蛋白質構造を格納したり、さ
らに独自のアノテーション情報等を付加したりして作成
したインハウスデータベースであってもよい。
【0054】また、類似性マトリックス106bは、断
片配列に関する類似性検索結果に関する情報等を格納す
るマトリックステーブルである。
【0055】また、構造クラスター情報マトリックス1
06cは、断片配列がどの断片構造クラスターに属して
いるかを示す情報等を格納するマトリックステーブルで
ある。
【0056】また、確信度マトリックス106dは、あ
る断片配列が他の断片配列に似ているという情報が得ら
れたとき、その断片配列が断片構造に属する確信度(確
率)を表す情報等を格納するマトリックステーブルであ
る。
【0057】また、図4において、制御部102は、O
S(Operating System)等の制御プロ
グラム、各種の処理手順等を規定したプログラム、およ
び所要データを格納するための内部メモリを有し、これ
らのプログラム等により、種々の処理を実行するための
情報処理を行う。制御部102は、機能概念的に、断片
構造クラスター作成部102a、断片配列類似性検索部
102b、類似性マトリックス作成部102c、構造ク
ラスター情報マトリックス作成部102d、確信度マト
リックス作成部102e、問合せ配列入力部102f、
問合せ断片配列作成部102g、問合せ断片配列類似性
検索部102h、断片構造確率計算部102i、断片配
列構造予測部102j、および、全体構造最適化部10
2kを備えて構成されている。
【0058】このうち、断片構造クラスター作成部10
2aは、蛋白質の配列情報および立体構造情報に基づい
て、配列情報を所定の長さに分割した断片配列とそれに
対応する断片構造とを作成し、当該断片構造の類似度に
基づいて断片構造クラスターを作成する断片構造クラス
ター作成手段である。また、断片配列類似性検索部10
2bは、断片配列について配列空間上における周囲の断
片配列と配列類似性検索を行う断片配列類似性検索手段
である。また、類似性マトリックス作成部102cは、
断片配列類似性検索手段により断片配列に関して類似性
検索をした結果を、断片配列の行列で表示した類似性マ
トリックスを作成する類似性マトリックス作成手段であ
る。
【0059】また、構造クラスター情報マトリックス作
成部102dは、断片配列がどの断片構造クラスターに
属しているかを示す構造クラスター情報を、断片配列と
上記構造クラスターの行列で表示した構造クラスター情
報マトリックスを作成する構造クラスター情報マトリッ
クス作成手段である。また、確信度マトリックス作成部
102eは、断片配列の類似配列が断片構造クラスター
に属する確率である確信度を、断片配列と構造クラスタ
ーとの行列で表示する確信度マトリックスを作成する確
信度マトリックス作成手段である。
【0060】また、問合せ配列入力部102fは、利用
者に問合せ配列を入力させる問合せ配列入力手段であ
る。また、問合せ断片配列作成部102gは、問合せ配
列入力手段にて入力された問合せ配列を所定の長さに分
割して問合せ断片配列を作成する問合せ断片配列作成手
段である。また、問合せ断片配列類似性検索部102h
は、問合せ断片配列作成手段にて作成された問合せ断片
配列について、断片配列と配列類似性検索を行う問合せ
断片配列類似性検索手段である。また、断片構造確率計
算部102iは、確信度マトリックス作成手段にて作成
した確信度マトリックスと、問合せ断片配列類似性検索
手段の検索結果とに基づいて、問合せ断片配列が断片構
造クラスターに属する確率を計算する断片構造確率計算
手段である。
【0061】また、断片配列構造予測部102jは、断
片構造確率計算手段にて計算された確率に基づいて、問
合せ配列の断片構造を予測する断片配列構造予測手段で
ある。また、全体構造最適化部102kは、最大の確信
度を持つ断片構造にて決定された初期全体構造について
所定の最適化を行う全体構造最適化手段である。なお、
これら各部によって行なわれる処理の詳細については、
後述する。
【0062】[システムの処理]次に、このように構成
された本実施の形態における本システムの処理の一例に
ついて、以下に図5〜図15を参照して詳細に説明す
る。
【0063】[断片構造予測処理]次に、断片構造予測
処理の詳細について図5〜図14を参照して説明する。
図5は、本実施の形態における本システムの断片構造予
測処理の一例を示すフローチャートである。
【0064】まず、蛋白質構造予測装置100は、断片
構造クラスター作成部102aの処理により、蛋白質構
造データベース106aにアクセスして、蛋白質の配列
情報(例えば、アミノ酸配列情報など)および立体構造
情報を取得し、配列情報を所定の長さに分割した断片配
列とそれに対応する断片構造とを生成する(ステップS
A−1)。ここで、図6は、断片構造クラスター作成部
102aが蛋白質構造データベース106aから断片配
列とそれに対応する断片構造とを取得する場合の一例を
示す概念図である。図6に示すように、断片構造クラス
ター作成部102aは、所定の長さの断片配列(図6に
おいては7アミノ酸残基)毎に配列を分割し、その断片
配列が取る断片構造と対応付けて記憶部106に格納す
る。ここで、断片の長さは、7残基に限らず、様々な長
さで断片構造を分割することができる。
【0065】ついで、蛋白質構造予測装置100は、断
片構造クラスター作成部102aの処理により、断片構
造の類似度に基づいて断片構造クラスターを作成する
(ステップSA−2)。ここで、図7は、断片構造クラ
スター作成部102aが作成する断片配列の断片構造ク
ラスターの一例を示す図である。図7に示すように、断
片構造クラスター作成部102aは、断片構造の類似度
(例えば、rmsdやdmeなど)を類似度の指標とし
て、自己組織化マップ(SOM;self organ
ized map)、k−平均法(k−means)、
階層的クラスタリングなどの既知のクラスタリング手法
を用いてクラスター化する。
【0066】また、図8は、階層的クラスター手法を用
いて断片構造クラスターを作成する場合の一例を示す図
である。図8に示すように、断片構造クラスター作成部
102aは、全ての断片構造の距離を計算し、一番距離
の近いものを順次まとめていくことによりクラスター化
を行っている。ここで、クラスター間の距離は、例え
ば、それぞれのクラスターに属するもの全ての距離を計
算して平均をとる等により計算する。
【0067】ついで、蛋白質構造予測装置100は、断
片配列類似性検索部102bの処理により、全ての断片
配列について配列空間上における周囲の断片配列とbl
ast検索等の既存の配列類似性検索手法により、類似
の断片配列、類似度スコア、その断片配列が属する断片
構造クラスターを取得する(ステップSA−3)。ここ
で、図9は、断片配列Aについて、その類似の断片配列
(D、F、G、S、I等)と、類似度スコア(50、3
0、28、25、20等)と、その断片配列が属する断
片構造クラスター(α、α、β、α、γ等)を検索した
場合を示す概念図である。
【0068】ついで、蛋白質構造予測装置100は、類
似性マトリックス作成部102cの処理により、断片配
列に関して類似性検索をした結果を、断片配列の行列で
表示した類似性マトリックス106bを作成する(ステ
ップSA−4)。ここで、図10は、類似性マトリック
ス106bに格納される情報の一例を示す図である。図
10に示すように、類似性マトリックス106bには、
各断片配列に関して類似性検索を実行した結果を格納す
る。
【0069】ついで、蛋白質構造予測装置100は、構
造クラスター情報マトリックス作成部102dの処理に
より、断片配列がどの断片構造クラスターに属している
かを示す構造クラスター情報マトリックス106cを作
成する(ステップSA−5)。図11は、構造クラスタ
ー情報マトリックス106cに格納される情報の一例を
示す図である。図11に示すように、断片配列が属する
断片構造クラスターに「1」の構造クラスター情報が設
定されている。
【0070】ついで、蛋白質構造予測装置100は、確
信度マトリックス作成部102eの処理により、ある断
片配列が他の断片配列と類似しているという情報が得ら
れたときに、その断片配列が他の断片配列の構造クラス
ターに属する確率である確信度を示す確信度マトリック
ス106dを作成する(ステップSA−6)。ここで、
図12は、確信度マトリックス作成部102eが類似性
マトリックス106bおよび構造クラスター情報マトリ
ックス106cに基づいて確信度マトリックス106d
を作成することを示す概念図である。図12に示すよう
に、確信度マトリックス作成部102eは、規格化した
類似性マトリックス106bと構造クラスター情報マト
リックス106cの積をとることにより確信度マトリッ
クス106dを作成する。
【0071】ついで、蛋白質構造予測装置100は、問
合せ配列入力部102fの処理により、利用者に問合せ
(query)配列を入力させる(ステップSA−
7)。この配列の入力は、外部のアミノ酸配列を格納し
たデータベースから所望の配列を利用者に選択させるこ
とにより入力してもよく、また、所望の配列を利用者が
直接入力してもよい。
【0072】ついで、蛋白質構造予測装置100は、問
合せ断片配列作成部102gの処理により、問合せ配列
について所定の長さの断片配列(例えば7アミノ酸残
基)に分割し、その断片配列(問合せ断片配列)を記憶
部106に格納する(ステップSA−8)。ここで、断
片の長さは、7残基に限らず、様々な長さで断片構造を
分割してもよい。
【0073】ついで、蛋白質構造予測装置100は、問
合せ断片配列類似性検索部102hの処理により、問合
せ配列の各断片配列(問合せ断片配列)について配列類
似性を検索し(ステップSA−9)、その検索結果に基
づいて、断片構造確率計算部102iの処理により、断
片配列が属する断片構造の確率を計算する(ステップS
A−10)。ここで、図13は、問合せ配列(問合せ断
片配列)Xについて類似性検索を行い、その検索結果に
確信度マトリックス106dを掛け合わせて属する断片
構造の確率を計算する場合の一例を示す概念図である。
図13に示すように、問合せ配列Xの規格化された類似
度ベクトルに確信度マトリックス106dを掛け合わせ
ることにより、問合せ配列Xが各断片構造クラスターに
属する確率(確信度)を計算することができる。
【0074】ついで、蛋白質構造予測装置100は、断
片配列構造予測部102jの処理により、この計算され
た確率(確信度)に基づいて問合せ配列の断片構造を予
測する(ステップSA−11)。ここで、図14は、断
片配列構造予測部102jによる断片構造予測の一例を
示す概念図である。図14に示すように、断片配列構造
予測部102jは、問合せ配列Xの類似配列の属する構
造クラスターの確信度に従ってソートすることにより、
その問合せ断片配列Xが断片構造αに属すると予想す
る。これにて、断片構造予測処理が終了する。
【0075】[全体構造予測処理]次に、全体構造予測
処理の詳細について図15を参照して説明する。図15
は、本実施形態における本システムの全体構造予測処理
の一例を示すフローチャートである。
【0076】まず、利用者が問合せ(query)配列
を入力する(ステップSB−1)。
【0077】そして、蛋白質構造予測装置100は、問
合せ断片配列作成部102gの処理により、問合せ(q
uery)配列を所定の長さの断片配列に分割する(ス
テップSB−2)。ここで、異なる長さで分割した複数
のパターンの断片配列を作成する(図15では2つのパ
ターンを作成している)。
【0078】そして、蛋白質構造予測装置100は、上
述の方法により、断片構造を予測する(ステップSB−
3)。
【0079】そして、蛋白質構造予測装置100は、断
片配列構造予測部102jの処理により、最大の確信度
を持つ断片構造により初期の全体構造を作成する(ステ
ップSB−4)。
【0080】そして、蛋白質構造予測装置100は、全
体構造最適化部102kの処理により、統計的ポテンシ
ャル法や、MC法や、シミュレーテッド・アニーリング
(SA)などを用いて、全体構造について最適化を行う
(ステップSB−5)。
【0081】ここで、最適化の一例を以下に説明する。 (1)全体構造のエネルギー値(Eold)を計算する。
【0082】(2)継ぎ目の部分については、ランダム
に二面角を動かし、動かした後のエネルギー値
(Enew)を計算し、動かした二面角が次のステップで
採用される確率ρを、 ρ=exp(−βΔE) (ここで、ΔE= Enew − Eold )により計算す
る。
【0083】(3)断片構造については、予測された断
片構造の中からランダムに選んで構造を入れ替え、入れ
替えた後の確信度(Pnew)のエネルギー値(Enew)を
計算し、入れ替えた後の断片構造が次のステップで採用
される確率ρを、 ρ=Pnew exp(−βEnew) / Pold exp
(−βEold) により計算する。
【0084】そして、(1)から(3)を繰返すことに
より最適化を行う。これにて、全体構造予測処理が終了
する。
【0085】[他の実施の形態]さて、これまで本発明
の実施の形態について説明したが、本発明は、上述した
実施の形態以外にも、上記特許請求の範囲に記載した技
術的思想の範囲内において種々の異なる実施の形態にて
実施されてよいものである。
【0086】例えば、蛋白質構造予測装置100がスタ
ンドアローンの形態で処理を行う場合を一例に説明した
が、蛋白質構造予測装置100とは別筐体で構成される
クライアント端末からの要求に応じて処理を行い、その
処理結果を当該クライアント端末に返却するように構成
してもよい。
【0087】また、実施の形態において説明した各処理
のうち、自動的に行なわれるものとして説明した処理の
全部または一部を手動的に行うこともでき、あるいは、
手動的に行なわれるものとして説明した処理の全部また
は一部を公知の方法で自動的に行うこともできる。この
他、上記文書中や図面中で示した処理手順、制御手順、
具体的名称、各種の登録データや検索条件等のパラメー
タを含む情報、画面例、データベース構成については、
特記する場合を除いて任意に変更することができる。
【0088】また、蛋白質構造予測装置100に関し
て、図示の各構成要素は機能概念的なものであり、必ず
しも物理的に図示の如く構成されていることを要しな
い。例えば、蛋白質構造予測装置100の各部(各装
置)が備える処理機能、特に制御部にて行なわれる各処
理機能については、その全部または任意の一部を、CP
U(Central Processing Uni
t)および当該CPUにて解釈実行されるプログラムに
て実現することができ、あるいは、ワイヤードロジック
によるハードウェアとして実現することも可能である。
なお、プログラムは、後述する記録媒体に記録されてお
り、必要に応じて蛋白質構造予測装置100に機械的に
読み取られる。すなわち、ROMまたはHDなどの記憶
部106などには、OS(Operating Sys
tem)と協働してCPUに命令を与え、各種処理を行
うためのコンピュータプログラムが記録されている。こ
のコンピュータプログラムは、RAMにロードされるこ
とによって実行され、CPUと協働して制御部を構成す
る。
【0089】しかしながら、このコンピュータプログラ
ムは、蛋白質構造予測装置100に対して任意のネット
ワークを介して接続されたアプリケーションプログラム
サーバに記録されてもよく、必要に応じてその全部また
は一部をダウンロードすることも可能である。
【0090】また、本発明にかかるプログラムを、コン
ピュータ読み取り可能な記録媒体に格納することもでき
る。ここで、この「記録媒体」とは、フレキシブルディ
スク、光磁気ディスク、ROM、EPROM、EEPR
OM、CD−ROM、MO、DVD等の任意の「可搬用
の物理媒体」や、各種コンピュータシステムに内蔵され
るROM、RAM、HD等の任意の「固定用の物理媒
体」、あるいは、LAN、WAN、インターネットに代
表されるネットワークを介してプログラムを送信する場
合の通信回線や搬送波のように、短期にプログラムを保
持する「通信媒体」を含むものとする。
【0091】また、「プログラム」とは、任意の言語や
記述方法にて記述されたデータ処理方法であり、ソース
コードやバイナリコード等の形式を問わない。なお、
「プログラム」は必ずしも単一的に構成されるものに限
られず、複数のモジュールやライブラリとして分散構成
されるものや、OS(Operating Syste
m)に代表される別個のプログラムと協働してその機能
を達成するものをも含む。なお、実施の形態に示した各
装置において記録媒体を読み取るための具体的な構成、
読み取り手順、あるいは、読み取り後のインストール手
順等については、周知の構成や手順を用いることができ
る。
【0092】また、ネットワーク300は、蛋白質構造
予測装置100と外部システム200とを相互に接続す
る機能を有し、例えば、インターネットや、イントラネ
ットや、LAN(有線/無線の双方を含む)や、VAN
や、パソコン通信網や、公衆電話網(アナログ/デジタ
ルの双方を含む)や、専用回線網(アナログ/デジタル
の双方を含む)や、CATV網や、IMT2000方
式、GSM方式またはPDC/PDC―P方式等の携帯
回線交換網/携帯パケット交換網や、無線呼出網や、B
luetooth等の局所無線網や、PHS網や、C
S、BSまたはISDB等の衛星通信網等のうちいずれ
かを含んでもよい。すなわち、本システムは、有線・無
線を問わず任意のネットワークを介して、各種データを
送受信することができる。
【0093】記憶部106に格納される各種のデータベ
ース等(蛋白質構造データベース106a〜確信度マト
リックス106d)は、RAM、ROM等のメモリ装
置、ハードディスク等の固定ディスク装置、フレキシブ
ルディスク、光ディスク等のストレージ手段であり、各
種処理やウェブサイト提供に用いる各種のプログラムや
テーブルやファイルやデータベースやウェブページ用フ
ァイル等を格納する。
【0094】また、蛋白質構造予測装置100は、既知
のパーソナルコンピュータ、ワークステーション等の情
報処理端末等の情報処理装置にプリンタやモニタやイメ
ージスキャナ等の周辺装置を接続し、該情報処理装置に
本発明の方法を実現させるソフトウェア(プログラム、
データ等を含む)を実装することにより実現してもよ
い。
【0095】さらに、蛋白質構造予測装置100の分散
・統合の具体的形態は図示のものに限られず、その全部
または一部を、各種の負荷等に応じた任意の単位で、機
能的または物理的に分散・統合して構成することができ
る。例えば、各データベースを独立したデータベース装
置として独立に構成してもよく、また、処理の一部をC
GI(Common Gateway Interfa
ce)を用いて実現してもよい。
【0096】
【発明の効果】以上詳細に説明したように、本発明によ
れば、蛋白質の配列情報および立体構造情報に基づい
て、配列情報を所定の長さに分割した断片配列とそれに
対応する断片構造とを作成し、当該断片構造の類似度に
基づいて断片構造クラスターを作成し、断片配列につい
て配列空間上における周囲の断片配列と配列類似性検索
を行い、断片配列の類似配列が断片構造クラスターに属
する確率である確信度を、断片配列と構造クラスターと
の行列で表示する確信度マトリックスを作成する。そし
て、利用者に問合せ配列を入力させ、入力された問合せ
配列を所定の長さに分割して問合せ断片配列を作成し、
作成された問合せ断片配列について、断片配列と配列類
似性検索を行い、作成した確信度マトリックスと検索結
果とに基づいて、問合せ断片配列が断片構造クラスター
に属する確率を計算し、計算された確率に基づいて、問
合せ配列の断片構造を予測するので、相関の複雑な多様
体や相関の確信度をも表現可能なように、部分配列から
部分構造の相関を計算し、その部分構造を予測すること
ができるようになる。すなわち、本発明は、構造を計算
する際、相関の度合に応じて複数の構造候補の確率(確
信度)を与えて持たせておく(確信度の関数を構造変化
の確率として用いる)ことができる蛋白質構造予測装
置、蛋白質構造予測方法、プログラム、および、記録媒
体を提供することができる。
【0097】また、蛋白質立体構造を相関の大きな部分
構造のブロックとして考える手法は以前からあるが、本
装置ではまず部分構造のクラスターを作り、構造配列相
関多様体の複雑な形を考慮して、問合せ(query)
配列が与えられた後に動的に配列相関クラスターを作る
ことができる蛋白質構造予測装置、蛋白質構造予測方
法、プログラム、および、記録媒体を提供することがで
きる。
【0098】また、本発明によれば、構造クラスターを
違う観点から(例えば、断片配列の長さ、断片構造の解
像度、構造クラスターの大きさ、相関の度合い等)いく
つも作り、それぞれのデータセットからの構造予測結果
を統合して構造を計算することができる蛋白質構造予測
装置、蛋白質構造予測方法、プログラム、および、記録
媒体を提供することができる。
【0099】また、本発明によれば、断片配列に関して
類似性検索をした結果を、断片配列の行列で表示した類
似性マトリックスを作成する類似性マトリックス作成手
段と、断片配列がどの断片構造クラスターに属している
かを示す構造クラスター情報を、断片配列と構造クラス
ターの行列で表示した構造クラスター情報マトリックス
を作成し、作成した類似性マトリックスと構造クラスタ
ー情報マトリックスとに基づいて、確信度マトリックス
を作成するので、行列演算手法を用いて類似性検索結果
に基づいて簡易かつ精緻に確信度を計算することができ
る蛋白質構造予測装置、蛋白質構造予測方法、プログラ
ム、および、記録媒体を提供することができる。
【0100】さらに、本発明によれば、最大の確信度を
持つ断片構造にて決定された初期全体構造について所定
の最適化を行うので、まず、初期構造を作成する際に様
々な可能な断片配列に分割しそれらの最適な予測結果を
統合することができるようになる。また、初期構造をさ
らに最適化を行うことにより、全体構造予測の精度をさ
らに上げることができる蛋白質構造予測装置、蛋白質構
造予測方法、プログラム、および、記録媒体を提供する
ことができる。
【図面の簡単な説明】
【図1】従来技術により配列をプロファイルで表現した
場合の一例を示す図である。
【図2】従来技術による構造クラスター作成イメージを
示す図である。
【図3】本発明の基本原理を示す概念図である。
【図4】本発明が適用される本システムの構成の一例を
示すブロック図である。
【図5】本実施形態における本システムの断片構造予測
処理の一例を示すフローチャートである。
【図6】断片構造クラスター作成部102aが蛋白質構
造データベース106aから断片配列とそれに対応する
断片構造とを取得する場合の一例を示す概念図である。
【図7】断片構造クラスター作成部102aが作成する
断片配列の断片構造クラスターの一例を示す図である。
【図8】階層的クラスター手法を用いて断片構造クラス
ターを作成する場合の一例を示す図である。
【図9】断片配列Aについて、その類似の断片配列
(D、F、G、S、I等)と、類似度スコア(50、3
0、28、25、20等)と、その断片配列が属する断
片構造クラスター(α、α、β、α、γ等)を検索した
場合を示す概念図である。
【図10】類似性マトリックス106bに格納される情
報の一例を示す図である。
【図11】構造クラスター情報マトリックス106cに
格納される情報の一例を示す図である。
【図12】確信度マトリックス作成部102eが類似性
マトリックス106bおよび構造クラスター情報マトリ
ックス106cに基づいて確信度マトリックス106d
を作成することを示す概念図である。
【図13】問合せ配列(問合せ断片配列)Xについて類
似性検索を行い、その検索結果に確信度マトリックス1
06dを掛け合わせて属する断片構造の確率を計算する
場合の一例を示す概念図である。
【図14】断片配列構造予測部102jによる断片構造
予測の一例を示す概念図である。
【図15】本実施形態における本システムの全体構造予
測処理の一例を示すフローチャートである。
【符号の説明】
100 蛋白質構造予測装置 102 制御部 102a 断片構造クラスター作成部 102b 断片配列類似性検索部 102c 類似性マトリックス作成部 102d 構造クラスター情報マトリックス作成部 102e 確信度マトリックス作成部 102f 問合せ配列入力部 102g 問合せ断片配列作成部 102h 問合せ断片配列類似性検索部 102i 断片構造確率計算部 102j 断片配列構造予測部 102k 全体構造最適化部 104 通信制御インターフェース部 106 記憶部 106a 蛋白質構造データベース 106b 類似性マトリックス 106c 構造クラスター情報マトリックス 106d 確信度マトリックス 108 入出力制御インターフェース部 112 入力装置 114 出力装置 200 外部システム 300 ネットワーク

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 蛋白質の配列情報および立体構造情報に
    基づいて、配列情報を所定の長さに分割した断片配列と
    それに対応する断片構造とを作成し、当該断片構造の類
    似度に基づいて断片構造クラスターを作成する断片構造
    クラスター作成手段と、 上記断片配列について配列空間上における周囲の上記断
    片配列と配列類似性検索を行う断片配列類似性検索手段
    と、 上記断片配列の類似配列が上記断片構造クラスターに属
    する確率である確信度を、上記断片配列と上記構造クラ
    スターとの行列で表示する確信度マトリックスを作成す
    る確信度マトリックス作成手段と、 利用者に問合せ配列を入力させる問合せ配列入力手段
    と、 上記問合せ配列入力手段にて入力された上記問合せ配列
    を所定の長さに分割して問合せ断片配列を作成する問合
    せ断片配列作成手段と、 上記問合せ断片配列作成手段にて作成された上記問合せ
    断片配列について、上記断片配列と配列類似性検索を行
    う問合せ断片配列類似性検索手段と、 上記確信度マトリックス作成手段にて作成した上記確信
    度マトリックスと、上記問合せ断片配列類似性検索手段
    の検索結果とに基づいて、上記問合せ断片配列が上記断
    片構造クラスターに属する確率を計算する断片構造確率
    計算手段と、 上記断片構造確率計算手段にて計算された上記確率に基
    づいて、上記問合せ配列の上記断片構造を予測する断片
    配列構造予測手段と、 を備えたことを特徴とする蛋白質構造予測装置。
  2. 【請求項2】 上記断片配列類似性検索手段により上記
    断片配列に関して類似性検索をした結果を、断片配列の
    行列で表示した類似性マトリックスを作成する類似性マ
    トリックス作成手段と、 上記断片配列がどの上記断片構造クラスターに属してい
    るかを示す構造クラスター情報を、上記断片配列と上記
    構造クラスターの行列で表示した構造クラスター情報マ
    トリックスを作成する構造クラスター情報マトリックス
    作成手段と、 をさらに備え、 上記確信度マトリックス作成手段は、上記類似性マトリ
    ックス作成手段にて作成した上記類似性マトリックス
    と、上記構造クラスター情報マトリックス作成手段にて
    作成した上記構造クラスター情報マトリックスとに基づ
    いて、上記確信度マトリックスを作成する、 ことを特徴とする請求項1に記載の蛋白質構造予測装
    置。
  3. 【請求項3】 最大の上記確信度を持つ上記断片構造に
    て決定された初期全体構造について所定の最適化を行う
    全体構造最適化手段、 をさらに備えたことを特徴とする請求項1または2に記
    載の蛋白質構造予測装置。
  4. 【請求項4】 蛋白質の配列情報および立体構造情報に
    基づいて、配列情報を所定の長さに分割した断片配列と
    それに対応する断片構造とを作成し、当該断片構造の類
    似度に基づいて断片構造クラスターを作成する断片構造
    クラスター作成ステップと、 上記断片配列について配列空間上における周囲の上記断
    片配列と配列類似性検索を行う断片配列類似性検索ステ
    ップと、 上記断片配列の類似配列が上記断片構造クラスターに属
    する確率である確信度を、上記断片配列と上記構造クラ
    スターとの行列で表示する確信度マトリックスを作成す
    る確信度マトリックス作成ステップと、 利用者に問合せ配列を入力させる問合せ配列入力ステッ
    プと、 上記問合せ配列入力ステップにて入力された上記問合せ
    配列を所定の長さに分割して問合せ断片配列を作成する
    問合せ断片配列作成ステップと、 上記問合せ断片配列作成ステップにて作成された上記問
    合せ断片配列について、上記断片配列と配列類似性検索
    を行う問合せ断片配列類似性検索ステップと、 上記確信度マトリックス作成ステップにて作成した上記
    確信度マトリックスと、上記問合せ断片配列類似性検索
    ステップの検索結果とに基づいて、上記問合せ断片配列
    が上記断片構造クラスターに属する確率を計算する断片
    構造確率計算ステップと、 上記断片構造確率計算ステップにて計算された上記確率
    に基づいて、上記問合せ配列の上記断片構造を予測する
    断片配列構造予測ステップと、 を含むことを特徴とする蛋白質構造予測方法。
  5. 【請求項5】 上記断片配列類似性検索ステップにより
    上記断片配列に関して類似性検索をした結果を、断片配
    列の行列で表示した類似性マトリックスを作成する類似
    性マトリックス作成ステップと、 上記断片配列がどの上記断片構造クラスターに属してい
    るかを示す構造クラスター情報を、上記断片配列と上記
    構造クラスターの行列で表示した構造クラスター情報マ
    トリックスを作成する構造クラスター情報マトリックス
    作成ステップと、 をさらに含み、 上記確信度マトリックス作成ステップは、上記類似性マ
    トリックス作成ステップにて作成した上記類似性マトリ
    ックスと、上記構造クラスター情報マトリックス作成ス
    テップにて作成した上記構造クラスター情報マトリック
    スとに基づいて、上記確信度マトリックスを作成する、 ことを特徴とする請求項4に記載の蛋白質構造予測方
    法。
  6. 【請求項6】 最大の上記確信度を持つ上記断片構造に
    て決定された初期全体構造について所定の最適化を行う
    全体構造最適化ステップ、 をさらに含むことを特徴とする請求項4または5に記載
    の蛋白質構造予測方法。
  7. 【請求項7】 蛋白質の配列情報および立体構造情報に
    基づいて、配列情報を所定の長さに分割した断片配列と
    それに対応する断片構造とを作成し、当該断片構造の類
    似度に基づいて断片構造クラスターを作成する断片構造
    クラスター作成ステップと、 上記断片配列について配列空間上における周囲の上記断
    片配列と配列類似性検索を行う断片配列類似性検索ステ
    ップと、 上記断片配列の類似配列が上記断片構造クラスターに属
    する確率である確信度を、上記断片配列と上記構造クラ
    スターとの行列で表示する確信度マトリックスを作成す
    る確信度マトリックス作成ステップと、 利用者に問合せ配列を入力させる問合せ配列入力ステッ
    プと、 上記問合せ配列入力ステップにて入力された上記問合せ
    配列を所定の長さに分割して問合せ断片配列を作成する
    問合せ断片配列作成ステップと、 上記問合せ断片配列作成ステップにて作成された上記問
    合せ断片配列について、上記断片配列と配列類似性検索
    を行う問合せ断片配列類似性検索ステップと、 上記確信度マトリックス作成ステップにて作成した上記
    確信度マトリックスと、上記問合せ断片配列類似性検索
    ステップの検索結果とに基づいて、上記問合せ断片配列
    が上記断片構造クラスターに属する確率を計算する断片
    構造確率計算ステップと、 上記断片構造確率計算ステップにて計算された上記確率
    に基づいて、上記問合せ配列の上記断片構造を予測する
    断片配列構造予測ステップと、 を含む蛋白質構造予測方法をコンピュータに実行させる
    ことを特徴とするプログラム。
  8. 【請求項8】 上記断片配列類似性検索ステップにより
    上記断片配列に関して類似性検索をした結果を、断片配
    列の行列で表示した類似性マトリックスを作成する類似
    性マトリックス作成ステップと、 上記断片配列がどの上記断片構造クラスターに属してい
    るかを示す構造クラスター情報を、上記断片配列と上記
    構造クラスターの行列で表示した構造クラスター情報マ
    トリックスを作成する構造クラスター情報マトリックス
    作成ステップと、 をさらに含み、 上記確信度マトリックス作成ステップは、上記類似性マ
    トリックス作成ステップにて作成した上記類似性マトリ
    ックスと、上記構造クラスター情報マトリックス作成ス
    テップにて作成した上記構造クラスター情報マトリック
    スとに基づいて、上記確信度マトリックスを作成する、 ことを特徴とする請求項7に記載のプログラム。
  9. 【請求項9】 最大の上記確信度を持つ上記断片構造に
    て決定された初期全体構造について所定の最適化を行う
    全体構造最適化ステップ、 をさらに含むことを特徴とする請求項7または8に記載
    のプログラム。
  10. 【請求項10】 上記請求項7から9のいずれか一つに
    記載されたプログラムを記録したことを特徴とするコン
    ピュータ読み取り可能な記録媒体。
JP2001398569A 2001-12-27 2001-12-27 蛋白質構造予測装置、蛋白質構造予測方法、プログラム、および、記録媒体 Expired - Fee Related JP4084040B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2001398569A JP4084040B2 (ja) 2001-12-27 2001-12-27 蛋白質構造予測装置、蛋白質構造予測方法、プログラム、および、記録媒体
EP02792060A EP1460559A4 (en) 2001-12-27 2002-12-27 DEVICE FOR PREDICTING A PROTEIN STRUCTURE, METHOD FOR PREDICTING A PROTEIN STRUCTURE, PROGRAM AND RECORDING MEDIUM
PCT/JP2002/013832 WO2003056461A1 (fr) 2001-12-27 2002-12-27 Dispositif de prediction de structure proteique, procede de prediction de structure proteique, programme et support d'enregistrement associes
US10/846,622 US20050026217A1 (en) 2001-12-27 2004-05-17 Protein structure prediction device, protein structure prediction method, program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001398569A JP4084040B2 (ja) 2001-12-27 2001-12-27 蛋白質構造予測装置、蛋白質構造予測方法、プログラム、および、記録媒体

Publications (2)

Publication Number Publication Date
JP2003196575A true JP2003196575A (ja) 2003-07-11
JP4084040B2 JP4084040B2 (ja) 2008-04-30

Family

ID=19189362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001398569A Expired - Fee Related JP4084040B2 (ja) 2001-12-27 2001-12-27 蛋白質構造予測装置、蛋白質構造予測方法、プログラム、および、記録媒体

Country Status (4)

Country Link
US (1) US20050026217A1 (ja)
EP (1) EP1460559A4 (ja)
JP (1) JP4084040B2 (ja)
WO (1) WO2003056461A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017037377A (ja) * 2015-08-07 2017-02-16 富士通株式会社 情報処理装置、シミュレーション方法、およびシミュレーションプログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1796009A3 (en) * 2005-12-08 2007-08-22 Electronics and Telecommunications Research Institute System for and method of extracting and clustering information
EP2589653A1 (en) * 2010-07-02 2013-05-08 NEC Soft, Ltd. Prediction device, prediction method, program, and recording medium
CN104200130B (zh) * 2014-07-23 2017-08-11 浙江工业大学 一种基于树结构副本交换和片段组装的蛋白质结构预测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3012441B2 (ja) * 1993-10-01 2000-02-21 日本電気株式会社 タンパク質立体構造予測方法
JP3585613B2 (ja) * 1995-12-08 2004-11-04 富士通株式会社 蛋白質の二次構造予測方法及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017037377A (ja) * 2015-08-07 2017-02-16 富士通株式会社 情報処理装置、シミュレーション方法、およびシミュレーションプログラム

Also Published As

Publication number Publication date
WO2003056461A1 (fr) 2003-07-10
JP4084040B2 (ja) 2008-04-30
EP1460559A4 (en) 2007-01-24
US20050026217A1 (en) 2005-02-03
EP1460559A1 (en) 2004-09-22

Similar Documents

Publication Publication Date Title
Keller et al. Experimental protein mixture for validating tandem mass spectral analysis
de Brevern et al. Extension of a local backbone description using a structural alphabet: a new approach to the sequence‐structure relationship
Yang et al. Accurate disulfide-bonding network predictions improve ab initio structure prediction of cysteine-rich proteins
Selvitopi et al. Distributed many-to-many protein sequence alignment using sparse matrices
CA2942106A1 (en) Aligning and clustering sequence patterns to reveal classificatory functionality of sequences
Djeddi et al. A novel computational approach for global alignment for multiple biological networks
Zheng et al. Protein structure prediction constrained by solution X-ray scattering data and structural homology identification
Kandathil et al. Toward a detailed understanding of search trajectories in fragment assembly approaches to protein structure prediction
Nanni et al. Set of approaches based on 3D structure and position specific-scoring matrix for predicting DNA-binding proteins
Wong et al. Fast de novo discovery of low‐energy protein loop conformations
Peng et al. Modeling protein loops with knowledge-based prediction of sequence-structure alignment
Tao et al. Docking cyclic peptides formed by a disulfide bond through a hierarchical strategy
Xu et al. Protein threading by PROSPECT: a prediction experiment in CASP3
JP2003196575A (ja) 蛋白質構造予測装置、蛋白質構造予測方法、プログラム、および、記録媒体
Liu et al. TM-search: An efficient and effective tool for protein structure database search
Woo et al. MONACO: accurate biological network alignment through optimal neighborhood matching between focal nodes
Vesterstrøm et al. Flexible secondary structure based protein structure comparison applied to the detection of circular permutation
Moschopoulos et al. GIBA: a clustering tool for detecting protein complexes
He et al. Protein complexes identification with family-wise error rate control
CN115862742A (zh) 基于自注意力机制的双向肽段测序方法及应用
Sillitoe et al. Assessing strategies for improved superfamily recognition
JP2003242154A (ja) 遺伝子発現情報管理装置、遺伝子発現情報管理方法、プログラム、および、記録媒体
EP1460560A1 (en) Apparatus for predicting interaction site, method of predicting interaction site, program and recording medium
Can et al. Automated protein classification using consensus decision
JP2004295606A (ja) 遺伝子機能推定装置、遺伝子機能推定方法、および、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080214

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140222

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees