JPWO2010026738A1 - 酵素活性をコンピュータを用いたシミュレーションにより予測する方法 - Google Patents

酵素活性をコンピュータを用いたシミュレーションにより予測する方法 Download PDF

Info

Publication number
JPWO2010026738A1
JPWO2010026738A1 JP2010527692A JP2010527692A JPWO2010026738A1 JP WO2010026738 A1 JPWO2010026738 A1 JP WO2010026738A1 JP 2010527692 A JP2010527692 A JP 2010527692A JP 2010527692 A JP2010527692 A JP 2010527692A JP WO2010026738 A1 JPWO2010026738 A1 JP WO2010026738A1
Authority
JP
Japan
Prior art keywords
protein
substrate
docking
simulation
enzyme activity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010527692A
Other languages
English (en)
Other versions
JP5447383B2 (ja
Inventor
裕 高岡
裕 高岡
研爾 三浦
研爾 三浦
久英 西尾
久英 西尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe University NUC
Original Assignee
Kobe University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe University NUC filed Critical Kobe University NUC
Priority to JP2010527692A priority Critical patent/JP5447383B2/ja
Publication of JPWO2010026738A1 publication Critical patent/JPWO2010026738A1/ja
Application granted granted Critical
Publication of JP5447383B2 publication Critical patent/JP5447383B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment

Landscapes

  • Spectroscopy & Molecular Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本発明は、タンパク質を用いて実際に酵素活性を測定しなくても、タンパク質の立体構造に基づいて酵素活性を予測可能とすることを課題とする。かかる課題は、コンピュータによりタンパク質と基質とのドッキングシミュレーションを行い、かかるドッキングシミュレーションの結果を式1または3に代入して、タンパク質の酵素活性を予測することにより解決される。【選択図】図6

Description

本発明は、特定のタンパク質Aの酵素活性をコンピュータを用いたシミュレーションにより数式を用いて予測する方法に関する。また本発明は、かかる酵素活性予測方法を実行可能な記録媒体、および装置に関する。さらに、前記酵素活性予測方法、前記記録媒体、または装置を用いて予測された結果を用いた、酵素の基質適合性の判断方法、および、基質の生体への投与間隔等を評価する方法に関する。
本出願は、参照によりここに援用されるところの日本出願特願2008-228434号優先権を請求する。
近年、タンパク質の構造解析に、コンピュータを用いた構造シミュレーションが取り入れられるようになっている。タンパク質の3次元構造の決定などが、コンピュータを用いて行われており、X線結晶解析により決定された3次元構造データからなるデータベースや、ホモロジーモデリング等で決定した3次元構造データからなるデータベースが構築されている(非特許文献1)。タンパク質の3次元構造データは、これらのデータベースから容易に取得することができる。
タンパク質の3次元構造データを利用および解析して、タンパク質立体構造構築の原理や、タンパク質の作用メカニズムなどの研究が進んでいるところである。タンパク質の3次元構造データを利用した解析として、タンパク質と低分子化合物であるリガンドとのドッキングシミュレーションが挙げられる(非特許文献2)。これらのシミュレーションに関連するソフトウェア群は、複数開発されており、一般的に利用可能なレベルになっている(非特許文献2〜6)。その結果、容易にタンパク質構造シミュレーションを研究に用いることが可能になってきた。
ドッキングシミュレーションは、タンパク質とリガンドとの結合能の予測や、化合物ライブラリーから薬剤候補化合物を探索するスクリーニングなどに利用されている(特許文献1,2)。
タンパク質には生体内で種々の化学反応を触媒する酵素が含まれる。
生体内の酵素に、UDP−グルクロン酸転移酵素(EC 2.4.1.17)(以下「UGT」と称する)がある。UGTはグルクロン酸抱合を触媒する。グルクロン酸抱合により、内因性物質、生体外から投与された薬剤、食物中の化学物質、環境汚染物質などの排出パスウェイが提供されるため、UGTは一次代謝産物の排泄において重要な酵素である。UGTのうち、UGT1A1はビリルビンのグルクロン酸抱合に関与する主要な酵素であることが知られている。UGT1A1遺伝子に変異が生じた場合には、UGT1A1のビリルビンに対する酵素活性が消失または深刻に低下し、黄疸を主症状とするGilbert症候群やCrigler−Najjar症候群の原因となる。UGT1A1の変異型は多数あり、変異部位によって、ビリルビンに対する酵素活性のレベルが異なっている(非特許文献7,8)。また、同じ変異部位を持つ場合でも、変異型UGT1A1の抱合活性は、薬剤によって異なる。
UGT1A1にみられるように、タンパク質自体の構造や、触媒対象である基質に応じて、酵素の活性レベルは変化する。特定のタンパク質の特定の基質に対する酵素活性について情報を得たい場合は、組換えタンパク質を作製するなどして、実際に酵素活性を測定しなくてはならず、手間と時間がかかってしまうという問題がある。
特開2005-181104号公報 特開2007-272627号公報
Pieper U, Eswar N, Davis FP, Braberg H, Madhusudhan MS, Rossi A, Marti-Renom M, Karchin R, Webb BM, Eramian D, Shen MY, Kelly L, Melo F, Sali A: MODBASE: Nucleic Acids Research 2006, 1(34):D291-D295. Morris GM, Goodsell DS, Halliday RS, Huey R, Hart WE, Belew RK, Olson AJ: J Comput Chem 1998, 19:1639-1662. Guex N, Peitsch MC: SWISS-MODEL and the Swiss-PdbViewer: Electrophoresis 1997, 18:2714-2723. Ren P, Ponder JW: J Phys Chem B 2003, 107:5933-5947. DeLano, W.L. The PyMOL Molecular Graphics System. (2008) DeLano Scientific LLC, Palo Alto, CA, USA., インターネット<URL:http://www.pymol.org> Molecular Operating Environment (moe), version 2008.10. Chemical Computing Group, Inc. Montreal, Quebec, Canada, 2008, インターネット<URL:http://www.chemcomp.com> Udomuksorn W, Eliot DJ, Lewis BC, Mackenzie PI, Yoovathaworn K, Miners JO: Pharmacogenetics & Genomics 2007, 17(12):1017-1029. Yamamoto K, Sato H, Fujiwara Y, Doida Y, Bamba T: Biochimica et Biophysica Acta 1998, 1406:267-273.
本発明は、タンパク質を用いて実際に酵素活性を測定しなくても、タンパク質の立体構造データに基づいて酵素活性を予測可能とすることを課題とする。
本発明者らは上記課題を解決するために鋭意検討を重ね、コンピュータによりタンパク質と基質との分子シミュレーションを行い、なかでもドッキングシミュレーションの結果を数式を用いて解析することにより、タンパク質の酵素活性を予測することが可能であることを見出し、本発明を完成した。
すなわち、本発明は以下よりなる。
1.タンパク質Aの酵素活性をコンピュータを用いたシミュレーションにより予測する方法であって、
酵素活性がタンパク質Aへの基質の進入の向きにより規定されるようなタンパク質であり、
タンパク質Aの酵素活性fが以下の式1により算出される方法;
式中、gは基質ごとに固有の定数であり、Eはタンパク質Aと補酵素とのドッキングの酵素活性に対する寄与度であり、βはタンパク質への基質の進入の向きの酵素活性に対する寄与度であり、aは生体内環境による影響を表す定数であり、Nとnは、タンパク質Aと基質とのドッキングシミュレーションにより得られる値であり、Nはタンパク質Aと基質とのドッキングシミュレーションの総回数であり、Nは2以上であり、nは酵素反応を受け得る向きで基質がタンパク質Aに進入した回数である。
2.タンパク質Aの立体構造データが、タンパク質Aとは別のタンパク質Bの立体構造データに基づいて計算されるものであり、βが以下の式2によって算出される前項1に記載の方法:
式中、Nとnは、タンパク質Bと基質とのドッキングシミュレーションにより得られる値であり、Nはタンパク質Bと基質とのドッキングシミュレーションの総回数であり、Nは2以上であり、nは酵素反応を受け得る向きで基質がタンパク質Bに進入した回数である。
3.タンパク質Bの酵素活性に対するタンパク質Aの相対的な酵素活性をコンピュータを用いたシミュレーションにより予測する方法であって、
酵素活性がタンパク質Aへの基質の進入の向きにより規定されるようなタンパク質であり、
タンパク質Aの相対的な酵素活性f’が以下の式3により算出される方法;
式中、gは基質ごとに固有の定数であり、Eはタンパク質Aと補酵素とのドッキングの酵素活性に対する寄与度であり、aは生体内環境による影響を表す定数であり、βはタンパク質への基質の進入の向きの酵素活性に対する寄与度であり、次の式2により表され;
Nとnは、タンパク質Aと基質とのドッキングシミュレーションにより得られる値であり、Nはタンパク質Aと基質とのドッキングシミュレーションの総回数であり、Nは2以上であり、nは酵素反応を受け得る向きで基質がタンパク質Aに進入した回数であり、Nとnはタンパク質Bと基質とのドッキングシミュレーションにより得られる値であり、Nはタンパク質Bと基質とのドッキングシミュレーションの総回数であり、Nは2以上であり、nは酵素反応を受け得る向きで基質がタンパク質Bに進入した回数である。
4.Eが、下記の式16または式17により表される、前項1〜3のいずれか1に記載の方法:
(式16中、γはタンパク質への補酵素の進入の向きの酵素活性に対する寄与度であり、次の式21により表され、
Lとlは、タンパク質Aと補酵素とのドッキングシミュレーションにより得られる値であり、Lはタンパク質Aと補酵素とのドッキングシミュレーションの総回数であり、Lは2以上であり、lは酵素反応が進行し得る向きで補酵素がタンパク質Aに進入した回数であり、Lとlはタンパク質Bと補酵素とのドッキングシミュレーションにより得られる値であり、Lはタンパク質Bと補酵素とのドッキングシミュレーションの総回数であり、Lは2以上であり、lは酵素反応が進行し得る向きで補酵素がタンパク質Bに進入した回数である);
(式17中、mはタンパク質Aと補酵素とのドッキングモデルをクラスタリングして得られたクラスタ内のモデル数であり、mはタンパク質Bと補酵素とのドッキングモデルをクラスタリングして得られたクラスタ内のモデル数であり、δはクラスタ内のモデル数の酵素活性への寄与度を表す。)
5.式1または式3において、
について、Sigmoid関数を導入する、前項1〜4のいずれか1に記載の方法。
6.2以上のタンパク質Aについてドッキングシミュレーションを行い、
gとaが、ドッキングシミュレーションにより得られた計算値yと、測定された値y’との二乗誤差を最小にする値であり、下記の式4を用いて算出される、前項2〜5のいずれか1に記載の方法。
式中、yとy’はタンパク質Bについての値であり、yA1とy’A1、yApとy’Apはタンパク質Aについての値であり、pは2以上の数を表す。
7.タンパク質と基質とのドッキングシミュレーションが以下の工程を含む前項1〜6のいずれか1に記載の方法:
(a)タンパク質Bの立体構造データを入手し、タンパク質Aの立体構造データをタンパク質Bの立体構造データに基づいて計算し、
(b)タンパク質AまたはBと補酵素とのドッキングシミュレーションを行い、熱力学的に安定なドッキングモデルを決定し;
(c)タンパク質AまたはBと基質とのドッキングのグリッドを設定し;
(d)タンパク質Bと基質とのドッキングシミュレーションをN回行い、Nは2以上であり、酵素反応を受け得る向きで基質がタンパク質Bに進入した回数nを計数し、
(e)タンパク質Aと基質とのドッキングシミュレーションをN回行い、Nは2以上であり、酵素反応を受け得る向きで基質がタンパク質Aに進入した回数nを計数する。
8.工程(b)の後に次の工程(b−1)を行い;
工程(b−1)タンパク質AまたはBと補酵素とのドッキングモデルをクラスタリングし、クラスタリングして得られたクラスタ内の2以上のモデルについてinduced fitを行い、
工程(d)において、induced fit後の各モデルについて、基質とのドッキングシミュレーションを行う、
前項1〜7のいずれか1に記載の方法。
9.タンパク質Aが変異型タンパク質である前項1〜7のいずれか1に記載の方法。
10.タンパク質AがUDP−グルクロン酸転移酵素であり、補酵素がUDP−グルクロン酸である、前項4〜9のいずれか1に記載の方法。
11.タンパク質Aがgとaの算出のために用いた変異型タンパク質以外の変異型タンパク質であり、算出されたgとaの値を用いて酵素活性の予測を行う、前項6〜10のいずれか1に記載の方法。
12.前項1〜11のいずれか1に記載の方法を実行するために、コンピュータを下記の手段として機能させるプログラムを担持する記録媒体:
(1)入力されたアミノ酸配列情報に基づいて、タンパク質Aの立体構造データを計算する手段、
(2)タンパク質Aの立体構造データと、ドッキングシミュレーションの対象となる基質の立体構造データを記憶する手段、
(3)前記記憶された、タンパク質Aの立体構造データと基質の立体構造データを用いて、タンパク質Aと基質とのドッキングシミュレーションを行うシミュレーション手段、
(4)シミュレーションにより得られた結果を記憶する手段、
(5)記憶されたシミュレーション結果に基づいて、タンパク質Aの酵素活性を算出する手段、
(6)算出された酵素活性を表示する手段。
13.前項1〜11のいずれか1に記載の方法を実行するために、下記の手段を担持する装置;
(1)入力されたアミノ酸配列情報に基づいて、タンパク質Aの立体構造データを計算する手段、
(2)タンパク質Aの立体構造データと、ドッキングシミュレーションの対象となる基質の立体構造データを記憶する手段、
(3)前記記憶された、タンパク質Aの立体構造データと基質の立体構造データを用いて、タンパク質Aと基質とのドッキングシミュレーションを行うシミュレーション手段、
(4)シミュレーションにより得られた結果を記憶する手段、
(5)記憶されたシミュレーション結果に基づいて、タンパク質Aの酵素活性を算出する手段、
(6)算出された酵素活性を表示する手段。
14.前項1〜11のいずれか1に記載の方法、前項12に記載の記録媒体、または前項13に記載の装置を用いて、2以上の基質について、基質ごとのタンパク質Aの酵素活性を予測し、得られた2以上の予測結果に基づいて目的の基質を選択する、基質適合性の判定方法。
15.前記基質が生体に投与される薬剤であって、前項14に記載の方法を用いて、薬剤の投与量および/または投与間隔、投与頻度を評価する方法。
本発明によれば、実際にタンパク質を用いて酵素活性の測定をすることなく、タンパク質の立体構造データに基づいて酵素活性を予測することができる。例えば組換えタンパク質を作製し、実際に酵素活性の測定をする場合には、数週間の時間を要するが、本発明の方法を用いることにより、数時間で酵素活性の予測をすることが可能である。また、本発明により予測された酵素活性は、実際にタンパク質を用いて測定して得られた値と相関性が見られ、信頼性が高い。
コンピュータを用いて計算された各種UGT1A1の立体構造を示す。(実施例1) 各種UGT1A1とUDPGAとのドッキングモデルを示す。(実施例2) 各種UGT1A1とUDPGAとのドッキングにおけるドッキングエネルギーの分布を示す。(実施例2) 基質のUGT1A1への進入の2つの向きを示す。(実施例3) in vitro実験における変異型UGT1A1の抱合活性を示す。(実施例4) 変異型UGT1A1の抱合活性のin vitro測定値と、シミュレーションに基づく計算値との比較を示す。(実施例6) 野生型UGT1A1と34種の変異型UGT1A1の抱合活性のシミュレーションに基づく計算値を示す。(実施例6) UGT1A1とビリルビンとのドッキングシミュレーションのためのグリッドを示す(a:抱合反応空間の断面を表示した図、b:抱合反応空間の正面から見た図)。(実施例7) 変異型UGT1A1の抱合活性のin vitro測定値(文献報告)と、シミュレーションに基づく計算値との比較を示す。(実施例7) 変異型UGT1A1の抱合活性のin vivo測定値(文献報告)と、シミュレーションに基づく計算値との比較を示す。(実施例8) 変異型UGT1A1の抱合活性のin vitro測定値(文献報告)と、シミュレーションに基づく計算値との比較を示す。(実施例9) 変異型UGT1A1の抱合活性のin vivo測定値(文献報告)と、シミュレーションに基づく計算値との比較を示す。(実施例10) 変異型UGT1A1の抱合活性のin vivo測定値(文献報告)と、シミュレーションに基づく計算値との比較を示す。(実施例11) 水分子を付加して構造計算した各種UGT1A1とUDPGAとのドッキングシミュレーションにおけるドッキングエネルギーの分布を示す。(実施例12) 水分子を付加して構造計算した各種UGT1A1と基質とのドッキングシミュレーションの結果を示す。(実施例12) 水分子を付加して構造計算した各種UGT1A1と基質とのドッキングシミュレーションの結果と、各種UGT1A1の抱合活性のin vitro測定値との比較を示す。(実施例12) 水分子を付加して構造計算した変異型Arl6と、GTPγSもしくはGDPとのドッキングシミュレーションの結果を示す。(実施例12) induced fitを行った場合の、各種UGT1A1と基質とのドッキングシミュレーションの結果を示す。(実施例13) induced fitを行った場合の、各種UGT1A1と基質とのドッキングシミュレーションの結果と、各種UGT1A1の抱合活性のin vitro測定値との比較を示す。(実施例13) クラスタ内の全モデルに対してinduced fitを行った各種UGT1A1と基質とのドッキングシミュレーションの結果と、各種UGT1A1の抱合活性のin vitro測定値との比較を示す。(実施例13) 式10における項RにSigmoid関数を導入して算出した、各種UGT1A1の抱合活性の計算値と、各種UGT1A1の抱合活性のin vitro測定値との比較を示す。(実施例15) 式10における項RにSigmoid関数を導入して算出した、野生型UGT1A1と34種の変異型UGT1A1の抱合活性の計算値を示す。(実施例15) 各種UGT1A1の抱合活性のin vitro測定値と、シミュレーションに基づく計算値との比較を示す。(実施例16)
本発明は、特定のタンパク質Aの酵素活性をコンピュータを用いたシミュレーションにより予測する方法に関する。一般にタンパク質の酵素活性は、基質の種類に応じて違いがある。本発明においては、下記の式1を用いることにより、特定の基質に対する特定のタンパク質Aの酵素活性を予測することができ、基質、タンパク質Aともに、種々の種類を選択して組み合わせ、解析を行うことができる。
本発明において解析の対象となるタンパク質Aは、酵素活性がタンパク質Aへの基質の進入の向きにより規定されるようなタンパク質である。一般的にタンパク質の酵素活性のレベルは、タンパク質の量と、タンパク質の性質により規定される。生体内では、タンパク質の量はタンパク質の合成・分解のバランスにより制御され、タンパク質が他の生体分子と可逆的に作用したり、立体構造が変化することによりタンパク質の性質が変化する。本発明において予測される「酵素活性」は、タンパク質の立体構造に基づくタンパク質の性質(触媒能)であり、かかる立体構造に基づく触媒能は、補酵素とのドッキングエネルギー、補酵素のタンパク質への進入の向き、基質の進入口の断面の大きさ、基質とのドッキングエネルギー、基質と触媒部位との距離、基質のタンパク質への進入の向きなど、種々の要因により規定されると考えられる。これらの要因のうち、特に基質のタンパク質への進入の向きにより酵素活性(タンパク質の立体構造に基づく触媒能)が規定されるタンパク質について、式1を用いた本発明により酵素活性(タンパク質の立体構造に基づく触媒能)を予測することが可能である。
かかるタンパク質Aは、いかなる反応を触媒する酵素であってもよく、細胞膜や、細胞質内等のいかなる場所に存在する酵素であってもよい。タンパク質Aは、補酵素から基質への原子団の転移を触媒する転移酵素であることが好ましい。中でも、グリコシル基転移酵素が好ましく、グリコシル基転移酵素としては、例えばUDP−グルクロン酸転移酵素(以下「UGT」と称する)、ラクトースシンターゼ(lactose synthase)(EC 2.4.1.22)が挙げられる。UGTは配列相同性と遺伝子構造によってUGT1A、UGT2A、UGT2Bの3つのサブファミリーに区別される。サブファミリーUGT1Aは染色体2q37に位置し、9種類のアイソフォーム、UGT1A1、UGT1A3、UGT1A4、UGT1A5、UGT1A6、UGT1A7、UGT1A8、UGT1A9、UGT1A10が存在する。これらのアイソフォームは選択的スプライシングにより変化する最初のエキソンと、共通する4つのエキソンとからなる。9種類のアイソフォームの1種である、UGT1A1が本発明において解析されるタンパク質として特に好ましい。
本発明では、タンパク質Aと基質のドッキングシミュレーションをコンピュータ上で行うことが必須である。ドッキングシミュレーションに必要なタンパク質Aの立体構造データは、公知のデータベースからダウンロードするか、X線結晶構造解析、核磁気共鳴法などにより入手するか、または、公知のタンパク質Bの立体構造データに基づいて計算して入手することができる。公知のタンパク質Bの立体構造データは、公知のデータベースからダウンロードするか、X線結晶構造解析などにより入手することができる。
タンパク質Bは、タンパク質Aの立体構造データを計算するための基準となるタンパク質であり、タンパク質Aとは異なるタンパク質であるが、タンパク質Aと同様の触媒作用を有するものである。またタンパク質Bは、タンパク質Aと高いアミノ酸相同性(25〜30%以上、好ましくは40%以上)を有しており、かつタンパク質Aと構造類似性を有しているものが好ましい。
タンパク質Aは、基準となるタンパク質(タンパク質B)とアミノ酸配列が相違するものである。タンパク質Aとタンパク質Bの関係としては、例えば、変異型タンパク質と野生型タンパク質の関係や、互いにアイソフォームの関係などが挙げられる。さらに具体的には、変異型タンパク質と野生型タンパク質との関係では、タンパク質Aが変異型UGT1A1であり、タンパク質Bは野生型UGT1A1であり、アイソフォームの関係では、タンパク質AがUGT1A6であり、タンパク質BがUGT1A1である場合などが例示される。
タンパク質Aとタンパク質Bの関係が変異型タンパク質と野生型タンパク質である場合、タンパク質Aのアミノ酸配列は、タンパク質Bのアミノ酸配列においてアミノ酸が置換、欠失、挿入、および/または付加されているものである。置換、欠失、挿入、および/または付加されているアミノ酸の個数は1以上であればよい。また、変異型タンパク質には、現在同定されていないあらゆる変異部位を持つタンパク質が含まれる。現在同定されていない変異部位は、天然に存在する変異部位であってもよいし、天然には存在しない人工的な変異部位であってもよい。
タンパク質Aと基質のドッキングシミュレーションについて説明する。
まず、タンパク質Aの立体構造データを入手する。タンパク質Aの立体構造データは、公知のデータベースからダウンロードする、X線結晶構造解析、核磁気共鳴法などにより入手する、または、公知のタンパク質Bの立体構造データに基づいて計算して入手することができる。公知のタンパク質Bの立体構造データは、公知のデータベースからダウンロードする、または、X線結晶構造解析などにより入手することができる。データベースとしては、PDB(http://www.pdbj.org/)、MODBASE(http://modbase.compbio.ucsf.edu/modbase-cgi/index.cgi, Morris GM et al.: J Comput Chem 1998, 19:1639-1662)が例示される。
タンパク質Aの立体構造データは、自体公知の方法およびソフトウェアを用いて、公知のタンパク質Bの立体構造データに基づいて計算することが可能である。例えば、タンパク質Bの立体構造データを用いてホモロジーモデリングなどの手法を用いて計算すればよい。立体構造の計算に用いるソフトウェアとしては、公知のものを使用可能であり、今後開発されるものも使用可能である。以下に具体的に例示して、立体構造データの構築の方法を説明する。タンパク質Aが1アミノ酸置換の変異型UGT1A1であり、タンパク質Bが野生型UGT1A1である場合を例示する。
野生型UGT1A1の立体構造データを、MODBASE(accession number: Q5DT03)よりダウンロードする。ダウンロードした野生型UGT1A1の立体構造データに、PyMOLプログラム(http://pymol.sourceforge.net/, DeLano WL: DeLano Scientific, Palo alto, CA, USA; 2002)を用いて適切に水素原子を追加し、SWISS-PDBViewerプログラム(http://spdbv.vital-it.ch/, Guex N, Peitsch MC: Electrophoresis 1997, 18: 2714-2723)を用いて、変異型UGT1A1の立体構造データを作成する。例えば、公知の変異部位を持つ、G71R変異型UGT1A1(71番目のグリシンがアルギニンに置換)、F83L変異型UGT1A1(83番目のフェニルアラニンがロイシンに置換)、I322V変異型UGT1A1(322番目のイソロイシンがバリンに置換)などについて、立体構造データを作成することができる。TINKERパッケージ(Ren P, Ponder JW: J Phys Chem B 2003, 107:5933-5947)のminimizeプログラムとAMBER99力場パラメータによるエネルギー最小化計算を、RMS勾配が例えば0.3になるまで行い、各タンパク質の立体構造を計算する。力場等は、後の工程で用いるドッキングシミュレーションのソフトウェアに応じて適宜設定可能である。計算されたG71R変異型UGT1A1、F83L変異型UGT1A1、I322V変異型UGT1A1の三次元構造を図1に示す。
タンパク質Aの立体構造データを計算する際、UGT1A1の場合と同様に水分子を付加せずに計算をおこなってもよいが、水分子を付加して計算を行ってもよい。例えば、タンパク質Aが細胞膜に存在するタンパク質の場合は、水分子を付加せずに、上述の手法で計算することが好ましい。タンパク質Aが細胞質に存在するタンパク質の場合は、上述の手法に加えて、水分子を付加して立体構造データを計算することが好ましい。タンパク質Aの存在する箇所や、触媒反応の起こる部位などについて、疎水性度および親水性度を考慮することにより水分子付加の要否を決定して、立体構造データの計算を行うことが可能である。なお、タンパク質Aへの水分子の付加は、MOE(Chemical Computing Group Inc.)等のプログラムを用いて行うことができる。
次に、ドッキングプログラムにより、タンパク質Aの立体構造データを用いてドッキングシミュレーションを行う。基質や補酵素のデータは、既存のデータベース(例えば、ChemIDPlus(http://chem.sis.nlm.nih.gov/chemidplus/)など)からダウンロードすることができる。ドッキングシミュレーションに用いるソフトウェアとしては、公知のものや今後開発されるものを使用可能であり、Dock(http://dock.compbio.ucsf.edu/)、AutoDock(http://scripps.edu/mb/olson/doc/autodock/)、GOLD(http://ccdc.cam.ac.uk/products/life_sciences/gold/)、MOEなどが例示される。それぞれのソフトウェアの使用方法に従って、ドッキングシミュレーションを行えばよい。
タンパク質Aが補酵素を必要とする酵素(例えば転移酵素)である場合は、まず補酵素とタンパク質Aとのドッキングシミュレーションを行い、安定なドッキングモデルを決定する必要がある。基質とのドッキングシミュレーションには、補酵素とタンパク質Aとの安定なドッキングモデルを用いればよい。補酵素とタンパク質Aとの安定なドッキングモデルは、1つであっても複数であってもよい。1つの安定なドッキングモデルを用いる場合は、後述する手法にて最も安定なドッキングモデルを選択して用いることができる。複数の安定なドッキングモデルを用いる場合は、後述する手法にて、補酵素とタンパク質Aとのドッキングモデルについて階層型クラスタリングを行って得られるクラスタ(最も安定な集合C)内の2以上のドッキングモデル、好ましくは全ドッキングモデルを用いることができる。
変異型UGT1A1について、AutoDock 4プログラム(Morris GM et al.: J Comput Chem 1998, 19:1639-1662)を用いたドッキングシミュレーションを例示しながら説明する。
UGTはグルクロン酸抱合に関与する酵素であり、補酵素であるUDP−グルクロン酸(以下「UDPGA」と称する)から、基質(例えば、生体内物質であるビリルビンや、薬剤であるイリノテカン)にグルクロン酸を転移させる機能を持つ。UGT1A1と基質とのドッキングシミュレーションを行うために、まず、UGT1A1とUDPGAのドッキングシミュレーションを行う。
UDPGAの立体構造データは、ChemIDPlusに登録されているデータをダウンロードして用いることができる(registry number: 2616-64-0)。5種類のUDPGAの立体構造データが存在するが、これら5種類の立体構造データを用いてドッキングシミュレーションを行えばよい。
以下にAutoDockを用いてドッキングシミュレーションを行った例を用いて説明する。まず、UDPGAの配置を探索するマップを、グリッド間隔0.375Å、60×60×60ポイントの立方体としてAutoGridプログラムを用いて生成する。グリッド探索アルゴリズムは、ラマルク型遺伝アルゴリズムを使用すればよい。その他のパラメータはAutoDock 4のデフォルト値を使用すればよい。
変異型UGT1A1と5種類のUDPGAの組み合わせ毎に、複数回、例えば10〜100回ずつドッキングシミュレーションを実行する。10回ずつシミュレーションを行った場合は、1種の変異型UGT1A1について、50個の計算結果が得られる。得られた50個の計算結果のうち、抱合反応可能な向きでUDPGAがドッキングしているものについて、ドッキングエネルギーの平均値を計算する。ドッキングエネルギーΔGは下記の式6で計算される。
変異型UGT1A1とUDPGAとのドッキングシミュレーションにて得られた50個の結果を、分子間エネルギー、UDPGAの分子内部エネルギー、およびアンバウンドエネルギーのそれぞれについて、低い順に順位づけを行う。各結果について分子間エネルギー、UDPGAの分子内部エネルギー、およびアンバウンドエネルギーの3種類の順位の順位和を算出し、順位和が最小のドッキング結果を最も安定なドッキングモデルとして選択し、変異型UGT1A1とUDPGAのドッキングモデルとして決定することができる。この時、ドッキングモデルに含まれる水素結合は、PyMOLを用いて検出すればよい。図2に各種UGT1A1とUDPGAとのドッキングモデルを示す。
変異型UGT1A1と基質のドッキングシミュレーションを行うために、グリッドを決定する必要がある。
変異型UGT1A1とUDPGAとのドッキングモデルから、ドッキングエネルギーが低い一群のシミュレーション結果を、群平均法(2つのクラスタを順次統合していく階層型クラスタリングの一種)によるクラスタリングで、グループ化して定義する。
群平均法では、全てのクラスタ間の距離を計算し、最も距離の小さい2つのクラスタを統合する。クラスタXとYの間の距離d(X,Y)は以下の式7のように定義される。
変異型UGT1A1と抱合反応可能な向きで結合しているUDPGAとの分子間エネルギー、分子内部エネルギー、アンバウンドエネルギーの順位和を指標として群平均法でクラスタリングを行い、「相対的に低いドッキングエネルギーを有する数種類のドッキング構造」の集合(本明細書にて「最も安定な集合C」とも称する。)を求める。
ここで、最も安定な集合Cの至適な粒度を決定することで、グループ化が可能である。クラスタXの粒度G(X)を、抱合反応可能なUDPGA全体の集合をSとした次式8により計算する。
階層型クラスタリングでは、様々な粒度のクラスタリング結果が得られる。粒度の決定のために、野生型、G71R変異型UGT1A1、F83L変異型UGT1A1、I322V変異型UGT1A1と、UDPGAのドッキングシミュレーション結果を使って、群平均法によるクラスタリングを行い、全てのクラスタの粒度を計算してその分布を解析する。例えば、5%水準で、平均と比して有意に大きい粒度を除外するものとしたので、棄却域の値は0.56であった。つまり、粒度0.56以下のクラスタのうち最大のものを、グループとして定義可能であった。
最も安定な集合Cは、抱合反応可能なドッキング結果から群平均法で得られたクラスタをgac(S)と定義して、次の式9のように計算する。
上記式9により定義されたクラスタの位置から分子の揺らぎを加味した抱合反応の場を決定することができる。
変異型UGT1A1と基質とのドッキングシミュレーションにおいて、基質の大きさに合わせて、グリッドの最奥の位置を決定すればよい。基質が、アセトアミノフェンなどの比較的小さな化合物である場合は、グリッドは1つ設定すればよいが、ビリルビンなどの比較的大きな化合物である場合は、グリッドを複数、例えば3つ設定すればよい。グリッドの個数は、基質の大きさだけではなく、タンパク質の反応の場の立体構造も加味して決定される。
また、かかるクラスタリングにより得られたクラスタ(最も安定な集合C)に含まれる補酵素とUGT1A1とのドッキングモデルのうち、2以上を選択して、基質とのドッキングシミュレーションに用いることができる。好ましくは、最も安定な集合Cに含まれる全ドッキングモデルについて、基質とのドッキングシミュレーションを行う。
定めたグリッド位置を用いて、UGT1A1と基質(例えば、アセトアミノフェン(以下「AAP」と称する)、エストラジオール(以下「E2」と称する)、ビリルビン等)とのドッキングシミュレーションを行う。AAPとE2の立体構造データはChemIDPlusに登録されているものを用いればよい。ドッキングシミュレーションは、ドッキングモデルごと及び/又は基質ごとに複数回、例えば10〜1000回行えばよい。100回程度でもよい。ドッキングシミュレーションごとに、基質のUGT1A1への進入の向きを評価する。基質の変異型UGT1A1への進入の向きが、抱合反応可能な向きであった場合を計数する。
基質のタンパク質への進入の向きは、基質のUGT1A1への進入の向きを例にすると、図4に示す2種類が考えられる。<向きI>では、基質のヒドロキシル基がUDPGAに向いており、グルクロン酸抱合反応の進行が可能である。<向きII>では、基質のヒドロキシル基がUDPGAの反対側に向いており、グルクロン酸抱合反応の進行が困難である。本発明では、基質が酵素反応を受け得る向きでタンパク質に進入した回数、すなわちUGT1A1の場合は、基質が<向きI>でUGT1A1に進入したドッキングシミュレーションの回数を計数する。
また、タンパク質Aと補酵素とのドッキングモデルを得た後、基質とのドッキングシミュレーションの前に、induced fit(誘導結合)を行ってもよい。本発明においてinduced fitとは、Flexible Dockingを行うことによりタンパク質の活性部位の立体構造を変化させることを意味する。Flexible Dockingは、MOE(Chemical Computing Group Inc.)等のプログラムにより行うことができる。
induced fitは、タンパク質Aと補酵素とのドッキングモデルを得た後、基質とのドッキングシミュレーションに用いるドッキングモデルを対象に行う。1種のドッキングモデルに対して行ってもよいし、2以上の複数のドッキングモデルに対して行ってもよいが、上述の手法でクラスタリングされた「最も安定な集合C」のクラスタに含まれる全てのドッキングモデルに対して行うことが好ましい。induced fitを行った後の補酵素とのドッキングモデルを用いて、基質とのドッキングシミュレーションを行い、基質が酵素反応を受け得る向きでタンパク質に進入した回数を計数する。
ドッキングシミュレーションにより得られた結果を用いて、タンパク質Aの酵素活性を予測する。タンパク質Aの酵素活性fは、以下の式10を用いて一般的に算出することができる。
gは基質ごとに固有の定数であり、Eはタンパク質Aと補酵素とのドッキングの酵素活性に対する寄与度であり、Rは基質が酵素反応を受け得る向きで進入した割合であり、aは、タンパク質Aの酵素反応が進行している環境、例えば生体内環境による影響を表す定数である。
Rはドッキングシミュレーションにより得られた結果を用いて以下の式11を用いて表される。
式中、Nとnは、タンパク質Aと基質とのドッキングシミュレーションにより得られる値であり、Nはタンパク質Aと基質とのドッキングシミュレーションの総回数であり、Nは2以上であり、nは酵素反応を受け得る向き(UGT1A1の場合は、<向きI>)で基質がタンパク質Aに進入した回数である。βはタンパク質への基質の進入の向きの酵素活性に対する寄与度である。例えば、タンパク質Aが変異型であり、タンパク質Aの立体構造データをタンパク質Bの立体構造データに基づいて計算した場合、βはタンパク質Bへの基質の進入の向きの酵素活性に対する寄与度とすればよい。
したがって、本発明の方法では下記の式1を用いて、ドッキングシミュレーションから得られた結果を用いてタンパク質Aの酵素活性fを予測することができる。
また、タンパク質Bの酵素活性に対するタンパク質Aの相対的な酵素活性f’は、以下の式3により算出される。
式中、Nとnは、タンパク質Bと基質とのドッキングシミュレーションにより得られる値であり、Nはタンパク質Bと基質とのドッキングシミュレーションの総回数であり、Nは2以上であり、nは酵素反応を受け得る向きで基質がタンパク質Bに進入した回数である。
また、βは以下の式2によって算出することができる。
タンパク質Aと補酵素とのドッキングにおける、補酵素の向きやドッキングエネルギーなどが酵素活性に寄与していないか、もしくは、関与が極めて小さい場合は、E=1とすることができる。ドッキングエネルギーが酵素活性に関与していない場合とは、例えばドッキングシミュレーションにより得られたドッキングエネルギー結果が、測定された値y’と相関がない場合を意味する。この場合、式1と式3はそれぞれ以下の式12と式13により表される。

また、式1におけるE(補酵素とタンパク質Aとのドッキングの酵素活性に対する寄与度)は、補酵素の酵素への進入の向きが酵素活性に対して寄与する場合は、以下の式16または式17のいずれかを代入することも可能である。好ましくは、式17を代入する。
(式16中、γはタンパク質への補酵素の進入の向きの酵素活性に対する寄与度であり、次の式21により表され、
Lとlは、タンパク質Aと補酵素とのドッキングシミュレーションにより得られる値であり、Lはタンパク質Aと補酵素とのドッキングシミュレーションの総回数であり、Lは2以上であり、lは酵素反応が進行し得る向きで補酵素がタンパク質Aに進入した回数であり、Lとlはタンパク質Bと補酵素とのドッキングシミュレーションにより得られる値であり、Lはタンパク質Bと補酵素とのドッキングシミュレーションの総回数であり、Lは2以上であり、lは酵素反応が進行し得る向きで補酵素がタンパク質Bに進入した回数である);
(式17中、mはタンパク質Aと補酵素とのドッキングモデルをクラスタリングして得られたクラスタ内のモデル数であり、mはタンパク質Bと補酵素とのドッキングモデルをクラスタリングして得られたクラスタ内のモデル数であり、δはクラスタ内のモデル数の酵素活性への寄与度を表す。δは、ドッキングシミュレーションの結果に基づいて式17を用いて算出した計算値yと測定された値y’との二乗誤差を最小にするように、下記式23を用いて算出することができる。
式23中、yとy’はタンパク質Bについての値であり、yA1とy’A1、yApとy’Apはタンパク質Aについての値であり、pは2以上の数を表す。)
式1、3、12、13等において、gとaは、予測対象となる基質について予め設定された数値を用いることができる。あるいは、gとaの値が不明である場合は、2以上のタンパク質Aについてドッキングシミュレーションを行った結果得られる計算値yと、測定された値y’を用いて、gとaの値を算出することができる。例えば、計算値yと、測定された値y’との二乗誤差を最小にするように、下記の式4を用いて、gとaを算出することができる。測定された値y’は、大きな値から小さな値を満遍なく選択して用いることが好ましい。例えば、タンパク質Bに対する相対活性で示すと、100%〜1%未満まで幅広く用いることが好ましい。測定された値y’が偏っている場合、例えば相対活性では100%〜50%の値である場合は、a=0として酵素活性を算出することもできる。なお、gとaは、喫煙等の生体外環境により影響をうけるであろう生体内環境を加味した値を設定することも可能である。
式中、yとy’はタンパク質Bについての値であり、yA1とy’A1、yApとy’Apはタンパク質Aについての値であり、pは2以上の数を表す。
上記式4における測定された値y’は、ドッキングシミュレーションに基づく計算値ではなく、何らかの実測値を意味する。測定された値y’は例えば、組換えタンパク質を用いたアッセイで得られた実験値、論文などの文献報告や臨床検査結果などから予測される値を含む。例えばUGT1A1のビリルビンに対する抱合活性は、ビリルビンの血中濃度から推定することができ、推定された値を測定された値y’として使用することができる。
変異型UGT1A1の、AAP、E2もしくはビリルビンに対する酵素活性の予測を例示して説明する。
まず、AAP、E2、ビリルビンについて、各々gとaを算出する。G71R変異型UGT1A1、F83L変異型UGT1A1、I322V変異型UGT1A1の各々について、組換えタンパク質の酵素活性を測定することにより、測定された値y’を得ることができる。組換えタンパク質の作製方法、および酵素活性の測定方法は自体公知の方法により行うことができる。例えば、実施例に記載の方法により行えばよい。また、ビリルビンに対する測定された値y’として、文献報告のビリルビン抱合活性(例えば、Yamamoto K et al.: Biochem Biophys Acta 1998, 1406:267-273, Udomuksorn W et al: Pharmacogenetics & Genomics 2007, 17:1017-1029, Ciotti M et al: Biochimica et Biophysica Acta 1998, 1407:40-50)を使用することもできる。
下記の式5を用いて、AAP、E2、ビリルビンについて、測定された値y’を代入して、二乗誤差を最小にするgとaの値を算出する。
その結果、AAPについて、g=1.1055、a=0.0722、E2について、g=5.9410、a=1.2548、ビリルビンについて、g=47.58、a=0.04の値を算出することができる。
上記算出されたgとaを用いて、変異型UGT1A1の酵素活性を予測することができる。式3にg、aを代入し、ドッキングシミュレーションにより得られるNとnを利用して、変異型UGT1A1の算出することができる。34種類の変異型UGT1A1の、AAPおよびE2についての酵素活性を算出した結果を図7に示す。
さらに、式1および式3における
について、Sigmoid関数を導入することも可能である。Sigmoid関数とは、下記式19で表されるS字型の関数である。
本発明の式1において、Sigmoid関数を導入した計算式は、下記式20にて表すことができる。
ここでtは、基質の向きに対する酵素活性の感受性を表すものであり、tの値が大きい程基質の向きの僅かな差異が酵素活性を大きく変化させることとなる。tの値は、2以上のタンパク質Aについてドッキングシミュレーションを行った結果得られる計算値yと、測定された値y’を用いて算出することができ、以下のdの算出方法と同様にして求めることができる。dは、シミュレーションの結果を上記の式に代入して得られる計算値yと、in vitro 解析等による測定値y’との二乗誤差を最小化する値として、下記の式22を用いて算出することができる。
本発明は、タンパク質Aの酵素活性を予測する方法を実行するプログラムを担持する記録媒体、およびタンパク質Aの酵素活性を予測する方法を実行する手段を担持する装置にも及ぶ。記録媒体に担持されるプログラムは、コンピュータを以下の手段として機能させるものであり、装置は、以下の手段を含むものである。
(1)入力されたアミノ酸配列情報に基づいて、タンパク質Aの立体構造データを計算する手段、
(2)タンパク質Aの立体構造データと、ドッキングシミュレーションの対象となる基質の立体構造データを記憶する手段、
(3)前記記憶された、タンパク質Aの立体構造データと基質の立体構造データを用いて、タンパク質Aと基質とのドッキングシミュレーションを行うシミュレーション手段、
(4)シミュレーションにより得られた結果を記憶する手段、
(5)記憶されたシミュレーション結果に基づいて、タンパク質Aの酵素活性を算出する手段、
(6)算出された酵素活性を表示する手段。
また、本発明は、タンパク質Aの酵素活性を予測する方法、前記記録媒体、または前記装置を用いた、基質適合性の判断方法にも及ぶ。本発明における式1または3を用いて、2以上の基質について、基質ごとの特定のタンパク質Aの酵素活性を予測し、得られた2以上の予測結果に基づいて目的の基質を選択する。例えば、タンパク質Aが特定の変異型UGT1A1であり、基質が薬剤である場合に、本方法により、当該変異型UGT1A1による抱合活性が最も高い薬剤を検出し、選択することができる。本方法により生体内での薬剤の効能と代謝とのバランスを鑑み、薬剤を選択することも可能となる。
さらに、本発明はタンパク質Aの酵素活性を予測する方法、前記記録媒体、または前記装置を用いて、当該薬剤の投与量および/または投与間隔、投与頻度を評価する方法にも及ぶ。基質が特定の薬剤であり、当該薬剤が生体に投与される場合であって、生体が例えばUGT1A1に変異を持つ場合に、かかる変異型UGT1A1の当該薬剤に対する酵素活性を予測し、予測結果に基づいて、当該薬剤の投与量および/または投与間隔、投与頻度を評価することが可能である。例えば、薬剤に対する変異型UGT1A1の抱合活性が低い場合は、投与量、投与頻度を低くすることを検討することが可能である。
以下、実施例により本発明を説明するが、本発明はこれらに限定されるものではない。
(実施例1)UGT1A1の立体構造データの計算
野生型UGT1A1の立体構造データを、MODBASEからダウンロードした(accession number: Q5DT03)。PyMOLプログラムを用いて水素原子を追加し、SWISS-PDB Viewerプログラムを用いて、G71R変異型UGT1A1、F83L変異型UGT1A1、I322V変異型UGT1A1の各変異型のデータを作成した。これらのデータを用いて、TINKERパッケージのminimizeプログラムとAMBER99力場パラメータによるエネルギー最小化計算をRMS勾配が0.3になるまで行い、各変異型の立体構造を求めた。計算された各変異型の三次元構造を図1に示す。
(実施例2)各種UGT1A1とUDPGAとのドッキングシミュレーション
AutoDock 4プログラムを用いて、各種UGT1A1(野生型UGT1A1、G71R変異型UGT1A1、F83L変異型UGT1A1、I322V変異型UGT1A1)とUDPGAのドッキングシミュレーションを行った。UDPGAの立体構造データは、ChemIDPlusに登録されている5個のデータを用いた(registry number: 2616-64-0)。UDPGAの配置を探索するマップを、グリッド間隔0.375Å、60×60×60ポイントの立方体としてAutoGridプログラムを用いて生成した。グリッド探索アルゴリズムは、ラマルク型遺伝アルゴリズムを使用した。その他のパラメータはAutoDock 4のデフォルト値を使用した。
各種UGT1A1と5個のUDPGAの組み合わせ毎に、10回ずつドッキングシミュレーションを実行した。計算結果は、1種の変異型UGT1A1について、50個得られた。各々の変異型UGT1A1について、得られた50個の計算結果のうち、抱合反応可能な向きのUDPGAのドッキングエネルギーの平均値を計算した。なお、ドッキングエネルギーΔGは下記の式6で計算した。
各変異型UGT1A1とUDPGAとのドッキングシミュレーションにて得られた50個の結果を、分子間エネルギー、UDPGAの分子内部エネルギー、およびアンバウンドエネルギーのそれぞれについて、低い順に順位づけを行った。分子間エネルギー、UDPGAの分子内部エネルギー、およびアンバウンドエネルギーの3種類の順位の順位和が最小のドッキング結果を最も安定なドッキングモデルとして選択し、それぞれの変異型UGT1A1とUDPGAのドッキングモデルに決定した。この時、ドッキングモデルに含まれる水素結合は、PyMOLを用いて検出した。
図2にドッキングモデルの構造を示す。UDPGAのウラシル環は、野生型では357番目のグルタミン(Q)と、G71R変異型UGT1A1では42番目のセリン(S)、173番目のヒスチジン(H)、375番目のセリン(S)、396番目のアスパラギン酸(D)と、F83L変異型UGT1A1では374番目のグリシン(G)との相互作用が見られた。I322V変異型UGT1A1ではウラシル環と相互作用するアミノ酸は見られなかった。UDPGAのグルクロン酸部分は、野生型UGT1A1では396番目のアスパラギン酸(D)と、G71R変異型UGT1A1では310番目のメチオニン(M)、312番目のセリン(S)、393番目のロイシン(L)との相互作用が見られた。F83L変異型UGT1A1においては、グルクロン酸部分と相互作用するアミノ酸は見られなかった。I322V変異型UGT1A1においては、153番目のフェニルアラニン(F)とグルクロン酸部分との相互作用が見られた。なお、UDPGA反応の場の疎水性度には大きな違いはなかった。
抱合反応可能な向きのUDPGAと各UGT1A1のドッキングエネルギーの分布を図3に示す。野生型とG71R変異型とのドッキングエネルギー、および、F83L変異型とI322V変異型とのドッキングエネルギーに有意差は無かった。F83L変異型は、野生型およびG71R変異型よりもドッキングエネルギーが有意に高かった。また、I322V変異型は野生型およびG71R変異型よりもドッキングエネルギーが有意に高かった。
(実施例3)UGT1A1とUDPGAとの複合体における基質のドッキングシミュレーション
UGT1A1と基質とのドッキングシミュレーション条件のうち、グリッドを決定するために、まずドッキングモデルのうちからドッキングエネルギーが低い一群のシミュレーション結果を、群平均法(2つのクラスタを順次統合していく階層型クラスタリングの一種)によるクラスタリングで、グループ化して定義した。群平均法では、全てのクラスタ間の距離を計算し、最も距離の小さい2つのクラスタを統合する。クラスタXとYの間の距離d(X,Y)は以下の式7のように定義された。
UGT1A1と抱合反応可能な向きのUDPGAの分子間エネルギー、分子内部エネルギー、アンバウンドエネルギーの順位和を指標として群平均法でクラスタリングを行い、「相対的に低いドッキングエネルギーを有する数種類のドッキング構造」の集合を求めた。
ここで、最も安定な集合Cの至適な粒度を決定することで、グループ化が可能である。クラスタXの粒度G(X)を、抱合反応可能なUDPGA全体の集合をSとした次の式8により計算した。
階層型クラスタリングでは、様々な粒度のクラスタリング結果が得られる。
粒度の決定のために、野生型、G71R変異型UGT1A1、F83L変異型UGT1A1、I322V変異型UGT1A1と、UDPGAのドッキングシミュレーション結果を使って、群平均法によるクラスタリングを行い、全てのクラスタの粒度を計算してその分布を解析した。5%水準で、平均と比して有意に大きい粒度を除外するものとしたので、棄却域の値は0.56であった。つまり、粒度0.56以下のクラスタのうち最大のものを、グループとして定義可能であった。
最も安定な集合Cは、抱合反応可能なドッキング結果から群平均法で得られたクラスタをgac(S)と定義して、次の式9のように計算した。
式9により定義されたクラスタの位置から分子の揺らぎを加味した抱合反応の場を決定した。そして、各変異型UGT1A1とAAPもしくはE2とのドッキングシミュレーションにおいて、各基質の大きさに合わせたグリッドの最奥の位置を決定した。かかるグリッド位置を用いて、UGT1A1のグルクロン酸抱合反応の場への各基質の進入方向を解析した。AAPとE2の分子構造データはChemIDPlusに登録されているものを用い、ドッキングシミュレーションを基質ごとに100回実行した。
図4に基質の2つの向きを示す。向きIは基質のヒドロキシル基がUDPGAに向いており、グルクロン酸抱合反応の進行が可能である。向きIIは基質のヒドロキシル基がUDPGAの反対側に向いており、グルクロン酸抱合反応の進行が困難である。
表1に向きIおよび向きIIの各々でドッキングした回数を示す。
AAPでは、野生型、G71R変異型、I322V変異型では大部分のドッキング結果が向きIであった。F83L変異型では大部分のドッキング結果が、向きIIであった。
E2では、野生型、I322V変異型では大部分のドッキング結果において、向きIであった。G71R変異型、F83L変異型では、大部分のドッキング結果が、向きIIであった。
(実施例4)UGT1A1のin vitroでの酵素活性測定
ヒト肝臓cDNAライブラリーから、PCR増幅によりヒトUGT1A1 cDNAを抽出し、pENTERTM/D-TOPOベクター(Invitrogen, Carlsbad, CA, USA)に挿入した。Site-directed mutagenesis法を用いて、遺伝子変異をクローンcDNAに導入した。正常型および各変異型のcDNA配列を、組み換えを用いて発現ベクターpcDNA-DEST40 GatewayTM(Invitrogen, Carlsbad, CA, USA)に移植した。各種UGT1A1の発現ベクターをルシフェラーゼレポーターベクター(pGL3-vector)とともにLipofectamineTM2000を用いてCOS−7細胞に導入した。48時間後に細胞を採取し、0.1M Tri-HCl 70μl で均質化し、ルシフェラーゼとUGT1A1のアッセイの酵素ソースとして使用した。TD-20/20 luminometer(Promega, Madison, WI, USA)を用いてルシフェラーゼ活性を計測し、UGT1A1の酵素活性の標準化に供した。E2のグルクロン酸抱合反応を、UGT Reaction Mix (BD Gentest, Franklin Lakes, NJ, USA)を使用して分析した。反応生成物を遠心した後、LC/MS/MS解析に供し、E2とグルクロン酸の抱合体(E2G)の量を測定した。AAPについても同様の手法を用いて抱合体(AAPG)の測定を行った。
Analyst 1.3.1ソフトウェアでAPI-3000TMLC/MS/MSシステム (Applied Biosystems-MDS Sciex, Tronto, Canada)を操作し、データ取得と解析を行った。
AAPおよびE2を基質とした時の各変異型UGT1A1のin vitro抱合活性を図5に示す。F83L変異型のAAPに対する酵素活性は、野生型と比較して有意に低下していた (n=5, p<0.005)。G71R変異型およびF83L変異型のE2に対する酵素活性は、野生型と比較して有意に低下していた (n=5, p<0.005)。F83L変異型のE2に対する酵素活性は、G71R変異型のE2に対する酵素活性よりも有意に低かった (n=5, p<0.05)。
(実施例5) UGT1A1酵素活性を予測するための数式の作成
UGT1A1の酵素活性は、(i)UGT1A1とUDPGAのドッキング、と(ii)UGT1A1の抱合反応空間への基質の進入、の積で規定され、プロセス(i)をE、プロセス(ii)をRと定義することで、抱合活性fは次式10で表される。
gは基質に固有の定数、aは内因性UGT1A1等の生体内環境による影響を表す定数である。ここでは、実施例2と実施例4の結果から、UDPGAとUGT1A1とのドッキングエネルギーの抱合反応活性への関与は認められないと考えられたため、E=1を代入した。
プロセス(ii)では、基質の進入方向の関与を反映させる。変異型UGT1A1と基質とのドッキングシミュレーションをN回行い、そのうち基質が抱合反応可能な向きである結果がn回であった場合、プロセス(ii)のRは次式11で定義される。
βは、以下の式2で表される。式中、Nは野生型UGT1A1と基質とのドッキングシミュレーションの総回数であり、nは全N回中、基質が野生型UGT1A1に抱合反応可能な方向で進入した回数である。
EとRを式10に代入すると、酵素活性の計算式は下記式12で表される。
ここで定数g,aは、計算式とin vitro実験結果の二乗誤差が最小となるように基質ごとに異なる値を設定する。
また、式12を用いて、変異型UGT1A1の、野生型の酵素活性に対する相対的な酵素活性f’は次の式13のように計算できる。
(実施例6)AAPと、E2に対する酵素活性の予測
上記実施例5の式により算出された計算値yと、野生型およびG71R変異型、F83L変異型、I322V変異型のUGT1A1の各基質に対する抱合活性の実験値y’(実施例4)を用いて、二乗誤差を最小化するg,aを次式5で計算することができる。
式5にAAPおよびE2のin vitro実験結果を代入し、g,aの値を求めた。その結果、AAPについて、g=1.1055、a=0.0722、E2について、g=5.9410、a=1.2548の値が算出された。
まずG71R変異型、F83L変異型、I322V変異型のin vitroでの抱合活性の測定結果(in vitro測定値)と、式3を用いた抱合活性の算出結果(計算値)を比較した。結果を図6に示す。式3を用いて算出した抱合活性(計算値)はin vitroの抱合活性(in vitro測定値)を良く再現可能であることがわかった。
式3を用いて、現在報告されている他の31種類の変異型UGT1A1について、ドッキングシミュレーションを行い、抱合活性を式3を用いて算出した。全34種類の変異型UGT1A1に関する算出結果を、図7に示した。
(実施例7)ビリルビンに対する酵素活性の予測
ビリルビンを基質とした時の抱合活性を式3を用いて算出した。
まず、ビリルビンとUGT1A1のドッキングシミュレーションを行った。基質(ビリルビン)の分子が大きいため、基質進入方向のグリッドとして、グリッドA〜Cの3つを設定した。3つのグリッドを図8に示す。野生型、およびG71R変異型、F83L変異型、I294T変異型とビリルビンとのドッキングシミュレーションを行い、基質の進入の向きを解析した。グリッドA〜Cのそれぞれについて100回ずつドッキングシミュレーションを行った。各グリッドについてNとnは、各々N,N,N,n,n,nとして計数した。NをNとNとNの和(すなわち300回)、nをnとnとnの和として算出した。その結果を表2に示す。
上記結果と、野生型および文献で報告されているG71R変異型、F83L変異型、I294T変異型のin vitro酵素活性の値y’(y'w=1.00, y'G71R=0.32, y'F83L=0.05, y'I294T=0.50)を用いて二乗誤差を最小化するg,aを計算したところ、g=44.06、a=0.17であった。in vitro酵素活性は、G71R変異型については、Yamamoto K et al.: Biochem Biophys Acta 1998, 1406:267-273を、F83L変異型についてはUdomuksorn W et al.: Pharmacogenetics & Genomics 2007, 17:1017-1029を、I294T変異型については、Ciotti M et al: Biochimica et Biophysica Acta 1998, 1407:40-50を参照した。これらの文献では、酵素活性は正常値(野生型)に対する割合(相対活性)で示されており、G71R変異型は32%、F83L変異型は5%、I294T変異型は50%である。
これらの結果を用いて式3により、各変異型UGT1A1のビリルビンに対する相対抱合活性を算出した。
G71R変異型、F83L変異型、I294T変異型のin vitroでの抱合活性値(in vitro測定値(文献報告))と、式3を用いた抱合活性の算出結果(計算値)を比較した。結果を図9に示す。式3を用いて算出した抱合活性(計算値)はin vitroの抱合活性(in vitro測定値(文献報告))を良く再現可能であることがわかった。
(実施例8)ビリルビンに対する酵素活性の予測2
実施例7にて得られたgとaの値を用いて、R336L変異型、N400D変異型、W461R変異型についてビリルビンに対する活性を算出した。
まず、各変異型UGT1A1とビリルビンとのドッキングシミュレーションを行った。ドッキングシミュレーションの結果を表3に示す。
これらの結果と実施例7にて得られたgとaの値を用いて、抱合活性を式3を用いて算出した。
次に、文献に記載のデータからR336L変異型、N400D変異型、W461R変異型のビリルビン抱合活性の値の範囲を算出した。
Crigler−Najjar症候群I型(CN−I)患者に見られる変異型UGT1A1のビリルビン抱合活性は、野生型の0〜10%と算出される(Yamamoto K et al.: Biochem Biophys Acta 1998, 1406:267-273)。ホモ型のW461R変異型(TA6/TA6)が、CN−I患者にて発見されている(Maruo Y, et al.: J Pediatr Gastroenterol Nutr 2003, 37(5):627-30)。よって、ホモ型のW461R変異型の酵素活性は、野生型の0〜10%と計算された。
Crigler−Najjar症候群II型(CN−II)およびGilbert症候群(GS)患者に見られる変異型UGT1A1のビリルビン抱合活性は、野生型の26〜66%と算出される(Udomuksorn W et al.: Pharmacogenetics & Genomics 2007, 17:1017-1029; Yamamoto K et al.: Biochem Biophys Acta 1998, 1406:267-273; Seppen J, et al.: J Clin Invest 1994, 94(6):2385-2391)。ホモ型のN400D変異型が、CN−II患者に見られる(Labrune P et al.: Hum Mutat 2002, 20(5):399-401)。よって、ホモ型のN400D変異型の酵素活性は、野生型の26〜66%と計算された。
ヘテロ型のR336L変異型は、CN−II患者に見られる(Servedio V et al.: Hum Mutat 2005, 25(3):325)。Servedio V et al.に記載のCN−II患者ではプロモータ領域にTA7/TA7の変異も確認されている。TA7/TA7変異のある患者では、ビリルビン抱合活性が野生型と比べて50%に低下することが報告されている(Peterson et al.: J Nutr 2005, 135:1051-1055)。これらの報告から、R336L型変異の染色体あたりの抱合活性低下をx(%)とすると、下記の式14が成り立つ:
式14から以下の式15が得られた。
したがって、ホモ型のR336L変異型の抱合活性は野生型の52〜132%(平均値92%)と計算された。
表3に記載のドッキングシミュレーションの結果から算出した値(計算値)と、文献から得られた値(in vivo測定値(文献報告))の比較を図10に示す。この結果、高い精度で正しい抱合活性を導出可能なことが分かった。UGT1A1は肝臓で働く酵素であり、ヒト生体内でのUGT1A1抱合活性は飲酒や喫煙の影響を受ける可能性が高いことを考慮すると、本発明に用いられる式により得られる値は非常に精度が高いと考えられた。
(実施例9)ビリルビンに対する酵素活性の予測3
in vitro酵素活性の値として、G71R変異型、F83L変異型、I294T変異型ではなく、G71R変異型、P229Q変異型、I294T変異型のものを用いた以外は、実施例7と同様にして、gとaを算出した。P229Q変異型の値は、Udomuksorn W et al: Pharmacogenetics and genomics 2007, 17(12):1017-29を参照した。この文献では、P229Q変異型の正常値(野生型)に対する割合(相対活性)は、61%と示されている。各変異型UGT1A1とビリルビンとのドッキングシミュレーションを行った結果を、表4に示す。
上記結果と、野生型および文献で報告されているG71R変異型、P229Q変異型、I294T変異型のin vitro酵素活性の値y’(y'w=1.00, y'G71R=0.32, y'P229Q=0.61, y'I294T=0.50)を用いて二乗誤差を最小化するg,aを計算したところ、g=29.36、a=0.40であった。
これらの結果を用いて式3により、各変異型UGT1A1のビリルビンに対する相対抱合活性を算出した。
G71R変異型、P229Q変異型、I294T変異型のin vitroでの抱合活性値(in vitro測定値(文献報告))と、式3を用いた抱合活性の算出結果(計算値)を比較した。結果を図11に示す。
(実施例10)ビリルビンに対する酵素活性の予測4
R336L変異型、N400D変異型、W461R変異型について、実施例8にて得られたドッキングシミュレーションの結果と、実施例9にて得られたgとaの値を用いて、抱合活性を式3を用いて算出した。
ドッキングシミュレーションの結果から算出した値(計算値)と、実施例8に記載の文献から得られた値(in vivo測定値(文献報告))の比較を図12に示す。
(実施例11)ビリルビンに対する酵素活性の予測5
R336L変異型、N400D変異型、W461R変異型について、g=29.36、a=0を代入して、抱合活性(相対活性)を式3を用いて算出した。
算出した結果(計算値)と、実施例8に記載の文献から得られた値(in vivo測定値(文献報告))の比較を、図13に示す。
(実施例12)構造計算時の水分子付加の影響
水分子を付加して、又は水分子を付加せず(Gas Phase)に、UGT1A1(細胞膜タンパク質)およびGタンパクであるArl6(細胞質に存在)のタンパク質2種類について、シミュレーションを行った。
水分子を付加する場合は、TINKERパッケージの代わりにMOEを用いた以外は実施例1と同様にして立体構造を計算した(野生型UGT1A1、G71R変異型UGT1A1、F83L変異型UGT1A1、I322V変異型UGT1A1:野生型Arl6、T31R変異型Arl6、G169A変異型Arl6、L170W変異型Arl6)。また、水分子を付加しない場合は、TINKERパッケージを用いて、実施例1と同様にして立体構造を計算した。
その後UGT1A1について、水分子を付加した場合はMOE DockもしくはAutoDock 4プログラムを用いて、水分子を付加していない場合はAutoDock 4プログラムを用いて、実施例2と同様にして、UDPGAとのドッキングシミュレーションを行った。抱合反応可能な向きのUDPGAと各UGT1A1のドッキングエネルギーの分布を図14に示す。
次に、水分子を付加した各変異型UGT1A1と基質(AAPもしくはE2)とのドッキングシミュレーションまたは、水分子を付加した各変異型Arl6と基質(GTPγSもしくはGDP)とのドッキングシミュレーションを行った。基質とのドッキングシミュレーションは、MOE DockもしくはAutoDock4を用いて、実施例3と同様にして行った。ドッキングシミュレーションの結果を図15(UGT1A1)と図17(Arl6)に示す。図15のaは、ドッキングプログラムにMOE Dockを使用し、bはAutoDock4を用いた結果である。図17の結果は、ドッキングプログラムにAutoDock4を用いた結果である。
各種UGT1A1について、基質が向きIで進入した回数とin vitro測定値との比較を図16に示す。図16のaは、水分子付加した場合に基質とのドッキングシミュレーションをMOE Dockを用いて行った結果であり、bは水分子を付加した場合に基質とのドッキングシミュレーションをAutoDock4を用いて行った結果である。
UGT1A1では、水分子を付加して構造計算を行った場合、基質と各種UGT1A1のドッキングシミュレーションの結果(基質が向きIで各種UGT1A1に進入した回数)がin vitroの抱合活性(in vitro測定値)に相関しないことがわかった。また、ドッキングシミュレーションにMOE DockおよびAutoDock4のいずれを使用した場合でも同様に相関がみられず、基質がAAPおよびE2のいずれの場合でも相関がみられなかった。
また、Arl6では水分子を付加して構造計算を行った結果、基質(GTPγSまたはGDP)と各種Arl6のドッキングシミュレーションの結果(GTPγSまたはGDPが各種Arl6に結合し得る向きで進入した回数)と、in vitroのArl6実験値(Kobayashi et.al, BBRC 381, 439-442, 2009および東京大学大学院薬学研究科機能薬学教室生理化学教室の紺谷圏二先生の実験データ)とに高い相関が見られることを確認した。なおArl6は酵素タンパク質ではないが、酵素タンパク質について酵素反応が進むためには基質との結合が必須であることから、Arl6の基質との結合能は酵素タンパク質の触媒能と同義に考えることができる。
UGT1A1は、細胞膜に存在するタンパク質であり、触媒反応が酵素内部で起こると考えられる。一方、Arl6は細胞質に存在するタンパク質であり、GTPとの結合がタンパク質表面で起こると考えられる。これらの結果から、対象となる酵素タンパク質の存在する箇所や、触媒反応の起こる部位などの疎水性度および親水性度を考慮して、構造計算時における水分子付加の要否を決定可能であることが示唆された。
(実施例13)induced fitの影響
(1)水分子を付加せずに各種UGT1A1の立体構造データの計算を行い、UDPGAとのドッキングシミュレーションを行った。構造計算にMOE又はTINKERを使用し、ドッキングシミュレーションにMOE Dock又はAutoDock4を使用して、実施例1および2と同様の手法でシミュレーションを行った。UDPGAとのドッキングモデル1つに対して、MOEを用いてinduced fitを行い、基質(AAPまたはE2)とのドッキングシミュレーションを行った。
結果を図18および図19に示す。図18のaは、構造計算にMOEを用いてドッキングシミュレーションにMOE Dockを用いた結果であり、図18のbは、構造計算にTINKERを用いてドッキングシミュレーションにAutoDock4を用いた結果である。図19のaは構造計算にMOEを用いてドッキングシミュレーションにMOE Dockを用いた結果とin vitro測定値との比較であり、図19のbは、構造計算にTINKERを用いてドッキングシミュレーションにAutoDock4を用いた結果とin vitro測定値との比較である。
induced fitを行わなかった結果(図19のグラフ、実線)と比較すると、induced fitを行った場合(図19のグラフ、点線)では、基質と各種UGT1A1のドッキングシミュレーションの結果(基質が向きIで各種UGT1A1に進入した回数)がin vitroの抱合活性(in vitro測定値)に相関しないことがわかった。本実施例では、UDPGAとのドッキングモデルを1種類(最も安定なドッキングモデル)としている。induced fitのシミュレーションに対する影響をさらに検討するため、UDPGAとのドッキングモデルについてクラスタリングを行い(実施例3参照)、クラスタリングの結果得られたクラスタ(最も安定な集合C)内の全ドッキングモデルについて、induced fitを行い影響を検討した。
(2)実施例1および2と同様にして、TINKERを使用して水分子を付加せずに各種UGT1A1の立体構造データの計算を行い、AutoDock4でUDPGAとのドッキングシミュレーションを行った。次にUDPGAとのドッキングモデルについてクラスタリングを行い(実施例3参照)、クラスタリングの結果得られた最も安定な集合C内の全ドッキングモデルについて、MOEを用いてinduced fitを行い、AutoDock4を用いて基質(AAPまたはE2)とのドッキングシミュレーションを行った。これらの結果を用いて、式3(gとaの値は、実施例6のものを使用)により、各変異型UGT1A1のAAPもしくはE2に対する相対抱合活性を算出した。
結果を図20に示す。最も安定な集合C内の全ドッキングモデルについてinduced fitを行った場合(図20(B))、induced fitなしの場合(図20(C))およびクラスタ内の1種類のモデルについてinduced fitを行った場合(図20(A))と比較して、式3を用いて算出した抱合活性(計算値)がin vitroの抱合活性(in vitro測定値)と高い相関を持つことがわかった。従って、UDPGAとのドッキングモデルのクラス内の複数のモデル、好ましくは全てのモデルについて、induced fitを行い、基質とのドッキングシミュレーションを行うことが好ましいことが、示唆された。
(実施例14)補酵素の各種UGT1A1への進入の向きの抱合能への影響
補酵素のドッキングエネルギーがUGT1A1の抱合能に影響をしないことを実施例2および4にて確認した。補酵素の各種UGT1A1への進入の向きが、抱合能へ影響するかについて検討を行うため、式1について3種類のin silico抱合能計算式を導出した。すなわち、E=1(補酵素の向きの寄与が皆無)、E=下記式16(補酵素が酵素反応を受け得る向きで各種UGT1A1へ進入した回数の寄与)、
E=下記式17(補酵素とのシミュレーションを行った後、クラスタリングにより選択されたモデル数の寄与)
である。L、l、γ、m、m、δについては本明細書にて定義したとおりである。
実施例13の手法により、UDPGAとのドッキングモデルのクラスタ内の全てのモデルについて、induced fitを行い、基質とのドッキングシミュレーションを行った。基質とのドッキングシミュレーションの結果を用いて、各計算式を用いてG71R変異型UGT1A1、F83L変異型UGT1A1、I322V変異型UGT1A1、R336L変異型UGT1A1、H376R変異型UGT1A1、P387S変異型UGT1A1の抱合活性(計算値)を算出した(gとaは実施例6のものを使用、δは0.37を用いた)。得られた計算値とin vitro抱合能(基質はAAPまたはE2)との二重誤差(式18)を算出し、各計算式の抱合能の予測精度を評価した。
E=1(補酵素の寄与が皆無)の場合は、二重誤差が0.137062であり、E=式16(補酵素が酵素反応を受け得る向きで各種UGT1A1へ進入した回数の寄与)の場合は0.117838、E=式17(補酵素とのシミュレーションを行った後、クラスタリングにより選択されたモデル数の寄与)の場合は0.053017であった。補酵素とのドッキングシミュレーションを行った後、クラスタリングにより選択されたモデル数を計算式に使用した場合に、最も二重誤差が減少した。従って、補酵素のオリエンテーションが抱合能に関与しており、これを考慮することにより、さらに正確に抱合能を予測可能となることが示唆された。
(実施例15)基質のオリエンテーションについてSigmoid関数を用いた場合の影響
Sigmoid関数とは下記式19で表されるS字型の関数であり、実数xに対して(0, 1)の値域を持つ単調増加関数である。pをゲインと呼び、関数の形状に影響する。
抱合能の計算式である式1において、式10における項R(UGT1A1の抱合反応空間への基質の進入)にSigmoid関数を適用した計算式を作成した(式20)。
G71R変異型UGT1A1、F83L変異型UGT1A1、I322V変異型UGT1A1、R336L変異型UGT1A1、H376R変異型UGT1A1、P387S変異型UGT1A1について、実施例13の手法により、UDPGAとのドッキングモデルのクラス内の全てのモデルについて、induced fitを行い、基質とのドッキングシミュレーションを行った。基質とのドッキングシミュレーションの結果を用いて、実施例14の3種類のEのうち式17を上記式20と組み合わせた計算式により、各種UGT1A1の抱合活性(計算値)を算出した(gとaは実施例6のものを使用。d、tは実施例13の結果と、野生型およびG71R変異型、F83L変異型、I322V変異型のin vitro酵素活性の値を用いて、二重誤差を最小化する値を計算した。その結果、t=7.00、d=0.54であった。δは0.37を用いた)。なお、各種UGT1A1(G71R変異型、F83L変異型、I322V変異型、R336L変異型、H376R変異型、P387S変異型)のin vitro抱合能は、実施例4の手法と同様にして測定した。さらに、現在報告されている他の28種類の変異型UGT1A1について、本実施例と同様にしてドッキングシミュレーションを行い、その結果を用いて式17および式20を用いて、抱合活性を測定した。
図21に、in vitro測定値とシミュレーションに基づく計算値との比較を示す。また図22に、野生型UGT1A1と、全34種の変異型UGT1A1のシミュレーションに基づく計算値の結果を示す。
計算式にSigmoid関数を使用した場合、in vitroの抱合活性を良く再現可能であることがわかった(図21および図22)。よって、式10における項R(UGT1A1の抱合反応空間への基質の進入)へSigmoid関数を適用することが好ましいことが示唆された。
(実施例16)AAPと、E2に対する酵素活性の予測
実施例15と同様の手法を用いて、ドッキングシミュレーションを行った。かかるドッキングシミュレーションの結果を用いて、実施例14の3種類のEのうちE=1を式3と組み合わせた計算式により、G71R変異型UGT1A1、F83L変異型UGT1A1、I322V変異型UGT1A1、R336L変異型UGT1A1、H376R変異型UGT1A1、P387S変異型UGT1A1の抱合活性(計算値)を算出した(gとaは実施例6のものを使用)。なお、各種UGT1A1(G71R変異型、F83L変異型、I322V変異型、R336L変異型、H376R変異型、P387S変異型)のin vitro抱合能は、実施例4の手法と同様にして測定した。
これらの結果を図23に示す。
本発明の方法を用いれば、特定の基質に対する酵素活性が予測できない変異型タンパク質についての、酵素活性を予測することができ有用である。薬剤代謝に重要なUGT1A1の変異型を例に説明すると、天然に存在する変異部位の解析結果は、将来的に個人のゲノム解析結果が得られた場合、薬剤投与のための情報として有益である。また、上記酵素活性fまたはf’は、タンパク質の立体構造自体に由来する酵素活性であり、上記数式を使用して、その他の環境要因等を含めるような数式を作成し、リスクファクターを加味した患者ごとの薬剤投与計画の作成のための参考情報を得ることも可能である。さらに、特定のタンパク質について、人工変異部位を含めて、網羅的に変異部位を持つタンパク質について酵素活性の予測を行うことにより、酵素の触媒作用におけるタンパク質の重要部位の決定が可能となり、創薬ターゲットに利用可能である。
1 野生型
2 P34Q変異型
3 H39D変異型
4 G71R変異型
5 F83L変異型
6 L175Q変異型
7 C177R変異型
8 R209W変異型
9 V225G変異型
10 P229Q変異型
11 G276R変異型
12 E291V変異型
13 A292V変異型
14 I294T変異型
15 G308E変異型
16 I322V変異型
17 Q331R変異型
18 R336L変異型
19 R336Q変異型
20 R336W変異型
21 W354R変異型
22 Q357R変異型
23 R367G変異型
24 A368T変異型
25 S375F変異型
26 H376R変異型
27 G377V変異型
28 S381R変異型
29 P387S変異型
30 G395V変異型
31 N400D変異型
32 A401P変異型
33 R403C変異型
34 K428E変異型
35 W461R変異型
(A) induced fit有り、1モデル
(B) induced fit有り、クラスタ内の全モデル
(C) induced fitなし
(D) UDPGAが酵素反応を受け得る向きで各種UGT1A1に進入した回数
(E) クラスタ内のモデル数
(F) 基質が向きIで各種UGT1A1に進入した回数(向きIの回数/シミュレーションの全回数)

Claims (15)

  1. タンパク質Aの酵素活性をコンピュータを用いたシミュレーションにより予測する方法であって、
    酵素活性がタンパク質Aへの基質の進入の向きにより規定されるようなタンパク質であり、
    タンパク質Aの酵素活性fが以下の式1により算出される方法;
    式中、gは基質ごとに固有の定数であり、Eはタンパク質Aと補酵素とのドッキングの酵素活性に対する寄与度であり、βはタンパク質への基質の進入の向きの酵素活性に対する寄与度であり、aは生体内環境による影響を表す定数であり、Nとnは、タンパク質Aと基質とのドッキングシミュレーションにより得られる値であり、Nはタンパク質Aと基質とのドッキングシミュレーションの総回数であり、Nは2以上であり、nは酵素反応を受け得る向きで基質がタンパク質Aに進入した回数である。
  2. タンパク質Aの立体構造データが、タンパク質Aとは別のタンパク質Bの立体構造データに基づいて計算されるものであり、βが以下の式2によって算出される請求の範囲第1項に記載の方法:
    式中、Nとnは、タンパク質Bと基質とのドッキングシミュレーションにより得られる値であり、Nはタンパク質Bと基質とのドッキングシミュレーションの総回数であり、Nは2以上であり、nは酵素反応を受け得る向きで基質がタンパク質Bに進入した回数である。
  3. タンパク質Bの酵素活性に対するタンパク質Aの相対的な酵素活性をコンピュータを用いたシミュレーションにより予測する方法であって、
    酵素活性がタンパク質Aへの基質の進入の向きにより規定されるようなタンパク質であり、
    タンパク質Aの相対的な酵素活性f’が以下の式3により算出される方法;
    式中、gは基質ごとに固有の定数であり、Eはタンパク質Aと補酵素とのドッキングの酵素活性に対する寄与度であり、aは生体内環境による影響を表す定数であり、βはタンパク質への基質の進入の向きの酵素活性に対する寄与度であり、次の式2により表され;
    Nとnは、タンパク質Aと基質とのドッキングシミュレーションにより得られる値であり、Nはタンパク質Aと基質とのドッキングシミュレーションの総回数であり、Nは2以上であり、nは酵素反応を受け得る向きで基質がタンパク質Aに進入した回数であり、Nとnはタンパク質Bと基質とのドッキングシミュレーションにより得られる値であり、Nはタンパク質Bと基質とのドッキングシミュレーションの総回数であり、Nは2以上であり、nは酵素反応を受け得る向きで基質がタンパク質Bに進入した回数である。
  4. Eが、下記の式16または式17により表される、請求の範囲第1項〜第3項のいずれか1に記載の方法:
    (式16中、γはタンパク質への補酵素の進入の向きの酵素活性に対する寄与度であり、次の式21により表され、
    Lとlは、タンパク質Aと補酵素とのドッキングシミュレーションにより得られる値であり、Lはタンパク質Aと補酵素とのドッキングシミュレーションの総回数であり、Lは2以上であり、lは酵素反応が進行し得る向きで補酵素がタンパク質Aに進入した回数であり、Lとlはタンパク質Bと補酵素とのドッキングシミュレーションにより得られる値であり、Lはタンパク質Bと補酵素とのドッキングシミュレーションの総回数であり、Lは2以上であり、lは酵素反応が進行し得る向きで補酵素がタンパク質Bに進入した回数である);
    (式17中、mはタンパク質Aと補酵素とのドッキングモデルをクラスタリングして得られたクラスタ内のモデル数であり、mはタンパク質Bと補酵素とのドッキングモデルをクラスタリングして得られたクラスタ内のモデル数であり、δはクラスタ内のモデル数の酵素活性への寄与度を表す。)
  5. 式1または式3において、
    について、Sigmoid関数を導入する、請求の範囲第1項〜第4項のいずれか1に記載の方法。
  6. 2以上のタンパク質Aについてドッキングシミュレーションを行い、
    gとaが、ドッキングシミュレーションにより得られた計算値yと、測定された値y’との二乗誤差を最小にする値であり、下記の式4を用いて算出される、請求の範囲第2項〜第5項のいずれか1に記載の方法。
    式中、yとy’はタンパク質Bについての値であり、yA1とy’A1、yApとy’Apはタンパク質Aについての値であり、pは2以上の数を表す。
  7. タンパク質と基質とのドッキングシミュレーションが以下の工程を含む請求の範囲第1項〜第6項のいずれか1に記載の方法:
    (a)タンパク質Bの立体構造データを入手し、タンパク質Aの立体構造データをタンパク質Bの立体構造データに基づいて計算し、
    (b)タンパク質AまたはBと補酵素とのドッキングシミュレーションを行い、熱力学的に安定なドッキングモデルを決定し;
    (c)タンパク質AまたはBと基質とのドッキングのグリッドを設定し;
    (d)タンパク質Bと基質とのドッキングシミュレーションをN回行い、Nは2以上であり、酵素反応を受け得る向きで基質がタンパク質Bに進入した回数nを計数し、
    (e)タンパク質Aと基質とのドッキングシミュレーションをN回行い、Nは2以上であり、酵素反応を受け得る向きで基質がタンパク質Aに進入した回数nを計数する。
  8. 工程(b)の後に次の工程(b−1)を行い;
    工程(b−1)タンパク質AまたはBと補酵素とのドッキングモデルをクラスタリングし、クラスタリングして得られたクラスタ内の2以上のモデルについてinduced fitを行い、
    工程(d)において、induced fit後の各モデルについて、基質とのドッキングシミュレーションを行う、
    請求の範囲第1項〜第7項のいずれか1に記載の方法。
  9. タンパク質Aが変異型タンパク質である請求の範囲第1項〜第7項のいずれか1に記載の方法。
  10. タンパク質AがUDP−グルクロン酸転移酵素であり、補酵素がUDP−グルクロン酸である、請求の範囲第4項〜第9項のいずれか1に記載の方法。
  11. タンパク質Aがgとaの算出のために用いた変異型タンパク質以外の変異型タンパク質であり、算出されたgとaの値を用いて酵素活性の予測を行う、請求の範囲第6項〜第10項のいずれか1に記載の方法。
  12. 請求の範囲第1項〜第11項のいずれか1に記載の方法を実行するために、コンピュータを下記の手段として機能させるプログラムを担持する記録媒体:
    (1)入力されたアミノ酸配列情報に基づいて、タンパク質Aの立体構造データを計算する手段、
    (2)タンパク質Aの立体構造データと、ドッキングシミュレーションの対象となる基質の立体構造データを記憶する手段、
    (3)前記記憶された、タンパク質Aの立体構造データと基質の立体構造データを用いて、タンパク質Aと基質とのドッキングシミュレーションを行うシミュレーション手段、
    (4)シミュレーションにより得られた結果を記憶する手段、
    (5)記憶されたシミュレーション結果に基づいて、タンパク質Aの酵素活性を算出する手段、
    (6)算出された酵素活性を表示する手段。
  13. 請求の範囲第1項〜第11項のいずれか1に記載の方法を実行するために、下記の手段を担持する装置;
    (1)入力されたアミノ酸配列情報に基づいて、タンパク質Aの立体構造データを計算する手段、
    (2)タンパク質Aの立体構造データと、ドッキングシミュレーションの対象となる基質の立体構造データを記憶する手段、
    (3)前記記憶された、タンパク質Aの立体構造データと基質の立体構造データを用いて、タンパク質Aと基質とのドッキングシミュレーションを行うシミュレーション手段、
    (4)シミュレーションにより得られた結果を記憶する手段、
    (5)記憶されたシミュレーション結果に基づいて、タンパク質Aの酵素活性を算出する手段、
    (6)算出された酵素活性を表示する手段。
  14. 請求の範囲第1項〜第11項のいずれか1に記載の方法、請求の範囲第12項に記載の記録媒体、または請求の範囲第13項に記載の装置を用いて、2以上の基質について、基質ごとのタンパク質Aの酵素活性を予測し、得られた2以上の予測結果に基づいて目的の基質を選択する、基質適合性の判定方法。
  15. 前記基質が生体に投与される薬剤であって、請求の範囲第14項に記載の方法を用いて、薬剤の投与量および/または投与間隔、投与頻度を評価する方法。
JP2010527692A 2008-09-05 2009-09-01 酵素活性をコンピュータを用いたシミュレーションにより予測する方法 Expired - Fee Related JP5447383B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010527692A JP5447383B2 (ja) 2008-09-05 2009-09-01 酵素活性をコンピュータを用いたシミュレーションにより予測する方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2008228434 2008-09-05
JP2008228434 2008-09-05
PCT/JP2009/004286 WO2010026738A2 (ja) 2008-09-05 2009-09-01 酵素活性をコンピュータを用いたシミュレーションにより予測する方法
JP2010527692A JP5447383B2 (ja) 2008-09-05 2009-09-01 酵素活性をコンピュータを用いたシミュレーションにより予測する方法

Publications (2)

Publication Number Publication Date
JPWO2010026738A1 true JPWO2010026738A1 (ja) 2012-01-26
JP5447383B2 JP5447383B2 (ja) 2014-03-19

Family

ID=41797601

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010527692A Expired - Fee Related JP5447383B2 (ja) 2008-09-05 2009-09-01 酵素活性をコンピュータを用いたシミュレーションにより予測する方法

Country Status (2)

Country Link
JP (1) JP5447383B2 (ja)
WO (1) WO2010026738A2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5905781B2 (ja) * 2012-06-13 2016-04-20 学校法人沖縄科学技術大学院大学学園 相互作用予測装置、相互作用予測方法、および、プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004295654A (ja) * 2003-03-27 2004-10-21 National Institute Of Agrobiological Sciences リガンドライブラリを利用したタンパク質の機能推定法
JP2007272627A (ja) * 2006-03-31 2007-10-18 Nec Corp スクリーニング方法およびスクリーニングシステム

Also Published As

Publication number Publication date
WO2010026738A3 (ja) 2010-05-14
JP5447383B2 (ja) 2014-03-19
WO2010026738A2 (ja) 2010-03-11

Similar Documents

Publication Publication Date Title
Berka et al. Behavior of human cytochromes P450 on lipid membranes
Ando et al. Allosteric inhibition of human ribonucleotide reductase by dATP entails the stabilization of a hexamer
Achour et al. Protein expression of various hepatic uridine 5′‐diphosphate glucuronosyltransferase (UGT) enzymes and their inter‐correlations: a meta‐analysis
CN104520435A (zh) 基于细胞的探询式分析及其应用
Caliandro et al. Protein crystallography and fragment-based drug design
Shen et al. Structural evidence for direct interactions between the BRCT domains of human BRCA1 and a phospho-peptide from human ACC1
BRPI0214840B1 (pt) métodos para a detecção de mutações oncogênicas humanas, métodos automatizados para detectar uma mutação e método e ensaio para identificar um ou mais compostos tendo atividade anti-proliferativa
Rogawski et al. Two loops undergoing concerted dynamics regulate the activity of the ASH1L histone methyltransferase
Fan et al. Harnessing reversed allosteric communication: a novel strategy for allosteric drug discovery
Gaßel et al. Mutants of protein kinase A that mimic the ATP-binding site of protein kinase B (AKT)
Mills et al. A novel disulfide bond in the SH2 Domain of the C-terminal Src kinase controls catalytic activity
Allen et al. Steered molecular dynamics simulations reveal important mechanisms in reversible monoamine oxidase B inhibition
Moscato et al. Induced fit in the selection of correct versus incorrect nucleotides by DNA polymerase β
Deibler et al. A chemical probe strategy for interrogating inhibitor selectivity across the mek kinase family
Yaneff et al. MRP4/ABCC4 as a new therapeutic target: meta-analysis to determine cAMP binding sites as a tool for drug design
Viegas et al. Modeling of human fatty acid synthase and in silico docking of acyl carrier protein domain and its partner catalytic domains
Vanarotti et al. Structural basis for the interaction between Pyk2-FAT domain and leupaxin LD repeats
Wang et al. Elucidation of the interaction loci of the human pyruvate dehydrogenase complex E2· E3BP core with pyruvate dehydrogenase kinase 1 and kinase 2 by H/D exchange mass spectrometry and nuclear magnetic resonance
Zhang et al. Dynamics of post-translational modification inspires drug design in the kinase family
Onuk et al. Effects of catalytic action and ligand binding on conformational ensembles of adenylate kinase
Gizzio et al. Evolutionary divergence in the conformational landscapes of tyrosine vs serine/threonine kinases
Juyoux et al. Architecture of the MKK6-p38α complex defines the basis of MAPK specificity and activation
Pond et al. Membrane anchoring of Hck kinase via the intrinsically disordered SH4-U and length scale associated with subcellular localization
Jagarlamudi et al. Analytical and clinical characterization of an optimized dual monoclonal sandwich ELISA for the quantification of thymidine kinase 1 (TK1) protein in human blood samples
JP5447383B2 (ja) 酵素活性をコンピュータを用いたシミュレーションにより予測する方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120229

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130829

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131216

R150 Certificate of patent or registration of utility model

Ref document number: 5447383

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees