WO2010026738A2

WO2010026738A2 - 酵素活性をコンピュータを用いたシミュレーションにより予測する方法

Info

Publication number: WO2010026738A2
Application number: PCT/JP2009/004286
Authority: WO
Inventors: 高岡裕; 三浦研爾; 西尾久英
Original assignee: 国立大学法人神戸大学
Priority date: 2008-09-05
Filing date: 2009-09-01
Publication date: 2010-03-11
Also published as: JP5447383B2; JPWO2010026738A1; WO2010026738A3

Abstract

　本発明は、タンパク質を用いて実際に酵素活性を測定しなくても、タンパク質の立体構造に基づいて酵素活性を予測可能とすることを課題とする。かかる課題は、コンピュータによりタンパク質と基質とのドッキングシミュレーションを行い、かかるドッキングシミュレーションの結果を式１または３に代入して、タンパク質の酵素活性を予測することにより解決される。

Description

酵素活性をコンピュータを用いたシミュレーションにより予測する方法

　本発明は、特定のタンパク質Ａの酵素活性をコンピュータを用いたシミュレーションにより数式を用いて予測する方法に関する。また本発明は、かかる酵素活性予測方法を実行可能な記録媒体、および装置に関する。さらに、前記酵素活性予測方法、前記記録媒体、または装置を用いて予測された結果を用いた、酵素の基質適合性の判断方法、および、基質の生体への投与間隔等を評価する方法に関する。

　本出願は、参照によりここに援用されるところの日本出願特願2008-228434号優先権を請求する。

　近年、タンパク質の構造解析に、コンピュータを用いた構造シミュレーションが取り入れられるようになっている。タンパク質の３次元構造の決定などが、コンピュータを用いて行われており、Ｘ線結晶解析により決定された３次元構造データからなるデータベースや、ホモロジーモデリング等で決定した３次元構造データからなるデータベースが構築されている（非特許文献１）。タンパク質の３次元構造データは、これらのデータベースから容易に取得することができる。

　タンパク質の３次元構造データを利用および解析して、タンパク質立体構造構築の原理や、タンパク質の作用メカニズムなどの研究が進んでいるところである。タンパク質の３次元構造データを利用した解析として、タンパク質と低分子化合物であるリガンドとのドッキングシミュレーションが挙げられる（非特許文献２）。これらのシミュレーションに関連するソフトウェア群は、複数開発されており、一般的に利用可能なレベルになっている（非特許文献２～６）。その結果、容易にタンパク質構造シミュレーションを研究に用いることが可能になってきた。

　ドッキングシミュレーションは、タンパク質とリガンドとの結合能の予測や、化合物ライブラリーから薬剤候補化合物を探索するスクリーニングなどに利用されている（特許文献１，２）。

　タンパク質には生体内で種々の化学反応を触媒する酵素が含まれる。
　生体内の酵素に、ＵＤＰ－グルクロン酸転移酵素（EC 2.4.1.17）（以下「ＵＧＴ」と称する）がある。ＵＧＴはグルクロン酸抱合を触媒する。グルクロン酸抱合により、内因性物質、生体外から投与された薬剤、食物中の化学物質、環境汚染物質などの排出パスウェイが提供されるため、ＵＧＴは一次代謝産物の排泄において重要な酵素である。ＵＧＴのうち、ＵＧＴ１Ａ１はビリルビンのグルクロン酸抱合に関与する主要な酵素であることが知られている。ＵＧＴ１Ａ１遺伝子に変異が生じた場合には、ＵＧＴ１Ａ１のビリルビンに対する酵素活性が消失または深刻に低下し、黄疸を主症状とするＧｉｌｂｅｒｔ症候群やＣｒｉｇｌｅｒ－Ｎａｊｊａｒ症候群の原因となる。ＵＧＴ１Ａ１の変異型は多数あり、変異部位によって、ビリルビンに対する酵素活性のレベルが異なっている（非特許文献７，８）。また、同じ変異部位を持つ場合でも、変異型ＵＧＴ１Ａ１の抱合活性は、薬剤によって異なる。

　ＵＧＴ１Ａ１にみられるように、タンパク質自体の構造や、触媒対象である基質に応じて、酵素の活性レベルは変化する。特定のタンパク質の特定の基質に対する酵素活性について情報を得たい場合は、組換えタンパク質を作製するなどして、実際に酵素活性を測定しなくてはならず、手間と時間がかかってしまうという問題がある。

特開2005-181104号公報特開2007-272627号公報

Pieper U, Eswar N, Davis FP, Braberg H, Madhusudhan MS, Rossi A, Marti-Renom M, Karchin R, Webb BM, Eramian D, Shen MY, Kelly L, Melo F, Sali A: MODBASE: Nucleic Acids Research 2006, 1(34):D291-D295. Morris GM, Goodsell DS, Halliday RS, Huey R, Hart WE, Belew RK, Olson AJ: J Comput Chem 1998, 19:1639-1662. Guex N, Peitsch MC: SWISS-MODEL and the Swiss-PdbViewer: Electrophoresis 1997, 18:2714-2723. Ren P, Ponder JW: J Phys Chem B 2003, 107:5933-5947. DeLano, W.L. The PyMOL Molecular Graphics System. (2008) DeLano Scientific LLC, Palo Alto, CA, USA.,　インターネット＜ＵＲＬ：http://www.pymol.org＞ Molecular Operating Environment (moe), version 2008.10. Chemical Computing Group, Inc. Montreal, Quebec, Canada, 2008,　インターネット＜ＵＲＬ：http://www.chemcomp.com＞ Udomuksorn W, Eliot DJ, Lewis BC, Mackenzie PI, Yoovathaworn K, Miners JO: Pharmacogenetics & Genomics 2007, 17(12):1017-1029. Yamamoto K, Sato H, Fujiwara Y, Doida Y, Bamba T: Biochimica et Biophysica Acta 1998, 1406:267-273.

　本発明は、タンパク質を用いて実際に酵素活性を測定しなくても、タンパク質の立体構造データに基づいて酵素活性を予測可能とすることを課題とする。

　本発明者らは上記課題を解決するために鋭意検討を重ね、コンピュータによりタンパク質と基質との分子シミュレーションを行い、なかでもドッキングシミュレーションの結果を数式を用いて解析することにより、タンパク質の酵素活性を予測することが可能であることを見出し、本発明を完成した。

　すなわち、本発明は以下よりなる。
１．タンパク質Ａの酵素活性をコンピュータを用いたシミュレーションにより予測する方法であって、
酵素活性がタンパク質Ａへの基質の進入の向きにより規定されるようなタンパク質であり、
タンパク質Ａの酵素活性ｆが以下の式１により算出される方法；

式中、ｇは基質ごとに固有の定数であり、Ｅはタンパク質Ａと補酵素とのドッキングの酵素活性に対する寄与度であり、βはタンパク質への基質の進入の向きの酵素活性に対する寄与度であり、ａは生体内環境による影響を表す定数であり、Ｎとｎは、タンパク質Ａと基質とのドッキングシミュレーションにより得られる値であり、Ｎはタンパク質Ａと基質とのドッキングシミュレーションの総回数であり、Ｎは２以上であり、ｎは酵素反応を受け得る向きで基質がタンパク質Ａに進入した回数である。
２．タンパク質Ａの立体構造データが、タンパク質Ａとは別のタンパク質Ｂの立体構造データに基づいて計算されるものであり、βが以下の式２によって算出される前項１に記載の方法：
式中、Ｎ_ｗとｎ_ｗは、タンパク質Ｂと基質とのドッキングシミュレーションにより得られる値であり、Ｎ_ｗはタンパク質Ｂと基質とのドッキングシミュレーションの総回数であり、Ｎ_ｗは２以上であり、ｎ_ｗは酵素反応を受け得る向きで基質がタンパク質Ｂに進入した回数である。
３．タンパク質Ｂの酵素活性に対するタンパク質Ａの相対的な酵素活性をコンピュータを用いたシミュレーションにより予測する方法であって、
酵素活性がタンパク質Ａへの基質の進入の向きにより規定されるようなタンパク質であり、
タンパク質Ａの相対的な酵素活性ｆ’が以下の式３により算出される方法；

式中、ｇは基質ごとに固有の定数であり、Ｅはタンパク質Ａと補酵素とのドッキングの酵素活性に対する寄与度であり、ａは生体内環境による影響を表す定数であり、βはタンパク質への基質の進入の向きの酵素活性に対する寄与度であり、次の式２により表され；

Ｎとｎは、タンパク質Ａと基質とのドッキングシミュレーションにより得られる値であり、Ｎはタンパク質Ａと基質とのドッキングシミュレーションの総回数であり、Ｎは２以上であり、ｎは酵素反応を受け得る向きで基質がタンパク質Ａに進入した回数であり、Ｎ_ｗとｎ_ｗはタンパク質Ｂと基質とのドッキングシミュレーションにより得られる値であり、Ｎ_ｗはタンパク質Ｂと基質とのドッキングシミュレーションの総回数であり、Ｎ_ｗは２以上であり、ｎ_ｗは酵素反応を受け得る向きで基質がタンパク質Ｂに進入した回数である。
４．Ｅが、下記の式１６または式１７により表される、前項１～３のいずれか１に記載の方法：

（式１６中、γはタンパク質への補酵素の進入の向きの酵素活性に対する寄与度であり、次の式２１により表され、

Ｌとｌは、タンパク質Ａと補酵素とのドッキングシミュレーションにより得られる値であり、Ｌはタンパク質Ａと補酵素とのドッキングシミュレーションの総回数であり、Ｌは２以上であり、ｌは酵素反応が進行し得る向きで補酵素がタンパク質Ａに進入した回数であり、Ｌ_ｗとｌ_ｗはタンパク質Ｂと補酵素とのドッキングシミュレーションにより得られる値であり、Ｌ_ｗはタンパク質Ｂと補酵素とのドッキングシミュレーションの総回数であり、Ｌ_ｗは２以上であり、ｌ_ｗは酵素反応が進行し得る向きで補酵素がタンパク質Ｂに進入した回数である）；

（式１７中、ｍはタンパク質Ａと補酵素とのドッキングモデルをクラスタリングして得られたクラスタ内のモデル数であり、ｍ_ｗはタンパク質Ｂと補酵素とのドッキングモデルをクラスタリングして得られたクラスタ内のモデル数であり、δはクラスタ内のモデル数の酵素活性への寄与度を表す。）
５．式１または式３において、

について、Sigmoid関数を導入する、前項１～４のいずれか１に記載の方法。
６．２以上のタンパク質Ａについてドッキングシミュレーションを行い、
ｇとａが、ドッキングシミュレーションにより得られた計算値ｙと、測定された値ｙ’との二乗誤差を最小にする値であり、下記の式４を用いて算出される、前項２～５のいずれか１に記載の方法。

式中、ｙ_ｗとｙ’_ｗはタンパク質Ｂについての値であり、ｙ_Ａ１とｙ’_Ａ１、ｙ_Ａｐとｙ’_Ａｐはタンパク質Ａについての値であり、ｐは２以上の数を表す。
７．タンパク質と基質とのドッキングシミュレーションが以下の工程を含む前項１～６のいずれか１に記載の方法：
（ａ）タンパク質Ｂの立体構造データを入手し、タンパク質Ａの立体構造データをタンパク質Ｂの立体構造データに基づいて計算し、
（ｂ）タンパク質ＡまたはＢと補酵素とのドッキングシミュレーションを行い、熱力学的に安定なドッキングモデルを決定し；
（ｃ）タンパク質ＡまたはＢと基質とのドッキングのグリッドを設定し；
（ｄ）タンパク質Ｂと基質とのドッキングシミュレーションをＮ_ｗ回行い、Ｎ_ｗは２以上であり、酵素反応を受け得る向きで基質がタンパク質Ｂに進入した回数ｎ_ｗを計数し、
（ｅ）タンパク質Ａと基質とのドッキングシミュレーションをＮ回行い、Ｎは２以上であり、酵素反応を受け得る向きで基質がタンパク質Ａに進入した回数ｎを計数する。
８．工程（ｂ）の後に次の工程（ｂ－１）を行い；
工程（ｂ－１）タンパク質ＡまたはＢと補酵素とのドッキングモデルをクラスタリングし、クラスタリングして得られたクラスタ内の２以上のモデルについてinduced fitを行い、
工程（ｄ）において、induced fit後の各モデルについて、基質とのドッキングシミュレーションを行う、
前項１～７のいずれか１に記載の方法。
９．タンパク質Ａが変異型タンパク質である前項１～７のいずれか１に記載の方法。
１０．タンパク質ＡがＵＤＰ－グルクロン酸転移酵素であり、補酵素がＵＤＰ－グルクロン酸である、前項４～９のいずれか１に記載の方法。
１１．タンパク質Ａがｇとａの算出のために用いた変異型タンパク質以外の変異型タンパク質であり、算出されたｇとａの値を用いて酵素活性の予測を行う、前項６～１０のいずれか１に記載の方法。
１２．前項１～１１のいずれか１に記載の方法を実行するために、コンピュータを下記の手段として機能させるプログラムを担持する記録媒体：
　（１）入力されたアミノ酸配列情報に基づいて、タンパク質Ａの立体構造データを計算する手段、
　（２）タンパク質Ａの立体構造データと、ドッキングシミュレーションの対象となる基質の立体構造データを記憶する手段、
　（３）前記記憶された、タンパク質Ａの立体構造データと基質の立体構造データを用いて、タンパク質Ａと基質とのドッキングシミュレーションを行うシミュレーション手段、
　（４）シミュレーションにより得られた結果を記憶する手段、
　（５）記憶されたシミュレーション結果に基づいて、タンパク質Ａの酵素活性を算出する手段、
　（６）算出された酵素活性を表示する手段。
１３．前項１～１１のいずれか１に記載の方法を実行するために、下記の手段を担持する装置；
　（１）入力されたアミノ酸配列情報に基づいて、タンパク質Ａの立体構造データを計算する手段、
　（２）タンパク質Ａの立体構造データと、ドッキングシミュレーションの対象となる基質の立体構造データを記憶する手段、
　（３）前記記憶された、タンパク質Ａの立体構造データと基質の立体構造データを用いて、タンパク質Ａと基質とのドッキングシミュレーションを行うシミュレーション手段、
　（４）シミュレーションにより得られた結果を記憶する手段、
　（５）記憶されたシミュレーション結果に基づいて、タンパク質Ａの酵素活性を算出する手段、
　（６）算出された酵素活性を表示する手段。
１４．前項１～１１のいずれか１に記載の方法、前項１２に記載の記録媒体、または前項１３に記載の装置を用いて、２以上の基質について、基質ごとのタンパク質Ａの酵素活性を予測し、得られた２以上の予測結果に基づいて目的の基質を選択する、基質適合性の判定方法。
１５．前記基質が生体に投与される薬剤であって、前項１４に記載の方法を用いて、薬剤の投与量および／または投与間隔、投与頻度を評価する方法。

　本発明によれば、実際にタンパク質を用いて酵素活性の測定をすることなく、タンパク質の立体構造データに基づいて酵素活性を予測することができる。例えば組換えタンパク質を作製し、実際に酵素活性の測定をする場合には、数週間の時間を要するが、本発明の方法を用いることにより、数時間で酵素活性の予測をすることが可能である。また、本発明により予測された酵素活性は、実際にタンパク質を用いて測定して得られた値と相関性が見られ、信頼性が高い。

コンピュータを用いて計算された各種ＵＧＴ１Ａ１の立体構造を示す。（実施例１）各種ＵＧＴ１Ａ１とＵＤＰＧＡとのドッキングモデルを示す。（実施例２）各種ＵＧＴ１Ａ１とＵＤＰＧＡとのドッキングにおけるドッキングエネルギーの分布を示す。（実施例２）基質のＵＧＴ１Ａ１への進入の２つの向きを示す。（実施例３） in vitro実験における変異型ＵＧＴ１Ａ１の抱合活性を示す。（実施例４）変異型ＵＧＴ１Ａ１の抱合活性のin vitro測定値と、シミュレーションに基づく計算値との比較を示す。（実施例６）野生型ＵＧＴ１Ａ１と３４種の変異型ＵＧＴ１Ａ１の抱合活性のシミュレーションに基づく計算値を示す。（実施例６）ＵＧＴ１Ａ１とビリルビンとのドッキングシミュレーションのためのグリッドを示す（ａ：抱合反応空間の断面を表示した図、ｂ：抱合反応空間の正面から見た図）。（実施例７）変異型ＵＧＴ１Ａ１の抱合活性のin vitro測定値（文献報告）と、シミュレーションに基づく計算値との比較を示す。（実施例７）変異型ＵＧＴ１Ａ１の抱合活性のin vivo測定値（文献報告）と、シミュレーションに基づく計算値との比較を示す。（実施例８）変異型ＵＧＴ１Ａ１の抱合活性のin vitro測定値（文献報告）と、シミュレーションに基づく計算値との比較を示す。（実施例９）変異型ＵＧＴ１Ａ１の抱合活性のin vivo測定値（文献報告）と、シミュレーションに基づく計算値との比較を示す。（実施例１０）変異型ＵＧＴ１Ａ１の抱合活性のin vivo測定値（文献報告）と、シミュレーションに基づく計算値との比較を示す。（実施例１１）水分子を付加して構造計算した各種ＵＧＴ１Ａ１とＵＤＰＧＡとのドッキングシミュレーションにおけるドッキングエネルギーの分布を示す。（実施例１２）水分子を付加して構造計算した各種ＵＧＴ１Ａ１と基質とのドッキングシミュレーションの結果を示す。（実施例１２）水分子を付加して構造計算した各種ＵＧＴ１Ａ１と基質とのドッキングシミュレーションの結果と、各種ＵＧＴ１Ａ１の抱合活性のin vitro測定値との比較を示す。（実施例１２）水分子を付加して構造計算した変異型Ａｒｌ６と、ＧＴＰγＳもしくはＧＤＰとのドッキングシミュレーションの結果を示す。（実施例１２） induced fitを行った場合の、各種ＵＧＴ１Ａ１と基質とのドッキングシミュレーションの結果を示す。（実施例１３） induced fitを行った場合の、各種ＵＧＴ１Ａ１と基質とのドッキングシミュレーションの結果と、各種ＵＧＴ１Ａ１の抱合活性のin vitro測定値との比較を示す。（実施例１３）クラスタ内の全モデルに対してinduced fitを行った各種ＵＧＴ１Ａ１と基質とのドッキングシミュレーションの結果と、各種ＵＧＴ１Ａ１の抱合活性のin vitro測定値との比較を示す。（実施例１３）式１０における項ＲにSigmoid関数を導入して算出した、各種ＵＧＴ１Ａ１の抱合活性の計算値と、各種ＵＧＴ１Ａ１の抱合活性のin vitro測定値との比較を示す。（実施例１５）式１０における項ＲにSigmoid関数を導入して算出した、野生型ＵＧＴ１Ａ１と３４種の変異型ＵＧＴ１Ａ１の抱合活性の計算値を示す。（実施例１５）各種ＵＧＴ１Ａ１の抱合活性のin vitro測定値と、シミュレーションに基づく計算値との比較を示す。（実施例１６）

　本発明は、特定のタンパク質Ａの酵素活性をコンピュータを用いたシミュレーションにより予測する方法に関する。一般にタンパク質の酵素活性は、基質の種類に応じて違いがある。本発明においては、下記の式１を用いることにより、特定の基質に対する特定のタンパク質Ａの酵素活性を予測することができ、基質、タンパク質Ａともに、種々の種類を選択して組み合わせ、解析を行うことができる。

　本発明において解析の対象となるタンパク質Ａは、酵素活性がタンパク質Ａへの基質の進入の向きにより規定されるようなタンパク質である。一般的にタンパク質の酵素活性のレベルは、タンパク質の量と、タンパク質の性質により規定される。生体内では、タンパク質の量はタンパク質の合成・分解のバランスにより制御され、タンパク質が他の生体分子と可逆的に作用したり、立体構造が変化することによりタンパク質の性質が変化する。本発明において予測される「酵素活性」は、タンパク質の立体構造に基づくタンパク質の性質（触媒能）であり、かかる立体構造に基づく触媒能は、補酵素とのドッキングエネルギー、補酵素のタンパク質への進入の向き、基質の進入口の断面の大きさ、基質とのドッキングエネルギー、基質と触媒部位との距離、基質のタンパク質への進入の向きなど、種々の要因により規定されると考えられる。これらの要因のうち、特に基質のタンパク質への進入の向きにより酵素活性（タンパク質の立体構造に基づく触媒能）が規定されるタンパク質について、式１を用いた本発明により酵素活性（タンパク質の立体構造に基づく触媒能）を予測することが可能である。

　かかるタンパク質Ａは、いかなる反応を触媒する酵素であってもよく、細胞膜や、細胞質内等のいかなる場所に存在する酵素であってもよい。タンパク質Ａは、補酵素から基質への原子団の転移を触媒する転移酵素であることが好ましい。中でも、グリコシル基転移酵素が好ましく、グリコシル基転移酵素としては、例えばＵＤＰ－グルクロン酸転移酵素（以下「ＵＧＴ」と称する）、ラクトースシンターゼ（lactose synthase）（EC 2.4.1.22）が挙げられる。ＵＧＴは配列相同性と遺伝子構造によってＵＧＴ１Ａ、ＵＧＴ２Ａ、ＵＧＴ２Ｂの３つのサブファミリーに区別される。サブファミリーＵＧＴ１Ａは染色体２ｑ３７に位置し、９種類のアイソフォーム、ＵＧＴ１Ａ１、ＵＧＴ１Ａ３、ＵＧＴ１Ａ４、ＵＧＴ１Ａ５、ＵＧＴ１Ａ６、ＵＧＴ１Ａ７、ＵＧＴ１Ａ８、ＵＧＴ１Ａ９、ＵＧＴ１Ａ１０が存在する。これらのアイソフォームは選択的スプライシングにより変化する最初のエキソンと、共通する４つのエキソンとからなる。９種類のアイソフォームの１種である、ＵＧＴ１Ａ１が本発明において解析されるタンパク質として特に好ましい。

　本発明では、タンパク質Ａと基質のドッキングシミュレーションをコンピュータ上で行うことが必須である。ドッキングシミュレーションに必要なタンパク質Ａの立体構造データは、公知のデータベースからダウンロードするか、Ｘ線結晶構造解析、核磁気共鳴法などにより入手するか、または、公知のタンパク質Ｂの立体構造データに基づいて計算して入手することができる。公知のタンパク質Ｂの立体構造データは、公知のデータベースからダウンロードするか、Ｘ線結晶構造解析などにより入手することができる。

　タンパク質Ｂは、タンパク質Ａの立体構造データを計算するための基準となるタンパク質であり、タンパク質Ａとは異なるタンパク質であるが、タンパク質Ａと同様の触媒作用を有するものである。またタンパク質Ｂは、タンパク質Ａと高いアミノ酸相同性（２５～３０％以上、好ましくは４０％以上）を有しており、かつタンパク質Ａと構造類似性を有しているものが好ましい。

　タンパク質Ａは、基準となるタンパク質（タンパク質Ｂ）とアミノ酸配列が相違するものである。タンパク質Ａとタンパク質Ｂの関係としては、例えば、変異型タンパク質と野生型タンパク質の関係や、互いにアイソフォームの関係などが挙げられる。さらに具体的には、変異型タンパク質と野生型タンパク質との関係では、タンパク質Ａが変異型ＵＧＴ１Ａ１であり、タンパク質Ｂは野生型ＵＧＴ１Ａ１であり、アイソフォームの関係では、タンパク質ＡがＵＧＴ１Ａ６であり、タンパク質ＢがＵＧＴ１Ａ１である場合などが例示される。

　タンパク質Ａとタンパク質Ｂの関係が変異型タンパク質と野生型タンパク質である場合、タンパク質Ａのアミノ酸配列は、タンパク質Ｂのアミノ酸配列においてアミノ酸が置換、欠失、挿入、および／または付加されているものである。置換、欠失、挿入、および／または付加されているアミノ酸の個数は１以上であればよい。また、変異型タンパク質には、現在同定されていないあらゆる変異部位を持つタンパク質が含まれる。現在同定されていない変異部位は、天然に存在する変異部位であってもよいし、天然には存在しない人工的な変異部位であってもよい。

　タンパク質Ａと基質のドッキングシミュレーションについて説明する。
　まず、タンパク質Ａの立体構造データを入手する。タンパク質Ａの立体構造データは、公知のデータベースからダウンロードする、Ｘ線結晶構造解析、核磁気共鳴法などにより入手する、または、公知のタンパク質Ｂの立体構造データに基づいて計算して入手することができる。公知のタンパク質Ｂの立体構造データは、公知のデータベースからダウンロードする、または、Ｘ線結晶構造解析などにより入手することができる。データベースとしては、PDB（http://www.pdbj.org/）、MODBASE（http://modbase.compbio.ucsf.edu/modbase-cgi/index.cgi, Morris GM et al.: J Comput Chem 1998, 19:1639-1662）が例示される。

　タンパク質Ａの立体構造データは、自体公知の方法およびソフトウェアを用いて、公知のタンパク質Ｂの立体構造データに基づいて計算することが可能である。例えば、タンパク質Ｂの立体構造データを用いてホモロジーモデリングなどの手法を用いて計算すればよい。立体構造の計算に用いるソフトウェアとしては、公知のものを使用可能であり、今後開発されるものも使用可能である。以下に具体的に例示して、立体構造データの構築の方法を説明する。タンパク質Ａが１アミノ酸置換の変異型ＵＧＴ１Ａ１であり、タンパク質Ｂが野生型ＵＧＴ１Ａ１である場合を例示する。

　野生型ＵＧＴ１Ａ１の立体構造データを、MODBASE（accession number: Q5DT03）よりダウンロードする。ダウンロードした野生型ＵＧＴ１Ａ１の立体構造データに、PyMOLプログラム（http://pymol.sourceforge.net/, DeLano WL: DeLano Scientific, Palo alto, CA, USA; 2002）を用いて適切に水素原子を追加し、SWISS-PDBViewerプログラム（http://spdbv.vital-it.ch/, Guex N, Peitsch MC: Electrophoresis 1997, 18: 2714-2723）を用いて、変異型ＵＧＴ１Ａ１の立体構造データを作成する。例えば、公知の変異部位を持つ、Ｇ７１Ｒ変異型ＵＧＴ１Ａ１（７１番目のグリシンがアルギニンに置換）、Ｆ８３Ｌ変異型ＵＧＴ１Ａ１（８３番目のフェニルアラニンがロイシンに置換）、Ｉ３２２Ｖ変異型ＵＧＴ１Ａ１（３２２番目のイソロイシンがバリンに置換）などについて、立体構造データを作成することができる。TINKERパッケージ（Ren P, Ponder JW: J Phys Chem B 2003, 107:5933-5947）のminimizeプログラムとAMBER99力場パラメータによるエネルギー最小化計算を、RMS勾配が例えば0.3になるまで行い、各タンパク質の立体構造を計算する。力場等は、後の工程で用いるドッキングシミュレーションのソフトウェアに応じて適宜設定可能である。計算されたＧ７１Ｒ変異型ＵＧＴ１Ａ１、Ｆ８３Ｌ変異型ＵＧＴ１Ａ１、Ｉ３２２Ｖ変異型ＵＧＴ１Ａ１の三次元構造を図１に示す。

　タンパク質Ａの立体構造データを計算する際、ＵＧＴ１Ａ１の場合と同様に水分子を付加せずに計算をおこなってもよいが、水分子を付加して計算を行ってもよい。例えば、タンパク質Ａが細胞膜に存在するタンパク質の場合は、水分子を付加せずに、上述の手法で計算することが好ましい。タンパク質Ａが細胞質に存在するタンパク質の場合は、上述の手法に加えて、水分子を付加して立体構造データを計算することが好ましい。タンパク質Ａの存在する箇所や、触媒反応の起こる部位などについて、疎水性度および親水性度を考慮することにより水分子付加の要否を決定して、立体構造データの計算を行うことが可能である。なお、タンパク質Ａへの水分子の付加は、MOE（Chemical Computing Group Inc.）等のプログラムを用いて行うことができる。

　次に、ドッキングプログラムにより、タンパク質Ａの立体構造データを用いてドッキングシミュレーションを行う。基質や補酵素のデータは、既存のデータベース（例えば、ChemIDPlus（http://chem.sis.nlm.nih.gov/chemidplus/）など）からダウンロードすることができる。ドッキングシミュレーションに用いるソフトウェアとしては、公知のものや今後開発されるものを使用可能であり、Dock（http://dock.compbio.ucsf.edu/）、AutoDock（http://scripps.edu/mb/olson/doc/autodock/）、GOLD（http://ccdc.cam.ac.uk/products/life_sciences/gold/）、MOEなどが例示される。それぞれのソフトウェアの使用方法に従って、ドッキングシミュレーションを行えばよい。

　タンパク質Ａが補酵素を必要とする酵素（例えば転移酵素）である場合は、まず補酵素とタンパク質Ａとのドッキングシミュレーションを行い、安定なドッキングモデルを決定する必要がある。基質とのドッキングシミュレーションには、補酵素とタンパク質Ａとの安定なドッキングモデルを用いればよい。補酵素とタンパク質Ａとの安定なドッキングモデルは、１つであっても複数であってもよい。１つの安定なドッキングモデルを用いる場合は、後述する手法にて最も安定なドッキングモデルを選択して用いることができる。複数の安定なドッキングモデルを用いる場合は、後述する手法にて、補酵素とタンパク質Ａとのドッキングモデルについて階層型クラスタリングを行って得られるクラスタ（最も安定な集合Ｃ）内の２以上のドッキングモデル、好ましくは全ドッキングモデルを用いることができる。

　変異型ＵＧＴ１Ａ１について、AutoDock 4プログラム（Morris GM et al.: J Comput Chem 1998, 19:1639-1662）を用いたドッキングシミュレーションを例示しながら説明する。
　ＵＧＴはグルクロン酸抱合に関与する酵素であり、補酵素であるＵＤＰ－グルクロン酸（以下「ＵＤＰＧＡ」と称する）から、基質（例えば、生体内物質であるビリルビンや、薬剤であるイリノテカン）にグルクロン酸を転移させる機能を持つ。ＵＧＴ１Ａ１と基質とのドッキングシミュレーションを行うために、まず、ＵＧＴ１Ａ１とＵＤＰＧＡのドッキングシミュレーションを行う。

　ＵＤＰＧＡの立体構造データは、ChemIDPlusに登録されているデータをダウンロードして用いることができる（registry number: 2616-64-0）。５種類のＵＤＰＧＡの立体構造データが存在するが、これら５種類の立体構造データを用いてドッキングシミュレーションを行えばよい。
　以下にAutoDockを用いてドッキングシミュレーションを行った例を用いて説明する。まず、ＵＤＰＧＡの配置を探索するマップを、グリッド間隔0.375Å、60×60×60ポイントの立方体としてAutoGridプログラムを用いて生成する。グリッド探索アルゴリズムは、ラマルク型遺伝アルゴリズムを使用すればよい。その他のパラメータはAutoDock 4のデフォルト値を使用すればよい。

　変異型ＵＧＴ１Ａ１と５種類のＵＤＰＧＡの組み合わせ毎に、複数回、例えば１０～１００回ずつドッキングシミュレーションを実行する。１０回ずつシミュレーションを行った場合は、１種の変異型ＵＧＴ１Ａ１について、５０個の計算結果が得られる。得られた５０個の計算結果のうち、抱合反応可能な向きでＵＤＰＧＡがドッキングしているものについて、ドッキングエネルギーの平均値を計算する。ドッキングエネルギーΔＧは下記の式６で計算される。

　変異型ＵＧＴ１Ａ１とＵＤＰＧＡとのドッキングシミュレーションにて得られた５０個の結果を、分子間エネルギー、ＵＤＰＧＡの分子内部エネルギー、およびアンバウンドエネルギーのそれぞれについて、低い順に順位づけを行う。各結果について分子間エネルギー、ＵＤＰＧＡの分子内部エネルギー、およびアンバウンドエネルギーの３種類の順位の順位和を算出し、順位和が最小のドッキング結果を最も安定なドッキングモデルとして選択し、変異型ＵＧＴ１Ａ１とＵＤＰＧＡのドッキングモデルとして決定することができる。この時、ドッキングモデルに含まれる水素結合は、PyMOLを用いて検出すればよい。図２に各種ＵＧＴ１Ａ１とＵＤＰＧＡとのドッキングモデルを示す。

　変異型ＵＧＴ１Ａ１と基質のドッキングシミュレーションを行うために、グリッドを決定する必要がある。

　変異型ＵＧＴ１Ａ１とＵＤＰＧＡとのドッキングモデルから、ドッキングエネルギーが低い一群のシミュレーション結果を、群平均法（２つのクラスタを順次統合していく階層型クラスタリングの一種）によるクラスタリングで、グループ化して定義する。

　群平均法では、全てのクラスタ間の距離を計算し、最も距離の小さい２つのクラスタを統合する。クラスタＸとＹの間の距離ｄ（Ｘ，Ｙ）は以下の式７のように定義される。

　変異型ＵＧＴ１Ａ１と抱合反応可能な向きで結合しているＵＤＰＧＡとの分子間エネルギー、分子内部エネルギー、アンバウンドエネルギーの順位和を指標として群平均法でクラスタリングを行い、「相対的に低いドッキングエネルギーを有する数種類のドッキング構造」の集合（本明細書にて「最も安定な集合Ｃ」とも称する。）を求める。
　ここで、最も安定な集合Ｃの至適な粒度を決定することで、グループ化が可能である。クラスタＸの粒度Ｇ（Ｘ）を、抱合反応可能なＵＤＰＧＡ全体の集合をＳとした次式８により計算する。

　階層型クラスタリングでは、様々な粒度のクラスタリング結果が得られる。粒度の決定のために、野生型、Ｇ７１Ｒ変異型ＵＧＴ１Ａ１、Ｆ８３Ｌ変異型ＵＧＴ１Ａ１、Ｉ３２２Ｖ変異型ＵＧＴ１Ａ１と、ＵＤＰＧＡのドッキングシミュレーション結果を使って、群平均法によるクラスタリングを行い、全てのクラスタの粒度を計算してその分布を解析する。例えば、５％水準で、平均と比して有意に大きい粒度を除外するものとしたので、棄却域の値は０．５６であった。つまり、粒度０．５６以下のクラスタのうち最大のものを、グループとして定義可能であった。

　最も安定な集合Ｃは、抱合反応可能なドッキング結果から群平均法で得られたクラスタをgac(S)と定義して、次の式９のように計算する。

　上記式９により定義されたクラスタの位置から分子の揺らぎを加味した抱合反応の場を決定することができる。
　変異型ＵＧＴ１Ａ１と基質とのドッキングシミュレーションにおいて、基質の大きさに合わせて、グリッドの最奥の位置を決定すればよい。基質が、アセトアミノフェンなどの比較的小さな化合物である場合は、グリッドは１つ設定すればよいが、ビリルビンなどの比較的大きな化合物である場合は、グリッドを複数、例えば３つ設定すればよい。グリッドの個数は、基質の大きさだけではなく、タンパク質の反応の場の立体構造も加味して決定される。

　また、かかるクラスタリングにより得られたクラスタ（最も安定な集合Ｃ）に含まれる補酵素とＵＧＴ１Ａ１とのドッキングモデルのうち、２以上を選択して、基質とのドッキングシミュレーションに用いることができる。好ましくは、最も安定な集合Ｃに含まれる全ドッキングモデルについて、基質とのドッキングシミュレーションを行う。

　定めたグリッド位置を用いて、ＵＧＴ１Ａ１と基質（例えば、アセトアミノフェン（以下「ＡＡＰ」と称する）、エストラジオール（以下「Ｅ２」と称する）、ビリルビン等）とのドッキングシミュレーションを行う。ＡＡＰとＥ２の立体構造データはChemIDPlusに登録されているものを用いればよい。ドッキングシミュレーションは、ドッキングモデルごと及び／又は基質ごとに複数回、例えば１０～１０００回行えばよい。１００回程度でもよい。ドッキングシミュレーションごとに、基質のＵＧＴ１Ａ１への進入の向きを評価する。基質の変異型ＵＧＴ１Ａ１への進入の向きが、抱合反応可能な向きであった場合を計数する。

　基質のタンパク質への進入の向きは、基質のＵＧＴ１Ａ１への進入の向きを例にすると、図４に示す２種類が考えられる。＜向きＩ＞では、基質のヒドロキシル基がＵＤＰＧＡに向いており、グルクロン酸抱合反応の進行が可能である。＜向きＩＩ＞では、基質のヒドロキシル基がＵＤＰＧＡの反対側に向いており、グルクロン酸抱合反応の進行が困難である。本発明では、基質が酵素反応を受け得る向きでタンパク質に進入した回数、すなわちＵＧＴ１Ａ１の場合は、基質が＜向きＩ＞でＵＧＴ１Ａ１に進入したドッキングシミュレーションの回数を計数する。

　また、タンパク質Ａと補酵素とのドッキングモデルを得た後、基質とのドッキングシミュレーションの前に、induced fit（誘導結合）を行ってもよい。本発明においてinduced fitとは、Flexible Dockingを行うことによりタンパク質の活性部位の立体構造を変化させることを意味する。Flexible Dockingは、MOE（Chemical Computing Group Inc.）等のプログラムにより行うことができる。

　induced fitは、タンパク質Ａと補酵素とのドッキングモデルを得た後、基質とのドッキングシミュレーションに用いるドッキングモデルを対象に行う。１種のドッキングモデルに対して行ってもよいし、２以上の複数のドッキングモデルに対して行ってもよいが、上述の手法でクラスタリングされた「最も安定な集合Ｃ」のクラスタに含まれる全てのドッキングモデルに対して行うことが好ましい。induced fitを行った後の補酵素とのドッキングモデルを用いて、基質とのドッキングシミュレーションを行い、基質が酵素反応を受け得る向きでタンパク質に進入した回数を計数する。

　ドッキングシミュレーションにより得られた結果を用いて、タンパク質Ａの酵素活性を予測する。タンパク質Ａの酵素活性ｆは、以下の式１０を用いて一般的に算出することができる。

　ｇは基質ごとに固有の定数であり、Ｅはタンパク質Ａと補酵素とのドッキングの酵素活性に対する寄与度であり、Ｒは基質が酵素反応を受け得る向きで進入した割合であり、ａは、タンパク質Ａの酵素反応が進行している環境、例えば生体内環境による影響を表す定数である。

　Ｒはドッキングシミュレーションにより得られた結果を用いて以下の式１１を用いて表される。

式中、Ｎとｎは、タンパク質Ａと基質とのドッキングシミュレーションにより得られる値であり、Ｎはタンパク質Ａと基質とのドッキングシミュレーションの総回数であり、Ｎは２以上であり、ｎは酵素反応を受け得る向き（ＵＧＴ１Ａ１の場合は、＜向きＩ＞）で基質がタンパク質Ａに進入した回数である。βはタンパク質への基質の進入の向きの酵素活性に対する寄与度である。例えば、タンパク質Ａが変異型であり、タンパク質Ａの立体構造データをタンパク質Ｂの立体構造データに基づいて計算した場合、βはタンパク質Ｂへの基質の進入の向きの酵素活性に対する寄与度とすればよい。

　したがって、本発明の方法では下記の式１を用いて、ドッキングシミュレーションから得られた結果を用いてタンパク質Ａの酵素活性ｆを予測することができる。

　また、タンパク質Ｂの酵素活性に対するタンパク質Ａの相対的な酵素活性ｆ’は、以下の式３により算出される。

　式中、Ｎ_ｗとｎ_ｗは、タンパク質Ｂと基質とのドッキングシミュレーションにより得られる値であり、Ｎ_ｗはタンパク質Ｂと基質とのドッキングシミュレーションの総回数であり、Ｎ_ｗは２以上であり、ｎ_ｗは酵素反応を受け得る向きで基質がタンパク質Ｂに進入した回数である。

　また、βは以下の式２によって算出することができる。

　タンパク質Ａと補酵素とのドッキングにおける、補酵素の向きやドッキングエネルギーなどが酵素活性に寄与していないか、もしくは、関与が極めて小さい場合は、Ｅ＝１とすることができる。ドッキングエネルギーが酵素活性に関与していない場合とは、例えばドッキングシミュレーションにより得られたドッキングエネルギー結果が、測定された値ｙ’と相関がない場合を意味する。この場合、式１と式３はそれぞれ以下の式１２と式１３により表される。

　また、式１におけるＥ（補酵素とタンパク質Ａとのドッキングの酵素活性に対する寄与度）は、補酵素の酵素への進入の向きが酵素活性に対して寄与する場合は、以下の式１６または式１７のいずれかを代入することも可能である。好ましくは、式１７を代入する。

（式１７中、ｍはタンパク質Ａと補酵素とのドッキングモデルをクラスタリングして得られたクラスタ内のモデル数であり、ｍ_ｗはタンパク質Ｂと補酵素とのドッキングモデルをクラスタリングして得られたクラスタ内のモデル数であり、δはクラスタ内のモデル数の酵素活性への寄与度を表す。δは、ドッキングシミュレーションの結果に基づいて式１７を用いて算出した計算値ｙと測定された値ｙ’との二乗誤差を最小にするように、下記式２３を用いて算出することができる。

　式２３中、ｙ_ｗとｙ’_ｗはタンパク質Ｂについての値であり、ｙ_Ａ１とｙ’_Ａ１、ｙ_Ａｐとｙ’_Ａｐはタンパク質Ａについての値であり、ｐは２以上の数を表す。）

　式１、３、１２、１３等において、ｇとａは、予測対象となる基質について予め設定された数値を用いることができる。あるいは、ｇとａの値が不明である場合は、２以上のタンパク質Ａについてドッキングシミュレーションを行った結果得られる計算値ｙと、測定された値ｙ’を用いて、ｇとａの値を算出することができる。例えば、計算値ｙと、測定された値ｙ’との二乗誤差を最小にするように、下記の式４を用いて、ｇとａを算出することができる。測定された値ｙ’は、大きな値から小さな値を満遍なく選択して用いることが好ましい。例えば、タンパク質Ｂに対する相対活性で示すと、１００％～１％未満まで幅広く用いることが好ましい。測定された値ｙ’が偏っている場合、例えば相対活性では１００％～５０％の値である場合は、ａ＝０として酵素活性を算出することもできる。なお、ｇとａは、喫煙等の生体外環境により影響をうけるであろう生体内環境を加味した値を設定することも可能である。

　式中、ｙ_ｗとｙ’_ｗはタンパク質Ｂについての値であり、ｙ_Ａ１とｙ’_Ａ１、ｙ_Ａｐとｙ’_Ａｐはタンパク質Ａについての値であり、ｐは２以上の数を表す。

　上記式４における測定された値ｙ’は、ドッキングシミュレーションに基づく計算値ではなく、何らかの実測値を意味する。測定された値ｙ’は例えば、組換えタンパク質を用いたアッセイで得られた実験値、論文などの文献報告や臨床検査結果などから予測される値を含む。例えばＵＧＴ１Ａ１のビリルビンに対する抱合活性は、ビリルビンの血中濃度から推定することができ、推定された値を測定された値ｙ’として使用することができる。

　変異型ＵＧＴ１Ａ１の、ＡＡＰ、Ｅ２もしくはビリルビンに対する酵素活性の予測を例示して説明する。
　まず、ＡＡＰ、Ｅ２、ビリルビンについて、各々ｇとａを算出する。Ｇ７１Ｒ変異型ＵＧＴ１Ａ１、Ｆ８３Ｌ変異型ＵＧＴ１Ａ１、Ｉ３２２Ｖ変異型ＵＧＴ１Ａ１の各々について、組換えタンパク質の酵素活性を測定することにより、測定された値ｙ’を得ることができる。組換えタンパク質の作製方法、および酵素活性の測定方法は自体公知の方法により行うことができる。例えば、実施例に記載の方法により行えばよい。また、ビリルビンに対する測定された値ｙ’として、文献報告のビリルビン抱合活性（例えば、Yamamoto K et al.: Biochem Biophys Acta 1998, 1406:267-273, Udomuksorn W et al: Pharmacogenetics & Genomics 2007, 17:1017-1029, Ciotti M et al: Biochimica et Biophysica Acta 1998, 1407:40-50）を使用することもできる。

　下記の式５を用いて、ＡＡＰ、Ｅ２、ビリルビンについて、測定された値ｙ’を代入して、二乗誤差を最小にするｇとａの値を算出する。

　その結果、ＡＡＰについて、ｇ＝１．１０５５、ａ＝０．０７２２、Ｅ２について、ｇ＝５．９４１０、ａ＝１．２５４８、ビリルビンについて、ｇ＝４７．５８、ａ＝０．０４の値を算出することができる。

　上記算出されたｇとａを用いて、変異型ＵＧＴ１Ａ１の酵素活性を予測することができる。式３にｇ、ａを代入し、ドッキングシミュレーションにより得られるＮとｎを利用して、変異型ＵＧＴ１Ａ１の算出することができる。３４種類の変異型ＵＧＴ１Ａ１の、ＡＡＰおよびＥ２についての酵素活性を算出した結果を図７に示す。

　さらに、式１および式３における

について、Sigmoid関数を導入することも可能である。Sigmoid関数とは、下記式１９で表されるＳ字型の関数である。

　本発明の式１において、Sigmoid関数を導入した計算式は、下記式２０にて表すことができる。

　ここでtは、基質の向きに対する酵素活性の感受性を表すものであり、tの値が大きい程基質の向きの僅かな差異が酵素活性を大きく変化させることとなる。tの値は、２以上のタンパク質Ａについてドッキングシミュレーションを行った結果得られる計算値ｙと、測定された値ｙ’を用いて算出することができ、以下のdの算出方法と同様にして求めることができる。dは、シミュレーションの結果を上記の式に代入して得られる計算値ｙと、in vitro 解析等による測定値ｙ’との二乗誤差を最小化する値として、下記の式２２を用いて算出することができる。

　本発明は、タンパク質Ａの酵素活性を予測する方法を実行するプログラムを担持する記録媒体、およびタンパク質Ａの酵素活性を予測する方法を実行する手段を担持する装置にも及ぶ。記録媒体に担持されるプログラムは、コンピュータを以下の手段として機能させるものであり、装置は、以下の手段を含むものである。
　（１）入力されたアミノ酸配列情報に基づいて、タンパク質Ａの立体構造データを計算する手段、
　（２）タンパク質Ａの立体構造データと、ドッキングシミュレーションの対象となる基質の立体構造データを記憶する手段、
　（３）前記記憶された、タンパク質Ａの立体構造データと基質の立体構造データを用いて、タンパク質Ａと基質とのドッキングシミュレーションを行うシミュレーション手段、
　（４）シミュレーションにより得られた結果を記憶する手段、
　（５）記憶されたシミュレーション結果に基づいて、タンパク質Ａの酵素活性を算出する手段、
　（６）算出された酵素活性を表示する手段。

　また、本発明は、タンパク質Ａの酵素活性を予測する方法、前記記録媒体、または前記装置を用いた、基質適合性の判断方法にも及ぶ。本発明における式１または３を用いて、２以上の基質について、基質ごとの特定のタンパク質Ａの酵素活性を予測し、得られた２以上の予測結果に基づいて目的の基質を選択する。例えば、タンパク質Ａが特定の変異型ＵＧＴ１Ａ１であり、基質が薬剤である場合に、本方法により、当該変異型ＵＧＴ１Ａ１による抱合活性が最も高い薬剤を検出し、選択することができる。本方法により生体内での薬剤の効能と代謝とのバランスを鑑み、薬剤を選択することも可能となる。

　さらに、本発明はタンパク質Ａの酵素活性を予測する方法、前記記録媒体、または前記装置を用いて、当該薬剤の投与量および／または投与間隔、投与頻度を評価する方法にも及ぶ。基質が特定の薬剤であり、当該薬剤が生体に投与される場合であって、生体が例えばＵＧＴ１Ａ１に変異を持つ場合に、かかる変異型ＵＧＴ１Ａ１の当該薬剤に対する酵素活性を予測し、予測結果に基づいて、当該薬剤の投与量および／または投与間隔、投与頻度を評価することが可能である。例えば、薬剤に対する変異型ＵＧＴ１Ａ１の抱合活性が低い場合は、投与量、投与頻度を低くすることを検討することが可能である。

　以下、実施例により本発明を説明するが、本発明はこれらに限定されるものではない。

（実施例１）ＵＧＴ１Ａ１の立体構造データの計算
　野生型ＵＧＴ１Ａ１の立体構造データを、MODBASEからダウンロードした（accession number: Q5DT03）。PyMOLプログラムを用いて水素原子を追加し、SWISS-PDB Viewerプログラムを用いて、Ｇ７１Ｒ変異型ＵＧＴ１Ａ１、Ｆ８３Ｌ変異型ＵＧＴ１Ａ１、Ｉ３２２Ｖ変異型ＵＧＴ１Ａ１の各変異型のデータを作成した。これらのデータを用いて、TINKERパッケージのminimizeプログラムとAMBER99力場パラメータによるエネルギー最小化計算をRMS勾配が0.3になるまで行い、各変異型の立体構造を求めた。計算された各変異型の三次元構造を図１に示す。

（実施例２）各種ＵＧＴ１Ａ１とＵＤＰＧＡとのドッキングシミュレーション
　AutoDock 4プログラムを用いて、各種ＵＧＴ１Ａ１（野生型ＵＧＴ１Ａ１、Ｇ７１Ｒ変異型ＵＧＴ１Ａ１、Ｆ８３Ｌ変異型ＵＧＴ１Ａ１、Ｉ３２２Ｖ変異型ＵＧＴ１Ａ１）とＵＤＰＧＡのドッキングシミュレーションを行った。ＵＤＰＧＡの立体構造データは、ChemIDPlusに登録されている５個のデータを用いた（registry number: 2616-64-0）。ＵＤＰＧＡの配置を探索するマップを、グリッド間隔0.375Å、60×60×60ポイントの立方体としてAutoGridプログラムを用いて生成した。グリッド探索アルゴリズムは、ラマルク型遺伝アルゴリズムを使用した。その他のパラメータはAutoDock 4のデフォルト値を使用した。
　各種ＵＧＴ１Ａ１と５個のＵＤＰＧＡの組み合わせ毎に、１０回ずつドッキングシミュレーションを実行した。計算結果は、１種の変異型ＵＧＴ１Ａ１について、５０個得られた。各々の変異型ＵＧＴ１Ａ１について、得られた５０個の計算結果のうち、抱合反応可能な向きのＵＤＰＧＡのドッキングエネルギーの平均値を計算した。なお、ドッキングエネルギーΔＧは下記の式６で計算した。

　各変異型ＵＧＴ１Ａ１とＵＤＰＧＡとのドッキングシミュレーションにて得られた５０個の結果を、分子間エネルギー、ＵＤＰＧＡの分子内部エネルギー、およびアンバウンドエネルギーのそれぞれについて、低い順に順位づけを行った。分子間エネルギー、ＵＤＰＧＡの分子内部エネルギー、およびアンバウンドエネルギーの３種類の順位の順位和が最小のドッキング結果を最も安定なドッキングモデルとして選択し、それぞれの変異型ＵＧＴ１Ａ１とＵＤＰＧＡのドッキングモデルに決定した。この時、ドッキングモデルに含まれる水素結合は、PyMOLを用いて検出した。

　図２にドッキングモデルの構造を示す。ＵＤＰＧＡのウラシル環は、野生型では３５７番目のグルタミン（Ｑ）と、Ｇ７１Ｒ変異型ＵＧＴ１Ａ１では４２番目のセリン（Ｓ）、１７３番目のヒスチジン（Ｈ）、３７５番目のセリン（Ｓ）、３９６番目のアスパラギン酸（Ｄ）と、Ｆ８３Ｌ変異型ＵＧＴ１Ａ１では３７４番目のグリシン（Ｇ）との相互作用が見られた。Ｉ３２２Ｖ変異型ＵＧＴ１Ａ１ではウラシル環と相互作用するアミノ酸は見られなかった。ＵＤＰＧＡのグルクロン酸部分は、野生型ＵＧＴ１Ａ１では３９６番目のアスパラギン酸（Ｄ）と、Ｇ７１Ｒ変異型ＵＧＴ１Ａ１では３１０番目のメチオニン（Ｍ）、３１２番目のセリン（Ｓ）、３９３番目のロイシン（Ｌ）との相互作用が見られた。Ｆ８３Ｌ変異型ＵＧＴ１Ａ１においては、グルクロン酸部分と相互作用するアミノ酸は見られなかった。Ｉ３２２Ｖ変異型ＵＧＴ１Ａ１においては、１５３番目のフェニルアラニン（Ｆ）とグルクロン酸部分との相互作用が見られた。なお、ＵＤＰＧＡ反応の場の疎水性度には大きな違いはなかった。

　抱合反応可能な向きのＵＤＰＧＡと各ＵＧＴ１Ａ１のドッキングエネルギーの分布を図３に示す。野生型とＧ７１Ｒ変異型とのドッキングエネルギー、および、Ｆ８３Ｌ変異型とＩ３２２Ｖ変異型とのドッキングエネルギーに有意差は無かった。Ｆ８３Ｌ変異型は、野生型およびＧ７１Ｒ変異型よりもドッキングエネルギーが有意に高かった。また、Ｉ３２２Ｖ変異型は野生型およびＧ７１Ｒ変異型よりもドッキングエネルギーが有意に高かった。

（実施例３）ＵＧＴ１Ａ１とＵＤＰＧＡとの複合体における基質のドッキングシミュレーション
　ＵＧＴ１Ａ１と基質とのドッキングシミュレーション条件のうち、グリッドを決定するために、まずドッキングモデルのうちからドッキングエネルギーが低い一群のシミュレーション結果を、群平均法（２つのクラスタを順次統合していく階層型クラスタリングの一種）によるクラスタリングで、グループ化して定義した。群平均法では、全てのクラスタ間の距離を計算し、最も距離の小さい２つのクラスタを統合する。クラスタＸとＹの間の距離ｄ（Ｘ，Ｙ）は以下の式７のように定義された。

　ＵＧＴ１Ａ１と抱合反応可能な向きのＵＤＰＧＡの分子間エネルギー、分子内部エネルギー、アンバウンドエネルギーの順位和を指標として群平均法でクラスタリングを行い、「相対的に低いドッキングエネルギーを有する数種類のドッキング構造」の集合を求めた。
　ここで、最も安定な集合Ｃの至適な粒度を決定することで、グループ化が可能である。クラスタＸの粒度Ｇ（Ｘ）を、抱合反応可能なＵＤＰＧＡ全体の集合をＳとした次の式８により計算した。

　階層型クラスタリングでは、様々な粒度のクラスタリング結果が得られる。
　粒度の決定のために、野生型、Ｇ７１Ｒ変異型ＵＧＴ１Ａ１、Ｆ８３Ｌ変異型ＵＧＴ１Ａ１、Ｉ３２２Ｖ変異型ＵＧＴ１Ａ１と、ＵＤＰＧＡのドッキングシミュレーション結果を使って、群平均法によるクラスタリングを行い、全てのクラスタの粒度を計算してその分布を解析した。５％水準で、平均と比して有意に大きい粒度を除外するものとしたので、棄却域の値は０．５６であった。つまり、粒度０．５６以下のクラスタのうち最大のものを、グループとして定義可能であった。

　最も安定な集合Ｃは、抱合反応可能なドッキング結果から群平均法で得られたクラスタをｇａｃ（Ｓ）と定義して、次の式９のように計算した。

　式９により定義されたクラスタの位置から分子の揺らぎを加味した抱合反応の場を決定した。そして、各変異型ＵＧＴ１Ａ１とＡＡＰもしくはＥ２とのドッキングシミュレーションにおいて、各基質の大きさに合わせたグリッドの最奥の位置を決定した。かかるグリッド位置を用いて、ＵＧＴ１Ａ１のグルクロン酸抱合反応の場への各基質の進入方向を解析した。ＡＡＰとＥ２の分子構造データはChemIDPlusに登録されているものを用い、ドッキングシミュレーションを基質ごとに１００回実行した。

　図４に基質の２つの向きを示す。向きＩは基質のヒドロキシル基がＵＤＰＧＡに向いており、グルクロン酸抱合反応の進行が可能である。向きＩＩは基質のヒドロキシル基がＵＤＰＧＡの反対側に向いており、グルクロン酸抱合反応の進行が困難である。
　表１に向きＩおよび向きＩＩの各々でドッキングした回数を示す。

　ＡＡＰでは、野生型、Ｇ７１Ｒ変異型、Ｉ３２２Ｖ変異型では大部分のドッキング結果が向きＩであった。Ｆ８３Ｌ変異型では大部分のドッキング結果が、向きＩＩであった。
　Ｅ２では、野生型、Ｉ３２２Ｖ変異型では大部分のドッキング結果において、向きＩであった。Ｇ７１Ｒ変異型、Ｆ８３Ｌ変異型では、大部分のドッキング結果が、向きＩＩであった。

（実施例４）ＵＧＴ１Ａ１のin vitroでの酵素活性測定
　ヒト肝臓ｃＤＮＡライブラリーから、ＰＣＲ増幅によりヒトＵＧＴ１Ａ１ｃＤＮＡを抽出し、pENTER^TM/D-TOPOベクター（Invitrogen, Carlsbad, CA, USA）に挿入した。Site-directed mutagenesis法を用いて、遺伝子変異をクローンｃＤＮＡに導入した。正常型および各変異型のｃＤＮＡ配列を、組み換えを用いて発現ベクターpcDNA-DEST40 Gateway^TM（Invitrogen, Carlsbad, CA, USA）に移植した。各種ＵＧＴ１Ａ１の発現ベクターをルシフェラーゼレポーターベクター（pGL3-vector）とともにLipofectamine^TM2000を用いてＣＯＳ－７細胞に導入した。４８時間後に細胞を採取し、0.1M Tri-HCl 70μl で均質化し、ルシフェラーゼとＵＧＴ１Ａ１のアッセイの酵素ソースとして使用した。TD-20/20 luminometer（Promega, Madison, WI, USA）を用いてルシフェラーゼ活性を計測し、ＵＧＴ１Ａ１の酵素活性の標準化に供した。Ｅ２のグルクロン酸抱合反応を、UGT Reaction Mix (BD Gentest, Franklin Lakes, NJ, USA)を使用して分析した。反応生成物を遠心した後、LC/MS/MS解析に供し、Ｅ２とグルクロン酸の抱合体（Ｅ２Ｇ）の量を測定した。ＡＡＰについても同様の手法を用いて抱合体（ＡＡＰＧ）の測定を行った。
　Analyst 1.3.1ソフトウェアでAPI-3000^TMLC/MS/MSシステム (Applied Biosystems-MDS Sciex, Tronto, Canada)を操作し、データ取得と解析を行った。

　ＡＡＰおよびＥ２を基質とした時の各変異型ＵＧＴ１Ａ１のin vitro抱合活性を図５に示す。Ｆ８３Ｌ変異型のＡＡＰに対する酵素活性は、野生型と比較して有意に低下していた (n=5, p<0.005)。Ｇ７１Ｒ変異型およびＦ８３Ｌ変異型のＥ２に対する酵素活性は、野生型と比較して有意に低下していた (n=5, p<0.005)。Ｆ８３Ｌ変異型のＥ２に対する酵素活性は、Ｇ７１Ｒ変異型のＥ２に対する酵素活性よりも有意に低かった (n=5, p<0.05)。

（実施例５）　ＵＧＴ１Ａ１酵素活性を予測するための数式の作成
　ＵＧＴ１Ａ１の酵素活性は、（ｉ）ＵＧＴ１Ａ１とＵＤＰＧＡのドッキング、と（ｉｉ）ＵＧＴ１Ａ１の抱合反応空間への基質の進入、の積で規定され、プロセス（ｉ）をＥ、プロセス（ｉｉ）をＲと定義することで、抱合活性ｆは次式１０で表される。

　ｇは基質に固有の定数、ａは内因性ＵＧＴ１Ａ１等の生体内環境による影響を表す定数である。ここでは、実施例２と実施例４の結果から、ＵＤＰＧＡとＵＧＴ１Ａ１とのドッキングエネルギーの抱合反応活性への関与は認められないと考えられたため、Ｅ＝１を代入した。

　プロセス（ｉｉ）では、基質の進入方向の関与を反映させる。変異型ＵＧＴ１Ａ１と基質とのドッキングシミュレーションをＮ回行い、そのうち基質が抱合反応可能な向きである結果がｎ回であった場合、プロセス（ｉｉ）のＲは次式１１で定義される。

βは、以下の式２で表される。式中、Ｎ_ｗは野生型ＵＧＴ１Ａ１と基質とのドッキングシミュレーションの総回数であり、ｎ_ｗは全Ｎ_ｗ回中、基質が野生型ＵＧＴ１Ａ１に抱合反応可能な方向で進入した回数である。

ＥとＲを式１０に代入すると、酵素活性の計算式は下記式１２で表される。

　ここで定数ｇ，ａは、計算式とin vitro実験結果の二乗誤差が最小となるように基質ごとに異なる値を設定する。

　また、式１２を用いて、変異型ＵＧＴ１Ａ１の、野生型の酵素活性に対する相対的な酵素活性ｆ’は次の式１３のように計算できる。

（実施例６）ＡＡＰと、Ｅ２に対する酵素活性の予測
　上記実施例５の式により算出された計算値ｙと、野生型およびＧ７１Ｒ変異型、Ｆ８３Ｌ変異型、Ｉ３２２Ｖ変異型のＵＧＴ１Ａ１の各基質に対する抱合活性の実験値ｙ’（実施例４）を用いて、二乗誤差を最小化するｇ，ａを次式５で計算することができる。

　式５にＡＡＰおよびＥ２のin vitro実験結果を代入し、ｇ，ａの値を求めた。その結果、ＡＡＰについて、ｇ＝１．１０５５、ａ＝０．０７２２、Ｅ２について、ｇ＝５．９４１０、ａ＝１．２５４８の値が算出された。

　まずＧ７１Ｒ変異型、Ｆ８３Ｌ変異型、Ｉ３２２Ｖ変異型のin vitroでの抱合活性の測定結果（in vitro測定値）と、式３を用いた抱合活性の算出結果（計算値）を比較した。結果を図６に示す。式３を用いて算出した抱合活性（計算値）はin vitroの抱合活性（in vitro測定値）を良く再現可能であることがわかった。

　式３を用いて、現在報告されている他の３１種類の変異型ＵＧＴ１Ａ１について、ドッキングシミュレーションを行い、抱合活性を式３を用いて算出した。全３４種類の変異型ＵＧＴ１Ａ１に関する算出結果を、図７に示した。

（実施例７）ビリルビンに対する酵素活性の予測
　ビリルビンを基質とした時の抱合活性を式３を用いて算出した。
　まず、ビリルビンとＵＧＴ１Ａ１のドッキングシミュレーションを行った。基質（ビリルビン）の分子が大きいため、基質進入方向のグリッドとして、グリッドＡ～Ｃの３つを設定した。３つのグリッドを図８に示す。野生型、およびＧ７１Ｒ変異型、Ｆ８３Ｌ変異型、Ｉ２９４Ｔ変異型とビリルビンとのドッキングシミュレーションを行い、基質の進入の向きを解析した。グリッドＡ～Ｃのそれぞれについて１００回ずつドッキングシミュレーションを行った。各グリッドについてＮとｎは、各々Ｎ_Ａ，Ｎ_Ｂ，Ｎ_Ｃ，ｎ_Ａ，ｎ_Ｂ，ｎ_Ｃとして計数した。ＮをＮ_ＡとＮ_ＢとＮ_Ｃの和（すなわち３００回）、ｎをｎ_Ａとｎ_Ｂとｎ_Ｃの和として算出した。その結果を表２に示す。

　上記結果と、野生型および文献で報告されているＧ７１Ｒ変異型、Ｆ８３Ｌ変異型、Ｉ２９４Ｔ変異型のin vitro酵素活性の値ｙ’（y'_w=1.00, y'_G71R=0.32, y'_F83L=0.05, y'_I294T=0.50）を用いて二乗誤差を最小化するｇ，ａを計算したところ、ｇ＝４４．０６、ａ＝０．１７であった。in vitro酵素活性は、Ｇ７１Ｒ変異型については、Yamamoto K et al.: Biochem Biophys Acta 1998, 1406:267-273を、Ｆ８３Ｌ変異型についてはUdomuksorn W et al.: Pharmacogenetics & Genomics 2007, 17:1017-1029を、Ｉ２９４Ｔ変異型については、Ciotti M et al: Biochimica et Biophysica Acta 1998, 1407:40-50を参照した。これらの文献では、酵素活性は正常値（野生型）に対する割合（相対活性）で示されており、Ｇ７１Ｒ変異型は３２％、Ｆ８３Ｌ変異型は５％、Ｉ２９４Ｔ変異型は５０％である。
　これらの結果を用いて式３により、各変異型ＵＧＴ１Ａ１のビリルビンに対する相対抱合活性を算出した。

　Ｇ７１Ｒ変異型、Ｆ８３Ｌ変異型、Ｉ２９４Ｔ変異型のin vitroでの抱合活性値（in vitro測定値（文献報告））と、式３を用いた抱合活性の算出結果（計算値）を比較した。結果を図９に示す。式３を用いて算出した抱合活性（計算値）はin vitroの抱合活性（in vitro測定値（文献報告））を良く再現可能であることがわかった。

（実施例８）ビリルビンに対する酵素活性の予測２
　実施例７にて得られたｇとａの値を用いて、Ｒ３３６Ｌ変異型、Ｎ４００Ｄ変異型、Ｗ４６１Ｒ変異型についてビリルビンに対する活性を算出した。
　まず、各変異型ＵＧＴ１Ａ１とビリルビンとのドッキングシミュレーションを行った。ドッキングシミュレーションの結果を表３に示す。

　これらの結果と実施例７にて得られたｇとａの値を用いて、抱合活性を式３を用いて算出した。

　次に、文献に記載のデータからＲ３３６Ｌ変異型、Ｎ４００Ｄ変異型、Ｗ４６１Ｒ変異型のビリルビン抱合活性の値の範囲を算出した。
　Ｃｒｉｇｌｅｒ－Ｎａｊｊａｒ症候群Ｉ型（ＣＮ－Ｉ）患者に見られる変異型ＵＧＴ１Ａ１のビリルビン抱合活性は、野生型の０～１０％と算出される（Yamamoto K et al.: Biochem Biophys Acta 1998, 1406:267-273）。ホモ型のＷ４６１Ｒ変異型（ＴＡ６／ＴＡ６）が、ＣＮ－Ｉ患者にて発見されている（Maruo Y, et al.: J Pediatr Gastroenterol Nutr 2003, 37(5):627-30）。よって、ホモ型のＷ４６１Ｒ変異型の酵素活性は、野生型の０～１０％と計算された。

　Ｃｒｉｇｌｅｒ－Ｎａｊｊａｒ症候群ＩＩ型（ＣＮ－ＩＩ）およびＧｉｌｂｅｒｔ症候群（ＧＳ）患者に見られる変異型ＵＧＴ１Ａ１のビリルビン抱合活性は、野生型の２６～６６％と算出される（Udomuksorn W et al.: Pharmacogenetics & Genomics 2007, 17:1017-1029； Yamamoto K et al.: Biochem Biophys Acta 1998, 1406:267-273； Seppen J, et al.: J Clin Invest 1994, 94(6):2385-2391）。ホモ型のＮ４００Ｄ変異型が、ＣＮ－ＩＩ患者に見られる（Labrune P et al.: Hum Mutat 2002, 20(5):399-401）。よって、ホモ型のＮ４００Ｄ変異型の酵素活性は、野生型の２６～６６％と計算された。

　ヘテロ型のＲ３３６Ｌ変異型は、ＣＮ－ＩＩ患者に見られる（Servedio V et al.: Hum Mutat 2005, 25(3):325）。Servedio V et al.に記載のＣＮ－ＩＩ患者ではプロモータ領域にＴＡ７／ＴＡ７の変異も確認されている。ＴＡ７／ＴＡ７変異のある患者では、ビリルビン抱合活性が野生型と比べて５０％に低下することが報告されている（Peterson et al.: J Nutr 2005, 135:1051-1055）。これらの報告から、Ｒ３３６Ｌ型変異の染色体あたりの抱合活性低下をｘ（％）とすると、下記の式１４が成り立つ：

式１４から以下の式１５が得られた。

したがって、ホモ型のＲ３３６Ｌ変異型の抱合活性は野生型の５２～１３２％（平均値９２％）と計算された。

　表３に記載のドッキングシミュレーションの結果から算出した値（計算値）と、文献から得られた値（in vivo測定値（文献報告））の比較を図１０に示す。この結果、高い精度で正しい抱合活性を導出可能なことが分かった。ＵＧＴ１Ａ１は肝臓で働く酵素であり、ヒト生体内でのＵＧＴ１Ａ１抱合活性は飲酒や喫煙の影響を受ける可能性が高いことを考慮すると、本発明に用いられる式により得られる値は非常に精度が高いと考えられた。

（実施例９）ビリルビンに対する酵素活性の予測３
　in vitro酵素活性の値として、Ｇ７１Ｒ変異型、Ｆ８３Ｌ変異型、Ｉ２９４Ｔ変異型ではなく、Ｇ７１Ｒ変異型、Ｐ２２９Ｑ変異型、Ｉ２９４Ｔ変異型のものを用いた以外は、実施例７と同様にして、ｇとａを算出した。Ｐ２２９Ｑ変異型の値は、Udomuksorn W et al: Pharmacogenetics and genomics 2007, 17(12):1017-29を参照した。この文献では、Ｐ２２９Ｑ変異型の正常値（野生型）に対する割合（相対活性）は、６１％と示されている。各変異型ＵＧＴ１Ａ１とビリルビンとのドッキングシミュレーションを行った結果を、表４に示す。

上記結果と、野生型および文献で報告されているＧ７１Ｒ変異型、Ｐ２２９Ｑ変異型、Ｉ２９４Ｔ変異型のin vitro酵素活性の値ｙ’（y'_w=1.00, y'_G71R=0.32, y'_P229Q=0.61, y'_I294T=0.50）を用いて二乗誤差を最小化するｇ，ａを計算したところ、ｇ＝２９．３６、ａ＝０．４０であった。
　これらの結果を用いて式３により、各変異型ＵＧＴ１Ａ１のビリルビンに対する相対抱合活性を算出した。

　Ｇ７１Ｒ変異型、Ｐ２２９Ｑ変異型、Ｉ２９４Ｔ変異型のin vitroでの抱合活性値（in vitro測定値（文献報告））と、式３を用いた抱合活性の算出結果（計算値）を比較した。結果を図１１に示す。

（実施例１０）ビリルビンに対する酵素活性の予測４
　Ｒ３３６Ｌ変異型、Ｎ４００Ｄ変異型、Ｗ４６１Ｒ変異型について、実施例８にて得られたドッキングシミュレーションの結果と、実施例９にて得られたｇとａの値を用いて、抱合活性を式３を用いて算出した。

　ドッキングシミュレーションの結果から算出した値（計算値）と、実施例８に記載の文献から得られた値（in vivo測定値（文献報告））の比較を図１２に示す。

（実施例１１）ビリルビンに対する酵素活性の予測５
　Ｒ３３６Ｌ変異型、Ｎ４００Ｄ変異型、Ｗ４６１Ｒ変異型について、ｇ＝２９．３６、ａ＝０を代入して、抱合活性（相対活性）を式３を用いて算出した。

　算出した結果（計算値）と、実施例８に記載の文献から得られた値（in vivo測定値（文献報告））の比較を、図１３に示す。

（実施例１２）構造計算時の水分子付加の影響
　水分子を付加して、又は水分子を付加せず（Gas Phase）に、ＵＧＴ１Ａ１（細胞膜タンパク質）およびＧタンパクであるＡｒｌ６（細胞質に存在）のタンパク質２種類について、シミュレーションを行った。
　水分子を付加する場合は、TINKERパッケージの代わりにMOEを用いた以外は実施例１と同様にして立体構造を計算した（野生型ＵＧＴ１Ａ１、Ｇ７１Ｒ変異型ＵＧＴ１Ａ１、Ｆ８３Ｌ変異型ＵＧＴ１Ａ１、Ｉ３２２Ｖ変異型ＵＧＴ１Ａ１：野生型Ａｒｌ６、Ｔ３１Ｒ変異型Ａｒｌ６、Ｇ１６９Ａ変異型Ａｒｌ６、Ｌ１７０Ｗ変異型Ａｒｌ６）。また、水分子を付加しない場合は、TINKERパッケージを用いて、実施例１と同様にして立体構造を計算した。

　その後ＵＧＴ１Ａ１について、水分子を付加した場合はMOE DockもしくはAutoDock 4プログラムを用いて、水分子を付加していない場合はAutoDock 4プログラムを用いて、実施例２と同様にして、ＵＤＰＧＡとのドッキングシミュレーションを行った。抱合反応可能な向きのＵＤＰＧＡと各ＵＧＴ１Ａ１のドッキングエネルギーの分布を図１４に示す。

　次に、水分子を付加した各変異型ＵＧＴ１Ａ１と基質（ＡＡＰもしくはＥ２）とのドッキングシミュレーションまたは、水分子を付加した各変異型Ａｒｌ６と基質（ＧＴＰγＳもしくはＧＤＰ）とのドッキングシミュレーションを行った。基質とのドッキングシミュレーションは、MOE DockもしくはAutoDock4を用いて、実施例３と同様にして行った。ドッキングシミュレーションの結果を図１５（ＵＧＴ１Ａ１）と図１７（Ａｒｌ６）に示す。図１５のａは、ドッキングプログラムにMOE Dockを使用し、ｂはAutoDock4を用いた結果である。図１７の結果は、ドッキングプログラムにAutoDock4を用いた結果である。

　各種ＵＧＴ１Ａ１について、基質が向きＩで進入した回数とin vitro測定値との比較を図１６に示す。図１６のａは、水分子付加した場合に基質とのドッキングシミュレーションをMOE Dockを用いて行った結果であり、ｂは水分子を付加した場合に基質とのドッキングシミュレーションをAutoDock4を用いて行った結果である。

　ＵＧＴ１Ａ１では、水分子を付加して構造計算を行った場合、基質と各種ＵＧＴ１Ａ１のドッキングシミュレーションの結果（基質が向きＩで各種ＵＧＴ１Ａ１に進入した回数）がin vitroの抱合活性（in vitro測定値）に相関しないことがわかった。また、ドッキングシミュレーションにMOE DockおよびAutoDock4のいずれを使用した場合でも同様に相関がみられず、基質がＡＡＰおよびＥ２のいずれの場合でも相関がみられなかった。
　また、Ａｒｌ６では水分子を付加して構造計算を行った結果、基質（ＧＴＰγＳまたはＧＤＰ）と各種Ａｒｌ６のドッキングシミュレーションの結果（ＧＴＰγＳまたはＧＤＰが各種Ａｒｌ６に結合し得る向きで進入した回数）と、in vitroのＡｒｌ６実験値（Kobayashi et.al, BBRC 381, 439-442, 2009および東京大学大学院薬学研究科機能薬学教室生理化学教室の紺谷圏二先生の実験データ）とに高い相関が見られることを確認した。なおＡｒｌ６は酵素タンパク質ではないが、酵素タンパク質について酵素反応が進むためには基質との結合が必須であることから、Ａｒｌ６の基質との結合能は酵素タンパク質の触媒能と同義に考えることができる。

　ＵＧＴ１Ａ１は、細胞膜に存在するタンパク質であり、触媒反応が酵素内部で起こると考えられる。一方、Ａｒｌ６は細胞質に存在するタンパク質であり、ＧＴＰとの結合がタンパク質表面で起こると考えられる。これらの結果から、対象となる酵素タンパク質の存在する箇所や、触媒反応の起こる部位などの疎水性度および親水性度を考慮して、構造計算時における水分子付加の要否を決定可能であることが示唆された。

（実施例１３）induced fitの影響
（１）水分子を付加せずに各種ＵＧＴ１Ａ１の立体構造データの計算を行い、ＵＤＰＧＡとのドッキングシミュレーションを行った。構造計算にMOE又はTINKERを使用し、ドッキングシミュレーションにMOE Dock又はAutoDock4を使用して、実施例１および２と同様の手法でシミュレーションを行った。ＵＤＰＧＡとのドッキングモデル１つに対して、MOEを用いてinduced fitを行い、基質（ＡＡＰまたはＥ２）とのドッキングシミュレーションを行った。

　結果を図１８および図１９に示す。図１８のａは、構造計算にMOEを用いてドッキングシミュレーションにMOE Dockを用いた結果であり、図１８のｂは、構造計算にTINKERを用いてドッキングシミュレーションにAutoDock4を用いた結果である。図１９のａは構造計算にMOEを用いてドッキングシミュレーションにMOE Dockを用いた結果とin vitro測定値との比較であり、図１９のｂは、構造計算にTINKERを用いてドッキングシミュレーションにAutoDock4を用いた結果とin vitro測定値との比較である。

　induced fitを行わなかった結果（図１９のグラフ、実線）と比較すると、induced fitを行った場合（図１９のグラフ、点線）では、基質と各種ＵＧＴ１Ａ１のドッキングシミュレーションの結果（基質が向きＩで各種ＵＧＴ１Ａ１に進入した回数）がin vitroの抱合活性（in vitro測定値）に相関しないことがわかった。本実施例では、ＵＤＰＧＡとのドッキングモデルを１種類（最も安定なドッキングモデル）としている。induced fitのシミュレーションに対する影響をさらに検討するため、ＵＤＰＧＡとのドッキングモデルについてクラスタリングを行い（実施例３参照）、クラスタリングの結果得られたクラスタ（最も安定な集合Ｃ）内の全ドッキングモデルについて、induced fitを行い影響を検討した。

（２）実施例１および２と同様にして、TINKERを使用して水分子を付加せずに各種ＵＧＴ１Ａ１の立体構造データの計算を行い、AutoDock4でＵＤＰＧＡとのドッキングシミュレーションを行った。次にＵＤＰＧＡとのドッキングモデルについてクラスタリングを行い（実施例３参照）、クラスタリングの結果得られた最も安定な集合Ｃ内の全ドッキングモデルについて、MOEを用いてinduced fitを行い、AutoDock4を用いて基質（ＡＡＰまたはＥ２）とのドッキングシミュレーションを行った。これらの結果を用いて、式３（ｇとａの値は、実施例６のものを使用）により、各変異型ＵＧＴ１Ａ１のＡＡＰもしくはＥ２に対する相対抱合活性を算出した。

　結果を図２０に示す。最も安定な集合Ｃ内の全ドッキングモデルについてinduced fitを行った場合（図２０（Ｂ））、induced fitなしの場合（図２０（Ｃ））およびクラスタ内の１種類のモデルについてinduced fitを行った場合（図２０（Ａ））と比較して、式３を用いて算出した抱合活性（計算値）がin vitroの抱合活性（in vitro測定値）と高い相関を持つことがわかった。従って、ＵＤＰＧＡとのドッキングモデルのクラス内の複数のモデル、好ましくは全てのモデルについて、induced fitを行い、基質とのドッキングシミュレーションを行うことが好ましいことが、示唆された。

（実施例１４）補酵素の各種ＵＧＴ１Ａ１への進入の向きの抱合能への影響
　補酵素のドッキングエネルギーがＵＧＴ１Ａ１の抱合能に影響をしないことを実施例２および４にて確認した。補酵素の各種ＵＧＴ１Ａ１への進入の向きが、抱合能へ影響するかについて検討を行うため、式１について３種類のin silico抱合能計算式を導出した。すなわち、Ｅ＝１（補酵素の向きの寄与が皆無）、Ｅ＝下記式１６（補酵素が酵素反応を受け得る向きで各種ＵＧＴ１Ａ１へ進入した回数の寄与）、

Ｅ＝下記式１７（補酵素とのシミュレーションを行った後、クラスタリングにより選択されたモデル数の寄与）

である。Ｌ、ｌ、γ、ｍ、ｍ_ｗ、δについては本明細書にて定義したとおりである。

　実施例１３の手法により、ＵＤＰＧＡとのドッキングモデルのクラスタ内の全てのモデルについて、induced fitを行い、基質とのドッキングシミュレーションを行った。基質とのドッキングシミュレーションの結果を用いて、各計算式を用いてＧ７１Ｒ変異型ＵＧＴ１Ａ１、Ｆ８３Ｌ変異型ＵＧＴ１Ａ１、Ｉ３２２Ｖ変異型ＵＧＴ１Ａ１、Ｒ３３６Ｌ変異型ＵＧＴ１Ａ１、Ｈ３７６Ｒ変異型ＵＧＴ１Ａ１、Ｐ３８７Ｓ変異型ＵＧＴ１Ａ１の抱合活性（計算値）を算出した（ｇとａは実施例６のものを使用、δは0.37を用いた）。得られた計算値とin vitro抱合能（基質はＡＡＰまたはＥ２）との二重誤差（式１８）を算出し、各計算式の抱合能の予測精度を評価した。

　Ｅ＝１（補酵素の寄与が皆無）の場合は、二重誤差が0.137062であり、Ｅ＝式１６（補酵素が酵素反応を受け得る向きで各種ＵＧＴ１Ａ１へ進入した回数の寄与）の場合は0.117838、Ｅ＝式１７（補酵素とのシミュレーションを行った後、クラスタリングにより選択されたモデル数の寄与）の場合は0.053017であった。補酵素とのドッキングシミュレーションを行った後、クラスタリングにより選択されたモデル数を計算式に使用した場合に、最も二重誤差が減少した。従って、補酵素のオリエンテーションが抱合能に関与しており、これを考慮することにより、さらに正確に抱合能を予測可能となることが示唆された。

（実施例１５）基質のオリエンテーションについてSigmoid関数を用いた場合の影響
　Sigmoid関数とは下記式１９で表されるS字型の関数であり、実数xに対して(0, 1)の値域を持つ単調増加関数である。pをゲインと呼び、関数の形状に影響する。

　抱合能の計算式である式１において、式１０における項Ｒ（ＵＧＴ１Ａ１の抱合反応空間への基質の進入）にSigmoid関数を適用した計算式を作成した（式２０）。

　Ｇ７１Ｒ変異型ＵＧＴ１Ａ１、Ｆ８３Ｌ変異型ＵＧＴ１Ａ１、Ｉ３２２Ｖ変異型ＵＧＴ１Ａ１、Ｒ３３６Ｌ変異型ＵＧＴ１Ａ１、Ｈ３７６Ｒ変異型ＵＧＴ１Ａ１、Ｐ３８７Ｓ変異型ＵＧＴ１Ａ１について、実施例１３の手法により、ＵＤＰＧＡとのドッキングモデルのクラス内の全てのモデルについて、induced fitを行い、基質とのドッキングシミュレーションを行った。基質とのドッキングシミュレーションの結果を用いて、実施例１４の３種類のＥのうち式１７を上記式２０と組み合わせた計算式により、各種ＵＧＴ１Ａ１の抱合活性（計算値）を算出した（ｇとａは実施例６のものを使用。d、tは実施例１３の結果と、野生型およびＧ７１Ｒ変異型、Ｆ８３Ｌ変異型、Ｉ３２２Ｖ変異型のin vitro酵素活性の値を用いて、二重誤差を最小化する値を計算した。その結果、t=7.00、d=0.54であった。δは0.37を用いた）。なお、各種ＵＧＴ１Ａ１（Ｇ７１Ｒ変異型、Ｆ８３Ｌ変異型、Ｉ３２２Ｖ変異型、Ｒ３３６Ｌ変異型、Ｈ３７６Ｒ変異型、Ｐ３８７Ｓ変異型）のin vitro抱合能は、実施例４の手法と同様にして測定した。さらに、現在報告されている他の２８種類の変異型ＵＧＴ１Ａ１について、本実施例と同様にしてドッキングシミュレーションを行い、その結果を用いて式１７および式２０を用いて、抱合活性を測定した。

　図２１に、in vitro測定値とシミュレーションに基づく計算値との比較を示す。また図２２に、野生型ＵＧＴ１Ａ１と、全３４種の変異型ＵＧＴ１Ａ１のシミュレーションに基づく計算値の結果を示す。
　計算式にSigmoid関数を使用した場合、in vitroの抱合活性を良く再現可能であることがわかった（図２１および図２２）。よって、式１０における項Ｒ（ＵＧＴ１Ａ１の抱合反応空間への基質の進入）へSigmoid関数を適用することが好ましいことが示唆された。

（実施例１６）ＡＡＰと、Ｅ２に対する酵素活性の予測
　実施例１５と同様の手法を用いて、ドッキングシミュレーションを行った。かかるドッキングシミュレーションの結果を用いて、実施例１４の３種類のＥのうちＥ＝１を式３と組み合わせた計算式により、Ｇ７１Ｒ変異型ＵＧＴ１Ａ１、Ｆ８３Ｌ変異型ＵＧＴ１Ａ１、Ｉ３２２Ｖ変異型ＵＧＴ１Ａ１、Ｒ３３６Ｌ変異型ＵＧＴ１Ａ１、Ｈ３７６Ｒ変異型ＵＧＴ１Ａ１、Ｐ３８７Ｓ変異型ＵＧＴ１Ａ１の抱合活性（計算値）を算出した（ｇとａは実施例６のものを使用）。なお、各種ＵＧＴ１Ａ１（Ｇ７１Ｒ変異型、Ｆ８３Ｌ変異型、Ｉ３２２Ｖ変異型、Ｒ３３６Ｌ変異型、Ｈ３７６Ｒ変異型、Ｐ３８７Ｓ変異型）のin vitro抱合能は、実施例４の手法と同様にして測定した。

　これらの結果を図２３に示す。

　本発明の方法を用いれば、特定の基質に対する酵素活性が予測できない変異型タンパク質についての、酵素活性を予測することができ有用である。薬剤代謝に重要なＵＧＴ１Ａ１の変異型を例に説明すると、天然に存在する変異部位の解析結果は、将来的に個人のゲノム解析結果が得られた場合、薬剤投与のための情報として有益である。また、上記酵素活性ｆまたはｆ’は、タンパク質の立体構造自体に由来する酵素活性であり、上記数式を使用して、その他の環境要因等を含めるような数式を作成し、リスクファクターを加味した患者ごとの薬剤投与計画の作成のための参考情報を得ることも可能である。さらに、特定のタンパク質について、人工変異部位を含めて、網羅的に変異部位を持つタンパク質について酵素活性の予測を行うことにより、酵素の触媒作用におけるタンパク質の重要部位の決定が可能となり、創薬ターゲットに利用可能である。

1　野生型
2　Ｐ３４Ｑ変異型
3　Ｈ３９Ｄ変異型
4　Ｇ７１Ｒ変異型
5　Ｆ８３Ｌ変異型
6　Ｌ１７５Ｑ変異型
7　Ｃ１７７Ｒ変異型
8　Ｒ２０９Ｗ変異型
9　Ｖ２２５Ｇ変異型
10　Ｐ２２９Ｑ変異型
11　Ｇ２７６Ｒ変異型
12　Ｅ２９１Ｖ変異型
13　Ａ２９２Ｖ変異型
14　Ｉ２９４Ｔ変異型
15　Ｇ３０８Ｅ変異型
16　Ｉ３２２Ｖ変異型
17　Ｑ３３１Ｒ変異型
18　Ｒ３３６Ｌ変異型
19　Ｒ３３６Ｑ変異型
20　Ｒ３３６Ｗ変異型
21　Ｗ３５４Ｒ変異型
22　Ｑ３５７Ｒ変異型
23　Ｒ３６７Ｇ変異型
24　Ａ３６８Ｔ変異型
25　Ｓ３７５Ｆ変異型
26　Ｈ３７６Ｒ変異型
27　Ｇ３７７Ｖ変異型
28　Ｓ３８１Ｒ変異型
29　Ｐ３８７Ｓ変異型
30　Ｇ３９５Ｖ変異型
31　Ｎ４００Ｄ変異型
32　Ａ４０１Ｐ変異型
33　Ｒ４０３Ｃ変異型
34　Ｋ４２８Ｅ変異型
35　Ｗ４６１Ｒ変異型
（Ａ）　induced　fit有り、１モデル
（Ｂ）　induced　fit有り、クラスタ内の全モデル
（Ｃ）　induced　fitなし
（Ｄ）　ＵＤＰＧＡが酵素反応を受け得る向きで各種ＵＧＴ１Ａ１に進入した回数
（Ｅ）　クラスタ内のモデル数
（Ｆ）　基質が向きＩで各種ＵＧＴ１Ａ１に進入した回数（向きＩの回数／シミュレーションの全回数）

Claims

タンパク質Ａの酵素活性をコンピュータを用いたシミュレーションにより予測する方法であって、
酵素活性がタンパク質Ａへの基質の進入の向きにより規定されるようなタンパク質であり、
タンパク質Ａの酵素活性ｆが以下の式１により算出される方法；

式中、ｇは基質ごとに固有の定数であり、Ｅはタンパク質Ａと補酵素とのドッキングの酵素活性に対する寄与度であり、βはタンパク質への基質の進入の向きの酵素活性に対する寄与度であり、ａは生体内環境による影響を表す定数であり、Ｎとｎは、タンパク質Ａと基質とのドッキングシミュレーションにより得られる値であり、Ｎはタンパク質Ａと基質とのドッキングシミュレーションの総回数であり、Ｎは２以上であり、ｎは酵素反応を受け得る向きで基質がタンパク質Ａに進入した回数である。
タンパク質Ａの立体構造データが、タンパク質Ａとは別のタンパク質Ｂの立体構造データに基づいて計算されるものであり、βが以下の式２によって算出される請求の範囲第１項に記載の方法：

式中、Ｎ_ｗとｎ_ｗは、タンパク質Ｂと基質とのドッキングシミュレーションにより得られる値であり、Ｎ_ｗはタンパク質Ｂと基質とのドッキングシミュレーションの総回数であり、Ｎ_ｗは２以上であり、ｎ_ｗは酵素反応を受け得る向きで基質がタンパク質Ｂに進入した回数である。
タンパク質Ｂの酵素活性に対するタンパク質Ａの相対的な酵素活性をコンピュータを用いたシミュレーションにより予測する方法であって、
酵素活性がタンパク質Ａへの基質の進入の向きにより規定されるようなタンパク質であり、
タンパク質Ａの相対的な酵素活性ｆ’が以下の式３により算出される方法；

式中、ｇは基質ごとに固有の定数であり、Ｅはタンパク質Ａと補酵素とのドッキングの酵素活性に対する寄与度であり、ａは生体内環境による影響を表す定数であり、βはタンパク質への基質の進入の向きの酵素活性に対する寄与度であり、次の式２により表され；

Ｎとｎは、タンパク質Ａと基質とのドッキングシミュレーションにより得られる値であり、Ｎはタンパク質Ａと基質とのドッキングシミュレーションの総回数であり、Ｎは２以上であり、ｎは酵素反応を受け得る向きで基質がタンパク質Ａに進入した回数であり、Ｎ_ｗとｎ_ｗはタンパク質Ｂと基質とのドッキングシミュレーションにより得られる値であり、Ｎ_ｗはタンパク質Ｂと基質とのドッキングシミュレーションの総回数であり、Ｎ_ｗは２以上であり、ｎ_ｗは酵素反応を受け得る向きで基質がタンパク質Ｂに進入した回数である。
Ｅが、下記の式１６または式１７により表される、請求の範囲第１項～第３項のいずれか１に記載の方法：

（式１６中、γはタンパク質への補酵素の進入の向きの酵素活性に対する寄与度であり、次の式２１により表され、

Ｌとｌは、タンパク質Ａと補酵素とのドッキングシミュレーションにより得られる値であり、Ｌはタンパク質Ａと補酵素とのドッキングシミュレーションの総回数であり、Ｌは２以上であり、ｌは酵素反応が進行し得る向きで補酵素がタンパク質Ａに進入した回数であり、Ｌ_ｗとｌ_ｗはタンパク質Ｂと補酵素とのドッキングシミュレーションにより得られる値であり、Ｌ_ｗはタンパク質Ｂと補酵素とのドッキングシミュレーションの総回数であり、Ｌ_ｗは２以上であり、ｌ_ｗは酵素反応が進行し得る向きで補酵素がタンパク質Ｂに進入した回数である）；

（式１７中、ｍはタンパク質Ａと補酵素とのドッキングモデルをクラスタリングして得られたクラスタ内のモデル数であり、ｍ_ｗはタンパク質Ｂと補酵素とのドッキングモデルをクラスタリングして得られたクラスタ内のモデル数であり、δはクラスタ内のモデル数の酵素活性への寄与度を表す。）
式１または式３において、

について、Sigmoid関数を導入する、請求の範囲第１項～第４項のいずれか１に記載の方法。
２以上のタンパク質Ａについてドッキングシミュレーションを行い、
ｇとａが、ドッキングシミュレーションにより得られた計算値ｙと、測定された値ｙ’との二乗誤差を最小にする値であり、下記の式４を用いて算出される、請求の範囲第２項～第５項のいずれか１に記載の方法。

式中、ｙ_ｗとｙ’_ｗはタンパク質Ｂについての値であり、ｙ_Ａ１とｙ’_Ａ１、ｙ_Ａｐとｙ’_Ａｐはタンパク質Ａについての値であり、ｐは２以上の数を表す。
タンパク質と基質とのドッキングシミュレーションが以下の工程を含む請求の範囲第１項～第６項のいずれか１に記載の方法：
（ａ）タンパク質Ｂの立体構造データを入手し、タンパク質Ａの立体構造データをタンパク質Ｂの立体構造データに基づいて計算し、
（ｂ）タンパク質ＡまたはＢと補酵素とのドッキングシミュレーションを行い、熱力学的に安定なドッキングモデルを決定し；
（ｃ）タンパク質ＡまたはＢと基質とのドッキングのグリッドを設定し；
（ｄ）タンパク質Ｂと基質とのドッキングシミュレーションをＮ_ｗ回行い、Ｎ_ｗは２以上であり、酵素反応を受け得る向きで基質がタンパク質Ｂに進入した回数ｎ_ｗを計数し、
（ｅ）タンパク質Ａと基質とのドッキングシミュレーションをＮ回行い、Ｎは２以上であり、酵素反応を受け得る向きで基質がタンパク質Ａに進入した回数ｎを計数する。
工程（ｂ）の後に次の工程（ｂ－１）を行い；
工程（ｂ－１）タンパク質ＡまたはＢと補酵素とのドッキングモデルをクラスタリングし、クラスタリングして得られたクラスタ内の２以上のモデルについてinduced fitを行い、
工程（ｄ）において、induced fit後の各モデルについて、基質とのドッキングシミュレーションを行う、
請求の範囲第１項～第７項のいずれか１に記載の方法。
タンパク質Ａが変異型タンパク質である請求の範囲第１項～第７項のいずれか１に記載の方法。
タンパク質ＡがＵＤＰ－グルクロン酸転移酵素であり、補酵素がＵＤＰ－グルクロン酸である、請求の範囲第４項～第９項のいずれか１に記載の方法。
タンパク質Ａがｇとａの算出のために用いた変異型タンパク質以外の変異型タンパク質であり、算出されたｇとａの値を用いて酵素活性の予測を行う、請求の範囲第６項～第１０項のいずれか１に記載の方法。
請求の範囲第１項～第１１項のいずれか１に記載の方法を実行するために、コンピュータを下記の手段として機能させるプログラムを担持する記録媒体：
　（１）入力されたアミノ酸配列情報に基づいて、タンパク質Ａの立体構造データを計算する手段、
　（２）タンパク質Ａの立体構造データと、ドッキングシミュレーションの対象となる基質の立体構造データを記憶する手段、
　（３）前記記憶された、タンパク質Ａの立体構造データと基質の立体構造データを用いて、タンパク質Ａと基質とのドッキングシミュレーションを行うシミュレーション手段、
　（４）シミュレーションにより得られた結果を記憶する手段、
　（５）記憶されたシミュレーション結果に基づいて、タンパク質Ａの酵素活性を算出する手段、
　（６）算出された酵素活性を表示する手段。
請求の範囲第１項～第１１項のいずれか１に記載の方法を実行するために、下記の手段を担持する装置；
　（１）入力されたアミノ酸配列情報に基づいて、タンパク質Ａの立体構造データを計算する手段、
　（２）タンパク質Ａの立体構造データと、ドッキングシミュレーションの対象となる基質の立体構造データを記憶する手段、
　（３）前記記憶された、タンパク質Ａの立体構造データと基質の立体構造データを用いて、タンパク質Ａと基質とのドッキングシミュレーションを行うシミュレーション手段、
　（４）シミュレーションにより得られた結果を記憶する手段、
　（５）記憶されたシミュレーション結果に基づいて、タンパク質Ａの酵素活性を算出する手段、
　（６）算出された酵素活性を表示する手段。
請求の範囲第１項～第１１項のいずれか１に記載の方法、請求の範囲第１２項に記載の記録媒体、または請求の範囲第１３項に記載の装置を用いて、２以上の基質について、基質ごとのタンパク質Ａの酵素活性を予測し、得られた２以上の予測結果に基づいて目的の基質を選択する、基質適合性の判定方法。
前記基質が生体に投与される薬剤であって、請求の範囲第１４項に記載の方法を用いて、薬剤の投与量および／または投与間隔、投与頻度を評価する方法。