JP2003159095A - 結合分子予測方法およびその利用方法 - Google Patents

結合分子予測方法およびその利用方法

Info

Publication number
JP2003159095A
JP2003159095A JP2002203120A JP2002203120A JP2003159095A JP 2003159095 A JP2003159095 A JP 2003159095A JP 2002203120 A JP2002203120 A JP 2002203120A JP 2002203120 A JP2002203120 A JP 2002203120A JP 2003159095 A JP2003159095 A JP 2003159095A
Authority
JP
Japan
Prior art keywords
binding molecule
amino acid
protein
residue
sequence alignment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002203120A
Other languages
English (en)
Inventor
Hiroshi Inooka
博 井ノ岡
Yoshio Yamamoto
善雄 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Takeda Pharmaceutical Co Ltd
Original Assignee
Takeda Chemical Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Takeda Chemical Industries Ltd filed Critical Takeda Chemical Industries Ltd
Priority to JP2002203120A priority Critical patent/JP2003159095A/ja
Publication of JP2003159095A publication Critical patent/JP2003159095A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

(57)【要約】 【解決課題】 GPCRの配列情報から直接的にGPC
Rに結合する(、あるいは共役する)分子又は分子の種
類を予測し、その機能を予測することにつながる方法を
提供する。 【解決手段】 結合分子既知タンパク質のアラインメン
トと、結合分子又は結合分子の種類とを対応付けた結合
分子既知タンパク質分類情報を得た後、結合分子決定残
基と結合分子又は結合分子の種類との相関関係を表す結
合分子決定残基−結合分子分類情報を得て、結合分子未
知タンパク質についてのアラインメントを得る工程と、
前記結合分子未知タンパク質のアラインメントのうち少
なくとも結合分子決定残基についての情報を、結合分子
決定残基−結合分子分類情報に当てはめ、結合分子未知
タンパク質の結合分子又は結合分子の種類を予測する結
合分子未知タンパク質の結合分子予測方法。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、結合分子未知タン
パク質の結合分子予測方法、該予測方法を用いた医薬の
製造方法、及び結合分子未知タンパク質の結合分子を予
測するためのコンピュータに関し、より詳しくは、結合
分子既知タンパク質のアミノ酸配列(又はシークエンス
アラインメント)とその結合分子又は結合分子の種類と
に関する情報から結合分子未知タンパク質の結合分子又
は結合分子の種類を予測する方法、該方法を用いた医
薬、及び当該方法に用いられるコンピュータに関する。
さらに本発明は、結合分子や結合分子の種類を予測する
ことを通して結合分子が未知であるタンパク質の機能を
予測する方法等に関する。
【0002】
【従来の技術】ヒトゲノムの配列情報が公開され(Na
ture 第409巻、第6822号(2001);S
cience 第291巻、第5507号(200
1))、既知の遺伝子も含め3−4万の遺伝子の存在が
報告された。しかし、遺伝子と細胞内機能の関係が未知
のものが数多く存在している。特に、疾病・疾患の原因
となる遺伝子に関する情報はその病態を明らかにする上
で重要であるばかりでなく、その診断・予防・治療に用い
る医薬を開発する場合にも必要不可欠なものである。
【0003】医薬開発の標的となりうる分子は、その分
子を含む医薬が体内に入ったとき直接または間接的に他
の分子と結合するような分子であり、ほとんどの場合が
タンパク質と考えられる。このタンパク質としては低分
子物質を結合するタンパク質、低分子または高分子の基
質に対して触媒活性を有する酵素、高分子物質を結合す
るタンパク質などが挙げられる。その中でも低分子物質
を結合するタンパク質を標的とする医薬品が非常に多く
存在する。標的分子として特に注目されるタンパク質と
して、膜タンパク質としてシグナルの伝達に関与するG
タンパク質共役型受容体タンパク質があげられる。
【0004】膜タンパク質の例では、細胞外から細胞内
へのシグナルの伝達は、膜貫通ドメインを有する膜タン
パク質がその膜貫通ドメインで構造変化を生ずることに
より進行する。膜貫通ドメインを有する上記のGタンパ
ク質共役型受容体タンパク質(G protein c
oupled receptor protein,以
下GPCRと略すことがある)は7回膜貫通ドメインを
その分子内に有するシグナル伝達に関与する膜タンパク
質である。GPCRは細胞外側にN末端を有し、7回膜
貫通ドメインを経て細胞内にC末端を有するトポロジー
を持ち、リガンドはその種類によってN末端領域や膜貫
通領域に結合する。また、細胞内のC末端部分と細胞内
ループ2にGタンパク質が結合することが知られてい
る。現在までに唯一GPCRファミリーの一種であるロ
ドプシンの結晶構造解析が行われている(Palcze
wskiら Science 第289巻、739−7
45頁 (2000))が、その他のGPCRの結晶構
造解析に関する報告はない。また各種生物学実験によ
り、以下のようにGPCRの活性化が起きることが明ら
かとなってきた。即ち、(i)受容体にリガンドが結合
し、GPCRの構造の変化する。(ii)共役Gタンパ
ク質にGPCRの構造変化が伝達され、Gタンパク質の
一部が遊離する。(iii)情報(シグナル)が細胞内
へ伝達される。
【0005】受容体と特異的に結合する分子はリガンド
と呼ばれる。GPCRの場合、既知のリガンド分子とし
ては、ドーパミン、セロトニン、メラトニン、ヒスタミ
ンのような生体アミン、プロスタグランジン、ロイコト
リエンなどの脂質誘導体、核酸、グルタミンなどのアミ
ノ酸、アンギオテンシン、セクレチン、ソマトスタチン
のような生理活性ペプチド類などがあげられる。
【0006】Gタンパク質はシグナル伝達系においてト
ランスデューサーとして機能し、α、β、γの3種のサ
ブユニットから構成される。これらのうちαサブユニッ
トはGTPへの結合およびGTPを加水分解する活性を
有し、各々のGタンパク質に特有のサブユニットであ
る。即ち、共役するGαタンパク質の種類により、GP
CRの機能が決定されることになる。現在までに、Gα
タンパク質としてはGs、Gi、GoおよびGtが単離精製
され、その性質が調べられている。
【0007】Gタンパク質共役型レセプタータンパク質
は生体の細胞や臓器の各機能細胞表面に存在し、それら
細胞や臓器の機能を調節する分子、例えば、ホルモン、
神経伝達物質および生理活性物質等の標的として生理的
に重要な役割を担っている。レセプターは生理活性物質
との結合を介してシグナルを細胞内に伝達し、このシグ
ナルにより細胞の賦活や抑制といった種々の反応が惹起
される。
【0008】各種細胞や臓器における複雑な機能を調節
する物質と、その特異的レセプタータンパク質、特には
Gタンパク質共役型レセプタータンパク質との関係を明
らかにすることは、各種細胞や臓器における複雑な機能
を解明し、それら機能と密接に関連した医薬品開発に非
常に重要な手段を提供することとなる。
【0009】近年、生体内で発現している遺伝子を解析
する手段として、cDNAの配列をランダムに解析する
研究が活発に行なわれており、その結果として得られた
cDNAの断片配列がExpressed Sequence Tag(ES
T)としてデータベースに登録され、公開されている。
しかし、多くのESTは配列情報だけを提供し、配列が
有する機能を推定することは困難である。
【0010】Gタンパク質共役型レセプターはその全て
が見出されているわけではなく、現時点でもなお、未知
のGタンパク質共役型レセプター、また対応するリガン
ドが同定されていない、いわゆるオーファンレセプター
が多数存在しており、新たなGタンパク質共役型レセプ
ターの探索および機能解明が切望されている。
【0011】
【発明が解決しようとする課題】ゲノムの配列情報が公
開されたことにより、既知の配列情報と比較することに
よって何らかの機能を有すると推測できる遺伝子領域を
調べることが可能となった。遺伝子の塩基配列間もしく
はそれが翻訳されたタンパク質のアミノ酸配列間の類似
性に基づき、新規タンパク質の結合分子や機能の予測が
実施されている。上記のように、配列の類似性を計算
し、配列間の適切な対応関係(シークエンスアラインメ
ント)を表示するソフトとしてClustal WやBLASTなどが
用いられている。これらのソフトから得られたシークエ
ンスアラインメントを用い、類似性解析によって、新規
タンパク質にはその類似タンパク質と類似の機能がある
という概念に基づき、機能予測が実施されている。この
ような類似性に基づく予測は、基本的な機能の予測には
貢献するが、基本的な機能が同じタンパク質グループに
対する結合分子の予測に関しては効果が乏しい。例え
ば、その新規タンパク質がGPCRかどうかの分類化に
は役立つが、類似度が極めて高いものでない限り、その
GPCRに結合するリガンドや共役Gタンパク質の種類
の予測には不向きである。実際にGPCRに結合する未
知のリガンド分子を検索・決定するためには、細胞抽出
物などを利用して多くの候補化合物の活性測定を行う必
要があるが、物性の異なる結合分子の候補化合物は同時
に評価することができないという問題が生じる。そこ
で、複雑な活性測定などを行うことなく、リガンド分子
の種類を予測することができたとすれば、効率的なリガ
ンド分子の決定に結びつくこととなる。
【0012】したがって、タンパク質の配列情報を類似
性とは異なる概念で捉えることが必要となる。類似性に
よって分類されたタンパク質グループ(例えばGPCR)内の
各メンバーに対して、各タンパク質に結合する分子を予
測することができれば、リガンドの同定やそのタンパク
質とリガンドの機能解析に有用である。そのために、タ
ンパク質の1次元的な配列情報から立体構造を予測し、
計算機上での結合実験によって結合分子を予測する検討
も実施されている。しかし、現状ではタンパク質の立体
構造の予測および計算機上での結合実験の精度がないた
めに、実用的でない。これらの精度の低さと煩雑さを回
避し、配列情報から直接結合分子や機能について検討で
きることは本発明の技術分野において有用なことであ
る。
【0013】配列情報から、結合分子や機能を予測する
方法としては、例えば、限定された既知のGPCRに対
して、共役するGαタンパク質の種類の決定に関与する
と思われるアミノ酸の変異(ならびにその変異位置)に
ついての報告がなされた(Bulseco and Schimerlik, Mo
lecular Pharmacology, 49: 132-141 (1996); Burstei
n, Spalding and Brann, Biochemistry, 37: 4052-4058
(1998); Kazmi et al., Biochemistry, 39: 3734-3744
(2000))が、新規GPCRに対して共役するGαタン
パク質の種類を予測するような報告は知られていない。
【0014】また、やはりGPCRに関して、GPCR
とリガンド双方のアミノ酸の変異を解析することによ
り、リガンドとそのGPCRの結合に関与する部位を予
測する方法、即ちcorrelated mutation analysis(CM
A)法が開発された(Singer et al., Receptors and c
hannels, 3: 89-95 (1995))が、GPCRの配列を単独
で用いて未知のGPCRの結合分子(及び/又は結合分
子の種類)を選択した報告例はない。
【0015】以上のように、例えばGPCRの場合、G
PCRの配列情報から直接的にGPCRに結合する(、
あるいは共役する)分子又は分子の種類を予測し、その
機能を予測することにつながる方法は知られていない。
【0016】また、やはりGPCRに関していえば、新
たなGPCRを発見した場合、そのGPCRを利用した
医薬を製造するためには、当該GPCRの機能を把握し
た上で、当該GPCRに結合する(、あるいは共役す
る)分子又は分子の種類を実験等により把握しなければ
ならず、莫大な費用と手間がかかるという問題がある。
【0017】
【課題を解決するための手段】本発明は、機能未知の配
列情報に対し、それに結合できる分子等を簡便かつ精度
よく予測する方法、当該方法を用いた医薬の製造方法及
び、これらに用いられるコンピュータに関する。
【0018】上記課題の少なくとも一つは、以下の発明
によって解決される。 (1)結合分子未知タンパク質に結合する結合分子を予
測する結合分子未知タンパク質の結合分子予測方法であ
って、アミノ酸配列と結合分子とが既知である結合分子
既知タンパク質について、少なくとも2以上の結合分子
既知タンパク質のシークエンスアラインメントと、結合
分子又は結合分子の種類とを対応付けた結合分子既知タ
ンパク質分類情報を得る工程と、前記結合分子既知タン
パク質分類情報を用いて、結合分子既知タンパク質のシ
ークエンスアラインメントの位置のうち結合分子を決定
することに関与すると想定される位置である結合分子決
定残基位置を1又は2以上特定する工程と、前記結合分
子決定残基位置におけるアミノ酸残基(結合分子決定残
基)と、結合分子又は結合分子の種類とを対応付けるこ
とにより、結合分子決定残基と結合分子又は結合分子の
種類との相関関係を表す結合分子決定残基−結合分子分
類情報を得る工程と、前記結合分子既知タンパク質と同
じ種類の結合分子未知タンパク質について前記結合分子
既知タンパク質間のシークエンスアラインメントに対し
て結合分子未知タンパク質の配列を整列させ、結合分子
未知タンパク質のシークエンスアラインメントを得る工
程と、前記結合分子未知タンパク質のシークエンスアラ
インメントのうち少なくとも結合分子決定残基について
の情報を、結合分子決定残基−結合分子分類情報に当て
はめ、結合分子未知タンパク質の結合分子又は結合分子
の種類を予測する工程とを含む結合分子未知タンパク質
の結合分子予測方法。
【0019】(2)前記結合分子が、リガンド、調節因
子、エフェクター、補酵素のいずれかである上記(1)
に記載の結合分子未知タンパク質の結合分子予測方法。 (3)前記結合分子が、2以上の種類に分類され、当該
分類された結合分子の種類を予測する上記(1)又は
(2)に記載の結合分子未知タンパク質の結合分子予測
方法。 (4)結合分子未知タンパク質が、Gタンパク質共役型
受容体、キナーゼ、リパーゼ、トランスポーター、プロ
テアーゼ、イオンチャンネルのいずれかである上記
(1)から上記(3)のいずれかに記載の結合分子未知
タンパク質の結合分子予測方法。 (5)結合分子決定残基位置を1又は2以上特定する工
程において、シークエンスアラインメントを構成するア
ミノ酸残基と結合分子の種類とから結合分子決定残基位
置を1又は2以上特定する上記(1)から(4)のいず
れかに記載の結合分子未知タンパク質の結合分子予測方
法。 (6)式1、又は式2のいずれか又は両方を用いて結合
分子決定残基位置を決定する上記(1)から(4)のい
ずれか1項に記載の結合分子未知タンパク質の結合分子
予測方法。 (7)式3、式4、式5のいずれかひとつ以上を用いて
結合分子決定残基位置を決定する上記(1)から(4)
のいずれか1項に記載の結合分子未知タンパク質の結合
分子予測方法。 (8)リガンド決定残基−リガンド分類情報を得る工程
が、リガンド既知タンパク質のアミノ酸残基のうち、関
数f3(n)の値が一番小さなリガンド決定残基位置にある
ものを抽出する工程と、リガンド決定残基−リガンド分
類情報にあげられたリガンド既知タンパク質のうち、抽
出されたリガンド決定残基と一致するものの数(A)を
求める工程と、リガンド決定残基−リガンド分類情報に
あげられたリガンド既知タンパク質のうち抽出されたリ
ガンド決定残基と一致するもののうちで、リガンド又は
リガンドの種類が当該リガンド既知タンパク質のものと
一致する数(B)を求める工程と、リガンド既知タンパ
ク質のアミノ酸残基のうち関数f3(n)の値が二番目に小
さい又はx番目(ここで、xは2より大きく100より
小さな整数を表す。) に小さいリガンド決定残基位置
にあるものを抽出する工程と、リガンド決定残基−リガ
ンド分類情報にあげられたリガンド既知タンパク質のう
ち、抽出されたリガンド決定残基と一致するものの数
(C)を求める工程と、リガンド決定残基−リガンド分
類情報にあげられたリガンド既知タンパク質のうち抽出
されたリガンド決定残基と一致するもののうちで、リガ
ンド又はリガンドの種類が当該リガンド既知タンパク質
のものと一致する数(D)を求める工程と、(A)と
(C)との和(E)を求める工程と、(B)と(D)と
の和(F)を求める工程とを含み、(E)と(F)を更
に表示するリガンド決定残基−リガンド分類情報を得る
上記(7)に記載の結合分子未知タンパク質の結合分子
予測方法。 (9)アミノ酸配列と結合分子とが既知である少なくと
も2以上の結合分子既知タンパク質について、当該結合
分子既知タンパク質のシークエンスアラインメントと、
結合分子又は結合分子の種類とを対応付けた結合分子既
知タンパク質分類情報を得る工程と、当該結合分子既知
タンパク質分類情報を用いて、結合分子既知タンパク質
のシークエンスアラインメントのうち結合分子を決定す
ることに関与すると想定される位置である結合分子決定
残基位置を1又は2以上特定する工程と、当該結合分子
決定残基位置におけるアミノ酸残基(結合分子決定残
基)と、結合分子、又は結合分子の種類とを対応付ける
ことにより、結合分子決定残基と結合分子との相関関係
を表す結合分子決定残基−結合分子分類情報を得る工程
とを含む結合分子未知タンパク質の結合分子予測方法。 (10)結合分子決定残基と結合分子との相関関係を表
す結合分子決定残基−結合分子分類情報に、前記結合分
子既知タンパク質と同じ種類の結合分子未知タンパク質
について前記結合分子既知タンパク質間のシークエンス
アラインメントに対して結合分子未知タンパク質の配列
を整列させて得られた結合分子未知タンパク質のシーク
エンスアラインメントのうち結合分子決定残基に関する
情報を入力し、当該結合分子未知タンパク質に結合する
結合分子、又は結合分子の種類を予測する結合分子未知
タンパク質の結合分子予測方法。
【0020】この方法によれば、結合分子が未知である
タンパク質のアミノ酸配列、及び/又はアミノ酸配列を
用いて得られるシークエンスアラインメントに関する情
報を得るだけで結合分子又は結合分子の種類を予測する
ことが可能となる。これにより、従来の3次元構造まで
予測するような分子モデリング法に比べ格段に迅速かつ
低コストに結合分子(リガンド等)を予測することがで
きる。更に、本発明によれば様々な種類の結合分子が未
知であるタンパク質に対してその結合分子又は結合分子
の種類を予測することができる。また、結合分子が未知
であるタンパク質に実際にあらゆる結合分子の候補が結
合するかどうか実験するよりも容易かつ迅速に結合分子
又は結合分子の種類を予測することができる。結合分子
決定残基−結合分子分類情報を得ることによって、結合
分子未知タンパク質のシークエンスアラインメントを得
るのみで当該情報を当該表に当てはめ、当該結合分子未
知タンパク質に結合する結合分子又は結合分子の種類を
容易に予測することが可能となる。
【0021】また、上記課題のうち少なくとも一つは以
下の発明によって解決される。すなわち、 (11)上記(1)〜(10)のいずれかに記載した結
合分子未知タンパク質の結合分子予測方法を用いて、結
合分子未知タンパク質に結合する結合分子、又は結合分
子の種類を予測する工程を含む医薬の製造方法、 (12)医薬が、中枢疾患、炎症性疾患、循環器疾患、
癌、代謝性疾患、免疫系疾患または消化器系疾患の予防
剤、又は治療剤のいずれか又は両方である上記(11)
に記載の医薬の製造方法である。
【0022】また、上記課題の少なくとも一つは以下の
発明によって解決される。すなわち、 (13)式6又は下記式7のいずれか又は両方を用いた
結合分子決定残基位置を決定する方法。 (14)式8を用いた結合分子決定残基位置を決定する
方法、 (15)結合分子既知タンパク質のアミノ酸配列又はシ
ークエンスアラインメントと、結合分子又は結合分子の
種類に関する情報とを用いて、結合分子既知タンパク質
のシークエンスアラインメントの位置のうち結合分子を
決定することに関与すると想定される位置(結合分子決
定残基位置)におけるアミノ酸残基である結合分子決定
残基と、結合分子または結合分子の種類との相関関係を
表す結合分子決定残基−結合分子分類情報を得る、結合
分子未知タンパク質の結合分子を予測するためのコンピ
ュータであって、当該コンピュータは、結合分子既知タ
ンパク質のシークエンスアラインメントに関する情報を
入力するシークエンスアラインメント入力手段と、前記
シークエンスアラインメント入力手段により入力された
結合分子既知タンパク質のアミノ酸配列又はシークエン
スアラインメントと、結合分子又は結合分子の種類に関
する情報とを記憶するシークエンスアラインメント結合
分子記憶手段と、前記シークエンスアラインメント結合
分子記憶手段により記憶された結合分子既知タンパク質
のアミノ酸配列又はシークエンスアラインメントと、結
合分子又は結合分子の種類に関する情報を用いて前記結
合分子決定残基位置を決定する結合分子決定残基位置決
定手段と、前記結合分子決定残基位置におけるアミノ酸
残基(結合分子決定残基)と、結合分子又は結合分子の
種類とを対応付けることにより、結合分子決定残基と結
合分子または結合分子の種類との相関関係を表す結合分
子決定残基−結合分子分類情報を得る結合分子決定残基
−結合分子分類情報取得手段と、前記結合分子既知タン
パク質と同じ種類の結合分子未知タンパク質について前
記結合分子既知タンパク質間のシークエンスアラインメ
ントに対して結合分子未知タンパク質の配列を整列させ
て得られた結合分子未知タンパク質のシークエンスアラ
インメントに関する情報を入力するシークエンスアライ
ンメント入力手段とを具備し、結合分子決定残基−結合
分子分類情報に、シークエンスアラインメント入力手段
により入力された結合分子未知タンパク質のシークエン
スアラインメントに関する情報を用いて、当該結合分子
未知タンパク質の結合分子、又は結合分子の種類を予測
する、結合分子未知タンパク質の結合分子を予測するた
めのコンピュータ、 (16)前記結合分子決定残基位置決定手段が、少なく
とも式9又は式10のいずれか又は両方の関数を用いる
上記(14)に記載の結合分子未知タンパク質の結合分
子を予測するためのコンピュータ、 (17)前記結合分子決定残基位置決定手段が、式9で
表される関数を用いる上記(15)又は上記(16)に
記載の結合分子未知タンパク質の結合分子を予測するた
めのコンピュータ、 (18)結合分子未知タンパク質の結合分子を予測する
ためのコンピュータであって、当該結合分子未知タンパ
ク質と同じ種類であり結合する結合分子が既知である結
合分子既知タンパク質のシークエンスアラインメントの
うち当該結合分子既知タンパク質に結合する分子を決定
することに関与すると想定される位置である結合分子決
定残基位置と、当該結合分子決定残基位置における結合
分子既知タンパク質のアミノ酸残基である結合分子決定
残基と、当該結合分子決定残基に対応した結合分子既知
タンパク質の結合分子又は結合分子の種類とに関する情
報を記憶した記憶手段と、前記結合分子既知タンパク質
と同じ種類の結合分子未知タンパク質について前記結合
分子既知タンパク質間のシークエンスアラインメントに
対して結合分子未知タンパク質の配列を整列させて得ら
れた結合分子未知タンパク質のシークエンスアラインメ
ントに関する情報を入力するシークエンスアラインメン
ト入力手段と、入力されたシークエンスアラインメント
に関する情報と記憶手段に記憶される情報とから当該結
合分子未知タンパク質の結合分子又は結合分子の種類を
決定する結合分子決定手段と、決定された結合分子未知
タンパク質に結合する結合分子又は結合分子の種類を表
示する表示手段とを具備し、シークエンスアラインメン
ト入力手段により入力された結合分子未知タンパク質の
シークエンスアラインメントに関する情報と、記憶手段
に記憶された結合分子決定残基と当該結合分子決定残基
に対応した結合分子既知タンパク質の結合分子又は結合
分子の種類に関する情報とに基づいて結合分子決定手段
により結合分子未知タンパク質の結合分子又は結合分子
の種類を予測し、結合分子決定手段により予測された当
該結合分子未知タンパク質の結合分子又は結合分子の種
類を表示手段により表示する結合分子未知タンパク質の
結合分子を予測するためのコンピュータである。このよ
うなコンピュータによれば、結合分子既知タンパク質の
シークエンスアラインメントに基づいて結合分子決定残
基−結合分子分類情報を得ることができ、これにより結
合分子未知タンパク質のシークエンスアラインメントを
得るのみでその結合分子又は結合分子の種類を容易に予
測することができることとなる。
【0023】さらに本発明は、 (19)コンピュータを、結合分子既知タンパク質のシ
ークエンスアラインメントに関する情報を入力するシー
クエンスアラインメント入力手段と、前記シークエンス
アラインメント入力手段により入力された結合分子既知
タンパク質のアミノ酸配列又はシークエンスアラインメ
ントと、結合分子又は結合分子の種類に関する情報とを
記憶するシークエンスアラインメント結合分子記憶手段
と、前記シークエンスアラインメント結合分子記憶手段
により記憶された結合分子既知タンパク質のアミノ酸配
列又はシークエンスアラインメントと、結合分子又は結
合分子の種類に関する情報を用いて前記結合分子決定残
基位置を決定する結合分子決定残基位置決定手段と、前
記結合分子決定残基位置におけるアミノ酸残基(結合分
子決定残基)と、結合分子又は結合分子の種類とを対応
付けることにより、結合分子決定残基と結合分子または
結合分子の種類との相関関係を表す結合分子決定残基−
結合分子分類情報を得る結合分子決定残基−結合分子分
類情報取得手段と、前記結合分子既知タンパク質と同じ
種類の結合分子未知タンパク質について前記結合分子既
知タンパク質間のシークエンスアラインメントに対して
結合分子未知タンパク質の配列を整列させて得られた結
合分子未知タンパク質のシークエンスアラインメントに
関する情報を入力するシークエンスアラインメント入力
手段と、して機能させるプログラム、 (20)前記結合分子決定残基位置決定手段が、少なく
とも式12又は式13のいずれか又は両方の関数を用い
る上記(19)に記載のプログラム、 (21)前記結合分子決定残基位置決定手段が、式14
で表される関数を用いる上記(19)又は(20)に記
載のプログラム、 (22)コンピュータを、結合分子未知タンパク質と同
じ種類であり結合する結合分子が既知である結合分子既
知タンパク質のシークエンスアラインメントのうち当該
結合分子既知タンパク質に結合する分子を決定すること
に関与すると想定される位置である結合分子決定残基位
置と、当該結合分子決定残基位置における結合分子既知
タンパク質のアミノ酸残基である結合分子決定残基と、
当該結合分子決定残基に対応した結合分子既知タンパク
質の結合分子又は結合分子の種類とに関する情報を記憶
した記憶手段と、前記結合分子既知タンパク質と同じ種
類の結合分子未知タンパク質について前記結合分子既知
タンパク質間のシークエンスアラインメントに対して結
合分子未知タンパク質の配列を整列させて得られた結合
分子未知タンパク質のシークエンスアラインメントに関
する情報を入力するシークエンスアラインメント入力手
段と、入力されたシークエンスアラインメントに関する
情報と記憶手段に記憶される情報とから当該結合分子未
知タンパク質の結合分子又は結合分子の種類を決定する
結合分子決定手段と、決定された結合分子未知タンパク
質に結合する結合分子又は結合分子の種類を表示する表
示手段として機能させるプログラム、および、 (23)上記(19)〜(22)のいずれか1項に記載
のプログラムを記憶した記録媒体、等を提供する。
【発明の実施の形態】本発明は、アミノ酸配列と結合分
子とが既知である結合分子既知タンパク質について、少
なくとも2以上の結合分子既知タンパク質のシークエン
スアラインメントと、結合分子又は結合分子の種類とを
対応付けた結合分子既知タンパク質分類情報を得る工程
と、前記結合分子既知タンパク質分類情報を用いて、結
合分子既知タンパク質のシークエンスアラインメントの
位置のうち結合分子を決定することに関与すると想定さ
れる位置である結合分子決定残基位置を1又は2以上特
定する工程と、前記結合分子決定残基位置におけるアミ
ノ酸残基(結合分子決定残基)と、結合分子又は結合分
子の種類とを対応付けることにより、結合分子決定残基
と結合分子又は結合分子の種類との相関関係を表す結合
分子決定残基−結合分子分類情報を得る工程と、前記結
合分子既知タンパク質と同じ種類の結合分子未知タンパ
ク質について前記結合分子既知タンパク質間のシークエ
ンスアラインメントに対して結合分子未知タンパク質の
配列を整列させ、結合分子未知タンパク質のシークエン
スアラインメントを得る工程と、前記結合分子未知タン
パク質のシークエンスアラインメントのうち結合分子決
定残基についての情報を、結合分子決定残基−結合分子
分類情報に当てはめ、結合分子未知タンパク質の結合分
子又は結合分子の種類を予測する結合分子未知タンパク
質の結合分子予測方法に関する。
【0024】結合分子既知タンパク質とは、タンパク質
であってそれに結合する生体分子が知られているものを
意味する。例えば、リガンドが既知であるレセプターな
ど生体分子が特異的に結合するタンパク質を意味する。
【0025】結合分子未知タンパク質とは、結合分子既
知タンパク質と同じ種類のタンパク質であって、結合分
子が未知のものを意味する。結合分子既知タンパク質と
同じ種類の結合分子未知タンパク質について前記結合分
子既知タンパク質間のシークエンスアラインメントに対
して結合分子未知タンパク質の配列を整列させて得られ
た結合分子未知タンパク質のシークエンスアラインメン
トとは、結合分子未知タンパク質のアミノ酸配列と当該
結合分子未知タンパク質と同種類のタンパク質のアミノ
酸配列の類似性(相同性)を調べるために置換、挿入、
欠失を考慮した上で、挿入、欠失に相当する箇所にギャ
ップを入れ、配列全体を並置したものである。
【0026】結合分子未知タンパク質及び結合分子既知
タンパク質としては、Gタンパク質共役型受容体(GP
CR)、キナーゼ、リパーゼ、トランスポーター、プロ
テアーゼ、イオンチャンネルがあげられる。これらのう
ちで、Gタンパク質共役型受容体(GPCR)、キナー
ゼについて本発明が好ましく適用できる。結合分子未知
タンパク質及び結合分子既知タンパク質がGタンパク質
共役型受容体(GPCR)である場合、結合分子未知タ
ンパク質をオーファンレセプターとも呼ぶ。なお、前述
の通り、結合分子未知タンパク質と結合分子既知タンパ
ク質とは同じ種類である。例えば、結合分子未知タンパ
ク質がGPCRであれば結合分子既知タンパク質もGP
CRである。
【0027】[結合分子既知タンパク質分類情報]結合
分子既知タンパク質分類情報とは、少なくとも2以上の
結合分子既知タンパク質のシークエンスアラインメント
と結合分子(及び/又は、結合分子の種類)とを対応付
けた表を意味する。この表は、紙面のみならず、電子的
に保存され視覚により表として認識することができるよ
うな態様のものであれば特に限定されるものではない。
また、結合分子既知タンパク質のシークエンスアライン
メントと結合分子又は結合分子の種類との対応が認識で
きるものであれば特に限定されるものではない。
【0028】[結合分子決定残基位置]結合分子決定残
基位置とは、結合分子既知タンパク質のシークエンスア
ラインメントの位置であって、結合分子を決定すること
に関与すると想定される位置を意味する。
【0029】リガンド決定残基位置の数としては、1以
上であれば特に限定されるものではなく、1以上10以下
であれば好ましく、2以上6以下であればより好ましく、
2であれば特に好ましい。生体を構成するアミノ酸残基
の種類は20種しか存在しない。したがって、1つのリガ
ンド決定残基のみで対応付けることのできるリガンドは
20種類までである。一方、例えば、GPCRでは、100
種類以上のリガンドが知られているので、リガンド決定
残基位置が1つであれば、全てのリガンドとリガンド決
定残基とを対応付けることができない。したがって、G
PCRのようにリガンドが20種類以上ある系において、
結合分子未知タンパク質のリガンドを予測するには、リ
ガンド決定残基位置が2つ以上あることが望ましい。ま
た、リガンド決定残基位置の数が多いほど予測精度が高
まる。リガンドを数種類に分類し(X1〜Xp:pは分類の
数である。)、結合分子未知タンパク質のリガンドがい
ずれの分類に属するかを決定する場合、リガンドの数
(pの値)が少なければ、1つのリガンド決定残基位置の
アミノ酸残基のみでリガンドの種類を予測することが可
能となる。しかし、かかる場合であっても、一般に2つ
以上のリガンド決定残基位置のアミノ酸残基を組合せて
リガンドの種類を予測した方が予測精度は高くなる。
【0030】[結合分子決定残基]結合分子決定残基と
は、前記結合分子決定残基位置におけるアミノ酸残基を
意味する。また、結合分子既知タンパク質について複数
種類の結合分子の特定残基位置(1つ又は2つ以上)と
複数種類のアミノ酸残基とを組合せ、結合分子決定残基
としても良い。例えば、シークエンスアラインメント第
2番目と第8番目のアミノ酸残基位置を結合分子決定残
基位置の一例とし、シークエンスアラインメント第9番
目と第11番目のアミノ酸残基を他の例とする場合であ
る。このように異なった結合分子決定残基位置を組合せ
ることにより、結合分子又は結合分子の種類の予測精度
を向上させることが可能となるからである。結合分子決
定残基に関する情報とは、前記結合分子決定残基位置に
おけるアミノ酸残基に関する情報を意味する。例えば、
タンパク質のシークエンスアラインメントの第2番目と
第8番目が結合分子決定残基位置であれば、シークエン
スアラインメントの第2番目と第8番目が、結合分子決
定残基の位置に関する情報である。そして、シークエン
スアラインメントのうち、第2番目と第8番目のアミノ
酸残基の種類についての情報と当該結合分子決定残基の
位置に関する情報とをあわせて結合分子決定残基に関す
る情報となる。
【0031】[結合分子決定残基−結合分子分類情報]
結合分子決定残基−結合分子分類情報とは、結合分子決
定残基と結合分子または結合分子の種類との相関関係を
表す表である。この表は、紙面のみならず、電子的に保
存され視覚により表として認識することができるような
態様のものであれば特に限定されるものではない。ま
た、結合分子決定残基と結合分子又は結合分子の種類と
の対応が認識できるようなものであれば特に限定される
ものではない。
【0032】[結合分子]結合分子としては、生体高分
子である結合分子既知タンパク質及び結合分子未知タン
パク質に結合しうるものであれば特に限定されるもので
はないが、例えば、レセプタータンパク質に結合するリ
ガンドや、GPCRに結合するGαタンパク質などがあ
げられる。
【0033】[結合分子の種類]結合分子の種類とは、
同じ種類の結合分子既知タンパク質に複数の結合分子が
存在する場合にそれらをその機能や性質などに応じて分
類したものである。例えば、GPCRのリガンドを、モ
ノアミン、脂質、ペプチドに分類する場合があげられ
る。
【0034】[コンピュータ]本発明のコンピュータ
は、一定の計算等をすることができる電子的デバイスで
あれば、特に限定されるものではなく、たとえば、パー
ソナルコンピューター、スーパーコンピュータ、モバイ
ル等公知のコンピュータであってもよい。ブラウザを搭
載したコンピュータであれば、インターネットに接続す
ることができ、公知のWeb(ウェブ)サイトにアクセ
スすることができるので特に好ましい。
【0035】以下、結合分子がリガンドである場合を例
にしてリガンド決定残基−リガンド分類情報作成までの
工程を説明する。 [リガンド決定残基−リガンド分類情報作成までの工
程]図1は、リガンド決定残基−リガンド分類情報作成
までの工程の一例を表し、以下の工程からなる。すなわ
ち、アミノ酸配列とリガンド(及び/又はリガンドの種
類)とが既知である少なくとも2以上の結合分子既知タ
ンパク質についてのシークエンスアラインメントとリガ
ンド(及び/又はリガンドの種類)に関する情報を取得
する工程(S101)、シークエンスアラインメントとリガ
ンド(及び/又はリガンドの種類)を対応付け、結合分
子既知タンパク質分類情報を得るシークエンスアライン
メントリガンド分類情報取得工程(S102)、シークエン
スアラインメントリガンド分類情報取得工程により得ら
れる結合分子既知タンパク質分類情報を用いて結合分子
既知タンパク質のシークエンスアラインメントのうちリ
ガンド(及び/又はリガンドの種類)を決定することに
関与すると想定される位置であるリガンド決定残基位置
を1又は2以上特定するリガンド決定残基位置特定工程
(S103)、リガンド決定残基位置特定工程により特定さ
れたリガンド決定残基位置におけるアミノ酸残基(リガ
ンド決定残基)によって、リガンド(及び/又はリガン
ドの種類)を対応付けたリガンド決定残基とリガンド
(及び/又はリガンドの種類)との相関関係を表すリガ
ンド決定残基−リガンド分類情報を得るリガンド決定残
基−リガンド分類工程(S104)である。以下、各工程に
ついて説明する。なお、以降リガンドの種類を含めて単
にリガンドという場合もある。
【0036】[ステップ101]まず、リガンド決定残
基−リガンド分類情報を作成するために、アミノ酸配列
とリガンドとが既知である少なくとも2以上の結合分子
既知タンパク質についてのシークエンスアラインメント
とリガンド(及び/又はリガンドの種類)に関する情報
を取得する(S101)。この工程では、複数の結合分子既
知タンパク質についてアミノ酸配列とリガンド(及び/
又はリガンドの種類)に関する情報を取得するが、アミ
ノ酸配列からシークエンスアラインメントを求めても良
いし、複数の結合分子既知タンパク質について既にシー
クエンスアラインメントが求められていれば、そのシー
クエンスアラインメントに関する情報を直接取得しても
良い。結合分子既知タンパク質についてのシークエンス
アラインメントとリガンド(及び/又はリガンドの種
類)に関する情報を取得する方法は、特に限定されるも
のではなく、データベースから当該情報を取得しても、
計算により当該情報を取得しても良い。データベースと
しては、少なくとも100種類以上の結合分子既知タンパ
ク質についてのシークエンスアラインメントとリガンド
(及び/又はリガンドの種類)に関する情報を収録して
いるデータベースが好ましく、500以上収録していれば
より好ましく、1000以上収録していれば特に好ましい。
結合分子既知タンパク質の数が多いほど、リガンド決定
残基−リガンド分類情報の精度が高まるからである。
【0037】公知のデータベースとしては、結合分子既
知タンパク質のシークエンスアラインメントとリガンド
(及び/又はリガンドの種類)を記述しているものであ
れば特に限定されるものではなく、例えばGPCRDB
(http://www.GPCR.org/7tm/)があげられる。シーク
エンスアラインメントは、公知の計算方法によって求め
ることもできる。シークエンスアラインメントに関して
公知の計算法としては、例えばClustal WやBLASTが挙げ
られるが、手動で計算しても良い。また、リガンドに関
する分類をあらかじめ作成しておき、リガンドに関する
情報が入力されれば、リガンドの種類が自動的に求めら
れるようにしてき、リガンドの情報を入手すれば、リガ
ンドの種類に関する情報も得られるようにしてもよい。
【0038】[ステップ102]次に、ステップ101で
取得された2以上の結合分子既知タンパク質についての
シークエンスアラインメントとリガンド(及び/又はリ
ガンドの種類)に関する情報について、シークエンスア
ラインメントとリガンド(及び/又はリガンドの種類)
に関する情報を対応付け、結合分子既知タンパク質分類
情報を得る(シークエンスアラインメントリガンド分類
情報取得工程:S102)。ステップ101において、2以上の
結合分子既知タンパク質についてのシークエンスアライ
ンメントとリガンド(及び/又はリガンドの種類)に関
する情報をデータベース等から取得する際に、すでにシ
ークエンスアラインメントとリガンド(及び/又はリガ
ンドの種類)が対応付けられていれば、シークエンスア
ラインメントとリガンド(及び/又はリガンドの種類)
が対応付けられたままの情報を取得してもよい。
【0039】[ステップ103]次に、ステップ102の
シークエンスアラインメントリガンド分類情報取得工程
により得られる結合分子既知タンパク質分類情報を用い
て、結合分子既知タンパク質のシークエンスアラインメ
ントのうちリガンド(及び/又はリガンドの種類)を決
定することに関与すると想定される位置であるリガンド
決定残基位置を1又は2以上特定する(リガンド決定残基
位置特定工程:S103)。
【0040】この工程においては、対象とするタンパク
質の種類や性質に合わせ好ましい関数を組合せてリガン
ド決定残基位置を1又は2以上特定する。この工程の好ま
しい実施態様については、後述する。
【0041】[ステップ104]次に、リガンド決定残
基位置特定工程により特定されたリガンド決定残基位置
におけるアミノ酸残基(リガンド決定残基)によって、
リガンド(及び/又はリガンドの種類)を対応付けたリ
ガンド決定残基とリガンドとの相関関係を表すリガンド
決定残基−リガンド分類情報を得る(リガンド決定残基
−リガンド分類工程:S104)。
【0042】この工程では、それぞれのGPCRについ
てリガンド決定残基位置、リガンド決定残基、及びリガ
ンド(及び/又はリガンドの種類)に関する情報を、シ
ークエンスアラインメントリガンド分類情報から取得
し、リガンド決定残基−リガンド分類情報を得る。
【0043】このようなリガンド決定残基−リガンド分
類情報を用いれば、リガンド未知のGPCRについて
も、そのシークエンスアラインメントを求めるだけで、
そのリガンド(及び/又はリガンドの種類)を予測する
ことが可能となる。
【0044】[ステップ103の一実施態様]図2に従
って、リガンド決定残基位置特定工程(S103)の好まし
い一態様を説明する。この工程は、リガンド決定残基位
置の数が1つの場合である。リガンドをp種類に分け、そ
れぞれX1からXpに分類する。ステップ102で得られた結
合分子既知タンパク質分類情報に存在する結合分子既知
タンパク質の全てのシークエンスアラインメントとリガ
ンド(及び/又はリガンドの種類)に関する情報を下記
の式15に入力し、関数f1(n)の値が小さいものから、
リガンド決定残基位置の候補とする(リガンド決定残基
位置候補選択工程:S201)。このとき、得られたリガン
ド決定残基位置の候補におけるシークエンスアラインメ
ントについて、シークエンスアラインメント不能(-で表
される)が、全GPCRの3%以上存在すれば、当該リ
ガンド決定残基位置をリガンド決定残基位置として採用
しないことが好ましい。
【式15】 [式15中、nは、f1(n)が、結合分子既知タンパク質
のシークエンスアラインメントのうち第n番目のアミノ
酸残基についての評価関数であることを表し、Resは、
アミノ酸残基の種類を表し、Xq及びXrは、リガンドを表
し、qは1からp-1までの整数を表し、rはqより大きくp以
下である整数を表し、pはリガンドの数を表し、N(Res,
Xq)は、結合分子既知タンパク質分類情報に存在する結
合分子既知タンパク質のうち、シークエンスアラインメ
ントのn番目のアミノ酸残基がResであり、かつリガン
ドがXqであるものの数を表し、N(Res, Xr)は、結合分子
既知タンパク質分類情報に存在する結合分子既知タンパ
ク質のうち、シークエンスアラインメントのn番目のア
ミノ酸残基がResであり、かつリガンドがXrであるもの
の数を表す。]
【0045】リガンド決定残基位置候補選択工程におい
てあげられるリガンド決定残基位置候補の数としては、
特に限定されるものではないが、1以上100以下が好まし
く、1以上10以下であればより好ましく、1以上5以下で
あれば特に好ましい。リガンド決定残基位置候補が多す
ぎると後のリガンド決定残基位置候補の信頼性確認工程
が困難になるからである。
【0046】ステップ201のリガンド決定残基位置候補
選択工程において選択されたリガンド決定残基位置候補
は、そのままリガンド決定残基位置としてもよいが、リ
ガンド決定残基位置の候補の信頼性を式2を用いて検討
することがより好ましい。(リガンド決定残基位置候補
の信頼性検討工程:S202)。この場合、下記式16を用
いてリガンド決定残基位置候補の信頼性を検討する。得
られたf2(n)の値が小さいほどリガンド決定残基位置と
してふさわしいこととなる。
【式16】 [式16中、nは、f2(n)が、結合分子既知タンパク質
のシークエンスアラインメントのうち第n番目のアミノ
酸残基についての評価関数であることを表し、Resは、
アミノ酸残基の種類を表し、X1からXpは、リガンド又は
リガンドの種類を表し、pは、リガンド又はリガンドの
種類の数を表し、N(Res, X)は、ステップ102で得られた
結合分子既知タンパク質分類情報に存在する結合分子既
知タンパク質のうち、シークエンスアラインメントのn
番目のアミノ酸残基がResであり、かつリガンドがXであ
るものの数を表す。]
【0047】ステップ201で得られたf1(n)の値及び/ま
たはステップ202で得られたf2(n)の値を用いてリガンド
決定残基位置を特定する(リガンド決定残基位置特定工
程:S203)。得られたf2(n)の値が最も小さいものをリガ
ンド決定残基位置としてもよいし、f1(n)とf2(n)の値の
積が最も小さなものをリガンド決定残基位置としてもよ
いし、f1(n)とf2(n)の値の和が最も小さなものをリガン
ド決定残基位置としてもよい。また、ステップ102で得
られた結合分子既知タンパク質分類情報に存在する結合
分子既知タンパク質のアミノ酸残基位置のうち、f1(n)
が低い方から順位付けをし、更にf2(n)についても同様
に順位付けをし、両方の順位を掛け合わせ、最も低いも
のをリガンド決定残基位置としてもよい。また、得られ
たリガンド決定残基位置におけるシークエンスアライン
メントについてシークエンスアラインメント不能(-で表
される)が、全GPCRの3%以上存在すれば、当該リ
ガンド決定残基位置をリガンド決定残基位置として採用
しないことが好ましい。
【0048】[ステップ103の別の実施態様]図3に
従って、リガンド決定残基位置特定工程(S103)の好ま
しい別の実施態様を説明する。この工程は、リガンド決
定残基位置の数が2つの場合である。まず、ステップ102
で得られた結合分子既知タンパク質分類情報に存在する
結合分子既知タンパク質の全てのシークエンスアライン
メントと、リガンド又はリガンドの種類に関する情報を
式1に入力し、リガンド決定残基位置の候補をあげる
(リガンド決定残基位置候補選択工程:S301)。
【0049】リガンド決定残基位置候補選択工程におい
てあげられるリガンド決定残基位置候補の数としては、
特に限定されるものではないが、1以上100以下が好まし
く、1以上20以下であればより好ましく、2以上10以下で
あれば更に好ましく、2以上6以下であれば特に好まし
い。リガンド決定残基位置候補が多いと後のリガンド決
定残基位置候補の信頼性確認工程が困難になり、候補が
1だと多様なリガンド種類に対応できないからである。
【0050】ステップ301のリガンド決定残基位置候補
選択工程においてあげられたリガンド決定残基位置候補
について、リガンド決定残基位置の候補の信頼性を式2
を用いて検討することを含めることはより好ましい実施
態様である(リガンド決定残基位置候補の信頼性検討工
程:S302)。なお、ステップ302であるリガンド決定残基
位置信頼性検討工程を経ない場合は、ステップ301の後
ステップ303へと進めばよい。リガンド決定残基位置信
頼性検討工程では、少なくともリガンド決定残基位置候
補を含むアミノ酸残基位置に関して、式2に結合分子既
知タンパク質のシークエンスアラインメントとリガンド
に関する情報を入力する。関数f2(n)の値の小さいもの
がリガンド決定位置残基位置としてふさわしい。
【0051】関数f2(n)の値の小さいものからリガンド
決定残基位置として選択してもよいし、f1(n)とf2(n)の
値の積が最も小さなものをリガンド決定残基位置として
選択してもよいし、f1(n)とf2(n)の値の和が最も小さな
ものをリガンド決定残基位置として選択してもよい。ま
た、ステップ102で得られた結合分子既知タンパク質分
類情報に存在する結合分子既知タンパク質のアミノ酸残
基位置のうち、f1(n)が低い方から順位付けをし、更にf
2(n)についても同様に順位付けをし、両方の順位を掛け
合わせ低いものからリガンド決定残基位置として選択し
てもよい。また、得られたリガンド決定残基位置におけ
るシークエンスアラインメントについてシークエンスア
ラインメント不能(-で表される)が、結合分子既知タン
パク質分類情報に記載されたGPCRの3%以上存在す
れば、当該リガンド決定残基位置をリガンド決定残基位
置として採用しないことが好ましい。
【0052】次に、ステップ301又はステップ302におい
てあげられた、リガンド決定残基位置の候補を2つ組合
せ、リガンド決定残基位置のペア候補をあげる(リガン
ド決定残基位置のペア選択工程:S303)。リガンド決定
残基位置のペア候補としては、全てのリガンド決定残基
位置の候補からなる組合せをあげても良いし、f1(n)の
好ましいリガンド決定残基位置とその他の残基位置との
組合せでリガンド決定残基位置のペア候補をあげても良
い。
【0053】リガンド決定残基位置のペア候補について
の情報を式17に入力することによりリガンド決定残基
位置のペアを特定する(リガンド決定残基位置のペア特
定工程:S304)。
【式17】 [式17中、(m,n)は、f3(m, n)が結合分子既知タンパ
ク質のシークエンスアラインメントのうち第m番目と第
n番目のアミノ酸残基についての評価関数であることを
表し、アミノ酸残基ペア種類数は、結合分子既知タンパ
ク質のシークエンスアラインメントのうち第m番目と第
n番目のアミノ酸残基の組合せの種類の数を表し、2交
差残基ペア種類数及び3交差残基ペア種類数はそれぞ
れ、結合分子既知タンパク質のシークエンスアラインメ
ントのうち第m番目と第n番目のアミノ酸残基の組合せ
のうちリガンドが2種類及び3種類のものの数を意味し、
p交差残基ペア種類数は、結合分子既知タンパク質のシ
ークエンスアラインメントのうち第m番目と第n番目の
アミノ酸残基の組合せのうちリガンドがp種類のものの
数を意味し、シークエンスアラインメント不能アミノ酸
残基数とは、結合分子既知タンパク質のシークエンスア
ラインメントのうち第m番目と第n番目のアミノ酸残基
のうち一方が、好ましい相同性を得るためにシークエン
スアラインメント不可能とされた数を意味し、シークエ
ンスアラインメント不能アミノ酸残基ペア数とは、結合
分子既知タンパク質のシークエンスアラインメントのう
ち第m番目と第n番目のアミノ酸残基の両方が、好まし
い相同性を得るためにシークエンスアラインメント不可
能とされた数を意味し、wXは正の定数、またはアミノ
酸ペア種類数を変数とする分布関数であって、アミノ酸
ペア種類数が400以下の正の数であるときに最大値を与
える分布関数を意味し、w1…wp-1、wA、wBは、ウエ
イトであり、正の数である。]
【0054】wXは正の定数でもよく、ガウス関数や分
布関数でもよい。正の定数の場合、特に限定されるもの
ではないが、1が望ましい。wXが、分布関数の場合、
wXは正の定数、またはアミノ酸ペア種類数を変数とす
る分布関数であって、アミノ酸ペア種類数が400以下
であるときに最大値を与える分布関数を意味し、特に限
定されるものではない。例えば、アミノ酸ペア種類数を
変数とするガウス関数、ローレンツ関数などでもよい。
その最大値は、正の数であれば特に限定されるものでは
ない。この分布関数の最大値を与えるような変数の値と
しては、400以下が好ましく、20〜200であればより好ま
しく、40〜140であれば更に好ましい。この値は、リガ
ンド決定アミノ酸ペアの総数が20×20 = 400であり、経
験上40〜140種のアミノ酸ペアによる予測が最も良好な
結果を与えることから決定されたものである。分布関数
の半値全幅としては、10以上100以下が好ましく、
20以上70以下であればより好ましく、30以上50
以下であれば更に好ましい。分布関数の最大値として
は、他のウエイトとの関係にもよるが、1が好ましい。
ウエイト(w1…wp-1、wA、wB)の値は、正の数であ
れば特に限定されるものではない。しかし、例えば、3
交差残基ペアが存在する場合、2交差残基ペアよりもリ
ガンドを予測する上で好ましくないためw2の値がw1の
値よりも大きいことが好ましい。例えば、リガンドの数
が3つの場合は、3交差残基ペア以降は存在し得ない。こ
の場合のウエイトの組合せとしては、w1が2でw2が5で
wAとwBが1の組合せがあげられる。
【0055】リガンド決定残基位置のペア候補のうち小
さなf3(m,n)の値を与えるものが好ましいリガンド決定
残基位置のペアである。
【0056】なお、特に明示しないが、リガンド決定残
基位置のペアを任意に組合せたリガンド決定残基−リガ
ンド分類情報を得ることは、本発明の好ましい別の実施
態様である。組合せ方としては、特に限定されるもので
はないが、前述の関数f3(n)の値が一番小さなものと、
二番目及び/又はx番目(ここで、xは2より大きく1
00より小さな整数を表す。) に小さなものを組合せ
る、関数f3(m,n)の値がx番目に小さなものとy番目(こ
こで、yは、xとは異なり、2より大きく100より小
さな整数を表す。) に小さなものを組合せる等があげ
られる。例えば、f3(n)関数の値が、29番目までのリ
ガンド決定残基を任意に組合せることができる。ここ
で、x番目及びy番目のx及びyは、コンピュータにあ
らかじめ入力されていてもよいし、ユーザからの入力情
報をコンピュータが受け取り、リガンド決定残基の組合
せを作成してもよい。f3(m,n)関数の値が最小なものと2
番目に小さなものを組合せたのみでは、リガンド及び/
又はリガンドの種類を予測することのできるリガンド位
置決定残基は限られたものとなる。しかし、このよう
に、複数のリガンド位置決定残基を組合せることで、多
くの種類のリガンド未知タンパク質のリガンド及び/又
はリガンドの種類を予測することが可能となり、しかも
当該予測の精度も高まることとなりうる。このような、
リガンド決定残基の組合せは、リガンド決定残基組合せ
手段により自動的に組合せることが可能となっているこ
とが、本発明の好ましい実施の態様である。かかる手段
を用いれば、リガンド決定残基位置から導かれる予測を
補完することができる。なお、上記xとyは、それぞれ
2より大きく、100より小さいことが好ましく、50
より小さければより好ましく、30より小さければ更に
好ましく、20より小さければ特に好ましい。この実施
態様では、例えば、あるリガンド既知タンパク質のアミ
ノ酸残基のうち、関数f3(m,n)の値が一番小さなリガン
ド決定残基位置にあるものを抽出する。そして、リガン
ド決定残基−リガンド分類情報にあげられたリガンド既
知タンパク質のうち、抽出されたリガンド決定残基と一
致するものの数を求める。さらに、これらのうちで、リ
ガンド又はリガンドの種類が、当該あるリガンド既知タ
ンパク質と一致するものの数を求める。このような本明
細書ではこのようにしてえられた値をN:((リガンド
決定残基−リガンド分類情報にあげられたリガンド既知
タンパク質のうち、抽出されたリガンド決定残基と一致
するものの数)/(リガンド又はリガンドの種類が、当
該あるリガンド既知タンパク質と一致するものの数))
とする。そして、関数f3(m,n)の値が二番目に小さなリ
ガンド決定残基位置についても同様にNを求める。その
後、関数f3(m,n)の値第一番目及び第二番目に小さなリ
ガンド決定残基位置のNの分母同士及び分子同士を足し
合わせる。このようにして、リガンド決定残基位置のペ
アを任意に組合せたリガンド決定残基−リガンド分類情
報を得るのである。
【0057】以上説明した各工程は、手動によって行わ
れてもよいが所定の媒体又はプログラムをインストール
したコンピュータによって行われることが特に好まし
い。また、このコンピュータは、インターネットに接続
されており、外部のデータベースにアクセス可能となっ
ていることが特に好ましい。
【0058】このようなコンピュータは、少なくとも、
結合分子未知タンパク質のシークエンスアラインメント
に関する情報を入力するシークエンスアラインメント入
力手段と、前記シークエンスアラインメント入力手段に
より入力された結合分子既知タンパク質のアミノ酸配列
又はシークエンスアラインメントと結合分子又は結合分
子の種類に関する情報とを記憶するシークエンスアライ
ンメント結合分子記憶手段と、前記シークエンスアライ
ンメント結合分子記憶手段により記憶された結合分子既
知タンパク質のアミノ酸配列又はシークエンスアライン
メントと結合分子又は結合分子の種類に関する情報を用
いて前記結合分子決定残基位置を予測する結合分子決定
残基位置決定手段と、前記結合分子決定残基位置におけ
るアミノ酸残基(結合分子決定残基)と結合分子または
結合分子の種類とを対応付けることにより、結合分子決
定残基と結合分子または結合分子の種類との相関関係を
表す結合分子決定残基−結合分子分類情報を得る結合分
子決定残基−結合分子分類情報取得手段とを具備する。
【0059】結合分子決定残基位置決定手段において
は、結合分子既知タンパク質のシークエンスアラインメ
ントや結合分子又は結合分子の種類に関する情報を先述
したf1(n)、f2(n)、f3(m,n)関数のいずれか又はこれら
を任意に組合せ結合分子決定残基位置を決定する。
【0060】リガンド決定残基−リガンド分類情報は、
独自のデータベースを構成していてもよいし、ステップ
102で得られる結合分子既知タンパク質分類情報に基づ
くリレーショナルデータベースとして構成されていても
よい。リガンド決定残基−リガンド分類情報が、結合分
子既知タンパク質分類情報に基づくリレーショナルデー
タベースとして構成されていれば、結合分子未知タンパ
ク質のシークエンスアラインメントとそのリガンドが確
認された場合、それを結合分子既知タンパク質分類情報
に組込んで、リガンド決定残基位置を容易に再評価する
ことができるため好ましい。
【0061】このようなコンピュータであれば、結合分
子決定残基−結合分子分類情報に結合分子未知タンパク
質のシークエンスアラインメントを入力することにより
結合分子又は結合分子の種類を容易に予測することが可
能となる。
【0062】なお、本発明のコンピュータは、結合分子
決定残基−結合分子分類情報をあらかじめインストール
しておき、タンパク質のシークエンスアラインメントを
入力するシークエンスアラインメント入力手段によっ
て、結合分子未知タンパク質のシークエンスアラインメ
ントを入力することにより、結合分子及び/又は結合分
子の種類を予測するコンピュータであってもよい。この
ようなコンピュータであっても、結合分子決定残基−結
合分子分類情報に結合分子未知タンパク質のシークエン
スアラインメントを入力することにより結合分子又は結
合分子の種類を容易に予測することが可能となる。
【0063】[仮想的な結合分子既知タンパク質を用い
た例]以下、仮想的な結合分子既知タンパク質を用い
て、本発明のリガンド決定残基−リガンド分類情報作成
までの工程及び結合分子未知タンパク質の結合分子種予
測工程を説明する。
【0064】表1は、仮想的な結合分子既知タンパク質
分類情報の例である。この系では、リガンドが既知であ
りアミノ酸配列(シークエンスアラインメント)が既知
である6つの結合分子既知タンパク質が集められてい
る。そして、リガンドは、P、A、Nの3つの分類に分けら
れている。リガンドの種類に基づいてリガンド決定残基
位置を決定する場合は、P、A、Nが、それぞれ式1、式2
におけるX1、X2、X3に対応する。また、リガンドに基づ
いてリガンド決定残基位置を決定する場合は、○×、×
×、△△が、それぞれ式1、式2におけるX1、X2、X3に対
応する。
【0065】
【表1】
【0066】表1において、例えば1番目の結合分子既
知たんぱく質のシークエンスアラインメントが、TLMRK
であり、その結合分子(リガンド)は○×である。そし
て、リガンド○×のリガンドの種類は、Pである。
【0067】評価関数f1(1)について説明する。上記シ
ークエンスアラインメントのうち1番目のアミノ酸残基
はTのみである。したがって、関数f1(n)において、Res
はTのみである。アミノ酸残基がTであって、リガンドが
Pであるものは3種類あるから、N(Res, X1)= N(T,X1)=3
となる。同様にして、N(Res, X2)= N(T,X2)=2、N(Res,
X3)= N(T,X3)=1 となる。これから、f1(1)は以下の通
りとなる。
【式18】
【0068】次にf2(1)について説明する。
【0069】
【式19】 となる。
【0070】f1(2)とf2(2)について説明する。上記シー
クエンスアラインメントのうち2番目のアミノ酸残基は
L、M、Cの3種類である。したがって、関数f1(n)におい
て、ResはL、M、Cである。2番目のアミノ酸残基がLであ
って、リガンドがPであるものは3種類あるから、N(L,X
1)=N(L,P)=3となる。2番目のアミノ酸残基がLであっ
て、リガンドがA、Nのものは存在しないから、N(L,X2)=
N(L,A)=N(L,X3)=N(L,N)=0となる。2番目のアミノ酸残基
がMであって、リガンドがAであるものは2種類あるか
ら、N(M,X2)=N(M,A)=2となる。2番目のアミノ酸残基がL
であって、リガンドがP、Nのものは存在しないから、N
(M,X1)=N(M,P)=N(M,X3)=N(M,N)=0となる。2番目のアミ
ノ酸残基がCであって、リガンドがNであるものは1種類
あるから、N(C,X3)=N(C,N)=1となる。2番目のアミノ酸
残基がCであって、リガンドがP、Aのものは存在しない
から、N(C,X1)=N(C,P)=N(C,X2)=N(C,A)=0となる。これ
から、f1(2)は以下の通りとなる。
【0071】
【式20】
【0072】またf2(2)は次の通りとなる。
【0073】
【式21】
【0074】同様にしてf1(3)=5、f1(4)=0、f1(5)=8、f
2(3)=1、f2(4)=O、f2(5)=4となる。
【0075】f1(n)の値が小さなものから並べると、n
が2、4、3、5、1の順番となる。小さなf1(n)の値を与え
るアミノ酸残基位置が、リガンド決定残基位置の候補で
ある。ここでは、第2、4、3番目のアミノ酸残基位置
を、リガンド決定残基位置の候補とする。いくつのアミ
ノ酸残基位置をリガンド決定残基位置の候補とするかは
あらかじめ決めておいても良い。これらのアミノ酸残基
位置におけるf2(n)の値は、第1、5番目のアミノ酸残基
位置におけるf2(n)の値に比べ小さいことから、第2、
4、3番目のアミノ酸残基位置が、リガンド決定残基位置
の候補として望ましい候補であることが確認できる。
【0076】[リガンド決定残基位置のペア決定過程]
リガンド決定残基位置のペアに対してリガンドが2種類
あるものを2交差残基ペア種とし、リガンド決定残基位
置のペアに対してリガンドが3種類あるものを3交差残基
ペア種とする。第2、4、3番目のアミノ酸残基位置をそ
れぞれ組合せ、リガンド決定残基位置のペア候補をあげ
る。この例では、(2,3)、(2,4)、(3,4)の3種類のペア候
補があげられる。
【0077】まず、リガンド決定残基位置のペア候補
(2,3)について検討する。シークエンスアラインメント
の2番目と3番目にあるアミノ酸残基の組合せは、(L,
M)、(M,M)、(C,M)、(L,L)、(M,L)の5種類である。した
がって、「属するアミノ残基ペア種類数」は5である。
これら5種類のアミノ酸残基の組合せについて対応する
リガンドはそれぞれ一義的に決まるので、2交差残基ペ
ア種と3交差残基ペア種はない。これからf3(2,3)の値は
5である。同様にして、f3(2,4)の値は、4であり、 f3
(3,4)の値は、5である。よって残基位置のペア(2,4)が
最も好ましく、リガンド決定残基位置のペアである。
【0078】なお、好ましくないアミノ酸残基位置の組
合せであれば、f3の値が大きくなることを示すために、
アミノ酸残基位置1と5の組合せを用いてf3(1,5)を求め
る。シークエンスアラインメントの1番目と5番目にある
アミノ酸残基の組合せは、(T,K)、(T,A)の2種類であ
る。したがって、「属するアミノ残基ペア種類数」は2
である。(T,K)の組合せに対応するリガンドの種類は、
P、A、Nの3種であるから、(T,K)は、3交差残基ペア種で
ある。よって、f3(1,5)の値は、7となる。この値は、f3
(2,4)の値よりも大きく、関数f3がリガンド決定残基位
置のペア決定に適していることが理解できる。
【0079】[リガンド決定残基−リガンド分類情報作
成工程]以上よりリガンド決定残基位置のペアがシーク
エンスアラインメントの(2,4)番目であることがわかっ
た。これらに対応するアミノ酸残基とそのリガンドを抽
出しリガンド決定残基−リガンド分類情報を作成する。
【0080】
【表2】
【0081】表2から、例えば、2、4番目のシークエ
ンスアラインメントがそれぞれLとRであれば、そのリ
ガンドは○×であり、リガンドの種類はPであると予測
される。
【0082】[結合分子未知タンパク質の結合分子種予
測工程]以上のようなリガンド決定残基−リガンド分類
情報を入手できれば、結合分子未知タンパク質(リガン
ドが未知の結合分子既知タンパク質)のリガンド決定残
基位置におけるアミノ酸残基を求めリガンド決定残基−
リガンド分類情報に当てはめることにより、結合分子未
知タンパク質のリガンドを予測することが可能となる。
例えば、ある結合分子未知タンパク質のシークエンスア
ラインメントを公知の方法により求め、当該シークエン
スアラインメントのうち第2番目と第4番目のアミノ酸残
基が、それぞれMとQであれば、その結合分子未知タンパ
ク質のリガンドの種類はA、でありリガンドは××(表
2)と予想できる。このように、結合分子未知タンパク
質のリガンド(又はリガンドの種類)を予測することに
より、そのタンパク質とリガンドのペアが決められ、そ
のリガンドの物理的・化学的・生物学的性質は容易に推
定できることから、そのタンパク質の機能を推定するこ
とにつながる。したがって、本発明の予測方法は新規な
医薬を開発する上でも有益である。
【0083】以上の説明では、リガンドについて説明し
たが、本発明は、リガンドのみならず、結合分子既知タ
ンパク質に結合する分子を予測することができる。例え
ば、結合分子既知タンパク質がGPCRである場合には
当該GPCRに結合する、Gαタンパク質を予測するこ
ともできる。
【0084】各種細胞や臓器における複雑な機能を調節
する物質と、その特異的レセプタータンパク質、特には
Gタンパク質共役型レセプタータンパク質との関係を明
らかにすることは、各種細胞や臓器における複雑な機能
を解明し、それら機能と密接に関連した医薬品開発に非
常に重要な手段を提供することとなる。本発明の結合分
子未知タンパク質の結合分子予測方法を用いれば、例え
ば、GPCRのリガンド及び/又はリガンドの種類を予
測することが可能となる。GPCRのリガンド及び/又
はリガンドの種類を予測することができれば、当該GP
CRの生体内での機能を予測することにつながる。そし
て、例えば、機能が予測され、そのリガンド及び/又は
リガンドの種類が予測されたGPCRに関する情報を用
いれば、容易に当該GPCRが関与する疾患等の予防
薬、治療薬を製造することが可能となる。
【0085】GPCRの機能を考慮すると、特に中枢疾
患、炎症性疾患、循環器疾患、癌、代謝性疾患、免疫系
疾患または消化器系疾患の予防剤、若しくは治療剤のい
ずれか又は両方の製造方法に本発明は有効に利用される
こととなる。
【0086】本明細書の配列表の配列番号は、以下の配
列を示す。 〔配列番号:1〕ラットTGR23−2リガンド(1−
18)のアミノ酸配列を示す。 〔配列番号:2〕ラットTGR23−2リガンド(1−
15)のアミノ酸配列を示す。 〔配列番号:3〕ラットTGR23−2リガンド(1−
14)のアミノ酸配列を示す。 〔配列番号:4〕以下の参考例6におけるPCR反応で
使用したプライマーの塩基配列を示す。 〔配列番号:5〕以下の参考例6におけるPCR反応で
使用したプライマーの塩基配列を示す。 〔配列番号:6〕以下の参考例6におけるPCR反応で
使用したプライマーの塩基配列を示す。 〔配列番号:7〕ヒトTGR23−2リガンド前駆体を
コードするcDNAの塩基配列を示す。 〔配列番号:8〕ヒトTGR23−2リガンド前駆体の
アミノ酸配列を示す。 〔配列番号:9〕ヒトTGR23−2リガンド(1−1
8)のアミノ酸配列を示す。 〔配列番号:10〕ヒトTGR23−2リガンド(1−
15)のアミノ酸配列を示す。 〔配列番号:11〕ヒトTGR23−2リガンド(1−
14)のアミノ酸配列を示す。 〔配列番号:12〕ヒトTGR23−2リガンド(1−
20)のアミノ酸配列を示す。 〔配列番号:13〕以下の参考例7におけるPCR反応
で使用したプライマーの塩基配列を示す。 〔配列番号:14〕以下の参考例7におけるPCR反応
で使用したプライマーの塩基配列を示す。 〔配列番号:15〕以下の参考例7におけるPCR反応
で使用したプライマーの塩基配列を示す。 〔配列番号:16〕マウスTGR23−2リガンド前駆
体をコードするcDNAの塩基配列を示す。 〔配列番号:17〕マウスTGR23−2リガンド前駆
体のアミノ酸配列を示す。 〔配列番号:18〕マウスTGR23−2リガンド(1
−18)のアミノ酸配列を示す。 〔配列番号:19〕マウスTGR23−2リガンド(1
−15)のアミノ酸配列を示す。 〔配列番号:20〕マウスTGR23−2リガンド(1
−14)のアミノ酸配列を示す。 〔配列番号:21〕マウスTGR23−2リガンド(1
−20)のアミノ酸配列を示す。 〔配列番号:22〕以下の参考例8におけるPCR反応
で使用したプライマーの塩基配列を示す。 〔配列番号:23〕ラットTGR23−2リガンド前駆
体の一部をコードするcDNAの塩基配列を示す。 〔配列番号:24〕ラットTGR23−2リガンド前駆
体の一部のアミノ酸配列を示す。 〔配列番号:25〕ラットTGR23−2リガンド(1
−20)のアミノ酸配列を示す。 〔配列番号:26〕ヒトTGR23−2リガンド(1−
16)のアミノ酸配列を示す。 〔配列番号:27〕以下の参考例9におけるPCR反応
で使用したプライマーの塩基配列を示す。 〔配列番号:28〕以下の参考例9におけるPCR反応
で使用したプライマーの塩基配列を示す。 〔配列番号:29〕以下の参考例9におけるPCR反応
で使用したプライマーの塩基配列を示す。 〔配列番号:30〕ラットTGR23−2リガンド前駆
体をコードするcDNAの塩基配列を示す。 〔配列番号:31〕ラットTGR23−2リガンド前駆
体のアミノ酸配列を示す。 〔配列番号:32〕以下の参考例10におけるPCR反
応で使用したプライマー1の塩基配列を示す。 〔配列番号:33〕以下の参考例10におけるPCR反
応で使用したプライマー2の塩基配列を示す。 〔配列番号:34〕以下の参考例11におけるTGR2
3−1発現CHO細胞のTGR23−1遺伝子発現量を
測定するのに使用したプライマーの塩基配列を示す。 〔配列番号:35〕以下の参考例11におけるTGR2
3−1発現CHO細胞のTGR23−1遺伝子発現量を
測定するのに使用したプライマーの塩基配列を示す。
〔配列番号:36〕以下の参考例11におけるTGR2
3−1発現CHO細胞のTGR23−1遺伝子発現量を
測定するのに使用したプローブの塩基配列を示す。5’
端は6−カルボキシ−フルオレセイン(Fam)で、
3’端は6−カルボキシ−テトラメチル−ローダミン
(Tamra)で標識されている。 〔配列番号:37〕ヒト由来Gタンパク質共役型レセプ
タータンパク質TGR23−1(ヒトTGR23−1)
のアミノ酸配列を示す。 〔配列番号:38〕ヒト由来Gタンパク質共役型レセプ
タータンパク質TGR23−1をコードするcDNAの
塩基配列を示す。 〔配列番号:39〕ヒト由来Gタンパク質共役型レセプ
タータンパク質TGR23−2(ヒトTGR23−2)
のアミノ酸配列を示す。 〔配列番号:40〕ヒト由来Gタンパク質共役型レセプ
タータンパク質TGR23−2をコードするcDNAの
塩基配列を示す。
【0087】
【実施例】以下の実施例においては、結合分子既知タン
パク質および結合分子未知タンパク質としてGPCRを
あげるが、本発明は、その要旨を超えない限りこれらに
限定されるものではない。
【0088】[実施例1] (GPCRのリガンドの種類の予測)GPCRのシーク
エンスアラインメント及びリガンドが登録されているG
PCRDB(データベース)から、1152種類のGPCR
のシークエンスアラインメントおよびリガンドに関する
情報を取得し結合分子既知タンパク質分類情報(表3)
を得た。その後、取得したリガンドを3つの種類に分け
た。3つの種類は以下の通りである。
【0089】P …… Peptides(ペプチド)、Chemokine
s(ケモカイン)、Glycoproteins(糖タンパク質) A …… Monoamines(モノアミン)、(アドレナリ
ン、アセチルコリン、ドーパミン、セレトニン、ヒスタ
ミン) N …… Lipids(脂質)
【0090】1152種類のGPCRのシークエンスアライ
ンメントおよびリガンドに関する情報をコンピュータに
入力した。入力された1152種類のGPCRのシークエン
スアラインメントおよびリガンドに関する情報をf1(n)
関数及びf2(n)関数を用いたリガンド決定残基位置候補
選択手段により選択した6種類のリガンド決定残基位置
候補を表3に示す。
【0091】リガンド決定残基位置候補選択手段におい
ては、f1(n)関数の値と、f2(n)関数の値の積が小さいも
のをリガンド残基位置候補として選ぶ。それらのうち、
シークエンスアラインメント不能(-)が、全体の3%以
上存在しているものがあれば、リガンド決定残基位置候
補から除いた。このようにして、リガンド残基位置候補
を20個選択した。表3は、それらのうちより好ましい
6個のリガンド残基位置候補について、関数f1(n)、関
数f2(n)の評価値及び順位をそれぞれ表したものであ
る。
【0092】
【表3】
【0093】表3によれば、例えば、シークエンスアラ
インメントが86番の残基位置についての、関数f1(n)
の順位が5位で、関数f2(n)の順位は3位であることがわ
かる。
【0094】上記6種類のリガンド決定残基位置候補を
組合せ、360個のリガンド決定残基位置のペア候補をあ
げた。360個のリガンド決定残基位置のペア候補に関す
る情報を式3に代入し、リガンド決定残基位置のペアを
決定した。その結果、f3(n)の値が最も小さく、最も好
ましいリガンド決定残基位置(のペア)は、(86, 9
0)、すなわち、GPCRのシークエンスアラインメン
トのうち第86番目と第90番目のアミノ酸残基位置であっ
た。また、(86, 90)から導き出される予測を補完でき
るかどうかを指標とし、次に好ましいリガンド決定残基
位置として、(209,211)、と(86, 236)を選択した。
【0095】結合分子既知タンパク質分類情報からGP
CRのシークエンスアラインメントのうち第86番目と第
90番目のアミノ酸残基の種類とリガンドの種類の数を抽
出し、リガンド決定残基−リガンド分類情報を得た。そ
れを抜粋したものを表4に示す。表4から、例えば1152
種類のGPCRのうち、アミノ酸残基位置86番目及び
90番目のアミノ酸がそれぞれAとGであるものは、8
6種類あり、それらのリガンドは全てN(脂質)に分類
されることがわかる。このように、殆どのGPCRは、
アミノ酸残基位置86番目及び90番目のアミノ酸によ
って、そのリガンドを予測することができることがわか
る。
【0096】
【表4】
【0097】表4から、例えば、GPCRのシークエン
スアラインメントのうち第86番目と第90番目のアミノ酸
残基が、それぞれAとGであるGPCRは、86種類あり、
それらに対するリガンドは全てN(脂質)に分類される
リガンドであることがわかる。
【0098】次に、最近リガンドが発見されたGPCR
を無作為に選択し、上記リガンド決定残基−リガンド分
類情報の精度(すなわち、今回のリガンド予測方法の精
度)を分析した。その結果を表5に示す。
【0099】
【表5】
【0100】表5について説明する。例えば、GPR2のシ
ークエンスアラインメントのうち、第(86,90)番目(結
合分子決定残基位置)のアミノ酸残基は、それぞれI、
Mという配列である。結合分子決定残基−結合分子分類
情報にある結合分子既知GPCR1152種類のうち、第(8
6,90)番目のアミノ酸残基が、それぞれI、Mとなるも
のは32種類あって、それらのうちリガンドの種類がペ
プチドのものは32種類全てである。このGPR2は、
1152種類の結合分子既知GPCRに含まれていない
が、実際のリガンドの種類はペプチドであり、予測され
たリガンドの種類と一致している。また、GPR2のシーク
エンスアラインメントのうち、結合分子決定残基位置
(209,211)番目のアミノ酸残基は、それぞれ
V、Fである。そして、上記1152種のうち、20
9、211番目のシークエンスアラインメントが、V、
Fであるものは、26種類あり、それらのうちリガンド
の種類がペプチドのものは4種類である。
【0101】表5から結合分子決定残基位置(86,90)
が、3種のうちで最も好ましい結合分子決定残基位置で
あることがわかる。更に、表5によれば、高い精度をも
ってリガンドの種類を予測できることがわかる。
【0102】次に、結合分子決定残基位置(86,90)、及
び(209,211)を組合せたリガンド決定残基−リガンド
分類情報の精度を分析した。例えば、表5より、GPR2の
結合分子決定残基位置(86,90)、及び(209,211)のN
(1152種のGPCRであって、結合分子決定残基
が、GPR2と一致したものと、リガンドの種類も同一であ
ったものの数)は、それぞれ32/32、及び4/26
である。これらを足し合わせ、36/58とする。この
ようにして、表5に記載された全てのGPCRについ
て、GPR2の結合分子決定残基位置(86,90)、及び(209,2
11)のNを足し合わせた。この結果、評価対象が増大
し、結合分子決定残基位置(86,90)、又は(209,211)単
独でリガンドの種類を予測した場合に比べ、より精度高
くリガンドの種類を予測できることが確認された。
【0103】[実施例2] (GPCRに結合する結合Gαタンパク質の種類の予測
方法)まず、GPCRの結合分子である結合Gαタンパ
ク質をGi、Gq、Gsの3種類に分類した。これは、T
IPS(Trends in pharmacological sciences)の2000
Receptor&Ion channel Nomenclature Supplement に
従って結合Gαタンパク質を3つに分類したものである。
なお、簡単の為に、TIPSの2000 Receptor&Ion ch
annel Nomenclature Supplement 中、Gi/oをGi、Gq/11
をGqとした。また、TIPSの2000 Receptor&Ion ch
annel Nomenclature Supplementにあげられる結合Gαタ
ンパク質のから、2種類以上のGαタンパク質に結合す
るもの、及びGi/a1,3、Gi/a2,3を例外として除外した。
このようにして、約600種類のGPCR及びそのシー
クエンスアラインメント、並びにそれに結合する結合G
αタンパク質、及びその種類に関する情報を得た。
【0104】GPCRのシークエンスアラインメント
と、当該Gタンパク質に結合する結合Gαタンパク質の
種類に関する情報を、コンピュータに入力した。入力さ
れたGPCRのシークエンスアラインメントおよび結合
Gαタンパク質の種類に関する情報をf1(n)関数及びf2
(n)関数を用いた結合分子決定残基位置候補選択手段に
より選択した。その結果、2種類の結合分子決定残基位
置のペア(177、178)、及び(82、230)が
得られた。
【0105】結合分子決定残基位置候補選択手段におい
ては、f1(n)関数の値と、f2(n)関数の値の積が小さいも
のを結合分子残基位置候補として選ぶ。それらのうち、
シークエンスアラインメント不能(-)が、全体の3%以
上存在しているものがあれば、リガンド決定残基位置候
補から除いた。このようにして、リガンド残基位置候補
を選択した。
【0106】次に、2種類の結合分子決定残基位置のペ
ア(177、178)、及び(82、230)の結合分
子の種類を予測する精度を確認した。複数のGPCRに
ついて結合するGαタンパク質の種類を文献から入手し
た。そして、結合Gαタンパク質が、どのような手法で
得られたものであるかを、Cainfluxによる場合、Arachi
donic acid release:アラキドン酸の放出による場合、
PTX(pertussis toxin sensitive)による場合、環状アデ
ノシン一リン酸による場合に分け、それぞれ、Ca、AA、
PTX、cAMPとした。なお、CaだけでGqの判定をしている
場合は、結合Gαタンパク質が他のものである可能性が
あるので、排除した。このようにして、GPCRを選択
した。
【0107】選択されたGPCR及び、文献から得られ
た結合GPCRの種類、当該種類が得られた手法、結合
分子決定残基位置のペア(177、178)、及び(8
2、230)におけるシークエンスアラインメントと、
それぞれのペアから予測されるGαタンパク質の種類を
表6に示す。
【0108】
【表6】
【0109】例えば、表6のGPR5について説明す
る。GPR5の結合Gαタンパク質の種類はGiであり、
その種類は、PTXにより取得されたものである。そし
て、GPR5の第177番目と第178番目のシークエンスアライ
ンメントは、RとSである。このようなシークエンスアラ
インメントをもつGPCRは9個あり、それらの共役Gαタ
ンパク質の種類は、いずれもGiであることがわかる。上
記8種のGPCRのうち、GPR5、GPR13、GPR14、GPR16、GPR2
4、APJの6種について結合Gαタンパク質の予想が的中
している。以上より本発明によれば、高い精度をもって
結合Gαタンパク質を予測することが可能となることが
わかる。
【0110】[実施例3] (TGR23リガンドの予測)2種のSDMペアを組み
合わせて評価することにより、高い精度でリガンドの種
類を予測できることが明らかとなった。そこで、本発明
の方法を用いて、配列番号:37および配列番号:39
で表されるGタンパク質共役型レセプタータンパク質で
あるTGR23のアミノ酸配列情報のシークエンスアラ
インメントを行い、その結果から、TGR23リガンド
の予測を行った。ここでは、TGR23−1とウシロド
プシンのシークエンスアラインメントの結果を図4に示
す。図4に示したとおり、TGR23−1における結合
分子決定残基位置(86、90)、(209,211)
および(86、236)のアミノ酸は、それぞれ(Q、
L)、(D、F)および(Q、N)であった。これらの
N(1152種のGPCRであって、結合分子決定残基
がTGR23と一致したものと、リガンドの種類も同一
であったものの数)は、それぞれ0/0、13/27お
よび52/52であり、評価GPCR数が広範な(8
6、90)と(86、236)のSDMペアを組み合わ
せた評価では、リガンド種類はペプチドであると推定さ
れた。以下の参考例では、実際にTGR23(TGR2
3−1およびTGR23−2)のリガンドがペプチドで
あることを示す。
【0111】[参考例1] (TGR23−2発現CHO細胞に対して特異的にcA
MP産生促進活性を示す活性物質のラット全脳抽出物か
らの精製)TGR23−2に特異的なリガンド活性を示
す物質を、TGR23−2発現CHO細胞に対するcA
MP産生促進活性を指標として、ラット全脳から精製し
た。ラット全脳抽出物の高速液体クロマトグラフィー
(HPLC)フラクションを以下に述べる方法で調製し
た。日本チャールズリバー(株)より購入したオス8週
齢のウィスターラットの全脳400g(200頭分)を
順次摘出直後、25頭ずつ沸騰した蒸留水(300m
l)に投じて10分間煮沸した。煮沸後、直ちに氷冷
し、200頭分を合わせて(2.4L)酢酸180ml
を加えて終濃度1.0Mとし、低温下ポリトロン(1
0,000rpm、2分間)を用いて破砕した。破砕液
を遠心(8,000rpm、30分)して上清を取り、
沈殿には1.0M酢酸2.4Lを加えて再度ポリトロン
によって破砕し、一晩攪拌した後、遠心(8,000r
pm、30分)して上清を得た。各遠心で得られた上清
は、2倍量(4.8L)の冷アセトンを4℃でゆっくり
滴下した後、1回目の遠心により得られた上清について
は一晩攪拌し、2回目の遠心により得られた上清につい
ては4時間攪拌した。アセトンを加えた抽出液は遠心
(8,000rpm、30分)して沈殿を除き、得られ
た上清については減圧下エバポレーターにてアセトンを
留去した。アセトンを留去した抽出液に等量のジエチル
エーテルを加え、分液ロートを使って脂質を含むエーテ
ル層を分離して水層を回収した。エーテル脱脂した抽出
液はエバポレーターにて減圧下濃縮しエーテルを完全に
除去した。濃縮液をガラス繊維濾紙(アドバンテック、
DP70(90mmφ))で濾過し、濾液をガラス製カ
ラム(30φ×240mm)に充填したODSカラム
(ダイソー、Daisogel IR-120-ODS-A 63/210 um)に付
した。カラムを1.0M酢酸400mlで洗浄後、0.
1%トリフルオロ酢酸を含む60%アセトニトリル50
0mlで溶出した。溶出液を減圧下濃縮して溶媒を留去
した後、濃縮液を凍結乾燥した。得られた白色粉末1.
2gを30mlの0.1%トリフルオロ酢酸を含む10
%アセトニトリルに溶解し、12.5mlずつをODS
カラム(東ソー、TSKgel ODS-80Ts(21.5φ×30
0mm))を用いた10%から60%の0.1%トリフ
ルオロ酢酸を含むアセトニトリルの濃度勾配溶出法によ
る分取HPLCに付した。HPLCは2回に分けて行
い、溶出液は2分毎に60分画にし、2回分の溶出液を
まとめた。各分画を減圧下に濃縮・乾固し、残渣に0.
4mlのジメチルスルホキシド(DMSO)を添加後ボ
ルテックスミキサー、および超音波洗浄機を用いて完全
に溶解した。上記によって得られたHPLCフラクショ
ンのDMSO溶液を参考例3に示した方法に従いTGR
23−2発現CHO細胞に投与し、細胞内cAMP産生
量の測定を行なった結果、分画番号18、20および2
2〜23に顕著なcAMP産生促進活性が認められた。
また同様の試料について公知の方法に従いアラキドン酸
代謝物遊離活性を調べた結果、顕著な活性が確認され
た。これらの活性は他のレセプター発現細胞では認めら
れなかったことより、ラット全脳抽出物にTGR23−
2に特異的なリガンド活性物質が存在することが示され
た。得られた3つの活性画分をそれぞれ以下の(a)〜
(c)の方法によりさらに精製した。また、いずれの活
性分画についても、以下に述べる最初の陽イオン交換カ
ラムを用いた精製工程において得られたcAMP産生促
進活性が認められた分画には、同時にFLIPR(モレ
キュラーデバイス社)によってレセプター特異的な細胞
内カルシウム遊離活性が認められた。そこで、それ以降
の精製工程における活性の確認には、FLIPRによる
細胞内カルシウム遊離活性を指標として用い、活性を示
した分画がcAMP産生促進活性を示すことについては
適宜確認した。
【0112】(a)分画番号18 分画番号18については、10%アセトニトリルを含む
10mMギ酸アンモニウム10mlに溶解し、陽イオン
交換カラム(東ソー、TSKgel SP-5PW(20mmφ×1
50mm))に付した後、10%アセトニトリルを含む
10mMから1.0Mのギ酸アンモニウムの濃度勾配に
より溶出した。活性はギ酸アンモニウム0.4M付近に
回収された。活性分画を凍結乾燥後、0.1%トリフル
オロ酢酸を含む10%アセトニトリル0.8mlに溶解
し、ODSカラム(東ソー、TSKgel ODS-80Ts(4.6
φ×250mm))に付した後、0.1%トリフルオロ
酢酸を含む10%から25%のアセトニトリルの濃度勾
配により溶出した結果、アセトニトリル13%付近に活
性が認められた。得られた活性分画を凍結乾燥後、0.
1mlのDMSOで溶解し、さらに0.7mlの0.1
%ヘプタフルオロ酪酸を含む10%アセトニトリルを加
えてODSカラム(和光純薬、Wakosil-II 3C18HG
(2.0mmφ×150mm))に付した後、0.1%
ヘプタフルオロ酪酸を含む10%から37.5%のアセ
トニトリルの濃度勾配により溶出し、ピーク毎に手動で
分取した。活性はアセトニトリル26%付近に認められ
た。活性画分には、さらに0.7mlの0.1%を含む
トリフルオロ酢酸10%アセトニトリルを加え、ODS
カラム(和光純薬、Wakosil-II 3C18HG)に付した後、
0.1%トリフルオロ酢酸を含む10%から20%のア
セトニトリルの濃度勾配によって溶出し、溶出液はピー
ク毎に手動で分取した。活性はアセトニトリル11%付
近に単一ピークとして得られた。この分画に含まれる活
性物質は、以下の参考例5に示すようにして構造決定し
た。
【0113】(b)分画番号20 分画番号20については、10%アセトニトリルを含む
10mMギ酸アンモニウム10mlに溶解し、陽イオン
交換カラム(東ソー、TSKgel SP-5PW(20mmφ×1
50mm))に付した後、10%アセトニトリルを含む
10mMから1.0Mのギ酸アンモニウムの濃度勾配に
より溶出した。活性はギ酸アンモニウム0.6M付近に
回収された。活性分画を凍結乾燥後、0.1%トリフル
オロ酢酸を含む10%アセトニトリル0.8mlに溶解
し、CNカラム(野村化学、Develosil CN-UG-5(4.
6mmφ×250mm))に付した後、0.1%トリフ
ルオロ酢酸を含む10%から25%のアセトニトリルの
濃度勾配によって溶出した結果、アセトニトリル12%
付近に活性が認められた。得られた活性分画を凍結乾燥
後、0.1mlのDMSOで溶解し、さらに0.7ml
の0.1%トリフルオロ酢酸を含む10%アセトニトリ
ルを加えてODSカラム(和光純薬、Wakosil-II 3C18H
G(2.0mmφ×150mm))に付した後、0.1
%トリフルオロ酢酸を含む10%から20%のアセトニ
トリルの濃度勾配により溶出し、溶出液はピーク毎に手
動で分取した。活性はアセトニトリル15%付近に単一
ピークとして得られた。この分画に含まれる活性物質を
以下の参考例83に示すようにして構造決定した。
【0114】(c)分画番号22〜23 分画番号22〜23については、10%アセトニトリル
を含む10mMギ酸アンモニウム10mlに溶解し、陽
イオン交換カラム(東ソー、TSKgel SP-5PW(20mm
φ×150mm))に付した後、10%アセトニトリル
を含む10mMから1.0Mのギ酸アンモニウムの濃度
勾配により溶出した。活性はギ酸アンモニウム0.4M
付近に回収された。活性分画を凍結乾燥後、0.1%ト
リフルオロ酢酸を含む10%アセトニトリル0.8ml
に溶解し、CNカラム(野村化学、Develosil CN-UG-5
(4.6mmφ×250mm))に付した後、0.1%
トリフルオロ酢酸を含む10%から25%のアセトニト
リルの濃度勾配によって溶出した結果、アセトニトリル
13%付近に活性が認められた。得られた活性分画を凍
結乾燥後、0.1mlのDMSOで溶解し、さらに0.
7mlの0.1%トリフルオロ酢酸を含む10%アセト
ニトリルを加えてODSカラム(和光純薬、Wakosil-II
3C18HG(2.0mmφ×150mm))に付した後、
0.1%トリフルオロ酢酸を含む10%から20%のア
セトニトリルの濃度勾配により溶出し、ピーク毎に手動
で分取した。活性はアセトニトリル16%付近に認めら
れた。活性分画には、さらに0.7mlの0.1%ヘプ
タフルオロ酪酸を含む10%アセトニトリルを加え、O
DSカラム(和光純薬、Wakosil-II 3C18HG)に付した
後、0.1%ヘプタフルオロ酪酸を含む10%から3
7.5%のアセトニトリルの濃度勾配によって溶出し、
溶出液はピーク毎に手動で分取した。活性はアセトニト
リル28%付近に単一ピークとして得られた。この分画
に含まれる活性物質は、以下の参考例4に示すようにし
て構造決定した。
【0115】[参考例2] (ラット全脳抽出物中のTGR23−2発現CHO細胞
に対して特異的に細胞内cAMP産生促進活性を示す活
性物質のプロナーゼによる失活)参考例1でTGR23
−2発現CHO細胞に対して細胞内cAMP産生促進活
性を示したHPLC分画18、20および22〜23
を、タンパク質分解酵素であるプロナーゼ(Sigma, pro
tease Type XIV (P5147))で処理し、活性物質がタンパ
ク性であるか否かを調べた。上記ラット全脳抽出物HP
LC活性分画(分画番号18、20および22〜23)
各4μlを0.2M酢酸アンモニウム100μlに加
え、これにプロナーゼ3μgを添加して37℃で2時間
インキュベートした後、沸騰水中で10分間加熱して添
加したプロナーゼを失活させた。これにBSA0.05
mgおよびCHAPS0.05mgを含む蒸留水1ml
を加え凍結乾燥した。凍結乾燥した試料を、公知の方法
に従いTGR23−2発現CHO細胞に添加して細胞内
cAMP産生促進活性を測定した。その結果、いずれの
分画の活性もプロナーゼ処理によって完全に消失した。
従って、ラット全脳抽出物中のTGR23−2発現CH
O細胞に対して細胞内cAMP産生促進活性を示す活性
物質は、いずれもタンパク質またはペプチドであること
が明らかとなった。
【0116】[参考例3] (ラット全脳抽出物の分画番号20から得られたTGR
23−2発現CHO細胞に対して特異的にcAMP産生
促進活性を示す活性物質のアミノ酸配列の決定)参考例
2に示したようにラット全脳抽出物の3つの分画に含ま
れるTGR23−2発現CHO細胞に対して特異的にc
AMP産生促進活性を示す活性物質は、いずれもタンパ
ク性であることが予想されたので、以下のようにそれぞ
れについてアミノ酸配列解析を行なった。参考例1に示
すようにしてラット全脳抽出物の分画番号20から得ら
れたTGR23−2発現CHO細胞に対して特異的にc
AMP産生促進活性を示す活性物質のアミノ酸配列解析
および質量分析を行なった。活性ピークを含む溶出液を
用いてProcise 491cLCプロテインシーケンサー(アプラ
イドバイオシステム)によるアミノ末端アミノ酸配列分
析を行なったところ、N末端から18残基までにSFR
NGVGSGVKKTSFRRA(配列番号:1)のア
ミノ酸配列が得られた。同様の溶出液を用いてナノスプ
レーイオン源(プロタナ)を装着したThermoFinnigan L
CQイオントラップ質量分析計(サーモクエスト)による
質量分析を行なった結果、配列番号:1のアミノ酸配列
から計算される質量値が得られた(実測値:1954.
9、計算値:1954.2)。これより、ラット全脳抽
出物の分画番号20から得られたTGR23−2発現C
HO細胞に対して特異的にcAMP産生促進活性を示す
活性物質は、配列番号:1に示すアミノ酸配列を有する
ものであると決定された。
【0117】[参考例4] (ラット全脳抽出物の分画番号22〜23から得られた
TGR23−2発現CHO細胞に対して特異的にcAM
P産生促進活性を示す活性物質のアミノ酸配列の決定)
参考例1に示すようにしてラット全脳抽出物の分画番号
22〜23から得られたTGR23−2発現CHO細胞
に対して特異的にcAMP産生促進活性を示す活性物質
のアミノ酸配列解析および質量分析を行なった。活性ピ
ークを含む溶出液を用いてProcise 491cLCプロテインシ
ーケンサー(アプライドバイオシステム)によるアミノ
末端アミノ酸配列分析を行なったところ、N末端から1
5残基までにSFRNGVGSGVKKTSF(配列番
号:2)のアミノ酸配列が得られた。同様の溶出液を用
いてナノスプレーイオン源(プロタナ)を装着したTher
moFinnigan LCQイオントラップ質量分析計(サーモクエ
スト)による質量分析を行なった結果、配列番号:2の
アミノ酸配列から計算される質量値が得られた(実測
値:1570.8、計算値:1570.8)。これよ
り、ラット全脳抽出物の分画番号22〜23から得られ
たTGR23−2発現CHO細胞に対して特異的にcA
MP産生促進活性を示す活性物質は、配列番号:2に示
すアミノ酸配列を有するものであると決定された。
【0118】[参考例5] (ラット全脳抽出物の分画番号18から得られたTGR
23−2発現CHO細胞に対して特異的にcAMP産生
促進活性を示す活性物質のアミノ酸配列の決定)参考例
1に示すようにしてラット全脳抽出物の分画番号18か
ら得られたTGR23−2発現CHO細胞に対して特異
的にcAMP産生促進活性を示す活性物質のアミノ酸配
列解析および質量分析を行なった。活性ピークを含む溶
出液を用いてProcise 491cLCプロテインシーケンサー
(アプライドバイオシステム)によるアミノ末端アミノ
酸配列分析を行なったところ、N末端から14残基まで
にSFRNGVGSGVKKTS(配列番号:3)のア
ミノ酸配列が得られた。同様の溶出液を用いてナノスプ
レーイオン源(プロタナ)を装着したThermo Finnigan
LCQイオントラップ質量分析計(サーモクエスト)によ
る質量分析を行なった結果、配列番号:3のアミノ酸配
列から計算される質量値が得られた(実測値:142
4.1、 計算値:1423.6)。これより、ラット全
脳抽出物の分画番号18から得られたTGR23−2発
現CHO細胞に対して特異的にcAMP産生促進活性を
示す活性物質は、配列番号:3に示すアミノ酸配列を有
するものであると決定された。
【0119】[参考例6] (ヒトTGR23−2リガンド前駆体をコードするcD
NAのクローニング)ラット全脳抽出物から得られたT
GR23−2発現CHO細胞に対して特異的にcAMP
産生促進活性を示す活性ペプチド(本明細書中、ラット
TGR23−2リガンドと記載することがある)のヒト
ホモログ(本明細書中、ヒトTGR23−2リガンドと
記載することがある)の前駆体をコードするcDNAを
クローニングするため、ヒト視床下部由来のcDNAを
鋳型としたPCRを行なった。以下の合成DNAプライ
マーを用い、ヒト視床下部由来のcDNAを鋳型として
PCR法による増幅を行なった。反応液の組成は、ヒト
視床下部Marathon-Ready cDNA(CLONTECH)0.8μ
l、配列番号:4および配列番号:5の合成DNAプラ
イマー各1.0μM、0.2mM dNTPs、ExT
aq(宝酒造)0.1μlおよび酵素に付属のExTa
qバッファーで、総反応量は20μlとした。増幅のた
めのサイクルはサーマルサイクラー(PE Biosystems)
を用い、94℃・300秒の加熱の後、94℃・10
秒、55℃・30秒、72℃・30秒のサイクルを35
回繰り返し、最後に72℃で5分間保温した。次に、D
Nase、RNase Freeの蒸留水で50倍希釈
したPCR反応液2μl、配列番号:4および配列番
号:6の合成DNAプライマー各1.0μM、0.2m
MdNTPs、ExTaqポリメラーゼ(宝酒造)0.
1μlおよび酵素に付属のExTaqバッファーで総反
応量を20μlとし、サーマルサイクラー(PE Biosyst
ems)を用い、94℃・300秒の加熱の後、94℃・
10秒、55℃・30秒、72℃・30秒のサイクルを
35回繰り返し、最後に72℃で5分間保温した。増幅
したDNAを2.0%のアガロースゲル電気泳動により
分離した後、バンドの部分をカミソリで切り出し、DN
AをQIAquick Gel Extraction Kit(キアゲン)を用い
て回収した。このDNAを、pGEM-T Easy Vector Syste
m(プロメガ)のプロトコールに従ってpGEM-T Easyベク
ターへクローニングした。これを大腸菌(Escherichia
coli)JM109 competent cell(宝酒造)に導入して形質
転換した後、cDNA挿入断片を持つクローンをアンピ
シリンおよびX−galを含むLB寒天培地で選択し、
白色を呈するクローンのみを滅菌したつま楊枝を用いて
分離し、形質転換体を得た。個々のクローンをアンピシ
リンを含むLB培地で一晩培養し、QIAwell 8 Plasmid
Kit(キアゲン)を用いてプラスミドDNAを調製し
た。塩基配列の決定のための反応はBigDye Terminator
Cycle Sequencing Ready Reaction Kit(PE Biosystem
s)を用いて行ない、蛍光式自動シーケンサーを用いて
解読し、配列番号:7に示すDNA配列を得た。配列番
号:7で表されるDNAの塩基配列には、配列番号:
1、配列番号:2および配列番号:3で表されるラット
全脳から得られたラットTGR23−2リガンドのアミ
ノ酸配列に極めて類似したアミノ酸配列をコードするよ
うなフレームが存在したことからヒトTGR23−2リ
ガンドの前駆体あるいはその一部をコードするcDNA
であると推定された。ヒトTGR23−2リガンドと考
えられるアミノ酸配列をコードするようなフレームで配
列番号:7から翻訳されるアミノ酸配列の5’上流側に
はタンパク質翻訳の開始コドンであると予想されるAT
Gが2ヶ所存在するが、疎水性プロットを行なったとこ
ろ、より5’上流側のATGから翻訳した場合にのみシ
グナル配列と推定される疎水性の高い領域が出現したの
でこのATGが開始コドンであると推定した。3’側に
はヒトTGR23−2リガンドをコードすると考えられ
る配列の下流に終止コドンが存在した。以上により推定
されたヒトTGR23−2リガンド前駆体のアミノ酸配
列を配列番号:8に示す。この配列において、ヒトTG
R23−2リガンドに相当すると考えられるアミノ酸配
列のN末側には、通常生理活性ペプチドがその前駆体タ
ンパク質から切り出されるとされるLys−Argの配
列(Seidah, N. G. et al.、Ann. N. Y. Acad. Sci.、8
39巻、9-24頁、1998年)が存在した。一方、C末側には
終止コドンが存在したが、配列番号:1で表されるアミ
ノ酸配列を有するラットTGR23−2リガンドに対応
する配列との間にさらに2残基が存在した。これより、
ヒトTGR23−2リガンドのアミノ酸配列は、ラット
全脳抽出物より得られたラットTGR23−2リガンド
のアミノ酸配列;配列番号:1〔ラットTGR23−2
リガンド(1−18)〕、配列番号:2〔ラットTGR
23−2リガンド(1−15)〕および配列番号:3
〔ラットTGR23−2リガンド(1−14)〕にそれ
ぞれ対応する、配列番号:9〔ヒトTGR23−2リガ
ンド(1−18)〕、配列番号:10〔ヒトTGR23
−2リガンド(1−15)〕および配列番号:11〔ヒ
トTGR23−2リガンド(1−14)〕で表されるア
ミノ酸配列、およびさらに配列番号:9のC末側に2残
基延長された配列番号:12で表されるアミノ酸配列
〔ヒトTGR23−2リガンド(1−20)〕であると
推定された。さらに、ヒトTGR23−2リガンドの配
列は、マウスTGR23−2リガンドおよびラットTG
R23−2リガンドの配列と異なり、その配列中にAr
g−Arg配列ではなくGln−Arg配列を有するこ
とから、配列番号:26に示された16残基のアミノ酸
配列〔ヒトTGR23−2リガンド(1−16)〕もま
たリガンドの配列であると推定された。
【0120】[参考例7] (マウスTGR23−2リガンド前駆体をコードするc
DNAのクローニング)ラット全脳抽出物から得られた
ラットTGR23−2リガンドのマウスホモログ(本明
細書中、マウスTGR23−2リガンドと記載すること
がある)の前駆体をコードするcDNAをクローニング
するため、マウス全脳由来のcDNAを鋳型としたPC
Rを行なった。以下の合成DNAプライマーを用い、マ
ウス全脳由来のcDNAを鋳型としてPCR法による増
幅を行なった。反応液の組成は、マウス全脳Marathon-R
eady cDNA(CLONTECH)0.8μl、配列番号:13お
よび配列番号:14の合成DNAプライマー各1.0μ
M、0.2mM dNTPs、ExTaq(宝酒造)
0.1μlおよび酵素に付属のExTaqバッファー
で、総反応量は20μlとした。増幅のためのサイクル
はサーマルサイクラー(PE Biosystems)を用い、94
℃・5分間の加熱の後、94℃・10秒、65℃・30
秒、72℃・30秒のサイクルを35回繰り返し、最後
に72℃で5分間保温した。次に、DNase、RNa
se Freeの蒸留水で100倍希釈したPCR反応
液2μl、配列番号:13および配列番号:15の合成
DNAプライマー各1.0μM、0.2mM dNTP
s、ExTaqポリメラーゼ(宝酒造)0.1μlおよ
び酵素に付属のExTaqバッファーで総反応量は20
μlとし、サーマルサイクラー(PE Biosystems)を用
い、94℃・5分間の加熱の後、94℃・10秒、60
℃・30秒、72℃・30秒のサイクルを30回繰り返
し、最後に72℃で5分間保温した。増幅したDNAを
2.0%のアガロースゲル電気泳動により分離した後、
約440塩基長のDNAをカミソリで切り出し、DNA
をQIAquick Gel Extraction Kit(キアゲン)を用いて
回収した。このDNAを、pGEM-T Easy Vector System
(プロメガ)のプロトコールに従ってpGEM-T Easyベク
ターへクローニングした。これを大腸菌(Escherichia
coli)JM109 competent cell(宝酒造)に導入して形質
転換した後、cDNA挿入断片を持つクローンをアンピ
シリンおよびX−galを含むLB寒天培地で選択し、
白色を呈するクローンのみを滅菌したつま楊枝を用いて
分離し、形質転換体を得た。個々のクローンをアンピシ
リンを含むLB培地で一晩培養し、QIAwell 8 Plasmid Ki
t(キアゲン)を用いてプラスミドDNAを調製した。
塩基配列の決定のための反応はBigDye TerminatorCycle
Sequencing Ready Reaction Kit(PE Biosystems)を
用いて行ない、蛍光式自動シーケンサーを用いて解読
し、配列番号:16で表されるDNA配列を得た。配列
番号:16で表されるDNAの塩基配列には、配列番
号:1、配列番号:2および配列番号:3で表されるラ
ット全脳から得られたラットTGR23−2リガンドの
アミノ酸配列に極めて類似したアミノ酸配列をコードす
るようなフレームが存在したことからマウスTGR23
−2リガンドの前駆体あるいはその一部をコードするc
DNAであると推定された。マウスTGR23−2リガ
ンドと考えられるアミノ酸配列をコードするようなフレ
ームで配列番号:16から翻訳されるアミノ酸配列の
5’上流側にはタンパク質翻訳の開始コドンであると予
想されるATGが2ヶ所存在するが、疎水性プロットを
行なったところ、より5’上流側のATGから翻訳した
場合にのみシグナル配列と推定される疎水性の高い領域
が出現したのでこのATGが開始コドンであると推定し
た。このATGコドンのさらに5’上流側には同じフレ
ームで終止コドンが出現した。3’側にはマウスTGR
23−2リガンドをコードすると考えられる配列の下流
に終止コドンが存在した。以上により推定されたマウス
TGR23−2リガンド前駆体のアミノ酸配列を配列番
号:17に示す。この配列において、マウスTGR23
−2リガンドに相当すると考えられるアミノ酸配列のN
末側には、通常生理活性ペプチドがその前駆体タンパク
質から切り出されるとされるLys−Argの配列(Se
idah, N. G. et al.、Ann. N. Y. Acad. Sci.、839巻、
9-24頁、1998年)が存在した。一方、C末側には終止コ
ドンが存在したが、配列番号:1のラットTGR23−
2リガンドに対応する配列との間にさらに2残基が存在
した。これより、マウスTGR23−2リガンドのアミ
ノ酸配列は、ラット全脳抽出物より得られたラットTG
R23−2リガンドのアミノ酸配列;配列番号:1〔ラ
ットTGR23−2リガンド(1−18)〕、配列番
号:2〔ラットTGR23−2リガンド(1−15)〕
および配列番号:3〔ラットTGR23−2リガンド
(1−14)〕それぞれに対応する、配列番号:18
〔マウスTGR23−2リガンド(1−18)〕、配列
番号:19〔マウスTGR23−2リガンド(1−1
5)〕および配列番号:20〔マウスTGR23−2リ
ガンド(1−14)〕で表されるアミノ酸配列、および
さらに配列番号:18のC末側に2残基延長された配列
番号:21で表されるアミノ酸配列〔マウスTGR23
−2リガンド(1−20)〕であると推定された。
【0121】[参考例8] (ラットTGR23−2リガンド前駆体の一部をコード
するcDNAのクローニング) ラットTGR23−2リガンドの前駆体をコードするc
DNAをクローニングするためラット全脳由来のcDN
Aを鋳型としたPCRを行なった。以下の合成DNAプ
ライマーを用い、ラット全脳由来のcDNAを鋳型とし
てPCR法による増幅を行なった。反応液の組成は、ラ
ット全脳Marathon-Ready cDNA(CLONTECH)0.8μ
l、配列番号:22および配列番号:14の合成DNA
プライマー各1.0μM、0.2mM dNTPs、E
xTaq(宝酒造)0.1μlおよび酵素に付属のEx
Taqバッファーで、総反応量は20μlとした。増幅
のためのサイクルはサーマルサイクラー(PE Biosystem
s)を用い、94℃・5分間の加熱の後、94℃・10
秒、65℃・30秒、72℃・30秒のサイクルを35
回繰り返し、最後に72℃で5分間保温した。次に、D
Nase、RNase Freeの蒸留水で100倍希
釈したPCR反応液2μl、配列番号:22のプライマ
ー1.0μM、配列番号:15の合成DNAプライマー
0.2μM、0.2mM dNTPs、ExTaqポリ
メラーゼ(宝酒造)0.1μlおよび酵素に付属のEx
Taqバッファーで総反応量は20μlとし、サーマル
サイクラー(PE Biosystems)を用い、94℃・5分間
の加熱の後、94℃・10秒、60℃・30秒、72℃
・30秒のサイクルを30回繰り返し、最後に72℃で
5分間保温した。増幅したDNAを2.0%のアガロー
スゲル電気泳動により分離した後、約200塩基長のD
NAをカミソリで切り出し、DNAをQIAquick Gel Ext
raction Kit(キアゲン)を用いて回収した。このDN
Aを、pGEM-T Easy Vector System(プロメガ)のプロ
トコールに従ってpGEM-T Easyベクターへクローニング
した。これを大腸菌(Escherichia coli)JM109 compet
ent cell(宝酒造)に導入して形質転換した後、cDN
A挿入断片を持つクローンをアンピシリンおよびX−g
alを含むLB寒天培地で選択し、白色を呈するクロー
ンのみを滅菌したつま楊枝を用いて分離し、形質転換体
を得た。個々のクローンをアンピシリンを含むLB培地
で一晩培養し、QIAwell 8 Plasmid Kit(キアゲン)を
用いてプラスミドDNAを調製した。塩基配列の決定の
ための反応はBigDye Terminator Cycle Sequencing Rea
dy Reaction Kit(PE Biosystems)を用いて行ない、蛍
光式自動シーケンサーを用いて解読し、配列番号:23
で表されるDNA配列を得た。配列番号:23で表され
るDNAの塩基配列には、配列番号:1、配列番号:2
および配列番号:3で表されるラット全脳から得られた
ラットTGR23−2リガンドのアミノ酸配列をコード
するフレームが存在した。このフレームを読み取り枠と
してDNA配列を翻訳したところ、配列番号:24で表
されるアミノ酸配列が得られた。この配列を参考例7で
得られたマウスTGR23−2リガンド前駆体のアミノ
酸配列(配列番号:16)と比較することにより、本配
列がラットTGR23−2リガンド前駆体の一部である
C末側の54アミノ酸からなる配列に相当することが推
定された。3’側にはラットTGR23−2リガンドを
コードする配列の下流に終止コドンが存在した。この配
列において、ラットTGR23−2リガンドのアミノ酸
配列のN末側には、通常生理活性ペプチドがその前駆体
タンパク質から切り出されるとされるLys−Argの
配列(Seidah, N. G. et al.、Ann. N. Y. Acad. Sc
i.、839巻、9-24頁、1998年)が存在した。一方、C末
側には終止コドンが存在したが、配列番号:1のラット
TGR23−2リガンドの配列との間にさらに2残基が
存在した。これより、ラットTGR23−2リガンドの
アミノ酸配列は、ラット全脳抽出物より得られた配列番
号:1〔ラットTGR23−2リガンド(1−1
8)〕、配列番号:2〔ラットTGR23−2リガンド
(1−15)〕および配列番号:3〔ラットTGR23
−2リガンド(1−14)〕で表されるアミノ酸配列、
およびさらに配列番号:1のC末側に2残基延長された
配列番号:25で表されるアミノ酸配列〔ラットTGR
23−2リガンド(1−20)〕であると推定された。
【0122】[参考例9](ラットTGR23−2リガ
ンド前駆体をコードするcDNAのクローニング)ラッ
トTGR23−2リガンドの前駆体をコードするcDN
Aをクローニングするためラット全脳由来のcDNAを
鋳型としたPCRを行なった。以下の合成DNAプライ
マーを用い、ラット全脳由来のcDNAを鋳型としてP
CR法による増幅を行なった。反応液の組成は、ラット
全脳Marathon-Ready cDNA(CLONTECH)0.8μl、配
列番号:27および配列番号:28の合成DNAプライ
マー各1.0μM、0.2mM dNTPs、ExTa
q(宝酒造)0.1μlおよび酵素に付属のExTaq
バッファーで、総反応量は20μlとした。増幅のため
のサイクルはサーマルサイクラー(PE Biosystems)を
用い、94℃・5分間の加熱の後、94℃・10秒、6
5℃・30秒、72℃・30秒のサイクルを35回繰り
返し、最後に72℃で5分間保温した。次に、DNas
e、Rnase Freeの蒸留水で50倍希釈したP
CR反応液2μl、配列番号:29のプライマー1.0
μM、配列番号:28の合成DNAプライマー0.2μ
M、0.2mM dNTPs、ExTaqポリメラーゼ
(宝酒造)0.1μlおよび酵素に付属のExTaqバ
ッファーで総反応量は20μlとし、サーマルサイクラ
ー(PE Biosystems)を用い、94℃・5分間の加熱の
後、94℃・10秒、65℃・30秒、72℃・30秒
のサイクルを30回繰り返し、最後に72℃で5分間保
温した。増幅したDNAを2.0%のアガロースゲル電
気泳動により分離した後、約350塩基長のDNAをカ
ミソリで切り出し、DNAをQIAquick Gel Extraction
Kit(キアゲン)を用いて回収した。このDNAを、pGE
M-T Easy Vector System(プロメガ)のプロトコールに
従ってpGEM-T Easyベクターへクローニングした。これ
を大腸菌(Escherichia coli)JM109 competentcell
(宝酒造)に導入して形質転換した後、cDNA挿入断
片を持つクローンをアンピシリンおよびX−galを含
むLB寒天培地で選択し、白色を呈するクローンのみを
滅菌したつま楊枝を用いて分離し、形質転換体を得た。
個々のクローンをアンピシリンを含むLB培地で一晩培
養し、QIAwell 8 Plasmid Kit(キアゲン)を用いてプ
ラスミドDNAを調製した。塩基配列の決定のための反
応はBigDye Terminator Cycle Sequencing Ready React
ion Kit(PE Biosystems)を用いて行ない、蛍光式自動
シーケンサーを用いて解読し、配列番号:30で表され
るDNA配列を得た。配列番号:30で表されるcDN
Aの塩基配列は、参考例8で得たラットTGR23−2
リガンド前駆体の一部をコードするDNA配列(配列番
号:23)がさらに5’側に延長された配列であった。
本配列を、配列番号:1、配列番号:2または配列番
号:3で表されるラット全脳から得られたラットTGR
23−2リガンドのアミノ酸配列に一致するアミノ酸配
列をコードするようなフレームを読み取り枠として翻訳
したところ、5’上流側には、ヒトTGR23−2リガ
ンド前駆体およびマウスTGR23−2リガンド前駆体
をコードすると推定されるcDNA(配列番号:7およ
び配列番号:16)に存在するタンパク質翻訳の開始コ
ドンであると予想されるATGに対応する位置に、AT
Gが1ヶ所存在した。また、このATGコドンのさらに
5’上流側には同じフレームで終止コドンが出現した。
3’側にはマウスTGR23−2リガンドをコードする
と考えられる配列の下流に終止コドンが存在した。これ
より、配列番号:30で表される配列は、ラットTGR
23−2リガンド前駆体をコードするcDNA配列であ
ると推定された。配列番号:30で表されるcDNAの
塩基配列から翻訳されるアミノ酸配列を配列番号:31
に示す。
【0123】[参考例10] (TGR23−1(以下、ヒトTGR23−1を、単に
TGR23−1と称することもある)発現CHO細胞の
作成)TGR23−1をコードする、配列番号:38で
表される塩基配列を有するDNA断片を含有するプラス
ミドpTB2173を鋳型とし、SalI認識配列を付
加したプライマー1(配列番号:32)およびSpeI
認識配列を付加したプライマー2(配列番号:33)を
用いてPCR反応を行った。該反応における反応液の組
成は上記プラスミド10ngを鋳型として使用し、Pfu
Turbo DNA Polymerase(ストラタジーン社)2.5U、
プライマー1(配列番号:32)およびプライマー2
(配列番号:33)を各1.0μM、dNTPsを20
0μM、および反応液にに2 X GC Buffer I(宝酒造)
を25μl加え、50μlの液量とした。PCR反応
は、95℃・60秒の後、95℃・60秒、55℃・6
0秒、72℃・70秒のサイクルを25回繰り返し、最
後に72℃・10分の伸長反応を行った。該PCR反応
産物をZero Blunt TOPO PCRクローニングキット(イン
ビトロジェン社)の処方に従いプラスミドベクターpCR-
BluntII-TOPO(インビトロジェン社)へサブクローニン
グした。これをE. coli TOP10(インビトロジェン社)
に導入し、pTB2173に含まれるTGR23−1の
cDNAを持つクローンを、カナマイシンを含むLB寒
天培地中で選択した。ここで得られた、5’側および
3’側にSalIおよびSpeIがそれぞれ認識する配
列を付加したTGR23−1が導入されたプラスミドに
よって形質転換されたE. coliのクローンよりPlasmid M
iniprep Kit(バイオラッド社)を用いてプラスミドを
調製し、制限酵素SalIおよびSpeIで切断してイ
ンサート部分を切り出した。インサートDNAは電気泳
動後、アガロースゲルより切り出し、次にGel Extracti
on Kit(キアゲン社)を用いて回収した。このインサー
トDNAをSalIおよびSpeIで切断した動物細胞
発現用ベクタープラスミドpAKKO−111H(Hinu
ma, S. et al. Biochim. Biophys. Acta, Vol. 1219, p
p. 251-259(1994)記載のpAKKO1.11Hと同一
のベクタープラスミド)に加え、DNA Ligation Kit Ve
r.2(宝酒造)を用いてライゲーションを行ない、タン
パク質発現用プラスミドpAKKO-TGR23-1を構築した。こ
のpAKKO−TGR23−1で形質転換したE. coli
TOP10を培養後、Plasmid Miniprep Kit(バイオラッド
社)を用いてpAKKO-TGR23-1のプラスミドDNAを調製
した。ハムスターCHO/dhfr-細胞を10%ウシ
胎児血清を含むα−MEM培地(with ribonucleosides
and deoxyribonucleosides、GIBCO、Cat. No. 12571)
でファルコンディッシュ(径3.5cm)に1×105
個播種し、5% CO2インキュベーターで37℃一晩培
養した。上記発現プラスミドpAKKO-TGR23-1 DNA 2μg
をTransfection Reagent FuGENE 6(Roche社)を用い、
添付説明書記載の方法に従ってトランスフェクトし、1
8時間培養後、新鮮な増殖培地に交換した。さらに10
時間培養を続けたのち、トランスフェクトした細胞をト
リプシン−EDTA処理により集め、選択培地(10%
透析牛胎児血清を含むα−MEM培地(without ribonu
cleosides and deoxyribonucleosides、GIBCO、Cat. N
o.12561))を用いて平底96穴プレート10枚に播種
した。3−4日ごとに選択培地を交換しながら培養を続
け、2−3週間後にコロニー状に増殖してきたDHFR
+ 細胞クローンを81個取得した。
【0124】[参考例11] (TaqMan PCR法を用いたTGR23−1発現
CHO細胞株のTGR23−1発現量の定量)参考例1
0で得たTGR23−1発現CHO細胞株81クローン
を、96穴プレートに培養し、RNeasy 96 Kit(キアゲ
ン社)を用いて全RNAを調製した。得られた全RNA
50〜200ngをTaqMan Gold RT-PCR Kit(PEバ
イオシステムズ社)を用いて、逆転写反応を行なった。
得られた全RNA 5〜20ng相当の逆転写産物、ま
たは後述のようにして作製した標準cDNA、1xUniver
sal PCR Master Mix(PEバイオシステムズ社)、配列
番号:34で表されるプライマーおよび配列番号:35
で表されるプライマー各500nM、および配列番号:
36で表されるTaqManプローブ100nMを含む
反応混合液25μlについてABI PRISM 7700 Sequence
Detector(PEバイオシステムズ社)を用いてPCRを
行なった。PCRは、50℃・2分、95℃・10分で
処理後、95℃・15秒、60℃・60秒のサイクルを
40回繰り返すことにより行なった。標準cDNAは、
配列番号:40で表される塩基配列を有するDNA断片
を含有するプラスミドpTB2174の260nmの吸
光度を測定して濃度を算出し、正確なコピー数を算出し
た後、1mM EDTAを含む10mM Tris−HC
l(pH8.0)溶液で希釈し、2コピーから2×10
6コピーの標準cDNA溶液を調製した。また、Taq
Man PCR用プローブおよびプライマーはPrimer Ex
press(Version1.0)(PEバイオシステムズ社)によ
り設計した。発現量はABI PRISM 7700 SDSソフトウェア
によって算出した。リポーターの蛍光強度が設定された
値に達した瞬間のサイクル数を縦軸にとり、標準cDN
Aの初期濃度の対数値を横軸にとり、標準曲線を作成し
た。標準曲線より各逆転写産物の初期濃度を算出し、各
クローンの全RNA当たりのTGR23−1遺伝子発現
量を求めた。その結果、TGR23−1の発現が高かっ
たCHO細胞株11個を選択し24穴プレートに培養し
た。これらの細胞について、TGR23−1の発現量を
再検した。RNeasy Mini Kits(キアゲン社)を用いて全
RNAを調製した後、RNase-free DNase Set(キアゲン
社)を用いてDNase処理をした。得られた全RNA
から、上記と同様に逆転写反応し、TaqMan PC
R法で各クローンの全RNA当たりのTGR23−1遺
伝子発現量を求めた。その結果、TGR23−1発現C
HO細胞株クローン49および52が高い発現量を示す
ことがわかった。以後の参考例では、これら2つのクロ
ーンの発現細胞を用いた。
【0125】[参考例12] (ヒトTGR23−2リガンド(1−20):Ser-Phe-
Arg-Asn-Gly-Val-Gly-Thr-Gly-Met-Lys-Lys-Thr-Ser-Ph
e-Gln-Arg-Ala-Lys-Ser(配列番号:12)の製造)市
販のBoc-Ser(Bzl)-OCH2-PAM樹脂を、ペプチド合成機A
CT90の反応槽に入れ、DCMで膨潤後TFAでBo
cを除去し、DIEAで中和した。この樹脂をNMPに
懸濁し、HOBt-DIPCIでBoc-Lys(Cl-Z)を縮合した。反応
後ニンヒドリンテストで遊離のアミノ基の有無を調べ、
ニンヒドリンテストがプラスの時には同じアミノ酸を再
度縮合した。再縮合後においてもニンヒドリンテストが
プラスの時には無水酢酸でアセチル化した。このサイク
ルを繰り返しBoc-Ala、Boc-Arg(Tos)、Boc-Gln、Boc-Ph
e、Boc-Ser(Bzl)、Boc-Thr(Bzl)、Boc-Lys(Cl-Z)、Boc-
Lys(CL-Z)、Boc-Met、Boc-Gly、Boc-Thr(Bzl)、Boc-G
ly、Boc-Val、Boc-Gly、Boc-Asn、Boc-Arg(Tos)、Boc-P
he、Boc-Ser(Bzl)を配列順に縮合し、所望の保護ペプチ
ド樹脂0.24gを得た。この樹脂をp−クレゾール
1.5mlとともにフッ化水素約15ml中、0℃で6
0分攪拌した後フッ化水素を減圧留去し、残留物にジエ
チルエーテルを加えて濾過した。濾過物に水と酢酸を加
えペプチドを抽出し、樹脂と分離した。抽出液を濃縮し
50%酢酸で充填したセファデックス(商標)G−25
カラム(2.0×80cm)に付し、同溶媒で展開、主
要画分を集め凍結乾燥した。その一部(45mg)をLi
Chroprep(商標)RP-18を充填した逆相クロマトカラム
(2.6×60cm)に付け、0.1% TFA水 20
0mlで洗浄、0.1% TFA水 300mlと0.1
% TFA含有25%アセトニトリル水300mlを用
いた線型勾配溶出を行い、主要画分を集め凍結乾燥し目
的とするペプチド12.7mgを得た。 ESI−MS:分子量MW 2188.0(理論値21
87.5)HPLC溶出時間 10.6分 カラム条件:カラム:Wakosil 5C18T 4.6×100
mm 溶離液:A液−0.1% TFA水、B液−0.1% T
FA含有アセトニトリル を用い A/B:95/5〜45/55へ直線型濃度勾
配溶出(25分) 流速:1.0ml/分
【0126】[参考例13] (FLIPRを用いたヒトTGR23−2リガンド(1
−20)によるTGR23−1発現CHO細胞およびT
GR23−2発現CHO細胞の細胞内Caイオン濃度上
昇活性の測定)参考例12で得られたヒトTGR23−
2リガンド(1−20)を種々の濃度で、公知の方法に
従って、TGR23−1発現CHO細胞およびTGR2
3−2発現CHO細胞に投与し、細胞内Caイオン濃度
上昇活性をFLIPRを用いて測定したところ、ヒトT
GR23−2リガンド(1−20)は、濃度依存的にT
GR23−1発現CHO細胞およびTGR23−2発現
CHO細胞の細胞内Caイオン濃度上昇を促進した。結
果を図5および図6に示す。これより、配列番号:12
で表されるアミノ配列を有するポリペプチド〔ヒトTG
R23−2リガンド(1−20)〕が、TGR23−1
およびTGR23−2対する細胞内Caイオン濃度上昇
活性を有することが明らかである。
【0127】
【発明の効果】本発明によれば、結合分子が未知である
タンパク質のアミノ酸配列(及び/又はアミノ酸配列を
用いて得られるシークエンスアラインメント)に関する
情報を得るだけで結合分子又は結合分子の種類を予測す
ることが可能となる。これにより、従来の3次元構造ま
で予測する分子モデリング法に比べ格段に迅速に結合分
子(リガンド等)を予測することができる。
【0128】更に、本発明によれば様々な種類の結合分
子が未知であるタンパク質に対してその結合分子又は結
合分子の種類を予測することができる。また、結合分子
が未知であるタンパク質に実際にあらゆる結合分子が結
合するかどうか実験するよりも容易かつ迅速に結合分子
又は結合分子の種類を予測することができる。
【0129】公知の技術を用いることで、相同性を有し
たタンパク質グループに共通の機能は、シークエンスア
ラインメントを計算することや立体構造モデルを作成す
ることで推定できる。一方、シークエンスアラインメン
トによる類似性評価や分子ドッキング計算から、リガン
ド(およびその種類)の特定は、現在の技術では不可能で
ある。しかし、医薬品開発に有用な個々のGPCRが有して
いる個別の機能を推定するためには、結合するリガンド
・共役Gタンパク質の予測が必要である。このような、
GPCR・リガンドのセットが推定・決定されて初めて、共
役Gタンパク質を通じた細胞内応答の調査、生体内分布
や発現量変化の測定、遺伝子導入・欠損動物の作成など
の詳細な機能研究が進展することになる。リガンド決定
残基を用いた予測方法およびそのためのコンピュータ
は、このような医薬品開発に必須な分子同定・機能解明
に直接役に立つものである。
【0130】本発明によれば、きわめて容易に結合分子
未知タンパク質(オーファンGタンパク質共役レセプタ
ー等)の結合分子又は結合分子の種類を予測することが
でき、かかる知見に基づけば、実験を経なくとも当該結
合分子未知タンパク質が関与する疾患等の予防薬や治療
薬を容易に製造することが可能となる。
【0131】
【配列表】 SEQUENCE LISTING <110> Takeda Chemical Industries, Ltd. <120> Prediction method of ligand <130> P02-0089 <160> 40 <210> 1 <211> 18 <212> PRT <213> Rat <400> 1 Ser Phe Arg Asn Gly Val Gly Ser Gly Val Lys Lys Thr Ser Phe Arg 5 10 15 Arg Ala <210> 2 <211> 15 <212> PRT <213> Rat <400> 2 Ser Phe Arg Asn Gly Val Gly Ser Gly Val Lys Lys Thr Ser Phe 5 10 15 <210> 3 <211> 14 <212> PRT <213> Rat <400> 3 Ser Phe Arg Asn Gly Val Gly Ser Gly Val Lys Lys Thr Ser 5 10 14 <210> 4 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 4 cagattttgg gaagtccaaa atga 24 <210> 5 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 5 gagtacgtca gtcacactct acag 24 <210> 6 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 6 agattaattc cccgagtcct ttgc 24 <210> 7 <211> 322 <212> DNA <213> Human <400> 7 cagattttgg gaagtccaaa atgattagct cagtaaaact caatctcatc ctagttctgt 60 cgctgtccac aatgcatgtg ttttggtgtt atccagttcc atcttctaag gtgtctggaa 120 aatctgatta ctttctcatt ctgctgaaca gctgcccaac cagattggac aggagcaaag 180 aactagcttt tctaaagcca attttggaga agatgtttgt gaaaaggtcc tttcgcaatg 240 gagttggcac agggatgaaa aaaacttcct ttcaaagagc aaaatcatga ctaagtgtgc 300 aaaggactcg gggaattaat ct 322 <210> 8 <211> 89 <212> PRT <213> Human <400> 8 Met Ile Ser Ser Val Lys Leu Asn Leu Ile Leu Val Leu Ser Leu Ser 5 10 15 Thr Met His Val Phe Trp Cys Tyr Pro Val Pro Ser Ser Lys Val Ser 20 25 30 Gly Lys Ser Asp Tyr Phe Leu Ile Leu Leu Asn Ser Cys Pro Thr Arg 35 40 45 Leu Asp Arg Ser Lys Glu Leu Ala Phe Leu Lys Pro Ile Leu Glu Lys 50 55 60 Met Phe Val Lys Arg Ser Phe Arg Asn Gly Val Gly Thr Gly Met Lys 65 70 75 80 Lys Thr Ser Phe Gln Arg Ala Lys Ser 85 <210> 9 <211> 18 <212> PRT <213> Human <400> 9 Ser Phe Arg Asn Gly Val Gly Thr Gly Met Lys Lys Thr Ser Phe Gln 5 10 15 Arg Ala <210> 10 <211> 15 <212> PRT <213> Human <400> 10 Ser Phe Arg Asn Gly Val Gly Thr Gly Met Lys Lys Thr Ser Phe 5 10 15 <210> 11 <211> 14 <212> PRT <213> Human <400> 11 Ser Phe Arg Asn Gly Val Gly Thr Gly Met Lys Lys Thr Ser 5 10 <210> 12 <211> 20 <212> PRT <213> Human <400> 12 Ser Phe Arg Asn Gly Val Gly Thr Gly Met Lys Lys Thr Ser Phe Gln 5 10 15 Arg Ala Lys Ser 20 <210> 13 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 13 ccagtcacac aggagggatc tcaa 24 <210> 14 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 14 gcacatcagt cacactctac atag 24 <210> 15 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 15 agattaattc ccagagtcct ttgc 24 <210> 16 <211> 443 <212> DNA <213> Mouse <400> 16 ccagtcacac aggagggatc tcaatgacat ttttacttct gaacttttct aatataaaag 60 ggccacccaa gcaggctcag acagcaaacg tgaggaaatt ggcaataaaa acccatctgc 120 gcaggtctcg gaaaatccaa aatgattggc tcgttaaaac tcagcttcgt cttagctctg 180 tcgctgtctg taatgcacgt gctttggtgt tatccggtcc tctcttccaa ggtgcctggg 240 aagcctgatt actttctcat cttgctgagc agctgcccag ccaggctgga ggggagcgac 300 aggctagctt ttctaaagcc aattttggag aagacatcga tgaaaaggtc ctttcgcaac 360 ggagtcggct caggggcgaa aaaaacttcg tttcgaagag caaagcaatg aataagtgtg 420 caaaggactc tgggaattaa tct 443 <210> 17 <211> 89 <212> PRT <213> Mouse <400> 17 Met Ile Gly Ser Leu Lys Leu Ser Phe Val Leu Ala Leu Ser Leu Ser 5 10 15 Val Met His Val Leu Trp Cys Tyr Pro Val Leu Ser Ser Lys Val Pro 20 25 30 Gly Lys Pro Asp Tyr Phe Leu Ile Leu Leu Ser Ser Cys Pro Ala Arg 35 40 45 Leu Glu Gly Ser Asp Arg Leu Ala Phe Leu Lys Pro Ile Leu Glu Lys 50 55 60 Thr Ser Met Lys Arg Ser Phe Arg Asn Gly Val Gly Ser Gly Ala Lys 65 70 75 80 Lys Thr Ser Phe Arg Arg Ala Lys Gln 85 <210> 18 <211> 18 <212> PRT <213> Mouse <400> 18 Ser Phe Arg Asn Gly Val Gly Ser Gly Ala Lys Lys Thr Ser Phe Arg 5 10 15 Arg Ala <210> 19 <211> 15 <212> PRT <213> Mouse <400> 19 Ser Phe Arg Asn Gly Val Gly Ser Gly Ala Lys Lys Thr Ser Phe 5 10 15 <210> 20 <211> 14 <212> PRT <213> Mouse <400> 20 Ser Phe Arg Asn Gly Val Gly Ser Gly Ala Lys Lys Thr Ser 5 10 <210> 21 <211> 20 <212> PRT <213> Mouse <400> 21 Ser Phe Arg Asn Gly Val Gly Ser Gly Ala Lys Lys Thr Ser Phe Arg 5 10 15 Arg Ala Lys Gln 20 <210> 22 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 22 ctgattactt tctcatyytg ctga 24 <210> 23 <211> 199 <212> DNA <213> Rat <400> 23 ctgattactt tctcattttg ctgagtacct gcccagccag gctggagggg agcgacgggc 60 tagcttttct aaagccaatt ttggagaaga cgtcgatgaa aaggtccttt cgcaacggag 120 tcggctcagg ggtgaaaaaa acttcatttc gaagagcaaa gcaatgaata agtgtgcaaa 180 ggactctggg aattaatct 199 <210> 24 <211> 54 <212> PRT <213> Rat <400> 24 Asp Tyr Phe Leu Ile Leu Leu Ser Thr Cys Pro Ala Arg Leu Glu Gly 5 10 15 Ser Asp Gly Leu Ala Phe Leu Lys Pro Ile Leu Glu Lys Thr Ser Met 20 25 30 Lys Arg Ser Phe Arg Asn Gly Val Gly Ser Gly Val Lys Lys Thr Ser 35 40 45 Phe Arg Arg Ala Lys Gln 50 <210> 25 <211> 20 <212> PRT <213> Mouse <400> 25 Ser Phe Arg Asn Gly Val Gly Ser Gly Val Lys Lys Thr Ser Phe Arg 5 10 15 Arg Ala Lys Gln 20 <210> 26 <211> 16 <212> PRT <213> Human <400> 26 Ser Phe Arg Asn Gly Val Gly Thr Gly Met Lys Lys Thr Ser Phe Gln 5 10 15 <210> 27 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 27 cttaacaaga acaaaaggcc acag 24 <210> 28 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 28 ttattcattg ctttgctctt cgaaat 26 <210> 29 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 29 ccacccaagc aggctcagac agcgag 26 <210> 30 <211> 353 <212> DNA <213> Rat <400> 30 ccacccaagc aggctcagac agcgagcgtg aggaatttgg caataaaaac ccatctgcac 60 agatctcgga aaatccaaaa tgattggctc attaaaactc aacctcatct tagctctgtc 120 gctgtccgtg gtacacgtga tttggagtta tccggtcctc tcttccaagg tgcctgggaa 180 gcctgattac tttctcattt tgctgagtac ctgcccagcc aggctggagg ggagcgacgg 240 gctagctttt ctaaagccaa ttttggagaa gacgtcgatg aaaaggtcct ttcgcaacgg 300 agtcggctca ggggtgaaaa aaacttcatt tcgaagagca aagcaatgaa taa 353 <210> 31 <211> 89 <212> PRT <213> Rat <400> 31 Met Ile Gly Ser Leu Lys Leu Asn Leu Ile Leu Ala Leu Ser Leu Ser 5 10 15 Val Val His Val Ile Trp Ser Tyr Pro Val Leu Ser Ser Lys Val Pro 20 25 30 Gly Lys Pro Asp Tyr Phe Leu Ile Leu Leu Ser Thr Cys Pro Ala Arg 35 40 45 Leu Glu Gly Ser Asp Gly Leu Ala Phe Leu Lys Pro Ile Leu Glu Lys 50 55 60 Thr Ser Met Lys Arg Ser Phe Arg Asn Gly Val Gly Ser Gly Val Lys 65 70 75 80 Lys Thr Ser Phe Arg Arg Ala Lys Gln 85 <210> 32 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 32 tatagtcgac atgccagcca acttcac 27 <210> 33 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 33 tgtcactagt ctagatgaat tctggctt 28 <210> 34 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 34 ttcactggag acttcacggc a 21 <210> 35 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 35 tagaggcgta gagcagcaca ac 22 <210> 36 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Probe designed for TaqMan PCR, wherein 5' end is labeled by 6-carb oxy-fluorescein (Fam) and 3' end is labeled by 6-carboxy-tetramethyl-rho damine (Tamra) <400> 36 acctggtttg ccgagtggtc cgctattt 28 <210> 37 <211> 371 <212> PRT <213> Human <400> 37 Met Pro Ala Asn Phe Thr Glu Gly Ser Phe Asp Ser Ser Gly Thr Gly 5 10 15 Gln Thr Leu Asp Ser Ser Pro Val Ala Cys Thr Glu Thr Val Thr Phe 20 25 30 Thr Glu Val Val Glu Gly Lys Glu Trp Gly Ser Phe Tyr Tyr Ser Phe 35 40 45 Lys Thr Glu Gln Leu Ile Thr Leu Trp Val Leu Phe Val Phe Thr Ile 50 55 60 Val Gly Asn Ser Val Val Leu Phe Ser Thr Trp Arg Arg Lys Lys Lys 65 70 75 80 Ser Arg Met Thr Phe Phe Val Thr Gln Leu Ala Ile Thr Asp Ser Phe 85 90 95 Thr Gly Leu Val Asn Ile Leu Thr Asp Ile Asn Trp Arg Phe Thr Gly 100 105 110 Asp Phe Thr Ala Pro Asp Leu Val Cys Arg Val Val Arg Tyr Leu Gln 115 120 125 Val Val Leu Leu Tyr Ala Ser Thr Tyr Val Leu Val Ser Leu Ser Ile 130 135 140 Asp Arg Tyr His Ala Ile Val Tyr Pro Met Lys Phe Leu Gln Gly Glu 145 150 155 160 Lys Gln Ala Arg Val Leu Ile Val Ile Ala Trp Ser Leu Ser Phe Leu 165 170 175 Phe Ser Ile Pro Thr Leu Ile Ile Phe Gly Lys Arg Thr Leu Ser Asn 180 185 190 Gly Glu Val Gln Cys Trp Ala Leu Trp Pro Asp Asp Ser Tyr Trp Thr 195 200 205 Pro Tyr Met Thr Ile Val Ala Phe Leu Val Tyr Phe Ile Pro Leu Thr 210 215 220 Ile Ile Ser Ile Met Tyr Gly Ile Val Ile Arg Thr Ile Trp Ile Lys 225 230 235 240 Ser Lys Thr Tyr Glu Thr Val Ile Ser Asn Cys Ser Asp Gly Lys Leu 245 250 255 Cys Ser Ser Tyr Asn Arg Gly Leu Ile Ser Lys Ala Lys Ile Lys Ala 260 265 270 Ile Lys Tyr Ser Ile Ile Ile Ile Leu Ala Phe Ile Cys Cys Trp Ser 275 280 285 Pro Tyr Phe Leu Phe Asp Ile Leu Asp Asn Phe Asn Leu Leu Pro Asp 290 295 300 Thr Gln Glu Arg Phe Tyr Ala Ser Val Ile Ile Gln Asn Leu Pro Ala 305 310 315 320 Leu Asn Ser Ala Ile Asn Pro Leu Ile Tyr Cys Val Phe Ser Ser Ser 325 330 335 Ile Ser Phe Pro Cys Arg Glu Gln Arg Ser Gln Asp Ser Arg Met Thr 340 345 350 Phe Arg Glu Arg Thr Glu Arg His Glu Met Gln Ile Leu Ser Lys Pro 355 360 365 Glu Phe Ile 370 <210> 38 <211> 1113 <212> DNA <213> Human <400> 38 atgccagcca acttcacaga gggcagcttc gattccagtg ggaccgggca gacgctggat 60 tcttccccag tggcttgcac tgaaacagtg acttttactg aagtggtgga aggaaaggaa 120 tggggttcct tctactactc ctttaagact gagcaattga taactctgtg ggtcctcttt 180 gtttttacca ttgttggaaa ctccgttgtg cttttttcca catggaggag aaagaagaag 240 tcaagaatga ccttctttgt gactcagctg gccatcacag attctttcac aggactggtc 300 aacatcttga cagatattaa ttggcgattc actggagact tcacggcacc tgacctggtt 360 tgccgagtgg tccgctattt gcaggttgtg ctgctctacg cctctaccta cgtcctggtg 420 tccctcagca tagacagata ccatgccatc gtctacccca tgaagttcct tcaaggagaa 480 aagcaagcca gggtcctcat tgtgatcgcc tggagcctgt cttttctgtt ctccattccc 540 accctgatca tatttgggaa gaggacactg tccaacggtg aagtgcagtg ctgggccctg 600 tggcctgacg actcctactg gaccccatac atgaccatcg tggccttcct ggtgtacttc 660 atccctctga caatcatcag catcatgtat ggcattgtga tccgaactat ttggattaaa 720 agcaaaacct acgaaacagt gatttccaac tgctcagatg ggaaactgtg cagcagctat 780 aaccgaggac tcatctcaaa ggcaaaaatc aaggctatca agtatagcat catcatcatt 840 cttgccttca tctgctgttg gagtccatac ttcctgtttg acattttgga caatttcaac 900 ctccttccag acacccagga gcgtttctat gcctctgtga tcattcagaa cctgccagca 960 ttgaatagtg ccatcaaccc cctcatctac tgtgtcttca gcagctccat ctctttcccc 1020 tgcagggagc aaagatcaca ggattccaga atgacgttcc gggagagaac tgagaggcat 1080 gagatgcaga ttctgtccaa gccagaattc atc 1113 <210> 39 <211> 371 <212> PRT <213> Human <400> 39 Met Pro Ala Asn Phe Thr Glu Gly Ser Phe Asp Ser Ser Gly Thr Gly 5 10 15 Gln Thr Leu Asp Ser Ser Pro Val Ala Cys Thr Glu Thr Val Thr Phe 20 25 30 Thr Glu Val Val Glu Gly Lys Glu Trp Gly Ser Phe Tyr Tyr Ser Phe 35 40 45 Lys Thr Glu Gln Leu Ile Thr Leu Trp Val Leu Phe Val Phe Thr Ile 50 55 60 Val Gly Asn Ser Val Val Leu Phe Ser Thr Trp Arg Arg Lys Lys Lys 65 70 75 80 Ser Arg Met Thr Phe Phe Val Thr Gln Leu Ala Ile Thr Asp Ser Phe 85 90 95 Thr Gly Leu Val Asn Ile Leu Thr Asp Ile Ile Trp Arg Phe Thr Gly 100 105 110 Asp Phe Thr Ala Pro Asp Leu Val Cys Arg Val Val Arg Tyr Leu Gln 115 120 125 Val Val Leu Leu Tyr Ala Ser Thr Tyr Val Leu Val Ser Leu Ser Ile 130 135 140 Asp Arg Tyr His Ala Ile Val Tyr Pro Met Lys Phe Leu Gln Gly Glu 145 150 155 160 Lys Gln Ala Arg Val Leu Ile Val Ile Ala Trp Ser Leu Ser Phe Leu 165 170 175 Phe Ser Ile Pro Thr Leu Ile Ile Phe Gly Lys Arg Thr Leu Ser Asn 180 185 190 Gly Glu Val Gln Cys Trp Ala Leu Trp Pro Asp Asp Ser Tyr Trp Thr 195 200 205 Pro Tyr Met Thr Ile Val Ala Phe Leu Val Tyr Phe Ile Pro Leu Thr 210 215 220 Ile Ile Ser Ile Met Tyr Gly Ile Val Ile Arg Thr Ile Trp Ile Lys 225 230 235 240 Ser Lys Thr Tyr Glu Thr Val Ile Ser Asn Cys Ser Asp Gly Lys Leu 245 250 255 Cys Ser Ser Tyr Asn Arg Gly Leu Ile Ser Lys Ala Lys Ile Lys Ala 260 265 270 Ile Lys Tyr Ser Ile Ile Ile Ile Leu Ala Phe Ile Cys Cys Trp Ser 275 280 285 Pro Tyr Phe Leu Phe Asp Ile Leu Asp Asn Phe Asn Leu Leu Pro Asp 290 295 300 Thr Gln Glu Arg Phe Tyr Ala Ser Val Ile Ile Gln Asn Leu Pro Ala 305 310 315 320 Leu Asn Ser Ala Ile Asn Pro Leu Ile Tyr Cys Val Phe Ser Ser Ser 325 330 335 Ile Ser Phe Pro Cys Arg Glu Arg Arg Ser Gln Asp Ser Arg Met Thr 340 345 350 Phe Arg Glu Arg Thr Glu Arg His Glu Met Gln Ile Leu Ser Lys Pro 355 360 365 Glu Phe Ile 370 <210> 40 <211> 1113 <212> DNA <213> Human <400> 40 atgccagcca acttcacaga gggcagcttc gattccagtg ggaccgggca gacgctggat 60 tcttccccag tggcttgcac tgaaacagtg acttttactg aagtggtgga aggaaaggaa 120 tggggttcct tctactactc ctttaagact gagcaattga taactctgtg ggtcctcttt 180 gtttttacca ttgttggaaa ctccgttgtg cttttttcca catggaggag aaagaagaag 240 tcaagaatga ccttctttgt gactcagctg gccatcacag attctttcac aggactggtc 300 aacatcttga cagatattat ttggcgattc actggagact tcacggcacc tgacctggtt 360 tgccgagtgg tccgctattt gcaggttgtg ctgctctacg cctctaccta cgtcctggtg 420 tccctcagca tagacagata ccatgccatc gtctacccca tgaagttcct tcaaggagaa 480 aagcaagcca gggtcctcat tgtgatcgcc tggagcctgt cttttctgtt ctccattccc 540 accctgatca tatttgggaa gaggacactg tccaacggtg aagtgcagtg ctgggccctg 600 tggcctgacg actcctactg gaccccatac atgaccatcg tggcctttct ggtgtacttc 660 atccctctga caatcatcag catcatgtat ggcattgtga tccgaactat ttggattaaa 720 agcaaaacct acgaaacagt gatttccaac tgctcagatg ggaaactgtg cagcagctat 780 aaccgaggac tcatctcaaa ggcaaaaatc aaggctatca agtatagcat catcatcatt 840 cttgccttca tctgctgttg gagtccatac ttcctgtttg acattttgga caatttcaac 900 ctccttccag acacccagga gcgtttctat gcctctgtga tcattcagaa cctgccagca 960 ttgaatagtg ccatcaaccc cctcatctac tgtgtcttca gcagctccat ctctttcccc 1020 tgcagggagc gaagatcaca ggattccaga atgacgttcc gggagagaac cgagaggcat 1080 gagatgcaga ttctgtccaa gccagaattc atc 1113
【図面の簡単な説明】
【図1】 本発明のリガンド決定残基−リガンド分類情
報作成までの工程表を表す。
【図2】 本発明のリガンド決定残基位置特定工程の一
態様を示す工程表である。
【図3】 本発明のリガンド決定残基位置特定工程の別
の一態様を示す工程表である。
【図4】 ウシロドプシンとTGR23−1とのシーク
エンスアラインメントの結果を表す。
【図5】 FLIPRを用いて測定した種々の濃度のヒ
トTGR23−2リガンド(1−20)によるTGR2
3−1発現CHO細胞の細胞内Caイオン濃度上昇活性
を示す。
【図6】 FLIPRを用いて測定した種々の濃度のヒ
トTGR23−2リガンド(1−20)によるTGR2
3−2発現CHO細胞の細胞内Caイオン濃度上昇活性
を示す。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) C12Q 1/44 C12Q 1/48 ZNAZ 1/48 ZNA C12N 15/00 A Fターム(参考) 2G045 AA34 AA35 BB01 BB10 BB20 BB41 BB46 BB48 BB50 CB01 DA13 DA36 FB06 JA01 4B024 AA01 AA11 BA80 CA04 DA02 EA04 GA11 GA18 HA03 4B063 QA01 QA18 QQ20 QQ63 QQ89 QR07 QR12 QR16 QR57 QR69 QR77 QS12 QS28 QS36 QX01

Claims (23)

    【特許請求の範囲】
  1. 【請求項1】 結合分子未知タンパク質に結合する結合
    分子を予測する結合分子未知タンパク質の結合分子予測
    方法であって、アミノ酸配列と結合分子とが既知である
    結合分子既知タンパク質について、少なくとも2以上の
    結合分子既知タンパク質のシークエンスアラインメント
    と、結合分子又は結合分子の種類とを対応付けた結合分
    子既知タンパク質分類情報を得る工程と、前記結合分子
    既知タンパク質分類情報を用いて、結合分子既知タンパ
    ク質のシークエンスアラインメントの位置のうち結合分
    子を決定することに関与すると想定される位置である結
    合分子決定残基位置を1又は2以上特定する工程と、前
    記結合分子決定残基位置におけるアミノ酸残基(結合分
    子決定残基)と、結合分子又は結合分子の種類とを対応
    付けることにより、結合分子決定残基と結合分子又は結
    合分子の種類との相関関係を表す結合分子決定残基−結
    合分子分類情報を得る工程と、前記結合分子既知タンパ
    ク質と同じ種類の結合分子未知タンパク質について前記
    結合分子既知タンパク質間のシークエンスアラインメン
    トに対して結合分子未知タンパク質の配列を整列させ、
    結合分子未知タンパク質のシークエンスアラインメント
    を得る工程と、前記結合分子未知タンパク質のシークエ
    ンスアラインメントのうち少なくとも1種類の結合分子
    決定残基についての情報を、結合分子決定残基−結合分
    子分類情報に当てはめ、結合分子未知タンパク質の結合
    分子又は結合分子の種類を予測する工程とを含む、結合
    分子未知タンパク質の結合分子予測方法。
  2. 【請求項2】 前記結合分子が、リガンド、調節因子、
    エフェクター、補酵素のいずれかである請求項1に記載
    の結合分子未知タンパク質の結合分子予測方法。
  3. 【請求項3】 前記結合分子が、2以上の種類に分類さ
    れ、当該分類された結合分子の種類を予測する請求項1
    又は2に記載の結合分子未知タンパク質の結合分子予測
    方法。
  4. 【請求項4】 結合分子未知タンパク質が、Gタンパク
    質共役型受容体、キナーゼ、リパーゼ、トランスポータ
    ー、プロテアーゼ、イオンチャンネルのいずれかである
    請求項1から3のいずれか1項に記載の結合分子未知タ
    ンパク質の結合分子予測方法。
  5. 【請求項5】 結合分子決定残基位置を1又は2以上特
    定する工程において、シークエンスアラインメントを構
    成するアミノ酸残基と結合分子の種類とから結合分子決
    定残基位置を1又は2以上特定する請求項1から4のい
    ずれか1項に記載の結合分子未知タンパク質の結合分子
    予測方法。
  6. 【請求項6】 下記式1、又は下記式2のいずれか又は
    両方を用いて結合分子決定残基位置を決定する請求項1
    から4のいずれか1項に記載の結合分子未知タンパク質
    の結合分子予測方法。 【式1】 [式1中、nは、f1(n)が、結合分子既知タンパク質の
    シークエンスアラインメントのうち第n番目のアミノ酸
    残基についての評価関数であることを表し、Resは、ア
    ミノ酸残基の種類を表し、Xq及びXrは、結合分子又は結
    合分子の種類を表し、qは1からp-1までの整数を表し、r
    はqより大きくp以下である整数を表し、pは結合分子又
    は結合分子の種類の数を表し、N(Res, Xq)は、結合分子
    既知タンパク質分類情報に存在する結合分子既知タンパ
    ク質のうち、シークエンスアラインメントのn番目のア
    ミノ酸残基がResであり、かつ結合分子がXqであるもの
    の数を表し、N(Res, Xr)は、結合分子既知タンパク質分
    類情報に存在する結合分子既知タンパク質のうち、シー
    クエンスアラインメントのn番目のアミノ酸残基がRes
    であり、かつ結合分子がXrであるものの数を表す。] 【式2】 [式2中、nは、f2(n)が、結合分子既知タンパク質の
    シークエンスアラインメントのうち第n番目のアミノ酸
    残基についての評価関数であることを表し、Resは、ア
    ミノ酸残基の種類を表し、X1からXpは、結合分子又は結
    合分子の種類を表し、pは、結合分子又は結合分子の種
    類の数を表し、N(Res, X)は、結合分子既知タンパク質
    分類情報に存在する結合分子既知タンパク質のうち、シ
    ークエンスアラインメントのn番目のアミノ酸残基がRe
    sであり、かつ結合分子がXであるものの数を表す。]
  7. 【請求項7】下記式3、下記式4、下記式5のいずれか
    ひとつ以上を用いて結合分子決定残基位置を決定する請
    求項1から4のいずれか1項に記載の結合分子未知タン
    パク質の結合分子予測方法。 【式3】 [式3中、nは、f1(n)が、結合分子既知タンパク質の
    シークエンスアラインメントのうち第n番目のアミノ酸
    残基についての評価関数であることを表し、Resは、ア
    ミノ酸残基の種類を表し、Xq及びXrは、結合分子又は結
    合分子の種類を表し、qは1からp-1までの整数を表し、r
    はqより大きくp以下である整数を表し、pは結合分子又
    は結合分子の種類の数を表し、N(Res, Xq)は、結合分子
    既知タンパク質分類情報に存在する結合分子既知タンパ
    ク質のうち、シークエンスアラインメントのn番目のア
    ミノ酸残基がResであり、かつ結合分子がXqであるもの
    の数を表し、N(Res, Xr)は、結合分子既知タンパク質分
    類情報に存在する結合分子既知タンパク質のうち、シー
    クエンスアラインメントのn番目のアミノ酸残基がRes
    であり、かつ結合分子がXrであるものの数を表す。] 【式4】 [式4中、nは、f2(n)が、結合分子既知タンパク質の
    シークエンスアラインメントのうち第n番目のアミノ酸
    残基についての評価関数であることを表し、Resは、ア
    ミノ酸残基の種類を表し、X1からXpは、結合分子又は結
    合分子の種類を表し、pは、結合分子又は結合分子の種
    類の数を表し、N(Res, X)は、結合分子既知タンパク質
    分類情報に存在する結合分子既知タンパク質のうち、シ
    ークエンスアラインメントのn番目のアミノ酸残基がRe
    sであり、かつ結合分子がXであるものの数を表す。] 【式5】 [式5中、(m,n)は、f3(m, n)が結合分子既知タンパク
    質のシークエンスアラインメントのうち第m番目と第n
    番目のアミノ酸残基についての評価関数であることを表
    し、アミノ酸残基ペア種類数は、結合分子既知タンパク
    質のシークエンスアラインメントのうち第m番目と第n
    番目のアミノ酸残基の組合せの種類の数を表し、2交差
    残基ペア種類数及び3交差残基ペア種類数はそれぞれ、
    結合分子既知タンパク質のシークエンスアラインメント
    のうち第m番目と第n番目のアミノ酸残基の組合せのう
    ちリガンドが2種類及び3種類のものの数を意味し、p交
    差残基ペア種類数は、結合分子既知タンパク質のシーク
    エンスアラインメントのうち第m番目と第n番目のアミ
    ノ酸残基の組合せのうちリガンドがp種類のものの数を
    意味し、シークエンスアラインメント不能アミノ酸残基
    数とは、結合分子既知タンパク質のシークエンスアライ
    ンメントのうち第m番目と第n番目のアミノ酸残基のう
    ち一方が、好ましい相同性を得るためにシークエンスア
    ラインメント不可能とされた数を意味し、シークエンス
    アラインメント不能アミノ酸残基ペア数とは、結合分子
    既知タンパク質のシークエンスアラインメントのうち第
    m番目と第n番目のアミノ酸残基の両方が、好ましい相
    同性を得るためにシークエンスアラインメント不可能と
    された数を意味し、wXは正の定数、またはアミノ酸ペ
    ア種類数を変数とする分布関数であって、アミノ酸ペア
    種類数が400以下の正の数であるときに最大値を与える
    分布関数を意味し、w1…wp-1、wA、wBは、ウエイト
    であり、正の数である。]
  8. 【請求項8】 リガンド決定残基−リガンド分類情報を
    得る工程が、リガンド既知タンパク質のアミノ酸残基の
    うち、関数f3(n)の値が一番小さなリガンド決定残基位
    置にあるものを抽出する工程と、リガンド決定残基−リ
    ガンド分類情報にあげられたリガンド既知タンパク質の
    うち、抽出されたリガンド決定残基と一致するものの数
    (A)を求める工程と、リガンド決定残基−リガンド分
    類情報にあげられたリガンド既知タンパク質のうち抽出
    されたリガンド決定残基と一致するもののうちで、リガ
    ンド又はリガンドの種類が当該リガンド既知タンパク質
    のものと一致する数(B)を求める工程と、リガンド既
    知タンパク質のアミノ酸残基のうち関数f3(n)の値が二
    番目に小さい又はx番目(ここで、xは2より大きく1
    00より小さな整数を表す。)に小さいリガンド決定残
    基位置にあるものを抽出する工程と、リガンド決定残基
    −リガンド分類情報にあげられたリガンド既知タンパク
    質のうち、抽出されたリガンド決定残基と一致するもの
    の数(C)を求める工程と、リガンド決定残基−リガン
    ド分類情報にあげられたリガンド既知タンパク質のうち
    抽出されたリガンド決定残基と一致するもののうちで、
    リガンド又はリガンドの種類が当該リガンド既知タンパ
    ク質のものと一致する数(D)を求める工程と、(A)
    と(C)との和(E)を求める工程と、(B)と(D)
    との和(F)を求める工程と、を含み、(E)と(F)
    を更に表示するリガンド決定残基−リガンド分類情報を
    得る請求項7に記載の結合分子未知タンパク質の結合分
    子予測方法。
  9. 【請求項9】 アミノ酸配列と結合分子とが既知である
    少なくとも2以上の結合分子既知タンパク質について、
    当該結合分子既知タンパク質のシークエンスアラインメ
    ントと、結合分子又は結合分子の種類とを対応付けた結
    合分子既知タンパク質分類情報を得る工程と、当該結合
    分子既知タンパク質分類情報を用いて、結合分子既知タ
    ンパク質のシークエンスアラインメントのうち結合分子
    を決定することに関与すると想定される位置である結合
    分子決定残基位置を1又は2以上特定する工程と、当該
    結合分子決定残基位置におけるアミノ酸残基(結合分子
    決定残基)と、結合分子、又は結合分子の種類とを対応
    付けることにより、結合分子決定残基と結合分子との相
    関関係を表す結合分子決定残基−結合分子分類情報を得
    る工程と、を含む結合分子未知タンパク質の結合分子予
    測方法。
  10. 【請求項10】 結合分子決定残基と結合分子との相関
    関係を表す結合分子決定残基−結合分子分類情報に、前
    記結合分子既知タンパク質と同じ種類の結合分子未知タ
    ンパク質について前記結合分子既知タンパク質間のシー
    クエンスアラインメントに対して結合分子未知タンパク
    質の配列を整列させて得られた結合分子未知タンパク質
    のシークエンスアラインメントに関する情報を入力し、
    当該結合分子未知タンパク質に結合する結合分子、又は
    結合分子の種類を予測する結合分子未知タンパク質の結
    合分子予測方法。
  11. 【請求項11】 請求項1〜10のいずれか1項に記載
    した結合分子未知タンパク質の結合分子予測方法を用い
    て、結合分子未知タンパク質に結合する結合分子、又は
    結合分子の種類を予測する工程を含む医薬の製造方法。
  12. 【請求項12】 医薬が、中枢疾患、炎症性疾患、循環
    器疾患、癌、代謝性疾患、免疫系疾患または消化器系疾
    患の予防剤、又は治療剤のいずれか又は両方である請求
    項11に記載の医薬の製造方法。
  13. 【請求項13】 下記式6又は下記式7のいずれか又は
    両方を用いた結合分子決定残基位置を決定する方法。 【式6】 [式6中、nは、f1(n)が、結合分子既知タンパク質の
    シークエンスアラインメントのうち第n番目のアミノ酸
    残基についての評価関数であることを表し、Resは、ア
    ミノ酸残基の種類を表し、Xq及びXrは、結合分子又は結
    合分子の種類を表し、qは1からp-1までの整数を表し、r
    はqより大きくp以下である整数を表し、pは結合分子又
    は結合分子の種類の数を表し、N(Res, Xq)は、結合分子
    既知タンパク質分類情報に存在する結合分子既知タンパ
    ク質のうち、シークエンスアラインメントのn番目のア
    ミノ酸残基がResであり、かつ結合分子がXqであるもの
    の数を表し、N(Res, Xr)は、結合分子既知タンパク質分
    類情報に存在する結合分子既知タンパク質のうち、シー
    クエンスアラインメントのn番目のアミノ酸残基がRes
    であり、かつ結合分子がXrであるものの数を表す。] 【式7】 [式7中、nは、f2(n)が、結合分子既知タンパク質の
    シークエンスアラインメントのうち第n番目のアミノ酸
    残基についての評価関数であることを表し、Resは、ア
    ミノ酸残基の種類を表し、X1からXpは、結合分子又は結
    合分子の種類を表し、pは、結合分子又は結合分子の種
    類の数を表し、N(Res, X)は、結合分子既知タンパク質
    分類情報に存在する結合分子既知タンパク質のうち、シ
    ークエンスアラインメントのn番目のアミノ酸残基がRe
    sであり、かつ結合分子がXであるものの数を表す。]
  14. 【請求項14】 下記式8を用いた結合分子決定残基位
    置を決定する方法。 【式8】 [式8中、(m,n)は、f3(m, n)が結合分子既知タンパク
    質のシークエンスアラインメントのうち第m番目と第n
    番目のアミノ酸残基についての評価関数であることを表
    し、アミノ酸残基ペア種類数は、結合分子既知タンパク
    質のシークエンスアラインメントのうち第m番目と第n
    番目のアミノ酸残基の組合せの種類の数を表し、2交差
    残基ペア種類数及び3交差残基ペア種類数はそれぞれ、
    結合分子既知タンパク質のシークエンスアラインメント
    のうち第m番目と第n番目のアミノ酸残基の組合せのう
    ちリガンドが2種類及び3種類のものの数を意味し、p交
    差残基ペア種類数は、結合分子既知タンパク質のシーク
    エンスアラインメントのうち第m番目と第n番目のアミ
    ノ酸残基の組合せのうちリガンドがp種類のものの数を
    意味し、シークエンスアラインメント不能アミノ酸残基
    数とは、結合分子既知タンパク質のシークエンスアライ
    ンメントのうち第m番目と第n番目のアミノ酸残基のう
    ち一方が、好ましい相同性を得るためにシークエンスア
    ラインメント不可能とされた数を意味し、シークエンス
    アラインメント不能アミノ酸残基ペア数とは、結合分子
    既知タンパク質のシークエンスアラインメントのうち第
    m番目と第n番目のアミノ酸残基の両方が、好ましい相
    同性を得るためにシークエンスアラインメント不可能と
    された数を意味し、wXは正の定数、またはアミノ酸ペ
    ア種類数を変数とする分布関数であって、アミノ酸ペア
    種類数が400以下の正の数であるときに最大値を与える
    分布関数を意味し、w1…wp-1、wA、wBは、ウエイト
    であり、正の数である。]
  15. 【請求項15】 結合分子既知タンパク質のアミノ酸配
    列又はシークエンスアラインメントと、結合分子又は結
    合分子の種類に関する情報とを用いて、結合分子既知タ
    ンパク質のシークエンスアラインメントの位置のうち結
    合分子を決定することに関与すると想定される位置(結
    合分子決定残基位置)におけるアミノ酸残基である結合
    分子決定残基と、結合分子または結合分子の種類との相
    関関係を表す結合分子決定残基−結合分子分類情報を得
    る、結合分子未知タンパク質の結合分子を予測するため
    のコンピュータであって、当該コンピュータは、結合分
    子既知タンパク質のシークエンスアラインメントに関す
    る情報を入力するシークエンスアラインメント入力手段
    と、前記シークエンスアラインメント入力手段により入
    力された結合分子既知タンパク質のアミノ酸配列又はシ
    ークエンスアラインメントと、結合分子又は結合分子の
    種類に関する情報とを記憶するシークエンスアラインメ
    ント結合分子記憶手段と、 前記シークエンスアラインメント結合分子記憶手段によ
    り記憶された結合分子既知タンパク質のアミノ酸配列又
    はシークエンスアラインメントと、結合分子又は結合分
    子の種類に関する情報を用いて前記結合分子決定残基位
    置を決定する結合分子決定残基位置決定手段と、前記結
    合分子決定残基位置におけるアミノ酸残基(結合分子決
    定残基)と、結合分子又は結合分子の種類とを対応付け
    ることにより、結合分子決定残基と結合分子または結合
    分子の種類との相関関係を表す結合分子決定残基−結合
    分子分類情報を得る結合分子決定残基−結合分子分類情
    報取得手段と、前記結合分子既知タンパク質と同じ種類
    の結合分子未知タンパク質について前記結合分子既知タ
    ンパク質間のシークエンスアラインメントに対して結合
    分子未知タンパク質の配列を整列させて得られた結合分
    子未知タンパク質のシークエンスアラインメントに関す
    る情報を入力するシークエンスアラインメント入力手段
    と、を具備し、結合分子決定残基−結合分子分類情報
    に、シークエンスアラインメント入力手段により入力さ
    れた結合分子未知タンパク質のシークエンスアラインメ
    ントに関する情報を用いて、当該結合分子未知タンパク
    質の結合分子、又は結合分子の種類を予測する、結合分
    子未知タンパク質の結合分子を予測するためのコンピュ
    ータ。
  16. 【請求項16】 前記結合分子決定残基位置決定手段
    が、少なくとも下記式9又は式10のいずれか又は両方
    の関数を用いる請求項15に記載の結合分子未知タンパ
    ク質の結合分子を予測するためのコンピュータ。 【式9】 [式9中、nは、f1(n)が、結合分子既知タンパク質の
    シークエンスアラインメントのうち第n番目のアミノ酸
    残基についての評価関数であることを表し、Resは、ア
    ミノ酸残基の種類を表し、Xq及びXrは、結合分子又は結
    合分子の種類を表し、qは1からp-1までの整数を表し、r
    はqより大きくp以下である整数を表し、pは結合分子又
    は結合分子の種類の数を表し、N(Res, Xq)は、結合分子
    既知タンパク質分類情報に存在する結合分子既知タンパ
    ク質のうち、シークエンスアラインメントのn番目のア
    ミノ酸残基がResであり、かつ結合分子がXqであるもの
    の数を表し、N(Res, Xr)は、結合分子既知タンパク質分
    類情報に存在する結合分子既知タンパク質のうち、シー
    クエンスアラインメントのn番目のアミノ酸残基がRes
    であり、かつ結合分子がXrであるものの数を表す。] 【式10】 [式10中、nは、f2(n)が、結合分子既知タンパク質
    のシークエンスアラインメントのうち第n番目のアミノ
    酸残基についての評価関数であることを表し、Resは、
    アミノ酸残基の種類を表し、X1からXpは、結合分子又は
    結合分子の種類を表し、pは、結合分子又は結合分子の
    種類の数を表し、N(Res, X)は、結合分子既知タンパク
    質分類情報に存在する結合分子既知タンパク質のうち、
    シークエンスアラインメントのn番目のアミノ酸残基が
    Resであり、かつ結合分子がXであるものの数を表す。]
  17. 【請求項17】 前記結合分子決定残基位置決定手段
    が、下記式11で表される関数を用いる請求項15又は
    16に記載の結合分子未知タンパク質の結合分子を予測
    するためのコンピュータ。 【式11】 [式11中、(m,n)は、f3(m, n)が結合分子既知タンパ
    ク質のシークエンスアラインメントのうち第m番目と第
    n番目のアミノ酸残基についての評価関数であることを
    表し、アミノ酸残基ペア種類数は、結合分子既知タンパ
    ク質のシークエンスアラインメントのうち第m番目と第
    n番目のアミノ酸残基の組合せの種類の数を表し、2交
    差残基ペア種類数及び3交差残基ペア種類数はそれぞ
    れ、結合分子既知タンパク質のシークエンスアラインメ
    ントのうち第m番目と第n番目のアミノ酸残基の組合せ
    のうちリガンドが2種類及び3種類のものの数を意味し、
    p交差残基ペア種類数は、結合分子既知タンパク質のシ
    ークエンスアラインメントのうち第m番目と第n番目の
    アミノ酸残基の組合せのうちリガンドがp種類のものの
    数を意味し、シークエンスアラインメント不能アミノ酸
    残基数とは、結合分子既知タンパク質のシークエンスア
    ラインメントのうち第m番目と第n番目のアミノ酸残基
    のうち一方が、好ましい相同性を得るためにシークエン
    スアラインメント不可能とされた数を意味し、シークエ
    ンスアラインメント不能アミノ酸残基ペア数とは、結合
    分子既知タンパク質のシークエンスアラインメントのう
    ち第m番目と第n番目のアミノ酸残基の両方が、好まし
    い相同性を得るためにシークエンスアラインメント不可
    能とされた数を意味し、wXは正の定数、またはアミノ
    酸ペア種類数を変数とする分布関数であって、アミノ酸
    ペア種類数が400以下の正の数であるときに最大値を与
    える分布関数を意味し、w1…wp-1、wA、wBは、ウエ
    イトであり、正の数である。]
  18. 【請求項18】 結合分子未知タンパク質の結合分子を
    予測するためのコンピュータであって、当該結合分子未
    知タンパク質と同じ種類であり結合する結合分子が既知
    である結合分子既知タンパク質のシークエンスアライン
    メントのうち当該結合分子既知タンパク質に結合する分
    子を決定することに関与すると想定される位置である結
    合分子決定残基位置と、当該結合分子決定残基位置にお
    ける結合分子既知タンパク質のアミノ酸残基である結合
    分子決定残基と、当該結合分子決定残基に対応した結合
    分子既知タンパク質の結合分子又は結合分子の種類とに
    関する情報を記憶した記憶手段と、前記結合分子既知タ
    ンパク質と同じ種類の結合分子未知タンパク質について
    前記結合分子既知タンパク質間のシークエンスアライン
    メントに対して結合分子未知タンパク質の配列を整列さ
    せて得られた結合分子未知タンパク質のシークエンスア
    ラインメントに関する情報を入力するシークエンスアラ
    インメント入力手段と、入力されたシークエンスアライ
    ンメントに関する情報と記憶手段に記憶される情報とか
    ら当該結合分子未知タンパク質の結合分子又は結合分子
    の種類を決定する結合分子決定手段と、決定された結合
    分子未知タンパク質に結合する結合分子又は結合分子の
    種類を表示する表示手段とを具備し、シークエンスアラ
    インメント入力手段により入力された結合分子未知タン
    パク質のシークエンスアラインメントに関する情報と、
    記憶手段に記憶された結合分子決定残基と当該結合分子
    決定残基に対応した結合分子既知タンパク質の結合分子
    又は結合分子の種類に関する情報とに基づいて結合分子
    決定手段により結合分子未知タンパク質の結合分子又は
    結合分子の種類を予測し、結合分子決定手段により予測
    された当該結合分子未知タンパク質の結合分子又は結合
    分子の種類を表示手段により表示する結合分子未知タン
    パク質の結合分子を予測するためのコンピュータ。
  19. 【請求項19】 コンピュータを、結合分子既知タンパ
    ク質のシークエンスアラインメントに関する情報を入力
    するシークエンスアラインメント入力手段と、前記シー
    クエンスアラインメント入力手段により入力された結合
    分子既知タンパク質のアミノ酸配列又はシークエンスア
    ラインメントと、結合分子又は結合分子の種類に関する
    情報とを記憶するシークエンスアラインメント結合分子
    記憶手段と、 前記シークエンスアラインメント結合分子記憶手段によ
    り記憶された結合分子既知タンパク質のアミノ酸配列又
    はシークエンスアラインメントと、結合分子又は結合分
    子の種類に関する情報を用いて前記結合分子決定残基位
    置を決定する結合分子決定残基位置決定手段と、前記結
    合分子決定残基位置におけるアミノ酸残基(結合分子決
    定残基)と、結合分子又は結合分子の種類とを対応付け
    ることにより、結合分子決定残基と結合分子または結合
    分子の種類との相関関係を表す結合分子決定残基−結合
    分子分類情報を得る結合分子決定残基−結合分子分類情
    報取得手段と、前記結合分子既知タンパク質と同じ種類
    の結合分子未知タンパク質について前記結合分子既知タ
    ンパク質間のシークエンスアラインメントに対して結合
    分子未知タンパク質の配列を整列させて得られた結合分
    子未知タンパク質のシークエンスアラインメントに関す
    る情報を入力するシークエンスアラインメント入力手段
    と、して機能させるプログラム。
  20. 【請求項20】 前記結合分子決定残基位置決定手段
    が、少なくとも下記式12又は式13のいずれか又は両
    方の関数を用いる請求項19に記載のプログラム。 【式12】 [式12中、nは、f1(n)が、結合分子既知タンパク質
    のシークエンスアラインメントのうち第n番目のアミノ
    酸残基についての評価関数であることを表し、Resは、
    アミノ酸残基の種類を表し、Xq及びXrは、結合分子又は
    結合分子の種類を表し、qは1からp-1までの整数を表
    し、rはqより大きくp以下である整数を表し、pは結合
    分子又は結合分子の種類の数を表し、N(Res, Xq)は、結
    合分子既知タンパク質分類情報に存在する結合分子既知
    タンパク質のうち、シークエンスアラインメントのn番
    目のアミノ酸残基がResであり、かつ結合分子がXqであ
    るものの数を表し、N(Res, Xr)は、結合分子既知タンパ
    ク質分類情報に存在する結合分子既知タンパク質のう
    ち、シークエンスアラインメントのn番目のアミノ酸残
    基がResであり、かつ結合分子がXrであるものの数を表
    す。] 【式13】 [式13中、nは、f2(n)が、結合分子既知タンパク質
    のシークエンスアラインメントのうち第n番目のアミノ
    酸残基についての評価関数であることを表し、Resは、
    アミノ酸残基の種類を表し、X1からXpは、結合分子又は
    結合分子の種類を表し、pは、結合分子又は結合分子の
    種類の数を表し、N(Res, X)は、結合分子既知タンパク
    質分類情報に存在する結合分子既知タンパク質のうち、
    シークエンスアラインメントのn番目のアミノ酸残基が
    Resであり、かつ結合分子がXであるものの数を表す。]
  21. 【請求項21】 前記結合分子決定残基位置決定手段
    が、下記式14で表される関数を用いる請求項19又は
    20に記載のプログラム。 【式14】 [式14中、(m,n)は、f3(m, n)が結合分子既知タンパ
    ク質のシークエンスアラインメントのうち第m番目と第
    n番目のアミノ酸残基についての評価関数であることを
    表し、アミノ酸残基ペア種類数は、結合分子既知タンパ
    ク質のシークエンスアラインメントのうち第m番目と第
    n番目のアミノ酸残基の組合せの種類の数を表し、2交
    差残基ペア種類数及び3交差残基ペア種類数はそれぞ
    れ、結合分子既知タンパク質のシークエンスアラインメ
    ントのうち第m番目と第n番目のアミノ酸残基の組合せ
    のうちリガンドが2種類及び3種類のものの数を意味し、
    p交差残基ペア種類数は、結合分子既知タンパク質のシ
    ークエンスアラインメントのうち第m番目と第n番目の
    アミノ酸残基の組合せのうちリガンドがp種類のものの
    数を意味し、シークエンスアラインメント不能アミノ酸
    残基数とは、結合分子既知タンパク質のシークエンスア
    ラインメントのうち第m番目と第n番目のアミノ酸残基
    のうち一方が、好ましい相同性を得るためにシークエン
    スアラインメント不可能とされた数を意味し、シークエ
    ンスアラインメント不能アミノ酸残基ペア数とは、結合
    分子既知タンパク質のシークエンスアラインメントのう
    ち第m番目と第n番目のアミノ酸残基の両方が、好まし
    い相同性を得るためにシークエンスアラインメント不可
    能とされた数を意味し、wXは正の定数、またはアミノ
    酸ペア種類数を変数とする分布関数であって、アミノ酸
    ペア種類数が400以下の正の数であるときに最大値を与
    える分布関数を意味し、w1…wp-1、wA、wBは、ウエ
    イトであり、正の数である。]
  22. 【請求項22】 コンピュータを、結合分子未知タンパ
    ク質と同じ種類であり結合する結合分子が既知である結
    合分子既知タンパク質のシークエンスアラインメントの
    うち当該結合分子既知タンパク質に結合する分子を決定
    することに関与すると想定される位置である結合分子決
    定残基位置と、当該結合分子決定残基位置における結合
    分子既知タンパク質のアミノ酸残基である結合分子決定
    残基と、当該結合分子決定残基に対応した結合分子既知
    タンパク質の結合分子又は結合分子の種類とに関する情
    報を記憶した記憶手段と、前記結合分子既知タンパク質
    と同じ種類の結合分子未知タンパク質について前記結合
    分子既知タンパク質間のシークエンスアラインメントに
    対して結合分子未知タンパク質の配列を整列させて得ら
    れた結合分子未知タンパク質のシークエンスアラインメ
    ントに関する情報を入力するシークエンスアラインメン
    ト入力手段と、入力されたシークエンスアラインメント
    に関する情報と記憶手段に記憶される情報とから当該結
    合分子未知タンパク質の結合分子又は結合分子の種類を
    決定する結合分子決定手段と、決定された結合分子未知
    タンパク質に結合する結合分子又は結合分子の種類を表
    示する表示手段として機能させるプログラム。
  23. 【請求項23】 請求項19〜請求項22のいずれか1
    項に記載のプログラムを記憶した記録媒体。
JP2002203120A 2001-07-12 2002-07-11 結合分子予測方法およびその利用方法 Withdrawn JP2003159095A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002203120A JP2003159095A (ja) 2001-07-12 2002-07-11 結合分子予測方法およびその利用方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001-212749 2001-07-12
JP2001212749 2001-07-12
JP2002203120A JP2003159095A (ja) 2001-07-12 2002-07-11 結合分子予測方法およびその利用方法

Publications (1)

Publication Number Publication Date
JP2003159095A true JP2003159095A (ja) 2003-06-03

Family

ID=26618634

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002203120A Withdrawn JP2003159095A (ja) 2001-07-12 2002-07-11 結合分子予測方法およびその利用方法

Country Status (1)

Country Link
JP (1) JP2003159095A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006098192A1 (ja) * 2005-03-16 2006-09-21 Ajinomoto Co., Inc. 生体状態評価装置、生体状態評価方法、生体状態評価システム、生体状態評価プログラム、評価関数作成装置、評価関数作成方法、評価関数作成プログラムおよび記録媒体
JP2010054353A (ja) * 2008-08-28 2010-03-11 Hirokazu Shibahara 患者の予後健康状態改善度合の予測方法
JP2010051555A (ja) * 2008-08-28 2010-03-11 Hirokazu Shibahara 患者の健康状態評価方法
US8234075B2 (en) 2002-12-09 2012-07-31 Ajinomoto Co., Inc. Apparatus and method for processing information concerning biological condition, system, program and recording medium for managing information concerning biological condition
JP5448447B2 (ja) * 2006-05-26 2014-03-19 国立大学法人京都大学 ケミカルゲノム情報に基づく、タンパク質−化合物相互作用の予測と化合物ライブラリーの合理的設計

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8234075B2 (en) 2002-12-09 2012-07-31 Ajinomoto Co., Inc. Apparatus and method for processing information concerning biological condition, system, program and recording medium for managing information concerning biological condition
WO2006098192A1 (ja) * 2005-03-16 2006-09-21 Ajinomoto Co., Inc. 生体状態評価装置、生体状態評価方法、生体状態評価システム、生体状態評価プログラム、評価関数作成装置、評価関数作成方法、評価関数作成プログラムおよび記録媒体
JP5448447B2 (ja) * 2006-05-26 2014-03-19 国立大学法人京都大学 ケミカルゲノム情報に基づく、タンパク質−化合物相互作用の予測と化合物ライブラリーの合理的設計
JP2010054353A (ja) * 2008-08-28 2010-03-11 Hirokazu Shibahara 患者の予後健康状態改善度合の予測方法
JP2010051555A (ja) * 2008-08-28 2010-03-11 Hirokazu Shibahara 患者の健康状態評価方法

Similar Documents

Publication Publication Date Title
Bräuner-Osborne et al. Cloning and characterization of a human orphan family C G-protein coupled receptor GPRC5D
EP1849866A2 (en) Human orphan G protein-coupled receptors
US7108991B2 (en) Human orphan G protein-coupled receptors
JP4003069B2 (ja) 新規なグアノシン三リン酸(gtp)結合タンパク質共役型のレセプタータンパク質、bg37
JP2002199893A (ja) Gタンパク質共役型受容体hfiao41
JPH1128093A (ja) 新規ヒト・7−トランスメンブラン受容体をコードしているcDNAクローンHDPBI30
JP2002537805A (ja) ヒト分泌タンパク質
JP2004500125A (ja) アンギオペプチンによって確認される機能性受容体としてのGPCRx11を発現し、アゴニストおよびアンタゴニストのスクリーニングに役立つ組換え細胞系
Guan et al. Two related ligands of the TNF family, BAFF and APRIL, in rabbit: molecular cloning, 3D modeling, and tissue distribution
JP2003159095A (ja) 結合分子予測方法およびその利用方法
JPH11235184A (ja) ヒト7回膜貫通受容体をコードするcDNAクローンHNEAA8 1
CN103074348A (zh) 重组鲤鱼Nrf2基因、蛋白及其制备与检测方法和应用
JP2000510690A (ja) 哺乳類混合リンパ球受容体、ケモカイン受容体(mmlr―ccr)
Ahmad et al. Cloning and evaluation of the role of rat GALR‐2, a novel subtype of galanin receptor, in the control of pain perception
JP2000083682A (ja) 新規なヒトg―タンパク質結合レセプタ―(hcept09)
WO2003007187A1 (fr) Procede d&#39;evaluation de ligand et utilisation de ce procede
WO2005121356A1 (ja) 新規スクリーニング方法
JPH10243788A (ja) 新規ヒト7−トランスメンブランレセプターをコードするcDNAクローンHNFJD15
Zhu et al. Molecular cloning and characterization of CD9 cDNA from cartilaginous fish, red stingray, Dasyatis akajei
JP2000078994A (ja) 新規7―トランスメンブラン受容体をコ―ドしているcDNAクロ―ンHNFDY20
JPWO2003027672A1 (ja) プロキネティシン受容体を用いた新規スクリーニング方法
JPH1118782A (ja) 新規なヒト・ニューロテンシン・レセプター2型およびそのスプライス変種
JP2002186488A (ja) ヒト7膜貫通受容体をコードするcDNAクローンHAPOI67
JP2002525050A (ja) ヒト及びマウスgタンパク質結合受容体edg6(内皮分化遺伝子)及びその用途
US20030017536A1 (en) Novel polypeptide

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050613

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20061128