JP7125575B2

JP7125575B2 - 情報処理装置、情報処理方法、情報処理プログラム、及び情報処理システム

Info

Publication number: JP7125575B2
Application number: JP2021023750A
Authority: JP
Inventors: 泰秋山; 雅史大上; 渓甫柳澤; 寧吉川
Original assignee: AHEAD BIOCOMPUTING, CO. LTD.
Current assignee: AHEAD BIOCOMPUTING, CO. LTD.
Priority date: 2020-11-13
Filing date: 2021-02-17
Publication date: 2022-08-25
Anticipated expiration: 2041-02-17
Also published as: JP2022078924A

Description

本開示は、情報処理装置、情報処理方法、情報処理プログラム、及び情報処理システムに関する。

特許文献１には、生体高分子の構造解析において、次元集合に含まれるすべての指標次元それぞれを座標軸とする多次元空間において複数の構造のクラスタリングを行い、いずれのクラスタにも含まれないはずれ値となった構造を初期構造とする分子動力学シミュレーションを行うことが開示されている（例えば、請求項４）。

特許文献２には、タンパク質の立体構造を予測するタンパク質立体構造予測プログラムが開示されている。このタンパク質立体構造予測プログラムを実行するコンピュータは、タンパク質のアミノ酸配列を読み込み、２次構造情報を予測する。次に、このコンピュータは、２次構造情報に基づいてターンを形成するアミノ酸の個数を算出し、算出されたアミノ酸の個数と２次構造情報とによって、存在確率の高いターンのターン構造情報を取得してターンを予測再現し、タンパク質の立体構造を予測する。

また、特許文献３には、新生抗原のセットのそれぞれのペプチド配列を、機械学習させた提示モデルに入力することにより、患者についての新生抗原のセットについての数値的提示尤度のセットをそれぞれの患者について生成する方法が開示されている（例えば、請求項１）。

また、特許文献４には、コンピュータのプロセッサを使用してペプチドの数値ベクトルをディープラーニング提示モデルに入力して、新生抗原のセットについての提示尤度のセットを生成する方法が開示されている（例えば、請求項１）。

特開2017-37378号公報国際公開第2003/054743号特表2020-523010号公報特表2020-519246号公報

ところで、近年、中分子医薬の一つとしてペプチド医薬が注目されている。しかし、ペプチドの体内動態については不明な点が多い。

上記特許文献１～４に開示されている技術は、生体高分子の分子動力学シミュレーションを実行する技術、コンピュータによってタンパク質の立体構造を予測する技術、及び新生抗原に対して有効なペプチドを予測する技術であり、ペプチドの体内動態を予測するものではない。このため、上記特許文献１～４の技術は、ペプチドの体内動態を予測することはできない、という課題がある。

本開示は上記事実を考慮して、ペプチドの体内動態を予測することを目的とする。

本開示の第１の態様は、端末から送信された要求信号を受信する受信部と、前記要求信号に応答して、ペプチドの体内動態に関する予測情報を生成する予測部と、前記予測部により生成された前記予測情報を前記端末へ送信する送信部と、を含む情報処理装置である。

本開示の第２の態様は、端末から送信された要求信号を受信し、前記要求信号に応答して、ペプチドの体内動態に関する予測情報を生成し、生成された前記予測情報を前記端末へ送信する、処理をコンピュータが実行する情報処理方法である。

本開示の第３の態様は、端末から送信された要求信号を受信し、前記要求信号に応答して、ペプチドの体内動態に関する予測情報を生成し、生成された前記予測情報を前記端末へ送信する、処理をコンピュータに実行させるための情報処理プログラムである。

本開示の第４の態様は、端末と情報処理装置とを含む情報処理システムであって、前記端末は、要求信号を前記情報処理装置へ送信し、前記情報処理装置は、前記端末から送信された前記要求信号を受信し、前記要求信号に応答して、ペプチドの体内動態に関する予測情報を生成し、生成された前記予測情報を前記端末へ送信し、前記端末は、前記情報処理装置から送信された前記予測情報を表示部に表示させる、情報処理システムである。

本開示によれば、ペプチドの体内動態を予測することができる、という効果が得られる。

第１実施形態に係る情報処理システムを示すブロック図である。共通データベース１４２に格納されるデータの一例を説明するための図である。ユーザ用データベース１４４に格納されるデータの一例を説明するための図である。本実施形態の予測モデルを説明するための図である。情報処理システムの各機器を実現するコンピュータを示す図である。情報処理システムにおいて実行されるシーケンスである。端末の表示部に表示される画面の一例を示す図である。情報処理システムにおいて実行されるシーケンスである。設計支援情報の一例を示す図である。第２実施形態に係る情報処理システムを示すブロック図である。第２実施形態のスコアを説明するための図である。候補ペプチドを説明するための図である。設計支援情報の一例を示す図である。第４実施形態に係る情報処理システムを示すブロック図である。報酬記憶部に格納されているテーブルの一例を示す図である。

以下、図面を参照して本発明の実施形態を詳細に説明する。

［第１実施形態］

＜情報処理システムの構成＞

図１は、第１実施形態に係る情報処理システム１０の構成の一例を示すブロック図である。情報処理システム１０は、機能的には、図１に示されるように、複数の端末１２Ａ，１２Ｂ，１２Ｃと、情報処理装置の一例であるサーバ１４とを備えている。複数の端末１２Ａ，１２Ｂ，１２Ｃとサーバ１４とは、例えば、インターネット等のネットワーク１６を介して接続される。なお、以下では、１つの端末を指し示す場合には、単に、端末１２と称する。なお、図１では、複数の端末１２Ａ，１２Ｂ，１２Ｃが例示されているが、情報処理システム１０は、より多い又はより少ない端末を備えていても良い。

（端末）

複数の端末１２Ａ，１２Ｂ，１２Ｃの各々は、複数の異なるユーザによって操作される。ユーザは、自身が分析したいペプチドを表すペプチド情報を、自身が操作する端末１２へ入力する。そして、ユーザは、そのペプチド情報を後述するサーバ１４へ送信するように端末１２を操作する。端末１２は、ユーザから入力されたペプチド情報を、ネットワーク１６を介してサーバ１４へ送信する。なお、ペプチド情報には、ペプチドの構造式、ペプチドのＳＭＩＬＥＳ表記、ペプチドの一次構造、ペプチドの二次構造、ペプチドの三次構造、及びペプチドの四次構造のうちの少なくとも１つの情報が含まれている。

（サーバ）

サーバ１４は、図１に示されるように、受信部１４０と、共通データベース１４２と、複数のユーザ用データベース１４４Ａ，１４４Ｂ，１４４Ｃと、共通予測モデル記憶部１４５と、複数のユーザ用予測モデル記憶部１４６Ａ，１４６Ｂ，１４６Ｃと、予測部１４８と、処理部１５０と、送信部１５２とを備えている。なお、以下では、１つのユーザ用データベースを指し示す場合には、単に、ユーザ用データベース１４４と称する。また、１つのユーザ用予測モデル記憶部を指し示す場合には、単に、ユーザ用予測モデル記憶部１４６と称する。なお、図１では、複数のユーザ用データベース１４４Ａ，１４４Ｂ，１４４Ｃが例示されているが、サーバ１４は、より多い又はより少ないユーザ用データベースを備えていても良い。また、同様に、図１では、複数のユーザ用予測モデル記憶部１４６Ａ，１４６Ｂ，１４６Ｃが例示されているが、サーバ１４は、より多い又はより少ないユーザ用予測モデル記憶部を備えていても良い。

受信部１４０は、端末１２から送信された、端末を識別するためのユーザＩＤと、ペプチド情報と、後述する予測モデルの選択情報とを含む要求信号を受信する。

共通データベース１４２には、サーバ１４を管理する管理者のデータと、端末１２を操作するユーザのデータとが格納される。図２に、共通データベース１４２に格納されるデータの一例を示す。図２に示されるように、各データにはデータＩＤが付与されている。このデータＩＤは、データを識別するための識別情報である。また、データＩＤは、データが管理者由来であるのかユーザ由来であるのかを識別するための情報でもある。

図２に示されるように、データＩＤ「00001」～「00004」等に対応するデータは管理者由来のデータであり、ペプチド情報と、ペプチド情報の特徴情報と、ペプチドの膜透過性の実験値と、ペプチドの膜透過性の実験値を得た際の実験手法と、ペプチドの体内持続性の実験値と、ペプチドの体内持続性の実験値を得た際の実験手法と、注釈と、後述する予測部１４８により生成された予測情報と、が対応付けられて格納されている。なお、ペプチドの体内持続性の値は、例えば、ペプチドの血漿タンパク質結合率(Plasma Protein Binding)である。注釈は、そのデータがどの様にして得られたのかを表す情報等である。なお、注釈の欄には、当該データの信頼度を表すスコアが格納されていてもよい。データＩＤ「00001」～「00004」等に対応するデータは、サーバ１４の管理者によって予め共通データベース１４２に格納される。

一方、図２に示されるように、データＩＤ「A_00001」、「A_00002」、「B_00001」等に対応するデータはユーザ由来のデータであり、ペプチド情報は対応付けられておらず、ペプチド情報の特徴情報と、ペプチドの膜透過性の実験値と、ペプチドの膜透過性の実験値を得た際の実験手法と、ペプチドの体内持続性の実験値と、ペプチドの体内持続性の実験値を得た際の実験手法と、注釈と、後述する予測部１４８により生成された予測情報と、が対応付けられて格納されている。データＩＤ「A_00001」、「A_00002」、「B_00001」等に対応するデータは、ユーザによる承諾を経て共通データベース１４２に格納される。

複数のユーザ用データベース１４４Ａ，１４４Ｂ，１４４Ｃの各々には、ユーザ由来のデータが格納される。図３に、ユーザ用データベース１４４に格納されるデータの一例を示す。図３に示されるように、ユーザ用データベース１４４には、ペプチド情報と、ペプチドの特徴情報と、ペプチドの膜透過性の実験値と、ペプチドの膜透過性の実験値を得た際の実験手法と、ペプチドの体内持続性の実験値と、ペプチドの体内持続性の実験値を得た際の実験手法と、注釈と、後述する予測部１４８により生成された予測情報と、が対応付けられて格納されている。なお、ユーザ用データベース１４４に格納される各データについては、その一部又は全てが欠損していてもよい。

上述したように、共通データベース１４２にはユーザ由来のデータのうちのペプチド情報は格納されないが、ユーザ用データベース１４４にはペプチド情報が格納される。ペプチド情報は秘匿性が高い情報である。このため、ユーザは、他のユーザ及び管理者のデータも格納される共通データベース１４２に、自らのペプチド情報が格納されることに関しては抵抗があると考えられる。

そこで、本実施形態では、共通データベース１４２とは異なるユーザ用データベース１４４を設け、ユーザ用データベース１４４にのみユーザのペプチド情報を格納する。一方、共通データベース１４２には、ユーザのペプチド情報は格納されない。

なお、ペプチド情報から得られる特徴情報は、ペプチドのさまざまな局所又は全体の構成に注目して、可逆的又は不可逆的な演算処理により計算された多数の数値を集めて構成されるベクトル形式の情報であり、ペプチド情報に比べれば秘匿性は低い。このため、特徴情報に関しては共通データベース１４２に格納してもよいと考えるユーザも存在すると考えられる。

そこで、本実施形態では、特徴情報に関しては共通データベース１４２に格納する。この共通データベース１４２に格納された情報は、ペプチドの膜透過性又は体内持続性を予測するための予測モデルの生成等に用いられる。予測モデルについては後述する。また、共通データベース１４２に格納された情報は、サーバ１４を管理する管理者によって利用可能な情報として取り扱われる。なお、共通データベース１４２に格納された情報は、管理者のみならず、全てのユーザから利用可能な情報としても取り扱われる。なお、共通データベース１４２に格納された情報のうちの一部については、ユーザは利用することができない情報として設定されていてもよい。

共通予測モデル記憶部１４５には、予測モデルが格納される。

複数のユーザ用予測モデル記憶部１４６Ａ，１４６Ｂ，１４６Ｃの各々には、ユーザ用の予測モデルが格納される。

図４に、本実施形態の予測モデルの一例を示す。図４には、予測モデルの一例である、膜透過性予測用学習済みモデルＭ１と、体内持続性予測用学習済みモデルＭ２と、ペプチドの体内動態に関する分子動力学シミュレーションを実施するためのシミュレーションモデルＭ３が示されている。図４に示されるように、ペプチド情報から得られる特徴情報が、膜透過性予測用学習済みモデルＭ１に入力されると、そのペプチドに対応する膜透過性の予測値がモデルから出力される。また、ペプチド情報から得られる特徴情報が、体内持続性予測用学習済みモデルＭ２に入力されると、そのペプチドに対応する体内持続性の予測値がモデルから出力される。また、ペプチド情報がシミュレーションモデルＭ３に入力されると、そのペプチドの体内動態に関する分子動力学シミュレーションのトラジェクトリーデータがシミュレーションモデルＭ３から出力される。なお、シミュレーションモデルＭ３から出力されるデータはトラジェクトリーデータであるが、トラジェクトリーデータ対して統計的分析等を行うことにより、ペプチドの膜透過性又は体内持続性の予測値が算出され、それらの値がシミュレーションモデルＭ３から出力される場合もある。

なお、これらの学習済みモデルは、共通データベース１４２又はユーザ用データベース１４４に格納されているデータの全て又は一部を学習用データとして生成される。具体的には、特徴情報に対応付けられた実験値が教師データとして用いられ、教師あり機械学習によって学習済みモデルが生成される。これらの学習済みモデルは、例えば、ニューラルネットワーク（例えば、深層学習により学習されるディープニューラルネットワークも含む）、及びサポートベクターマシーン等によって実現される。なお、学習済みモデルは、これらのような機械学習モデルに限らず、ロジスティック回帰等の手法によって実現されてもよい。

なお、共通予測モデル記憶部１４５には、共通データベース１４２に格納されているデータを学習用データとして生成された学習済みモデルと、シミュレーションモデルとが予測モデルとして格納される。一方、複数のユーザ用予測モデル記憶部１４６Ａ，１４６Ｂ，１４６Ｃの各々には、ユーザ用データベース１４４に格納されているデータを学習用データとして生成された学習済みモデルと、ユーザ毎に用意されたシミュレーションモデルとが予測モデルとして格納される。

ペプチドの挙動を予測する際、あるユーザＡはある種類のペプチドの挙動を解析したいと考え、別のユーザＢは別の種類のペプチドの挙動を解析したい、と考えることが想定される。また、ユーザ毎に、ユーザ用データベース１４４に格納されるデータは異なるため、予測モデルの最適な構成方法が異なってくることが考えられる。そこで、本実施形態では、ペプチドの体内動態を予測する予測モデルをユーザ毎に用意する。

具体的には、ユーザ用予測モデル記憶部１４６Ａには、ユーザＡ用の予測モデルが格納されている。また、ユーザ用予測モデル記憶部１４６Ｂには、ユーザＢ用の予測モデルが格納されている。ユーザ用予測モデル記憶部１４６Ｃには、ユーザＣ用の予測モデルが格納されている。これにより、ユーザが解析したいペプチドに応じて予測モデルが用意され、ユーザはその予測モデルを利用してペプチドの予測情報を得ることができる。

一方、自らのデータから生成された固有の予測モデルではなく、一般の予測モデルを用いてペプチドの体内動態を予測したいといったユーザの存在も考えられる。このため、本実施形態では、共通予測モデル記憶部１４５に、共通データベース１４２に格納されているデータを学習用データとして生成された学習済みモデルと、標準的なシミュレーションモデルとが格納される。

このため、予測部１４８は、端末１２から送信された要求信号に含まれる予測モデルの選択情報が、ユーザ用予測モデル記憶部１４６に格納されている予測モデルを表している場合には、受信部１４０により受信されたユーザＩＤに基づいて、当該ユーザＩＤに対応するユーザ用予測モデル記憶部１４６から、予測モデルを読み出す。

一方、予測部１４８は、端末１２から送信された要求信号に含まれる予測モデルの選択情報が、共通予測モデル記憶部１４５に格納されている予測モデルを表している場合には、共通予測モデル記憶部１４５から予測モデルを読み出す。

そして、予測部１４８は、受信部１４０により受信されたペプチド情報を既知の手法により特徴情報に変換する。次に、予測部１４８は、ペプチド情報及び特徴情報の少なくとも一方を読み出した予測モデルへ入力することにより、ペプチド情報に対応する予測情報を生成する。

例えば、予測モデルが膜透過性予測用学習済みモデルＭ１である場合には、膜透過性の予測値が予測情報として生成される。予測モデルが体内持続性予測用学習済みモデルＭ２である場合には、体内持続性の予測値が予測情報として生成される。また、予測モデルがシミュレーションモデルＭ３である場合には、予測部１４８は、受信部１４０により受信されたペプチド情報をシミュレーションモデルＭ３へ入力することにより、既知の分子動力学シミュレーション手法によって、体内におけるペプチドの挙動をシミュレーションする。これにより、ペプチドの体内動態に関する予測情報が生成される。

なお、共通予測モデル記憶部１４５及びユーザ用予測モデル記憶部１４６には、同種の予測情報を生成する予測モデルが複数格納されている場合もある。例えば、ユーザ用予測モデル記憶部１４６には、複数の膜透過性予測用学習済みモデルが格納されている場合もある。また、ユーザ用予測モデル記憶部１４６には、複数のシミュレーションモデルが格納されている場合もある。

例えば、ユーザは、あるペプチド情報について、ユーザ用予測モデル記憶部１４６に格納されている自らの膜透過性予測用学習済みモデルＸ及び膜透過性予測用学習済みモデルＹと、共通予測モデル記憶部１４５に格納されている膜透過性予測用学習済みモデルＺ及び膜透過性予測用学習済みモデルＷの各々を用いて、ペプチドの予測情報を生成したいといった場合も想定される。なお、体内持続性予測用学習済みモデル及びシミュレーションモデルについても同様のことが想定される。

このような場合、ユーザは、上記の同種の複数の予測モデルを用いて、１つのペプチド情報に対して複数の予測情報を生成することも可能である。この場合には、例えば、ユーザは、同種の複数の予測モデルによって生成された予測情報の各々を確認し、どの予測情報が妥当であるのかといった検討も可能である。または、ユーザは、同種の複数の予測モデルによって生成された予測情報の各々を平均するなどして、妥当な予測情報を得ることも可能である。なお、この場合には、予測対象のペプチド情報から特徴情報を生成する処理は一度でよく、生成された特徴情報を複数の予測モデルへ入力することにより、複数の予測情報が生成される。

なお、共通予測モデル記憶部１４５には、予測情報を生成する際の各種パラメータも格納されている。これらの各種パラメータは、予測モデルを用いて予測情報を生成する際に用いられる。また、複数のユーザ用予測モデル記憶部１４６Ａ，１４６Ｂ，１４６Ｃの各々にも、予測情報を生成する際の各種パラメータが格納されており、これらの各種パラメータはユーザ毎に異なるものとなる。予測情報を生成する際の各種パラメータがユーザ毎に異なることにより、ユーザの要望に応じた適切な予測情報を生成することができる。なお、共通予測モデル記憶部１４５又はユーザ用予測モデル記憶部１４６には、同種の各種パラメータが複数格納されている場合もある。ユーザは、ペプチドの予測情報を得る際に、これらの各種パラメータから適切と思われるパラメータを適宜選択して、サーバ１４にペプチドの予測情報を生成させる。

処理部１５０は、受信部１４０により受信されたペプチド情報と、予測部１４８により得られた特徴情報と予測情報とを対応付けて、ユーザＩＤに対応するユーザ用データベース１４４へ格納する。

送信部１５２は、予測部１４８により生成された予測情報を、受信部１４０により受信したユーザＩＤに対応する端末１２へ送信する。

端末１２は、サーバ１４から送信された予測情報を受信し、その予測情報を表示部（図示省略）へ表示させる。

端末１２及びサーバ１４は、例えば、図５に示すようなコンピュータ５０によって実現することができる。端末１２及びサーバ１４を実現するコンピュータ５０は、ＣＰＵ５１、一時記憶領域としてのメモリ５２、及び不揮発性の記憶部５３を備える。また、コンピュータは、入出力装置等（図示省略）が接続される入出力interface（Ｉ／Ｆ）５４、及び記録媒体５９に対するデータの読み込み及び書き込みを制御するread/write（Ｒ／Ｗ）部５５を備える。また、コンピュータは、インターネット等のネットワークに接続されるネットワークＩ／Ｆ５６を備える。ＣＰＵ５１、メモリ５２、記憶部５３、入出力Ｉ／Ｆ５４、Ｒ／Ｗ部５５、及びネットワークＩ／Ｆ５６は、バス５７を介して互いに接続される。

記憶部５３は、Hard Disk Drive（ＨＤＤ）、Solid State Drive（ＳＳＤ）、フラッシュメモリ等によって実現できる。記憶媒体としての記憶部５３には、コンピュータを機能させるためのプログラムが記憶されている。ＣＰＵ５１は、プログラムを記憶部５３から読み出してメモリ５２に展開し、プログラムが有するプロセスを順次実行する。

次に、実施形態の情報処理システム１０の作用について説明する。

端末１２を操作するユーザが、予測対象のペプチド情報を端末１２に入力し、そのペプチド情報をサーバ１４へ送信するような操作を実行すると、図６に示されるようなシーケンスが実行される。具体的には、端末１２を操作するユーザが、予測対象のペプチド情報を端末１２に入力し、そのペプチド情報をサーバ１４へ送信するとともに、ペプチドの挙動を学習済みモデルによって予測する旨の指示信号をサーバ１４へ送信した場合には、図６に示されるようなシーケンスが実行される。なお、図６のシーケンスでは、１つの予測モデルが選択され当該予測モデルによって予測情報が生成される場合を例に説明する。なお、前述したように複数の予測モデルの各々によって予測情報が生成される場合もある。この場合には、複数の予測モデルを指定する情報が、後述する予測モデルの選択情報に含まれる。

ステップＳ１００において、端末１２は、ユーザによって入力されたペプチド情報と自身のユーザＩＤとを含む要求信号をサーバ１４へ送信する。なお、要求信号には、ユーザ用予測モデル記憶部１４６に格納されているユーザ自らの予測モデルを用いて予測情報を生成するのか、又は、共通予測モデル記憶部１４５に格納されている予測モデルを用いて予測情報を生成するのかを表す予測モデルの選択情報も含まれている。

ステップＳ１０２において、サーバ１４の受信部１４０は、上記ステップＳ１００で端末１２から送信された要求信号を受信する。

ステップＳ１０４において、サーバ１４の予測部１４８は、上記ステップＳ１０２で受信した要求信号に含まれるユーザＩＤから、端末１２のユーザを特定する。

ステップＳ１０６において、サーバ１４の予測部１４８は、上記ステップＳ１０２で受信した要求信号に含まれる予測モデルの選択情報に基づいて、予測情報の生成に用いる予測モデルが何れであるのかを判定する。選択情報がユーザ自らの予測モデルを利用することを表している場合には、サーバ１４の予測部１４８は、ユーザＩＤに対応するユーザ用予測モデル記憶部１４６から予測モデルを読み出す。一方、選択情報が共通予測モデル記憶部１４５の予測モデルを利用することを表している場合には、サーバ１４の予測部１４８は、共通予測モデル記憶部１４５から予測モデルを読み出す。

ステップＳ１０８において、サーバ１４の予測部１４８は、上記ステップＳ１０２で受信した要求信号に含まれるペプチド情報を特徴情報へ変換する。

ステップＳ１１０において、サーバ１４の予測部１４８は、上記ステップＳ１０６で読み出した予測モデルに対して、上記ステップＳ１０８で得られた特徴情報を入力することにより、ペプチドの予測情報を生成する。

ステップＳ１１２において、サーバ１４の送信部１５２は、上記ステップＳ１１０で得られた予測情報を端末１２へ送信する。なお、送信部１５２は、上記ステップＳ１１０で得られた予測情報と、予測対象のペプチド情報（例えば、ペプチドの構造式等）とを対応付けて、端末１２へ送信するようにしてもよい。

ステップＳ１１４において、端末１２は上記ステップＳ１１２で送信された予測情報を受信する。

ステップＳ１１６において、端末１２は、上記ステップＳ１１４で受信した予測情報を表示部（図示省略）に表示させる。

この場合には、図７に示されるように、端末１２の表示部（図示省略）には、ペプチドの構造式を表す情報、ペプチドのＳＭＩＬＥＳ表記、及び予測情報が表示される。図７は、ペプチドの予測情報と、予測対象であるペプチドの構造式とが対応付けられた情報の一例である。

なお、予測対象のペプチドが１つではなく複数あってもよい。この場合には、複数のペプチドの各々について、ペプチド情報（例えば、ペプチドの構造式を表す情報）、ペプチドのＳＭＩＬＥＳ表記、及び予測情報が端末１２の表示部（図示省略）に表示される。なお、この場合には、上記ステップＳ１０６～ステップＳ１１０の処理が複数のペプチド情報の各々について繰り返され、複数のペプチド情報の各々についての予測情報が端末１２の表示部（図示省略）に表示される。また、上記ステップＳ１０６で読み出される予測モデルが複数である場合には、一つのペプチド情報について複数の予測モデルにより予測情報が生成される。

これにより、ユーザは自らの端末１２を操作するのみで、ペプチドの体内動態に関する予測情報を得ることができる。

ステップＳ１１８において、サーバ１４の処理部１５０は、上記ステップＳ１０２で受信した要求信号に含まれるペプチド情報と、上記ステップＳ１０８で得られた特徴情報と、上記ステップＳ１１０で生成された予測情報とを対応付けて、ユーザＩＤに対応するユーザ用データベース１４４へ格納する。

ステップＳ１２０において、サーバ１４の処理部１５０は、上記ステップＳ１０８で得られた特徴情報と上記ステップＳ１１０で生成された予測情報とを共通データベース１４２に格納する。

なお、端末１２を操作するユーザが、予測対象のペプチド情報を端末１２に入力し、そのペプチド情報をサーバ１４へ送信するとともに、ペプチドの挙動を分子動力学シミュレーションによって予測する旨の指示信号をサーバ１４へ送信した場合には、図８に示されるようなシーケンスが実行される。

図８に示すステップＳ１００～ステップＳ１０６は、図６と同様に実行される。

ステップＳ２１０において、サーバ１４の予測部１４８は、ステップＳ１０２で受信されたペプチド情報を、予測モデルとしてのシミュレーションモデルへ入力することにより、既知の分子動力学シミュレーション手法によって、体内におけるペプチドの挙動をシミュレーションする。これにより、ペプチドの体内動態に関する予測情報が生成される。

ステップＳ２１２において、サーバ１４の予測部１４８は、上記ステップＳ２１０で生成された予測情報を端末１２へ送信する。

ステップＳ２１４において、端末１２は、上記ステップＳ２１２でサーバ１４から送信された予測情報を受信する。

ステップＳ２１６において、端末１２は、上記ステップＳ２１４で受信した予測情報を表示部（図示省略）へ表示させる。

ステップＳ２１８において、サーバ１４の処理部１５０は、上記ステップＳ１０２で受信した要求信号に含まれるペプチド情報と、上記ステップＳ２１０で生成された予測情報とを対応付けて、ユーザＩＤに対応するユーザ用データベース１４４へ格納する。

なお、この場合のペプチドの予測情報は、例えば、ペプチド分子の運動を時系列的に模擬したトラジェクトリーデータ及びトラジェクトリーデータに対して統計的分析等を行うことにより得られた膜透過性又は体内持続性の予測値等の少なくとも一つの情報である。なお、このトラジェクトリーデータに基づき、ペプチドの膜透過性又は体内持続性等に関わる挙動が動画像によって可視化されてもよい。

以上詳細に説明したように、情報処理システムのサーバは、端末から送信された要求信号に応答して、ペプチドの体内動態に関する予測情報を生成する。そして、サーバは、予測情報を端末へ送信する。これにより、ペプチドの体内動態を予測することができる。

なお、本開示は、上述した実施形態に限定されるものではなく、この開示の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

例えば、上記実施形態のサーバ１４は、ペプチドの体内動態の予測情報として、膜透過性及び体内持続性を予測する場合を例に説明したが、これに限定されるものではない。ペプチドの体内動態であれば、どのようなものであってもよい。例えば、ペプチドの体内動態として、血液脳関門(Blood-Brain Barrier)透過性又は体内環境におけるペプチドの溶解度等の物性パラメータを予測するようにしてもよい。

また、上記実施形態のサーバ１４は、ペプチドの予測情報のみを生成する場合を例に説明したが、これに限定されるものではない。例えば、サーバ１４は、ペプチドの体内動態を改良する目的で、ペプチドを構成する要素のうちの変更箇所の候補を表す設計支援情報を生成する設計支援部を更に備えるようにしてもよい。例えば、ペプチドを構成する要素としてはペプチドの残基が挙げられる。この場合には、サーバ１４は、例えば、変更箇所の候補Ｒを含む設計支援情報Ｓを生成する。そして、端末１２の表示部には、図９に示されるような設計支援情報Ｓが表示される。これにより、ユーザのペプチドの設計が支援される。なお、サーバ１４は、ペプチドの予測情報に代えてペプチドの設計支援情報のみを生成し、設計支援情報を端末１２へ送信するようにしてもよい。

また、上記実施形態では、特徴情報及び予測情報が共通データベース１４２に格納され、ペプチド情報、特徴情報、及び予測情報がユーザ用データベース１４４に格納される場合を例に説明したが、これらに関しては種々の変形例が想定される。

例えば、上記実施形態では、ユーザが予測対象としてサーバ１４へ送信したペプチド情報の特徴情報及び予測情報は、共通データベース１４２に全て格納される場合を例に説明したが、これに限定されるものではない。

例えば、サーバ１４は、ペプチド情報の特徴情報及び予測情報のうちユーザの承諾が得られた特徴情報及び予測情報のみを共通データベース１４２に格納するようにしてもよい。この場合には、サーバ１４は、例えば、図６のステップＳ１２０において特徴情報及び予測情報を共通データベース１４２に格納する際に、端末１２に対して特徴情報を共通データベース１４２に格納して良いか否かを表す確認信号を出力する。端末１２は、サーバ１４から送信された確認信号を受信すると、自らの表示部（図示省略）に、予測対象のペプチド情報の特徴情報を共通データベース１４２に格納しても良いか否かの確認を取る画面を表示させる。なお、この際には、例えば、ユーザが共通データベース１４２に特徴情報を格納することに同意した場合には、その特徴情報又は予測情報は他のユーザのペプチドの予測情報の生成の際にも用いられ、当該ユーザに対しては特徴情報又は予測情報の提供に対する報酬としてポイント等が付与される旨の表示が端末１２の表示部（図示省略）に表示される。そして、例えば、ユーザが、特徴情報又は予測情報を共通データベース１４２に格納しても良い旨の操作を端末１２に対して入力した場合には、端末１２は、その旨の指示信号をサーバ１４へ送信する。一方、ユーザが、特徴情報又は特徴情報を共通データベース１４２に格納することには同意しない旨の操作を端末１２に対して入力した場合には、端末１２は、その旨の指示信号をサーバ１４へ送信する。

サーバ１４は、端末１２から送信された指示信号に応じて、特徴情報又は予測情報を共通データベース１４２に格納するか否かを判定する。そして、サーバ１４は、端末１２から送信された指示信号が、共通データベース１４２への特徴情報又は予測情報の格納に同意する旨を表す場合には、当該特徴情報又は当該予測情報を共通データベース１４２に格納する。一方、サーバ１４は、端末１２から送信された指示信号が、共通データベース１４２への特徴情報又は予測情報の格納に同意しない旨を表す場合には、特徴情報又は予測情報を共通データベース１４２に格納せずに処理を終了する。このように、ユーザの意向に応じてデータを登録することにより、ユーザはサーバ１４の利用がしやすくなる。なお、前述したように、ユーザから特徴情報又は予測情報が提供され、特徴情報又は予測情報が共通データベース１４２へ格納された場合には、ユーザに対してポイントが付与される。ユーザに対して付与されたポイントは、例えば、サーバ１４を利用する際の利用料の割引等に用いられる。

また、ユーザはペプチドの予測情報を得た後に、そのペプチドが体内において実際にどのような挙動を示すのかを検証するために実験を行う場合がある。ユーザは、その実験値を確認するとともに、サーバ１４のユーザ用データベース１４４及び共通データベース１４２に格納することも可能である。この場合、ユーザが、上記の特徴情報及び予測情報の場合と同様に、実験値と実験手法の情報とを共通データベース１４２に格納することに同意し、ユーザによる実験によって得られた各種情報が共通データベース１４２に格納された場合には当該ユーザに対しては実験によって得られた各種情報の提供に対する報酬としてポイント等が付与される。これにより、ユーザの実験によって得られた実験値は、他のユーザ又はサーバ１４の管理者による利用が可能な情報となり、例えば、ユーザ又は管理者が予測モデルを機械学習させる際の教師データとして活用が可能となる。例えば、図２に示されている、c2_A、d2_A、e2_A、及びf2_Aは、ユーザから提供された実験情報の一例であり、このように実験情報が共通データベース１４２に格納された場合には、ユーザに対してポイントが付与される。

なお、サーバ１４の各種の記憶部にデータを格納する際には、ユーザは、サーバ１４には一切データを格納しない、ユーザ用データベース１４４にのみデータを格納する、又は共通データベース１４２にもデータを格納する、といった何れかの形態を選択可能である。

また、ユーザに対してポイントが付与される際には、サーバ１４の管理者は、ユーザの行動履歴又は図２の注釈等に格納される信頼度等に基づき、ユーザに対してポイントを付与するようにしてもよい。なお、注釈等に格納される信頼度は、ユーザが提供したデータ自体の信頼度及びユーザに対する信頼度の何れであってもよい。この場合には、例えば、高品質なデータを提供してくれるユーザ又は信頼度が高いユーザに対しては多くのポイントが付与される。

また、上記実施形態では、複数のユーザ用予測モデル記憶部１４６Ａ，１４６Ｂ，１４６Ｃの各々に格納されている学習済みモデルは、ユーザ用データベース１４４に格納されているデータのみを学習用データとして生成された学習済みモデルである場合を例に説明したが、これに限定されるものではない。例えば、複数のユーザ用予測モデル記憶部１４６Ａ，１４６Ｂ，１４６Ｃの各々に格納されている学習済みモデルは、ユーザ用データベース１４４に格納されているデータに加えて、共通データベース１４２に格納されているデータを学習用データとして生成されていてもよい。具体的には、ユーザ用データベース１４４に格納されているデータに加えて、共通データベース１４２に格納されているデータの一部又は全部を学習用データとして学習済みモデルを生成するようにしてもよい。これにより、予測精度の高い学習済みモデルが生成される。なお、この場合には、ユーザ用データベース１４４又は共通データベース１４２には、学習用データとしての各種データが予め登録される。

また、ユーザは上記のような各種データをサーバ１４の共通データベース１４２に格納することにより自らのデータを提供するのみではなく、自らが作成した予測モデルをサーバ１４に提供するようにしてもよい。この場合には、上記と同様に、予測モデルの提供に際しては当該ユーザに対してポイントが付与される。

また、共通データベース１４２又はユーザ用データベース１４４に格納されているデータは、端末１２へダウンロード可能となっていても良い。また、共通データベース１４２又はユーザ用データベース１４４に格納されているデータは、端末１２により編集可能な状態となっていてもよい。なお、この場合には、端末１２から編集可能なデータは制限がかけられていてもよい。例えば、共通データベース１４２に格納されているデータに関しては、端末１２からは編集ができないように構成されていてもよい。また、端末１２又はサーバ１４は、共通データベース１４２又はユーザ用データベース１４４に格納されているデータを用いて、ペプチドの体内動態に関する各種の情報を生成するようにしてもよい。例えば、端末１２又はサーバ１４は、ペプチドの特徴量（例えば、脂溶性）を横軸にとり、膜透過性を縦軸にとったグラフを生成するなどして、ペプチドの体内動態に関する各種の情報を生成するようにしてもよい。

また、上記実施形態では、サーバ１４の予測部１４８が、端末１２から送信された要求信号に含まれるペプチド情報を特徴情報へ変換する場合を例に説明したが、これに限定されるものではない。例えば、端末１２から送信される要求信号には特徴情報が含まれていてもよい。

サーバ１４により提供されるサービスを利用するユーザの中には、サーバ１４に対してペプチドの構造式等のペプチド情報を送信することに躊躇するユーザも存在することが想定される。このため、例えば、ユーザが操作する端末１２又はサーバ１４とは異なるコンピュータによって、ペプチド情報から特徴情報への変換を予め実行し、要求信号にその特徴情報を含ませるようにしてもよい。この場合には、端末１２は、ペプチド情報から変換された特徴情報を含む要求信号をサーバ１４へ送信する。サーバ１４の受信部１４０は、端末１２から送信された要求信号を受信する。サーバ１４の予測部１４８は、要求信号に含まれる特徴情報を予測モデルに対して入力することにより、ペプチドの予測情報を生成する。そして、サーバ１４の送信部１５２は、得られた予測情報を端末１２へ送信する。これにより、ユーザは、ペプチドの構造式等であるペプチド情報をサーバ１４へ送信することなく、ペプチドの予測情報を得ることができる。ただし、この場合には、予測モデルをシミュレーションモデルとする選択は不可となる。シミュレーションモデルによる予測には、ペプチドの構造式等のペプチド情報が必要となるためである。なお、この場合には、例えば、サーバ１４又はサーバ１４とは異なるコンピュータによって利用される、ペプチド情報から特徴情報への変換プログラム等を、端末１２又はサーバ１４とは異なるコンピュータに予め提供しておく等の対応が想定される。

［第２実施形態］

次に、第２実施形態について説明する。第２実施形態の情報処理システムは、ユーザによるペプチドの設計を支援する。なお、第２実施形態では、第１実施形態をより具体化させた内容について説明する。なお、第２実施形態に係る情報処理システムの構成のうちの第１実施形態の情報処理システムと同様の部分は、同一符号を付して説明を省略する。

ユーザがペプチドを設計する場合、所望の膜透過性又は体内持続性を持つペプチドの構成を知りたい場合がある。この点、ペプチドの構成のうちどの部分を変更すれば、より好ましい膜透過性又は体内持続性を持つペプチドとなるのかといった情報は、ペプチドを設計するユーザにとっては有用な情報である。

そこで、第２実施形態の情報処理システムは、ペプチドを構成する複数の残基のうち予測情報に特に影響を与えている残基を特定し、その残基を交換候補の残基としてユーザに対して提示する。これにより、より好ましい膜透過性又は体内持続性を有するペプチドの探索を支援することができる。また、ユーザに対してペプチドの設計に関するナビゲーションサービスを提供することができる。

図１０は、第２実施形態に係る情報処理システム２１０の構成の一例を示すブロック図である。第２実施形態の情報処理システム２１０のサーバ２１４は、図１０に示されるように、設計支援部２５４を更に備えている。設計支援部２５４は、ユーザによるペプチドの設計を支援する情報を端末１２へ送信する。以下、具体的に説明する。

なお、第２実施形態の情報処理システム２１０のサーバ２１４の予測部１４８は、第１実施形態と同様に、ニューラルネットワーク等の学習済みモデルによってペプチドの予測情報を生成する。また、情報処理装置２１０の予測部１４８は、第１実施形態と同様に、予測対象のペプチドのペプチド情報から特徴情報として特徴ベクトルｘを抽出し、その特徴ベクトルｘを学習済みモデルへ入力することにより予測情報を生成する。

なお、特徴ベクトルｘは、ペプチドが有する複数の残基の各々から得られる。例えば、特徴ベクトルｘ＝［ｘ_１１，ｘ_１２，・・・，ｘ_２１，ｘ_２２，・・・，ｘ_Ｎ１，ｘ_Ｎ２，・・・］のうちの、［ｘ_１１，ｘ_１２，・・・］はペプチドに含まれる１番目の残基から得られるベクトルであり、［ｘ_２１，ｘ_２２，・・・］はペプチドに含まれる２番目の残基から得られるベクトルであり、［ｘ_Ｎ１，ｘ_Ｎ２，・・・］はペプチドに含まれるＮ番目の残基から得られるベクトルである。

まず、設計支援部２５４は、ペプチドを構成する複数の残基の各々について、ペプチドの予測情報を生成するための学習済みモデルのパラメータを、例えば既知の技術を用いて解析することにより、当該残基が予測情報に影響を与えている度合いを表すスコア（以下、単に「残基影響度スコア」とも称する。）を計算する。

具体的には、まず、設計支援部２５４は、学習済みモデルに入力される特徴ベクトルｘのうちの各要素ｘ_ｉｊについて、学習済みモデルから出力される予測情報が表す値ｙを要素ｘ_ｉｊによって偏微分することにより得られる微分値を計算する。なお、予測情報が表す値ｙの要素ｘ_ｉｊによる偏微分は次式によって表される。

この微分値は、学習済みモデルのパラメータを解析することにより得られる。また、以下の微分値

の絶対値を、ｉ番目の残基の各特徴量が予測情報に影響を与えている度合いを表すスコア（以下、単に「特徴量影響度スコア」とも称する。）とする。設計支援部２５４は、この特徴量影響度スコアを特徴ベクトルｘのうちの各要素ｘ_ｉｊについて計算する。

図１１に、本実施形態の特徴量影響度スコアを説明するための図を示す。図１１は、他分野においてはサリエンシーマップとも称される。

図１１に示されるマップでは、横軸の「１，２，・・・」が残基のＩＤを表し、縦軸の「ｘ_ｉｊ」が特徴ベクトルｘに含まれる特徴量の種類を表す。また、マップの濃淡は、特徴ベクトルｘの各要素ｘ_ｉｊが予測に影響を与えている度合いを表す特徴量影響度スコアに相当し、マップの濃淡が濃いほど特徴量影響度スコアが高いことが表されている。

図１１の例では、例えば、ＩＤ＝７である残基の特徴ベクトルの要素ｘ_７１の特徴量影響度スコアが高い。このため、ＩＤ＝７である残基を別の残基等に交換すれば、予測情報が大きく変化するものと予想される。なお、このとき、特徴量影響度スコアに対応する微分値の正負を確認することにより、この残基が存在することによる影響の方向を示すことも可能である。

次に、例えば、設計支援部２５４は、複数の残基の各々について、特徴ベクトルｘの各要素に対して計算された特徴量影響度スコアの総和を計算するなどして、当該残基の残基影響度スコアを計算する。そして、設計支援部２５４は、複数の残基の各々に対して計算された当該残基の残基影響度スコアのうち所定閾値以上の残基影響度スコアの残基を特定する。

なお、特徴量影響度スコアから残基影響度スコアを計算する方法は、上記の手法に限定されるものではなく、例えば、特徴ベクトルｘの各要素に対して計算された特徴量影響度スコアの重み付き平均、最大値、又は最小値等を残基影響度スコアとしてもよい。

次に、設計支援部２５４は、ペプチドの構造のうち、特定された残基を交換候補の残基として設定し、交換候補の残基を変更箇所の候補とする。

例えば、設計支援部２５４は、残基影響度スコアが所定閾値以上である残基を変更箇所の候補として設定する。そして、設計支援部２５４は、交換候補の残基を提案する設計支援情報を生成する。

第２実施形態のサーバ２１４の送信部１５２は、設計支援部２５４により生成された設計支援情報を端末１２へ送信する。なお、送信部１５２は、上記図１１に示されるようなマップを設計支援情報として端末１２へ送信するようにしてもよい。

なお、第２実施形態の情報処理システム２１０の他の構成及び作用については、第１実施形態と同様であるため、説明を省略する。

以上説明したように、第２実施形態の情報処理システムのサーバは、ペプチドを構成する複数の残基の各々について、予測情報を生成するための学習済みモデルのパラメータを解析することにより、当該残基が予測情報に影響を与えている度合いを表す残基影響度スコアを計算する。サーバは、複数の残基の各々に対して計算された残基影響度スコアのうち所定閾値以上の残基影響度スコアの残基を特定し、ペプチドの構造のうち、特定された残基を交換候補の残基として設定し、交換候補の残基を変更箇所の候補とする。また、サーバは、変更箇所の候補を提案する設計支援情報を端末へ送信する。端末は、サーバから送信された設計支援情報を表示部（図示省略）に表示させる。これにより、ユーザは、ペプチドを構成する残基のうち何れの残基をどのように変更すれば良いのかに関する手掛かりを得ることができる。また、ユーザによるペプチドの設計を支援することができる。

なお、第２実施形態のサーバは、複数の残基の各々に対して計算された残基影響度スコアのうち所定閾値未満の残基影響度スコアの残基を特定し、その情報をユーザに対して提示するようにしてもよい。この場合には、変更しても膜透過性又は体内持続性にあまり影響しない残基が特定されうるため、ユーザは、ペプチドを構成する残基のうち何れの残基を変更すれば良いのかに関する手掛かりを得ることができる。

［第３実施形態］

次に、第３実施形態について説明する。第３実施形態の情報処理システムは、ペプチドを構成する複数の残基のうちの少なくとも１つの残基を予め定めた別の残基に置換した候補ペプチドを複数生成し、複数の候補ペプチドの各々の予測情報を生成することにより、予測情報に影響を与えている残基を特定し、具体的に残基交換を提案する点が、第１及び第２実施形態と異なる。なお、第３実施形態に係る情報処理システムの構成は、第２実施形態の情報処理システムと同様の構成であるため、同一符号を付して説明を省略する。

第３実施形態のサーバ２１４の設計支援部２５４は、ペプチドを構成する複数の残基のうちの少なくとも１つの残基を、アラニンなどの予め定めた別の残基に置換した候補ペプチドを生成する。

図１２に、候補ペプチドを説明するための図を示す。図１２は、あるペプチドＳ１のうちの残基Ｒｅ１を別の残基へ置換する場合の例が示されている。例えば、設計支援部２５４は、図１２のペプチドＳ１のうちの残基Ｒｅ１を別の残基Ｒｅ２（例えば、グリシン）へ置換することにより、候補ペプチドＳ２を生成する。また、設計支援部２５４は、図１２のペプチドＳ１のうちの残基Ｒｅ１を別の残基Ｒｅ３（例えば、アラニン）へ置換することにより、候補ペプチドＳ３を生成する。なお、別の残基は、例えば、バリン、ロイシン、アルギニン、若しくはアスパラギン酸等の天然アミノ酸、又は任意の人工アミノ酸等であってもよい。

そして、第３実施形態の予測部１４８は、第１実施形態と同様の手法を用いて、残基を置換する前のペプチドの予測情報と、複数の候補ペプチドの各々の予測情報を生成する。

次に、設計支援部２５４は、複数の候補ペプチドの各々について、候補ペプチドの予測情報と、残基を置換する前のペプチドの予測情報との差分を計算する。そして、設計支援部２５４は、差分が所定閾値以上である候補ペプチドを特定し、特定した候補ペプチドのうちの置換後の残基の箇所を特定する。

残基を置換する前のペプチドの予測情報と、候補ペプチドの予測情報との間の差分が大きい場合、置換前の残基及び置換後の残基の少なくとも一方は予測情報に対して大きな影響を与える残基であることになる。このため、設計支援部２５４は、差分が大きい候補ペプチドのうちの置換後の残基の箇所を特定し、残基を置換する前のペプチドにおいて当該箇所に存在していた残基を特定する。

そして、設計支援部２５４は、ペプチドの構造を表すペプチド構造情報のうち、特定された箇所の残基を交換候補の残基として設定し、交換候補の残基を変更箇所の候補とする。そして、設計支援部２５４は、交換候補の残基を別の残基へ交換することを提案する設計支援情報を生成する。

図１３に、設計支援情報の一例を示す。図１３に示されるように、例えば、設計支援情報には、残基を変更する前のペプチド情報（例えば、ペプチドの構造式）、交換候補の残基を表す情報（図中では点線部分が交換候補の残基を表す）、及びペプチドの予測情報が含まれうる。また、例えば、設計支援情報には、残基を交換した後の候補ペプチドのペプチド情報（例えば、ペプチドの構造式）、候補ペプチドの予測情報、及び候補ペプチドに新たに組み込まれた残基の情報（例えば、残基の構造式）が含まれうる。なお、設計支援情報には、交換候補の残基を複数の異なる別の残基へ置換し、交換候補の残基が置換された際の予測情報の変化（または、変化の重み付き平均）を含んでいてもよい。

第３実施形態のサーバ２１４の送信部１５２は、設計支援部２５４により生成された設計支援情報を端末１２へ送信する。

なお、第３実施形態の情報処理システム２１０の他の構成及び作用については、第１又は第２実施形態と同様であるため、説明を省略する。

以上説明したように、第３実施形態の情報処理システムのサーバは、ペプチドを構成する複数の残基のうちの少なくとも１つの残基を予め定めた別の残基に置換した候補ペプチドを複数生成し、残基を置換する前のペプチドの予測情報と、複数の候補ペプチドの各々の予測情報とを生成する。次に、サーバは、複数の候補ペプチドの各々について、残基を置換する前のペプチドの予測情報と、候補ペプチドの予測情報との間の差分を計算し、差分が所定閾値以上である候補ペプチドを特定し、特定した候補ペプチドのうちの置換後の残基の箇所を特定する。そして、サーバは、ペプチドの構造のうち、特定された箇所の残基を交換候補の残基として設定し、交換候補の残基を変更箇所の候補とする。これにより、ユーザは、ペプチドを構成する残基のうち何れの残基を変更すれば良いのかに関する手掛かりを得ることができる。また、ユーザによるペプチドの設計を支援することができる。

［第４実施形態］

次に、第４実施形態について説明する。第４実施形態の情報処理システムは、ユーザから所定のデータが提供された場合に、当該ユーザに対して報酬を表すポイントを付与する点が、第１～第３実施形態と異なる。なお、第４実施形態に係る情報処理システムの構成は、第１実施形態の情報処理システムと同様の構成であるため、同一符号を付して説明を省略する。

ペプチドの体内動態に関する予測情報を精度良く生成するためには、多くのデータが必要となる。例えば、あるペプチドの体内動態に関する所定の実験により得られた膜透過性又は体内持続性を表す実験データは、他のペプチドの体内動態を予測するための有用なデータとなり得る。

そこで、第４実施形態の情報処理システムは、ユーザから所定のデータが提供された場合に、当該ユーザに対して報酬を表すポイントを付与する。このポイントは、例えば、本情報処理システムを用いて提供されるサービスの利用料の割引等に利用される。

図１４は、第４実施形態に係る情報処理システム４１０の構成の一例を示すブロック図である。第４実施形態の情報処理システム４１０のサーバ４１４は、図１４に示されるように、報酬付与部４５６と、報酬記憶部４５８とを更に備えている。

報酬付与部４５６は、ユーザから提供されたデータを、共通データベース１４２又は共通予測モデル記憶部１４５へ格納する。例えば、報酬付与部４５６は、端末１２から送信された、ペプチドの予測情報の教師データである、ペプチドの体内動態に関する実験データ、実験データを得た際の実験手法を表す情報、ユーザ用予測モデル記憶部１４６に保存された予測モデル、ユーザが自らの端末で利用している予測モデル（例えば、ユーザが自らの端末で独自に生成した予測モデル又はユーザが外部から持ち込んできた予測モデル等）、及びユーザにより生成されたペプチドの体内動態に関する予測情報の少なくとも１つのデータを受け付ける。そして、報酬付与部４５６は、受け付けたデータを、情報処理装置４１４が管理する記憶部の一例である共通データベース１４２又は共通予測モデル記憶部１４５に格納する。

なお、実験データは、既知の実験手法により得られる予測対象のペプチドの体内動態に関するデータである。この実験データは、例えば、学習済みモデルの生成の際に教師データとして用いられる。また、実験データを得た際の実験手法を表す情報に関しては、どの実験手法を用いたかによって実験データの信頼性は異なるものとなるため、有用な情報である。また、ユーザが独自に生成した学習済みモデル等の予測モデルが提供されれば、その予測モデルを基に新たな予測モデルを生成することも可能であるため、同様に有用である。また、ユーザが独自に生成したペプチドの予測情報も同様に有用である。

そのため、報酬付与部４５６は、データが送信された端末１２に付与されているユーザＩＤに対して、当該データの提供に対する報酬を表すポイントを付与する。

例えば、報酬付与部４５６は、報酬記憶部４５８に格納されている、ユーザＩＤと当該ユーザＩＤに付与されているポイントとが対応付けられているテーブルを更新することにより、ユーザＩＤに対してポイントを付与する。

図１５は、報酬記憶部４５８に格納されているテーブルの一例である。図１５に示される例では、ユーザＩＤ「USER_01」と当該ユーザＩＤに付与されているポイント「P_USER_01」が示されている。報酬付与部４５６は、ユーザＩＤ「USER_01」に対応する端末１２からデータの提供を受け付けた場合には、ユーザＩＤ「USER_01」に付与されているポイント「P_USER_01」に所定のポイントを加算することにより、報酬記憶部４５８に格納されているテーブルを更新する。なお、データ提供に対してどの程度のポイントが付与されるのかに関してのルールは予め設定されている。例えば、報酬付与部４５６は、提供されるデータの種類（例えば、提供されるデータは、実験値を表すデータ、予測モデルを表すデータ、及び予測情報を表すデータの何れであるか）、データの量、データの履歴情報（例えば、提供されるデータが膜透過性の実験値を表すデータである場合、そのデータはPAMPA試験、Caco2細胞、MDCK細胞、及びLLC-PK1細胞等のうちどの手段で得られたものであるかといった履歴情報）、データのカテゴリ（例えば、提供されるデータは、環状ペプチドに関するデータ及び低分子に関するデータの何れであるかといった属性）、及びデータが提供されたユーザの信頼度等に応じて、ユーザに対してポイントが付与される。なお、ユーザの信頼度は、人手によって設定することも可能であるし、サーバ４１４のようなコンピュータによって設定することも可能である。例えば、サーバ４１４の報酬付与部４５６は、情報処理システム４１０が提供しているサービスの利用頻度及び利用履歴等に応じて、ユーザの信頼度を決定する。例えば、報酬付与部４５６は、利用頻度が高いユーザほど信頼度が高くなるように設定する。または、報酬付与部４５６は、利用履歴に応じて利用年数が長いユーザほど信頼度が高くなるように設定する。また、ユーザからデータの提供を受けた際のポイントについては、例えば、報酬付与部４５６は、提供されたデータを予測モデルへ反映させた場合の性能向上への貢献度合いの推定値を計算し、当該推定値に基づいて、ユーザに付与するポイントを変化させてもよい。例えば、報酬付与部４５６は、ユーザから提供されたデータとサーバ４１４が既に保持しているデータとの間の類似度を計算し、類似度が低いデータを提供したユーザに対しては高いポイントを付与するようにしてもよい。これにより、サーバ４１４が保持していないデータの提供が促される。また、例えば、報酬付与部４５６は、ペプチドの予測に悪影響があると思われるデータの提供がされた場合には、ポイントを付与しないようにしてもよい。

このように、データの提供に対するインセンティブをユーザに対して与えることにより、サーバ４１４の共通データベース１４２又は共通予測モデル記憶部１４５には、より多くのデータが格納され、それらのデータをペプチドの体内動態の予測に役立てることができる。予測モデルの提供に対するポイントの付与についても、上記とほぼ同様である。例えば、予め準備しておいた正解の判っている試験用データを用いて、提供された予測モデルの性能を推定し、優れた性能を発揮すると期待できる予測モデルには高いポイントを付与するようにしてもよい。また、例えば、従来の予測モデルでは成績が悪かったペプチドに対して、予測が改善されているような予測モデルには高いポイントを付与するようにしてもよい。

以上説明したように、第４実施形態の情報処理システムのサーバは、端末から送信された、ペプチドの予測情報の教師データである実験データ、実験データを得た際の実験手法を表す情報、ユーザが利用する予測モデル、及びユーザにより生成されたペプチドの体内動態に関する予測情報の少なくとも１つのデータが、サーバが管理する記憶部に格納された場合、端末に付与されているユーザＩＤに対して、データの提供に対する報酬を表すポイントを付与する。これにより、ペプチドの体内動態の予測に有用なデータをより多く収集することができる。

また、上記では本発明に係るプログラムが記憶部（図示省略）に予め記憶（インストール）されている態様を説明したが、本発明に係るプログラムは、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ及びマイクロＳＤカード等の記録媒体に記録されている形態で提供することも可能である。

なお、上記実施形態でＣＰＵがソフトウェア（プログラム）を読み込んで実行した処理を、ＣＰＵ以外の各種のプロセッサが実行してもよい。この場合のプロセッサとしては、ＦＰＧＡ（Field-Programmable Gate Array）等の製造後に回路構成を変更可能なＰＬＤ（Programmable Logic Device）、及びＡＳＩＣ（Application Specific Integrated Circuit）等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が例示される。また、各処理を、これらの各種のプロセッサのうちの１つで実行してもよいし、同種又は異種の２つ以上のプロセッサの組み合わせ（例えば、複数のＦＰＧＡ、及びＣＰＵとＦＰＧＡとの組み合わせ等）で実行してもよい。また、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路である。

また、本実施形態の各処理を、汎用演算処理装置及び記憶装置等を備えたコンピュータ又はサーバ等により構成して、各処理がプログラムによって実行されるものとしてもよい。このプログラムは記憶装置に記憶されており、磁気ディスク、光ディスク、半導体メモリ等の記録媒体に記録することも、ネットワークを通して提供することも可能である。もちろん、その他いかなる構成要素についても、単一のコンピュータやサーバによって実現しなければならないものではなく、ネットワークによって接続された複数のコンピュータに分散して実現してもよい。

１０情報処理システム
１２Ａ，１２Ｂ，１２Ｃ端末
１４サーバ
１６ネットワーク
１４０受信部
１４２共通データベース
１４４Ａ，１４４Ｂ，１４４Ｃユーザ用データベース
１４５共通予測モデル記憶部
１４６Ａ，１４６Ｂ，１４６Ｃユーザ用予測モデル記憶部
１４８予測部
１５０処理部
１５２送信部
２５４設計支援部
４５６報酬付与部
４５８報酬記憶部

Claims

端末から送信された要求信号を受信する受信部と、
前記要求信号に応答して、予測情報を生成するための予測モデルに対して、前記要求信号に含まれるペプチドを表すペプチド情報又は前記ペプチド情報から変換された特徴情報を入力し、前記予測モデルからペプチドの体内動態に関する予測情報を出力させることにより、前記予測情報を生成する予測部と、
前記予測部により生成された前記予測情報を前記端末へ送信する送信部と、
を含み、
前記要求信号にはユーザＩＤが含まれており、
前記予測モデルは、ユーザ毎に予め用意されている予測モデルであり、
前記予測部は、複数の前記予測モデルから前記ユーザＩＤに応じた予測モデルを選択し、
選択された前記予測モデルに対して、前記ペプチド情報又は前記特徴情報を入力することにより、前記ペプチドの前記予測情報を生成する、
情報処理装置。
複数の予測モデルの各々は、ユーザ毎に予め用意された学習用データによって予め学習されている学習済みモデルである、
請求項１に記載の情報処理装置。
前記要求信号にはユーザＩＤが含まれており、
前記ユーザＩＤに応じて、ユーザ毎に予め用意されている複数のデータベースのうちの前記ユーザＩＤに対応するデータベースに対して、前記予測情報を格納する処理部を更に含む、
請求項１又は請求項２に記載の情報処理装置。
前記要求信号にはユーザＩＤが含まれており、
前記ユーザＩＤに応じて、ユーザ毎に予め用意されている複数のデータベースのうちの前記ユーザＩＤに対応するデータベースに対して、前記端末から送信されたデータを格納する処理部を更に含む、
請求項１～請求項３の何れか１項に記載の情報処理装置。
前記処理部は、前記端末から送信された、ペプチドの体内動態に関するデータを前記データベースへ格納する、
請求項４に記載の情報処理装置。
前記送信部は、前記予測部により予測された前記予測情報と、予測対象の前記ペプチドとを対応付けて、前記端末へ送信する、
請求項１～請求項５の何れか１項に記載の情報処理装置。
前記ペプチドを構成する要素の変更箇所の候補を含む設計支援情報を生成する設計支援部を更に備え、
前記設計支援部は、前記ペプチドを構成する複数の残基の各々について、前記予測情報を生成するための学習済みモデルのパラメータを解析することにより、前記残基が前記予測情報に影響を与えている度合いを表す残基影響度スコアを計算し、
前記複数の残基の各々に対して計算された前記残基影響度スコアのうち所定閾値以上の残基影響度スコアの前記残基を特定し、
前記ペプチドの構造のうち、前記特定された前記残基を交換候補の残基として設定し、前記交換候補の残基を変更箇所の候補とし、
前記送信部は、前記設計支援情報を前記端末へ送信する、
請求項１～請求項６の何れか１項に記載の情報処理装置。
前記ペプチドを構成する要素の変更箇所の候補を含む設計支援情報を生成する設計支援部を更に備え、
前記設計支援部は、前記ペプチドを構成する複数の残基のうちの少なくとも１つの残基を予め定めた別の残基に置換した候補ペプチドを複数生成し、
前記予測部は、残基を置換する前の前記ペプチドの前記予測情報と、前記複数の前記候補ペプチドの各々の前記予測情報とを生成し、
前記設計支援部は、複数の前記候補ペプチドの各々について、残基を置換する前の前記ペプチドの前記予測情報と、前記候補ペプチドの前記予測情報との間の差分を計算し、前記差分が所定閾値以上である前記候補ペプチドを特定し、特定した前記候補ペプチドのうちの置換後の前記残基の箇所を特定し、
前記ペプチドの構造のうち、前記特定された箇所の残基を交換候補の残基として設定し、前記交換候補の残基を変更箇所の候補とし、
前記送信部は、前記設計支援情報を前記端末へ送信する、
請求項１～請求項６の何れか１項に記載の情報処理装置。
前記端末から送信された、前記ペプチドの前記予測情報の教師データである、前記ペプチドの体内動態に関する実験データ、前記実験データを得た際の実験手法を表す情報、ユーザが利用する予測モデル、及び前記ユーザにより生成された前記ペプチドの体内動態に関する予測情報の少なくとも１つのデータが、前記情報処理装置が管理する記憶部に格納された場合、前記端末に付与されているユーザＩＤに対して、前記データの提供に対する報酬を表すポイントを付与する報酬付与部を更に備える、
請求項１～請求項８の何れか１項に記載の情報処理装置。
端末から送信された要求信号を受信し、
前記要求信号に応答して、予測情報を生成するための予測モデルに対して、前記要求信号に含まれるペプチドを表すペプチド情報又は前記ペプチド情報から変換された特徴情報を入力し、前記予測モデルからペプチドの体内動態に関する予測情報を出力させることにより、前記予測情報を生成し、
生成された前記予測情報を前記端末へ送信し、
前記要求信号にはユーザＩＤが含まれており、
前記予測モデルは、ユーザ毎に予め用意されている予測モデルであり、
前記ペプチドの前記予測情報を生成する際に、複数の前記予測モデルから前記ユーザＩＤに応じた予測モデルを選択し、
選択された前記予測モデルに対して、前記ペプチド情報又は前記特徴情報を入力することにより、前記ペプチドの前記予測情報を生成する、
処理をコンピュータが実行する情報処理方法。
端末から送信された要求信号を受信し、
前記要求信号に応答して、予測情報を生成するための予測モデルに対して、前記要求信号に含まれるペプチドを表すペプチド情報又は前記ペプチド情報から変換された特徴情報を入力し、前記予測モデルからペプチドの体内動態に関する予測情報を出力させることにより、前記予測情報を生成し、
生成された前記予測情報を前記端末へ送信し、
前記要求信号にはユーザＩＤが含まれており、
前記予測モデルは、ユーザ毎に予め用意されている予測モデルであり、
前記ペプチドの前記予測情報を生成する際に、複数の前記予測モデルから前記ユーザＩＤに応じた予測モデルを選択し、
選択された前記予測モデルに対して、前記ペプチド情報又は前記特徴情報を入力することにより、前記ペプチドの前記予測情報を生成する、
処理をコンピュータに実行させるための情報処理プログラム。
端末と請求項１～請求項９の何れか１項に記載の情報処理装置とを含む情報処理システムであって、
前記端末は、要求信号を前記情報処理装置へ送信し、
前記情報処理装置は、前記端末から送信された前記要求信号を受信し、前記要求信号に応答して、ペプチドの体内動態に関する予測情報を生成し、生成された前記予測情報を前記端末へ送信し、
前記端末は、前記情報処理装置から送信された前記予測情報を表示部に表示させる、
情報処理システム。
端末と請求項７又は請求項８に記載の情報処理装置とを含む情報処理システムであって、
前記端末は、要求信号を前記情報処理装置へ送信し、
前記情報処理装置は、前記端末から送信された前記要求信号を受信し、前記要求信号に応答して、ペプチドを構成する要素の変更箇所の候補を含む設計支援情報を生成し、前記設計支援情報を前記端末へ送信し、
前記端末は、前記情報処理装置から送信された前記設計支援情報を表示部に表示させる、
情報処理システム。