WO2023139933A1

WO2023139933A1 - 情報処理装置、情報処理方法、及びプログラム

Info

Publication number: WO2023139933A1
Application number: PCT/JP2022/043877
Authority: WO
Inventors: 諭志河田
Original assignee: ソニーグループ株式会社
Priority date: 2022-01-21
Filing date: 2022-11-29
Publication date: 2023-07-27

Abstract

本技術の一形態に係る情報処理装置は、取得部と、入力部と、生成部とを具備する。前記取得部は、タンパク質に関するタンパク質情報を取得する。前記入力部には、前記取得部により取得された前記タンパク質情報に対するユーザの入力操作に応じた入力情報が入力される。前記生成部は、前記取得部により取得された前記タンパク質情報と、前記入力部に入力された前記入力情報とに基づいて、アミノ酸配列に関する配列情報を生成する。これにより、所望のタンパク質を効率よく生成することが可能となる。

Description

情報処理装置、情報処理方法、及びプログラム

　本技術は、アミノ酸配列の予測に適用可能な情報処理装置、情報処理方法、及びプログラムに関する。

　特許文献１には、アミノ酸配列に基づいて、タンパク質の構造を予測する予測システムについて開示されている。この予測システムでは、アミノ酸配列に対して、マルチプルアライメントと呼ばれる配列の整列処理が実行され、タンパク質の構造が予測される。これにより、タンパク質の構造を精度よく予測することが可能となる。

米国特許出願公開第２０２１／０１６６７７９号明細書

　ところで、所望のタンパク質を効率よく生成することを可能とする技術が求められている。

　以上のような事情に鑑み、本技術の目的は、所望のタンパク質を効率よく生成することを可能とする情報処理装置、情報処理方法、及びプログラムを提供することにある。

　上記目的を達成するため、本技術の一形態に係る情報処理装置は、取得部と、入力部と、生成部とを具備する。
　前記取得部は、タンパク質に関するタンパク質情報を取得する。
　前記入力部には、前記取得部により取得された前記タンパク質情報に対するユーザの入力操作に応じた入力情報が入力される。
　前記生成部は、前記取得部により取得された前記タンパク質情報と、前記入力部に入力された前記入力情報とに基づいて、アミノ酸配列に関する配列情報を生成する。

　この情報処理装置では、タンパク質情報が取得され、タンパク質情報に対するユーザの入力操作に応じた入力情報が入力される。また、タンパク質情報と入力情報とに基づいて、アミノ酸配列に関する配列情報が生成される。これにより、所望のタンパク質を効率よく生成することが可能となる。

　前記生成部は、前記タンパク質情報に対して前記入力情報が反映された反映タンパク質情報を生成し、前記反映タンパク質情報に対応する前記配列情報を予測してもよい。

　前記生成部は、前記反映タンパク質情報を入力として機械学習を実行することで、前記配列情報を予測してもよい。

　前記タンパク質情報は、前記タンパク質の構造、又は前記タンパク質の機能の少なくとも一方を含んでもよい。この場合、前記入力操作は、前記タンパク質の構造の編集操作、又は前記タンパク質の機能の編集操作の少なくとも一方を含んでもよい。

　前記タンパク質の機能は、前記タンパク質の親水性、又は前記タンパク質の剛性の少なくとも一方を含んでもよい。

　前記情報処理装置は、さらに、前記生成部により生成された前記配列情報に対応する前記タンパク質情報を、予測タンパク質情報として予測するタンパク質予測部を具備してもよい。

　前記タンパク質予測部は、前記配列情報を入力として機械学習を実行することで、前記予測タンパク質情報を予測してもよい。

　前記生成部は、前記反映タンパク質情報と、前記タンパク質予測部により予測された前記予測タンパク質情報との差分に基づいて、前記反映タンパク質情報を修正してもよい。

　前記情報処理装置は、さらに、前記取得部により取得された前記タンパク質情報に対応するタンパク質画像の表示を制御する表示制御部を具備してもよい。

　前記入力情報は、前記タンパク質画像に対する前記入力操作に応じた情報を含んでもよい。

　前記表示制御部は、前記生成部により生成された前記反映タンパク質情報に対応する反映タンパク質画像の表示を制御してもよい。

　前記入力情報は、前記反映タンパク質画像に対する前記入力操作に応じた情報を含んでもよい。

　前記表示制御部は、前記生成部により予測された前記配列情報に対応する配列情報画像の表示を制御してもよい。

　前記情報処理装置は、さらに、前記生成部により予測された前記配列情報に対応する前記タンパク質情報を、予測タンパク質情報として予測するタンパク質予測部を具備してもよい。この場合、前記表示制御部は、前記反映タンパク質情報と前記予測タンパク質情報との差分に対応する差分画像の表示を制御してもよい。

　前記差分画像は、前記反映タンパク質画像と、前記予測タンパク質情報に対応する予測タンパク質画像とが互いに重畳された画像を含んでもよい。

　前記差分画像は、前記反映タンパク質画像と前記予測タンパク質画像とが互いに重畳され、前記反映タンパク質情報と前記予測タンパク質情報との差分が強調表示された画像を含んでもよい。

　前記情報処理装置は、さらに、前記生成部により生成された前記配列情報に対応する前記タンパク質情報を、予測タンパク質情報として予測するタンパク質予測部を具備してもよい。この場合、前記表示制御部は、前記タンパク質画像、前記生成部により生成された前記反映タンパク質情報に対応する反映タンパク質画像、又は前記予測タンパク質情報に対応する予測タンパク質画像の少なくとも１つを、点群画像、ポリゴン画像、メッシュ画像、サーフェス画像、スライス画像、又は三面図の少なくとも１つの表示形式により表示するように、表示を制御してもよい。

　前記タンパク質情報は、前記タンパク質情報の雛形であるテンプレート情報を含んでもよい。

　本技術の一形態に係る情報処理方法は、コンピュータシステムが実行する情報処理方法であって、タンパク質に関するタンパク質情報を取得することを含む。
　取得された前記タンパク質情報に対するユーザの入力操作に応じた入力情報が入力される。
　取得された前記タンパク質情報と、入力された前記入力情報とに基づいて、アミノ酸配列に関する配列情報が生成される。

　本技術の一形態に係るプログラムは、コンピュータシステムに以下のステップを実行させる。
　タンパク質に関するタンパク質情報を取得するステップ。
　取得された前記タンパク質情報に対するユーザの入力操作に応じた入力情報を入力するステップ。
　取得された前記タンパク質情報と、入力された前記入力情報とに基づいて、アミノ酸配列に関する配列情報を生成するステップ。

本技術の一実施形態に係る配列生成システムの構成例を示す模式図である。クラウド環境を含む配列生成システムの構成例を示す模式図である。クラウド環境を含む配列生成システムの構成例を示す模式図である。情報処理装置による配列情報の生成に関する処理例を示すフローチャートである。配列生成システムの構成例を示すブロック図である。配列情報の予測に関する処理例を示すフローチャートである。表示部による表示内容の一例を示す模式図である。配列予測部に含まれる機械学習モデルの一例を示す模式図である。配列生成システムの構成例を示すブロック図である。差分画像の生成等に関する処理例を示すフローチャートである。差分画像の生成等に関する処理例を示すフローチャートである。差分画像の一例を示す模式図である。配列生成システムの構成例を示すブロック図である。反映立体構造の修正に関する処理例を示すフローチャートである。反映立体構造の修正に関する処理例を示すフローチャートである。情報処理装置を実現可能なコンピュータのハードウェア構成例を示すブロック図である。

　以下、本技術に係る実施形態を、図面を参照しながら説明する。

　［配列生成システム］
　図１は、本技術の一実施形態に係る配列生成システムの構成例を示す模式図である。
　配列生成システム１は、タンパク質の構造等の情報に基づいて、当該タンパク質を構成するアミノ酸配列を生成して出力することが可能である。

　まず、アミノ酸とタンパク質との関係について説明する。
　アミノ酸同士が結合してアミノ酸配列になると、アミノ酸配列は折り畳まれ、タンパク質が生成される。
　元となるアミノ酸配列が異なれば、配列がどのように折り畳まれるかも異なり、それぞれ違ったタンパク質が生成される。このように、アミノ酸配列及びタンパク質には対応関係があるといえる。

　本配列生成システム１では、タンパク質が与えられた場合に、そのタンパク質の元となるアミノ酸配列がどのようなものであるかを解析することが可能である。
　与えるタンパク質は、配列生成システム１を利用するユーザにより指定することが可能である。具体的には、ユーザはタンパク質を編集可能であり、編集により与えるタンパク質を決めることが可能である。
　すなわち本配列生成システム１では、ユーザが「あるタンパク質について、元となるアミノ酸配列がどのようなものであるかを知りたい」と考えた場合に、その所望のタンパク質を編集によって作成することで、元となるアミノ酸配列を解析させることが可能となる。
　例えば、ユーザにより、未知のタンパク質の構造等を入力することも可能である。本配列生成システム１により、未知のタンパク質に対応するアミノ酸配列を生成して出力することも可能である。

　図１に示すように、配列生成システム１は、タンパク質情報ＤＢ（データベース）２、配列情報ＤＢ３、及び情報処理装置４を有する。

　タンパク質情報ＤＢ２は、タンパク質情報５が記憶されるデータベースである。
　タンパク質情報５とは、タンパク質に関する情報である。
　例えば、タンパク質情報５にはタンパク質の立体構造（タンパク質が持つ固有の立体的な構造や機能）が含まれる。
　もちろん、タンパク質情報５にはタンパク質に関する他の任意の情報が含まれてよい。

　配列情報ＤＢ３は、配列情報６が記憶されるデータベースである。
　配列情報６とは、アミノ酸配列に関する情報である。
　例えば配列情報６には、配列を表現したアルファベットの文字列が含まれる。

　アミノ酸配列は、一般的に数十～数百個ものアミノ酸残基の配列となる。それらのアミノ酸残基を示性式等で表記すると、非常に冗長になってしまう。
　そこで、簡潔にアミノ酸配列を表記するために、アミノ酸残基の種類をアルファベット１文字により表現する方法が用いられる。例えばセリン残基は「Ｓ」、グルタミン残基は「Ｑ」で表記される。その他、全部で２０種類のアミノ酸残基の各々が、アルファベット１文字により表現される。
　例えばこのようなアルファベットの文字列が、配列情報６となる。図１には、配列情報６としてアルファベットの文字列が模式的に図示されている。
　もちろん、配列情報６にはアミノ酸配列に関する他の任意の情報が含まれてよい。

　タンパク質情報ＤＢ２及び配列情報ＤＢ３は、例えばＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）等の記憶デバイスにより構成される。その他、コンピュータ読み取り可能な非一過性の任意の記憶媒体が用いられてよい。

　情報処理装置４は、例えばＣＰＵ、ＧＰＵ、ＤＳＰ等のプロセッサ、ＲＯＭ、ＲＡＭ等のメモリ、ＨＤＤ等の記憶デバイス等、コンピュータの構成に必要なハードウェアを有する。
　例えばＣＰＵがＲＯＭ等に予め記録されている本技術に係るプログラムをＲＡＭにロードして実行することにより、本技術に係る情報処理方法が実行される。
　例えばＰＣ（Personal Computer）等の任意のコンピュータにより、情報処理装置４を実現することが可能である。もちろんＦＰＧＡ、ＡＳＩＣ等のハードウェアが用いられてもよい。
　本実施形態では、ＣＰＵ等が所定のプログラムを実行することで、機能ブロックとしての取得部７、入力部８、及び生成部９が構成される。もちろん機能ブロックを実現するために、ＩＣ（集積回路）等の専用のハードウェアが用いられてもよい。
　プログラムは、例えば種々の記録媒体を介して情報処理装置４にインストールされる。あるいは、インターネット等を介してプログラムのインストールが実行されてもよい。
　プログラムが記録される記録媒体の種類等は限定されず、コンピュータが読み取り可能な任意の記録媒体が用いられてよい。例えば、コンピュータが読み取り可能な非一過性の任意の記憶媒体が用いられてよい。

　取得部７は、タンパク質情報５を取得する。
　本実施形態では、取得部７により、タンパク質情報ＤＢ２に記憶されたタンパク質情報５が取得される。

　入力部８には、取得部７により取得されたタンパク質情報５に対する、ユーザの入力操作に応じた入力情報が入力される。
　例えば、ユーザはキーボードやマウス等のデバイスを介して入力操作を行うことで、タンパク質情報５の編集が可能である。ユーザによる入力操作が実行された場合に、入力部８に対して入力情報が入力される。

　生成部９は、取得部７により取得されたタンパク質情報５と、入力部８に入力された入力情報とに基づいて、配列情報６を生成する。
　生成部９により生成された配列情報６は、配列情報ＤＢ３に出力される。
　また生成部９により、表示デバイス（ＰＣのディスプレイ等）に対する配列情報６の表示が制御される。

　図２及び図３は、クラウド環境を含む配列生成システム１の構成例を示す模式図である。
　本例では、配列生成システム１は、２つの第１の情報処理装置１２、及び第２の情報処理装置１３を有する。
　これらの端末及び装置は、ネットワーク１４を介して相互に通信可能に接続される。ネットワーク１４は、例えばインターネットや広域通信回線網等により構築される。その他、任意のＷＡＮ（Wide Area Network）やＬＡＮ（Local Area Network）等が用いられてよく、ネットワーク１４を構築するためのプロトコルは限定されない。
　また図３に示すように、配列生成システム１は、タンパク質情報ＤＢ２と、配列情報ＤＢ３とを有する。なお図２では、タンパク質情報ＤＢ２及び配列情報ＤＢ３の図示は省略されている。

　第１の情報処理装置１２は、図１に示す取得部７及び入力部８と、通信部１５とを有する。
　通信部１５は、他のデバイスとの間で、ネットワーク通信や近距離無線通信等を実行するためのモジュールである。例えばＷｉＦｉ等の無線ＬＡＮモジュールや、Bluetooth（登録商標）等の通信モジュールが設けられる。
　通信部１５は、取得部７により取得されたタンパク質情報５と、入力部８に入力された入力情報とをネットワーク１４に対して送信する。また、第２の情報処理装置１３により送信された配列情報６を、ネットワーク１４を介して受信する。

　第２の情報処理装置１３は、図１に示す生成部９と、通信部１６とを有する。
　通信部１６は、第１の情報処理装置１２により送信されたタンパク質情報５及び入力情報を、ネットワーク１４を介して受信する。また、生成部９により生成された配列情報６を、ネットワーク１４に対して送信する。

　本例では、例えば第１の情報処理装置１２として、ＰＣ等の、ユーザが操作可能な装置が用いられる。ユーザがタンパク質情報５の編集のために、入力デバイスを介して入力操作を行うことで、入力情報が入力される。入力情報は、タンパク質情報５と共に第２の情報処理装置１３に送信される。
　第２の情報処理装置１３は、例えばサーバ装置として構成され、受信したタンパク質情報５及び入力情報に基づいて、配列情報６が生成される。そして、配列情報６が第１の情報処理装置１２に送信され、第１の情報処理装置１２の画面への配列情報６の表示、及び配列情報ＤＢ３に対する配列情報６の出力等が実行される。

　このように、ユーザ側の環境（ローカル環境１７）、及びユーザと離れた場所にある環境（クラウド環境１８）により、配列生成システム１が構成されてもよい。
　図２及び３に示す構成例では、第１の情報処理装置１２及び第２の情報処理装置１３が協働することで、図１に示す情報処理装置４が有する本技術に係る機能が実現される。
　すなわち、図２及び図３に示す構成例では、ネットワーク１４を介して通信可能に接続された２つのコンピュータが協働することで、本技術に係る情報処理装置が実現され、本技術に係る情報処理方法が実行される。

　図２に示すように、本例ではローカル環境１７にて、ユーザが操作可能な第１の情報処理装置１２が２つ配置されている。このように、ローカル環境１７側に複数の第１の情報処理装置１２が配置され、複数のユーザにより本配列生成システム１が利用可能であってもよい。もちろん、ローカル環境１側に配置される第１の情報処理装置１２の数は限定されず、３つ以上の第１の情報処理装置１２が配置されてもよい。
　また、第１の情報処理装置１２及び第２の情報処理装置１３が、ケーブル等を介して通信可能に接続される構成も採用可能である。
　また、タンパク質情報ＤＢ２や配列情報ＤＢ３がクラウド環境１８側に含まれる構成が採用されてもよい。
　その他、配列生成システム１の具体的な構成は限定されない。

　図４は、情報処理装置４による配列情報６の生成に関する処理例を示すフローチャートである。図２及び図３に示す構成例では、第１の情報処理装置１２及び第２の情報処理装置１３が協働することで、図４に示す処理例が実行される。

　取得部７により、タンパク質情報５が取得される（ステップ１０１）。
　具体的には、取得部７により、タンパク質情報ＤＢ２に記憶されたタンパク質情報５が取得される。

　入力部８により入力情報が取得される（ステップ１０２）。
　例えばユーザが、タンパク質情報５の編集のために入力操作を行った場合に、入力部８により入力情報が取得される。
　なお、入力部８による入力情報の取得は、入力部８に対する入力情報の入力に含まれる。

　生成部９により、配列情報６が生成される（ステップ１０３）。
　具体的には、まず生成部９により、取得部７からタンパク質情報５が取得され、入力部８から入力情報が取得される。さらに、タンパク質情報５及び入力情報に基づいて、配列情報６が生成される。
　本実施形態では、生成部９により、機械学習アルゴリズムを用いた処理により配列情報６が生成される。配列情報６の生成方法については、後に詳しく説明する。

　生成部９により生成された配列情報６が出力される（ステップ１０４）。
　本実施形態では、生成部９により、配列情報６が配列情報ＤＢ３に対して出力される。これにより、配列情報ＤＢ３に配列情報６が記憶される。
　また、ＰＣのディスプレイ等の表示デバイスに、配列情報６が表示される。表示デバイスに対する配列情報６の表示は、配列情報６の出力に含まれる。

　なお配列生成システム１として、クラウド環境１８を含む構成が採用される場合には、ステップ１０３（配列情報の生成）の直前及びステップ１０４（配列情報の出力）の直前に、第１の情報処理装置１２と第２の情報処理装置１３との通信に係る処理が実行される。

　＜第１の実施形態＞
　図５～図８を参照して、本技術に係る配列生成システム１について、さらに詳細な実施形態を、第１の実施形態として説明する。
　図５は、配列生成システム１の構成例を示すブロック図である。
　配列生成システム１は、タンパク質情報ＤＢ２、配列情報ＤＢ３、及び情報処理装置４を有する。

　タンパク質情報ＤＢ２には、タンパク質情報５として立体構造１９が記憶される。
　立体構造１９とは、タンパク質が持つ固有の立体的な構造や機能を含む情報である。
　立体構造１９は、タンパク質の構造又はタンパク質の機能の少なくとも一方を含む。

　タンパク質の構造とは、タンパク質の構造に関する情報である。例えばタンパク質を構成する各々の原子や分子、結合、官能基等の三次元座標の座標列を含んだ情報が、タンパク質の構造に含まれる。これらの三次元座標の座標列は、ボリュームデータと呼称されることもある。
　もちろんタンパク質の構造が具体的にどのような情報であるかは限定されず、タンパク質の構造に関する任意の情報が含まれてよい。

　タンパク質の機能とは、タンパク質の機能に関する情報である。
　本実施形態では、タンパク質の機能には、タンパク質の親水性、又はタンパク質の剛性の少なくとも一方が含まれる。
　タンパク質の中には、構造の一部に局所的な親水性を有するものが存在する。また、局所的な剛性（折れ曲がりにくさ）を有するものが存在する。
　例えばこのような親水性や剛性を表す機能ラベルが、タンパク質の機能に含まれる。
　機能ラベルは、例えば親水性や剛性を有する三次元座標の範囲、及び親水性や剛性の高さを表す数値となる。
　逆に、疎水性や非剛性を有する三次元座標の範囲等を表す数値が、機能ラベルに含まれてもよい。

　また、タンパク質が局所的にＹ字型の構造を有する場合に、Ｙ字の腕の部分でウイルスを捉える機能が発現する、といったこともある。このような免疫機能を表す機能ラベルが、タンパク質の機能に含まれてもよい。
　その他、タンパク質の機能が具体的にどのような情報であるかは限定されず、タンパク質の機能に関する任意の情報が含まれてよい。

　なおタンパク質情報５の内容は、タンパク質の構造又はタンパク質の機能に限定されない。例えばタンパク質に関する画像等、タンパク質に関する任意の情報がタンパク質情報ＤＢ２に記憶されてよい。

　また本実施形態では、タンパク質情報５として、タンパク質情報５の雛形であるテンプレート情報がタンパク質情報ＤＢ２に記憶される。
　テンプレート情報は、ユーザの編集のために用意された、初期値となるタンパク質情報５である。
　例えばユーザは、複数のテンプレート情報から、自分が作成したいタンパク質情報５に近い形のテンプレート情報を選択する。これにより、情報が何も与えられていない状態から編集する場合に比べて、編集に係る労力や時間を少なくすることが可能となる。

　例えば、配列生成システム１の管理者によって予めテンプレート情報が作成され、タンパク質情報ＤＢ２に記憶される。
　あるいは、国際タンパク質構造データバンク（wwPDB）のデータベースにて公開されているタンパク質のデータが、テンプレート情報として用いられてもよい。この場合、例えばＰＤＢ形式、ＰＤＢＭＬ形式、又はｍｍＣＩＦ形式といったデータ形式により、テンプレート情報が作成される。
　その他、テンプレート情報の具体的な内容は限定されない。

　配列情報ＤＢ３には、配列情報６として、例えばアミノ酸残基の配列を表現したアルファベットの文字列が記憶される。
　もちろん配列情報６の具体的な内容は限定されない。例えばアミノ酸配列が構造式や示性式等で表された情報等、アミノ酸配列に関する任意の情報が配列情報ＤＢ３に記憶されてよい。

　情報処理装置４は、コントローラ２０、表示部２１、操作部２２、通信部２３、及び記憶部２４を有する。
　コントローラ２０、表示部２１、操作部２２、通信部２３、及び記憶部２４は、バス２５を介して相互に接続されている。バス２５に代えて、通信ネットワークや規格化されていない独自の通信方式等を用いて、各ブロックが接続されてもよい。

　表示部２１は、例えば液晶、ＥＬ（Electro-Luminescence）等を用いた表示デバイスで
あり、種々の画像や種々のＧＵＩ（Graphical User Interface）等が表示される。

　操作部２２は、例えばキーボード、ポインティングデバイス、タッチパネル、その他の操作装置である。操作部２２がタッチパネルを含む場合、そのタッチパネルは表示部２１と一体となり得る。
　本実施形態では、ユーザによる操作部２２を介した入力操作に応じて、入力情報が生成される。

　通信部２３は、他のデバイスとの間で、ネットワーク通信や近距離無線通信等を実行するためのモジュールである。
　例えば配列生成システム１がクラウド環境１８を含む場合に、通信部２３によりネットワーク１４との通信が実行される。

　記憶部２４は、不揮発性メモリ等の記憶デバイスであり、例えばＨＤＤやＳＳＤ等が用いられる。その他、コンピュータ読み取り可能な非一過性の任意の記憶媒体が用いられてよい。
　記憶部２４には、情報処理装置４の全体の動作を制御するための制御プログラムが記憶される。制御プログラムを情報処理装置４にインストールする方法は限定されない。
例えば、種々の記録媒体を介してインストールが実行されてもよいし、インターネット等を介してプログラムのインストールが実行されてもよい。
　また、記憶部２４に立体構造１９や配列情報６が記憶されてもよい。

　コントローラ２０は、例えばＣＰＵ、ＧＰＵ、ＤＳＰ等のプロセッサ、ＲＯＭやＲＡＭ等のメモリ、ＨＤＤ等の記憶デバイス等、コンピュータの構成に必要なハードウェアを有する。例えばＣＰＵがＲＯＭ等に予め記録されている本技術に係るプログラムをＲＡＭにロードして実行することにより、本技術に係る情報処理方法が実行される。
　コントローラ２０として、例えばＦＰＧＡ（Field Programmable Gate Array）等のＰＬＤ(Programmable Logic Device)、その他ＡＳＩＣ（Application Specific Integrated Circuit）等のデバイスが用いられてもよい。
　本実施形態では、コントローラ２０のＣＰＵが本技術に係るプログラム（例えばアプリケーションプログラム）を実行することで、機能ブロックとして、取得部７、入力部８、立体構造生成部２６、配列予測部２７、表示制御部２８、出力部２９が実現される。
　そしてこれらの機能ブロックにより、本実施形態に係る情報処理方法が実行される。なお各機能ブロックを実現するために、ＩＣ（集積回路）等の専用のハードウェアが適宜用いられてもよい。

　取得部７は、タンパク質情報５を取得する。
　本実施形態では取得部７により、タンパク質情報ＤＢ２から、テンプレート情報である立体構造１９が取得される。
　また取得部７により、表示制御部２８に対して立体構造１９が出力される。

　入力部８は、入力情報を取得する。
　入力情報とは、取得部７により取得された立体構造１９に対する、ユーザの入力操作に応じた情報である。
　例えば、ユーザは表示部２１に表示された立体構造１９に関する画像を確認しながら、画面上で編集作業を行うことが可能である。具体的には、例えば操作部２２に含まれるマウスを用いて原子の画像をドラッグ操作することで原子の配置を変更する等、様々な編集作業が可能である。
　この場合には、「ドラッグ操作」が、入力操作に該当する。そして、例えば「原子の新たな座標」が、入力情報に該当する。入力情報である「原子の新たな座標」は、例えば入力操作である「ドラッグ操作」の軌跡に応じて決まる。
　入力情報の具体的な内容は限定されず、入力操作に応じた任意の情報が含まれる。

　立体構造生成部２６は、立体構造１９に対して入力情報が反映された反映立体構造を生成する。
　例えば取得部７により取得された立体構造１９に、「原子Ａの座標はＸ＝１０、Ｙ＝２０、Ｚ＝３０」という三次元座標が含まれており、入力情報が「原子Ａの新たな座標はＸ＝２０、Ｙ＝１０、Ｚ＝４０」という情報であったとする。この場合には、反映立体構造は、「原子Ａの座標はＸ＝２０、Ｙ＝１０、Ｚ＝４０」という三次元座標を含んだ情報となる。
　なお、もちろん立体構造１９及び反映立体構造には、複数の原子の座標や種類、分子、結合及び官能基の座標や種類、あるいは機能ラベル等の情報も含まれうる。

　また、立体構造生成部２６により、配列予測部２７及び表示制御部２８に対して反映立体構造が出力される。
　反映立体構造は、本技術に係る反映タンパク質情報の一実施形態に相当する。

　配列予測部２７は、反映立体構造に対応する配列情報６を予測する。
　本実施形態では、機械学習アルゴリズムを用いた方法により配列情報６が予測される。
　なお、配列予測部２７による配列情報６の予測は、配列情報６の生成に含まれる。
　配列予測部２７により予測された配列情報６は、表示制御部２８及び出力部２９に出力される。

　表示制御部２８は、取得部７により取得された立体構造１９に対応する画像の表示を制御する。また、立体構造生成部２６により生成された反映立体構造に対応する画像、及び配列予測部２７により予測された配列情報６に対応する画像の表示を制御する。

　出力部２９は、配列予測部２７により予測された配列情報６を、ファイルとして出力する。
　具体的には、出力部２９により、配列情報ＤＢ３に対して配列情報６が出力される。あるいは、記憶部２４や、所定の記憶媒体に対して配列情報６が出力されてもよい。
　また、通信部２３を介して、クラウド環境１８に含まれる記憶媒体に対して配列情報６が出力されてもよい。
　その他、出力部２９による配列情報６の具体的な出力先は限定されない。

　配列情報６のファイル形式としては、例えばテキストファイル、ＦＡＳＴＡファイル、ｃｓｖファイル等の形式が用いられる。
　これに限らず、例えば画像形式等、任意の形式が採用されてよい。

　本実施形態において、立体構造生成部２６、配列予測部２７、及び出力部２９により、本技術に係る生成部の一実施形態が実現される。

　図５を用いて説明したコントローラ２０、表示部２１、操作部２２、通信部２３、記憶部２４の構成はあくまで一例であり、具体的な構成は限定されない。

　図６は、配列情報６の予測に関する処理例を示すフローチャートである。
　図７は、表示部２１による表示内容の一例を示す模式図である。
　図８は、配列予測部２７に含まれる機械学習モデルの一例を示す模式図である。
　まず、取得部７により、立体構造１９が取得される（ステップ２０１）。

　［立体構造画像の表示］
　表示部２１に立体構造画像が表示される（ステップ２０２）。
　本実施形態では、表示制御部２８により、取得部７により取得された立体構造１９に対応する立体構造画像の表示が制御される。
　具体的には、まず表示制御部２８により、取得部７から立体構造１９が取得される。さらに、立体構造１９に対応する立体構造画像が生成され、表示部２１に対する立体構造画像の表示が制御される。
　図７Ａには、表示部２１に立体構造画像３２が表示された状態が模式的に図示されている。

　本実施形態では、表示制御部２８により、立体構造画像３２が、点群画像、ポリゴン画像、メッシュ画像、サーフェス画像、スライス画像、又は三面図の少なくとも１つの表示形式により表示されるように、表示が制御される。

　点群画像とは、データが点の集合により表された画像である。例えばタンパク質に含まれる各々の原子が点で表され、点群画像として表示される。
　具体的には、立体構造１９に含まれる原子の三次元座標に基づいて、点群画像における点の位置が算出され、点群画像が生成される。
　もちろん、点群画像を始めとした立体構造画像の具体的な生成方法は限定されない。

　原子に限らず、分子、官能基、機能ラベル、あるいはタンパク質の主鎖や側鎖等が点で表され、点群画像として表示されてもよい。
　あるいは、原子や機能ラベルの種類に応じて、異なる色で点が表示されてもよい。
　その他、点群画像による具体的な表示の内容は限定されない。
　なお、点群はポイントクラウド（Point Cloud）と呼称されることもある。

　ポリゴン画像とは、データが多角形により表現された画像である。例えばタンパク質の局所的な形状が、三角形や四角形で表現される。

　メッシュ画像とは、データが複数の多角形により表現された画像である。例えばタンパク質の形状が、三角形や四角形を繋ぎ合わせた形状で表現される。メッシュ画像は、ポリゴン画像の集まりとも言える。

　サーフェス画像とは、データが滑らかな曲面により表現された画像である。例えばタンパク質の形状が、滑らかな曲面で表現される。

　スライス画像とは、タンパク質の断面が表現された画像である。例えば点群画像の所定の位置における断面図が、スライス画像として表示される。あるいは、ポリゴン画像、メッシュ画像、又はサーフェス画像の断面図が表示されてもよい。

　三面図とは、タンパク質を三方向から見た場合の形状が表現された画像である。例えば、タンパク質の所定の面を正面として、正面図、上面図、下面図、右側面図、左側面図、背面図等、任意の方向から見た図が三面図に含まれてよい。

　これらの表示形式で立体構造画像３２が表示されることにより、ユーザはタンパク質の構造等を直感的に把握することが可能となる。
　また、スライス画像により、ユーザはタンパク質の内部構造（外側から見えない構造）を、容易に把握することが可能となる。
　なお、表示形式、スライス画像における断面の位置、及び三面図における方向等は、例えばユーザが設定ボタン等を介して適宜変更することが可能である。

　その他、立体構造画像３２の具体的な表示形式は限定されない。
　立体構造画像３２は、本技術に係るタンパク質画像の一実施形態に相当する。

　［入力操作］
　入力部８により、入力情報が取得される（ステップ２０３）。
　本実施形態では、入力情報は、立体構造画像３２に対する入力操作に応じた情報を含む。
　すなわちユーザは、表示部２１に表示された立体構造画像３２を確認しながら、立体構造画像３２に対して入力操作を行うことが可能となる。このようにして、立体構造１９の編集が実現される。

　例えば「原子の配置の変更」という編集が行われる場合に、入力操作として、「立体構造画像３２内の原子を表す点に対するドラッグ操作」が実行される。
　当該操作は、立体構造画像３２に対する入力操作となる。

　また本実施形態では、入力操作に、タンパク質の構造の編集操作、又はタンパク質の機能の編集操作の少なくとも一方が含まれる。
　例えば「原子の配置の変更」はタンパク質の構造の編集であり、それに対応する「立体構造画像３２内の原子を表す点に対するドラッグ操作」は、タンパク質の構造の編集操作である。

　タンパク質の構造の編集、及びタンパク質の構造の編集操作のその他のバリエーションについて説明する。
　例えば原子の配置の変更のみならず、原子の新たな配置、削除、選択、種類（α炭素、β炭素、酸素、窒素等）の変更といった編集も可能である。
　これらの編集は、立体構造画像３２内の原子を表す点に対する、クリック操作やドラッグ操作等により実現される。
　この場合入力情報としては、「原子Ａを削除」「原子Ａの新たな種類は炭素」等の情報が、入力部８により取得される。
　あるいは、分子、官能基、タンパク質の主鎖や側鎖について、同様の編集が可能であってもよい。この場合、分子等の変形といった編集が可能であってもよい。

　また、所望の領域に対して、まとめて原子等を配置することが可能であってもよい。
　すなわち、１点に対してピンポイントに原子等を配置する方法のみならず、例えばドラッグ操作により所望の領域を指定し、その領域全てに原子等をまとめて配置する方法がとられてもよい。
　同様に、領域内の全ての原子等をまとめて選択、移動、削除等することが可能であってもよい。

　また、原子同士の結合関係が編集可能であってもよい。
　例えば２つの原子をクリック操作により指定し、右クリックにより結合の種類の選択画面を表示させる。そして、チェックボックス等により、所望の種類（水素結合等）を選択する。

　また、ユーザによりタンパク質の骨格（大まかな形状）のみが指定され、指定された骨格に従って、詳細な原子等の配置が自動的に決定されてもよい。

　タンパク質の機能の編集、及びタンパク質の機能の編集操作のその他のバリエーションについて説明する。
　例えば「親水」「疎水」「剛体」「非剛体」といった機能を表す機能ラベルを、局所的に付与することが可能である。
　例えばユーザは、所望の領域をドラッグ操作により選択した後、チェックボックス等により、付与させたい機能ラベルを選択する。
　この場合、例えば入力情報は「機能ラベルＡの新たな機能は親水、座標の範囲はＸ＝１０～２０、Ｙ＝１０～３０、Ｚ＝２０～４０」といった情報となる。

　機能ラベルが付与された場合、例えば付与された機能ラベルに基づいて、原子等の配置が自動的に決定される。
　例えば、ある領域に「親水」の機能ラベルが付与された場合には、その領域でタンパク質が「親水」の機能を持つように、領域内の原子等の配置が自動的に決定される。
　これにより、ユーザがタンパク質に所望の機能を持たせたいものの、どのように原子等を配置すればよいかが分からない場合であっても、機能を付与することが可能となる。

　なお、取得部７により取得されるテンプレート情報は、原子等の位置のみが決められており、種類は決められていない情報であってもよい。この場合には、例えばユーザが自ら原子等の種類を編集により指定する。
　もちろん、国際タンパク質構造データバンクのデータ等、原子等の位置及び構造の各々が決まっているテンプレート情報が、取得部７により取得されてもよい。

　その他、タンパク質の構造の編集、タンパク質の機能の編集、入力操作、及び入力情報等の具体的な内容は限定されない。
　また、編集操作を実現するために、種々のウィンドウ、ボタン、チェックボックス、タブ、入力欄等の任意のＧＵＩ（Graphical User Interface）が配置されてよい。

　なお入力操作は、画像に対する入力操作に限定されない。
　例えば文字の入力や音声認識等、画像に対する入力操作以外の入力操作により、編集が可能であってもよい。

　立体構造生成部２６により、反映立体構造が生成される（ステップ２０４）。
　具体的には、立体構造生成部２６により、取得部７から立体構造１９が取得され、入力部８から入力情報が取得される。さらに、取得された立体構造１９及び入力情報に基づいて、反映立体構造が生成される。

　例えば立体構造１９に含まれる原子Ａの種類が酸素であって、入力情報が「原子Ａの新たな種類は炭素」である場合には、反映立体構造は、立体構造１９の原子Ａを酸素から炭素に置き換えた情報となる。
　このように、立体構造１９に入力情報が反映されることで、反映立体構造が生成される。

　表示部２１に反映立体構造画像が表示される（ステップ２０５）。
　本実施形態では、表示制御部２８により、立体構造生成部２６により生成された反映立体構造に対応する反映立体構造画像の表示が制御される。
　具体的には、まず表示制御部２８により、立体構造生成部２６から反映立体構造が取得される。さらに、反映立体構造に対応する反映立体構造画像が生成され、表示部２１に対する反映立体構造画像の表示が制御される。

　反映立体構造画像３３は、立体構造画像３２と同様に、反映立体構造に含まれる原子等の三次元座標に基づいて生成される。
　例えば、図７Ａを、反映立体構造画像３３の表示例として見做すことも可能である。

　例えば、反映立体構造画像３３が新たに表示される場合には、ステップ２０２で元々表示されていた立体構造画像３２は削除される。反映立体構造画像３３の表示形式は、元々表示されていた立体構造画像３２の表示形式と同じでもよいし、異なっていてもよい。
　あるいは、立体構造画像３２が削除されることなく、立体構造画像３２及び反映立体構造画像３３の各々が、同じ表示形式で重畳される形で表示されてもよい。これにより、ユーザは自分の編集内容がどのように反映されたかを、容易に把握することが可能となる。
　反映立体構造画像３３は、本技術に係る反映タンパク質画像の一実施形態に相当する。

　操作部２２に対する入力があるか否かが判定される（ステップ２０６）。
　本実施形態では、ユーザは、反映立体構造に対して更なる編集を行うことが可能である。この場合、例えば、反映立体構造画像３３に対してクリック操作等を行う。
　編集に伴う入力操作があった場合に、判定が肯定となる。判定は、例えば入力部８により、入力操作の取得の有無に基づいて実行される。

　操作部２２に対する入力があった場合には（ステップ２０６のＹｅｓ）、入力部８により再び入力情報が取得される（ステップ２０３）。
　入力情報には、反映立体構造画像３３に対する入力操作に応じた情報が含まれる。
　そして、立体構造生成部２６により、反映立体構造及び入力情報に基づいて、新たな反映立体構造が生成される（ステップ２０４）。
　また、表示部２１に新たな反映立体構造画像３３が表示される（ステップ２０５）。

　操作部２２に対する入力がなかった場合には（ステップ２０６のＮｏ）、配列予測部２７により、配列情報６が予測される（ステップ２０７）。
　例えば入力が一定時間なかった場合に、入力がなかったと判定される。あるいは、入力終了ボタンや配列予測ボタン等のボタンが押された場合に、ステップ２０７の配列予測処理が開始されてもよい。

　［配列情報の予測］
　本実施形態では、配列予測部２７により、反映立体構造に対応する配列情報６が予測される。
　具体的には、まず配列予測部２７により、立体構造生成部２６から反映立体構造が取得される。そして、取得された反映立体構造に基づいて、配列情報６が予測される。

　また本実施形態では、配列予測部２７により、反映立体構造を入力として機械学習が実行されることで、配列情報６が予測される。
　図８Ａは、反映立体構造を入力とする学習モデルを用いた、配列情報６の予測例を示す模式図である。
　図８Ａに示すように、配列情報６を推定するための機械学習を行った学習済みの機械学習モデル３７に、反映立体構造３６が入力される。そして、機械学習モデル３７により配列情報６が予測される。
　これにより、高い精度で配列情報６を予測することが可能となる。

　図８Ｂは、教師データを用いた機械学習モデル３７の学習を説明するための模式図である。
　本実施形態では、立体構造１９が学習用データとして用いられる。この学習用データに配列情報６（教師ラベル３８）が関連付けられたデータが、教師データとして用いられる。
　従って、機械学習モデル３７は、立体構造１９と、配列情報６とを教師データとして機械学習された予測モデルとなる。
　図８Ｂに示すように、学習部３９により、教師データが用いられ、機械学習アルゴリズムに基づいて学習が実行される。これにより、機械学習モデル３７が生成される。

　本実施形態では、学習用データ（立体構造１９）に基づいて、まずグラフィカルモデルや距離マップが生成される。グラフィカルモデルや距離マップの生成は、例えば配列予測部２７により実行される。
　そして、グラフィカルモデル又は距離マップと、配列情報６（教師ラベル３８）とが学習部３９に入力されて学習が実行される。従って、立体構造１９から生成されるグラフィカルモデル又は距離マップと、配列情報６（教師ラベル３８）との組を、教師データとしているともいえる。

　グラフィカルモデルとは、確率の依存関係を表すグラフである。具体的には、グラフィカルモデルは、複数のノードと複数のエッジにより構成される。ノード同士はエッジにより結ばれ、模式的にはノードは丸、エッジはノード同士を結ぶ線で表現されることが多い。

　例えば２つのノードに関連する何らかの確率の大きさに応じて、２つノードを結ぶエッジの長さが決定される。確率が相対的に大きい場合にはエッジの距離は相対的に短くなり、確率が相対的に小さい場合にはエッジの距離は相対的に長くなる。

　本実施形態では、原子をノード、原子同士が結合している確率をエッジと見立てて、グラフィカルモデルが作成される。
　例えば原子Ａと原子Ｂが結合している確率が高い場合には、原子Ａを表すノード及び原子Ｂを表すノードが、短いエッジで結ばれる。
　一方で、結合している確率が低い場合には、ノード同士が長いエッジで結ばれる。

　なお、原子同士が結合している確率は、原子同士の距離に依存することが知られている。
　例えば原子同士の距離が短い場合には、原子同士が結合している確率が高い。一方で、距離が長い場合には、結合している確率が低い。
　すなわち、原子同士の距離をエッジと見立てて、グラフィカルモデルが作成されてもよい。

　この場合、原子同士の距離が長い場合には、ノード同士が長いエッジで結ばれる。このことは、原子同士が結合している確率が低いことも意味している。
　逆に、原子同士の距離が短い場合には、ノード同士が短いエッジで結ばれる。このことは、原子同士が結合している確率が高いことも意味している。
　また、距離が所定の閾値（例えば１０オングストローム等）よりも短い場合のみ、それらの原子同士がエッジにより結ばれてもよい。このような、距離が閾値より短い（接触しているとみなされる）原子対は、コンタクト原子対と呼称されることもある。

　また、機能ラベルがノードやエッジに埋め込まれてもよい。すなわち、機能ラベルに基づいて、ノード特徴量やエッジ特徴量が生成されてもよい。
　その他、グラフィカルモデルの具体的な生成方法は限定されない。

　距離マップは、原子同士の距離を示すマップである。例えば距離マップとして、二次元の正方形のマップが用いられる。
　例えばタンパク質を構成する各々の原子に番号が割り当てられる。そして、例えば「３０番」の原子と、「５０番」の原子との距離が、距離マップの「Ｘ＝３０、Ｙ＝５０」の位置におけるモノクロ色の明度で表現される。
　例えば原子同士の距離が短い場合には、対応する位置の色は白色に近い色となる。逆に、距離が長い場合には、黒色に近い色となる。
　その他、カラー色の明度、彩度、及び色相等により距離が表現されてもよい。

　また、距離マップとしてコンタクトマップが生成されてもよい。
　コンタクトマップは、距離マップと同様の二次元の正方形のマップであり、距離マップに含まれる。
　コンタクトマップにおいては、原子同士の距離が所定の閾値よりも短い場合に、対応する位置の色が白色となる。逆に、距離が閾値よりも長い場合には、黒色となる。
　このようにコンタクトマップは、原子同士の距離が「０又は１」で表現されたマップとなる。

　生成されたグラフィカルモデルや距離マップに基づいて、学習が実行される。
　学習においては、例えばワンホットエンコーディングにより表された配列情報６が、教師ラベル３８として用いられる。
　ワンホットエンコーディングとは、ダミー変数（０）を含むデータの表示形式である。
　具体的には１つのアミノ酸残基が、２０桁のワンホットエンコーディングにより表現される。例えば１６番目のアミノ酸である「セリン（Ｓ）」は、１６番目のみが１であり、その他は０である「０００００００００００００００１００００」という数値列で表現される。
　同様に、例えば５つのアミノ酸からなるアミノ酸配列がワンホットエンコーディングにより表現される場合には、１００桁の数値列となる。
　なお、上記ではアミノ酸を表記するアルファベット順に順番を定義し、「セリン（Ｓ）」を１６番目としているが、もちろん順番の決め方は限定されない。

　グラフィカルモデルや距離マップ、配列情報６を用いた具体的な学習のアルゴリズムは限定されず、既知の手法等により学習が実行されてよい。
　なお、グラフィカルモデル、距離マップ、又はコンタクトマップ自体が立体構造１９に含まれ、タンパク質情報ＤＢ２に記憶されてもよい。

　表示部２１に配列情報画像が表示される（ステップ２０８）。
　本実施形態では、表示制御部２８により、配列予測部２７により予測された配列情報６に対応する配列情報画像の表示が制御される。
　具体的には、まず表示制御部２８により、配列予測部２７から配列情報６が取得される。さらに、配列情報６に対応する配列情報画像が生成され、表示部２１に対する配列情報画像の表示が制御される。

　図７Ｂには、表示部２１に配列情報画像４０が表示された状態が模式的に図示されている。
　本例では、配列情報画像４０として、アミノ酸配列を示すアルファベットの文字列が表示されている。
　これに限定されず、例えばアミノ酸配列の構造式や示性式等、配列情報６に対応する任意の画像が表示されてよい。

　出力部２９により、配列情報６が出力される（ステップ２０８）。
　具体的には、まず出力部２９により配列予測部２７から配列情報６が取得される。さらに、配列情報ＤＢ３、記憶部２４、その他の記憶媒体等に対して配列情報が出力される。
　これによりユーザは、予測された配列情報６を容易に管理することが可能となる。

　図６の処理における、配列情報画像４０の表示（ステップ２０８）及び配列情報６の出力（ステップ２０９）の処理は、逆の順番で実行されてもよい。すなわち、配列情報６が出力された後に、配列情報画像４０の表示が実行されてもよい。
　その他、配列情報６の予測に係る具体的な処理の内容は限定されない。

　以上、本実施形態に係る配列生成システム１では、立体構造１９が取得され、立体構造１９に対するユーザの入力操作に応じた入力情報が入力される。また、立体構造１９と入力情報とに基づいて、アミノ酸配列に関する配列情報６が生成される。これにより、所望のタンパク質を効率よく生成することが可能となる。

　タンパク質は、数十から数百のアミノ酸がペプチド結合することにより形成され、細胞内で固有の３次元構造に折りたたまれ、機能を持つ。
　例えばある種の抗体タンパク質は、ウイルスや抗原をキャッチする構造を形成することで、免疫として作用する。
　タンパク質の構造はタンパク質の機能に直結するため、タンパク質の構造を理解することは非常に重要な研究課題である。

　しかしながら従来は、１次元のアミノ酸配列と３次元のタンパク質の構造との間の関係が十分に理解されていなかった。
　そのため、有機化合物の合成において、所望の構造や機能を有するタンパク質を生成するために、微生物培養と実験的解析のトライアンドエラーを繰り返す必要があり、膨大な時間や手間、コストがかかっていた。

　近年では、アミノ酸配列を入力とし、そこからニューラルネットワークにより立体構造の形状を予測する方法や装置が提案されている。
　これらの構造予測技術は近年大きく進化しており、例えばＣｏｖｉｄ－１９の構造解析等にも利用され、急速なワクチン開発にも貢献している。
　また、グラフィカルモデルのエンコーダやデコーダを用いたタンパク質構造のモデリングも提案されてきている。

　一方で、所望の立体構造を得るにはどのようなアミノ酸配列を生成すればよいかという課題は依然として存在する。この課題に対して、立体構造を入力として、グラフニューラルネットワークを用いてアミノ酸配列を予測する手法も提案されてきている。
　このような、有機化合物合成の低スループット（効率）の問題を解決するための更なる手法が求められている。

　本技術に係る配列生成システムでは、ユーザに対してタンパク質デザインソフトウェアが提供される。ユーザはタンパク質情報を作成・編集することで、所望のタンパク質をインタラクティブにデザインすることが可能となる。
　これにより、有機化合物合成や創薬における培養・解析サイクルのスループットを大幅に高めることができる。

　また本実施形態では、立体構造１９に対して入力情報が反映された反映立体構造３６が生成され、反映立体構造３６に対応する配列情報６が予測される。
　これにより、編集内容が高精度に反映され、精度よく配列情報６が予測される。

　また本実施形態では、タンパク質構造の編集や機能の編集が可能である。また、機能の編集として、タンパク質の親水性や剛性の編集が可能である。
　これにより、ユーザは高い自由度で編集を行うことが可能となる。また、得られるタンパク質の機能を想定しながら編集を行うことが可能となる。

　また、立体構造画像３２や反映立体構造画像３３が表示部２１に表示される。
　これにより、ユーザは自分の編集操作がどのように反映されているかを確認しながら編集を行うことが可能となる。
　さらに、配列情報画像４０が表示部２１に表示される。
　これにより、ユーザは予測された配列情報がどのようなものであるかを容易に把握することが可能となる。

　また、立体構造画像３２や反映立体構造画像３３に対して、編集のための入力操作を行うことが可能である。
　これにより、ユーザは簡便かつ直感的な操作で編集を行うことが可能となる。

　＜第２の実施形態＞
　図９～図１１を参照して、本技術に係る配列生成システム１について、さらに詳細な実施形態を、第２の実施形態として説明する。
　これ以降の説明では、上記の実施形態で説明した配列生成システム１における構成及び作用と同様な部分については、その説明を省略又は簡略化する。
　本実施形態では、配列予測部２７により予測された配列情報６に基づいて、さらに立体構造１９が予測される。

　図９は、配列生成システム１の構成例を示すブロック図である。
　本実施形態では、コントローラ２０のＣＰＵが本技術に係るプログラムを実行することで、機能ブロックとして、さらに、立体構造予測部４３及び立体構造誤差算出部４４が実現される。

　立体構造予測部４３は、配列予測部２７により予測された配列情報６に対応する立体構造１９を、予測立体構造として予測する。
　具体的には、まず立体構造予測部４３により、配列予測部２７から配列情報６が取得される。さらに、取得された配列情報６に基づいて予測立体構造の予測が実行される。

　配列情報６により表されたアミノ酸配列により、あるタンパク質が生成される場合に、そのタンパク質に関する情報が予測立体構造として予測される。
　すなわち本実施形態では、立体構造１９はあるタンパク質Ａに関する情報であり、配列情報６はタンパク質Ａの元となるアミノ酸配列に関する情報であり、予測立体構造は「タンパク質Ａの元となるアミノ酸配列により生成されるタンパク質に関する情報」となる。
　すなわち、立体構造１９及び予測立体構造は、基本的には類似する情報となる。
　一方で、配列情報６及び予測立体構造は予測処理により生成されるため、予測の過程で誤差が生じる場合もありうる。従って、立体構造１９及び予測立体構造が完全には一致せず、誤差が現れる場合もありうる。

　立体構造予測部４３により予測された予測立体構造は、表示制御部２８及び立体構造誤差算出部４４に出力される。
　立体構造予測部４３は、本技術に係るタンパク質予測部の一実施形態に相当する。
　予測立体構造は、本技術に係る予測タンパク質情報の一実施形態に相当する。

　立体構造誤差算出部４４は、反映立体構造３６と、立体構造予測部４３により予測された予測立体構造との差分を算出する。
　なお、差分は誤差と言うことも可能である。以降、反映立体構造３６及び予測立体構造の情報の差を、差分と表記する場合、及び誤差と表記する場合があるが、各々の言葉の使い分けに特別な意味はない。

　立体構造誤差算出部４４により算出された差分は、表示制御部２８に出力される。
　立体構造生成部２６、配列予測部２７、出力部２９、及び立体構造予測部４３は、本技術に係る生成部の一実施形態に相当する。

　また本実施形態では、表示制御部２８により、反映立体構造３６と予測立体構造との差分に対応する差分画像の表示が制御される。
　具体的には、まず表示制御部２８により、立体構造生成部２６から反映立体構造３６が取得され、立体構造予測部４３から予測立体構造が取得される。さらに、取得された反映立体構造３６及び予測立体構造に基づいて差分画像が生成され、表示部２１に対する表示が制御される。

　図１０及び図１１は、差分画像の生成等に関する処理例を示すフローチャートである。
　図１２は、差分画像の一例を示す模式図である。
　図１０に示すステップ３０１～３０９では、図６に示すステップ２０１～２０９と同様の処理が実行される。

　立体構造予測部４３により、予測立体構造が予測される（ステップ３１０）。
　本実施形態では、立体構造予測部４３により、配列情報６を入力として機械学習が実行されることで、予測立体構造が予測される。
　これにより、高い精度で予測立体構造を予測することが可能となる。
　学習は、配列情報６（学習用データ）及び立体構造１９（教師ラベル）が関連付けられた教師データが用いられ、実行される。
　学習のための具体的なアルゴリズムは限定されず、既知の手法等により学習が実行されてよい。

　立体構造誤差算出部４４により、差分が算出される（ステップ３１１）。
　例えば立体構造誤差算出部４４により、反映立体構造３６及び予測立体構造に共通して含まれる原子の座標のズレが、差分として算出される。
　反映立体構造３６における原子Ａの座標が「Ｘ＝２０、Ｙ＝１０、Ｚ＝４０」、予測立体構造における原子Ａの座標が「Ｘ＝２２、Ｙ＝１３、Ｚ＝３９」である場合には、算出される差分は「Ｘ＝２、Ｙ＝３、Ｚ＝－１」という情報となる。
　あるいは、平均二乗偏差（RMSD、Root Mean Square Deviation）や平均絶対誤差（MAE、Mean Absolute Error）といった指標により、差分が算出されてもよい。

　また、同じ位置における原子等の種類の違いが、差分として算出されてもよい。
　例えば反映立体構造３６のある位置における原子が炭素であり、予測立体構造の当該位置における原子が酸素である場合、算出される差分は「原子の種類が異なる」という情報となる。あるいは、「原子の種類は炭素と酸素」というように、各々の原子の種類を含んだ情報が算出されてもよい。

　その他、機能が付与された位置のズレ、機能の種類の違い、結合の位置や種類の違い等、反映立体構造３６及び予測立体構造の情報の差を表す任意の情報が、差分として算出されてよい。

　表示制御部２８により、差分画像が生成される（ステップ３１２）。
　本実施形態では、表示制御部２８により、差分画像として、反映立体構造画像３３と、予測立体構造に対応する予測立体構造画像とが互いに重畳された画像が生成される。
　具体的には、まず表示制御部２８により、立体構造予測部４３から予測立体構造が取得される。また、取得された予測立体構造に基づいて、予測立体構造画像が生成される。さらに、ステップ３０５で生成された反映立体構造画像３３、及び予測立体構造画像に基づいて、これらが互いに重畳された差分画像が生成される。

　図１２には、反映立体構造画像３３が白色で図示されている。また、予測立体構造画像３４が網掛け模様で図示されている。そして、これらの画像が重畳された画像が、差分画像３５となる。

　予測立体構造画像３４は、予測立体構造に基づいて、立体構造画像３２の生成と同様の方法で生成される。
　予測立体構造画像３４は、本技術に係る予測タンパク質画像の一実施形態に相当する。

　例えば反映立体構造３６と予測立体構造とが一致している場合には、反映立体構造画像３３及び予測立体構造画像３４も同一の画像となる。この場合、差分画像３５は同一の画像同士が重畳された画像となるため、１つの立体構造１９を表すように見える画像となる。
　一方で、反映立体構造３６及び予測立体構造に誤差が生じている場合には、差分画像３５は２つの立体構造１９がずれて表されたように見える画像となる。
　図１２には、反映立体構造３６及び予測立体構造に誤差が生じており、反映立体構造画像３３及び予測立体構造画像３４がずれている状態が、一例として示されている。

　また本実施形態では、表示制御部２８により、差分画像３５として、反映立体構造画像３３と予測立体構造画像３４とが互いに重畳され、反映立体構造３６と予測立体構造との差分が強調表示された画像が生成される。
　具体的には、表示制御部２８により、立体構造誤差算出部４４から差分が取得される。さらに、反映立体構造画像３３、予測立体構造画像３４、及び差分に基づいて、２つの画像が互いに重畳され、差分が強調表示された差分画像３５が生成される。

　例えば、差分が相対的に大きい位置が強調表示される。
　具体的には、ある位置における座標値の差が所定の閾値より大きい場合に、２つの画像が重畳された画像の、当該位置が異なる色で表示される。
　図１２に示す例では、右下の原子において位置にズレが生じているため、当該部分が強調表示されている。

　また、座標値のみならず、原子等の種類、機能ラベルの位置や種類等の差分が相対的に大きい位置が強調表示されてもよい。
　逆に、差分が相対的に小さい位置が強調表示されてもよい。
　なお、強調表示の具体的な方法は限定されない。例えば点滅あるいはグラデーション等により強調表示がされてもよい。

　もちろん、差分画像３５として強調表示を含まない画像が生成されてもよい。
　また、反映立体構造画像３３及び予測立体構造画像３４が互いに重畳された画像以外の、任意の差分画像３５が生成されてよい。例えば２枚の画像を単に横に並べただけの画像が生成されてもよい。

　表示部２１に差分画像３５が表示される（ステップ３１３）。
　具体的には、表示制御部２８により、表示部２１に対する差分画像３５の表示が制御される。
　これにより、ユーザは予測された配列情報６の妥当性について評価することが可能となる。
　また、ユーザは自分が編集により作成した反映立体構造３６と、予測された予測立体構造との誤差を、直感的に把握することが可能となる。
　例えば差分画像３５内のズレが大きい場所を確認し、誤差を修正するために、反映立体構造３６の当該位置を編集する。このようにして、効率よく立体構造１９の編集を行うことが可能となり、有機化合物合成のスループット改善を図ることができる。

　なお、画像のみならず、具体的な数値により差分が表示されることで、ユーザに対して誤差が提示されてもよい。
　その他、ユーザに対する誤差の具体的な提示の方法は限定されない。

　＜第３の実施形態＞
　図１３～図１５を参照して、本技術に係る配列生成システム１について、さらに詳細な実施形態を、第３の実施形態として説明する。
　本実施形態では、差分に基づいて、配列生成システム１側で反映立体構造３６が自動的に修正される。

　図１３は、配列生成システム１の構成例を示すブロック図である。
　本実施形態では、コントローラ２０のＣＰＵが本技術に係るプログラムを実行することで、機能ブロックとして、さらに修正部４７が実現される。

　修正部４７は、立体構造誤差算出部４４により算出された差分に基づいて、修正情報を生成する。
　立体構造生成部２６、配列予測部２７、出力部２９、立体構造予測部４３、及び修正部４７により、本技術に係る生成部の一実施形態が実現される。

　図１４及び図１５は、反映立体構造３６の修正に関する処理例を示すフローチャートである。
　ステップ４０１～４１３では、図１０及び図１１に示すステップ３０１～３１３と同様の処理が実行される。

　反映立体構造３６の修正が必要か否かが判定される（ステップ４１４）。
　例えば、差分（誤差）が所定の閾値よりも大きい場合に、修正が必要であると判定される。あるいは、ユーザにより修正ボタンが押された場合に、修正が必要であると判定されてもよい。
　判定は、例えば修正部４７により実行される。

　修正が必要であると判定された場合（ステップ４１４のＹｅｓ）、反映立体構造３６の修正が実行される（ステップ４１５）。
　本実施形態では、修正部４７及び立体構造生成部２６により、反映立体構造３６と、立体構造予測部４３により予測された予測立体構造との差分に基づいて、反映立体構造３６が修正される。

　具体的には、まず修正部４７により、立体構造誤差算出部４４から差分が取得される。そして、取得された差分に基づいて修正情報が生成される。
　例えば反映立体構造３６の原子Ａの座標が「Ｘ＝２０、Ｙ＝１０、Ｚ＝４０」、予測立体構造の原子Ａの座標が「Ｘ＝２２、Ｙ＝１３、Ｚ＝３９」である場合には、差分は「Ｘ＝２、Ｙ＝３、Ｚ＝－１」という情報となる。
　この場合修正部４７により、修正情報として、「原子Ａの座標値にＸ＝＋２、Ｙ＝＋３、Ｚ＝－１を加算する」という情報が生成される。
　修正部４７により生成された修正情報は、立体構造生成部２６に出力される。

　立体構造生成部２６は、修正部４７から取得された修正情報に基づいて、反映立体構造３６を修正した修正立体構造を生成する。
　例えば反映立体構造３６の原子Ａの座標「Ｘ＝２０、Ｙ＝１０、Ｚ＝４０」に、修正情報に基づいて、「Ｘ＝＋２、Ｙ＝＋３、Ｚ＝－１」が加算される。その結果、原子Ａの座標が「Ｘ＝２２、Ｙ＝１３、Ｚ＝３９」である修正立体構造が生成される。

　生成された修正立体構造は、予測立体構造と一致する情報となる。
　すなわち本例では、反映立体構造３６をそのまま予測立体構造に修正する処理が実行される。
　もちろん修正の具体的な内容は限定されない。例えば反映立体構造３６及び予測立体構造の「平均を取った構造」が、予測立体構造として生成されてもよい。この場合、例えば各々の原子の座標値が平均値として算出される。
　あるいは、原子の種類、分子等の位置や種類、結合の位置や種類、機能ラベルの位置や種類等、任意の情報が修正されてよい。
　また、反映立体構造３６と予測立体構造とが一致する（誤差が生じていない）場合に、修正が実行されなくてもよい。

　立体構造生成部２６により修正立体構造が生成された後、再び表示部２１に反映立体構造画像３３が表示される（ステップ４０５）。
　反映立体構造画像３３は、修正立体構造に基づいて生成される。すなわち、修正が反映された反映立体構造画像３３が表示される。
　ユーザは反映立体構造画像３３に対する操作を行うことで、さらに修正立体構造の編集を行うことが可能である。

　修正が必要でないと判定された場合には（ステップ４１４のＮｏ）、処理が終了する。

　本実施形態では、差分（誤差）に基づいて、反映立体構造３６が配列生成システム１側で自動的に修正される。これにより、ユーザによる反映立体構造３６の修正の手間が省かれ、効率よくタンパク質をデザインすることが可能となる。

　＜その他の実施形態＞
　本技術は、以上説明した実施形態に限定されず、他の種々の実施形態を実現することができる。

　第２の実施形態又は第３の実施形態において、立体構造予測部４３により予測された予測立体構造、及び配列予測部２７により予測された配列情報６を教師データとして、配列予測部２７の学習が実行されてもよい。
　これにより、高精度に配列予測が予測可能となる。
　この場合、特に第３の実施形態においては、修正の処理が複数回繰り返し実行され、処理の度に配列情報６及び予測立体構造が予測される。これらが用いられ、処理の度に配列予測部２７の学習が実行されてもよい。これにより、配列予測部２７の予測精度をさらに向上させることが可能となる。

　図１に示すタンパク質情報ＤＢ２又は配列情報ＤＢ３の一部または全部の機能が、情報処理装置４に搭載されてもよい。あるいは、携帯可能な情報処理装置４が用いられ、タンパク質情報ＤＢ２又は配列情報ＤＢ３の一部または全部の機能が搭載されてもよい。
　配列生成システム１は、複数のコンピュータにより実現されてもよいし、１台のコンピュータにより実現されてもよい。

　図１６は、情報処理装置４を実現可能なコンピュータ５００のハードウェア構成例を示すブロック図である。
　コンピュータ５００は、ＣＰＵ５０１、ＲＯＭ５０２、ＲＡＭ５０３、入出力インタフェース５０５、及びこれらを互いに接続するバス５０４を備える。入出力インタフェース５０５には、表示部５０６、操作部５０７、記憶部５０８、通信部５０９、及びドライブ部５１０等が接続される。
　表示部５０６は、例えば液晶、ＥＬ等を用いた表示デバイスである。操作部５０７は、例えばキーボード、ポインティングデバイス、タッチパネル、その他の操作装置である。操作部５０７がタッチパネルを含む場合、そのタッチパネルは表示部５０６と一体となり得る。
　記憶部５０８は、不揮発性の記憶デバイスであり、例えばＨＤＤ、フラッシュメモリ、その他の固体メモリである。ドライブ部５１０は、例えば光学記録媒体、磁気記録テープ等、リムーバブル記録媒体５１１を駆動することが可能なデバイスである。
　通信部５０９は、ＬＡＮ、ＷＡＮ等に接続可能な、他のデバイスと通信するためのモデム、ルータ、その他の通信機器である。通信部５０９は、有線及び無線のどちらを利用して通信するものであってもよい。通信部５０９は、コンピュータ５００とは別体で使用される場合が多い。
　上記のようなハードウェア構成を有するコンピュータ５００による情報処理は、記憶部５０８またはＲＯＭ５０２等に記憶されたソフトウェアと、コンピュータ５００のハードウェア資源との協働により実現される。具体的には、ＲＯＭ５０２等に記憶された、ソフトウェアを構成するプログラムをＲＡＭ５０３にロードして実行することにより、本技術に係る情報処理方法が実現される。
　プログラムは、例えばリムーバブル記録媒体５１１を介してコンピュータ５００にインストールされる。あるいは、グローバルネットワーク等を介してプログラムがコンピュータ５００にインストールされてもよい。その他、コンピュータ５００が読み取り可能な非一過性の任意の記憶媒体が用いられてよい。

　ネットワーク等を介して通信可能に接続された複数のコンピュータが協働することで、本技術に係る情報処理方法が実行され、本技術に係る配列生成システム及び情報処理装置が構築されてもよい。
　すなわち本技術に係る情報処理方法は、単体のコンピュータにより構成されたコンピュータシステムのみならず、複数のコンピュータが連動して動作するコンピュータシステムにおいても実行可能である。
　なお本開示において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれもシステムである。
　コンピュータシステムによる本技術に係る情報処理方法の実行は、例えばタンパク質情報の取得、入力情報の入力、反映タンパク質情報の生成や修正、配列情報の予測や出力、予測タンパク質情報の予測、差分の算出、修正情報の生成、及びタンパク質画像等の表示等が、単体のコンピュータにより実行される場合、及び各処理が異なるコンピュータにより実行される場合の両方を含む。また所定のコンピュータによる各処理の実行は、当該処理の一部または全部を他のコンピュータに実行させその結果を取得することを含む。
　すなわち本技術に係る情報処理方法は、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成にも適用することが可能である。

　各図面を参照して説明した配列生成システム、情報処理装置、表示部による表示の内容、各処理フロー等はあくまで一実施形態であり、本技術の趣旨を逸脱しない範囲で、任意に変形可能である。すなわち本技術を実施するための他の任意の構成やアルゴリズム等が採用されてよい。

　本開示において、「略」という文言が使用される場合、これはあくまで説明の理解を容易とするための使用であり、「略」という文言の使用／不使用に特別な意味があるわけではない。
　すなわち、本開示において、「中心」「中央」「均一」「等しい」「同じ」「直交」「平行」「対称」「延在」「軸方向」「円柱形状」「円筒形状」「リング形状」「円環形状」「平均」等の、形状、サイズ、位置関係、状態等を規定する概念は、「実質的に中心」「実質的に中央」「実質的に均一」「実質的に等しい」「実質的に同じ」「実質的に直交」「実質的に平行」「実質的に対称」「実質的に延在」「実質的に軸方向」「実質的に円柱形状」「実質的に円筒形状」「実質的にリング形状」「実質的に円環形状」「実質的に平均」等を含む概念とする。
　例えば「完全に中心」「完全に中央」「完全に均一」「完全に等しい」「完全に同じ」「完全に直交」「完全に平行」「完全に対称」「完全に延在」「完全に軸方向」「完全に円柱形状」「完全に円筒形状」「完全にリング形状」「完全に円環形状」「完全に平均」等を基準とした所定の範囲（例えば±１０％の範囲）に含まれる状態も含まれる。
　従って、「略」の文言が付加されていない場合でも、いわゆる「略」を付加して表現される概念が含まれ得る。反対に、「略」を付加して表現された状態について、完全な状態が排除される訳ではない。

　本開示において、「Ａより大きい」「Ａより小さい」といった「より」を使った表現は、Ａと同等である場合を含む概念と、Ａと同等である場合を含まない概念の両方を包括的に含む表現である。例えば「Ａより大きい」は、Ａと同等は含まない場合に限定されず、「Ａ以上」も含む。また「Ａより小さい」は、「Ａ未満」に限定されず、「Ａ以下」も含む。
　本技術を実施する際には、上記で説明した効果が発揮されるように、「Ａより大きい」及び「Ａより小さい」に含まれる概念から、具体的な設定等を適宜採用すればよい。

　以上説明した本技術に係る特徴部分のうち、少なくとも２つの特徴部分を組み合わせることも可能である。すなわち各実施形態で説明した種々の特徴部分は、各実施形態の区別なく、任意に組み合わされてもよい。また上記で記載した種々の効果は、あくまで例示であって限定されるものではなく、また他の効果が発揮されてもよい。

　なお、本技術は以下のような構成も採ることができる。
（１）
　タンパク質に関するタンパク質情報を取得する取得部と、
　前記取得部により取得された前記タンパク質情報に対するユーザの入力操作に応じた入力情報が入力される入力部と、
　前記取得部により取得された前記タンパク質情報と、前記入力部に入力された前記入力情報とに基づいて、アミノ酸配列に関する配列情報を生成する生成部と
　を具備する情報処理装置。
（２）（１）に記載の情報処理装置であって、
　前記生成部は、前記タンパク質情報に対して前記入力情報が反映された反映タンパク質情報を生成し、前記反映タンパク質情報に対応する前記配列情報を予測する
　情報処理装置。
（３）（２）に記載の情報処理装置であって、
　前記生成部は、前記反映タンパク質情報を入力として機械学習を実行することで、前記配列情報を予測する
　情報処理装置。
（４）（１）から（３）のうちいずれか１つに記載の情報処理装置であって、
　前記タンパク質情報は、前記タンパク質の構造、又は前記タンパク質の機能の少なくとも一方を含み、
　前記入力操作は、前記タンパク質の構造の編集操作、又は前記タンパク質の機能の編集操作の少なくとも一方を含む
　情報処理装置。
（５）（４）に記載の情報処理装置であって、
　前記タンパク質の機能は、前記タンパク質の親水性、又は前記タンパク質の剛性の少なくとも一方を含む
　情報処理装置。
（６）（１）から（５）のうちいずれか１つに記載の情報処理装置であって、さらに、
　前記生成部により生成された前記配列情報に対応する前記タンパク質情報を、予測タンパク質情報として予測するタンパク質予測部を具備する
　情報処理装置。
（７）（６）に記載の情報処理装置であって、
　前記タンパク質予測部は、前記配列情報を入力として機械学習を実行することで、前記予測タンパク質情報を予測する
　情報処理装置。
（８）（６）又は（７）に記載の情報処理装置であって、
　前記生成部は、前記反映タンパク質情報と、前記タンパク質予測部により予測された前記予測タンパク質情報との差分に基づいて、前記反映タンパク質情報を修正する
　情報処理装置。
（９）（２）又は（３）に記載の情報処理装置であって、さらに、
　前記取得部により取得された前記タンパク質情報に対応するタンパク質画像の表示を制御する表示制御部を具備する
　情報処理装置。
（１０）（９）に記載の情報処理装置であって、
　前記入力情報は、前記タンパク質画像に対する前記入力操作に応じた情報を含む
　情報処理装置。
（１１）（９）又は（１０）に記載の情報処理装置であって、
　前記表示制御部は、前記生成部により生成された前記反映タンパク質情報に対応する反映タンパク質画像の表示を制御する
　情報処理装置。
（１２）（１１）に記載の情報処理装置であって、
　前記入力情報は、前記反映タンパク質画像に対する前記入力操作に応じた情報を含む
　情報処理装置。
（１３）（９）から（１２）のうちいずれか１つに記載の情報処理装置であって、
　前記表示制御部は、前記生成部により予測された前記配列情報に対応する配列情報画像の表示を制御する
　情報処理装置。
（１４）（９）から（１３）のうちいずれか１つに記載の情報処理装置であって、さらに、
　前記生成部により予測された前記配列情報に対応する前記タンパク質情報を、予測タンパク質情報として予測するタンパク質予測部を具備し、
　前記表示制御部は、前記反映タンパク質情報と前記予測タンパク質情報との差分に対応する差分画像の表示を制御する
　情報処理装置。
（１５）（１４）に記載の情報処理装置であって、
　前記差分画像は、前記反映タンパク質画像と、前記予測タンパク質情報に対応する予測タンパク質画像とが互いに重畳された画像を含む
　情報処理装置。
（１６）（１５）に記載の情報処理装置であって、
　前記差分画像は、前記反映タンパク質画像と前記予測タンパク質画像とが互いに重畳され、前記反映タンパク質情報と前記予測タンパク質情報との差分が強調表示された画像を含む
　情報処理装置。
（１７）（９）から（１６）のうちいずれか１つに記載の情報処理装置であって、さらに、
　前記生成部により生成された前記配列情報に対応する前記タンパク質情報を、予測タンパク質情報として予測するタンパク質予測部を具備し、
　前記表示制御部は、前記タンパク質画像、前記生成部により生成された前記反映タンパク質情報に対応する反映タンパク質画像、又は前記予測タンパク質情報に対応する予測タンパク質画像の少なくとも１つを、点群画像、ポリゴン画像、メッシュ画像、サーフェス画像、スライス画像、又は三面図の少なくとも１つの表示形式により表示するように、表示を制御する
　情報処理装置。
（１８）（１）から（１７）のうちいずれか１つに記載の情報処理装置であって、
　前記タンパク質情報は、前記タンパク質情報の雛形であるテンプレート情報を含む
　情報処理装置。
（１９）
　タンパク質に関するタンパク質情報を取得し、
　取得された前記タンパク質情報に対するユーザの入力操作に応じた入力情報を入力し、
　取得された前記タンパク質情報と、入力された前記入力情報とに基づいて、アミノ酸配列に関する配列情報を生成する
　ことをコンピュータシステムが実行する情報処理方法。
（２０）
　タンパク質に関するタンパク質情報を取得するステップと、
　取得された前記タンパク質情報に対するユーザの入力操作に応じた入力情報を入力するステップと、
　取得された前記タンパク質情報と、入力された前記入力情報とに基づいて、アミノ酸配列に関する配列情報を生成するステップと
　をコンピュータシステムに実行させるプログラム。
（２１）（１）から（１８）のうちいずれか１つに記載の情報処理装置であって、
　前記生成部は、前記配列情報をファイルとして出力する
　情報処理装置。

　１…配列生成システム
　４…情報処理装置
　５…タンパク質情報
　６…配列情報
　７…取得部
　８…入力部
　９…生成部
　１２…第１の情報処理装置
　１３…第２の情報処理装置
　１９…立体構造
　２６…立体構造生成部
　２７…配列予測部
　２８…表示制御部
　２９…出力部
　３２…立体構造画像
　３３…反映立体構造画像
　３４…予測立体構造画像
　３５…差分画像
　３６…反映立体構造
　３７…機械学習モデル
　４０…配列情報画像
　４３…立体構造予測部
　４４…立体構造誤差算出部
　４７…修正部

Claims

　タンパク質に関するタンパク質情報を取得する取得部と、
　前記取得部により取得された前記タンパク質情報に対するユーザの入力操作に応じた入力情報が入力される入力部と、
　前記取得部により取得された前記タンパク質情報と、前記入力部に入力された前記入力情報とに基づいて、アミノ酸配列に関する配列情報を生成する生成部と
　を具備する情報処理装置。
　請求項１に記載の情報処理装置であって、
　前記生成部は、前記タンパク質情報に対して前記入力情報が反映された反映タンパク質情報を生成し、前記反映タンパク質情報に対応する前記配列情報を予測する
　情報処理装置。
　請求項２に記載の情報処理装置であって、
　前記生成部は、前記反映タンパク質情報を入力として機械学習を実行することで、前記配列情報を予測する
　情報処理装置。
　請求項１に記載の情報処理装置であって、
　前記タンパク質情報は、前記タンパク質の構造、又は前記タンパク質の機能の少なくとも一方を含み、
　前記入力操作は、前記タンパク質の構造の編集操作、又は前記タンパク質の機能の編集操作の少なくとも一方を含む
　情報処理装置。
　請求項４に記載の情報処理装置であって、
　前記タンパク質の機能は、前記タンパク質の親水性、又は前記タンパク質の剛性の少なくとも一方を含む
　情報処理装置。
　請求項１に記載の情報処理装置であって、さらに、
　前記生成部により生成された前記配列情報に対応する前記タンパク質情報を、予測タンパク質情報として予測するタンパク質予測部を具備する
　情報処理装置。
　請求項６に記載の情報処理装置であって、
　前記タンパク質予測部は、前記配列情報を入力として機械学習を実行することで、前記予測タンパク質情報を予測する
　情報処理装置。
　請求項６に記載の情報処理装置であって、
　前記生成部は、前記反映タンパク質情報と、前記タンパク質予測部により予測された前記予測タンパク質情報との差分に基づいて、前記反映タンパク質情報を修正する
　情報処理装置。
　請求項２に記載の情報処理装置であって、さらに、
　前記取得部により取得された前記タンパク質情報に対応するタンパク質画像の表示を制御する表示制御部を具備する
　情報処理装置。
　請求項９に記載の情報処理装置であって、
　前記入力情報は、前記タンパク質画像に対する前記入力操作に応じた情報を含む
　情報処理装置。
　請求項９に記載の情報処理装置であって、
　前記表示制御部は、前記生成部により生成された前記反映タンパク質情報に対応する反映タンパク質画像の表示を制御する
　情報処理装置。
　請求項１１に記載の情報処理装置であって、
　前記入力情報は、前記反映タンパク質画像に対する前記入力操作に応じた情報を含む
　情報処理装置。
　請求項９に記載の情報処理装置であって、
　前記表示制御部は、前記生成部により予測された前記配列情報に対応する配列情報画像の表示を制御する
　情報処理装置。
　請求項９に記載の情報処理装置であって、さらに、
　前記生成部により予測された前記配列情報に対応する前記タンパク質情報を、予測タンパク質情報として予測するタンパク質予測部を具備し、
　前記表示制御部は、前記反映タンパク質情報と前記予測タンパク質情報との差分に対応する差分画像の表示を制御する
　情報処理装置。
　請求項１４に記載の情報処理装置であって、
　前記差分画像は、前記反映タンパク質画像と、前記予測タンパク質情報に対応する予測タンパク質画像とが互いに重畳された画像を含む
　情報処理装置。
　請求項１５に記載の情報処理装置であって、
　前記差分画像は、前記反映タンパク質画像と前記予測タンパク質画像とが互いに重畳され、前記反映タンパク質情報と前記予測タンパク質情報との差分が強調表示された画像を含む
　情報処理装置。
　請求項９に記載の情報処理装置であって、さらに、
　前記生成部により生成された前記配列情報に対応する前記タンパク質情報を、予測タンパク質情報として予測するタンパク質予測部を具備し、
　前記表示制御部は、前記タンパク質画像、前記生成部により生成された前記反映タンパク質情報に対応する反映タンパク質画像、又は前記予測タンパク質情報に対応する予測タンパク質画像の少なくとも１つを、点群画像、ポリゴン画像、メッシュ画像、サーフェス画像、スライス画像、又は三面図の少なくとも１つの表示形式により表示するように、表示を制御する
　情報処理装置。
　請求項１に記載の情報処理装置であって、
　前記タンパク質情報は、前記タンパク質情報の雛形であるテンプレート情報を含む
　情報処理装置。
　タンパク質に関するタンパク質情報を取得し、
　取得された前記タンパク質情報に対するユーザの入力操作に応じた入力情報を入力し、
　取得された前記タンパク質情報と、入力された前記入力情報とに基づいて、アミノ酸配列に関する配列情報を生成する
　ことをコンピュータシステムが実行する情報処理方法。
　タンパク質に関するタンパク質情報を取得するステップと、
　取得された前記タンパク質情報に対するユーザの入力操作に応じた入力情報を入力するステップと、
　取得された前記タンパク質情報と、入力された前記入力情報とに基づいて、アミノ酸配列に関する配列情報を生成するステップと
　をコンピュータシステムに実行させるプログラム。