JP7357336B2 - 情報解析システム、方法、およびプログラム - Google Patents

情報解析システム、方法、およびプログラム Download PDF

Info

Publication number
JP7357336B2
JP7357336B2 JP2019132559A JP2019132559A JP7357336B2 JP 7357336 B2 JP7357336 B2 JP 7357336B2 JP 2019132559 A JP2019132559 A JP 2019132559A JP 2019132559 A JP2019132559 A JP 2019132559A JP 7357336 B2 JP7357336 B2 JP 7357336B2
Authority
JP
Japan
Prior art keywords
information
protein
amount
gene
analysis system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019132559A
Other languages
English (en)
Other versions
JP2021016325A (ja
Inventor
幸代 油谷
倫史 亀田
克郎 矢追
通啓 荒木
智量 白井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2019132559A priority Critical patent/JP7357336B2/ja
Publication of JP2021016325A publication Critical patent/JP2021016325A/ja
Application granted granted Critical
Publication of JP7357336B2 publication Critical patent/JP7357336B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Description

特許法第30条第2項適用 平成30年7月19日 シンポジウム「バイオで切り拓くモノづくりの新潮流 ~スマートセル創出プラットフォームの構築と実証~(第20回新産業技術促進検討会)」において発表
特許法第30条第2項適用 平成30年8月15日 第36回日本植物細胞分子生物学会講演要旨集において発表
特許法第30条第2項適用 平成30年8月26日 第36回日本植物細胞分子生物学会において発表
特許法第30条第2項適用 平成30年8月29日 研究評価委員会「植物等の生物を用いた高機能品生産技術の開発」(中間評価)分科会において発表
特許法第30条第2項適用 平成30年9月25日 「関西スマートセルフォーラム2018」第1回セミナーにおいて発表
特許法第30条第2項適用 平成30年9月27日 経済産業省北海道経済産業局 意見交換において発表
特許法第30条第2項適用 平成30年10月10日 BioJapan2018 NEDOセミナーにおいて発表
特許法第30条第2項適用 平成30年11月9日 第2回千葉県バイオ・ライフサイエンス・ネットワーク会議セミナーにおいて発表
特許法第30条第2項適用 平成31年1月18日 ライフサイエンス技術部会 反応分科会 講演会「スマートセルインダストリー創出に向けた技術開発」において発表
特許法第30条第2項適用 平成31年2月1日 2019HOBIA 第127回新年例会において発表
特許法第30条第2項適用 平成31年2月13日 沖縄県庁商工労働部ものづくり振興課 意見交換において発表
特許法第30条第2項適用 平成31年2月20日 「植物等の生物を用いた高機能品生産技術の開発/研究開発項目[4]微生物による高機能品生産技術開発」に係る公募説明会(川崎会場)において発表
特許法第30条第2項適用 平成31年2月21日 「植物等の生物を用いた高機能品生産技術の開発/研究開発項目[4]微生物による高機能品生産技術開発」に係る公募説明会(大阪会場)において発表
特許法第30条第2項適用 平成31年3月6日 日本学術振興会 産学協力「植物分子デザイン第178委員会」研究会において発表
本発明は、人為的に設計された細胞を構築するための情報解析システム、方法、およびプログラムに関する。
遺伝子工学技術の利用により、微生物細胞、動物細胞、植物細胞等の宿主細胞を用いて目的物質を人為的に発現させることができる。宿主細胞を改変させることにより、より好ましい目的物質を、より制御された態様で生産することが可能になる。従来、宿主細胞の改変技術は、生物学的実験により大量の生物学的データ(ウェットデータ)を取得が必須であり、それに基づいて改変を行う、というものであった。高精度のルール抽出のためには、より大量の生物学的実験データが必要であった。
近年、微生物細胞、動物細胞、植物細胞等の細胞が持つ物質生産能力を人工的に最大限引き出した「スマートセル」(人為的に設計された細胞)を構築することで、化学合成では生産が難しい有用物質の創製、または従来法の生産性をしのぐ技術の実現が期待されている(例えば、非特許文献1:「スマートセルインダストリー -微生物細胞を用いた物質清算の展望-」、2018年6月、株式会社 シーエムシー出版)。スマートセルの研究を可能にしたのは、DNAシークエンシング技術の進化等によるゲノム解析コストの低減と・短時間化で生体情報爆発的な増加、ITやAI技術の進化で生体ビックデータの解析による生物機能の解明と機能改変等に向けたゲノムデザインの現実化、ゲノム編集技術CRISPR/Cas(クリスパーキャス)の登場による、と考えられている。これらに技術により、宿主細胞の精緻な生物機能の改変、発現制御の現実化が可能になりつつある。
しかしながら、スマートセルの開発は未だ途上であり、スマートセルを構築するためのシステムは得られていない。
「スマートセルインダストリー -微生物細胞を用いた物質清算の展望-」、2018年6月、株式会社 シーエムシー出版 「生物工学」第96巻 第10号、公益社団法人 日本生物学会、2018年、p.578-p.581 Nature Biotechnology, volume 28, pages 245-248 (2010)
本発明は、人為的に設計された細胞を構築するための情報解析システム、方法、およびプログラムを提供するものである。
上記課題を解決するために、本発明の一態様は、人為的に設計された細胞を構築するための情報解析システムであって、宿主細胞のゲノム情報、遺伝子発現情報、タンパク質発現情報及び代謝産物量情報からなる群から選択される、2以上の情報を用いて公知の代謝経路より目的物質の生産量が向上する代謝経路を示す拡張代謝モデルを生成する拡張代謝モデル生成部と、拡張代謝モデル生成部によって生成された拡張代謝モデルをFBA(flux balance analysis)ツールによって解析することによって、前記目的物質の前記宿主細胞による生産量に関与するタンパク質であるキータンパク質を推定するキータンパク質推定部と、キータンパク質推定部によって推定されたキータンパク質の活性と前記目的物質の生産量との関係性を提示する関係性提示部と、を備える情報解析システムである。
また、本発明の他の態様は、人為的に設計された細胞を構築するためのコンピュータシステムによって実行される方法であって、宿主細胞のゲノム情報、遺伝子発現情報、タンパク質発現情報及び代謝産物量情報からなる群から選択される、2以上の情報を用いて公知の代謝経路より目的物質の生産量が向上する代謝経路を示す拡張代謝モデルを生成するステップと、前記生成された拡張代謝モデルをFBA(flux balance analysis)ツールによって解析することによって、前記目的物質の前記宿主細胞による生産量に関与するタンパク質であるキータンパク質を推定するステップと、前記推定されたキータンパク質の活性と前記目的物質の生産量との関係性を提示するステップと、を含む方法である。
また、本発明の他の態様は、上記の方法をコンピュータシステムに実行させるためのプログラムである。
本発明に係る情報解析システム、方法、およびプログラムを用いれば、大量の生物学的データ(ウェットデータ)を必要とせず、より低コストで効率良く宿主細胞改変を行うことが可能である。
本発明の一実施形態に係る情報解析システムの全体像を示す図である。 本発明の一実施形態に係る情報解析システムの構成の一例を示す図である。 M-pathツールについて説明する図である。 BioProVツールについて説明する図である。 本発明の一実施形態に係る情報解析システムの関係性提示部140によって提示されるキータンパク質の活性と目的物質の生産量との関係性の一例を示す模式図である。 本発明の一実施形態に係る情報解析システムの遺伝子改変候補解析部150における処理の具体例を示す図である。 本発明の一実施形態に係る情報解析システムの発現量改変候補配列算出部160における処理の具体例を示す図である。 本発明の一実施形態に係る情報解析システムのタンパク質機能改変配列候補算出部170における処理の具体例を示す図である。 本発明の一実施形態に係る情報解析システムのハードウェア構成の一例を示す図である。 本発明の一実施形態に係る情報解析システムにおける処理の一例を示すフロー図である。
以下、図面を参照しながら本発明の実施形態について詳しく説明する。
(情報解析システムの概要)
本実施形態に係る情報解析システムは、人為的に設計された細胞である、いわゆるスマートセルと呼ばれる細胞を構築するためのシステムである。すなわち、本実施形態の情報解析システムは、宿主細胞の遺伝子を人為的に改変させることで宿主細胞の細胞内において生じる化学反応を変化させ、これにより従来よりもより効果的に所望の物質を得ることが可能なスマートセルを構築するためのシステムである。
図1は、本実施形態に係る情報解析システムの全体像を示す図である。本実施形態に係る情報解析システムにおける処理は、全体として、左上の「標準代謝モデル」の位置から時計回りに進んでいく。中心の円12は、各ステップにおいて各情報解析技術に入力されるデータベース(DB)等の入力データを示している。また、2番目の円14は、円12の入力情報を用いて処理を実行する情報解析技術(アプリケーション)の一例を示す。また、外円16は、円14に示される情報解析技術から出力されるモデルを示す。
一般的に、スマートセルを構築するにあたり解決することが期待される課題としては、以下のような課題が挙げられる。
課題1:宿主細胞による新規物質の生成
課題2:宿主細胞における目的物質の生産量の向上
課題3:宿主細胞における目的物質の生産量の制御
課題4:目的物質の生産ボトルネックの解消
課題1は、従来は存在していなかった新規の物質、あるいは細胞中で生産することができなかった物質(以下、本明細書中において「新規物質」と呼称する場合がある)を、新たに宿主細胞に作らせることである。これにより、例えば天然には存在していなかった新規の物質を宿主細胞から収集し、当該物質を工業や産業等に活用することが可能となる。具体的には、本実施形態に係る情報解析システムは、課題1について、宿主細胞に新規物質を生成させるために新規の代謝経路を設計する。
課題2について、本実施形態に係る情報解析システムは、宿主細胞に目的物質を生産させる際の収率がより大きくなるような代謝経路を探索する。目的物質とは、宿主細胞から収集しようとする物質である。収率が改善されることにより、効率的に目的物質を宿主細胞から収集することが可能となる。本課題に関して、本実施形態の情報解析システムは、図1に示される標準代謝モデルまたは拡張代謝モデルを生成する。
課題3について、本実施形態に係る情報解析システムは、宿主細胞に生産させる目的物質の量を調整するために代謝経路および遺伝子発現の制御を行う。本実施形態に係る情報解析システムは、課題3に関して、拡張代謝モデルにフラックスバランス解析(FBA)を実行するとともに、ネットワーク解析ツールおよび配列設計ツールによって目的物質の生産量に関係するタンパク質であるキータンパク質の発現量を調整する。
課題4について、本実施形態に係る情報解析システムは、分子動力学(MD)シミュレーションおよび配列設計ツールを用いてキータンパク質の機能を改変(高機能化)する。
本実施形態に係る情報解析システムは、これらの課題に対して、従来のような大量の生物学的データ(ウェットデータ)を必要とせず、より低コストで効率良く宿主細胞改変を行うことを可能とする。
(情報解析システムの構成)
図2は、本実施形態に係る情報解析システムの構成の一例を示す図である。図2に示される情報解析システム1は、新規代謝経路設計部110と、拡張代謝モデル生成部120と、キータンパク質推定部130と、関係性提示部140と、遺伝子改変候補解析部150と、発現量改変候補配列算出部160と、タンパク質機能改変配列候補算出部170とを備える。
新規代謝経路設計部110は、新規の目的物質のための新規の代謝経路を設計する。代謝経路の設計は、例えば既存のツールである、M-pathやBioProVを使用して行うことができる。M-pathは、京都大学大学院・荒木通啓特定教授作成の代謝経路設計ツールである。また、BioProVは、国立研究開発法人理化学研究所・白井智量氏作成の代謝経路設計ツールである。
図3は、M-pathツールについて説明する図である。例えば、出発物質(出発化合物等)22から目的物質(目的化合物等)26までの新規の代謝経路を設計する場合に、実線で示される、Enz(エンザイム)2を介した物質24aまでの経路28aと、Enz0および物質24bを介したEnz1までの経路28bとが既知であるとする。ユーザがM-pathツールに出発物質22と目的物質26とを示すデータを入力すると、M-pathツールが代謝経路を探索し、画面上に出発物質22から目的物質26までの新規の代謝経路30a、30b、30cが表示される。また、M-pathツールでは、各経路中に出現する化合物(Enz0~Enz5)の化学構造が表示されるため、各経路における化学構造の変化をユーザが直感的に確認できるようになっている。ユーザは表示された新規の代謝経路30a、30b、30cから採用する代謝経路を選択することができる。
また、図4は、BioProVツールについて説明する図である。KEGG(https://www.genome.jp/kegg/)やBRENDA(https://www.brenda-enzymes.org/)といった公開データベースには、代謝反応・酵素反応に関する情報が格納されている。BioProVツールは、これらの情報から個々の酵素という概念を外し、化学反応パターンだけを抽出し、再分類化する。具体的には図4に示されるように、各化学反応における前駆体と生成物とをSMILESという表記方法で記述し、その反応メカニズムをSMIRKSという表記方法で記述する。BioProVツールにより代謝経路を設計する場合には、ユーザが目的物質をSMILES形式で記述してBioProVツールに入力する。BioProVツールは、それをもとにランダムに,かつ網羅的に前駆体を逆合成していく。その逆合成された前駆体の中に、生体内での存在が既知の化合物が出てくるとシミュレーションが成功となる.つまり,その既知の生体化合物を出発物質として,設計された人工代謝反応を実現することができれば,目的の化合物が生合成できる(非特許文献2参照)。結果、既知の化合物を出発物質とした新規の代謝経路が出力される。
図2に戻り、拡張代謝モデル生成部120は、宿主細胞のゲノム情報、遺伝子発現情報、タンパク質発現情報及び代謝産物量情報からなる群から選択される、2以上の情報を用いて公知の代謝経路より(新規または公知の)目的物質の生産量が向上する代謝経路(最適経路)を示す拡張代謝モデルを生成する。
「宿主細胞」は、所望する物質(目的物質)を生産させる細胞であり、その種類は特に限定されない。宿主細胞は、微生物細胞、動物細胞、植物細胞等を含み、好ましくは微生物である。微生物には、非原的に、大腸菌(E. coli)、酵母、枯草菌、コリネ菌、麹菌類、等が含まれる。植物細胞には、非限定的に、コムギ、トウモロコシ、イネ、等を含む。動物細胞には、非限定的に、ヒト細胞、サル細胞、ハムスター細胞、ラット細胞、マウス細胞、昆虫細胞等を含む。ゲノム編集等の技術により宿主細胞の遺伝子(ゲノム、ミトコンドリア等)を人為的に改変させてもよい。あるいは、ベクターを導入し、遺伝子を恒久的にあるいは一過的に発現させてもよい。
「遺伝子発現情報」とは、宿主細胞の遺伝子発現に関する情報である。より具体的 「遺伝子発現情報」とは、宿主細胞の遺伝子発現に関する情報である。より具体的には、遺伝子発現情報は、例えば、遺伝子発現の転写プロセスにおいて遺伝子(DNA)が転写され生産されるmRNA(メッセンジャーRNA)の種類及び量に関する情報(データ)である。「遺伝子発現情報」は、非限定的に、例えば、NCBI(米国)が公開しているGene Expression Omnibus(GEO: https://www.ncbi.nlm.nih.gov/geo/)やEMBL-EBI(欧州)が公開しているArray Express(https://www.ebi.ac.uk/arrayexpress/)、等の公知のデータベースから入手可能である。
「タンパク質発現情報」とは、宿主細胞のタンパク質発現に関する情報である。より具体的には、タンパク質発現情報は、細胞内における発現するタンパク質の種類及び量に関する情報(データ)である。「タンパク質発現情報」は、非限定的に、例えば、網羅的なヒトタンパク質の発現情報を質量分析データから同定したProteomicsDB(https://www.proteomicsdb.org/)や、質量分析の生データを登録したリポジトリデータベースとしてEMBL-EBIが公開しているPRIDE Archive(https://www.ebi.ac.uk/pride/archive/)、等の公知のデータベースから入手可能である。
「代謝産物量情報」とは、細胞内における各代謝産物(出発物質から目的物質が生成されるプロセス中において生成される中間生成物)の量に関する情報(データ)である。代謝産物には、目的物質の他、目的物質が合成されるまでの中間体物質も含まれる。
「代謝産物量情報」は、非限定的に、例えば、公益財団法人 かずさDNA研究所が公開しているMassBase(http://webs2.kazusa.or.jp/massbase/)やヒトにおける代謝産物情報をまとめたHMDB(http://www.hmdb.ca/)等の公知のデータベースから入手可能である。
「目的物質」とは、取得を目的とする所望の物質であり、宿主細胞によってから収集しようとする物質であり、例えばタンパク質(酵素、抗体、等)、糖質、脂質、核酸、等である。
拡張代謝モデル生成部120における拡張代謝モデルの生成は、例えば既存のツールであるHyMepにより実現可能である。
なお、本実施形態に係る情報解析システム1は、拡張代謝モデルの生成に加えて、標準代謝モデルを生成するようになっていてもよい。
キータンパク質推定部130は、拡張代謝モデル生成部120によって生成された拡張代謝モデルをFBA(flux balance analysis:代謝流束均衡解析)ツールによって解析することによって、目的物質の宿主細胞による生産量に関与するタンパク質であるキータンパク質を推定する。キータンパク質は、例えばキーエンザイム(酵素)である。また、「FBA(代謝流束均衡解析)」は、代謝ネットワークのゲノムスケール再構成において、(実験データを必要とせずに)代謝を数学的にシュミレートする手法である。例えば、Nature Biotechnology volume 28, pages 245-248 (2010) (非特許文献3)に詳述されている。FBAは、例えばオープンソースの「THE COBRA Toolbox」等の既存のツールを利用することもできる。
「キータンパク質」とは、宿主細胞による目的物質を生産するための代謝経路に関与するタンパク質のうち、目的物質の生産量に関与する、即ち、生産量を向上する又は生産量を減少させるのに、最も関与する1ないし複数のタンパク質である。「目的物質の生産量に関与する」とは、そのタンパク質が直接または間接的に関与することにより、他のタンパク質の関与と比較して、目的産物の生産量により大きく影響を与えることを意味する。「間接的に関与する」とは、当該タンパク質は目的物質を生産するための代謝経路に直接は関与しないか、目的物質を生産するための代謝経路に直接は関与するタンパク質の活性に影響を与え、最終的に目的産物の生産量により影響を与えることを意味する。
例えば、中間体X1→中間体X2→目的物質Zの代謝経路で目的物質が生産される場合、中間体X1→中間体X2に関与する酵素Aの活性が目的物質Zの生産量に関与する場合を想定する。この場合、目的物質Zの生産量に直接関与する酵素Aがキータンパク質の候補となり得る。さらに、酵素Aの活性にタンパク質B(例えば、酵素Aの阻害因子)が関与している場合、タンパク質Bも、目的物質Zの生産量に間接的に直接関与するタンパク質である、として、キータンパク質の候補となり得る。一つの目的物質の生産に関し、キータンパク質(の候補)は1つであるとは限らない。例えば、タンパク質Aよりもタンパク質Bの方が改変等の操作がしやすい場合、目的物質Zの生産量の制御を目的として、タンパク質Bをキータンパク質とする場合がありうる。
関係性提示部140は、キータンパク質推定部130によって推定されたキータンパク質の活性と目的物質の生産量との関係性を提示する。関係性提示部140は、例えば情報解析システム1に備えられているディスプレイに当該関係性を表示する。当該関係性の提示は、例えばFBAツールによって実行されうる。また、情報解析システム1のユーザは、関係性提示部140によって提示されたキータンパク質の活性と目的物質の生産量との関係性を確認する。
図5は、関係性提示部140によって提示されるキータンパク質の活性と目的物質の生産量との関係性の一例を示す模式図である、解糖系、クエン酸回路を含む代謝系の図である。本模式図では、ピルビン酸(PYR)からアセチルCoA(AcCoA)を合成するピルビン酸デヒドロゲナーゼ複合体、及び、アセトアルデヒ(acald)からAcCoAを合成するアセトアルデヒド脱水素酵素が、キータンパク質(の候補)の例である。
図5に示されるように、関係性提示部140によってキータンパク質の活性と目的物質の生産量との関係性が提示されることにより、いずれの遺伝子またはタンパク質を改変すべきかが明らかとなる。これに応じて、遺伝子について改変すべき場合には、遺伝子改変候補解析部150または発現量改変候補配列算出部160において改変が行われ、タンパク質について改変すべき場合には、タンパク質機能改変配列候補算出部170において改変が行われる。
次いで、関係性提示部140で提示されたキータンパク質について量的・機能的な制御を実現するために必要に応じて遺伝子改変候補解析を実施する。
遺伝子改変候補解析部150は、関係性提示部140において提示された遺伝子に関連して、遺伝子発現情報、タンパク質発現情報、および代謝産物量情報の細胞内因子量を測定したオミクスデータをネットワーク解析ツールによって解析することによって改変すべき宿主細胞の遺伝子の候補である改変候補遺伝子と、改変候補遺伝子の遺伝子発現量制御因子と、を推定する。「遺伝子発現情報、タンパク質発現情報、および代謝産物量情報の細胞内因子量」とは実験的に測定された遺伝子発現量、タンパク質発現量、および代謝産物(メタボライト)量である。また、「改変候補遺伝子の遺伝子発現量制御因子」とは、改変候補と推定された遺伝子の転写量(遺伝子発現量)を制御している遺伝子、タンパク質、もしくはそれ以外の細胞内に存在する因子や制御条件等を含む。また、「ネットワーク解析ツール」は、例えばNIHのNational Resource for Network Biology(NRNB)が提供しているCytoscape、三菱スペース・ソフトウェア株式会社のMinos等の既存のツールであってよい。
図6は、遺伝子改変候補解析部150における処理の具体例を示す図である。本例として、遺伝子発現情報及びタンパク質発現情報に基づき、統計解析推理モデリングを行い、宿主細胞の遺伝子のうち改変すべき遺伝子の候補である改変候補遺伝子を推定し、そして改変候補遺伝子の改変による遺伝子発現の変化を推定する。
また、例えば図5のように関係性提示部140によってディスプレイ等に表示された情報に対して、改変すべき遺伝子またはタンパク質をユーザが判断してクリック等して選択すると、遺伝子改変候補解析部150、発現量改変候補配列算出部160、タンパク質機能改変配列候補算出部170を実現するコンピュータプログラムが自動的に立ち上がり、当該プログラムに対して、ユーザに選択された遺伝子またはタンパク質を示すデータが渡される。そして、遺伝子改変候補解析部150、発現量改変候補配列算出部160、タンパク質機能改変配列候補算出部170を実現するプログラムは、関係性提示部140から渡されたデータによって示される遺伝子またはタンパク質についての解析が行われる、というようになっていてもよい。
発現量改変候補配列算出部160は、宿主細胞の遺伝子配列情報を配列設計ツールに入力することによってキータンパク質の発現量を改変するための宿主細胞の遺伝子配列の候補である発現量改変候補配列を算出する。「配列設計ツール」とは、例えばThermofisher Scientific社のGeneOptimizer(R)等の既存のツールであってよい。また、「発現量改変候補配列」とは、改変候補と推定された遺伝子のDNA配列のことである。
図7は、発現量改変候補配列算出部160における処理の具体例を示す図である。本例として、改変を行いたい遺伝子DNA配列を入力とし、改変候補配列を多数生成し、その中から発現量改変に効果的であると考えられる遺伝子DNA配列を選出する。
タンパク質機能改変配列候補算出部170は、キータンパク質の立体構造を分子動力学(MD)シミュレーションによって解析することによって、キータンパク質の改変候補配列を算出する。MDシミュレーション用ソフトウェアとしては、例えばBIOVIA社のBIOVIA Discovery Studio等が存在する。また、「キータンパク質の改変候補配列」とは、改変候補と推定されたタンパク質のアミノ酸配列のことである。
図8は、タンパク質機能改変配列候補算出部170における処理の具体例を示す図である。本例として、キータンパク質など、改変を行いたいタンパク質アミノ酸配列を入力とし、アミノ酸改変変異体候補を多数生成し、MDシミュレーションを実施する。その結果に基づき機能改変に効果的であると考えられるアミノ酸配列を選出する。
上記説明した本実施形態に係る情報解析システム1は、上述した各機能が実現可能なハードウェア構成を用いて様々な態様にて実施可能である。例えば、情報解析システム1は、1つの装置によって実現されてもよいし、複数の装置が各機能の一部をそれぞれ実現し、各装置が適宜ネットワークや記録媒体を介してデータのやり取りを行うことで全体として全ての機能を実現するシステムとなっていてもよい。
なお、図2に示される情報解析システム1の構成はあくまで一例であって、これに限定されるものではない。
(ハードウェア構成)
上記説明された情報解析システム1の構成は、一般的なコンピュータシステムと同様のハードウェア構成によって実現可能である。図9は、情報解析システム1のハードウェア構成の一例を示す図である。図9に示されるコンピュータシステム10は、一例として、プロセッサ11と、RAM12と、ROM13と、内蔵のハードディスク装置14と、外付けハードディスク装置、CD、DVD、USBメモリ、メモリスティック、SDカード等のリムーバブルメモリ15と、ユーザがコンピュータシステム10とデータのやり取りを行うための入出力ユーザインタフェース16(タッチパネル、キーボード、マウス、スピーカ、マイク、ランプ等)と、他のコンピュータ装置と通信可能な有線/無線の通信インタフェース17と、ディスプレイ18と、を備える。上述した情報解析システム1の各機能は、例えば、プロセッサ11が、ハードディスク装置14やROM13、リムーバブルメモリ15等にあらかじめ格納されたプログラムをRAM12等のメモリに読み出し、処理に必要な上述したデータを、ハードディスク装置14やROM13、リムーバブルメモリ15等から適宜読み出しながらプログラムを実行することで実現可能である。
また、上述したように本実施形態に係る情報解析システム1は、1つのコンピュータ装置によって実現されてもよいし複数のコンピュータ装置によって実現されてもよい。本実施形態に係る情報解析システム1が複数のコンピュータ装置によって構成される場合には、各コンピュータ装置が図9に示されるコンピュータシステム10の構成を備えていてもよい。
なお、図9に示されるハードウェア構成はあくまで一例であって、これに限定されるものではない。
(処理フロー)
図10は、本実施形態に係る情報解析システムにおける処理の一例を示すフロー図である。
情報解析システム1は、目的物質が新規であるか判断する(ステップS102)。当該判断は、以下のようにして実現可能である。すなわち、例えば情報解析システム1が備えるディスプレイに、目的物質が新規のものであるか既存のものであるかの質問メッセージが表示され、情報解析システム1のユーザはマウスやキーボード等により質問に対する回答を入力する。情報解析システム1はユーザからの操作入力を受け付けて目的物質が新規のものであるか判断する。なお、本ステップの処理は、新規代謝経路設計部110によって実行されてもよい。
ステップS102における判断が、目的物質が新規であるとの判断である場合には(ステップS102:Yes)、新規代謝経路設計部110が新規代謝経路の設計を行う(ステップS104)。新規代謝経路の設計は、例えばM-pathやBioProV等のツールの機能を用いて実行されうる。また、ステップS102における判断が、目的物質が新規ではない(既存の物質である)との判断である場合には(ステップS102:No)、本ステップはスキップされる。
次に、拡張代謝モデル生成部120が、宿主細胞のゲノム情報、遺伝子発現情報、タンパク質発現情報及び代謝産物量情報からなる群から選択される、2以上の情報を用いて拡張代謝モデルを生成する(ステップS106)。キータンパク質推定部130が、ステップS106にて生成された拡張代謝モデルをFBAツールによって解析することでキータンパク質を推定する(ステップS108)。また、関係性提示部140が、キータンパク質の活性と目的物質の生産量との関係性を情報解析システム1のディスプレイ等に提示する(ステップS110)。
情報解析システム1は、さらなる遺伝子の改変を行うか判断する(ステップS112)。行わない場合には処理を終了する(ステップS112:No)。機能改変を行う場合には(課題3に対応)ステップS114に移行する。量的制御を行う場合には(課題4に対応)ステップS120に移行する。なお、当該判断は、以下のようにして実現可能である。すなわち、例えば情報解析システム1が備えるディスプレイに、改変を行うか否か、行う場合には機能改変または量的制御のいずれを行うか、の質問メッセージが表示され、情報解析システム1のユーザはマウスやキーボード等により質問に対する回答を入力する。情報解析システム1はユーザからの操作入力を受け付けて、これ以降、いずれのステップに移行するべきかを決定する。
機能改変を行う場合には、機能解析システム1は、MDシミュレーションにより機能改変を行う。キータンパク質の立体構造をMDシミュレーションによって解析することによって、キータンパク質の改変候補配列を算出する(ステップS114)。
ステップS112において情報解析システム1が量的制御を行うと判断した場合には、機能解析システム1は、配列設計またはネットワーク解析のいずれの改変方法により機能改変を行うか決定する(ステップS120)。当該決定についても、例えば情報解析システム1が備えるディスプレイにいずれの改変方法を採用するかの質問メッセージが表示され、情報解析システム1のユーザがマウスやキーボード等により質問に対する回答を入力するようになっていてよい。そして、情報解析システム1はユーザからの操作入力を受け付けて、いずれの改変方法を採用するかを決定することができる。
配列設計を行う場合には、宿主細胞の遺伝子配列情報を配列設計ツールに入力し、キータンパク質の発現量を改変するための発現量改変候補配列を算出する(ステップS122)。また、ネットワーク解析を行う場合には、遺伝子発現情報、タンパク質発現情報、および代謝産物量情報の細胞内因子量を測定したオミクスデータをネットワーク解析ツールによって解析することによって改変すべき遺伝子の候補である改変候補遺伝子と、改変候補遺伝子の遺伝子発現量制御因子と、を推定する(ステップS124)。
ステップS110からステップS114、S122、またはS124への移行方法は、別の方法も考えられる。すなわち、ステップS110において関係性提示部140によってディスプレイ等に表示された情報に対して、改変すべき遺伝子またはタンパク質をユーザが判断してクリック等して選択すると、遺伝子改変候補解析部150、発現量改変候補配列算出部160、タンパク質機能改変配列候補算出部170を実現するコンピュータプログラムが自動的に立ち上がり、当該プログラムに対して、ユーザに選択された遺伝子またはタンパク質を示すデータが渡される。そして、遺伝子改変候補解析部150、発現量改変候補配列算出部160、タンパク質機能改変配列候補算出部170を実現するプログラムは、関係性提示部140から渡されたデータによって示される遺伝子またはタンパク質についての解析が行われる(それぞれステップS124、S122、S114が対応する)、というようになっていてもよい。
なお、前述したように本実施形態に係る情報解析システムは単一のコンピュータ装置によって実現される場合もあるし、複数のコンピュータ装置によって実現される場合もありうる。よって、上記した各処理ステップは、単一のコンピュータ装置によって実行される場合もあるし、複数のコンピュータ装置によって実行される場合もありうる。
以上において、本実施形態は、情報解析システムおよび情報解析システムによって実行される方法として説明された。しかしながら、本開示が、例えばプロセッサにより実行されると当該プロセッサに当該方法を実行させるプログラム、又は当該プログラムを格納したコンピュータ読み取り可能な記憶媒体として実施され得ることが理解されよう。
ここまで、本発明の一実施形態について説明したが、本発明は上述の実施形態に限定されず、その技術的思想の範囲内において種々異なる形態にて実施されてよいことは言うまでもない。
また、本発明の範囲は、図示され記載された例示的な実施形態に限定されるものではなく、本発明が目的とするものと均等な効果をもたらすすべての実施形態をも含む。さらに、本発明の範囲は、各請求項により画される発明の特徴の組み合わせに限定されるものではなく、すべての開示されたそれぞれの特徴のうち特定の特徴のあらゆる所望する組み合わせによって画されうる。
1 情報解析システム
110 新規代謝経路設計部
120 拡張代謝モデル生成部
130 キータンパク質推定部
140 関係性提示部
150 遺伝子改変候補解析部
160 発現量改変候補配列算出部
170 タンパク質機能改変配列候補算出部
10 コンピュータ装置
11 プロセッサ
12 RAM
13 ROM
14 ハードディスク装置
15 リムーバブルメモリ
16 入出力ユーザインタフェース
17 通信インタフェース
18 ディスプレイ

Claims (3)

  1. 人為的に設計された細胞を構築するための情報解析システムであって、
    宿主細胞のゲノム情報、遺伝子発現の転写プロセスにおいて遺伝子(DNA)が転写され生産されるmRNA(メッセンジャーRNA)の種類及び量に関する情報である遺伝子発現情報、細胞内における発現するタンパク質の種類及び量に関する情報であるタンパク質発現情報及び細胞内における、出発物質から目的物質が生成されるプロセス中において生成される中間生成物である各代謝産物の量に関する情報である代謝産物量情報からなる群から選択される、2以上の情報を用いて前記情報解析システムに記憶されている代謝経路より目的物質の生産量が向上する代謝経路を示す拡張代謝モデルを生成する拡張代謝モデル生成部と、
    前記拡張代謝モデル生成部によって生成された拡張代謝モデルをFBA(flux balance analysis)ツールによって解析することによって、前記目的物質の前記宿主細胞による生産量に関与するタンパク質であるキータンパク質を推定するキータンパク質推定部と、
    前記キータンパク質推定部によって推定されたキータンパク質の活性と前記目的物質の生産量との関係性を提示する関係性提示部と、
    前記関係性提示部において提示された前記キータンパク質について、遺伝子発現情報、タンパク質発現情報、および代謝産物量情報の細胞内因子量を測定したオミクスデータをネットワーク解析ツールによって解析した結果を用いてユーザが指定した改変すべき前記宿主細胞の遺伝子の候補である改変候補遺伝子と、前記改変候補遺伝子の遺伝子発現量制御因子と、を推定する遺伝子改変候補解析部と、
    前記宿主細胞の遺伝子配列情報を配列設計ツールに入力することによって前記キータンパク質の発現量を改変するための前記宿主細胞の遺伝子配列の候補である発現量改変候補配列を算出する発現量改変候補配列算出部と、
    前記キータンパク質の立体構造が分子動力学(MD)シミュレーションに入力されることによって、前記キータンパク質の改変候補配列を算出するタンパク質配列改変候補算出部と、
    前記目的物質が前記情報解析システムに記憶されていない新規物質であり、当該新規物質を合成するための前記情報解析システムに記憶されていない新規の代謝経路を設計する新規代謝経路設計部と、
    を備える情報解析システム。
  2. 人為的に設計された細胞を構築するための情報解析システムによって実行される方法であって、
    宿主細胞のゲノム情報、遺伝子発現の転写プロセスにおいて遺伝子(DNA)が転写され生産されるmRNA(メッセンジャーRNA)の種類及び量に関する情報である遺伝子発現情報、細胞内における発現するタンパク質の種類及び量に関する情報であるタンパク質発現情報及び細胞内における、出発物質から目的物質が生成されるプロセス中において生成される中間生成物である各代謝産物の量に関する情報である代謝産物量情報からなる群から選択される、2以上の情報を用いて前記情報解析システムに記憶されている代謝経路より目的物質の生産量が向上する代謝経路を示す拡張代謝モデルを生成するステップと、
    前記生成された拡張代謝モデルをFBA(flux balance analysis)ツールによって解析することによって、前記目的物質の前記宿主細胞による生産量に関与するタンパク質であるキータンパク質を推定するステップと、
    前記推定されたキータンパク質の活性と前記目的物質の生産量との関係性を提示するステップと、
    前記関係性が提示された前記キータンパク質について、遺伝子発現情報、タンパク質発現情報、および代謝産物量情報の細胞内因子量を測定したオミクスデータをネットワーク解析ツールによって解析した結果を用いてユーザが指定した改変すべき前記宿主細胞の遺伝子の候補である改変候補遺伝子と、前記改変候補遺伝子の遺伝子発現量制御因子と、を推定するステップと、
    前記宿主細胞の遺伝子配列情報を配列設計ツールに入力することによって前記キータンパク質の発現量を改変するための前記宿主細胞の遺伝子配列の候補である発現量改変候補配列を算出するステップと、
    前記キータンパク質の立体構造が分子動力学(MD)シミュレーションに入力されることによって、前記キータンパク質の改変候補配列を算出するステップと、
    前記目的物質が前記情報解析システムに記憶されていない新規物質であり、当該新規物質を合成するための前記情報解析システムに記憶されていない新規の代謝経路を設計するステップと、
    を含む方法。
  3. 請求項に記載の方法を情報解析システムに実行させるためのプログラム。
JP2019132559A 2019-07-18 2019-07-18 情報解析システム、方法、およびプログラム Active JP7357336B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019132559A JP7357336B2 (ja) 2019-07-18 2019-07-18 情報解析システム、方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019132559A JP7357336B2 (ja) 2019-07-18 2019-07-18 情報解析システム、方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2021016325A JP2021016325A (ja) 2021-02-15
JP7357336B2 true JP7357336B2 (ja) 2023-10-06

Family

ID=74562921

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019132559A Active JP7357336B2 (ja) 2019-07-18 2019-07-18 情報解析システム、方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP7357336B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005507108A (ja) 2001-10-26 2005-03-10 ザ・レジェンツ・オブ・ザ・ユニバーシティ・オブ・カリフォルニア 酵母代謝をモデリングするための組成物および方法
JP2006503373A (ja) 2002-10-15 2006-01-26 ザ・レジェンツ・オブ・ザ・ユニバーシティ・オブ・カリフォルニア 実施反応経路を同定するための方法およびシステム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005507108A (ja) 2001-10-26 2005-03-10 ザ・レジェンツ・オブ・ザ・ユニバーシティ・オブ・カリフォルニア 酵母代謝をモデリングするための組成物および方法
JP2006503373A (ja) 2002-10-15 2006-01-26 ザ・レジェンツ・オブ・ザ・ユニバーシティ・オブ・カリフォルニア 実施反応経路を同定するための方法およびシステム

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
「植物等の生物を用いた高機能品生産技術の開発」中間報告書, 国立研究開発法人新エネルギー・産業技術総合研究機構 研究評価委員会, 2018, 「第2章 評価対象事業に係る資料」pp.269-383
Microb. Cell Fact., 2016, Vol.15, Article No.13
アグリバイオ, 2017, Vol.1, No.12, pp.68-72
第12回日本ゲノム微生物学会年会要旨集, 2018, p.66

Also Published As

Publication number Publication date
JP2021016325A (ja) 2021-02-15

Similar Documents

Publication Publication Date Title
Nookaew et al. The genome-scale metabolic model iIN800 of Saccharomyces cerevisiae and its validation: a scaffold to query lipid metabolism
Helmy et al. Systems biology approaches integrated with artificial intelligence for optimized metabolic engineering
Hur et al. A global approach to analysis and interpretation of metabolic data for plant natural product discovery
McCloskey et al. Basic and applied uses of genome‐scale metabolic network reconstructions of Escherichia coli
Price et al. Genome-scale microbial in silico models: the constraints-based approach
Miskovic et al. Production of biofuels and biochemicals: in need of an ORACLE
Kim et al. Methods for integration of transcriptomic data in genome-scale metabolic models
Stephanopoulos Synthetic biology and metabolic engineering
Copeland et al. Computational tools for metabolic engineering
Price et al. Genome-scale models of microbial cells: evaluating the consequences of constraints
Ruppin et al. Metabolic reconstruction, constraint-based analysis and game theory to probe genome-scale metabolic networks
JP4870547B2 (ja) 調節された反応ネットワークの全体的特性を決定するためのモデルおよび方法
Czajka et al. Integrated knowledge mining, genome-scale modeling, and machine learning for predicting Yarrowia lipolytica bioproduction
Wei et al. Reconstruction of genome-scale metabolic model of Yarrowia lipolytica and its application in overproduction of triacylglycerol
Lu et al. Multiscale models quantifying yeast physiology: towards a whole-cell model
Pathania et al. Metabolic systems biology and multi-omics of cyanobacteria: Perspectives and future directions
Brandl et al. Current state of genome-scale modeling in filamentous fungi
St John et al. Approaches to computational strain design in the multiomics era
Sarkar et al. Minnow: a principled framework for rapid simulation of dscRNA-seq data at the read level
Kerkhoven Advances in constraint-based models: methods for improved predictive power based on resource allocation constraints
Martínez et al. Dynamic modeling of CHO cell metabolism using the hybrid cybernetic approach with a novel elementary mode analysis strategy
Chua et al. Identifying a gene knockout strategy using a hybrid of the bat algorithm and flux balance analysis to enhance the production of succinate and lactate in Escherichia coli
Nookaew et al. Genome-scale metabolic models of Saccharomyces cerevisiae
Trinh et al. Elementary mode analysis: a useful metabolic pathway analysis tool for reprograming microbial metabolic pathways
Yen et al. Designing metabolic engineering strategies with genome-scale metabolic flux modeling

Legal Events

Date Code Title Description
A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20190815

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220513

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230818

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230908

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230919

R150 Certificate of patent or registration of utility model

Ref document number: 7357336

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150