WO2021256055A1

WO2021256055A1 - 情報処理装置、情報処理装置の作動方法、情報処理装置の作動プログラム

Info

Publication number: WO2021256055A1
Application number: PCT/JP2021/014592
Authority: WO
Inventors: 雅也長瀬
Original assignee: 富士フイルム株式会社
Priority date: 2020-06-19
Filing date: 2021-04-06
Publication date: 2021-12-23
Also published as: US20230118920A1; CN115843381A; JPWO2021256055A1; EP4170027A1; JP7459254B2; EP4170027A4

Abstract

生体試料に関する複数のバイオマーカーのそれぞれに付与されたアノテーション情報を取得する取得処理と、アノテーション情報に基づいて、複数のバイオマーカー毎の評価値を導出する導出処理と、評価値に基づいて、複数のバイオマーカーの中から測定対象のバイオマーカーを選択する選択処理と、をプロセッサが実行する情報処理装置の作動方法。

Description

情報処理装置、情報処理装置の作動方法、情報処理装置の作動プログラム

　本開示の技術は、情報処理装置、情報処理装置の作動方法、情報処理装置の作動プログラムに関する。

　ｉＰＳ細胞（ｉｎｄｕｃｅｄ　Ｐｌｕｒｉｐｏｔｅｎｔ　Ｓｔｅｍ　Ｃｅｌｌ）等の生体試料を研究対象とした分野では、細胞クローンのバリエーション、薬剤の投与量といったパラメータを種々変更した多水準の実験を組んで、それにより得られたバイオマーカーを参照して、分化能といった生体試料の特性を解明することが行われている。バイオマーカーは、例えば培養中に細胞が発現する遺伝子およびタンパク質、培養中に細胞から出される代謝物、あるいは、二酸化炭素濃度、ｐＨ（ｐｏｔｅｎｔｉａｌ　ｏｆ　Ｈｙｄｒｏｇｅｎ）といった細胞の培養環境に関する要素を含む。

　バイオマーカーの代表例である遺伝子の検査として、ＲＮＡ（Ｒｉｂｏｎｕｃｌｅｉｃ　Ａｃｉｄ）シーケンシング（ＲＮＡ－Ｓｅｑ（Ｓｅｑｕｅｎｃｉｎｇ））が知られている。ＲＮＡ－Ｓｅｑは、数万個の遺伝子の発現量を網羅的に測定可能である。このため生体試料の特性の解明は捗る。ただし検査に時間が掛かるうえ比較的高価であるので、多水準実験への展開は難しい。

　遺伝子は非常に膨大な数があり、その中には生体試料の特性の解明にあまり貢献しないものもある。このため、多水準実験向けに、より効果的に生体試料の特性を解明するためには、膨大な数の遺伝子の中から、生体試料の特性の解明に貢献すると考えられる遺伝子を測定対象として選択して絞り込むことが重要である。

　従来、測定対象の遺伝子を選択する方法としては、主に以下の２つがあった。第１の方法は、研究者の経験知に基づく方法である。具体的には、細胞の挙動に影響を与えることが既に知られている遺伝子である先行知見遺伝子を測定対象として選択する。第２の方法は、遺伝子の発現量の実際の測定結果からデータドリブンで遺伝子を選択する方法である。具体的には、少数のサンプルで予備実験を行い、いったん網羅的に遺伝子の発現量を測定した上で、発現量が特異的に変動している遺伝子である発現変動遺伝子（ＤＥＧｓ；Ｄｉｆｆｅｒｅｎｔｉａｌｌｙ　Ｅｘｐｒｅｓｓｅｄ　Ｇｅｎｅｓ）の一部を測定対象として選択する。例えば＜Ａｒａｖｉｎｄ　Ｓｕｂｒａｍａｎｉａｎ他、「Ａ　Ｎｅｘｔ　Ｇｅｎｅｒａｔｉｏｎ　Ｃｏｎｎｅｃｔｉｖｉｔｙ　Ｍａｐ：　Ｌ１０００　ｐｌａｔｆｏｒｍ　ａｎｄ　ｔｈｅ　ｆｉｒｓｔ　１，０００，０００　ｐｒｏｆｉｌｅｓ」、２０１５年１１月３０日発行、Ｃｅｌｌ、Ｖｏｌｕｍｅ　１７１、　ＩＳＳＵＥ　６、　Ｐ１４３７－１４５２．ｅ１７、インターネット〈ＵＲＬ：https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5990023/〉＞には、高度なデータ解析手法によって、データドリブンで抽出したＤＥＧｓから、全遺伝子の挙動の８０％以上を説明可能なＤＥＧｓを測定対象として選択することが記載されている。

　しかしながら、先行知見遺伝子を測定対象として選択する第１の方法では、研究者の経験知に頼るために先行知見遺伝子の数に限界があり、生体試料の特性の解明に貢献すると考えられる遺伝子を適切に選択し得るとは言い難かった。また、ＤＥＧｓの一部を測定対象として選択する第２の方法では、単純に変動量が特異的というだけで選択しているので、多水準実験に展開した結果、研究者の知見が乏しいマイナーな遺伝子が生体試料の特性の解明に特に貢献することが分かった場合に、どうすれば細胞の培養成績が向上するのかといった指針を得ることが難しかった。

　本開示の技術に係る１つの実施形態は、生体試料の特性の解明に繋がる、より適切な測定対象のバイオマーカーを選択することが可能な情報処理装置、情報処理装置の作動方法、情報処理装置の作動プログラムを提供する。

　本開示の情報処理装置の作動方法は、生体試料に関する複数のバイオマーカーのそれぞれに付与されたアノテーション情報を取得する取得処理と、アノテーション情報に基づいて、複数のバイオマーカー毎の評価値を導出する導出処理と、評価値に基づいて、複数のバイオマーカーの中から測定対象のバイオマーカーを選択する選択処理と、をプロセッサが実行する。

　プロセッサは、注目する生体試料の特性に関するアノテーション情報を選定して、選定したアノテーション情報のみに基づいて評価値を導出することが好ましい。

　プロセッサは、バイオマーカーに対するアノテーション情報が登録されたデータベースを参照して、バイオマーカーに対してアノテーション情報を付与することが好ましい。

　アノテーション情報には、生体試料の種類が関連付けられていることが好ましい。

　プロセッサは、生体試料の種類に応じて定義された複数のカテゴリ、および複数のカテゴリ毎の測定対象のバイオマーカーの個数の範囲のユーザによる指定を受け付け、複数のカテゴリ毎に用意されたバイオマーカーから、範囲を満たす数のバイオマーカーを選択し、選択したバイオマーカーを、測定対象のバイオマーカーとして複数のカテゴリのそれぞれに割り振ることが好ましい。

　カテゴリは、ｉＰＳ細胞、外胚葉、中胚葉、および内胚葉を含むことが好ましい。

　プロセッサは、複数のバイオマーカー毎にアノテーション情報の付与数を計数し、付与数に基づいて評価値を導出することが好ましい。

　プロセッサは、アノテーション情報の情報価値に応じて、評価値に対して重み付けを行うことが好ましい。

　プロセッサは、稀少性が比較的高いアノテーション情報を情報価値が高いと判断して、重み付けを重くすることが好ましい。

　プロセッサは、アノテーション情報の直交性に基づいて、評価値に対して重み付けを行うことが好ましい。

　プロセッサは、強度指標が予め設定された閾値範囲内にあるバイオマーカーの評価値の重み付けを重くすることが好ましい。

　プロセッサは、生体試料の特性に影響を与えることが既に知られているバイオマーカーである先行知見マーカーのユーザによる指定を受け付け、先行知見マーカーの評価値の重み付けを重くすることが好ましい。

　プロセッサは、１００個超１０００個以下の測定対象のバイオマーカーを選択することが好ましい。

　バイオマーカーは遺伝子を含むことが好ましい。

　遺伝子は、発現量が特異的に変動している発現変動遺伝子を含むことが好ましい。

　アノテーション情報は、遺伝子オントロジーで定義された用語であることが好ましい。

　プロセッサは、測定対象のバイオマーカーの測定結果を取得し、測定結果に基づいて、統計的な手法によって、測定対象のバイオマーカーに付与されたアノテーション情報から、生体試料の特性への影響度が比較的高いアノテーション情報を選出し、選出したアノテーション情報をユーザに提示することが好ましい。

　本開示の情報処理装置は、少なくとも１つのプロセッサを備え、プロセッサは、生体試料に関する複数のバイオマーカーのそれぞれに付与されたアノテーション情報を取得し、アノテーション情報に基づいて、複数のバイオマーカー毎の評価値を導出し、評価値に基づいて、複数のバイオマーカーの中から測定対象のバイオマーカーを選択する。

　本開示の情報処理装置の作動プログラムは、生体試料に関する複数のバイオマーカーのそれぞれに付与されたアノテーション情報を取得する取得処理と、アノテーション情報に基づいて、複数のバイオマーカー毎の評価値を導出する導出処理と、評価値に基づいて、複数のバイオマーカーの中から測定対象のバイオマーカーを選択する選択処理と、をプロセッサに実行させる。

　本開示の技術によれば、生体試料の特性の解明に繋がる、より適切な測定対象のバイオマーカーを選択することが可能な情報処理装置、情報処理装置の作動方法、情報処理装置の作動プログラムを提供することができる。

情報処理装置等を示す図である。遺伝子発現情報を示す図である。アノテーション情報テーブルを示す図である。アノテーション情報を示す表である。ｉＰＳ細胞から三胚葉、三胚葉から組織細胞に分化する様子を示す図である。情報処理装置の処理の概要を示す図である。情報処理装置を構成するコンピュータを示すブロック図である。情報処理装置のＣＰＵの処理部を示すブロック図である。カテゴリ指定画面とカテゴリおよび個数範囲指定情報とを示す図である。カテゴリ指定画面上に警告画面がポップアップ表示された状態を示す図である。選択部の処理の概要を示す図である。先行知見遺伝子指定画面と先行知見遺伝子指定情報とを示す図である。抽出対象指定画面と抽出対象指定情報とを示す図である。ＤＥＧｓリストを示す図である。配信情報を示す図である。取得部において付与済ＤＥＧｓリストを生成する様子を示す図である。導出部において評価値テーブルを生成する様子を示す図である。選択部において、先行知見遺伝子を無条件で測定対象遺伝子として選択する様子を示す図である。選択部において、評価値テーブルから選択順位表群を生成する様子を示す図である。選択部において、個数範囲を満たす数のＤＥＧｓを選択し、選択したＤＥＧｓを測定対象遺伝子として割り振る様子を示す図である。測定対象遺伝子リストを示す図である。抽出部および取得部の処理の概要を示す図である。導出部および選択部の処理の概要を示す図である。測定対象遺伝子表示画面を示す図である。情報処理装置の処理手順を示すフローチャートである。稀少性が比較的高いアノテーション情報を情報価値が高いと判断して、当該アノテーション情報の付与数を多くする例を示す図である。３個のＤＥＧｓに対するアノテーション情報の付与状況を示す表である。強度指標が予め設定された閾値範囲内にある遺伝子の評価値の重み付けを重くする第３実施形態を示す図である。測定対象遺伝子の発現量の測定結果を取得し、測定結果に基づいて高影響アノテーション情報を選出する第４実施形態を示す図である。選出部において高影響アノテーション情報を選出する処理の手順を示すフローチャートである。選出部において、測定結果を参照して、測定対象遺伝子から高発現遺伝子を抽出する様子を示す図である。選出部において、付与済ＤＥＧｓリストから、高発現遺伝子に付与されたアノテーション情報を抜粋する様子を示す図である。選出部において、高発現遺伝子に付与されたアノテーション情報の各々について、オッズ比およびｐ値を算出し、ｐ値が０．０５未満のアノテーション情報を、高影響アノテーション情報として選出する様子を示す図である。高影響アノテーション情報表示画面を示す図である。実施例の測定対象遺伝子であるＣ１０００を選択するために指定された先行知見遺伝子、および抽出されたＤＥＧｓを示す表である。比較例のマイクロアレイの発現量の測定結果を示す図である。マイクロアレイで測定に用いた遺伝子から選出した高影響アノテーション情報を示す表である。マイクロアレイで測定に用いた遺伝子から選出した高影響アノテーション情報を示す表である。Ｃ１０００の発現量の測定結果を示す図である。Ｃ１０００から選出した高影響アノテーション情報、および高影響アノテーション情報が付与された遺伝子を示す表である。Ｃ１０００の測定遺伝子のセットによるオッズ比の棒グラフである。比較例のＴａｑＭａｎスコアカードの測定遺伝子のセットによるオッズ比の棒グラフである。

　［第１実施形態］
　図１において、情報処理装置１０は、例えばデスクトップ型のパーソナルコンピュータであり、本開示の技術に係る「生体試料」の一例である細胞の研究者等のユーザにより操作される。情報処理装置１０はネットワーク１１に接続されている。ネットワーク１１は、例えば、インターネットあるいは公衆通信網等のＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）である。

　情報処理装置１０は、ネットワーク１１を介して、遺伝子発現情報データベース（以下、ＤＢ（Ｄａｔａ　Ｂａｓｅ）と略す）サーバ１２、およびアノテーション情報ＤＢサーバ１３と接続されている。遺伝子発現情報ＤＢサーバ１２は遺伝子発現情報ＤＢ１４を有する。遺伝子発現情報ＤＢ１４は、例えば、アメリカ国立バイオテクノロジーセンター（ＮＣＢＩ；Ｎａｔｉｏｎａｌ　Ｃｅｎｔｅｒ　ｆｏｒ　Ｂｉｏｔｅｃｈｎｏｌｏｇｙ　Ｉｎｆｏｒｍａｔｉｏｎ）が提供するＧＥＯ（Ｇｅｎｅ　Ｅｘｐｒｅｓｓｉｏｎ　Ｏｍｎｉｂｕｓ）である。遺伝子発現情報ＤＢ１４には、不特定多数の研究者からアップロードされた膨大な遺伝子発現情報１５がオープンデータとして登録されている。遺伝子発現情報１５は、培養中に細胞が発現する遺伝子の量、すなわち発現量に関する情報である。なお、遺伝子は、本開示の技術に係る「バイオマーカー」の一例である。

　遺伝子発現情報ＤＢサーバ１２は、情報処理装置１０から第１配信要求７２（図８参照）を受信する。遺伝子発現情報ＤＢサーバ１２は、第１配信要求７２に応じた遺伝子発現情報１５を遺伝子発現情報ＤＢ１４から読み出す。そして、読み出した遺伝子発現情報１５を情報処理装置１０に配信する。

　アノテーション情報ＤＢサーバ１３はアノテーション情報ＤＢ１６を有する。アノテーション情報ＤＢ１６は、例えば、アメリカ国立アレルギー・感染症研究所（ＮＩＡＩＤ；Ｎａｔｉｏｎａｌ　Ｉｎｓｔｉｔｕｔｅ　ｏｆ　Ａｌｌｅｒｇｙ　ａｎｄ　Ｉｎｆｅｃｔｉｏｕｓ　Ｄｉｓｅａｓｅｓ）が提供するＤＡＶＩＤ（Ｔｈｅ　Ｄａｔａｂａｓｅ　ｆｏｒ　Ａｎｎｏｔａｔｉｏｎ，　Ｖｉｓｕａｌｉｚａｔｉｏｎ　ａｎｄ　Ｉｎｔｅｇｒａｔｅｄ　Ｄｉｓｃｏｖｅｒｙ）、および／または、欧州バイオインフォマティクス研究所（ＥＢＩ；Ｅｕｒｏｐｅａｎ　Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ　Ｉｎｓｔｉｔｕｔｅ）が提供するＩｎｔｅｒＰｒｏである。アノテーション情報ＤＢ１６には、複数の遺伝子のそれぞれについて、対応するアノテーション情報が登録されている。すなわち、アノテーション情報ＤＢ１６は、本開示の技術に係る「データベース」の一例である。

　アノテーション情報ＤＢサーバ１３は、情報処理装置１０から第２配信要求７５（図８参照）を受信する。アノテーション情報ＤＢサーバ１３は、第２配信要求７５に応じたアノテーション情報をアノテーション情報ＤＢ１６から読み出す。そして、読み出したアノテーション情報を含む配信情報７６（図８参照）を情報処理装置１０に配信する。

　図２に示すように、遺伝子発現情報１５は、遺伝子毎に発現量が登録された情報である。遺伝子発現情報１５には、発現量を測定した生体試料の種類（図２では「ｉＰＳ細胞」）が登録されている。また、遺伝子発現情報１５には、「ｉＰＳ細胞」、「中胚葉」、「分化能」等、検索を容易にするためのキーワードが登録されている。キーワードは、例えば遺伝子発現情報１５をアップロードした研究者、あるいは遺伝子発現情報ＤＢ１４の提供者によって登録される。

　アノテーション情報ＤＢ１６には、図３に示すアノテーション情報テーブル２０が格納されている。アノテーション情報テーブル２０は、遺伝子毎にアノテーション情報のＩＤ（Ｉｄｅｎｔｉｆｉｃａｔｉｏｎ　Ｄａｔａ）が登録されたものである。

　図４の表２２に示すように、アノテーション情報は、ＩＤ「ＧＯ：００００５７８」の「ｅｍｂｒｙｏｎｉｃ　ａｘｉｓ　ｓｐｅｃｉｆｉｃａｔｉｏｎ（胚軸の仕様）」、ＩＤ「ＩＰＲ０１２２８７」の「Ｈｏｍｅｏｄｏｍａｉｎ－ｒｅｌａｔｅｄ（ホメオドメイン関連）」等、遺伝子オントロジー（ＧＯ；Ｇｅｎｅ　Ｏｎｔｏｌｏｇｙ）で定義された用語である。

　図５に示すように、以下では、ヒト体細胞を初期化して樹立されたｉＰＳ細胞２５を研究対象とした場合を例示する。ｉＰＳ細胞２５は、細胞分裂することにより三胚葉２６を形成する。三胚葉２６は、外胚葉２７、中胚葉２８、および内胚葉２９である。三胚葉２６は、それぞれ複数種の組織細胞３０に分化する。具体的には、外胚葉２７は、水晶体３１、神経細胞３２等に分化する。中胚葉２８は、血液細胞３３、骨細胞３４、筋細胞３５等に分化する。内胚葉２９は、肺胞細胞３６、腸管細胞３７、肝細胞３８等に分化する。

　図６に、情報処理装置１０の処理の概要を示す。情報処理装置１０は、まず、アノテーション情報ＤＢサーバ１３からアノテーション情報を取得する。そして、取得したアノテーション情報に基づいて、遺伝子毎の評価値を導出する。次いで、導出した評価値に基づいて、複数の遺伝子の中から測定対象の遺伝子（以下、測定対象遺伝子という）を選択する。この際、情報処理装置１０は、ユーザにより指定された個数の測定対象遺伝子を選択する。測定対象遺伝子の候補となる遺伝子は例えば約３０００個、測定対象遺伝子は例えば１０００個である。情報処理装置１０は、選択した測定対象遺伝子をユーザに提示する。測定対象遺伝子は、本開示の技術に係る「測定対象のバイオマーカー」の一例である。

　図７において、情報処理装置１０を構成するコンピュータは、ストレージデバイス４５、メモリ４６、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）４７、通信部４８、ディスプレイ４９、および入力デバイス５０を備えている。これらはバスライン５１を介して相互接続されている。

　ストレージデバイス４５は、情報処理装置１０を構成するコンピュータに内蔵、またはケーブル、ネットワークを通じて接続されたハードディスクドライブである。もしくはストレージデバイス４５は、ハードディスクドライブを複数台連装したディスクアレイである。ストレージデバイス４５には、オペレーティングシステム等の制御プログラム、各種アプリケーションプログラム、およびこれらのプログラムに付随する各種データ等が記憶されている。なお、ハードディスクドライブに代えてソリッドステートドライブを用いてもよい。

　メモリ４６は、ＣＰＵ４７が処理を実行するためのワークメモリである。ＣＰＵ４７は、ストレージデバイス４５に記憶されたプログラムをメモリ４６へロードして、プログラムにしたがった処理を実行する。これにより、ＣＰＵ４７はコンピュータの各部を統括的に制御する。

　通信部４８は、ネットワーク１１を介した各種情報の伝送制御を行うネットワークインターフェースである。ディスプレイ４９は各種画面を表示する。情報処理装置１０を構成するコンピュータは、各種画面を通じて、入力デバイス５０からの操作指示の入力を受け付ける。入力デバイス５０は、キーボード、マウス、タッチパネル等である。

　図８において、情報処理装置１０のストレージデバイス４５には、作動プログラム５５が記憶されている。作動プログラム５５は、コンピュータを情報処理装置１０として機能させるためのアプリケーションプログラムである。すなわち、作動プログラム５５は、本開示の技術に係る「情報処理装置の作動プログラム」の一例である。

　作動プログラム５５が起動されると、情報処理装置１０を構成するコンピュータのＣＰＵ４７は、メモリ４６等と協働して、指示受付部６０、抽出部６１、取得部６２、導出部６３、選択部６４、および表示制御部６５として機能する。ＣＰＵ４７は、本開示の技術に係る「プロセッサ」の一例である。

　指示受付部６０は、入力デバイス５０を介したユーザによる様々な指示を受け付ける。例えば、指示受付部６０は、複数のカテゴリ、および複数のカテゴリ毎の測定対象遺伝子の個数の範囲（以下、個数範囲という）のユーザによる指定を受け付ける。カテゴリは、生体試料の種類に応じてユーザにより定義される。指示受付部６０は、指定されたカテゴリおよび個数範囲に応じたカテゴリおよび個数範囲指定情報７０を生成し、カテゴリおよび個数範囲指定情報７０を選択部６４に出力する。

　指示受付部６０は、先行知見遺伝子のユーザによる指定も受け付ける。指示受付部６０は、指定された先行知見遺伝子に応じた先行知見遺伝子指定情報７１を生成し、先行知見遺伝子指定情報７１を選択部６４に出力する。なお、先行知見遺伝子は、ｉＰＳ細胞２５の挙動に影響を与えることが既に知られている遺伝子である。すなわち先行知見遺伝子は、本開示の技術に係る「先行知見マーカー」の一例である。そして、ｉＰＳ細胞２５の挙動は、本開示の技術に係る「生体試料の特性」の一例である。

　指示受付部６０は、遺伝子発現情報ＤＢサーバ１２に対して遺伝子発現情報１５の配信を指示する、ユーザによる第１配信指示も受け付ける。第１配信指示は、具体的にはｉＰＳ細胞２５に関する検索キーワード、例えば「ｉＰＳ細胞」、「外胚葉」、「内胚葉」、「中胚葉」、・・・等で構成される検索指示である。第１配信指示は、検索キーワードの入力ボックスと検索ボタンが設けられた検索画面（図示省略）を通じて行われる。指示受付部６０は、第１配信指示を受け付けた場合、上記検索キーワードを含む第１配信要求７２を遺伝子発現情報ＤＢサーバ１２に送信する。遺伝子発現情報ＤＢサーバ１２は、遺伝子発現情報ＤＢ１４にある遺伝子発現情報１５の中から、登録されたキーワードが検索キーワードと一致する遺伝子発現情報１５を検索する。そして、検索した遺伝子発現情報１５を情報処理装置１０に配信する。情報処理装置１０において、遺伝子発現情報１５は、抽出部６１および表示制御部６５に入力される。

　表示制御部６５は、遺伝子発現情報ＤＢサーバ１２からの遺伝子発現情報１５の表示画面（図示省略）をディスプレイ４９に表示する。指示受付部６０は、表示された遺伝子発現情報１５のうち、ＤＥＧｓを抽出する対象とする遺伝子発現情報１５（以下、抽出対象１５Ｅ（図２２参照）と表記する）のユーザによる指定を受け付ける。指示受付部６０は、指定された抽出対象１５Ｅに応じた抽出対象指定情報７３を生成し、抽出対象指定情報７３を抽出部６１に出力する。

　抽出部６１は、抽出対象指定情報７３で指定された抽出対象１５ＥからＤＥＧｓを抽出する。抽出部６１は、例えば、抽出対象１５Ｅの各遺伝子の発現量と予め設定された閾値とを比較し、発現量が閾値以上である遺伝子をＤＥＧｓとして抽出する。抽出部６１は、抽出したＤＥＧｓが登録されたＤＥＧｓリスト７４を生成し、ＤＥＧｓリスト７４を取得部６２に出力する。

　取得部６２は、抽出部６１からのＤＥＧｓリスト７４に基づく第２配信要求７５をアノテーション情報ＤＢサーバ１３に送信する。第２配信要求７５は、ＤＥＧｓリスト７４に登録されたＤＥＧｓを含む。アノテーション情報ＤＢサーバ１３は、アノテーション情報ＤＢ１６にあるアノテーション情報テーブル２０の中から、第２配信要求７５に含まれるＤＥＧｓに付与されたアノテーション情報を検索する。そして、検索したアノテーション情報およびＤＥＧｓの組で構成される配信情報７６を情報処理装置１０に配信する。情報処理装置１０において、配信情報７６は、取得部６２に入力される。

　取得部６２は、アノテーション情報ＤＢサーバ１３からの配信情報７６を取得する。配信情報７６には、前述のようにアノテーション情報が含まれる。このため、取得部６２は、配信情報７６を取得することで、アノテーション情報を取得していることになる。

　取得部６２は、配信情報７６に基づいて、ＤＥＧｓリスト７４にアノテーション情報を付与し、ＤＥＧｓリスト７４を付与済ＤＥＧｓリスト７４Ｇとする。つまり、取得部６２は、アノテーション情報ＤＢ１６を参照して、遺伝子に対してアノテーション情報を付与する。取得部６２は、付与済ＤＥＧｓリスト７４Ｇを導出部６３に出力する。

　導出部６３は、付与済ＤＥＧｓリスト７４Ｇに基づいて、ＤＥＧｓ毎の評価値を導出する。そして、評価値の導出結果である評価値テーブル７７を選択部６４に出力する。

　選択部６４は、先行知見遺伝子指定情報７１に応じて、先行知見遺伝子を無条件で測定対象遺伝子として選択する。また、選択部６４は、カテゴリおよび個数範囲指定情報７０に応じて、抽出部６１において抽出されたＤＥＧｓの中から測定対象遺伝子を選択する。選択部６４は、測定対象遺伝子の選択結果である測定対象遺伝子リスト７８を表示制御部６５に出力する。表示制御部６５は、測定対象遺伝子リスト７８に基づいて、測定対象遺伝子表示画面１２０（図２４参照）を生成し、これをディスプレイ４９に表示する。

　図９において、カテゴリ指定画面８０は、カテゴリおよび個数範囲のユーザによる指定を受け付けるために、表示制御部６５の制御の下、ディスプレイ４９に表示される。カテゴリ指定画面８０には、本開示の技術に係る「注目する生体試料の特性」の一例である注目する細胞の挙動を選択入力するためのプルダウンメニュー８１が設けられている。また、カテゴリ指定画面８０には、カテゴリの入力ボックス８２、および個数範囲の下限の入力ボックス８３と上限の入力ボックス８４が設けられている。入力ボックス８２～８４は、追加ボタン８５を選択することで追加することが可能である。

　プルダウンメニュー８１で注目する細胞の挙動が選択され、入力ボックス８２～８４に所望のカテゴリおよび個数範囲が入力された後、指定ボタン８６が選択された場合、指示受付部６０は、注目する細胞の挙動、カテゴリ、および個数範囲の指定を受け付ける。これにより指示受付部６０から選択部６４にカテゴリおよび個数範囲指定情報７０が出力される。カテゴリおよび個数範囲指定情報７０は、プルダウンメニュー８１で選択された注目する細胞の挙動、入力ボックス８２に入力されたカテゴリ、並びに入力ボックス８３および８４に入力された個数範囲を含む。

　図９では、注目する細胞の挙動として「分化能」が選択された場合を例示している。また、カテゴリとして「ｉＰＳ細胞」、「外胚葉」、「中胚葉」、「内胚葉」が指定され、個数範囲として、各カテゴリに対して「２２５～２５０」が指定された場合を例示している。なお、指定するカテゴリは１つでもよい。また、入力ボックス８３および８４には同じ数値が入力されてもよい。

　入力ボックス８３および８４の下部には、入力ボックス８３および８４に入力された個数範囲の下限および上限の合計の表示領域８７が設けられている。表示領域８７の下部には、合計が１００個超１０００個以下となるようユーザに促すメッセージ８８が表示されている。

　図１０に示すように、合計が１００個超１０００個以下の範囲外である状態で指定ボタン８６が選択された場合、表示制御部６５は、カテゴリ指定画面８０上に警告画面９０をポップアップ表示する。警告画面９０には、合計が１００個超１０００個以下の範囲外で、このままでは指定できない旨のメッセージ９１が表示される。ＯＫボタン９２が選択された場合、表示制御部６５は警告画面９０の表示を消す。

　カテゴリ指定画面８０は、こうして個数範囲の合計が１００個超１０００個以下の範囲外である場合に指定ができないように構成される。このため図１１に示すように、選択部６４は、結果として１００個超１０００個以下の測定対象遺伝子を選択することとなる。

　図１２において、先行知見遺伝子指定画面９５は、先行知見遺伝子のユーザによる指定を受け付けるために、表示制御部６５の制御の下、ディスプレイ４９に表示される。先行知見遺伝子指定画面９５には、先行知見遺伝子のセットを選択入力するためのプルダウンメニュー９６が設けられている。プルダウンメニュー９６は、追加ボタン９７を選択することで追加することが可能である。プルダウンメニュー９６には、複数の先行知見遺伝子のセットが選択肢として予め用意されている。先行知見遺伝子のセットは、カテゴリ毎に用意されている。先行知見遺伝子のセットには、例えば、ＴａｑＭａｎ（登録商標）スコアカードによる遺伝子解析に用いられる先行知見遺伝子のセット、ｎＣｏｕｎｔｅｒ（登録商標）による遺伝子解析に用いられる先行知見遺伝子のセット、ＴｒｕＳｅｑ（登録商標）による遺伝子解析に用いられる先行知見遺伝子のセット等が含まれる。

　プルダウンメニュー９６で所望の先行知見遺伝子のセットが選択された後、指定ボタン９８が選択された場合、指示受付部６０は、先行知見遺伝子のセットの指定を受け付ける。これにより指示受付部６０から選択部６４に先行知見遺伝子指定情報７１が出力される。先行知見遺伝子指定情報７１は、先行知見遺伝子のセットと、これに対応するカテゴリとが登録された情報である。

　図１２では、カテゴリ「ｉＰＳ細胞」について先行知見遺伝子のセットが２つ、カテゴリ「外胚葉」、「中胚葉」、「内胚葉」について先行知見遺伝子のセットが１つずつ、計５つの先行知見遺伝子のセットが指定された場合を例示している。なお、セットを指定する代わりに、あるいは加えて、先行知見遺伝子を１つずつ指定する構成としてもよい。

　図１３において、抽出対象指定画面１０５は、遺伝子発現情報ＤＢサーバ１２からの遺伝子発現情報１５の中から抽出対象１５Ｅをユーザに指定させるために、表示制御部６５の制御の下、ディスプレイ４９に表示される。抽出対象指定画面１０５には、抽出対象１５Ｅの入力ボックス１０６が設けられている。入力ボックス１０６は、追加ボタン１０７を選択することで追加することが可能である。

　抽出対象１５Ｅが入力ボックス１０６に入力された後、指定ボタン１０８が選択された場合、指示受付部６０において抽出対象１５Ｅの指定が受け付けられる。これにより指示受付部６０から抽出部６１に抽出対象指定情報７３が出力される。抽出対象指定情報７３は、入力ボックス１０６に入力された抽出対象１５Ｅと、当該抽出対象１５Ｅに登録された生体試料の種類とが登録された情報である。

　図１３では、生体試料の種類「ｉＰＳ細胞」、「外胚葉」、「中胚葉」、「内胚葉」のそれぞれに対して１つずつ、抽出対象１５Ｅが指定された場合を例示している。なお、１つの生体試料の種類に対して２つ以上の抽出対象１５Ｅを指定しても構わない。

　図１４に示すように、ＤＥＧｓリスト７４には、ＤＥＧｓと、当該ＤＥＧｓを抽出した抽出対象１５Ｅに登録された生体試料の種類とが登録されている。ＤＥＧｓには、ＩＤ「ＧＥ＿５」、「ＧＥ＿１０」等のＤＥＧｓのように、１つの生体試料の種類だけが登録されているものもあれば、ＩＤ「ＧＥ＿１」、「ＧＥ＿２」等のＤＥＧｓのように、「ｉＰＳ細胞」、「外胚葉」、「中胚葉」、「内胚葉」といった複数の生体試料の種類が登録されているものもある。つまり、１つの生体試料の種類にだけ属しているＤＥＧｓもあれば、複数の生体試料の種類にまたがって属しているＤＥＧｓもある。

　図１５に示すように、配信情報７６は、ＤＥＧｓと、これに対応するアノテーション情報とが登録された情報である。

　図１６において、付与済ＤＥＧｓリスト７４Ｇは、図１４で示したＤＥＧｓリスト７４に、アノテーション情報の項目が追加されたものである。この付与済ＤＥＧｓリスト７４Ｇによって、アノテーション情報に生体試料の種類が関連付けられる。

　取得部６２は、配信情報７６に登録されたアノテーション情報の中から、カテゴリおよび個数範囲指定情報７０の注目する細胞の挙動に関するアノテーション情報を選定する。そして、選定したアノテーション情報のみをＤＥＧｓリスト７４に登録し、付与済ＤＥＧｓリスト７４Ｇとする。

　図９で示したように、本例では、注目する細胞の挙動として「分化能」が指定されている。このため、取得部６２は、ＩＤ「ＧＯ：０００００７５」、「ＧＯ：０００１０２８」といった分化能に関りがないアノテーション情報は選定せず、ＩＤ「ＧＯ：００００５７８」、「ＧＯ：０００１５０１」といった分化に関するアノテーション情報のみを選定して登録する。なお、注目する細胞の挙動に関する検索キーワードを第２配信要求７５に含めておき、アノテーション情報ＤＢサーバ１３において、注目する細胞の挙動に関するアノテーション情報を選定してもよい。

　図１７において、導出部６３は、付与済ＤＥＧｓリスト７４Ｇに基づいて、各ＤＥＧｓに付与されたアノテーション情報の付与数を計数する。そして、計数した付与数自体を、評価値として評価値テーブル７７に登録する。例えばＩＤ「ＧＥ＿１」のＤＥＧｓに２８個のアノテーション情報が付与されていた場合、評価値テーブル７７には評価値として付与数と同じ「２８」が登録される。

　図１８において、選択部６４は、まず、先行知見遺伝子指定情報７１で指定された先行知見遺伝子のセットを、無条件で測定対象遺伝子として選択する。これにより、先行知見遺伝子のセットが測定対象遺伝子として登録された仮測定対象遺伝子リスト７８Ｐが生成される。この先行知見遺伝子のセットを無条件で測定対象遺伝子として選択する態様は、先行知見遺伝子の評価値の重み付けを重くして、必ず先行知見遺伝子が測定対象遺伝子として選択されるようにすることの一例である。

　図１９において、選択部６４は、評価値テーブル７７に基づいて、選択順位表群１１５を生成する。選択順位表群１１５は、生体試料の種類「ｉＰＳ細胞」に対応するカテゴリ「ｉＰＳ細胞」の選択順位表１１６Ａ、生体試料の種類「外胚葉」に対応するカテゴリ「外胚葉」の選択順位表１１６Ｂ、生体試料の種類「中胚葉」に対応するカテゴリ「中胚葉」の選択順位表１１６Ｃ、および生体試料の種類「内胚葉」に対応するカテゴリ「内胚葉」の選択順位表１１６Ｄで構成される。選択部６４は、各カテゴリについて、評価値が高い（アノテーション情報の付与数が多い）ＤＥＧｓから順に選択順位をつけていく。すなわち、評価値が最も高いＤＥＧｓの選択順位を１位、次に評価値が高いＤＥＧｓの選択順位を２位、次の次に評価値が高いＤＥＧｓの選択順位を３位、・・・とする。

　図２０に示すように、選択部６４は、選択順位表１１６を参照して、カテゴリ毎に用意されたＤＥＧｓから、個数範囲を満たす測定対象遺伝子を選択し、各カテゴリに割り振る。

　図２０は、カテゴリ「ｉＰＳ細胞」のために用意されたＤＥＧｓから、カテゴリ「ｉＰＳ細胞」の測定対象遺伝子を選択する様子を例示している。また、図２０は、カテゴリ「ｉＰＳ細胞」の個数範囲として、図９で示した「２２５～２５０」が指定され、かつ図１８で選択された、カテゴリ「ｉＰＳ細胞」の先行知見遺伝子の個数が１００個であった場合を例示している。この場合、個数範囲を満たすためには、少なくとも１２５個、多くとも１５０個のＤＥＧｓを選択する必要がある。このため選択部６４は、選択順位表１１６Ａにおいて選択順位１位～１５０位までの計１５０個のＤＥＧｓを選択する。そして、選択した１５０個のＤＥＧｓを、カテゴリ「ｉＰＳ細胞」の測定対象遺伝子として仮測定対象遺伝子リスト７８Ｐに登録する。

　図示は省略するが、選択部６４は、他のカテゴリ「外胚葉」、「中胚葉」、「内胚葉」も同様にして、選択順位表１１６Ｂ～１１６Ｄを参照して、個数範囲を満たす数のＤＥＧｓを選択する。そして、選択したＤＥＧｓを測定対象遺伝子として仮測定対象遺伝子リスト７８Ｐに登録する。選択部６４は、こうして測定対象遺伝子を順次選択していくことで、最終的には図２１に示すような、各カテゴリにおいて個数範囲が満たされた測定対象遺伝子リスト７８を生成する。

　図２２および図２３は、抽出部６１、取得部６２、導出部６３、および選択部６４による一連の処理をまとめた図である。まず、図２２に示すように、抽出部６１は、抽出対象１５ＥからＤＥＧｓを抽出し、ＤＥＧｓリスト７４を生成する。取得部６２は、アノテーション情報ＤＢサーバ１３からの配信情報７６を取得することで、アノテーション情報を取得する。取得部６２は、配信情報７６のアノテーション情報をＤＥＧｓリスト７４に付与し、付与済ＤＥＧｓリスト７４Ｇとする。

　図２３に示すように、導出部６３は、各ＤＥＧｓへのアノテーション情報の付与数を計数し、付与数を評価値として評価値テーブル７７に登録する。選択部６４は、評価値に基づいて測定対象遺伝子を選択し、測定対象遺伝子リスト７８を生成する。

　図２４に示すように、測定対象遺伝子表示画面１２０には、測定対象遺伝子リスト７８に登録された測定対象遺伝子が表示される。測定対象遺伝子表示画面１２０には、カテゴリ毎に表示領域１２１Ａ、１２１Ｂ、１２１Ｃ、および１２１Ｄが設けられている。表示領域１２１Ａにはカテゴリ「ｉＰＳ細胞」の測定対象遺伝子が表示される。表示領域１２１Ｂにはカテゴリ「外胚葉」、表示領域１２１Ｃにはカテゴリ「中胚葉」、表示領域１２１Ｄにはカテゴリ「内胚葉」の測定対象遺伝子がそれぞれ表示される。

　測定対象遺伝子表示画面１２０の下部には、保存ボタン１２２、印刷ボタン１２３、および確認ボタン１２４が設けられている。保存ボタン１２２は、測定対象遺伝子リスト７８をストレージデバイス４５に保存する場合に選択される。印刷ボタン１２３は、測定対象遺伝子リスト７８を印刷する場合に選択される。確認ボタン１２４が選択された場合、表示制御部６５は、測定対象遺伝子表示画面１２０の表示を消す。

　次に、上記構成による作用について、図２５のフローチャートを参照して説明する。まず、情報処理装置１０において作動プログラム５５が起動されると、図８で示したように、情報処理装置１０のＣＰＵ４７は、指示受付部６０、抽出部６１、取得部６２、導出部６３、選択部６４、および表示制御部６５として機能される。

　表示制御部６５の制御の下、図９で示したカテゴリ指定画面８０がディスプレイ４９に表示される（ステップＳＴ１００）。ユーザは、注目する細胞の挙動と、所望のカテゴリおよび個数範囲とを入力し、指定ボタン８６を選択する。これにより、指示受付部６０において、注目する細胞の挙動と、カテゴリおよび個数範囲との指定が受け付けられ（ステップＳＴ１１０）、カテゴリおよび個数範囲指定情報７０が生成される。カテゴリおよび個数範囲指定情報７０は、指示受付部６０から選択部６４に出力される。

　続いて、表示制御部６５の制御の下、図１２で示した先行知見遺伝子指定画面９５がディスプレイ４９に表示される（ステップＳＴ１２０）。ユーザは、所望の先行知見遺伝子のセットを入力し、指定ボタン９８を選択する。これにより、指示受付部６０において、先行知見遺伝子のセットの指定が受け付けられ（ステップＳＴ１３０）、先行知見遺伝子指定情報７１が生成される。先行知見遺伝子指定情報７１は、指示受付部６０から選択部６４に出力される。

　表示制御部６５の制御の下、図示省略した検索画面がディスプレイ４９に表示される。そして、指示受付部６０において、検索キーワードを含むユーザによる第１配信指示が受け付けられる。これにより、指示受付部６０から、検索キーワードを含む第１配信要求７２が遺伝子発現情報ＤＢサーバ１２に送信される（ステップＳＴ１４０）。

　第１配信要求７２に応じて、遺伝子発現情報ＤＢサーバ１２から遺伝子発現情報１５が配信される。遺伝子発現情報１５は表示制御部６５に入力される。そして、表示制御部６５の制御の下、図示省略した遺伝子発現情報１５の表示画面がディスプレイ４９に表示される（ステップＳＴ１５０）。

　また、表示制御部６５の制御の下、図１３で示した抽出対象指定画面１０５がディスプレイ４９に表示される（ステップＳＴ１６０）。ユーザは、所望の抽出対象１５Ｅを入力し、指定ボタン１０８を選択する。これにより、指示受付部６０において、抽出対象１５Ｅの指定が受け付けられ（ステップＳＴ１７０）、抽出対象指定情報７３が生成される。抽出対象指定情報７３は、指示受付部６０から抽出部６１に出力される。

　抽出部６１において、抽出対象１５ＥからＤＥＧｓが抽出され、図１４で示したＤＥＧｓリスト７４が生成される（ステップＳＴ１８０）。ＤＥＧｓリスト７４は、抽出部６１から取得部６２に出力される。続いて、ＤＥＧｓリスト７４に基づく第２配信要求７５が取得部６２からアノテーション情報ＤＢサーバ１３に送信される（ステップＳＴ１９０）。

　第２配信要求７５に応じて、アノテーション情報ＤＢサーバ１３から、図１５で示したアノテーション情報を含む配信情報７６が配信される。配信情報７６は取得部６２に入力される。これにより、配信情報７６、ひいてはアノテーション情報が取得部６２において取得される（ステップＳＴ２００）。なお、ステップＳＴ２００は、本開示の技術に係る「取得処理」の一例である。

　図１６で示したように、取得部６２によって、配信情報７６に基づいて、ＤＥＧｓリスト７４にアノテーション情報が付与され、ＤＥＧｓリスト７４が付与済ＤＥＧｓリスト７４Ｇとされる（ステップＳＴ２１０）。この際、注目する細胞の挙動に関するアノテーション情報のみが選定されて付与される。付与済ＤＥＧｓリスト７４Ｇは、取得部６２から導出部６３に出力される。

　図１７で示したように、導出部６３によって、各ＤＥＧｓに付与されたアノテーション情報の付与数が計数され、付与数が評価値として評価値テーブル７７に登録される（ステップＳＴ２２０）。評価値テーブル７７は、導出部６３から選択部６４に出力される。なお、ステップＳＴ２２０は、本開示の技術に係る「導出処理」の一例である。

　図１８で示したように、選択部６４によって、先行知見遺伝子が無条件で測定対象遺伝子として選択される（ステップＳＴ２３０）。

　さらに、図２０で示したように、選択部６４によって、カテゴリ毎に用意されたＤＥＧｓから、評価値が高い順に個数範囲を満たす数のＤＥＧｓが選択される。そして、選択されたＤＥＧｓが測定対象遺伝子として各カテゴリに割り振られる（ステップＳＴ２４０）。こうした過程を経て、図２１で示した測定対象遺伝子リスト７８が生成される。測定対象遺伝子リスト７８は、選択部６４から表示制御部６５に出力される。なお、ステップＳＴ２４０は、本開示の技術に係る「選択処理」の一例である。

　最後に、表示制御部６５によって、図２４で示した測定対象遺伝子表示画面１２０がディスプレイ４９に表示される（ステップＳＴ２５０）。ユーザは、この測定対象遺伝子表示画面１２０を通じて、測定対象遺伝子を確認する。

　以上説明したように、情報処理装置１０は、取得部６２と、導出部６３と、選択部６４とを備える。取得部６２は、複数の遺伝子のそれぞれに付与されたアノテーション情報を取得する。導出部６３は、アノテーション情報に基づいて、複数の遺伝子毎の評価値を導出する。選択部６４は、評価値に基づいて、複数の遺伝子の中から測定対象遺伝子を選択する。このため、アノテーション情報に基づく評価値という確かな裏付けの下で、データドリブンで測定対象遺伝子を選択することが可能となる。このようにして選択された測定対象遺伝子は、多水準展開が容易でありながら、研究対象の細胞に合わせてカスタマイズされている。したがって、細胞の挙動の解明に繋がる、より適切な測定対象遺伝子を選択することが可能となる。

　取得部６２は、注目する細胞の挙動に関するアノテーション情報を選定する。選択部６４は、選定したアノテーション情報のみに基づいて評価値を導出する。このため、注目する細胞の挙動に特化したアノテーション情報のみに基づいて、測定対象遺伝子を選択することができる。換言すれば、注目する細胞の挙動への関連性が薄いアノテーション情報をノイズとして排除し、注目する細胞の挙動への関連性が高いアノテーション情報に限定した形で、測定対象遺伝子を選択することができる。

　取得部６２は、遺伝子に対するアノテーション情報が登録されたアノテーション情報ＤＢ１６を参照して、遺伝子に対してアノテーション情報を付与する。このため、既存のアノテーション情報ＤＢ１６を用いて、簡単にアノテーション情報を付与することができる。

　アノテーション情報には、生体試料の種類が関連付けられている。指示受付部６０は、生体試料の種類に応じて定義された複数のカテゴリ、および複数のカテゴリ毎の個数範囲のユーザによる指定を受け付ける。選択部６４は、複数のカテゴリ毎に用意された遺伝子から、個数範囲を満たす数の遺伝子を選択し、選択した遺伝子を、測定対象遺伝子として複数のカテゴリのそれぞれに割り振る。このため、カテゴリ毎に過不足なく測定対象遺伝子を選択することができる。

　カテゴリは、「ｉＰＳ細胞」、「外胚葉」、「中胚葉」、および「内胚葉」を含む。このため、近年非常に関心が高まっているｉＰＳ細胞２５に関連するカテゴリ毎の測定対象遺伝子を得ることができる。なお、ｉＰＳ細胞およびその分化工程を評価することを目的として遺伝子の発現量を測定する場合には、カテゴリは、上記の「ｉＰＳ細胞」、「外胚葉」、「中胚葉」、および「内胚葉」を含むことが好ましい。ただし、上記以外の目的で遺伝子の発現量を測定する場合には、カテゴリとしては上記の「ｉＰＳ細胞」、「外胚葉」、「中胚葉」、および「内胚葉」に限らない。

　導出部６３は、複数の遺伝子毎にアノテーション情報の付与数を計数し、付与数に基づいて評価値を導出する。このため、簡単に評価値を導出することができる。

　遺伝子は先行知見遺伝子を含む。そして、指示受付部６０は、先行知見遺伝子のユーザによる指定を受け付ける。選択部６４は、先行知見遺伝子の評価値の重み付けを重くする一形態として、先行知見遺伝子を無条件で測定対象遺伝子として選択する。このため、先行知見遺伝子を測定したいというユーザの意図を反映させることができる。また、過去の知見が凝縮された先行知見遺伝子を、測定対象遺伝子として有効に取り入れることができる。

　選択部６４は、１００個超１０００個以下の測定対象遺伝子を選択する。測定対象遺伝子が１００個以下であると、細胞の挙動の解明に十分でない。一方、測定対象遺伝子が１０００個よりも多いと、検査に時間およびコストが掛かり、多水準実験への展開が困難となる。

　遺伝子はＤＥＧｓを含む。このため、より細胞の挙動の解明に寄与すると考えられる測定対象遺伝子を選択することができる。

　なお、先行知見遺伝子は無条件で測定対象遺伝子として選択するとしたが、これに限らない。先行知見遺伝子についてもＤＥＧｓと同様にアノテーション情報を取得して評価値を導出し、導出した評価値に基づいて選択してもよい。この際、先行知見遺伝子の評価値の重み付けを、ＤＥＧｓよりも重くしてもよい。また、この場合、先行知見遺伝子の各々に対して重要度を設定し、重要度を加味して評価値を導出してもよい。具体的には、重要度が高い程、高い評価値を導出する構成とする。なお、先行知見遺伝子以外の遺伝子、例えばＤＥＧｓ等は、重要度を最低と見なして評価値を導出してもよい。

　先行知見遺伝子は、必ずしも指定しなくてもよい。例えば、研究対象の細胞が新規で、先行知見遺伝子がそもそも存在しない場合は、先行知見遺伝子の指定を省略してもよい。

　抽出対象１５Ｅの指定も省略し、遺伝子発現情報ＤＢサーバ１２から配信された全ての遺伝子発現情報１５を抽出対象１５Ｅとしてもよい。

　カテゴリも、必ずしも指定しなくてもよい。ただし、カテゴリの指定は省略しても、選択する測定対象遺伝子の個数の範囲、少なくとも上限は指定する必要がある。

　遺伝子発現情報ＤＢ１４は、例示のＧＥＯといった公共的なＤＢに限定されない。例えばユーザが所属する研究所で測定された遺伝子発現情報１５が登録された、ローカルなＤＢであっても構わない。アノテーション情報ＤＢ１６についても同様に、ＤＡＶＩＤ、ＩｎｔｅｒＰｒｏといった公共的なＤＢに限らず、例えばユーザが所属する研究所で用意されたローカルなＤＢであってもよい。

　［第２実施形態］
　図２６および図２７に示す第２実施形態では、アノテーション情報の情報価値に応じて、評価値に対して重み付けを行う。

　図２６は、付与数が比較的少ない、すなわち稀少性が比較的高いアノテーション情報を情報価値が高いと判断して、当該アノテーション情報の付与数を多くする例を示す。導出部６３は、まず、表１５０に示すように、付与済ＤＥＧｓリスト７４Ｇに基づいて、ＤＥＧｓに付与されたアノテーション情報のそれぞれの付与数（以下、トータル付与数という）を計数する。導出部６３は、トータル付与数と予め設定された閾値とを比較する。そして、トータル付与数が閾値未満のアノテーション情報を情報価値が高いと判断して、表１５１に示すように、当該アノテーション情報の、評価値を導出する際の付与数を１よりも大きい値とする。つまり、情報価値が高いと判断したアノテーション情報の重み付けを重くする。導出部６３は、重み付けがされた付与数を含めて、各ＤＥＧｓのアノテーション情報の付与数を計数し、評価値テーブル７７を生成する。

　図２６は、閾値として「１０」が設定され、トータル付与数が「６」と閾値未満のＩＤ「ＧＯ：００００５７８」のアノテーション情報の付与数が「１０」とされた場合を例示している。

　図２７は、アノテーション情報の直交性に基づいて、評価値に対して重み付けを行う例を示す。導出部６３は、できる限り漏れなくかつ重複なくアノテーション情報をカバー可能な遺伝子のセットの直交性が高いと判断する。

　表１５８は、ＩＤ「ＧＥ＿１０００」、「ＧＥ＿１００１」、および「ＧＥ＿１００２」の３個のＤＥＧｓに対する、Ａ１～Ａ７で示すアノテーション情報の付与状況を示したものである。Ａ１～Ａ７のアノテーション情報のうち、Ａ１～Ａ４には生体試料の種類として「ｉＰＳ細胞」が、Ａ５～Ａ７には「外胚葉」がそれぞれ関連付けられている。

　この場合、アノテーション情報の付与数だけをみれば、ＩＤ「ＧＥ＿１０００」およびＩＤ「ＧＥ＿１００１」のＤＥＧｓが、ＩＤ「ＧＥ＿１００２」のＤＥＧｓよりも優先的に測定対象遺伝子として選択される。しかし、アノテーション情報の直交性を考慮すると、ＩＤ「ＧＥ＿１００２」のＤＥＧｓが、ＩＤ「ＧＥ＿１００１」のＤＥＧｓよりも優先的に測定対象遺伝子として選択される。こうして最終的にＩＤ「ＧＥ＿１０００」およびＩＤ「ＧＥ＿１００２」のＤＥＧｓが測定対象遺伝子として選択されれば、「ｉＰＳ細胞」および「外胚葉」の両方をカバーすることができる。

　なお、他の遺伝子との組み合わせでカバーできるアノテーション情報の数に基づいて、評価値を導出してもよい。表１５８を例に説明すると、ＩＤ「ＧＥ＿１０００」およびＩＤ「ＧＥ＿１００１」のＤＥＧｓの組み合わせでは、カバーできるアノテーション情報の数は６個である。ＩＤ「ＧＥ＿１０００」およびＩＤ「ＧＥ＿１００２」のＤＥＧｓの組み合わせでは、カバーできるアノテーション情報の数は７個である。ＩＤ「ＧＥ＿１００１」およびＩＤ「ＧＥ＿１００２」のＤＥＧｓの組み合わせでは、カバーできるアノテーション情報の数は５個である。この結果から、ＩＤ「ＧＥ＿１０００」およびＩＤ「ＧＥ＿１００２」のＤＥＧｓの評価値を、ＩＤ「ＧＥ＿１００１」のＤＥＧｓの評価値よりも高くする。

　このように、第２実施形態では、導出部６３は、アノテーション情報の情報価値に応じて、評価値に対して重み付けを行う。このため、例えば情報価値が高いと判断したアノテーション情報の付与数の重み付けを重くすることで、情報価値が高いと思われるアノテーション情報が付与された遺伝子が、測定対象遺伝子として選択されやすくなる。したがって、測定対象遺伝子の妥当性、信頼性を高めることができる。

　図２６においては、導出部６３は、稀少性が比較的高いアノテーション情報を情報価値が高いと判断して、重み付けを重くする。このため、見落としがちな稀少なアノテーション情報が付与された遺伝子を、測定対象遺伝子として選択することができる。

　図２７においては、導出部６３は、アノテーション情報の直交性に基づいて、評価値に対して重み付けを行う。このため、できる限り漏れなくかつ重複なくアノテーション情報をカバー可能な遺伝子のセットを、測定対象遺伝子として選択することができる。
　

　図２６および図２７の例を複合して実施してもよい。この場合、例えば、トータル付与数が閾値未満のアノテーション情報が付与され、かつアノテーション情報の直交性が高いＤＥＧｓの評価値に１００を加算する。

　なお、図２６では、稀少性が比較的高いアノテーション情報を情報価値が高いアノテーション情報と判断したが、情報価値が高いアノテーション情報の例は、これらに限定されない。例えば、研究論文への掲載数が比較的多いアノテーション情報を、情報価値が高いアノテーション情報と判断してもよい。

　図２６では、ＤＥＧｓに付与されたアノテーション情報の付与数に対して重み付けを行っているが、これに限定されない。先行知見遺伝子についても評価値を導出する場合は、先行知見遺伝子に付与されたアノテーション情報の付与数に対して、図２６で示した場合と同様に重み付けを行ってもよい。図２７で示した態様も同様に、先行知見遺伝子に対して適用してもよい。

　［第３実施形態］
　図２８に示す第３実施形態では、強度指標が予め設定された閾値範囲内にある遺伝子の評価値の重み付けを重くする。

　図２８において、第３実施形態の付与済ＤＥＧｓリスト１６０Ｇには、強度指標情報の項目が設けられている。強度指標情報の項目には、強度指標が予め設定された閾値範囲内であるか否かが登録されている。強度指標は、例えばｆｏｌｄ－ｃｈａｎｇｅ、多重検定補正済の発現有意差を示すｑ値（ｑ－ｖａｌｕｅ）等である。

　導出部６３は、表１６１に示すように、強度指標が閾値範囲内にあるＤＥＧｓのアノテーション情報の、評価値を導出する際の付与数を１よりも大きい値とする。つまり、強度指標が閾値範囲内にあるＤＥＧｓの評価値の重み付けを重くする。導出部６３は、重み付けがされた付与数を含めて、各ＤＥＧｓのアノテーション情報の付与数を計数し、評価値テーブル７７を生成する。

　図２８は、ＩＤ「ＧＥ＿２」、「ＧＥ＿５」等のＤＥＧｓの強度指標が閾値範囲内で、これらのアノテーション情報の付与数が「２」とされた場合を例示している。

　このように、第３実施形態では、導出部６３は、強度指標が閾値範囲内にあるＤＥＧｓの評価値の重み付けを重くする。このため、生体試料の特性の解明により重要と考えられる、強度指標が閾値範囲内にあるＤＥＧｓを、測定対象遺伝子として選択することができる。なお、第２実施形態と第３実施形態を複合して実施してもよい。

　［第４実施形態］
　図２９～図３４に示す第４実施形態では、測定対象遺伝子の測定結果１６６を取得する。そして、測定結果１６６に基づいて、統計的な手法によって、測定対象遺伝子に付与されたアノテーション情報１７１から、細胞の挙動への影響度が比較的高いアノテーション情報（以下、高影響アノテーション情報という）１６７を選出し、選出した高影響アノテーション情報１６７をユーザに提示する。

　図２９において、第４実施形態の情報処理装置１０のＣＰＵ４７は、図８で示した各処理部６０～６５（図２９では取得部６２のみ図示）に加えて、選出部１６５として機能する。

　取得部６２は、複数の測定結果１６６＿１、１６６＿２、・・・、および１６６＿Ｘを取得する。測定結果１６６＿１～１６６＿Ｘは、例えば、ｉＰＳ細胞２５から組織細胞３０への分化誘導効率が低かった複数のサンプル１、２、・・・、Ｘについて、ｉＰＳ細胞２５の段階における測定対象遺伝子の発現量を実際に測定した結果である。測定結果１６６＿１～１６６＿Ｘは、例えば、遺伝子の発現量を測定する測定装置から情報処理装置１０に送信され、取得部６２に入力される。取得部６２は、測定結果１６６＿１～１６６＿Ｘを選出部１６５に出力する。

　選出部１６５は、取得部６２からの測定結果１６６＿１～１６６＿Ｘ、および付与済ＤＥＧｓリスト７４Ｇに基づいて、高影響アノテーション情報１６７を選出する。選出部１６５は、高影響アノテーション情報１６７を表示制御部６５に出力する。

　図３０～図３３に、選出部１６５において高影響アノテーション情報１６７を選出する処理の手順を示す。まず、選出部１６５は、図３０のステップＳＴ３００および図３１に示すように、測定結果１６６＿１～１６６＿Ｘを参照して、測定対象遺伝子から高発現遺伝子１７０を抽出する。高発現遺伝子１７０は、例えば、全サンプル１～Ｘにおいて発現量が閾値以上の測定対象遺伝子である。図３１は、閾値として「１００」が設定され、ＩＤ「ＧＥ＿５」、「ＧＥ＿３２」、「ＧＥ＿３００」、・・・といった測定対象遺伝子を、高発現遺伝子１７０として抽出した場合を例示している。

　次に、選出部１６５は、図３０のステップＳＴ３１０および図３２に示すように、付与済ＤＥＧｓリスト７４Ｇから、高発現遺伝子１７０に付与されたアノテーション情報１７１を抜粋する。続いて、選出部１６５は、図３０のステップＳＴ３２０および図３３の算出結果１７２に示すように、高発現遺伝子１７０に付与されたアノテーション情報１７１の各々について、オッズ比およびｐ値（ｐ－ｖａｌｕｅ）を算出する。最後に、選出部１６５は、図３０のステップＳＴ３３０および図３３の算出結果１７２の後段に示すように、高発現遺伝子１７０に付与されたアノテーション情報１７１のうち、ｐ値が０．０５未満と統計的に有意なアノテーション情報１７１を、高影響アノテーション情報１６７として選出する。図３３は、ｐ値が「０．０２０５」であるＩＤ「ＧＯ：０００１５０１」のアノテーション情報１７１、ｐ値が「０．０２４５」であるＩＤ「ＧＯ：０００１７０４」のアノテーション情報１７１等を、高影響アノテーション情報１６７として選出した場合を例示している。

　図３４において、高影響アノテーション情報表示画面１８０は、表示制御部６５の制御の下、ディスプレイ４９に表示される。高影響アノテーション情報表示画面１８０には、高影響アノテーション情報１６７の表示領域１８１が設けられている。表示領域１８１には、高影響アノテーション情報１６７とその内容とが一覧表示される。確認ボタン１８２が選択された場合、表示制御部６５は、高影響アノテーション情報表示画面１８０の表示を消す。

　このように、第４実施形態では、取得部６２は、測定対象遺伝子の測定結果１６６を取得する。選出部１６５は、測定結果１６６に基づいて、統計的な手法によって、測定対象遺伝子に付与されたアノテーション情報１７１から、細胞の挙動への影響度が比較的高い高影響アノテーション情報１６７を選出する。表示制御部６５は、高影響アノテーション情報表示画面１８０をディスプレイ４９に表示することで、高影響アノテーション情報１６７をユーザに提示する。このため、ユーザは、高影響アノテーション情報１６７から、分化誘導効率が低かった主要因等を類推することができ、次回の培養に活かすことができる。高影響アノテーション情報１６７は、統計的な手法によって選出されたものであるから、分化誘導効率が低かった主要因等の類推を的確に行うことができる。

　なお、高影響アノテーション情報表示画面１８０に、高影響アノテーション情報１６７に加えて、高影響アノテーション情報１６７が付与された遺伝子を表示してもよい。

　［実施例］
　以下、図９の場合と同じく、注目する細胞の挙動としてｉＰＳ細胞２５の「分化能」が選択された場合の実施例を示す。カテゴリおよび個数範囲も、図９で示した例と同じである。すなわち、カテゴリとして「ｉＰＳ細胞」、「外胚葉」、「中胚葉」、「内胚葉」が指定され、個数範囲として各カテゴリに「２２５～２５０」が指定された例を示す。

　図３５に示す表２００は、本実施例において測定対象遺伝子を選択するために指定された先行知見遺伝子、および抽出されたＤＥＧｓを示すものである。先行知見遺伝子には、知見者ヒアリングに基づくもの、あるいはＴａｑＭａｎスコアカードといった有名遺伝子パネルも含まれている。ＤＥＧｓには、ｉＰＳ細胞２５あるいはＥＳ細胞（Ｅｍｂｒｙｏｎｉｃ　Ｓｔｅｍ　ｃｅｌｌｓ）、および、ｉＰＳ細胞２５あるいはＥＳ細胞を三胚葉２６または組織細胞３０に分化させた実験における抽出対象１５Ｅから抽出されたものが含まれている。本実施例では、これら約２９００個（一部重複）の遺伝子の中から、個数範囲を満たす約１０００個（具体的には９８０個）の測定対象遺伝子を選択した。より詳しくは、先行知見遺伝子およびＤＥＧｓに、アノテーション情報ＤＢ１６から取得したアノテーション情報のうちで分化に関わるアノテーション情報のみを選定して付与した。そして、アノテーション情報に基づいて評価値を導出し、評価値が高い順に個数範囲を満たす数を選択した。また、先行知見遺伝子およびＤＥＧｓとは別に、正規化用遺伝子も測定対象遺伝子として選択した。以下、こうして選択した約１０００個の測定対象遺伝子をＣ１０００と呼ぶ。

　ｉＰＳ細胞２５を心筋細胞に分化誘導する実験において、ｉＰＳ細胞２５の段階における１５サンプルのＣ１０００の発現量を測定した。１５サンプルのうち、１０サンプルは分化誘導効率が高く、一方で５サンプルは分化誘導効率が低かった。

　ここで、本開示の技術の効果を確認するため、比較例として、１５サンプルの分化誘導前のｉＰＳ細胞２５について、別途マイクロアレイによる網羅的な遺伝子（約２１０００個）の発現量の測定も行った。

　図３６に、マイクロアレイの発現量の測定結果２０２を示す。バー２０３は各遺伝子の発現量を表す。測定結果２０２によれば、クラスタリングによって左側の９サンプルのグループと右側の６サンプルのグループとに分かれ、６サンプルのグループに、「Ｂａｄ」で示す分化誘導効率が低かった５サンプルが全て包含された。つまり、マイクロアレイの発現量の測定結果２０２によれば、ｉＰＳ細胞２５の段階で、分化誘導効率の高低を比較的高い確度（分化誘導効率が低くなるサンプルの検出感度１００％、分化誘導効率が低くなるサンプルの特異度８３％）で予測可能であることが分かった。なお、「Ｇｏｏｄ」は、分化誘導効率が高かったサンプルを示す。

　マイクロアレイで測定に用いた遺伝子から、上記第４実施形態のごとく高発現遺伝子１７０を抽出し、さらに高影響アノテーション情報１６７を選出した。その結果を図３７の表２０５および図３８の表２０６に示す。表２０５および表２０６によれば、種々雑多なアノテーション情報が高影響アノテーション情報１６７として選出されており、細胞の挙動の解明に繋がる有効な知見を得ることは困難であることが分かった。

　図３９に、１５サンプルの分化誘導前のｉＰＳ細胞２５について行った、Ｃ１０００の発現量の測定結果２０８を示す。測定結果２０８によれば、クラスタリングによって右側の９サンプルのグループと左側の６サンプルのグループに分かれ、６サンプルのグループに、「Ｂａｄ」で示す分化誘導効率が低かった５サンプルが全て包含された（分化誘導効率が低くなるサンプルの検出感度１００％、分化誘導効率が低くなるサンプルの特異度８３％）。したがって、本開示の技術に係るＣ１０００によれば、マイクロアレイによる網羅的な測定と同等のレベルの分化誘導効率の予測が可能であることが確認された。

　Ｃ１０００から上記第４実施形態のごとく高発現遺伝子１７０を抽出し、さらに高影響アノテーション情報１６７を選出した。その結果を図４０の表２１０に示す。表２１０によれば、血管形成系機能発現に関するアノテーション情報が特に多く選出されていることが分かる。また、ＮＯＤＡＬ、ＬＥＦＴＹ１、ＬＥＦＴＹ２、ＣＥＲ１、ＢＭＰ４等の遺伝子が目立っており、これらの遺伝子が分化誘導効率の高低を決定付けていそうなことが読み取れる。つまり、本開示の技術のように、アノテーション情報から評価値を導出し、評価値に基づいて測定対象遺伝子を選択すれば、生体試料の特性の解明に大いに役立つことが確認された。

　続いて、本開示の技術により選択したＣ１０００の測定遺伝子のセットと、従来手法を代表してＴａｑＭａｎスコアカードの測定遺伝子のセットとの解析能力を比較した。なお、ＴａｑＭａｎスコアカードの測定遺伝子のセットによる測定結果は、マイクロアレイによる網羅的な遺伝子の発現量の測定結果から、ＴａｑＭａｎスコアカードの８４個の遺伝子を抽出して疑似的に作成したものである。

　解析能力の比較として、ＤＥＧｓ抽出によって、ＴａｑＭａｎスコアカードにおける生体試料の種類と、Ｃ１０００における生体試料の種類のアノテーション情報とを対比させ、各アノテーション情報が付与された遺伝子に対して、ＤＥＧｓがどの程度濃縮されたかを表すオッズ比を調べた。図４１にＣ１０００の測定遺伝子のセットによるオッズ比の棒グラフ２１５、図４２にＴａｑＭａｎスコアカードの測定遺伝子のセットによるオッズ比の棒グラフ２１６を示す。

　図４１にの棒グラフ２１５によれば、Ｃ１０００の測定遺伝子のセットでは、分化誘導効率が低いサンプルにおいて、「中胚葉」および「内胚葉」に関連する遺伝子が濃縮されており、かつ「ｉＰＳ細胞」に関連する遺伝子が減少していた。また、分化誘導効率が低い場合の各生体試料の種類に関連する遺伝子は、「外胚葉」を除いて、オッズ比が統計的に有意に１００％から乖離（ｑ値（ｑ－ｖａｌｕｅ）が０．０５未満（ｑ＜０．０５））していた。このため、Ｃ１０００の測定遺伝子のセットは、分化誘導効率が低くなるサンプルに対する一定の解析能力を有していることが分かった。こうした結果が得られたのは、各生体試料の種類に焦点を当てた十分に多い測定対象遺伝子がバランスよく配分されているためと考えられる。

　一方、図４２の棒グラフ２１６によれば、ＴａｑＭａｎスコアカードの測定遺伝子のセットでは、分化誘導効率が高いサンプルにおいて「ｉＰＳ細胞」に関連する遺伝子が、分化誘導効率が低いサンプルにおいて「内胚葉」に関連する遺伝子が、それぞれ濃縮されていた。しかしながら、オッズ比が統計的に有意に１００％から乖離しているのは、分化誘導効率が高い場合の「ｉＰＳ細胞」に関連する遺伝子のみであった。このため、ＴａｑＭａｎスコアカードの測定遺伝子のセットは、分化誘導効率が低くなるサンプルに対する解析能力に限界があることが分かった。こうした結果が得られたのは、Ｃ１０００の場合と異なり、各生体試料の種類に配分された遺伝子の個数が少なく、極端な比率が生まれやすいためと考えられる。

　以上のように、本開示の技術は、事前に知見が蓄積されていない場合においても、統計的に有意な解明が可能である。つまり、検査が短時間で済み、かつ比較的安価なＰＣＲをベースとした手法を、ＲＮＡ－Ｓｅｑのように活用可能ということであり、幅広い応用が期待できる。

　上記各実施形態では、付与数自体を評価値として導出しているが、これに限定されない。付与数０は評価値０、付与数１～１０は評価値１、付与数１１～２０は評価値２、・・・というように、付与数に応じて予め設定された評価値を導出してもよい。

　測定対象遺伝子をユーザに提示する態様としては、図２４で示した測定対象遺伝子表示画面１２０をディスプレイ４９に表示する態様に限定されない。測定対象遺伝子リスト７８をプリントアウトする態様、あるいは、測定対象遺伝子リスト７８をユーザが所有する端末に電子メール等で配信する態様を採用してもよい。上記第４実施形態において高影響アノテーション情報１６７をユーザに提示する態様も同様に、高影響アノテーション情報表示画面１８０をディスプレイ４９に表示する態様に限らない。高影響アノテーション情報１６７をプリントアウトする態様、高影響アノテーション情報１６７をユーザが所有する端末に電子メール等で配信する態様を採用してもよい。

　上記各実施形態では、研究対象の生体試料としてｉＰＳ細胞２５を例示したが、これに限定されない。ＥＳ細胞、培養中の細胞からの抽出物、あるいは生体組織片でもよい。また、バイオマーカーとして遺伝子を例示したが、これに限定されない。遺伝子に代えて、あるいは加えて、遺伝子の配列、変異、発現、修飾、ＤＮＡ（Ｄｅｏｘｙｒｉｂｏｎｕｃｌｅｉｃ　ａｃｉｄ）、エピゲノム、ｍＲＮＡ（ｍｅｓｓｅｎｇｅｒ　ＲＮＡ）、ｍｉＲＮＡ（ｍｉｃｒｏＲＮＡ）、培養中に細胞が発現するタンパク質、培養中に細胞から出される代謝物、二酸化炭素濃度、ｐＨといった細胞の培養環境に関する要素を、バイオマーカーとしてもよい。ただし、遺伝子は種類が多く、より細胞の挙動の解明に寄与すると考えられるため、遺伝子をバイオマーカーに含めることが好ましい。なお、上記の例からも分かるように、本明細書における「バイオマーカー」とは、単に様々なバイオ特徴量を示す物の総称である。

　情報処理装置１０を構成するコンピュータのハードウェア構成は種々の変形が可能である。情報処理装置１０を、処理能力および信頼性の向上を目的として、ハードウェアとして分離された複数台のコンピュータで構成することも可能である。例えば、指示受付部６０、抽出部６１、および取得部６２の機能と、導出部６３、選択部６４、および表示制御部６５の機能とを、２台のコンピュータに分散して担わせる。この場合は２台のコンピュータで情報処理装置１０を構成する。

　このように、情報処理装置１０のコンピュータのハードウェア構成は、処理能力、安全性、信頼性等の要求される性能に応じて適宜変更することができる。さらに、ハードウェアに限らず、作動プログラム５５等のアプリケーションプログラムについても、安全性および信頼性の確保を目的として、二重化したり、あるいは、複数のストレージデバイスに分散して格納することももちろん可能である。

　上記各実施形態において、例えば、指示受付部６０、抽出部６１、取得部６２、導出部６３、選択部６４、表示制御部６５、および選出部１６５といった各種の処理を実行する処理部（Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）のハードウェア的な構造としては、次に示す各種のプロセッサ（Ｐｒｏｃｅｓｓｏｒ）を用いることができる。各種のプロセッサには、上述したように、ソフトウェア（作動プログラム５５）を実行して各種の処理部として機能する汎用的なプロセッサであるＣＰＵ４７に加えて、ＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）等の製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス（Ｐｒｏｇｒａｍｍａｂｌｅ　Ｌｏｇｉｃ　Ｄｅｖｉｃｅ:ＰＬＤ）、ＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。

　１つの処理部は、これらの各種のプロセッサのうちの１つで構成されてもよいし、同種または異種の２つ以上のプロセッサの組み合わせ（例えば、複数のＦＰＧＡの組み合わせ、および／または、ＣＰＵとＦＰＧＡとの組み合わせ）で構成されてもよい。また、複数の処理部を１つのプロセッサで構成してもよい。

　複数の処理部を１つのプロセッサで構成する例としては、第１に、クライアントおよびサーバ等のコンピュータに代表されるように、１つ以上のＣＰＵとソフトウェアの組み合わせで１つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第２に、システムオンチップ（Ｓｙｓｔｅｍ　Ｏｎ　Ｃｈｉｐ:ＳｏＣ）等に代表されるように、複数の処理部を含むシステム全体の機能を１つのＩＣ（Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、上記各種のプロセッサの１つ以上を用いて構成される。

　さらに、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子等の回路素子を組み合わせた電気回路（ｃｉｒｃｕｉｔｒｙ）を用いることができる。

　本開示の技術は、上述の種々の実施形態と種々の変形例を適宜組み合わせることも可能である。また、上記各実施形態に限らず、要旨を逸脱しない限り種々の構成を採用し得ることはもちろんである。さらに、本開示の技術は、プログラムに加えて、プログラムを非一時的に記憶する記憶媒体にもおよぶ。

　以上に示した記載内容および図示内容は、本開示の技術に係る部分についての詳細な説明であり、本開示の技術の一例に過ぎない。例えば、上記の構成、機能、作用、および効果に関する説明は、本開示の技術に係る部分の構成、機能、作用、および効果の一例に関する説明である。よって、本開示の技術の主旨を逸脱しない範囲内において、以上に示した記載内容および図示内容に対して、不要な部分を削除したり、新たな要素を追加したり、置き換えたりしてもよいことはいうまでもない。また、錯綜を回避し、本開示の技術に係る部分の理解を容易にするために、以上に示した記載内容および図示内容では、本開示の技術の実施を可能にする上で特に説明を要しない技術常識等に関する説明は省略されている。

　本明細書において、「Ａおよび／またはＢ」は、「ＡおよびＢのうちの少なくとも１つ」と同義である。つまり、「Ａおよび／またはＢ」は、Ａだけであってもよいし、Ｂだけであってもよいし、ＡおよびＢの組み合わせであってもよい、という意味である。また、本明細書において、３つ以上の事柄を「および／または」で結び付けて表現する場合も、「Ａおよび／またはＢ」と同様の考え方が適用される。

　本明細書に記載された全ての文献、特許出願および技術規格は、個々の文献、特許出願および技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。

Claims

　生体試料に関する複数のバイオマーカーのそれぞれに付与されたアノテーション情報を取得する取得処理と、
　前記アノテーション情報に基づいて、複数の前記バイオマーカー毎の評価値を導出する導出処理と、
　前記評価値に基づいて、複数の前記バイオマーカーの中から測定対象のバイオマーカーを選択する選択処理と、
をプロセッサが実行する情報処理装置の作動方法。
　前記プロセッサは、
　注目する生体試料の特性に関するアノテーション情報を選定して、
　選定したアノテーション情報のみに基づいて前記評価値を導出する請求項１に記載の情報処理装置の作動方法。
　前記プロセッサは、
　前記バイオマーカーに対する前記アノテーション情報が登録されたデータベースを参照して、前記バイオマーカーに対して前記アノテーション情報を付与する請求項１または請求項２に記載の情報処理装置の作動方法。
　前記アノテーション情報には、前記生体試料の種類が関連付けられている請求項１から請求項３のいずれか１項に記載の情報処理装置の作動方法。
　前記プロセッサは、
　前記生体試料の種類に応じて定義された複数のカテゴリ、および複数の前記カテゴリ毎の前記測定対象のバイオマーカーの個数の範囲のユーザによる指定を受け付け、
　複数の前記カテゴリ毎に用意された前記バイオマーカーから、前記範囲を満たす数のバイオマーカーを選択し、選択した前記バイオマーカーを、前記測定対象のバイオマーカーとして複数の前記カテゴリのそれぞれに割り振る請求項４に記載の情報処理装置の作動方法。
　前記カテゴリは、ｉＰＳ細胞、外胚葉、中胚葉、および内胚葉を含む請求項５に記載の情報処理装置の作動方法。
　前記プロセッサは、
　複数の前記バイオマーカー毎に前記アノテーション情報の付与数を計数し、
　前記付与数に基づいて前記評価値を導出する請求項１から請求項６のいずれか１項に記載の情報処理装置の作動方法。
　前記プロセッサは、
　前記アノテーション情報の情報価値に応じて、前記評価値に対して重み付けを行う請求項１から請求項７のいずれか１項に記載の情報処理装置の作動方法。
　前記プロセッサは、
　稀少性が比較的高いアノテーション情報を前記情報価値が高いと判断して、重み付けを重くする請求項８に記載の情報処理装置の作動方法。
　前記プロセッサは、
　前記アノテーション情報の直交性に基づいて、前記評価値に対して重み付けを行う請求項８または請求項９に記載の情報処理装置の作動方法。
　前記プロセッサは、
　強度指標が予め設定された閾値範囲内にある前記バイオマーカーの評価値の重み付けを重くする請求項１から請求項１０のいずれか１項に記載の情報処理装置の作動方法。
　前記プロセッサは、
　前記生体試料の特性に影響を与えることが既に知られている前記バイオマーカーである先行知見マーカーのユーザによる指定を受け付け、
　前記先行知見マーカーの評価値の重み付けを重くする請求項１から請求項１１のいずれか１項に記載の情報処理装置の作動方法。
　前記プロセッサは、
　１００個超１０００個以下の前記測定対象のバイオマーカーを選択する請求項１から請求項１２のいずれか１項に記載の情報処理装置の作動方法。
　前記バイオマーカーは遺伝子を含む請求項１から請求項１３のいずれか１項に記載の情報処理装置の作動方法。
　前記遺伝子は、発現量が特異的に変動している発現変動遺伝子を含む請求項１４に記載の情報処理装置の作動方法。
　前記アノテーション情報は、遺伝子オントロジーで定義された用語である請求項１から請求項１５のいずれか１項に記載の情報処理装置の作動方法。
　前記プロセッサは、
　前記測定対象のバイオマーカーの測定結果を取得し、
　前記測定結果に基づいて、統計的な手法によって、前記測定対象のバイオマーカーに付与された前記アノテーション情報から、前記生体試料の特性への影響度が比較的高いアノテーション情報を選出し、
　選出したアノテーション情報をユーザに提示する請求項１から請求項１６のいずれか１項に記載の情報処理装置の作動方法。
　少なくとも１つのプロセッサを備え、
　前記プロセッサは、
　生体試料に関する複数のバイオマーカーのそれぞれに付与されたアノテーション情報を取得し、
　前記アノテーション情報に基づいて、複数の前記バイオマーカー毎の評価値を導出し、
　前記評価値に基づいて、複数の前記バイオマーカーの中から測定対象のバイオマーカーを選択する、
情報処理装置。
　生体試料に関する複数のバイオマーカーのそれぞれに付与されたアノテーション情報を取得する取得処理と、
　前記アノテーション情報に基づいて、複数の前記バイオマーカー毎の評価値を導出する導出処理と、
　前記評価値に基づいて、複数の前記バイオマーカーの中から測定対象のバイオマーカーを選択する選択処理と、
をプロセッサに実行させる情報処理装置の作動プログラム。