JP6356015B2 - 遺伝子発現情報解析装置、遺伝子発現情報解析方法、及びプログラム - Google Patents

遺伝子発現情報解析装置、遺伝子発現情報解析方法、及びプログラム Download PDF

Info

Publication number
JP6356015B2
JP6356015B2 JP2014173382A JP2014173382A JP6356015B2 JP 6356015 B2 JP6356015 B2 JP 6356015B2 JP 2014173382 A JP2014173382 A JP 2014173382A JP 2014173382 A JP2014173382 A JP 2014173382A JP 6356015 B2 JP6356015 B2 JP 6356015B2
Authority
JP
Japan
Prior art keywords
pathway
information
expression information
gene
phenotype
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014173382A
Other languages
English (en)
Other versions
JP2016048485A (ja
Inventor
勝久 堀本
勝久 堀本
福井 一彦
一彦 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2014173382A priority Critical patent/JP6356015B2/ja
Publication of JP2016048485A publication Critical patent/JP2016048485A/ja
Application granted granted Critical
Publication of JP6356015B2 publication Critical patent/JP6356015B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

本発明は、コントロールに比べて発現量の変動が大きい遺伝子(これを「シグネチャ遺伝子」という)及びシグネチャ遺伝子を含むパスウェイを探索する技術に関する。
従来、シグネチャ遺伝子及びそのパスウェイを探索する方法としては、コントロールとサンプルの網羅的発現情報を比較し、発現量の相違が大きいシグネチャ遺伝子を探索し、その後で、既知のパスウェイのデータベースの中から、当該シグネチャ遺伝子を多く含むパスウェイを探すのが一般的であった(非特許文献1)。
藤渕航、堀本勝久 編集「マイクロアレイデータ統計解析プロトコール」羊土社
シグネチャ遺伝子を探索する対象の遺伝子は数万〜数十万個にも及ぶ場合があるが、これらの大量の遺伝子に対してマイクロアレイ解析等を行うと、それらの中にノイズが含まれてしまうことがあった。その結果、ノイズによって異常値を有する遺伝子をシグネチャ遺伝子として誤って探索してしまうという不都合が生じる場合があった。
本発明は、上記背景に鑑み、ノイズの影響を受けにくいシグネチャ遺伝子及びパスウェイの探索技術を提供することを目的とする。
本発明の遺伝子発現情報解析装置は、既知のパスウェイの情報を記憶したデータベースと、複数のサンプルの表現型に関する情報および網羅的発現情報を入力する入力部と、前記データベースから一のパスウェイを読み出し、前記複数のサンプルについて、前記網羅的発現情報から前記パスウェイを構成する遺伝子の発現情報を抽出し、前記サンプルの前記パスウェイ固有の発現情報を生成するパスウェイ固有遺伝子発現情報生成部と、前記パスウェイ固有の発現情報に基づいて前記複数のサンプルを複数の群にクラスタリングするクラスタリング部と、前記複数のサンプルが前記表現型に関する情報に応じて所定の閾値以上の精度で前記複数の群に分類された否かを判定し、所定の閾値以上の精度で分類されたと判定された場合には、当該パスウェイを前記表現型に特異的なパスウェイとして抽出するパスウェイ適合性判定部と、前記パスウェイ適合性判定部にて抽出されたパスウェイの情報を出力する出力部とを備える。
このようにパスウェイに含まれる少数の遺伝子の発現情報だけを比較して、パスウェイが表現型特異的かどうかによってパスウェイ適合性を判定しているので、表現型特異的なパスウェイの抽出に際してノイズの影響を抑制できる。
本発明の遺伝子発現情報解析装置は、前記複数のサンプルは複数の表現型に関する情報を有しており、前記パスウェイ適合判定部は、それぞれの表現型について、前記複数のサンプルが所定の閾値以上の精度で前記複数の群に分けられたか否かを判定し、前記出力部は、前記パスウェイ適合性判定部にて抽出されたパスウェイと、そのパスウェイを抽出した表現型を出力してもよい。表現型に関する情報としては、例えば、疾患の有無、疾患のステージ、薬剤の応答性、予後の状態等の情報を用いることができる。
このようにサンプルが複数の表現型に関する情報を有している場合には、それぞれのパスウェイについて、どの表現型情報に特異的であるかを求めることができ、効率良く、表現型特異的なパスウェイを求めることができる。従来は、表現型に応じたパスウェイを探索することは困難であったが、本発明の構成によれば、表現型に特異的なパスウェイを容易に求めることができる。
本発明の遺伝子発現情報解析装置は、前記パスウェイ適合性判定部にて抽出された表現型特異的パスウェイに含まれる遺伝子の中から、前記表現型の値の違いによって発現量の変動が大きいシグネチャ遺伝子を抽出するシグネチャ遺伝子抽出部を備えてもよい。
この構成により、ノイズの影響を抑制して求めたパスウェイに含まれる遺伝子の中からシグネチャ遺伝子を抽出しているので、シグネチャ遺伝子を抽出する際にもノイズの影響を抑制できる。
本発明の遺伝子発現情報解析装置において、前記網羅的発現情報は、遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報であり、前記パスウェイ適合性判定部は、遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報のそれぞれを用いて求めた表現型特異的パスウェイと、当該パスウェイを抽出したときの分類の精度の情報を出力し、遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報のそれぞれを用いて求めた表現型特異的パスウェイの情報と前記分類の精度の情報とに基づいて総合的な表現型特異的パスウェイを求めてもよい。
この構成により、多角的な網羅的発現情報に基づいて、表現型特異的なパスウェイを適切に求めることができる。
本発明の遺伝子発現情報解析装置は、前記パスウェイ適合性判定部にて抽出された遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報のそれぞれを用いて求めた表現型特異的パスウェイについて、当該表現型特異的パスウェイに含まれる遺伝子の中から、前記表現型の値の違いによって発現量の変動が大きいシグネチャ遺伝子を抽出するシグネチャ遺伝子抽出部を備えてもよい。
遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報のそれぞれの観点からシグネチャ遺伝子を求めることができる。
本発明の遺伝子発現情報解析装置は、前記シグネチャ遺伝子抽出部にて抽出したシグネチャ遺伝子の発現量を要素とするサンプルの発現量のベクトルを求め、前記ベクトルに基づいて前記サンプルどうしの偏相関係数を求め、求めた偏相関係数に基づいて前記複数のサンプルをクラスタリングしてもよい。
この構成により、ノイズを抑制して抽出されたシグネチャ遺伝子の発現量を要素とするベクトルを用いて、複数のサンプルを適切にクラスタリングすることができる。また、偏相関係数を用いることにより、対象としている2変数以外の他の変数の影響を除いた真の相関を求めることができる。これにより、分子レベルで病系分類を行うことができる。
本発明の遺伝子発現情報解析装置は、前記シグネチャ遺伝子抽出部にて抽出した遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報のそれぞれを用いて求めたシグネチャ遺伝子の発現量を要素とするサンプルの発現量のベクトルを求め、前記ベクトルに基づいて前記サンプルどうしの偏相関係数を求め、求めた偏相関係数に基づいて前記複数のサンプルをクラスタリングしてもよい。
この構成により、ノイズを抑制して抽出されたシグネチャ遺伝子の発現量を要素とするベクトルを用いて、複数のサンプルを適切にクラスタリングすることができる。また、偏相関係数を用いることにより、対象としている2変数以外の他の変数の影響を除いた真の相関を求めることができる。さらに、遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報を用いて求めたシグネチャ遺伝子の発現量を要素とするサンプルの発現量のベクトルを用いることにより、分子レベルで適切な病系分類を行うことができる可能性を高めることができる。病気が、遺伝子のメチル化レベル、mRNAの発現、タンパク質の発現のいずれに影響を与えるのかということは予め分かってはいないので、どの網羅的発現情報を用いればよいかは不明である。例えば、ある病気が遺伝子のメチル化レベルに影響を与えているにもかかわらず、mRNAの発現量を用いて求めたシグネチャ遺伝子だけを用いてクラスタリングを行ってしまうと正しく病系分類を行えないことになる。本発明では、遺伝子のメチル化レベル、mRNAの発現、タンパク質の発現の情報を用いて抽出したシグネチャ遺伝子を用いているので、病系分類の成功率を高めることができる。
本発明の遺伝子発現情報解析装置は、前記シグネチャ遺伝子抽出部にて抽出した遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報のそれぞれを用いて求めた前記シグネチャ遺伝子のベクトルを、当該シグネチャ遺伝子の前記複数のサンプルにおける発現量を要素として生成し、前記ベクトルに基づいて、メチル化レベル情報から求めたシグネチャ遺伝子とmRNAの発現情報から求めたシグネチャ遺伝子との偏相関係数、及び、mRNAの発現情報から求めたシグネチャ遺伝子とタンパク質の発現情報から求めたシグネチャ遺伝子との偏相関係数を求め、求めた偏相関係数に基づいて、遺伝子のメチル化レベル情報とmRNAの発現情報とタンパク質の発現情報の連鎖モデルを生成してもよい。
この構成により、ノイズを抑制して抽出されたシグネチャ遺伝子のベクトルに基づいて、適切なネットワーク連鎖モデルを生成することができる。また、偏相関係数を用いることにより、対象としている2変数以外の他の変数の影響を除いた真の相関を求め、ひいては真のネットワーク連鎖モデルを生成することができる。ネットワーク連鎖モデルを生成することにより、どの遺伝子がどの遺伝子に対して影響を与えているかを知ることができる。
本発明の遺伝子発現情報解析方法は、遺伝子発現情報解析装置が、複数のサンプルの表現型に関する情報および網羅的発現情報を入力するステップと、前記遺伝子発現情報解析装置が、前記複数のサンプルの表現型に関する情報および網羅的発現情報に基づいて、表現型特異的なパスウェイを探索するステップと、前記遺伝子発現情報解析装置が、抽出されたパスウェイを出力するステップとを備え、前記表現型特異的なパスウェイを探索するステップは、前記遺伝子発現情報解析装置が、前記複数のサンプルについて、前記網羅的発現情報から、前記パスウェイを構成する遺伝子の発現情報を抽出し、前記サンプルの前記パスウェイ固有の発現情報を生成するステップと、前記遺伝子発現情報解析装置が、前記パスウェイ固有の発現情報に基づいて前記複数のサンプルを複数の群にクラスタリングするステップと、前記遺伝子発現情報解析装置が、前記複数のサンプルが前記表現型に関する情報に応じて所定の閾値以上の精度で前記複数の群に分類されたか否かを判定し、所定の閾値以上の精度で分類されたと判定された場合には、当該パスウェイを前記表現型に特異的なパスウェイとして抽出するステップとを繰り返し行う。
本発明のプログラムは、遺伝子発現情報の解析を行うためのプログラムであって、コンピュータに、複数のサンプルの表現型に関する情報および網羅的発現情報を入力するステップと、前記複数のサンプルの表現型に関する情報および網羅的発現情報に基づいて、表現型特異的なパスウェイを探索するステップと、抽出されたパスウェイを出力するステップとを実行させ、前記表現型特異的なパスウェイを探索するステップは、前記複数のサンプルについて、前記網羅的発現情報から、前記パスウェイを構成する遺伝子の発現情報を抽出し、前記サンプルの前記パスウェイ固有の発現情報を生成するステップと、前記パスウェイ固有の発現情報に基づいて前記サンプルを複数の群にクラスタリングするステップと、前記複数のサンプルが前記表現型に関する情報に応じて所定の閾値以上の精度で前記複数の群に分類されたか否かを判定し、所定の閾値以上の精度で分類されたと判定された場合には、当該パスウェイを前記表現型に特異的なパスウェイとして抽出するステップとを繰り返し行う。
本発明によれば、パスウェイに含まれる少数の遺伝子の発現情報だけを比較して、パスウェイが表現型特異的かどうかによってパスウェイ適合性を判定しているので、表現型特異的なパスウェイの抽出に際してノイズの影響を抑制できる。
第1の実施の形態の遺伝子発現情報解析装置の構成を示す図である。 パスウェイデータベースに記憶されたデータを模式的に示す図である。 遺伝子発現情報解析装置に入力されるサンプルの情報の例を示す図である。 パスウェイ固有遺伝子発現情報生成部の処理を模式的に示す図である。 (a)クラスタリング部によって、サンプルを2つの群にクラスタリングした例を示す。(b)クラスタリング結果に表現型を当てはめた例を示す図である。(c)クラスタリング結果に表現型を当てはめた例を示す図である。 第1の実施の形態の遺伝子発現情報解析装置の動作を示す図である。 第2の実施の形態の遺伝子発現情報解析装置の原理を示す図である。 複数のサンプルS1〜SNについて、シグネチャ遺伝子Sgm,Sgt,Sgpの発現量のデータを記載した図である。 偏相関係数に基づいてサンプルS1〜SNをクラスタリングした例を示す図である。 複数のサンプルS1〜SNについて、シグネチャ遺伝子Sgm,Sgt,Sgpの発現量のデータを記載した図である。 連鎖モデルを示す図である。
以下、本発明の実施の形態の遺伝子発現情報解析装置について、図面を参照して説明する。
(第1の実施の形態)
図1は、第1の実施の形態の遺伝子発現情報解析装置1の構成を示す図である。第1の実施の形態の遺伝子発現情報解析装置1は、既知のパスウェイの情報を記憶したパスウェイデータベース(以下、「パスウェイDB」という)10と、解析の対象となるサンプルの網羅的遺伝子発現情報を入力する入力部11と、入力された情報を解析する制御部12と、解析結果を出力する出力部18とを有している。
遺伝子発現情報解析装置1は、CPU、RAM、ROM、ディスプレイ、キーボード、マウス、通信インターフェース等を備えるコンピュータによって構成される。遺伝子発現情報解析のためのプログラムをROMに記憶しておき、CPUがROMからプログラムを読み出して実行することにより、コンピュータが遺伝子発現情報解析を行う。
図2は、パスウェイDB10に記憶されたデータの例を模式的に示す図である。図2に示すようにパスウェイDB10には、既知のパスウェイのデータとそのパスウェイを構成する遺伝子のデータが関連付けて記憶されている。図2に示す例では、例えば、パスウェイ:P001は、遺伝子a,b,c,d,・・・を含んでいる。パスウェイDB10としては、MSigDB(Molecular Signatures Database)、INOH Pathway Database(Integrating Network Objects with Hierarchies Pathway Database)、KEGG PATHWAYなどの既知のデータベースを用いることができる。
図3は、入力部11より入力されるサンプルの情報の例を示す図である。サンプルの情報は、サンプルを特定するIDと、サンプルの表現型のデータと、遺伝子データを有している。例えば、ID:00001の被験者の表現型は、疾患なし、ステージなし、薬剤応答性なしであり、その被験者のデータ(たとえばマイクロアレイデータ)はData00001である。ID:00002の被験者の表現型は、d-HCM(肥大型心筋症)の疾患あり、ステージ2、薬剤応答性5である。ここで、薬剤応答性は、薬剤に対する応答の大きさを5段階で評価した数値であり、数値が大きいほど、薬剤に対する応答性が大きい。
本実施の形態において、遺伝子データは、mRNA発現量である。本実施の形態では、mRNA発現量のデータを用いているが、遺伝子のメチル化の情報や、タンパク質の発現量の情報を用いてもよい。mRNA発現量のデータは、例えば、マイクロアレイ解析によって取得され、数万〜数十万のmRNAの発現量の情報を有している。
制御部12は、入力されたサンプルの網羅的遺伝子発現情報に基づいて、ある表現型に着目したときのシグネチャ遺伝子及びパスウェイを求める機能を有している。例えば、表現型がd-HCMの疾患の有無であるとすると、制御部12は、d-HCMの患者(サンプル)とd-HCMではない被験者(コントロール)とのmRNA発現量を比較したときに、発現量の変動の大きいシグネチャ遺伝子及びパスウェイを発見する機能を有している。このシグネチャ遺伝子は、d-HCMに関係の深い遺伝子であると理解される。シグネチャ遺伝子の知見は創薬等に利用することができる有益な情報である。
制御部12は、パスウェイ読出部13と、パスウェイ固有遺伝子発現情報生成部14と、クラスタリング部15と、パスウェイ適合性判定部16と、シグネチャ遺伝子抽出部17とを有している。パスウェイ読出部13は、パスウェイDB10から、パスウェイの情報を読み出す機能を有している。
パスウェイ固有遺伝子発現情報生成部14は、パスウェイ読出部13にて読み出したパスウェイに含まれる遺伝子を特定する。例えば、パスウェイP001の場合には、パスウェイを構成する遺伝子として、a,b,c,e,・・・が特定される。パスウェイ固有遺伝子発現情報生成部14は、入力部11より入力された網羅的遺伝子発現情報の中から、特定された遺伝子の発現情報を抽出する機能を有する。
図4は、パスウェイ固有遺伝子発現情報生成部14の処理を模式的に示す図である。図4の上に示すマトリックスは、入力部11より入力された網羅的遺伝子発現情報を示す。マトリックスの一つ一つが遺伝子の発現情報を有している。この網羅的遺伝子発現情報において、パスウェイAに含まれる遺伝子を特定し、特定された遺伝子発現情報を抽出して、パスウェイAに含まれる遺伝子の発現情報を生成する。パスウェイ固有遺伝子発現情報生成部14は、入力部11より入力された全てのサンプルの情報に対してこの処理を行って、サンプルのパスウェイ固有の遺伝子発現情報を生成する。
クラスタリング部15は、パスウェイ固有の遺伝子発現情報をクラスタリングして2つの群に分ける。クラスタリングには、k-means法などの既知の統計的手法を用いることができる。図5(a)は、クラスタリング部15によって、パスウェイAに固有の遺伝子について複数のサンプルを2つの群(図5において点線で囲って示す)にクラスタリングした例を示す。
パスウェイ適合性判定部16は、パスウェイが表現型に特異的なものであるか否かを判定する機能を有する。本実施の形態のように、サンプルが複数の表現型に関する情報を有している場合には、各表現型についてパスウェイが特異的であるか否かを判定する。具体的には、パスウェイ適合性判定部16は、表現型の値が異なるサンプル(例えば、疾患ありのサンプルと、疾患なしのサンプル)が、クラスタリング部15にて分けられた2つの群に所定の精度で分類されたか否かを判定する。そして、ある表現型の値が異なるサンプルが所定の精度で2つの群に分類された場合には、その表現型に特異的なパスウェイであると判定する。
図5(b)は、図5(a)に示すパスウェイAに固有の遺伝子発現情報に基づくクラスタリングの結果に対して、「疾患の有無」という表現型を当てはめた例を示す図である。図5(b)において、「N」は疾患なしを示し、「D」は疾患ありを示す。疾患の有無のデータは、サンプルの情報に含まれる表現型に関する情報である。
図5(b)においては、左側の群には、疾患なしのサンプルが分類され、右側の群には疾患ありのサンプルが分類された。「疾患あり」「疾患なし」という表現型の違いによって、きれいに2つの群に分類されているので、このクラスタリングに用いたパスウェイ固有遺伝子を抽出したパスウェイAは、「疾患の有無」という表現型に特異的なパスウェイであると判定する。
図5(c)は、図5(a)に示すクラスタリングの結果に対して、「薬剤応答性」という表現型を当てはめた例を示す図である。図5(c)において、「Y」は薬剤応答性あり(つまり薬剤が効くこと)を示し、「N」は薬剤応答性なしを示す。図5(c)においては、左側の群にも、右側の群にも、薬剤応答性ありと薬剤応答性なしの両方のサンプルが含まれており、このパスウェイAによって分類することができていない。したがって、このパスウェイAは、「薬剤応答性」の表現型に対しては特異的でないと判定する。
図5(b)では、「疾患あり」のサンプルと「疾患なし」のサンプルとが完全に分類された例を示しているが、分類の精度は100%でなくてもよく、例えば、90%以上の精度で分類できた表現型については、その表現型に特異的なパスウェイであると判定してもよい。
シグネチャ遺伝子抽出部17は、表現型に特異的なパスウェイに含まれる遺伝子の中からシグネチャ遺伝子を抽出する機能を有する。シグネチャ遺伝子抽出部17は、特異的なパスウェイであるとの判断の元となった表現型の値の違いによって、発現量の変動の大きい遺伝子を求める。例えば、図5(b)に示す例では、「疾患あり」に含まれる遺伝子発現情報と、「疾患なし」に含まれる遺伝子発現情報とを比較して、発現量の変動の大きい遺伝子を特定する。なお、シグネチャ遺伝子抽出部17は、表現型の値が違うこと(例えば、疾患の有無)によって発現量の変動が大きい遺伝子を求めるのであって、クラスタリング部15にて分類された2つの群の遺伝子発現情報を比較するのではない。以上、制御部12の構成について説明した。
出力部18は、制御部12にて求めた表現型に特異的なパスウェイとシグネチャ遺伝子を出力する機能を有している。
図6は、第1の実施の形態の遺伝子発現情報解析装置1の動作を示す図である。本実施の形態の遺伝子発現情報解析装置1は、まず、入力部11より、複数のサンプルの情報を入力する(S10)。上述したとおり、サンプルの情報には、表現型に関する情報と網羅的遺伝子発現情報とが含まれている。
次に、遺伝子発現情報解析装置1は、パスウェイDB10から一のパスウェイの情報を読み出し(S12)、当該パスウェイを構成する遺伝子の発現情報を入力されたサンプルの網羅的遺伝子発現情報から抽出して、パスウェイ固有の遺伝子発現情報を生成する(S14)。続いて、遺伝子発現情報解析装置1は、パスウェイ固有の遺伝子発現情報に基づいて複数のサンプルを2つの群にクラスタリングする(S16)。
次に、遺伝子発現情報解析装置1は、各表現型について、表現型の値が異なるサンプルが2つの群に所定の閾値以上の精度で分類されたか否かを判定する。所定の閾値以上の精度で分類された場合には、遺伝子発現情報解析装置1は、現在処理中のパスウェイがその表現型に特異的なパスウェイであると決定する(S18)。
遺伝子発現情報解析装置1は、以上の処理を、パスウェイDB10に記憶された全パスウェイについて行ったか否かを判定し(S20)、全パスウェイについて行っていないと判定した場合には(S20でNO)、パスウェイDB10から処理を行っていない別のパスウェイの情報を読み出して(S12)、上記の処理を繰り返す。全パスウェイについて処理を行ったと判定された場合には(S20でYES)、遺伝子発現情報解析装置1は、表現型に特異的なパスウェイに含まれる遺伝子の中からその表現型のシグネチャ遺伝子を抽出する(S22)。その後、遺伝子発現情報解析装置1は、表現型別に、表現型特異的なパスウェイとシグネチャ遺伝子の情報を出力する(S24)。以上、第1の実施の形態の遺伝子発現情報解析装置1の構成及び動作について説明した。
第1の実施の形態の遺伝子発現情報解析装置1は、入力されたサンプルの網羅的遺伝子発現情報からパスウェイ固有の遺伝子発現情報を生成し、パスウェイ固有の遺伝子発現情報に基づいてサンプルをクラスタリングして得られた2つの群に、表現型の値の違うサンプルが精度良く分類されているか否かを判定することで、表現型に特異的なパスウェイを探索する。これにより、サンプルの網羅的遺伝子発現情報に含まれるノイズの影響を受けにくくでき、表現型特異的なパスウェイを適切に求めることができる。
従来の方法と比較して、本実施の形態の効果について説明する。ここで、マイクロアレイ解析によって求めたサンプルの遺伝子発現情報に0.1%の確率でノイズが含まれると仮定する。例えば、d-HCMのシグネチャ遺伝子を探索する従来法は、d-HCMの患者から取得したmRNA発現情報と、健常者のmRNA発現情報とを比較し、変動の大きい遺伝子を抽出していた。サンプルに2万個の遺伝子のデータを含まれていたとすると、2万個×0.1%=20個のmRNAの発現情報にはノイズが含まれ、異常値となる。異常値をとる20個のmRNAは、実際にはd-HCMに特異的な遺伝子ではないとしても、d-HCMに特異的なmRNAと判定されてしまう可能性が高い。そして、この20個のmRNAを含むシグネチャ遺伝子に基づいてパスウェイを求めると、誤ったパスウェイが求められてしまう。
これに対し、本実施の形態の方法では、最初にパスウェイ固有の発現遺伝子情報を生成している。パスウェイを構成する遺伝子数はせいぜい30〜40個程度であるので、0.1%の確率でノイズが含まれたとしても、パスウェイ固有の発現遺伝子情報の中に異常値が含まれる可能性は極めて低く、仮に含まれても1個か2個である。したがって、パスウェイ固有の発現遺伝子情報に基づくサンプルのクラスタリングに、ノイズの影響はほとんどなく、適切にクラスタリングを行うことができる。このクラスタリング結果を使って表現型に特異的なパスウェイを探索するので、適切なパスウェイを求めることができる。
(第2の実施の形態)
次に、第2の実施の形態の遺伝子発現情報解析装置について説明する。第2の実施の形態の遺伝子発現情報解析装置の基本的な構成は、第1の実施の形態と同じである。
図7は、第2の実施の形態の遺伝子発現情報解析装置の原理を示す図である。第2の実施の形態で用いられるサンプルには、遺伝子データとして、遺伝子のメチル化レベル情報、mRNA発現情報、及びタンパク質の発現情報が含まれている。遺伝子発現情報解析装置は、遺伝子のメチル化レベル情報、mRNA発現情報、及びタンパク質の発現情報のそれぞれに基づいて、表現型特異的なパスウェイを求め、それらの結果を統合して、表現型特異的なパスウェイとシグネチャ遺伝子を求める。
遺伝子のメチル化レベル情報、mRNA発現情報、及び、タンパク質の発現情報から表現型特異的なパスウェイを求める方法は、第1の実施の形態で説明した方法と同じである。すなわち、シグネチャ遺伝子の抽出に先立ってパスウェイ固有の遺伝子発現情報を生成しておき、パスウェイ固有の遺伝子発現情報に基づいてサンプルのクラスタリングを行い、クラスタリングされた2つの群が表現型の値が違うサンプルを精度良く分類しているか否かを判定することで、表現型に特異的なパスウェイを求める。これにより、遺伝子のメチル化レベル情報を用いて求めた表現型特異的パスウェイ、mRNA発現情報を用いて求めた表現型特異的パスウェイ、及び、タンパク質の発現情報を用いて求めた表現型特異的パスウェイが得られる。
第2の実施の形態では、この際に、表現型の値が違うサンプルを分類できた精度に基づいて、それぞれのパスウェイが表現型特異的なパスウェイである確率値を求める。分類の精度が高いほど、表現型特異的なパスウェイである確率値が高いものとして扱う。そして、それぞれの確率値にフィッシャーの式(Fisher's C)を適用して統合確率を求め、求めた統合確率に基づいて、表現型特異的パスウェイの決定を行う。第2の実施の形態の遺伝子発現情報解析装置は、3つの発現情報を用いて求めた表現型特異的パスウェイに含まれる遺伝子の中から、表現型がとる値の違いによって発現量の違いが大きいシグネチャ遺伝子を求める。
第2の実施の形態では、遺伝子のメチル化レベル情報、mRNA発現情報、及び、タンパク質の発現情報の3つの発現情報を用いて、マルチオミックス解析によって表現型特異的なパスウェイを求めるので、多角的な観点から表現特異的なパスウェイを求めることができる。
(第3の実施の形態)
次に、第3の実施の形態の遺伝子発現情報解析装置について説明する。第3の実施の形態の遺伝子発現情報解析装置は、シグネチャ遺伝子のデータを用いてサンプルの病系分類を行う。
第3の実施の形態の遺伝子発現情報解析装置の基本的な構成は、第2の実施の形態と同じである。第3の実施の形態の遺伝子発現情報解析装置は、遺伝子のメチル化レベル情報を用いて求めた表現型特異的パスウェイ、mRNA発現情報を用いて求めた表現型特異的パスウェイ、及び、タンパク質の発現情報を用いて求めた表現型特異的パスウェイのそれぞれから、シグネチャ遺伝子を求める。すなわち、(1)遺伝子のメチル化レベル情報を用いて求めた表現型特異的パスウェイの遺伝子の中からシグネチャ遺伝子Sgm 1,Sgm 2,Sgm 3,・・・Sgm kを求め、(2)mRNA発現情報を用いて求めた表現型特異的パスウェイの遺伝子の中からシグネチャ遺伝子Sgt 1,Sgt 2,Sgt 3,・・・Sgt lを求め、(3)タンパク質の発現情報を用いて求めた表現型特異的パスウェイの遺伝子の中からシグネチャ遺伝子Sgp 1,Sgp 2,Sgp 3,・・・Sgp mを求める。
図8は、複数のサンプルS1〜SNについて、シグネチャ遺伝子Sgm,Sgt,Sgpの発現量のデータを記載した図である。図8では省略しているが、サンプルとシグネチャ遺伝子の交点には、当該サンプルのシグネチャ遺伝子の発現量のデータが入っている。サンプルS1〜SNは、シグネチャ遺伝子Sgm 1,Sgm 2,Sgm 3,・・・Sgm k,Sgt 1,Sgt 2,Sgt 3,・・・Sgt l,Sgp 1,Sgp 2,Sgp 3,・・・Sgp mの発現量を要素とするベクトルとして表現することができる。
第3の実施の形態の遺伝子発現情報解析装置は、上述したベクトルに基づいて、複数のサンプルの相互間の偏相関係数を求める。偏相関係数は、対象としている2変数以外の他の変数の影響を除いた真の相関を示す係数であり、公知の方法によって計算することができる。第3の実施の形態の遺伝子発現情報解析装置は、偏相関係数に基づいてサンプルS1〜SNをクラスタリングする。具体的には、サンプルS1〜SN間に偏相関係数の大きさに応じたエッジを張り、エッジの繋がり具合によってクラスタリングを行う。
図9は、偏相関係数に基づいてサンプルS1〜SNをクラスタリングした例を示す図である。図9に示す例では、サンプルS1,S4,S5,S8が一つの群にクラスタリングされ、サンプルS2,S3,S7が一つの群にクラスタリングされている。例えば、サンプルS1,S4,S5,S8がいずれも疾患Aがあるサンプルであり、サンプルS2,S3,S7がいずれも疾患Aがないサンプルであるとした場合、疾患Aの有無を分子レベルで病系分類ができたことになる。したがって、第3の実施の形態の遺伝子発現情報解析装置を用いて、新しいサンプルの病系分類を分子レベルで客観的に行うことが可能となるので、経験が浅い医師であっても適切な診断を行うことが可能となる。なお、従来は、病系分類には、階層型クラスタリングが用いられることがあったが、病系分類をうまく行えない場合があった。例えば、腎がんは、分子レベルの病系分類を行うことができなかったが、本発明者らのこの方法により初めて分子レベルの病系分類を行えるようになった。
本実施の形態では、(1)遺伝子のメチル化レベル情報を用いて求めたシグネチャ遺伝子Sgm 1,Sgm 2,Sgm 3,・・・Sgm k、(2)mRNA発現情報を用いて求めたシグネチャ遺伝子Sgt 1,Sgt 2,Sgt 3,・・・Sgt l、(3)タンパク質の発現情報を用いて求めたシグネチャ遺伝子Sgp 1,Sgp 2,Sgp 3,・・・Sgp mを用いているので、病気が遺伝子のメチル化レベル、mRNA発現、タンパク質の発現のいずれに影響を与える場合であっても、適切なクラスタリングを行える可能性が高い。
本実施の形態では、(1)シグネチャ遺伝子Sgm 1,Sgm 2,Sgm 3,・・・Sgm k、(2)シグネチャ遺伝子Sgt 1,Sgt 2,Sgt 3,・・・Sgt l、(3)シグネチャ遺伝子Sgp 1,Sgp 2,Sgp 3,・・・Sgp mを用いて、サンプルのクラスタリングを行ったが、必ずしもすべての発現情報を用いなくてもよく、上記(1)〜(3)のうちの1つを用いたり、2つを組み合わせて用いてもよい。
(第4の実施の形態)
次に、第4の実施の形態の遺伝子発現情報解析装置について説明する。遺伝情報は、遺伝子のメチル化、mRNA発現、タンパク質の発現の順に伝達されるが、第4の実施の形態の遺伝子発現情報解析装置は、遺伝子のメチル化、mRNA発現、タンパク質の発現のそれぞれの段階において、遺伝子がどのように影響し合っているかを解析する。
第4の実施の形態の遺伝子発現情報解析装置の基本的な構成は、第3の実施の形態と同じである。第4の実施の形態の遺伝子発現情報解析装置は、遺伝子のメチル化レベル情報を用いて求めた表現型特異的パスウェイ、mRNA発現情報を用いて求めた表現型特異的パスウェイ、及び、タンパク質の発現情報を用いて求めた表現型特異的パスウェイのそれぞれから、シグネチャ遺伝子を求める。すなわち、(1)遺伝子のメチル化レベル情報を用いて求めた表現型特異的パスウェイの遺伝子の中からシグネチャ遺伝子Sgm 1,Sgm 2,Sgm 3,・・・Sgm kを求め、(2)mRNA発現情報を用いて求めた表現型特異的パスウェイの遺伝子の中からシグネチャ遺伝子Sgt 1,Sgt 2,Sgt 3,・・・Sgt lを求め、(3)タンパク質の発現情報を用いて求めた表現型特異的パスウェイの遺伝子の中からシグネチャ遺伝子Sgp 1,Sgp 2,Sgp 3,・・・Sgp mを求める。
図10は、複数のサンプルS1〜SNについて、シグネチャ遺伝子Sgm,Sgt,Sgpの発現量のデータを記載した図である。図10では省略しているが、サンプルとシグネチャ遺伝子の交点には、当該サンプルのシグネチャ遺伝子の発現量のデータが入っている。シグネチャ遺伝子Sgm 1,Sgm 2,Sgm 3,・・・Sgm k,Sgt 1,Sgt 2,Sgt 3,・・・Sgt l,Sgp 1,Sgp 2,Sgp 3,・・・Sgp mは、サンプルS1〜SNの当該シグネチャ遺伝子の発現量を要素とするベクトルとして表現することができる。
第4の実施の形態の遺伝子発現情報解析装置は、上述したベクトルに基づいて、(1)遺伝子のメチル化レベル情報を用いて求めたシグネチャ遺伝子Sgm 1,Sgm 2,Sgm 3,・・・Sgm kと(2)mRNA発現情報を用いて求めたシグネチャ遺伝子Sgt 1,Sgt 2,Sgt 3,・・・Sgt lの偏相関係数を求めると共に、(2)mRNA発現情報を用いて求めたシグネチャ遺伝子Sgt 1,Sgt 2,Sgt 3,・・・Sgt lと(3)タンパク質の発現情報を用いて求めたシグネチャ遺伝子Sgp 1,Sgp 2,Sgp 3,・・・Sgp mの偏相関係数を求める。
第3の実施の形態の遺伝子発現情報解析装置は、偏相関係数に基づいて(1)シグネチャ遺伝子Sgm 1,Sgm 2,Sgm 3,・・・Sgm kと、(2)シグネチャ遺伝子Sgt 1,Sgt 2,Sgt 3,・・・Sgt lと、(3)シグネチャ遺伝子Sgp 1,Sgp 2,Sgp 3,・・・Sgp mとの偏相関を表す連鎖モデルを生成する。
図11は、連鎖モデルを示す図である。シグネチャ遺伝子のベクトルの偏相関が高いということは、シグネチャ遺伝子の各段階での発現の原因と結果の関係になっている可能性がある。例えば、シグネチャ遺伝子Sgm 1とシグネチャ遺伝子Sgt 1,Sgt 2の偏相関が高いが、これはシグネチャ遺伝子Sgm 1のメチル化がシグネチャ遺伝子Sgt 1,Sgt 2のmRNAの発現の原因になっている可能性があると判断することができる。このようにメチル化レベルとmRNAの発現とタンパク質の発現の各段階でのシグネチャ遺伝子どうしの関係が明らかになることにより、どのシグネチャ遺伝子に働きかければ有効であるかの手がかりを得ることができる。例えば、上述の例では、シグネチャ遺伝子Sgm 1のメチル化がシグネチャ遺伝子Sgt 1,Sgt 2のmRNAの発現に関係していることが分かるから、シグネチャ遺伝子Sgm 1のメチル化をブロックすれば、シグネチャ遺伝子Sgt 1,Sgt 2のmRNAの発現量を増やすことができること(あるいはその逆)が分かる。
以上、本発明の遺伝子発現情報解析装置について実施の形態を挙げて詳細に説明したが、本発明は上述した実施の形態に限定されない。
上述した第1の実施の形態では、クラスタリング部15は、サンプルを2つの群にクラスタリングする例を挙げているが、クラスタリング部15は、3つ以上の群にクラスタリングをしてもよい。例えば、表現型が取りうる値が3つある場合には、3つの群にクラスタリングし、表現型が取りうる値に応じてサンプルが3つの群に精度良く分類されたか否かによって、パスウェイ適合性を判断してもよい。
上述した第3の実施の形態及び第4の実施の形態では、第2の実施の形態の遺伝子発現情報解析装置で求めたシグネチャ遺伝子及びその発現量のデータを用いる例について説明したが、第3の実施の形態で説明したサンプルのクラスタリング、第4の実施の形態の遺伝子の連鎖モデルの生成は、第2の実施の形態の遺伝子発現情報解析方法によって求めた以外のシグネチャ遺伝子にも適用することができる。
本発明は、表現型特異的なパスウェイの抽出に際してノイズの影響を抑制できるという効果を有し、遺伝子発現情報の中からシグネチャ遺伝子を抽出する技術に有用である。
1 遺伝子発現情報解析装置
10 パスウェイDB
11 入力部
12 制御部
13 パスウェイ読出部
14 パスウェイ固有遺伝子発現情報生成部
15 クラスタリング部
16 パスウェイ適合性判定部
17 シグネチャ遺伝子抽出部
18 出力部

Claims (11)

  1. 既知のパスウェイの情報を記憶したデータベースと、
    複数のサンプルの表現型に関する情報および網羅的発現情報を入力する入力部と、
    前記データベースから一のパスウェイを読み出し、前記複数のサンプルについて、前記網羅的発現情報から前記パスウェイを構成する遺伝子の発現情報を抽出し、前記サンプルの前記パスウェイ固有の発現情報を生成するパスウェイ固有遺伝子発現情報生成部と、
    前記パスウェイ固有の発現情報に基づいて前記複数のサンプルを複数の群にクラスタリングするクラスタリング部と、
    表現型が異なる前記複数のサンプルが所定の閾値以上の精度で互いに異なる前記複数の群に分類された否かを前記表現型に関する情報に応じて判定し、所定の閾値以上の精度で分類されたと判定された場合には、当該パスウェイを前記表現型に特異的なパスウェイとして抽出するパスウェイ適合性判定部と、
    前記パスウェイ適合性判定部にて抽出されたパスウェイの情報を出力する出力部と、
    を備える遺伝子発現情報解析装置。
  2. 前記複数のサンプルは複数の表現型に関する情報を有しており、
    前記パスウェイ適合判定部は、それぞれの表現型について、前記複数のサンプルが所定の閾値以上の精度で前記複数の群に分けられたか否かを判定し、
    前記出力部は、前記パスウェイ適合性判定部にて抽出されたパスウェイと、そのパスウェイを抽出した表現型を出力する請求項1に記載の遺伝子発現情報解析装置。
  3. 前記表現型に関する情報は、疾患の有無の情報である請求項1または2に記載の遺伝子発現情報解析装置。
  4. 前記パスウェイ適合性判定部にて抽出された表現型特異的パスウェイに含まれる遺伝子の中から、前記表現型の値の違いによって発現量の変動が大きいシグネチャ遺伝子を抽出するシグネチャ遺伝子抽出部を備える、請求項1ないし3のいずれかに記載の遺伝子発現情報解析装置。
  5. 前記網羅的発現情報は、遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報であり、
    前記パスウェイ適合性判定部は、遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報のそれぞれを用いて求めた表現型特異的パスウェイと、当該パスウェイを抽出したときの分類の精度の情報を出力し、
    遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報のそれぞれを用いて求めた表現型特異的パスウェイの情報と前記分類の精度の情報とに基づいて総合的な表現型特異的パスウェイを求める請求項1ないし3のいずれかに記載の遺伝子発現情報解析装置。
  6. 前記パスウェイ適合性判定部にて抽出された遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報のそれぞれを用いて求めた表現型特異的パスウェイについて、当該表現型特異的パスウェイに含まれる遺伝子の中から、前記表現型の値の違いによって発現量の変動が大きいシグネチャ遺伝子を抽出するシグネチャ遺伝子抽出部を備える、請求項5に記載の遺伝子発現情報解析装置。
  7. 前記シグネチャ遺伝子抽出部にて抽出したシグネチャ遺伝子の発現量を要素とするサンプルの発現量のベクトルを生成し、前記ベクトルに基づいて前記サンプルどうしの偏相関係数を求め、求めた偏相関係数に基づいて前記複数のサンプルをクラスタリングする請求項4に記載の遺伝子発現情報解析装置。
  8. 前記シグネチャ遺伝子抽出部にて抽出した遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報のそれぞれを用いて求めたシグネチャ遺伝子の発現量を要素とするサンプルの発現量のベクトルを生成し、前記ベクトルに基づいて前記サンプルどうしの偏相関係数を求め、求めた偏相関係数に基づいて前記複数のサンプルをクラスタリングする請求項6に記載の遺伝子発現情報解析装置。
  9. 前記シグネチャ遺伝子抽出部にて抽出した遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報のそれぞれを用いて求めた前記シグネチャ遺伝子のベクトルを、当該シグネチャ遺伝子の前記複数のサンプルにおける発現量を要素として生成し、前記ベクトルに基づいて、メチル化レベル情報から求めたシグネチャ遺伝子とmRNAの発現情報から求めたシグネチャ遺伝子との偏相関係数、及び、mRNAの発現情報から求めたシグネチャ遺伝子とタンパク質の発現情報から求めたシグネチャ遺伝子との偏相関係数を求め、求めた偏相関係数に基づいて、遺伝子のメチル化レベル情報とmRNAの発現情報とタンパク質の発現情報の連鎖モデルを生成する請求項6に記載の遺伝子発現情報解析装置。
  10. 遺伝子発現情報解析装置が、複数のサンプルの表現型に関する情報および網羅的発現情報を入力するステップと、
    前記遺伝子発現情報解析装置が、前記複数のサンプルの表現型に関する情報および網羅的発現情報に基づいて、表現型特異的なパスウェイを探索するステップと、
    前記遺伝子発現情報解析装置が、抽出されたパスウェイを出力するステップと、
    を備え、
    前記表現型特異的なパスウェイを探索するステップは、
    前記遺伝子発現情報解析装置が、前記複数のサンプルについて、前記網羅的発現情報から、前記パスウェイを構成する遺伝子の発現情報を抽出し、前記サンプルの前記パスウェイ固有の発現情報を生成するステップと、
    前記遺伝子発現情報解析装置が、前記パスウェイ固有の発現情報に基づいて前記複数のサンプルを複数の群にクラスタリングするステップと、
    前記遺伝子発現情報解析装置が、表現型が異なる前記複数のサンプルが所定の閾値以上の精度で互いに異なる前記複数の群に分類されたか否かを前記表現型に関する情報に応じて判定し、所定の閾値以上の精度で分類されたと判定された場合には、当該パスウェイを前記表現型に特異的なパスウェイとして抽出するステップと、
    を繰り返し行う遺伝子発現情報解析方法。
  11. 遺伝子発現情報の解析を行うためのプログラムであって、コンピュータに、
    複数のサンプルの表現型に関する情報および網羅的発現情報を入力するステップと、
    前記複数のサンプルの表現型に関する情報および網羅的発現情報に基づいて、表現型特異的なパスウェイを探索するステップと、
    抽出されたパスウェイを出力するステップと、
    を実行させ、
    前記表現型特異的なパスウェイを探索するステップは、
    前記複数のサンプルについて、前記網羅的発現情報から、前記パスウェイを構成する遺伝子の発現情報を抽出し、前記サンプルの前記パスウェイ固有の発現情報を生成するステップと、
    前記パスウェイ固有の発現情報に基づいて前記サンプルを複数の群にクラスタリングするステップと、
    表現型が異なる前記複数のサンプルが所定の閾値以上の精度で互いに異なる前記複数の群に分類されたか否かを前記表現型に関する情報に応じて判定し、所定の閾値以上の精度で分類されたと判定された場合には、当該パスウェイを前記表現型に特異的なパスウェイとして抽出するステップと、
    を繰り返し行うプログラム。
JP2014173382A 2014-08-28 2014-08-28 遺伝子発現情報解析装置、遺伝子発現情報解析方法、及びプログラム Active JP6356015B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014173382A JP6356015B2 (ja) 2014-08-28 2014-08-28 遺伝子発現情報解析装置、遺伝子発現情報解析方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014173382A JP6356015B2 (ja) 2014-08-28 2014-08-28 遺伝子発現情報解析装置、遺伝子発現情報解析方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2016048485A JP2016048485A (ja) 2016-04-07
JP6356015B2 true JP6356015B2 (ja) 2018-07-11

Family

ID=55649344

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014173382A Active JP6356015B2 (ja) 2014-08-28 2014-08-28 遺伝子発現情報解析装置、遺伝子発現情報解析方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6356015B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101701168B1 (ko) * 2016-05-11 2017-02-01 가천대학교 산학협력단 유전자 패스웨이 활성지수의 세부적 정량화를 위한 유전자 프로파일 방법
JP6884389B2 (ja) * 2017-11-07 2021-06-09 国立研究開発法人産業技術総合研究所 解析装置、解析方法およびプログラム
CN110826635B (zh) * 2019-11-12 2023-04-18 曲阜师范大学 基于整合非负矩阵分解的样本聚类和特征识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030093A (ja) * 2002-06-25 2004-01-29 Hitachi Ltd 遺伝子発現データ解析方法
US20090055147A1 (en) * 2004-06-25 2009-02-26 National Inst. Of Adv. Industrial Science And Tech Cell network analysis system

Also Published As

Publication number Publication date
JP2016048485A (ja) 2016-04-07

Similar Documents

Publication Publication Date Title
US20180225416A1 (en) Systems and methods for visualizing a pattern in a dataset
US20190332963A1 (en) Systems and methods for visualizing a pattern in a dataset
CN111292802B (zh) 用于检测突变的方法、电子设备和计算机存储介质
US20150066378A1 (en) Identifying Possible Disease-Causing Genetic Variants by Machine Learning Classification
JP6828807B2 (ja) データ解析装置、データ解析方法およびデータ解析プログラム
JP2018155522A (ja) データ解析装置
JP2016200435A (ja) マススペクトル解析システム,方法およびプログラム
CN110322926A (zh) miRNA海绵模块的识别方法和装置
JP6356015B2 (ja) 遺伝子発現情報解析装置、遺伝子発現情報解析方法、及びプログラム
CN116564409A (zh) 基于机器学习的转移性乳腺癌转录组测序数据识别方法
CN111180013A (zh) 检测血液病融合基因的装置
Zeng et al. A parameter-free deep embedded clustering method for single-cell RNA-seq data
KR20200073822A (ko) 악성코드 분류 방법 및 그 장치
CN111863135A (zh) 一种假阳性结构变异过滤方法、存储介质及计算设备
Pereira et al. Assessing active learning strategies to improve the quality control of the soybean seed vigor
KR102474042B1 (ko) 데이터 마이닝을 이용한 질병 연관성 분석 방법
US20180239866A1 (en) Prediction of genetic trait expression using data analytics
Alexander et al. Capturing discrete latent structures: choose LDs over PCs
KR102072894B1 (ko) 인트론과 엑손 구분에 기반한 이상 서열 식별 방법
Fu et al. Single cell and spatial alternative splicing analysis with long read sequencing
JP2006092478A (ja) 遺伝子発現プロファイル検索装置、遺伝子発現プロファイル検索方法およびプログラム
Papetti et al. Barcode demultiplexing of nanopore sequencing raw signals by unsupervised machine learning
Cudic et al. Prediction of sorghum bicolor genotype from in-situ images using autoencoder-identified SNPs
WO2020135500A1 (zh) 一种构建生物信息分析参照数据集的方法及系统
KR20170000707A (ko) 유전자 발현 데이터를 이용하여 표현형 특이적인 유전자 네트워크를 식별하는 방법 및 장치

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20170107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170518

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180529

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180613

R150 Certificate of patent or registration of utility model

Ref document number: 6356015

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250