JP6270221B2 - バイオマーカー探索方法、バイオマーカー探索装置、及びプログラム - Google Patents

バイオマーカー探索方法、バイオマーカー探索装置、及びプログラム Download PDF

Info

Publication number
JP6270221B2
JP6270221B2 JP2015026059A JP2015026059A JP6270221B2 JP 6270221 B2 JP6270221 B2 JP 6270221B2 JP 2015026059 A JP2015026059 A JP 2015026059A JP 2015026059 A JP2015026059 A JP 2015026059A JP 6270221 B2 JP6270221 B2 JP 6270221B2
Authority
JP
Japan
Prior art keywords
information
treatment
biomarker
effect
omics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015026059A
Other languages
English (en)
Other versions
JP2016148604A (ja
Inventor
勝久 堀本
勝久 堀本
福井 一彦
一彦 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2015026059A priority Critical patent/JP6270221B2/ja
Priority to PCT/JP2016/053846 priority patent/WO2016129601A1/ja
Priority to US15/550,761 priority patent/US11238959B2/en
Publication of JP2016148604A publication Critical patent/JP2016148604A/ja
Application granted granted Critical
Publication of JP6270221B2 publication Critical patent/JP6270221B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

本発明は、個別化診療や創薬の分野で用いられるバイオマーカーを探索する方法及び装置に関する。
従来から、個別化診療や創薬の分野において、特異的な遺伝子発現による疾患の発症や遺伝的バラツキ(遺伝子多型)による薬物応答性等を鋭敏に反映するバイオマーカーが知られている。
疾患の状態は個々の患者で様々であり、同じ医薬品が効く患者と効かない患者がいる。従来は、実際に医薬品を投与してみてその効果を観察してみる方法がとられていた。個別化診療では、一般的な診療情報に加えて、患者の遺伝的背景・生理的状態・疾患の状態をバイオマーカーによって把握することにより、個々の患者に適切な治療を行うことができる。
また、創薬の分野においては、新たに承認される医薬品の数は年々減少しているが、その最大の原因は臨床試験の成功確率の低さにある。臨床試験においては、ランダム化された患者集団に対して新薬が投与され、その効果や副作用の試験が行われるが、上述したとおり、個々の患者で遺伝的背景・生理的状態・疾患の状態等が異なるため、一部の患者において、効果が見られなかったり、副作用が生じることがあった。バイオマーカーを用いて、新薬の効果がある患者や新薬による副作用のない患者を層別化することができれば、臨床試験の成功確率を高めることができる。
「バイオマーカー関連研究分野の特許出願動向からみた創薬プロセスの効率化に向けた日本の課題」鳥山裕司著、医薬産業政策研究所リサーチペーパー・シリーズNo.46(2009年10月)
上記に説明したとおり、個別化診療及び創薬等の分野においてバイオマーカーは重要であるが、バイオマーカーの開発は容易ではない。
そこで、本発明は、こうした背景に鑑み、バイオマーカーを探索することができるバイオマーカー探索方法及び装置を提供する。
本発明のバイオマーカー探索方法は、疾患に対して所定の治療が効果を有するか否かの判定に用いるバイオマーカーを探索する方法であって、記憶手段から複数の患者の治療前のオミックス情報とコントロールのオミックス情報を読み出し、読み出した患者のオミックス情報とコントロールのオミックス情報とに基づいて、複数の分子情報からなるオミックス情報の中から疾患特有のシグネチャ分子情報を検出するステップと、前記シグネチャ分子情報の中からバイオマーカーを求めるステップであって、前記シグネチャ分子情報の中から少なくとも1つの処理対象の分子情報を選択する処理と、記憶手段から前記複数の患者の治療前の臨床情報と前記複数の患者における前記治療の効果の情報とを読み出し、前記治療の効果を目的変数とし、前記治療前の臨床情報、及び前記処理対象の分子情報の変動データを説明変数として、回帰分析を行う処理と、前記回帰分析の決定係数が所定の閾値以上の場合に、前記治療の効果、治療前における前記臨床情報、前記処理対象の分子情報をノードとし、各ノード間の偏相関に基づいてネットワーク構造を生成する処理と、前記ネットワーク構造において前記処理対象の分子情報と前記治療の効果との間に所定の閾値以上の因果関係があるか否かを判定し、所定の閾値以上の因果関係がある場合に前記処理対象の分子情報をバイオマーカーとして決定する処理と、を繰り返し行うステップとを備える。なお、治療とは、薬剤の投与による治療、補助人工心臓(ventricular assist system :VAS)による治療、手術やレーザーによる治療、ステント等による治療など、様々な治療を含む。また、治療の効果とは、治療によって患者が回復した度合い又は回復する度合いであり、薬剤の投与による薬効を含む。
オミックス情報は、遺伝子のメチル化、mRNAの発現、タンパク質の発現、タンパク質の立体構造、一塩基多型(SNP)、細胞内の全代謝物質等の網羅的分子情報であり、その情報量は膨大である。本発明によれば、最初に疾患のシグネチャ分子情報を求め、この中からバイオマーカーを探索するので、効率的にバイオマーカーを探索することができる。また、オミックス情報は、ゲノムデータとは異なり変動が大きくノイズが発生することが多いが、ネットワーク構造において、治療の効果と分子情報との因果推論を行うことにより、ノイズの影響を回避して、適切なバイオマーカーを求めることができる。
本発明のバイオマーカー探索方法は、記憶部から複数の患者の治療前後の臨床情報を読み出し、治療の前後の前記臨床情報に基づいて前記治療の効果を求めるステップを備えてもよい。
この構成により、予め治療の効果を記憶していなくても、バイオマーカーの探索を行うことができるようになると共に、治療の効果を定量的に分析することができる。なお、治療の効果を求めるために、全ての臨床情報を用いる必要はなく、医師等により予め定められた臨床情報のみを用いることとしてもよい。
本発明のバイオマーカー探索方法は、前記オミックス情報として、遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報を用いてもよい。この構成により、多角的なオミックス情報に基づいて、適切にバイオマーカーを探索することができる。
本発明のバイオマーカー探索方法において、バイオマーカーを求めるステップは、前記治療の効果との因果関係の強い方から所定個数の分子情報をバイオマーカーとして決定してもよい。これにより、ユーザは、所定個数のオミックス情報の中から、診療や創薬等に用いるバイオマーカーを選ぶことができる。
本発明のバイオマーカー探索装置は、疾患に対して所定の治療が効果を有するか否かの判定に用いるバイオマーカーを探索する装置であって、複数の患者の治療前の臨床情報を記憶する手段と、前記複数の患者の治療前のオミックス情報を記憶する手段と、コントロールのオミックス情報を記憶する手段と、前記複数の患者における前記治療の効果を示す情報を記憶する手段と、患者のオミックス情報とコントロールのオミックス情報とに基づいて、複数の分子情報からなるオミックス情報の中から疾患特有のシグネチャ分子情報を検出する手段と、前記治療の効果を目的変数とし、前記治療前の臨床情報と、前記シグネチャ分子情報の中から処理対象として選択された少なくとも1つの分子情報の変動データとを説明変数として、回帰分析を行う回帰分析部と、前記回帰分析部による回帰分析の決定係数が所定の閾値以上の場合に、前記治療の効果、治療前における前記臨床情報、選択された処理対象の分子情報をノードとし、各ノード間の偏相関に基づいてネットワーク構造を生成するネットワーク生成部と、前記ネットワーク構造において前記処理対象の分子情報と前記治療の効果との間に所定の閾値以上の因果関係があるか否かを判定し、所定の閾値以上の因果関係がある場合に前記処理対象の分子情報をバイオマーカーとして決定するバイオマーカー決定部とを備える。
本発明のバイオマーカー探索装置は、複数の患者の治療後の臨床情報を記憶する手段と、治療の前後の前記臨床情報に基づいて前記治療の効果を求める手段とを備え、求められた前記治療の効果の情報を記憶してもよい。
本発明のバイオマーカー探索装置は、前記オミックス情報として、遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報を用いてもよい。
本発明のプログラムは、上記した本発明の方法をコンピュータに実行させるプログラムである。
本発明は、オミックス情報の中から疾患特有のシグネチャ分子情報を求めた上で、シグネチャ分子情報の中からバイオマーカーを探索することにより効率的な探索ができる。また、ネットワーク構造上の因果推論を行うことにより、ノイズの影響を回避して適切なバイオマーカーを求めることができる効果を有する。
実施の形態のバイオマーカー探索装置の構成を示す図である。 臨床情報データベースに記憶されたデータの例を示す図である。 臨床情報データベースに記憶されたデータの例を示す図である。 オミックス情報データベースに記憶されたデータの例を示す図である。 回帰分析に用いる変数を説明するための図である。 (a)ネットワーク構造の例を示す図である。(b)ネットワーク構造の別の例を示す図である。 実施の形態のバイオマーカー探索装置の動作を示す図である。 実施の形態のバイオマーカー探索装置の処理によって分子情報が絞り込まれる様子を示す図である。
以下、本発明の実施の形態に係るバイオマーカー探索装置及びバイオマーカー探索方法について、図面を参照しながら説明する。本実施の形態においては、拡張型心筋症の例を挙げる。拡張型心筋症治療として、人工補助心臓(VAS)を装着する方法があるが、その回復率は患者によって極端に異なる。VASの装着による回復率を予測することができれば、VASを装着すべきかどうかの判断が容易になる。本実施の形態では、VASを装着したときの回復率(治療の効果)を予測するためのバイオマーカーを探索する例を挙げる。なお、本発明は、以下の実施の形態で挙げる例に限定されるものではなく、その他の様々な治療に対するバイオマーカーを探索するために適用することができる。
図1は、実施の形態のバイオマーカー探索装置1の構成を示す図である。バイオマーカー探索装置1は、情報を入力する入力部10と、バイオマーカーを探索する処理を行う制御部11と、患者の臨床情報を記憶した臨床情報データベース(以下、「臨床情報DB」という。)12と、患者及びコントロールのオミックス情報を記憶したオミックス情報データベース(以下、「オミックス情報DB」という。)13と、探索されたバイオマーカーのデータを出力する出力部14とを有している。
バイオマーカー探索装置1は、CPU、RAM、ROM、ディスプレイ、キーボード、マウス、通信インターフェース等を備えるコンピュータによって構成される。バイオマーカー探索のためのプログラムをROMに記憶しておき、CPUがROMからプログラムを読み出して実行することにより、コンピュータがバイオマーカーの探索を行う。
図2は、臨床情報DB12に記憶された治療前の患者の臨床情報の例を示す図、図3は、同じく臨床情報DB12に記憶された治療後の患者の臨床情報の例を示す図である。図2及び図3に示すように、臨床情報としては、左室拡張末期径(Left Ventricular Dimension at Diastole:LVDd)、左室駆出率(left ventricular ejection fraction:LVEF)、左冠動脈前下行枝(Left anterior descending coronary artery:LAD)などの拡張型心筋症の程度を示す値が記憶されている。
図4は、オミックス情報DB13に記憶されたデータの例を示す図である。オミックス情報DB13には、各患者について、遺伝子メチル化レベル、mRNAの発現レベル、タンパク質の発現レベルの3層の分子情報が記憶されている。オミックス情報は、こうした網羅的な分子情報の集まりである。本実施の形態では、3層の発現情報を用いることにより、治療の効果との相関の高いバイオマーカーを見つけることができる可能性が高くなる。なお、図4には、図示していないが、オミックス情報DB13は、患者のオミックス情報に加え、所定の疾患を有しないコントロール(健常者)のオミックス情報を記憶している。
図1に戻って、制御部11の構成について説明する。制御部11は、治療効果算出部15と、シグネチャ分子情報検出部16と、回帰分析部17と、ネットワーク生成部18と、バイオマーカー決定部19とを有している。
治療効果算出部15は、治療の前後における患者の臨床情報を用いて、治療の効果を定量的に算出する機能を有する。治療効果算出部15は、所定の臨床情報の改善の度合いによって治療の効果を算出してもよいし、複数の臨床情報の改善の度合いによって治療の効果を算出してもよい。拡張型心筋症を例とする本実施の形態においては、LVDdの改善の度合いによって治療の度合いを算出する。すなわち、治療効果算出部15は、臨床情報DB12から治療前後のLVDdのデータを読み出し、治療の効果=LVDd(治療後)−LVDd(治療前)によって治療の効果を算出する。
シグネチャ分子情報検出部16は、オミックス情報DB13から患者のオミックス情報とコントロールのオミックス情報とを読み出し、患者のオミックス情報とコントロールのオミックス情報に基づいて、所定の疾患の患者においてコントロールからの変動の大きいシグネチャ分子情報を算出する。なお、上述したとおり、オミックス情報DB13には、遺伝子メチル化レベル、mRNAの発現レベル、タンパク質の発現レベルの3層の分子情報が記憶されているが、各層における遺伝子の情報を別個の情報として扱う。例えば、遺伝子Aについての遺伝子メチル化情報、遺伝子AについてのmRNAの発現レベル、遺伝子Aについてのタンパク質発現レベルのデータが記憶されている場合に、遺伝子AについてのmRNAの発現レベルが疾患特有の変動データであって、シグネチャ分子情報として検出されたとしても、遺伝子Aの遺伝子メチル化レベル、タンパク質の発現レベルを自動的にシグネチャ分子情報として検出することはしない。
シグネチャ分子情報の検出に際しては、本出願人が先に出願した特願2014−173382に記載された方法を用いてもよい。この方法では、オミックス情報の中から既知のパスウェイに含まれる遺伝子を特定し、特定した遺伝子のオミックス情報を用いてクラスタリングを行う。このクラスタリングによって、患者とコントロールを所定の精度でクラスタリングできた場合には、そのパスウェイを疾患特有のパスウェイとみなし、そのパスウェイの中からシグネチャ分子情報を求める。この方法を用いると、パスウェイに含まれる少数の遺伝子の分子情報だけを比較してパスウェイ適合性を判定するので、ノイズの影響を抑制しつつ疾患特異的なパスウェイを抽出でき、ひいては、シグネチャ分子情報を抽出できる。
図5は、回帰分析部17にて用いる変数を説明する模式図である。回帰分析部17は、治療効果算出部15にて算出された治療の効果を目的変数として用いる。回帰分析部17が説明変数として用いるのは、治療を行う前の複数の臨床情報と、処理対象の分子情報の変動データである。変動データとは、患者の分子情報がコントロールの分子情報と比べてどのくらい変動しているかのデータである。なお、治療前の情報を説明変数としているのは、本実施の形態により求めるバイオマーカーは、治療前の情報を元にVAS装着による治療効果を予測するためのものだからである。
分子情報としては、シグネチャ分子情報の中から選択した1個の分子情報、または複数の分子情報の組合せを用いる。ここで選択された分子情報は、後述するとおり、治療の効果との相関があるかどうかの検証の処理の対象となる分子情報であるので、本願では「処理対象の分子情報」という。
処理対象の分子情報の個数としては、1個、または2〜3個が望ましいが、4〜5個用いることとしてもよい。多くの分子情報を用いれば、その分だけ予測の精度は高まるが、複数のバイオマーカーを見なくてはならないことになるので、バイオマーカーとしての価値は低くなる。バイオマーカーとしていくつの分子情報を用いるかは、例えば、入力部10からユーザが入力することとしてもよい。
回帰分析部17は、決定係数が所定の閾値以上になった場合には、処理対象の分子情報が治療の効果に対して何らかの影響があると認められたものと判断し、ネットワーク生成部18による処理に進む。ここで、決定係数は、回帰係数で変数を追加してフィットネスを評価して、自由度を修正した自由度調整済決定係数もしくは修正決定係数を用いる。もし、回帰分析の決定係数が所定の閾値未満の場合には、シグネチャ分子情報の中から、別の処理対象の分子情報を選択し、回帰分析を行う。このように、順次、別の処理対象の分子情報を選択して回帰分析を行うことにより、シグネチャ分子情報の中から、治療の効果に関係のある分子情報を求めることができる。
次に、ネットワーク生成部18について説明する。ネットワーク生成部18は、回帰分析によるチェックに合格した分子情報と、複数の臨床情報と、治療の効果とをノードとするネットワーク構造を生成する機能を有する。ネットワーク生成部18は、各ノード(分子情報、複数の臨床情報、治療の効果)の間の偏相関係数を求め、偏相関係数に基づいてネットワーク構造を生成する。ネットワーク生成部18は、偏相関係数が所定の閾値以上のノード間には相関があるとしてノードどうしを連結し、偏相関係数が所定の閾値未満のノード間には相関がないとしてノードどうしを連結しない。
図6(a)及び図6(b)は、ネットワーク生成部18によって生成されたネットワーク構造の例を示す図である。図6(a)及び図6(b)では、分子情報、臨床情報、および治療効果をノードとし、各ノード間の偏相関係数に基づいて、偏相関係数が所定の閾値以上のノードどうしを連結してネットワーク構造を記述している。なお、ネットワーク生成に偏相関係数を用いているので、他のノードの影響を除去して2変数の相関を求めることができる。
図6(a)に示す例では、分子情報aのノードと治療効果のノードとがリンクされており、両者の間に直接的な相関があることが分かる。図6(b)に示す例では、オミックス情報bのノードが臨床情報4を介して治療効果のノードにリンクされており、オミックス情報bと治療情報との間に間接的な相関があることが分かる。なお、図6(a)及び図6(b)において、臨床情報3のノードにはリンクが張られていないが、臨床情報3は他の臨床情報、治療効果、分子情報と所定の相関がみられないことを示している。
バイオマーカー決定部19は、ネットワーク生成部18にて生成されたネットワーク構造に基づいて、バイオマーカーを決定する。本実施の形態のバイオマーカー探索装置1は、治療効果と直接のリンク、すなわち因果関係を有する分子情報をバイオマーカーとして決定する。本実施の形態のバイオマーカー探索装置1は、図6(a)に示す分子情報aをバイオマーカーとして決定する。もし、治療効果と間接的にリンクで接続されている、すなわち間接的な因果関係を有する分子情報をもバイオマーカーとすることとしていれば、バイオマーカー探索装置1は、図6(a)に示す分子情報aに加え、図6(b)に示す分子情報bもバイオマーカーとして決定する。なお、間接的なリンクの場合に、間に介在するノードの数によってバイオマーカーとするかどうかを決めてもよい。
出力部14は、バイオマーカー決定部19にて決定されたバイオマーカーを示すデータを出力する機能を有する。
図7は、本実施の形態のバイオマーカー探索装置1の動作を示すフローチャートである。図8は、本実施の形態のバイオマーカー探索装置1の処理によって分子情報が絞り込まれる様子を示す図である。バイオマーカー探索装置1は、まず、所定の治療を行ったときの治療の効果を算出する(S10)。本実施の形態では、複数の臨床情報のうち、治療の前後におけるLVDdの改善の度合いを治療の効果として算出する。
次に、バイオマーカー探索装置1は、オミックス情報DB13から患者のオミックス情報とコントロールのオミックス情報を読み出し、患者のオミックス情報とコントロールのオミックス情報の変動データに基づいて、疾患に特有のシグネチャ分子情報を検出する(S11)。図8に示すように、オミックス情報には、遺伝子メチル化レベル、mRNAの発現レベル、タンパク質の発現レベルに関する多数の分子情報が含まれている。図8において網掛けをしているのが、コントロールからの変動が大きいシグネチャ分子情報であり、このステップにおいて、オミックス情報がシグネチャ分子情報に絞り込まれることが分かる。
図7に戻って説明する。バイオマーカー探索装置1は、シグネチャ分子情報の中から、処理対象となる1つの分子情報を選択し(S12)、当該分子情報がバイオマーカーとなるかどうかを判定する。具体的には、バイオマーカー探索装置1は、まず、処理対象の分子情報を、複数の臨床情報とともに説明変数とし、目的変数である治療効果を説明できるかどうか回帰分析を行う(S13)。回帰分析の結果、決定係数が所定の閾値より大きいか否かを判定し(S14)、決定係数が所定の閾値より大きかった場合には(S14でYES)、ネットワーク構造の生成に移行する(S15)。もし、決定係数が所定の閾値以下の場合(S14でNO)、処理対象の分子情報はバイオマーカーの候補から除き、次に、バイオマーカーとなり得るかどうかを確認すべき分子情報の選択を行う(S12)。図8に示すように、シグネチャ分子情報として抽出された複数の分子情報の中から処理対象の分子情報を取り出し、取り出した分子情報を説明変数として回帰分析を行う。その結果、決定係数が所定の閾値以上であればネットワーク構造を用いた因果推論に移行する。
再び図7に戻って説明する。バイオマーカー探索装置1は、回帰分析によって求めた決定係数が所定の閾値より大きかった分子情報と、複数の臨床情報と、治療効果とをノードとして、各ノード間の偏相関に基づいて、ネットワーク構造を生成する(S15)。そして、バイオマーカー探索装置1は、生成されたネットワーク構造において、分子情報と治療効果との間に直接の因果関係があるか否かを判定する(S16)。その結果、直接の因果関係があると判定された場合には(S16でYES)、バイオマーカー探索装置1は、当該分子情報をバイオマーカーとして決定する(S17)。分子情報と治療効果との間に因果関係がないと判定された場合には(S16でNO)、処理対象の分子情報はバイオマーカーの候補から除き、次に、バイオマーカーとなり得るかどうかを確認すべき分子情報の選択を行う(S12)。図8に示すように、回帰分析の結果、決定係数が所定の閾値以上となった分子情報についてネットワーク構造を用いた因果推論を行い、治療効果との間に因果関係がある場合に、バイオマーカーとして決定する。
続いて、バイオマーカー探索装置1は、探索処理を終了するか否かを判定し(S18)、処理を終了すると判定された場合には(S18でYES)、それまでにバイオマーカーとして決定された分子情報を出力する。探索処理を終了しないと判定された場合は(S18でNO)、選択された分子情報はバイオマーカーの候補から除き、次に、バイオマーカーとなり得るかどうかを確認すべき分子情報の選択を行う(S12)。ここで、探索処理の終了条件としては、シグネチャ分子情報として検出された分子情報をすべて確認した場合である。
以上、本実施の形態のバイオマーカー探索装置1の構成及び動作について説明した。本実施の形態のバイオマーカー探索装置1は、オミックス情報の中から疾患に特有のシグネチャ分子情報を求め、シグネチャ分子情報の中からバイオマーカーを探索する構成を採用している。これにより、膨大な量のオミックス情報の中から、効率的にバイオマーカーを探索することができる。
また、本実施の形態のバイオマーカー探索装置1は、偏相関係数を用いて生成したネットワーク構造において治療の効果と処理対象の分子情報との因果関係があるかどうかを求め、因果関係がある場合にバイオマーカーとして選択する構成を採用している。オミックス情報は、ゲノムデータと異なり変動が大きくノイズが発生することが多いが、因果推論を行うことで、ノイズの影響を抑制することができる。
本実施の形態のバイオマーカー探索装置1にて発見されたバイオマーカーは、医薬品の効果や副作用を投薬前に予測して、医薬品が有効な患者とそうでない患者を層別化する「患者層別化マーカー」として用いることができる。また、この層別化を行う臨床検査を「コンパニオン診断」というが、本実施の形態のバイオマーカー探索装置1にて発見されたバイオマーカーを測定するための「コンパニオン診断薬」の開発にも役立てることができる。
また、本実施の形態のバイオマーカー探索装置1は、まず回帰分析を行って、回帰分析において所定の閾値以上の決定係数が得られたときにネットワーク構造を生成する。回帰分析に比べて計算負荷の大きいネットワーク構造の生成を後の工程にすることにより、計算処理の効率化を図っている。
以上、本発明のバイオマーカー探索装置及びバイオマーカー探索方法について、実施の形態を挙げて詳細に説明したが、本発明は上記した実施の形態に限定されるものではない。
上記した実施の形態では、バイオマーカー探索装置1が治療効果算出部15を備え、治療の前後の臨床情報に基づいて治療効果を算出する例について説明したが、治療効果は予め医師の判断により入力し、記憶しておいてもよい。これにより、治療効果算出部15を省略することができる。
また、バイオマーカー決定部19は、回帰分析及びネットワーク構造を用いた因果推論において、所定の閾値を満たす分子情報が複数見つかった場合に、治療効果との因果関係が大きい所定個数の分子情報をバイオマーカーとして決定することとしてもよい。複数のバイオマーカーを提示することにより、ユーザは、その中から扱いやすいバイオマーカーを選ぶことができる。また、バイオマーカーを出力する際に、治療効果との因果関係の強さと共に出力することとしてもよい。これにより、探索されたバイオマーカーを提示されたユーザは、どのバイオマーカーを用いればよいかを容易に判断することができる。
本発明は、ノイズの影響を回避して適切なバイオマーカーを求めることができる効果を有し、バイオマーカーの開発に有用である。
1 バイオマーカー探索装置
10 入力部
11 制御部
12 臨床情報DB
13 オミックス情報DB
14 出力部
15 治療効果算出部
16 シグネチャ分子情報算出部
17 回帰分析部
18 ネットワーク生成部
19 バイオマーカー決定部

Claims (11)

  1. 疾患に対して所定の治療が効果を有するか否かの判定に用いるバイオマーカーを探索する方法であって、
    記憶手段から複数の患者の治療前のオミックス情報とコントロールのオミックス情報を読み出し、読み出した患者のオミックス情報とコントロールのオミックス情報とに基づいて、複数の分子情報からなるオミックス情報の中から疾患特有のシグネチャ分子情報を検出するステップと、
    前記シグネチャ分子情報の中からバイオマーカーを求めるステップであって、
    前記シグネチャ分子情報の中から少なくとも1つの処理対象の分子情報を選択する処理と、
    記憶手段から前記複数の患者の治療前の臨床情報と複数の患者における前記治療の効果の情報とを読み出し、前記治療の効果を目的変数とし、前記治療前の臨床情報、及び前記処理対象の分子情報の変動データを説明変数として、回帰分析を行う処理と、
    前記回帰分析の決定係数が所定の閾値以上の場合に、前記治療の効果、治療前における前記臨床情報、前記処理対象の分子情報をノードとし、各ノード間の偏相関に基づいてネットワーク構造を生成する処理と、
    前記ネットワーク構造において前記処理対象の分子情報と前記治療の効果との間に所定の閾値以上の因果関係があるか否かを判定し、所定の閾値以上の因果関係がある場合に前記処理対象の分子情報をバイオマーカーとして決定する処理と、
    を繰り返し行うステップと、
    を備えるバイオマーカー探索方法。
  2. 記憶部から複数の患者の治療前後の臨床情報を読み出し、治療の前後の前記臨床情報に基づいて前記治療の効果を求めるステップを備える請求項1に記載のバイオマーカー探索方法。
  3. 前記オミックス情報として、遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報を用いる請求項1または2に記載のバイオマーカー探索方法。
  4. バイオマーカーを求めるステップは、前記治療の効果との因果関係の強い方から所定個数の分子情報をバイオマーカーとして決定する請求項1乃至3のいずれかに記載のバイオマーカー探索方法。
  5. 疾患に対して所定の治療が効果を有するか否かの判定に用いるバイオマーカーを探索する装置であって、
    複数の患者の治療前の臨床情報を記憶する手段と、
    前記複数の患者の治療前のオミックス情報を記憶する手段と、
    コントロールのオミックス情報を記憶する手段と、
    前記複数の患者における前記治療の効果を示す情報を記憶する手段と、
    患者のオミックス情報とコントロールのオミックス情報とに基づいて、複数の分子情報からなるオミックス情報の中から疾患特有のシグネチャ分子情報を検出する手段と、
    前記治療の効果を目的変数とし、前記治療前の臨床情報と、前記シグネチャ分子情報の中から処理対象として選択された少なくとも1つの分子情報の変動データとを説明変数として、回帰分析を行う回帰分析部と、
    前記回帰分析部による回帰分析の決定係数が所定の閾値以上の場合に、前記治療の効果、治療前における前記臨床情報、選択された処理対象の分子情報をノードとし、各ノード間の偏相関に基づいてネットワーク構造を生成するネットワーク生成部と、
    前記ネットワーク構造において前記処理対象の分子情報と前記治療の効果との間に所定の閾値以上の因果関係があるか否かを判定し、所定の閾値以上の因果関係がある場合に前記処理対象の分子情報をバイオマーカーとして決定するバイオマーカー決定部と、
    を備えるバイオマーカー探索装置。
  6. 複数の患者の治療後の臨床情報を記憶する手段と、
    治療の前後の前記臨床情報に基づいて前記治療の効果を求める手段と、
    を備え、求められた前記治療の効果の情報を記憶する請求項5に記載のバイオマーカー探索装置。
  7. 前記オミックス情報として、遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報を用いる請求項5または6に記載のバイオマーカー探索装置。
  8. 疾患に対して所定の治療が効果を有するか否かの判定に用いるバイオマーカーを探索するためのプログラムであって、コンピュータに、
    記憶手段から複数の患者の治療前のオミックス情報とコントロールのオミックス情報を読み出し、読み出した患者のオミックス情報とコントロールのオミックス情報とに基づいて、複数の分子情報からなるオミックス情報の中から疾患特有のシグネチャ分子情報を検出するステップと、
    前記シグネチャ分子情報のオミックス情報の中からバイオマーカーを求めるステップであって、
    前記シグネチャ分子情報の中から少なくとも1つの処理対象の分子情報を選択する処理と、
    記憶手段から前記複数の患者の治療前の臨床情報と前記複数の患者における前記治療の効果の情報とを読み出し、前記治療の効果を目的変数とし、前記治療前の臨床情報、及び前記処理対象の分子情報の変動データを説明変数として、回帰分析を行う処理と、
    前記回帰分析の決定係数が所定の閾値以上の場合に、前記治療の効果、治療前における前記臨床情報、前記処理対象の分子情報をノードとし、各ノード間の偏相関に基づいてネットワーク構造を生成する処理と、
    前記ネットワーク構造において前記処理対象の分子情報と前記治療の効果との間に所定の閾値以上の因果関係があるか否かを判定し、所定の閾値以上の因果関係がある場合に前記処理対象の分子情報をバイオマーカーとして決定する処理と、
    を繰り返し行うステップと、
    を実行させるプログラム。
  9. 記憶部から複数の患者の治療前後の臨床情報を読み出し、治療の前後の前記臨床情報に基づいて前記治療の効果を求めるステップを、コンピュータに実行させる請求項8に記載のプログラム。
  10. 前記オミックス情報として、遺伝子のメチル化レベル情報、mRNAの発現情報、及びタンパク質の発現情報を用いる請求項8または9に記載のプログラム。
  11. バイオマーカーを求めるステップにおいて、前記治療の効果との因果関係の強い方から所定個数の分子情報をバイオマーカーとして決定する請求項8乃至10のいずれかに記載のプログラム。
JP2015026059A 2015-02-13 2015-02-13 バイオマーカー探索方法、バイオマーカー探索装置、及びプログラム Active JP6270221B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2015026059A JP6270221B2 (ja) 2015-02-13 2015-02-13 バイオマーカー探索方法、バイオマーカー探索装置、及びプログラム
PCT/JP2016/053846 WO2016129601A1 (ja) 2015-02-13 2016-02-09 バイオマーカー探索方法、バイオマーカー探索装置、及びプログラム
US15/550,761 US11238959B2 (en) 2015-02-13 2016-02-09 Biomarker search method, biomarker search device, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015026059A JP6270221B2 (ja) 2015-02-13 2015-02-13 バイオマーカー探索方法、バイオマーカー探索装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2016148604A JP2016148604A (ja) 2016-08-18
JP6270221B2 true JP6270221B2 (ja) 2018-01-31

Family

ID=56614667

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015026059A Active JP6270221B2 (ja) 2015-02-13 2015-02-13 バイオマーカー探索方法、バイオマーカー探索装置、及びプログラム

Country Status (3)

Country Link
US (1) US11238959B2 (ja)
JP (1) JP6270221B2 (ja)
WO (1) WO2016129601A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11244761B2 (en) * 2017-11-17 2022-02-08 Accenture Global Solutions Limited Accelerated clinical biomarker prediction (ACBP) platform
CN108460630B (zh) * 2018-02-12 2021-11-02 广州虎牙信息科技有限公司 基于用户数据进行分类分析的方法和装置
JP6960369B2 (ja) * 2018-04-13 2021-11-05 株式会社日立製作所 分析システム及び分析方法
JP2020025471A (ja) * 2018-08-09 2020-02-20 国立研究開発法人産業技術総合研究所 毒性学習装置、毒性学習方法、学習済みモデル、毒性予測装置およびプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007048074A1 (en) 2005-10-21 2007-04-26 Genenews Inc. Method and apparatus for correlating levels of biomarker products with disease
KR101325736B1 (ko) * 2010-10-27 2013-11-08 삼성에스디에스 주식회사 바이오 마커 추출 장치 및 방법
EP2791843A4 (en) * 2011-12-16 2015-07-01 Critical Outcome Technologies Inc PROGRAMMABLE CELL MODEL FOR DETERMINING TREATMENTS AGAINST CANCER
EA038600B1 (ru) * 2012-04-02 2021-09-21 Берг Ллк Основанные на клетках перекрестные анализы и их применение
JP5963198B2 (ja) * 2012-09-26 2016-08-03 国立研究開発法人科学技術振興機構 動的ネットワークバイオマーカーの検出装置、検出方法及び検出プログラム

Also Published As

Publication number Publication date
US20180018424A1 (en) 2018-01-18
US11238959B2 (en) 2022-02-01
JP2016148604A (ja) 2016-08-18
WO2016129601A1 (ja) 2016-08-18

Similar Documents

Publication Publication Date Title
Marimuthu et al. A review on heart disease prediction using machine learning and data analytics approach
JP6270221B2 (ja) バイオマーカー探索方法、バイオマーカー探索装置、及びプログラム
JP6382459B1 (ja) 細胞系ゲノミクスからの薬物応答の患者特異的予測のためのシステムおよび方法
JP2013545188A (ja) 患者の病気重篤性、致死性および滞在長さの連続的な予測の方法
WO2021205828A1 (ja) 予後予測装置、及びプログラム
CN111640512A (zh) 肾脏替代疗法启动策略评估方法、装置及电子设备
Vivekanandan et al. A hybrid risk assessment model for cardiovascular disease using cox regression analysis and a 2-means clustering algorithm
El Bakrawy Grey wolf optimization and naive bayes classifier incorporation for heart disease diagnosis
Sahoo et al. Machine learning-based heart disease prediction: A study for home personalized care
EP3718116B1 (en) Apparatus for patient data availability analysis
Hu et al. Identification of pulmonary hypertension animal models using a new evolutionary machine learning framework based on blood routine indicators
Vijayalakshmi et al. Predicting Hepatitis B to be acute or chronic in an infected person using machine learning algorithm
JP5436446B2 (ja) 薬剤の作用・副作用予測システムとそのプログラム
Wosiak et al. On integrating clustering and statistical analysis for supporting cardiovascular disease diagnosis
WO2015173917A1 (ja) 分析システム
JP7475353B2 (ja) 有害事象を発見するための自然言語処理の使用
TW202107478A (zh) 用於預測主要心血管不良事件之計算裝置、可攜帶裝置及電腦實施方法
Jibril et al. Feature Selection and Parameter Optimization of Support Vector Machine (Svm) and Logistic Regression (Lr) Algorithms Using Particle Swarm Optimization (Pso) In Prediction of Diabetes.
Alle et al. COVID-19 risk stratification and mortality prediction in hospitalized Indian patients
JP7501862B2 (ja) 健康改善経路探索装置及び健康改善経路探索方法
Bos et al. Artificial intelligence in cardiovascular genetics
Peterson An efficient dynamic Bayesian network classifier structure learning algorithm: application to sport epidemiology
JP7462556B2 (ja) 患者データ有効性解析のための装置
Zhang et al. Risk factors of heart failure for patients classification with extreme learning machine
JPWO2020112478A5 (ja)

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20170107

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171205

R150 Certificate of patent or registration of utility model

Ref document number: 6270221

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250