WO2016006532A1

WO2016006532A1 - 薬効分析システム及び薬効分析方法

Info

Publication number: WO2016006532A1
Application number: PCT/JP2015/069167
Authority: WO
Inventors: 琢磨柴原; 善浩村垣
Original assignee: 株式会社日立製作所; 学校法人東京女子医科大学
Priority date: 2014-07-07
Filing date: 2015-07-02
Publication date: 2016-01-14
Also published as: JP2016018321A; US20170161469A1; JP6324828B2

Abstract

少ないサンプル数で臨床データの統計分析を可能とする。有害事象の発生に関連する因子情報であって投薬前の検査値を含む患者の因子情報を回帰分析し、投薬後の検査値の推移をモデル化するモデル生成ステップと、前記検査値の推移がモデル化された患者の因子情報から、前記患者の因子情報と同じ因子情報を有する患者の因子情報を仮想的に生成し、生成した前記因子情報を有する患者のうち、投薬による前記検査値の変動が一定以上となる患者について、前記因子情報ごとの頻度分布を生成する分布生成ステップと、を含む。

Description

薬効分析システム及び薬効分析方法

　本発明は、病院等の医療機関で用いられるヘルスケアデータの統計解析を実行し、薬剤の効果や副作用に関するデータを提供するためのシステム及び方法に関する。

　一般に、新薬は有害事象（副作用）の危険性があるため、市販直後は売上の伸びが鈍く、また、特許切れ等による独占期間終了後には、後発医薬品が販売されることで急速に利益が減少する傾向にある。そこで、早期に新薬の効果や有害事象の傾向を分析し、販売直後から薬剤の効果的な適用を支援することが、薬の販売機会を増大させるうえで重要である。

　例えば、特許文献１では患者の因子（年齢や性別など）と有害事象との間の統計的な相関に関する情報を識別及び提供する方法が開示されている。

特開２０１２－５２４９４５号公報

　ところが、特許文献１の従来技術から得られる患者の属性と有害事象に関連があるという相関情報からでは、医師や薬剤師が薬剤の投与計画の立案を行うことが難しい。また、有害事象の関連候補となる因子が多値／連続値の場合、因子の全定義域で相関計算を行う必要があるために、膨大な計算時間を要してしまう。

　本発明は、上記に鑑みてなされたものであって、少ないサンプル数で臨床データの統計分析を可能とする薬効分析システム及び薬効分析方法を提供することを目的とする。

　上述した課題を解決し、目的を達成するために、本発明にかかる薬効分析方法は、有害事象の発生に関連する因子情報であって投薬前の検査値を含む患者の因子情報を回帰分析し、投薬後の検査値の推移をモデル化するモデル生成ステップと、前記検査値の推移がモデル化された患者の因子情報から、前記患者の因子情報と同じ因子情報を有する患者の因子情報を仮想的に生成し、生成した前記因子情報を有する患者のうち、投薬による前記検査値の変動が一定以上となる患者について、前記因子情報ごとの頻度分布を生成する分布生成ステップと、を含むことを特徴とする薬効分析方法として構成される。

　また、本発明は、上記薬効分析方法を実行する薬効分析システムとしても把握される。

本発明によれば、少ないサンプル数で臨床データの統計分析が可能となる。

本発明の実施形態における機械学習による薬効分析のシステムの処理の流れを示した図である。本発明の実施形態における機械学習による薬効分析のシステムの装置的な構成を示した図である。本発明の実施形態における機械学習による薬効分析のシステムの概要を示した図である。本発明の実施形態におけるヘルスケアデータの例を示した図である。本発明の実施形態において、薬剤効果の発生過程のモデル生成について処理の流れを示した図である。本発明の実施形態において得られた予測検査データを可視化した図である。本発明の実施形態において得られた関連因子ごとの分布に関する図である。本発明の実施形態において、高発生群分布の算出について処理の流れを示した図である。本発明の実施形態において、関連因子に対する統計値に関して示した図である。本発明の実施形態における機械学習による薬効分析のシステムの処理において、個々の患者における薬剤の効果予測を行う場合の流れを示した図である。

　以下では、発明を実施するための形態（以降、「実施形態」と称す。）について、適宜、図面を参照しながら説明する。以下に示すように、本システムでは、薬剤の投与による効果（治療効果及び有害事象）に対する患者属性（例えば、年齢や性別、遺伝子情報等）の統計的な頻度分布及び、医学的な統計値を算出し、ユーザに提供する方法及びシステムを用意する。また、個々の患者ごとに薬剤の投与による治療効果と有害事象の強さや、発生時期を予測する手段を提供する。

　実施形態における典型的な装置の構成の例を図２に示す。実施形態ではクライント端末２００と分析サーバ２２０があり、ネットワーク２１０にて接続されている。クライント端末２００は補助記憶装置のＨＤＤ（ｈａｒｄ　ｄｉｓｋ　ｄｒｉｖｅ）２０１と、主記憶装置のメモリ２０２、ＣＰＵ（ｃｅｎｔｒａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）２０３、キーボードやマウスからなる入力装置２０４、モニタ２０５から構成される。分析サーバ２２０は補助記憶装置のＨＤＤ２２１と、主記憶装置のメモリ２２２、ＣＰＵ２２３、キーボードやマウスからなる入力装置２２４、モニタ２２５から構成される。

　（第１実施形態）
　以下、抗がん剤の有害事象（副作用）の発生に関連する因子解析を行う場合を例に本発明の第１実施形態を説明する。図２及び図３を用いて説明すると、分析が行われるヘルスケアデータ４００はデータベース３０１に格納されてＨＤＤ２２１に保存されており、分析処理部３００はＣＰＵ２２３で実行される。クライント端末２００からネットワーク２１０を介して分析サーバ２２０に接続すると、ＨＤＤ２２１に保存されているデータベース３０１からヘルスケアデータ４００が呼び出され、分析処理部３００はＣＰＵ２２３で実行され、分析結果５００をメモリ２２２上に生成する。その後、分析処理部３００は分析結果５００をＨＤＤ２２１に保存した後、ネットワーク２１０を介してクライント端末２００に配信し、クライアント端末２００のＣＰＵ２０３がモニタ２０５に分析結果５００を表示する。

　図１を用いて分析処理部３００で実行される処理の流れについて説明する。Ｓ１０１ではデータベース３０１からヘルスケアデータ４００が読み出される。ここで、データベース３０１に格納されているヘルスケアデータ４００について、図４を用いて説明すると、ヘルスケアデータ４００は患者の因子情報を格納している固有データ４１０と、投与薬の効果（本実施形態では、抗がん剤の有害事象）を判断するための検査データ４２０から構成されている。患者にはユニークなＩＤ（４１１）が割り振らており、固有データ４１０と検査データ４２０を結びつけることができる。

　固有データ４１０には患者の性別４１２、年齢４１３がある。また、固有データ４１０の遺伝子関連情報４１４には、一塩基多型（ＳＮＰ：ｓｉｎｇｌｅ　ｎｕｃｌｅｏｔｉｄｅ　ｐｏｌｙｍｏｒｐｈｉｓｍ）による遺伝子の欠損情報の有無や、染色体の欠損の有無が記載されている。さらに、固有データ４１０には、放射線治療による放射線量４１５、投薬前の検査値である白血球数４１６などから構成されている。固有データ４１０には、病院における電子カルテに記載された情報が含まれているが、一例として、説明の容易さから４１２から４１６の５項目を図４に図示した。なお、図４の４１０と４２０に現れる表記ＮＡ（例えば、４１７）は値が不明であることを意味する。このように、固有データ４１０には、患者の身体的な特徴を示す因子情報が含まれ、以下では、患者の特徴に関連するこれらの因子情報のことを関連因子と呼ぶ。

　検査データ４２０には投薬後の白血球数の検査値が週ごとに格納されている。検査値は白血球に限らず、他の血球（赤血球数、血小板数など）や、生化学検査値ＧＯＴ（グルタミン酸オキサロ酢酸トランスアミナーゼ）、ＧＰＴ（グルタミン酸ピルビン酸トランスアミナーゼ）、腫瘍マーカ等の時系列的なデータから構成されている。多くの抗がん剤には骨髄抑制作用があるため、以下では、白血球数を検査値として用いた場合を例に説明する。

　Ｓ１０２では、固有データ４１０から検査データ４２０の検査値の推移を回帰によりモデル化する。本発明の実施形態におけるモデル化とは固有データ４１０から個々の患者の検査値４２０を予測算出するための回帰式のパラメータ（係数）を求めることを意味する。Ｓ１０２で得られた回帰式のパラメータにより、ＩＤ＝１（４３１）の患者の予測検査値６０１と、ＩＤ＝２（４３２）の患者の予測検査値６０２を図示した例を図６に示す。回帰の手法としては非特許文献１（Ｂｉｓｈｏｐ，　Ｃｈｒｉｓｔｏｐｈｅｒ　Ｍ．，　ａｎｄ　Ｎａｓｓｅｒ　Ｍ．　Ｎａｓｒａｂａｄｉ．　"Ｐａｔｔｅｒｎ　ｒｅｃｏｇｎｉｔｉｏｎ　ａｎｄ　ｍａｃｈｉｎｅ　ｌｅａｒｎｉｎｇ．"　Ｖｏｌ．　１．　Ｎｅｗ　Ｙｏｒｋ：　ｓｐｒｉｎｇｅｒ，　２００６．）に記載されているｌａｓｓｏ回帰（正則化を導入した線形回帰）、ニューラルネット回帰、ｓｕｐｐｏｒｔ　ｖｅｃｔｏｒ回帰などの一般的な回帰を用いた様々な回帰条件で以下の処理を実行することができる。なお、以下では、ｄｅｅｐ　ｌｅａｒｎｉｎｇ（非特許文献２（Ｂｅｎｇｉｏ，　Ｙｏｓｈｕａ．　"Ｌｅａｒｎｉｎｇ　ｄｅｅｐ　ａｒｃｈｉｔｅｃｔｕｒｅｓ　ｆｏｒ　ＡＩ．"　Ｆｏｕｎｄａｔｉｏｎｓ　ａｎｄ　ｔｒｅｎｄｓｉｎ　Ｍａｃｈｉｎｅ　Ｌｅａｒｎｉｎｇ　２．１　（２００９）：　１－１２７．）に基づく回帰（本実施形態では、deep learning回帰と呼称する）を用いて本実施形態を説明する。

　はじめに、データの取り扱い方について説明する。固有データ４１０から２値のデータ４１２を抽出し、０－１表現の値を以下の式に置き換える。

　例えば、データ４１２の場合については、男性＝０、女性＝１とする。また、固有データ４１０から、他の２値を取りうるデータについても、例えばデータ４１４について同様の手順で、０－１表現で置き換える。

　次に、固有データ４１０から多値のデータ４１３を抽出し、１－ｏｆ－Ｋ表現（非特許文献１（Ｂｉｓｈｏｐ，　Ｃｈｒｉｓｔｏｐｈｅｒ　Ｍ．，　ａｎｄ　Ｎａｓｓｅｒ　Ｍ．　Ｎａｓｒａｂａｄｉ．　"Ｐａｔｔｅｒｎ　ｒｅｃｏｇｎｉｔｉｏｎ　ａｎｄ　ｍａｃｈｉｎｅ　ｌｅａｒｎｉｎｇ．"　Ｖｏｌ．　１．　Ｎｅｗ　Ｙｏｒｋ：　ｓｐｒｉｎｇｅｒ，　２００６．））のベクトル

に置き換える。例えば、患者の年齢を０歳から１００歳までとした場合、１－ｏｆ－Ｋ表現の次元数

は、１０１であり、０歳の患者のデータは１０１次元の０－１ベクトル

で置き換えられる。なお、固有データ４１０に存在する他の多値のデータ列、例えば４１５についても同様の手順で、１－ｏｆ－Ｋ表現でベクトル化する。

　固有データ４１０が有理数や実数のデータ４１６の場合には、

として、そのままの値を用いる。なお、（数５）の記号Ｒは実数を意味する。また、検査データ４２０の検査値４２２の値についても実数値として取り扱う。

　なお、処理の簡便さの観点から固有データ４１０に存在する全てのデータを実数値として、上述した（数５）と置き換えても良い。例えば、データ４１２の場合については、男性＝０、女性＝１に置き換えてから実数とみなす。また、データ４１３の場合には患者の年齢を実数とみなして用いる。

　以下では、図５に示されるＳ１０２の詳細な処理フローを用いて、全Ｌ層（Ｌ≧１）のｒｅｓｔｒｉｃｔｅｄ　ｂｏｌｔｚｍａｎｎ　ｍａｃｈｉｎｅｓ（ＲＢＭ）とＬ＋１層目の回帰関数から構成される非線形重回帰により、固有データ４１０から個々の患者の検査値４２０を予測算出するための、回帰式のパラメータを求める手順を説明する。

　Ｓ５０１では、第１層のＲＢＭのトレーニングを実施する。第１層は固有データ４１０を入力としたベクトル列

である。まず、ベクトルｖの各要素について説明すると、ｔは検査データ４２０の時刻（週数）を表すパラメータであり、例えば４２１列目のデータの場合にはｔ＝１と入力する。　
　なお、ｔは実数値として取り扱う。ｖ^Ｂは固有データ４１０から取り出された２値データの関連因子であり、例えば関連因子４１２のＩＤ＝１の患者の場合には１（ｍａｌｅ）と入力する。ｖ^Ｍは固有データ４１０から取り出された多値データの関連因子であり、例えば関連因子４１３のＩＤ＝１の患者の場合には１－ｏｆ－Ｋ表現により、１０１次元ベクトルの８２次元目の要素に１を入力する。ｖ^Ｒは固有データ４１０から取り出された実数値データの関連因子であり、例えば関連因子４１６のＩＤ＝１の患者の場合には８．５と入力する。

　第１層目のＲＢＭの勾配を次式で計算する。

　なお、ｐは確率を意味する。第１層目の隠れユニットのベクトルｈ⁽¹⁾のｉ番目の要素を

とする。関数ｇはアクティベーション関数であり、

と

であるときには、ｇをシグモイド関数として計算する。

であるときには、ｇを正規分布として計算する。次に、第ｌ層のパラメータを

とする。Ｗ^(l)は第ｌ層のパラメータ行列を表し、ｂ^(l)，ｃ^(l)はバイアスベクトルを表している。式（数７）ではｌ＝１の場合であり、添字ｉ、ｊにより各パラメータの要素を表している。そして、

は、ｃｏｎｔｒａｓｔｉｖｅ　ｄｉｖｅｒｇｅｎｃｅ（ＣＤ法）（非特許文献３（Ｈｉｎｔｏｎ，　Ｇｅｏｆｆｒｅｙ．　"Ａ　ｐｒａｃｔｉｃａｌ　ｇｕｉｄｅ　ｔｏ　ｔｒａｉｎｉｎｇ　ｒｅｓｔｒｉｃｔｅｄ　Ｂｏｌｔｚｍａｎｎ　ｍａｃｈｉｎｅｓ．"　Ｍｏｍｅｎｔｕｍ　９．１　（２０１０）．））によりサンプリングされたデータ層のベクトルである。

　前記ＣＤ法では、（数７）の勾配を用いて勾配降下法によりパラメータθ^(１)を計算する。パラメータの計算後、ｌ＝２として次のステップＳ５０２に進む。なお、データ層ｖの要素が４１７のようにＮＡであった場合には、ＣＤ法を実行する際に、計算を続けるためランダムな値を入力することでパラメータθ^(１)の算出を行う。

　Ｓ５０２ではｌ層のＲＢＭのトレーニングを実施する。第ｌ層目のＲＢＭの勾配を次式で計算する。

　関数ｓｉｇｍはシグモイド関数である。Ｓ５０１と同様にθ^(ｌ)を計算して次のステップＳ５０３に進む。

　Ｓ５０３ではＬ＝＝ｌならばＳ５０４に進すすみ、Ｌ＞ｌならばｌ＋１⇒ｌとしてＳ５０２に進む。

　Ｓ５０４ではファインチューニングを実施する。Ｌ＋１層目の回帰関数

として、線形回帰に基づいた次式を用いる。

　ここで、v^(L)は入力ベクトルであり、第Ｌ層の隠れユニットｈ^（L）を用いる。ｙは出力ベクトルであり、検査データ４２０の値を用いる。なお、本実施形態では白血球の検査データ４２０の値を用いる例について説明しており、ｙを１次元のスカラとしてみなす。複数の検査値を同時に求める際には、ｙの異なる要素に、複数種の検査値（リンパ球数と血小板数など）を入力することで同時に回帰を実行する。そして、（数１６)を最終層として追加したニューラルネットワーク

に、L+1層までのパラメータ

をコピーした後、勾配降下法により（数１X）の全パラメータを計算する。

をメモリ２２２に保存してＳ１０３に進む。なお、Ｓ１０２により、ひとたび全パラメータθが算出されていれば、固有データ４１０をｖに入力することで、図６に示すような予測検査値６０１、６０２、６０３をｙとして計算するとともに、その最小値として有害事象が強く生じる時期６１１、６１２、６１３を算出する。したがって、患者ごとにどのタイミングで最も強く有害事象が発生するのかを把握することができる。また、どのような値の関連因子を持つ患者が投薬によりどの程度の影響を受けるのかを把握することができる。

　なお、Ｓ５０１からＳ５０３のステップを省略して、（数１７）のニューラルネット回帰を直接用いても良い。また、ｓｕｐｐｏｒｔｖｅｃｔｏｒ回帰などの一般的な回帰を用いても良い。

　Ｓ１０２において血球数の推移がモデル化され、これによって固有データ４１０を入力することで、週ごとの血球数の推移を予測算出することが可能となる。固有データ４１０は、クライアント２００から分析サーバ２２０に送信され、分析処理部３００が、受信したその固有データ４１０を図４に示したヘルスケアデータ４００に記憶する。Ｓ１０３では、患者の固有データ４１０と同じ関連因子（４１２や４１３、４１４、・・・、４１５、４１６）を持つ仮想的な固有データを生成し、図６の予測検査値６０３のように薬剤が強い影響を与える患者群（すなわち、投薬により検査値の変動が一定以上となった患者群。）についての頻度分布を算出する。以下では、あるタイミングで検査値が一定値を下回る患者群を例に説明しているが、薬剤の種類や関連因子の種類に応じて、あるタイミングで検査値が一定値を上回る患者群について頻度分布を算出する場合も含む。Ｓ１０３で予測された頻度分布の例を図７に示すと、関連因子４１２に対応する頻度分布は７１２であり、縦軸は仮想的に算出された患者数であり、横軸は性別を表す。関連因子４１３に対応する頻度分布は７１３であり、縦軸は仮想的に算出された患者数であり、横軸は年齢を表す。関連因子４１４に対応する頻度分布は７１４であり、縦軸は仮想的に算出された患者数であり、横軸は遺伝子欠損の有無を表す。関連因子４１５に対応する頻度分布は７１５であり、縦軸は仮想的に算出された患者数であり、横軸は放射線量を表す。関連因子４１６に対応する頻度分布は７１６であり、縦軸は仮想的に算出された患者数であり、横軸は白血球数を表す。

　以下では、ＭｅｔｒｏｐｏｌｉｓＨａｓｔｉｎｇｓ（ＭＨ）アルゴリズムを用いて、血球数が最小となる関連因子の分布を効率的に算出する。薬剤の作用により白血球数が低下する患者の分布を算出するため、予測値ｙが常に小さい値をとる固有データの関連因子からなるベクトルｖを算出する。

　図８にＳ１０３の処理のＭＨアルゴリズムを表したフローを示す。まず、Ｓ８０１で初期値ｖ^{（ｋ＝１）}をランダムに生成し、正規分布から取り出されたεをｖ^（ｋ）に加えて、

　を算出する。なお、Ｓ１０２とは異なり、添字ｋはＭＨアルゴリズムの繰り返し回数を意味していることに注意する。

　次に、Ｓ８０２では、次式から予測値ｙが小さい値をとる確率（上記ベクトルｖが得られる確率）αを計算する。

は、任意の提案分布であり、例えばガウス分布を用いることができる。ここで、検査値が小さいほど、薬剤の影響が強い場合には、関数Ｌを（数１６）に置き換えて計算する。また、検査値が大きいほど、薬剤の影響が強い場合には、関数Ｌを次式から計算する。

　Ｓ８０３では一様分布から一様乱数ｕを計算し、α＞ｕを満たす際にはＳ８０４に進み、そうでない場合はＳ８０５に進む。
Ｓ８０４では、

とする。
Ｓ８０５では、

とする。

　次に、Ｓ８０６では、ｋ＞１０，０００（Ｘ）を満たせばＳ８０８に進み、そうでない場合はＳ８０７に進む。また、ｋ＋１⇒ｋとする。繰り返し回数ｋの値（すなわちＸの値）については任意に定めることができる。　
　次に、Ｓ８０７では正規分布から取り出されたεをｖ^（ｋ）に加えて、

を算出する。

　Ｓ８０８では、ｋ＝１０，０００以上のｖ^（ｋ）について頻度分布を生成して処理を終える。なお、生成された頻度分布の例を図７に示す。以上がＳ１０３における処理の流れである。

　次に、Ｓ１０４では高発生関連因子の統計検証を実施する。具体的には、Ｓ１０３で生成された個々の頻度分布に対して統計的な検定を行う。ヘルスケアデータ４００の関連因子が２値の際には、値の一方のグループをＡとし、値の他方のグループをＢとする。例えば、関連因子４１２の頻度分布７１２において、男性（ｍａｌｅ）をＡグループとし、女性（ｆｅｍａｌｅ）をＢグループとする。

　次に、ヘルスケアデータ４００の関連因子が多値と実数値の際には、頻度分布の全累積数の５０からＸ％（本実施形態では、Ｘ＝８０％）を含む区間をグループＡとし、グループＡに含まれない区間をグループＢとする。例えば、関連因子４１３の頻度分布７１３においては、区間は６０歳以上１００歳以下で８０％（全累積数５，５００，０００のうち、累積数４，４００，０００）となる。図９の９１０に関連因子４１２、４１３、４１４、４１５についてグループ分けした例を示す。

　ヘルスケアデータ４００から算出された頻度分布７１２、７１３、７１４、７１５、７１６から算出されたＡグループとＢグループの検査値４２０に対して統計的な検定を実施し、有意差の有無を算出する。なお、本システムでは、ＡグループとＢグループの白血球数値に対してｓｔｕｄｅｎｔ’ｓｔ－ｔｅｓｔを実施することでｐ値を算出し、ｐ値が０．０５以下であれば有意差があるとして出力する。関連因子４１２、４１３、４１４、４１５について、図９の９１１にｐ値、８１２に統計的な有意差を算出した結果を示す。以上が、Ｓ１０４における処理の流れである。

　次に、Ｓ１０５ではクライントに有害事象のリスク情報を伝達する。まず、Ｓ１０１からＳ１０４で得られた分析データ、すなわち、図６の予測検査データ６００、図７の頻度分布データ７００、図８の統計解析データ９００を分析結果５００として分析サーバ２２０のデータベース３０１に保存する。

　次に、データベース３０１の分析結果５００について、ネットワーク２１０を介してクライアント２００に伝達される。その後、図６のグラフ及び図７の頻度分布がモニタ２０５に表示される。

　（第２実施形態）
　以下、個々の患者における薬剤の効果予測を行う場合を例に本発明の第２実施形態を説明する。なお、第１実施形態の場合と同様に抗がん剤の有害事象の発生予測を例にして説明するが、第１実施形態の場合と同様、様々な有害事象について適用することができる。分析が行われるヘルスケアデータ４００はデータベース３０１に格納され、ＨＤＤ２２１に保存されており、また、予測が行われ患者データ１１０２はクライアントデータベース１１０１に格納され、ＨＤＤ２０１に保存されている。第２実施形態では、第１実施形態で生成した仮想的な固有データを含むヘルスケアデータ４００が記憶された状態にあることを前提に、実際の患者の固有データ４１０を含むデータを入力として、その患者について、薬剤投与後の効果を予測することができる。分析処理部３００はサーバ２２０のＣＰＵ２２３上で実行される。

　図３を用いて説明すると、クライント端末２００からネットワーク２１０を介して分析サーバ２２０に接続すると、ＨＤＤ２２１に保存されているデータベース３０１からヘルスケアデータ４００が呼び出され、分析処理部３００はＣＰＵ２２３で実行され、分析結果５００をメモリ２２２上に生成する。その後、分析結果５００はＨＤＤ２２１に保存された後、ネットワーク２１０を介してクライント端末２００に配信され、モニタ２０５に表示される。さらに、クライント端末２００内のクライアントデータベース１１０１から患者データ１１０２がネットワーク２１０を介して分析サーバ２２０に呼び出され、予測処理部３１１はサーバ２２０のＣＰＵ２２３で実行され、予測結果１１０３をメモリ２２２上に生成する。その後、予測結果１１０３はＨＤＤ２２１に保存され、ネットワーク２１０を介してクライント端末２００に配信された後にＨＤＤ２０１に保存され、モニタ２０５に表示される。

　図１０を用いて、予測処理部３１１で実行される処理の流れについて説明する。まず、Ｓ１１０において第１実施形態と同様に処理Ｓ１０１からＳ１０５が実行される。

　次に、Ｓ１０６ではクライアントデータベース１１０１から分析対象となる患者の患者データ１１０２が読み出される。ここで、患者データ１１０１について図４を用いて説明すると、患者データ１１０１は、実施例１に示した患者自身の固有データ４１０と同様に患者にはユニークなＩＤが割り振らており、固有データ４１０に記載されている関連因子４１２、４１３、４１４、４１５、４１６に関するデータを保持している。単に、患者データ１１０２はヘルスケアデータ４００には含まれない患者の固有データである。

　Ｓ１０７ではＳ１０２と同様の手順で患者データ１１０１から入力ベクトルｖを計算する。次に、Ｓ１０２で計算された全Ｌ＋１層の回帰パラメタータθを用いて、（数１６）により予測検査値ｙを計算する。図６のグラフ６２０に予測検査値６２１と有害事象の発生時期６３１を描画した例を示す。

　Ｓ１０８ではＳ１０７で得られた有害事象の予測検査値を予測結果１１０３として、分析サーバ２２０からネットワーク２１０を介して、クライアント２００に伝達される。その後、有害事象の予測検査値が図６に示すようなグラフ６２０としてモニタ２０５に表示される。

　以上が、機械学習による薬効分析のシステムの動作例である。このように、本システムでは、分析処理部３００が、有害事象の発生に関連する因子情報であって投薬前の検査値を含む患者の関連因子を回帰分析し、投薬後の検査値の推移をモデル化し、検査値の推移がモデル化された患者の関連因子から、患者の関連情報と同じ関連因子を有する患者の関連因子を仮想的に生成し、生成した関連因子を有する患者のうち、投薬による検査値の変動が一定以上となる患者について、関連因子報ごとの頻度分布を生成するので、少ないサンプル数で臨床データの統計分析が可能となる。また、統計的検定により、関連因子ごとの頻度分布の有意差の有無を判定するので、それぞれの関連因子についての有意差を把握することができる。さらに、分析対象となる患者の関連因子と、検査値の推移がモデル化された患者の因子情報とに基づいて、分析対象となる患者の薬剤効果を予測するので、患者一人一人について、投薬後の薬剤効果を予測することが可能となる。

Claims

　有害事象の発生に関連する因子情報であって投薬前の検査値を含む患者の因子情報を回帰分析し、投薬後の検査値の推移をモデル化するモデル生成ステップと、
　前記検査値の推移がモデル化された患者の因子情報から、前記患者の因子情報と同じ因子情報を有する患者の因子情報を仮想的に生成し、生成した前記因子情報を有する患者のうち、投薬による前記検査値の変動が一定以上となる患者について、前記因子情報ごとの頻度分布を生成する分布生成ステップと、
　を含むことを特徴とする薬効分析方法。
　統計的検定により、前記頻度分布の有意差の有無を判定する検証ステップ、
　をさらに含むことを特徴とする請求項１に記載の薬効分析方法。
　前記モデル生成ステップでは、有害事象としての投薬後の副作用の発生に関連する因子情報を回帰分析する、
　ことを特徴とする請求項１に記載の薬効分析方法。
　分析対象となる患者の因子情報と、前記モデル生成ステップで生成された前記検査値の推移がモデル化された患者の因子情報とに基づいて、分析対象となる患者の薬剤効果を予測する予測処理ステップ、
を含むことを特徴とする請求項１に記載の薬効分析方法。
　前記モデル生成ステップでは、ニューラルネット回帰により、前記患者の因子情報を回帰分析する、
　ことを特徴とする請求項１に記載の薬効分析方法。
　前記モデル生成ステップでは、ｓｕｐｐｏｒｔ　ｖｅｃｔｏｒ回帰により、前記患者の因子情報を回帰分析する、
　ことを特徴とする請求項１に記載の薬効分析方法。
　前記モデル生成ステップでは、ｄｅｅｐ　ｌｅａｒｎｉｎｇ回帰により、前記患者の因子情報を回帰分析する、
　ことを特徴とする請求項１に記載の薬効分析方法。
　有害事象の発生に関連する因子情報であって投薬前の検査値を含む患者の因子情報を回帰分析し、投薬後の検査値の推移をモデル化するモデル生成部と、
　前記検査値の推移がモデル化された患者の因子情報から、前記患者の因子情報と同じ因子情報を有する患者の因子情報を仮想的に生成し、生成した前記因子情報を有する患者のうち、投薬による前記検査値の変動が一定以上となる患者について、前記因子情報ごとの頻度分布を生成する分布生成部と、
　を備えることを特徴とする薬効分析システム。
　統計的検定により、前記頻度分布の有意差の有無を判定する検証部、
　をさらに備えることを特徴とする請求項８に記載の薬効分析システム。
　前記モデル生成部は、有害事象としての投薬後の副作用の発生に関連する因子情報を回帰分析する、
　ことを特徴とする請求項８に記載の薬効分析システム。
　分析対象となる患者の因子情報と、前記モデル生成ステップで生成された前記検査値の推移がモデル化された患者の因子情報とに基づいて、分析対象となる患者の薬剤効果を予測する予測処理部、
を備えることを特徴とする請求項８に記載の薬効分析システム。