WO2016006532A1 - 薬効分析システム及び薬効分析方法 - Google Patents

薬効分析システム及び薬効分析方法 Download PDF

Info

Publication number
WO2016006532A1
WO2016006532A1 PCT/JP2015/069167 JP2015069167W WO2016006532A1 WO 2016006532 A1 WO2016006532 A1 WO 2016006532A1 JP 2015069167 W JP2015069167 W JP 2015069167W WO 2016006532 A1 WO2016006532 A1 WO 2016006532A1
Authority
WO
WIPO (PCT)
Prior art keywords
patient
factor information
data
model generation
analysis
Prior art date
Application number
PCT/JP2015/069167
Other languages
English (en)
French (fr)
Inventor
琢磨 柴原
善浩 村垣
Original Assignee
株式会社日立製作所
学校法人東京女子医科大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所, 学校法人東京女子医科大学 filed Critical 株式会社日立製作所
Priority to US15/323,777 priority Critical patent/US20170161469A1/en
Publication of WO2016006532A1 publication Critical patent/WO2016006532A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Abstract

少ないサンプル数で臨床データの統計分析を可能とする。有害事象の発生に関連する因子情報であって投薬前の検査値を含む患者の因子情報を回帰分析し、投薬後の検査値の推移をモデル化するモデル生成ステップと、前記検査値の推移がモデル化された患者の因子情報から、前記患者の因子情報と同じ因子情報を有する患者の因子情報を仮想的に生成し、生成した前記因子情報を有する患者のうち、投薬による前記検査値の変動が一定以上となる患者について、前記因子情報ごとの頻度分布を生成する分布生成ステップと、を含む。

Description

薬効分析システム及び薬効分析方法
 本発明は、病院等の医療機関で用いられるヘルスケアデータの統計解析を実行し、薬剤の効果や副作用に関するデータを提供するためのシステム及び方法に関する。
 一般に、新薬は有害事象(副作用)の危険性があるため、市販直後は売上の伸びが鈍く、また、特許切れ等による独占期間終了後には、後発医薬品が販売されることで急速に利益が減少する傾向にある。そこで、早期に新薬の効果や有害事象の傾向を分析し、販売直後から薬剤の効果的な適用を支援することが、薬の販売機会を増大させるうえで重要である。
 例えば、特許文献1では患者の因子(年齢や性別など)と有害事象との間の統計的な相関に関する情報を識別及び提供する方法が開示されている。
特開2012-524945号公報
 ところが、特許文献1の従来技術から得られる患者の属性と有害事象に関連があるという相関情報からでは、医師や薬剤師が薬剤の投与計画の立案を行うことが難しい。また、有害事象の関連候補となる因子が多値/連続値の場合、因子の全定義域で相関計算を行う必要があるために、膨大な計算時間を要してしまう。
 本発明は、上記に鑑みてなされたものであって、少ないサンプル数で臨床データの統計分析を可能とする薬効分析システム及び薬効分析方法を提供することを目的とする。
 上述した課題を解決し、目的を達成するために、本発明にかかる薬効分析方法は、有害事象の発生に関連する因子情報であって投薬前の検査値を含む患者の因子情報を回帰分析し、投薬後の検査値の推移をモデル化するモデル生成ステップと、前記検査値の推移がモデル化された患者の因子情報から、前記患者の因子情報と同じ因子情報を有する患者の因子情報を仮想的に生成し、生成した前記因子情報を有する患者のうち、投薬による前記検査値の変動が一定以上となる患者について、前記因子情報ごとの頻度分布を生成する分布生成ステップと、を含むことを特徴とする薬効分析方法として構成される。
 また、本発明は、上記薬効分析方法を実行する薬効分析システムとしても把握される。
本発明によれば、少ないサンプル数で臨床データの統計分析が可能となる。
本発明の実施形態における機械学習による薬効分析のシステムの処理の流れを示した図である。 本発明の実施形態における機械学習による薬効分析のシステムの装置的な構成を示した図である。 本発明の実施形態における機械学習による薬効分析のシステムの概要を示した図である。 本発明の実施形態におけるヘルスケアデータの例を示した図である。 本発明の実施形態において、薬剤効果の発生過程のモデル生成について処理の流れを示した図である。 本発明の実施形態において得られた予測検査データを可視化した図である。 本発明の実施形態において得られた関連因子ごとの分布に関する図である。 本発明の実施形態において、高発生群分布の算出について処理の流れを示した図である。 本発明の実施形態において、関連因子に対する統計値に関して示した図である。 本発明の実施形態における機械学習による薬効分析のシステムの処理において、個々の患者における薬剤の効果予測を行う場合の流れを示した図である。
 以下では、発明を実施するための形態(以降、「実施形態」と称す。)について、適宜、図面を参照しながら説明する。以下に示すように、本システムでは、薬剤の投与による効果(治療効果及び有害事象)に対する患者属性(例えば、年齢や性別、遺伝子情報等)の統計的な頻度分布及び、医学的な統計値を算出し、ユーザに提供する方法及びシステムを用意する。また、個々の患者ごとに薬剤の投与による治療効果と有害事象の強さや、発生時期を予測する手段を提供する。
 実施形態における典型的な装置の構成の例を図2に示す。実施形態ではクライント端末200と分析サーバ220があり、ネットワーク210にて接続されている。クライント端末200は補助記憶装置のHDD(hard disk drive)201と、主記憶装置のメモリ202、CPU(centralprocessing unit)203、キーボードやマウスからなる入力装置204、モニタ205から構成される。分析サーバ220は補助記憶装置のHDD221と、主記憶装置のメモリ222、CPU223、キーボードやマウスからなる入力装置224、モニタ225から構成される。
 (第1実施形態)
 以下、抗がん剤の有害事象(副作用)の発生に関連する因子解析を行う場合を例に本発明の第1実施形態を説明する。図2及び図3を用いて説明すると、分析が行われるヘルスケアデータ400はデータベース301に格納されてHDD221に保存されており、分析処理部300はCPU223で実行される。クライント端末200からネットワーク210を介して分析サーバ220に接続すると、HDD221に保存されているデータベース301からヘルスケアデータ400が呼び出され、分析処理部300はCPU223で実行され、分析結果500をメモリ222上に生成する。その後、分析処理部300は分析結果500をHDD221に保存した後、ネットワーク210を介してクライント端末200に配信し、クライアント端末200のCPU203がモニタ205に分析結果500を表示する。
 図1を用いて分析処理部300で実行される処理の流れについて説明する。S101ではデータベース301からヘルスケアデータ400が読み出される。ここで、データベース301に格納されているヘルスケアデータ400について、図4を用いて説明すると、ヘルスケアデータ400は患者の因子情報を格納している固有データ410と、投与薬の効果(本実施形態では、抗がん剤の有害事象)を判断するための検査データ420から構成されている。患者にはユニークなID(411)が割り振らており、固有データ410と検査データ420を結びつけることができる。
 固有データ410には患者の性別412、年齢413がある。また、固有データ410の遺伝子関連情報414には、一塩基多型(SNP:single nucleotide polymorphism)による遺伝子の欠損情報の有無や、染色体の欠損の有無が記載されている。さらに、固有データ410には、放射線治療による放射線量415、投薬前の検査値である白血球数416などから構成されている。固有データ410には、病院における電子カルテに記載された情報が含まれているが、一例として、説明の容易さから412から416の5項目を図4に図示した。なお、図4の410と420に現れる表記NA(例えば、417)は値が不明であることを意味する。このように、固有データ410には、患者の身体的な特徴を示す因子情報が含まれ、以下では、患者の特徴に関連するこれらの因子情報のことを関連因子と呼ぶ。
 検査データ420には投薬後の白血球数の検査値が週ごとに格納されている。検査値は白血球に限らず、他の血球(赤血球数、血小板数など)や、生化学検査値GOT(グルタミン酸オキサロ酢酸トランスアミナーゼ)、GPT(グルタミン酸ピルビン酸トランスアミナーゼ)、腫瘍マーカ等の時系列的なデータから構成されている。多くの抗がん剤には骨髄抑制作用があるため、以下では、白血球数を検査値として用いた場合を例に説明する。
 S102では、固有データ410から検査データ420の検査値の推移を回帰によりモデル化する。本発明の実施形態におけるモデル化とは固有データ410から個々の患者の検査値420を予測算出するための回帰式のパラメータ(係数)を求めることを意味する。S102で得られた回帰式のパラメータにより、ID=1(431)の患者の予測検査値601と、ID=2(432)の患者の予測検査値602を図示した例を図6に示す。回帰の手法としては非特許文献1(Bishop, Christopher M., and Nasser M. Nasrabadi. "Pattern recognition and machine learning." Vol. 1. New York: springer, 2006.)に記載されているlasso回帰(正則化を導入した線形回帰)、ニューラルネット回帰、support vector回帰などの一般的な回帰を用いた様々な回帰条件で以下の処理を実行することができる。なお、以下では、deep learning(非特許文献2(Bengio, Yoshua. "Learning deep architectures for AI." Foundations and trends in Machine Learning 2.1 (2009): 1-127.)に基づく回帰(本実施形態では、deep learning回帰と呼称する)を用いて本実施形態を説明する。
 はじめに、データの取り扱い方について説明する。固有データ410から2値のデータ412を抽出し、0-1表現の値を以下の式に置き換える。
Figure JPOXMLDOC01-appb-M000001
 例えば、データ412の場合については、男性=0、女性=1とする。また、固有データ410から、他の2値を取りうるデータについても、例えばデータ414について同様の手順で、0-1表現で置き換える。
 次に、固有データ410から多値のデータ413を抽出し、1-of-K表現(非特許文献1(Bishop, Christopher M., and Nasser M. Nasrabadi. "Pattern recognition and machine learning." Vol. 1. New York: springer, 2006.))のベクトル
Figure JPOXMLDOC01-appb-M000002
に置き換える。例えば、患者の年齢を0歳から100歳までとした場合、1-of-K表現の次元数
Figure JPOXMLDOC01-appb-M000003
は、101であり、0歳の患者のデータは101次元の0-1ベクトル
Figure JPOXMLDOC01-appb-M000004
で置き換えられる。なお、固有データ410に存在する他の多値のデータ列、例えば415についても同様の手順で、1-of-K表現でベクトル化する。
 固有データ410が有理数や実数のデータ416の場合には、
Figure JPOXMLDOC01-appb-M000005
として、そのままの値を用いる。なお、(数5)の記号Rは実数を意味する。また、検査データ420の検査値422の値についても実数値として取り扱う。
 なお、処理の簡便さの観点から固有データ410に存在する全てのデータを実数値として、上述した(数5)と置き換えても良い。例えば、データ412の場合については、男性=0、女性=1に置き換えてから実数とみなす。また、データ413の場合には患者の年齢を実数とみなして用いる。
 以下では、図5に示されるS102の詳細な処理フローを用いて、全L層(L≧1)のrestricted boltzmann machines(RBM)とL+1層目の回帰関数から構成される非線形重回帰により、固有データ410から個々の患者の検査値420を予測算出するための、回帰式のパラメータを求める手順を説明する。
 S501では、第1層のRBMのトレーニングを実施する。第1層は固有データ410を入力としたベクトル列
Figure JPOXMLDOC01-appb-M000006
である。まず、ベクトルvの各要素について説明すると、tは検査データ420の時刻(週数)を表すパラメータであり、例えば421列目のデータの場合にはt=1と入力する。 
 なお、tは実数値として取り扱う。vは固有データ410から取り出された2値データの関連因子であり、例えば関連因子412のID=1の患者の場合には1(male)と入力する。vは固有データ410から取り出された多値データの関連因子であり、例えば関連因子413のID=1の患者の場合には1-of-K表現により、101次元ベクトルの82次元目の要素に1を入力する。vは固有データ410から取り出された実数値データの関連因子であり、例えば関連因子416のID=1の患者の場合には8.5と入力する。
 第1層目のRBMの勾配を次式で計算する。
Figure JPOXMLDOC01-appb-M000007
 なお、pは確率を意味する。第1層目の隠れユニットのベクトルh(1)のi番目の要素を
Figure JPOXMLDOC01-appb-M000008
とする。関数gはアクティベーション関数であり、
Figure JPOXMLDOC01-appb-M000009
Figure JPOXMLDOC01-appb-M000010
であるときには、gをシグモイド関数として計算する。
Figure JPOXMLDOC01-appb-M000011
であるときには、gを正規分布として計算する。次に、第l層のパラメータを
Figure JPOXMLDOC01-appb-M000012
とする。W(l)は第l層のパラメータ行列を表し、b(l),c(l)はバイアスベクトルを表している。式(数7)ではl=1の場合であり、添字i、jにより各パラメータの要素を表している。そして、
Figure JPOXMLDOC01-appb-M000013
は、contrastive divergence(CD法)(非特許文献3(Hinton, Geoffrey. "A practical guide to training restricted Boltzmann machines." Momentum 9.1 (2010).))によりサンプリングされたデータ層のベクトルである。
 前記CD法では、(数7)の勾配を用いて勾配降下法によりパラメータθ(1)を計算する。パラメータの計算後、l=2として次のステップS502に進む。なお、データ層vの要素が417のようにNAであった場合には、CD法を実行する際に、計算を続けるためランダムな値を入力することでパラメータθ(1)の算出を行う。
 S502ではl層のRBMのトレーニングを実施する。第l層目のRBMの勾配を次式で計算する。
Figure JPOXMLDOC01-appb-M000014
 関数sigmはシグモイド関数である。S501と同様にθ(l)を計算して次のステップS503に進む。
 S503ではL==lならばS504に進すすみ、L>lならばl+1⇒lとしてS502に進む。
 S504ではファインチューニングを実施する。L+1層目の回帰関数
Figure JPOXMLDOC01-appb-M000015
として、線形回帰に基づいた次式を用いる。
Figure JPOXMLDOC01-appb-M000016
 ここで、v(L)は入力ベクトルであり、第L層の隠れユニットh(L)を用いる。yは出力ベクトルであり、検査データ420の値を用いる。なお、本実施形態では白血球の検査データ420の値を用いる例について説明しており、yを1次元のスカラとしてみなす。複数の検査値を同時に求める際には、yの異なる要素に、複数種の検査値(リンパ球数と血小板数など)を入力することで同時に回帰を実行する。そして、(数16)を最終層として追加したニューラルネットワーク
Figure JPOXMLDOC01-appb-M000017
に、L+1層までのパラメータ
Figure JPOXMLDOC01-appb-M000018
をコピーした後、勾配降下法により(数1X)の全パラメータを計算する。
Figure JPOXMLDOC01-appb-M000019
をメモリ222に保存してS103に進む。なお、S102により、ひとたび全パラメータθが算出されていれば、固有データ410をvに入力することで、図6に示すような予測検査値601、602、603をyとして計算するとともに、その最小値として有害事象が強く生じる時期611、612、613を算出する。したがって、患者ごとにどのタイミングで最も強く有害事象が発生するのかを把握することができる。また、どのような値の関連因子を持つ患者が投薬によりどの程度の影響を受けるのかを把握することができる。
 なお、S501からS503のステップを省略して、(数17)のニューラルネット回帰を直接用いても良い。また、support vector回帰などの一般的な回帰を用いても良い。
 S102において血球数の推移がモデル化され、これによって固有データ410を入力することで、週ごとの血球数の推移を予測算出することが可能となる。固有データ410は、クライアント200から分析サーバ220に送信され、分析処理部300が、受信したその固有データ410を図4に示したヘルスケアデータ400に記憶する。S103では、患者の固有データ410と同じ関連因子(412や413、414、・・・、415、416)を持つ仮想的な固有データを生成し、図6の予測検査値603のように薬剤が強い影響を与える患者群(すなわち、投薬により検査値の変動が一定以上となった患者群。)についての頻度分布を算出する。以下では、あるタイミングで検査値が一定値を下回る患者群を例に説明しているが、薬剤の種類や関連因子の種類に応じて、あるタイミングで検査値が一定値を上回る患者群について頻度分布を算出する場合も含む。S103で予測された頻度分布の例を図7に示すと、関連因子412に対応する頻度分布は712であり、縦軸は仮想的に算出された患者数であり、横軸は性別を表す。関連因子413に対応する頻度分布は713であり、縦軸は仮想的に算出された患者数であり、横軸は年齢を表す。関連因子414に対応する頻度分布は714であり、縦軸は仮想的に算出された患者数であり、横軸は遺伝子欠損の有無を表す。関連因子415に対応する頻度分布は715であり、縦軸は仮想的に算出された患者数であり、横軸は放射線量を表す。関連因子416に対応する頻度分布は716であり、縦軸は仮想的に算出された患者数であり、横軸は白血球数を表す。
 以下では、Metropolis Hastings(MH)アルゴリズムを用いて、血球数が最小となる関連因子の分布を効率的に算出する。薬剤の作用により白血球数が低下する患者の分布を算出するため、予測値yが常に小さい値をとる固有データの関連因子からなるベクトルvを算出する。
 図8にS103の処理のMHアルゴリズムを表したフローを示す。まず、S801で初期値v(k=1)をランダムに生成し、正規分布から取り出されたεをv(k)に加えて、
Figure JPOXMLDOC01-appb-M000020
 を算出する。なお、S102とは異なり、添字kはMHアルゴリズムの繰り返し回数を意味していることに注意する。
 次に、S802では、次式から予測値yが小さい値をとる確率(上記ベクトルvが得られる確率)αを計算する。
Figure JPOXMLDOC01-appb-M000021
Figure JPOXMLDOC01-appb-M000022
は、任意の提案分布であり、例えばガウス分布を用いることができる。ここで、検査値が小さいほど、薬剤の影響が強い場合には、関数Lを(数16)に置き換えて計算する。また、検査値が大きいほど、薬剤の影響が強い場合には、関数Lを次式から計算する。
Figure JPOXMLDOC01-appb-M000023
 S803では一様分布から一様乱数uを計算し、α>uを満たす際にはS804に進み、そうでない場合はS805に進む。
S804では、
Figure JPOXMLDOC01-appb-M000024
とする。
S805では、
Figure JPOXMLDOC01-appb-M000025
とする。
 次に、S806では、k>10,000(X)を満たせばS808に進み、そうでない場合はS807に進む。また、k+1⇒kとする。繰り返し回数kの値(すなわちXの値)については任意に定めることができる。 
 次に、S807では正規分布から取り出されたεをv(k)に加えて、
Figure JPOXMLDOC01-appb-M000026
を算出する。
 S808では、k=10,000以上のv(k)について頻度分布を生成して処理を終える。なお、生成された頻度分布の例を図7に示す。以上がS103における処理の流れである。
 次に、S104では高発生関連因子の統計検証を実施する。具体的には、S103で生成された個々の頻度分布に対して統計的な検定を行う。ヘルスケアデータ400の関連因子が2値の際には、値の一方のグループをAとし、値の他方のグループをBとする。例えば、関連因子412の頻度分布712において、男性(male)をAグループとし、女性(female)をBグループとする。
 次に、ヘルスケアデータ400の関連因子が多値と実数値の際には、頻度分布の全累積数の50からX%(本実施形態では、X=80%)を含む区間をグループAとし、グループAに含まれない区間をグループBとする。例えば、関連因子413の頻度分布713においては、区間は60歳以上100歳以下で80%(全累積数5,500,000のうち、累積数4,400,000)となる。図9の910に関連因子412、413、414、415についてグループ分けした例を示す。
 ヘルスケアデータ400から算出された頻度分布712、713、714、715、716から算出されたAグループとBグループの検査値420に対して統計的な検定を実施し、有意差の有無を算出する。なお、本システムでは、AグループとBグループの白血球数値に対してstudent’s t-testを実施することでp値を算出し、p値が0.05以下であれば有意差があるとして出力する。関連因子412、413、414、415について、図9の911にp値、812に統計的な有意差を算出した結果を示す。以上が、S104における処理の流れである。
 次に、S105ではクライントに有害事象のリスク情報を伝達する。まず、S101からS104で得られた分析データ、すなわち、図6の予測検査データ600、図7の頻度分布データ700、図8の統計解析データ900を分析結果500として分析サーバ220のデータベース301に保存する。
 次に、データベース301の分析結果500について、ネットワーク210を介してクライアント200に伝達される。その後、図6のグラフ及び図7の頻度分布がモニタ205に表示される。
 (第2実施形態)
 以下、個々の患者における薬剤の効果予測を行う場合を例に本発明の第2実施形態を説明する。なお、第1実施形態の場合と同様に抗がん剤の有害事象の発生予測を例にして説明するが、第1実施形態の場合と同様、様々な有害事象について適用することができる。分析が行われるヘルスケアデータ400はデータベース301に格納され、HDD221に保存されており、また、予測が行われ患者データ1102はクライアントデータベース1101に格納され、HDD201に保存されている。第2実施形態では、第1実施形態で生成した仮想的な固有データを含むヘルスケアデータ400が記憶された状態にあることを前提に、実際の患者の固有データ410を含むデータを入力として、その患者について、薬剤投与後の効果を予測することができる。分析処理部300はサーバ220のCPU223上で実行される。
 図3を用いて説明すると、クライント端末200からネットワーク210を介して分析サーバ220に接続すると、HDD221に保存されているデータベース301からヘルスケアデータ400が呼び出され、分析処理部300はCPU223で実行され、分析結果500をメモリ222上に生成する。その後、分析結果500はHDD221に保存された後、ネットワーク210を介してクライント端末200に配信され、モニタ205に表示される。さらに、クライント端末200内のクライアントデータベース1101から患者データ1102がネットワーク210を介して分析サーバ220に呼び出され、予測処理部311はサーバ220のCPU223で実行され、予測結果1103をメモリ222上に生成する。その後、予測結果1103はHDD221に保存され、ネットワーク210を介してクライント端末200に配信された後にHDD201に保存され、モニタ205に表示される。
 図10を用いて、予測処理部311で実行される処理の流れについて説明する。まず、S110において第1実施形態と同様に処理S101からS105が実行される。
 次に、S106ではクライアントデータベース1101から分析対象となる患者の患者データ1102が読み出される。ここで、患者データ1101について図4を用いて説明すると、患者データ1101は、実施例1に示した患者自身の固有データ410と同様に患者にはユニークなIDが割り振らており、固有データ410に記載されている関連因子412、413、414、415、416に関するデータを保持している。単に、患者データ1102はヘルスケアデータ400には含まれない患者の固有データである。
 S107ではS102と同様の手順で患者データ1101から入力ベクトルvを計算する。次に、S102で計算された全L+1層の回帰パラメタータθを用いて、(数16)により予測検査値yを計算する。図6のグラフ620に予測検査値621と有害事象の発生時期631を描画した例を示す。
 S108ではS107で得られた有害事象の予測検査値を予測結果1103として、分析サーバ220からネットワーク210を介して、クライアント200に伝達される。その後、有害事象の予測検査値が図6に示すようなグラフ620としてモニタ205に表示される。
 以上が、機械学習による薬効分析のシステムの動作例である。このように、本システムでは、分析処理部300が、有害事象の発生に関連する因子情報であって投薬前の検査値を含む患者の関連因子を回帰分析し、投薬後の検査値の推移をモデル化し、検査値の推移がモデル化された患者の関連因子から、患者の関連情報と同じ関連因子を有する患者の関連因子を仮想的に生成し、生成した関連因子を有する患者のうち、投薬による検査値の変動が一定以上となる患者について、関連因子報ごとの頻度分布を生成するので、少ないサンプル数で臨床データの統計分析が可能となる。また、統計的検定により、関連因子ごとの頻度分布の有意差の有無を判定するので、それぞれの関連因子についての有意差を把握することができる。さらに、分析対象となる患者の関連因子と、検査値の推移がモデル化された患者の因子情報とに基づいて、分析対象となる患者の薬剤効果を予測するので、患者一人一人について、投薬後の薬剤効果を予測することが可能となる。

Claims (11)

  1.  有害事象の発生に関連する因子情報であって投薬前の検査値を含む患者の因子情報を回帰分析し、投薬後の検査値の推移をモデル化するモデル生成ステップと、
     前記検査値の推移がモデル化された患者の因子情報から、前記患者の因子情報と同じ因子情報を有する患者の因子情報を仮想的に生成し、生成した前記因子情報を有する患者のうち、投薬による前記検査値の変動が一定以上となる患者について、前記因子情報ごとの頻度分布を生成する分布生成ステップと、
     を含むことを特徴とする薬効分析方法。
  2.  統計的検定により、前記頻度分布の有意差の有無を判定する検証ステップ、
     をさらに含むことを特徴とする請求項1に記載の薬効分析方法。
  3.  前記モデル生成ステップでは、有害事象としての投薬後の副作用の発生に関連する因子情報を回帰分析する、
     ことを特徴とする請求項1に記載の薬効分析方法。
  4.  分析対象となる患者の因子情報と、前記モデル生成ステップで生成された前記検査値の推移がモデル化された患者の因子情報とに基づいて、分析対象となる患者の薬剤効果を予測する予測処理ステップ、
    を含むことを特徴とする請求項1に記載の薬効分析方法。
  5.  前記モデル生成ステップでは、ニューラルネット回帰により、前記患者の因子情報を回帰分析する、
     ことを特徴とする請求項1に記載の薬効分析方法。
  6.  前記モデル生成ステップでは、support vector回帰により、前記患者の因子情報を回帰分析する、
     ことを特徴とする請求項1に記載の薬効分析方法。
  7.  前記モデル生成ステップでは、deep learning回帰により、前記患者の因子情報を回帰分析する、
     ことを特徴とする請求項1に記載の薬効分析方法。
  8.  有害事象の発生に関連する因子情報であって投薬前の検査値を含む患者の因子情報を回帰分析し、投薬後の検査値の推移をモデル化するモデル生成部と、
     前記検査値の推移がモデル化された患者の因子情報から、前記患者の因子情報と同じ因子情報を有する患者の因子情報を仮想的に生成し、生成した前記因子情報を有する患者のうち、投薬による前記検査値の変動が一定以上となる患者について、前記因子情報ごとの頻度分布を生成する分布生成部と、
     を備えることを特徴とする薬効分析システム。
  9.  統計的検定により、前記頻度分布の有意差の有無を判定する検証部、
     をさらに備えることを特徴とする請求項8に記載の薬効分析システム。
  10.  前記モデル生成部は、有害事象としての投薬後の副作用の発生に関連する因子情報を回帰分析する、
     ことを特徴とする請求項8に記載の薬効分析システム。
  11.  分析対象となる患者の因子情報と、前記モデル生成ステップで生成された前記検査値の推移がモデル化された患者の因子情報とに基づいて、分析対象となる患者の薬剤効果を予測する予測処理部、
    を備えることを特徴とする請求項8に記載の薬効分析システム。
PCT/JP2015/069167 2014-07-07 2015-07-02 薬効分析システム及び薬効分析方法 WO2016006532A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US15/323,777 US20170161469A1 (en) 2014-07-07 2015-07-02 Drug Efficacy Analysis System and Drug Efficacy Analysis Method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014139785A JP6324828B2 (ja) 2014-07-07 2014-07-07 薬効分析システム及び薬効分析方法
JP2014-139785 2014-07-07

Publications (1)

Publication Number Publication Date
WO2016006532A1 true WO2016006532A1 (ja) 2016-01-14

Family

ID=55064168

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/069167 WO2016006532A1 (ja) 2014-07-07 2015-07-02 薬効分析システム及び薬効分析方法

Country Status (3)

Country Link
US (1) US20170161469A1 (ja)
JP (1) JP6324828B2 (ja)
WO (1) WO2016006532A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018042606A1 (ja) * 2016-09-01 2018-03-08 株式会社日立製作所 分析装置、分析システムおよび分析方法
KR101946402B1 (ko) * 2017-10-31 2019-02-11 고려대학교산학협력단 인공 지능망 기반 치료 예측 결과 제공 방법 및 시스템
WO2019074191A1 (ko) * 2017-10-13 2019-04-18 고려대학교 산학협력단 암 치료 예측결과 제공 방법 및 시스템, 인공 지능망 기반 치료 예측 결과 제공 방법 및 시스템, 그리고 치료 예측결과 및 근거 자료 일괄 제공 방법 및 시스템
KR101946407B1 (ko) * 2017-10-13 2019-02-11 고려대학교산학협력단 방사선 치료 예측 방법 및 장치
JP7458000B2 (ja) 2019-03-26 2024-03-29 国立大学法人埼玉大学 支援情報提供システム、支援情報提供装置、支援情報提供方法及びプログラム
KR102497003B1 (ko) * 2020-11-30 2023-02-06 재단법인대구경북과학기술원 약물 평가 방법 및 장치
CN112786104B (zh) * 2021-02-03 2024-03-22 东北大学 基于机器学习的药物疗效影响因子挖掘方法
CN112885487B (zh) * 2021-03-18 2023-03-24 宁夏医科大学总医院 一种药物基因检测项目管理系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002048400A1 (fr) * 2000-12-12 2002-06-20 Nagoya Industrial Science Research Institute Procede d'estimation du risque de l'expression d'effets secondaires causes par l'administration de compose metabolise, soit automatiquement, soit comme intermediaire metabolique, par l'enzyme ugt1a1
JP2007279999A (ja) * 2006-04-06 2007-10-25 Hitachi Ltd 薬物動態解析システム及び方法
WO2010064413A1 (ja) * 2008-12-01 2010-06-10 国立大学法人山口大学 薬剤の作用・副作用予測システムとそのプログラム
JP2013012025A (ja) * 2011-06-29 2013-01-17 Fujifilm Corp 診療支援システムおよび方法、並びに、プログラム
JP2013524355A (ja) * 2010-04-07 2013-06-17 ノヴァディスカバリー 処置成果を予測するためのコンピュータベースシステム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013006704A1 (en) * 2011-07-05 2013-01-10 Hunt Robert Don Systems and methods for clinical evaluation of psychiatric disorders
US9008391B1 (en) * 2013-10-22 2015-04-14 Eyenuk, Inc. Systems and methods for processing retinal images for screening of diseases or abnormalities

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002048400A1 (fr) * 2000-12-12 2002-06-20 Nagoya Industrial Science Research Institute Procede d'estimation du risque de l'expression d'effets secondaires causes par l'administration de compose metabolise, soit automatiquement, soit comme intermediaire metabolique, par l'enzyme ugt1a1
JP2007279999A (ja) * 2006-04-06 2007-10-25 Hitachi Ltd 薬物動態解析システム及び方法
WO2010064413A1 (ja) * 2008-12-01 2010-06-10 国立大学法人山口大学 薬剤の作用・副作用予測システムとそのプログラム
JP2013524355A (ja) * 2010-04-07 2013-06-17 ノヴァディスカバリー 処置成果を予測するためのコンピュータベースシステム
JP2013012025A (ja) * 2011-06-29 2013-01-17 Fujifilm Corp 診療支援システムおよび方法、並びに、プログラム

Also Published As

Publication number Publication date
JP2016018321A (ja) 2016-02-01
US20170161469A1 (en) 2017-06-08
JP6324828B2 (ja) 2018-05-16

Similar Documents

Publication Publication Date Title
JP6324828B2 (ja) 薬効分析システム及び薬効分析方法
Spooner et al. A comparison of machine learning methods for survival analysis of high-dimensional clinical data for dementia prediction
Rock Artificial Intelligence (AI) in Arkansas (AR)
Beaulieu-Jones et al. Missing data imputation in the electronic health record using deeply learned autoencoders
Pivovarov et al. Learning probabilistic phenotypes from heterogeneous EHR data
Kassahun et al. Automatic classification of epilepsy types using ontology-based and genetics-based machine learning
JP6066825B2 (ja) データ分析装置及び保健事業支援方法
US20160378919A1 (en) System and method for medical data analysis and sharing
US20140278130A1 (en) Method of predicting toxicity for chemical compounds
Neelon et al. A Bayesian two-part latent class model for longitudinal medical expenditure data: Assessing the impact of mental health and substance abuse parity
US20130254202A1 (en) Parallelization of synthetic events with genetic surprisal data representing a genetic sequence of an organism
Meier et al. Predicting treatment process steps from events
Lin et al. Machine learning in neural networks
Coley et al. Predicting outcomes of psychotherapy for depression with electronic health record data
Böck et al. Superhuman performance on sepsis MIMIC-III data by distributional reinforcement learning
Xue et al. Perioperative predictions with interpretable latent representation
Jalamangala Shivananjaiah et al. Predicting near-term glaucoma progression: An artificial intelligence approach using clinical free-text notes and data from electronic health records
Alghamdi et al. A prediction modelling and pattern detection approach for the first-episode psychosis associated to cannabis use
Patel A Review on Importance of Artificial Intelligence in Alzheimer's Disease and it's Future Outcomes for Alzheimer's Disease
Prakash et al. Random forest regression with hyper parameter tuning for medical insurance premium prediction
Bhattarai et al. Using artificial intelligence to learn optimal regimen plan for Alzheimer’s disease
Pradhan et al. Prediction of stroke disease using different types of gradient boosting classifiers
Muthalaly Using deep learning to predict the mortality of leukemia patients
Arnaoudova et al. Statistical phylogenetic tree analysis using differences of means
Manikandan et al. An hybrid technique for optimized clustering of EHR using binary particle swarm and constrained optimization for better performance in prediction of cardiovascular diseases

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15819736

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 15323777

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15819736

Country of ref document: EP

Kind code of ref document: A1