JP7100728B1 - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP7100728B1 JP7100728B1 JP2021012266A JP2021012266A JP7100728B1 JP 7100728 B1 JP7100728 B1 JP 7100728B1 JP 2021012266 A JP2021012266 A JP 2021012266A JP 2021012266 A JP2021012266 A JP 2021012266A JP 7100728 B1 JP7100728 B1 JP 7100728B1
- Authority
- JP
- Japan
- Prior art keywords
- information processing
- model
- drug
- diseases
- patients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 66
- 238000003672 processing method Methods 0.000 title claims description 6
- 229940079593 drug Drugs 0.000 claims abstract description 151
- 239000003814 drug Substances 0.000 claims abstract description 151
- 201000010099 disease Diseases 0.000 claims abstract description 141
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 141
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000010801 machine learning Methods 0.000 claims abstract description 29
- 238000000034 method Methods 0.000 abstract description 6
- 239000003795 chemical substances by application Substances 0.000 description 11
- 239000004480 active ingredient Substances 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 238000012986 modification Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- XZWYZXLIPXDOLR-UHFFFAOYSA-N metformin Chemical compound CN(C)C(=N)NC(N)=N XZWYZXLIPXDOLR-UHFFFAOYSA-N 0.000 description 7
- 229960003105 metformin Drugs 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 239000002245 particle Substances 0.000 description 6
- 239000003168 generic drug Substances 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 206010039073 rheumatoid arthritis Diseases 0.000 description 2
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 208000011231 Crohn disease Diseases 0.000 description 1
- 108010008165 Etanercept Proteins 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 229960000403 etanercept Drugs 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000005802 health problem Effects 0.000 description 1
- 229940048921 humira Drugs 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/20—ICT specially adapted for the handling or processing of medical references relating to practices or guidelines
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- General Business, Economics & Management (AREA)
- Business, Economics & Management (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Pharmacology & Pharmacy (AREA)
- Bioethics (AREA)
- Toxicology (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】施設ごとの患者数を精度よく推定するための技術を提供する。【解決手段】情報処理装置は、命令を記憶するメモリと、1つ以上のプロセッサと、を備える。命令は、1つ以上のプロセッサによって実行された場合に、情報処理装置に、複数の医療施設のそれぞれについて、特定の疾患グループに含まれる複数の疾患のそれぞれの患者数と、複数の疾患の少なくとも1つに関連する複数の薬剤のそれぞれの使用量とを含む訓練データを取得することと、訓練データを使用して機械学習を行うことによって、特定の疾患グループに固有のモデルであって、薬剤の使用量を特徴量とし疾患の患者数を目的変数とするモデルを生成することと、を行わせる。【選択図】図5
Description
本発明は、情報処理装置、情報処理方法及びプログラムに関する。
製薬会社が医療施設に対して営業活動を行う際に、各医療施設における疾患ごとの患者数を把握することが有用である。特許文献1には、薬剤の販売量から対象疾患の患者数を推定する技術が記載されている。
特許文献1に記載された技術では、複数の施設全体での対象疾患の患者数を推定可能であるものの、施設ごとの患者数を精度よく推定することは困難であった。本発明の1つの側面は、施設ごとの患者数を精度よく推定するための技術を提供することを目的とする。
一部の実施形態では、情報処理装置であって、命令を記憶するメモリと、1つ以上のプロセッサと、を備え、前記命令は、前記1つ以上のプロセッサによって実行された場合に、前記情報処理装置に、複数の医療施設のそれぞれについて、特定の疾患グループに含まれる複数の疾患のそれぞれの患者数と、前記複数の疾患の少なくとも1つに関連する複数の薬剤のそれぞれの使用量とを含む訓練データを取得することと、前記訓練データを使用して機械学習を行うことによって、前記特定の疾患グループに固有のモデルであって、薬剤の使用量を特徴量とし疾患の患者数を目的変数とするモデルを生成することと、を行わせる、情報処理装置が提供される。
上記手段により、施設ごとの患者数を精度よく推定できる。
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態で説明されている特徴の組み合わせの全てが発明に必須のものとは限らない。実施形態で説明されている複数の特徴のうち二つ以上の特徴は任意に組み合わされてもよい。また、同一若しくは同様の構成には同一の参照番号を付し、重複した説明は省略する。
図1のブロック図を参照して、本発明の一部の実施形態に係る情報処理装置100のハードウェア構成について説明する。情報処理装置100は、特定の疾患グループに含まれる複数の疾患のそれぞれの患者数を医療施設ごとに推定するためのモデルを作成する機械学習(以下、学習フェーズという)と、当該モデルを使用した患者数の推定(以下、推定フェーズという)との両方を実行可能である。以下の実施形態において、特定の疾患の患者とは、特定の疾患を罹患し、実際に医療施設で治療を受けている(例えば、薬剤を摂取している)人のことである。医療施設とは、人に対して医療行為を提供する施設のことであり、例えば病院、クリニック、診療所などを含む。疾患グループとは、関連する複数の疾患で構成されたグループのことである。
情報処理装置100は、例えばパーソナルコンピュータやワークステーション、スマートフォン、タブレットデバイスなどの情報処理装置で実現される。情報処理装置100は、単体の装置で実現されてもよいし、ネットワークを介して相互に接続された複数の装置で実現されてもよい。学習フェーズと推定フェーズとは、同一の情報処理装置100によって行われてもよいし、別個の情報処理装置100によって行われてもよい。
情報処理装置100は、図1に示す各構成要素を有する。プロセッサ101は、情報処理装置100全体の動作を制御する。プロセッサ101は、例えばCPU(Central Processing Unit)や、CPUとGPU(Graphics Processing Unit)との組み合わせなどによって実現される。メモリ102は、情報処理装置100の動作に用いられるプログラムや一時データなどを記憶する。メモリ102は、例えばROM(Read Only Memory)やRAM(Random Access Memory)などによって実現される。
入力装置103は、情報処理装置100のユーザが情報処理装置100への入力を行うために用いられ、例えばマウスやキーボードなどによって実現される。出力装置104は、情報処理装置100のユーザが情報処理装置100からの出力を確認するために用いられ、例えばディスプレイなどの出力装置やスピーカなどの音響装置によって実現される。通信装置105は、情報処理装置100が他の装置と通信する機能を提供し、例えばネットワークカードなどで実現される。他の装置との通信は有線通信であってもよいし、無線通信であってもよい。記憶装置106は、情報処理装置100の処理に使用されるデータを記憶するために用いられ、例えばHDD(Hard Disk Drive)やSSD(Solid State Drive)などによって実現される。
図2のブロック図を参照して、情報処理装置100が学習フェーズを実行するための機能構成について説明する。情報処理装置100は、学習フェーズを実行する場合に、図2に示す機能ブロックを有してもよい。
訓練データ生成部201は、機械学習で使用される訓練データを生成する。機械学習部202は、訓練データ生成部201によって生成された訓練データを使用して機械学習を行うことによって、特定の疾患グループに含まれる複数の疾患のそれぞれの患者数を医療施設ごとに推定するモデルを生成する。図2の機能ブロックの動作の詳細については後述する。
図3のブロック図を参照して、情報処理装置100が推定フェーズを実行するための機能構成について説明する。情報処理装置100は、推定フェーズを実行する場合に、図3に示す機能ブロックを有してもよい。
疾患グループ選択部301は、患者数を推定する対象の疾患グループを選択する。モデル取得部302は、疾患グループ選択部301によって選択された疾患グループに固有のモデルを取得する。このモデルは、学習フェーズで生成されたものであってもよい。薬剤使用量取得部303は、患者数を推定する対象の医療施設における薬剤の使用量を取得する。薬剤の使用は、医療施設における薬剤の投与、医療施設における薬剤の処方、医療施設が発行した処方箋に従う外部施設(例えば、薬局)における薬剤の販売を含むいかなる態様であってもよい。医療施設の付近に位置する外部施設の薬剤の販売量を当該医療施設の薬剤の使用量とみなしてもよい。患者数推定部304は、取得したモデルに個別の医療施設の薬剤の使用量を適用することによって、疾患グループに含まれる複数の疾患のそれぞれについて、当該医療施設の患者数を推定する。図3の機能ブロックの動作の詳細については後述する。
図2及び図3の各機能ブロックは、例えばメモリ102に記憶されたプログラムに含まれる命令をプロセッサ101が実行することによって実現されてもよい。これにかえて、図2及び図3の機能ブロックの少なくとも一部は、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)のような専用集積回路によって実現されてもよい。
図4を参照して、学習フェーズ及び推定フェーズで使用されるデータについて説明する。これらのデータは、記憶装置106に記憶されてもいてもよく、情報処理装置100の各機能ブロックは使用時にこれらのデータを記憶装置106から読み出してもよい。これにかえて、これらのデータは、外部の記憶装置に記憶されていてもよく、情報処理装置100の各機能ブロックは使用時に外部の記憶装置からこれらのデータを受信してもよい。
医療施設データ400は、個別の医療施設における複数の薬剤のそれぞれの使用量と、当該医療施設における複数の疾患のそれぞれの患者数とを表す。医療施設データ400は、例えば医療施設への聞き取り調査や、健保レセプトの分析によって生成されてもよい。医療施設データ400は、医療施設ごとにエントリを有する。
カラム401は、医療施設を一意に識別するための識別子を表す。カラム402は、個別の医療施設における複数の薬剤のそれぞれの使用量を表す。使用量は、有効成分量、総重量、錠数、薬価などのような、使用量に有意な相関を有する任意の量として表されてもよい。カラム403は、各医療施設における複数の疾患のそれぞれの患者数を表す。1人の患者に対して同一種類の薬剤が複数回使用されることがあるため、患者数は典型的には延べ人数である。これにかえて、患者数は実人数で表されてもよい。薬剤の使用量及び患者数は、特定の時間長(例えば、1か月間)における値であってもよい。
医療施設データ400において、薬剤は、いかなる基準で分類されてもよい。例えば、薬剤は、有効成分によって分類されてもよい。この場合に、例えば有効成分が「メトホルミン」であれば、強度(例えば、500mgや250mg)によらず同じ薬剤に分類され、先発薬であるか後発薬であるかによらず同じ薬剤に分類される。有効成分が「メトホルミン」以外(例えば、「エタネルセプト」)であれば、別の薬剤に分類される。薬剤は、有効成分及び強度の組み合わせによって分類されてもよい。この場合に、例えば有効成分が「メトホルミン」であり且つ強度が500mgであれば、先発薬であるか後発薬であるかによらず同じ薬剤に分類される。有効成分が同じ「メトホルミン」であっても、強度が「250mg」であれば、「500mgのメトホルミン」とは別の薬剤に分類される。薬剤は、有効成分、強度及び先後発の組み合わせによって分類されてもよい。この場合に、例えば有効成分が「メトホルミン」であり且つ強度が500mgであり且つ先発薬であれば、同じ薬剤に分類される。「500mgのメトホルミン」であっても、後発薬であれば、先発薬とは別の薬剤に分類される。
疾患は、いかなる粒度で分類されてもよい。例えば、疾患は、ICD(the International Statistical Classification of Diseases and Related Health Problems)‐10コード(例えば、「M600」)に従って分類されてもよいし、関連する複数のICD‐10コードを統合した単位(例えば、「関節リウマチ」)に従って分類されてもよい。
適応症データ410は、薬剤の有効性が確かめられた疾患(いわゆる適応症)を表す。医療施設データ400は、例えば製薬会社や行政機関が提供する情報に基づいて生成されてもよい。適応症データ410は、薬剤ごとにエントリを有する。
カラム411は、薬剤を一意に識別するための識別子を表す。カラム412は、各薬剤の適応症を表す。薬剤Aのように1つの適応症のみを有する薬剤もあれば、薬剤Bのように複数の適応症を有する薬剤もある。以下の説明において、1つの適応症のみを有する薬剤を専用薬剤と呼び、複数の適応症を有する薬剤を汎用薬剤と呼ぶこともある。専用薬剤・汎用薬剤の区別は、疾患の粒度によって変わりうる。カラム412に示される適応症の粒度は、医療施設データ400のカラム403に示される疾患の粒度と同じである。
薬剤使用量データ420は、医療施設における複数の薬剤のそれぞれの使用量を表す。薬剤使用量データ420は、例えば医療施設への聞き取り調査や、調剤レセプトの分析、薬品の売上データの分析によって生成されてもよい。薬剤使用量データ420は、医療施設ごとにエントリを有する。カラム421及びカラム422は、カラム401及びカラム401と同様であるため、説明を省略する。薬剤使用量データ420に含まれる医療施設の各疾患の患者数は不明であるとする。そのため、これらの医療施設について、複数の薬剤の使用量に基づいて各疾患の患者数が推定される。
続いて、図5を参照して、学習フェーズによって作成されるモデル500の一例について説明する。一部の実施形態では、生成されるモデル500は、線形回帰モデルである。これにかえて、ニューラルネットワークなどの他のモデルが使用されてもよい。モデル500の特徴量501は、薬剤の使用量である。特徴量501は、モデル500への入力データである。複数の薬剤のそれぞれの使用量が特徴量501として使用される。モデル500の目的変数503は、疾患の患者数である。モデル500の目的変数503は、モデル500からの出力データである。複数の疾患のそれぞれの患者数が目的変数503として使用される。モデル500のパラメータ502は、特徴量501と目的変数503との間の関係を規定する係数である。パラメータ502は、重みと呼ばれることもある。モデル500では、複数の特徴量501のそれぞれから、複数の目的変数503のそれぞれに個別にパラメータ502が割り当てられる。機械学習部202は、医療施設データ400を訓練データとして使用して機械学習を行うことによって、モデル500のパラメータ502を決定する。
機械学習部202は、疾患グループごとにモデル500を生成する。そのため、モデル500は、疾患グループに固有のモデルであるといえる。例えば、疾患X~疾患Zの3つの疾患で1つの特定の疾患グループが構成されるとする。この場合に、疾患X~Zのそれぞれの患者数を目的変数503とし、疾患X~Zの少なくとも1つに関連する薬剤A~Eのそれぞれの使用量を特徴量501とするモデル(図5のモデル500)が、この特定の疾患グループに固有のモデルとなる。疾患に関連する薬剤とは、例えば図4の適応症データ410で表されるような当該疾患を適応症に含む薬剤であってもよい。
図6は、モデル500を表形式で表した図である。図6のセルが図5の矢印に1対1対応する。例えば、薬剤Aの使用量と疾患Xの患者数との間のパラメータを示すセル601は、図5の矢印504に対応する。
続いて、図7を参照して、情報処理装置100が学習フェーズを実行する動作例について説明する。この動作の開始時に、情報処理装置100が医療施設データ400及び適応症データ410を利用可能であるとする。図7の動作は、情報処理装置100のユーザからの指示に従って開始されてもよい。
ステップS701で、訓練データ生成部201は、疾患グループを特定するための起点となる薬剤(以下、起点薬剤)を選択する。起点薬剤は、情報処理装置100のユーザからの指示に従って選択されてもよい。起点薬剤は、医療施設データ400のカラム402で表される薬剤と同じ分類であってもよいし、その上位又は下位の分類であってもよい。
ステップS702で、訓練データ生成部201は、起点薬剤に関連する複数の疾患を含む疾患グループを特定する。例えば、起点薬剤として「ヒュミラ」が選択された場合に、自己免疫疾患に関連する複数の疾患(関節リウマチ、クローン病など)を含む疾患グループが特定される。ここで特定される複数の疾患は、医療施設データ400のカラム403で表される疾患の粒度と同じであってもよい。起点薬剤に関連する複数の疾患とは、適応症データ410に表されるような起点薬剤の適応症であってもよい。例えば、医療施設データ400のカラム403で表される疾患のうち、疾患X~疾患Zが特定されたとする。
ステップS703で、訓練データ生成部201は、ステップS702で特定された複数の疾患の何れかに関連する薬剤を特定する。ここで特定される複数の薬剤は、医療施設データ400のカラム402で表される薬剤の粒度と同じであってもよい。疾患に関連する薬剤とは、適応症データ410で表される適応症を有する薬剤であってもよい。疾患X~疾患Zについて、医療施設データ400のカラム402で表される薬剤のうち、薬剤A~薬剤Eが特定される。
ステップS704で、訓練データ生成部201は、医療施設データ400から、ステップS702で特定された疾患グループに含まれる複数の疾患のそれぞれの患者数と、ステップS703で特定された複数の薬剤のそれぞれの使用量とを抽出することによって、訓練データを生成する。訓練データにおいて、薬剤の使用量が特徴量となり、疾患の患者数が目的変数となる。
ステップS705で、機械学習部202は、ステップS704で生成された訓練データを使用して機械学習を行うことによって、モデル500を作成する。具体的に、機械学習部202は、モデル500のパラメータ502を決定する。パラメータ502の決定アルゴリズムについては既存のものと同じであってもよいため、詳細な説明を省略する。
上述のステップS701~S705を実行することによって、1つの疾患グループに固有のモデルが生成される。情報処理装置100は、別の疾患グループに固有のモデルを生成するために、上述のステップS701~S705を繰り返し実行してもよい。また、図7の方法では、起点薬剤を使用して疾患グループが特定された。これにかえて、情報処理装置100のユーザによって、1つの疾患グループを構成する複数の疾患が特定されてもよい。
続いて、図8を参照して、情報処理装置100が推定フェーズを実行する動作例について説明する。この動作の開始時に、情報処理装置100がモデル500及び薬剤使用量データ420を利用可能であるとする。図8の動作は、情報処理装置100のユーザからの指示に従って開始されてもよいし、定期的に(例えば、薬剤使用量データ420が更新されるごとに)開始されてもよい。
ステップS801で、疾患グループ選択部301は、推定対象となる疾患を含む疾患グループを選択する。情報処理装置100のユーザからの指示に従って選択されてもよいし、事前の設定に従って選択されてもよい。疾患グループが複数選択された場合に、それぞれの疾患グループに対して以下のステップS802~S804が実行される。このステップで選択される疾患グループは、学習フェーズで生成されたモデルの疾患グループに対応する。
ステップS802で、モデル取得部302は、選択された疾患グループに固有のモデルを取得する。モデルは、情報処理装置100の記憶装置106から読み出されてもよいし、情報処理装置100とは異なる外部の記憶装置から読み出されてもよい。
ステップS803で、薬剤使用量取得部303は、モデルの特徴量として使用される複数の薬剤のそれぞれの使用量を取得する。具体的に、薬剤使用量取得部303は、薬剤使用量データ420のうち、モデルの特徴量として使用されるカラムを抽出する。この医療施設ごとの薬剤の使用量を表す行列をMとする。Mの各行は医療施設に対応し、Mの各列は薬剤の使用量に対応する。
ステップS804で、患者数推定部304は、モデルを使用して医療施設ごと及び疾患ごとの患者数を推定する。モデルを表す行列をWとする。図6に示すように、Wの各行は、薬剤の使用量に対応し、Wの各列は患者数に対応する。患者数の推定値は、M×Wによって算出される。M×Wの各行は、医療施設に対応し、M×Wの各列は、患者数に対応する。
上述の実施形態によれば、個別の医療施設における薬剤の使用量の分布に応じて、精度よく患者数を推定可能である。また、医療施設データ400から、1つの疾患グループに含まれる複数の疾患の患者数と、これらの複数の疾患に関連する薬剤の使用量とを抽出することによって生成された訓練データを使用して機械学習が行われる。そのため、医療施設データ400全体を訓練データとして機械学習を行う場合と比較して、モデルの精度を向上できる。
<第1変形例>
上述の実施形態の変形例について説明する。以下、上述の実施形態との相違点を中心に説明し、説明しない事項については上述の実施形態と同様であってもよい。
上述の実施形態の変形例について説明する。以下、上述の実施形態との相違点を中心に説明し、説明しない事項については上述の実施形態と同様であってもよい。
上述の実施形態では、特定の疾患グループが疾患X~Zで構成され、これらの疾患に関連する薬剤が薬剤A~Eであった。これらの薬剤のうち、一部の薬剤(薬剤B)は疾患X~Zのすべてに関連し、その他の薬剤は疾患X~Zの一部のみに関連する。この変形例で、機械学習部202は、この事前知識を利用して機械学習を行う。
例えば、図9では、モデル500のパラメータ502を示す矢印のうち、個別の薬剤と、複数の疾患のうち当該個別の薬剤に関連しない疾患とを関連付ける矢印を破線で示す。例えば、図4の適応症データ410に示すように、薬剤Aは、疾患X~疾患Zのうち、疾患Xのみに関連する。そのため、薬剤Aから疾患Xに向かう矢印のみが実線で示され、薬剤Aから疾患Y及び疾患Zに向かう矢印が破線で示される。機械学習部202は、機械学習の際に、破線で示されるペアに関連するパラメータにペナルティを課す。例えば、機械学習部202は、これらのパラメータの値を常にゼロにしてもよい。これにかえて、機械学習部202は、これらのパラメータに上限を与えてもよい。
このようにペナルティを課すことによって、機械学習の精度をさらに向上できる。
<第2変形例>
上述の実施形態の変形例について説明する。以下、上述の実施形態との相違点を中心に説明する。説明されない事項については上述の実施形態と同様であってもよい。上述の実施形態では、推定フェーズにおいて、疾患グループが同一であれば、推定対象の複数の医療施設に対して同一のモデル(例えば、モデル500)を使用した。この変形例では、このモデルを医療施設ごとに個別に調整した後に患者数を推定する。以下の説明において、モデル500のように、1つの特定の疾患グループに固有であり、患者数の推定に使用されるモデルをグローバルモデルと呼ぶ。この変形例では、グローバルモデルを調整するためのスペシャルモデルを機械学習によってさらに生成する。図4の適応症データ410に示されるように、薬剤は、専用薬剤(例えば、薬剤A、C、E、G)と、汎用薬剤(例えば、薬剤B、D)とに分類される。この変形例では、この事前知識を利用してスペシャルモデルを生成する。
上述の実施形態の変形例について説明する。以下、上述の実施形態との相違点を中心に説明する。説明されない事項については上述の実施形態と同様であってもよい。上述の実施形態では、推定フェーズにおいて、疾患グループが同一であれば、推定対象の複数の医療施設に対して同一のモデル(例えば、モデル500)を使用した。この変形例では、このモデルを医療施設ごとに個別に調整した後に患者数を推定する。以下の説明において、モデル500のように、1つの特定の疾患グループに固有であり、患者数の推定に使用されるモデルをグローバルモデルと呼ぶ。この変形例では、グローバルモデルを調整するためのスペシャルモデルを機械学習によってさらに生成する。図4の適応症データ410に示されるように、薬剤は、専用薬剤(例えば、薬剤A、C、E、G)と、汎用薬剤(例えば、薬剤B、D)とに分類される。この変形例では、この事前知識を利用してスペシャルモデルを生成する。
学習フェーズにおいて、訓練データ生成部201は、図7のステップS703の後に、1つの特定の疾患グループに含まれる複数の疾患のうちの2つ以上の疾患に関連する1つの汎用薬剤と、この1つの汎用薬剤に関連する2つ以上の疾患の何れか1つのみに関連する1つ以上の専用薬剤とのそれぞれの薬剤の使用量と、この2つ以上の疾患のそれぞれの患者数とを含む訓練データを取得する。この訓練データは、ステップS704で生成された訓練データの部分集合となる。
例えば、上述の実施形態と同様に、特定の疾患グループが疾患X~Zで構成されるとする。まず、訓練データ生成部201は、疾患X~Zのうちの2つ以上の疾患に関連する薬剤B及びDのうちの1つの薬剤Dを選択する。続いて、訓練データ生成部201は、この薬剤Dが関連する疾患Y及びZの何れか1つのみに関連する薬剤C及びEを特定する。訓練データ生成部201は、医療施設データ400から、薬剤C~E並びに疾患Y及びZに対応するカラムを抽出することによって、訓練データを取得する。
その後、機械学習部202は、この訓練データを使用して機械学習を行うことによって、図10に示されるような、薬剤C~Eのそれぞれの使用量を特徴量1001とし、疾患Y及びZのそれぞれの患者数を目的変数1003とするモデル1000を生成する。モデル1000は、上述のスペシャルモデルである。モデル1000のパラメータ1002は、特徴量1001と目的変数1003との間の関係を規定する係数である。モデル1000は線形回帰モデルである。これにかえて、ニューラルネットワークなどの他のモデルが使用されてもよい。モデル1000は、選択された1つの汎用薬剤(上記の例では、薬剤D)に対して生成される。そのため、モデル1000は、1つの汎用薬剤Dに固有のモデルであるといえる。機械学習部202は、別の汎用薬剤Bについても固有のスペシャルモデルを生成できる。
推定フェーズでは、図8のステップS803とステップS804との間に、スペシャルモデルを使用することによって、ステップS802で読み出されたグローバルモデルを調整する。調整方法について、図11を参照して具体的に説明する。図11のモデル500は、上述のように、疾患X~Zで構成された疾患グループに固有のグローバルモデルを表形式で表したものである。モデル500に対応する行列をWとする。また、モデル1100は、汎用薬剤Bに固有のスペシャルモデルを表形式で表したものである。モデル1100に対応する行列をMとする。モデル1000は、汎用薬剤Dに固有のスペシャルモデルを表形式で表したものである。モデル1000に対応する行列をNとする。
患者数推定部304は、患者数を推定する1つの医療施設(薬剤使用量データ420の1つのエントリ)を選択し、選択された特定の医療施設に関して、モデル1100の特徴量として使用される複数の薬剤A~C及びEのそれぞれの使用量を取得する。具体的に、患者数推定部304は、薬剤使用量データ420のうち、モデル1100の特徴量として使用されるカラムを抽出する。この特定の医療施設の薬剤の使用量を表す行ベクトルをUとする。患者数推定部304は、モデル1100を使用して、この特定の医療施設における汎用薬剤Bに関連する疾患X~Zの患者数を推定する。この患者数は、U×Mによって算出される。この推定数を表す列ベクトル1101をPとする(すなわち、P=U×M)。この列ベクトル1101は、1つの特定の医療施設において汎用薬剤Bが使用された複数の疾患X~Zの患者数の比率(Pbx:Pby:Pbz)を表していると考えられる。
そこで、患者数推定部304は、モデル500のうち、汎用薬剤Bの行のパラメータの比率が、列ベクトル1101の患者数の比率に一致するように、モデル500の汎用薬剤Bの行のパラメータを調整する。例えば、患者数推定部304は、汎用薬剤Bと疾患Xとの間の係数Wbxを、Rbx=(Wbx+Wby+Wbz)×Pbx/(Pbx+Pby+Pbz)に置き換える。同様に、患者数推定部304は、モデル500のWby及びWbzをRby及びRbzに置き換える。
また、患者数推定部304は、選択された特定の医療施設に関して、モデル1000の特徴量として使用される複数の薬剤C~Eのそれぞれの使用量を取得する。この特定の医療施設の薬剤の使用量を表す行ベクトルをVとする。患者数推定部304は、モデル1000を使用して、この特定の医療施設における汎用薬剤Dに関連する疾患Y及びZの患者数を推定する。この患者数は、V×Nによって算出される。この推定数を表す列ベクトル1102をQとする。この列ベクトル1102は、1つの特定の医療施設において汎用薬剤Dが使用された複数の疾患Y及びZの患者数の比率(Qdy:Qdz)を表していると考えられる。
そこで、患者数推定部304は、モデル500のうち、汎用薬剤Dの行のパラメータの比率が、列ベクトル1102の患者数の比率に一致するように、モデル500の汎用薬剤Dの行のパラメータを調整する。例えば、患者数推定部304は、汎用薬剤Dと疾患Yとの間の係数Wdyを、Rdy=(Wdy+Wdz)×Qdy/(Qdy+Qdz)に置き換える。同様に、患者数推定部304は、モデル500のWdzをRdzに置き換える。
以上のような調整を行うことによって得られたモデルをモデル1103とする。列ベクトルU及びVは医療施設ごとに異なるため、モデル1103も医療施設ごとに異なる。患者数推定部304は、上述のステップS804において、モデル500の代わりにモデル1103を使用して患者数の推定を行う。
このように汎用薬剤に固有のモデルを使用することによって、患者数の推定の精度をさらに向上できる。
発明は上記の実施形態に制限されるものではなく、発明の要旨の範囲内で、種々の変形・変更が可能である。
100 情報処理装置、500 モデル
Claims (9)
- 情報処理装置であって、
命令を記憶するメモリと、
1つ以上のプロセッサと、を備え、前記命令は、前記1つ以上のプロセッサによって実行された場合に、前記情報処理装置に、
複数の医療施設のそれぞれについて、特定の疾患グループに含まれる複数の疾患のそれぞれの患者数と、前記複数の疾患の少なくとも1つに関連する複数の薬剤のそれぞれの使用量とを含む訓練データを取得することと、
前記訓練データを使用して機械学習を行うことによって、前記特定の疾患グループに固有のモデルであって、薬剤の使用量を特徴量とし疾患の患者数を目的変数とするモデルを生成することと、
を行わせる、情報処理装置。 - 前記複数の疾患は、特定の薬剤に関連する疾患である、請求項1に記載の情報処理装置。
- 前記機械学習において、前記複数の薬剤のうちの個別の薬剤と、前記複数の疾患のうちの当該個別の薬剤に関連しない疾患とを関連付けるパラメータに対してペナルティが課される、請求項1又は2に記載の情報処理装置。
- 前記モデルは第1モデルであり、
前記命令は、前記1つ以上のプロセッサによって実行された場合に、前記情報処理装置に、
前記複数の疾患のうちの2つ以上の疾患に関連する1つの汎用薬剤と、前記1つの汎用薬剤に関連する前記2つ以上の疾患の何れか1つのみに関連する1つ以上の専用薬剤とのそれぞれの薬剤の使用量と、前記2つ以上の疾患のそれぞれの患者数とを含む、前記訓練データの部分集合を取得することと、
前記訓練データの前記部分集合を使用して機械学習を行うことによって、前記1つの汎用薬剤に固有の第2モデルであって、薬剤の使用量を特徴量とし患者数を目的変数とする第2モデルを生成すること、
をさらに行わせる、請求項1乃至3の何れか1項に記載の情報処理装置。 - 情報処理装置であって、
命令を記憶するメモリと、
1つ以上のプロセッサと、を備え、前記命令は、前記1つ以上のプロセッサによって実行された場合に、前記情報処理装置に、
特定の疾患グループに固有のモデルであって、薬剤の使用量を特徴量とし疾患の患者数を目的変数とするモデルを取得することと、
特定の医療施設について、複数の薬剤のそれぞれの使用量を取得することと、
前記特定の医療施設について取得された薬剤の使用量を前記モデルに適用することによって、前記特定の疾患グループに含まれる複数の疾患のそれぞれについて患者数を推定することと、
を行わせる、情報処理装置。 - 前記モデルは第1モデルであり、
前記命令は、前記1つ以上のプロセッサによって実行された場合に、前記情報処理装置に、
前記複数の疾患のうちの2つ以上の疾患に関連する1つの汎用薬剤に固有の第2モデルであって、薬剤の使用量を特徴量とし患者数を目的変数とする第2モデルを取得すること、
前記第2モデルを使用することによって前記第1モデルを調整することと、
をさらに行わせる、請求項5に記載の情報処理装置。 - 請求項1乃至6の何れか1項に記載の情報処理装置の前記1つ以上のプロセッサによって実行される前記命令を含むプログラム。
- 情報処理装置が実行する情報処理方法であって、
複数の医療施設のそれぞれについて、特定の疾患グループに含まれる複数の疾患のそれぞれの患者数と、前記複数の疾患の少なくとも1つに関連する複数の薬剤のそれぞれの使用量とを含む訓練データを取得することと、
前記訓練データを使用して機械学習を行うことによって、前記特定の疾患グループに固有のモデルであって、薬剤の使用量を特徴量とし疾患の患者数を目的変数とするモデルを生成することと、
を有する、情報処理方法。 - 情報処理装置が実行する情報処理方法であって、
特定の疾患グループに固有のモデルであって、薬剤の使用量を特徴量とし疾患の患者数を目的変数とするモデルを取得することと、
特定の医療施設について、複数の薬剤のそれぞれの使用量を取得することと、
前記特定の医療施設について取得された薬剤の使用量を前記モデルに適用することによって、前記特定の疾患グループに含まれる複数の疾患のそれぞれについて患者数を推定することと、
を有する、情報処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021012266A JP7100728B1 (ja) | 2021-01-28 | 2021-01-28 | 情報処理装置、情報処理方法及びプログラム |
US17/216,025 US20220238236A1 (en) | 2021-01-28 | 2021-03-29 | Estimating numbers of patients treated for each of multiple medical conditions based on amounts of medicines administered |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021012266A JP7100728B1 (ja) | 2021-01-28 | 2021-01-28 | 情報処理装置、情報処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7100728B1 true JP7100728B1 (ja) | 2022-07-13 |
JP2022115607A JP2022115607A (ja) | 2022-08-09 |
Family
ID=82399177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021012266A Active JP7100728B1 (ja) | 2021-01-28 | 2021-01-28 | 情報処理装置、情報処理方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20220238236A1 (ja) |
JP (1) | JP7100728B1 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010055303A (ja) * | 2008-08-27 | 2010-03-11 | Denso It Laboratory Inc | 学習データ管理装置、学習データ管理方法及び車両用空調装置ならびに機器の制御装置 |
JP2018092490A (ja) * | 2016-12-06 | 2018-06-14 | アイエムエス ソフトウェア サービシズ リミテッド | 情報処理装置、推定方法及びプログラム |
CN109785003A (zh) * | 2019-01-17 | 2019-05-21 | 四川骏逸富顿科技有限公司 | 一种药品零售行业药品销售预测系统及方法 |
US20200398082A1 (en) * | 2017-11-08 | 2020-12-24 | Shanghai United Imaging Healthcare Co., Ltd. | System and method for diagnostic and treatment |
JP6854955B1 (ja) * | 2020-08-06 | 2021-04-07 | エンサイス株式会社 | 情報処理システム、コンピュータシステム及びプログラム |
JP2021056548A (ja) * | 2019-09-26 | 2021-04-08 | 株式会社インテージヘルスケア | 推定装置、推定システム、推定方法及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8301468B2 (en) * | 2000-05-15 | 2012-10-30 | Optuminsight, Inc. | System and method of drug disease matching |
US7698157B2 (en) * | 2002-06-12 | 2010-04-13 | Anvita, Inc. | System and method for multi-dimensional physician-specific data mining for pharmaceutical sales and marketing |
US9881136B2 (en) * | 2013-10-17 | 2018-01-30 | WellDoc, Inc. | Methods and systems for managing patient treatment compliance |
US20160283921A1 (en) * | 2015-03-26 | 2016-09-29 | Ims Health Incorporated | Data Structures for Plan of Care Related Data |
US20210398676A1 (en) * | 2020-06-19 | 2021-12-23 | Neil Reza Shadbeh Evans | Machine learning algorithms for detecting medical conditions, related systems, and related methods |
-
2021
- 2021-01-28 JP JP2021012266A patent/JP7100728B1/ja active Active
- 2021-03-29 US US17/216,025 patent/US20220238236A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010055303A (ja) * | 2008-08-27 | 2010-03-11 | Denso It Laboratory Inc | 学習データ管理装置、学習データ管理方法及び車両用空調装置ならびに機器の制御装置 |
JP2018092490A (ja) * | 2016-12-06 | 2018-06-14 | アイエムエス ソフトウェア サービシズ リミテッド | 情報処理装置、推定方法及びプログラム |
US20200398082A1 (en) * | 2017-11-08 | 2020-12-24 | Shanghai United Imaging Healthcare Co., Ltd. | System and method for diagnostic and treatment |
CN109785003A (zh) * | 2019-01-17 | 2019-05-21 | 四川骏逸富顿科技有限公司 | 一种药品零售行业药品销售预测系统及方法 |
JP2021056548A (ja) * | 2019-09-26 | 2021-04-08 | 株式会社インテージヘルスケア | 推定装置、推定システム、推定方法及びプログラム |
JP6854955B1 (ja) * | 2020-08-06 | 2021-04-07 | エンサイス株式会社 | 情報処理システム、コンピュータシステム及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20220238236A1 (en) | 2022-07-28 |
JP2022115607A (ja) | 2022-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7346521B2 (en) | System and methods for generating physician profiles concerning prescription therapy practices | |
US11688497B2 (en) | Systems and methods for predictive data analytics | |
AU2002258439A1 (en) | System and methods for generating physician profiles concerning prescription therapy practices | |
Wen et al. | Two approaches to incorporate clinical data uncertainty into multiple criteria decision analysis for benefit-risk assessment of medicinal products | |
US20140229191A1 (en) | Prescription decision support system and method using comprehensive multiplex drug monitoring | |
JP6697621B1 (ja) | 推定装置、推定システム、推定方法及びプログラム | |
JP5724020B1 (ja) | 情報処理装置及びプログラム | |
JP7100728B1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP6771014B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN113066531A (zh) | 风险预测方法、装置、计算机设备及存储介质 | |
JP6995233B1 (ja) | 情報処理システム、コンピュータシステム及びプログラム | |
JP7472226B1 (ja) | 情報処理装置及びプログラム | |
JP6845994B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
Delshad et al. | Adaptive Design of Personalized Dose-Finding Clinical Trials | |
Mankar et al. | Pharmacometrics: Application in Drug Development and Clinical Practice | |
US20150134311A1 (en) | Modeling Effectiveness of Verum | |
JP7511074B1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP6851631B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2021005410A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2020154905A (ja) | 情報処理システム、情報処理装置、情報処理方法及びプログラム | |
Mitroiu et al. | Possible data-generating models of longitudinal continuous outcomes and intercurrent events to investigate estimands | |
Li | Methods in Randomization Based ANCOVA for Novel Crossover Designs and Sensitivity Analysis for Missing Data | |
Sverdlov et al. | Statistical Approaches in the Development of Digital | |
Du et al. | A Simulation Optimization Approach forPrecision Medicine | |
Sverdlov et al. | Statistical Approaches in the Development of Digital Therapeutics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220603 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220701 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7100728 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |