JPWO2014162540A1 - クレンジングデータの管理方法および計算機システム - Google Patents
クレンジングデータの管理方法および計算機システム Download PDFInfo
- Publication number
- JPWO2014162540A1 JPWO2014162540A1 JP2015509791A JP2015509791A JPWO2014162540A1 JP WO2014162540 A1 JPWO2014162540 A1 JP WO2014162540A1 JP 2015509791 A JP2015509791 A JP 2015509791A JP 2015509791 A JP2015509791 A JP 2015509791A JP WO2014162540 A1 JPWO2014162540 A1 JP WO2014162540A1
- Authority
- JP
- Japan
- Prior art keywords
- data
- reliability
- analysis
- correction
- screen
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 131
- 238000013523 data management Methods 0.000 title claims 8
- 238000004458 analytical method Methods 0.000 claims abstract description 305
- 238000012937 correction Methods 0.000 claims description 164
- 238000003860 storage Methods 0.000 claims description 55
- 238000004364 calculation method Methods 0.000 claims description 43
- 238000009826 distribution Methods 0.000 claims description 21
- 238000004891 communication Methods 0.000 claims description 18
- 238000007405 data analysis Methods 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 description 202
- 230000008569 process Effects 0.000 description 104
- 239000003814 drug Substances 0.000 description 76
- 229940079593 drug Drugs 0.000 description 70
- 238000007726 management method Methods 0.000 description 52
- 230000005540 biological transmission Effects 0.000 description 29
- 201000010099 disease Diseases 0.000 description 24
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 24
- 230000007704 transition Effects 0.000 description 23
- 238000012360 testing method Methods 0.000 description 8
- 238000009534 blood test Methods 0.000 description 6
- 230000036541 health Effects 0.000 description 6
- 238000013500 data storage Methods 0.000 description 5
- 239000008280 blood Substances 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000007689 inspection Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000007876 drug discovery Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 229940127557 pharmaceutical product Drugs 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
解析目的に応じたデータ間の関連性における誤りを検出して、解析目的に対するデータの信頼性を明らかにし、解析目的に応じた信頼度のデータを選択可能とする計算機は、様々なデータ間の関連の信頼度の判定パターンを作成する手段と、様々なデータ間の関連の信頼度の判定パターンを保持する手段と、解析目的に応じて信頼度の判定パターンを選択する手段と、選択した判定パターンに応じてデータの信頼度を評価する手段と、データに信頼度を付与して保持する手段と、解析手段あるいは解析結果の評価手段に対して信頼度を付与したデータを表示する手段と、解析目的に応じた信頼度の利用データを選択する手段とを備える。
Description
本発明は、複数の医療関連機関に散在する大量の医療情報を医学研究や創薬に活用する際に、有効な解析を実現するために医療情報のデータクレンジングを行う技術に関する。
特に、医療情報は、人間による入力による表記のゆれや誤記があり、また、穴あき数の多いインバランスな(データの欠損が多い不揃な)大量のデータ群となる特徴がある。こうした特徴のある医療情報から信頼性のある解析結果を得るためには、解析目的に対して有効なデータを選択し、補正等によりデータの有効性を向上するデータクレンジング技術が必要となる。
本技術の医療分野の背景技術として、特開2009−128968号公報(特許文献1)がある。この公報には、「表記が異なるが同じ概念を表す同義語と推定される単語の組を効率よく抽出する。」と記載されており、病名の表記ゆれを修正する技術が開示されている。また、特開2009−247688号公報(特許文献2)がある。この公報には、「各施設間で臨床検査データに生ずる施設間誤差を効率的かつ高精度に補正する。」と記載されており、臨床検査データの施設間誤差を補正する技術が開示されている。
また、医療分野に応用が考えられる他分野の背景技術として、製造分野における特許第4417897号号公報(特許文献3)がある。この特許には、「製造データの一部に欠損がある場合でも欠損値のある集合を解析することで製造データの解析精度を高めることができる。また、説明変数の欠損値が目的変数の値に与える影響を評価することで解析の信頼性を高めることができる。」と記載されている。
上記の医療分野の背景技術(特許文献1、特許文献2)では、医学研究、創薬向けの解析において重要と考えられるデータの関連性に対して、信頼性の評価や補正を行う技術は開示されていない。
また、上記の製造分野の背景技術(特許文献3)では、欠損値に対して解析の信頼性を高める技術が開示されているが、医療分野で考えられる欠損は存在していないがデータ間の関連性において矛盾している情報に対応する技術は開示されていない。
そこで、本発明では、解析目的に応じたデータ間の関連性における誤りを検出して、解析目的に対するデータの信頼性を明らかにし、解析目的に応じた信頼度のデータを選択可能とする技術を開示する。
本発明の医療情報連携システムは、
様々なデータ間の関連の信頼度の判定パターンを作成する手段と、
様々なデータ間の関連の信頼度の判定パターンを保持する手段と、
解析目的に応じて信頼度の判定パターンを選択する手段と、
選択した判定パターンに応じてデータの信頼度を評価する手段と、
データに信頼度を付与して保持する手段と、
解析手段あるいは解析結果の評価手段に対して
信頼度を付与したデータを表示する手段と、
解析目的に応じた信頼度の利用データを選択する手段と、
を備える。
様々なデータ間の関連の信頼度の判定パターンを作成する手段と、
様々なデータ間の関連の信頼度の判定パターンを保持する手段と、
解析目的に応じて信頼度の判定パターンを選択する手段と、
選択した判定パターンに応じてデータの信頼度を評価する手段と、
データに信頼度を付与して保持する手段と、
解析手段あるいは解析結果の評価手段に対して
信頼度を付与したデータを表示する手段と、
解析目的に応じた信頼度の利用データを選択する手段と、
を備える。
データ解析ごとに行っているデータ間の関連に対する信頼度を評価する処理を、本発明により予め行って信頼度を付与することにより、解析効率を向上する。また、本発明により解析に応じたデータ間の関連に対する信頼度を付与して、解析目的に応じた信頼度のデータを選択可能とすることにより、解析結果の精度を向上する。
以下、本発明の実施例について図面を用いて説明する。以下の図中、同一の部分には同一の符号を付加する。
(システム構成)
本実施例における医療情報連携システムの構成を図1に示す。図1に示すシステムは、(1)本発明実施の主体:医療情報の解析サービスをWebサービスとして提供するヘルスケアクラウドデータセンター1、(2)医療データの利用:解析サービスをWeb端末にて医療情報を利用する臨床研究者や市販後調査担当者が所属するP大学病院2及びQ製薬会社3、(3)医療データの管理運用:レセプト情報をデータ化し蓄積したレセプトDBを管理及び運用している医療データセンター4、及び医薬品の効能、用法及び使用上の注意などの情報を集めた医薬品情報DBを管理及び運用している医薬情報センター5、(4)医療データの提供:医療情報を提供する、電子カルテサーバおよび医事会計サーバを備えるA市民病院6およびC大学病院8、電子カルテサーバを備えるB医院7、およびその他多数の医療機関9、といった4つのグループによって構成され、これらセンターなどがネットワーク10によって接続されている。なお、本実施例におけるWeb端末や入力端末は、PCあるいは携帯端末等である。
本実施例における医療情報連携システムの構成を図1に示す。図1に示すシステムは、(1)本発明実施の主体:医療情報の解析サービスをWebサービスとして提供するヘルスケアクラウドデータセンター1、(2)医療データの利用:解析サービスをWeb端末にて医療情報を利用する臨床研究者や市販後調査担当者が所属するP大学病院2及びQ製薬会社3、(3)医療データの管理運用:レセプト情報をデータ化し蓄積したレセプトDBを管理及び運用している医療データセンター4、及び医薬品の効能、用法及び使用上の注意などの情報を集めた医薬品情報DBを管理及び運用している医薬情報センター5、(4)医療データの提供:医療情報を提供する、電子カルテサーバおよび医事会計サーバを備えるA市民病院6およびC大学病院8、電子カルテサーバを備えるB医院7、およびその他多数の医療機関9、といった4つのグループによって構成され、これらセンターなどがネットワーク10によって接続されている。なお、本実施例におけるWeb端末や入力端末は、PCあるいは携帯端末等である。
ヘルスケアクラウドデータセンター1は、外部機関との通信を中継するルータ101およびネットワーク102、Webサービスにて解析サービスを提供するための各種サーバ(Webサーバ201、解析サーバ202、クレンジング(cleansing)サーバ203、DBサーバ204)を備えるブレードサーバ装置103、大容量のデータを格納し高速な入出力を行うことができるストレージ装置104および入出力を中継するネットワーク105を備える。
ここで、「(データ)クレンジング」とは、社会的要因・入力ミスなどにより陳腐化したデータベースを正しいデータにすることである。
P大学病院2は、臨床研究者がWebベースの解析サービスにアクセスするためのWeb端末および外部との通信を中継するルータを備える。
Q製薬会社3は、市販後調査担当者がWebベースの解析サービスにアクセスするためのWeb端末および外部との通信を中継するルータを備える。
医療データセンター4は、レセプトDBを保持するストレージ装置、外部からのレセプトDBへのアクセスに対してアクセス制御や課金処理を行う管理サーバ、内部の通信を中継するネットワークおよび外部との通信時に経由するルータを備える。
医薬情報センター5は、医薬品情報DBを保持するストレージ装置、外部からの医薬品情報DBへのアクセスに対してアクセス制御や課金処理を行う管理サーバ、内部の通信を中継するネットワークおよび外部との通信時に経由するルータを備える。
A市民病院6およびC大学病院8は、医師やメディカルクラークが電子カルテや退院時サマリの入力を行うための入力端末、カルテを電子的に管理する電子カルテサーバ、医事会計処理を支援する医事会計サーバ、退院時サマリ・医事会計システムDBなどの情報を格納するストレージ装置、各装置間の通信を中継するネットワークおよび外部との通信時に経由するルータを備える。
B医院7は、医師らが電子カルテや退院時サマリを入力するための入力端末、カルテを電子的に管理する電子カルテサーバ、各装置間の通信を中継するネットワークおよび外部との通信時に経由するルータを備える。
その他の医療機関9は、A市民病院6、C大学病院8と同様、またはB医院7と同様のシステムを備え、ネットワーク10に接続された多数の医療機関を示す。
(データセンター1の構成)
図1に示したヘルスケアクラウドデータセンター1は、ブレードサーバ装置103及びストレージ装置104で構成されている。図2Aを用いて、ブレードサーバ装置103の詳細な構造を説明し、図2Bを用いて、ストレージ装置104の詳細な構造を説明する。
図1に示したヘルスケアクラウドデータセンター1は、ブレードサーバ装置103及びストレージ装置104で構成されている。図2Aを用いて、ブレードサーバ装置103の詳細な構造を説明し、図2Bを用いて、ストレージ装置104の詳細な構造を説明する。
ブレードサーバ装置103は、外部からの要求を受け内部の各サーバに処理を割り振りその処理結果をWeb画面として外部に応答するWebサーバ201、外部からの要求の内容を解釈してDBサーバ204から必要なデータを抽出し解析を実行して解析結果を作成する解析サーバ202、解析目的に対して抽出されたデータの信頼度の評価および補正データの作成を行うクレンジングサーバ203、内部および外部の各医療関連機関のDB検索を処理するDBサーバ204、ストレージ装置104への入出力を行う際に経由する入出力インタフェース(以下ではI/O I/Fと略記する)206、ブレードサーバ装置内部の管理作業等を行うためのディスプレイ207、マウス208、キーボード209、およびこれらを接続する内部バス205から構成される。
Webサーバ201は、メモリ201a、ディスク201e、通信インタフェース(通信I/F)、I/O I/F、CPUおよびこれらを接続する内部バスから構成される。メモリ201aには、Web端末に表示する画面の遷移を制御する画面制御処理部201b、Web端末に画面を表示する画面表示処理部201c、Web端末からの要求に対し各種サーバに処理を割り振り、結果を収集するプロセスを管理するプロセス管理部201dが格納される。これらのプログラムは、あらかじめ、または可搬型記録媒体からの読み込み、または他装置からのネットワーク102経由のダウンロードにより、ディスク201eに格納され、必要に応じてメモリ201aに転送された後、CPUが実行する。
解析サーバ202は、メモリ202a、ディスク202h、通信インタフェース(通信I/F)、I/O I/F、CPUおよびこれらを接続する内部バスから構成される。メモリ202aには、ユーザが入力した解析内容の文章を解析し名詞や動詞などに分解する形態素解析処理部202b、分解した名詞や動詞からDB検索に用いるキーワードを抽出するキーワード抽出処理部202c、DB検索に用いるキーワードを元にDBへの問合せクエリーを作成するDBクエリー作成処理部202d、DBの検索結果のデータから解析の目標となる値を算出する目標値算出処理部202e、解析結果の元データの信頼度の分布のグラフを表示するためのグラフデータを作成するグラフデータ作成処理部202fおよび解析内容の文章に対応する解析結果の文章を作成する解析結果作成処理部202gが格納される。これらのプログラムは、あらかじめ、または可搬型記録媒体からの読み込み、または他装置からのネットワーク102経由のダウンロードにより、ディスク202hに格納され、必要に応じてメモリ202aに転送された後、CPUが実行する。
クレンジングサーバ203は、メモリ203a、ディスク203d、I/O I/F、CPUおよびこれらを接続する内部バスから構成される。メモリ203aには、医療情報のテーブルに対して属性間の関連の信頼度を算出し付与する信頼度付与処理部203b、医療情報のテーブルに対して属性間の関連の誤りや矛盾を補正するデータを作成する補正データ作成処理部203cが格納される。ディスク203dには、属性間の関連の信頼度を算出する数式やアルゴリズムを格納する信頼度判定パターンDB203e、属性間の関連の誤りや矛盾を補正する数式やアルゴリズムを格納する補正パターンDB203f、信頼度の算出結果を保持する信頼度算出情報テーブル203gが格納される。これらのプログラムやデータは、あらかじめ、または可搬型記録媒体からの読み込み、または他装置からのネットワーク102経由のダウンロードにより、ディスク203dに格納され、必要に応じてメモリ203aに転送された後、CPUが実行する。
DBサーバ204は、メモリ204a、ディスク204d、通信インタフェース(通信I/F)、I/O I/F、CPUおよびこれらを接続する内部バスから構成される。メモリ204aには、データセンター内のDBの操作を行うDB操作処理部204bおよびデータセンター外のDBの検索を行う外部DB検索処理部204cが格納される。これらのプログラムは、あらかじめ、または可搬型記録媒体からの読み込み、または他装置からのネットワーク102経由のダウンロードにより、ディスク204dに格納され、必要に応じてメモリ204aに転送された後、CPUが実行する。
ストレージ装置104は、CPU221、外部からの入出力要求を解釈しストレージ装置104の内部を制御するディスクコントローラ222、ディスクよりも高速な入出力性能を持つキャッシュメモリ223、複数の物理ディスクからなるディスクプール225およびこれらを接続する内部バス224から構成される。キャッシュメモリ223には、データセンター外部のDB(例.医薬品情報DB)の検索結果であるDB検索結果データ223b、グラフを表示するための元データであるグラフデータ223c、医療情報の解析結果である解析結果データ223dが格納される。ディスクプール225には、DB検索結果情報を格納するDB検索結果情報テーブル225bや、DB検索結果に信頼度を付与した情報を格納する信頼度付与DB検索結果情報テーブル225cが格納される。
(処理概要)
図31に本実施例の処理概要を示す。図31には、後述する処理及び図との関連を示す。また、図31に示した実線の矢印は処理(データを含む)の流れ、又は処理が参照することを示し、破線の矢印は利用者が参照することを示す。
(1)様々な信頼度の判定パターンを利用者が作成して保持する。
(2)解析目的に応じて、利用者が信頼度の判定パターンを選択する。
(3)選択した判定パターンに基づいて、図4の解析目的を参照しながら医療データの信頼度を計算する。その際、解析目的からキーワードを抽出して、医療データのDBに対するクエリーを作成して医療データを検索する(図5の501〜504)。
(4)図7に示す信頼度を医療データに付与する(図5の505)。その結果、図6のDB検索結果と図7の信頼度算出情報とが統合されて図8の信頼度付与DB検索結果が得られる。
(5)解析目的に基づいて、信頼度付与DB検索結果を解析して、解析結果を評価し(図5の506〜508)、信頼度を付与したデータを図10及び図11のように表示する(図5の509)。
(6)表示されたデータに対して、対象データ絞込み・補正を行うかどうか、更に、解析内容の絞込みを行うかどうかを利用者が決定した場合は、対象データ絞込み・補正の処理、及び解析内容の絞込みの処理を行う(図3の302〜305)。対象データ絞込み・補正が決定された場合は、上記(3)の処理に戻り、解析内容の絞込みが決定された場合は、上記(1)の処理に戻り、上記と同様の処理を行う。
(7)上記(5)又は(6)の処理の結果得られたデータの中から、解析目的に応じた信頼度の利用データが選択される。
図31に本実施例の処理概要を示す。図31には、後述する処理及び図との関連を示す。また、図31に示した実線の矢印は処理(データを含む)の流れ、又は処理が参照することを示し、破線の矢印は利用者が参照することを示す。
(1)様々な信頼度の判定パターンを利用者が作成して保持する。
(2)解析目的に応じて、利用者が信頼度の判定パターンを選択する。
(3)選択した判定パターンに基づいて、図4の解析目的を参照しながら医療データの信頼度を計算する。その際、解析目的からキーワードを抽出して、医療データのDBに対するクエリーを作成して医療データを検索する(図5の501〜504)。
(4)図7に示す信頼度を医療データに付与する(図5の505)。その結果、図6のDB検索結果と図7の信頼度算出情報とが統合されて図8の信頼度付与DB検索結果が得られる。
(5)解析目的に基づいて、信頼度付与DB検索結果を解析して、解析結果を評価し(図5の506〜508)、信頼度を付与したデータを図10及び図11のように表示する(図5の509)。
(6)表示されたデータに対して、対象データ絞込み・補正を行うかどうか、更に、解析内容の絞込みを行うかどうかを利用者が決定した場合は、対象データ絞込み・補正の処理、及び解析内容の絞込みの処理を行う(図3の302〜305)。対象データ絞込み・補正が決定された場合は、上記(3)の処理に戻り、解析内容の絞込みが決定された場合は、上記(1)の処理に戻り、上記と同様の処理を行う。
(7)上記(5)又は(6)の処理の結果得られたデータの中から、解析目的に応じた信頼度の利用データが選択される。
本実施例では、上記の処理を行うことにより、同じデータに対して、利用者の解析目的に即した解析結果が得られ、更に、得られた解析結果が利用者の解析目的に即していない場合、あるいは解析目的を修正した場合であっても、利用者ごとに異なる解析目的に即した解析結果が得られる。具体的には、本実施例によれば、解析の対象となるデータを絞り込みたい場合、あるいは、解析の条件を変えて解析内容を絞り込みたい場合のいずれであっても解析目的に即した解析結果が得られる。
(画面遷移処理のフロー)
次に、図3を用いて、画面遷移処理部201bによる画面遷移処理の動作を説明する。本処理は、医療情報を利用する際に、P大学病院2やQ製薬会社3のWeb端末に表示する画面の遷移を、ユーザの入力に応じて制御する。
次に、図3を用いて、画面遷移処理部201bによる画面遷移処理の動作を説明する。本処理は、医療情報を利用する際に、P大学病院2やQ製薬会社3のWeb端末に表示する画面の遷移を、ユーザの入力に応じて制御する。
まず、画面遷移処理部201bは画面表示処理部201cに対して、後に図4にて説明する解析内容入力画面400からなる画面301をWeb端末に表示することを指示する。ユーザが画面301にて入力を行うと、画面遷移処理部201bは画面表示処理部201cに対して、後に図10及び図11にて説明する解析経過サマリ表示画面1000及び解析結果表示画面1100からなる画面302をWeb端末に表示することを指示する。
表示された解析結果に対して、利用者の要望を更に反映させたい場合は、以下の処理が行われ、それに伴って表示画面が遷移する。
ユーザが画面302において対象データの絞込みを指示する入力(1108)を行った場合、画面遷移処理部201bは画面表示処理部201cに対して、後に図12にて説明する対象データ絞込み入力画面1200からなる画面303をWeb端末に表示することを指示する。一方、ユーザが画面302において解析内容の絞込みを指示する入力(1110)を行った場合、画面遷移処理部201bは画面表示処理部201cに対して、後に図25にて説明する解析内容絞込み入力画面2500からなる画面304をWeb端末に表示することを指示する。その時、解析経過サマリ表示画面1000(図10)及び解析結果表示画面1100(図11)に対応する図29及び図30が表示される。
ユーザが画面303において補正データ作成ボタン1216を押下すると、画面遷移処理部201bは画面表示処理部201cに対して、後に図21にて説明する対象データ絞込み・補正データ選択画面2100からなる画面305をWeb端末に表示することを指示する。その時、解析経過サマリ表示画面1000(図10)及び解析結果表示画面1100(図11)に対応する図23及び図24が表示される。一方、ユーザが画面303において解析再実行ボタン1217を押下すると、画面遷移処理部201bは画面表示処理部201cに対して、画面302をWeb端末に表示することを指示する。
ユーザが画面305において入力(2140)を行うと、画面遷移処理部201bは画面表示処理部201cに対して、画面302をWeb端末に表示することを指示する。
ユーザが画面304において入力(2502)を行うと、画面遷移処理部201bは画面表示処理部201cに対して、画面302をWeb端末に表示することを指示する。
上記のように、得られた解析結果に対して、対象データの絞込み、あるいは解析内容の絞込みを行うことで、利用者の解析目的に即した解析結果が得られる。
(解析内容入力画面)
次に、図4を用いて、本実施例に関わるグラフィカルユーザインタフェース(以下ではGUIと略記する)の1つであり、ユーザが最初に解析内容(解析目的)を入力する解析内容入力画面401の表示例を説明する。解析内容入力画面401は、Webサーバ201の画面表示処理部201cがネットワーク102、ルータ101およびネットワーク10を介してP大学病院2やQ製薬会社3のWeb端末に表示し、臨床研究者や市販後調査担当者が、Web端末の入出力デバイスを用いて解析内容を入力する画面である。
次に、図4を用いて、本実施例に関わるグラフィカルユーザインタフェース(以下ではGUIと略記する)の1つであり、ユーザが最初に解析内容(解析目的)を入力する解析内容入力画面401の表示例を説明する。解析内容入力画面401は、Webサーバ201の画面表示処理部201cがネットワーク102、ルータ101およびネットワーク10を介してP大学病院2やQ製薬会社3のWeb端末に表示し、臨床研究者や市販後調査担当者が、Web端末の入出力デバイスを用いて解析内容を入力する画面である。
解析内容入力画面401は、解析したい内容の文章を入力する領域402、入力した解析内容による解析の実行を指示するボタン403、解析内容の入力を取り消すボタン404から構成される。ユーザがボタン403を押下すると、Web端末が、領域402に入力された解析内容の文章を、ネットワーク10、ルータ101およびネットワーク102を介してWebサーバ201の画面遷移処理部201bに伝送する。
伝送を受けた画面遷移処理部201bは、図3にて説明したとおり、画面表示処理部201cに対して解析経過サマリ画面および解析結果表示画面からなる画面302をWeb端末に表示することを指示する情報を伝送する。また、画面遷移処理部201bは、プロセス管理部201dに解析内容の文章を伝送する。
伝送を受けた画面表示処理部201cは、プロセス管理部201dからの、解析経過サマリ画面および解析結果表示画面の画面表示に必要な情報の伝送を待ち受ける。
画面遷移処理部201bからの伝送を受けたプロセス管理部201dは、伝送された解析内容の文章を入力とするヘルスケアデータ解析処理を実行し、情報の作成および画面表示処理部201cへの伝送を行う。
プロセス管理部201dから情報の伝送を受けた画面表示処理部201cは、P大学病院2やQ製薬会社3のWeb端末に対して、ネットワーク102、ルータ101およびネットワーク10を介して解析経過サマリ画面および解析結果表示画面からなる画面302を表示する。画面302の各画面の詳細は、後の図10および図11にて説明する。
(ヘルスケアデータ解析の処理フロー)
次に、図5を用いて、Webサーバ201のプロセス管理部201dによるヘルスケアデータ解析処理の動作を説明する。プロセス管理部201dは、図2に示した各処理部と連携して処理全体の流れを制御する。
次に、図5を用いて、Webサーバ201のプロセス管理部201dによるヘルスケアデータ解析処理の動作を説明する。プロセス管理部201dは、図2に示した各処理部と連携して処理全体の流れを制御する。
まず、プロセス管理部201dは、解析内容の文章を解析サーバ202の形態素解析処理部202bに伝送する。形態素解析処理部202bは、伝送された解析内容の文章を名詞、動詞、形容詞などに分解し、キーワード抽出処理部202cに伝送する(形態素解析処理501)。
分解された語句の伝送を受けたキーワード処理部202cは、分解された語句の中からヘルスケア関連のDBの検索に有用なキーワードを選択し、DBクエリー作成処理部202dに伝送する(キーワード抽出処理502)。
DBクエリー作成処理部202dは、選択したキーワードに基づき有用なDBを選択し、選択したDBへのアクセスの規定に則ったDBクエリーを作成し、Webサーバ201のプロセス管理部201dへ、選択したDBの識別子とDBクエリーを伝送する(DBクエリー作成処理503)。
DBの識別子とDBクエリーの伝送を受けたプロセス管理部201dは、DBの識別子が示すDBがヘルスケアクラウドデータセンター内にある場合、DBサーバ204のDB操作処理部204bへDBの識別子とDBクエリーを伝送し、一方、DBの識別子が示すDBがヘルスケアクラウドセンター外のDBである場合、DBサーバ204の外部DB検索処理部204cへDBの識別子とDBクエリーを伝送する。DB操作処理部204bあるいは外部DB検索処理部204cは、DBの識別子とDBクエリーの伝送を受けると、DBの識別子が示すDBに対してDBクエリーを発行し、DBクエリーに対する検索結果の情報(例.テーブル)をストレージ装置104のキャッシュメモリ223あるいはディスクプール225に格納し、Webサーバ201のプロセス管理部201dへ、DBクエリーに対する検索結果の情報(以降、DB検索結果情報、と略す)の格納先のアドレスを伝送する(DB検索処理504)。なお、DB検索結果情報の具体例は後の図6にて説明する。
DB検索結果情報の格納先アドレスの伝送を受けたプロセス管理部201dは、同アドレスをクレンジングサーバ203の信頼度付与処理部203bへ伝送する。信頼度付与処理部203bは、同アドレスの伝送を受けると、DB検索結果情報に対して後に図9にて説明する信頼度付与処理を行い、信頼度付与後のDB検索結果情報(以降、信頼度付与DB検索結果情報、と略す)をストレージ装置104のキャッシュメモリ223あるいはディスクプール225に格納し、Webサーバ201のプロセス管理部201dへ、信頼度付与DB検索結果情報の格納先のアドレスを伝送する(信頼度付与処理505)。なお、信頼度付与DB検索結果情報の具体例は後の図8にて説明する。
信頼度付与DB検索結果情報の格納先アドレスの伝送を受けたプロセス管理部201dは、同アドレスを解析サーバ202の目標値算出処理部202eへ伝送する。目標値算出処理部202eは、同アドレスの伝送を受けると、信頼度付与DB検索結果情報から、解析結果を代表する数値の条件(例.疾病A患者に薬剤Xを投与した場合の平均入院期間)に該当する対象データを絞込み、対象データから解析結果を代表する数値(以下、解析目標値、と略す)を算出し、解析目標値と対象データのペアをキャッシュメモリ223に格納する。このペアは、単数あるいは複数となる。解析目標値と対象データのペアの格納先アドレスをグラフデータ作成処理部202fへ伝送する(目標値算出処理506)。
解析目標値と対象データのペアの格納先アドレスの伝送を受けたグラフデータ作成処理部202fは、同アドレスの解析目標値および対象データの信頼度の分布を示すグラフを表示するためのグラフデータ(例.CSV形式データ(データをカンマで区切って並べたファイル形式)、グラフの種類及び軸を定義するデータ)を作成し、ストレージ装置104のキャッシュメモリ223に格納し、グラフデータの格納先アドレスをWebサーバ201のプロセス管理部201dへ伝送する(グラフデータ作成処理507)。
グラフデータの格納先アドレスの伝送を受けたプロセス管理部201dは、解析目標値を格納先アドレスから読み出し、解析目標値および解析内容の文章を解析サーバ202の解析結果作成処理部202gへ伝送する。解析結果作成処理部202gは、解析内容の文章と解析目標値を入力とし、解析結果の文章データを作成してキャッシュメモリ223に格納し、解析結果の文章データの格納先アドレスを、Webサーバ201のプロセス管理部201dへ伝送する(解析結果作成処理508)。
解析結果の文章データの格納先アドレスの伝送を受けたプロセス管理部201dは、解析内容の文章、選択したDBの識別子、解析結果の文章、解析目標値および対象データの信頼度の分布を示すグラフデータを画面表示処理部201cへ伝送し(解析結果表示処理509)、ヘルスケアデータ解析処理を終了する。
上記の処理により、利用者の解析目的の即した、信頼度付きの解析結果が得られる。
(信頼度付与処理に関するデータ構造)
次に、図6〜図8を用いて、本実施例の信頼度付与処理505に関するデータ構造を説明する。
次に、図6〜図8を用いて、本実施例の信頼度付与処理505に関するデータ構造を説明する。
図6は、図5のDB検索処理504の出力であるDB検索結果情報の例であるDB検索結果情報テーブル225bのデータ構造である。DB検索結果情報テーブル225bは、配列構造を成し1以上のレコードを格納可能である。DB検索結果情報テーブル225bの各レコードは、入院患者が入院している医療機関の名称である病院名601、入院患者の医療機関内での識別情報である入院患者ID602、入院患者の入院日を記録する入院日603、入院患者の退院日を記録する退院日604、入院患者の病名を記録する疾病名605、及び入院患者に投与された薬剤の名称を記録する薬剤名606から構成される。
例えば、レコード611は、病院名「A市民病院」に入院した入院患者ID「1」の入院患者は、入院日「2012/1/4」に入院して退院日「2012/2/3」に退院し、病名は疾病名「A」であり、入院中に投与された医薬品は薬剤名「X」であったことを表す。
図7は、図9の信頼度付与処理の中で使用される信頼度算出結果情報の例である信頼度算出情報テーブル203gのデータ構造である。図7は、図6のDB検索結果情報に基づいて、病院ごとに入退院日の記載の信頼度を後述する判定ロジックにより算出した結果である。信頼度算出情報テーブル203gは、配列構造を成し、1以上のレコードを格納可能である。信頼度算出情報テーブル203gの各レコードは、病院名601、および入退院日の信頼度をパーセンテージで表す入退院日の信頼度(%)701から構成される。
本実施例に置ける入退院日の信頼度は、次の計算式『入退院日の信頼度DB(%)=100×(1−(DB検索結果情報テーブル225bにおいて病院名が同じレコード群の中で入院日よりも退院日が古い誤記のあるレコード数)÷(DB検索結果情報テーブル225bにおいて病院名が同じレコード数))』にて算出した。即ち、信頼度は、対象となる全レコード数に対する、誤記のないレコード数の割合である。
例えば、レコード711は、病院名「A市民病院」の病院のレコード群においては、入退院日よりも退院日が古い誤記のあるレコードが無く、この誤記の定義において入退院日の信頼度(%)「100」であることを表す。また、レコード712は、病院名「B医院」の病院のレコード群においては、入退院日の信頼度(%)「80」であり、上記定義の誤記のレコードが20%存在することを表す。なお、信頼度の計算は任意の評価関数、又はアルゴリズムでもよい。
図8は、図5の信頼度付与処理505の出力である信頼度付与DB検索結果情報の例である信頼度付与DB検索結果情報テーブル225cのデータ構造である。図8は、図6のDB検索結果と図7の信頼度算出情報を統合した結果である。信頼度付与DB検索結果情報テーブル225cは、DB検索結果情報テーブル225bと信頼度算出情報テーブル700の自然結合をとる操作から得られる。
自然結合をとる操作のSQL文の例は、『SELECT DB検索結果情報テーブル225b.*,入退院日の信頼度(%) FROM DB検索結果情報テーブル225b,信頼度算出情報テーブル203g WHERE DB検索結果情報テーブル225b.病院名=信頼度算出情報テーブル203g.病院名』である。
クレンジングサーバ203の信頼度付与処理部203bが、前記SQL文を、DBサーバ204のDB操作処理部204bに伝送し、DB操作処理部204bがSQL文を実行することにより信頼度付与DB検索結果情報テーブル225cを得る。
信頼度付与DB検索結果情報テーブル225cは、配列構造を成し1以上のレコードを格納可能である。信頼度付与DB検索結果情報テーブル225cの各レコードは、病院名601、入院患者ID602、入院日603、退院日604、疾病名605、薬剤名606、および入退院日の信頼度(%)701から構成される。
例えば、レコード811は、病院名「A市民病院」に入院した入院患者ID「1」の入院患者は、入院日「2012/1/4」、退院日「2012/2/3」と記録されており、病名は疾病名「A」、入院中に投与された医薬品は薬剤名「X」であり、入退院日の記録に誤記がないことの信頼度は、入退院日の信頼度(%)「100」であることを表す。また、レコード812は、病院名「B医院」に入院した入院患者ID「1」の入院患者は、入院日「2012/4/5」、退院日「2012/4/3」と記録されており、病名は疾病名「A」、入院中に投与された医薬品は薬剤名「X」であり、入退院日の記録に誤記がないことの信頼度は、入退院日の信頼度(%)「80」であることを表す。
信頼度に基づいて、解析の対処とすべきデータ、あるいはデータの提供先などを決めることができる。
(信頼度付与の処理フロー)
次に、図9を用いて、クレンジングサーバ203の信頼度付与処理部203bによる信頼度付与処理505の動作を説明する。まず、信頼度付与処理部203bは、プロセス管理部201dが伝送したDB検索結果情報の格納先アドレスからDB検索結果情報テーブル225bを構成する属性を用いた、信頼度の判定パターンを選択する。本実施例は、信頼度付与処理部203bが、ディスク203dの信頼度判定パターンDB203eから、解析内容の文章にある『平均入院期間』の算出に必要な属性である入院日603と退院日604の信頼度を判定するための、前記の計算式『入退院日の信頼度DB(%)=100 ×(1−(DB検索結果情報テーブル600において病院名が同じレコード群の中で入院日603よりも退院日604の日付が古い誤記のあるレコード数)÷(DB検索結果情報テーブル225bにおいて病院名が同じレコード数))』による判定パターンを選択した例である(判定パターン選択処理901)。
次に、図9を用いて、クレンジングサーバ203の信頼度付与処理部203bによる信頼度付与処理505の動作を説明する。まず、信頼度付与処理部203bは、プロセス管理部201dが伝送したDB検索結果情報の格納先アドレスからDB検索結果情報テーブル225bを構成する属性を用いた、信頼度の判定パターンを選択する。本実施例は、信頼度付与処理部203bが、ディスク203dの信頼度判定パターンDB203eから、解析内容の文章にある『平均入院期間』の算出に必要な属性である入院日603と退院日604の信頼度を判定するための、前記の計算式『入退院日の信頼度DB(%)=100 ×(1−(DB検索結果情報テーブル600において病院名が同じレコード群の中で入院日603よりも退院日604の日付が古い誤記のあるレコード数)÷(DB検索結果情報テーブル225bにおいて病院名が同じレコード数))』による判定パターンを選択した例である(判定パターン選択処理901)。
判定パターン選択処理901の結果、必要な判定パターンが信頼度判定パターンDB203eに存在する場合は信頼度判定処理904を実行し、必要な判定パターンが存在しない場合は、必要な任意の評価関数やアルゴリズムのライブラリと組み合わせる判定パターン作成処理903を行い、利用者が必要な信頼度の判定パターンを作成して選択する(判定処理902)。
処理901〜903により信頼度の判定パターンが決定すると、信頼度処理部203bは、選択した信頼度の判定パターンの信頼度を算出し、算出結果をディスク203dに格納する。図7として説明した信頼度算出情報テーブル203gは、判定パターンとして前記の計算式『入退院日の信頼度DB(%)=100×(DB検索結果情報テーブル225bにおいて病院名が同じレコード群の中で入院日603よりも退院日604の日付が古い誤記のあるレコード数)÷(DB検索結果情報テーブル600において病院名が同じレコード数)』を選択した場合の、信頼度判定処理結果の例である(信頼度判定処理904)。
信頼度算出情報テーブル203gがディスク203dに格納されると、信頼度付与処理部203bはDB検索結果情報テーブル225bに、算出した信頼度の情報を付与する。本実施例では、DB検索結果情報テーブル225bと信頼度算出情報テーブル203gの自然結合をとる操作により、信頼度付与DB検索結果情報テーブル225cを得た。前記のとおり、自然結合をとる操作のSQL文の例は、『SELECT DB検索結果情報テーブル225b.*,入退院日の信頼度(%) FROM DB検索結果情報テーブル225b,信頼度算出情報テーブル203g WHERE DB検索結果情報テーブル225b.病院名=信頼度算出情報テーブル203g.病院名』である。
クレンジングサーバ203の信頼度付与処理部203bが、前記SQL文を、DBサーバ204のDB操作処理部204bに伝送し、DB操作処理部204bがSQL文を実行することにより信頼度付与DB検索結果情報テーブル225cを得る。なお、信頼度の付与の方法は信頼度の判定パターンに依存するため、信頼度の判定パターンに応じた任意の方法でもよい(信頼度データ追加処理905)。信頼度付与処理部203gは、信頼度付与DB検索結果情報テーブル225cをストレージ装置104のディスクプール225に格納した後、処理を終了する。
(解析経過の画面表示例)
次に、図10を用いて、本実施例に関わるGUIのうち、一連の解析の内容と結果を一覧表示する解析経過サマリ表示画面1000の表示例を説明する。解析経過サマリ表示画面1000は、Webサーバ201の画面表示処理部201cがネットワーク102、ルータ101およびネットワーク10を介してP大学病院2やQ製薬会社3のWeb端末に表示し、臨床研究者や市販後調査担当者が、Web端末のディスプレイにより参照する画面である。現在の解析結果のみを表示するのではなく、それまでに行った解析経過サマリを表示することで、利用者は、これらの情報を、解析結果に対する問題点の把握、解析目的の見直しなどに役立てることができる。
次に、図10を用いて、本実施例に関わるGUIのうち、一連の解析の内容と結果を一覧表示する解析経過サマリ表示画面1000の表示例を説明する。解析経過サマリ表示画面1000は、Webサーバ201の画面表示処理部201cがネットワーク102、ルータ101およびネットワーク10を介してP大学病院2やQ製薬会社3のWeb端末に表示し、臨床研究者や市販後調査担当者が、Web端末のディスプレイにより参照する画面である。現在の解析結果のみを表示するのではなく、それまでに行った解析経過サマリを表示することで、利用者は、これらの情報を、解析結果に対する問題点の把握、解析目的の見直しなどに役立てることができる。
解析経過サマリ表示画面1000は、配列構造を成し、1以上のレコードを表示可能である。各レコードは、解析の順番を表示するNo.(1001)、解析内容の文章を表示する解析内容1002、対象データの絞込み内容を表示するデータ絞込み1003、対象データのレコード数を表示するレコード数1004、解析結果の文章を表示する解析結果1005から構成される。
例えば、レコード1011は、解析順序がNo「1」番目の解析内容が「疾病A患者の平均入院期間は、薬剤Xをしようした場合と、薬剤Yを使用した場合のどちらが短いか?」においては、解析におけるデータの絞込みは行ないデータの絞込み「−」の条件で対象データの規模を示すレコード数は「253143」であり、解析結果は「薬剤Yを使用した場合の方が、平均入院期間が短い(X:35日、Y:27日)」であったことを表す。
次に、図11を用いて、本実施例に関わるGUIのうち、最新の解析結果を詳細に表示する解析結果表示画面1100の表示例を説明する。解析結果表示画面1100は、Webサーバ201の画面表示処理部201cがネットワーク102、ルータ101およびネットワーク10を介してP大学病院2やQ製薬会社3のWeb端末に表示し、臨床研究者や市販後調査担当者が、Web端末により入出力を行う画面である。
解析結果表示画面1100は、解析の対象データの検索元を表示する領域1101、薬剤別の対象データの信頼度分布を表示する領域1102および領域1103、薬剤別に解析目標値である平均入院期間の算出値を表示する領域1104および1105、対象データのうち、解析目標値の算出に使用する使用データの信頼度の範囲の下限を表示する領域1106、同上限を表示する領域1107、ユーザが対象データのうち使用するデータの絞込みあるいは補正を実行する際に押下し、後に図12で説明する対象データ絞込み入力画面入力の表示の契機となるボタン1108、解析結果の文章を表示する領域1109、およびユーザが解析内容を絞込む際に押下し、後に図25で説明する解析内容絞込み入力画面の表示の契機となるボタン1110から構成される。
例えば、図11の表示例は、解析の対象データの検索元が対象データ「退院時サマリDB」であり、薬剤Xの平均入院期間が「35日」、その算出に使用したデータの信頼度分布が領域1102に示したグラフであり、薬剤Yの平均入院期間が「27日」、その算出に使用したデータの信頼度分布が領域1103に示したグラフであり、対象データのうち使用したデータの信頼度の範囲は「0%」〜「100%」、すなわち全てであり、解析結果の文章が「薬剤Yを使用した場合の方が、平均入院期間が短い」であったことを表す。
以下では、図10に示した解析経過、及び図11に示した解析結果が表示された後で、利用者が、画面中の種々の操作ボタンを押したときに起動される処理及び表示される画面について説明する。操作ボタンに対応して起動される以下の処理では、図5に示した処理ステップの一部と同じ処理が実行される。その場合は、図5のステップと同じ符号を処理フロー中に記載する。
(対象データ絞込みの画面表示例)
図12を用いて、本実施例に関わるGUIのうち、対象データの絞込み条件を入力する対象データ絞込み入力画面1200の表示例を説明する。対象データ絞込み入力画面1200は、ユーザがP大学病院2やQ製薬会社3のWeb端末において図11に示した解析結果表示画面1100の対象データ絞込み・補正ボタン1108を押下すると、押下したという情報をWeb端末がネットワーク10およびルータ101およびネットワーク102を介してWebサーバ201の画面遷移処理部201bに伝送し、伝送を受けた画面遷移処理部201bが画面表示処理部201cに対して対象データ絞込み入力画面1200をWeb端末に表示する指示を伝送し、指示の伝送を受けた画面表示処理部201cがネットワーク102、ルータ101およびネットワーク10を介してP大学病院2やQ製薬会社3のWeb端末に表示し、臨床研究者や市販後調査担当者が、Web端末により入出力を行う画面である。
図12を用いて、本実施例に関わるGUIのうち、対象データの絞込み条件を入力する対象データ絞込み入力画面1200の表示例を説明する。対象データ絞込み入力画面1200は、ユーザがP大学病院2やQ製薬会社3のWeb端末において図11に示した解析結果表示画面1100の対象データ絞込み・補正ボタン1108を押下すると、押下したという情報をWeb端末がネットワーク10およびルータ101およびネットワーク102を介してWebサーバ201の画面遷移処理部201bに伝送し、伝送を受けた画面遷移処理部201bが画面表示処理部201cに対して対象データ絞込み入力画面1200をWeb端末に表示する指示を伝送し、指示の伝送を受けた画面表示処理部201cがネットワーク102、ルータ101およびネットワーク10を介してP大学病院2やQ製薬会社3のWeb端末に表示し、臨床研究者や市販後調査担当者が、Web端末により入出力を行う画面である。
対象データ絞込み入力画面1200は、対象データを選択するラジオボタン1201、解析の対象データの検索元を表示する領域1101、薬剤別の対照データの信頼度分布を表示する領域1211および領域1212、解析目標値の算出に使用する使用データの信頼度の範囲の下限を指定する領域1214、同上限を指定する領域1215、ユーザが対象データの補正を実行する際に押下し、後に図13で説明する補正データ反映処理の開始の契機となる補正データ作成ボタン1216、指定した対象データに対して信頼度の範囲設定による対象データの絞込みを実施し解析を再実行することを指示する解析再実行ボタン1217および指定した内容を消去するクリアボタン1218から構成される。例えば、図12の表示例では、対象データとして「退院時サマリDB」を選択した場合の薬剤Xおよび薬剤Yの信頼度の分布が領域1211および1212に示すグラフのとおり、概ね信頼度50%〜100%の間に主に分布することを表す。
(補正データ反映の処理フロー)
次に、図13を用いて、Webサーバ201のプロセス管理部201dによる補正データ反映処理の動作例を説明する。補正データ反映処理は、図12の補正データ作成ボタン1216が押されたときに起動される。本実施例における補正データは、解析目標値の算出に使用する使用データの信頼度の範囲の下限(1214)及び上限(1215)を変更したものである。
次に、図13を用いて、Webサーバ201のプロセス管理部201dによる補正データ反映処理の動作例を説明する。補正データ反映処理は、図12の補正データ作成ボタン1216が押されたときに起動される。本実施例における補正データは、解析目標値の算出に使用する使用データの信頼度の範囲の下限(1214)及び上限(1215)を変更したものである。
まず、プロセス管理部201dは、信頼度付与DB検索結果情報テーブル225cの格納先アドレス、信頼度付与に用いた信頼度判定パターンの識別子および補正データの作成の指示を、クレンジングサーバ203の補正データ作成処理部203cへ伝送する。伝送を受けた補正データ作成処理部203cは、後の図14にて説明する補正データ作成処理を行って補正データを作成し、補正データの格納先アドレスをプロセス管理部201dへ伝送する(補正データ作成処理1301)。
補正データの格納先アドレスの伝送を受けたプロセス管理部201dは、補正データの格納先アドレスをクレンジングサーバ203の信頼度付与処理部203bへ伝送する。信頼度付与処理部203bは、補正データに対し、図9にて説明した信頼度付与処理505を実行して、補正データの信頼度を算出して補正データに付与し、信頼度付与補正データテーブルとして格納し、その格納先アドレスをWebサーバ201のプロセス管理部201dへ伝送する(信頼度付与処理505)。
信頼度付与補正データテーブルの格納先アドレスの伝送を受けたWebサーバ201のプロセス管理部201dは、同アドレスを解析サーバ202のグラフデータ作成処理部202fへ伝送する。伝送を受けたグラフデータ作成処理部202fは、信頼度付与補正データテーブルの対象データの信頼度の分布を示すグラフを表示するためのグラフデータ(例.CSV形式データ、グラフの種類及び軸を定義するデータ)を作成し、ストレージ装置104のキャッシュメモリ223に格納し、グラフデータの格納先アドレスをWebサーバ201のプロセス管理部201dへ伝送する(グラフデータ作成処理507)。
グラフデータの格納先アドレスの伝送を受けたプロセス管理部201dは、グラフデータを画面表示処理部201cへ伝送する。伝送を受けた画面表示処理部201cは、後に図21にて説明する対象データ絞込み・補正データ選択画面2100の情報を作成し、ネットワーク102、ルータ101およびネットワーク10を介して、P大学病院2やQ製薬会社3のユーザのWeb端末へ伝送し(データ絞込み画面表示処理1302)、補正データ反映処理を終了する。
(補正データ作成の処理フロー)
次に、図14を用いて、クレンジングサーバ203の補正データ作成処理部203cによる補正データ作成処理(1301)の動作例を説明する。
次に、図14を用いて、クレンジングサーバ203の補正データ作成処理部203cによる補正データ作成処理(1301)の動作例を説明する。
まず、補正データ作成処理部203cは、Webサーバ201のプロセス管理部201dから信頼度付与DB検索結果情報テーブル225cの格納先アドレス、信頼度付与に用いた信頼度判定パターンの識別子および補正データの作成の指示の伝送を受けると、信頼度判定パターンDB203eから信頼度付与に用いられた信頼度判定パターンを、識別子により特定し、その信頼度判定パターンにより誤記と判定される信頼度付与DB検索結果情報テーブル225cのレコードを特定して複製し、後に図15で説明する補正対象データテーブル1500としてストレージ装置104のキャッシュメモリ223に格納する。
補正データ作成処理部203cは、補正対象データテーブル1500の属性をキーとし、補正パターンDB203fから、補正に必要な属性を備えたDBの候補、およびそのDBの情報を利用する際の補正パターンのペアを選択する。本実施例は、補正データ作成処理部203cが、補正に必要な属性を備えたDBの候補として、後に図16にて説明する医療データセンター4のレセプトDB1600と、後に図17にて説明するA市民病院6およびC大学病院8の医事会計システムDB1700を選択した例である。レセプトDBの補正パターンとしては、後に図16で示すレセプトDB検索結果情報テーブル1600と補正対象データテーブル1500の属性の定義の差異を補正する『図16の「診療開始日」を「入院日」とみなし、図16の「診察開始日」に「診療実日数」を加えた日付を「退院日」とみなす』という補正パターンを選択する。また、医事会計システムDBの補正パターンとして、後に図17で示す医事会計システムDB検索結果情報テーブル1700と補正対象データテーブル1500の属性の定義が同一のため『補正処理不要』という補正パターンを選択する(補正パターン選択処理1401)。
補正パターン選択処理1401の結果、必要な補正パターンがあるかどうかを判定し(1402)、必要な補正パターンが補正パターンDB203fに存在する場合は補正パターン適用処理1404を実行し、必要な補正パターンが存在しない場合は、補正に利用するDBと組み合わせる補正の方法を作成し、補正パターンDB203fに追加する補正パターン作成処理1403を行った上で、必要な補正パターンを作成選択する(判定処理1402、補正パターン作成処理1403)。
補正データ作成処理部203cは、処理1401〜1403により決定したDBの候補と各DBの補正パターンごとに、補正対象データテーブル1500の「入院日」および「退院日」の補正データを抽出し、補正対象データテーブル1500の当該レコードを更新し、補正対象データテーブル1500とは別にキャッシュメモリ223上に格納する。本実施例では、医療データセンター4のレセプトDBの情報を用いた補正結果であるレセプトDB補正パターン結果データテーブルと、A市民病院6およびC大学病院8の医事会計システムDBの情報を用いた補正結果である医事会計システムDB補正パターン結果データテーブルの2つが、キャッシュメモリ223上に格納される(補正パターン適用処理1404)。
補正パターン適用処理1404が完了すると、補正データ作成処理部203cは、各補正結果のテーブルごとに、信頼度付与DB検索結果情報テーブル225cの同一レコードを更新したテーブルを作成し、ストレージ装置104のディスクプール225に格納する。本実施例では、補正データ作成処理部203cは、レセプトDB補正パターン結果データテーブルの情報を信頼度付与DB検索結果情報テーブル225cの同一レコードと置き換えたレセプトDB補正結果情報テーブルと、医事会計システムDB補正パターン結果データテーブルの情報を信頼度付与DB検索結果情報テーブル225cの同一レコードと置き換えた医事会計システムDB補正結果情報テーブルの2つを作成し、ストレージ装置225cのディスクプールに格納し、格納先のアドレスをWebサーバ201のプロセス管理部201dに伝送し(補正データ追加処理1405)、補正データ作成処理を終了する。
(補正データ作成処理に関するデータ構造)
次に、図15〜図17を用いて、本実施例の補正データ作成処理に関するデータ構造を説明する。
次に、図15〜図17を用いて、本実施例の補正データ作成処理に関するデータ構造を説明する。
図15は、図14の補正パターン選択処理1401において作成される補正対象データテーブル1500のデータ構造である。補正対象データは、例えば、図15のように入院日と退院日の日付の順序が逆転している、矛盾のあるデータである。補正対象データテーブル1500は、図6にて説明したDB検索結果情報テーブルと同一の構造を成し、図9の信頼度付与処理にて誤記と判定されたレコードから構成される。たとえば、レコード612、レコード613およびレコード614は、入院日よりも退院日の日付が古いため、図9の信頼度付与処理において誤記のあるレコードとして判定されたレコードを表す。
図16は、図14の補正パターン選択処理1401において用いられる、医療情報センター4のレセプトDBを補正対象データテーブル1500の属性601〜606をキーとして類似検索した結果であるレセプトDB検索結果情報テーブル1600のデータ構造である。レセプトDB検索結果情報テーブル1600は、図6に示したDB検索結果情報テーブル225bと類似の配列構造を成し、1以上のレコードを格納可能である。
レセプトDB検索結果情報テーブル1600の各レコードは、図6にて説明したDB検索結果情報テーブルと同一の病院名601、患者ID602、疾病名605、薬剤名606に加え、医科入院レセプトデータにおいて入院日を示す診療開始日1601と、入院期間を示す診療実日数1602から構成される。例えば、レコード1611は病院名「A市民病院」の病院に入院した患者ID「1」の患者が、診療を開始した日付が診療開始日「2012/1/4」であり、診療に要した実日数が診療実日数「30」であり、患者の病名は疾病名「A」であり、投与された医薬品名は薬剤名「X」であることを表す。
図17は、図14の補正パターン選択処理1401において用いられる、A市民病院6およびC大学病院8の医事会計システムDBを補正対象データテーブル1500の属性601〜606をキーとして類似検索した結果である医事会計システムDB検索結果情報テーブル1700のデータ構造である。医事会計システムDB検索結果情報テーブル1700は、配列構造を成し、1以上のレコードを格納可能である。医事会計システムDB検索結果情報テーブル1700の各レコードは、図6にて説明したDB検索結果情報テーブルと同一の属性601〜606から構成され、各レコードは図6と同一の意味を表す。
(補正データ反映処理に関するデータ構造)
次に、図18〜図20を用いて、本実施例の図13に示した補正データ反映処理に関するデータ構造を説明する。図18〜図20は、図6と図7を統合して図8を生成した場合に対応し、補正データ反映処理に関するデータ構造である。
次に、図18〜図20を用いて、本実施例の図13に示した補正データ反映処理に関するデータ構造を説明する。図18〜図20は、図6と図7を統合して図8を生成した場合に対応し、補正データ反映処理に関するデータ構造である。
図18は、図13の補正データ作成処理1301の出力となる補正データの例である、レセプトDB補正結果情報テーブル1800のデータ構造である。レセプトDB補正結果情報テーブル1800は、配列構造を成し1以上のレコードを格納可能である。レセプトDB補正結果情報テーブル1800の各レコードは、図8にて説明した信頼度付与DB検索結果情報テーブル225cと同一の属性601〜606および701から構成される。レセプトDB補正結果情報テーブルの各レコードは、図8と比べ、入院日よりも退院日が古い誤記のあるレコードが補正されている。たとえば、レコード1811、レコード1812およびレコード1813は、図8では入院日よりも退院日が古い誤記のあるレコードであったが、図18ではレセプトDBの医科入院レセプトデータの診療開始日と診療実日数による補正により誤記が修正された結果のレコードを表す。
図19は、クレンジングサーバ203の信頼度付与処理部203bが、図13の信頼度付与処理505の中において算出するレセプトDB補正結果信頼度算出テーブル1900のデータ構造である。レセプトDB補正結果信頼度算出テーブル1900は、配列構造を成し1以上のレコードを格納可能である。レセプトDB補正結果信頼度算出テーブル1900の各レコードは、図9と同一の属性601および属性702から構成される。レセプトDB補正結果信頼度算出テーブル1900の各レコードは、図9と比べ、レセプトDB補正結果情報テーブル1800の属性601〜606からなるレコードを入力として算出されている点が異なる。たとえば、図9のレコード712は病院名「B医院」の病院の入退院日の信頼度(%)「80」であったのに対し、レコード1911は同病院の入退院日の信頼度(%)「91.2」となっており、レセプトDBによる補正によって入退院日の信頼度が改善していることを表す。
(信頼度付与処理の出力データ)
図20は、クレンジングサーバ203の信頼度付与処理部203bが、図13の信頼度付与処理505の出力としてストレージ装置104のディスクプール225に格納する信頼度付与補正データテーブルの例である、信頼度付与レセプトDB補正データテーブル2000のデータ構造である。信頼度付与レセプトDB補正データテーブル2000は、配列構造を成し、1以上のレコードを格納可能である。
図20は、クレンジングサーバ203の信頼度付与処理部203bが、図13の信頼度付与処理505の出力としてストレージ装置104のディスクプール225に格納する信頼度付与補正データテーブルの例である、信頼度付与レセプトDB補正データテーブル2000のデータ構造である。信頼度付与レセプトDB補正データテーブル2000は、配列構造を成し、1以上のレコードを格納可能である。
信頼度付与レセプトDB補正データテーブル2000は、図18にて説明したレセプトDB補正結果情報テーブル1800と同一の属性601〜606および701から構成される。信頼度付与レセプトDB補正データテーブル2000の各レコードは、図18と比べ、図19で示した改善された入退院日の信頼度(%)が各レコードに反映されている。たとえば、図18のレコード1811は病院名「B医院」の病院のレコードであり入退院日の信頼度(%)「80」であったのに対し、図19の2011のレコードは病院名「B医院」の病院のレコードであり入退院日の信頼度(%)「91.2」となっており、図19で示した改善された入退院日の信頼度を反映していることを表す。
(絞込み補正データの選択画面)
次に、図21を用いて、本実施例に関わるGUIのうち、対象データの絞込み条件および補正データの使用を指定する対象データ絞込み・補正データ選択画面2100の表示例を説明する。対象データ絞込み入力画面2100は、Webサーバ201の画面表示処理部201cが、ネットワーク102、ルータ101およびネットワーク10を介してP大学病院2やQ製薬会社3のユーザのWeb端末に表示する。
次に、図21を用いて、本実施例に関わるGUIのうち、対象データの絞込み条件および補正データの使用を指定する対象データ絞込み・補正データ選択画面2100の表示例を説明する。対象データ絞込み入力画面2100は、Webサーバ201の画面表示処理部201cが、ネットワーク102、ルータ101およびネットワーク10を介してP大学病院2やQ製薬会社3のユーザのWeb端末に表示する。
対象データ絞込み・補正データ選択画面2100は、対象データを選択するラジオボタン2110、対象データの検索元DBを示す領域1101、対象データの信頼度の分布を薬剤の種類別に示す領域2111と領域2112、対象データのうち使用するデータの信頼度の範囲の下限を指定する領域2113、範囲の上限を指定する領域2114、補正データ1を選択するラジオボタン2120、補正データ1の補正データの検索元DBを示す領域2121、対象データに補正データ1による補正を加えたデータの信頼度の分布を薬剤の種類別に示す領域2122と領域2123、対象データに補正データ1による補正を加えたデータのうち使用するデータの信頼度の範囲の下限を指定する領域2124、範囲の上限を指定する領域2125、補正データ2を選択するラジオボタン2130、補正データ2の補正データの検索元DBを示す領域2131、対象データに補正データ2による補正を加えたデータの信頼度の分布を薬剤の種類別に示す領域2132と領域2133、対象データに補正データ2による補正を加えたデータのうち使用するデータの信頼度の範囲の下限を指定する領域2134、範囲の上限を指定する領域2135、ユーザが選択し使用範囲を指定したデータの解析の再実行の契機となる解析再実行ボタン2140、および指定した内容を消去するクリアボタン2150から構成される。
例えば、図21の表示例は、ユーザが補正データ1を選択するラジオボタン2120を選択したこと、選択した補正データ1の内容は対象データである「退院時サマリDB」の検索結果のデータに対して補正データ1「レセプトDB」の検索結果のデータによる補正を加えたデータであること、補正データ1の信頼度の分布が領域2122および領域2123のグラフで示されること、解析に使用する補正データの信頼度は下限「90%」上限「100%」が指定されたことを表す。また、図21の表示例は、ユーザが解析再実行ボタン2140を押下すると、Web端末が、ネットワーク10、ルータ101およびネットワーク102を介して、Webサーバ201のプロセス管理部201dへユーザが指定した補正データ1の格納先アドレスと使用するデータの信頼度の範囲の下限「90%」および上限「100%」の情報を伝送する。
(絞込み解析の処理フロー)
次に、図22を用いて、Webサーバ201のプロセス管理部201dによる対象データ絞込み解析処理の動作例を説明する。
次に、図22を用いて、Webサーバ201のプロセス管理部201dによる対象データ絞込み解析処理の動作例を説明する。
まず、プロセス管理部201dは、図21でユーザが指定した補正データ1の格納先アドレスおよび使用するデータの信頼度の範囲の下限「90%」および上限「100%」の情報の伝送を受けると、上記情報を解析サーバ202のDBクエリー作成処理部202dへ伝送する。上記情報の伝送を受けたDBクエリー作成処理部202dは、補正データ1のテーブルから『属性「入退院日の信頼度(%)」の値が、「90%」以上かつ「100%」以下であるレコード』を抽出するDBクエリーを作成し、プロセス管理部201dへ伝送する。上記DBクエリーを受けたプロセス管理部201dは、DBサーバ204のDB操作処理部204bへ、補正データ1の格納先アドレスおよび上記DBクエリーを伝送する。伝送を受けたDB操作処理部204bは、補正データ1のテーブルから同DBクエリーに従いレコードを抽出し、補正データ1絞込みデータテーブルとしてストレージ装置104のディスクプール225に格納し、その格納先アドレスをWebサーバ201のプロセス管理部201dへ伝送する(対象データ絞込み処理2201)。
プロセス管理部201dは、補正データ1絞込みデータテーブルの格納先アドレスの伝送を受けると、上記アドレスを解析サーバ202の目標値算出処理部202eへ伝送する。目標値算出処理部202eは、図5の目標値算出処理506の処理を行い、解析目標値の算出結果と算出に用いた対象データのペアをストレージ装置104のキャッシュメモリ223に格納し、上記格納先アドレスをグラフデータ作成処理部202fへ伝送する(目標値算出処理506)。
解析目標値と対象データのペアの格納先アドレスの伝送を受けたグラフデータ作成処理部202fは、上記アドレスの解析目標値および対象データの信頼度の分布を示すグラフを表示するためのグラフデータ(例.CSV形式データ、グラフの種類及び軸を定義するデータ)を作成し、ストレージ装置104のキャッシュメモリ223に格納し、グラフデータの格納先アドレスをWebサーバ201のプロセス管理部201dへ伝送する(グラフデータ作成処理507)。
グラフデータの格納先アドレスの伝送を受けたプロセス管理部201dは、解析目標値を格納先アドレスから読み出し、解析目標値および解析内容の文章を解析サーバ202の解析結果作成処理部202gへ伝送する。解析結果作成処理部202gは、解析内容の文章と解析目標値を入力とし、解析結果の文章データを作成してキャッシュメモリ223に格納し、解析結果の文章データの格納先アドレスを、Webサーバ201のプロセス管理部201dへ伝送する(解析結果作成処理508)。
解析結果の文章データの格納先アドレスの伝送を受けたプロセス管理部201dは、解析内容の文章、選択したDBの識別子、解析結果の文章、解析目標値および対象データの信頼度の分布を示すグラフデータを画面表示処理部201cへ伝送し(解析結果表示処理509)、対象データ絞込み解析処理を終了する。
(解析経過サマリ表示画面)
次に、図23を用いて、本実施例に関わるGUIのうち、図10にて説明した一連の解析の内容と結果を一覧表示する解析経過サマリ表示画面1000の、対象データ絞込み・補正を実施した後の表示例を説明する。以下、図10との変更点に絞り説明する。
次に、図23を用いて、本実施例に関わるGUIのうち、図10にて説明した一連の解析の内容と結果を一覧表示する解析経過サマリ表示画面1000の、対象データ絞込み・補正を実施した後の表示例を説明する。以下、図10との変更点に絞り説明する。
図23で示した解析経過サマリ表示画面1000は、図10と比べ、レコード2301が追加された点が異なる。レコード2301は、解析順序がNo.「2」番目の解析であること、解析内容「−」は解析内容の変更が無いこと、データ絞込み「・補正データ使用 ・信頼度90−100%」は補正データを使用し解析に使用するデータを信頼度が90%以上100%以下のデータに絞ったこと、レコード数「213879」は補正データを使用しデータの絞込みを行った結果のレコード数、そのレコードを用いた解析結果が解析結果「薬剤Xを使用した場合の方が、平均入院期間が短い(X:25日、Y:35日)」であることを表す。
図23の解析経過サマリ表示画面1000が示す一連の解析の経過の意味は、1番目に行った解析の結果は、レコード1011が示すとおり「薬剤Y」の方が平均入院期間は短いことを示したのに対し、2番目に行った対象データ絞込み・補正を行った上での解析は、レコード2301が示すとおり補正データを使用し入退院日の信頼度が高いデータに絞って解析を再実行した結果、「薬剤X」の方が平均入院期間は短いという異なる結果が出ていることを表す。
(対象データ絞込み・補正実施後の解析結果表示画面)
次に、図24を用いて、本実施例に関わるGUIのうち、図11にて説明した最新の解析結果を詳細に表示する解析結果表示画面1100の、対象データ絞込み・補正を実施した後の表示例を説明する。以下、図11との変更点に絞り説明する。
次に、図24を用いて、本実施例に関わるGUIのうち、図11にて説明した最新の解析結果を詳細に表示する解析結果表示画面1100の、対象データ絞込み・補正を実施した後の表示例を説明する。以下、図11との変更点に絞り説明する。
図24で示した解析結果表示画面1100は、図11と比べ、補正データの検索元DBを示す領域2121が追加された点が異なる。領域2121は、補正データの検索元として医療データセンター4のレセプトDBに格納された医科入院レセプトデータを対象としたことを表す。領域1102と領域1103は、補正後の薬剤別の対象データの信頼度の分布を表す。領域1104と領域1105と領域1109は、対象データ絞込み・補正を行った上で解析を再実行した結果、薬剤Xの平均入院期間は「25日」、薬剤Yの平均入院期間は「35日」となり、解析結果は図10とは逆の「薬剤Xを使用した場合の方が、平均入院期間が短い」という結果になったことを表す。
(解析内容絞込み入力画面)
次に、図25を用いて、本実施例に関わるGUIのうち、ユーザが解析内容の絞込み内容を入力する解析内容絞込み入力画面2500の表示例を説明する。解析内容絞込み入力画面2500は、ユーザが解析結果表示画面1100の解析内容絞込みボタン1110を押下したことを契機とし、Webサーバ201の画面表示処理部201cがネットワーク102、ルータ101およびネットワーク10を介してP大学病院2やQ製薬会社のWeb端末に表示し、臨床研究者や市販後調査担当者が、Web端末の入出力デバイスを用いて解析内容の絞込み内容を入力する画面である。
次に、図25を用いて、本実施例に関わるGUIのうち、ユーザが解析内容の絞込み内容を入力する解析内容絞込み入力画面2500の表示例を説明する。解析内容絞込み入力画面2500は、ユーザが解析結果表示画面1100の解析内容絞込みボタン1110を押下したことを契機とし、Webサーバ201の画面表示処理部201cがネットワーク102、ルータ101およびネットワーク10を介してP大学病院2やQ製薬会社のWeb端末に表示し、臨床研究者や市販後調査担当者が、Web端末の入出力デバイスを用いて解析内容の絞込み内容を入力する画面である。
解析内容絞込み画面2500は、解析内容の絞込み内容の文章を入力する領域2501、入力した内容による解析内容の絞りこみの実行を指示する絞込み実行ボタン2502、および入力した内容を取り消すボタン2503から構成される。ユーザがWeb端末の画面上でボタン2502を押下すると、Web端末が、領域2501に入力された解析内容の絞込み内容の文章を、ネットワーク10、ルータ101およびネットワーク102を介してWebサーバ201の画面遷移処理部201bに伝送する。
伝送を受けた画面遷移処理部201bは、図3にて説明したとおり、画面表示処理部201cに対して解析経過サマリ画面および解析結果表示画面からなる画面302をWeb端末に表示することを指示する情報を伝送する。また、画面遷移処理部201bは、プロセス管理部201dに解析内容の絞込み内容の文章を伝送する。
伝送を受けた画面表示処理部201cは、プロセス管理部201dからの、解析経過サマリ画面および解析結果表示画面の画面表示に必要な情報の伝送を待ち受ける。
画面遷移処理部201bからの伝送を受けたプロセス管理部201dは、伝送された解析内容の文章を入力とする図5に示したヘルスケアデータ解析処理を実行し、情報の作成および画面表示処理部201cへの伝送を行う。
プロセス管理部201dから情報の伝送を受けた画面表示処理部201cは、P大学病院2やQ製薬会社3のWeb端末に対して、ネットワーク102、ルータ101およびネットワーク10を介して解析経過サマリ画面および解析結果表示画面からなる画面302を表示する。画面302の各画面の詳細は、後の図29および図30にて説明する。
(解析内容絞込み時の信頼度付与処理に関するデータ構造)
次に図26〜図28を用いて、本実施例の解析内容の絞込みにおける信頼度付与処理に関するデータ構造を説明する。
次に図26〜図28を用いて、本実施例の解析内容の絞込みにおける信頼度付与処理に関するデータ構造を説明する。
図26は、図1の医薬情報センター5が保持する医薬品情報DBの検索結果の例である医薬品情報DB検索結果テーブル2600のデータ構造である。同テーブルは、プロセス管理部201dが、ユーザが図25の領域2501に入力した解析内容「標準的な検査時間で投薬後の検査を行った患者のみを対象とした場合は?」を入力とし、医薬情報センター5の医薬品情報DBに対して、図5のヘルスケアデータ解析処理の処理501〜504を実施した出力結果として得られる。医薬品情報DB検索結果テーブル2600は、クレンジングサーバ203の信頼度付与処理部203bが、図5の信頼度付与処理505を実行する際、投薬後の検査時間の信頼度の判定基準として参照される。
医薬品情報DB検索結果テーブル2600は、配列構造を成し、1以上のレコードを格納可能である。医薬品情報DB検索結果テーブル2600の各レコードは、医薬品の名称を示す薬剤名2601、医薬品が対象とする疾病を示す対象疾病2602、医薬品を投与した後の血液検査を行う標準時間を示す投与後血液検査時間2603、および投与後血液検査時に重篤な副作用の危険性の有無の判定基準と成る薬剤の血中濃度の条件を示す薬剤の血中濃度2604から構成される。例えば、レコード2611は、薬剤名「薬剤X」の医薬品は、投与対象となる疾病が対象疾病「疾病A」であること、投与後の血液検査の標準時間が投与後血液検査時間「72時間」であること、投与後血液検査時間経過時の重篤な副作用の危険性を判定する基準が薬剤の血中濃度「0.00001モル濃度以上」であることを示す。
図27は、解析内容の絞込み内容の文章に応じて必要な属性を図20のテーブルに追加した信頼度付与DB検索結果情報の例である絞込み属性追加結果テーブル2700のデータ構造である。上記テーブル2700は、ユーザが図25の領域2501に入力した解析内容「標準的な検査時間で投薬後の検査を行った患者のみを対象とした場合は?」を入力とし、A市民病院6およびC大学病院8等の退院時サマリDBに対して、図5のヘルスケアデータ解析処理の処理501〜504を実施した出力結果として得られる。上記テーブル2700は、クレンジングサーバ203の信頼度付与処理203bが、信頼度付与処理505を実行して追加された属性に対する信頼度を付与する処理の入力情報となる。
絞込み属性追加結果テーブル2700は、配列構造を成し、1以上のレコードを格納可能である。上記テーブル2700の各レコードは、図20で説明した信頼度付与レセプトDB補正データテーブル2000と同じ属性601〜606、属性701に加え、投薬日時を記録する投薬日時2701および投薬後の検査日時を示す投薬後検査日時2702から構成される。属性2701および属性2702は、絞込み解析に必要な属性として図5の処理501〜504により追加された2つの属性であり、各属性の値は同処理の中でDBサーバ204の外部DB検索処理部204cがA市民病院およびC大学病院等の退院サマリDBを検索して読み出した値である。
例えば、レコード2711は、病院名「A市民病院」に入院した入院患者ID「1」の入院患者は、入院日「2012/1/4」に入院して退院日「2012/2/3」に退院し、病名は疾病名「A」であり、入院中に投与された医薬品は薬剤名「X」であり、入院日と退院日の記録の信頼度は入退院日の信頼度(%)「100」であり、投与された日時は投薬日時「2012/1/14 9:10」であり、投薬後の検査日時は投薬後検査日時「2012/1/17 10:05」であったことを表す。
図28は、図27で追加された属性間の関連の信頼性を判定し付与した信頼度付与DB検索結果情報の例である、信頼度付与絞込み属性追加結果テーブル2800のデータ構造である。上記テーブル2800は、クレンジングサーバ203の信頼度付与処理部203bが、絞込み属性追加結果テーブル2700および医薬品情報DB検索結果テーブル2600を入力とし、絞込み属性追加結果テーブル2700の各患者の投薬後の検査時間が、医薬品情報DB検索結果テーブル2600の標準の検査時間に準拠している度合いを信頼度として信頼度付与処理505を実施した出力結果として得られる。信頼度付与処理505における信頼度の算出式は、Tsを医薬品情報DB検索結果テーブル2600の投薬後血液検査時間2603の値、Trを絞込み属性追加結果テーブル2700の投薬後検査日時2702から投薬日時2701を差し引いた時間とすると、『投薬後検査時間の信頼度(%)=100×(Ts−|Ts−Tr|)÷Ts』である。即ち、対象データの絞込み前後で投薬後血液検査時間に違いが少ない場合、信頼度が高いと評価する。
信頼度付与絞込み属性追加結果テーブル2800は、配列構造を成し、1以上のレコードを格納可能である。上記テーブル2800の各レコードは、図27で説明した絞込み属性追加結果テーブル2700と同じ属性601〜606、属性701、属性2701、属性2071に加え、上記の算出式で算出された信頼度を記録する投薬後検査時間の信頼度(%)2801から構成される。
例えば、レコード2811は、病院名「A市民病院」に入院した入院患者ID「1」の入院患者は、入院日「2012/1/4」に入院して退院日「2012/2/3」に退院し、病名は疾病名「A」であり、入院中に投与された医薬品は薬剤名「X」であり、入院日と退院日の記録の信頼度は入退院日の信頼度(%)「100」であり、投与された日時は投薬日時「2012/1/14 9:10」であり、投薬後の検査日時は投薬後検査日時「2012/1/17 10:05」であり、投薬後の検査までの時間が医薬品の標準検査時間に準拠している信頼度は、投薬後検査時間の信頼度(%)「98.7」であることを表す。
(解析内容絞込みを実施した後の解析経過サマリ表示画面)
次に、図29を用いて、本実施例に関わるGUIのうち、図23にて説明した一連の解析の内容と結果を一覧表示する解析経過サマリ表示画面1000の、解析内容絞込みを実施した後の表示例を説明する。以下、図23との変更点に絞り説明する。
次に、図29を用いて、本実施例に関わるGUIのうち、図23にて説明した一連の解析の内容と結果を一覧表示する解析経過サマリ表示画面1000の、解析内容絞込みを実施した後の表示例を説明する。以下、図23との変更点に絞り説明する。
図29で示した解析経過サマリ表示画面1000は、図23と比べ、レコード2901が追加された点が異なる。レコード2901は、解析順序がNo「3」番目の解析であること、絞込み解析内容の文章が解析内容「標準的な検査時間で投薬後の検査を行った患者のみを対象とした場合は?」であること、データ絞込み「−」により対象データの絞込み条件の変更No「2」の条件と変更が無いこと、レコード数「153879」は解析内容の絞込みの結果のレコード数、そのレコードを用いた解析の結果が解析結果「薬剤Xを使用した場合の方が、平均入院期間が短い(X:24日、Y:35日)」であることを表す。
図29の解析経過サマリ表示画面1000が示す一連の解析の意味は、次のとおりである。1番目に行った解析の結果は、レコード1011が示すとおり「薬剤Y」の方が平均入院期間は短いことを表す。それに対し、2番目に行った解析は、レコード2301が示すとおり補正データを使用し入退院日の信頼度が高いデータに絞って解析を再実行した結果、「薬剤X」の方が平均入院期間は短いという異なる結果が出ていることを表す。最後に、3番目に行った解析は、レコード2901が示すとおり、解析内容の絞込みにより標準的な検査時間の患者のレコードのみを解析対象とした結果、2番目の解析結果と「薬剤Xを使用した場合のほうが、平均入院期間が短い」という結論は同じだが、薬剤Xの平均入院期間が1日減少した「X:24日」、薬剤Yの平均入院期間が3日減少した「Y:35日」となっており、標準的な検査時間の患者は入院期間が比較的短い傾向を表す。
(解析内容絞込み実施後の解析結果表示画面)
次に、図30を用いて、本実施例に関わるGUIのうち、図24にて説明した最新の解析結果を詳細に表示する解析結果表示画面1100の、解析内容絞込みを実施した後の表示例を説明する。以下、図24との変更点に絞り説明する。
次に、図30を用いて、本実施例に関わるGUIのうち、図24にて説明した最新の解析結果を詳細に表示する解析結果表示画面1100の、解析内容絞込みを実施した後の表示例を説明する。以下、図24との変更点に絞り説明する。
図30で示した解析結果表示画面1100は、図24と比べ、構成要素に変化はないが、解析内容の絞込みによりいくつかの領域の表示するグラフ及び値が異なる。具体的には、領域1102・領域1103が示す対象データの信頼度の分布、および領域1104・領域1105が示す平均入院期間の値が、解析内容の絞込みにより変動している点が異なる。これらの変動は、解析内容の絞込みによる属性および信頼度の追加に伴い、対象データの信頼度の分布および解析目標値である平均入院期間の算出結果が、図24に比べ変わったことを表す。
以上で、本発明の実施例1を説明した。実施例1では、ヘルスケアクラウドデータセンター1の各サーバが、P大学病院2の臨床研究者やQ製薬会社3の市販後調査担当者などのデータ利用者が入力した解析内容に応じて、属性間の関連の信頼度を判断し付与する処理を解析と合わせてまとめて行うことにより、データ利用者が個別に属性間の関連の信頼度を判断しデータの絞込み・補正を行う作業を効率化することができる。
また、図23および図29に示すように、解析内容に応じた属性間の関連の信頼度を付与して、信頼度に基づくデータの絞込みを行うことにより、信頼度を付与しない場合(図23レコード1011)に比べ、解析内容に対して精度の高い解析結果(図23レコード2301、図24レコード2901)が得られる。
1:ヘルスケアクラウドデータセンター、2:P大学病院、3:Q製薬会社、4:医療データセンター、5:医薬情報センター、6:A市民病院、7:B医院、8:C大学病院、10:ネットワーク、103:ブレードサーバ装置、104:ストレージ装置、201:Webサーバ、202:解析サーバ、203:クレンジングサーバ、204:DBサーバ、
203b:信頼度付与処理部、203e:信頼度判定パターンDB、203g:信頼度算出テーブル、201c:画面表示処理部
203b:信頼度付与処理部、203e:信頼度判定パターンDB、203g:信頼度算出テーブル、201c:画面表示処理部
Claims (12)
- 1以上の医療機関と1以上のデータセンターの計算機がネットワークで接続されている計算機システムにおいて、
1以上の通信インタフェースおよび1以上のCPUを備える1以上のサーバ装置からなる計算機システムであって、
データ間の関連の信頼度の判定方法を記憶する第1の記憶部と、
解析目的に応じて信頼度の判定方法を選択する第1の選択部と、
データ間の関連の信頼度の判定方法を作成する第1の作成部と、
選択した判定方法を用いてデータの信頼度を算出する算出部と、
データに算出した信頼度を付与して記憶する第2の記憶部と、
解析手段に対して信頼度を付与したデータの信頼度の分布を表示する表示部と、
解析目的に応じて信頼度の利用範囲を選択する第2の選択部と、
を備えることを特徴とする計算機システム。 - 請求項1に記載の計算機システムであって、
前記表示部は、信頼度を付与したデータの解析結果と信頼度の分布を合わせて表示する
ことを特徴とする計算機システム。 - 請求項1に記載の計算機システムであって、
前記表示部は、1以上の解析内容および解析結果の経過を一覧表示する
ことを特徴とする計算機システム。 - 請求項1に記載の計算機システムであって、
誤った関連を持つデータの補正方法を記憶する第3の記憶部と、
解析目的に応じて補正方法を選択する第3の記憶部と、
誤った関連を持つデータの補正方法を作成する第2の作成部と、
選択した補正方法を用いてデータを補正する補正部と、
を備えることを特徴とする計算機システム。 - 請求項4に記載の計算機システムであって、
前記表示部は、誤った関連を持つデータと補正後のデータの信頼度の分布を表示し、
データの解析目的に応じて利用するデータを誤った関連を持つデータと補正後のデータから選択する第3の選択部、
を備えることを特徴とする計算機システム。 - 請求項1に記載の計算機システムであって、
データの解析内容を絞り込む条件を追加する第1の追加部と、
解析内容の絞込み条件に応じてデータに属性を追加する第2の追加部と、
追加した属性に関する関連に対して信頼度を追加する第3の追加部と、
を備えることを特徴とする計算機システム。 - データの提供、又は前記データの管理及び運用を行う少なくとも1つのサーバと、前記データを利用する少なくとも1つの端末とがネットワークを介して接続された計算機におけるクレンジングデータの管理方法であって、
様々な信頼度の判定パターンを利用者が作成して前記計算機の記憶装置に保持する第1ステップ、
前記端末の利用者が指示した解析目的に応じて前記信頼度の判定パターンを選択する第2ステップ、
前記選択した判定パターンに基づいて、前記解析目的を参照しながら前記サーバに格納されたデータの信頼度を計算して前記データに付与する第3ステップ、
前記解析目的に基づいて、前記信頼度を付与した前記データを解析して、前記解析の結果を評価し、前記信頼度を付与した前記データを表示する第4ステップ、
利用者の指示に基づいて、前記解析目的に応じた信頼度のデータを選択する第5ステップ、
を実行することを特徴とするクレンジングデータの管理方法。 - 前記クレンジングデータの管理方法は、さらに、前記第4ステップの後で、
前記表示されたデータに対して、対象データ絞込み・補正を行うかどうか、更に、解析内容の絞込みを行うかどうかを利用者の指示に基づいて決定し、
前記対象データ絞込み・補正が決定された際に、前記第3ステップ及び前記第4ステップを実行し、
前記解析内容の絞込みが決定された際に、前記第1ステップから前記第4ステップを実行することを特徴とする請求項7記載のクレンジングデータの管理方法。 - 前記第3ステップにおいて、前記解析目的からキーワードを抽出して、前記データのDBに対するクエリーを作成して前記データを検索する、ことを特徴とする請求項7記載のクレンジングデータの管理方法。
- 前記第3ステップにおいて、前記データのDB検索結果と前記信頼度に関する情報とを統合して信頼度付与DB検索結果を生成することを特徴とする請求項9記載のクレンジングデータの管理方法。
- 前記データは、医療データであることを特徴とする請求項7記載のクレンジングデータの管理方法。
- 前記第3ステップにおいて、前記信頼度は、対象となる全レコード数に対する、誤記のないレコード数の割合であることを特徴とする請求項7記載のクレンジングデータの管理方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2013/060230 WO2014162540A1 (ja) | 2013-04-03 | 2013-04-03 | クレンジングデータの管理方法および計算機システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5941217B2 JP5941217B2 (ja) | 2016-06-29 |
JPWO2014162540A1 true JPWO2014162540A1 (ja) | 2017-02-16 |
Family
ID=51657872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015509791A Active JP5941217B2 (ja) | 2013-04-03 | 2013-04-03 | クレンジングデータの管理方法および計算機システム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5941217B2 (ja) |
WO (1) | WO2014162540A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016203544A1 (ja) * | 2015-06-16 | 2016-12-22 | 株式会社 日立製作所 | データ補正システムおよびデータ補正方法 |
WO2017115409A1 (ja) * | 2015-12-28 | 2017-07-06 | 日本郵船株式会社 | 船舶において計測されたデータを管理するためのデータ処理装置、プログラム、および記録媒体 |
JP7195101B2 (ja) * | 2018-09-28 | 2022-12-23 | 三菱電機株式会社 | データ提供システム、計測装置、中継装置、データ提供サーバ、データ提供方法、及び、プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3342474B2 (ja) * | 1999-11-19 | 2002-11-11 | 三洋電機株式会社 | 医療機関向け経営支援システムおよび医療機関に経営支援情報を提供する方法 |
JP2003050868A (ja) * | 2001-08-06 | 2003-02-21 | Koichi Kawabuchi | Drgを用いた医療情報分析システム |
JP2005258715A (ja) * | 2004-03-10 | 2005-09-22 | Toshiba Corp | 医療検査マネジメントシステム、医療検査マネジメント方法および医療検査マネジメントプログラム |
US8666919B2 (en) * | 2011-07-29 | 2014-03-04 | Accenture Global Services Limited | Data quality management for profiling, linking, cleansing and migrating data |
-
2013
- 2013-04-03 WO PCT/JP2013/060230 patent/WO2014162540A1/ja active Application Filing
- 2013-04-03 JP JP2015509791A patent/JP5941217B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP5941217B2 (ja) | 2016-06-29 |
WO2014162540A1 (ja) | 2014-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Agarwal et al. | National trends in heart failure hospitalizations and readmissions from 2010 to 2017 | |
Johnson et al. | A comparative analysis of sepsis identification methods in an electronic database | |
Petitti | Meta-analysis, decision analysis, and cost-effectiveness analysis: methods for quantitative synthesis in medicine | |
US10541052B2 (en) | Retroactive extraction of clinically relevant information from patient sequencing data for clinical decision support | |
CN109670054B (zh) | 知识图谱构建方法、装置、存储介质及电子设备 | |
US10636515B2 (en) | Medical or health information search support apparatus and medical or health information search support system | |
RU2662205C2 (ru) | Расширение клинических руководств на основе рекомендаций клинических экспертов | |
van Dijk et al. | Text-mining in electronic healthcare records can be used as efficient tool for screening and data collection in cardiovascular trials: a multicenter validation study | |
JP6187474B2 (ja) | 医療情報解析プログラム、医療情報解析装置、および医療情報解析方法 | |
US20130185099A1 (en) | Medical query refinement system | |
Thomson et al. | Association of smoking initiation and cessation across the life course and cancer mortality: prospective study of 410 000 US adults | |
Zhang et al. | Computable eligibility criteria through ontology-driven data access: a case study of hepatitis C virus trials | |
Ruppel et al. | Assessment of electronic health record search patterns and practices by practitioners in a large integrated health care system | |
JP5941217B2 (ja) | クレンジングデータの管理方法および計算機システム | |
CN113658712A (zh) | 医患匹配方法、装置、设备及存储介质 | |
CN113066531B (zh) | 风险预测方法、装置、计算机设备及存储介质 | |
Coogan | Calcium-channel blockers and breast cancer: a hypothesis revived | |
Otten et al. | Does reinforcement learning improve outcomes for critically ill patients? A systematic review and level-of-readiness assessment | |
Nordon et al. | Separating wheat from chaff: joining biomedical knowledge and patient data for repurposing medications | |
US11488695B2 (en) | Expression of clinical logic with positive and negative explainability | |
Sun et al. | A framework for systematic assessment of clinical trial population representativeness using electronic health records data | |
Golder et al. | Best practices on big data analytics to address sex-specific biases in our understanding of the etiology, diagnosis, and prognosis of diseases | |
CN112331355B (zh) | 病种评估表的生成方法、装置、电子设备及存储介质 | |
KR20180039036A (ko) | 임상 연구 데이터 제공 방법 및 시스템 | |
Dhiyanesh et al. | Cloud computing and machine learning for analysis of health care data based on neuro fuzzy logistic regression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160426 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160519 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5941217 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |