JP5941217B2

JP5941217B2 - クレンジングデータの管理方法および計算機システム

Info

Publication number: JP5941217B2
Application number: JP2015509791A
Authority: JP
Inventors: 啓成藤原; 及川　道雄; 道雄及川; 崇文小池; 由美子横張
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2013-04-03
Filing date: 2013-04-03
Publication date: 2016-06-29
Anticipated expiration: 2033-04-03
Also published as: JPWO2014162540A1; WO2014162540A1

Description

本発明は、複数の医療関連機関に散在する大量の医療情報を医学研究や創薬に活用する際に、有効な解析を実現するために医療情報のデータクレンジングを行う技術に関する。

特に、医療情報は、人間による入力による表記のゆれや誤記があり、また、穴あき数の多いインバランスな（データの欠損が多い不揃な）大量のデータ群となる特徴がある。こうした特徴のある医療情報から信頼性のある解析結果を得るためには、解析目的に対して有効なデータを選択し、補正等によりデータの有効性を向上するデータクレンジング技術が必要となる。

本技術の医療分野の背景技術として、特開２００９−１２８９６８号公報（特許文献１）がある。この公報には、「表記が異なるが同じ概念を表す同義語と推定される単語の組を効率よく抽出する。」と記載されており、病名の表記ゆれを修正する技術が開示されている。また、特開２００９−２４７６８８号公報（特許文献２）がある。この公報には、「各施設間で臨床検査データに生ずる施設間誤差を効率的かつ高精度に補正する。」と記載されており、臨床検査データの施設間誤差を補正する技術が開示されている。

また、医療分野に応用が考えられる他分野の背景技術として、製造分野における特許第４４１７８９７号号公報（特許文献３）がある。この特許には、「製造データの一部に欠損がある場合でも欠損値のある集合を解析することで製造データの解析精度を高めることができる。また、説明変数の欠損値が目的変数の値に与える影響を評価することで解析の信頼性を高めることができる。」と記載されている。

特開２００９−１２８９６８号公報特開２００９−２４７６８８号公報特許第４４１７８９７号公報（特開２００７−０７９９７１号公報）

上記の医療分野の背景技術（特許文献１、特許文献２）では、医学研究、創薬向けの解析において重要と考えられるデータの関連性に対して、信頼性の評価や補正を行う技術は開示されていない。

また、上記の製造分野の背景技術（特許文献３）では、欠損値に対して解析の信頼性を高める技術が開示されているが、医療分野で考えられる欠損は存在していないがデータ間の関連性において矛盾している情報に対応する技術は開示されていない。

そこで、本発明では、解析目的に応じたデータ間の関連性における誤りを検出して、解析目的に対するデータの信頼性を明らかにし、解析目的に応じた信頼度のデータを選択可能とする技術を開示する。

本発明の医療情報連携システムは、
様々なデータ間の関連の信頼度の判定パターンを作成する手段と、
様々なデータ間の関連の信頼度の判定パターンを保持する手段と、
解析目的に応じて信頼度の判定パターンを選択する手段と、
選択した判定パターンに応じてデータの信頼度を評価する手段と、
データに信頼度を付与して保持する手段と、
解析手段あるいは解析結果の評価手段に対して
信頼度を付与したデータを表示する手段と、
解析目的に応じた信頼度の利用データを選択する手段と、
を備える。

データ解析ごとに行っているデータ間の関連に対する信頼度を評価する処理を、本発明により予め行って信頼度を付与することにより、解析効率を向上する。また、本発明により解析に応じたデータ間の関連に対する信頼度を付与して、解析目的に応じた信頼度のデータを選択可能とすることにより、解析結果の精度を向上する。

医療情報連携システムの構成概要の例を示す図である。ヘルスケアクラウドデータセンターの構成の例を示す図である。ヘルスケアクラウドデータセンターにおけるストレージ装置の構成の詳細を示す図である。画面遷移処理部の処理を説明するフローチャートの例を示す図である。解析内容入力画面の例を示す図である。プロセス管理部２０１ｄの解析処理を説明するフローチャートの例を示す図である。医療情報のテーブルの例を示す図である。信頼度の算出結果のテーブルの例を示す図である。信頼度を付与した医療情報のテーブルの例を示す図である。信頼度付与処理部２０３ｂの処理を説明するフローチャートの例を示す図である。解析経過サマリ表示画面の第一の例を示す図である。解析結果表示画面の第一の例を示す図である。対象データ絞込み入力画面の例を示す図である。プロセス管理部２０１ｂの対象データ絞込み処理を説明するフローチャートの例を示す図である。補正データ作成処理を説明するフローチャートの例を示す図である。矛盾のあるデータ一覧を示すテーブルの例を示す図である。レセプトＤＢから抽出した補正用データのテーブルの例を示す図である。医事会計システムのＤＢから抽出した補正用データのテーブルの例を示す図である。データ補正を行った医療情報のテーブルの例を示す図である。補正後のデータに基づく信頼度の算出結果のテーブルの例を示す図である。補正後のデータに基づく信頼度を付与した医療情報のテーブルの例を示す図である。対象データ絞込み入力画面の例を示す図である。プロセス管理部２０１ｂの解析再実行時の処理を説明するフローチャートの例を示す図である。解析経過サマリ表示画面の第二の例を示す図である。解析結果表示画面の第二の例を示す図である。解析内容絞込み入力画面の例を示す図である。医薬品情報ＤＢから抽出した薬剤情報のテーブルの例を示す図である。解析内容絞込みを反映した医療情報のテーブルの例を示す図である。解析内容絞込みの反映後のデータに基づき信頼度を付与した医療情報の例を示す図である。解析経過サマリ表示画面の第三の例を示す図である。解析結果表示画面の第三の例を示す図である。処理概要を示す図である。

以下、本発明の実施例について図面を用いて説明する。以下の図中、同一の部分には同一の符号を付加する。

（システム構成）
本実施例における医療情報連携システムの構成を図１に示す。図１に示すシステムは、（１）本発明実施の主体：医療情報の解析サービスをＷｅｂサービスとして提供するヘルスケアクラウドデータセンター１、（２）医療データの利用：解析サービスをＷｅｂ端末にて医療情報を利用する臨床研究者や市販後調査担当者が所属するＰ大学病院２及びＱ製薬会社３、（３）医療データの管理運用：レセプト情報をデータ化し蓄積したレセプトＤＢを管理及び運用している医療データセンター４、及び医薬品の効能、用法及び使用上の注意などの情報を集めた医薬品情報ＤＢを管理及び運用している医薬情報センター５、（４）医療データの提供：医療情報を提供する、電子カルテサーバおよび医事会計サーバを備えるＡ市民病院６およびＣ大学病院８、電子カルテサーバを備えるＢ医院７、およびその他多数の医療機関９、といった４つのグループによって構成され、これらセンターなどがネットワーク１０によって接続されている。なお、本実施例におけるＷｅｂ端末や入力端末は、ＰＣあるいは携帯端末等である。

ヘルスケアクラウドデータセンター１は、外部機関との通信を中継するルータ１０１およびネットワーク１０２、Ｗｅｂサービスにて解析サービスを提供するための各種サーバ（Ｗｅｂサーバ２０１、解析サーバ２０２、クレンジング(cleansing)サーバ２０３、ＤＢサーバ２０４）を備えるブレードサーバ装置１０３、大容量のデータを格納し高速な入出力を行うことができるストレージ装置１０４および入出力を中継するネットワーク１０５を備える。

ここで、「（データ）クレンジング」とは、社会的要因・入力ミスなどにより陳腐化したデータベースを正しいデータにすることである。

Ｐ大学病院２は、臨床研究者がＷｅｂベースの解析サービスにアクセスするためのＷｅｂ端末および外部との通信を中継するルータを備える。

Ｑ製薬会社３は、市販後調査担当者がＷｅｂベースの解析サービスにアクセスするためのＷｅｂ端末および外部との通信を中継するルータを備える。

医療データセンター４は、レセプトＤＢを保持するストレージ装置、外部からのレセプトＤＢへのアクセスに対してアクセス制御や課金処理を行う管理サーバ、内部の通信を中継するネットワークおよび外部との通信時に経由するルータを備える。

医薬情報センター５は、医薬品情報ＤＢを保持するストレージ装置、外部からの医薬品情報ＤＢへのアクセスに対してアクセス制御や課金処理を行う管理サーバ、内部の通信を中継するネットワークおよび外部との通信時に経由するルータを備える。

Ａ市民病院６およびＣ大学病院８は、医師やメディカルクラークが電子カルテや退院時サマリの入力を行うための入力端末、カルテを電子的に管理する電子カルテサーバ、医事会計処理を支援する医事会計サーバ、退院時サマリ・医事会計システムＤＢなどの情報を格納するストレージ装置、各装置間の通信を中継するネットワークおよび外部との通信時に経由するルータを備える。

Ｂ医院７は、医師らが電子カルテや退院時サマリを入力するための入力端末、カルテを電子的に管理する電子カルテサーバ、各装置間の通信を中継するネットワークおよび外部との通信時に経由するルータを備える。

その他の医療機関９は、Ａ市民病院６、Ｃ大学病院８と同様、またはＢ医院７と同様のシステムを備え、ネットワーク１０に接続された多数の医療機関を示す。

（データセンター１の構成）
図１に示したヘルスケアクラウドデータセンター１は、ブレードサーバ装置１０３及びストレージ装置１０４で構成されている。図２Ａを用いて、ブレードサーバ装置１０３の詳細な構造を説明し、図２Ｂを用いて、ストレージ装置１０４の詳細な構造を説明する。

ブレードサーバ装置１０３は、外部からの要求を受け内部の各サーバに処理を割り振りその処理結果をＷｅｂ画面として外部に応答するＷｅｂサーバ２０１、外部からの要求の内容を解釈してＤＢサーバ２０４から必要なデータを抽出し解析を実行して解析結果を作成する解析サーバ２０２、解析目的に対して抽出されたデータの信頼度の評価および補正データの作成を行うクレンジングサーバ２０３、内部および外部の各医療関連機関のＤＢ検索を処理するＤＢサーバ２０４、ストレージ装置１０４への入出力を行う際に経由する入出力インタフェース（以下ではＩ／ＯＩ／Ｆと略記する）２０６、ブレードサーバ装置内部の管理作業等を行うためのディスプレイ２０７、マウス２０８、キーボード２０９、およびこれらを接続する内部バス２０５から構成される。

Ｗｅｂサーバ２０１は、メモリ２０１ａ、ディスク２０１ｅ、通信インタフェース（通信Ｉ／Ｆ）、Ｉ／ＯＩ／Ｆ、ＣＰＵおよびこれらを接続する内部バスから構成される。メモリ２０１ａには、Ｗｅｂ端末に表示する画面の遷移を制御する画面制御処理部２０１ｂ、Ｗｅｂ端末に画面を表示する画面表示処理部２０１ｃ、Ｗｅｂ端末からの要求に対し各種サーバに処理を割り振り、結果を収集するプロセスを管理するプロセス管理部２０１ｄが格納される。これらのプログラムは、あらかじめ、または可搬型記録媒体からの読み込み、または他装置からのネットワーク１０２経由のダウンロードにより、ディスク２０１eに格納され、必要に応じてメモリ２０１aに転送された後、ＣＰＵが実行する。

解析サーバ２０２は、メモリ２０２ａ、ディスク２０２ｈ、通信インタフェース（通信Ｉ／Ｆ）、Ｉ／ＯＩ／Ｆ、ＣＰＵおよびこれらを接続する内部バスから構成される。メモリ２０２ａには、ユーザが入力した解析内容の文章を解析し名詞や動詞などに分解する形態素解析処理部２０２ｂ、分解した名詞や動詞からＤＢ検索に用いるキーワードを抽出するキーワード抽出処理部２０２ｃ、ＤＢ検索に用いるキーワードを元にＤＢへの問合せクエリーを作成するＤＢクエリー作成処理部２０２ｄ、ＤＢの検索結果のデータから解析の目標となる値を算出する目標値算出処理部２０２ｅ、解析結果の元データの信頼度の分布のグラフを表示するためのグラフデータを作成するグラフデータ作成処理部２０２ｆおよび解析内容の文章に対応する解析結果の文章を作成する解析結果作成処理部２０２ｇが格納される。これらのプログラムは、あらかじめ、または可搬型記録媒体からの読み込み、または他装置からのネットワーク１０２経由のダウンロードにより、ディスク２０２ｈに格納され、必要に応じてメモリ２０２ａに転送された後、ＣＰＵが実行する。

クレンジングサーバ２０３は、メモリ２０３ａ、ディスク２０３ｄ、Ｉ／ＯＩ／Ｆ、ＣＰＵおよびこれらを接続する内部バスから構成される。メモリ２０３ａには、医療情報のテーブルに対して属性間の関連の信頼度を算出し付与する信頼度付与処理部２０３ｂ、医療情報のテーブルに対して属性間の関連の誤りや矛盾を補正するデータを作成する補正データ作成処理部２０３ｃが格納される。ディスク２０３ｄには、属性間の関連の信頼度を算出する数式やアルゴリズムを格納する信頼度判定パターンＤＢ２０３ｅ、属性間の関連の誤りや矛盾を補正する数式やアルゴリズムを格納する補正パターンＤＢ２０３ｆ、信頼度の算出結果を保持する信頼度算出情報テーブル２０３ｇが格納される。これらのプログラムやデータは、あらかじめ、または可搬型記録媒体からの読み込み、または他装置からのネットワーク１０２経由のダウンロードにより、ディスク２０３ｄに格納され、必要に応じてメモリ２０３ａに転送された後、ＣＰＵが実行する。

ＤＢサーバ２０４は、メモリ２０４ａ、ディスク２０４ｄ、通信インタフェース（通信Ｉ／Ｆ）、Ｉ／ＯＩ／Ｆ、ＣＰＵおよびこれらを接続する内部バスから構成される。メモリ２０４ａには、データセンター内のＤＢの操作を行うＤＢ操作処理部２０４ｂおよびデータセンター外のＤＢの検索を行う外部ＤＢ検索処理部２０４ｃが格納される。これらのプログラムは、あらかじめ、または可搬型記録媒体からの読み込み、または他装置からのネットワーク１０２経由のダウンロードにより、ディスク２０４ｄに格納され、必要に応じてメモリ２０４ａに転送された後、ＣＰＵが実行する。

ストレージ装置１０４は、ＣＰＵ２２１、外部からの入出力要求を解釈しストレージ装置１０４の内部を制御するディスクコントローラ２２２、ディスクよりも高速な入出力性能を持つキャッシュメモリ２２３、複数の物理ディスクからなるディスクプール２２５およびこれらを接続する内部バス２２４から構成される。キャッシュメモリ２２３には、データセンター外部のＤＢ（例．医薬品情報ＤＢ）の検索結果であるＤＢ検索結果データ２２３ｂ、グラフを表示するための元データであるグラフデータ２２３ｃ、医療情報の解析結果である解析結果データ２２３ｄが格納される。ディスクプール２２５には、ＤＢ検索結果情報を格納するＤＢ検索結果情報テーブル２２５ｂや、ＤＢ検索結果に信頼度を付与した情報を格納する信頼度付与ＤＢ検索結果情報テーブル２２５ｃが格納される。

（処理概要）
図３１に本実施例の処理概要を示す。図３１には、後述する処理及び図との関連を示す。また、図３１に示した実線の矢印は処理（データを含む）の流れ、又は処理が参照することを示し、破線の矢印は利用者が参照することを示す。
（１）様々な信頼度の判定パターンを利用者が作成して保持する。
（２）解析目的に応じて、利用者が信頼度の判定パターンを選択する。
（３）選択した判定パターンに基づいて、図４の解析目的を参照しながら医療データの信頼度を計算する。その際、解析目的からキーワードを抽出して、医療データのＤＢに対するクエリーを作成して医療データを検索する（図５の５０１〜５０４）。
（４）図７に示す信頼度を医療データに付与する（図５の５０５）。その結果、図６のＤＢ検索結果と図７の信頼度算出情報とが統合されて図８の信頼度付与ＤＢ検索結果が得られる。
（５）解析目的に基づいて、信頼度付与ＤＢ検索結果を解析して、解析結果を評価し（図５の５０６〜５０８）、信頼度を付与したデータを図１０及び図１１のように表示する（図５の５０９）。
（６）表示されたデータに対して、対象データ絞込み・補正を行うかどうか、更に、解析内容の絞込みを行うかどうかを利用者が決定した場合は、対象データ絞込み・補正の処理、及び解析内容の絞込みの処理を行う（図３の３０２〜３０５）。対象データ絞込み・補正が決定された場合は、上記（３）の処理に戻り、解析内容の絞込みが決定された場合は、上記（１）の処理に戻り、上記と同様の処理を行う。
（７）上記（５）又は（６）の処理の結果得られたデータの中から、解析目的に応じた信頼度の利用データが選択される。

本実施例では、上記の処理を行うことにより、同じデータに対して、利用者の解析目的に即した解析結果が得られ、更に、得られた解析結果が利用者の解析目的に即していない場合、あるいは解析目的を修正した場合であっても、利用者ごとに異なる解析目的に即した解析結果が得られる。具体的には、本実施例によれば、解析の対象となるデータを絞り込みたい場合、あるいは、解析の条件を変えて解析内容を絞り込みたい場合のいずれであっても解析目的に即した解析結果が得られる。

（画面遷移処理のフロー）
次に、図３を用いて、画面遷移処理部２０１ｂによる画面遷移処理の動作を説明する。本処理は、医療情報を利用する際に、Ｐ大学病院２やＱ製薬会社３のＷｅｂ端末に表示する画面の遷移を、ユーザの入力に応じて制御する。

まず、画面遷移処理部２０１ｂは画面表示処理部２０１ｃに対して、後に図４にて説明する解析内容入力画面４００からなる画面３０１をＷｅｂ端末に表示することを指示する。ユーザが画面３０１にて入力を行うと、画面遷移処理部２０１ｂは画面表示処理部２０１ｃに対して、後に図１０及び図１１にて説明する解析経過サマリ表示画面１０００及び解析結果表示画面１１００からなる画面３０２をＷｅｂ端末に表示することを指示する。

表示された解析結果に対して、利用者の要望を更に反映させたい場合は、以下の処理が行われ、それに伴って表示画面が遷移する。

ユーザが画面３０２において対象データの絞込みを指示する入力（１１０８）を行った場合、画面遷移処理部２０１ｂは画面表示処理部２０１ｃに対して、後に図１２にて説明する対象データ絞込み入力画面１２００からなる画面３０３をＷｅｂ端末に表示することを指示する。一方、ユーザが画面３０２において解析内容の絞込みを指示する入力（１１１０）を行った場合、画面遷移処理部２０１ｂは画面表示処理部２０１ｃに対して、後に図２５にて説明する解析内容絞込み入力画面２５００からなる画面３０４をＷｅｂ端末に表示することを指示する。その時、解析経過サマリ表示画面１０００（図１０）及び解析結果表示画面１１００（図１１）に対応する図２９及び図３０が表示される。

ユーザが画面３０３において補正データ作成ボタン１２１６を押下すると、画面遷移処理部２０１ｂは画面表示処理部２０１ｃに対して、後に図２１にて説明する対象データ絞込み・補正データ選択画面２１００からなる画面３０５をＷｅｂ端末に表示することを指示する。その時、解析経過サマリ表示画面１０００（図１０）及び解析結果表示画面１１００（図１１）に対応する図２３及び図２４が表示される。一方、ユーザが画面３０３において解析再実行ボタン１２１７を押下すると、画面遷移処理部２０１ｂは画面表示処理部２０１ｃに対して、画面３０２をＷｅｂ端末に表示することを指示する。

ユーザが画面３０５において入力（２１４０）を行うと、画面遷移処理部２０１ｂは画面表示処理部２０１ｃに対して、画面３０２をＷｅｂ端末に表示することを指示する。

ユーザが画面３０４において入力（２５０２）を行うと、画面遷移処理部２０１ｂは画面表示処理部２０１ｃに対して、画面３０２をＷｅｂ端末に表示することを指示する。

上記のように、得られた解析結果に対して、対象データの絞込み、あるいは解析内容の絞込みを行うことで、利用者の解析目的に即した解析結果が得られる。

（解析内容入力画面）
次に、図４を用いて、本実施例に関わるグラフィカルユーザインタフェース（以下ではＧＵＩと略記する）の１つであり、ユーザが最初に解析内容（解析目的）を入力する解析内容入力画面４０１の表示例を説明する。解析内容入力画面４０１は、Ｗｅｂサーバ２０１の画面表示処理部２０１ｃがネットワーク１０２、ルータ１０１およびネットワーク１０を介してＰ大学病院２やＱ製薬会社３のＷｅｂ端末に表示し、臨床研究者や市販後調査担当者が、Ｗｅｂ端末の入出力デバイスを用いて解析内容を入力する画面である。

解析内容入力画面４０１は、解析したい内容の文章を入力する領域４０２、入力した解析内容による解析の実行を指示するボタン４０３、解析内容の入力を取り消すボタン４０４から構成される。ユーザがボタン４０３を押下すると、Ｗｅｂ端末が、領域４０２に入力された解析内容の文章を、ネットワーク１０、ルータ１０１およびネットワーク１０２を介してＷｅｂサーバ２０１の画面遷移処理部２０１ｂに伝送する。

伝送を受けた画面遷移処理部２０１ｂは、図３にて説明したとおり、画面表示処理部２０１ｃに対して解析経過サマリ画面および解析結果表示画面からなる画面３０２をＷｅｂ端末に表示することを指示する情報を伝送する。また、画面遷移処理部２０１ｂは、プロセス管理部２０１ｄに解析内容の文章を伝送する。

伝送を受けた画面表示処理部２０１ｃは、プロセス管理部２０１ｄからの、解析経過サマリ画面および解析結果表示画面の画面表示に必要な情報の伝送を待ち受ける。

画面遷移処理部２０１ｂからの伝送を受けたプロセス管理部２０１ｄは、伝送された解析内容の文章を入力とするヘルスケアデータ解析処理を実行し、情報の作成および画面表示処理部２０１ｃへの伝送を行う。

プロセス管理部２０１ｄから情報の伝送を受けた画面表示処理部２０１ｃは、Ｐ大学病院２やＱ製薬会社３のＷｅｂ端末に対して、ネットワーク１０２、ルータ１０１およびネットワーク１０を介して解析経過サマリ画面および解析結果表示画面からなる画面３０２を表示する。画面３０２の各画面の詳細は、後の図１０および図１１にて説明する。

（ヘルスケアデータ解析の処理フロー）
次に、図５を用いて、Ｗｅｂサーバ２０１のプロセス管理部２０１ｄによるヘルスケアデータ解析処理の動作を説明する。プロセス管理部２０１ｄは、図２に示した各処理部と連携して処理全体の流れを制御する。

まず、プロセス管理部２０１ｄは、解析内容の文章を解析サーバ２０２の形態素解析処理部２０２ｂに伝送する。形態素解析処理部２０２ｂは、伝送された解析内容の文章を名詞、動詞、形容詞などに分解し、キーワード抽出処理部２０２ｃに伝送する（形態素解析処理５０１）。

分解された語句の伝送を受けたキーワード処理部２０２ｃは、分解された語句の中からヘルスケア関連のＤＢの検索に有用なキーワードを選択し、ＤＢクエリー作成処理部２０２ｄに伝送する（キーワード抽出処理５０２）。

ＤＢクエリー作成処理部２０２ｄは、選択したキーワードに基づき有用なＤＢを選択し、選択したＤＢへのアクセスの規定に則ったＤＢクエリーを作成し、Ｗｅｂサーバ２０１のプロセス管理部２０１ｄへ、選択したＤＢの識別子とＤＢクエリーを伝送する（ＤＢクエリー作成処理５０３）。

ＤＢの識別子とＤＢクエリーの伝送を受けたプロセス管理部２０１ｄは、ＤＢの識別子が示すＤＢがヘルスケアクラウドデータセンター内にある場合、ＤＢサーバ２０４のＤＢ操作処理部２０４ｂへＤＢの識別子とＤＢクエリーを伝送し、一方、ＤＢの識別子が示すＤＢがヘルスケアクラウドセンター外のＤＢである場合、ＤＢサーバ２０４の外部ＤＢ検索処理部２０４ｃへＤＢの識別子とＤＢクエリーを伝送する。ＤＢ操作処理部２０４ｂあるいは外部ＤＢ検索処理部２０４ｃは、ＤＢの識別子とＤＢクエリーの伝送を受けると、ＤＢの識別子が示すＤＢに対してＤＢクエリーを発行し、ＤＢクエリーに対する検索結果の情報（例．テーブル）をストレージ装置１０４のキャッシュメモリ２２３あるいはディスクプール２２５に格納し、Ｗｅｂサーバ２０１のプロセス管理部２０１ｄへ、ＤＢクエリーに対する検索結果の情報（以降、ＤＢ検索結果情報、と略す）の格納先のアドレスを伝送する（ＤＢ検索処理５０４）。なお、ＤＢ検索結果情報の具体例は後の図６にて説明する。

ＤＢ検索結果情報の格納先アドレスの伝送を受けたプロセス管理部２０１ｄは、同アドレスをクレンジングサーバ２０３の信頼度付与処理部２０３ｂへ伝送する。信頼度付与処理部２０３ｂは、同アドレスの伝送を受けると、ＤＢ検索結果情報に対して後に図９にて説明する信頼度付与処理を行い、信頼度付与後のＤＢ検索結果情報（以降、信頼度付与ＤＢ検索結果情報、と略す）をストレージ装置１０４のキャッシュメモリ２２３あるいはディスクプール２２５に格納し、Ｗｅｂサーバ２０１のプロセス管理部２０１ｄへ、信頼度付与ＤＢ検索結果情報の格納先のアドレスを伝送する（信頼度付与処理５０５）。なお、信頼度付与ＤＢ検索結果情報の具体例は後の図８にて説明する。

信頼度付与ＤＢ検索結果情報の格納先アドレスの伝送を受けたプロセス管理部２０１ｄは、同アドレスを解析サーバ２０２の目標値算出処理部２０２ｅへ伝送する。目標値算出処理部２０２ｅは、同アドレスの伝送を受けると、信頼度付与ＤＢ検索結果情報から、解析結果を代表する数値の条件（例．疾病Ａ患者に薬剤Ｘを投与した場合の平均入院期間）に該当する対象データを絞込み、対象データから解析結果を代表する数値（以下、解析目標値、と略す）を算出し、解析目標値と対象データのペアをキャッシュメモリ２２３に格納する。このペアは、単数あるいは複数となる。解析目標値と対象データのペアの格納先アドレスをグラフデータ作成処理部２０２ｆへ伝送する（目標値算出処理５０６）。

解析目標値と対象データのペアの格納先アドレスの伝送を受けたグラフデータ作成処理部２０２ｆは、同アドレスの解析目標値および対象データの信頼度の分布を示すグラフを表示するためのグラフデータ（例．ＣＳＶ形式データ（データをカンマで区切って並べたファイル形式）、グラフの種類及び軸を定義するデータ）を作成し、ストレージ装置１０４のキャッシュメモリ２２３に格納し、グラフデータの格納先アドレスをＷｅｂサーバ２０１のプロセス管理部２０１ｄへ伝送する（グラフデータ作成処理５０７）。

グラフデータの格納先アドレスの伝送を受けたプロセス管理部２０１ｄは、解析目標値を格納先アドレスから読み出し、解析目標値および解析内容の文章を解析サーバ２０２の解析結果作成処理部２０２ｇへ伝送する。解析結果作成処理部２０２ｇは、解析内容の文章と解析目標値を入力とし、解析結果の文章データを作成してキャッシュメモリ２２３に格納し、解析結果の文章データの格納先アドレスを、Ｗｅｂサーバ２０１のプロセス管理部２０１ｄへ伝送する（解析結果作成処理５０８）。

解析結果の文章データの格納先アドレスの伝送を受けたプロセス管理部２０１ｄは、解析内容の文章、選択したＤＢの識別子、解析結果の文章、解析目標値および対象データの信頼度の分布を示すグラフデータを画面表示処理部２０１ｃへ伝送し（解析結果表示処理５０９）、ヘルスケアデータ解析処理を終了する。

上記の処理により、利用者の解析目的の即した、信頼度付きの解析結果が得られる。

（信頼度付与処理に関するデータ構造）
次に、図６〜図８を用いて、本実施例の信頼度付与処理５０５に関するデータ構造を説明する。

図６は、図５のＤＢ検索処理５０４の出力であるＤＢ検索結果情報の例であるＤＢ検索結果情報テーブル２２５ｂのデータ構造である。ＤＢ検索結果情報テーブル２２５ｂは、配列構造を成し１以上のレコードを格納可能である。ＤＢ検索結果情報テーブル２２５ｂの各レコードは、入院患者が入院している医療機関の名称である病院名６０１、入院患者の医療機関内での識別情報である入院患者ＩＤ６０２、入院患者の入院日を記録する入院日６０３、入院患者の退院日を記録する退院日６０４、入院患者の病名を記録する疾病名６０５、及び入院患者に投与された薬剤の名称を記録する薬剤名６０６から構成される。

例えば、レコード６１１は、病院名「Ａ市民病院」に入院した入院患者ＩＤ「１」の入院患者は、入院日「２０１２／１／４」に入院して退院日「２０１２／２／３」に退院し、病名は疾病名「Ａ」であり、入院中に投与された医薬品は薬剤名「Ｘ」であったことを表す。

図７は、図９の信頼度付与処理の中で使用される信頼度算出結果情報の例である信頼度算出情報テーブル２０３ｇのデータ構造である。図７は、図６のＤＢ検索結果情報に基づいて、病院ごとに入退院日の記載の信頼度を後述する判定ロジックにより算出した結果である。信頼度算出情報テーブル２０３ｇは、配列構造を成し、１以上のレコードを格納可能である。信頼度算出情報テーブル２０３ｇの各レコードは、病院名６０１、および入退院日の信頼度をパーセンテージで表す入退院日の信頼度（％）７０１から構成される。

本実施例に置ける入退院日の信頼度は、次の計算式『入退院日の信頼度ＤＢ（％）＝１００×（１−（ＤＢ検索結果情報テーブル２２５ｂにおいて病院名が同じレコード群の中で入院日よりも退院日が古い誤記のあるレコード数）÷（ＤＢ検索結果情報テーブル２２５ｂにおいて病院名が同じレコード数））』にて算出した。即ち、信頼度は、対象となる全レコード数に対する、誤記のないレコード数の割合である。

例えば、レコード７１１は、病院名「Ａ市民病院」の病院のレコード群においては、入退院日よりも退院日が古い誤記のあるレコードが無く、この誤記の定義において入退院日の信頼度（％）「１００」であることを表す。また、レコード７１２は、病院名「Ｂ医院」の病院のレコード群においては、入退院日の信頼度（％）「８０」であり、上記定義の誤記のレコードが２０％存在することを表す。なお、信頼度の計算は任意の評価関数、又はアルゴリズムでもよい。

図８は、図５の信頼度付与処理５０５の出力である信頼度付与ＤＢ検索結果情報の例である信頼度付与ＤＢ検索結果情報テーブル２２５ｃのデータ構造である。図８は、図６のＤＢ検索結果と図７の信頼度算出情報を統合した結果である。信頼度付与ＤＢ検索結果情報テーブル２２５ｃは、ＤＢ検索結果情報テーブル２２５ｂと信頼度算出情報テーブル７００の自然結合をとる操作から得られる。

自然結合をとる操作のＳＱＬ文の例は、『ＳＥＬＥＣＴＤＢ検索結果情報テーブル２２５ｂ.*，入退院日の信頼度（％）ＦＲＯＭＤＢ検索結果情報テーブル２２５ｂ，信頼度算出情報テーブル２０３ｇＷＨＥＲＥＤＢ検索結果情報テーブル２２５ｂ.病院名＝信頼度算出情報テーブル２０３ｇ.病院名』である。

クレンジングサーバ２０３の信頼度付与処理部２０３ｂが、前記ＳＱＬ文を、ＤＢサーバ２０４のＤＢ操作処理部２０４ｂに伝送し、ＤＢ操作処理部２０４ｂがＳＱＬ文を実行することにより信頼度付与ＤＢ検索結果情報テーブル２２５ｃを得る。

信頼度付与ＤＢ検索結果情報テーブル２２５ｃは、配列構造を成し１以上のレコードを格納可能である。信頼度付与ＤＢ検索結果情報テーブル２２５ｃの各レコードは、病院名６０１、入院患者ＩＤ６０２、入院日６０３、退院日６０４、疾病名６０５、薬剤名６０６、および入退院日の信頼度（％）７０１から構成される。

例えば、レコード８１１は、病院名「Ａ市民病院」に入院した入院患者ＩＤ「１」の入院患者は、入院日「２０１２／１／４」、退院日「２０１２／２／３」と記録されており、病名は疾病名「Ａ」、入院中に投与された医薬品は薬剤名「Ｘ」であり、入退院日の記録に誤記がないことの信頼度は、入退院日の信頼度（％）「１００」であることを表す。また、レコード８１２は、病院名「Ｂ医院」に入院した入院患者ＩＤ「１」の入院患者は、入院日「２０１２／４／５」、退院日「２０１２／４／３」と記録されており、病名は疾病名「Ａ」、入院中に投与された医薬品は薬剤名「Ｘ」であり、入退院日の記録に誤記がないことの信頼度は、入退院日の信頼度（％）「８０」であることを表す。

信頼度に基づいて、解析の対処とすべきデータ、あるいはデータの提供先などを決めることができる。

（信頼度付与の処理フロー）
次に、図９を用いて、クレンジングサーバ２０３の信頼度付与処理部２０３ｂによる信頼度付与処理５０５の動作を説明する。まず、信頼度付与処理部２０３ｂは、プロセス管理部２０１ｄが伝送したＤＢ検索結果情報の格納先アドレスからＤＢ検索結果情報テーブル２２５ｂを構成する属性を用いた、信頼度の判定パターンを選択する。本実施例は、信頼度付与処理部２０３ｂが、ディスク２０３ｄの信頼度判定パターンＤＢ２０３ｅから、解析内容の文章にある『平均入院期間』の算出に必要な属性である入院日６０３と退院日６０４の信頼度を判定するための、前記の計算式『入退院日の信頼度ＤＢ（％）＝１００ ×（１−（ＤＢ検索結果情報テーブル６００において病院名が同じレコード群の中で入院日６０３よりも退院日６０４の日付が古い誤記のあるレコード数）÷（ＤＢ検索結果情報テーブル２２５ｂにおいて病院名が同じレコード数））』による判定パターンを選択した例である（判定パターン選択処理９０１）。

判定パターン選択処理９０１の結果、必要な判定パターンが信頼度判定パターンＤＢ２０３ｅに存在する場合は信頼度判定処理９０４を実行し、必要な判定パターンが存在しない場合は、必要な任意の評価関数やアルゴリズムのライブラリと組み合わせる判定パターン作成処理９０３を行い、利用者が必要な信頼度の判定パターンを作成して選択する（判定処理９０２）。

処理９０１〜９０３により信頼度の判定パターンが決定すると、信頼度処理部２０３ｂは、選択した信頼度の判定パターンの信頼度を算出し、算出結果をディスク２０３ｄに格納する。図７として説明した信頼度算出情報テーブル２０３ｇは、判定パターンとして前記の計算式『入退院日の信頼度ＤＢ（％）＝１００×（ＤＢ検索結果情報テーブル２２５ｂにおいて病院名が同じレコード群の中で入院日６０３よりも退院日６０４の日付が古い誤記のあるレコード数）÷（ＤＢ検索結果情報テーブル６００において病院名が同じレコード数）』を選択した場合の、信頼度判定処理結果の例である（信頼度判定処理９０４）。

信頼度算出情報テーブル２０３ｇがディスク２０３ｄに格納されると、信頼度付与処理部２０３ｂはＤＢ検索結果情報テーブル２２５ｂに、算出した信頼度の情報を付与する。本実施例では、ＤＢ検索結果情報テーブル２２５ｂと信頼度算出情報テーブル２０３ｇの自然結合をとる操作により、信頼度付与ＤＢ検索結果情報テーブル２２５ｃを得た。前記のとおり、自然結合をとる操作のＳＱＬ文の例は、『ＳＥＬＥＣＴＤＢ検索結果情報テーブル２２５ｂ.＊，入退院日の信頼度（％）ＦＲＯＭＤＢ検索結果情報テーブル２２５ｂ，信頼度算出情報テーブル２０３ｇＷＨＥＲＥＤＢ検索結果情報テーブル２２５ｂ.病院名＝信頼度算出情報テーブル２０３ｇ.病院名』である。

クレンジングサーバ２０３の信頼度付与処理部２０３ｂが、前記ＳＱＬ文を、ＤＢサーバ２０４のＤＢ操作処理部２０４ｂに伝送し、ＤＢ操作処理部２０４ｂがＳＱＬ文を実行することにより信頼度付与ＤＢ検索結果情報テーブル２２５ｃを得る。なお、信頼度の付与の方法は信頼度の判定パターンに依存するため、信頼度の判定パターンに応じた任意の方法でもよい（信頼度データ追加処理９０５）。信頼度付与処理部２０３ｇは、信頼度付与ＤＢ検索結果情報テーブル２２５ｃをストレージ装置１０４のディスクプール２２５に格納した後、処理を終了する。

（解析経過の画面表示例）
次に、図１０を用いて、本実施例に関わるＧＵＩのうち、一連の解析の内容と結果を一覧表示する解析経過サマリ表示画面１０００の表示例を説明する。解析経過サマリ表示画面１０００は、Ｗｅｂサーバ２０１の画面表示処理部２０１ｃがネットワーク１０２、ルータ１０１およびネットワーク１０を介してＰ大学病院２やＱ製薬会社３のＷｅｂ端末に表示し、臨床研究者や市販後調査担当者が、Ｗｅｂ端末のディスプレイにより参照する画面である。現在の解析結果のみを表示するのではなく、それまでに行った解析経過サマリを表示することで、利用者は、これらの情報を、解析結果に対する問題点の把握、解析目的の見直しなどに役立てることができる。

解析経過サマリ表示画面１０００は、配列構造を成し、１以上のレコードを表示可能である。各レコードは、解析の順番を表示するＮｏ.（１００１）、解析内容の文章を表示する解析内容１００２、対象データの絞込み内容を表示するデータ絞込み１００３、対象データのレコード数を表示するレコード数１００４、解析結果の文章を表示する解析結果１００５から構成される。

例えば、レコード１０１１は、解析順序がＮｏ「１」番目の解析内容が「疾病Ａ患者の平均入院期間は、薬剤Ｘをしようした場合と、薬剤Ｙを使用した場合のどちらが短いか？」においては、解析におけるデータの絞込みは行ないデータの絞込み「−」の条件で対象データの規模を示すレコード数は「２５３１４３」であり、解析結果は「薬剤Ｙを使用した場合の方が、平均入院期間が短い（Ｘ：３５日、Ｙ：２７日）」であったことを表す。

次に、図１１を用いて、本実施例に関わるＧＵＩのうち、最新の解析結果を詳細に表示する解析結果表示画面１１００の表示例を説明する。解析結果表示画面１１００は、Ｗｅｂサーバ２０１の画面表示処理部２０１ｃがネットワーク１０２、ルータ１０１およびネットワーク１０を介してＰ大学病院２やＱ製薬会社３のＷｅｂ端末に表示し、臨床研究者や市販後調査担当者が、Ｗｅｂ端末により入出力を行う画面である。

解析結果表示画面１１００は、解析の対象データの検索元を表示する領域１１０１、薬剤別の対象データの信頼度分布を表示する領域１１０２および領域１１０３、薬剤別に解析目標値である平均入院期間の算出値を表示する領域１１０４および１１０５、対象データのうち、解析目標値の算出に使用する使用データの信頼度の範囲の下限を表示する領域１１０６、同上限を表示する領域１１０７、ユーザが対象データのうち使用するデータの絞込みあるいは補正を実行する際に押下し、後に図１２で説明する対象データ絞込み入力画面入力の表示の契機となるボタン１１０８、解析結果の文章を表示する領域１１０９、およびユーザが解析内容を絞込む際に押下し、後に図２５で説明する解析内容絞込み入力画面の表示の契機となるボタン１１１０から構成される。

例えば、図１１の表示例は、解析の対象データの検索元が対象データ「退院時サマリＤＢ」であり、薬剤Ｘの平均入院期間が「３５日」、その算出に使用したデータの信頼度分布が領域１１０２に示したグラフであり、薬剤Ｙの平均入院期間が「２７日」、その算出に使用したデータの信頼度分布が領域１１０３に示したグラフであり、対象データのうち使用したデータの信頼度の範囲は「０％」〜「１００％」、すなわち全てであり、解析結果の文章が「薬剤Ｙを使用した場合の方が、平均入院期間が短い」であったことを表す。

以下では、図１０に示した解析経過、及び図１１に示した解析結果が表示された後で、利用者が、画面中の種々の操作ボタンを押したときに起動される処理及び表示される画面について説明する。操作ボタンに対応して起動される以下の処理では、図５に示した処理ステップの一部と同じ処理が実行される。その場合は、図５のステップと同じ符号を処理フロー中に記載する。

（対象データ絞込みの画面表示例）
図１２を用いて、本実施例に関わるＧＵＩのうち、対象データの絞込み条件を入力する対象データ絞込み入力画面１２００の表示例を説明する。対象データ絞込み入力画面１２００は、ユーザがＰ大学病院２やＱ製薬会社３のＷｅｂ端末において図１１に示した解析結果表示画面１１００の対象データ絞込み・補正ボタン１１０８を押下すると、押下したという情報をＷｅｂ端末がネットワーク１０およびルータ１０１およびネットワーク１０２を介してＷｅｂサーバ２０１の画面遷移処理部２０１ｂに伝送し、伝送を受けた画面遷移処理部２０１ｂが画面表示処理部２０１ｃに対して対象データ絞込み入力画面１２００をＷｅｂ端末に表示する指示を伝送し、指示の伝送を受けた画面表示処理部２０１ｃがネットワーク１０２、ルータ１０１およびネットワーク１０を介してＰ大学病院２やＱ製薬会社３のＷｅｂ端末に表示し、臨床研究者や市販後調査担当者が、Ｗｅｂ端末により入出力を行う画面である。

対象データ絞込み入力画面１２００は、対象データを選択するラジオボタン１２０１、解析の対象データの検索元を表示する領域１１０１、薬剤別の対照データの信頼度分布を表示する領域１２１１および領域１２１２、解析目標値の算出に使用する使用データの信頼度の範囲の下限を指定する領域１２１４、同上限を指定する領域１２１５、ユーザが対象データの補正を実行する際に押下し、後に図１３で説明する補正データ反映処理の開始の契機となる補正データ作成ボタン１２１６、指定した対象データに対して信頼度の範囲設定による対象データの絞込みを実施し解析を再実行することを指示する解析再実行ボタン１２１７および指定した内容を消去するクリアボタン１２１８から構成される。例えば、図１２の表示例では、対象データとして「退院時サマリＤＢ」を選択した場合の薬剤Ｘおよび薬剤Ｙの信頼度の分布が領域１２１１および１２１２に示すグラフのとおり、概ね信頼度５０％〜１００％の間に主に分布することを表す。

（補正データ反映の処理フロー）
次に、図１３を用いて、Ｗｅｂサーバ２０１のプロセス管理部２０１ｄによる補正データ反映処理の動作例を説明する。補正データ反映処理は、図１２の補正データ作成ボタン１２１６が押されたときに起動される。本実施例における補正データは、解析目標値の算出に使用する使用データの信頼度の範囲の下限（１２１４）及び上限（１２１５）を変更したものである。

まず、プロセス管理部２０１ｄは、信頼度付与ＤＢ検索結果情報テーブル２２５ｃの格納先アドレス、信頼度付与に用いた信頼度判定パターンの識別子および補正データの作成の指示を、クレンジングサーバ２０３の補正データ作成処理部２０３ｃへ伝送する。伝送を受けた補正データ作成処理部２０３ｃは、後の図１４にて説明する補正データ作成処理を行って補正データを作成し、補正データの格納先アドレスをプロセス管理部２０１ｄへ伝送する（補正データ作成処理１３０１）。

補正データの格納先アドレスの伝送を受けたプロセス管理部２０１ｄは、補正データの格納先アドレスをクレンジングサーバ２０３の信頼度付与処理部２０３ｂへ伝送する。信頼度付与処理部２０３ｂは、補正データに対し、図９にて説明した信頼度付与処理５０５を実行して、補正データの信頼度を算出して補正データに付与し、信頼度付与補正データテーブルとして格納し、その格納先アドレスをＷｅｂサーバ２０１のプロセス管理部２０１ｄへ伝送する（信頼度付与処理５０５）。

信頼度付与補正データテーブルの格納先アドレスの伝送を受けたＷｅｂサーバ２０１のプロセス管理部２０１ｄは、同アドレスを解析サーバ２０２のグラフデータ作成処理部２０２ｆへ伝送する。伝送を受けたグラフデータ作成処理部２０２ｆは、信頼度付与補正データテーブルの対象データの信頼度の分布を示すグラフを表示するためのグラフデータ（例．ＣＳＶ形式データ、グラフの種類及び軸を定義するデータ）を作成し、ストレージ装置１０４のキャッシュメモリ２２３に格納し、グラフデータの格納先アドレスをＷｅｂサーバ２０１のプロセス管理部２０１ｄへ伝送する（グラフデータ作成処理５０７）。

グラフデータの格納先アドレスの伝送を受けたプロセス管理部２０１ｄは、グラフデータを画面表示処理部２０１ｃへ伝送する。伝送を受けた画面表示処理部２０１ｃは、後に図２１にて説明する対象データ絞込み・補正データ選択画面２１００の情報を作成し、ネットワーク１０２、ルータ１０１およびネットワーク１０を介して、Ｐ大学病院２やＱ製薬会社３のユーザのＷｅｂ端末へ伝送し（データ絞込み画面表示処理１３０２）、補正データ反映処理を終了する。

（補正データ作成の処理フロー）
次に、図１４を用いて、クレンジングサーバ２０３の補正データ作成処理部２０３ｃによる補正データ作成処理（１３０１）の動作例を説明する。

まず、補正データ作成処理部２０３ｃは、Ｗｅｂサーバ２０１のプロセス管理部２０１ｄから信頼度付与ＤＢ検索結果情報テーブル２２５ｃの格納先アドレス、信頼度付与に用いた信頼度判定パターンの識別子および補正データの作成の指示の伝送を受けると、信頼度判定パターンＤＢ２０３ｅから信頼度付与に用いられた信頼度判定パターンを、識別子により特定し、その信頼度判定パターンにより誤記と判定される信頼度付与ＤＢ検索結果情報テーブル２２５ｃのレコードを特定して複製し、後に図１５で説明する補正対象データテーブル１５００としてストレージ装置１０４のキャッシュメモリ２２３に格納する。

補正データ作成処理部２０３ｃは、補正対象データテーブル１５００の属性をキーとし、補正パターンＤＢ２０３ｆから、補正に必要な属性を備えたＤＢの候補、およびそのＤＢの情報を利用する際の補正パターンのペアを選択する。本実施例は、補正データ作成処理部２０３ｃが、補正に必要な属性を備えたＤＢの候補として、後に図１６にて説明する医療データセンター４のレセプトＤＢ１６００と、後に図１７にて説明するＡ市民病院６およびＣ大学病院８の医事会計システムＤＢ１７００を選択した例である。レセプトＤＢの補正パターンとしては、後に図１６で示すレセプトＤＢ検索結果情報テーブル１６００と補正対象データテーブル１５００の属性の定義の差異を補正する『図１６の「診療開始日」を「入院日」とみなし、図１６の「診察開始日」に「診療実日数」を加えた日付を「退院日」とみなす』という補正パターンを選択する。また、医事会計システムＤＢの補正パターンとして、後に図１７で示す医事会計システムＤＢ検索結果情報テーブル１７００と補正対象データテーブル１５００の属性の定義が同一のため『補正処理不要』という補正パターンを選択する（補正パターン選択処理１４０１）。

補正パターン選択処理１４０１の結果、必要な補正パターンがあるかどうかを判定し（１４０２）、必要な補正パターンが補正パターンＤＢ２０３ｆに存在する場合は補正パターン適用処理１４０４を実行し、必要な補正パターンが存在しない場合は、補正に利用するＤＢと組み合わせる補正の方法を作成し、補正パターンＤＢ２０３ｆに追加する補正パターン作成処理１４０３を行った上で、必要な補正パターンを作成選択する（判定処理１４０２、補正パターン作成処理１４０３）。

補正データ作成処理部２０３ｃは、処理１４０１〜１４０３により決定したＤＢの候補と各ＤＢの補正パターンごとに、補正対象データテーブル１５００の「入院日」および「退院日」の補正データを抽出し、補正対象データテーブル１５００の当該レコードを更新し、補正対象データテーブル１５００とは別にキャッシュメモリ２２３上に格納する。本実施例では、医療データセンター４のレセプトＤＢの情報を用いた補正結果であるレセプトＤＢ補正パターン結果データテーブルと、Ａ市民病院６およびＣ大学病院８の医事会計システムＤＢの情報を用いた補正結果である医事会計システムＤＢ補正パターン結果データテーブルの２つが、キャッシュメモリ２２３上に格納される（補正パターン適用処理１４０４）。

補正パターン適用処理１４０４が完了すると、補正データ作成処理部２０３ｃは、各補正結果のテーブルごとに、信頼度付与ＤＢ検索結果情報テーブル２２５ｃの同一レコードを更新したテーブルを作成し、ストレージ装置１０４のディスクプール２２５に格納する。本実施例では、補正データ作成処理部２０３ｃは、レセプトＤＢ補正パターン結果データテーブルの情報を信頼度付与ＤＢ検索結果情報テーブル２２５ｃの同一レコードと置き換えたレセプトＤＢ補正結果情報テーブルと、医事会計システムＤＢ補正パターン結果データテーブルの情報を信頼度付与ＤＢ検索結果情報テーブル２２５ｃの同一レコードと置き換えた医事会計システムＤＢ補正結果情報テーブルの２つを作成し、ストレージ装置２２５ｃのディスクプールに格納し、格納先のアドレスをＷｅｂサーバ２０１のプロセス管理部２０１ｄに伝送し（補正データ追加処理１４０５）、補正データ作成処理を終了する。

（補正データ作成処理に関するデータ構造）
次に、図１５〜図１７を用いて、本実施例の補正データ作成処理に関するデータ構造を説明する。

図１５は、図１４の補正パターン選択処理１４０１において作成される補正対象データテーブル１５００のデータ構造である。補正対象データは、例えば、図１５のように入院日と退院日の日付の順序が逆転している、矛盾のあるデータである。補正対象データテーブル１５００は、図６にて説明したＤＢ検索結果情報テーブルと同一の構造を成し、図９の信頼度付与処理にて誤記と判定されたレコードから構成される。たとえば、レコード６１２、レコード６１３およびレコード６１４は、入院日よりも退院日の日付が古いため、図９の信頼度付与処理において誤記のあるレコードとして判定されたレコードを表す。

図１６は、図１４の補正パターン選択処理１４０１において用いられる、医療情報センター４のレセプトＤＢを補正対象データテーブル１５００の属性６０１〜６０６をキーとして類似検索した結果であるレセプトＤＢ検索結果情報テーブル１６００のデータ構造である。レセプトＤＢ検索結果情報テーブル１６００は、図６に示したＤＢ検索結果情報テーブル２２５ｂと類似の配列構造を成し、１以上のレコードを格納可能である。

レセプトＤＢ検索結果情報テーブル１６００の各レコードは、図６にて説明したＤＢ検索結果情報テーブルと同一の病院名６０１、患者ＩＤ６０２、疾病名６０５、薬剤名６０６に加え、医科入院レセプトデータにおいて入院日を示す診療開始日１６０１と、入院期間を示す診療実日数１６０２から構成される。例えば、レコード１６１１は病院名「Ａ市民病院」の病院に入院した患者ＩＤ「１」の患者が、診療を開始した日付が診療開始日「２０１２／１／４」であり、診療に要した実日数が診療実日数「３０」であり、患者の病名は疾病名「Ａ」であり、投与された医薬品名は薬剤名「Ｘ」であることを表す。

図１７は、図１４の補正パターン選択処理１４０１において用いられる、Ａ市民病院６およびＣ大学病院８の医事会計システムＤＢを補正対象データテーブル１５００の属性６０１〜６０６をキーとして類似検索した結果である医事会計システムＤＢ検索結果情報テーブル１７００のデータ構造である。医事会計システムＤＢ検索結果情報テーブル１７００は、配列構造を成し、１以上のレコードを格納可能である。医事会計システムＤＢ検索結果情報テーブル１７００の各レコードは、図６にて説明したＤＢ検索結果情報テーブルと同一の属性６０１〜６０６から構成され、各レコードは図６と同一の意味を表す。

（補正データ反映処理に関するデータ構造）
次に、図１８〜図２０を用いて、本実施例の図１３に示した補正データ反映処理に関するデータ構造を説明する。図１８〜図２０は、図６と図７を統合して図８を生成した場合に対応し、補正データ反映処理に関するデータ構造である。

図１８は、図１３の補正データ作成処理１３０１の出力となる補正データの例である、レセプトＤＢ補正結果情報テーブル１８００のデータ構造である。レセプトＤＢ補正結果情報テーブル１８００は、配列構造を成し１以上のレコードを格納可能である。レセプトＤＢ補正結果情報テーブル１８００の各レコードは、図８にて説明した信頼度付与ＤＢ検索結果情報テーブル２２５ｃと同一の属性６０１〜６０６および７０１から構成される。レセプトＤＢ補正結果情報テーブルの各レコードは、図８と比べ、入院日よりも退院日が古い誤記のあるレコードが補正されている。たとえば、レコード１８１１、レコード１８１２およびレコード１８１３は、図８では入院日よりも退院日が古い誤記のあるレコードであったが、図１８ではレセプトＤＢの医科入院レセプトデータの診療開始日と診療実日数による補正により誤記が修正された結果のレコードを表す。

図１９は、クレンジングサーバ２０３の信頼度付与処理部２０３ｂが、図１３の信頼度付与処理５０５の中において算出するレセプトＤＢ補正結果信頼度算出テーブル１９００のデータ構造である。レセプトＤＢ補正結果信頼度算出テーブル１９００は、配列構造を成し１以上のレコードを格納可能である。レセプトＤＢ補正結果信頼度算出テーブル１９００の各レコードは、図９と同一の属性６０１および属性７０２から構成される。レセプトＤＢ補正結果信頼度算出テーブル１９００の各レコードは、図９と比べ、レセプトＤＢ補正結果情報テーブル１８００の属性６０１〜６０６からなるレコードを入力として算出されている点が異なる。たとえば、図９のレコード７１２は病院名「Ｂ医院」の病院の入退院日の信頼度（％）「８０」であったのに対し、レコード１９１１は同病院の入退院日の信頼度（％）「９１．２」となっており、レセプトＤＢによる補正によって入退院日の信頼度が改善していることを表す。

（信頼度付与処理の出力データ）
図２０は、クレンジングサーバ２０３の信頼度付与処理部２０３ｂが、図１３の信頼度付与処理５０５の出力としてストレージ装置１０４のディスクプール２２５に格納する信頼度付与補正データテーブルの例である、信頼度付与レセプトＤＢ補正データテーブル２０００のデータ構造である。信頼度付与レセプトＤＢ補正データテーブル２０００は、配列構造を成し、１以上のレコードを格納可能である。

信頼度付与レセプトＤＢ補正データテーブル２０００は、図１８にて説明したレセプトＤＢ補正結果情報テーブル１８００と同一の属性６０１〜６０６および７０１から構成される。信頼度付与レセプトＤＢ補正データテーブル２０００の各レコードは、図１８と比べ、図１９で示した改善された入退院日の信頼度（％）が各レコードに反映されている。たとえば、図１８のレコード１８１１は病院名「Ｂ医院」の病院のレコードであり入退院日の信頼度（％）「８０」であったのに対し、図１９の２０１１のレコードは病院名「Ｂ医院」の病院のレコードであり入退院日の信頼度（％）「９１．２」となっており、図１９で示した改善された入退院日の信頼度を反映していることを表す。

（絞込み補正データの選択画面）
次に、図２１を用いて、本実施例に関わるＧＵＩのうち、対象データの絞込み条件および補正データの使用を指定する対象データ絞込み・補正データ選択画面２１００の表示例を説明する。対象データ絞込み入力画面２１００は、Ｗｅｂサーバ２０１の画面表示処理部２０１ｃが、ネットワーク１０２、ルータ１０１およびネットワーク１０を介してＰ大学病院２やＱ製薬会社３のユーザのＷｅｂ端末に表示する。

対象データ絞込み・補正データ選択画面２１００は、対象データを選択するラジオボタン２１１０、対象データの検索元ＤＢを示す領域１１０１、対象データの信頼度の分布を薬剤の種類別に示す領域２１１１と領域２１１２、対象データのうち使用するデータの信頼度の範囲の下限を指定する領域２１１３、範囲の上限を指定する領域２１１４、補正データ１を選択するラジオボタン２１２０、補正データ１の補正データの検索元ＤＢを示す領域２１２１、対象データに補正データ１による補正を加えたデータの信頼度の分布を薬剤の種類別に示す領域２１２２と領域２１２３、対象データに補正データ１による補正を加えたデータのうち使用するデータの信頼度の範囲の下限を指定する領域２１２４、範囲の上限を指定する領域２１２５、補正データ２を選択するラジオボタン２１３０、補正データ２の補正データの検索元ＤＢを示す領域２１３１、対象データに補正データ２による補正を加えたデータの信頼度の分布を薬剤の種類別に示す領域２１３２と領域２１３３、対象データに補正データ２による補正を加えたデータのうち使用するデータの信頼度の範囲の下限を指定する領域２１３４、範囲の上限を指定する領域２１３５、ユーザが選択し使用範囲を指定したデータの解析の再実行の契機となる解析再実行ボタン２１４０、および指定した内容を消去するクリアボタン２１５０から構成される。

例えば、図２１の表示例は、ユーザが補正データ１を選択するラジオボタン２１２０を選択したこと、選択した補正データ１の内容は対象データである「退院時サマリＤＢ」の検索結果のデータに対して補正データ１「レセプトＤＢ」の検索結果のデータによる補正を加えたデータであること、補正データ１の信頼度の分布が領域２１２２および領域２１２３のグラフで示されること、解析に使用する補正データの信頼度は下限「９０％」上限「１００％」が指定されたことを表す。また、図２１の表示例は、ユーザが解析再実行ボタン２１４０を押下すると、Ｗｅｂ端末が、ネットワーク１０、ルータ１０１およびネットワーク１０２を介して、Ｗｅｂサーバ２０１のプロセス管理部２０１ｄへユーザが指定した補正データ１の格納先アドレスと使用するデータの信頼度の範囲の下限「９０％」および上限「１００％」の情報を伝送する。

（絞込み解析の処理フロー）
次に、図２２を用いて、Ｗｅｂサーバ２０１のプロセス管理部２０１ｄによる対象データ絞込み解析処理の動作例を説明する。

まず、プロセス管理部２０１ｄは、図２１でユーザが指定した補正データ１の格納先アドレスおよび使用するデータの信頼度の範囲の下限「９０％」および上限「１００％」の情報の伝送を受けると、上記情報を解析サーバ２０２のＤＢクエリー作成処理部２０２ｄへ伝送する。上記情報の伝送を受けたＤＢクエリー作成処理部２０２ｄは、補正データ１のテーブルから『属性「入退院日の信頼度（％）」の値が、「９０％」以上かつ「１００％」以下であるレコード』を抽出するＤＢクエリーを作成し、プロセス管理部２０１ｄへ伝送する。上記ＤＢクエリーを受けたプロセス管理部２０１ｄは、ＤＢサーバ２０４のＤＢ操作処理部２０４ｂへ、補正データ１の格納先アドレスおよび上記ＤＢクエリーを伝送する。伝送を受けたＤＢ操作処理部２０４ｂは、補正データ１のテーブルから同ＤＢクエリーに従いレコードを抽出し、補正データ１絞込みデータテーブルとしてストレージ装置１０４のディスクプール２２５に格納し、その格納先アドレスをＷｅｂサーバ２０１のプロセス管理部２０１ｄへ伝送する（対象データ絞込み処理２２０１）。

プロセス管理部２０１ｄは、補正データ１絞込みデータテーブルの格納先アドレスの伝送を受けると、上記アドレスを解析サーバ２０２の目標値算出処理部２０２ｅへ伝送する。目標値算出処理部２０２ｅは、図５の目標値算出処理５０６の処理を行い、解析目標値の算出結果と算出に用いた対象データのペアをストレージ装置１０４のキャッシュメモリ２２３に格納し、上記格納先アドレスをグラフデータ作成処理部２０２ｆへ伝送する（目標値算出処理５０６）。

解析目標値と対象データのペアの格納先アドレスの伝送を受けたグラフデータ作成処理部２０２ｆは、上記アドレスの解析目標値および対象データの信頼度の分布を示すグラフを表示するためのグラフデータ（例．ＣＳＶ形式データ、グラフの種類及び軸を定義するデータ）を作成し、ストレージ装置１０４のキャッシュメモリ２２３に格納し、グラフデータの格納先アドレスをＷｅｂサーバ２０１のプロセス管理部２０１ｄへ伝送する（グラフデータ作成処理５０７）。

解析結果の文章データの格納先アドレスの伝送を受けたプロセス管理部２０１ｄは、解析内容の文章、選択したＤＢの識別子、解析結果の文章、解析目標値および対象データの信頼度の分布を示すグラフデータを画面表示処理部２０１ｃへ伝送し（解析結果表示処理５０９）、対象データ絞込み解析処理を終了する。

（解析経過サマリ表示画面）
次に、図２３を用いて、本実施例に関わるＧＵＩのうち、図１０にて説明した一連の解析の内容と結果を一覧表示する解析経過サマリ表示画面１０００の、対象データ絞込み・補正を実施した後の表示例を説明する。以下、図１０との変更点に絞り説明する。

図２３で示した解析経過サマリ表示画面１０００は、図１０と比べ、レコード２３０１が追加された点が異なる。レコード２３０１は、解析順序がＮｏ.「２」番目の解析であること、解析内容「−」は解析内容の変更が無いこと、データ絞込み「・補正データ使用・信頼度９０−１００％」は補正データを使用し解析に使用するデータを信頼度が９０％以上１００％以下のデータに絞ったこと、レコード数「２１３８７９」は補正データを使用しデータの絞込みを行った結果のレコード数、そのレコードを用いた解析結果が解析結果「薬剤Ｘを使用した場合の方が、平均入院期間が短い（Ｘ：２５日、Ｙ：３５日）」であることを表す。

図２３の解析経過サマリ表示画面１０００が示す一連の解析の経過の意味は、１番目に行った解析の結果は、レコード１０１１が示すとおり「薬剤Ｙ」の方が平均入院期間は短いことを示したのに対し、２番目に行った対象データ絞込み・補正を行った上での解析は、レコード２３０１が示すとおり補正データを使用し入退院日の信頼度が高いデータに絞って解析を再実行した結果、「薬剤Ｘ」の方が平均入院期間は短いという異なる結果が出ていることを表す。

（対象データ絞込み・補正実施後の解析結果表示画面）
次に、図２４を用いて、本実施例に関わるＧＵＩのうち、図１１にて説明した最新の解析結果を詳細に表示する解析結果表示画面１１００の、対象データ絞込み・補正を実施した後の表示例を説明する。以下、図１１との変更点に絞り説明する。

図２４で示した解析結果表示画面１１００は、図１１と比べ、補正データの検索元ＤＢを示す領域２１２１が追加された点が異なる。領域２１２１は、補正データの検索元として医療データセンター４のレセプトＤＢに格納された医科入院レセプトデータを対象としたことを表す。領域１１０２と領域１１０３は、補正後の薬剤別の対象データの信頼度の分布を表す。領域１１０４と領域１１０５と領域１１０９は、対象データ絞込み・補正を行った上で解析を再実行した結果、薬剤Ｘの平均入院期間は「２５日」、薬剤Ｙの平均入院期間は「３５日」となり、解析結果は図１０とは逆の「薬剤Ｘを使用した場合の方が、平均入院期間が短い」という結果になったことを表す。

（解析内容絞込み入力画面）
次に、図２５を用いて、本実施例に関わるＧＵＩのうち、ユーザが解析内容の絞込み内容を入力する解析内容絞込み入力画面２５００の表示例を説明する。解析内容絞込み入力画面２５００は、ユーザが解析結果表示画面１１００の解析内容絞込みボタン１１１０を押下したことを契機とし、Ｗｅｂサーバ２０１の画面表示処理部２０１ｃがネットワーク１０２、ルータ１０１およびネットワーク１０を介してＰ大学病院２やＱ製薬会社のＷｅｂ端末に表示し、臨床研究者や市販後調査担当者が、Ｗｅｂ端末の入出力デバイスを用いて解析内容の絞込み内容を入力する画面である。

解析内容絞込み画面２５００は、解析内容の絞込み内容の文章を入力する領域２５０１、入力した内容による解析内容の絞りこみの実行を指示する絞込み実行ボタン２５０２、および入力した内容を取り消すボタン２５０３から構成される。ユーザがＷｅｂ端末の画面上でボタン２５０２を押下すると、Ｗｅｂ端末が、領域２５０１に入力された解析内容の絞込み内容の文章を、ネットワーク１０、ルータ１０１およびネットワーク１０２を介してＷｅｂサーバ２０１の画面遷移処理部２０１ｂに伝送する。

伝送を受けた画面遷移処理部２０１ｂは、図３にて説明したとおり、画面表示処理部２０１ｃに対して解析経過サマリ画面および解析結果表示画面からなる画面３０２をＷｅｂ端末に表示することを指示する情報を伝送する。また、画面遷移処理部２０１ｂは、プロセス管理部２０１ｄに解析内容の絞込み内容の文章を伝送する。

画面遷移処理部２０１ｂからの伝送を受けたプロセス管理部２０１ｄは、伝送された解析内容の文章を入力とする図５に示したヘルスケアデータ解析処理を実行し、情報の作成および画面表示処理部２０１ｃへの伝送を行う。

プロセス管理部２０１ｄから情報の伝送を受けた画面表示処理部２０１ｃは、Ｐ大学病院２やＱ製薬会社３のＷｅｂ端末に対して、ネットワーク１０２、ルータ１０１およびネットワーク１０を介して解析経過サマリ画面および解析結果表示画面からなる画面３０２を表示する。画面３０２の各画面の詳細は、後の図２９および図３０にて説明する。

（解析内容絞込み時の信頼度付与処理に関するデータ構造）
次に図２６〜図２８を用いて、本実施例の解析内容の絞込みにおける信頼度付与処理に関するデータ構造を説明する。

図２６は、図１の医薬情報センター５が保持する医薬品情報ＤＢの検索結果の例である医薬品情報ＤＢ検索結果テーブル２６００のデータ構造である。同テーブルは、プロセス管理部２０１ｄが、ユーザが図２５の領域２５０１に入力した解析内容「標準的な検査時間で投薬後の検査を行った患者のみを対象とした場合は？」を入力とし、医薬情報センター５の医薬品情報ＤＢに対して、図５のヘルスケアデータ解析処理の処理５０１〜５０４を実施した出力結果として得られる。医薬品情報ＤＢ検索結果テーブル２６００は、クレンジングサーバ２０３の信頼度付与処理部２０３ｂが、図５の信頼度付与処理５０５を実行する際、投薬後の検査時間の信頼度の判定基準として参照される。

医薬品情報ＤＢ検索結果テーブル２６００は、配列構造を成し、１以上のレコードを格納可能である。医薬品情報ＤＢ検索結果テーブル２６００の各レコードは、医薬品の名称を示す薬剤名２６０１、医薬品が対象とする疾病を示す対象疾病２６０２、医薬品を投与した後の血液検査を行う標準時間を示す投与後血液検査時間２６０３、および投与後血液検査時に重篤な副作用の危険性の有無の判定基準と成る薬剤の血中濃度の条件を示す薬剤の血中濃度２６０４から構成される。例えば、レコード２６１１は、薬剤名「薬剤Ｘ」の医薬品は、投与対象となる疾病が対象疾病「疾病Ａ」であること、投与後の血液検査の標準時間が投与後血液検査時間「７２時間」であること、投与後血液検査時間経過時の重篤な副作用の危険性を判定する基準が薬剤の血中濃度「０．００００１モル濃度以上」であることを示す。

図２７は、解析内容の絞込み内容の文章に応じて必要な属性を図２０のテーブルに追加した信頼度付与ＤＢ検索結果情報の例である絞込み属性追加結果テーブル２７００のデータ構造である。上記テーブル２７００は、ユーザが図２５の領域２５０１に入力した解析内容「標準的な検査時間で投薬後の検査を行った患者のみを対象とした場合は？」を入力とし、Ａ市民病院６およびＣ大学病院８等の退院時サマリＤＢに対して、図５のヘルスケアデータ解析処理の処理５０１〜５０４を実施した出力結果として得られる。上記テーブル２７００は、クレンジングサーバ２０３の信頼度付与処理２０３ｂが、信頼度付与処理５０５を実行して追加された属性に対する信頼度を付与する処理の入力情報となる。

絞込み属性追加結果テーブル２７００は、配列構造を成し、１以上のレコードを格納可能である。上記テーブル２７００の各レコードは、図２０で説明した信頼度付与レセプトＤＢ補正データテーブル２０００と同じ属性６０１〜６０６、属性７０１に加え、投薬日時を記録する投薬日時２７０１および投薬後の検査日時を示す投薬後検査日時２７０２から構成される。属性２７０１および属性２７０２は、絞込み解析に必要な属性として図５の処理５０１〜５０４により追加された２つの属性であり、各属性の値は同処理の中でＤＢサーバ２０４の外部ＤＢ検索処理部２０４ｃがＡ市民病院およびＣ大学病院等の退院サマリＤＢを検索して読み出した値である。

例えば、レコード２７１１は、病院名「Ａ市民病院」に入院した入院患者ＩＤ「１」の入院患者は、入院日「２０１２／１／４」に入院して退院日「２０１２／２／３」に退院し、病名は疾病名「Ａ」であり、入院中に投与された医薬品は薬剤名「Ｘ」であり、入院日と退院日の記録の信頼度は入退院日の信頼度（％）「１００」であり、投与された日時は投薬日時「2012/1/14 9:10」であり、投薬後の検査日時は投薬後検査日時「2012/1/17 10:05」であったことを表す。

図２８は、図２７で追加された属性間の関連の信頼性を判定し付与した信頼度付与ＤＢ検索結果情報の例である、信頼度付与絞込み属性追加結果テーブル２８００のデータ構造である。上記テーブル２８００は、クレンジングサーバ２０３の信頼度付与処理部２０３ｂが、絞込み属性追加結果テーブル２７００および医薬品情報ＤＢ検索結果テーブル２６００を入力とし、絞込み属性追加結果テーブル２７００の各患者の投薬後の検査時間が、医薬品情報ＤＢ検索結果テーブル２６００の標準の検査時間に準拠している度合いを信頼度として信頼度付与処理５０５を実施した出力結果として得られる。信頼度付与処理５０５における信頼度の算出式は、Ｔｓを医薬品情報ＤＢ検索結果テーブル２６００の投薬後血液検査時間２６０３の値、Ｔｒを絞込み属性追加結果テーブル２７００の投薬後検査日時２７０２から投薬日時２７０１を差し引いた時間とすると、『投薬後検査時間の信頼度（％）＝１００×（Ｔｓ−｜Ｔｓ−Ｔｒ｜）÷Ｔｓ』である。即ち、対象データの絞込み前後で投薬後血液検査時間に違いが少ない場合、信頼度が高いと評価する。

信頼度付与絞込み属性追加結果テーブル２８００は、配列構造を成し、１以上のレコードを格納可能である。上記テーブル２８００の各レコードは、図２７で説明した絞込み属性追加結果テーブル２７００と同じ属性６０１〜６０６、属性７０１、属性２７０１、属性２０７１に加え、上記の算出式で算出された信頼度を記録する投薬後検査時間の信頼度（％）２８０１から構成される。

例えば、レコード２８１１は、病院名「Ａ市民病院」に入院した入院患者ＩＤ「１」の入院患者は、入院日「２０１２／１／４」に入院して退院日「２０１２／２／３」に退院し、病名は疾病名「Ａ」であり、入院中に投与された医薬品は薬剤名「Ｘ」であり、入院日と退院日の記録の信頼度は入退院日の信頼度（％）「１００」であり、投与された日時は投薬日時「2012/1/14 9:10」であり、投薬後の検査日時は投薬後検査日時「2012/1/17 10:05」であり、投薬後の検査までの時間が医薬品の標準検査時間に準拠している信頼度は、投薬後検査時間の信頼度（％）「９８．７」であることを表す。

（解析内容絞込みを実施した後の解析経過サマリ表示画面）
次に、図２９を用いて、本実施例に関わるＧＵＩのうち、図２３にて説明した一連の解析の内容と結果を一覧表示する解析経過サマリ表示画面１０００の、解析内容絞込みを実施した後の表示例を説明する。以下、図２３との変更点に絞り説明する。

図２９で示した解析経過サマリ表示画面１０００は、図２３と比べ、レコード２９０１が追加された点が異なる。レコード２９０１は、解析順序がＮｏ「３」番目の解析であること、絞込み解析内容の文章が解析内容「標準的な検査時間で投薬後の検査を行った患者のみを対象とした場合は？」であること、データ絞込み「−」により対象データの絞込み条件の変更Ｎｏ「２」の条件と変更が無いこと、レコード数「１５３８７９」は解析内容の絞込みの結果のレコード数、そのレコードを用いた解析の結果が解析結果「薬剤Ｘを使用した場合の方が、平均入院期間が短い（Ｘ：２４日、Ｙ：３５日）」であることを表す。

図２９の解析経過サマリ表示画面１０００が示す一連の解析の意味は、次のとおりである。１番目に行った解析の結果は、レコード１０１１が示すとおり「薬剤Ｙ」の方が平均入院期間は短いことを表す。それに対し、２番目に行った解析は、レコード２３０１が示すとおり補正データを使用し入退院日の信頼度が高いデータに絞って解析を再実行した結果、「薬剤Ｘ」の方が平均入院期間は短いという異なる結果が出ていることを表す。最後に、３番目に行った解析は、レコード２９０１が示すとおり、解析内容の絞込みにより標準的な検査時間の患者のレコードのみを解析対象とした結果、２番目の解析結果と「薬剤Ｘを使用した場合のほうが、平均入院期間が短い」という結論は同じだが、薬剤Ｘの平均入院期間が１日減少した「Ｘ：２４日」、薬剤Ｙの平均入院期間が３日減少した「Ｙ：３５日」となっており、標準的な検査時間の患者は入院期間が比較的短い傾向を表す。

（解析内容絞込み実施後の解析結果表示画面）
次に、図３０を用いて、本実施例に関わるＧＵＩのうち、図２４にて説明した最新の解析結果を詳細に表示する解析結果表示画面１１００の、解析内容絞込みを実施した後の表示例を説明する。以下、図２４との変更点に絞り説明する。

図３０で示した解析結果表示画面１１００は、図２４と比べ、構成要素に変化はないが、解析内容の絞込みによりいくつかの領域の表示するグラフ及び値が異なる。具体的には、領域１１０２・領域１１０３が示す対象データの信頼度の分布、および領域１１０４・領域１１０５が示す平均入院期間の値が、解析内容の絞込みにより変動している点が異なる。これらの変動は、解析内容の絞込みによる属性および信頼度の追加に伴い、対象データの信頼度の分布および解析目標値である平均入院期間の算出結果が、図２４に比べ変わったことを表す。

以上で、本発明の実施例１を説明した。実施例１では、ヘルスケアクラウドデータセンター１の各サーバが、Ｐ大学病院２の臨床研究者やＱ製薬会社３の市販後調査担当者などのデータ利用者が入力した解析内容に応じて、属性間の関連の信頼度を判断し付与する処理を解析と合わせてまとめて行うことにより、データ利用者が個別に属性間の関連の信頼度を判断しデータの絞込み・補正を行う作業を効率化することができる。

また、図２３および図２９に示すように、解析内容に応じた属性間の関連の信頼度を付与して、信頼度に基づくデータの絞込みを行うことにより、信頼度を付与しない場合（図２３レコード１０１１）に比べ、解析内容に対して精度の高い解析結果（図２３レコード２３０１、図２４レコード２９０１）が得られる。

１：ヘルスケアクラウドデータセンター、２：Ｐ大学病院、３：Ｑ製薬会社、４：医療データセンター、５：医薬情報センター、６：Ａ市民病院、７：Ｂ医院、８：Ｃ大学病院、１０：ネットワーク、１０３：ブレードサーバ装置、１０４：ストレージ装置、２０１：Ｗｅｂサーバ、２０２：解析サーバ、２０３：クレンジングサーバ、２０４：ＤＢサーバ、
２０３ｂ：信頼度付与処理部、２０３ｅ：信頼度判定パターンＤＢ、２０３ｇ：信頼度算出テーブル、２０１ｃ：画面表示処理部

Claims

１以上の医療機関と１以上のデータセンターの計算機がネットワークで接続されている計算機システムにおいて、
１以上の通信インタフェースおよび１以上のＣＰＵを備える１以上のサーバ装置からなる計算機システムであって、
データ間の関連の信頼度の判定方法を記憶する第１の記憶部と、
解析目的に応じて信頼度の判定方法を選択する第１の選択部と、
データ間の関連の信頼度の判定方法を作成する第１の作成部と、
選択した判定方法を用いてデータの信頼度を算出する算出部と、
データに算出した信頼度を付与して記憶する第２の記憶部と、
解析手段に対して信頼度を付与したデータの信頼度の分布を表示する表示部と、
解析目的に応じて信頼度の利用範囲を選択する第２の選択部と、
を備えることを特徴とする計算機システム。
請求項１に記載の計算機システムであって、
前記表示部は、信頼度を付与したデータの解析結果と信頼度の分布を合わせて表示する
ことを特徴とする計算機システム。
請求項１に記載の計算機システムであって、
前記表示部は、１以上の解析内容および解析結果の経過を一覧表示する
ことを特徴とする計算機システム。
請求項１に記載の計算機システムであって、
誤った関連を持つデータの補正方法を記憶する第３の記憶部と、
解析目的に応じて補正方法を選択する第３の記憶部と、
誤った関連を持つデータの補正方法を作成する第２の作成部と、
選択した補正方法を用いてデータを補正する補正部と、
を備えることを特徴とする計算機システム。
請求項４に記載の計算機システムであって、
前記表示部は、誤った関連を持つデータと補正後のデータの信頼度の分布を表示し、
データの解析目的に応じて利用するデータを誤った関連を持つデータと補正後のデータから選択する第３の選択部、
を備えることを特徴とする計算機システム。
請求項１に記載の計算機システムであって、
データの解析内容を絞り込む条件を追加する第１の追加部と、
解析内容の絞込み条件に応じてデータに属性を追加する第２の追加部と、
追加した属性に関する関連に対して信頼度を追加する第３の追加部と、
を備えることを特徴とする計算機システム。
データの提供、又は前記データの管理及び運用を行う少なくとも１つのサーバと、前記データを利用する少なくとも１つの端末とがネットワークを介して接続された計算機におけるクレンジングデータの管理方法であって、
様々な信頼度の判定パターンを利用者が作成して前記計算機の記憶装置に保持する第１ステップ、
前記端末の利用者が指示した解析目的に応じて前記信頼度の判定パターンを選択する第２ステップ、
前記選択した判定パターンに基づいて、前記解析目的を参照しながら前記サーバに格納されたデータの信頼度を計算して前記データに付与する第３ステップ、
前記解析目的に基づいて、前記信頼度を付与した前記データを解析して、前記解析の結果を評価し、前記信頼度を付与した前記データを表示する第４ステップ、
利用者の指示に基づいて、前記解析目的に応じた信頼度のデータを選択する第５ステップ、
を実行することを特徴とするクレンジングデータの管理方法。
前記クレンジングデータの管理方法は、さらに、前記第４ステップの後で、
前記表示されたデータに対して、対象データ絞込み・補正を行うかどうか、更に、解析内容の絞込みを行うかどうかを利用者の指示に基づいて決定し、
前記対象データ絞込み・補正が決定された際に、前記第３ステップ及び前記第４ステップを実行し、
前記解析内容の絞込みが決定された際に、前記第１ステップから前記第４ステップを実行することを特徴とする請求項７記載のクレンジングデータの管理方法。
前記第３ステップにおいて、前記解析目的からキーワードを抽出して、前記データのＤＢに対するクエリーを作成して前記データを検索する、ことを特徴とする請求項７記載のクレンジングデータの管理方法。
前記第３ステップにおいて、前記データのＤＢ検索結果と前記信頼度に関する情報とを統合して信頼度付与ＤＢ検索結果を生成することを特徴とする請求項９記載のクレンジングデータの管理方法。
前記データは、医療データであることを特徴とする請求項７記載のクレンジングデータの管理方法。
前記第３ステップにおいて、前記信頼度は、対象となる全レコード数に対する、誤記のないレコード数の割合であることを特徴とする請求項７記載のクレンジングデータの管理方法。