JP7422643B2 - 統合装置、統合方法、および統合プログラム - Google Patents
統合装置、統合方法、および統合プログラム Download PDFInfo
- Publication number
- JP7422643B2 JP7422643B2 JP2020184257A JP2020184257A JP7422643B2 JP 7422643 B2 JP7422643 B2 JP 7422643B2 JP 2020184257 A JP2020184257 A JP 2020184257A JP 2020184257 A JP2020184257 A JP 2020184257A JP 7422643 B2 JP7422643 B2 JP 7422643B2
- Authority
- JP
- Japan
- Prior art keywords
- statistical information
- integration
- statistical
- integrated
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010354 integration Effects 0.000 title claims description 160
- 238000000034 method Methods 0.000 title claims description 106
- 238000012545 processing Methods 0.000 claims description 53
- 238000004458 analytical method Methods 0.000 claims description 47
- 238000012795 verification Methods 0.000 claims description 42
- 238000012360 testing method Methods 0.000 claims description 26
- 238000010801 machine learning Methods 0.000 claims description 23
- 238000006243 chemical reaction Methods 0.000 claims description 18
- 238000013179 statistical model Methods 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000000528 statistical test Methods 0.000 claims description 6
- 238000007405 data analysis Methods 0.000 description 49
- 238000010586 diagram Methods 0.000 description 18
- 238000012351 Integrated analysis Methods 0.000 description 12
- 238000010200 validation analysis Methods 0.000 description 10
- 238000010276 construction Methods 0.000 description 9
- 239000008280 blood Substances 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- LEHOTFFKMJEONL-UHFFFAOYSA-N Uric Acid Chemical compound N1C(=O)NC(=O)C2=C1NC(=O)N2 LEHOTFFKMJEONL-UHFFFAOYSA-N 0.000 description 3
- TVWHNULVHGKJHS-UHFFFAOYSA-N Uric acid Natural products N1C(=O)NC(=O)C2NC(=O)NC21 TVWHNULVHGKJHS-UHFFFAOYSA-N 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 229940116269 uric acid Drugs 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/041—Abduction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
Description
図1は、統合分析システムのシステム構成例を示すブロック図である。統合分析システム100は、プライベート環境群PEsと、統合装置101と、統計情報DB(データベース)102と、統合モデルDB103と、統合分析結果DB104と、を有する。これらは、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)などのネットワーク110を介して通信可能に接続される。
図2は、コンピュータのハードウェア構成例を示すブロック図である。コンピュータ200は、プロセッサ201と、記憶デバイス202と、入力デバイス203と、出力デバイス204と、通信インターフェース(通信IF)205と、を有する。プロセッサ201、記憶デバイス202、入力デバイス203、出力デバイス204、および通信IF205は、バス206により接続される。プロセッサ201は、コンピュータ200を制御する。記憶デバイス202は、プロセッサ201の作業エリアとなる。また、記憶デバイス202は、各種プログラムやデータを記憶する非一時的なまたは一時的な記録媒体である。記憶デバイス202としては、たとえば、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリがある。入力デバイス203は、データを入力する。入力デバイス203としては、たとえば、キーボード、マウス、タッチパネル、テンキー、スキャナ、マイクがある。出力デバイス204は、データを出力する。出力デバイス204としては、たとえば、ディスプレイ、プリンタ、スピーカがある。通信IF205は、ネットワーク110と接続し、データを送受信する。
図3は、統計情報の一例を示す説明図である。統計情報213は、たとえば、基本情報301と、平均値情報302と、偏差平方和情報303と、偏差積和情報304と、を有する。基本情報301は、名称311と、値312と、の組み合わせである。名称311は、値として基本情報301である「データ数」を示す項目を規定する。データ数とは、統計情報213として扱うデータの個数を意味する。電子カルテの例では、名称311は、電子カルテの数、すなわち、患者の人数という項目となる。値312は、名称311で規定された項目が持つ数値データである。電子カルテの例では、値312は、電子カルテの数、すなわち、患者の人数を示す数値データである。
図4は、分析条件212の一例を示す説明図である。分析条件212は、変数情報テーブル401と、統合元情報テーブル402と、を有する。変数情報テーブル401は、統合モデルで用いられる変数を規定する情報であり、変数カテゴリ411と、変数412と、を有する。変数カテゴリ411は、変数412の種類(目的変数、第1説明変数、第2説明変数)を規定する。変数412は、変数カテゴリ411に適用される変数を規定する。図4では、目的変数には変数X1、第1説明変数には変数X2、第2説明変数には変数X3が規定される。
図5は、統計情報計算処理の一例を示すシーケンス図である。統合装置101は、所定のタイミングで、プライベートデータ分析装置PSiに項目情報を送信する(ステップS501)。
図6は、統合装置101による統合モデル構築処理の一例を示すシーケンス図である。統合装置101は、分析条件212を取得すると(ステップS212)、統合元情報テーブル402で特定されるプライベートデータ分析装置PSiの統計情報213を問い合わせ(ステップS602)、当該統計情報213を読み込む(ステップS603)。そして、統合装置101は、統合モデルを生成して、統合モデルパラメータを統合モデルDBに保存する(ステップS604)。このようにして、統合モデルパラメータが統合モデルDBに蓄積される。
図8は、統計情報統合処理(ステップS703)の例1を示す説明図である。図8は、単回帰の場合における2つの統計情報213(800A、800B)を統合する統計情報統合処理(ステップS703)を示す。統計情報800A、800Bそれぞれの統計値(データ数、平均、偏差平方和、偏差積和)は、図8に示した通りである。統計情報800A、800Bにおいて、Xは説明変数、Yは目的変数を示す。添え字のAが付与されている統計値は、統計情報800Aに含まれる統計値を示し、添え字のBが付与されている統計値は、統計情報800Bに含まれる統計値を示す。
図10は、統合装置101による統合妥当性検証処理(ステップS704)の詳細な処理手順例を示すフローチャートである。統合装置101は、並行性の検定(ステップS1001)、切片の検定(ステップS1002)を実行し、複数の統計情報213の統合の妥当性を判定し(ステップS1003)、ステップS705に移行する。
図11は、統合装置101の表示画面の一例を示す説明図である。表示画面1101は、統合装置101の出力デバイス204であるディスプレイに表示される。表示画面1101は、分析条件設定領域1102と、統計情報表示領域1103と、統合統計情報表示領域1104と、統合モデルパラメータ情報表示領域1105と、統合妥当性検証結果表示領域1106と、統計情報読込ボタン1107と、統合モデル構築ボタン1108と、統合モデル保存ボタン1109と、を有する。
101 統合装置
200 コンピュータ
201 プロセッサ
202 記憶デバイス
211 項目情報
212 分析条件
213 統計情報
214 統合統計情報
215 モデルパラメータ
216 統合モデルパラメータ検証結果
220 プライベートデータ
102 統計情報DB
103 統合モデルDB
104 統合分析結果DB
PDi プライベートDB
PSi プライベートデータ分析装置
Claims (14)
- プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有し、複数の分析対象装置の各々が有する分析対象データに基づく統計情報の各々にアクセス可能な統合装置であって、
前記プロセッサは、
複数の統計情報から第1統計情報と第2統計情報とを取得する取得処理と、
前記取得処理によって取得された前記第1統計情報と前記第2統計情報とを、前記第1統計情報の統計処理に用いられた第1分析対象データの第1データ数と前記第2統計情報の統計処理に用いられた第2分析対象データの第2データ数とに基づく統計処理により統合する統合処理と、
前記統合処理における前記第1統計情報および前記第2統計情報の統合の妥当性を検証する検証処理と、
前記検証処理による検証結果を出力する出力処理と、
を実行することを特徴とする統合装置。 - 請求項1に記載の統合装置であって、
前記取得処理では、前記プロセッサは、前記複数の統計情報から第3統計情報を取得するとともに、前記統合処理によって統合された統合統計情報を第4統計情報として取得し、
前記統合処理では、前記プロセッサは、前記取得処理によって取得された前記第3統計情報と前記第4統計情報とを、前記第3統計情報の統計処理に用いられた第3分析対象データの第3データ数と前記第4統計情報の統計処理に用いられた前記第1データ数および前記第2データ数の総和とに基づく統計処理により統合する、
ことを特徴とする統合装置。 - 請求項1に記載の統合装置であって、
前記プロセッサは、
前記統合処理によって統合された統合統計情報を用いて、前記第1分析対象データおよび前記第2分析対象データ内の1以上の説明変数の値から前記第1分析対象データおよび第2分析対象データ内の目的変数の値を予測する統合モデルを生成する生成処理を実行することを特徴とする統合装置。 - 請求項1に記載の統合装置であって、
変換元項目名と変換先項目名とを対応付けたテーブルを有し、
前記取得処理では、前記プロセッサは、前記統計情報内の変数の項目名が前記変換元項目名と一致した場合、前記統計情報内の変数の項目名を前記変換先項目名に変換し、
前記統合処理では、前記プロセッサは、前記項目名の変換結果に基づいて、前記第1統計情報と前記第2統計情報とを統合する、
ことを特徴とする統合装置。 - 請求項3に記載の統合装置であって、
前記生成処理では、前記プロセッサは、前記検証処理による検証結果に基づいて、前記統合統計情報を用いて、前記統合モデルを生成する、
ことを特徴とする統合装置。 - 請求項5に記載の統合装置であって、
前記検証処理では、前記プロセッサは、前記第1統計情報に関する第1統計モデルの係数と、前記第2統計情報に関する第2統計モデルの係数と、が等しいという仮説の統計的な検定を実行し、検定結果に基づいて、前記第1統計情報および前記第2統計情報の統合の妥当性を検証する、
ことを特徴とする統合装置。 - 請求項6に記載の統合装置であって、
前記検証処理では、前記プロセッサは、前記第1統計モデルと前記第2統計モデルとの間で、傾きが等しいという仮説を検定する統計的な検定と、切片が等しいという仮説を検定する統計的な検定をそれぞれ実行し、前記傾きが等しいという仮説と前記切片が等しいという仮説の両方が否定できない場合には、前記統合が妥当であると判定し、前記傾きが等しいという仮説が否定できず、前記切片が等しいという仮説が否定された場合は、前記第1統計モデルと前記第2統計モデルとを傾きが等しく切片が異なる独立モデルであると判定し、前記傾きが等しいという仮説が否定された場合は、前記統合は妥当でないと判定する、
ことを特徴とする統合装置。 - 請求項1に記載の統合装置であって、
前記分析対象装置の各々にアクセス可能であり、
前記取得処理では、前記プロセッサは、前記複数の分析対象装置が有する前記複数の統計情報から前記第1統計情報と前記第2統計情報とを取得する、
ことを特徴とする統合装置。 - 請求項1に記載の統合装置であって、
前記複数の統計情報を記憶する統計情報データベースにアクセス可能であり、
前記取得処理では、前記プロセッサは、前記統計情報データベースから前記第1統計情報と前記第2統計情報とを取得する、
ことを特徴とする統合装置。 - 請求項1に記載の統合装置であって、
前記取得処理では、前記プロセッサは、計算対象を示す項目情報を前記分析対象装置に送信した結果、前記項目情報を示す値を含む前記分析対象データに基づく複数の統計情報から、前記第1統計情報と前記第2統計情報とを取得する、
ことを特徴とする統合装置。 - 請求項3に記載の統合装置であって、
前記プロセッサは、
前記1以上の説明変数および前記目的変数を設定する設定処理を実行し、
前記取得処理では、前記プロセッサは、前記1以上の説明変数および前記目的変数を示す値を含む前記分析対象データに基づく複数の統計情報から、前記第1統計情報と前記第2統計情報とを取得し、
前記生成処理では、前記プロセッサは、前記1以上の説明変数の値から前記目的変数の値を予測する統合モデルを生成する、
ことを特徴とする統合装置。 - 請求項3に記載の統合装置であって、
前記生成処理では、前記プロセッサは、前記検証処理による検証結果に基づいて、前記1以上の説明変数を特徴量とし、前記目的変数の値を予測する機械学習モデルを生成する、
ことを特徴とする統合装置。 - プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有し、複数の分析対象装置の各々が有する分析対象データに基づく統計情報の各々にアクセス可能な統合装置が実行する統合方法であって、
前記統合方法は、
前記プロセッサが、
複数の統計情報から第1統計情報と第2統計情報とを取得する取得処理と、
前記取得処理によって取得された前記第1統計情報と前記第2統計情報とを、前記第1統計情報の統計処理に用いられた第1分析対象データの第1データ数と前記第2統計情報の統計処理に用いられた第2分析対象データの第2データ数とに基づく統計処理により統合する統合処理と、
前記統合処理における前記第1統計情報および前記第2統計情報の統合の妥当性を検証する検証処理と、
前記検証処理による検証結果を出力する出力処理と、
を実行することを特徴とする統合方法。 - 複数の分析対象装置の各々が有する分析対象データに基づく統計情報の各々にアクセス可能なプロセッサに、
複数の統計情報から第1統計情報と第2統計情報とを取得する取得処理と、
前記取得処理によって取得された前記第1統計情報と前記第2統計情報とを、前記第1統計情報の統計処理に用いられた第1分析対象データの第1データ数と前記第2統計情報の統計処理に用いられた第2分析対象データの第2データ数とに基づく統計処理により統合する統合処理と、
前記統合処理における前記第1統計情報および前記第2統計情報の統合の妥当性を検証する検証処理と、
前記検証処理による検証結果を出力する出力処理と、
を実行させることを特徴とする統合プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020184257A JP7422643B2 (ja) | 2020-11-04 | 2020-11-04 | 統合装置、統合方法、および統合プログラム |
US17/496,178 US20220138603A1 (en) | 2020-11-04 | 2021-10-07 | Integration device, integration method, and integration program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020184257A JP7422643B2 (ja) | 2020-11-04 | 2020-11-04 | 統合装置、統合方法、および統合プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022074315A JP2022074315A (ja) | 2022-05-18 |
JP7422643B2 true JP7422643B2 (ja) | 2024-01-26 |
Family
ID=81379074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020184257A Active JP7422643B2 (ja) | 2020-11-04 | 2020-11-04 | 統合装置、統合方法、および統合プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20220138603A1 (ja) |
JP (1) | JP7422643B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220210140A1 (en) * | 2020-12-30 | 2022-06-30 | Atb Financial | Systems and methods for federated learning on blockchain |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016038780A (ja) | 2014-08-08 | 2016-03-22 | 株式会社博報堂Dyホールディングス | 情報処理システム、及び、プログラム。 |
US20160379128A1 (en) | 2015-06-26 | 2016-12-29 | Xerox Corporation | Distributed and privacy-preserving prediction method |
JP2018005317A (ja) | 2016-06-28 | 2018-01-11 | 日本電気株式会社 | 医療データ処理装置、端末装置、情報処理方法、およびシステム |
WO2019220486A1 (ja) | 2018-05-14 | 2019-11-21 | 富士通株式会社 | 情報処理システム、情報処理方法および情報処理プログラム |
-
2020
- 2020-11-04 JP JP2020184257A patent/JP7422643B2/ja active Active
-
2021
- 2021-10-07 US US17/496,178 patent/US20220138603A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016038780A (ja) | 2014-08-08 | 2016-03-22 | 株式会社博報堂Dyホールディングス | 情報処理システム、及び、プログラム。 |
US20160379128A1 (en) | 2015-06-26 | 2016-12-29 | Xerox Corporation | Distributed and privacy-preserving prediction method |
JP2018005317A (ja) | 2016-06-28 | 2018-01-11 | 日本電気株式会社 | 医療データ処理装置、端末装置、情報処理方法、およびシステム |
WO2019220486A1 (ja) | 2018-05-14 | 2019-11-21 | 富士通株式会社 | 情報処理システム、情報処理方法および情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20220138603A1 (en) | 2022-05-05 |
JP2022074315A (ja) | 2022-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
El Emam et al. | Practical synthetic data generation: balancing privacy and the broad availability of data | |
Hosseini et al. | A systematic literature review and meta-analysis on cross project defect prediction | |
Abdia et al. | Propensity scores based methods for estimating average treatment effect and average treatment effect among treated: a comparative study | |
Bi | A review of statistical methods for determination of relative importance of correlated predictors and identification of drivers of consumer liking | |
Middleton et al. | Unbiased estimation of the average treatment effect in cluster-randomized experiments | |
Wallace et al. | A systematic review of the probability of repeated admission score in community‐dwelling adults | |
Lu et al. | Estimation of Sobol's sensitivity indices under generalized linear models | |
Weedop et al. | The effect of phylogenetic uncertainty and imputation on EDGE Scores | |
JP7422643B2 (ja) | 統合装置、統合方法、および統合プログラム | |
Tariq et al. | Software measurement by using artificial intelligence | |
JP5176628B2 (ja) | ログデータの取得のための制御方法および装置、並びにコンピュータプログラム | |
Frangakis et al. | Deductive derivation and turing‐computerization of semiparametric efficient estimation | |
Iren et al. | Cost of quality in crowdsourcing | |
Muñoz et al. | Multiple imputation of incomplete multilevel data using Heckman selection models | |
Hof et al. | A mixture model for the analysis of data derived from record linkage | |
CN111816318A (zh) | 一种心脏疾病数据队列生成方法和风险预测系统 | |
Shlomo | Statistical disclosure limitation for health data: a statistical agency perspective | |
CN109564782A (zh) | 基于医院人口统计的电子临床决策支持设备 | |
Chung et al. | Do all your detailing efforts pay off? Dynamic panel data methods revisited | |
Ganguli et al. | Deletion diagnostics for the generalised linear mixed model with independent random effects | |
Schnetzer et al. | Quality assessment of imputations in administrative data | |
Milocco et al. | A method to predict the response to directional selection using a Kalman filter | |
Zhou et al. | Application of a record linkage software to identify mortality of enrolees of large integrated healthcare organisations | |
Ríos-Gutiérrez et al. | An updated estimation approach for SEIR models with stochastic perturbations: Application to COVID-19 data in Bogotá | |
US20230274026A1 (en) | Synthetic and traditional data stewards for selecting, optimizing, verifying and recommending one or more datasets |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230207 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231011 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231024 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7422643 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |