JP2023509786A - 適合率診断において関連する特徴を選択するためのツール - Google Patents
適合率診断において関連する特徴を選択するためのツール Download PDFInfo
- Publication number
- JP2023509786A JP2023509786A JP2022542352A JP2022542352A JP2023509786A JP 2023509786 A JP2023509786 A JP 2023509786A JP 2022542352 A JP2022542352 A JP 2022542352A JP 2022542352 A JP2022542352 A JP 2022542352A JP 2023509786 A JP2023509786 A JP 2023509786A
- Authority
- JP
- Japan
- Prior art keywords
- features
- outcome
- unmeasured
- feature
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 218
- 230000015654 memory Effects 0.000 claims description 49
- 238000005070 sampling Methods 0.000 claims description 36
- 238000005259 measurement Methods 0.000 claims description 25
- 230000036962 time dependent Effects 0.000 claims description 12
- 238000004891 communication Methods 0.000 description 18
- 238000003745 diagnosis Methods 0.000 description 15
- 239000013598 vector Substances 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000009471 action Effects 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000003066 decision tree Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 206010040047 Sepsis Diseases 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000002411 adverse Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000003862 health status Effects 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 229920001690 polydopamine Polymers 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 208000017667 Chronic Disease Diseases 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 206010019233 Headaches Diseases 0.000 description 1
- 208000010496 Heart Arrest Diseases 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000000342 Monte Carlo simulation Methods 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 241000269400 Sirenidae Species 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000003443 antiviral agent Substances 0.000 description 1
- 229940121357 antivirals Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 238000004820 blood count Methods 0.000 description 1
- 238000009534 blood test Methods 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 230000009194 climbing Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000001647 drug administration Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 231100000869 headache Toxicity 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 206010024378 leukocytosis Diseases 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000002705 metabolomic analysis Methods 0.000 description 1
- 230000001431 metabolomic effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000004579 scanning voltage microscopy Methods 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 1
- 208000019206 urinary tract infection Diseases 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/60—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
- G16H40/67—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Abstract
少なくとも1つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法が提供される。この方法は、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未使用特徴に第1の値を補定することと、インスタンスにおける第1の値を使用するモデルを用いて第1の転帰を評価することと、を含む。この方法は、他の残りの未測定特徴を一定に保持しながら、データセットにおける未測定特徴に第2の値を補定することと、インスタンスにおける第2の値を使用するモデルを用いて第2の転帰を評価することと、第1の転帰と第2の転帰を用いて統計パラメータを判定することと、を含む。この方法はまた、未測定特徴を、判定された統計パラメータに対応するランキングに割り当てることを含む。また、上記の方法を実行するためのシステム及び非一時的なコンピュータ可読媒体が提示される。
Description
本願は、「Tool for Selecting Relevant Features in Precision Diagnostics」と題された2020年1月10日に出願された米国仮特許出願第62/959,754号の優先権及び利益を主張し、以下に完全に記載されているかのように、また、適用可能なすべての目的のために、その全体が参照により本明細書に組み込まれる。
本開示は、一般に、正確かつタイムリーな転帰の予測を提供するために、データの選択及び収集の方法及び手段に関する。より具体的には、本開示は、個々のベースで強化された信頼レベルを用いてデータ収集のためのコスト及び時間を最適化するための教育された提案を提供するための方法及びシステムに関する。
機械学習(ML)アルゴリズムに基づく診断システムは、重要性の観点から臨床的特徴の集団全体のランキングを提供する。しかしながら、特定の患者について特徴のセットが収集されるときに、その特徴の集団全体のランキングは、その患者にとって最適ではないことがある。測定する最適ではない特徴を収集した帰結として、特に緊急事態において患者に対して望ましくない転帰となっていることがある。患者固有のベースで予測データセットを完成させるための最適な特徴の選択を可能にするシステム及び方法を有することが望ましい。
本開示のいくつかの実施形態では、少なくとも1つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法であって、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未測定特徴に第1の値を補定することと、インスタンスにおける第1の値を使用するモデルを用いて第1の転帰を評価することと、を含む。この方法は、他の残りの未測定特徴を一定に保持しながら、データセットにおける未測定特徴に第2の値を補定することと、インスタンスにおける第2の値を使用するモデルを用いて第2の転帰を評価することと、第1の転帰と第2の転帰を用いて統計パラメータを判定することと、を含む。この方法はまた、未測定特徴を、判定された統計パラメータに対応するランキングに割り当てることを含む。
いくつかの実施形態では、少なくとも1つの特徴が測定されているインスタンスについて未測定特徴をランク付けするためのシステムは、命令を記憶するためのメモリと、メモリと通信可能に結合された1つ以上のプロセッサと、を含む。1つ以上のプロセッサは命令を実行して、システムに、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未使用特徴に第1の値を補定することと、インスタンスにおける第1の値を使用するモデルを用いて第1の転帰を評価することと、を行わせるように構成されている。1つ以上のプロセッサはまた、命令を実行して、システムに、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未使用特徴に第2の値を補定することと、インスタンスにおける第2の値を使用するモデルを用いて第2の転帰を評価することと、第1の転帰と第2の転帰を用いて統計パラメータを判定することと、を行わせるように構成されている。1つ以上のプロセッサはまた、未測定特徴を、統計パラメータに対応するランキングに割り当てることと、インスタンスからの少なくとも1つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することであって、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、選択することと、を行うように構成されている。
いくつかの実施形態では、命令を記憶する非一時的なコンピュータ可読媒体であって、命令は、コンピュータによって実行されるときに、コンピュータに、少なくとも1つの特徴が測定されているインスタンスに対して未測定特徴をランク付けするための方法を実行させる。この方法は、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未使用特徴に第1の値を補定することと、インスタンスにおける第1の値を使用するモデルを用いて第1の転帰を評価することと、を含む。この方法はまた、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未測定特徴に第2の値を補定することと、インスタンスにおける第2の値を使用するモデルを用いて第2の転帰を評価することと、第1の転帰と第2の転帰を用いて統計パラメータを判定することと、を含む。この方法はまた、未測定特徴を、統計パラメータに対応するランキングに割り当てることと、インスタンスからの少なくとも1つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することであって、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、選択することと、を含む。この方法では、未測定特徴を、統計パラメータに対応するランキングに割り当てることは、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、1つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することを含む。
いくつかの実施形態では、少なくとも1つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法は、インスタンスからの少なくとも1つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することを含み、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む。この方法はまた、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、1つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することと、未測定特徴を、モデルベースの特徴重要度からの出力に対応するランキングに割り当てることと、を含む。
いくつかの実施形態では、少なくとも1つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法は、マスターデータセットにアクセスすることを含み、マスターデータセットは、既知の転帰に関連する複数のデータセットを含む。この方法はまた、転帰についてのモデルに関連する分散値を判定することであって、そのモデルは、未測定特徴、及びデータセットにおける少なくとも1つの他の別個の特徴に基づく、判定することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することと、未測定特徴を、分散値に対する予測の分散の値に従ってランキングに割り当てることと、を含む。
いくつかの実施形態では、少なくとも1つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法は、データセットに基づいて決定値を査定するためのルールを判定することを含む。データセットは、インスタンスにおける複数の測定済特徴及びインスタンスにおける未測定特徴について収集された値を含み、ルールは、(1)複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び(2)1つ以上の測定済特徴と合致する。この方法はまた、複数の転帰値及びデータセットの各々についての既知の転帰に基づいて、ルールの正解率を判定することと、未測定特徴を、ルールの正解率に対応するランキングを割り当てることと、を含む。
いくつかの実施形態では、特徴の予測可能性に基づいて選択された特徴についてのサンプリング頻度を判定する方法は、観察された特徴のセット及び欠落特徴のセットを識別することを含む。この方法はまた、履歴データセットから選択された特徴マトリクスを使用して選択された特徴のサンプル頻度を予測するモデルを構築することと、このモデルを使用してサンプリング頻度についての予測を生成することと、複数の時間予測から選択された特徴の分散を判定することと、を含む。この方法はまた、分散に基づいて、他の特徴に対して、選択された特徴をランク付けすることと、特徴のランクが予め判定された上位パーセンタイルにあるときに、選択された特徴のサンプリング頻度を増加させることと、を含む。
主題の技術の他の構成は、以下の詳細な説明から当業者には容易に明らかになるであろうことが理解され、主題の技術の様々な構成は、例示として示され説明される。実現されるように、主題の技術は、主題の技術の範囲から逸脱することなく、他の異なる構成が可能であり、そのいくつかの詳細は、様々な他の点で修正可能である。したがって、図面及び詳細な説明は、限定的なものではなく、本質的に例示的なものとみなされるべきである。
添付の図面は、さらなる理解を提供するために含まれ、本明細書に組み込まれ、本明細書の一部を構成しており、開示の実施形態を例示し、説明と一緒に、開示の実施形態の原理を説明するのに役立つ。
図において、同じ又は類似の参照番号によって示される要素及びステップは、他に示されない限り、同じ又は類似の要素及びステップに関連付けられる。
以下の詳細な説明では、本開示の完全な理解を提供するために、多数の特定の詳細が記載される。しかしながら、当業者には明らかであろうが、本開示の実施形態は、これらの特定の詳細のいくつかなしに実施することができることが明らかであろう。他の例では、周知の構造及び技術は、開示を不明瞭にしないように詳細には示されていない。
概要
最近、患者について測定可能な特徴の数が劇的に増加している。様々な実施形態では、特徴測定は、ゲノミクス、トランスクリプトミクス、プロテオミクス、メタボロミクス、ウェアラブルデバイスデータ、行動データ(食品/飲料購入、フィットネスデータなど)、請求データ(保険など)、及びソーシャルメディアデータを含み得る。異なる特徴は、それらに関連する異なるコスト及び取得時間を有し得る。したがって、特徴のパーソナライズされたランキングを有することが望ましい。
最近、患者について測定可能な特徴の数が劇的に増加している。様々な実施形態では、特徴測定は、ゲノミクス、トランスクリプトミクス、プロテオミクス、メタボロミクス、ウェアラブルデバイスデータ、行動データ(食品/飲料購入、フィットネスデータなど)、請求データ(保険など)、及びソーシャルメディアデータを含み得る。異なる特徴は、それらに関連する異なるコスト及び取得時間を有し得る。したがって、特徴のパーソナライズされたランキングを有することが望ましい。
したがって、所与の患者の診断における特定の特徴の関連性を理解して、測定のコスト及び時間を低減することが望ましく、これは、緊急ケア状況において極めて重要であり得る。任意の所与の特徴の関連性はまた、状況、及び患者自身にも依存することがある。例えば、発熱、白血球増加、及び2型糖尿病の病歴を有する70歳の患者は、特徴a、b、及びcのその後の測定から最も利益を得ることがある。一方、持続性の頭痛の症状を呈している健康な23歳は、特徴x、y、zのその後の測定から最も利益を得ることがある。したがって、広範な個人集団から収集されたデータを使用して、単一の患者に関連する特徴のランキングを調整することが非常に望ましい。
患者の利用可能な情報及び定量可能な健康状態が与えられると、本明細書に開示の方法及びシステムは、対応する臨床的問い合わせのために収集する価値ある特徴を判定する(例えば、患者が疾患dを有するかどうか、又は患者が治療tから利益を得るかなど)。追加的に、様々な実施形態はまた、収集の頻度、及び所望の正確率及び適合率で、選択された特徴を取得するためにどの測定技術が使用され得るかを判定する。様々な実施形態は、所与の患者がそのバイタルを測定されたときに(例えば、現在の利用可能な情報)、利用可能な資源及び診断のための時間によって制約される、臨床医が収集し得る特徴の最適なセットを提供する。様々な実施形態では、特徴選択メカニズムは、患者の利用可能な情報及び定量可能な健康状態を条件とする。
様々な実施形態によれば、特徴のセットに対するノイズ許容度は、経験的に判定することができる。さらに、様々な実施形態は、特徴のセットが既に測定されていることを条件として特徴のノイズ許容度を判定し得る。したがって、様々な実施形態は、エンドユーザに対して、その特徴又は他の特徴の以前の測定に基づいて、所与の特徴に対する平均可能許容度を増加又は減少させることを提案することを含む。
様々な実施形態によれば、特徴のセットに対する最適なサンプリング頻度は、アルゴリズム的に判定することができる。追加的に、様々な実施形態は、特徴のセットが既に測定されていることを条件として特徴のサンプリング頻度を判定し得る。したがって、様々な実施形態は、エンドユーザに対して、その特徴又は他の特徴の以前の測定に基づいて、所与の特徴に対するサンプリング頻度を増加又は減少させることを提案することを含む。
様々な実施形態では、機械学習アルゴリズムが使用されて、入力特徴行列及び転帰ベクトルからなるデータセットで訓練されたモデル及び所与の患者について利用可能な定量可能な情報に従って特徴関連性をランク付けする。追加的に、本開示と合致する実施形態は、所与の患者及びデータセットについて利用可能な定量可能な情報に基づいて、特徴のセットのランキングの被験者固有の推定値を提供する。
提案される解決策は、さらに、コンピュータ自体の機能を改善する。なぜなら、コンピュータ自体は、データ記憶空間を節約し、本明細書に開示の方法及びシステムによりもたらされる決定までの時間短縮により、ネットワークの使用量を低減するためである。
本明細書に提供の多くの実施例は、患者のデータが識別可能であること、又は記憶されている画像のダウンロード履歴を説明しているが、各ユーザは、そのような患者情報が共有又は記憶されることに明示的に許可を付与し得る。明示的な許可は、開示のシステムに一体化されたプライバシー制御を使用して付与することができる。各ユーザには、そのような患者情報が明示的な同意を得て共有することができるか、又は共有されるであろうことの通知が提供され得、各患者がいつでもその情報を共有し得、任意の記憶されたユーザ情報を削除し得る。記憶された患者情報は、患者のセキュリティを保護するために暗号化され得る。
例示的なシステムアーキテクチャ
図1は、様々な実施形態による、ストリーミングデータ環境における診断エンジンに好適な例示的なアーキテクチャを例示する。アーキテクチャ100は、ネットワーク150を介して接続されたサーバ130及びクライアントデバイス110を含む。多くのサーバ130のうちの1つは、プロセッサによって実行されるときに、サーバ130に、本明細書に開示の方法におけるステップの少なくともいくつかを実行させる命令を含むメモリをホストするように構成されている。サーバ130のうちの少なくとも1つは、複数の患者についての臨床データを含むデータベースを含むか、又はそれに対するアクセスを有し得る。
図1は、様々な実施形態による、ストリーミングデータ環境における診断エンジンに好適な例示的なアーキテクチャを例示する。アーキテクチャ100は、ネットワーク150を介して接続されたサーバ130及びクライアントデバイス110を含む。多くのサーバ130のうちの1つは、プロセッサによって実行されるときに、サーバ130に、本明細書に開示の方法におけるステップの少なくともいくつかを実行させる命令を含むメモリをホストするように構成されている。サーバ130のうちの少なくとも1つは、複数の患者についての臨床データを含むデータベースを含むか、又はそれに対するアクセスを有し得る。
サーバ130は、画像のコレクション及びトリガ論理エンジンをホストするための適切なプロセッサ、メモリ、及び通信能力を有する任意のデバイスを含み得る。トリガ論理エンジンは、ネットワーク150を介して様々なクライアントデバイス110によってアクセス可能であり得る。クライアントデバイス110は、例えば、デスクトップコンピュータ、モバイルコンピュータ、タブレットコンピュータ(例えば、電子ブックリーダを含む)、モバイルデバイス(例えば、スマートフォンもしくはPDA)、又はサーバ130のうちの1つのトリガ論理エンジンにアクセスするための適切なプロセッサ、メモリ、及び通信能力を有する任意の他のデバイスとすることができる。様々な実施形態によれば、クライアントデバイス110は、医師、看護師、又は救急救命士のような医療従事者が、リアルタイムの緊急状況において(例えば、病院、クリニック、救急車、又は他の公衆もしくは居住環境において)サーバ130のうちの1つのトリガ論理エンジンにアクセスすることによって使用され得る。いくつかの実施形態では、クライアントデバイス110の1つ以上のユーザ(例えば、看護師、救急救命士、医師、及び他の医療従事者)は、ネットワーク150を介して、1つ以上のサーバ130のトリガ論理エンジンに臨床データを提供し得る。さらに他の実施形態では、1つ以上のクライアントデバイス110は、臨床データをサーバ130に自動的に提供し得る。例えば、いくつかの実施形態では、クライアントデバイス110は、ネットワーク接続を介して自動的に患者結果をサーバ130に提供するように構成された、クリニックにおける血液検査ユニットであり得る。ネットワーク150は、例えば、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネットなどのうちの任意の1つ以上を含むことができる。さらに、ネットワーク150は、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スターバスネットワーク、ツリー又は階層ネットワークなどを含む、ネットワークトポロジのうちの任意の1つ以上を含むことができるが、これらに限定されない。
例示的な診断システム
図2は、本開示の所定の態様による、図1のアーキテクチャ100における例示的なサーバ130及びクライアントデバイス110を例示するブロック図200である。クライアントデバイス110及びサーバ130は、それぞれの通信モジュール218-1及び218-2(以下、総称して「通信モジュール218」)を介してネットワーク150を介して通信可能に結合されている。通信モジュール218は、データ、要求、応答、及びコマンドのような情報をネットワークの他のデバイスと送受信するために、ネットワーク150とインターフェースするように構成されている。通信モジュール218は、例えば、モデム又はEthernet(登録商標)カードとすることができる。クライアントデバイス110及びサーバ130は、それぞれ、メモリ220-1及び220-2(以下、総称して「メモリ220」)並びにプロセッサ212-1及び212-2(以下、総称して「プロセッサ212」)を含み得る。メモリ220は、プロセッサ212によって実行されるときに、クライアントデバイス110又はサーバ130のいずれか一方に、本明細書に開示の方法における1つ以上のステップを実行させる命令を記憶し得る。したがって、プロセッサ212は、物理的にプロセッサ212にコード化された命令、メモリ220内のソフトウェアから受信された命令、又はその両方の組み合わせのような命令を実行するように構成され得る。
図2は、本開示の所定の態様による、図1のアーキテクチャ100における例示的なサーバ130及びクライアントデバイス110を例示するブロック図200である。クライアントデバイス110及びサーバ130は、それぞれの通信モジュール218-1及び218-2(以下、総称して「通信モジュール218」)を介してネットワーク150を介して通信可能に結合されている。通信モジュール218は、データ、要求、応答、及びコマンドのような情報をネットワークの他のデバイスと送受信するために、ネットワーク150とインターフェースするように構成されている。通信モジュール218は、例えば、モデム又はEthernet(登録商標)カードとすることができる。クライアントデバイス110及びサーバ130は、それぞれ、メモリ220-1及び220-2(以下、総称して「メモリ220」)並びにプロセッサ212-1及び212-2(以下、総称して「プロセッサ212」)を含み得る。メモリ220は、プロセッサ212によって実行されるときに、クライアントデバイス110又はサーバ130のいずれか一方に、本明細書に開示の方法における1つ以上のステップを実行させる命令を記憶し得る。したがって、プロセッサ212は、物理的にプロセッサ212にコード化された命令、メモリ220内のソフトウェアから受信された命令、又はその両方の組み合わせのような命令を実行するように構成され得る。
様々な実施形態によれば、サーバ130は、データベース252-1及びマスターデータセット252-2(以下、総称して「データベース252」)を含み得、又はそれらに通信可能に結合され得る。1つ以上の実装形態では、データベース252は、複数の患者のための臨床データを記憶し得る。データベース252は、1人以上の患者についての、様々な特徴、治療情報、モデル予測、及び患者ごとの転帰情報についての時系列測定値を有する、履歴データセットHを含み得る。履歴データベースHは、異なる時点で測定された複数の特徴を含み得る。
様々な実施形態によれば、マスターデータセット252-2は、データベース252-1と同じであり得、又はデータベース252-1に含まれ得る。データベース252内の臨床データは、非同定性患者特性、バイタルサイン、CBC(complete blood count)などの血液測定値、CMP(comprehensive metabolic panel)、及び血液ガス(例えば、酸素、CO2など)、免疫学的情報、バイオマーカー、培養などの計測情報を含み得る。非識別性患者特性は、年齢、性別、及び慢性疾患(例えば、糖尿病、アレルギーなど)などの一般的な病歴を含み得る。様々な実施形態では、臨床データはまた、治療手段、薬剤投与事象、投与量などの計測情報に応答して医療従事者によって取られる行動を含み得る。様々な実施形態では、臨床データはまた、患者の履歴で生じる事象及び転帰(例えば、敗血症、脳卒中、心停止、ショックなど)を含み得る。データベース252は、サーバ130から分離されて例示されているが、所定の態様では、データベース252及びトリガ論理エンジン242は、同じサーバ130内にホストすることができ、ネットワーク150内の任意の他のサーバ又はクライアントデバイスによってアクセス可能とすることができる。
サーバ130内のメモリ220-2は、医学的特徴のデータセットに基づいて、可能性のある患者転帰を評価するための診断エンジン240を含み得る。診断エンジン240はまた、トリガ論理エンジン242、モデリングツール244、統計ツール246、及び補定ツール248を含み得る。モデリングツール244は、関連する臨床データを収集し、予想される転帰(例えば、診断)を評価するための命令及びコマンドを含み得る。いくつかの実施形態では、モデリングツール244は、複数の可能な行動から取るべき行動を提案し得る。モデリングツール244は、ディープニューラルネットワーク(DNN)、畳み込みニューラルネットワーク(CNN)、生成的敵対ニューラルネットワーク(GAN)、ディープ強化学習(DRL)アルゴリズム、ディープリカレントニューラルネットワーク(DRNN)、ランダムフォレストなどの古典的機械学習アルゴリズム、k近傍法(KNN)アルゴリズム、k平均法アルゴリズム、又はそれらの任意の組み合わせなどのニューラルネットワーク(NN)からのコマンド及び命令を含み得る。様々な実施形態によれば、モデリングツール244は、機械学習アルゴリズム、人工知能アルゴリズム、又はそれらの任意の組み合わせを含み得る。モデルリングツール244は、履歴データセットHから抽出された情報を用いて、所定の時点で行われた予測、患者のセットについて行われた測定、及び患者のセットについての実際の転帰に基づいて、モデルに基づいたモデルを動的に生成し得る。
統計ツール246は、データベース252に記憶された、又はモデリングツール244によって提供されたデータを評価する。補定ツール248は、トリガ論理エンジン242によって収集された計測情報から欠落しているデータ入力をモデリングツール244に提供し得る。トリガ論理エンジン242は、統計ツールによって計算された入力データ{Pi}及びモデルFに関連する様々なメトリックを評価し、入力及びそれが所定の条件を満たすかどうかに基づいて行動をトリガするように構成され得る。ストリーミングデータ入力{Pi}は、患者iに対するクライアントデバイス110を使用して、看護師又は他の医療従事者によって提供された複数の測定済特徴を含み得る。いくつかの実施形態によれば、サーバ130は、{Mi}における1つ以上の特徴に対するランキング変数をクライアントデバイス110に提供し得る。{Mi}における所与の特徴に提供されるランキング変数は、エンドユーザが、所与の患者についてその後にどの特徴又は特徴のセットを測定するべきかを判定するために使用される情報であり得る。いくつかの実施形態によれば、測定済特徴{Pi}は、1つ以上のクライアントデバイス110からサーバ130に提供される。様々な実施形態によれば、クライアントデバイス110は、入力データ{Pi}に応答して、サーバ130から予測される転帰又は診断を受信し得る。
モデリングツール244は、m×(l+k)次元入力特徴行列X及び次元mの転帰ベクトルY(各患者に対して1つのエントリ)からなるデータセットDで訓練されたモデルFを含む。Miは、被験者iに対して測定されていないk個の特徴を含むk次元の特徴ベクトルである。被験者iに対するl次元特徴ベクトルPiは、被験者iに対して測定されたl個の特徴を含む。したがって、n個の欠落特徴のセット(Min、n≦kである)は、Miから選択され得る。所与のMinに対して、診断エンジン240は3つの値を割り当てる。第1の値は、スカラー値s(例えば、0≦s≦1)であり、Y(患者の転帰)に関するnセットの重要性を示す。第2の値は、サイズnのベクトル(v1n)であり、各エントリは、所与のnセット内の各特徴に対する時間依存変動に対応する。そして、第3の値、サイズnの他のベクトルv2nは、nセット内の各欠落特徴の測定における最大可能ノイズを示す。様々な実施形態によれば、サーバ130は、グループ{Min,s,v1n,v2n}をクライアントデバイス110に送信する。
クライアントデバイス110は、クライアントデバイス110にインストールされたアプリケーション222又はウェブブラウザを介して診断エンジン240にアクセスし得る。プロセッサ212-1は、クライアントデバイス110におけるアプリケーション222の実行を制御し得る。様々な実施形態によれば、アプリケーション222は、クライアントデバイス110の出力デバイス216におけるユーザのために表示されるユーザインターフェース(例えば、グラフィカルユーザインターフェースGUI)を含み得る。クライアントデバイス110のユーザは、入力デバイス214を使用して、計測情報として入力データを入力するか、又はアプリケーション222のユーザインターフェースを介して診断エンジン240に問い合わせを送信し得る。入力デバイス214は、スタイラス、マウス、キーボード、タッチスクリーン、マイクロホン、又はそれらの任意の組み合わせを含み得る。また、出力デバイス216は、ディスプレイ、ヘッドセット、スピーカ、アラーム又はサイレン、又はそれらの任意の組み合わせを含み得る。
図3は、様々な実施形態による、決定木のための例示的なワークフローを例示する。様々な実施形態では、本明細書に開示の1つ以上のクライアントデバイス及びサーバは、決定木300の各ノードにおける意思決定について介入し得る。より具体的には、決定木300内のノードの1つ以上において、トリガ論理エンジン、モデリングツール、統計ツール、及び補定ツールを含む診断エンジンが使用され得る。各決定点は独立して解決され、フォローアップの決定につながる可能性がある。第1の決定(A)後の決定は、新しいデータを推薦する代わりに、以前の決定までに収集されたデータを使用することによって開始することができる。1つの例示的な実施形態では、第1の決定点は、次のX時間内に敗血症を発症するリスクが高い患者を見つけることを含み得る。第2の決定点は、それらの患者に対して、広域スペクトル(A、B、Xなど)から利益を受ける宿主応答のサブタイプを選択することを含み得る。
様々な実施形態では、2層ディープ決定木は、以下のように概略され得る。1)臨床医は、患者が次の6時間以内に敗血症を発症するリスクが高いかどうかを問い合わせる。2a) 臨床医が、関連情報(バイタル、検査、機械学習に基づく予測)を受けた後、患者が高リスクであると評価するときに、患者に抗生物質又は抗ウイルス薬を投与すべきか?2b)臨床医が、患者に敗血症はないと考えるときに、次のレベルは、患者に尿路感染症があるかどうか(合併症を伴わない)を識別することを含む。
各決定点は、特定のワークフローを実行することを含み得る。ルートレベル決定点の後、その後の決定点は、収集すべき特徴のセットを提案し得る。様々な実施形態では、診断ツールは、集団全体の推定に基づいて特徴のセットを提案するか、又は、以前の決定点で要求又は実行されたテストに従って収集された(例えば、履歴データセットHからの)データを、これまでに記録されている利用可能なものを使用するためのいくつかのオプションを含み得る。
様々な実施形態において、推薦される行動は、すべての特徴が利用可能であるかどうかにかかわらず、所与の患者についての新しい観察を収集し、新しいデータの準備が整っているときはいつでも次のステップに移動することを含み得る。
様々な実施形態では、モデリングツールにおける機械学習モデルは、利用可能なデータに基づいて、転帰の予測又は転帰の確率、及び予測についての信頼レベルを提供する。いくつかの実施形態では、信頼レベルは、診断エンジンにおける統計ツールによって提供され得る。したがって、転帰の予測に基づいて、1つ以上の決定が利用可能であり得る。トリガ論理エンジンにおいて定義された1つ以上の決定に依存するルールは、診断エンジンが答えを提供するか又は行動を要求するための準備がいつ整うのかを決定するために使用され得る。
統計ツールはまた、1つ以上の決定の各々に対するリスクを査定し得る。リスクが低いときに、ワークフローは停止し、決定が下される。リスクが高いときに、診断エンジンは、医師、看護師、又は他の医療従事者に問い合わせ(例えば、クライアントデバイスにおけるタッチスクリーンに、又はマイクロホンを介して表示される質問)を発行し得る。医師、看護師、又は他の従事者が問い合わせに対して肯定的な応答をした(「OK」応答、又はクライアントデバイスのタッチスクリーン上のボタンを押す)ときに、ワークフローは停止し、決定が下される。
システムが、決定を行う前に(例えば、高いリスク又は低い信頼レベルのために)欠落データを検出するときに、診断エンジンは、欠落データ中の少なくとも1つ以上の特徴が測定され、モデリングツールに組み込まれるのを待つことを決定してもよい。選択された決定に基づいて、システムは、ユーザに新しい機能のセットを収集するように提案し得る。様々な実施形態によれば、システムは、たとえユーザによって要求されないときでも、新しい特徴が収集されるのを待ち得る。様々な実施形態によれば、モデリングツールはまた、関連する信頼性メトリックを有する利用可能な特徴に基づいてモデルを更新し得る。
様々な実施形態によれば、予測される転帰に対する信頼性が不十分な場合の収集のための特徴を示唆するために、システムは、予測の不確実性に対する個々の特徴の欠落の影響を定量化し得る。様々な態様では、収集される特徴を提案するために、システムはまた、「類似の」患者集団に基づいて動的モデル及び可変的重要度判定を適用し得る。利用可能な変数に基づいて、可変的重要度予測が取得され得る。欠落特徴を示唆するために、システムはまた、履歴データセットHを使用して、特徴の付加的な予測価値を定量化し得る。
様々な実施形態では、診断エンジンはまた、各特徴又は特徴のセットに割り当てられたランキング変数を提供する。したがって、診断エンジンは、それらのランク及びユーザ固有の制約関数に基づいて、測定されるべき欠落特徴を示唆し得る。制約関数は、特徴のコスト及び取得時間を含み得る。
図4は、様々な実施形態による、制約関数を使用して診断エンジンの関連性に従って、データセットにおける1つ以上の特徴をランク付けするための方法を例示する。F1、F2、F3、F4、F5、F6、F7、F8、F9、及びF10の取得する最大10個の特徴があると仮定し、その特徴のうちの3つが特定の患者について測定される{P=F2、F6、F9}。例えば、患者は病院の救急治療室に入ってもよく、特徴F2、F6、及びF9のうちの少なくとも2つは体温及び心拍数を含み得る。以下の表は、欠落特徴{M=F1、F3、F4、F5、F7、F8、及びF10}の測定に伴って取得(遅延)するコスト及び時間をリストにしている。
利用可能なデータ{P}に基づいて、臨床医は、患者に疾患dがあるかどうかを問い合わせ得る。したがって、本明細書に開示の診断ツールは、患者の転帰を高い信頼レベルで予測するという観点から、残りの特徴{M}の関連性についてのランキングを出力する。決定は、時間(time)に敏感であり得(例えば、次の1時間以内、又は他の規定時間内)、費用(cost)は二次的な関心事であり得る。したがって、診断エンジンは、以下のような数学的表現に比例する因子で上記の構成を反映するモデリングツールに制約関数(例えば、ランキング論理)を含み得る。
セット{M}における特徴は、制約関数の値に従って降順に臨床医に提示され得る。いくつかの実施形態では、提示されたN個の特徴(この例ではn=7)のうち、診断ツールは、リストにおける上位
個の特徴(例えば、F2、F6、及びF9の3つの特徴)の測定を提案し得る。様々な実施形態では、このプロセスは、診断エンジンにおける統計ツールが信頼レベル(所定の閾値を超える)に対して満足な値に達するまで繰り返される。
図5は、様々な実施形態による、診断エンジンについての予測の不確実性における欠落特徴の影響を定量化するための方法を例示するブロック図である。いくつかの実施形態では、欠落特徴セットは、個々の特徴(nセットにおけるn=1、図2参照)を含み得る。予測の不確実性は、予測の不確実性を定量化しようとしている特徴(例えば、F1、図4参照)を除いて、特徴のセットを「一定(constant)」(例えば、特徴F2、F6、及びF9、図4参照)に保持することによって取得される。モデリングツールは、各々がF1に対して異なる補定値を有するN個の補定について予測される転帰を評価する。いくつかの例では、統計ツールは、モデリングツールの予測に基づいて統計パラメータを判定する。例えば、統計ツールは、モデリングツールのN個の予測間の分散(variance)を判定し得る。様々な実施形態では、統計ツールによって見出されるより高い分散は、予測値に対するより大きな影響、したがって、この特定の患者の診断についての特徴F1のより大きな重要度(importance)に関連し得る。
より具体的には、診断エンジンは、Miにおける特定の特徴によって誘発される予測不確実性を、F3~F10を「一定」に保持し、F1を異なる値で複数回(N回)補定し、予測における分散を計算することによって定量化する。固定数の特徴(例えば、大きい特徴のセット、又は履歴データセットHから抽出されたマスターデータセットなど)を用いて訓練され、所与の確率と信頼レベルで診断を生成するモデルで開始する。
診断エンジンは、所与の患者についてPにおいてj個の特徴があり、Mにおいてk個の特徴があると想定すると、診断エンジンは以下のステップを実行し得る。
1からkまで変化するiについて、
セットMから欠落特徴Fiを選択する。
Mにおける特徴1...k-Fi(例えば、{1...k/i})を、履歴データセットからの大まかな推定(ランダム、平均、中央など)を用いて補定する。
履歴マスターデータセットHを使用して、複数の補定フレームワークを介して特徴Fiを補定し、特徴iについてN個の補定値を生成する。Mimputedは、各エントリがFiのN個の補定値のうちの1つに対応するNベクトルを表すものとする。
PのN個の同一コピーM{1...k/i}を生成する。
P、M{1...k/i},Mimputedを連結し、(N×(j+k))の入力行列Iを生成する。
モデリングツールを用いて、I内の行ごとに1つのN個の予測(例えば、診断値や転帰)のセットを提供する。
N個の予測から補定間分散biを判定する。Mにおける各特徴についてプロセスを繰り返した後、k個の値biは、セットMにおける相対的特徴関連性に関連付けられ得る。
各特徴をbiによって降順に並べる(高いbiは関連性が高いことに対応する)。
様々な実施形態では、予測を見つけるために使用されるモデルは固定され得、マスターデータセット又は履歴データセットHに基づく多重補定を使用して、変数重要度をランク付けする。様々な実施形態では、モデルは、所望に応じて動的に更新され得る。
様々な実施形態では、上記の方法は、1...kを特定のセットのリスト(例えば、[{1,2,3}、{1,3,4}、{1,3,5}など])で置き換えることによって、特徴の別々のセットをランク付けすることに一般化され得る。
図6は、様々な実施形態による、マスターデータセットから類似の患者データセットを選択する診断エンジンにおいて特徴の関連性を定量化するための方法を例示するブロック図である。様々な実施形態では、この方法は、(例えば、マスターデータセット又は履歴データセットHから)現在の患者に類似する患者のサブセットを含むフィルタリングされたデータセットを見つける。様々な実施形態では、「よく似ている」患者からなるより同質な集団を使用してモデルを構築することにより、現在の患者に固有の特徴の関連性ランキングが生成される。モデリングツールは、新しいモデルを構築するか、又は既存のモデルを更新して、類似の患者のサブセットについて既知の転帰(例えば、ベクトルY)を予測し、本明細書に開示の技術を使用して、欠落特徴に対する関連値又はランキングを提供する。
限定された特徴のセットを有する患者iの所定の観察値Piについて、診断エンジンは、履歴マスターデータセットHから最も近い被験者のセットNSを選択する。セットNSはまた、追加の測定済特徴のセットXを含み得る。いくつかの実施形態では、セットNSの選択は、限定された特徴の初期セットに基づく。様々な実施形態において、セットNSは、異なるメトリック(ユークリッド、マンハッタン、マハラノビス、ミンコウスキー、シェビシェフ、コサイン、相関、ハミング、ジャッカード、スペアマン、ガウスカーネルなど)のうちの任意の1つを使用して、複数の方法(k近傍法、固定半径近傍法など)を使用して定義することができる。
様々な実施形態では、セットNSのサイズは、この方法における調整可能な入力であり得る。例えば、様々な実施形態では、すべての被験者が使用され得る。マスターデータセットにおけるセットNS、及び所望の予測値(例えば、セットNS内の患者についての既知の転帰Y)を使用して、モデリングツールは、特徴Xを使用して監視下のモデルFNSを構築する。FNSの性能(例えば、転帰予測及び信頼レベル)が、予め判定された閾値(例えば、正解率、AUC、AUPR、F1スコア、感度、特異度、PPV、NPV、RMSE、r2、AIC、BICなど)よりも大きくない場合、モデリングツールは、セットXを更新し、新しいモデルFNSを構築する(又は、既存のモデルを更新する)。
モデルFNSが満足できるときに、モデリングツールは、FNSの変数重要度を計算する。FNSの変数重要度は、複数の方法のうちの任意の1つによって、X内の各特徴についての数値を提供する。様々な実施形態では、変数重要度は、モデル情報アプローチ(線形回帰、ロジスティック回帰、SVM、ツリーベースの方法、ニューラルネットワークなど)によって提供され得る。このような方法は、gini重要性、置換に基づく重要性、係数の大きさなどを含む。限定されたモデル固有の能力を有する様々な実施形態では、非モデル情報方法は、正解率、AUC、AUPR、F1スコア、感度、特異度、PPV、NPV、RMSE、r2、AIC、BICなどの一般的なメトリックに対して最適化される、ヒルクライミング、シミュレーションアニーリング、遺伝子ベースアルゴリズムなどのような探索アルゴリズムを利用する。したがって、診断エンジンは、FNSの変数重要度のランキングに基づいて、患者測定についての新しい特徴を提案する。
様々な実施形態では、モデルFNSは、各新しい特徴提案について構築又は更新され得る。様々な実施形態では、特徴がMiにあるがXには存在しないときに、その特徴についての特徴重要度は、NA(利用可能ではない)に対応することができるか、又は対応することになる。
図7は、様々な実施形態による、マスターデータセットから選択された履歴データセットを使用して、診断エンジンにおいて特徴の関連性を定量化するための方法を示すブロック図である。様々な実施形態は、この方法を使用して、予測及び対応する回顧転帰を含む履歴データセットHを利用する。存在する特徴のセットPiとk個の欠落特徴のセットMiが与えられると、診断エンジンは、患者iについて、履歴データセットHを探索し、Piにすでに存在するものに加えて、どの特徴が予測正解率に最大の影響を及ぼしたかを判定する。
診断エンジンは、Piにおける特徴のみが存在するインスタンスに従って、HのサブセットHpを選択する。様々な実施形態において、臨床医又は他の権限のあるユーザはまた、サブセットに対するオプションを有するか、又は異なる距離メトリック(ユークリッド、マンハッタン、マハラノビス、ミンコウスキー、シェビシェフ、コサイン、相関、ハミング、ジャッカード、スペアマン、ガウスカーネルなど)を有する様々な方法(k近傍法、固定半径近傍法など)を使用して、Piに最も近い被験者のセット及び距離メトリックを選択することによって、さらにHpを「キュレート」し得る。
1...kにわたるインデックスjについて、この方法は、様々な実施形態において、以下のように進行する。すなわち、セットMiにおける特徴Fjを選択する。Piにおける特徴が存在し、特徴Fjも存在するインスタンスに従って、HのサブセットHp+jを選択する。Hp+jについて、正解率、AUC、AUPR、F1スコア、感度、特異性、PPV、NPV、RMSE、r2、AIC、BICなどの標準的な測定メトリックを使用して、既知の結果(Y)に基づいて、モデルに基づく予測の正解率Ajを判定する。対応する値Ajに基づいて、Mにおける各特徴Fjを降順に順序付ける。
様々な実施形態では、上記の方法は、欠落特徴1...kを上記のステップの各々における欠落特徴のnセットのリスト(例えば、[{1,2,3}、{1,3,4}、{1,3,5}など])で置き換えることによって、n特徴の選択されたセットをランク付けすることに一般化され得る。
図8は、様々な実施形態による、時間シーケンスにわたって受信されたか、又は補定された複数の医療的特徴に基づいて、患者に対する医療行動を実行するための方法800におけるステップを例示するフローチャートである。方法800は、ネットワークを介して1つ以上のサーバに結合されたクライアントデバイスの任意の1つ(例えば、サーバ130のうちの任意の1つ、及びクライアントデバイス110の任意の1つ、及びネットワーク150)によって少なくとも部分的に実行され得る。例えば、様々な実施形態によれば、サーバは、医療関係者又は医療従事者によって携行する1つ以上の医療デバイス又はポータブルコンピュータデバイスをホストし得る。クライアントデバイス110は、医療施設内の労働者又は他の職員、患者を医療施設又は病院の救急治療室に搬送する救急車内の救急救命士、救急車で搬送するか、又は個人の住居又は医療施設から離れた公共の場所で患者を看護する者によって取り扱われ得る。方法800におけるステップのうちの少なくともいくつかは、コンピュータのメモリに記憶されたコマンドを実行するプロセッサ(例えば、プロセッサ212及びメモリ220)を有するコンピュータによって実行され得る。様々な実施形態によれば、ユーザは、クライアントデバイス内のアプリケーションを起動して、ネットワークを介してサーバ内の診断エンジン(例えば、アプリケーション222及び診断論理エンジン240)にアクセスし得る。診断エンジンは、トリガ論理エンジン、モデリングツール、統計ツール、及びリアルタイムで臨床データを検索、供給、及び処理し、その行動推薦を提供する補定ツール(例えば、トリガ論理エンジン242、モデリングツール244、統計ツール246、及び補定ツール248)を含み得る。さらに、方法800に開示のステップは、とりわけ、診断エンジン(例えば、データベース252)を使用して、コンピュータの一部であるか、又はコンピュータと通信可能に結合されたデータベースにおけるファイルを検索、編集、及び/又は記憶することを含み得る。本開示に合致する方法は、異なるシーケンスで実行される、方法800に例示されるステップのすべてではないが少なくともいくつかを含み得る。さらに、本開示に合致する方法は、時間的に重複して、又はほぼ同時に実行される方法800におけるように、少なくとも2つ以上のステップを含み得る。
ステップ802は、収集する所望の初期特徴のセットを推薦することを含む。様々な実施形態では、ステップ802は、集団全体の推定値に基づくか、又はこれまでに記録において利用可能なものを使用して、提案を提供することを含む。
ステップ804は、新しい観察を収集することを含み、観察は、1つ以上の特徴を含む。様々な実施形態では、ステップ804は、特徴の重要性、コストの制約、及び時間の制約に基づく1つ以上の特徴の要求を、医師、看護師又は他の医療従事者から受信することを含み得る。様々な実施形態では、ステップ804は、所与の患者について測定された1つ以上の新しい特徴を収集することを含む。様々な実施形態では、ステップ804は、新しい特徴が利用可能になると、次のステップに移動することを含む。様々な実施形態では、ステップ804は、進行する前に測定される特徴の予め判定されたセットを待つことを含む。
ステップ806は、転帰を予測することと、予測された転帰の信頼レベルを提供することとを含む。様々な実施形態では、ステップ806は、予測及び/又は確率を提供するために機械学習モデルを使用することを含む。
ステップ808は、信頼レベルが予め判定された閾値よりも大きいかどうかを判定することを含む。様々な実施形態では、ステップ808は、決定が、その決定に依存するルールに基づいて準備が整っているかどうかを評価することを含む。決定が整っているときに、ステップ808は、ステップ810aにおいて、スコアを表示し、決定のリスクを査定することを含み得る。ステップ810aにおいて、有害事象のリスクがリスク閾値よりも低いときに、ワークフローは終了する。
ステップ812aは、有害事象のリスクがリスク閾値よりも高いときに、医師、看護師、又は医療従事者に承認を要求することを含む。ステップ812aで医療従事者が要求を承認するときに、ワークフローは終了する。医療従事者がステップ812aで要求を承認しないときに、ステップ814は、重要度のランキング変数(s)、所与の未測定特徴のセットについてのサンプリング頻度(v1n)を提供することを含む。
ステップ816は、所与の未測定特徴のセットについてのノイズ許容度(v2n)を識別することを含む。様々な実施形態では、ステップ816は、本開示に合致するノイズ許容度に関する方法のうちの1つまたはそれら組み合わせに基づいて、各特徴についての測定技術を選択することを含む。
ステップ808では、信頼レベルが予め判定された閾値よりも低いときに、ステップ810bは、要求されたデータがすべて利用可能であるかどうかを判定することを含む。すべてのデータが利用可能であるわけではない場合、ユーザは、ステップ812bに進み、このステップは、新しいデータを待つことを伴う。ステップ810bに従ってすべての要求されたデータが利用可能であるときに、この方法はステップ814において継続する。
図9は、様々な実施形態による、個々の特徴の欠落の影響を定量化することによって、診断エンジンに関連する特徴を選択する方法900におけるステップを例示するフローチャートである。方法900は、少なくとも部分的に、ネットワークを介して1つ又は複数のサーバに結合されたクライアントデバイス(例えば、サーバ130の任意の1つ、及びクライアントデバイス110の任意の1つ、及びネットワーク150)の任意の1つによって実行されてもよい。例えば、様々な実施形態によれば、サーバは、医療関係者又は医療従事者によって携行する1つ以上の医療デバイス又はポータブルコンピュータデバイスをホストし得る。クライアントデバイス110は、医療施設内の労働者又は他の職員、患者を医療施設又は病院の救急治療室に搬送する救急車内の救急救命士、救急車で搬送するか、又は個人の住居又は医療施設から離れた公共の場所で患者を看護する者によって取り扱われ得る。方法900におけるステップのうちの少なくともいくつかは、コンピュータのメモリに記憶されたコマンドを実行するプロセッサ(例えば、プロセッサ212及びメモリ220)を有するコンピュータによって実行され得る。様々な実施形態によれば、ユーザは、クライアントデバイス内のアプリケーションを起動して、ネットワークを介してサーバ内の診断エンジン(例えば、アプリケーション222及び診断論理エンジン240)にアクセスし得る。診断エンジンは、トリガ論理エンジン、モデリングツール、統計ツール、及びリアルタイムで臨床データを検索、供給、及び処理し、その行動推薦を提供する補定ツール(例えば、トリガ論理エンジン242、モデリングツール244、統計ツール246、及び補定ツール248)を含み得る。さらに、方法900に開示のステップは、とりわけ、診断エンジン(例えば、データベース252)を使用して、コンピュータの一部であるか、又はコンピュータと通信可能に結合されたデータベースにおけるファイルを検索、編集、及び/又は記憶することを含み得る。本開示に合致する方法は、異なるシーケンスで実行される、方法900に例示されるステップのすべてではないが少なくともいくつかを含み得る。さらに、本開示に合致する方法は、時間的に重複して、又はほぼ同時に実行される方法900におけるように、少なくとも2つ以上のステップを含み得る。
ステップ902は、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未測定特徴に第1の値を補定することを含む。
ステップ904は、インスタンスにおける第1の値を使用するモデルを用いて第1の転帰を評価することを含む。
ステップ906は、他の残りの未測定特徴を一定に保持しながら、データセットにおける未測定特徴に第2の値を補定することを含む。
ステップ908は、インスタンスにおける第2の値を使用するモデルを用いて第2の転帰を評価することを含む。
ステップ910は、第1の転帰と第2の転帰を用いて統計パラメータを判定することを含む。
ステップ912は、未測定特徴を、判定された統計パラメータに対応するランキングに割り当てることを含む。
図10は、様々な実施形態による、マスターデータセットからの類似の患者集団のためのフィルタに基づいて、診断エンジンに関連する特徴を選択する方法1000におけるステップを例示するフローチャートである。方法1000は、ネットワークを介して1つ以上のサーバに結合されたクライアントデバイスの任意の1つ(例えば、サーバ130のうちの任意の1つ、及びクライアントデバイス110の任意の1つ、及びネットワーク150)によって少なくとも部分的に実行され得る。例えば、様々な実施形態によれば、サーバは、医療関係者又は医療従事者によって携行する1つ以上の医療デバイス又はポータブルコンピュータデバイスをホストし得る。クライアントデバイス110は、医療施設内の労働者又は他の職員、患者を医療施設又は病院の救急治療室に搬送する救急車内の救急救命士、救急車で搬送するか、又は個人の住居又は医療施設から離れた公共の場所で患者を看護する者によって取り扱われ得る。方法1000におけるステップのうちの少なくともいくつかは、コンピュータのメモリに記憶されたコマンドを実行するプロセッサ(例えば、プロセッサ212及びメモリ220)を有するコンピュータによって実行され得る。様々な実施形態によれば、ユーザは、クライアントデバイス内のアプリケーションを起動して、ネットワークを介してサーバ内の診断エンジン(例えば、アプリケーション222及び診断論理エンジン240)にアクセスし得る。診断エンジンは、トリガ論理エンジン、モデリングツール、統計ツール、及びリアルタイムで臨床データを検索、供給、及び処理し、その行動推薦を提供する補定ツール(例えば、トリガ論理エンジン242、モデリングツール244、統計ツール246、及び補定ツール248)を含み得る。さらに、方法1000に開示のステップは、とりわけ、診断エンジン(例えば、データベース252)を使用して、コンピュータの一部であるか、又はコンピュータと通信可能に結合されたデータベースにおけるファイルを検索、編集、及び/又は記憶することを含み得る。本開示に合致する方法は、異なるシーケンスで実行される、方法1000に例示されるステップのすべてではないが少なくともいくつかを含み得る。さらに、本開示に合致する方法は、時間的に重複して、又はほぼ同時に実行される方法1000におけるように、少なくとも2つ以上のステップを含み得る。
ステップ1002は、インスタンスからの少なくとも1つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することを含み、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む。
ステップ1004は、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、1つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することを含む。
ステップ1006は、未測定特徴を、モデルベースの特徴重要度からの出力に対応するランキングに割り当てることを含む。
図11は、様々な実施形態による、測定済特徴についてのモデルに基づいて診断エンジンに関連する特徴を選択する方法1100におけるステップを例示するフローチャートである。方法1100は、ネットワークを介して1つ以上のサーバに結合されたクライアントデバイスの任意の1つ(例えば、サーバ130のうちの任意の1つ、及びクライアントデバイス110の任意の1つ、及びネットワーク150)によって少なくとも部分的に実行され得る。例えば、様々な実施形態によれば、サーバは、医療関係者又は医療従事者によって携行する1つ以上の医療デバイス又はポータブルコンピュータデバイスをホストし得る。クライアントデバイス110は、医療施設内の労働者又は他の職員、患者を医療施設又は病院の救急治療室に搬送する救急車内の救急救命士、救急車で搬送するか、又は個人の住居又は医療施設から離れた公共の場所で患者を看護する者によって取り扱われ得る。方法800におけるステップのうちの少なくともいくつかは、コンピュータのメモリに記憶されたコマンドを実行するプロセッサ(例えば、プロセッサ212及びメモリ220)を有するコンピュータによって実行され得る。様々な実施形態によれば、ユーザは、クライアントデバイス内のアプリケーションを起動して、ネットワークを介してサーバ内の診断エンジン(例えば、アプリケーション222及び診断論理エンジン240)にアクセスし得る。診断エンジンは、トリガ論理エンジン、モデリングツール、統計ツール、及びリアルタイムで臨床データを検索、供給、及び処理し、その行動推薦を提供する補定ツール(例えば、トリガ論理エンジン242、モデリングツール244、統計ツール246、及び補定ツール248)を含み得る。さらに、方法1100に開示のステップは、とりわけ、診断エンジン(例えば、データベース252)を使用して、コンピュータの一部であるか、又はコンピュータと通信可能に結合されたデータベースにおけるファイルを検索、編集、及び/又は記憶することを含み得る。本開示に合致する方法は、異なるシーケンスで実行される、方法1100に例示されるステップのすべてではないが少なくともいくつかを含み得る。さらに、本開示に合致する方法は、時間的に重複して、又はほぼ同時に実行される方法1100におけるように、少なくとも2つ以上のステップを含み得る。
ステップ1102は、既知の転帰に関連する複数のデータセットを含むマスターデータセットにアクセスすることを含む。
ステップ1104は、転帰についてのモデルに関連する分散値を判定することを含み、そのモデルは、未測定特徴、及びデータセット内の少なくとも1つの他の別個の特徴に基づく、判定することを含む。
ステップ1106は、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することを含む。
ステップ1108は、分散値に対する予測の分散の値に従って、未測定特徴にランキングを割り当てることを含む。
図12は、様々な実施形態による、マスターデータセットから選択された履歴データセットに基づいて、診断エンジンに関連する特徴を選択する方法1200におけるステップを例示するフローチャートである。方法1200は、ネットワークを介して1つ以上のサーバに結合されたクライアントデバイスの任意の1つ(例えば、サーバ130のうちの任意の1つ、及びクライアントデバイス110の任意の1つ、及びネットワーク150)によって少なくとも部分的に実行され得る。例えば、様々な実施形態によれば、サーバは、医療関係者又は医療従事者によって携行する1つ以上の医療デバイス又はポータブルコンピュータデバイスをホストし得る。クライアントデバイス110は、医療施設内の労働者又は他の職員、患者を医療施設又は病院の救急治療室に搬送する救急車内の救急救命士、救急車で搬送するか、又は個人の住居又は医療施設から離れた公共の場所で患者を看護する者によって取り扱われ得る。方法1200におけるステップのうちの少なくともいくつかは、コンピュータのメモリに記憶されたコマンドを実行するプロセッサ(例えば、プロセッサ212及びメモリ220)を有するコンピュータによって実行され得る。様々な実施形態によれば、ユーザは、クライアントデバイス内のアプリケーションを起動して、ネットワークを介してサーバ内の診断エンジン(例えば、アプリケーション222及び診断論理エンジン240)にアクセスし得る。診断エンジンは、トリガ論理エンジン、モデリングツール、統計ツール、及びリアルタイムで臨床データを検索、供給、及び処理し、その行動推薦を提供する補定ツール(例えば、トリガ論理エンジン242、モデリングツール244、統計ツール246、及び補定ツール248)を含み得る。さらに、方法1200に開示のステップは、とりわけ、診断エンジン(例えば、データベース252)を使用して、コンピュータの一部であるか、又はコンピュータと通信可能に結合されたデータベースにおけるファイルを検索、編集、及び/又は記憶することを含み得る。本開示に合致する方法は、異なるシーケンスで実行される、方法1200に例示されるステップのすべてではないが少なくともいくつかを含み得る。さらに、本開示に合致する方法は、時間的に重複して、又はほぼ同時に実行される方法1200におけるように、少なくとも2つ以上のステップを含み得る。
ステップ1202は、データセットに基づいて決定値を査定するためのルールを判定することを含み、データセットは、インスタンスにおける複数の測定済特徴及びインスタンスにおける未測定特徴について収集された値を含み、ルールは、(1)複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び(2)1つ以上の測定済特徴と合致する(consistent with)。
ステップ1204は、複数の転帰値及びデータセットの各々に対する既知の転帰に基づいて、ルールの正確率を判定することを含む。
ステップ1206は、未測定特徴を、ルールの正確率に対応するランキングに割り当てることを含む。
図13は、様々な実施形態による、測定済特徴を使用して、欠落特徴の重要性を予測する多変数モデルを構築する方法1300におけるステップを例示するフローチャートである。方法1300は、ネットワークを介して1つ以上のサーバに結合されたクライアントデバイスの任意の1つ(例えば、サーバ130のうちの任意の1つ、及びクライアントデバイス110の任意の1つ、及びネットワーク150)によって少なくとも部分的に実行され得る。例えば、様々な実施形態によれば、サーバは、医療関係者又は医療従事者によって携行する1つ以上の医療デバイス又はポータブルコンピュータデバイスをホストし得る。クライアントデバイス110は、医療施設内の労働者又は他の職員、患者を医療施設又は病院の救急治療室に搬送する救急車内の救急救命士、救急車で搬送するか、又は個人の住居又は医療施設から離れた公共の場所で患者を看護する者によって取り扱われ得る。方法1200におけるステップのうちの少なくともいくつかは、コンピュータのメモリに記憶されたコマンドを実行するプロセッサ(例えば、プロセッサ212及びメモリ220)を有するコンピュータによって実行され得る。様々な実施形態によれば、ユーザは、クライアントデバイス内のアプリケーションを起動して、ネットワークを介してサーバ内の診断エンジン(例えば、アプリケーション222及び診断論理エンジン240)にアクセスし得る。診断エンジンは、トリガ論理エンジン、モデリングツール、統計ツール、及びリアルタイムで臨床データを検索、供給、及び処理し、その行動推薦を提供する補定ツール(例えば、トリガ論理エンジン242、モデリングツール244、統計ツール246、及び補定ツール248)を含み得る。さらに、方法1300に開示のステップは、とりわけ、診断エンジン(例えば、データベース252)を使用して、コンピュータの一部であるか、又はコンピュータと通信可能に結合されたデータベースにおけるファイルを検索、編集、及び/又は記憶することを含み得る。本開示に合致する方法は、異なるシーケンスで実行される、方法1300に例示されるステップのすべてではないが少なくともいくつかを含み得る。さらに、本開示に合致する方法は、時間的に重複して、又はほぼ同時に実行される方法1300におけるように、少なくとも2つ以上のステップを含み得る。
第3の方法の背後にある基本的なアイデアは、与えられた被験者に利用可能な特徴を使用して未測定特徴の重要度を予測するマルチクラスモデルを構築することである。このモデルは、Mにおけるすべての特徴についての履歴データセットHにおけるすべての被験者についてMにおける特定の特徴によって誘発される分散を推定するデータセットを作成することによって作成される。この方法論は、既に収集された任意の特徴のセットがあるが、信頼性は十分ではない場合に好適である。様々な実施形態では、モデルは、新しい特徴提案が望まれるときに構築又は更新される。未測定特徴のセットが同じである(例えば、バイタルで開始し、CMP、CBC、特殊なバイオマーカーのような測定を提案する)ときに、様々な実施形態において、モデル構築プロセスは1回のみ行われ得る。
ステップ1302は、Hにおけるすべての被験者について存在すると想定される特徴に基づいて重要度ベクトルを生成することを含む。様々な実施形態では、ステップ1302は、マスターデータセットにおける各被験者sについて、関連する時間枠の間に利用可能な最大数の特徴が存在するものに対応する観察Xsを検索することを含む。Sは、すべてのsについてのセットXsを指すとする。様々な実施形態では、Xsにおける特徴のサブセットは、P又はMのいずれかに属する。Pは、存在すると仮定される特徴のセットであるが、Mは、Pの後に収集されると仮定される特徴のセットであり、Mにおいてk個の特徴があり得る。様々な実施形態では、ステップ1302は、Sを使用して転帰Yを予測するためにモデルfを構築し、標準的な方法(例えば、予測間隔の標準誤差、ジャックナイフ推定量、ベイズ推定量、最尤ベースの推定量など)を使用して、Sにおけるすべてのsについての予測f(S)の分散を計算することを含み得る。分散はs×1ベクトルVであり、各sについてのVにおいてエントリがある。
様々な実施形態では、ステップ1302は、Sにおけるすべての被験者sについて、及び1....kのjについて、Msのj番目のエントリ(Ms,jに対応する)を取り、それを異なる値にランダムに置き換えることを含む。これは、他の被験者の同じ特徴のランダム値を選択するか、又はマルコフモンテカルロ法を使用して残りの他の特徴を用いてこの特徴をモデル化する条件付き分布から引き出し、置き換えられた新しい値を使用し、それがMs,jの最初に観測された値であると取り繕い、モデルを使用して予測値を生成し、上記のステップを何度も独立に繰り返し、予測Vjの分散を計算し、その値をXに基づく分散推定で除算し、その2つの比をRs,j=Vj/Vsと示し、Msのすべてのj個のエントリについてステップ(I)~(III)を実行することによって行うことができる。結果をRs,jで最大から最小に並べ替える。Rs,jが大きいほど、j番目の特徴は被験者に対してより重要である。
ステップ1304は、存在する特徴Pを使用して、パーソナライズされた特徴重要度のモデルを生成することを含む。具体的には、Pが利用可能である履歴データセットにおけるすべての被験者を使用して、Pを使用してRを予測するマルチクラスモデルg(多項回帰、ツリーベースの方法、ニューラルネットワークなどを使用)を構築する。
ステップ1306は、与えられた被験者iに対して、g(Pi)を介して、Miにおける特徴のランキングを提供することを含む。
図14は、様々な実施形態による、特徴の予測可能性に基づいて、選択された特徴のためのサンプリング頻度を判定する方法1400におけるステップを例示するフローチャートである。方法1400は、ネットワークを介して1つ以上のサーバに結合されたクライアントデバイスの任意の1つ(例えば、サーバ130のうちの任意の1つ、及びクライアントデバイス110の任意の1つ、及びネットワーク150)によって少なくとも部分的に実行され得る。例えば、様々な実施形態によれば、サーバは、医療関係者又は医療従事者によって携行する1つ以上の医療デバイス又はポータブルコンピュータデバイスをホストし得る。クライアントデバイス110は、医療施設における労働者又は他の職員、患者を医療施設又は病院の救急治療室に搬送する救急車における救急救命士、救急車で搬送するか、又は個人の住居又は医療施設から離れた公共の場所で患者を看護する者によって取り扱われ得る。方法1400におけるステップのうちの少なくともいくつかは、コンピュータのメモリに記憶されたコマンドを実行するプロセッサ(例えば、プロセッサ212及びメモリ220)を有するコンピュータによって実行され得る。様々な実施形態によれば、ユーザは、クライアントデバイスにおけるアプリケーションを起動して、ネットワークを介してサーバにおける診断エンジン(例えば、アプリケーション222及び診断論理エンジン240)にアクセスし得る。診断エンジンは、トリガ論理エンジン、モデリングツール、統計ツール、及びリアルタイムで臨床データを検索、供給、及び処理し、その行動推薦を提供する補定ツール(例えば、トリガ論理エンジン242、モデリングツール244、統計ツール246、及び補定ツール248)を含み得る。さらに、方法1400に開示のステップは、とりわけ、診断エンジン(例えば、データベース252)を使用して、コンピュータの一部であるか、又はコンピュータと通信可能に結合されたデータベースにおけるファイルを検索、編集、及び/又は記憶することを含み得る。本開示に合致する方法は、異なるシーケンスで実行される、方法1400に例示されるステップのすべてではないが少なくともいくつかを含み得る。さらに、本開示に合致する方法は、時間的に重複して、又はほぼ同時に実行される方法1400におけるように、少なくとも2つ以上のステップを含み得る。
この方法の背後にある基本的な考え方は、特徴の将来の値がどの程度予測可能かを推定し、これに基づいて、それらどのくらいの頻度でサンプリングされるべきかを判定することである。直観的に、特徴の将来の値が予測しにくいほど、頻繁にサンプリングされるべきである。この方法は、対応する特徴ベクトルPiを有する所与の被験者iに対して、以下のように形式的に記載することができる。
ステップ1402は、所与の対象iについて、観察された特徴Pを識別することを含み、欠落特徴はMであり、Pにおいてj個の特徴があり、Mにおいてk個の特徴がある。P又はMのいずれかにあり得る所与の特徴のサンプリング頻度sを判定したいと想定する。
ステップ1404は、特徴行列Xを使用して、st+1を予測するモデルgを構築することを含む。様々な実施形態では、ステップ1404は、履歴データセットHから特徴行列Xを選択することを含む。特徴行列Xは、Pにおける特徴を排他的に含み、最大tの各特徴についての時系列観察を含み得る。関連するモデルには、自己回帰モデル、移動平均モデル、マルコフモデルなどを含む。
ステップ1406は、g(P0...t)を使用して、st+xについての予測を生成することを含む。
ステップ1408は、[Pt,g(P0...t)]の分散又はCVを判定することを含む。様々な実施形態では、この時間依存性の変動は、Vsとして示される。様々な実施形態では、上記は、複数の将来値(例えば、st+x_1、st+x_2、...st+x_n)を予測することに拡張することができる。様々な実施形態では、ステップ1408は、P及びMにおける残りの特徴のほとんど又はすべてについて、上記のステップを繰り返すことを含む。
ステップ1410は、分散に基づいて、選択された特徴を他の特徴に関してランク付けすることを含む。
ステップ1412は、そのランクが上位r番目のパーセンタイルにあるときに、選択された特徴のサンプリング頻度を増加させることを含む。様々な実施形態では、ステップ1412は、特徴の(履歴データセットから抽出することができる)ベースラインサンプリング頻度に関してランクに比例する経験的に判定された因子を選択することを含む。特徴のランクが下位r番目のパーセンタイルにあるときに、ステップ1412は、(履歴データセットから抽出することができる)ベースラインサンプリング頻度に関してランクに反比例する経験的に判定された因子によってサンプリング頻度を減少させることを提案することを含む。ハードウェアの概要
図15は、図1及び図2のクライアントデバイス110及びサーバ130、並びに図8~図14の方法が実装され得る例示的なコンピュータシステム1500を例示するブロック図である。所定の態様では、コンピュータシステム1500は、専用サーバ内にあるか、別のエンティティ内に一体化されているか、又は複数のエンティティにわたって分散されているかのいずれかで、ハードウェア又はソフトウェアとハードウェアの組み合わせを使用して実装され得る。
コンピュータシステム1500(例えば、クライアントデバイス110及びサーバ130)は、情報を通信するためのバス1508又は他の通信メカニズムと、情報を処理するためのバス1508と結合されたプロセッサ1502(例えば、プロセッサ212)とを含む。一例として、コンピュータシステム1500は、1つ以上のプロセッサ1502で実装され得る。プロセッサ1502は、汎用マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブル論理デバイス(PLD)、コントローラ、状態マシン、ゲート論理、ディスクリートハードウェア構成要素、又は情報の計算又は他の操作を実行することができる他の好適なエンティティであり得る。
コンピュータシステム1500は、ハードウェアに加えて、ランダムアクセスメモリ(RAM)、フラッシュメモリ、読み出し専用メモリ(ROM)、プログラマブル読み出し専用メモリ(PROM)、消去可能PROM(EPROM)、レジスタ、ハードディスク、リムーバブルディスク、CD-ROM、DVD、又は、プロセッサ1502によって実行される情報及び命令を記憶するためにバス1508に結合された任意の他の好適なストレージなどの含まれるメモリ1504(例えば、メモリ220)に記憶された、問題のコンピュータプログラムのための実行環境を生成するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、又は、それらのうちの1つ以上の組み合わせを含むことができる。プロセッサ1502及びメモリ1504は、特殊目的論理回路によって補足されるか、又はこれに内蔵され得る。
命令は、メモリ1504に記憶され、1つ以上のコンピュータプログラム製品、すなわち、コンピュータシステム1500による実行又はコンピュータシステム1500の動作を制御するために、コンピュータ可読媒体上に符号化されたコンピュータプログラム命令のうちの1つ以上のモジュールに実装され、データ指向言語(例えば、SQL、dBase)、システム言語(例えば、C、Objective-C、C+、Assembly)、アーキテクチャ言語(例えば、Java、NET)、及びアプリケーション言語(例えば、PHP、Ruby、Perl、Python)などのコンピュータ言語を含むが、これらに限定されない、当業者には周知の任意の方法に従って実装され得る。命令はまた、配列言語、アスペクト指向言語、アセンブリ言語、オーサリング言語、コマンドラインインターフェース言語、コンパイル言語、同時言語、カーリーブラケット言語、データフロー言語、データ構造言語、宣言型言語、難解言語、拡張言語、第4世代言語、機能言語、対話型モード言語、インタプリタ型言語、反復言語、リストベース言語、小言語、論理ベース言語、機械言語、マクロ言語、メタプログラミング言語、マルチパラダイム言語、数値解析、非英語ベース言語、オブジェクト指向クラスベース言語、オブジェクト指向プロトタイプベース言語、オフサイドルール言語、手続き型言語、リフレクティブ言語、ルールベース言語、スクリプト言語、スタックベース言語、同期言語、構文処理言語、視覚言語、ヴィルト言語、xmlベース言語などのコンピュータ言語で実装され得る。メモリ1504はまた、プロセッサ1502によって実行される命令の実行中に、一時変数又は他の中間情報を記憶するために使用され得る。
本明細書において説明されるコンピュータプログラムは、必ずしもファイルシステムにおけるファイルに対応しない。プログラムは、他のプログラム又はデータを保持するファイルの一部分(例えば、マークアップ言語文書に記憶される1つ以上のスクリプト)、問題のプログラム専用の単一ファイル、又は複数の協調ファイル(例えば、1つ以上のモジュール、サブプログラム、又はコードの一部分を記憶するファイル)に記憶することができる。コンピュータプログラムは、1つのコンピュータ、又は1つのサイトに位置するか、もしくは複数のサイトに分散され、かつ通信ネットワークによって相互接続される複数のコンピュータで実行されるように展開することができる。本明細書に記載のプロセス及び論理フローは、入力データに対して動作し、出力を生成することによって機能を実行するために、1つ以上のコンピュータプログラムを実行する1つ以上のプログラマブルプロセッサによって実行することができる。
コンピュータシステム1500は、さらに、情報及び命令を記憶するためにバス1508に結合された、磁気ディスク又は光ディスクなどのデータ記憶デバイス1506を含む。コンピュータシステム1500は、入出力モジュール1510を介して様々なデバイスに結合され得る。入出力モジュール1510は、任意の入出力モジュールであり得る。例示的な入出力モジュール1510は、USBポートなどのデータポートを含む。入出力モジュール1510は、通信モジュール1512に接続するように構成されている。例示的な通信モジュール1512(例えば、通信モジュール218)は、Ethernetカード及びモデムなどのネットワークインターフェースカードを含む。特定の態様では、入出力モジュール1510は、入力デバイス1514(例えば、入力デバイス214)及び/又は出力デバイス1516(例えば、出力デバイス216)などの複数のデバイスに接続するように構成されている。例示的な入力デバイス1514は、キーボード及びポインティングデバイス、例えば、マウス又はトラックボールを含み、これらにより、ユーザは、コンピュータシステム1500に入力を提供することができる。触覚入力デバイス、視覚入力デバイス、オーディオ入力デバイス、又は脳コンピュータインターフェースデバイスなどの他の種類の入力デバイス1514を使用して、ユーザとの対話を提供することもできる。例えば、ユーザに提供されるフィードバックは、任意の形態の感覚フィードバック、例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバックとすることができ、ユーザからの入力は、音響、音声、触覚、又は脳波入力を含む任意の形態で受信することができる。例示的な出力デバイス1516は、ユーザに情報を表示するための、LCD(液晶ディスプレイ)モニタなどの表示デバイスを含む。
本開示の一態様によれば、クライアントデバイス110及びサーバ130は、プロセッサ1502がメモリ1504に含まれる1つ以上の命令の1つ以上のシーケンスを実行することに応答して、コンピュータシステム1500を使用して実装することができる。このような命令は、データ記憶デバイス1506のような別の機械可読媒体からメモリ1504に読み込まれ得る。メインメモリ1504に含まれる命令のシーケンスの実行により、プロセッサ1502は、本明細書に記載のプロセスステップを実行する。また、マルチ処理構成における1つ以上のプロセッサを用いて、メモリ1504に含まれる命令のシーケンスを実行し得る。別の態様では、本開示の様々な態様を実装するために、ハードワイヤード回路を、ソフトウェア命令の代わりに、又はそれと組み合わせて使用してもよい。したがって、本開示の態様は、ハードウェア回路及びソフトウェアの任意の特定の組み合わせに限定されない。
本明細書に記載の主題の様々な態様は、バックエンド構成要素、例えば、データサーバを含むか、ミドルウェア構成要素、例えば、アプリケーションサーバを含むか、又はフロントエンド構成要素、例えば、ユーザが本明細書に記載の主題の実施態様と対話することができるグラフィカルユーザインターフェース又はウェブブラウザを有するクライアントコンピュータ、又は1つ以上のこのようなバックエンド、ミドルウェア、又はフロントエンド構成要素の任意の組み合わせを含むコンピューティングシステムにおいて実装することができる。システムの構成要素は、デジタルデータ通信の任意の形態又は媒体、例えば通信ネットワークによって相互接続することができる。通信ネットワーク(例えば、ネットワーク150)は、例えば、LAN、WAN、インターネットなどのうちの任意の1つ以上を含むことができる。さらに、通信ネットワークは、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スターバスネットワーク、ツリー又は階層ネットワークなどを含む、ネットワークトポロジのうちの任意の1つ以上を含むことができるが、これらに限定されない。通信モジュールは、例えば、モデム又はEthernetカードとすることができる。
コンピュータシステム1500は、クライアント及びサーバを含むことができる。クライアントとサーバは、一般的に互いに離れており、展開的には通信ネットワークを介して対話する。クライアントとサーバの関係は、それぞれのコンピュータ上で実行され、互いにクライアント-サーバの関係を有するコンピュータプログラムにより生じる。コンピュータシステム1500は、例えば、限定されるものではないが、デスクトップコンピュータ、ラップトップコンピュータ、又はタブレットコンピュータとすることができる。コンピュータシステム1500はまた、例えば、携帯電話、PDA、モバイルオーディオプレーヤ、グローバルポジショニングシステム(GPS)レシーバ、ビデオゲームコンソール、及び/又はテレビジョンセットトップボックスなどの別のデバイスに組み込むことができるが、これらに限定されない。
本明細書で使用される用語「機械可読記憶媒体」又は「コンピュータ可読媒体」は、実行のためにプロセッサ1502に命令を提供することに参加する任意の媒体を指す。このような媒体は、限定されるものではないが、不揮発性媒体、揮発性媒体、及び伝送媒体を含む多くの形態をとり得る。不揮発性媒体は、例えば、データ記憶デバイス1506のような光ディスク又は磁気ディスクを含む。揮発性媒体は、メモリ1504のようなダイナミックメモリを含む。伝送媒体は、バス1508を構成するワイヤを含む、同軸ケーブル、銅線、及び光ファイバを含む。機械可読媒体の一般的な形態は、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVD、他の任意の光学媒体、パンチカード、紙テープ、穴のパターンを有する任意の他の物理媒体、RAM、PROM、EPROM、FLASH(登録商標) EPROM、他の任意のメモリチップもしくはカートリッジ、又はコンピュータが読み出すことができる任意の他の媒体を含む。機械可読記憶媒体は、機械可読記憶デバイス、機械可読記憶基板、メモリデバイス、機械可読伝搬信号に影響を与える物質の組成、又はそれらの1つ以上の組み合わせとすることができる。
本明細書中で使用される場合、項目のうちの任意のものを分離する用語「及び」又は「又は」と共に、一連の項目に先行する語句「少なくとも1つ」は、リストの各メンバー(すなわち、各項目)ではなく、リスト全体を修正する。語句「少なくとも1つ」は、少なくとも1つの項目の選択を必要とせず、むしろ、その語句は、項目のうちの任意の1つの少なくとも1つ、及び/又は項目の任意の組み合わせの少なくとも1つ、及び/又は項目の各々の少なくとも1つを含む意味を可能にする。一例として、語句「A、B、及びCの少なくとも1つ」又は「A、B、又はCの少なくとも1つ」は、各々、Aのみ、Bのみ、又はCのみ、A、B、及びCの任意の組み合わせ、及び/又はA、B、及びCの各々の少なくとも1つを指す。
「含む」、「有する」などの用語が明細書又は特許請求の範囲において使用される限りにおいて、このような用語は、「含む」が請求項における移行句として用いられるときに解釈されるように、用語「含む」と同様に包括的であると意図されている。本明細書において、文言「例示的」は、「例、インスタンス、又は例示としての役割を果たす」ことを意味するために使用される。本明細書において、「例示的」として記載の任意の実施形態は、必ずしも他の実施形態よりも好ましいか、又は有利であると解釈される必要はない。
単数形の要素への言及は、具体的に述べられていない限り、「1つ及びただ1つ」を意味することを意図するものではなく、むしろ「1つ以上」を意味することを意図している。当業者に公知であるか、又は後に当業者に知られるようになる本開示全体を通して記載の様々な構成の要素に対するすべての構造的及び機能的等価物は、参照により本明細書に組み込まれ、主題の技術に包含されると意図されている。さらに、本明細書に開示されているものは、そのような開示が上記の説明に明示的に規定されているかどうかにかかわらず、公衆専用であると意図されていない。
本明細書は多くの具体物を含んでいるが、これらは、特許請求の範囲に記載されたものの範囲を限定するものではなく、むしろ主題の特定の実装形態の説明として解釈されるべきである。別々の実施形態の文脈において本明細書に記載される所定の特徴は、単一の実施形態において組み合わせて実装することができる。逆に、単一の実施形態の文脈において記載の様々な特徴は、複数の実施形態において別々に、又は任意の好適なサブコンビネーションで実装することができる。さらに、特徴は、所定の組み合わせにおいて作用するものとして上述され、最初にそのようなものとして請求項に記載されることさえあるが、請求項に記載された組み合わせからの1つ以上の特徴は、場合によっては、組み合わせから切り出され得、請求項に記載された組み合わせは、サブコンビネーション又はサブコンビネーションの変形例に向けられ得る。
本明細書の主題は、特定の態様の観点から記載されてきたが、他の態様を実装することができ、以下の特許請求の範囲の範囲内にある。例えば、動作が図面に特定の順序で示されているが、これは、所望の結果を達成するために、このような動作が、示された特定の順序で、又は逐次的順序で、実行されること、又は、例示されたすべての動作が実行されることを必要とするものとして理解されるべきではない。請求項に規定された行動は、異なる順序で実行することができ、なお所望の結果を達成することができる。一例として、添付の図面に示されたプロセスは、所望の結果を達成するために、示された特定の順序、又は逐次的順序を必ずしも必要としない。所定の状況下では、マルチタスク及び並列処理が有利であり得る。さらに、上述の態様における様々なシステム構成要素の分離は、すべての態様においてそのような分離を必要とするものとして理解されるべきではなく、記載のプログラム構成要素及びシステムは、一般的に、単一のソフトウェア製品内に一体化されるか、又は複数のソフトウェア製品内にパッケージ化され得ると理解されたい。他の変形例は、以下の特許請求の範囲の範囲内である。
実施形態の規定
(実施形態1)少なくとも1つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法であって、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未測定特徴に第1の値を補定することと、インスタンスにおける第1の値を使用するモデルを用いて第1の転帰を評価することと、他の残りの未測定特徴を一定に保持しながら、インスタンスおける未測定特徴に第2の値を補定することと、インスタンスにおける第2の値を使用するモデルを用いて第2の転帰を評価することと、第1の転帰と第2の転帰を用いて統計パラメータを判定することと、未測定特徴を、統計パラメータに対応するランキングに割り当てることと、を含む、方法が提供される。
(実施形態1)少なくとも1つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法であって、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未測定特徴に第1の値を補定することと、インスタンスにおける第1の値を使用するモデルを用いて第1の転帰を評価することと、他の残りの未測定特徴を一定に保持しながら、インスタンスおける未測定特徴に第2の値を補定することと、インスタンスにおける第2の値を使用するモデルを用いて第2の転帰を評価することと、第1の転帰と第2の転帰を用いて統計パラメータを判定することと、未測定特徴を、統計パラメータに対応するランキングに割り当てることと、を含む、方法が提供される。
(実施形態2)インスタンスからの少なくとも1つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することをさらに含み、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、実施形態1に記載の方法。
(実施形態3)未測定特徴を、統計パラメータに対応するランキングに割り当てることは、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、1つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することを含む、実施形態1又は2に記載の方法。
(実施形態4)第1の転帰と第2の転帰を用いて統計パラメータを判定することは、既知の転帰と関連する複数のデータセットを含むマスターデータセットにアクセスすることを含む、実施形態1~3のいずれか1つに記載の方法。
(実施形態5)第1の転帰と第2の転帰を用いて統計パラメータを判定することは、転帰についてのモデルに関連する分散値を判定することであって、モデルは、未測定特徴及びデータセットにおける少なくとも1つの他の別個の特徴に基づく、判定することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することと、を含む、実施形態1~4のいずれか1つに記載の方法。
(実施形態6)第1の転帰と第2の転帰を用いて統計パラメータを判定することは、データセットに基づいて決定値を査定するためのルールを判定することを含み、データセットは、インスタンスにおける複数の測定済特徴及びインスタンスにおける未測定特徴について収集された値を含み、ルールは、(1)複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び(2)1つ以上の測定済特徴と一致する、実施形態1~5のいずれか1つに記載の方法。
(実施形態7)第1の転帰と第2の転帰を用いて統計パラメータを判定することは、複数の転帰値及び複数のデータセットの各々についての既知の転帰に基づいて、第1の値を未測定特徴に補定するためのルールの正解率を判定することを含む、実施形態1~6のいずれか1つに記載の方法。
(実施形態8)統計パラメータを判定することは、第1の転帰及び第2の転帰の時間依存分散を判定することを含む、実施形態1~7のいずれか1つに記載の方法。
(実施形態9)統計パラメータに対応するランキングに基づいて、未測定特徴のサンプリング頻度を選択することをさらに含む、実施形態1~8のいずれか1つに記載の方法。
(実施形態10)センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することをさらに含む、実施形態1~9のいずれか1つに記載の方法。
(実施形態11)少なくとも1つの特徴が測定されているインスタンスについて未測定特徴をランク付けするためのシステムであって、命令を記憶するメモリと、メモリと通信可能に結合された1つ以上のプロセッサであって、1つ以上のプロセッサは命令を実行して、システムに、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未測定特徴に第1の値を補定することと、インスタンスにおける第1の値を使用するモデルを用いて第1の転帰を評価することと、他の残りの未測定特徴を一定に保持しながら、インスタンスおける未測定特徴に第2の値を補定することと、インスタンスにおける第2の値を使用するモデルを用いて第2の転帰を評価することと、第1の転帰と第2の転帰を用いて統計パラメータを判定することと、未測定特徴を、統計パラメータに対応するランキングに割り当てることと、インスタンスからの少なくとも1つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することであって、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、選択することと、を行わせるように構成されている、システムが提供される。
(実施形態12)未測定特徴を、統計パラメータに対応するランキングに割り当てるために、1つ以上のプロセッサは命令を実行して、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、1つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することを行う、実施形態11に記載のシステム。
(実施形態13)第1の転帰と第2の転帰を用いて統計パラメータを判定するために、1つ以上のプロセッサは命令を実行して、既知の転帰と関連する複数のデータセットを含むマスターデータセットにアクセスすることを行う、実施形態11又は12に記載のシステム。
(実施形態14)第1の転帰と第2の転帰を用いて統計パラメータを判定するために、1つ以上のプロセッサは命令を実行して、転帰についてのモデルに関連する分散値を判定することであって、モデルは、未測定特徴及びデータセットにおける少なくとも1つの他の別個の特徴に基づく、判定することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することとを行う、実施形態11~13のいずれか1つに記載のシステム。
(実施形態15)第1の転帰と第2の転帰を用いて統計パラメータを判定するために、1つ以上のプロセッサは命令を実行して、データセットに基づいて決定値を査定するためのルールを判定することを含み、データセットは、インスタンスにおける複数の測定済特徴及びインスタンスにおける未測定特徴について収集された値を含み、ルールは、(1)複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び(2)1つ以上の測定済特徴と合致する、実施形態11~14のいずれか1つに記載のシステム。
(実施形態16)命令を記憶する非一時的なコンピュータ可読媒体であって、命令は、コンピュータによって実行されるときに、コンピュータに、少なくとも1つの特徴が測定されているインスタンスに対して未測定特徴をランク付けするための方法を実行させ、方法は、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未測定特徴に第1の値を補定することと、インスタンスにおける第1の値を使用するモデルを用いて第1の転帰を評価することと、他の残りの未測定特徴を一定に保持しながら、インスタンスおける未測定特徴に第2の値を補定することと、インスタンスにおける第2の値を使用するモデルを用いて第2の転帰を評価することと、第1の転帰と第2の転帰を用いて統計パラメータを判定することと、未測定特徴を、統計パラメータに対応するランキングに割り当てることと、インスタンスからの少なくとも1つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することであって、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、選択することと、を含み、未測定特徴を、統計パラメータに対応するランキングに割り当てることは、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、1つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することを含む、非一時的なコンピュータ可読媒体が提供される。
(実施形態17)方法において第1の転帰と第2の転帰を用いて統計パラメータを判定することは、既知の転帰と関連する複数のデータセットを含むマスターデータセットにアクセスすることを含む、実施形態16に記載の非一時的なコンピュータ可読媒体。
(実施形態18)方法において第1の転帰と第2の転帰を用いて統計パラメータを判定することは、転帰についてのモデルに関連する分散値を判定することであって、モデルは、未測定特徴及びデータセットにおける少なくとも1つの他の別個の特徴に基づく、判定することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することと、を含む、実施形態16又は17に記載の非一時的なコンピュータ可読媒体。
(実施形態19)方法において第1の転帰と第2の転帰を用いて統計パラメータを判定することは、データセットに基づいて決定値を査定するためのルールを判定することを含み、データセットは、インスタンスにおける複数の測定済特徴及びインスタンスにおける未測定特徴について収集された値を含み、ルールは、(1)複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び(2)1つ以上の測定済特徴と合致する、実施形態16~18のいずれか1つに記載の非一時的なコンピュータ可読媒体。
(実施形態20)方法において第1の転帰と第2の転帰を用いて統計パラメータを判定することは、複数の転帰値及び複数のデータセットの各々についての既知の転帰に基づいて、第1の値を未測定特徴に補定するためのルールの正解率を判定することを含む、実施形態16~19のいずれか1つに記載の非一時的なコンピュータ可読媒体。
(実施形態21)少なくとも1つの特徴が測定されているインスタンスに対して未測定特徴をランク付けするため方法であって、インスタンスからの少なくとも1つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することであって、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、選択することと、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、1つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することと、未測定特徴を、モデルベースの特徴重要度からの出力に対応するランキングに割り当てることと、を含む、方法が提供される。
(実施形態22)マスターデータセットからフィルタリングされたデータセットを選択することは、履歴データセットの少なくとも一部分を選択することを含む、実施形態21に記載の方法。
(実施形態23)フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、1つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することは、新しい特徴を用いてモデルを構築又は更新することを含む、実施形態21又は22に記載の方法。
(実施形態24)フィルタリングされたデータセットを選択することは、既知の転帰を用いて統計パラメータを判定することをさらに含む、実施形態21~23のいずれか1つに記載の方法。
(実施形態25)フィルタリングされたデータセットを選択することは、第1の転帰と第2の転帰を用いて統計パラメータを判定することであって、転帰についてのモデルに関連する分散値を判定することであって、モデルは、未測定特徴及びデータセットにおける少なくとも1つの他の別個の特徴に基づく、判定することを含む、判定することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することと、を含む、実施形態1~24のいずれか1つに記載の方法。
(実施形態26)フィルタリングされたデータセットに基づいて、決定値を査定するためのルールを判定することをさらに含む、実施形態21~25のいずれか1つに記載の方法。
(実施形態27)複数の転帰を用いて統計パラメータを判定することと、複数の結果に基づいて、未測定特徴に第1の値を補定するためのルールの正解率を判定することと、をさらに含む、実施形態21~26のいずれか1つに記載の方法。
(実施形態28)第1の転帰及び第2の転帰の時間依存分散を判定することをさらに含む、実施形態21~27のいずれか1つに記載の方法。
(実施形態29)統計パラメータに対応するランキングに基づいて、未測定特徴のサンプリング頻度を選択することをさらに含む、実施形態21~28のいずれか1つに記載の方法。
(実施形態30)センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することをさらに含む、実施形態21~29のいずれか1つに記載の方法。
(実施形態31)少なくとも1つの特徴が測定されているインスタンスに対して未測定特徴をランク付けするためシステムであって、命令を記憶するメモリと、メモリに通信可能に結合された1つ以上のプロセッサと、を含み、1つ以上のプロセッサは命令を実行してシステムに、インスタンスからの少なくとも1つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することであって、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、選択することと、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、1つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することと、未測定特徴を、モデルベースの特徴重要度からの出力に対応するランキングに割り当てることと、を行わせるように構成されている、システム。
(実施形態32)マスターデータセットからフィルタリングされたデータセットを選択するために、1つ以上のプロセッサは命令をさらに実行して、履歴データセットの少なくとも一部分を選択することを行う、実施形態31に記載のシステム。
(実施形態33)フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、1つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別するために、1つ以上のプロセッサは命令をさらに実行して、新しい特徴を用いてモデルを構築又は更新することを行う、実施形態31又は32に記載のシステム。
(実施形態34)フィルタリングされたデータセットを選択するために、1つ以上のプロセッサは命令をさらに実行して、既知の転帰を用いて統計パラメータを判定することを行う、実施形態31~33のいずれか1つに記載のシステム。
(実施形態35)フィルタリングされたデータセットを選択するために、1つ以上のプロセッサは命令を実行して、第1の転帰と第2の転帰を用いて統計パラメータを判定することと、転帰についてのモデルに関連する分散値を判定することであって、モデルは、未測定特徴及びデータセットにおける少なくとも1つの他の別個の特徴に基づく、判定することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することと、を行う、実施形態31~34のいずれか1つに記載のシステム。
(実施形態36)1つ以上のプロセッサは命令をさらに実行して、フィルタリングされたデータセットに基づいて、決定値を査定するためのルールを判定することを行う、実施形態31~35のいずれか1つに記載のシステム。
(実施形態37)1つ以上のプロセッサは命令をさらに実行して、複数の転帰を用いて統計パラメータを判定し、複数の転帰に基づいて未測定特徴に第1の値を補定するためのルールの正解率を判定することを行う、実施形態31~36のうちのいずれか1つのシステム。
(実施形態38)1つ以上のプロセッサは命令をさらに実行して、第1の転帰及び第2の転帰の時間依存分散を判定することを行う、実施形態31~37のいずれか1つに記載のシステム。
(実施形態39)1つ以上のプロセッサは命令をさらに実行して、未測定特徴のランクに基づいて、未測定特徴のサンプリング頻度を低減することを行う、実施形態31~38のいずれか1つに記載のシステム。
(実施形態40)1つ以上のプロセッサは命令をさらに実行して、センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することを行う、実施形態31~39のいずれか1つに記載のシステム。
(実施形態41)少なくとも1つの特徴が測定されているインスタンスに対して未測定特徴をランク付けするための方法であって、マスターデータセットにアクセスすることであって、マスターデータセットは、既知の転帰に関連する複数のデータセットを含む、アクセスすることと、転帰についてのモデルに関連する分散値を判定することであって、そのモデルは、未測定特徴、及びデータセットにおける少なくとも1つの他の別個の特徴に基づく、判定することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することと、未測定特徴を、分散値に対する予測の分散の値に従ってランキングに割り当てることと、を含む、方法が提供される。
(実施形態42)マスターデータセットにアクセスすることは、履歴データセットの少なくとも一部分を選択することを含む、実施形態41に記載の方法。
(実施形態43)予測の分散を評価することは、新しい特徴を用いてモデルを構築又は更新することを含む、実施形態41及び42の方法。
(実施形態44)転帰についてのモデルに関連する分散値を判定することは、マスターデータセットからフィルタリングされたデータセットを選択することを含む、実施形態41~43のいずれか1つに記載の方法。
(実施形態45)転帰についてのモデルに関連する分散値を判定することは、未測定特徴とデータセットにおける少なくとも1つの他の別個の特徴に基づいてモデルを選択することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することとを含む、実施形態41~44のいずれか1つに記載の方法。
(実施形態46)マスターデータセットに基づいて、決定値を査定するためのルールを判定することをさらに含む、実施形態41~45のいずれか1つに記載の方法。
(実施形態47)既知の転帰に基づいて、未測定特徴に第1の値を補定するためのルールの正解率を判定することをさらに含む、実施形態41~46のいずれか一項に記載の方法。
(実施形態48)第1の転帰及び第2の転帰の時間依存分散を判定することをさらに含む、実施形態41~47のいずれか1つに記載の方法。
(実施形態49)統計パラメータに対応するランキングに基づいて、未測定特徴のサンプリング頻度を選択することをさらに含む、実施形態41~48のいずれか1つに記載の方法。
(実施形態50)センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することをさらに含む、実施形態41~49のいずれか1つに記載の方法。
(実施形態51)少なくとも1つの特徴が測定されているインスタンスに対して未測定特徴をランク付けするための方法であって、命令を記憶するメモリと、メモリと通信可能に結合された1つ以上のプロセッサであって、1つ以上のプロセッサは命令を実行して、システムに、マスターデータセットにアクセスすることであって、マスターデータセットは、既知の転帰に関連する複数のデータセットを含む、アクセスすることと、転帰についてのモデルに関連する分散値を判定することであって、そのモデルは、未測定特徴、及びデータセットにおける少なくとも1つの他の別個の特徴に基づく、判定することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することと、未測定特徴を、分散値に対する予測の分散の値に従ってランキングに割り当てることと、を行わせるように構成されている、システム。
(実施形態52)マスターデータセットにアクセスするために、1つ以上のプロセッサは命令を実行して、履歴データセットの少なくとも一部分を選択することを行う、実施形態51に記載のシステム。
(実施形態53)予測の分散を評価するために、1つ以上のプロセッサは命令を実行して、新しい特徴を用いてモデルを構築又は更新することを行う、実施形態51及び52に記載のシステム。
(実施形態54)転帰についてのモデルに関連する分散値を判定するために、1つ以上のプロセッサは命令を実行して、マスターデータセットからフィルタリングされたデータセットを選択することを行う、実施形態51~53のいずれか1つに記載のシステム。
(実施形態55)転帰についてのモデルに関連する分散値を判定するために、1つ以上のプロセッサは命令を実行して、未測定特徴とデータセットにおける少なくとも1つの他の別個の特徴に基づいてモデルを選択することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することとを行う、実施形態51~54のいずれか1つに記載のシステム。
(実施形態56)1つ以上のプロセッサは命令をさらに実行して、マスターデータセットに基づいて、決定値を査定するためのルールを判定することを行う、実施形態51~55のいずれか1つに記載のシステム。
(実施形態57)1つ以上のプロセッサは命令をさらに実行して、既知の転帰に基づいて、未測定特徴に第1の値を補定するためのルールの正解率を判定することを行う、実施形態51~56のいずれか1つに記載のシステム。
(実施形態58)1つ以上のプロセッサは命令をさらに実行して、第1の転帰及び第2の転帰の時間依存分散を判定することを行う、実施形態51~57のいずれか1つに記載のシステム。
(実施形態59)1つ以上のプロセッサは命令をさらに実行して、未測定特徴のランクに基づいて、未測定特徴のサンプリング頻度を低減することを行う、実施形態51~58のいずれか1つに記載のシステム。
(実施形態60)1つ以上のプロセッサは命令をさらに実行して、センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することを行う、実施形態51~59のいずれか1つに記載のシステム。
(実施形態61)少なくとも1つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法であって、データセットに基づいて決定値を査定するためのルールを判定することであって、データセットは、インスタンスにおける複数の測定済特徴及びインスタンスにおける未測定特徴について収集された値を含み、ルールは、(1)複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び(2)1つ以上の測定済特徴と合致する、判定することと、複数の転帰値とデータベースの各々についての既知の転帰に基づいて、ルールの正解率を判定することと、未測定特徴を、ルールの正解率に対応するランキングを割り当てることとと、を含む、方法が提供される。
(実施形態62)データセットに基づいて決定値を査定することは、マスターデータセットにアクセスすることを含む、実施形態61に記載の方法。
(実施形態63)複数の転帰値に基づいてルールの正解率を判定することは、新しい特徴を用いてモデルを構築又は更新することを含む、実施形態61又は62に記載の方法。
(実施形態64)データセットに基づいて決定値を査定するためのルールの正解率を判定することは、転帰についてのモデルに関連する分散値を判定することをさらに含む、実施形態61~63のうちのいずれか1つの方法。
(実施形態65)データセットに基づいて決定値を査定するためのルールを判定することは、未測定特徴とデータセットにおける少なくとも1つの他の別個の特徴に基づいてモデルを選択することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することとを行う、実施形態61~64のいずれか1つに記載の方法。
(実施形態66)履歴データセットから選択されたマスターデータに基づいて決定値を評価するためのルールを判定することをさらに含む、実施形態61~65のいずれか1つに記載の方法。
(実施形態67)ルールの正解率を判定することは、未測定特徴を用いてルールについてのモデルを更新することを行う、実施形態61~66のいずれか1つに記載の方法。
(実施形態68)第1の転帰及び第2の転帰の時間依存分散を判定することをさらに含む、実施形態61~67のいずれか1つに記載の方法。
(実施形態69)統計パラメータに対応するランキングに基づいて、未測定特徴のサンプリング頻度を選択することをさらに含む、実施形態61~68のいずれか1つに記載の方法。
(実施形態70)センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することをさらに含む、実施形態61~69のいずれか1つに記載の方法。
(実施形態71)少なくとも1つの特徴が測定されているインスタンスについて未測定特徴をランク付けするためのシステムであって命令を記憶するメモリと、メモリと通信可能に結合された1つ以上のプロセッサであって、1つ以上のプロセッサは命令を実行して、システムに、、データセットに基づいて決定値を査定するためのルールを判定することであって、データセットは、インスタンスにおける複数の測定済特徴及びインスタンスにおける未測定特徴について収集された値を含み、ルールは、(1)複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び(2)1つ以上の測定済特徴と合致する、判定することと、複数の転帰値とデータベースの各々についての既知の転帰に基づいて、ルールの正解率を判定することと、未測定特徴を、ルールの正解率に対応するランキングを割り当てることとと、を行わせるように構成されている、システム。
(実施形態72)データセットに基づいて決定値を査定するために、1つ以上のプロセッサは命令を実行して、マスターデータセットにアクセスすることを行う、実施形態71に記載の方法。
(実施形態73)複数の転帰値に基づいてルールの正解率を判定するために、1つ以上のプロセッサは命令を実行して、新しい特徴を用いてモデルを構築又は更新する、実施形態71又は72のシステム。
(実施形態74)データセットに基づいて決定値を査定するためのルールの正解率を判定するために、1つ以上のプロセッサは命令をさらに実行して、転帰についてのモデルに関連する分散値を判定することを行う、実施形態71~73のうちのいずれか1つのシステム。
(実施形態75)データセットに基づいて決定値をアクセスするためのルールを判定するために、1つ以上のプロセッサは命令を実行して、未測定特徴とデータセットにおける少なくとも1つの他の別個の特徴に基づいてモデルを選択することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することとを行う、実施形態71~74のいずれか1つに記載のシステム。
(実施形態76)1つ以上のプロセッサは命令をさらに実行して、履歴データセットから選択されたマスターデータセットに基づいて、決定値を評価するためのルールを判定することを行う、実施形態71~75のうちのいずれか1つのシステム。
(実施形態77)ルールの正解率を判定するために、1つ以上のプロセッサは命令を実行して、未測定特徴を用いてルールについてのモデルを更新することを行う、実施形態71~76のいずれか1つに記載のシステム。
(実施形態78)1つ以上のプロセッサは命令をさらに実行して、第1の転帰及び第2の転帰の時間依存分散を判定することを行う、実施形態71~77のいずれか1つに記載のシステム。
(実施形態79)1つ以上のプロセッサは命令をさらに実行して、未測定特徴のランクに基づいて、未測定特徴のサンプリング頻度を低減することを行う、実施形態71~78のいずれか1つに記載のシステム。
(実施形態80)1つ以上のプロセッサは命令をさらに実行して、センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することを行う、実施形態71~79のいずれか1つに記載のシステム。
(実施形態81)特徴の予測可能性に基づいて選択された特徴についてのサンプリング頻度を判定する方法であって、観察された特徴のセットと欠落特徴のセットを識別することと、履歴データセットから選択された特徴行列を使用して、選択された特徴サンプリング頻度を予測するモデルを構築することと、モデルを使用して、サンプリング頻度についての予測を生成することと、複数の時間予測から選択された特徴の分散を判定することと、分散に基づいて他の特徴に対して選択された特徴をランク付けすることと、特徴のランクが予め判定された上位パーセンタイルにあるときに選択された特徴のサンプリング頻度を増加させることと、を含む、方法が提供される。
(実施形態82)観察された特徴を含む履歴データセットにアクセスすることをさらに含む、実施形態81に記載の方法。
(実施形態83)サンプリング頻度を予測するモデルを構築することは、予測の分散を評価することを含む、実施形態81又は82に記載のシステム。
(実施形態84)選択された特徴の分散を判定することは、マスターデータセットからフィルタリングされたデータセットを選択することを含む、実施形態81~83のいずれか1つに記載の方法。
(実施形態85)選択された値の分散を判定することは、観察された特徴とデータセットにおける少なくとも1つの他の別個の特徴に基づいてモデルを選択することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することとを含む、実施形態81~84のいずれか1つに記載の方法。
(実施形態86)サンプリング頻度に基づいて、決定値を評価するためのルールを判定することをさらに含む、実施形態81~85のいずれか1つに記載の方法。
(実施形態87)モデルに基づいて、欠落特徴に第1の値を補定するためのルールの正解率を判定することをさらに含む、実施形態81~86のいずれか一項に記載の方法。
(実施形態88)第1の転帰及び第2の転帰の時間依存分散を判定することをさらに含む、実施形態81~87のいずれか1つに記載の方法。
(実施形態89)未測定特徴のランクに基づいて、未測定特徴のサンプリング頻度を低減することをさらに含む、実施形態81~88のいずれか1つに記載の方法。
(実施形態90)センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することをさらに含む、実施形態81~89のいずれか1つに記載の方法。
(実施形態91)特徴の予測可能性に基づいて選択された特徴についてのサンプリング頻度を判定するシステムであって、命令を記憶するメモリと、メモリに通信可能に結合された1つ以上のプロセッサと、を含み、1つ以上のプロセッサは命令を実行してシステムに、記憶命令、及びメモリと通信するように結合された1つ以上のプロセッサを含み、命令を実行して、観察された特徴のセットと欠落特徴のセットを識別することと、履歴データセットから選択された特徴行列を使用して、選択された特徴サンプリング頻度を予測するモデルを構築することと、モデルを使用して、サンプリング頻度についての予測を生成することと、複数の時間予測から選択された特徴の分散を判定することと、分散に基づいて他の特徴に対して選択された特徴をランク付けすることと、特徴のランクが予め判定された上位パーセンタイルにあるときに選択された特徴のサンプリング頻度を増加させることと、を行わせるように構成されている、システム。
(実施形態92)1つ以上のプロセッサは命令をさらに実行して、観察された特徴を含む履歴データセットにアクセスすることを行う、実施形態91に記載のシステム。
(実施形態93)サンプリング頻度を予測するモデルを構築するために、1つ以上のプロセッサは命令をさらに実行して、予測の分散を評価することを行う、実施形態91又は92に記載のシステム。
(実施形態94)選択された特徴の分散を判定するために、1つ以上のプロセッサは、マスターデータセットからフィルタリングされたデータセットを選択することを行う、実施形態91~93のいずれか1つに記載のシステム。
(実施形態95)選択された値の分散を判定するために、1つ以上のプロセッサは命令を実行して、観察された特徴とデータセットにおける少なくとも1つの他の別個の特徴に基づいてモデルを選択することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することとを行う、実施形態91~94のいずれか1つに記載のシステム。
(実施形態96)1つ以上のプロセッサは命令をさらに実行して、サンプリング頻度に基づいて、決定値を評価するためのルールを判定することを行う、実施形態91~95のいずれか1つに記載のシステム。
(実施形態97)1つ以上のプロセッサは命令をさらに実行して、モデルに基づいて、欠落特徴に第1の値を補定するためのルールの正解率を判定することを行う、実施形態91~96のいずれか1つに記載のシステム。
(実施形態98)1つ以上のプロセッサは命令をさらに実行して、第1の転帰及び第2の転帰の時間依存分散を判定することを行う、実施形態91~97のいずれか1つに記載のシステム。
(実施形態99)1つ以上のプロセッサは命令をさらに実行して、未測定特徴のランクに基づいて、未測定特徴のサンプリング頻度を低減することを行う、実施形態91~98のいずれか1つに記載のシステム。
(実施形態100)1つ以上のプロセッサは命令をさらに実行して、センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することを行う、実施形態91~99のいずれか1つに記載のシステム。
(実施形態101)他の第1の残りの未測定特徴は、他の第2の残りの未測定特徴と同じである、実施形態1~10のいずれか1つに記載の方法。
(実施形態102)他の第1の残りの未測定特徴は、他の第2の残りの未測定特徴と同じである、実施形態11~15のいずれか1つに記載のシステム。
(実施形態103)他の第1の残りの未測定特徴は、他の第2の残りの未測定特徴と同じである、実施形態16~20のいずれか1つに記載の非一時的なコンピュータ可読媒体。
Claims (23)
- 少なくとも1つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法であって、
他の第1の残りの未測定特徴を一定に保持しながら、前記インスタンスにおける前記未測定特徴に第1の値を補定することと、
前記インスタンスにおける前記第1の値を使用するモデルを用いて第1の転帰を評価することと、
他の第2の残りの未測定特徴を一定に保持しながら、前記インスタンスおける前記未測定特徴に第2の値を補定することと、
前記インスタンスにおける前記第2の値を使用する前記モデルを用いて第2の転帰を評価することと、
前記第1の転帰と前記第2の転帰を用いて統計パラメータを判定することと、
前記未測定特徴を、前記統計パラメータに対応するランキングに割り当てることと、を含む、方法。 - 前記インスタンスからの少なくとも1つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することをさらに含み、前記マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、請求項1に記載の方法。
- 前記未測定特徴を、前記統計パラメータに対応するランキングに割り当てることは、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、1つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することを含む、請求項1に記載の方法。
- 前記第1の転帰と前記第2の転帰を用いて統計パラメータを判定することは、既知の転帰と関連する複数のデータセットを含むマスターデータセットにアクセスすることを含む、請求項1に記載の方法。
- 前記第1の転帰と前記第2の転帰を用いて統計パラメータを判定することは、転帰についてのモデルに関連する分散値を判定することであって、前記モデルは、前記未測定特徴及びデータセットにおける少なくとも1つの他の別個の特徴に基づく、判定することと、前記データセットにおける前記未測定特徴についての複数の補定値を使用する前記モデルを用いて転帰についての予測の分散を評価することと、を含む、請求項1に記載の方法。
- 前記第1の転帰と前記第2の転帰を用いて統計パラメータを判定することは、
データセットに基づいて決定値を評価するためのルールを判定することを含み、前記データセットは、前記インスタンスにおける複数の測定済特徴及び前記インスタンスにおける未測定特徴について収集された値を含み、前記ルールは、(1)複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び(2)1つ以上の測定済特徴と合致する、請求項1に記載の方法。 - 前記第1の転帰と前記第2の転帰を用いて統計パラメータを判定することは、複数の転帰値及び複数のデータセットの各々についての既知の転帰に基づいて、前記第1の値を前記未測定特徴に補定するためのルールの正解率を判定することを含む、請求項1に記載の方法。
- 統計パラメータを判定することは、前記第1の転帰及び前記第2の転帰の時間依存分散を判定することを含む、請求項1に記載の方法。
- 前記統計パラメータに対応する前記ランキングに基づいて、前記未測定特徴のサンプリング頻度を選択することをさらに含む、請求項1に記載の方法。
- センサデバイスの正解率及び適合率、並びに前記未測定特徴の前記ランキングに基づいて、前記未測定特徴から測定値を収集する前記センサデバイスを選択することをさらに含む、請求項1に記載の方法。
- 少なくとも1つの特徴が測定されているインスタンスについて未測定特徴をランク付けするためのシステムであって、
命令を記憶するメモリと、
メモリと通信可能に結合された1つ以上のプロセッサであって、前記1つ以上のプロセッサは、前記命令を実行して、前記システムに
他の第1の残りの未測定特徴を一定に保持しながら、前記インスタンスにおける前記未測定特徴に第1の値を補定することと、
前記インスタンスにおける前記第1の値を使用するモデルを用いて第1の転帰を評価することと、
他の第2の残りの未測定特徴を一定に保持しながら、前記インスタンスおける前記未測定特徴に第2の値を補定することと、
前記インスタンスにおける前記第2の値を使用する前記モデルを用いて第2の転帰を評価することと、
前記第1の転帰と前記第2の転帰を用いて統計パラメータを判定することと、
前記未測定特徴を、前記統計パラメータに対応するランキングに割り当てることと、
前記インスタンスからの少なくとも1つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することであって、前記マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、選択することと、を行わせるように構成されている、システム。 - 前記未測定特徴を、前記統計パラメータに対応するランキングに割り当てるために、前記1つ以上のプロセッサは命令を実行して、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、1つ以上の既知の転帰を用いて前記未測定特徴の相対的重要度を識別することを行う、請求項11に記載のシステム。
- 前記第1の転帰と前記第2の転帰を用いて統計パラメータを判定するために、前記1つ以上のプロセッサは命令を実行して、既知の転帰と関連する複数のデータセットを含むマスターデータセットにアクセスすることを行う、請求項11に記載のシステム。
- 前記第1の転帰と前記第2の転帰を用いて統計パラメータを判定するために、前記1つ以上のプロセッサは命令を実行して、転帰についてのモデルに関連する分散値を判定することであって、前記モデルは、前記未測定特徴及びデータセットにおける少なくとも1つの他の別個の特徴に基づく、判定することと、前記データセットにおける前記未測定特徴についての複数の補定値を使用する前記モデルを用いて転帰についての予測の分散を評価することとを行う、請求項11に記載のシステム。
- 前記第1の転帰と前記第2の転帰を用いて統計パラメータを判定するために、前記1つ以上のプロセッサは命令を実行して、データセットに基づいて決定値を評価するためのルールを判定することを含み、前記データセットは、前記インスタンスにおける複数の測定済特徴及び前記インスタンスにおける前記未測定特徴について収集された値を含み、前記ルールは、(1)複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び(2)1つ以上の測定済特徴と合致する、請求項11に記載のシステム。
- 命令を記憶する非一時的なコンピュータ可読媒体であって、前記命令は、コンピュータによって実行されるときに、前記コンピュータに、少なくとも1つの特徴が測定されているインスタンスに対して未測定特徴をランク付けするための方法を実行させ、前記方法は、
他の第1の残りの未測定特徴を一定に保持しながら、前記インスタンスにおける前記未測定特徴に第1の値を補定することと、
前記インスタンスにおける前記第1の値を使用するモデルを用いて第1の転帰を評価することと、
他の第2の残りの未測定特徴を一定に保持しながら、前記インスタンスおける前記未測定特徴に第2の値を補定することと、
前記インスタンスにおける前記第2の値を使用する前記モデルを用いて第2の転帰を評価することと、
前記第1の転帰と前記第2の転帰を用いて統計パラメータを判定することと、
前記未測定特徴を、前記統計パラメータに対応するランキングに割り当てることと、
前記インスタンスからの少なくとも1つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することであって、前記マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、選択することと、を含み、前記未測定特徴を、前記統計パラメータに対応するランキングに割り当てることは、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、1つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することを含む、非一時的なコンピュータ可読媒体。 - 前記方法において前記第1の転帰と前記第2の転帰を用いて統計パラメータを判定することは、既知の転帰と関連する複数のデータセットを含むマスターデータセットにアクセスすることを含む、請求項16に記載の非一時的なコンピュータ可読媒体。
- 前記方法において前記第1の転帰と前記第2の転帰を用いて統計パラメータを判定することは、転帰についてのモデルに関連する分散値を判定することであって、前記モデルは、前記未測定特徴及びデータセットにおける少なくとも1つの他の別個の特徴に基づく、判定することと、前記データセットにおける前記未測定特徴についての複数の補定値を使用する前記モデルを用いて転帰についての予測の分散を評価することと、を含む、請求項16に記載の非一時的なコンピュータ可読媒体。
- 前記方法において前記第1の転帰と前記第2の転帰を用いて統計パラメータを判定することは、データセットに基づいて決定値を評価するためのルールを判定することを含み、前記データセットは、前記インスタンスにおける複数の測定済特徴及び前記インスタンスにおける前記未測定特徴について収集された値を含み、前記ルールは、(1)複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び(2)1つ以上の測定済特徴と合致する、請求項16に記載の非一時的なコンピュータ可読媒体。
- 前記方法において前記第1の転帰と前記第2の転帰を用いて統計パラメータを判定することは、複数の転帰値及び複数のデータセットの各々についての既知の転帰に基づいて、前記第1の値を前記未測定特徴に補定するためのルールの正解率を判定することを含む、請求項16に記載の非一時的なコンピュータ可読媒体。
- 前記他の第1の残りの未測定特徴は、前記他の第2の残りの未測定特徴と同じである、請求項1に記載の方法。
- 前記他の第1の残りの未測定特徴は、前記他の第2の残りの未測定特徴と同じである、請求項11に記載のシステム。
- 前記他の第1の残りの未測定特徴は、前記他の第2の残りの未測定特徴と同じである、請求項16に記載の非一時的なコンピュータ可読媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062959754P | 2020-01-10 | 2020-01-10 | |
PCT/US2021/013142 WO2021142479A1 (en) | 2020-01-10 | 2021-01-12 | A tool for selecting relevant features in precision diagnostics |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023509786A true JP2023509786A (ja) | 2023-03-09 |
Family
ID=76787610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022542352A Pending JP2023509786A (ja) | 2020-01-10 | 2021-01-12 | 適合率診断において関連する特徴を選択するためのツール |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230042330A1 (ja) |
JP (1) | JP2023509786A (ja) |
WO (1) | WO2021142479A1 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7970718B2 (en) * | 2001-05-18 | 2011-06-28 | Health Discovery Corporation | Method for feature selection and for evaluating features identified as significant for classifying data |
US9191442B2 (en) * | 2012-04-03 | 2015-11-17 | Accenture Global Services Limited | Adaptive sensor data selection and sampling based on current and future context |
US20180300333A1 (en) * | 2017-04-13 | 2018-10-18 | General Electric Company | Feature subset selection and ranking |
WO2019210292A1 (en) * | 2018-04-27 | 2019-10-31 | Delphinus Medical Technologies, Inc. | System and method for feature extraction and classification on ultrasound tomography images |
-
2021
- 2021-01-12 JP JP2022542352A patent/JP2023509786A/ja active Pending
- 2021-01-12 WO PCT/US2021/013142 patent/WO2021142479A1/en active Application Filing
- 2021-01-12 US US17/791,880 patent/US20230042330A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2021142479A1 (en) | 2021-07-15 |
US20230042330A1 (en) | 2023-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11527326B2 (en) | Dynamically determining risk of clinical condition | |
US20230082019A1 (en) | Systems and methods for monitoring brain health status | |
KR102581103B1 (ko) | 환자 배치를 최적화하기 위한 다인자, 기계-학습 기반 우선순위화 프레임워크 | |
US20170124269A1 (en) | Determining new knowledge for clinical decision support | |
US10957449B1 (en) | Determining new knowledge for clinical decision support | |
KR101634425B1 (ko) | 질의-응답 시스템을 사용하는 의학적 감별진단 및 치료를 위한 의사결정-지원 애플리케이션 및 시스템 | |
US20150193583A1 (en) | Decision Support From Disparate Clinical Sources | |
Ongenae et al. | A probabilistic ontology-based platform for self-learning context-aware healthcare applications | |
US20170011183A1 (en) | Integrated medical platform | |
JP6454762B2 (ja) | 階層データに基づくデバイス制御 | |
CN114078597A (zh) | 从文本获得支持的决策树用于医疗健康应用 | |
US20200058408A1 (en) | Systems, methods, and apparatus for linking family electronic medical records and prediction of medical conditions and health management | |
JP2023544335A (ja) | 機械学習モデルの適応訓練システム及び方法 | |
US20210151140A1 (en) | Event Data Modelling | |
CA2997354A1 (en) | Experience engine-method and apparatus of learning from similar patients | |
Das et al. | Application of AI and soft computing in healthcare: a review and speculation | |
WO2017007461A1 (en) | Integrated medical platform | |
JP2023509786A (ja) | 適合率診断において関連する特徴を選択するためのツール | |
EP4113535A1 (en) | Remote monitoring methods and systems for monitoring patients suffering from chronical inflammatory diseases | |
Olivia et al. | Clinical severity level prediction based optimal medical resource allocation at mass casualty incident | |
JP2021507392A (ja) | エンティティ間のコンテキスト的類似性の学習および適用 | |
US20220375617A1 (en) | Computerized decision support tool for preventing falls in post-acute care patients | |
JP2024505145A (ja) | インタラクティブな患者ダッシュボードを生成するためのシステムおよび方法 | |
Wang et al. | Prediction Models for Glaucoma in a Multicenter Electronic Health Records Consortium: The Sight Outcomes Research Collaborative | |
Muñoz-Valencia et al. | Bayesian networks for disease diagnosis: What are they, who has used them and how? |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240111 |