JP2023509786A

JP2023509786A - 適合率診断において関連する特徴を選択するためのツール

Info

Publication number: JP2023509786A
Application number: JP2022542352A
Authority: JP
Inventors: タネジャ，アイシャン; ロペス－エスピナ，カルロス; デイヴザオ，シーハイ; ズー，ルオキン; レディ，ボビー
Original assignee: プレノシス，インコーポレイテッド
Priority date: 2020-01-10
Filing date: 2021-01-12
Publication date: 2023-03-09
Also published as: WO2021142479A1; US20230042330A1

Abstract

少なくとも１つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法が提供される。この方法は、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未使用特徴に第１の値を補定することと、インスタンスにおける第１の値を使用するモデルを用いて第１の転帰を評価することと、を含む。この方法は、他の残りの未測定特徴を一定に保持しながら、データセットにおける未測定特徴に第２の値を補定することと、インスタンスにおける第２の値を使用するモデルを用いて第２の転帰を評価することと、第１の転帰と第２の転帰を用いて統計パラメータを判定することと、を含む。この方法はまた、未測定特徴を、判定された統計パラメータに対応するランキングに割り当てることを含む。また、上記の方法を実行するためのシステム及び非一時的なコンピュータ可読媒体が提示される。

Description

本願は、「ＴｏｏｌｆｏｒＳｅｌｅｃｔｉｎｇＲｅｌｅｖａｎｔＦｅａｔｕｒｅｓｉｎＰｒｅｃｉｓｉｏｎＤｉａｇｎｏｓｔｉｃｓ」と題された２０２０年１月１０日に出願された米国仮特許出願第６２／９５９，７５４号の優先権及び利益を主張し、以下に完全に記載されているかのように、また、適用可能なすべての目的のために、その全体が参照により本明細書に組み込まれる。

本開示は、一般に、正確かつタイムリーな転帰の予測を提供するために、データの選択及び収集の方法及び手段に関する。より具体的には、本開示は、個々のベースで強化された信頼レベルを用いてデータ収集のためのコスト及び時間を最適化するための教育された提案を提供するための方法及びシステムに関する。

機械学習（ＭＬ）アルゴリズムに基づく診断システムは、重要性の観点から臨床的特徴の集団全体のランキングを提供する。しかしながら、特定の患者について特徴のセットが収集されるときに、その特徴の集団全体のランキングは、その患者にとって最適ではないことがある。測定する最適ではない特徴を収集した帰結として、特に緊急事態において患者に対して望ましくない転帰となっていることがある。患者固有のベースで予測データセットを完成させるための最適な特徴の選択を可能にするシステム及び方法を有することが望ましい。

本開示のいくつかの実施形態では、少なくとも１つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法であって、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未測定特徴に第１の値を補定することと、インスタンスにおける第１の値を使用するモデルを用いて第１の転帰を評価することと、を含む。この方法は、他の残りの未測定特徴を一定に保持しながら、データセットにおける未測定特徴に第２の値を補定することと、インスタンスにおける第２の値を使用するモデルを用いて第２の転帰を評価することと、第１の転帰と第２の転帰を用いて統計パラメータを判定することと、を含む。この方法はまた、未測定特徴を、判定された統計パラメータに対応するランキングに割り当てることを含む。

いくつかの実施形態では、少なくとも１つの特徴が測定されているインスタンスについて未測定特徴をランク付けするためのシステムは、命令を記憶するためのメモリと、メモリと通信可能に結合された１つ以上のプロセッサと、を含む。１つ以上のプロセッサは命令を実行して、システムに、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未使用特徴に第１の値を補定することと、インスタンスにおける第１の値を使用するモデルを用いて第１の転帰を評価することと、を行わせるように構成されている。１つ以上のプロセッサはまた、命令を実行して、システムに、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未使用特徴に第２の値を補定することと、インスタンスにおける第２の値を使用するモデルを用いて第２の転帰を評価することと、第１の転帰と第２の転帰を用いて統計パラメータを判定することと、を行わせるように構成されている。１つ以上のプロセッサはまた、未測定特徴を、統計パラメータに対応するランキングに割り当てることと、インスタンスからの少なくとも１つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することであって、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、選択することと、を行うように構成されている。

いくつかの実施形態では、命令を記憶する非一時的なコンピュータ可読媒体であって、命令は、コンピュータによって実行されるときに、コンピュータに、少なくとも１つの特徴が測定されているインスタンスに対して未測定特徴をランク付けするための方法を実行させる。この方法は、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未使用特徴に第１の値を補定することと、インスタンスにおける第１の値を使用するモデルを用いて第１の転帰を評価することと、を含む。この方法はまた、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未測定特徴に第２の値を補定することと、インスタンスにおける第２の値を使用するモデルを用いて第２の転帰を評価することと、第１の転帰と第２の転帰を用いて統計パラメータを判定することと、を含む。この方法はまた、未測定特徴を、統計パラメータに対応するランキングに割り当てることと、インスタンスからの少なくとも１つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することであって、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、選択することと、を含む。この方法では、未測定特徴を、統計パラメータに対応するランキングに割り当てることは、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、１つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することを含む。

いくつかの実施形態では、少なくとも１つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法は、インスタンスからの少なくとも１つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することを含み、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む。この方法はまた、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、１つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することと、未測定特徴を、モデルベースの特徴重要度からの出力に対応するランキングに割り当てることと、を含む。

いくつかの実施形態では、少なくとも１つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法は、マスターデータセットにアクセスすることを含み、マスターデータセットは、既知の転帰に関連する複数のデータセットを含む。この方法はまた、転帰についてのモデルに関連する分散値を判定することであって、そのモデルは、未測定特徴、及びデータセットにおける少なくとも１つの他の別個の特徴に基づく、判定することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することと、未測定特徴を、分散値に対する予測の分散の値に従ってランキングに割り当てることと、を含む。

いくつかの実施形態では、少なくとも１つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法は、データセットに基づいて決定値を査定するためのルールを判定することを含む。データセットは、インスタンスにおける複数の測定済特徴及びインスタンスにおける未測定特徴について収集された値を含み、ルールは、（１）複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び（２）１つ以上の測定済特徴と合致する。この方法はまた、複数の転帰値及びデータセットの各々についての既知の転帰に基づいて、ルールの正解率を判定することと、未測定特徴を、ルールの正解率に対応するランキングを割り当てることと、を含む。

いくつかの実施形態では、特徴の予測可能性に基づいて選択された特徴についてのサンプリング頻度を判定する方法は、観察された特徴のセット及び欠落特徴のセットを識別することを含む。この方法はまた、履歴データセットから選択された特徴マトリクスを使用して選択された特徴のサンプル頻度を予測するモデルを構築することと、このモデルを使用してサンプリング頻度についての予測を生成することと、複数の時間予測から選択された特徴の分散を判定することと、を含む。この方法はまた、分散に基づいて、他の特徴に対して、選択された特徴をランク付けすることと、特徴のランクが予め判定された上位パーセンタイルにあるときに、選択された特徴のサンプリング頻度を増加させることと、を含む。

主題の技術の他の構成は、以下の詳細な説明から当業者には容易に明らかになるであろうことが理解され、主題の技術の様々な構成は、例示として示され説明される。実現されるように、主題の技術は、主題の技術の範囲から逸脱することなく、他の異なる構成が可能であり、そのいくつかの詳細は、様々な他の点で修正可能である。したがって、図面及び詳細な説明は、限定的なものではなく、本質的に例示的なものとみなされるべきである。

添付の図面は、さらなる理解を提供するために含まれ、本明細書に組み込まれ、本明細書の一部を構成しており、開示の実施形態を例示し、説明と一緒に、開示の実施形態の原理を説明するのに役立つ。

様々な実施形態による、ストリーミングデータ環境における診断エンジンに好適な例示的なアーキテクチャを例示する。

本開示の所定の態様による、図１のアーキテクチャからの例示的なサーバ及びクライアントを例示するブロック図である。

様々な実施形態による、決定木のための例示的なワークフローを例示する。

様々な実施形態による、制約関数を使用して診断エンジンの関連性に従って、データセットにおける１つ以上の特徴をランク付けするための方法を例示する。

様々な実施形態による、診断エンジンのための予測の不確実性における欠落特徴の影響を定量化するための方法を例示するブロック図である。

様々な実施形態による、マスターデータセットから類似の患者データセットを選択する診断エンジンにおいて特徴の関連性を定量化するための方法を例示するブロック図である。

様々な実施形態による、マスターデータセットから選択された履歴データセットを使用して、診断エンジンにおいて特徴の関連性を定量化するための方法を示すブロック図である。

様々な実施形態による、時間シーケンスにわたって受信されたか、又は補定された複数の医療的特徴に基づいて、診断エンジンに関連する特徴を選択する方法におけるステップを例示するフローチャートである。

様々な実施形態による、個々の特徴の欠落の影響を定量化することによって、診断エンジンに関連する特徴を選択する方法におけるステップを例示するフローチャートである。

様々な実施形態による、マスターデータセットからの類似の患者集団のためのフィルタに基づいて、診断エンジンに関連する特徴を選択する方法におけるステップを例示するフローチャートである。

様々な実施形態による、測定済特徴についてのモデルに基づいて診断エンジンに関連する特徴を選択する方法におけるステップを例示するフローチャートである。

様々な実施形態による、マスターデータセットから選択された履歴データセットに基づいて、診断エンジンに関連する特徴を選択する方法におけるステップを例示するフローチャートである。

様々な実施形態による、測定済特徴を使用して、欠落特徴の重要性を予測する多変数モデルを構築する方法におけるステップを例示するフローチャートである。

様々な実施形態による、特徴の予測可能性に基づいて、選択された特徴のためのサンプリング頻度を判定する方法におけるステップを例示するフローチャートである。

様々な実施形態よる、図１及び図２のクライアント及びサーバ、並びに図８～図１２の方法が実装され得る例示的なコンピュータシステムを例示するブロック図である。

図において、同じ又は類似の参照番号によって示される要素及びステップは、他に示されない限り、同じ又は類似の要素及びステップに関連付けられる。

以下の詳細な説明では、本開示の完全な理解を提供するために、多数の特定の詳細が記載される。しかしながら、当業者には明らかであろうが、本開示の実施形態は、これらの特定の詳細のいくつかなしに実施することができることが明らかであろう。他の例では、周知の構造及び技術は、開示を不明瞭にしないように詳細には示されていない。

概要
最近、患者について測定可能な特徴の数が劇的に増加している。様々な実施形態では、特徴測定は、ゲノミクス、トランスクリプトミクス、プロテオミクス、メタボロミクス、ウェアラブルデバイスデータ、行動データ（食品／飲料購入、フィットネスデータなど）、請求データ（保険など）、及びソーシャルメディアデータを含み得る。異なる特徴は、それらに関連する異なるコスト及び取得時間を有し得る。したがって、特徴のパーソナライズされたランキングを有することが望ましい。

したがって、所与の患者の診断における特定の特徴の関連性を理解して、測定のコスト及び時間を低減することが望ましく、これは、緊急ケア状況において極めて重要であり得る。任意の所与の特徴の関連性はまた、状況、及び患者自身にも依存することがある。例えば、発熱、白血球増加、及び２型糖尿病の病歴を有する７０歳の患者は、特徴ａ、ｂ、及びｃのその後の測定から最も利益を得ることがある。一方、持続性の頭痛の症状を呈している健康な２３歳は、特徴ｘ、ｙ、ｚのその後の測定から最も利益を得ることがある。したがって、広範な個人集団から収集されたデータを使用して、単一の患者に関連する特徴のランキングを調整することが非常に望ましい。

患者の利用可能な情報及び定量可能な健康状態が与えられると、本明細書に開示の方法及びシステムは、対応する臨床的問い合わせのために収集する価値ある特徴を判定する（例えば、患者が疾患ｄを有するかどうか、又は患者が治療ｔから利益を得るかなど）。追加的に、様々な実施形態はまた、収集の頻度、及び所望の正確率及び適合率で、選択された特徴を取得するためにどの測定技術が使用され得るかを判定する。様々な実施形態は、所与の患者がそのバイタルを測定されたときに（例えば、現在の利用可能な情報）、利用可能な資源及び診断のための時間によって制約される、臨床医が収集し得る特徴の最適なセットを提供する。様々な実施形態では、特徴選択メカニズムは、患者の利用可能な情報及び定量可能な健康状態を条件とする。

様々な実施形態によれば、特徴のセットに対するノイズ許容度は、経験的に判定することができる。さらに、様々な実施形態は、特徴のセットが既に測定されていることを条件として特徴のノイズ許容度を判定し得る。したがって、様々な実施形態は、エンドユーザに対して、その特徴又は他の特徴の以前の測定に基づいて、所与の特徴に対する平均可能許容度を増加又は減少させることを提案することを含む。

様々な実施形態によれば、特徴のセットに対する最適なサンプリング頻度は、アルゴリズム的に判定することができる。追加的に、様々な実施形態は、特徴のセットが既に測定されていることを条件として特徴のサンプリング頻度を判定し得る。したがって、様々な実施形態は、エンドユーザに対して、その特徴又は他の特徴の以前の測定に基づいて、所与の特徴に対するサンプリング頻度を増加又は減少させることを提案することを含む。

様々な実施形態では、機械学習アルゴリズムが使用されて、入力特徴行列及び転帰ベクトルからなるデータセットで訓練されたモデル及び所与の患者について利用可能な定量可能な情報に従って特徴関連性をランク付けする。追加的に、本開示と合致する実施形態は、所与の患者及びデータセットについて利用可能な定量可能な情報に基づいて、特徴のセットのランキングの被験者固有の推定値を提供する。

提案される解決策は、さらに、コンピュータ自体の機能を改善する。なぜなら、コンピュータ自体は、データ記憶空間を節約し、本明細書に開示の方法及びシステムによりもたらされる決定までの時間短縮により、ネットワークの使用量を低減するためである。

本明細書に提供の多くの実施例は、患者のデータが識別可能であること、又は記憶されている画像のダウンロード履歴を説明しているが、各ユーザは、そのような患者情報が共有又は記憶されることに明示的に許可を付与し得る。明示的な許可は、開示のシステムに一体化されたプライバシー制御を使用して付与することができる。各ユーザには、そのような患者情報が明示的な同意を得て共有することができるか、又は共有されるであろうことの通知が提供され得、各患者がいつでもその情報を共有し得、任意の記憶されたユーザ情報を削除し得る。記憶された患者情報は、患者のセキュリティを保護するために暗号化され得る。

例示的なシステムアーキテクチャ
図１は、様々な実施形態による、ストリーミングデータ環境における診断エンジンに好適な例示的なアーキテクチャを例示する。アーキテクチャ１００は、ネットワーク１５０を介して接続されたサーバ１３０及びクライアントデバイス１１０を含む。多くのサーバ１３０のうちの１つは、プロセッサによって実行されるときに、サーバ１３０に、本明細書に開示の方法におけるステップの少なくともいくつかを実行させる命令を含むメモリをホストするように構成されている。サーバ１３０のうちの少なくとも１つは、複数の患者についての臨床データを含むデータベースを含むか、又はそれに対するアクセスを有し得る。

サーバ１３０は、画像のコレクション及びトリガ論理エンジンをホストするための適切なプロセッサ、メモリ、及び通信能力を有する任意のデバイスを含み得る。トリガ論理エンジンは、ネットワーク１５０を介して様々なクライアントデバイス１１０によってアクセス可能であり得る。クライアントデバイス１１０は、例えば、デスクトップコンピュータ、モバイルコンピュータ、タブレットコンピュータ（例えば、電子ブックリーダを含む）、モバイルデバイス（例えば、スマートフォンもしくはＰＤＡ）、又はサーバ１３０のうちの１つのトリガ論理エンジンにアクセスするための適切なプロセッサ、メモリ、及び通信能力を有する任意の他のデバイスとすることができる。様々な実施形態によれば、クライアントデバイス１１０は、医師、看護師、又は救急救命士のような医療従事者が、リアルタイムの緊急状況において（例えば、病院、クリニック、救急車、又は他の公衆もしくは居住環境において）サーバ１３０のうちの１つのトリガ論理エンジンにアクセスすることによって使用され得る。いくつかの実施形態では、クライアントデバイス１１０の１つ以上のユーザ（例えば、看護師、救急救命士、医師、及び他の医療従事者）は、ネットワーク１５０を介して、１つ以上のサーバ１３０のトリガ論理エンジンに臨床データを提供し得る。さらに他の実施形態では、１つ以上のクライアントデバイス１１０は、臨床データをサーバ１３０に自動的に提供し得る。例えば、いくつかの実施形態では、クライアントデバイス１１０は、ネットワーク接続を介して自動的に患者結果をサーバ１３０に提供するように構成された、クリニックにおける血液検査ユニットであり得る。ネットワーク１５０は、例えば、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）、インターネットなどのうちの任意の１つ以上を含むことができる。さらに、ネットワーク１５０は、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スターバスネットワーク、ツリー又は階層ネットワークなどを含む、ネットワークトポロジのうちの任意の１つ以上を含むことができるが、これらに限定されない。

例示的な診断システム
図２は、本開示の所定の態様による、図１のアーキテクチャ１００における例示的なサーバ１３０及びクライアントデバイス１１０を例示するブロック図２００である。クライアントデバイス１１０及びサーバ１３０は、それぞれの通信モジュール２１８－１及び２１８－２（以下、総称して「通信モジュール２１８」）を介してネットワーク１５０を介して通信可能に結合されている。通信モジュール２１８は、データ、要求、応答、及びコマンドのような情報をネットワークの他のデバイスと送受信するために、ネットワーク１５０とインターフェースするように構成されている。通信モジュール２１８は、例えば、モデム又はＥｔｈｅｒｎｅｔ（登録商標）カードとすることができる。クライアントデバイス１１０及びサーバ１３０は、それぞれ、メモリ２２０－１及び２２０－２（以下、総称して「メモリ２２０」）並びにプロセッサ２１２－１及び２１２－２（以下、総称して「プロセッサ２１２」）を含み得る。メモリ２２０は、プロセッサ２１２によって実行されるときに、クライアントデバイス１１０又はサーバ１３０のいずれか一方に、本明細書に開示の方法における１つ以上のステップを実行させる命令を記憶し得る。したがって、プロセッサ２１２は、物理的にプロセッサ２１２にコード化された命令、メモリ２２０内のソフトウェアから受信された命令、又はその両方の組み合わせのような命令を実行するように構成され得る。

様々な実施形態によれば、サーバ１３０は、データベース２５２－１及びマスターデータセット２５２－２（以下、総称して「データベース２５２」）を含み得、又はそれらに通信可能に結合され得る。１つ以上の実装形態では、データベース２５２は、複数の患者のための臨床データを記憶し得る。データベース２５２は、１人以上の患者についての、様々な特徴、治療情報、モデル予測、及び患者ごとの転帰情報についての時系列測定値を有する、履歴データセットＨを含み得る。履歴データベースＨは、異なる時点で測定された複数の特徴を含み得る。

様々な実施形態によれば、マスターデータセット２５２－２は、データベース２５２－１と同じであり得、又はデータベース２５２－１に含まれ得る。データベース２５２内の臨床データは、非同定性患者特性、バイタルサイン、ＣＢＣ（ｃｏｍｐｌｅｔｅｂｌｏｏｄｃｏｕｎｔ）などの血液測定値、ＣＭＰ（ｃｏｍｐｒｅｈｅｎｓｉｖｅｍｅｔａｂｏｌｉｃｐａｎｅｌ）、及び血液ガス（例えば、酸素、ＣＯ_２など）、免疫学的情報、バイオマーカー、培養などの計測情報を含み得る。非識別性患者特性は、年齢、性別、及び慢性疾患（例えば、糖尿病、アレルギーなど）などの一般的な病歴を含み得る。様々な実施形態では、臨床データはまた、治療手段、薬剤投与事象、投与量などの計測情報に応答して医療従事者によって取られる行動を含み得る。様々な実施形態では、臨床データはまた、患者の履歴で生じる事象及び転帰（例えば、敗血症、脳卒中、心停止、ショックなど）を含み得る。データベース２５２は、サーバ１３０から分離されて例示されているが、所定の態様では、データベース２５２及びトリガ論理エンジン２４２は、同じサーバ１３０内にホストすることができ、ネットワーク１５０内の任意の他のサーバ又はクライアントデバイスによってアクセス可能とすることができる。

サーバ１３０内のメモリ２２０－２は、医学的特徴のデータセットに基づいて、可能性のある患者転帰を評価するための診断エンジン２４０を含み得る。診断エンジン２４０はまた、トリガ論理エンジン２４２、モデリングツール２４４、統計ツール２４６、及び補定ツール２４８を含み得る。モデリングツール２４４は、関連する臨床データを収集し、予想される転帰（例えば、診断）を評価するための命令及びコマンドを含み得る。いくつかの実施形態では、モデリングツール２４４は、複数の可能な行動から取るべき行動を提案し得る。モデリングツール２４４は、ディープニューラルネットワーク（ＤＮＮ）、畳み込みニューラルネットワーク（ＣＮＮ）、生成的敵対ニューラルネットワーク（ＧＡＮ）、ディープ強化学習（ＤＲＬ）アルゴリズム、ディープリカレントニューラルネットワーク（ＤＲＮＮ）、ランダムフォレストなどの古典的機械学習アルゴリズム、ｋ近傍法（ＫＮＮ）アルゴリズム、ｋ平均法アルゴリズム、又はそれらの任意の組み合わせなどのニューラルネットワーク（ＮＮ）からのコマンド及び命令を含み得る。様々な実施形態によれば、モデリングツール２４４は、機械学習アルゴリズム、人工知能アルゴリズム、又はそれらの任意の組み合わせを含み得る。モデルリングツール２４４は、履歴データセットＨから抽出された情報を用いて、所定の時点で行われた予測、患者のセットについて行われた測定、及び患者のセットについての実際の転帰に基づいて、モデルに基づいたモデルを動的に生成し得る。

統計ツール２４６は、データベース２５２に記憶された、又はモデリングツール２４４によって提供されたデータを評価する。補定ツール２４８は、トリガ論理エンジン２４２によって収集された計測情報から欠落しているデータ入力をモデリングツール２４４に提供し得る。トリガ論理エンジン２４２は、統計ツールによって計算された入力データ｛Ｐ_ｉ｝及びモデルＦに関連する様々なメトリックを評価し、入力及びそれが所定の条件を満たすかどうかに基づいて行動をトリガするように構成され得る。ストリーミングデータ入力｛Ｐ_ｉ｝は、患者ｉに対するクライアントデバイス１１０を使用して、看護師又は他の医療従事者によって提供された複数の測定済特徴を含み得る。いくつかの実施形態によれば、サーバ１３０は、｛Ｍ_ｉ｝における１つ以上の特徴に対するランキング変数をクライアントデバイス１１０に提供し得る。｛Ｍ_ｉ｝における所与の特徴に提供されるランキング変数は、エンドユーザが、所与の患者についてその後にどの特徴又は特徴のセットを測定するべきかを判定するために使用される情報であり得る。いくつかの実施形態によれば、測定済特徴｛Ｐ_ｉ｝は、１つ以上のクライアントデバイス１１０からサーバ１３０に提供される。様々な実施形態によれば、クライアントデバイス１１０は、入力データ｛Ｐ_ｉ｝に応答して、サーバ１３０から予測される転帰又は診断を受信し得る。

モデリングツール２４４は、ｍ×（ｌ＋ｋ）次元入力特徴行列Ｘ及び次元ｍの転帰ベクトルＹ（各患者に対して１つのエントリ）からなるデータセットＤで訓練されたモデルＦを含む。Ｍ_ｉは、被験者ｉに対して測定されていないｋ個の特徴を含むｋ次元の特徴ベクトルである。被験者ｉに対するｌ次元特徴ベクトルＰ_ｉは、被験者ｉに対して測定されたｌ個の特徴を含む。したがって、ｎ個の欠落特徴のセット（Ｍ_ｉｎ、ｎ≦ｋである）は、Ｍ_ｉから選択され得る。所与のＭ_ｉｎに対して、診断エンジン２４０は３つの値を割り当てる。第１の値は、スカラー値ｓ（例えば、０≦ｓ≦１）であり、Ｙ（患者の転帰）に関するｎセットの重要性を示す。第２の値は、サイズｎのベクトル（ｖ_１ｎ）であり、各エントリは、所与のｎセット内の各特徴に対する時間依存変動に対応する。そして、第３の値、サイズｎの他のベクトルｖ_２ｎは、ｎセット内の各欠落特徴の測定における最大可能ノイズを示す。様々な実施形態によれば、サーバ１３０は、グループ｛Ｍ_ｉｎ，ｓ，ｖ_１ｎ，ｖ_２ｎ｝をクライアントデバイス１１０に送信する。

クライアントデバイス１１０は、クライアントデバイス１１０にインストールされたアプリケーション２２２又はウェブブラウザを介して診断エンジン２４０にアクセスし得る。プロセッサ２１２－１は、クライアントデバイス１１０におけるアプリケーション２２２の実行を制御し得る。様々な実施形態によれば、アプリケーション２２２は、クライアントデバイス１１０の出力デバイス２１６におけるユーザのために表示されるユーザインターフェース（例えば、グラフィカルユーザインターフェースＧＵＩ）を含み得る。クライアントデバイス１１０のユーザは、入力デバイス２１４を使用して、計測情報として入力データを入力するか、又はアプリケーション２２２のユーザインターフェースを介して診断エンジン２４０に問い合わせを送信し得る。入力デバイス２１４は、スタイラス、マウス、キーボード、タッチスクリーン、マイクロホン、又はそれらの任意の組み合わせを含み得る。また、出力デバイス２１６は、ディスプレイ、ヘッドセット、スピーカ、アラーム又はサイレン、又はそれらの任意の組み合わせを含み得る。

図３は、様々な実施形態による、決定木のための例示的なワークフローを例示する。様々な実施形態では、本明細書に開示の１つ以上のクライアントデバイス及びサーバは、決定木３００の各ノードにおける意思決定について介入し得る。より具体的には、決定木３００内のノードの１つ以上において、トリガ論理エンジン、モデリングツール、統計ツール、及び補定ツールを含む診断エンジンが使用され得る。各決定点は独立して解決され、フォローアップの決定につながる可能性がある。第１の決定（Ａ）後の決定は、新しいデータを推薦する代わりに、以前の決定までに収集されたデータを使用することによって開始することができる。１つの例示的な実施形態では、第１の決定点は、次のＸ時間内に敗血症を発症するリスクが高い患者を見つけることを含み得る。第２の決定点は、それらの患者に対して、広域スペクトル（Ａ、Ｂ、Ｘなど）から利益を受ける宿主応答のサブタイプを選択することを含み得る。

様々な実施形態では、２層ディープ決定木は、以下のように概略され得る。１）臨床医は、患者が次の６時間以内に敗血症を発症するリスクが高いかどうかを問い合わせる。２ａ）臨床医が、関連情報（バイタル、検査、機械学習に基づく予測）を受けた後、患者が高リスクであると評価するときに、患者に抗生物質又は抗ウイルス薬を投与すべきか？２ｂ）臨床医が、患者に敗血症はないと考えるときに、次のレベルは、患者に尿路感染症があるかどうか（合併症を伴わない）を識別することを含む。

各決定点は、特定のワークフローを実行することを含み得る。ルートレベル決定点の後、その後の決定点は、収集すべき特徴のセットを提案し得る。様々な実施形態では、診断ツールは、集団全体の推定に基づいて特徴のセットを提案するか、又は、以前の決定点で要求又は実行されたテストに従って収集された（例えば、履歴データセットＨからの）データを、これまでに記録されている利用可能なものを使用するためのいくつかのオプションを含み得る。

様々な実施形態において、推薦される行動は、すべての特徴が利用可能であるかどうかにかかわらず、所与の患者についての新しい観察を収集し、新しいデータの準備が整っているときはいつでも次のステップに移動することを含み得る。

様々な実施形態では、モデリングツールにおける機械学習モデルは、利用可能なデータに基づいて、転帰の予測又は転帰の確率、及び予測についての信頼レベルを提供する。いくつかの実施形態では、信頼レベルは、診断エンジンにおける統計ツールによって提供され得る。したがって、転帰の予測に基づいて、１つ以上の決定が利用可能であり得る。トリガ論理エンジンにおいて定義された１つ以上の決定に依存するルールは、診断エンジンが答えを提供するか又は行動を要求するための準備がいつ整うのかを決定するために使用され得る。

統計ツールはまた、１つ以上の決定の各々に対するリスクを査定し得る。リスクが低いときに、ワークフローは停止し、決定が下される。リスクが高いときに、診断エンジンは、医師、看護師、又は他の医療従事者に問い合わせ（例えば、クライアントデバイスにおけるタッチスクリーンに、又はマイクロホンを介して表示される質問）を発行し得る。医師、看護師、又は他の従事者が問い合わせに対して肯定的な応答をした（「ＯＫ」応答、又はクライアントデバイスのタッチスクリーン上のボタンを押す）ときに、ワークフローは停止し、決定が下される。

システムが、決定を行う前に（例えば、高いリスク又は低い信頼レベルのために）欠落データを検出するときに、診断エンジンは、欠落データ中の少なくとも１つ以上の特徴が測定され、モデリングツールに組み込まれるのを待つことを決定してもよい。選択された決定に基づいて、システムは、ユーザに新しい機能のセットを収集するように提案し得る。様々な実施形態によれば、システムは、たとえユーザによって要求されないときでも、新しい特徴が収集されるのを待ち得る。様々な実施形態によれば、モデリングツールはまた、関連する信頼性メトリックを有する利用可能な特徴に基づいてモデルを更新し得る。

様々な実施形態によれば、予測される転帰に対する信頼性が不十分な場合の収集のための特徴を示唆するために、システムは、予測の不確実性に対する個々の特徴の欠落の影響を定量化し得る。様々な態様では、収集される特徴を提案するために、システムはまた、「類似の」患者集団に基づいて動的モデル及び可変的重要度判定を適用し得る。利用可能な変数に基づいて、可変的重要度予測が取得され得る。欠落特徴を示唆するために、システムはまた、履歴データセットＨを使用して、特徴の付加的な予測価値を定量化し得る。

様々な実施形態では、診断エンジンはまた、各特徴又は特徴のセットに割り当てられたランキング変数を提供する。したがって、診断エンジンは、それらのランク及びユーザ固有の制約関数に基づいて、測定されるべき欠落特徴を示唆し得る。制約関数は、特徴のコスト及び取得時間を含み得る。

図４は、様々な実施形態による、制約関数を使用して診断エンジンの関連性に従って、データセットにおける１つ以上の特徴をランク付けするための方法を例示する。Ｆ_１、Ｆ_２、Ｆ_３、Ｆ_４、Ｆ_５、Ｆ_６、Ｆ_７、Ｆ_８、Ｆ_９、及びＦ_１０の取得する最大１０個の特徴があると仮定し、その特徴のうちの３つが特定の患者について測定される｛Ｐ＝Ｆ_２、Ｆ_６、Ｆ_９｝。例えば、患者は病院の救急治療室に入ってもよく、特徴Ｆ_２、Ｆ_６、及びＦ_９のうちの少なくとも２つは体温及び心拍数を含み得る。以下の表は、欠落特徴｛Ｍ＝Ｆ_１、Ｆ_３、Ｆ_４、Ｆ_５、Ｆ_７、Ｆ_８、及びＦ_１０｝の測定に伴って取得（遅延）するコスト及び時間をリストにしている。

利用可能なデータ｛Ｐ｝に基づいて、臨床医は、患者に疾患ｄがあるかどうかを問い合わせ得る。したがって、本明細書に開示の診断ツールは、患者の転帰を高い信頼レベルで予測するという観点から、残りの特徴｛Ｍ｝の関連性についてのランキングを出力する。決定は、時間（ｔｉｍｅ）に敏感であり得（例えば、次の１時間以内、又は他の規定時間内）、費用（ｃｏｓｔ）は二次的な関心事であり得る。したがって、診断エンジンは、以下のような数学的表現に比例する因子で上記の構成を反映するモデリングツールに制約関数（例えば、ランキング論理）を含み得る。

セット｛Ｍ｝における特徴は、制約関数の値に従って降順に臨床医に提示され得る。いくつかの実施形態では、提示されたＮ個の特徴（この例ではｎ＝７）のうち、診断ツールは、リストにおける上位

個の特徴（例えば、Ｆ_２、Ｆ_６、及びＦ_９の３つの特徴）の測定を提案し得る。様々な実施形態では、このプロセスは、診断エンジンにおける統計ツールが信頼レベル（所定の閾値を超える）に対して満足な値に達するまで繰り返される。

図５は、様々な実施形態による、診断エンジンについての予測の不確実性における欠落特徴の影響を定量化するための方法を例示するブロック図である。いくつかの実施形態では、欠落特徴セットは、個々の特徴（ｎセットにおけるｎ＝１、図２参照）を含み得る。予測の不確実性は、予測の不確実性を定量化しようとしている特徴（例えば、Ｆ_１、図４参照）を除いて、特徴のセットを「一定（ｃｏｎｓｔａｎｔ）」（例えば、特徴Ｆ_２、Ｆ_６、及びＦ_９、図４参照）に保持することによって取得される。モデリングツールは、各々がＦ_１に対して異なる補定値を有するＮ個の補定について予測される転帰を評価する。いくつかの例では、統計ツールは、モデリングツールの予測に基づいて統計パラメータを判定する。例えば、統計ツールは、モデリングツールのＮ個の予測間の分散（ｖａｒｉａｎｃｅ）を判定し得る。様々な実施形態では、統計ツールによって見出されるより高い分散は、予測値に対するより大きな影響、したがって、この特定の患者の診断についての特徴Ｆ_１のより大きな重要度（ｉｍｐｏｒｔａｎｃｅ）に関連し得る。

より具体的には、診断エンジンは、Ｍ_ｉにおける特定の特徴によって誘発される予測不確実性を、Ｆ_３～Ｆ_１０を「一定」に保持し、Ｆ_１を異なる値で複数回（Ｎ回）補定し、予測における分散を計算することによって定量化する。固定数の特徴（例えば、大きい特徴のセット、又は履歴データセットＨから抽出されたマスターデータセットなど）を用いて訓練され、所与の確率と信頼レベルで診断を生成するモデルで開始する。

診断エンジンは、所与の患者についてＰにおいてｊ個の特徴があり、Ｍにおいてｋ個の特徴があると想定すると、診断エンジンは以下のステップを実行し得る。

１からｋまで変化するｉについて、

セットＭから欠落特徴Ｆ_ｉを選択する。

Ｍにおける特徴１．．．ｋ－Ｆ_ｉ（例えば、｛１．．．ｋ／ｉ｝）を、履歴データセットからの大まかな推定（ランダム、平均、中央など）を用いて補定する。

履歴マスターデータセットＨを使用して、複数の補定フレームワークを介して特徴Ｆ_ｉを補定し、特徴ｉについてＮ個の補定値を生成する。Ｍ_{ｉｍｐｕｔｅｄ}は、各エントリがＦ_ｉのＮ個の補定値のうちの１つに対応するＮベクトルを表すものとする。

ＰのＮ個の同一コピーＭ_{｛１．．．ｋ／ｉ｝}を生成する。

Ｐ、Ｍ_{｛１．．．ｋ／ｉ｝}，Ｍ_{ｉｍｐｕｔｅｄ}を連結し、（Ｎ×（ｊ＋ｋ））の入力行列Ｉを生成する。

モデリングツールを用いて、Ｉ内の行ごとに１つのＮ個の予測（例えば、診断値や転帰）のセットを提供する。

Ｎ個の予測から補定間分散ｂ_ｉを判定する。Ｍにおける各特徴についてプロセスを繰り返した後、ｋ個の値ｂ_ｉは、セットＭにおける相対的特徴関連性に関連付けられ得る。

各特徴をｂ_ｉによって降順に並べる（高いｂ_ｉは関連性が高いことに対応する）。

様々な実施形態では、予測を見つけるために使用されるモデルは固定され得、マスターデータセット又は履歴データセットＨに基づく多重補定を使用して、変数重要度をランク付けする。様々な実施形態では、モデルは、所望に応じて動的に更新され得る。

様々な実施形態では、上記の方法は、１．．．ｋを特定のセットのリスト（例えば、［｛１，２，３｝、｛１，３，４｝、｛１，３，５｝など］）で置き換えることによって、特徴の別々のセットをランク付けすることに一般化され得る。

図６は、様々な実施形態による、マスターデータセットから類似の患者データセットを選択する診断エンジンにおいて特徴の関連性を定量化するための方法を例示するブロック図である。様々な実施形態では、この方法は、（例えば、マスターデータセット又は履歴データセットＨから）現在の患者に類似する患者のサブセットを含むフィルタリングされたデータセットを見つける。様々な実施形態では、「よく似ている」患者からなるより同質な集団を使用してモデルを構築することにより、現在の患者に固有の特徴の関連性ランキングが生成される。モデリングツールは、新しいモデルを構築するか、又は既存のモデルを更新して、類似の患者のサブセットについて既知の転帰（例えば、ベクトルＹ）を予測し、本明細書に開示の技術を使用して、欠落特徴に対する関連値又はランキングを提供する。

限定された特徴のセットを有する患者ｉの所定の観察値Ｐ_ｉについて、診断エンジンは、履歴マスターデータセットＨから最も近い被験者のセットＮＳを選択する。セットＮＳはまた、追加の測定済特徴のセットＸを含み得る。いくつかの実施形態では、セットＮＳの選択は、限定された特徴の初期セットに基づく。様々な実施形態において、セットＮＳは、異なるメトリック（ユークリッド、マンハッタン、マハラノビス、ミンコウスキー、シェビシェフ、コサイン、相関、ハミング、ジャッカード、スペアマン、ガウスカーネルなど）のうちの任意の１つを使用して、複数の方法（ｋ近傍法、固定半径近傍法など）を使用して定義することができる。

様々な実施形態では、セットＮＳのサイズは、この方法における調整可能な入力であり得る。例えば、様々な実施形態では、すべての被験者が使用され得る。マスターデータセットにおけるセットＮＳ、及び所望の予測値（例えば、セットＮＳ内の患者についての既知の転帰Ｙ）を使用して、モデリングツールは、特徴Ｘを使用して監視下のモデルＦ_ＮＳを構築する。Ｆ_ＮＳの性能（例えば、転帰予測及び信頼レベル）が、予め判定された閾値（例えば、正解率、ＡＵＣ、ＡＵＰＲ、Ｆ１スコア、感度、特異度、ＰＰＶ、ＮＰＶ、ＲＭＳＥ、ｒ^２、ＡＩＣ、ＢＩＣなど）よりも大きくない場合、モデリングツールは、セットＸを更新し、新しいモデルＦ_ＮＳを構築する（又は、既存のモデルを更新する）。

モデルＦ_ＮＳが満足できるときに、モデリングツールは、Ｆ_ＮＳの変数重要度を計算する。Ｆ_ＮＳの変数重要度は、複数の方法のうちの任意の１つによって、Ｘ内の各特徴についての数値を提供する。様々な実施形態では、変数重要度は、モデル情報アプローチ（線形回帰、ロジスティック回帰、ＳＶＭ、ツリーベースの方法、ニューラルネットワークなど）によって提供され得る。このような方法は、ｇｉｎｉ重要性、置換に基づく重要性、係数の大きさなどを含む。限定されたモデル固有の能力を有する様々な実施形態では、非モデル情報方法は、正解率、ＡＵＣ、ＡＵＰＲ、Ｆ１スコア、感度、特異度、ＰＰＶ、ＮＰＶ、ＲＭＳＥ、ｒ^２、ＡＩＣ、ＢＩＣなどの一般的なメトリックに対して最適化される、ヒルクライミング、シミュレーションアニーリング、遺伝子ベースアルゴリズムなどのような探索アルゴリズムを利用する。したがって、診断エンジンは、Ｆ_ＮＳの変数重要度のランキングに基づいて、患者測定についての新しい特徴を提案する。

様々な実施形態では、モデルＦ_ＮＳは、各新しい特徴提案について構築又は更新され得る。様々な実施形態では、特徴がＭ_ｉにあるがＸには存在しないときに、その特徴についての特徴重要度は、ＮＡ（利用可能ではない）に対応することができるか、又は対応することになる。

図７は、様々な実施形態による、マスターデータセットから選択された履歴データセットを使用して、診断エンジンにおいて特徴の関連性を定量化するための方法を示すブロック図である。様々な実施形態は、この方法を使用して、予測及び対応する回顧転帰を含む履歴データセットＨを利用する。存在する特徴のセットＰ_ｉとｋ個の欠落特徴のセットＭ_ｉが与えられると、診断エンジンは、患者ｉについて、履歴データセットＨを探索し、Ｐ_ｉにすでに存在するものに加えて、どの特徴が予測正解率に最大の影響を及ぼしたかを判定する。

診断エンジンは、Ｐ_ｉにおける特徴のみが存在するインスタンスに従って、ＨのサブセットＨ_ｐを選択する。様々な実施形態において、臨床医又は他の権限のあるユーザはまた、サブセットに対するオプションを有するか、又は異なる距離メトリック（ユークリッド、マンハッタン、マハラノビス、ミンコウスキー、シェビシェフ、コサイン、相関、ハミング、ジャッカード、スペアマン、ガウスカーネルなど）を有する様々な方法（ｋ近傍法、固定半径近傍法など）を使用して、Ｐ_ｉに最も近い被験者のセット及び距離メトリックを選択することによって、さらにＨ_ｐを「キュレート」し得る。

１．．．ｋにわたるインデックスｊについて、この方法は、様々な実施形態において、以下のように進行する。すなわち、セットＭ_ｉにおける特徴Ｆ_ｊを選択する。Ｐ_ｉにおける特徴が存在し、特徴Ｆ_ｊも存在するインスタンスに従って、ＨのサブセットＨ_ｐ＋ｊを選択する。Ｈ_ｐ＋ｊについて、正解率、ＡＵＣ、ＡＵＰＲ、Ｆ１スコア、感度、特異性、ＰＰＶ、ＮＰＶ、ＲＭＳＥ、ｒ^２、ＡＩＣ、ＢＩＣなどの標準的な測定メトリックを使用して、既知の結果（Ｙ）に基づいて、モデルに基づく予測の正解率Ａ_ｊを判定する。対応する値Ａ_ｊに基づいて、Ｍにおける各特徴Ｆ_ｊを降順に順序付ける。

様々な実施形態では、上記の方法は、欠落特徴１．．．ｋを上記のステップの各々における欠落特徴のｎセットのリスト（例えば、［｛１，２，３｝、｛１，３，４｝、｛１，３，５｝など］）で置き換えることによって、ｎ特徴の選択されたセットをランク付けすることに一般化され得る。

図８は、様々な実施形態による、時間シーケンスにわたって受信されたか、又は補定された複数の医療的特徴に基づいて、患者に対する医療行動を実行するための方法８００におけるステップを例示するフローチャートである。方法８００は、ネットワークを介して１つ以上のサーバに結合されたクライアントデバイスの任意の１つ（例えば、サーバ１３０のうちの任意の１つ、及びクライアントデバイス１１０の任意の１つ、及びネットワーク１５０）によって少なくとも部分的に実行され得る。例えば、様々な実施形態によれば、サーバは、医療関係者又は医療従事者によって携行する１つ以上の医療デバイス又はポータブルコンピュータデバイスをホストし得る。クライアントデバイス１１０は、医療施設内の労働者又は他の職員、患者を医療施設又は病院の救急治療室に搬送する救急車内の救急救命士、救急車で搬送するか、又は個人の住居又は医療施設から離れた公共の場所で患者を看護する者によって取り扱われ得る。方法８００におけるステップのうちの少なくともいくつかは、コンピュータのメモリに記憶されたコマンドを実行するプロセッサ（例えば、プロセッサ２１２及びメモリ２２０）を有するコンピュータによって実行され得る。様々な実施形態によれば、ユーザは、クライアントデバイス内のアプリケーションを起動して、ネットワークを介してサーバ内の診断エンジン（例えば、アプリケーション２２２及び診断論理エンジン２４０）にアクセスし得る。診断エンジンは、トリガ論理エンジン、モデリングツール、統計ツール、及びリアルタイムで臨床データを検索、供給、及び処理し、その行動推薦を提供する補定ツール（例えば、トリガ論理エンジン２４２、モデリングツール２４４、統計ツール２４６、及び補定ツール２４８）を含み得る。さらに、方法８００に開示のステップは、とりわけ、診断エンジン（例えば、データベース２５２）を使用して、コンピュータの一部であるか、又はコンピュータと通信可能に結合されたデータベースにおけるファイルを検索、編集、及び／又は記憶することを含み得る。本開示に合致する方法は、異なるシーケンスで実行される、方法８００に例示されるステップのすべてではないが少なくともいくつかを含み得る。さらに、本開示に合致する方法は、時間的に重複して、又はほぼ同時に実行される方法８００におけるように、少なくとも２つ以上のステップを含み得る。

ステップ８０２は、収集する所望の初期特徴のセットを推薦することを含む。様々な実施形態では、ステップ８０２は、集団全体の推定値に基づくか、又はこれまでに記録において利用可能なものを使用して、提案を提供することを含む。

ステップ８０４は、新しい観察を収集することを含み、観察は、１つ以上の特徴を含む。様々な実施形態では、ステップ８０４は、特徴の重要性、コストの制約、及び時間の制約に基づく１つ以上の特徴の要求を、医師、看護師又は他の医療従事者から受信することを含み得る。様々な実施形態では、ステップ８０４は、所与の患者について測定された１つ以上の新しい特徴を収集することを含む。様々な実施形態では、ステップ８０４は、新しい特徴が利用可能になると、次のステップに移動することを含む。様々な実施形態では、ステップ８０４は、進行する前に測定される特徴の予め判定されたセットを待つことを含む。

ステップ８０６は、転帰を予測することと、予測された転帰の信頼レベルを提供することとを含む。様々な実施形態では、ステップ８０６は、予測及び／又は確率を提供するために機械学習モデルを使用することを含む。

ステップ８０８は、信頼レベルが予め判定された閾値よりも大きいかどうかを判定することを含む。様々な実施形態では、ステップ８０８は、決定が、その決定に依存するルールに基づいて準備が整っているかどうかを評価することを含む。決定が整っているときに、ステップ８０８は、ステップ８１０ａにおいて、スコアを表示し、決定のリスクを査定することを含み得る。ステップ８１０ａにおいて、有害事象のリスクがリスク閾値よりも低いときに、ワークフローは終了する。

ステップ８１２ａは、有害事象のリスクがリスク閾値よりも高いときに、医師、看護師、又は医療従事者に承認を要求することを含む。ステップ８１２ａで医療従事者が要求を承認するときに、ワークフローは終了する。医療従事者がステップ８１２ａで要求を承認しないときに、ステップ８１４は、重要度のランキング変数（ｓ）、所与の未測定特徴のセットについてのサンプリング頻度（ｖ_１ｎ）を提供することを含む。

ステップ８１６は、所与の未測定特徴のセットについてのノイズ許容度（ｖ_２ｎ）を識別することを含む。様々な実施形態では、ステップ８１６は、本開示に合致するノイズ許容度に関する方法のうちの１つまたはそれら組み合わせに基づいて、各特徴についての測定技術を選択することを含む。

ステップ８０８では、信頼レベルが予め判定された閾値よりも低いときに、ステップ８１０ｂは、要求されたデータがすべて利用可能であるかどうかを判定することを含む。すべてのデータが利用可能であるわけではない場合、ユーザは、ステップ８１２ｂに進み、このステップは、新しいデータを待つことを伴う。ステップ８１０ｂに従ってすべての要求されたデータが利用可能であるときに、この方法はステップ８１４において継続する。

図９は、様々な実施形態による、個々の特徴の欠落の影響を定量化することによって、診断エンジンに関連する特徴を選択する方法９００におけるステップを例示するフローチャートである。方法９００は、少なくとも部分的に、ネットワークを介して１つ又は複数のサーバに結合されたクライアントデバイス（例えば、サーバ１３０の任意の１つ、及びクライアントデバイス１１０の任意の１つ、及びネットワーク１５０）の任意の１つによって実行されてもよい。例えば、様々な実施形態によれば、サーバは、医療関係者又は医療従事者によって携行する１つ以上の医療デバイス又はポータブルコンピュータデバイスをホストし得る。クライアントデバイス１１０は、医療施設内の労働者又は他の職員、患者を医療施設又は病院の救急治療室に搬送する救急車内の救急救命士、救急車で搬送するか、又は個人の住居又は医療施設から離れた公共の場所で患者を看護する者によって取り扱われ得る。方法９００におけるステップのうちの少なくともいくつかは、コンピュータのメモリに記憶されたコマンドを実行するプロセッサ（例えば、プロセッサ２１２及びメモリ２２０）を有するコンピュータによって実行され得る。様々な実施形態によれば、ユーザは、クライアントデバイス内のアプリケーションを起動して、ネットワークを介してサーバ内の診断エンジン（例えば、アプリケーション２２２及び診断論理エンジン２４０）にアクセスし得る。診断エンジンは、トリガ論理エンジン、モデリングツール、統計ツール、及びリアルタイムで臨床データを検索、供給、及び処理し、その行動推薦を提供する補定ツール（例えば、トリガ論理エンジン２４２、モデリングツール２４４、統計ツール２４６、及び補定ツール２４８）を含み得る。さらに、方法９００に開示のステップは、とりわけ、診断エンジン（例えば、データベース２５２）を使用して、コンピュータの一部であるか、又はコンピュータと通信可能に結合されたデータベースにおけるファイルを検索、編集、及び／又は記憶することを含み得る。本開示に合致する方法は、異なるシーケンスで実行される、方法９００に例示されるステップのすべてではないが少なくともいくつかを含み得る。さらに、本開示に合致する方法は、時間的に重複して、又はほぼ同時に実行される方法９００におけるように、少なくとも２つ以上のステップを含み得る。

ステップ９０２は、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未測定特徴に第１の値を補定することを含む。

ステップ９０４は、インスタンスにおける第１の値を使用するモデルを用いて第１の転帰を評価することを含む。

ステップ９０６は、他の残りの未測定特徴を一定に保持しながら、データセットにおける未測定特徴に第２の値を補定することを含む。

ステップ９０８は、インスタンスにおける第２の値を使用するモデルを用いて第２の転帰を評価することを含む。

ステップ９１０は、第１の転帰と第２の転帰を用いて統計パラメータを判定することを含む。

ステップ９１２は、未測定特徴を、判定された統計パラメータに対応するランキングに割り当てることを含む。

図１０は、様々な実施形態による、マスターデータセットからの類似の患者集団のためのフィルタに基づいて、診断エンジンに関連する特徴を選択する方法１０００におけるステップを例示するフローチャートである。方法１０００は、ネットワークを介して１つ以上のサーバに結合されたクライアントデバイスの任意の１つ（例えば、サーバ１３０のうちの任意の１つ、及びクライアントデバイス１１０の任意の１つ、及びネットワーク１５０）によって少なくとも部分的に実行され得る。例えば、様々な実施形態によれば、サーバは、医療関係者又は医療従事者によって携行する１つ以上の医療デバイス又はポータブルコンピュータデバイスをホストし得る。クライアントデバイス１１０は、医療施設内の労働者又は他の職員、患者を医療施設又は病院の救急治療室に搬送する救急車内の救急救命士、救急車で搬送するか、又は個人の住居又は医療施設から離れた公共の場所で患者を看護する者によって取り扱われ得る。方法１０００におけるステップのうちの少なくともいくつかは、コンピュータのメモリに記憶されたコマンドを実行するプロセッサ（例えば、プロセッサ２１２及びメモリ２２０）を有するコンピュータによって実行され得る。様々な実施形態によれば、ユーザは、クライアントデバイス内のアプリケーションを起動して、ネットワークを介してサーバ内の診断エンジン（例えば、アプリケーション２２２及び診断論理エンジン２４０）にアクセスし得る。診断エンジンは、トリガ論理エンジン、モデリングツール、統計ツール、及びリアルタイムで臨床データを検索、供給、及び処理し、その行動推薦を提供する補定ツール（例えば、トリガ論理エンジン２４２、モデリングツール２４４、統計ツール２４６、及び補定ツール２４８）を含み得る。さらに、方法１０００に開示のステップは、とりわけ、診断エンジン（例えば、データベース２５２）を使用して、コンピュータの一部であるか、又はコンピュータと通信可能に結合されたデータベースにおけるファイルを検索、編集、及び／又は記憶することを含み得る。本開示に合致する方法は、異なるシーケンスで実行される、方法１０００に例示されるステップのすべてではないが少なくともいくつかを含み得る。さらに、本開示に合致する方法は、時間的に重複して、又はほぼ同時に実行される方法１０００におけるように、少なくとも２つ以上のステップを含み得る。

ステップ１００２は、インスタンスからの少なくとも１つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することを含み、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む。

ステップ１００４は、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、１つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することを含む。

ステップ１００６は、未測定特徴を、モデルベースの特徴重要度からの出力に対応するランキングに割り当てることを含む。

図１１は、様々な実施形態による、測定済特徴についてのモデルに基づいて診断エンジンに関連する特徴を選択する方法１１００におけるステップを例示するフローチャートである。方法１１００は、ネットワークを介して１つ以上のサーバに結合されたクライアントデバイスの任意の１つ（例えば、サーバ１３０のうちの任意の１つ、及びクライアントデバイス１１０の任意の１つ、及びネットワーク１５０）によって少なくとも部分的に実行され得る。例えば、様々な実施形態によれば、サーバは、医療関係者又は医療従事者によって携行する１つ以上の医療デバイス又はポータブルコンピュータデバイスをホストし得る。クライアントデバイス１１０は、医療施設内の労働者又は他の職員、患者を医療施設又は病院の救急治療室に搬送する救急車内の救急救命士、救急車で搬送するか、又は個人の住居又は医療施設から離れた公共の場所で患者を看護する者によって取り扱われ得る。方法８００におけるステップのうちの少なくともいくつかは、コンピュータのメモリに記憶されたコマンドを実行するプロセッサ（例えば、プロセッサ２１２及びメモリ２２０）を有するコンピュータによって実行され得る。様々な実施形態によれば、ユーザは、クライアントデバイス内のアプリケーションを起動して、ネットワークを介してサーバ内の診断エンジン（例えば、アプリケーション２２２及び診断論理エンジン２４０）にアクセスし得る。診断エンジンは、トリガ論理エンジン、モデリングツール、統計ツール、及びリアルタイムで臨床データを検索、供給、及び処理し、その行動推薦を提供する補定ツール（例えば、トリガ論理エンジン２４２、モデリングツール２４４、統計ツール２４６、及び補定ツール２４８）を含み得る。さらに、方法１１００に開示のステップは、とりわけ、診断エンジン（例えば、データベース２５２）を使用して、コンピュータの一部であるか、又はコンピュータと通信可能に結合されたデータベースにおけるファイルを検索、編集、及び／又は記憶することを含み得る。本開示に合致する方法は、異なるシーケンスで実行される、方法１１００に例示されるステップのすべてではないが少なくともいくつかを含み得る。さらに、本開示に合致する方法は、時間的に重複して、又はほぼ同時に実行される方法１１００におけるように、少なくとも２つ以上のステップを含み得る。

ステップ１１０２は、既知の転帰に関連する複数のデータセットを含むマスターデータセットにアクセスすることを含む。

ステップ１１０４は、転帰についてのモデルに関連する分散値を判定することを含み、そのモデルは、未測定特徴、及びデータセット内の少なくとも１つの他の別個の特徴に基づく、判定することを含む。

ステップ１１０６は、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することを含む。

ステップ１１０８は、分散値に対する予測の分散の値に従って、未測定特徴にランキングを割り当てることを含む。

図１２は、様々な実施形態による、マスターデータセットから選択された履歴データセットに基づいて、診断エンジンに関連する特徴を選択する方法１２００におけるステップを例示するフローチャートである。方法１２００は、ネットワークを介して１つ以上のサーバに結合されたクライアントデバイスの任意の１つ（例えば、サーバ１３０のうちの任意の１つ、及びクライアントデバイス１１０の任意の１つ、及びネットワーク１５０）によって少なくとも部分的に実行され得る。例えば、様々な実施形態によれば、サーバは、医療関係者又は医療従事者によって携行する１つ以上の医療デバイス又はポータブルコンピュータデバイスをホストし得る。クライアントデバイス１１０は、医療施設内の労働者又は他の職員、患者を医療施設又は病院の救急治療室に搬送する救急車内の救急救命士、救急車で搬送するか、又は個人の住居又は医療施設から離れた公共の場所で患者を看護する者によって取り扱われ得る。方法１２００におけるステップのうちの少なくともいくつかは、コンピュータのメモリに記憶されたコマンドを実行するプロセッサ（例えば、プロセッサ２１２及びメモリ２２０）を有するコンピュータによって実行され得る。様々な実施形態によれば、ユーザは、クライアントデバイス内のアプリケーションを起動して、ネットワークを介してサーバ内の診断エンジン（例えば、アプリケーション２２２及び診断論理エンジン２４０）にアクセスし得る。診断エンジンは、トリガ論理エンジン、モデリングツール、統計ツール、及びリアルタイムで臨床データを検索、供給、及び処理し、その行動推薦を提供する補定ツール（例えば、トリガ論理エンジン２４２、モデリングツール２４４、統計ツール２４６、及び補定ツール２４８）を含み得る。さらに、方法１２００に開示のステップは、とりわけ、診断エンジン（例えば、データベース２５２）を使用して、コンピュータの一部であるか、又はコンピュータと通信可能に結合されたデータベースにおけるファイルを検索、編集、及び／又は記憶することを含み得る。本開示に合致する方法は、異なるシーケンスで実行される、方法１２００に例示されるステップのすべてではないが少なくともいくつかを含み得る。さらに、本開示に合致する方法は、時間的に重複して、又はほぼ同時に実行される方法１２００におけるように、少なくとも２つ以上のステップを含み得る。

ステップ１２０２は、データセットに基づいて決定値を査定するためのルールを判定することを含み、データセットは、インスタンスにおける複数の測定済特徴及びインスタンスにおける未測定特徴について収集された値を含み、ルールは、（１）複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び（２）１つ以上の測定済特徴と合致する（consistent with）。

ステップ１２０４は、複数の転帰値及びデータセットの各々に対する既知の転帰に基づいて、ルールの正確率を判定することを含む。

ステップ１２０６は、未測定特徴を、ルールの正確率に対応するランキングに割り当てることを含む。

図１３は、様々な実施形態による、測定済特徴を使用して、欠落特徴の重要性を予測する多変数モデルを構築する方法１３００におけるステップを例示するフローチャートである。方法１３００は、ネットワークを介して１つ以上のサーバに結合されたクライアントデバイスの任意の１つ（例えば、サーバ１３０のうちの任意の１つ、及びクライアントデバイス１１０の任意の１つ、及びネットワーク１５０）によって少なくとも部分的に実行され得る。例えば、様々な実施形態によれば、サーバは、医療関係者又は医療従事者によって携行する１つ以上の医療デバイス又はポータブルコンピュータデバイスをホストし得る。クライアントデバイス１１０は、医療施設内の労働者又は他の職員、患者を医療施設又は病院の救急治療室に搬送する救急車内の救急救命士、救急車で搬送するか、又は個人の住居又は医療施設から離れた公共の場所で患者を看護する者によって取り扱われ得る。方法１２００におけるステップのうちの少なくともいくつかは、コンピュータのメモリに記憶されたコマンドを実行するプロセッサ（例えば、プロセッサ２１２及びメモリ２２０）を有するコンピュータによって実行され得る。様々な実施形態によれば、ユーザは、クライアントデバイス内のアプリケーションを起動して、ネットワークを介してサーバ内の診断エンジン（例えば、アプリケーション２２２及び診断論理エンジン２４０）にアクセスし得る。診断エンジンは、トリガ論理エンジン、モデリングツール、統計ツール、及びリアルタイムで臨床データを検索、供給、及び処理し、その行動推薦を提供する補定ツール（例えば、トリガ論理エンジン２４２、モデリングツール２４４、統計ツール２４６、及び補定ツール２４８）を含み得る。さらに、方法１３００に開示のステップは、とりわけ、診断エンジン（例えば、データベース２５２）を使用して、コンピュータの一部であるか、又はコンピュータと通信可能に結合されたデータベースにおけるファイルを検索、編集、及び／又は記憶することを含み得る。本開示に合致する方法は、異なるシーケンスで実行される、方法１３００に例示されるステップのすべてではないが少なくともいくつかを含み得る。さらに、本開示に合致する方法は、時間的に重複して、又はほぼ同時に実行される方法１３００におけるように、少なくとも２つ以上のステップを含み得る。

第３の方法の背後にある基本的なアイデアは、与えられた被験者に利用可能な特徴を使用して未測定特徴の重要度を予測するマルチクラスモデルを構築することである。このモデルは、Ｍにおけるすべての特徴についての履歴データセットＨにおけるすべての被験者についてＭにおける特定の特徴によって誘発される分散を推定するデータセットを作成することによって作成される。この方法論は、既に収集された任意の特徴のセットがあるが、信頼性は十分ではない場合に好適である。様々な実施形態では、モデルは、新しい特徴提案が望まれるときに構築又は更新される。未測定特徴のセットが同じである（例えば、バイタルで開始し、ＣＭＰ、ＣＢＣ、特殊なバイオマーカーのような測定を提案する）ときに、様々な実施形態において、モデル構築プロセスは１回のみ行われ得る。

ステップ１３０２は、Ｈにおけるすべての被験者について存在すると想定される特徴に基づいて重要度ベクトルを生成することを含む。様々な実施形態では、ステップ１３０２は、マスターデータセットにおける各被験者ｓについて、関連する時間枠の間に利用可能な最大数の特徴が存在するものに対応する観察Ｘ_ｓを検索することを含む。Ｓは、すべてのｓについてのセットＸ_ｓを指すとする。様々な実施形態では、Ｘ_ｓにおける特徴のサブセットは、Ｐ又はＭのいずれかに属する。Ｐは、存在すると仮定される特徴のセットであるが、Ｍは、Ｐの後に収集されると仮定される特徴のセットであり、Ｍにおいてｋ個の特徴があり得る。様々な実施形態では、ステップ１３０２は、Ｓを使用して転帰Ｙを予測するためにモデルｆを構築し、標準的な方法（例えば、予測間隔の標準誤差、ジャックナイフ推定量、ベイズ推定量、最尤ベースの推定量など）を使用して、Ｓにおけるすべてのｓについての予測ｆ（Ｓ）の分散を計算することを含み得る。分散はｓ×１ベクトルＶであり、各ｓについてのＶにおいてエントリがある。

様々な実施形態では、ステップ１３０２は、Ｓにおけるすべての被験者ｓについて、及び１．．．．ｋのｊについて、Ｍ_ｓのｊ番目のエントリ（Ｍ_ｓ，ｊに対応する）を取り、それを異なる値にランダムに置き換えることを含む。これは、他の被験者の同じ特徴のランダム値を選択するか、又はマルコフモンテカルロ法を使用して残りの他の特徴を用いてこの特徴をモデル化する条件付き分布から引き出し、置き換えられた新しい値を使用し、それがＭ_ｓ，ｊの最初に観測された値であると取り繕い、モデルを使用して予測値を生成し、上記のステップを何度も独立に繰り返し、予測Ｖ_ｊの分散を計算し、その値をＸに基づく分散推定で除算し、その２つの比をＲ_ｓ，ｊ＝Ｖ_ｊ／Ｖ_ｓと示し、Ｍ_ｓのすべてのｊ個のエントリについてステップ（Ｉ）～（ＩＩＩ）を実行することによって行うことができる。結果をＲ_ｓ，ｊで最大から最小に並べ替える。Ｒ_ｓ，ｊが大きいほど、ｊ番目の特徴は被験者に対してより重要である。

ステップ１３０４は、存在する特徴Ｐを使用して、パーソナライズされた特徴重要度のモデルを生成することを含む。具体的には、Ｐが利用可能である履歴データセットにおけるすべての被験者を使用して、Ｐを使用してＲを予測するマルチクラスモデルｇ（多項回帰、ツリーベースの方法、ニューラルネットワークなどを使用）を構築する。

ステップ１３０６は、与えられた被験者ｉに対して、ｇ（Ｐ_ｉ）を介して、Ｍ_ｉにおける特徴のランキングを提供することを含む。

図１４は、様々な実施形態による、特徴の予測可能性に基づいて、選択された特徴のためのサンプリング頻度を判定する方法１４００におけるステップを例示するフローチャートである。方法１４００は、ネットワークを介して１つ以上のサーバに結合されたクライアントデバイスの任意の１つ（例えば、サーバ１３０のうちの任意の１つ、及びクライアントデバイス１１０の任意の１つ、及びネットワーク１５０）によって少なくとも部分的に実行され得る。例えば、様々な実施形態によれば、サーバは、医療関係者又は医療従事者によって携行する１つ以上の医療デバイス又はポータブルコンピュータデバイスをホストし得る。クライアントデバイス１１０は、医療施設における労働者又は他の職員、患者を医療施設又は病院の救急治療室に搬送する救急車における救急救命士、救急車で搬送するか、又は個人の住居又は医療施設から離れた公共の場所で患者を看護する者によって取り扱われ得る。方法１４００におけるステップのうちの少なくともいくつかは、コンピュータのメモリに記憶されたコマンドを実行するプロセッサ（例えば、プロセッサ２１２及びメモリ２２０）を有するコンピュータによって実行され得る。様々な実施形態によれば、ユーザは、クライアントデバイスにおけるアプリケーションを起動して、ネットワークを介してサーバにおける診断エンジン（例えば、アプリケーション２２２及び診断論理エンジン２４０）にアクセスし得る。診断エンジンは、トリガ論理エンジン、モデリングツール、統計ツール、及びリアルタイムで臨床データを検索、供給、及び処理し、その行動推薦を提供する補定ツール（例えば、トリガ論理エンジン２４２、モデリングツール２４４、統計ツール２４６、及び補定ツール２４８）を含み得る。さらに、方法１４００に開示のステップは、とりわけ、診断エンジン（例えば、データベース２５２）を使用して、コンピュータの一部であるか、又はコンピュータと通信可能に結合されたデータベースにおけるファイルを検索、編集、及び／又は記憶することを含み得る。本開示に合致する方法は、異なるシーケンスで実行される、方法１４００に例示されるステップのすべてではないが少なくともいくつかを含み得る。さらに、本開示に合致する方法は、時間的に重複して、又はほぼ同時に実行される方法１４００におけるように、少なくとも２つ以上のステップを含み得る。

この方法の背後にある基本的な考え方は、特徴の将来の値がどの程度予測可能かを推定し、これに基づいて、それらどのくらいの頻度でサンプリングされるべきかを判定することである。直観的に、特徴の将来の値が予測しにくいほど、頻繁にサンプリングされるべきである。この方法は、対応する特徴ベクトルＰ_ｉを有する所与の被験者ｉに対して、以下のように形式的に記載することができる。

ステップ１４０２は、所与の対象ｉについて、観察された特徴Ｐを識別することを含み、欠落特徴はＭであり、Ｐにおいてｊ個の特徴があり、Ｍにおいてｋ個の特徴がある。Ｐ又はＭのいずれかにあり得る所与の特徴のサンプリング頻度ｓを判定したいと想定する。

ステップ１４０４は、特徴行列Ｘを使用して、ｓ_ｔ＋１を予測するモデルｇを構築することを含む。様々な実施形態では、ステップ１４０４は、履歴データセットＨから特徴行列Ｘを選択することを含む。特徴行列Ｘは、Ｐにおける特徴を排他的に含み、最大ｔの各特徴についての時系列観察を含み得る。関連するモデルには、自己回帰モデル、移動平均モデル、マルコフモデルなどを含む。

ステップ１４０６は、ｇ（Ｐ_{０．．．ｔ}）を使用して、ｓ_ｔ＋ｘについての予測を生成することを含む。

ステップ１４０８は、［Ｐ_ｔ，ｇ_{（Ｐ０．．．ｔ）}］の分散又はＣＶを判定することを含む。様々な実施形態では、この時間依存性の変動は、Ｖ_ｓとして示される。様々な実施形態では、上記は、複数の将来値（例えば、ｓ_{ｔ＋ｘ＿１}、ｓ_{ｔ＋ｘ＿２}、．．．ｓ_{ｔ＋ｘ＿ｎ}）を予測することに拡張することができる。様々な実施形態では、ステップ１４０８は、Ｐ及びＭにおける残りの特徴のほとんど又はすべてについて、上記のステップを繰り返すことを含む。

ステップ１４１０は、分散に基づいて、選択された特徴を他の特徴に関してランク付けすることを含む。

ステップ１４１２は、そのランクが上位ｒ番目のパーセンタイルにあるときに、選択された特徴のサンプリング頻度を増加させることを含む。様々な実施形態では、ステップ１４１２は、特徴の（履歴データセットから抽出することができる）ベースラインサンプリング頻度に関してランクに比例する経験的に判定された因子を選択することを含む。特徴のランクが下位ｒ番目のパーセンタイルにあるときに、ステップ１４１２は、（履歴データセットから抽出することができる）ベースラインサンプリング頻度に関してランクに反比例する経験的に判定された因子によってサンプリング頻度を減少させることを提案することを含む。ハードウェアの概要

図１５は、図１及び図２のクライアントデバイス１１０及びサーバ１３０、並びに図８～図１４の方法が実装され得る例示的なコンピュータシステム１５００を例示するブロック図である。所定の態様では、コンピュータシステム１５００は、専用サーバ内にあるか、別のエンティティ内に一体化されているか、又は複数のエンティティにわたって分散されているかのいずれかで、ハードウェア又はソフトウェアとハードウェアの組み合わせを使用して実装され得る。

コンピュータシステム１５００（例えば、クライアントデバイス１１０及びサーバ１３０）は、情報を通信するためのバス１５０８又は他の通信メカニズムと、情報を処理するためのバス１５０８と結合されたプロセッサ１５０２（例えば、プロセッサ２１２）とを含む。一例として、コンピュータシステム１５００は、１つ以上のプロセッサ１５０２で実装され得る。プロセッサ１５０２は、汎用マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、プログラマブル論理デバイス（ＰＬＤ）、コントローラ、状態マシン、ゲート論理、ディスクリートハードウェア構成要素、又は情報の計算又は他の操作を実行することができる他の好適なエンティティであり得る。

コンピュータシステム１５００は、ハードウェアに加えて、ランダムアクセスメモリ（ＲＡＭ）、フラッシュメモリ、読み出し専用メモリ（ＲＯＭ）、プログラマブル読み出し専用メモリ（ＰＲＯＭ）、消去可能ＰＲＯＭ（ＥＰＲＯＭ）、レジスタ、ハードディスク、リムーバブルディスク、ＣＤ－ＲＯＭ、ＤＶＤ、又は、プロセッサ１５０２によって実行される情報及び命令を記憶するためにバス１５０８に結合された任意の他の好適なストレージなどの含まれるメモリ１５０４（例えば、メモリ２２０）に記憶された、問題のコンピュータプログラムのための実行環境を生成するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、又は、それらのうちの１つ以上の組み合わせを含むことができる。プロセッサ１５０２及びメモリ１５０４は、特殊目的論理回路によって補足されるか、又はこれに内蔵され得る。

命令は、メモリ１５０４に記憶され、１つ以上のコンピュータプログラム製品、すなわち、コンピュータシステム１５００による実行又はコンピュータシステム１５００の動作を制御するために、コンピュータ可読媒体上に符号化されたコンピュータプログラム命令のうちの１つ以上のモジュールに実装され、データ指向言語（例えば、ＳＱＬ、ｄＢａｓｅ）、システム言語（例えば、Ｃ、Ｏｂｊｅｃｔｉｖｅ－Ｃ、Ｃ＋、Ａｓｓｅｍｂｌｙ）、アーキテクチャ言語（例えば、Ｊａｖａ、ＮＥＴ）、及びアプリケーション言語（例えば、ＰＨＰ、Ｒｕｂｙ、Ｐｅｒｌ、Ｐｙｔｈｏｎ）などのコンピュータ言語を含むが、これらに限定されない、当業者には周知の任意の方法に従って実装され得る。命令はまた、配列言語、アスペクト指向言語、アセンブリ言語、オーサリング言語、コマンドラインインターフェース言語、コンパイル言語、同時言語、カーリーブラケット言語、データフロー言語、データ構造言語、宣言型言語、難解言語、拡張言語、第４世代言語、機能言語、対話型モード言語、インタプリタ型言語、反復言語、リストベース言語、小言語、論理ベース言語、機械言語、マクロ言語、メタプログラミング言語、マルチパラダイム言語、数値解析、非英語ベース言語、オブジェクト指向クラスベース言語、オブジェクト指向プロトタイプベース言語、オフサイドルール言語、手続き型言語、リフレクティブ言語、ルールベース言語、スクリプト言語、スタックベース言語、同期言語、構文処理言語、視覚言語、ヴィルト言語、ｘｍｌベース言語などのコンピュータ言語で実装され得る。メモリ１５０４はまた、プロセッサ１５０２によって実行される命令の実行中に、一時変数又は他の中間情報を記憶するために使用され得る。

本明細書において説明されるコンピュータプログラムは、必ずしもファイルシステムにおけるファイルに対応しない。プログラムは、他のプログラム又はデータを保持するファイルの一部分（例えば、マークアップ言語文書に記憶される１つ以上のスクリプト）、問題のプログラム専用の単一ファイル、又は複数の協調ファイル（例えば、１つ以上のモジュール、サブプログラム、又はコードの一部分を記憶するファイル）に記憶することができる。コンピュータプログラムは、１つのコンピュータ、又は１つのサイトに位置するか、もしくは複数のサイトに分散され、かつ通信ネットワークによって相互接続される複数のコンピュータで実行されるように展開することができる。本明細書に記載のプロセス及び論理フローは、入力データに対して動作し、出力を生成することによって機能を実行するために、１つ以上のコンピュータプログラムを実行する１つ以上のプログラマブルプロセッサによって実行することができる。

コンピュータシステム１５００は、さらに、情報及び命令を記憶するためにバス１５０８に結合された、磁気ディスク又は光ディスクなどのデータ記憶デバイス１５０６を含む。コンピュータシステム１５００は、入出力モジュール１５１０を介して様々なデバイスに結合され得る。入出力モジュール１５１０は、任意の入出力モジュールであり得る。例示的な入出力モジュール１５１０は、ＵＳＢポートなどのデータポートを含む。入出力モジュール１５１０は、通信モジュール１５１２に接続するように構成されている。例示的な通信モジュール１５１２（例えば、通信モジュール２１８）は、Ｅｔｈｅｒｎｅｔカード及びモデムなどのネットワークインターフェースカードを含む。特定の態様では、入出力モジュール１５１０は、入力デバイス１５１４（例えば、入力デバイス２１４）及び／又は出力デバイス１５１６（例えば、出力デバイス２１６）などの複数のデバイスに接続するように構成されている。例示的な入力デバイス１５１４は、キーボード及びポインティングデバイス、例えば、マウス又はトラックボールを含み、これらにより、ユーザは、コンピュータシステム１５００に入力を提供することができる。触覚入力デバイス、視覚入力デバイス、オーディオ入力デバイス、又は脳コンピュータインターフェースデバイスなどの他の種類の入力デバイス１５１４を使用して、ユーザとの対話を提供することもできる。例えば、ユーザに提供されるフィードバックは、任意の形態の感覚フィードバック、例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバックとすることができ、ユーザからの入力は、音響、音声、触覚、又は脳波入力を含む任意の形態で受信することができる。例示的な出力デバイス１５１６は、ユーザに情報を表示するための、ＬＣＤ（液晶ディスプレイ）モニタなどの表示デバイスを含む。

本開示の一態様によれば、クライアントデバイス１１０及びサーバ１３０は、プロセッサ１５０２がメモリ１５０４に含まれる１つ以上の命令の１つ以上のシーケンスを実行することに応答して、コンピュータシステム１５００を使用して実装することができる。このような命令は、データ記憶デバイス１５０６のような別の機械可読媒体からメモリ１５０４に読み込まれ得る。メインメモリ１５０４に含まれる命令のシーケンスの実行により、プロセッサ１５０２は、本明細書に記載のプロセスステップを実行する。また、マルチ処理構成における１つ以上のプロセッサを用いて、メモリ１５０４に含まれる命令のシーケンスを実行し得る。別の態様では、本開示の様々な態様を実装するために、ハードワイヤード回路を、ソフトウェア命令の代わりに、又はそれと組み合わせて使用してもよい。したがって、本開示の態様は、ハードウェア回路及びソフトウェアの任意の特定の組み合わせに限定されない。

本明細書に記載の主題の様々な態様は、バックエンド構成要素、例えば、データサーバを含むか、ミドルウェア構成要素、例えば、アプリケーションサーバを含むか、又はフロントエンド構成要素、例えば、ユーザが本明細書に記載の主題の実施態様と対話することができるグラフィカルユーザインターフェース又はウェブブラウザを有するクライアントコンピュータ、又は１つ以上のこのようなバックエンド、ミドルウェア、又はフロントエンド構成要素の任意の組み合わせを含むコンピューティングシステムにおいて実装することができる。システムの構成要素は、デジタルデータ通信の任意の形態又は媒体、例えば通信ネットワークによって相互接続することができる。通信ネットワーク（例えば、ネットワーク１５０）は、例えば、ＬＡＮ、ＷＡＮ、インターネットなどのうちの任意の１つ以上を含むことができる。さらに、通信ネットワークは、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スターバスネットワーク、ツリー又は階層ネットワークなどを含む、ネットワークトポロジのうちの任意の１つ以上を含むことができるが、これらに限定されない。通信モジュールは、例えば、モデム又はＥｔｈｅｒｎｅｔカードとすることができる。

コンピュータシステム１５００は、クライアント及びサーバを含むことができる。クライアントとサーバは、一般的に互いに離れており、展開的には通信ネットワークを介して対話する。クライアントとサーバの関係は、それぞれのコンピュータ上で実行され、互いにクライアント－サーバの関係を有するコンピュータプログラムにより生じる。コンピュータシステム１５００は、例えば、限定されるものではないが、デスクトップコンピュータ、ラップトップコンピュータ、又はタブレットコンピュータとすることができる。コンピュータシステム１５００はまた、例えば、携帯電話、ＰＤＡ、モバイルオーディオプレーヤ、グローバルポジショニングシステム（ＧＰＳ）レシーバ、ビデオゲームコンソール、及び／又はテレビジョンセットトップボックスなどの別のデバイスに組み込むことができるが、これらに限定されない。

本明細書で使用される用語「機械可読記憶媒体」又は「コンピュータ可読媒体」は、実行のためにプロセッサ１５０２に命令を提供することに参加する任意の媒体を指す。このような媒体は、限定されるものではないが、不揮発性媒体、揮発性媒体、及び伝送媒体を含む多くの形態をとり得る。不揮発性媒体は、例えば、データ記憶デバイス１５０６のような光ディスク又は磁気ディスクを含む。揮発性媒体は、メモリ１５０４のようなダイナミックメモリを含む。伝送媒体は、バス１５０８を構成するワイヤを含む、同軸ケーブル、銅線、及び光ファイバを含む。機械可読媒体の一般的な形態は、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤ、他の任意の光学媒体、パンチカード、紙テープ、穴のパターンを有する任意の他の物理媒体、ＲＡＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＦＬＡＳＨ（登録商標）ＥＰＲＯＭ、他の任意のメモリチップもしくはカートリッジ、又はコンピュータが読み出すことができる任意の他の媒体を含む。機械可読記憶媒体は、機械可読記憶デバイス、機械可読記憶基板、メモリデバイス、機械可読伝搬信号に影響を与える物質の組成、又はそれらの１つ以上の組み合わせとすることができる。

本明細書中で使用される場合、項目のうちの任意のものを分離する用語「及び」又は「又は」と共に、一連の項目に先行する語句「少なくとも１つ」は、リストの各メンバー（すなわち、各項目）ではなく、リスト全体を修正する。語句「少なくとも１つ」は、少なくとも１つの項目の選択を必要とせず、むしろ、その語句は、項目のうちの任意の１つの少なくとも１つ、及び／又は項目の任意の組み合わせの少なくとも１つ、及び／又は項目の各々の少なくとも１つを含む意味を可能にする。一例として、語句「Ａ、Ｂ、及びＣの少なくとも１つ」又は「Ａ、Ｂ、又はＣの少なくとも１つ」は、各々、Ａのみ、Ｂのみ、又はＣのみ、Ａ、Ｂ、及びＣの任意の組み合わせ、及び／又はＡ、Ｂ、及びＣの各々の少なくとも１つを指す。

「含む」、「有する」などの用語が明細書又は特許請求の範囲において使用される限りにおいて、このような用語は、「含む」が請求項における移行句として用いられるときに解釈されるように、用語「含む」と同様に包括的であると意図されている。本明細書において、文言「例示的」は、「例、インスタンス、又は例示としての役割を果たす」ことを意味するために使用される。本明細書において、「例示的」として記載の任意の実施形態は、必ずしも他の実施形態よりも好ましいか、又は有利であると解釈される必要はない。

単数形の要素への言及は、具体的に述べられていない限り、「１つ及びただ１つ」を意味することを意図するものではなく、むしろ「１つ以上」を意味することを意図している。当業者に公知であるか、又は後に当業者に知られるようになる本開示全体を通して記載の様々な構成の要素に対するすべての構造的及び機能的等価物は、参照により本明細書に組み込まれ、主題の技術に包含されると意図されている。さらに、本明細書に開示されているものは、そのような開示が上記の説明に明示的に規定されているかどうかにかかわらず、公衆専用であると意図されていない。

本明細書は多くの具体物を含んでいるが、これらは、特許請求の範囲に記載されたものの範囲を限定するものではなく、むしろ主題の特定の実装形態の説明として解釈されるべきである。別々の実施形態の文脈において本明細書に記載される所定の特徴は、単一の実施形態において組み合わせて実装することができる。逆に、単一の実施形態の文脈において記載の様々な特徴は、複数の実施形態において別々に、又は任意の好適なサブコンビネーションで実装することができる。さらに、特徴は、所定の組み合わせにおいて作用するものとして上述され、最初にそのようなものとして請求項に記載されることさえあるが、請求項に記載された組み合わせからの１つ以上の特徴は、場合によっては、組み合わせから切り出され得、請求項に記載された組み合わせは、サブコンビネーション又はサブコンビネーションの変形例に向けられ得る。

本明細書の主題は、特定の態様の観点から記載されてきたが、他の態様を実装することができ、以下の特許請求の範囲の範囲内にある。例えば、動作が図面に特定の順序で示されているが、これは、所望の結果を達成するために、このような動作が、示された特定の順序で、又は逐次的順序で、実行されること、又は、例示されたすべての動作が実行されることを必要とするものとして理解されるべきではない。請求項に規定された行動は、異なる順序で実行することができ、なお所望の結果を達成することができる。一例として、添付の図面に示されたプロセスは、所望の結果を達成するために、示された特定の順序、又は逐次的順序を必ずしも必要としない。所定の状況下では、マルチタスク及び並列処理が有利であり得る。さらに、上述の態様における様々なシステム構成要素の分離は、すべての態様においてそのような分離を必要とするものとして理解されるべきではなく、記載のプログラム構成要素及びシステムは、一般的に、単一のソフトウェア製品内に一体化されるか、又は複数のソフトウェア製品内にパッケージ化され得ると理解されたい。他の変形例は、以下の特許請求の範囲の範囲内である。

実施形態の規定
（実施形態１）少なくとも１つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法であって、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未測定特徴に第１の値を補定することと、インスタンスにおける第１の値を使用するモデルを用いて第１の転帰を評価することと、他の残りの未測定特徴を一定に保持しながら、インスタンスおける未測定特徴に第２の値を補定することと、インスタンスにおける第２の値を使用するモデルを用いて第２の転帰を評価することと、第１の転帰と第２の転帰を用いて統計パラメータを判定することと、未測定特徴を、統計パラメータに対応するランキングに割り当てることと、を含む、方法が提供される。

（実施形態２）インスタンスからの少なくとも１つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することをさらに含み、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、実施形態１に記載の方法。

（実施形態３）未測定特徴を、統計パラメータに対応するランキングに割り当てることは、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、１つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することを含む、実施形態１又は２に記載の方法。

（実施形態４）第１の転帰と第２の転帰を用いて統計パラメータを判定することは、既知の転帰と関連する複数のデータセットを含むマスターデータセットにアクセスすることを含む、実施形態１～３のいずれか１つに記載の方法。

（実施形態５）第１の転帰と第２の転帰を用いて統計パラメータを判定することは、転帰についてのモデルに関連する分散値を判定することであって、モデルは、未測定特徴及びデータセットにおける少なくとも１つの他の別個の特徴に基づく、判定することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することと、を含む、実施形態１～４のいずれか１つに記載の方法。

（実施形態６）第１の転帰と第２の転帰を用いて統計パラメータを判定することは、データセットに基づいて決定値を査定するためのルールを判定することを含み、データセットは、インスタンスにおける複数の測定済特徴及びインスタンスにおける未測定特徴について収集された値を含み、ルールは、（１）複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び（２）１つ以上の測定済特徴と一致する、実施形態１～５のいずれか１つに記載の方法。

（実施形態７）第１の転帰と第２の転帰を用いて統計パラメータを判定することは、複数の転帰値及び複数のデータセットの各々についての既知の転帰に基づいて、第１の値を未測定特徴に補定するためのルールの正解率を判定することを含む、実施形態１～６のいずれか１つに記載の方法。

（実施形態８）統計パラメータを判定することは、第１の転帰及び第２の転帰の時間依存分散を判定することを含む、実施形態１～７のいずれか１つに記載の方法。

（実施形態９）統計パラメータに対応するランキングに基づいて、未測定特徴のサンプリング頻度を選択することをさらに含む、実施形態１～８のいずれか１つに記載の方法。

（実施形態１０）センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することをさらに含む、実施形態１～９のいずれか１つに記載の方法。

（実施形態１１）少なくとも１つの特徴が測定されているインスタンスについて未測定特徴をランク付けするためのシステムであって、命令を記憶するメモリと、メモリと通信可能に結合された１つ以上のプロセッサであって、１つ以上のプロセッサは命令を実行して、システムに、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未測定特徴に第１の値を補定することと、インスタンスにおける第１の値を使用するモデルを用いて第１の転帰を評価することと、他の残りの未測定特徴を一定に保持しながら、インスタンスおける未測定特徴に第２の値を補定することと、インスタンスにおける第２の値を使用するモデルを用いて第２の転帰を評価することと、第１の転帰と第２の転帰を用いて統計パラメータを判定することと、未測定特徴を、統計パラメータに対応するランキングに割り当てることと、インスタンスからの少なくとも１つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することであって、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、選択することと、を行わせるように構成されている、システムが提供される。

（実施形態１２）未測定特徴を、統計パラメータに対応するランキングに割り当てるために、１つ以上のプロセッサは命令を実行して、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、１つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することを行う、実施形態１１に記載のシステム。

（実施形態１３）第１の転帰と第２の転帰を用いて統計パラメータを判定するために、１つ以上のプロセッサは命令を実行して、既知の転帰と関連する複数のデータセットを含むマスターデータセットにアクセスすることを行う、実施形態１１又は１２に記載のシステム。

（実施形態１４）第１の転帰と第２の転帰を用いて統計パラメータを判定するために、１つ以上のプロセッサは命令を実行して、転帰についてのモデルに関連する分散値を判定することであって、モデルは、未測定特徴及びデータセットにおける少なくとも１つの他の別個の特徴に基づく、判定することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することとを行う、実施形態１１～１３のいずれか１つに記載のシステム。

（実施形態１５）第１の転帰と第２の転帰を用いて統計パラメータを判定するために、１つ以上のプロセッサは命令を実行して、データセットに基づいて決定値を査定するためのルールを判定することを含み、データセットは、インスタンスにおける複数の測定済特徴及びインスタンスにおける未測定特徴について収集された値を含み、ルールは、（１）複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び（２）１つ以上の測定済特徴と合致する、実施形態１１～１４のいずれか１つに記載のシステム。

（実施形態１６）命令を記憶する非一時的なコンピュータ可読媒体であって、命令は、コンピュータによって実行されるときに、コンピュータに、少なくとも１つの特徴が測定されているインスタンスに対して未測定特徴をランク付けするための方法を実行させ、方法は、他の残りの未測定特徴を一定に保持しながら、インスタンスにおける未測定特徴に第１の値を補定することと、インスタンスにおける第１の値を使用するモデルを用いて第１の転帰を評価することと、他の残りの未測定特徴を一定に保持しながら、インスタンスおける未測定特徴に第２の値を補定することと、インスタンスにおける第２の値を使用するモデルを用いて第２の転帰を評価することと、第１の転帰と第２の転帰を用いて統計パラメータを判定することと、未測定特徴を、統計パラメータに対応するランキングに割り当てることと、インスタンスからの少なくとも１つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することであって、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、選択することと、を含み、未測定特徴を、統計パラメータに対応するランキングに割り当てることは、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、１つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することを含む、非一時的なコンピュータ可読媒体が提供される。

（実施形態１７）方法において第１の転帰と第２の転帰を用いて統計パラメータを判定することは、既知の転帰と関連する複数のデータセットを含むマスターデータセットにアクセスすることを含む、実施形態１６に記載の非一時的なコンピュータ可読媒体。

（実施形態１８）方法において第１の転帰と第２の転帰を用いて統計パラメータを判定することは、転帰についてのモデルに関連する分散値を判定することであって、モデルは、未測定特徴及びデータセットにおける少なくとも１つの他の別個の特徴に基づく、判定することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することと、を含む、実施形態１６又は１７に記載の非一時的なコンピュータ可読媒体。

（実施形態１９）方法において第１の転帰と第２の転帰を用いて統計パラメータを判定することは、データセットに基づいて決定値を査定するためのルールを判定することを含み、データセットは、インスタンスにおける複数の測定済特徴及びインスタンスにおける未測定特徴について収集された値を含み、ルールは、（１）複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び（２）１つ以上の測定済特徴と合致する、実施形態１６～１８のいずれか１つに記載の非一時的なコンピュータ可読媒体。

（実施形態２０）方法において第１の転帰と第２の転帰を用いて統計パラメータを判定することは、複数の転帰値及び複数のデータセットの各々についての既知の転帰に基づいて、第１の値を未測定特徴に補定するためのルールの正解率を判定することを含む、実施形態１６～１９のいずれか１つに記載の非一時的なコンピュータ可読媒体。

（実施形態２１）少なくとも１つの特徴が測定されているインスタンスに対して未測定特徴をランク付けするため方法であって、インスタンスからの少なくとも１つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することであって、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、選択することと、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、１つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することと、未測定特徴を、モデルベースの特徴重要度からの出力に対応するランキングに割り当てることと、を含む、方法が提供される。

（実施形態２２）マスターデータセットからフィルタリングされたデータセットを選択することは、履歴データセットの少なくとも一部分を選択することを含む、実施形態２１に記載の方法。

（実施形態２３）フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、１つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することは、新しい特徴を用いてモデルを構築又は更新することを含む、実施形態２１又は２２に記載の方法。

（実施形態２４）フィルタリングされたデータセットを選択することは、既知の転帰を用いて統計パラメータを判定することをさらに含む、実施形態２１～２３のいずれか１つに記載の方法。

（実施形態２５）フィルタリングされたデータセットを選択することは、第１の転帰と第２の転帰を用いて統計パラメータを判定することであって、転帰についてのモデルに関連する分散値を判定することであって、モデルは、未測定特徴及びデータセットにおける少なくとも１つの他の別個の特徴に基づく、判定することを含む、判定することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することと、を含む、実施形態１～２４のいずれか１つに記載の方法。

（実施形態２６）フィルタリングされたデータセットに基づいて、決定値を査定するためのルールを判定することをさらに含む、実施形態２１～２５のいずれか１つに記載の方法。

（実施形態２７）複数の転帰を用いて統計パラメータを判定することと、複数の結果に基づいて、未測定特徴に第１の値を補定するためのルールの正解率を判定することと、をさらに含む、実施形態２１～２６のいずれか１つに記載の方法。

（実施形態２８）第１の転帰及び第２の転帰の時間依存分散を判定することをさらに含む、実施形態２１～２７のいずれか１つに記載の方法。

（実施形態２９）統計パラメータに対応するランキングに基づいて、未測定特徴のサンプリング頻度を選択することをさらに含む、実施形態２１～２８のいずれか１つに記載の方法。

（実施形態３０）センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することをさらに含む、実施形態２１～２９のいずれか１つに記載の方法。

（実施形態３１）少なくとも１つの特徴が測定されているインスタンスに対して未測定特徴をランク付けするためシステムであって、命令を記憶するメモリと、メモリに通信可能に結合された１つ以上のプロセッサと、を含み、１つ以上のプロセッサは命令を実行してシステムに、インスタンスからの少なくとも１つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することであって、マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、選択することと、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、１つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することと、未測定特徴を、モデルベースの特徴重要度からの出力に対応するランキングに割り当てることと、を行わせるように構成されている、システム。

（実施形態３２）マスターデータセットからフィルタリングされたデータセットを選択するために、１つ以上のプロセッサは命令をさらに実行して、履歴データセットの少なくとも一部分を選択することを行う、実施形態３１に記載のシステム。

（実施形態３３）フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、１つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別するために、１つ以上のプロセッサは命令をさらに実行して、新しい特徴を用いてモデルを構築又は更新することを行う、実施形態３１又は３２に記載のシステム。

（実施形態３４）フィルタリングされたデータセットを選択するために、１つ以上のプロセッサは命令をさらに実行して、既知の転帰を用いて統計パラメータを判定することを行う、実施形態３１～３３のいずれか１つに記載のシステム。

（実施形態３５）フィルタリングされたデータセットを選択するために、１つ以上のプロセッサは命令を実行して、第１の転帰と第２の転帰を用いて統計パラメータを判定することと、転帰についてのモデルに関連する分散値を判定することであって、モデルは、未測定特徴及びデータセットにおける少なくとも１つの他の別個の特徴に基づく、判定することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することと、を行う、実施形態３１～３４のいずれか１つに記載のシステム。

（実施形態３６）１つ以上のプロセッサは命令をさらに実行して、フィルタリングされたデータセットに基づいて、決定値を査定するためのルールを判定することを行う、実施形態３１～３５のいずれか１つに記載のシステム。

（実施形態３７）１つ以上のプロセッサは命令をさらに実行して、複数の転帰を用いて統計パラメータを判定し、複数の転帰に基づいて未測定特徴に第１の値を補定するためのルールの正解率を判定することを行う、実施形態３１～３６のうちのいずれか１つのシステム。

（実施形態３８）１つ以上のプロセッサは命令をさらに実行して、第１の転帰及び第２の転帰の時間依存分散を判定することを行う、実施形態３１～３７のいずれか１つに記載のシステム。

（実施形態３９）１つ以上のプロセッサは命令をさらに実行して、未測定特徴のランクに基づいて、未測定特徴のサンプリング頻度を低減することを行う、実施形態３１～３８のいずれか１つに記載のシステム。

（実施形態４０）１つ以上のプロセッサは命令をさらに実行して、センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することを行う、実施形態３１～３９のいずれか１つに記載のシステム。

（実施形態４１）少なくとも１つの特徴が測定されているインスタンスに対して未測定特徴をランク付けするための方法であって、マスターデータセットにアクセスすることであって、マスターデータセットは、既知の転帰に関連する複数のデータセットを含む、アクセスすることと、転帰についてのモデルに関連する分散値を判定することであって、そのモデルは、未測定特徴、及びデータセットにおける少なくとも１つの他の別個の特徴に基づく、判定することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することと、未測定特徴を、分散値に対する予測の分散の値に従ってランキングに割り当てることと、を含む、方法が提供される。

（実施形態４２）マスターデータセットにアクセスすることは、履歴データセットの少なくとも一部分を選択することを含む、実施形態４１に記載の方法。

（実施形態４３）予測の分散を評価することは、新しい特徴を用いてモデルを構築又は更新することを含む、実施形態４１及び４２の方法。

（実施形態４４）転帰についてのモデルに関連する分散値を判定することは、マスターデータセットからフィルタリングされたデータセットを選択することを含む、実施形態４１～４３のいずれか１つに記載の方法。

（実施形態４５）転帰についてのモデルに関連する分散値を判定することは、未測定特徴とデータセットにおける少なくとも１つの他の別個の特徴に基づいてモデルを選択することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することとを含む、実施形態４１～４４のいずれか１つに記載の方法。

（実施形態４６）マスターデータセットに基づいて、決定値を査定するためのルールを判定することをさらに含む、実施形態４１～４５のいずれか１つに記載の方法。

（実施形態４７）既知の転帰に基づいて、未測定特徴に第１の値を補定するためのルールの正解率を判定することをさらに含む、実施形態４１～４６のいずれか一項に記載の方法。

（実施形態４８）第１の転帰及び第２の転帰の時間依存分散を判定することをさらに含む、実施形態４１～４７のいずれか１つに記載の方法。

（実施形態４９）統計パラメータに対応するランキングに基づいて、未測定特徴のサンプリング頻度を選択することをさらに含む、実施形態４１～４８のいずれか１つに記載の方法。

（実施形態５０）センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することをさらに含む、実施形態４１～４９のいずれか１つに記載の方法。

（実施形態５１）少なくとも１つの特徴が測定されているインスタンスに対して未測定特徴をランク付けするための方法であって、命令を記憶するメモリと、メモリと通信可能に結合された１つ以上のプロセッサであって、１つ以上のプロセッサは命令を実行して、システムに、マスターデータセットにアクセスすることであって、マスターデータセットは、既知の転帰に関連する複数のデータセットを含む、アクセスすることと、転帰についてのモデルに関連する分散値を判定することであって、そのモデルは、未測定特徴、及びデータセットにおける少なくとも１つの他の別個の特徴に基づく、判定することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することと、未測定特徴を、分散値に対する予測の分散の値に従ってランキングに割り当てることと、を行わせるように構成されている、システム。

（実施形態５２）マスターデータセットにアクセスするために、１つ以上のプロセッサは命令を実行して、履歴データセットの少なくとも一部分を選択することを行う、実施形態５１に記載のシステム。

（実施形態５３）予測の分散を評価するために、１つ以上のプロセッサは命令を実行して、新しい特徴を用いてモデルを構築又は更新することを行う、実施形態５１及び５２に記載のシステム。

（実施形態５４）転帰についてのモデルに関連する分散値を判定するために、１つ以上のプロセッサは命令を実行して、マスターデータセットからフィルタリングされたデータセットを選択することを行う、実施形態５１～５３のいずれか１つに記載のシステム。

（実施形態５５）転帰についてのモデルに関連する分散値を判定するために、１つ以上のプロセッサは命令を実行して、未測定特徴とデータセットにおける少なくとも１つの他の別個の特徴に基づいてモデルを選択することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することとを行う、実施形態５１～５４のいずれか１つに記載のシステム。

（実施形態５６）１つ以上のプロセッサは命令をさらに実行して、マスターデータセットに基づいて、決定値を査定するためのルールを判定することを行う、実施形態５１～５５のいずれか１つに記載のシステム。

（実施形態５７）１つ以上のプロセッサは命令をさらに実行して、既知の転帰に基づいて、未測定特徴に第１の値を補定するためのルールの正解率を判定することを行う、実施形態５１～５６のいずれか１つに記載のシステム。

（実施形態５８）１つ以上のプロセッサは命令をさらに実行して、第１の転帰及び第２の転帰の時間依存分散を判定することを行う、実施形態５１～５７のいずれか１つに記載のシステム。

（実施形態５９）１つ以上のプロセッサは命令をさらに実行して、未測定特徴のランクに基づいて、未測定特徴のサンプリング頻度を低減することを行う、実施形態５１～５８のいずれか１つに記載のシステム。

（実施形態６０）１つ以上のプロセッサは命令をさらに実行して、センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することを行う、実施形態５１～５９のいずれか１つに記載のシステム。

（実施形態６１）少なくとも１つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法であって、データセットに基づいて決定値を査定するためのルールを判定することであって、データセットは、インスタンスにおける複数の測定済特徴及びインスタンスにおける未測定特徴について収集された値を含み、ルールは、（１）複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び（２）１つ以上の測定済特徴と合致する、判定することと、複数の転帰値とデータベースの各々についての既知の転帰に基づいて、ルールの正解率を判定することと、未測定特徴を、ルールの正解率に対応するランキングを割り当てることとと、を含む、方法が提供される。

（実施形態６２）データセットに基づいて決定値を査定することは、マスターデータセットにアクセスすることを含む、実施形態６１に記載の方法。

（実施形態６３）複数の転帰値に基づいてルールの正解率を判定することは、新しい特徴を用いてモデルを構築又は更新することを含む、実施形態６１又は６２に記載の方法。

（実施形態６４）データセットに基づいて決定値を査定するためのルールの正解率を判定することは、転帰についてのモデルに関連する分散値を判定することをさらに含む、実施形態６１～６３のうちのいずれか１つの方法。

（実施形態６５）データセットに基づいて決定値を査定するためのルールを判定することは、未測定特徴とデータセットにおける少なくとも１つの他の別個の特徴に基づいてモデルを選択することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することとを行う、実施形態６１～６４のいずれか１つに記載の方法。

（実施形態６６）履歴データセットから選択されたマスターデータに基づいて決定値を評価するためのルールを判定することをさらに含む、実施形態６１～６５のいずれか１つに記載の方法。

（実施形態６７）ルールの正解率を判定することは、未測定特徴を用いてルールについてのモデルを更新することを行う、実施形態６１～６６のいずれか１つに記載の方法。

（実施形態６８）第１の転帰及び第２の転帰の時間依存分散を判定することをさらに含む、実施形態６１～６７のいずれか１つに記載の方法。

（実施形態６９）統計パラメータに対応するランキングに基づいて、未測定特徴のサンプリング頻度を選択することをさらに含む、実施形態６１～６８のいずれか１つに記載の方法。

（実施形態７０）センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することをさらに含む、実施形態６１～６９のいずれか１つに記載の方法。

（実施形態７１）少なくとも１つの特徴が測定されているインスタンスについて未測定特徴をランク付けするためのシステムであって命令を記憶するメモリと、メモリと通信可能に結合された１つ以上のプロセッサであって、１つ以上のプロセッサは命令を実行して、システムに、、データセットに基づいて決定値を査定するためのルールを判定することであって、データセットは、インスタンスにおける複数の測定済特徴及びインスタンスにおける未測定特徴について収集された値を含み、ルールは、（１）複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び（２）１つ以上の測定済特徴と合致する、判定することと、複数の転帰値とデータベースの各々についての既知の転帰に基づいて、ルールの正解率を判定することと、未測定特徴を、ルールの正解率に対応するランキングを割り当てることとと、を行わせるように構成されている、システム。

（実施形態７２）データセットに基づいて決定値を査定するために、１つ以上のプロセッサは命令を実行して、マスターデータセットにアクセスすることを行う、実施形態７１に記載の方法。

（実施形態７３）複数の転帰値に基づいてルールの正解率を判定するために、１つ以上のプロセッサは命令を実行して、新しい特徴を用いてモデルを構築又は更新する、実施形態７１又は７２のシステム。

（実施形態７４）データセットに基づいて決定値を査定するためのルールの正解率を判定するために、１つ以上のプロセッサは命令をさらに実行して、転帰についてのモデルに関連する分散値を判定することを行う、実施形態７１～７３のうちのいずれか１つのシステム。

（実施形態７５）データセットに基づいて決定値をアクセスするためのルールを判定するために、１つ以上のプロセッサは命令を実行して、未測定特徴とデータセットにおける少なくとも１つの他の別個の特徴に基づいてモデルを選択することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することとを行う、実施形態７１～７４のいずれか１つに記載のシステム。

（実施形態７６）１つ以上のプロセッサは命令をさらに実行して、履歴データセットから選択されたマスターデータセットに基づいて、決定値を評価するためのルールを判定することを行う、実施形態７１～７５のうちのいずれか１つのシステム。

（実施形態７７）ルールの正解率を判定するために、１つ以上のプロセッサは命令を実行して、未測定特徴を用いてルールについてのモデルを更新することを行う、実施形態７１～７６のいずれか１つに記載のシステム。

（実施形態７８）１つ以上のプロセッサは命令をさらに実行して、第１の転帰及び第２の転帰の時間依存分散を判定することを行う、実施形態７１～７７のいずれか１つに記載のシステム。

（実施形態７９）１つ以上のプロセッサは命令をさらに実行して、未測定特徴のランクに基づいて、未測定特徴のサンプリング頻度を低減することを行う、実施形態７１～７８のいずれか１つに記載のシステム。

（実施形態８０）１つ以上のプロセッサは命令をさらに実行して、センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することを行う、実施形態７１～７９のいずれか１つに記載のシステム。

（実施形態８１）特徴の予測可能性に基づいて選択された特徴についてのサンプリング頻度を判定する方法であって、観察された特徴のセットと欠落特徴のセットを識別することと、履歴データセットから選択された特徴行列を使用して、選択された特徴サンプリング頻度を予測するモデルを構築することと、モデルを使用して、サンプリング頻度についての予測を生成することと、複数の時間予測から選択された特徴の分散を判定することと、分散に基づいて他の特徴に対して選択された特徴をランク付けすることと、特徴のランクが予め判定された上位パーセンタイルにあるときに選択された特徴のサンプリング頻度を増加させることと、を含む、方法が提供される。

（実施形態８２）観察された特徴を含む履歴データセットにアクセスすることをさらに含む、実施形態８１に記載の方法。

（実施形態８３）サンプリング頻度を予測するモデルを構築することは、予測の分散を評価することを含む、実施形態８１又は８２に記載のシステム。

（実施形態８４）選択された特徴の分散を判定することは、マスターデータセットからフィルタリングされたデータセットを選択することを含む、実施形態８１～８３のいずれか１つに記載の方法。

（実施形態８５）選択された値の分散を判定することは、観察された特徴とデータセットにおける少なくとも１つの他の別個の特徴に基づいてモデルを選択することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することとを含む、実施形態８１～８４のいずれか１つに記載の方法。

（実施形態８６）サンプリング頻度に基づいて、決定値を評価するためのルールを判定することをさらに含む、実施形態８１～８５のいずれか１つに記載の方法。

（実施形態８７）モデルに基づいて、欠落特徴に第１の値を補定するためのルールの正解率を判定することをさらに含む、実施形態８１～８６のいずれか一項に記載の方法。

（実施形態８８）第１の転帰及び第２の転帰の時間依存分散を判定することをさらに含む、実施形態８１～８７のいずれか１つに記載の方法。

（実施形態８９）未測定特徴のランクに基づいて、未測定特徴のサンプリング頻度を低減することをさらに含む、実施形態８１～８８のいずれか１つに記載の方法。

（実施形態９０）センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することをさらに含む、実施形態８１～８９のいずれか１つに記載の方法。

（実施形態９１）特徴の予測可能性に基づいて選択された特徴についてのサンプリング頻度を判定するシステムであって、命令を記憶するメモリと、メモリに通信可能に結合された１つ以上のプロセッサと、を含み、１つ以上のプロセッサは命令を実行してシステムに、記憶命令、及びメモリと通信するように結合された１つ以上のプロセッサを含み、命令を実行して、観察された特徴のセットと欠落特徴のセットを識別することと、履歴データセットから選択された特徴行列を使用して、選択された特徴サンプリング頻度を予測するモデルを構築することと、モデルを使用して、サンプリング頻度についての予測を生成することと、複数の時間予測から選択された特徴の分散を判定することと、分散に基づいて他の特徴に対して選択された特徴をランク付けすることと、特徴のランクが予め判定された上位パーセンタイルにあるときに選択された特徴のサンプリング頻度を増加させることと、を行わせるように構成されている、システム。

（実施形態９２）１つ以上のプロセッサは命令をさらに実行して、観察された特徴を含む履歴データセットにアクセスすることを行う、実施形態９１に記載のシステム。

（実施形態９３）サンプリング頻度を予測するモデルを構築するために、１つ以上のプロセッサは命令をさらに実行して、予測の分散を評価することを行う、実施形態９１又は９２に記載のシステム。

（実施形態９４）選択された特徴の分散を判定するために、１つ以上のプロセッサは、マスターデータセットからフィルタリングされたデータセットを選択することを行う、実施形態９１～９３のいずれか１つに記載のシステム。

（実施形態９５）選択された値の分散を判定するために、１つ以上のプロセッサは命令を実行して、観察された特徴とデータセットにおける少なくとも１つの他の別個の特徴に基づいてモデルを選択することと、データセットにおける未測定特徴についての複数の補定値を使用するモデルを用いて転帰についての予測の分散を評価することとを行う、実施形態９１～９４のいずれか１つに記載のシステム。

（実施形態９６）１つ以上のプロセッサは命令をさらに実行して、サンプリング頻度に基づいて、決定値を評価するためのルールを判定することを行う、実施形態９１～９５のいずれか１つに記載のシステム。

（実施形態９７）１つ以上のプロセッサは命令をさらに実行して、モデルに基づいて、欠落特徴に第１の値を補定するためのルールの正解率を判定することを行う、実施形態９１～９６のいずれか１つに記載のシステム。

（実施形態９８）１つ以上のプロセッサは命令をさらに実行して、第１の転帰及び第２の転帰の時間依存分散を判定することを行う、実施形態９１～９７のいずれか１つに記載のシステム。

（実施形態９９）１つ以上のプロセッサは命令をさらに実行して、未測定特徴のランクに基づいて、未測定特徴のサンプリング頻度を低減することを行う、実施形態９１～９８のいずれか１つに記載のシステム。

（実施形態１００）１つ以上のプロセッサは命令をさらに実行して、センサデバイスの正解率及び適合率、並びに未測定特徴のランキングに基づいて、未測定特徴から測定値を収集するセンサデバイスを選択することを行う、実施形態９１～９９のいずれか１つに記載のシステム。

（実施形態１０１）他の第１の残りの未測定特徴は、他の第２の残りの未測定特徴と同じである、実施形態１～１０のいずれか１つに記載の方法。

（実施形態１０２）他の第１の残りの未測定特徴は、他の第２の残りの未測定特徴と同じである、実施形態１１～１５のいずれか１つに記載のシステム。

（実施形態１０３）他の第１の残りの未測定特徴は、他の第２の残りの未測定特徴と同じである、実施形態１６～２０のいずれか１つに記載の非一時的なコンピュータ可読媒体。

Claims

少なくとも１つの特徴が測定されているインスタンスについて未測定特徴をランク付けするための方法であって、
他の第１の残りの未測定特徴を一定に保持しながら、前記インスタンスにおける前記未測定特徴に第１の値を補定することと、
前記インスタンスにおける前記第１の値を使用するモデルを用いて第１の転帰を評価することと、
他の第２の残りの未測定特徴を一定に保持しながら、前記インスタンスおける前記未測定特徴に第２の値を補定することと、
前記インスタンスにおける前記第２の値を使用する前記モデルを用いて第２の転帰を評価することと、
前記第１の転帰と前記第２の転帰を用いて統計パラメータを判定することと、
前記未測定特徴を、前記統計パラメータに対応するランキングに割り当てることと、を含む、方法。
前記インスタンスからの少なくとも１つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することをさらに含み、前記マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、請求項１に記載の方法。
前記未測定特徴を、前記統計パラメータに対応するランキングに割り当てることは、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、１つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することを含む、請求項１に記載の方法。
前記第１の転帰と前記第２の転帰を用いて統計パラメータを判定することは、既知の転帰と関連する複数のデータセットを含むマスターデータセットにアクセスすることを含む、請求項１に記載の方法。
前記第１の転帰と前記第２の転帰を用いて統計パラメータを判定することは、転帰についてのモデルに関連する分散値を判定することであって、前記モデルは、前記未測定特徴及びデータセットにおける少なくとも１つの他の別個の特徴に基づく、判定することと、前記データセットにおける前記未測定特徴についての複数の補定値を使用する前記モデルを用いて転帰についての予測の分散を評価することと、を含む、請求項１に記載の方法。
前記第１の転帰と前記第２の転帰を用いて統計パラメータを判定することは、
データセットに基づいて決定値を評価するためのルールを判定することを含み、前記データセットは、前記インスタンスにおける複数の測定済特徴及び前記インスタンスにおける未測定特徴について収集された値を含み、前記ルールは、（１）複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び（２）１つ以上の測定済特徴と合致する、請求項１に記載の方法。
前記第１の転帰と前記第２の転帰を用いて統計パラメータを判定することは、複数の転帰値及び複数のデータセットの各々についての既知の転帰に基づいて、前記第１の値を前記未測定特徴に補定するためのルールの正解率を判定することを含む、請求項１に記載の方法。
統計パラメータを判定することは、前記第１の転帰及び前記第２の転帰の時間依存分散を判定することを含む、請求項１に記載の方法。
前記統計パラメータに対応する前記ランキングに基づいて、前記未測定特徴のサンプリング頻度を選択することをさらに含む、請求項１に記載の方法。
センサデバイスの正解率及び適合率、並びに前記未測定特徴の前記ランキングに基づいて、前記未測定特徴から測定値を収集する前記センサデバイスを選択することをさらに含む、請求項１に記載の方法。
少なくとも１つの特徴が測定されているインスタンスについて未測定特徴をランク付けするためのシステムであって、
命令を記憶するメモリと、
メモリと通信可能に結合された１つ以上のプロセッサであって、前記１つ以上のプロセッサは、前記命令を実行して、前記システムに
他の第１の残りの未測定特徴を一定に保持しながら、前記インスタンスにおける前記未測定特徴に第１の値を補定することと、
前記インスタンスにおける前記第１の値を使用するモデルを用いて第１の転帰を評価することと、
他の第２の残りの未測定特徴を一定に保持しながら、前記インスタンスおける前記未測定特徴に第２の値を補定することと、
前記インスタンスにおける前記第２の値を使用する前記モデルを用いて第２の転帰を評価することと、
前記第１の転帰と前記第２の転帰を用いて統計パラメータを判定することと、
前記未測定特徴を、前記統計パラメータに対応するランキングに割り当てることと、
前記インスタンスからの少なくとも１つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することであって、前記マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、選択することと、を行わせるように構成されている、システム。
前記未測定特徴を、前記統計パラメータに対応するランキングに割り当てるために、前記１つ以上のプロセッサは命令を実行して、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、１つ以上の既知の転帰を用いて前記未測定特徴の相対的重要度を識別することを行う、請求項１１に記載のシステム。
前記第１の転帰と前記第２の転帰を用いて統計パラメータを判定するために、前記１つ以上のプロセッサは命令を実行して、既知の転帰と関連する複数のデータセットを含むマスターデータセットにアクセスすることを行う、請求項１１に記載のシステム。
前記第１の転帰と前記第２の転帰を用いて統計パラメータを判定するために、前記１つ以上のプロセッサは命令を実行して、転帰についてのモデルに関連する分散値を判定することであって、前記モデルは、前記未測定特徴及びデータセットにおける少なくとも１つの他の別個の特徴に基づく、判定することと、前記データセットにおける前記未測定特徴についての複数の補定値を使用する前記モデルを用いて転帰についての予測の分散を評価することとを行う、請求項１１に記載のシステム。
前記第１の転帰と前記第２の転帰を用いて統計パラメータを判定するために、前記１つ以上のプロセッサは命令を実行して、データセットに基づいて決定値を評価するためのルールを判定することを含み、前記データセットは、前記インスタンスにおける複数の測定済特徴及び前記インスタンスにおける前記未測定特徴について収集された値を含み、前記ルールは、（１）複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び（２）１つ以上の測定済特徴と合致する、請求項１１に記載のシステム。
命令を記憶する非一時的なコンピュータ可読媒体であって、前記命令は、コンピュータによって実行されるときに、前記コンピュータに、少なくとも１つの特徴が測定されているインスタンスに対して未測定特徴をランク付けするための方法を実行させ、前記方法は、
他の第１の残りの未測定特徴を一定に保持しながら、前記インスタンスにおける前記未測定特徴に第１の値を補定することと、
前記インスタンスにおける前記第１の値を使用するモデルを用いて第１の転帰を評価することと、
他の第２の残りの未測定特徴を一定に保持しながら、前記インスタンスおける前記未測定特徴に第２の値を補定することと、
前記インスタンスにおける前記第２の値を使用する前記モデルを用いて第２の転帰を評価することと、
前記第１の転帰と前記第２の転帰を用いて統計パラメータを判定することと、
前記未測定特徴を、前記統計パラメータに対応するランキングに割り当てることと、
前記インスタンスからの少なくとも１つの測定済特徴に従って、マスターデータセットからフィルタリングされたデータセットを選択することであって、前記マスターデータセットは、複数の既知の転帰に関連する複数のデータセットを含む、選択することと、を含み、前記未測定特徴を、前記統計パラメータに対応するランキングに割り当てることは、フィルタリングされたデータセットにおいて、モデルベースの特徴重要度方法論を使用して、１つ以上の既知の転帰を用いて未測定特徴の相対的重要度を識別することを含む、非一時的なコンピュータ可読媒体。
前記方法において前記第１の転帰と前記第２の転帰を用いて統計パラメータを判定することは、既知の転帰と関連する複数のデータセットを含むマスターデータセットにアクセスすることを含む、請求項１６に記載の非一時的なコンピュータ可読媒体。
前記方法において前記第１の転帰と前記第２の転帰を用いて統計パラメータを判定することは、転帰についてのモデルに関連する分散値を判定することであって、前記モデルは、前記未測定特徴及びデータセットにおける少なくとも１つの他の別個の特徴に基づく、判定することと、前記データセットにおける前記未測定特徴についての複数の補定値を使用する前記モデルを用いて転帰についての予測の分散を評価することと、を含む、請求項１６に記載の非一時的なコンピュータ可読媒体。
前記方法において前記第１の転帰と前記第２の転帰を用いて統計パラメータを判定することは、データセットに基づいて決定値を評価するためのルールを判定することを含み、前記データセットは、前記インスタンスにおける複数の測定済特徴及び前記インスタンスにおける前記未測定特徴について収集された値を含み、前記ルールは、（１）複数のデータセットを含むマスターデータセットからの複数の既知の転帰、及び（２）１つ以上の測定済特徴と合致する、請求項１６に記載の非一時的なコンピュータ可読媒体。
前記方法において前記第１の転帰と前記第２の転帰を用いて統計パラメータを判定することは、複数の転帰値及び複数のデータセットの各々についての既知の転帰に基づいて、前記第１の値を前記未測定特徴に補定するためのルールの正解率を判定することを含む、請求項１６に記載の非一時的なコンピュータ可読媒体。
前記他の第１の残りの未測定特徴は、前記他の第２の残りの未測定特徴と同じである、請求項１に記載の方法。
前記他の第１の残りの未測定特徴は、前記他の第２の残りの未測定特徴と同じである、請求項１１に記載のシステム。
前記他の第１の残りの未測定特徴は、前記他の第２の残りの未測定特徴と同じである、請求項１６に記載の非一時的なコンピュータ可読媒体。