JP2016520228A - 医療システムにおけるコンテキスト意識予測 - Google Patents
医療システムにおけるコンテキスト意識予測 Download PDFInfo
- Publication number
- JP2016520228A JP2016520228A JP2016514041A JP2016514041A JP2016520228A JP 2016520228 A JP2016520228 A JP 2016520228A JP 2016514041 A JP2016514041 A JP 2016514041A JP 2016514041 A JP2016514041 A JP 2016514041A JP 2016520228 A JP2016520228 A JP 2016520228A
- Authority
- JP
- Japan
- Prior art keywords
- outcome
- feature
- data
- features
- characteristic curve
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Z—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
- G16Z99/00—Subject matter not provided for in other main groups of this subclass
Landscapes
- Medical Informatics (AREA)
- Engineering & Computer Science (AREA)
- Public Health (AREA)
- Health & Medical Sciences (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
方法が、環境的、生理学的、行動的、および履歴コンテキストのうちの少なくとも1つに関連するコンテキストデータを受信するステップと、少なくとも1つの転帰に関連する転帰データを受信するステップとを含む。本方法はさらに、特徴セットをコンテキストデータから作成するステップと、特徴のサブセットを特徴セットから選択するステップと、特徴が少なくとも1つの転帰の予測因子である確率に従って、スコアを特徴のサブセットにおける各特徴に割り当てるステップと、少なくとも1つの転帰のための特性曲線を特徴のサブセットから生成するステップであって、特性曲線は、スコア化に基づく、ステップとを含む。本方法はさらに、特性曲線下面積を計算するステップと、特性曲線下面積を使用して、特徴のサブセットが少なくとも1つの転帰のための好適な予測因子であるかどうかを識別するステップとを含む。
Description
(関連特許出願の引用)
本願は、“Context−Aware Prediction in Medical Systems,”と題された、Ghasemzadeh et al.に対する、2013年5月14日に出願された、米国仮特許出願第61/823,230号の利益を主張するものであり、その内容の全体は、参照により本明細書中に援用される。
本願は、“Context−Aware Prediction in Medical Systems,”と題された、Ghasemzadeh et al.に対する、2013年5月14日に出願された、米国仮特許出願第61/823,230号の利益を主張するものであり、その内容の全体は、参照により本明細書中に援用される。
(背景)
作用の過程の有効性の予測または後の転帰の予測等の予測が、多くの場合、不正確であり、ひいては、予測のための技術の改善が、有益になるであろう。
作用の過程の有効性の予測または後の転帰の予測等の予測が、多くの場合、不正確であり、ひいては、予測のための技術の改善が、有益になるであろう。
一側面では、方法が、環境的、生理学的、行動的、および履歴コンテキストのうちの少なくとも1つに関連するコンテキストデータを受信するステップと、少なくとも1つの転帰に関連する転帰データを受信するステップと、特徴セットをコンテキストデータから作成するステップと、特徴のサブセットを特徴セットから選択するステップと、特徴が少なくとも1つの転帰の予測因子である確率に従って、スコアを特徴のサブセットにおける各特徴に割り当てるステップとを含む。本方法はさらに、少なくとも1つの転帰のための特性曲線を特徴のサブセットから生成するステップであって、特性曲線は、スコア化に基づく、ステップと、特性曲線下面積を計算するステップと、特性曲線下面積を使用して、特徴のサブセットが少なくとも1つの転帰のための好適な予測因子かどうかを識別するステップとを含む。
一側面では、システムが、プロセッサ実行可能命令を含むメモリと、メモリからの命令を実行するように構成されるプロセッサと含む。命令は、プロセッサが、コンテキストデータおよび転帰データを受信し、特徴セットをコンテキストデータから作成し、複数の特徴サブセットを特徴セットから選択するための命令を含む。複数の特徴サブセットのそれぞれのために、命令は、特徴サブセットおよび転帰データを分類子に適用させ、特徴サブセットのためのスコアを判定し、複数の特徴サブセットのそれぞれのためのスコアに基づいて、好ましい特徴サブセットを選択し、好ましい特徴サブセットを使用して、予測モデルを生成するための命令を含む。
一側面では、プロセッサ可読物理的媒体が、プロセッサ実行可能命令を含む。命令は、転帰情報に関連する転帰情報およびコンテキスト情報を受信し、転帰情報およびコンテキスト情報を事前処理し、特徴セットを事前処理されたコンテキスト情報から作成するための命令を含む。命令はさらに、スコアを特徴セットにおける特徴のうちの少なくともいくつかに割り当て、スコアが、転帰情報によって記述される転帰を予測するための特徴の能力に従って特徴に割り当てられ、スコアを使用して、特性曲線のセットを判定し、各特性曲線は、転帰を予測する能力を表し、特性曲線のセットにおける特性曲線のそれぞれのためのスコアを計算し、特性曲線のそれぞれのためのスコアに基づいて、特徴セットからの特徴を含む予測因子を識別するための命令を含む。
本開示は、医学的状態または事象のコンテキスト意識予測を説明する。生理学的データ単独に基づく予測が、データのコンテキストを把握しない場合、常に、効果的であるわけではない。研究は、子供の住居の周囲の交通関連の空気汚染が、喘息を患う子供に入院の繰り返しをもたらす可能性があり、減量および運動が、糖尿病の危険性を低減させることができ、ある遺伝子が、冠動脈疾患患者内における心臓発作の危険性の増加をもたらし得る、タンパク質物質(例えば、C反応性タンパク質)の産出の原因となる可能性がある等の実施例では、いくつかのコンテキストデータといくつかの医学的状態との間に相関関係があるという証拠を示している。別の実施例として、高脈拍数が、健康状態を予測し得るが、コンテキストにおいて、高脈拍数が最近の身体的活動性に起因する場合、予測は、不正確であろう。
医学的状態のための予測を提供することに加えて、コンテキスト意識予測は、例えば、健康管理または予防医学に関連する方針決定において、有用なコミュニティベースの結論を提供し得る。コミュニティベースの結論の実施例は、スポーツ参加者が、肯定的な健康上の利点を達成するためではなく、社交的に楽しむもののための手段としてスポーツに携わることにより動機付けられることと、血圧の季節変動が、より高齢の対象においてより大きく、日々の最高と最低気温に関連することとを見出すことを含む。
コンテキスト意識予測はさらに、解空間を絞り込むことを通して、予測精度および応答時間を改善することによって、利点をもたらし得る。例えば、ある生体指標が、群B、B+D、またはCのうちの1つとして、患者内の肝炎ウイルスを分類するために役立つ可能性があり、論理的推論が、次いで、肝炎ウイルスB、B+D、またはCのうちのどのウイルスが存在するかを決定するために使用されてもよい。治効に関する予測は、人工神経ネットワークを使用して、生物学的パラメータの進化を含み得る。
図1は、本開示による、コンテキスト意識予測システム100の実施形態を例証する。コンピューティングデバイス110が、ネットワーク120または125等のネットワークを経由して、他のコンピューティングデバイス110と通信してもよい。例えば、ある場所におけるあるコンピューティングデバイス110は、コンテキストまたは転帰情報を提供する等、情報を別の場所における別のコンピューティングデバイス110に提供してもよい。コンピューティングデバイス110は、相互と直接通信してもよく、あるコンピューティングデバイス110は、別のコンピューティングデバイス110を通して情報を中継してもよい。
コンピューティングデバイス110は、命令を実行するデバイスであってもよく、命令は、ソフトウェア、ハードウェア、またはソフトウェアおよびハードウェアの組み合わせ内にあってもよい。コンピューティングデバイス110の実施例は、限定ではないが、コンピュータ、サーバ、ネットブック、スマートフォン、携帯情報端末等を含む。コンピューティングデバイス110は、ディスプレイ130を含んでもよく、情報が、グラフィカルユーザインターフェース140を介してディスプレイ130に提供される。命令は、メモリデバイスまたはユニット等のストレージ150内に記憶されてもよい。
図2は、プロセッサ210、メモリ220、入力/出力インターフェース230、および通信インターフェース240を含む、コンピューティングデバイス110の実施例を例証する。バス250が、コンピューティングデバイス110の構成要素の2つまたはそれを上回るものの間に、通信経路を提供する。示される構成要素は、例証として提供されるが、限定ではない。コンピューティングデバイス110は、付加的またはより少数の構成要素、あるいは複数の同一の構成要素を有してもよい。
プロセッサ210は、関連付けられる論理とともに、プロセッサ、マイクロプロセッサ、マイクロコントローラ、ASIC、および/またはFPGAのうちの1つまたはそれを上回るものを表す。
メモリ220は、情報を記憶するための揮発性および不揮発性メモリの一方または両方を表す。メモリの実施例は、EPROM、EEPROM、およびフラッシュメモリデバイス等の半導体メモリデバイス、内蔵ハードディスクまたはリムーバルディスク、光磁気ディスク、CD−ROMおよびDVD−ROMディスク等の磁気ディスク、ならびに同等物を含む。
本開示のコンテキスト意識予測システムは、プロセッサ210によって実行される、コンピューティングデバイス110のメモリ220内のコンピュータ可読命令として実装されてもよい。
入力/出力インターフェース230は、インターフェースをコンピューティングデバイス110の内部構成要素から外部構成要素にともに提供する、電気構成要素および随意のコードを表す。実施例は、関連付けられるプログラムミングを伴う駆動集積回路を含む。
通信インターフェース240は、インターフェースをコンピューティングデバイス110の内部構成要素からネットワーク120またはネットワーク125等の外部ネットワークにともに提供する、電気構成要素および随意のコードを表す。
バス250は、コンピューティングデバイス110内の構成要素の間にある1つまたはそれを上回るインターフェースを表す。例えば、バス250は、プロセッサ210とメモリ220との間に専用接続ならびに要素コンピューティングデバイス110のプロセッサ210と複数の他の構成との間に共有接続を含んでもよい。
本開示は、一実施形態では、複数の患者に関して集められたデータに基づいて、個人または群内における医学的状態、後の有害事象、または医学的合併症の発生の可能性を推定する、コンテキスト意識予測システムを説明する。
図3は、転帰を予測する特徴のセットを判定するための技術の実施例を例証する。データ310が、ストレージデバイスから収集または読み出される。データ310は、コンテキスト情報と、コンテキスト情報に関連する転帰情報とを含む。例えば、データ310は、個人の群に関する現在およびこれまでの医療ならびに環境データを含んでもよく、現在の医療データの1つまたはそれを上回る部分が、転帰として指定されてもよい。データ310は、フィルタリング、正規化等によって等、ブロック320においてフォーマットされる。フォーマット済データは、後続の処理のために使用される特徴のセット340を識別するために、ブロック330において事前処理される。事前処理は、例えば、冗長性削除および関連性判定を含む。スコアラ350では、各特徴340は、定義された転帰を予測するためのその能力に従って、スコア化される。スコアは、例えば、特徴が転帰を予測することが可能である確率であってもよい。ブロック360では、特性曲線(CC)370が、特徴スコアに基づいて、生成される。CCは、特徴スコア閾値を種々の値に設定し、各閾値において、閾値を上回るスコアを伴う特徴に関して、これらの特徴に関連するデータサンプルのための転帰を予測する真陽性率および偽陽性率を判定することによって生成される。異なる閾値のための真陽性率対偽陽性率のプロットが、CCである。CCは、CCの曲線下面積(AUC)を判定することによって等、ブロック380においてグレード分けされる。
ブロック380において判定されたグレードは、セレクタブロック390において多くの方法で使用されてもよい。AUCの実施例に関して、CCが、スコアラ350および特徴340のサブセットの種々の組み合わせのために生成され、対応するAUCが、1つまたはそれを上回る転帰のための予測モデルで使用するための特定のスコアラ350および特徴340のサブセットの組み合わせを選択するために比較されてもよい。この実施例を継続すると、組み合わせは、複数の転帰のうちの1つを予測するためのその能力が、それ自体では望ましくない場合でさえも、複数の転帰のそれぞれを個別に予測するために、その平均能力(または、他の測定)に基づいて、選択されてもよい。別の実施例のように、スコアラ350は、1つまたはそれを上回る転帰のための2つまたはそれを上回るスコアラ350のAUCを比較することによって選択されてもよい、または特徴340のサブセットは、1つまたはそれを上回る転帰のための2つまたはそれを上回るサブセットのAUCを比較することによって選択されてもよい。
加重が、特定の特徴または転帰を強調する、またはそれを強調しないために使用されてもよい。例えば、特徴を収集または処理するコストが、加重を割り当てる際に考慮され得る。コストに基づいて特徴を選択するための付加的または代替技術が、使用されてもよい。
データの収集および処理は、特徴選択技術にコストがかかる。人がある質問に答える、またはある生物学的サンプルを提供することを望まない場合がある点で、サンプルを採取してもらうために研究室に向かう人と関連付けられる時間、可用性、および移送コスト、またはプライバシー問題と関連付けられるコストが存在し得る。処理能力およびメモリサイズが、集められたデータの量に適応しなければならない点で、算出コストが存在し得る。とりわけ、バッテリ動作式システムに重要である、遠隔健康監視(RHM)システムにおけるセンサおよび処理に関するエネルギーコストが存在し得る。これらは、コストのごくわずかな実施例であり、特徴選択技術に影響を与える多くの他のコストが存在する。
コスト重視の特徴選択は、サブセット特徴の選択と関連付けられる全コストを最小限にすることを目指す。下記に議論されるアプローチは、個人の特徴のコストを考慮する。グラフモデルが、特徴の相関関係およびコストを表すために導入される。問題が、整数計画法を使用して、公式化され、貪欲近似が、コスト高効率様式で特徴を選択するために提示される。特徴選択へのコスト重視のアプローチは、分類精度を実質的に保持しながら、最小限のコスト特徴セットを構築する。
所与のスコアラ350および所与の特徴340のサブセットに関して、対応するCCは、CCに沿った所望の動作点に関する特徴スコア閾値を判定するために使用され得る。例えば、第1の閾値が、直接介入に関する高リスクの個人を識別するとき、使用されてもよく、第2の閾値が、遠隔健康監視から利点を得るであろう個人を識別するとき、使用されてもよい。
データ310等のデータは、広範囲の様々なソースからの情報を含んでもよい。データのいくつかの実施例は、医療履歴、遺伝的特徴、活動性レベル、食糧摂取量、人口統計学、地理情報、およびソーシャルネットワークへの関与に関する情報を含む。
生理学的データは、例えば、血圧、血糖値、心拍数、血小板数、血液酸素含有量、および体温等の測定を含む。
医療履歴情報は、例えば、予防接種、外科手術、成長、発症、医療事象(例えば、心臓発作)、および医学的合併症(例えば、再入院、糖尿病合併症、および喘息発作)に関連する履歴情報を含んでもよい。遺伝情報は、例えば、家族の疾患の履歴および遺伝子関連マーカーを含んでもよい。活動性レベル情報は、例えば、現在の運動情報、非移動対移動のパーセンテージ、1日あたりの歩数、およびスポーツ活動性に参加の頻度を含んでもよい。食糧摂取量情報は、例えば、頻度、体積または質量、カロリー、流体量、アルコールの頻度および量、ならびに野菜のパーセンテージ等の摂取量に関連する情報を含んでもよい。
人口統計学的情報は、例えば、性別、人種、年齢、障害、移動性、自宅所有権、雇用状況、および学歴を含んでもよい。地理情報は、例えば、居住地、勤務地、通勤情報、定期的訪問場所、および1週間あたりの運転マイル数を含んでもよい。ソーシャルネットワーキング情報は、例えば、直接対面の会合のタイプおよび頻度、直接対面の社会的交流対電子社会的交流のパーセント、オンラインソーシャルネットワーキングサイト会員の数、電子ソーシャルネットワーキングサイトにアクセスする頻度、ならびに1日あたりの携帯電話のメール数を含んでもよい。
データの他の実施例は、疾患に関する論理的推論等の臨床医の意見または薬剤の用量の変更に関する看護師の推奨を含む。
本開示は、他の中でもとりわけ、異なるソースからのデータ取得および関連かつ非冗長データを選択するための技術を説明する。
コンテキスト意識予測システムは、質問を尋ねることによってデータを患者から収集し、また、データを患者から自動的に収集してもよい。データは、例えば、臨床医の診察所内においてローカルで、またはリモートで、集められてもよい。データは、有線または無線デバイスを使用して、集められてもよい。
いくつかの実装では、生理学的または他のデータは、遠隔監視システムを使用して、取得されてもよい。例えば、遠隔センサが、患者の体温を捕捉してもよく、これは、ある予測モデルへの生理学的データ入力として使用され、別の予測モデルのためのコンテキストデータ入力として体温傾向または平均データを作成するために使用されてもよい。
図4は、無線デバイスを使用し、データを人から自動的に収集する、コンテキスト意識予測システムの一実施形態を例証する。
図4の実施形態におけるデータ収集が、実施例として、血圧監視、パルスオキシメトリ、血糖監視、体重測定、心電図記録法(ECG)、および運動検出に関する表現を使用して、例証される。例示的データ収集デバイスの全てが、データ収集のために使用されることが必要とされず、さらに、他のデータ収集デバイスは、加えて、または代替として、使用されてもよい。
ゲートウェイデバイスが、データを、図4に例証される無線デバイス等の収集デバイス、または図示されない他のデバイスから受信する。一実施形態では、スマートフォンは、ゲートウェイとして使用される。ゲートウェイはまた、集められるデータを表示してもよい。ゲートウェイは、入力されたデータを手動で記録し得る、入力デバイスを有してもよい。一実施形態では、ゲートウェイは、パーソナルコンピュータである。
ゲートウェイは、無線または有線接続を使用して、データソースに接続し、データを要求し、データを受信し、接続を終了してもよい。ゲートウェイは、パブリックまたはプライベート通信ネットワークを通して、データソースに接続してもよい。
ゲートウェイデバイスは、記憶および管理のためにデータを提供する。記憶は、ゲートウェイ上にあってもよい。加えて、または代替として、ゲートウェイは、全体的または部分的に、記憶のために別のデバイスにデータを提供してもよい。メタデータが、収集されたデータと関連付けられてもよく、いくつかの状況では、収集されたデータは、それ自体メタデータである。メタデータは、例えば、作成の日時、データのタイプ、データを作成するユーザ(例えば、血圧測定を行う患者または患者の薬剤に関するデータを入力する臨床医)等の収集されたデータの1つまたはそれを上回る側面に関する情報を提供するデータを指す。
未加工データを取得するために使用されるゲートウェイは、メタデータを取得するために使用されるゲートウェイと異なり得る。
データ収集は、医学的状態または事象に関する予測モデルを構築するために、複数の人に対して実施されてもよい。モデル構築段階の間、データ収集が、実施され、収集されたデータは、記憶される。データは、事前処理において、必要に応じて、取り除かれ、かつ変換され得る。事前処理は、データが収集されるにつれて実施される、または収集されたデータに実施されてもよい。
いったんデータが集められると、データは、医学的状態または事象に対する1つまたはそれを上回るモデル関連データを生成するために使用されてもよい。モデルは、個人または群に関する医学的状態または事象を予測するために使用される。
図5は、コンテキスト意識システムにおける、個人のための事象予測の実施例を例証する。データは、個人から収集され、随意に記憶かつ事前処理され、個人がより高い危険性になり得る医学的状態または事象を予測するためのモデルと併用されてもよい。
図6は、予測モデルがどのように個人の群に関する結論を判定するために使用され得るかの実施例を例証する。データが、複数の対象から収集され、1つまたはそれを上回る予測モデルが、データから判定される。モデルから、群に関する結論が、形成され得、そのような結論は、より大きい母集団に関する結論を形成するために使用される、結論を表し得る。例えば、モデルは、特定の社会経済分類では、個人が、他の社会経済分類における個人よりも膝を損傷する可能性が高いことを示し得る。別の実施例に関して、モデルは、糖尿病を発症する高い危険性がある母集団の患者下位群を見出し得る。
有意な量のデータが、予測モデルを生成することと個人のデータを予測モデルと比較することとの両方のために、収集されてもよい。図7に例証されるように、いくつかのデータ処理が、例えば、データ収集デバイスまたはゲートウェイ上で、ローカルに収集されたデータに実施されてもよい。ローカルデータ処理は、雑音低減、データ加算、データ正規化、およびデータ融合を含んでもよい。
図8は、データを複数のソースから受信するデバイス上でのローカル処理を例証する。
図9は、データがコンテキストデータ収集ソフトウェア(CDGS)によって収集され得ることを例証する。例えば、CDGSは、データを、電子医療履歴システム、オンラインソーシャルネットワーク、ウェブデータコレクタ、または他のデータのソースから読み出してもよい。データはまた、CDGSを使用して、手動で入力されてもよい。CDGSは、ゲートウェイ上に常駐してもよい。CDGSはまた、データストレージが生じるウェブサーバ等のサーバ上に常駐してもよい。
図10は、電子データソースがCDGSによって行われる要求に応答するデータの自動収集の実施例を例証する。図10に例証されるように、認証および許可が、例えば、セキュリティおよびプライバシーの理由のために、CDGSと電子データソースとの間の相互作用に含まれてもよい。
図4に関して上記に言及されるように、収集されたデータは、モデルを生成する際の使用または予測を判定する際の使用の前に、事前処理されてもよい。図11は、データクリーニングおよびデータ変換を含み、後にコンテキストデータ選択が続く、事前処理の一実施形態を例証する。
データクリーニングは、雑音を収集されたデータから除去し、欠測値に帰属させる。雑音の一実施例は、歩行の間の加速度計からの信号が特定の予測のためにほとんど有用でないデータを含有する、加速度計歩数計によって記録されるような歩行の間の時間である。
データ変換は、統計的および/または形態的特徴を集められたデータから抽出することを指す。データ変換はまた、次元低減機能を含有してもよい。一実施例では、次元低減は、データ収集段階において集められたデータ項目のサブセットの選択を含む。別の実施例では、次元低減は、特徴選択プロセスによって抽出された特徴のサブセットの選択を含む。
事前処理はさらに、予測プロセスに関連のあるコンテキストデータの選択を含んでもよい。
図12は、予測のためのデータのタイプを選択するための一例示的プロセスを例証する。図12の実施例において例証されるように、2つのタイプの分析(関連性分析および冗長性分析)が、行われる。関連性分析は、所与のデータタイプが予測タスクに関連があるかどうかを検査する。冗長性分析は、所与のデータタイプがすでに選択されたデータタイプとより高い相関があるかどうかを判定する。例えば、所得レベルおよび運転される車両のモデルがより高い相関がある場合、これらの2つのデータタイプは、相互に冗長である。
一実施例では、情報利得が、関連性および冗長性測定の計算のための手段として使用されてもよい。相関係数が、データ選択分析のために使用されてもよい。
一実装では、関連性および冗長性分析は、対称不確実性の概念に基づく。2つの別々のランダム変数XとYとの間の対称不確実性は、以下のようなU(X、Y)によって与えられる。
式中、H(X)およびH(Y)は、それぞれ、ランダム変数XおよびYのエントロピーを表し、I(X,Y)は、2つの変数の間の情報利得を示す。I(X,Y)は、以下のように定義される。
I(X,Y)=H(X)−H(X|Y) (2)
対称不確実性は、正規化情報利得であり、0と1との間にあり、式中、U=1は、いずれかの変数の値を把握することが、他の変数を完全に予測することができることを示し、U=0は、2つの変数が完全に独立していることを示す。対称不確実性は、2つのランダム変数の間の相関関係の基準である。相関係数等、他の基準に対するこの基準の利点は、対称不確実性が、変数の間で非線形相関を捕捉する可能性があることである。
I(X,Y)=H(X)−H(X|Y) (2)
対称不確実性は、正規化情報利得であり、0と1との間にあり、式中、U=1は、いずれかの変数の値を把握することが、他の変数を完全に予測することができることを示し、U=0は、2つの変数が完全に独立していることを示す。対称不確実性は、2つのランダム変数の間の相関関係の基準である。相関係数等、他の基準に対するこの基準の利点は、対称不確実性が、変数の間で非線形相関を捕捉する可能性があることである。
一実装では、予測技術は、2つの分類(陽性(P)および陰性(N))のサンプルを分類することを目指す。データDは、以下である場合、予測タスクに無関係であり、
min{U(D,P),U(D,N)}<thr1 (3)
式中、thr1は、事前定義またはユーザに選択された閾値である。
min{U(D,P),U(D,N)}<thr1 (3)
式中、thr1は、事前定義またはユーザに選択された閾値である。
別の実装では、n個の特徴のセットF={f1,f2,...,fn}と、転帰のセットA={a1,a2,...,ah}とが存在し、式中、特徴fiは、以下である場合、分類タスクに無関係であり、
minj(U(fi,aj))<λR (4)
式中、λR(関連性閾値)は、設計パラメータである。関連性分析は、転帰の予測に無関係である特徴を排除する。
minj(U(fi,aj))<λR (4)
式中、λR(関連性閾値)は、設計パラメータである。関連性分析は、転帰の予測に無関係である特徴を排除する。
残りのm個の特徴(m<n)は、強い相関特徴を見出すために、冗長性分析を受ける。2つの特徴fiおよびfkは、U(fi,fk)>λDである場合、強い相関関係があると見なされる(式中、λD(冗長性閾値)は、設計パラメータである)。冗長性分析の出力は、(fi、fk)の形態の特徴対のセットであり、これらは、強い相関関係があり、それらのいずれかは、相関分析に従って、排除される可能性がある。しかしながら、これらの特徴はさらに、データの収集、処理、またはストレージと関連付けられる1つまたはそれを上回るコスト要因を考慮することによって、コスト重視の特徴選択のために分析されることができる。一実施例では、コスト重視の分析は、グラフモデルを使用して、行われる。
関連性分析によって導入されるm個の関連性特徴および冗長性分析に従って生成される特徴対のセット(fj,fk)を前提として、無向グラフG=(V,E,W)は、冗長性グラフと呼ばれる(式中、Vは、m個の関連性特徴と関連付けられるm個の頂点V={u1,u2,...,um}のセットであり、E={e1,e2,...,er}は、強い相関関係があるr個の特徴対のセットであり、W={w1,w2,...,wm}は、頂点に割り当てられ、各特徴と関連付けられるコストを示す、加重のセットである)。実施例として、10個の特徴が、F={f1,f2,...,f10}によって表される、特徴の網羅的セットを構成すると仮定されたい。さらに、関連性分析が、5つの特徴を排除し、ひいては、冗長性グラフが、5つの特徴を含有するであろうと仮定されたい。図13は、例証である。各特徴に帰属されるコストは、各頂点の加重によって表される。例えば、w1は、f1のコストである。
特徴セットが、次に、最小限コスト特徴選択(MCFS)を使用して、選択される。仮に、全加重が、W={w1,w2,w3,w4,w5}={1,1,1,1,1}である、1つの単位に等しいとされたい。この場合、MCFSは、全ての特徴を等しく扱い、ひいては、最適な特徴セットは、2つの頂点(具体的には、f1およびf3)から成る。しかしながら、加重セットがW={10,1,1,1,1}に修正される場合、MCFSは、より低い加重を伴う頂点をより考慮し、ひいては、特徴f4およびf5は、f1よりも好まれ得、特徴セットの低減が、3つの頂点(例えばf4、f5、およびf3)を含有するであろう。したがって、全コストは、11単位から3単位まで減少されるであろう。
一般論として、コスト低減は、解決されるべき問題を表す。冗長性グラフG=(V,E,W)を前提として、最小限コスト特徴選択の問題は、グラフ内の任意の他の頂点によって支配されない頂点のサブセットを見出すことであり、総コストは、最小限にされる。問題は、以下のように公式化される。aijは、冗長性グラフ内で境界の存在をエンコードする所与の2変数であると仮定されたい。
xiは、頂点uiが最終頂点セットの要素として選ばれるかどうかを判定する、2値変数である。
MCFS問題に関する対応する整数線形計画法(ILP)公式化は、以下の通りである。
以下を条件とする。
(7)の目的関数は、選択された頂点(すなわち、xi=1を伴うもの)の総コストを最小限にするためのものである。制約(8)は、各選択された頂点が、少なくとも1つを上回る頂点に隣接することを保証し、(9)の制約は、変数xiが2進値のみをとることを確実にする。
MCFS問題は、最小限コスト支配セット(MCDS)問題に類似する。MCDS問題は、加重セットカバー(WSC)問題からの低減によって、NP困難であると証明される。MCFS問題もまた、WSC問題からの低減によって示されるように、NP困難である。仮に、(S,U,W)が、母集団Uと、それぞれ、セットW={w1,w2,...,wn}からの加重値wiと関連付けられる、サブセットS={S1,S2,...、Sn}群のファミリーとを伴う、WSC問題の事例であるとされたい。Si∈Sセット毎に、頂点ui(特徴fiと関連付けられる)を描き、(ui、uj)∈Siの対毎に(ui、uj)を描き、かつそれを縁取りするように、グラフG=(V,E,W)を構成する。これは、頂点セットV={u1、u2,...,un}ならびに縁セットEを形成する。さらに、各頂点ui(セットSiと関連付けられる)に、セットWによって与えられるような加重値wiを割り当てる。ここで、C={Si:i∈D}が、加重セットカバー問題の許容解である場合、Dはまた、MCFS問題に対する解でもある。
MCFS問題を解決するための貪欲技術は、以下の通りである。
冗長性グラフ内の頂点ui毎に、本技術は、まず、全ての隣接頂点(Vi)を見出す。これは、次いで、最終頂点セットΩに含むために、最良候補頂点を見出す。最良候補は、最大利益を伴うものである。最大利益頂点が、「頂点コストwiで除算されるViの濃度」の最大値を伴うものである。そのような頂点を選択する手助けをする直感は、大きい数の隣接頂点および小さいコストを有することである。本技術は、候補頂点(ui)をΩに追加し、uiと、ViならびにVからその近接するもの全てとを排除する。本技術は、Vの頂点を上回らないものが存在するまで反復し、各頂点が、最終頂点として選ばれる、または最終頂点によって支配されるかのいずれかであることを示す。
貪欲技術は、O(m log m)の時間計算量を有する(式中、m=|V|)。実際に、上記の貪欲技術におけるメインループは、O(m)時間の間、反復する「while」ループである。ループ内側の主動作は、最大利益(頂点コストwi’で除算されるViの濃度の最大値)を伴う頂点へのものである。これは、優先ヒープを使用して、O(log m)時間以内に行われることができる。したがって、貪欲技術は、O(m log m)の時間計算量を達成する。
貪欲技術は、MCFS問題に対するln nの近似を達成する。最大利益頂点として選択される頂点ui毎に、Θiをuiが選定された時点の|Vi|/wiとして定義する。本質的に、uiが選定されたとき、隣接頂点の数を支配するであろう。仮に、頂点uj∈V毎に、uiが、uiに隣接する最初に選定された頂点であり、これを支配するとされたい。仮に、各支配される頂点ujと関連付けられるコストが、コスト(uj)=1/Θiであると定義されたい。
最利益頂点として本技術によって選定された頂点uiに関して、以下の式で求められる。
したがって、
貪欲技術の実行にわたって、kの値は、mから1に変化し、ひいては、本技術が除去する各頂点の総コストは、多くても、以下の式で求められる。
示されるように、貪欲技術は、MCFSに対するln mの近似である(式中、mは、冗長性グラフ内の頂点の数を示す)。
リアルタイム特徴選択が、いくつかのシステムにおいて、課題を呈し得る。実施例として、装着可能センサノードシステムが、遠隔健康監視のために使用されてもよく、処理能力、メモリ、およびその可搬性(例えば、無線アクセス、バッテリ動作)に起因する利用可能であるエネルギー上の制約を有し得る。上記に提示される貪欲技術は、特徴のコストに基づいて、コスト最小限特徴セットを見出す。加えて、貪欲技術自体は、コスト最小限にされてもよい。
加重セットカバー問題に類似して、MCFS問題は、多項式時間において近似化されることが可能でもなく、扱いやすい固定されたパラメータでもない、難しい問題の群に属する。オフラインで最適な解を見出す(すなわち、装着可能センサノードシステムを展開することに先立って最適な特徴セットを見出すこと)ために、ILPアプローチを使用する可能性があるが、ILPは、制約システムにおいて、リアルタイム実行が実現可能はない場合がある。したがって、リアルタイムおよび動的特徴選択に関して、近似は、十分な精度が取得される限り、好ましい。上記に提示される貪欲技術は、対数近似因子(ln m)を有し、O(m log m)の時間計算量を生じさせる。理想的には、ILP解に可能な限り近い精度と、貪欲アプローチに可能な限り近い時間計算量とを有する、技術を考案することを望むであろう。より良好な精度のために、時間計算量は、犠牲にされ得る。
一般性の損失を伴わずに、仮に、(ln r)が、区分された特徴サブセット上でILPを行う特徴選択技術の近似比であるとされたい。また、そのような技術が、t=cm/r時間単位内で起動すると仮定されたい。目的は、特徴選択を実施するための時間バジェット(T)に影響する近似比を最小限にする、パーティションの最適数を見出すことである。
Minimize ln r (14)
以下を条件とする。
t≦Tt=cm/r (15)
t=cm/r (16)
この最適化問題は、以下に匹敵する。
Minimize r (17)
以下を条件とする。
したがって、パーティションの最適数は、以下の式で求められる。
Minimize ln r (14)
以下を条件とする。
t≦Tt=cm/r (15)
t=cm/r (16)
この最適化問題は、以下に匹敵する。
Minimize r (17)
以下を条件とする。
図14は、パーティションの数が、時間バジェット(T)における低減の結果として、t−Tが増加するにつれて、どのように増大するかを示す。図は、t−Tが103〜106の範囲であるときの場合のrを例証する。
上に述べたように、医療環境で使用されるコンテキスト意識予測システムが、説明されている。コンテキスト意識予測システムはまた、環境状況、群衆挙動、地質学的形成、天候パターン、市場変動、ならびにコンテキストおよび転帰データがモデルの作成のために利用可能である他の分野を予測するため等、他の予測環境で使用され得ることが本明細書から明白であろう。
図15は、予測における、モデル生成およびモデルの後続の使用の実施例を例証する。モデル生成は、例えば、収集されたデータで動作し、医学的状態の確率を計算するために使用され得る数学的方程式を提供する、回帰モデルとして実装されてもよい。図15の「訓練データ」が、具体的な医学的状態の予測のためのモデルを生成するために使用される、データを指す。
「予測データ」が、具体的な医学的状態の発生を予測するために、予測モデルとともに使用される、データを指す。例えば、予測データは、予測が行われる具体的な個人と関連付けられる任意の事前に収集されたデータを含む。
モデル生成は、代替として、または加えて、機械学習、パターン認識、人工知能、ならびに分類、回帰、およびクラスタリング技術等の統計的推論プロセスのうちの1つまたはそれを上回るものを含んでもよい。
コミュニティベースの結論に関して、一実施例では、患者の群から収集されたデータは、コンテキスト要因に基づいて、患者を階層化するために、クラスタリング(また、教師なし分類と呼ばれる)のために使用される。このように、類似する患者(そのデータに従った)が、ともに群化される(クラスタリング技術によって識別される)。したがって、結論が、患者下位群に関して、下される可能性がある。クラスタリング技術の実施例は、K平均法クラスタリング、階層的クラスタリング、およびガウス混合モデルを含む。
(臨床研究の分析−遠隔健康監視システムのユーザの予測因子)
(臨床研究の分析−遠隔健康監視システムのユーザの予測因子)
コンテキスト意識予測に関する本技術の一実施形態が、患者を本システムに登録することに先立って、遠隔健康監視(RHM)システムを使用するための転帰の成功を予測するためのモデルを判定するために使用された。
RHMシステムの使用は、急激に増大しており、慢性心不全(CHF)を患う患者における、患者と提供者の通信、意思決定の共有、アクティブ化、および自己管理を改善している。これらの有望な前途にもかかわらず、介入にアクセスすること(最初の使用)、ある実質的期間(長時間の使用)のための介入に携わること、および介入(持続使用)を再考することとして定義される、無線技術の使用への実際の暴露は、CHFを患う患者内において、かなり低いままである。さらに、どの患者の下位群がRHM技術から利点を得る場合があるのかと、どのユーザ特徴およびコンテキスト要因がこれらのシステムの効果的な使用を判定するのかとが不明である。
CHF研究では、RHMシステムは、毎日の体重、血圧(心臓収縮および心臓拡張)、心拍数、および症状の質問を、鬱血性心不全を患う16名の患者から収集するために使用された。200の特徴を含むベースラインデータもまた、各患者から収集された。そのような特徴の実施例は、人口統計学、併存疾患、体重、心理社会的属性(落ち込み、不安、生活の質に対する質問)、性別、ベースライン時における年齢、結婚歴、同棲、信頼する友人の有無、民族性、完了教育年数、教育レベル、雇用状況、所帯が金融的にその所得で生活するための裕福度、喫煙歴、飲酒歴、平均運動レベル、身長(インチ)、体重(ポンド)、および医療保険を含む。
CHF研究の分析が、1)RHMにアクセスする(すなわち、最初の使用)予測因子を検査し、2)CHFを患う患者の群内において高度なデータ分析論を採用することによって、RHMのユーザと非ユーザとの間を区別するために行われた。目標は、CHFを患う患者の下位群が、効果的にRHMシステムを使用する傾向がより高いであろうかどうかを判定し、そのような順守予測に寄与するコンテキストおよび生理学的要因を識別することによって、患者の順守を査定することであった。
CHF研究は、事前試験(ベースライン)および事後試験(3カ月)を伴う単群実験的研究であり、ベースライン測定からのデータは、次いで、予測因子分析のために使用された。16名の患者の合計(平均年齢65.8±6.1歳、範囲58−83歳)が、CHF研究に対する同意を提供したが、しかしながら、研究プロトコルあたり、7名の患者のみが、開発されたRHMシステムにアクセスし、CHF悪化のための退院の7±2日以内に、データ(例えば、体重、血圧、心拍数、症状苦痛)を中央情報システムに伝送した。ベースラインデータ(約200の属性)は、属性選択および患者分類のために使用された。欠測値を伴う全ての属性が、順守査定に及ぼす欠測データ転嫁の影響を回避するために、データ分析から排除された。残りの88の属性は、後に意思決定表分類子が続く、属性選択技術にフィードされた。分類子は、患者の2つの群(順守対非順守)の間を区別するために使用された。
データは、決定木分類に基づいて、予測モデルを構築するために使用された。決定木は、木構造の形態で分類モデルを構築し、データセットをより小さいサブセットに再帰的に分割する一方、同時に、関連付けられた決定木が、増分的に開発される。最終結果は、決定ノードおよび葉ノードを伴う木である。決定ノード(データセットのベースライン属性)は、2つまたはそれを上回る分岐を含有してもよい。例えば、患者の年齢を表すノードが、年齢<50、50<=年齢<75、および年齢>=75に関する3つの分岐を有してもよい。葉ノード(順守および非順守)は、分類または決定を表す。最良の予測因子と関連付けられる木の最上位ノードが、ルートと呼ばれる。決定木分類モデルに基づく予測技術を開発する利点は、決定木が、特徴予測目的のための検討から顕著でないものを自動的に除外し、顕著な特徴の一覧を明示的に提供するであろうことである。これは、基準特徴の数が大きい場合、特に重要である。しかしながら、結果が示すように、非常に小さな数の特徴が、順守を予測するために十分である。本質的に、これらの特徴は、決定木を構成するために使用されるものである。決定木ベース分類の別の利点は、決定木が、ヒトによって理解され、意思決定のために使用され得る、ルールを表すことである。
決定木は、ID3技術に基づいた。トップダウン貪欲検索が、特徴が木のより高いレベルにバックトラッキングすることなく作り得る可能性がある分岐の空間を通して、実施される。各ノードにおいて分岐を構成することは、エントロピーおよび情報利得の測度に基づく。決定木構成プロセスは、ルートノードから始動し、データを、類似するデータタイプを伴うデータ項目を含有するより小さいサブセットに区分する。サンプル(すなわち、データインタンス)の類似度を計算するために、エントロピーが、使用される。エントロピーは、サンプル(例えば、ベースラインデータ値)のセットの均質性の測度である。サンプルが、ある特徴に対して完全に均質である場合、エントロピーは、その特徴に対してゼロであり(例えば、全ての患者が同一年齢である場合、特徴「年齢」に関するエントロピーは、ゼロである)、サンプルが等しく分割される場合、1のエントロピーを有する(例えば、全ての患者が異なる年齢値を有する場合、特徴「年齢」のエントロピーは、1である)。順守および非順守の観察/実施例のセットSを前提として、この2変数分類に関連のあるセットSのエントロピーは、以下の式で求められる。
E(S)=−p(Ad)log p(Ad)−p(NAd)log p(NAd)
式中、Adは、順守を示し、NAdは、非順守を指し、関数「p」は、確率関数である。
E(S)=−p(Ad)log p(Ad)−p(NAd)log p(NAd)
式中、Adは、順守を示し、NAdは、非順守を指し、関数「p」は、確率関数である。
言及されるように、決定木を構成するときの各ノードにおける試験に対する属性の選択が、順守対非順守の場合を分類するための最も有用な属性の選択を要求する。情報利得が、そのようなノードを見出すために使用される。情報利得は、所与の属性が、その標的分類に従って、訓練実施例をいかに良好に分離するかを測定する。この測度は、部分的に構成された木を拡張しながら、各ステップにおける候補特徴の中から選択するために使用される。情報利得は、エントロピーの予期される低減を測定する。
式中、Values(f)は、基準特徴fに関する全ての可能性がある値のセットであり、Svは、属性fが値「v」を有する、Sのサブセットである。この方程式の初項は、元の収集Sのエントロピーであり、2次項は、Sが属性fを使用して区分された後のエントロピーの期待値である。情報利得は、実際に、属性fに従って、実施例を区分することによって生じさせられるエントロピーの予期される低減である。
CHF研究では、ユーザおよび非ユーザのベースライン社会人口学的かつ臨床的特徴は、同等であった。しかしながら、属性選択技術は、非ユーザがCHF専門家ベースのケアを行った可能性が低く、自動式内部心臓除細動器を有した可能性が高く、アルコール使用歴がある可能性が高かったことを明らかにし、それらの3つの顕著な属性は、属性選択技術によって識別された。意思決定表分類子は、87.5%の精度と再現率との両方と、RHMへのアクセスを予測することに関する76.2%のFスコアとを有した。
CHF研究の分析は、ベースライン属性の小さなセットが、RHM技術へのCHFを患う患者のアクセスおよび順守を予測することのために十分であることを示した。さらに、CHFを患う患者の下位群は、RHM介入を使用する傾向がより高くあり得る。その発見は、RHM介入から利点を得る可能性が高い潜在的なエンドユーザに光明を投じる。
(臨床研究の分析−健康改善プログラムの成功の予測因子)
(臨床研究の分析−健康改善プログラムの成功の予測因子)
コンテキスト意識予測に関する本技術の一実施形態は、健康改善プログラムの転帰の成功を予測するためのモデルを判定するために使用された。転帰は、肥満度指数(BMI)、胴囲(WC)、高比重リポ蛋白(HDL)、および低比重リポ蛋白(LDL)の変化に関連した。転帰の成功は、それぞれ、表1に示されるように定義された。
コンテキスト意識予測は、臨床研究を評価し、RHMシステムを使用して、後の健康改善プログラムの成功のための予測因子を識別するために使用された。
評価された臨床研究は、Wanda−CVDと称されるRHMシステムを使用して、6カ月にわたって実施された。その研究の参加者は、少なくとも2つの心臓血管疾患(CVD)危険要因を伴う、年齢25〜45歳の90名のアフリカ系アメリカ人の女性であった。その研究は、CVDに対する予防対策として、危険要因を低減することを対象とした。
Wanda−CVDは、スマートフォンベースであり、無線コーチングおよび社会的支援を参加者に提供するように設計される。その研究では、介入群内の45名の参加者が、Wanda−CVDシステムを介して、栄養およびライフスタイル教育を受けた。対照群が、教育の制限および遠隔監視ではないものを含んだ標準的ケアを受けた。
スマートフォンは、Wi−Fiおよび3G/4G技術を使用して、リアルタイムで、参加者に測定されたデータを伝送する。Wanda−CVDは、自動無線コーチングを介した社会的支援から結果として生じる、影響およびライフスタイルの変化を分析する。4つの教育クラスを受けた介入群が、食事の自己管理、栄養素、身体的活動性、およびストレス低減に集中した。コレステロールレベル、血圧、およびBMIのベースラインが、検討され、参加者は、人口統計学および心理社会学の質問表に記入した。参加者はまた、教育クラスに参加した。参加者は、スマートフォンおよび血圧計をどのように装着かつ管理するかを教示された。参加者は、スマートフォンの主要目的が、自動フィードバックのためのユーザインターフェースおよび機構を提供しながら、身体的活動性を追跡することであることが伝えられた。対象は、無制限の携帯電話のメールを送信/受信することが可能であり、無制限のデータプランを有した。
治験の参加者の大多数は、陽性転帰を有したが、多くのものは、役立たなかった。研究からのデータは、どの人が、RHMシステムを使用して、成功するかをより深く理解するためだけでなく、患者をRHMシステムに登録することに先立って、スクリーニング質問のセットを識別するためにも、RHM転帰成功の予測因子を見出すために使用された。これは、時間およびリソースを節約し、現在の健康監視システムを形作り、異なる母集団により良好に適することに役立ち得る。加えて、脱落率が質問表の長さに伴って増加するため、予測モデルを開発することは、研究の目的および成功基準に関するより影響のある質問を識別することによって、参加者への負担を低減し得る。
臨床研究では、様々な生理学的かつ心理学的情報が、参加者から集められた。
対面のベースライン訪問と、3カ月および6カ月の経過観察訪問の間、生理学的および心理学的測定は、身体計測基準、質問表、およびソフトウェアプログラムを使用して、検討された。
脂質レベル(すなわち、総コレステロール、HDL、LDL、およびトリグリセリド)が、診療現場試験のために設計された小型かつ軽量の分析器である、Cholestechを使用して分析された。BMIは、専門グレードの身長計(secca 225 Hite−Mobile)および大容量電子体重計(S6600、Summit)を使用して、測定された身長および体重から計算された。胴囲は、身体計測標準化参照マニュアルに推奨される標準的手順に従って測定された。胴囲は、専門グレードの身体計測用巻き尺を使用して、最も近いセンチメートルまで測定された。
参加者は、いくつかの質問表に記入した。質問表は、表2に列挙されるもの等の分類に群化された。
生理学的および心理学的測定は、臨床研究の分析から、成功の予測因子を判定するためのコンテキストデータおよび転帰データを提供する。臨床研究を分析する際の目標は、参加者のCVD研究の転帰成功を判定することを対象とする質問のサブセットを判定することであった。臨床研究の結果が提供され、後に、臨床研究の分析から、予測因子を判定する考察が続く。
6カ月研究の結果は、参加者の49%がWCの低減、30%がBMIの減少、60%がHDLレベルの増加、55%がLDLレベルの減少をもたらす、転帰を含んでいた。
臨床研究の分析では、いくつかの特徴選択技術が、評価され、好ましい特徴選択技術が、予測因子を識別するためのその能力に基づいて、選択された。特徴選択技術は、概して、具体的な指標に焦点を当て、特徴の関連性および/または冗長性を定量化し、予測のための有用な情報の最大量を提供する特徴の最小サブセットを見出す。特徴選択技術の目標は、所与の特徴セットにおける冗長または無関係な特徴を排除することである。効果的な特徴選択技術を適用することが、次元性および冗長性を低減させることによって本システムの算出の複雑性を減少させるだけでなく、また、無関係かつ混同情報を削除することによって分類子の性能を増加させる。
特徴選択技術の2つの分類は、フィルタ技術およびラッパ技術である。フィルタ技術は、具体的な指標を使用し、各個人の特徴(または、ともに特徴のサブセット)をスコア化し、ラッパ技術より高速で、はるかに算出的に集約的ではない場合がある。ラッパ技術は、分類子を使用し、その予測力に従って、反復様式で特徴サブセットを評価する。
臨床研究の分析に関して、ラッパ分類が選択され、試験が、特徴サブセットおよび分類子の複数の組み合わせに実施された。使用された分類子は、kNN、BayesNet、SVM、Random Forest、およびC4.5DTを含んでいた。特徴サブセットおよび分類子の組み合わせ毎に、確率が、分類子によって特徴に割り当てられ、確率の割り当ての精度は、組み合わせをグレード分けするために使用された。グレードは、次いで、好ましい特徴サブセットおよび好ましい分類子の組み合わせを選択するために使用された。臨床研究を分析することに関して説明されるように、分類子の選択は、本開示の概念に従って、随意であることに留意されたい。ある分類子が、最初に選択され、次いで、好ましい特徴サブセットを続いて識別するために、使用されてもよい。
特性曲線(CC)は、確率割当の精度を特性評価するために使用された。CCを作成するために、確率閾値のシーケンスが、設定され、各確率閾値において、真陽性率(TPR)および偽陽性率(FPR)が、閾値を上回る確率を伴う特徴に対して判定された。TPR/FPR判定は、高確率(包含された特徴が存在しない、または実質的に存在しない、ひいては、真陽性または偽陽性が存在しないような)と、低確率(全て、または実質的に全ての特徴が、包含され、ひいては、真陽性とともに多くの偽陽性が、包含されるような)との間の確率閾値に対して実施された。異なる閾値設定におけるFPR対TPRのプロットが、CCをもたらす。曲線下面積(AUC)は、次いで、判別力、すなわち、臨床研究の転帰分類毎に参加者の転帰を正確に分類するための能力を測定するために使用されることができる。AUCは、次いで、特徴サブセットおよび分類子の種々の組み合わせを比較するために利用可能であった。
100本の木を伴うランダム森分類子が、迅速かつ略正確な予測結果を提供するため、臨床研究のための分類子として選択された。
図16は、臨床研究からのデータに関するWAIST−C、BMI、HDL、およびLDL転帰のそれぞれのためのCCを例証する。WAIST−Cに関するAUCは、92.4%である一方、BMIに関するAUCは、73%である。WCに関するものを下回るBMIに関するAUCは、WCがBMIよりも心臓血管疾患危険要因により密接につながる事前調査を裏付け、AUC技術が、本開示に説明される他の利点に加えて、所与の転帰のために、相互に予測因子を比較する際に有用な情報を提供することを例証する。
臨床研究データに基づく転帰のための予測因子として選択される特徴が、次に、説明される。
胴囲(WC)。参加者の約48%が、6カ月の介入の終了時に、少なくとも1インチWCが減っており、これは、転帰の成功として事前に定義された。WC転帰成功のための予測因子として識別された特徴は、ほとんど、分類PMT、INSURA、SF、およびFAMHXと関連付けられた。以下の特徴は、ピアソン相関係数を使用して、選択された。
1)PMT14:(あなたの健康に関する考え)私が知っているのは、塩と脂肪だけを用いた料理である?
利用可能である応答は、「非常にそう思う」から「全くそう思わない」とした。
2)INSURA:(一般情報)、あなたは、現在、以下の健康保険のいずれかの適用を受けているか?政府系保険(メディケア、メディケイド、退役軍人の管理健康プラン、軍隊医療保険プラン、または他の政府系補償ケア)。
利用可能である応答は、2つの「はい」または「いいえ」のうちのいずれかとした。
3)SF−3A:過去4週間の間、身体的な健康の結果として、仕事または他の規則的な毎日の活動に関してこの問題にどれくらい悩まされたか?あなたが望んだ達成を下回ったか。
利用可能である応答は、「いつも」から「全くない」とした。
4)FAMHX:脳卒中/TIAを患う祖父母または心臓疾患を患う母親。
利用可能である応答は、2つの「はい」または「いいえ」のうちのいずれかとした。
塩と脂肪だけを用いた料理しか知らないかという質問に対して「そう思わない」により近かった参加者は、その研究において良好であった一方、同意できた人は、胴囲の減少に成功しなかった(すなわち、WC転帰の非成功をもたらした)。政府機関保険加入者および低所得者は、WCが減少した(すなわち、WC転帰の成功をもたらした)。仕事または毎日の活動中、機能的問題があった参加者のうち40%は、WC転帰の成功をもたらした。脳卒中または心臓疾患を患う一等親血縁者がいる参加者もまた、WC転帰の成功をもたらした。
1)PMT14:(あなたの健康に関する考え)私が知っているのは、塩と脂肪だけを用いた料理である?
利用可能である応答は、「非常にそう思う」から「全くそう思わない」とした。
2)INSURA:(一般情報)、あなたは、現在、以下の健康保険のいずれかの適用を受けているか?政府系保険(メディケア、メディケイド、退役軍人の管理健康プラン、軍隊医療保険プラン、または他の政府系補償ケア)。
利用可能である応答は、2つの「はい」または「いいえ」のうちのいずれかとした。
3)SF−3A:過去4週間の間、身体的な健康の結果として、仕事または他の規則的な毎日の活動に関してこの問題にどれくらい悩まされたか?あなたが望んだ達成を下回ったか。
利用可能である応答は、「いつも」から「全くない」とした。
4)FAMHX:脳卒中/TIAを患う祖父母または心臓疾患を患う母親。
利用可能である応答は、2つの「はい」または「いいえ」のうちのいずれかとした。
塩と脂肪だけを用いた料理しか知らないかという質問に対して「そう思わない」により近かった参加者は、その研究において良好であった一方、同意できた人は、胴囲の減少に成功しなかった(すなわち、WC転帰の非成功をもたらした)。政府機関保険加入者および低所得者は、WCが減少した(すなわち、WC転帰の成功をもたらした)。仕事または毎日の活動中、機能的問題があった参加者のうち40%は、WC転帰の成功をもたらした。脳卒中または心臓疾患を患う一等親血縁者がいる参加者もまた、WC転帰の成功をもたらした。
肥満度指数(BMI)。参加者の約30%は、6カ月の介入の終了時に、BMI転帰の成功として事前に定義された、1ポンド/インチ2(またはそれを上回る)減っていた。(BMI転帰の成功を伴う人の57%はまた、WC転帰の成功をもたらした)。BMI転帰の成功のための予測因子として識別された特徴は、ほとんど、分類(STRESSおよびSOCSUP)と関連付けられた。以下の特徴は、ピアソン相関係数を使用して、選択された。
1)STRESS4:あなたは、別居、離婚、失業、退職、事業の失敗、暴力、近親家族の死または大きな損傷もしくは病気、配偶者の死、あるいは他の大きなストレス等、過去1年以内に人生の大きな出来事を経験したか?
利用可能である応答は、2つの「はい」または「いいえ」のうちのいずれかとした。
2)STRESS1:あなたは、自宅でストレスを感じているか?
利用可能である応答は、「1度も自宅でストレスを感じたことがない」から「自宅で常時ストレスを感じている」とした。
3)SOCSUP7:私は、物事がうまくいかないとき、友人を頼りにすることができる。
利用可能である応答は、「非常にそう思う」から「全くそう思わない」とした。
過去1年以内に人生の大きな出来事を経験した参加者(STRESS4)のうち89%は、BMI転帰の成功をもたらさなかった。自宅で常時ストレスを感じている、またはある時期にわたってストレスを感じていたと応答した参加者はまた、BMI転帰の成功をもたらさず、BMI転帰の成功をもたらさなかった参加者の86%は、自宅でストレスを感じていなかった。1人を除いて、BMI転帰の成功をもたらした全ての参加者は、頼り得る友人を有していた(SOCSUP7)。
1)STRESS4:あなたは、別居、離婚、失業、退職、事業の失敗、暴力、近親家族の死または大きな損傷もしくは病気、配偶者の死、あるいは他の大きなストレス等、過去1年以内に人生の大きな出来事を経験したか?
利用可能である応答は、2つの「はい」または「いいえ」のうちのいずれかとした。
2)STRESS1:あなたは、自宅でストレスを感じているか?
利用可能である応答は、「1度も自宅でストレスを感じたことがない」から「自宅で常時ストレスを感じている」とした。
3)SOCSUP7:私は、物事がうまくいかないとき、友人を頼りにすることができる。
利用可能である応答は、「非常にそう思う」から「全くそう思わない」とした。
過去1年以内に人生の大きな出来事を経験した参加者(STRESS4)のうち89%は、BMI転帰の成功をもたらさなかった。自宅で常時ストレスを感じている、またはある時期にわたってストレスを感じていたと応答した参加者はまた、BMI転帰の成功をもたらさず、BMI転帰の成功をもたらさなかった参加者の86%は、自宅でストレスを感じていなかった。1人を除いて、BMI転帰の成功をもたらした全ての参加者は、頼り得る友人を有していた(SOCSUP7)。
脂質状態HDL。参加者の約58%は、HDL転帰の成功として事前に定義された、そのHDLレベルを増加させることに成功した。HDLの転帰成功のための予測因子として識別された特徴は、ほとんど、分類(PMT、MOSSAS、SF、およびPHQ)と関連付けられた。以下の特徴が、選択された。
1)PMT29:私の家族は、私が健康食品を料理する場合でも、それを食べないであろう。
利用可能である応答は、「非常にそう思う」から「全くそう思わない」とした。
2)PMT23:私が望む場合、私は、より少ない塩と脂肪を伴う食品を食べることができる。
利用可能である応答は、「非常にそう思う」から「全くそう思わない」とした。
3)MOSSAS9:食事時、ナトリウムを制限した(1日あたり2500mg未満を摂取した)。
利用可能である応答は、「いつも」から「全くない」とした。
4)SF3B:過去4週間の間、身体的な健康の結果として、仕事または他の規則的な毎日の活動に関してこの問題にどれくらい悩まされたか?仕事または他の活動の種類が制限されたのか。
利用可能である応答は、「いつも」から「全くない」とした。
5)PHQ9:あなたが何らかの方法で自殺または自傷することでより楽になるであろうという考えがあるか。利用可能である応答は、「全くそうではない」から「ほとんど毎日」とした。
PMTはまた、HDLレベルを予測する際の重要な特徴であることが分かる。別の重要な予測因子は、食事の順守であって、その食事時のそのナトリウムを制限した参加者は、HDL転帰の成功をもたらした。仕事または毎日の活動中、機能的問題があった参加者は、HDL転帰の不成功をもたらした。自殺または自傷の考えがある参加者(PHQ9)は、HDL転帰の不成功をもたらした。
1)PMT29:私の家族は、私が健康食品を料理する場合でも、それを食べないであろう。
利用可能である応答は、「非常にそう思う」から「全くそう思わない」とした。
2)PMT23:私が望む場合、私は、より少ない塩と脂肪を伴う食品を食べることができる。
利用可能である応答は、「非常にそう思う」から「全くそう思わない」とした。
3)MOSSAS9:食事時、ナトリウムを制限した(1日あたり2500mg未満を摂取した)。
利用可能である応答は、「いつも」から「全くない」とした。
4)SF3B:過去4週間の間、身体的な健康の結果として、仕事または他の規則的な毎日の活動に関してこの問題にどれくらい悩まされたか?仕事または他の活動の種類が制限されたのか。
利用可能である応答は、「いつも」から「全くない」とした。
5)PHQ9:あなたが何らかの方法で自殺または自傷することでより楽になるであろうという考えがあるか。利用可能である応答は、「全くそうではない」から「ほとんど毎日」とした。
PMTはまた、HDLレベルを予測する際の重要な特徴であることが分かる。別の重要な予測因子は、食事の順守であって、その食事時のそのナトリウムを制限した参加者は、HDL転帰の成功をもたらした。仕事または毎日の活動中、機能的問題があった参加者は、HDL転帰の不成功をもたらした。自殺または自傷の考えがある参加者(PHQ9)は、HDL転帰の不成功をもたらした。
脂質状態LDL。参加者の約57%は、LDL転帰の成功として事前に定義された、そのLDLレベルを低減した。LDL転帰の成功のための予測因子として識別された特徴は、ほとんど、分類(BRIEFS、PHQ、およびPMT)と関連付けられた。以下の特徴が、選択された。
1)BRIEFS2:理由もなく突然驚かせられることによって、どれくらい動揺したか?
利用可能である応答は、「全くない」から「非常に」とした。
2)BRIEFS5:発作または恐怖心、もしくはパニックによってどれくらい動揺したか?
利用可能である応答は、「全くない」から「非常に」とした。
3)PHQ4:過去2週間にわたって、疲労または無気力にどのくらいの頻度で悩まされたか?
利用可能である応答は、「全くない」から「ほとんど毎日」とした。
4)PHQ7:過去2週間にわたって、新聞を読む、またはテレビを見る等の物事に集中することの困難にどのくらいの頻度で悩まされたか?
利用可能である応答は、「全くない」から「ほとんど毎日」とした。
5)PMT20:私が心臓疾患を患う可能性は非常に低い。
利用可能である応答は、「非常にそう思う」から「全くそう思わない」とした。
6)PMT25:私の年代の他の人々と比較して、今後、心臓疾患を患う可能性はそれほど高くない。
利用可能である応答は、「非常にそう思う」から「全くそう思わない」とした。
突然の恐怖からの苦痛の結果として、強い不安を感じる参加者(BRIEFS2)は、LDL転帰の不成功をもたらした。発作または恐怖心、もしくはパニックによって動揺した参加者(BRIEFS5)のうち83%は、HDL転帰の不成功をもたらした。疲労または無気力に関して、「多くの場合」により近い応答をした参加者(PHQ4)の75%は、HDL転帰の不成功をもたらした。また、新聞を読む、またはテレビを見る等の物事に集中することが困難である全ての参加者は、HDL転帰の不成功をもたらした。
1)BRIEFS2:理由もなく突然驚かせられることによって、どれくらい動揺したか?
利用可能である応答は、「全くない」から「非常に」とした。
2)BRIEFS5:発作または恐怖心、もしくはパニックによってどれくらい動揺したか?
利用可能である応答は、「全くない」から「非常に」とした。
3)PHQ4:過去2週間にわたって、疲労または無気力にどのくらいの頻度で悩まされたか?
利用可能である応答は、「全くない」から「ほとんど毎日」とした。
4)PHQ7:過去2週間にわたって、新聞を読む、またはテレビを見る等の物事に集中することの困難にどのくらいの頻度で悩まされたか?
利用可能である応答は、「全くない」から「ほとんど毎日」とした。
5)PMT20:私が心臓疾患を患う可能性は非常に低い。
利用可能である応答は、「非常にそう思う」から「全くそう思わない」とした。
6)PMT25:私の年代の他の人々と比較して、今後、心臓疾患を患う可能性はそれほど高くない。
利用可能である応答は、「非常にそう思う」から「全くそう思わない」とした。
突然の恐怖からの苦痛の結果として、強い不安を感じる参加者(BRIEFS2)は、LDL転帰の不成功をもたらした。発作または恐怖心、もしくはパニックによって動揺した参加者(BRIEFS5)のうち83%は、HDL転帰の不成功をもたらした。疲労または無気力に関して、「多くの場合」により近い応答をした参加者(PHQ4)の75%は、HDL転帰の不成功をもたらした。また、新聞を読む、またはテレビを見る等の物事に集中することが困難である全ての参加者は、HDL転帰の不成功をもたらした。
臨床研究の分析は、転帰WC、BMI、HDL、およびLDLのそれぞれのために、転帰の成功を予測するための好ましい特徴のセットを提供した。いずれは、特徴のセット内の特徴のうちの1つまたはそれを上回るものを呈する個人または個人の群が、関連付けられたWC、BMI、HDL、またはLDL転帰の危険に曝されるものとして識別され得る。セット内の個人の特徴は、セット内の特徴の相対予測能力に対応するように加重されてもよい、または正規化されてもよい。加重および/または正規化は、例えば、介入、ケア、または支援の適切なレベルを提供するために、予測プロセスにおいて解明の向上をもたらし得る。
本開示の実施形態は、種々のコンピュータ実装動作を実施するためのコンピュータコードをその上に有する、非一過性コンピュータ可読記憶媒体に関する。「コンピュータ可読記憶媒体」という用語は、本明細書では、本明細書に説明される動作、方法論、および技法を実施するための命令またはコンピュータコードのシーケンスを記憶またはエンコードすることが可能な任意の媒体を含むように使用される。媒体およびコンピュータコードは、本開示の実施形態の目的のために特別に設計および構築されたものであってもよく、またはコンピュータソフトウェア技術の当業者に周知であり、利用可能な種類のものであってもよい。コンピュータ可読記憶媒体の実施例として、限定ではないが、ハードディスク、フロッピー(登録商標)ディスク、および磁気テープ等の磁気媒体と、CD−ROMおよびホログラフィックデバイス等の光媒体と、光ディスク等の光磁気記録媒体と、特定用途向け集積回路(「ASIC」)、プログラム可能論理デバイス(「PLD」)、ならびにROMおよびRAMデバイス等、プログラムコードを記憶および実行するように特別に構成されるハードウェアデバイスとが挙げられる。
コンピュータコードの実施例として、コンパイラによって生成されるような機械コードと、インタープリタまたはコンパイラを使用するコンピュータによって実行されるより高いレベルのコードを含有するファイルとが挙げられる。例えば、本開示の実施形態は、Java(登録商標)、C++、または他のオブジェクト指向プログラミング言語と、開発ツールとを使用して実装され得る。コンピュータコードの付加的実施例として、暗号化されたコードおよび圧縮コードが挙げられる。さらに、本開示の実施形態は、コンピュータプログラム製品としてダウンロードされてもよく、これは、伝送チャネルを介してリモートコンピュータ(例えば、サーバコンピュータ)から、要求側コンピュータ(例えば、クライアントコンピュータまたは異なるサーバコンピュータ)に伝達され得る。本開示の別の実施形態は、機械実施可能ソフトウェア命令の代わりに、またはそれと組み合わせて、接続された回路に実装されてもよい。
本明細書で使用されるように、「実質的に」および「約」は、わずかな変形例を説明し、考慮するために使用される。イベントまたは状況と併せて使用されるとき、本用語は、イベントまたは状況が精密に発生する事例ならびにイベントまたは状況が近似値で発生する事例に言及することができる。例えば、本用語は、±5%未満またはそれに等しい、±4%未満またはそれに等しい、±3%未満またはそれに等しい、±2%未満またはそれに等しい、±1%未満またはそれに等しい、±0.5%未満またはそれに等しい、±0.1%未満またはそれに等しい、または±0.05%未満またはそれに等しい等、±10%未満またはそれに等しいものに言及することができる。
本開示は、その具体的実施形態に関連して説明されているが、添付される請求項によって定義されるように、本開示の真の精神および範囲から逸脱することなく、種々の変更がなされ、また、均等物が代用されてよいことが、当業者によって理解されるはずである。加えて、多くの修正が、特定の状況、材料、組成物、方法、動作、または複数の動作を、本開示の目的、精神、および範囲に適合させるためになされてよい。全てのそのような修正は、本明細書に添付される請求項の範囲内であることが意図される。特に、ある方法は、特定の順序で実施される特定の動作に関連して説明され得るが、これらの動作は、本開示の教示から逸脱することなく、均等方法を形成するために、組み合わせられ、細分化され、または再順序付けされ得ることが理解されるであろう。故に、本明細書に具体的に示されない限り、動作の順序および分類は、本開示の制限ではない。
Claims (21)
- 環境的、生理学的、行動的、および履歴コンテキストのうちの少なくとも1つに関連するコンテキストデータを受信するステップと、
少なくとも1つの転帰に関連する転帰データを受信するステップと、
特徴セットを前記コンテキストデータから作成するステップと、
特徴のサブセットを前記特徴セットから選択するステップと、
前記特徴が前記少なくとも1つの転帰の予測因子である確率に従って、スコアを特徴の前記サブセットにおける各特徴に割り当てるステップと、
前記少なくとも1つの転帰のための特性曲線を前記特徴のサブセットから生成するステップであって、前記特性曲線は、前記スコア化に基づく、ステップと、
特性曲線下面積を計算するステップと、
前記特性曲線下面積を使用して、前記特徴のサブセットが前記少なくとも1つの転帰のための好適な予測因子かどうかを識別するステップと
を含む、方法。 - 特性曲線を生成するステップは、
確率閾値を設定するステップと、
特徴群を前記特徴のサブセットから選択するステップであって、前記特徴群における特徴毎に、前記割り当てられたスコアは、前記確率閾値を上回る、ステップと、
前記特徴群における特徴の前記コンテキストデータのために、前記転帰の予測の真陽性率および偽陽性率を判定するステップと、
前記確率閾値のための前記真陽性率および前記偽陽性率をプロット化するステップと
を反復的に含む、請求項1に記載の方法。 - 前記特性曲線は、複数の特性曲線のうちの1つであり、前記特性曲線下面積を前記複数の特性曲線における他の特性曲線下面積と比較するステップと、前記比較するステップに基づいて、好ましい予測因子を識別するステップとをさらに含む、請求項1に記載の方法。
- 前記特性曲線は、複数の特性曲線のうちの1つであり、前記特性曲線下面積を前記複数の特性曲線における他の特性曲線下面積と比較するステップと、前記比較するステップに基づいて、好ましいスコア化技術を識別するステップとをさらに含む、請求項1に記載の方法。
- 前記特徴のサブセットに基づいて、前記少なくとも1つの転帰のための予測モデルを生成するステップをさらに含む、請求項1に記載の方法。
- 付加的コンテキストデータを受信するステップと、
前記予測モデルを使用して、前記付加的コンテキストデータに基づいて、転帰を予測するステップと
をさらに含む、請求項5に記載の方法。 - 前記付加的コンテキストデータは、個人の群に関するデータを含み、前記予測された転帰は、前記個人の群のための前記転帰の予測である、請求項6に記載の方法。
- 前記コンテキストデータは、複数のソースからのデータを含む、請求項1に記載の方法。
- 前記コンテキストデータは、複数の個人に関するデータを含む、請求項1に記載の方法。
- 前記コンテキストデータは、複数の時間において取り出されたデータを含む、請求項1に記載の方法。
- プロセッサ実行可能命令を含むメモリと、
前記メモリからの命令を実行するように構成されるプロセッサであって、前記命令は、前記プロセッサが、
コンテキストデータおよび転帰データを受信することと、
特徴セットを前記コンテキストデータから作成することと、
複数の特徴サブセットを前記特徴セットから選択することと、
前記複数の特徴サブセットのそれぞれのために、前記特徴サブセットおよび前記転帰データを分類子に適用させ、前記特徴サブセットのためにスコアを判定することと、
前記複数の特徴サブセットのそれぞれのための前記スコアに基づいて、好ましい特徴サブセットを選択することと、
前記好ましい特徴サブセットを使用して、予測モデルを生成することと
を行うための命令を含む、プロセッサと
を備える、システム。 - 前記命令はさらに、前記プロセッサが、前記コンテキストデータをクラスタ化するための命令を含み、前記特徴セットを前記クラスタ化されたコンテキストデータの少なくとも一部から作成する、請求項11に記載のシステム。
- 前記クラスタ化されたコンテキストデータは、複数のデータクラスタを含み、前記特徴セットを作成する前記命令は、複数の特徴セットを前記複数のデータクラスタのそれぞれのものから作成する命令を含む、請求項12に記載のシステム。
- 前記転帰データは、複数の異なる転帰を表すデータを含む、請求項11に記載のシステム。
- 前記命令はさらに、前記プロセッサが、付加的コンテキストデータを受信するための命令を含み、前記予測モデルを使用して、転帰を前記付加的コンテキストデータから予測する、請求項11に記載のシステム。
- 前記転帰データは、少なくとも1つの転帰を表し、前記複数の特徴サブセットのそれぞれのために前記スコアを判定する前記命令は、前記プロセッサが、特徴サブセット毎に、
前記分類子を使用し、前記特徴セットにおける特徴毎に確率測度を判定することであって、前記確率測度は、前記少なくとも1つの転帰のうちの転帰に対する前記特徴の予測度の指標である、ことと、
真陽性率対偽陽性率の特性曲線を作成することであって、前記特性曲線の各点は、前記特徴セットの一部を表し、前記特徴セットの各部分は、確率測度閾値に基づいて、選択される、ことと、
特性曲線下面積として、前記スコアを計算することと
を行うための命令を含む、請求項11に記載のシステム。 - プロセッサ実行可能命令を含むプロセッサ可読物理的媒体であって、前記命令は、
転帰情報および前記転帰情報に関連するコンテキスト情報を受信することと、
前記転帰情報およびコンテキスト情報を事前処理することと、
特徴セットを前記事前処理されたコンテキスト情報から作成することと、
スコアを前記特徴セットにおける前記特徴のうちの少なくともいくつかに割り当てることであって、スコアが、前記転帰情報によって記述される転帰を予測するための前記特徴の能力に従って特徴に割り当てられる、ことと、
前記スコアを使用して、特性曲線のセットを判定することであって、各特性曲線は、前記転帰を予測する能力を表す、ことと、
前記特性曲線のセットにおける前記特性曲線のそれぞれのためのスコアを計算することと、
前記特性曲線のそれぞれのための前記スコアに基づいて、前記特徴セットからの特徴を含む予測因子を識別することと
を行うための命令を備える、プロセッサ可読物理的媒体。 - 前記転帰情報は、複数の異なる転帰を表すデータを含む、請求項17に記載のプロセッサ可読物理的媒体。
- 前記事前処理は、冗長特徴および無関係特徴を除去することを含む、請求項17に記載のプロセッサ可読物理的媒体。
- 前記命令はさらに、
前記予測因子内に含まれる特徴に関連するコンテキスト情報のプールを識別することと、
前記プールを複数のスコアラに個々に適用することと、
前記プールに基づいて、前記複数のスコアラのうちのスコアラ毎に特性曲線を判定することと、
前記選択されたスコアラのための前記特性曲線に関連する測定に基づいて、スコアラを前記複数のスコアラから選択することと
を行うための命令を備える、請求項17に記載のプロセッサ可読物理的媒体。 - 前記スコアを計算するための命令は、データ収集およびデータ処理のうちの1つのコストを最小限にするための命令を含む、請求項17に記載のプロセッサ可読物理的媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361823230P | 2013-05-14 | 2013-05-14 | |
US61/823,230 | 2013-05-14 | ||
PCT/US2014/037887 WO2014186387A1 (en) | 2013-05-14 | 2014-05-13 | Context-aware prediction in medical systems |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016520228A true JP2016520228A (ja) | 2016-07-11 |
Family
ID=51896598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016514041A Pending JP2016520228A (ja) | 2013-05-14 | 2014-05-13 | 医療システムにおけるコンテキスト意識予測 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9754081B2 (ja) |
EP (1) | EP2997514A4 (ja) |
JP (1) | JP2016520228A (ja) |
WO (1) | WO2014186387A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019044642A1 (ja) * | 2017-08-30 | 2019-03-07 | 日本電気株式会社 | 医療情報処理装置、医療情報処理方法および記憶媒体 |
KR20200088012A (ko) * | 2019-01-14 | 2020-07-22 | 인하대학교 산학협력단 | 반도체 제조 공정에서 특징 선택 기법에 따른 멀티 분류기를 활용한 불량 패턴 예측 장치 및 방법 |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014155690A1 (ja) * | 2013-03-29 | 2014-10-02 | 富士通株式会社 | モデル更新方法、装置、およびプログラム |
WO2016081946A1 (en) * | 2014-11-21 | 2016-05-26 | The Regents Of The University Of California | Fast behavior and abnormality detection |
US10095682B2 (en) * | 2015-07-29 | 2018-10-09 | Mark43, Inc. | Determining incident codes using a decision tree |
US10347370B1 (en) * | 2015-08-17 | 2019-07-09 | Aetion Inc. | Deriving a patient level longitudinal database for rapid cycle analytics |
US20180268936A1 (en) | 2015-09-28 | 2018-09-20 | Koninklijke Philips N.V. | Pulse oximeter user interface customized to a doctor |
WO2017117375A1 (en) * | 2015-12-29 | 2017-07-06 | Lifeq Global Limited | Non-invasive measurement of ambulatory blood pressure |
US10069934B2 (en) * | 2016-12-16 | 2018-09-04 | Vignet Incorporated | Data-driven adaptive communications in user-facing applications |
US10430716B2 (en) * | 2016-02-10 | 2019-10-01 | Ground Rounds, Inc. | Data driven featurization and modeling |
DE102017103588A1 (de) * | 2016-02-24 | 2017-08-24 | Jtekt Corporation | Analysevorrichtung und analysesystem |
US20170249437A1 (en) * | 2016-02-25 | 2017-08-31 | Samsung Electronics Co., Ltd. | Sensor assisted depression detection |
US11164596B2 (en) | 2016-02-25 | 2021-11-02 | Samsung Electronics Co., Ltd. | Sensor assisted evaluation of health and rehabilitation |
US20170308981A1 (en) * | 2016-04-22 | 2017-10-26 | New York University | Patient condition identification and treatment |
WO2017217881A1 (en) * | 2016-06-14 | 2017-12-21 | Huawei Technologies Co., Ltd. | Acceleration of svm clustering technology using chebyshev iteration technique |
US11308049B2 (en) | 2016-09-16 | 2022-04-19 | Oracle International Corporation | Method and system for adaptively removing outliers from data used in training of predictive models |
WO2018192831A1 (en) * | 2017-04-20 | 2018-10-25 | Koninklijke Philips N.V. | Learning and applying contextual similarities between entities |
JP2021501384A (ja) * | 2017-07-06 | 2021-01-14 | リキッド バイオサイエンシズ,インコーポレイテッド | 次元削減により計算時間を減少させるための方法 |
US11139048B2 (en) | 2017-07-18 | 2021-10-05 | Analytics For Life Inc. | Discovering novel features to use in machine learning techniques, such as machine learning techniques for diagnosing medical conditions |
US11062792B2 (en) | 2017-07-18 | 2021-07-13 | Analytics For Life Inc. | Discovering genomes to use in machine learning techniques |
US11331019B2 (en) | 2017-08-07 | 2022-05-17 | The Research Foundation For The State University Of New York | Nanoparticle sensor having a nanofibrous membrane scaffold |
WO2019063520A1 (en) * | 2017-09-26 | 2019-04-04 | Koninklijke Philips N.V. | SYSTEM AND METHOD FOR JOINT CLINICAL DECISION FOR PHARMACEUTICAL PRODUCTS |
US11342050B2 (en) | 2019-09-27 | 2022-05-24 | International Business Machines Corporation | Monitoring users to capture contextual and environmental data for managing adverse events |
US11769063B2 (en) | 2019-10-21 | 2023-09-26 | International Business Machines Corporation | Providing predictive analytics with predictions tailored for a specific domain |
US11538559B2 (en) | 2020-05-14 | 2022-12-27 | Merative Us L.P. | Using machine learning to evaluate patients and control a clinical trial |
US11651243B2 (en) * | 2020-05-14 | 2023-05-16 | Merative Us L.P. | Using machine learning to evaluate data quality during a clinical trial based on participant queries |
US11556806B2 (en) * | 2020-05-14 | 2023-01-17 | Merative Us L.P. | Using machine learning to facilitate design and implementation of a clinical trial with a high likelihood of success |
US11102304B1 (en) | 2020-05-22 | 2021-08-24 | Vignet Incorporated | Delivering information and value to participants in digital clinical trials |
US11586524B1 (en) * | 2021-04-16 | 2023-02-21 | Vignet Incorporated | Assisting researchers to identify opportunities for new sub-studies in digital health research and decentralized clinical trials |
US11789837B1 (en) | 2021-02-03 | 2023-10-17 | Vignet Incorporated | Adaptive data collection in clinical trials to increase the likelihood of on-time completion of a trial |
US11196656B1 (en) | 2021-02-03 | 2021-12-07 | Vignet Incorporated | Improving diversity in cohorts for health research |
US11296971B1 (en) | 2021-02-03 | 2022-04-05 | Vignet Incorporated | Managing and adapting monitoring programs |
US11281553B1 (en) | 2021-04-16 | 2022-03-22 | Vignet Incorporated | Digital systems for enrolling participants in health research and decentralized clinical trials |
US11901083B1 (en) | 2021-11-30 | 2024-02-13 | Vignet Incorporated | Using genetic and phenotypic data sets for drug discovery clinical trials |
US11705230B1 (en) | 2021-11-30 | 2023-07-18 | Vignet Incorporated | Assessing health risks using genetic, epigenetic, and phenotypic data sources |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070100666A1 (en) | 2002-08-22 | 2007-05-03 | Stivoric John M | Devices and systems for contextual and physiological-based detection, monitoring, reporting, entertainment, and control of other devices |
US7899225B2 (en) | 2006-10-26 | 2011-03-01 | Mcgill University | Systems and methods of clinical state prediction utilizing medical image data |
WO2008124138A1 (en) * | 2007-04-05 | 2008-10-16 | Aureon Laboratories, Inc. | Systems and methods for treating, diagnosing and predicting the occurrence of a medical condition |
US7505867B2 (en) | 2007-05-21 | 2009-03-17 | General Electric Co. | System and method for predicting medical condition |
US7695434B2 (en) | 2007-10-19 | 2010-04-13 | Lifescan Scotland, Ltd. | Medical device for predicting a user's future glycemic state |
US8346349B2 (en) * | 2008-01-16 | 2013-01-01 | Massachusetts Institute Of Technology | Method and apparatus for predicting patient outcomes from a physiological segmentable patient signal |
CA2737755A1 (en) * | 2008-09-19 | 2010-03-25 | Duke University | Systems and methods for generating an osteoarthritis progression predictor and systems and methods for using the predictor |
US20110046805A1 (en) * | 2009-08-18 | 2011-02-24 | Honeywell International Inc. | Context-aware smart home energy manager |
EP2365456B1 (en) | 2010-03-11 | 2016-07-20 | CompuGroup Medical SE | Data structure, method and system for predicting medical conditions |
CN103189883A (zh) * | 2010-09-07 | 2013-07-03 | 里兰斯坦福初级大学理事会 | 医学评分系统及方法 |
US9017256B2 (en) * | 2010-09-22 | 2015-04-28 | Milieu Institute, Llc | System and method for physiological monitoring |
US9753043B2 (en) * | 2011-12-18 | 2017-09-05 | 20/20 Genesystems, Inc. | Methods and algorithms for aiding in the detection of cancer |
-
2014
- 2014-05-13 JP JP2016514041A patent/JP2016520228A/ja active Pending
- 2014-05-13 US US14/276,660 patent/US9754081B2/en active Active
- 2014-05-13 EP EP14797523.9A patent/EP2997514A4/en not_active Withdrawn
- 2014-05-13 WO PCT/US2014/037887 patent/WO2014186387A1/en active Application Filing
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019044642A1 (ja) * | 2017-08-30 | 2019-03-07 | 日本電気株式会社 | 医療情報処理装置、医療情報処理方法および記憶媒体 |
JPWO2019044642A1 (ja) * | 2017-08-30 | 2020-07-02 | 日本電気株式会社 | 医療情報処理装置、医療情報処理方法およびプログラム |
JP7188390B2 (ja) | 2017-08-30 | 2022-12-13 | 日本電気株式会社 | 医療情報処理装置、医療情報処理方法およびプログラム |
KR20200088012A (ko) * | 2019-01-14 | 2020-07-22 | 인하대학교 산학협력단 | 반도체 제조 공정에서 특징 선택 기법에 따른 멀티 분류기를 활용한 불량 패턴 예측 장치 및 방법 |
KR102182678B1 (ko) * | 2019-01-14 | 2020-11-24 | 인하대학교 산학협력단 | 반도체 제조 공정에서 특징 선택 기법에 따른 멀티 분류기를 활용한 불량 패턴 예측 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
US9754081B2 (en) | 2017-09-05 |
EP2997514A4 (en) | 2017-03-01 |
US20140344208A1 (en) | 2014-11-20 |
WO2014186387A1 (en) | 2014-11-20 |
EP2997514A1 (en) | 2016-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2016520228A (ja) | 医療システムにおけるコンテキスト意識予測 | |
Souri et al. | A new machine learning-based healthcare monitoring model for student’s condition diagnosis in Internet of Things environment | |
JP7001593B2 (ja) | 人工知能およびユーザ入力を用いて発達進度を判定するための方法および装置 | |
Ramkumar et al. | IoT-based patient monitoring system for predicting heart disease using deep learning | |
KR20230002513A (ko) | 휴대용 모니터링 장치의 모니터링에 의한 사용자의 건강 예측 | |
Azbeg et al. | Diabetes emergency cases identification based on a statistical predictive model | |
Goyal et al. | IoT based cloud network for smart health care using optimization algorithm | |
Shukla et al. | Cloud computing with artificial intelligence techniques for effective disease detection | |
Sani et al. | Review on hypertension diagnosis using expert system and wearable devices | |
Ahammad | Risk factor identification for stroke prognosis using machine-learning algorithms | |
Oğur et al. | Development of an artificial intelligence-supported hybrid data management platform for monitoring depression and anxiety symptoms in the perinatal period: Pilot-scale study | |
Ekong et al. | A Softcomputing Model for Depression Prediction. | |
Benfares et al. | A clinical support system for classification and prediction of depression using machine learning methods | |
Prottasha et al. | Impact learning: A learning method from feature’s impact and competition | |
Punarselvam | A pragmatic approach of Parkinson disease detection using hybrid case-based reasoning neuro-fuzzy classification system over Mobile edge computing | |
Blessie et al. | Novel approach for psychiatric patient detection and prediction using data mining techniques | |
AU2021102593A4 (en) | A Method for Detection of a Disease | |
Altun et al. | Application of deep learning and classical machine learning methods in the diagnosis of attention deficit hyperactivity disorder according to temperament features | |
Oliveira et al. | CML-Cardio: a cascade machine learning model to predict cardiovascular disease risk as a primary prevention strategy | |
Guruvammal et al. | Optimal feature selection and hybrid classification for autism detection in young children | |
Sonia et al. | An empirical evaluation of benchmark machine learning classifiers for risk prediction of cardiovascular disease in diabetic males | |
Akazue et al. | Machine Learning Survival Analysis Model for Diabetes Mellitus | |
Al-Dallal et al. | Prediction of non-communicable diseases using class comparison data mining | |
Sukanya et al. | An assessment of machine learning algorithms for healthcare analysis based on improved MapReduce | |
Vamsi et al. | Prediction of Micro Vascular and Macro Vascular Complications in Type-2 Diabetic Patients using Machine Learning Techniques |