JP7335352B2 - アンサンブル・モデルの強化された多様性および学習 - Google Patents

アンサンブル・モデルの強化された多様性および学習 Download PDF

Info

Publication number
JP7335352B2
JP7335352B2 JP2021559389A JP2021559389A JP7335352B2 JP 7335352 B2 JP7335352 B2 JP 7335352B2 JP 2021559389 A JP2021559389 A JP 2021559389A JP 2021559389 A JP2021559389 A JP 2021559389A JP 7335352 B2 JP7335352 B2 JP 7335352B2
Authority
JP
Japan
Prior art keywords
data points
class
clusters
minority
minority class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021559389A
Other languages
English (en)
Other versions
JPWO2020208445A5 (ja
JP2022527366A (ja
Inventor
サテ、サケト
トゥラガ、ディーパク、スリニバス
アッガーワル、チャル
パブルリ、ベンカタ、ナガラジュ
チャン、ユアン-チ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2022527366A publication Critical patent/JP2022527366A/ja
Publication of JPWO2020208445A5 publication Critical patent/JPWO2020208445A5/ja
Application granted granted Critical
Publication of JP7335352B2 publication Critical patent/JP7335352B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2115Selection of the most significant subset of features by evaluating different subsets according to an optimisation criterion, e.g. class separability, forward selection or backward elimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/259Fusion by voting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は一般にコンピューティング・システムに関し、より詳細には、プロセッサによって教師なし機械学習(unsupervised machine learning)を使用して教師ありアンサンブル・モデル(supervised ensemble model)を強化するためのさまざまな実施形態に関する。
今日の社会において、医学のさまざまな進歩は、技術の進歩と相まって、患者のコンピュータ化モニタリング、または患者の健康記録を表すデータの記憶もしくは編成などの付随する多種多様な利益を可能にした。コンピュータ、プロセッサ、ストレージ・デバイスおよびモバイル・コンピューティング・プラットホームは社会の全方面に拡散しているため、患者、保健従事者およびその他の人々の利益のために保健医療技術を強化する追加の機会は到来し続けている。
プロセッサによってアンサンブル・モデルの強化された多様性および学習を実現するためのさまざまな実施形態が提供される。一実施形態では、単なる例として、プロセッサによってアンサンブル・モデルの強化された多様性および学習を実現するための方法が提供される。少数クラス(minority class)のデータ点の1つまたは複数のクラスタを多数クラス(majority class)の選択されたデータ点と結合することによって、1つまたは複数のデータ・セットを生成することができる。教師あり機械学習操作を使用して、この1つまたは複数のデータ・セットから1つまたは複数のアンサンブル・モデルを生成することができる。この1つまたは複数のアンサンブル・モデルを使用して事象の発生を予測することができる。
本発明の利点が容易に理解されるように、添付図面に示された特定の実施形態を参照することによって、上で簡単に説明した発明をより詳細に説明する。これらの図は、本発明の典型的な実施形態だけを示したものであり、したがって本発明の範囲を限定するものであるとはみなされないとの理解を前提に、添付図面を使用することにより、本発明を、追加の特殊性および詳細とともに記述し、説明する。
本発明の実施形態による、例示的なコンピューティング・ノードを示すブロック図である。 本発明の実施形態による、例示的なクラウド・コンピューティング環境を示す追加のブロック図である。 本発明の実施形態による、抽象化モデル層を示す追加のブロック図である。 本発明の態様に従って機能するさまざまなユーザ・ハードウェアおよびコンピューティング構成要素を示す図である。 本発明の態様による、アンサンブル学習および多様性のための操作を示す図である。 本発明の態様による、多様性を強化するアンサンブル・モデル学習のための操作を示す図である。 本発明の態様による、アンサンブル・モデルを使用したラベル予測のための操作を示す図である。 プロセッサによってアンサンブル・モデルの強化された多様性および学習を実現するための例示的な方法の流れ図であり、この方法では、本発明のさまざまな態様を実施することができる。
多くの患者が、真性糖尿病(diabetes mellitus)(「糖尿病(diabetes)」)などの一貫した管理および注意を必要とするさまざまな病気に苦しんでいる。糖尿病は、膵臓が十分なインスリンを産生しないこと、または体の細胞が、産生されたインスリンに適切に反応しないことに起因する。糖尿病の管理は、血糖値を正常に近い値に保ち、低血中グルコース/低血糖(「低血糖症(Hypoglycemia)」)を生じさせないことに重点を置く。低血糖症を防ぐため、糖尿病患者はしばしば、低血中グルコース値に対する「緩衝帯」を提供するために異常に高い血中グルコース値(blood glucose level)を維持する。この一定の高い血中グルコース値は、糖尿病の大部分の長期合併症、すなわち網膜症、神経障害、腎症および心血管疾患の根本的原因である。例えば、現在、低血糖症状態を検出したときに患者に警報を送るリアルタイム連続血糖モニタリングを提供する血糖モニタリング装置が使用可能である。しかしながら、患者の低血糖症状態が検出される前に低血糖症状態を正確に予測するコンピューティング・システムが求められている。
一態様では、例示された実施形態の機構が、機械学習などの人工知能を使用して、コンピュータが、かなりの量の経験的データに基づいて、人間の知能および選択をシミュレートすることを可能にする。機械学習は、糖尿病などの関心の特性、およびそれらの特性の根底にある確率分布を捕捉することができ、訓練データ・セットを使用して機械学習モデルを訓練することができる。モデルまたは規則セットを構築し、それを使用して、いくつかの特徴(feature)の値に基づいて結果を予測することができる。機械学習はデータ・セットを使用することができ、データ・セットは通常、レコードごとに、一組の特徴のうちのそれぞれの特徴の値、および結果を含む。このデータ・セットから、結果を予測するためのモデルまたは規則セットが開発される。
一態様では、機械学習を、低血糖症を予測する(例えば1型および2型糖尿病患者の低血糖症事象を予測する)目的に使用することができる。例えば、インスリンを必要としている患者はしばしば、予めプログラムされたとおりにまたは必要に応じてインスリン・ボーラス(insulin bolus)を送達することができるインスリン・ポンプを携行している。それぞれのボーラス事象は、その事象に関連した一組の特徴を有する。ボーラス事象はさらに、その事象が結果的に低血糖症(「HYPO」)に至るのかまたは非低血糖症(「NON-HYPO」)に至るのかを示すラベルを有することができる。すなわち、ボーラス事象は、2~4時間の窓内において低血糖症事象が起こったのかまたは起こらなかったのかに応じて、低血糖症(例えば「HYPO」)または非低血糖症(例えば「NON-HYPO」)の2つラベルを有することができる。この窓は、1回または数回のHYPOまたはNON-HYPO事象を含む可能性がある固定時間の窓と定義することができる。低血糖症事象の予測は、例えば、テスト点の予測が、HYPO事象に関しては0.7またはNON-HYPO事象に関しては0.3であるなど、一組のラベルの全体にわたる確率分布の形態をとりうる。
HYPOクラスとNON-HYPOクラスの両方に関係するデータ点の分類は、例えばHYPOラベルが決してデータの10%を超えないなど、ひどく不釣合いなものになることがある。クラスが不釣合いである場合でも、機械学習を使用して、患者によってボーラスが注射された後に低血中グルコース事象が起こりうるかどうかを予測すること、および、修正処置をとる十分な時間を患者が持てるように、規定された時間(例えば2~3時間前)までに患者に知らせることができる。低血糖症事象は、患者によってボーラスが投与された後の2~4時間の窓内において血中グルコース値がしきい値よりも低下した状態と定義することができる。この2~4時間の窓を使用して、逆hypo遅延(reverse hypo delay)(「RHD」。これは、平均逆事象遅延(average reverse event delay)と等価であることがある)を計算することができ、ボーラス事象前の時間窓内において複数の特徴が導き出される。これらの特徴(RHDを含む)はそれぞれ、数分から数か月の範囲の窓内で導き出すことができる。
しかしながら、例えば教師ありアンサンブル・モデルの質を向上させるために教師なし機械学習操作が必要な場合など、現在の機械学習操作にはいくつかの課題がある。さらに、アンサンブル・モデルは、モデルを結合した後に最良のバリアンス低減を達成するために、その弱い学習器(weak learner)のそれぞれにおいてモデルの多様性を必要とする。データ・クラスがひどく不釣合いであり、まれな(rare)クラス(例えば少数クラス)が最も重要なクラスである場合、その重要でまれなクラスの異なるモード/特性を学習する機械学習モデルを生成するのは難しい。すなわち、クラスまたは特徴がひどく不釣合いであり、まれなクラスまたはまれな特徴が、「少数クラス」と呼ばれることがある最も重要なクラスまたは特徴(または最もまれでもある最高ランクのクラスまたは特徴)であると識別されている状況では、機械学習予測の効率が低下し、重要でまれなクラス(例えば少数クラス)の異なるモード/特性を学習する予測モデルを生成することは極めて難しい。
したがって、一態様では、本発明が、プロセッサによってアンサンブル・モデルの強化された多様性および学習を実現することを提供する。一実施形態では、単なる例として、プロセッサによってアンサンブル・モデルの強化された多様性および学習を実現するための方法が提供される。少数クラスのデータ点の1つまたは複数のクラスタを多数クラスの選択されたデータ点と結合することによって、1つまたは複数のデータ・セットを生成することができる。教師あり機械学習操作を使用して、この1つまたは複数のデータ・セットから1つまたは複数のアンサンブル・モデルを生成することができる。この1つまたは複数のアンサンブル・モデルを使用して事象の発生を予測することができる。
追加の態様では、非常に不釣合いなデータ・セット、例えば1型および2型糖尿病患者の低血糖症事象の非常に不釣合いなデータ・セットの全体にわたって、多様性のあるアンサンブル学習を構築することによって、本発明が、糖尿病患者の低血糖症を予測するための信頼性の高い正確なモデルを提供する。
追加の態様では、元のデータ・セットが非常に不釣合いであるとき(例えば事象の少数クラスまたは事象の多数クラスを表すことがある不釣合いなデータ点)でもアンサンブル・モデルのモデル多様性を保証するために、教師なし機械学習操作を学習、生成もしくは構築し、またはこれらの組合せを達成されることができる。データ(例えばインスリン・ポンプ・データ)、ユーザ(例えば患者)の人口統計学的データもしくはユーザの行動データ、またはこれらのデータの組合せに従って、選択されたグループ/ユーザの事象を予測する(例えば糖尿病患者の低血糖症事象を予測する)ための1つまたは複数の信頼性の高い正確なモデルを生成/構築することができる。これらのデータは、収集されたデータ・セットの事象分類不釣合いの特性を有することがある。
さらに、機械学習に関連して、通知を使用してユーザ(例えば患者)の行動を修正することができる。例えば、患者が行動をとり、低血糖症が起こらないように、低血糖症事象が起こる確率が高いことを知らせる通知を患者に提供することができる。ユーザは、通知の有効性および有用性の程度を示すフィードバックを提供することができる。本発明は、このデータから継続的に学習することができ、機械学習モデルを絶えず改良することができる。規定された期間にわたって1つまたは複数のパターンおよび傾向を学習および解析することができる。ユーザ情報、ユーザによって実行された行動および通知は全て、リポジトリに記憶することができる。記憶されたデータは、パターンの長期解析および傾向の変化検出に使用することができる。さらに、ユーザは、低血糖症予測および予測を計算するために使用したデータ/特徴を含む記憶された全ての情報を視覚化することができる。ユーザの活動および事象を理解するために、このデータを、インタラクティブ・ダッシュボードを介して(例えばグラフィカル・ユーザ・インタフェース「GUI」を介して)1人または複数のユーザに提供することができ、その事象に関係して実行すべき、もしくは実行すべきでない、またはその両方である規定された事象(例えば低血糖症)行動にどの活動がつながるのかを提供し、さらにそれに関する洞察を提供する。
以下では、本発明の追加の態様および付随する利点をさらに説明する。
本開示はクラウド・コンピューティングに関する詳細な説明を含むが、本明細書に記載された教示の実施態様はクラウド・コンピューティング環境だけに限定されないことを予め理解されたい。むしろ、本発明の実施形態は、現在知られているまたは後に開発される他の任意のタイプのコンピューティング環境に関連して実施することができる。
クラウド・コンピューティングは、最小限の管理労力またはサービスのプロバイダとの最小限のインタラクションで迅速に供給およびリリースすることができる構成可能なコンピューティング・リソース(例えばネットワーク、ネットワーク帯域、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想機械およびサービス)の共用プールへの便利なオンデマンド・ネットワーク・アクセスを可能にするサービス配信モデルである。このクラウド・モデルは、少なくとも5つの特徴、少なくとも3つのサービス・モデル、および少なくとも4つのデプロイメント(deployment)モデルを含むことができる。
特徴は以下のとおりである。
オンデマンド・セルフサービス:クラウド・コンシューマは、サーバ時間およびネットワーク・ストレージなどのコンピューティング機能の供給を、このサービスのプロバイダとのヒューマン・インタラクションを必要とすることなく必要に応じて自動的に一方向的に受けることができる。
ブロード・ネットワーク・アクセス:機能は、ネットワーク上で利用可能であり、機能には、異種のシンまたはシック・クライアント・プラットホーム(例えば移動電話、ラップトップおよびPDA)による使用を促進する標準的機構を通してアクセスされる。
リソース・プーリング(resource pooling):マルチテナント・モデルを使用して多数のコンシューマにサービスを提供するために、プロバイダのコンピューティング・リソースがプールされており、要求に応じて、異なる物理的および仮想リソースが動的に割当ておよび再割当てされる。コンシューマは一般に、提供されたリソースの正確な位置を制御できずまたは正確な位置を知らないが、より高次の抽象化レベル(例えば国、州またはデータセンター)で位置を指定することができるという意味で、位置独立の感覚がある。
ラピッド・エラスティシティ(rapid elasticity):機能は、素早くスケールアウトするために迅速かつ弾力的に、場合によっては自動的に供給することができ、素早くスケールインするために迅速にリリースすることができる。コンシューマにとって、供給に利用可能な機能はしばしば無限であるように見え、いつでも好きな量だけ購入することができる。
メジャード・サービス(measured service):クラウド・システムは、サービスのタイプ(例えば、ストレージ、処理、帯域および使用中ユーザ・アカウント)に対して適切なある抽象化レベルで計測機能を活用することによって、リソースの使用状況を自動的に制御および最適化する。リソースの使用状況を監視、制御および報告して、利用されているサービスのプロバイダとコンシューマの両方に透明性を提供することができる。
サービス・モデルは以下のとおりである。
ソフトウェア・アズ・ア・サービス(SaaS):コンシューマに提供されるこの機能は、クラウド・インフラストラクチャ上でランしているプロバイダのアプリケーションを使用する機能である。ウェブ・ブラウザなどのシン・クライアント・インタフェース(例えばウェブ・ベースの電子メール)を通してさまざまなクライアント・デバイスからアプリケーションにアクセス可能である。場合によっては可能な限られたユーザ固有のアプリケーション構成の設定を除けば、コンシューマは、ネットワーク、サーバ、オペレーティング・システム、ストレージまたは個々のアプリケーション機能を含む基礎をなすクラウド・インフラストラクチャを管理もまたは制御もしない。
プラットホーム・アズ・ア・サービス(PaaS):コンシューマに提供されるこの機能は、クラウド・インフラストラクチャ上で、プロバイダがサポートするプログラム言語およびツールを使用して作成されたコンシューマ作成または取得のアプリケーションをデプロイする機能である。コンシューマは、ネットワーク、サーバ、オペレーティング・システムまたはストレージを含む基礎をなすクラウド・インフラストラクチャを管理もまたは制御もしないが、デプロイされたアプリケーションおよび場合によってはアプリケーション・ホスティング環境構成は制御することができる。
インフラストラクチャ・アズ・ア・サービス(IaaS):コンシューマに提供されるこの機能は、処理、ストレージ、ネットワークおよび他の基本的なコンピューティング・リソースを供給する機能であり、コンシューマは任意のソフトウェアをデプロイおよびランすることができ、これらのソフトウェアは、オペレーティング・システムおよびアプリケーションを含むことができる。コンシューマは、基礎をなすクラウド・インフラストラクチャを管理もまたは制御もしないが、オペレーティング・システム、ストレージおよびデプロイされたアプリケーションは制御することができ、場合によっては、選択されたネットワーク構成要素(例えばホスト・ファイアウォール)を限定的に制御することができる。
デプロイメント・モデルは以下のとおりである。
プライベート・クラウド:このクラウド・インフラストラクチャは、組織体のためだけに運営される。インフラストラクチャは、その組織体または第三者が管理することができ、オンプレミス(on-premises)またはオフプレミス(off-premises)で存在することができる。
コミュニティ・クラウド:このクラウド・インフラストラクチャは、いくつかの組織体によって共有され、利害(例えばミッション、セキュリティ要件、ポリシーおよびコンプライアンス上の問題)を共有する特定のコミュニティをサポートする。インフラストラクチャは、その組織体または第三者が管理することができ、オンプレミスまたはオフプレミスで存在することができる。
パブリック・クラウド:このクラウド・インフラストラクチャは、一般大衆または大きな産業グループが利用可能であり、クラウド・サービスを販売している組織体によって所有される。
ハイブリッド・クラウド:このクラウド・インフラストラクチャは、固有のエンティティ(entity)を維持しているが、データおよびアプリケーション・ポータビリティを可能にする標準化された技術または独占技術(例えばクラウド間のロード・バランシングのためのクラウド・バースティング(cloud bursting))によって1つに結合された2つ以上のクラウド(プライベート、コミュニティまたはパブリック)の合成体である。
クラウド・コンピューティング環境は、無国籍、低結合、モジュール性および意味論的相互運用性(semantic interoperability)に重きを置くサービス指向の環境である。クラウド・コンピューティングの中心には、相互接続されたノードのネットワークを含むインフラストラクチャがある。
次に図1を参照すると、クラウド・コンピューティング・ノードの一例の概略図が示されている。クラウド・コンピューティング・ノード10は適当なクラウド・コンピューティング・ノードの一例に過ぎず、クラウド・コンピューティング・ノード10が、本明細書に記載された本発明の実施形態の使用または機能の範囲に関する限定を示唆することは意図されていない。とは言え、クラウド・コンピューティング・ノード10は、以上に記載された機能を実装もしくは実行すること、または実装および実行することができる。
クラウド・コンピューティング・ノード10にはコンピュータ・システム/サーバ12が存在し、コンピュータ・システム/サーバ12は、他の多数の汎用または専用コンピューティング・システム環境または構成とともに動作可能である。コンピュータ・システム/サーバ12とともに使用するのに適していることがある、よく知られたコンピューティング・システム、環境もしくは構成またはこれらの組合せの例は、限定はされないが、パーソナル・コンピュータ・システム、サーバ・コンピュータ・システム、シン・クライアント、シック・クライアント、ハンドヘルドまたはラップトップ・デバイス、マルチプロセッサ・システム、マイクロプロセッサ・ベースのシステム、セット・トップ・ボックス、プログラム可能なコンシューマ電子機器、ネットワークPC、ミニコンピュータ・システム、メインフレーム・コンピュータ・システム、ならびに上記のいずれかのシステムまたはデバイスを含む分散クラウド・コンピューティング環境などを含む。
コンピュータ・システム/サーバ12は、コンピュータ・システムによって実行されているプログラム・モジュールなどのコンピュータ・システム実行可能命令の一般的な文脈で説明することができる。一般に、プログラム・モジュールは、特定のタスクを実行する、または特定の抽象データ型を実装した、ルーチン、プログラム、オブジェクト、コンポーネント、ロジック、データ構造などを含むことができる。コンピュータ・システム/サーバ12は、通信ネットワークを介してリンクされた遠隔処理デバイスによってタスクが実行される分散クラウド・コンピューティング環境で使用することができる。分散クラウド・コンピューティング環境では、ローカル・コンピュータ・システム・ストレージ媒体と遠隔コンピュータ・システム・ストレージ媒体の両方にプログラム・モジュールを置くことができる。このストレージ媒体にはメモリ・ストレージ・デバイスが含まれる。
図1に示されているとおり、クラウド・コンピューティング・ノード10のコンピュータ・システム/サーバ12は、汎用コンピューティング・デバイスの形態で示されている。コンピュータ・システム/サーバ12の構成要素は、限定はされないが、1つまたは複数のプロセッサまたは処理ユニット16、システム・メモリ28およびバス18を含むことができ、バス18は、システム・メモリ28を含むさまざまなシステム構成要素をプロセッサ16に結合する。
バス18は、メモリ・バスまたはメモリ・コントローラ、周辺バス、加速グラフィクス・ポート、およびプロセッサ・バスまたはローカル・バスを含む、さまざまなバス・アーキテクチャを使用したいくつかのタイプのバス構造体のうちの1つまたは複数の任意のバス構造体を表す。例として、このようなアーキテクチャは、限定はされないが、インダストリ・スタンダード・アーキテクチャ(ISA)バス、マイクロ・チャネル・アーキテクチャ(MCA)バス、エンハンストISA(EISA)バス、ビデオ・エレクトロニクス・スタンダーズ・アソシエーション(VESA)ローカル・バス、およびペリフェラル・コンポーネント・インターコネクツ(PCI)バスを含む。
コンピュータ・システム/サーバ12は通常、さまざまなコンピュータ・システム可読媒体を含む。このような媒体は、コンピュータ・システム/サーバ12がアクセス可能な利用可能な任意の媒体とすることができ、揮発性媒体と不揮発性媒体の両方、取外し可能媒体と非取外し可能媒体の両方を含む。
システム・メモリ28は、ランダム・アクセス・メモリ(RAM)30もしくはキャッシュ・メモリ32またはその両方など、揮発性メモリの形態のコンピュータ・システム可読媒体を含むことができる。コンピュータ・システム/サーバ12はさらに、他の取外し可能/非取外し可能な揮発性/不揮発性のコンピュータ・システム・ストレージ媒体を含むことができる。単なる例として、ストレージ・システム34は、非取外し可能な不揮発性の磁気媒体(図示せず。通常は「ハード・ドライブ」と呼ばれる)からの読取り用、および非取外し可能な不揮発性の磁気媒体への書込み用に提供することができる。図示されてはいないが、取外し可能な不揮発性の磁気ディスク(例えば「フロッピー(R)・ディスク」)からの読取り用および取外し可能な不揮発性の磁気ディスクへの書込み用の磁気ディスク・ドライブ、ならびにCD-ROM、DVD-ROMまたは他の光学式媒体などの取外し可能な不揮発性光ディスクからの読取り用および取外し可能な不揮発性の光ディスクへの書込み用の光ディスク・ドライブを提供することもできる。そのような場合には、それぞれを、1つまたは複数のデータ媒体インタフェースによってバス18に接続することができる。後にさらに示し、説明するが、システム・メモリ28は、本発明の実施形態の機能を実行するように構成された一組の(例えば少なくとも1つの)プログラム・モジュールを有する少なくとも1つのプログラム製品を含むことができる。
一組の(少なくとも1つの)プログラム・モジュール42、例えば、限定はされないが、オペレーティング・システム、1つまたは複数のアプリケーション・プログラム、他のプログラム・モジュールおよびプログラム・データなどを有するプログラム/ユーティリティ40を、システム・メモリ28に記憶することができる。このオペレーティング・システム、1つまたは複数のアプリケーション・プログラム、他のプログラム・モジュールおよびプログラム・データまたはこれらのある組合せはそれぞれ、ネットワーキング環境の実施態様を含むことができる。プログラム・モジュール42は一般に、本明細書に記載された本発明の実施形態の機能もしくは方法またはその両方を実行する。
コンピュータ・システム/サーバ12はさらに、キーボード、ポインティング・デバイス、ディスプレイ24など;ユーザがコンピュータ・システム/サーバ12と対話することを可能にする1つもしくは複数のデバイス;またはコンピュータ・システム/サーバ12が1つもしくは複数の他のコンピューティング・デバイスと通信することを可能にする任意のデバイス(例えばネットワーク・カード、モデムなど)、あるいはこれらの組合せなどの、1つまたは複数の外部デバイス14と通信することができる。このような通信は、入力/出力(I/O)インタフェース22を介して実行することができる。さらに、コンピュータ・システム/サーバ12は、ネットワーク・アダプタ20を介して、ローカル・エリア・ネットワーク(LAN)、一般的なワイド・エリア・ネットワーク(WAN)もしくは公衆ネットワーク(例えばインターネット)、またはこれらの組合せなどの1つまたは複数のネットワークと通信することができる。図示されているように、ネットワーク・アダプタ20は、バス18を介してコンピュータ・システム/サーバ12の残りの構成要素と通信する。示されてはいないが、他のハードウェア構成要素もしくはソフトウェア構成要素またはその両方を、コンピュータ・システム/サーバ12とともに使用することができることを理解すべきである。このような構成要素の例は、限定はされないが、マイクロコード、デバイス・ドライバ、冗長処理ユニット、外部ディスク・ドライブ・アレイ、RAIDシステム、テープ・ドライブ、およびデータ・アーカイバル・ストレージ・システムなどを含む。
当業者者なら理解することだが、本発明の文脈では、図1に示されたさまざまな構成要素を、移動する車両内に置くことができる。例えば、本発明のさまざまな目的を達成するために、局所処理構成要素が、遠隔地に置かれた分散コンピューティング・データ処理構成要素およびストレージ構成要素にネットワークを介して接続されている間に、例示された実施形態の機構に関連した処理能力およびデータ・ストレージ能力の一部を、同じ局所処理構成要素によって局所的に実行することができる。やはり当業者には理解されることだが、この図は、本発明のさまざまな態様を共同で達成する分散コンピューティング構成要素の接続されたネットワークの全体であることがあるもののサブセットだけを伝達することが意図されている。
次に図2を参照すると、例示的なクラウド・コンピューティング環境50が示されている。示されているとおり、クラウド・コンピューティング環境50は1つまたは複数のクラウド・コンピューティング・ノード10を含み、クラウド・コンシューマによって使用されるローカル・コンピューティング・デバイス、例えばパーソナル・ディジタル・アシスタント(PDA)もしくは携帯電話54A、デスクトップ・コンピュータ54B、ラップトップ・コンピュータ54Cまたは自動車コンピュータ・システム54Nあるいはこれらの組合せは、これらのノードと通信することができる。ノード10は互いに通信することができる。それらのノードは、上で説明したプライベート、コミュニティ、パブリックまたはハイブリッド・クラウドまたはこれらの組合せなどの1つまたは複数のネットワークに、物理的にまたは仮想的にグループ分けされていることがある(図示せず)。これによって、クラウド・コンピューティング環境50は、インフラストラクチャ、プラットホームもしくはソフトウェアまたはこれらの組合せをサービスとして提供することができ、そのため、クラウド・コンシューマは、ローカル・コンピューティング・デバイス上にリソースを維持する必要がない。図2に示されたタイプのコンピューティング・デバイス54A~Nは単なる例であることが意図されていること、ならびにコンピューティング・ノード10およびクラウド・コンピューティング環境50は、任意のタイプのネットワーク上もしくはアドレス指定可能なネットワーク接続上またはその両方で(例えばウェブ・ブラウザを使用して)、コンピュータ化された任意のタイプのデバイスと通信することができることが理解される。
次に図3を参照すると、クラウド・コンピューティング環境50(図2)によって提供される一組の機能抽象化層が示されている。図3に示された構成要素、層および機能は単なる例であることが意図されており、本発明の実施形態はそれらに限定されないことを予め理解しておくべきである。図示のとおり、以下の層および対応する機能が提供される。
デバイス層55は、クラウド・コンピューティング環境50においてさまざまなタスクを実行するために電子回路、センサ、アクチュエータおよびその他のオブジェクトとともに埋め込まれた物理デバイスおよび/もしくは仮想デバイス、ならびに/またはクラウド・コンピューティング環境50においてさまざまなタスクを実行するための独立型の電子回路、センサ、アクチュエータおよび他のオブジェクトである物理デバイスおよび/もしくは仮想デバイスを含む。デバイス層55のデバイスはそれぞれ、デバイスから取得した情報を他の機能抽象化層に提供することができ、もしくは他の抽象化層からの情報をデバイスに提供することができ、またはその両方を実行することができるような形で、ネットワーキング機能を他の機能抽象化層に組み込む。一実施形態では、デバイス層55を含めて、これらのさまざまなデバイスが、集合的に「インターネット・オブ・シングス」(IoT)として知られているエンティティのネットワークを組み込むことができる。当業者なら理解することだが、このようなエンティティのネットワークは、非常に変化に富んださまざまな目的を達成するために、データの相互通信、収集および伝播を可能にする。
示されたデバイス層55は、示されているとおり、センサ52、アクチュエータ53、処理、センサおよびネットワーキング電子回路が統合された「学習」サーモスタット56、カメラ57、制御可能な家庭用アウトレット/レセプタクル58、ならびに制御可能な電気スイッチ59を含む。他の可能なデバイスは、限定はされないが、さまざまな追加のセンサ・デバイス、ネットワーキング・デバイス、電子デバイス(例えば遠隔制御デバイス)、追加のアクチュエータ・デバイス、冷蔵庫または洗濯/乾燥機などのいわゆる「スマート」家電、および相互接続された多種多様な他の可能なオブジェクトを含むことができる。
ハードウェアおよびソフトウェア層60は、ハードウェア構成要素およびソフトウェア構成要素を含む。ハードウェア構成要素の例は、メインフレーム61、RISC(縮小命令セット・コンピュータ)アーキテクチャ・ベースのサーバ62、サーバ63、ブレード・サーバ(blade server)64、ストレージ・デバイス65ならびにネットワークおよびネットワーキング構成要素66を含む。いくつかの実施形態では、ソフトウェア構成要素が、ネットワーク・アプリケーション・サーバ・ソフトウェア67およびデータベース・ソフトウェア68を含む。
仮想化層70は抽象化層を提供し、この層から、仮想エンティティの以下の例を提供することができる:仮想サーバ71、仮想ストレージ72、仮想専用ネットワークを含む仮想ネットワーク73、仮想アプリケーションおよびオペレーティング・システム74、ならびに仮想クライアント75。
一例では、管理層80が以下の機能を提供することができる。リソース供給81は、クラウド・コンピューティング環境内でタスクを実行する目的に利用されるコンピューティング・リソースおよびその他のリソースの動的調達を提供する。計量および価格決定82は、クラウド・コンピューティング環境内でリソースが利用されたときの費用追跡、およびこれらのリソースの消費に対する課金または請求を提供する。一例では、これらのリソースがアプリケーション・ソフトウェア・ライセンスを含むことがある。セキュリティは、クラウド・コンシューマおよびタスクの識別確認ならびにデータおよび他のリソースの保護を提供する。ユーザ・ポータル83は、コンシューマおよびシステム管理者に、クラウド・コンピューティング環境へのアクセスを提供する。サービス水準管理84は、必要なサービス水準が達成されるようなクラウド・コンピューティング・リソースの割振りおよび管理を提供する。サービス水準合意(Service Level Agreement)(SLA)計画および履行85は、SLAによって将来必要になると予想されるクラウド・コンピューティング・リソースの事前調整および調達を提供する。
ワークロード層90は、クラウド・コンピューティング環境を利用することができる機能の例を提供する。この層から提供することができるワークロードおよび機能の例は、マッピングおよびナビゲーション91、ソフトウェア開発およびライフサイクル管理92、仮想教室教育配信93、データ解析処理94、トランザクション処理95、ならびに、本発明の例示された実施形態の文脈では、アンサンブル・モデルの強化された多様性および学習を実現するためのさまざまなワークロードおよび機能96を含む。さらに、アンサンブル・モデルの強化された多様性および学習を実現するためのワークロードおよび機能96は、データ解析機能(さまざまな環境センサからのデータ収集および処理を含む)および予測データ解析機能などの操作を含むことができる。アンサンブル・モデルの強化された多様性および学習を実現するためのワークロードおよび機能96はさらに、本発明の例示された実施形態のさまざまな目的を達成するために、ハードウェアおよびソフトウェア60、仮想化70、管理80ならびに(例えばデータ解析処理94などの)他のワークロード90の部分など、さまざまな抽象化層の他の部分とともに働くことができることを、当業者は理解するであろう。
前述のとおり、本発明は、アンサンブル・モデルの強化された多様性および学習を提供する。1つまたは複数の教師なし機械学習操作を使用して、アンサンブル・モデルの弱い学習器(例えばベース・アンサンブル構成モデル)のためのデータ・セットを生成することができる。少数クラスをクラスタ化し、次いで弱い学習のためのデータ・セットを、これらの少数クラスタのうちのそれぞれの少数クラスタを多数クラスからのランダム・サンプルと結合することにより生成することによって、クラス不釣合いの釣合いをとることができる。教師あり機械学習手法を使用して、それぞれのデータ・セットに対して、1つまたは複数のアンサンブル・モデルを生成し/その1つまたは複数のアンサンブル・モデルに学習させることができる。データ・セットから生成されたベース・アンサンブル構成モデルからの予測を結合することによって、テスト・データ点のスコアを決定することができる。
一態様では、1つまたは複数の少数クラスのさまざまなサブタイプを検出するように、弱い学習器に学習させ、または弱い学習器を訓練することができ、このようなサブタイプは、クラスタ化プロセスによって取得することができる。一態様では、さまざまな特徴をクラスタ化することによって、これらのサブタイプを検出することができる。これらのサブタイプは、教師なし機械学習操作を使用してデータから学習される。平均逆事象遅延を使用して、少数クラス(例えば少数特徴または特定のデータ点のクラス)をグループ/クラスタに分割することができる。すなわち、少数クラスのさまざまなサブタイプを検出するように弱い学習器に学習させるような態様で、データ・セットを生成することができ、そのようなサブタイプは、クラスタ化プロセスによって取得される。少数クラスは、教師なし機械学習操作の代わりに教師あり機械学習操作を使用してグループ/クラスタに分割することができる。
アンサンブル点におけるK個の分類器(classifier)からの予測を結合することによって、テスト点の予測を取得することができる。ボーラス事象を含む時間窓内、もしくはボーラス事象前の時間窓内、またはそれらの両方の時間窓内で特徴ベクトルを計算することができ、特徴ベクトルは、異なるデータ源に基づいて計算することができ、予め確立された判定基準を使用して、「HYPO」または非「NON-HYPO」のラベルを付けることができる。例えば、この予め確立された判定基準は、例えば低血糖症などの事象に関するデータとすることができ、低血糖症は、患者がボーラスを自身に注射した後の時間窓(例えば4時間、3時間または2時間)内に血中グルコースが約10分間にわたって70mg/dl未満に低下した状態と定義される。したがって、ボーラス後の時間窓の間に血中グルコース値が70mg/dl未満に低下した場合、そのボーラス事象に、HYPOの「マーク」(例えば指示)を付けることができ、そうでない場合には、その事象にNON-HYPOのマークを付けることができる。すなわち、過去のデータを使用して、どのボーラスがHYPOであるのかまたはどのボーラスがNON-HYPOであるのかを見つけ出すことができ、次いで、そのデータから、1つまたは複数の特徴を抽出することができ、機械学習アルゴリズムを、1つのボーラスがHYPOであるのかまたはNON-HYPOであるのかを予測するように訓練することができる。
患者およびボーラス事象特徴の人口統計学的情報を組み合わせて、ボーラス特徴(例えば少数クラスにクラスタ化される前の元の一組のデータ点の特徴)を形成することもできる。それらの特徴を、少数クラス(例えばHYPO特徴)と多数クラス(例えば、NON-HYPO特徴)にグループ分けすることができる。少数クラス(例えばHYPO特徴)を、少数クラスのK個のクラスタにクラスタ化することができる。多数クラスタと比較される少数クラスのK個のクラスタのうちのそれぞれのクラスタについて少なくともK個の分類器に学習させることによって、アンサンブル・モデルを生成することができる。アンサンブル点における少数クラスのK個の分類器からの予測を結合することによって、テスト点の予測を取得することができる。この予測は、結果的に少数クラスの事象(例えばHYPO事象)または多数クラスの事象(例えばNON-HYPO事象)に至るボーラス事象のスコアとすることができる。
一態様では、知られているエンティティのラベルをモデルが誤分類した場合に、誤分類が起こる可能性がある。この機械学習モデルは、例えば勾配降下法(gradient descent)などの費用最小化技法(cost minimization technique)、またはジニ係数(Gini index)を使用したその他の技法を使用して構築することができる。デシジョン・フォレスト(decision forest)、サポート・ベクター・マシン(support vector machine)(SVM)、ロジスティック回帰(logistic regression)などのようなさまざまな分類アルゴリズムを使用して、このアンサンブル法の1つまたは複数の個々のモデルに学習させることができる。この誤分類の費用は、受信者操作特性(receiver operating characteristic)(ROC)の曲線下面積(area-under-curve)(「AOC」)を使用して見積もることができ、HYPOはクラスであり、陽性として取り扱われる。陽性適中率(positive predictive value)(PPV)などの他の尺度を使用して性能を見積もることもできる。
次に図4を参照すると、例示された実施形態のさまざまな機構に従う例示的な機能構成要素400を示すブロック図が示されている。図4は、本技術の一例による、コンピューティング環境402などのコンピューティング環境においてアンサンブル・モデルの強化された多様性および学習を実現することを示している。以上のことに留意して、本発明による正確な時間事象予測モデル化のためのシステムのさまざまなハードウェアおよびソフトウェア構成要素に、モジュール・ブロック400をさらに組み込むことができる。機能ブロック400の多くは、分散コンピューティング構成要素内の、またはユーザ・デバイス上の、または他の場所にあるさまざまな構成要素上でバックグラウンド・プロセスとして実行することができる。
理解されることだが、これらの機能ブロックの多くは、以前に図1~3で説明したものと同じ記述的意味で機能の「モジュール」とみなすこともできる。例えば、図1のコンピュータ・システム/サーバ12が再び示されており、コンピュータ・システム/サーバ12はさらに、本発明のさまざまな態様に従ってさまざまな計算機能、データ処理機能およびその他の機能を実行するために図1の処理ユニット16およびメモリ28を含むことができる。
システム400は、デスクトップ・コンピュータ、ラップトップ・コンピュータ、タブレット、インターネット・オブ・シングス(「IoT」)デバイス(例えばスマート・フォンもしくはウェアラブル・デバイス/センサ)、もしくは別の電子デバイス、またはこれらの組合せなどのコンピューティング環境402およびデバイス420を含むことができ、これらは、1つまたは複数のプロセッサおよびメモリを有することができる。デバイス420およびコンピューティング環境402はそれぞれ、コンピューティング・ネットワークなどの1つまたは複数の通信方式によって互いに関連づけられていてもよく、もしくは互いに通信してもよく、またはその両方であってもよい。一例では、デバイス420が、コンピューティング環境402に関連づけられたユーザ(例えば所有者、管理者、顧客、特定分野の専門家(domain expert)または患者)によって制御されてもよい。別の例では、デバイス420が、コンピューティング環境402のユーザ(例えば所有者、管理者、顧客、特定分野の専門家または患者)から完全に独立していてもよい。
一態様では、コンピューティング環境402が、仮想化されたコンピューティング・サービス(すなわち仮想化されたコンピューティング、仮想化されたストレージ、仮想化されたネットワーキングなど)をデバイス420に提供することができる。より詳細には、コンピューティング環境402は、ハードウェア基板上で実行されている仮想化されたコンピューティング、仮想化されたストレージ、仮想化されたネットワーキング、および他の仮想化されたサービスを提供することができる。
図4に示されているように、コンピューティング環境402は、機械学習モジュール406、機械学習モジュール406に関連づけられた特徴もしくはパラメータまたはその両方のデータベース404を含むことができる。コンピューティング環境402はさらに、図1に示されているコンピュータ・システム12を含むことができる。コンピュータ・システム12はさらに、分類構成要素410、アンサンブル・モデル構成要素412および事象構成要素416を含むことができ、これらはそれぞれ、1つまたは複数の機械学習モデルを訓練し、1つまたは複数の機械学習モデルに学習させるため、さらに、特徴もしくはパラメータまたはその両方の多数の組合せを、テストされている機械学習モデルに適用するために、機械学習モジュールに関連づけられている。
一態様では、機械学習モジュール406が、事象を予測するための予測モジュール408を含むことができる。例えば、コンピュータ・システム12は、アンサンブル・モデル構成要素412および事象構成要素416を使用して、例えば、患者によってボーラスが投与された後の時系列窓内で血中グルコース値がしきい値よりも低下する低血糖症事象などの事象を規定することができる。
分類構成要素410は、少数クラス(例えば少数特徴)のデータ点の1つまたは複数のクラスタを多数クラス(例えば多数特徴)の選択されたデータ点と結合することによって、1つまたは複数のデータ・セットを生成することができる。分類構成要素410は、複数のデータ点から1つまたは複数の特徴を抽出すること、およびその1つまたは複数の特徴に従って、複数のデータ点のうちのデータ点を多数クラスまたは少数クラスに分類することができる。分類構成要素410は、1つまたは複数のアンサンブル・モデルからの1つまたは複数の予測を結合することによって、テスト・データ点のスコアを決定することができる。
追加の態様では、分類構成要素410が、複数の少数クラス・データ点を、少数クラスを形成するK個のクラスタにクラスタ化すること、および少数クラスのK個のクラスタのうちのそれぞれのクラスタを、多数クラスのランダムな数の選択されたデータ点によって増大させることができる。分類構成要素410はさらに、少数クラスの1つまたは複数のサブクラスを検出することができる。分類構成要素410は、教師あり機械学習操作を使用して、少数クラスを、データ点の1つまたは複数のクラスタに分割することができる。分類構成要素410は、予め定められた判定基準に従って、少数クラスのデータ点の1つまたは複数のクラスタにラベルを付けることができる。
アンサンブル・モデル構成要素412は、教師あり機械学習操作を使用して、1つまたは複数のデータ・セットから1つまたは複数のアンサンブル・モデルを生成することができる。
予測モジュール408は、1つまたは複数のアンサンブル・モデルを使用して事象の発生を予測することができる。機械学習モジュール406によって、平均事象遅延もしくは予測モジュール408またはその両方、加えて他の特徴もしくはパラメータまたはその両方を使用して、1つもしくは複数の機械学習モデルないし「分類器」に学習させ、または1つもしくは複数の機械学習モデルないし「分類器」を訓練することができる。予測モジュール408は、学習させたまたは訓練された分類器に基づいて、糖尿病患者の低血糖症事象を予測することができる。
デバイス420は、グラフィカル・ユーザ・インタフェース(GUI)422を含むことができ、GUI422は、ユーザがGUI422と対話するための1つまたは複数のユーザ・インタフェース制御をデバイス420に表示することができる。例えば、GUI422は、予測された低血糖症事象を、警報として表示することができる。例えば、この予測された低血糖症事象を、「警報!10分以内に低血糖になりそうです。すぐに修正処置をとってください!(ALERT! You are about to experience low blood sugar in 10 minutes.Please take corrective action now!)」をGUI422上に聴覚的にもしくは視覚的にまたはその両方で示しまたは表示する警報とすることができる。
特徴/パラメータ404は、特徴/パラメータと特徴/パラメータを処理するための手順との組合せとすることができ、これらを、患者のさまざまな状態または患者の状態の診断のテスト、モニタリングもしくは計算またはこれらの組合せに関係する同じ入力データに適用することができる。すなわち、1つもしくは複数の機械学習モデルに学習させるため、または1つもしくは複数の機械学習モデルを訓練するために、パラメータの異なる組合せを選択し、同じ入力データに適用することができる。
一態様では、教師あり学習、教師なし学習、時間差分学習(temporal difference learning)、強化学習(reinforcement learning)などの多種多様な方法または方法の組合せを使用して、本明細書に記載された予測モデル化(または機械学習モデル化)を実行することができる。本技術とともに使用することができる教師あり学習のいくつかの非限定的な例は、AODE(averaged one-dependence estimator)、人工ニューラル・ネットワーク(artificial neural network)、バックプロパゲーション(backpropagation)、ベイズ統計学(Bayesian statistics)、単純ベイズ分類器(naive bays classifier)、ベイジアン・ネットワーク(Bayesian network)、ベイジアン知識ベース(Bayesian knowledge base)、事例ベース推論(case-based reasoning)、決定木(decision tree)、帰納的理論プログラミング(inductive logic programming)、ガウス過程回帰(Gaussian process regression)、遺伝子発現プログラミング(gene expression programming)、グループ・メソッド・オブ・データ・ハンドリング(group method of data handling)(GMDH)、学習オートマトン(learning automaton)、学習ベクトル量子化(learning vector quantization)、最小メッセージ長(minimum message length)(決定木、決定グラフなど)、レイジー学習(lazy learning)、インスタンス・ベース学習(instance-based learning)、最近傍アルゴリズム(nearest neighbor algorithm)、類推モデル化(analogical modeling)、確率的に近似的に正しい(probably approximately correct)(PAC)学習、リップル・ダウン・ルール(ripple down rules)、知識獲得法(knowledge acquisition methodology)、シンボリック機械学習アルゴリズム(symbolic machine learning algorithm)、サブシンボリック機械学習アルゴリズム(sub symbolic machine learning algorithm)、サポート・ベクター・マシン、ランダム・フォレスト(random forest)、分類器のアンサンブル(ensemble of classifiers)、ブートストラップ・アグリゲーティング(bootstrap aggregating)(バギング(bagging))、ブースティング(boosting)(メタアルゴリズム)、順序分類(ordinal classification)、回帰分析(regression analysis)、情報ファジー・ネットワーク(information fuzzy network)(IFN)、統計学的分類(statistical classification)、線形分類器(linear classifier)、フィッシャーの線形判別(fisher's linear discriminant)、ロジスティック回帰、パーセプトロン(perceptron)、サポート・ベクター・マシン、2次分類器(quadratic classifier)、k近傍法(k-nearest neighbor)、隠れマルコフ・モデル(hidden Markov model)、およびブースティング(boosting)を含む。本技術とともに使用することができる教師なし学習のいくつかの非限定的な例は、人工ニューラル・ネットワーク、データ・クラスタリング(data clustering)、期待値最大化(expectation-maximization)、自己組織化マップ(self-organizing map)、放射基底関数ネットワーク(radial basis function network,)、ベクトル量子化(vector quantization)、ジェネラティブ・トポグラフィック・マップ(generative topographic map)、情報ボトルネック法(information bottleneck method)、IBSEAD(distributed autonomous entity systems based interaction)、相関ルール学習(association rule learning)、アプリオリ・アルゴリズム(apriori algorithm)、エクラ・アルゴリズム(eclat algorithm)、FPグロース・アルゴリズム(FP-growth algorithm)、階層クラスタリング(hierarchical clustering)、単連結クラスタリング(single-linkage clustering)、概念クラスタリング(conceptual clustering)、分割クラスタリング(partitional clustering)、k平均アルゴリズム(k-means algorithm)、ファジー・クラスタリング(fuzzy clustering)、および強化学習を含む。時間差分学習のいくつかの非限定的な例は、Q学習(Q-learning)および学習オートマトンを含むことができる。この段落に記載された教師あり学習、教師なし学習、時間差分学習または他の機械学習の例に関する特定の詳細はいずれも知られており、本開示の範囲に含まれるとみなされる。さらに、1つまたは複数の機械学習モデルをデプロイするときには、最初に、公開環境でデプロイする前に、コンピューティング・デバイスを制御された環境でテストすることができる。さらに、(例えば制御されたテスト環境の外の)公開環境でデプロイするときでも、コンプライアンスに関して、コンピューティング・デバイスを監視することができる。
次に図5を参照すると、アンサンブル学習および多様性のための操作を示すシステム500が示されている。一態様では、図1~4に記載された構成要素、モジュール、サービス、アプリケーションもしくは機能またはこれらの組合せのうちの1つまたは複数を、図5において使用することができる。簡潔にするため、本明細書に記載された他の実施形態で使用されている同じ要素、構成要素、モジュール、サービス、アプリケーションもしくは機能またはこれらの組合せの繰返しの説明は省く。示されているように、さまざまな機能ブロックが、ブロック500の相互関係を表し処理の流れを示す矢印とともに示されている。さらに、機能ブロック500のそれぞれのブロックに関する記述的情報も示されている。
一態様では、これらの例示的な実施形態が、アンサンブル学習における多様性の必要性を示している。例えば、事象を予測する1つの分類問題(classification problem)は、分類が、クラスの不釣合いを生み出すことであり、この不釣合いでは、少数クラスが、重要なクラスまたは優先度の高いクラスとして設計されているにもかかわらず、少数クラスをそのようなクラスとして分類することができない。他の特徴に加えて使用して、分類器(「予測モデル」)を訓練し、または分類器(「予測モデル」)に学習させることができるが、それぞれのモデルが、元のデータ点からのデータのサブセットに特化していることが決定的に重要である。元のデータ点510に示されているように、多数クラスのデータ点の数が多く、少数クラスのデータ点の数が少ないクラスの不釣合いが示されている。
例えば、操作520(例えば操作1)では、元のデータ点510から、データ・セット1およびデータ・セット2が分類されている。すなわち、アンサンブルの中の個々のモデルのための訓練データ・セットを生成するためにランダムなサブサンプルを描くことによって、元のデータ点510の区分が生み出されている。しかしながら、操作520(例えば操作1)は、正確なアンサンブル学習モデルを生成するための多様性のある最適な訓練データ・セットを与えることに失敗している。
対照的に、操作530(例えば操作2)は、最初に、少数クラス(例えば暗い陰影がつけられた点)を、元のデータ点510からクラスタ1、2および3にクラスタ化する。データ点を少数クラス(例えば、クラスタ1、2および3)にクラスタ化した後のこの時点で、少数クラスのそれぞれのグループは、似たタイプの事象(例えば少数クラスを形成している似たタイプの事象)を含むことがある。
次いで、クラスタ(例えばクラスタ1、2および3)のうちのそれぞれのクラスタを、多数クラス(例えば明るい陰影がつけられた点)からのランダム・サンプルと結合することによって、弱い学習のための訓練データ・セット(例えばデータ・セット1、データ・セット2およびデータ・セット3)が生成される。訓練データ・セット(例えばデータ・セット1、データ・セット2およびデータ・セット3)を最適に多様化することができ、これらの訓練データ・セット、および教師あり機械学習操作を使用して、図6に示されているように、1つまたは複数のアンサンブル・モデルを生成することができる。
次に、それぞれのグループまたはクラスタ(例えばクラスタ1、2および3)について、例えば低血糖症などの事象を予測するように、機械学習モデルに学習させ、または機械学習モデルを訓練することができる。これは、最初に、特徴、一致したデータ点の限局されたグループを少数クラスにクラスタ化し、次いで、多数クラスからのランダム・サンプルをそれぞれの少数クラス・クラスタに追加することに基づく多様性のあるアンサンブル・モデルを使用して予測の正確さを向上させる。予測の正確さの増大を可能にするために、全てのデータに対する1つの機械学習モデルだけを訓練するのではなしに、クラスタごとに(または多数クラスまたは少数クラスなどのグループごとに)機械学習モデルを訓練することができる。
図6は、多様性を強化するアンサンブル・モデル学習のための操作を示す図である。一態様では、図1~5に記載された構成要素、モジュール、サービス、アプリケーションもしくは機能またはこれらの組合せのうちの1つまたは複数を、図6において使用することができる。簡潔にするため、本明細書に記載された他の実施形態で使用されている同じ要素、構成要素、モジュール、サービス、アプリケーションもしくは機能またはこれらの組合せの繰返しの説明は省く。示されているように、さまざまな機能ブロックが、ブロック600の相互関係を表し処理の流れを示す矢印とともに示されている。さらに、機能ブロック600のそれぞれのブロックに関する記述的情報も示されている。
ブロック610から開始して、ブロック610で、さまざまな特徴抽出操作を使用して1つまたは複数の特徴を抽出することができ、特徴は、さまざまなデータ源から抽出することができる。ブロック620で、特徴が計算された後、それらの特徴を、例えばデータ・クラスタリングなどの教師なし操作を使用してグループ分けすることができる。一態様では、教師なし機械学習操作を使用して特徴がクラスタ化され、教師あり機械学習操作を使用して、1つまたは複数の機械学習モデルに学習させることができる。クラスタ解析またはクラスタ化は、同じグループ(クラスタと呼ばれる)のオブジェクト同士の方が、他のグループ(クラスタ)のオブジェクトとよりも(ある意味でまたは別の意味で)似ているようなやり方で、一組のオブジェクトをグループ分けするタスクとすることができる。すなわち、最初に、データ点を、K個のクラスタにクラスタ化されている少数クラスに、(例えばK平均操作(「K」は正の整数である)または他のクラスタ化操作を使用して)クラスタ化することができる。
ブロック630で、それぞれの多数/少数データ・セットについて多様化された複数のアンサンブル・モデル(例えば、M、MおよびM)を生成することができるような態様で、ランダムなデータ点を選択し、それらのデータ点を、少数クラスのK個のクラスタのうちのそれぞれのクラスタに加えて、少数クラスと多数クラス(例えば少数対多数。これは、少数クラス対多数クラス間で識別する分類問題を指す)の釣合いのとれたアンサンブル・モデルを生成することができる。すなわち、ブロック630に示されているように、1)釣合いのとれた少数対多数分類問題を生成するように、多数クラスからデータ点をサンプリングし、2)このような多くの問題を生成することができ、3)それぞれの多数/少数データ・セットについて分類器M、...Mに学習させる。例示のため、以下の例を考える。20個のデータ点(例えば図示のための赤のデータ点)および100個のデータ点(例えば図示のための青のデータ点。赤および青は、例えば少数クラスおよび多数クラスなどの2つの異なるクラスを表すことができる)を有するデータ・セットがあると仮定する。したがって、このデータ・セットは釣合いがとれていない。赤の点は少数クラスを表すことができ、青の点は多数クラスを表すことができる。後続のステップは以下のとおりである。ステップ1で、赤(少数)クラスからの点を、選択された数のクラスタ(例えば5つのクラスタ)にクラスタ化することができる。ステップ2で、(ステップ1からの)赤クラスタのうちのそれぞれのクラスタについて、青(多数)クラスからの同じ数の点をクラスタ化することができる。これらの赤の点と青の点を結合し、「釣合いのとれた」データ・セットを形成する(例えば、釣合いのとれたデータ・セットはそれぞれのクラスからの同数の点を有する)。ステップ3で、ステップ2からの釣合いのとれたデータ・セットについて分類器を訓練することができる。ステップ4で、それぞれのクラスタについてステップ2および3を実行することができ、その結果、5つの分類器を訓練することができる。ステップ5で、予測操作の間に、5つの全ての分類器から1つまたは複数の予測(例えば赤かまたは青かの予測)を生み出し、多い方の予測を最終予測として返すことができる。
このように、多様性が強化されたアンサンブル・モデルの学習は、アンサンブル・モデルを形成する弱い学習器のその多様性を保証することによって強化するアンサンブル・モデルを学習するための教師なし操作の組合せを使用することを含む。最初に少数クラスをクラスタ化することによって、少数クラスのいくつかのサブタイプを発見することができ、それらのサブタイプを使用して、多様化されたアンサンブル・モデル(例えばM、MおよびM)を形成することができる。多数クラスのランダムなサブサンプルによって少数クラスを増大させることができ、このことは、不釣合いなクラスの問題を解決する。
図7は、アンサンブル・モデルを使用したラベル予測のための操作を示す図である。一態様では、図1~6に記載された構成要素、モジュール、サービス、アプリケーションもしくは機能またはこれらの組合せのうちの1つまたは複数を、図7において使用することができる。簡潔にするため、本明細書に記載された他の実施形態で使用されている同じ要素、構成要素、モジュール、サービス、アプリケーションもしくは機能またはこれらの組合せの繰返しの説明は省く。示されているように、さまざまな機能ブロックが、ブロック700の相互関係を表し処理の流れを示す矢印とともに示されている。さらに、機能ブロック700のそれぞれのブロックに関する記述的情報も示されている。
ブロック720で、テスト・データ点710を集め、収集し、もしくは受け取り、またはこれらの組合せを実行し、それらのデータ点を、それぞれの多様化されたアンサンブル・モデル(例えば図5および6で生成されたM、MおよびM)によってテストするために、それらのアンサンブル・モデルに提供することができる。
ブロック730で、多様化されたアンサンブル・モデル(例えばM、MおよびM)のうちのそれぞれのアンサンブル・モデルがテスト・データ点710を使用することができ、1つまたは複数のアンサンブル・モデル(例えばM、MおよびM)からの1つまたは複数の予測を結合することによって、テスト・データ点のスコアを決定することができる。すなわち、多様化されたアンサンブル・モデル(例えばM、MおよびM)は、テスト・データ点710が多数クラスからのものであるのか、もしくは少数クラスからのものであるのか、またはこれらの両方のクラスからのものであるのかを予測することができる。ブロック740に示されているように、多数決によって結合操作を実行することができる。ブロック750に示されているように、最終予測(例えば、テスト・データ点710が多数クラスからのものであるのか、もしくは少数クラスからのものであるのか、またはこれらの両方のクラスからのものであるのかの予測)を実行することができる。この最終的な多数決操作は、それぞれのアンサンブル・モデル予測よりも正確な予測を生み出し、これは「アンサンブル・モデルのバリアンス低減効果」と呼ばれることがあることに留意すべきである。
図8は、プロセッサによってアンサンブル・モデルの強化された多様性および学習を実現するための方法800であり、この方法では、例示された実施形態のさまざまな態様を実施することができる。機能800は、機械上で命令として実行される方法として実施することができ、それらの命令は、少なくとも1つのコンピュータ可読媒体または1つの非一過性機械可読ストレージ媒体に含まれる。機能800はブロック802から開始することができる。
ブロック804に示されているように、少数クラスのデータ点の1つまたは複数のクラスタを多数クラスの選択されたデータ点と結合することによって、1つまたは複数のデータ・セットを生成することができる。ブロック806に示されているように、教師あり機械学習操作を使用して、この1つまたは複数のデータ・セットから1つまたは複数のアンサンブル・モデルを生成することができる。ブロック808に示されているように、この1つまたは複数のアンサンブル・モデルを使用して事象の発生を予測することができる。機能800はブロック810で終了することができる。
一態様では、図8の少なくとも1つのブロックとともに、もしくは図8の少なくとも1つのブロックの部分として、またはその両方で、方法800の操作は、以下のそれぞれの操作を含むことができる。方法800の操作は、この1つまたは複数のアンサンブル・モデルからの1つまたは複数の予測を結合することによって、テスト・データ点のスコアを決定することができる。
方法800の操作は、複数のデータ点から1つまたは複数の特徴を抽出すること、この1つまたは複数の特徴に従って、複数のデータ点のうちのデータ点を多数クラスまたは少数クラスに分類すること、複数の少数クラス・データ点を、少数クラスを形成するK個のクラスタにクラスタ化すること、もしくは少数クラスのK個のクラスタのうちのそれぞれのクラスタを、多数クラスのランダムな数の選択されたデータ点によって増大させること、またはこれらの組合せを実行することができる。方法800の操作はさらに、少数クラスの1つまたは複数のサブクラスを検出することができる。方法800の操作は、教師あり機械学習操作を使用して、少数クラスを、データ点の1つまたは複数のクラスタに分割すること、もしくは予め定められた判定基準に従って、少数クラスのデータ点の1つまたは複数のクラスタにラベルを付けること、またはその両方を実行することができる。
本発明は、システム、方法もしくはコンピュータ・プログラム製品、またはこれらの組合せであることがある。コンピュータ・プログラム製品は、本発明の態様をプロセッサに実行させるためのコンピュータ可読プログラム命令をその上に有するコンピュータ可読ストレージ媒体を含むことがある。
このコンピュータ可読ストレージ媒体は、命令実行デバイスが使用するための命令を保持および記憶することができる有形のデバイスとすることができる。このコンピュータ可読ストレージ媒体は例えば、限定はされないが、電子ストレージ・デバイス、磁気ストレージ・デバイス、光学ストレージ・デバイス、電磁気ストレージ・デバイス、半導体ストレージ・デバイスまたはこれらの適当な組合せとすることができる。コンピュータ可読ストレージ媒体のより具体的な例の非網羅的なリストは、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM)、リードオンリー・メモリ(ROM)、消去可能なプログラマブル・リードオンリー・メモリ(EPROMまたはフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM)、ポータブル・コンパクト・ディスク・リードオンリー・メモリ(CD-ROM)、ディジタル・バーサタイル・ディスク(DVD)、メモリ・スティック、フロッピー(R)・ディスク、機械的にコード化されたデバイス、例えばパンチカードまたはその上に命令が記録された溝の中の一段高くなった構造体、およびこれらの適当な組合せを含む。本明細書で使用されるとき、コンピュータ可読ストレージ媒体は、それ自体が一過性の信号、例えば電波もしくは他の自由に伝搬する電磁波、ウェーブガイドもしくは他の伝送体内を伝搬する電磁波(例えば光ファイバ・ケーブル内を通る光パルス)、または電線を通して伝送される電気信号であると解釈されるべきではない。
本明細書に記載されたコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体から対応するそれぞれのコンピューティング/処理デバイスにダウンロードすることができ、またはネットワーク、例えばインターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワークもしくは無線ネットワークまたはそれらの組合せを介して外部コンピュータもしくは外部ストレージ・デバイスにダウンロードすることができる。このネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータもしくはエッジ・サーバ、またはこれらの組合せを含むことができる。それぞれのコンピューティング/処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インタフェースは、コンピュータ可読プログラム命令をネットワークから受け取り、それらのコンピュータ可読プログラム命令を、対応するそれぞれのコンピューティング/処理デバイス内のコンピュータ可読ストレージ媒体に記憶するために転送する。
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ(ISA)命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、もしくは状態設定データであってもよく、またはSmalltalk(R)、C++などのオブジェクト指向プログラミング言語、および「C」プログラミング言語または同種のプログラミング言語などの従来の手続き型プログラミング言語を含む、1つまたは複数のプログラミング言語の任意の組合せで書かれた、ソース・コードもしくはオブジェクト・コードであってもよい。このコンピュータ可読プログラム命令は、全体がユーザのコンピュータ上で実行されてもよく、一部がユーザのコンピュータ上で実行されてもよく、独立型ソフトウェア・パッケージとして実行されてもよく、一部がユーザのコンピュータ上で、一部が遠隔コンピュータ上で実行されてもよく、または全体が遠隔コンピュータもしくは遠隔サーバ上で実行されてもよい。上記の最後のシナリオでは、遠隔コンピュータが、ローカル・エリア・ネットワーク(LAN)もしくはワイド・エリア・ネットワーク(WAN)を含む任意のタイプのネットワークを介してユーザのコンピュータに接続されてもよく、またはこの接続が、外部コンピュータに対して(例えばインターネット・サービス・プロバイダを使用してインターネットを介して)実施されてもよい。いくつかの実施形態では、本発明の態様を実施するために、例えばプログラム可能論理回路、フィールドプログラマブル・ゲート・アレイ(FPGA)またはプログラム可能論理アレイ(PLA)を含む電子回路が、このコンピュータ可読プログラム命令の状態情報を利用してその電子回路をパーソナライズすることにより、このコンピュータ可読プログラム命令を実行してもよい。
本明細書では、本発明の態様が、本発明の実施形態による方法、装置(システム)およびコンピュータ・プログラム製品の流れ図もしくはブロック図またはその両方の図を参照して説明される。それらの流れ図もしくはブロック図またはその両方の図のそれぞれのブロック、およびそれらの流れ図もしくはブロック図またはその両方の図のブロックの組合せは、コンピュータ可読プログラム命令によって実施することができることが理解される。
これらのコンピュータ可読プログラム命令は、機械を形成する汎用コンピュータ、専用コンピュータまたは他のプログラム可能データ処理装置のプロセッサに、それらのコンピュータまたは他のプログラム可能データ処理装置のプロセッサによって実行されるこれらの命令が、これらの流れ図もしくはブロック図またはその両方の図のブロックに指定された機能/動作を実施する手段を生成するような態様で、提供することができる。これらのコンピュータ可読プログラム命令はさらに、特定の方式で機能するようにコンピュータ、プログラム可能データ処理装置もしくは他のデバイスまたはこれらの組合せに指図することができるコンピュータ可読ストレージ媒体に、その中に命令が記憶されたコンピュータ可読ストレージ媒体が、これらの流れ図もしくはブロック図またはその両方の図のブロックに指定された機能/動作の態様を実施する命令を含む製品を含むような態様で、記憶することができる。
これらのコンピュータ可読プログラム命令はさらに、コンピュータ、他のプログラム可能装置または他のデバイス上で一連の動作ステップを実行させて、コンピュータによって実施されるプロセスを生み出すために、このコンピュータ、他のプログラム可能データ処理装置または他のデバイス上に、このコンピュータ、他のプログラム可能装置または他のデバイス上で実施されるこれらの命令が、これらの流れ図もしくはブロック図またはその両方の図のブロックに指定された機能/動作を実施するような態様で、ロードすることができる。
添付図中の流れ図およびブロック図は、本発明のさまざまな実施形態によるシステム、方法およびコンピュータ・プログラム製品の可能な実施態様のアーキテクチャ、機能および動作を示す。この点に関して、それらの流れ図またはブロック図のそれぞれのブロックは、指定された論理機能を実施する1つまたは複数の実行可能命令を含む、命令のモジュール、セグメントまたは部分を表すことがある。いくつかの代替実施態様では、ブロックに示された機能を、図に示された順序とは異なる順序で実行することができる。例えば、連続して示された2つのブロックが、実際は、実質的に同時に実行されることがあり、または、含まれる機能によってはそれらのブロックが逆の順序で実行されることもある。それらのブロック図もしくは流れ図またはその両方の図のそれぞれのブロック、ならびにそれらのブロック図もしくは流れ図またはその両方の図のブロックの組合せを、指定された機能もしくは動作を実行しまたは専用ハードウェアとコンピュータ命令の組合せを実施するハードウェアベースの専用システムによって実施することができることにも留意すべきである。

Claims (16)

  1. コンピューティング環境においてプロセッサによってアンサンブル・モデルの強化された多様性および学習を実現するための方法であって、
    少数クラスのデータ点の1つまたは複数のクラスタを多数クラスの選択されたデータ点と結合することによって、1つまたは複数のデータ・セットを生成すること、
    教師あり機械学習操作を使用して、前記1つまたは複数のデータ・セットから1つまたは複数のアンサンブル・モデルを生成すること、および
    前記1つまたは複数のアンサンブル・モデルを使用して事象の発生を予測すること
    を含む、方法。
  2. 前記1つまたは複数のアンサンブル・モデルからの1つまたは複数の予測を結合することによって、テスト・データ点のスコアを決定することをさらに含む、請求項1に記載の方法。
  3. 複数のデータ点から1つまたは複数の特徴を抽出すること、
    前記1つまたは複数の特徴に従って、前記複数のデータ点のうちのデータ点を前記多数クラスまたは前記少数クラスに分類すること
    をさらに含む、請求項1に記載の方法。
  4. 複数の少数クラス・データ点を、前記少数クラスを形成するK個のクラスタにクラスタ化すること、および
    前記少数クラスの前記K個のクラスタのうちのそれぞれのクラスタを、前記多数クラスのランダムな数の前記選択されたデータ点によって増大させること
    をさらに含む、請求項1に記載の方法。
  5. 前記少数クラスの1つまたは複数のサブクラスを検出することをさらに含む、請求項1に記載の方法。
  6. 前記教師あり機械学習操作を使用して、前記少数クラスを、データ点の前記1つまたは複数のクラスタに分割することをさらに含む、請求項1に記載の方法。
  7. 予め定められた判定基準に従って、前記少数クラスのデータ点の前記1つまたは複数のクラスタにラベルを付けることをさらに含む、請求項1に記載の方法。
  8. コンピューティング環境においてアンサンブル・モデルの強化された多様性および学習を実現するためのシステムであって、
    実行可能命令を含む1つまたは複数のコンピュータ
    を備え、前記実行可能命令が、実行されたときに、前記システムに、
    少数クラスのデータ点の1つまたは複数のクラスタを多数クラスの選択されたデータ点と結合することによって、1つまたは複数のデータ・セットを生成すること、
    教師あり機械学習操作を使用して、前記1つまたは複数のデータ・セットから1つまたは複数のアンサンブル・モデルを生成すること、および
    前記1つまたは複数のアンサンブル・モデルを使用して事象の発生を予測すること
    を実行させる、システム。
  9. 前記実行可能命令が、前記1つまたは複数のアンサンブル・モデルからの1つまたは複数の予測を結合することによって、テスト・データ点のスコアを決定する、請求項8に記載のシステム。
  10. 前記実行可能命令が、
    複数のデータ点から1つまたは複数の特徴を抽出し、
    前記1つまたは複数の特徴に従って、前記複数のデータ点のうちのデータ点を前記多数クラスまたは前記少数クラスに分類する、
    請求項8に記載のシステム。
  11. 前記実行可能命令が、
    複数の少数クラス・データ点を、前記少数クラスを形成するK個のクラスタにクラスタ化し、
    前記少数クラスの前記K個のクラスタのうちのそれぞれのクラスタを、前記多数クラスのランダムな数の前記選択されたデータ点によって増大させる、
    請求項8に記載のシステム。
  12. 前記実行可能命令が、前記少数クラスの1つまたは複数のサブクラスを検出する、請求項8に記載のシステム。
  13. 前記実行可能命令が、前記教師あり機械学習操作を使用して、前記少数クラスを、データ点の前記1つまたは複数のクラスタに分割する、請求項8に記載のシステム。
  14. 前記実行可能命令が、予め定められた判定基準に従って、前記少数クラスのデータ点の前記1つまたは複数のクラスタにラベルを付ける、請求項8に記載のシステム。
  15. コンピュータ・プログラムであって、請求項1ないし7のいずれか1項に記載の方法の各ステップをコンピュータに実行させるための、コンピュータ・プログラム。
  16. 請求項15に記載のコンピュータ・プログラムを記録した、コンピュータ可読ストレージ媒体。
JP2021559389A 2019-04-11 2020-03-18 アンサンブル・モデルの強化された多様性および学習 Active JP7335352B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/381,979 US11593716B2 (en) 2019-04-11 2019-04-11 Enhanced ensemble model diversity and learning
US16/381,979 2019-04-11
PCT/IB2020/052472 WO2020208445A1 (en) 2019-04-11 2020-03-18 Enhanced ensemble model diversity and learning

Publications (3)

Publication Number Publication Date
JP2022527366A JP2022527366A (ja) 2022-06-01
JPWO2020208445A5 JPWO2020208445A5 (ja) 2022-08-12
JP7335352B2 true JP7335352B2 (ja) 2023-08-29

Family

ID=72749268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021559389A Active JP7335352B2 (ja) 2019-04-11 2020-03-18 アンサンブル・モデルの強化された多様性および学習

Country Status (5)

Country Link
US (1) US11593716B2 (ja)
JP (1) JP7335352B2 (ja)
CN (1) CN113632112A (ja)
GB (1) GB2598061A (ja)
WO (1) WO2020208445A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200342968A1 (en) * 2019-04-24 2020-10-29 GE Precision Healthcare LLC Visualization of medical device event processing
US20210342707A1 (en) * 2020-05-01 2021-11-04 International Business Machines Corporation Data-driven techniques for model ensembles
US11356387B1 (en) 2020-12-14 2022-06-07 Cigna Intellectual Property, Inc. Anomaly detection for multiple parameters
JP7322918B2 (ja) * 2021-03-29 2023-08-08 横河電機株式会社 プログラム、情報処理装置、及び学習モデルの生成方法
US20240161458A1 (en) * 2022-11-10 2024-05-16 Samsung Electronics Co., Ltd. Method and device with object classification

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009122851A (ja) 2007-11-13 2009-06-04 Internatl Business Mach Corp <Ibm> データを分類する技術
JP2013161298A (ja) 2012-02-06 2013-08-19 Nippon Steel & Sumitomo Metal 分類器作成装置、分類器作成方法、及びコンピュータプログラム
US20180210944A1 (en) 2017-01-26 2018-07-26 Agt International Gmbh Data fusion and classification with imbalanced datasets
JP2020532025A (ja) 2017-08-11 2020-11-05 ビュノ インコーポレイテッドVuno, Inc. 被検体の致命的症状の発生を早期に予測するための予測結果を生成する方法、及びそれを利用する装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7127087B2 (en) * 2000-03-27 2006-10-24 Microsoft Corporation Pose-invariant face recognition system and process
WO2007115426A2 (en) * 2006-03-30 2007-10-18 Carestream Health, Inc. Smote algorithm with locally linear embedding
US20130097103A1 (en) 2011-10-14 2013-04-18 International Business Machines Corporation Techniques for Generating Balanced and Class-Independent Training Data From Unlabeled Data Set
US10515448B2 (en) 2016-09-20 2019-12-24 International Business Machines Corporation Handprint analysis to predict genetically based traits
US10956821B2 (en) 2016-11-29 2021-03-23 International Business Machines Corporation Accurate temporal event predictive modeling
CN109032829B (zh) 2018-07-23 2020-12-08 腾讯科技(深圳)有限公司 数据异常检测方法、装置、计算机设备及存储介质
US11128667B2 (en) * 2018-11-29 2021-09-21 Rapid7, Inc. Cluster detection and elimination in security environments

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009122851A (ja) 2007-11-13 2009-06-04 Internatl Business Mach Corp <Ibm> データを分類する技術
JP2013161298A (ja) 2012-02-06 2013-08-19 Nippon Steel & Sumitomo Metal 分類器作成装置、分類器作成方法、及びコンピュータプログラム
US20180210944A1 (en) 2017-01-26 2018-07-26 Agt International Gmbh Data fusion and classification with imbalanced datasets
JP2020532025A (ja) 2017-08-11 2020-11-05 ビュノ インコーポレイテッドVuno, Inc. 被検体の致命的症状の発生を早期に予測するための予測結果を生成する方法、及びそれを利用する装置

Also Published As

Publication number Publication date
US20200327456A1 (en) 2020-10-15
GB202115645D0 (en) 2021-12-15
JP2022527366A (ja) 2022-06-01
GB2598061A (en) 2022-02-16
WO2020208445A1 (en) 2020-10-15
CN113632112A (zh) 2021-11-09
US11593716B2 (en) 2023-02-28

Similar Documents

Publication Publication Date Title
JP7335352B2 (ja) アンサンブル・モデルの強化された多様性および学習
US10956821B2 (en) Accurate temporal event predictive modeling
US11062230B2 (en) Detecting data anomalies
JP7046181B2 (ja) マルチ・タスク学習を用いた特徴抽出方法、コンピュータ・システム、およびコンピュータ・プログラム製品(マルチ・タスク学習を用いた特徴抽出)
US11074913B2 (en) Understanding user sentiment using implicit user feedback in adaptive dialog systems
US11132510B2 (en) Intelligent management and interaction of a communication agent in an internet of things environment
US11048564B2 (en) API evolution and adaptation based on cognitive selection and unsupervised feature learning
US11568249B2 (en) Automated decision making for neural architecture search
US11663486B2 (en) Intelligent learning system with noisy label data
US11645575B2 (en) Linking actions to machine learning prediction explanations
US11432762B2 (en) Intelligent monitoring of a health state of a user engaged in operation of a computing device
US10621976B2 (en) Intent classification from multiple sources when building a conversational system
US20200074052A1 (en) Intelligent user identification
US20220092464A1 (en) Accelerated machine learning
US11847132B2 (en) Visualization and exploration of probabilistic models
US11646116B2 (en) Intelligent identification of appropriate sections of clinical practical guideline
US11314984B2 (en) Intelligent generation of image-like representations of ordered and heterogenous data to enable explainability of artificial intelligence results
US10832393B2 (en) Automated trend detection by self-learning models through image generation and recognition
US20230168877A1 (en) Upgrading operating software (&#34;os&#34;) for devices in a multi-device ecosystem
US20220188693A1 (en) Self-improving bayesian network learning
US20230129390A1 (en) Data processing application system management in non-stationary environments
US11740726B2 (en) Touch sensitivity management
US20230342627A1 (en) Automated lookback window searching
US20230214454A1 (en) Intelligent expansion of reviewer feedback on training data
WO2023011618A1 (en) Predicting root cause of alert using recurrent neural network

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220803

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220824

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230731

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230817

R150 Certificate of patent or registration of utility model

Ref document number: 7335352

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150