JP7413392B2 - トレーニング・データと性能トレンドとの相関付けに基づいたコンピュータ・モデル機械学習 - Google Patents

トレーニング・データと性能トレンドとの相関付けに基づいたコンピュータ・モデル機械学習 Download PDF

Info

Publication number
JP7413392B2
JP7413392B2 JP2021547725A JP2021547725A JP7413392B2 JP 7413392 B2 JP7413392 B2 JP 7413392B2 JP 2021547725 A JP2021547725 A JP 2021547725A JP 2021547725 A JP2021547725 A JP 2021547725A JP 7413392 B2 JP7413392 B2 JP 7413392B2
Authority
JP
Japan
Prior art keywords
computer
training
model
implemented model
implemented
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021547725A
Other languages
English (en)
Other versions
JPWO2020178687A5 (ja
JP2022522641A (ja
Inventor
チェン、ハンキン
ラメシュ、アブヒナンダン ケルゲレ
ロートレイ、ラマーニ
イプ、ロバート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2022522641A publication Critical patent/JP2022522641A/ja
Publication of JPWO2020178687A5 publication Critical patent/JPWO2020178687A5/ja
Application granted granted Critical
Publication of JP7413392B2 publication Critical patent/JP7413392B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Algebra (AREA)
  • Debugging And Monitoring (AREA)
  • Feedback Control In General (AREA)

Description

本出願は、包括的には、改善されたデータ処理装置および方法に関し、より詳細には、トレーニング・データと性能トレンドとの相関付けに基づいたコンピュータ・モデル機械学習の実行のためのメカニズムに関する。
コンピュータ・モデル、またはコンピュータ・シミュレーションは、物理的世界においてオブジェクトまたはシステムをシミュレートすることによって、或る状況において何が起こり得るか、または何が起こったかをシミュレートするように設計されたコンピュータ・プログラムであり、ここで、このオブジェクトまたはシステムは、生物学的オブジェクト/システム、コンピュータ・オブジェクト/システム、環境オブジェクト/システム、機械的オブジェクト/システム、または物理的世界に存在し得る任意の他のオブジェクトもしくはシステムを含む様々なタイプのものとすることができる。コンピュータ・モデル、またはコンピュータ・シミュレーションは、天文学、経済学、ならびに物理学および生物学等の様々な科学分野を含む多くの方式で用いられる。多くの現代のコンピュータ・モデルまたはコンピュータ・シミュレーションは、機械学習手法に基づいたトレーニング動作を利用して、コンピュータ・モデルまたはコンピュータ・シミュレーションをトレーニングし、オブジェクトまたはシステムの挙動を適切に予測する。
機械学習(ML)は、特定のタスクに対する性能を漸進的に改善するためにコンピュータ・システムが用いるアルゴリズムおよび統計モデルの科学的研究である。機械学習アルゴリズムは、タスクを実行するように明示的にプログラムされることなく予測または判定を行うために、「トレーニング・データ」として既知のサンプル・データの数学的モデルを構築する。機械学習アルゴリズムは、タスクを実行するための特殊な命令のアルゴリズムを開発することが実行不可能な、電子メールフィルタリング、ネットワーク侵入者の検出、コンピュータ・ビジョンの用途において用いられる。機械学習は、コンピュータを用いて予測を行うことに焦点を当てた計算統計学に密接に関連している。データ・マイニングは、機械学習における研究分野であり、教師なし学習を通じた探索的データ分析に焦点を当てる。ビジネス上の問題にわたるその用途において、機械学習は、予測的アナリティクスとも呼ばれる。
この発明の概要は、本明細書の発明を実施するための形態において更に説明される概念の抜粋を簡易化した形で紹介するために提供される。本要約は、特許請求の範囲の対象の主要素または本質的特徴を識別することは意図されておらず、特許請求の範囲の対象を限定するために用いることも意図されていない。
1つの態様によれば、データ処理システムにおいて、コンピュータ実施モデルをトレーニングするための方法が提供される。本方法は、データ処理システムによって、コンピュータ実施モデルのトレーニングの複数のインスタンスを実行することを含み、コンピュータ実施モデルのトレーニングの各インスタンスは、異なるトレーニング・データ・セットを用いてコンピュータ実施モデルをトレーニングして、トレーニングされたコンピュータ実施モデルの異なるインスタンスを生成することを含む。本方法は、トレーニングの各インスタンス後に、トレーニングされたコンピュータ実施モデルの対応するインスタンスを実行することによって、コンピュータ実施モデル結果を生成することを更に含む。加えて、本方法は、データ処理システムによって、トレーニングされたコンピュータ実施モデルのインスタンスの対応する識別子および対応するコンピュータ実施モデル結果に関連付けて、コンピュータ実施モデルのトレーニングのインスタンスの差を記録することを含む。更に、本方法は、データ処理システムによって、記録された差および対応するコンピュータ実施モデル結果を分析することと、データ処理システムによって、記録された差と、対応するコンピュータ実施モデル結果との間の相関を示す出力を生成することとを含む。
1つの例示的な実施形態において、コンピュータ実施モデルのトレーニングの複数のインスタンスを実行することは、データ処理システムによって、トレーニング・データの第1のバージョンおよび1つまたは複数のハイパーパラメータの第1のセットを用いて、コンピュータ実施モデルに対し第1のトレーニング動作を実行して、コンピュータ実施モデルの第1のトレーニングされたインスタンスを生成することと、データ処理システムによって、トレーニング・データの第2のバージョンおよび1つまたは複数のハイパーパラメータの第2のセットを用いて、コンピュータ実施モデルに対し第2のトレーニング動作を実行して、コンピュータ実施モデルの第2のトレーニングされたインスタンスを生成することとを含む。トレーニング・データの異なるバージョンおよびハイパーパラメータを用いてコンピュータ実施モデルの異なるインスタンスをトレーニングすることによって、例示的な実施形態は、コンピュータ・モデルの性能におけるトレンドを特定し、これを特定のトレーニング・データ・セットおよびハイパーパラメータ設定と相関付けることが可能である。
いくつかの例示的な実施形態において、コンピュータ実施モデルのトレーニングのインスタンスの変更を記録することは、データ処理システムによって、第1のトレーニング動作の第1の識別子を、トレーニング・データの第1のバージョンおよび1つまたは複数のハイパーパラメータの第1のセットと相関付ける第1の追跡データ構造を生成することと、データ処理システムによって、第2のトレーニング動作の第2の識別子を、トレーニング・データの第2のバージョンおよび1つまたは複数のハイパーパラメータの第2のセットと相関付ける第2の追跡データ構造を生成することとを含む。いくつかの例示的な実施形態において、コンピュータ実施モデル結果を生成することは、コンピュータ実施モデルの第1のインスタンスの実行から第1のモデル結果を生成することと、コンピュータ実施モデルの第2のインスタンスの実行から第2のモデル結果を生成することとを含み、ここで、記録された差および対応するコンピュータ実施モデル結果を分析することは、データ処理システムによって、第1の追跡データ構造、第2の追跡データ構造、第1のモデル結果および第2のモデル結果に対しアナリティクスを実行して、第1のモデル結果と第2のモデル結果との差と相関する、第1のトレーニング動作と第2のトレーニング動作との差を特定することを含む。ここでもまた、これらの動作は、所望の性能を達成するためのトレーニング特性の適切な選択を特定することができるように、トレーニングの差をモデル結果の差と相関付ける役割を果たす。
いくつかの例示的な実施形態において、トレーニング・データの第2のバージョンは、トレーニング・データの第1のバージョンの変更バージョンである。このようにして、例示的な実施形態のメカニズムは、トレーニング・データの第1のバージョンにおけるどの変更がコンピュータ・モデルの性能を改善または低下させるかを判断することができる。
いくつかの例示的な実施形態において、出力を生成することは、記録された差および対応するコンピュータ実施モデル結果に基づいて、どの変更がコンピュータ実施モデルの正確性を増大させるかを特定することによって、コンピュータ実施モデルのトレーニングを変更してトレーニング・データを改善するための1つまたは複数の推薦(レコメンデーション)を生成することを更に含む。更に、いくつかの例示的な実施形態において、コンピュータ動作は、生成された1つまたは複数の推薦を実施するために自動的に実行され、ここで、コンピュータ動作は、コンピュータ実施モデルのトレーニングを改善するエンティティとして1つまたは複数の推薦において指定されたエンティティを含む新たなトレーニング・データを得ること、コンピュータ実施モデルのトレーニングを劣化させるエンティティとして1つまたは複数の推薦において指定されたエンティティを除去すること、コンピュータ実施モデルの少なくとも1つのハイパーパラメータを変更すること、またはコンピュータ実施モデルのトレーニングを実行するのに用いられるコンピュータ・モデル・トレーニング・ツールを変更することのうちの少なくとも1つを含む。このようにして、コンピュータ・モデルのトレーニングは、例示的な実施形態によって行われるトレンド分析に基づいて自動的に改善することができる。
いくつかの例示的な実施形態において、コンピュータ実施モデルをトレーニングするのに用いられるトレーニング・データのインスタンスは、コンピュータ実施モデルをトレーニングするのに用いられるトレーニング・データを、トレーニング・データの前のバージョンに戻すことができるように追跡される。このため、これらのメカニズムにより、コンピュータ・モデルのトレーニングの変更の結果として、望ましくない性能変化が生じる場合、トレーニングに対し行われた変更を戻して、所望の性能を達成するためのコンピュータ・モデルの最適なトレーニングを確実にすることができる。
いくつかの例示的な実施形態において、分析は、記録された差および対応するコンピュータ実施モデル結果に対しトレンド分析を実行することを含む。このトレンド分析は、所望のまたは最適な性能を達成するためにコンピュータ・モデルのトレーニングを変更することに労力を向けるように、トレーニング・データの変更および対応する性能変化の投影を決定することを可能にする。
いくつかの例示的な実施形態において、コンピュータ実施モデルのトレーニングの複数のインスタンスは、1つまたは複数のロケーションにおける異なるコンピュータ実施モデル開発者によってコンピュータ実施モデルの異なるコピーをトレーニングして、トレーニングされたコンピュータ実施モデルのインスタンスの異なるサブセットを生成することを含み、方法は、異なるコンピュータ実施モデル開発者からのトレーニングされたコンピュータ実施モデルのインスタンスの全てのサブセットにわたって実行される。このため、例示的な実施形態のメカニズムにより、複数の異なるモデル開発者によって実行されるコンピュータ・モデルのインスタンスの個々のトレーニングを用いて、コンピュータ・モデルの独自のインスタンスから、より良好な性能を達成するように他の開発者を支援することができる。
他の例示的な実施形態において、コンピュータ可読プログラムを有するコンピュータ使用可能または可読媒体を備えるコンピュータ・プログラム製品が提供される。コンピュータ可読プログラムは、コンピューティング・デバイスにおいて実行されると、コンピューティング・デバイスに、上記で例示的な方法実施形態のうちの1つまたは複数に関して概説された動作のうちの様々なもの、およびこれらの組合せを実行させる。
更に別の例示的な実施形態において、システム/装置が提供される。システム/装置は、1つまたは複数のプロセッサと、1つまたは複数のプロセッサに結合されたメモリとを備えることができる。メモリは、1つまたは複数のプロセッサによって実行されると、1つまたは複数のプロセッサに、上記で例示的な方法実施形態のうちの1つまたは複数に関して概説された動作のうちの様々なもの、およびこれらの組合せを実行させる。
別の態様によれば、コンピュータ可読プログラムが記憶されたコンピュータ可読記憶媒体を備えるコンピュータ・プログラム製品が提供される。コンピュータ可読プログラムは、データ処理システムにおいて実行されると、データ処理システムに、コンピュータ実施モデルのトレーニングの複数のインスタンスを実行することであって、コンピュータ実施モデルのトレーニングの各インスタンスは、異なるトレーニング・データ・セットを用いてコンピュータ実施モデルをトレーニングして、トレーニングされたコンピュータ実施モデルの異なるインスタンスを生成することを含む、実行することと、トレーニングの各インスタンス後に、トレーニングされたコンピュータ実施モデルの対応するインスタンスを実行することによって、コンピュータ実施モデル結果を生成することと、トレーニングされたコンピュータ実施モデルのインスタンスの対応する識別子および対応するコンピュータ実施モデル結果に関連付けて、コンピュータ実施モデルのトレーニングのインスタンスの差を記録することと、記録された差および対応するコンピュータ実施モデル結果を分析することと、記録された差と、対応するコンピュータ実施モデル結果との間の相関を示す出力を生成することとを実行させる。
別の態様によれば、装置であって、プロセッサと、プロセッサに結合されたメモリであって、メモリは命令を含み、命令は、プロセッサによって実行されると、プロセッサに、コンピュータ実施モデルのトレーニングの複数のインスタンスを実行することであって、コンピュータ実施モデルのトレーニングの各インスタンスは、異なるトレーニング・データ・セットを用いてコンピュータ実施モデルをトレーニングして、トレーニングされたコンピュータ実施モデルの異なるインスタンスを生成することを含む、実行することと、トレーニングの各インスタンス後に、トレーニングされたコンピュータ実施モデルの対応するインスタンスを実行することによって、コンピュータ実施モデル結果を生成することと、トレーニングされたコンピュータ実施モデルのインスタンスの対応する識別子および対応するコンピュータ実施モデル結果に関連付けて、コンピュータ実施モデルのトレーニングのインスタンスの差を記録することと、記録された差および対応するコンピュータ実施モデル結果を分析することと、記録された差と、対応するコンピュータ実施モデル結果との間の相関を示す出力を生成することとを行わせる、メモリと、を備える、装置が提供される。
本明細書に開示される解決策のこれらのおよび他の特徴および利点は、本発明の例示的な実施形態の以下の詳細な説明に記載されるか、またはこれに鑑みて当業者に明らかとなるであろう。
ここで、本発明の好ましい実施形態を、単なる例として、以下の図を参照して説明する。
本発明の例示的な実施形態が実施される分散コンピューティング・システムのブロック図である。 本発明の例示的な実施形態が実施される例示的なデータ処理システムのブロック図である。 1つの例示的な実施形態によるコンピュータ・モデル・トレーニング・コンピューティング・システムの例示的な動作を概説するフローチャートである。 1つの例示的な実施形態によるトレーニング情報のダッシュボード表現の例示的な図である。 1つの例示的な実施形態によるコンピュータ・モデルのコピーのトレーニングのトレンドのグラフィック表現の例示的な図である。 1つの例示的な実施形態による、トレーニング・モデル特性およびトレーニング・データ・セット特性の表形式の表現の例示的な図である。
例示的な実施形態は、トレーニング・データと性能トレンドとの相関に基づいてコンピュータ・モデル機械学習を実行するためのメカニズムを提供する。本解決策は、特に、トレーニング・データ、トレーニング・ツール、ハイパーパラメータ等の変更、およびこれらの変更に基づくコンピュータ・モデルの性能および正確性における対応するトレンドの観測に基づいて、これらのコンピュータ・モデルの性能および正確性を改善するようにコンピュータ・モデルをトレーニングするためのコンピュータ・ツールに対する改善を対象とする。このようにして、コンピュータ・モデル・トレーニングに対し改善がもたらされ、ひいては、結果としてコンピュータ・モデルの性能および正確性が改善する。
上述したように、コンピュータ・モデルは、様々なオブジェクトもしくはシステムが特定の刺激に応じて動作する方式をシミュレートもしくは予測するか、または特定のオブジェクトもしくはシステムが動作した方式の動作理由を特定するためのアナリティクスを実行するのに利用される。コンピュータ・モデルは、アナリティクスおよび予測モデル化を実行するための優れたツールを提供するが、これらの性能および正確性は、多くの場合、コンピュータ・モデルのトレーニングの品質に依拠し、この品質自体が、トレーニングを実行するのに利用される特定のトレーニング・データに依拠する。
更に、現代のコンピュータ・モデリングにおいて、そのようなコンピュータ・モデルは、多くの場合、機械学習トレーニング動作を用いてトレーニングされ、機械学習トレーニング動作において、そのようなトレーニング・データは、コンピュータ・モデルの性能および正確性を改善するためにコンピュータ・モデルの動作を変更するための基礎として用いられる。すなわち、教師なし機械学習と呼ばれる場合がある1つのタイプの機械学習手法において、機械学習は、コンピュータ・モデルの正しい出力、すなわち「グランド・トゥルース」が、事前に知られており、コンピュータ・モデルの実際の出力をこれに対し比較してコンピュータ・モデルがどれだけ良好に機能しているかを判断する基礎となる、トレーニング・データを利用する。コンピュータ・モデルの出力とグランド・トゥルースとの差に基づいて、コンピュータ・モデルにおける誤差が決定され、コンピュータ・モデルと関連付けられた動作パラメータが、この誤差を低減するように変更される。このプロセスは、誤差が、許容可能な誤差、例えば、閾値誤差レベルまたはモデルにおける損失以下であると判断されるまで、反復的に実行することができる。
教師あり機械学習と呼ばれる場合がある他のタイプの機械学習には、生成する結果の正確性もしくは不正確性、または実施される動作パラメータに対する変更、あるいはその両方についてコンピュータ・モデルに通知する主題専門家等の人間が関与する。例えば、主題専門家(SME)は、コンピュータ・モデルから出力を入手することができ、動作パラメータ、トレーニング・データ等に対し手動で調節を行うことができ、次に、再びコンピュータ・モデルを実行して、性能における改善が達成されたか否かを知ることができる。
これらのコンピュータ・モデルのトレーニングは、利用されるトレーニング・データ、利用されるトレーニング・ツール、およびコンピュータ・モデルの動作パラメータ、例えば、コンピュータ・モデルのハイパーパラメータの特定の設定に大きく依拠することを理解することができ、ここで、ハイパーパラメータは、機械学習プロセスの前に固定されるコンピュータ・モデルの動作パラメータである。そのようなハイパーパラメータは、多くの場合、主題専門家の知識に基づいてセットされ、機械学習トレーニング・プロセス中、静的である。
コンピュータ・モデルの改善された性能および正確性を得ることを試みるために、コンピュータ・モデルのトレーニングに関与する人間の開発者は、トレーニング・データ、トレーニング・ツール、ハイパーパラメータ等に対し変更を行い、モデルに所望の性能または正確性を達成させるように試みることができる。例えば、人間の開発者が、潜在的には主題専門家の支援により、コンピュータ・モデルの動作をオン・ザ・フライでトレーニングおよび学習し、トレーニング・データ、ハイパーパラメータ、トレーニング・ツール等に対し変更を行っているシナリオを検討する。開発者は、複数のツール、いくつかのタイプのハイパーパラメータを用いることができ、トレーニング・データを変更して様々な結果を得ることができる。このプロセス中、開発者は、グランド・トゥルースが誤りであると判断し、新たなものを得る、すなわち、トレーニング・データの新たなバージョンが得られる。ここで、開発者は、再びトレーニング・プロセスを通して戻る。トレーニング・データ・セットごとに、開発者は、異なるツール、異なるハイパーパラメータを適用し、異なる結果を入手することができる。
このトレーニング・プロセスに伴う問題は、行われた変更を追跡し、コンピュータ・モデルの性能および正確性の差と相関付けることが可能であることである。すなわち、異常、トレンド等を特定し、どの変更がコンピュータ・モデルの性能および正確性の改善または悪化に対応するかを判断するために、開発者が、行われた変更、ならびにコンピュータ・モデルの性能および正確性に対する変化との対応関係をどのように追跡するかである。更に、この問題は、各々がコンピュータ・モデルの独自の個々のインスタンスのそのような変更およびトレーニングを独立して実行する異なる開発者に、同じコンピュータ・モデルの複数のインスタンスが配信されるときに増幅する。
例示的な実施形態のメカニズムにより、開発者がコンピュータ・モデル(以後、単に「モデル」と呼ばれる)のトレーニングを変更および更新する際、コンピュータ・モデルの性能および正確性に影響を及ぼすトレーニング・データにおける追加/削除/変更、例えば、何のエンティティが追加され、何のエンティティが削除され、何のエンティティが変更されたかが追跡される。追跡データに対しアナリティクスが実行され、トレーニング・データにおけるトレンド、ならびにモデルの対応する性能および正確性が特定される。このプロセスは、モデルとの反復トレーニングセッション、ならびに異なるトレーニング・データ・セット、異なるトレーニング・ツールおよび異なるハイパーパラメータ設定について繰り返すことができる。例えば、開発者は、日毎に新たなトレーニング・データに対しコンピュータ・モデルを実行することができ、トレーニング・データの変更と相関付けることができる特定されたトレンドをもたらすことができるコンピュータ・モデルの正確性の更新を得ることができる。
特定されたトレンドに基づいて、例示的な実施形態のメカニズムは、何の変更がモデルの正確性を増大させるかを特定することによって、トレーニング・データをどのように改善するかに関する推薦、例えば、Xのようなエンティティをより多く含むことによりモデルの正確性が増大する、を生成することができる。そのような推薦は、行うべきでない変更、すなわち、結果としてモデルの正確性または性能が低下した変更の推薦と共に開発者に出力することができる。いくつかの例示的な実施形態において、例示的な実施形態のメカニズムによって生成された推薦を用いて、1つまたは複数のトレーニング・データ・セット・リポジトリにおいて他のトレーニング・データ・セットを自動的に探索することができ、これは、コンピュータ・モデルの正確性または性能あるいはその両方を改善すると判断されるエンティティを含むことができる。更にいくつかの実施形態において、自動的に特定されたトレーニング・データ・セットを自動的に索出し、これを用いてコンピュータ・モデルをトレーニングすることができる。このプロセスは、コンピュータ・モデルの所望の正確性もしくは性能が達成されるまで、または利用可能なトレーニング・データ・セット、ツール等に基づいて更なる改善が可能でないと判断されるまで繰り返すことができる。
トレンド、異常等を特定するためのこの追跡および相関は、異なるコンピュータ・モデル・インスタンス、異なる開発者等にわたって行うことができる。このため、コンピュータ・モデルの第1のインスタンスを用いる顧客Aにおける第1の開発者は、独自の独立したトレーニング・データ・セット変更、動作パラメータ変更等を行うことができ、この情報、および第1のコンピュータ・モデル・インスタンスの性能/正確性との相関が追跡され、集中化されたコンピューティング・システムに報告される。コンピュータ・モデルの第2のインスタンスを用いる顧客Bにおける第2の開発者は、独自の独立したトレーニング・データ・セット変更、動作パラメータ変更等を行うことができ、この情報、および第2のコンピュータ・モデル・インスタンスの性能/正確性との相関が追跡され、集中化されたコンピューティング・システムに報告される。例示的な実施形態のメカニズムは、第1および第2双方のコンピュータ・モデル・インスタンスのための全ての報告された情報に対しアナリティクスを実行し、コンピュータ・モデルの性能および正確性を改善するための推薦を行うのに用いることができるトレンド情報を生成することができる。
いくつかの例示的な実施形態において、トレーニング・データのためのバージョン追跡は、必要な場合、トレーニング・データの以前のバージョンを再作成することができるように提供される。すなわち、モデルが用いるためにフォーマット設定されたトレーニング・データの、最初に受信されたトレーニング・データへのマッピングが維持される。このようにして、モデルによりフォーマット設定されたトレーニング・データを所与として、最初に受信したトレーニング・データを再作成することができる。このため、例示的な実施形態のメカニズムは、顧客から得たトレーニング・データのバージョンを、コンピュータ・モデルの消費のために生成されたデータのバージョンと相関付けることができ、より早期のバージョンを再現することができるように、バージョニングの追跡により顧客データに戻ることができる。
このため、例示的な実施形態のメカニズムを用いて、コンピュータ実施モデルをトレーニングするためのコンピュータ方法論が提供され、ここで、このコンピュータ方法論は、コンピュータ・モデルをトレーニングし、トレーニングに対し行われた変更を追跡するとともに、トレーニングに対し行われた変更を性能/正確性メトリックと相関付けるためのコンピュータ固有の動作の順序付けされた組合せを実行するように特に構成されたデータ処理システムにおいて実施される。コンピュータ方法論は、追跡情報におけるトレンドを特定し、コンピュータ実施モデルのトレーニングを改善するための推薦を生成するか、またはコンピュータ実施モデルのトレーニングを改善するために生成された推薦を自動的に実施するか、あるいはその両方を行うために分析を行うコンピュータ固有の動作を更に提供する。
1つの例示的な実施形態において、コンピュータ方法論は、特別に構成されたデータ処理システムによって、コンピュータ実施モデルのトレーニングの複数のインスタンスを実行することを含み、コンピュータ実施モデルのトレーニングの各インスタンスは、異なるトレーニング・データ・セットを用いてコンピュータ実施モデルをトレーニングして、コンピュータ実施モデルのトレーニングの他のインスタンスと異なる、トレーニングされたコンピュータ実施モデルのインスタンスを生成することを含む。コンピュータ方法論は、トレーニングの各インスタンス後に、トレーニングされたコンピュータ実施モデルの対応するインスタンスを実行することによって、コンピュータ実施モデル結果を生成することを更に含む。更に、コンピュータ方法論は、データ処理システムによって、トレーニングされたコンピュータ実施モデルのインスタンスの対応する識別子および対応するコンピュータ実施モデル結果に関連付けて、コンピュータ実施モデルのトレーニングのインスタンスの差を記録することを含む。コンピュータ方法論は、データ処理システムによって、記録された差および対応するコンピュータ実施モデル結果を分析することと、データ処理システムによって、記録された差と、対応するコンピュータ実施モデル結果との間の相関を示す出力を生成することとを更に含む。
いくつかの例示的な実施形態において、コンピュータ方法論は、少なくとも、データ処理システムによって、トレーニング・データの第1のバージョンおよび1つまたは複数のハイパーパラメータの第1のセットを用いて、コンピュータ実施モデルに対し第1のトレーニング動作を実行して、コンピュータ実施モデルの第1のトレーニングされたインスタンスを生成することによって、コンピュータ実施モデルのトレーニングの複数のインスタンスを実行する。コンピュータ方法論は、データ処理システムによって、トレーニング・データの第2のバージョンおよび1つまたは複数のハイパーパラメータの第2のセットを用いて、コンピュータ実施モデルに対し第2のトレーニング動作を実行して、コンピュータ実施モデルの第2のトレーニングされたインスタンスを生成することによって、コンピュータ実施モデルのトレーニングの複数のインスタンスを更に実行する。
いくつかの例示的な実施形態において、コンピュータ方法論は、少なくとも、データ処理システムによって、第1のトレーニング動作の第1の識別子を、トレーニング・データの第1のバージョンおよび1つまたは複数のハイパーパラメータの第1のセットと相関付ける第1の追跡データ構造を生成することと、データ処理システムによって、第2のトレーニング動作の第2の識別子を、トレーニング・データの第2のバージョンおよび1つまたは複数のハイパーパラメータの第2のセットと相関付ける第2の追跡データ構造を生成することとによって、コンピュータ実施モデルのトレーニングのインスタンスの変化を記録する。いくつかの例示的な実施形態において、コンピュータ方法論は、少なくとも、コンピュータ実施モデルの第1のインスタンスの実行から第1のモデル結果を生成し、コンピュータ実施モデルの第2のインスタンスの実行から第2のモデル結果を生成することによって、コンピュータ実施モデル結果を生成する。そのような例示的な実施形態において、記録された差および対応するコンピュータ実施モデル結果の分析は、データ処理システムによって、第1の追跡データ構造、第2の追跡データ構造、第1のモデル結果および第2のモデル結果に対しアナリティクスを実行して、第1のモデル結果と第2のモデル結果との差と相関する、第1のトレーニング動作と第2のトレーニング動作との差を特定することを含む。
いくつかの例示的な実施形態において、トレーニング・データの第2のバージョンは、トレーニング・データの第1のバージョンの変更バージョンである。いくつかの例示的な実施形態において、コンピュータ方法論は、少なくとも、記録された差および対応するコンピュータ実施モデル結果に基づいて、どの変更がコンピュータ実施モデルの正確性を増大させるかを特定することによって、コンピュータ実施モデルのトレーニングを変更してトレーニング・データを改善するための推薦を生成することによって、出力を生成する。いくつかの例示的なコンピュータ動作は、生成された1つまたは複数の推薦を実施するために自動的に実行され、ここで、コンピュータ動作は、コンピュータ実施モデルのトレーニングを改善するエンティティとして1つまたは複数の推薦において指定されたエンティティを含む新たなトレーニング・データを得ること、コンピュータ実施モデルのトレーニングを劣化させるエンティティとして1つまたは複数の推薦において指定されたエンティティを除去すること、コンピュータ実施モデルの少なくとも1つのハイパーパラメータを変更すること、またはコンピュータ実施モデルのトレーニングを実行するのに用いられるコンピュータ・モデル・トレーニング・ツールを変更することのうちの少なくとも1つを含む。
いくつかの例示的な実施形態において、コンピュータ方法論は、コンピュータ実施モデルをトレーニングするのに用いられるトレーニング・データを、トレーニング・データの前のバージョンに戻すことができるようにコンピュータ実施モデルをトレーニングするのに用いられるトレーニング・データのインスタンスを追跡することを含む。更に他の例示的な実施形態において、コンピュータ方法論は、記録された差および対応するコンピュータ実施モデル結果に対しトレンド分析を実行することを含む。また更なる例示的な実施形態において、コンピュータ実施モデルのトレーニングの複数のインスタンスは、1つまたは複数のロケーションにおける異なるコンピュータ実施モデル開発者によってコンピュータ実施モデルの異なるコピーをトレーニングして、トレーニングされたコンピュータ実施モデルのインスタンスの異なるサブセットを生成することを含み、方法は、異なるコンピュータ実施モデル開発者からのトレーニングされたコンピュータ実施モデルのインスタンスの全てのサブセットにわたって実行される。
このため、例示的な実施形態のメカニズムにより、コンピュータ・モデルのインスタンスのトレーニングの変更を自動的に追跡し、これを、コンピュータ・モデルのインスタンスの性能/正確性の変化と相関付ける自動コンピュータ・ツールが提供される。トレンド・アナリティクスは、コンピュータ・ツールによって追跡情報に対し自動的に実行され、これは、コンピュータ・モデルの単一のインスタンスについて、または異なるトレーニング・プロセスを受ける同じもしくは異なるコンピュータ・モデルの複数のインスタンスにわたって追跡することができる。トレンド・アナリティクスは、コンピュータ・モデル・インスタンスのトレーニングに対し行われた変更のタイプにおけるトレンド、およびコンピュータ・モデル・インスタンスの性能/正確性の対応する変化を特定し、ここでもまた、異なる性能/正確性パラメータに関する性能/正確性の変化のタイプを潜在的に相関付ける。これらのタイプの変更は、例示的な実施形態の自動計算ツールが、コンピュータ・モデルのトレーニングに対する特定のタイプの変更の結果として、ランタイム使用のために展開されているときのコンピュータ・モデルの性能/正確性における特定のタイプの変化が生じる傾向にあると判断することができるように、例えば、トレーニング・データ内に存在するエンティティの特定のタイプの追加/削除/変更、ハイパーパラメータに対する変更のタイプ、例えば、パラメータ値における増減、用いられるトレーニング・ツールに対する変更等とすることができる。
このため、本発明は、好ましい実施形態によれば、論理構造を含み、コンピュータ分野、すなわち、コンピュータ・モデルのトレーニングにおける問題に対処するための特定のコンピュータプロセスを実行するように特に構成された、改善されたコンピュータ・ツールを特に対象とすることを理解することができる。改善されたコンピュータ・ツールは、改善されたコンピュータ・ツールに対しコンピュータ・ツールが以前に有していなかった新たな機能を与えるメカニズムを提供し、ひいては、好ましい実施形態に従って本発明の改善されたコンピュータ・ツールのメカニズムを用いてトレーニングされるコンピュータ・モデルの機能を改善する。すなわち、改善されたコンピュータ・ツールの動作を通じて、コンピュータ・モデルの性能および正確性が改善される。
様々な例示的な実施形態のより詳細な論考を始める前に、まず、本明細書全体を通じて、用語「メカニズム」は、様々な動作、機能等を行う本発明の要素を称するのに用いられることになるのを認識すべきである。本明細書で用いられる用語としての「メカニズム」は、装置、手順、またはコンピュータ・プログラム製品の形態の例示的な実施形態の機能または態様の実装であってもよい。手順の場合、手順は、1つまたは複数のデバイス、装置、コンピュータ、データ処理システム等によって実装される。コンピュータ・プログラム製品の場合、コンピュータ・プログラム製品中または製品上に具現化されたコンピュータ・コードまたは命令によって表されるロジックが、機能を実装するため、または特定の「メカニズム」に関連付けられた動作を実行するために、1つまたは複数のハードウェア・デバイスによって実行される。このため、本明細書に記載のメカニズムは、特化されたハードウェア、汎用ハードウェア上で実行されるソフトウェア、特化されたまたは汎用のハードウェアによって容易に実行可能であるように媒体上に記憶されたソフトウェア命令、機能を実行するための手順もしくは方法、または上記の任意の組合せとして実装することができる。
本明細書および特許請求の範囲は、例示的な実施形態の特定の特徴または構成要素に関し、用語「或る(a)」、「の少なくとも1つ(at least one of)」、「の1つまたは複数(one or more of)」を使用し得る。これらの語および句は、特定の特徴または構成要素の少なくとも1つが特定の例示的な実施形態中に存在するが、1つより多くが存在することもあり得ることを言明することが意図されていることを理解されたい。すなわち、これらの語/句は、明細書または特許請求の範囲を単一の特徴/構成要素の存在に限定する、または複数のかかる特徴/構成要素の存在を必要とすることは意図されていない。逆に、これらの語/句は、複数のかかる特徴/構成要素が本明細書および特許請求の範囲にある可能性と共に、少なくとも単一の特徴/構成要素があることを必要としているだけである。
更に、用語「エンジン」の使用は、本明細書中で本発明の実施形態および特徴の説明に関連して用いられる場合、そのエンジンに起因し得るもしくはそれによって行われるまたはその両方の、アクション、ステップ、プロセス等を達成もしくは実行またはその両方を行うためのいかなる特定の実装にも限定することは意図されていないことを理解されたい。エンジンは、限定ではないが、マシン可読のメモリにロードまたは記憶され、プロセッサによって実行される適切なソフトウェアと組み合わせた、汎用プロセッサもしくは専用プロセッサまたはその両方の任意の使用を含む、限定ではないが、特定の機能を実行するソフトウェア、ハードウェア、および/もしくはファームウェア、またはこれらの任意の組合せであってもよい。更に、或る特定のエンジンに関連付けられた何らかの名称は、別途に指定されている場合を除き、参照の便宜のためのものであり、特定の実装に限定することを意図されてはいない。加えて、或るエンジンに帰属する任意の機能は、複数のエンジンによっても同様に行うことができ、同じ型または異なる型の別のエンジンの機能に組み込むもしくはこれと組み合わせるまたはその両方ができ、あるいは、様々な構成の1つまたは複数のエンジンにわたって分散させることができる。
更に、以下の説明では、例示的な実施形態の例示の実装を更に説明し、例示的な実施形態のメカニズムの理解を助けるために、例示的な実施形態の様々な構成要素の複数の様々な例が用いられることを理解されたい。これらの例は、非限定であることが意図され、例示的な実施形態のメカニズムの実施の様々な可能性を包括するものではない。当業者には、本明細書を考慮して、本発明の思想および範囲から逸脱することなく、本明細書に提供された諸例に加えてまたは置き換えて使用可能な、これら様々な構成要素に対する多くの他の代替的実施態様があることが明らかであろう。
本発明は、システム、方法、もしくはコンピュータ・プログラム製品またはこれらの組合せとすることができる。このコンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を有するコンピュータ可読記憶媒体(または媒体群)を含むことが可能である。
コンピュータ可読記憶媒体は、命令実行デバイスによって使用されるように命令を保持および記憶することができる有形のデバイスとすることができる。コンピュータ可読記憶媒体は、例えば、限定ではないが、電子ストレージ・デバイス、磁気ストレージ・デバイス、光ストレージ・デバイス、電磁ストレージ・デバイス、半導体ストレージ・デバイス、または上記の任意の適切な組合せとすることができる。コンピュータ可読記憶媒体のより具体的な例の網羅的でないリストは、以下、すなわち、ポータブル・コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ(RAM)、リード・オンリー・メモリ(ROM)、消去可能なプログラマブル・リード・オンリー・メモリ(EPROMもしくはフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM)、ポータブル・コンパクト・ディスク・リード・オンリー・メモリ(CD-ROM)、デジタル・バーサタイル・ディスク(DVD)、メモリ・スティック、フロッピー(R)・ディスク、パンチカード、もしくは命令が記録されている溝の中の隆起構造等の機械的に符号化されたデバイス、および以上の任意の適切な組合せを含む。本明細書において使用されるコンピュータ可読記憶媒体は、電波もしくは他の自由に伝播する電磁波、導波路もしくは他の伝送媒体を伝播する電磁波(例えば、光ファイバ・ケーブルを通過する光パルス)、または配線を通して伝送される電気信号等の、一過性の信号自体であると解釈されるべきではない。
本明細書において説明されるコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング/処理デバイスにダウンロードされること、またはネットワーク、例えば、インターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、または無線ネットワーク、あるいはその組合せを介して外部コンピュータもしくは外部ストレージ・デバイスにダウンロードされることが可能である。ネットワークは、銅伝送ケーブル、伝送光ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組合せを含み得る。各コンピューティング/処理デバイスにおけるネットワーク・アダプタ・カードまたはネットワーク・インタフェースが、ネットワークからコンピュータ可読プログラム命令を受信し、そのコンピュータ可読プログラム命令を、それぞれのコンピューティング/処理デバイス内のコンピュータ可読記憶媒体に記憶するために転送する。
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはJava(商標)、Smalltalk(R)、C++等のオブジェクト指向プログラミング言語、および「C」プログラミング言語もしくは類似したプログラミング言語等の従来の手続き型プログラミング言語を含む、1つまたは複数のプログラミング言語の任意の組合せで書かれたソース・コードもしくはオブジェクト・コードとすることができる。コンピュータ可読プログラム命令は、完全にユーザのコンピュータ上で、部分的にユーザのコンピュータ上で、スタンドアロンのソフトウェア・パッケージとして、部分的にユーザのコンピュータ上で、かつ部分的に遠隔コンピュータ上で、または完全に遠隔コンピュータもしくは遠隔サーバの上で実行することができる。完全に遠隔コンピュータもしくは遠隔サーバの上で実行されるシナリオにおいて、遠隔コンピュータは、ローカル・エリア・ネットワーク(LAN)もしくはワイド・エリア・ネットワーク(WAN)を含む、任意のタイプのネットワークを通じてユーザのコンピュータに接続されてもよく、または接続は、外部コンピュータに対して(例えば、インターネット・サービス・プロバイダを用いてインターネットを通じて)行われてもよい。いくつかの実施形態において、例えば、プログラマブル論理回路、フィールド・プログラマブル・ゲート・アレイ(FPGA)、またはプログラマブル・ロジック・アレイ(PLA)を含む電子回路が、本発明の態様を実行するためにその電子回路を個人設定すべく、コンピュータ可読プログラム命令の状態情報を利用することによってコンピュータ可読プログラム命令を実行してもよい。Java(R)および全てのJava(R)ベースの商標およびロゴは、Oracle社もしくはその関係会社またはその両方の商標または登録商標である。
本発明の態様は、本発明の実施形態による方法、装置(システム)、およびコンピュータ・プログラム製品のフローチャートまたはブロック図、あるいはその両方を参照して本明細書において説明される。フローチャートまたはブロック図、あるいはその両方の各ブロック、ならびにフローチャートまたはブロック図、あるいはその両方におけるブロックの組合せは、コンピュータ可読プログラム命令によって実装されることが可能であることが理解されよう。
これらのコンピュータ可読プログラム命令は、コンピュータまたは他のプログラマブル・データ処理装置のプロセッサを介して実行される命令が、フローチャートまたはブロック図、あるいはその両方の1つまたは複数のブロックにおいて指定される機能/動作を実施するための手段を作り出すように、汎用コンピュータ、専用コンピュータ、または他のプログラマブル・データ処理装置のプロセッサに提供されてマシンを作り出すものであってもよい。また、これらのコンピュータ可読プログラム命令は、命令が記憶されたコンピュータ可読記憶媒体が、フローチャートまたはブロック図、あるいはその両方の1つまたは複数のブロックにおいて指定される機能/動作の態様を実施する命令を含む製品を備えるように、コンピュータ可読記憶媒体に記憶されて、コンピュータ、プログラマブル・データ処理装置、または他のデバイス、あるいはその組合せに特定の方式で機能するように指示することができるものであってもよい。
また、コンピュータ可読プログラム命令は、コンピュータ、他のプログラマブル装置、または他のデバイス上で実行される命令が、フローチャートまたはブロック図、あるいはその両方の1つまたは複数のブロックにおいて指定される機能/動作を実施するように、コンピュータによって実施されるプロセスを生成するために、コンピュータ、他のプログラマブル・データ処理装置、または他のデバイスにロードされて、コンピュータ、他のプログラマブル装置、または他のデバイスの上で一連の動作ステップを実行させてもよい。
図におけるフローチャートおよびブロック図は、本発明の様々な実施形態によるシステム、方法、およびコンピュータ・プログラム製品の可能な実施態様のアーキテクチャ、機能、および動作を示す。これに関して、フローチャートまたはブロック図における各ブロックは、指定された論理機能を実施するための1つまたは複数の実行可能命令を備える、命令のモジュール、セグメント、または一部分を表すことが可能である。いくつかの代替的な実装形態において、ブロックに記載される機能は、図に記載される順序を外れて生じてもよい。例えば、連続して示される2つのブロックが、実際には、実質的に同時に実行されてもよく、またはそれらのブロックが、関与する機能に依存して、場合によっては逆の順序で実行されてもよい。また、ブロック図またはフローチャート、あるいはその両方の各ブロック、ならびにブロック図またはフローチャート、あるいはその両方におけるブロックの組合せは、指定された機能もしくは動作を実行する、または専用ハードウェア命令とコンピュータ命令の組合せを実行する専用ハードウェア・ベースのシステムによって実施され得ることにも留意されたい。
上述したように、本発明は、好ましい実施形態によれば、コンピュータ・モデルのトレーニングに対し行われた変更を複数のトレーニング・インスタンスにわたって追跡し、これらの変更を、コンピュータ・モデルの性能/正確性の変化と相関付けることによってコンピュータ・モデルのトレーニングを改善するための、改善したコンピュータ・ツールを提供する。コンピュータ・モデルのトレーニングにおけるトレンドを特定するための追跡情報、例えば、1つまたは複数のトレーニング特性、例えば、トレーニング・データにおけるエンティティのタイプまたはトレーニング・データ自体の他の特性における特定の変更、1つまたは複数のハイパーパラメータの変更、用いられる特定のトレーニング・アルゴリズムまたはトレーニング・ツールの変更等、性能/正確性の差における結果、例えば、コンピュータ・モデルのトレーニングの収束速度、トレーニングされたコンピュータ・モデルにおける誤差/損失量、または他の性能/正確性メトリックの差に対し、アナリティクスが実行される。
トレーニング特性に対する変更と、性能/正確性の変化との相関付けにより、コンピュータ・モデルをトレーニングするためのトレーニング推薦を生成するのに用いられるトレンド情報、または1つもしくは複数のロケーションにおける複数の開発者にわたるコンピュータ・モデルのコピーが生成される。ここで、コンピュータ・モデルのコピーは、特定の使用、例えば、ヘルスケア治療推薦モデル等の同じコンピュータ・モデルについてトレーニングされており、異なる開発者によって異なる目的で、例えば、異なる開発者によって膀胱がん患者のための治療推薦を提供するようにコンピュータ・モデルの別のコピーがトレーニングされるのに対し、或る開発者による、前立腺がん患者のための治療推薦を提供するためのコンピュータ・モデルのトレーニングの目的で、開発することができる。しかしながら、類似のトレーニング推薦を用いて、トレーニング特性における特定されたトレンドおよびコンピュータ・モデルの性能/正確性の改善における対応するトレンドに基づいて、異なる開発者がコンピュータ・モデルの個々のコピーをトレーニングすることを支援することができる。
例示的な実施形態の改善されたコンピュータ・ツールは、多くの異なるタイプのデータ処理環境において利用することができる。例示的な実施形態の特定の要素および機能の記述のためのコンテキストを提供するために、図1~図2は、以後、例示的な実施形態を実施することができる例示的な環境として提供される。図1~図2は単なる例であり、本発明の実施形態を実施することができる環境に関していかなる限定も主張または暗示することを意図したものでないことを理解されたい。示された環境に対する多くの変更は、本発明の思想および範囲から逸脱することなく行うことができる。
図1は、要求処理パイプライン108を実施するデータ処理システム100の1つの例示的な実施形態の概略図を示す。データ処理システム100は、いくつかの場合、コンピュータ・ネットワーク102においてQAパイプライン108を用いる質問応答(QA)コンピューティング・システム等のコグニティブ・コンピューティング・システムとすることができる。データ処理システム100の一部として利用することができるコグニティブ・コンピューティング・システムの例は、ニューヨーク州アーモンク所在のインターナショナル・ビジネス・マシーンズ(IBM)コーポレーションから入手可能なIBMワトソン(商標)コグニティブ・コンピューティング・システムである。そのようなコグニティブ・コンピューティング・システムにおいて実施されるコンピュータ・モデル自体は、多くの異なる形態をとることができ、例えば、ニューラル・ネットワーク、回帰モデル、時系列分析モデル、トレンド分析モデル、挙動モデル、シミュレーション・モデル、もしくは任意の他のタイプのコンピュータ・モデル挙動アルゴリズム、またはトレーニング特性の調節を通じてコンピュータ・モデルを反復的にトレーニングし、トレーニングされたコンピュータ・モデルまたはシミュレーションの性能/正確性の変化を判断することによる教師ありもしくは教師なし機械学習プロセスを通じてトレーニングされるコンピュータ・シミュレーションを含むことができる。IBMおよびワトソンは、米国または他の国あるいはその両方におけるインターナショナル・ビジネス・マシーンズ・コーポレーションの商標である。
コグニティブ・コンピューティング・システムは、自身のコグニティブ・コンピュータ動作を実行するためにコンピュータ・モデルを利用するため、図1に示すコグニティブ・コンピューティング・システム実施態様は例にすぎないことを理解されたい。しかしながら、本発明は、好ましくは、コンピュータ・モデル、シミュレーションまたは挙動アルゴリズムがトレーニングおよび利用される任意の実施態様に適用可能であり、これには、コグニティブ・コンピューティング・システムまたは対応するパイプライン108を必要としない実施態様が含まれる。
本説明の目的で、データ処理システム100は、要求処理パイプライン108が、入力質問の形態で構造化された、または構造化されていない、あるいはその両方の要求に対し動作するQAパイプラインとして実装されるQAシステムとして実装されたコグニティブ・コンピューティング・システムであると仮定される。そのような構造化された、または構造化されていない、あるいはその両方の要求に対し動作する際、QAシステム100の特定の実施およびその意図される目的、例えば、前立腺がん患者のための治療推薦の生成、医療画像診断の実行、患者電子医療記録の評価、車両ナビゲーションまたは衝突回避の実行、金融商品/サービス推薦の提供等に固有とすることができる1つまたは複数のトレーニングされたコンピュータ・モデルが利用される。これらのコンピュータ・モデルは、トレーニング・コンピュータ・システムおよび1つまたは複数のトレーニング・データ・セットを用いてトレーニングすることができる。本明細書に記載の原理と併せて用いることができる質問処理動作の1つの例は、参照によりその全体が本明細書に援用される、米国特許出願公開第2011/0125734号に記載されている。
図1に示すように、データ処理システム100、例えば、コグニティブ・システム100は、コンピュータ・ネットワーク102に接続された1つまたは複数のコンピューティング・デバイス104A~D(1つまたは複数のプロセッサおよび1つまたは複数のメモリ、ならびに潜在的に、バス、ストレージ・デバイス、通信インタフェース等を含む当該技術分野において一般的に既知の任意の他のコンピューティング・デバイス要素を含む)において実施される。説明の目的のみで、図1は、コンピューティング・デバイス104Aのみで実施されるコグニティブ・システム100を示すが、上述したように、コグニティブ・システム100は、複数のコンピューティング・デバイス104A~D等の複数のコンピューティング・デバイスにわたって分散されてもよい。ネットワーク102は、サーバ・コンピューティング・デバイスとして動作することができる複数のコンピューティング・デバイス104A~D、および1つまたは複数の有線または無線あるいはその両方のデータ通信リンクを介して互いにおよび他のデバイスまたは構成要素と通信するクライアント・コンピューティング・デバイスとして動作することができる複数のコンピューティング・デバイス110~112を含み、ここで、各通信リンクは、配線、ルータ、スイッチ、送信機、受信機等のうちの1つまたは複数を含む。いくつかの例示的な実施形態において、コグニティブ・システム100およびネットワーク102は、それぞれのコンピューティング・デバイス110~112を介した1つまたは複数のコグニティブ・システム・ユーザのための質問処理および回答生成(QA)機能を可能にする。他の実施形態において、コグニティブ・システム100およびネットワーク102は、限定ではないが、所望の実施態様に応じて多くの異なる形態をとることができる要求処理およびコグニティブ応答生成、例えばコグニティブ情報索出、ユーザのトレーニング/命令、データのコグニティブ評価等を含む他のタイプのコグニティブ動作を提供することができる。コグニティブ・システム100の他の実施形態を、本明細書に示したもの以外の構成要素、システム、サブシステムまたはデバイス、あるいはその組合せと共に用いることができる。
コグニティブ・システム100は、様々なソースから入力を受信する要求処理パイプライン108を実施するように構成される。要求は、自然言語質問、情報の自然言語要求、コグニティブ動作の実行の自然言語要求等の形態で課すことができる。例えば、コグニティブ・システム100は、ネットワーク102、電子文書の1つまたは複数のコーパス106、コグニティブ・システム・ユーザ、または他のデータおよび他の可能な入力源、あるいはその組合せから入力を受信する。1つの実施形態において、コグニティブ・システム100への入力のうちのいくつかまたは全ては、ネットワーク102を通じてルーティングされる。ネットワーク102における様々なコンピューティング・デバイス104A~Dは、コンテンツ作成者およびコグニティブ・システム・ユーザのためのアクセス・ポイントを含む。コンピューティング・デバイス104A~Dのうちのいくつかは、(単に例示の目的で図1において別個のエンティティとして示される)データの1つまたは複数のコーパス106を記憶するデータベースのためのデバイスを含む。データの1つまたは複数のコーパス106の部分は、1つまたは複数の他のネットワークにアタッチされたストレージ・デバイス、1つまたは複数のデータベース、または図1に明示的に示されない他のコンピューティング・デバイスにも提供することができる。コグニティブ・システム100が、ローカルおよびグローバルを含む任意のサイズの環境、例えばインターネットにおいて動作することができるように、ネットワーク102は、様々な実施形態において、ローカル・ネットワーク接続およびリモート接続を含む。
1つの実施形態において、コンテンツ作成者は、コグニティブ・システム100によりデータのコーパスの一部として用いるためのデータの1つまたは複数のコーパス106の文書内のコンテンツを作成する。文書は、コグニティブ・システム100において用いるための任意のファイル、テキスト、アーティクル、またはデータソースを含む。コグニティブ・システム・ユーザは、ネットワーク102へのネットワーク接続またはインターネット接続を介してコグニティブ・システム100にアクセスし、コグニティブ・システム100への質問/要求を入力し、これらは、データの1つまたは複数のコーパス106におけるコンテンツに基づいて回答/処理される。1つの実施形態において、質問/要求は自然言語を用いて形成される。コグニティブ・システム100は、パイプライン108を介して質問/要求をパースおよび解釈し、課された質問に対する1つまたは複数の回答、要求に対する応答、要求の処理結果等を含む応答をコグニティブ・システム・ユーザ、例えば、コグニティブ・システム・ユーザ110に提供する。いくつかの実施形態では、コグニティブ・システム100は、候補回答/応答のランク付けされたリストにおいてユーザに応答を提供するのに対し、他の例示的な実施形態において、コグニティブ・システム100は、単一の最終回答/応答、または最終的な回答/応答と他の候補回答/応答のランク付けされたリストとの組合せを提供する。
コグニティブ・システム100は、データの1つまたは複数のコーパス106から得られた情報に基づいて入力質問/要求を処理するための複数の段階を含むパイプライン108を実施する。ここで、これらの段階のうちの1つまたは複数は、1つまたは複数のコンピュータ・モデルを実施して、データの1つまたは複数のコーパス106から得られた入力質問/要求またはデータあるいはその組合せの対応する処理の実行を支援することができる。パイプライン108は、入力質問/要求およびデータの1つまたは複数のコーパス106の処理に基づいて入力質問または要求のための回答/応答を生成する。
上述したように、いくつかの例示的な実施形態において、コグニティブ・システム100は、ニューヨーク州アーモンク所在のインターナショナル・ビジネス・マシーンズ・コーポレーションから入手可能なIBMワトソン(商標)コグニティブ・システムとすることができる。そのような例示的な実施形態において、IBMワトソン(商標)コグニティブ・システム、例えばコグニティブ・システム100のパイプライン、例えばパイプライン108は、入力質問または要求を受信し、次にこれをパースして、質問/要求の主要な特徴を抽出し、そして次にこれを用いて、データの1つまたは複数のコーパス106に適用されるクエリを定式化する。データの1つまたは複数のコーパス106へのクエリの適用に基づいて、データの1つまたは複数のコーパス106にわたって、入力質問/応答(以後、入力質問であると仮定される)に対する価値のある応答を含む可能性がいくらかあるデータの1つまたは複数のコーパス106(以後、単にコーパス106と呼ぶ)の部分を探すことによって、仮説のセット、または入力質問/要求に対する候補回答/応答が生成される。次に、IBMワトソン(商標)コグニティブ・システムのパイプライン108は、入力質問の言語、および多岐にわたる推論アルゴリズムを用いてクエリの適用中に得られたコーパス106の部分の各々において用いられる言語に対し綿密な分析を行う。
次に、様々な推論アルゴリズムから得られるスコアは、潜在的な候補回答が質問によって推測される根拠に関して、この例では、IBMワトソン(商標)コグニティブ・システム100のパイプライン108が有する確信度を要約する統計モデルに対し重み付けされる。このプロセスは、候補回答のランク付けされたリストを生成するために候補回答の各々について繰り返され、これは次に、入力質問を提出したユーザ、例えばクライアント・コンピューティング・デバイス110のユーザに提示することができるか、またはここから最終的な回答が選択され、ユーザに提示される。IBMワトソン(商標)コグニティブ・システム100のパイプライン108に関する更なる情報は、例えば、IBMコーポレーションのウェブサイト、IBMレッドブック等から得ることができる。例えば、IBMワトソン(商標)コグニティブ・システムのパイプラインに関する情報は、Yuan他「Watson and Healthcare」IBM developerWorks, 2011、およびRob Highによる「The Era of Cognitive Systems: An Inside Look at IBM Watson and How it Works」IBM Redbooks, 2012に見ることができる。
上述したように、クライアント・デバイスからコグニティブ・システム100への入力は、自然言語質問の形態で課すことができるが、例示的な実施形態はそのように限定されない。むしろ、入力質問は、実際には、コグニティブ分析を行い、コグニティブ分析の結果を提供する際の基礎を決定するために、限定ではないが、IBMワトソン(商標)等のコグニティブ・システムの自然言語パースおよび分析メカニズムを含む構造化された、または構造化されていない、あるいはその両方の入力分析を用いてパースおよび分析することができる任意の適切なタイプの要求として定式化または構造化することができる。ヘルスケア・ベースのコグニティブ・システムの場合、例えば、この分析は、ヘルスケアを重視したコグニティブ・システム結果、例えば、患者の医学的状態の診断、患者のための治療推薦、医療撮像における異常の強調等を提供するために、患者の医療記録、1つまたは複数のコーパスからの医療指導文書等を処理することを伴うことができる。車両ナビゲーションまたは衝突回避システムあるいはその両方等の他の状況において、カメラから捕捉された画像等を分析して、オブジェクトを分類し、適切な警告、是正措置、例えば制動/操縦制御等を決定することができる。財務評価の状況では、リスク決定を行うことができ、金融商品/サービスのための推薦を生成することができる等である。行うことができる可能なコグニティブ動作は、多数であり、本明細書に全ての可能性を記すことは実現可能でない。コンピュータ実施コグニティブ・コンピューティング・システムによって実行することができる任意のコグニティブ動作は、本発明の例示的な実施形態の思想および範囲内にあることが意図される。
図1に示すように、本発明の例示的な実施形態は、図1のコグニティブ・システム100等のデータ処理システムにおける実行を通じたランタイム使用のために開発することができるコンピュータ・モデルのトレーニングを改善することを特に対象とした改善されたコンピュータ・ツール150を提供する。ここでもまた、これは例にすぎず、トレーニングされ、そのトレーニングが例示的な実施形態のうちの1つまたは複数の動作を通じて改善されるコンピュータ・モデル、シミュレーション、アルゴリズム等は、コグニティブ・コンピューティング・システムとの使用に限定されず、コンピュータ・モデル、シミュレーション、アルゴリズムが利用される任意のコンピューティング・システム構成において実施することができる。更に、例示的な実施形態は、そのようなコンピュータ・モデル、シミュレーション、アルゴリズム等のトレーニングを改善するための、改善されたコンピュータ・ツールを特に対象とし、このため、これらのコンピュータ・モデル、シミュレーション、アルゴリズム等は、1つまたは複数のトレーニング・データ・セット、ハイパーパラメータ、トレーニング・ツール等を用いて、多くの場合反復的方式でトレーニングされる性質を有する。例示的な実施形態の改善されたコンピュータ・ツールは、コンピュータ・モデル・トレーニング・コンピューティング・システム150を実施するために、例示的な実施形態のメカニズムに従って、専用ハードウェア、ハードウェア上で実行されるソフトウェア、または専用ハードウェアとハードウェア上で実行されるソフトウェアとの任意の組合せにおいて実施される論理構造およびプロセスを含むように更に拡張される1つまたは複数のコンピューティング・デバイス、ストレージ・デバイス、メモリ、通信インタフェース等を含むことができることを理解されたい。
図1に示すように、コンピュータ・モデル・トレーニング・コンピューティング・システム150は、トレーニング・データ・セット・トレンド分析エンジン152と、トレーニング・ツール・トレンド分析エンジン154と、コンピュータ・モデル(または単に「モデル」)ハイパーパラメータ・トレンド分析エンジン156と、モデル結果相関付けエンジン158と、モデル・インスタンス追跡インタフェース・エンジン160と、コンピュータ・モデル・トレーニング・インスタンス追跡データベース162と、開発者間トレンド・アナリティクス・エンジン164と、トレーニング推薦エンジン166と、自動推薦実施エンジン168と、トレーニング・データ・セット・ソース特性追跡エンジン170とを備える。コンピュータ・モデル・トレーニング・コンピューティング・システム150のこれらの要素の各々は、ハードウェア、ハードウェア上で実行されるソフトウェア、またはハードウェア/ソフトウェア実施の組合せとして実施することができる。要素152~170は、コンピュータ・モデルのトレーニングにおけるトレンドの特定、コンピュータ・モデルのトレーニングを改善するための推薦の生成、およびいくつかの例示的な実施形態では、コンピュータ・モデルのトレーニングを改善するための推薦された動作の実際の自動実行を通じて、コンピュータ・モデルのトレーニングを改善する目的を達成するために、互いと併せて動作する。
モデル・インスタンス追跡インタフェース・エンジン160は、反復的トレーニング・プロセスを通じてコンピュータ・モデルの実施および開発に関与する開発者ワークステーション、他のサーバ・コンピューティング・デバイス等からの情報を得るのに必要なコンピュータ・ロジックおよびコンピュータ論理構造を提供する。例えば、1つまたは複数のクライアント・コンピューティング・デバイス110、112は、1つまたは複数のサーバ104C、104Dにおいて実行されるコンピュータ・モデルのコピーに対し動作することができる。クライアント・コンピューティング・デバイス110、112またはサーバ104C、104Dあるいはその両方は、コンピュータ・インタフェース、トレーニング・ツール等を提供することができ、これを通じて、ユーザ、例えばコンピュータ・モデル開発者は、コンピュータ・モデルのコピーのトレーニングの反復を実行するときに用いるためのトレーニング特性、例えば、何のトレーニング・データ・セットを利用するか、ハイパーパラメータの設定等を指定することができる。1つまたは複数のサーバ104C、104Dにおいて実行されるコンピュータ・モデルのコピーを開発する際、開発者は、例えば、変更がコンピュータ・モデルの性能および正確性に影響を及ぼすようにコンピュータ・モデルの対応するコピーをトレーニングするのに利用されるトレーニング・データ・セットに追加/削除/変更を行うことによって、利用されるトレーニング・ツールまたはアルゴリズムに変更を行うことによって、トレーニング中のコンピュータ・モデルのコピーを構成するのに用いられるハイパーパラメータの設定を変更することによって等によりコンピュータ・モデルのコピーのトレーニング特性を変更および更新することができる。
モデル・インスタンス追跡インタフェース・エンジン160は、コンピュータ・モデルのコピーを実行するクライアント・コンピューティング・デバイス110、112またはサーバ・コンピューティング・デバイス104C、104Dあるいはその両方に存在しそこで実行するエージェント172、174と併せて動作することができ、ここで、これらのエージェント172、174は、開発者または開発者環境あるいはその両方によって用いられる特定のインタフェース、トレーニング・ツール、トレーニング・パイプライン等を監視して、トレーニング特性および結果として生成される対応するコンピュータ・モデル結果における変化を特定することができる。これは、コンピュータ・モデルのコピーをトレーニングするためのトレーニング特性の変更に関する情報、およびトレーニング特性の変更の結果として生成される対応するトレーニング結果を収集したものである。エージェント172、174は、収集されたトレーニング情報、例えばトレーニング特性の変更および対応するコンピュータ・モデル結果を、モデル・インスタンス追跡インタフェース・エンジン160を介してコンピュータ・モデル・トレーニング・コンピューティング・システム150に報告することができる。
エージェント・ベースの実施形態は、1つの可能な実施形態にすぎず、例示的な実施形態のメカニズムは、エージェントがクライアント・コンピューティング・デバイス110、112またはサーバ・コンピューティング・デバイス104C、104D、あるいはその両方において展開されるものにのみ限定されるわけではないことを理解されたい。いくつかの例示的な実施形態において、コンピュータ・モデルのコピーは、コグニティブ・コンピューティング・システム100またはコンピュータ・モデル・トレーニング・コンピューティング・システム150、あるいはその両方が実施されるサーバ104A~104Dにおいて実施することができる。例えば、いくつかの実施形態では、コンピュータ・モデルのコピーを実行し、これらの様々な開発者環境においてトレーニングすることができる複数の開発者環境を、例えば仮想マシンを介して仮想的に等により提供することができる。そのような実施形態において、エージェントは必要とされず、開発者環境の直接監視が可能である。本発明の思想および範囲から逸脱することなく、開発者環境からコンピュータ・モデル・トレーニング・コンピューティング・システム150にトレーニング情報を通信するための任意の適切なメカニズムを含むことができる他の実施態様も利用することができる。
トレーニング情報を、開発者環境から直接、展開されたエージェント172、174から、または特定の実施に固有の他の通信メカニズムを通じて受信する際、トレーニング情報は、タグ付けされるか、または他の形でコンピュータ・モデルの特定のコピー、開発者等と関連付けられる。加えて、トレーニング情報は、バージョン情報、またはコンピュータ・モデルのコピーをトレーニングするインスタンスを識別する他のインジケータを含むことができる。すなわち、例えば、開発者がトレーニングの新たなインスタンスを始動する度に、コンピュータ・モデルのコピー、新たなインスタンス識別子、またはバージョン識別子が生成され、トレーニング・インスタンスと関連付けられる。このため、トレーニング情報は、コンピュータ・モデルのコピー、およびコンピュータ・モデルのコピーをトレーニングするのに用いられるトレーニング・インスタンスと関連付けることができる。
トレーニング情報は、トレーニング・インスタンス中に用いられるトレーニング特性および生成されるコンピュータ・モデル結果を追跡する。いくつかの例示的な実施形態において、これらのトレーニング特性は、トレーニング・インスタンス中に用いられる特定のトレーニング特性、例えば利用されるトレーニング・データ・セット、利用されるトレーニング・ツール、ハイパーパラメータ設定等、およびコンピュータ・モデルによって出力されるコンピュータ・モデル結果として報告することができる。以下で論考するように、これらの例示的な実施形態において、全ての関連するトレーニング特性が報告され、他のトレーニング・インスタンスからのこれらのトレーニング特性の変更が下流のアナリティクスにおいて判断される。他の例示的な実施形態において、トレーニング特性の変更のみが報告され、これらの変化は、トレーニング・インスタンス・インジケータまたはバージョン・インジケータの比較から判断することができるように、以前のトレーニング・インスタンスからの変化とみなされる。
モデル・インスタンス追跡エンジン160を介して受信された、報告されたトレーニング情報を用いて、コンピュータ・モデル・トレーニング・インスタンス追跡データベース162に対応するエントリが生成される。コンピュータ・モデル・トレーニング・インスタンス追跡データベース162におけるエントリは、コンピュータ・モデルのコピーの識別子、トレーニング・インスタンス・インジケータ、トレーニング特性等によって任意の適切な方式でインデックス付けすることができる。このようにして、トレーニング特性に対する変更は、コンピュータ・モデルのコピーごとに新たなエントリとして経時的にコンピュータ・モデル・トレーニング・インスタンス追跡データベース162において追跡することができ、トレーニング・インスタンスごとに生成され、この追跡情報におけるトレンドを特定するための様々なトレンド・アナリティクスの適用のために記憶される。例えば、1つのトレーニング・インスタンスと、別のトレーニング・インスタンスとで、異なるトレーニング・データ・セットが特定される場合がある。異なるトレーニング・データ・セットは、トレーニング・データ・セットにおいて、前のトレーニング・データ・セットから、何のエンティティが追加、削除または変更されたかの指定、利用されている完全に新しいトレーニング・データ・セットの識別子を含むことができ、これには、トレーニング・データ・セットのソース、新たなトレーニング・データ・セット内に存在するエンティティのタイプ等の、新たなトレーニング・データ・セットに関する任意の追加情報が含まれる。いくつかの場合、コンピュータ・モデル・トレーニング・インスタンス追跡データベース162のエントリにおけるトレーニング特性情報は、トレーニング・データ・セットに対するポインタ、またはトレーニング・データ・セットの特性を指定するそのメタデータ、あるいはその両方を含むことができ、メタデータは、トレーニング・データ・セットに含まれるエンティティのタイプ、およびトレーニング・データ・セット間の差を決定するために他のトレーニング・データ・セットと比較することができる他の特性等である。
同様に、利用される特定のトレーニング・ツールまたはハイパーパラメータ設定あるいはその両方に関するトレーニング特性の変更は、コンピュータ・モデル・トレーニング・インスタンス追跡データベース162のエントリにおけるこれらのトレーニング特性の記憶を通じて追跡される。例えば、特定のトレーニング・ツール、例えば、コンピュータ・モデル等のトレーニング・パラメータを変更するのに用いられるアルゴリズムの識別情報を、トレーニング・インスタンス・インジケータと関連付けて記憶することができる。別の例として、ハイパーパラメータの特定の設定を、コンピュータ・モデル・トレーニング・インスタンス追跡データベース162における特定のトレーニング・インスタンスに対応するエントリに記憶することができる。代替的に、上述したように、コンピュータ・モデル・トレーニング・インスタンス追跡データベース162におけるエンティティは、代わりに、必ずしも用いられる特定の値ではなく、行われた実際の変更を記憶することができ、例えば、ハイパーパラメータXが3に等しいことを記憶するのではなく、代わりに、エントリは、ハイパーパラメータXが1増大したことを指定することができ、または別の例では、追加、削除、変更されたトレーニング・データ・セット内のエンティティの特定のタイプのアイデンティティを記憶するのではなく、データベース162におけるエンティティは、タイプAのエンティティが300増大したこと、タイプBのエンティティが50減少したこと等を指定することができる。
コンピュータ・モデルのコピーのトレーニングの複数のインスタンスを経時的に追跡することができ、コンピュータ実施モデルのトレーニングの各インスタンスは、異なるトレーニング・データ・セット、異なるトレーニング・ツール、または異なるハイパーパラメータ設定、あるいはその組合せを用いてコンピュータ実施モデルをトレーニングし、コンピュータ実施モデルのトレーニングの他のインスタンスと異なるトレーニングされたコンピュータ実施モデルのインスタンスを生成することを伴うことを理解することができる。コンピュータ方法は、トレーニングの各インスタンス後に、トレーニング・データ・セットのトレーニング・データに対し、トレーニングされたコンピュータ実施モデルの対応するインスタンスを実行することによって、コンピュータ実施モデル結果を生成することを更に含む。生成されたコンピュータ実施モデル結果、または前のトレーニング・インスタンスからの生成されたコンピュータ実施モデル結果の差、あるいはその両方は、コンピュータ・モデル・トレーニング・インスタンス追跡データベース162内のエントリと関連付けて記憶することもできる。
このコンピュータ実施モデル結果情報は、受信した他のトレーニング・インスタンス情報と共にモデル・インスタンス追跡インタフェース・エンジン160を介して受信される。コンピュータ実施モデル結果情報および他のトレーニング特性情報、またはいくつかの実施形態では、以前のトレーニング・インスタンスに対するこれらのタイプの情報の差は、トレーニングされたコンピュータ実施モデルのインスタンスの対応する識別子と関連付けて記録される。
トレーニング特性情報および結果情報を、モデル・インスタンス追跡インタフェース・エンジン160を通じて得て、コンピュータ・モデル・トレーニング・インスタンス追跡データベース162に対応するエントリを記憶すると、記録された差および対応するコンピュータ実施モデル結果を分析するために、コンピュータ・モデル・トレーニング・インスタンス追跡データベース162に記録されたエントリに対し様々なアナリティクスが適用される。これらのアナリティクスに基づいて、トレーニング特性の変更、およびコンピュータ・モデル結果におけるそれらの対応する変化のトレンドが特定され、記録された差と対応するコンピュータ実施モデル結果との間の相関を示す対応する出力が生成される。
トレーニング・データ・セット・トレンド分析エンジン152は、トレーニング・データ・セットの変更におけるトレンドを識別し、これらを、コンピュータ実施モデル結果に対する変化、例えば、性能または正確性メトリックあるいはその両方の変化におけるトレンドと相関付けるように特に構成され、これを対象とするアナリティクスを適用する。このため、例えば、トレーニング・データ・セット・トレンド分析エンジン152は、トレーニング・データ・セット特性に関するトレーニング・インスタンス間の変更のパターン、例えば、何のタイプのエンティティが追加、削除または変更されたか、トレーニング・データ・セットの何のソースが利用されるか等を特定して、経時的に、コンピュータ・モデル性能または正確性メトリック、あるいはその両方の改善/低下を結果的にもたらす変更を特定する。例えば、トレーニング・データ・セット・トレンド分析アナリティクスを通じて、エンジン152は、コンピュータ実施モデルの特定のコピーについてトレーニング・データ・セット内に存在するタイプAの医用画像数を増大させることにより、患者医用撮像データにおける特定の異常の存在を予測することに関してコンピュータ・モデルの正確性のX量の改善を結果としてもたらすと判断することができる。
同様に、トレーニング・ツール・トレンド分析エンジン154は、トレーニング・ツールの変更のトレンドを識別し、これらをコンピュータ実施モデル結果に対する変化のトレンドと相関付けるように特に構成され、これを対象とするアナリティクスを適用する。このため、例えば、トレーニング・ツール・トレンド分析エンジン154は、コンピュータ・モデルのトレーニングを実行するのに利用される特定のトレーニング・ツールに関してトレーニング・インスタンス間の変更パターン、すなわち、トレーニングを実行するのに利用されるコンピュータ・ツールまたはアルゴリズムのどの変更、例えばツールAからツールBへの変更が、コンピュータ・モデル性能または正確性メトリックあるいはその両方の改善/低下を結果としてもたらすかを特定する。例えば、トレーニング・ツール・トレンド分析アナリティクスを通じて、エンジン154は、コンピュータ実施モデルの特定のコピーについて、トレーニング・ツールまたはアルゴリズムBと対照的に、トレーニング・ツールまたはアルゴリズムAを用いると、コンピュータ・モデルの性能/正確性のX量の改善が結果としてもたらされると判断することができる。
モデル・ハイパーパラメータ・トレンド分析エンジン156は、コンピュータ実施モデルのコピーをトレーニングするために用いられるモデル・ハイパーパラメータ設定の変更のトレンドを特定し、これらを、コンピュータ実施モデル結果に対するトレンドと相関付けるように特に構成され、これを対象とするアナリティクスを適用する。このため、例えば、モデル・ハイパーパラメータ・トレンド分析エンジン156は、ハイパーパラメータ設定に関するトレーニング・インスタンス間の変更パターンを特定して、コンピュータ・モデル性能または正確性メトリック、あるいはその両方における改善/低下を結果としてもたらす経時的な変更を特定する。例えば、モデル・ハイパーパラメータ・トレンド分析アナリティクスを通じて、エンジン156は、コンピュータ実施モデルの特定のコピーについて、コンピュータ・モデルのコピーのハイパーパラメータの設定を増大させ/減少させ/変更すると、コンピュータ・モデルの性能/正確性のX量の改善が結果としてもたらされると判断することができる。
モデル結果相関付けエンジン158は、様々なエンジン152~156によって特定されたトレーニング特性のトレンドを、コンピュータ実施モデル結果のトレンドと相関付ける。このため、トレーニング特性の変更は、コンピュータ実施モデル結果の変化にマッピングされ、そしてこのコンピュータ実施モデル結果は、コンピュータ実施モデル結果の改善/低下を結果としてもたらすトレーニング特性の潜在的変更を特定する。この相関付けは、コンピュータ・モデルのコピーのトレーニングの複数のインスタンスにわたってコンピュータ・モデルの個々のコピーに関して行うことができる。このため、これらのエンジン152~158およびコンピュータ・モデル・トレーニング・インスタンス追跡データベース162における対応するエントリを用いて、これらのトレンドを、コンピュータ・モデルの第1のコピーに関して特定することができ、異なるトレンドを、コンピュータ・モデルの第2のコピーに関して特定することができる。
様々なエンジン152~158によって実行されるアナリティクスが、データベース162内の追跡データに対し実行され、トレーニング特性およびコンピュータ実施モデルのコピーの対応する性能および正確性が特定される。このプロセスは、コンピュータ実施モデルとの反復トレーニングセッション、ならびに異なるトレーニング・データ・セット、異なるトレーニング・ツール、および異なるハイパーパラメータ設定について繰り返すことができる。
このため、例えば、1つの例示的な実施形態において、コンピュータ実施モデルのトレーニングの複数のインスタンスが、少なくとも、トレーニング・データの第1のバージョンおよび1つまたは複数のハイパーパラメータの第1のセットを用いてコンピュータ実施モデルに対し第1のトレーニング動作を実行して、コンピュータ実施モデルの第1のトレーニングされたインスタンスを生成することによって実行される。コンピュータ実施モデルのトレーニングの複数のインスタンスが、トレーニング・データの第2のバージョンおよび1つまたは複数のハイパーパラメータの第2のセットを用いてコンピュータ実施モデルに対し第2のトレーニング動作を実行して、コンピュータ実施モデルの第2のトレーニングされたインスタンスを生成することによって更に実行される。コンピュータ実施モデルのトレーニングのインスタンスの変更は、少なくとも、第1のトレーニング動作の第1の識別子を、トレーニング・データの第1のバージョンおよび1つまたは複数のハイパーパラメータの第1のセットと相関付ける第1の追跡データ構造、例えばデータベース162内のエントリを生成し、データ処理システムによって、第2のトレーニング動作の第2の識別子を、トレーニング・データの第2のバージョンおよび1つまたは複数のハイパーパラメータの第2のセットと相関付ける第2の追跡データ構造を生成することによって記録される。コンピュータ実施モデル結果は、少なくとも、コンピュータ実施モデルの第1のインスタンスを実行することにより第1のモデル結果を生成し、コンピュータ実施モデルの第2のインスタンスを実行することにより第2のモデル結果を生成することによって生成される。記録された差および対応するコンピュータ実施モデル結果の分析は、エンジン152~158によって、第1の追跡データ構造、第2の追跡データ構造、第1のモデル結果、および第2のモデル結果に対しアナリティクスを実行して、第1のモデル結果と第2のモデル結果との差と相関する、第1のトレーニング動作と第2のトレーニング動作との間の差を特定することを含む。
この例示的な実施形態のいくつかの場合、トレーニング・データの第2のバージョンは、トレーニング・データの第1のバージョンの変更バージョンである。例えば、開発者は、日毎に、トレーニング・データ内のエンティティが追加、削除、または他の形で変更されるトレーニング・データの前のバージョンの新たなバージョンとすることができる新たなトレーニング・データに対し、コンピュータ実施モデルを実行することができ、トレーニング特性の変更と相関付けることができる正確性の特定されたトレンドをもたらすことができる、コンピュータ実施モデルの正確性の更新を得ることができる。同様に、そのようなバージョニングは、特定のハイパーパラメータ設定、利用されるトレーニング・ツール等に関して実行することができる。
様々なエンジン152~158によって適用されるアナリティクスは、コンピュータ・モデルの個々のコピーのための追跡されたトレーニング特性情報および性能/正確性情報に適用することができる。次に、開発者間のトレンド分析エンジン164は、コンピュータ・モデルの複数の開発者および複数のコピーにわたって、エンジン152~158によって用いられるものに対し、他のアナリティクスまたは類似のアナリティクスを適用することができる。例えば、コンピュータ・モデルを利用する特定の顧客の特定の所望の実施および目的のためにコンピュータ・モデルのトレーニングされたコピーを開発する異なる開発者に、同じコンピュータ・モデルの複数のコピーを配布することができる。トレーニング特性のトレンド、およびコンピュータ・モデルのコピーの性能/正確性におけるそれらの対応するトレンドを相関付け、同じコンピュータ・モデルのこれらの様々な複数のコピーにわたって分析し、それによって異なる開発者環境および開発者について、異なるトレーニング特性変更に対しコンピュータ・モデルがどのように反応するかを特定することができる。このため、マクロ・トレンド分析が開発者間で可能にされる。
コンピュータ実施モデルの単一のコピーについて、または潜在的に複数の開発者にわたるコンピュータ実施モデルの複数のコピーにわたって特定されたトレンドに基づいて、例示的な実施形態のメカニズムは、トレーニング特性をどのように改善するかを示すトレーニング推薦を生成し、それによって、コンピュータ・モデルの結果として得られるトレーニングされたコピーの性能/正確性を改善することができる。トレーニング推薦は、様々なエンジン152~158によって以前に特定されたトレンドの分析に基づいて、および潜在的に(164)、これらのトレンドを分析してトレーニング特性の何の変更がコンピュータ・モデルのコピーの性能/正確性を増大させるか、例えば、Xのようなエンティティをより多く含むことによりコンピュータ・モデルの正確性が増大すること、或るエンティティを除去することによりコンピュータ・モデルの正確性が増大すること、ハイパーパラメータ値を特定の範囲または値に設定することにより正確性が改善すること等を特定することによって生成される。いくつかの場合、トレーニング推薦は、アーキテクチャAを有するコンピュータ・モデルが、アーキテクチャBを有するコンピュータ・モデルよりも良好な結果を与えることを指定する等、特定のアーキテクチャを対象とすることができる。
トレーニング推薦は、1つまたは複数のグラフィカル・ユーザ・インタフェース(GUI)、ダッシュボード等を介して提示することができる。GUIまたはダッシュボードは、例示的な実施形態のアナリティクスを通じて特定されたトレンドのグラフィック表現、そのようなトレンド情報の表形式の表現、または特定の実施に適したトレンド情報の任意の他の表現を含むことができる。1つの例示的な実施形態において、GUIまたはダッシュボードは、トレーニング・インスタンスが、トレーニング・インスタンス中に用いられる特定のトレーニング特性に関する詳細な情報を得るために選択可能なグラフに沿ったポイントとして表されるトレンド情報のグラフ表現を含む。例えば、1つの軸に沿って、コンピュータ・モデルの性能/正確性をプロットすることができ、別の軸に沿って、経時的なコンピュータ・モデルの性能・正確性が表されるように時間をプロットすることができる。プロットされたグラフのポイントは、生成されたコンピュータ・モデル結果、すなわち性能/正確性メトリックに従ってプロットされた、異なる時点における異なるトレーニング・インスタンスを表す。単純な例は2次元グラフであり得るが、より複雑な実施は、多くの異なる性能/正確性メトリックがプロットされ、異なるトレーニング特性が表される多次元グラフを利用することができることを理解されたい。
トレーニング推薦エンジン166は、これらのGUI、ダッシュボード等を生成および出力し、これらをコンピュータ・モデルの開発者に提示して、トレーニングを改善し、それによって結果として得られるトレーニングされたコンピュータ・モデルを改善するために、コンピュータ・モデルのトレーニング・プロセスのトレーニング特性に対し何の変更を行うことができるかを理解するのを支援することができる。いくつかの例示的な実施形態において、追跡されたトレーニング情報のグラフィック表現に加えて、またはこれに代えて、トレーニング推薦エンジン166は、コンピュータ・モデルのためのトレーニング・インスタンスのトレーニング特性を変更するための自然言語または他の人間が読み取ることが可能な推薦を生成することができる。
いくつかの場合、トレーニング推薦エンジン166によって生成される推薦は、行うべきでない変更に関する推薦も含むことができる。例えば、受信トレーニング情報に対し適用されるトレンド・アナリティクスを通じて、トレーニング推薦エンジン166は、トレーニング特性に対する特定のタイプの変更が行われたとき、コンピュータ・モデルの低減されたまたはより低い性能/正確性のパターンが存在すると判断することができる。これらのトレンドの結果として、トレーニング推薦エンジン166は、コンピュータ・モデルのより低い正確性または性能を結果としてもたらすそのような変更が行われないことを推薦することができる。
いくつかの例示的な実施形態において、トレーニング推薦エンジン166によって生成される推薦は、トレーニング推薦を自動的に実施する自動推薦実施エンジン168によって用いられる。例えば、トレーニング推薦は、ハイパーパラメータの設定を増大させ/低減させ/変更することによって、ハイパーパラメータ設定を変更する推薦を含むことができる。自動推薦実施エンジン168は、トレーニングされるコンピュータ・モデルによって生成されるコンピュータ・モデル結果を改善するための別のトレーニング・インスタンスを実行するために、トレーニング推薦に従ってハイパーパラメータ設定を自動的に修正することができる。別の例として、トレーニング推薦は、コンピュータ・モデル結果を改善する傾向にある特定のトレーニング・ツールを指定することができ、用いられるトレーニング・ツールは、コンピュータ・モデル性能/正確性を改善する特定されたトレーニング・ツールに自動的に変更することができる。
他の例示的な実施形態において、トレーニング推薦は、トレーニング・データ・セット自体およびトレーニング・データ・セットの特定の組成、例えば、トレーニング・データ・セットに何のタイプのエンティティが含まれるか、どれだけの量の異なるタイプのエンティティがトレーニング・データ・セット内に存在するか、改善されたコンピュータ・モデル結果を提供するトレーニング・データの特定のソース等を変更することであり得る。トレーニング・データ・セットに含まれるエンティティのタイプ、エンティティタイプの量等に関する推薦に基づいて、これらのトレーニング・データ・セット特性は、コンピュータ・モデルの正確性または性能あるいはその両方を改善すると判断されるエンティティ、すなわち、探索基準に合致するエンティティ、およびこのためトレーニング推薦を含むことができる、1つまたは複数のトレーニング・データ・セット・リポジトリにおける他のトレーニング・データ・セットの自動探索を実行するための探索基準として用いられる。例えば、新たなトレーニング・データ・セットが利用可能にされる際、それらの特性を、トレーニング・データ・セット・ソース特性追跡エンジン170に登録することができる。このトレーニング・データ・セット・ソース特性追跡エンジン170、およびトレーニング・データ・セット・ソース特性追跡エンジン170によって維持されるレジストリによって、自動探索を行うことができる。
いくつかの例示的な実施形態において、自動探索によって自動的に特定される、自動的に特定されたトレーニング・データ・セットは、自動推薦実施エンジン168によって自動的に索出することができ、コンピュータ・モデルをトレーニングするのに用いることができる。このプロセスは、コンピュータ・モデルの所望の正確性もしくは性能が達成されるまで、または利用可能なトレーニング・データ・セット、ツール等に基づいて更なる改善が可能でない、例えば、コンピュータ・モデルのエラーまたは損失が所定の閾値以下であると判断されるまで繰り返すことができる。
上述したように、コンピュータ・モデルの各トレーニング・インスタンスは、トレーニング特性に対する特定の変更、および生成された特定のコンピュータ・モデル結果と共に追跡することができる。このため、この追跡により、必要な場合、トレーニング・データの前のバージョンを再作成することができるように、トレーニング・データのバージョン追跡が可能にされる。すなわち、いくつかの例示的な実施形態において、モデルによる使用のためにフォーマット設定されたトレーニング・データの、最初に受信したトレーニング・データへのマッピングが、様々なトレーニング・インスタンスにわたって維持される。このようにして、モデルによりフォーマット設定されたトレーニング・データを所与として、最初に受信したトレーニング・データを再作成することができる。このため、例示的な実施形態のメカニズムは、顧客から得たトレーニング・データのバージョンを、コンピュータ・モデルの消費のために生成されたデータのバージョンと相関付けることができ、より早期のバージョンを再現することができるように、バージョニングの追跡により顧客データに戻ることができる。
上記で説明した例示的な実施形態は、単一のコンピュータ・モデルに適用されるトレンド・アナリティクスに関するものであるが、潜在的に、異なる開発者によってトレーニングされる同じコンピュータ・モデルの異なるコピーに関して、例示的な実施形態はそのように限定されないことを理解されたい。対照的に、トレンド分析およびトレーニング推薦の生成は、所望の実施に依拠して異なるコンピュータ・モデルにわたって実行することができる。例えば、1つのコンピュータ・モデルにおけるトレーニング特性の変更は、他のコンピュータ・モデルのトレーニングにおいて類似の影響を有することができ、このため、コンピュータ間モデル・トレンド分析およびトレーニング推薦を例示的な実施形態のメカニズムによって生成することができると判断することができる。そのような場合、トレンド分析は、異なるコンピュータ・モデルに関連付けられたデータベース162内の異なるエントリに関して実行することができる。
上述したように、例示的な実施形態のメカニズムは、コンピュータ技術分野に根差し、そのようなコンピューティングまたはデータ処理システムに存在するロジックを用いて実施される。これらのコンピューティングまたはデータ処理システムは、ハードウェア、ソフトウェア、またはハードウェアおよびソフトウェアの組合せを通じて、上記の様々な動作を実施するように特に構成される。したがって、図2は、本発明の実施形態を実施することができる1つのタイプのデータ処理システムの例として提供される。多くの他のタイプのデータ処理システムも例示的な実施形態のメカニズムを特に実施するように同様に構成することができる。
図2は、例示的な実施形態が実施される例示的なデータ処理システムのブロック図である。データ処理システム200は、本発明の例示的な実施形態のためのプロセスを実施するコンピュータ使用可能コードまたは命令が配置される、図1におけるサーバ104またはクライアント110等のコンピュータの例である。1つの例示的な実施形態において、図2は、以下で説明する例示的な実施形態の追加のメカニズムを含むように拡張されたコグニティブ・システム100およびQAシステムパイプライン108を実施する、サーバ104等のサーバ・コンピューティング・デバイスを表す。
示される例において、データ処理システム200は、ノース・ブリッジおよびメモリ・コントローラ・ハブ(NB/MCH)202ならびにサウス・ブリッジおよび入力/出力(I/O)コントローラ・ハブ(SB/ICH)204を含むハブ・アーキテクチャを用いる。処理ユニット206、メイン・メモリ208、およびグラフィック・プロセッサ210は、NB/MCH202に接続される。グラフィック・プロセッサ210は、アクセラレーテッド・グラフィックス・ポート(AGP)を介してNB/MCH202に接続される。
示される例では、ローカル・エリア・ネットワーク(LAN)アダプタ212がSB/ICH204に接続される。オーディオ・アダプタ216、キーボードおよびマウス・アダプタ220、モデム222、リード・オンリー・メモリ(ROM)224、ハード・ディスク・ドライブ(HDD)226、CD-ROMドライブ230、ユニバーサル・シリアル・バス(USB)ポートおよび他の通信ポート232、ならびにPCI/PCIeデバイス234が、バス238およびバス240を介してSB/ICH204に接続される。PCI/PCIeデバイスは、例えばイーサネット(R)・アダプタ、アドイン・カード、およびノート型コンピュータ用のPCカードを含むことができる。PCIはカード・バス・コントローラを使用するが、PCIeは使用しない。ROM224は、例えばフラッシュ基本入出力システム(BIOS)とすることができる。
HDD226およびCD-ROMドライブ230は、バス240を通じてSB/ICH204に接続される。HDD226およびCD-ROM230は、例えば、集積ドライブ・エレクトロニクス(IDE)またはシリアル高度技術アタッチメント(SATA)インタフェースを使用することができる。スーパーI/O(SIO)デバイス236はSB/ICH204に接続される。
オペレーティング・システムは、処理ユニット206上で実行される。オペレーティング・システムは、図2のデータ処理システム200内の様々なコンポーネントの制御を調整および提供する。クライアントとして、オペレーティング・システムは、Microsoft(R)Windows(R)8等の市販のオペレーティング・システムである。Java(商標)プログラミング・システム等のオブジェクト指向プログラミング・システムはオペレーティング・システムと共に実行することができ、データ処理システム200上で実行されるJava(商標)プログラムまたはアプリケーションからオペレーティング・システムに呼び出しを与える。
サーバとして、データ処理システム200は、例えば、Advanced Interactive Executive(AIX(R))オペレーティング・システムまたはLINUX(R)オペレーティング・システムを実行する、IBM(R)eServer(商標)System pコンピュータ・システムとすることができる。データ処理システム200は、処理ユニット206内に複数のプロセッサを含む対称型マルチプロセッサ(SMP)システムとすることができる。代替的に、単一のプロセッサ・システムが用いられてもよい。IBM、eSeverおよびAIXは、米国または他の国あるいはその両方におけるインターナショナル・ビジネス・マシーンズ・コーポレーションの商標である。Microsoft、Windows(R)、Windows(R) NTおよびWindows(R) logoは、米国、他の国、またはその両方におけるMicrosoft Corporationの商標である。Java(R)および全てのJava(R)ベースの商標およびロゴは、Oracleまたはその関連会社あるいはその両方の商標または登録商標である。登録商標Linux(R)は、世界規模での商標の所有者であるLinus Torvaldsの専用実施権者であるLinux Foundationからのサブライセンスに準拠して用いられる。
オペレーティング・システムに対する命令、オブジェクト指向プログラミング・システム、およびアプリケーションまたはプログラムは、HDD226等のストレージ・デバイス上に置かれ、処理ユニット206による実行のためにメイン・メモリ208にロードされる。本発明の例示的な実施形態のためのプロセスは、コンピュータ使用可能プログラム・コードを用いて、処理ユニット206によって行われ、コンピュータ使用可能プログラム・コードは、例えばメイン・メモリ208、ROM224等のメモリ内、または例えば1つもしくは複数の周辺デバイス226および230内に配置される。
図2に示されるバス238またはバス240等のバス・システムは、1つまたは複数のバスからなる。当然ながら、バス・システムは、そのファブリックまたはアーキテクチャに付加された様々な構成要素またはデバイスの間でデータの転送を可能にする任意のタイプの通信ファブリックまたは通信アーキテクチャを使用して実装することができる。図2のモデム222またはネットワーク・アダプタ212等の通信ユニットは、データを送受信するのに使用される1つまたは複数のデバイスを含む。メモリは、例えば、図2におけるNB/MCH202に見られるようなメイン・メモリ208、ROM224、またはキャッシュとすることができる。
図1および図2に示すハードウェアは、実装形態に依拠して異なってもよいことが当業者には認識されよう。フラッシュ・メモリ、同等の不揮発性メモリ、または光ディスク・ドライブ等のような他の内部ハードウェアまたは周辺デバイスが、図1および図2に示すハードウェアに加えて、またはその代わりに使用されてよい。また、例示的な実施形態のプロセスは、本発明の思想および範囲から逸脱することなく、前述したSMPシステム以外のマルチプロセッサ・データ処理システムに適用されてもよい。
更に、データ処理システム200は、クライアント・コンピューティング・デバイス、サーバ・コンピューティング・デバイス、タブレット・コンピュータ、ラップトップ・コンピュータ、電話機または他の通信デバイス、携帯情報端末(PDA)等を含む、複数の異なるデータ処理システムのうちの任意のものの形態をとることができる。いくつかの例示的な例において、データ処理システム200は、例えば、オペレーティング・システム・ファイルまたはユーザによって生成されたデータ、あるいはその両方を記憶するための不揮発性メモリを提供するために、フラッシュ・メモリを備えて構成されたポータブル・コンピューティング・デバイスとすることができる。基本的に、データ処理システム200は、構造上の限定なしに任意の既知のまたは将来開発されるデータ処理システムとすることができる。
図3は、1つの例示的な実施形態による、コンピュータ・モデル・トレーニング・コンピューティング・システムの例示的な動作を概説するフローチャートである。図3に示すように、動作は、コンピュータ・モデルのコピーの1つまたは複数のトレーニング・インスタンスについて、開発者環境、例えば、クライアント/サーバ・コンピューティング・システムにより実施された開発者環境からトレーニング情報を受信することによって開始する(ステップ310)。上述したように、いくつかの例示的な実施形態において、このトレーニング情報の取得は、開発者環境から直接、または開発者がコンピュータ・モデルのコピーをトレーニングしている開発者環境からそのようなデータを得るための任意の他の適切なメカニズムを通じて、開発者環境内にまたは開発者環境と併せて存在し、実行されるエージェントを用いることによって容易にすることができる。
受信したトレーニング情報に基づいて、コンピュータ・モデルのコピーのためのコンピュータ・モデル・トレーニング・インスタンス追跡データベースにおいて1つまたは複数の対応するエントリが生成される(ステップ320)。上述したように、エントリは、1つまたは複数の異なる識別子、またはトレーニング・インスタンス・インジケータ、コンピュータ・モデルのコピーのインジケータ等のインジケータに基づいてインデックス付けすることができる。
トレーニング特性のトレンドを特定するために、コンピュータ・モデルのコピーのためのコンピュータ・モデル・トレーニング・インスタンス追跡データベースにおけるエントリに1つまたは複数のトレンド・アナリティクスが適用される(ステップ330)。加えて、複数のコンピュータ・モデルにわたるトレーニング特性におけるトレンドを特定するために、コンピュータ・モデルの複数のコピー、または異なるモデルの異なるコピー、またはその両方にわたってコンピュータ・モデル・トレーニング・インスタンス追跡データベースにおけるエントリに1つまたは複数のトレンド・アナリティクスが適用される(ステップ340)。特定されるトレーニング特性のトレンドは、コンピュータ・モデル結果のトレンドと相関付けられる(ステップ350)。
コンピュータ・モデル結果のトレンドと相関付けされたトレーニング特性のトレンドに基づいて、コンピュータ・モデルのコピーのトレーニングを改善するための1つまたは複数のトレーニング推薦が生成され、コンピュータ・モデルのコピーの開発を担当する開発者または他の権限を有するユーザに出力される(ステップ360)。任意選択で、トレーニング推薦は、トレーニング推薦に従ってトレーニング特性を変更するために対応するコンピュータ動作を実行することによって自動的に実施されてもよい(ステップ370)。これは、例えば、ハイパーパラメータの設定を変更すること、トレーニング・データ・セットのコンテンツを変更すること、特定のトレーニング・データ・セット・ソースから新たなトレーニング・データ・セットを得ること、利用されるトレーニング・ツールを変更すること等を含むことができる。
自動的に実施されるか、または開発者に対するトレーニング推薦の出力に基づく手動変更を通じて実施されるかに関わらず、コンピュータ・モデルのコピーは、トレーニング推薦のうちの1つまたは複数を用いてトレーニングされる(ステップ380)。次に動作が終了する。
上述したように、トレーニング特性および対応するコンピュータ・モデル結果に対し実行されたトレンド分析に基づく、例示的な実施形態のメカニズムによって生成されたトレーニング推薦。これらのトレーニング推薦の出力は、グラフィカル・ユーザ・インタフェースおよびダッシュボードとして表されることを含む様々な異なる方式で表すことができ、ここで、トレンドは、コンピュータ・モデル性能/正確性を、コンピュータ・モデルの1つのコピーの、または1つのコンピュータ・モデルもしくは異なる複数のコンピュータ・モデルの複数のコピーにわたる、様々なトレーニング・インスタンスのトレーニング特性と経時的に相関付けるグラフとして表される。いくつかの例示的な実施形態において、ダッシュボードは、表形式のフォーマットで表すことができ、ここで、表形式の出力の1つまたは複数の列は、コンピュータ・モデル性能/正確性のトレンドを表し、1つまたは複数の列はトレーニング特性情報を表し、1つまたは複数の他の列は、コンピュータ・モデルのコピーのトレーニング・インスタンスに固有の他のタイプの情報を表す。
図4は、1つの例示的な実施形態によるトレーニング情報のダッシュボード表現の例示的な図である。図4に示すように、ダッシュボード表現は表形式であり、ここで、表の行は異なるコンピュータ・モデルを表し、列はトレーニング・インスタンスの様々なトレーニング・インスタンス情報およびトレンド情報を表す。「詳細」列は、ユーザが選択可能な要素を含み、これは、ユーザによって選択されると、対応するモデルをトレーニングするのに用いられるトレーニング・データに関する詳細な情報を生成する。「トレンド」列は、ユーザが選択可能な要素を含み、これは、ユーザによって選択されると、対応するモデルをトレーニングする際のトレンドを示す出力を生成する。
図5は、1つの例示的な実施形態による、コンピュータ・モデルのコピーのトレーニングのトレンドのグラフィック表現の例示的な図である。図5に示すように、グラフィック表現は、コンピュータ・モデル出力の正確性を表す垂直軸および時系列を表す水平軸を含む。線に沿ったポイントは、コンピュータ・モデルのコピーのためのトレーニング・インスタンスを表し、ここで、これらのポイント間の線は、コンピュータ・モデル性能のトレンドを表す。グラフィック表現におけるポイントは、ユーザが対応するポイントを選択するときに、トレーニング・データ・バージョン、トレーニング・ツール、ハイパーパラメータおよび他のトレーニング特性の組合せを開発者が閲覧するために提示することができるようにユーザ選択可能である。トレーニング特性のこの表現から、開発者は、トレーニング特性のどの組合せが、コンピュータ・モデル性能/正確性における増減をもたらし得るか、いずれのトレーニング特性の結果として異常な増減が生じるか等を知ることができる。示される例における領域510内等、所望の性能/正確性でグラフィック表現においてトレンドがより平滑に表されるとき、開発者は、対応するトレーニング特性を特定し、これらを利用して、トレーニング特性の適切な設定を通じてコンピュータ・モデルの改善された性能/正確性を得ることができる。
図6は、トレーニング・モデル特性およびトレーニング・データ・セット特性の表形式の表現の例示的な図であり、上の図5は、複数のモデルにわたる正確性トレンドを表す。すなわち、図5において、各ドットはコンピュータ・モデル・インスタンスを表し、エッジは、例えば増減している正確性のトレンドを表す。図5における曲線が増加しているかまたは減少しているかに依拠して(図5における各点線のエッジはモデルである)、モデル開発者は、より高い正確性をもたらすモデル・インスタンスのために指定されたトレーニング特性に戻ることができる。図5に示すグラフ内の曲線に沿った各ポイントは、図6に示す表形式の情報の独自の対応するバージョンを有することができ、これを、コンピュータ・モデルの特定のインスタンスのためのトレーニング特性を指定するために用いることができる。
このため、例示的な実施形態のメカニズムを用いて、コンピュータ実施モデルをトレーニングするための改善されたコンピュータ・ツールが提供され、ここで、この改善されたコンピュータ・ツールは、コンピュータ実施モデルをトレーニングし、トレーニング特性に対し行われた変更を追跡し、これらのトレーニング特性に対し行われた変更を、性能/正確性メトリックの変化と相関付けるためのコンピュータ固有の動作の順序付けされた組合せを実行するように特に構成されたデータ処理システムにおいて実施される。改善されたコンピュータ・ツールは、追跡情報におけるトレンドを特定し、コンピュータ実施モデルのトレーニングを改善するための推薦を生成するか、またはコンピュータ実施モデルのトレーニングを改善するための生成された推薦を自動的に実施するか、あるいはその両方を行うための分析を行う、コンピュータ固有の動作を更に提供する。
上述したように、例示的な実施形態は、完全にハードウェアの実施形態、完全にソフトウェアの実施形態、またはハードウェア要素およびソフトウェア要素の双方を含む実施形態の形態をとることができることを理解されたい。1つの例示的な実施形態において、例示的な実施形態のメカニズムは、ソフトウェアまたはプログラム・コードにおいて実施され、これは、限定ではないが、ファームウェア、常駐ソフトウェア、マイクロコード等を含む。
プログラム・コードの記憶または実行あるいはその両方に適したデータ処理システムは、例えばシステム・バス等の通信バスを通じてメモリ要素に直接または間接的に結合された少なくとも1つのプロセッサを含む。これらのメモリ素子は、プログラム・コードの実際の実行中に用いられるローカル・メモリ、バルク・ストレージ、および、実行中にコードをバルク・ストレージから索出する必要回数を減らすために、少なくとも一部のプログラム・コードの一時的ストレージを提供するキャッシュ・メモリを含むことができる。メモリは、限定ではないが、ROM、PROM、EPROM、EEPROM、DRAM、SRAM、フラッシュ・メモリ、固体メモリ等を含む、様々なタイプとすることができる。
本システムには、直接、あるいは、介在する有線または無線I/Oインタフェースもしくはコントローラまたはその両方等を通じて、入力/出力またはI/Oデバイス(限定ではないが、キーボード、ディスプレイ、ポインティング・デバイス等を含む)を結合することができる。I/Oデバイスは、従来のキーボード、ディスプレイ、ポインティング・デバイス等以外に、例えば、限定ではないが、スマート・フォン、タブレット・コンピュータ、タッチ・スクリーン・デバイス、音声認識デバイス等を含む、有線または無線接続を通じて結合された通信デバイス等の、多くの異なる形態をとることができる。任意の既知のまたは将来開発されるI/Oデバイスが例示的な実施形態の範囲内にあると意図される。
また、データ処理システムが、介在する私設または公衆ネットワークを通じて他のデータ処理システム、または遠隔のプリンタもしくはストレージ・デバイスに連結できるようにするため、システムにネットワーク・アダプタが結合されてよい。モデム、ケーブル・モデム、およびイーサネット(R)カードは、有線通信のために現在利用可能なネットワーク・アダプタのタイプのほんの一部である。また、限定ではないが、802.11/a/b/g/n無線通信アダプタ、ブルートゥース(R)無線アダプタ等を含む、無線通信ベースのネットワーク・アダプタも利用が可能である。任意の既知のまたは将来開発されるネットワーク・アダプタが本発明の思想および範囲内にあることが意図される。
本発明の記述は、例示および説明の目的で提示されたものであり、網羅的であることも、または本発明を開示した形態に限定することも意図されていない。当業者には、説明された実施形態の範囲および思想から逸脱することなく、多くの変更および変形が明らかであろう。実施形態は、本発明の原理および実際的な応用を最善に説明し、他の当業者が、意図する特定の用途に適した様々な変更を加えた様々な実施形態に関連して、本発明を理解できるように選択し説明されたものである。本明細書で用いられた用語は、実施形態の原理、実際上の応用、または市場の技術の技術的な改良を最善に説明し、または他の当業者が本明細書に開示された実施形態を理解できるように選択されたものである。

Claims (22)

  1. データ処理システムにおいて、コンピュータ実施モデルをトレーニングするための方法であって、
    前記データ処理システムによって、前記コンピュータ実施モデルのトレーニングの複数のインスタンスを実行することであって、前記コンピュータ実施モデルのトレーニングの各インスタンスは、異なるトレーニング・データ・セットを用いて前記コンピュータ実施モデルをトレーニングして、トレーニングされたコンピュータ実施モデルの異なるインスタンスを生成することを含む、前記実行することと、
    トレーニングの各インスタンス後に、前記トレーニングされたコンピュータ実施モデルの対応するインスタンスを実行することによって、コンピュータ実施モデル結果を生成することと、
    前記データ処理システムによって、前記トレーニングされたコンピュータ実施モデルのインスタンスの対応する識別子および対応するコンピュータ実施モデル結果に関連付けて、前記コンピュータ実施モデルのトレーニングの前記インスタンスの差を記録することと、
    前記データ処理システムによって、前記記録された差および前記対応するコンピュータ実施モデル結果を分析することと、
    前記データ処理システムによって、記録された差と、対応するコンピュータ実施モデル結果との間の相関を示す出力を生成することと、
    を含む、方法。
  2. 前記コンピュータ実施モデルのトレーニングの複数のインスタンスを実行することは、
    前記データ処理システムによって、トレーニング・データの第1のバージョンおよび1つまたは複数のハイパーパラメータの第1のセットを用いて、前記コンピュータ実施モデルに対し第1のトレーニング動作を実行して、前記コンピュータ実施モデルの第1のトレーニングされたインスタンスを生成することと、
    前記データ処理システムによって、前記トレーニング・データの第2のバージョンおよび1つまたは複数のハイパーパラメータの第2のセットを用いて、前記コンピュータ実施モデルに対し第2のトレーニング動作を実行して、前記コンピュータ実施モデルの第2のトレーニングされたインスタンスを生成することと、
    を含む、請求項1に記載の方法。
  3. 前記コンピュータ実施モデルのトレーニングの前記インスタンスの変更を記録することは、
    前記データ処理システムによって、前記第1のトレーニング動作の第1の識別子を、前記トレーニング・データの第1のバージョンおよび前記1つまたは複数のハイパーパラメータの第1のセットと相関付ける第1の追跡データ構造を生成することと、
    前記データ処理システムによって、前記第2のトレーニング動作の第2の識別子を、前記トレーニング・データの第2のバージョンおよび前記1つまたは複数のハイパーパラメータの第2のセットと相関付ける第2の追跡データ構造を生成することと、
    を含む、請求項2に記載の方法。
  4. コンピュータ実施モデル結果を生成することは、
    前記コンピュータ実施モデルの第1のインスタンスの実行から第1のモデル結果を生成することと、
    前記コンピュータ実施モデルの第2のインスタンスの実行から第2のモデル結果を生成することとを含み、前記記録された差および前記対応するコンピュータ実施モデル結果を分析することは、前記データ処理システムによって、前記第1の追跡データ構造、前記第2の追跡データ構造、前記第1のモデル結果および前記第2のモデル結果に対しアナリティクスを実行して、前記第1のモデル結果と前記第2のモデル結果との差と相関する、前記第1のトレーニング動作と前記第2のトレーニング動作との差を特定することを含む、請求項3に記載の方法。
  5. 前記トレーニング・データの第2のバージョンは、前記トレーニング・データの第1のバージョンの変更バージョンである、請求項2に記載の方法。
  6. 前記出力を生成することは、
    前記記録された差および対応するコンピュータ実施モデル結果に基づいて、どの変更が前記コンピュータ実施モデルの正確性を増大させるかを特定することによって、前記コンピュータ実施モデルのトレーニングを変更してトレーニング・データを改善するための1つまたは複数の推薦を生成することを更に含む、請求項1に記載の方法。
  7. 前記生成された1つまたは複数の推薦を実施するためにコンピュータ動作を自動的に実行することを更に含み、前記コンピュータ動作は、前記コンピュータ実施モデルのトレーニングを改善するエンティティとして前記1つまたは複数の推薦において指定されたエンティティを含む新たなトレーニング・データを得ること、前記コンピュータ実施モデルのトレーニングを劣化させるエンティティとして前記1つまたは複数の推薦において指定されたエンティティを除去すること、前記コンピュータ実施モデルの少なくとも1つのハイパーパラメータを変更すること、または前記コンピュータ実施モデルのトレーニングを実行するのに用いられるコンピュータ・モデル・トレーニング・ツールを変更することのうちの少なくとも1つを含む、請求項6に記載の方法。
  8. 前記コンピュータ実施モデルをトレーニングするのに用いられるトレーニング・データを、トレーニング・データの前のバージョンに戻すことができるように、前記コンピュータ実施モデルをトレーニングするのに用いられるトレーニング・データのインスタンスを追跡することを更に含む、請求項1に記載の方法。
  9. 前記分析することは、前記記録された差および前記対応するコンピュータ実施モデル結果に対しトレンド分析を実行することを含む、請求項1に記載の方法。
  10. 前記コンピュータ実施モデルのトレーニングの前記複数のインスタンスは、1つまたは複数のロケーションにおける異なるコンピュータ実施モデル開発者によって前記コンピュータ実施モデルの異なるコピーをトレーニングして、前記トレーニングされたコンピュータ実施モデルのインスタンスの異なるサブセットを生成することを含み、前記方法は、前記異なるコンピュータ実施モデル開発者からの前記トレーニングされたコンピュータ実施モデルのインスタンスの全ての前記サブセットにわたって実行される、請求項1に記載の方法。
  11. コンピュータ・プログラムであって、請求項1ないし10のいずれか1項に記載の方法の各ステップをコンピュータに実行させるための、コンピュータ・プログラム。
  12. 請求項11に記載のコンピュータ・プログラムを記録した、コンピュータ可読記憶媒体。
  13. データ処理システムである装置であって、
    プロセッサと、
    前記プロセッサに結合されたメモリであって、前記メモリは命令を含み、前記命令は、前記プロセッサによって実行されると、前記プロセッサに、
    コンピュータ実施モデルのトレーニングの複数のインスタンスを実行することであって、前記コンピュータ実施モデルのトレーニングの各インスタンスは、異なるトレーニング・データ・セットを用いて前記コンピュータ実施モデルをトレーニングして、トレーニングされたコンピュータ実施モデルの異なるインスタンスを生成することを含む、前記実行することと、
    トレーニングの各インスタンス後に、前記トレーニングされたコンピュータ実施モデルの対応するインスタンスを実行することによって、コンピュータ実施モデル結果を生成することと、
    前記トレーニングされたコンピュータ実施モデルのインスタンスの対応する識別子および対応するコンピュータ実施モデル結果に関連付けて、前記コンピュータ実施モデルのトレーニングの前記インスタンスの差を記録することと、
    前記記録された差および前記対応するコンピュータ実施モデル結果を分析することと、
    記録された差と、対応するコンピュータ実施モデル結果との間の相関を示す出力を生成することと、
    を行わせる、前記メモリと、
    を備える、装置。
  14. 前記メモリは命令を含み、前記命令は、前記プロセッサによって実行されると、前記プロセッサに、少なくとも、
    前記データ処理システムによって、トレーニング・データの第1のバージョンおよび1つまたは複数のハイパーパラメータの第1のセットを用いて、前記コンピュータ実施モデルに対し第1のトレーニング動作を実行して、前記コンピュータ実施モデルの第1のトレーニングされたインスタンスを生成することと、
    前記データ処理システムによって、トレーニング・データの第2のバージョンおよび1つまたは複数のハイパーパラメータの第2のセットを用いて、前記コンピュータ実施モデルに対し第2のトレーニング動作を実行して、前記コンピュータ実施モデルの第2のトレーニングされたインスタンスを生成することと、
    によって、前記コンピュータ実施モデルのトレーニングの複数のインスタンスを実行させる、請求項13に記載の装置。
  15. 前記メモリは命令を含み、前記命令は、前記プロセッサによって実行されると、前記プロセッサに、少なくとも、
    前記データ処理システムによって、前記第1のトレーニング動作の第1の識別子を、前記トレーニング・データの第1のバージョンおよび前記1つまたは複数のハイパーパラメータの第1のセットと相関付ける第1の追跡データ構造を生成することと、
    前記データ処理システムによって、前記第2のトレーニング動作の第2の識別子を、前記トレーニング・データの第2のバージョンおよび前記1つまたは複数のハイパーパラメータの第2のセットと相関付ける第2の追跡データ構造を生成することと、
    によって、前記コンピュータ実施モデルのトレーニングの前記インスタンスの変更を記録させる、請求項14に記載の装置。
  16. 前記メモリは命令を含み、前記命令は、前記プロセッサによって実行されると、前記プロセッサに、少なくとも、
    前記コンピュータ実施モデルの第1のインスタンスの実行から第1のモデル結果を生成することと、
    前記コンピュータ実施モデルの第2のインスタンスの実行から第2のモデル結果を生成することとによって、コンピュータ実施モデル結果を生成させ、前記記録された差および前記対応するコンピュータ実施モデル結果を分析することは、前記データ処理システムによって、前記第1の追跡データ構造、前記第2の追跡データ構造、前記第1のモデル結果および前記第2のモデル結果に対しアナリティクスを実行して、前記第1のモデル結果と前記第2のモデル結果との差と相関する、前記第1のトレーニング動作と前記第2のトレーニング動作との差を特定することを含む、請求項15に記載の装置。
  17. 前記トレーニング・データの第2のバージョンは、前記トレーニング・データの第1のバージョンの変更バージョンである、請求項14に記載の装置。
  18. 前記メモリは命令を含み、前記命令は、前記プロセッサによって実行されると、前記プロセッサに、少なくとも、
    前記記録された差および対応するコンピュータ実施モデル結果に基づいて、どの変更が前記コンピュータ実施モデルの正確性を増大させるかを特定することによって、前記コンピュータ実施モデルのトレーニングを変更してトレーニング・データを改善するための1つまたは複数の推薦を生成することによって、前記出力を生成させる、請求項13に記載の装置。
  19. 前記メモリは命令を含み、前記命令は、前記プロセッサによって実行されると、前記プロセッサに、
    前記生成された1つまたは複数の推薦を実施するためのコンピュータ動作を自動的に実行させ、前記コンピュータ動作は、前記コンピュータ実施モデルのトレーニングを改善するエンティティとして前記1つまたは複数の推薦において指定されたエンティティを含む新たなトレーニング・データを得ること、前記コンピュータ実施モデルのトレーニングを劣化させるエンティティとして前記1つまたは複数の推薦において指定されたエンティティを除去すること、前記コンピュータ実施モデルの少なくとも1つのハイパーパラメータを変更すること、または前記コンピュータ実施モデルのトレーニングを実行するのに用いられるコンピュータ・モデル・トレーニング・ツールを変更することのうちの少なくとも1つを含む、請求項18に記載の装置。
  20. 前記メモリは命令を含み、前記命令は、前記プロセッサによって実行されると、前記プロセッサに、
    前記コンピュータ実施モデルをトレーニングするのに用いられるトレーニング・データを、トレーニング・データの前のバージョンに戻すことができるように、前記コンピュータ実施モデルをトレーニングするのに用いられるトレーニング・データのインスタンスを追跡させる、請求項13に記載の装置。
  21. 前記メモリは命令を含み、前記命令は、前記プロセッサによって実行されると、前記プロセッサに、少なくとも、前記記録された差および前記対応するコンピュータ実施モデル結果に対しトレンド分析を実行することによって、前記記録された差および前記対応するコンピュータ実施モデル結果を分析させる、請求項13に記載の装置。
  22. 前記コンピュータ実施モデルの異なるコピーは、1つまたは複数のロケーションにおける異なるコンピュータ実施モデル開発者によってトレーニングされ、前記装置は、前記異なるコンピュータ実施モデル開発者からの前記トレーニングされたコンピュータ実施モデルの前記インスタンスの全てのサブセットにわたって動作可能である、請求項13に記載の装置。
JP2021547725A 2019-03-07 2020-02-28 トレーニング・データと性能トレンドとの相関付けに基づいたコンピュータ・モデル機械学習 Active JP7413392B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/295,062 US11809966B2 (en) 2019-03-07 2019-03-07 Computer model machine learning based on correlations of training data with performance trends
US16/295,062 2019-03-07
PCT/IB2020/051708 WO2020178687A1 (en) 2019-03-07 2020-02-28 Computer model machine learning based on correlations of training data with performance trends

Publications (3)

Publication Number Publication Date
JP2022522641A JP2022522641A (ja) 2022-04-20
JPWO2020178687A5 JPWO2020178687A5 (ja) 2022-06-07
JP7413392B2 true JP7413392B2 (ja) 2024-01-15

Family

ID=72336425

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021547725A Active JP7413392B2 (ja) 2019-03-07 2020-02-28 トレーニング・データと性能トレンドとの相関付けに基づいたコンピュータ・モデル機械学習

Country Status (6)

Country Link
US (2) US11809966B2 (ja)
JP (1) JP7413392B2 (ja)
CN (1) CN113557535A (ja)
DE (1) DE112020000227T5 (ja)
GB (1) GB2596438A (ja)
WO (1) WO2020178687A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11625642B2 (en) * 2018-04-22 2023-04-11 Trendalyze Inc. Method for converting nominal to ordinal or continuous variables using time-series distances
US20200303060A1 (en) * 2019-03-18 2020-09-24 Nvidia Corporation Diagnostics using one or more neural networks
US11562178B2 (en) * 2019-04-29 2023-01-24 Oracle International Corporation Adaptive sampling for imbalance mitigation and dataset size reduction in machine learning
US11573833B2 (en) * 2019-07-31 2023-02-07 EMC IP Holding Company LLC Allocating cores to threads running on one or more processors of a storage system
US20210233166A1 (en) * 2020-01-28 2021-07-29 David B. Coulter System and Method Of Lender, Borrower, and Employee Driven Enrollment
US11494703B2 (en) * 2020-02-26 2022-11-08 Opendoor Labs Inc. Machine learning model registry
US11568279B2 (en) * 2020-06-09 2023-01-31 Sap Se Anomaly detection for automated information technology processes
US11956315B2 (en) 2020-11-03 2024-04-09 Microsoft Technology Licensing, Llc Communication system and method
KR102493655B1 (ko) * 2020-12-01 2023-02-07 가천대학교 산학협력단 인공지능 모델 훈련 데이터셋의 관리방법
US20220199262A1 (en) * 2020-12-22 2022-06-23 Nuance Communications, Inc. AI Platform System and Method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017004509A (ja) 2015-06-04 2017-01-05 ザ・ボーイング・カンパニーThe Boeing Company 機械学習のための高度解析インフラストラクチャ
JP2017228068A (ja) 2016-06-22 2017-12-28 富士通株式会社 機械学習管理プログラム、機械学習管理方法および機械学習管理装置
US20180025286A1 (en) 2016-07-25 2018-01-25 International Business Machines Corporation Detecting trends in evolving analytics models

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6879944B1 (en) 2000-03-07 2005-04-12 Microsoft Corporation Variational relevance vector machine
US7080052B2 (en) 2001-04-19 2006-07-18 International Business Machines Corporation Method and system for sample data selection to test and train predictive algorithms of customer behavior
AU2009251043A1 (en) 2009-01-07 2010-07-22 The University Of Sydney A method and system of data modelling
US20110125734A1 (en) 2009-11-23 2011-05-26 International Business Machines Corporation Questions and answers generation
US8458074B2 (en) * 2010-04-30 2013-06-04 Corelogic Solutions, Llc. Data analytics models for loan treatment
US9454733B1 (en) 2012-08-15 2016-09-27 Context Relevant, Inc. Training a machine learning model
DE102013213397A1 (de) 2013-07-09 2015-01-15 Robert Bosch Gmbh Verfahren und Vorrichtung zum Bereitstellen von Stützstellendaten für ein datenbasiertes Funktionsmodell
JP2015087973A (ja) 2013-10-31 2015-05-07 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 生成装置、生成方法、およびプログラム
WO2015179778A1 (en) * 2014-05-23 2015-11-26 Datarobot Systems and techniques for predictive data analytics
US9886670B2 (en) 2014-06-30 2018-02-06 Amazon Technologies, Inc. Feature processing recipes for machine learning
US10832308B2 (en) 2017-04-17 2020-11-10 International Business Machines Corporation Interpretable rule generation using loss preserving transformation
US11113599B2 (en) 2017-06-22 2021-09-07 Adobe Inc. Image captioning utilizing semantic text modeling and adversarial learning
US20200012890A1 (en) * 2018-07-06 2020-01-09 Capital One Services, Llc Systems and methods for data stream simulation
CN109189767B (zh) 2018-08-01 2021-07-23 北京三快在线科技有限公司 数据处理方法、装置、电子设备及存储介质
US10528891B1 (en) * 2018-08-23 2020-01-07 SigOpt, Inc. Systems and methods for implementing an intelligent machine learning optimization platform for multiple tuning criteria
US11392859B2 (en) * 2019-01-11 2022-07-19 Microsoft Technology Licensing, Llc Large-scale automated hyperparameter tuning

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017004509A (ja) 2015-06-04 2017-01-05 ザ・ボーイング・カンパニーThe Boeing Company 機械学習のための高度解析インフラストラクチャ
JP2017228068A (ja) 2016-06-22 2017-12-28 富士通株式会社 機械学習管理プログラム、機械学習管理方法および機械学習管理装置
US20180025286A1 (en) 2016-07-25 2018-01-25 International Business Machines Corporation Detecting trends in evolving analytics models

Also Published As

Publication number Publication date
CN113557535A (zh) 2021-10-26
JP2022522641A (ja) 2022-04-20
WO2020178687A1 (en) 2020-09-10
US20200285899A1 (en) 2020-09-10
US11809966B2 (en) 2023-11-07
DE112020000227T5 (de) 2021-09-02
US20240020579A1 (en) 2024-01-18
GB2596438A (en) 2021-12-29
GB202112847D0 (en) 2021-10-27

Similar Documents

Publication Publication Date Title
JP7413392B2 (ja) トレーニング・データと性能トレンドとの相関付けに基づいたコンピュータ・モデル機械学習
Lu et al. Machine learning for synthetic data generation: a review
US10423519B2 (en) Proactive cognitive analysis for inferring test case dependencies
US10585784B2 (en) Regression testing question answering cognitive computing systems by applying ground truth virtual checksum techniques
US10606893B2 (en) Expanding knowledge graphs based on candidate missing edges to optimize hypothesis set adjudication
US20210019665A1 (en) Machine Learning Model Repository Management and Search Engine
US9063975B2 (en) Results of question and answer systems
US9280908B2 (en) Results of question and answer systems
US10878570B2 (en) Knockout autoencoder for detecting anomalies in biomedical images
US11544621B2 (en) Cognitive model tuning with rich deep learning knowledge
US20210295188A1 (en) Cross-User Dashboard Behavior Analysis and Dashboard Recommendations
US20170169355A1 (en) Ground Truth Improvement Via Machine Learned Similar Passage Detection
US20240053307A1 (en) Identifying Repetitive Portions of Clinical Notes and Generating Summaries Pertinent to Treatment of a Patient Based on the Identified Repetitive Portions
US20220300712A1 (en) Artificial intelligence-based question-answer natural language processing traces
US20190333612A1 (en) Identifying Repetitive Portions of Clinical Notes and Generating Summaries Pertinent to Treatment of a Patient Based on the Identified Repetitive Portions
US20200034732A1 (en) System and Method for Automated Analysis of Ground Truth Using Confidence Model to Prioritize Correction Options
US20190251473A1 (en) Cognitive System Virtual Corpus Training and Utilization
US10282066B2 (en) Dynamic threshold filtering for watched questions
US10565503B2 (en) Dynamic threshold filtering for watched questions
US9471877B1 (en) Health checking a question answering cognitive computing system built on a baseline of ground truth virtual checksum
US11354321B2 (en) Search results ranking based on a personal medical condition
US11243988B2 (en) Data curation on predictive data modelling platform
US11182552B2 (en) Routine evaluation of accuracy of a factoid pipeline and staleness of associated training data
US20210097406A1 (en) Identification of Clinical Inference Rules
Ekström Hagevall et al. Increasing Reproducibility Through Provenance, Transparency and Reusability in a Cloud-Native Application for Collaborative Machine Learning

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220527

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220725

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230711

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231010

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231227

R150 Certificate of patent or registration of utility model

Ref document number: 7413392

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150