JP7216021B2 - 機械学習モデルを迅速に構築し、管理し、共有するためのシステム及び方法 - Google Patents
機械学習モデルを迅速に構築し、管理し、共有するためのシステム及び方法 Download PDFInfo
- Publication number
- JP7216021B2 JP7216021B2 JP2019564084A JP2019564084A JP7216021B2 JP 7216021 B2 JP7216021 B2 JP 7216021B2 JP 2019564084 A JP2019564084 A JP 2019564084A JP 2019564084 A JP2019564084 A JP 2019564084A JP 7216021 B2 JP7216021 B2 JP 7216021B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- sampling
- model
- annotations
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/30—Creation or generation of source code
- G06F8/36—Software reuse
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/285—Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/772—Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
- G06V10/7784—Active pattern-learning, e.g. online learning of image or video features based on feedback from supervisors
- G06V10/7788—Active pattern-learning, e.g. online learning of image or video features based on feedback from supervisors the supervisor being a human, e.g. interactive learning with a human teacher
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
- G06V10/7796—Active pattern-learning, e.g. online learning of image or video features based on specific statistical tests
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Algebra (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
[関連出願の相互参照]
本出願は、2017年5月14日に出願された米国仮特許出願第62/505,936号の優先権及び利益を主張し、その全体が引用により本明細書に組み込まれている。
[背景技術]
[発明の概要]
Claims (102)
- 機械学習モデルのライフサイクルを管理する方法であって、
アノテーションなしデータのセットを受信することと、
前記アノテーションなしデータのサンプルのアノテーションを要求して、アノテーション付きデータのセットを生成することと、
前記アノテーション付きデータのセットに基づいて機械学習モデルを構築することと、
前記機械学習モデルをクライアントシステムに配備することであって、前記クライアントシステムにおいて本番アノテーションが生成される、前記配備することと、
生成された前記本番アノテーションを収集し、前記本番アノテーションを組み込んだ新たな機械学習モデルを生成することと、
前記アノテーション付きデータのセットに基づいて構築された前記機械学習モデル、または前記新たな機械学習モデルの一方を選択することと、を含み、
前記アノテーションなしデータのサンプルのアノテーションを要求することは、前記アノテーションなしデータのセットからサンプルを選択するための複数の選択可能なボタンをグラフィカルユーザインターフェース上に設けることを含み、前記複数の選択可能なボタンの各々は、互いに異なるサンプラの推奨に関連付けられている、前記方法。 - 適合率、再現率、平均適合率、受信者動作者特性スコア、またはFベータスコアを含む、前記機械学習モデルの1つまたは複数の品質尺度を報告すること、をさらに含む、請求項1に記載の方法。
- 前記機械学習モデルを第三者と共有すること、をさらに含む、請求項1に記載の方法。
- サンプルのアノテーションを要求することは、
ユーザ入力または自動サンプラ選択に基づいて、前記アノテーションなしデータのセットからサンプルを選択することを含む、請求項1に記載の方法。 - 前記ユーザ入力は、セマンティック検索、類似サンプルの選択、または前記アノテーションなしデータの視覚マップ上の選択のうちの1つまたは複数を含む、請求項4に記載の方法。
- 前記自動サンプラ選択は、進行過程内の複数のサンプラのうちの1つからのものである、請求項4に記載の方法。
- 前記複数のサンプラのそれぞれは、異なるサンプリングアルゴリズムを使用する、請求項6に記載の方法。
- 前記それぞれのサンプリングアルゴリズムは、密度サンプリングアルゴリズム、エントロピーサンプリングアルゴリズム、推定誤差低減サンプリングアルゴリズム、網羅的なサンプリングアルゴリズム、フラグ付き予測アルゴリズム、ハードネガティブマイニングサンプリングアルゴリズム、高信頼度サンプリングアルゴリズム、線形サンプリングアルゴリズム、マップ可視化サンプリングアルゴリズム、メタデータ検索サンプリングアルゴリズム、最小マージンサンプリングアルゴリズム、クエリバイコミッティサンプリングアルゴリズム、ランダムサンプリングアルゴリズム、レビューサンプリングアルゴリズム、検索サンプリングアルゴリズム、類似性サンプリングアルゴリズム、前記ユーザ入力がサンプルをスキップするものであったサンプルのサンプリングのタイプのアルゴリズム、層化サンプリングアルゴリズム、最も信頼性のあるサンプルのアルゴリズム、または最も不確実なサンプルのアルゴリズムから選択される、請求項7に記載の方法。
- 前記進行過程は、前記複数のサンプラのうちのサンプラ間で連続的に変更されることを含む、請求項7に記載の方法。
- 前記複数のサンプラの各サンプラは、前記進行過程における前または次のサンプラのいずれに移動するかを決定する結果の期待分布を有する、請求項9に記載の方法。
- モデル予測が誤っている所定数のサンプルアノテーションを受信すると、前記進行過程はサンプラ間で、前記進行過程における前のサンプラに変更される、請求項10に記載の方法。
- モデル予測が一致する所定数のサンプルアノテーションを受信すると、前記進行過程はサンプラ間で、前記進行過程における次のサンプラに変更される、請求項10に記載の方法。
- 前記機械学習モデルを構築することは、共有モデルを受信し、中間モデルの重みを前記共有モデルの重みに初期化し、異なる学習率で訓練することを含む、請求項1に記載の方法。
- 前記アノテーションなしデータのサンプルのアノテーションを要求することは、テストデータのセットの網羅的なアノテーションを要求することを含む、請求項1に記載の方法。
- 前記テストデータのセットの前記網羅的なアノテーションは、密度サンプリング、レベルセットツリー、またはランダムサンプリングのうちの1つまたは複数を含む遠距離教師あり学習によって実行される、請求項14に記載の方法。
- 前記グラフィカルユーザインターフェース上にデータ品質メトリック及びデータ数量メトリックを提示することをさらに含む、請求項1に記載の方法。
- 前記データ数量メトリックは、いくつかの訓練されたサンプル、いくつかの正例、いくつかの負例、またはサンプルのクラスについて訓練されたいくつかのサンプルのうちの1つまたは複数を含む、請求項16に記載の方法。
- 前記データ品質メトリックは、正解率、適合率、再現率、またはF1スコアのうちの1つまたは複数を含む、請求項16に記載の方法。
- グラフィカルユーザインターフェース上に、前記アノテーションなしデータのセットのアノテーションにわたる不一致を提示することをさらに含む、請求項1に記載の方法。
- 前記機械学習モデルを構築することは、前記機械学習モデルを確立するためのアルゴリズム及び損失関数を選択することを含む、請求項1に記載の方法。
- 前記アルゴリズムを選択することは、モデルタイプに基づく、請求項20に記載の方法。
- 前記アノテーションなしデータのセットからアノテーションが付けられたアノテーション付き訓練データのセットでモデルを複数回訓練し、実行にわたる品質メトリックの分散を測定することによって、収束をテストすること、をさらに含む、請求項20に記載の方法。
- 前記品質メトリックは学習曲線の傾きを含む、請求項22に記載の方法。
- 前記機械学習モデルは、所与のモデルタイプ及び前記アルゴリズムに対して選択されたデフォルトのハイパーパラメータを使用して訓練される、請求項20に記載の方法。
- 前記ハイパーパラメータは、ランダム選択、グリッド探索、またはベイズ推定法のうちの1つまたは複数を使用して選択される、請求項24に記載の方法。
- ランダムシード、アルゴリズム選択、損失関数、ハイパーパラメータ、データセット分割、データセットハッシュ、またはクラス重みのうちの1つまたは複数が、前記機械学習モデルに対して記憶される、請求項24に記載の方法。
- 前記機械学習モデルは、バージョン管理され、切り替えられ、またはロールバックされる、請求項1に記載の方法。
- データドリフトまたはコンセプトドリフトを介してモデル間の変化を監視すること、をさらに含む、請求項1に記載の方法。
- コンセプトドリフトは、前記アノテーション付きデータのセットと前記本番アノテーションとの間でいくつかの変化した予測を定量化することに基づいてモデルを訓練することにより計算される、請求項28に記載の方法。
- データドリフトは、前記アノテーション付きデータのセットと前記本番アノテーションとの間のコーパス統計及び/またはコーパス比較に基づいて測定される、請求項28に記載の方法。
- データドリフトまたはコンセプトドリフトを識別した場合に警告が生成される、請求項28に記載の方法。
- 前記データドリフトまたは前記コンセプトドリフトは、経時的なアノテーションなしデータに関するメトリック、または経時的なモデル予測に関するメトリックを含む、請求項31に記載の方法。
- 前記機械学習モデルを共有することは、特徴ハッシュ化、暗号ハッシュ化、またはランダムプロジェクションのうちの1つまたは複数を実行することを含む、請求項3に記載の方法。
- 前記機械学習モデルを共有することは、前記機械学習モデルの勾配更新を共有することを含む、請求項3に記載の方法。
- 前記勾配更新は、計算グラフのレイヤに加算される、請求項34に記載の方法。
- 前記機械学習モデルを共有することは、1つまたは複数のモデル資産を共有することを含む、請求項3に記載の方法。
- 前記1つまたは複数のモデル資産は、データセットで訓練された単語埋め込み、単語ベクトル、アノテーションのセット、キーワード及びフレーズのリスト、例文のリスト、言語モデル、辞書、ならびに訓練されたモデル、及びモデルアーキテクチャを含む、請求項36に記載の方法。
- 前記1つまたは複数のモデル資産は、個人を特定可能な情報がサニタイズされる、請求項37に記載の方法。
- 前記進行過程は、シードサンプラからハードネガティブサンプラ、層化サンプラ、不確実性サンプラへと進むことを含む、請求項6に記載の方法。
- サンプルのアノテーションを要求することは、アノテーションフィードバックのためにグラフィカルユーザインターフェース上にユーザに質問を提示することを含む、請求項1に記載の方法。
- 前記アノテーションなしデータのサンプルに対して1つまたは複数のアノテーションを予測することをさらに含む、請求項1に記載の方法。
- 前記1つまたは複数のアノテーションの前記予測は、前記アノテーションなしデータのサンプルのアノテーションを要求する前である、請求項41に記載の方法。
- 前記予測された1つまたは複数のアノテーションをサンプリングスコアに基づいて優先度キューに記憶することをさらに含む、請求項41に記載の方法。
- 前記サンプリングスコアは、前記予測された1つまたは複数のアノテーションの信頼度スコアである、請求項43に記載の方法。
- 前記予測された1つまたは複数のアノテーションを前記優先度キューに記憶する前に、前記サンプリングスコアが閾値サンプリングスコアより大きいか否かを判定することをさらに含む、請求項43に記載の方法。
- 前記閾値サンプリングスコア未満であると判定されたサンプリングスコアを有する予測を破棄することをさらに含む、請求項45に記載の方法。
- 前記優先度キューは、所定の最大数の予測を記憶する、請求項43に記載の方法。
- 前記予測を前記優先度キューに記憶する前に、前記優先度キューに記憶されたいくつかの予測が前記予測の所定の最大数未満であると判定することをさらに含む、請求項43に記載の方法。
- 前記予測を前記優先度キューに記憶する前に、前記サンプリングスコアが、前記優先度キュー内の少なくとも1つの以前に記憶された予測よりも大きいと判定することをさらに含む、請求項43に記載の方法。
- 最も低いサンプリングスコアを有する、前記優先度キュー内の以前に記憶された予測を破棄することをさらに含む、請求項43に記載の方法。
- 前記アノテーションなしデータのサンプルのアノテーションを要求することは、複数の優先度キューの中から前記優先度キューを選択することを含む、請求項43に記載の方法。
- 機械学習モデルのライフサイクルを管理するためのシステムであって、
プロセッサと、
前記プロセッサに結合され、コンピュータ可読命令を記憶する非一時的メモリデバイスであって、前記コンピュータ可読命令は、前記プロセッサより実行された場合に、前記システムに機能を実行させ、前記機能は、
アノテーションなしデータのセットを受信することと、
前記アノテーションなしデータのサンプルのアノテーションを要求して、アノテーション付きデータのセットを生成することと、
前記アノテーション付きデータのセットに基づいて機械学習モデルを構築することと、
前記機械学習モデルをクライアントシステムに配備することであって、前記クライアントシステムにおいて本番アノテーションが生成される、前記配備することと、
生成された前記本番アノテーションを収集し、前記本番アノテーションを組み込んだ新たな機械学習モデルを生成することと、
前記アノテーション付きデータのセットに基づいて構築された前記機械学習モデル、または前記新たな機械学習モデルの一方を選択することと、
を含み、
前記アノテーションなしデータのサンプルのアノテーションを要求することは、前記アノテーションなしデータのセットからサンプルを選択するための複数の選択可能なボタンをグラフィカルユーザインターフェース上に設けることを含み、前記複数の選択可能なボタンの各々は、互いに異なるサンプラの推奨に関連付けられている、前記非一時的メモリデバイスと、を備える、前記システム。 - 前記システムによって実行される前記機能は、
適合率、再現率、平均適合率、受信者動作者特性スコア、またはFベータスコアを含む、前記機械学習モデルの1つまたは複数の品質尺度を報告すること、をさらに含む、請求項52に記載のシステム。 - 前記システムによって実行される前記機能は、
前記機械学習モデルを第三者と共有すること、をさらに含む、請求項52に記載のシステム。 - サンプルのアノテーションを要求することは、
ユーザ入力または自動サンプラ選択に基づいて、前記アノテーションなしデータのセットからサンプルを選択すること、を含む、請求項52に記載のシステム。 - 前記ユーザ入力は、セマンティック検索、類似サンプルの選択、または前記アノテーションなしデータの視覚マップ上の選択のうちの1つまたは複数を含む、請求項55に記載のシステム。
- 前記自動サンプラ選択は、進行過程内の複数のサンプラのうちの1つからのものである、請求項55に記載のシステム。
- 前記複数のサンプラのそれぞれは、異なるサンプリングアルゴリズムを使用する、請求項57に記載のシステム。
- 前記それぞれのサンプリングアルゴリズムは、密度サンプリングアルゴリズム、エントロピーサンプリングアルゴリズム、推定誤差低減サンプリングアルゴリズム、網羅的なサンプリングアルゴリズム、フラグ付き予測アルゴリズム、ハードネガティブマイニングサンプリングアルゴリズム、高信頼度サンプリングアルゴリズム、線形サンプリングアルゴリズム、マップ可視化サンプリングアルゴリズム、メタデータ検索サンプリングアルゴリズム、最小マージンサンプリングアルゴリズム、クエリバイコミッティサンプリングアルゴリズム、ランダムサンプリングアルゴリズム、レビューサンプリングアルゴリズム、検索サンプリングアルゴリズム、類似性サンプリングアルゴリズム、前記ユーザ入力がサンプルをスキップするものであったサンプルのサンプリングのタイプのアルゴリズム、層化サンプリングアルゴリズム、最も信頼性のあるサンプルのアルゴリズム、または最も不確実なサンプルのアルゴリズムから選択される、請求項58に記載のシステム。
- 前記進行過程は、前記複数のサンプラのうちのサンプラ間で連続的に変更されることを含む、請求項58に記載のシステム。
- 前記複数のサンプラの各サンプラは、前記進行過程における前または次のサンプラのいずれに移動するかを決定する結果の期待分布を有する、請求項60に記載のシステム。
- モデル予測が誤っている所定数のサンプルアノテーションを受信すると、前記進行過程はサンプラ間で、前記進行過程における前のサンプラに変更される、請求項61に記載のシステム。
- モデル予測が一致する所定数のサンプルアノテーションを受信すると、前記進行過程はサンプラ間で、前記進行過程における次のサンプラに変更される、請求項61に記載のシステム。
- 前記機械学習モデルを構築することは、共有モデルを受信し、中間モデルの重みを前記共有モデルの重みに初期化し、異なる学習率で訓練することを含む、請求項52に記載のシステム。
- 前記アノテーションなしデータのサンプルのアノテーションを要求することは、テストデータのセットの網羅的なアノテーションを要求することを含む、請求項52に記載のシステム。
- 前記テストデータのセットの前記網羅的なアノテーションは、密度サンプリング、レベルセットツリー、またはランダムサンプリングのうちの1つまたは複数を含む遠距離教師あり学習によって実行される、請求項65に記載のシステム。
- 前記システムによって実行される前記機能は、前記グラフィカルユーザインターフェース上にデータ品質メトリック及びデータ数量メトリックを提示することをさらに含む、請求項52に記載のシステム。
- 前記データ数量メトリックは、いくつかの訓練されたサンプル、いくつかの正例、いくつかの負例、またはサンプルのクラスについて訓練されたいくつかのサンプルのうちの1つまたは複数を含む、請求項67に記載のシステム。
- 前記データ品質メトリックは、正解率、適合率、再現率、またはF1スコアのうちの1つまたは複数を含む、請求項67に記載のシステム。
- 前記システムによって実行される前記機能は、グラフィカルユーザインターフェース上に、前記アノテーションなしデータのセットのアノテーションにわたる不一致を提示することをさらに含む、請求項52に記載のシステム。
- 前記機械学習モデルを構築することは、前記機械学習モデルを確立するためのアルゴリズム及び損失関数を選択することを含む、請求項52に記載のシステム。
- 前記アルゴリズムを選択することは、モデルタイプに基づく、請求項71に記載のシステム。
- 前記システムによって実行される前記機能は、
前記アノテーションなしデータのセットからアノテーションが付けられたアノテーション付き訓練データのセットでモデルを複数回訓練し、実行にわたる品質メトリックの分散を測定することによって、収束をテストすること、をさらに含む、請求項71に記載のシステム。 - 前記品質メトリックは学習曲線の傾きを含む、請求項73に記載のシステム。
- 前記機械学習モデルは、所与のモデルタイプ及び前記アルゴリズムに対して選択されたデフォルトのハイパーパラメータを使用して訓練される、請求項71に記載のシステム。
- 前記ハイパーパラメータは、ランダム選択、グリッド探索、またはベイズ推定法のうちの1つまたは複数を使用して選択される、請求項75に記載のシステム。
- ランダムシード、アルゴリズム選択、損失関数、ハイパーパラメータ、データセット分割、データセットハッシュ、またはクラス重みのうちの1つまたは複数が、前記機械学習モデルに対して記憶される、請求項75記載のシステム。
- 前記機械学習モデルは、バージョン管理され、切り替えられ、またはロールバックされる、請求項52に記載のシステム。
- 前記システムによって実行される前記機能は、
データドリフトまたはコンセプトドリフトを介してモデル間の変化を監視すること、をさらに含む、請求項52に記載のシステム。 - コンセプトドリフトは、前記アノテーション付きデータのセットと前記本番アノテーションとの間でいくつかの変化した予測を定量化することに基づいてモデルを訓練することにより計算される、請求項79に記載のシステム。
- データドリフトは、前記アノテーション付きデータのセットと前記本番アノテーションとの間のコーパス統計及び/またはコーパス比較に基づいて測定される、請求項79に記載のシステム。
- データドリフトまたはコンセプトドリフトを識別した場合に警告が生成される、請求項79に記載のシステム。
- 前記データドリフトまたは前記コンセプトドリフトは、経時的なアノテーションなしデータに関するメトリック、または経時的なモデル予測に関するメトリックを含む、請求項82に記載のシステム。
- 前記機械学習モデルを共有することは、特徴ハッシュ化、暗号ハッシュ化、またはランダムプロジェクションのうちの1つまたは複数を実行することを含む、請求項54に記載のシステム。
- 前記機械学習モデルを共有することは、前記機械学習モデルの勾配更新を共有することを含む、請求項54に記載のシステム。
- 前記勾配更新は、計算グラフのレイヤに加算される、請求項85に記載のシステム。
- 前記機械学習モデルを共有することは、1つまたは複数のモデル資産を共有することを含む、請求項54に記載のシステム。
- 前記1つまたは複数のモデル資産は、データセットで訓練された単語埋め込み、単語ベクトル、アノテーションのセット、キーワード及びフレーズのリスト、例文のリスト、言語モデル、辞書、ならびに訓練されたモデル、及びモデルアーキテクチャを含む、請求項87に記載のシステム。
- 前記1つまたは複数のモデル資産は、個人を特定可能な情報がサニタイズされる、請求項88に記載のシステム。
- 前記進行過程は、シードサンプラからハードネガティブサンプラ、層化サンプラ、不確実性サンプラへと進むことを含む、請求項57に記載のシステム。
- サンプルのアノテーションを要求することは、アノテーションフィードバックのためにグラフィカルユーザインターフェース上にユーザに質問を提示することを含む、請求項53に記載のシステム。
- 前記アノテーションなしデータのサンプルに対して1つまたは複数のアノテーションを予測することをさらに含む、請求項52に記載のシステム。
- 前記1つまたは複数のアノテーションの前記予測は、前記アノテーションなしデータのサンプルのアノテーションを要求する前である、請求項92に記載のシステム。
- 前記システムによって実行される前記機能は、前記予測された1つまたは複数のアノテーションをサンプリングスコアに基づいて優先度キューに記憶することをさらに含む、請求項92に記載のシステム。
- 前記サンプリングスコアは、前記予測された1つまたは複数のアノテーションの信頼度スコアである、請求項94に記載のシステム。
- 前記システムによって実行される前記機能は、前記予測された1つまたは複数のアノテーションを前記優先度キューに記憶する前に、前記サンプリングスコアが閾値サンプリングスコアより大きいか否かを判定することをさらに含む、請求項94に記載のシステム。
- 前記システムによって実行される前記機能は、前記閾値サンプリングスコア未満であると判定されたサンプリングスコアを有する予測を破棄することをさらに含む、請求項96に記載のシステム。
- 前記優先度キューは、所定の最大数の予測を記憶する、請求項94に記載のシステム。
- 前記システムによって実行される前記機能は、前記予測を前記優先度キューに記憶する前に、前記優先度キューに記憶されたいくつかの予測が前記予測の所定の最大数未満であると判定することをさらに含む、請求項94に記載のシステム。
- 前記システムによって実行される前記機能は、前記予測を前記優先度キューに記憶する前に、前記サンプリングスコアが、前記優先度キュー内の少なくとも1つの以前に記憶された予測よりも大きいと判定することをさらに含む、請求項94に記載のシステム。
- 前記システムによって実行される前記機能は、最も低いサンプリングスコアを有する、前記優先度キュー内の以前に記憶された予測を破棄することをさらに含む、請求項94に記載のシステム。
- 前記アノテーションなしデータのサンプルのアノテーションを要求することは、複数の優先度キューの中から前記優先度キューを選択することを含む、請求項94に記載のシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023006402A JP2023052502A (ja) | 2017-05-14 | 2023-01-19 | 機械学習モデルを迅速に構築し、管理し、共有するためのシステム及び方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762505936P | 2017-05-14 | 2017-05-14 | |
US62/505,936 | 2017-05-14 | ||
PCT/US2018/032607 WO2018213205A1 (en) | 2017-05-14 | 2018-05-14 | Systems and methods for rapidly building, managing, and sharing machine learning models |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023006402A Division JP2023052502A (ja) | 2017-05-14 | 2023-01-19 | 機械学習モデルを迅速に構築し、管理し、共有するためのシステム及び方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020522055A JP2020522055A (ja) | 2020-07-27 |
JP2020522055A5 JP2020522055A5 (ja) | 2021-07-26 |
JP7216021B2 true JP7216021B2 (ja) | 2023-01-31 |
Family
ID=64274823
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019564084A Active JP7216021B2 (ja) | 2017-05-14 | 2018-05-14 | 機械学習モデルを迅速に構築し、管理し、共有するためのシステム及び方法 |
JP2023006402A Pending JP2023052502A (ja) | 2017-05-14 | 2023-01-19 | 機械学習モデルを迅速に構築し、管理し、共有するためのシステム及び方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023006402A Pending JP2023052502A (ja) | 2017-05-14 | 2023-01-19 | 機械学習モデルを迅速に構築し、管理し、共有するためのシステム及び方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US12106078B2 (ja) |
EP (1) | EP3625677A4 (ja) |
JP (2) | JP7216021B2 (ja) |
CN (1) | CN111095308A (ja) |
AU (1) | AU2018269941A1 (ja) |
CA (1) | CA3063738A1 (ja) |
WO (1) | WO2018213205A1 (ja) |
Families Citing this family (93)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11288595B2 (en) * | 2017-02-14 | 2022-03-29 | Groq, Inc. | Minimizing memory and processor consumption in creating machine learning models |
US11392133B2 (en) | 2017-06-06 | 2022-07-19 | Plusai, Inc. | Method and system for object centric stereo in autonomous driving vehicles |
US11573573B2 (en) | 2017-06-06 | 2023-02-07 | Plusai, Inc. | Method and system for distributed learning and adaptation in autonomous driving vehicles |
US11042155B2 (en) | 2017-06-06 | 2021-06-22 | Plusai Limited | Method and system for closed loop perception in autonomous driving vehicles |
CN110119507A (zh) * | 2018-02-05 | 2019-08-13 | 阿里巴巴集团控股有限公司 | 词向量生成方法、装置以及设备 |
US12099909B2 (en) | 2018-03-06 | 2024-09-24 | Tazi AI Systems, Inc. | Human understandable online machine learning system |
US11715042B1 (en) | 2018-04-20 | 2023-08-01 | Meta Platforms Technologies, Llc | Interpretability of deep reinforcement learning models in assistant systems |
US10782986B2 (en) | 2018-04-20 | 2020-09-22 | Facebook, Inc. | Assisting users with personalized and contextual communication content |
US11307880B2 (en) | 2018-04-20 | 2022-04-19 | Meta Platforms, Inc. | Assisting users with personalized and contextual communication content |
US11676220B2 (en) | 2018-04-20 | 2023-06-13 | Meta Platforms, Inc. | Processing multimodal user input for assistant systems |
US11886473B2 (en) | 2018-04-20 | 2024-01-30 | Meta Platforms, Inc. | Intent identification for agent matching by assistant systems |
US11487941B2 (en) * | 2018-05-21 | 2022-11-01 | State Street Corporation | Techniques for determining categorized text |
US11423330B2 (en) * | 2018-07-16 | 2022-08-23 | Invoca, Inc. | Performance score determiner for binary signal classifiers |
US11403465B2 (en) * | 2018-08-24 | 2022-08-02 | Royal Bank Of Canada | Systems and methods for report processing |
US11880396B2 (en) * | 2018-10-08 | 2024-01-23 | Arctic Alliance Europe Oy | Method and system to perform text-based search among plurality of documents |
US11074456B2 (en) * | 2018-11-14 | 2021-07-27 | Disney Enterprises, Inc. | Guided training for automation of content annotation |
US11651235B2 (en) * | 2018-11-28 | 2023-05-16 | International Business Machines Corporation | Generating a candidate set of entities from a training set |
RU2702980C1 (ru) * | 2018-12-14 | 2019-10-14 | Самсунг Электроникс Ко., Лтд. | Распределённое обучение моделей машинного обучения для персонализации |
CN109740752B (zh) * | 2018-12-29 | 2022-01-04 | 北京市商汤科技开发有限公司 | 深度模型训练方法及装置、电子设备及存储介质 |
US11790239B2 (en) * | 2018-12-29 | 2023-10-17 | International Business Machines Corporation | Deep learning testing |
US11030086B2 (en) * | 2019-02-15 | 2021-06-08 | Tencent America LLC | Machine learning model full life cycle management framework |
US10984246B2 (en) | 2019-03-13 | 2021-04-20 | Google Llc | Gating model for video analysis |
CN111797126B (zh) * | 2019-04-08 | 2024-04-02 | 阿里巴巴集团控股有限公司 | 数据的处理方法、装置及设备 |
US20200334553A1 (en) * | 2019-04-22 | 2020-10-22 | Electronics And Telecommunications Research Institute | Apparatus and method for predicting error of annotation |
US11475358B2 (en) | 2019-07-31 | 2022-10-18 | GE Precision Healthcare LLC | Annotation pipeline for machine learning algorithm training and optimization |
US11409772B2 (en) * | 2019-08-05 | 2022-08-09 | International Business Machines Corporation | Active learning for data matching |
US11663275B2 (en) | 2019-08-05 | 2023-05-30 | International Business Machines Corporation | Method for dynamic data blocking in a database system |
WO2021040588A1 (en) * | 2019-08-28 | 2021-03-04 | Telefonaktiebolaget Lm Ericsson (Publ) | Network nodes and methods for handling machine learning models in a communications network |
US11080352B2 (en) | 2019-09-20 | 2021-08-03 | International Business Machines Corporation | Systems and methods for maintaining data privacy in a shared detection model system |
US11216268B2 (en) | 2019-09-20 | 2022-01-04 | International Business Machines Corporation | Systems and methods for updating detection models and maintaining data privacy |
US11188320B2 (en) | 2019-09-20 | 2021-11-30 | International Business Machines Corporation | Systems and methods for updating detection models and maintaining data privacy |
US11157776B2 (en) * | 2019-09-20 | 2021-10-26 | International Business Machines Corporation | Systems and methods for maintaining data privacy in a shared detection model system |
US11003825B1 (en) * | 2019-09-26 | 2021-05-11 | Cadence Design Systems, Inc. | System, method, and computer program product for optimization in an electronic design |
US11288515B2 (en) * | 2019-11-11 | 2022-03-29 | Samsung Electronics Co., Ltd. | Methods and systems for real-time data reduction |
CN110956018B (zh) * | 2019-11-22 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 文本处理模型的训练方法、文本处理方法、装置及存储介质 |
EP3828725A1 (en) * | 2019-11-27 | 2021-06-02 | Ubimax GmbH | Method of performing a process using artificial intelligence |
EP3828734A1 (en) * | 2019-11-27 | 2021-06-02 | Ubimax GmbH | Method of performing a data collection procedure for a process which uses artificial intelligence |
US11429813B1 (en) * | 2019-11-27 | 2022-08-30 | Amazon Technologies, Inc. | Automated model selection for network-based image recognition service |
TWI732370B (zh) | 2019-12-04 | 2021-07-01 | 財團法人工業技術研究院 | 神經網路模型的訓練裝置和訓練方法 |
US11294759B2 (en) | 2019-12-05 | 2022-04-05 | International Business Machines Corporation | Detection of failure conditions and restoration of deployed models in a computing environment |
WO2021118173A1 (en) | 2019-12-09 | 2021-06-17 | Samsung Electronics Co., Ltd. | Electronic device and controlling method of electronic device |
US11610152B2 (en) * | 2019-12-27 | 2023-03-21 | GE Precision Healthcare LLC | Machine learning model development and optimization process that ensures performance validation and data sufficiency for regulatory approval |
US11704602B2 (en) * | 2020-01-02 | 2023-07-18 | Intuit Inc. | Method for serving parameter efficient NLP models through adaptive architectures |
US11715151B2 (en) * | 2020-01-31 | 2023-08-01 | Walmart Apollo, Llc | Systems and methods for retraining of machine learned systems |
US12099997B1 (en) | 2020-01-31 | 2024-09-24 | Steven Mark Hoffberg | Tokenized fungible liabilities |
US20230067026A1 (en) * | 2020-02-17 | 2023-03-02 | DataRobot, Inc. | Automated data analytics methods for non-tabular data, and related systems and apparatus |
US11494588B2 (en) | 2020-03-06 | 2022-11-08 | International Business Machines Corporation | Ground truth generation for image segmentation |
US11556852B2 (en) | 2020-03-06 | 2023-01-17 | International Business Machines Corporation | Efficient ground truth annotation |
US11495038B2 (en) | 2020-03-06 | 2022-11-08 | International Business Machines Corporation | Digital image processing |
US11361146B2 (en) | 2020-03-06 | 2022-06-14 | International Business Machines Corporation | Memory-efficient document processing |
US11755951B2 (en) * | 2020-05-15 | 2023-09-12 | Vmware, Inc. | Machine learning with an intelligent continuous learning service in a big data environment |
US11294946B2 (en) * | 2020-05-15 | 2022-04-05 | Tata Consultancy Services Limited | Methods and systems for generating textual summary from tabular data |
CN111612158B (zh) * | 2020-05-22 | 2024-03-01 | 云知声智能科技股份有限公司 | 模型部署方法、装置、设备和存储介质 |
US12118297B2 (en) * | 2020-06-15 | 2024-10-15 | Canon Kabushiki Kaisha | Information processing apparatus |
US20210406758A1 (en) * | 2020-06-24 | 2021-12-30 | Surveymonkey Inc. | Double-barreled question predictor and correction |
US11461292B2 (en) * | 2020-07-01 | 2022-10-04 | International Business Machines Corporation | Quick data exploration |
CN113971422A (zh) * | 2020-07-06 | 2022-01-25 | 华为技术有限公司 | 样本数据标注系统、方法以及相关设备 |
US20220024032A1 (en) * | 2020-07-21 | 2022-01-27 | UiPath, Inc. | Artificial intelligence / machine learning model drift detection and correction for robotic process automation |
US20220027578A1 (en) * | 2020-07-27 | 2022-01-27 | Nvidia Corporation | Text string summarization |
JP2022028338A (ja) * | 2020-08-03 | 2022-02-16 | オムロン株式会社 | 予測システム、情報処理装置および情報処理プログラム |
KR20220023639A (ko) | 2020-08-21 | 2022-03-02 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
CN112101952B (zh) * | 2020-09-27 | 2024-05-10 | 中国建设银行股份有限公司 | 银行可疑交易评估、数据处理方法及装置 |
US12086548B2 (en) | 2020-09-30 | 2024-09-10 | Amazon Technologies, Inc. | Event extraction from documents with co-reference |
US20220100967A1 (en) * | 2020-09-30 | 2022-03-31 | Amazon Technologies, Inc. | Lifecycle management for customized natural language processing |
US10930272B1 (en) * | 2020-10-15 | 2021-02-23 | Drift.com, Inc. | Event-based semantic search and retrieval |
EP3989101A1 (en) * | 2020-10-20 | 2022-04-27 | Dassault Systèmes | Improving unsupervised embedding methods for similarity based industrial component model requesting systems |
KR20220063361A (ko) * | 2020-11-10 | 2022-05-17 | 이인텔리전스 주식회사 | 어노테이션 관리 장치 및 방법 |
US11769318B2 (en) | 2020-11-23 | 2023-09-26 | Argo AI, LLC | Systems and methods for intelligent selection of data for building a machine learning model |
FR3118245B1 (fr) * | 2020-12-18 | 2024-04-05 | Airbus Defence & Space Sas | Procede et systeme d’apprentissage actif et d’analyse automatique de documents |
US11657591B2 (en) * | 2021-01-15 | 2023-05-23 | Argo AI, LLC | Autonomous vehicle system for intelligent on-board selection of data for building a remote machine learning model |
US20220237234A1 (en) * | 2021-01-22 | 2022-07-28 | Microsoft Technology Licensing, Llc | Document sampling using prefetching and precomputing |
US11711257B1 (en) * | 2021-03-03 | 2023-07-25 | Wells Fargo Bank, N.A. | Systems and methods for automating incident severity classification |
CN113033631A (zh) * | 2021-03-09 | 2021-06-25 | 北京百度网讯科技有限公司 | 一种模型的增量训练方法和装置 |
WO2022217122A1 (en) * | 2021-04-08 | 2022-10-13 | Nec Laboratories America, Inc. | Learning ordinal representations for deep reinforcement learning based object localization |
EP4099142A4 (en) | 2021-04-19 | 2023-07-05 | Samsung Electronics Co., Ltd. | ELECTRONIC DEVICE AND METHOD OF OPERATION |
KR102343043B1 (ko) * | 2021-05-13 | 2021-12-24 | 주식회사 인피닉 | 실시간 작업 변경 사항에 대응하는 어노테이션 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 |
US20220398524A1 (en) * | 2021-06-11 | 2022-12-15 | Aktify, Inc. | Consumer interaction agent management platform |
KR102310600B1 (ko) * | 2021-06-17 | 2021-10-13 | 주식회사 인피닉 | 빅데이터 기반의 인공지능 학습용 데이터 추출 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 |
CN113449878B (zh) * | 2021-06-24 | 2024-04-02 | 西安交通大学 | 数据分布式的增量学习方法、系统、设备及存储介质 |
US20230004857A1 (en) * | 2021-06-30 | 2023-01-05 | Armis Security Ltd. | Techniques for validating machine learning models |
US11797425B2 (en) * | 2021-07-09 | 2023-10-24 | International Business Machines Corporation | Data augmentation based on failure cases |
CN113568739B (zh) * | 2021-07-12 | 2024-06-18 | 北京淇瑀信息科技有限公司 | 用户资源额度分配方法、装置及电子设备 |
WO2023006224A1 (en) * | 2021-07-30 | 2023-02-02 | NEC Laboratories Europe GmbH | Entity matching with joint learning of blocking and matching |
CN113704667B (zh) * | 2021-08-31 | 2023-06-27 | 北京百炼智能科技有限公司 | 一种招标公告的自动提取处理方法和装置 |
CN113610191B (zh) * | 2021-09-07 | 2023-08-29 | 中原动力智能机器人有限公司 | 垃圾分类模型建模方法、垃圾分类方法 |
US20230140160A1 (en) * | 2021-11-04 | 2023-05-04 | International Business Machines Corporation | Compliance risk management for data in computing systems |
EP4212973A1 (en) * | 2022-01-13 | 2023-07-19 | Siemens Aktiengesellschaft | Method and system for quality inspection |
CN114428677B (zh) * | 2022-01-28 | 2023-09-12 | 北京百度网讯科技有限公司 | 任务处理方法、处理装置、电子设备及存储介质 |
WO2023149880A1 (en) * | 2022-02-03 | 2023-08-10 | Google Llc | Continuous training of machine learning models on changing data |
EP4274297A1 (en) | 2022-05-05 | 2023-11-08 | Continental Automotive Technologies GmbH | Base station, user equipment, network and method for machine learning related communication |
CN114820074A (zh) * | 2022-05-16 | 2022-07-29 | 郑州简信软件科技有限公司 | 基于机器学习的目标用户群体预测模型构建方法 |
WO2024004127A1 (ja) * | 2022-06-30 | 2024-01-04 | 株式会社マーケットヴィジョン | 情報処理システム |
CN116665656B (zh) * | 2023-07-24 | 2023-10-10 | 美智纵横科技有限责任公司 | 语音识别模型的生成方法、语音识别方法、装置及芯片 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080126556A1 (en) | 2006-09-13 | 2008-05-29 | International Business Machines Corporation | System and method for classifying data streams using high-order models |
CN101425152A (zh) | 2008-12-12 | 2009-05-06 | 湖南大学 | 一种基于变学习率神经网络的fir滤波器的设计方法 |
JP2013538543A (ja) | 2010-07-16 | 2013-10-10 | ザ トラスティーズ オブ コロンビア ユニバーシティ イン ザ シティー オブ ニューヨーク | 送電網用の機械学習 |
US20140380286A1 (en) | 2013-06-20 | 2014-12-25 | Six Five Labs, Inc. | Dynamically evolving cognitive architecture system based on training by third-party developers |
JP2016042322A (ja) | 2014-08-19 | 2016-03-31 | 日本電気株式会社 | データ分析装置、分析方法とそのプログラム |
WO2016140701A1 (en) | 2015-03-02 | 2016-09-09 | Northrop Grumman Systems Corporation | Digital object library management system for machine learning applications |
US20170032281A1 (en) | 2015-07-29 | 2017-02-02 | Illinois Tool Works Inc. | System and Method to Facilitate Welding Software as a Service |
US20170032279A1 (en) | 2015-07-31 | 2017-02-02 | Acuity Solutions Corporation | System and method for in-situ classifier retraining for malware identification and model heterogeneity |
CN106560848A (zh) | 2016-10-09 | 2017-04-12 | 辽宁工程技术大学 | 模拟生物双向认知能力的新型神经网络模型及训练方法 |
WO2017073000A1 (ja) | 2015-10-29 | 2017-05-04 | 株式会社Preferred Networks | 情報処理装置及び情報処理方法 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7996219B2 (en) * | 2005-03-21 | 2011-08-09 | At&T Intellectual Property Ii, L.P. | Apparatus and method for model adaptation for spoken language understanding |
KR100750886B1 (ko) * | 2005-12-09 | 2007-08-22 | 한국전자통신연구원 | 학습 데이터 구축 장치 및 방법 |
US8250408B1 (en) | 2007-04-02 | 2012-08-21 | Hewlett-Packard Development Company, L.P. | System diagnosis |
TWI489394B (zh) | 2008-03-03 | 2015-06-21 | Videoiq Inc | 用於追蹤、索引及搜尋之物件匹配 |
US8386401B2 (en) * | 2008-09-10 | 2013-02-26 | Digital Infuzion, Inc. | Machine learning methods and systems for identifying patterns in data using a plurality of learning machines wherein the learning machine that optimizes a performance function is selected |
US20100257167A1 (en) | 2009-04-01 | 2010-10-07 | Microsoft Corporation | Learning to rank using query-dependent loss functions |
US9111218B1 (en) | 2011-12-27 | 2015-08-18 | Google Inc. | Method and system for remediating topic drift in near-real-time classification of customer feedback |
US9058317B1 (en) | 2012-11-01 | 2015-06-16 | Digital Reasoning Systems, Inc. | System and method for machine learning management |
WO2014075108A2 (en) * | 2012-11-09 | 2014-05-15 | The Trustees Of Columbia University In The City Of New York | Forecasting system using machine learning and ensemble methods |
US9122681B2 (en) * | 2013-03-15 | 2015-09-01 | Gordon Villy Cormack | Systems and methods for classifying electronic information using advanced active learning techniques |
GB2525804B (en) * | 2013-03-15 | 2020-08-05 | Veracyte Inc | Methods and compositions for classification of samples |
ITTO20130588A1 (it) | 2013-07-12 | 2015-01-13 | Fond Istituto Italiano Di Tecnologia | Sistema per la penetrazione non distruttiva di un substrato |
US10262272B2 (en) * | 2014-12-07 | 2019-04-16 | Microsoft Technology Licensing, Llc | Active machine learning |
US20160358099A1 (en) * | 2015-06-04 | 2016-12-08 | The Boeing Company | Advanced analytical infrastructure for machine learning |
US20170011077A1 (en) * | 2015-07-07 | 2017-01-12 | Socrata, Inc. | Scalable annotation architecture |
US20170143284A1 (en) | 2015-11-25 | 2017-05-25 | Carestream Health, Inc. | Method to detect a retained surgical object |
US20180032901A1 (en) * | 2016-07-27 | 2018-02-01 | International Business Machines Corporation | Greedy Active Learning for Reducing User Interaction |
-
2018
- 2018-05-14 AU AU2018269941A patent/AU2018269941A1/en not_active Abandoned
- 2018-05-14 EP EP18803094.4A patent/EP3625677A4/en active Pending
- 2018-05-14 CA CA3063738A patent/CA3063738A1/en active Pending
- 2018-05-14 US US16/613,301 patent/US12106078B2/en active Active
- 2018-05-14 CN CN201880046890.6A patent/CN111095308A/zh active Pending
- 2018-05-14 JP JP2019564084A patent/JP7216021B2/ja active Active
- 2018-05-14 WO PCT/US2018/032607 patent/WO2018213205A1/en unknown
-
2023
- 2023-01-19 JP JP2023006402A patent/JP2023052502A/ja active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080126556A1 (en) | 2006-09-13 | 2008-05-29 | International Business Machines Corporation | System and method for classifying data streams using high-order models |
CN101425152A (zh) | 2008-12-12 | 2009-05-06 | 湖南大学 | 一种基于变学习率神经网络的fir滤波器的设计方法 |
JP2013538543A (ja) | 2010-07-16 | 2013-10-10 | ザ トラスティーズ オブ コロンビア ユニバーシティ イン ザ シティー オブ ニューヨーク | 送電網用の機械学習 |
US20140380286A1 (en) | 2013-06-20 | 2014-12-25 | Six Five Labs, Inc. | Dynamically evolving cognitive architecture system based on training by third-party developers |
JP2016042322A (ja) | 2014-08-19 | 2016-03-31 | 日本電気株式会社 | データ分析装置、分析方法とそのプログラム |
WO2016140701A1 (en) | 2015-03-02 | 2016-09-09 | Northrop Grumman Systems Corporation | Digital object library management system for machine learning applications |
US20170032281A1 (en) | 2015-07-29 | 2017-02-02 | Illinois Tool Works Inc. | System and Method to Facilitate Welding Software as a Service |
US20170032279A1 (en) | 2015-07-31 | 2017-02-02 | Acuity Solutions Corporation | System and method for in-situ classifier retraining for malware identification and model heterogeneity |
WO2017073000A1 (ja) | 2015-10-29 | 2017-05-04 | 株式会社Preferred Networks | 情報処理装置及び情報処理方法 |
CN106560848A (zh) | 2016-10-09 | 2017-04-12 | 辽宁工程技术大学 | 模拟生物双向认知能力的新型神经网络模型及训练方法 |
Non-Patent Citations (1)
Title |
---|
宮崎 亮輔,Wikipediaを用いた遠距離教師あり学習による専門用語抽出,言語処理学会 第21回年次大会発表論文集,2015年03月17日,pp.87-90,[検索日:2022.05.09],インターネット<URL:https://www.anlp.jp/proceedings/annual_meeting/2015/pdf_dir/P1-22.pdf> |
Also Published As
Publication number | Publication date |
---|---|
US12106078B2 (en) | 2024-10-01 |
CN111095308A (zh) | 2020-05-01 |
WO2018213205A1 (en) | 2018-11-22 |
US20200202171A1 (en) | 2020-06-25 |
EP3625677A1 (en) | 2020-03-25 |
JP2020522055A (ja) | 2020-07-27 |
AU2018269941A1 (en) | 2019-12-05 |
EP3625677A4 (en) | 2021-04-21 |
JP2023052502A (ja) | 2023-04-11 |
CA3063738A1 (en) | 2018-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7216021B2 (ja) | 機械学習モデルを迅速に構築し、管理し、共有するためのシステム及び方法 | |
US11080340B2 (en) | Systems and methods for classifying electronic information using advanced active learning techniques | |
US11243993B2 (en) | Document relationship analysis system | |
EP3020006B1 (en) | Interactive segment extraction in computer-human interactive learning | |
US20190164084A1 (en) | Method of and system for generating prediction quality parameter for a prediction model executed in a machine learning algorithm | |
AlQahtani | Product sentiment analysis for amazon reviews | |
US11256991B2 (en) | Method of and server for converting a categorical feature value into a numeric representation thereof | |
US11620453B2 (en) | System and method for artificial intelligence driven document analysis, including searching, indexing, comparing or associating datasets based on learned representations | |
US11995519B2 (en) | Method of and server for converting categorical feature value into a numeric representation thereof and for generating a split value for the categorical feature | |
Rafail et al. | Natural language processing | |
US20230030341A1 (en) | Dynamic user interface and machine learning tools for generating digital content and multivariate testing recommendations | |
US11868313B1 (en) | Apparatus and method for generating an article | |
US20230273964A1 (en) | Apparatus and method for evaluating search engine performance, and dashboard | |
US20230376858A1 (en) | Classification-based machine learning frameworks trained using partitioned training sets | |
Swadia | A study of text mining framework for automated classification of software requirements in enterprise systems | |
US20240004913A1 (en) | Long text clustering method based on introducing external label information | |
RU2817726C2 (ru) | Способ и сервер для определения обучающего набора для обучения алгоритма машинного обучения (MLA) | |
US20240184570A1 (en) | Code review comment generation via retrieval-augmented transformer with chunk cross- attention | |
Anupriya et al. | Audio Based Sentiment Prediction Model | |
Ait Benali et al. | Arabic named entity recognition in social media based on BiLSTM-CRF using an attention mechanism | |
Klingfors | Data mining on Data sets of Products | |
Tesfay | Using various Natural Language Processing Techniques to Automate Information Retrieval | |
Zhu | Improving Software Defect Assignment Accuracy With the LSTM and Rule Engine Model | |
Tohalino et al. | Using citation networks to evaluate the impact of text length on keyword extraction | |
TANVIR | Design and Implementation of an Efficient Web Crawling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210513 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210513 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220506 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220517 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220810 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7216021 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |