JP2023044728A

JP2023044728A - 機械学習のための方法、システムおよびコンピュータプログラム製品（埋め込みを用いるインクリメンタル機械学習）

Info

Publication number: JP2023044728A
Application number: JP2022147755A
Authority: JP
Inventors: チャン、チャオミン; Chao-Min Chang; クオ、ボーユー; Bo-Yu Kuo; チェン、ユジン; Yu-Jin Chen; タン、ユーチー; yu-chi Tang
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2021-09-20
Filing date: 2022-09-16
Publication date: 2023-03-31
Also published as: US20230092969A1

Abstract

【課題】埋め込みを用いるインクリメンタル機械学習のための方法、システムおよびコンピュータプログラム製品を提供する。
【解決手段】新しい出力を包含する結果を生成するための機械学習方法であって、機械学習モデルは、複数の候補出力の中から候補出力を決定するために訓練される。複数の候補出力に関連する第１埋め込みは、訓練された機械学習モデルの中間レイヤによって、訓練データの第１セットから生成される。新しい候補出力に関連する第２埋め込みは、訓練された機械学習モデルの中間レイヤによって、訓練データの第２セットから生成される。訓練された機械学習モデルの中間レイヤによって、第３埋め込みが入力データに対して決定される。複数の候補出力のグループと、第１および第２埋め込みに対する第３埋め込みの距離に基づく新しい候補出力とから、入力データに対する結果としての候補出力が予測される。
【選択図】図６

Description

本発明の実施形態は、機械学習に関し、より具体的には、機械学習モデルを再訓練することなく、埋め込みを用いる新しい側面（例えば、新しい出力、新しいクラスなど）のインクリメンタル機械学習に関する。

分類は機械学習の分野であり、異なる入力をある数のグループまたはクラスに分類するために使用される。分類はコンピュータビジョン、自然言語処理、およびデータ解析など様々な分野で広く使用されている。一般に、分類モデルは、予測するクラスの数に等しい数のノードを含む固定サイズの出力レイヤで生成される（例えば、出力レイヤの各ノードが予測されるクラスに対応する）。

分類モデルに新しいクラスを追加したい場合、新しいクラスを含めるために、分類モデルを再設定、リセット、再訓練する必要がある。そのため、クラスの数が頻繁に変わる場合は、常に分類モデルを再設定、リセット、再訓練する必要がある。

埋め込みを用いるインクリメンタル機械学習のための方法、システムおよびコンピュータプログラム製品を提供する。

本発明の一実施形態によれば、新しい出力を包含する結果を生成するための機械学習のためのシステムは、少なくとも１つのプロセッサを含む。機械学習モデルは、複数の候補出力の中から候補出力を決定するために訓練される。複数の候補出力に関連する第１埋め込みは、訓練データの第１セットから生成される。第１埋め込みは、訓練された機械学習モデルの中間レイヤから生成される。新しい候補出力に関連する第２埋め込みは、訓練データの第２セットから生成される。第２埋め込みは、訓練された機械学習モデルの中間レイヤから生成される。第３埋め込みは、訓練された機械学習モデルの中間レイヤによって、入力データに対して決定される。複数の候補出力のグループと、第１および第２埋め込みに対する第３埋め込みの距離に基づく新しい候補出力とから、入力データに対する結果としての候補出力が予測される。本発明の実施形態は、上記と実質的に同じ方法で新しい出力を包含する結果を生成するための機械学習のための方法およびコンピュータプログラム製品をさらに含む。

本発明の実施形態は、新しい候補出力を、その候補出力の訓練データに基づいて、機械学習モデルを再訓練させることなく学習することができるため、コンピューティングおよびメモリ資源を節約し、機械学習の速度を大幅に向上させることが可能である。

本発明の実施形態は、機械学習モデルとして、複数の候補出力がクラスを含み、新しい候補出力が新しいクラスを含む分類モデルを採用してよい。これにより、分類モデルを再訓練させることなく、新しいクラスを追加して分類することを可能にするため、特にクラスが頻繁に変化する場合のコンピューティング性能を向上させることができる。

本発明の実施形態は、さらに、第１および第２埋め込みから、第３埋め込みに最も近い複数の埋め込みを決定し、決定された複数の埋め込みに関連する候補出力に基づいて、結果としての候補出力を決定することによって、結果としての候補出力を予測してもよい。埋め込みと予測は、機械学習モデルを再訓練することなく、新しい候補出力を追加するために使用される。埋め込み（およびその間の距離）の使用は、さらに、再訓練を回避するための予測の十分な精度を提供する。

本発明の実施形態は、決定された複数の埋め込みの大多数に関連する候補出力に基づいて、結果としての候補出力を決定することもできる。大多数を使用することにより、機械学習モデルの再訓練を回避するための予測の精度を高めるために適切な（そして最も近い）候補出力が選択されることが保証される。

本発明の実施形態は、第１および第２埋め込みに基づき、訓練スコアをさらに決定し、訓練スコアが閾値を満たさないことに応答して、機械学習モデルを再訓練することができる。これにより、埋め込みの性能を監視して、埋め込みの性能を向上させるために埋め込みの再訓練を選択的に始動させることができる。したがって、機械学習モデルを訓練する頻度を大幅に減少させることができ、コンピュータの性能を向上させることができる。

本発明の実施形態はさらに、第１埋め込みが、それぞれが対応する候補出力に関連する複数の第１クラスタを形成し、第２埋め込みが、新しい候補出力に関連する第２クラスタを形成するようにしてもよい。この場合、訓練スコアは、第２クラスタ内の第２埋め込みとの間の距離と、第２埋め込みそれぞれと複数の第１クラスタとの間の距離とに基づいて決定されてよい。これにより、新しい候補出力に対する埋め込みによって形成されるクラスタの品質に基づいて、埋め込みの性能を監視することができる。新しい候補出力に対するクラスタが、新しい候補出力を複数の候補出力から区別するのに不十分である場合、埋め込みの再訓練が行われ、埋め込みの性能が向上される。したがって、機械学習モデルの訓練頻度を大幅に減少させることができ、コンピュータの性能を向上させることができる。

本発明の実施形態において、機械学習モデルは、複数の候補出力のための入力レイヤ、中間レイヤ、および出力レイヤを含むニューラルネットワークを含み、第１、第２、および第３埋め込みは、埋め込みモデルによって生成される。埋め込みモデルは、出力レイヤを含まない訓練された機械学習モデルのニューラルネットワークを含む。これにより、ニューラルネットワークが構造的に変更され、訓練されたニューラルネットワークに基づいて埋め込みを生成する埋め込みモデルが形成される。埋め込みは、ニューラルネットワークを再訓練することなく、新しい候補出力を学習させることを可能にし、機械学習の速度を大幅に向上させることができる。

また、本発明の実施形態は、機械学習モデルを再訓練することなく、結果としての候補出力を予測するためのグループに新しい候補出力を追加してもよい。これにより、コンピューティング資源およびメモリ資源を節約し、機械学習の速度を大幅に向上させることができる。

一般に、様々な図中の同様の参照数字は、同様のコンポーネントを指定するために利用される。

本発明の実施形態による、例示的なコンピューティング環境を示す図である。本発明の実施形態による、例示的なコンピューティング装置を示すブロック図である。本発明の実施形態による、機械学習システムのブロック図である。本発明の実施形態による、図３の機械学習システムの埋め込みモデルによって生成された埋め込みを使用して、新しいクラスの追加を示すグラフ図である。本発明の実施形態による、図３の機械学習システムの予測モデルによるクラスの予測を示すグラフ図である。本発明の実施形態による、インクリメンタル機械学習による新しい側面の学習の態様を示す手続き的フローチャートである。本発明の実施形態による、図３の機械学習システムに対して、新しいクラスを追加する例を示す図である。本発明の実施形態による、図７の例についてクラスの予測を示すグラフ図である。

本発明の実施形態は、機械学習モデルを再訓練することなく、埋め込みを用いて新しい側面（例えば、新しい出力、新しいクラスなど）のインクリメンタル機械学習に向けられている。例えば、機械学習の分類モデルに対して新しいクラスを追加する場合、新しいクラスを含めるために、分類モデルを再構成し、リセットし、再訓練することが必要となる。したがって、クラスの数が頻繁に変化する場合、分類モデルは常に再構成、リセット、および再訓練され、それによって、大きなコンピューティングおよびメモリ資源が消費されることになる。しかしながら、本発明の実施形態は、新しい側面（例えば、新しい出力、新しいクラスなど）が追加されたときに、インクリメンタル機械学習（例えば、深層学習モデル、分類モデルなど）のために埋め込みを使用する。したがって、機械学習モデルを再訓練することなく、新しい側面を学習するために、インクリメンタル機械学習を実行することができる。

反復的な再訓練を防ぐために、本発明の実施形態は、データに対する埋め込みを生成する埋め込みモデルと、パターン認識を用いて、埋め込みモデルからの埋め込みに基づいて、新たに追加された側面（例えば、新しい出力、新しいクラスなど）を予測する予測モデルとを含む。この手法により、新しい側面が追加された際に、埋め込みモデルの再訓練を行うことを防ぐことができる。

本発明の一実施形態によれば、新しい出力を包含する結果を生成するための機械学習のためのシステムは、少なくとも１つのプロセッサを備える。機械学習モデルは、複数の候補出力の中から候補出力を決定するために訓練される。複数の候補出力に関連する第１埋め込みは、訓練データの第１セットから生成される。第１埋め込みは、訓練された機械学習モデルの中間レイヤから生成される。新しい候補出力に関連する第２埋め込みは、訓練データの第２セットから生成される。第２埋め込みは、訓練された機械学習モデルの中間レイヤから生成される。第３埋め込みは、訓練された機械学習モデルの中間レイヤによって、入力データに対して決定される。複数の候補出力のグループと、第１および第２埋め込みに対する第３埋め込みの距離に基づく新しい候補出力とから、入力データに対する結果としての候補出力が予測される。本発明の実施形態は、上記と実質的に同じ方法で新しい出力を包含する結果を生成するための機械学習のための方法およびコンピュータプログラム製品をさらに含む。

本発明の実施形態は、新しい候補出力を、その候補出力の訓練データに基づいて、機械学習モデルを再訓練させることなく学習させることが可能なため、コンピューティングおよびメモリ資源を節約し、機械学習の速度を大幅に向上させることが可能である。

本発明の実施形態は、機械学習モデルとして、複数の候補出力がクラスを含み、新しい候補出力が新しいクラスを含む分類モデルを採用してもよい。これにより、分類モデルを再訓練させることなく、分類のための新しいクラスを追加するため、特にクラスが頻繁に変化する場合の性能を向上させるという利点がある。

本発明の実施形態はまた、第１埋め込みが、それぞれが対応する候補出力に関連する複数の第１クラスタを形成し、第２埋め込みが、新しい候補出力に関連する第２クラスタを形成するようにしてもよい。この場合、訓練スコアは、第２クラスタ内の第２埋め込みとの間の距離と、第２埋め込みそれぞれと複数の第１クラスタとの間の距離とに基づいて決定されてもよい。これにより、新しい候補出力に対する埋め込みによって形成されるクラスタの品質に基づいて、埋め込みの性能を監視することができる。新しい候補出力に対するクラスタが、新しい候補出力を複数の候補出力から区別するのに不十分である場合、埋め込みの再訓練が行われ、埋め込みの性能が向上される。したがって、機械学習モデルの訓練頻度を大幅に減少させることができ、コンピュータの性能を向上させることができる。

本発明の実施形態において、機械学習モデルは、複数の候補出力のための入力レイヤ、中間レイヤ、出力レイヤを含むニューラルネットワークを含み、第１、第２、および第３埋め込みは、埋め込みモデルによって生成される。埋め込みモデルは、出力レイヤを含まない訓練された機械学習モデルのニューラルネットワークを含む。これにより、ニューラルネットワークが構造的に変更され、訓練されたニューラルネットワークに基づいて埋め込みを生成する埋め込みモデルが形成される。埋め込みは、ニューラルネットワークを再訓練することなく、新しい候補出力を学習させることを可能にし、機械学習の速度を大幅に向上させることができる。

また、本発明の実施形態は、機械学習モデルを再訓練することなく、結果としての候補出力を予測するためのグループに新しい候補出力を追加してもよい。これにより、コンピューティングおよびメモリ資源を節約し、機械学習の速度を大幅に向上させることができる。

本発明の実施形態で使用するための例示的な環境１００が図１に示されている。具体的には、環境は、１つまたは複数のサーバシステム１１０と、１つまたは複数のクライアントまたはエンドユーザシステム１１４とを含む。サーバシステム１１０およびクライアントシステム１１４は、互いに遠隔であってよく、ネットワーク１１２を介して通信する。ネットワークは、任意の数の任意の適切な通信媒体（例えば、ワイドエリアネットワーク（ＷＡＮ）、ローカルエリアネットワーク（ＬＡＮ）、インターネット、イントラネットなど）によって実施されてもよい。あるいは、サーバシステム１１０およびクライアントシステム１１４は、互いにローカルであってよく、任意の適切なローカル通信媒体（例えば、ローカルエリアネットワーク（ＬＡＮ）、ハードワイヤ、無線リンク、イントラネットなど）を介して通信する。

クライアントシステム１１４は、所望のタスク（例えば、分類など）のための出力を生成するために機械学習モデルを管理及び利用するために、ユーザがサーバシステム１１０に情報（例えば、機械学習モデル用の入力、機械学習モデル用の新しい側面（例えば、新しい出力、新しいクラスなど）、訓練データなど）を提出することを可能にする。サーバシステムは、以下に説明するように、様々なタスク（例えば、分類など）のために機械学習モデルを訓練し、利用し、維持するための機械学習モジュール１１６を含む。データベースシステム１１８は、タスクのための様々な情報（例えば、機械学習モデル及び対応する構成及びパラメータ、訓練データ、結果など）を格納してもよい。データベースシステムは、任意の従来型または他のデータベースまたは記憶装置によって実装されてもよく、サーバシステム１１０およびクライアントシステム１１４に対してローカルであっても、遠隔であってもよく、任意の適切な通信媒体（例えば、ローカルエリアネットワーク（ＬＡＮ）、広域ネットワーク（ＷＡＮ）、インターネット、ハードワイヤ、無線リンク、イントラネットなど）を介して通信してもよい。クライアントシステムは、グラフィカルユーザー（例えば、ＧＵＩなど）又は他のインタフェース（例えば、コマンドラインプロンプト、メニュー画面など）を提示して、ユーザから情報（例えば、機械学習モデル用の入力、機械学習モデル用の新しい側面（例えば、新しい出力、新しいクラスなど）、訓練データなど）を募る、インタフェースモジュール１２０又はブラウザを含んでもよく、結果（例えば、分類、機械学習モデルからの出力）を含むレポートを提供してもよい。

サーバシステム１１０及びクライアントシステム１１４は、好ましくは、ディスプレイ又はモニタ、ベース、任意の入力装置（例えば、キーボード、マウス又は他の入力装置）、及び任意のソフトウェア（例えば、従来型又は他のサーバ／通信ソフトウェア、従来型又は他のブラウザソフトウェア、本発明の実施形態の機械学習モジュール１１６及びインタフェースモジュール１２０等）を備えた任意の従来型又は他のコンピュータシステムによって実装されてもよい。ベースは、少なくとも１つのハードウェアプロセッサ１１５（例えば、マイクロプロセッサ、コントローラ、中央処理装置（ＣＰＵ）など）、１つまたは複数のメモリ１３５もしくは、内部もしくは外部のネットワークインタフェースまたはこれらの組み合わせ、もしくは、通信装置１２５（例えば、モデム、ネットワークカードなど）を含んでもよい。

代替的に、１つまたは複数のクライアントシステム１１４は、スタンドアロンユニットとして動作する場合、所望のタスク（例えば、分類など）のための出力を生成するために機械学習モデルを管理及び利用することができる。スタンドアロン動作モードでは、クライアントシステムは、データ（例えば、機械学習モデル用の入力、機械学習モデル用の新しい側面（例えば、新しい出力、新しいクラスなど）、訓練データ、機械学習モデル及び対応する構成及びパラメータ、訓練データ、結果など）を格納するか又はアクセスし、以下に説明するように、様々なタスク（例えば分類など）用に機械学習モデルを訓練、利用及び維持するために機械学習モジュール１１６を含んでいる。インタフェースモジュール１２０は、グラフィカルユーザー（例えば、ＧＵＩなど）または他のインタフェース（例えば、コマンドラインプロンプト、メニュー画面など）を生成して、対応するユーザから情報（例えば、機械学習モデル用の入力、機械学習モデル用の新しい側面（例えば、新しい出力、新しいクラスなど）、訓練データなど）を募り、結果（例えば、分類、機械学習モデルからの出力など）を含むレポートを提供してもよい。

機械学習モジュール１１６及びインタフェースモジュール１２０は、以下に説明する本発明の実施形態の様々な機能を実行するための１つまたは複数のモジュール又はユニットを含んでもよい。様々なモジュール（例えば、機械学習モジュール１１６、インタフェースモジュール１２０など）は、任意の量のソフトウェアもしくは、ハードウェアモジュールもしくはユニットまたはその組み合わせの任意の組み合わせによって実装されてもよく、プロセッサ１１５による実行のためにサーバシステムもしくはクライアントシステムまたはその両方のメモリ１３５内に存在してもよい。

ここで図２を参照すると、コンピューティング環境１００のコンピューティング装置２１０の一例（例えば、サーバシステム１１０、クライアントシステム１１４、データベースシステム１１８、もしくは他のコンピューティング装置またはその組み合わせを実装する）の概略図が示されている。コンピューティング装置は、コンピューティング環境１００に適したコンピューティング装置の一例に過ぎず、本明細書に記載される本発明の実施形態の使用範囲または機能性に関して、いかなる制限を示唆することを意図するものではない。それにかかわらず、コンピューティング装置２１０は、本明細書に規定される機能性のいずれかを実施することもしくは実行することが可能である。

コンピューティング装置２１０において、多数の他の汎用または専用のコンピューティングシステム環境または構成で動作可能なコンピュータシステム２１２が存在する。コンピュータシステム２１２と共に使用するのに適している可能性のあるコンピューティングシステム、環境、もしくは構成またはその組み合わせの例としては、パーソナルコンピュータシステム、サーバコンピュータシステム、シンクライアント、シッククライアント、ハンドヘルドまたはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、セットトップボックス、プログラマブル家電、ネットワークＰＣ、ミニコンピュータシステム、メインフレームコンピュータシステム、ならびに上記システムまたはデバイスのいずれかを含む分散クラウドコンピューティング環境などがあるが、それだけに限られる訳ではない。

コンピュータシステム２１２は、プログラムモジュールなどのコンピュータシステム実行可能命令がコンピュータシステムによって実行されるという一般的な文脈で説明されてもよい。一般に、プログラムモジュールは、特定のタスクを実行する、または特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、ロジック、データ構造などを含んでもよい。

図２に示すように、コンピュータシステム２１２は、汎用コンピューティング装置の形態で示されている。コンピュータシステム２１２のコンポーネントは、１つまたは複数のプロセッサまたは処理ユニット１１５、システムメモリ１３５、およびシステムメモリ１３５を含む様々なシステムコンポーネントをプロセッサ１１５に結合するバス２１８を含むことができるが、これらに限定されるものではない。

バス２１８は、メモリバスまたはメモリコントローラ、周辺バス、加速グラフィックスポート、および様々なバスアーキテクチャのいずれかを使用するプロセッサまたはローカルバスを含む、いくつかのタイプのバス構造のうちのいずれか１つまたは複数を表す。例として、限定するものではないが、そのようなアーキテクチャには、業界標準アーキテクチャ（ＩＳＡ）バス、マイクロチャネルアーキテクチャ（ＭＣＡ）バス、拡張ＩＳＡ（ＥＩＳＡ）バス、ビデオ電子標準協会（ＶＥＳＡ）ローカルバス、および周辺コンポーネント相互接続（ＰＣＩ）バスが含まれる。

コンピュータシステム２１２は、典型的には、様々なコンピュータシステム可読媒体を含む。そのような媒体は、コンピュータシステム２１２によってアクセス可能な任意の利用可能な媒体であってよく、揮発性媒体と不揮発性媒体、取り外し可能媒体と取り外し不可能媒体の両方が含まれる。

システムメモリ１３５は、ランダムアクセスメモリ（ＲＡＭ）２３０もしくはキャッシュメモリ２３２またはその両方などの揮発性メモリの形態のコンピュータシステム可読媒体を含むことができる。コンピュータシステム２１２は、他の取り外し可能／取り外し不可能な、揮発性／不揮発性のコンピュータシステム記憶媒体をさらに含むことができる。例としてのみ、ストレージシステム２３４は、取り外し不可能、不揮発性磁気媒体（図示せず、典型的には「ハードドライブ」と呼ばれる）からの読み取りおよび書き込みのために提供されることができる。図示しないが、取り外し可能、不揮発性磁気ディスク（例えば、「フロッピーディスク」）から読み取りおよび書き込みのための磁気ディスクドライブ、およびＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭまたは他の光学媒体などの取り外し可能、不揮発性光ディスクからの読み取りや書き込みのための光ディスクドライブが提供されることができる。そのような例では、それぞれは、１つまたは複数のデータ媒体インタフェースによってバス２１８に接続することができる。以下でさらに描写および説明するように、メモリ１３５は、本発明の実施形態の機能を実行するように構成されたプログラムモジュールのセット（例えば、少なくとも１つ）を有する少なくとも１つのプログラム製品を含むことができる。

プログラムモジュール２４２（例えば、機械学習モジュール１１６、インタフェースモジュール１２０など）のセット（少なくとも１つ）を有するプログラム／ユーティリティ２４０は、例として、限定ではなく、オペレーティングシステム、１つまたは複数のアプリケーションプログラム、他のプログラムモジュール、及びプログラムデータと同様にメモリ１３５に格納されてもよい。オペレーティングシステム、１つまたは複数のアプリケーションプログラム、他のプログラムモジュール、及びプログラムデータの各々、又はそれらの何らかの組み合わせは、ネットワーク環境の実装を含んでもよい。プログラムモジュール２４２は、一般に、本明細書に記載される本発明の実施形態の機能もしくは方法論またはその両方を実施する。

コンピュータシステム２１２は、キーボード、ポインティングデバイス、ディスプレイ２２４などの１つまたは複数の外部装置２１４、ユーザがコンピュータシステム２１２と対話することを可能にする１つまたは複数の装置、もしくはコンピュータシステム２１２が１つまたは複数の他のコンピュータ装置と通信することを可能にする任意の装置（例えば、ネットワークカード、モデムなど）またはこれらの組み合わせと通信することもできる。そのような通信は、入力／出力（Ｉ／Ｏ）インタフェース２２２を介して発生することができる。また、コンピュータシステム２１２は、ネットワークアダプタ１２５を介して、ローカルエリアネットワーク（ＬＡＮ）、一般的なワイドエリアネットワーク（ＷＡＮ）、もしくは公衆ネットワーク（例えば、インターネット）またはこれらの組み合わせなどの１つまたは複数のネットワークと通信することができる。描かれているように、ネットワークアダプタ１２５は、バス２１８を介してコンピュータシステム２１２の他のコンポーネントと通信する。図示されていないが、他のハードウェアもしくはソフトウェアコンポーネントまたはその組み合わせがコンピュータシステム２１２と共に使用され得ることを理解されたい。例としては、マイクロコード、デバイスドライバ、冗長処理装置、外部ディスクドライブアレイ、ＲＡＩＤシステム、テープドライブ、及びデータアーカイブストレージシステム等が挙げられるが、これらに限定されるものではない。

従来の機械学習分類モデルは、データを量または数の異なるクラスに分類するように訓練されることがある。例として、分類モデルは、訓練セットが各クラスについて１万個のデータアイテムを含む（又は、１００クラス×１万個のデータアイテム＝１００万個の全データアイテム）、１００個の異なるクラスの間でデータを分類するように訓練されてもよい。分類モデルには、クラスに各々対応する１００個のノードを持つ出力レイヤが含まれる。

訓練された分類モデルに追加クラスを追加する場合、１０１個のクラスに１０１個のノードを有する出力レイヤを持つ新しい分類モデルが必要になる。また、新しい分類モデルは、１００個のクラスの初期訓練セットと新しいクラス（１０１個のクラス×１万個のデータアイテム＝合計１０１万個のデータアイテム）の追加訓練セット（１０万個のデータアイテム）を用いて、１０１個のクラスの訓練を行う必要がある。したがって、クラスの数が変わると、分類モデルを再構成して再訓練する必要があり（例えば、１００万個のデータアイテムを超える訓練セットを用いて）、これには大きなコンピューティング資源とメモリ資源が消費されることになる。

したがって、本発明の実施形態は、新しい側面（例えば、新しい出力、新しいクラスなど）が追加されたときに、（例えば、深層学習モデル、分類モデルなどの）インクリメンタル機械学習のための埋め込みを使用する。機械学習モデルを再訓練することなく、新しい側面に対してインクリメンタル機械学習を行うようにしてもよい。上記の例の場合、本発明の実施形態に係る機械学習システムの埋め込みモデルは、最初に１００個のクラスについて訓練され、埋め込みを生成するように修正される。新しいクラスを追加する場合、新しいクラスの訓練セット（例えば、１万個のデータアイテム）を埋め込みモデルに適用して、新しいクラスを定義する埋め込みを生成し、機械学習システムの予測モデルが新しいクラスを出力として予測することを可能にする。このように、１０１個のクラスの訓練セットを用いて埋め込みモデルを再構成、再訓練することなく、新しいクラスを追加することにより、コンピューティングおよびメモリ資源を節約し、機械学習の速度を大幅に向上させることができる。さらに、本発明の実施形態は、頻繁に変化するクラスの処理に関して、柔軟性およびスケーラビリティを導入する。

本発明の実施形態における、機械学習システムを図３に示す。特に、機械学習システム３００は、入力データを受信し、複数の候補出力の中から１つまたは複数を示す出力を生成する。一例として、機械学習システムは、オブジェクト（例えば、画像、テキストなど）に係る入力データを１つまたは複数のクラス、グループ、又はカテゴリに分類する分類器であってよい。

機械学習システム３００は、埋め込みモデル３１０と予測モデル３４０を含む。埋め込みモデル３１０は、機械学習システムへの入力データを受け取り、入力データの各データアイテムに対する埋め込みを生成する。予測モデルは、埋め込みモデル３１０からの埋め込みにパターン認識を適用し、埋め込みに対応するデータアイテムの予測候補出力（例えば、クラスなど）を出力として生成する。

埋め込みモデル３１０は、埋め込みを生成するための機械学習モデル３２０を含む。基本的に、データアイテムは、複数の次元に対応する数値要素を有するベクトルを含む埋め込みによって表現されることができる。類似の特徴又は特性を有するデータアイテムは、類似の埋め込み又はベクトル表現を有する。一例として、機械学習モデル３２０は、埋め込みを生成するためにニューラルネットワークによって実装されてもよい。ニューラルネットワークは、入力レイヤ３２２、中間およびは隠れレイヤ３２４、３２６、および出力レイヤ３２８を含む。各レイヤは、１つまたは複数のニューロンまたはノード３２９を含み、入力レイヤのニューロンは、入力データ（例えば、オブジェクトに係るデータ）を受け取り、重み値と関連付けられる場合がある。中間および出力レイヤのニューロンは、先行するレイヤの１つまたは複数のニューロンに接続され、先行するレイヤの接続されたニューロンの出力を入力として受信する。各接続は重み値と関連付けられ、各ニューロンはそのニューロンへの入力の重み付き結合に基づく出力を生成する。ニューロンの出力は、特定のタイプのニューラルネットワーク（例えば、リカレントタイプのニューラルネットワークなど）のバイアス値にさらに基づくことがある。

重み（及びバイアス）値は、様々な訓練技術に基づいて調整されてもよい。例えば、訓練セットのデータアイテムを入力とし、対応する既知の結果を出力として訓練を行い、ニューラルネットワークが既知の結果を生成しようとし、出力からの誤差（例えば、生成された出力と既知の出力との差）を用いて、重み（及びバイアス）値を（例えば、誤差逆伝播法や他の訓練技術を介して）調整してもよい。ニューラルネットワークの出力レイヤは、好ましくは、各候補出力（例えば、クラスなど）に対するニューロン３２９を含み、対応する入力データに対する候補出力を示す。一例として、出力レイヤニューロンは、特定の候補出力（例えば、クラスなど）または特定の候補出力の識別子を示すことができる。さらに、出力レイヤニューロンは、関連する候補出力（例えば、クラスなど）が入力データに対する結果である確率を示してもよい。最も高い確率に関連付けられた候補出力（例えば、クラスなど）は、好ましくは、入力データに対して選択される。しかしながら、機械学習モデル３２０は、任意の種類の機械学習モデル（例えば、フィードフォワード、リカレント、畳み込み、又は他のニューラルネットワーク等）の任意の量を含んでもよい。さらに、ニューラルネットワークは、任意の数量のニューロン又はノードを有する任意の数量のレイヤを含んでもよい。

ニューラルネットワーク３２０は、候補出力（例えば、クラスなど）の初期セットに対する訓練セットで最初に訓練される。訓練されると、出力レイヤ３２８は、ニューラルネットワークから除去され（例えば、埋め込みモデル３１０を形成するため、又は埋め込みモデルとして機能するため）、先行する中間レイヤ３２６は、埋め込みを生成する埋め込みレイヤとして機能する。埋め込みの要素又は次元は、埋め込みレイヤにおけるニューロンの数に対応する（例えば、埋め込みレイヤの各ニューロンは、埋め込みの要素又は次元に値を提供する）。しかしながら、埋め込みは、任意の所望の特徴（例えば、画像特徴、テキスト特徴など）に係る要素又は次元の任意の数量を含んでもよい。

新しい候補出力（例えば、クラスなど）を追加する場合、埋め込みモデル３１０は、新しい候補出力のための訓練データ３５０を提供され、予測モデル３４０が、対応する入力データに対して新しい候補出力を予測することを可能にする新しい候補出力を表し定義する埋め込みを生成する。このように、新しい候補出力（例えば、クラスなど）を追加するために、埋め込みモデルの再訓練を行わずに、新しい候補出力のための訓練セットを埋め込みモデルに適用し、それによって、コンピューティング及びメモリ資源を節約し、機械学習の速度を大幅に増加させる。

図４は、埋め込みの次元によって定義される空間内のデータアイテムの一例を示す図である。データアイテム４０５は、埋め込み空間内でグループ化又はクラスタ化され、それによって、候補出力（例えば、クラスなど）に対応するクラスタが形成される。例えば、クラスタ４１０はクラス１に関連付けられ、クラスタ４２０はクラス２に関連付けられ、クラスタ４３０はクラス３に関連付けられ、クラスタ４４０はクラス４に関連付けられている（例えば、図４で見た場合）。クラスタ内のデータアイテム４０５は、そのクラスタに関連付けられたクラスに割り当てられる（例えば、クラスタ４１０内のデータアイテムはクラス１に、クラスタ４２０内のデータアイテムはクラス２に、クラスタ４３０内のデータアイテムはクラス３に、クラスタ４４０内のデータアイテムはクラス４に割り当てられる）。これらのクラスは、機械学習モデル３２０（出力レイヤ３２８を有する）が埋め込みを提供するために訓練されるクラスの初期セットを表すことができる。

埋め込みモデルが新しいクラスのための訓練データと共に使用されるとき、結果としての埋め込みは、新しいクラス（例えば、図４で見られるようなクラス５）に関連する新しいクラスタ４５０を形成する。クラスタ４１０、４２０、４３０、４４０、および４５０は、データアイテムに対する候補出力（例えば、クラスなど）を予測するために予測モデル３４０によって使用される。

図３に戻って、データアイテムに対する埋め込みモデル３１０から生成された埋め込みは、予測モデル３４０に提供され、データアイテムに対する予測された候補出力（例えば、クラスなど）を生成する。予測モデルは、パターン認識技術（例えば、ｋ近傍法（ｋＮＮ）など）を使用して、候補出力（例えば、クラスなど）を予測する。

図５は、データアイテムとクラスタ４１０、４２０、４３０、４４０、および４５０との埋め込みに基づいて、データアイテムの候補出力（例えば、クラスなど）を予測する予測モデル３４０の一例を示す図である。例として、データアイテム４６０（例えば、図５において「Ｘ」として表される）は、埋め込みモデル３１０によって生成されたデータアイテムの埋め込みに基づいて、クラスタ４１０、４２０、４３０、４４０、および４５０の間の埋め込み空間内に示される。適切なクラスタ（したがって、候補出力（例えば、クラスなど））を予測するために、パターン認識技術が使用される。例えば、埋め込み空間におけるデータアイテム４６０の最近傍を決定するために、ｋ近傍法（ｋＮＮ）技術が適用されてもよい。この技術は、データアイテム４６０とクラスタ４１０、４２０、４３０、４４０、および４５０内の他の点との間の距離を決定し、データアイテム４６０の候補出力（例えば、クラスなど）を予測するために、決定された距離に基づいて、埋め込み空間内に存在するｋ近傍法（又はｋ最接近点）を識別してもよい。予測された候補出力（例えば、クラスなど）は、近傍法の大多数を有するクラスタであってもよい。距離は、様々な技術（例えば、ユークリッド距離、マンハッタン距離、ハミング距離など）に基づき決定されてもよい。

３つの近傍法を使用する場合（ｋ＝３）、データアイテム４６０の３つの近傍法は、クラスタ４２０（クラス２）内の第１データアイテム、クラスタ４２０（クラス２）内の第２データアイテム、およびクラスタ４３０（クラス３）内の第３データアイテムであってよい。予測される候補出力（例えば、クラスなど）は、近傍法の大多数を有するクラスタから決定されてもよい。この場合、近傍法の大多数がクラスタ４２０にあるため（例えば、３つの近傍法データアイテムのうち２つ）、予測された候補出力（例えば、クラスなど）は、クラスタ４２０（またはクラス２）に関連するクラスである。ｋ近傍法は、任意の所望の数の近傍法で適用されてもよく（例えば、ｋは任意の適切な値であってもよい）、ここで、任意の適切な技術が、結果としてのクラスタを決定するために使用されてもよい（例えば、大多数、近傍法への距離、など）。

本発明の実施形態による、インクリメンタル機械学習によって（例えば、機械学習モジュール１１６とサーバシステム１１０もしくはクライアントシステム１１４またはこれらの組み合わせを介して）新しい側面を学習する態様は、図６に示されている。特に、埋め込みモデル３１０（図３）は、動作６１０において、候補出力（例えば、クラス、カテゴリ、結果など）の初期セットに対する訓練セットを用いて生成される。訓練データのセットは、データアイテム及び対応する既知の結果（例えば、データアイテム及びデータアイテムが属する既知のクラスなど）を含む。埋め込みモデルは、好ましくは、入力レイヤ３２２、中間または隠れレイヤ３２４、３２６、及び出力レイヤ３２８（例えば、図３について上述したような）を含むニューラルネットワークから派生する機械学習モデルを含む。ニューラルネットワークの出力レイヤは、好ましくは、各候補出力に対するニューロン３２９を含み、対応する入力データに対する候補出力を示す。ニューラルネットワーク（出力レイヤ３２８を含む）は、出力レイヤ３２８から対応する候補出力を生成するために、候補出力の初期セットに対する訓練セットで最初に訓練される。訓練されると、出力レイヤ３２８はニューラルネットワークから除去され、ニューラルネットワークの残りの部分（例えば、入力レイヤ３２２及び中間レイヤ３２４、３２６）は、中間レイヤ３２６が埋め込みを生成するための埋め込みレイヤとして機能する埋め込みモデルを形成する。埋め込みの要素又は次元は、中間レイヤ３２６におけるニューロンの数に対応する（例えば、埋め込みレイヤの各ニューロンは、埋め込みの要素又は次元に値を提供する）。しかしながら、埋め込みは、ニューラルネットワークの任意の中間レイヤまたは他のレイヤが埋め込みを提供し得る、任意の量の次元を含んでもよい。

訓練された埋め込みモデル３１０が生成されると、動作６２０において、訓練データのセットのデータアイテムに対する埋め込みを生成するために、訓練データのセットが埋め込みモデルに適用される。動作６３０において、訓練セットのデータアイテムの各埋め込みは、対応する既知の候補出力と関連付けられ（又はラベル付けされ）、（例えば、データベースシステム１１８に）格納される。格納された埋め込みは、予測モデル３４０のための対応する候補出力（例えば、クラスなど）を定義する。しかしながら、候補出力を定義する埋め込みを生成するために、同じ又は異なる訓練セットが使用されてもよい。

動作６３５において、決定されたように、新しい候補出力（例えば、クラス、カテゴリ、結果など）が追加される場合、埋め込みモデル３１０（図３）には、動作６４０で新しい候補出力を表す埋め込みを生成するために、新しい候補出力に対する訓練データのセットが提供される。新しい候補出力のための訓練データのセットは、新しい候補出力に対応するデータアイテム（例えば、データアイテムと新しい候補出力など）を含む。新しい候補出力のための訓練セットのデータアイテムの各埋め込みは、新しい候補出力と関連付けられ（又はラベル付けられ）、（例えば、データベースシステム１１８に）格納される。このように、新しい候補出力を追加するために、埋め込みモデル３１０が新しい候補出力のための訓練セットから新しい候補出力を定義する埋め込みを生成するインクリメンタル機械学習が実行される。これにより、埋め込みモデルが（新しい候補出力と以前の候補出力を包含する大きな訓練セット上で）再訓練されることを回避し、それにより、コンピューティング及びメモリ資源を節約し、新しい候補出力が追加されたときに機械学習の速度を大幅に向上させることができる。

訓練スコアは、動作６４２において、新しい候補出力に対する訓練セットから埋め込みモデル３１０によって生成された埋め込みに基づいて決定され、インクリメンタル機械学習の充足度を決定する。訓練スコアは、新しい候補出力に対する埋め込みによって形成されるクラスタの品質の尺度から派生されてもよい。一例として、他のクラスタに関連する自身のクラスタへのオブジェクトの類似性を測定するシルエット法を使用して、以下の式に基づいて、新しい候補出力に対する埋め込みのスコアを決定してもよい。
スコア（ｉ）＝（ｂ（ｉ）－ａ（ｉ））／ｍａｘ｛ａ（ｉ），ｂ（ｉ）｝
ここで、ｉは新しい候補出力に対する埋め込みを表し、ａ（ｉ）は新しい候補出力に対するクラスタ内の他の埋め込みに対するクラスタ内距離、ｂ（ｉ）は新しい候補出力に対するクラスタ内の埋め込みと他の候補出力に対するクラスタ内の埋め込みとのクラスタ間距離、ｍａｘは最大関数（例えば、ａ（ｉ）とｂ（ｉ）の大きい値を提供する）である。

例えば、クラスタ間距離ａ（ｉ）は、新しい候補出力に対するクラスタ内の埋め込みと他の埋め込みとの間の平均距離であってもよい。クラスタ間距離ｂ（ｉ）は、他の候補出力のクラスタのための平均距離の最小値であってもよい。他の候補出力のクラスタに対する平均距離は、新しい候補出力のクラスタ内の埋め込みと、他の候補出力のクラスタ内の各埋め込みとの間の距離の平均値である。距離は、様々な技術（例えば、ユークリッド距離、マンハッタン距離、ハミング距離など）に基づき決定されてもよい。訓練スコアは、新しい候補出力に対する埋め込みのスコアの組み合わせであってよく、例えば、新しい候補出力に対する埋め込みのスコアの平均値であってよい。

さらなる例として、埋め込み空間は、点１Ａと点１Ｂを持つクラス１、点２Ａを持つクラス２、点３Ａ、点３Ｂ、点３Ｃを持つ新しいクラスを含むことができる。新しいクラス内の点の間の距離は、点３Ａと点３Ｂの間が２、点３Ａと点３Ｃの間が４となることを含む。この場合、点３Ａのクラスタ内距離ａ（ｉ）は、新しいクラス内の他の点（３Ｂと３Ｃ）への距離の平均、または（（距離３Ａから３Ｂ）＋（距離３Ａから３Ｃ））／２＝（２＋４）／２＝３となる。点３Ａと他のクラスタ内の点との間の距離は、点３Ａとクラス１の点１Ａとの距離が１２、点３Ａとクラス１の点１Ｂとの距離が１０、点３Ａとクラス２の点２Ａとの距離が１２であってよい。点３Ａのクラスタ間距離ｂ（ｉ）は、点３Ａとそのクラスタ内の点との間の各クラスタの平均距離の最小値、またはｍｉｎ（クラス１では、（１２＋１０）／２＝１１、クラス２では、１２／１＝１２）＝１１）となる。点３Ａのスコアは、（ｂ（ｉ）－ａ（ｉ））／ｍａｘ｛ａ（ｉ），ｂ（ｉ）｝＝（１１－３）／１１＝０．７２となる。新しいクラスの訓練スコアは、点３Ａ、点３Ｂ、点３Ｃの平均、つまり（スコア３Ａ＋スコア３Ｂ＋スコア３Ｃ）／３となる。

動作６４５において、決定されるように、訓練スコアが閾値を超えないとき、新しい候補出力に対する埋め込みは、埋め込みモデルの再構成及び再訓練なしに候補出力を追加することを可能にするのに不十分である。言い換えれば、埋め込みは、新しい候補出力を他の候補出力から十分に区別しない。したがって、埋め込みモデル３１０は、動作６１０において、以前の候補出力のための訓練セットと新しい候補出力のための訓練セットとを含む訓練セットに基づいて、上述と実質的に同じ方法で生成される（例えば、新しい候補出力に対応するニューロンを有する出力レイヤを有する機械学習モデル３２０（又はニューラルネットワーク）から開始される）。

訓練スコアが閾値を超えた場合、新しい候補出力に対する埋め込みは、埋め込みモデルの再構成や再訓練なしに候補出力を追加するのに十分である。言い換えれば、埋め込みが他の候補出力と十分に区別される。埋め込みモデルの再訓練なしに、新しい候補出力を（埋め込みを用いたインクリメンタル機械学習により）機械学習システムに追加できるため、機械学習の速度向上とコンピューティング資源やメモリ資源の節約ができる。したがって、動作６４５において、決定されたように、インクリメンタル機械学習が十分である場合、または動作６３５において、新しい候補出力が存在しないと決定された場合、処理すべきデータが動作６５０において、埋め込みモデル３１０に提供され、そのデータに対する埋め込みが生成される。

データアイテムに対する埋め込みモデル３１０から生成された埋め込みは、埋め込み空間に形成された候補出力に対する訓練セットのデータアイテムの埋め込みのクラスタに基づいて、動作６６０において、データアイテムに対する結果としての予測された候補出力を生成するために予測モデル３４０に提供される。予測モデルは、パターン認識技術（例えば、ｋ近傍法（ｋＮＮ）など）を用いて、候補出力を予測する。例えば、埋め込み空間におけるデータアイテムの近傍法を決定するために、ｋ近傍法（ｋＮＮ）技術が適用されてもよい。この技術は、データアイテムとクラスタ内の点（任意の新しい候補出力を含む候補出力を表す）との間の距離を決定し、決定された距離に基づいて、埋め込み空間内に存在するｋ近傍法（またはｋ最接近点）を特定してもよい。近傍法は、データアイテムに対する結果としての候補出力（例えば、クラス、カテゴリ、結果など）を予測するために使用される。予測された候補出力は、近傍法の大多数を有するクラスタであってもよい。距離は、様々な技術（例えば、ユークリッド距離、マンハッタン距離、ハミング距離など）に基づいて決定されてもよい。ｋ近傍法技術は、任意の所望の数の近傍法で適用されてもよく（例えば、ｋは任意の適切な値であってもよい）、ここで、任意の適切な技術が、結果としてのクラスタを決定するために使用されてもよい（例えば、大多数、近傍法の距離など）。追加の候補出力は、上述した方法と実質的に同じ方法で追加されてもよい。

本発明の実施形態における、機械学習システムの動作の一例を図７及び図８に示す。初めに、機械学習システム３００は、画像を猫７１０と犬７２０のカテゴリのクラスに分類する分類器として実装される。機械学習システムは、上述したように、埋め込みモデル３１０と予測モデル３４０とを含む。埋め込みモデル３１０は、クラスの初期セット（例えば、猫７１０と犬７２０）についての訓練セットを用いて訓練される。訓練データのセットは、データアイテム（例えば、画像など）及び対応する既知の結果（例えば、データアイテム及びデータアイテムが属する既知のクラス（猫又は犬）など）を含む。埋め込みモデルは、好ましくは、入力レイヤ３２２、中間レイヤ又は隠れレイヤ３２４、３２６、及び出力レイヤ３２８（例えば、図３について上述したように）を含むニューラルネットワークから派生した機械学習モデル３２０を含む。ニューラルネットワークの出力レイヤは、好ましくは、各クラスに対するニューロン３２９を含み、対応する入力データに対する候補出力を示す。ニューラルネットワーク（出力レイヤ３２８を含む）は、出力レイヤ３２８から対応する候補出力を生成するために、クラスの初期セットに対する訓練セットで最初に訓練される。訓練されると、出力レイヤ３２８はニューラルネットワークから除去され、ニューラルネットワークの残りの部分（例えば、入力レイヤ３２２及び中間レイヤ３２４、３２６）は、中間レイヤ３２６が埋め込みを生成するための埋め込みレイヤとして機能する、埋め込みモデルを形成する。

訓練された埋め込みモデル３１０が生成されると、訓練データのセットを埋め込みモデルに適用して、訓練データのセットのデータアイテムに対する埋め込みを生成する（例えば、猫および犬の各クラスにおけるＮ個のデータアイテムについて、猫１［０．０１，０．００，０．２３，．．．０．２０］，猫Ｎ［０．００，０．０２，０．２１，．．．０．２２］，犬１［０．０２，０．５２，０．１３，．．．０．３８］，犬Ｎ［０．０２，０．５０，０．１１，．．．０．４０］）。訓練セットのデータアイテムの各埋め込みは、対応する既知のクラスと関連付けられ（またはラベル付けされ）、（例えば、データベースシステム１１８に）格納される。

新しいクラスであるウサギ７３０を追加する場合、埋め込みモデル３１０は、新しいウサギのクラスのための訓練データのセットを提供され、新しいクラスを表す埋め込みを生成する。新しいクラスのための訓練データのセットは、新しいクラスに対応するデータアイテム（例えば、画像など）を含む（例えば、データアイテムと新しいクラスなど）。新しいクラスのための訓練セットのデータアイテムの各埋め込みは、新しいクラスと関連付けられ（又はラベル付けされ）、（例えば、データベースシステム１１８に）格納される。このように、新しいクラスを追加するために、埋め込みモデル３１０は、猫、犬、及びウサギのクラスに対して再構成及び再訓練されるのではなく、予測モデルに対して新しいクラスを定義する埋め込みを生成し、それにより、コンピューティング及びメモリ資源を節約し、機械学習の速度を大幅に向上させる。

猫、犬、及びウサギのクラスのための例示的なデータアイテムは、埋め込みの次元によって定義される空間内に示される（図８）。データアイテムは、埋め込み空間内でグループ化又はクラスタ化され、それによって、猫、犬、及びウサギのクラスに対応するクラスタが形成される（例えば、クラスタ８１０は猫のクラス７１０に関連し、クラスタ８２０は犬のクラス７２０に関連し、クラスタ８３０はウサギのクラス７３０に関連する）。クラスタ内のデータアイテムは、そのクラスタに関連付けられたクラスに割り当てられる（例えば、クラスタ８１０内のデータアイテムは猫のクラス７１０に割り当てられ、クラスタ８２０内のデータアイテムは犬のクラス７２０に割り当てられ、クラスタ８３０内のデータアイテムはウサギのクラス７３０に割り当てられる）。

猫の画像８４０は、画像に対する埋め込みを生成するために、埋め込みモデル３１０に提供してよい。画像に対する埋め込みモデル３１０から生成された埋め込みは、埋め込み空間に形成された猫、犬、及びウサギのクラスに対する訓練セットのデータアイテムの埋め込みのクラスタ８１０、８２０、及び８３０に基づいて、画像に対する予測されたクラスを生成するために予測モデル３４０に供給される。予測モデルは、埋め込み空間における猫の画像の近傍法を決定するために、ｋ近傍法（ｋＮＮ）技術を使用してもよい。この技術は、クラスを予測するために、埋め込み空間に存在するｋ近傍法を決定してもよい。予測されたクラスは、近傍法の大多数を有するクラスタから決定されてよい。

例えば、画像８４０は、埋め込みモデル３１０によって生成された画像の埋め込みに基づいて、クラスタ８１０、８２０、及び８３０のうちの埋め込み空間においてデータアイテム８５０（例えば、図８において「Ｘ」で示されている）によって表される。埋め込み空間における画像８４０の近傍法を決定するために、ｋ近傍法（ｋＮＮ）技術を適用してもよい。３つの近傍法（ｋ＝３）を用いる場合、画像８４０の３つの近傍法は、クラスタ８１０内の第１のデータアイテム（猫のクラス７１０）、クラスタ８１０内の第２のデータアイテム（猫クラス７１０）、及びクラスタ８３０内の第３のデータアイテム（ウサギのクラス７３０）であってもよい。予測されたクラスは、近傍法の大多数を有するクラスタから決定されてもよい。この場合、近傍法の大多数がクラスタ８１０にあるため（例えば、３つの近傍法データアイテムのうち２つ）、予測されるクラスは、クラスタ８１０に関連する猫のクラス７１０である。

上述し、図面に示した実施形態は、埋め込みを用いたインクリメンタル機械学習のための実施形態を実装する多くの方法のうちの、ほんの一部を表しているに過ぎないことが理解されよう。

本発明の実施形態の環境は、任意の数のコンピュータまたは他の処理システム（例えば、クライアントまたはエンドユーザシステム、サーバシステムなど）および任意の所望の様式で配置されたデータベースまたは他のリポジトリを含んでもよく、ここで本発明の実施形態は、任意の所望のタイプのコンピューティング環境（例えば、クラウドコンピューティング、クライアント－サーバ、ネットワークコンピューティング、メインフレーム、スタンドアロンシステムなど）に適用され得る。本発明の実施形態によって採用されるコンピュータ又は他の処理システムは、任意の数の任意のパーソナル又は他のタイプのコンピュータ又は処理システム（例えば、デスクトップ、ラップトップ、ＰＤＡ、モバイルデバイス等）によって実施されてもよく、任意の市販のオペレーティングシステム及び任意のソフトウェア（例えば、従来の又は他のサーバソフトウェア、従来の又は他のブラウザソフトウェア、従来の又は他の通信ソフトウェア、本発明の実施形態の機械学習モジュール１１６及びインタフェースモジュール１２０等）を含んでもよい。これらのシステムは、情報を入力もしくは表示またはその両方をするための任意のタイプのモニタ及び入力装置（例えば、キーボード、マウス、音声認識など）を含んでよい。

本発明の実施形態のソフトウェア（例えば、機械学習モジュール１１６、インタフェースモジュール１２０など）は、任意の所望のコンピュータ言語で実装されてもよく、明細書に含まれる機能説明及び図面に示されるフローチャートに基づいて、コンピュータ技術の通常のスキルを有する者によって開発され得ることが理解されよう。さらに、様々な機能を実行するソフトウェアに関する本明細書におけるあらゆる言及は、一般に、ソフトウェア制御下でそれらの機能を実行するコンピュータシステムまたはプロセッサを指す。本発明の実施形態のコンピュータシステムは、代替的に、任意のタイプのハードウェアもしくは他の処理回路またはその組み合わせによって実施され得る。

コンピュータまたは他の処理システムの様々な機能は、任意の数のソフトウェアもしくはハードウェアモジュールまたはユニット、またはその組み合わせ、処理またはコンピュータシステムもしくは回路またはその組み合わせの間で任意の方法で分散されてよく、コンピュータまたは処理システムは、互いにローカルまたは遠隔に配置されてよく、任意の適切な通信媒体（例えば、ＬＡＮ、ＷＡＮ、イントラネット、インターネット、ハードワイヤ、モデム接続、無線など）を介して通信することがある。例えば、本発明の実施形態の機能は、様々なエンドユーザ／クライアント及びサーバシステム、もしくは他の任意の中間処理装置またはこれらの組み合わせ間で任意の方法で分散されてもよい。上述し、フローチャートに示されたソフトウェアもしくはアルゴリズムまたはその両方は、本明細書に記載された機能を達成する任意の方法で修正されてもよい。さらに、フローチャートまたは説明における機能は、所望の動作を達成する任意の順序で実行されてもよい。

本発明の実施形態のソフトウェア（例えば、機械学習モジュール１１６、インタフェースモジュール１２０など）は、スタンドアロンシステムまたはネットワークもしくは他の通信媒体によって接続されたシステムで使用するために、据え置き型または携帯型のプログラム製品装置またはデバイスの非一時的なコンピュータ使用可能媒体（例えば、磁気または光媒体、磁気光学媒体、フロッピーディスク、ＣＤ－ＲＯＭ、ＤＶＤ、メモリデバイスなど）上で利用可能であってよい。

通信ネットワークは、任意の数の任意のタイプの通信ネットワーク（例えば、ＬＡＮ、ＷＡＮ、インターネット、イントラネット、ＶＰＮなど）により実施されてもよい。本発明の実施形態のコンピュータ又は他の処理システムは、任意の従来型又は他のプロトコルを介してネットワーク上で通信するための任意の従来型又は他の通信デバイスを含んでもよい。コンピュータまたは他の処理システムは、ネットワークにアクセスするために、任意のタイプの接続（例えば、有線、無線など）を利用してもよい。ローカル通信媒体は、任意の適切な通信媒体（例えば、ローカルエリアネットワーク（ＬＡＮ）、ハードワイヤ、無線リンク、イントラネットなど）により実施されてもよい。

システムは、情報（例えば、機械学習モデルおよび対応する構成およびパラメータ、訓練データ、結果など）を格納するために、任意の数の従来型または他のデータベース、データストアまたはストレージ構造（例えば、ファイル、データベース、データ構造、データまたは他のリポジトリなど）を採用してもよい。データベースシステムは、情報を格納するための任意の数の従来型または他のデータベース、データストアまたはストレージ構造（例えば、ファイル、データベース、データ構造、データまたは他のリポジトリなど）によって実装されてもよい。データベースシステムは、サーバもしくはクライアントシステムまたはその両方内に含まれてよく、又はそれに結合されてよい。データベースシステムもしくは記憶構造またはその両方は、コンピュータ又は他の処理システムからリモートであってもローカルであってもよく、任意の所望のデータを格納することができる。

本発明の実施形態は、情報（例えば、機械学習モデルの入力、新しい側面（例えば、新しい出力、新しいクラス、分類、機械学習モデルからの出力など））を取得または提供するための任意の数の任意のタイプのユーザインタフェース（例えば、グラフィカルユーザーインターフェース（ＧＵＩ）、コマンドライン、プロンプトなど）を採用してよく、インタフェースは、任意の様式で配置された任意の情報を含むことがある。インタフェースは、任意の適切な入力装置（例えば、マウス、キーボードなど）を介して情報を入力／表示し、所望の動作を開始するために任意の位置に配置された任意の数の任意のタイプの入力または作動メカニズム（例えば、ボタン、アイコン、フィールド、ボックス、リンクなど）を含んでもよい。インタフェース画面は、任意の方法で画面間を移動するための任意の適切なアクチュエータ（例えば、リンク、タブなど）を含んでもよい。

レポートは、任意の方法で配置された任意の情報を含んでもよく、ユーザに所望の情報（例えば、機械学習モデル、側面（例えば、出力の種類、クラスなど）、分類、機械学習モデルからの出力など）を提供するためにルールまたは他の基準に基づいて構成可能であってもよい。

埋め込みモデルは、任意の機械学習モデル（例えば、ニューラルネットワーク、統計モデルなど）から派生されてもよい。ニューラルネットワークは、任意のタイプ（例えば、フィードフォワード、リカレント、畳み込みなど）であってよく、任意の量のレイヤ、及び各レイヤにおける任意の量のニューロン又はノードを含んでよい。ニューラルネットワークの任意のレイヤは、埋め込みを生成する埋め込みレイヤとして機能してもよく、埋め込みモデルは、ニューラルネットワーク又はニューラルネットワークの任意の部分（例えば、埋め込みレイヤ及び埋め込みレイヤより前のレイヤなど）を含む。埋め込みは、任意のタイプの構造（例えば、ベクトル、配列など）によって表わされてもよく、任意の所望の特徴（例えば、画像特徴、テキスト特徴など）に係る任意の数値又は他の値（例えば、英数字など）を有する任意の量の要素又は次元を含んでもよい。データアイテムに対して任意の数の埋め込みが生成されてもよい（例えば、各埋め込みは、データアイテムの対応する１つまたは複数の特徴に関連付けられる、など）。候補出力（新しい候補出力を含む）のための訓練セットは、任意のタイプの任意の量のデータアイテム（例えば、画像、テキスト、ビデオ、オーディオなど）を含んでもよく、さらに、既知の結果（例えば、既知の出力、既知のクラス、既知の結果など）の任意の表示を含んでもよい。機械学習モデルを訓練または再訓練するために、任意の量の訓練セットについて、任意の従来型または他の訓練技術を適用してよい（例えば、誤差逆伝播法など）。

予測モデルは、候補出力を予測するために、任意の技術を採用してもよい（例えば、機械学習、パターン認識、ｋＮＮなど）。任意の量の近傍法は、任意の適切な距離または他の類似度測定（例えば、コサイン類似度など）に基づく予測のために使用されてよい。距離は、様々な従来型または他の技術（例えば、ユークリッド距離、マンハッタン距離、ハミング距離など）に基づいて決定されてよい。候補出力は、任意の方法で近傍法に基づいて選択されてよい（例えば、近傍法の大多数に関連する候補出力、最も近い近傍法と関連する候補出力、他のクラスタへの近傍法の距離など）。

訓練スコアは、任意のクラスタ品質測定もしくは、距離もしくは他の類似度測定（例えば、クラスタ間距離、クラスタ内距離、平均距離、コサイン類似度など）またはこれらの組み合わせに基づいて決定されてよい。距離は、様々な従来型または他の技術（例えば、ユークリッド距離、マンハッタン距離、ハミング距離など）に基づき決定されてよい。個々の埋め込みに対するスコアを任意の方法で組み合わせて、訓練スコアを決定してよい（例えば、平均値、中央値、標準偏差など）。さらに、新しい候補出力の埋め込みは、訓練スコアを決定するために使用される代表的な埋め込みを形成するために、任意の方法（例えば、平均値、中央値、特定の特徴または要素の最大値または最小値など）で結合されてよい。閾値は、新しい候補出力のためのクラスタが他の候補出力のクラスタから十分に区別されることを示すために、任意の値の範囲の任意の適切な値に設定されてもよい。例えば、クラスタ間距離は、他のクラスタと区別するために大きく、一方、クラスタ内距離は、まとまったクラスタを提供するために小さくする必要がある。上記の訓練スコアの表現では、個々の埋め込みが１．０に近づくほど、十分に識別可能な埋め込みクラスタであることを示す（例えば、クラスタ間距離ｂ（ｉ）が大きく、クラスタ内距離ａ（ｉ）が小さい場合、スコアは１．０に近づく）。したがって、訓練スコアの閾値の例（例えば、個々の埋め込みスコアの平均値または中央値、あるいは代表埋め込みに対するスコアなどに関する上記の表現に基づく）は、０．７から１．０までの範囲の任意の値（または個々の埋め込みスコアが結合または正規化される方法に基づく他の値の範囲の同様の値）であってもよい。しかし、閾値には、任意の適切な値または値の範囲が使用されてよい。

本発明の実施形態は、上述した特定のタスクやアルゴリズムに限定されるものではなく、様々な機械学習システム（例えば、深層学習、分類、パターンマッチング／認識、画像／映像／視覚解析、自然言語／テキスト解析、音声解析など）のための任意の種類の新しい側面（例えば、新しい出力、新しいクラス、新しいグループ、新しいカテゴリ、新しい値の範囲、任意のグループからの新しい選択など）の学習に利用されることがある。

本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、限定することを意図するものではない。本明細書で使用される場合、単数形「ａ」、「ａｎ」および「ｔｈｅ」は、文脈が明確に他のことを示さない限り、複数形も含むことを意図している。本明細書で使用される場合、「含む（comprises）」、「含む（comprising）」、「含む（includes）」、「含む（including）」、「有する（has）」、「有する（have）」、「有する（having）」、「有する（with）」などの用語は、記載された特徴、整数、ステップ、動作、要素、もしくはコンポーネントまたはその組み合わせの存在を指定するが、１つ以上の他の特徴、整数、ステップ、動作、要素、コンポーネント、もしくはそれらのグループまたはその組み合わせの存在または追加を排除するものではないことがさらに理解されたい。

以下の特許請求の範囲におけるすべての手段またはステッププラスファンクションの対応する構造、材料、動作、および等価物は、具体的に請求された他の請求項の要素と組み合わせて機能を実行するための任意の構造、材料、または動作を含むことを意図している。本発明の説明は、例示および説明の目的で提示されたが、網羅的であること、または開示された形態の本発明に限定されることを意図していない。多くの修正および変形が、本発明の範囲および精神から逸脱することなく、当業者には明らかであろう。実施形態は、本発明の原理および実用化を最もよく説明するために、また、当業者が、企図される特定の用途に適するように種々の変更を伴う種々の実施形態について本発明を理解できるように、選択および説明されたものである。

本発明の様々な実施形態の説明は、例示の目的で提示されているが、網羅的であることを意図するものではなく、開示される実施形態に限定されることを意図するものでもない。説明された実施形態の範囲および精神から逸脱することなく、多くの修正および変更が可能であることは当業者には明らかであろう。本明細書で使用される用語は、実施形態の原理、市場で見られる技術に対する実際の適用または技術的改善を説明するため、または当業者が本明細書に開示される実施形態を理解できるようにするために選択された。

本発明は、任意の可能な技術詳細レベルで統合されたシステム、方法もしくはコンピュータプログラム製品またはそれらの組み合せとすることができる。コンピュータプログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を記憶したコンピュータ可読記憶媒体を含んでよい。

コンピュータ可読記憶媒体は、命令実行装置によって使用される命令を保持し、記憶することができる有形の装置とすることができる。コンピュータ可読記憶媒体は、一例として、電子記憶装置、磁気記憶装置、光学記憶装置、電磁記憶装置、半導体記憶装置またはこれらの適切な組み合わせであってよいが、限定されるものではない。コンピュータ可読記憶媒体のより具体的な一例としては、ポータブルコンピュータディスケット、ハードディスク、ＲＡＭ、ＲＯＭ、ＥＰＲＯＭ（またはフラッシュメモリ）、ＳＲＡＭ、ＣＤ－ＲＯＭ、ＤＶＤ、メモリスティック、フロッピーディスク、パンチカードまたは溝内の隆起構造などに命令を記録した機械的に符号化された装置、およびこれらの適切な組み合せが挙げられる。本明細書で使用されるコンピュータ可読記憶装置は、電波もしくは他の自由に伝播する電磁波、導波管もしくは他の伝送媒体を介して伝播する電磁波（例えば、光ファイバケーブルを通過する光パルス）、またはワイヤを介して送信される電気信号のような、一過性の信号それ自体として解釈されるべきではない。

本明細書に記載のコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピュータ装置／処理装置へダウンロード可能である。あるいは、ネットワーク（例えばインターネット、ＬＡＮ、ＷＡＮもしくはワイヤレスネットワークまたはこれらの組み合わせ）を介して、外部コンピュータまたは外部記憶装置へダウンロード可能である。ネットワークは、銅製伝送ケーブル、光伝送ファイバ、ワイヤレス伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイコンピュータもしくはエッジサーバまたはこれらの組み合わせを備えることができる。各コンピュータ装置／処理装置内のネットワークアダプタカードまたはネットワークインタフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、当該コンピュータ可読プログラム命令を、各々のコンピュータ装置／処理装置におけるコンピュータ可読記憶媒体に記憶するために転送する。

本発明の動作を実施するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ（ＩＳＡ）命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路用構成データ、または、スモールトークやＣ＋＋などのオブジェクト指向プログラミング言語、および「Ｃ」プログラミング言語や類似のプログラミング言語などの手続き型プログラミング言語を含む、１つ以上のプログラミング言語の任意の組み合わせで記述されたソースコードもしくはオブジェクトコードのいずれかとすることができる。コンピュータ可読プログラム命令は、スタンドアロン型ソフトウェアパッケージとして完全にユーザのコンピュータ上で、または部分的にユーザのコンピュータ上で実行可能である。あるいは、部分的にユーザのコンピュータ上でかつ部分的にリモートコンピュータ上で、または、完全にリモートコンピュータもしくはサーバ上で実行可能である。後者の場合、リモートコンピュータは、ＬＡＮやＷＡＮを含む任意の種類のネットワークを介してユーザのコンピュータに接続してもよいし、外部コンピュータに（例えば、インターネットサービスプロバイダを使用してインターネットを介して）接続してもよい。いくつかの実施形態において、例えばプログラマブル論理回路、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、プログラマブル論理アレイ（ＰＬＡ）を含む電子回路は、本発明の態様を実行する目的で当該電子回路をカスタマイズするために、コンピュータ可読プログラム命令の状態情報を利用することによって、コンピュータ可読プログラム命令を実行することができる。

本発明の各態様は、本明細書において、本発明の実施形態に係る方法、装置（システム）、およびコンピュータプログラム製品のフローチャートもしくはブロック図またはその両方を参照して説明されている。フローチャートもしくはブロック図またはその両方における各ブロック、および、フローチャートもしくはブロック図またはその両方における複数のブロックの組み合わせは、コンピュータ可読プログラム命令によって実行可能である。

上記のコンピュータ可読プログラム命令は、機械を生産するために、コンピュータ、または他のプログラマブルデータ処理装置のプロセッサに提供してよい。これにより、かかるコンピュータまたは他のプログラマブルデータ処理装置のプロセッサを介して実行されるこれらの命令が、フローチャートもしくはブロック図またはその両方における１つ以上のブロックにて特定される機能／動作を実行するための手段を創出する。上記のコンピュータ可読プログラム命令はさらに、コンピュータ、プログラマブルデータ処理装置もしくは他の装置またはこれらの組み合わせに対して特定の態様で機能するよう命令可能なコンピュータ可読記憶媒体に記憶してよい。これにより、命令が記憶された当該コンピュータ可読記憶媒体は、フローチャートもしくはブロック図またはその両方における１つ以上のブロックにて特定される機能／動作の態様を実行するための命令を含む製品を構成する。

また、コンピュータ可読プログラム命令を、コンピュータ、他のプログラマブル装置、または他の装置にロードし、一連の動作ステップを当該コンピュータ、他のプログラマブル装置、または他の装置上で実行させることにより、コンピュータ実行プロセスを生成してもよい。これにより、当該コンピュータ、他のプログラマブル装置、または他の装置上で実行される命令が、フローチャートもしくはブロック図またはその両方における１つ以上のブロックにて特定される機能／動作を実行する。

本開示の図面におけるフローチャートおよびブロック図は、本発明の種々の実施形態に係るシステム、方法およびコンピュータプログラム製品の可能な実装形態のアーキテクチャ、機能性、および動作を示している。この点に関して、フローチャートまたはブロック図における各ブロックは、特定の論理機能を実行するための１つ以上の実行可能な命令を含む、命令のモジュール、セグメント、または部分を表すことができる。他の一部の実装形態において、ブロック内に示した機能は、各図に示す順序とは異なる順序で実行してもよい。例えば、連続して示される２つのブロックは、実際には、関係する機能に応じて、１つの工程として達成してもよいし、同時もしくは略同時に実行してもよいし、部分的もしくは全体的に時間的に重複した態様で実行してもよいし、または場合により逆順で実行してもよい。なお、ブロック図もしくはフローチャートまたはその両方における各ブロック、および、ブロック図もしくはフローチャートまたはその両方における複数のブロックの組み合わせは、特定の機能または動作を行う、または専用ハードウェアとコンピュータ命令との組み合わせを実行する専用ハードウェアベースのシステムによって、実行可能である。

Claims

新しい出力を包含する結果を生成するための機械学習方法であって、前記方法は、
プロセッサを介して、複数の候補出力の中から候補出力を決定するために、機械学習モデルを訓練することと、
前記プロセッサを介して、訓練データの第１セットから複数の候補出力に関連する第１埋め込みを生成することであって、前記第１埋め込みは、前記訓練された機械学習モデルの中間レイヤから生成される、生成することと、
前記プロセッサを介して、訓練データの第２セットから新しい候補出力に関連する第２埋め込みを生成することであって、前記第２埋め込みは、前記訓練された機械学習モデルの前記中間レイヤから生成される、生成することと、
前記プロセッサを介して、前記訓練された機械学習モデルの前記中間レイヤによって入力データに対する第３埋め込みを決定することと、
前記プロセッサを介して、前記複数の候補出力のグループと、前記第１および第２埋め込みに対する前記第３埋め込みの距離に基づく前記新しい候補出力とから、前記入力データに対する結果としての候補出力を予測することと、を含む方法。
前記機械学習モデルは分類モデルを含み、前記複数の候補出力はクラスを含み、前記新しい候補出力は新しいクラスを含む、請求項１に記載の方法。
前記結果としての候補出力を予測することは、
前記第１および第２埋め込みから、前記第３埋め込みに最も近い複数の埋め込みを決定することと、
前記決定された複数の埋め込みに関連する候補出力に基づいて、前記結果としての候補出力を決定することと、を含む、請求項１に記載の方法。
前記結果としての候補出力は、前記決定された複数の埋め込みのうちの大多数に関連する候補出力に基づいて決定される、請求項３に記載の方法。
前記第１および第２埋め込みに基づき、訓練スコアを決定することと、
前記訓練スコアが閾値を満たさないことに応答して、前記機械学習モデルを再訓練させることと、をさらに含む、請求項１に記載の方法。
前記第１埋め込みは、それぞれが対応する候補出力に関連する複数の第１クラスタを形成し、前記第２埋め込みは、前記新しい候補出力に関連する第２クラスタを形成し、前記訓練スコアを決定することは、
前記第２クラスタ内の前記第２埋め込みとの間の距離と、前記第２埋め込みそれぞれと前記複数の第１クラスタとの間の距離とに基づいて、前記訓練スコアを決定すること、をさらに含む、請求項５に記載の方法。
前記機械学習モデルは、前記複数の候補出力のための入力レイヤ、中間レイヤ、および出力レイヤを含むニューラルネットワークを含み、前記第１、第２、および第３埋め込みは、埋め込みモデルによって生成され、前記埋め込みモデルは、前記出力レイヤを含まない前記訓練された機械学習モデルの前記ニューラルネットワークを含む、請求項１に記載の方法。
前記新しい候補出力は、前記機械学習モデルを再訓練することなく、前記結果としての候補出力を予測するためのグループに追加される、請求項１に記載の方法。
新しい出力を包含する結果を生成するための機械学習のためのシステムであって、前記システムは、
複数の候補出力の中から候補出力を決定するために、機械学習モデルを訓練することと、
訓練データの第１セットから複数の候補出力に関連する第１埋め込みを生成することであって、前記第１埋め込みは、前記訓練された機械学習モデルの中間レイヤから生成される、生成することと、
訓練データの第２セットから新しい候補出力に関連する第２埋め込みを生成することであって、前記第２埋め込みは、前記訓練された機械学習モデルの前記中間レイヤから生成される、生成することと、
前記訓練された機械学習モデルの前記中間レイヤによって入力データに対する第３埋め込みを決定することと、
前記複数の候補出力のグループと、前記第１および第２埋め込みに対する前記第３埋め込みの距離に基づく前記新しい候補出力とから、前記入力データに対する結果としての候補出力を予測することと、を行うように構成される、少なくとも１つのプロセッサを含む、システム。
前記機械学習モデルは分類モデルを含み、前記複数の候補出力はクラスを含み、前記新しい候補出力は新しいクラスを含む、請求項９に記載のシステム。
前記結果としての候補出力を予測することは、
前記第１および第２埋め込みから、前記第３埋め込みに最も近い複数の埋め込みを決定することと、
前記決定された複数の埋め込みに関連する候補出力に基づいて、前記結果としての候補出力を決定することと、を含む、請求項９に記載のシステム。
前記結果としての候補出力は、前記決定された複数の埋め込みのうちの大多数に関連する候補出力に基づいて決定される、請求項１１に記載のシステム。
前記少なくとも１つのプロセッサは、
前記第１および第２埋め込みに基づき、訓練スコアを決定することと、
前記訓練スコアが閾値を満たさないことに応答して、前記機械学習モデルを再訓練することと、をさらに行うように構成される、請求項９に記載のシステム。
前記第１埋め込みは、それぞれが対応する候補出力に関連する複数の第１クラスタを形成し、前記第２埋め込みは、前記新しい候補出力に関連する第２クラスタを形成し、前記訓練スコアを決定することは、
前記第２クラスタ内の前記第２埋め込みとの間の距離と、前記第２埋め込みそれぞれと前記複数の第１クラスタとの間の距離とに基づいて、前記訓練スコアを決定すること、をさらに含む、請求項１３に記載のシステム。
前記機械学習モデルは、前記複数の候補出力のための入力レイヤ、中間レイヤ、および出力レイヤを含むニューラルネットワークを含み、前記第１、第２、および第３埋め込みは、埋め込みモデルによって生成され、前記埋め込みモデルは、前記出力レイヤを含まない前記訓練された機械学習モデルの前記ニューラルネットワークを含む、請求項９に記載のシステム。
前記新しい候補出力は、前記機械学習モデルを再訓練することなく、前記結果としての候補出力を予測するためのグループに追加される、請求項９に記載のシステム。
新しい出力を包含する結果を生成するための機械学習のためのコンピュータプログラム製品であって、前記コンピュータプログラム製品は、１つまたは複数のコンピュータ可読記憶媒体にまとめて格納されたプログラム命令を有する１つまたは複数のコンピュータ可読記憶媒体を含み、前記プログラム命令はプロセッサによって実行可能であり、前記プロセッサに、
複数の候補出力の中から候補出力を決定するために、機械学習モデルを訓練することと、
訓練データの第１セットから複数の候補出力に関連する第１埋め込みを生成することであって、前記第１埋め込みは、前記訓練された機械学習モデルの中間レイヤから生成される、生成することと、
訓練データの第２セットから新しい候補出力に関連する第２埋め込みを生成することであって、前記第２埋め込みは、前記訓練された機械学習モデルの前記中間レイヤから生成される、生成することと、
前記訓練された機械学習モデルの前記中間レイヤによって入力データに対する第３埋め込みを決定することと、
前記複数の候補出力のグループと、前記第１および第２埋め込みに対する前記第３埋め込みの距離に基づく前記新しい候補出力とから、前記入力データに対する結果としての候補出力を予測することと、を行わせる、コンピュータプログラム製品。
前記機械学習モデルは分類モデルを含み、前記複数の候補出力はクラスを含み、前記新しい候補出力は新しいクラスを含む、請求項１７に記載のコンピュータプログラム製品。
前記結果としての候補出力を予測することは、
前記第１および第２埋め込みから、前記第３埋め込みに最も近い複数の埋め込みを決定することと、
前記決定された複数の埋め込みに関連する候補出力に基づいて、前記結果としての候補出力を決定することと、を含む、請求項１７に記載のコンピュータプログラム製品。
前記結果としての候補出力は、前記決定された複数の埋め込みのうちの大多数に関連する候補出力に基づいて決定される、請求項１９に記載のコンピュータプログラム製品。
前記プログラム命令は前記プロセッサに、
前記第１および第２埋め込みに基づき、訓練スコアを決定することと、
前記訓練スコアが閾値を満たさないことに応答して、前記機械学習モデルを再訓練することと、をさらに行わせる、請求項１７に記載のコンピュータプログラム製品。
前記第１埋め込みは、それぞれが対応する候補出力に関連する複数の第１クラスタを形成し、前記第２埋め込みは、前記新しい候補出力に関連する第２クラスタを形成し、前記訓練スコアを決定することは、
前記第２クラスタ内の前記第２埋め込みとの間の距離と、前記第２埋め込みそれぞれと前記複数の第１クラスタとの間の距離とに基づいて、前記訓練スコアを決定することを、さらに含む、請求項２１に記載のコンピュータプログラム製品。
前記機械学習モデルは、前記複数の候補出力のための入力レイヤ、中間レイヤ、および出力レイヤを含むニューラルネットワークを含み、前記第１、第２、および第３埋め込みは、埋め込みモデルによって生成され、前記埋め込みモデルは、前記出力レイヤを含まない前記訓練された機械学習モデルの前記ニューラルネットワークを含む、請求項１７に記載のコンピュータプログラム製品。
前記新しい候補出力は、前記機械学習モデルを再訓練することなく、前記結果としての候補出力を予測するためのグループに追加される、請求項１７に記載のコンピュータプログラム製品。