JP2022537317A

JP2022537317A - 機械学習サービスを提供するための方法及びシステム

Info

Publication number: JP2022537317A
Application number: JP2021575051A
Authority: JP
Inventors: ゴンデン，ジアン; アン，イクジン; イム，デソプ; チェ，ボギョン; オー，セチャン; カナーン，ウィリアム
Original assignee: モロコ，インコーポレイテッド
Priority date: 2019-06-18
Filing date: 2020-06-17
Publication date: 2022-08-25
Also published as: US20200401886A1; US11868884B2; CN114287007A; EP3987461A1; KR20220024718A; EP3987461A4; WO2020257292A1

Abstract

本開示は機械学習モデルサービスを提供するための方法及びシステムを提供する。本方法は、（ａ）第１の機械学習モデルを使用することにより第１の出力データを第１の計算システムにより生成することであって、第１の機械学習モデルは第１のトレーニングデータセットでトレーニングされる、生成すること；（ｂ）第１の出力データを第２の計算システムへ送信することであって、第１のトレーニングデータセット及び第１の機械学習モデルは第２の計算システムにアクセス不能である、送信すること；（ｃ）第１の出力データと第２の計算システムにアクセス可能な選択された組の入力特徴とを連結することにより入力データを生成すること；及び（ｄ）入力データを処理するために第２の機械学習モデルを使用して第２の出力データを生成することを含み得る。

Description

関連出願の相互参照
[0001] 本出願は、参照のためその全体を本明細書に援用する２０１９年６月１８日出願の米国暫定特許出願第６２／８６２，９８６号及び２０１９年８月２９日出願の米国暫定特許出願第６２／８９３，７２５号からの優先権及び利益を主張する。

背景
[0002] 高度にアクセス可能であり且つ費用効率の高い機械学習プラットホーム（例えばTensorFlow、Amazonの機械学習、MicrosoftのAzure機械学習、OpenAI、SciKit-Learn、Matlabなど）の最近の成長により、ユーザは、大きなデータセットの自動解析を行うためのユーザに利用可能な無数の既成選択肢を有する。機械学習サービスプロバイダは、深層学習技術の成功がトレーニングのために利用可能なデータ量に直接比例するので、大規模にユーザデータを通常収集する。しかし、このような大量データ収集及び／又は機械学習モデルをサービスすることはプライバシー問題に悩まされる。

概要
[0003] ユーザがモデルトレーニング及び予測と相互作用するための既存手法及び方法が存在するが、このような方法及びシステムに付随する制限がここでは認識される。例えば、連合学習は、すべてのトレーニングデータをデバイス上に維持し、データをクラウド内に格納する必要性から機械学習を行う能力を切り離す一方で、モバイルフォンが共有予測モデルを連携して学習することを可能にする。連合学習では、中央システム及び分散されたデバイスが共通モデルを共有する一方で、分散されたデバイスは、モデルの重み付けをプライベートトレーニングデータセットによりローカルに更新し、及び更新された重み付けを中央システムへ送信し得る。中央システムは、分散デバイスからの更新を統合し、延いては分散デバイスへ送信され得る共通モデルの重み付けを更新し得る。しかし、このような連合手法では、中央モデルは可視であり、及び分散デバイスへ露出され、各デバイスからの更新されたモデルもまた中央システムへ露出される。別の例として、転移学習（transfer learning）は、トレーニング済み深層ニューラルネットワークのアーキテクチャ及び重み付けの一部（又は全体）を第２の深層ニューラルネットワークの開始点として使用することにより、情報を１つの深層ニューラルネットワークから別のネットワークへ転送するための技術である。転移学習では、基本ネットワークは、基本データセット及びタスクに関し最初にトレーニングされ、次に、学習された特徴は再利用されるか、又は学習された特徴は、標的データセット及びタスクに関しトレーニングされる第２の標的ネットワークへ転送される。しかし、このような転移学習では、特徴は通常、一般的（基本タスクに固有である代わりに基本タスク及び標的タスクの両方に好適であることを意味する）となることが要求され、及び基本モデルもまた、第２のネットワークに対して露出されて可視となる。

[0004] ここで認識されるのは、機械学習サービスを提供する際の改善されたプライバシー保存能力を有する方法及びシステムの必要性である。本開示は、フィールド内データ、ローカルモデル、及びプロバイダモデルをプライベート且つ安全なままにする一方で個人／消費者がフィールド内データ及び別のモデル（プロバイダモデル）から転送されたデータの両方を使用することにより予測を生成することができる機械学習モデルを構築、開発、及び実施することを可能にする方法及びシステムを提供する。ローカル入力データとモデルコンテンツとを複数（例えば２つ以上）の別個のシステムにおいて分離状態にする一方で別の基本／プロバイダ機械学習モデルを使用することにより機械学習モデルに対する改善を達成し得る方法及びシステムが提供される。

[0005] 一態様では、機械学習モデルサービスを提供する方法が提供される。本方法は、（ａ）第１の機械学習モデルを使用することにより第１の出力データを第１の計算システムにより生成することであって、第１の機械学習モデルは第１のトレーニングデータセットでトレーニングされる、生成すること；（ｂ）第１の出力データを第２の計算システムへ送信することであって、第１のトレーニングデータセット及び第１の機械学習モデルは第２の計算システムにアクセス不能である、送信すること；（ｃ）第１の出力データと第２の計算システムにアクセス可能な選択された組の入力特徴とを連結することにより入力データを生成すること；及び（ｄ）入力データを処理するために第２の機械学習モデルを使用して第２の出力データを生成することであって、第２の機械学習モデル及び選択された組の入力特徴は第１の計算システムにアクセス不能である、生成することを含む。

[0006] いくつかの実施形態では、第１の出力データは予測値を含む。いくつかの実施形態では、第１の出力データは、１つ又は複数の共通特徴に従って、選択された組の入力特徴と連結される。いくつかのケースでは、１つ又は複数の共通特徴は共通特徴識別子を含む。いくつかの実施形態では、第２の機械学習モデルは教師有り学習を使用してトレーニングされ、第２の機械学習モデルをトレーニングするためのラベル付きデータセットは第１の機械学習モデルにより生成されたデータを含む。いくつかのケースでは、第１の機械学習モデルは畳み込みニューラルネットワークであり、第１の機械学習により生成されるデータは、畳み込みニューラルネットワークの最上層の出力を含む。

[0007] いくつかの実施形態では、選択された組の入力特徴は、第２の機械学習モデルの性能を評価することにより決定される。いくつかのケースでは、第２の機械学習モデルの性能メトリックが閾値より良くなるまで、異なる組の入力特徴が選択される。いくつかの実施形態では、本方法はさらに、第１の出力データを生成するための要求を、第１の計算システムにより受信することを含む。いくつかのケースでは、要求は予測サービスに関係する１つ又は複数の共通特徴を含む。

[0008] 別の態様では、連続機械学習システムが提供される。本システムは、（ａ）第１の機械学習モデルを使用して第１の出力データを生成するように構成された第１の計算システムであって、第１の機械学習モデルは第１のトレーニングデータセットでトレーニングされる、第１の計算システム；（ｂ）入力データを処理するために第２の機械学習モデルを使用することにより第２の出力データを生成するように構成された第２の計算システム；及び（ｃ）第１の出力データと第２の計算システムにアクセス可能な選択された組の入力特徴とを連結することにより入力データを生成するように構成された集積コンポーネントを含み、第１のトレーニングデータセット及び第１の機械学習モデルは第２の計算システムにアクセス不能であり、第２の機械学習モデル及び選択された一組の入力特徴は第１の計算システムにアクセス不能である。

[0009] いくつかの実施形態では、第１の出力データは予測値を含む。いくつかの実施形態では、第１の出力データは、１つ又は複数の共通特徴に従って、選択された組の入力特徴と連結される。いくつかのケースでは、１つ又は複数の共通特徴は共通特徴識別子を含む。

[0010] いくつかの実施形態では、第２の機械学習モデルは教師有り学習を使用してトレーニングされ、第２の機械学習モデルをトレーニングするためのラベル付きデータセットは第１の機械学習モデルにより生成されたデータを含む。いくつかのケースでは、第１の機械学習モデルは畳み込みニューラルネットワークであり、第１の機械学習により生成されるデータは、畳み込みニューラルネットワークの最上層の出力を含む。

[0011] いくつかの実施形態では、選択された組の入力特徴は、第２の機械学習モデルの性能を評価することにより決定される。いくつかのケースでは、第２の機械学習モデルの性能メトリックが閾値より良くなるまで、異なる組の入力特徴が選択される。いくつかの実施形態では、第１の計算システムは、第１の出力データを生成するための要求をさらに受信するように構成される。いくつかのケースでは、要求は予測サービスに関係する１つ又は複数の共通特徴を含む。

[0012] 本開示の追加の態様及び利点は、本開示の例示的実施形態だけが示され説明される以下の詳細説明から当業者に容易に明らかになる。理解されることになるように、本開示は他の実施形態及び様々な実施形態に対応することが可能であり、そのいくつかの詳細はすべて本開示から逸脱することなく様々な明白な方式で修正可能である。したがって、添付図面と本明細書は、本来例示的であり、限定的ではないとみなされるべきである。

参照による援用
[0013] 本明細書で述べられるすべての刊行物、特許、及び特許出願は、各個々の刊行物、特許、又は特許出願が参照により援用されるように具体的且つ個々に指示される限りにおいて、参照により本明細書に援用される。参照により援用される刊行物及び特許又は特許出願が本明細書に含まれる開示と矛盾する限りにおいて、本明細書は、いかなるこのような矛盾する資料をも代替する及び／又は優先する。

図面の簡単な説明
[0014] 本発明の新規な特徴は添付の特許請求の範囲において具体的に示される。本発明の特徴及び利点のさらなる理解は、本発明の原理が利用される例示的実施形態を示す以下の詳細説明と添付図面（本明細書では「図」）とを参照することにより得られることになる。

[0015]２つのエンティティ（例えばプロバイダ及び消費者）間でデータを活用する従来のアーキテクチャを示す。 [0016]いくつかの実施形態によるプロバイダシステムと消費者システムとの間でデータを活用する方法を概略的に示す。 [0017]いくつかの実施形態による連続機械学習システムを概略的に示す。 [0018]本明細書に記載の連続機械学習システムにおいて行われる例示的トレーニングプロセスを示す。 [0019]例示的予測プロセスを示す。 [0020]いくつかの実施形態による連続機械学習システムの例を示す。 [0021]連続機械学習システムを実現するようにプログラムされるか又はそうでなければ構成されたコンピュータシステムを示す。

詳細な説明
[0022] 本明細書では本発明の様々な実施形態が示され説明されるが、このような実施形態が単に一例として提供されることは当業者にとって明白である。本発明から逸脱することなく非常に多くの変形、変更、及び置換が当業者に思い浮かび得る。本明細書に記載の本発明の実施形態の様々な代替案が採用され得るということが理解されるべきである。

[0023] 本発明は、入力データとモデルコンテンツとをそれぞれの別個のシステムにおいて分離されたままにする一方で、別の基本機械学習モデルを使用することにより機械学習モデルを改善するための、方法及びシステムを提供する。特に、プロバイダからの機械学習モデル出力を消費者機械学習モデルへの入力として使用することにより、消費者機械学習モデルに対する改善を達成し得る、安全であり且つ保護されたシステムアーキテクチャが提供される。データセット及びモデルは、それぞれの消費者及びプロバイダシステムに関し分離され、プライベート、且つ安全なままである。提供される方法は、生成中にデータを消費者又はプロバイダシステムと共有することなく消費者データセット及びプロバイダデータセットを活用することを可能にする。提供される方法及びシステムは、消費者システム及びプロバイダシステムが、緩い接続（例えば集積点）により、分離された方式で働くことを可能にする。例えば、生成中、消費者システムは、プロバイダモデルにより生成されるモデル出力を受信し、及び消費者モデルが、増強された予測を行うように、集積点を介してモデル出力とローカル消費者データとを連結し得る。プロバイダモデルコンテンツ及びデータセット、並びに消費者モデルコンテンツ及びデータセットは、消費者モデルのトレーニング、開発、検証、生産化及び配備全体にわたり、分離されたままであり得る。提供される方法及びシステムは、クラウド環境又は構内環境などの様々なシナリオにおいて適用され得る。

[0024] 本明細書で説明する、本発明の様々な態様は、以下に記載される具体的アプリケーションのうちの任意のものへ適用され得る。本発明は、サービスとして機械学習予測を提供するものとして実現され得る。本発明の様々な態様は、個々に、集合的に、又は互いに組み合わせて認識され得るということが理解されるべきである。

[0025] 本明細書において利用される用語「プロバイダ」は一般的には、機械学習モデル出力を提供する当事者、エンティティ又は会社を指す。機械学習出力は、第２の機械学習予測のために別のシステムへ提供され得る。いくつかのケースでは、プロバイダは、別のシステムへ提供される出力を生成する機械学習モデルの所有者であり得る。機械学習出力は、トレーニング段階中に第２の機械学習モデルをトレーニングするための及び／又は第２の機械学習モデルの配備後に予測を行うための別のシステムへ提供され得る。

[0026] 本明細書において利用される用語「消費者」は一般的には、プロバイダシステムの機械学習出力から恩恵を受けている当事者、エンティティ又は会社を指す。消費者は、自身の機械学習モデルを改善するために、プロバイダシステムの機械学習出力を使用し得る。いくつかのケースでは、消費者は、別の機械学習モデルにより生成される出力を使用する機械学習モデルの所有者であり得る。例えば、消費者は、トレーニング段階中に消費者の機械学習モデルをトレーニングするための、及び／又は生産段階において又はモデルの配備後に予測を行うための、プロバイダシステムにより提供される出力を受信し及び使用し得る。

[0027] 本明細書において利用されるように、用語「コンポーネント」、「システム」「インターフェース」、「ユニット」などは、コンピュータ関連エンティティ、ハードウェア、ソフトウェア（例えば実行中の）、及び／又はファームウェアを指すように意図されている。例えば、コンポーネントは、プロセッサ、プロセッサ上で実行するプロセス、オブジェクト、実行ファイル、プログラム、ストレージデバイス、及び／又はコンピュータであり得る。例示として、サーバ上で実行するアプリケーション及びサーバはコンポーネントであり得る。１つ又は複数のコンポーネントがプロセス内に常在し得、１つのコンポーネントは１つのコンピュータ上に局所化され得る及び／又は２つ以上のコンピュータ間に分散され得る。

[0028] さらに、これらのコンポーネントは、その上に格納された様々なデータ構造を有する様々なコンピュータ可読媒体から実行し得る。コンポーネント同士は、１つ又は複数のデータパケットを有する信号に従ってローカル及び／又はリモートプロセスを介し通信し得る（例えば、１つのコンポーネントからのデータは、ローカルシステム内の、分散システム内の、及び／又はネットワーク（例えばインターネット、ローカルエリアネットワーク、広域ネットワークなど）上の別のコンポーネントと相互作用する、例えば信号を介し他のシステムと相互作用する）。

[0029] 別の例として、コンポーネントは、電気的又は電子的回路構成により操作される機械コンポーネントにより提供される特別な機能性を有する装置であり得；電気的又は電子的回路構成は、１つ又は複数のプロセッサにより実行されるソフトウェアアプリケーション又はファームウェアアプリケーションにより操作され得る；１つ又は複数のプロセッサは装置の内部また外部にあり得、ソフトウェア又はファームウェアアプリケーションの少なくとも一部を実行し得る。さらに別の例として、コンポーネントは機械部品無しに電子コンポーネントを介し特別な機能性を提供する装置であり得；電子コンポーネントは、電子コンポーネントの機能性を少なくとも部分的に与えるソフトウェア及び／又はファームウェアを実行するために１つ又は複数のプロセッサを含み得る。いくつかのケースでは、コンポーネントは仮想機械（例えばクラウド計算システム内の）を介し電子コンポーネントをエミュレートし得る。

[0030] データセットをトレーニングすることは制限され得、且つ稀であり得る。上述のように、機械学習モデルの性能は得トレーニングデータセットの量により制限され得る。本開示の方法及びシステムは、プロバイダ機械学習モデルからの出力（例えば予測、スコア）によりトレーニングするための入力特徴セットを増強することにより、消費者機械学習モデルの精度、品質及び性能を改善し得る。いくつかのケースでは、プロバイダシステムにより生成される出力は、消費者モデルをトレーニングするために設定される最適入力特徴を形成するために、ローカル／プライベートデータの選択された入力特徴と連結され得る。消費者モデルの性能は、ローカルデータだけを使用するモデルの性能又はプロバイダモデルの性能を越えて改善され得る。

[0031] プロバイダモデルにより生成されるモデル出力を利用することは有益には、消費者システム及びプロバイダシステムの両方が、それ自身のデータセットをプライベート、分離、及び安全状態に維持することを可能にする。消費者システム及びプロバイダシステムは、安全且つプライベートである。例えば、消費者システム及びプロバイダシステム上のデータ、モデル設計、モデル重み付け又はコードは可視でない、すなわち互いにアクセス不能である。

[0032] 安全性及びプライバシーは、消費者機械学習モデルのトレーニング、開発、検証、生産化及び配備全体にわって維持され得る。モデル生成時又は予測時に、消費者システムは、プロバイダモデルにより生成される出力及び消費者ローカルデータの両方を入力として取り入れることにより予測を行い得る。トレーニング段階と同様に、データ、モデル設計、モデル重み付け又はコードは、それぞれ消費者システム及びプロバイダシステム上で分離され且つ安全にされたままであり得る。

[0033] モデル出力は、集積点（integration point）を介し、プロバイダシステムから消費者システムへ渡され得る。集積点は、消費者機械学習モデルをトレーニングするための入力特徴（トレーニングデータ）の一部としてプロバイダシステムからのモデル出力を自動的に集積し得る。集積点はまた、推測又は予測段階中に予測を行うための入力特徴の一部としてプロバイダシステムから消費者モデルへ転送されるモデル出力を自動的に集積し得る。これは、プロバイダのデータ又はモデルコンテンツを露出することなく、適応的且つ普遍的方式で機械学習モデル出力をサービスすることを可能にするので有益である。プロバイダ機械学習モデルからのモデル出力を消費者機械学習モデルへ渡すように構成された集積点は、一方向性であり得る。集積点は、データ処理装置による実行のために又はデータ処理デバイスの操作を制御するためにコンピュータストレージ媒体上で符号化される１つ又は複数のコンピュータプログラム（すなわちコンピュータプログラム命令の１つ又は複数のモジュール）として実現され得る。集積点に関する詳細は本明細書の後で説明される。

[0034] 上述のように、モデル出力はトレーニング及び予測中にプロバイダシステムから消費者システムへ送信され得る。プロバイダシステムから消費者システムへ渡されるモデル出力は、例えば確率スコア、ニューラルネットワークの最上（すなわちロジット）層出力、又はこれら両方の組み合わせを含み得る。いくつかのケースでは、データはまたプロバイダ入力特徴を含み得る。例えば、プロバイダ入力特徴及びプロバイダ機械学習モデルにより生成される対応予測は、ペアのデータセットを形成し得る。ペアのデータセットは、教師有り学習のために消費者システムへ転送され得る。スコア（又は予想値）などのモデル出力は、プロバイダ機械学習モデル設計とプロバイダ機械学習モデル入力データタイプとに依存して、多くの異なるフォーマットのものであり得る。例えば、分類モデルに関して、モデル出力はクラスの予想値だけでなく予想値の確率も含み得る；回帰モデルに関して、モデル出力は予測数値を含み得る；画像分類モデルに関して、モデル出力は、画像内のオブジェクトのクラス、又は特定特徴が発見されたかどうかを示すブーリアンを含み得る。

[0035] 図１は、２つのエンティティ（例えばプロバイダ及び消費者）間でデータを活用する従来のアーキテクチャを示す。従来のアーキテクチャでは、データ（例えば消費者データ、プロバイダデータ）の少なくとも１つ、モデル設計（例えば、モデルアーキテクチャ）、モデル重み付け（例えば消費者機械学習モデルの重み付け、プロバイダ機械学習モデルの重み付け）又はコードは１つのエンティティ又は両エンティティへ露出される。

[0036] 図２は、本発明のいくつかの実施形態による、プロバイダシステムと消費者システムとの間でデータを活用する方法を概略的に示す。上述のように、プロバイダ機械学習モデル２０３により生成されるモデル出力２０５は、消費者機械学習モデル２１３をトレーニングするために、又は消費者機械学習モデル２１３の配備後に予測を行うための入力特徴として消費者データ２１１と組み合わせて使用されるために、消費者システムへ渡され得る。消費者機械学習モデル２１３の性能、精度又は品質は、増強されたモデル出力２１５が生成されるように改善され得る。プロバイダデータ２０１及び消費者データ２１１は、消費者機械学習モデルのトレーニング、開発、検証、生産化及び配備全体にわたり、プロバイダシステム及び消費者システムそれぞれの上で分離され且つ安全にされたままであり得る。

[0037] プロバイダデータ２０１は、プロバイダシステムへアクセス可能であるデータストレージユニット２０７（又はデータレポジトリ）内に格納され得る。データストレージユニット２０７は、消費者システムへアクセス可能でなくてもよい、すなわちアクセス不能であってもよい。データレポジトリ２０７は、プロバイダデータを格納するためのローカルストレージレポジトリ又はクラウドストレージであり得る。プロバイダデータは、プロバイダ機械学習モデルをトレーニングするためのトレーニングデータセット（例えば特徴ベクトル、ラベル付きデータなど）、モデル設計（例えばモデルアーキテクチャ）、モデル重み付け（例えばハイパーパラメータ、プロバイダ機械学習モデルの重み付け）、プロバイダモデルシステムのコンポーネントの入力データ及び出力データ、歴史的データ、プロバイダシステムに関連付けられたコード、及び本明細書の他の箇所で説明される様々な他のデータを含み得る。

[0038] 同様に、消費者データ２１１は、消費者システムへアクセス可能であるデータストレージユニット２１７（又はデータレポジトリ）内に格納され得る。データストレージユニット２１７は、プロバイダシステムへアクセス可能でなくてもよい、すなわちアクセス不能であってもよい。データレポジトリ２１７は、消費者データを格納するためのローカルストレージレポジトリ又はクラウドストレージであり得る。消費者データは、ローカル又はプライベートデータ、消費者機械学習モデルをトレーニングするためのトレーニングデータセット（例えば特徴ベクトル、ラベル付きデータ、プロバイダシステムからの出力データなど）、モデル設計（例えばモデルアーキテクチャ）、モデル重み付け（例えばハイパーパラメータ、消費者機械学習モデルなどの重み付け）、消費者モデルシステムのコンポーネントの入力データ及び出力データ、歴史的データ（例えばフィールド内データ、予測結果、評価データ、性能メトリックなど）、消費者機械学習モデルをトレーニングするためのパラメータ（例えば性能メトリックのための閾値等）、消費者システムに関連付けられたコード、及び本明細書の他の菓舗で説明される様々な他のデータを含み得る。

[0039] プロバイダシステムから消費者システムへ渡されるモデル出力２０５は、例えば確率スコア、ニューラルネットワークの最上（例えばロジット）層出力、又はこれら両方の組み合わせを含み得る。いくつかのケースでは、モデル出力２０５はまた、プロバイダ入力特徴を含み得る。このようなプロバイダ入力特徴は、消費者機械学習モデルをトレーニングするために使用され得る。例えば、プロバイダ入力特徴は、消費者機械学習モデルをトレーニングするためのラベル付きデータ、又は入力特徴として使用され得るグラウンドトゥルースデータ（例えばラベル付きデータ）を含み得る。このような場合、モデル出力と共に、ラベル付きデータは教師有り学習のために消費者システムへ転送され得る。スコア（又は予想値）などのモデル出力は、プロバイダ機械学習モデル設計とプロバイダ機械学習モデル入力データタイプとに依存して、多くの異なるフォーマットであり得る。例えば、分類モデルに関し、モデル出力はクラスの予想値だけでなく予想値の確率も含み得る；回帰モデルに関し、モデル出力は予測数値を含み得る；画像分類モデルに関し、モデル出力は、画像内のオブジェクトのクラス、又は特定特徴が発見されたかどうかを示すブーリアンを含み得る。

[0040] 図３は、本発明の実施形態による連続機械学習システム３００を概略的に示す。いくつかの実施形態では、連続機械学習システム３００は、１つ又は複数のプロバイダシステム３０１及び１つ又は複数の消費者システム３１１を含み得る。１つ又は複数のプロバイダシステム３０１により生成されるモデル出力３０７は、集積点を介し、１つ又は複数のプロバイダシステム３０１から１つ又は複数の消費者システム３１１へ渡され得る。

[0041] 集積点は、消費者機械学習モデル３１３をトレーニングするための入力特徴として、モデル出力３０７と消費者データセット３１５とを自動的に集積し得る。集積点は一方向性であり得る。集積点は、モデル出力をプロバイダシステム３０１から消費者システム３１１へ渡すように構成され得る。集積点は、ソフトウェア、ハードウェア、ファームウェア、埋め込み型ハードウェア、スタンドアロンハードウェア、特殊用途ハードウェア又はこれらの任意の組み合わせで実現され得る。集積点はプロバイダシステム、消費者システム、又はこれら両システム上に設けられ得る。集積点は、プロバイダデータ３０５及び消費者データ３１５それぞれがプロバイダシステム及び消費者システム上で分離され且つ安全にされたままとなるように、プロバイダシステム３０１と消費者システム３１１との間の緩い接続として機能し得る。データ（例えば消費者データ、プロバイダデータ）、モデル設計（例えばモデルアーキテクチャ）、モデル重み付け（例えば消費者機械学習モデルの重み付け、プロバイダ機械学習モデルの重み付け）並びにプロバイダ及び消費者に関連付けられたコードなどの情報は、互いに不可視である。

[0042] 集積点は、プロバイダシステムにより提供される出力データ又はトレーニングサンプルデータと消費者システムのローカルデータとを連結するように構成され得る。いくつかのケースでは、プロバイダシステムにより提供されるデータと消費者システムのローカルデータは、共通特徴識別子（ＩＤ）などのいくつかの共通特徴により連結され得る。これは、プロバイダのデータ又はモデルコンテンツを露出することなく、適応的且つ普遍的方式で機械学習モデル出力をサービスすることを可能にするので有益である（逆も同様である）。集積点は、下位機械学習モデル／アルゴリズムのアーキテクチャ又はタイプにかかわらず、プロバイダシステムから出力されるモデルを消費者システムのローカルデータへ適応的に集積し得る。例えば、モバイル広告アプリケーションでは、消費者プライベートデータとプロバイダシステムにより提供されるトレーニングサンプルデータとを連結するための、モバイルデバイス広告（Ａｄ）ＩＤ及び発行者名などの共通特徴ＩＤが使用され得る。例えば、クリックスルー率（ｃｔｒ：click-through rate）予測では、プロバイダシステムから転送される１つのサンプルデータセットは以下のものを含み得る：（ｉ）モバイルデバイスＡｄＩＤ、（ｉｉ）Ａｄ押下がなされた発行者の名前、（ｉｉｉ）プロバイダモデルの予測ｃｔｒ、及び（ｉｖ）変換結果（例えば、ユーザがクリックしたか否か、ユーザがランディングウェブページに名前を登録したか否か等）。いくつかのケースでは、サンプルデータセット毎に、消費者システム又は集積点は、消費者のトレーニングデータセットを生成するために、消費者プライベート／ローカルデータ（例えば、各モバイルＡｄＩＤが獲得された製品、モバイルＡｄＩＤを使用するｅコマースアプリ）に由来するプライベート特徴を付加し得る。例えば、プライベート特徴及び（ｉｉｉ）プロバイダモデルの予測ｃｔｒが入力特徴を形成し得、及び（ｉｖ）プロバイダシステムから転送される変換結果は消費者機械学習モデルをトレーニングするためのラベル付きデータとして使用され得る。集積点は、図６に関して本明細書で後にさらに説明される。

[0043] プロバイダ機械学習モデル３０３及び消費者機械学習モデル３１３は、同じ目的を持たなくてもよい。例えば、消費者機械学習モデルは、Ａｄクリック、製品購入及びアプリケーションインストールなどの標的変換の確率を予測するようにトレーニングされ得、プロバイダ機械学習モデルは、クリックスルー率（ｃｔｒ）及び獲得率を介し、クリックなどの予測を行い得る。例えば、プロバイダ機械学習モデルがｃｔｒを予測し得、消費者機械学習モデルはアプリインストール確率を予測し得る。この場合、消費者システムにアクセス可能であるがプロバイダシステムにアクセス不能であるプライベート又はローカルデータは少なくともアプリインストールラベル（例えば、ユーザが広告アプリをインストールしたか否か）を含み得る。代わりに又は加えて、プロバイダ機械学習モデル３０３及び消費者機械学習モデル３１３は同じ目的を持ってもよい。例えば、プロバイダ機械学習モデル及び消費者機械学習モデルの両方は、クリックラベルを使用すること（例えば、ユーザがクリックしたか否か）によりｃｔｒを予測し得、予測性能（例えば精度）は、プライベートデータ及びプロバイダデータの両方を利用することにより改善され得る。

[0044] プロバイダ機械学習モデル３０３及び消費者機械学習モデル３１３は、同じアーキテクチャ、パラメータ、又は他のモデル設計パラメータを有しても有しなくてもよい。プロバイダ機械学習モデル３０３により提供されるデータ（例えば機械学習モデル出力）はそれぞれの機械学習モデルのアーキテクチャ、タイプ又はコンテンツにかかわらず、普遍的方式で消費者機械学習モデル３１３により使用され得る。例えば、プロバイダ機械学習モデル３０３がＣＮＮアーキテクチャを有し得、消費者機械学習モデル３１３はランダムフォレストアーキテクチャを有し得る。別の例では、プロバイダ機械学習モデル３０３は教師無し学習手法を使用することによりトレーニングされ得、消費者機械学習モデル３１３は教師有り学習技術を使用することによりトレーニングされ得る。

[0045] 図４は、本明細書において提供される連続機械学習システムにおいて行われるトレーニングプロセス４００の一例を示す。プロバイダシステムは、消費者システムへ転送されるデータ（消費者機械学習モデルをトレーニングするための）を生成するように構成され得る（操作４０１）。いくつかのケースでは、転送されるデータはプロバイダ機械学習モデル出力を含み得る。いくつかのケースでは、データは、プロバイダ入力特徴とプロバイダ機械学習モデルにより生成されるモデル出力との両方を含み得る。例えば、プロバイダ入力特徴及び対応予測はペアのデータセットを形成し得、並びにペアのデータセットは教師有り学習のために消費者システムへ転送され得る。いくつかのケースでは、プロバイダ機械学習モデルにより生成される出力は、教師有り学習のためのラベル付きデータとして使用され得る。いくつかのケースでは、プロバイダのトレーニングデータセットのラベル付きデータは、消費者機械学習モデルをトレーニングするためのラベル付きデータとして使用され得る。代替的に、プロバイダ機械学習モデルにより提供されるデータはラベル付きデータを含まなくてもよく、したがってこのデータは消費者機械学習モデルのための入力特徴を生成するために使用され得る。いくつかのケースでは、消費者システムへ転送されるデータは、プロバイダのニューラルネットワークの最上（例えばロジット）層の出力を含み得る。ニューラルネットワークアーキテクチャの場合、Ｋレベルニューラルネットワークの層ｋにおけるニューロンの出力ベクトルはａ＿ｋ＝ｆ＿ｋ（Ｗ＿ｋ’ａ＿｛ｋ－１｝）として定義され得、ここで、ｆ＿ｋ（．）は層ｋの活性化関数であり、Ｗ＿ｋはモデル重み付けの行列であり、及びａ＿０は入力層（符号化された入力特徴）である。プロバイダモデルの出力すなわち最終予測（例えば予測ｃｔｒ）は、次にシグモイド（ａ＿Ｋ’ｗ＿Ｋ）として計算され、ここでｗ＿Ｋは最上層の重みベクトルである。この例では、予測ｃｔｒの代わりに／又はこれに加えて、最上層の出力ａ＿Ｋが消費者システムへ転送され得る。

[0046] いくつかのケースでは、消費者システムへ転送されるデータは、サービス要求を受信することに応答して生成され得る。サービス要求は所望モデル出力又は転送されるデータを指示し得る。いくつかのケースでは、サービス要求は、モデル出力が送信される送付先に関する情報（例えば消費者システムＩＤ／アドレス、消費者機械学習モデルＩＤなど）、要求の目的（例えば、モデルをトレーニングするため、予測を行うための）、要求データのタイプ（例えばモデル出力、モバイルデバイス広告（Ａｄ）ＩＤ、データを連結するための発行者名などの特徴）、データセットの量（例えば転送されるデータの量）等を含み得る。

[0047] 次に、消費者機械学習モデルをトレーニングするためのトレーニングデータセットを生成するために使用されるデータが、消費者システムへ転送され得る（操作４０２）。このデータは、定期的又はオンデマンド方式で転送され得る。例えば、このデータは、プロバイダシステムにデータを消費者システムへ提供することを要求する命令を受信すると転送され得る。

[0048] プロバイダシステムから転送されるデータは、トレーニングデータセット又は評価データセットを形成するために消費者プライベートデータと連結され得る（操作４０４）。消費者機械学習モデルをトレーニングするためのトレーニングデータセット及び／又は評価データセットは、転送されたデータ（プロバイダ）及び消費者入力特徴の両方からの入力特徴を含み得る。本明細書の他のどこかで説明されるように、いくつかのケースでは、プロバイダ機械学習モデルにより提供されるデータの少なくとも一部は、消費者モデルをトレーニングする（例えば教師有り学習の）ためのラベル付きデータとして使用され得る。代替的に、プロバイダ機械学習モデルにより提供されるデータは、ラベル付きデータを含まなくてもよく、したがって転送されたデータは、消費者機械学習モデルのための入力特徴を生成するために使用され得る。

[0049] 転送されたデータと連結される消費者入力特徴は複数の入力特徴から選択され得る（操作４０３）。いくつかのケースでは、消費者データは複数の入力特徴（各モバイルＡｄＩＤが獲得される製品、モバイルＡｄＩＤを使用するｅコマースアプリなど）を抽出するために前処理され得る。トレーニングデータセット又は評価データセットはまた、ウェブサイト変換（例えば広告クリック、製品購入、アプリケーションインストール等）などの消費者プライベートデータに由来するラベル付きデータを含み得る。いくつかのケースでは、初期組の１つ又は複数の消費者入力特徴が選択され得る。消費者機械学習モデルの性能が十分でなければ（例えば、性能が閾値をパスしなければ）、新しいトレーニングデータセットを生成するために転送データと組み合わせるための異なる組の消費者入力特徴が選択され得る。このプロセスは、モデル評価が基本評価（最適組の入力特徴が判断され得る）を越えて改善されるまで反復され得る。

[0050] トレーニングデータセットは、プロバイダシステムにより提供されるデータと選択された消費者入力特徴とを連結することにより生成され得る。いくつかのケースでは、これらのデータは共通特徴識別子（ＩＤ）により連結され得る。例えば、消費者入力特徴データとプロバイダシステムにより提供されるトレーニングサンプルデータとを連結するためのモバイルデバイス広告（Ａｄ）ＩＤ及び発行者名などの共通特徴ＩＤが使用され得る。例えば、クリックスルー率（ｃｔｒ）予測では、プロバイダシステムから転送される１つのサンプルデータセットは以下のものを含み得る：（ｉ）モバイルデバイスＡｄＩＤ、（ｉｉ）Ａｄ押下がなされた発行者の名前、（ｉｉｉ）プロバイダモデルの予測ｃｔｒ、及び（ｉｖ）変換結果（例えば、ユーザがクリックしたか否か、ウェブサイト変換率など）。いくつかのケースでは、サンプルデータセット毎に、選択された消費者入力特徴（例えば各モバイルＡｄＩＤが獲得される製品、モバイルＡｄＩＤを使用するｅコマースアプリ）が、消費者のトレーニングデータセットを生成するためにサンプルデータセットへ付加され得る。例えば、プライベート特徴及び（ｉｉｉ）プロバイダモデルの予測ｃｔｒが入力特徴を形成し得、及び（ｉｖ）プロバイダシステムから転送される変換結果は、消費者機械学習モデルをトレーニングするためのラベル付きデータとして使用され得る。

[0051] トレーニングプロセス（操作４０５）中、モデルが評価され得（操作４０６）、及び１つ又は複数の性能メトリックが計算され得る。いくつかのケースでは、評価は、性能が十分かどうかを判断する（操作４０７）ために基本評価又は閾値（プロバイダモデル評価）と比較され得る。任意の好適なメトリックが、評価の性能メトリックとして選択され得る。メトリックは、モデル及びデータタイプ、目的、アプリケーションなどに基づき選択され得る。例えば、入力データが画像データを含めば、評価メトリックは、限定しないがピーク信号対雑音比（ＰＳＮＲ：Peak-Signal-to-Noise-Ratio）、正規化二乗平均平方根誤差（ＲＭＳＥ：Root-Mean-Squared-Error）、構造類似性指標（ＳＳＩＭ：Structural Similarity Index）、ソフトマックスエントロピー（softmax cross entropy）等を含み得る。

[0052] いくつかのケースでは、性能メトリックが計算され及び閾値と比較され得る（操作４０７）。例えば、トレーニングされた分類器の性能メトリックはソフトマックス（softmax）エントロピーであり得、閾値はプロバイダシステムの分類器のソフトマックスエントロピーであり得る。閾値は固定値又は所定閾値であってもよいし動的に判断されてもよい。

[0053] モデル評価が基本評価より良ければ、又はトレーニングされたモデルの性能が閾値をパスすれば、トレーニングされたモデルが予測のために配備され得る（操作４０８）。モデル評価が基本評価より良くなければ、転送されたデータと組み合わせるための異なる組の消費者入力特徴が、新しいトレーニングデータセットを生成するために選択され得る。このプロセスは、モデル評価が基本評価を越えて改善されるまで反復され得る（例えば、操作４０３～４０７が反復される）。

[0054] 消費者機械学習モデルをトレーニングするための入力特徴は連続的に更新され得る。例えば、プロバイダシステムは、モデル出力を連続的に生成し、消費者システムへ渡し得る。いくつかのケースでは、消費者システム上で行われるトレーニングプロセス中に使用される入力特徴は定期的に更新され得る。代わりに又は加えて、モデル出力は、オンデマンド方式で消費者システムへ渡され得る。

[0055] 図５はいくつかの実施形態による方法を示すが、当業者は様々な実施形態のための多くの適応化が存在するということを認識することになる。例えば、これらの操作は任意の順番で行われ得る。これらの操作のいくつかは排除され得る、これらの操作のいくつかは一工程内に同時に行われ得る、これらの操作のいくつかは反復され得、及びこれらの操作のいくつかは他の操作の副工程を含み得る。例えば、教師無し学習又は準教師有り学習がプロバイダ機械学習モデル及び／又は消費者機械学習モデルをトレーニングするために使用され得る。このような場合、トレーニングプロセスはラベル付きデータをほとんど必要としなくてもよい。本方法はまた、本明細書において提供される開示の他の態様に従って修正され得る。

[0056] 図５は、予測プロセス５００の一例を示す。提供される方法及びシステムは、プロバイダから受信されるデータに応答して動的に更新される消費者モデル予測を可能にし得る。消費者モデルは、プロバイダシステムにより提供されるデータ及び消費者プライベートデータに基づき予測を行い得る。

[0057] プロバイダシステムは、サービス要求に応答して消費者システムへサービスされる入力特徴を生成し得る（操作５０１）。サービス要求は所望モデル出力を指示し得る。いくつかのケースでは、サービス要求は、モデル出力が送信される送付先に関する情報（例えば消費者システムＩＤ、消費者機械学習モデルＩＤなど）、要求の目的（例えば、モデルをトレーニングするための、予測を行うための）、要求データのタイプ（例えばモデル出力、最上層出力、プロバイダ入力特徴、モバイルデバイス広告（Ａｄ）ＩＤ、データを連結するための発行者名などの特徴などの１つ又は複数の共通特徴）等を含み得る。サービス要求は予測を行うための任意のサービス要求であり得る。例えば、サービスは、クラウドクライアントのキャンペーンを広告するためのＡｄ押下入札要求（押下機会）であり得る。入札要求は、ユーザ及び広告インベントリに関する情報（ユーザの広告ＩＤ、ユーザのジオロケーション、発行者名、及び広告創作フォーマットなど）を含み得る。サービス要求は、サービス要求のキー属性又は特徴データ（入札ＩＤ、ユーザ広告ＩＤ、広告インベントリＩＤ、ユーザロケーション及び発行者名など）を含み得る。

[0058] プロバイダは、プロバイダ機械学習モデルを使用することにより予測を生成し得る（操作５０２）。いくつかのケースでは、予測は消費者システムにアクセス可能であるプロバイダデータに基づき生成され得る。次に、プロバイダ機械学習モデル出力（例えば予測）が消費者システムへ渡され得る（操作５０３）。消費者システムは、プロバイダシステムから送信されたデータを共通特徴ＩＤなどの公開入力特徴と共に受信し得る（操作５０４）。次に、消費者システムは、消費者入力特徴を操作５０４において受信されたデータへ付加し、及び消費者機械学習モデルを使用することにより予測を生成し得る（操作５０５）。

[0059] プロバイダ機械学習モデルにより生成された出力は、任意の好適な頻度で消費者システムへ提供され得る。例えば、予測毎に新しいモデル出力が要求され及び提供され得る。別の例では、複数予測のための新しいモデル出力が要求され及び提供され得る。

[0060] 本開示の方法及びシステムは、任意のタイプの機械学習アルゴリズム、アーキテクチャ又は手法へ適用され得るということに注意すべきである。プロバイダシステム及び消費者システムは同じ機械学習アルゴリズムを使用し得る。プロバイダシステム及び消費者システムは異なる機械学習アルゴリズムを使用し得る。機械学習アルゴリズムはニューラルネットワークなどの任意のタイプにより実現され得る。ニューラルネットワークの一例は深層ニューラルネットワーク、畳み込みニューラルネットワーク、（ＣＮＮ：convolutional neural network）、及び再帰型ニューラルネットワーク（ＲＮＮ：recurrent neural network）を含む。機械学習アルゴリズムは以下のうちの１つ又は複数を含み得る：サポートベクトル機械（ＳＶＭ：support vector machine）、単純ベイズ分類（naive Bayes classification）、線形回帰、分位点回帰、ロジスティック回帰（ランダムフォレスト）、ニューラルネットワーク、ＣＮＮ、ＲＮＮ、勾配ブースト型（gradient-boosted）分類器又は抑制器、又は別の教師有り又は教師無し機械学習アルゴリズム（例えば敵対的生成ネットワーク（ＧＡＮ：generative adversarial network）、サイクルＧＡＮなど）。

[0061] 本開示の方法及びシステムは様々なシナリオへ適用され得る。一例では、プロバイダは、クラウドサービスとしてプログラム式入札プラットホームをゲーム発行者及びｅコマース会社などのクライアントへ提供するオンライン広告会社であり得る。消費者は、広告クラウドサービスプロバイダと共有し得ないプロプライエタリユーザデータを有する１つ又は複数のクライアント、ゲーム発行者及びｅコマース会社を含み得る。広告クラウドサービスプロバイダは、クライアント（消費者）が広告キャンペーンを設定し及び運営し得るプラットホームを提供し、機械学習モデルを使用することによりリアルタイム入札交換から広告インベントリを購入し、並びに広告キャンペーンの結果を追跡し得る。このようなオンライン広告キャンペーンでは、どのように適切ユーザを標的とするか及びどのように様々な広告インベントリを値付けするか（広告押下）についての決定は、広告クリック、製品購入及びアプリケーションインストールなどの標的変換の確率を予測し得る機械学習モデルにより行われる。精確な機械学習モデルを構築することは、ユーザ振る舞い及び広告インベントリの有効性に関する大量のデータを必要とし得る。オンライン広告に対するユーザの応答及び広告インベントリの有効性は（大量の）広告キャンペーンを実行することにより学習され得るので、このようなデータを取得するために時間だけでなく多くの（広告）支出を要する。広告クラウドクライアント（消費者）がこの挑戦的課題を克服するのを助け、及び機械学習モデル及び広告業務を始めから成功裏に構築するために、広告クラウドサービスプロバイダはサービスとして機械学習予測を提供し得る。プロバイダは、オンライン広告キャンペーンの成功ための大量のデータ及び先進的機械学習モデルを既に有する。プロバイダのプロプライエタリデータ（消費者プロプライエタリデータ無し）及び機械学習モデルを使用することにより、プロバイダは、クリックスルー率及び広告クラウドクライアントのキャンペーンを広告するための入力入札要求（押下機会）の獲得率などの予測を行い得る。次に、プロバイダのシステムは、深層ニューラルネットワークの最上層の予測クリックスルー率及び／又は出力などのプロバイダの機械学習モデルからの出力と共に広告インベントリＩＤ、ユーザロケーション、並びにユーザＩＤなどの入札要求のキー属性を消費者のシステムへ送信する。消費者のシステムは、プロバイダの予測結果を取り入れ、これとそのプロプライエタリユーザデータとを連結し、及び連結されたデータセットを第２の機械学習モデルへの入力として使用する。第２の機械学習モデルの精度はプロバイダの第１の機械学習モデルを越えて改善され得る。第２の機械学習モデルの性能は、プロバイダの機械学習モデルの性能と、消費者システムのプロプライエタリユーザデータだけを使用することによりトレーニングされた機械学習モデルの性能とを超えて改善され得る。プロバイダのプロプライエタリデータ及びモデル設計は消費者のシステムに対して可視ではなく、且つ消費者のプロプライエタリデータ及びモデル設計はプロバイダのシステムに対して可視ではない。

[0062] 図６は、連続機械学習システム６００内の消費者システム６１０及びプロバイダシステム６２０とインターフェースする集積コンポーネント６３０の一例を示す。プロバイダシステム６２０は、集積コンポーネント６３０を介しモデル出力６２２，６２２－Ｎを１つ又は複数の消費者システム６１０，６１０－Ｎへ提供し得る。１つ又は複数の消費者システム６１０，６１０－Ｎへ提供されるモデル出力６２２，６２２－Ｎは同じでなくてもよい。例えば、１つ又は複数の消費者システム６１０，６１０－Ｎへ提供されるモデル出力６２２，６２２－Ｎは異なる消費者モデルをトレーニングするために使用され得る。集積コンポーネント６３０は本明細書の他のどこかで説明した集積点と同じであり得る。いくつかのケースでは、集積コンポーネント６３０は、消費者機械学習モデルをトレーニングするための及び予測を行うための入力データ６３２，６３２－Ｎを形成するためにモデル出力６２２，６２２－Ｎと消費者プライベートデータとを連結するように構成され得る。

[0063] プロバイダシステム６２０は、複数のコンポーネントを含み得る。いくつかの実施形態では、複数のコンポーネントは、限定しないがモデル予測モジュール６２１、モデルトレーニングモジュール６２３、ユーザインターフェースモジュール６２５及びデータ通信モジュール６２７を含み得る。

[0064] モデル予測モジュール６２１は、トレーニングされたモデルを使用することにより予測を行うように構成され得る。次に、消費者学習モジュールをトレーニングするための及び／又は図４及び図５に関する本開示方法に準拠する推測を行うためのモデル出力（例えば予測）６２２が、消費者システム６１０へ転送され得る。例えば、消費者機械学習モデルが予測を行うために配備される場合、モデル予測モジュール６２１は、消費者機械学習モデルによりさらに処理される入力データ６３２を生成するために使用されるモデル出力を生成するためにプロバイダ機械学習モデルを実行し得る。

[0065] モデルトレーニングモジュール６２３は１つ又は複数のプロバイダ機械学習モデルをトレーニングするように構成され得る。１つ又は複数のプロバイダ機械学習モデルはプロバイダデータに基づきトレーニングされ得る。プロバイダデータはデータベース６２９などのデータレポジトリ内に格納され得る。

[0066] ユーザインターフェースモジュール６２５は、ユーザデバイス上で実行するユーザインターフェースを提供するように構成され得る。いくつかのケースでは、ユーザ又は消費者は、モデル出力サービスを取得するためにプロバイダモデルセットからモデルを選択することを許可され得る。例えば、ユーザは、要求されたアプリケーションフィールド（例えばクリックスルー率予測）、要求されたデータタイプのモデル出力、又は適切なプロバイダ機械学習モデルを選択するための他の情報を入力し得る。ユーザはグラフィックユーザインターフェース（ＧＵＩ）及びウェブベースユーザインターフェースを介しサービスを選択し得る。

[0067] グラフィックユーザインターフェース（ＧＵＩ）は、テキストベースインターフェース、タイプされる命令ラベル又はテキストナビゲーションとは対照的に、グラフィックアイコン並びに二次表記法などの視覚的指示子を介しユーザが電子デバイスと相互作用することを可能にするタイプのインターフェースである。ＧＵＩにおける行為は通常、グラフィック要素の直接操作を介し行われる。コンピュータに加えて、ＧＵＩは、ＭＰ３プレーヤなどの携帯デバイス、ポータブル媒体プレーヤ、ゲームデバイス並びに小型家庭、オフィス及び工業機器内に見出され得る。ＧＵＩは、ソフトウェア、ソフトウェアアプリケーション、ウェブブラウザなど内に提供され得る。ＧＵＩは、ユーザデバイス又は消費者システム（例えばモバイルデバイス、パーソナルコンピュータ、パーソナルデジタルアシスタント、クラウド計算システムなど）上に表示され得る。ＧＵＩはモバイルアプリケーション又はウェブアプリケーションを介し提供され得る。

[0068] いくつかのケースでは、グラフィックユーザインターフェース（ＧＵＩ）又はユーザインターフェースはディスプレイ上に提供され得る。ディスプレイはタッチスクリーンであってもなくてもよい。ディスプレイは、発光ダイオード（ＬＥＤ）画面、有機発光ダイオード（ＯＬＥＤ）画面、液晶ディスプレイ（ＬＣＤ）画面、プラズマ画面又は任意の他のタイプの画面であり得る。ディスプレイはアプリケーションを介し（例えばユーザデバイス又は消費者システム上又はクラウド上で実行されるアプリケーションプログラムインターフェース（ＡＰＩ）を介し）描写されるユーザインターフェース（ＵＩ）又はグラフィックユーザインターフェース（ＧＵＩ）を示すように構成され得る。

[0069] データ通信モジュール６２７はデータをプロバイダシステムから消費者システムへ送信するように構成され得る。いくつかのケースでは、データ通信モジュールは一組の送信規則に基づきデータを送信し得る。例えば、モデル出力６２２，６２２－Ｎをサービスするための１つ又は複数の規則が設定され得る。一組の送信規則は、送信頻度、送信されるデータ（例えばデータの選択、データの量、バッチデータ、ストリームデータなど）、送信の送付先等に関する情報を含み得る。例えば、要求に応答してモデル出力を送信する頻度が送信規則内に設定され得る。モデル出力又はデータの送信は、消費者機械学習モデルにより行われる各予測に関し又は所定数の予測に関し行われ得る。別の例では、モデル出力又はデータが送信される送付先（例えば消費者モデルＩＤ、消費者システム、ＩＤ／アドレスなど）が規則内に設定され得る。送信規則はまた、どのように（バッチデータ（例えばトレーニングするための）の形式で又はデータストリーム（例えば予測を行うための）の形式で）データが送信されるべきかを指示し得る。いくつかのケースでは、一組の送信規則はプロバイダシステムにより自動的に設定され得る。代わりに又は加えて、１つ又は複数の送信規則は、ユーザデバイス上で実行するＧＵＩ又はウェブブラウザを介するなどして消費者又はユーザにより設定され得る。

[0070] データベース６２９はプロバイダシステム６２０にアクセス可能であり得る。データベース６２９は消費者システム６１０にアクセス不能であり得る。データベース６２９は、プロバイダ機械学習モデルをトレーニングするためのトレーニングデータセット（例えば特徴ベクトル、ラベル付きデータなど）、モデル設計（例えばモデルアーキテクチャ）、モデル重み付け（例えばハイパーパラメータ、プロバイダ機械学習モデルの重み付けなど）、プロバイダモデルシステムのコンポーネントの入力データ及び出力データ、歴史的データ（例えばモバイルデバイスＡｄＩＤ、発行者、変換結果などの名前）、又はプロバイダシステムに関連付けられたコードなどのプロバイダデータを格納し得る。いくつかのケースでは、データベースはまた、上述のような送信規則に関するデータを格納し得る。

[0071] 消費者システム６１０は複数のコンポーネントを含み得る。いくつかの実施形態では、複数のコンポーネントは、限定しないがモデル予測モジュール６１１、モデルトレーニングモジュール６１３及びデータ通信モジュール６１５を含み得る。

[0072] モデル予測モジュール６１１はトレーニングされた消費者モデルを使用して予測を行うように構成され得る。モデル予測モジュールは、図４及び図５に関する本開示方法に準拠する推論を行うためのプロバイダシステムにより提供されるモデル出力（例えば予測）６２２を受信し得る。例えば、消費者機械学習モデルが予測を行うために配備される場合、モデル出力６２２，６２２－Ｎに基づき生成された入力データ６３２，６３２－Ｎ及び消費者プライベートデータの両方は、予測を行うために、トレーニングされた消費者機械学習モデルへ供給され得る。

[0073] モデルトレーニングモジュール６１３は１つ又は複数の消費者機械学習モデルをトレーニングするように構成され得る。１つ又は複数の消費者機械学習モデルは、プロバイダシステムにより提供されるデータ及び本明細書の他のどこかで説明した消費者ローカルデータに基づきトレーニングされ得る。プライベート消費者又はローカルデータはデータベース６１７などのデータレポジトリ内に格納され得る。

[0074] 消費者システム６１０はデータ通信モジュール６１５を任意選択的に含み得る。データ通信モジュール６１５はデータをプロバイダシステムから受信するように構成され得る。データ通信モジュール６１５はまた集積モジュール６３０に一体化されてもよいしその一部であってもよいということに注意すべきである。

[0075] 本システムのデータベース６２９、６１７及びデータレポジトリ２０７、２１７は任意の好適なデータベース技術を利用し得る。例えば、構造化照会言語（ＳＱＬ：structured query language）すなわち「ＮｏＳＱＬ」データベースが、照会データ、トレーニングデータセット、歴史的データ、予測モデル又はアルゴリズムを格納するために利用され得る。データベースのいくつかは、アレイ、ハッシュ、（リンクされた）リスト、構造体、構造化テキストファイル（例えばＸＭＬ）、表、JavaScriptオブジェクト表記法（ＪＳＯＮ：JavaScript Object Notation）、ＮＯＳＱＬ等の様々な標準データ構造を使用して実現され得る。このようなデータ構造はメモリ内及び／又は（構造化）ファイス内に格納され得る。別の代替案では、オブジェクト指向型データベースが使用され得る。オブジェクトデータベースは、共通属性によりグループ分け及び／又は連結される多くのオブジェクト集合を含み得る；すなわち、いくつかの共通属性により他のオブジェクト集合へ関係付けられ得る。オブジェクト指向型データベースは、オブジェクトが単なるデータではないということを除いてリレーショナルデータベースと同様に行うが、所与のオブジェクト内にカプセル化された他のタイプの機能性を有し得る。いくつかの実施形態では、データベースは、データを表し格納するためにノード、エッジ及び特性に関し照会するためのグラフ構造を使用するグラフデータベースを含み得る。本発明のデータベースがデータ構造として実装されれば、本発明のデータベースの使用は、本発明のコンポーネントなどの別のコンポーネント内へ集積化され得る。また、データベースは、データ構造、オブジェクト、及び関係構造の混合として実装され得る。データベースは標準データ処理技術を介し変形形態で統合及び／又は分散され得る。データベースの一部（例えば表）はエキスポート及び／又はインポートされしたがって分散化及び／又は一体化され得る。

[0076] 集積コンポーネント６３０は、消費者機械学習モデルをトレーニングするために及び予測を行うために使用される得る入力データ６３２，６３２－Ｎを形成するためにモデル出力６２２，６２２－Ｎと消費者プライベートデータとを連結し得る。集積コンポーネントは上述のような方法を使用することによりデータを連結するように構成され得る。例えば、トレーニング段階中、プロバイダシステムにより提供されるデータは選択された消費者入力特徴と連結され得る。集積コンポーネント６３０はプロバイダシステムから転送されるデータと連結される１つ又は複数の消費者入力特徴を選択するように構成され得る。いくつかのケースでは、これらのデータは共通特徴識別子（ＩＤ）により連結され得る。例えば、消費者入力特徴データとプロバイダシステムにより提供されるトレーニングサンプルデータとを連結するためのモバイルデバイス広告（Ａｄ）ＩＤ及び発行者名などの共通特徴ＩＤが使用され得る。例えば、クリックスルー率（ｃｔｒ）予測では、プロバイダシステムから転送される１つのサンプルデータセットは以下のものを含み得る：（ｉ）モバイルデバイスＡｄＩＤ、（ｉｉ）Ａｄ押下がなされた発行者の名前、（ｉｉｉ）プロバイダモデルの予測ｃｔｒ、及び（ｉｖ）変換結果（例えば、ユーザがクリックしたか否か、ウェブサイト変換率など）。いくつかのケースでは、サンプルデータセット毎に、選択された消費者入力特徴（例えば各モバイルＡｄＩＤが獲得される製品、モバイルＡｄＩＤを使用するｅコマースアプリ）が、消費者のトレーニングデータセットを生成するためにサンプルデータセットへ付加され得る。例えば、プライベート特徴及び（ｉｉｉ）プロバイダモデルの予測ｃｔｒが入力特徴を形成し得、及び（ｉｖ）プロバイダシステムから転送される変換結果は消費者機械学習モデルをトレーニングするためのラベル付きデータとして使用され得る。

[0077] 集積コンポーネントはプロバイダシステム及び消費者システムの両方をインターフェースするスタンドアロンコンポーネントとして示されるがプロバイダシステム及び／又は消費者システムの一部であり得るということに注意すべきである。

[0078] 集積コンポーネント、消費者システム、プロバイダシステム、消費者システム又はプロバイダシステムのコンポーネントは、ソフトウェア、ハードウェア、ファームウェア、埋め込み型ハードウェア、スタンドアロンハードウェア、特殊用途ハードウェア、又はこれらの任意の組み合わせで実装され得る。集積コンポーネント、プロバイダシステム及びそのコンポーネント、消費者システム及びそのコンポーネント、並びに本明細書において説明される技術は、ディジタル電子回路構成、集積回路構成、特別設計ＡＳＩＣ（特定用途向け集積回路）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせで実現され得る。これらのシステム、デバイス、及び技術は、データ及び命令をストレージシステム、少なくとも１つの入力装置、及び少なくとも１つの出力デバイスと送受信するように結合された特殊用途又は汎用であり得る少なくとも１つのプログラム可能プロセッサを含むプログラマブルシステム上で実行可能及び／又は解釈可能である１つ又は複数のコンピュータプログラムにおける実装を含み得る。これらのコンピュータプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとしても知られる）は、プログラム可能プロセッサの機械語命令を含み得、及びハイレベル手順及び／又はオブジェクト指向プログラミング言語において及び／又はアセンブリ／機械語において実現され得る。本明細書で使用されるように、用語「機械可読媒体」及び「コンピュータ可読媒体」は、機械語命令及び／又はデータをプログラム可能プロセッサへ提供するために使用される任意のコンピュータプログラム製品、装置及び／又はデバイス（磁性ディスク、光ディスク、メモリ、又はプログラマブルロジックデバイス（ＰＬＤ）など）を指す。

[0079] いくつかのケースでは、本明細書において説明した方法に準拠する１つ又は複数の機能又は操作はクラウドサービス（ウェブサービスモデルなど）として配備され得るソフトウェアアプリケーションとして提供され得る。クラウド計算資源は物理的又は仮想的コンピュータ資源（例えば仮想機械）であり得る。いくつかの実施形態では、クラウド計算資源は、ストレージ資源（例えばストレージエリアネットワーク（ＳＡＮ：Storage Area Network）、ネットワークファイルシステム（ＮＦＳ：Network File System）、又はAmazon S3.RTM）、ネットワーク資源（例えばファイアウォール、ロードバランサ（load-balancer）、又はプロキシサーバ）、内部プライベート資源、外部プライベート資源、安全な公開資源（インフラストラクチャ・アズ・ア・サービス（ＩａａＳ：infrastructure-as-a-service）資源、プラットホーム・アズ・ア・サービス（ＰａａＳ：platform-as-a-service）資源、又はソフトウェア・アズ・ア・サービス（ＳａａＳ：software-as-a-service）資源である。したがって、いくつかの実施形態では、提供されるクラウド計算サービスは、プライベート又は商用（例えば、公開）クラウドサービスプロバイダにより提供されるＩａａＳ、ＰａａＳ、又はＳａａＳを含み得る。

コンピュータシステム
[0080] 本明細書において説明されるプロバイダシステム、消費者システム、集積コンポーネント、又はプロセスは１つ又は複数のプロセッサにより実現され得る。いくつかの実施形態では、１つ又は複数のプロセッサは、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、及び／又は１つ又は複数のアドバンストＲＩＳＣ機械（ＡＲＭ：Advanced RISC Machine）プロセッサなどの密粒度空間的アーキテクチャの形式のプログラム可能プロセッサ（例えば中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、汎用処理ユニット、又はマイクロコントローラ）であり得る。いくつかの実施形態では、プロセッサはコンピュータシステムの処理ユニットであり得る。図７は連続機械学習システムを実現するようにプログラム又はそうでなければ構成されたコンピュータシステム７０１を示す。コンピュータシステム７０１は本開示の様々な態様を規制し得る。

[0081] コンピュータシステム７０１は、シングルコア若しくはマルチコアプロセッサ又は並列処理のための複数のプロセッサであり得る中央処理ユニット（ＣＰＵ、また本明細書では「プロセッサ」及び「コンピュータプロセッサ」）７０５を含む。コンピュータシステム７０１はまた、メモリ又はメモリロケーション７１０（例えばランダムアクセスメモリ、読み出し専用メモリ、フラッシュメモリ）、電子ストレージユニット７１５（例えばハードディスク）、１つ又は複数の他のシステムと通信するための通信インターフェース７２０（例えばネットワークアダプタ）、及びキャッシュ、他のメモリ、データストレージ及び／又は電子表示アダプタなどの周辺デバイス７２５を含む。メモリ７１０、ストレージユニット７１５、インターフェース７２０及び周辺デバイス７２５はマザーボードなどの通信バス（実線）を介しＣＰＵ７０５と通信状態にある。ストレージユニット７１５はデータを格納するためのデータストレージユニット（又はデータレポジトリ）であり得る。コンピュータシステム７０１は通信インターフェース７２０の助けを借りてコンピュータネットワーク（「ネットワーク」）７３０へ作動可能に結合し得る。ネットワーク７３０はインターネット、インターネット及び／又はエクストラネット、又はインターネットと通信状態にあるイントラネット及び／又はエクストラネットであり得る。いくつかのケースでは、ネットワーク７３０はリモート通信及び／又はデータネットワークである。ネットワーク７３０は、クラウド計算などの分散計算を可能にし得る１つ又は複数のコンピュータサーバを含み得る。ネットワーク７３０（いくつかのケースではコンピュータシステム７０１の助けを借りる）は、コンピュータシステム７０１へ結合されるデバイスがクライアント又はサーバとして振る舞うことを可能にし得るピア・ツー・ピアネットワークを実現し得る。

[0082] ＣＰＵ７０５はプログラム又はソフトウェアで具現化され得る一連の機械可読命令を実行し得る。命令はメモリ７１０などのメモリロケーション内に格納され得る。本開示の方法を実施するようにＣＰＵ７０５をその後にプログラムし得る又は構成し得る命令はＣＰＵ７０５へ向けられ得る。ＣＰＵ７０５により行われる操作の一例は、フェッチ、復号、実行、及び書き戻しを含み得る。

[0083] ＣＰＵ７０５は集積回路などの回路の一部であり得る。システム７０１の１つ又は複数の他のコンポーネントは同回路内に含まれ得る。いくつかのケースでは、同回路は特定用途向け集積回路（ＡＳＩＣ）である。

[0084] ストレージユニット７１５は、ドライバ、ライブラリ、及び保存されたプログラムなどのファイルを格納し得る。ストレージユニット７１５はユーザデータ（例えばユーザ嗜好、ユーザプログラム）を格納し得る。いくつかのケースにおけるコンピュータシステム７０１は、コンピュータシステム７０１の外側にある（例えば、イントラネット又はインターネットを介しコンピュータシステム７０１と通信状態にあるリモートサーバ上に在る）１つ又は複数の追加データストレージユニットを含み得る。

[0085] コンピュータシステム７０１はネットワーク７３０を介し１つ又は複数のリモートコンピュータシステムと通信し得る。例えば、コンピュータシステム７０１は、ユーザ（例えばユーザデバイス）のリモートコンピュータシステムと通信し得る。リモートコンピュータシステムの例は、パーソナルコンピュータ（例えばポータブルＰＣ）、スレート又はタブレットＰＣ（例えばApple（登録商標）iPad、Samsung（登録商標）Galaxy Tab）、電話、スマートフォン（例えばApple（登録商標）iPhone、アンドロイド使用可能デバイス、Blackberry（登録商標））、又はパーソナルデジタルアシスタントを含む。ユーザはネットワーク７３０を介しコンピュータシステム７０１にアクセスし得る。

[0086] 本明細書において説明される方法は、コンピュータシステム７０１の電子ストレージロケーション上（例えばメモリ７１０又は電子ストレージユニット７１５上など）に格納される機械（例えばコンピュータプロセッサ）実行可能コードにより実施され得る。機械実行ファイル又は機械可読コードはソフトウェアの形式で提供され得る。使用中、コードはプロセッサ７０５により実行され得る。いくつかのケースでは、コードは、ストレージユニット７１５から取り出され、及びプロセッサ７０５によるレディアクセス(ready access)のためにメモリ７１０上に格納され得る。いくつかの状況では、電子ストレージユニット７１５は排除され得、したがって機械実行可能命令はメモリ７１０上に格納される。

[0087] コードは、コードを実行するように適合化されたプロセッサを有する機械による使用のために事前コンパイルされ及び構成されてもよいし、実行時中にコンパイルされてもよい。機械実行可能コードは、コードがコンパイル又は事前コンパイルされる方式で実行されることを可能にするように選択され得るプログラミング言語で提供され得る。

[0088] コンピュータシステム７０１など、本明細書で提供されるシステム及び方法の態様は、プログラミングで具現化され得る。本技術の様々な態様は、通常は機械（又はプロセッサ）実行可能コードの形式で及び／又はあるタイプの機械可読媒体で実行又は具現される関連データの形式の「製品」又は「製造物品」と考えられ得る。機械実行可能コードは、メモリ（例えば、読み出し専用メモリ、ランダムアクセスメモリ、フラッシュメモリ）又はハードディスクなどの電子ストレージデバイス上に格納され得る。「ストレージ」型媒体は、コンピュータ、プロセッサなど、又はその関連モジュール（ソフトウェアプログラミングのためにいつでも非一時的ストレージを提供し得る様々な半導体メモリ、テープドライブ、ディスクドライブなど）の有形なメモリのうちの任意のもの又はすべてを含み得る。ソフトウェアのすべて又は一部は、インターネット又は様々な他の通信ネットワークを介し適宜伝達される。このような通信は例えば、１つのコンピュータ又はプロセッサから別のものへ（例えば、管理サーバ又はホストコンピュータからアプリケーションサーバのコンピュータプラットフォームへ）のソフトウェアのローディングを可能にし得る。したがって、ソフトウェア要素を有し得る別の型の媒体が、ローカルデバイス間の物理インターフェースにわたって、有線及び光学的地上通信線ネットワークを介し、及び様々なエアリンク上で使用されるような光学的、電気的、電磁的波を含むソフトウェア要素を運び得る。有線又は無線リンク、光リンクなどのこのような波を運ぶ物理要素もまたソフトウェアを運ぶ媒体と考えられ得る。本明細書で使用されるように、非一時的、有形「ストレージ」媒体に限定されない限り、コンピュータ又は機械「可読媒体」などの用語は、実行のためにプロセッサへ命令を提供することに関与する任意の媒体を指す。

[0089] したがって、コンピュータ実行可能コードなどの機械可読媒体は、限定しないが有形ストレージ媒体、搬送波媒体、又は物理的送信媒体を含む多くの形態を取り得る。不揮発性ストレージ媒体は例えば、図に示されるデータベースなどを実現するために使用され得るような任意のコンピュータ内のストレージデバイスの任意のものなどの光学的又は磁気的ディスクを含む。揮発性ストレージ媒体はこのようなコンピュータプラットフォームの主メモリなどのダイナミックメモリを含む。有形送信媒体は同軸ケーブル、すなわちコンピュータシステム内のバスを含む配線を含む銅線及び光ファイバを含む。搬送波送信媒体は、電気的又は電磁気的信号、又は無線周波数（ＲＦ）及び赤外線（ＩＲ）データ通信中に生成されるような音波又は光波の形態を取り得る。したがって、コンピュータ可読媒体の一般的形式は、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤ又はＤＶＤ－ＲＯＭ、任意の他の光媒体、パンチカード、紙テープ、孔のパターンを有する任意の他の物理的ストレージ媒体、ＲＡＭ、ＲＯＭ、ＰＲＯＭ及びＥＰＲＯＭ、ＦＬＡＳＨ－ＥＰＲＯＭ、任意の他のメモリチップ又はカートリッジ、搬送波輸送データ又は命令、搬送波を輸送するケーブル又はリンク、又はコンピュータがプログラミングコード及び／又はデータを読み出し得る任意の他の媒体を含む。これらのコンピュータ可読媒体の形態の多くは、１又は複数のシーケンスの１つ又は複数の命令を実行するためにプロセッサへ運ぶことに関与し得る。

[0090] コンピュータシステム７０１は、本明細書の他のどこかで説明した例えばグラフィックユーザインターフェースを提供するためのユーザインターフェース（ＵＩ）７４０を含む電子ディスプレイ７３５を含み得る又はそれと通信状態にあり得る。ＵＩの例は、限定しないがグラフィックユーザインターフェース（ＧＵＩ）及びウェブベースユーザインターフェースを含む。

[0091] 本開示の方法及びシステムは、１つ又は複数のアルゴリズムにより実施され得る。アルゴリズムは、中央処理ユニット７０５により実行されるソフトウェアにより実現され得る。アルゴリズムは、例えば予測モデルなどの、トレーニングされたモデルであり得る。

[0092] 特定の実施形態が示され説明されたが、それらに対して様々な修正がなされ得、且つ本明細書において企図されるということが、上記説明から理解されるべきである。本発明が本明細書内に提供される具体例により制限され得るということも意図されていない。本発明は、前述の明細書を参照して説明されたが、本明細書に記載の好ましい実施形態の説明及びイラストは、限定的意味で解釈されることを意味しない。さらに、本発明のすべての態様は、多種多様な条件及び変数に依存する本明細書に記載された特定の描写、構成、又は相対的比率に限定されないということが理解されるべきである。本発明の実施形態の形式と詳細における様々な修正は、当業者にとって明らかである。したがって、本発明はまた、任意のこのような修正、変形、及び等価物をカバーするものと考えられる。

Claims

機械学習モデルサービスを提供する方法であって、
（ａ）第１の機械学習モデルを使用することにより第１の出力データを第１の計算システムにより生成することであって、前記第１の機械学習モデルは第１のトレーニングデータセットでトレーニングされる、生成すること；
（ｂ）前記第１の出力データを第２の計算システムへ送信することであって、前記第１のトレーニングデータセット及び前記第１の機械学習モデルは前記第２の計算システムにアクセス不能である、送信すること；
（ｃ）前記第１の出力データと前記第２の計算システムにアクセス可能な選択された組の入力特徴とを連結することにより入力データを生成すること；及び
（ｄ）前記入力データを処理するために第２の機械学習モデルを使用して第２の出力データを生成することであって、前記第２の機械学習モデル及び前記選択された組の入力特徴は前記第１の計算システムにアクセス不能である、生成することを含む方法。
前記第１の出力データは予測値を含む、請求項１に記載の方法。
前記第１の出力データは１つ又は複数の共通特徴に従って前記選択された組の入力特徴と連結される、請求項１に記載の方法。
前記１つ又は複数の共通特徴は共通特徴識別子を含む、請求項３に記載の方法。
前記第２の機械学習モデルは教師有り学習を使用してトレーニングされ、前記第２の機械学習モデルをトレーニングするためのラベル付きデータセットは前記第１の機械学習モデルにより生成されたデータを含む、請求項１に記載の方法。
前記第１の機械学習モデルは畳み込みニューラルネットワークであり、前記第１の機械学習により生成される前記データは、前記畳み込みニューラルネットワークの最上層の出力を含む、請求項５に記載の方法。
前記選択された組の入力特徴は、前記第２の機械学習モデルの性能を評価することにより決定される、請求項１に記載の方法。
前記第２の機械学習モデルの性能メトリックが閾値より良くなるまで、異なる組の入力特徴が選択される、請求項７に記載の方法。
前記第１の出力データを生成するための要求を、前記第１の計算システムにより受信することをさらに含む、請求項１に記載の方法。
前記要求は予測サービスに関係する１つ又は複数の共通特徴を含む、請求項９に記載の方法。
（ａ）第１の機械学習モデルを使用して第１の出力データを生成するように構成された第１の計算システムであって、前記第１の機械学習モデルは第１のトレーニングデータセットでトレーニングされる、第１の計算システム；
（ｂ）入力データを処理するために第２の機械学習モデルを使用することにより第２の出力データを生成するように構成された第２の計算システム；及び
（ｃ）前記第１の出力データと前記第２の計算システムにアクセス可能な選択された組の入力特徴とを連結することにより前記入力データを生成するように構成された集積コンポーネントを含み、
前記第１のトレーニングデータセット及び前記第１の機械学習モデルは前記第２の計算システムにアクセス不能であり、前記第２の機械学習モデル及び前記選択された一組の入力特徴は前記第１の計算システムにアクセス不能である、
連続機械学習システム。
前記第１の出力データは予測値を含む、請求項１１に記載の連続機械学習システム。
前記第１の出力データは１つ又は複数の共通特徴に従って、前記選択された組の入力特徴と連結される、請求項１１に記載の連続機械学習システム。
前記１つ又は複数の共通特徴は共通特徴識別子を含む、請求項１３に記載の連続機械学習システム。
前記第２の機械学習モデルは教師有り学習を使用してトレーニングされ、前記第２の機械学習モデルをトレーニングするためのラベル付きデータセットは前記第１の機械学習モデルにより生成されたデータを含む、請求項１１に記載の連続機械学習システム。
前記第１の機械学習モデルは畳み込みニューラルネットワークであり、前記第１の機械学習により生成される前記データは、前記畳み込みニューラルネットワークの最上層の出力を含む、請求項１５に記載の連続機械学習システム。
前記選択された組の入力特徴は、前記第２の機械学習モデルの性能を評価することにより決定される、請求項１１に記載の連続機械学習システム。
前記第２の機械学習モデルの性能メトリックが閾値より良くなるまで、異なる組の入力特徴が選択される、請求項１７に記載の連続機械学習システム。
前記第１の計算システムは、前記第１の出力データを生成するための要求をさらに受信するように構成される、請求項１１に記載の連続機械学習システム。
前記要求は予測サービスに関係する１つ又は複数の共通特徴を含む、請求項１９に記載の連続機械学習システム。