JP6276857B2

JP6276857B2 - 訓練データに関する重み利益エバリュエータ

Info

Publication number: JP6276857B2
Application number: JP2016532028A
Authority: JP
Inventors: アブ−モスタファ，ヤセル，サイド; ゴンザレス，カルロス，ロベルト
Original assignee: カリフォルニアインスティテュートオブテクノロジー
Priority date: 2013-11-22
Filing date: 2014-11-21
Publication date: 2018-02-07
Anticipated expiration: 2034-11-21
Also published as: US20160379140A1; EP3072060A4; EP3072060A2; WO2015077555A2; JP2017500637A; KR20160083111A; WO2015077555A3; US10558935B2; KR101889451B1; US20150206065A1

Description

本出願は、２０１３年１１月２２日に出願した米国仮特許出願第６１／９０７，５０４号、２０１４年６月２０日に出願した米国仮特許出願第６２／０１５，１３３号、および２０１４年８月５日に出願した米国特許出願第１４／４５１，８５９号の優先権を主張するものであり、これらの出願の全体が、参照により本明細書に組み込まれている。本出願は、「ＧＥＮＥＲＡＴＩＯＮＯＦＷＥＩＧＨＴＳＩＮＭＡＣＨＩＮＥＬＥＡＲＮＩＮＧ」という名称の２０１４年８月５日に出願した出願、整理番号１４／４５１，８７０号、「ＷＥＩＧＨＴＧＥＮＥＲＡＴＩＯＮＩＮＭＡＣＨＩＮＥＬＥＡＲＮＩＮＧ」という名称の２０１４年８月５日に出願した出願、整理番号１４／４５１，８９９号、および「ＡＬＴＥＲＮＡＴＩＶＥＴＲＡＩＮＩＮＧＤＩＳＴＲＩＢＵＴＩＯＮＤＡＴＡＩＮＭＡＣＨＩＮＥＬＥＡＲＮＩＮＧ」という名称の２０１４年８月５日に出願した出願、整理番号１４／４５１，９３５号に関連する。

機械学習環境において、訓練入力および訓練ラベルを含む訓練データが、学習された関数を決定するのに使用され得る。学習された関数は、訓練入力と訓練ラベルの間の関係を示すのに有効であり得る。学習された関数は、機械学習システムにおいて展開され得る。機械学習システムは、試験入力を受け取ることが可能であり、学習された関数を試験入力に適用して、試験ラベルをもたらすことができ、試験入力および試験ラベルは、試験データに形成され得る。

いくつかの例において、機械学習環境において訓練データに関連する重み利益を決定する方法が、一般的に説明される。これらの方法は、デバイスによる、訓練データに基づいて第１の関数を決定することであって、その訓練データは、訓練入力と、訓練ラベルとを含み得ることを含むことが可能である。また、これらの方法は、デバイスによる、訓練データに重みのセットを適用して、重み付けされた訓練データを生成することを含むことも可能である。また、これらの方法は、デバイスによる、その重み付けされた訓練データに基づいて第２の関数を決定することを含むことも可能である。また、これらの方法は、デバイスによる、ターゲット関数に基づいてターゲットデータを生成することを含むことも可能である。ターゲットデータは、訓練ラベルとは異なるターゲットラベルを含み得る。また、これらの方法は、デバイスによる、そのターゲットデータに基づいて第３の関数を決定することを含むことも可能である。また、これらの方法は、デバイスによる、そのターゲットデータに重みのセットを適用して、重み付けされたターゲットデータを生成することを含むことも可能である。また、これらの方法は、デバイスによる、重み付けされたターゲットデータに基づいて第４の関数を決定することを含むことも可能である。また、これらの方法は、デバイスによる、第１の関数、第２の関数、第３の関数、および第４の関数に基づいて重み利益を決定することを含むことも可能である。その重み利益は、訓練データに重みのセットを適用する利益に関連することが可能である。

いくつかの例において、機械学習環境において訓練データに関連する重み利益を決定するのに有効なシステムが、一般的に説明される。これらのシステムは、メモリを含み得る。そのメモリは、訓練データを記憶するように構成され得る。その訓練データは、訓練入力と、訓練ラベルとを含み得る。また、そのメモリは、重みのセットを記憶するように構成されることも可能である。また、これらのシステムは、そのメモリと通信状態にあるように構成されたターゲット関数生成モジュールを含むことも可能である。ターゲット関数生成モジュールは、ターゲット関数に基づいてターゲットデータを生成するように構成され得る。ターゲットデータは、訓練ラベルとは異なるターゲットラベルを含み得る。また、ターゲット関数生成モジュールは、メモリの中にターゲットデータを記憶するように構成されることも可能である。また、これらのシステムは、ターゲット関数生成モジュールおよびメモリと通信状態にあるように構成された処理モジュールを含むことも可能である。その処理モジュールは、訓練データに重みのセットを適用して、重み付けされた訓練データを生成するように構成され得る。また、その処理モジュールは、ターゲットデータに重みのセットを適用して、重み付けされたターゲットデータを生成するように構成されることも可能である。また、その処理モジュールは、メモリの中に重み付けされた訓練データおよび重み付けされたターゲットデータを記憶するように構成されることも可能である。また、これらのシステムは、ターゲット関数生成モジュール、処理モジュール、およびメモリと通信状態にあるように構成された機械学習モジュールを含むことも可能である。その機械学習モジュールは、訓練データに基づいて第１の関数を決定するように構成され得る。また、その機械学習モジュールは、重み付けされた訓練データに基づいて第２の関数を決定するように構成されることも可能である。また、その機械学習モジュールは、ターゲットデータに基づいて第３の関数を決定するように構成されることも可能である。また、その機械学習モジュールは、重み付けされたターゲットデータに基づいて第４の関数を決定するように構成されることも可能である。また、これらのシステムは、ターゲット関数生成モジュール、処理モジュール、機械学習モジュール、およびメモリと通信状態にあるように構成された評価モジュールを含むことも可能である。その評価モジュールは、第１の関数、第２の関数、第３の関数、および第４の関数に基づいて重み利益を決定するように構成され得る。その重み利益は、訓練データに重みのセットを適用する利益に関連することが可能である。

いくつかの例において、機械学習環境において訓練データに関連する重み利益を決定する方法が、一般的に説明される。これらの方法は、第１のデバイスによる、第２のデバイスから第１の関数を受信することを含み得る。第１の関数は、訓練データに基づくことが可能である。その訓練データは、訓練入力と、訓練ラベルとを含み得る。また、これらの方法は、第１のデバイスによる、第２のデバイスから重みのセットを受信することを含むことも可能である。また、これらの方法は、第１のデバイスによる、第２のデバイスから第２の関数を受信することを含むことも可能である。第２の関数は、重み付けされた訓練データに基づくことが可能である。その重み付けされた訓練データは、重みのセットに基づくことが可能である。また、これらの方法は、第１のデバイスによる、ターゲット関数に基づいてターゲットデータを生成することを含むことも可能である。ターゲットデータは、訓練ラベルとは異なるターゲットラベルを含み得る。また、これらの方法は、第１のデバイスによる、ターゲットデータに基づいて第３の関数を決定することを含むことも可能である。また、これらの方法は、第１のデバイスによる、ターゲットデータに重みのセットを適用して、重み付けされたターゲットデータを生成することを含むことも可能である。また、これらの方法は、第１のデバイスによる、重み付けされたターゲットデータに基づいて第４の関数を決定することを含むことも可能である。また、これらの方法は、第１のデバイスによる、第１の関数、第２の関数、第３の関数、および第４の関数に基づいて重み利益を決定することを含むことも可能である。その重み利益は、訓練データに重みのセットを適用する利益に関連することが可能である。

以上の概要は、単に例示的であり、限定することはまったく意図していない。前述した例示的な態様、実施形態、および特徴に加えて、さらなる態様、実施形態、および特徴が、図面、および後段の詳細な説明を参照することによって明白となろう。

本開示の以上、およびその他の特徴は、添付の図面と併せて解釈される、後段の説明、および添付の特許請求の範囲から、より完全に明白となろう。これらの図面は、本開示によるいくつかの実施形態を表すに過ぎず、したがって、本開示の範囲を限定するものと見なされるべきではないものと理解して、本開示を、添付の図面の使用を介してさらに具体的に、さらに詳細に説明する。

本明細書で説明される少なくともいくつかの実施形態により構成された、訓練データに関する重み利益エバリュエータを実施するのに利用され得る例示的なシステムを示す図である。本明細書で説明される少なくともいくつかの実施形態により構成された、人工的な学習された関数および人工的な重み付けされた関数の決定と関係するさらなる詳細とともに図１の例示的なシステムを示す図である。本明細書で説明される少なくともいくつかの実施形態により構成された、重み利益の決定と関係するさらなる詳細とともに図１の例示的なシステムを示す図である。本明細書で説明される少なくともいくつかの実施形態により構成された、訓練データに関する重み利益エバリュエータを実施する例示的なプロセスを示す流れ図である。本明細書で説明される少なくともいくつかの実施形態により構成された、訓練データに関する重み利益エバリュエータを実施するのに利用され得る例示的なコンピュータプログラム製品を示す図である。本明細書で説明される少なくともいくつかの実施形態により構成された、訓練データに関する重み利益エバリュエータを実施するように構成された例示的なコンピューティングデバイスを示すブロック図である。

後段の詳細な説明において、本明細書の一部分を形成する添付の図面が参照される。これらの図面において、同様の符号は、そうでないことを文脈が規定するのでない限り、通常、同様の構成要素を識別する。詳細な説明、図面、および特許請求の範囲において説明される例示的な実施形態は、限定することは意図していない。本明細書において提示される主題の趣旨も範囲も逸脱することなく、他の実施形態が利用されることが可能であり、他の変更が行われることが可能である。本明細書で一般的に説明され、図に例示される本開示の態様は、本明細書においてそのすべてが明示的に企図される多種多様な異なる構成において構成され、置換され、組み合わされ、分離され、設計されることが可能であることが容易に理解されよう。

本開示は、とりわけ、訓練データに関する重み利益エバリュエータと関係する方法、装置、システム、デバイス、およびコンピュータプログラム製品を対象とする。

簡単に述べると、機械学習環境において訓練データに重みのセットを適用することに関連する重み利益を決定するのに有効な方法およびシステムのための技術が、一般的に説明される。たとえば、それらの重みは、訓練データにおけるいくつかのポイントに、他のポイントと比べて、より多く寄与させて、異なる学習された関数の生成をもたらすのに使用され得る。例において、デバイスが、訓練データに基づいて第１の関数を決定することが可能であり、その訓練データは、訓練入力と、訓練ラベルとを含む。たとえば、それらの訓練入力は、ユーザプロファイル（たとえば、年齢、性別、収入）およびラベル（たとえば、映画格付け）であり得る。第１の関数は、訓練入力と訓練ラベルの間の関係を示すのに有効であり得る。たとえば、第１の関数は、ユーザプロファイルと映画格付けの間の関係を示してもよい。このデバイスは、訓練データに対する重みの適用に基づく、重み付けされた訓練データに基づいて第２の関数を決定することが可能である。第２の関数は、訓練データに重みが適用された後、生成され得る。第２の関数の演算が、本明細書で説明されるとおり第１の関数と比較され得る。このデバイスは、ターゲットデータに基づいて第３の関数を決定することが可能であり、そのターゲットデータは、ターゲット関数に基づいて生成される。そのターゲット関数は、重みを用いて生成された関数と重みを用いずに生成された関数を比較するのに使用され得る。ターゲットデータは、訓練ラベルとは異なるターゲットラベルを含み得る。このデバイスは、ターゲットデータに重みを適用したことの結果であり得る、重み付けされたターゲットデータに基づいて第４の関数を決定することが可能である。このデバイスは、第１の関数、第２の関数、第３の関数、および第４の関数に基づいて重み利益を決定することが可能である。たとえば、このデバイスは、その重みが適用されるべきかどうかを決定することが可能である。

図１は、本明細書で説明される少なくともいくつかの実施形態により構成された、訓練データに関する重み利益エバリュエータを実施するのに利用され得る例示的なシステムを示す。後段でより詳細に説明されるとおり、システム１００が、機械学習システムとして実施されることが可能である。システム１００は、訓練データ１６０（（ｘ_ｉ，ｙ_ｉ）として表される）に基づいて、学習された関数１６２（ｇとして表される）を決定するように実施され得る。訓練データ１６０の例が、ユーザプロファイル（たとえば、年齢、性別、収入）およびラベル（たとえば、映画格付け）であり得る。学習された関数１６２の例が、試験ユーザプロファイルを入力として受け取り、試験映画格付けを出力として生成する関数であり得る。訓練データ１６０は、各ポイントｉにおける訓練入力（ｘ_ｉ）と、訓練ラベル（ｙ_ｉとして表される）とを含むペアにされたデータのセットに関連することが可能である。システム１００は、重み付けされた訓練データ１８０（（ｘ_ｗｉ，ｙ_ｗｉ）として表される）に基づいて、重み付けされた関数１７２（ｇ_ｗとして表される）を決定するようにさらに実施され得る。重み付けされた訓練データ１８０は、訓練データ１６０に重みのセット（「重み」）１７０（ｗ_ｉとして表される）を適用したことの結果であり得る。重みのセット１７０は、訓練データ１６０におけるいくつかのポイント（訓練入力と、訓練ラベルとを含む）に、訓練データ１６０におけるそれらのいくつかのポイントとは異なる他のポイントより重く評価することが可能である。たとえば、いくつかのポイントは、より高い重みを与えられることが可能であり、したがって、重み付けされた関数１７２の生成により多く寄与することが可能である。システム１００は、重み利益１５２を決定するようにさらに実施されることが可能であり、重み利益１５２は、訓練データ１６０に重みのセット１７０を適用する利益に関連することが可能である。

例において、システム１００は、コンピューティングデバイス１０２で実施されることが可能であり、コンピューティングデバイス１０２は、コンピュータまたはサーバであり得る。コンピューティングデバイス１０２は、処理モジュール１１０、機械学習モジュール１２０、ターゲット関数生成モジュール１３０、算術モジュール１４０、および／または評価モジュール１５０を含み得る。処理モジュール１１０、機械学習モジュール１２０、ターゲット関数生成モジュール１３０、算術モジュール１４０、および／または評価モジュール１５０は、互いに通信状態にあるように構成され得る。コンピューティングデバイス１０２は、処理モジュール１１０、機械学習モジュール１２０、ターゲット関数生成モジュール１３０、算術モジュール１４０、および／または評価モジュール１５０と通信状態にあるように構成されたメモリ１０４をさらに含み得る。いくつかの例において、コンピューティングデバイス１０２の各モジュールは、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）、ＳｏＣ（システムオンチップ）などの集積回路を含むハードウェア構成要素または組込み型システムであり得る。いくつかの例において、第１のモジュールは、第２のモジュール上に組み込まれてもよい。たとえば、算術モジュール１４０が、ターゲット関数生成モジュール１３０上に組み込まれてもよい。いくつかの例において、処理モジュール１１０、機械学習モジュール１２０、ターゲット関数生成モジュール１３０、算術モジュール１４０、および／または評価モジュール１５０は、コンピューティングデバイス１０２のプロセッサの構成要素であり得る。

メモリ１０４は、機械学習命令１２２、少なくとも１つの人工的な関数１６６（ｈ_ｊとして表される）、訓練データ１６０、および／または重み１７０を記憶するように構成され得る。機械学習命令１２２は、学習された関数１６２および／または重み付けされた関数１７２などの学習された関数の生成を円滑にするのに有効な命令を含み得る。機械学習命令１２２は、ターゲット関数生成モジュール１３０、算術モジュール１４０、および／または評価モジュール１５０の動作に関連する命令をさらに含み得る。いくつかの例において、機械学習命令１２２は、機械学習モジュール１２０の中に記憶され得る。人工的な関数１６６は、後段で説明されるとおり、システム１００の実施によってそれまでに生成された関数であり得る。

訓練データ１６０は、訓練入力（ｘ_ｉ）と、訓練ラベル（ｙ_ｉ）とを含むペアにされたデータのセットに関連することが可能である。訓練入力（ｘ_ｉ）は、ベクトルのセットであることが可能であり、各ベクトルは、１つまたは複数の座標に対応することが可能である。重みのセット１７０は、処理モジュール１１０などによって、訓練データ１６０に適用され得るベクトルのセットであり得る。訓練データ１６０に重み１７０を適用した結果、重み付けされた訓練データ１８０が生成され得る。重み付けされた訓練データ１８０は、重み付けされた訓練入力（ｘ_ｗｉ）と、重み付けされた訓練ラベル（ｙ_ｗｉ）とを含むペアにされたデータのセットに関連することが可能である。いくつかの例において、重みのセット１７０は、コンピューティングデバイス１０２において別のコンピューティングデバイスから受信され得る。いくつかの例において、コンピューティングデバイス１０２は、重み１７０を生成するように構成された重み生成モジュール１０６をさらに含み得る。いくつかの例において、処理モジュール１１０は、機械学習モジュール１２０、ターゲット関数生成モジュール１３０、算術モジュール１４０、および評価モジュール１５０などのコンピューティングデバイス１０２における１つまたは複数のモジュールの動作を制御するようにさらに構成され得る。処理モジュール１１０は、評価モジュール１５０から重み利益１５２を受信し、それに応答して、訓練データ１６０に重み１７０を適用すべきかどうかを決定するようにさらに構成され得る。重み利益１５２は、「適用する」または「適用しない」、あるいは「０」と「１」、あるいは「Ａ」と「非Ａ」などのバイナリデータであり得る。

ターゲット関数生成モジュール１３０は、訓練データ１６０および人工的な関数１６６（後段で説明される）を使用してターゲット関数１６８（ｆ_ｊとして表される）を生成するように構成され得る。いくつかの例において、算術モジュール１４０は、ターゲット関数生成モジュール１３０によるターゲット関数１６８の生成を円滑にする特定の動作を実行するように構成され得る。たとえば、算術モジュール１４０は、システム１００の実施中の大きいデータセットの比較などの複雑な計算を実行するように構成され得る。

機械学習モジュール１２０は、訓練データ１６０に基づいて、学習された関数１６２を決定するように構成され得る。学習された関数１６２の決定は、訓練入力（ｘ_ｉ）と訓練ラベル（ｙ_ｉ）の間の関係を決定することを含み得る。学習された関数１６２は、訓練入力（ｘ_ｉ）と訓練ラベル（ｙ_ｉ）の間の関係を示すのに有効であり得る。機械学習モジュール１２０は、重み付けされた訓練データ１８０に基づいて、重み付けされた関数１７２を決定するようにさらに構成され得る。重み付けされた関数１７２の決定は、重み付けされた訓練入力（ｘ_ｗｉ）と重み付けされた訓練ラベル（ｙ_ｗｉ）の間の関係を決定することを含み得る。重み付けされた関数１７２は、重み付けされた訓練入力（ｘ_ｗｉ）と重み付けされた訓練ラベル（ｙ_ｗｉ）の間の関係を示すのに有効であり得る。後段でより詳細に説明されるとおり、機械学習モジュール１２０は、人工的な関数１６６およびターゲット関数１６８に基づいて、人工的な学習された関数１６４（ｇ_ｊとして表される）および人工的な重み付けされた関数１７４（ｇ_ｗｊとして表される）を決定するように構成され得る。評価モジュール１５０は、学習された関数１６２、重み付けされた関数１７２、人工的な学習された関数１６４、および人工的な重み付けされた関数１７４に基づいて重み利益１５２を決定することが可能である。

図２は、本明細書で説明される少なくともいくつかの実施形態により構成された、人工的な学習された関数および人工的な重み付けされた関数の決定と関係するさらなる詳細とともに図１の例示的なシステム１００を示す。図２は、さらなる詳細を伴って、図１のシステム１００と実質的に同様である。図１の構成要素と同一のラベルを付けられた図２の構成要素については、簡明のため、再び説明することはしない。

後段でより詳細に説明されるとおり、ターゲット関数生成モジュール１３０が、訓練データ１６０（メモリ１０４の中の）および人工的な関数１６６（メモリ１０４の中の）に基づいて１つまたは複数のターゲット関数１６８を生成することが可能である（動作｛２１０、２１１、２１２、２１３｝を参照して説明される）。ターゲット関数１６８の生成の後、ターゲット関数生成モジュール１３０は、訓練データ１６０に基づき、かつターゲット関数１６８に基づき、ターゲットデータ２３０を生成することが可能である。処理モジュール１１０が、ターゲットデータ２３０に重み１７０を適用して、重み付けされたターゲットデータ２３２を生成することが可能である（動作｛２１４，２１５｝）。機械学習モジュール１２０が、ターゲットデータ２３０に基づいて、人工的な学習された関数１６４を決定することが可能である（動作｛２１６｝）。機械学習モジュール１２０は、重み付けされたターゲットデータ２３２に基づいて、人工的な重み付けされた関数１７４をさらに決定することが可能である（動作｛２１６｝）。

動作２１０において、ターゲット関数生成モジュール１３０が、メモリ１０４から人工的な関数１６６を取り出すことが可能である。例において、処理モジュール１１０が、メモリ１０４の中に記憶された複数の人工的な関数の中からいくつかの人工的な関数１６６を選択するようターゲット関数生成モジュール１３０に命令するように構成され得る。人工的な関数１６６の選択は、機械学習命令１２２に基づくことが可能である。例において、最終の所望される学習された関数でもある、機械学習命令１２２の出力は、ａｘ^３＋ｂｘ^２＋ｃｘ＋ｄのような次数４の多項式によって表現されるモデルに従う関数であり得る。処理モジュール１１０は、機械学習命令１２２における命令に基づいて、係数ａ、ｂ、ｃ、ｄの値などの、パラメータのセットをランダムに選択することが可能である。特定の選択ｊに関して、処理モジュール１１０が、ａ＝１、ｂ＝３、ｃ＝７、ｄ＝１２を選択した場合、第ｊ番の人工的な関数１６６は、ｘ^３＋３ｘ^２＋７ｘ＋１２であることになる。

いくつかの人工的な関数１６６の選択の後、ターゲット関数１６８の生成は、動作２１０から動作２１１に進むことが可能である。動作２１１で、ターゲット関数生成モジュール１３０が、訓練データ１６０の訓練入力ｘ_ｉを選択された数の人工的な関数１６６に適用することが可能である。人工的な関数１６６に訓練入力ｘ_ｉを適用することは、人工的なデータ２２０の生成をもたらし得る。人工的なデータ２２０は、（ｘ_ｉ，ｈ_ｊ（ｘ_ｉ））によって表される、ペアにされたデータの１つまたは複数のセットを含むことが可能であり、ここで、ｉは、訓練データ１６０のポイントに対応し、ｊは、選択された人工的な関数に対応する。ペアにされたデータのセットの数は、選択された人工的な関数１６６の数と等しいことが可能である。人工的なデータ２２０の各セットの中のポイントの数は、訓練データ１６０におけるポイントの数と等しいことが可能である。たとえば、訓練データ１６０が、１００のポイント（たとえば、ｉ＝１，２，．．．１００であり、かつ（ｘ_ｉ，ｙ_ｉ）＝（ｘ_１，ｙ_１），（ｘ_２，ｙ_２），．．．（ｘ_１００，ｙ_１００））を含むことが可能である。処理モジュール１１０は、１０の人工的な関数１６６を選択するためにパラメータの１０のセットを選択することが可能である。ターゲット関数生成モジュール１３０は、対応する１０の人工的な関数に基づいて人工的なデータの１０のセット２２０を生成して、人工的なデータの１０のセット２２０の中の各セットが、１００のポイントを含み得るようにすることが可能である。

人工的なデータ２２０の生成の後、ターゲット関数１６８の生成は、動作２１１から動作２１２に進むことが可能である。動作２１２で、ターゲット関数生成モジュール１３０が、訓練データ１６０および人工的なデータ２２０を算術モジュール１４０に送信することが可能である。算術モジュール１４０は、訓練データ１６０の平均値であり得る訓練平均値２４０を決定することが可能である。算術モジュール１４０は、訓練データ１６０の標準偏差であり得る訓練標準偏差２４２をさらに決定することが可能である。算術モジュール１４０は、いくつかの人工的な平均値２５０（ｍ_ｊとして表される）をさらに決定することが可能であり、ここで、各人工的な平均値は、人工的なデータ２２０の特定のセットの平均値であり得る。たとえば、人工的な平均値ｍ_１が、ｊ＝１における人工的なデータ２２０のセットの人工的な平均値であり得る。算術モジュール１４０は、いくつかの人工的な標準偏差２５２（ｄ_ｊとして表される）をさらに決定することが可能であり、ここで、各人工的な標準偏差は、人工的なデータ２２０の特定のセットの標準偏差であり得る。たとえば、人工的な標準偏差ｄ_１が、ｊ＝１における人工的なデータ２２０のセットの標準偏差であり得る。算術モジュール１４０が、訓練平均値２４０、訓練標準偏差２４２、人工的な平均値２５０、および人工的な標準偏差２５２をターゲット関数生成モジュール１３０に送信することが可能である。算術モジュール１４０がターゲット関数生成モジュール１３０の構成要素であり得る、いくつかの例において、ターゲット関数生成モジュール１３０が、訓練平均値２４０、訓練標準偏差２４２、人工的な平均値２５０、および人工的な標準偏差２５２を決定することが可能である。

訓練平均値２４０、訓練標準偏差２４２、人工的な平均値２５０、および人工的な標準偏差２５２の生成の後、ターゲット関数１６８の生成は、動作２１２から動作２１３に進むことが可能である。動作２１３において、ターゲット関数生成モジュールは、人工的なデータ２２０、訓練平均値２４０、訓練標準偏差２４２、人工的な平均値２５０、および人工的な標準偏差２５２に基づいて、いくつかのターゲット関数１６８を生成することが可能である。ターゲット関数１６８の数は、選択された人工的な関数１６６の数、または人工的なデータ２２０の中のセットの数と等しいことが可能である。たとえば、ターゲット関数ｆ_２が、ｊ＝２における人工的な関数ｈ_２、または人工的なデータ２２０のセットに基づくことが可能である。ターゲット関数ｆ_２が、ｊ＝２における人工的なデータ２２０、訓練平均値２４０、訓練標準偏差２４２、人工的な平均値２５０ｍ_２、および人工的な標準偏差２５２ｄ_２に基づいて生成されることが可能である。

いくつかの例において、ターゲット関数生成モジュール１３０が、訓練平均値２４０、訓練標準偏差２４２、人工的な平均値２５０、および人工的な標準偏差２５２に符号関数を適用することによって、そのいくつかのターゲット関数１６８を生成することが可能である。いくつかの例において、ターゲット関数生成モジュール１３０が、訓練平均値２４０、訓練標準偏差２４２、人工的な平均値２５０、および人工的な標準偏差２５２にラウンド関数を適用することによって、ターゲット関数１６８を生成することが可能である。いくつかの例において、ターゲット関数生成モジュール１３０が、訓練平均値２４０、訓練標準偏差２４２、人工的な平均値２５０、および人工的な標準偏差２５２に最近接数関数（nearest number function）を適用することによって、ターゲット関数１６８を生成することが可能である。ターゲット関数生成モジュール１３０は、訓練平均値２４０、訓練標準偏差２４２、人工的な平均値２５０、および人工的な標準偏差２５２に、機械学習命令１２２に基づいて選択され得る様々な他の関数を適用することによって、ターゲット関数１６８を生成することが可能である。いくつかの例において、ターゲット関数１６８は、ガウス雑音などの雑音パラメータにさらに基づくことが可能である。

ターゲット関数１６８の生成の後、ターゲット関数生成モジュール１３０は、ターゲットデータ２３０および重み付けされたターゲットデータ２３２を生成することが可能である。動作２１４において、ターゲット関数生成モジュール１３０が、各ターゲット関数１６８に訓練データ１６０の訓練入力ｘ_ｉを適用して、ターゲットデータ２３０を生成することが可能である。ターゲットデータ２３０は、（ｘ_ｉ，ｆ_ｊ（ｘ_ｉ））によって表される、ペアにされたデータの１つまたは複数のセットを含むことが可能であり、ここで、ターゲットデータ２３０におけるペアにされたデータのセットの数は、ターゲット関数１６８の数と等しいことが可能である。ターゲットデータ２３０の各セットの中のポイントの数は、訓練データ１６０におけるポイントの数と等しいことが可能である。たとえば、ターゲット生成関数モジュール１３０が、１０のターゲット関数１６８を生成した場合、ターゲットデータ２３０においてターゲットデータの１０のセットが存在する。ターゲットデータ２３０の生成の後、動作２１５において、処理モジュール１１０が、訓練データ１６０に重みのセット１７０を適用して、重み付けされたターゲットデータ２３２を生成することが可能である。重み付けされたターゲットデータ２３２は、（ｘ_ｉ，ｆ_ｗｊ（ｘ_ｉ））によって表される、ペアにされたデータの１つまたは複数のセットを含むことが可能であり、ここで、重み付けされたターゲットデータ２３２におけるペアにされたデータのセットの数は、ターゲット関数１６８の数と等しいことが可能である。重み付けされたターゲットデータ２３２の各セットの中のポイントの数は、訓練データ１６０におけるポイントの数と等しいことが可能である。

ターゲットデータ２３０および重み付けされたターゲットデータ２３２の生成の後、機械学習モジュール１２０が、いくつかの人工的な学習された関数１６４を決定することが可能であり、いくつかの人工的な重み付けされた関数１７４を決定することが可能である。機械学習モジュール１２０が、特定のターゲットデータ２３０に基づいて、特定の人工的な学習された関数１６４を決定することが可能である。たとえば、機械学習モジュール１２０が、セットｊ＝２においてターゲットデータ（ｘ_ｉ，ｆ_２（ｘ_ｉ））に基づいて、人工的な学習された関数ｇ_２を決定することが可能である。人工的な学習された関数１６４の数は、ターゲットデータ２３０におけるターゲットデータのセットの数と等しいことが可能である。機械学習モジュール１２０は、特定の重み付けされたターゲットデータ２３２に基づいて、特定の人工的な重み付けされた関数１７４をさらに決定することが可能である。人工的な重み付けされた関数１７４の数は、重み付けされたターゲットデータ２３２における重み付けされたターゲットデータのセットの数と等しいことが可能である。

図３は、本明細書で説明される少なくともいくつかの実施形態により構成された、重み利益の決定と関係するさらなる詳細とともに図１の例示的なシステム１００を示す。図３は、さらなる詳細を伴って、図１のシステム１００と実質的に同様である。図１の構成要素と同一のラベルが付けられた図３における構成要素については、簡明のため、再び説明することはしない。

後段でより詳細に説明されるとおり、機械学習モジュール１２０が、学習された関数１６２、重み付けされた関数１７２、１つまたは複数の人工的な学習された関数１６４、および１つまたは複数の人工的な重み付けされた関数１７４に試験入力のセット３０２を適用することが可能である（動作｛３１０｝）。その適用の結果、機械学習モジュール１２０は、試験データ３０４、重み付けされた試験データ３０５、人工的な試験データ３０６、および人工的な重み付けされた試験データ３０７を生成することが可能である（動作｛３１０｝）。算術モジュール１４０が、試験データ３０４、重み付けされた試験データ３０５、人工的な試験データ３０６、および人工的な重み付けされた試験データ３０７に基づいて評価値３４０を決定することが可能である（動作｛３１１，３１２｝）。評価モジュール１５０が、評価値３４０に基づいて重み利益１５２を生成することが可能である（動作｛３１３，３１４，３１５｝）。

動作３１０において、機械学習モジュール１２０が、学習された関数１６２に試験入力３０２を適用して、試験データ３０４を生成することが可能である。試験入力３０２は、ベクトルのセット（ｓ_ｉとして表される）であることが可能であり、システム１００の外部のデバイスから受信されることが可能である。試験データ３０４は、試験入力３０２ｓ_ｉと、生成された試験ラベルｇ（ｓ_ｉ）とを含むペアにされたデータのセット（ｓ_ｉ，ｇ（ｓ_ｉ）として表される）に関連することが可能である。学習された関数１６２は、試験入力３０２と生成された試験ラベルｇ（ｓ_ｉ）の間の関係を定義するのに有効であり得る。機械学習モジュール１２０は、重み付けされた関数１７２に試験入力３０２をさらに適用して、重み付けされた試験データ３０５を生成することが可能である。重み付けされた試験データ３０５は、試験入力３０２ｓ_ｉと、生成された重み付けされた試験ラベルｇ_ｗ（ｓ_ｉ）とを含むペアにされたデータのセット（（ｓ_ｉ，ｇ_ｗ（ｓ_ｉ））として表される）に関連することが可能である。重み付けされた関数１７２は、試験入力３０２と重み付けされた試験ラベルｇ_ｗ（ｓ_ｉ）の間の関係を定義するのに有効であり得る。

機械学習モジュール１２０は、人工的な学習された関数１６４の中のそれぞれの人工的な学習された関数ｇ_ｊに試験入力３０２をさらに適用して、人工的な試験データ３０６の１つまたは複数のセット（（ｓ_ｉ，ｇ_ｊ（ｓ_ｉ））として表される）を生成することが可能である。人工的な試験データ３０６の各セットは、試験入力３０２ｓ_ｉと、対応する人工的な試験ラベルｇ_ｊ（ｓ_ｉ）とを含むペアにされたデータのセットに関連することが可能である。たとえば、機械学習モジュール１２０が、人工的な学習された関数ｇ_２に試験入力３０２を適用して、人工的な試験データのセット（ｓ_ｉ，ｇ_２（ｓ_ｉ））を生成することが可能である。人工的な学習された関数１６４は、試験入力３０２と人工的な試験ラベルｇ_ｊ（ｓ_ｉ）の間の関係を定義するのに有効であり得る。機械学習モジュール１２０は、人工的な重み付けされた関数１７４の中のそれぞれの人工的な重み付けされた関数に試験入力３０２をさらに適用して、人工的な重み付けされた試験データ３０７（（ｓ_ｉ，ｇ_ｗｊ（ｓ_ｉ））として表される）を生成することが可能である。人工的な重み付けされた試験データ３０７のそれぞれのセットは、試験入力３０２ｓ_ｉと、対応する人工的な重み付けされた試験ラベルｇ_ｗｊ（ｓ_ｉ）とを含むペアにされたデータのセットに関連することが可能である。人工的な重み付けされた関数１７４は、試験入力３０２と人工的な重み付けされた試験ラベルｇ_ｗｊ（ｓ_ｉ）の間の関係を定義するのに有効であり得る。

動作３１１において、算術モジュール１４０が、学習された関数１６２と重み付けされた関数１７２の間の予期される値３２０を決定することが可能である。学習された関数１６２と重み付けされた関数１７２の間の予期される値３２０の例は、以下のとおりであり得る。すなわち、

Ｅ［（ｇ−ｇ_ｗ）^２］

ここで、ｇは、学習された関数１６２を表し、ｇ_ｗは、重み付けされた関数１７２を表す。

例において、算術モジュール１４０が、以下のような試験入力３０２を使用して、予期される値３２０を決定することが可能である。すなわち、

Ｅ［（ｇ（ｓ_ｉ）−ｇ_ｗ（ｓ_ｉ））^２］

ここで、ｓ_ｉは、試験入力３０２であり、ｇ（ｓ_ｉ）は、試験ラベルｔ_ｉであり、ｇ_ｗ（ｓ_ｉ）は、重み付けされた試験ラベルｔ_ｗｉである。

同様に、算術モジュール１４０は、各第ｊ番の人工的な学習された関数１６４と各第ｊ番のターゲット関数１６８の間の予期される値３２２をさらに決定することが可能である。算術モジュール１４０は、各第ｊ番の人工的な重み付けされた関数１７４と各第ｊ番のターゲット関数１６８の間の予期される値３２４をさらに決定することが可能である。算術モジュール１４０は、各第ｊ番の人工的な学習された関数１６４と各第ｊ番の人工的な重み付けされた関数１７４の間の予期される値３２６をさらに決定することが可能である。算術モジュール１４０は、試験入力３０２を使用して、予期される値３２２、３２４、３２６を決定することが可能である。

動作３１２において、算術モジュール１４０が、いくつかの評価値３４０（Ｔ_ｊとして表される）を決定することが可能である。評価値３４０は、以下のとおり、予期される値３２２、３２４、３２６に基づくことが可能である。すなわち、

Ｔ_ｊ＝Ｅ［（ｇ_ｊ−ｆ_ｊ）^２］−Ｅ［（ｇ_ｗｊ−ｆ_ｊ）^２］−Ｅ［（ｇ_ｊ−ｇ_ｗｊ）^２］

ここで、Ｅ［（ｇ_ｊ−ｆ_ｊ）^２］は、予期される値３２２を表し、Ｅ［（ｇ _ｗｊ−ｆ_ｊ）^２］は、予期される値３２４を表し、Ｅ［（ｇ_ｊ−ｇ_ｗｊ）^２］は、予期される値３２６を表す。

動作３１３において、評価モジュール１５０が、評価値３４０の中の各値を予期される値３２０と比較することが可能である。評価値３４０と予期される値３２０の例示的な比較は、以下の条件３４２に基づくことが可能である。

Ｅ［（ｇ−ｇ_ｗ）^２］＋Ｔ_ｊ＞０

評価モジュール１５０が、評価値３４０の中のいくつの値が条件３４２を満たすかを数えることによってカウント３５０を決定することが可能である。たとえば、評価値３４０の中の３７個の値が条件３４２を満たす場合、カウント３５０は、値「３７」である。動作３１４において、評価モジュール１５０が、カウント３５０をしきい値３６０と比較することが可能であり、ここで、しきい値３６０は、機械学習命令１２２によって定義されることが可能であり、メモリ１０４の中に記憶されることが可能である。例において、しきい値３６０は、訓練データ１６０のポイントの数の半分であり得る。たとえば、訓練データ１６０が１００のポイントを含む場合、しきい値３６０は、値「５０」であり得る。

動作３１５において、評価モジュール１５０が、カウント３５０としきい値３６０の比較に基づいて、重み利益１５２を決定することが可能である。評価モジュール１５０は、カウント３５０としきい値３６０の比較に基づいて重み利益１５２に値を割り当てることが可能である。例において、カウント３５０が「３７」であり、しきい値が「５０」である場合、評価モジュール１５０には、重み利益１５２に「１」または「Ａ」（「適用する」）という値を割り当てることが可能である。同様に、カウント３５０が「７１」であり、しきい値が「５０」である場合、評価モジュール１５０には、重み利益１５２に「０」または「非Ａ」（「適用しない」）という値を割り当てることが可能である。評価モジュール１５０が、処理モジュール１１０に重み利益１５２を送信することが可能である。処理モジュール１１０が、重み利益１５２の値に基づいて、訓練データ１６０に重み１７０を適用すべきかどうかを決定することが可能である。処理モジュール１１０が、重み利益１５２の値に基づいて、学習された関数１６２を展開すべきか、または重み付けされた関数１７２を展開すべきかを機械学習モジュール１２０にさらに指示することが可能である。

他の可能な利点として、本開示によるシステムは、機械学習システムのパフォーマンスを向上させることが可能である。いくつかの例において、重み付けされた訓練データから決定された重み付けされた関数は、重み付けされていない訓練データから決定された関数と比べて、より正確であると見なされ得る。しかし、重み付けされた訓練データは、サンプルロスをもたらす可能性があり、重み付けされた関数の生成を意図せずに損なう可能性がある。本開示によるシステムは、訓練データに重みを適用することが、機械学習システムのパフォーマンスを利する可能性があるか、または損なう可能性があるかを決定する方法を提供することが可能である。

図４は、本明細書で提示される少なくともいくつかの実施形態により構成された、訓練データに関する重み利益エバリュエータを実施する例示的なプロセスに関する流れ図を示す。図４のプロセスは、たとえば、前述したシステム１００を使用して実施されることも可能である。例示的なプロセスは、ブロックＳ２、Ｓ４、Ｓ６、Ｓ８、Ｓ１０、Ｓ１２、Ｓ１４、および／またはＳ１６のうちの１つまたは複数によって示される、１つまたは複数の動作、アクション、または機能を含み得る。別々のブロックとして例示されるものの、様々なブロックは、所望される実施形態に依存して、さらなるブロックに分割されても、組み合わされて、より少ないブロックにされても、無くされてもよい。

処理は、ブロックＳ２、「訓練データに基づいて第１の関数を決定する」において始まることが可能である。ブロックＳ２において、デバイスが、訓練データに基づいて第１の関数を決定することが可能である。訓練データは、訓練入力と、訓練ラベルとを含み得る。

処理は、ブロックＳ２からブロックＳ４、「訓練データに重みのセットを適用して、重み付けされた訓練データを生成する」に進むことが可能である。ブロックＳ４において、デバイスが、訓練データに重みのセットを適用して、重み付けされた訓練データを生成することが可能である。

処理は、ブロックＳ４からブロックＳ６、「重み付けされた訓練データに基づいて第２の関数を決定する」に進むことが可能である。ブロックＳ６において、デバイスが、重み付けされた訓練データに基づいて第２の関数を決定することが可能である。

処理は、ブロックＳ６からブロックＳ８、「ターゲット関数に基づいてターゲットデータを生成する」に進むことが可能である。ブロックＳ８において、デバイスが、ターゲット関数に基づいてターゲットデータを生成することが可能である。そのターゲット関数は、訓練ラベルとは異なるターゲットラベルを含み得る。デバイスが、そのターゲット関数を生成することが可能である。例において、デバイスが、人工的な関数を生成するパラメータのセットを決定することが可能である。デバイスは、訓練入力および人工的な関数を使用して人工的なデータをさらに生成することが可能である。その人工的なデータは、訓練入力と、人工的なラベルとを含むことが可能である。デバイスは、訓練データに関連する第１の平均値をさらに決定することが可能である。デバイスは、訓練データに関連する第１の標準偏差をさらに決定することが可能である。デバイスは、人工的なデータに関連する第２の平均値をさらに決定することが可能である。デバイスは、人工的なデータに関連する第２の標準偏差をさらに決定することが可能である。デバイスは、第１の平均値、第１の標準偏差、第２の平均値、および第２の偏差に基づいてターゲット関数をさらに生成することが可能である。いくつかの例において、ターゲット関数は、雑音パラメータに基づくことが可能である。

処理は、ブロックＳ８からブロックＳ１０、「ターゲットデータに基づいて第３の関数を決定する」に進むことが可能である。ブロックＳ１０において、デバイスが、ターゲットデータに基づいて第３の関数を決定することが可能である。

処理は、ブロックＳ１０からブロックＳ１２、「ターゲットデータに重みのセットを適用して、重み付けされたターゲットデータを生成する」に進むことが可能である。ブロックＳ１２において、デバイスが、ターゲットデータに重みのセットを適用して、重み付けされたターゲットデータを生成することが可能である。

処理は、ブロックＳ１２からブロックＳ１４、「重み付けされたターゲットデータに基づいて第４の関数を決定する」に進むことが可能である。ブロックＳ１４において、デバイスが、重み付けされたターゲットデータに基づいて第４の関数を決定することが可能である。

処理は、ブロックＳ１４からブロックＳ１６、「第１の関数、第２の関数、第３の関数、および第４の関数に基づいて重み利益を決定する」に進むことが可能である。ブロックＳ１６において、デバイスが、第１の関数、第２の関数、第３の関数、および第４の関数に基づいて重み利益を決定することが可能である。重み利益は、訓練データに重みのセットを適用する利益に関連することが可能である。いくつかの例において、デバイスが、第１の予期される値、第２の予期される値、第３の予期される値、および第４の予期される値を決定することが可能である。第１の予期される値は、第１の関数と第２の関数の間の予期される値であり得る。第２の予期される値は、第３の関数とターゲット関数の間の予期される値であり得る。第３の予期される値は、第３の関数とターゲット関数の間の予期される値であり得る。第４の予期される値は、第３の関数と第４の関数の間の予期される値であり得る。重み利益の決定は、第１の予期される値、第２の予期される値、第３の予期される値、および第４の予期される値に基づくことが可能である。いくつかの例において、第１の予期される値、第２の予期される値、第３の予期される値、および第４の予期される値は、第１の関数、第２の関数、第３の関数、および第４の関数に試験入力を適用することに基づくことが可能である。

いくつかの例において、デバイスが、第２の予期される値、第３の予期される値、および第４の予期される値を使用して評価値をさらに決定することが可能である。デバイスは、その評価値を第１の予期される値とさらに比較することが可能である。デバイスは、その評価値と第１の予期される値の比較に基づいてカウントをさらに決定することが可能である。デバイスは、そのカウントをしきい値とさらに比較することが可能である。重み利益の決定はまず、そのカウントとしきい値の比較に基づくことが可能である。

図５は、本明細書で説明される少なくともいくつかの実施形態により構成された、訓練データに関する重み利益エバリュエータを実施するのに利用され得る例示的なコンピュータプログラム製品を示す。プログラム製品５００が、信号担持媒体５０２を含み得る。信号担持媒体５０２は、たとえば、プロセッサによって実行されると、図１〜図４に関連して前述した機能をもたらすことが可能な１つまたは複数の命令５０４を含み得る。このため、たとえば、システム１００を参照すると、コンピューティングデバイス１０２が、媒体５０２によってシステム１００に伝送された命令５０４に応答して、図５に示されるブロックのうちの１つまたは複数を実行することが可能である。

いくつかの実施形態において、信号担持媒体５０２は、ハードディスクドライブ、コンパクトディスク（ＣＤ）、デジタルバーサタイルディスク（ＤＶＤ）、デジタルテープ、メモリなどの、ただし、以上には限定されないコンピュータ可読媒体５０６を包含することが可能である。いくつかの実施形態において、信号担持媒体５０２は、メモリ、読取り／書込み（Ｒ／Ｗ）型ＣＤ、Ｒ／Ｗ型ＤＶＤなどの、ただし、以上には限定されない記録可能媒体５０８を包含することが可能である。いくつかの実施形態において、信号担持媒体５０２は、デジタル通信媒体および／またはアナログ通信媒体（たとえば、光ファイバケーブル、導波管、有線通信リンク、ワイヤレス通信リンク、その他）などの、ただし、以上には限定されない通信媒体５１０を包含することが可能である。このため、たとえば、プログラム製品５００は、ＲＦ信号担持媒体５０２によってシステム１００の１つまたは複数のモジュールに伝送されることが可能であり、信号担持媒体５０２は、ワイヤレス通信媒体５１０（たとえば、ＩＥＥＥ８０２．１１標準に準拠するワイヤレス通信媒体）によって伝送される。

図６は、本明細書で説明される少なくともいくつかの実施形態により構成された、訓練データに関する重み利益エバリュエータを実施するように構成された例示的なコンピューティングデバイスを示すブロック図である。非常に基本的な構成６０２において、コンピューティングデバイス６００は、通常、１つまたは複数のプロセッサ６０４と、システムメモリ６０６とを含む。メモリバス６０８が、プロセッサ６０４とシステムメモリ６０６の間で通信するために使用され得る。

所望される構成に依存して、プロセッサ６０４は、マイクロプロセッサ（μＰ）、マイクロコントローラ（μＣ）、デジタルシグナルプロセッサ（ＤＳＰ）、または以上の任意の組み合わせを含むが、以上には限定されない任意のタイプのものであり得る。プロセッサ６０４は、レベル１キャッシュ６１０およびレベル２キャッシュ６１２などの１つまたは複数のレベルのキャッシングと、プロセッサコア６１４と、レジスタ６１６とを含み得る。例示的なプロセッサコア６１４は、算術論理演算装置（ＡＬＵ）、浮動小数点演算装置（ＦＰＵ）、デジタル信号処理コア（ＤＳＰコア）、または以上の任意の組み合わせを含み得る。また、例示的なメモリコントローラ６１８が、プロセッサ６０４と一緒に使用されることも可能であり、またはいくつかの実施形態において、メモリコントローラ６１８は、プロセッサ６０４と一体化した部分であることが可能である。

所望される構成に依存して、システムメモリ６０６は、揮発性メモリ（ＲＡＭなどの）、不揮発性メモリ（ＲＯＭ、フラッシュメモリなどの）、または揮発性メモリと不揮発性メモリの任意の組み合わせを含むが、以上には限定されない任意のタイプのものであり得る。システムメモリ６０６は、オペレーティングシステム６２０と、１つまたは複数のアプリケーション６２２と、プログラムデータ６２４とを含むことが可能である。アプリケーション６２２は、図１〜図４のシステム１００に関連して説明した機能を含め、本明細書で説明される機能を実行するように構成された重み利益評価アルゴリズム６２６を含むことが可能である。プログラムデータ６２４は、本明細書で説明されるとおり訓練データに関する重み利益エバリュエータを実施するのに役立ち得る重み利益評価データ６２８を含むことが可能である。いくつかの実施形態において、アプリケーション６２２は、訓練データに関する重み利益エバリュエータの実施形態が提供され得るようにオペレーティングシステム６２０上でプログラムデータ６２４を操作するように構成されることが可能である。この説明される基本構成６０２が、内側の破線内の構成要素によって図６に示される。

コンピューティングデバイス６００は、さらなる特徴または機能、ならびに基本構成６０２と任意の要求されるデバイスおよびインターフェースの間で通信を円滑にするさらなるインターフェースを有することが可能である。たとえば、バス／インターフェースコントローラ６３０が、ストレージインターフェースバス６３４を介して基本構成６０２と１つまたは複数のデータストレージデバイス６３２の間の通信を円滑にするのに使用され得る。データストレージデバイス６３２は、取外し式ストレージデバイス６３６、非取外し式ストレージデバイス６３８、または取外し式ストレージデバイス６３６と非取外し式ストレージデバイス６３８の組み合わせであることが可能である。取外し式ストレージデバイスおよび非取外し式ストレージデバイスの例には、いくつかを挙げると、フレキシブルディスクドライブおよびハードディスクドライブ（ＨＤＤ）などの磁気ディスクデバイス、コンパクトディスク（ＣＤ）ドライブまたはデジタルバーサタイルディスク（ＤＶＤ）ドライブなどの光ディスクドライブ、ソリッドステートドライブ（ＳＳＤ）、およびテープドライブが含まれる。例示的なコンピュータ記憶媒体には、コンピュータ可読命令、データ構造、プログラムモジュール、またはその他のデータなどの情報を記憶するために任意の方法または技術で実装された揮発性媒体および不揮発性媒体、取外し式媒体および非取外し式媒体が含まれ得る。

システムメモリ６０６、取外し式ストレージデバイス６３６、および非取外し式ストレージデバイス６３８が、コンピュータ記憶媒体の例である。コンピュータ記憶媒体には、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリもしくは他のメモリ技術、ＣＤ−ＲＯＭ、デジタルバーサタイルディスク（ＤＶＤ）もしくは他の光ストレージ、磁気カセット、磁気テープ、磁気ディスクストレージもしくは他の磁気ストレージデバイス、または所望される情報を記憶するのに使用されることが可能であり、コンピューティングデバイス６００によってアクセスされ得る他の任意の媒体が含まれるが、以上には限定されない。任意のそのようなコンピュータ記憶媒体が、コンピューティングデバイス６００の一部であり得る。

また、コンピューティングデバイス６００は、バス／インターフェースコントローラ６３０を介して様々なインターフェースデバイス（たとえば、出力デバイス６４２、周辺インターフェース６４４、および通信デバイス６４６）から基本構成６０２への通信を円滑にするためのインターフェースバス６４０を含むことも可能である。例示的な出力デバイス６４２は、１つまたは複数のＡ／Ｖポート６５２を介してディスプレイまたはスピーカなどの様々な外部デバイスに通信するように構成され得る、グラフィックス処理ユニット６４８およびオーディオ処理ユニット６５０を含む。例示的な周辺インターフェース６４４は、１つまたは複数のＩ／Ｏポート６５８を介して入力デバイス（たとえば、キーボード、マウス、ペン、音声入力デバイス、タッチ入力デバイスなど）またはその他の周辺デバイス（たとえば、プリンタ、スキャナなど）などの外部デバイスと通信するように構成され得るシリアルインターフェースコントローラ６５４またはパラレルインターフェースコントローラ６５６を含む。例示的な通信デバイス６４６は、１つまたは複数の通信ポート６６４経由でネットワーク通信リンクを介して他の１つまたは複数のコンピューティングデバイス６６２を相手にした通信を円滑にするように構成され得るネットワークコントローラ６６０を含む。

ネットワーク通信リンクは、通信媒体の一例であり得る。通信媒体は、通常、搬送波または他のトランスポート機構などの変調されたデータ信号内のコンピュータ可読命令、データ構造、プログラムモジュール、または他のデータによって実現されることが可能であり、任意の情報配信媒体を含み得る。「変調されたデータ信号」は、信号内に情報を符号化するように信号の特性のうちの１つまたは複数が設定された、または変更された信号であり得る。例として、限定としてではなく、通信媒体には、有線ネットワークまたは直接配線接続などの有線媒体、ならびに音響媒体、無線周波数（ＲＦ）媒体、マイクロ波媒体、赤外線（ＩＲ）媒体、およびその他のワイヤレス媒体などのワイヤレス媒体が含まれ得る。本明細書で使用されるコンピュータ可読媒体という用語は、記憶媒体と通信媒体をともに含み得る。

コンピューティングデバイス６００は、セル電話、携帯情報端末（ＰＤＡ）、パーソナルメディアプレーヤデバイス、ワイヤレスウェブウォッチデバイス、パーソナルヘッドセットデバイス、特定用途向けデバイス、または前述の機能のいずれかを含むハイブリッドデバイスなどのスモールフォームファクタのポータブル（またはモバイル）電子デバイスの一部分として実装され得る。また、コンピューティングデバイス６００は、ラップトップコンピュータ構成と非ラップトップコンピュータ構成の両方を含め、パーソナルコンピュータとして実装されることも可能である。

本開示は、様々な態様の例示として意図される、本出願において説明される特定の実施形態に関して限定されるべきではない。当業者には明白となるとおり、本開示の趣旨および範囲を逸脱することなく、多くの変形および変更が行われ得る。本明細書において列挙される方法および装置に加えて、本開示の範囲に含まれる機能的に均等な方法および装置が、前段の説明から当業者には明白となろう。そのような変形および変更は、添付の特許請求の範囲に含まれるものとされる。本開示は、添付の特許請求の範囲、およびそのような特許請求の範囲に権利が与えられる均等物の完全な範囲によってのみ限定されるものとする。本開示は、無論、様々であり得る、特定の方法、試薬、化合物組成、または生物系に限定されないことを理解されたい。また、本明細書で使用される用語は、特定の実施形態を説明することを目的とするに過ぎず、限定することは意図していないことも理解されたい。

本明細書における実質的にすべての複数形および／または単数形の用語の使用に対して、当業者は、状況および／または用途に適切なように、複数形から単数形に、および／または単数形から複数形に変換することができる。様々な単数形／複数形の置き換えは、理解しやすいように、本明細書で明確に説明することができる。

通常、本明細書において、特に添付の特許請求の範囲（たとえば、添付の特許請求の範囲の本体部）において使用される用語は、全体を通じて「オープンな（ｏｐｅｎ）」用語として意図されていることが、当業者には理解されよう（たとえば、用語「含む（ｉｎｃｌｕｄｉｎｇ）」は、「含むがそれに限定されない（ｉｎｃｌｕｄｉｎｇｂｕｔｎｏｔｌｉｍｉｔｅｄｔｏ）」と解釈されるべきであり、用語「有する（ｈａｖｉｎｇ）」は、「少なくとも有する（ｈａｖｉｎｇａｔｌｅａｓｔ）」と解釈されるべきであり、用語「含む（ｉｎｃｌｕｄｅｓ）」は、「含むがそれに限定されない（ｉｎｃｌｕｄｅｓｂｕｔｉｓｎｏｔｌｉｍｉｔｅｄｔｏ）」と解釈されるべきである、など）。導入される請求項で具体的な数の記載が意図される場合、そのような意図は、当該請求項において明示的に記載されることになり、そのような記載がない場合、そのような意図は存在しないことが、当業者にはさらに理解されよう。たとえば、理解の一助として、添付の特許請求の範囲は、導入句「少なくとも１つの（ａｔｌｅａｓｔｏｎｅ）」および「１つまたは複数の（ｏｎｅｏｒｍｏｒｅ）」を使用して請求項の記載を導くことを含む場合がある。しかし、そのような句の使用は、同一の請求項が、導入句「１つまたは複数の」または「少なくとも１つの」および「ａ」または「ａｎ」などの不定冠詞を含む場合であっても、不定冠詞「ａ」または「ａｎ」による請求項の記載の導入が、そのように導入される請求項の記載を含む任意の特定の請求項を、単に１つのそのような記載を含む実施形態に限定する、ということを示唆していると解釈されるべきではない（たとえば、「ａ」および／または「ａｎ」は、「少なくとも１つの」または「１つまたは複数の」を意味すると解釈されるべきである）。同じことが、請求項の記載を導入するのに使用される定冠詞の使用にも当てはまる。また、導入される請求項の記載で具体的な数が明示的に記載されている場合でも、そのような記載は、少なくとも記載された数を意味すると解釈されるべきであることが、当業者には理解されよう（たとえば、他の修飾語なしでの「２つの記載（ｔｗｏｒｅｃｉｔａｔｉｏｎｓ）」の単なる記載は、少なくとも２つの記載、または２つ以上の記載を意味する）。さらに、「Ａ、ＢおよびＣ、などの少なくとも１つ」に類似の慣例表現が使用されている事例では、通常、そのような構文は、当業者がその慣例表現を理解するであろう意味で意図されている（たとえば、「Ａ、Ｂ、およびＣの少なくとも１つを有するシステム」は、Ａのみ、Ｂのみ、Ｃのみ、ＡおよびＢを共に、ＡおよびＣを共に、ＢおよびＣを共に、ならびに／またはＡ、Ｂ、およびＣを共に、などを有するシステムを含むが、それに限定されない）。「Ａ、Ｂ、またはＣ、などの少なくとも１つ」に類似の慣例表現が使用されている事例では、通常、そのような構文は、当業者がその慣例表現を理解するであろう意味で意図されている（たとえば、「Ａ、Ｂ、またはＣの少なくとも１つを有するシステム」は、Ａのみ、Ｂのみ、Ｃのみ、ＡおよびＢを共に、ＡおよびＣを共に、ＢおよびＣを共に、ならびに／またはＡ、Ｂ、およびＣを共に、などを有するシステムを含むが、それに限定されない）。２つ以上の代替用語を提示する事実上いかなる離接する語および／または句も、明細書、特許請求の範囲、または図面のどこにあっても、当該用語の一方（ｏｎｅｏｆｔｈｅｔｅｒｍｓ）、当該用語のいずれか（ｅｉｔｈｅｒｏｆｔｈｅｔｅｒｍｓ）、または両方の用語（ｂｏｔｈｔｅｒｍｓ）を含む可能性を企図すると理解されるべきであることが、当業者にはさらに理解されよう。たとえば、句「ＡまたはＢ」は、「Ａ」または「Ｂ」あるいは「ＡおよびＢ」の可能性を含むことが理解されよう。

さらに、本開示の特徴または態様がマーカッシュグループに関連して説明される場合、本開示は、その結果、そのマーカッシュグループの任意の個別のメンバ、またはそのようなメンバのサブグループに関連しても説明されることが当業者には認識されよう。

当業者には理解されるとおり、書面の説明を与えることなどに関してなどの一部およびすべての目的に関して、事実上、本明細書で開示されるすべての範囲は、その範囲の可能なすべての部分的範囲、およびその範囲の部分的範囲の組み合わせも包含する。いずれのリストアップされる範囲も、少なくとも等しい１／２、１／３、１／４、１／５、１／１０などに細分された同一の範囲を十分に説明し、可能にするものと容易に認識され得る。非限定的な例として、本明細書で説明される各範囲は、下１／３、中１／３、および上１／３などに容易に細分され得る。当業者には理解されるとおり、「〜まで」、「少なくとも〜」、「〜より大きい」、「〜未満」などのすべての言い回しは、記載される数を含むとともに、前述したとおり、部分的範囲にその後、細分され得る範囲を指す。最後に、当業者には理解されるとおり、範囲は、個別の各メンバを含む。このため、たとえば、１〜３のセルを有するグループとは、１つのセル、２つのセル、または３つのセルを有するグループを指す。同様に、１〜５のセルを有するグループとは、１つのセル、２つのセル、３つのセル、４つのセル、または５つのセルを有するグループを指すといった具合である。

様々な態様および実施形態が本明細書で説明されてきたが、他の態様および実施形態が、当業者には明白となろう。本明細書で開示される様々な態様および実施形態は、例示を目的としており、限定することは意図しておらず、真の範囲および趣旨は、添付の特許請求の範囲によって示される。

Claims

機械学習環境において訓練データに関連する重み利益を決定する方法であって、デバイスによる、
前記訓練データに基づいて第１の関数を決定することであって、前記訓練データは、訓練入力と、訓練ラベルとを含むこと、
前記訓練データに重みのセットを適用して、重み付けされた訓練データを生成すること、
前記重み付けされた訓練データに基づいて第２の関数を決定すること、
重みの前記セットの評価のために使用する関数（以下、ターゲット関数という）に基づいて、重みの前記セットの評価のために使用するデータ（以下、ターゲットデータという）を生成することであって、前記ターゲットデータは、前記訓練入力と、前記訓練入力を前記ターゲット関数に適用して得られるラベル（以下、ターゲットラベルという）を含み、前記ターゲットラベルは、前記訓練ラベルとは異なること、
前記ターゲットデータに基づいて第３の関数を決定すること、
前記ターゲットデータに重みの前記セットを適用して、重み付けされたターゲットデータを生成すること、
重み付けされたターゲットデータに基づいて第４の関数を決定すること、ならびに
前記第１の関数、前記第２の関数、前記第３の関数、および前記第４の関数に基づいて前記重み利益を決定することであって、前記重み利益は、前記訓練データに重みの前記セットを適用する利益に関連すること、を備える方法。
前記第１の関数と前記第２の関数の間の第１の予期される値を決定すること、
前記第３の関数と前記ターゲット関数の間の第２の予期される値を決定することであって、前記ターゲット関数は、前記訓練データに基づくこと、
前記第４の関数と前記ターゲット関数の間の第３の予期される値を決定すること、および
前記第３の関数と前記第４の関数の間の第４の予期される値を決定すること、をさらに備え、
前記重み利益を前記決定することは、前記第１の予期される値、前記第２の予期される値、前記第３の予期される値、および前記第４の予期される値に基づく、請求項１に記載の方法。
前記第１の予期される値、前記第２の予期される値、前記第３の予期される値、および前記第４の予期される値は、それぞれ、前記第１の関数、前記第２の関数、前記第３の関数、および前記第４の関数に試験入力を適用することに基づく、請求項２に記載の方法。
前記第２の予期される値、前記第３の予期される値、および前記第４の予期される値を使用して評価値を決定すること、
前記評価値を前記第１の予期される値と比較すること、
前記評価値と前記第１の予期される値を前記比較することに基づいてカウントを決定すること、および
前記カウントをしきい値と比較すること、をさらに備え、
前記重み利益を前記決定することは、前記カウントと前記しきい値を前記比較することに基づく、請求項２に記載の方法。
前記重み付けされたターゲットデータを前記生成することは、前記ターゲット関数に基づく、請求項２に記載の方法。
前記ターゲット関数を生成するために使用する関数（以下、人工的な関数という）を生成するパラメータのセットを決定すること、
前記訓練入力および前記人工的な関数を使用して、前記ターゲット関数を生成するために使用するデータ（以下、人工的なデータという）を生成することであって、前記人工的なデータは、前記訓練入力と、前記訓練入力を前記人工的な関数に適用して得られるラベルとを含むこと、
前記訓練データおよび前記人工的なデータに基づいて前記ターゲット関数を生成すること、
前記第１の関数と前記第２の関数の間の第１の予期される値を決定すること、
前記第３の関数と前記ターゲット関数の間の第２の予期される値を決定すること、
前記第４の関数と前記ターゲット関数の間の第３の予期される値を決定すること、ならびに
前記第３の関数と前記第４の関数の間の第４の予期される値を決定すること、をさらに備え、
前記重み利益を前記決定することは、前記第１の予期される値、前記第２の予期される値、前記第３の予期される値、および前記第４の予期される値に基づく、請求項１に記載の方法。
前記ターゲット関数を前記生成することは、
前記訓練データに関連する第１の平均値を決定すること、
前記訓練データに関連する第１の標準偏差を決定すること、
前記人工的なデータに関連する第２の平均値を決定すること、
前記人工的なデータに関連する第２の標準偏差を決定すること、を備え、
前記ターゲット関数は、前記第１の平均値、前記第１の標準偏差、前記第２の平均値、および前記第２の偏差に基づく、請求項６に記載の方法。
前記ターゲット関数は、雑音パラメータにさらに基づく、請求項７に記載の方法。
前記ターゲット関数は、
前記第１の平均値、前記第１の標準偏差、前記第２の平均値、および前記第２の標準偏差に符号関数、
前記第１の平均値、前記第１の標準偏差、前記第２の平均値、および前記第２の標準偏差にラウンド関数、または
前記第１の平均値、前記第１の標準偏差、前記第２の平均値、および前記第２の標準偏差に最近接数関数
のうちの１つを適用することに基づく、請求項７に記載の方法。
機械学習環境において訓練データに関連する重み利益を決定するのに有効なシステムであって、
前記訓練データを記憶することであって、前記訓練データは、訓練入力と、訓練ラベルとを含むこと、および
重みのセットを記憶することを行うように構成されたメモリと、
前記メモリと通信状態にあるように構成されたターゲット関数生成モジュールであって、
重みの前記セットの評価のために使用する関数（以下、ターゲット関数という）に基づいて、重みの前記セットの評価のために使用するデータ（以下、ターゲットデータという）を生成することであって、前記ターゲットデータは、前記訓練入力と、前記訓練入力を前記ターゲット関数に適用して得られるラベル（以下、ターゲットラベルという）を含み、前記ターゲットラベルは、前記訓練ラベルとは異なること、および
前記ターゲットデータを前記メモリの中に記憶することを行うように構成されたターゲット関数生成モジュールと、
前記ターゲット関数生成モジュールおよび前記メモリと通信状態にあるように構成された処理モジュールであって、
前記訓練データに重みの前記セットを適用して、重み付けされた訓練データを生成すること、
前記ターゲットデータに重みの前記セットを適用して、重み付けされたターゲットデータを生成すること、
前記重み付けされた訓練データおよび前記重み付けされたターゲットデータを前記メモリの中に記憶することを行うように構成された処理モジュールと、
前記ターゲット関数生成モジュール、前記処理モジュール、および前記メモリと通信状態にあるように構成された機械学習モジュールであって、
前記訓練データに基づいて第１の関数を決定すること、
前記重み付けされた訓練データに基づいて第２の関数を決定すること、
前記ターゲットデータに基づいて第３の関数を決定すること、および
前記重み付けされたターゲットデータに基づいて第４の関数を決定することを行うように構成された機械学習モジュールと、
前記ターゲット関数生成モジュール、前記処理モジュール、前記機械学習モジュール、および前記メモリと通信状態にあるように構成された評価モジュールであって、
前記第１の関数、前記第２の関数、前記第３の関数、および前記第４の関数に基づいて前記重み利益を決定することであって、前記重み利益は、前記訓練データに重みの前記セットを適用する利益に関連することを行うように構成された評価モジュールと、を備えるシステム。
前記ターゲット関数生成モジュール、前記処理モジュール、前記機械学習モジュール、前記評価モジュール、および前記メモリと通信状態にあるように構成された算術モジュールをさらに備え、前記算術モジュールは、
前記第１の関数と前記第２の関数の間の第１の予期される値を決定すること、
前記メモリから前記ターゲット関数を取り出すことであって、前記ターゲット関数は、前記訓練データに基づくこと、
前記第３の関数と前記ターゲット関数の間の第２の予期される値を決定すること、
前記第４の関数と前記ターゲット関数の間の第３の予期される値を決定すること、
前記第３の関数と前記第４の関数の間の第４の予期される値を決定すること、
前記第１の予期される値、前記第２の予期される値、前記第３の予期される値、および前記第４の予期される値を前記評価モジュールに送信することを行うように構成され、
前記評価モジュールは、前記第１の予期される値、前記第２の予期される値、前記第３の予期される値、および前記第４の予期される値に基づいて前記重み利益を決定するのに有効である、請求項１０に記載のシステム。
前記評価モジュールは、
前記第１の予期される値、前記第２の予期される値、前記第３の予期される値、および前記第４の予期される値を受信すること、
前記第２の予期される値、前記第３の予期される値、および前記第４の予期される値を使用して評価値を決定すること、
前記評価値を前記第１の予期される値と比較すること、
前記評価値と前記第１の予期される値を前記比較することに基づいてカウントを決定すること、および
前記カウントをしきい値と比較することを行うようにさらに構成され、
前記重み利益を前記決定することは、前記カウントと前記しきい値を前記比較することに基づく、請求項１１に記載のシステム。
前記処理モジュールは、
前記ターゲット関数を使用して前記重み付けされたターゲットデータを生成することを行うように構成される、請求項１１に記載のシステム。
前記ターゲット関数生成モジュールは、
前記ターゲット関数を生成するために使用する関数（以下、人工的な関数という）を生成するパラメータのセットを決定すること、
前記訓練入力および前記人工的な関数を使用して、前記ターゲット関数を生成するために使用するデータ（以下、人工的なデータという）を生成することであって、前記人工的なデータは、前記訓練入力と、前記訓練入力を前記人工的な関数に適用して得られるラベルとを含むこと、
前記訓練データおよび前記人工的なデータに基づいて前記ターゲット関数を生成すること、
前記第１の関数と前記第２の関数の間の第１の予期される値を決定すること、
前記第３の関数と前記ターゲット関数の間の第２の予期される値を決定すること、
前記第４の関数と前記ターゲット関数の間の第３の予期される値を決定すること、ならびに
前記第３の関数と前記第４の関数の間の第４の予期される値を決定することを行うようにさらに構成され、
前記評価モジュールは、前記第１の予期される値、前記第２の予期される値、前記第３の予期される値、および前記第４の予期される値に基づいて前記重み利益を決定するのに有効である、請求項１０に記載のシステム。
前記ターゲット関数生成モジュールは、
前記訓練データに関連する第１の平均値を決定すること、
前記訓練データに関連する第１の標準偏差を決定すること、
前記人工的なデータに関連する第２の平均値を決定すること、および
前記人工的なデータに関連する第２の標準偏差を決定することを行うようにさらに構成され、
前記ターゲット関数は、前記人工的なデータ、前記第１の平均値、前記第１の標準偏差、前記第２の平均値、および前記第２の偏差に基づく、請求項１４に記載のシステム。
機械学習環境において訓練データに関連する重み利益を決定する方法であって、第１のデバイスによる、
第２のデバイスから、前記訓練データに基づく第１の関数を受信することであって、前記訓練データは、訓練入力と、訓練ラベルとを含むこと、
前記第２のデバイスから、重みのセットを受信すること、
前記第２のデバイスから、重み付けされた訓練データに基づく第２の関数を受信することであって、前記重み付けされた訓練データは、重みの前記セットに基づくこと、
重みの前記セットの評価のために使用する関数（以下、ターゲット関数という）に基づいて、重みの前記セットの評価のために使用するデータ（以下、ターゲットデータという）を生成することであって、前記ターゲットデータは、前記訓練入力と、前記訓練入力を前記ターゲット関数に適用して得られるラベル（以下、ターゲットラベルという）を含み、前記ターゲットラベルは、前記訓練ラベルとは異なること、
前記ターゲットデータに基づいて第３の関数を決定すること、
前記ターゲットデータに重みの前記セットを適用して、重み付けされたターゲットデータを生成すること、
前記重み付けされたターゲットデータに基づいて第４の関数を決定すること、ならびに
前記第１の関数、前記第２の関数、前記第３の関数、および前記第４の関数に基づいて前記重み利益を決定することであって、前記重み利益は、前記訓練データに重みの前記セットを適用する利益に関連すること、を備える方法。
前記第１の関数と前記第２の関数の間の第１の予期される値を決定すること、
前記第３の関数と前記ターゲット関数の間の第２の予期される値を決定すること、
前記第４の関数と前記ターゲット関数の間の第３の予期される値を決定すること、および
前記第３の関数と前記第４の関数の間の第４の予期される値を決定すること、をさらに備え、
前記重み利益を前記決定することは、前記第１の予期される値、前記第２の予期される値、前記第３の予期される値、および前記第４の予期される値に基づく、請求項１６に記載の方法。
前記第１の予期される値、前記第２の予期される値、前記第３の予期される値、および前記第４の予期される値は、それぞれ、前記第１の関数、前記第２の関数、前記第３の関数、および前記第４の関数に試験入力を適用することに基づく、請求項１７に記載の方法。
前記第２の予期される値、前記第３の予期される値、および前記第４の予期される値を使用して評価値を決定すること、
前記評価値を前記第１の予期される値と比較すること、
前記評価値と前記第１の予期される値を前記比較することに基づいてカウントを決定すること、および
前記カウントをしきい値と比較すること、をさらに備え、
前記重み利益を前記決定することは、前記カウントと前記しきい値を前記比較することに基づく、請求項１７に記載の方法。
前記ターゲット関数を生成するために使用する関数（以下、人工的な関数という）を生成するパラメータのセットを決定すること、
前記訓練入力および前記人工的な関数を使用して、前記ターゲット関数を生成するために使用するデータ（以下、人工的なデータという）を生成することであって、前記人工的なデータは、前記訓練入力と、前記訓練入力を前記人工的な関数に適用して得られるラベルとを含むこと、
前記訓練データに関連する第１の平均値を決定すること、
前記訓練データに関連する第１の標準偏差を決定すること、
前記人工的なデータに関連する第２の平均値を決定すること、
前記人工的なデータに関連する第２の標準偏差を決定すること、および
前記人工的なデータ、前記第１の平均値、前記第１の標準偏差、前記第２の平均値、および前記第２の標準偏差を使用して前記ターゲット関数を生成すること、をさらに備える、請求項１６に記載の方法。