JP6212217B2

JP6212217B2 - 機械学習における重みの生成

Info

Publication number: JP6212217B2
Application number: JP2016532125A
Authority: JP
Inventors: アブ−モスタファ，ヤセル，サイド; ゴンザレス，カルロス，ロベルト
Original assignee: カリフォルニアインスティテュートオブテクノロジー
Priority date: 2013-11-22
Filing date: 2014-11-21
Publication date: 2017-10-11
Anticipated expiration: 2034-11-21
Also published as: KR101868829B1; KR20160084453A; JP2017500639A; US9953271B2; EP3072069A4; EP3072069A1; US20150206066A1; WO2015077557A1

Description

本出願は、出願全体を本明細書において参照により援用する、２０１３年１１月２２日に出願した米国特許仮出願第６１／９０７，４９１号明細書、２０１４年６月２０日に出願した米国特許仮出願第６２／０１５，１７６号明細書、および２０１４年８月５日に出願した米国特許仮出願第１４／４５１，８７０号明細書の優先権を主張するものである。本出願は、２０１４年８月５日に出願された「ＷＥＩＧＨＴＢＥＮＥＦＩＴＥＶＡＬＵＡＴＯＲＦＯＲＴＲＡＩＮＩＮＧＤＡＴＡ」と題する特許出願第１４／４５１，８５９号、２０１４年８月５日に出願された「ＷＥＩＧＨＴＧＥＮＥＲＡＴＩＯＮＩＮＭＡＣＨＩＮＥＬＥＡＲＮＩＮＧ」と題する特許出願第１４／４５１，８９９号、および２０１４年８月５日に出願された「ＡＬＴＥＲＮＡＴＩＶＥＴＲＡＩＮＩＮＧＤＩＳＴＲＩＢＵＴＩＯＮＤＡＴＡＩＮＭＡＣＨＩＮＥＬＥＡＲＮＩＮＧ」と題する特許出願第１４／４５１，９３５号に関する。

本明細書において特に指示のない限り、この節において説明される題材は、本出願における特許請求の範囲に対する従来技術ではなく、この節に含有することにより従来技術であると是認されるものではない。

機械学習は、データから学習し、データに基づいて一般化を行うために、データにより訓練され得るシステムを伴うことができる。訓練された機械学習システムは、入力を取り込み、出力を予測することができる。一部の例において、機械学習技法は、分類または回帰の問題を解決することによって、出力を予測することができる。機械学習システムは、データによる学習アルゴリズムの訓練に基づいて、データを分類すること、推奨を行うこと、および／またはさまざまな結果を予測することに効果的となり得る。

一部の例において、機械学習環境において重みを決定するための方法が、概ね説明される。一部の例において、方法は、プロセッサにより、トレーニングデータのトレーニング分布を識別することを含むことができる。その他の例において、方法はまた、プロセッサにより、テストデータのテスト分布に関する情報を識別することを含むことができる。一部の他の例において、方法はまた、プロセッサにより、トレーニングデータおよびテストデータのコーディネイトを識別することを含むことができる。さらにその他の例において、方法はまた、プロセッサにより、コーディネイトについて、テスト分布とトレーニング分布との差を決定することを含むことができる。その他の例において、方法はまた、プロセッサにより、コーディネイトの重み重要度パラメータを識別することを含むことができる。一部の他の例において、方法はまた、プロセッサにより、前記差に基づいて、および重み重要度パラメータに基づいて、重みを計算することを含むことができる。重みは、トレーニング分布を、ある適合度においてテスト分布と適合させるように構成されてもよい。一部の例において、ある適合度は、重み重要度パラメータに基づいてもよい。

一部の例において、機械学習環境において重みを決定するための方法が、概ね説明される。一部の例において、方法は、プロセッサにより、トレーニングデータのトレーニング分布を識別することを含むことができる。さらに他の例において、方法はまた、プロセッサにより、テストデータのテスト分布に関する情報を識別することを含むことができる。さまざまな例において、方法はまた、プロセッサにより、トレーニングデータおよびテストデータのコーディネイトを識別することを含むことができる。一部の他の例において、方法はまた、プロセッサにより、コーディネイトについて、テスト分布とトレーニング分布との差を決定することを含むことができる。その他の例において、方法は、プロセッサにより、コーディネイトの第１の重み重要度パラメータを識別することを含むことができる。さらに他の例において、方法はまた、プロセッサにより、前記差に基づいて、および第１の重み重要度パラメータに基づいて、第１の重みを計算することを含むことができる。第１の重みは、トレーニング分布を、第１の適合度においてテスト分布と適合させるように構成されてもよい。一部の例において、第１の適合度は、第１の重み重要度パラメータに基づいてもよい。さまざまな他の例において、方法はまた、プロセッサにより、コーディネイトの第２の重み重要度パラメータを識別することを含むことができる。一部の他の例において、方法はまた、プロセッサにより、前記差に基づいて、および第２の重み重要度パラメータに基づいて、第２の重みを計算することを含むことができる。第２の重みは、トレーニング分布を、第２の適合度においてテスト分布と適合させるように構成されてもよい。一部の例において、第２の適合度は、第２の重み重要度パラメータに基づいてもよい。さまざまな例において、第２の適合度は、第１の適合度と異なっていてもよい。

一部の他の例において、機械学習システムが、概ね説明される。一部の例において、機械学習システムは、プロセッサ、および／またはプロセッサと通信するように構成されたメモリとを含むことができる。一部の例において、メモリは、トレーニングデータを含むことができる。トレーニングデータは、第１の点を含むことができる。一部の他の例において、メモリは、テストデータを含むことができる。テストデータは、第２の点を含むことができる。一部の例において、プロセッサは、第１および第２の点のコーディネイトを識別することに有効であってもよい。コーディネイトは、コーディネイト空間における値の範囲を含むことができる。一部の他の例において、プロセッサは、コーディネイト空間における値の範囲を複数のビンに分割することに効果的であってもよい。それぞれのビンは、値の範囲のサブセットを定義することができる。さまざまな他の例において、プロセッサは、第１の度数を決定することに有効であってもよい。第１の度数は、特定のビン内に位置し得る第１の点の第１の割合に関連してもよい。一部の他の例において、プロセッサは、第２の度数を決定することに有効であってもよい。第２の度数は、前記特定のビン内に位置し得る第２の点の第２の割合に関連してもよい。一部の他の例において、プロセッサは、コーディネイトの重み重要度パラメータを識別することに有効であってもよい。その他の例において、プロセッサは、第１の度数および第２の度数を比較することに有効であってもよい。その他の例において、プロセッサは、第１と第２の度数の比較に少なくとも部分的に基づいて、および重み重要度パラメータに基づいて、トレーニングデータの重みを計算することに有効であってもよい。重みは、トレーニングデータを、ある適合度においてテストデータと適合させるように構成されてもよい。ある適合度は、重み重要度パラメータに基づいてもよい。一部の他の例において、メモリは、重みを格納することに有効であってもよい。

前述の課題を解決するための手段は、例示的なものに過ぎず、限定的であることは全く意図されていない。上記で説明される例示的な態様、実施形態、および特徴に加えて、さらなる態様、実施形態、および特徴は、図面および後段の詳細な説明を参照することにより明らかとなろう。

本開示の前述およびその他の特徴は、付属の図面と併せて以下の説明と添付の特許請求の範囲を読めばさらに十分に明らかとなろう。それらの図面が本開示によるいくつかの実施形態を示すに過ぎず、その範囲を限定するものと見なされるべきではないことを理解すれば、本開示は、付属の図面を使用することでさらに具体的かつ詳細に説明されるであろう。

本明細書において説明される少なくとも一部の実施形態に従って配置される、機械学習において重み生成を実施するために使用され得る例示のシステムを示す図である。本明細書において説明される少なくとも一部の実施形態に従って配置される、重み生成モジュールに関連する追加の詳細と共に図１の例示のシステムを示す図である。本明細書において説明される少なくとも一部の実施形態に従って配置される、機械学習において重み生成を実施するための例示のプロセスを示す流れ図である。本明細書において説明される少なくとも一部の実施形態に従って配置される、機械学習において重み生成を実施するために使用され得る例示のコンピュータプログラム製品を示す図である。本明細書において説明される少なくとも一部の実施形態に従って配置される、機械学習において重み生成のために配置された例示のコンピューティングデバイスを示すブロック図である。

以下の詳細な説明において、本明細書の一部を形成する付属の図面が参照される。図面において、文脈に特に指示がない限り、類似する符号は概して、類似するコンポーネントを識別する。発明を実施するための形態、図面、および特許請求の範囲において説明される例示的な実施形態は、限定的であることを意図されていない。本明細書において提示される主題の精神または範囲を逸脱することなく、その他の実施形態が使用されてもよく、その他の変更が行われてもよい。本明細書において概ね説明され、図面に示される本開示の態様が、多岐にわたるさまざまな構成において配置され、代替され、組み合わされ、分離され、設計されてもよい。

本開示は、とりわけ、機械学習における重みの生成に関連する方法、装置、システム、デバイス、およびコンピュータプログラム製品を概ね対象とする。

簡潔に述べると、機械学習環境において重みを決定することに関連するシステム、デバイス、および方法について概ね説明される。トレーニングデータのトレーニング分布が、識別されてもよい。たとえば、トレーニングデータは、機能を学習するために使用され得る、入力および出力のような、点を含むことができる。テストデータのテスト分布に関する情報が、識別されてもよい。一部の例において、テストデータは、機械学習機能への入力のためのデータであってもよい。トレーニングデータおよびテストデータのコーディネイトが、識別されてもよい。コーディネイトは、たとえば、ユーザによって評価された複数のムービーであってもよい。テスト分布とトレーニング分布の差は、コーディネイトについて決定されてもよい。たとえば、差は、ムービーの評判に関連してもよい。重み重要度パラメータは、コーディネイトについて識別されてもよい。プロセッサは、差に基づいて、および重み重要度パラメータに基づいて重みを計算することができる。重み重要度パラメータは、トレーニング分布がどの程度テスト分布と適合すべきかに関連してもよい。重みは、トレーニング分布を、ある適合度においてテスト分布と適合させるように構成されてもよい。ある適合度は、重み重要度パラメータに基づいてもよい。

図１は、機械学習において重み生成を実施するために使用され得る、本明細書において説明される少なくとも一部の実施形態に従って配置される、例示のシステム１００を示す。示されているように、システム１００は、コンピューティングデバイス１０２を含むことができる。コンピューティングデバイス１０２は、相互に通信するようにすべてが構成された、処理モジュール１０４、メモリ１０６、重み生成モジュール１０８、および機械学習モジュール１１０を含むことができる。処理モジュール１０４は、ハードウェアであってもよく、１つまたは複数の命令を実行するように構成されてもよい。たとえば、処理モジュール１０４は、メモリ１０６に格納されている１つまたは複数の命令を実行するように構成されてもよい。メモリ１０６は、１つまたは複数の機械学習アルゴリズム１１４を格納することにさらに有効であってもよい。機械学習アルゴリズム１１４は、機械学習モジュール１１０によって実行されるとき、関数１１６を生成することに有効な命令および／または命令のセットを含むことができる。

後段においてさらに詳細に説明されるように、機械学習モジュール１１０は、１つまたは複数の機械学習アルゴリズム１１４およびトレーニングデータ１１８を使用して関数１１６を学習または訓練することに効果的であってもよい。関数１１６の例は、クレジットスコアを決定するための関数であってもよい。一部の例において、トレーニングデータ１１８は、１つまたは複数の点１３０を含むことができる。点１３０は、関連付けられている入力１２２ａおよび出力１２４ａのセットを含むことができる。たとえば、収入Ｘと債務Ｙによる入力は、クレジットスコアＺという結果になり得る。一部の例において、トレーニングデータ１１８のトレーニング分布は、処理モジュール１０４によって識別されてもよい。さまざまな他の例において、処理モジュール１０４は、トレーニングデータ１１８の点１３０を識別することに有効であってもよい。トレーニングデータ１１８は、メモリ１０６に格納されてもよい。トレーニングデータ１１８の点１３０は、特定のトレーニング分布に従うことができる。たとえば、トレーニング分布は、第１の時間のインスタンスにおける収入レベルの範囲を指示することができる。一部の例において、トレーニング分布は、確率分布であってもよい。トレーニングデータ１１８は、関数１１６の生成に先立ち得る時間のインスタンスにおいて生成されてもよい。一部の例において、関数１１６は、関数１１６に提供されたテストデータ１２０の入力１２２ｂに基づいて（たとえば、決定、分類、予測、および／または推奨のような）出力１２４ｂを決定することに有効であってもよい。一部の例において、出力１２４ｂは、「ラベル」と称されてもよい。

たとえば、テスト分布は、第２の時間のインスタンスにおける収入レベルの範囲を指示することができる。テストデータ１２０は、特定のテスト分布に従い得る複数の点１３１を含むことができる。一部の例において、テストデータ１２０は、トレーニングデータ１１８が生成される時間のインスタンスよりも後である時間のインスタンスにおいて生成されてもよい。一部の例において、テスト分布は、確率分布であってもよい。テストデータ１２０のテスト分布は、トレーニングデータ１１８のトレーニング分布とは異なっていてもよい。一部の例において、関数１１６へのテストデータ１２０の入力に先立ってテストデータ１２０のテスト分布に関する一部の情報が、知られていてもよい。たとえば、人口調査データのような公的に利用可能な情報は、トレーニングデータとテストデータとの間の収入または評判の変化を識別するためにアクセスされてもよい。例において、処理モジュール１０４は、テストデータ１２０のテスト分布に関する情報を識別するように構成されてもよい。一部の例において、テスト分布に関する情報は、テスト分布の平均および／または標準偏差のような統計を含むことができる。一部の他の例において、テスト分布に関する情報は、テスト分布の投影の推定を含むことができる。たとえば、コーディネイトに沿った点１３１のヒストグラムは、コーディネイトに沿ったテスト分布の投影の推定をもたらすことができる。テストデータ１２０および／またはテストデータ１２０に関する情報は、メモリ１０６に格納されてもよい。重み生成モジュール１０８は、トレーニングデータ１１８の各点１３０について重み１１２を決定および／または計算することに有効であってもよい。重み１１２は、トレーニングデータ１１８の点１３０が、重み１１２の適用後に、ある適合度においてテストデータ１２０の確率分布と類似、一致、および／または適合する確率分布に従うことができるように、トレーニングデータ１１８の点１３０に適用されてもよい。重み重要度パラメータ１４０は、重みが、トレーニングデータ１１８の点１３０を、テストデータ１２０の点と一致および／または適合させるために使用され得る度合いを制御するように調整されてもよい。重み重要度パラメータ１４０は、コンピューティングデバイス１０２のユーザによって、または機械学習モジュール１１０によって調整されてもよい。一部の例において、処理モジュール１０４は、重み重要度パラメータ１４０を識別するように構成されてもよい。

機械学習モジュール１１０は、重み生成モジュール１０８から重み１１２を受信することができる。機械学習アルゴリズム１１４は、重み１１２および／またはトレーニングデータ１１８を使用して、重み付き関数１３２を生成する。重み付き関数１３２は、重み付き関数１３２への入力１２２ｃの適用に基づいて、（たとえば、決定、分類、予測、および／または推奨のような）出力またはラベル１２４ｃを決定および／または生成することに有効であってもよい。一部の例において、たとえ関数１１６および重み付き関数１３２に同じ入力値が適用された場合であっても、重み付き関数１３２によって生成された一部のラベルは、関数１１６によって生成されたラベルと異なっていてもよい。

図２は、機械学習における重み生成に関連する追加の詳細と共に、本明細書において説明される少なくとも一部の実施形態に従って配置される図１の例示のシステム１００を示す。図２は、図１のシステム１００と実質的に類似しており、追加の詳細を伴う。図１のコンポーネントと同様にラベル付けされている図２のコンポーネントは、明確および簡潔を期すために再度説明されることはない。

一部の例において、後段においてさらに詳細に説明されるように、重み生成モジュール１０８は、メモリ１０６から、または別のソースから、トレーニングデータ１１８およびテストデータ１２０を受信することができる。重み生成モジュール１０８は、トレーニングデータ１１８のトレーニング分布を識別することができる。重み生成モジュール１０８は、テストデータ１２０のテスト分布に関する情報を識別することができる。重み生成モジュール１０８は、トレーニング分布およびテスト分布によって共有される１つまたは複数のコーディネイト２１０（たとえば、２１０_１．．．２１０_ｎを含む）を識別および／または選択することができる。コーディネイト２１０は、たとえば、点１３０の１つまたは複数のパラメータまたは次元を含むことができる。コーディネイト２１０の各々は、コーディネイト空間における値の範囲を含むことができる。コーディネイト空間は、たとえば、特定のコーディネイト２１０に対するユークリッドまたはその他の幾何学空間であってもよい。たとえば、機械学習モジュール１１０がクレジットスコアの生成に関連する場合、コーディネイト２１０は収入、債務などに関連し得る。重み生成モジュール１０８は、各コーディネイト空間の値の範囲を１つまたは複数のビンに分割することができる。それぞれのビンは、各コーディネイトの値の範囲のサブセットを定義することができる。たとえば、重み生成モジュール１０８は、各々の識別済みおよび／または選択済みのコーディネイト２１０を（たとえば、「Ｂｉｎ１」、「Ｂｉｎ２」、「Ｂｉｎ３」などのような）１つまたは複数のビンに分割することができる。

後段における詳細な説明をさらに要約すると、重み生成モジュール１０８は、各々の識別済みのコーディネイト２１０に沿った点１３０のそれぞれの値を決定することができる。重み生成モジュール１０８は、それぞれのコーディネイト２１０について、それぞれのビン内に位置する点１３０、１３１の数の度数を決定することができる。度数は、たとえば、特定のコーディネイト２１０について、点１３０の総数と相対的な、特定のビン内に位置する点１３０の割合であってもよい。重み１１２は、各コーディネイトについて、各ビン内に位置する点１３０の度数に基づいて、テストデータ１２０の点に関する情報に基づいて、および重み重要度パラメータ１４０に基づいて、トレーニングデータ１１８の各点１３０に対して計算されてもよい。例において、重み重要度パラメータ１４０は、重み１１２が、トレーニングデータ１１８の点１３０を、テストデータ１２０の点と一致および／または適合させることに有効となり得る度合いを制御するように調整されてもよい。機械学習モジュール１１０は、重み１１２、重み重要度パラメータ１４０、および／またはトレーニングデータ１１８に基づいて、重み付き関数１３２を生成することができる。

トレーニングデータ１１８の入力１２２ａは、１つまたは複数のパラメータを含むベクトルであってもよい。機械学習アルゴリズム１１４がユーザに映画を推薦するために設計される場合の例において、入力１２２ａの一部の例のパラメータは、ユーザの年齢、年収、ユーザによって評価された複数の映画、ユーザの居住する場所などを含むことができる。重み生成モジュール１０８は、パラメータの１つまたは複数をコーディネイト２１０（たとえば、コーディネイト２１０_１、２１０_２、．．．、２１０_ｎを含む）として選択することができる。重み生成モジュール１０８は、コーディネイトごとに、各点１３０を検査することによって点１３０を評価することに有効であってもよい。各コーディネイト２１０は、（「Ｂｉｎ１」、「Ｂｉｎ２」、「Ｂｉｎ３」などのような）多数のビンに分割されてもよい。選択済みのコーディネイト２１０が年収である場合の例において、Ｂｉｎ１は＄０〜＄２５，０００の範囲、Ｂｉｎ２は＄２５，０００〜＄５０，０００の範囲、Ｂｉｎ３は＄５０，００００〜＄７５，０００の範囲などであってもよい。各点１３０は、年収に関連するパラメータを含むことができる。各点１３０の位置は、年収コーディネイト２１０に沿って決定されてもよい。たとえば、第１の点１３０は、＄４２，０００の年収パラメータ値を含むことができる。したがって、第１の点１３０は、Ｂｉｎ２に位置してもよい。各ビン内に位置する点１３０の数は、重み生成モジュール１０８によって決定されてもよく、各ビンの度数を生成するために点１３０の総数によって除算されてもよい。後段においてさらに詳細に説明されるように、重み１１２は、重み重要度パラメータ１４０に基づいて決定および／または計算されてもよい。一部の他の例において、重み１１２の決定および／または計算は、テスト分布について計算された度数と、トレーニング分布について計算された度数との差にさらに基づいてもよい。

重み生成モジュール１０８は、式（１）を使用して重み１１２を生成することができる。

ここで、ω_ｉは、点１３０のうちの特定の点ｉの重み１１２であってもよい。μ_ｃは、（たとえば、「Ｂｉｎ１」、「Ｂｉｎ２」、「Ｂｉｎ３」および／または「Ｂｉｎ４」などのような）特定のビン内の、テストデータ１２０の点１３１の度数と、特定のコーディネイトｃに対する重み重要度パラメータ１４０を伴う係数で乗算された、特定のビン内の、トレーニングデータ１１８の点１３０の重み付き度数との差を定量化することができる。一部の例において、μ_ｃは、（コーディネイト２１０の）各コーディネイトｃについて計算されてもよい。Ｃは、コーディネイト２１０の総数を表すことができる。θ_ｃは、どのビンに、点１３０の、特定の点ｉが収まるかを決定することができる関数である。λ_ｃは、重み重要度パラメータ１４０を表すことができる。λ_ｃは、重み１１２が、トレーニング分布をテスト分布と一致および／または適合させることに有効となり得る度合いを制御するように調整されてもよい。

重み生成モジュール１０８は、式（２）を使用してμ_ｃの値を決定することができる。

ここで、ｎ_ｃは、コーディネイト２１０のうちの、特定のコーディネイトＣの、各ビン内の、トレーニングデータ１１８の点の数を表し得る現行カウント値を保持することができるベクトルであってもよい。Ｎ_Ｒは、トレーニングデータ１１８内の点１３０の数を表すことができる。ν_ｃは、点１３０の総数と相対的な、コーディネイト２１０のうちの特定のコーディネイトＣに対して、（たとえば、「Ｂｉｎ１」、「Ｂｉｎ２」、「Ｂｉｎ３」および／または「Ｂｉｎ４」などのような）特定のビンに出現するテストデータ１２０内の点の度数を表すことができる。λ_ｃは、重み重要度パラメータ１４０を表すことができる。重み生成モジュール１０８は、式（１）でμ_ｃの値を使用して、重み１１２を決定および／または計算することができる。

反復プロセスは、μ_ｃを決定するために重み生成モジュール１０８によって使用されてもよい。一部の例において、すべてのμ_ｃは、ゼロまたは一部の他の値に初期化されてもよい。第１の比較値μ_ｃ（ｔ）は、式（２）を使用して各コーディネイトの各ビンについて識別されてもよい。μ_ｃ（ｔ）の計算値は、式（２）に繰り返し代入されて、さまざまな値を生成することができる。μ_ｃ（ｔ）の値は、μ_ｃ（ｔ）の収束値に到達するまで、繰り返し更新されてもよい。μ_ｃ（ｔ）の収束値は、式（１）に使用され、トレーニングデータ１１８の各点１３０について重み１１２を生成することができる。一部の例において、式（２）を繰り返す間に使用されたμ_ｃ（ｔ）の値は、式（３）により以前の反復に使用された値の差の割合に基づいてもよい。
μ’_ｎｅｗ＝α＊μ_ｎｅｗ＋（１−α）＊μ_ｏｌｄ（３）
ただし、α＝０．１またはα＝０．０１
ここで、μ_ｏｌｄは、μ_ｎｅｗを計算するために式（２）の以前の反復中に使用されたμの値であってもよい。式（３）は、μ_ｎｅｗおよびμ_ｏｌｄを使用してμ’_ｎｅｗを計算することができ、その値は式（２）の後続の反復に使用されてもよい。αは、式（２）を繰り返す間に、μの新しい値（たとえば、μ’_ｎｅｗ）がμの以前の値（たとえば、μ_ｏｌｄ）に依存する度合いを制御するために使用されてもよい。

潜在的な利点の中でも特に、本開示により配置された機械学習における重み生成は、テストおよびトレーニング分布の簡略化マッチングが、機械学習システムの予測能力を高めることができるようにする。重み重要度パラメータは、重みが、トレーニング分布をテスト分布に適合させる上で役立つ度合いに影響を及ぼし得る。加えて、重み重要度パラメータは、分布をマッチングすることの利点と、トレーニング分布とテスト分布をマッチングする際に生じ得るサンプル損失の不利点との間に純プラス利得があるように調整されてもよい。さらに、コーディネイトごとにビンの数を選択することによって、本開示による機械学習における重み生成は、有限サンプルサイズの影響から生じるトレーニングデータセットとテストデータセットとの差を明らかにすることができる。見解、傾向、流行などが変化した結果として経時的に生じ得る変化は、トレーニングデータとテストデータとの間で識別されてもよい。一部の例において、そのような変化を考慮に入れることで、より優れた予測能力を備える機械学習システムをもたらすことができる。推奨システム、または株式市場のような時系列の予測は、説明されているシステムの利益を享受することができる。さまざまな重み重要度パラメータが、さまざまなコーディネイトについて識別されてもよい。たとえば、コーディネイト「給与」の重み重要度パラメータは、分布がコーディネイト「年齢」の重み重要度パラメータよりも適合するように重みを割り当てられてもよい。

図３は、本明細書において説明される少なくとも一部の実施形態に従って配置される、機械学習において重み生成を実施するための例示のプロセスを示す流れ図である。一部の例において、図３のプロセスは、上記で説明されるシステム１００を使用して実施されてもよく、機械学習の重みを生成するために使用されてもよい。例示のプロセスは、ブロックＳ２、Ｓ４、Ｓ６、Ｓ８、Ｓ１０、および／またはＳ１２などの１つまたは複数によって示される１つまたは複数の操作、アクション、または機能を含むことができる。別個のブロックとして示されているが、さまざまなブロックは、特定の実施態様に応じて、追加のブロックに分割されてもよいか、より少ないブロックに結合されてもよいか、または除去されてもよい。ブロックは、その他の操作、アクション、または機能を表す追加のブロックで補足されてもよい。図３のプロセスは、処理モジュール１０４のようなプロセッサによって、または上記で説明される機械学習モジュール１１０のような機械学習モジュールによって使用されてもよい。

処理は、ブロックＳ２「プロセッサにより、トレーニングデータのトレーニング分布を識別する」において開始することができる。ブロックＳ２において、プロセッサは、トレーニングデータのトレーニング分布を識別することができる。

処理は、ブロックＳ２から、ブロックＳ４「プロセッサにより、テストデータのテスト分布に関する情報を識別する」へと続行することができる。ブロックＳ４において、プロセッサは、テストデータのテスト分布に関する情報を識別することができる。例において、トレーニングデータは第１の時間のインスタンスにおいて生成されてもよく、テストデータは第２の時間のインスタンスにおいて生成されてもよい。第２の時間のインスタンスは、第１の時間のインスタンスよりも後であってもよい。

処理は、ブロックＳ４から、ブロックＳ６「プロセッサにより、トレーニングデータとテストデータのコーディネイトを識別する」へと続行することができる。ブロックＳ６において、プロセッサは、トレーニングデータとテストデータのコーディネイトを識別することができる。一部の例において、コーディネイト空間における値の範囲は、複数のビンに分割されてもよい。たとえば、コーディネイト２１０は、図２に示されるように「Ｂｉｎ１」、「Ｂｉｎ２」、「Ｂｉｎ３」などのような、１つまたは複数のビンに分割されてもよい。

処理は、ブロックＳ６から、ブロックＳ８「プロセッサにより、コーディネイトについて、テスト分布とトレーニング分布との差を決定する」へと続行することができる。ブロックＳ８において、テスト分布とトレーニング分布の差は、識別されてもよい。差は、繰り返し決定されてもよく、重みは、トレーニングデータとテストデータとの差の収束値に基づいて計算されてもよい。たとえば、テスト分布とトレーニング分布との差は、上記で説明されるように、式（２）を使用して繰り返し決定されてもよい。

処理は、ブロックＳ８から、ブロックＳ１０「プロセッサにより、コーディネイトについて重み重要度パラメータを識別する」へと続行することができる。ブロックＳ１０において、重み重要度パラメータ１４０のような重み重要度パラメータは、識別されてもよい。

処理は、ブロックＳ１０から、ブロックＳ１２「プロセッサにより、差に基づいて、および重み重要度パラメータに基づいて重みを計算し、重みは、トレーニング分布を適合度においてテスト分布と適合させるように構成されてもよく、適合度は、重み重要度パラメータに基づいてもよい」へと続行することができる。ブロックＳ１２において、重みが計算されてもよい。例において、重みは、上記で説明される式（１）を使用して計算されてもよい。重みは、差に基づいて、および重み重要度パラメータに基づいて計算されてもよい。重みは、トレーニング分布を、ある適合度においてテスト分布と適合させるように構成されてもよい。ある適合度は、重み重要度パラメータに基づいてもよい。一部の例において、重みを計算すること、およびある適合度を決定することは、第２の重み重要度パラメータにさらに基づいてもよい。関数は、トレーニングデータおよび重みに基づいて生成されてもよい。たとえば、重み付き関数は、トレーニングデータおよび重みに基づいて、機械学習モジュールによって生成されてもよい。テストデータは、関数に入力として適用されてもよい。たとえば、テストデータは、重み付き関数に入力として適用されてもよい。関数へのテストデータの適用に応答して、ラベルが生成されてもよい。一部の例において、重み付き関数への入力の適用に応答して、出力またはラベルが生成されてもよい。さまざまな例において、ラベルは、推奨、分類、予測、および／または決定のうちの少なくとも１つを含むことができる。

図４は、本明細書において説明される少なくとも一部の実施形態に従って配置される、機械学習において重み生成を実施するために使用され得る例示のコンピュータプログラム製品４００を示す図である。プログラム製品４００は、信号担持媒体４０２を含むことができる。信号担持媒体４０２は、たとえば、プロセッサによる実行に応答して、図１〜図３に関して上記で説明される機能および特徴を提供することができる１つまたは複数の命令４０４を含むことができる。したがって、たとえば、システム１００を参照すると、処理モジュール１０４および／または機械学習モジュール１１０は、媒体４０２によってシステム１００に搬送される命令４０４に応答して、図４に示されるブロックの１つまたは複数を実行することができる。一部の例において、命令４０４は、メモリ１０６のようなメモリに格納されてもよい。

一部の実施態様において、信号担持媒体４０２は、ハードディスクドライブ、コンパクトディスク（ＣＤ）、デジタルビデオディスク（ＤＶＤ）、デジタルテープ、メモリなどのようなコンピュータ可読媒体４０６を含むことができるが、これらに限定されることはない。一部の実施態様において、信号担持媒体４０２は、メモリ、読取り／書込み（Ｒ／Ｗ）ＣＤ、Ｒ／ＷＤＶＤなどのような記録可能媒体４０８を含むことができるが、これらに限定されることはない。一部の実施態様において、信号担持媒体４０２は、デジタルおよび／またはアナログ通信媒体（たとえば、光ファイバケーブル、導波管、有線通信リンク、無線通信リンクなど）のような通信媒体４１０を含むことができるが、これらに限定されることはない。したがって、たとえば、プログラム製品４００は、ＲＦ信号担持媒体４０２によってシステム１００の１つまたは複数のモジュールに搬送されてもよく、信号担持媒体４０２は、無線通信媒体４１０（たとえば、ＩＥＥＥ８０２．１１規格に準拠する無線通信媒体）によって搬送される。

図５は、機械学習において重み生成を実施するために配置され、本明細書において説明される少なくとも一部の実施形態に従って配置される、例示のコンピューティングデバイス５００を示すブロック図である。極めて基本的な構成５０２において、コンピューティングデバイス５００は一般に、１つまたは複数の（たとえば、処理モジュール１０４のような）プロセッサ５０４、および（たとえば、メモリ１０６のような）システムメモリ５０６を含む。メモリバス５０８は、プロセッサ５０４とシステムメモリ５０６との間で通信するために使用されてもよい。

望ましい構成に応じて、プロセッサ５０４は、マイクロプロセッサ（μＰ）、マイクロコントローラ（μＣ）、デジタルシグナルプロセッサ（ＤＳＰ）、またはそれらの任意の組み合わせを含む任意のタイプであってもよいが、これらに限定されることはない。プロセッサ５０４は、レベル１キャッシュ５１０およびレベル２キャッシュ５１２のような、１つまたは複数のレベルのキャッシング、プロセッサコア５１４、およびレジスタ５１６を含むことができる。例示のプロセッサコア５１４は、演算論理装置（ＡＬＵ：ａｒｉｔｈｍｅｔｉｃｌｏｇｉｃｕｎｉｔ）、浮動小数点演算ユニット（ＦＰＵ：ｆｌｏａｔｉｎｇｐｏｉｎｔｕｎｉｔ）、デジタル信号処理コア（ＤＳＰＣｏｒｅ：ｄｉｇｉｔａｌｓｉｇｎａｌｐｒｏｃｅｓｓｉｎｇｃｏｒｅ）、またはそれらの任意の組み合わせを含むことができる。例示のメモリコントローラ５１８はまた、プロセッサ５０４と共に使用されてもよいか、または一部の実施態様において、メモリコントローラ５１８はプロセッサ５０４の内部部品であってもよい。

望ましい構成に応じて、システムメモリ５０６は、（ＲＡＭのような）揮発性メモリ、（ＲＯＭ、フラッシュメモリなどのような）不揮発性メモリ、またはそれらの任意の組み合わせを含む任意のタイプであってもよいが、これらに限定されることはない。システムメモリ５０６は、オペレーティングシステム５２０、１つまたは複数のアプリケーション５２２、およびプログラムデータ５２４を含むことができる。アプリケーション５２２は、システム１００に関連して図１〜図４について説明されている機能および操作を含む本明細書において説明される機能および操作を実行するように配置される、機械学習における重みの生成アルゴリズム５２６を含むことができる。プログラムデータ５２４は、本明細書において説明される機械学習における重みの生成を実施するために有用となり得る機械学習における重みの生成データ５２８を含むことができる。一部の実施形態において、アプリケーション５２２は、機械学習において重み生成が提供され得るように、プログラムデータ５２４および／またはオペレーティングシステム５２４と連携して動作するように配置されてもよい。この説明される基本構成５０２は、破線内のコンポーネントにより図５に示される。

コンピューティングデバイス５００は、追加の特徴または機能、および追加のインターフェースを有して、基本構成５０２と、任意の必要なデバイスおよびインターフェース間の通信を容易にすることができる。たとえば、バス／インターフェースコントローラ５３０は、ストレージインターフェースバス５２４を介して基本構成５０２と１つまたは複数のデータストレージデバイス５３２との間の通信を容易にするために使用されてもよい。データストレージデバイス５３２は、取外し式ストレージデバイス５３６、非取外し式ストレージデバイス５３８、またはそれらの組み合わせであってもよい。取外し式ストレージデバイスおよび非取外し式ストレージデバイスの例は、ほんの一部をあげると、フレキシブルディスクドライブおよびハードディスクドライブ（ＨＤＤ）のような磁気ディスクデバイス、コンパクトディスク（ＣＤ）ドライブまたはデジタル多用途ディスク（ＤＶＤ）ドライブのような光ディスクドライブ、ソリッドステートドライブ（ＳＳＤ）、およびテープドライブを含む。例示のコンピュータストレージ媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、またはその他のデータのような情報の格納のための任意の方法または技術で実施された揮発性および不揮発性の、取外し式および非取外し式媒体を含むことができる。

システムメモリ５０６、取外し式ストレージデバイス５３６、および非取外し式ストレージデバイス５３８は、コンピュータストレージ媒体の例である。コンピュータストレージ媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリまたはその他のメモリ技術、ＣＤ−ＲＯＭ、デジタル多用途ディスク（ＤＶＤ）またはその他の光ストレージ、磁気カセット、磁気テープ、磁気ディスクストレージまたはその他の磁気ストレージデバイス、もしくは望ましい情報を格納するために使用され得る、コンピューティングデバイス５００によってアクセスされ得る任意の他の媒体を含むが、これらに限定されることはない。任意のそのようなコンピュータストレージ媒体は、コンピューティングデバイス５００の一部であってもよい。

コンピューティングデバイス５００はまた、さまざまなインターフェースデバイス（たとえば、出力デバイス５４２、周辺インターフェース５４４、および通信デバイス５４６）から基本構成５０２へのバス／インターフェースコントローラ５３０を介する通信を容易にするためのインターフェースバス５４０を含むこともできる。例示の出力デバイス５４２は、グラフィックス処理ユニット５４８およびオーディオ処理ユニット５５０を含み、これらは１つまたは複数のＡ／Ｖポート５５２を介してディスプレイまたはスピーカのようなさまざまな外部デバイスと通信するように構成されてもよい。例示の周辺インターフェース５４４は、シリアルインターフェースコントローラ５５４またはパラレルインターフェースコントローラ５５６を含み、これらは１つまたは複数の入出力ポート５５８を介して入力デバイス（たとえば、キーボード、マウス、ペン、音声入力デバイス、タッチ入力デバイスなど）またはその他の周辺デバイス（たとえば、プリンタ、スキャナなど）のような外部デバイスと通信するように構成されてもよい。例示の通信デバイス５４６はネットワークコントローラ５６０を含み、これは１つまたは複数の通信ポート５６４を介するネットワーク通信リンク上の１つまたは複数のその他のコンピューティングデバイス５６４との通信を容易にするために配置されてもよい。

ネットワーク通信リンクは、通信媒体の一例であってもよい。通信媒体は通常、搬送波または他のトランスポート機構のような、変調データ信号のコンピュータ可読命令、データ構造、プログラムモジュール、またはその他のデータによって具現されてもよく、任意の情報配信媒体を含むことができる。「変調データ信号」は、信号の特性セットの１つまたは複数を有する信号、または信号の情報をエンコードするような方法で変更された信号であってもよい。限定的ではなく、一例として、通信媒体は、有線ネットワークまたは直接有線接続のような有線媒体、ならびに音響、無線周波数（ＲＦ）、マイクロ波、赤外線（ＩＲ）および他の無線媒体のような無線媒体を含むことができるが、これらに限定されることはない。本明細書において使用されているコンピュータ可読媒体という用語は、ストレージ媒体および通信媒体の両方を含むことができる。

コンピューティングデバイス５００は、携帯電話、携帯情報端末（ＰＤＡ）のようなスモールフォームファクターのポータブル（またはモバイル）電子デバイス、パーソナルメディアプレイヤーデバイス、無線Ｗｅｂ視聴デバイス、パーソナルハンドセットデバイス、アプリケーション固有デバイス、または上記の機能のいずれかを含む混合デバイスの一部として実施されてもよい。コンピューティングデバイス５００はまた、ラップトップコンピュータおよびラップトップコンピュータ以外の構成を含むパーソナルコンピュータとして実施されてもよい。

本開示は、本出願において説明される特定の実施形態に関して限定されるべきではなく、実施形態はさまざまな態様を例示することを目的としている。その精神および範囲を逸脱することなく多くの変更および変形が行われてもよい。本開示の範囲内の機能的に等価の方法および装置は、本明細書において列挙される方法および装置に加えて、上記の説明から明らかとなるであろう。そのような変更および変形は、添付の特許請求の範囲内に含まれることが意図される。本開示は、添付の特許請求の範囲の条項、ならびにそのような特許請求の範囲が権利を有する等価物の全範囲によってのみ限定されるものとする。本開示が、当然変化し得るものである特定の方法、試薬、化合物組成、または生態系に限定されないことを理解されたい。また、本明細書において使用される用語が、特定の実施形態を説明することのみを目的としており、限定的であることは意図されていないことも理解されたい。

本明細書における実質的にすべての複数形および／または単数形の用語の使用に対して、当業者は、状況および／または用途に適切なように、複数形から単数形に、および／または単数形から複数形に変換することができる。さまざまな単数形／複数形の置き換えは、理解しやすいように、本明細書で明確に説明することができる。

通常、本明細書において、特に添付の特許請求の範囲（たとえば、添付の特許請求の範囲の本体部）において使用される用語は、全体を通じて「オープンな（ｏｐｅｎ）」用語として意図されている（たとえば、用語「含む（ｉｎｃｌｕｄｉｎｇ）」は、「含むがそれに限定されない（ｉｎｃｌｕｄｉｎｇｂｕｔｎｏｔｌｉｍｉｔｅｄｔｏ）」と解釈されるべきであり、用語「有する（ｈａｖｉｎｇ）」は、「少なくとも有する（ｈａｖｉｎｇａｔｌｅａｓｔ）」と解釈されるべきであり、用語「含む（ｉｎｃｌｕｄｅｓ）」は、「含むがそれに限定されない（ｉｎｃｌｕｄｅｓｂｕｔｉｓｎｏｔｌｉｍｉｔｅｄｔｏ）」と解釈されるべきである、など）。導入される請求項で具体的な数の記載が意図される場合、そのような意図は、当該請求項において明示的に記載されることになり、そのような記載がない場合、そのような意図は存在しない。たとえば、理解の一助として、添付の特許請求の範囲は、導入句「少なくとも１つの（ａｔｌｅａｓｔｏｎｅ）」および「１つまたは複数の（ｏｎｅｏｒｍｏｒｅ）」を使用して請求項の記載を導くことを含む場合がある。しかし、そのような句の使用は、同一の請求項が、導入句「１つまたは複数の」または「少なくとも１つの」および「ａ」または「ａｎ」などの不定冠詞を含む場合であっても、不定冠詞「ａ」または「ａｎ」による請求項の記載の導入が、そのように導入される請求項の記載を含む任意の特定の請求項を、単に１つのそのような記載を含む実施形態に限定する、ということを示唆していると解釈されるべきではない（たとえば、「ａ」および／または「ａｎ」は、「少なくとも１つの」または「１つまたは複数の」を意味すると解釈されるべきである）。同じことが、請求項の記載を導入するのに使用される定冠詞の使用にも当てはまる。また、導入される請求項の記載で具体的な数が明示的に記載されている場合でも、そのような記載は、少なくとも記載された数を意味すると解釈されるべきであることが、当業者には理解されよう（たとえば、他の修飾語なしでの「２つの記載（ｔｗｏｒｅｃｉｔａｔｉｏｎｓ）」の単なる記載は、少なくとも２つの記載、または２つ以上の記載を意味する）。さらに、「Ａ、ＢおよびＣ、などの少なくとも１つ」に類似の慣例表現が使用されている事例では、通常、そのような構文は、当業者がその慣例表現を理解するであろう意味で意図されている（たとえば、「Ａ、Ｂ、およびＣの少なくとも１つを有するシステム」は、Ａのみ、Ｂのみ、Ｃのみ、ＡおよびＢを共に、ＡおよびＣを共に、ＢおよびＣを共に、ならびに／またはＡ、Ｂ、およびＣを共に、などを有するシステムを含むが、それに限定されない）。「Ａ、Ｂ、またはＣ、などの少なくとも１つ」に類似の慣例表現が使用されている事例では、通常、そのような構文は、当業者がその慣例表現を理解するであろう意味で意図されている（たとえば、「Ａ、Ｂ、またはＣの少なくとも１つを有するシステム」は、Ａのみ、Ｂのみ、Ｃのみ、ＡおよびＢを共に、ＡおよびＣを共に、ＢおよびＣを共に、ならびに／またはＡ、Ｂ、およびＣを共に、などを有するシステムを含むが、それに限定されない）。２つ以上の代替用語を提示する事実上いかなる離接する語および／または句も、明細書、特許請求の範囲、または図面のどこにあっても、当該用語の一方（ｏｎｅｏｆｔｈｅｔｅｒｍｓ）、当該用語のいずれか（ｅｉｔｈｅｒｏｆｔｈｅｔｅｒｍｓ）、または両方の用語（ｂｏｔｈｔｅｒｍｓ）を含む可能性を企図すると理解されるべきであることが、当業者にはさらに理解されよう。たとえば、句「ＡまたはＢ」は、「Ａ」または「Ｂ」あるいは「ＡおよびＢ」の可能性を含むことが理解されよう。

書面による説明を行うことに関してなど、任意およびすべての目的のため、本明細書において開示されるあらゆる範囲はまた、任意およびすべての可能な下位範囲およびその下位範囲の組み合わせを網羅する。任意の一覧される範囲は、同範囲が少なくとも等価の２分の１、３分の１、４分の１、５分の１、１０分の１などに分割されることを十分に説明および可能にするものと容易に理解されてもよい。非限定的な例として、本明細書において説明される各範囲は、下３分の１、中３分の１、および上３分の１などに容易に分解されてもよい。さらに当業者によって理解されるであろうように、「最大（ｕｐｔｏ）」、「少なくとも（ａｔｌｅａｓｔ）」、「よりも大きい（ｇｒｅａｔｅｒｔｈａｎ）」、「よりも小さい（ｌｅｓｓｔｈａｎ）」などのようなすべての表現は、列挙される数を含み、上記で説明されている下位範囲に引き続き分解されてもよい範囲を示す。最終的に、範囲は、各々個別の構成要素を含む。したがって、たとえば、１〜３のセルを有するグループは、１、２、または３のセルを有するグループを示す。同様に、１〜５のセルを有するグループは、１、２、３、４、または５のセルを有するグループを示し、以下同様である。
本明細書においてさまざまな態様および実施形態が開示されたが、その他の態様および実施形態が可能である。本明細書において開示されるさまざまな態様および実施形態は、説明のためのものであって、限定的であることを意図しておらず、真の範囲および精神は後段の特許請求の範囲により示される。

Claims

機械学習環境において重みを決定するための方法であって、
プロセッサにより、トレーニングデータのトレーニング分布を識別することと、
前記プロセッサにより、テストデータのテスト分布に関する情報を識別することと、
前記プロセッサにより、前記トレーニングデータと前記テストデータのコーディネイトを識別することと、
前記プロセッサにより、前記コーディネイトについて、前記テスト分布と前記トレーニング分布との差を決定することと、
前記プロセッサにより、前記コーディネイトの重み重要度パラメータを識別することと、
前記プロセッサにより、前記差に基づいて、および前記重み重要度パラメータに基づいて重みを計算することと、を備える方法であって、
前記重みは、前記トレーニング分布を前記テスト分布に適合させるように構成され、前記重み重要度パラメータは、前記トレーニング分布を前記テスト分布に適合させる度合いを制御するためのパラメータである、
方法。
前記コーディネイトは第１のコーディネイトを含み、前記重み重要度パラメータは第１の重み重要度パラメータを含み、
前記プロセッサにより、前記トレーニングデータと前記テストデータの第２のコーディネイトを識別することと、
前記プロセッサにより、前記第２のコーディネイトについて、前記テスト分布と前記トレーニング分布との差を決定することと、
前記プロセッサにより、前記第２のコーディネイトの第２の重み重要度パラメータを識別することであって、前記第２の重み重要度パラメータは、前記第１の重み重要度パラメータとは異なることとをさらに備え、
前記重みを計算することは、前記第２の重み重要度パラメータにさらに基づく、請求項１に記載の方法。
前記トレーニングデータおよび前記重みに基づいて関数を生成することと、
前記テストデータを前記関数に入力として適用することと、
前記関数への前記テストデータの前記適用に応答して、ラベルを生成することとをさらに備える、請求項１に記載の方法。
前記ラベルは、推奨、分類、予測、および決定のうちの少なくとも１つを含む、請求項３に記載の方法。
前記トレーニングデータは、第１の時間のインスタンスにおいて生成され、
前記テストデータは、第２の時間のインスタンスにおいて生成され、前記第２の時間のインスタンスは、前記第１の時間のインスタンスよりも後である、請求項１に記載の方法。
前記重みを計算することは、
前記トレーニングデータと前記テストデータとの差を繰り返し決定することであって、前記重みは、前記トレーニングデータと前記テストデータとの前記差の収束値に基づいて計算されることを備える、請求項１に記載の方法。
前記トレーニングデータは複数の点を含み、前記コーディネイトはコーディネイト空間内の値の範囲を含み、
前記方法は、前記コーディネイト空間内の値の前記範囲を複数のビンに分割することをさらに備え、
前記重みを計算することは、前記トレーニングデータ内の点の数および前記複数のビンの数にさらに基づく、請求項１に記載の方法。
前記テストデータおよび前記トレーニングデータは、それぞれ第１および第２の点を含み、前記コーディネイトはコーディネイト空間内の値の範囲を含み、
前記方法は、前記コーディネイト空間内の値の前記範囲を複数のビンに分割することをさらに備え、
前記重みを計算することは、前記複数のビン内に位置する前記第１および第２の点の数にさらに基づく、請求項１に記載の方法。
機械学習環境において重みを決定するための方法であって、
プロセッサにより、トレーニングデータのトレーニング分布を識別することと、
前記プロセッサにより、テストデータのテスト分布に関する情報を識別することと、
前記プロセッサにより、前記トレーニングデータと前記テストデータのコーディネイトを識別することと、
前記プロセッサにより、前記コーディネイトについて、前記テスト分布と前記トレーニング分布との差を決定することと、
前記プロセッサにより、前記コーディネイトの第１の重み重要度パラメータを識別することと、
前記プロセッサにより、前記差に基づいて、および前記第１の重み重要度パラメータに基づいて第１の重みを計算することであって、前記第１の重みは、前記トレーニング分布を前記テスト分布と適合させるように構成され、前記第１の重み重要度パラメータは、前記トレーニング分布を前記テスト分布に適合させる度合いを制御するためのパラメータである、第１の重みを計算することと、
前記プロセッサにより、前記コーディネイトの第２の重み重要度パラメータを識別することと、
前記プロセッサにより、前記差に基づいて、および前記第２の重み重要度パラメータに基づいて第２の重みを計算することであって、前記第２の重みは、前記トレーニング分布を前記テスト分布と適合させるように構成され、前記第２の重み重要度パラメータは、前記トレーニング分布を前記テスト分布に適合させる度合いを制御するためのパラメータであり、前記第２の重み重要度パラメータは、前記第１の重み重要度パラメータとは異なる値を有する、第２の重みを計算することとを備える方法。
前記コーディネイトは第１のコーディネイトを含み、
前記方法は、前記トレーニングデータと前記テストデータの第２のコーディネイトを識別することと、
前記プロセッサにより、前記第２のコーディネイトの第３の重み重要度パラメータを識別することであって、前記第３の重み重要度パラメータは、前記第１および第２の重み重要度パラメータとは異なることとをさらに備え、
前記トレーニングデータの前記第１の重みおよび前記第２の重みを計算することは、前記第３の重み重要度パラメータに、少なくとも部分的に、さらに基づく、請求項９に記載の方法。
前記トレーニングデータおよび前記重みに基づいて関数を生成することと、
前記テストデータを前記関数に入力として適用することと、
前記関数への前記テストデータの前記適用に応答して、ラベルを生成することとをさらに備える、請求項９に記載の方法。
前記ラベルは、推奨、分類、予測、および決定のうちの少なくとも１つを含む、請求項１１に記載の方法。
前記トレーニングデータは、第１の時間のインスタンスにおいて生成され、
前記テストデータは、第２の時間のインスタンスにおいて生成され、前記第２の時間のインスタンスは、前記第１の時間のインスタンスよりも後である、請求項９に記載の方法。
前記重みを計算することは、
前記トレーニングデータと前記テストデータとの差を繰り返し決定することであって、前記重みは、前記トレーニングデータと前記テストデータとの前記差の収束値に基づいて計算されることを備える、請求項９に記載の方法。
前記トレーニングデータは複数の点を含み、前記コーディネイトはコーディネイト空間内の値の範囲を含み、
前記方法は、前記コーディネイト空間内の値の前記範囲を複数のビンに分割することをさらに備え、
前記重みを計算することは、前記トレーニングデータ内の点の数および前記複数のビンの数にさらに基づく、請求項９に記載の方法。
プロセッサと、
前記プロセッサと通信するように構成されたメモリであって、
第１の点を備えるトレーニングデータと、
第２の点を備えるテストデータとを含むメモリとを備え、
前記プロセッサは、
前記第１および第２の点のコーディネイトを識別することであって、前記コーディネイトはコーディネイト空間内の値の範囲を含むことと、
前記コーディネイト空間内の値の前記範囲を複数のビンに分割することであって、それぞれのビンは値の前記範囲のサブセットを定義することと、
第１の度数を決定することであって、前記第１の度数は、特定のビン内に位置する前記第１の点の第１の割合に関連することと、
第２の度数を決定することであって、前記第２の度数は、前記特定のビン内に位置する前記第２の点の第２の割合に関連することと、
前記コーディネイトの重み重要度パラメータを識別することと、
前記第１の度数および前記第２の度数を比較することと、
前記第１および第２の度数の前記比較に少なくとも部分的に基づいて、および前記重み重要度パラメータに基づいて前記トレーニングデータの重みを計算することと、を行うのに有効であり、
前記重みは、前記トレーニングデータを前記テストデータと適合させるように構成され、前記重み重要度パラメータは、前記トレーニングデータを前記テストデータに適合させる度合いを制御するためのパラメータであり、
前記メモリは、前記重みを格納するのに有効である、機械学習システム。
前記第１の点はトレーニング分布に従い、
前記第２の点はテスト分布に従い、
前記重みは、前記トレーニング分布内の特定の点を前記テスト分布内の特定の点と適合させるのに有効である、請求項１６に記載の機械学習システム。
前記度数を比較するために、前記プロセッサは、
第１の比較値を識別することと、
差の値を生成するために、それぞれのビンおよびコーディネイト内の前記テストデータおよび前記トレーニングデータの度数値を比較することと、
前記差の値に基づいて、第２の比較値を生成するように前記第１の比較値を更新することと、
前記第２の比較値が収束するまで、前記第１の比較値の前記識別と、前記差の値を生成するためのそれぞれのビンおよびコーディネイト内の前記テストデータおよび前記トレーニングデータの度数値の前記比較と、前記差の値に基づいて前記第２の比較値を生成するための前記第１の比較値の前記更新とを反復的に繰り返すことと、
前記第２の比較値の収束値を前記メモリに格納することとを行うのにさらに有効である、請求項１６に記載の機械学習システム。
機械学習モジュールをさらに備え、前記プロセッサは、
前記重みおよび前記トレーニングデータを前記機械学習モジュールに送信することを行うのにさらに有効であり、
それに応答して、前記機械学習モジュールは、
前記重みおよび前記トレーニングデータを前記プロセッサから受信することと、
前記重みおよび前記トレーニングデータに少なくとも部分的に基づいて関数を生成することと、
前記関数を前記メモリに格納することとを行うのに有効である、請求項１６に記載の機械学習システム。
前記プロセッサは、前記複数のビン内に位置する前記第１および第２の点の数に基づいて前記重みを計算することを行うのに有効である、請求項１６に記載の機械学習システム。