JP7222239B2

JP7222239B2 - アプリケーションプログラム生成のための深層ニューラルネットワーク訓練

Info

Publication number: JP7222239B2
Application number: JP2018238048A
Authority: JP
Inventors: モンタントス・ジェームス
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2018-04-25
Filing date: 2018-12-20
Publication date: 2023-02-15
Anticipated expiration: 2038-12-20
Also published as: EP3561645A1; US11537871B2; JP2019192207A; US20190332931A1

Description

本明細書で説明される実施形態は、アプリケーションプログラム生成のための深層ニューラルネットワーク訓練に関係がある。

人間－機械間のインタラクション、機械学習、及び深層学習は、タスクのデジタル化及び自動化のためにますます重要になりつつある。その上、ロボティクスの使用の増加、並列コンピューティング、及び強力なエッジコンピューティング機能の増設は、複雑な、微妙なタスクのための機械学習の実装に関連した技術的課題を生み出してきた。例えば、深層ニューラルネットワーク訓練は、それらの微妙なタスクにとって適切であり得るが、一般に、高度な計算リソースを必要とする。更に、深層ニューラルネットワーク訓練に関与する計算リソースの量は、センサ入力の複雑さが増すにつれて増大する。

本明細書で請求される主題は、記載されている環境においてしか動作しない実施形態、又は記載されている如何なる欠点も解消する実施形態に制限されない。むしろ、この背景は、本明細書で記載されるいくつかの実施形態が実施され得る技術分野の一例を説明するためにのみ提供されている。

実施形態に従って、コンピュータシステムアーキテクチャは、深層ニューラルネットワーク訓練のために構成されてよい。コンピュータシステムアーキテクチャは、プロセッサ、メモリ、及び微分メモリサブシステムを有してよい。メモリは、学習エンジンが記憶され得るランダムアクセスメモリ（ＲＡＭ）を含む。学習エンジンは、データをエキスパートユーザに提示し、データがエキスパートユーザに提示される場合に、該提示されたデータに関連したエキスパートユーザの反応及びフィードバックを測定する１つ以上のセンサを介してユーザ感覚入力を受け、該ユーザ感覚入力に基づきアテンションマップを生成するよう構成されてよい。アテンションマップは、エキスパートユーザが焦点を合わせた前記提示されたデータの部分を示してよく、１つ以上のデータ分類領域を含んでよい。学習エンジンは、エキスパートユーザの自然言語入力に基づく自然言語入力ラベルによりアテンションマップに注釈を付し、ニューラルネットワークをユーザ感覚入力に基づき訓練するよう構成されてよい。学習エンジンは、エンドユーザアプリケーションの特異なアクティビティのために最適化される前記訓練されたニューラルネットワークに基づくモデルを生成し、エンドユーザアプリケーションの出力目標のためのアプリケーションプログラムを供給し、出力目標に、アプリケーションプログラムを介して、特異なアクティビティを検出し是正するよう指示するよう構成されてよい。微分メモリサブシステムは、メモリ及びプロセッサから物理的に離れておりネットワーク接続されてよい。微分メモリサブシステムは、実験データ処理機能のために学習エンジンからニューラルネットワーク情報及び処理されたユーザ感覚入力を受けるよう構成されてよい。

実施形態の目的及び利点は、少なくとも、特許請求の範囲で特に指し示されている要素、特徴、及び組み合わせによって、実現及び達成されるだろう。前述の概要及び以下の詳細な説明は、実例及び説明であって、請求されている発明を制限するものではない点が理解されるべきである。

例となる実施形態は、添付の図面の使用を通じて、更なる特定及び詳細を伴って記載及び説明されることになる。

アプリケーションプログラム生成のための深層ニューラルネットワーク訓練が実装され得る環境の例を表す。図１の環境において実装され得るユーザ感覚入力取得プロセスの例を表す。図１の環境において実装され得るアプリケーションプログラム生成プロセスの例を表す。図１の環境において実装され得るトレーナーサーバのコンピュータアーキテクチャの例を表す。図１の環境において実装され得るトレーナーサーバのコンピュータアーキテクチャの例を表す。図１の環境において実装され得る表示デバイスの実施形態の例を表す。第１データ源の選択の後の図５の表示デバイスを表す。図１の環境において実装され得る、受け取られた入力からの注釈付きアテンションマップの生成のプロセスの例を表す。選択された第１出力目標のためのアプリケーションプログラムを生成するプロセスを表す。アプリケーションプログラム生成のための深層ニューラルネットワーク訓練の実装のために構成され得るコンピューティングシステムの例のブロック図である。アプリケーションプログラム生成のための深層ニューラルネットワーク訓練の方法の例のフローチャートである。アプリケーションプログラム生成のための深層ニューラルネットワーク訓練の方法の例のフローチャートである。

全ては、本開示で記載される少なくとも１つの実施形態に従う。

従来のニューラルネットワークシステムにおいて、入力が取得されてよく、それは、ニューラルネットワークを訓練するために使用される。通常、入力は、様々な状況からの入力及び出力を示す特定のデータセットに制限される。ニューラルネットワークを訓練することは、計算費用がかかり得る。計算リソースの使用は、ニューラルネットワークへの入力の量及び／又は複雑さが増すにつれて増大し得る。深層学習は、一般に、より高度な計算リソースを必要とする。

本開示で説明される実施形態は、アプリケーションプログラム生成のための深層ニューラルネットワーク訓練に関係がある。いくつかの実施形態において、ニューラルネットワークは、エキスパートユーザの入力に基づき訓練されてよい。特に、そのような実施形態では、データがエキスパートユーザに提示される場合に彼らの微妙な自然な反応を捕捉するために、視線（gaze）センサなどのようなセンサが実装されてよい。その上、他のセンサが、自然言語コメント又は自然テキスト入力を捕捉するために実装されてよい。自然言語コメント又は自然テキスト入力は、センサがエキスパートユーザの自然な反応を測定することによって得られる情報に関連し得る。データに対するエキスパートユーザの自然な反応を表すデータの使用は、従来システムの改良である。特に、データの使用は、実環境における特異なアクティビティのより深い精緻化と、その特異なアクティビティに対する改善措置とを提供することができる。そのような特異なアクティビティ及び改善措置は、入力及び出力を含むデータセットに基づく訓練を通してさもなければ見逃される可能性がある。

訓練されたニューラルネットワークは、アプリケーションプログラムを生成するために使用されてよい。アプリケーションプログラムは、特定の出力目標のために生成されてよい。アプリケーションプログラムは、出力目標に、特異なアクティビティを特定し、エキスパートユーザの自然な反応に一致した改善措置をとるよう指示してよい。

いくつかの実施形態において、ニューラルネットワークの訓練は、微分メモリサブシステムによって少なくとも部分的に実行されてよい。微分メモリサブシステムは、ニューラルネットワーク訓練において使用される一次メモリの他の部分から分離してよい。微分メモリサブシステムは、訓練の実験的部分を実行してよく、これは、一次メモリの計算費用を削減し得る。微分メモリサブシステムの使用は、アプリケーションプログラムの生成及び訓練を実行するサーバの動作を改善し得る。例えば、微分メモリサブシステムは、一次メモリによって従来実行され得る処理又は計算オーバーヘッドの部分を割り当てられてよい。然るに、微分メモリサブシステムの使用は、アプリケーションプログラムが生成される速度を改善することができ、そして、一次メモリを備えるシステムの動作を改善することができる（例えば、速度の改善、正確さの改善、処理リソース割り当ての改善、など）。

それら及び他の実施形態は、添付の図面を参照して記載される。図面において、同じ参照符号は、別なふうに述べられない限りは、同じ機能及び構造を示す。

図１は、アプリケーションプログラム生成のための深層ニューラルネットワーク訓練が実装され得る、例となる環境１００を表す。ニューラルネットワーク訓練及びアプリケーションプログラム生成は、トレーナーサーバ１１８の学習エンジン１１６によって実行されてよい。学習エンジン１１６は、データが表示デバイス１０４で表示される場合にエキスパートユーザ１２０からユーザ感覚入力を受けるよう構成されてよい。例えば、ユーザセンサ１２２及び１２４並びに／又は環境センサ１０６（集合的に、センサ１０６／１２２／１２４）は、データが表示デバイス１０４で表示される場合にエキスパートユーザ１２０の反応及び／又は活動を測定するよう構成されてよい。ユーザ感覚入力に基づき、モデルは、提示されたデータを表す実環境１１０における出力目標１０８の動作のために生成又は変更されてよい。

モデルから、学習エンジン１１６は、アプリケーションプログラムを生成してよい。アプリケーションプログラムは、実環境１１０における出力目標１０８の動作を制御してよい。例えば、アプリケーションプログラムは、出力目標１０８が実環境１１０において特異なアクティビティを特定し及び／又はそれに対処することを可能にする出力目標１０８の動作を制御するよう構成されてよい。

環境１００におけるモデル及びアプリケーションプログラム生成は、従来のモデル訓練及び従来のアプリケーションプログラム生成を改善し得る。例えば、環境１００において、ユーザ感覚入力は、データが表示デバイス１０４で表示される場合にエキスパートユーザ１２０から取得されてよい。ユーザ感覚入力は、データの提示中にエキスパートユーザ１２０が焦点を合わせているもの、及び／又はエキスパートユーザ１２０によってされたコメントに関係があってよい。学習エンジン１１６は、エキスパートユーザ１２０がどこに焦点を合わせているかに基づきアテンションマップを生成し、次いで、エキスパートユーザ１２０のコメントによりアテンションマップに注釈を付してよい。アテンションマップ及び／又は注釈は、ユーザ感覚入力を分類するために使用されてよく、これは、ニューラルネットワークを訓練することにおいて使用されてよい。例えば、学習エンジン１１６によって実行される入力の分類は、その全文を参照により本願に援用される米国特許第９３２４０２２号又は第９６９７４４４号において実行された分類処理に類似し得る。その上、注釈付きアテンションマップは、ニューラルネットワークを訓練するために入力として使用されてよい。

エキスパートユーザ１２０は、実環境１１０において特に熟練している個人及び／又は出力目標１０８を使用している個人を含んでよい。エキスパートユーザ１２０は、実環境１１０に基づき変わり得る。例えば、環境１００は、セキュリティ／対テロリズム環境を含んでよい。エキスパートユーザ１２０は、配信動画（video feed）を監視するセキュリティ専門家を含んでよい。

更に、表されている実施形態において、学習エンジン１１６は、微分メモリサブシステム（differential memory subsystem）（ＤＭＳ）１１４とともに実装されてよい。ＤＭＳ１１４は、トレーナーサーバ１１８において学習エンジン１１６から分離してよい。学習エンジン１１６は、ＤＭＳ１１４とインターフェイス接続してよく、そして、実験データ処理機能のためにＤＭＳ１１４を使用してよい。例えば、学習エンジン１１６は、ニューラルネットワーク情報及び処理されたユーザ感覚入力をＤＭＳ１１４へ送ってよい。ＤＭＳ１１４はまた、ユーザ感覚入力及びニューラルネットワーク情報に独立してアクセスするよう構成されてよい。

ＤＭＳ１１４は、受け取られたニューラルネットワーク情報及び処理されたユーザ感覚入力に基づき、１つ以上の実験データ処理機能を適用してよい。ＤＭＳ１１４は、本質的に、トレーナーサーバ１１８において別個のコンピュータとして動作し得る。ＤＭＳ１１４は、ニューラルネットワーク訓練に関わる処理を実行するのに適した代替の計算構造としてユーザ感覚入力を処理してよい。ＤＭＳ１１４のいくつかの更なる詳細は、その全文を参照により本願に援用されるGraves et al.，HYBRID COMPUTING USING A NEURAL NETWORK WITH DYNAMIC EXTERNAL MEMORY，Nature 538，471-476（２０１６年１０月２７日）において見つけられ得る。

ＤＭＳ１１４の使用は、アプリケーションプログラムの生成及びトレーナーサーバ１１８の動作を改善し得る。例えば、ＤＭＳ１１４は、学習エンジン１１６によって従来実行され得る処理又は計算オーバーヘッドの一部を割り当てられてよい。然るに、ＤＭＳ１１４の使用は、アプリケーションプログラムが生成される速度を改善することができるとともに、アプリケーションプログラム生成中のトレーナーサーバ１１８の動作を改善することができる（例えば、速度の改善、正確さの改善、処理リソース割り当ての改善、など）。環境１００はＤＭＳ１１４を含むが、いくつかの実施形態はＤＭＳ１１４を省略する。そのような実施形態では、学習エンジン１１６は、実質的に本実施形態における他の場所に設けられるように動作し得る。

環境１００は、トレーナーサーバ１１８、出力目標１０８、環境センサ１０６、データストレージデバイス１１２、ユーザセンサ１２２及び１２４、並びに表示デバイス１０４のような１つ以上の構成要素を含んでよい。構成要素は、データ及び情報をネットワーク１２８を介してやり取りするよう構成されてよい。ユーザセンサ１２２及び１２４は、エキスパート入力環境１０２内でエキスパートユーザ１２０に実装されてよい。出力目標１０８は、実環境１１０内で実装されてよい。環境１００における構成要素（例えば、１１８、１０８、１０６、１１２、１２２、１２４、１０４、など）の夫々については、以降の段落で記載される。

ネットワーク１２８は、環境１００の構成要素間の信号、データ、及び情報の通信のために構成された如何なるネットワークも含んでよい。例えば、ネットワーク１２８は、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）（例えば、インターネット）、及び／又は他の相互接続されたデータパスを含んでよく、それらにわたって複数のデバイスが通信し得る。いくつかの実施形態において、ネットワーク１２８は、ピア・ツー・ピアネットワークを含んでよい。ネットワーク１２８はまた、多種多様な通信プロトコルにおけるデータの通信を可能にし得る電気通信網の部分へ結合されるか、又はそれらの部分を含んでよい。いくつかの実施形態において、ネットワーク１２８は、Ｂｌｕｅｔｏｏｔｈ（登録商標）通信網、Ｗｉ－Ｆｉ通信網、ＺｉｇＢｅｅ通信網、拡張可能メッセージング及びプレゼンスプロトコル（extensible messaging and presence protocol）（ＸＭＰＰ）通信網、セルラー通信網、あらゆる同様の通信網、又はデータの送受信のためのそれらのあらゆる組み合わせを含むか、又はそれらを含むよう構成される。ネットワーク１２８において通信されるデータは、ショートメッセージングサービス（short messaging service）（ＳＭＳ）、マルチメディアメッセージングサービス（multimedia messaging service）（ＭＭＳ）、ハイパーテキスト転送プロトコル（hypertext transfer protocol）（ＨＴＴＰ）、直接データ接続、ワイヤレスアプリケーションプロトコル（wireless application protocol）（ＷＡＰ）、電子メール、又は環境１００において実装され得るあらゆる他のプロトコルを介して通信されるデータを含んでよい。いくつかの実施形態において、ネットワーク１２８は、環境１００の構成要素のうちの２つ以上の間の単純な有線接続を含んでよい。例えば、表示デバイス１０４は、環境センサ１０６へ有線接続されてよい。

エキスパート入力環境１０２において、エキスパートユーザ１２０は、表示デバイス１０４に対して位置付けられてよい。エキスパートユーザ１２０は、権限を付与されたユーザであってよい。例えば、エキスパートユーザ１２０は、エキスパートユーザ１２０を認証するために使用され得るログイン情報、セッショントークン、バイオメトリックサンプル、などを供給してよい。いくつかの実施形態において、エキスパートユーザ１２０によって供給された情報は、ブロックチェーンスタイルの台帳（blockchain-style ledger）のような台帳に格納されてよい。

エキスパートユーザ１２０は、ユーザセンサ１２２及び１２４を取り付けられてよい。その上、又は代替的に、環境センサ１０６は、エキスパートユーザ１２０の応答若しくは反応を示す環境条件及び／又はエキスパートユーザ１２０の観測及び測定を可能にするよう位置付けられてよい。データは、表示デバイス１０４においてエキスパートユーザ１２０に提示されてよい。例えば、データは、特定のカメラから捕捉された画像データ、カメラから捕捉されたビデオ情報、圃場のレイアウト、学習ユーザインターフェイス、工場フロアレイアウト、（セキュリティ若しくは他の目的のための）被監視エリアからの映像、臨床試験若しくは認識評価のためのビデオゲーム若しくは画像、医療スキャン（例えば、ＭＲＩ、Ｘ線、など）、設備移動ビデオ画像、他のデータ、又はそれらの組み合わせを含んでよい。表示デバイス１０４へ送られるデータは、実環境１１０に関係がある。例えば、表示デバイス１０４で提示され得るデータは、実環境１１０で取得された実データ又はその派生物であってよい。

エキスパートユーザ１２０に提示されるデータは、実環境１１０におけるシナリオを提供してよい。そのようなシナリオに対するエキスパートユーザ１２０の反応及び応答は、データが提示される場合にセンサ１０６／１２２／１２４によってモニタされてよい。センサ１０６／１２２／１２４は、ユーザ感覚入力を生成してよく、それは、ネットワーク１２８を介してトレーナーサーバ１１８へ送られ及び／又はデータストレージデバイス１１２へ送られてよい。

センサ１０６／１２２／１２４は、可能な限り自然であるユーザ感覚入力を取得するよう選択されてよい。例えば、センサ１０６／１２２／１２４は、自然言語入力、タッチ入力、視線入力、及び他の感覚入力（例えば、表示デバイス１０４でのデータの提示中に脳活動を測定するＥＥＧ）を取得するよう構成されてよい。ユーザ感覚入力は、エキスパートユーザ１２０の直感又は特定の知的プロファイルを表し得る。

トレーナーサーバ１１８は、アプリケーションプログラム生成及び深層ニューラルネットワーク訓練のために構成されるコンピュータベースの又はハードウェアベースのコンピューティングシステムを含んでよい。トレーナーサーバ１１８は、ネットワーク１２８を介して環境１００の構成要素のうちの１つ以上と通信するよう構成されてよい。トレーナーサーバ１１８は、学習エンジン１１６を含んでよい。

学習エンジン１１６及び本開示の全体を通して記載されるその１つ以上の構成要素又はモジュールは、プロセッサ、マイクロプロセッサ（１つ以上の動作を実行するか若しくはその実行を制御する。）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、又は特定用途向け集積回路（ＡＳＩＣ）を含むハードウェアを用いて実装されてよい。いくつかの他の事例では、学習エンジン１１６又はそのモジュールは、ハードウェアとソフトウェアとの組み合わせを用いて実装されてよい。ソフトウェアにおける実装は、コンピューティングシステム（例えば、トレーナーサーバ１１８）のハードウェアにおいて含まれ得るような１つ以上のトランジスタ又はトランジスタ素子の急速な活性化及び非活性化を含んでよい。その上、ソフトウェアで定義される命令は、トランジスタ素子内の情報に作用してよい。ソフトウェア命令の実装は、少なくとも一時的に電子経路を再構成し、コンピューティングハードウェアを変形し得る。

学習エンジン１１６は、データをエキスパートユーザ１２０に提示するよう構成されてよい。例えば、学習エンジン１１６は、ネットワーク１２８を介して表示デバイス１０４へデータを送ってよい。データがエキスパートユーザ１２０に提示されると、学習エンジン１１６はユーザ感覚入力を受け取ってよい。例えば、センサ１０６／１２２／１２４は、提示されたデータに関連したエキスパートユーザ１２０の測定されたフィードバック及び反応に基づきユーザ感覚入力を捕捉するよう構成されてよい。

学習エンジン１１６は、アテンションマップを生成するよう構成されてよい。アテンションマップは、ユーザ感覚入力に基づいてよく、エキスパートユーザ１２０が焦点を合わせた提示されたデータの部分を示すよう構成されてよい。

いくつかの実施形態において、学習エンジン１１６は、アテンショントランスファー（attention transfer）処理を実行してよい。アテンショントランスファー処理は、勾配に基づく（gradient-based）アテンショントランスファー又は活性化に基づく（activation-based）アテンショントランスファーを含んでよい。いくつかの実施形態において、学習エンジン１１６は、その全文を参照により本願に援用されるZagoruyko & Komodakis，Paying More Attention to Attention: Improvement the Performance of Convolutional Neural Networks via Attention Transfer，ICLR 2017でconference paperとして公開，２０１７年２月１２日（https://arxiv.org/pdf/1612.03928.pdfから入手可能。）で記載されているアテンショントランスファー処理を実行してよい。

その上、アテンションマップは、１つ以上のデータ分類領域を含んでよい。学習エンジン１１６は、エキスパートユーザ１２０の自然言語入力に基づく自然言語入力ラベルによりアテンションマップに注釈を付してよい。学習エンジン１１６は、ユーザ感覚入力及び注釈付きアテンションマップに基づきニューラルネットワークを訓練してよい。例えば、注釈付きアテンションマップは、ニューラルネットワークへの入力として含まれてよい。学習エンジン１１６は、訓練されたニューラルネットワークに基づきモデルを生成及び／又は変更してよい。学習エンジン１１６は、出力目標１０８によって実装され得る最終使用用途のためにニューラルネットワークを更に最適化してよい。特に、学習エンジン１１６は、出力目標１０８によって実装され得る最終使用用途の特異なアクティビティのためにニューラルネットワークを最適化してよい。学習エンジン１１６は、最終使用用途の出力目標１０８のためのアプリケーションプログラムを提供してよい。学習エンジン１１６は、出力目標１０８に、アプリケーションプログラムを介して、実環境１１０において特異なアクティビティを検出し是正するよう指示してよい。

トレーナーサーバ１１８は、ＤＭＳ１１４を含んでよい。ＤＭＳ１１４は、学習エンジン１１６から物理的に離れているメモリの部分であってよい。ＤＭＳ１１４は、ニューラルネットワークの訓練に関連した実験データ処理機能のために構成されてよい。いくつかの実施形態において、学習エンジン１１６は、ニューラルネットワーク情報及び処理されたユーザ感覚入力をＤＭＳ１１４へ送るよう構成されてよい。ＤＭＳ１１４は、実験データ処理機能のために、受け取られたニューラルネットワーク情報及び処理されたユーザ感覚入力を使用してよい。いくつかの実施形態において、ＤＭＳ１１４は、実験データ処理機能のためにニューラルチューリングマシン（neural Turing machine）を模倣する演算を用いてよい。

出力目標１０８は、実環境１１０において実装されるデバイスを含んでよい。出力目標１０８は、学習エンジン１１６からアプリケーションプログラムを受信するよう構成されてよい。出力目標１０８は、エキスパートユーザ１２０と同様に動作してよい。例えば、ユーザ感覚入力は、実環境１１０をシミュレートするか又はその派生物であるデータに対するエキスパートユーザ１２０の応答及び反応に基づく。アプリケーションプログラムは、ユーザ感覚入力に基づく。然るに、出力目標１０８は、エキスパートユーザ１２０がエキスパート入力環境１０２において行ったアクションに類似するアクションを実行してよい。例えば、アプリケーションプログラムは、表示デバイス１０４を介して提示されたデータにおける特異なアクティビティと類似しているか又は同じである実環境１１０における特異なアクティビティの検出又は識別を可能にし得る。アプリケーションプログラムは、識別された特異なアクティビティに対処するための改善措置又は方法を更に含んでよい。それは、エキスパートユーザ１２０によって実施される改善措置又はエキスパートユーザ１２０が特異なアクティビティに対処した方法に類似し得る。

データストレージデバイス１１２は、環境１００において実装されてよい。データストレージデバイス１１２は、環境１００におけるデータ及び情報を記憶するよう構成されてよい。例えば、データストレージデバイス１１２は、生の（raw）ユーザ感覚入力、訓練されたニューラルネットワーク、最適化されたモデル、アプリケーションプログラム、アテンションマップ、自然言語入力に基づく注釈、センサ入力データ、又はそれらの何らかの組み合わせを記憶してよい。データストレージデバイス１１２は、後述されるメモリ９１０に類似した非一時的な媒体を含んでよい。いくつかの実施形態において、データストレージデバイス１１２に記憶されたデータの少なくともある部分は、データが特定のセッション及び／又は特定のエキスパートユーザ（例えば、１２０）に明示的に関連付けられるように、一意的にタグを付されてよい。例えば、特定のユーザによって供給されるセンサ入力データの特定の組は、特定の入力セッションの間に供給されるものである。センサ入力データの組は、センサ入力データのその特定の組が特定のエキスパートユーザ及び特定入力セッションに明示的に関連付けられるように、（例えば、エキスパートユーザログイン、時間、日付、などにより）一意的にタグを付されてよい。

環境１００は、一般的な意味において記載される。環境１００及びその原理は、多数のテストケースにおいて適用可能であり得る。例えば、環境１００は、セキュリティ／対テロリズム環境を含んでよい。この例では、エキスパートユーザ１２０は、セキュリティ専門家を含んでよい。エキスパートユーザ１２０は、配信動画を監視してよい。学習エンジン１１６は、エキスパートユーザ１２０がどんな観察結果及び異常を疑わしいと考え得るかに基づき視線又は他の入力デバイスを用いてアテンションマップを生成してよい。エキスパートユーザ１２０はまた、自然言語において観察結果を入力し、そして、特定の特異なアクティビティを探すためにスマートエッジデバイスに展開されるべきエキスパートシステムプロファイルを生成してよい。

環境１００は、農業環境を含んでよい。エキスパートユーザ１２０は、例えば、農業主、植物学者、又は温室専門家を含んでよい。エキスパートユーザ１２０は、映像（ドローンカメラ、温度、衛星、地上センサデータフィード）を観測してよく、アテンションマップは、飛行経路、関心のあるエリア、及びエキスパートシステムが収穫を高め且つ穀物の不作をなくすのを助けるよう訓練するための他の注釈を生成するために使用されてよい。

環境１００は、工場環境を含んでよい。この例では、エキスパートユーザ１２０は、高度な技術を有するメンテナンス又は工場労働者を含んでよい。エキスパートユーザ１２０は、ドローン、カメラ、又は工場からのデータを観測し、専門的な解析を加えてよい。例えば、エキスパートユーザ１２０は、注意から恩恵を受け得る危険な実務又は特異なアクティビティを観測してよい。専門的な訓練を受けたシステムは、後に、この学習をエッジデバイスへ受け渡すことができる。

環境１００は、行動／認知健康環境を含んでよい。この例となる環境では、エキスパートユーザ１２０はまた、認知又は発達障害を持った患者の行動特性を観測してよい。そのような観測は、視線をマッピングすることによって、且つ、被験者がビデオゲーム、又はビデオ、画像、又は音響にどのように反応しているかという肉体的及び感情的反応を観測することによって生成されたアテンションマップによって、達成されてよい。

環境１００は、医療撮像環境を含んでよい。この例となる環境では、エキスパートユーザ１２０は、特定の腫瘍又は疾患を探しながらＭＲＩスキャンを見ることができる医師であってよい。視線データ又はタッチ入力に基づき、画像の特定の部分への注意が検出され得る。アテンションマップ及び特異なアクティビティの検出は、医療撮像デバイスに実装されてよい。

環境１００は、消防／災害復旧環境を含んでよい。この例となる環境では、エキスパートユーザ１２０は、火災又は災害エリアの配信動画から知的エージェントを訓練することができる消防士を含んでよい。エキスパートユーザ１２０は、どんな又はどこで助けが最も必要とされているかを知らせてよい。出力目標１０８は、アプリケーションプログラムに基づき警告を発せられ得る配備されたドローン又はカメラを含んでよい。

環境１００は、ロボット動作環境を含んでよい。この例となる環境では、エキスパートユーザ１２０は、ロボティクス専門家又はエンジニアを含んでよい。エキスパートユーザ１２０は、モーションセンサを装備された、及び／又はＲＢＧｄカメラによる監視下にあるマシンを観測してよい。モーションセンサ及び／又はＲＢＧｄカメラは、動作プロファイルを生成し、エキスパートユーザ１２０のロボットバージョン又はマシンを訓練するために使用されてよい。

環境１００は、認知／学習行動環境を含んでよい。この例となる環境では、エキスパートユーザ１２０は、学習材料における特定の焦点エリアについてシステムを訓練する教師を含んでよい。生徒は、その場合に、システムを使用してよく、生徒の視線は、その生徒がデータの適切な部分に集中しているかどうかを判定するために、教師の焦点エリアと比較されてよい。

変更、追加、又は削除は、本開示の適用範囲から逸脱することなしに環境１００に対して行われてよい。例えば、環境１００は、表示デバイス１０４の１つ以上、センサ１０６／１２２／１２４の１つ以上、トレーナーサーバ１１８の１つ以上、１つ以上のデータストレージデバイス１１２、出力目標１０８の１つ以上、又はそれらのあらゆる組み合わせを含んでよい。更に、本明細書で記載される環境における様々な構成要素及びサーバの分離は、その分離が全ての実施形態で起こることを示すよう意図されない。例えば、いくつかの実施形態では、データストレージデバイス１１２がトレーナーサーバ１１８に含まれてよい。更に、記載される構成要素及びサーバは、一般に、単一のコンポーネント又はサーバにまとめられてよく、あるいは、複数の構成要素又はサーバに分けられてよいことが、本願によって理解され得る。例えば、ＤＭＳ１１４は、トレーナーサーバ１１８へ通信上結合されている他のコンピューティングデバイスで実装されてよい。

図２は、図１の環境１００において実装され得る、例となるユーザ感覚入力取得プロセス（取得プロセス）２００を表す。例えば、取得プロセス２００は、図１のエキスパート入力環境１０２において実装されてよい。図２は、図１を参照して記載されたエキスパートユーザ１２０及びトレーナーサーバ１１８を含んでよい。図２は、通信ネットワークを省略する。しかし、情報（例えば、２０４、２０６、２０８、２１０、及び２１２）の通信は、図１のネットワーク１２８のような通信ネットワークによって通信されてよいことが、本開示によって理解され得る。

エキスパートユーザ１２０は、認証されてよい。例えば、エキスパートユーザ１２０は、セッショントークン２０４をトレーナーサーバ１１８へ送ってよい。セッショントークン２０４は、トレーナーサーバ１１８とインターフェイス接続する特定のユーザとしてエキスパートユーザ１２０を識別し、及び／又は、エキスパートユーザ１２０がユーザ感覚入力２０８及び２１２をトレーナーサーバ１１８へ供給する特定の期間（例えば、セッション）を識別してよい。

いくつかの実施形態において、エキスパートユーザ１２０は、セッショントークン２０４を、表示デバイス１０４を介して送ってよい。他の実施形態では、エキスパートユーザ１２０は、セッショントークン２０４をトレーナーサーバ１１８へ送るようエキスパートデバイス２０２とインターフェイス接続してよい。その上、エキスパートユーザ１２０は、パスワード、バイオメトリックサンプル、又は他の適切な識別子を用いてログイン情報をトレーナーサーバ１１８へ供給するよう構成されてよい。

数あるデータの中でも特にセッショントークン２０４並びにユーザ感覚入力２０８及び２１２は、ブロックチェーンスタイルの台帳２１４に格納されてよい。ブロックチェーンスタイルの台帳２１４は、タイムスタンプ及び他のデータを含み得る暗号で保護された記録のリストを含んでよい。いくつかの実施形態において、ブロックチェーンスタイルの台帳２１４は、その全文を参照により本願に援用されるTschorsch & Scheuermann，Bitcoin and Beyond: A Technical Survey on Decentralized Digital Currencies，IEEE Communications Surveys & Tutorials 2084-2123，２０１７年１１月２４日で記載されているブロックチェーンに類似し得る。他の実施形態では、セッショントークン２０４並びに／又はユーザ感覚入力２０８及び２１２は、他の適切なフォーマット又はデータベースに格納されてよい。

トレーナーサーバ１１８は、データ２１０を表示デバイス１０４へ送るよう構成されてよい。いくつかの実施形態において、データ２１０のソースは、表示デバイス１０４を用いてエキスパートユーザ１２０によって選択されてよい。例えば、エキスパートユーザ１２０は、表示デバイス１０４でデータ２１０の複数のソースを提示されてよい。エキスパートユーザ１２０は、次いで、提示されたソースの中から１つを選択してよい。例えば、エキスパートユーザ１２０は、特定の交差点からのストリートカメラを含むデータソースを選択してよい。トレーナーサーバ１１８は、次いで、ストリートカメラからの映像データを表示デバイス１０４へ送ってよい。データ２１０は、表示デバイス１０４で表示されてよい。例えば、図２では、交差点の画像又は映像が表示デバイス１０４で表示される。選択の例についてのいくつかの更なる詳細は、図５を参照して与えられる。

エキスパートユーザ１２０は、複数のセンサ２０１Ａ、２０１Ｂ、２０１Ｃ、２０１Ｄ、２０１Ｅ、及び２０１Ｆを取り付けられ、及び／又はそれらのセンサによって観測されてよい。センサ２０１Ａ、２０１Ｂ、２０１Ｃ、２０１Ｄ、２０１Ｅ、及び２０１Ｆは、センサ１０６／１２２／１２４と実質的に同様であってよく、センサ１０６／１２２／１２４に対応してよい。複数のセンサ２０１Ａ、２０１Ｂ、２０１Ｃ、２０１Ｄ、２０１Ｅ、及び２０１Ｆは、概してセンサ２０１と呼ばれ得る。例えば、表されている実施形態では、エキスパートユーザ１２０は、脳電図（ＥＥＧ）２０１Ａ、心拍モニタ２０１Ｂ、加速度計２０１Ｃ、及びマイクロホン２０１Ｄを取り付けられてよい。その上、視線カメラ２０１Ｅ及びジェスチャ捕捉カメラ２０１Ｆが、エキスパートユーザ１２０を観測するために実装されてよい。他の実施形態では、他のセンサ２０１が、エキスパートユーザ１２０を観測及びモニタするよう実装されてよい。例えば、いくつかの実施形態において、センサ２０１は、ＲＢＧｄ（depth；奥行き）カメラ、ジェスチャ捕捉センサ、バイオメトリック捕捉システム、ウェアラブルセンサシステム、デジタルＩ／Ｏインターフェイス、ウェアラブルリング型入力、キーボード、マウス、感情認識システム、視線追跡システム、ビデオインターフェイス、マイクロホン、ブレインコンピュータインターフェイス、触覚インターフェイス、ワイヤレス受信器、高解像度カメラ、温度又は赤外線カメラ、光センサ、グローバルポジショニングシステム（ＧＰＳ）、ワイヤレス送信器、３６０度カメラ、デジタル光学インターフェイス、及びバーチャルリアリティインターフェイス、又はそれらの何らかの組み合わせを含んでよい。

センサ２０１は、ユーザ感覚入力２０８及び２１２を生成するよう構成されてよい。ユーザ感覚入力２０８及び２１２は、トレーナーサーバ１１８へ送られてよい。ユーザ感覚入力２０８及び２１２は、センサ２０１の夫々の１つ以上から生成された多数のタイプの入力を含んでよい。例えば、第１のユーザ感覚入力２１２は、視線カメラ２０１Ｅによって生成されてよい。視線カメラ２０１Ｅは、データ２１０がエキスパートユーザ１２０に表示されている場合に表示デバイス１０４のどこを見ているかを決定してよい。然るに、第１のユーザ感覚入力２１２は、エキスパートユーザ１２０が見ている場所のインジケーションによるデータ２１０の表現を含み得る。第２のユーザ感覚入力２０８は、ＥＥＧ２０１Ａによって生成されてよい。然るに、第２のユーザ感覚入力２０８は、ＥＥＧ２０１Ａによって生成されたデータを表し得る。

ユーザ感覚入力２０８及び２１２は、データ２１０が表示デバイス１０４に表示される場合に生成及び通信されてよい。ユーザ感覚入力２０８及び２１２は、ユーザ感覚入力２０８及び２１２が特定の時点に表示されているデータ２１０の特定の部分と関連付けられるように、タイムスタンプとともに記憶されてよい。

ユーザ感覚入力２０８及び２１２に加えて、自然言語入力２０６がトレーナーサーバ１１８へ送られてよい。自然言語入力２０６は、エキスパートユーザ１２０によって供給されるコメント２１３又は他の同様の入力（例えば、タッチ、タイプ入力、マウスクリック、など）を表してよい。コメント２１３は、自然な話し又は書き言葉において供給されてよく、ユーザ感覚入力２０８及び２１２が取得される場合にエキスパートユーザ１２０の応答又は行動を物語ってよい。自然言語入力２０６は、学習エンジン１１６によって訓練されたニューラルネットワークへ入力を供給するよう、ユーザ感覚入力２０８及び２１２とともに記憶又は処理されてよい。

図３は、図１の環境１００において実装され得る、例となるアプリケーションプログラム生成プロセス（生成プロセス）３００を表す。例えば、生成プロセス３００は、図１のトレーナーサーバ１１８によって実装されてよい。図３は、図１を参照して記載される実環境１１０に含まれ得るトレーナーサーバ１１８及び出力目標１０８を含んでよい。図３は、通信ネットワークを省略する。しかし、情報（例えば、２０６、２０８、２１２、及び３１０）の通信は、図１のネットワーク１２８のような通信ネットワークによって通信されてよいことが、本開示によって理解され得る。

生成プロセス３００において、トレーナーサーバ１１８は、図２を参照して記載されるようにセンサ２０１から自然言語入力２０６及びユーザ感覚入力２０８／２１２を受信するよう構成されてよい。自然言語入力２０６は、ユーザ感覚入力２０８／２１２に対応し関連付けられてよい。例えば、自然言語入力２０６は、エキスパートユーザ（例えば、図１及び２のエキスパートユーザ１２０）のフィードバック及び反応を測定するユーザ感覚入力２０８／２１２と同時に受け取られるコメントであってよい。

学習エンジン１１６は、ユーザ感覚入力２０８／２１２に少なくとも部分的に基づき、アテンションマップ３０４を生成してよい。アテンションマップ３０４は、エキスパートユーザが焦点を合わせた提示されているデータ部分を示してよい。アテンションマップ３０４は、１つ以上の分類領域を含んでよい。その上、学習エンジン１１６は、自然言語入力２０６から１つ以上の注釈３０２を生成してよい。注釈３０２は、アテンションマップ３０４に加えられてよい。例えば、学習エンジン１１６は、エキスパートユーザの自然言語入力２０６に基づく自然言語入力ラベルによりアテンションマップ３０４に注釈を付してよい。

学習エンジン１１６は、ニューラルネットワーク３０６を訓練してよい。学習エンジン１１６は、ユーザ感覚入力２０８／２１２、自然言語入力２０６、注釈３０２、アテンションマップ３０４、他の情報３１４（図３では、他の情報３１４）、又はそれらの組み合わせに基づきニューラルネットワーク３０６を訓練してよい。他の情報３１４は、出力目標１０８に関連したアプリケーション命令及びソースコード、出力目標１０８に関連した製品仕様、出力目標１０８のデバイス仕様、又は実環境１１０の物理的な制約を含んでよい。例えば、注釈３０２付きのアテンションマップ３０４は、他の情報３１４とともにニューラルネットワーク３０６への入力として使用されてよい。ニューラルネットワーク３０６を訓練することは、実環境１１０における特異なアクティビティを示す特定の組の入力を分離又は精緻化し得る。その上、ニューラルネットワーク３０６の訓練は、実環境１１０における特異なアクティビティに対処する出力目標１０８のための改善措置又は動作を分離又は精緻化し得る。

訓練されたニューラルネットワーク３０６は、最終使用用途の特異なアクティビティのために最適化されてよい。例えば、ニューラルネットワーク３０６は、実環境１１０における特定の特異なアクティビティ又は特異なアクティビティの組の検出のために、訓練されてよい。例えば、いくつかの実施形態において、実環境１１０は農業環境を含んでよい。そのような実施形態では、エキスパートユーザは農業専門家を含む。その上、アテンションマップ３０４は、ヒートマップ、グリッドをオーバーレイされた画像、又はオブジェクトセグメンテーション選択を含んでよい。ユーザ感覚入力２０８／２１２は、視線センサによって捕捉される農業専門家の視線を表すユーザ視線データと、タッチスクリーン上で受け取られた物理接触を表す物理接触データとを含んでよい。農業専門家であるユーザの自然言語入力２０６は、音声入力又はタッチ機能を含んでよい。注釈３０２及びアテンションマップ３０４は、自然言語入力２０６に基づいてよく、ニューラルネットワーク３０６を訓練するために使用されてよい。最終使用用途は、農業環境の水やりスケジュールを含んでよい。然るに、ニューラルネットワーク３０６は、農業環境に関連した特異なアクティビティ（例えば、乾燥地、装置の誤動作、など）を識別するよう訓練されてよい。ニューラルネットワーク３０６は、出力目標１０８を用いて農業環境において改善措置（例えば、水やりを増やすこと、装置を交換すること、など）を実施するよう更に訓練されてよい。出力目標１０８は、実環境１１０において実装され、そして、学習エンジン１１６によって直接又は間接に制御されるよう構成された１つの道具（例えば、スプリンクラー）を含んでよい。

その上、いくつかの実施形態において、学習エンジン１１６は、深層学習エンジン３１２を含んでよい。深層学習エンジン３１２は、ニューラルネットワーク３０６を訓練するのを助けるよう構成されてよい。深層学習エンジン３１２は、ニューラルネットワーク情報及び処理されたユーザ感覚入力をＤＭＳ１１４へ送ってよい。例えば、深層学習エンジン３１２は、注釈３０２、アテンションマップ３０４、他の情報３１４、などをＤＭＳ１１４へ送ってよい。ＤＭＳ１１４は、実験データ処理機能のために構成されてよい。例えば、ＤＭＳ１１４は、実験データ処理機能のためにニューラルチューリングマシンを模倣する演算を用いてよい。

学習エンジン１１６は、訓練されたニューラルネットワーク３０６に基づきモデル３０８を生成し及び／又はモデル３０８を変更してよい。例えば、学習エンジン１１６は、ユーザ感覚入力２０８／２１２、自然言語入力２０６、注釈３０２、アテンションマップ３０４、他の情報３１４又はそれらの何らかの組み合わせを評価して、新しいモデル３０８が生成され得るかどうか、又は既に存在するモデル３０８が変更され得るかどうかを判定してよい。そのような判定に応えて、モデル３０８は生成又は変更されてよい。

学習エンジン１１６は、出力目標１０８のためのアプリケーションプログラム３１０を供給してよい。アプリケーションプログラム３１０は、モデル３０８に基づいてよい。アプリケーションプログラム３１０は、最終使用用途のために、特に、１つ以上の特異なアクティビティ及びそれらの特定された特異なアクティビティに対する１つ以上の改善措置を特定するために、最適化されてよい。アプリケーションプログラム３１０は、出力目標１０８によって実装されてよい。例えば、アプリケーションプログラム３１０は、出力目標１０８に指示するよう構成されてよい。例えば、アプリケーションプログラム３１０は、出力目標１０８に、実環境１１０における特異なアクティビティを検出し是正するよう指示してよい。

いくつかの実施形態において、学習エンジン１１６は、アプリケーションプログラムの品質チェックを可能にしてよい。品質チェックは、本開示で記載されているエキスパートユーザ１２０とは異なり得る第２のエキスパートユーザによって品質チェックセッション中に行われてよい。例えば、図２を参照して記載された認証と同様に、品質チェックは、第２のエキスパートユーザから第２のセッショントークンを受け取ることを含んでよい。第２のエキスパートユーザは、第２のセッショントークンに基づき認証され得る。第２のエキスパートユーザの品質チェックセッションは、タイムスタンプを付されてよい。第２のエキスパートユーザは、次いで、アプリケーションプログラム３１０が正確に且つ有効に特異なアクティビティを識別し、そのような特異なアクティビティに対する改善措置を実施するかどうかを評価してよい。第２のエキスパートユーザによって取得された如何なる情報も、ブロックチェーンスタイルの台帳２１４に格納されてよい。

図４Ａ及び４Ｂは、図１～３を参照して記載されたトレーナーサーバ１１８の、例となるコンピュータアーキテクチャ４００を表す。図４Ａは、バス４８０を介して接続されているハードウェアアクセラレータ４０２、中央演算処理装置（ＣＰＵ）４６８、ＤＭＳ１１４、ディスプレイアダプタ４３２、不揮発性ストレージ４３０、ネットワークインターフェイス４２８、電源４２６、バッテリー４２４、拡張バス４６０、及びメモリ４４４を含むコンピュータアーキテクチャ４００を表す。

ハードウェアアクセラレータ４０２は、トレーナーサーバ１１８においてプロセッシング機能を設けるよう構成されてよい。例えば、ハードウェアアクセラレータ４０２は、ユーザ感覚入力又は他のデータの部分を処理してよい。これは、ＣＰＵ４６８によってさもなければ実行され得る一部の処理を軽減し得る。ハードウェアアクセラレータ４０２の利点には、ハードウェアアクセラレータ４０２がないシステムと比較して、ニューラルネットワークが訓練される速度、モデルが生成される速度、アプリケーションプログラムが生成される速度、又はそれらの何らかの組み合わせを増大させることが含まれ得る。表されている実施形態では、ハードウェアアクセラレータ４０２は、人工知能（ＡＩ）アクセラレータ４０４、メモリスタ（memristor）に基づくアクセラレータ４０６、グラフィカル処理ユニット（ＧＰＵ）４０８、ベクトルプロセッサ４１０、ＦＰＧＡ４１２、ビジョン処理ユニット（ＶＰＵ）４１４、ＡＳＩＣ４１６、物理処理ユニット（ＰＰＵ）４１８、汎用ＣＰＵ４２０、深層学習ユニット（ＤＬＵ）４２２、又はそれらの何らかの組み合わせを含んでよい。ＣＰＵ４６８は、データ及び情報を、情報の処理のために、ハードウェアアクセラレータ４０２とやり取りしてよい。

図４ＡにおけるＤＭＳ１１４は、Ｉ／Ｏコントローラ４４２、読み取りヘッド４４０、書き込みヘッド４３８、メモリ４３６、及びメモリコントローラ４３４を含んでよい。ＤＭＳ１１４は、トレーナーサーバ１１８の１つ以上の他の構成要素と通信するようバス４８０と接続されてよい。いくつかの実施形態において、ＤＭＳ１１４と、Ｉ／Ｏコントローラ４４２、読み取りヘッド４４０、書き込みヘッド４３８、メモリ４３６、及びメモリコントローラ４３４のうちの１つ以上とは、その全文を参照により本願に援用されるNikhil Buduma and Nicholas Lacascio，FUNDAMENTALS OF DEEP LEARNING，DESIGNING NEXT-GENERATION MACHINE INTELLIGENCE ALGORITHMS，２０１７年６月で記載されているように動作してよい。

表されている実施形態では、ＤＭＳ１１４は、ニューラルネットワークを訓練するために深層学習エンジン３１２とインターフェイス接続するよう構成されてよい。例えば、深層学習エンジン３１２は、ニューラルネットワーク情報及び処理されたユーザ感覚入力をＤＭＳ１１４へ送ってよい。ＤＭＳ１１４並びにＩ／Ｏコントローラ４４２、読み取りヘッド４４０、書き込みヘッド４３８、メモリ４３６、及びメモリコントローラ４３４は、受け取られたニューラルネットワーク情報及び処理されたユーザ感覚入力に基づき実験データ処理機能を実行してよい。

メモリ４４４は、図９を参照して記載されるメモリ９１０と実質的に同様であってよい。メモリ４４４は、ランダムアクセスメモリ（ＲＡＭ）４４６を含んでよい。ＲＡＭ４４６は、リードオンリーメモリ（ＲＯＭ）４４８、オペレーティングシステム４５２、メモリ内ストレージ４５４、及びアプリケーションスタック４５６を更に含んでよい。その上、ＤＭＳ及びメモリ４４４は、接続されるか又は一緒にネットワーク化されてよい。例えば、ＤＭＳ１１４及びメモリ４４４は、バス４８０を介して接続されてよい。アプリケーションスタック４５６は、学習エンジン１１６及び１つ以上の他のアプリケーション４５８を含んでよい。学習エンジン１１６は、数あるアプリケーション及びエンジンの中でも特に、深層学習エンジン３１２を含んでよい。

図４Ｂを参照すると、コンピュータアーキテクチャ４００のいくつかの更なる詳細が示されている。特に、図４Ｂは、学習エンジン１１６、深層学習エンジン３１２、及び他のアプリケーション４５８の詳細を含む。図４Ｂは、図４Ａを参照して記載されたハードウェアアクセラレータ４０２、ＣＰＵ４６８、ディスプレイアダプタ４３２、不揮発性ストレージ４３０、ネットワークインターフェイス４２８、電源４２６、バッテリー４２４、拡張バス４６０、又はそれらの何らかの組み合わせを含み得る他の構成要素４０１を含む。上述されたように、他の構成要素４０１、ＤＭＳ１１４、及びアプリケーションスタック４５６は、バス４８０を介して通信上結合されてよい。

表されている実施形態では、他のアプリケーション４５８は、ランタイムシミュレーション環境４３７、ソースコード発生器／コンパイラ４３５、データ分類器４３３、ブラウザアプリケーション４３１、ウェブサーバ４２９、行動解析（behavior analytics）エンジン４２７、ドメイン固有言語モデル４２５、統合開発環境４２３、又はそれらの何らかの組み合わせを含んでよい。他のアプリケーション４５８は、エキスパートユーザからの入力の処理、アプリケーションプログラムの生成、若しくは出力目標へのアプリケーションプログラムの通信に関連した機能、又は何らかの他の関連機能を提供してよい。例えば、ランタイムシミュレーション環境４３７は、アプリケーションプログラムの試験を可能にし得る。ソースコード発生器／コンパイラ４３５は、出力目標（例えば、図１の出力目標１０８）に関連したソースコードを供給し得る。

学習エンジン１１６は、ニューラルネットワーク（例えば、図３の３０６）の訓練に関連した１つ以上のアプリケーションを含んでよい。例えば、図４Ｂの学習エンジン１１６は、アテンションマップを生成するアテンションマッピングアプリケーション４１３、ニューラルネットワーク発生器４１５、機械学習エンジン４１７、対話型ニューラルネットワークオプティマイザ／構成アプリケーション４１９、自動ニューラルネットワークオプティマイザ／構成アプリケーション４２１、及び深層学習エンジン３１２を含んでよい。

深層学習エンジン３１２は、メモリ（例えば、図４Ａの４４４）で実行されるよう意図されてよい。例えば、深層学習エンジン３１２は、同時に実行され得る、複数の仮想マシンからのライブラリ、フレームワーク、及び他のニューラルネットワークモデルを含んでよい。深層学習エンジン３１２は、リソースを必要に応じて動的に共有し又は他の構成要素に割り当ててよい。深層学習エンジン３１２は、最適なニューラルネットワークが見つけられるまで、複数のモデル及びフレームワークが同時に実行及び評価することを可能にし得る。表されている実施形態では、深層学習エンジン３１２は、深層学習フレームワーク４０３、ハイブリッド／他のネットワーク４０５、再帰型ニューラルネットワーク（recurrent neural network）（ＲＮＮ）ライブラリ４０７、生成モデル（generative models）４０９、畳み込みニューラルネットワーク（convolution neural network）（ＣＮＮ）４１１、又はそれらの何らかの組み合わせを含んでよい。

図５は、図１のエキスパートユーザ１２０のようなエキスパートユーザからユーザ入力を受けるよう構成される図１の表示デバイス１０４の例となる実施形態を表す。表示デバイス１０４は、複数のアイコン（例えば、５２２Ａ～５２２Ｄ、５０６、５０４、５０８、５１０、５１２、及び５２０Ａ～５２０Ｄ）が提示され得る画面を含んでよい。表示デバイス１０４は、表示デバイス１０４の画面へのタッチを通じてアイコンの１つ以上の選択を可能にし得るタッチスクリーンとして構成されてよい。表されている実施形態では、例えば、表示デバイス１０４は、登録情報５０８、入力装置５０４、データソース５２２Ａ～５２２Ｄ、出力目標５２０Ａ～５２０Ｄ、又はそれらの何らかの組み合わせの選択、入力、及び確認を可能にし得る。

表示デバイス１０４上で、上部分は、１つ以上のデータソース５２２Ａ～５２２Ｄ（概して、データソース５２２）を表示してよい。データソース５２２は、エキスパートユーザに提示されるデータが発せられるか又はアクセスされるデバイス及び／システムを含んでよい。データソース５２２は、図１の実環境１１０のような実環境にある１つ以上のデバイスであってよい。例えば、データソース５２２は、実環境１１０における複数のカメラ、すなわち、固定カメラ及びドローンに取り付けられたカメラ、実環境１１０における２つ以上の他のデータソース、又は他の適切なデータソースを含んでよい。

表示デバイス１０４又は表示デバイス１０４に接続されたデバイスを用いて、エキスパートユーザは、上部分に提示されているデータソース５２２から１つを選択してよい。データソース５２２の選択後、データ（例えば、図２のデータ２１０）は、表示デバイス１０４で提示されてよい。エキスパートユーザは、本開示において別な場所で記載されているように、ユーザ感覚入力を供給するよう表示デバイス１０４と相互作用してよい。例えば、表されている実施形態では、表示デバイス１０４は、視線検出器５０２を含んでよい。エキスパートユーザが表示デバイス１０４と相互作用する場合に、視線検出器５０２は、エキスパートユーザを観察し、それに基づきユーザ感覚入力を生成してよい。

例えば、いくつかの実施形態において、エキスパートユーザは農業専門家であってよい。この実施形態では、実環境は、例えば、作物畑を含んでよい。表示デバイス１０４は、作物畑内の第１の位置にある第１のカメラである第１のデータソース５２２Ａを表示してよく、第２のデータソース５２２Ａは、ドローンが撮影した映像を含んでよく、第３のデータソース５２２Ｃは、畑の衛星画像を含んでよく、第４のデータソース５２２Ｄは、畑のサーマル画像を含んでよい。他の実施形態では、データソース５２２は、温室の画像、屋内庭園の映像、又は何らかの他の農業に関連した画像／映像のような、他のソースを含んでよい。エキスパートユーザは、次いで、データソース５２２の中から１つを選択してよい。例えば、エキスパートユーザは、データソース５２２のうちの１つに対応するアイコンをタッチするか、あるいは、そのデータソース５２２に対応するアイコンを選択するようマウス（又は他の適切なデバイス）を使用してよい。

表示デバイス１０４上で、中央部分は、登録情報５０８に関するアイコンを表示してよい。エキスパートユーザは、表示デバイス１０４上でプロフィールを作成し、そのプロフィールを、図２のブロックチェーンスタイルの台帳２１４のようなブロックチェーンスタイルの台帳を用いてセーブしてよい。プロフィールは、エキスパートユーザによって供給された登録情報５０８を含んでよい。登録情報５０８はまた、ユーザＩＤ及びセッションＩＤ５０６を用いて入力及びアクセスされてよい。ユーザＩＤ及びセッションＩＤ５０６は、ブロックチェーンスタイルの台帳を用いてログオンされてよい。

表示デバイス１０４の中央部分はまた、入力装置５０４に関するアイコンを表示してよい。入力装置５０４は、自然言語入力を取得するために使用されてよい。例えば、入力装置５０４は、エキスパートユーザからの感覚入力、反応、コメント、及び相互作用を取り込んでよく、エキスパートユーザの相互作用及び応答に基づきアテンションマップを生成するために使用されてよい。入力装置はまた、深層学習ニューラルネットワークモデルの重み、クラス情報、又は注釈を変更してよい。入力装置は、いくつかの入力装置オプションを表示してよい。例えば、入力装置は、タッチスクリーン、視線検出器、及び刺激応答中の脳活動を測定するＥＥＧのような、自然言語装置を含んでよい。自然言語装置は、エキスパートユーザの直感又は特定の知的プロファイルを捕捉してよく、それらは、アテンションマップ又はアテンションマップに含まれる注釈を生成するために使用されてよい。

例えば、いくつかの実施形態において、エキスパートユーザは農業専門家であってよい。農業専門家は、ユーザＩＤ及びセッションＩＤ５０６を介して登録情報５０８を供給してよい。農業専門家は、入力装置５０４を選択してよい。農業専門家は、入力装置５０４から１つ以上の感覚入力を選択してよい。例えば、農業専門家は、視線追跡器及び音声入力を選択してよい。農業専門家は、データソース５２２として作物畑を選択していてよい。農業専門家は、その場合に、作物畑の特定の領域に焦点を合わせるために視線センサを利用してよい。音声入力を用いて、農業専門家は、データソース５２２におけるデータにラベル又は注釈を付してよい。

表示デバイス１０４上で、下部分は、１つ以上の出力目標５２０Ａ～５２０Ｄ（概して、出力目標５２０）に関するアイコンを表示してよい。出力目標５２０は、学習エンジンによって生成されたアプリケーションプログラムを受け取ってよい。アプリケーションプログラムは、エキスパートユーザの観察を通じて取得されたユーザ感覚入力に基づき作成された命令を含んでよい。出力目標５２０は、図１の実環境１１０のような実環境において作動する１つ以上のデバイスであってよい。例えば、出力目標５２０は、実環境１１０における複数のカメラ、すなわち、固定カメラ及びドローンに取り付けられたカメラ、スマート灌漑システム、同様の事象を検出するよう訓練されているドローン若しくはカメラ、ウェアラブルセンサシステム、拡張現実ヘッドセット、実環境１１０における２つ以上の他の出力目標、又は他の適切な出力目標を含んでよい。

図６は、図５の第１のデータソース５２２Ａの選択後の表示デバイス１０４を表す。選択された第１のデータソース５２２Ａから供給又はアクセスされたデータは、表示デバイス１０４において提示されてよい。

エキスパートユーザ１２０が表示デバイス１０４と相互作用する場合に、ユーザ感覚入力は、エキスパートユーザ１２０を観察するよう実装された１つ以上のセンサによって、取得されてよい。例えば、図６の表示デバイス１０４は視線検出器５０２を含んでよい。視線検出器５０２は、エキスパートユーザ１２０の視野６０２を観測するか、又はエキスパートユーザ１２０が焦点を合わせている第１のデータソース５２２Ａの部分を決定してよい。その上、又は代替的に、同じく選択され得るマイクロホンは、エキスパートユーザ１２０によって話されたコメント６０４の形で自然言語入力を取得してよい。更にその上、表示デバイス１０４は、エキスパートユーザ１２０のタッチ６０６又は他の適切なセンサの形でユーザ感覚入力を取得してよい。自然言語入力及び／又はユーザ感覚入力は、トレーナーサーバ（例えば、本明細書で記載される１１８）へ送られてよい。

図７は、受け取られた入力７５０からの注釈付きアテンションマップ７１６の生成の、例となるプロセス７００を表す。プロセス７００は、いくつかの実施形態において、トレーナーサーバ（例えば、１１８）の学習エンジンによって実行されてよい。受け取られた入力７５０は、図６の表示デバイス１０４から送られ得る自然言語入力７０６及び／又はユーザ感覚入力７０２を含んでよい。自然言語入力７０６は、ユーザ感覚入力７０２に対応し関連付けられてよい。然るに、受け取られた入力７５０は、トレーナーサーバで一緒に受け取られ又は関連付けられてよい。

図７において、ユーザ感覚入力７０２は、フレーム７０８又は、表示デバイス１０４で提示されたデータの表現を含んでよい。フレーム７０８の部分７１０は、エキスパートユーザ（図６の１２０）が焦点を合わせたフレーム７０８の部分として強調表示されるか又は別なふうに示されてよい。フレーム７０８の部分７１０は、注釈付きアテンションマップ７１６において、分類領域７１８に対応してよい。分類領域７１８は、エキスパートユーザが焦点を合わせたフレーム７０８の部分７１０を含んでよい。

自然言語入力７０６は、ユーザ感覚入力７０２のフレーム７０８に関連した注釈を生成するために使用される。例えば、自然言語入力７０６は、環境又は分類領域７１８のためのラベルを生成するために使用されてよい。例えば、自然言語入力７０６は、フレーム７０８内に表されている環境にラベルを付すために使用されてよい。例えば、フレーム７０８に示されている環境は“トレイ１”であってよく、これは自然言語入力７０６から引っ張られ得る。その上、自然言語入力７０６は、分類領域７１８にラベル７２０を付すために使用されてよい。図７において、ラベル７２０は“野菜”を含んでよい。ラベル７２０は、注釈付きアテンションマップ７１６を生成するために加えられ得る。

然るに、学習エンジンは、ユーザ感覚入力７０２及び自然言語入力７０６に少なくとも部分的に基づき注釈付きアテンションマップ７１６を生成してよい。学習エンジンは、自然言語入力７０６から注釈又はラベル７１２及び７２０を生成してよい。注釈又はラベル７１２及び７２０は、注釈付きアテンションマップ７１６を生成するために加えられてよい。注釈付きアテンションマップ７１６は、エキスパートユーザが焦点を合わせた提示されているデータの部分を示してよい。特に、注釈付きアテンションマップ７１６は、エキスパートユーザによって焦点を合わせられた部分７１０に対応し得る分類領域７１８を含んでよい。

図８は、選択された第１の出力目標５２０のためのアプリケーションプログラム３１０を生成するプロセス８００を表す。例えば、エキスパートユーザは、図５の表示デバイス１０４を用いて第１の出力目標５２０を選択してよい。プロセス８００は、注釈付きアテンションマップ７１６及び他の情報３１４を入力として受けるニューラルネットワーク８１２の訓練を含んでよい。他の情報３１４は、選択された第１の出力目標５２０Ａに特有であり得るアプリケーション命令８０８及び製品仕様８１０を含んでよい。

ニューラルネットワーク８１２は、入力として注釈付きアテンションマップ７１６及び他の情報３１４を入力層８１８内に受けてよい。入力層８１８は、次いで、ノードの１つ以上の隠れ層８２０Ａ～８２０Ｃ（概して、隠れ層８２０）を通して処理してよい。隠れ層８２０は、特異なアクティビティが識別され、そして、その特異なアクティビティに対する改善措置が決定され得るようにニューラルネットワーク８１２を訓練するための中間計算及び／又は処理を含む。

訓練されたニューラルネットワーク８１２は、最終使用用途において最適化されてよい。特に、訓練されたニューラルネットワーク８１２は、特定の選択された出力目標８２０Ａのために最適化されてよい。例えば、他の情報３１４は、特定の選択された第１の出力目標５２０Ａに対する訓練されたニューラルネットワーク８１２の最適化を可能にし得る。ニューラルネットワーク８１２は出力層８２２を含んでよい。出力層８２２は、モデル３０８に供給されるか又はモデル３０８を生成するために使用され得る最適化された値の組を含んでよい。

モデル３０８は、アプリケーションプログラム３１０を生成するために使用されてよい。例えば、アプリケーションプログラム３１０は、選択された第１の出力目標５２０Ａに特有である訓練されたニューラルネットワーク８１２の最適値を含んでよい。アプリケーションプログラム３１０は、実環境１１０における第１の出力目標５２０Ａへ送られてよい。アプリケーションプログラム３１０は、第１の出力目標５２０Ａに、特異なアクティビティを識別し、その識別された特異なアクティビティに対する改善措置を実施するよう指示してよい。

表されている実施形態では、例えば、特異なアクティビティは、注釈付きアテンションマップ７１６において識別されラベルを付されている野菜を含んでよい。野菜は、注釈付きアテンションマップ７１６に含まれている分類領域７１８に対応してよい。然るに、第１の出力目標５２０Ａは、次いで、野菜が水を必要とする場合を特定し、解決策（例えば、水源を作動させること。）を実施することが可能であり得る。

図９は、本開示の少なくとも１つの実施形態に従うアプリケーションプログラム生成のための深層ニューラルネットワーク訓練の実施のために構成され得る、例となるコンピューティングシステム９００のブロック図である。コンピューティングシステム９００は、例えば、図１の環境１００において実装されてよい。例えば、コンピューティングシステム９００は、出力目標１０８、表示デバイス１０４、トレーナーサーバ１１８、又はエキスパートデバイス２０２を含んでよい。コンピューティングシステム９００は、ＤＭＳ１１４、１つ以上のプロセッサ９０８、メモリ９１０、通信ユニット９１２、ユーザインターフェイスデバイス９１４、及び学習エンジン１１６を含むデータストレージ９０６を含んでよい。

プロセッサ９０８は、様々なコンピュータハードウェア又はソフトウェアモジュールを含む如何なる適切な特別目的又は汎用のコンピュータ、コンピューティングエンティティ、又はプロセッシングデバイスも含んでよく、如何なる適用可能なコンピュータ読み出し可能記憶媒体にも記憶された命令を実行するよう構成されてよい。例えば、プロセッサ９０８は、マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ（ＤＳＰ）、ＡＳＩＣ、ＦＰＧＡ、あるいは、プログラム命令を解釈及び／若しくは実行するよう並びに／又はデータを処理するよう構成された如何なる他のデジタル又はアナログ回路も含んでよい。

図９では単一のプロセッサとして表されているが、プロセッサ９０８は、より一般的には、本開示で記載されている動作をいくつでも個々に又は集合的に実行するよう構成されたプロセッサをいくつでも含んでよい。その上、プロセッサ９０８の１つ以上は、１つ以上の異なる電子デバイス又はコンピューティングシステムにおいて存在してよい。いくつかの実施形態において、プロセッサ９０８は、メモリ９１０、データストレージ９０６、又はメモリ９１０及びデータストレージ９０６に記憶されているプログラム命令を解釈及び／若しくは実行し、並びに／又は記憶されているデータを処理してよい。いくつかの実施形態において、プロセッサ９０８は、データストレージ９０６からプログラム命令をフェッチし、プログラム命令をメモリ９１０にロードしてよい。プログラム命令がメモリ９１０にロードされた後、プロセッサ９０８はプログラム命令を実行してよい。

メモリ９１０及びデータストレージ９０６は、コンピュータ実行可能命令又はデータ構造を運ぶか又は記憶しているコンピュータ読み出し可能記憶媒体を含んでよい。そのようなコンピュータ読み出し可能記憶媒体は、プロセッサ９０８のような汎用又は特別目的のコンピュータによってアクセスされ得る如何なる利用可能な媒体も含んでよい。例として、制限なしに、そのようなコンピュータ読み出し可能記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ－ＲＯＭ若しくは他の光学ディスクストレージ、磁気ディスクストレージ若しくは他の磁気記憶デバイス、フラッシュメモリデバイス（例えば、固体状態メモリデバイス）、あるいは、コンピュータ実行可能命令又はデータ構造の形で所望のプログラムコードを携行又は記憶するために使用され得且つ汎用又は特別目的のコンピュータによってアクセスされ得る如何なる他の記憶媒体も含む有形な又は非一時的なコンピュータ読み出し可能記憶媒体を含んでよい。上記の組み合わせも、コンピュータ読み出し可能記憶媒体の適用範囲内に含まれ得る。コンピュータ実行可能命令は、例えば、プロセッサ９０８に特定の動作又は動作群を実行させるよう構成された命令及びデータを含んでよい。

通信ユニット９１２は、通信を受信及び送信するよう構成されたハードウェアの１つ以上の片を含んでよい。いくつかの実施形態において、通信ユニット９１２は、通信ハードウェアデバイスの中でも特に、アンテナ、有線ポート、及び変調／復調ハードウェアのうちの１つ以上を含んでよい。特に、通信ユニット９１２は、コンピューティングシステム９００の外から通信を受け、通信をプロセッサ９０８へ渡すよう、あるいは、プロセッサ９０８から他のデバイス又はネットワークへ通信を送るよう構成されてよい。

ユーザインターフェイスデバイス９１４は、ユーザから入力を受け及び／又は出力をユーザへ供給するよう構成されたハードウェアの１つ以上の片を含んでよい。いくつかの実施形態において、ユーザインターフェイスデバイス９１４は、ハードウェアデバイスの中でも特に、スピーカー、マイクロホン、ディスプレイ、キーボード、タッチスクリーン、又はホログラフィック投影のうちの１つ以上を含んでよい。

学習エンジン１１６は、データストレージ９０６に記憶されているプログラム命令を含んでよい。プロセッサ９０８は、学習エンジン１１６をメモリ９１０にロードし、そして、学習エンジン１１６を実行するよう構成されてよい。代替的に、プロセッサ９０８は、学習エンジン１１６をメモリ９１０にロードせずに、データストレージ９０６からライン・バイ・ラインで学習エンジン１１６を実行してよい。学習エンジン１１６を実行する場合に、プロセッサ９０８は、本開示において他の場所で記載されている未識別ブランチ探索を実行するよう構成されてよい。

変更、追加、又は削除は、本開示の適用範囲から逸脱することなしに、コンピューティングシステム９００に対して行われてよい。例えば、いくつかの実施形態において、コンピューティングシステム９００は、ユーザインターフェイスデバイス９１４を含まなくてよい。いくつかの実施形態において、コンピューティングシステム９００の異なる構成要素は物理的に分離していてよく、如何なる適切なメカニズムによっても通信上結合されてよい。例えば、データストレージ９０６は、プロセッサ９０８、メモリ９１０、及び記憶デバイスへ通信上結合されている通信ユニット９１２を含むサーバから分離した記憶デバイスの部分であってよい。本明細書で記載される実施形態は、以下で更に詳細に記載されるように、様々なコンピュータハードウェア又はソフトウェアモジュールを含む特別目的又は汎用のコンピュータの使用を含んでよい。

図１０Ａ及び１０Ｂは、アプリケーションプログラム生成のための深層ニューラルネットワーク訓練の、例となる方法１０００のフローチャートである。方法１０００は、図１の環境１００のような環境において実行されてよい。方法１０００は、いくつかの実施形態において、学習エンジン１１６、トレーナーサーバ１１８、コンピューティングシステム９００又はそれらの何らかの組み合わせによってプログラム可能に実行されてよい。いくつかの実施形態において、学習エンジン１１６を含むコンピューティングシステム（例えば、コンピューティングシステム９００）は、コンピューティングシステムに方法１０００を実行させるか又はその実行を制御させるよう１つ以上のプロセッサ（例えば、図９のプロセッサ９０８）によって実行可能であるプログラミングコード又は命令を記憶している非一時的なコンピュータ読み出し可能媒体を含んでよく、あるいは、そのような媒体へ通信上結合されてよい。その上、又は代替的に、学習エンジン１１６を含むコンピューティングシステム（例えば、コンピューティングシステム９００）は、本開示において他の場所に記載されたプロセッサ９０８を含んでよく、プロセッサ９０８は、コンピューティングシステムに方法１０００を実行させるか又はその実行を制御させるようにコンピュータ命令を実行するよう構成される。別個のブロックとして表されているが、図１０Ａ及び１０Ｂにおける様々なブロックは、所望の実施に応じて、更なるブロックに分けられても、より少ないブロックへとまとめられても、あるいは、削除されてもよい。

方法１０００は、セッショントークンがエキスパートユーザから受け取られ得るブロック１００２から開始してよい。セッショントークンは、エキスパートユーザに関連するエキスパートデバイスから受け取られてよい。セッショントークンは、エキスパートユーザを識別し、及び／又は、エキスパートユーザがトレーナーサーバとインターフェイス接続するか若しくはそれに入力を供給する特定のセッションを識別する識別子を含んでよい。セッショントークンは、図１のネットワーク１２８のような通信ネットワークを介して送られてよい。ブロック１００４で、エキスパートユーザは、セッショントークンに基づき認証されてよい。例えば、トレーナーサーバ１１８のようなトレーナーサーバは、特定のエキスパートユーザをセッショントークンに基づき認証するよう構成されてよい。ブロック１００６で、エキスパートユーザから取得された情報が、ブロックチェーンスタイルの台帳に格納されてよい。例えば、エキスパートユーザ及び／又は入力（後述される。）の識別情報は、ブロックチェーンスタイルの台帳に格納されてよい。

ブロック１００８で、ユーザ入力が、エキスパートユーザから受け取られてよい。いくつかの実施形態において、ユーザ入力は、提示されるデータが発せられるデータソースの選択、及び／又は出力目標の選択を含んでよい。出力目標は、例えば、ドローン、カメラ、又は拡張現実ヘッドセットを含んでよい。ブロック１０１０で、データがエキスパートユーザに提示されてよい。データは、アプリケーションプログラムが生成される実環境に関する情報を含んでよい。例えば、データは、１つ以上の場所からカメラフィード、ドローンからの画像データ、衛星からの画像データ、屋内カメラデータフィード、などを含んでよい。

ブロック１０１２で、ユーザ感覚入力が１つ以上のセンサを介して受け取られてよい。センサは、提示されているデータに関連した又はそれに応じたエキスパートユーザのアクティビティ及び反応を測定するものであってよい。ユーザ感覚入力は、データがエキスパートユーザに提示される場合に受け取られてよい。例えば、ユーザ感覚入力は、実時間において又は略実時間において受け取られてよい。センサは、ＲＢＧｄカメラ、ジェスチャ捕捉センサ、バイオメトリック捕捉システム、ウェアラブルセンサシステム、デジタルＩ／Ｏインターフェイス、ウェアラブルリング型入力、キーボード、マウス、感情認識システム、視線追跡システム、ビデオインターフェイス、マイクロホン、脳コンピュータインターフェイス、触覚インターフェイス、ワイヤレス受信器、高解像度カメラ、温度又は赤外線カメラ、光センサ、ＧＰＳ、ワイヤレス送信器、３６０度カメラ、デジタル光学インターフェイス、バーチャルリアリティインターフェイス、又はそれらの何らかの組み合わせを含んでよい。

ブロック１０１４で、アテンションマップが生成されてよい。アテンションマップは、ユーザ感覚入力に基づき生成されてよい。例えば、アテンションマップは、エキスパートユーザが焦点を合わせた、１つ以上のデータ分類領域を含む提示されているデータの部分を示してよい。ブロック１０１６で、アテンションマップは注釈を付されてよい。アテンションマップは、エキスパートユーザの自然言語入力に基づく自然言語入力ラベルにより注釈を付されてよい。例えば、エキスパートユーザは、エキスパートユーザが提示されているデータと相互作用する場合に（口頭で又はユーザインターフェイスを介して）コメントすることがある。エキスパートユーザのコメントは、テキスト上で解析され、アテンションマップ上で注釈を付されてよい。注釈は、提示されているデータの部分を参照するラベル及び／又はボックスを含んでよい。

ブロック１０１８で、ニューラルネットワークは訓練されてよい。ニューラルネットワークは、ユーザ感覚入力に基づき訓練されてよい。例えば、注釈付きアテンションマップが、ニューラルネットワークへの入力として使用されてよく、ニューラルネットワークは、注釈付きアテンションマップに基づき訓練されてよい。いくつかの実施形態において、訓練は、ニューラルネットワーク情報及び／又は処理されたユーザ感覚入力を微分メモリサブシステムへ送ることを含んでよい。微分メモリサブシステムで、ニューラルネットワーク情報及び／又は処理されたユーザ感覚入力は、実験データ処理機能のために使用されてよい。微分メモリサブシステムは、ブロック１００２、１００４、１００６、１００８、１０１０、１０１２、１０１４、１０１６、又はそれらの組み合わせのうちの１つ以上を実行するトレーナーサーバの他の部分から物理的に離れておりネットワーク接続されてよい。

ブロック１０２０で、モデルが生成又は変更されてよい。モデルは、最終使用用途の１つ以上の特異なアクティビティのために最適化されている訓練されたニューラルネットワークに基づき生成又は変更されてよい。例えば、ブロック１０１８に従って、ニューラルネットワークは、ユーザ感覚入力及び他の入力に基づき訓練されてよい。ニューラルネットワークは、実環境における特異なアクティビティ及びそれに対する改善措置の検出のために訓練又は最適化されてよい。ブロック１０２２で、アプリケーションプログラムが、最終使用用途の出力目標のために供給されてよい。例えば、アプリケーションプログラムは、最終使用用途の１つ以上の特定の特異なアクティビティ及びそれらの特異なアクティビティを是正する１つ以上の方法を検出するよう構成されてよい。

ブロック１０２４で、出力目標は、アプリケーションプログラムを介して、特異なアクティビティを検出し是正するよう指示されてよい。例えば、アプリケーションプログラムは、ユーザ感覚入力に基づく訓練されたニューラルネットワークに基づき、生成されてよい。アプリケーションプログラムは、次いで、出力目標へ送信又は通信されてよい。出力目標は、次いで、アプリケーションプログラムに従って動作してよい。

ブロック１０２６で、アプリケーションプログラムの品質チェックが有効にされてよい。品質チェックは、１以上の他のエキスパートユーザによって実行されてよい。他のエキスパートユーザは、実環境における出力目標の実行に基づきアプリケーションプログラムにアクセスし及び／又はそれを評価してよい。いくつかの実施形態において、品質チェックは、第２のエキスパートユーザから第２のセッショントークンを受け取ることを含んでよい。第２のエキスパートユーザは、第２のセッショントークンに基づき認証されてよい。第２のエキスパートユーザの品質チェックセッションは、タイムスタンプを付されてよく、アプリケーションプログラムをチェックするために第２のエキスパートユーザから取得された情報は、ブロックチェーンスタイルの台帳に格納されてよい。

例えば、いくつかの実施形態において、エキスパートユーザは農業専門家を含んでよい。そのような及び他の実施形態では、アテンションマップは、ヒートマップ、グリッドをオーバーレイされた画像、オブジェクトセグメンテーション選択を含んでよい。ユーザ感覚入力は、視線センサによって捕捉される農業専門家の視線を表すユーザ視線データと、タッチスクリーン上で受け取られた物理セッションを表す物理接触データとを含んでよい。農業専門家ユーザの自然言語入力は、音声入力又はタッチ機能を含む。モデルは、ユーザ感覚入力に基づき生成されてよく、ニューラルネットワークは、ユーザ感覚入力に基づき訓練されてよい。ニューラルネットワークは、実環境における特異なアクティビティ（例えば、乾燥地、枯れた野菜、故障したスプリンクラー、成熟した野菜、害虫の存在、雑草の存在、など）の検出と、特異なアクティビティを取り除くか又は別なふうにそれに対処するためのドローン又は他のメカニズムによる動作とのために、訓練されてよい。

他の実施形態では、エキスパートユーザはセキュリティ専門家を含んでよい。そのような及び他の実施形態では、アテンションマップは過去の映像を含んでよい。ユーザ感覚入力は、視線センサによって捕捉されるセキュリティ専門家の視線を表すユーザ視線データと、感情的な反応を表すカメラとを含んでよい。セキュリティ専門家ユーザの自然言語入力は、（例えば、マイクロホンによる）音声入力を含んでよい。モデルは、ユーザ感覚入力に基づき生成されてよく、ニューラルネットワークは、ユーザ感覚入力に基づき訓練されてよい。ニューラルネットワークは、モニタされている環境における特異なアクティビティ（例えば、安全保障上の脅威の存在、爆発物の存在、など）の検出と、特異なアクティビティを取り除くか又は別なふうにそれに対処するためのドローン、カメラ、アラーム又は他のメカニズムによる動作とのために、訓練されてよい。

当業者に明らかなように、本明細書で開示されているこの及び他のプロシージャ及び方法に関して、プロセス及び方法において実行される機能は、別の順序で実施されてよい。更に、説明されているステップ及び動作は、単に例として与えられており、ステップ及び動作の一部は、開示されている実施形態から逸脱することなしに、任意であっても、より少ないステップ及び動作へとまとめられても、又は更なるステップへと広げられてもよい。

本明細書で記載される実施形態は、以下で更に詳細に説明されるように、様々なコンピュータハードウェア又はソフトウェアを含む特別目的又は汎用のコンピュータの使用を含んでよい。

本明細書で記載される実施形態は、コンピュータ実行可能命令又はデータ構造を運ぶか又は記憶しているコンピュータ読み出し可能媒体を用いて、実装されてよい。そのようなコンピュータ読み出し可能媒体は、汎用又は特別目的のコンピュータによってアクセスされ得る如何なる利用可能な媒体であってもよい。例として、制限なしに、そのようなコンピュータ読み出し可能媒体は、ランダムアクセスメモリ（ＲＡＭ）、リードオンリーメモリ（ＲＯＭ）、電気的消去可能なプログラム可能リードオンリーメモリ（ＥＥＰＲＯＭ）、コンパクトディスク・リードオンリーメモリ（ＣＤ－ＲＯＭ）若しくは他の光学ディスクストレージ、磁気ディスクストレージ若しくは他の磁気記憶デバイス、フラッシュメモリデバイス（例えば、固体状態メモリデバイス）、あるいは、コンピュータ実行可能命令又はデータ構造の形で所望のプログラムコードを携行又は記憶するために使用され得且つ汎用又は特別目的のコンピュータによってアクセスされ得る如何なる他の記憶媒体も含む非一時的なコンピュータ読み出し可能記憶媒体を含んでよい。そのような及び他の実施形態において、本明細書で説明される語“一時的な”は、In re Nuijten, 500 F.3d 1346のFederal Circuit判決（Fed. Cir. 2007）において特許可能な対象の適用範囲外にあると認められたような一時的な媒体のみを除くと解釈されるべきである。

コンピュータ実行可能命令は、例えば、汎用のコンピュータ、特別目的のコンピュータ、又は特別目的のプロセッシングデバイス（例えば、１つ以上のプロセッサ）に特定の機能又は機能群を実行させる命令及びデータを含む。構造的な特徴及び／又は方法論的な動作に特有の言語で対象が記載されてきたが、添付の特許請求の範囲で定義されている対象は、必ずしも、上記の具体的な特徴又は動作に制限されないことが理解されるべきである。むしろ、上記の具体的な特徴又は動作は、特許請求の範囲を実施する形態の例として開示されている。

本明細書で使用されるように、語“モジュール”又は“コンポーネント”は、モジュール若しくはコンポーネントの動作を実行するよう構成された特定のハードウェア実施、並びに／又はコンピューティングシステムの汎用ハードウェア（例えば、コンピュータ読み出し可能媒体、プロセッシングデバイス、など）によって記憶及び／若しくは実行され得るソフトウェアオブジェクト若しくはソフトウェアルーチンを指し得る。いくつかの実施形態において、本明細書で記載される種々のコンポーネント、モジュール、エンジン、及びサービスは、コンピューティングシステムで（例えば、別個のスレッドとして）実行するオブジェクト又はプロセスとして実行されてよい。

本明細書で記載されるシステム及び方法の一部は、概して、（汎用ハードウェアによって記憶及び／又は実行される）ソフトウェアにおいて実装されるものとして記載されているが、特定のハードウェア実施、又はソフトウェア及び特定のハードウェア実施の組み合わせも可能であり、考えられている。本明細書において、“コンピューティングエンティティ”は、本明細書で以前に定義されたあらゆるコンピューティングシステム、又はコンピューティングシステムで実行されるあらゆるモジュール若しくはモジュールの組み合わせであってよい。

本明細書で、特に添付の特許請求の範囲（例えば、添付の特許請求の本文）で使用される語は、一般的に、“非限定的な（open）”用語として意図されている（例えば、語「含んでいる（including）」は、“～を含んでいるが、～に制限されない”との意に解釈されるべきであり、語「備えている（having）」は、「少なくとも～を備えている」との意に解釈されるべきであり、語「含む（includes）」は、“～を含むが、～に制限されない”との意に解釈されるべきである、など。）。

加えて、導入されたクレーム記載（introduced claim recitation）において特定の数が意図される場合、そのような意図は当該クレーム中に明確に記載され、そのような記載がない場合は、そのような意図も存在しない。例えば、理解を促すために、後続の添付された特許請求の範囲では、「少なくとも１つの（at least one）」及び「１つ以上の（one or more）」といった導入句を使用し、クレーム記載を導入することがある。しかし、このような句を使用するからといって、「a」又は「an」といった不定冠詞によりクレーム記載を導入した場合に、たとえ同一のクレーム内に、「１つ以上の」又は「少なくとも１つの」といった導入句と「a」又は「an」といった不定冠詞との両方が含まれるとしても、当該導入されたクレーム記載を含む特定のクレームが、当該記載事項を１しか含まない例に限定されるということが示唆されると解釈されるべきではない（例えば、「a」及び／又は「an」は、「少なくとも１つの」又は「１つ以上の」を意味すると解釈されるべきである。）。定冠詞を使用してクレーム記載を導入する場合にも同様のことが当てはまる。

更には、導入されたクレーム記載において特定の数が明示されている場合であっても、そのような記載は、通常、少なくとも記載された数を意味するように解釈されるべきであることは、当業者には理解されるであろう（例えば、他に修飾語のない、単なる「２つの記載事項」という記載がある場合、この記載は、少なくとも２つの記載事項、又は２つ以上の記載事項を意味する。）。更に、「Ａ、Ｂ及びＣなどのうち少なくとも１つ」又は「Ａ、Ｂ及びＣなどのうちの１つ以上」に類する表記が使用される場合、一般的に、そのような構造は、Ａのみ、Ｂのみ、Ｃのみ、ＡとＢの両方、ＡとＣの両方、ＢとＣの両方、及び／又はＡとＢとＣの全て、などを含むよう意図される。例えば、語「及び／又は（and/or）」の使用は、このように解釈されるよう意図される。

更に、２つ以上の選択可能な用語を表す如何なる離接語及び／又は離接句も、明細書、特許請求の範囲、又は図面のいずれであろうと、それら用語のうちの１つ、それらの用語のうちのいずれか、あるいは、それらの用語の両方を含む可能性を意図すると理解されるべきである。例えば、「Ａ又はＢ」という句は、「Ａ又はＢ」、あるいは、「Ａ及びＢ」の可能性を含むことが理解されるべきである。

加えて、語「第１（first）」、「第２（second）」、「第３（third）」などの使用は、要素の特定の順序又は数を示すために本願で必ずしも使用されているわけではない。一般に、語「第１」、「第２」、「第３」などは、異なる要素どうしを総称的な識別子として区別するために使用される。語「第１」、「第２」、「第３」などが特定の順序を示すとの明示がない限りは、それらの語が特定の順序を示すと理解されるべきではない。更には、語「第１」、「第２」、「第３」などが要素の特定の数を示すとの明示がない限りは、それらの語が要素の特定の数を示すと理解されるべきではない。例えば、第１のウィジェットは、第１の側面を有するものとして記載されることがあり、第２のウィジェットは、第２の側面を有するものとして記載されることがある。第２のウィジェットに対する語「第２の側面」の使用は、第２のウィジェットのその側面を第１のウィジェットの「第１の側面」と区別するためであって、第２のウィジェットが２つの側面を有していることを示すためではない。

ここで挙げられている全ての例及び条件付き言語は、当該技術の促進に本発明者によって寄与される概念及び本発明を読者が理解するのを助ける教育上の目的を意図され、そのような具体的に挙げられている例及び条件に制限されないと解釈されるべきである。本開示の実施形態が詳細に記載されてきたが、様々な変更、置換、及び代替が、本開示の主旨及び適用範囲から逸脱することなしに行われてよい。

上記の実施形態に加えて、以下の付記を開示する。
（付記１）
深層ニューラルネットワーク訓練のために構成されるコンピュータシステムアーキテクチャであって、
プロセッサと、
学習エンジンが記憶されており、該学習エンジンが
データをエキスパートユーザに提示し、
前記データが前記エキスパートユーザに提示される場合に、該提示されたデータに関連した前記エキスパートユーザの反応及びフィードバックを測定する１つ以上のセンサを介してユーザ感覚入力を受け、
前記エキスパートユーザが焦点を合わせた前記提示されたデータの部分を示し且つ１つ以上のデータ分類領域を含むアテンションマップを、前記ユーザ感覚入力に基づき生成し、
前記エキスパートユーザの自然言語入力に基づく自然言語入力ラベルにより前記アテンションマップに注釈を付し、
前記ユーザ感覚入力に基づきニューラルネットワークを訓練し、
エンドユーザアプリケーションの特異なアクティビティのために最適化される前記訓練されたニューラルネットワークに基づくモデルを生成し、
前記エンドユーザアプリケーションの出力目標のためのアプリケーションプログラムを供給し、
前記出力目標に、前記アプリケーションプログラムを介して、前記特異なアクティビティを検出し是正するよう指示する
よう構成されるメモリと、
前記メモリ及び前記プロセッサと物理的に離れておりネットワーク接続されている微分メモリサブシステムであり、ニューラルネットワーク情報及び処理されたユーザ感覚入力を、実験データ処理機能のために前記学習エンジンから受けるよう構成される前記微分メモリサブシステムと
を有するコンピュータシステムアーキテクチャ。
（付記２）
前記微分メモリサブシステムは、実験データ処理機能のためにニューラルチューリングマシンを模倣する演算を用いる、
付記１に記載のコンピュータシステムアーキテクチャ。
（付記３）
前記学習エンジンは更に、
前記エキスパートユーザからセッショントークン識別子を受け、
前記セッショントークンに基づき前記エキスパートユーザを認証し、
前記エキスパートユーザから得られた情報をブロックチェーンスタイルの台帳に格納する
よう構成される、
付記１に記載のコンピュータシステムアーキテクチャ。
（付記４）
前記学習エンジンは更に、前記アプリケーションプログラムの品質チェックを可能にするよう構成される、
付記１に記載のコンピュータシステムアーキテクチャ。
（付記５）
前記品質チェックは、
第２エキスパートユーザから第２セッショントークン識別子を受けることと、
前記第２セッショントークンに基づき前記第２エキスパートユーザを認証することと、
前記第２エキスパートユーザの品質チェックセッションにタイムスタンプを付すことと、
前記第２エキスパートユーザから得られた情報をブロックチェーンスタイルの台帳に格納することと
を含む、
付記４に記載のコンピュータシステムアーキテクチャ。
（付記６）
前記エキスパートユーザは、農業専門家を含み、
前記アテンションマップは、ヒートマップ、グリッドをオーバーレイされた画像、又はオブジェクトセグメンテーション選択を含み、
前記ユーザ感覚入力は、視線センサによって捕捉される前記農業専門家の視線を表すユーザ視線データと、タッチスクリーンにおいて受け取られる物理接触を表す物理接触データとを含み、
前記農業専門家の自然言語入力は、音声入力又はタッチ機能を含む、
付記１に記載のコンピュータシステムアーキテクチャ。
（付記７）
前記エキスパートユーザは、セキュリティ専門家を含み、
前記アテンションマップは、過去の映像を含み、
前記ユーザ感覚入力は、視線センサによって捕捉される前記セキュリティ専門家の視線を表すユーザ視線データと、情緒反応を表す脳波図及びカメラとを含み、
前記セキュリティ専門家の自然言語入力は、音声入力を含む、
付記１に記載のコンピュータシステムアーキテクチャ。
（付記８）
前記１つ以上のセンサは、ＲＢＧｄカメラ、ジェスチャ捕捉センサ、バイオメトリック捕捉システム、ウェアラブルセンサシステム、デジタルＩ／Ｏインターフェイス、ウェアラブルリング型入力、キーボード、マウス、感情認識システム、視線追跡システム、ビデオインターフェイス、マイクロホン、ブレインコンピュータインターフェイス、触覚インターフェイス、ワイヤレス受信器、高解像度カメラ、温度又は赤外線カメラ、光センサ、ＧＰＳ、ワイヤレス送信器、３６０度カメラ、デジタル光学インターフェイス、及びバーチャルリアリティインターフェイスの組み合わせの１つ以上を含む、
付記１に記載のコンピュータシステムアーキテクチャ。
（付記９）
前記出力目標は、ドローン、カメラ、又は拡張現実ヘッドセットを含む、
付記１に記載のコンピュータシステムアーキテクチャ。
（付記１０）
前記学習エンジンは更に、前記エキスパートユーザからユーザ入力を受けるよう構成され、
前記ユーザ入力は、前記提示されたデータが発せられるデータ源の選択を含み、且つ、前記出力目標の選択を含む、
付記１に記載のコンピュータシステムアーキテクチャ。
（付記１１）
アプリケーションプログラムのための深層ニューラルネットワーク訓練の方法であって、
トレーナーサーバによって、データをエキスパートユーザに提示することと、
前記トレーナーサーバによって、前記データが前記エキスパートユーザに提示される場合に、該提示されたデータに関連した前記エキスパートユーザの反応及びアクティビティを測定する１つ以上のセンサを介してユーザ感覚入力を受けることと、
前記トレーナーサーバによって、前記エキスパートユーザが焦点を合わせた前記提示されたデータの部分を示し且つ１つ以上のデータ分類領域を含むアテンションマップを、前記ユーザ感覚入力に基づき生成することと、
前記トレーナーサーバによって、前記エキスパートユーザの自然言語入力に基づく自然言語入力ラベルにより前記アテンションマップに注釈を付すことと、
前記トレーナーサーバによって、前記ユーザ感覚入力に基づきニューラルネットワークを訓練することであり、実験データ処理機能のためにニューラルネットワーク情報及び処理されたユーザ感覚入力を微分メモリサブシステムへ送ることを含む前記訓練することと、
前記トレーナーサーバによって、エンドユーザアプリケーションの特異なアクティビティのために最適化される前記訓練されたニューラルネットワークに基づくモデルを生成することと、
前記トレーナーサーバによって、前記エンドユーザアプリケーションの出力目標のためのアプリケーションプログラムを供給することと、
前記トレーナーサーバによって、前記出力目標に、前記アプリケーションプログラムを介して、前記特異なアクティビティを検出し是正するよう指示することと
を有する方法。
（付記１２）
前記エキスパートユーザからユーザ入力を受けることを更に有し、
前記ユーザ入力は、前記提示されたデータが発せられるデータ源の選択を含み、且つ、前記出力目標の選択を含む、
付記１１に記載の方法。
（付記１３）
前記微分メモリサブシステムは、前記トレーナーサーバの一次メモリから物理的に離れておりネットワーク接続されている、
付記１１に記載の方法。
（付記１４）
前記エキスパートユーザからセッショントークン識別子を受けることと、
前記セッショントークンに基づき前記エキスパートユーザを認証することと、
前記エキスパートユーザから得られた情報をブロックチェーンスタイルの台帳に格納することと
を更に有する
付記１１に記載の方法。
（付記１５）
前記アプリケーションプログラムの品質チェックを可能にすることを更に有し、
前記品質チェックは、
第２エキスパートユーザから第２セッショントークン識別子を受けることと、
前記第２セッショントークンに基づき前記第２エキスパートユーザを認証することと、
前記第２エキスパートユーザの品質チェックセッションにタイムスタンプを付すことと、
前記第２エキスパートユーザから得られた情報をブロックチェーンスタイルの台帳に格納することと
を含む、
付記１１に記載の方法。
（付記１６）
前記エキスパートユーザは、農業専門家を含み、
前記アテンションマップは、ヒートマップ、グリッドをオーバーレイされた画像、又はオブジェクトセグメンテーション選択を含み、
前記ユーザ感覚入力は、視線センサによって捕捉される前記農業専門家の視線を表すユーザ視線データと、タッチスクリーンにおいて受け取られる物理接触を表す物理接触データとを含み、
前記農業専門家の自然言語入力は、音声入力又はタッチ機能を含む、
付記１１に記載の方法。
（付記１７）
前記エキスパートユーザは、セキュリティ専門家を含み、
前記アテンションマップは、過去の映像を含み、
前記ユーザ感覚入力は、視線センサによって捕捉される前記セキュリティ専門家の視線を表すユーザ視線データと、情緒反応を表す脳波図及びカメラとを含み、
前記セキュリティ専門家の自然言語入力は、音声入力を含む、
付記１１に記載の方法。
（付記１８）
前記出力目標は、ドローン、カメラ、又は拡張現実ヘッドセットを含む、
付記１１に記載の方法。
（付記１９）
前記１つ以上のセンサは、ＲＢＧｄカメラ、ジェスチャ捕捉センサ、バイオメトリック捕捉システム、ウェアラブルセンサシステム、デジタルＩ／Ｏインターフェイス、ウェアラブルリング型入力、キーボード、マウス、感情認識システム、視線追跡システム、ビデオインターフェイス、マイクロホン、ブレインコンピュータインターフェイス、触覚インターフェイス、ワイヤレス受信器、高解像度カメラ、温度又は赤外線カメラ、光センサ、ＧＰＳ、ワイヤレス送信器、３６０度カメラ、デジタル光学インターフェイス、及びバーチャルリアリティインターフェイスの組み合わせの１つ以上を含む、
付記１１に記載の方法。
（付記２０）
プロセッサによって実行される場合に該プロセッサに付記１１に記載の方法を実行させる実行可能コードを記憶している非一時的なコンピュータ読み出し可能な媒体。

１００環境
１０２エキスパート入力環境
１０４表示デバイス
１０６環境センサ
１０８出力目標
１１０実環境
１１２データストレージ
１１８トレーナーサーバ
１１４微分メモリサブシステム（ＤＭＳ）
１１６学習エンジン
１２０エキスパートユーザ
１２２，１２４ユーザセンサ
１２８ネットワーク
２０１Ａ～Ｆセンサ
２０２エキスパートデバイス
２０４セッショントークン
２０６，７０６自然言語入力
２０８，２１２，７０２ユーザ感覚入力
２１０データ
２１３，６０４コメント
２１４ブロックチェーンスタイルの台帳
３０２注釈
３０４アテンションマップ
３０６，８１２ニューラルネットワーク
３０８モデル
３１０アプリケーションプログラム
３１２深層学習エンジン
５０２視線検出器
７１２，７２０ラベル
７１６注釈付きアテンションマップ
７１８分類領域
９００コンピューティングシステム

Claims

深層ニューラルネットワーク訓練のために構成されるコンピュータシステムアーキテクチャであって、
プロセッサと、
学習エンジンが記憶されており、該学習エンジンが
データをエキスパートユーザに提示し、
前記データが前記エキスパートユーザに提示される場合に、該提示されたデータに関連した前記エキスパートユーザの反応及びフィードバックを測定する１つ以上のセンサを介してユーザ感覚入力を受け、
前記エキスパートユーザが焦点を合わせた前記提示されたデータの部分を示し且つ１つ以上のデータ分類領域を含むアテンションマップを、前記ユーザ感覚入力に基づき生成し、
前記エキスパートユーザの自然言語入力に基づく自然言語入力ラベルにより前記アテンションマップに注釈を付し、
前記ユーザ感覚入力に基づきニューラルネットワークを訓練し、
エンドユーザアプリケーションの特異なアクティビティのために最適化される前記訓練されたニューラルネットワークに基づくモデルを生成し、
前記エンドユーザアプリケーションの出力目標のためのアプリケーションプログラムを供給し、
前記出力目標に、前記アプリケーションプログラムを介して、前記特異なアクティビティを検出し是正するよう指示する
よう構成されるメモリと、
前記メモリ及び前記プロセッサと物理的に離れておりネットワーク接続されている微分メモリサブシステムであり、ニューラルネットワーク情報及び処理されたユーザ感覚入力を、実験データ処理機能のために前記学習エンジンから受けるよう構成される前記微分メモリサブシステムと
を有するコンピュータシステムアーキテクチャ。
前記微分メモリサブシステムは、実験データ処理機能のためにニューラルチューリングマシンを模倣する演算を用いる、
請求項１に記載のコンピュータシステムアーキテクチャ。
前記学習エンジンは更に、
前記エキスパートユーザからセッショントークン識別子を受け、
前記セッショントークンに基づき前記エキスパートユーザを認証し、
前記エキスパートユーザから得られた情報をブロックチェーンスタイルの台帳に格納する
よう構成される、
請求項１に記載のコンピュータシステムアーキテクチャ。
前記学習エンジンは更に、前記アプリケーションプログラムの品質チェックを可能にするよう構成される、
請求項１に記載のコンピュータシステムアーキテクチャ。
前記品質チェックは、
第２エキスパートユーザから第２セッショントークン識別子を受けることと、
前記第２セッショントークンに基づき前記第２エキスパートユーザを認証することと、
前記第２エキスパートユーザの品質チェックセッションにタイムスタンプを付すことと、
前記第２エキスパートユーザから得られた情報をブロックチェーンスタイルの台帳に格納することと
を含む、
請求項４に記載のコンピュータシステムアーキテクチャ。
前記エキスパートユーザは、農業専門家を含み、
前記アテンションマップは、ヒートマップ、グリッドをオーバーレイされた画像、又はオブジェクトセグメンテーション選択を含み、
前記ユーザ感覚入力は、視線センサによって捕捉される前記農業専門家の視線を表すユーザ視線データと、タッチスクリーンにおいて受け取られる物理接触を表す物理接触データとを含み、
前記農業専門家の自然言語入力は、音声入力又はタッチ機能を含む、
請求項１に記載のコンピュータシステムアーキテクチャ。
前記エキスパートユーザは、セキュリティ専門家を含み、
前記アテンションマップは、過去の映像を含み、
前記ユーザ感覚入力は、視線センサによって捕捉される前記セキュリティ専門家の視線を表すユーザ視線データと、情緒反応を表す脳波図及びカメラとを含み、
前記セキュリティ専門家の自然言語入力は、音声入力を含む、
請求項１に記載のコンピュータシステムアーキテクチャ。
前記１つ以上のセンサは、ＲＢＧｄカメラ、ジェスチャ捕捉センサ、バイオメトリック捕捉システム、ウェアラブルセンサシステム、デジタルＩ／Ｏインターフェイス、ウェアラブルリング型入力、キーボード、マウス、感情認識システム、視線追跡システム、ビデオインターフェイス、マイクロホン、ブレインコンピュータインターフェイス、触覚インターフェイス、ワイヤレス受信器、高解像度カメラ、温度又は赤外線カメラ、光センサ、ＧＰＳ、ワイヤレス送信器、３６０度カメラ、デジタル光学インターフェイス、及びバーチャルリアリティインターフェイスの組み合わせの１つ以上を含む、
請求項１に記載のコンピュータシステムアーキテクチャ。
前記出力目標は、ドローン、カメラ、又は拡張現実ヘッドセットを含む、
請求項１に記載のコンピュータシステムアーキテクチャ。
前記学習エンジンは更に、前記エキスパートユーザからユーザ入力を受けるよう構成され、
前記ユーザ入力は、前記提示されたデータが発せられるデータ源の選択を含み、且つ、前記出力目標の選択を含む、
請求項１に記載のコンピュータシステムアーキテクチャ。
アプリケーションプログラムのための深層ニューラルネットワーク訓練の方法であって、
トレーナーサーバによって、データをエキスパートユーザに提示することと、
前記トレーナーサーバによって、前記データが前記エキスパートユーザに提示される場合に、該提示されたデータに関連した前記エキスパートユーザの反応及びアクティビティを測定する１つ以上のセンサを介してユーザ感覚入力を受けることと、
前記トレーナーサーバによって、前記エキスパートユーザが焦点を合わせた前記提示されたデータの部分を示し且つ１つ以上のデータ分類領域を含むアテンションマップを、前記ユーザ感覚入力に基づき生成することと、
前記トレーナーサーバによって、前記エキスパートユーザの自然言語入力に基づく自然言語入力ラベルにより前記アテンションマップに注釈を付すことと、
前記トレーナーサーバによって、前記ユーザ感覚入力に基づきニューラルネットワークを訓練することであり、実験データ処理機能のためにニューラルネットワーク情報及び処理されたユーザ感覚入力を微分メモリサブシステムへ送ることを含む前記訓練することと、
前記トレーナーサーバによって、エンドユーザアプリケーションの特異なアクティビティのために最適化される前記訓練されたニューラルネットワークに基づくモデルを生成することと、
前記トレーナーサーバによって、前記エンドユーザアプリケーションの出力目標のためのアプリケーションプログラムを供給することと、
前記トレーナーサーバによって、前記出力目標に、前記アプリケーションプログラムを介して、前記特異なアクティビティを検出し是正するよう指示することと
を有する方法。
前記エキスパートユーザからユーザ入力を受けることを更に有し、
前記ユーザ入力は、前記提示されたデータが発せられるデータ源の選択を含み、且つ、前記出力目標の選択を含む、
請求項１１に記載の方法。
前記微分メモリサブシステムは、前記トレーナーサーバの一次メモリから物理的に離れておりネットワーク接続されている、
請求項１１に記載の方法。
前記エキスパートユーザからセッショントークン識別子を受けることと、
前記セッショントークンに基づき前記エキスパートユーザを認証することと、
前記エキスパートユーザから得られた情報をブロックチェーンスタイルの台帳に格納することと
を更に有する
請求項１１に記載の方法。
前記アプリケーションプログラムの品質チェックを可能にすることを更に有し、
前記品質チェックは、
第２エキスパートユーザから第２セッショントークン識別子を受けることと、
前記第２セッショントークンに基づき前記第２エキスパートユーザを認証することと、
前記第２エキスパートユーザの品質チェックセッションにタイムスタンプを付すことと、
前記第２エキスパートユーザから得られた情報をブロックチェーンスタイルの台帳に格納することと
を含む、
請求項１１に記載の方法。
前記エキスパートユーザは、農業専門家を含み、
前記アテンションマップは、ヒートマップ、グリッドをオーバーレイされた画像、又はオブジェクトセグメンテーション選択を含み、
前記ユーザ感覚入力は、視線センサによって捕捉される前記農業専門家の視線を表すユーザ視線データと、タッチスクリーンにおいて受け取られる物理接触を表す物理接触データとを含み、
前記農業専門家の自然言語入力は、音声入力又はタッチ機能を含む、
請求項１１に記載の方法。
前記エキスパートユーザは、セキュリティ専門家を含み、
前記アテンションマップは、過去の映像を含み、
前記ユーザ感覚入力は、視線センサによって捕捉される前記セキュリティ専門家の視線を表すユーザ視線データと、情緒反応を表す脳波図及びカメラとを含み、
前記セキュリティ専門家の自然言語入力は、音声入力を含む、
請求項１１に記載の方法。
前記出力目標は、ドローン、カメラ、又は拡張現実ヘッドセットを含む、
請求項１１に記載の方法。
前記１つ以上のセンサは、ＲＢＧｄカメラ、ジェスチャ捕捉センサ、バイオメトリック捕捉システム、ウェアラブルセンサシステム、デジタルＩ／Ｏインターフェイス、ウェアラブルリング型入力、キーボード、マウス、感情認識システム、視線追跡システム、ビデオインターフェイス、マイクロホン、ブレインコンピュータインターフェイス、触覚インターフェイス、ワイヤレス受信器、高解像度カメラ、温度又は赤外線カメラ、光センサ、ＧＰＳ、ワイヤレス送信器、３６０度カメラ、デジタル光学インターフェイス、及びバーチャルリアリティインターフェイスの組み合わせの１つ以上を含む、
請求項１１に記載の方法。
プロセッサによって実行される場合に該プロセッサに請求項１１に記載の方法を実行させる実行可能コードを記憶している非一時的なコンピュータ読み出し可能な媒体。