JP2012108950A - 有用な情報を自律的にブートストラッピングする装置 - Google Patents
有用な情報を自律的にブートストラッピングする装置 Download PDFInfo
- Publication number
- JP2012108950A JP2012108950A JP2012034425A JP2012034425A JP2012108950A JP 2012108950 A JP2012108950 A JP 2012108950A JP 2012034425 A JP2012034425 A JP 2012034425A JP 2012034425 A JP2012034425 A JP 2012034425A JP 2012108950 A JP2012108950 A JP 2012108950A
- Authority
- JP
- Japan
- Prior art keywords
- neural network
- artificial neural
- self
- learning
- learning artificial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
【解決手段】 発見システム内の訓練を実行し、自身に適用される各種の形式の摂動を通じて新たな出力パターンを生成すべく刺激を受けるニューラル・ネットワークと、同様に当該システム内のその場で訓練を実行し、前者のネットワーク内でこれらのパターンのうち、より有用またはより貴重なパターンの強化学習を起動しつつ、そのような新たなパターンに自身の有用性または価値を関連付けることができる評価機能ニューラル・ネットワークとを用いる発見システム。後者と前者の自己学習人工ニューラル・ネットワーク間のオプションのフィードバック機構を用いて、有用な概念または行動計画に向けて本システムの収束を加速する。
【選択図】 図5
Description
発明の技術分野
を介して特定され、
当該クラスコンストラクタは、
と呼ばれる。
次いで、ネットワークは命令
により初期化され、3はこれが3層の多層パーセプトロンであることを示す。
ここにTRUEブーリアン・フラグは訓練が実行されている(非適応型のフィードフォワード・パッセージとは対照的に)ことを示し、dInPatternは訓練入力パターンを含む二重配列、dOutPatternは目標出力パターンを表わす二重配列である、およびdNetOutPatternはネットワークの実際の出力パターンを受信する同様の二重配列である。
dInPatternを訓練入力パターンとしてだけでなく、目標訓練出力パターンとしても用いている。
STANNOクラスの訓練方法が、任意の逆伝搬サイクルに関するdoubleの二乗平均平方根(RMS)訓練誤差を返す点に注意されたい。
警察スケッチ画家アプリケーション
白紙状態からの学習を介したロボット牽引技術
ロボット経路計画策定
ここで、x0およびy0は目標の質量中心座標、xおよびyはロボットのオンボードカメラ、およびγは目標の正確な位置x=x0、y=y0における領域値Ztargetの特異性を回避するための減衰定数である。
フォビエーション的システム
Claims (54)
- 自己学習人工ニューラル・ネットワーク型発見装置であって、
摂動された際にパターンを生成することが可能な第1の自己学習人工ニューラル・ネットワークと、
前記第1の自己学習人工ニューラル・ネットワークにさまざまな摂動度を与える手段と、
前記生成されたパターンを前記第1の自己学習人工ニューラル・ネットワークから受信すべく前記第1の自己学習人工ニューラル・ネットワークに関連付けられた第2の自己学習人工ニューラル・ネットワークと、
前記第1の自己学習人工ニューラル・ネットワークの前記生成されたパターンを概念として実装する手段と、
前記概念の効果を評価する手段と、
前記生成されたパターンのいずれかが肯定的な効果を示す場合、前記第1の自己訓練人工ニューラル・ネットワーク内で強化学習を起動する手段と、
前記第1の自己学習人工ニューラル・ネットワークの前記生成されたパターンの少なくとも1つと、前記生成されたパターンの前記効果との関係を前記第2ネットワーク内に組み込むように前記第2の自己学習人工ニューラル・ネットワーク内で強化学習を起動する手段とを含む装置。 - 前記第2の人工ニューラル・ネットワークからの出力パターンに基づいて前記第1の人工ニューラル・ネットワーク内で摂動を制御する手段を更に含む、請求項1に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記概念の効果を評価する前記手段が否定的な効果を示す場合、前記第1および第2の自己学習人工ニューラル・ネットワークのうち少なくとも1つの訓練を中止する手段を更に含む、請求項1に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 自己学習人工ニューラル・ネットワーク型発見装置であって、
パターンを生成することが可能な第1の人工ニューラル・ネットワーク部と、
前記第1の人工ニューラル・ネットワークにさまざまな摂動度を与える手段と、
前記第1の自己学習人工ニューラル・ネットワークの前記生成されたパターンを概念として実装する手段と、
前記概念の効果を評価する手段と、
前記第1の自己訓練人工ニューラル・ネットワーク内で肯定的な効果を示す前記生成されたパターンの1つの強化学習を起動する手段とを含む装置。 - 前記概念の効果を評価する前記手段が否定的な効果を示す場合、前記第1の自己学習人工ニューラル・ネットワークの訓練を中止する手段を更に含む、請求項4に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記概念を評価する前記手段が、前記第1の人工ニューラル・ネットワークの前記生成されたパターンの人間による評価を含む、請求項4に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記概念を評価する前記手段が少なくとも1つのセンサを含む、請求項4に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記センサがソナー装置である、請求項7に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記センサがカメラである、請求項7に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記概念の前記効果を評価する前記手段が、少なくとも部分的にはランダムなプロセスに支配される、請求項4に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記概念の前記効果を評価する前記手段が、規則に基づくアルゴリズムおよびモデルに基づくアルゴリズムからなる群の1つに支配される、請求項4に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記第1のネットワークから生成されたパターンを受信すべく前記第1の人工ニューラル・ネットワークに関連付けられた、少なくとも第2の自己学習人工ニューラル・ネットワークと、
前記第1の自己学習人工ニューラル・ネットワークの前記生成されたパターンと前記生成されたパターンの前記効果との間の関係を前記第2のネットワーク内に組み込むべく、前記第2の自己学習人工ニューラル・ネットワークにおいて強化学習を起動する手段とを更に含む、請求項4に記載の自己学習人工ニューラル・ネットワーク型発見装置。 - 自己学習人工ニューラル・ネットワーク型発見装置であって、
各々の人工ニューラル・ネットワークがそれに対するさまざまな摂動度に応答してパターンを生成することができる、自己学習人工ニューラル・ネットワークのアレイと、
前記自己学習人工ニューラル・ネットワークの少なくとも1つにさまざまな摂動度を与える手段であって、前記自己学習人工ニューラル・ネットワークの第2のものが第1の摂動された人工ニューラル・ネットワークから生成されたパターンを受信するように、少なくとも第1の摂動された自己学習人工ニューラル・ネットワークが、少なくとも第2の前記自己学習人工ニューラル・ネットワークに関連付けられる手段と、
少なくとも前記第1の摂動された自己訓練人工ニューラル・ネットワークの前記生成されたパターンを概念として実装する手段と、
前記概念の効果を評価する手段と、
前記生成されたパターンが肯定的な効果を示す場合、少なくとも前記第1の摂動された自己訓練人工ニューラル・ネットワーク内で強化学習を起動する手段と、
前記第1の摂動された自己学習人工ニューラル・ネットワークの前記生成されたパターンの少なくとも1つと前記生成されたパターンの前記効果との間の関係を前記第2のネットワーク内に組み込むべく、前記第2の自己学習人工ニューラル・ネットワークにおいて強化学習を起動する手段とを含む装置。 - 前記生成されたパターンが、前記第1の摂動された人工ネットワークおよび少なくとも第2の摂動された自己学習人工ニューラル・ネットワークにより生成されたパターンの組合せである、請求項13に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記第1の人工ニューラル・ネットワークから前記生成されたパターンを受信するように前記第1の人工ニューラル・ネットワークに関連付けられた少なくとも1つの規則ベースのアルゴリズムかを更に含む、請求項4に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記第2の人工ニューラル・ネットワークが、前記入力パターンと前記第1の自己学習人工ニューラル・ネットワークの前記生成されたパターンとを比較すべく動作可能である、請求項1に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記アルゴリズムが、前記入力パターンと前記第1の人工ニューラル・ネットワークの前記生成されたパターンとを比較すべく動作可能である、請求項11に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記概念の前記効果を評価する前記手段が、少なくとも1つの客観的な基準の関数である、請求項4に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記概念の前記効果を評価する前記手段が、少なくとも1つの主観的な基準の関数である、請求項4に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記装置がロボット機構に組み込まれる、請求項4に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記装置が仮想的なロボット・システムに組み込まれる、請求項4に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記装置がシミュレーションされたロボット・システムに組み込まれる、請求項4に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記装置が機械視覚システムに組み込まれる、請求項4に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記第1の人工ニューラル・ネットワークが自己連想人工ニューラル・ネットワークである、請求項4に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記第1の人工ニューラル・ネットワークがグループ・メンバシップ・フィルタとして動作可能である、請求項24に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記第2の人工ニューラル・ネットワークがヘテロ連想人工ニューラル・ネットワークである、請求項1に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 経路計画に特化した自己学習人工ニューラル・ネットワーク型発見装置であって、
前記第1のネットワークに与えられた摂動に応答して生成されるパターンを生成でき、前記生成されたパターンが環境を通る潜在的な経路を表わす、第1の自己学習人工ニューラル・ネットワークと、
前記第1の自己学習人工ニューラル・ネットワークにさまざまな摂動度を与える手段と、
前記潜在的経路に関連付けられたコストを計算する手段と、
前記コストを計算する手段に環境入力を提供する手段であって、前記計算手段が前記環境入力を用いて前記コストを生成する手段と、を含み、
前記コストを計算する手段が、前記摂動された第1のニューラル・ネットワークにより生成された前記潜在的経路から前記環境を通る最小コスト経路を決定する装置。 - 前記計算手段が第2の人工ニューラル・ネットワークを含む、請求項27に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記計算手段が規則ベースのアルゴリズムを含む、請求項27に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 低コストである前記経路が、連続した訓練により前記第1の自己訓練人工ニューラル・ネットワーク内で再吸収される、請求項27に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記潜在的経路の前記コストに基づいて、前記潜在的経路のうち1つの前記第1の自己訓練人工ニューラル・ネットワーク内で強化学習を起動する手段を更に含む、請求項27に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記摂動の大きさが前記コストに基づいている、請求項27に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記環境入力が、動作インピーダンスが低いおよび高い領域の識別を含み、前記計算手段が更に前記低いおよび高い動作インピーダンス領域のマップを含むナビゲーション領域を計算すべく動作可能である、請求項27に記載の自己学習人工ニューラル・ネットワーク型装置。
- 前記第1の自己学習人工ニューラル・ネットワークが、環境を通る最小コスト経路を表わす自身の支配的記憶を生成すべくさまざまな摂動度を介して呼び掛けられる、請求項27に記載の自己学習人工ニューラル・ネットワーク型装置。
- 前記第1の自己学習人工ニューラル・ネットワークが、グループ・メンバシップ・フィルタを含む、請求項27に記載の自己学習人工ニューラル・ネットワーク型装置。
- 人工ニューラル・ネットワーク型発見装置であって、
自身に与えられた摂動に応答してパターンを生成可能な第1の人工ニューラル・ネットワークであって、前記生成されたパターンが潜在的な行動計画を表わす、第1の人工ニューラル・ネットワークと、
前記第1の人工ニューラル・ネットワークにさまざまな摂動度を与える手段と、
前記潜在的な行動計画に関連付けられたコストを計算する手段と、
前記コスト計算手段へ環境入力を提供する手段であって、前記計算手段が前記環境入力を用いて前記コストを生成する手段と、を含み、
前記コストを計算する手段が、前記摂動された第1のニューラル・ネットワークにより生成された動作の前記潜在的計画から、最小コストの行動計画を決定する装置。 - 前記計算手段が更に、前記潜在的な行動計画の前記コストに基づいてナビゲーション領域を計算すべく動作可能である、請求項36に記載の人工ニューラル・ネットワーク型装置。
- 前記第1の人工ニューラル・ネットワークが自己学習人工ニューラル・ネットワークである、請求項36に記載の人工ニューラル・ネットワーク型装置。
- 自己学習人工ニューラル・ネットワーク型発見装置であって、
自身に与えられた摂動に応答してパターンを生成することが可能な第1の自己学習人工ニューラル・ネットワークと、
前記第1の自己学習人工ニューラル・ネットワークをさまざまな摂動度を与える手段と、
前記生成されたパターンの値を決定する手段と、
前記第1の自己学習人工ニューラル・ネットワーク内で目標値を有する前記生成されたパターンの少なくとも1つの強化学習を起動する手段とを含む装置。 - 前記第1の人工ニューラル・ネットワーク内における強化学習の少なくとも1つのサイクルの後で、前記生成されたパターンの記憶を再構築すべく摂動の適用を通じて前記第1の人工ニューラル・ネットワークに呼び掛ける手段を更に含む、請求項39に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記第1の人工ニューラル・ネットワーク内における強化学習の少なくとも1つのサイクルの後で、前記生成されたパターンの劣化した記憶を生成すべく前記第1の自己学習人工ニューラル・ネットワークにさまざまな摂動度を与える手段を更に含む、請求項39に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記劣化した記憶が、強化学習の少なくとも1つのサイクルを通じて以前に吸収された概念から派生した概念を表わす、請求項41に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記評価手段が、前記第1の人工ニューラル・ネットワークから前記生成されたパターンを受信すべく第2の人工ニューラル・ネットワークを含む、請求項39に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 前記評価手段が規則ベースのアルゴリズムを含む、請求項39に記載の自己学習人工ニューラル・ネットワーク型発見装置。
- 物体検出用の自己学習人工ニューラル・ネットワーク型装置であって、
環境のセンサ視野を提供する手段と、
注視ウインドウの各々の位置が前記環境の前記センサ視野の少なくとも1つを表わす注視ウインドウを移動する手段と、
自身への入力パターンが前記センサ視野の内容からなり、且つ前記センサ視野の前記内容の認識を示す認識尺度を生成すべく動作する第1の自己学習人工ニューラル・ネットワークとを含む装置。 - 前記第1の自己学習人工ニューラル・ネットワークが、前記注視ウインドウが探索対象物体の一部に遭遇した場合のみ前記注視ウインドウの内容を学習する、請求項45に記載の自己学習人工ニューラル・ネットワーク装置。
- 前記物体が、周囲環境を意図的に中性化することにより、前記周囲環境から区別される、請求項46に記載の自己学習人工ニューラル・ネットワーク装置。
- 前記物体が、前記物体を周囲環境からマスキングすることにより、前記周囲環境から区別される、請求項46に記載の自己学習人工ニューラル・ネットワーク装置。
- 注視ウインドウを移動させる前記手段が、さまざまな摂動度と共に反復的に実行すべく動作する第2の自己学習自己連想人工ニューラル・ネットワークを含み、
前記第1の人工ニューラル・ネットワークにより生成された前記認識尺度に基づいて、前記第2の人工ニューラル・ネットワークへの摂動を調整する手段を更に含む、請求項45に記載の自己学習人工ニューラル・ネットワーク装置。 - 前記第1のネットワークが前記センサ視野の前記内容の少なくとも一部を識別した場合に前記第2の人工ニューラル・ネットワークにおいて強化学習が生じ、前記強化学習が前記内容の前記識別された部分に関連付けられた前記センサ視野の位置に関係している、請求項49に記載の自己学習人工ニューラル・ネットワーク装置。
- 前記強化学習が生じた後で、摂動を用いて前記第2のネットワークの支配的記憶について前記第2のネットワークに呼び掛ける、請求項50に記載の自己学習人工ニューラル・ネットワーク装置。
- 前記注視ウインドウを動かす前記手段が、ラスタ・アルゴリズムおよび線形スキャン・アルゴリズムからなる群のうちの1つを含む、請求項45に記載の自己学習人工ニューラル・ネットワーク装置。
- 人工ニューラル・ネットワーク型装置であって、
特定のグループまたはジャンルに属する共通性を有するパターンについて訓練された第1の自己連想人工ニューラル・ネットワークと、
前記第1のネットワークに供給されたパターンを前記第1のネットワークにより生成されたパターンと比較して前記第1の人工ニューラル・ネットワークに関連付けられた再構築誤差を生成すべく動作する比較部とを含み、
前記再構築誤差が、前記グループまたはジャンルに属するパターンの認識尺度を表わす装置。 - 人工ニューラル・ネットワーク型ナビゲーション領域生成システムであって、
第1の人工ニューラル・ネットワークと、
前記第1の人工ニューラル・ネットワークへの環境センサ入力を提供する手段とを含み、
前記第1のネットワークが、前記環境内の座標において領域値を含むナビゲーション領域を生成すべく動作するシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67885605P | 2005-05-07 | 2005-05-07 | |
US60/678,856 | 2005-05-07 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008511241A Division JP2008542859A (ja) | 2005-05-07 | 2006-05-08 | 有用な情報を自律的にブートストラッピングする装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012108950A true JP2012108950A (ja) | 2012-06-07 |
Family
ID=37102062
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008511241A Pending JP2008542859A (ja) | 2005-05-07 | 2006-05-08 | 有用な情報を自律的にブートストラッピングする装置 |
JP2011201753A Pending JP2012003782A (ja) | 2005-05-07 | 2011-09-15 | 有用な情報を自律的にブートストラッピングする装置 |
JP2012034425A Pending JP2012108950A (ja) | 2005-05-07 | 2012-02-20 | 有用な情報を自律的にブートストラッピングする装置 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008511241A Pending JP2008542859A (ja) | 2005-05-07 | 2006-05-08 | 有用な情報を自律的にブートストラッピングする装置 |
JP2011201753A Pending JP2012003782A (ja) | 2005-05-07 | 2011-09-15 | 有用な情報を自律的にブートストラッピングする装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7454388B2 (ja) |
EP (2) | EP1894150A2 (ja) |
JP (3) | JP2008542859A (ja) |
WO (1) | WO2006122030A2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016522497A (ja) * | 2013-05-24 | 2016-07-28 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 連続的構成機能を備える学習デバイス |
JP2019200485A (ja) * | 2018-05-14 | 2019-11-21 | ヤフー株式会社 | 出力装置、出力方法、出力プログラム及び出力システム |
US11669711B2 (en) | 2018-05-07 | 2023-06-06 | Shanghai Sensetime Intelligent Technology Co., Ltd | System reinforcement learning method and apparatus, and computer storage medium |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4858832B2 (ja) * | 2006-08-17 | 2012-01-18 | 富士ゼロックス株式会社 | 駆動切換え機構及びこれを有する画像形成装置 |
US8010471B2 (en) * | 2007-07-13 | 2011-08-30 | Microsoft Corporation | Multiple-instance pruning for learning efficient cascade detectors |
US7822696B2 (en) * | 2007-07-13 | 2010-10-26 | Microsoft Corporation | Histogram-based classifiers having variable bin sizes |
US7890443B2 (en) * | 2007-07-13 | 2011-02-15 | Microsoft Corporation | Learning classifiers using combined boosting and weight trimming |
US9015091B2 (en) | 2011-11-09 | 2015-04-21 | Qualcomm Incorporated | Methods and apparatus for unsupervised neural replay, learning refinement, association and memory transfer: structural plasticity and structural constraint modeling |
US9443190B2 (en) | 2011-11-09 | 2016-09-13 | Qualcomm Incorporated | Methods and apparatus for neural pattern sequence completion and neural pattern hierarchical replay by invoking replay of a referenced neural pattern |
US9424511B2 (en) | 2011-11-09 | 2016-08-23 | Qualcomm Incorporated | Methods and apparatus for unsupervised neural component replay by referencing a pattern in neuron outputs |
US9424513B2 (en) | 2011-11-09 | 2016-08-23 | Qualcomm Incorporated | Methods and apparatus for neural component memory transfer of a referenced pattern by including neurons to output a pattern substantially the same as the referenced pattern |
CN103366782B (zh) * | 2012-04-06 | 2014-09-10 | 腾讯科技(深圳)有限公司 | 在虚拟形象上自动播放表情的方法和装置 |
US11495213B2 (en) | 2012-07-23 | 2022-11-08 | University Of Southern California | Noise speed-ups in hidden markov models with applications to speech recognition |
US10002430B1 (en) | 2013-06-04 | 2018-06-19 | Hrl Laboratories, Llc | Training system for infield training of a vision-based object detector |
US10423875B2 (en) | 2014-01-07 | 2019-09-24 | Stephen L. Thaler | Electro-optical device and method for identifying and inducing topological states formed among interconnecting neural modules |
US11256982B2 (en) * | 2014-07-18 | 2022-02-22 | University Of Southern California | Noise-enhanced convolutional neural networks |
US20160034814A1 (en) * | 2014-08-01 | 2016-02-04 | University Of Southern California | Noise-boosted back propagation and deep learning neural networks |
WO2017004626A1 (en) * | 2015-07-01 | 2017-01-05 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and methods for providing reinforcement learning in a deep learning system |
CN106845507A (zh) * | 2015-12-07 | 2017-06-13 | 北京航天长峰科技工业集团有限公司 | 一种基于注意力的分块化目标检测方法 |
US10949737B2 (en) | 2016-07-13 | 2021-03-16 | Samsung Electronics Co., Ltd. | Method for neural network and apparatus performing same method |
CN115338859A (zh) | 2016-09-15 | 2022-11-15 | 谷歌有限责任公司 | 机器人操纵的深度强化学习 |
JP6587761B2 (ja) * | 2017-02-09 | 2019-10-09 | 三菱電機株式会社 | 位置制御装置及び位置制御方法 |
CN107065881B (zh) * | 2017-05-17 | 2019-11-08 | 清华大学 | 一种基于深度强化学习的机器人全局路径规划方法 |
CN107832850B (zh) * | 2017-10-27 | 2018-10-23 | 合肥工业大学 | 对抗环境下无人机占位决策的矩阵博弈方法及装置 |
CN108153200A (zh) * | 2017-12-29 | 2018-06-12 | 贵州航天南海科技有限责任公司 | 一种三层神经网络路径规划的立体车库控制方法 |
US11568236B2 (en) | 2018-01-25 | 2023-01-31 | The Research Foundation For The State University Of New York | Framework and methods of diverse exploration for fast and safe policy improvement |
CN108415254B (zh) * | 2018-03-12 | 2020-12-11 | 苏州大学 | 基于深度q网络的废品回收机器人控制方法 |
US11457244B2 (en) * | 2018-04-09 | 2022-09-27 | Nokia Technologies Oy | Apparatus, a method and a computer program for video coding and decoding |
CN108803313B (zh) * | 2018-06-08 | 2022-07-12 | 哈尔滨工程大学 | 一种基于海流预测模型的路径规划方法 |
CN108762281A (zh) * | 2018-06-08 | 2018-11-06 | 哈尔滨工程大学 | 一种基于记忆关联强化学习的嵌入式实时水下机器人智能决策方法 |
CN108924897A (zh) * | 2018-06-30 | 2018-11-30 | 北京工业大学 | 一种基于深度强化学习算法的移动sink路径规划方法 |
CN109697458A (zh) * | 2018-11-27 | 2019-04-30 | 深圳前海达闼云端智能科技有限公司 | 控制设备移动的方法、装置、存储介质及电子设备 |
CN109445437A (zh) * | 2018-11-30 | 2019-03-08 | 电子科技大学 | 一种无人电动车的路径规划方法 |
CN109754070B (zh) * | 2018-12-28 | 2022-10-21 | 东莞钜威软件科技有限公司 | 基于神经网络的绝缘阻值计算方法及电子设备 |
US11568267B2 (en) * | 2020-03-12 | 2023-01-31 | International Business Machines Corporation | Inducing creativity in an artificial neural network |
CN111811532B (zh) * | 2020-07-02 | 2022-03-25 | 浙江大学 | 基于脉冲神经网络的路径规划方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06259542A (ja) * | 1993-03-08 | 1994-09-16 | A T R Shichokaku Kiko Kenkyusho:Kk | パターン生成装置 |
JPH08225258A (ja) * | 1995-02-21 | 1996-09-03 | Fujitec Co Ltd | エレベータ呼び割り当て用ニューラルネットの学習方法 |
JPH10507553A (ja) * | 1994-10-13 | 1998-07-21 | エル ターラー、ステフエン | 有用な情報の自律的発生装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5640494A (en) * | 1991-03-28 | 1997-06-17 | The University Of Sydney | Neural network with training by perturbation |
US5692107A (en) | 1994-03-15 | 1997-11-25 | Lockheed Missiles & Space Company, Inc. | Method for generating predictive models in a computer system |
JPH07271964A (ja) * | 1995-02-06 | 1995-10-20 | Takata Kogyosho:Kk | 人相判定方法 |
US5845271A (en) | 1996-01-26 | 1998-12-01 | Thaler; Stephen L. | Non-algorithmically implemented artificial neural networks and components thereof |
JPH09212798A (ja) * | 1996-01-30 | 1997-08-15 | Mitsubishi Electric Corp | 移動体の経路生成方法 |
AU3477397A (en) * | 1996-06-04 | 1998-01-05 | Paul J. Werbos | 3-brain architecture for an intelligent decision and control system |
JP3860867B2 (ja) * | 1996-10-25 | 2006-12-20 | 株式会社野村総合研究所 | 地理情報に基づくスケジュール作成装置 |
US7113932B2 (en) | 2001-02-07 | 2006-09-26 | Mci, Llc | Artificial intelligence trending system |
JP3682533B2 (ja) * | 2002-05-30 | 2005-08-10 | 独立行政法人情報通信研究機構 | 画像識別方法及び画像認識モデル |
-
2006
- 2006-05-08 JP JP2008511241A patent/JP2008542859A/ja active Pending
- 2006-05-08 US US11/429,803 patent/US7454388B2/en active Active
- 2006-05-08 EP EP06752398A patent/EP1894150A2/en not_active Withdrawn
- 2006-05-08 WO PCT/US2006/017731 patent/WO2006122030A2/en active Application Filing
- 2006-05-08 EP EP11002179A patent/EP2360629A3/en not_active Ceased
-
2011
- 2011-09-15 JP JP2011201753A patent/JP2012003782A/ja active Pending
-
2012
- 2012-02-20 JP JP2012034425A patent/JP2012108950A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06259542A (ja) * | 1993-03-08 | 1994-09-16 | A T R Shichokaku Kiko Kenkyusho:Kk | パターン生成装置 |
JPH10507553A (ja) * | 1994-10-13 | 1998-07-21 | エル ターラー、ステフエン | 有用な情報の自律的発生装置 |
JPH08225258A (ja) * | 1995-02-21 | 1996-09-03 | Fujitec Co Ltd | エレベータ呼び割り当て用ニューラルネットの学習方法 |
Non-Patent Citations (2)
Title |
---|
CSNG200000975004; 高秀 誠 Makoto TAKAHIDE: '不完全/不確実情報処理利用技術' 電気学会研究会資料 第99-1/10巻, 19990319, 第23頁, 社団法人電気学会 * |
JPN6014005000; 高秀 誠 Makoto TAKAHIDE: '不完全/不確実情報処理利用技術' 電気学会研究会資料 第99-1/10巻, 19990319, 第23頁, 社団法人電気学会 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016522497A (ja) * | 2013-05-24 | 2016-07-28 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 連続的構成機能を備える学習デバイス |
US11669711B2 (en) | 2018-05-07 | 2023-06-06 | Shanghai Sensetime Intelligent Technology Co., Ltd | System reinforcement learning method and apparatus, and computer storage medium |
JP2019200485A (ja) * | 2018-05-14 | 2019-11-21 | ヤフー株式会社 | 出力装置、出力方法、出力プログラム及び出力システム |
Also Published As
Publication number | Publication date |
---|---|
JP2008542859A (ja) | 2008-11-27 |
US7454388B2 (en) | 2008-11-18 |
US20070011119A1 (en) | 2007-01-11 |
EP2360629A3 (en) | 2012-04-11 |
EP1894150A2 (en) | 2008-03-05 |
EP2360629A2 (en) | 2011-08-24 |
JP2012003782A (ja) | 2012-01-05 |
WO2006122030A3 (en) | 2007-11-29 |
WO2006122030A2 (en) | 2006-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2012108950A (ja) | 有用な情報を自律的にブートストラッピングする装置 | |
Wang et al. | Robust imitation of diverse behaviors | |
Das et al. | Model-based inverse reinforcement learning from visual demonstrations | |
Chebotar et al. | Path integral guided policy search | |
Rosenblum et al. | An improved radial basis function network for visual autonomous road following | |
Weber et al. | Robot docking with neural vision and reinforcement | |
Jain et al. | From pixels to legs: Hierarchical learning of quadruped locomotion | |
Azimirad et al. | A consecutive hybrid spiking-convolutional (CHSC) neural controller for sequential decision making in robots | |
Tan et al. | A hierarchical framework for quadruped locomotion based on reinforcement learning | |
Saeedvand et al. | Hierarchical deep reinforcement learning to drag heavy objects by adult-sized humanoid robot | |
CN113379027A (zh) | 一种生成对抗交互模仿学习方法、系统、存储介质及应用 | |
Yin et al. | Learning nonlinear dynamical system for movement primitives | |
Silveira et al. | Natural steering behaviors for virtual pedestrians | |
Seo et al. | Learning to walk by steering: Perceptive quadrupedal locomotion in dynamic environments | |
Dindo et al. | An adaptive probabilistic approach to goal-level imitation learning | |
Wang et al. | Encoder–decoder recurrent network model for interactive character animation generation | |
Atoofi et al. | Learning of central pattern generator coordination in robot drawing | |
Wright et al. | Intelligent approaches in locomotion | |
Shukla et al. | Augmented-SVM: Automatic space partitioning for combining multiple non-linear dynamics | |
Dapper et al. | Simulating pedestrian behavior with potential fields | |
Gonçalves et al. | Defining behaviors for autonomous agents based on local perception and smart objects | |
Kajic et al. | A biologically inspired model for coding sensorimotor experience leading to the development of pointing behaviour in a humanoid robot | |
Tan et al. | A Hierarchical Framework for Quadruped Omnidirectional Locomotion Based on Reinforcement Learning | |
Hu et al. | Hybrid learning architecture for fuzzy control of quadruped walking robots | |
Saputra et al. | Topological based Environmental Reconstruction for Efficient Multi-Level Control of Robot Locomotion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120321 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120321 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130409 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130628 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130703 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131009 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140205 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20140507 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20140512 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20140605 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20140610 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20141031 |