JP5256215B2

JP5256215B2 - 情報を選択するための方法

Info

Publication number: JP5256215B2
Application number: JP2009550734A
Authority: JP
Inventors: ハッリ・ヴァルポラ; アンッティ・イリ−クレコラ
Original assignee: Zenrobotics Oy
Current assignee: Zenrobotics Oy
Priority date: 2007-02-23
Filing date: 2008-02-22
Publication date: 2013-08-07
Anticipated expiration: 2028-02-22
Also published as: PT2126801E; WO2008102052A2; PL2126801T3; US20100088259A1; EP2126801B1; FI20070159A0; WO2008102052B1; ES2429214T3; DK2126801T3; JP2010519642A; US8332336B2; WO2008102052A3; EP2126801A2

Description

本発明の目的は、例えば制御、パターン認識、または予測のために適した方法であって、情報の集積化および選択ならびにその表現の学習に使用される方法である。

コンピュータビジョンや自律ロボットの制御などといった多数の用途において、入力信号または観察データ中の情報を取り扱う必要があり、この目的のために、いくつかの異なる種類の方法が開発されている。

例えば、そのようないくつかの方法が、機械学習および統計分析において提示されており、情報の表現を学習するために使用することができ、換言すると、情報の表現を定めるパラメータの適応が、観察データにもとづいて行われる。適応の目的は、多くの場合、例えばパターン認識、制御、または相応の活動に使用することができる有用な特徴を観察から見つけることにある。例えば、独立成分分析が、観察データから入力信号を記述する特徴を発見するために使用される。これらの方法の多くにおいては、情報処理ユニットが、入力ベクトルにもとづいて、入力ベクトルの特性を記述する特徴ベクトルを形成することが一般的であり、特徴ベクトルの構成要素の意味、すなわち特徴が、適応の結果として変化する。カルマン（Ｋａｌｍａｎ）フィルタの状態ベクトルを、特徴ベクトルと考えることができるため、状態ベクトルが、入力ベクトル内の情報を記述する。

これら上述の方法の多くは、確率が確信の程度を記述し、ベイズ規則が異なるソースからの情報をどのように集積化するかを指定するベイズ統計に照らして解釈することが可能である。例えば、状態ベクトルの値がカルマンフィルタの場合において計算されるとき、観察信号から得られる情報および状態ベクトルの以前の値が組み合わせられる。ベイズ統計に関しては、以前の状態ベクトルを使用することによって計算される事前分布および観察信号にもとづいて計算される尤度が、種々の状態ベクトル値の確率を記述する状態ベクトルの事後分布へと組み合わせられる。事後分布は、カルマンフィルタの場合には、ガウス分布に従い、事後平均および共分散によって表わされる。他のいくつかの方法では、事後不確実性がまったく表現されないが、それでもなお、これらの方法を、ベイズ法の近似と解釈することができる。

これらの方法において、特徴ベクトルの値が観察信号を記述するが、情報が先行の情報から集積化もされていることに、注目する価値がある。

パターン認識は、パターンを認識するモデルまたはシステムを生成することを目的とする情報にもとづく機械学習の一部である。パターン認識は、例えば情報技術およびロボット工学に適用されるが、医療技術および人間−コンピュータの相互作用の研究にも適用される。パターン認識システムは、測定、前処理、特徴抽出、および分類という４つの工程を有するプロセスとして定義される。

第１の工程において、必要とされるデータが、主として物理的変数の測定および得られたアナロジカルデータのデジタル形式への変換によって取得される。第２の工程において、データが、多くの場合、フィルタ処理や主成分分析などといったさまざまな種類のデジタル信号処理方法を使用して前処理される。第３の工程において、前処理済みの測定データが、特徴空間へと写像される。この工程において、データが情報へと変換されると見ることができる。第４の工程において、特徴空間へと写像されたサンプルが、分類器を使用することによって２つ以上のカテゴリへと分類される。

手書き文字の認識など、難しいパターン認識のタスクにおいては、特徴ベクトルの処理が階層的に組織化され、多くの場合、複数の処理ユニットが各レベルに存在し、それらが階層の下位のレベルのユニットの一部から入力として特徴ベクトルを得るようなやり方で、階層的に組織化される。そのようなシステムにおいては、処理ユニットが、コンテクストとして、上位のユニットから特徴を得ることができ、おそらくは同じレベルのユニットからも特徴を得ることができる。階層を使用する利点は、接続の数を少なく保ったままで、大量の入力信号からの情報をなんとか集積化できる点にある。そのような階層モデルの古典的な例が、ＦｕｋｕｓｈｉｍａによるＮｅｏｃｏｇｎｉｔｒｏｎ（Ｆｕｋｕｓｈｉｍａ、１９８０）である。

多数の用途において、観察データが、使用されている処理ユニットが表現できるよりも多くの統計的構造を含んでいる状況に直面する。そのような場合、タスクにとって有用な情報を選択する必要がある。モデルの適応を行って、タスクにとって有用な情報がモデルによって表現される特徴に記述されるようにすることが、しばしば必要になる。

いくつかの場合には、機械学習法である教師あり学習が、有用な特徴の制御された選択に適している。制御された学習は、統計における回帰に相当する。回帰の目標は、或る１つの入力ベクトルから、目標ベクトルと呼ばれる別のベクトルへの写像を発見することにある。入力ベクトルから目標ベクトルへの写像がいくつかの工程にて行われる場合、中間的結果を、とくにはモデルの構造が中間的結果の次元が入力および目標ベクトルの次元よりも小さいようなやり方で選択される場合に、特徴ベクトルと解釈することができる（Ｈｅｃｈｔ−Ｎｉｅｌｓｅｎ、１９９３）。最も単純な事例では、２つの連続的な線形写像を使用することができ、結果は、正準相関分析と基本的に同じである。上述の教師あり学習法が使用される特徴ベクトルが、入力ベクトルに直接依存するが、教示の際には、特徴が目標ベクトルからの情報を可能な限り多く含むようなやり方で表現が修正されるため、入力ベクトルを、一次入力と解釈することができ、目標ベクトルを、コンテクストと解釈することができる。

これらの方法における問題は、多段階の写像の教師あり学習のために莫大な量の観察データが必要であり、多数の日常的問題の学習が、実用にならないほど遅くなり、あるいは適切な観察データがない場合に、不可能になる点にある。典型的には、この問題の解決が、例えば上述の独立成分分析など、いくつかの教師あり学習法を前処理として使用することによって、試みられている。そのような解決策における問題は、教師あり学習が、観察データを記述することだけを目的としており、タスクにとって有用な情報の選択を試みない点にある。提示された１つの解決策は、例えば時間変化しない特徴を発見することである。しかしながら、これは、多くの場合、潜在的に有用な特徴の組を充分な程度にまで制限することがなく、他方では、偶然に時間不変になることがない有用な情報が、失われる可能性がある。

基本的には、問題は、ベイズ統計的推測にもとづく方法（刊行物ＷＯ２００６０６３２９１およびＵＳ２００７００５５３１に記載の階層的一次記憶など）が、確信度および観察を強調する現象を表わすことができるが、有用な情報の選択が、本質的に、決定理論的問題である点にある。確信度に加え、決定理論のいわゆる効用（ユーティリティ）を考慮することが重要である。特徴の確率が、その特徴が観察中に存在するか否かという疑問に答えるが、既存の特徴が存在する場合に得られる効用も、考慮する必要がある。

統計的推測のみを使用する方法は、有用な情報を動的に選択しなければならない状況にとくに適していない。例えばロボットの手の把持の制御など、多くの日常的問題において、現在のタスクに関係する情報を選択できることが重要であり、センサ（カメラ、マイクロホン、など）によってもたらされるすべての情報に代えて、有用な情報（例えば、手の位置、対象物の場所および形状、ならびに手と物体との間に存在しうる障害物）のみが表現されるならば、制御の問題が大幅に容易になる。

人間および他の哺乳類の大脳皮質は、上述の種類の問題を解決することができる。大脳皮質は、感覚によってもたらされる莫大な量の情報を集積化し、タスクに不可欠な部分を選択し（選択的注意、動的選択）、その表現をさまざまな種類のタスクにとって有用な方向に修正する（学習、パラメータの修正）ことができる。したがって、この明細書に記載される方法に類似する多数の方法の開発が、人間および他の哺乳類の大脳皮質の機能に着想を得ている。

選択的注意は、いくつかの情報処理ユニットで構成されるシステムにおいて、各ユニットが、自身の表わす情報を他のユニットが当該ユニットにどの情報を伝達するかをコンテクストとして選択する場合に、生じることが示されている（例えば、ＵｓｈｅｒおよびＮｉｅｂｕｒ、１９９６）。選択的注意は、ユニットが、自身の一次入力から、コンテクストに適合する情報を選択しようとする場合に生じる。さらに、注意の対象を変化させることが通常は有用であることから、同じ事物への注意の集中が長くなりすぎないようにする機構が必要とされる。この目的のために、多数の方法が存在している（例えば、Ｌａｎｋｈｅｅｔ、２００６）。

人間における選択的注意が、特徴間の学習関連付け（Ｋｒｕｓｃｈｋｅ、２００１）ならびに表現の学習の指導において、中心的な役割を果たすことが知られている。しかしながら、以前のモデルにおいては、これがまったく実装されておらず、あるいは注意の対象が、何らかのやり方で前もって決定されている。ＷａｌｔｈｅｒおよびＫｏｃｈ（２００６）は、後者の方法を使用している。彼らのモデルは、新たな種類の対象に適合することができず、注意および学習が、前もって設定されるいわゆるプロト対象についてのそのような基準を満たす対象についてしか、機能しない。

いわゆる主成分分析（ＰＣＡ）の目的は、中心的特徴の多次元データを重要性を失うことなく表現することができる成分を発見することにある。主成分分析は、入力データの成分をそれらの固有値に応じて順序付ける。

主成分分析の後で、どれを重要性が低いとして破棄できるかを選択する必要がある。なぜならば、この方法は、いかなる成分も自動的には破棄せず、発見された成分を重要性の順序に設定するだけであるからである。主成分分析は、パターン認識および信号処理における最も中心的な方法の１つである。

ＤｅｃｏおよびＲｏｌｌｓによる記事「Ａｎｅｕｒｏｄｙｎａｍｉｃａｌｃｏｒｔｉｃａｌｍｏｄｅｌｏｆｖｉｓｕａｌａｔｔｅｎｔｉｏｎａｎｄｉｎｖａｒｉａｎｔｏｂｊｅｃｔｒｅｃｏｇｎｉｔｉｏｎ」、ＶｉｓｉｏｎＲｅｓｅａｒｃｈ４４（２００４）６２１−６４２に提示されている方法においては、動的選択が、コンテクストにもとづいて行われる。プレアクティベーションが、「一次入力」のみにもとづいて特徴について計算される。その後に、コンテクストから予測される特徴のプレアクティベーションが強められる。最後に、最強のアクティベーションが選択される。このようにして、コンテクストが、表現のためにどの特徴が選択されるかを左右する。しかしながら、Ｗａｌｌｉｓ、Ｒｏｌｌｓ、およびＦｏｅｌｄｉａｋによって提示されたパラメータの適応のために、別個の方法が使用されている。この方法においては、真のコンテクストは使用されない（Ｇ．Ｗａｌｌｉｓ、Ｅ．Ｔ．Ｒｏｌｌｓ、およびＰ．Ｆｏｅｌｄｉａｋの「Ｌｅａｒｎｉｎｇｉｎｖａｒｉａｎｔｒｅｓｐｏｎｓｅｓｔｏｔｈｅｎａｔｕｒａｌｔｒａｎｓｆｏｒｍａｔｉｏｎｓｏｆｏｂｊｅｃｔｓ」、ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｉｎｔＣｏｎｆｅｒｅｎｃｅｏｎＮｅｕｒａｌＮｅｔｗｏｒｋｓ、２：１０８７−１０９０、１９９３）。したがって、ＲｏｌｌｓおよびＤｅｃｏの記事においては、最初にパラメータの適応が、或る１つの方法によって行われ、次いで得られたパラメータが、コンテクストから作成された予測にもとづく特徴情報の動的選択において使用されている。

正準相関分析は、パラメータの適応においてコンテクストを考慮するが、情報が動的に選択されるわけではない。

以下の刊行物が、上述のものに加えて、従来技術として提示される。

Ｋ．Ｆｕｋｕｓｈｉｍａ、「Ｎｅｏｃｏｇｎｉｔｒｏｎ：Ａｓｅｌｆ−ｏｒｇａｎｉｚｉｎｇｎｅｕｒａｌｎｅｔｗｏｒｋｍｏｄｅｌｆｏｒａｍｅｃｈａｎｉｓｍｏｆｐａｔｔｅｒｎｒｅｃｏｇｎｉｔｉｏｎｕｎａｆｆｅｃｔｅｄｂｙｓｈｉｆｔｉｎｐｏｓｉｔｉｏｎ」、ＢｉｏｌｏｇｉｃａｌＣｙｂｅｒｎｅｔｉｃｓ、３６：１９３−２０２、１９８０。Ｒ．Ｈｅｃｈｔ−Ｎｉｅｌｓｅｎ、「Ｒｅｐｌｉｃａｔｏｒｎｅｕｒａｌｎｅｔｗｏｒｋｓｆｏｒｕｎｉｖｅｒｓａｌｏｐｔｉｍａｌｓｏｕｒｃｅｃｏｄｉｎｇ」、Ｓｃｉｅｎｃｅ、２６９：１８６０−１８６３、１９９５。Ｊ．Ｋ．Ｋｒｕｓｃｈｋｅ、「Ｔｏｗａｒｄａｕｎｉｆｉｅｄｍｏｄｅｌｏｆａｔｔｅｎｔｉｏｎｉｎａｓｓｏｃｉａｔｉｖｅｌｅａｒｎｉｎｇ」、ＪｏｕｒｎａｌｏｆＭａｔｈｅｍａｔｉｃａｌＰｓｙｃｈｏｌｏｇｙ４５：８１２−８６３、２００１。Ｍ．Ｊ．Ｍ．Ｌａｎｋｈｅｅｔ、「Ｕｎｒａｖｅｌｉｎｇａｄａｐｔａｔｉｏｎａｎｄｍｕｔｕａｌｉｎｈｉｂｉｔｉｏｎｉｎｐｅｒｃｅｐｔｕａｌｒｉｖａｌｒｙ」、ＪｏｕｒｎａｌｏｆＶｉｓｉｏｎ、６：３０４−３１０、２００６。Ｍ．ＵｓｈｅｒおよびＥ．Ｎｉｅｂｕｒ、「ＭｏｄｅｌｉｎｇｔｈｅｔｅｍｐｏｒａｌｄｙｎａｍｉｃｓｏｆＩＴｎｅｕｒｏｎｓｉｎｖｉｓｕａｌｓｅａｒｃｈ：Ａｍｅｃｈａｎｉｓｍｆｏｒｔｏｐ−ｄｏｗｎｓｅｌｅｃｔｉｖｅａｔｔｅｎｔｉｏｎ」、Ｊｏｕｒｎａｌｏｆｃｏｇｎｉｔｉｖｅｎｅｕｒｏｓｃｉｅｎｃｅ、８：３１１−３２７、１９９６。Ｇ．Ｗａｌｌｉｓ、Ｅ．Ｔ．Ｒｏｌｌｓ、およびＰ．Ｆｏｅｌｄｉａｋ、「Ｌｅａｒｎｉｎｇｉｎｖａｒｉａｎｔｒｅｓｐｏｎｓｅｓｔｏｔｈｅｎａｔｕｒａｌｔｒａｎｓｆｏｒｍａｔｉｏｎｓｏｆｏｂｊｅｃｔｓ」、ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｉｎｔＣｏｎｆｅｒｅｎｃｅｏｎＮｅｕｒａｌＮｅｔｗｏｒｋｓ、２：１０８７−１０９０、１９９３。Ｗａｌｌｉｓ、Ｒｏｌｌｓ、およびＦｏｅｌｄｉａｋは、パラメータの適応を行っているが、生成された特徴の時間不変性を適応のための基準として使用している。したがって、コンテクストはまったく使用されていない。Ｄ．ＷａｌｔｈｅｒおよびＣ．Ｋｏｃｈ、「Ｍｏｄｅｌｉｎｇａｔｔｅｎｔｉｏｎｔｏｓａｌｉｅｎｔｐｒｏｔｏ−ｏｂｊｅｃｔｓ」、ＮｅｕｒａｌＮｅｔｗｏｒｋｓ、１９：１３９５−１４０７、２００６。

特徴の学習およびそれらの動的選択は、別々のプロセスであるため、選択的注意によって得られた情報を、学習において使用することができない。

本出願の方法の目的は、特徴を定めるパラメータの適応を特徴情報の動的選択に組み合わせ、タスクにとって有用な特徴の学習および選択の両方を行うようにすることにある。

本発明の情報処理方法は、主として請求項１の特徴付け部分によって特徴付けられる。

本発明の方法においては、情報が処理ユニットにおいて選択される。得るべき最終結果は、タスクの実行に使用する最終的な特徴情報で構成される。この方法においては、処理ユニットの入力情報が、入力情報からタスクにとって有用な情報を発見するために処理される。入力情報は、一次入力とタスクを実行するための一般的情報を表わすコンテクストとで構成される。入力情報の特性を表わす特徴情報が、入力情報から形成される。特徴情報の値が、それらの効用にもとづいてさらに処理される。この方法は、最終結果についての仮の予測が、第１のパラメータによって入力情報の第１の組のコンテクストから形成されること、および入力情報の組の第１の一次入力が、第２のパラメータにもとづいて計算結果を形成することによって前処理されることを、主な特徴とする。上述の工程において得られた情報の効用が、得られた予測および計算結果を、有用な特徴が予測にもとづいて計算結果から選択されるようなやり方で組み合わせることによって評価され、すなわち特徴情報が、有用な特性を強め、他の特性を弱めることによって形成される。次いで、第２のパラメータが、一次入力データを前処理する工程において評価の工程において得られた特徴情報に対応する計算結果が初めからもたらされるように修正される。その後に、入力情報および一次入力の組の次のコンテクストおよび一次入力が、処理のために取り入れられ、上述の工程が、最終的な特徴情報を得るために、入力情報の組のそれぞれの構成員について繰り返される。

本発明の好ましい実施形態が、従属請求項に提示されている。

そのような１つの実施形態においては、第１のパラメータも、特徴情報に対応する計算結果を与えただろうと考えられるようなやり方で修正される。

以下では、特許請求の範囲および明細書におけるいくつかの用語を、特許請求の範囲の理解を容易にするために説明する。

本明細書において、一次入力は、特徴が主として記述する情報であり、コンテクストは、特徴ベクトルの形成を監督すべく他のやり方で使用される他の補助的情報で構成される。

本発明において、特徴情報は、主として数値またはスカラとして、すなわち大小の数字として、提示されると考えられる。アクティベーションという用語が、特徴の数値の同義語である。アクティベーション関数という用語が、ニューラルネットワークにおいて使用される。これは、特徴の値がどのように入力ベクトルおよびパラメータから計算されるかを示す。アクティベーションという用語の使用は、一般に、本明細書のとおり、ゼロレベルが、特徴によって記述される現象が入力ベクトル中に存在しないことを意味するデフォルト値であるという仮定を含む。ゼロでない値は、特徴によって記述される現象が入力ベクトル中に存在することを意味し、より強力またはより高確率であるほど、特徴の数値が大きくなる。特徴情報は、本発明において、効用にもとづいて選択される。情報の選択は、この方法が特徴の表示の効用が小さいと考える場合に、特徴の値をゼロレベルにより近く変えることによって実現される。

入力情報の組が、いくつかの入力情報（例えば、いくつかの連続するカメラ画像および感覚データ）で構成され、入力情報は、いくつかの数値で構成される。組の構成員は、組における１つの構成要素を意味する。

相関は、確率計算および統計において使用される用語である。これは、２つの変数の間の依存関係を記述する。より正確には、２つのランダム変数の線形依存性の数値指標である。２つの独立変数の間には相関が存在しない。２つのベクトルの間の相関は、相関行列であり、その要素が、ベクトルの要素間の相関を記述する。統計学において、相関ならびに平均値は、常に或るグループについて定められる。本明細書においては、相関が、入力情報の組またはそこから計算された結果について計算される。

非相関化は、ベクトルが、最終結果として得られるベクトルの要素の相互の相関が可能な限り少なくなるようなパラメータ行列によって乗算される計算工程である。非相関化に使用されるパラメータ行列は、後に処理されるベクトルにもはや相関が存在しないようなやり方で、観察される相関にもとづいて、新たなベクトルを処理する際に修正される。

平均アクティベーションレベルは、実際には、平均値と同じことである。本発明の詳細な説明においては、後で提示される実例において、適応プリプロセッサによって生成された未だ最終的な特徴ベクトル（特徴情報）ではないベクトルについて、プレアクティベーションという用語が使用される。

注意が学習を強調するという事実は、学習の対象を変更するだけでなく、学習そのものをより効率的にする。他の対象を注意によって破棄できる場合、残りの情報から対象物の特性を学習することができる。ＷａｌｔｅｒおよびＫｏｃｈのモデルが、注意が本出願の方法の場合と同じやり方で適応的でないにせよ、同じ現象にもとづいている。彼らのモデルにおいては、前処理段階として機能するにすぎない。対象の選択は、対象そのものが学習される前は完璧に機能することはできないが、学習を、不完全な情報によってすでにバイアスすることができる。しかしながら、平均では、バイアスは正しい方向に進む。

学習が一緒に現れる対象によって妨げられるとき、学習および注意を組み合わせることが学習を加速させる。既存のシステムにおいては、教示の工程において使用される観察データの対象をあらかじめ選択するために、かなりの量の手作業が必要とされている。

本出願の方法は、この工程を自動化し、手作業の必要性を減らすだけでなく、この方法の自律的学習も可能にし、そのようにして、この方法を例えば自律ロボットにおいて使用できるようにする。主たる請求項の土台は、有用な情報の動的な選択およびパラメータの適応の両方においてコンテクストが考慮されることにある。これまでに、入力情報が２つの種類の入力、すなわち一次入力およびコンテクストで構成される方法が提示されているが、それらにおいては、コンテクストが効果的に利用されてはいない。

正準相関分析が、パラメータが適応されるときにコンテクストを考慮するが、コンテクストにもとづいて動的に特徴を選択するわけではない。さらに、Ｗａｌｌｉｓ、Ｒｏｌｌｓ、およびＦｏｅｌｄｉａｋが、パラメータを適応させているが、コンテクストはまったく使用されていない（Ｇ．Ｗａｌｌｉｓ、Ｅ．Ｔ．Ｒｏｌｌｓ、およびＰ．Ｆｏｅｌｄｉａｋの「Ｌｅａｒｎｉｎｇｉｎｖａｒｉａｎｔｒｅｓｐｏｎｓｅｓｔｏｔｈｅｎａｔｕｒａｌｔｒａｎｓｆｏｒｍａｔｉｏｎｓｏｆｏｂｊｅｃｔｓ」、ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｉｎｔＣｏｎｆｅｒｅｎｃｅｏｎＮｅｕｒａｌＮｅｔｗｏｒｋｓ、２：１０８７−１０９０、１９９３）。これまでに公知のいわゆる主成分分析が、単に一次入力の値を適応させる一方で、記事「Ａｎｅｕｒｏｄｙｎａｍｉｃａｌｃｏｒｔｉｃａｌｍｏｄｅｌｏｆｖｉｓｕａｌａｔｔｅｎｔｉｏｎａｎｄｉｎｖａｒｉａｎｔｏｂｊｅｃｔｒｅｃｏｇｎｉｔｉｏｎ」、ＶｉｓｉｏｎＲｅｓｅａｒｃｈ４４（２００４）６２１−６４２においてＤｅｃｏおよびＲｏｌｌｓによって提示された方法においては、動的な選択が、実際にコンテクストにもとづいて実行されているが、この記事においては、パラメータの適応が或る１つの方法を使用することによって最初に行われ、得られたパラメータが、コンテクストから得られる予測にもとづいて特徴情報を動的に選択するために使用される方法が提示されている。最初に、特徴のプレアクティベーションが、一次入力にもとづいて計算される。次いで、コンテクストから予測された特徴のプレアクティベーションが強められる。最後に、最強のアクティベーションが選択される。このようにして、コンテクストが、どの特徴が表現のために選択されるかを左右するが、どの特徴がパラメータの適応のために選択されるかを左右することはない。

本発明の方法においては、コンテクストにもとづく動的な選択およびコンテクストにもとづくパラメータの適応の両方が実行される。

本発明の方法は、１つまたは複数の処理ユニットにおいて実行可能である。後者の場合には、処理ユニットが、それらの生み出す特徴情報をコンテクストとして互いに共有するように接続される。

処理ユニットは、協働または単独で働くことができ、互いに並列または階層的に接続することができる。ユニットが、それらの特徴ベクトルがコンテクストとして他のユニットへと仲介されるようなやり方で互いに接続され、それらユニットのそれぞれが、コンテクストにコヒーレントな情報を表わすことを目的としている場合、選択的注意に相当する動的な情報選択プロセスがシステムに出現する。コヒーレンスに加え、特徴の効用を、新規性値に従って評価することができる。ユニットの先の状態またはコンテクストから予測できない特徴は、予測できる特徴よりも価値がある。特徴の長く続くアクティベーションが、効用を減少させる場合、注意の対象が、たとえ入力が不変であっても変化する。

特定の種類の階層構造においては、コンテクスト情報の一部が、一次入力の予測において、この部分がいくつかのグループへの強制的な分割なしで完全に支配的であるように良好であってよい。パラメータが、特徴情報がコンテクストを予測できるようなやり方で適応させられるとき、特徴情報が、コンテクスト情報のこの部分のみの予測において良好であるようなやり方で選択される。しかしながら、一部のコンテクスト情報の予測がきわめて重要である状況がしばしば存在する。例えば、ロボットの場合には、モータの制御信号がそのような重要情報であるが、カメラ画像に見られる特徴の予測においては、まったく良好でない。コンテクスト情報をグループへと分割し、各グループを一次入力の情報を予測するように強いることによって、その内容が一次入力により近い情報だけでなく、コンテクスト情報の各グループを記述する情報を発見できることを保証できる。

とくには学習において、すなわちパラメータが修正されるときに、予測されなかった特徴の効用の評価を、この特徴の予測されなかったアクティベーション（ゼロ以外の数）がコンテクストの予測を助ける場合に、増加させることができる。

注意は、通常は最高の効用を有する情報に集中し、したがって、情報の表現が、不可欠な事物が強調されるような方向、またはそれらが長時間動作においてより良好な分解能を有するような方向に、適応させられる。

システム（５および６）の動作の進行の評価を、効用の評価の基礎となるコンテクストに含めることができる。処理ユニットが、効用によって制御される特徴ベクトルのアクティベーションについての決定を行うとき、アクティベーションを、何らかの制御システムの入力として間接的に使用できるだけでなく、例えば自律ロボットを制御するモータへと指令および制御信号を与えるために直接使用することも可能である。そのような構造は、そのアクティベーションが脊髄の運動ニューロンを直接制御する人間の大脳皮質に類似している。

以下では、これらの方法のいくつかの異なる実施形態の実施例、それらの挙動、および用途が提示される。これらの例は、本方法の理解を容易にするために提示されるが、本方法を実行するための必須のやり方というわけではない。以下の図が、これらの実施例の説明において助けとして使用される。

本発明の考え方を理論的に示している概略図である。本発明の考え方を理論的に示している概略図である。複数の処理ユニットが本発明の方法を実行するために使用されている実施形態を示している。処理ユニットが階層的に接続された実施形態を示している。コンテクストがシステムの外部から与えられる典型的な実施形態を示している。コンテクストがシステムの内部でも与えられる典型的な用途を示している。処理ユニットの典型的な実施形態を示している。ベクトルのアクティベーションを演算に関して効率的なやり方でスパース化するアルゴリズムの流れの仕組みを示している。情報の集積化および選択のシミュレーション結果を示している。不変性の学習からのシミュレーション結果を示している。選択の変化からのシミュレーション結果を示している。

本発明の方法においては、処理ユニットが、それを使用することによって例えばロボットの制御または疾病の診断などといった特定のタスクのために可能な限り最良の最終結果が得られるような情報を、既存の入力情報から選択するように教示される。効用が最大になっているとき、すなわち特定のタスクが可能な限り最良なやり方で実行されているとき、正しい情報が入力情報から選択されている。

本発明の基本的な考え方は、一次入力を記述する特徴のアクティベーション（数値）を計算するとき、およびパラメータを修正するときに、特徴が観察中に存在する確率を考慮するだけでなく、存在する特徴の表現の効用も考慮することにある。基本的な原理が、図１および２に示されている。この方法において使用される処理ユニットのそれぞれを、特徴の確率（１および３）ならびに効用（２および４）を評価すると解釈することができる。決定理論によれば、特徴の表現の効用は、それらを乗じることによって得られる。図１は、主たる請求項のステップｃに相当し、図２が、主たる請求項のステップｄに相当する。

すなわち、本発明の方法の基本的な考え方は、統計情報および効用の使用を説明している図１および２の理論的仕組みのとおり提示される。これらを、２つの決定プロセス、すなわち表現（アクティベーション）の選択およびパラメータの適応において、異なるやり方で使用することができる。

いくつかのユニットがこの方法において使用される場合、それら処理ユニットの相互接続のやり方が、本発明がどのように機能するかを左右する。それらが、図３のように互いにコンテクストを与え合うように設定される場合（請求項１６）、それらは、本発明の方法を使用することによって、それらの一次入力の間の接続を効率的に発見する。

ユニットが図４に示されるように階層的に接続（請求項１５および１７）される方法においては、さらにユニットが、より上位のレベルにおいて、ネットワークの入力から抜粋特徴を発見することができる。さらに、処理ユニットが、それら自身へと過去の時点からのコンテクストを与えることができる。このやり方で、例えばゆっくりと変化する特徴など、処理ユニットの自身の特徴の例えばゆっくりした内部力学も発見することができる。

多数の処理ユニットを備えるシステムが使用される場合、以下の原理に従うことが好ましい。すなわち、階層的な処理ユニットが使用される場合には、階層においてより上位にある処理ユニットほど、より広い領域からの入力を受け取るようなアーキテクチャを使用することが好ましい。これにより、大域的特徴を、ネットワーク入力の小さな部分を記述するだけではない上位レベルへと進展させることができる。また、特徴を不変にするために、いくつかの処理ユニットにおいて次元の削減を使用することが好ましい。これは、情報の一部がフィルタ処理によって除かれるため、不変性を生じさせる。次元の削減は、別途の処理ユニットにおいて実行でき、あるいはこの次元の削減を他の処理に加えて含むことができる処理ユニットに或る種のプリプロセッサを備えることによって実行できる。

種々の有用な特徴の学習は、一次入力が処理ユニットへの供給前に白色化される場合に、より高速であり、容易にされる（請求項１３）。ここで、白色化は、すべての要素の分散の非相関化および正規化を意味する。正規化および非相関化は、一次入力に適切な白色化行列を掛けることによって達成される。少なくともシステム全体のうちの最下位レベルの一次入力について、白色化を使用することが好ましい。

図７が、処理ユニットの典型的な実施形態を示している。ネットワークが機能しているとき、ネットワークのアクティベーションが、情報がネットワークのすべての部分から集積するための時間を有した状態へと実質的に収束したと見なすことができる時点で、図７に示した適応工程を実行することが好ましい。これは、ネットワークのすべての処理ユニットが、実際に何らかの順序で数回繰り返されたことを意味し、その後で、処理ユニットについて、結果としてのベクトルによって適応が行われる。更新する順序は、例えば処理ユニットが階層のレベルに従った順序で運転されるような順序であってよい。各レベル内では、無作為な順序が使用される。この種の適応は、異なる特徴の識別能力およびコンテクストに関する特徴の学習を向上させる。適応がそれぞれの更新の後で実行される場合、コンテクスト情報を集積させる充分な時間が存在しないと考えられ、全体的注意が、上手く現れるための充分な時間を有さないと考えられ、この理由で、異なる種類の特徴がアクティベーションにおいて混合される。図７の実施形態においては、特徴表現を選択するためのプロセスおよび特徴の適応のプロセスが、図１のように異なる効用モデルを使用する。換言すると、特徴が、全体的注意とコヒーレントである場合にのみ、適応の効用を有する。

代わりに、コヒーレンスを得る目的において、表現効用も別に存在する。さらに、確率モデルも別個であってよい。情報の瞬時の表現においては、現在および過去の情報のみを使用することができ、代わりに、パラメータの適応が行われるとき、たとえ適応がリアルタイムよりも少し遅れて行われてもそれほど致命的でないため、将来の情報も同様に使用することができる。

図７は、処理ユニットの考えられる一実施形態を示しており、この実施形態が、本明細書に記載される実施例において使用される。一部のモジュールを横切って描かれている破線の矢印は、この場合には常に特徴ベクトル（４４）、すなわち特徴情報である矢印に含まれている情報によるこのモジュールへのパラメータの教示を意味している。この実施形態においては、特徴の確率および効用が、個々には明示的に取り扱われず、代わりに両者が、プレアクティベーション（１５）および予測（１６）の両者において混合される。一次入力（８）が、主たる請求項のステップａ）に従って、適応プリプロセッサ（１０）へと案内される。これは、最終的な特徴ベクトル（４４）と同じ次元のベクトルであるプレアクティベーション（１５）への写像である。本明細書に提示される実施例では、適応プリプロセッサ（１０）が、線形写像Ｗｘ（請求項４）であり、Ｗが、重み行列と呼ばれるパラメータ行列であり、列ベクトルｘが、一次入力（８）である。適応プリプロセッサ（１０）のパラメータＷが、重み行列Ｗの修正が積ｙｘ’に直接比例するように、最終的な特徴ベクトル（４４）のヘビッシュ学習（Ｈｅｂｂｉｓｈｌｅａｒｎｉｎｇ）を使用して、主たる請求項のステップｄ）において教示（適応、修正）され、ここで列ベクトルｙは、特徴ベクトル（４４）であり、ｘ’は、ベクトルｘの転置である。修正の後で常に、重み行列Ｗの行を単位ベクトルへと正規化することが好ましい。また、適応プリプロセッサ（１０）において、センシテーション特性を使用することが好ましい。これは、プレアクティベーション（１５）の各要素が、何らかのセンシテーションパラメータｇ＿ｉによって乗算されることを意味し、その目的は、それぞれの特徴ベクトル（４４）の平均を、一式の入力情報において一定にすることにある。表記ｇ＿ｉは、ベクトルｇのｉ番目の要素を意味する。適応プリプロセッサ（１０）が、このアクティベーションレベルを測定し、すべての平均アクティベーションレベルが同じレベルになるように、値ｇ＿ｉをゆっくりと増加または減少させる（請求項１４）。これは、ネットワーク全体の情報表示能力を向上させる。すべての特徴が使用され、特徴ベクトルのすべての要素がほぼ常に不活発になる（ゼロに近づく）状況が、回避される。

予測器（１１）が、コンテクスト（９）にもとづいて、主たる請求項のステップａ）において予測（１６）を計算する。予測器（１１）のパラメータが、請求項２に述べられているように、予測器のコンテクストの入力（９）にもとづいて計算される予測（１６）が前よりもプレアクティベーション（１５）に近くなるようなやり方で、修正される。予測器は、ここ（請求項４）で使用されている線形予測器や、多層パーセプトロンなど、教師あり学習を使用する任意の種類の方法であってよい。

予測のアクティベーションとの組み合わせ（１２）は、以下のやり方（主たる請求項のステップｃ））で実行される。第１に、プレアクティベーション（１５）および予測（１６）のすべての負の要素が、存在するのであれば、値ゼロへと設定される。その後に、予測ベクトルのすべての要素が、最大でも１であることが保証される。いくつかの値がより大きい場合には、予測ベクトルが、この数によって除算される。これにより、コンテクストを互いに与え合う２つの処理ユニットが、限界なくお互いのアクティベーションを強め合うことが防止される。

その後に、組み合わせ（４７）が、式ｙ＿ｃｏｍｂ＝ｙ＿ｐｒｅ×ｍ（１＋ｙ＿ｐｒｅｄ）によって得られ、ｙ＿ｃｏｍｂが、組み合わせ（４７）であり、ｙ＿ｐｒｅが、プレアクティベーション（１５）であり、ｍが、変調係数であって、例えばｍ＝１であり、ｙ＿ｐｒｅｄが、予測（１６）である。この式は、コンテクストによって与えられた予測（１６）が、アクティベーションを生成できないが、プレアクティベーション（１５）のアクティブ要素を強化できるようにする。

これにより、ネットワークによって提示される特徴、すなわち値がゼロでない特徴が、常に一次入力（８）に存在する。

特徴の非相関化（１３）は、互いに相関しており、特定の瞬間において同時にアクティブであるようなアクティベーションを少なくすることを意味する（請求項５）。これは、２つの効果を有している。一方では、適応プリプロセッサ（１０）がすべての要素が同じ特徴を記述するという状況に陥る危険を少なくする。他方では、非相関の特徴の選択はより容易であり、特徴が次の処理ユニットのレベルへと供給されたとき、そのようなレベルでの処理がより容易である。共通のアクティベーションが相関する特徴から引き算されるとき、その後は、どの特徴が実際に一次入力に存在するかを理解することがより容易である。非相関化は、本明細書で使用されるすべての実施形態において、式ｙ＝ｘ−Ａｘによって実行され、ｙは、非相関化されたアクティベーションベクトル（４８）であり、ｘは、組み合わせ（４７）であり、Ａは、非相関化行列である。行列Ａは、例えば最終的な特徴ベクトル（４４）によって適応させられる。Ａの対角線要素は、ベクトルの要素が自身を妨げることがないように、ゼロに保たれる。Ａの残りの要素Ａ＿ｉｊは、特徴ベクトル（４４）の要素ｉの要素ｊへの推定された相関である。

請求項６のスパース化（１４）が、特徴ベクトルの少数の要素のみがゼロ以外であるようなやり方で、アクティブな特徴を切り詰める。本明細書に提示される実施形態においては、スパース化が、図８のアルゴリズムによって実行される。特徴ベクトルｙ（列ベクトル）について、スパース化指標ｓ＝−ＳＵＭ（ｙ）／ＳＱＲＴ（Ｎ×ｙ’ｙ）が使用され、ＳＵＭは、ベクトルの要素の合計であり、ＳＱＲＴは、平方根であり、Ｎは、ベクトルの要素の数であり、×は、乗算を意味している。このようにして、異なる長さのベクトルのスパース化指標が、比較可能になる。さらに、定数によるベクトルのすべての要素の拡大縮小（スケーリング）は、スパース化指標を変化させない。スパース化対象のベクトルが、スパース化指標が所定のしきい値を超える限りにおいて、繰り返し更新される。このしきい値は、ネットワークの定義段階において決定された定数である。本明細書に記載の実施形態において、この限界は、定義者が充分にスパースであると考えるベクトルを形成し、このベクトルについてスパース化指標を計算することによって達成される。要素のうちの５％が値１を有し、残りの要素が値０を有しているベクトルが、本明細書の実施形態において使用される。スパース化対象のベクトルｘの更新ルールは、以下のとおりである。第１に、ｘ＜−ｘ−ａ×ＭＡＸ（ｘ）が計算され、ここで＜−は、代入演算を意味し、ｍは、間隔［０，１］内の何らかの定数であり、ＭＡＸは、ベクトルの最大値を返す。その後に、ゼロよりも小さいすべての値が、ゼロへと変換される。ベクトルが充分にスパースであるとき、それは、ゼロでない要素を含んでいるならば、ＭＡＸ（元のベクトル）／ＭＡＸ（新しいベクトル）という数によって乗算される。最後に、得られたベクトルが、特徴ベクトル（４４）として設定される。

図７の場合には、効用が、暗黙のうちに評価される（請求項９および１１）。効用は、この実施形態において、特徴情報の助けによってコンテクストを予測する能力が有用であるようなやり方で定められる。図７は、予測がコンテクストから作成される実例を示しており、この予測が、一次入力から計算されるプレアクティベーションに組み合わせられる。図７に示したステップ（１１）〜（１４）が、効用の評価に関係する。

試験結果
図９が、本発明の方法を使用することによる情報の集積化および選択のシミュレーション結果を示している。この特定の実施例においては、図７の実施形態の処理ユニットを２段階の階層にて含んでいるネットワークを使用した（請求項１７）。第１の階層が、３０の特徴の１２の処理ユニットを有している。これらを、いかなる直接的なコンテクストの接続ももたない２つの領域へと分割した。これらの領域からの結果を、３０の特徴の４つの処理ユニットを有している第２の階層への一次入力として供給した（請求項１５）。第２の階層において、すべての処理ユニットが、他のすべてのユニットからコンテクストを取得し、さらに、下位の階層のすべての処理ユニットへとコンテクストを供給した（請求項１６）。ネットワークを、入力が常に雑音のない入力ベクトルで構成されるよう、３０の入力ベクトルで教示した。このようにして、それぞれの処理ユニットが自身の一式の入力情報を有し、その構成員（入力情報の要素）は、一次入力およびコンテクストで構成されている。第１の階層の処理ユニットへの一次入力は、前記３０の入力ベクトルで構成され、第２の階層の処理ユニットへの一次入力は、第１の階層によって生成された特徴ベクトルで構成されている。すべての処理ユニットへのコンテクストは、第２の階層によって生成された特徴ベクトルで構成されている。

ネットワークの教示の前に、線形写像のパラメータが、無作為に初期化される。教示が進むにつれ、主たる請求項のステップａ）〜ｅ）が、入力情報の組の各要素について繰り返される。教示の最終結果は、ネットワークがコヒーレントな情報を選択できるようなやり方でパラメータが変化したことである。

教示の後で、所与の入力が２つの元の入力ベクトルの組み合わせである場合に、どのようにネットワークが機能するかを調べた。入力情報の組への新たな入力を追加し、それらにもとづき、新たな特徴情報の値を計算した。ここで、ネットワークの異なる領域に名前を付ける。ネットワークの第１の階層の２つの異なる領域が、Ｙ１１およびＹ１２であり、第２の階層が、Ｙ２である。元の入力ベクトルの中から２つの入力ベクトルを無作為に選択し、ＡおよびＢと名付ける。供給すべき新たな入力ベクトルが、領域Ｙ１１に供給されようとするベクトルの部分が、ベクトル０．５×Ａ＋０．５×Ｂの対応する部分であるように、ネットワークにおいて形成される。

領域Ｙ１２へと供給されるベクトルの残りの半分は、ベクトルａ×Ａ＋（１−ａ）×Ｂの対応する部分である。ここで、混合割合「ａ」は、値０から値１まで連続的に変えられる。この種の入力は、ネットワークがその入力についてすべてを表わさず、入力ベクトル内の或る対象のみを記述するようなやり方で特徴を選択するという結果をもたらす。「ａ」がゼロに近いとき、たとえ入力がＡをＢと同程度に含んでいても、主としてＢのみが、領域Ｙ１１における表現として選択される。

これを、図９のグラフから見て取ることができる。これら３つの異なるグラフは、ネットワークの３つの異なる領域に対応している。すべての曲線は、特徴ベクトルまたは入力ベクトルについて、さまざまな混合割合「ａ」の値の対応するモデルベクトルとのスカラ積を示している。すべてのグラフにおいて、ｘ座標は「ａ」を有し、ｙ座標は、間隔［−１，１］へと正規化されたスカラ積の値を有している。参照番号１７および１８は、領域Ｙ１１の入力ベクトルの入力ベクトルＡおよびＢの対応する部分とのスカラ積である。これらは、混合関係がこの入力に影響を有さないため、一定である。同様に、参照番号２１および２２は、領域Ｙ１２の入力の入力ベクトルＡおよびＢの対応する部分とのスカラ積である。残りの曲線は、種々の領域からの特徴ベクトルのモデル特徴ベクトルとのスカラ積である。例えば、入力ベクトルＡに対応するモデル特徴ベクトルは、入力ベクトルＡをネットワークへの入力として、種々の領域において選択された特徴ベクトルを意味する。参照番号１９および２０は、領域Ｙ１１の特徴ベクトルのＡおよびＢに対応するモデルベクトルとのスカラ積である。参照番号２３および２４は、領域Ｙ１２の同様のスカラ積である。参照番号２５および２６は、領域Ｙ２の同様のスカラ積である。

これらのグラフは、情報の集積化および情報の選択の両方のためのネットワークの能力を示している。領域Ｙ１２のグラフに目を向ける。混合割合「ａ」が増やされるとき、特徴ベクトルは、入力ベクトルよりも速く変化する。これらの曲線は、最初はかなり水平であるが、「ａ」が値０．５に近づくとき、急激に上昇する。これが、選択が生じるときである。Ｂがもはや表現されず、代わりに、Ａの表現が始まる。処理ユニットが、非線形に機能する。この現象は、より上位の領域Ｙ２を調べると、さらに強力である。これは、自身の一次入力を、或る程度の非線形選択がすでに行われているより下位の領域から受け取る。領域Ｙ２は、この選択をさらにより強化し、これを、「ａ」の値が０．５の辺りにある時の曲線（２５および２６）のより鋭い上昇および下降として見て取ることができる。情報集積化特性を、領域Ｙ１１のグラフに見て取ることができる。この領域は、常に一定の一次入力を受け取っているが、領域Ｙ２からのコンテクストが変化する。この結果として、他の領域など、異なるａの値において特徴の表現について異なる決定を行う。ａの値が小さいと、領域Ｙ１１は、Ｂを表わすための決定を行い、値が大きいと、Ａを表わす。

この実施例は、瞬間的なコヒーレンスを異なる種類の入力を処理するネットワーク部分の間で達成できることを示している。これを、全体的注意と名付けることもできる。例えば、図６の応用において、ロボットの視覚およびモータの処理を協働させることができる。ロボットが何らかの特定のモータ制御を実行するとき、ネットワークの視覚部分が、制御のために有用なビデオ画像からの特徴を正確に処理する。ネットワークの入力には、ネットワークによって提示される特徴ベクトルよりも多くの情報が存在しているため、ネットワークが、提示情報の効用についてアクティブな決定を行う。例えば、先のシミュレーションにおいて混合割合「ａ」が値０．５に近い場合、ネットワークは、対象ＡおよびＢのうちの一方を強調し、他方を弱める。処理ユニットは、この実施形態において情報表現の効用という考え方を明示的には有していないが、それは、ネットワークの機能に暗黙のうちに表わされている。個々の処理ユニットが、全ネットワークへのコヒーレントな表現が形成されるよう、そのコンテクストに表わされる同じ特徴を表わすことが、より有用である。

図１０は、適切な方法を使用してネットワークにおいて不変性を学習するための能力についてのシミュレーション結果を示している。２０４次元のベクトルが、ネットワークへの入力として与えられ、それらは、９の別個の部分から連結されている。さらに、５つの異なる対象が、それらのそれぞれが自身の特徴部分を有し、それらの特徴部分で対象全体が構成されるように、定められている。各対象は、各部分のための無作為なモデルベクトルの大きなグループを有しており、それらの部分の或る組み合わせが、１つの対象を表わすために常に選択されている。１つの物体は、すべての組み合わせが考慮されるとき、数十万の異なるインスタンス化を有している。２つの無作為な対象のいくつかのインスタンス化ベクトルの重み付きの合計が、ネットワークへの入力として常に与えられる。一方の対象の重みが１であり、他方の対象の重みは、間隔［０，１］に一様に分布したランダム変数である。ネットワークは、コンテクストにもとづいて処理ユニットの学習および選択を重み付けることができる場合、外部の教師信号なしで、そのようなデータから種々の対象の分類を独立に学習する可能性を有する。

ここで使用したネットワークは、６つの階層を有しており、２つ毎の階層が、次元削減層であり、２つごとの階層が、収束層である。後者は、下位の階層の２つ以上の処理ユニットから入力を受け取るような処理ユニットからなる層という意味である。すべての分類からの２０の異なる種類のインスタンス化が入力としてネットワークへと与えられたとき、ネットワークによって学習された分類を、最上位の階層、すなわち６番目の階層の特徴ベクトルを調べることによって検査した。組み合わせ特徴ベクトルが、６番目の階層のこれらの特徴ベクトルから形成され、この組み合わせ特徴ベクトルが、異なる分類に対応する５つの線形分類器へと供給された。これらのベクトルが、単位ベクトルへと正規化され、その後に、スカラ積が、これら５つの分類のそれぞれからの１つの対応するランダム特徴ベクトルについて計算された。

図１０は、これらのスカラ積を示している。スカラ積の値が、ｙ座標上にあり、ｘ座標上のそれぞれの値は、ネットワークへと供給された１つの入力ベクトルを示している。最初の２０は、分類１からの無作為のインスタンス化であり、２１〜４０は、同様に分類２からのものであり、４１〜６０は、分類３からのものであり、６１〜８０は、分類４からのものであり、８１〜１００は、分類５からのものである。曲線（３５）は、入力ベクトル１に対応する組み合わせ特徴ベクトルとの１００の組み合わせ特徴ベクトルのすべてのスカラ積を示している。同様に、曲線（３６、３７、３８、および３９）は、それぞれ分類２、３、４、および５のそれぞれに対応する１つの組み合わせ特徴ベクトルとの１００の組み合わせ特徴ベクトルのすべてのスカラ積を示している。不変性が、ほぼ同じ特徴ベクトルがすべてのインスタンスから生成されるようなやり方で、これらの結果において生じている。分類３の学習が、種々のインスタンス化の約半分だけが比較のインスタンス化と同様の特徴ベクトルを生じさせているため、最も悪い。元の特徴ベクトルの互いのスカラ積は、無作為に形成されたモデルベクトルおよび各分類に対応するインスタンス化の大きな量ゆえ、平均でゼロに近かった。

これらのシミュレーション結果は、我々の方法を使用するネットワークが、同じ対象のまったく異なるインスタンス化を一緒に分類するために、効率的に学習することを示している。このやり方で、ネットワークは、種々の視認角度から画像化された対象の不変の表現を学習することができ、あるいは多関節のロボットを制御するときに、アクチュエータの種々の位置において同じ最終結果を達成する種々の制御信号を学習することができる。

図１１は、注意の対象の変化についてのシミュレーション結果を示している。ここでは、図１０のシミュレーションと同じネットワークを使用したが、長時間にわたってすでにオンであり、かつコンテクストが変化していない場合に予測を減少させる疲労特性を、すべてのコンテクスト予測器へと追加で加えた。より正確には、ゼロよりも小さい値がゼロによって置き換えられ、結果が、高域通過フィルタで処理された。これは、近接過去においてアクティブであった特徴からの表現の効用の低減（請求項１８）に、暗黙裏に相当する。図１１に示されている曲線において、ｘ座標は、繰り返し数を有しており、ｙ座標は、特定の時間の瞬間における５つの異なる分類器のアクティベーションを有している。分類器は、５つの異なる分類のためのネットワークの６番目の階層からの最適線形分類器である。上方のグラフにおいて、分類１および２のインスタンス化されたベクトルの合計が、入力として与えられている。

インスタンス化は、分類３の特徴的な特徴を可能な限り思い出すように選択されている。曲線（５５、５６、２７、２８、および２９）は、この順で、分類１、３、２、４、および５の分類器のアクティベーションである。

グラフは、ネットワークが、注意が他の対象へと移されるまで、しばらくのあいだ或る１つの物体を常に示していることを示している。ネットワークが画像を処理する場合、これは、注意が異なる対象の間で変化するという状況に相当している。さらに、注意を、対象の全体と対象の各部分との間で変化させることができる。ネットワークの全体的注意の対象は、例えば、最初は椅子であって、その後に椅子の脚のうちの１つへと移動することができる。

図１１の下方の図は、入力が対象１のインスタンス化ベクトルで構成される場合の同じネットワークを有している（しかしながら、種々の分類の下位レベルの特徴が互いに部分的に重なり合っており、入力が対象１のみで構成されていると言うことはできない）。曲線（３０、３１、３２、３３、および３４）は、この順で、それぞれ分類１、３、２、４、および５の分類器アクティベーションのアクティベーションである。この場合、注意は、対象３への短いジャンプを除き、ほぼ常に対象１に集中されている。予測器の疲労がより強くされる場合、そのようなジャンプが、あきらかにより頻繁に行われると考えられる。これは、ネットワークが入力を可能な限り多くの態様から解釈しようとする状況に類似している。この実施例も、ネットワークが表わしている情報の効用をどのように暗黙裏に取り扱うかを示している。何らかの対象が充分に長く表わされている場合、その表現は、おそらくはもはや当初ほどには有用でなく、ネットワークが注意の対象を変更する。

上述のシミュレーションは、我々の方法を使用するネットワークが、多次元のデータからの不変の分類の学習を、たとえそれらの分類が教示の状況において明示的に命名されておらず、種々の分類のインスタンス化が別個に入力として与えられていなくても、実行できることを示している。さらに、このネットワークは、注意の対象についての全体的決定を行うことができる。この決定のために、すべての入力からの情報が集積化される。

実施例１および２
処理ユニットを１つしか持たないシステムであっても、実際の用途において有用であり得る。そのようなシステムが、図５に記載されている。システムは、所与の疾病の進行を可能な限り早期に予測できるような特徴を、患者の測定および症状データから発見しようと試みる（請求項８）。他方で、疾病そのものの進行によって左右される可能性があり、したがって疾病そのものの進行を左右することができる特徴を、この方法によって見つけることも可能である。処理ユニット７が、患者のデータを一次入力８として取得する。このデータを、例えば血液の値および他の測定パラメータならびに患者によって述べられる症状および医師によって把握される症状で構成することができる。以前に患者において観察された疾病についての情報が、コンテクスト９として与えられる。

処理ユニット８は、種々の特徴について静的な情報を生成するだけではない。加えて、それぞれの時刻において患者の疾病に最も関係する特徴を選択することを学習する。

我々の方法の第２の実施形態は、ロボットの制御システムである（請求項７）。

この実施形態が、図６に示されている。システムへの一次入力８が、ビデオ画像で構成され、コンテクストが、システムのモータの制御信号で構成される。この制御信号は、視覚システム５３の特徴ベクトル４４を入力として使用する何らかの外部モジュールによって生成される。処理ユニットの階層５３は、図４のものと同じ種類であるが、より多くの処理ユニットを有している。この実施例においては、４つの階層が使用され、その半分が、次元削減階層である。

図４のネットワークなど、視覚システム５３は、自身へと内部的にコンテクストを与える。このように、ネットワークは、ビデオ画像から連続的なコヒーレント全体を学習する。さらに、注意が、その中の全体へと払われる。視覚システム５３は、制御信号９をコンテクストとして取得するとき、ロボットの調節へと接続された視覚的特徴を表わすための学習を行う。例えば、遠方の物体がフィルタによって除かれ、ロボットのアクチュエータの近傍にある物体が表現される。請求項１９によれば、新しい情報のみが、視覚システム５３において表現される。例えば、ロボットが自身のアクチュエータのうちのいくつかを動かすとき、動くアクチュエータをビデオ画像８において見て取ることができ、したがってそれ以上視覚システム５３において表わす必要がないと予測することができる。代わりに、効用のより大きい何らかの他の情報がそこに表わされる。

さらに、請求項２０の特徴が使用され、視覚システムに、制御のために次の時刻に照らして重要な目標を表現させる。例えば、ロボットのアクチュエータが壁に向かって動いている場合、視覚システム５３は、制動行為および他の調節行為の到来を予測することができる。今や、壁および動いているアクチュエータが、最良のやり方でなすべき調節を予測する因子であり、視覚システム５３によって表わされるべく選択される。その結果、外部のコントローラが、衝突の前に前もって反応することができる。

請求項２１の特徴は、全システムの動作の成功についての全体的評価５４を得るための外部のモジュールを、システムへと追加する。このスカラ評価は、システムが上手く機能しているときに視覚システム５３の学習を高め、性能が良好でない場合に学習を少なくするために使用される。このやり方で、システムは、その表現が良好な性能につながるような特徴を、さらに強く表現するように学習する。

実施例１のさらなる詳細
患者の診断のための補助システム
この実施例においては、診断を促進するような特徴が、患者データから選択される。

入力データに含まれる一次入力は、患者の測定結果および患者において観察された症状で構成される。

測定結果は、血液の値（数百）および遺伝子チップで測定された遺伝子発現活動（数千）を含む。血液の値は、血液中の天然物質、免疫学的指標、および外部物質の濃度を含む。症状は、値ゼロおよび１で記述される。患者が所与の症状を有する場合、これに対応する要素が、値１に設定され、そうでない場合にはゼロである。

１つの処理ユニットが、この用途において使用される。処理ユニットは、診断の助けとして使用される前に学習セットによる学習が行われ、すなわちパラメータが修正されるため、一次入力から直接に診断を行うことはできない。

患者データおよび患者群からのコンテクストからなる上述の入力が、学習データの組として使用される。より多くの学習データが存在するほど、より良好に処理ユニットを学習させることができる。通常は、少なくとも１０人の患者のデータが必要とされるが、数千の患者からのデータも使用することができる。

学習の開始前に、処理ユニットのパラメータが、無作為な値で初期化される。学習の結果として、処理ユニットのパラメータが、処理ユニットが患者データから診断に照らして有用な特徴情報を生成するようなやり方で、修正される。学習の後で、本発明を、例えば健康センターの医師のための助けとして使用することができる。

そのようでないと述べない限り、処理ユニットは、図９のシミュレーションのとおりに機能する。或る患者の入力データが処理ユニットへと与えられたとき、さらに詳しく後述される以下の工程が実行される。

１．一次入力の前処理（主たる請求項のステップｂ）
診断を促進するような特徴のプレアクティベーションが、入力データから計算される。これは、パラメータ化関数によって実行され、そのパラメータは、１つの診断の実行の間は一定であるが、新たな診断に関連して常に修正（改善）される。より有用な情報が、パラメータによって一次入力から形成される。パラメータは、それぞれの診断の後で、この関数（プレアクティベーション）が最後（主たる請求項のステップｄ）に得られる種類の特徴情報をすでに元から与えるような関数となるようなパラメータに修正される。その結果、処理ユニットによって表わされる特徴が、可能な限り有用になるように次第に変化する。

２．最終的な特徴アクティベーションについての仮の予測が、コンテクストから形成される（主たる請求項のステップａ）。
プレアクティベーションの予測が、コンテクストから計算される（ここで、予測は、将来についての予測を指さず、回帰を指す）。これは、パラメータ化関数によって実行され、そのパラメータは、１つの診断の実行の間は一定であるが、新たな診断に関連して常に修正（改善）される。

３．予測が、予測された特徴が強められ、他の特徴が弱められるように、プレアクティベーションに組み合わせられる（主たる請求項のステップｃ）。

４．この段階において、特徴が、好ましくは非相関化され、換言すると、特徴の相違が強調され、類似性が弱められる（請求項５）。最終的な特徴アクティベーション、すなわち最終的な特徴情報が、上述の工程の後で最もアクティブな特徴を選択することによって得られる（請求項６）。

最初に、プレアクティベーションの予測が、コンテクストから計算される。上述のように、１０００のプレアクティベーションが存在し、コンテクストベクトルの長さは、５００である。予測のｙ＿ｐｒｅｄの計算のために我々が使用したパラメータ化関数は、１０００×５００のサイズの行列Ｗ＿ｐｒｅｄのすべての要素が修正可能なパラメータである行列乗算である。予測が、ｙ＿ｐｒｅｄ＝Ｗ＿ｐｒｅｄ×ｚとして計算され、ｚは、コンテクストベクトルである。たとえ患者の実際の血液レベルを、患者の診断による疾病履歴から正確に予測できなくても、これは、タスクに応じた効用を特徴の選択において使用することが望まれる場合に、不可欠な工程である。しかしながら、或る血液の値が他よりもおそらくは高いことを、患者の疾病履歴から予測することが可能である。この予測により、血液の値からの特徴の選択を案内することが可能である。

さらに詳しくは、入力情報の前処理が、以下のやり方で行われる。入力情報は、４０００という長さを有するベクトルである。それについて、無作為な投影によって非線形の展開が実行され、２００００という長さのベクトルが得られる。これは、処理ユニットの生成段階において、２００００×４０００というサイズの行列Ａ＿ｒｐおよび２００００という長さのベクトルｂが、が無作為に形成されていることを意味する。非線形の展開ｘ＿ｎｌが、式ｘ＿ｎｌ＝ｔａｎｈ（Ａ＿ｒｐ×ｘ＋ｂ）によって４０００という長さの入力情報ベクトルから計算され、ｔａｎｈは、双極正接であり、「×」は乗算を意味する。この前処理の結果は、線形成分を真の特徴成分として使用できるというものであるが、それらは、４０００次元空間の他用途な非線形の特徴に対応する。これは、有用な特徴の発見をより効果的にする。さらに、新しいベクトルｘ＿ｎｌの相関構造が球形にされ、これは、ベクトルの要素間に存在する相関が可能な限り少なく、要素の分散が値１に近いことを意味する。これは、白色化行列Ａ＿ｗｈによって左側から乗算を行うことによって実行される。この行列の構成員は、実際の学習の開始前に設定される。白色行列は、広く使用されている方法である主成分分析白色化によって設定される。この相関構造の球形化は、使用されたときに入力のアクティベーションの大きさが学習される特徴の種類を決定せず、代わりに有用な特徴を学習できるという理由で、有用である。

以下で、診断を促進する特徴のプレアクティベーションが、入力情報から計算される。今や、入力情報に２００００の要素が存在しており、我々は、１０００の特徴要素を使用する。したがって、我々は、１０００の異なる特徴についてアクティベーションを計算している。我々は、パラメータ化関数として行列の乗算を使用し、１０００×２００００というサイズの行列Ｗのすべての構成員が、修正可能なパラメータである。プレアクティベーションｙ＿ｐｒｅが、ｙ＿ｐｒｅ＝Ｗ×ｘ＿ｗｈを計算することによって得られ、ｘ＿ｗｈは、相関構造が球形化されたｘ＿ｎｌである。

その後に、予測が、予測された特徴が強められ、残りの特徴が弱められるように、プレアクティベーションに組み合わせられる。組み合わせｙ＿ｃｏｍｂ＝ｙ＿ｐｒｅ×（１＋ｙ＿ｐｒｅｄ）が計算され、ベクトルの間の乗算が、要素ごとに実行される。組み合わせのこのやり方の結果は、コンテクストに一致する特徴が強められるというものである。しかしながら、予測のみでは、新たなアクティベーションを形成することができず、既存のプレアクティベーションを強めるだけしかできない。

すべての特徴が患者データについての異なる事物を表わすようにするために、非相関化が行われる。非相関化は、ｙ＿ｃｏｍｂを左側から行列Ａ＿ｄｅｃで乗算することによって実行される。この行列の構成員が、他の修正可能なパラメータと同じ工程で修正される。

スパース化
最終的な特徴アクティベーションｙが、上述の工程の後で最もアクティブな特徴を選択することによって得られる。これは、図８の説明に関して述べたやり方で実行される。ここで必要とされるスパース化のしきい値が、初めに、処理ユニットの学習を開始させる前に、一定の値へと設定される。これは、スパース度の指標が、図８の説明に従ってスパースモデルベクトルについて計算されるように実行される。このモデルベクトルは、処理ユニットの特徴ベクトルと同じ次元を有しており、モデルベクトルの要素の５％（切り上げによる）が、値１に設定されている一方で、残りの要素の値は、ゼロである。このモデルのスパース度が、スパース度のしきい値として設定される。

最終的な特徴が計算されたとき、処理ユニットが学習させられ、すなわちパラメータＷ、Ｗ＿ｐｒｅｄ、およびＡ＿ｄｅｃが修正される。

プレアクティベーションを形成するための関数のパラメータＷは、この関数が最後に得られる値により近い特徴アクティベーションをすでに元から生成するように修正される。このやり方で、処理ユニットによって表現される特徴が、可能な限り有用になるように修正される。パラメータは、ａ×ｙ×ｘ＿ｗｈ＾Ｔが行列Ｗへと加えられるように修正され、「ａ」は、学習率であり、＾Ｔは、転置を意味する。学習率は、ａ＝０．００００１である。最後に、行列Ｗの行が、単位長さを有するように正規化される。

コンテクストからプレアクティベーションを予測する関数のパラメータは、この患者の特徴のプレアクティベーションをすでに元からよりよく予測するように修正される。パラメータは、ａ＿ｐｒｅｄ×ｙ＿ｐｒｅ×ｚ＾Ｔが行列Ｗ＿ｐｒｅｄにおいて加えられるように修正され、学習率は、ａ＿ｐｒｅｄ＝０．００１である。非相関化パラメータは、ａ＿ｄｅｃ×（−ｙ×ｙ＾Ｔ−Ａ＿ｄｅｃ）が行列において加えられるように修正され、その後に、行列の対角線要素が１に設定される。学習率は、ａ＿ｄｅｃ＝０．０１である。

この後で、学習データ内の次の患者の患者データが処理され、対応する入力情報が形成される。この方法が、すべての学習データが処理されるまで、工程１から繰り返される。その後で、処理ユニットは、新たな患者データの分析に使用されるべく準備ができた状態となる。新たな患者データの分析は、学習データを処理するときと同じ工程に従って実行される。しかしながら、必要であれば、修正を阻止することができる。なぜならば、健康センターにおいて処理されるべき患者データが、学習データとして使用されるべく選択された材料ほどに信頼できるのかどうか、定かではないからである。

処理の結果、システムは、患者の測定結果を診断のために役立つ形態になるように処理する。さらに、この莫大な量のデータから、患者の疾病履歴に照らして最も不可欠である特徴を選択する。その結果、それらは、診断すべき新たな疾病に照らしても、最も不可欠である可能性が高い。処理ユニットが、コンテクストによって与えられる予測を特徴のプレアクティベーションに組み合わせる場合、種々の特徴の表現の効用が、特徴を選択するときに最終的な効用に照らして考慮される。

実施例２のさらなる詳細
ロボットのための視覚システム
この実施例では、処理ユニットの学習が、ロボットのモータの適切な制御を可能にするようなデータをロボットのビデオカメラデータから選択するために行われる。

ロボットが複雑な環境で働くとき、視覚システムは、ロボットが避けなければならない障害物、ロボットの移動に影響を及ぼす地形、ロボットによって操作される対象物および対象物の位置を、カメラ画像から識別しなければならない。

このために、多数の処理ユニットが階層にて使用される。第１の階層のユニットが、ビデオカメラ画像（一次入力）の種々の部分を入力情報として受け取る。それらは、制御信号および階層の他の処理ユニットからの特徴を、コンテクストとして受け取る。上位の階層の処理ユニットは、同じコンテクストを取得するが、それらが取得する一次入力データは、下位の階層の処理ユニットによって選択された特徴で構成される。下位の階層が、カメラ画像内の単純な局所形態に相当する特徴を選択する。上位の階層によって選択される特徴は、カメラ画像内の複雑な物体および他の構造体に相当する。

特徴は、静的なだけでなく、物体の動きおよび物体間の相互作用も記述する。これは、第１には、３つの後続する時点からの一次入力を最下位の階層へと与えることによって達成され、第２には、現時点ならびに先の２秒および将来の２秒の両方からのコンテクストを与えることによって達成される。現在のコンテクストが、患者データの用途の場合と同じやり方で使用される。次いで、近接過去のコンテクストが、請求項１９によるやり方で使用される。過去のコンテクストが現在の特徴を予測できる場合、それらを表わす効用が、減少させられる。近接未来のコンテクストは、請求項２０によるやり方で使用される。このコンテクストは、処理ユニットがその特徴を計算するときは使用されないが、主たる請求項のステップｄにおいて使用される。将来のコンテクストが現在の特徴を予測できる場合、それらは、パラメータ修正工程において他よりも重み付けされる。

ロボットの制御システムの実現は、現実には、直接的に生のカメラ画像によるのではなく、このような特徴によって可能である。請求項１９および２０による効用の計算が、システムを、常に新規な情報を表わすように試みさせる。さらに、そのような情報にもとづき、ロボットのモータのための未来の制御信号を予測することができる。そのような特徴は、制御信号が選択されるタスクにおいて有用である。

この実施例においては、物体を操作する目的の手を有している車輪上のロボットが使用される。手は、２つの関節と、手を閉じることによって把持を可能にするアクチュエータとを有している。両方の関節が、２つのモータを有しており、把持具が、１つのモータを有している。さらに、両方の車輪が１つのモータを有している。ビデオカメラが、ロボットの本体の前部に位置している。手の動きと一緒に動くことはない。１００×１００というサイズ、すなわち１００００ピクセルの画像が、このビデオカメラから得られる。フレームレートは、１秒に付き１０枚の画像である。ロボットの制御信号は、階層の上位レベルの処理ユニットによって生成される特徴情報と必要とされる他の情報（関節および把持手の位置、それらに作用している力、および動作の目標）とを入力として受け取る別の制御ユニットにて生成される。制御ユニットは、自身の入手するフィードバックから、（いわゆる小脳学習を使用して）所定の反射によって学習を行う（我々は、一般的に使用されている方法であるＳＡＲＳＡ学習を使用した）。制御ユニットが、受け取った情報にもとづいてタスクを実行するためにふさわしい制御信号を生成できることが、本発明に照らして必須である。モータのすべての制御信号が、すべての処理ユニットへとコンテクストとして与えられる。

処理ユニットを備える４つの階層が存在する。それらのうちの第１は、３つの連続する時点からの静止フレームを取得する。それは、このやり方で動的な特徴を学習する。第１の階層は、１０×１０の処理ユニットを有しており、そのそれぞれが、元の画像の１０×１０ピクセルのサイズを有する部分を、入力情報として取得する。各ユニットは、当然ながら、画像の別の部分を取得する。第１の階層のユニットは、８００の特徴を計算する。第２の階層も、１０×１０のユニットを有しており、そのそれぞれが、下位の階層の１つのユニットによって計算された特徴を、入力情報として取得する。第２の階層の各ユニットは、１５０の特徴を計算する。第３の階層は、５×５のユニットを有しており、そのそれぞれが、第２の階層の４つのユニットからの特徴を、入力情報として取得する。第３の階層の各ユニットは、１０００の特徴を計算する。第４の階層も、５×５のユニットを有しており、そのそれぞれが、下位の階層の１つのユニットからの特徴を、入力情報として取得する。第４の階層の各ユニットは、１００の特徴を計算する。

第２および第４の階層は、多数の特徴からそれよりも少ない数の特徴を計算する。すなわち、次元の削減を実行する。これは、これらのユニットの一般化を強いるため、有用である。モータの制御に無関係な特徴が除かれ、残りの特徴が有用であり、一般化されている。

システムがロボットのための制御システムの一部として使用される前に、学習セットによって学習が行われ、すなわちパラメータが変更される。最初に、すべてのパラメータが無作為に初期化される。スパース化のしきい値が、患者の診断の用途の場合と同じやり方で、スパースモデルベクトルによって初期化される。学習データが、いかなる自動制御システムも使用せずにロボットを手動で制御することによって取得され、単純な自動制御シリーズによって制御することによって取得される。このやり方で、得られる学習データは、ロボットによって収集されたカメラ画像およびモータの同時の制御信号の両者によって構成される。システムがロボットのための制御システムの一部として使用されるとき、このパラメータの修正が続けられる。

それぞれの処理ユニットは、請求項１８〜２１による前処理およびコンテクストの使用を除き、患者の診断のための補助システムの場合と同様に、個々に機能する。処理されるデータは、当然ながら異なるが、動作の機構は、具体的に述べられる例外がなければ、同じである。

この用途においては、多数の処理ユニットが使用されるため、それらのそれぞれによって生成される特徴（特徴情報）が、それぞれの３つ組静止フレームについて多数回計算され、パラメータの修正は、全システムがすべての特徴を計算し終えるまで実行されない。この繰り返しは、以下のやり方で実行される。第１に、階層の最も下位の処理ユニットが、それらの特徴（特徴情報）を計算する。次いで、計算が、階層の上部へと一階層ごとに進められる。この後で、計算が、上方から下方へと逆順で進められる。この繰り返しは、個々の処理ユニットが特徴を選択するときに、残りのユニットの入力およびコンテクスト情報が変化するために必要である。この階層における上向きおよび下向きの繰り返しが、それぞれの３つ組静止フレームについて２回実行される。次いで、すべての処理ユニットが、自身が計算した特徴をそれらのコンテクストに一致するように修正する時間を有する。

個々の処理ユニットは、以下のやり方で特徴を計算する。

１．一次入力情報が前処理される（主たる請求項のステップｂ）。

患者の診断の用途において行われたのと同様に、第１の階層の入力情報が白色化される。しかしながら、特徴の非相関化がそれらを充分に非相関にするため、上位の階層の入力を白色化する必要はない。特徴のプレアクティベーションが、一次入力から計算される。これは、パラメータ化関数によって実行され、そのパラメータは、１つの３つ組カメラ画像の処理の間は一定である。患者の診断の用途の場合と同様に、行列の乗算が、ここでも使用される。第１の階層において、８００×１００というサイズの特徴行列が使用され、第２の階層では、１５０×８００というサイズであり、第３の階層においては、１０００×６００というサイズであり、第４の階層においては、１００×１０００というサイズである。

２．最終的な特徴アクティベーションについての仮の予測が、コンテクストから形成される（主たる請求項のステップａ）。

プレアクティベーションについての３つの異なる予測が、コンテクストから計算される。ｙ＿ｐｒｅｄ１が、過去のコンテクストから計算され、ｙ＿ｐｒｅｄ２が、現在のコンテクストから、ｙ＿ｐｒｅｄ３が、未来のコンテクストから計算される。これらのうちの最後の１つは、後まで計算されず、パラメータの修正の工程において使用される。ユニットがその特徴を時々刻々と計算するとき、最初の２つの予測のみが使用される。予測は、パラメータ化関数によって計算され、そのパラメータは、１つの３つ組カメラ画像の処理の間は一定であるが、新たなそれぞれの３つ組画像に関連して常に修正（改善）される。患者の診断の実施例の場合と同様に、線形回帰がここでも使用され、すなわち予測が、コンテクストベクトルを行列Ｗ＿ｐｒｅｄ１、Ｗ＿ｐｒｅｄ２、およびＷ＿ｐｒｅｄ３で乗算することによって得られる。初めに、コンテクストベクトルｚ１、ｚ２、およびｚ３が、同じ階層のすべてのユニットによって表わされる特徴を有している。次に、このユニットが自身の特徴を与えた上位の階層の処理ユニットの特徴が存在し、最後に、モータのための７つの制御信号が存在する。現時点のコンテクストｚ２において、これらが１回生じる一方で、これらが、２秒のコンテクストｚ１およびｚ３においては２０回生じる（１秒につき１０枚の画像が２秒間）。したがって、最も下位の階層の行列Ｗ＿ｐｒｅｄ２のサイズは、８００×７９３５７であり、第２の階層のそれのサイズは、１５０×１５８５７であり、第３の階層のそれのサイズは、１０００×２４１０７であり、第４の階層のそれのサイズは、１００×２４０７である。対応する行列Ｗ＿ｐｒｅｄ１およびＷ＿ｐｒｅｄ３においては、２０倍も多い列が存在するが、そのほかの点では同じ形態を有している。

３．予測が、予測された特徴が強められ、他の特徴が弱められるように、プレアクティベーションに組み合わせられる（主たる請求項のステップｃ）。患者の診断の実施例の場合には、式ｙ＿ｃｏｍｂ＝ｙ＿ｐｒｅ×（１＋ｙ＿ｐｒｅｄ２）が使用されると考えられるが、この用途においては、予測可能な特徴の表現の効用を減らすために、古いコンテクストにもとづいて作成された予測ｙ＿ｐｒｅｄ１が含まれなければならない。この目的のため、式ｙ＿ｃｏｍｂ＝ｙ＿ｐｒｅ×（１＋ｙ＿ｐｒｅｄ２−０．２×ｙ＿ｐｒｅｄ１）が使用される。

４．この工程において、特徴が、好ましくは非相関化され、すなわち特徴の間の相違が強調され、それらの類似性が弱められる（請求項５）。最終的な特徴アクティベーション、すなわち最終的な特徴情報が、上述の工程の後で最もアクティブな特徴を選択することによって得られる（請求項６）。

繰り返しの終わりにおいて、次の３つ組画像の処理（主たる請求項のステップｅ）が始まる前に、すべてのユニットのパラメータが、現在の特徴アクティベーションによって修正される（主たる請求項のステップｄ）。これは、各ユニットについて、患者の診断の用途とほぼ同じやり方で行われるが、プレアクティベーションの計算において、未来のコンテクストによって与えられる予測が、使用すべきパラメータの修正において考慮される。患者の診断の用途においては、行列ａ×ｙ×ｘ＾Ｔが行列Ｗへと加えられると考えられるが、この用途においては、行列ａ×（ｙ＋０．２×ｙ＿ｐｒｅｄ３）×ｘ＾Ｔが加えられる。

請求項２１に効果は、制御ユニットによって使用されるフィードバック信号にもとづいて上位の階層の処理ユニットによって使用される学習率「ａ」を修正することによって得られる。したがって、フィードバック信号は、ＳＡＲＳＡ法によって使用されるいわゆるＴＤ信号（時間差信号）と同じである。ここで使用される方法においては、フィードバック信号が、常に０と１との間である。階層の最上位において使用される学習率は、０．００００１の代わりに、値（１＋ｄ）×０．００００１である。

この処理すべての結果として、階層において、最下位の階層から最上位の階層へと徐々により複雑であってロボットの制御タスクに関してより有用であるような特徴が作り出される。それぞれの処理ユニットが、自身のコンテクストデータを自身の特徴アクティベーションおよび特徴の選択に組み合わせるときに、効用を考慮する。

別の実施形態
上述の実施形態に加えて、本発明の基本的考え方は、別のさまざまなやり方においても実行可能である。上述の実施形態においては、処理ユニットが別々であり、表現の選択および特徴の非相関化が、処理ユニットの内部においてのみ実行されていた。代案として、処理ユニットの境界がより柔軟であってよい。例えば、非相関化を、連続的な値の近傍がそれぞれの特徴要素について定められるように実行することができる。最も近い特徴要素が、大きな近傍重み付けを得、より離れていると、より小さな値を得、最も離れていると、まったく近傍に属さないと考えられる。また、表現特徴および適応特徴の選択を、状況に応じてより局所的な選択またはより広い選択を動的に可能にするようなアルゴリズムで実行することが可能である。

処理ユニットを、プログラムによって実行でき、あるいは例えばこの方法に専用化されたプロセッサで実行することができる。したがって、実施形態は、いかなる物理的な具現化にも限定されない。また、特徴のアクティベーションを、数字以外の他のやり方で表わすことができる。それらを、例えば電圧値と同様の専用化された回路の連続値で表わすことができる。

とくには、特徴の表現から得られる効用の基準が、用途に大きく依存する。コンテクストのための新規性、コヒーレンス、および関連性は、きわめて一般的に使用されており、本明細書において提示されている。さらに、そのような方法を、コンテクストが２つの異なるやり方で使用されるように使用することができる。一方では、一次入力にどの特徴が存在するかの評価を改善するために統計的に使用でき、他方では、どの特徴が表現のために有用かの評価に使用することができる。

Claims

処理ユニットにおいて情報を選択し、タスクを実行するために使用される特徴情報を最終結果として得るために、処理ユニットへの入力データを、一次入力と実行すべきタスクに関する一般的情報を表わしているコンテクストとで構成される入力情報からタスクに照らして有用な情報を発見する目的で処理して、入力情報の特徴を表わす特徴情報を入力情報から形成し、特徴情報の値をその効用にもとづいてさらに処理する方法であって、
ａ）第１のパラメータおよびパラメータ化関数によって、入力情報の組のうちの第１のコンテクストから、予測が形成され、
ｂ）第２のパラメータおよびパラメータ化関数によって、入力情報の組のうちの第１の一次入力から、プレアクティベーションが形成され、
ｃ）ステップａ）において形成される予測にもとづき、予測される特徴が予測されない特徴よりも高い効用を有すると考えるやり方で効用を評価し、評価による効用が高い特徴を強める一方で、他の特徴を弱めることによって、プレアクティベーションから特徴情報が形成され、
ｄ）第２のパラメータが、ステップｂ）で使用されたならばステップｃ）の特徴情報に対応する計算結果を与えるであろうやり方で修正され、
ｅ）ステップａ）〜ｄ）が、入力情報の組のそれぞれの要素について繰り返される
ことを特徴とする方法。
ステップｄ）において、第１のパラメータも、ステップａ）で使用されたならばステップｂ）のプレアクティベーションまたはステップｃ）の特徴情報に対応する計算結果を与えるであろうやり方で修正されることを特徴とする請求項１に記載の方法。
情報が、種々の値の数字として数値の形態で表わされ、該数字が、特定の特徴を記述していることを特徴とする請求項１または２に記載の方法。
ステップｃ）において得られた特徴情報が、改善された特徴情報を得るべく情報を構成している値の相違を強調するために、特徴情報の値から相関を取り除くことによって非相関化されることを特徴とする請求項１〜３のいずれか一項に記載の方法。
特徴情報が、ロボットのための制御信号を生成するために使用され、
一次入力が、環境およびロボットのセンサによって測定されるロボットの状態についての情報で構成され、コンテクストが、ロボットのモータの制御信号など、ロボットの制御部へと直接に接続された信号で構成されることを特徴とする請求項１〜４のいずれか一項に記載の方法。
特徴情報が、疾病の診断に使用され、
一次入力が、患者の測定値および症状データで構成され、コンテクストが、患者において観察された疾病についての情報で構成されることを特徴とする請求項１〜４のいずれか一項に記載の方法。
１つ以上の種類の入力が、部分的または完全に白色化されることを特徴とする請求項１〜６のいずれか一項に記載の方法。
特徴情報の数字が、入力情報の組において対応するキャラクタを記述している各数字の平均がほぼ同じになるように敏感化されることを特徴とする請求項１〜７のいずれか一項に記載の方法。
複数の処理ユニットを、処理ユニットが自身の形成した特徴情報を処理ユニットの一次入力として相互に届けるように接続することによって、複数の処理ユニットにおいて実行されることを特徴とする請求項１〜８のいずれか一項に記載の方法。
複数の処理ユニットを、処理ユニットが自身の形成した特徴情報をコンテクストとして相互に届けるように接続することによって、複数の処理ユニットにおいて実行されることを特徴とする請求項１〜９のいずれか一項に記載の方法。
処理ユニットが、階層的なやり方で接続されることを特徴とする請求項１０に記載の方法。
ステップｃ）において処理ユニット全体の特徴の効用を評価するときに、処理ユニットによって表わされる特徴の効用についての評価が、外部のモジュールによって与えられ、コンテクストとして考慮されることを特徴とする請求項１〜１１のいずれか一項に記載の方法。