JP3826197B2

JP3826197B2 - ロボットの位置および向きの情報の自己組織的学習処理方法ならびにその学習処理システム、およびその学習プログラム

Info

Publication number: JP3826197B2
Application number: JP2003414118A
Authority: JP
Inventors: 章伊達; 耕治倉田
Original assignee: National Institute of Information and Communications Technology
Current assignee: National Institute of Information and Communications Technology
Priority date: 2003-12-12
Filing date: 2003-12-12
Publication date: 2006-09-27
Anticipated expiration: 2023-12-12
Also published as: JP2005174040A

Description

本発明は、ある空間を自由に移動できるロボットの位置ならびに向きの情報を当該ロボットの視覚的時系列信号から分離・抽出するために、当該ロボットの位置ならびに向きを自己組織化モデルにより学習する処理方法、前記処理方法を実行する処理システム、および前記処理システムとしてコンピュータを機能させるためのプログラムに関する。

外界の構造を自己組織的に獲得するメカニズムは、生物の研究においてもロボットの研究にとっても興味深いものである。人間は、普段、見慣れた場所であれば自分がどこにいて、どこを向いているかをわかっている。これは、人間が繰り返し与えられた視覚情報を学習した成果である。

視覚情報から自己の位置や自己が見ている方向（向き）を自己組織的に獲得する能力については様々な研究が行われている。特にラットの脳の海馬には、ある特定の場所にきたときに選択的に反応する「場所細胞」と呼ばれる神経細胞が存在することが知られている。

また、移動可能なロボットの誘導や行動生成のためには環境地図が有用であると考えられ、センサ情報から外界の構造を抽出する様々な手法が提案されている。ロボットが部屋の中の動き回る状況を考えてみると、ロボットの周囲の画像など視覚センサから入力される情報は、ロボットの位置と向きに依存して決まる。

図１３に、移動可能なロボットが置かれたある部屋の平面図の例を示す。また図１４に、図１３に示す部屋に置いたロボットの視覚センサから入力されたロボット周囲の画像例を示す。図１４（Ａ）〜（Ｅ）は、それぞれ、ロボットが図１３の平面図に示す（Ａ）〜（Ｅ）の位置および矢印の向きに位置する場合に、ロボットの視覚センサから入力される周囲の画像（視覚画像）例である。

図１４（Ａ）および（Ｂ）は、ロボットの向きが同じで位置のみが異なる画像例であり、図１４（Ｃ）〜（Ｅ）は、ロボットの位置が同じで向きのみが異なる画像例である。これらの画像から、同一方向で位置のみが異なる場合の視覚画像では、入力される範囲の広狭はあるが範囲そのものはあまり変わらず、一方で、同一位置で方向のみが異なる場合の視覚画像では、入力される範囲が大きく変化することがわかる。

このような視覚入力情報だけを使用してロボットの位置や向きを知るためには、入力画像という高次元の情報から部屋での位置（２次元）および向き（１次元）という２つの情報を分離する必要がある。

コホネンの自己組織化マップ（ＳＯＭ：Ｓｅｌｆ−ＯｒｇａｎｉｚｉｎｇＭａｐ）は、このような高次元のデータを要約し重要な変数を抽出することに利用できる。ＳＯＭは、例えば２次元に配列された素子からなり、大脳皮質の感覚野に見られる機能地図がある種の学習アルゴリズムにより形成されていくさまを説明する数理モデルである（例えば、非特許文献１参照）。ＳＯＭは、入力信号空間中で隣接する領域がＳＯＭ上でも隣接する素子に表現されるという特徴がある。なお、ＳＯＭの配列が２次元であることは本質的ではなく、必要に応じて１次元や３次元の配列を考えることができる。

一方、様々な位相構造を持つ入力信号に対応できる自己組織化モデルとしてニューラルガスが知られている（非特許文献２参照）。

図１５に、ＳＯＭによる自己組織化およびニューラルガスによる自己組織化を説明するための図を示す。

ＳＯＭの各素子は、参照ベクトルｍと呼ばれるｎ次元ベクトルを持つ。以下では、ｉ番目の素子の参照ベクトルをｍ_iとする。参照ベクトルｍ_iの次元は、ＳＯＭに与えられる入力信号ｘの次元と同一である。

ＳＯＭ１：参照ベクトルｍ_i（ｉ＝１，…，ｎ）の初期値を設定する。ｎはＳＯＭの素子数である。

ＳＯＭ２：入力信号（入力ベクトル）ｘを生成する。

ＳＯＭ３：すべての素子の中で入力信号ｘに最も近い参照ベクトルｍ_iを持つ素子（以後、勝者ｃと呼ぶ）
ｃ＝ａｒｇｍｉｎ_i‖ｍ_i−ｘ‖ 式(1)
を求める。

ＳＯＭ４：以下の式(2) および式(3) にしたがい参照ベクトルｍ_i（ｉ＝１，…，ｎ）の学習を行う。

ｍ_i＝ｍ_i＋ αｈ_ci（ｘ−ｍ_i）式(2)
ｈ_ci＝ｅｘｐ−‖ｒ_c−ｒ_i‖²／２σ² 式(3)
ここで、ｒ_iはｉ番目の素子の配列上（神経場）での位置、αは学習の強さを表す正の定数である。

ＳＯＭ５：ＳＯＭ２にもどって処理を繰り返す。

ＳＯＭによる学習において、学習は勝者ｃの周囲でおこる。これを近傍学習といい、ｈ_ciを近傍関数という。前記の式(3) で与えた近傍関数はガウス関数を使用している。σは近傍の広がりを決定する正の定数である。式(1) の絶対値は、入力信号空間内のユークリッド距離、式(3) の絶対値は、素子配列上のユークリッド距離である。

さらに、ニューラルガスによる学習を簡単に説明する。

ＧＡＳ１：参照ベクトルｍ_i（ｉ＝１，…，ｎ）の初期値を設定する。ｎは素子数である。

ＧＡＳ２：入力信号（入力ベクトル）ｘを生成する。

ＧＡＳ３：入力信号ｘに対し、参照ベクトルｍ_iとのユークリッド距離をすべての素子について求め、距離の小さい順に素子を順位付けする。以下ではｉ番目の素子は第ｓ_i位にランクされたと仮定する。

ＧＡＳ４：以下の式(4) にしたがい参照ベクトルｍ_i（ｉ＝１，…，ｎ）の学習を行う。

ｍ_i＝ｍ_i＋αｇ（ｓ_i）（ｘ−ｍ_i）式(4)
ＧＡＳ５：ＧＡＳ２に戻って処理を繰り返す。
ニューラルガスでは、学習は入力信号ｘに近い参照ベクトルｍ_iを持つ素子ほど大きく、その大きさを決定する関数がｇ（ｓ）である。例えば、Ｒ，０≦Ｒ＜１として、
ｇ（ｓ）＝Ｒ^s-1（ｓ＝１，２，…，ｎ）式(5)
を用いる。

このように、ＳＯＭにおける学習が近傍学習であるのに対し、ニューラルガスでは順位学習が行われる。ニューラルガスでは素子間の隣接関係を順位学習後に定義するため、様々な形状を持つ信号空間に対応することができるという特徴がある。
T. Kohonen, "Self-organized formation of topology correct feature maps," Biological Cybernetics, vol.43, 1982, pp.59-69 T. Martinetz, S. Berkovich, K. Schulten, "Neural-gas network for vector quantization and its application to time-series prediction," IEEE Transactions on Neural Networks, 4, 1993, pp.558-567

本発明者らは、本発明に関連する技術として、ＳＯＭを注意深く利用することによって視覚入力情報からロボットの位置および向きの情報を分離して自己組織化できる手法を示した（参考文献１参照）。

［参考文献１：K. Kurata, N. Oshiro, "Information separation of position and direction of a robot by self-organizing map," Proceedings of the 8th International Symposium on Artificial Life and Robotics, 2003, pp641-644 ］
しかし、ＳＯＭは、入力信号空間中で隣接する領域がＳＯＭ上でも隣接する素子に表現されることから、障害物がある部屋や正方形ではない部屋の構造を自己組織的に獲得することは難しい。

あらかじめ部屋の形状がわかっていればＳＯＭの構造をその部屋の形状に合わせることができるが、それでは自己組織化の意味の大半が失われてしまう。

一方、ニューラルガスは、様々な位相構造を持つ入力信号に対応することができるが、参照ベクトル数が増大すると計算量が増大してしまう。

本発明の目的は、障害物があるような未知の空間に置かれたロボットの位置および向きの情報を当該ロボットの視覚入力情報から分離・抽出するために、当該視覚入力情報を自己組織化モデルに与えることによってロボットの位置および向きを自己組織的に学習する処理方法、および前記処理方法を実施する処理システム、前記処理システムとしてコンピュータを機能させるためのプログラムを提供することである。

部屋の中に置かれたロボットの位置と向きの情報を考えた場合に、部屋の形状すなわちロボットが移動可能な範囲は未知であるが、ロボットの向きの情報が円環のトポロジーを持つことは明らかである。

そこで、本発明は、ロボットの位置および向きの情報を分離・抽出できるように、ロボットの向きについての学習ではＳＯＭの特徴を、ロボットの位置についての学習ではニューラルガスの特徴をそれぞれ利用したＳＯＭとニューラルガスの直積モデル（以下、直積モデルとする）によりロボットの位置の選択性および向きの選択性を学習する。

本発明は、ある空間を自由に移動できるロボットの視覚センサが入力した視覚入力情報から当該空間における当該ロボットの位置および向きの情報を分離・抽出するために、当該視覚入力情報をニューラルネットワークモデルに与えて当該モデルを自己組織的に学習する処理方法であって、前記位置のための第１軸と第２軸で作られる面に複数の素子が独立して配置された素子面と前記向きのための第３軸の方向に各素子面の１つの素子が隣り合う関係を保持して属する素子コラムとにより構成される３次元構造であって、かつ前記素子コラムが前記向きの位相に対応して円環上に構成されるＳＯＭとニューラルガスの直積モデルを備え、前記直積モデルに前記視覚入力情報を入力する視覚情報入力処理過程と、前記直積モデルにおいて、前記視覚入力情報に最も近い参照ベクトルを持つ素子を求めて勝者とし、前記勝者について、前記直積モデルの素子面を用いて前記位置の選択性について順位学習を行い、かつ、前記直積モデルの素子コラムを用いて前記方向の選択性について近傍学習を行い、前記位置および方向の選択性の学習から、前記素子ごとに前記位置および前記向きの選択性を取得する学習処理過程とを備える。

本発明では、ロボットの視覚入力情報を直積モデルに与えて、ロボットの向きの情報を自己組織化するためにロボットの方向に対応させた円環状のＳＯＭとして構成された素子コラムを用いて近傍学習を行い、ロボットの位置の情報を自己組織化するためにニューラルガスとして構成された素子面を用いて順位学習を行うというＳＯＭおよびニューラルガスの２つの学習アルゴリズムを組み合わせた学習モデルを用いて、ロボットの視覚入力信号からロボットの位置および向きの情報を分離・抽出できるように、各素子について位置および向きの選択性を取得する。

加えて、本発明は、さらに、前記ロボットの直前の状態からの位置または向きのいずれか一つの変化を前記直積モデルに入力する変化入力処理過程を備え、前記学習処理過程では、前記変化入力処理過程において前記位置の変化を入力した場合に、前記視覚入力情報に最も近い参照ベクトルを持つ素子を前回の勝者が属する素子面から決定し、決定した勝者について前記順位学習および前記近傍学習を組み合わせた学習を行って、前記素子ごとに前記位置および前記向きの選択性を取得する。

または、本発明は、前記ロボットの直前の状態からの位置または向きのいずれか一つの変化を前記直積モデルに入力する変化入力処理過程を備え、前記学習処理過程では、前記変化入力処理過程において前記向きの変化を入力した場合に、前記視覚入力情報に最も近い参照ベクトルを持つ素子を前回の勝者が属する素子コラムから決定し、決定した勝者について前記順位学習および前記近傍学習を組み合わせた学習を行って、前記素子ごとに前記位置および前記向きの選択性を取得する。

本発明によれば、対象となる部屋に置いたロボットの視覚センサで入力された周囲の情報（視覚入力情報）から、その部屋におけるロボットの位置および向きの選択性を分離・抽出できるように直積モデルを用いて自己組織的に学習する。

これにより、範囲が未知な部屋であっても、あらかじめマーカなどを設定することなく、部屋内でロボットをランダムに移動させるだけで、ロボットの位置および向きの情報を分離・抽出できるようになる。

また、本発明では、２次元の情報である位置に対応する第１軸と第２軸で作られる面に素子が独立して配置された素子面（ニューラルガス）と、１次元の情報である向きに対応する第３軸の方向に各素子面の素子１つが属する素子コラム（ＳＯＭ）との次元の構造を持ち、さらに向きの情報のトポロジーに対応するため素子コラムが円環上に構成された直積モデルにより学習する。

これにより、障害物があるような未知の形状の部屋であっても、ロボットの位置および向きの情報を、同時に分離・抽出することができる。

さらに、本発明は、前時刻でのロボットの状況から位置が変化した場合には前時刻での処理と同一の素子面から勝者を決定し、または、前時刻でのロボットの状況から向きが変化した場合には前時刻での処理と同一の素子コラムから勝者を決定して、近傍学習と順位学習とを組み合わせた学習を行う。これにより、ニューラルガスのみによる学習処理の計算量の増大を抑制しつつ、精度よく位置および向きを分離・抽出することができる。

図１に、本発明を実施するための最良の形態における、本発明の構成例を示す。本発明の自己組織的学習処理システム１は、視覚入力情報取得部１１および位置および向き学習部１５から構成される。

視覚入力情報取得部１１は、ある空間を自由に移動できるロボットの視覚センサで入力されたロボットの周囲についての情報（視覚入力情報）を取得する処理手段である。

図２に、ロボットが置かれる部屋およびロボットの視覚センサの例を示す。図２は、ロボット２が四角形の部屋に置かれている状況を平面的に表した図である。部屋の四方の壁の色は、青、黒、白、赤と各面がそれぞれ異なっているとする。ロボット２の位置を、”（ｕ，ｖ），０≦ｕ，ｖ≦１”で表す。

ロボット２の筐体の周囲には全周を６０等分するように６０個の視覚センサｓｓ_i（ｉ＝１，…，６０）が付与されており、各視覚センサｓｓ_iは、その正面の壁の色１ピクセルを識別できるものとする。各視覚センサｓｓ_iからの情報を入力信号（青，黒，白，赤）の違いにより、
（ｓｓ_i1，ｓｓ_i2，ｓｓ_i3，ｓｓ_i4）＝（１，０，０，０），青
（０，１，０，０），黒
（０，０，１，０），白
（０，０，０，１），赤式(6)
と表す。入力情報は全体として２４０ビットの情報として表現される。

このような情報をそのまま入力信号として用いると次元が高すぎて学習処理に時間がかかりすぎるので、視覚入力情報取得部１１は、視覚入力情報の次元を縮約する。すなわち、ロボット２の６０個の視覚センサｓｓ_iからの入力を１５×４のブロックに分け、以下のような１６次元の入力信号（入力ベクトル）ｘ（ｘ＝ｘ₁，…，ｘ₁₆）を生成する。

ｘ_4*(j-1)+1＝Σ_aｓ_ij（Σ_aはｉが１から１５までの総和）
ｘ_4*(j-1)+2＝Σ_bｓ_ij（Σ_bはｉが１６から３０までの総和）
ｘ_4*(j-1)+3＝Σ_cｓ_ij（Σ_cはｉが３１から４５までの総和）
ｘ_4*(j-1)+4＝Σ_dｓ_ij（Σ_dはｉが４６から６０までの総和）
（ｊ＝１，…，４）式(6')
例えば、ｘ₁は、１番目から１５番目の視覚センサのうち青色の壁を見ているセンサの個数となる。

位置および向き学習部１５は、ある部屋におけるロボット２の位置および向きの情報を分離するための学習モデルとして、ＳＯＭとニューラルガスの直積モデル（直積モデル）を用いて、その部屋内における位置および向きの選択性を自己組織的に学習する処理手段である。

直積モデルには、視覚入力情報取得部１１で生成された入力信号、および位置変化または向きの変化信号が与えられる。変化信号とは、ロボット２が、その直前の処理におけるロボット２の位置だけが変化したか（位置変化）または同一位置で向きだけが変化したか（向き変化）を示す信号である。変化信号は、例えばロボット２の自律的な移動を制御する制御部（図示しない）で生成される。または、位置変化または向き変化をランダムに発生させる発生処理部（図示しない）で生成されてもよい。なお、変化信号は、視覚センサｓｓ_iにも通知される。視覚センサｓｓ_iは変化信号を受け取って視覚入力情報を入力する。

ロボット２は、学習中に部屋をくまなくランダムに動くことができるが、次の時刻には現在の状態から位置または向きのどちらか一方が変化し、ロボット２の位置と向きが同時に変化することはないとした。すなわち、位置および向き学習部１５は、一回に位置変化または向き変化のいずれか一方の信号が与えられる。

図３に、位置および向き学習部１５のＳＯＭとニューラルガスの直積モデルの例を示す。図３の直積モデルの神経場は３次元構造を持つ。直積モデルを３次元構造とするのは、本例では１６次元である入力信号ｘが本質的に３次元の構造を持つものであって、入力信号ｘから２次元の位置情報と１次元の向きの情報とを同時に分離できるようにするためである。

直積モデルの神経場は、ｒ₁軸およびｒ₂軸が作る素子面（ユニットレイヤ）に４９個の素子を配置し、ｒ₃軸が作る素子コラムに２０個の素子を配置し、合計９８０個の素子を持つように構成されている。各素子面の４９個の素子は独立に存在するように構成される。素子コラムの２０個の素子は、各ユニットレイヤに属する素子１つずつであって、それぞれ隣り合うユニットレイヤの素子同士で隣接するように構成される。

また、ロボット２の向き情報を埋め込むために、ｒ₃軸の方向を環状となるようにし、ｒ₃軸方向が周期境界条件を満たすようにした。ロボット２の位置の変化に比べて向きの変化は視覚入力情報への影響が大きいことから、本例の直積モデルは、ｒ₁軸、ｒ₂軸方向に対してｒ₃軸が長くなるように構成されている。

各素子は、参照ベクトルｍと呼ばれるｎ次元ベクトルを持ち、ｉ番目の素子の参照ベクトルをｍ_i（ｉ＝１，２，…，９８０）とする。参照ベクトルｍ_iの次元は、直積モデルに与えられる入力信号ｘの次元と同一である。

図４に、本発明の処理概要を示す。

ステップＳ１０：自己組織的学習処理システム１では、位置および向き学習部１５により、直積モデルの参照ベクトルｍ_i（ｉ＝１，２，…，９８０）を初期化する。

ステップＳ１１：視覚入力情報取得部１１により、対象となるロボットの位置または向きをランダムに決定して取得した視覚入力情報から、１６次元の入力信号ｘを生成する。

ステップＳ１２：位置および向き学習部１５により、素子の中から入力信号ｘに最も近い参照ベクトルｍ_iを持つ勝者ｃを求め、順位学習と近傍学習とを組み合わせた以下の学習を行う。

ｍ_i＝ｍ_i＋αｈ_ci（ｘ−ｍ_i）式(7)
ｈ_ci＝−ｅｘｐ（ｒ_3c−ｒ_3i）²／２σ²・Ｒ^s 式(8)
ここでは、ｒ_3iは、ｉ番目の素子のｒ₃軸上の位置、Ｒ^s中のｓはｉ番目の素子が属するユニットレイヤ上での素子の順位である。

ステップＳ１３：ロボット２の位置または向きのいずれかを変化させる。なお、位置または向きの変化はランダムに決定してよい。位置および向き学習部１５は、位置変化または向き変化を取得する。そして、位置変化を取得した場合にはステップＳ１４の処理へ、向き変化を取得した場合にはステップＳ１６の処理へ進む。

ステップＳ１４：視覚入力情報取得部１１により、位置が変化したロボット２の視覚入力情報から１６次元の入力信号ｘを生成する。

ステップＳ１５：そして、入力信号ｘに最も近い参照ベクトルｍ_iを持つ勝者ｃを、前回の勝者ｃが属するユニットレイヤ、すなわち素子面（ｒ₃＝ｒ_3c）から決定し、式(7) および式(8) により順位学習および近傍学習を組み合わせた学習を行う。

ステップＳ１６：または、視覚入力情報取得部１１により、向きが変化したロボットの視覚入力情報から１６次元の入力信号ｘを生成する。

ステップＳ１７：そして、入力信号ｘに最も近い参照ベクトルｍ_iを持つ勝者ｃを、前回の勝者ｃが属する素子コラム（（ｒ₁，ｒ₂）＝（ｒ_c1，ｒ_c2））から決定し、式(7) および式(8) により順位学習および近傍学習を組み合わせた学習を行う。

その後、上記のステップＳ１３の処理へ戻り、直積モデルが安定するまでステップＳ１３〜ステップＳ１７の学習処理を繰り返す。

本例で、入力信号ｘは１６次元であるが、前述のように、位置（ｕ，ｖ）と向きθの関数であって、本質的には３次元の構造を持つ。直積モデルの各素子の参照ベクトルｍ_iが、この１６次元の入力信号を位置（２次元）と向き（１次元）の情報を分離するように組織化されているかどうかは、多数の入力信号に対する反応から調べることができる。

すなわち、ｉ番目の素子が、ロボット２が移動する部屋のどの位置に対応するかという位置の選択性を求めるには、視覚入力情報の発生確率に従った入力信号ｘを直積モデルに多数与えて、ＳＯＭの場合にはそのときに得られるｈ_ci( ｈ_ciは入力信号ｘの関数）で、ニューラルガスの場合にはｇ（ｓ_i）で、それぞれ重み付けを行う。そして、ｉ番目の素子の位置に対する選択性を、以下のように定義する。

Σ_u,v,th（ｕ，ｖ）ｈ_ci（ｘ）／Σ_u,v,th・ｈ_ci（ｘ）式(9)
（ここでｔｈはθを表す）
ここで、ｘ＝ｘ（ｕ，ｖ，ｔｈ）であり、具体的には、ｕ，ｖ，ｔｈ（θ）を適当な間隔で刻んで求める。素子間の隣接関係は、直積モデルに多数の入力信号ｘを与えたときに、少なくとも一度、１位と２位との関係となった素子同士を隣接していると定義する。

以下に、本発明の具体例として、障害物のない四角形の部屋および障害物がある部屋に対する本発明の処理例およびその学習結果を説明する。

なお、本発明の効果を比較するため、３次元ＳＯＭモデルを用意した。ｒ₁軸およびｒ₂軸が作る２０枚の素子面に４９個の素子を、ｒ₃軸が作る素子コラムに２０個の素子をそれぞれ配置し、合計９８０個の素子を用いた。３次元ＳＯＭモデルの素子面の４９個の素子は７×７の格子状に配置されている。

３次元ＳＯＭでは、以下のような学習を行う。ｉ番目の素子の神経場上の位置を（ｒ_1i，ｒ_2i，ｒ_3i）とする。

ＲＮ１：参照ベクトルｍ_iを初期化する。

ＲＮ２：ロボットの位置または向きをランダムに決定し、１６次元の入力信号ｘを生成する。

ＲＮ３：入力信号ｘに最も近い勝者を求め、近傍学習を行う。

ＲＮ４：勝者の３次元の神経場上での位置を（ｒ_1c，ｒ_2c，ｒ_3c）とする。さらに、ロボットの位置を変化させる（ＲＮ５ａの処理へ進む）。またはロボットの向きを変化させる（ＲＮ５ｂの処理へ進む）。

ＲＮ５ａ：ロボットの位置が変化した場合に、勝者ｃが属する素子面（ｒ₃＝ｒ_3c）から新たな勝者ｃを決定して近傍学習を行う。

ＲＮ５ｂ：ロボットの向きが変化した場合に、勝者ｃが属する素子コラム（（ｒ₁，ｒ₂）＝（ｒ_c1，ｒ_c2））から新たな勝者ｃを決定して近傍学習を行う。
そして、ＲＮ４の処理へ戻り、３次元ＳＯＭが安定するまで学習処理を繰り返す。

以下に本発明のＳＯＭとニューラルガスの直積モデルによる学習と、３次元ＳＯＭによる学習との結果を説明する。

図５〜図７に、障害物がまったくおかれていない四角形の部屋でロボットをランダムに動かした場合に、直積モデルの自己組織化が進行するようすを示す。

近傍学習の学習係数αは、
α_t＝０．３（１．０−ｔ／Ｔ）＋０．０１
のように時間と共に小さくなるようにした。ここで、ｔは学習時間、Ｔは総合学習時間である。また、順位学習のパラメータσは、
σ_t＝１．４１４（１．０−ｔ／Ｔ）＋０．１
のように、σ_t＞０．５を満たす限り時間と共に小さくなるようにした。これ以外の場合に、σ_t＝０．５とした。

パラメータＲ_iは、σ_tの関数として以下の値を用いた。

Ｒ_i＝１．０−２．０ｅｘｐ（−２．０σ_t）式(10)
図５に、ある素子面の各素子の参照ベクトルｍ_iの位置選択性を示す。

図５では、７番目の素子面（ｒ₃＝７）に存在する４９個の素子の各参照ベクトルｍ_iがロボット２が移動可能な部屋（ｕ，ｖ面）のどの位置に選択性を持つかを、点で表示した。また、隣接関係( 少なくとも一度、１位と２位となる関係）を持つと特定した素子間の結果を線で示した。外枠は、ロボットが移動可能な範囲である。具体的には、”ｕ，ｖ（０≦ｕ，ｖ≦１）”を、”ｕ，ｖ”とも０．０５間隔で、θ（−π≦θ＜π）はπ／１８間隔で一様に入力信号ｘを生成し、素子の選択性を求めて、その結果を示した。

図５（Ａ）にｔ＝１０の場合の位置の選択性、図５（Ｂ）にｔ＝１０，０００の場合の位置の選択性、図５（Ｃ）にｔ＝１，０００，０００の場合の位置の選択性のそれぞれの様子を示す。図５（Ａ）〜（Ｃ）により、学習の進行にしたがって直積モデルにおいて位置選択性が構築されていく様子がわかる。

図５に示す７番目の素子面以外の素子面でも、図５（Ｃ）とほぼ同様な結果が得られる。異なった素子面の間でどの程度似たような場所選択性が組織化されているかどうかを示すため、図６に、９８０個すべての素子の位置選択性を示す。

図６（Ａ）にｔ＝１０の場合の位置の選択性、図６（Ｂ）にｔ＝１０，０００の場合の位置の選択性、図６（Ｃ）にｔ＝１，０００，０００の場合の位置の選択性のそれぞれの様子を示す。図６では、各素子の参照ベクトルｍ_iの位置選択性を点で示し、各素子コラムに属する隣り合う素子同士の位置選択性を線で結んだ。

学習が完了した段階になると、図５（Ｃ）および図６（Ｃ）に示すように、素子面上では異なる素子は分担して部屋をカバーする一方で、同じ素子コラムに属する素子は素子面が異なっても、すべての素子がほぼ同一の位置選択性を持つようになることがわかる。

図７に、各素子面（ｒ₃= 定数) に存在する４９個の素子の向きの選択性を示す。

図７に示すように、ｒ₃軸の素子コラムにはロボット２の向きについての選択性が自己組織化された。図７（Ａ）に示すように、学習の初期段階では、各素子面（ｒ₃＝定数）に属する４９個の素子は、ばらばらな向きに選択性を持っていたが、図７（Ｂ）および（Ｃ）に示すように、学習が進むにしたがって、ある特定の向きに選択性を持つようになることがわかる。例えば、素子面ｒ₃＝５に属する４９個の素子はすべて１８０度の向きに選択性を持っている。図７（Ｃ）では、学習の完了段階では、ほぼ４９個の素子が重なってプロットされている。

図８〜図１０に、障害物がまったくおかれていない四角形の部屋でロボットをランダムに動かした場合に３次元ＳＯＭモデルの自己組織化が進行するようすを示す。

学習係数αは、
α_t＝０．８（１．０−ｔ／Ｔ）＋０．０１
のように時間と共に小さくなるようにした。ここで、ｔは学習時間、Ｔは総合学習時間である。図８〜図１０に示すように、３次元ＳＯＭモデルでも、直積モデルの結果と同様に、学習終了後は、各素子は場所と向きの選択性を持つようになった。

図１１に、それぞれ異なる障害物が置かれている四角形の部屋でロボット２をランダムに動かした場合に、直積モデルの自己組織化が進行するようすを示す。

図１１（Ａ）〜（Ｃ）の図において、外枠はロボットが移動できる範囲であり、四角形の中に示される矩形は障害物を示す。また、障害物がある領域にロボットは入ることができないが、障害物はロボット２の視覚センサｓｓ_iの位置よりも低い位置にあって障害物自体は視覚センサｓｓ_iには検出されないものと想定した。

図１１（Ａ）〜（Ｃ）の左側の図に、学習完了後の自己組織化の様子を、ある素子面における素子を点で、さらに隣接する素子間を線で示した。また、図１１（Ａ）〜（Ｃ）の中央の図に、学習完了後のすべての素子の場所選択性を、図１１（Ａ）〜（Ｃ）右側の図に、学習完了後のすべての素子の向き選択性をそれぞれ示した。

本発明の直積モデルによる学習によって、直積モデルは、素子の参照ベクトルｍ_iが障害物がない領域をくまなくカバーするように自己組織化されることがわかる。

図１２に、それぞれ異なる障害物が置かれている四角形の部屋でロボット２をランダムに動かした場合に、３次元ＳＯＭモデルの自己組織化が進行するようすを示す。

図１２（Ａ）〜（Ｃ）の左側の図に、学習完了後の自己組織化の様子を、ある素子面における素子を点で、さらに隣接関係を持つ素子間を線で示した。また、図１２（Ａ）〜（Ｃ）の中央の図に、学習完了後のすべての素子の場所選択性を示した。

３次元ＳＯＭモデルでは、素子の参照ベクトルｍ_iが障害物の領域内へも配置され、障害物の領域をまたぐように素子間の隣接関係が生成されている。したがって、３次元ＳＯＭモデルによる自己組織化の結果を用いてロボット２を誘導する場合には、一般的に移動開始位置と目的位置に対応する素子の参照ベクトルｍ_i間の隣接関係をもとにした最短距離を利用するため、ロボットが障害物に衝突する状況が生じてしまう。

また、図１２（Ａ）〜（Ｃ）右側の図に、学習完了後のすべての素子の向き選択性を示したが、一部の素子では向きの選択性が収束できなかったことがわかる。

以上、本発明をその実施の形態により説明したが、本発明はその主旨の範囲において種々の変形が可能であることは当然である。

また、本発明は、コンピュータにより読み取られ実行されるプログラムとして実施することができる。本発明を実現するプログラムは、コンピュータが読み取り可能な、可搬媒体メモリ、半導体メモリ、ハードディスクなどの適当な記録媒体に格納することができ、これらの記録媒体に記録して提供され、または、通信インタフェースを介して種々の通信網を利用した送受信により提供されるものである。

本発明により、ある空間に置かれたロボットが、視覚入力情報からロボットの位置および向きの情報を自己組織的に学習して分離・抽出することができるようになるため、本発明は、ロボットの移動制御、誘導制御などの支援技術として利用することが可能である。

本発明を実施するための最良の形態における本発明の構成例を示す図である。ロボットが置かれる部屋およびロボットの視覚センサの例を示す図である。ＳＯＭとニューラルガスの直積モデルの例を示す図である。ＳＯＭとニューラルガスの直積モデルによる学習処理の処理概要を示す図である。障害物がない四角形の部屋についての直積モデルの位置選択性を示す図である。障害物がない四角形の部屋についての直積モデルの位置選択性を示す図である。障害物がない四角形の部屋についての直積モデルの向き選択性を示す図である。障害物がない四角形の部屋についての３次元ＳＯＭの位置選択性を示す図である。障害物がない四角形の部屋についての３次元ＳＯＭの位置選択性を示す図である。障害物がない四角形の部屋についての３次元ＳＯＭの向き選択性を示す図である。障害物がある部屋についての直積モデルの位置選択性および向き選択性を示す図である。障害物がある部屋についての３次元ＳＯＭの位置選択性および向き選択性を示す図である。ロボットが置かれた部屋の平面図の例を示す図である。ロボットの視覚センサから入力されたロボット周囲の画像例を示す図である。ＳＯＭまたはニューラルガスによる自己組織化を説明するための図である。

符号の説明

１自己組織的学習処理システム
１１視覚入力情報取得部
１５位置および向き学習部
２ロボット
ｓｓ_i 視覚センサ

Claims

ある空間を自由に移動できるロボットの視覚センサが入力した視覚入力情報から当該空間における当該ロボットの位置および向きの情報を分離・抽出するために、当該視覚入力情報をニューラルネットワークモデルに与えて当該モデルを自己組織的に学習する処理方法であって、
前記位置のための第１軸と第２軸で作られる面に複数の素子が独立して配置された素子面と前記向きのための第３軸の方向に各素子面の１つの素子が隣り合う関係を保持して属する素子コラムとにより構成される３次元構造であって、かつ前記素子コラムが前記向きの位相に対応して円環上に構成されるＳＯＭとニューラルガスの直積モデルを備え、
前記直積モデルに前記視覚入力情報を入力する視覚情報入力処理過程と、
前記直積モデルにおいて、前記視覚入力情報に最も近い参照ベクトルを持つ素子を求めて勝者とし、前記勝者について、前記直積モデルの素子面を用いて前記位置の選択性について順位学習を行い、かつ、前記直積モデルの素子コラムを用いて前記方向の選択性について近傍学習を行い、前記位置および方向の選択性の学習から、前記素子ごとに前記位置および前記向きの選択性を取得する学習処理過程とを備える
ことを特徴とするロボットの位置および向きの情報の自己組織的学習処理方法。
さらに、前記ロボットの直前の状態からの位置または向きのいずれか一つの変化を前記直積モデルに入力する変化入力処理過程を備え、
前記学習処理過程では、前記変化入力処理過程において前記位置の変化を入力した場合に、前記視覚入力情報に最も近い参照ベクトルを持つ素子を前回の勝者が属する素子面から決定し、決定した勝者について前記順位学習および前記近傍学習を組み合わせた学習を行って、前記素子ごとに前記位置および前記向きの選択性を取得する
ことを特徴とする請求項１記載のロボットの位置および向きの情報の自己組織的学習処理方法。
さらに、前記ロボットの直前の状態からの位置または向きのいずれか一つの変化を前記直積モデルに入力する変化入力処理過程を備え、
前記学習処理過程では、前記変化入力処理過程において前記向きの変化を入力した場合に、前記視覚入力情報に最も近い参照ベクトルを持つ素子を前回の勝者が属する素子コラムから決定し、決定した勝者について前記順位学習および前記近傍学習を組み合わせた学習を行って、前記素子ごとに前記位置および前記向きの選択性を取得する
ことを特徴とする請求項１記載のロボットの位置および向きの情報の自己組織的学習処理方法。
ある空間を自由に移動できるロボットの視覚センサが入力した視覚入力情報から当該空間における当該ロボットの位置および向きの情報を分離・抽出するために、当該視覚入力情報をニューラルネットワークモデルに与えて当該モデルを自己組織的に学習する処理システムであって、
前記位置のための第１軸と第２軸で作られる面に複数の素子が独立して配置された素子面と前記向きのための第３軸の方向に各素子面の１つの素子が隣り合う関係を保持して属する素子コラムとにより構成される３次元構造であって、かつ前記素子コラムが前記向きの位相に対応して円環上に構成されるＳＯＭとニューラルガスの直積モデルと、
前記直積モデルに前記視覚入力情報を入力する視覚情報入力処理手段と、
前記直積モデルにおいて、前記視覚入力情報に最も近い参照ベクトルを持つ素子を求めて勝者とし、前記勝者について、前記直積モデルの素子面を用いて前記位置の選択性について順位学習を行い、かつ、前記直積モデルの素子コラムを用いて前記方向の選択性について近傍学習を行い、前記位置および方向の選択性の学習から、前記素子ごとに前記位置および前記向きの選択性を取得する学習処理手段とを備える
ことを特徴とするロボットの位置および向きの情報の自己組織的学習処理システム。
さらに、前記ロボットの直前の状態からの位置または向きのいずれか一つの変化を前記直積モデルに入力する変化入力処理手段を備え、
前記学習処理手段は、前記変化入力処理手段によって前記位置の変化を入力した場合に、前記視覚入力情報に最も近い参照ベクトルを持つ素子を前回の勝者が属する素子面から決定し、決定した勝者について前記順位学習および前記近傍学習を組み合わせた学習を行って、前記素子ごとに前記位置および前記向きの選択性を取得する処理を行う
ことを特徴とする請求項４記載のロボットの位置および向きの情報の自己組織的学習処理システム。
さらに、前記ロボットの直前の状態からの位置または向きのいずれか一つの変化を前記直積モデルに入力する変化入力処理手段を備え、
前記学習処理手段は、前記変化入力処理手段によって前記向きの変化を入力した場合に、前記視覚入力情報に最も近い参照ベクトルを持つ素子を前回の勝者が属する素子コラムから決定し、決定した勝者について前記順位学習および前記近傍学習を組み合わせた学習を行って、前記素子ごとに前記位置および前記向きの選択性を取得する処理を行う
ことを特徴とする請求項４記載のロボットの位置および向きの情報の自己組織的学習処理システム。
ある空間を自由に移動できるロボットの視覚センサが入力した視覚入力情報から当該空間における当該ロボットの位置および向きの情報を分離・抽出するために、当該視覚入力情報をニューラルネットワークモデルに与えて当該モデルを自己組織的に学習する処理システムとして、コンピュータを機能させるためのプログラムであって、
前記位置のための第１軸と第２軸で作られる面に複数の素子が独立して配置された素子面と前記向きのための第３軸の方向に各素子面の１つの素子が隣り合う関係を保持して属する素子コラムとにより構成される３次元構造であって、かつ前記素子コラムが前記向きの位相に対応して円環上に構成されるＳＯＭとニューラルガスの直積モデルと、
前記直積モデルに前記視覚入力情報を入力する視覚情報入力処理手段と、
前記直積モデルにおいて、前記視覚入力情報に最も近い参照ベクトルを持つ素子を求めて勝者とし、前記勝者について、前記直積モデルの素子面を用いて前記位置の選択性について順位学習を行い、かつ、前記直積モデルの素子コラムを用いて前記方向の選択性について近傍学習を行い、前記位置および方向の選択性の学習から、前記素子ごとに前記位置および前記向きの選択性を取得する学習処理手段とを備える処理システムとして
前記コンピュータを機能させるためのロボットの位置および向きの情報の自己組織的学習処理プログラム。
さらに、前記ロボットの直前の状態からの位置または向きのいずれか一つの変化を前記直積モデルに入力する変化入力処理手段を備え、
前記学習処理手段は、前記変化入力処理手段によって前記位置の変化を入力した場合に、前記視覚入力情報に最も近い参照ベクトルを持つ素子を前回の勝者が属する素子面から決定し、決定した勝者について前記順位学習および前記近傍学習を組み合わせた学習を行って、前記素子ごとに前記位置および前記向きの選択性を取得する処理を行う
ことを特徴とする請求項７記載のロボットの位置および向きの情報の自己組織的学習処理プログラム。
さらに、前記ロボットの直前の状態からの位置または向きのいずれか一つの変化を前記直積モデルに入力する変化入力処理手段を備え、
前記学習処理手段は、前記変化入力処理手段によって前記向きの変化を入力した場合に、前記視覚入力情報に最も近い参照ベクトルを持つ素子を前回の勝者が属する素子コラムから決定し、決定した勝者について前記順位学習および前記近傍学習を組み合わせた学習を行って、前記素子ごとに前記位置および前記向きの選択性を取得する処理を行う
ことを特徴とする請求項７記載のロボットの位置および向きの情報の自己組織的学習処理プログラム。