JP4269055B2 - Obstacle avoidance device and moving body - Google Patents

Obstacle avoidance device and moving body Download PDF

Info

Publication number
JP4269055B2
JP4269055B2 JP2004106347A JP2004106347A JP4269055B2 JP 4269055 B2 JP4269055 B2 JP 4269055B2 JP 2004106347 A JP2004106347 A JP 2004106347A JP 2004106347 A JP2004106347 A JP 2004106347A JP 4269055 B2 JP4269055 B2 JP 4269055B2
Authority
JP
Japan
Prior art keywords
speed
obstacle
repulsive force
moving body
obstacle avoidance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004106347A
Other languages
Japanese (ja)
Other versions
JP2005293154A (en
Inventor
透 山本
亮太 黒住
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hiroshima University NUC
Original Assignee
Hiroshima University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hiroshima University NUC filed Critical Hiroshima University NUC
Priority to JP2004106347A priority Critical patent/JP4269055B2/en
Publication of JP2005293154A publication Critical patent/JP2005293154A/en
Application granted granted Critical
Publication of JP4269055B2 publication Critical patent/JP4269055B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61GTRANSPORT, PERSONAL CONVEYANCES, OR ACCOMMODATION SPECIALLY ADAPTED FOR PATIENTS OR DISABLED PERSONS; OPERATING TABLES OR CHAIRS; CHAIRS FOR DENTISTRY; FUNERAL DEVICES
    • A61G2203/00General characteristics of devices
    • A61G2203/10General characteristics of devices characterised by specific control means, e.g. for adjustment or steering
    • A61G2203/14Joysticks
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61GTRANSPORT, PERSONAL CONVEYANCES, OR ACCOMMODATION SPECIALLY ADAPTED FOR PATIENTS OR DISABLED PERSONS; OPERATING TABLES OR CHAIRS; CHAIRS FOR DENTISTRY; FUNERAL DEVICES
    • A61G5/00Chairs or personal conveyances specially adapted for patients or disabled persons, e.g. wheelchairs
    • A61G5/04Chairs or personal conveyances specially adapted for patients or disabled persons, e.g. wheelchairs motor-driven

Description

本発明は、障害物回避装置および移動体に関するものであり、例えば電動車椅子のような移動体に備えられる障害物回避装置、およびその障害物回避装置を備えた移動体に関するものである。   The present invention relates to an obstacle avoidance device and a mobile object, and more particularly to an obstacle avoidance device provided in a mobile object such as an electric wheelchair and a mobile object provided with the obstacle avoidance device.

高齢化社会が進展する中で、体に多少の不自由を感じる人から寝たきりの人まで、移動補助機器に関する多様なニーズが存在する。   As an aging society progresses, there are diverse needs for mobility aids, from those who feel a little inconvenient to those who are bedridden.

それらの中で、従来の車椅子のイメージに対する抵抗感や、狭い場所で小回りが利くことなどを求める声が多く聞かれる。例えば、特許文献1には、狭い場所で小回りの利く車椅子が開示されている。また、非特許文献1〜3には、全方向移動機構、全方向移動機構を備えた車椅子が開示されている。   Many of them ask for resistance to the image of a conventional wheelchair and demand for a small turn in a small place. For example, Patent Document 1 discloses a wheelchair that is easy to turn in a small place. Non-patent documents 1 to 3 disclose a wheelchair including an omnidirectional movement mechanism and an omnidirectional movement mechanism.

また、車椅子などの移動車両において、安全運転を可能とし、操作を容易にするための障害物回避補助装置(障害物回避装置)を設けた構成が知られている。   In addition, in a moving vehicle such as a wheelchair, a configuration in which an obstacle avoidance assist device (obstacle avoidance device) for enabling safe driving and facilitating operation is known.

例えば、特許文献2には障害物を回避する移動ロボットが開示され、特許文献3には障害物を回避する車椅子が開示されている。   For example, Patent Document 2 discloses a mobile robot that avoids obstacles, and Patent Document 3 discloses a wheelchair that avoids obstacles.

また、障害物を回避する際に、反発力を想定して動作制御する構成が、特許文献4に開示されている。反発力については、非特許文献4に記載がある。
特開2000−116720号公報(公開日:2000年4月25日) 特開平7−110711号公報(公開日:1995年4月25日) 特開2000−210340号公報(公開日:2000年8月2日) 特開2002−225741号公報(公開日:2002年8月14日) H.Asama, M.Sato, L.Bogoni et al.: Development of an omnidirectional Mobile robot with 3 DOF decoupling drive mechanism, Proc.of IEEE 1995 Int.Conf. on Robotics and Automation, pp.1925-1930(1995) S.Hirose and S.Asano; The VUTON: High Payload High efficiency holonomic omni-directional vehicle, 6th Int.Symp. on Robotics Research, October(1993) M.Wada and H.H.Asada: A holonomic omnidirectional wheelchair with a variable footprint mechanism, Proc.of the 3rd Int.Conf.on Advanced Mechatronics Okayama, Japan, pp.268-274,(1998) 太田順、倉林大輔、新井民夫: 知能ロボット入門−動作計画問題の解法、コロナ社(2001)
Moreover, when avoiding an obstacle, the structure which controls operation | movement supposing a repulsive force is disclosed by patent document 4. FIG. The repulsive force is described in Non-Patent Document 4.
JP 2000-116720 A (publication date: April 25, 2000) Japanese Patent Laid-Open No. 7-110711 (Publication date: April 25, 1995) JP 2000-210340 A (publication date: August 2, 2000) JP 2002-225741 A (publication date: August 14, 2002) H. Asama, M. Sato, L. Bogoni et al .: Development of an omnidirectional Mobile robot with 3 DOF decoupling drive mechanism, Proc. Of IEEE 1995 Int. Conf. On Robotics and Automation, pp.1925-1930 (1995) S. Hirose and S. Asano; The VUTON: High Payload High efficiency holonomic omni-directional vehicle, 6th Int. Symp. On Robotics Research, October (1993) M. Wada and HHAsada: A holonomic omnidirectional wheelchair with a variable footprint mechanism, Proc.of the 3rd Int. Conf.on Advanced Mechatronics Okayama, Japan, pp.268-274, (1998) Jun Ohta, Daisuke Kurabayashi, Tamio Arai: Introduction to Intelligent Robots-Solving Motion Planning Problems, Corona (2001)

しかしながら、従来の構成の障害物回避装置においては、ユーザ毎、周囲の状況毎に応じた対応をしないので、十分きめ細かな対応ができないという問題を生ずる。   However, the obstacle avoidance device having the conventional configuration does not respond according to each user and each surrounding situation, so that there is a problem that a sufficiently fine response cannot be performed.

例えば、特許文献4に記載の構成は、障害物を回避する際に反発力を想定して動作制御するものである。しかしながら、操作状態はユーザ毎に異なり、また周囲の状況に応じて
変わるものであるため、特許文献4の構成のように予め定めた反発力を固定して用いる場合には、ユーザによっては反発力がかえってじゃまになりうる場合が考えられる。このため、十分きめ細かな対応ができず、障害物回避装置がじゃまになる場合が考えられる。
For example, the configuration described in Patent Document 4 controls the operation assuming a repulsive force when avoiding an obstacle. However, since the operation state differs for each user and changes depending on the surrounding situation, when a predetermined repulsive force is fixed and used as in the configuration of Patent Document 4, depending on the user, the repulsive force However, there are cases where it can get in the way. For this reason, there is a case where a sufficiently fine response cannot be made and the obstacle avoidance device is obstructed.

本発明は、上記の問題点に鑑みてなされたものであり、その目的は、障害物を回避するためにユーザからの指示速度を修正する障害物回避装置であって、ユーザごとに細かな対応ができる障害物回避装置および移動体を提供することにある。   The present invention has been made in view of the above-described problems, and an object of the present invention is an obstacle avoidance device that corrects an instruction speed from a user in order to avoid an obstacle. It is an object to provide an obstacle avoidance device and a moving body that can perform the above.

本発明に係る障害物回避装置は、上記課題を解決するために、ユーザからの指示速度に基づいて移動する移動体に対して、上記移動体の周囲の障害物を検出する障害物センサからの情報に応じて上記指示速度を修正することによって、上記移動体の障害物との衝突を回避させる障害物回避装置であって、設定された重み係数を乗算した上で上記指示速度に加減算することによって上記指示速度を修正するために用いる、上記障害物との衝突を回避するための反発力を、上記障害物センサからの情報に応じて計算する反発力生成部を備えており、さらに、上記指示速度を上記反発力によって修正した速度と上記指示速度との方向の一致または不一致に応じて、上記反発力生成部における上記重み係数の大きさを強化学習により学習し、上記反発力生成部に対して設定する学習部を有していることを特徴としている。   In order to solve the above-described problem, the obstacle avoidance device according to the present invention provides an object from an obstacle sensor that detects an obstacle around the moving body relative to the moving body that moves based on an instruction speed from the user. An obstacle avoidance device that avoids a collision of the moving object with an obstacle by correcting the indicated speed according to information, and adds / subtracts to / from the indicated speed after multiplying a set weight coefficient. A repulsive force generation unit for calculating a repulsive force for avoiding a collision with the obstacle, which is used to correct the indicated speed according to the information from the obstacle sensor, and The magnitude of the weight coefficient in the repulsive force generation unit is learned by reinforcement learning according to the coincidence or mismatch of the direction of the command speed corrected by the repulsive force and the directed speed, and the repulsion It is characterized by having a learning section that sets the generated section.

上記構成の障害物回避装置は、障害物センサの検出した障害物を回避するように、反発力生成部が反発力を計算する。例えばこの反発力を速度に加算することによって、障害物回避を実現する。すなわち、車両の駆動装置、動力部にて、得られた速度となるように調整を行えば、障害物に近接した場合には障害物から離れる方向の力が強くなり、障害物を回避できる。   In the obstacle avoidance device configured as described above, the repulsive force generation unit calculates the repulsive force so as to avoid the obstacle detected by the obstacle sensor. For example, obstacle avoidance is realized by adding this repulsive force to the speed. That is, if the vehicle drive device and the power unit are adjusted so as to obtain the obtained speed, the force in the direction away from the obstacle becomes stronger when the vehicle approaches the obstacle, and the obstacle can be avoided.

ここで、上記構成の障害物回避装置は、操作部に対する操作を学習して、反発力の大きさ、方向を調整することによって、速度を修正する。これは、操作部に対する操作の強さなどはユーザごとに異なる一方で、反発力生成部による反発力を画一的なものとすると、ユーザによっては反発力がじゃまとなり、所望の動作が実現できない虞があるためである。   Here, the obstacle avoidance device having the above configuration corrects the speed by learning the operation of the operation unit and adjusting the magnitude and direction of the repulsive force. This is because the strength of operation on the operation unit differs for each user, but if the repulsive force generated by the repulsive force generating unit is uniform, the repulsive force is disturbed by some users, and a desired operation cannot be realized. This is because there is a fear.

このため、障害物回避装置は、ユーザの操作を学習して、反発力の強さを調整する。より詳細には、学習部が、ユーザからの指示速度を反発力によって修正した速度と、指示速度との方向の一致または不一致に応じて、重み係数の大きさを強化学習により学習し、反発力生成部に対して設定する。なお、ここでは、速度の大きさが0の場合は方向が定まらないため、修正した速度と指示速度との大きさが共に0である場合には方向が一致したものとし、それ以外の例えば一方の大きさが0であるが他方の大きさが0でない場合には方向が不一致であるとする。   For this reason, the obstacle avoidance device adjusts the strength of the repulsive force by learning the user's operation. More specifically, the learning unit learns the magnitude of the weighting factor by reinforcement learning according to the coincidence or mismatch of the direction of the instruction speed from the user with the repulsive force and the direction of the instruction speed, and the repulsive force Set for the generator. Here, since the direction is not determined when the magnitude of the speed is 0, it is assumed that the directions coincide when the magnitudes of the corrected speed and the indicated speed are both 0, for example, one of the other speeds. If the size of is not 0 but the other is not 0, the directions are assumed to be inconsistent.

したがって、ユーザが移動体を移動させるように操作すると、障害物回避装置において、反発力の大きさが適切なものとなるように学習される。ここで、学習部は、教師なし学習である強化学習を用いるので、ユーザごとの障害物回避のように正解のない場合であっても学習できる。   Therefore, when the user operates to move the moving body, the obstacle avoidance device learns that the magnitude of the repulsive force is appropriate. Here, since the learning unit uses reinforcement learning which is unsupervised learning, it can learn even when there is no correct answer, such as obstacle avoidance for each user.

よって、ユーザ毎、周囲の状況毎に応じた対応をして、十分きめ細かな対応ができる。   Therefore, it is possible to respond sufficiently finely by responding to each user and each surrounding situation.

また、本発明に係る障害物回避装置は、上記構成において、上記学習部が、上記修正した速度と上記指示速度との方向が一致する場合に正の報酬とし、上記修正した速度と上記指示速度との方向が不一致の場合には負の報酬とすることによって強化学習を行うことを
特徴としている。
In the obstacle avoidance device according to the present invention, in the configuration described above, the learning unit determines a positive reward when the direction of the corrected speed matches the direction of the indicated speed, and the corrected speed and the indicated speed are If the directions are inconsistent with each other, reinforcement learning is performed by using a negative reward.

このように、修正した速度と指示速度とが一致する場合に正の報酬とするので、修正した速度と指示速度とが一致するように学習を行うことができる。したがって、障害物回避を行いつつ、できるだけユーザの希望に応じた所望の進行が可能となる。   As described above, since the positive reward is obtained when the corrected speed matches the instruction speed, learning can be performed so that the corrected speed matches the instruction speed. Therefore, it is possible to make a desired progress according to the user's wish as much as possible while performing obstacle avoidance.

また、本発明に係る障害物回避装置は、上記構成において、上記指示速度を検出するための操作部がジョイスティック型の操作部であり、上記学習部が、上記修正した速度が0であって上記移動体が停止しているときに、上記ジョイスティックが中央位置に保持されている場合には正の報酬とし、上記修正した速度が0でなく上記移動体が移動している方向と上記ジョイスティックの倒されている方向とが不一致の場合、または上記修正した速度が0であって上記移動体が停止しているときに上記ジョイスティックが倒されている場合には、負の報酬とすることを特徴としている。   In the obstacle avoidance device according to the present invention, in the above configuration, the operation unit for detecting the instruction speed is a joystick type operation unit, and the learning unit has the corrected speed of 0 and the When the moving body is stopped, if the joystick is held at the center position, a positive reward is given, and the corrected speed is not 0 and the moving body is moving and the joystick is tilted. If the direction is not consistent, or if the corrected speed is 0 and the joystick is tilted when the moving body is stopped, a negative reward is provided. Yes.

修正した速度が0であって移動体が停止しているときに、ジョイスティックが中央位置に保持されている場合には正の報酬とするので、所望のタイミングで直ぐに停止できるように学習することができ、移動体の安全な運転が可能となる。   When the corrected speed is 0 and the moving body is stopped, if the joystick is held at the center position, the reward is a positive reward, so that learning can be performed immediately at a desired timing. This enables safe operation of the moving body.

また、修正した速度が0であって移動体が停止しているときにジョイスティックが倒されている場合には負の報酬とするので、望まない停止をすることなく、直ぐに発進するように学習することができる。   Also, if the corrected speed is 0 and the joystick is tilted when the moving body is stopped, it will be a negative reward, so it will learn to start immediately without making an undesired stop be able to.

本発明に係る移動体は、上記課題を解決するために、上述のいずれかに記載の障害物回避装置を備えていることを特徴としている。   In order to solve the above-described problem, a mobile object according to the present invention includes the obstacle avoidance device described above.

上述の障害物回避装置を備えているので、移動体において、上述の効果を得ることができる。   Since the obstacle avoidance device described above is provided, the above-described effects can be obtained in the moving body.

本発明に係る障害物回避装置は、上記課題を解決するために、指示速度を反発力によって修正した速度と、上記指示速度との方向の一致または不一致に応じて、反発力生成部における重み係数の適切な大きさを強化学習により学習し、上記反発力生成部に対して設定する学習部を有している構成である。   In order to solve the above-described problem, the obstacle avoidance device according to the present invention provides a weighting coefficient in the repulsive force generation unit according to the coincidence or inconsistency between the direction in which the indicated speed is corrected by the repulsive force and the indicated speed. Is learned by reinforcement learning, and has a learning unit that is set for the repulsive force generation unit.

このように、移動体の実際の速度である「指示速度を反発力によって修正した速度」と、指示速度とを比較して、方向の一致または不一致に応じて強化学習を行う。したがって、例えばユーザ指示を修正した速度の方向とユーザ指示速度の方向とが一致するように学習を行うことができる。   In this way, “the speed at which the indicated speed is corrected by the repulsive force”, which is the actual speed of the moving body, is compared with the indicated speed, and reinforcement learning is performed according to the coincidence or mismatch of directions. Therefore, for example, learning can be performed so that the direction of the speed in which the user instruction is corrected matches the direction of the user instruction speed.

このため、ユーザによる移動体の操作に応じて重み係数の大きさを学習して、反発力の大きさを適切なものにできる。したがって、ユーザごとにきめ細かな対応ができる。また、障害物回避装置がじゃまになることがない。   For this reason, the magnitude | size of a repulsive force can be made appropriate by learning the magnitude | size of a weighting coefficient according to operation of the moving body by a user. Therefore, a fine response can be made for each user. Also, the obstacle avoidance device will not get in the way.

本発明の実施形態について図面に基づいて説明すると以下の通りである。   An embodiment of the present invention will be described below with reference to the drawings.

本発明の一実施例である電動車椅子(移動体)1は、図2の概略の斜視図に示すような構成である。電動車椅子1は、オフィスチェアーのような外見の、コンパクトな全方向移動車椅子である。電動車椅子1は、操作部2を用いて、移動速度(走行速度)を制御することができる。また、電動車椅子1は、図3に示すように、動力部の右車輪7a、左車輪
7b、回転軸7cの回転により、全方向に移動が可能となっている。このため、電気車椅子1は、非常に小回りが利く構成である。
An electric wheelchair (moving body) 1 according to an embodiment of the present invention is configured as shown in a schematic perspective view of FIG. The electric wheelchair 1 is a compact omnidirectional mobile wheelchair that looks like an office chair. The electric wheelchair 1 can control the moving speed (traveling speed) using the operation unit 2. Moreover, as shown in FIG. 3, the electric wheelchair 1 can be moved in all directions by the rotation of the right wheel 7a, the left wheel 7b, and the rotating shaft 7c of the power unit. For this reason, the electric wheelchair 1 has a configuration that is very easy to turn.

電動車椅子1は、図1に示すように、操作部2、回避装置(障害物回避補助装置、障害物回避装置)3、対物センサ(障害物センサ)4、速度センサ5、駆動装置6および動力部7を備えている。   As shown in FIG. 1, the electric wheelchair 1 includes an operation unit 2, an avoidance device (obstacle avoidance assist device, obstacle avoidance device) 3, an objective sensor (obstacle sensor) 4, a speed sensor 5, a drive device 6, and power. Part 7 is provided.

本実施例の操作部2はジョイスティック型のユーザインタフェースである。電動車椅子1のユーザは、操作部2を用いて、電動車椅子1の移動方向、移動速度(指示速度)Wを指定する。   The operation unit 2 of this embodiment is a joystick type user interface. The user of the electric wheelchair 1 uses the operation unit 2 to specify the moving direction and moving speed (instruction speed) W of the electric wheelchair 1.

より詳細には、操作部2には、ジョイスティックに加えて、図示しないつまみが設けられている。ジョイスティックを用いて平面上でのXY方向の移動速度を指定するとともに、つまみを用いて回転移動方向、回転移動速度を指定することができる。   More specifically, the operation unit 2 is provided with a knob (not shown) in addition to the joystick. The movement speed in the XY directions on the plane can be specified using the joystick, and the rotational movement direction and the rotational movement speed can be specified using the knob.

回避装置3は、電動車椅子1周辺の障害物を回避するように、電動車椅子1の速度Uを変更する。より詳細には、対物センサ4にて障害物を検知して、この障害物との距離に応じた仮想反発力Fを、回避装置3の反発力発生器11にて計算する。この仮想反発力Fを移動速度に加算することによって速度Uを得て、障害物回避を実現する。   The avoidance device 3 changes the speed U of the electric wheelchair 1 so as to avoid obstacles around the electric wheelchair 1. More specifically, an obstacle is detected by the objective sensor 4, and a virtual repulsive force F corresponding to the distance from the obstacle is calculated by the repulsive force generator 11 of the avoidance device 3. By adding this virtual repulsive force F to the moving speed, the speed U is obtained and obstacle avoidance is realized.

また、本実施形態の回避装置3は、ユーザの操作を学習する学習部12を備えている。回避装置3の学習部12を用いて、ユーザ指定の移動速度Wを、適切な値に修正して出力する。より詳細には、本実施形態の学習部12は、仮想反発力Fを適切な値に修正する。これは、例えば回避装置3において用いる仮想反発力Fが、ユーザによってはじゃまになったりすることが考えられるためである。   The avoidance device 3 of the present embodiment includes a learning unit 12 that learns user operations. Using the learning unit 12 of the avoidance device 3, the user-specified moving speed W is corrected to an appropriate value and output. More specifically, the learning unit 12 of the present embodiment corrects the virtual repulsive force F to an appropriate value. This is because, for example, the virtual repulsive force F used in the avoidance device 3 may be disturbed by some users.

本実施形態の学習部12は、強化学習によってユーザの操作を学習する。強化学習は教師なし学習であるので、ユーザ操作のように正解のない場合であっても適用できる。なお、強化学習については、Richard S.Sutton, Andrew G.Barto: Reinforcement Learning, MIT-Press(1999)を参照されたい。   The learning unit 12 of the present embodiment learns the user's operation by reinforcement learning. Since reinforcement learning is unsupervised learning, it can be applied even when there is no correct answer, such as user operation. For reinforcement learning, see Richard S. Sutton, Andrew G. Barto: Reinforcement Learning, MIT-Press (1999).

対物センサ4は、周囲の障害物を検出するものである。対物センサ4を用いて、周囲の障害物との距離、方向を測定できる。電動車椅子1には、複数の対物センサが設けられており、図1においてはこれをまとめて対物センサ4として示す。速度センサ5は、電動車椅子1の移動速度を測定する。対物センサ4、速度センサ5を用いて、移動体としての電動車椅子1と障害物との距離および相対速度を検出することができる。   The objective sensor 4 detects surrounding obstacles. The objective sensor 4 can be used to measure the distance and direction from surrounding obstacles. The electric wheelchair 1 is provided with a plurality of objective sensors, which are collectively shown as an objective sensor 4 in FIG. The speed sensor 5 measures the moving speed of the electric wheelchair 1. The objective sensor 4 and the speed sensor 5 can be used to detect the distance and relative speed between the electric wheelchair 1 as the moving body and the obstacle.

駆動装置6は、ユーザ指定の速度へと調整するための駆動力を生成する。動力部7は、駆動力に応じて電動車椅子1を移動させる。本実施形態の動力部7は、右車輪7a、左車輪7bなどを含んでいる。   The driving device 6 generates a driving force for adjusting to a user-specified speed. The power unit 7 moves the electric wheelchair 1 according to the driving force. The power unit 7 of the present embodiment includes a right wheel 7a, a left wheel 7b, and the like.

上記構成の電動車椅子1は、ユーザの操作に応じて以下のように動作する。   The electric wheelchair 1 having the above-described configuration operates as follows according to the user's operation.

回避装置3のコントローラ8には、操作部2からユーザ指定の移動速度Wが入力され、速度センサ5から電動車椅子1の現在の速度Yが入力される。なお、速度センサ5は、電動車椅子1の動力部7の動作に基づいて、電動車椅子1の速度を判定する。コントローラ8の生成部9は、これらの入力に基づき、ゲイン係数Kpを用いて目標速度(目標速度差)Umを出力する。   The controller 8 of the avoidance device 3 receives the user-specified moving speed W from the operation unit 2 and the current speed Y of the electric wheelchair 1 from the speed sensor 5. The speed sensor 5 determines the speed of the electric wheelchair 1 based on the operation of the power unit 7 of the electric wheelchair 1. Based on these inputs, the generator 9 of the controller 8 outputs a target speed (target speed difference) Um using the gain coefficient Kp.

一方、反発力発生器11の学習部12は、格納部13および抽出部14を含んでいる。
格納部13は、前回のユーザ指定の移動速度Wおよび対物センサ4からの出力を格納する記憶領域である。抽出部14は、修正出力のための反発係数ηを強化学習によって得るものである。反発力生成部15が、抽出部14からの反発係数ηと、速度W,Y、および対物センサ4からの出力とを用いて、仮想反発力Fを計算して出力する。
On the other hand, the learning unit 12 of the repulsive force generator 11 includes a storage unit 13 and an extraction unit 14.
The storage unit 13 is a storage area for storing the previous movement speed W specified by the user and the output from the objective sensor 4. The extraction unit 14 obtains a restitution coefficient η for correction output by reinforcement learning. The repulsive force generation unit 15 calculates and outputs the virtual repulsive force F using the repulsion coefficient η from the extraction unit 14, the speeds W and Y, and the output from the objective sensor 4.

ここで、強化学習を行う抽出部14の動作について説明する。抽出部14は、格納部13に格納された前回のユーザ指定の移動速度Wと現在の速度Yとを比較し、WとYとの方向が同じである場合には正の報酬をカウントし、WとYとの方向が逆である場合には負の報酬をカウントする。この際、対物センサ4からの入力をも考慮して学習を行う。仮想反発力Fに応じた適切なジョイスティック操作が行われ、所望方向に移動している場合には正の報酬が与えられる。仮想反発力Fのために、ユーザの意思とは異なる方向に移動している場合には負の報酬が与えられる。このため、ユーザが操作部2のジョイスティックを操作しているだけで、抽出部14により適切な反発係数ηが抽出される。   Here, operation | movement of the extraction part 14 which performs reinforcement learning is demonstrated. The extraction unit 14 compares the previous user-specified moving speed W stored in the storage unit 13 with the current speed Y, and counts a positive reward when the directions of W and Y are the same, When the directions of W and Y are opposite, a negative reward is counted. At this time, learning is performed in consideration of the input from the objective sensor 4. An appropriate joystick operation corresponding to the virtual repulsive force F is performed, and a positive reward is given when moving in a desired direction. Due to the virtual repulsive force F, a negative reward is given when moving in a direction different from the user's intention. For this reason, only by the user operating the joystick of the operation unit 2, an appropriate restitution coefficient η is extracted by the extraction unit 14.

なお、報酬のより詳細な具体例として、例えばユーザがジョイスティックを中央位置に保持し(W=0)電動車椅子1が停止した(Y=0)ときに正の報酬として1を与え、またユーザがジョイスティックを倒したときに電動車椅子1がジョイスティックと逆の向きに進む、または停止するときには負の報酬として−1を与えるようにしてもよい。   As a more specific example of the reward, for example, when the user holds the joystick in the center position (W = 0) and the electric wheelchair 1 stops (Y = 0), 1 is given as a positive reward, and the user When the electric wheelchair 1 moves in the opposite direction to the joystick when the joystick is pushed down or stops, -1 may be given as a negative reward.

以上のようにして、適切な反発係数ηが抽出されると、反発力生成部15がこれに基づき仮想反発力Fを計算する。仮想反発力Fが得られると、回避装置3の加算部10にて目標速度Umと仮想反発力Fとを加算して、速度Uを得る。   As described above, when an appropriate repulsion coefficient η is extracted, the repulsive force generation unit 15 calculates the virtual repulsive force F based on this. When the virtual repulsive force F is obtained, the adding unit 10 of the avoidance device 3 adds the target speed Um and the virtual repulsive force F to obtain the speed U.

ここで、電動車椅子1は、動力部7の右車輪7a、左車輪7b、および座席の向きを独立に変更可能となっている。得られた速度Uを、駆動装置6の変換部16にて、電動車椅子1の右車輪7a、左車輪7bなどの駆動用の速度ωへと変換する。この速度ωを実現するための駆動力を計算部17にて計算し、動力部7へと指示出力する。   Here, the electric wheelchair 1 can change independently the direction of the right wheel 7a of the power part 7, the left wheel 7b, and a seat. The obtained speed U is converted into the driving speed ω of the right wheel 7a, the left wheel 7b, etc. of the electric wheelchair 1 by the converter 16 of the drive device 6. The driving force for realizing the speed ω is calculated by the calculation unit 17 and an instruction is output to the power unit 7.

電動車椅子1のさらなる詳細については、以下の実施例において説明する。   Further details of the electric wheelchair 1 will be described in the following examples.

以上のように、本実施形態の電動車椅子1は、障害物との衝突を回避するために必要となる障害物との距離を、使用者のジョイスティックの操作状況から推測し、その距離を保ちつつ障害物を回避することを補助する回避装置3を備えている。   As described above, the electric wheelchair 1 according to the present embodiment estimates the distance from the obstacle necessary for avoiding the collision with the obstacle from the operation state of the user's joystick, and maintains the distance. An avoidance device 3 for assisting in avoiding an obstacle is provided.

この電動車椅子1は、使用者および障害物との距離を測定する対物センサ4を搭載した電動車椅子であり、(仮想)反発力発生器11、反発力調整器としての学習部12を備えている。上述のように、対物センサ4が検出した障害物と電動車椅子1との距離に応じて、反発力生成部15が障害物からの仮想反発力ベクトルを計算し、車椅子使用者のジョイスティック操作に基づくベクトルと合成し、それに基づいて電動車椅子1を走行させる。そして、反発力生成部15の計算した反発力の大きさが適切であるか否かを、使用者の操縦と比較して判断し、強化学習を用いた学習器12により調整する。   The electric wheelchair 1 is an electric wheelchair equipped with an objective sensor 4 that measures the distance from the user and an obstacle, and includes a (virtual) repulsive force generator 11 and a learning unit 12 as a repulsive force adjuster. . As described above, the repulsive force generation unit 15 calculates a virtual repulsive force vector from the obstacle according to the distance between the obstacle detected by the objective sensor 4 and the electric wheelchair 1, and is based on the joystick operation of the wheelchair user. The electric wheelchair 1 is caused to travel based on the combination with the vector. Then, whether or not the magnitude of the repulsive force calculated by the repulsive force generation unit 15 is appropriate is determined by comparison with the user's maneuver, and is adjusted by the learning device 12 using reinforcement learning.

学習器12においては、操作部2のジョイスティックの操作の仕方(操作者の意思と判断する。)と、実際の走行状態とを比較する。操作方向と移動方向が同じであれば正の報酬とし、それ以外のくい違いのある場合には負の報酬を与える。これは、例えばジョイスティックを倒している方向と逆方向に進む場合のように、仮想反発力が意思と反する方向に向いて、じゃまをしている場合などを考慮したものである。強化学習を用いて、仮想反発力のゲインを決める。これによって、ジョイスティックを動かして試行錯誤しているだけで、ゲインが最適化されていく。このため、普通に操縦していれば、その操縦のじゃまとならないように、仮想反発力が学習されて行くことになり、快適な操作が可能となる。   The learning device 12 compares the way of operating the joystick of the operation unit 2 (determined as the intention of the operator) with the actual running state. If the direction of operation is the same as the direction of movement, a positive reward is given. If there is any other difference, a negative reward is given. This takes into account the case where the virtual repulsive force is in the direction opposite to the intention and is disturbed, for example, when the joystick is moved in the direction opposite to the direction in which the joystick is tilted. Reinforcement learning is used to determine the gain of virtual repulsion. As a result, the gain is optimized simply by moving the joystick and performing trial and error. For this reason, if the vehicle is operated normally, the virtual repulsive force is learned so as not to disturb the operation, and a comfortable operation is possible.

なお、電動車椅子1は、図示しないスイッチを選択することにより、仮想反発力の学習を停止して、仮想反発力の係数の大きさを一定としたまま操作することもできる。また、さらに他のスイッチによって、仮想反発力自体を用いずに、ユーザの操作のみに応じて動作させることもできる。   The electric wheelchair 1 can also be operated with the magnitude of the coefficient of the virtual repulsive force being kept constant by stopping learning of the virtual repulsive force by selecting a switch (not shown). Furthermore, the operation can be performed only by the user's operation without using the virtual repulsive force itself by using another switch.

ここで、障害物を回避しながら電動車椅子1を走行させるためには、障害物との距離を少なくとも一定以上に保つことが必要となる。この距離は、障害物と衝突する危険が少なく、なおかつ走行経路を大幅にはずれることなく走行可能な距離である。このため、この距離は、走行環境や使用者の心理的、能力的な状態によって異なるものとなる。そこで、上述のように、走行環境や使用者に応じて最適な状態とすることのできる電動車椅子1を提供する。電動車椅子1によれば、障害物との距離を少なくとも一定以上に保つことができる。   Here, in order to run the electric wheelchair 1 while avoiding the obstacle, it is necessary to keep the distance from the obstacle at least a certain level. This distance is a distance that is less likely to collide with an obstacle and can travel without significantly deviating from the travel route. For this reason, this distance differs depending on the driving environment and the psychological and ability state of the user. Therefore, as described above, the electric wheelchair 1 that can be in an optimum state according to the traveling environment and the user is provided. According to the electric wheelchair 1, the distance from the obstacle can be kept at least a certain distance.

なお、上記実施形態の回避装置3の各部や各処理ステップは、CPUなどの演算手段が、ROM(Read Only Memory)やRAMなどの記憶手段に記憶されたプログラムを実行し、キーボードなどの入力手段、ディスプレイなどの出力手段、あるいは、インターフェース回路などの通信手段を制御することにより実現することができる。したがって、これらの手段を有するコンピュータが、上記プログラムを記録した記録媒体を読み取り、当該プログラムを実行するだけで、本実施形態の回避装置の各種機能および各種処理を実現することができる。また、上記プログラムをリムーバブルな記録媒体に記録することにより、任意のコンピュータ上で上記の各種機能および各種処理を実現することができる。   Note that in each part and each processing step of the avoidance device 3 of the above-described embodiment, an arithmetic unit such as a CPU executes a program stored in a storage unit such as a ROM (Read Only Memory) or a RAM, and an input unit such as a keyboard. It can be realized by controlling output means such as a display or communication means such as an interface circuit. Therefore, various functions and various processes of the avoidance device of the present embodiment can be realized simply by a computer having these means reading the recording medium storing the program and executing the program. In addition, by recording the program on a removable recording medium, the various functions and various processes described above can be realized on an arbitrary computer.

また、このコンピュータに、図1に示す操作部2、対物センサ4、速度センサ5、駆動装置6、動力部7などを接続して、上述の電動車椅子1を実現することもできる。   Further, the above-described electric wheelchair 1 can be realized by connecting the operation unit 2, the objective sensor 4, the speed sensor 5, the driving device 6, the power unit 7, and the like shown in FIG.

なお、プログラムを記録した記録媒体としては、マイクロコンピュータで処理を行うために図示しないメモリ、例えばROMのようなものがプログラムメディアであっても良いし、また、図示していないが外部記憶装置としてプログラム読取り装置が設けられ、そこに記録媒体を挿入することにより読取り可能なプログラムメディアであっても良い。   As a recording medium on which the program is recorded, a program medium such as a memory (not shown) such as a ROM may be used for processing by the microcomputer, and an external storage device is not shown. It may be a program medium provided with a program reading device and readable by inserting a recording medium therein.

また、上記プログラムメディアとしては、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスクやCD/MO/MD/DVD等のディスクのディスク系、ICカード(メモリカードを含む)等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラム
を担持する記録媒体等がある。
The program medium is a recording medium configured to be separable from the main body, such as a tape system such as a magnetic tape or a cassette tape, a magnetic disk such as a flexible disk or a hard disk, or a disk such as a CD / MO / MD / DVD. Fixed disk, IC card (including memory card), etc., or semiconductor ROM such as mask ROM, EPROM (Erasable Programmable Read Only Memory), EEPROM (Electrically Erasable Programmable Read Only Memory), flash ROM, etc. In particular, there are recording media that carry programs.

また、上述の実施形態においては、反発力を調整して障害物を回避する構成について説明した。しかしながら、障害物を回避するための構成としては、これに限るものではない。例えば、上述の電動車椅子1の構成において、回避装置3は、反発力の調整を行わず、操作部2に入力されるユーザの指示速度Wから得る速度Umを調整する構成であってもよい。この場合は、反発力生成器11側ではなく、コントローラ8側に、格納部13と抽出部14とを有する学習部12を設ける。この構成であっても、加算部10を介して速度U=Um+Fが調整され、障害物回避を実現できる。また、学習による適切な調整が可能となる。   Moreover, in the above-mentioned embodiment, the structure which adjusts a repulsive force and avoids an obstacle was demonstrated. However, the configuration for avoiding the obstacle is not limited to this. For example, in the configuration of the electric wheelchair 1 described above, the avoidance device 3 may be configured to adjust the speed Um obtained from the user's instruction speed W input to the operation unit 2 without adjusting the repulsive force. In this case, the learning unit 12 including the storage unit 13 and the extraction unit 14 is provided not on the repulsive force generator 11 side but on the controller 8 side. Even in this configuration, the speed U = Um + F is adjusted via the adder 10, and obstacle avoidance can be realized. In addition, appropriate adjustment by learning is possible.

〔実施例1〕
上述の電動車椅子1の詳細な実施例について説明する。本実施形態の電動車椅子1は、
上述のように、2つの駆動輪を有する駆動部と座面の部位を、モータを用いて回転させる非ホロノミックな機構を有する。このため、全方向の移動が可能である。
[Example 1]
A detailed embodiment of the above-described electric wheelchair 1 will be described. The electric wheelchair 1 of this embodiment is
As described above, it has a non-holonomic mechanism that rotates a drive unit having two drive wheels and a seat surface portion using a motor. For this reason, movement in all directions is possible.

電動車椅子1は、図3に示すように、椅子部分の回転速度(Angular velocity of the seat)ωs、右輪回転速度(Angular velocity of the right wheel)ωr、左輪回転速度(Angular velocity of the left wheel)ωl、右輪半径(Radius of the right wheel)Rr、左輪半径(Radius of the left wheel)Rl、左右輪の間隔(Tread of the vehicle)T、車体回
転速度(Angular velocity of the gravity center)ω、並進速度(Velocity of the gravity center)νのようなパラメータを含んでいる。なお、左右車輪、座面の角速度をωl/r/sとして表し、左右車輪、座面のモータの角速度をωMl/r/sと表す。
As shown in FIG. 3, the electric wheelchair 1 has an angular velocity of the seat ω s , an angular velocity of the right wheel ω r , and a left wheel rotational velocity (Angular velocity of the seat). left wheel) ω l , Radius of the right wheel R r , Radius of the left wheel R l , Tread of the vehicle T, Angular velocity of It includes parameters such as the gravity center) ω and translational velocity (Velocity of the gravity center) ν. In addition, the angular velocity of the left and right wheels and the seating surface is represented as ω 1 / r / s , and the angular velocity of the motors of the left and right wheels and the seating surface is represented as ω Ml / r / s .

また、本実施例の電動車椅子1における具体的な値の例は以下の通りである。車椅子の質量(Mass of the wheelchair)Mは81.2[kg]である。車椅子駆動部の慣性(Inertia of the drive part of the wheelchair)Jは1.98[kg m2]である。左右車輪軸の慣性(Inertia of the left/right wheel axis)Jl/rは4.38×10-4[kg m2]である。座面軸の慣性(Inertia
of the seat axis)Jsは11.0[kg m2]である。左右、座面のモータ軸の慣性(Inertia of the left/right/seat motor axis)JMl/r/sは2.16×10-5[kg m2]である。左右車輪と座席の摩擦係数(Friction constant of the left/right wheel and seat)δl/r/sは0.02[kg m2/sec]である。左右車輪と座席のギア比(Gear ratio of the left/right wheel and seat)γl/r/sは70である。左右車輪距離Tは0.6[m]である。左右車輪の半径Rl/rは0.05[m]である。
Moreover, the example of the specific value in the electric wheelchair 1 of a present Example is as follows. The mass of the wheelchair M is 81.2 [kg]. The inertia of the wheelchair drive part (Inertia of the drive part of the wheelchair) J is 1.98 [kg m 2 ]. Inertia of the left / right wheel axis J l / r is 4.38 × 10 −4 [kg m 2 ]. Inertia of bearing surface axis
of the seat axis) J s is 11.0 [kg m 2 ]. Inertia of the left / right / seat motor axis J Ml / r / s is 2.16 × 10 −5 [kg m 2 ]. Friction coefficient of the left and right wheels and the seat (Friction constant of the left / right wheel and seat) δ l / r / s is 0.02 [kg m 2 / sec] . Gear ratio of the left / right wheel and seat γl / r / s is 70. The left and right wheel distance T is 0.6 [m]. The radius R l / r of the left and right wheels is 0.05 [m].

図4には、本実施例における、駆動部6の構成の一変形例を示す。軌道(desired trajectory)が軌道追跡器20に入力されると、軌道追跡器(Trajectory tracker, 経路追従器)20が目標速度を計算し、逆変換器(Inverse PWS kinematics)21に入力する。逆変換器21は、電動車椅子1の操作のための速度へと変換する。運動制御部(PWS controller)22がその速度に達するために必要な外力を計算し、動力計算器(Dynamics of electric wheelchair)23がその外力に応じて得られる速度を計算する。得られた速度を運動制御
部22へと出力して調整を行う。変換器(PWS kinematics)24が、操作のための速度を、電動車椅子1の速度へと変換して、動力指示部(Wheelchair kinematics)25へと出力す
る。
FIG. 4 shows a modification of the configuration of the drive unit 6 in the present embodiment. When a trajectory (desired trajectory) is input to the trajectory tracker 20, the trajectory tracker (trajectory tracker) 20 calculates a target velocity and inputs it to an inverse transformer (Inverse PWS kinematics) 21. The reverse converter 21 converts the speed into an operation speed for the electric wheelchair 1. A motion control unit (PWS controller) 22 calculates an external force necessary to reach the speed, and a dynamics of electric wheelchair 23 calculates a speed obtained according to the external force. The obtained speed is output to the motion control unit 22 for adjustment. A converter (PWS kinematics) 24 converts the speed for operation into the speed of the electric wheelchair 1 and outputs it to the power instruction unit (Wheelchair kinematics) 25.

また、図5には、一変形例の他の概略を示す。ヒューマンコントローラ(Human Controller)26によって、所望の速度が入力される。調整部(RL Tuner)29により計算され、回避部(Object Avoider)28によって計算された反発力が、速度に加算されて駆動部(System)27に入力される。また、現在の速度に応じて、ユーザが操作スイッチ26を用いて所望の速度を入力する。   FIG. 5 shows another outline of a modification. A desired speed is input by a human controller 26. The repulsive force calculated by the adjustment unit (RL Tuner) 29 and calculated by the avoidance unit (Object Avoider) 28 is added to the speed and input to the drive unit (System) 27. In addition, the user inputs a desired speed using the operation switch 26 according to the current speed.

より詳細には、使用者から、ジョイスティック入力により、x方向軸速度νx ref(t)、
y方向軸速度νy ref(t)、回転角速度ωu ref(t)が与えられる。
More specifically, the joystick input from the user causes the x-direction axial velocity ν x ref (t),
A y-direction axial velocity ν y ref (t) and a rotational angular velocity ω u ref (t) are given.

軌道追跡器20により、次式で目標並進速度νref(t)、目標車体回転速度ωref(t)を計算する。 The trajectory tracker 20 calculates the target translation speed ν ref (t) and the target vehicle body rotation speed ω ref (t) by the following equations.

Figure 0004269055
Figure 0004269055

但し、 However,

Figure 0004269055
Figure 0004269055

であり、aは正の定数である。図4に示す逆変換器21、変換器24における変換は、そ
れぞれ以下のようになる。
And a is a positive constant. The conversion in the inverse converter 21 and the converter 24 shown in FIG. 4 is as follows.

Figure 0004269055
Figure 0004269055

以上のように、ジョイスティック入力から上記の式の逆変換に基づいて、各駆動軸の制御目標値を決定する。また、上記の式の変換に基づいて、各駆動軸の制御出力から、実際の並進速度ν(t)、車体回転速度ω(t)を求め、センサ情報とともに障害物回避装置に入力する。   As described above, the control target value of each drive shaft is determined based on the inverse transformation of the above equation from the joystick input. Further, based on the conversion of the above equation, the actual translation speed ν (t) and the vehicle body rotation speed ω (t) are obtained from the control output of each drive shaft, and input to the obstacle avoidance device together with the sensor information.

なお、本実施例における対物センサの配置の一例を図12に示す。このように、ジョイスティック31を備えた一実施例としての電動車椅子(移動体)30に対して、車体カバーの周囲に対物センサ(障害物センサ)32を搭載する。この対物センサ32は、超音波センサまたは赤外線センサであり、対障害物距離測定センサとして機能する。   An example of the arrangement of the objective sensors in this embodiment is shown in FIG. Thus, with respect to the electric wheelchair (moving body) 30 as an embodiment provided with the joystick 31, the objective sensor (obstacle sensor) 32 is mounted around the vehicle body cover. The objective sensor 32 is an ultrasonic sensor or an infrared sensor and functions as an obstacle distance measuring sensor.

また、本実施例においては、内蔵したマイクロコンピュータに実装したアルゴリズムにより回避補助動作を実現する。   In this embodiment, the avoidance assist operation is realized by an algorithm mounted on a built-in microcomputer.

本実施例における電動車椅子1の運動方程式は、図3に示すパラメータを用いて、以下のように記述できる。   The equation of motion of the electric wheelchair 1 in the present embodiment can be described as follows using the parameters shown in FIG.

Figure 0004269055
Figure 0004269055

但し、A〜Lは、それぞれ以下のような係数である。 However, A to L are the following coefficients, respectively.

Figure 0004269055
Figure 0004269055

上述の運動方程式から、左右輪および座面回転それぞれが干渉することが分かる。この影響を、次式のフィードフォワード補償器を用いたPIコントローラを用いて取り除く。PIコントローラについては、S.Iida and S.Yuta: Control of vehicle with power wheeled steerings using feedforward dynamics compensation, Proc.of 1991 IEEE Int.Conf.on Industrial Electronics, pp.2264-2269(1991)を参照されたい。   From the above equation of motion, it can be seen that the left and right wheels and the seat surface rotation interfere with each other. This effect is removed by using a PI controller using a feedforward compensator of the following equation. For PI controllers, see S. Iida and S. Yuta: Control of vehicle with power wheeled steerings using feedforward dynamics compensation, Proc. Of 1991 IEEE Int. Conf. On Industrial Electronics, pp. 2264-2269 (1991) .

Figure 0004269055
Figure 0004269055

但し、KPFF、KIFFはフィードバックゲインである。 However, K PFF and K IFF are feedback gains.

以下の図6(a)〜(c)にはPIコントローラのみを用いた場合のシミュレーション結果を示す。また、以下の図7(a)〜(c)には、フィードフォワード補償器を用いた場合のシミュレーション結果を示す。図6(a)・図7(a)は並進速度νについてのものであり、図6(b)・図7(b)は角速度ωについてのものであり、図6(c)・図7(c)は角速度ωuについてのものである。なお、それぞれの図においては、破線が実際
のシミュレーション結果を示しており、実線は、参照用にシミュレーションの目標となる時間変化を示している。図より分かるように、フィードフォワード補償器によって干渉を除去することができ、制御性能を向上することができる。
FIGS. 6A to 6C below show simulation results when only the PI controller is used. Moreover, the following FIGS. 7A to 7C show simulation results when a feedforward compensator is used. FIGS. 6A and 7A are for the translational velocity ν, and FIGS. 6B and 7B are for the angular velocity ω, and FIGS. c) is for the angular velocity ω u . In each figure, a broken line indicates an actual simulation result, and a solid line indicates a time change that is a simulation target for reference. As can be seen from the figure, interference can be removed by the feedforward compensator, and control performance can be improved.

次に、本実施例における具体的な仮想反発力の計算法、仮想反発力の計算法を以下に述べる。まず、障害物からの斥力ポテンシャルを、次式に基づいて計算する。   Next, a specific method for calculating the virtual repulsive force and a method for calculating the virtual repulsive force in the present embodiment will be described below. First, the repulsive potential from the obstacle is calculated based on the following equation.

Figure 0004269055
Figure 0004269055

但し、xは車椅子の現在位置を表すベクトル、ηは正の重み係数である。ρ(x)はxからの
障害物への最近接距離を表し、ρ0は正の定数である。斥力ポテンシャルの値U(x)は、0以上の値を取る。U(x)の値は、車椅子が障害物領域に近づくほど大きくなり、無限大に
近くなる。車椅子から障害物への距離がρ0以上のときには、U(x)の値は0となる。この
とき、車椅子に働く仮想的な反発力FOASを上記のポテンシャル関数U(x)により、FOAS
=−ΔUのように求める。
Where x is a vector representing the current position of the wheelchair, and η is a positive weighting factor. ρ (x) represents the closest distance from x to the obstacle, and ρ 0 is a positive constant. The repulsive potential value U (x) takes a value of 0 or more. The value of U (x) increases as the wheelchair approaches the obstacle area and approaches infinity. When the distance from the wheelchair to the obstacle is ρ 0 or more, the value of U (x) is 0. At this time, the virtual repulsive force F OAS the potential function U acting on the wheelchair (x), F OAS
= -ΔU

また、本変形例では、使用者のジョイスティックからの入力に基づくベクトルUman
、仮想反発力ベクトルFOASとを合成し、電動車椅子1の操作量u=Uman+FOASとする
In this modification, a vector U man based on the input from the joystick of the user synthesizes the virtual repulsive force vector F OAS, the manipulated variable u = U man + F OAS of the electric wheelchair 1.

反発力調整器としての調整部29が、式(28)の重み係数ηを調整することで、仮想反発力発生器としての回避部28に、環境や使用者の状態に適した大きさの反発力を計算させる。パラメータの調整には、強化学習を用いる。強化学習器における処理手続きには、後述するSarsa(λ)を用い、状態空間の生成にはCMACによるタイルコーディングを導入
した。なお、CMACによるタイルコーディングについては、J.S.Albus: Data storage in the control cerebellar model articulation contro1(CMAC), Trans.on ASME, J.of Dynamic Systems, Measurement, and Control, 97-9, 228/233(1975)を参照されたい。
The adjusting unit 29 as a repulsive force adjuster adjusts the weighting coefficient η in the equation (28), so that the avoiding unit 28 as a virtual repulsive force generator has a repulsion having a size suitable for the environment and the state of the user. Let the force be calculated. Reinforcement learning is used for parameter adjustment. Sarsa (λ), which will be described later, was used for the processing procedure in the reinforcement learning device, and tile coding by CMAC was introduced for the generation of the state space. For tile coding by CMAC, JSAlbus: Data storage in the control cerebellar model articulation control 1 (CMAC), Trans.on ASME, J.of Dynamic Systems, Measurement, and Control, 97-9, 228/233 (1975) Please refer to.

強化学習器の状態には、センサにより検出された障害物と車椅子の間の距離、接近速度、ジョイスティックの位置をとる。強化学習器の報酬は、次のように与える。   The state of the reinforcement learner includes the distance between the obstacle detected by the sensor and the wheelchair, the approach speed, and the position of the joystick. Reinforcement learner rewards are given as follows.

まず、正の報酬を与える場合は、使用者がジョイスティックを中央位置に保持し、車椅子が停止したときとする。この場合に1の報酬を与える。   First, when giving a positive reward, the user holds the joystick in the center position and the wheelchair stops. In this case, 1 reward is given.

一方、負の報酬を与える場合は、使用者がジョイスティックを倒したときに、電動車椅子がジョイスティックを倒した向きと逆方向に進んでいるか、または停止しているときにとする。この場合に-1の報酬を与える。   On the other hand, when a negative reward is given, it is assumed that when the user defeats the joystick, the electric wheelchair is moving in the direction opposite to the direction of defeating the joystick or is stopped. In this case, -1 reward is given.

つまり、ジョイスティックの操作から使用者の意向を推測し、目標とする距離を確保していると判断できるときに正の報酬を与え、仮想反発力が弱すぎるか又は強すぎるかして、目標距離を確保できず、使用者の意思に反した方向に車椅子が進んでいると判断できるときには負の報酬を与える。   In other words, the user's intention is estimated from the operation of the joystick, a positive reward is given when it can be determined that the target distance is secured, and the virtual repulsive force is too weak or too strong, the target distance If the wheelchair is moving in a direction contrary to the user's intention, a negative reward is given.

次に、状態空間の生成に用いる、CMACによるタイルコーディングを導入した、Sarsa(λ)の処理手続きを簡単に示す。   Next, the Sarsa (λ) processing procedure using tile coding by CMAC, which is used for generating the state space, will be briefly described.

まず、ベクトルθにより、CMACの荷重表をベクトル表現する。ベクトルeは、適格度トレースベクトルを表す。Qaは価値関数である。Sは状態sの集合であり、各々、セ
ンサにより検出された障害物と車椅子の間の距離、接近速度、ジョイスティックの位置を数値として与えた。aは行動であり、重み係数ηを与える。報酬rは、上述の基準に基づき実数値を与える。また、γは割引率(discount rate)であり、λはトレース減衰パラメ
ータ(trace-decay parameter)である。
First, the CMAC load table is expressed in vector by the vector θ. Vector e represents the eligibility trace vector. Q a is a value function. S is a set of states s, and the distance between the obstacle detected by the sensor and the wheelchair, the approach speed, and the position of the joystick are given as numerical values. a is an action and gives a weighting coefficient η. The reward r is a real value based on the above criteria. Γ is a discount rate, and λ is a trace-decay parameter.

まず、ベクトルθを任意に初期化し、ベクトルeにゼロベクトルを代入する。各エピソードに対して、以下の処理手順を繰り返す。   First, the vector θ is arbitrarily initialized, and a zero vector is substituted for the vector e. The following procedure is repeated for each episode.

まず、状態Sをエピソードの初期状態とする。次に、集合A(s)の要素である行動aについて、s、aでの特徴集合をFaとし、Faの要素iについてベクトルθ(i)の総和をQaとし、arg maxaaをaとする。 First, let state S be the initial state of the episode. Next, for an action a that is an element of the set A (s), a feature set at s and a is F a , a sum of vectors θ (i) is Q a for an element i of F a , and arg max a Q Let a be a.

次に、ソフトマックス政策により、集合A(s)の行動aから行動を選択する。但し、ソフトマックス政策は、次式に基づいて選択確率を決定し、行動集合から行動を選択するものとする。   Next, an action is selected from the action a of the set A (s) by the softmax policy. However, in the softmax policy, the selection probability is determined based on the following equation, and the action is selected from the action set.

Figure 0004269055
Figure 0004269055

次に、エピソードの各ステップに対して、以下の処理手順を繰り返す。   Next, the following processing procedure is repeated for each step of the episode.

まず、γλ×ベクトルeを、ベクトルeとする。   First, let γλ × vector e be a vector e.

次に、集合Faの全ての要素iについて、ベクトルe(i)+1を、ベクトルe(i)とす
る。行動aを取り、報酬rと次状態s’を観測する。r−Qaをδとする。集合A(s’
)に含まれる全ての要素aについて、s’、aでの特徴集合をFaとし、Faの要素iについてベクトルθ(i)の総和をQaとし、arg maxaaをa’とする。そして、ソフトマッ
クス政策により、集合A(s)の行動a’から行動を選択する。そして、δ+γQa'をδとし、ベクトルθ+αδ×ベクトルeをベクトルθとする。s’が終端状態であれば繰り返しを終了する。
Then, for all elements i of the set F a, the vector e (i) +1, and the vector e (i). Take action a and observe reward r and next state s ′. Let r-Q a be δ. Set A (s'
For all elements a contained), s ', a feature set at a and F a, the sum of the vector theta (i) the elements i of F a and Q a, the arg max a Q a a' a To do. Then, an action is selected from the action a ′ of the set A (s) by the softmax policy. Then, δ + γQ a ′ is δ, and vector θ + αδ × vector e is vector θ. If s ′ is in the terminal state, the repetition ends.

上記の手順を用いて、ジョイスティックの入力に応じて、障害物との間に使用者の望む一定距離を保持することができるか確認した。   Using the above procedure, it was confirmed whether a certain distance desired by the user can be maintained between the obstacle and the obstacle according to the input of the joystick.

なお、実際には、上述した式(7)-(21)を用いたシステムとするべきであるが、簡単化のために一方向のみの実験を行った。すなわち、便宜上、車椅子のシステムを、y(t) = 1.905 y(t-1) - 0.905 y(t-2) + 0.005 u(t-1) + 0.005 u(t-2)で表現する。また、使用者の操作入力を、pコントローラとして、um(t)=Kp{w(t)-y(t)}で表現する。ここで、Kpがpコントローラの比例ゲイン、w(t)は目標値である。また、Kp、w(t)、ν(t)は障害物回避補助システムにとって未知であるものとする。なお、反発力調整器に用いた強化学習器のパラメータは、以下の通りである。まず、ステップサイズパラメータ(Step-size parameter)αは0.2とし、割引率(Discount rate)γは1.0とし、トレース減衰パラメータ(Trace-decay parameter)λは0.9とし、温度係数(Temperature coefficient)Tは1.0とし、CMAC重みテーブルの数(Number of weight tables of CMAC)は5とした。 In practice, the system should be based on the above-described equations (7)-(21), but for simplification, only one-way experiment was performed. That is, for convenience, the wheelchair system is expressed as y (t) = 1.905 y (t-1) −0.905 y (t−2) +0.005 u (t−1) +0.005 u (t−2). Further, the user's operation input is expressed as u m (t) = K p {w (t) −y (t)} as a p controller. Here, Kp is the proportional gain of the p controller, and w (t) is the target value. Further, it is assumed that K p , w (t), and ν (t) are unknown to the obstacle avoidance assistance system. The parameters of the reinforcement learner used for the repulsive force adjuster are as follows. First, a step-size parameter α is 0.2, a discount rate γ is 1.0, a trace-decay parameter λ is 0.9, and a temperature coefficient T is 1.0. The number of CMAC weight tables (Number of weight tables of CMAC) was 5.

まず、目標値w(t)=45とし、Kp、ρ0を変化させて、1次元でのシミュレーションを行った結果について説明する。シミュレーションとして、100回の試行を行った。図8(a)(b)には、Kp=0.5、ρ0=60の場合のシミュレーション結果を示す。また、図9
(a)(b)には、Kp=1.0、ρ0=65の場合のシミュレーション結果を示す。
First, the result of performing a one-dimensional simulation with the target value w (t) = 45 and changing K p and ρ 0 will be described. As a simulation, 100 trials were performed. FIGS. 8A and 8B show simulation results when K p = 0.5 and ρ 0 = 60. Also, FIG.
The (a) (b), it shows the simulation results for K p = 1.0, ρ 0 = 65.

図8(a)の縦軸におけるy=60、図9(a)の縦軸におけるy=65の太い実線は、壁面
を表す。また、それぞれの図において、縦軸におけるy=45の位置の一点鎖線は、回避し
たい距離を表す。また、それぞれの図において、黒い実線が仮想反発力を与えた場合の車椅子の時間変化に応じた軌跡を示す。また、破線が仮想反発力を与えない場合の軌跡を示す。
A thick solid line with y = 60 on the vertical axis in FIG. 8A and y = 65 on the vertical axis in FIG. 9A represents a wall surface. In each figure, the alternate long and short dash line at the position of y = 45 on the vertical axis represents the distance to be avoided. Moreover, in each figure, the locus | trajectory according to the time change of the wheelchair when a black continuous line gives virtual repulsive force is shown. Moreover, a broken line shows the locus | trajectory when not giving virtual repulsive force.

また、図8(b)、図9(b)には、調整するパラメータηの時間変化を示す。図8(b)においては、パラメータηが約4となる様子が示されている。仮想反発力発生器が計算した反発力によって、Pコントローラによる定常偏差をおさえて、目標距離の維持が実
現されている。また、図9(b)においては、パラメータηが約8となり、図8(b)と同様に目標距離の維持が実現される。
FIGS. 8B and 9B show changes over time in the parameter η to be adjusted. FIG. 8B shows a state where the parameter η is about 4. By the repulsive force calculated by the virtual repulsive force generator, the steady distance by the P controller is suppressed, and the target distance is maintained. In FIG. 9B, the parameter η is about 8, and the target distance can be maintained as in FIG. 8B.

次に、目標値w(t)=300とし、Kp=5として、ρ0を変化させて、2次元でシミュレーションを行った結果について説明する。シミュレーションとして、20回の試行を行った。図10(a)(b)には、ρ0=380の場合のシミュレーション結果を示す。また、図11(a)(b)には、ρ0=350の場合のシミュレーション結果を示す。 Next, a description will be given of the result of a two-dimensional simulation with the target value w (t) = 300, K p = 5, and changing ρ 0 . As a simulation, 20 trials were performed. FIGS. 10A and 10B show simulation results in the case of ρ 0 = 380. FIGS. 11A and 11B show simulation results when ρ 0 = 350.

図10(a)の横軸におけるx=380、図11(a)の横軸におけるx=350の太い実線は、壁面を表す。また、それぞれの図において、横軸におけるx=300の位置の破線は、
回避したい距離を表す。また、それぞれの図において、黒い実線による白丸(18a、19a)が仮想反発力を与えた場合の車椅子の時間変化に応じた軌跡を示す。また、白丸の領域に対して図中右側の陰になる位置に、灰色で示す領域(18b、19b)は、仮想反発力を与えない場合の軌跡を重ねて示すものである。
A thick solid line with x = 380 on the horizontal axis in FIG. 10A and x = 350 on the horizontal axis in FIG. 11A represents a wall surface. Moreover, in each figure, the broken line of the position of x = 300 in a horizontal axis is
Represents the distance to avoid. Moreover, in each figure, the locus | trajectory according to the time change of a wheelchair when the white circle (18a, 19a) by a black continuous line gave virtual repulsion force is shown. Further, gray areas (18b, 19b) are shown in a shaded position on the right side in the figure with respect to the white circle area, and the trajectories when virtual repulsive force is not applied are superimposed.

また、図10(b)、図11(b)には、調整するパラメータηの時間変化を示す。図10(b)においては、パラメータηが約1となる様子が示されている。仮想反発力発生器が計算した反発力によって、Pコントローラによる定常偏差をおさえて、目標距離の維
持が実現されている。また、図11(b)においては、パラメータηが約0.5となり、図
10(b)と同様に目標距離の維持が実現される。
FIGS. 10B and 11B show changes over time in the parameter η to be adjusted. FIG. 10B shows a state where the parameter η is about 1. By the repulsive force calculated by the virtual repulsive force generator, the steady distance by the P controller is suppressed, and the target distance is maintained. In FIG. 11B, the parameter η is about 0.5, and the target distance can be maintained as in FIG.

上記の結果から、強化学習を用いた反発力調整器によって、使用者の入力からの判断により、壁との距離が異なっても、同一のシステムによる目標距離の維持が可能であることが分かる。   From the above results, it is understood that the repulsive force adjuster using reinforcement learning can maintain the target distance by the same system even if the distance from the wall is different, based on the judgment from the user's input.

〔変形例1〕
上述の実施例1における、全方向移動可能な車椅子についての変形例を説明する。本変形例においては、左右駆動輪機構を有する従来型の電動車椅子に対する、障害物回避装置の実装について説明する。
[Modification 1]
The modification about the wheelchair which can move to all directions in the above-mentioned Example 1 is demonstrated. In this modification, an implementation of an obstacle avoidance device for a conventional electric wheelchair having a left and right drive wheel mechanism will be described.

図14が、本変形例の電動車椅子(移動体)35の概略を示す図である。電動車椅子35は、図1に示す電動車椅子1とほぼ同様の概略構成を有するものであり、同様の点については説明を省略する。図14には、図1に示す操作部2に相当するジョイスティック36、図1に示す回避装置3、駆動装置6に相当するマイクロコンピュータ37、および対物センサ4に相当する対障害物距離測定センサ38を示す。   FIG. 14 is a diagram showing an outline of the electric wheelchair (moving body) 35 of the present modification. The electric wheelchair 35 has a schematic configuration substantially the same as that of the electric wheelchair 1 shown in FIG. 1, and the description of the same points is omitted. FIG. 14 shows a joystick 36 corresponding to the operation unit 2 shown in FIG. 1, a avoidance device 3 shown in FIG. 1, a microcomputer 37 equivalent to the driving device 6, and an obstacle distance measuring sensor 38 equivalent to the objective sensor 4. Indicates.

この電動車椅子35は左右駆動輪機構を有しているので、パラメータは、図13に示すように、左車輪の回転速度νL、右車輪の回転速度νRであり、これらの並進速度νx、角
速度ωとの関係は、νR=νx+rω、およびνL=νx−rωで与えられる。但し、rは車体中心から車輪接地点までの距離を表す。
Since the electric wheelchair 35 has left and right drive wheels mechanism, parameters, as shown in FIG. 13, the rotational speed of the left wheel [nu L, the rotation speed [nu R of the right wheel, these translational velocity [nu x The relationship with the angular velocity ω is given by ν R = ν x + rω and ν L = ν x −rω. However, r represents the distance from the vehicle body center to the wheel ground contact point.

このように、全方向移動可能な車椅子でなく、左右駆動輪機構を有する従来型の電動車
椅子35に対しても、本発明の構成を適用できる。ただし、電動車椅子1であれば、電動車椅子35よりも小回りが利くため、操縦が難しいということができ、障害物回避補助装置を用いた障害物回避の効果をより多く得ることができる。
Thus, the configuration of the present invention can be applied not only to a wheelchair that can move in all directions but also to a conventional electric wheelchair 35 having a left and right drive wheel mechanism. However, since the electric wheelchair 1 has a smaller turn than the electric wheelchair 35, it can be said that the steering is difficult, and more obstacle avoidance effects using the obstacle avoidance assisting device can be obtained.

〔変形例2〕
本発明に係る移動体は、車椅子以外に適用することもできる。すなわち、上記移動体としては、人が操作・操縦する車両等に障害物回避装置を使用する形態が想定される。使用する車両としては、移動速度と移動方向が制御可能なものであれば種類を問わない。操縦形態としては、車両に乗ってジョイスティックやハンドル・アクセル・ブレーキ等で操縦する場合、荷車を押すような形で動力を用いてそれを補助する場合、ラジオ・コントロール等で遠隔操縦を行う場合等が考えられる。したがって、全方向移動車両、操舵輪による車両(自動車)、左右駆動輪による車両(電動車椅子)、歩行車両、船舶等に適用してもよい。なお、移動速度は、人が歩いたり、走ったりする場合における程度と同等の速度が想定されるが、特に制限はない。
[Modification 2]
The mobile body according to the present invention can be applied to other than wheelchairs. That is, as the moving body, a form in which an obstacle avoidance device is used for a vehicle or the like that is operated and operated by a person is assumed. The vehicle to be used is not limited as long as the moving speed and the moving direction can be controlled. As a form of operation, when riding a vehicle with a joystick, steering wheel, accelerator, brake, etc., assisting with power by pushing a cart, remote control with radio control etc. Can be considered. Therefore, the present invention may be applied to omnidirectional vehicles, vehicles using steered wheels (automobiles), vehicles using left and right drive wheels (electric wheelchairs), walking vehicles, ships, and the like. The moving speed is assumed to be the same speed as when a person walks or runs, but is not particularly limited.

本変形例では、このうち、軽車両への実装の一例として、荷物を積載して搬送を行う台車型の車両(移動体)40について、図15に基づいて説明する。この車両40は、人が取っ手41を押して移動するものであり、図示しない障害物回避補助装置(回避装置)がその操作を補助(アシスト)するタイプである。車両40は、図1に示す電動車椅子1とほぼ同様の概略構成を有するものであり、同様の点については説明を省略する。   In this modified example, a cart-type vehicle (moving body) 40 that loads and conveys luggage will be described with reference to FIG. 15 as an example of mounting on a light vehicle. The vehicle 40 is a type in which a person moves by pushing a handle 41, and an obstacle avoidance assisting device (avoidance device) (not shown) assists the operation. The vehicle 40 has a schematic configuration substantially similar to that of the electric wheelchair 1 shown in FIG. 1, and the description of the same points is omitted.

車両40の取っ手41は、使用者によって与えられる力を検出する力センサを内蔵している。この取っ手41が取っ手41に加えられる力の大きさと方向を検出する。また、車両40は、対障害物距離測定センサ42を台車の周囲に備えている。車両40の回避装置が台車の左右輪の駆動力を調整し、人が押す力を補助する。これによって、障害物回避補助動作を実現する。   The handle 41 of the vehicle 40 has a built-in force sensor that detects the force applied by the user. The handle 41 detects the magnitude and direction of the force applied to the handle 41. Further, the vehicle 40 includes an obstacle distance measuring sensor 42 around the carriage. The avoidance device of the vehicle 40 adjusts the driving force of the left and right wheels of the carriage, and assists the force pushed by the person. This implements an obstacle avoidance assist operation.

以上の構成のような車両40によれば、例えば搬送する荷物が大きくて、路面状況が十分把握できないような場合についても、安全に障害物を回避しながらの走行が可能となる。   According to the vehicle 40 having the above configuration, for example, even when the load to be transported is large and the road surface condition cannot be sufficiently grasped, it is possible to travel while avoiding the obstacle safely.

〔変形例3〕
本変形例では、遠隔操縦する移動体についての実施例を、図16(a)(b)に基づいて説明する。図16(a)(b)に示すシステムは、一体とした場合には、図1に示す電動車椅子1と類似した概略構成を包含するものである。以下では、電動車椅子1と同様の点については説明を省略する。
[Modification 3]
In this modification, an example of a mobile body that is remotely controlled will be described with reference to FIGS. The system shown in FIGS. 16A and 16B includes a schematic configuration similar to that of the electric wheelchair 1 shown in FIG. 1 when integrated. Below, description is abbreviate | omitted about the point similar to the electric wheelchair 1. FIG.

図16(b)に示す車両(移動体)45は、CCDカメラ48、対障害物距離測定センサ49、および図示しない障害物回避装置(回避装置)を備えている。一方、図16(a)には、車両45を操作するための遠隔操作装置の一部である、操作部46と表示部47とを示す。操作部46はハンドル形状である。表示部47は平面型の表示ディスプレイである。車両45のCCDカメラ48にて撮影した画像データが、遠隔操作装置に送信され、表示部47に表示される。   A vehicle (moving body) 45 shown in FIG. 16B includes a CCD camera 48, an obstacle distance measuring sensor 49, and an obstacle avoidance device (avoidance device) (not shown). On the other hand, FIG. 16A shows an operation unit 46 and a display unit 47 which are a part of a remote control device for operating the vehicle 45. The operation unit 46 has a handle shape. The display unit 47 is a flat display. Image data captured by the CCD camera 48 of the vehicle 45 is transmitted to the remote control device and displayed on the display unit 47.

使用者は、操作部46を用いて所望の移動速度等を車両45に指示する。対障害物距離測定センサ49にて周囲の障害物を検出する。回避装置が車両45の駆動力を調整し、障害物回避補助動作を実現する。   The user uses the operation unit 46 to instruct the vehicle 45 about a desired moving speed or the like. A surrounding obstacle is detected by an obstacle distance measuring sensor 49. The avoidance device adjusts the driving force of the vehicle 45 to realize the obstacle avoidance assist operation.

このように、ラジオコントロール等による遠隔操作で移動体を操縦する場合、移動体に搭載されたCCDカメラでは、十分に進行方向の障害物を把握できない場合が考えられる
。このような場合であっても、提案する障害物回避補助装置を実装すれば、操縦を支援することができる。
As described above, when a moving body is controlled by a remote operation such as radio control, a CCD camera mounted on the moving body may not be able to sufficiently grasp an obstacle in the traveling direction. Even in such a case, if the proposed obstacle avoidance assisting device is mounted, steering can be supported.

なお、本変形例においては、障害物回避補助装置を車両45に備えている構成について説明したが、これに限るものではなく、障害物回避補助装置を遠隔操作装置側に備えてもよい。遠隔操作装置側で障害物回避補助装置を用いて修正した速度を計算し、移動体に送信してもよい。このようにすれば、移動体をコンパクトにできる。   In addition, in this modification, although the structure provided with the obstacle avoidance assistance apparatus in the vehicle 45 was demonstrated, it is not restricted to this, You may provide an obstacle avoidance assistance apparatus in the remote control apparatus side. The corrected speed may be calculated by using the obstacle avoidance assisting device on the remote operation device side and transmitted to the moving body. In this way, the moving body can be made compact.

また移動体としては、図示した構成に限るものではなく、車両や飛行体、船舶等であってもよい。   Further, the moving body is not limited to the illustrated configuration, and may be a vehicle, a flying body, a ship, or the like.

以上に説明したように、簡易機構を用いた全方向移動車椅子を提案し、シミュレーションによりその動特性を検証した。また、フィードフォワード補償器を用いることにより、各軸の干渉の除去を行った。また、電動車椅子の障害物回避補助システムとして、障害物からの仮想反発力を強化学習により調節するシステムを提案し、シミュレーションにより有効性の検証を行った。その結果、強化学習を用いた反発力調整器によって、使用者の入力からの判断により、使用者の操作性や目標距離(壁との距離)が異なっても、同一のシステムによる目標距離の維持が可能であることが示された。   As explained above, we proposed an omnidirectional mobile wheelchair using a simple mechanism and verified its dynamic characteristics by simulation. Moreover, the interference of each axis was removed by using a feedforward compensator. In addition, as an obstacle avoidance assistance system for electric wheelchairs, we proposed a system that adjusts the virtual repulsive force from obstacles by reinforcement learning, and verified its effectiveness by simulation. As a result, the repulsive force adjuster using reinforcement learning maintains the target distance by the same system even if the user's operability and the target distance (distance to the wall) differ according to the judgment from the user's input. Was shown to be possible.

また、以上に説明したように、本発明の実施形態は、簡易機構を用いた全方向移動車椅子の開発と強化学習による障害物回避補助装置の実装に関するものである、と表現することもできる。   Further, as described above, the embodiment of the present invention can also be expressed as relating to development of an omnidirectional mobile wheelchair using a simple mechanism and implementation of an obstacle avoidance assisting device by reinforcement learning.

ここで、高齢化社会の進展とともに、体に多少の不自由を感じる人から寝たきりの人まで、移動補助機器に関する多様なニーズが存在する。その中で共通するものとして、狭い場所で小回りが利くことや、従来と異なったイメージの車椅子に対する要望がある。そこで、これらに対応するための機器として、機構の大幅な簡略化及びソフトウェアによる制御により操縦を容易にして全方向移動を実現し、これを用いた小型で安価な全方向移動車椅子を提案する。また、強化学習を用いた障害物回避補助システムを実装することにより、使用者の操縦能力に応じて、適切に障害物の回避を補助する。提案手法では障害物からの仮想反発力を使用者の操作入力に合成することで障害物の回避補助を行う。仮想反発力は個々の使用者や環境の状態に、強化学習を用いて調整される。提案手法は数値シミュレーションによって評価した。   Here, with the progress of an aging society, there are various needs for mobility aids ranging from those who feel a little inconvenient to those who are bedridden. Among them, there are common demands for a small turn in a narrow place and a wheelchair with a different image from the conventional one. Therefore, as a device for dealing with these problems, the present invention proposes a small and inexpensive omnidirectional mobile wheelchair that uses this to realize omnidirectional movement by greatly simplifying the mechanism and controlling it with software to facilitate operation. In addition, by implementing an obstacle avoidance assistance system using reinforcement learning, the obstacle avoidance is appropriately assisted according to the user's steering ability. In the proposed method, obstacle avoidance assistance is performed by synthesizing the virtual repulsive force from the obstacle into the user's operation input. The virtual repulsive force is adjusted using reinforcement learning to individual users and environmental conditions. The proposed method was evaluated by numerical simulation.

なお、従来、全方向移動機構、全方向移動機構を備えた車椅子が非特許文献1〜3に開示されているが、機構が複雑で、高価であるなどの理由から、一般に広く普及するには至っていない。   Conventionally, an omnidirectional movement mechanism and a wheelchair equipped with an omnidirectional movement mechanism are disclosed in Non-Patent Documents 1 to 3, but the mechanism is complicated and expensive so that it can be widely used in general. Not reached.

そこで、上述のように、簡略な機構を用い、ソフトウェアによる制御により操縦を容易にして全方向移動を実現し、これを用いた小型で安価な全方向移動車椅子を提案する。   Thus, as described above, a simple mechanism is used to facilitate omnidirectional movement by software control, and a small and inexpensive omnidirectional wheelchair using the same is proposed.

また、従来の特許文献4には、反発力を想定して動作制御する構成について記載があるが、本件のようなアルゴリズムの詳細までは開示されていない。また、仮想反発力をどう計算するか、どのように用いるかは、上述の実施形態の構成とは異なっている。   Moreover, although the conventional patent document 4 has described about the structure which carries out operation control supposing a repulsive force, the detail of the algorithm like this case is not disclosed. Further, how to calculate the virtual repulsive force and how to use it are different from the configuration of the above-described embodiment.

また、障害を持つ人は、障害物を回避しながら電動車椅子を操縦することは困難である。そこで、上述のように、使用者の状態や使用環境に適した障害物回避補助を行うシステムを構築する。具体的には、使用者のジョイスティック操作入力に障害物からの仮想的な反発力を加えることで、障害物の回避を補助する。この仮想反発力の大きさは、環境状態や使用者によって変化させる必要があると考える。例えば、広く障害物の少ない場所と狭
く障害物の多い場所とでは、仮想反発力の適当な大きさは異なるものとなり、環境に応じて適切な仮想反発力が変化することになる。また、使用者の障害の程度や、個人の心理的な特性(パーソナルスペースの広さ等)に応じて、仮想反発力の適当な大きさは異なるものとなる。そこで、使用者のジョイスティックの操作入力から、その環境下における仮想反発力の良し悪しを判断し、強化学習を用いて適当な出力を生成する手法を提案する。
Moreover, it is difficult for a person with an obstacle to operate an electric wheelchair while avoiding an obstacle. Therefore, as described above, a system that performs obstacle avoidance assistance suitable for the user's condition and use environment is constructed. Specifically, avoiding an obstacle is assisted by applying a virtual repulsive force from the obstacle to the user's joystick operation input. I think that the magnitude of this virtual repulsive force needs to be changed according to environmental conditions and users. For example, the appropriate magnitude of the virtual repulsive force differs between a wide area with few obstacles and a narrow area with many obstacles, and the appropriate virtual repulsive force changes depending on the environment. Also, the appropriate magnitude of the virtual repulsive force varies depending on the degree of obstacle of the user and the psychological characteristics (personal space size, etc.) of the individual. Therefore, we propose a method for judging whether the virtual repulsive force is good or bad in the environment from the operation input of the user's joystick, and generating an appropriate output using reinforcement learning.

なお、強化学習以外の方法を用いて仮想反発力を調整する方法として、事前学習(オフライン学習)によるものが考えられる。この場合、ニューラルネットワークなどの教師付き学習法を用いて、想定される環境中での走行を事前に行い、適切な仮想反発力を教師信号として与える。このような事前学習を行うためには、障害物との適切な距離および速度が予め必要であり、そこから仮想反発力を逆算する必要がある。しかしながら、障害物との適切な距離および速度は、使用する人によって異なり、また陽に得られるものではなく、走行環境によっても変化するので、この方法は実用的ではない。すなわち、この従来の方法は、使用する人に合わせるものでない。また、人間の動的な応答に対応するものではなく、このため、人との相互作用により調節するものではない、ということもできる。   As a method of adjusting the virtual repulsive force using a method other than reinforcement learning, a method based on prior learning (offline learning) can be considered. In this case, using a supervised learning method such as a neural network, traveling in an assumed environment is performed in advance, and an appropriate virtual repulsive force is given as a teacher signal. In order to perform such pre-learning, an appropriate distance and speed from the obstacle are required in advance, and the virtual repulsive force needs to be calculated backward from there. However, this method is not practical because the appropriate distance and speed with respect to the obstacle vary depending on the person who uses it, is not obtained explicitly, and varies depending on the driving environment. That is, this conventional method is not adapted to the user. In addition, it does not correspond to the dynamic response of human beings, and for this reason, it can also be said that it does not adjust by interaction with humans.

また、この方法を、使用する人が操縦しながら、障害物に対して本当は維持したい距離および速度を常に何らかの方法で入力することによって、学習させることも考えられる。しかし、これは使用する人にとって負担となる。また、現実には、使用する人は、厳密にこの距離、この速度を維持したいと考える訳ではなく、その時々で、もっと遠く、もっと近く、単純に今の状態が良いか、悪いかを感じ、それを改善したいと思うだけであると考えられる。   It is also conceivable that this method is learned by always inputting the distance and speed that the user wants to maintain against the obstacle in some way while manipulating the method. However, this is a burden on the user. Also, in reality, the user doesn't want to maintain this distance, this speed exactly, but sometimes feels far better, closer, simply better or worse It seems that you just want to improve it.

したがって、上述のように、教師信号を必要とせず、現在の状態の善し悪しによって正負の報酬を与える、教師なし学習法である強化学習を用いて、仮想反発力を調整するものとした。   Therefore, as described above, the virtual repulsive force is adjusted using reinforcement learning, which is an unsupervised learning method that does not require a teacher signal and gives positive or negative rewards depending on whether the current state is good or bad.

上述の具体的な実施形態または実施例は、あくまでも、本発明の技術内容を明らかにするものであって、本発明はそのような具体例にのみ限定して狭義に解釈されるべきものではなく、特許請求の範囲に示した範囲で種々の変更が可能であり、変更した形態および実施の形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施の形態についても、本発明の技術的範囲に含まれる。   The specific embodiments or examples described above are merely to clarify the technical contents of the present invention, and the present invention is not limited to such specific examples and should not be interpreted in a narrow sense. Various modifications can be made within the scope of the claims, and the modified embodiment and the embodiment obtained by appropriately combining the technical means respectively disclosed in the embodiment are also the technical features of the present invention. Included in the range.

本発明に係る障害物回避装置は、ユーザの操作に応じた最適な移動状態を実現できるので、例えば電動車椅子に搭載できる。   Since the obstacle avoidance device according to the present invention can realize an optimal movement state according to the user's operation, it can be mounted on, for example, an electric wheelchair.

また、本発明に係る障害物回避装置は、異なるユーザに対応できるだけでなく、環境の変化が大きい場合にも対応できるので、例えば遠隔操縦する移動体に搭載することもできる。   Moreover, since the obstacle avoidance device according to the present invention can cope not only with different users but also when the environment changes greatly, it can also be mounted on a mobile object that is remotely operated, for example.

本発明に係る障害物回避装置を備えた移動体としての電動車椅子について、一実施形態の概略を示すブロック図である。It is a block diagram which shows the outline of one Embodiment about the electric wheelchair as a moving body provided with the obstacle avoidance apparatus which concerns on this invention. 上記電動車椅子の斜視図である。It is a perspective view of the electric wheelchair. 上記電動車椅子の一部の概略を示す図である。It is a figure which shows the one part outline of the said electric wheelchair. 上記電動車椅子の一実施例の一部を示すブロック図である。It is a block diagram which shows a part of one Example of the said electric wheelchair. 上記電動車椅子の一実施例における他の一部を示すブロック図である。It is a block diagram which shows the other part in one Example of the said electric wheelchair. (a)は上記電動車椅子についてのシミュレーション結果の一例を示す図であり、(b)は上記シミュレーション結果の他の一例を示す図であり、(c)は上記シミュレーション結果のさらに他の一例を示す図である。(A) is a figure which shows an example of the simulation result about the said electric wheelchair, (b) is a figure which shows another example of the said simulation result, (c) shows another example of the said simulation result. FIG. (a)は上記電動車椅子についての他のシミュレーション結果の一例を示す図であり、(b)は上記シミュレーション結果の他の一例を示す図であり、(c)は上記シミュレーション結果のさらに他の一例を示す図である。(A) is a figure which shows an example of the other simulation result about the said electric wheelchair, (b) is a figure which shows another example of the said simulation result, (c) is another example of the said simulation result. FIG. (a)は上記電動車椅子についてのさらに他のシミュレーション結果の一例を示す図であり、(b)は上記シミュレーション結果の他の一例を示す図である。(A) is a figure which shows an example of the other simulation result about the said electric wheelchair, (b) is a figure which shows another example of the said simulation result. (a)は上記電動車椅子についてのさらに他のシミュレーション結果の一例を示す図であり、(b)は上記シミュレーション結果の他の一例を示す図である。(A) is a figure which shows an example of the other simulation result about the said electric wheelchair, (b) is a figure which shows another example of the said simulation result. (a)は上記電動車椅子についてのさらに他のシミュレーション結果の一例を示す図であり、(b)は上記シミュレーション結果の他の一例を示す図である。(A) is a figure which shows an example of the other simulation result about the said electric wheelchair, (b) is a figure which shows another example of the said simulation result. (a)は上記電動車椅子についてのさらに他のシミュレーション結果の一例を示す図であり、(b)は上記シミュレーション結果の他の一例を示す図である。(A) is a figure which shows an example of the other simulation result about the said electric wheelchair, (b) is a figure which shows another example of the said simulation result. 上記電動車椅子におけるセンサ装着状態の一例を示す斜視図である。It is a perspective view which shows an example of the sensor mounting state in the said electric wheelchair. 上記電動車椅子の変形例の動作を説明するための図である。It is a figure for demonstrating operation | movement of the modification of the said electric wheelchair. 上記電動車椅子の変形例の斜視図である。It is a perspective view of the modification of the said electric wheelchair. 上記移動体の一例としての軽車両の概略を示す斜視図である。It is a perspective view which shows the outline of the light vehicle as an example of the said mobile body. (a)は上記移動体の一例の遠隔操縦装置の概略を示す斜視図であり、(b)は上記移動体の一例を示す斜視図である。(A) is a perspective view which shows the outline of the remote control apparatus of an example of the said mobile body, (b) is a perspective view which shows an example of the said mobile body.

符号の説明Explanation of symbols

1、30、35 電動車椅子(移動体)
2、31、36、41、46 操作部
3 回避装置(障害物回避装置)
4、32 対物センサ(障害物センサ)
5 速度センサ
6 駆動装置
7 動力部
11 反発力発生器
12 学習部
15 反発力生成部
38、42、49 対障害物距離測定センサ(障害物センサ)
40、45 車両(移動体)
1, 30, 35 Electric wheelchair (moving body)
2, 31, 36, 41, 46 Operation unit 3 Avoidance device (obstacle avoidance device)
4, 32 Objective sensor (obstacle sensor)
DESCRIPTION OF SYMBOLS 5 Speed sensor 6 Drive apparatus 7 Power part 11 Repulsive force generator 12 Learning part 15 Repulsive force production | generation part 38, 42, 49 Anti-obstacle distance measurement sensor (obstacle sensor)
40, 45 Vehicle (moving body)

Claims (4)

指定された速度で移動しようとする移動体に対して、ユーザからの指示速度に応じた目標速度を修正して得られた速度を指定することによって、上記移動体の障害物との衝突を回避させる障害物回避装置であって、
選択された重み係数を乗算した上で上記目標速度に加減算することによって上記目標速度を修正するために用いる、上記障害物との衝突を回避するための反発力を、上記移動体の周囲の障害物を検出する障害物センサからの情報に応じて計算する反発力生成部を備えており、
さらに、上記移動体と障害物との距離、上記移動体と障害物との接近速度、及び、上記指示速度を参照して上記重み係数を選択するとともに、上記移動体の移動速度の方向と上記指示速度の方向との一致または不一致に応じた報酬に基づいて、上記重み係数を選択するための政策を決定する強化学習を行なう学習部を有していることを特徴とする障害物回避装置。
By specifying the speed obtained by correcting the target speed according to the instruction speed from the user for the moving body that is going to move at the specified speed, the collision of the moving body with the obstacle is avoided. An obstacle avoidance device,
It used to modify the target speed by subtracting to the target speed after having multiplied the selected weighting factor, the repulsive force for avoiding a collision between the obstacle, obstacle around the movable body It has a repulsive force generator that calculates according to information from obstacle sensors that detect objects,
Further, the weighting factor is selected with reference to the distance between the moving body and the obstacle, the approach speed between the moving body and the obstacle, and the indicated speed, and the direction of the moving speed of the moving body and the An obstacle avoidance device comprising: a learning unit that performs reinforcement learning for determining a policy for selecting the weighting factor based on a reward according to a match or mismatch with a direction of an instruction speed .
上記学習部が、上記移動体の移動速度の方向と上記指示速度の方向とが一致する場合に正の報酬とし、上記移動体の移動速度の方向と上記指示速度の方向とが不一致の場合には負の報酬とすることによって強化学習を行うことを特徴とする請求項1に記載の障害物回避装置。 The learning section, if the direction of the direction and the instruction speed of the moving speed of the moving object matches a positive reward, and the direction of the direction and the instruction speed of the moving speed of the moving body in the case of disagreement The obstacle avoidance apparatus according to claim 1, wherein reinforcement learning is performed by setting a negative reward. 上記指示速度を検出するための操作部がジョイスティック型の操作部であり、
上記学習部が、上記移動体が停止しているときに、上記ジョイスティックが中央位置に保持されている場合には正の報酬とし、
上記移動体の移動速度の方向と上記ジョイスティックの倒されている方向とが不一致の場合、または、上記移動体が停止しているときに上記ジョイスティックが倒されている場合には、負の報酬とすることを特徴とする請求項2に記載の障害物回避装置。
The operation unit for detecting the indicated speed is a joystick type operation unit,
The learning section, when the upper Symbol moving body is stopped, and a positive compensation when the joystick is held in a central position,
If the direction is tilted directional and the joystick of the moving speed of the moving object does not match, or, if the joystick is tilted when the upper Symbol moving body is stopped, the negative The obstacle avoidance device according to claim 2, wherein the obstacle avoidance device is a reward.
請求項1ないし3のいずれか1項に記載の障害物回避装置を備えていることを特徴とする移動体。   A moving body comprising the obstacle avoidance device according to any one of claims 1 to 3.
JP2004106347A 2004-03-31 2004-03-31 Obstacle avoidance device and moving body Expired - Lifetime JP4269055B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004106347A JP4269055B2 (en) 2004-03-31 2004-03-31 Obstacle avoidance device and moving body

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004106347A JP4269055B2 (en) 2004-03-31 2004-03-31 Obstacle avoidance device and moving body

Publications (2)

Publication Number Publication Date
JP2005293154A JP2005293154A (en) 2005-10-20
JP4269055B2 true JP4269055B2 (en) 2009-05-27

Family

ID=35326023

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004106347A Expired - Lifetime JP4269055B2 (en) 2004-03-31 2004-03-31 Obstacle avoidance device and moving body

Country Status (1)

Country Link
JP (1) JP4269055B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102452394A (en) * 2010-10-19 2012-05-16 松下电器产业株式会社 Electric vehicle and method for controlling the same

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4802692B2 (en) * 2005-12-09 2011-10-26 トヨタ自動車株式会社 Traveling body
JP2007175831A (en) * 2005-12-28 2007-07-12 Kawada Kogyo Kk Walking robot
JP2009012133A (en) * 2007-07-05 2009-01-22 Shin Meiwa Ind Co Ltd Safety apparatus and manipulator equipped with the same
JP4997604B2 (en) * 2008-05-15 2012-08-08 独立行政法人産業技術総合研究所 Personal mobile vehicle driving support device
JP5147542B2 (en) * 2008-05-23 2013-02-20 本田技研工業株式会社 Inverted pendulum moving body
JP5287051B2 (en) * 2008-09-04 2013-09-11 村田機械株式会社 Autonomous mobile device
EP2343617A4 (en) 2008-09-03 2013-11-20 Murata Machinery Ltd Route planning method, route planning unit, and autonomous mobile device
JP5316142B2 (en) * 2009-03-23 2013-10-16 トヨタ自動車株式会社 Inverted wheel type moving body
JP5186041B2 (en) * 2009-06-02 2013-04-17 パナソニック株式会社 Electric vehicle and control method
JP5510081B2 (en) * 2010-06-02 2014-06-04 日本精工株式会社 Obstacle avoidance support device, obstacle avoidance support method, and moving object
JP2014016655A (en) * 2010-09-28 2014-01-30 Nec Corp Information processing system, information processing method, and information processing program
KR101233714B1 (en) 2010-09-30 2013-02-18 아주대학교산학협력단 Autonomous mobile robot avoiding obstacle trap and controlling method for the same
JP5141931B2 (en) * 2011-04-20 2013-02-13 株式会社エクォス・リサーチ Traveling vehicle
EP2743121B1 (en) * 2011-08-08 2019-03-27 Panasonic Intellectual Property Management Co., Ltd. Electric vehicle and method for controlling the same
KR101516544B1 (en) * 2013-10-31 2015-05-04 삼성중공업 주식회사 Robot, feedback force generating device for controlling the same
CN105150210B (en) * 2015-05-13 2017-05-24 西北工业大学 Virtual pipeline dynamic obstacle avoidance control method for remote operation man-machine interaction
CN107224363A (en) * 2017-05-05 2017-10-03 深圳市元征科技股份有限公司 Wheelchair control method and device
JP6706223B2 (en) * 2017-05-25 2020-06-03 日本電信電話株式会社 MOBILE BODY CONTROL METHOD, MOBILE BODY CONTROL DEVICE, AND PROGRAM
JP6680730B2 (en) * 2017-08-08 2020-04-15 ファナック株式会社 Control device and learning device
CN114200928B (en) * 2018-05-15 2023-07-14 北京石头世纪科技股份有限公司 Intelligent mobile device, control method thereof and storage medium
JP7065069B2 (en) * 2019-12-25 2022-05-11 本田技研工業株式会社 Mobile control device
CN111571582B (en) * 2020-04-02 2023-02-28 上海钧控机器人有限公司 Moxibustion robot man-machine safety monitoring system and monitoring method
CN111949032A (en) * 2020-08-18 2020-11-17 中国科学技术大学 3D obstacle avoidance navigation system and method based on reinforcement learning
CN113021359B (en) * 2021-05-27 2021-10-29 深圳市越疆科技有限公司 Mechanical arm control method, device, equipment, system, storage medium and mechanical arm

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102452394A (en) * 2010-10-19 2012-05-16 松下电器产业株式会社 Electric vehicle and method for controlling the same
CN102452394B (en) * 2010-10-19 2015-04-15 松下电器产业株式会社 Electric vehicle and method for controlling the same

Also Published As

Publication number Publication date
JP2005293154A (en) 2005-10-20

Similar Documents

Publication Publication Date Title
JP4269055B2 (en) Obstacle avoidance device and moving body
JP6765568B2 (en) Control systems and methods for controlling vehicle motion
Klančar et al. Tracking-error model-based predictive control for mobile robots in real time
Fu et al. Motion tracking control design for a class of nonholonomic mobile robot systems
De La Cruz et al. Adaptive motion control law of a robotic wheelchair
Cuesta et al. Parking maneuvers of industrial-like electrical vehicles with and without trailer
Yoo et al. Adaptive formation tracking control of electrically driven multiple mobile robots
Binugroho et al. Control for balancing line follower robot using discrete cascaded PID algorithm on ADROIT V1 education robot
JP4280678B2 (en) Vehicle steering device
Hassan et al. Neural network-based adaptive controller for trajectory tracking of wheeled mobile robots
Katsura et al. Semiautonomous wheelchair based on quarry of environmental information
Vans et al. Vision based autonomous path tracking of a mobile robot using fuzzy logic
Ghani et al. Comparative assessment for two wheels inverted pendulum mobile robot using robust control
Terashima et al. Auto-tuning control of power assist system based on the estimation of operator's skill level for forward and backward driving of omni-directional wheelchair
Arab et al. Motion control of autonomous aggressive vehicle maneuvers
Alessandretti et al. A planar path-following model predictive controller for fixed-wing unmanned aerial vehicles
Harisha et al. Fuzzy logic reasoning to control mobile robot on pre-defined strip path
Allagui et al. Artificial fuzzy-PID gain scheduling algorithm design for motion control in differential drive mobile robotic platforms
Rivals et al. Real-time control of an autonomous vehicle: a neural network approach to the path following problem
JP2004049523A (en) Method and equipment for controlling running vehicle
JP2011212092A (en) Mobile robot and method of controlling the same
JP4280669B2 (en) Vehicle steering device
Urbano et al. Velocity control of an omni-directional wheelchair considering user's comfort by suppressing vibration
Vander Poorten et al. Backwards maneuvering powered wheelchairs with haptic guidance
Inagaki et al. Design of man-machine cooperative nonholonomic two-wheeled vehicle based on impedance control and time-state control

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061220

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20061220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080624

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080822

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090127

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150