JP2020054408A - 制御内容決定装置及び制御内容決定方法 - Google Patents

制御内容決定装置及び制御内容決定方法 Download PDF

Info

Publication number
JP2020054408A
JP2020054408A JP2017014847A JP2017014847A JP2020054408A JP 2020054408 A JP2020054408 A JP 2020054408A JP 2017014847 A JP2017014847 A JP 2017014847A JP 2017014847 A JP2017014847 A JP 2017014847A JP 2020054408 A JP2020054408 A JP 2020054408A
Authority
JP
Japan
Prior art keywords
control content
unit
operation support
content determination
support device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017014847A
Other languages
English (en)
Inventor
伸裕 見市
Nobuhiro Miichi
伸裕 見市
智彦 藤田
Tomohiko Fujita
智彦 藤田
真梨奈 大野
Marina ONO
真梨奈 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2017014847A priority Critical patent/JP2020054408A/ja
Priority to PCT/JP2018/001123 priority patent/WO2018139292A1/ja
Publication of JP2020054408A publication Critical patent/JP2020054408A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61HPHYSICAL THERAPY APPARATUS, e.g. DEVICES FOR LOCATING OR STIMULATING REFLEX POINTS IN THE BODY; ARTIFICIAL RESPIRATION; MASSAGE; BATHING DEVICES FOR SPECIAL THERAPEUTIC OR HYGIENIC PURPOSES OR SPECIFIC PARTS OF THE BODY
    • A61H3/00Appliances for aiding patients or disabled persons to walk about
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N99/00Subject matter not provided for in other groups of this subclass

Abstract

【課題】個々のユーザに適応する動作支援のための動作支援装置の制御内容を決定することができる制御内容決定装置を提供する。【解決手段】制御内容決定装置200は、ユーザの動作を機械的に支援する動作支援装置100の動作状態を示す動作状態情報を取得する第1取得部210と、(i)制御内容決定ルールに従って、動作支援装置100の制御内容を動作状態情報から決定する、又は(ii)ランダムに動作支援装置100の制御内容を決定する決定部220と、決定された制御内容を出力する出力部230と、動作支援装置100による動作支援の快適さを示す快適性情報を取得する第2取得部240と、動作状態情報及び快適性情報に基づいて、制御内容決定ルールを更新する更新部250と、を備え、決定部220は、確率εで(ii)の決定を選択する。【選択図】図1

Description

本発明は、ユーザの動作を機械的に支援する動作支援装置の制御内容を決定する制御内容決定装置及び制御内容決定方法に関する。
従来、自力で歩行することが困難な被介護者の起立動作を支援する動作支援システムが提案されている(例えば、特許文献1を参照)。
特開2016−64124号公報
しかしながら、従来技術では、予め定められた制御パターンに基づいて動作支援装置が制御されるため、あるユーザに対しては快適な動作支援ができたとしても、別のユーザには不快な動作支援しかできない場合がある。つまり、従来技術では、個々のユーザに適応した動作支援を実現することが難しい。
そこで、本発明は、個々のユーザに適応する動作支援のための動作支援装置の制御内容を決定することができる制御内容決定装置及び制御内容決定方法を提供する。
本発明の一態様に係る制御内容決定装置は、ユーザの動作を機械的に支援する動作支援装置の動作状態を示す動作状態情報を取得する第1取得部と、(i)制御内容決定ルールに従って、前記動作支援装置の制御内容を前記動作状態情報から決定する、又は(ii)ランダムに前記動作支援装置の制御内容を決定する決定部と、決定された前記制御内容を出力する出力部と、前記動作支援装置による動作支援の快適さを示す快適性情報を取得する第2取得部と、前記動作状態情報及び前記快適性情報に基づいて、前記制御内容決定ルールを更新する更新部と、を備え、前記決定部は、確率εで前記(ii)の決定を選択する。
本発明の一態様に係る制御内容決定方法は、ユーザの動作を機械的に支援する動作支援装置の動作状態を示す動作状態情報を取得する第1取得ステップと、(i)制御内容決定ルールに従って、前記動作支援装置の制御内容を前記動作状態情報から決定する、又は(ii)ランダムに前記動作支援装置の制御内容を決定する決定ステップと、決定された前記制御内容を出力する出力ステップと、前記動作支援装置による動作支援の快適さを示す快適性情報を取得する第2取得ステップと、前記動作状態情報及び前記快適性情報に基づいて、前記制御内容決定ルールを更新する更新ステップと、を含み、前記決定ステップでは、確率εで前記(ii)の決定を選択する。
なお、これらの包括的又は具体的な態様は、システム、集積回路、コンピュータプログラム又はコンピュータ読み取り可能なCD−ROMなどの記録媒体で実現されてもよく、システム、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。
本発明の一態様に係る制御内容決定装置は、個々のユーザに適応する動作支援のための動作支援装置の制御内容を決定することができる。
図1は、実施の形態1に係る動作支援システムの構成を示すブロック図である。 図2は、実施の形態1に係る動作支援装置の本体部の斜視図である。 図3Aは、実施の形態1に係る動作支援装置の本体部の動作を説明するための図である。 図3Bは、実施の形態1に係る動作支援装置の本体部の動作を説明するための図である。 図3Cは、実施の形態1に係る動作支援装置の本体部の動作を説明するための図である。 図4は、実施の形態1に係る動作支援装置におけるニューラルネットワークの一例を示す概念図である。 図5は、実施の形態1における制御内容の一例を示す図である。 図6は、実施の形態1に係る制御内容決定装置の処理を示すフローチャートである。 図7は、実施の形態1に係る快適性情報の入力のためのグラフィカルユーザーインターフェースの一例を示す図である。 図8は、実施の形態2に係る制御内容決定装置の機能構成を示すブロック図である。 図9は、実施の形態2に係る制御内容決定装置の処理を示すフローチャートである。
以下、実施の形態について、図面を参照しながら具体的に説明する。
なお、以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、請求の範囲を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
また、各図は、模式図であり、必ずしも厳密に図示されたものではない。また、各図において、同一又は類似の構成部及び処理ステップについては同じ符号を付している。
(実施の形態1)
[動作支援システムの構成]
まず、動作支援システムの全体構成について説明する。図1は、実施の形態1に係る動作支援システム10の構成を示すブロック図である。本実施の形態に係る動作支援システム10は、動作支援装置100と、制御内容決定装置200と、入力装置300と、を備える。以下に、各装置の構成について図面を参照しながら具体的に説明する。
[動作支援装置の構成]
動作支援装置100は、ユーザの動作を機械的に支援する。つまり、動作支援装置100は、ユーザを物理的に補助することによりユーザの動作を支援する。図1に示すように、動作支援装置100は、本体部110と、センサ120と、制御部130と、駆動部140と、を備える。
本体部110は、ユーザの動作にあわせてユーザに力を付加することで、ユーザの動作を機械的に支援する。例えば、本体部110は、ユーザの起立動作あるいは歩行動作などにあわせて動く複数の機械部品を含む。この本体部110の具体例については、図2〜図3Cを用いて後述する。
センサ120は、動作支援装置100の動作状態を検知し、検知結果を動作状態情報として出力する。動作状態は、本体部110に含まれる機械部品の位置、角度、軌道もしくは移動速度、又は、機械部品がユーザから受けている力もしくは圧力などを含む。また、動作状態は、駆動部140の状態を含んでもよい。具体的には、動作状態は、駆動部140の出力(動力の大きさ)などを含んでもよい。
具体的には、センサ120は、例えばロータリエンコーダである。この場合、センサ120は、駆動部140の回転数(回転角度)を検出する。
制御部130は、制御内容決定装置200によって決定された制御内容に基づいて駆動部140を制御する。例えば、駆動部140が電動モータである場合に、制御部130は、制御内容に基づいて電動モータの回転速度に対応するパルス信号を駆動部140に送信する。
駆動部140は、本体部110を駆動する。例えば、駆動部140は、電動モータ、プーリー、ベルトなどを含む。駆動部140によって本体部110が駆動されることにより、ユーザの動作が機械的に支援される。
[動作支援装置の本体部の具体例]
次に、動作支援装置100の本体部110の具体例について図2を参照しながら説明する。図2は、実施の形態1に係る動作支援装置100の本体部110の斜視図である。各図において、X軸方向は、動作支援装置100の進行方向と逆向きを表す。また、Z軸方向は、鉛直方向の上向きであり、X軸と直交する方向を表す。また、Y軸方向は、X軸及びZ軸の各々と直交する方向を表す。
動作支援装置100の本体部110は、座面に着座しているユーザが起立してから歩行するまでの動作を支援するために、図2に示すように、保持部111と、アーム部112と、基部113と、を備える。
保持部111は、ユーザに装着されることでユーザの上半身を保持する。保持部111は、アーム部112の一端に着脱可能に接続される。
アーム部112は、2自由度のロボットアームである。アーム部112は、第1関節112aと、第1アーム112bと、第2関節112cと、第2アーム112dと、接続部112eと、を備える。
第1アーム112bの一端は、第1関節112aを介して回動可能に基部113に連結され、第1アーム112bの他端は、第2関節112cを介して回動可能に第2アーム112dに連結される。第1アーム112bは、駆動部140によって駆動され、第1関節112aを中心に回動する。
第2アーム112dの一端は第2関節112cを介して回動可能に第1アーム112bに連結され、第2アーム112dの他端は、接続部112eに連結される。第2アーム112dは、駆動部140によって第1アーム112bとは独立して駆動され、第2関節112cを中心に回動する。
基部113は、アーム部112を支持する。ここでは、基部113は、床面を移動するための車輪を有し、駆動部140によって車輪の回転が制御されることにより床面をX軸の負の向きに移動する。この基部113の移動によってユーザの歩行動作を支援することができる。また、基部113には、アーム部112が接続される。
ここで、ユーザの起立動作を支援する際の本体部110の動作について図3A〜図3Cを参照しながら説明する。また、図3A〜図3Cは、実施の形態1に係る動作支援装置100の本体部110の動作を説明するための図である。
図3Aにおいて、ユーザは、保持部111によって保持された状態で座面(例えば、ベッド、椅子、又は、トイレの便座など)に座っている。ここで、ユーザから起立動作の支援開始の指示入力を受けると、駆動部140は、図3Bに示すように、アーム部112を駆動して座位姿勢から前傾姿勢までの動作を支援する。さらに、駆動部140は、図3Cに示すように、アーム部112を駆動して前傾姿勢から起立姿勢までの動作を支援する。
[制御内容決定装置の構成]
次に、制御内容決定装置200について、図1を参照しながら具体的に説明する。制御内容決定装置200は、動作支援装置100のための制御内容を決定し、その制御内容を動作支援装置100に出力する。図1に示すように、制御内容決定装置200は、第1取得部210と、決定部220と、出力部230と、第2取得部240と、更新部250と、を備える。
制御内容決定装置200は、例えば、プロセッサ及びメモリにより実現される。例えば、メモリに格納されたソフトウェアプログラムをプロセッサが実行したときに、プロセッサが、第1取得部210、決定部220、出力部230、第2取得部240、及び更新部250として機能する。また、制御内容決定装置200は、第1取得部210、決定部220、出力部230、第2取得部240、及び更新部250に対応する専用の1以上の電子回路として実現されてもよい。
第1取得部210は、動作支援装置100のセンサ120から動作状態情報を取得する。例えば、第1取得部210は、センサ120の出力信号を処理することにより、接続部112eの基部113に対する相対的な位置情報を動作状態情報として取得する。
決定部220は、(i)制御内容決定ルールに従って、動作状態情報から動作支援装置100の制御内容を決定する、又は、(ii)ランダムに動作支援装置100の制御内容を決定する。つまり、決定部220は、(i)の決定及び(ii)の決定を含む複数の決定の中から1つの決定を選択的に実行する。このとき、決定部220は、確率εで(ii)の決定を選択する。εは、0より大きく1より小さい予め定められた値である。例えば、決定部220は、1−εの確率で(i)の決定を選択し、εの確率で(ii)の決定を選択する。
制御内容決定ルールは、例えば、動作状態情報から複数の制御内容の各々の価値を推定するためのニューラルネットワークで表される。制御内容決定ルールは、図示しない記憶部に記憶されている。ニューラルネットワークについては図4を用いて後述する。
出力部230は、決定部220によって決定された制御内容を出力する。ここでは、出力部230は、動作支援装置100に制御内容を出力する。
第2取得部240は、動作支援装置100の動作支援によるユーザの快適さを示す快適性情報を取得する。この快適性情報は、入力装置300を介してユーザから入力された情報を含む。例えば、第2取得部240は、ユーザによって入力された動作支援の快適性を示す値を入力装置300から取得する。
また例えば、第2取得部240は、入力装置300から音声信号を受信し、音声認識により所定のキーワードの発言を検出することにより快適性情報を取得してもよい。所定のキーワードは、ユーザの快適性を示す予め定められたキーワードである。例えば、所定のキーワードは、「痛い」あるいは「遅い」などである。
更新部250は、第1取得部210によって取得された動作状態情報と、第2取得部240によって取得された快適性情報とに基づいて、決定部220で用いられる制御内容決定ルールを更新する。具体的には、更新部250は、快適性情報に基づく値を報酬として用いて複数の制御内容の価値を更新する。そして、更新部250は、更新された価値に基づいてニューラルネットワークのパラメータ(例えば重みw)を更新する。つまり、更新部250は、複数の制御内容の価値に基づいた強化学習により、ユーザに適応した制御内容の決定を学習する。
[ニューラルネットワークの説明]
ここで、本実施の形態におけるニューラルネットワークについて図4を参照しながら説明する。図4は、実施の形態1に係る制御内容決定装置200におけるニューラルネットワークの一例を示す概念図である。このニューラルネットワークは、多階層の人工ニューラルネットワークであり、動作状態情報に基づく環境sにおける複数の制御内容ai(i=1〜n)の価値Qaiを推定するための数学モデルである。
[制御内容の具体例]
図5は、実施の形態1における制御内容の一例を示す図である。
制御内容は、接続部112eの位置の時間変化を示す情報である。例えば、制御内容は、XZ平面上の接続部112eの移動軌跡を示す。具体的には、制御内容は、各時間ti(i=0〜m)における、基部113に対する接続部112eの相対的な位置を示す。このような制御内容を含む複数の制御内容a1〜anの各々の環境s(動作状態)における価値がニューラルネットワークによって推定される。
入力装置300は、ユーザから動作支援の快適さを示す快適性情報の入力を受ける。例えば、入力装置300は、動作支援装置100に設けられ、タッチディスプレイ、機械式プッシュボタンなどを介して快適性情報の入力を受ける。また例えば、入力装置300は、マイクロフォンであってもよい。この場合、入力装置300は、ユーザから音声入力を受ける。
[制御内容決定装置の動作]
次に、以上のように構成された制御内容決定装置200の動作について図6及び図7を参照しながら説明する。
図6は、実施の形態1に係る制御内容決定装置200の処理を示すフローチャートである。この処理は、例えば、ユーザからの指示に基づいて実行されればよい。
まず、第1取得部210は、動作状態情報を取得する(S110)。決定部220は、ニューラルネットワークに基づいて、動作状態情報から各制御内容の価値を推定する(S120)。
続いて、決定部220は、確率εを用いて分岐処理を行う(S130)。ここでは、決定部220は、1−εの確率で(i)の決定を選択し、εの確率で(ii)の決定を選択する。
ここで、(ii)の決定が選択された場合(S130のε)、決定部220は、ランダムに制御内容を決定する(S140)。つまり、決定部220は、複数の制御内容の中からランダムに制御内容を選択する。言い換えると、決定部220は、ニューラルネットワークに基づいて推定される価値に依存せずに制御内容を決定する。
一方、(i)の決定が選択された場合(S130の1−ε)、決定部220は、推定された価値に基づいて制御内容を決定する(S150)。例えば、決定部220は、複数の制御内容の中から最も高い価値を有する制御内容を選択する。
出力部230は、ステップS140又はステップS150で決定された制御内容を出力する(S160)。これにより、決定された制御内容に基づいて動作支援装置100が制御される。
その後、第2取得部240は、快適性情報を取得する(S170)。例えば、入力装置300がディスプレイを有する場合、第2取得部240は、図7に示すようなグラフィカルユーザーインターフェース(GUI)を介して、屋内におけるユーザの快適性を示す値を取得する。なお、図7のGUIでは、スライダーを用いて快適性の値が入力されるが、これに限定される必要はない。GUIは、数値が直接入力されるテキストボックスを含んでもよいし、数値増加/減少ボタンを含んでもよいし、これらの組合せを含んでもよい。
続いて、更新部250は、動作状態情報及び快適性情報に基づいて、複数の制御内容の価値を更新する(S180)。このとき、快適性情報に基づく値が強化学習における報酬として用いられる。快適性情報に基づく値とは、快適性を示す値であり、例えば、快適性が高いほど増加する値である。
さらに、更新部250は、更新された価値に基づいてニューラルネットワークのパラメータを更新する(S190)。つまり、更新部250は、更新された各制御内容の価値を教師信号として入力することにより、複数階層のニューラルネットワークのパラメータを学習する。
このようなステップS180及びステップS190の処理が内部的に繰り返されることにより、いわゆる深層強化学習が行われる。なお、深層強化学習については、特に限定される必要はなく、従来技術が用いられてもよい。したがって、深層強化学習の詳細な説明については省略する。
なお、快適性情報の取得は、制御内容の決定のたびに行われなくてもよい。つまり、ステップS170はスキップされてもよい。この場合、更新部250は、予め定められた値(例えば0)を報酬として用いて各制御内容の価値を学習してもよい。
[効果]
以上のように、本実施の形態に係る制御内容決定装置200は、動作支援装置100の動作状態を示す動作状態情報を取得する第1取得部210と、(i)制御内容決定ルールに従って、動作支援装置100の制御内容を動作状態情報から決定する、又は(ii)ランダムに動作支援装置100の制御内容を決定する決定部220と、決定された制御内容を出力する出力部230と、動作支援装置100による動作支援の快適さを示す快適性情報を取得する第2取得部240と、動作状態情報及び快適性情報に基づいて、制御内容決定ルールを更新する更新部250と、を備え、決定部220は、確率εで(ii)の決定を選択する。
この構成により、更新部250は、快適性情報に基づいて制御内容決定ルールを更新することができる。したがって、制御内容決定装置200は、ユーザの快適性の向上に適した制御内容決定ルールを学習することができ、個々のユーザに適応した動作支援を実現することができる。さらに、決定部220は、確率εでランダムな決定を選択するので、現在の制御内容決定ルールに縛られることなく、最適な制御内容を探査することができる。つまり、制御内容決定装置200は、探査と学習結果の利用とのバランスを図ることができ、制御内容決定ルールを効果的に更新することができる。
また、本実施の形態に係る制御内容決定装置200において、制御内容決定ルールは、動作状態情報から複数の制御内容の各々の価値を推定するためのニューラルネットワークで表され、更新部250は、快適性情報に基づく値を報酬として用いて複数の制御内容の価値を更新し、更新された価値に基づいてニューラルネットワークのパラメータを更新する。
この構成により、いわゆる深層強化学習を制御内容決定装置200に適用することができ、制御内容決定装置200は、よりユーザに適した制御内容決定ルールを構築することができる。その結果、制御内容決定装置200は、個々のユーザに適した動作支援を実現することができる。
また、本実施の形態に係る制御内容決定装置200において、第2取得部240は、音声認識により所定のキーワードの発言を検出することにより快適性情報を取得してもよい。
この構成により、制御内容決定装置200は、ユーザの快適性情報の入力の負荷を軽減することができ、ユーザの利便性を向上させることができる。
(実施の形態2)
次に、実施の形態2について説明する。実施の形態2では、動作支援が行われたときのユーザの安全性を示す安全度に基づいて複数の制御内容の中から1以上の制御内容を抽出し、抽出された1以上の制御内容の中からランダムに制御内容が決定される点が上記実施の形態1と主として異なる。以下に、実施の形態1と異なる点を中心に実施の形態2について説明する。
[制御内容決定装置の構成]
実施の形態2に係る制御内容決定装置の詳細な構成について説明する。図8は、実施の形態2に係る制御内容決定装置200Aの機能構成を示すブロック図である。図8に示すように、制御内容決定装置200Aは、第1取得部210と、決定部220Aと、出力部230と、第2取得部240と、更新部250Aと、検知部260Aと、を備える。
決定部220Aは、(i)制御内容決定ルールに従って、動作支援装置100の制御内容を動作状態情報から決定する、又は(ii)ランダムに制御内容を決定する。ここで、(ii)の場合に、決定部220Aは、安全度情報を参照して、安全度が所定の条件を満たす1以上の制御内容の中からランダムに制御内容を決定する。
安全度情報とは、複数の制御内容の各々に対して安全度が対応付けられた情報である。安全度は、動作支援が行われたときのユーザの安全性を示す値である。例えば、安全度情報は、複数の制御内容の各々に対して安全さを表す値が対応付けられたテーブルである。安全度情報は、図示しない記憶部に記憶されている。
所定の条件は、安全性が高い制御内容を決定するための条件である。例えば、所定の条件は、安全度の値が予め定められた閾値より大きいことである。
例えば、決定部220Aは、安全度情報を参照して、複数の制御内容の中から、閾値より大きい安全度の値を有する1以上の制御内容を抽出する。そして、決定部220Aは、抽出された1以上の制御内容からランダムに制御内容を決定する。
検知部260Aは、ユーザが安全かどうかを検知する。つまり、検知部260Aは、ランダムに制御内容が決定された場合に、その決定された制御内容に基づく動作支援が安全か否かを決定する。例えば、ユーザが転倒した場合に、検知部260Aは、ユーザが安全でない(つまり危険)と検知する。
更新部250Aは、実施の形態1と同様に、動作状態情報と快適性情報とに基づいて、制御内容決定ルールを更新する。本実施の形態に係る更新部250Aは、さらに、ランダムに制御内容が決定された場合に、検知部260Aによる検知結果に基づいて、安全度情報を更新する。例えば、ユーザが安全でないと検知された場合に、更新部250Aは、決定された制御内容の安全度の値を減少させる。逆に、例えばユーザが安全であると検知された場合に、更新部250Aは、決定された制御内容の安全度の値を増加させる。
[制御内容決定装置の動作]
次に、以上のように構成された制御内容決定装置200Aの動作について図9を参照しながら説明する。図9は、実施の形態2に係る制御内容決定装置200Aの処理を示すフローチャートである。
ステップS130において(ii)の決定が選択された場合(S130のε)、決定部220Aは、安全度情報に基づいて、複数の制御内容の中から1以上の制御内容を抽出する(S132A)。例えば、決定部220Aは、安全度情報を参照して、複数の制御内容a1〜anの中から、予め定められた閾値(例えば50)より大きい安全度の値を有する制御内容を抽出する。
そして、決定部220Aは、抽出された制御内容の中からランダムに制御内容を決定する(S140A)。
その後、ステップS160〜S190が実行され、ランダムに制御内容が決定されていない場合は(S192AのNo)、そのまま処理を終了する。一方、ランダムに制御内容が決定されていた場合は(S192AのYes)、検知部260Aは、動作支援が安全であったかどうかを検知する(S194A)。更新部250Aは、検知部260Aによる検知結果に基づいて安全度情報を更新する(S196A)。
[効果]
以上のように、本実施の形態に係る制御内容決定装置200Aにおいて、決定部220Aは、ランダムに制御内容が決定される場合に、複数の制御内容の各々について当該制御内容に基づいて動作支援が行われたときのユーザの安全性を示す安全度が対応付けられた安全度情報を参照して、安全度が所定の条件を満たす1以上の制御内容の中からランダムに制御内容を決定する。
この構成により、決定部220Aは、ランダムに制御内容を決定したときに、ユーザに危険が生じる可能性を低減させることができる。つまり、決定部220Aは、ランダムな決定において、ユーザに危険が生じる制御内容が決定されることを抑制することができる。
また、本実施の形態に係る制御内容決定装置200Aは、さらに、動作支援が危険であったかどうかを検知する検知部260Aを備え、更新部250Aは、ランダムに制御内容が決定された場合に、さらに、検知部260Aによる検知結果に基づいて安全度情報を更新する。
この構成により、更新部250Aは、動作支援によってユーザに危険が生じたかどうかの検知結果に基づいて危険度情報を更新することができ、危険度情報の改良を図ることができる。したがって、決定部220Aは、ランダムな決定において、ユーザに危険を生じさせる制御内容が決定されることを抑制することができる。
(他の実施の形態)
以上、本発明の1つまたは複数の態様に係る制御内容決定装置について、実施の形態に基づいて説明したが、本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の1つまたは複数の態様の範囲内に含まれてもよい。
なお、上記各実施の形態では、第2取得部240は、入力装置300から受信した情報に基づいて快適性情報を取得していたが、入力装置300だけではなくセンサ120から受信した情報にも基づいて、快適性情報を取得してもよい。例えば、第2取得部240は、センサ120から受信した情報を用いて、入力装置300から受信した情報を修正することにより快適性情報を取得してもよい。具体的には、第2取得部240は、ユーザの表情、脳波又は心拍数に基づいて、入力装置300から受信した情報を修正してもよい。この場合、センサ120は、画像センサ、脳波センサ、又は、心拍センサを含めばよい。
なお、上記各実施の形態では、深層強化学習を利用して、ユーザに適応した制御内容の決定を学習していたが、深層強化学習に限定されなくてもよい。例えば、制御内容決定ルールは、多階層のニューラルネットワークではなく、単階層のニューラルネットワークで表されてもよい。また、制御内容決定ルールは、ニューラルネットワークではなく、他の数学モデル(例えば、線形回帰、サポートベクタマシンなど)で表されてもよい。
なお、上記各実施の形態では、主として2つの決定((i)制御内容決定ルールに従って、動作状態情報から動作支援装置100の制御内容を決定する、又は、(ii)ランダムに動作支援装置100の制御内容を決定する)について説明したが、必ずしも2つの決定に限定される必要はない。例えば、3以上の決定の中から1つの決定が選択されてもよい。つまり、決定部は、(i)の決定及び(ii)の決定を含む複数の決定のうちのいずれかを選択的に実行すればよく、このとき、(ii)の決定が確率εで選択されればよい。
なお、上記各実施の形態では、制御内容決定装置は、単一の装置で実現されていたが、互いに接続された複数の装置で実現されてもよい。例えば、制御内容決定装置は、クラウドコンピューティングによって実現されてもよい。
なお、上記実施の形態2では、安全度情報が更新されていたが、必ずしも安全度情報は更新されなくてもよい。この場合、制御内容決定装置200Aは検知部260Aを備えなくてもよい。
また、上記各実施の形態における制御内容決定装置が備える構成要素の一部又は全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。例えば、制御内容決定装置200は、第1取得部210と、決定部220と、出力部230と、第2取得部240と、更新部250とを有するシステムLSIから構成されてもよい。
システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM(Read Only Memory)、RAM(Random Access Memory)などを含んで構成されるコンピュータシステムである。前記ROMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムに従って動作することにより、システムLSIは、その機能を達成する。
なお、ここでは、システムLSIとしたが、集積度の違いにより、IC、LSI、スーパーLSI、ウルトラLSIと呼称されることもある。また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)、あるいはLSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
また、本発明の一態様は、このような制御内容決定装置だけではなく、制御内容決定装置に含まれる特徴的な構成部をステップとする制御内容決定方法であってもよい。また、本発明の一態様は、制御内容決定方法に含まれる特徴的な各ステップをコンピュータに実行させるコンピュータプログラムであってもよい。また、本発明の一態様は、そのようなコンピュータプログラムが記録された、コンピュータ読み取り可能な非一時的な記録媒体であってもよい。
なお、上記各実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。ここで、上記各実施の形態の制御内容決定装置などを実現するソフトウェアは、次のようなプログラムである。
すなわち、このプログラムは、コンピュータに、ユーザの動作を機械的に支援する動作支援装置の動作状態を示す動作状態情報を取得する第1取得ステップと、(i)制御内容決定ルールに従って、前記動作支援装置の制御内容を前記動作状態情報から決定する、又は(ii)ランダムに前記動作支援装置の制御内容を決定する決定ステップと、決定された前記制御内容を出力する出力ステップと、前記動作支援装置による動作支援の快適さを示す快適性情報を取得する第2取得ステップと、前記動作状態情報及び前記快適性情報に基づいて、前記制御内容決定ルールを更新する更新ステップと、を含む制御内容決定方法を実行させ、前記決定ステップでは、確率εで前記(ii)の決定を選択する。
100 動作支援装置
200、200A 制御内容決定装置
210 第1取得部
220、220A 決定部
230 出力部
240 第2取得部
250、250A 更新部
260A 検知部

Claims (7)

  1. ユーザの動作を機械的に支援する動作支援装置の動作状態を示す動作状態情報を取得する第1取得部と、
    (i)制御内容決定ルールに従って、前記動作支援装置の制御内容を前記動作状態情報から決定する、又は(ii)ランダムに前記動作支援装置の制御内容を決定する決定部と、
    決定された前記制御内容を出力する出力部と、
    前記動作支援装置による動作支援の快適さを示す快適性情報を取得する第2取得部と、
    前記動作状態情報及び前記快適性情報に基づいて、前記制御内容決定ルールを更新する更新部と、を備え、
    前記決定部は、確率εで前記(ii)の決定を選択する、
    制御内容決定装置。
  2. 前記制御内容決定ルールは、動作情報から複数の制御内容の各々の価値を推定するためのニューラルネットワークで表され、
    前記更新部は、前記動作情報に基づく値を報酬として用いて前記複数の制御内容の価値を更新し、更新された前記価値に基づいて前記ニューラルネットワークのパラメータを更新する、
    請求項1に記載の制御内容決定装置。
  3. 前記第2取得部は、音声認識により所定のキーワードの発言を検出することにより前記快適性情報を取得する、
    請求項1又は2に記載の制御内容決定装置。
  4. 前記決定部は、前記(ii)の決定において、複数の制御内容の各々について当該制御内容に基づいて動作支援が行われたときのユーザの安全性を示す安全度が対応付けられた安全度情報を参照して、前記安全度が所定の条件を満たす1以上の制御内容の中からランダムに前記制御内容を決定する、
    請求項1〜3のいずれか1項に記載の制御内容決定装置。
  5. 前記制御内容決定装置は、さらに、動作支援が安全であったかどうかを検知する検知部を備え、
    前記更新部は、前記(ii)の決定が選択された場合に、さらに、前記検知部による検知結果に基づいて前記安全度情報を更新する、
    請求項4に記載の制御内容決定装置。
  6. ユーザの動作を機械的に支援する動作支援装置の動作状態を示す動作状態情報を取得する第1取得ステップと、
    (i)制御内容決定ルールに従って、前記動作支援装置の制御内容を前記動作状態情報から決定する、又は(ii)ランダムに前記動作支援装置の制御内容を決定する決定ステップと、
    決定された前記制御内容を出力する出力ステップと、
    前記動作支援装置による動作支援の快適さを示す快適性情報を取得する第2取得ステップと、
    前記動作状態情報及び前記快適性情報に基づいて、前記制御内容決定ルールを更新する更新ステップと、を含み、
    前記決定ステップでは、確率εで前記(ii)の決定を選択する、
    制御内容決定方法。
  7. 請求項6に記載の制御内容決定方法をコンピュータに実行させるためのプログラム。
JP2017014847A 2017-01-30 2017-01-30 制御内容決定装置及び制御内容決定方法 Pending JP2020054408A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017014847A JP2020054408A (ja) 2017-01-30 2017-01-30 制御内容決定装置及び制御内容決定方法
PCT/JP2018/001123 WO2018139292A1 (ja) 2017-01-30 2018-01-17 制御内容決定装置及び制御内容決定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017014847A JP2020054408A (ja) 2017-01-30 2017-01-30 制御内容決定装置及び制御内容決定方法

Publications (1)

Publication Number Publication Date
JP2020054408A true JP2020054408A (ja) 2020-04-09

Family

ID=62978884

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017014847A Pending JP2020054408A (ja) 2017-01-30 2017-01-30 制御内容決定装置及び制御内容決定方法

Country Status (2)

Country Link
JP (1) JP2020054408A (ja)
WO (1) WO2018139292A1 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002013271A (ja) * 2000-04-25 2002-01-18 Matsushita Electric Works Ltd 手摺位置提案システム及び手摺位置提案方法並びに手摺位置提案プログラムを記録した記録媒体
DE102008007700A1 (de) * 2007-10-31 2009-05-07 Siemens Aktiengesellschaft Verfahren zur rechnergestützten Exploration von Zuständen eines technischen Systems
JP4803212B2 (ja) * 2008-05-28 2011-10-26 ソニー株式会社 データ処理装置、データ処理方法、及びプログラム
EP2624786B1 (en) * 2010-10-06 2019-12-04 Ekso Bionics Human machine interfaces for lower extremity orthotics
JP5981158B2 (ja) * 2012-02-10 2016-08-31 富士機械製造株式会社 立ち座り動作支援ロボットおよび動作設定方法
DE102013205356B4 (de) * 2013-03-26 2016-07-07 Siemens Aktiengesellschaft Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems

Also Published As

Publication number Publication date
WO2018139292A1 (ja) 2018-08-02

Similar Documents

Publication Publication Date Title
JP6194971B2 (ja) ユーザの健康記録に基づいてパーソナライズされた看護の提供
EP3576707B1 (en) System and method for user intent recognition
JP6436548B2 (ja) 自律行動型ロボット
CN110024000B (zh) 使瞳部变化的行为自主型机器人
JP6065077B2 (ja) ロボットによる物体手渡しシステム
US20210022945A1 (en) Method and apparatus for recognizing user motion
US20190282431A1 (en) Systems and methods for providing synchronized movements of a powered wheelchair and an exoskeleton
US20210259374A1 (en) Walking assistance method and apparatuses
JP2012524579A (ja) 人の姿勢を決定するシステムおよび方法
JPWO2010050113A1 (ja) 移動体制御装置及び移動体制御方法
JP2008192004A (ja) 入力情報処理装置、入力情報処理方法、入力情報処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP6890286B2 (ja) 起立動作支援装置、起立動作支援方法およびプログラム
JP6322984B2 (ja) 姿勢推定装置、方法及びプログラム
US20170216119A1 (en) Robot, robot control method, method, and recording medium
JP2018038785A (ja) 起立動作支援装置、起立動作支援方法およびプログラム
CN107174441A (zh) 生活辅助系统、行走辅助机器人以及生活辅助方法
JP6599821B2 (ja) 自動教師データ作成装置、自動教師データ作成方法および自動教師データ作成プログラム
JP2020054408A (ja) 制御内容決定装置及び制御内容決定方法
JP2018134724A (ja) 動作推定装置及び動作補助装置
Nordin et al. Simple torso model for upper limb compensatory assessment after stroke
JP7454826B2 (ja) マッサージデータ更新装置及びマッサージ機
KR20210022839A (ko) 생체 데이터 측정 방법 및 장치
JP7349038B1 (ja) 介護ロボット用制御装置及び介護ロボットシステム
JP2018136869A (ja) 健康管理支援装置及び健康管理支援方法
Manurung et al. Fuzzy clustering of temporal parameters of gait during stance phase for walking speed estimation