JP2017121017A - 機器制御システム及び機器制御方法 - Google Patents

機器制御システム及び機器制御方法 Download PDF

Info

Publication number
JP2017121017A
JP2017121017A JP2015257306A JP2015257306A JP2017121017A JP 2017121017 A JP2017121017 A JP 2017121017A JP 2015257306 A JP2015257306 A JP 2015257306A JP 2015257306 A JP2015257306 A JP 2015257306A JP 2017121017 A JP2017121017 A JP 2017121017A
Authority
JP
Japan
Prior art keywords
user
behavior prediction
node
time
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015257306A
Other languages
English (en)
Inventor
由章 赤澤
Yoshiaki Akazawa
由章 赤澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Priority to JP2015257306A priority Critical patent/JP2017121017A/ja
Publication of JP2017121017A publication Critical patent/JP2017121017A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Selective Calling Equipment (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】計算量を抑えながらユーザの行動を予測して、予測に応じて機器を制御する。【解決手段】機器制御システムは、ユーザの位置を計測する位置計測部と、計測された前記ユーザの位置の履歴を格納する位置情報記録部と、前記ユーザの位置の履歴に基づいて、複数の時刻における複数の場所に関してノードを有するベイジアンネットワークである行動予測モデルを生成する行動予測モデル生成部と、前記行動予測モデルを用いて、前記ユーザの所在位置の情報から所定の場所に前記ユーザが到着する予測到着時刻を求める行動予測部と、前記予測到着時刻に基づいて、前記所定の場所における機器を制御する制御機器とを有する。前記行動予測モデルは、前記ノードからその次の時刻のノードへ向かう1次リンクと、前記ノードからその次の更に次の時刻のノードへ向かう2次リンクとを有する。【選択図】図3

Description

本開示は、機器の制御を行う技術に関する。
ユーザの行動に基づいてそのユーザの次の行動を予測する技術が知られている。例えば、特許文献1には、過去の運転履歴から現在の運転状況と類似度の高いものを探し、それを予測される行動とみなすことが記載されている。また、特許文献2には、ユーザの現在の行動から次の行動を予測する技術が記載されている。このように、行動が、その1つ前の行動によって一意に決定されるような性質は、1次マルコフ性と呼ばれる。
特開2008−267741号公報 国際公開第2006/030742号
しかし、特許文献1によると、寄り道や休憩等、過去の運転履歴に含まれない行動が発生した場合には正しい予測ができない、という問題がある。また、ユーザの行動は、直前の行動のみならず、更に前の行動の影響も受けることが多い。例えば、このような更に前の行動と同じ行動をユーザが繰り返す可能性は低い。特許文献2に記載されているような1次マルコフ性を用いた予測には、過去の複数の行動の因果関係を表現できないという問題がある。
ベイジアンネットワークと呼ばれる状態遷移モデルが知られている。その中でも、時系列データを入力として将来の行動を予測するための手法として、動的ベイジアンネットワークと呼ばれる方法がある。これは、静的ベイジアンネットワークを時系列方向に複製し、隣合う時刻のノード間を有向グラフにより接続したものである。このような有向グラフは、ノードをその次の時刻のノードと接続するので、このネットワークは1次マルコフモデルといえる。
このような動的ベイジアンネットワークでは、ある時刻においてユーザが居る場所によって次の時刻においてユーザが各場所に居る確率が決まるので、例えば時刻tにおいてユーザが駅に居るとき、次の時刻においてユーザが各場所に居る確率は、時刻t−1においてユーザが居る場所によっては影響を受けない。このため、自宅から駅に向かうような出社時の行動と、会社から駅に向かうような帰宅時の行動との区別ができない。ユーザの位置の履歴に基づいて、駅から会社に向かう確率が高くなるようにパラメータの学習がなされている場合には、会社から駅に向かった後、再び会社に戻るような異常な行動が予測され得る。
このような誤推定を防ぐためには、高次マルコフ性を導入する必要がある。しかしながら、ベイジアンネットワークにおいて、高次マルコフ性を導入するためにあらゆるノード同士を有向グラフで接続することは、計算量が莫大となるため現実的ではない。そこで、現実的な計算量で予測精度の高い動的ベイジアンネットワークを構築する必要がある。
本発明は、計算量を抑えながらユーザの行動を予測して、予測されたユーザの行動に応じた制御を機器に対して行うことを目的とする。
本開示による機器制御システムは、ユーザの位置を計測する位置計測部と、計測された前記ユーザの位置の履歴を格納する位置情報記録部と、前記ユーザの位置の履歴に基づいて、複数の時刻における複数の場所に関してノードを有するベイジアンネットワークである行動予測モデルを生成する行動予測モデル生成部と、前記行動予測モデルを用いて、前記ユーザの所在位置の情報から前記複数の場所のうちの所定の場所に前記ユーザが到着すると予測される予測到着時刻を求める行動予測部と、前記予測到着時刻に基づいて、前記所定の場所における機器を制御する制御機器とを有する。前記行動予測モデルは、前記ノードからその次の時刻のノードへ向かう1次リンクと、前記ノードからその次の更に次の時刻のノードへ向かう2次リンクとを有する。
本開示による機器制御方法は、ユーザの位置を計測し、計測された前記ユーザの位置の履歴を格納し、前記ユーザの位置の履歴に基づいて、複数の時刻における複数の場所に関してノードを有するベイジアンネットワークである行動予測モデルを生成し、前記行動予測モデルを用いて、前記ユーザの所在位置の情報から前記複数の場所のうちの所定の場所に前記ユーザが到着すると予測される予測到着時刻を求め、前記予測到着時刻に基づいて、前記所定の場所における機器を制御する。前記行動予測モデルは、前記ノードからその次の時刻のノードへ向かう1次リンクと、前記ノードからその次の更に次の時刻のノードへ向かう2次リンクとを有する。
本開示よれば、計算量を抑えながら、より正確に、ユーザの行動を予測することができる。その結果、予測されたユーザの行動に応じた制御を機器に対して行うことができる。
図1は、本発明の実施形態に係る機器制御システムの構成例を示すブロック図である。 図2は、1次リンクのみを有するベイジアンネットワークの例を示す説明図である。 図3は、2次リンクのみを有するベイジアンネットワークの例を示す説明図である。 図4は、1次リンクと2次リンクとを有するベイジアンネットワークの例を示す説明図である。 図5は、学習データの例を示す説明図である。 図6は、CPTの学習結果として求められた、ベイジアンネットワークである行動予測モデルの例を示す説明図である。 図7は、図1の機器制御システムにおける処理の例を示すフローチャートである。 図8は、図6のベイジアンネットワークに基づいて求められた予測結果の例を示す説明図である。 図9は、1次リンクのみを用いた場合の予測結果の例を示す説明図である。 図10は、図6のベイジアンネットワークに基づいて求められた予測結果の他の例を示す説明図である。 図11は、本発明の実施形態に係る機器制御システムの他の構成例を示すブロック図である。 図12は、本発明の実施形態に係る機器制御システムを実現するコンピュータシステムの構成例を示すブロック図である。
以下、本発明の実施の形態について、図面を参照しながら説明する。図面において下2桁が同じ参照番号で示された構成要素は、互いに対応しており、同一の又は類似の構成要素である。
図1は、本発明の実施形態に係る機器制御システムの構成例を示すブロック図である。図1の機器制御システム100は、モバイル機器110と、制御機器180とを有する。モバイル機器110は、位置計測部112と、位置情報記録部114と、行動予測モデル生成部116と、行動予測部118と、送信部120とを有する。制御機器180は、受信部182と、空調制御部184とを有する。モバイル機器110は、例えば、携帯電話、スマートフォン、腕時計型の通信装置、タブレット端末、パーソナルコンピュータ等である。本明細書において、時刻は離散的なものである。各時刻t−1,t,t+1,…の間の間隔は、典型的には一定(例えば1分)であるが、これには限られない。
モバイル機器110はユーザとともに移動し、位置計測部112はユーザの位置を計測する。位置計測部112は、例えばGPS(global positioning system)受信機であり、複数のGPS衛星からの電波を受信してユーザの位置を計測し、その位置を示す位置情報を出力する。位置計測部112は、ネットワークから受信したデータをも用いるA−GPS(assisted GPS)によって位置を計測してもよい。位置計測部112は、無線LAN(local area network)又は携帯電話の基地局と通信し、その基地局の位置情報を用いてユーザの位置を計測してもよいし、その基地局の位置をユーザの位置と見なすようにしてもよい。位置情報記録部114は、位置計測部112から出力された位置情報を格納する。位置情報記録部114には、ユーザの位置の履歴が格納される。
行動予測モデル生成部116は、ユーザの位置の履歴を表す位置情報を、位置計測部112から読み出し、複数の時刻における複数の場所をノードとして有するベイジアンネットワークである行動予測モデルを生成する。行動予測モデルの生成の詳細については後述する。行動予測モデル生成部116は、この行動予測モデルに関する複数の場所のうち、例えば計測されたユーザの位置に最も近い場所が、ユーザが存在する場所であると見なす。つまり、本明細書において、場所はある程度の広がりを有する。なお、位置情報記録部114は、このようなユーザの位置に最も近い場所を示す情報を位置情報として格納してもよい。
行動予測部118は、生成された行動予測モデルを用いて、ユーザの所在位置から複数の場所のうちの所定の場所にユーザが到着する時刻を予測し、求められた予測到着時刻を出力する。送信部120は、行動予測部118で求められた予測到着時刻を、インターネット等のネットワーク90を経由して制御機器180に送信する。
制御機器180の受信部182は、送信部120から送信された予測到着時刻を受信し、空調制御部184に出力する。空調制御部184は、受信された予測到着時刻に基づいて、前記所定の場所の空調機188を制御する。より具体的には、例えば、空調制御部184は、ユーザの自宅に設置されており、ユーザの到着時に室温が適温になっているように、予測到着時刻より所定時間前(例えば30分前)に空調機188の運転を開始させる。
図1の行動予測モデル生成部116が行う行動予測モデルの生成について説明する。本実施形態では、行動予測モデルとしてベイジアンネットワークを用い、ベイジアンネットワークにおけるノード間の関係に着目し、いくつかの拘束条件を導入すること等によって計算量を削減する。本実施形態では、3つの時刻における3つの場所に関してノードを有するベイジアンネットワークを、行動予測モデルとして生成する例について説明する。このベイジアンネットワークは、1次リンク及び2次リンクを有する。1次リンクは、あるノードからその次の時刻のノードに向かう有向グラフであり、1次マルコフ性を表現する。2次リンクは、あるノードからその次の時刻の更に次の時刻のノードに向かう有向グラフであり、2次マルコフ性を表現する。
場所の数及び時間方向のノード数は3には限定されず、場所の数は3より多くてもよく、時間方向のノード数も3より多くてもよい。時間方向にN個のノードを有する行動予測モデルの場合、1次からN−1次までのリンクを設定することができる。例えばNは160であってもよいが、これには限定されない。
図2は、1次リンクのみを有するベイジアンネットワークの例を示す説明図である。図2では、t−1、t、t+1の3時刻における、会社、駅、自宅の3つの場所に関して、ノードが示されている。例えば時刻tにおける会社、駅、自宅のノードの確率変数は、それぞれOt,St,Htで示される。P(Ot)等はOt等の確率を、P(Ot|Ot-1,St-1,Ht-1)等は条件付き確率を示す。各ノードは、その次の時刻の全てのノードと接続されている。時刻tにおいてユーザが存在できる場所は1つであるので、ある場所での存在確率が1に決まると、同じ時刻に他の場所にユーザが存在する確率は0になる。これは、全ての時刻の全てのノードに対しての拘束条件である。
図2において、時刻t−1のノードと時刻t+1のノードとの間には直接的なリンクはない。このとき、図2のベイジアンネットワークには、
P(Ot|Ot-1,St-1,Ht-1)
P(St|Ot-1,St-1,Ht-1)
P(Ht|Ot-1,St-1,Ht-1)
P(Ot+1|Ot,St,Ht)
P(St+1|Ot,St,Ht)
P(Ht+1|Ot,St,Ht)
の6つの条件付き確率が存在する。その後の学習処理では、行動予測モデル生成部116は、学習データを用いて、これら6つの条件付き確率について条件付き確率表(CPT:conditional probability table)を計算する。
学習処理では、学習データの再現率が最も高くなるように、ノード間の親子関係(どのノードをどのノードに有向グラフでつなぐか)を探索する。条件付き確率が0とならない場合、親子関係が存在する。この探索処理が、ベイジアンネットワークの計算コストが高くなる理由である。どの時刻においても、ユーザは必ずどこかの場所にいなければならないので、2つの時刻の間において、1次リンクは少なくとも1つは必要である。なお、時刻tのノードから時刻t−1のノードへ向かう逆向きの有向グラフは存在しない。
例えば確率変数Otについては、条件が3つあるので、一般的には8(2の3乗)パターンの条件についてCPTを計算しなければならない。しかし、本実施形態では、ある時刻においてユーザが存在できる場所は1つであるという拘束条件を用いるので、確率変数Ot-1,St-1,Ht-1のうちの1つのみが真となる3パターンについてのみ計算すればよい。これにより、CPTの計算を大幅に削減できる。確率変数Ot+1,St,St+1,Ht,Ht+1についても同様である。
図3は、2次リンクのみを有するベイジアンネットワークの例を示す説明図である。図3では、各ノードは、その次の更に次の時刻の全てのノードと接続されている。図3において、時刻t−1のノードと時刻tのノードとの間や、時刻tのノードと時刻t+1のノードとの間には直接的なリンクはない。このとき、図3のベイジアンネットワークには、
P(Ot+1|Ot-1,St-1,Ht-1)
P(St+1|Ot-1,St-1,Ht-1)
P(Ht+1|Ot-1,St-1,Ht-1)
の3つの条件付き確率が存在する。その後の学習処理では、行動予測モデル生成部116は、学習データを用いて、これら3つの条件付き確率についてCPTを計算する。
例えば確率変数Ot+1については、条件が3つあるので、一般的には8(2の3乗)パターンの条件についてCPTを計算しなければならない。しかし、本実施形態では、ある時刻においてユーザが存在できる場所は1つであるという拘束条件を用いるので、確率変数Ot-1,St-1,Ht-1のうちの1つのみが真となる3パターンについてのみ計算すればよい。これにより、CPTの計算を大幅に削減できる。確率変数St+1,Ht+1についても同様である。
図4は、1次リンクと2次リンクとを有するベイジアンネットワークの例を示す説明図である。図4のベイジアンネットワークには、
P(Ot|Ot-1,St-1,Ht-1)
P(St|Ot-1,St-1,Ht-1)
P(Ht|Ot-1,St-1,Ht-1)
P(Ot+1|Ot-1,St-1,Ht-1,Ot,St,Ht)
P(St+1|Ot-1,St-1,Ht-1,Ot,St,Ht)
P(Ht+1|Ot-1,St-1,Ht-1,Ot,St,Ht)
の6つの条件付き確率が存在する。
学習処理において、図2のような1次リンクのみを用いるベイジアンネットワークのCPTの計算コストは、場所に関してノードがM個あり、時間方向にノードがN個ある場合、
O(M)*O(N)=O(MN)
である。条件付き確率の条件となるノードは直前の時刻のノードのみであるので、場所に関するノード数Mのみから計算コストO(M)が決まる。時間方向に条件付き確率を求める対象となるノード数Nから計算コストO(N)が決まる。図3のような2次リンクのみを用いるベイジアンネットワークのCPTの計算コストも、同様にO(MN)である。より高次のリンクについても同様である。
一方、1次からN−1次までの全てのリンクを用いるベイジアンネットワークのCPTの計算コストは、場所に関してノードがM個あり、時間方向にノードがN個ある場合、
O(MN)*O(N)=O(N MN)
である。このように、計算コストが指数関数で示されるので、莫大な計算コストが必要となる。高次マルコフモデルを導入したベイジアンネットワークは、図4のように全てのリンクを用いるものが正しい表現形式となる。ただし、計算コストの問題により、高次マルコフモデルを導入したベイジアンネットワークは実用に向いておらず、導入が進んでいない。そこで、本実施形態では、各ノードに関して、図2のように1次リンクのみを含むベイジアンネットワークによって求められる条件付き確率と、図3のように高次リンクのみを含むベイジアンネットワークによって求められる条件付き確率とを、それぞれに重みを与えて加算し、得られた和をそのノードの条件付き確率とする。
具体的には、行動予測モデル生成部116は、1次リンクのみのベイジアンネットワークの条件付き確率の重み(1次リンクの重み)w1と、2次リンクのみのベイジアンネットワークの条件付き確率の重み(2次リンクの重み)w2とを、適切に設定する。行動予測モデル生成部116は、例えば確率変数Xt+1の条件付き確率P(Xt+1|Ot-1,St-1,Ht-1,Ot,St,Ht)を、次式(1)、すなわち、
P(Xt+1|Ot-1,St-1,Ht-1,Ot,St,Ht)=w1P(Xt+1|Ot,St,Ht)+w2P(Xt+1|Ot-1,St-1,Ht-1) …(1)
ただし、w1+w2=1、XはO,S,又はH
によって求める。
図4のベイジアンネットワークを用いて式(1)の左辺を直接求める場合、計算コストはO(N MN)であるが、図2及び図3のベイジアンネットワークを用いて式(1)の右辺を求める場合、計算コストはO(MN)である。これにより、計算量を抑えつつ、高次マルコフ性を導入することができる。1次からN次までのリンクを含むベイジアンネットワークを用いてもよく、この場合、式(1)は、
P(Ot|(時刻t-1までの全移動事象))=Σi=1 N wiP(Ot|(時刻t-iまでの移動事象))
…(2)
ここで、w1+w2+...+wi+...+wn-1+wn=1
wi: i次リンクの重み
N: リンクの最大次数
のように一般化することができる。
次に、学習処理について説明する。図5は、学習データの例を示す説明図である。図5には4つの経路が含まれる。会社から自宅に向かう場合の例として、(L1)会社→駅→自宅、(L2)会社→駅→駅、の2つの経路が示されている。自宅から会社に向かう場合の例として、(L3)自宅→駅→会社、(L4)自宅→駅→会社、の2つの経路が示されている。4例とも自宅と会社との間を往復するような移動行動の一部であり、駅が中間地点となっている。
図6は、CPTの学習結果として求められた、ベイジアンネットワークである行動予測モデルの例を示す説明図である。行動予測モデル生成部116が学習データの統計処理を行うことにより、各リンクに関する条件付き確率が求められる。図6には、図5の学習データによる1次リンクについてのCPTの学習結果(細線)と、図5の学習データによる2次リンクについてのCPTの学習結果(太線)とが示されている。図6には、条件付き確率が0ではないリンクのみが示されている。図6では、各リンクについて、学習データから統計的に求められる条件付き確率を示している。
例えば、時刻tにおいてユーザが駅に存在するという条件で、時刻t+1においてユーザが会社に存在する条件付き確率P(Ot+1|Ot=0,St=1,Ht=0)は、時刻tにおいてユーザが駅に存在する4例のうち2例が該当することから、0.5である。例えば、時刻t−1においてユーザが会社に存在するという条件で、時刻t+1においてユーザが駅に存在する条件付き確率P(St+1|Ot-1=1,St-1=0,Ht-1=0)は、時刻t−1においてユーザが会社に存在する2例のうち1例が該当することから、0.5である。
図1の機器制御システム100の動作について説明する。図7は、図1の機器制御システム100における処理の例を示すフローチャートである。ブロックB2において、位置計測部112は上述のようにユーザの位置を計測する。ブロックB4において、位置情報記録部114は、位置計測部112から出力された位置情報を格納する。位置情報記録部114には、ユーザの位置が順次格納されるので、ユーザの位置の履歴が格納されている。
ブロックB12〜B24において、行動予測モデル生成部116は、図2〜図6を参照して説明したように、行動予測モデルを生成する。ブロックB12において、行動予測モデル生成部116は、学習データとしてユーザの位置の履歴を位置情報記録部114から読み込む。ブロックB14において、行動予測モデル生成部116は、ノード間を接続する有向グラフのうち、1次リンクを設定する。ブロックB14において、行動予測モデル生成部116は、図2のように設定可能な全ての1次リンクを設定する。ブロックB16において、行動予測モデル生成部116は、図6を参照して説明したように、学習データを統計処理することによって1次リンクのCPTを計算する(学習処理)。行動予測モデル生成部116は、条件付き確率が0である有向グラフを削除する。
ブロックB18において、行動予測モデル生成部116は、ノード間を接続する有向グラフのうち、高次リンク(ここでは2次リンク)を設定する。ブロックB18において、行動予測モデル生成部116は、図3のように設定可能な全ての高次リンクを設定する。ブロックB20において、行動予測モデル生成部116は、図6を参照して説明したように、学習データを統計処理することによって高次リンクのCPTを計算する(学習処理)。行動予測モデル生成部116は、条件付き確率が0である有向グラフを削除する。更に、ブロックB18及びB20と同様に、行動予測モデル生成部116は、3次以上のリンクについて、リンクの設定及びリンクのCPTの計算等をしてもよい。
ブロックB22において、行動予測モデル生成部116は、1次リンクの条件付き確率と高次リンクの条件付き確率の重みの設定を探索的に行う。行動予測モデル生成部116は、例えば、重みのそれぞれとして初期値を設定する。各重みの総和は、1である。
ブロックB24において、行動予測モデル生成部116は、設定された重みが適切か否かを判断する。具体的には、行動予測モデル生成部116は、式(1)によって条件付き確率を求め、これと学習データとの整合性を評価する。整合性が高い場合には重みが適切であるのでブロックB32に進み、整合性が高くない場合には適切でないのでブロックB22に戻る。ブロックB22に戻った場合、行動予測モデル生成部116は、重みを変更する。この際、行動予測モデル生成部116は、例えば最急降下法を用いて重みを変更してもよい。その後、再びブロックB24に進む。なお、行動予測モデル生成部116は、ブロックB22及びB24を繰り返して、条件付き確率と学習データとの整合性が最も高くなるような重みを求めて設定してもよい。
ブロックB32において、行動予測部118は、図6のベイジアンネットワーク及び式(1)に基づいて、ユーザの到着時刻の予測を行う。図8は、図6のベイジアンネットワークに基づいて求められた予測結果の例を示す説明図である。図8においては、各ノードにユーザが存在する確率が示されている。行動予測部118は、時刻t−1においてユーザが会社に居る場合において、時刻t+1においてユーザが存在している可能性の高い場所を以下のように予測する。ブロックB22及びB24の処理により、例として、重みw1及びw2のいずれにも0.5が設定されているものとする。
入力値は、P(Ot-1)=1である。このとき、同時刻にユーザが存在できる場所は1つだけという拘束条件により、P(St-1)=P(Ht-1)=0となる。時刻t−1から時刻tに遷移した際に、それぞれの場所にユーザが存在する確率P(Ot|Ot-1)、P(St|Ot-1)、P(Ht|Ot-1)を、行動予測部118は、図6のCPTを用いて、
P(Ot|Ot-1)=P(Ot-1)*P(Ot|Ot-1=1,St-1=0,Ht-1=0) + P(St-1)*P(Ot|Ot-1=0,St-1=1,Ht-1=0)
+ P(Ht-1)*P(Ot|Ot-1=0,St-1=0,Ht-1=1)
=1.0*0.0 + 0.0*0.0 + 0.0*0.0
=0.0
P(St|Ot-1)=P(Ot-1)*P(St|Ot-1=1,St-1=0,Ht-1=0) + P(St-1)*P(St|Ot-1=0,St-1=1,Ht-1=0)
+ P(Ht-1)*P(St|Ot-1=0,St-1=0,Ht-1=1)
=1.0*1.0 + 0.0*0.0 + 0.0*1.0
=1.0
P(Ht|Ot-1)=P(Ot-1)*P(Ht|Ot-1=1,St-1=0,Ht-1=0) + P(St-1)*P(Ht|Ot-1=0,St-1=1,Ht-1=0)
+ P(Ht-1)*P(Ht|Ot-1=0,St-1=0,Ht-1=1)
=1.0*0.0 + 0.0*0.0 + 0.0*0.0
=0.0
のように求める。
時刻t−1から時刻t+1に遷移した後に、それぞれの場所にユーザが存在する確率P(Ot+1|Ot-1)、P(St+1|Ot-1)、P(Ht+1|Ot-1)について、行動予測部118は、図6のCPTを用いて求める。すなわち、行動予測部118は、1次リンクのみでの条件付き確率と、2次リンクのみでの条件付き確率とを、それぞれに重みw1=0.5及びw2=0.5を乗算してから加算した結果として、
P(Ot+1|Ot-1)=w1{P(Ot+1|Ot)P(Ot|Ot-1)+P(Ot+1|St)P(St|Ot-1)+P(Ot+1|Ht)P(Ht|Ot-1)}
+ w2P(Ot+1|Ot-1,St-1,Ht-1)
=0.5*{0.0*0.0+0.5*1.0+0.0*0.0}
+ 0.5*{P(Ot-1)*P(Ot+1|Ot-1=1,St-1=0,Ht-1=0)
+P(St-1)*P(Ot+1|Ot-1=0,St-1=1,Ht-1=0)
+P(Ht-1)*P(Ot+1|Ot-1=0,St-1=0,Ht-1=1)}
=0.25+0.5*{1.0*0.0+0.0*0.0+0.0*1.0}
=0.25
P(St+1|Ot-1)=w1{P(St+1|Ot)P(Ot|Ot-1)+P(St+1|St)P(St|Ot-1)+P(St+1|Ht)P(Ht|Ot-1)}
+ w2P(St+1|Ot-1,St-1,Ht-1)
=0.5*{0.0*0.0+0.25*1.0+0.0*0.0}
+ 0.5*{P(Ot-1)*P(St+1|Ot-1=1,St-1=0,Ht-1=0)
+P(St-1)*P(St+1|Ot-1=0,St-1=1,Ht-1=0)
+P(Ht-1)*P(St+1|Ot-1=0,St-1=0,Ht-1=1)}
=0.13+0.5*{1.0*0.5+0.0*0.0+0.0*0.0}
=0.38
P(Ht+1|Ot-1)=w1{P(Ht+1|Ot)P(Ot|Ot-1)+P(Ht+1|St)P(St|Ot-1)+P(Ht+1|Ht)P(Ht|Ot-1)}
+ w2P(Ht+1|Ot-1,St-1,Ht-1)
=0.5*{0.0*0.0+0.25*1.0+0.0*0.0}
+ 0.5*{P(Ot-1)*P(Ht+1|Ot-1=1,St-1=0,Ht-1=0)
+P(St-1)*P(Ht+1|Ot-1=0,St-1=1,Ht-1=0)
+P(Ht-1)*P(Ht+1|Ot-1=0,St-1=0,Ht-1=1)}
=0.13+0.5*{1.0*0.5+0.0*0.0+0.0*0.0}
=0.38
のように求める。1次リンクのみでの条件付き確率は、時刻t−1から時刻tへの遷移と、時刻tから時刻t+1への遷移の連結結果として表される。2次リンクのみでの条件付き確率は、時刻t−1から時刻t+1への遷移の確率として表される。得られた確率P(Ot+1|Ot-1)=0.25、P(St+1|Ot-1)=0.38、P(Ht+1|Ot-1)=0.38は、時刻t−1においてユーザが会社にいた場合、時刻t+1においてはユーザが駅に移動しているか自宅に戻っている可能性が高いということを、示している。
図9は、1次リンクのみを用いた場合の予測結果の例を示す説明図である。参考のため、1次リンクのみを用いた場合に得られる確率を計算する。P(Ot|Ot-1)、P(St|Ot-1)、P(Ht|Ot-1)については、図8の場合と同じ結果が得られる。
時刻t−1から時刻t+1に遷移した後に、それぞれの場所にユーザが存在する確率P(Ot+1|Ot-1)、P(St+1|Ot-1)、P(Ht+1|Ot-1)については、時刻t−1から時刻tへの遷移と、時刻tから時刻t+1への遷移の連結結果として表される。これらの確率は、図6のCPTを用いて、
P(Ot+1|Ot-1)=P(Ot+1|Ot)P(Ot|Ot-1)+P(Ot+1|St)P(St|Ot-1)+P(Ot+1|Ht)P(Ht|Ot-1)
=0.0*0.0+0.5*1.0+0.0*0.0
=0.5
P(St+1|Ot-1)=P(St+1|Ot)P(Ot|Ot-1)+P(St+1|St)P(St|Ot-1)+P(St+1|Ht)P(Ht|Ot-1)
=0.0*0.0+0.25*1.0+0.0*0.0
=0.25
P(Ht+1|Ot-1)=P(Ht+1|Ot)P(Ot|Ot-1)+P(Ht+1|St)P(St|Ot-1)+P(Ht+1|Ht)P(Ht|Ot-1)
=0.0*0.0+0.25*1.0+0.0*0.0
=0.25
のように求められる。得られたP(Ot+1|Ot-1)=0.5、P(St+1|Ot-1)=0.25、P(Ht+1|Ot-1)=0.25は、時刻t−1においてユーザが会社にいた場合、時刻t+1においてはユーザが会社に引き返している可能性が高いということを、示している。これは、学習データが示す実際の行動と大きくかけ離れており、正しい予測ができていないと言える。
図10は、図6のベイジアンネットワークに基づいて求められた予測結果の他の例を示す説明図である。図10においても、各ノードにユーザが存在する確率が示されている。行動予測部118は、時刻t−1においてユーザが自宅に居る場合において、時刻t+1においてユーザが存在している可能性の高い場所を以下のように予測する。例として、重みw1及びw2のいずれにも0.5が設定されているものとする。
入力値は、P(Ht-1)=1である。このとき、同時刻にユーザが存在できる場所は1つだけという拘束条件により、P(Ot-1)=P(St-1)=0となる。時刻t−1から時刻tに遷移した際に、それぞれの場所にユーザが存在する確率P(Ot|Ht-1)、P(St|Ht-1)、P(Ht|Ht-1)を、行動予測部118は、図6のCPTを用いて、
P(Ot|Ht-1)=P(Ot-1)*P(Ot|Ot-1=1,St-1=0,Ht-1=0) + P(St-1)*P(Ot|Ot-1=0,St-1=1,Ht-1=0)
+ P(Ht-1)*P(Ot|Ot-1=0,St-1=0,Ht-1=1)
=0.0*0.0 + 0.0*0.0 + 1.0*0.0
=0.0
P(St|Ht-1)=P(Ot-1)*P(St|Ot-1=1,St-1=0,Ht-1=0) + P(St-1)*P(St|Ot-1=0,St-1=1,Ht-1=0)
+ P(Ht-1)*P(St|Ot-1=0,St-1=0,Ht-1=1)
=0.0*1.0 + 0.0*0.0 + 1.0*1.0
=1.0
P(Ht|Ht-1)=P(Ot-1)*P(Ht|Ot-1=1,St-1=0,Ht-1=0) + P(St-1)*P(Ht|Ot-1=0,St-1=1,Ht-1=0)
+ P(Ht-1)*P(Ht|Ot-1=0,St-1=0,Ht-1=1)
=0.0*0.0 + 0.0*0.0 + 1.0*0.0
=0.0
のように求める。
時刻t−1から時刻t+1に遷移した後に、それぞれの場所にユーザが存在する確率P(Ot+1|Ht-1)、P(St+1|Ht-1)、P(Ht+1|Ht-1)について、行動予測部118は、図6のCPTを用いて求める。すなわち、行動予測部118は、1次リンクのみでの条件付き確率と、2次リンクのみでの条件付き確率とを、それぞれに重みw1=0.5及びw2=0.5を乗算してから加算した結果として、
P(Ot+1|Ht-1)=w1{P(Ot+1|Ot)P(Ot|Ht-1)+P(Ot+1|St)P(St|Ht-1)+P(Ot+1|Ht)P(Ht|Ht-1)}
+ w2P(Ot+1|Ot-1,St-1,Ht-1)
=0.5*{0.0*0.0+0.5*1.0+0.0*0.0}
+ 0.5*{P(Ot-1)*P(Ot+1|Ot-1=1,St-1=0,Ht-1=0)
+P(St-1)*P(Ot+1|Ot-1=0,St-1=1,Ht-1=0)
+P(Ht-1)*P(Ot+1|Ot-1=0,St-1=0,Ht-1=1)}
=0.25+0.5*{0.0*0.0+0.0*0.0+1.0*1.0}
=0.75
P(St+1|Ht-1)=w1{P(St+1|Ot)P(Ot|Ht-1)+P(St+1|St)P(St|Ht-1)+P(St+1|Ht)P(Ht|Ht-1)}
+ w2P(St+1|Ot-1,St-1,Ht-1)
=0.5*{0.0*0.0+0.25*1.0+0.0*0.0}
+ 0.5*{P(Ot-1)*P(St+1|Ot-1=1,St-1=0,Ht-1=0)
+P(St-1)*P(St+1|Ot-1=0,St-1=1,Ht-1=0)
+P(Ht-1)*P(St+1|Ot-1=0,St-1=0,Ht-1=1)}
=0.13+0.5*{0.0*0.5+0.0*0.0+1.0*0.0}
=0.13
P(Ht+1|Ht-1)=w1{P(Ht+1|Ot)P(Ot|Ht-1)+P(Ht+1|St)P(St|Ht-1)+P(Ht+1|Ht)P(Ht|Ht-1)}
+ w2P(Ht+1|Ot-1,St-1,Ht-1)
=0.5*{0.0*0.0+0.25*1.0+0.0*0.0}
+ 0.5*{P(Ot-1)*P(Ht+1|Ot-1=1,St-1=0,Ht-1=0)
+P(St-1)*P(Ht+1|Ot-1=0,St-1=1,Ht-1=0)
+P(Ht-1)*P(Ht+1|Ot-1=0,St-1=0,Ht-1=1)}
=0.13+0.5*{0.0*0.5+0.0*0.0+1.0*0.0}
=0.13
のように求める。得られた確率P(Ot+1|Ht-1)=0.75、P(St+1|Ht-1)=0.13、P(Ht+1|Ht-1)=0.13は、時刻t−1においてユーザが自宅に居た場合、時刻t+1においてはユーザが会社に移動している可能性が高いということを、示している。
時刻t−1においてユーザが自宅に居る場合において、時刻t+1においてユーザが存在している可能性の高い場所を、1次リンクのみを用いて予測すると、図9と同様の結果が得られる。これは、図6において、時刻t−1における会社のノードを起点とする1次リンクは駅のノードに向かうリンクのみであり、時刻t−1における自宅のノードを起点とする1次リンクも駅のノードに向かうリンクのみであることからもわかる。
このように、1次リンクのみを用いると、ユーザが会社を出発する帰宅時においても、ユーザが自宅を出発する出社時においても、同じ結果が得られてしまい、正しい予測が行われないことがわかる。2次リンクも用いる本実施形態によると、図8及び図10に示されているように、帰宅時には時刻t+1においてユーザが自宅に居る可能性が比較的高くなり、出社時には時刻t+1においてユーザが会社に居る可能性が比較的高くなる。
図6のベイジアンネットワークは、実際には時間方向により多くのノードを有している。図7のブロックB32において、行動予測部118は、図8を参照して説明したような処理を時間方向に繰り返し、時刻t+1より後の時刻のノードについても、ユーザがそのノードに存在する確率を求める。更に、行動予測部118は、ユーザが自宅のノードに存在する確率P(Ht+1|Ot-1)、P(Ht+2|Ot-1)、P(Ht+3|Ot-1)、……のうち、値が最も大きいものを求め、それに対応する時刻を、ユーザが自宅に到着する予測到着時刻として出力する。なお、行動予測部118は、時間方向に複数のノードにわたって、ユーザの存在した場所を入力として用いてもよい。
送信部120は、求められた予測到着時刻を、ネットワーク90を経由して制御機器180に送信する。制御機器180の受信部182は、予測到着時刻を受信して空調制御部184に出力する。ブロックB34において、空調制御部184は、予測到着時刻より所定時間前に運転(例えば、冷房運転や暖房運転)を開始するように、空調機188を制御する。これにより、ユーザが自宅に到着したときには、室温が適切な温度になっているようにすることができる。
本実施形態は、過去の一連の行動に基づいて次の行動を予測する確率モデルを用いるので、直前の行動のみに基づいて次の行動を予測するようなモデルを用いる場合と比べて、より正確に、ユーザの行動(各場所にユーザが存在する確率や、ユーザの到着時刻)を予測することができる。また、類似する過去の行動履歴に基づいて次の行動を予測するような、パターンマッチング手法と比べると、過去にしたことがない行動をユーザが行うような場合においてもユーザの行動を予測することができる。本実施形態は、1次リンクに関する計算と、高次リンクに関する計算とを独立して行い、式(1)のように、これらを、それぞれに重み付けしてから加算する。このため、計算量を抑えることもできる。
図11は、本発明の実施形態に係る機器制御システムの他の構成例を示すブロック図である。図11の機器制御システム200は、モバイル機器210と、サーバ240と、制御機器280とを有する。モバイル機器210は、位置計測部212と、送信部220とを有する。サーバ240は、受信部242と、位置情報記録部244と、行動予測モデル生成部246と、行動予測部248と、送信部250とを有する。制御機器280は、受信部282と、給湯制御部284とを有する。
モバイル機器210は、位置情報記録部114、行動予測モデル生成部116、及び行動予測部118を有しない点以外は、図1のモバイル機器110とほぼ同様に構成されている。送信部220は、位置計測部212から出力された位置情報を、ネットワーク90を経由してサーバ240に送信する。
サーバ240の受信部242は、位置情報を受信して位置情報記録部244に出力する。位置情報記録部244、行動予測モデル生成部246、及び行動予測部248は、図1の位置情報記録部114、行動予測モデル生成部116、及び行動予測部118とそれぞれ同様であるので説明を省略する。送信部250は、行動予測部248で求められた予測到着時刻を、ネットワーク90を経由して制御機器280に送信する。
制御機器280の受信部282は、送信部250から送信された予測到着時刻を受信し、給湯制御部284に出力する。給湯制御部184は、受信された予測到着時刻に基づいて、所定の場所の給湯器288を制御する。より具体的には、例えば、給湯制御部284は、ユーザの自宅に設置されており、ユーザの到着時に浴槽に適切な量の湯が貯留されているように、予測到着時刻より所定時間前(例えば30分前)に給湯器288の運転を開始させる。このように、行動予測モデルの生成や行動予測を、モバイル機器210ではなく、サーバ240において行うようにしてもよい。
図12は、本発明の実施形態に係る機器制御システムを実現するコンピュータシステムの構成例を示すブロック図である。図12のコンピュータシステム300は、プロセッサ52と、バス54と、GPS受信機56と、送受信機58と、格納部60と、ユーザインタフェース66とを有する。格納部60は、メモリ62と、ファイル格納部64とを有する。
プロセッサ52は、バス54を経由して他の構成要素と通信する。GPS受信機56は、GPS衛星からの電波をアンテナ経由で受信し、位置の検出を行う。送受信機58は、例えば携帯電話の基地局や無線LANの基地局と無線で通信を行い、インターネット等のネットワークとの間でデータを送受信する。GPS受信機56は、ネットワークから受信したデータをも用いて、位置を検出し得る。GPS受信機56は、位置計測部112又は212として動作し得る。
メモリ62は例えばRAM(random access memory)及びROM(read only memory)を含んでおり、データ及び命令を格納する。ファイル格納部64は、1以上の揮発性又は不揮発性の、非過渡的な、コンピュータ読み取り可能な格納媒体である。本発明の実施形態がソフトウェアで実現される場合には、例えば、マイクロコード、アセンブリ言語のコード、又はより高レベルの言語のコードが用いられ得る。これらのコードで記述され、本発明の実施形態の機能を実現する命令を含むプログラムを、ファイル格納部64は格納する。ファイル格納部64は、RAM、ROM、EEPROM(electrically erasable programmable read only memory)、及びフラッシュメモリ等の半導体メモリ、ハードディスクドライブ等の磁気記録媒体、光記録媒体、これらの組み合わせ等を含み得る。
ユーザインタフェース66は、入力デバイスとして、タッチスクリーン、キーボード、及びマウス等を含み得る。ユーザインタフェース66は、出力デバイスとして、液晶ディスプレイ、有機EL(electroluminescence)ディスプレイ等のフラットパネルディスプレイを含み得る。
本明細書における各機能ブロックは、例えば、回路等のハードウェアで実現され得る。代替としては各機能ブロックの一部又は全ては、ソフトウェアで実現され得る。例えばそのような機能ブロックは、プロセッサ52及びプロセッサ52上で実行されるプログラムによって実現され得る。換言すれば、本明細書で説明される各機能ブロックは、ハードウェアで実現されてもよいし、ソフトウェアで実現されてもよいし、ハードウェアとソフトウェアとの任意の組合せで実現され得る。
本発明の多くの特徴及び優位性は、記載された説明から明らかであり、よって添付の特許請求の範囲によって、本発明のそのような特徴及び優位性の全てをカバーすることが意図される。更に、多くの変更及び改変が当業者には容易に可能であるので、本発明は、図示され記載されたものと全く同じ構成及び動作に限定されるべきではない。したがって、全ての適切な改変物及び等価物は本発明の範囲に入るものとされる。
以上説明したように、本発明は、機器制御システム及び機器制御方法等について有用である。
100,200 機器制御システム
110 モバイル機器
112 位置計測部
116 行動予測モデル生成部
118 行動予測部
180,280 制御機器
240 サーバ

Claims (6)

  1. ユーザの位置を計測する位置計測部と、
    計測された前記ユーザの位置の履歴を格納する位置情報記録部と、
    前記ユーザの位置の履歴に基づいて、複数の時刻における複数の場所に関してノードを有するベイジアンネットワークである行動予測モデルを生成する行動予測モデル生成部と、
    前記行動予測モデルを用いて、前記ユーザの所在位置の情報から前記複数の場所のうちの所定の場所に前記ユーザが到着すると予測される予測到着時刻を求める行動予測部と、
    前記予測到着時刻に基づいて、前記所定の場所における機器を制御する制御機器と
    を備え、
    前記行動予測モデルは、
    前記ノードからその次の時刻のノードへ向かう1次リンクと、
    前記ノードからその次の更に次の時刻のノードへ向かう2次リンクと
    を有する
    機器制御システム。
  2. 請求項1の機器制御システムにおいて、
    前記行動予測部は、前記ノードのそれぞれに関して、
    前記1次リンクのみに基づいて求められる条件付き確率に第1の重みを乗算して得られる第1乗算結果と、前記2次リンクのみに基づいて求められる条件付き確率に第2の重みを乗算して得られる第2乗算結果との和を、そのノードの条件付き確率として用いる
    機器制御システム。
  3. 請求項1の機器制御システムにおいて、
    前記行動予測部は、前記複数の場所のそれぞれに関して、前記ユーザがその場所に存在する確率を求め、前記ユーザがその場所に存在する確率が最大になる時刻を前記予測到着時刻として求める
    機器制御システム。
  4. 請求項1の機器制御システムにおいて、
    モバイル機器が、前記位置計測部、前記位置情報記録部、前記行動予測モデル生成部、及び前記行動予測部を有する
    機器制御システム。
  5. 請求項1の機器制御システムにおいて、
    モバイル機器が、前記位置計測部を有し、
    モバイル機器と通信するサーバが、前記位置情報記録部、前記行動予測モデル生成部、及び前記行動予測部を有する
    機器制御システム。
  6. 機器制御方法であって、
    ユーザの位置を計測し、
    計測された前記ユーザの位置の履歴を格納し、
    前記ユーザの位置の履歴に基づいて、複数の時刻における複数の場所に関してノードを有するベイジアンネットワークである行動予測モデルを生成し、
    前記行動予測モデルを用いて、前記ユーザの所在位置の情報から前記複数の場所のうちの所定の場所に前記ユーザが到着すると予測される予測到着時刻を求め、
    前記予測到着時刻に基づいて、前記所定の場所における機器を制御し、
    前記行動予測モデルは、
    前記ノードからその次の時刻のノードへ向かう1次リンクと、
    前記ノードからその次の更に次の時刻のノードへ向かう2次リンクと
    を有する
    機器制御方法。
JP2015257306A 2015-12-28 2015-12-28 機器制御システム及び機器制御方法 Pending JP2017121017A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015257306A JP2017121017A (ja) 2015-12-28 2015-12-28 機器制御システム及び機器制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015257306A JP2017121017A (ja) 2015-12-28 2015-12-28 機器制御システム及び機器制御方法

Publications (1)

Publication Number Publication Date
JP2017121017A true JP2017121017A (ja) 2017-07-06

Family

ID=59272507

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015257306A Pending JP2017121017A (ja) 2015-12-28 2015-12-28 機器制御システム及び機器制御方法

Country Status (1)

Country Link
JP (1) JP2017121017A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019161618A (ja) * 2018-03-16 2019-09-19 トヨタホーム株式会社 給湯制御システム
JP2020067237A (ja) * 2018-10-25 2020-04-30 株式会社ノーリツ 温水システム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019161618A (ja) * 2018-03-16 2019-09-19 トヨタホーム株式会社 給湯制御システム
JP7034783B2 (ja) 2018-03-16 2022-03-14 トヨタホーム株式会社 給湯制御システム
JP2020067237A (ja) * 2018-10-25 2020-04-30 株式会社ノーリツ 温水システム

Similar Documents

Publication Publication Date Title
JP6507279B2 (ja) 管理方法、非一時的コンピュータ可読媒体および管理装置
KR102191444B1 (ko) 우선순위화된 경험 메모리를 사용한 신경 네트워크의 트레이닝
ul Hassan et al. Efficient task assignment for spatial crowdsourcing: A combinatorial fractional optimization approach with semi-bandit learning
EP3384435B1 (en) Selecting action slates using reinforcement learning
US20150026109A1 (en) Method and system for predicting power consumption
EP3360083B1 (en) Dueling deep neural networks
JP6728495B2 (ja) 強化学習を用いた環境予測
US8653968B2 (en) Systems and methods for predictive building energy monitoring
JP7279445B2 (ja) 予測方法、予測プログラムおよび情報処理装置
US10783452B2 (en) Learning apparatus and method for learning a model corresponding to a function changing in time series
JP2013205170A (ja) 情報処理装置、情報処理方法、およびプログラム
Kroese et al. Network reliability optimization via the cross-entropy method
CN105335875A (zh) 购买力预测方法和装置
US20130262032A1 (en) Information processing device, information processing method, and program
US9563193B2 (en) Information processing method, program development device, recording medium, and method
JP2018181184A (ja) 評価装置、評価方法及びそのプログラム
US20180279078A1 (en) Confirming work supporting device, confirming work supporting system, and computer program product
JP2018060547A (ja) 指示分析のためのシステムおよび方法
CN114760308B (zh) 边缘计算卸载方法及装置
JP2017121017A (ja) 機器制御システム及び機器制御方法
CN115907222A (zh) 一种碳排放预测方法和系统
JP2017227994A (ja) 人流予測装置、パラメータ推定装置、方法、及びプログラム
KR102010031B1 (ko) 게임 지표 정보 예측 방법 및 장치
US8108238B1 (en) Flexible project governance based on predictive analysis
Caraka et al. The step construction of penalized spline in electrical power load data