WO2020213425A1

WO2020213425A1 - 状況推定装置、状況推定プログラム、推定モデル及び状況推定方法

Info

Publication number: WO2020213425A1
Application number: PCT/JP2020/015253
Authority: WO
Inventors: 典昭廣川; 義隆井上; 佑介深澤
Original assignee: 株式会社Ｎｔｔドコモ
Priority date: 2019-04-19
Filing date: 2020-04-02
Publication date: 2020-10-22
Also published as: US20220198341A1; JPWO2020213425A1

Abstract

状況推定装置は、時系列のセンサデータ群を取得するセンサ情報取得部と、状況ラベルを各時刻のセンサデータに対して仮に割り当てる状況割当部と、同じ状況ラベルが割り当てられたセンサデータの特徴パラメータを算出して、各時刻のセンサデータをいずれかの状況に分類する状況推定モデルの学習を行う第１モデル学習部と、遷移基準時以前の状況ラベルの遷移を入力とし遷移基準時の次の時刻の状況ラベルを出力とする状況遷移モデルの学習を行う第２モデル学習部と、各モデルに基づいて推定された各時刻の状況に基づいて、各時刻に割り当てる状況ラベルを更新する状況割当更新部と、状況推定モデル及び状況遷移モデルを出力する出力部と、を備える。

Description

状況推定装置、状況推定プログラム、推定モデル及び状況推定方法

　本発明は、状況推定装置、状況推定プログラム、推定モデル及び状況推定方法に関する。

　ユーザの具体的な状況の推定及び将来の状況の予測を行うことの要請が高まっている。例えば、ユーザが所持する端末に備えられた各種のセンサにより取得された検出値に基づいてユーザの状態を推定する技術が知られている。例えば、特許文献１には、センサが検出した時系列のセンサ情報を文節可したセグメント情報とユーザの状態に対応するラベルＩＤとの対応関係を教師あり学習により構築した予測モデルにより、ユーザの状態を推定する技術が記載されている。

特開２０１８－１０３４３号公報

　ユーザの状況を機械学習により構築されたモデルを用いて推定する従来の技術では、センサ等から取得された情報に対応づける正解ラベルが必要である。しかしながら、このような正解ラベルは、例えばユーザによる入力が必要であるので、その取得が困難であった。

　そこで、本発明は、上記問題点に鑑みてなされたものであり、容易に取得可能なセンサ情報に基づいて、状況に関するユーザによる情報の入力を要さずに、ユーザの状況を推定することを目的とする。

　上記課題を解決するために、本発明の一形態に係る状況推定装置は、センサにより検知されるセンサデータに基づいてユーザの状況を推定する状況推定装置であって、少なくとも一つのセンサにより取得された時系列のセンサデータ群からなるセンサ情報を取得するセンサ情報取得部と、ユーザの状況のそれぞれを識別する状況ラベルのうちの一つを、各時刻及び当該時刻に関連付けられた１以上のセンサデータに対して、所定の手法により仮に割り当てる状況割当部と、同じ状況ラベルが割り当てられたセンサデータの特徴を表す特徴パラメータを算出して、各時刻に関連付けられたセンサデータを複数の状況のうちのいずれかの状況に分類する第１モデルの学習を行う第１モデル学習部と、各時刻に割り当てられた状況ラベルの時系列の配列からなる状況配列から、時系列中の一の時刻を遷移基準時として遷移基準時以前の状況ラベルの遷移を表す情報及び遷移基準時の次の時刻に割り当てられた状況ラベルをそれぞれ入力特徴量及び教師ラベルとして抽出し、抽出した入力特徴量及び教師ラベル含む学習データに基づく機械学習により、遷移基準時以前の状況ラベルの遷移を入力とし遷移基準時の次の時刻の状況ラベルを出力とする第２モデルの学習を行う第２モデル学習部と、時系列のうちの各時刻に関して、第１モデル及び第２モデルのそれぞれに基づいて各時刻の状況を推定し、推定されたそれぞれの状況に基づいて、各時刻に割り当てる状況ラベルを更新する状況割当更新部と、状況ラベルの更新に関する所定の条件が充足された場合に、第１モデル及び第２モデルを出力する出力部と、を備える。

　上記の形態によれば、時系列に取得されたセンサデータに対して仮に割り当てられた状況ラベルの配列である状況配列に基づいて、各時刻に関連付けられたセンサデータを複数の状況のうちのいずれかに分類する第１モデルが、同じ状況ラベルが割り当てられたセンサデータの特徴パラメータを算出することによる教師なし学習により構築されると共に、時系列の状況の遷移に基づいて次の状況を推定する第２モデルが構築される。そして、第１モデル及び第２モデルのそれぞれにより出力された状況の推定結果に基づいて、状況の遷移を表す状況配列が更新され、更新された状況配列に基づいて第１モデル及び第２モデルの学習が実施されるので、学習に供するためのユーザによる状況の情報の入力を要さずに、高精度な状況の推定及びユーザの状況を推定するモデルの構築が可能となる。

　容易に取得可能なセンサ情報に基づいて、状況に関するユーザによる情報の入力を要さずに、ユーザの状況を推定することが可能となる。

本実施形態の状況推定装置を含む状況推定システムの機能的構成を示すブロック図である。状況推定装置のハードブロック図である。図３（ａ）は、センサ情報を模式的に示す図である。図３（ｂ）は、センサ情報の実体を模式的に表す図である。センサ情報における各時刻のセンサデータに対する状況の割り当ての例を示す図である。状況推定モデルの学習処理を説明するための図である。状況推定モデルの学習処理を示すフローチャートである。状況遷移モデルの学習データの例を示す図である。状況遷移モデルの学習処理を示すフローチャートである。図９（ａ）は、状況推定モデルのパラメータの例を示す図である。図９（ｂ）は、状況の推定対象のセンサデータの例を示す図である。状況割当の更新の例を説明するための図である。状況割当の更新の処理の例を示すフローチャートである。状況推定装置におけるモデル生成の局面の状況推定方法の処理内容を示すフローチャートである。現在時刻に至る状況の遷移を推定する状況推定方法の処理内容を示すフローチャートである。現在時刻の次の時刻の状況を推定する状況推定方法の処理内容を示すフローチャートである。状況推定プログラムの構成を示す図である。

　本発明に係る状況推定装置の実施形態について図面を参照して説明する。なお、可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。

　図１は、本実施形態に係る状況推定装置を含む状況推定システムの機能的構成を示す図である。図１に示すように、状況推定システム１は、状況推定装置１０、センサ情報記憶部２０、状況割当記憶部３０、第１モデル記憶部４０及び第２モデル記憶部５０を含む。状況推定装置１０は、センサにより検知されるセンサデータに基づいてユーザの状況を推定する装置である。

　状況推定装置１０並びにセンサ情報記憶部２０、状況割当記憶部３０、第１モデル記憶部４０及び第２モデル記憶部５０は、１つの装置として構成されてもよいし、それぞれが別の装置に構成されてもよい。

　状況推定装置１０は、図１に示すように、機能的には、センサ情報取得部１１、状況割当部１２、第１モデル学習部１３、第２モデル学習部１４、状況割当更新部１５、出力部１６及び状況予測部１７を備える。これらの各機能部１１～１７は、一つの装置に構成されてもよいし、複数の装置に分散されて構成されてもよい。センサ情報記憶部２０、状況割当記憶部３０、第１モデル記憶部４０及び第２モデル記憶部５０は、各機能部１１～１７からアクセス可能に構成されていれば、状況推定装置１０に構成されてもよいし、状況推定装置１０以外の装置に構成されてもよい。

　なお、図１に示したブロック図は、機能単位のブロックを示している。これらの機能ブロック（構成部）は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した１つの装置を用いて実現されてもよいし、物理的又は論理的に分離した２つ以上の装置を直接的又は間接的に（例えば、有線、無線などを用いて）接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記１つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。

　機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知（broadcasting）、通知（notifying）、通信（communicating）、転送（forwarding）、構成（configuring）、再構成（reconfiguring）、割り当て（allocating、mapping）、割り振り（assigning）などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック（構成部）は、送信部（transmitting　unit）や送信機（transmitter）と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。

　例えば、本発明の一実施の形態における状況推定装置１０は、コンピュータとして機能してもよい。図２は、本実施形態に係る状況推定装置１０のハードウェア構成の一例を示す図である。状況推定装置１０は、物理的には、プロセッサ１００１、メモリ１００２、ストレージ１００３、通信装置１００４、入力装置１００５、出力装置１００６、バス１００７などを含むコンピュータ装置として構成されてもよい。

　なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。状況推定装置１０のハードウェア構成は、図に示した各装置を１つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。

　状況推定装置１０における各機能は、プロセッサ１００１、メモリ１００２などのハードウェア上に所定のソフトウェア（プログラム）を読み込ませることで、プロセッサ１００１が演算を行い、通信装置１００４による通信や、メモリ１００２及びストレージ１００３におけるデータの読み出し及び／又は書き込みを制御することで実現される。

　プロセッサ１００１は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ１００１は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置（ＣＰＵ：Central　Processing　Unit）で構成されてもよい。例えば、図１に示した各機能部１１～１７などは、プロセッサ１００１で実現されてもよい。

　また、プロセッサ１００１は、プログラム（プログラムコード）、ソフトウェアモジュールやデータを、ストレージ１００３及び／又は通信装置１００４からメモリ１００２に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、状況推定装置１０の各機能部１１～１７は、メモリ１００２に格納され、プロセッサ１００１で動作する制御プログラムによって実現されてもよい。上述の各種処理は、１つのプロセッサ１００１で実行される旨を説明してきたが、２以上のプロセッサ１００１により同時又は逐次に実行されてもよい。プロセッサ１００１は、１以上のチップで実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。

　メモリ１００２は、コンピュータ読み取り可能な記録媒体であり、例えば、ＲＯＭ（Read　Only　Memory）、ＥＰＲＯＭ（Erasable　Programmable　ＲＯＭ）、ＥＥＰＲＯＭ（Electrically Erasable Programmable ＲＯＭ）、ＲＡＭ（Random　Access　Memory）などの少なくとも１つで構成されてもよい。メモリ１００２は、レジスタ、キャッシュ、メインメモリ（主記憶装置）などと呼ばれてもよい。メモリ１００２は、本発明の一実施の形態に係る状況推定方法を実施するために実行可能なプログラム（プログラムコード）、ソフトウェアモジュールなどを保存することができる。

　ストレージ１００３は、コンピュータ読み取り可能な記録媒体であり、例えば、ＣＤ－ＲＯＭ（Compact　Disc　ＲＯＭ）などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Ｂｌｕ－ｒａｙ（登録商標）ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー（登録商標）ディスク、磁気ストリップなどの少なくとも１つで構成されてもよい。ストレージ１００３は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ１００２及び／又はストレージ１００３を含むデータベース、サーバその他の適切な媒体であってもよい。

　通信装置１００４は、有線及び／又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア（送受信デバイス）であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。

　入力装置１００５は、外部からの入力を受け付ける入力デバイス（例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど）である。出力装置１００６は、外部への出力を実施する出力デバイス（例えば、ディスプレイ、スピーカー、LEDランプなど）である。なお、入力装置１００５及び出力装置１００６は、一体となった構成（例えば、タッチパネル）であってもよい。

　また、プロセッサ１００１やメモリ１００２などの各装置は、情報を通信するためのバス１００７で接続される。バス１００７は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。

　また、状況推定装置１０は、マイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ：Digital　Signal　Processor）、ＡＳＩＣ（Application　Specific　Integrated　Circuit）、ＰＬＤ（Programmable　Logic　Device）、ＦＰＧＡ（Field　Programmable　Gate　Array）などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ１００１は、これらのハードウェアの少なくとも１つで実装されてもよい。

　次に、状況推定装置１０の各機能部について説明する。センサ情報取得部１１は、少なくとも一つの種類のセンサにより取得された時系列のセンサデータ群からなるセンサ情報を取得する。センサデータは、ユーザの状況の推定に関連があるものであれば特に限定されないが、例えば、ユーザが所持する端末に備えられたセンサにより取得されるデータであってもよい。センサは、例えば、加速度センサ及び傾きセンサ等であってもよい。センサデータは、例えば、加速度及び傾きの情報であってもよい。

　センサ情報記憶部２０は、センサ情報を記憶している記憶手段である。ユーザの端末において取得された各種のセンサデータは、端末から送信され、センサ情報記憶部２０に記憶される。状況推定装置１０が、端末から送信されたセンサデータを受信して、受信したセンサデータをセンサ情報記憶部２０に記憶させてもよい。なお、本実施形態の状況推定装置１０は、ユーザの端末に構成されてもよい。

　図３は、センサ情報の例を示す図である。図３（ａ）は、センサ情報を模式的に示す図である。図３に示す例では、センサ情報は、３種類のセンサＡ～Ｃにより取得された時系列のセンサデータを含む。図３（ｂ）は、センサ情報の実体を模式的に表す図である。即ち、センサ情報は、各センサにより取得された時系列のセンサデータ群からなるので、図３（ｂ）に示されるように、センサの種類数を行数とする行列として表されることができる。この行列の列数は、センサによる検出時間に相当する。従って、センサ情報は、時刻に関連付けられたセンサＡ、センサＢ及びセンサＣのセンサデータを、時系列に配列したデータ群である。

　状況割当部１２は、複数の状況ラベルのうちの一つを、各時刻及び当該時刻に関連付けられた１以上の種類のセンサデータに対して、所定の手法により仮に割り当てる。

　状況ラベルは、ユーザの状況のそれぞれを識別するラベルである。状況ラベルの数は、峻別される状況の種類の数に対応する所定数に予め設定される。本実施形態の状況推定装置１０では、この状況ラベルの数を適切に設定することにより、移動、着座といったユーザの状態ではなく、通勤、事務作業、食事、外出及び帰宅といった具体的なユーザの状況の推定が可能となる。状況ラベルは、例えば、「０」、「１」、「２」、「３」、・・・といった数字であることができる。

　図４は、センサ情報における各時刻のセンサデータに対する状況の割り当ての例を示す図である。図４に示す例では、状況ラベル「０～４」が各時刻に対して割り当てられる。

　状況割当部１２は、後述するモデルの学習に先立って、初期の状況割当として、乱数に基づいて、各時刻及び当該時刻に関連付けられた１以上の種類のセンサデータに対して、状況ラベルを割り当てる。図４に示すように、状況割当部１２は、時系列の時刻及びセンサＡ～Ｃのセンサデータの組のそれぞれに対して、状況ラベル０～４のいずれかを乱数に基づいてランダムに割り当てる。これにより、各時刻に割り当てられた状況ラベルの時系列の配列からなる初期の状況配列が生成される。これにより、後述されるモデルの学習に好適な仮の状況配列を得ることができる。

　第１モデル学習部１３は、各時刻に関連付けられたセンサデータを複数の状況のうちのいずれかの状況に分類する状況推定モデル（第１モデル）の学習を行う。具体的には、第１モデル学習部１３は、同じ状況ラベルが割り当てられたセンサデータを抽出する。そして、第１モデル学習部１３は、抽出されたセンサデータの特徴を表す特徴パラメータを状況ラベルごとに算出することによる教師なし学習により、状況推定モデルの学習を実施する。

　本実施形態における教師なし学習は、例えば、ｋ－ｍｅａｎｓ法等のクラスタ分析、分散共分散行列（マルコフ確率場モデル）を用いた解析等であってもよく、その手法は限定されない。

　状況推定モデルを定義する特徴パラメータは、１以上の種類のセンサデータの平均値及び分散共分散行列のうちの少なくとも一つを含むこととしてもよい。本実施形態では、１以上の種類のセンサデータの平均値及び分散共分散行列を状況推定モデルの特徴パラメータとする。

　図５は、状況推定モデルの学習処理を説明するための図である。図５に示すように、第１モデル学習部１３は、状況割当部１２により生成された状況配列または状況割当更新部１５により更新された状況配列に基づいて、同じ状況ラベルが割り当てられたセンサデータを抽出する。そして、第１モデル学習部１３は、例えば状況ラベル３が割り当てられたセンサＡ～Ｃのセンサデータに基づいて、分散共分散行列ｐａ３及び平均ｐｂ２を算出して、状況ラベル「３」の特徴パラメータｐａｒ３を出力する。

　同様に、第１モデル学習部１３は、状況ラベル４が割り当てられたセンサＡ～Ｃのセンサデータに基づいて、分散共分散行列ｐａ４及び平均ｐｂ４を算出して、状況ラベル「４」の特徴パラメータｐａｒ４を出力する。さらに、第１モデル学習部１３は、状況ラベル２が割り当てられたセンサＡ～Ｃのセンサデータに基づいて、分散共分散行列ｐａ２及び平均ｐｂ２を算出して、状況ラベル「２」の特徴パラメータｐａｒ２を出力する。

　第１モデル学習部１３は、各状況ラベルの特徴パラメータを、学習された状況推定モデルとして第１モデル記憶部４０に記憶させる。第１モデル記憶部４０は、学習過程にある状況推定モデル及び学習済みの状況推定モデルを記憶する記憶手段である。

　図６は、状況推定モデルの学習処理を示すフローチャートである。図６に示されるフローチャートは、後に説明する図１４のフローチャートにおけるステップＳ３の処理に相当する。

　ステップＳ３１において、第１モデル学習部１３は、状況ラベルの種類数をカウントするための変数ｉを初期化する。ステップＳ３２において、第１モデル学習部１３は、変数ｉが状況ラベルの種類数未満であるか否かを判定する。変数ｉが状況ラベルの種類数未満であると判定された場合には、処理はステップＳ３３に進む。一方、変数ｉが状況ラベルの種類数未満であると判定されなかった場合には、学習処理は終了する。

　ステップＳ３３において、第１モデル学習部１３は、状況ラベル［ｉ］が割り当てられたセンサデータを、各時刻に割り当てられた状況ラベルの時系列の配列からなる状況配列に基づいて抽出する。

　ステップＳ３４において、第１モデル学習部１３は、ステップＳ３３において抽出されたセンサデータの特徴パラメータ（例えば、複数のセンサにより取得されたセンサデータの分散共分散行列及び平均値）を算出する。

　ステップＳ３５において、第１モデル学習部１３は、学習結果である特徴パラメータを、状況ラベル［ｉ］に関する状況推定モデルＭ１［ｉ］として、第１モデル記憶部４０に保持する。ステップＳ３６において、第１モデル学習部１３は、変数ｉの値をインクリメントして、処理はステップＳ３２に戻る。

　第２モデル学習部１４は、状況遷移モデル（第２モデル）の学習を行う。状況遷移モデルは、時系列中の一の時刻を遷移基準時として、状況ラベルの時系列の配列からなる状況配列から抽出された遷移基準時以前の状況ラベルの遷移を入力とし、遷移基準時の次の時刻の状況を出力とするモデルである。状況遷移モデルは、ニューラルネットワークを含んで構成されるモデルであってもよい。

　第２モデル学習部１４は、状況遷移モデルを定義するパラメータを、学習された状況遷移モデルとして第２モデル記憶部５０に記憶させる。第２モデル記憶部５０は、学習過程にある状況遷移モデル及び学習済みの状況遷移モデルを記憶する記憶手段である。

　具体的には、第２モデル学習部１４は、状況配列から、遷移基準時以前の状況ラベルの遷移を表す情報及び遷移基準時の次の時刻に割り当てられた状況ラベルをそれぞれ入力特徴量及び教師ラベルとして抽出し、抽出した入力特徴量及び教師ラベルからなる学習データを生成する。第２モデル学習部１４は、時系列に沿う各時刻を遷移基準時として複数の学習データを生成し、生成した学習データに基づく機械学習により、状況遷移モデルの学習を行う。

　学習済みのニューラルネットワークを含むモデルである状況遷移モデルは、コンピュータにより読み込まれ又は参照され、コンピュータに所定の処理を実行させ及びコンピュータに所定の機能を実現させるプログラムとして捉えることができる。

　即ち、本実施形態の学習済みの状況遷移モデルは、ＣＰＵ及びメモリを備えるコンピュータにおいて用いられる。具体的には、コンピュータのＣＰＵが、メモリに記憶された学習済みの状況遷移モデルからの指令に従って、ニューラルネットワークの入力層に入力された入力データ（例えば、遷移基準時以前の状況ラベルの遷移を表す情報からなる入力特徴量）に対し、各層に対応する学習済みの重み付け係数と応答関数等に基づく演算を行い、出力層から結果（各状況ラベルの尤度）を出力するよう動作する。

　状況遷移モデルに含まれるニューラルネットワークは、例えば、フィードフォワードニューラルネットワーク、畳み込みニューラルネットワーク等であってもよく、用いられるニューラルネットワークの種類は限定されない。

　図７は、状況遷移モデルの学習データの例を示す図である。図７に示すように、状況遷移モデルの学習のための学習データは、状況配列に対応する時系列のうちの一の時刻を遷移基準時ｔ１とし、当該遷移基準時に関連付けられた入力特徴量及び教師ラベルを含む。入力特徴量は、例えば、遷移基準時を基準とする相対時刻に関連付けられた状況ラベルの配列からなることができる。教師ラベルは、状況配列において、遷移基準時の次の時刻に割り当てられた状況ラベルである。

　第２モデル学習部は、遷移基準時以前の状況ラベルの時系列の配列を所定の手法により圧縮して、学習データにおける入力特徴量の状況ラベルの遷移を表す情報を生成してもよい。具体的には、第２モデル学習部１４は、遷移基準時以前の時系列の相対時刻と状況ラベルとの組の配列において、状況ラベルの遷移が発生した組のみを抽出（同じ状況ラベルが連続する配列を圧縮）して、入力特徴量としてもよい。例えば、第２モデル学習部１４は、相対時刻と状況ラベルとの組の配列［（０，Ａ），(１，Ａ）,（２，Ａ），（３，Ｂ），（４，Ｂ），（５，Ｂ）,（６，Ｃ）・・・］から、圧縮された配列［（０，Ａ），（３，Ｂ）（６，Ｃ）］を入力特徴量として抽出してもよい。

　図８は、状況遷移モデルの学習処理を示すフローチャートである。図８に示されるフローチャートは、後に説明する図１２のフローチャートにおけるステップＳ４の処理に相当する。

　ステップＳ４１において、第２モデル学習部１４は、状況割当部１２により生成された状況配列または状況割当更新部１５により更新された状況配列のうちの、同じ状況ラベルが連続する配列を圧縮する。なお、ステップＳ４１の状況ラベルの配列の圧縮の処理は、必須の処理ではない。

　ステップＳ４２において、第２モデル学習部１４は、状況配列に基づいて学習データを抽出する。

　ステップＳ４３において、第２モデル学習部１４は、ステップＳ４２において抽出された学習データを用いて、状況遷移モデルの学習を、いわゆる教師あり学習により実施する。具体的には、第２モデル学習部１４は、学習途中の状況遷移モデルに上述した入力特徴量を入力し、ニューラルネットワークを含む状況遷移モデルからの出力値及び教師ラベルに基づいて損失を算出し、算出された損失をニューラルネットワークに逆伝搬させ、ニューラルネットワークのパラメータ（重み）を更新する。本実施形態における状況遷移モデルの学習には、ニューラルネットワークを含むモデルに関する既知の学習手法を適用できる。

　ステップＳ４４において、第２モデル学習部１４は、学習結果であるパラメータを、状況遷移モデルＭ２として、第２モデル記憶部５０に保持する。

　状況割当更新部１５は、時系列のうちの各時刻に関して、状況推定モデル及び状況遷移モデルのそれぞれに基づいて各時刻の状況を推定し、推定されたそれぞれの状況に基づいて、各時刻に割り当てる状況ラベルを更新する。

　具体的には、状況割当更新部１５は、時系列のうちの各時刻の各状況に対する尤度を状況推定モデル及び状況遷移モデルのそれぞれに基づいて算出し、算出された各時刻の各状況に対する尤度に基づいて、各時刻に割り当てる状況ラベルを更新する。

　図９を参照して、状況割当更新部１５による、時系列のうちの各時刻の各状況に対する、状況推定モデルに基づく尤度の算出の例を説明する。状況割当更新部１５は、以下の式（１）により尤度を算出する。

図９（ａ）は、状況推定モデルの特徴パラメータの例を示す図である。具体的には、図９（ａ）に示される特徴パラメータは、時刻に関連付けられたセンサデータが、状況ラベル「３」に属する尤度を算出するための状況推定モデルを構成する。図９（ｂ）は、状況の推定対象のセンサデータの例を示す図である。

　センサデータｓｄが状況ラベル「３」に属する尤度を算出するために、状況割当更新部１５は、式（１）におけるΘ_ｋｕｔ、μ_ｕｔ及びＸ_ｕｔにそれぞれ、分散共分散行列ｐａ３の逆行列、平均値ｐｂ３及びセンサデータｓｄを適用して、尤度Πを算出する。

　図１０は、状況割当の更新の例を説明するための図である。推定結果ｒ１は、時系列中のある時刻ｔ及び時刻ｔに関連付けられたセンサデータに基づいて、学習により更新された状況推定モデルにより算出された、状況ラベル０，１，２のそれぞれに属する尤もらしさを示す尤度である。推定結果ｒ１は、例えば、式（１）を用いて算出される。推定結果ｒ２は、時刻ｔを遷移基準時として状況配列から抽出した入力特徴量に基づいて、学習により更新された状況遷移モデルにより算出された、状況ラベル０，１，２のそれぞれに属する尤もらしさを示す尤度である。

　状況割当更新部１５は、推定結果ｒ１及び推定結果ｒ２に基づいて、例えば、尤度の線形和を算出する。そして、状況割当更新部１５は、時刻ｔに割り当てるべき状況ラベルを、算出された各尤度の線形和のうち尤も値が大きい（負の対数尤度の線形和の値が尤も小さい）状況ラベル「０」に更新する。

　このように、各時刻の各状況に対する尤度が、状況推定モデル及び状況遷移モデルのそれぞれにより算出され、各モデルにより算出された尤度が併せて考慮されるので、状況配列における状況の割り当てが適切に更新される。例えば図１０に示す例において、仮に状況推定モデルのみを用いて状況割当を更新すると、状況ラベル「１」の尤度が最大であるので、時刻ｔの状況ラベルが「１」に更新されてしまう。本実施形態では、状況推定モデル及び状況遷移モデルの両方により算出された尤度が考慮されるので、時刻ｔの状況ラベルが「０」に適切に更新されることとなる。

　図１１は、全ユーザの状況割当の更新の処理の例を示すフローチャートである。ステップＳ５１において、状況割当更新部１５は、ユーザ数をカウントするための変数ｕを初期化するために０にする。ステップＳ５２において、状況割当更新部１５は、変数ｕがユーザ数未満であるか否かを判定する。変数ｕがユーザ数未満であると判定されなかった場合には状況割当の更新処理は終了する。一方、変数ｕがユーザ数未満であると判定された場合には処理はステップＳ５３に進む。

　ステップＳ５３において、状況割当更新部１５は、すべての状況ラベルｋについて時刻をカウントするための変数tを初期化するために０にする。ステップＳ５４において、状況割当更新部１５は、全ての状況ラベルｋについて、スコアＳ１（ｋ，ｕ，０）を算出する。スコアＳ１（ｋ，ｕ，ｔ）は、ユーザｕの時刻ｔにおけるセンサデータｖ（ｕ，ｔ）について、状況ラベルｋに関する状況推定モデルＭ１［ｋ］により生成されるスコアである。スコアＳ１は、その値が小さいほど、状況ラベルｋにより示される状況においてセンサデータｖが生じやすいことを示す。

　ステップＳ５５において、状況割当更新部１５は、全ての状況ラベルｋについて、スコアＳ２（ｋ，Ｈ（ｕ，ｋ，０））＝０とする。スコアＳ２は、時刻ｔ’（＜ｔ）の時刻と状況ラベルとの組の集合であるＨ（ｕ，ｋ，ｔ）及び状況遷移モデルＭ２に基づいて、状況ラベルｋに関して生成されるスコアである。スコアＳ２は、その値が小さいほど、状況ｋに遷移しやすいことを示す。

　ステップＳ５６において、状況割当更新部１５は、評価関数Ｇを用いて、Ｇ（Ｓ１，Ｓ２）を計算し、その値が最小となる状況ラベルを確定する。ここで、確定とは、その状況に至る状況の遷移を決定することを意味する。評価関数Ｇは、状況ｋの生起しやすさを示す指標であり、その値が小さいほど、状況ｋが生起しやすいことを示す。Ｇ（Ｓ１，Ｓ２）は、例えば、Ｓ１とＳ２との線形和であってもよい。

　ステップＳ５７において、状況割当更新部１５は、ステップＳ５５において確定された状況ラベルを、時刻と状況ラベルとの組の集合（配列）に追記することによりＨ（ｕ，ｋ，１）を取得する。そして、状況割当更新部１５は、取得したＨを用いて各状況ラベルｋに関するスコアＳ２を算出し、各状況ラベルｋ及びそのスコアＳ２を、未確定の状況として、候補リストに保持する。

　ステップＳ５８において、ｔ＝Ｔのいずれかの状況が確定されたか否かが判断され、確定されたと判断されるまでステップＳ５８，Ｓ６０～Ｓ６１の処理が繰り返される。確定されたと判断された場合には、処理はステップＳ５９に進む。

　ステップＳ６０において、状況割当更新部１５は、ステップＳ５７及びステップＳ６１において保持された候補リストを参照し、各状況ラベルに関するスコアＳ２を用いて状況評価関数Ｇ（Ｓ１，Ｓ２）を算出し、Ｇの値が最小となる状況ラベルを、確定した状況とする。

　ステップＳ６１において、状況割当更新部１５は、ステップＳ６０において確定された状況ラベルをＨ（ｕ，ｋ，ｔ）に追記し、Ｈ（ｕ，ｋ，ｔ）を用いて各状況ラベルｋに関するスコアＳ２を算出し、各状況ラベルｋ及びそのスコアＳ２を、候補リストに保持する。候補リストに、既に保持された未確定の状況がある場合には、スコアがより低い方を保持することとする。さらに、状況割当更新部１５は、確定した状況に関する変数ｔの値をインクリメントする。

　ステップＳ５９において、状況割当更新部１５は、確定された状況からなる遷移系列を、ユーザｕの最終的な状況の割り当てとして、状況配列を更新する。

　再び図１を参照して、出力部１６は、状況ラベルの更新に関する所定の条件が充足された場合に、状況推定モデル及び状況遷移モデルを出力する。状況ラベルの更新に関する所定の条件は、例えば、各モデルの学習及び状況配列の更新の処理において、状況配列における状況の割り当てに変化が発生せずに、各モデル及び状況配列が収束した場合である。

　出力部１６は、所定の条件が充足された場合に、例えば、状況推定モデル及び状況遷移モデルをそれぞれ第１モデル記憶部４０及び第２モデル記憶部５０に記憶させる。

　また、出力部１６は、状況ラベルの更新に関する所定の条件が充足された場合に、各時刻の状況ラベルが更新された状況配列をさらに出力してもよい。出力部１６は、例えば、状況割当記憶部３０に記憶させる。状況割当記憶部３０は、状況配列を記憶する記憶手段である。このように状況配列が出力されることにより、状況推定モデル及び状況遷移モデルにより推定された精度の高い状況配列を得ることが可能となる。

　状況予測部１７は、センサ情報を学習済みの状況推定モデル及び状況遷移モデルに入力して、現在時刻に至る状況の遷移を表す状況ラベルの配列からなる状況配列を取得する。出力部１６は、状況予測部１７により取得された状況配列を出力する。出力部１６は、状況予測部１７により取得された状況配列をユーザの端末に状況の推定結果として送信及び提供してもよい。

　このように、状況推定モデル及び状況遷移モデルに時系列のセンサデータからなるセンサ情報を入力することにより、現在時刻に至る状況の遷移を表す状況配列が出力されるので、高精度に推定されたユーザの状況を得ることができる。

　また、状況予測部１７は、状況遷移モデルに現在時刻に至る状況ラベルの配列からなる状況配列を入力して、現在時刻の次の時刻の状況ラベルを取得してもよい。出力部１６は、現在時刻の次の時刻の状況ラベルを出力する。出力部１６は、現在時刻の次の時刻の状況ラベルを、ユーザの未来の状況の予測結果として、ユーザの端末に送信及び提供してもよい。

　このように、現在時刻に至る状況配列を状況遷移モデルに入力することにより、現在時刻の次の時刻の状況ラベルが出力されるので、ユーザの現在以降の状況の高精度な予測が可能となる。

　また、状況予測部１７は、複数のユーザのそれぞれのセンサ情報を学習済みの状況推定モデル及び状況遷移モデルに入力することにより、複数の状況配列を取得できる。状況予測部１７は、取得された複数の状況配列に対して所定のデータマイニング処理を実施し、発生する頻度が上位の所定数のパターンの状況配列を取得する。状況予測部１７は、既知のいずれのデータマイニング処理を実施してもよい。状況予測部１７は、データ集合の中から，高頻度で発生する特徴的なパターンを見つける頻出パターン抽出、クラス分類、回帰分析及びクラスタリング等のデータマイニング処理を実施してもよい。また、取得される状況配列のパターンの数は、どのような数であってもよい。

　出力部１６は、状況予測部１７により取得された、発生する頻度が上位の所定数のパターンの状況配列を出力してもよい。センサ情報取得部１１により取得されるセンサ情報は、複数のセンサにより取得された時系列のセンサデータであるので、多次元の膨大なデータとなる場合がある。このような、多次元且つ膨大なデータに対してデータマイニング処理を実施すると、あるセンサデータにおいてユーザ間において僅かな差異があった場合でも、異なるパターンとして分類されてしまい、解釈が困難な分類結果が得られる場合がある。本実施形態によれば、センサ情報が状況推定モデル及び状況遷移モデルに入力されることにより、状況ラベルの配列といった１変数のシークエンスからなる情報に圧縮される。このようにセンサ情報が圧縮された状況配列に対してデータマイニングを実施することにより、有意且つ解釈用意な情報の提供が可能となる。

　図１２は、状況推定装置１０におけるモデル生成の局面の状況推定方法の処理内容を示すフローチャートである。

　ステップＳ１において、センサ情報取得部１１は、センサ情報を取得する。ステップＳ２において、状況割当部１２は、複数の状況ラベルのうちの一つを、各時刻及び当該時刻に関連付けられたセンサデータに対して、乱数に基づいてランダムに割り当てる。

　ステップＳ３において、第１モデル学習部１３は、ステップＳ２における状況の割り当てまたはステップＳ５における状況の割り当て（更新）に基づいて、状況推定モデルの学習及び更新を行う。ステップＳ３における処理は、例えば、図６に示されるフローチャートの処理に相当する。

　ステップＳ４において、第２モデル学習部１４は、ステップＳ２における状況の割り当てまたはステップＳ５における状況の割り当て（更新）に基づいて、状況遷移モデルの学習及び更新を行う。ステップＳ４における処理は、例えば、図８に示されるフローチャートの処理に相当する。

　ステップＳ５において、状況割当更新部１５は、学習及び更新された状況推定モデル及び状況遷移モデルによる、各時刻のセンサデータに対する状況ラベルの推定結果（例えば、各状況ラベルに属する尤度）に基づいて、状況配列における状況の割り当てを更新する。

　ステップＳ６において、状況割当更新部１５は、状況配列における状況の割り当てが変化したか否かを判定する。状況の割り当てが変化したと判定された場合には、処理はステップＳ３に戻る。一方、状況の割り当てが変化したと判定されなかった場合には、処理はステップＳ７に進む。

　ステップＳ７において、出力部１６は、状況推定モデル及び状況遷移モデル並びに状況配列を出力する。

　図１３は、現在時刻に至る状況の遷移を推定する状況推定方法の処理内容を示すフローチャートである。

　ステップＳ１１において、センサ情報取得部１１は、例えばユーザの端末において取得された時系列のセンサデータ群からなるセンサ情報を取得する。

　ステップＳ１２において、状況予測部１７は、センサ情報を学習済みの状況推定モデル及び状況遷移モデルに入力して、現在時刻ｔに至る状況の遷移を表す状況ラベルの配列からなる状況配列を推定する。

　ステップＳ１３において、出力部１６は、ステップＳ１２において推定された状況配列を、ユーザの状況の推定結果として、例えばユーザの端末に送信及び提供する。

　図１４は、現在時刻の次の時刻の状況を推定する状況推定方法の処理内容を示すフローチャートである。

　ステップＳ２１において、センサ情報取得部１１は、例えばユーザの端末において取得された時系列のセンサデータ群からなるセンサ情報を取得する。

　ステップＳ２２において、状況予測部１７は、センサ情報を学習済みの状況推定モデル及び状況遷移モデルに入力して、現在時刻ｔに至る状況の遷移を表す状況ラベルの配列からなる状況配列を推定する。

　ステップＳ２３において、状況予測部１７は、ステップＳ２２において推定された状況配列及び状況遷移モデルを用いて、時刻ｔ＋ｎの状況を予測する。

　ステップＳ２４において、出力部１６は、ステップＳ２３において予測された状況ラベルを、ユーザの未来の状況の予測結果として、例えばユーザの端末に送信及び提供する。

　次に、コンピュータを、本実施形態の状況推定装置１０として機能させるための状況推定プログラムについて説明する。図１５は、状況推定プログラムの構成を示す図である。

　状況推定プログラムＰ１は、状況推定装置１０における状況推定処理を統括的に制御するメインモジュールｍ１０、センサ情報取得モジュールｍ１１、状況割当モジュールｍ１２、第１モデル学習モジュールｍ１３、第２モデル学習モジュールｍ１４、状況割当更新モジュールｍ１５、出力モジュールｍ１６及び状況予測モジュールｍ１７を備えて構成される。そして、各モジュールｍ１１～ｍ１７により、状況推定装置１０におけるセンサ情報取得部１１、状況割当部１２、第１モデル学習部１３、第２モデル学習部１４、状況割当更新部１５、出力部１６及び状況予測部１７のための各機能が実現される。なお、状況推定プログラムＰ１は、通信回線等の伝送媒体を介して伝送される態様であってもよいし、図１５に示されるように、記録媒体Ｍ１に記憶される態様であってもよい。

　以上説明した本実施形態の状況推定装置１０、状況推定方法及び状況推定プログラムＰ１では、時系列に取得されたセンサデータに対して仮に割り当てられた状況ラベルの配列である状況配列に基づいて、各時刻に関連付けられたセンサデータを複数の状況のうちのいずれかに分類する状況推定モデルが、同じ状況ラベルが割り当てられたセンサデータの特徴パラメータを算出することによる教師なし学習により構築されると共に、時系列の状況の遷移に基づいて次の状況を推定する状況遷移が構築される。そして、状況推定モデル及び状況遷移モデルのそれぞれにより出力された状況の推定結果に基づいて、状況の遷移を表す状況配列が更新され、更新された状況配列に基づいて状況推定モデル及び状況遷移モデルの学習が実施されるので、学習に供するためのユーザによる状況の情報の入力を要さずに、高精度な状況の推定及びユーザの状況を推定するモデルの構築が可能となる。

　また、別の形態に係る状況推定装置では、特徴パラメータは、１以上の種類のセンサデータの平均値及び分散共分散行列のうちの少なくとも一つを含むこととしてもよい。

　上記形態によれば、同じ状況ラベルが割り当てられたセンサデータの特徴が適切に特徴パラメータに表されることとなるので、高精度な状況の割り当てが可能な第１モデルを構築できる。

　また、別の形態に係る状況推定装置では、状況割当更新部は、時系列のうちの各時刻の各状況に対する尤度を第１モデル及び第２モデルのそれぞれに基づいて算出し、算出された各時刻の各状況に対する尤度に基づいて、各時刻に割り当てる状況ラベルを更新することとしてもよい。

　上記形態によれば、各時刻の各状況に対する尤度が、第１モデル及び第２モデルのそれぞれにより算出され、各モデルにより算出された尤度が併せて考慮されるので、状況配列における状況の割り当てが適切に更新される。

　また、別の形態に係る状況推定装置では、出力部は、各時刻の状況ラベルが更新された状況配列を出力することとしてもよい。

　上記形態によれば、第１モデル及び第２モデルにより推定された精度の高い状況配列を得ることが可能となる。

　また、別の形態に係る状況推定装置では、状況割当部は、乱数に基づいて、各時刻及び当該時刻に関連付けられた１以上の種類のセンサデータに対して、状況ラベルを割り当てることとしてもよい。

　上記形態によれば、第１モデル及び第２モデルの学習に好適な仮の状況配列が得られる。

　また、別の形態に係る状況推定装置では、第２モデル学習部は、遷移基準時以前の状況ラベルの時系列の配列を所定の手法により圧縮して、学習データにおける入力特徴量の状況ラベルの遷移を表す情報を生成することとしてもよい。

　上記形態によれば、第２モデルの学習に供する入力特徴量のサイズを削減できるので、第２モデルの学習処理の負荷軽減が可能となる。

　また、上記課題を解決するために、本発明の一形態に係る状況推定プログラムは、コンピュータを、センサにより検知されるセンサデータに基づいてユーザの状況を推定する状況推定装置として機能させるための状況推定プログラムであって、コンピュータに、少なくとも一つのセンサにより取得された時系列のセンサデータ群からなるセンサ情報を取得するセンサ情報取得機能と、ユーザの状況のそれぞれを識別する状況ラベルのうちの一つを、各時刻及び当該時刻に関連付けられた１以上のセンサデータに対して、所定の手法により仮に割り当てる状況割当機能と、同じ状況ラベルが割り当てられたセンサデータの特徴を表す特徴パラメータを算出して、各時刻に関連付けられたセンサデータを複数の状況のうちのいずれかの状況に分類する第１モデルの学習を行う第１モデル学習機能と、各時刻に割り当てられた状況ラベルの時系列の配列からなる状況配列から、時系列中の一の時刻を遷移基準時として遷移基準時以前の状況ラベルの遷移を表す情報及び遷移基準時の次の時刻に割り当てられた状況ラベルをそれぞれ入力特徴量及び教師ラベルとして抽出し、抽出した入力特徴量及び教師ラベル含む学習データに基づく機械学習により、遷移基準時以前の状況ラベルの遷移を入力とし遷移基準時の次の時刻の状況ラベルを出力とする第２モデルの学習を行う第２モデル学習機能と、時系列のうちの各時刻に関して、第１モデル及び第２モデルのそれぞれに基づいて各時刻の状況を推定し、推定されたそれぞれの状況に基づいて、各時刻に割り当てる状況ラベルを更新する状況割当更新機能と、状況ラベルの更新に関する所定の条件が充足された場合に、第１モデル及び第２モデルを出力する出力機能と、を実現させる。

　上記の形態のプログラムによれば、時系列に取得されたセンサデータに対して仮に割り当てられた状況ラベルの配列である状況配列に基づいて、各時刻に関連付けられたセンサデータを複数の状況のうちのいずれかに分類する第１モデルが、同じ状況ラベルが割り当てられたセンサデータの特徴パラメータを算出することによる教師なし学習により構築されると共に、時系列の状況の遷移に基づいて次の状況を推定する第２モデルが構築される。そして、第１モデル及び第２モデルのそれぞれにより出力された状況の推定結果に基づいて、状況の遷移を表す状況配列が更新され、更新された状況配列に基づいて第１モデル及び第２モデルの学習が実施されるので、学習に供するためのユーザによる状況の情報の入力を要さずに、高精度な状況の推定及びユーザの状況を推定するモデルの構築が可能となる。

　上記課題を解決するために、本発明の一形態に係る学習済みの推定モデルは、センサにより検知されるセンサデータに基づいてユーザの状況を推定する状況推定装置において、ユーザの状況を推定するよう、コンピュータを機能させるための学習済みの推定モデルであって、推定モデルは、第１モデル及び第２モデルを含み、第１モデルは、各時刻に関連付けられた１以上の種類のセンサデータを複数の状況のうちのいずれかの状況に分類するモデルであって、少なくとも一つの種類のセンサにより取得された時系列のセンサデータ群からなるセンサ情報に基づいてユーザの状況のそれぞれを識別する状況ラベルのうちの一つが割り当てられた、各時刻及び当該時刻に関連付けられた１以上の種類のセンサデータに基づいて、同じ状況ラベルが割り当てられた時刻に関連付けられたセンサデータの特徴を表す特徴パラメータを算出する、教師なし学習により構成され、第２モデルは、各時刻に割り当てられた状況ラベルの時系列の配列からなる状況配列から、時系列中の一の時刻を遷移基準時として遷移基準時以前の状況ラベルの遷移を表す情報及び遷移基準時の次の時刻に割り当てられた状況ラベルをそれぞれ入力特徴量及び教師ラベルとして抽出し、抽出した入力特徴量及び教師ラベル含む学習データに基づく機械学習により構成され、遷移基準時以前の状況の遷移を入力とし遷移基準時の次の時刻の状況を出力とするモデルであり、時系列のうちの各時刻に関して、第１モデル及び第２モデルのそれぞれに基づいて各時刻の状況を推定し、推定されたそれぞれの状況に基づいて更新された各時刻の状況ラベルに基づいて、第１モデル及び第２モデルのそれぞれの学習が行われる。

　上記の形態によれば、時系列に取得されたセンサデータに対して割り当てられた状況ラベルの配列である状況配列に基づいて、同じ状況ラベルが割り当てられたセンサデータの特徴パラメータを算出することによる教師なし学習により、各時刻に関連付けられたセンサデータを複数の状況のうちのいずれかに分類する第１モデルが構築されると共に、時系列の状況の遷移に基づいて次の状況を推定する第２モデルが構築され、第１モデル及び第２モデルのそれぞれにより出力された状況の推定結果に基づいて、状況の遷移を表す状況配列が更新され、更新された状況配列に基づいて学習された第１モデル及び第２モデルを含む推定モデルが得られる。従って、学習に供するためのユーザによる状況の情報の入力を要さずに、高精度な状況の推定が可能なモデルを得ることが可能となる。

　また、本発明の一形態に係る状況推定方法は、センサにより検知されるセンサデータに基づいてユーザの状況を推定する状況推定装置における状況推定方法であって、少なくとも一つの種類のセンサにより取得された、現在時刻に至るまでの時系列のセンサデータ群からなるセンサ情報を取得するセンサ情報取得ステップと、センサ情報を、上記の推定モデルに入力して、現在時刻に至る状況の遷移を表す状況ラベルの配列からなる状況配列を取得する状況予測ステップと、状況予測ステップにおいて取得された状況配列を出力する出力ステップと、を有する。

　また、本発明の一形態に係る状況推定装置は、センサにより検知されるセンサデータに基づいてユーザの状況を推定する状況推定装置であって、少なくとも一つの種類のセンサにより取得された、現在時刻に至るまでの時系列のセンサデータ群からなるセンサ情報を取得するセンサ情報取得部と、センサ情報を、上記の推定モデルに入力して、現在時刻に至る状況の遷移を表す状況ラベルの配列からなる状況配列を取得する状況予測部と、状況予測部において取得された状況配列を出力する出力部と、を備える。

　上記の形態によれば、上記推定モデルに時系列のセンサデータを入力することにより、現在時刻に至る状況の遷移を表す状況配列が出力されるので、高精度に推定されたユーザの状況を得ることができる。

　また、別の形態に係る状況推定方法は、状況予測ステップにおいて、推定モデルの第２モデルに、現在時刻に至る状況ラベルの配列からなる状況配列を入力して、現在時刻の次の時刻の状況ラベルを取得し、出力ステップにおいて、状況予測ステップにおいて取得された現在時刻の次の時刻の状況ラベルを出力する。

　上記の形態によれば、現在時刻に至る状況配列を第２モデルに入力することにより、現在時刻の次の時刻の状況ラベルが出力されるので、ユーザの現在以降の状況の高精度な予測が可能となる。

　また、別の形態に係る状況推定装置では、状況予測部は、複数のユーザのそれぞれのセンサ情報を推定モデルに入力することにより取得された複数の状況配列に対して所定のデータマイニング処理を実施し、発生する頻度が上位の所定数のパターンの状況配列を取得し、出力部は、所定数のパターンの状況配列を出力する。

　上記の形態によれば、時系列のセンサデータ群が、状況ラベルの配列として１変数の情報により表された状況配列がデータマイニング処理に供され、データマイニングにより得られた所定数のパターンの状況配列が出力されるので、有意且つ解釈用意な情報の提供が可能となる。

　以上、本実施形態について詳細に説明したが、当業者にとっては、本実施形態が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本実施形態は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本実施形態に対して何ら制限的な意味を有するものではない。

　本明細書で説明した各態様／実施形態は、ＬＴＥ（Long　Term　Evolution）、ＬＴＥ－Ａ（LTE-Advanced）、ＳＵＰＥＲ　３Ｇ、ＩＭＴ－Ａｄｖａｎｃｅｄ、４Ｇ、５Ｇ、ＦＲＡ（Future　Radio　Access）、Ｗ－ＣＤＭＡ（登録商標）、ＧＳＭ（登録商標）、ＣＤＭＡ２０００、ＵＭＢ（Ultra　Mobile　Broadband）、ＩＥＥＥ　８０２．１１（Ｗｉ－Ｆｉ）、ＩＥＥＥ　８０２．１６（ＷｉＭＡＸ）、ＩＥＥＥ　８０２．２０、ＵＷＢ（Ultra-WideBand）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、その他の適切なシステムを利用するシステム及び／又はこれらに基づいて拡張された次世代システムに適用されてもよい。

　本明細書で説明した各態様／実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。

　入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理してもよい。入出力される情報等は、上書き、更新、または追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。

　判定は、１ビットで表される値（０か１か）によって行われてもよいし、真偽値（Boolean：trueまたはfalse）によって行われてもよいし、数値の比較（例えば、所定の値との比較）によって行われてもよい。

　本明細書で説明した各態様／実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知（例えば、「Ｘであること」の通知）は、明示的に行うものに限られず、暗黙的（例えば、当該所定の情報の通知を行わない）ことによって行われてもよい。

　以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。

　ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。

　また、ソフトウェア、命令などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線（ＤＳＬ）などの有線技術及び／又は赤外線、無線及びマイクロ波などの無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び／又は無線技術は、伝送媒体の定義内に含まれる。

　本開示において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。

　なお、本開示において説明した用語及び／又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。

　本明細書で使用する「システム」および「ネットワーク」という用語は、互換的に使用される。

　また、本明細書で説明した情報、パラメータなどは、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。

　本開示で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking　up、search、inquiry)（例えば、テーブル、データベース又は別のデータ構造での探索）、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)（例えば、情報を受信すること）、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)（例えば、メモリ中のデータにアクセスすること）した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断（決定）」は、「想定する（assuming）」、「期待する（expecting）」、「みなす（considering）」などで読み替えられてもよい。

　本開示で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。

　本明細書で「第１の」、「第２の」などの呼称を使用した場合においては、その要素へのいかなる参照も、それらの要素の量または順序を全般的に限定するものではない。これらの呼称は、２つ以上の要素間を区別する便利な方法として本明細書で使用され得る。したがって、第１および第２の要素への参照は、２つの要素のみがそこで採用され得ること、または何らかの形で第１の要素が第２の要素に先行しなければならないことを意味しない。

　「含む（include）」、「含んでいる（including）」、およびそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「または（or）」は、排他的論理和ではないことが意図される。

　本明細書において、文脈または技術的に明らかに1つのみしか存在しない装置である場合以外は、複数の装置をも含むものとする。

　本開示の全体において、文脈から明らかに単数を示したものではなければ、複数のものを含むものとする。

　１…状況推定システム、１０…状況推定装置、１１…センサ情報取得部、１２…状況割当部、１３…第１モデル学習部、１４…第２モデル学習部、１５…状況割当更新部、１６…出力部、１７…状況予測部、２０…センサ情報記憶部、３０…状況割当記憶部、４０…第１モデルモデル記憶部、５０…第２モデルモデル記憶部、Ｍ１…記録媒体、ｍ１０…メインモジュール、ｍ１１…センサ情報取得モジュール、ｍ１２…状況割当モジュール、ｍ１３…第１モデル学習モジュール、ｍ１４…第２モデル学習モジュール、ｍ１５…状況割当更新モジュール、ｍ１６…出力モジュール、ｍ１７…状況予測モジュール、Ｐ１…状況推定プログラム。

Claims

　センサにより検知されるセンサデータに基づいてユーザの状況を推定する状況推定装置であって、
　少なくとも一つのセンサにより取得された時系列のセンサデータ群からなるセンサ情報を取得するセンサ情報取得部と、
　ユーザの状況のそれぞれを識別する状況ラベルのうちの一つを、各時刻及び当該時刻に関連付けられた１以上のセンサデータに対して、所定の手法により仮に割り当てる状況割当部と、
　同じ状況ラベルが割り当てられたセンサデータの特徴を表す特徴パラメータを算出して、各時刻に関連付けられた前記センサデータを複数の状況のうちのいずれかの状況に分類する第１モデルの学習を行う第１モデル学習部と、
　各時刻に割り当てられた前記状況ラベルの時系列の配列からなる状況配列から、前記時系列中の一の時刻を遷移基準時として前記遷移基準時以前の前記状況ラベルの遷移を表す情報及び前記遷移基準時の次の時刻に割り当てられた状況ラベルをそれぞれ入力特徴量及び教師ラベルとして抽出し、抽出した前記入力特徴量及び前記教師ラベル含む学習データに基づく機械学習により、前記遷移基準時以前の状況ラベルの遷移を入力とし前記遷移基準時の次の時刻の状況ラベルを出力とする第２モデルの学習を行う第２モデル学習部と、
　前記時系列のうちの各時刻に関して、前記第１モデル及び前記第２モデルのそれぞれに基づいて各時刻の状況を推定し、推定されたそれぞれの状況に基づいて、各時刻に割り当てる状況ラベルを更新する状況割当更新部と、
　前記状況ラベルの更新に関する所定の条件が充足された場合に、前記第１モデル及び前記第２モデルを出力する出力部と、
　を備える状況推定装置。
　前記特徴パラメータは、前記１以上の種類のセンサデータの平均値及び分散共分散行列のうちの少なくとも一つを含む、
　請求項１に記載の状況推定装置。
　前記状況割当更新部は、前記時系列のうちの各時刻の各状況に対する尤度を前記第１モデル及び前記第２モデルのそれぞれに基づいて算出し、算出された各時刻の各状況に対する尤度に基づいて、各時刻に割り当てる状況ラベルを更新する、
　請求項１または２に記載の状況推定装置。
　前記出力部は、各時刻の状況ラベルが更新された前記状況配列を出力する、
　請求項１～３のいずれか一項に記載の状況推定装置。
　前記状況割当部は、乱数に基づいて、各時刻及び当該時刻に関連付けられた１以上の種類のセンサデータに対して、前記状況ラベルを割り当てる、
　請求項１～４のいずれか一項に記載の状況推定装置。
　前記第２モデル学習部は、前記遷移基準時以前の状況ラベルの時系列の配列を所定の手法により圧縮して、前記学習データにおける前記入力特徴量の前記状況ラベルの遷移を表す情報を生成する、
　請求項１～５のいずれか一項に記載の状況推定装置。
　コンピュータを、センサにより検知されるセンサデータに基づいてユーザの状況を推定する状況推定装置として機能させるための状況推定プログラムであって、
　前記コンピュータに、
　少なくとも一つのセンサにより取得された時系列のセンサデータ群からなるセンサ情報を取得するセンサ情報取得機能と、
　ユーザの状況のそれぞれを識別する状況ラベルのうちの一つを、各時刻及び当該時刻に関連付けられた１以上のセンサデータに対して、所定の手法により仮に割り当てる状況割当機能と、
　同じ状況ラベルが割り当てられたセンサデータの特徴を表す特徴パラメータを算出して、各時刻に関連付けられた前記センサデータを複数の状況のうちのいずれかの状況に分類する第１モデルの学習を行う第１モデル学習機能と、
　各時刻に割り当てられた前記状況ラベルの時系列の配列からなる状況配列から、前記時系列中の一の時刻を遷移基準時として前記遷移基準時以前の前記状況ラベルの遷移を表す情報及び前記遷移基準時の次の時刻に割り当てられた状況ラベルをそれぞれ入力特徴量及び教師ラベルとして抽出し、抽出した前記入力特徴量及び前記教師ラベル含む学習データに基づく機械学習により、前記遷移基準時以前の状況ラベルの遷移を入力とし前記遷移基準時の次の時刻の状況ラベルを出力とする第２モデルの学習を行う第２モデル学習機能と、
　前記時系列のうちの各時刻に関して、前記第１モデル及び前記第２モデルのそれぞれに基づいて各時刻の状況を推定し、推定されたそれぞれの状況に基づいて、各時刻に割り当てる状況ラベルを更新する状況割当更新機能と、
　前記状況ラベルの更新に関する所定の条件が充足された場合に、前記第１モデル及び前記第２モデルを出力する出力機能と、
　を実現させる状況推定プログラム。
　センサにより検知されるセンサデータに基づいてユーザの状況を推定する状況推定装置において、ユーザの前記状況を推定するよう、コンピュータを機能させるための学習済みの推定モデルであって、
　前記推定モデルは、第１モデル及び第２モデルを含み、
　前記第１モデルは、
　各時刻に関連付けられた前記１以上の種類のセンサデータを複数の状況のうちのいずれかの状況に分類するモデルであって、
　少なくとも一つの種類のセンサにより取得された時系列のセンサデータ群からなるセンサ情報に基づいてユーザの状況のそれぞれを識別する状況ラベルのうちの一つが割り当てられた、各時刻及び当該時刻に関連付けられた１以上の種類のセンサデータに基づいて、同じ状況ラベルが割り当てられた時刻に関連付けられたセンサデータの特徴を表す特徴パラメータを算出する、教師なし学習により構成され、
　前記第２モデルは、
　各時刻に割り当てられた前記状況ラベルの時系列の配列からなる状況配列から、前記時系列中の一の時刻を遷移基準時として前記遷移基準時以前の前記状況ラベルの遷移を表す情報及び前記遷移基準時の次の時刻に割り当てられた状況ラベルをそれぞれ入力特徴量及び教師ラベルとして抽出し、抽出した前記入力特徴量及び前記教師ラベル含む学習データに基づく機械学習により構成され、
前記遷移基準時以前の状況の遷移を入力とし前記遷移基準時の次の時刻の状況を出力とするモデルであり、
　前記時系列のうちの各時刻に関して、前記第１モデル及び前記第２モデルのそれぞれに基づいて各時刻の状況を推定し、推定されたそれぞれの状況に基づいて更新された各時刻の状況ラベルに基づいて、前記第１モデル及び前記第２モデルのそれぞれの学習が行われる、
　推定モデル。
　センサにより検知されるセンサデータに基づいてユーザの状況を推定する状況推定装置における状況推定方法であって、
　少なくとも一つの種類のセンサにより取得された、現在時刻に至るまでの時系列のセンサデータ群からなるセンサ情報を取得するセンサ情報取得ステップと、
　前記センサ情報を、請求項８に記載の推定モデルに入力して、前記現在時刻に至る状況の遷移を表す前記状況ラベルの配列からなる前記状況配列を取得する状況予測ステップと、
　前記状況予測ステップにおいて取得された前記状況配列を出力する出力ステップと、
　を有する状況推定方法。
　前記状況予測ステップにおいて、前記推定モデルの前記第２モデルに、前記現在時刻に至る前記状況ラベルの配列からなる前記状況配列を入力して、前記現在時刻の次の時刻の前記状況ラベルを取得し、
　前記出力ステップにおいて、前記状況予測ステップにおいて取得された前記現在時刻の次の時刻の前記状況ラベルを出力する、
　請求項９に記載の状況推定方法。
　センサにより検知されるセンサデータに基づいてユーザの状況を推定する状況推定装置であって、
　少なくとも一つの種類のセンサにより取得された、現在時刻に至るまでの時系列のセンサデータ群からなるセンサ情報を取得するセンサ情報取得部と、
　前記センサ情報を、請求項８に記載の推定モデルに入力して、前記現在時刻に至る状況の遷移を表す前記状況ラベルの配列からなる前記状況配列を取得する状況予測部と、
　前記状況予測部において取得された前記状況配列を出力する出力部と、
　を備える状況推定装置。
　前記状況予測部は、複数のユーザのそれぞれの前記センサ情報を前記推定モデルに入力することにより取得された複数の前記状況配列に対して所定のデータマイニング処理を実施し、発生する頻度が上位の所定数のパターンの状況配列を取得し、
　前記出力部は、前記所定数のパターンの前記状況配列を出力する、
　請求項１１に記載の状況推定装置。