JP2016157196A - 学習データ生成システム、学習データ生成方法およびプログラム - Google Patents

学習データ生成システム、学習データ生成方法およびプログラム Download PDF

Info

Publication number
JP2016157196A
JP2016157196A JP2015033239A JP2015033239A JP2016157196A JP 2016157196 A JP2016157196 A JP 2016157196A JP 2015033239 A JP2015033239 A JP 2015033239A JP 2015033239 A JP2015033239 A JP 2015033239A JP 2016157196 A JP2016157196 A JP 2016157196A
Authority
JP
Japan
Prior art keywords
data
behavior
action
user
learning data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015033239A
Other languages
English (en)
Other versions
JP6461639B2 (ja
Inventor
淳 松野
Atsushi Matsuno
淳 松野
啓一郎 帆足
Keiichiro Hoashi
啓一郎 帆足
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2015033239A priority Critical patent/JP6461639B2/ja
Publication of JP2016157196A publication Critical patent/JP2016157196A/ja
Application granted granted Critical
Publication of JP6461639B2 publication Critical patent/JP6461639B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】半教師あり学習を行動認識に適用するときに、滞在場所属性ごとの特徴的な行動に基づいて誤った行動ラベルを訂正することにより、信頼度の高い行動認識のための学習データを生成する。【解決手段】学習データ生成手段が、行動データ、行動特性、地図データを取得し、取得した行動データを滞在地点ごとに分類し、取得した地図データから滞在場所ごとに滞在場所属性を特定し、取得した行動特性から特徴的な行動を求める。次に、滞在地点ごとに各ユーザに対して、最も高い頻度で認識された行動を取得した行動データから求め、各ユーザに対して滞在地点ごとに特徴的な行動と最も高い頻度で認識された行動とを比較して、一致しない場合に、最も高い頻度で認識された行動のラベルを特徴的な行動のラベルで訂正する。そして、各ユーザに対して訂正したラベルを含む行動データからユーザID、行動ラベルおよび特徴量を抽出した学習データを生成する。【選択図】図4

Description

本発明は、半教師あり学習をユーザの行動認識に適用するときに、滞在場所属性ごとの特徴的な行動に基づいて誤った行動ラベルを訂正することにより、行動識別精度を向上させ、信頼度の高い行動認識のための学習データを生成する学習データ生成システム、学習データ生成方法およびプログラムに関する。
従来、スマートフォンやウェアラブルデバイスといった携帯端末装置から収集されるモーションデータや音声データを用いることにより、ユーザ行動を認識する方式が提案されている。このような方式は、主に、教師あり学習に基づくものであるが、大量のラベル付データを作成するためのコストが課題となっている。この課題に対して、半教師あり学習の1つであるself−trainingが効果的であることが知られている。self−trainingは、少数のラベル付データから生成可能な識別器と大量のラベル無しデータとから、大量のラベル付データを作成することを可能とする。
ここで、大量のラベル無しデータは、日常生活で容易に収集可能である。しかしながら、ラベル無しデータに誤った行動ラベルを付与してしまうと、識別器の認識精度が低下する恐れがある。そのため、非特許文献1では、ルールの中に信頼度を設け、付与ラベルの信頼度を決定するために、決定木学習においてラベル選択のための知識に付与されている信頼度を用いている。つまり、信頼度の高い知識に基づいて選択された行動ラベルは、信頼度の高いラベルと判断する。
また、非特許文献2では、複数の異なる学習器の複数のアルゴリズムによる行動ラベル選択結果を多数決により集約することによって、信頼度の高いラベル付与を可能としている。
Exploring Semi−Supervised and Active Learning for Activity Recognition ;12th IEEE International Symposium on Wearable Computers、2008.;M.Stikic、et al. Activity Recognition Based on Semi−Supervised Learning ;13th IEEE International Conference on Embedded and Real−Time Computing Systems and Applications、2007;D.Guan、et al. The Impact of Personalizationon Smartphone−Based Activity Recognition;Technical report、Workshop on Activity Context Representation、2012.;G.M.Weisss and J.W.Lockhart.
しかしながら、非特許文献1、2のいずれにおいても、ユーザ自身の識別器のラベル選択結果のみに基づいて、信頼度の高いラベルを選択しているため、初期段階で識別器の認識精度が低い場合には、誤ったラベルを選択してしまう可能性が高く、認識精度が向上しないという問題がある。これは、サンプル数が限定的であるために生じる問題である。
ここで、self−trainingでは、最初の識別器が他ユーザのラベル付データから生成されることが一般的である。この点で、ユーザによっては、初期段階においての識別器の認識精度が低く、self−trainingで認識精度を向上させることが困難となる。なぜなら、非特許文献3によれば、ユーザ自身のラベル付データのみを用いた場合は、高い精度で行動を識別可能であるが、一方で、他ユーザのラベル付データを用いた場合には、行動識別精度が高いユーザも存在すれば、行動識別精度が著しく低いユーザも存在することが知られているからである。
以上のことから、self−trainingを行動認識に適用するときに、初期段階でユーザの行動に対する識別器の認識精度が低いと、日常生活で収集可能なユーザ自身のラベル無しデータを利用したとしても、識別器の行動認識精度が向上しないという問題がある。
そこで、本発明は、上述の課題に鑑みてなされたものであり、半教師あり学習を行動認識に適用するときに、滞在場所属性ごとの特徴的な行動に基づいて誤った行動ラベルを訂正することにより、行動識別精度を向上させ、信頼度の高い行動認識のための学習データを生成する学習データ生成装置、学習データ生成システム、学習データ生成方法およびプログラムを提供することを目的とする。
本発明は、上述の課題を解決するために、以下の事項を提案している。
本発明は、self−trainingを行動認識に適用するときに、滞在場所属性ごとの特徴的な行動(行動特性)に基づいて誤った行動ラベルを訂正することにより、行動識別精度を向上させ、信頼度の高い学習データ(ラベル付データ)を生成するものである。
つまり、self−trainingでは、初期段階でユーザ行動に対する識別器の認識精度が低いと、誤ったラベルを選択し続ける可能性が高い。そのような識別器の認識精度を向上させるためには、誤りラベルを訂正することが求められる。そこで、一般的な人の行動特性(ユーザ自身の行動特性)から正しい行動ラベルを特定し、誤りラベルを訂正する方式(本願の第1の実施形態)を提案する。人の行動特性とは、人が滞在場所属性ごとに特徴的な行動をとることを指す。例えば、書店では読書、飲食店では食事、映画館では映像視聴などである。すなわち、滞在場所属性が分かれば、その場所で高頻度に発生する行動を知ることができる。識別器の誤り方が一定であるとすれば(ある行動に対して同じ行動に誤認識する)、人の行動特性に基づいて誤りラベルを訂正できる。例えば、飲食店での食事に対して映像視聴であると識別器が高い割合で誤認識した場合を考える。ここで、飲食店では、人は食事という行動をとるはずであるため、映像視聴は食事の誤りであると判断し、映像視聴を食事に訂正する。なお、滞在場所属性は、ユーザの滞在地点(緯度、経度)と地図情報から取得することが可能である。
しかし、先に提案した方式では、滞在場所属性ごとに人の行動特性を把握する必要がある.また、地図情報の整備という点でも実施者に対する負荷が高い。そのため、人の行動特性と地図情報を用いない方式(本願の第2の実施形態)を提案する。この方式では、ユーザ自身だけでなく他ユーザの識別器の認識結果に基づいて、滞在地点の特徴的な行動(行動特性)を特定することにより、誤りラベルを訂正する。self−trainingを行動認識に適用すると、識別器の認識精度が低いユーザが存在する一方で、認識精度が高いユーザも存在する。そのため、認識精度の高いユーザの行動に対する認識結果に従えば、滞在地点の特徴的な行動を特定できる。そこで、ある滞在地点で、ユーザの最高頻度で発生した行動認識結果を多数決で集約し、多数派に属する行動認識結果を特徴的な行動と特定する。そして、少数派に属する行動認識結果のラベルを特徴的な行動のラベルで訂正する。ここで、多数派への得票率が設定した閾値以上である場合にのみ正しくラベルを訂正できる可能性が高いと見なし、誤ったラベルを訂正することも可能である。すなわち、この発明によれば、初期段階でユーザの行動に対する識別器の認識精度が低い場合でも、日常生活で収集可能なユーザ自身のラベル無しデータを利用することにより、識別器の行動認識精度を向上を可能とした学習データ生成システム、学習データ生成方法およびプログラムを提供することができる。
(1)本発明は、各ユーザの携帯端末とサーバとからなる学習データ生成システムであって、前記各ユーザの携帯端末が、前記サーバから入力した行動認識モデルと、モーションデータあるいは音データのいずれかとに基づいて前記ユーザの行動を認識する行動認識手段と、前記ユーザが携帯端末を操作しているかどうかを判定する操作判定手段と、前記ユーザの位置情報を検知する位置情報検知手段と、前記行動認識手段により認識された行動認識データ、前記携帯端末の操作状況、前記位置情報に基づいて、前記ユーザの行動データを生成する行動データ生成手段と、を備え、前記サーバが、前記行動データ生成手段が生成した前記各ユーザの行動データを格納する行動データ記憶手段と、滞在場所ごとの特徴的な行動である行動特性を格納する行動特性記憶手段と、地図情報を格納する地図データ記憶手段と、前記行動データ、行動特性、地図データに基づいて、前記ユーザの行動を認識するための学習データを生成する学習データ生成手段と、該生成した学習データを格納する学習データ記憶手段と、該格納された学習データに基づいて行動認識モデルを生成する行動認識モデル生成手段と、を備えたことを特徴とする学習データ生成システムを提案している。
(2)本発明は、(1)の学習データ生成システムについて、前記学習データ生成手段は、前記位置情報から算出した滞在地点と前記地図データとから滞在場所属性を特定し、該滞在場所属性と前記行動特性から滞在地点での特徴的な行動を求めることを特徴とする学習データ生成システムを提案している。
(3)本発明は、(2)の学習データ生成システムについて、前記行動データが、少なくとも、ユーザID、日時、行動ラベル、位置情報、特徴量で構成され、前記学習データ生成手段は、前記特徴的な行動と前記行動認識手段による認識結果とを比較し、一致していない場合には、該認識結果に対応する前記行動ラベルを前記特徴的な行動を示す行動ラベルで訂正して、学習データを生成することを特徴とする学習データ生成システムを提案している。
(4)本発明は、各ユーザの携帯端末とサーバとからなる学習データ生成システムであって、前記各ユーザの携帯端末が、前記サーバから入力した行動認識モデルと、モーションデータあるいは音データのいずれかとに基づいて前記ユーザの行動を認識する行動認識手段と、前記ユーザが携帯端末を操作しているかどうかを判定する操作判定手段と、前記ユーザの位置情報を検知する位置情報検知手段と、前記行動認識手段により認識された行動認識データ、前記携帯端末の操作状況、前記位置情報に基づいて、前記ユーザの行動データを生成する行動データ生成手段と、を備え、前記サーバが、前記行動データ生成手段が生成した前記各ユーザの行動データを格納する行動データ記憶手段と、前記行動データに基づいて、前記ユーザの行動を認識するための学習データを生成する学習データ生成手段と、該生成した学習データを格納する学習データ記憶手段と、該格納された学習データに基づいて行動認識モデルを生成する行動認識モデル生成手段と、を備えたことを特徴とする学習データ生成システムを提案している。
(5)本発明は、(4)の学習データ生成システムについて、前記行動データが、少なくとも、ユーザID、日時、行動ラベル、位置情報、特徴量で構成され、前記学習データ生成手段は、同一滞在地点における全ユーザから最高頻度で認識された前記行動ラベルを多数決で決定し、最も得票数を得た多数派の前記行動ラベルを滞在地点における特徴的な行動と見なすことを特徴とする学習データシステムを提案している。
(6)本発明は、(5)の学習データ生成システムについて、前記学習データ生成手段は、数1から多数決の前記得票数を計算することを特徴とする学習データ生成システムを提案している。
(7)本発明は、(6)の学習データ生成システムについて、前記学習データ生成手段は、同一滞在地点において前記多数決で少数派であった行動ラベルを多数派の前記行動ラベルで訂正し、学習データを生成することを特徴とする学習データ生成システム。
(8)本発明は、(7)の学習データ生成システムについて、前記学習データ生成手段は、多数決の前記得票率が事前に設定した閾値以上である場合にのみ、少数派の前記行動ラベルを訂正することにより、学習データを生成することを特徴とする学習データ生成システムを提案している。
(9)本発明は、(8)の学習データ生成システムについて、前記学習データ生成手段は、数2から多数決の前記得票率を計算することを特徴とする学習データ生成システムを提案している。
(10)本発明は、各ユーザの携帯端末とサーバとからなり、前記各ユーザの携帯端末が、前記サーバから入力した行動認識モデルと、モーションデータあるいは音データのいずれかとに基づいて前記ユーザの行動を認識する行動認識手段と、前記ユーザが携帯端末を操作しているかどうかを判定する操作判定手段と、前記ユーザの位置情報を検知する位置情報検知手段と、前記行動認識手段により認識された行動認識データ、前記携帯端末の操作状況、前記位置情報に基づいて、前記ユーザの行動データを生成する行動データ生成手段と、を備え、前記サーバが、前記行動データ生成手段が生成した前記各ユーザの行動データを格納する行動データ記憶手段と、滞在場所ごとの特徴的な行動である行動特性を格納する行動特性記憶手段と、地図情報を格納する地図データ記憶手段と、前記行動データ、行動特性、地図データに基づいて、前記ユーザの行動を認識するための学習データを生成する学習データ生成手段と、該生成した学習データを格納する学習データ記憶手段と、該格納された学習データに基づいて行動認識モデルを生成する行動認識モデル生成手段と、を備えた学習データ生成システムにおける学習データ生成方法であって、前記学習データ生成手段が、前記行動データ、行動特性、地図データを取得する第1のステップと、取得した前記行動データを滞在地点ごとに分類する第2のステップと、取得した地図データから前記滞在場所ごとに滞在場所属性を特定し、取得した行動特性から特徴的な行動を求める第3のステップと、前記滞在地点ごとに各ユーザに対して、最も高い頻度で認識された行動を取得した行動データから求める第4のステップと、前記各ユーザに対して滞在地点ごとに前記特徴的な行動と前記最も高い頻度で認識された行動とを比較して、一致しない場合に、前記最も高い頻度で認識された行動のラベルを前記特徴的な行動のラベルで訂正する第5のステップと、前記各ユーザに対して訂正したラベルを含む行動データからユーザID、行動ラベルおよび特徴量を抽出した学習データを生成する第6のステップと、を備えたことを特徴とする学習データ生成方法を提案している。
(11)本発明は、各ユーザの携帯端末とサーバとからなり、前記各ユーザの携帯端末が、前記サーバから入力した行動認識モデルと、モーションデータあるいは音データのいずれかとに基づいて前記ユーザの行動を認識する行動認識手段と、前記ユーザが携帯端末を操作しているかどうかを判定する操作判定手段と、前記ユーザの位置情報を検知する位置情報検知手段と、前記行動認識手段により認識された行動認識データ、前記携帯端末の操作状況、前記位置情報に基づいて、前記ユーザの行動データを生成する行動データ生成手段と、を備え、前記サーバが、前記行動データ生成手段が生成した前記各ユーザの行動データを格納する行動データ記憶手段と、滞在場所ごとの特徴的な行動である行動特性を格納する行動特性記憶手段と、地図情報を格納する地図データ記憶手段と、前記行動データ、行動特性、地図データに基づいて、前記ユーザの行動を認識するための学習データを生成する学習データ生成手段と、該生成した学習データを格納する学習データ記憶手段と、該格納された学習データに基づいて行動認識モデルを生成する行動認識モデル生成手段と、を備えた学習データ生成システムにおける学習データ生成方法であって、前記学習データ生成手段が、前記行動データ記憶手段から行動データを取得する第1のステップと、前記取得した行動データを滞在地点ごとに分類する第2のステップと、前記滞在地点ごとに前記各ユーザに対して、最も高い頻度で認識された行動を取得した行動データから求める第3のステップと、前記滞在地点ごとに、最も高い頻度で認識された行動としてユーザに最も支持された多数派の行動を投票率とともに求める第4のステップと、前記滞在地点ごとに、前記投票率が事前に設定した閾値を超えていれば、少数派の行動ラベルを多数派の行動ラベルで訂正する第5のステップと、前記各ユーザに対して訂正したラベルを含む行動データからユーザID、行動ラベルおよび特徴量を抽出した学習データを生成する第6のステップと、を備えたことを特徴とする学習データ生成方法を提案している。
(12)本発明は、各ユーザの携帯端末とサーバとからなり、前記各ユーザの携帯端末が、前記サーバから入力した行動認識モデルと、モーションデータあるいは音データのいずれかとに基づいて前記ユーザの行動を認識する行動認識手段と、前記ユーザが携帯端末を操作しているかどうかを判定する操作判定手段と、前記ユーザの位置情報を検知する位置情報検知手段と、前記行動認識手段により認識された行動認識データ、前記携帯端末の操作状況、前記位置情報に基づいて、前記ユーザの行動データを生成する行動データ生成手段と、を備え、前記サーバが、前記行動データ生成手段が生成した前記各ユーザの行動データを格納する行動データ記憶手段と、滞在場所ごとの特徴的な行動である行動特性を格納する行動特性記憶手段と、地図情報を格納する地図データ記憶手段と、前記行動データ、行動特性、地図データに基づいて、前記ユーザの行動を認識するための学習データを生成する学習データ生成手段と、該生成した学習データを格納する学習データ記憶手段と、該格納された学習データに基づいて行動認識モデルを生成する行動認識モデル生成手段と、を備えた学習データ生成システムにおける学習データ生成方法をコンピュータに実行させるためのプログラムであって、前記学習データ生成手段が、前記行動データ、行動特性、地図データを取得する第1のステップと、取得した前記行動データを滞在地点ごとに分類する第2のステップと、取得した地図データから前記滞在場所ごとに滞在場所属性を特定し、取得した行動特性から特徴的な行動を求める第3のステップと、前記滞在地点ごとに各ユーザに対して、最も高い頻度で認識された行動を取得した行動データから求める第4のステップと、前記各ユーザに対して滞在地点ごとに前記特徴的な行動と前記最も高い頻度で認識された行動とを比較して、一致しない場合に、前記最も高い頻度で認識された行動のラベルを前記特徴的な行動のラベルで訂正する第5のステップと、前記各ユーザに対して訂正したラベルを含む行動データからユーザID、行動ラベルおよび特徴量を抽出した学習データを生成する第6のステップと、をコンピュータに実行させるためのプログラムを提案している。
(13)本発明は、各ユーザの携帯端末とサーバとからなり、前記各ユーザの携帯端末が、前記サーバから入力した行動認識モデルと、モーションデータあるいは音データのいずれかとに基づいて前記ユーザの行動を認識する行動認識手段と、前記ユーザが携帯端末を操作しているかどうかを判定する操作判定手段と、前記ユーザの位置情報を検知する位置情報検知手段と、前記行動認識手段により認識された行動認識データ、前記携帯端末の操作状況、前記位置情報に基づいて、前記ユーザの行動データを生成する行動データ生成手段と、を備え、前記サーバが、前記行動データ生成手段が生成した前記各ユーザの行動データを格納する行動データ記憶手段と、滞在場所ごとの特徴的な行動である行動特性を格納する行動特性記憶手段と、地図情報を格納する地図データ記憶手段と、前記行動データ、行動特性、地図データに基づいて、前記ユーザの行動を認識するための学習データを生成する学習データ生成手段と、該生成した学習データを格納する学習データ記憶手段と、該格納された学習データに基づいて行動認識モデルを生成する行動認識モデル生成手段と、を備えた学習データ生成システムにおける学習データ生成方法をコンピュータに実行させるためのプログラムであって、前記学習データ生成手段が、前記行動データ記憶手段から行動データを取得する第1のステップと、前記取得した行動データを滞在地点ごとに分類する第2のステップと、前記滞在地点ごとに前記各ユーザに対して、最も高い頻度で認識された行動を取得した行動データから求める第3のステップと、前記滞在地点ごとに、最も高い頻度で認識された行動としてユーザに最も支持された多数派の行動を投票率とともに求める第4のステップと、前記滞在地点ごとに、前記投票率が事前に設定した閾値を超えていれば、少数派の行動ラベルを多数派の行動ラベルで訂正する第5のステップと、前記各ユーザに対して訂正したラベルを含む行動データからユーザID、行動ラベルおよび特徴量を抽出した学習データを生成する第6のステップと、をコンピュータに実行させるためのプログラムを提案している。
本発明によれば、self−trainingを行動認識に適用するときに,滞在場所属性ごとの特徴的な行動に基づいて誤った行動ラベルを訂正することにより、行動識別精度を向上させ、信頼度の高いラベル付データを生成する。そのため、初期段階でユーザの行動に対する識別器の認識精度が低い場合であっても、識別器の行動認識精度を向上させることが可能であるという効果がある。
本発明の第1の実施形態に係る学習データ生成システムの概略構成を示す図である。 本発明の第1の実施形態に係る学習データ生成システムの構成を示す図である。 本発明の第1の実施形態に係る行動データ記憶部に格納されるデータを例示した図である。 本発明の第1の実施形態に係る学習データ生成部の処理フロー図である。 本発明の第1の実施形態に係る行動データ記憶部に格納されるデータを例示した図である。 本発明の第1の実施形態に係る行動特性記憶部に格納される滞在場所ごとに発生しうる特徴的な行動(行動特性)を示す図である。 本発明の第1の実施形態に係る修正後に得られる学習データを例示した図である。 本発明の第2の実施形態に係る学習データ生成システムの構成を示す図である。 本発明の第2の実施形態に係る学習データ生成部の処理フロー図である。 本発明の第2の実施形態に係る行動データ記憶部に格納されるデータを例示した図である。 本発明の第2の実施形態に係る行動データ記憶部に格納されるデータを例示した図である。 本発明の第2の実施形態に係る行動データ記憶部に格納されるデータを例示した図である。 本発明の第2の実施形態に係る行動データ記憶部に格納されるデータを例示した図である。
以下、本発明の実施形態について、図面を用いて、詳細に説明する。
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
<第1の実施形態>
図1から図7を用いて、本実施形態に係る学習データ生成システムについて説明する。
<学習データ生成システムの概要>
図1に示すように、本実施形態に係る学習データ生成システムは、滞在場所属性ごとの人の特徴的な行動を表す行動特性と地図データとを用いて、信頼度の高いラベル付データ(学習データ)を生成するものであり、携帯端末100〜 300とサーバ500とから構成されている。本実施形態に係る学習データ生成システムは、ユーザが所持する携帯端末100〜300がネットワークを介して、学習データ生成装置の役割を担うサーバ500に接続する。
<学習データ生成システムの構成>
図2に示すように、本実施形態に係る学習データ生成システムは、携帯端末100〜300とサーバ500とから構成され、携帯端末100(携帯端末200、300も同様の構成を備える)は、行動認識モデル更新部101と、行動認識部102と、モーションセンサ103の構成要素であり、携帯端末100の加速度をセンシングする加速度センサ103Aと携帯端末100の傾きをセンシングする傾きセンサ103Bと、音声情報を取得するマイク104と、アプリケーション動作監視部105と、GPS受信部106と、GPS測位部107と、行動データ生成部108とから構成されている。サーバ500は、行動データ記憶部501と、行動特性データ記憶部502と、地図データ記憶部503と、学習データ生成部504と、学習データ記憶部505と、行動認識モデル生成部506とから構成されている。
行動認識モデル更新部101は、サーバ500内の行動認識モデル生成部506が生成する行動認識モデルにより、図示しない記憶装置内の行動認識モデルを更新し、更新した行動認識モデルを行動認識部102に出力する。なお、行動認識モデル更新部101は、ユーザが行動認識部102を利用しない時間帯、例えば、睡眠中の時間帯等にモデル更新を行なう。また、収集した学習データが少ない状況では、モデル更新があまり意味を成さないため、このような場合には、日ごとだけでなく、週ごとに更新を行なう。行動認識部102は、モーションセンサ103からのモーションデータとマイク104からの音データと行動認識モデル更新部101からの行動認識モデルとを入力する。そして、モーションセンサ103からのモーションデータとマイク104からの音データの特徴量を抽出し、入力した行動認識モデルに基づいて、ユーザ行動を分刻みで認識する。
アプリケーション動作監視部105は、携帯端末100におけるアプリケーションの動作状況から、ユーザが携帯端末を操作しているかどうかを判定する。GPS受信部106は、衛生からGPS信号を受信する。GPS測位部107は、GPS受信部106が受信したGPS信号から緯度と経度で表される位置情報を取得する。行動データ生成部108は、アプリケーション動作監視部105から入力した情報、GPS測位部107から入力した位置情報、行動認識部102から入力した情報とに基づいて、ユーザの行動データを生成し、生成した行動データをネットワークを介してサーバ500に送信する。携帯端末200、300も同様に、携帯端末200、300内で生成した行動データをネットワークを介してサーバ500に送信する。
具体的には、行動認識部102は、「歩行、静止、読書、食事、映像視聴」を認識する。ここで、「歩行、静止」のような基本行動は、十分高い精度で認識可能であるが、「読書、食事、映像視聴」のような応用行動については、互いに認識の誤りを生じることがある。そのため、例えば、行動認識部102が、ユーザ行動を「読書」と認識しても、実際は「食事」または「映像視聴」である可能性も考えられる。そこで、行動認識結果を特徴量に対する行動ラベルと見なし、行動データ生成部108が、行動ラベル、特徴量、位置情報からなる行動データを生成して、行動データを後述するサーバ500内の行動データ記憶部501に保存する。ただし、行動認識結果が誤っている可能性のある「読書、食事、映像視聴」の場合のみ、行動データ記憶部501に保存することとする。なお、参考文献1、2などによれば、行動認識モデルは、モーションデータ、音データの特徴量とユーザ行動の正解データから形成される学習データを用いて、決定木やサポートベクターマシンなどの機械学習アルゴリズムにより生成可能である。
<参考文献1>
Stefan Dembach、et al.、‘’Simple and Complex Activity Recognition Through Smart Phone‘’、11thInternational Conference on Intelligent Enviroments、2012.
<参考文献2>
Koji Yatani and Khai N.Truong、‘’BodyScope:A Wearable Acoustic Sensor for Activity Recognition、14th ACM International Conference on Ubiquitous Computing、2012.
サーバ500内の行動データ記憶部501は、各携帯端末100〜300内の行動データ生成部108が、生成した行動ラベル、特徴量、位置情報からなる行動データを各携帯端末100〜300ごとに保存する。行動特性データ記憶部502は、滞在場所属性ごとの特徴的な行動である行動特性を保存する。例えば、「読書」、「食事」および「映像視聴」といった行動は、滞在場所属性によっては高頻度で発生する特徴的な行動である。図6に示すように、「書店」であれば「読書」、「飲食店」であれば「食事」、「映画館」であれば「映像視聴」が特徴的な行動となる。地図データ記憶部503は、メッシュ単位で区切られた区画に対して滞在場所属性を付与した地図データを保存する。地図データを用いれば、ユーザの滞在地点と区画の重なりから滞在場所属性を特定することができる。
学習データ生成部504は、行動データ、行動特性、地図データとを用いて、行動データ中の誤った行動ラベルを訂正し、信頼度の高いラベル付データ(学習データ)を生成する。具体的には、ユーザの行動データごとに以下の処理を実施する。まず、行動データを滞在地点ごとに分ける。次に、地図データを用いて、滞在地点ごとに、滞在場所属性を特定し、行動特性から特徴的な行動を割り出す。また、行動データから滞在地点ごとに、最高頻度で認識された行動を割り出す。そして、滞在地点ごとに特徴的な行動と最高頻度で認識された行動を比較し、一致していない場合に、最高頻度で認識された行動のラベルを特徴的な行動のラベルで訂正する。なお、一致している場合は、何も処理を施さない。最後に、行動ラベルとそれに対応する特徴量を学習データとして、学習データ記憶部505に保存する。行動認識モデル生成部506は、学習データ生成部504から受信した信号をトリガに学習データ記憶部505内のデータから行動認識モデルを生成する。なお、行動認識モデルの生成は、ユーザが行動認識部102を利用しない時間帯、例えば、睡眠中の時間帯等に行なう。また、収集した学習データが少ない状況では、モデル更新があまり意味を成さないため、このような場合には、日ごとだけでなく、週ごとに更新を行なう。
<学習データ生成システムの処理>
図3から図6を用いて、本実施形態に係る学習データ生成システムの処理について説明する。
サーバ500内の行動データ記憶部501は、各携帯端末100〜300から受信した行動データを携帯端末100〜300ごとに保存している。図3に、行動データを例示する。図3に示すように、行動データは、ユーザID、日時、行動ラベル、位置情報、特徴量とから構成されている。例えば、2014/12/1 11:30:00時点に位置(x0、y0)で読書、2014/12/1 12:00:00時点に位置(x1、y1)で食事というデータが存在する。ここで、参考文献3などによれば、位置情報履歴から、ある地点付近における滞留時間がある閾値を超えた場合に、滞在場所を特定することが可能である。しかし、ここでは、簡単化のために、同一位置情報の場合にのみ同一地点に滞在していると見なす。図3に示す行動データでは、2014/12/1 12:00:00から2014/12/1 12:09:00まで、同一地点(x1、y1)に滞在していることが分かる。
<参考文献3>
西野等;滞在地遷移情報からの行動パターン抽出方式の検討;情報処理学会研究報告.ユビキタスコンピューティングシステム、2008(110)pp.57−64
図4に示すように、学習データ生成部504は、まず、行動データ記憶部501、行動特性データ記憶部502、地図データ記憶部503から行動データ、行動特性、地図データを取得する(ステップS101)。
学習データ生成部504は、図5で示された行動データを滞在地点ごとに分ける(ステップS102)。学習データ生成部504は、取得した地図データから滞在場所ごとに滞在場所属性を特定し、取得した行動特性から特徴的な行動aを求める(ステップS103)。
学習データ生成部504は、滞在地点ごとに各ユーザに対して、最も高い頻度で認識された行動a’を取得した行動データから求める(ステップS104)。学習データ生成部504は、各ユーザに対して滞在地点ごとにaとa’とを比較して、一致しない場合に、a’のラベルをaのラベルで訂正する(ステップS105)。
学習データ生成部504は、各ユーザに対して訂正したラベルを含む行動データからユーザID、行動ラベルおよび特徴量を抽出したラベル付きデータ(学習データ)を生成し(ステップS106)、生成したラベル付きデータ(学習データ)を学習データ記憶部505に保存する(ステップS107)。
図5を用いて、具体的に説明すると、ユーザID(:1)の滞在地点(x1、y1)の行動データをd1(x1、y1)、滞在地点(x2、y2)の行動データをd1(x2、y2)とし、このとき、行動データdi(xj、yj)から最高頻度で発生した行動ラベルを求める関数をf(di(xj、yj))とすれば、f(d1(x1、y1))=映像視聴、f(d1(x2、y2))=食事となる。ここで、地図データから(x1、y1) と(x2、y2)の滞在場所属性がどちらも「飲食店」であったとすれば、行動特性から「飲食店」の特徴的な行動は「食事」となる。そのため、(x1、y1)についてのみ、「映像視聴」を「食事」に訂正し、訂正した行動ラベルを含む学習データを生成する。このとき生成される学習データは、図7のようになる。
以上、説明したように、本実施形態によれば、滞在場所属性ごとの特徴的な行動に基づいて誤った行動ラベルを訂正することにより、行動識別精度を向上させ、信頼度の高いラベル付データ(学習データ)を生成する。そのため、初期段階でユーザの行動に対する識別器の認識精度が低い場合であっても、識別器の行動認識精度を向上させることが可能となる。
<第2の実施形態>
図8から図13を用いて、本実施形態に係る学習データ生成システムについて説明する。本実施形態では、第1の実施形態において設けられていた行動特性記憶部、地図データ記憶部のデータを用いることなく、信頼度の高いラベル付きデータ(学習データ)を生成するものである。
第1の実施形態では、滞在場所属性ごとに人の行動特性を把握する必要があり、また、地図情報の整備という点でも実施者に対する負荷が高い。そのため、本実施形態では、人の行動特性と地図情報を用いない方式を提案する。本実施形態では、ユーザ自身だけでなく他ユーザの識別器の認識結果に基づいて、滞在地点の特徴的な行動を特定することにより、誤りラベルの訂正を行う。一般に、self−trainingをユーザの行動認識に適用すると、識別器の認識精度が低いユーザが存在する一方で、認識精度が高いユーザも存在する。そこで、認識精度の高いユーザの行動に対する認識結果に従えば、滞在地点の特徴的な行動を特定できる。つまり、ある滞在地点で、ユーザの最高頻度で発生した行動認識結果を多数決で集約し、多数派に属する行動認識結果を特徴的な行動と特定する。そして、少数派に属する行動認識結果のラベルを特徴的な行動のラベルで訂正する。ここで、多数派への得票率が設定した閾値以上である場合にのみ正しくラベルを訂正できる可能性が高いと見なし、誤ったラベルを訂正することが可能となる。
<学習データ生成システムの構成>
図8に示すように、本実施形態に係る学習データ生成システムは、携帯端末100〜 300とサーバ500とから構成され、携帯端末100(携帯端末200、300も同様の構成を備える)は、行動認識モデル更新部101と、行動認識部102と、モーションセンサ103の構成要素であり、携帯端末100の加速度をセンシングする加速度センサ103Aと携帯端末100の傾きをセンシングする傾きセンサ103Bと、音声情報を取得するマイク104と、アプリケーション動作監視部105と、GPS受信部106と、GPS測位部107と、行動データ生成部108とから構成されている。サーバ500は、行動データ記憶部501と、学習データ記憶部505と、行動認識モデル生成部506と、学習データ生成部510とから構成されている。なお、第1の実施形態と同一の符号を付す構成要素については、同様の機能を有することから、その詳細な説明は省略する。
学習データ生成部510は、行動データ記憶部501に保存される各ユーザの滞在地点に紐付いた行動データを取得し、この行動データを滞在地点ごとに分類する。次に、滞在地点ごとに、最も多くのユーザに対して、最高の頻度で認識された行動ラベル(多数派の行動ラベル)を求める。そして、少数派の行動ラベルを多数派の行動ラベルで訂正して、生成した行動ラベルとそれに対応する特徴量を学習データとして、学習データ記憶部505に保存する。
<学習データ生成システムの処理>
図9から図13を用いて、本実施形態に係る学習データ生成システムの処理について説明する。
図9に示すように、学習データ生成部510は、まず、行動データ記憶部501から行動データを取得する(ステップS201)。
学習データ生成部510は、図5、図10から図13で示された行動データを滞在地点ごとに分ける(ステップS202)。学習データ生成部510は、滞在地点ごとに各ユーザに対して、最も高い頻度で認識された行動を取得した行動データから求める(ステップS203)。
学習データ生成部510は、滞在地点ごとに、最も高い頻度で認識された行動としてユーザに最も支持された多数派の行動を投票率とともに求める(ステップS204)。学習データ生成部510は、滞在地点ごとに、投票率が事前に設定した閾値を超えていれば、少数派の行動ラベルを多数派の行動ラベルで訂正する(ステップS205)。
学習データ生成部510は、各ユーザに対して訂正したラベルを含む行動データからユーザID、行動ラベルおよび特徴量を抽出したラベル付きデータ(学習データ)を生成し(ステップS206)、生成したラベル付きデータ(学習データ)を学習データ記憶部505に保存する(ステップS207)。
以下では、ユーザID=iの滞在地点(x、y)における行動データをdi(xj、yj)とし、滞在地点(x、y) での行動データ全体は、D(xj、yj)={d1(xj、yj)、・・・、dn(xj、yj) }で表すものとし(n:ユーザ数,ユーザID=iでの滞在地点(x、y)における行動データが存在しない場合、di(xj、yj)=0)、具体的に、学習データ生成部510の処理について説明する。
学習データ生成部510は、取得した行動データを滞在地点ごとに分けることにより、D={D(x1、y1)、・・・、D(xm、ym)}(m*;滞在地点数)を得る。次に、滞在地点ごとに、最も多くのユーザに対して最高頻度で認識された行動のラベルを求める。ここで、行動データdi(xj、yj)から最高頻度で発生した行動ラベルを求める関数をf(di(xj、yj))とし、行動ラベルをl(エル)としたときg(l、di(xj、yj))を以下のように定義する。
g(l、di(xj、yj)) =Iflとf(di(xj、yj))が一致するthen l otherwise 0
このとき、滞在地点(x、y) での多数派の行動ラベルは、以下の得票数の計算式(数1)を最大にする行動ラベルl‘である。
Figure 2016157196
また、得票率は以下の数2で表される。
Figure 2016157196
そして、得票結果に従って、少数派の行動ラベルを多数派の行動ラベルで訂正する。すなわち、f(di(xj、yj))≠l‘であるdi(xj、yj)に対して、f(di(xj、yj))で表される行動ラベルをl‘で訂正する。
また、訂正した行動ラベルのみを含む行動データからラベル付データとして必要なユーザID、行動ラベル、および特徴量のみ抽出したラベル付データd‘i(xj、yj)を生成する (なお、f(di(xj、yj))=l‘’であれば、d‘i(xj、yj)≠0である)。
滞在地点ごとに得票とラベル訂正を繰り返すことにより、最終的に各ユーザに対するラベル付データD‘i={d‘i(xj、yj)、・・・、d‘i(xm、ym) } (ユーザID=iの場合)を得て、このラベル付データ(学習データ)を学習データ記憶部505に保存する。このとき、滞在地点での多数派への得票率に応じて多数派の行動ラベルの信頼度に優劣を与えることができる。そのため、得票率が事前に設定した閾値を超えた場合にのみ、ラベル付データとして採用することにより、更に、信頼度の高いラベル付データを得ることができる。
<実施例>
以下、図5、図10から図13を用いて、本実施形態に係る実施例について説明する。
図5、図10から図13から、
(x1、y1)={d1(x1、y1)、d2(x1、y1)、d3(x1、y1)、d4(x1、y1)、d5(x1、y1) }、f(d1(x1、y1))=映像視聴、f(d2(x1、y1))=食事、f(d3(x1、y1))=食事、f(d4(x1、y1))=食事、f(d5(x1、y1))=食事、
(x2、y2)={d1(x2、y2)、d2(x2、y2)、d3(x2、y2)、d4(x2、y2)} (ここで、d5(x2、y2)≠0)、f(d1(xj、yj))=食事、f(d2(xj、yj))=映像視聴、f(d3(xj、yj))=読書、f(d4(xj、yj))=読書である。
このとき,滞在地点(x、y) では、行動ラベル「食事」のとき、得票数は、数3で最大となり、得票率は数4になる。
Figure 2016157196
Figure 2016157196
そのため、滞在地点(x、y) での多数派の行動ラベルは「食事」である。同様に、滞在地点(x、y)では、行動ラベル「読書」のとき、得票数が数5で最大となり、得票率は、数6となる。
Figure 2016157196
Figure 2016157196
そのため、滞在地点(x、y) での多数派の行動ラベルは「読書」である。そこで、滞在地点(x、y)で、少数派のユーザID=1の行動ラベル「映像視聴」を多数派の行動ラベル「食事」で訂正し、訂正した行動ラベルを含む学習データを生成する。また、滞在地点(x、y)で、少数派のユーザID=1の行動ラベル「食事」とユーザID=2の行動ラベル「映像視聴」を多数派の行動ラベル「読書」で訂正し、ユーザごとに訂正した行動ラベルを含む学習データを生成する。
このとき、例えば、得票率に対して閾値0.8を与えれば、滞在地点(x、y)においては、多数派の行動ラベルに従ってラベルの訂正を行うが、滞在地点(x、y) では、ラベルを訂正しないようにすることができる。これにより、更に信頼度の高いラベル付データのみを得ることができる。
以上、説明したように、本実施形態によれば、滞在場所属性ごとの特徴的な行動に基づいて誤った行動ラベルを訂正することにより、信頼度の高いラベル付データ(学習データ)を生成する。そのため、初期段階でユーザの行動に対する識別器の認識精度が低い場合であっても、識別器の行動認識精度を向上させることが可能となる。
なお、学習データ生成システムを構成する携帯端末、サーバの処理をコンピュータシステムが読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムを学習データ生成システムを構成する携帯端末、サーバに読み込ませ、実行することによって本発明の学習データ生成システムを実現することができる。ここでいうコンピュータシステムとは、OSや周辺装置等のハードウェアを含む。
また、「コンピュータシステム」は、WWW(World Wide Web)システムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。例えば、第1の実施形態、第2の実施形態においては、滞在場所属性を精度高く選択するために、十分な期間の行動データを用いる方が望ましい。仮に、1週間の行動データを用いるとすれば、直近1週間の行動データから学習データを生成し続けることで、反復的に行動モデルを改善することができる。
また、本実施形態では、携帯端末とサーバとで機能分割するシステムについて説明したが、携帯端末に行動データ記憶部501と、行動特性データ記憶部502と、地図データ記憶部503と、学習データ生成部504と、学習データ記憶部505と、行動認識モデル生成部506、学習データ生成部510を設け、他のユーザからの行動データを受信し、すべてのユーザの行動データを行動データ記憶部501に格納することにより、各ユーザの携帯端末単体で、学習データの生成を行なうようにしてもよい。
100;携帯端末
101;行動認識モデル更新部
102;行動認識部
103;モーションセンサ
103A;加速度センサ
103B;傾きセンサ
104;マイク
105;アプリケーション動作監視部
106;GPS受信部
107;GPS測位部
108;行動データ生成部
200;携帯端末
300;携帯端末
500;サーバ
501;行動データ記憶部
502;行動特性データ記憶部
503;地図データ記憶部
504;学習データ生成部
505;学習データ記憶部
506;行動認識モデル生成部
510;学習データ生成部

Claims (13)

  1. 各ユーザの携帯端末とサーバとからなる学習データ生成システムであって、
    前記各ユーザの携帯端末が、
    前記サーバから入力した行動認識モデルと、モーションデータあるいは音データのいずれかとに基づいて前記ユーザの行動を認識する行動認識手段と、
    前記ユーザが携帯端末を操作しているかどうかを判定する操作判定手段と、
    前記ユーザの位置情報を検知する位置情報検知手段と、
    前記行動認識手段により認識された行動認識データ、前記携帯端末の操作状況、前記位置情報に基づいて、前記ユーザの行動データを生成する行動データ生成手段と、
    を備え、
    前記サーバが、
    前記行動データ生成手段が生成した前記各ユーザの行動データを格納する行動データ記憶手段と、
    滞在場所ごとの特徴的な行動である行動特性を格納する行動特性記憶手段と、
    地図情報を格納する地図データ記憶手段と、
    前記行動データ、行動特性、地図データに基づいて、前記ユーザの行動を認識するための学習データを生成する学習データ生成手段と、
    該生成した学習データを格納する学習データ記憶手段と、
    該格納された学習データに基づいて行動認識モデルを生成する行動認識モデル生成手段と、
    を備えたことを特徴とする学習データ生成システム。
  2. 前記学習データ生成手段は、前記位置情報から算出した滞在地点と前記地図データとから滞在場所属性を特定し、該滞在場所属性と前記行動特性から滞在地点での特徴的な行動を求めることを特徴とする請求項1に記載の学習データ生成システム。
  3. 前記行動データが、少なくとも、ユーザID、日時、行動ラベル、位置情報、特徴量で構成され、前記学習データ生成手段は、前記特徴的な行動と前記行動認識手段による認識結果とを比較し、一致していない場合には、該認識結果に対応する前記行動ラベルを前記特徴的な行動を示す行動ラベルで訂正して、学習データを生成することを特徴とする請求項2に記載の学習データ生成システム。
  4. 各ユーザの携帯端末とサーバとからなる学習データ生成システムであって、
    前記各ユーザの携帯端末が、
    前記サーバから入力した行動認識モデルと、モーションデータあるいは音データのいずれかとに基づいて前記ユーザの行動を認識する行動認識手段と、
    前記ユーザが携帯端末を操作しているかどうかを判定する操作判定手段と、
    前記ユーザの位置情報を検知する位置情報検知手段と、
    前記行動認識手段により認識された行動認識データ、前記携帯端末の操作状況、前記位置情報に基づいて、前記ユーザの行動データを生成する行動データ生成手段と、
    を備え、
    前記サーバが、
    前記行動データ生成手段が生成した前記各ユーザの行動データを格納する行動データ記憶手段と、
    前記行動データに基づいて、前記ユーザの行動を認識するための学習データを生成する学習データ生成手段と、
    該生成した学習データを格納する学習データ記憶手段と、
    該格納された学習データに基づいて行動認識モデルを生成する行動認識モデル生成手段と、
    を備えたことを特徴とする学習データ生成システム。
  5. 前記行動データが、少なくとも、ユーザID、日時、行動ラベル、位置情報、特徴量で構成され、前記学習データ生成手段は、同一滞在地点における全ユーザから最高頻度で認識された前記行動ラベルを多数決で決定し、最も得票数を得た多数派の前記行動ラベルを滞在地点における特徴的な行動と見なすことを特徴とする請求項4に記載の学習データシステム。
  6. 前記学習データ生成手段は、数1から多数決の前記得票数を計算することを特徴とする請求項5に記載の学習データ生成システム。
    Figure 2016157196
  7. 前記学習データ生成手段は、同一滞在地点において前記多数決で少数派であった行動ラベルを多数派の前記行動ラベルで訂正し、学習データを生成することを特徴とする請求項6に記載の学習データ生成システム。
  8. 前記学習データ生成手段は、多数決の得票率が事前に設定した閾値以上である場合にのみ、少数派の前記行動ラベルを訂正することにより、学習データを生成することを特徴とする請求項7に記載の学習データ生成システム。
  9. 前記学習データ生成手段は、数2から多数決の前記得票率を計算することを特徴とする請求項8に記載の学習データ生成システム。
    Figure 2016157196
  10. 各ユーザの携帯端末とサーバとからなり、前記各ユーザの携帯端末が、前記サーバから入力した行動認識モデルと、モーションデータあるいは音データのいずれかとに基づいて前記ユーザの行動を認識する行動認識手段と、前記ユーザが携帯端末を操作しているかどうかを判定する操作判定手段と、前記ユーザの位置情報を検知する位置情報検知手段と、前記行動認識手段により認識された行動認識データ、前記携帯端末の操作状況、前記位置情報に基づいて、前記ユーザの行動データを生成する行動データ生成手段と、を備え、前記サーバが、前記行動データ生成手段が生成した前記各ユーザの行動データを格納する行動データ記憶手段と、滞在場所ごとの特徴的な行動である行動特性を格納する行動特性記憶手段と、地図情報を格納する地図データ記憶手段と、前記行動データ、行動特性、地図データに基づいて、前記ユーザの行動を認識するための学習データを生成する学習データ生成手段と、該生成した学習データを格納する学習データ記憶手段と、該格納された学習データに基づいて行動認識モデルを生成する行動認識モデル生成手段と、を備えた学習データ生成システムにおける学習データ生成方法であって、
    前記学習データ生成手段が、
    前記行動データ、行動特性、地図データを取得する第1のステップと、
    取得した前記行動データを滞在地点ごとに分類する第2のステップと、
    取得した地図データから前記滞在場所ごとに滞在場所属性を特定し、取得した行動特性から特徴的な行動を求める第3のステップと、
    前記滞在地点ごとに各ユーザに対して、最も高い頻度で認識された行動を取得した行動データから求める第4のステップと、
    前記各ユーザに対して滞在地点ごとに前記特徴的な行動と前記最も高い頻度で認識された行動とを比較して、一致しない場合に、前記最も高い頻度で認識された行動のラベルを前記特徴的な行動のラベルで訂正する第5のステップと、
    前記各ユーザに対して訂正したラベルを含む行動データからユーザID、行動ラベルおよび特徴量を抽出した学習データを生成する第6のステップと、
    を備えたことを特徴とする学習データ生成方法。
  11. 各ユーザの携帯端末とサーバとからなり、前記各ユーザの携帯端末が、前記サーバから入力した行動認識モデルと、モーションデータあるいは音データのいずれかとに基づいて前記ユーザの行動を認識する行動認識手段と、前記ユーザが携帯端末を操作しているかどうかを判定する操作判定手段と、前記ユーザの位置情報を検知する位置情報検知手段と、前記行動認識手段により認識された行動認識データ、前記携帯端末の操作状況、前記位置情報に基づいて、前記ユーザの行動データを生成する行動データ生成手段と、を備え、前記サーバが、前記行動データ生成手段が生成した前記各ユーザの行動データを格納する行動データ記憶手段と、滞在場所ごとの特徴的な行動である行動特性を格納する行動特性記憶手段と、地図情報を格納する地図データ記憶手段と、前記行動データ、行動特性、地図データに基づいて、前記ユーザの行動を認識するための学習データを生成する学習データ生成手段と、該生成した学習データを格納する学習データ記憶手段と、該格納された学習データに基づいて行動認識モデルを生成する行動認識モデル生成手段と、を備えた学習データ生成システムにおける学習データ生成方法であって、
    前記学習データ生成手段が、
    前記行動データ記憶手段から行動データを取得する第1のステップと、
    前記取得した行動データを滞在地点ごとに分類する第2のステップと、
    前記滞在地点ごとに前記各ユーザに対して、最も高い頻度で認識された行動を取得した行動データから求める第3のステップと、
    前記滞在地点ごとに、最も高い頻度で認識された行動としてユーザに最も支持された多数派の行動を投票率とともに求める第4のステップと、
    前記滞在地点ごとに、前記投票率が事前に設定した閾値を超えていれば、少数派の行動ラベルを多数派の行動ラベルで訂正する第5のステップと、
    前記各ユーザに対して訂正したラベルを含む行動データからユーザID、行動ラベルおよび特徴量を抽出した学習データを生成する第6のステップと、
    を備えたことを特徴とする学習データ生成方法。
  12. 各ユーザの携帯端末とサーバとからなり、前記各ユーザの携帯端末が、前記サーバから入力した行動認識モデルと、モーションデータあるいは音データのいずれかとに基づいて前記ユーザの行動を認識する行動認識手段と、前記ユーザが携帯端末を操作しているかどうかを判定する操作判定手段と、前記ユーザの位置情報を検知する位置情報検知手段と、前記行動認識手段により認識された行動認識データ、前記携帯端末の操作状況、前記位置情報に基づいて、前記ユーザの行動データを生成する行動データ生成手段と、を備え、前記サーバが、前記行動データ生成手段が生成した前記各ユーザの行動データを格納する行動データ記憶手段と、滞在場所ごとの特徴的な行動である行動特性を格納する行動特性記憶手段と、地図情報を格納する地図データ記憶手段と、前記行動データ、行動特性、地図データに基づいて、前記ユーザの行動を認識するための学習データを生成する学習データ生成手段と、該生成した学習データを格納する学習データ記憶手段と、該格納された学習データに基づいて行動認識モデルを生成する行動認識モデル生成手段と、を備えた学習データ生成システムにおける学習データ生成方法をコンピュータに実行させるためのプログラムであって、
    前記学習データ生成手段が、
    前記行動データ、行動特性、地図データを取得する第1のステップと、
    取得した前記行動データを滞在地点ごとに分類する第2のステップと、
    取得した地図データから前記滞在場所ごとに滞在場所属性を特定し、取得した行動特性から特徴的な行動を求める第3のステップと、
    前記滞在地点ごとに各ユーザに対して、最も高い頻度で認識された行動を取得した行動データから求める第4のステップと、
    前記各ユーザに対して滞在地点ごとに前記特徴的な行動と前記最も高い頻度で認識された行動とを比較して、一致しない場合に、前記最も高い頻度で認識された行動のラベルを前記特徴的な行動のラベルで訂正する第5のステップと、
    前記各ユーザに対して訂正したラベルを含む行動データからユーザID、行動ラベルおよび特徴量を抽出した学習データを生成する第6のステップと、
    をコンピュータに実行させるためのプログラム。
  13. 各ユーザの携帯端末とサーバとからなり、前記各ユーザの携帯端末が、前記サーバから入力した行動認識モデルと、モーションデータあるいは音データのいずれかとに基づいて前記ユーザの行動を認識する行動認識手段と、前記ユーザが携帯端末を操作しているかどうかを判定する操作判定手段と、前記ユーザの位置情報を検知する位置情報検知手段と、前記行動認識手段により認識された行動認識データ、前記携帯端末の操作状況、前記位置情報に基づいて、前記ユーザの行動データを生成する行動データ生成手段と、を備え、前記サーバが、前記行動データ生成手段が生成した前記各ユーザの行動データを格納する行動データ記憶手段と、滞在場所ごとの特徴的な行動である行動特性を格納する行動特性記憶手段と、地図情報を格納する地図データ記憶手段と、前記行動データ、行動特性、地図データに基づいて、前記ユーザの行動を認識するための学習データを生成する学習データ生成手段と、該生成した学習データを格納する学習データ記憶手段と、該格納された学習データに基づいて行動認識モデルを生成する行動認識モデル生成手段と、を備えた学習データ生成システムにおける学習データ生成方法をコンピュータに実行させるためのプログラムであって、
    前記学習データ生成手段が、
    前記行動データ記憶手段から行動データを取得する第1のステップと、
    前記取得した行動データを滞在地点ごとに分類する第2のステップと、
    前記滞在地点ごとに前記各ユーザに対して、最も高い頻度で認識された行動を取得した行動データから求める第3のステップと、
    前記滞在地点ごとに、最も高い頻度で認識された行動としてユーザに最も支持された多数派の行動を投票率とともに求める第4のステップと、
    前記滞在地点ごとに、前記投票率が事前に設定した閾値を超えていれば、少数派の行動ラベルを多数派の行動ラベルで訂正する第5のステップと、
    前記各ユーザに対して訂正したラベルを含む行動データからユーザID、行動ラベルおよび特徴量を抽出した学習データを生成する第6のステップと、
    をコンピュータに実行させるためのプログラム。
JP2015033239A 2015-02-23 2015-02-23 学習データ生成システム、学習データ生成方法およびプログラム Active JP6461639B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015033239A JP6461639B2 (ja) 2015-02-23 2015-02-23 学習データ生成システム、学習データ生成方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015033239A JP6461639B2 (ja) 2015-02-23 2015-02-23 学習データ生成システム、学習データ生成方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2016157196A true JP2016157196A (ja) 2016-09-01
JP6461639B2 JP6461639B2 (ja) 2019-01-30

Family

ID=56826180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015033239A Active JP6461639B2 (ja) 2015-02-23 2015-02-23 学習データ生成システム、学習データ生成方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6461639B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020026395A1 (ja) * 2018-08-02 2020-02-06 日本電気株式会社 モデル作成装置、モデル作成方法、及び、モデル作成プログラムが記録された記録媒体
KR20200072717A (ko) * 2018-12-13 2020-06-23 재단법인대구경북과학기술원 데이터 빈도수 분석을 통한 인공지능 학습 방법 및 장치
JP2021099772A (ja) * 2019-12-23 2021-07-01 グーグル エルエルシーGoogle LLC 媒体消費に基づいた、コンピューティングデバイスのユーザによって実行される身体活動の識別
EP3699864A4 (en) * 2017-10-17 2021-09-08 Hitachi, Ltd. ONLINE RECOGNITION DEVICE, ONLINE RECOGNITION PROCESS AND SETTING SCREEN TO BE USED THEREIN
KR102319648B1 (ko) * 2021-02-19 2021-11-01 (주)아와소프트 빅데이터를 기반으로 생성된 학습데이터를 제공하는 챗봇 시스템 및 그 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011081431A (ja) * 2009-10-02 2011-04-21 Sony Corp 行動パターン解析システム、携帯端末、行動パターン解析方法、及びプログラム
JP2011108245A (ja) * 2009-11-20 2011-06-02 Palo Alto Research Center Inc 文脈情報からユーザに対する行動種別を決定する推論モデルを生成するプログラム
JP2012008771A (ja) * 2010-06-24 2012-01-12 Sony Corp 情報処理装置、情報処理システム、情報処理方法およびプログラム
US20120264446A1 (en) * 2011-04-18 2012-10-18 Microsoft Corporation Identifying Status Based on Heterogeneous Sensors

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011081431A (ja) * 2009-10-02 2011-04-21 Sony Corp 行動パターン解析システム、携帯端末、行動パターン解析方法、及びプログラム
JP2011108245A (ja) * 2009-11-20 2011-06-02 Palo Alto Research Center Inc 文脈情報からユーザに対する行動種別を決定する推論モデルを生成するプログラム
JP2012008771A (ja) * 2010-06-24 2012-01-12 Sony Corp 情報処理装置、情報処理システム、情報処理方法およびプログラム
US20120264446A1 (en) * 2011-04-18 2012-10-18 Microsoft Corporation Identifying Status Based on Heterogeneous Sensors

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3699864A4 (en) * 2017-10-17 2021-09-08 Hitachi, Ltd. ONLINE RECOGNITION DEVICE, ONLINE RECOGNITION PROCESS AND SETTING SCREEN TO BE USED THEREIN
WO2020026395A1 (ja) * 2018-08-02 2020-02-06 日本電気株式会社 モデル作成装置、モデル作成方法、及び、モデル作成プログラムが記録された記録媒体
JPWO2020026395A1 (ja) * 2018-08-02 2021-08-02 日本電気株式会社 モデル作成装置、モデル作成方法、及び、モデル作成プログラム
JP7115546B2 (ja) 2018-08-02 2022-08-09 日本電気株式会社 モデル作成装置、モデル作成方法、及び、モデル作成プログラム
KR20200072717A (ko) * 2018-12-13 2020-06-23 재단법인대구경북과학기술원 데이터 빈도수 분석을 통한 인공지능 학습 방법 및 장치
KR102209505B1 (ko) * 2018-12-13 2021-02-01 재단법인대구경북과학기술원 데이터 빈도수 분석을 통한 인공지능 학습 방법 및 장치
JP2021099772A (ja) * 2019-12-23 2021-07-01 グーグル エルエルシーGoogle LLC 媒体消費に基づいた、コンピューティングデバイスのユーザによって実行される身体活動の識別
JP7001763B2 (ja) 2019-12-23 2022-01-20 グーグル エルエルシー 媒体消費に基づいた、コンピューティングデバイスのユーザによって実行される身体活動の識別
US11620543B2 (en) 2019-12-23 2023-04-04 Google Llc Identifying physical activities performed by a user of a computing device based on media consumption
US12008485B2 (en) 2019-12-23 2024-06-11 Google Llc Identifying physical activities performed by a user of a computing device based on media consumption
KR102319648B1 (ko) * 2021-02-19 2021-11-01 (주)아와소프트 빅데이터를 기반으로 생성된 학습데이터를 제공하는 챗봇 시스템 및 그 방법

Also Published As

Publication number Publication date
JP6461639B2 (ja) 2019-01-30

Similar Documents

Publication Publication Date Title
JP6461639B2 (ja) 学習データ生成システム、学習データ生成方法およびプログラム
US20220138780A1 (en) Churn prediction with machine learning
KR102223630B1 (ko) 얼굴 모델링을 위한 신경망
US11003879B2 (en) Two-dimensional code generation and processing
US9830516B1 (en) Joint temporal segmentation and classification of user activities in egocentric videos
KR101593315B1 (ko) 행동 인식을 위한 방법, 장치 및 컴퓨터 프로그램 제품
US20200134674A1 (en) Method and device for pushing information
US20180253350A1 (en) Monitoring node usage in a distributed system
US20180268464A1 (en) Order clustering and malicious information combating method and apparatus
CN105825522B (zh) 图像处理方法和支持该方法的电子设备
CN109993150B (zh) 用于识别年龄的方法和装置
US11526701B2 (en) Method and system of performing data imbalance detection and correction in training a machine-learning model
KR20150096312A (ko) 클라우드 동기화 시스템용 텔레메트리 시스템
US20170012911A1 (en) Mood information processing method and apparatus
US11880754B2 (en) Electronic apparatus and control method thereof
EP3444811A1 (en) Speech recognition method and device
CN112400165A (zh) 利用无监督学习来改进文本到内容建议的方法和系统
JP2017010475A (ja) プログラム生成装置、プログラム生成方法および生成プログラム
EP4073978B1 (en) Intelligent conversion of internet domain names to vector embeddings
KR20190031421A (ko) 지정 항목 추천 방법
WO2021068613A1 (zh) 面部识别方法、装置、设备及计算机可读存储介质
CN113190646A (zh) 一种用户名样本的标注方法、装置、电子设备及存储介质
KR101808392B1 (ko) 웰니스 컨텐츠 추천 장치 및 방법
US20200272936A1 (en) System and Method for Managing Inventory of Artificial Intelligence Entities
KR102054993B1 (ko) 알림을 제공하는 방법 및 그 전자 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170907

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181226

R150 Certificate of patent or registration of utility model

Ref document number: 6461639

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150