JP7476984B2 - 行動予測方法、行動予測装置及びプログラム - Google Patents

行動予測方法、行動予測装置及びプログラム Download PDF

Info

Publication number
JP7476984B2
JP7476984B2 JP2022566576A JP2022566576A JP7476984B2 JP 7476984 B2 JP7476984 B2 JP 7476984B2 JP 2022566576 A JP2022566576 A JP 2022566576A JP 2022566576 A JP2022566576 A JP 2022566576A JP 7476984 B2 JP7476984 B2 JP 7476984B2
Authority
JP
Japan
Prior art keywords
behavior
certain
feature amount
time
person
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022566576A
Other languages
English (en)
Other versions
JPWO2022118428A1 (ja
Inventor
健 倉島
浩之 戸田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2022118428A1 publication Critical patent/JPWO2022118428A1/ja
Application granted granted Critical
Publication of JP7476984B2 publication Critical patent/JP7476984B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、行動予測方法、行動予測装置及びプログラムに関する。
従来、人物に関する過去の履歴情報をもとに、深層学習技術を用いて人物が次の行動を起こす時間を予測する方法がある。例えば、時系列データの扱いに特化したLSTM(Long short-term memory)などのリカレントニューラルネットワークを使うことで、時系列データに存在する規則性又はパターンを自動的に抽出して、次に行動が起きる時間を予測することができる(例えば、非特許文献1)。
Hochreiter, Sepp and Schmidhuber, Jurgen. "Long short-term memory." Neural computation 9.8 (1997): 1735-1780.
しかしながら、従来技術では、人物に関する過去の履歴情報から自動的に規則性又はパターンが抽出及び学習される。つまり、従来技術では、どのような特徴量を重視すべきか、どういった数式で予測を行うか、といったことを無数にある可能性の中から探し出す処理が行われる。したがって、従来技術を適用するためには大量のデータを用意する必要があり、大量のデータを用意ができない状況においては正確な予測が困難であった。
また、従来技術においては、大量のデータが存在する状況においても、ハイパーパラメータと呼ばれる数値(例えば、深層学習における層数や各層におけるノード(ニューロン)数など)を人手で設定する必要があり、そのチューニングに多くの時間を割く必要があった。
本発明は、上記の点に鑑みてなされたものであって、行動の予測を効率化することを目的とする。
そこで上記課題を解決するため、或る人の複数の行動のそれぞれについて当該行動の時間と当該行動の後の前記或る人の状態を示す数値とを含む第1の行動履歴から、或る時点において前記数値が閾値を超えるまでの前記或る人の労力を示す第1の特徴量を抽出する第1の抽出手順と、前記第1の行動履歴から、前記或る時点までに前記或る人が前記閾値の示す状態に馴化している度合いを示す第2の特徴量を抽出する第2の抽出手順と、前記第1の特徴量及び前記第2の特徴量と、前記第1の行動履歴における或る時点の行動から次の行動までの時間間隔とに基づいて、前記第1の特徴量及び前記第2の特徴量を説明変数とし、前記時間間隔を被説明変数とする予測モデルを学習する学習手順と、をコンピュータが実行する。
行動の予測を効率化することができる。
本発明の実施の形態における行動予測装置10のハードウェア構成例を示す図である。 本発明の実施の形態における行動予測装置10の機能構成例を示す図である。 労力度抽出部13及び馴化度抽出部14のそれぞれが実行する処理を説明するための図である。
本実施の形態では、ステータス(状態)を示すレーティングが与えられた人物が、或る行動を起こした結果に応じて自身のレーティングが確率的に変化する状況において、その人物が次の行動を起こす時間を行動履歴から予測する行動予測装置10が開示される(例えば、人物は何らかのゲームに参加することができ、その結果に応じて人物のゲームスキルを示すレーティングが変化する。)。また、レーティングに関して何らかの参照点が存在する状況が想定される(例えば、人物のレーティングがある一定値以上になると、何らかの称号が与えられる状況など。)。
なお、レーティングとは、人物の評価点、所有する金額など、広義の意味で人物のステータスを数値化したものを意味する総称をいう。本実施の形態では、レーティングが高いほど良い評価である場合として動作を述べるが、その逆であっても動作を逆転することで動作する。
また、参照点とは、レーティングにおける丸め値(100で割り切れる数値など)、自身が過去に記録したレーティングの最大値(最小値)、称号が与えられる境目(段階)となるレーティング値など、人物が価値を判断する際に基準とする数値を意味する総称をいう。
以下、図面に基づいて本発明の実施の形態を説明する。図1は、本発明の実施の形態における行動予測装置10のハードウェア構成例を示す図である。図1の行動予測装置10は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、プロセッサ104、及びインタフェース装置105等を有する。
行動予測装置10での処理を実現するプログラムは、CD-ROM等の記録媒体101によって提供される。プログラムを記憶した記録媒体101がドライブ装置100にセットされると、プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、プログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。プロセッサ104は、CPU若しくはGPU(Graphics Processing Unit)、又はCPU及びGPUであり、メモリ装置103に格納されたプログラムに従って行動予測装置10に係る機能を実行する。インタフェース装置105は、ネットワークに接続するためのインタフェースとして用いられる。
図2は、本発明の実施の形態における行動予測装置10の機能構成例を示す図である。図2において、行動予測装置10は、操作部11、出力部12、労力度抽出部13、馴化度抽出部14、予測モデル構築部15及び時間予測部16を有する。これら各部は、行動予測装置10にインストールされた1以上のプログラムが、プロセッサ104に実行させる処理により実現される。行動予測装置10は、また、予測モデル記憶部17を利用する。予測モデル記憶部17は、例えば、補助記憶装置102、又は行動予測装置10にネットワークを介して接続可能な記憶装置等を用いて実現可能である。なお、行動予測装置10の構成要素のうち、労力度抽出部13、馴化度抽出部14、予測モデル構築部15は外部の参照点・行動履歴記憶部20と接続される。図2において、参照点・行動履歴記憶部20は、行動予測装置10の外部に示されているが、行動予測装置10が参照点・行動履歴記憶部20を有してもよい。
参照点・行動履歴記憶部20は、参照点を示す情報(参照点情報)と、複数の人物それぞれの行動履歴情報を記憶している。参照点・行動履歴記憶部20は、行動予測装置10からの要求に従って、参照点情報、人物の行動履歴情報を読み出し、これらの情報を行動予測装置10に送信する。M個の参照点は、
R=<r,r,…,r
と表現できる。rは特定のレーティングを示す数値であり、数値の昇順(r<ri+1)にソートされているとする。
人物uの行動履歴情報は、
Hu={(su1,tu1),…,(sun,tun)}
と表現できる。行動履歴情報の各要素が行動イベントを示しており、tが行動を起こした時間(時刻等のタイミング)、sが行動を起こした後の人物のレーティングを示す。参照点・行動履歴記憶部20には、複数人物に関してのこのような行動履歴情報が記憶されている。
操作部11は、行動予測装置10の利用者から、予測モデル構築の実行に関する操作を受け付ける。操作部11は、斯かる操作を受け付けると、予測モデルの構築に関する実行指令を労力度抽出部13及び馴化度抽出部14へ送信する。操作部11は、また、予測を実施したい人物(予測対象の人物)の行動履歴情報を受け付けると(行動履歴情報の形式は上記した通りである。)、当該行動履歴情報を時間予測部16に送信する。操作部11が入力を受け付けるためのハードウェアは、キーボードやマウスやメニュー画面やタッチパネル等、所定のものに限定されない。操作部11は、例えば、マウス等の入力手段のデバイスドライバや、メニュー画面の制御ソフトウェアがプロセッサ104に実行させる処理により実現される。
出力部12は、時間予測部16から送信される予測結果を受け取り出力する。ここで、出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部装置への送信等を含む概念である。出力部12は、例えば、出力デバイスのドライバソフト、又は出力デバイスのドライバソフトと出力デバイス等がプロセッサ104に実行させる処理によりされる。
労力度抽出部13は、或る行動イベントによるレーティングの変化により、或る時点において或る参照点rを(良い方向に)超えた人物に関して、一つ前の参照点ri-1を超えてから次の参照点rを超えるまでの当該人物の労力の度合い(どの程度労力を割いたか)を示す特徴量(以下、「労力度」という。))を当該人物の行動履歴情報及び参照点情報から抽出する。労力度抽出部13は、例えば、或る人物が、一つ前の参照点ri-1を超えてから次の参照点rを超えるまでに何回の行動イベントを行ったか、又は時間がどの程度かかったか(参照点ri-1を超えてから参照点rを超えるまでの経過時間)を数値化した値を労力度として、当該人物の行動履歴情報及び参照点情報に基づいて抽出する。労力度抽出部13は、抽出した労力度としての特徴量を予測モデル構築部15に送信する。
馴化度抽出部14は、或る行動イベントによるレーティングの変化により、或る時点において或る参照点rを(良い方向に)超えた人物に関して、過去にその参照点rを(良い方向に)超えた経験を何度行ったことがあるかを示す特徴量(参照点rに当該人物が馴化している度合い(又は程度)を示す特徴量)(以下、「馴化度」という。)を当該人物の行動履歴情報及び参照点情報から抽出する。馴化度抽出部14は、抽出した馴化度としての特徴量を予測モデル構築部15に送信する。
予測モデル構築部15は、人物に関する情報と当該人物の行動履歴に基づいて、当該人物が次に行動を起こす時間情報を予測する予測モデルを構築(学習)する。人物に関する情報は、参照点・行動履歴記憶部20から送信されてくる行動履歴情報から計算される基本的な特徴量(行動イベントの時間間隔の人物毎の平均値、レーティングの人物毎の平均値など)である。予測モデル構築部15は、更に、労力度抽出部13又は馴化度抽出部14から送信された労力度及び馴化度も人物に関する情報として用いる。予測モデルのパラメータ推定に用いる機械学習器は、回帰木など教師あり学習器であれば何を用いても良い。予測モデル構築部15によって構築した予測モデルに関する各種情報(例えば、予測モデルのパラメータ等)は予測モデル記憶部17に送信される。なお、予測モデルは、複数の人物に対して共通である。すなわち、予測モデル構築部15は、複数の人物に関する情報と、当該複数の人物の行動履歴を学習データとして、予測モデルを学習する。
予測モデル記憶部17は、予測モデル構築部15から送信されてきた予測モデルに関する各種情報を記憶する。予測モデル記憶部17はこれらの情報が保存され、復元可能なものであればなんでもよい。例えば、当該情報は、データベースや、予め備えられた汎用的な記憶装置(メモリやハードディスク装置)の特定領域に記憶される。
時間予測部16は、操作部11から送信された予測対象の人物の行動履歴情報である予測対象行動履歴情報を受け付け、予測対象行動履歴情報から計算される基本的な特徴量(当該人物に関する行動イベントの時間間隔の平均値、当該人物に関するレーティングの平均値など)と、労力度抽出部13又は馴化度抽出部14が予測対象行動履歴情報から計算した労力度及び馴化度とを人物に関する情報とし、当該情報と予測モデル記憶部17に記憶された予測モデルとを用いて(当該情報に当該予測モデルを適用して)、予測対象の人物が次に行動を起こす時間情報(時刻等のタイミング)の予測値を計算する。
以下、具体的な例を用いて労力度抽出部13及び馴化度抽出部14のそれぞれが実行する処理について説明する。図3は、労力度抽出部13及び馴化度抽出部14のそれぞれが実行する処理を説明するための図である。図3には、2人の人物(人物A、人物B)のレーティングの時系列変化が示されている。横軸が時間、縦軸がレーティングであり、黒丸が各行動イベントである。また、参照点となるレーティングrとレーティングrが点線によって示されている。
図中左側の人物Aのi番目の行動イベント(その結果、レーティングrを超えた)について、労力度抽出部13は、人物Aが、一つ前のレーティングrを超えてから3回の行動イベントを経ているため、この3回を労力度として抽出する。又は、労力度抽出部13は、時間間隔のdelta1を労力度として抽出しもよい。馴化度抽出部14は、レーティング上昇の結果、人物Aがレーティングrを超えた経験は初めてであるため、馴化度として1を抽出する。
一方、図中右側の人物Bに関して、労力度抽出部13は、3回、又はdelta3を労力度として抽出する。馴化度抽出部14は、レーティングrを良い方向に超えた経験が2回目であるため、人物Bの馴化度として2を抽出する。なお、人物Bの労力のカウント方法だが、レーティングrを初めて超えたケースを除き、rを超えてからrとrの間のレーティングを記録した回数として2回とカウントしてもよい。また、レーティングrを初めて超えたケースのタイミングでカウントをクリアし、その後にrとrの間のレーティングだった回数(1回)を用いてもよい。
予測モデル構築部15においては、人物Aのケースにおいては、労力度(3回又はdelta1)、馴化度(1回)、人物Aの基本的な特徴量(人物Aのi番目の行動イベントまでの時間間隔の平均値、人物Aのi番目の行動イベントまでのレーティングの平均値など)を説明変数として、i+1番目の行動イベントまでの時間間隔であるdelta2を被説明変数としたデータの組み合わせを生成し、これらのデータに基づいて予測モデルを教師あり学習技術を用いて構築(学習)する。予測モデル構築部15は、同様に、人物Bに関する情報にも基づいて予測モデルを学習する。斯かる予測モデルは、例えば、人物Cの次の行動の予測に用いることができる(但し、人物A又は人物Bの次の予測に用いられてもよい。)。
上述したように、本実施の形態によれば、人間の行動を予測する上で重要な特徴・特徴量を明示的に指定し、どのような特徴量を重視すべきか、どういった数式で予測を行うか、についての無数にある可能性を適切に絞り込むことで、予測のためにデータから学習すべき事項を効率的に減らすことができる。そのため、少量のデータしか存在しない場合でも高精度な予測が可能となる。また、従来技術で必要としていたパラメータチューニングのコストを減らすこともできる。よって、行動の予測を効率化することができる。
なお、本実施の形態において、労力度は、第1の特徴量の一例である。馴化度は、第2の特徴量の一例である。労力度抽出部13は、第1の抽出部の一例である。馴化度抽出部14は、第2の抽出部の一例である。予測モデル構築部15は、学習部の一例である。時間予測部16は、予測部の一例である。参照点は、閾値の一例である。
以上、本発明の実施の形態について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
10 行動予測装置
11 操作部
12 出力部
13 労力度抽出部
14 馴化度抽出部
15 予測モデル構築部
16 時間予測部
17 予測モデル記憶部
20 参照点・行動履歴記憶部
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 プロセッサ
105 インタフェース装置
B バス

Claims (7)

  1. 或る人の複数の行動のそれぞれについて当該行動の時間と当該行動の後の前記或る人の状態を示す数値とを含む第1の行動履歴から、或る時点において前記数値が閾値を超えるまでの前記或る人の労力を示す第1の特徴量を抽出する第1の抽出手順と、
    前記第1の行動履歴から、前記或る時点までに前記或る人が前記閾値の示す状態に馴化している度合いを示す第2の特徴量を抽出する第2の抽出手順と、
    前記第1の特徴量及び前記第2の特徴量と、前記第1の行動履歴における或る時点の行動から次の行動までの時間間隔とに基づいて、前記第1の特徴量及び前記第2の特徴量を説明変数とし、前記時間間隔を被説明変数とする予測モデルを学習する学習手順と、
    をコンピュータが実行することを特徴とする行動予測方法。
  2. 前記閾値は複数の段階を有し、
    前記第1の抽出手順は、前記或る時点において超えた第1の段階より一つ下の第2の段階を超えた時点から前記第1の段階を超えるまでの前記或る人の労力を示す第1の特徴量を抽出し、
    前記第2の抽出手順は、前記或る時点までに前記或る人が前記第1の段階に馴化している度合いを示す前記第2の特徴量を抽出する、
    ことを特徴とする請求項1記載の行動予測方法。
  3. 前記予測モデルを用いて、第2の行動履歴の次の行動の時間を予測する予測手順、
    をコンピュータが実行することを特徴とする請求項1又は2記載の行動予測方法。
  4. 或る人の複数の行動のそれぞれについて当該行動の時間と当該行動の後の前記或る人の状態を示す数値とを含む第1の行動履歴から、或る時点において前記数値が閾値を超えるまでの前記或る人の労力を示す第1の特徴量を抽出する第1の抽出部と、
    前記第1の行動履歴から、前記或る時点までに前記或る人が前記閾値の示す状態に馴化している度合いを示す第2の特徴量を抽出する第2の抽出部と、
    前記第1の特徴量及び前記第2の特徴量と、前記第1の行動履歴における或る時点の行動から次の行動までの時間間隔とに基づいて、前記第1の特徴量及び前記第2の特徴量を説明変数とし、前記時間間隔を被説明変数とする予測モデルを学習する学習部と、
    を有することを特徴とする行動予測装置。
  5. 前記閾値は複数の段階を有し、
    前記第1の抽出部は、前記或る時点において超えた第1の段階より一つ下の第2の段階を超えた時点から前記第1の段階を超えるまでの前記或る人の労力を示す第1の特徴量を抽出し、
    前記第2の抽出部は、前記或る時点までに前記或る人が前記第1の段階に馴化している度合いを示す前記第2の特徴量を抽出する、
    ことを特徴とする請求項4記載の行動予測装置。
  6. 前記予測モデルを用いて、第2の行動履歴の次の行動の時間を予測する予測部、
    を有することを特徴とする請求項4又は5記載の行動予測装置。
  7. 請求項1乃至3いずれか一項記載の行動予測方法をコンピュータに実行させることを特徴とするプログラム。
JP2022566576A 2020-12-03 2020-12-03 行動予測方法、行動予測装置及びプログラム Active JP7476984B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/045032 WO2022118428A1 (ja) 2020-12-03 2020-12-03 行動予測方法、行動予測装置及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2022118428A1 JPWO2022118428A1 (ja) 2022-06-09
JP7476984B2 true JP7476984B2 (ja) 2024-05-01

Family

ID=81853065

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022566576A Active JP7476984B2 (ja) 2020-12-03 2020-12-03 行動予測方法、行動予測装置及びプログラム

Country Status (3)

Country Link
US (1) US20230394363A1 (ja)
JP (1) JP7476984B2 (ja)
WO (1) WO2022118428A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200250555A1 (en) 2019-01-31 2020-08-06 Electronics And Telecommunications Research Institute Method and system for creating a game operation scenario based on gamer behavior prediction model

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200250555A1 (en) 2019-01-31 2020-08-06 Electronics And Telecommunications Research Institute Method and system for creating a game operation scenario based on gamer behavior prediction model

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
橋本 幸二郎 ほか,状況と行動の因果関係に着目した人間の行動モデル化手法,電気学会論文誌C,(社)電気学会,2011年,第131巻,第3号,p.635-643,ISSN 0385-4221

Also Published As

Publication number Publication date
WO2022118428A1 (ja) 2022-06-09
JPWO2022118428A1 (ja) 2022-06-09
US20230394363A1 (en) 2023-12-07

Similar Documents

Publication Publication Date Title
Berk Accuracy and fairness for juvenile justice risk assessments
CN111330279B (zh) 一种游戏ai的策略决策模型训练方法和装置
Burghardt et al. The myopia of crowds: Cognitive load and collective evaluation of answers on Stack Exchange
WO2020155300A1 (zh) 一种模型预测方法及装置
US11928573B2 (en) Computer system, a computer device and a computer implemented method
CN111897960B (zh) 动态法律事件间的推理方法、装置、设备和存储介质
JP7279821B2 (ja) 意図特徴量抽出装置、学習装置、方法およびプログラム
US8862523B2 (en) Relational learning for system imitation
US20180361251A1 (en) Monitoring game activity to detect a surrogate computer program
US10795956B1 (en) System and method for identifying potential clients from aggregate sources
JP7476984B2 (ja) 行動予測方法、行動予測装置及びプログラム
JP6828834B2 (ja) 論理計算装置、論理計算方法、およびプログラム
WO2021084609A1 (ja) 学習装置、分類装置、学習方法、分類方法及びプログラム
JP2016224512A (ja) 意思決定支援システム及び意思決定支援方法
KR102404407B1 (ko) 게임 데이터 처리 방법
KR20200092457A (ko) 메타 강화 학습을 이용한 인간 행동패턴 및 행동전략 추정 시스템 및 방법
JP2023042919A (ja) 機械学習モデル評価システム及び方法
CN111144935A (zh) 基于大数据的睡眠会员唤醒方法及系统、服务器及介质
JPWO2019026703A1 (ja) 学習済モデル統合方法、装置、プログラム、icチップ、及びシステム
KR102554626B1 (ko) 점진적 학습을 위한 기계 학습 방법 및 이를 수행하기 위한 컴퓨팅 장치
O'Hanlon Using Supervised Machine Learning to Predict the Final Rankings of the 2021 Formula One Championship
CN115829755B (zh) 交易风险的预测结果的解释方法和装置
CN110796263B (zh) 用于干预优化的系统和方法
JP7189553B2 (ja) 推論方法、推論装置及びプログラム
WO2024060066A1 (zh) 一种文本识别方法、模型及电子设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230421

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240401

R150 Certificate of patent or registration of utility model

Ref document number: 7476984

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150