WO2021220399A1

WO2021220399A1 - 推定装置、推定システム、推定方法及びプログラム

Info

Publication number: WO2021220399A1
Application number: PCT/JP2020/018115
Authority: WO
Inventors: 秀明金
Original assignee: 日本電信電話株式会社
Priority date: 2020-04-28
Filing date: 2020-04-28
Publication date: 2021-11-04
Also published as: JP7392838B2; JPWO2021220399A1; US20230205841A1

Abstract

一実施形態に係る推定装置は、所定の次元の空間領域で観測されたイベントを表す観測点の集合と、前記観測が行われた回数を表す観測回数と、所定の条件を満たす第１の関数と、前記第１の関数のパラメータとを入力して、前記空間領域における前記イベントの発生率を得るためのレート関数を解析的に推定するレート関数推定部、を有することを特徴とする。

Description

推定装置、推定システム、推定方法及びプログラム

　本発明は、推定装置、推定システム、推定方法及びプログラムに関する。

　一次元又は多次元空間上で発生するイベントを表すデータを用いて、当該空間上の各点におけるイベントの発生率（以下、「レート関数」という。）を推定する技術として、Gaussian Cox Processが知られている。例えば、非特許文献１では、変分ベイズ法を用いた近似的なレート関数の推定方法が提案されている。

C. Lloyd, et al., "Variational Inference for Gaussian Process Modulated Poisson Processes", International Conference on Machine Learning, pp.1814-1822 (2015).

　しかしながら、変分ベイズ法を用いた近似は推定結果に誤差や偏りを生じさせる場合があり、真のレート関数と大きく異なる推定値が出力される可能性がある。また、その推定値の誤差の大きさを定量的に評価することが困難であり、誤った推定値を正しいものとして採用してしまう可能性もある。

　本発明の一実施形態は、上記の点に鑑みてなされたもので、解析的にレート関数を推定することを目的とする。

　上記目的を達成するため、一実施形態に係る推定装置は、所定の次元の空間領域で観測されたイベントを表す観測点の集合と、前記観測が行われた回数を表す観測回数と、所定の条件を満たす第１の関数と、前記第１の関数のパラメータとを入力して、前記空間領域における前記イベントの発生率を得るためのレート関数を解析的に推定するレート関数推定部、を有することを特徴とする。

　解析的にレート関数を推定することができる。

実施例１における推定装置の機能構成の一例を示す図である。実施例１における推定処理の流れの一例を示すフローチャートである。実施例２における推定装置の機能構成の一例を示す図である。実施例２における推定処理の流れの一例を示すフローチャートである。実施例３における推定装置の機能構成の一例を示す図である。実施例３における推定処理の流れの一例を示すフローチャートである。本実施形態に係る推定装置のハードウェア構成の一例を示す図である。

　以下、本発明の一実施形態について説明する。本実施形態では、Gaussian Cox Process（以下、「ＧＣＰ」と略記する。）に基づいて、解析的にレート関数を推定することができる推定装置１０について説明する。

　［実施例１］
　まず、本実施形態の実施例１について説明する。

　＜機能構成（実施例１）＞
　実施例１における推定装置１０の機能構成について、図１を参照しながら説明する。図１は、実施例１における推定装置１０の機能構成の一例を示す図である。

　図１に示すように、実施例１における推定装置１０は、推定器生成部１０１と、推定部１０２とを有する。また、実施例１における推定装置１０には、推定対象点１０００と、点事象データ１１００と、ＧＣＰカーネル１２００と、ＧＣＰカーネルパラメータ１３００とが与えられるものとする。なお、推定対象点１０００、点事象データ１１００、ＧＣＰカーネル１２００及びＧＣＰカーネルパラメータ１３００は、例えば、ＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）等の記憶装置に格納されていてもよいし、ユーザの操作等によって入力されてもよいし、通信ネットワークを介して接続される他の装置から受信してもよい。

　推定対象点１０００は、レート関数の値を推定する対象のＰ個の点（座標点）の集合｛ｓ_１，ｓ_２，・・・，ｓ_Ｐ｝であるものとする。これらの各ｓ_ｐ（ｐ＝１，２，・・・，Ｐ）は、後述する空間領域Ｔ内で、レート関数の値の推定対象となる点のことである。

　点事象データ１１００は、観測を実施した空間領域Ｔと、その観測回数Ｒと、当該空間領域Ｔ内で観測されたＮ個のイベントの点（座標点）の集合｛ｔ_１，ｔ_２，・・・，ｔ_Ｎ｝である。なお、空間領域Ｔは予め決められた任意の次元（１次元又は多次元）の空間領域である。

　ＧＣＰカーネル１２００は、以下の条件１及び条件２を満たす関数ｈ（ｔ，ｔ'）である。ただし、ｔ，ｔ'はそれぞれ空間領域Ｔ内の任意の点である。

　条件１：ｈは対称な関数である。すなわち、ｈ（ｔ，ｔ'）＝ｈ（ｔ'，ｔ）である。

　条件２：関数ｈ（ｔ，ｔ'）を積分演算子のカーネルとして利用するとき、当該積分演算子の固有値が０以上１／Ｒ以下となる。ただし、関数ｈ（ｔ，ｔ'）の固有値νは以下の式（１）により定義される。

　ここで、φ（ｔ）は固有関数である。

　以降では、上記の条件１及び条件２を満たす関数を「ＧＣＰカーネル」又は「ＧＣＰカーネル関数」と呼ぶ。ＧＣＰカーネルの例を以下に示す。

　ＧＣＰカーネルの例１：半正定値カーネルｋ（ｔ，ｔ'）とその固有値の上限値ｋ_ｍａｘで定義される以下の式（２）に示す関数ｈはＧＣＰカーネルとなる。

　ただし、ｋ_ｍａｘは、以下の式（３）に示すように、半正定値カーネルｋ（ｔ，ｔ'）を一方の変数（式（３）ではｔ'）に関して積分した関数の最大値として評価される。

　半正定値カーネルｋ（ｔ，ｔ'）としては、強度αと共分散行列Σをパラメータに持つGaussianカーネルｋ_Gauss（ｔ，ｔ'）や、強度αとスケースβをパラメータに持つMaternカーネルｋ_Matern（ｔ，ｔ'）等がある。Gaussianカーネルｋ_Gauss（ｔ，ｔ'）を以下の式（４）に、Maternカーネルｋ_Matern（ｔ，ｔ'）を以下の式（５）にそれぞれ示す。

　ただし、τはベクトル及び行列に対する転置操作を表す。なお、Gaussianカーネルｋ_Gauss（ｔ，ｔ'）やMaternカーネルｋ_Matern（ｔ，ｔ'）以外にも、例えば、Wienerカーネルｋ_Wiener（ｔ，ｔ'）を用いることも可能である。

　ＧＣＰカーネルの例２：半正定値カーネルｋ（ｔ，ｔ'）を用いて定義される第二種フレドホルム型積分方程式の解はＧＣＰカーネルとなる。すなわち、以下の式（６）に示す積分方程式の解ｈ（ｔ，ｔ'）はＧＣＰカーネルとなる。

　ＧＣＰカーネルパラメータ１３００は、ＧＣＰカーネルｈ（ｔ，ｔ'）のパラメータ値である。ＧＣＰカーネルｈ（ｔ，ｔ'）のパラメータの個数及びパラメータが取り得る値の範囲は、ＧＣＰカーネルｈ（ｔ，ｔ'）の定義によって異なる。例えば、半正定値カーネルｋ（ｔ，ｔ'）にGaussianカーネルｋ_Gauss（ｔ，ｔ'）を用いて、上記の式（２）に示す関数ｈをＧＣＰカーネルとした場合、そのパラメータは強度α及び共分散行列Σである。一方で、例えば、半正定値カーネルｋ（ｔ，ｔ'）にMaternカーネルｋ_Matern（ｔ，ｔ'）を用いて、上記の式（２）に示す関数ｈをＧＣＰカーネルとした場合、そのパラメータは強度α及びスケースβである。

　また、ＧＣＰカーネルパラメータ１３００には、レート関数の平均値の平方根を表すパラメータμが含まれる。パラメータμは非負の値を取るものとする。

　ＧＣＰカーネルパラメータ１３００に含まれる各パラメータの値は、通常、本実施形態に係る推定装置１０を適用する事例毎の様々な先行知識や制約等に基づいて決定される。例えば、ＥＣサイトのユーザが或る季節性の強い商材を購入するというイベントを対象として、Maternカーネルｋ_Matern（ｔ，ｔ'）を用いて、上記の式（２）に示す関数ｈをＧＣＰカーネルとした場合、パラメータβは数週程度を表す値とすることが考えられる。また、例えば、いくつかの候補となるパラメータ値を用いてレート関数をそれぞれ推定した上で、それらの推定結果を比較し、主観的に妥当と考えられるパラメータ値を採用することも考えられる。

　推定器生成部１０１は、推定装置１０に与えられた点事象データ１１００とＧＣＰカーネル１２００とＧＣＰカーネルパラメータ１３００とを入力して、レート関数推定器１４００を生成及び出力する。

　レート関数推定器１４００は、空間領域Ｔ内の任意の点ｔにおけるレート関数の推定値を得るための関数λ（ｔ）である。この関数λ（ｔ）は以下の式（７）で表される。

　ただし、

はＧＣＰカーネルｈ（ｔ，ｔ'）を空間領域Ｔにおいて積分した関数、ｈ（ｔ，：）はＮ個のイベントの座標点ｔ_１，ｔ_２，・・・，ｔ_Ｎ上におけるＧＣＰカーネルの値で構成されるベクトル、ｚはＮ個のイベントの座標点ｔ_１，ｔ_２，・・・，ｔ_Ｎ上におけるレート関数の推定値の平方根の逆数で構成されるベクトルとする。すなわち、

とする。

　上記の式（７）に示されるように、レート関数推定器１４００（つまり、λ（ｔ））は

の５つの要素で構成される。したがって、推定器生成部１０１は、これらの５つの要素を出力することで、レート関数推定器１４００を出力する。このとき、推定器生成部１０１は、これら５つの要素の中で未知数であるｚを計算により生成（算出）した上で、レート関数推定器１４００を出力する。ここで、Ｎ次元ベクトルｚの各要素ｚ_ｎ＝λ^－１／２（ｔ_ｎ）はレート関数の推定値の関数であり、かつ、レート関数の推定値は上記の式（７）によりｚの関数であることから、この両者の関係が無矛盾に成り立つための条件式が存在し、その条件式を解くことでｚが算出される。この条件式は、以下の式（８）に示すＮ元連立二次方程式となる。

　なお、ｎ'も１≦ｎ'≦Ｎである。

　推定部１０２は、推定装置１０に与えられた推定対象点１０００と、推定器生成部１０１によって出力されたレート関数推定器１４００とを入力して、推定値１５００を算出及び出力する。すなわち、推定部１０２は、Ｐ個の点ｓ_１，ｓ_２，・・・，ｓ_Ｐのそれぞれを上記の式（７）に示すλ（ｔ）に代入することで、レート関数の推定値の集合｛λ（ｓ_１），λ（ｓ_２），・・・，λ（ｓ_Ｐ）｝を算出する。この｛λ（ｓ_１），λ（ｓ_２），・・・，λ（ｓ_Ｐ）｝が推定値１５００である。

　＜推定処理（実施例１）＞
　次に、実施例１における推定装置１０によって推定値１５００を得るための推定処理の流れについて、図２を参照しながら説明する。図２は、実施例１における推定処理の流れの一例を示すフローチャートである。

　ステップＳ１０１：まず、推定器生成部１０１は、与えられた点事象データ１１００とＧＣＰカーネル１２００とＧＣＰカーネルパラメータ１３００とを入力して、レート関数推定器１４００を生成及び出力する。

　ステップＳ１０２：そして、推定部１０２は、与えられた推定対象点１０００と、上記のステップＳ１０１で出力されたレート関数推定器１４００とを入力して、推定値１５００を算出及び出力する。これにより、レート関数の推定値の集合｛λ（ｓ_１），λ（ｓ_２），・・・，λ（ｓ_Ｐ）｝が得られる。このとき、実施例１における推定装置１０では、近似を用いずに、ＧＣＰに基づいて解析的にレート関数を推定するため、推定結果に意図しない誤差や偏りが含まれてしまう事態を防止することができる。

　なお、上記のステップＳ１０１の処理は、ステップＳ１０２の処理を実行する前に予め実行されていてもよい（この場合、レート関数推定器１４００を記憶装置等に保存しておき、上記のステップＳ１０１の処理では記憶装置等からレート関数推定器１４００を読み出せばよい。）。このとき、同一のレート関数推定器１４００を使用して上記のステップＳ１０２の処理を複数回実行する場合には、上記のステップＳ１０１の処理は１度実行されればよい。また、例えば、上記のステップＳ１０１の処理が他の装置で実行され、この他の装置からレート関数推定器１４００が与えられる場合には、推定装置１０は、上記のステップＳ１０２の処理のみを実行すればよい（この場合、当該他の装置と推定装置１０とでシステムが構成され、当該他の装置が推定器生成部１０１を有する一方で、推定装置１０は推定器生成部１０１を有していなくてもよい。）。

　［実施例２］
　次に、本実施形態の実施例２について説明する。実施例２では、ＧＣＰカーネルパラメータ１３００に含まれる各パラメータの値を主観的に決定するのではなく、主観を廃して決定する場合について説明する。

　＜機能構成（実施例２）＞
　実施例２における推定装置１０の機能構成について、図３を参照しながら説明する。図３は、実施例２における推定装置１０の機能構成の一例を示す図である。

　図３に示すように、実施例２における推定装置１０は、推定器生成部１０１と、推定部１０２と、パラメータ決定部１０３とを有する。また、実施例２における推定装置１０には、推定対象点１０００と、点事象データ１１００と、ＧＣＰカーネル１２００とが与えられるものとする。なお、推定対象点１０００、点事象データ１１００及びＧＣＰカーネル１２００は、例えば、ＨＤＤやＳＳＤ等の記憶装置に格納されていてもよいし、ユーザの操作等によって入力されてもよいし、通信ネットワークを介して接続される他の装置から受信してもよい。

　推定器生成部１０１及び推定部１０２は実施例１と同様であるため、その説明を省略する。ただし、推定器生成部１０１は、パラメータ決定部１０３によって出力されたＧＣＰカーネルパラメータ１３００を入力する。

　パラメータ決定部１０３は、推定装置１０に与えられた点事象データ１１００とＧＣＰカーネル１２００とを入力して、ＧＣＰカーネルパラメータ１３００を出力する。すなわち、パラメータ決定部１０３は、空間領域Ｔと観測回数ＲとＮ個のイベントの点の集合｛ｔ_１，ｔ_２，・・・，ｔ_Ｎ｝とＧＣＰカーネルｈ（ｔ，ｔ'）とを用いて、交差検定によりＧＣＰカーネルパラメータ１３００に含まれる各パラメータの値を最適化な値に決定する。具体的には、パラメータ決定部１０３は、例えば、Ｎ個のイベントの点の集合｛ｔ_１，ｔ_２，・・・，ｔ_Ｎ｝をＫ個のバッチ（部分集合）に分割し、Ｋ－１個のバッチを訓練用、残り１個のバッチを検証用として、検証用のバッチを入れ替えながらパラメータ値の変更と検証とを繰り返すことで、各パラメータ値を最適化する。なお、Ｋは空間領域Ｔや観測回数Ｒに応じて決定すればよい。

　＜推定処理（実施例２）＞
　次に、実施例２における推定装置１０によって推定値１５００を得るための推定処理の流れについて、図４を参照しながら説明する。図４は、実施例２における推定処理の流れの一例を示すフローチャートである。

　ステップＳ２０１：まず、パラメータ決定部１０３は、与えられた点事象データ１１００とＧＣＰカーネル１２００とを入力して、ＧＣＰカーネルパラメータ１３００を出力する。

　ステップＳ２０２：次に、推定器生成部１０１は、与えられた点事象データ１１００及びＧＣＰカーネル１２００と、上記のステップＳ２０１で出力されたＧＣＰカーネルパラメータ１３００とを入力して、レート関数推定器１４００を生成及び出力する。

　ステップＳ２０３：そして、推定部１０２は、与えられた推定対象点１０００と、上記のステップＳ２０２で出力されたレート関数推定器１４００とを入力して、推定値１５００を算出及び出力する。これにより、レート関数の推定値の集合｛λ（ｓ_１），λ（ｓ_２），・・・，λ（ｓ_Ｐ）｝が得られる。しかも、実施例２における推定装置１０では、ＧＣＰカーネルパラメータ１３００を最適化することができるため、例えば、本実施形態係る推定装置１０を適用する事例の先行知識や制約等に関する知識や経験が不足するユーザであっても、精度の良いレート関数の推定値を得ることが可能となる。

　なお、実施例１と同様に、上記のステップＳ２０１及びステップＳ２０２の処理が予め実行されていてもよいし、上記のステップＳ２０１及びステップＳ２０２の処理が他の装置で実行されてもよい。

　［実施例３］
　次に、本実施形態の実施例３について説明する。実施例３では、レート関数の推定値の誤差も算出する場合について説明する。

　＜機能構成（実施例３）＞
　実施例３における推定装置１０の機能構成について、図５を参照しながら説明する。図５は、実施例３における推定装置１０の機能構成の一例を示す図である。

　図５に示すように、実施例３における推定装置１０は、推定器生成部１０１と、推定部１０２と、誤差算出部１０４とを有する。また、実施例３における推定装置１０には、推定対象点１０００と、点事象データ１１００と、ＧＣＰカーネル１２００と、ＧＣＰカーネルパラメータ１３００とが与えられるものとする。なお、推定対象点１０００、点事象データ１１００、ＧＣＰカーネル１２００及びＧＣＰカーネルパラメータ１３００は、例えば、ＨＤＤやＳＳＤ等の記憶装置に格納されていてもよいし、ユーザの操作等によって入力されてもよいし、通信ネットワークを介して接続される他の装置から受信してもよい。

　推定器生成部１０１及び推定部１０２は実施例１と同様であるため、その説明を省略する。

　誤差算出部１０４は、推定装置１０に与えられた推定対象点１０００と、推定器生成部１０１によって出力されたレート関数推定器１４００と、推定部１０２によって出力された推定値１５００とを入力して、誤差１６００を算出及び出力する。誤差１６００は、レート関数の平方根に対し、推定対象とするＰ個の点ｓ_１，ｓ_２，・・・，ｓ_Ｐにおける推定誤差（共分散行列）である。これらの推定誤差σ（ｔ）は、以下の式（９）により算出される。

　ただし、Λ及びＨはそれぞれＮ×Ｎの行列であり、Λの（ｎ，ｎ'）成分をΛ_ｎｎ'＝λ（ｔ_ｎ）δ_ｎｎ'、Ｈの（ｎ，ｎ'）成分をＨ_ｎｎ'＝ｈ（ｔ_ｎ，ｔ_ｎ'）である。なお、δ_ｎｎ'はｎ＝ｎ'のときは１、そうでないときは０を取る関数である。

　＜推定処理（実施例３）＞
　次に、実施例３における推定装置１０によって推定値１５００及び誤差１６００を得るための推定処理の流れについて、図６を参照しながら説明する。図６は、実施例３における推定処理の流れの一例を示すフローチャートである。

　ステップＳ３０１：まず、推定器生成部１０１は、与えられた点事象データ１１００とＧＣＰカーネル１２００とＧＣＰカーネルパラメータ１３００とを入力して、レート関数推定器１４００を生成及び出力する。

　ステップＳ３０２：次に、推定部１０２は、与えられた推定対象点１０００と、上記のステップＳ３０１で出力されたレート関数推定器１４００とを入力して、推定値１５００を算出及び出力する。

　ステップＳ３０３：そして、誤差算出部１０４は、与えられた推定対象点１０００と、上記のステップＳ３０１で出力されたレート関数推定器１４００と、上記のステップＳ３０２で出力された推定値１５００とを入力して、誤差１６００を算出及び出力する。これにより、レート関数の推定値の集合｛λ（ｓ_１），λ（ｓ_２），・・・，λ（ｓ_Ｐ）｝だけなく、推定誤差の集合｛σ（ｓ_１），σ（ｓ_２），・・・，σ（ｓ_Ｐ）｝も得られる。このため、実施例３における推定装置１０では、レート関数の推定値の誤差の大きさを定量的に評価することが可能となる。

　なお、実施例１と同様に、上記のステップＳ３０１の処理が予め実行されていてもよいし、上記のステップＳ３０１の処理が他の装置で実行されてもよい。

　＜応用例＞
　次に、本実施形態に係る推定装置１０を具体的な事例に適用した応用例について説明する。

　・応用例１
　ＥＣサイトにおける広告戦略担当者が、或る商材に関する次年度の夏季セール広告を優先的に送るユーザを特定する状況を考える。まず、ＥＣサイトの当該商材に関する購買履歴データ（ユーザＩＤと購買時刻とのペアで表されるデータの集合）からユーザ毎の購買時刻列を抽出した購買時刻データを準備する。１ユーザの購買時刻データが、イベントの点の集合｛ｔ_１，ｔ_２，・・・，ｔ_Ｎ｝となる。ここで、時刻は１秒単位の１年周期の値（01-01 00:00:00～12-31 23:59:59）を取るものとする。このとき、例えば、過去３年分の購買履歴データを用いるならば、空間領域Ｔは１次元空間、観測回数Ｒは３回となる。

　１ユーザの購買時刻データ、空間領域Ｔ及び観測回数Ｒが含まれる点事象データ１１００と、広告戦略担当者が選択したＧＣＰカーネル１２００及びＧＣＰカーネルパラメータ１３００とを推定装置１０に与えることで、レート関数推定器１４００が出力される。

　次に、広告戦略担当者は、広告を出す予定の期間を１秒単位で区切った時刻点列｛ｓ_１，ｓ_２，・・・，ｓ_Ｐ｝を推定対象点１０００として、推定装置１０に与える。これにより、当該期間の各時刻点における当該ユーザの購買発生確率の推定値１５００（つまり、λ（ｓ_１），λ（ｓ_２），・・・，λ（ｓ_Ｐ））が得られる。

　広告戦略担当者は、例えば、購買発生確率が高いユーザは広告効果が高いという仮説の下、購買発生確率が平均的に高いユーザを選別し、優先的に広告を出すスケジュールを組むことができる。

　なお、ＧＣＰカーネルのパラメータ値に関して業務上の先行知識がない場合は、実施例２で説明したパラメータ決定部１０３により、パラメータ値を決定してもよい。また、実施例３で説明した誤差算出部１０４により、購買発生確率に加えて、その推定誤差を算出してもよい。購買発生確率と共にその推定誤差を算出することで、例えば、各ユーザに対して、購買発生確率の推定値ではなく、購買発生確率が或る一定値以上を取る確率を算出することが可能となる。この確率は推定値の誤差も考慮するため、購買発生確率の高いユーザを特定するより頑強な指標として利用である可能性がある。

　・応用例２
　国や地方自治体あるいは警備会社が、対象地域における警備員の年間配置計画を策定する状況を考える。担当者は、まず、過去の犯罪発生履歴データ（発生時刻並びに発生位置の緯度及び経度で表される３次元ベクトルデータの集合）を準備する。この犯罪発生履歴データが、イベントの点の集合｛ｔ_１，ｔ_２，・・・，ｔ_Ｎ｝となる。ここで、時刻は１秒単位の１年周期の値（01-01 00:00:00～12-31 23:59:59）を取り、緯度及び経度はそれぞれ0.000001度単位の１０進数形式の値を取るものとする。このとき、例えば、過去５年分の犯罪発生履歴データを用いるならば、空間領域Ｔは３次元空間、観測回数Ｒは５回となる。

　犯罪発生履歴データ、空間領域Ｔ及び観測回数Ｒが含まれる点事象データ１１００と、担当者が選択したＧＣＰカーネル１２００及びＧＣＰカーネルパラメータ１３００とを推定装置１０に与えることで、レート関数推定器１４００が出力される。

　次に、担当者は、１年を１秒単位かつ対象地域を0.000001度単位で区切った時空間点列｛ｓ_１，ｓ_２，・・・，ｓ_Ｐ｝を推定対象点１０００として、推定装置１０に与える。これにより、各時空間点における犯罪発生率の推定値１５００（つまり、λ（ｓ_１），λ（ｓ_２），・・・，λ（ｓ_Ｐ））が得られる。したがって、担当者は、犯罪発生率が高い時間帯とエリアを特定することで、警備員の効果的な年間配置計画を策定することが可能となる。

　なお、警備員の年間配置計画策定のための犯罪発生率の推定事例と同様の方法により、例えば、感染症発生率の推定とその活用も可能である。この場合、対象地域の過去の感染症発生履歴データを用いればよい。このとき、感染症発生履歴データには、例えば、対象地域の位置情報（緯度・経度・高度）、時間情報（時間帯や年間等）、天候情報（晴天や雨天等）等が含まれていてもよい（つまり、感染症発生履歴データは、例えば、緯度、経度、高度、時間帯、天候等の情報で構成される多次元ベクトルの集合であってもよい。）。これにより、様々な条件下での感染症発生に関するレート関数を推定することができ、効果的な保健衛生に関する施策の策定が可能となる。

　＜評価＞
　次に、本実施形態に係る推定装置１０が実行する推定処理の手法（提案手法）の評価について説明する。本評価では、参考文献「Aglietti, V., Bonilla, E. V., Damoulas, T., and Cripps, S. Structured variational inference in continuous cox process models. In Advances in Neural Information Processing Systems, pp. 12437-12447, 2019.」の「4 Experiments」に記載されている方法と同様に、インターネット上の「ＵＲＬ：https://github.com/VirgiAgl/STVB」で提供されている人工データセットを用いて評価を行った。

　提案手法の比較対象とする従来手法としては、上記の非特許文献１に記載されている手法を採用した。また、評価指標としては、レート関数の推定値と真値とのＬ２ノルム誤差の平均（Average L2 norm errors）を採用した。ただし、平均は、１０回の試行の平均とした。以下の表１に評価結果を示す。

　ここで、ＰＰ_Gauss、ＰＰ_Matern及びＰＰ_Wienerは、上記の式（２）に示す関数ｈをＧＣＰカーネルとして、それぞれGaussianカーネルｋ_Gauss（ｔ，ｔ'）、Maternカーネルｋ_Matern（ｔ，ｔ'）及びWienerカーネルｋ_Wiener（ｔ，ｔ'）を半正定値カーネルｋ（ｔ，ｔ'）とした提案手法を表す。また、ＶＢＰＰは、上記の非特許文献１に記載されている手法を表す。

　上記の表１中のλ_１（ｔ）、λ_２（ｔ）及びλ_３（ｔ）は上記の参考文献の「4 Experiments」に記載されているものと同様であり、人工データセットに含まれる点列の生成に用いられた強度関数である。なお、上記の表１中の括弧内は、１０回の試行における、レート関数の推定値と真値とのＬ２ノルム誤差の標準誤差（standard errors）である。

　上記の表１に示されるように、強度関数λ_２（ｔ）で生成された点列を用いた場合のＰＰ_WienerはＶＢＰＰよりもやや精度が低いものの、他の場合では、提案手法は従来手法と比較して精度良くレート関数が推定できていることがわかる。

　＜ハードウェア構成＞
　最後に、本実施形態に係る推定装置１０のハードウェア構成について、図７を参照しながら説明する。図７は、本実施形態に係る推定装置１０のハードウェア構成の一例を示す図である。

　図７に示すように、本実施形態に係る推定装置１０は一般的なコンピュータ又はコンピュータシステムで実現され、入力装置２０１と、表示装置２０２と、外部Ｉ／Ｆ２０３と、通信Ｉ／Ｆ２０４と、プロセッサ２０５と、メモリ装置２０６とを有する。これら各ハードウェアは、それぞれがバス２０７を介して通信可能に接続されている。

　入力装置２０１は、例えば、キーボードやマウス、タッチパネル等である。表示装置２０２は、例えば、ディスプレイ等である。なお、推定装置１０は、入力装置２０１及び表示装置２０２のうちの少なくとも一方を有していなくてもよい。

　外部Ｉ／Ｆ２０３は、記録媒体２０３ａ等の外部装置とのインタフェースである。推定装置１０は、外部Ｉ／Ｆ２０３を介して、記録媒体２０３ａの読み取りや書き込み等を行うことができる。記録媒体２０３ａには、例えば、推定装置１０が有する各機能部（推定器生成部１０１、推定部１０２、パラメータ決定部１０３及び誤差算出部１０４）を実現する１以上のプログラムが格納されていてもよい。なお、記録媒体２０３ａには、例えば、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disk）、ＳＤメモリカード（Secure Digital memory card）、ＵＳＢ（Universal Serial Bus）メモリカード等がある。

　通信Ｉ／Ｆ２０４は、推定装置１０を通信ネットワークに接続するためのインタフェースである。なお、推定装置１０が有する各機能部を実現する１以上のプログラムは、通信Ｉ／Ｆ２０４を介して、所定のサーバ装置等から取得（ダウンロード）されてもよい。

　プロセッサ２０５は、例えば、ＣＰＵ（Central Processing Unit）等の各種演算装置である。推定装置１０が有する各機能部は、例えば、メモリ装置２０６に格納されている１以上のプログラムがプロセッサ２０５に実行させる処理により実現される。

　メモリ装置２０６は、例えば、ＨＤＤやＳＳＤ、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリ等の各種記憶装置である。

　本実施形態に係る推定装置１０は、図７に示すハードウェア構成を有することにより、上述した推定処理を実現することができる。なお、図７に示すハードウェア構成は一例であって、推定装置１０は、他のハードウェア構成を有していてもよい。例えば、推定装置１０は、複数のプロセッサ２０５を有していてもよいし、複数のメモリ装置２０６を有していてもよい。

　本発明は、具体的に開示された上記の実施形態に限定されるものではなく、請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。また、各実施例の組み合わせも可能である。例えば、実施例２と実施例３とを組み合わせて、推定器生成部１０１と推定部１０２とパラメータ決定部１０３と誤差算出部１０４とを有する推定装置１０が構成されてもよい。

　１０　　　　推定装置
　１０１　　　推定器生成部
　１０２　　　推定部
　１０３　　　パラメータ決定部
　１０４　　　誤差算出部
　２０１　　　入力装置
　２０２　　　表示装置
　２０３　　　外部Ｉ／Ｆ
　２０３ａ　　記録媒体
　２０４　　　通信Ｉ／Ｆ
　２０５　　　プロセッサ
　２０６　　　メモリ装置
　２０７　　　バス

Claims

　所定の次元の空間領域で観測されたイベントを表す観測点の集合と、前記観測が行われた回数を表す観測回数と、所定の条件を満たす第１の関数と、前記第１の関数のパラメータとを入力して、前記空間領域における前記イベントの発生率を得るためのレート関数を解析的に推定するレート関数推定部、
　を有することを特徴とする推定装置。
　前記所定の条件は、
　前記第１の関数が対称関数であること、かつ、前記観測回数をＲとして、前記第１の関数を積分演算子のカーネル関数として利用した場合における固有値が０以上１／Ｒ以下であること、を特徴とする請求項１に記載の推定装置。
　前記空間領域内の点であり、かつ、前記イベントの発生率の推定対象となる点を表す推定対象点の集合と、前記レート関数とを入力して、前記推定対象点におけるイベントの発生率を推定する発生率推定部、を更に有することを特徴とする請求項１又は２に記載の推定装置。
　前記レート関数推定部は、
　前記観測回数と、前記レート関数の平均値の平方根を表すパラメータと、前記第１の関数を前記空間領域で積分した第２の関数と、前記観測点における前記第１の関数の値を表すベクトルと、前記観測点における前記レート関数の推定値の平方根の逆数を表すベクトルとが含まれる前記レート関数を解析的に推定する、ことを特徴とする請求項１乃至３の何れか一項に記載の推定装置。
　第１の装置と、前記第１の装置とは異なる第２の装置とが含まれる推定システムであって、
　前記第１の装置は、
　所定の次元の空間領域で観測されたイベントを表す観測点の集合と、前記観測が行われた回数を表す観測回数と、所定の条件を満たす第１の関数と、前記第１の関数のパラメータとを入力して、前記空間領域における前記イベントの発生率を得るためのレート関数を解析的に推定するレート関数推定部、を有し、
　前記第２の装置は、
　前記空間領域内の点であり、かつ、前記イベントの発生率の推定対象となる点を表す推定対象点の集合と、前記レート関数とを入力して、前記推定対象点におけるイベントの発生率を推定する発生率推定部、を有することを特徴とする推定システム。
　所定の次元の空間領域で観測されたイベントを表す観測点の集合と、前記観測が行われた回数を表す観測回数と、所定の条件を満たす第１の関数と、前記第１の関数のパラメータとを入力して、前記空間領域における前記イベントの発生率を得るためのレート関数を解析的に推定するレート関数推定手順、
　をコンピュータが実行することを特徴とする推定方法。
　コンピュータを、請求項１乃至４の何れか一項に記載の推定装置、又は、請求項５に記載の推定システムに含まれる第１の装置若しくは第２の装置、として機能させるプログラム。