WO2019078101A1

WO2019078101A1 - 情報処理装置、リスク予測方法、およびプログラム

Info

Publication number: WO2019078101A1
Application number: PCT/JP2018/038052
Authority: WO
Inventors: 中川　淳子
Original assignee: 日本電気株式会社
Priority date: 2017-10-18
Filing date: 2018-10-12
Publication date: 2019-04-25
Also published as: US20210201219A1; JP6627842B2; JP2019075017A

Abstract

情報処理装置（１０）は、対象領域のリスク発生履歴データを、対象領域におけるリスク分布を空間的および時間的に示す分布関数、分布関数の空間的パラメータ、および、分布関数の時間的パラメータの組み合わせ毎のリスク値の算出に用いる学習データと、分布関数、空間的パラメータ、および時間的パラメータの組み合わせの評価に用いる評価値算出用データと、に分割するデータ分割部（１１０）と、学習データに基づく組み合わせ毎のリスク値と評価値算出用データとを基に算出された組み合わせ毎の評価値に基づいて、分布関数、空間的パラメータ、および、時間的パラメータの組み合わせの中から、一の組み合わせを選択する選択部（１２０）と、選択された一の組み合わせを用いて、対象領域におけるリスク予測結果を出力する出力部（１３０）と、を備える。

Description

情報処理装置、リスク予測方法、およびプログラム

　本発明は、発生し得るリスクを予測する技術に関する。

　犯罪や疾病といったリスクを予測する技術の一例が、例えば下記特許文献および非特許文献に開示されている。

　下記特許文献１では、サーバが、過去の犯罪データを数学的に分析し、いつ、どこで、どのようなタイプの犯罪が起こるかについての定量的確率（すなわち予測）を算出し、当該予測をｂｏｘと呼ぶターゲットリアに投影し、数学的な分析に基いて警察のリソース配置案を提案する技術が開示されている。その他にも、下記特許文献２および３には、過去に発生した犯罪データを数学的に分析し、対象の領域におけるリスクを予測して提示する技術が開示されている。

　また、下記特許文献４には、監視カメラの表示頻度および表示頻度の増加度合いに基づいて、表示頻度の少ない監視カメラを特定することによって、監視カメラの設置レイアウトを見直す際に役立つ情報を提供する技術が開示されている。

　また、下記非特許文献１には、ある領域における犯罪発生履歴データから時空間Ｋ関数という統計量を算出することで犯罪発生の近接反復被害の現象を分析する技術が開示されている。犯罪発生の近接反復被害とは、ある犯罪発生の近くの場所でかつ時間的に短い間に繰り返し発生する、という性質で、発生の集積度合いを時間的空間的に分析することで、近接反復被害の有無がわかるとされ、その分析に時空間Ｋ関数を用いている。

米国特許第８９４９１６４号明細書米国特許第９１２９２１９号明細書米国特許出願公開第２０１５／０３７９４１３号明細書特開２０１２－２１３１２４号公報

菊池城治、雨宮護、島田貴仁、齊藤知範、原田豊、「近接反復被害の罪種間比較 -時空間Ｋ関数の応用-」、GIS-理論と応用、2010、Vol.18、No.2、pp.21-30

　上述したような、発生し得るリスクの予測を行う技術においては、その予測結果と実際の観測結果（リスクの発生結果）とが高い確率で一致することが望ましい。

　本発明は、上記の課題に鑑みてなされたものである。本発明の目的の一つは、発生し得るリスクを高い精度で予測可能とする技術を提供することである。

　本発明によれば、
　対象領域のリスク発生履歴データを、前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせ毎のリスク値の算出に用いる学習データと、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせの評価に用いる評価値算出用データと、に分割するデータ分割手段と、
　前記学習データに基づく前記組み合わせ毎のリスク値と前記評価値算出用データとを基に算出された前記組み合わせ毎の評価値に基づいて、前記分布関数、前記空間的パラメータ、および、前記時間的パラメータの組み合わせの中から、一の組み合わせを選択する選択手段と、
　前記選択手段により選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する出力手段と、
　を備える情報処理装置が提供される。

　本発明によれば、
　対象領域を複数のセルに分割するセル分割手段と、
　前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせを複数生成する生成手段と、
　前記対象領域のリスク発生履歴データの中から前記セル毎のリスク発生履歴データを用いて前記組み合わせ毎の評価値を算出し、前記組み合わせ毎の評価値に基づいて、前記複数の組み合わせの中から一の組み合わせを選択する選択手段と、
　前記選択手段により選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する出力手段と、
　を備える情報処理装置が提供される。

　本発明によれば、
　コンピュータが、
　対象領域のリスク発生履歴データを、前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせ毎のリスク値の算出に用いる学習データと、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせの評価に用いる評価値算出用データと、に分割し、
　前記学習データに基づく前記組み合わせ毎のリスク値と前記評価値算出用データとを基に算出された前記組み合わせ毎の評価値に基づいて、前記分布関数、前記空間的パラメータ、および、前記時間的パラメータの組み合わせの中から、一の組み合わせを選択し、
　選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する、
　ことを含む第１のリスク予測方法が提供される。

　本発明によれば、
　対象領域を複数のセルに分割し、
　前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせを複数生成し、
　前記対象領域のリスク発生履歴データの中から前記セル毎のリスク発生履歴データを用いて前記組み合わせ毎の評価値を算出し、前記組み合わせ毎の評価値に基づいて、前記複数の組み合わせの中から一の組み合わせを選択し、
　選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する、
　ことを含む第２のリスク予測方法が提供される。

　本発明によれば、
　コンピュータに第１のリスク予測方法を実行させるプログラムが提供される。

　本発明によれば、
　コンピュータに第２のリスク予測方法を実行させるプログラムが提供される。

　本発明によれば、発生し得るリスクを高い精度で予測可能とする技術が提供される。

　上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。

第１実施形態における情報処理装置の機能構成を概念的に示すブロック図である。情報処理装置のハードウエア構成を概念的に示す図である。履歴データ記憶部が記憶する情報の一例を示す図である。第１実施形態の情報処理装置での処理の流れを例示するフローチャートである。第２実施形態の情報処理装置の機能構成を概念的に示すブロック図である。第２実施形態の情報処理装置での処理の流れを例示するフローチャートである。カーネル関数を例示する図である。分布関数、空間的パラメータ、および時間的パラメータの組み合わせを記憶するテーブルの一例を示す図である。選択部が学習データを抽出する流れを説明するための図である。リスク値相対ランク合計を算出する流れを説明するための図である。組み合わせ毎の評価値を記憶するテーブルの一例を示す図である。分布関数、空間的パラメータ、および時間的パラメータの最適な組み合わせを記憶するテーブルの一例を示す図である。第３実施形態の情報処理装置の機能構成を概念的に示すブロック図である。第３実施形態の情報処理装置での処理の流れを例示するフローチャートである。組み合わせ毎の評価値を記憶するテーブルの一例を示す図である。分布関数、空間的パラメータ、および時間的パラメータの最適な組み合わせを記憶するテーブルの一例を示す図である。

　以下、本発明の実施形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。また、特に説明する場合を除き、各ブロック図において、各ブロックは、ハードウエア単位の構成ではなく、機能単位の構成を表している。

　［概要説明］
　本発明に係る情報処理装置は、過去に発生したリスクの履歴データ（以下、「リスク発生履歴データ」と表記）を用いて、リスクの分布を空間的および時間的に示す分布関数、並びに、該分布関数で使用される空間的パラメータおよび時間的パラメータの組み合わせの中から、最適な組み合わせを決定する。本明細書において、「最適な組み合わせ」とは、リスクの予測的中率が、その他の組み合わせよりも高い組み合わせのことを言う。また、本明細書における「リスク」とは、特に限定されないが、例えば、犯罪、疾病、感染症（インフルエンザなど）、家畜または農作物の伝染病などによる病害、害虫、地震や台風といった自然災害などである。以下の各実施形態では、これらの「リスク」のうち「犯罪」を取り扱うケースを主に例示する。

　［第１実施形態］
　〔機能構成〕
　図１は、第１実施形態における情報処理装置１０の機能構成を概念的に示すブロック図である。図１に示されるように、本実施形態の情報処理装置１０は、データ分割部１１０、選択部１２０、および、出力部１３０を有する。

　データ分割部１１０は、対象領域のリスク発生履歴データを、分布関数、空間的パラメータ、時間的パラメータの組み合わせ毎のリスク値の算出に用いるデータ（以下、「学習データ」と表記）と、当該組み合わせの評価に用いるデータ（以下、評価値算出用データ）と表記）と、に分割する。ここで、リスク値とは、リスクが発生する確率の高低を示す値であり、任意の範囲の値を取り得る。選択部１２０は、学習データに基づく組み合わせ毎のリスク値と、評価値算出用データとを基に、当該組み合わせ毎の評価値を算出する。また、選択部１２０は、算出された組み合わせ毎の評価値に基づいて、分布関数、空間的パラメータ、および、時間的パラメータの複数の組み合わせの中から、最適な組み合わせを一つ選択する。出力部１３０は、選択部１２０により選択された組み合わせを用いて、対象領域におけるリスクを予測し、その結果を出力する。

　〔ハードウエア構成〕
　情報処理装置１０の各機能構成部は、各機能構成部を実現するハードウエア（例：ハードワイヤードされた電子回路など）で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ（例：電子回路とそれを制御するプログラムの組み合わせなど）で実現されてもよい。以下、情報処理装置１０の各機能構成部がハードウエアとソフトウエアとの組み合わせで実現される場合について、さらに説明する。

　図２は、情報処理装置１０のハードウエア構成を概念的に示す図である。図２に示されるように、情報処理装置１０は、バス１０１、プロセッサ１０２、メモリ１０３、ストレージデバイス１０４、入出力インタフェース１０５、及びネットワークインタフェース１０６を含んで構成される。

　バス１０１は、プロセッサ１０２、メモリ１０３、ストレージデバイス１０４、入出力インタフェース１０５、及びネットワークインタフェース１０６が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ１０２、メモリ１０３、ストレージデバイス１０４、入出力インタフェース１０５、及びネットワークインタフェース１０６などを互いに接続する方法は、バス接続に限定されない。

　プロセッサ１０２は、ＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）などの演算装置である。メモリ１０３は、ＲＡＭ（Random Access Memory）やＲＯＭ（Read Only Memory）などを用いて実現される主記憶装置である。ストレージデバイス１０４は、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、メモリカードなどを用いて実現される補助記憶装置である。

　ストレージデバイス１０４は、情報処理装置１０の各機能構成部（データ分割部１１０、選択部１２０、出力部１３０）を実現するプログラムモジュールを記憶している。プロセッサ１０２は、これら各プログラムモジュールをメモリ１０３に読み出して実行することで、各プログラムモジュールに対応する機能を実現する。

　入出力インタフェース１０５は、情報処理装置１０と周辺機器とを接続するためのインタフェースである。入出力インタフェース１０５には、入力装置３０や表示装置４０等が接続される。入力装置３０は、キーボードやマウスといった入力用のデバイスである。表示装置４０は、例えば、ＬＣＤ（Liquid Crystal Display）やＣＲＴ（Cathode Ray Tube）ディスプレイといった表示出力用のデバイスである。

　ネットワークインタフェース１０６は、情報処理装置１０をＬＡＮ（Local Area Network）やＷＡＮ（Wide Area Network）などの通信網に接続するためのインタフェースである。なお、通信網に接続する方法は、無線接続であってもよいし、有線接続であってもよい。ネットワークインタフェース１０６には、例えば、リスク発生履歴データを記憶する履歴データ記憶部２１０を備える外部装置２０などが接続され得る。また、履歴データ記憶部２１０は、情報処理装置１０に備えられていてもよい。履歴データ記憶部２１０は、リスクの発生履歴を示すデータを蓄積する（例：図３）。図３は、履歴データ記憶部２１０が記憶する情報の一例を示す図である。図３の例において、履歴データ記憶部２１０は、犯罪タイプ、犯罪の発生年月日および時刻、並びに、犯罪の発生位置を含むデータを記憶している。なお、図３に示されるように、犯罪タイプは、例えば、犯罪の種類（例：ひったくり、自転車盗、万引き等）や、被害者の属性（例：性別、年齢等）といったカテゴリーに分類されていてもよい。

　〔動作例〕
　図４を用いて、第１実施形態の情報処理装置１０の動作例を説明する。図４は、第１実施形態の情報処理装置１０での処理の流れを例示するフローチャートである。

　データ分割部１１０は、例えば、情報処理装置１０のオペレータによる対象領域の指定入力を、入力装置３０を介して受け付ける（Ｓ１０２）。そして、履歴データ記憶部２１０に記憶されているリスク発生履歴データの中から、Ｓ１０２の処理で指定された対象領域のデータを抽出する（Ｓ１０４）。ここで、データ分割部１１０は、期間を指定する入力を更に受け付け、当該指定期間のデータを対象として抽出してもよい。そして、データ分割部１１０は、抽出したデータを学習データと評価値算出用データとに分割する（Ｓ１０６）。一例として、データ分割部１１０は、次のように抽出したデータを学習データと評価値算出用データとに分割することができる。まず、データ分割部１１０は、指定された期間内にサンプル時刻を設定する。そして、データ分割部１１０は、時間的パラメータに基づいて当該サンプル時刻よりも過去の時点を特定し、サンプル時刻と過去の時点とで定義される期間に含まれるデータを学習データとして設定する。またデータ分割部１１０は、サンプル時刻後の所定の評価期間に含まれるデータを評価値算出用データとして設定する。なお、データ分割部１１０は、指定された期間内に、複数のサンプル時刻を設定し、その複数のサンプル時刻の各々において、学習データと評価値算出用データとを設定してもよい。複数のサンプル時刻を設けることより、学習データと評価値算出用データの組み合わせが複数生成される。そして、複数の組み合わせを用いて評価値を算出することによって、評価値の信頼性が向上する。

　そして、選択部１２０は、分布関数、空間的パラメータ、および時間的パラメータの組み合わせ毎に、学習データを用いてリスク値を算出する（Ｓ１０８）。ここで、分布関数、空間的パラメータ、および時間的パラメータの複数の組み合わせは、所定の記憶装置（例えば、メモリ１０３やストレージデバイス１０４）に予め記憶されていてもよい。また、選択部１２０が、所定のルールに従って分布関数、空間的パラメータ、および時間的パラメータの複数の組み合わせを作成してもよい。さらに、選択部１２０は、学習データを用いて組み合わせ毎に算出された組み合わせ毎のリスク値と、評価値算出用データとに基づいて、組み合わせ毎の評価値を算出する（Ｓ１１０）。一例として、選択部１２０は、各サンプル時刻の学習データを用いて算出された組み合わせ毎のリスクの値と、各サンプル時刻に対応する評価期間でのリスク発生件数（各サンプル時刻の評価値算出用データの件数）とに基づいて、各組み合わせによって算出されたリスク値が実際のリスク発生件数にどの程度関連するかを示す数値を算出することができる。そして、選択部１２０は、算出した組み合わせ毎の評価値に基づいて、最も評価値の高い組み合わせを選択する（Ｓ１１２）。

　そして、出力部１３０は、対象領域に対して選択された、分布関数、空間的パラメータ、時間的パラメータの組み合わせを用いて未来時点のリスク分布を算出し、それを予測結果として表示装置４０などに出力する（Ｓ１１４）。例えば、出力部１３０は、リスク分布の予測結果を示すマップを表示装置４０などに出力する。また、出力部１３０は、リスク分布の予測結果を示すマップを図示しない印刷装置に出力してもよい。この場合、図示しない印刷装置から、リスク分布の予測結果を示すマップが出力される。

　なお、最適な分布関数と各パラメータの組み合わせを選択するＳ１１２までの処理と、選択された組み合わせを使ってリスクを予測するＳ１１４の処理は、必ずしも続けて実行されなくてもよい。

　以上、本実施形態では、過去に発生したリスクの履歴データを用いて、分布関数および当該分布関数のパラメータの組み合わせ毎に、その予測的中率の高さが評価される。そして、複数の組み合わせの中から、最も評価の高い組み合わせ（即ち、リスクの予測的中率の高い組み合わせ）が選択される。そして、このように選択された組み合わせを用いて、対象領域のリスクを予測することによって、当該対象領域で発生し得るリスクを高精度に予測することができる。また、予測の精度が上がることにより、リスク管理を行う人物が効果的な対策を立て易くなるという効果も見込める。

　［第２実施形態］
　〔機能構成〕
　図５は、第２実施形態の情報処理装置１０の機能構成を概念的に示すブロック図である。本実施形態の情報処理装置１０は、セル分割部１４０、生成部１５０、選択部１６０、及び出力部１７０を備える。

　セル分割部１４０は、対象領域を指定する情報の入力を受け、当該対象領域を複数の小領域（以下、「セル」と表記）に分割する。生成部１５０は、対象領域におけるリスク分布を空間的および時間的に示す分布関数、当該分布関数の空間的パラメータ、および、当該分布関数の時間的パラメータの組み合わせを複数生成する。選択部１６０は、対象領域のリスク発生履歴データの中からセル毎のリスク発生履歴データを用いて、生成部１５０により生成された、分布関数、空間的パラメータ、および時間的パラメータの組み合わせ毎の評価値を算出する。また、選択部１６０は、算出した組み合わせ毎の評価値に基づいて、分布関数、空間的パラメータ、および時間的パラメータの複数の組み合わせの中から一の組み合わせを選択する。具体的には、選択部１６０は、評価値が最も高い組み合わせを選択する。出力部１７０は、第１実施形態と同様に、選択部１６０により選択された分布関数、空間的パラメータ、および時間的パラメータの組み合わせを用いて、対象領域におけるリスク予測結果を出力する。

　〔ハードウエア構成〕
　本実施形態のハードウエア構成は、第１実施形態と同様（例：図２）である。本実施形態のストレージデバイス１０４は、上述のセル分割部１４０、生成部１５０、選択部１６０、および出力部１７０の機能をそれぞれ実現するプログラムモジュールを記憶している。情報処理装置１０のプロセッサ１０２がこれらのプログラムモジュールを実行することによって、上述のセル分割部１４０、生成部１５０、選択部１６０、および出力部１７０の機能が実現される。

　〔動作例〕
　図６を用いて、第２実施形態の情報処理装置１０の動作例を説明する。図６は、第２実施形態の情報処理装置１０での処理の流れを例示するフローチャートである。ここでは、リスクが「犯罪」である場合の処理の一例を示す。

　まず、情報処理装置１０は、分布関数および各パラメータの最適な組み合わせを選択する際の条件の入力を受け付ける（Ｓ２０２）。一例として、情報処理装置１０は、対象領域、学習期間（組み合わせ毎の評価で用いるデータが属する期間）の指定入力を受け付ける。また、情報処理装置１０は、上記条件の１つとして、犯罪タイプ（例えば、犯罪の種類や、犯罪被害者の性別／年齢、又はそれらの組み合わせ）を受け付ける受付部（図示せず）を更に備えていてもよい。また、情報処理装置１０は、リスクの分布関数を取得する。リスクの分布関数は、例えば、メモリ１０３やストレージデバイス１０４、或いは、図示しない外部の記憶装置に記憶されている。

　ここで、リスクの分布関数は例えば下記の式（１）を用いて定義され得る。

　上記の式（１）において、Ｒ（ｇ，ｋ）は「時刻ｔ^ｋにおけるセルｇのリスク値」を意味する。また、上記の式（１）において、ｈ_ｓは空間バンド幅（空間的パラメータ）、ｈ_ｔは時間バンド幅（時間的パラメータ）である。また、上記の式（１）において、Ｉ^ｋは、リスク値の算出に利用する犯罪発生履歴データの数を示す。また、ｉは、リスク値の算出に利用する各犯罪発生履歴データに付与されるラベル番号である。また、上記の式（１）において、Ｋ_ｓおよびＫ_ｔは、それぞれ、分布関数における空間的および時間的な広がり方を決定するカーネル関数の形状を示す。Ｋ_ｓおよびＫ_ｔに設定するカーネル関数は、例えば、図７に示すような様々な形状のカーネル関数から選択され得る。図７には、５つの形状のカーネル関数（Ｕｎｉｆｏｒｍ（実線）、Ｔｒｉａｎｇｕｌａｒ（点線）、Ｑｕａｒｔｉｃ（短破線）、Ｎｏｒｍａｌ（一点鎖線）、Ｎｅｇａｔｉｖｅ　Ｅｘｐｏｎｅｎｔｉａｌ（長破線））が例示されている。なお、図７はあくまで一例であり、カーネル関数は図７に示される形状に限定されない。また、Ｋ_ｓおよびＫ_ｔに設定するカーネル関数は、同じ形状であってもよいし、異なる形状であってもよい。図７の例では、上記式（１）に対するカーネル関数の組み合わせとして、２５通りの組み合わせが得られる。なお、分布関数で使用されるパラメータは、空間的パラメータおよび時間的パラメータのいずれか一方であってもよい。例えば、対象領域のリスク分布が、日曜日および祝日と他の曜日とでは異なることを表す分布関数の定義は、空間的パラメータを含まず時間的パラメータを含む。また、分布関数は、複数の項の和で定義され、各項の割合を表す係数をパラメータにしてもよい。たとえば、図７に示すカーネル関数の中から２つのカーネル関数を選び、各カーネル関数にそれぞれ個別の係数を乗じて和をとったものを分布関数としてもよい。この場合も各実施形態の方法で最適な組み合わせを選択できる。

　下記の式（２）は、上記（１）の式にカーネル関数を組み合わせた具体例である。なお、下記の式（２）において、ｘ_ｇおよびｙ_ｇは、互いに直交するｘ軸およびｙ軸で定義される空間における、セルｇの位置座標（例えば、セルの中心点の位置座標）を示す。また、ｘ_ｉおよびｙ_ｉは、互いに直交するｘ軸およびｙ軸で定義される空間における、ラベルｉ番目の犯罪発生履歴データに含まれる犯罪の位置座標を示す。また、ｔ_ｉはラベルｉ番目の犯罪発生履歴データに含まれる犯罪の発生年月日時刻を示す。

　上記の式（２）によれば、セルｇの位置座標（ｘ_ｇ，ｙ_ｇ）とラベルｉ番目の犯罪発生履歴データの位置座標（ｘ_ｉ，ｙ_ｉ）との距離が短いほどセルｇのリスク値が増加し、また、該距離が長いほどセルｇのリスク値が減少することが分かる。また、上記の式（２）によれば、時刻ｔ^ｋとラベルｉ番目の犯罪発生履歴データの発生年月日時刻ｔ_ｉとが近いほど、セルｇのリスク値が増加し、また、時刻ｔ^ｋとラベルｉ番目の犯罪発生履歴データの発生年月日時刻ｔ_ｉとが離れているほどセルｇのリスク値が減少することが分かる。上記で例示されるような式を用いて全てのセルのリスク値を算出することによって、対象領域のリスク分布が得られる。

　次に、セル分割部１４０は、指定された対象領域を複数のセルに分割する（Ｓ２０４）。セル分割部１４０は、予め決められたルールまたは情報処理装置１０のオペレータからの入力に基づいて、セルの形状およびサイズを任意に設定することができる。一例として、セル分割部１４０は、対象領域を包含する四角形の短辺の長さをΔｓとした場合、当該Δｓの１００分の１の長さを一辺の長さとして有する正方形を単位セルとして設定することができる。そして、セル分割部１４０は、単位セル同士が重ならないように各々の単位セルの対象領域内での位置を決定し、各々の単位セルにラベルｇ（各セルを区別する情報）を付与することによって、対象領域を分割する。

　次に、生成部１５０は、分布関数および各パラメータの組み合わせを複数生成する（Ｓ２０６）。生成部１５０は、例えば次のようにして、分布関数および各パラメータの複数の組み合わせを生成することができる。

　まず、生成部１５０は、指定された期間において、複数のサンプル時刻ｔ^ｋ（ｋ＝１，２，３，・・・，Ｋ）を設定する。また、サンプル時刻の数Ｋは、生成部１５０により自動的に決定されてもよいし、オペレータの入力によって任意に設定されてもよい。具体的な例として、２０００年１月１日０時０分から２０００年１２月３１日２３時５９分までの期間が指定された場合、生成部１５０は、当該期間（３６６日）の１／１００を四捨五入した４日間隔でサンプル時刻ｔ^ｋを設定することができる。この場合、サンプル時刻ｔ^ｋは、「ｔ^１＝２０００年１月１日０時０分、ｔ^２＝２０００年１月５日０時０分、・・・、ｔ^Ｋ＝２０００年１２月３０日０時０分」であり、そのサンプル時刻数Ｋは９２である。

　そして、生成部１５０は、サンプル時刻毎の犯罪発生件数を集計する期間（評価期間Δｔ）を決定する。例えば、生成部１５０は、まず、履歴データ記憶部２１０に記憶されている犯罪発生履歴データの犯罪タイプおよび位置情報を基に、Ｓ２０２の処理で指定された犯罪タイプかつ対象領域の犯罪発生データを特定する。そして、生成部１５０は、当該特定した犯罪発生データの発生年月日時刻を基に算出される発生間隔の平均値を、評価期間Δｔとして設定することができる。具体的には、指定されたタイプの犯罪が対象領域において平均３日間隔で発生している場合、生成部１５０は、Δｔを３日と設定することができる。なお、評価期間は、サンプル時刻毎に異なる値であってもよい。

　そして、生成部１５０は、例えば、セル分割部１４０により設定された単位セルの一辺の長さΔｓの定数倍（例：１、５、１０倍）を空間的パラメータｈ_ｓと、また、評価期間Δｔの定数倍（例：５、１０、１００倍）を時間的パラメータｈ_ｔとして設定することができる。そして、生成部１５０は、例えばメモリ１０３やストレージデバイス１０４、或いは、図示しない他の記憶装置に予め記憶された複数の分布関数毎に、空間的パラメータｈ_ｓおよび時間的パラメータｈ_ｔを設定し、例えば図８に示すようなテーブルを生成する。図８は、分布関数、空間的パラメータ、および時間的パラメータの組み合わせを記憶するテーブルの一例を示す図である。図８に例示されるように、テーブルは、リスクの分布関数（上記の式（２）等）に、空間的パラメータｈ_ｓおよび時間的パラメータｈ_ｔを紐付けて記憶している。

　また、生成部１５０は、非特許文献１に開示される技術を基に、分布関数および各パラメータの組み合わせを生成することができる。非特許文献１には、ある領域における犯罪発生履歴データから時空間Ｋ関数という統計量を算出することで犯罪発生の近接反復被害の現象を分析する技術が開示されている。犯罪発生の近接反復被害とは、ある場所で犯罪が発生した場合に、その場所の近隣において、短い期間のうちに犯罪が繰り返し発生する、という性質である。近接反復被害の有無は、発生した犯罪の集積度合いを時間的および空間的に分析することでわかるとされている。非特許文献１では、これを、時空間Ｋ関数を用いて分析している。犯罪発生履歴データから、非特許文献１において時空間Ｋ関数を算出して得られる値（以下、「Ｄ_０」と表記）は、発生した犯罪が時間的および空間的に集積する程度や集積する範囲を表すとされている。つまり、Ｄ_０は、犯罪発生の時間的および空間的な分布を表す。生成部１５０は、このＤ_０をリスク分布関数として用いることができる。なお、非特許文献１において、空間的パラメータとして「発生場所からの距離帯と距離の範囲」を、時間的パラメータとして「発生年月日時刻からの時間幅と時間範囲」をそれぞれ指定して、Ｄ_０が算出される。生成部１５０は、例えば、「距離帯」として「単位セルの一辺の長さΔｓ」、「距離の範囲」として「対象領域の短辺の長さ」、「時間幅」として、上述の「評価期間Δｔ」、「時間範囲」として例えば「一年間」等と設定し、非特許文献１の方法でＤ_０を算出することで、分布関数および各パラメータの組み合わせを生成できる。

　次に、選択部１６０は、図８に例示されるようなテーブルに記憶されている、分布関数、空間的パラメータ、および時間的パラメータの複数の組み合わせの中から１つの組み合わせを選択し、その組み合わせのリスク値を算出する（Ｓ２０８）。例えば、選択部１６０は次のようにリスク値を算出することができる。まず、選択部１６０は、サンプル時刻ｔ^ｋ（ｋ＝１，２，３，・・・，Ｋ）と、選択した組み合わせの空間的パラメータｈ_ｓおよび時間的パラメータｈ_ｔとを基に、以下の式（３）で示す条件を満たす犯罪発生履歴データ（以下、「学習データ」とも表記）を、履歴データ記憶部２１０から抽出する。ここで、図示しない受付部が犯罪タイプ（リスクの種別）の指定入力を受け付けている場合、選択部１６０は、当該指定入力により指定された犯罪タイプ（リスクの種別）に対応するデータを選別することができる。サンプル時刻ｔ^ｋ（ｋ＝１，２，３，・・・，Ｋ）で抽出された学習データの件数をＩ^ｋとすると、選択部１６０は、Ｉ^ｋ個の学習データそれぞれにラベルｉ（ｉ＝１，２，３，・・・，Ｉ^ｋ）を付与する。

　上述の流れを、図９を用いて説明する。図９は、選択部１６０が学習データを抽出する流れを説明するための図である。図９において、バツ印は上記（３）式を満たす犯罪発生履歴データを示す。選択部１６０は、サンプル時刻ｔ^ｋ（ｔ^１，ｔ^２，・・・，ｔ^Ｋ）のそれぞれにおいて、バツ印で示す犯罪発生履歴データを学習データとして抽出する。例えば、サンプル時刻ｔ^１の場合には、ｉ＝１からＩ^１のラベルが付与されたＩ^１個の学習データが選択部１６０により抽出される。また、点線の矢印で示されるように、サンプル時刻毎に評価期間Δｔが設定されており、選択部１６０は、この評価期間Δｔにおける犯罪履歴データを、後述の評価値算出用データとして使用する。

　選択部１６０は、Ｓ２０８の処理で選択した分布関数、空間的パラメータ、および時間的パラメータの組み合わせと、サンプル時刻ｔ^１，ｔ^２，・・・，ｔ^Ｋそれぞれについて抽出されたＩ^ｋ個の学習データとを用いて、サンプル時刻ｔ^１，ｔ^２，・・・，ｔ^Ｋそれぞれにおける、全てのセルのリスク値を算出する。一例として、図８のテーブルの１行目の組み合わせが選択されている場合を考える。この場合、選択部１６０は、上記式（２）で示される分布関数に、ｈ_ｓ＝１００ｍ、ｈ_ｔ＝１５日、サンプル時刻ｔ^１，ｔ^２，・・・，ｔ^Ｋそれぞれについて抽出されたＩ^ｋ個の学習データの位置座標（ｘ_ｉ，ｙ_ｉ）、発生年月日時刻ｔ^ｉを代入する。これにより、サンプル時刻ｔ^１，ｔ^２，・・・，ｔ^Ｋそれぞれにおける、ラベルｇ（ｇ＝１，２，３，・・・，Ｇ：Ｇは全セル数）で区別されるセル毎のリスク値Ｒ（ｇ，ｋ）が得られる。そして、選択部１６０は、以下の式（４）に示すように、サンプル時刻毎、且つ、セル毎のリスク値Ｒ（ｇ，ｋ）に、単位セルの面積Δｓ^２とサンプル時刻毎の評価期間Δｔを掛けた値を、その組み合わせのリスク値として算出する。

　そして、選択部１６０は、評価値算出用データとして、サンプル時刻ｔ^１，ｔ^２，・・・，ｔ^Ｋそれぞれの評価期間Δｔ内で発生した犯罪に対応する犯罪発生履歴データ（以下、「評価値算出用データ」とも表記）を履歴データ記憶部２１０から抽出し、その件数を特定する（Ｓ２１０）。具体的には、選択部１６０は、評価値算出用データとして、履歴データ記憶部２１０に記憶されている対象領域の犯罪発生履歴データの中から、「ｔ^ｋ≦発生年月日時刻＜ｔ^ｋ＋Δｔ」を満たす犯罪発生履歴データを抽出する。選択部１６０は、抽出した評価値算出用データの位置情報に基づいて評価値算出用データの総数をセル毎に集計し、サンプル時刻ｔ^ｋにおける各セルの犯罪発生件数を算出する。サンプル時刻ｔ^ｋにおけるセルｇの犯罪発生件数は、数式上では以下のように表現する。

　選択部１６０は、上記式（４）で算出された、各組み合わせにおけるセル毎のリスク値と、上記式（５）で算出されたサンプル時刻ｔ^ｋにおける各セルの犯罪発生件数とに基づいて、組み合わせ毎の評価値を算出する（Ｓ２１２）。

　＜評価値の具体例１＞
　一例として、選択部１６０は、以下の式（６）を用いて、相関係数ＣＯＲＲ（ｈ_ｓ，ｈ_ｔ）を算出することができる。

　なお、上記の式（６）において、記号〈　〉は、全てのサンプル時刻ｔ^ｋ、および、ラベルｇにより区別される全てのセルにおける期待値を意味する記号である。例えば、記号〈　〉を用いて表現される部分は、以下の式（７）に示すように置き換えることができる。

　相関係数ＣＯＲＲ（ｈ_ｓ，ｈ_ｔ）は、分布関数、空間的パラメータ、および時間的パラメータの組み合わせを用いて算出されるリスク値と、犯罪発生件数との関連性の強さを示す。相関係数ＣＯＲＲ（ｈ_ｓ，ｈ_ｔ）の絶対値が１に近いほど、互いの数値の関連性が強いことを示す。例えば、相関係数ＣＯＲＲ（ｈ_ｓ，ｈ_ｔ）が１に近い正の値をとる場合、選択された分布関数、空間的パラメータ、および時間的パラメータの組み合わせによって算出されるリスク値が高いセルほど、犯罪が発生する確率も高いと判断することができる。

　＜評価値の具体例２＞
　また、他の例として、選択部１６０は、相関係数とは異なる指標である、リスク値相対ランク合計を算出してもよい。選択部１６０は、リスク値相対ランク合計を、例えば次のように算出することができる。まず、選択部１６０は、分布関数、空間的パラメータ、および時間的パラメータの組み合わせと、あるサンプル時刻で上記式（３）の条件を満たす学習データとを用いて算出されたセル毎のリスク値に基づいて各セルをランク付けする。例えば、選択部１６０は、算出されたリスク値の大きいセルから１位、２位と昇順にランクを付けていく。そして、選択部１６０は、各評価値算出用データの位置情報を基に当該評価値算出用データに対応するセル（即ち、当該評価値算出用データの犯罪が発生したセル）を特定し、特定したセルのランクに応じた値をリスク値相対ランク合計に加算する。選択部１６０は、全てのサンプル時刻（ｔ^１，ｔ^２，ｔ^３，・・・，ｔ^Ｋ）で、上記処理を繰り返して、リスク値相対ランク合計を算出する。例えば、リスク値相対ランク合計は、以下の式（８）で表現され得る。

　具体的な例として、分布関数、空間的パラメータ、および時間的パラメータの組み合わせと、あるサンプル時刻で上記式（３）の条件を満たす学習データとを用いて、各セルのリスク値として、図１０に示すような結果が得られた場合を考える。この場合、選択部１６０は、９つのセルを、例えば、（１）セルＣ３、（２）セルＢ２、（３）セルＡ３およびセルＢ１、（４）セルＡ２およびセルＣ２、（５）セルＡ１およびＢ３、（６）セルＣ１、の順にランク付けすることができる。そして、選択部１６０は、上記サンプル時刻の評価期間Δｔ内で抽出された評価値算出用データの位置情報に基づいて、その評価値算出用データの犯罪がどのセルで発生したかを判別する。そして、選択部１６０は、例えば、「該当するセルのランク／全てのセルの数」の値を、組み合わせ毎のリスク値に加算する。具体的には、評価期間Δｔ内に発生した犯罪の位置がセルＣ３に対応する場合、「セルＣ３のランク／全セル数＝１／９」が組み合わせ毎のリスク値に加算される。評価期間Δｔ内で抽出された全ての評価値算出用データに対して上述の処理を繰り返した結果として得られる評価値が、「あるサンプル時刻のリスク値相対ランク合計」となる。そして、上述の処理を全てのサンプル時刻（ｔ^１，ｔ^２，ｔ^３，・・・，ｔ^Ｋ）で実施することで、「最終的なリスク値相対ランク合計」が得られる。「最終的なリスク値相対ランク合計」は、全てのサンプル時刻（ｔ^１，ｔ^２，ｔ^３，・・・，ｔ^Ｋ）で得られた結果の合計値や平均値などである。

　図６に戻り、選択部１６０は、例えば上記式（６）や上記式（８）等を用いて算出した、組み合わせ毎の相関係数ＣＯＲＲ（ｈ_ｓ，ｈ_ｔ）やリスク値相対ランク合計を、組み合わせ毎の評価値としてメモリ１０３などに記憶されるテーブル（例：図１１）に格納する（Ｓ２１４）。図１１は、組み合わせ毎の評価値を記憶するテーブルの一例を示す図である。この図の例では、選択部１６０は、１行目の組み合わせに対して算出された相関係数「０．１１」を評価値の列に追加している。

　そして、選択部１６０は、全ての組み合わせの評価値が算出されたか否かを判定する（Ｓ２１６）。選択部１６０は、例えば、図１１に例示されるテーブルの評価値の列が全て入力されたか否かによって、全ての組み合わせの評価値が算出されたか否かを判定できる。全ての組み合わせの評価値が算出されていない場合（Ｓ２１６：ＮＯ）、処理はＳ２０８に戻り、新たな組み合わせについて評価値を算出する処理が繰り返される。一方、全ての組み合わせの評価値が算出された場合（Ｓ２１６：ＹＥＳ）、選択部１６０は、評価値の最も高い組合せを選択し、最適な組み合わせを記憶するテーブル（例：図１２）に格納する（Ｓ２１８）。図１２に例示されるテーブルでは、分布関数、空間的パラメータ、および時間的パラメータの最適な組み合わせが、その条件を示す情報と紐付けて記憶されている。選択部１６０は、Ｓ２０２の入力（例えば、犯罪タイプ、対象領域、学習期間など）を、条件を示す情報として利用することができる。

　なお、図１１のテーブルでは明確に示していないが、評価値の列には、「相関係数」と「リスク値相対ランク合計」とが混在する可能性もある。ここで、式（６）の「相関係数」の場合、正で最も１近い値が「最も高い評価値」である。また、式（８）の「リスク値相対ランク合計」の場合、最も小さい値が「最も高い評価値」である。このため、「相関係数」の評価値と「リスク値相対ランク合計」の評価値とを比較した場合、正確な結果が得られないおそれがある。そこで、選択部１６０は、図１１に例示されるテーブルの評価値の列に値を追加する際、その値が「相関係数」と「リスク値相対ランク合計」のどちらであるかを示す評価値種別情報（例：０＝「相関係数」、１＝「リスク値相対ランク合計」）を更に関連付けて記憶してもよい。このようにすることで、選択部１６０は、同種の評価値同士を比較して「評価値の最も高い組み合わせ」を適切に選ぶことができる。

　そして、出力部１７０は、予測に関する条件（犯罪タイプ、対象領域、予測を行う年月日時刻、予測の期間など）の入力を受け付ける。予測に関する条件が入力されると、出力部１７０は、当該条件に対して選択された、分布関数、空間的パラメータ、時間的パラメータの最適な組み合わせを用いて未来時点のリスク分布を算出し、それを予測結果として表示装置４０などに出力する（Ｓ２２０）。例えば、出力部１７０は、リスク分布の予測結果を示すマップを表示装置４０などに出力する。また、出力部１７０は、リスク分布の予測結果を示すマップを図示しない印刷装置に出力してもよい。この場合、図示しない印刷装置から、リスク分布の予測結果を示すマップが出力される。

　Ｓ２２０の処理の詳細を説明する。まず、出力部１７０は、入力された予測に関する条件（犯罪タイプ、対象領域、年月日時刻ｔ^ｐ、予測の期間Δｔ´など）を基に図１２に示されるようなテーブルを参照し、当該条件に合う、分布関数、空間的パラメータ、および、時間的パラメータの組み合わせを読み出す。ここで、出力部１７０は、図１２に例示するテーブルの「学習期間」が予測の期間Δｔ´になるべく近い組み合わせを選択するのが好ましい。特に限定されないが、出力部１７０は、例えば、図１２に例示するテーブルの「学習期間」が予測の期間Δｔ´の開始時点から離れている度合に応じて、その組み合わせの評価値を小さくする補正を行う。このようにすることで、予測の期間Δｔ´に近い組み合わせが選択され易くなる。これにより、リスク分布の関数やパラメータが時間の経過により変化する場合に、その影響を避けることが可能となる。そして、出力部１７０は、履歴データ記憶部２１０に記憶されている犯罪発生履歴データの中から、入力された年月日時刻ｔ^ｐに関して以下の条件を満たすデータを抽出する。そして、出力部１７０は、抽出されたデータの件数をＩ^ｐとすると、Ｉ^ｐ個のデータそれぞれにラベルｉ（ｉ＝１，２，３，・・・，Ｉ^ｐ）を付与する。

　そして、出力部１７０は、入力された条件に対して読み出された、分布関数、空間的パラメータ、および、時間的パラメータの組み合わせと、Ｉ^ｐ個のデータを用いて、年月日時刻ｔ^ｐにおける各セルのリスク値を算出する。例えば、図１２の１行目の組み合わせが選ばれた場合、以下に示す式（１０）により、年月日時刻ｔ^ｐにおける各セルのリスク値Ｒ（ｇ，ｐ）が算出される。

　そして、出力部１７０は、リスク値Ｒ（ｇ，ｐ）に対象領域のセル面積Δｓ^２と予測期間Δｔ´とを掛けた以下の値を、犯罪発生件数の予測結果として出力する。

　なお、最適な分布関数と各パラメータの組み合わせを選択するＳ２１８までの処理と、選択された組み合わせを使ってリスクを予測するＳ２２０の処理は、必ずしも連続して実行されなくてもよい。

　以上、本実施形態では、入力された条件（リスクのタイプ、対象領域など）に応じた最適な組み合わせを用いて、リスクの予測結果が出力される。本実施形態によっても、第１実施形態と同様の効果を得ることができる。

　［第３実施形態］
　本実施形態は、以下の点を除き、第２実施形態と同様の構成を有する。

　〔機能構成〕
　図１３は、第３実施形態の情報処理装置１０の機能構成を概念的に示すブロック図である。図１３に示されるように、本実施形態の情報処理装置１０は、第２実施形態の構成に加え、取得部１８０を更に備える。

　取得部１８０は、セルカバー率を取得する。セルカバー率とは、セル分割部１４０により分割された複数のセルのうち、人員または移動体を派遣することができるセルの割合を示す値である。ここで言う「移動体」には、パトロール用の車両といった人員を載せて移動する有人の移動体と、ドローンといった無人の移動体が含まれる。

　〔ハードウエア構成〕
　本実施形態のハードウエア構成は、第１実施形態と同様（例：図２）である。本実施形態のストレージデバイス１０４は、上述の取得部１８０の機能を実現するプログラムモジュールを更に記憶している。情報処理装置１０のプロセッサ１０２が当該プログラムモジュールを実行することによって、上述の取得部１８０の機能が実現される。

　〔動作例〕
　図１４を用いて、第３実施形態の情報処理装置１０の動作例を説明する。図１４は、第３実施形態の情報処理装置１０での処理の流れを例示するフローチャートである。ここでは、リスクが「犯罪」である場合の処理の一例を示す。ここでは、第２実施形態と異なる動作について主に説明する。図１４のＳ３０２～Ｓ３１０の処理は、図６のＳ２０２～２１０の処理と同様である。

　取得部１８０は、セルカバー率を取得する（Ｓ３１２）。取得部１８０は、例えば、セルカバー率をオペレータに入力させる画面を表示装置４０上に表示し、オペレータによって入力された情報を基にセルカバー率を取得することができる。取得部１８０は、取得したセルカバー率を選択部１６０に渡す。

　選択部１６０は、取得部１８０によって取得されたセルカバー率と、Ｓ３０８の処理で選択した組み合わせを用いて算出されたサンプル時刻毎の各セルのリスク値を基に、対象領域の全てのセルの中で人員や移動体を派遣すべきセル（以下、「高リスクセル」と表記）を特定する（Ｓ３１４）。一般的に、リスク値が相対的に高いセルから優先的に、人員や移動体を派遣してパトロールを行うべき高リスクセルが決定される。セルカバー率がβ％であった場合、選択部１６０は、サンプル時刻ｔ^１，ｔ^２，ｔ^３，・・・，ｔ^Ｋそれぞれについて対象領域のセルをリスク値が高い順に並べ、サンプル時刻毎に上位β％に該当するセル（高リスクセル）を特定し、その集合をＧ^ｋ（β）とする。例えば、Ｇ^１（β）は、サンプル時刻ｔ^１における高リスクセルの集合である。具体的な例として、ある対象領域が１００００個のセルに分割され、また、取得部１８０により取得されたセルカバー率が１％であったとする。この場合、選択部１６０は、サンプル時刻ｔ^１，ｔ^２，ｔ^３，・・・，ｔ^Ｋそれぞれにおいて、リスク値Ｒ（ｇ，ｋ）が高い順に１００個のセルを高リスクセルとして特定し、特定したセルのラベルｇを用いて高リスクセルの集合Ｇ^ｋ（β）を生成する。したがって、高リスクセルの集合Ｇ^ｋ（β）について、ある１つのサンプル時刻ｔ^ｋのＧ^ｋ（β）には１００個のセルが含まれる。また、全サンプル時刻（ｔ^１，ｔ^２，ｔ^３，・・・，ｔ^Ｋ）分のＧ^ｋ（β）にはサンプル時刻数Ｋ×１００個のセルが含まれる。

　選択部１６０は、サンプル時刻ｔ^１，ｔ^２，ｔ^３，・・・，ｔ^Ｋそれぞれにおける、Ｓ３１４の処理で特定された高リスクセルの集合Ｇ^ｋ（β）の犯罪発生件数と全てのセルの犯罪発生件数とに基づいて、組み合わせ毎の評価値を算出する（Ｓ３１６）。具体的には、選択部１６０は、組み合わせ毎の評価値として、以下の式（１２）で示される指標（以下、「パトロールカバー率」と表記）を算出する。なお、式（１２）は、セルカバー率βが１％であった場合の例である。例えば、セルカバー率βが１０％の場合は、式（１２）は異なる値になる。

　上記式において、除算の分子は、Ｓ３１４の処理で特定された、サンプル時刻ｔ^ｋにおける高リスクセルの発生犯罪件数の総和の、全サンプル時刻（ｔ^１，ｔ^２，ｔ^３，・・・，ｔ^Ｋ）での総和を示す。また、上記式において、除算の分母は、サンプル時刻ｔ^ｋにおける全てのセルの犯罪発生件数の総和の、全サンプル時刻（ｔ^１，ｔ^２，ｔ^３，・・・，ｔ^Ｋ）での総和を示す。つまり、選択部１６０は、あるサンプル時刻ｔ^ｋの評価期間Δｔに発生した全ての犯罪のうち、高リスクセル（すなわち、パトロールの対象となるセル）で発生した件数の全サンプル時刻（ｔ^１，ｔ^２，ｔ^３，・・・，ｔ^Ｋ）での総和を、あるサンプル時刻ｔ^ｋの評価期間Δｔに発生した全てのセルの犯罪発生件数の全サンプル時刻（ｔ^１，ｔ^２，ｔ^３，・・・，ｔ^Ｋ）での総和で割ることによって、組み合わせ毎のパトロールカバー率を算出することができる。

　選択部１６０は、例えば上記式（１２）を用いて算出した、組み合わせ毎のパトロールカバー率を、組み合わせ毎の評価値としてメモリ１０３などに記憶されるテーブル（例：図１５）に格納する（Ｓ３１８）。図１５は、組み合わせ毎の評価値を記憶するテーブルの一例を示す図である。この図の例では、選択部１６０は、１行目の組み合わせに対して算出されたパトロールカバー率「１１％」を評価値の列に追加している。

　そして、選択部１６０は、全ての組み合わせの評価値が算出されたか否かを判定する（Ｓ３２０）。選択部１６０は、例えば、図１５に例示されるテーブルの評価値の列が全て入力されたか否かによって、全ての組み合わせの評価値が算出されたか否かを判定できる。全ての組み合わせの評価値が算出されていない場合（Ｓ３２０：ＮＯ）、処理はＳ３０８に戻り、新たな組み合わせについて評価値を算出する処理が繰り返される。一方、全ての組み合わせの評価値が算出された場合（Ｓ３２０：ＹＥＳ）、選択部１６０は、評価値の最も高い組合せを選択し、最適な組み合わせを記憶するテーブル（例：図１６）に格納する（Ｓ３２２）。図１６に例示されるテーブルでは、分布関数、空間的パラメータ、および時間的パラメータの最適な組み合わせが、その条件を示す情報と紐付けて記憶されている。選択部１６０は、Ｓ３０２の入力（例えば、犯罪タイプ、対象領域、学習期間など）とＳ３１２で取得したセルカバー率とを、条件を示す情報として利用することができる。

　そして、出力部１７０は、予測に関する条件（犯罪タイプ、対象領域、予測を行う年月日時刻、予測の期間、セルカバー率など）の入力を受け付ける。予測に関する条件が入力されると、出力部１７０は、当該条件に対して選択された、分布関数、空間的パラメータ、時間的パラメータの組み合わせを用いて未来時点のリスク分布を算出し、それを予測結果として表示装置４０などに出力する（Ｓ３２４）。例えば、出力部１７０は、リスク分布の予測結果を示すマップを表示装置４０などに出力する。また、出力部１７０は、リスク分布の予測結果を示すマップを図示しない印刷装置に出力してもよい。この場合、図示しない印刷装置から、リスク分布の予測結果を示すマップが出力される。

　Ｓ３２４の処理の詳細を説明する。まず、出力部１７０は、入力された予測に関する条件（犯罪タイプ、対象領域、年月日時刻ｔ^ｐ、予測の期間Δｔ´、セルカバー率など）を基に図１６に示されるようなテーブルを参照し、当該条件に合う、分布関数、空間的パラメータ、および、時間的パラメータの組み合わせを読み出す。ここで、セルカバー率は、例えば上述の式（１２）で示されるように、「最適な組み合わせ」の選択時に利用する評価値に影響を与える因子である。そのため、予測の条件として入力されたセルカバー率が異なれば、分布関数、空間的パラメータおよび時間的パラメータの最適な組み合わせも異なると考えられる。出力部１７０は、例えば図１６に例示されるテーブルの中から、予測の条件として入力されたセルカバー率になるべく近いセルカバー率を有する組み合わせを、リスク分布の予測で用いる組み合わせとして選択する。例えば、出力部１７０は、セルカバー率の差分の絶対値が所定の閾値以下である組み合わせを選択することができる。具体的な例として、犯罪タイプが自転車盗で、対象領域の××市が１００００個のセルに分割されたとする。また、予測に関する条件のセルカバー率が１．５％であったとする。これは、対象領域の××市のセルのうち、１５０個のセルに、人員または移動体を派遣できることを意味する。また、上述の所定の閾値は１％であったとする。この場合、図１６のテーブルの中で、予測に関する条件（犯罪タイプおよび対象領域）に合う、分布関数、空間的パラメータ、および、時間的パラメータの組み合わせは、１行目と２行目である。ここで、１行目のセルカバー率は１％、２行目のセルカバー率は１０％であり、いずれも予測に関する条件のセルカバー率１．５％とは異なる。しかし、１行目のセルカバー率１％と予測に関する条件のセルカバー率１．５％との差分の絶対値は所定の閾値（１％）以下である。そのため、出力部１７０は、１行目を、リスク分布の予測に用いる組み合わせとして選択することができる。図１６に例示されるテーブルの中に該当する組み合わせが存在しない場合、選択部１６０は、予測の条件として入力されたセルカバー率を用いて、Ｓ３１４からＳ３２２の処理を実行してテーブルを更新してもよい。その後、出力部１７０は、更新されたテーブルから予測に関する条件に合う組み合わせを読み出すことができる。

　以降の処理は、第２実施形態と同様である。具体的には、出力部１７０は、履歴データ記憶部２１０に記憶されている犯罪発生履歴データの中から、入力された年月日時刻ｔ^ｐに関して、式（９）に示す条件を満たすデータを抽出する。そして、出力部１７０は、抽出されたデータの件数をＩ^ｐとすると、Ｉ^ｐ個のデータそれぞれにラベルｉ（ｉ＝１，２，３，・・・，Ｉ^ｐ）を付与する。そして、出力部１７０は、入力された条件に対して読み出された、分布関数、空間的パラメータ、および、時間的パラメータの組み合わせと、Ｉ^ｐ個のデータを用いて、年月日時刻ｔ^ｐにおける各セルのリスク値Ｒ（ｇ，ｐ）を算出する。例えば、図１６の１行目の組み合わせが選ばれた場合、式（１０）を用いて、年月日時刻ｔ^ｐにおける各セルのリスク値Ｒ（ｇ，ｐ）を算出する。そして、出力部１７０は、式（１１）に示すように、リスク値Ｒ（ｇ，ｐ）に対象領域のセル面積Δｓ^２と予測期間Δｔ´とを掛けた値を、犯罪発生件数の予測結果として出力する。

　以上、本実施形態によれば、上述の各実施形態と同様の効果が得られる。また、本実施形態では、分布関数と各パラメータの組み合わせを用いて算出した各セルのリスク値と、セルカバー率（パトロール可能なセルの割合）とを基に、高リスクセル（パトロール対象のセル）が決定される。そして、全てのセルの犯罪発生件数に占める高リスクセルの犯罪発生件数の割合が、組み合わせ毎の評価値として用いられる。そして、このように算出された評価値を基に「最適な組み合わせ」が選択され、「セルカバー率」と共に所定の記憶部に記憶される。これにより、対象領域において人員や機材を派遣可能なセルが限られる場合において、当該セルの割合（セルカバー率）に応じた、分布関数、空間的パラメータ、時間的パラメータの最適な組み合わせを選択して、精度の高い予測を行うことができる。

　以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。

　例えば、上述の各実施形態において、セル種別を特定する情報を更に取得し、そのセル種別毎に分布関数、空間的パラメータ、時間的パラメータの最適な組み合わせを選択するように構成されていてもよい。ここでセル種別とは、例えば、国土交通省により提供される国土数値情報の土地利用種別などである。第３実施形態のセルカバー率を用いる場合、例えば、次のような処理が更に実行され得る。まず、セル分割部１４０は、国土数値情報を参照して、各セルに対応する土地利用種別がパトロール対象の種別（例えば、「建物用地」など）か否かを判定し、パトロール対象の種別のセルに所定のフラグを付与する。そして、選択部１６０は、所定のフラグが付与されたセルを対象に高リスクセルを特定し、当該高リスクセルでの犯罪発生件数に基づいてパトロールカバー率を算出する。このようにすることで、「建物用地」など、所望の種別のセルで予測的中率を最大化する最適な組み合わせを選択することができる。これは、住宅地のパトロール計画を立案する場合など、特定の場所を監視対象とするケースで有用である。なお、第２実施形態の場合においても、選択部１６０は、所望のセル種別に対応するセルについて、相関係数やリスク値相対ランク合計を算出することができる。

　また、第２および第３実施形態において、組み合わせ毎の評価値を記憶するテーブル（例：図１１および図１５）を生成する例を示したが、そのようなテーブルを生成せずに、選択部１６０がこれらの情報を保持するように構成されていてもよい。

　また、上述の説明で用いた複数のフローチャートでは、複数の工程（処理）が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態は、内容が相反しない範囲で組み合わせることができる。

　上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下に限られない。
１．
　対象領域のリスク発生履歴データを、前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせ毎のリスク値の算出に用いる学習データと、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせの評価に用いる評価値算出用データと、に分割するデータ分割手段と、
　前記学習データに基づく前記組み合わせ毎のリスク値と前記評価値算出用データとを基に算出された前記組み合わせ毎の評価値に基づいて、前記分布関数、前記空間的パラメータ、および、前記時間的パラメータの組み合わせの中から、一の組み合わせを選択する選択手段と、
　前記選択手段により選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する出力手段と、
　を備える情報処理装置。
２．
　対象領域を複数のセルに分割するセル分割手段と、
　前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせを複数生成する生成手段と、
　前記対象領域のリスク発生履歴データの中から前記セル毎のリスク発生履歴データを用いて前記組み合わせ毎の評価値を算出し、前記組み合わせ毎の評価値に基づいて、前記複数の組み合わせの中から一の組み合わせを選択する選択手段と、
　前記選択手段により選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する出力手段と、
　を備える情報処理装置。
３．
　前記複数のセルのうち、人員または移動体を派遣することができるセルの割合を示すセルカバー率を取得する取得手段を更に備え、
　前記選択手段は、前記セルカバー率に基づいて前記評価値を算出する、
　２．に記載の情報処理装置。
４．
　前記出力手段は、前記セルカバー率とは別に入力された、予測の条件としての第２のセルカバー率に基づいて、前記リスク予測結果の生成に用いる組み合わせを決定する、
　３．に記載の情報処理装置。
５．
　前記選択手段は、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせ毎のリスク値と、前記リスク発生履歴データに基づくリスク発生件数とに基づき算出される相関係数を、前記評価値として算出する、
　２．に記載の情報処理装置。
６．
　前記選択手段は、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせ毎のリスク値と、前記リスク発生履歴データに基づくリスク発生件数とに基づき算出されるリスク値相対ランク合計を、前記評価値として算出する、
　２．に記載の情報処理装置。
７．
　前記生成手段は、指定された期間の中で複数のサンプル時刻を設定し、前記リスク発生履歴データのうち当該サンプル時刻より所定時間前のデータと前記組み合わせとを基に算出される前記リスク値と、前記リスク発生履歴データのうち当該サンプル時刻より所定時間後までのデータとを用いて、前記組み合わせ毎の評価値を算出する、
　２．から６．のいずれか１つに記載の情報処理装置。
８．
　リスクの種別の指定入力を受け付ける受付手段を更に備え、
　前記選択手段は、前記対象領域のリスク発生履歴データの中から、前記指定入力により指定されたリスクの種別に対応するデータを選別する、
　１．から７．のいずれか１つに記載の情報処理装置。
９．
　コンピュータが、
　対象領域のリスク発生履歴データを、前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせ毎のリスク値の算出に用いる学習データと、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせの評価に用いる評価値算出用データと、に分割し、
　前記学習データに基づく前記組み合わせ毎のリスク値と前記評価値算出用データとを基に算出された前記組み合わせ毎の評価値に基づいて、前記分布関数、前記空間的パラメータ、および、前記時間的パラメータの組み合わせの中から、一の組み合わせを選択し、
　選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する、
　ことを含むリスク予測方法。
１０．
　コンピュータが、
　対象領域を複数のセルに分割し、
　前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせを複数生成し、
　前記対象領域のリスク発生履歴データの中から前記セル毎のリスク発生履歴データを用いて前記組み合わせ毎の評価値を算出し、前記組み合わせ毎の評価値に基づいて、前記複数の組み合わせの中から一の組み合わせを選択し、
　選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する、
　ことを含むリスク予測方法。
１１．
　前記コンピュータが、
　前記複数のセルのうち、人員または移動体を派遣することができるセルの割合を示すセルカバー率を取得し、
　前記セルカバー率に基づいて前記評価値を算出する、
　ことを含む１０．に記載のリスク予測方法。
１２．
　前記コンピュータが、
　前記セルカバー率とは別に入力された、予測の条件としての第２のセルカバー率に基づいて、前記リスク予測結果の生成に用いる組み合わせを決定する、
　ことを含む１１．に記載のリスク予測方法。
１３．
　前記コンピュータが、
　前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせ毎のリスク値と、前記リスク発生履歴データに基づくリスク発生件数とに基づき算出される相関係数を、前記評価値として算出する、
　ことを含む１０．に記載のリスク予測方法。
１４．
　前記コンピュータが、
　前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせ毎のリスク値と、前記リスク発生履歴データに基づくリスク発生件数とに基づき算出されるリスク値相対ランク合計を、前記評価値として算出する、
　ことを含む１０．に記載のリスク予測方法。
１５．
　前記コンピュータが、
　指定された期間の中で複数のサンプル時刻を設定し、前記リスク発生履歴データのうち当該サンプル時刻より所定時間前のデータと前記組み合わせとを基に算出される前記リスク値と、前記リスク発生履歴データのうち当該サンプル時刻より所定時間後までのデータとを用いて、前記組み合わせ毎の評価値を算出する、
　ことを含む１０．から１４．のいずれか１つに記載のリスク予測方法。
１６．
　前記コンピュータが、
　リスクの種別の指定入力を受け付け、
　前記対象領域のリスク発生履歴データの中から、前記指定入力により指定されたリスクの種別に対応するデータを選別する、
　ことを含む９．から１５．のいずれか１つに記載のリスク予測方法。
１７．
　コンピュータに、９．から１６．のいずれか１つに記載のリスク予測方法を実行させるプログラム。

　この出願は、２０１７年１０月１８日に出願された日本出願特願２０１７－２０２１９５号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims

　対象領域のリスク発生履歴データを、前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせ毎のリスク値の算出に用いる学習データと、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせの評価に用いる評価値算出用データと、に分割するデータ分割手段と、
　前記学習データに基づく前記組み合わせ毎のリスク値と前記評価値算出用データとを基に算出された前記組み合わせ毎の評価値に基づいて、前記分布関数、前記空間的パラメータ、および、前記時間的パラメータの組み合わせの中から、一の組み合わせを選択する選択手段と、
　前記選択手段により選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する出力手段と、
　を備える情報処理装置。
　対象領域を複数のセルに分割するセル分割手段と、
　前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせを複数生成する生成手段と、
　前記対象領域のリスク発生履歴データの中から前記セル毎のリスク発生履歴データを用いて前記組み合わせ毎の評価値を算出し、前記組み合わせ毎の評価値に基づいて、前記複数の組み合わせの中から一の組み合わせを選択する選択手段と、
　前記選択手段により選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する出力手段と、
　を備える情報処理装置。
　前記複数のセルのうち、人員または移動体を派遣することができるセルの割合を示すセルカバー率を取得する取得手段を更に備え、
　前記選択手段は、前記セルカバー率に基づいて前記評価値を算出する、
　請求項２に記載の情報処理装置。
　前記出力手段は、前記セルカバー率とは別に入力された、予測の条件としての第２のセルカバー率に基づいて、前記リスク予測結果の生成に用いる組み合わせを決定する、
　請求項３に記載の情報処理装置。
　前記選択手段は、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせ毎のリスク値と、前記リスク発生履歴データに基づくリスク発生件数とに基づき算出される相関係数を、前記評価値として算出する、
　請求項２に記載の情報処理装置。
　前記選択手段は、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせ毎のリスク値と、前記リスク発生履歴データに基づくリスク発生件数とに基づき算出されるリスク値相対ランク合計を、前記評価値として算出する、
　請求項２に記載の情報処理装置。
　前記生成手段は、指定された期間の中で複数のサンプル時刻を設定し、前記リスク発生履歴データのうち当該サンプル時刻より所定時間前のデータと前記組み合わせとを基に算出される前記リスク値と、前記リスク発生履歴データのうち当該サンプル時刻より所定時間後までのデータとを用いて、前記組み合わせ毎の評価値を算出する、
　請求項２から６のいずれか１項に記載の情報処理装置。
　リスクの種別の指定入力を受け付ける受付手段を更に備え、
　前記選択手段は、前記対象領域のリスク発生履歴データの中から、前記指定入力により指定されたリスクの種別に対応するデータを選別する、
　請求項１から７のいずれか１項に記載の情報処理装置。
　コンピュータが、
　対象領域のリスク発生履歴データを、前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせ毎のリスク値の算出に用いる学習データと、前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせの評価に用いる評価値算出用データと、に分割し、
　前記学習データに基づく前記組み合わせ毎のリスク値と前記評価値算出用データとを基に算出された前記組み合わせ毎の評価値に基づいて、前記分布関数、前記空間的パラメータ、および、前記時間的パラメータの組み合わせの中から、一の組み合わせを選択し、
　選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する、
　ことを含むリスク予測方法。
　コンピュータが、
　対象領域を複数のセルに分割し、
　前記対象領域におけるリスク分布を空間的および時間的に示す分布関数、前記分布関数の空間的パラメータ、および、前記分布関数の時間的パラメータの組み合わせを複数生成し、
　前記対象領域のリスク発生履歴データの中から前記セル毎のリスク発生履歴データを用いて前記組み合わせ毎の評価値を算出し、前記組み合わせ毎の評価値に基づいて、前記複数の組み合わせの中から一の組み合わせを選択し、
　選択された前記一の組み合わせを用いて、前記対象領域におけるリスク予測結果を出力する、
　ことを含むリスク予測方法。
　前記コンピュータが、
　前記複数のセルのうち、人員または移動体を派遣することができるセルの割合を示すセルカバー率を取得し、
　前記セルカバー率に基づいて前記評価値を算出する、
　ことを含む請求項１０に記載のリスク予測方法。
　前記コンピュータが、
　前記セルカバー率とは別に入力された、予測の条件としての第２のセルカバー率に基づいて、前記リスク予測結果の生成に用いる組み合わせを決定する、
　ことを含む請求項１１に記載のリスク予測方法。
　前記コンピュータが、
　前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせ毎のリスク値と、前記リスク発生履歴データに基づくリスク発生件数とに基づき算出される相関係数を、前記評価値として算出する、
　ことを含む請求項１０に記載のリスク予測方法。
　前記コンピュータが、
　前記分布関数、前記空間的パラメータ、および前記時間的パラメータの組み合わせ毎のリスク値と、前記リスク発生履歴データに基づくリスク発生件数とに基づき算出されるリスク値相対ランク合計を、前記評価値として算出する、
　ことを含む請求項１０に記載のリスク予測方法。
　前記コンピュータが、
　指定された期間の中で複数のサンプル時刻を設定し、前記リスク発生履歴データのうち当該サンプル時刻より所定時間前のデータと前記組み合わせとを基に算出される前記リスク値と、前記リスク発生履歴データのうち当該サンプル時刻より所定時間後までのデータとを用いて、前記組み合わせ毎の評価値を算出する、
　ことを含む請求項１０から１４のいずれか１項に記載のリスク予測方法。
　前記コンピュータが、
　リスクの種別の指定入力を受け付け、
　前記対象領域のリスク発生履歴データの中から、前記指定入力により指定されたリスクの種別に対応するデータを選別する、
　ことを含む請求項９から１５のいずれか１項に記載のリスク予測方法。
　コンピュータに、請求項９から１６のいずれか１項に記載のリスク予測方法を実行させるプログラム。