JP6528532B2 - 災害検知プログラム、災害検知装置および災害検知方法 - Google Patents

災害検知プログラム、災害検知装置および災害検知方法 Download PDF

Info

Publication number
JP6528532B2
JP6528532B2 JP2015097633A JP2015097633A JP6528532B2 JP 6528532 B2 JP6528532 B2 JP 6528532B2 JP 2015097633 A JP2015097633 A JP 2015097633A JP 2015097633 A JP2015097633 A JP 2015097633A JP 6528532 B2 JP6528532 B2 JP 6528532B2
Authority
JP
Japan
Prior art keywords
disaster
regions
message
rate
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015097633A
Other languages
English (en)
Other versions
JP2016212751A (ja
Inventor
邦敬 武田
邦敬 武田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015097633A priority Critical patent/JP6528532B2/ja
Publication of JP2016212751A publication Critical patent/JP2016212751A/ja
Application granted granted Critical
Publication of JP6528532B2 publication Critical patent/JP6528532B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、災害検知プログラム、災害検知装置および災害検知方法に関する。
防災の現場では、災害が発生した場合に、いち早く災害の発生場所を捉えることが重要である。しかし、災害が発生する恐れがある場所に災害事象を捉えるための物理的なセンサを漏れなく配置することは困難である。そこで、ソーシャルメディアにおける災害の目撃情報を「人によるセンサ」として活用することが検討されている。
ソーシャルメディアは、インターネットなどを利用して、ユーザ同士がメッセージを投稿し、交換することによって情報流通を行うメディアである。ソーシャルメディアとしては、例えば、Twitter(登録商標)やFacebook(登録商標)などが挙げられる。
関連する先行技術としては、例えば、同一のグループに属していると定められたデータ系列のデータ値またはデータ値の累乗の和を計算し、グループごとに計算された和に基づいて、異常または変化が生じているデータ系列を含むグループを検出するものがある。
特開2010−198579号公報
ソーシャルメディアにおける災害の目撃情報を用いるには、時間や地域によって投稿数が大きく変化する。しかしながら、上述した先行技術では投稿数の変化に追従できず、ソーシャルメディアなどに投稿されるメッセージから、災害の発生を検知することが難しい場合がある。
一つの側面では、本発明は、災害の発生を高精度に検知する災害検知プログラム、災害検知装置および災害検知方法を提供することを目的とする。
本発明の一側面によれば、災害に関するメッセージにおける地域を推定し、推定した複数の前記地域の各地域における前記メッセージの数に基づいて、前記複数の地域で共通の第1変数と前記各地域で独立のバラツキを表す第2変数とを用いて表現される前記各地域の前記メッセージの投稿率と、前記第1変数の値とを算出し、算出した前記各地域の投稿率の平均値と、算出した前記第1変数の値から得られる前記複数の地域における平均的な投稿率との差分が閾値よりも大きい場合に、前記複数の地域のいずれかの地域で災害が発生していると判定する災害検知プログラム、災害検知装置および災害検知方法が提案される。
本発明の一態様によれば、災害の発生を高精度に検知することができるという効果を奏する。
図1は、実施の形態にかかる災害検知方法の一実施例を示す説明図である。 図2は、災害検知システム200のシステム構成例を示す説明図である。 図3は、災害検知装置101のハードウェア構成例を示すブロック図である。 図4は、メッセージDB220の記憶内容の一例を示す説明図である。 図5は、地域別発言数DB230の記憶内容の一例を示す説明図である。 図6は、各種統計量DB240の記憶内容の一例を示す説明図である。 図7は、災害検知装置101の機能的構成例を示すブロック図である。 図8は、メッセージDB220の記憶内容の更新例を示す説明図である。 図9は、地域別発言数DB230の記憶内容の更新例を示す説明図である。 図10は、各種統計量DB240の記憶内容の更新例を示す説明図である。 図11は、閾値Thの設定例を示す説明図である。 図12は、発災地域Ajの特定処理例を示す説明図である。 図13は、災害通知の具体例を示す説明図である。 図14は、災害検知装置101の災害検知処理手順の一例を示すフローチャートである。 図15は、フィルタ処理の具体的処理手順の一例を示すフローチャートである。 図16は、実施の形態にかかる災害検知方法の適用事例を示す説明図である。 図17は、発災事例に対する処理結果の一例を示す説明図である。
以下に図面を参照して、本発明にかかる災害検知プログラム、災害検知装置および災害検知方法の実施の形態を詳細に説明する。
(災害検知方法の一実施例)
図1は、実施の形態にかかる災害検知方法の一実施例を示す説明図である。図1において、災害検知装置101は、災害の発生を検知するコンピュータである。災害は、自然現象の変化、あるいは人為的な原因などによって、人命や社会生活に対する被害を生じる現象である。災害としては、例えば、浸水や土砂災害などの局所的に発生する災害が挙げられる。
防災の現場では、災害が発生した場合に、いち早く災害の発生場所を捉えることが重要であり、ソーシャルメディアにおける災害の目撃情報を「人によるセンサ」として活用することが検討されている。ところが、発災時には、災害が発生している地域以外においても、ノイズの影響により全国的に小規模なバースト、すなわち、災害の目撃情報を含む発言数の急増が発生してしまう場合がある。また、国外の災害に関する発言が全国的に発生し、全国的にバーストが発生することもある。
これらの要因により、例えば、都道府県といった地域別の発言数の推移に対して個別にバースト検知を実施すると誤検知してしまう。このため、例えば、日本全国のどこかで局所的に発生する災害を捉えるためには、単純なバースト検知ではなく、地域別の発言数を相対的に比較し、局所的にバーストが発生していることを検知することが重要である。
ここで、地域別の発言数を地域別のユーザ数等で除算した正規化発言数を求め、正規化発言数群が単一の確率分布に従うと仮定した上で、外れ値を検出する手法が考えられる。しかしながら、この手法では、地域間でユーザ数の格差が大きい場合に、極端にユーザ数が小さい地域において、発言数が過剰に評価されるという問題がある(以下、「small number problem」という)。
small number problemに対する対処法として、疫学分野において、地域別の観測値に対して独立なパラメータを持つポアソン分布を仮定し、ベイズ推定を用いて人口調整を行う手法が提案されている。しかしながら、この手法では、地域ごとに独立なパラメータを持つ分布を仮定するため、共通分布を仮定できず、外れ値を検出することが難しい。
以下の説明では、地域別の発言数を地域別のユーザ数等で除算した正規化発言数を求め、正規化発言数群が単一の確率分布に従うと仮定した上で、外れ値を検出する手法を「問題手法1」と表記する場合がある。
また、多数のデータ系列に対して、各データ系列のデータ値またはデータ値の累乗の和を計算し、計算された和に基づいて、異常または変化が生じているかを判定する手法がある。しかしながら、この手法では、和によってデータ系列を集約しているため、データ系列のデータ値またはデータ値の累乗をそのまま集約すると、人口が少ない地域で災害が発生した場合に検知することができない。
また、データ系列の大きさの格差を是正するために、上述した疫学分野の手法により発言率を求め、それらの和に対して異常または変化が生じているかを判定することが考えられる。しかしながら、データの全体量は、災害の規模や時間帯によって大きく変動するため、単純な和によって求めた集約値のみで発災の有無を判定することは難しい。
以下の説明では、多数のデータ系列に対して、各データ系列のデータ値またはデータ値の累乗の和を計算し、計算された和に基づいて、異常または変化が生じているかを判定する手法を「問題手法2」と表記する場合がある。
ここで、浸水、土砂災害といった災害は、ほぼ同時刻に特定の地域で局所的に発生することが多い。このため、発災時において、ソーシャルメディア上の災害目撃に対する地域別の発言率は、災害発生地域のみ全国平均からみて大きくなる傾向にある。一方、災害が発生していない平常時の地域別の発言率、および、発災時における災害が発生していない地域の発言率は、全国平均を中心に分布する傾向にある。
そこで、本実施の形態では、上述したデータ特性に着目し、地域別の投稿率(上述した「発言率」に対応)を求め、全国の投稿率群が構成する分布に偏りが生じているか否かを判定することにより、災害の発生を検知する災害検知方法について説明する。以下、災害検知装置101の処理例について説明する。
(1)災害検知装置101は、複数の地域の各地域において投稿された災害に関するメッセージの数を取得する。ここで、複数の地域は、災害の発生を監視する対象エリアに含まれる地域である。対象エリアは、任意に設定可能である。例えば、対象エリアを「日本全国」とし、地域を「都道府県」とすると、複数の地域は47都道府県となる。
また、例えば、対象エリアを「関東地方」とし、地域を「都道府県」とすると、複数の地域は、東京都と神奈川・埼玉・群馬・栃木・茨城・千葉の6県となる。また、例えば、対象エリアを「東京都」とし、地域を「市区町村」とすると、複数の地域は、東京都に含まれる市区町村となる。
災害に関するメッセージは、例えば、TwitterやFacebookなどのソーシャルメディアに投稿されたメッセージのうち、災害に関連するキーワードを含むメッセージである。具体的には、例えば、災害に関するメッセージは、ソーシャルメディアに投稿されたメッセージに対してフィルタ処理を実施することにより抽出することができる。なお、フィルタ処理についての詳細な説明は後述する。
以下の説明では、複数の地域を「地域A1〜Am」と表記し(m:2以上の自然数)、地域A1〜Amのうちの任意の地域を「地域Ai」と表記する場合がある(i=1,2,…,m)。また、地域Aiにおいて投稿された災害に関するメッセージの数を「メッセージ数yi」と表記する場合がある。
(2)災害検知装置101は、各地域Aiにおいて投稿された災害に関するメッセージ数yiに基づいて、各地域Aiにおいて投稿された災害に関するメッセージの投稿率θiを算出する。ここで、投稿率θiは、地域Aiのユーザ数niに対するメッセージ数yiの割合を表す値である。
各地域Aiのユーザ数niは、例えば、予め与えられて記憶されている。各地域Aiのユーザ数niとしては、例えば、各地域Aiにおけるソーシャルメディアのユーザ数を用いることにしてもよく、また、各地域Aiの人口を用いることにしてもよい。
ここでは、図1中のグラフ110に示すように、ある時刻tにおける各地域Aiの投稿率θiは、全地域A1〜Amで共通のパラメータμを中心に独立的なバラツキ(εi)をもって分布すると仮定する。パラメータμは、例えば、全地域A1〜Amの投稿率群{θ1〜θm}の分布の中心値に対応する変数である。そして、災害検知装置101は、階層的な回帰モデル(統計モデル)を用いて、パラメータμの値と各地域Aiの投稿率θiとを算出する。
具体的には、例えば、災害検知装置101は、下記式(1)および(2)を用いて、各地域Aiの投稿率θiがそれぞれ独立なパラメータを持つポアソン分布に従うと仮定した階層的なポアソン回帰モデル(統計モデル)を構築し、各パラメータの値を推定する。
Figure 0006528532
ただし、yiは、地域Aiにおいて投稿された災害に関するメッセージ数である。niは、各地域Aiのユーザ数である。θiは、各地域Aiの投稿率である。εiは、各地域Aiで独立のバラツキを表すパラメータである。μは、全地域A1〜Amで共通のパラメータである。
ここで、上記式(1)および(2)において、求めるべきパラメータ(θi、μ等)の数と比較して観測データ(メッセージ数yi)の数が少ない。このため、災害検知装置101は、例えば、下記式(3)および(4)のように、ハイパーパラメータおよび無情報事前分布を用意し、ベイズモデルを構築する。
Figure 0006528532
そして、災害検知装置101は、例えば、マルコフ連鎖モンテカルロ法(MCMC法)を用いて各パラメータを求め、得られた各パラメータ分布の代表値(例えば、中央値または平均値)をパラメータ推定値とする。ただし、上記のパラメータの推定方法は一例であり、他の推定方法を用いることにしてもよい。
(3)災害検知装置101は、算出した各地域Aiの投稿率θiの平均値μ0と、算出したパラメータμの値から得られる地域A1〜Amにおける平均的な投稿率exp(μ)との差分ξを算出する。そして、災害検知装置101は、算出した差分ξが閾値Thよりも大きい場合に、地域A1〜Amのいずれかの地域Aiで災害が発生していると判定する。
閾値Thは、任意に設定可能である。閾値Thの具体的な設定例については後述する。また、地域A1〜Amにおける平均的な投稿率exp(μ)は、パラメータεiの値を「εi=0」とし、上記式(2)の左辺のlogをとることにより求めることができる。
ここで、災害が発生していない平常時は、図1中のグラフ120に示すように、各地域Aiの投稿率θiは、地域A1〜Amにおける平均的な投稿率exp(μ)を中心に分布する。一方で、局所的な災害の発生時は、図1中のグラフ130に示すように、災害が発生している地域Ajの投稿率θjのみ大きくなり、他の地域Ai(i≠j)の投稿率θiが構成する分布において、地域Ajの投稿率θjは外れ値となる。
このため、災害が発生し、局所的な外れ値が存在する場合に、全地域A1〜Amの投稿率群{θ1〜θm}が構成する分布に偏りが生じる。そこで、パラメータμの値から得られる地域A1〜Amにおける平均的な投稿率exp(μ)と、各地域Aiの投稿率θiの平均値μ0との差分ξを、地域別の投稿率群{θ1〜θm}が構成する分布の偏りとして定義する。
すなわち、本実施の形態では、災害が局所的に発生する点に着目し、偏りξ(差分ξ)の大きさの推移を監視し、偏りξが急増(バースト)している場合に、地域A1〜Amのいずれかの地域Aiで災害が発生しているとみなす。
具体的には、例えば、災害検知装置101は、下記式(5)および(6)を用いて、差分ξを算出することができる。ただし、μ0は、各地域Aiの投稿率θiの平均値である。mは、地域A1〜Amの地域数である。exp(μ)は、パラメータμの値から得られる地域A1〜Amにおける平均的な投稿率である。
μ0=1/m(Σiθi) ・・・(5)
ξ=μ0−exp(μ) ・・・(6)
このように、災害検知装置101によれば、ユーザ数で調整された地域別の投稿率群{θ1〜θm}が構成する分布の偏りξ(差分ξ)を用いて、地域A1〜Amのいずれかの地域Aiで災害が発生しているか否かを判定することができる。これにより、small number problemを回避しながら、全体分布の形が不明なデータに対して外れ値の有無を判定することができ、ソーシャルメディアなどに投稿されるメッセージから、災害の発生を高精度に検知することができる。
(災害検知システム200のシステム構成例)
つぎに、災害検知装置101を含む災害検知システム200のシステム構成例について説明する。以下の説明では、災害の発生を監視する対象エリアを「日本全国」とし、地域A1〜Amを「47都道府県」とし、地域Aiを「47都道府県のいずれかの都道府県」とする。
図2は、災害検知システム200のシステム構成例を示す説明図である。図2において、災害検知システム200は、災害検知装置101と、ソーシャルメディアサービス201と、を含む。災害検知システム200において、災害検知装置101およびソーシャルメディアサービス201は、有線または無線のネットワーク210を介して接続される。ネットワーク210は、例えば、LAN(Local Area Network)、WAN(Wide Area Network)、インターネット、移動体通信網などである。
災害検知装置101は、メッセージDB(データベース)220、地域別発言数DB230および各種統計量DB240を有し、ソーシャルメディアサービス201に投稿されたメッセージから、災害の発生を検知する。災害検知装置101は、例えば、サーバやPC(パーソナル・コンピュータ)などである。
なお、メッセージDB220、地域別発言数DB230および各種統計量DB240の記憶内容については、図4〜図6を用いて後述する。また、本実施の形態では、災害検知装置101が、1台のコンピュータにより実現される場合を例に挙げて説明するが、複数台のコンピュータにより実現されることにしてもよい。
ソーシャルメディアサービス201は、ユーザ同士がメッセージを投稿し、交換することによって情報流通を行うソーシャルメディアのサービスを提供するクラウドシステムである。ソーシャルメディアサービス201は、1台のコンピュータにより実現されてもよく、また、複数台のコンピュータにより実現されてもよい。ソーシャルメディアサービス201としては、例えば、TwitterやFacebookなどが挙げられる。
(災害検知装置101のハードウェア構成例)
図3は、災害検知装置101のハードウェア構成例を示すブロック図である。図3において、災害検知装置101は、CPU(Central Processing Unit)301と、メモリ302と、I/F(Interface)303と、ディスクドライブ304と、ディスク305と、を有する。また、各構成部は、バス300によってそれぞれ接続される。
ここで、CPU301は、災害検知装置101の全体の制御を司る。メモリ302は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)およびフラッシュROMなどを有する。具体的には、例えば、フラッシュROMやROMが各種プログラムを記憶し、RAMがCPU301のワークエリアとして使用される。メモリ302に記憶されるプログラムは、CPU301にロードされることで、コーディングされている処理をCPU301に実行させる。
I/F303は、通信回線を通じてネットワーク210に接続され、ネットワーク210を介して他の装置(例えば、図2に示したソーシャルメディアサービス201)に接続される。そして、I/F303は、ネットワーク210と自装置内部とのインターフェースを司り、他の装置からのデータの入出力を制御する。I/F303には、例えば、モデムやLANアダプタなどを採用することができる。
ディスクドライブ304は、CPU301の制御に従ってディスク305に対するデータのリード/ライトを制御する。ディスク305は、ディスクドライブ304の制御で書き込まれたデータを記憶する。ディスク305としては、例えば、磁気ディスク、光ディスクなどが挙げられる。
なお、災害検知装置101は、上述した構成部のほか、例えば、SSD(Solid State Drive)、キーボード、マウス、ディスプレイなどを有することにしてもよい。また、図2に示したソーシャルメディアサービス201についても、災害検知装置101と同様のハードウェア構成のコンピュータにより実現することができる。
(メッセージDB220の記憶内容)
つぎに、災害検知装置101が有するメッセージDB220の記憶内容について説明する。メッセージDB220は、例えば、図3に示したメモリ302やディスク305などの記憶装置により実現される。
図4は、メッセージDB220の記憶内容の一例を示す説明図である。図4において、メッセージDB220は、投稿場所、投稿日時および本文のフィールドを有し、各フィールドに情報を設定することで、メッセージ(例えば、メッセージ400−1〜400−5)をレコードとして記憶する。
ここで、投稿場所は、ソーシャルメディアサービス201を利用してメッセージが投稿された地域を示す。ただし、初期状態では、投稿場所フィールドには「−(null)」が設定される。投稿日時は、ソーシャルメディアサービス201を利用してメッセージが投稿された日時である。本文は、ソーシャルメディアサービス201を利用して投稿されたメッセージの本文である。
(地域別発言数DB230の記憶内容)
つぎに、災害検知装置101が有する地域別発言数DB230の記憶内容について説明する。地域別発言数DB230は、例えば、図3に示したメモリ302やディスク305などの記憶装置により実現される。
図5は、地域別発言数DB230の記憶内容の一例を示す説明図である。図5において、地域別発言数DB230は、集計日時および都道府県別の発言数のフィールドを有し、各フィールドに情報を設定することで、地域別発言数情報(例えば、地域別発言数情報500−1〜500−4)をレコードとして記憶する。
集計日時は、都道府県別の発言数を集計した日時である。都道府県別の発言数は、各都道府県において投稿された災害に関するメッセージの数であり、後述する「地域Aiの発言数yi」に対応する。ここでは、都道府県別の発言数は、集計日時の過去1時間分のメッセージを集計した数である。例えば、集計日時が2015年4月11日8時00分の場合、都道府県別の発言数は、各都道府県において2015年4月11日の7時01分から8時00分までに投稿された災害に関するメッセージの合計となる。
なお、ここでは都道府県別の発言数として、集計日時の過去1時間分のメッセージの集計値を用いることにしたが、これに限らない。例えば、都道府県別の発言数として、移動平均的な集計値を用いることにしてもよい。
(各種統計量DB240の記憶内容)
つぎに、災害検知装置101が有する各種統計量DB240の記憶内容について説明する。各種統計量DB240は、例えば、図3に示したメモリ302やディスク305などの記憶装置により実現される。
図6は、各種統計量DB240の記憶内容の一例を示す説明図である。図6において、各種統計量DB240は、集計日時、集計統計量、全国平均推定値および都道府県別の発言率のフィールドを有し、各フィールドに情報を設定することで、各種統計量情報(例えば、各種統計量情報600−1〜600−4)をレコードとして記憶する。
ここで、集計日時は、都道府県別の発言数(各地域Aiの発言数yi)を集計した日時である。集計統計量は、全地域A1〜Amの発言率群{θ1〜θm}が構成する分布の偏りを示しており、後述する「差分ξ」に対応する。全国平均推定値は、全地域A1〜Amの発言率群{θ1〜θm}の分布の中心値に対応するパラメータであり、後述する「全地域A1〜Amで共通のパラメータμ」に対応する。
都道府県別の発言率は、各地域Aiのユーザ数niに対する発言数yiの割合を表す値であり、後述する「地域Aiの発言率θi」に対応する。なお、図6では、各種統計量として、スペースの都合上実際よりも大きな値を示している。
(災害検知装置101の機能的構成例)
図7は、災害検知装置101の機能的構成例を示すブロック図である。図7において、災害検知装置101は、取得部701と、フィルタ部702と、特定部703と、集計部704と、算出部705と、判定部706と、出力部707と、を含む構成である。取得部701〜出力部707は制御部となる機能であり、具体的には、例えば、図3に示したメモリ302、ディスク305などの記憶装置に記憶されたプログラムをCPU301に実行させることにより、または、I/F303により、その機能を実現する。各機能部の処理結果は、例えば、メモリ302、ディスク305などの記憶装置に記憶される。
取得部701は、ソーシャルメディアサービス201から、投稿されたメッセージを取得する。メッセージには、投稿日時と本文が含まれる。また、メッセージには、投稿場所を示す位置情報が含まれていてもよい。投稿場所を示す位置情報は、例えば、投稿者の端末機器に搭載されたGPS(Global Positioning System)などにより測位される緯度、経度の情報である。
なお、ソーシャルメディアサービス201は、投稿されたメッセージを、定期的(例えば、数秒単位)に災害検知装置101に送信することにしてもよく、また、災害検知装置101からの要求に応じて送信することにしてもよい。取得されたメッセージは、例えば、図4に示したメッセージDB220に記憶される。
フィルタ部702は、取得部701によって取得されたメッセージに対してフィルタ処理を行う。具体的には、例えば、フィルタ部702は、メッセージDB220から、所定のキーワードを含まないメッセージを除外するフィルタ処理を行う。所定のキーワードは、任意に設定可能である。所定のキーワードとしては、例えば、「浸水」、「冠水」などの災害に関連するキーワードが設定される。
これにより、災害に関するメッセージ以外を除外することができる。なお、フィルタ部702によるメッセージに対するフィルタ処理例については、図8を用いて後述する。
また、フィルタ部702は、自然言語処理等を使って、目撃情報ではないメッセージを除外するフィルタ処理を行うことにしてもよい。例えば、フィルタ部702は、メッセージDB220から、報道機関によるメッセージを除外するフィルタ処理を行う。具体的には、例えば、フィルタ部702は、メッセージに投稿元の情報が含まれ、投稿元が報道機関である場合、当該メッセージを除外する。
また、例えば、フィルタ部702は、メッセージが再投稿されたメッセージである場合、当該メッセージを除外するフィルタ処理を行う。Twitterを例に挙げると、再投稿されたメッセージにはリツイートであることを示す「RT」が含まれる。フィルタ部702は、メッセージがリツイートのメッセージである場合、当該メッセージを除外する。
また、例えば、フィルタ部702は、メッセージが推定的な内容である場合、当該メッセージを除外するフィルタ処理を行う。具体的には、例えば、フィルタ部702は、メッセージに推定的な内容に含まれる特定のワードが含まれる場合、当該メッセージを除外する。特定のワードは、任意に設定可能である。
また、特定のワードは、推定的な内容のメッセージを収集して、機械学習により求めてもよい。また、フィルタ部702は、メッセージを構文解析して、推定的な内容で用いられる構文である場合、当該メッセージを除外するようにしてもよい。推定的な内容で用いられる構文も、例えば、推定的な内容のメッセージを収集して、機械学習により求めてもよい。
このように、目撃情報ではないメッセージを除外することにより、災害の発生場所を推定する際にノイズとなるメッセージを除外することができる。ここで、図8を用いて、フィルタ部702によるメッセージに対するフィルタ処理例について説明する。
図8は、メッセージDB220の記憶内容の更新例を示す説明図である。ここでは、図4に示したメッセージDB220内のメッセージ400−1〜400−5に対するフィルタ処理を例に挙げて説明する。
図8の(8−1)において、フィルタ部702は、メッセージ400−1〜400−5から、所定のキーワードを本文に含まないメッセージを除外する。ここでは、所定のキーワードとして、「浸水」、「冠水」が設定されている場合を想定する。この場合、メッセージ400−1〜400−5の全てに「浸水」というキーワードが含まれるため、フィルタ部702は、メッセージ400−1〜400−5のいずれのメッセージも除外しない。
図8の(8−2)において、フィルタ部702は、報道機関によるメッセージを除外する。ここでは、メッセージ400−3の本文に、投稿元が報道機関であることを示す情報「[新聞]」が含まれる。この場合、フィルタ部702は、例えば、メッセージDB220からメッセージ400−3を削除する。
図8の(8−3)において、フィルタ部702は、メッセージが再投稿されたメッセージである場合、当該メッセージを除外する。ここでは、メッセージ400−2の本文に、リツイートであることを示す「RT」が含まれる。この場合、フィルタ部702は、例えば、メッセージDB220からメッセージ400−2を削除する。
図7の説明に戻り、特定部703は、メッセージの投稿場所を特定する。具体的には、例えば、メッセージに投稿場所を示す位置情報が含まれる場合、特定部703は、メッセージに含まれる位置情報を参照して、メッセージの投稿場所を特定することにしてもよい。なお、投稿場所の特定は、例えば、フィルタ部702により除外されなかったメッセージについて行われる。
また、例えば、特定部703は、メッセージから地名などの場所を示す名詞を抽出することにより、抽出した名詞が示す場所を投稿場所として特定することにしてもよい。地名などの場所を示す名詞は、例えば、メモリ302、ディスク305などの記憶装置に予め登録されている。
特定されたメッセージの投稿場所は、例えば、メッセージDB220に記憶される。ここで、メッセージの投稿場所の特定例について説明する。ここでは、メッセージの投稿場所として、47都道府県のいずれかの都道府県を特定する場合を例に挙げて説明する。
まず、メッセージ400−1に、投稿場所を示す位置情報として、京都府のいずれかの地点を示す緯度、経度が含まれていたとする。この場合、特定部703は、メッセージ400−1の投稿場所として「京都府」を特定し、メッセージDB220のメッセージ400−1の投稿場所フィールドに「京都府」を設定する(図8の(8−4)参照)。
つぎに、メッセージ400−4に、投稿場所を示す位置情報として、大阪府のいずれかの地点を示す緯度、経度が含まれていたとする。この場合、特定部703は、メッセージ400−4の投稿場所として「大阪府」を特定し、メッセージDB220のメッセージ400−4の投稿場所フィールドに「大阪府」を設定する(図8の(8−4)参照)。
つぎに、メッセージ400−5に、投稿場所を示す位置情報が含まれておらず、また、地名などの場所を示す名詞も含まれていなかったとする。この場合、メッセージ400−5の投稿場所は特定されず、特定部703は、メッセージDB220のメッセージ400−5の投稿場所フィールドに「unknown」を設定する(図8の(8−4)参照)。
集計部704は、特定部703によって特定されたメッセージの投稿場所を参照して、各地域Aiの発言数yiを集計する。ここで、地域Aiは、47都道府県のうちのいずれかの都道府県である。また、各地域Aiの発言数yiは、各地域Aiにおいて投稿された災害に関するメッセージの数であり、図1で説明した「各地域Aiのメッセージ数yi」に対応する。
具体的には、例えば、集計部704は、フィルタ部702によるフィルタ処理が行われたメッセージDB220から投稿日時が所定期間T内に含まれるメッセージを抽出する。所定期間Tは、任意に設定可能である。例えば、時刻tにおける各地域Aiの発言数yiを集計する場合、時刻tの過去数時間分の期間を所定期間Tとして設定することにしてもよい。
より具体的には、例えば、図5に示したように、各地域Aiの発言数yiを集計する集計日時を1時間ごとに設定し、集計日時の過去1時間分の期間を所定期間Tとして設定することにしてもよい。一例として、集計日時を「2015年4月11日12時00分」とすると、所定期間Tは「2015年4月11日の11時01分〜12時00分」となる。この場合、集計部704は、メッセージDB220から、「2015年4月11日の11時01分〜12時00分」に投稿日時が含まれるメッセージを抽出する。
そして、集計部704は、抽出したメッセージの投稿場所を参照して、各地域Aiの発言数yiを集計する。例えば、「2015年4月11日の11時01分〜12時00分」に投稿日時が含まれるメッセージ群の中に、投稿場所が「北海道」のメッセージが2件含まれていた場合、北海道の発言数は「2」となる。
これにより、所定期間T内に各地域Aiにおいて投稿された災害に関するメッセージの数、すなわち、都道府県別の発言数を得ることができる。集計された各地域Aiの発言数yiは、例えば、図5に示した地域別発言数DB230に記憶される。ここで、図9を用いて、地域別発言数DB230の記憶内容の更新例について説明する。
図9は、地域別発言数DB230の記憶内容の更新例を示す説明図である。ここでは、集計日時を「2015年4月11日12時00分」とし、所定期間Tを集計日時の過去1時間分の期間とする。この場合、集計部704によって集計された各地域Aiの発言数yiが都道府県別の発言数フィールドに設定されて、地域別発言数情報500−5が新たなレコードとして記憶される。
図7の説明に戻り、算出部705は、集計部704によって集計された各地域Aiの発言数yiに基づいて、全地域A1〜Amで共通のパラメータμと各地域Aiで独立のバラツキを表すパラメータεiとを用いて表現される各地域Aiの発言率θiと、パラメータμの値とを算出する。
ここで、各地域Aiの発言数yiは、例えば、地域別発言数DB230から特定される。より詳細に説明すると、例えば、時刻tにおける各地域Aiの発言率θiとパラメータμの値は、地域別発言数DB230内の集計時刻tにおける各地域Aiの発言数yiに基づいて算出される。
各地域Aiの発言率θiは、各地域Aiのユーザ数niに対する発言数yiの割合を表す値であり、図1で説明した「各地域Aiの投稿率θi」に対応する。各地域Aiのユーザ数niは、例えば、各地域Aiにおけるソーシャルメディアのユーザ数であってもよく、また、各地域Aiの人口であってもよい。パラメータμは、例えば、全地域A1〜Amの発言率群{θ1〜θm}が構成する分布の中心値に対応する。
本実施の形態では、ある時刻tにおける各地域Aiの発言率θiは、全地域A1〜Amで共通のパラメータμを中心に独立的なバラツキ(εi)をもって分布すると仮定する。そして、算出部705は、例えば、上記式(1)および(2)を用いて、各地域Aiの発言率θiがそれぞれ独立なパラメータを持つポアソン分布に従うと仮定した階層的なポアソン回帰モデルを構築し、各パラメータの値を推定する。
ただし、yiは、各地域Aiの発言数である。niは、各地域Aiのユーザ数である。各地域Aiのユーザ数niは、例えば、予め登録されてメモリ302、ディスク305などの記憶装置に記憶されている。θiは、各地域Aiの発言率である。εiは、各地域Aiで独立のバラツキを表すパラメータである。μは、全地域A1〜Amで共通のパラメータである。
上記式(1)および(2)において、求めるべきパラメータ(θi、μ等)の数と比較して観測データ(発言数yi)の数が少ない。このため、算出部705は、例えば、上記式(3)および(4)のように、ハイパーパラメータおよび無情報事前分布を用意し、ベイズモデルを構築する。そして、算出部705は、例えば、マルコフ連鎖モンテカルロ法(MCMC法)を用いて各パラメータを求め、得られた各パラメータ分布の代表値(例えば、中央値または平均値)をパラメータ推定値とする。
これにより、ある時刻t(所定期間T)における各地域Aiの発言率θiと、全地域A1〜Amで共通のパラメータμの値を推定することができる。算出された各地域Aiの発言率θiとパラメータμの値は、例えば、図6に示した各種統計量DB240に記憶される。各種統計量DB240の記憶内容の更新例については、図10を用いて後述する。
また、算出部705は、算出した各地域Aiの発言率θiの平均値μ0と、算出したパラメータμの値から得られる平均的発言率exp(μ)との差分ξを算出する。ここで、平均的発言率exp(μ)は、地域A1〜Amにおける平均的な発言率を表す。
具体的には、例えば、算出部705は、算出した各地域Aiの発言率θiを上記式(5)に代入することにより、各地域Aiの発言率θiの平均値μ0を算出する。ただし、mは、地域A1〜Amの地域数である。そして、算出部705は、算出したパラメータμの値と、算出した平均値μ0とを上記式(6)に代入することにより、差分ξを算出する。
算出された差分ξは、例えば、図6に示した各種統計量DB240に記憶される。ここで、図10を用いて、各種統計量DB240の記憶内容の更新例について説明する。
図10は、各種統計量DB240の記憶内容の更新例を示す説明図である。ここでは、集計日時を「2015年4月11日12時00分」とし、所定期間Tを集計日時の過去1時間分の期間とする。
図10の(10−1)に示すように、算出部705によって各地域Aiの発言率θiとパラメータμの値が算出されると、各地域Aiの発言率θiが都道府県別の発言率フィールドに設定され、また、パラメータμの値が全国平均推定値フィールドに設定される。これにより、各種統計量情報600−5が新たなレコードとして記憶される。ただし、この時点では、各種統計量情報600−5の集約統計量フィールドは「−」である。
図10の(10−2)に示すように、算出部705によって差分ξが算出されると、各種統計量情報600−5の集約統計量フィールドに差分ξが設定される。
図7の説明に戻り、判定部706は、算出部705によって算出された差分ξが閾値Thよりも大きいか否かを判定する。ここで、災害が発生し、局所的な外れ値が存在する場合に、全地域A1〜Amの発言率群{θ1〜θm}が構成する分布に偏りが生じる。このため、平均的発言率exp(μ)と、各地域Aiの発言率θiの平均値μ0との差分ξを、全地域A1〜Amの発言率群{θ1〜θm}が構成する分布の偏りとして定義する。
そして、判定部706は、差分ξが閾値Thよりも大きいと判定した場合に、地域A1〜Amのいずれかの地域Aiで災害が発生していると判定する。これにより、偏りξ(差分ξ)が急増(バースト)している場合に、地域A1〜Amのいずれかの地域Aiで災害が発生しているとみなすことができる。
なお、閾値Thは、任意に設定可能であり、例えば、災害が発生していない期間(平常時)における差分ξの平均値に基づいて設定される。ここで、図11を用いて、閾値Thの設定例について説明する。
図11は、閾値Thの設定例を示す説明図である。図11において、グラフ1100は、一定時間(例えば、1時間)ごとの各時刻t(例えば、時刻t1〜tk)における、各地域Aiの発言率θiの平均値μ0と平均的発言率exp(μ)との差分ξの推移を表している。
ここでは、時刻tkの直後に、地域A1〜Amのいずれかの地域Aiで災害が発生したとする。すなわち、時刻t1から時刻tkまでの期間を、災害が発生していない平常時の期間とする。この場合、判定部706は、時刻t1〜tkの各時刻tの差分ξの平均値ξ0を算出する。
そして、判定部706は、例えば、下記式(7)を用いて、閾値Thを算出する。ただし、cは、任意に設定可能な係数である。
Th=c×ξ0 ・・・(7)
これにより、災害が発生していない平常時の期間における差分ξを考慮して、偏りξ(差分ξ)のバーストを検出するための閾値Thを設定することができ、発災の有無を高精度に判定することができるようになる。
また、判定部706は、地域A1〜Amのいずれかの地域Aiで災害が発生していると判定した場合、各地域Aiの発言率θiに基づいて、地域A1〜Amの中から災害が発生している発災地域Ajを特定する。ここで、図12を用いて、判定部706による発災地域Ajの特定処理例について説明する。
図12は、発災地域Ajの特定処理例を示す説明図である。図12において、グラフ1210は、地域A1〜Amのいずれかの地域Aiで災害が発生していると判定された際の各地域Aiの発言率θiの分布を表している。
まず、判定部706は、各種統計量DB240を参照して、例えば、グラフ1220に示すように、ある時刻t(集計日時)における各地域Aiの発言率θiを小さい順に並べてランキングを構成する。つぎに、判定部706は、下記式(8)を用いて、ランキング上位から順に1位からp位までの発言率の平均を求めることにより、p位平均値μ(p)を算出する(p=1,2,…,m)。
Figure 0006528532
ここで、上記式(6)により、発災地域Ajの発言率θjは、平均的発言率exp(μ)付近から大きい方向の外れ値となっており、災害が発生していない地域Aiの発言率θiは、平均的発言率exp(μ)付近に分布すると想定される。このため、p位平均値μ(p)は、災害が発生していない地域Aiにおいては緩やかな上昇を示し、発災地域Ajにおいて極端に大きくなる。
また、上記式(6)および(7)により、例えば、グラフ1220において、p位平均値μ(p)が、閾値Thと平均的発言率exp(μ)とを加算した値「cξ0+exp(μ)」を超える点が発災地域Ajを推定する閾値になるといえる。そこで、判定部706は、p位平均値μ(p)が閾値「cξ0+exp(μ)」よりも大きい場合に、p位の発言率に対応する地域を発災地域Ajとして特定する。
より具体的には、例えば、判定部706は、p位平均値μ(p)が閾値「cξ0+exp(μ)」よりも大きい場合に、p位以降の各順位の発言率に対応する地域をそれぞれ発災地域Ajとして特定する。これにより、ある時刻t(集計日時)において災害が発生している地域Ajを特定することができる。
例えば、p位平均値μ(p)が閾値「cξ0+exp(μ)」よりも大きくなったときのpを「p=46」とする。また、47都道府県のうち、各地域Aiの発言率θiを小さい順に並べた際の順位が46位の地域を「大阪府」とし、47位の地域を「京都府」とする。この場合、判定部706は、46位以降の各発言率に対応する「大阪府」および「京都府」をそれぞれ発災地域として特定する。
図7の説明に戻り、出力部707は、判定部706によって判定された判定結果を出力する。出力部707の出力形式としては、例えば、メモリ302、ディスク305などの記憶装置への記憶、I/F303による外部装置(例えば、災害検知システム200の管理者のPC等)への送信、不図示のディスプレイへの表示、不図示のプリンタへの印刷出力などがある。
具体的には、例えば、出力部707は、地域A1〜Amのいずれかの地域Aiで災害が発生していると判定された場合、時刻t(集計日時)と対応付けて、地域A1〜Amのいずれかの地域Aiで災害が発生していることを示す情報を出力することにしてもよい。
これにより、例えば、災害検知システム200の管理者は、時刻tにおいて地域A1〜Amのいずれかの地域Aiで災害が発生していることを知ることができる。
また、出力部707は、判定部706によって特定された発災地域Ajの情報を出力する。具体的には、例えば、出力部707は、発災地域Ajが特定された場合、時刻t(集計日時)と対応付けて、地域Ajで災害が発生していることを示す災害通知を出力することにしてもよい。
ここで、図13を用いて、災害通知の具体例について説明する。ここでは、集計日時「2015年4月11日12時00分」において災害が発生している「大阪府」および「京都府」が特定された場合を例に挙げて説明する。
図13は、災害通知の具体例を示す説明図である。図13において、災害通知1300は、時刻「2015年4月11日12時00分」と対応付けて、災害が発生している都道府県名「大阪府」および「京都府」を示す情報である。災害通知1300によれば、例えば、災害検知システム200の管理者は、時刻「2015年4月11日12時00分」において、「大阪府」および「京都府」で災害が発生していることを知ることができる。
(災害検知装置101の災害検知処理手順)
つぎに、災害検知装置101の災害検知処理手順について説明する。
図14は、災害検知装置101の災害検知処理手順の一例を示すフローチャートである。図14のフローチャートにおいて、まず、災害検知装置101は、集計日時tとなったか否かを判断する(ステップS1401)。ここで、災害検知装置101は、集計日時tとなるのを待つ(ステップS1401:No)。
そして、集計日時tとなった場合(ステップS1401:Yes)、災害検知装置101は、メッセージDB220から集計日時tの過去1時間分の所定期間T内のメッセージを抽出する(ステップS1402)。つぎに、災害検知装置101は、抽出したメッセージに対してフィルタ処理を行う(ステップS1403)。
フィルタ処理の具体的な処理手順については、図15を用いて後述する。
つぎに、災害検知装置101は、フィルタ処理により除外されなかったメッセージの投稿場所を特定する(ステップS1404)。そして、災害検知装置101は、特定したメッセージの投稿場所を参照して、各地域Aiの発言数yiを集計する(ステップS1405)。
つぎに、災害検知装置101は、集計した各地域Aiの発言数yiに基づいて、上記式(1)〜(4)を用いて、各地域Aiの発言率θiと、全地域A1〜Amで共通のパラメータμの値とを算出する(ステップS1406)。そして、災害検知装置101は、算出した各地域Aiの発言率θiの平均値μ0と、算出したパラメータμの値から得られる平均的発言率exp(μ)との差分ξを算出する(ステップS1407)。
つぎに、災害検知装置101は、算出した差分ξが閾値cξ0よりも大きいか否かを判定する(ステップS1408)。ここで、差分ξが閾値cξ0以下の場合には(ステップS1408:No)、災害検知装置101は、本フローチャートによる一連の処理を終了する。
一方、差分ξが閾値cξ0よりも大きい場合は(ステップS1408:Yes)、災害検知装置101は、各地域Aiの発言率θiに基づいて、地域A1〜Amの中から災害が発生している発災地域Ajを特定する(ステップS1409)。そして、災害検知装置101は、集計日時tと対応付けて、地域Ajで災害が発生していることを示す災害通知を出力して(ステップS1410)、本フローチャートによる一連の処理を終了する。
これにより、リアルタイムに発災地域Ajを特定して、災害の発生日時と発生場所を推定することができる。
つぎに、図14に示したステップS1403のフィルタ処理の具体的な処理手順について説明する。
図15は、フィルタ処理の具体的処理手順の一例を示すフローチャートである。図15のフローチャートにおいて、まず、災害検知装置101は、図14に示したステップS1402において抽出したメッセージから、所定のキーワードを含まないメッセージを除外する(ステップS1501)。
そして、災害検知装置101は、残余のメッセージから、投稿元が報道機関であるメッセージを除外する(ステップS1502)。つぎに、災害検知装置101は、残余のメッセージから、再投稿されたメッセージを除外する(ステップS1503)。そして、災害検知装置101は、残余のメッセージから、推定的な内容のメッセージを除外して(ステップS1504)、フィルタ処理を呼び出したステップに戻る。
これにより、災害に関するメッセージを絞り込むとともに、目撃情報ではないメッセージを除外して、災害の発生場所を推定する際にノイズとなるメッセージを除外することができる。
図16は、実施の形態にかかる災害検知方法の適用事例を示す説明図である。図16において、色付き期間(図16中、発災ありと判定した期間)は、2012年8月10日〜19日のTwitter上の浸水、冠水等の災害に関連するキーワードを含むメッセージに対して、本災害検知方法を適用した場合に地域A1〜Amのいずれかの地域Aiで災害が発生していると判定した期間である。ただし、地域Aiは、47都道府県のうちのいずれかの都道府県である(m=47)。
具体的には、点線グラフ1610は、2012年8月10日〜19日の偏りξ(差分ξ)の推移を表している。破線グラフ1620は、2012年8月10日〜19日の平均的発言率exp(μ)の推移を表している。実線グラフ1630は、2012年8月10日〜19日の発言率の和の推移を表している。
本災害検知方法に比べて、図1で説明した問題手法1,2では発災地域を推定できない場合がある。例えば、図16中のA1,A2では、全国で発言数がバーストし、問題手法2では発災地域を推定することができない。また、図16中のB1,B2では、small number problemの影響により、問題手法1では発災地域を推定することができない。また、図16中のC1,C2では、全発言率の和の明確なバーストがなく、問題手法2では発災地域を推定することが難しい。
ここで、図16中のB1を例に挙げて、発災事例に対する処理結果について説明する。
図17は、発災事例に対する処理結果の一例を示す説明図である。図17において、グラフ1710は、2012年8月13日22時00分における問題手法1の正規化発言率(地域別の発言数を地域別のユーザ数等で除算した正規化発言数)の推移を表している。
グラフ1720は、2012年8月13日22時00分における本災害検知方法の発言率θiの推移を表している。グラフ1730は、2012年8月13日22時00分における各地域Aiの発言率θiを小さい順に並べたランキングを表している。
グラフ1710では、極端にユーザ数が小さい地域(図17中、点線丸)において発言数が過剰に評価されているのに対して、グラフ1720では、統計量が不安定なものが畳み込まれている。この結果、本災害検知方法では、グラフ1730に示すように、各地域Aiの発言率θiのランキングを構成してp位平均値μ(p)を算出することにより、実際の発災地域である「愛知県」を検知することができている。
以上説明したように、実施の形態にかかる災害検知装置101によれば、時刻t(所定期間T)における各地域Aiの発言数yiに基づいて、全地域A1〜Amで共通のパラメータμと各地域Aiで独立のバラツキを表すパラメータεiとを用いて表現される各地域Aiの発言率θiと、パラメータμの値とを算出することができる。これにより、時刻tにおける各地域Aiの発言率θiと、全地域A1〜Amで共通のパラメータμの値を推定することができる。
また、災害検知装置101によれば、算出した各地域Aiの発言率θiの平均値μ0と、算出したパラメータμの値から得られる平均的発言率exp(μ)との差分ξが閾値Thよりも大きいか否かを判定することができる。そして、災害検知装置101によれば、差分ξが閾値Thよりも大きい場合に、地域A1〜Amのいずれかの地域Aiで災害が発生していると判定することができる。これにより、偏りξ(差分ξ)が急増(バースト)している場合に、地域A1〜Amのいずれかの地域Aiで災害が発生しているとみなすことができ、時刻tにおける浸水や土砂災害などの局所的に発生する災害の有無を高精度に判定することができる。
また、災害検知装置101によれば、災害が発生していない期間(平常時)における差分ξの平均値に基づいて、閾値Thを設定することができる。これにより、災害が発生していない平常時の期間における差分ξを考慮して、偏りξ(差分ξ)のバーストを検出するための閾値Thを設定することができ、発災の有無をより高精度に判定することができるようになる。
また、災害検知装置101によれば、地域A1〜Amのいずれかの地域Aiで災害が発生していると判定した場合、各地域Aiの発言率θiに基づいて、地域A1〜Amの中から災害が発生している発災地域Ajを特定することができる。具体的には、例えば、災害検知装置101は、時刻tにおける各地域Aiの発言率θiを小さい順に並べてランキングを構成し、ランキング上位から順に1位からp位までの発言率の平均を求めてp位平均値μ(p)を算出することができる。そして、災害検知装置101は、p位平均値μ(p)が閾値「cξ0+exp(μ)」よりも大きい場合に、p位以降の各順位の発言率に対応する地域をそれぞれ発災地域Ajとして特定することができる。これにより、発言率群{θ1〜θm}の分布の偏りξの要因となっている外れ値を検出して、時刻tにおいて災害が発生している地域Ajを特定することができる。
また、災害検知装置101によれば、ソーシャルメディアサービス201から取得した災害に関するメッセージのうち、報道機関によるメッセージを除外するフィルタ処理を行うことができる。また、災害検知装置101によれば、災害に関するメッセージのうち、再投稿されたメッセージを除外するフィルタ処理を行うことができる。また、災害検知装置101によれば、災害に関するメッセージのうち、推定的な内容のメッセージを除外するフィルタ処理を行うことができる。そして、災害検知装置101によれば、フィルタ処理後のメッセージの投稿場所を特定して、各地域Aiの発言数yiを集計することができる。これにより、目撃情報ではないメッセージを除外して、災害の発生場所を推定する際にノイズとなるメッセージを除外することができる。
これらのことから、災害検知装置101によれば、ユーザ数で調整された地域別の発言率群{θ1〜θm}が構成する分布の偏りξ(差分ξ)を用いて、地域A1〜Amのいずれかの地域Aiで災害が発生しているか否かを判定することができる。これにより、small number problemを回避しながら、全体分布の形が不明なデータに対して外れ値の有無を判定することができ、ソーシャルメディアなどに投稿されるメッセージから、災害の発生を高精度に検知することができる。また、ユーザ数が極端に異なる地域間の発言数(メッセージ数)を相対的に比較して、局所的に発言数が大きくなっている地域を検出することができ、リアルタイムに発災地域Ajを特定して、災害の発生日時と発生場所を推定することができる。
また、全国的な災害関連の発言の平均的発言率exp(μ)をモデル式に組み込み、かつ、平均的発言率exp(μ)に対する偏りξを用いて発災の有無を判定することで、発災の有無に関わらず発生する全国的な発言数の経時的な変動の影響を回避することができる。これにより、発災時における全国的な発言数の急増に加え、時間帯等に起因する周期的な発言数の変動を吸収することができる。例えば、図16に示した例では、平均的発言率exp(μ)は、平常時(8/10)・発災時(8/14等)ともに経時的に変動している。一方で、偏りξ(差分ξ)は、平均的発言率exp(μ)と比べて変動が小さいものとなっている。
また、問題手法1では、地域ごとの発言数に対してバーストを検知するために、それぞれの地域に対して閾値を事前に用意する必要がある。これに対して、本災害検知方法では、調整すべきパラメータ(閾値Th)が1つのみであるため事前準備にかかる手間が少ない。
なお、本実施の形態で説明した災害検知方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本災害検知プログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本災害検知プログラムは、インターネット等のネットワークを介して配布してもよい。
上述した実施の形態に関し、さらに以下の付記を開示する。
(付記1)コンピュータに、
災害に関するメッセージにおける地域を推定し、推定した複数の前記地域の各地域における前記メッセージの数に基づいて、前記複数の地域で共通の第1変数と前記各地域で独立のバラツキを表す第2変数とを用いて表現される前記各地域の前記メッセージの投稿率と、前記第1変数の値とを算出し、
算出した前記各地域の投稿率の平均値と、算出した前記第1変数の値から得られる前記複数の地域における平均的な投稿率との差分が閾値よりも大きい場合に、前記複数の地域のいずれかの地域で災害が発生していると判定する、
処理を実行させることを特徴とする災害検知プログラム。
(付記2)前記メッセージの数は、所定期間内に前記各地域において投稿された災害に関するメッセージの数であることを特徴とする付記1に記載の災害検知プログラム。
(付記3)前記閾値は、災害が発生していない期間における前記差分の平均値に基づいて設定されることを特徴とする付記1または2に記載の災害検知プログラム。
(付記4)前記コンピュータに、
前記複数の地域のいずれかの地域で災害が発生していると判定した場合、算出した前記各地域の投稿率に基づいて、前記複数の地域から災害が発生している発災地域を特定する、処理を実行させることを特徴とする付記1〜3のいずれか一つに記載の災害検知プログラム。
(付記5)前記特定する処理は、
前記各地域の投稿率のうちのいずれかの投稿率以下の投稿率の平均値が、前記閾値と前記平均的な投稿率とを加算した所定値よりも大きい場合に、前記いずれかの投稿率に対応する地域を発災地域として特定することを特徴とする付記4に記載の災害検知プログラム。
(付記6)前記特定する処理は、
前記いずれかの投稿率以下の投稿率の平均値が前記所定値よりも大きい場合に、前記各地域の投稿率のうちの前記いずれかの投稿率以上の投稿率に対応する地域をそれぞれ発災地域として特定することを特徴とする付記5に記載の災害検知プログラム。
(付記7)前記第1変数は、前記複数の地域それぞれの前記メッセージの投稿率の分布の中心値に対応する変数であることを特徴とする付記1〜6のいずれか一つに記載の災害検知プログラム。
(付記8)前記メッセージの数は、前記各地域において投稿された災害に関するメッセージのうち、報道機関によるメッセージ、再投稿されたメッセージおよび推定的な内容のメッセージの少なくともいずれかを除外した残余のメッセージの数であることを特徴とする付記1〜7のいずれか一つに記載の災害検知プログラム。
(付記9)災害に関するメッセージにおける地域を推定し、推定した複数の前記地域の各地域における前記メッセージの数に基づいて、前記複数の地域で共通の第1変数と前記各地域で独立のバラツキを表す第2変数とを用いて表現される前記各地域の前記メッセージの投稿率と、前記第1変数の値とを算出し、
算出した前記各地域の投稿率の平均値と、算出した前記第1変数の値から得られる前記複数の地域における平均的な投稿率との差分が閾値よりも大きい場合に、前記複数の地域のいずれかの地域で災害が発生していると判定する、
制御部を有することを特徴とする災害検知装置。
(付記10)コンピュータが、
災害に関するメッセージにおける地域を推定し、推定した複数の前記地域の各地域における前記メッセージの数に基づいて、前記複数の地域で共通の第1変数と前記各地域で独立のバラツキを表す第2変数とを用いて表現される前記各地域の前記メッセージの投稿率と、前記第1変数の値とを算出し、
算出した前記各地域の投稿率の平均値と、算出した前記第1変数の値から得られる前記複数の地域における平均的な投稿率との差分が閾値よりも大きい場合に、前記複数の地域のいずれかの地域で災害が発生していると判定する、
処理を実行することを特徴とする災害検知方法。
101 災害検知装置
200 災害検知システム
201 ソーシャルメディアサービス
220 メッセージDB
230 地域別発言数DB
240 各種統計量DB
300 バス
301 CPU
302 メモリ
303 I/F
304 ディスクドライブ
305 ディスク
701 取得部
702 フィルタ部
703 特定部
704 集計部
705 算出部
706 判定部
707 出力部

Claims (8)

  1. コンピュータに、
    災害に関するメッセージにおける地域を推定し、
    推定した複数の前記地域の各地域における前記メッセージの数に基づいて、前記複数の地域それぞれの前記メッセージの投稿率の分布の中心値に対応する第1変数および前記第1変数に対する前記複数の地域それぞれの前記メッセージの投稿率のバラツキをす第2変数用いて表現される前記複数の地域の前記メッセージの投稿率と、前記第1変数の値とを算出し、
    算出した前記複数の地域の投稿率の平均値と、算出した前記第1変数の値から得られる前記複数の地域における平均的な投稿率との差分が閾値よりも大きい場合に、前記複数の地域のいずれかの地域で災害が発生していると判定する、
    処理を実行させることを特徴とする災害検知プログラム。
  2. 前記メッセージの数は、所定期間内に前記各地域において投稿された災害に関するメッセージの数であることを特徴とする請求項1に記載の災害検知プログラム。
  3. 前記閾値は、災害が発生していない期間における前記差分の平均値に基づいて設定されることを特徴とする請求項1または2に記載の災害検知プログラム。
  4. 前記コンピュータに、
    前記複数の地域のいずれかの地域で災害が発生していると判定した場合、算出した前記各地域の投稿率に基づいて、前記複数の地域から災害が発生している発災地域を特定する、処理を実行させることを特徴とする請求項1〜3のいずれか一つに記載の災害検知プログラム。
  5. 前記特定する処理は、
    前記各地域の投稿率のうちのいずれかの投稿率以下の投稿率の平均値が、前記閾値と前記平均的な投稿率とを加算した所定値よりも大きい場合に、前記いずれかの投稿率に対応する地域を発災地域として特定することを特徴とする請求項4に記載の災害検知プログラム。
  6. 前記特定する処理は、
    前記いずれかの投稿率以下の投稿率の平均値が前記所定値よりも大きい場合に、前記各地域の投稿率のうちの前記いずれかの投稿率以上の投稿率に対応する地域をそれぞれ発災地域として特定することを特徴とする請求項5に記載の災害検知プログラム。
  7. 災害に関するメッセージにおける地域を推定し、推定した複数の前記地域の各地域における前記メッセージの数に基づいて、前記複数の地域それぞれの前記メッセージの投稿率の分布の中心値に対応する第1変数および前記第1変数に対する前記複数の地域それぞれの前記メッセージの投稿率のバラツキをす第2変数用いて表現される前記複数の地域の前記メッセージの投稿率と、前記第1変数の値とを算出し、
    算出した前記複数の地域の投稿率の平均値と、算出した前記第1変数の値から得られる前記複数の地域における平均的な投稿率との差分が閾値よりも大きい場合に、前記複数の地域のいずれかの地域で災害が発生していると判定する、
    制御部を有することを特徴とする災害検知装置。
  8. コンピュータが、
    災害に関するメッセージにおける地域を推定し、推定した複数の前記地域の各地域における前記メッセージの数に基づいて、前記複数の地域それぞれの前記メッセージの投稿率の分布の中心値に対応する第1変数および前記第1変数に対する前記複数の地域それぞれの前記メッセージの投稿率のバラツキをす第2変数用いて表現される前記複数の地域の前記メッセージの投稿率と、前記第1変数の値とを算出し、
    算出した前記複数の地域の投稿率の平均値と、算出した前記第1変数の値から得られる前記複数の地域における平均的な投稿率との差分が閾値よりも大きい場合に、前記複数の地域のいずれかの地域で災害が発生していると判定する、
    処理を実行することを特徴とする災害検知方法。
JP2015097633A 2015-05-12 2015-05-12 災害検知プログラム、災害検知装置および災害検知方法 Active JP6528532B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015097633A JP6528532B2 (ja) 2015-05-12 2015-05-12 災害検知プログラム、災害検知装置および災害検知方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015097633A JP6528532B2 (ja) 2015-05-12 2015-05-12 災害検知プログラム、災害検知装置および災害検知方法

Publications (2)

Publication Number Publication Date
JP2016212751A JP2016212751A (ja) 2016-12-15
JP6528532B2 true JP6528532B2 (ja) 2019-06-12

Family

ID=57552187

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015097633A Active JP6528532B2 (ja) 2015-05-12 2015-05-12 災害検知プログラム、災害検知装置および災害検知方法

Country Status (1)

Country Link
JP (1) JP6528532B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6698040B2 (ja) * 2017-02-07 2020-05-27 ヤフー株式会社 生成装置、生成方法及び生成プログラム
JP7020100B2 (ja) * 2017-12-19 2022-02-16 日本電気株式会社 情報処理装置、ハザードマップ生成方法およびプログラム
JP7091700B2 (ja) * 2018-02-21 2022-06-28 富士通株式会社 情報処理プログラム、メッセージ解析プログラム、情報処理装置及び情報処理方法
JP7350546B2 (ja) * 2019-07-17 2023-09-26 三菱重工業株式会社 災害状況推定装置、表示システム、災害状況推定方法、災害推定モデルの作成方法およびプログラム
CN112288151B (zh) * 2020-10-22 2022-05-13 武汉大学 一种面向灾害应急的灾害链构建与灾害分析方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013168021A (ja) * 2012-02-15 2013-08-29 Nifty Corp イベント検出装置
JP5836892B2 (ja) * 2012-06-28 2015-12-24 Kddi株式会社 イベント位置に地理的な特徴物の識別名称をタグ付けする装置、プログラム及び方法
JP5548243B2 (ja) * 2012-08-07 2014-07-16 日本電信電話株式会社 イベント発生地点抽出装置、方法、及びプログラム

Also Published As

Publication number Publication date
JP2016212751A (ja) 2016-12-15

Similar Documents

Publication Publication Date Title
Kogan et al. An early warning approach to monitor COVID-19 activity with multiple digital traces in near real time
JP6528532B2 (ja) 災害検知プログラム、災害検知装置および災害検知方法
Hao et al. Compound extremes in hydroclimatology: a review
Huang et al. Twitter reveals human mobility dynamics during the COVID-19 pandemic
CN106656536B (zh) 一种用于处理服务调用信息的方法与设备
Mydlarz et al. The life of a New York City noise sensor network
CN109558295B (zh) 一种性能指标异常检测方法及装置
CN105446706B (zh) 用于评估表单页面使用效果及提供原始数据的方法及装置
DK3073450T3 (en) SYSTEM AND PROCEDURE FOR MONITORING A DRIVER'S DRIVING CONDUCT
Ruiz-Gutiérrez et al. Detection biases yield misleading patterns of species persistence and colonization in fragmented landscapes
Wang et al. Aggregated responses of human mobility to severe winter storms: An empirical study
Wagner et al. The added value of online user-generated content in traditional methods for influenza surveillance
US10210214B2 (en) Scalable trend detection in a personalized search context
US20160080229A1 (en) Application performance monitoring method and device
CN107391335B (zh) 一种用于检查集群健康状态的方法和设备
RU2716029C1 (ru) Система мониторинга качества и процессов на базе машинного обучения
US20170235784A1 (en) System and method for improving performance of unstructured text extraction
Zaldumbide et al. Identification and validation of real-time health events through social media
Bocquier Migration analysis using demographic surveys and surveillance systems
Madouasse et al. Evaluation of a continuous indicator for syndromic surveillance through simulation. application to vector borne disease emergence detection in cattle using milk yield
Young et al. Social sensing of flood impacts in India: A case study of Kerala 2018
Hong et al. Statistical perspectives on reliability of artificial intelligence systems
Wu et al. Policy and weather influences on mobility during the early US COVID-19 pandemic
US10242101B2 (en) Automatic identification of sources of web metric changes
Guan et al. Tracking the evolution of infrastructure systems and mass responses using publically available data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190429

R150 Certificate of patent or registration of utility model

Ref document number: 6528532

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150