JP2014006735A - 情報提供装置、情報提供方法及び情報提供プログラム - Google Patents

情報提供装置、情報提供方法及び情報提供プログラム Download PDF

Info

Publication number
JP2014006735A
JP2014006735A JP2012142391A JP2012142391A JP2014006735A JP 2014006735 A JP2014006735 A JP 2014006735A JP 2012142391 A JP2012142391 A JP 2012142391A JP 2012142391 A JP2012142391 A JP 2012142391A JP 2014006735 A JP2014006735 A JP 2014006735A
Authority
JP
Japan
Prior art keywords
information
extraction
event
extracted
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012142391A
Other languages
English (en)
Other versions
JP5739843B2 (ja
Inventor
Yasuyoshi Sawada
泰良 澤田
Takuya Masuko
卓也 益子
Hisato Kitamura
央斗 北村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2012142391A priority Critical patent/JP5739843B2/ja
Publication of JP2014006735A publication Critical patent/JP2014006735A/ja
Application granted granted Critical
Publication of JP5739843B2 publication Critical patent/JP5739843B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】イベントに関連する情報を適正な範囲で提供する。
【解決手段】投稿情報抽出部28は、クローラ情報毎に、イベントとの関連性が高いと見なされる主関連キーワード及び副関連キーワードの少なくとも何れかを含み、イベントとの関連性が低いと見なされるNGキーワードを含まない投稿情報を抽出し、更にその抽出した投稿情報に含まれる新たな副関連キーワードを抽出するという処理を繰り返す。抽出終了制御部32は、主関連キーワード及び副関連キーワードを含む投稿情報の件数の合計数が第1の所定数未満である場合に、投稿情報抽出部28による投稿情報の抽出を終了させる。
【選択図】図2

Description

本発明は、情報提供装置、情報提供方法及び情報提供プログラムに関する。
随時、更新や追加される情報からキーワード検索によりリアルタイムに情報を提供する情報提供装置がある。
例えば、特許文献1に記載の技術では、リアルタイムの情報から時々刻々と変化する話題性を判断し、その話題性の変化を考慮した情報抽出を行う。また、例えば、所定のイベントが発生した場合に、そのイベントに関連するキーワードを含む情報を抽出してリアルタイムに提供する情報提供装置がある。このような情報提供装置には、第1のキーワードを含む情報を抽出し、その抽出した情報に共通の第2のキーワードを取得して、更なる情報抽出に用いるといった処理を繰り返し、イベントに関連する情報を提供するものがある。
特許第2729356号公報
しかしながら、上述した、随時キーワードを追加して情報抽出に用いる情報提供装置では、追加されるキーワードは徐々にイベントとの関連性が低下することが想定される。このため、追加されるキーワードを用いた情報抽出では、徐々にイベントに関連する情報が得られなくなってしまうという問題があった。
本発明は、このような問題に鑑みてなされたものであり、イベントに関連する情報を適正な範囲で提供することを目的とする。
上記目的を達成するために、本発明の第1の観点に係る情報提供装置は、所定のイベントに関連する情報を提供する情報提供装置であって、前記所定のイベントとの関連性が高いと見なされる第1の関連キーワードを記憶する第1の記憶手段と、所定のタイミング毎に、抽出対象の情報のうち、前記第1の記憶手段に記憶された前記第1の関連キーワードの少なくとも何れかを含む情報を抽出し、その抽出した情報に含まれ、前記所定のイベントとの関連性が高いと見なされる新たな第1の関連キーワードを前記第1の記憶手段に記憶させる抽出及び記憶処理を繰り返す抽出手段と、前記抽出手段による抽出結果が抽出を終了すべき所定の条件を満たした場合に、前記抽出手段による前記抽出及び記憶処理を終了させる抽出終了制御手段と、を備えることを特徴とする。
このような構成によれば、情報提供装置は、第1の関連キーワードを含む情報を抽出し、更にその抽出した情報に含まれる新たな第1の関連キーワードを含む情報を抽出するという処理を繰り返す。但し、新たに追加される第1の関連キーワードはイベントとの関連性が徐々に低下することが想定されることに鑑み、情報提供装置は、抽出結果が抽出を終了すべき所定の条件を満たした場合には、抽出を終了する。このため、イベントとの関連性の低い第1の関連キーワードが用いられて、イベントと関連する情報が得られなくなってしまうことを防止し、イベントに関連する情報を適正な範囲で提供することができる。
前記抽出終了制御手段は、前記抽出手段により抽出される前記情報の件数が第1の所定数未満の場合に、前記抽出手段による前記抽出及び記憶処理を終了させるようにしてもよい。
第1の関連キーワードは随時追加されるため、第1の関連キーワードの何れかを含む情報の件数は、徐々に増加することが想定される。一方、このような想定にもかかわらず、第1の関連キーワードの何れかを含む情報の件数が第1の所定数未満になった場合には、第1の関連キーワードとイベントとの関連性が低くなっているとみなすことができる。この場合には、抽出及び記憶処理を終了することにより、イベントに関連する情報を適正な範囲で提供することができる。
前記抽出終了制御手段は、前記抽出手段により抽出される前記新たな第1の関連キーワードを含む前記情報の件数が第2の所定数未満の場合に、前記抽出手段による前記新たな第1の関連キーワードを含む前記情報の抽出及び記憶処理を終了させるようにしてもよい。
抽出した情報から得られた新たな第1の関連キーワードを用いて抽出される情報の件数が第1の所定数未満になった場合には、その新たな第1の関連キーワードとイベントとの関連性が低くなっているとみなすことができる。この場合には、その新たな第1の関連キーワードを用いた抽出及び記憶処理を終了することにより、イベントに関連する情報を適正な範囲で提供することができる。
前記抽出終了制御手段は、前記所定のタイミング毎に前記抽出手段により抽出される前記情報の件数が所定の減少傾向を示す場合に、前記抽出手段による前記抽出及び記憶処理を終了させるようにしてもよい。
第1の関連キーワードは随時追加されるため、第1の関連キーワードの何れかを含む情報の件数は、徐々に増加することが想定される。一方、このような想定にもかかわらず、第1の関連キーワードの何れかを含む情報の件数が所定の減少傾向を示す場合には、第1の関連キーワードとイベントとの関連性が低くなっているとみなすことができる。この場合には、抽出及び記憶処理を終了することにより、イベントに関連する情報を適正な範囲で提供することができる。
前記抽出終了制御手段は、前記抽出手段により抽出される前記新たな第1の関連キーワードを含む前記情報の件数が所定の減少傾向を示す場合に、前記抽出手段による前記新たな第1の関連キーワードを含む前記情報の抽出及び記憶処理を終了させるようにしてもよい。
抽出した情報から得られた新たな第1の関連キーワードを用いて抽出される情報の件数が所定の減少傾向を示す場合には、その新たな第1の関連キーワードとイベントとの関連性が低くなっているとみなすことができる。この場合には、その新たな第1の関連キーワードを用いた抽出及び記憶処理を終了することにより、イベントに関連する情報を適正な範囲で提供することができる。
前記所定のイベントとの関連性が低いと見なされる非関連キーワードを記憶する第2の記憶手段を備え、前記抽出手段は、前記第1の記憶手段に記憶された前記第1の関連キーワードの少なくとも何れかを含み、且つ、前記第2の記憶手段に記憶された前記非関連キーワードの何れも含まない前記情報を抽出するようにしてもよい。
イベントとの関連性が低い非関連キーワードを含む情報は、仮に第1の関連キーワードを含んでいても抽出対象から除外することにより、抽出される情報を、よりイベントとの関連性の高いと見なされる情報に限定することができる。
前記所定のイベントは、発生する地域が特定されるイベントであり、前記抽出対象の情報は、その情報に関連する位置を示す位置情報を含み、前記抽出手段は、前記第1の記憶手段に記憶された前記第1の関連キーワードの少なくとも何れかを含み、且つ、前記位置情報によって示される位置が前記所定のイベントが発生する地域に含まれる前記情報を抽出するようにしてもよい。
イベントの発生する地域と情報に関連する位置とを考慮して、位置情報によって示される位置がイベントが発生する地域に含まれる情報を抽出することにより、抽出される情報を、位置の観点からよりイベントとの関連性の高いと見なされる情報に限定することができる。
前記所定のイベントが発生したことを示すイベント発生情報を受信する通知受信手段を備え、前記抽出手段は、前記通知受信手段により前記イベント発生情報が受信された場合に、前記抽出及び記憶処理を開始するようにしてもよい。
所定のイベントの発生を確認した場合にのみ、抽出及び記憶処理が開始されることにより、イベントが発生したことが確実である場合にのみ、抽出及び記憶処理が行われ、利用者にイベントと関連性の高い投稿情報を提供することができる。
前記所定のイベントとの関連性が高いと見なされる第2の関連キーワードを記憶する第3の記憶手段を備え、前記抽出手段は、抽出対象の情報のうち、前記第3の記憶手段に記憶された前記第2の関連キーワードを含む情報を抽出し、その抽出した情報の件数が第3の所定数以上である場合に、前記抽出及び記憶処理を開始するようにしてもよい。
予め記憶している、所定のイベントとの関連性が高いと見なされる第2の関連キーワードの少なくとも何れかを含む情報の抽出件数が所定数以上である場合には、所定のイベントの発生が推定される。従って、イベントの発生が確実ではないものの、発生が推定される場合に抽出及び記憶処理が開始されることにより、利用者に対してイベントと関連性の高い情報を迅速に提供することが可能となる。
上記目的を達成するために、本発明の第2の観点に係る情報提供方法は、所定のイベントに関連する情報を提供する情報提供装置における情報提供方法であって、所定のタイミング毎に、抽出対象の情報のうち、記憶手段に記憶された前記所定のイベントとの関連性が高いと見なされる関連キーワードの少なくとも何れかを含む情報を抽出し、その抽出した情報に含まれ、前記所定のイベントとの関連性が高いと見なされる新たな関連キーワードを前記記憶手段に記憶させる抽出及び記憶処理を繰り返す抽出ステップと、前記抽出ステップにおける抽出結果が抽出を終了すべき所定の条件を満たした場合に、前記抽出ステップにおける抽出及び記憶処理を終了させる抽出終了制御ステップと、を含むことを特徴とする。
上記目的を達成するために、本発明の第3の観点に係る情報提供プログラムは、コンピュータを、所定のイベントとの関連性が高いと見なされる関連キーワードを記憶する記憶手段、所定のタイミング毎に、抽出対象の情報のうち、前記記憶手段に記憶された前記関連キーワードの少なくとも何れかを含む情報を抽出し、その抽出した情報に含まれ、前記所定のイベントとの関連性が高いと見なされる新たな関連キーワードを前記記憶手段に記憶させる抽出及び記憶処理を繰り返す抽出手段、前記抽出手段による抽出結果が抽出を終了すべき所定の条件を満たした場合に、前記抽出手段による前記抽出及び記憶処理を終了させる抽出終了制御手段、として機能させることを特徴とする。
本発明によれば、イベントに関連する情報を適正な範囲で提供することができる。
情報提供システムの構成を示す図である。 情報提供サーバの構成を示す図である。 イベント情報の一例を示す図である。 クローラ情報の一例を示す図である。 主関連キーワード情報の一例を示す図である。 副関連キーワード情報の一例を示す図である。 NGキーワード情報の一例を示す図である。 投稿情報の一例を示す図である。 抽出結果情報の一例を示す図である。 候補関連キーワード情報の一例を示す図である。 情報提供サーバの動作を示す第1のフローチャートである。 情報提供サーバの動作を示す第2のフローチャートである。 情報提供サーバの動作を示す第3のフローチャートである。 投稿情報画面の一例を示す図である。 情報提供サーバの動作を示す第4のフローチャートである。 情報提供サーバの動作を示す第5のフローチャートである。
以下、本発明の実施形態について、図面を参照しながら詳細に説明する。なお、本発明は下記の実施形態及び図面によって限定されるものではない。本発明の要旨を変更しない範囲で下記の実施形態及び図面に変更を加えることができるのはもちろんである。また、図中同一または相当部分には同一符号を付す。
(1)第1実施形態
(1−1)情報提供システムの構成
図1は、本発明の第1実施形態に係る情報提供システム1の構成を示す図である。情報提供システム1は、情報提供サーバ10、端末装置100−1、100−2、100−3(以下、端末装置100−1、100−2、100−3をまとめて適宜「端末装置100」と称する。)、無線基地局200−1、200−2(以下、無線基地局200−1、200−2をまとめて適宜「無線基地局200」と称する。)、通信ネットワーク250、イベント通知サーバ300、投稿サーバ400を備える。情報提供サーバ10は、情報提供装置に対応する。
端末装置100−1乃至100−3は、いわゆるスマートフォン等の携帯電話機、通信機能を有するパーソナルコンピュータ等である。通信ネットワーク250は、例えばインターネットである。情報提供サーバ10は、通信ネットワーク250及び無線基地局200を介して、端末装置100との間で通信を行うことができる。また、情報提供サーバ10は、通信ネットワーク250を介して、イベント通知サーバ300及び投稿サーバ400との間で通信を行うことができる。また、端末装置100は、無線基地局200及び通信ネットワーク250を介して、投稿サーバ400との間で通信を行うことができる。
情報提供システム1において、端末装置100は、当該端末装置100のユーザによる操作によって生成される情報である投稿情報を投稿サーバ400へ送信する。投稿サーバ400は、端末装置100からの投稿情報を受信、記憶する。また、投稿サーバ400は、端末装置100からのアクセスに応じて、記憶している投稿情報を端末装置100へ送信する。
イベント通知サーバ300は、イベントとしての地震等の災害発生時に当該災害の発生を示す情報(イベント発生情報)を情報提供サーバ10へ送信する。この際、イベント通知サーバ300は、送信先を情報提供サーバ10に指定して送信するユニキャスト通信を行ってもよく、複数の装置に対して同時に送信するマルチキャスト通信を行ってもよい。
情報提供サーバ10は、イベント通知サーバ300からの災害発生を示すイベント発生情報を受信すると、端末装置100−1乃至100−3から投稿サーバ400へ送信され、投稿サーバ400に記憶される投稿情報から、その災害に関連する投稿情報を抽出し、端末装置100−1乃至100−3へ送信する。
(1−2)情報提供サーバの構成
図2は、第1実施形態における情報提供サーバ10の構成を示す図である。情報提供サーバ10は、制御部20、記憶部40、通信部60及び操作部70を備える。制御部20は、例えばCPU(Central Processing Unit)により構成される。制御部20は、記憶部40に記憶されたプログラムを読み出して実行し、記憶部40に記憶された各種データを処理することなどにより、情報提供サーバ10の全体を制御する。
記憶部40は、例えばRAM(Random Access Memory)である。記憶部40は、情報提供サーバ10の動作に必要なプログラムや各種データを記憶する。記憶部40には、イベント情報データベース(DB)42、クローラ情報DB44、抽出結果DB46、主関連キーワードDB48、副関連キーワードDB50、NGキーワードDB52及び候補関連キーワードDB54が構成される。主関連キーワードDB48及び副関連キーワードDB50は、第1の記憶手段に対応し、NGキーワードDB54は、第2の記憶手段に対応する。
通信部60は、例えばLAN(Local Area Network)カードである。通信部60は、端末装置100、イベント通知サーバ300及び投稿サーバ400との間の通信を制御する。通信部60と、端末装置100、イベント通知サーバ300及び投稿サーバ400との間の通信には、TCP/IP(Transmission Control Protocol/Internet Protocol)によるパケット通信等が採用される。また、通信部60と、端末装置100、イベント通知サーバ300及び投稿サーバ400との間の通信には、必要に応じてSSL(Secure Socket Layer)等の安全な通信路が用いられる。操作部70は、例えばキーボードであり、作業者の操作に応じた操作信号を制御部20へ出力する。
制御部20は、イベント登録部22、クローラ情報登録部24、副関連キーワード生成部26、投稿情報抽出部28、投稿情報提供部30、抽出終了制御部32及びキーワード編集部34の機能を実現する。副関連キーワード生成部26及び投稿情報抽出部28は、抽出手段に対応し、抽出終了制御部32は、抽出終了制御手段に対応する。
通信部60は、イベント通知サーバ300からのイベント発生情報を受信し、制御部20へ出力する。イベント発生情報は、例えば、イベントである災害の発生日時を示すイベント日時、災害の発生領域の外縁の経度及び緯度の集合、災害の発生領域の識別情報(例えばJISコード)等であるであるイベント位置情報、「地震」、「津波」、「震度」等の災害の種類や災害の発生地域の名称等の災害の内容を示す文字列であるイベント情報文字列を含む。なお、イベント位置情報は、災害が発生した領域のみの情報ではなく、災害が発生した領域の周辺の領域や災害が発生した領域に関連する領域の情報を含んでいてもよい。
制御部20内のイベント登録部22は、イベント発生情報が入力されると、イベントの識別情報であるクローラIDを設定する。例えば、イベント登録部22は、情報提供サーバ10が内蔵する時計(図示せず)から現在の日時を取得し、その取得した日時を含んだクローラIDを生成する。次に、イベント登録部22は、入力されたイベント発生情報に、設定したクローラIDを付加してイベント情報を生成する。イベント登録部22は、生成したイベント情報を記憶部40内のイベント情報DB42に登録する。図3は、イベント情報の一例を示す図である。図3に示すイベント情報は、クローラIDとイベント発生情報内のイベント日時、イベント位置情報及びイベント情報文字列とを対応付けて構成される。
制御部20内のクローラ情報登録部24は、イベント情報を用いて、イベントである災害と1対1に対応する、換言すれば、イベント情報と1対1に対応する情報であるクローラ情報を生成する。クローラ情報登録部24は、生成したクローラ情報を記憶部40内のクローラ情報DB44に登録する。
図4は、クローラ情報の一例を示す図である。図4に示すクローラ情報は、クローラID、生成日時、イベントタイプ、イベント位置情報、イベント情報文字列、実行フラグ、実行フラグ更新日時、終了フラグ、終了フラグ更新日時、不一致フラグ及び不一致フラグ更新日時を含んで構成される。
クローラIDは、イベント情報内のクローラIDが設定される。生成日時は、クローラ情報が生成された日時である。例えば、クローラ情報登録部24は、情報提供サーバ10に内蔵された時計から現在の日時を取得し、生成日時に設定する。イベントタイプは、イベントである災害の種別を示す情報であり、地震、津波、台風等の災害の種別毎に異なる情報である。例えば、クローラ情報登録部24は、イベント情報内のイベント情報文字列等に基づいて、災害の種別を判別し、その種別に対応する情報をイベントタイプとして設定する。イベント位置情報及びイベント情報文字列は、イベント情報内のイベント位置情報及びイベント情報文字列である。
実行フラグは、後述する投稿情報抽出部28による投稿情報の抽出の際にクローラ情報が用いられたか否かを示す情報であり、初期状態では用いられていないことを示す「0」、用いられた後は「1」となる。実行フラグ更新日時は、実行フラグが更新された時の日時である。終了フラグは、投稿情報抽出部28によるクローラ情報を用いた投稿情報の抽出が終了したか否かを示す情報であり、初期状態では、終了していないことを示す「0」、終了した後は「1」となる。終了フラグ更新日時は、終了フラグが更新された時の日時である。不一致フラグは、投稿情報抽出部28によるクローラ情報を用いた投稿情報の抽出の際に抽出件数が0件か否か、あるいは、最新に抽出された投稿情報が過去の所定期間以前に発生したか否かを示す情報であり、抽出件数が0件、あるいは、最新に抽出された投稿情報が過去の所定期間以前に発生した場合には「1」、それ以外の場合には「0」となる。不一致フラグ更新日時は、不一致フラグが更新された時の日時である。
記憶部40内の主関連キーワードDB48には、予め主関連キーワード情報が登録されている。図5は、主関連キーワード情報の一例を示す図である。図5に示す主関連キーワード情報は、イベントタイプ、位置情報及び主関連キーワードを含んで構成される。イベントタイプは、投稿情報の抽出の際に主関連キーワードを用いるべきイベントである災害の種別を示す情報である。位置情報は、投稿情報の抽出の際に主関連キーワードを用いるべきイベントである災害の発生領域を示す情報であり、災害の発生領域の外縁の経度及び緯度の集合、災害の発生領域の識別情報(例えばJISコード)等である。主関連キーワードはイベントタイプに対応するイベントとの関連が高いと見なされる文字列であり、第1の関連キーワードに対応する。投稿情報の抽出においては、主関連キーワードを含む投稿情報が抽出される。
制御部20内の副関連キーワード生成部26は、投稿情報の抽出に先立って、イベント情報に基づいて副関連キーワード情報を生成し、記憶部40内の副関連キーワードDB50に登録する。
図6は、副関連キーワード情報の一例を示す図である。図6に示す副関連キーワード情報は、クローラID及び副関連キーワードを含んで構成される。クローラIDは、イベント情報内のクローラIDが設定される。副関連キーワードはクローラIDに対応するイベントとの関連が高いと見なされる文字列であり、第1の関連キーワードに対応する。投稿情報の抽出においては、副関連キーワードを含む投稿情報が抽出される。初期状態では、抽出件数は0である。
記憶部40内のNGキーワードDB52には、予めNGキーワード情報が登録されている。図7は、NGキーワード情報の一例を示す図である。図7に示すNGキーワード情報は、イベントタイプ及びNGキーワードを含んで構成される。イベントタイプは、投稿情報の抽出の際にNGキーワードを用いるべきイベントである災害の種別を示す情報である。NGキーワードはイベントタイプに対応するイベントとの関連が低いと見なされる文字列であり、非関連キーワードに対応する。投稿情報の抽出においては、NGキーワードを含む投稿情報は、主関連キーワードや副関連キーワードが含まれていても抽出の対象外となる。
制御部20内の投稿情報抽出部28は、上述したイベント情報、クローラ情報及び副関連キーワード情報が生成、登録された後、クローラ情報毎に投稿情報の抽出を行う。具体的には、投稿情報抽出部28は、端末装置100によって送信され、投稿サーバ400に記憶された投稿情報のうち、主関連キーワード及び副関連キーワードの少なくとも何れかを含み、且つ、NGキーワードを含まない投稿情報を抽出する。
図8は、投稿情報の一例を示す図である。図8に示す投稿情報は、投稿日時、投稿位置情報及び投稿情報文字列を含んで構成される。投稿日時は、端末装置100が投稿情報を送信した日時あるいは投稿サーバ400が投稿情報を受信した日時等である。投稿位置情報は、投稿情報を送信した端末装置100の位置を示す情報であり、経度及び緯度からなる。投稿情報文字列は、端末装置100のユーザの操作によって端末装置100に入力された文字列である。なお、投稿情報には、投稿者のアカウント名、投稿された画像のデータ等の投稿情報文字列以外のコンテンツデータが含まれる場合もある。
また、投稿情報抽出部28は、主関連キーワード及び副関連キーワード毎に、当該主関連キーワード及び副関連キーワードを含む投稿情報の件数をカウントし、そのカウント値を、主関連キーワード及び副関連キーワードに対応づけて記憶部40に記憶させる。更に、投稿情報抽出部28は、イベント情報と、当該イベント情報内のクローラIDを含むクローラ情報に対応して抽出した投稿情報とを含む抽出結果情報を生成し、記憶部40内の抽出結果DB46に登録する。図9は、抽出結果情報の一例を示す図である。制御部20内の投稿情報提供部30は、抽出結果DB46内の抽出結果情報を、通信部60、通信ネットワーク250及び無線基地局200を介して端末装置100へ送信する。
また、制御部20内の副関連キーワード生成部26は、抽出された投稿情報の解析(例えば形態素解析)を行い、所定数以上の投稿情報に含まれる語を、新たな副関連キーワードとして特定する。更に、副関連キーワード生成部26は、特定した新たな副関連キーワードと、対応するクローラ情報内のクローラIDとを含んだ新たな副関連キーワード情報を生成し、記憶部40内の副関連キーワードDB60に登録する。
その後は、上述した投稿情報抽出部28による投稿情報の抽出、投稿情報提供部30による投稿情報の送信、副関連キーワード生成部26による新たな副関連キーワード情報の生成及び登録(以下、適宜「投稿情報抽出・キーワード記憶処理」と称する。)が繰り返される。
制御部20内の抽出終了制御部32は、投稿情報抽出・キーワード記憶処理が繰り返されている間に、投稿情報の抽出結果が、投稿情報の抽出を終了すべき所定の条件を満たした場合に、投稿情報抽出部28による投稿情報の抽出を終了させる制御を行う。投稿情報抽出・キーワード記憶処理と投稿情報抽出の終了制御の詳細については後述する。
制御部20内のキーワード編集部34は、抽出された投稿情報の解析(例えば形態素解析)を行い、所定数以上の投稿情報に含まれる語を、候補関連キーワードとして特定する。更に、キーワード編集部34は、特定した候補関連キーワードを含む候補関連キーワード情報を生成し、記憶部40内の候補関連キーワードDB54に登録する。
図10は、候補関連キーワード情報の一例を示す図である。図10に示す候補関連キーワード情報は、イベントタイプ、位置情報及び候補関連キーワードを含んで構成される。イベントタイプ及び位置情報は、クローラ情報内のイベントタイプ及びイベント位置情報が設定される。候補関連キーワードは文字列である。
作業者は、候補関連キーワードDB54に登録された候補関連キーワード情報内の候補関連キーワードを選択して新たな主関連キーワードに格上げすべく、操作部70を操作することができる。この場合、キーワード編集部34は、作業者による操作部70の操作に応じて、候補関連キーワードDB54に登録された候補関連キーワード情報のうち、選択された候補関連キーワードを含む候補関連キーワード情報を主関連キーワード情報として、主関連キーワードDB48に登録する。
また、キーワード編集部34は、作業者による操作部70の操作に応じて、NGキーワードDB52に登録されたNGキーワードへの新たなNGキーワードの追加、NGキーワードDB52に登録されたNGキーワードの削除、NGキーワードDB52に登録されたNGキーワードの修正等、NGキーワードの編集を行う。
(1−3)情報提供サーバの動作
次に、フローチャートを参照しつつ、第1実施形態における情報提供サーバ10の動作を説明する。図11乃至図13は、第1実施形態における情報提供サーバ10による投稿情報抽出・キーワード記憶処理時の動作を示すフローチャートである。図11乃至図13に示す動作は、例えば10分周期等の所定の間隔で繰り返して実行される。
図11に示すように、制御部20内の投稿情報抽出部28は、処理の開始日時(現在の日時)を取得する(ステップS201)。例えば、投稿情報抽出部28は、情報提供サーバ10に内蔵された時計から開始日時を取得することができる。
次に、投稿情報抽出部28は、クローラ情報DB44に登録されているクローラ情報のうち、実行フラグが「0」又は終了フラグが「0」のクローラ情報、換言すれば、そのクローラ情報を用いた投稿情報の抽出が開始されていないクローラ情報、又は、そのクローラ情報を用いた投稿情報の抽出が終了していないクローラ情報を取得する。更に、投稿情報抽出部28は、取得したクローラ情報からなるリストを生成する(ステップS202)。リストには、例えば、取得されたクローラ情報のクローラIDが含まれる。リストは記憶部40に記憶される。
次に、投稿情報抽出部28は、ステップS202におけるクローラ情報の取得件数が0であるか否かを判定する(ステップS203)。クローラ情報の取得件数が0である場合(ステップS203:YES)には、一連の動作が終了する。一方、クローラ情報の取得件数が0でない場合(ステップS203:NO)、投稿情報抽出部28は、リストから未選択の1件のクローラ情報を選択する(ステップS204)。
次に、投稿情報抽出部28は、ステップS204において選択したクローラ情報内の不一致フラグが「1」であり、且つ、不一致フラグ更新日時が所定時間以上前(例えば、6時間以上前)であるか否かを判定する(ステップS205)。クローラ情報内の不一致フラグが「1」であり、且つ、不一致フラグ更新日時が所定時間以上前である場合(ステップS205:YES)、投稿情報抽出部28は、ステップS204において選択したクローラ情報内の終了フラグを「1」に設定し、終了フラグ更新日時を現在の日時に設定する(ステップS206)。次に、投稿情報抽出部28は、ステップS204において選択したクローラ情報をリストから削除する(ステップS207)。
ステップS207におけるクローラ情報の削除後、又は、ステップS205において、クローラ情報内の不一致フラグが「1」でない、及び、不一致フラグ更新日時が所定時間以上前でないことの何れかであると判定された場合(ステップS205:NO)、投稿情報抽出部28は、リストに未選択のクローラ情報があるか否かを判定する(ステップS208)。リストに未選択のクローラ情報がある場合(ステップS208:YES)には、ステップS204における未選択の1件のクローラ情報の選択以降の動作が繰り返される。
一方、リストにステップS204において未選択のクローラ情報がない場合(ステップS208:NO)、図12の動作が行われる。投稿情報抽出部28は、リストから所定の優先度でクローラ情報を選択する(ステップS251)。例えば、投稿情報抽出部28は、リストに含まれる各クローラ情報内の生成日時を比較し、生成日時が新しい順に1件ずつクローラ情報を選択する。また、投稿情報抽出部28は、リストに含まれる各クローラ情報内の実行フラグ更新日時を比較し、その実行フラグ更新日時の新しい順に1件ずつクローラ情報を選択してもよい。また、投稿情報抽出部28は、リストに含まれる各クローラ情報のうち、イベントタイプが所定の種別、例えば「津波」、「避難勧告」であるものを優先して選択するようにしてもよい。
以下、ステップS252乃至図13のステップS307の動作は、ステップS251において選択されたクローラ情報毎に行われる。投稿情報抽出部28は、ステップS251で選択したクローラ情報内の実行フラグを「1」に設定し、実行フラグ更新日時を現在の日時に設定する(ステップS252)。
次に、投稿情報抽出部28は、主関連キーワードDB48に登録された主関連キーワード情報のうち、ステップS251で選択したクローラ情報内のイベントタイプを含み、位置情報が示す領域がステップS251で選択したクローラ情報内のイベント位置情報が示す領域に含まれる主関連キーワード情報を特定する。例えば、主関連キーワード情報内の位置情報及びクローラ情報内のイベント位置情報が災害の発生領域の外縁の経度及び緯度の集合である場合、投稿情報抽出部28は、主関連キーワードDB48に登録された主関連キーワード情報のうち、ステップS251で選択したクローラ情報内のイベントタイプを含み、位置情報である外縁の経度及び緯度の集合からなる領域がクローラ情報内のイベント位置情報である外縁の経度及び緯度の集合からなる領域に含まれる、あるいは、一致する主関連キーワード情報を特定する。また、主関連キーワード情報内の位置情報及びクローラ情報内のイベント位置情報が災害の発生領域の識別情報(JISコード等)である場合、投稿情報抽出部28は、主関連キーワードDB48に登録された主関連キーワード情報のうち、ステップS251で選択したクローラ情報内のイベントタイプを含み、位置情報である識別情報がクローラ情報内のイベント位置情報である識別情報と一致する主関連キーワード情報を特定する。更に、投稿情報抽出部28は、その特定した主関連キーワード情報内の主関連キーワードを取得する(ステップS253)。取得される主関連キーワードは1つであっても複数であってもよい。
次に、投稿情報抽出部28は、副関連キーワードDB50に登録された副関連キーワード情報のうち、ステップS251で選択したクローラ情報内のクローラIDを含む副関連キーワード情報を特定し、その特定した副関連キーワード情報内の副関連キーワードを取得する(ステップS254)。取得される副関連キーワードは1つであっても複数であってもよい。
次に、投稿情報抽出部28は、NGキーワードDB52に登録されたNGキーワード情報のうち、ステップS251で選択したクローラ情報内のイベントタイプを含むNGキーワード情報を特定し、その特定したNGキーワード情報内のNGキーワードを取得する(ステップS255)。取得されるNGキーワードは1つであっても複数であってもよい。
次に、投稿情報抽出部28は、通信部60及び通信ネットワーク250を介して、投稿サーバ400にアクセスする。投稿情報抽出部28は、投稿サーバ400に記憶されている投稿情報のうち、過去の第1の所定期間内(例えば、現在の日時から24時間以内)に発生し、投稿位置情報が示す位置がステップS251で選択したクローラ情報内のイベント位置情報が示す領域に含まれ、ステップS253において取得した主関連キーワード及びステップS254において取得した副関連キーワードの少なくとも何れかを含み、且つ、ステップS255において取得したNGキーワードを含まない投稿情報を抽出する(ステップS256)。
上述した投稿情報の抽出において、例えば、クローラ情報内のイベント位置情報が災害の発生領域の外縁の経度及び緯度の集合である場合、投稿情報抽出部28は、投稿位置情報が示す位置がクローラ情報内のイベント位置情報である外縁の経度及び緯度の集合からなる領域に含まれる投稿情報を抽出対象とする。また、クローラ情報内のイベント位置情報が災害の発生領域の識別情報(JISコード等)である場合、投稿情報抽出部28は、識別情報と当該識別情報に対応する領域の外縁の経度及び緯度の集合とを対応付けたテーブル(図示せず)等を参照し、投稿位置情報が示す位置が識別情報に対応付けられた外縁の経度及び緯度の集合からなる領域に含まれる投稿情報を抽出対象とする。ここで、投稿情報抽出部28は、投稿サーバ400に記憶されている全ての投稿情報を取得し、取得した投稿情報の中から、上述した抽出条件に合致する投稿情報を抽出してもよい。あるいは、投稿情報抽出部28が、抽出条件の情報として、過去の第1の所定期間の情報、イベント位置情報が示す領域の情報、主関連キーワード、副関連キーワード及びNGキーワードを投稿サーバ400へ送信してもよい。この場合には、投稿サーバ400は、記憶している投稿情報の中から、抽出条件に合致する投稿情報を抽出して情報提供サーバ10へ送信し、投稿情報抽出部28は、送信された投稿情報を受信する。
次に、投稿情報抽出部28は、ステップS256において抽出した投稿情報内の投稿情報文字列の解析(例えば形態素解析)を行い、ステップS253において取得した主関連キーワード及びステップS254において取得した副関連キーワード毎に、その主関連キーワード及び副関連キーワードを投稿情報文字列に含む投稿情報の件数(抽出件数)をカウントする。更に、投稿情報抽出部28は、主関連キーワードを投稿情報文字列に含む投稿情報の件数を、その主関連キーワードを含む主関連キーワード情報、及び、ステップS251で選択したクローラ情報内のクローラIDと対応づけて記憶部40に記憶させる。また、投稿情報抽出部28は、副関連キーワードを投稿情報文字列に含む投稿情報の件数を、その副関連キーワードを含む副関連キーワード情報、及び、ステップS251で選択したクローラ情報内のクローラIDと対応づけて記憶部40に記憶させる(ステップS257)。
次に、投稿情報抽出部28は、ステップS256における投稿情報の抽出件数が0、又は、ステップS256において抽出した投稿情報ののうち、最新の投稿情報が過去の第2の所定期間以前(例えば、6時間以前)に発生したものであるか否かを判定する(ステップS258)。
ステップS256における投稿情報の抽出件数が0、又は、ステップS256において抽出した投稿情報ののうち、最新の投稿情報が過去の第2の所定期間以前に発生したものであることの少なくとも何れかを満たす場合(ステップS258:YES)、投稿情報抽出部28は、ステップS251で選択したクローラ情報内の不一致フラグを「1」に設定し、不一致フラグ更新日時を現在の日時に設定する(ステップS259)。その後、一連の動作が終了する。
一方、ステップS256における投稿情報の抽出件数が0ではなく、且つ、ステップS256において抽出した投稿情報ののうち、最新の投稿情報が過去の第2の所定期間以前に発生したものでない場合(ステップS258:NO)、投稿情報抽出部28は、イベント情報DB42に登録されたイベント情報のうち、ステップS251において選択したクローラ情報内のクローラIDを含むイベント情報を抽出する。更に、投稿情報抽出部28は、抽出したイベント情報に、ステップS256において抽出した投稿情報を対応付けて抽出結果情報を生成する(ステップS260)。
ステップS260の後、図13の動作が行われる。投稿情報提供部30は、抽出結果情報を、通信部60、通信ネットワーク250及び無線基地局200を介して、端末装置100へ送信する(ステップS301)。例えば、端末装置100のユーザは、取得したい投稿情報を地域の観点から限定することが可能である。この場合、記憶部40には、ユーザ情報として、ユーザID等とともに、端末装置100のユーザが希望する地域の情報が含まれる。投稿情報提供部30は、この地域の情報に基づいて、抽出結果情報を送信する際に、当該抽出結果情報に含まれるイベント位置情報や投稿位置情報が示す領域が端末装置100のユーザが希望する地域であるか否かを判定する。更に、投稿情報提供部30は、抽出結果情報に含まれるイベント位置情報や投稿位置情報が示す領域が端末装置100のユーザが希望する地域である場合に、当該端末装置100に向けて抽出結果情報を送信する。
端末装置100内の制御部(図示せず)は、抽出結果情報を受信すると、当該抽出結果情報に基づいて、抽出結果画面を生成し、ディスプレイ(図示せず)に表示する。図14は、抽出結果画面の一例を示す図である。図14は、抽出結果情報に含まれる3件の投稿情報に対応する画像500、510及び520が含まれる。例えば、1件の投稿情報に対応する画像500は、投稿情報に基づいて形成されるアカウント名の画像501、投稿情報文字列の画像502、投稿位置情報の画像503、コンテンツデータに対応する画像504、投稿日時の画像505が含まれる。
再び、図13に戻って説明する。制御部20内の抽出終了制御部32は、図12のステップS257において主関連キーワード及び副関連キーワード毎に得られた、その主関連キーワード及び副関連キーワードを含む投稿情報の件数の合計数を算出する(ステップS302)。次に、抽出終了制御部32は、ステップS302において算出した合計数が第1の所定数未満であるか否かを判定する(ステップS303)。
ステップS302において算出した合計数が第1の所定数未満でない場合(ステップS303:NO)、制御部20内の副関連キーワード生成部26は、図12のステップS256において抽出された投稿情報の解析(例えば形態素解析)を行い、所定数以上の投稿情報に含まれる語を、新たな副関連キーワードとして特定する。更に、副関連キーワード生成部26は、特定した新たな副関連キーワードを含んだ新たな副関連キーワード情報を生成し、記憶部40内の副関連キーワードDB60に登録する(ステップS304)。その後、一連の動作が終了する。
一方、ステップS302において算出した合計数が第1の所定数未満である場合(ステップS303:YES)、抽出終了制御部32は、図12のステップS251において選択されたクローラ情報内のクローラIDを含む副関連キーワード情報を削除する(ステップS305)。次に、制御部20内の抽出終了制御部32は、ステップS251において選択されたクローラ情報内の終了フラグを「1」に設定し、終了フラグ更新日時を現在の日時に設定する(ステップS306)。その後、一連の動作が終了する。クローラ情報内の終了フラグを「1」に設定された場合には、既に実行フラグも「1」であるため、その後の投稿情報抽出・キーワード記憶処理の動作における、図11のステップS202において、クローラ情報は、リストに設定されない。従って、クローラ情報に対応する投稿情報抽出及びキーワード記憶処理は実行されない。
(1−4)作用・効果
上述したように、第1実施形態において、情報提供システム1内の情報提供サーバ10は、クローラ情報毎に、イベントとの関連性が高いと見なされる主関連キーワード及び副関連キーワードの少なくとも何れかを含み、イベントとの関連性が低いと見なされるNGキーワードを含まない投稿情報を抽出し、更にその抽出した投稿情報に含まれる新たな副関連キーワードを抽出するという処理を繰り返す。
このように、副関連キーワードは随時追加されるため、主関連キーワード及び副関連キーワードの少なくとも何れかを含み、NGキーワードを含まない投稿情報は、徐々に増加することが想定される。一方、このような想定にもかかわらず、主関連キーワード及び副関連キーワード毎の抽出件数の合計数が第1の所定数未満である場合には、イベントが終息する等、イベントの状況が変化すること等によって、主関連キーワード及び副関連キーワードとイベントとの関連性が低くなっているとみなすことができる。この場合には、情報提供サーバ10は、投稿情報抽出及びキーワード記憶処理を終了することにより、イベントに関連する情報を適正な範囲で提供することができる。また、副関連キーワードは随時追加されて投稿情報の抽出に用いられるため、例えば、地震がきっかけとなって発生した電車の遅延情報、ゲリラ豪雨がきっかけとなって発生した川の氾濫等の二次災害に関する投稿情報の取得が可能となる。
また、情報提供サーバ10は、NGキーワードを含む投稿情報については、主関連キーワード及び副関連キーワードを含んでいても抽出対象から除外する。このため、抽出される投稿情報を、よりイベントとの関連性の高いと見なされる投稿情報に限定することができる。
また、情報提供サーバ10は、クローラ情報内のイベント位置情報と投稿情報内の投稿位置情報とに基づいて、投稿位置情報が示す位置が、イベント位置情報が示す領域に含まれる投稿情報を抽出する。このため、抽出される投稿情報を、位置の観点からよりイベントとの関連性の高いと見なされる投稿情報に限定することができる。
また、情報提供サーバ10は、イベント通知サーバ300からのイベント発生情報を受信した場合に、投稿情報の抽出及びキーワード記憶処理を開始する。これにより、イベントが発生したことが確実である場合にのみ、投稿情報の抽出及びキーワード記憶処理が行われ、端末装置100のユーザにイベントとの関連性の高い投稿情報を提供することができる。
(2)第2実施形態
第1実施形態では、制御部20内の抽出終了制御部32は、主関連キーワード及び副関連キーワードを含む投稿情報の抽出件数の合計数が第1の所定数未満である場合に、クローラ情報内の終了フラグを「1」に設定することで、その後に、当該クローラ情報に対応する投稿情報抽出及びキーワード記憶処理が実行されないようにした。
これに対して、第2実施形態では、抽出終了制御部32は、クローラ情報に対応する副関連キーワード毎に、その副関連キーワードを含む投稿情報の抽出件数を取得し、その抽出件数が第2の所定数未満である場合に、副関連キーワードを含んだ副関連キーワード情報を削除して、その後に当該副関連キーワードを含む投稿情報の抽出が実行されないようにする。
フローチャートを参照しつつ、第2実施形態における情報提供サーバ10の動作を説明する。第2実施形態では、第1実施形態と同様、図11に示す動作が行われ、その後、図15及び図16に示す動作が行われる。図15のステップS351乃至ステップS356の動作は、図12のステップS251乃至ステップS256の動作と同様であるので、その説明は省略する。
制御部20内の投稿情報抽出部28は、ステップS356において抽出した投稿情報内の投稿情報文字列を解析し、ステップS354において取得した副関連キーワード毎に、その副関連キーワードを含む投稿情報の件数をカウントする。更に、投稿情報抽出部28は、副関連キーワードを投稿情報文字列に含む投稿情報の件数(抽出件数)を、その副関連キーワードを含む副関連キーワード情報、及び、ステップS351で選択したクローラ情報内のクローラIDと対応づけて記憶部40に記憶させる(ステップS357)。
ステップS358乃至図16のステップS401の動作は、図12のステップS258乃至図13のステップS301の動作と同様であるので、その説明は省略する。
制御部20内の抽出終了制御部32は、図16のステップS354において取得された副関連キーワード情報の中から、未選択の1件の副関連キーワード情報を選択する(ステップS402)。次に、抽出終了制御部32は、ステップS402において選択した副関連キーワード情報にステップS403において対応づけられた抽出件数が第2の所定数未満であるか否かを判定する(ステップS403)。
ステップS402において選択した副関連キーワード情報にステップS403において対応づけられた抽出件数が第2の所定数未満である場合(ステップS403:YES)、抽出終了制御部32は、ステップS402において選択した副関連キーワード情報を副関連キーワードDB50から削除する(ステップS404)。副関連キーワード情報が削除されることにより、その後に、削除された副関連キーワード情報に含まれていたクローラIDを有するクローラ情報に対応する投稿情報抽出及びキーワード記憶処理において、削除された副関連キーワード情報内の副関連キーワードは用いられない。
ステップS404において副関連キーワード情報が削除された後、又は、ステップS402において選択した副関連キーワード情報に対応する抽出件数が第2の所定数未満でないと判定された(ステップS403:NO)後、抽出終了制御部32は、ステップS402において未選択の副関連キーワード情報があるか否かを判定する(ステップS405)。ステップS402において未選択の副関連キーワード情報がある場合(ステップS405:YES)には、ステップS402における未選択の1件の副関連キーワード情報の選択以降の動作が繰り返される。
一方、ステップS402において未選択の副関連キーワード情報がない場合(ステップS405:NO)には、制御部20内の副関連キーワード生成部26は、図15のステップS356において抽出された投稿情報の解析(例えば形態素解析)を行い、第1の所定件数以上の投稿情報に含まれる語を、新たな副関連キーワードとして特定する。更に、副関連キーワード生成部26は、特定した新たな副関連キーワードを含んだ新たな副関連キーワード情報を生成し、記憶部40内の副関連キーワードDB60に登録する(ステップS406)。その後、一連の動作が終了する。
追加される副関連キーワードを用いて抽出される投稿情報の件数が第2の所定数未満になった場合には、イベントの状況が変化すること等によって、その副関連キーワードとイベントとの関連性が低くなっているとみなすことができる。この場合、第2実施形態では、情報提供システム1内の情報提供サーバ10は、その副関連キーワードを含んだ副関連キーワード情報を副関連キーワードDB50から削除して、その後に当該副関連キーワードを含む投稿情報の抽出が実行されないようにすることにより、イベントに関連する情報を適正な範囲で提供することができる。
(3)第3実施形態
第1実施形態では、制御部20内の抽出終了制御部32は、クローラ情報毎の主関連キーワード及び副関連キーワードを含む投稿情報の抽出件数の合計数が第1の所定数未満である場合に、そのクローラ情報内の終了フラグを「1」に設定することで、その後に、当該クローラ情報に対応する投稿情報抽出及びキーワード記憶処理が実行されないようにした。
これに対して、第3実施形態では、抽出終了制御部32は、クローラ情報毎の投稿情報の抽出の都度、主関連キーワード及び当該クローラ情報に対応する副関連キーワードを含む投稿情報の抽出件数の合計数を記憶部40に記憶しておく。更に、抽出終了制御部32は、合計数の推移が所定の減少傾向を示す場合に、クローラ情報内の終了フラグを「1」に設定する。ここで、所定の減少傾向とは、合計数が増減することなく漸減する場合、合計数が所定数以下となることが所定回数以上継続する場合等である。
第1実施形態と同様、副関連キーワードは随時追加されるため、主関連キーワード及び副関連キーワードの少なくとも何れかを含み、NGキーワードを含まない投稿情報は、徐々に増加することが想定される。このような想定にもかかわらず、主関連キーワード及び副関連キーワード毎の抽出件数の合計数が所定の減少傾向を示す場合には、イベントの状況が変化すること等によって、主関連キーワード及び副関連キーワードとイベントとの関連性が低くなっているとみなすことができる。この場合、第3実施形態では、情報提供サーバ10は、クローラ情報内の終了フラグを「1」に設定することで、その後に、当該クローラ情報に対応する投稿情報抽出及びキーワード記憶処理が実行されないようにし、イベントに関連する情報を適正な範囲で提供することができる。
(4)第4実施形態
第2実施形態では、制御部20内の抽出終了制御部32は、副関連キーワードを含む投稿情報の抽出件数が第2の所定数未満である場合に、その副関連キーワードを含んだ副関連キーワード情報を副関連キーワードDB50から削除して、その後に当該副関連キーワードを含む投稿情報の抽出が実行されないようにした。
これに対して、第4実施形態では、抽出終了制御部32は、クローラ情報毎の投稿情報の抽出の都度、当該クローラ情報に対応する副関連キーワード毎に、その副関連キーワードを含む投稿情報の抽出件数の合計数を記憶部40に記憶しておく。更に、抽出終了制御部32は、合計数の推移が所定の減少傾向を示す場合に副関連キーワードを副関連キーワードDB50から削除する。ここで、所定の減少傾向とは、第3実施形態と同様、合計数が増減することなく漸減する場合、合計数が所定数以下となることが所定回数以上継続する場合等である。
追加される副関連キーワードを用いて抽出される投稿情報の件数が所定の減少傾向を示す場合には、イベントの状況が変化すること等によって、その副関連キーワードとイベントとの関連性が低くなっているとみなすことができる。この場合、第4実施形態では、情報提供システム1内の情報提供サーバ10は、その副関連キーワードを含んだ副関連キーワード情報を副関連キーワードDB50から削除して、その後に当該副関連キーワードを含む投稿情報の抽出が実行されないようにすることにより、イベントに関連する情報を適正な範囲で提供することができる。
(5)第5実施形態
第1実施形態では、情報提供サーバ10は、イベント通知サーバ300からのイベント発生情報を受信した場合に、投稿情報の抽出及びキーワード記憶処理を開始した。これに対し、第5実施形態では、情報提供サーバ10は、イベント発生情報を受信していなくても、イベントである災害の発生が推定される場合に、投稿情報の抽出及びキーワード記憶処理を開始する。
具体的には、記憶部40には、予め、イベント発生推定用のキーワードが記憶される。イベント発生推定用のキーワードは、イベントとの関連が高いと見なされる文字列であり、第2の関連キーワードに対応する。イベント発生推定用のキーワードは、イベントの種別毎に用意されており、イベントタイプが付加されている。
制御部20内のイベント登録部22は、イベント発生推定用のキーワードを1つずつ選択する。次に、イベント登録部22は、端末装置100によって送信され、投稿サーバ400に記憶された投稿情報のうち、選択したイベント発生推定用のキーワードを投稿情報文字列に含む投稿情報を抽出する。次に、イベント登録部22は、抽出された投稿情報の件数をカウントし、その件数が第3の所定数以上である場合に、選択したイベント発生推定用のキーワードに付加されているイベントタイプが示す種別のイベントが発生したと推定する。
イベント発生が推定された後、イベント登録部22は、クローラIDを生成し、イベント情報を生成する。但し、第1実施形態と異なり、イベント登録部22は、抽出された投稿情報を解析し、その解析結果から得られる適切な情報を、イベント情報内のイベント日時、イベント位置情報及びイベント情報文字列に設定する。例えば、イベント登録部22は、イベント日時に現在の日時を設定する。また、イベント登録部22は、イベント位置情報に、抽出した投稿情報のうち、所定数以上の投稿情報に含まれる地名に対応する領域の情報を設定する。また、イベント登録部22は、イベント情報文字列にイベント発生推定用のキーワードの文字列、所定数以上の投稿情報内の投稿情報文字列に含まれる語の文字列等を設定する。
その後は、第1実施形態と同様、クローラ情報登録部24によるクローラ情報の生成、副関連キーワード生成部26による副関連キーワード情報の生成、登録が行われ、更に、図11乃至図13に示す、副関連キーワード生成部26、投稿情報抽出部28、投稿情報提供部30及び抽出終了制御部32による投稿情報抽出・キーワード記憶処理が行われる。
このように、第5実施形態では、イベントとの関連性が高いと見なされるイベント発生推定用のキーワードを含む投稿情報の抽出件数が所定数以上である場合には、イベントの発生が推定され、投稿情報抽出・キーワード記憶処理が行われる。従って、イベント発生情報が受信されないためにイベントの発生が確実ではないものの、発生が推定される場合には、投稿情報抽出・キーワード記憶処理が行われることになり、利用者に対してイベントと関連性の高い情報を迅速に提供することが可能となる。
(6)その他の実施形態
以上、本発明の実施形態について説明したが、本発明は実施形態によって限定されるものではない。本発明は、実施形態及び以下の変形例を適宜組み合わせたものも含み、また、それらと均等なものも含む。
例えば、上述した実施形態では、投稿情報に、当該投稿情報を送信した端末装置100の位置を示す投稿位置情報が含まれるものとして説明したが、投稿位置情報が含まれていない場合には、図12のステップS256において、投稿情報抽出部28は、投稿サーバ400に記憶されている投稿情報内の投稿情報文字列について形態素解析等の解析を行って地域名等を特定し、その地域名等に対応する領域の識別情報(JISコード等)を投稿位置情報として投稿情報に設定するようにしてもよい。
また、例えば、上述した実施形態では、予め副関連キーワードが用意されており、1回目の投稿情報の抽出から副関連キーワードを用いたが、初期状態では、副関連キーワードがなく、1回目では副関連キーワードを用いない投稿情報の抽出が行われるようにしてもよい。更には、副関連キーワード生成部26が、その1回目の投稿情報の抽出で得られた投稿情報から副関連キーワードを生成して、2回目以降の投稿情報の抽出に用いられるようにしてもよい。
また、例えば、上述した実施形態では、抽出される投稿情報の件数や減少傾向に応じて、投稿情報抽出及びキーワード記憶処理を終了したり、所定の副関連キーワードを用いた投稿情報抽出及びキーワード記憶処理を終了した。しかし、抽出される投稿情報の件数や減少傾向以外にも、投稿情報の抽出結果が投稿情報抽出及びキーワード記憶処理を終了すべき所定の条件を満たした場合に、投稿情報抽出及びキーワード記憶処理を終了するようにしてもよい。
また、例えば、上述した実施形態では、所定のイベントが災害である場合について説明したが、災害以外のイベントに関する投稿情報を提供する場合にも、同様に本発明を適用することができる。
また、情報提供システム1の構成は、図1に示すものに限定されない。例えば、情報提供サーバ10と投稿サーバ400とが1つのサーバによって構成されていてもよい。また、例えば、情報提供サーバ10の機能を実現するためのプログラムは、CD−ROM等の記憶媒体に記憶されてもよいし、通信ネットワーク250を介してダウンロードされてもよい。
1 情報提供システム
10 情報提供サーバ
20 制御部
22 イベント登録部
24 クローラ情報登録部
26 副関連キーワード生成部
28 投稿情報抽出部
30 投稿情報提供部
32 抽出終了制御部
34 キーワード編集部
40 記憶部
60 通信部
70 操作部
100−1、100−2、100−3 端末装置
200−1、200−2 無線基地局
250 通信ネットワーク
300 イベントサーバ
400 投稿サーバ

Claims (11)

  1. 所定のイベントに関連する情報を提供する情報提供装置であって、
    前記所定のイベントとの関連性が高いと見なされる第1の関連キーワードを記憶する第1の記憶手段と、
    所定のタイミング毎に、抽出対象の情報のうち、前記第1の記憶手段に記憶された前記第1の関連キーワードの少なくとも何れかを含む情報を抽出し、その抽出した情報に含まれ、前記所定のイベントとの関連性が高いと見なされる新たな第1の関連キーワードを前記第1の記憶手段に記憶させる抽出及び記憶処理を繰り返す抽出手段と、
    前記抽出手段による抽出結果が抽出を終了すべき所定の条件を満たした場合に、前記抽出手段による前記抽出及び記憶処理を終了させる抽出終了制御手段と、
    を備えることを特徴とする情報提供装置。
  2. 前記抽出終了制御手段は、前記抽出手段により抽出される前記情報の件数が第1の所定数未満の場合に、前記抽出手段による前記抽出及び記憶処理を終了させることを特徴とする請求項1に記載の情報提供装置。
  3. 前記抽出終了制御手段は、前記抽出手段により抽出される前記新たな第1の関連キーワードを含む前記情報の件数が第2の所定数未満の場合に、前記抽出手段による前記新たな第1の関連キーワードを含む前記情報の抽出及び記憶処理を終了させることを特徴とする請求項1に記載の情報提供装置。
  4. 前記抽出終了制御手段は、前記所定のタイミング毎に前記抽出手段により抽出される前記情報の件数が所定の減少傾向を示す場合に、前記抽出手段による前記抽出及び記憶処理を終了させることを特徴とする請求項1に記載の情報提供装置。
  5. 前記抽出終了制御手段は、前記抽出手段により抽出される前記新たな第1の関連キーワードを含む前記情報の件数が所定の減少傾向を示す場合に、前記抽出手段による前記新たな第1の関連キーワードを含む前記情報の抽出及び記憶処理を終了させることを特徴とする請求項1に記載の情報提供装置。
  6. 前記所定のイベントとの関連性が低いと見なされる非関連キーワードを記憶する第2の記憶手段を備え、
    前記抽出手段は、前記第1の記憶手段に記憶された前記第1の関連キーワードの少なくとも何れかを含み、且つ、前記第2の記憶手段に記憶された前記非関連キーワードの何れも含まない前記情報を抽出することを特徴とする請求項1乃至5の何れかに記載の情報提供装置。
  7. 前記所定のイベントは、発生する地域が特定されるイベントであり、
    前記抽出対象の情報は、その情報に関連する位置を示す位置情報を含み、
    前記抽出手段は、前記第1の記憶手段に記憶された前記第1の関連キーワードの少なくとも何れかを含み、且つ、前記位置情報によって示される位置が前記所定のイベントが発生する地域に含まれる前記情報を抽出することを特徴とする請求項1乃至6の何れかに記載の情報提供装置。
  8. 前記所定のイベントが発生したことを示すイベント発生情報を受信する通知受信手段を備え、
    前記抽出手段は、前記通知受信手段により前記イベント発生情報が受信された場合に、前記抽出及び記憶処理を開始することを特徴とする請求項1乃至7の何れかに記載の情報提供装置。
  9. 前記所定のイベントとの関連性が高いと見なされる第2の関連キーワードを記憶する第3の記憶手段を備え、
    前記抽出手段は、抽出対象の情報のうち、前記第3の記憶手段に記憶された前記第2の関連キーワードを含む情報を抽出し、その抽出した情報の件数が第3の所定数以上である場合に、前記抽出及び記憶処理を開始することを特徴とする請求項1乃至8の何れかに記載の情報提供装置。
  10. 所定のイベントに関連する情報を提供する情報提供装置における情報提供方法であって、
    所定のタイミング毎に、抽出対象の情報のうち、記憶手段に記憶された前記所定のイベントとの関連性が高いと見なされる関連キーワードの少なくとも何れかを含む情報を抽出し、その抽出した情報に含まれ、前記所定のイベントとの関連性が高いと見なされる新たな関連キーワードを前記記憶手段に記憶させる抽出及び記憶処理を繰り返す抽出ステップと、
    前記抽出ステップにおける抽出結果が抽出を終了すべき所定の条件を満たした場合に、前記抽出ステップにおける抽出及び記憶処理を終了させる抽出終了制御ステップと、
    を含むことを特徴とする情報提供方法。
  11. コンピュータを、
    所定のイベントとの関連性が高いと見なされる関連キーワードを記憶する記憶手段、
    所定のタイミング毎に、抽出対象の情報のうち、前記記憶手段に記憶された前記関連キーワードの少なくとも何れかを含む情報を抽出し、その抽出した情報に含まれ、前記所定のイベントとの関連性が高いと見なされる新たな関連キーワードを前記記憶手段に記憶させる抽出及び記憶処理を繰り返す抽出手段、
    前記抽出手段による抽出結果が抽出を終了すべき所定の条件を満たした場合に、前記抽出手段による前記抽出及び記憶処理を終了させる抽出終了制御手段、
    として機能させることを特徴とする情報提供プログラム。
JP2012142391A 2012-06-25 2012-06-25 情報提供装置、情報提供方法及び情報提供プログラム Active JP5739843B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012142391A JP5739843B2 (ja) 2012-06-25 2012-06-25 情報提供装置、情報提供方法及び情報提供プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012142391A JP5739843B2 (ja) 2012-06-25 2012-06-25 情報提供装置、情報提供方法及び情報提供プログラム

Publications (2)

Publication Number Publication Date
JP2014006735A true JP2014006735A (ja) 2014-01-16
JP5739843B2 JP5739843B2 (ja) 2015-06-24

Family

ID=50104390

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012142391A Active JP5739843B2 (ja) 2012-06-25 2012-06-25 情報提供装置、情報提供方法及び情報提供プログラム

Country Status (1)

Country Link
JP (1) JP5739843B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10380117B2 (en) 2014-04-18 2019-08-13 Fujitsu Limited Event occurrence place estimation method, computer-readable recording medium storing event occurrence place estimation program, and event occurrence place estimation apparatus
JP2019144905A (ja) * 2018-02-21 2019-08-29 富士通株式会社 情報処理プログラム、メッセージ解析プログラム、情報処理装置及び情報処理方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002140366A (ja) * 2000-10-31 2002-05-17 Ricoh Co Ltd 関連語選出装置、その方法および記録媒体、並びに文書検索装置、その方法および記録媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002140366A (ja) * 2000-10-31 2002-05-17 Ricoh Co Ltd 関連語選出装置、その方法および記録媒体、並びに文書検索装置、その方法および記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10380117B2 (en) 2014-04-18 2019-08-13 Fujitsu Limited Event occurrence place estimation method, computer-readable recording medium storing event occurrence place estimation program, and event occurrence place estimation apparatus
JP2019144905A (ja) * 2018-02-21 2019-08-29 富士通株式会社 情報処理プログラム、メッセージ解析プログラム、情報処理装置及び情報処理方法

Also Published As

Publication number Publication date
JP5739843B2 (ja) 2015-06-24

Similar Documents

Publication Publication Date Title
JP5221369B2 (ja) 資源制約デバイスのための学習装置
US20140046933A1 (en) Method and system for displaying user activities based on geographic location information and computer storage medium
US9680719B2 (en) Communication system, client terminal, and server
JPWO2010067605A1 (ja) ペアリングシステム、ペアリング装置、ペアリング装置の処理方法及びプログラム
EP3779756A1 (en) Information processing device, information processing method, and program
JPWO2018186235A1 (ja) 場所人気度推定システム
WO2021062484A1 (en) System and method for identifying a disease affected area
JP5739843B2 (ja) 情報提供装置、情報提供方法及び情報提供プログラム
CN104348941A (zh) 一种利用手机通讯录查找期望用户的方法及装置
KR20170038806A (ko) 인스턴트 메시징 기법
JP5649619B2 (ja) 情報提供装置、情報提供方法及び情報提供プログラム
US9369848B2 (en) Information distribution apparatus, information distribution method and program
CN106202222B (zh) 热点事件的确定方法及装置
JP5788429B2 (ja) サーバシステム
US11855945B2 (en) Method, computer device, and non-transitory computer-readable recording medium to pick and display message in messaging-based social network service
JP6252315B2 (ja) 場所検知装置、場所検知プログラムおよび場所検知方法
JP5784475B2 (ja) 情報システムおよびプログラム
WO2015021908A1 (en) Method, apparatus and system for security verification
CN106034154B (zh) 公交信息共享方法和装置
JP2021119548A (ja) 位置特定システム、位置特定方法及びプログラム
CN106708418B (zh) 游戏环境内消息存储方法及装置
CN107113557A (zh) 一种信息处理方法及装置
JP2015156912A (ja) ゲームサーバ、ゲームサーバ用プログラム及びゲームシステム
JP6262123B2 (ja) 情報処理装置、プログラム、及び情報処理方法
JP2005309524A (ja) アプリケーションサーバ、プレゼンス情報提供方法、及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140602

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150331

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150424

R150 Certificate of patent or registration of utility model

Ref document number: 5739843

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250