JP5739843B2 - Information providing apparatus, information providing method, and information providing program - Google Patents

Information providing apparatus, information providing method, and information providing program Download PDF

Info

Publication number
JP5739843B2
JP5739843B2 JP2012142391A JP2012142391A JP5739843B2 JP 5739843 B2 JP5739843 B2 JP 5739843B2 JP 2012142391 A JP2012142391 A JP 2012142391A JP 2012142391 A JP2012142391 A JP 2012142391A JP 5739843 B2 JP5739843 B2 JP 5739843B2
Authority
JP
Japan
Prior art keywords
information
sub
extraction
related keyword
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012142391A
Other languages
Japanese (ja)
Other versions
JP2014006735A (en
Inventor
泰良 澤田
泰良 澤田
卓也 益子
卓也 益子
央斗 北村
央斗 北村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2012142391A priority Critical patent/JP5739843B2/en
Publication of JP2014006735A publication Critical patent/JP2014006735A/en
Application granted granted Critical
Publication of JP5739843B2 publication Critical patent/JP5739843B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報提供装置、情報提供方法及び情報提供プログラムに関する。   The present invention relates to an information providing apparatus, an information providing method, and an information providing program.

随時、更新や追加される情報からキーワード検索によりリアルタイムに情報を提供する情報提供装置がある。   There is an information providing apparatus that provides information in real time by keyword search from updated or added information as needed.

例えば、特許文献1に記載の技術では、リアルタイムの情報から時々刻々と変化する話題性を判断し、その話題性の変化を考慮した情報抽出を行う。また、例えば、所定のイベントが発生した場合に、そのイベントに関連するキーワードを含む情報を抽出してリアルタイムに提供する情報提供装置がある。このような情報提供装置には、第1のキーワードを含む情報を抽出し、その抽出した情報に共通の第2のキーワードを取得して、更なる情報抽出に用いるといった処理を繰り返し、イベントに関連する情報を提供するものがある。   For example, in the technique described in Patent Literature 1, topicality that changes from moment to moment is determined from real-time information, and information extraction that considers the change in topicality is performed. For example, there is an information providing apparatus that extracts information including a keyword related to an event and provides the information in real time when a predetermined event occurs. Such an information providing apparatus repeats the process of extracting information including the first keyword, acquiring the second keyword common to the extracted information, and using it for further information extraction, and related to the event. Some provide information to do.

特許第2729356号公報Japanese Patent No. 2729356

しかしながら、上述した、随時キーワードを追加して情報抽出に用いる情報提供装置では、追加されるキーワードは徐々にイベントとの関連性が低下することが想定される。このため、追加されるキーワードを用いた情報抽出では、徐々にイベントに関連する情報が得られなくなってしまうという問題があった。   However, in the information providing apparatus that is used for information extraction by adding keywords at any time as described above, it is assumed that the added keywords gradually decrease in relevance with events. For this reason, there is a problem that information related to an event cannot be obtained gradually in the information extraction using the added keyword.

本発明は、このような問題に鑑みてなされたものであり、イベントに関連する情報を適正な範囲で提供することを目的とする。   The present invention has been made in view of such problems, and an object thereof is to provide information related to an event within an appropriate range.

上記目的を達成するために、本発明の第1の観点に係る情報提供装置は、状況が変化する所定のイベントに関連して発生する情報を提供する情報提供装置であって、前記所定のイベントとの関連性が高いと見なされる主関連キーワード及び副関連キーワードを記憶する第1の記憶手段と、所定のタイミング毎に、所定期間内に発生する情報のうち、前記第1の記憶手段に記憶された前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含む情報を抽出し、その抽出した情報のうち、第1の所定数以上の情報に含まれるキーワードを副関連キーワードとして前記第1の記憶手段に記憶させる抽出及び記憶処理を繰り返す抽出手段と、前記所定期間内に発生する情報のうち、前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含む情報の抽出件数が第2の所定数未満となる条件を満たした場合に、前記副関連キーワードを前記抽出手段による情報の抽出の際の適用対象から除外する処理を行う抽出終了制御手段と、を備えることを特徴とする。 In order to achieve the above object, an information providing apparatus according to a first aspect of the present invention is an information providing apparatus that provides information that occurs in association with a predetermined event in which the situation changes. A first storage means for storing a main related keyword and a sub related keyword that are considered to be highly related to each other, and information stored in the first storage means among information generated within a predetermined period at every predetermined timing. Information including at least one of the main related keyword and the sub related keyword is extracted, and among the extracted information, keywords included in the information of a first predetermined number or more are used as the sub related keywords. extracting means for repeating the extraction and storage processing in the storage means, of the information generated within the predetermined period, small of the main relevant keywords and the sub related keywords Extraction Kutomo extracting the number of information including any one when the condition is met as a second less than the predetermined number, it performs process of excluding the sub related keywords from application of the extraction of information by the extracting means And an end control means.

このような構成によれば、情報提供装置は、主関連キーワード及び副関連キーワードの少なくとも何れかを含む情報を抽出し、その抽出した情報のうち、第1の所定数以上の情報に含まれるキーワードを副関連キーワードとして第1の記憶手段に記憶させる抽出及び記憶処理を繰り返す。但し、副関連キーワードは、イベントとの関連性が徐々に低下することが想定されることに鑑み、情報提供装置は、所定期間内に発生する情報のうち、主関連キーワード及び副関連キーワードの少なくとも何れかを含む情報の抽出件数が第2の所定数未満となる条件を満たした場合に、副関連キーワードを情報の抽出の際の適用対象から除外する処理を行う。このため、イベントとの関連性の低い副関連キーワードが用いられて、イベントと関連する情報が得られなくなってしまうことを防止し、イベントに関連する情報を適正な範囲で提供することができる。 According to such a configuration, the information providing apparatus extracts information including at least one of the main related keyword and the sub related keyword, and among the extracted information, the keyword included in the information of the first predetermined number or more. The extraction and storage process of storing the above as a sub-related keyword in the first storage means is repeated. However, in view of the fact that the relevance of the secondary related keyword is expected to gradually decrease, the information providing apparatus , at least the primary related keyword and the secondary related keyword among the information generated within the predetermined period. When the condition that the number of extracted information including any one is less than the second predetermined number is satisfied, a process of excluding the sub-related keyword from the application target at the time of extracting the information is performed. For this reason, it is possible to prevent the information related to the event from being obtained by using the sub-related keyword having a low relationship with the event, and to provide the information related to the event in an appropriate range.

副関連キーワードは随時追加されるため、主関連キーワード及び副関連キーワードの少なくとも何れかを含む情報の件数は、徐々に増加することが想定される。一方、このような想定にもかかわらず、所定期間内に発生する情報のうち、主関連キーワード及び副関連キーワードの少なくとも何れかを含む情報の件数が第2の所定数未満になった場合には、副関連キーワードとイベントとの関連性が低くなっているとみなすことができる。この場合には、副関連キーワードを前記抽出手段による情報の抽出の際の適用対象から除外することにより、イベントに関連する情報を適正な範囲で提供することができる。 Since sub-related keywords are added as needed, it is assumed that the number of information items including at least one of the main related keywords and the sub-related keywords will gradually increase. On the other hand, in spite of such assumptions, when the number of information including at least one of the main related keyword and the sub related keyword among the information generated within the predetermined period becomes less than the second predetermined number , It can be considered that the relevance between the secondary related keyword and the event is low. In this case, the information related to the event can be provided in an appropriate range by excluding the sub-related keyword from the application target when the information is extracted by the extraction unit .

前記抽出終了制御手段は、前記所定期間内に発生する情報のうち、前記副関連キーワードを含む情報の抽出件数が第3の所定数未満となる条件を満たした場合に、その条件を満たす前記副関連キーワードを前記抽出手段による情報の抽出の際の適用対象から除外する処理を行うようにしてもよい。 The extraction end control means, when the condition that the number of extracted information including the sub-related keyword is less than a third predetermined number among the information generated within the predetermined period is satisfied, satisfies the condition. You may make it perform the process which excludes a related keyword from the application object at the time of the extraction of the information by the said extraction means .

副関連キーワードを用いて抽出される情報の件数が第3の所定数未満になった場合には、その副関連キーワードとイベントとの関連性が低くなっているとみなすことができる。この場合には、その副関連キーワードを情報の抽出の際の適用対象から除外することにより、イベントに関連する情報を適正な範囲で提供することができる。 When the number of pieces of information extracted using the sub-related keyword is less than the third predetermined number , it can be considered that the relationship between the sub-related keyword and the event is low. In this case, the information related to the event can be provided in an appropriate range by excluding the sub-related keyword from the application target at the time of information extraction .

前記抽出終了制御手段は、前記所定のタイミング毎に抽出される前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含む情報の抽出件数が所定の減少傾向を示す場合に、前記副関連キーワードを情報の抽出の際の適用対象から除外するようにしてもよい。 The extraction end control unit, when extracting the number of information including at least one of the main relevant keywords and the sub related keywords are extracted for each of the predetermined timing represents a predetermined downward trend, the secondary related keywords You may make it exclude from the application object at the time of extraction of information.

副関連キーワードは随時追加されるため、主関連キーワード及び副関連キーワードの少なくとも何れかを含む情報の件数は、徐々に増加することが想定される。一方、このような想定にもかかわらず、主関連キーワード及び副関連キーワードの少なくとも何れかを含む情報の件数が所定の減少傾向を示す場合には、副関連キーワードとイベントとの関連性が低くなっているとみなすことができる。この場合には、副関連キーワードを情報の抽出の際の適用対象から除外することにより、イベントに関連する情報を適正な範囲で提供することができる。 Since sub-related keywords are added as needed, it is assumed that the number of information items including at least one of the main related keywords and the sub-related keywords will gradually increase. On the other hand, in spite of this assumption, when the number of information including at least one of the main related keyword and the sub related keyword shows a predetermined decreasing tendency, the relevance between the sub related keyword and the event becomes low. Can be considered. In this case, information related to the event can be provided in an appropriate range by excluding the sub-related keyword from the application target at the time of information extraction .

前記抽出終了制御手段は、前記所定のタイミング毎に抽出される前記副関連キーワードを含む情報の抽出件数が所定の減少傾向を示す場合に、前記副関連キーワードを情報の抽出の際の適用対象から除外するようにしてもよい。 The extraction end control means, when the number of extracted information including the sub-related keyword extracted at each predetermined timing shows a predetermined decreasing tendency, the sub-related keyword is applied from the application target at the time of information extraction You may make it exclude.

副関連キーワードを用いて抽出される情報の件数が所定の減少傾向を示す場合には、その副関連キーワードとイベントとの関連性が低くなっているとみなすことができる。この場合には、その副関連キーワードを情報の抽出の際の適用対象から除外することにより、イベントに関連する情報を適正な範囲で提供することができる。 When the number of pieces of information extracted using the secondary related keyword shows a predetermined decreasing tendency, it can be considered that the relationship between the secondary related keyword and the event is low. In this case, the information related to the event can be provided in an appropriate range by excluding the sub-related keyword from the application target at the time of information extraction .

前記所定のイベントとの関連性が低いと見なされる非関連キーワードを記憶する第2の記憶手段を備え、前記抽出手段は、前記第1の記憶手段に記憶された前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含み、且つ、前記第2の記憶手段に記憶された前記非関連キーワードの何れも含まない前記情報を抽出するようにしてもよい。 Second storage means for storing an unrelated keyword that is considered to be less relevant to the predetermined event is provided, and the extraction means includes the main related keyword and the sub-relation stored in the first storage means. The information including at least one of keywords and not including any of the unrelated keywords stored in the second storage unit may be extracted.

イベントとの関連性が低い非関連キーワードを含む情報は、仮に主関連キーワード及び前記副関連キーワードを含んでいても抽出対象から除外することにより、抽出される情報を、よりイベントとの関連性の高いと見なされる情報に限定することができる。 Information that includes non-related keywords that are less relevant to the event is excluded from the extraction target even if it contains the main related keywords and the sub-related keywords , so that the extracted information is more relevant to the event. It can be limited to information that is considered high.

前記所定のイベントは、発生する地域が特定されるイベントであり、前記抽出対象の情報は、その情報に関連する位置を示す位置情報を含み、前記抽出手段は、前記第1の記憶手段に記憶された前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含み、且つ、前記位置情報によって示される位置が前記所定のイベントが発生する地域に含まれる前記情報を抽出するようにしてもよい。 The predetermined event is an event in which a region where the event occurs is specified, and the information to be extracted includes position information indicating a position related to the information, and the extraction unit is stored in the first storage unit The information including at least one of the main related keyword and the sub related keyword , and the position indicated by the position information included in an area where the predetermined event occurs may be extracted.

イベントの発生する地域と情報に関連する位置とを考慮して、位置情報によって示される位置がイベントが発生する地域に含まれる情報を抽出することにより、抽出される情報を、位置の観点からよりイベントとの関連性の高いと見なされる情報に限定することができる。   Considering the area where the event occurs and the position related to the information, the information indicated by the position information is extracted from the area where the event occurs, so that the extracted information It can be limited to information that is considered highly relevant to the event.

前記所定のイベントが発生したことを示すイベント発生情報を受信する通知受信手段を備え、前記抽出手段は、前記通知受信手段により前記イベント発生情報が受信された場合に、前記抽出及び記憶処理を開始するようにしてもよい。   Notification receiving means for receiving event occurrence information indicating that the predetermined event has occurred, and the extraction means starts the extraction and storage processing when the event occurrence information is received by the notification reception means You may make it do.

所定のイベントの発生を確認した場合にのみ、抽出及び記憶処理が開始されることにより、イベントが発生したことが確実である場合にのみ、抽出及び記憶処理が行われ、利用者にイベントと関連性の高い投稿情報を提供することができる。   Extraction and storage processing is performed only when it is certain that an event has occurred by starting extraction and storage processing only when the occurrence of a predetermined event is confirmed, and the event is related to the user. Highly contributed post information can be provided.

前記所定のイベントとの関連性が高いと見なされるイベント発生推定用キーワードを記憶する第3の記憶手段を備え、前記抽出手段は、抽出対象の情報のうち、前記第3の記憶手段に記憶された前記イベント発生推定用キーワードを含む情報を抽出し、その抽出した情報の件数が第4の所定数以上である場合に、前記抽出及び記憶処理を開始するようにしてもよい。 Third storage means for storing an event occurrence estimation keyword that is considered highly relevant to the predetermined event is provided, and the extraction means is stored in the third storage means among the information to be extracted. Alternatively , the information including the event occurrence estimation keyword may be extracted, and the extraction and storage process may be started when the number of pieces of the extracted information is equal to or greater than a fourth predetermined number .

予め記憶している、所定のイベントとの関連性が高いと見なされるイベント発生推定用キーワードを含む情報の抽出件数が第4の所定数以上である場合には、所定のイベントの発生が推定される。従って、イベントの発生が確実ではないものの、発生が推定される場合に抽出及び記憶処理が開始されることにより、利用者に対してイベントと関連性の高い情報を迅速に提供することが可能となる。 When the number of extracted information including an event occurrence estimation keyword that is preliminarily stored and considered to be highly relevant to a predetermined event is greater than or equal to a fourth predetermined number , the occurrence of the predetermined event is estimated. The Therefore, although the occurrence of an event is not certain, extraction and storage processing is started when the occurrence is estimated, so that it is possible to quickly provide information highly related to the event to the user. Become.

上記目的を達成するために、本発明の第2の観点に係る情報提供方法は、状況が変化する所定のイベントに関連して発生する情報を提供する情報提供装置における情報提供方法であって、前記所定のイベントとの関連性が高いと見なされる主関連キーワード及び副関連キーワードを記憶手段に記憶する第1の記憶ステップと、所定のタイミング毎に、所定期間内に発生する情報のうち、前記記憶手段に記憶された前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含む情報を抽出し、その抽出した情報のうち、第1の所定数以上の情報に含まれるキーワードを副関連キーワードとして前記記憶手段に記憶させる抽出及び記憶処理を繰り返す抽出ステップと、前記所定期間内に発生する情報のうち、前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含む情報の抽出件数が第2の所定数未満となる条件を満たした場合に、前記副関連キーワードを前記抽出ステップにおける情報の抽出の際の適用対象から除外する処理を行う抽出終了制御ステップと、を含むことを特徴とする。 In order to achieve the above object, an information providing method according to a second aspect of the present invention is an information providing method in an information providing apparatus that provides information that occurs in association with a predetermined event whose situation changes, a first storing step of storing the main relevant keywords and sub related keywords that are considered highly relevant to the predetermined event in the storage means, at every predetermined timing, among the information generated within a predetermined time period, wherein Information including at least one of the main related keyword and the sub related keyword stored in the storage means is extracted, and among the extracted information, keywords included in the first predetermined number of information or more are used as sub related keywords. an extraction step of repeating extraction and storage processing is stored in the storage means, of the information generated within the predetermined period, the main related keywords及When the number of extracted information including at least one of the sub-related keywords satisfies a condition that is less than a second predetermined number, the sub-related keywords are excluded from the application target at the time of extracting information in the extraction step. And an extraction end control step for performing processing .

上記目的を達成するために、本発明の第3の観点に係る情報提供プログラムは、コンピュータを、状況が変化する所定のイベントとの関連性が高いと見なされる主関連キーワード及び副関連キーワードを記憶する記憶手段、所定のタイミング毎に、所定期間内に発生する情報のうち、前記記憶手段に記憶された前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含む情報を抽出し、その抽出した情報のうち、第1の所定数以上の情報に含まれるキーワードを副関連キーワードとして前記記憶手段に記憶させる抽出及び記憶処理を繰り返す抽出手段、前記所定期間内に発生する情報のうち、前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含む情報の抽出件数が第2の所定数未満となる条件を満たした場合に、前記副関連キーワードを前記抽出手段による情報の抽出の際の適用対象から除外する処理を行う抽出終了制御手段、として機能させることを特徴とする。 In order to achieve the above object, an information providing program according to a third aspect of the present invention stores a main related keyword and a sub related keyword that are considered to be highly related to a predetermined event whose situation changes. Storage means for extracting information including at least one of the main related keyword and the sub related keyword stored in the storage means from information generated within a predetermined period for each predetermined timing, and extracting the information Of the information, an extraction unit that repeats extraction and storage processing for storing in the storage unit keywords included in information of a first predetermined number or more as sub-related keywords, and among the information generated within the predetermined period, the main association The condition that the number of extracted information including at least one of the keyword and the sub-related keyword is less than the second predetermined number is satisfied. The case, characterized in that to function the sub related keyword as an extracting end control means, for performing process of excluding from application of the extraction of information by the extracting means.

本発明によれば、イベントに関連する情報を適正な範囲で提供することができる。   According to the present invention, information related to an event can be provided in an appropriate range.

情報提供システムの構成を示す図である。It is a figure which shows the structure of an information provision system. 情報提供サーバの構成を示す図である。It is a figure which shows the structure of an information provision server. イベント情報の一例を示す図である。It is a figure which shows an example of event information. クローラ情報の一例を示す図である。It is a figure which shows an example of crawler information. 主関連キーワード情報の一例を示す図である。It is a figure which shows an example of main relevant keyword information. 副関連キーワード情報の一例を示す図である。It is a figure which shows an example of sub related keyword information. NGキーワード情報の一例を示す図である。It is a figure which shows an example of NG keyword information. 投稿情報の一例を示す図である。It is a figure which shows an example of contribution information. 抽出結果情報の一例を示す図である。It is a figure which shows an example of extraction result information. 候補関連キーワード情報の一例を示す図である。It is a figure which shows an example of candidate related keyword information. 情報提供サーバの動作を示す第1のフローチャートである。It is a 1st flowchart which shows operation | movement of an information provision server. 情報提供サーバの動作を示す第2のフローチャートである。It is a 2nd flowchart which shows operation | movement of an information provision server. 情報提供サーバの動作を示す第3のフローチャートである。It is a 3rd flowchart which shows operation | movement of an information provision server. 投稿情報画面の一例を示す図である。It is a figure which shows an example of a contribution information screen. 情報提供サーバの動作を示す第4のフローチャートである。It is a 4th flowchart which shows operation | movement of an information provision server. 情報提供サーバの動作を示す第5のフローチャートである。It is a 5th flowchart which shows operation | movement of an information provision server.

以下、本発明の実施形態について、図面を参照しながら詳細に説明する。なお、本発明は下記の実施形態及び図面によって限定されるものではない。本発明の要旨を変更しない範囲で下記の実施形態及び図面に変更を加えることができるのはもちろんである。また、図中同一または相当部分には同一符号を付す。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In addition, this invention is not limited by the following embodiment and drawing. It goes without saying that the following embodiments and drawings can be modified without changing the gist of the present invention. Moreover, the same code | symbol is attached | subjected to the same or an equivalent part in a figure.

(1)第1実施形態
(1−1)情報提供システムの構成
図1は、本発明の第1実施形態に係る情報提供システム1の構成を示す図である。情報提供システム1は、情報提供サーバ10、端末装置100−1、100−2、100−3(以下、端末装置100−1、100−2、100−3をまとめて適宜「端末装置100」と称する。)、無線基地局200−1、200−2(以下、無線基地局200−1、200−2をまとめて適宜「無線基地局200」と称する。)、通信ネットワーク250、イベント通知サーバ300、投稿サーバ400を備える。情報提供サーバ10は、情報提供装置に対応する。
(1) First Embodiment (1-1) Configuration of Information Providing System FIG. 1 is a diagram showing a configuration of an information providing system 1 according to the first embodiment of the present invention. The information providing system 1 includes an information providing server 10, terminal devices 100-1, 100-2, and 100-3 (hereinafter, the terminal devices 100-1, 100-2, and 100-3 are collectively referred to as “terminal device 100” as appropriate. Radio base stations 200-1 and 200-2 (hereinafter, the radio base stations 200-1 and 200-2 are collectively referred to as “radio base stations 200” as appropriate), the communication network 250, and the event notification server 300. The posting server 400 is provided. The information providing server 10 corresponds to an information providing apparatus.

端末装置100−1乃至100−3は、いわゆるスマートフォン等の携帯電話機、通信機能を有するパーソナルコンピュータ等である。通信ネットワーク250は、例えばインターネットである。情報提供サーバ10は、通信ネットワーク250及び無線基地局200を介して、端末装置100との間で通信を行うことができる。また、情報提供サーバ10は、通信ネットワーク250を介して、イベント通知サーバ300及び投稿サーバ400との間で通信を行うことができる。また、端末装置100は、無線基地局200及び通信ネットワーク250を介して、投稿サーバ400との間で通信を行うことができる。   The terminal devices 100-1 to 100-3 are a mobile phone such as a so-called smartphone, a personal computer having a communication function, or the like. The communication network 250 is, for example, the Internet. The information providing server 10 can communicate with the terminal device 100 via the communication network 250 and the radio base station 200. Further, the information providing server 10 can communicate with the event notification server 300 and the posting server 400 via the communication network 250. The terminal device 100 can communicate with the posting server 400 via the radio base station 200 and the communication network 250.

情報提供システム1において、端末装置100は、当該端末装置100のユーザによる操作によって生成される情報である投稿情報を投稿サーバ400へ送信する。投稿サーバ400は、端末装置100からの投稿情報を受信、記憶する。また、投稿サーバ400は、端末装置100からのアクセスに応じて、記憶している投稿情報を端末装置100へ送信する。   In the information providing system 1, the terminal device 100 transmits post information, which is information generated by an operation by the user of the terminal device 100, to the posting server 400. Post server 400 receives and stores post information from terminal device 100. Also, the posting server 400 transmits the stored posting information to the terminal device 100 in response to access from the terminal device 100.

イベント通知サーバ300は、イベントとしての地震等の災害発生時に当該災害の発生を示す情報(イベント発生情報)を情報提供サーバ10へ送信する。この際、イベント通知サーバ300は、送信先を情報提供サーバ10に指定して送信するユニキャスト通信を行ってもよく、複数の装置に対して同時に送信するマルチキャスト通信を行ってもよい。   The event notification server 300 transmits information indicating the occurrence of the disaster (event occurrence information) to the information providing server 10 when a disaster such as an earthquake occurs as an event. At this time, the event notification server 300 may perform unicast communication in which the transmission destination is designated as the information providing server 10 or may perform multicast communication to be transmitted simultaneously to a plurality of devices.

情報提供サーバ10は、イベント通知サーバ300からの災害発生を示すイベント発生情報を受信すると、端末装置100−1乃至100−3から投稿サーバ400へ送信され、投稿サーバ400に記憶される投稿情報から、その災害に関連する投稿情報を抽出し、端末装置100−1乃至100−3へ送信する。   Upon receiving event occurrence information indicating the occurrence of a disaster from the event notification server 300, the information providing server 10 is transmitted from the terminal devices 100-1 to 100-3 to the posting server 400 and stored in the posting server 400. The post information related to the disaster is extracted and transmitted to the terminal devices 100-1 to 100-3.

(1−2)情報提供サーバの構成
図2は、第1実施形態における情報提供サーバ10の構成を示す図である。情報提供サーバ10は、制御部20、記憶部40、通信部60及び操作部70を備える。制御部20は、例えばCPU(Central Processing Unit)により構成される。制御部20は、記憶部40に記憶されたプログラムを読み出して実行し、記憶部40に記憶された各種データを処理することなどにより、情報提供サーバ10の全体を制御する。
(1-2) Configuration of Information Providing Server FIG. 2 is a diagram showing a configuration of the information providing server 10 in the first embodiment. The information providing server 10 includes a control unit 20, a storage unit 40, a communication unit 60, and an operation unit 70. The control unit 20 is configured by, for example, a CPU (Central Processing Unit). The control unit 20 reads and executes the program stored in the storage unit 40 and controls the entire information providing server 10 by processing various data stored in the storage unit 40.

記憶部40は、例えばRAM(Random Access Memory)である。記憶部40は、情報提供サーバ10の動作に必要なプログラムや各種データを記憶する。記憶部40には、イベント情報データベース(DB)42、クローラ情報DB44、抽出結果DB46、主関連キーワードDB48、副関連キーワードDB50、NGキーワードDB52及び候補関連キーワードDB54が構成される。主関連キーワードDB48及び副関連キーワードDB50は、第1の記憶手段に対応し、NGキーワードDB54は、第2の記憶手段に対応する。   The storage unit 40 is, for example, a RAM (Random Access Memory). The storage unit 40 stores programs and various data necessary for the operation of the information providing server 10. The storage unit 40 includes an event information database (DB) 42, a crawler information DB 44, an extraction result DB 46, a main related keyword DB 48, a secondary related keyword DB 50, an NG keyword DB 52, and a candidate related keyword DB 54. The main related keyword DB 48 and the sub related keyword DB 50 correspond to the first storage unit, and the NG keyword DB 54 corresponds to the second storage unit.

通信部60は、例えばLAN(Local Area Network)カードである。通信部60は、端末装置100、イベント通知サーバ300及び投稿サーバ400との間の通信を制御する。通信部60と、端末装置100、イベント通知サーバ300及び投稿サーバ400との間の通信には、TCP/IP(Transmission Control Protocol/Internet Protocol)によるパケット通信等が採用される。また、通信部60と、端末装置100、イベント通知サーバ300及び投稿サーバ400との間の通信には、必要に応じてSSL(Secure Socket Layer)等の安全な通信路が用いられる。操作部70は、例えばキーボードであり、作業者の操作に応じた操作信号を制御部20へ出力する。   The communication unit 60 is, for example, a LAN (Local Area Network) card. The communication unit 60 controls communication among the terminal device 100, the event notification server 300, and the posting server 400. For communication between the communication unit 60 and the terminal device 100, the event notification server 300, and the posting server 400, packet communication using TCP / IP (Transmission Control Protocol / Internet Protocol) or the like is employed. In addition, a secure communication path such as SSL (Secure Socket Layer) is used for communication between the communication unit 60 and the terminal device 100, the event notification server 300, and the posting server 400 as necessary. The operation unit 70 is, for example, a keyboard, and outputs an operation signal corresponding to the operation of the operator to the control unit 20.

制御部20は、イベント登録部22、クローラ情報登録部24、副関連キーワード生成部26、投稿情報抽出部28、投稿情報提供部30、抽出終了制御部32及びキーワード編集部34の機能を実現する。副関連キーワード生成部26及び投稿情報抽出部28は、抽出手段に対応し、抽出終了制御部32は、抽出終了制御手段に対応する。   The control unit 20 implements the functions of an event registration unit 22, a crawler information registration unit 24, a secondary related keyword generation unit 26, a post information extraction unit 28, a post information provision unit 30, an extraction end control unit 32, and a keyword editing unit 34. . The sub-related keyword generation unit 26 and the posted information extraction unit 28 correspond to an extraction unit, and the extraction end control unit 32 corresponds to an extraction end control unit.

通信部60は、イベント通知サーバ300からのイベント発生情報を受信し、制御部20へ出力する。イベント発生情報は、例えば、イベントである災害の発生日時を示すイベント日時、災害の発生領域の外縁の経度及び緯度の集合、災害の発生領域の識別情報(例えばJISコード)等であるであるイベント位置情報、「地震」、「津波」、「震度」等の災害の種類や災害の発生地域の名称等の災害の内容を示す文字列であるイベント情報文字列を含む。なお、イベント位置情報は、災害が発生した領域のみの情報ではなく、災害が発生した領域の周辺の領域や災害が発生した領域に関連する領域の情報を含んでいてもよい。   The communication unit 60 receives event occurrence information from the event notification server 300 and outputs it to the control unit 20. The event occurrence information is, for example, an event date and time indicating the date and time of occurrence of a disaster as an event, a set of longitude and latitude of the outer edge of the disaster occurrence area, identification information (for example, JIS code) of the disaster occurrence area, and the like It includes event information character strings that are character strings indicating disaster contents such as location information, disaster types such as “earthquake”, “tsunami”, “seismic intensity”, and names of disaster-occurring areas. Note that the event position information may include not only information on the area where the disaster occurred, but also information on areas around the area where the disaster occurred and areas related to the area where the disaster occurred.

制御部20内のイベント登録部22は、イベント発生情報が入力されると、イベントの識別情報であるクローラIDを設定する。例えば、イベント登録部22は、情報提供サーバ10が内蔵する時計(図示せず)から現在の日時を取得し、その取得した日時を含んだクローラIDを生成する。次に、イベント登録部22は、入力されたイベント発生情報に、設定したクローラIDを付加してイベント情報を生成する。イベント登録部22は、生成したイベント情報を記憶部40内のイベント情報DB42に登録する。図3は、イベント情報の一例を示す図である。図3に示すイベント情報は、クローラIDとイベント発生情報内のイベント日時、イベント位置情報及びイベント情報文字列とを対応付けて構成される。   When event occurrence information is input, the event registration unit 22 in the control unit 20 sets a crawler ID that is event identification information. For example, the event registration unit 22 acquires the current date and time from a clock (not shown) built in the information providing server 10 and generates a crawler ID including the acquired date and time. Next, the event registration unit 22 generates event information by adding the set crawler ID to the input event occurrence information. The event registration unit 22 registers the generated event information in the event information DB 42 in the storage unit 40. FIG. 3 is a diagram illustrating an example of event information. The event information shown in FIG. 3 is configured by associating a crawler ID with an event date / time, event position information, and an event information character string in the event occurrence information.

制御部20内のクローラ情報登録部24は、イベント情報を用いて、イベントである災害と1対1に対応する、換言すれば、イベント情報と1対1に対応する情報であるクローラ情報を生成する。クローラ情報登録部24は、生成したクローラ情報を記憶部40内のクローラ情報DB44に登録する。   The crawler information registration unit 24 in the control unit 20 uses the event information to generate a crawler information that corresponds to the event disaster in a one-to-one manner, in other words, the event information and the one-to-one information. To do. The crawler information registration unit 24 registers the generated crawler information in the crawler information DB 44 in the storage unit 40.

図4は、クローラ情報の一例を示す図である。図4に示すクローラ情報は、クローラID、生成日時、イベントタイプ、イベント位置情報、イベント情報文字列、実行フラグ、実行フラグ更新日時、終了フラグ、終了フラグ更新日時、不一致フラグ及び不一致フラグ更新日時を含んで構成される。   FIG. 4 is a diagram illustrating an example of the crawler information. The crawler information shown in FIG. 4 includes a crawler ID, generation date / time, event type, event position information, event information character string, execution flag, execution flag update date / time, end flag, end flag update date / time, mismatch flag, and mismatch flag update date / time. Consists of including.

クローラIDは、イベント情報内のクローラIDが設定される。生成日時は、クローラ情報が生成された日時である。例えば、クローラ情報登録部24は、情報提供サーバ10に内蔵された時計から現在の日時を取得し、生成日時に設定する。イベントタイプは、イベントである災害の種別を示す情報であり、地震、津波、台風等の災害の種別毎に異なる情報である。例えば、クローラ情報登録部24は、イベント情報内のイベント情報文字列等に基づいて、災害の種別を判別し、その種別に対応する情報をイベントタイプとして設定する。イベント位置情報及びイベント情報文字列は、イベント情報内のイベント位置情報及びイベント情報文字列である。   As the crawler ID, a crawler ID in the event information is set. The generation date / time is the date / time when the crawler information is generated. For example, the crawler information registration unit 24 acquires the current date and time from a clock built in the information providing server 10 and sets the date and time of generation. The event type is information indicating the type of disaster that is an event, and is different information for each type of disaster such as an earthquake, tsunami, or typhoon. For example, the crawler information registration unit 24 determines a disaster type based on an event information character string or the like in the event information, and sets information corresponding to the type as an event type. The event position information and event information character string are event position information and event information character string in the event information.

実行フラグは、後述する投稿情報抽出部28による投稿情報の抽出の際にクローラ情報が用いられたか否かを示す情報であり、初期状態では用いられていないことを示す「0」、用いられた後は「1」となる。実行フラグ更新日時は、実行フラグが更新された時の日時である。終了フラグは、投稿情報抽出部28によるクローラ情報を用いた投稿情報の抽出が終了したか否かを示す情報であり、初期状態では、終了していないことを示す「0」、終了した後は「1」となる。終了フラグ更新日時は、終了フラグが更新された時の日時である。不一致フラグは、投稿情報抽出部28によるクローラ情報を用いた投稿情報の抽出の際に抽出件数が0件か否か、あるいは、最新に抽出された投稿情報が過去の所定期間以前に発生したか否かを示す情報であり、抽出件数が0件、あるいは、最新に抽出された投稿情報が過去の所定期間以前に発生した場合には「1」、それ以外の場合には「0」となる。不一致フラグ更新日時は、不一致フラグが更新された時の日時である。   The execution flag is information indicating whether or not the crawler information has been used when the post information extraction unit 28, which will be described later, extracts post information, and “0” indicating that it is not used in the initial state is used. After that, it becomes “1”. The execution flag update date and time is the date and time when the execution flag is updated. The end flag is information indicating whether or not the post information extraction using the crawler information by the post information extraction unit 28 is completed. In the initial state, the end flag is “0” indicating that it has not ended. “1”. The end flag update date and time is the date and time when the end flag is updated. The discrepancy flag indicates whether the number of items to be extracted is zero when the post information extraction unit 28 extracts post information using the crawler information, or whether the latest post information has been extracted before a predetermined period in the past. This is information indicating whether or not the number of extracted items is 0, or “1” if the latest extracted post information occurs before a predetermined period in the past, and “0” otherwise. . The mismatch flag update date and time is the date and time when the mismatch flag is updated.

記憶部40内の主関連キーワードDB48には、予め主関連キーワード情報が登録されている。図5は、主関連キーワード情報の一例を示す図である。図5に示す主関連キーワード情報は、イベントタイプ、位置情報及び主関連キーワードを含んで構成される。イベントタイプは、投稿情報の抽出の際に主関連キーワードを用いるべきイベントである災害の種別を示す情報である。位置情報は、投稿情報の抽出の際に主関連キーワードを用いるべきイベントである災害の発生領域を示す情報であり、災害の発生領域の外縁の経度及び緯度の集合、災害の発生領域の識別情報(例えばJISコード)等である。主関連キーワードはイベントタイプに対応するイベントとの関連が高いと見なされる文字列であり、第1の関連キーワードに対応する。投稿情報の抽出においては、主関連キーワードを含む投稿情報が抽出される。   Main related keyword information is registered in the main related keyword DB 48 in the storage unit 40 in advance. FIG. 5 is a diagram illustrating an example of main related keyword information. The main related keyword information shown in FIG. 5 includes an event type, position information, and main related keywords. The event type is information indicating the type of disaster that is an event for which the main related keyword should be used when extracting posted information. The location information is information indicating a disaster occurrence area that is an event for which the main related keyword should be used when extracting posted information, and is a set of longitude and latitude of the outer edge of the disaster occurrence area, and identification information of the disaster occurrence area (For example, JIS code). The main related keyword is a character string that is considered to be highly related to the event corresponding to the event type, and corresponds to the first related keyword. In the post information extraction, post information including a main related keyword is extracted.

制御部20内の副関連キーワード生成部26は、投稿情報の抽出に先立って、イベント情報に基づいて副関連キーワード情報を生成し、記憶部40内の副関連キーワードDB50に登録する。   The sub-related keyword generation unit 26 in the control unit 20 generates sub-related keyword information based on the event information prior to the extraction of the posted information, and registers it in the sub-related keyword DB 50 in the storage unit 40.

図6は、副関連キーワード情報の一例を示す図である。図6に示す副関連キーワード情報は、クローラID及び副関連キーワードを含んで構成される。クローラIDは、イベント情報内のクローラIDが設定される。副関連キーワードはクローラIDに対応するイベントとの関連が高いと見なされる文字列であり、第1の関連キーワードに対応する。投稿情報の抽出においては、副関連キーワードを含む投稿情報が抽出される。初期状態では、抽出件数は0である。   FIG. 6 is a diagram illustrating an example of the sub-related keyword information. The sub-related keyword information shown in FIG. 6 includes a crawler ID and a sub-related keyword. As the crawler ID, a crawler ID in the event information is set. The sub-related keyword is a character string that is considered highly related to the event corresponding to the crawler ID, and corresponds to the first related keyword. In the post information extraction, post information including sub-related keywords is extracted. In the initial state, the number of extracted cases is zero.

記憶部40内のNGキーワードDB52には、予めNGキーワード情報が登録されている。図7は、NGキーワード情報の一例を示す図である。図7に示すNGキーワード情報は、イベントタイプ及びNGキーワードを含んで構成される。イベントタイプは、投稿情報の抽出の際にNGキーワードを用いるべきイベントである災害の種別を示す情報である。NGキーワードはイベントタイプに対応するイベントとの関連が低いと見なされる文字列であり、非関連キーワードに対応する。投稿情報の抽出においては、NGキーワードを含む投稿情報は、主関連キーワードや副関連キーワードが含まれていても抽出の対象外となる。   In the NG keyword DB 52 in the storage unit 40, NG keyword information is registered in advance. FIG. 7 is a diagram illustrating an example of the NG keyword information. The NG keyword information shown in FIG. 7 includes an event type and an NG keyword. The event type is information indicating the type of disaster that is an event for which the NG keyword should be used when extracting posted information. The NG keyword is a character string that is considered to have a low association with the event corresponding to the event type, and corresponds to an unrelated keyword. In the extraction of the posted information, the posted information including the NG keyword is not extracted even if the main related keyword and the sub related keyword are included.

制御部20内の投稿情報抽出部28は、上述したイベント情報、クローラ情報及び副関連キーワード情報が生成、登録された後、クローラ情報毎に投稿情報の抽出を行う。具体的には、投稿情報抽出部28は、端末装置100によって送信され、投稿サーバ400に記憶された投稿情報のうち、主関連キーワード及び副関連キーワードの少なくとも何れかを含み、且つ、NGキーワードを含まない投稿情報を抽出する。   The post information extracting unit 28 in the control unit 20 extracts post information for each crawler information after the event information, the crawler information, and the sub-related keyword information are generated and registered. Specifically, the posting information extraction unit 28 includes at least one of the main related keyword and the sub related keyword among the posting information transmitted by the terminal device 100 and stored in the posting server 400, and the NG keyword. Extract post information not included.

図8は、投稿情報の一例を示す図である。図8に示す投稿情報は、投稿日時、投稿位置情報及び投稿情報文字列を含んで構成される。投稿日時は、端末装置100が投稿情報を送信した日時あるいは投稿サーバ400が投稿情報を受信した日時等である。投稿位置情報は、投稿情報を送信した端末装置100の位置を示す情報であり、経度及び緯度からなる。投稿情報文字列は、端末装置100のユーザの操作によって端末装置100に入力された文字列である。なお、投稿情報には、投稿者のアカウント名、投稿された画像のデータ等の投稿情報文字列以外のコンテンツデータが含まれる場合もある。   FIG. 8 is a diagram illustrating an example of post information. The posting information shown in FIG. 8 includes posting date / time, posting position information, and a posting information character string. The posting date and time is the date and time when the terminal device 100 transmits the posting information or the date and time when the posting server 400 receives the posting information. The posting position information is information indicating the position of the terminal device 100 that has transmitted the posting information, and includes longitude and latitude. The post information character string is a character string input to the terminal device 100 by an operation of the user of the terminal device 100. The posted information may include content data other than the posted information character string such as the account name of the poster and the data of the posted image.

また、投稿情報抽出部28は、主関連キーワード及び副関連キーワード毎に、当該主関連キーワード及び副関連キーワードを含む投稿情報の件数をカウントし、そのカウント値を、主関連キーワード及び副関連キーワードに対応づけて記憶部40に記憶させる。更に、投稿情報抽出部28は、イベント情報と、当該イベント情報内のクローラIDを含むクローラ情報に対応して抽出した投稿情報とを含む抽出結果情報を生成し、記憶部40内の抽出結果DB46に登録する。図9は、抽出結果情報の一例を示す図である。制御部20内の投稿情報提供部30は、抽出結果DB46内の抽出結果情報を、通信部60、通信ネットワーク250及び無線基地局200を介して端末装置100へ送信する。   Further, the posting information extraction unit 28 counts the number of posting information including the main related keyword and the sub related keyword for each main related keyword and the sub related keyword, and uses the count value as the main related keyword and the sub related keyword. The data are stored in the storage unit 40 in association with each other. Further, the posting information extraction unit 28 generates extraction result information including event information and posting information extracted corresponding to the crawler information including the crawler ID in the event information, and the extraction result DB 46 in the storage unit 40. Register with. FIG. 9 is a diagram illustrating an example of the extraction result information. The posting information providing unit 30 in the control unit 20 transmits the extraction result information in the extraction result DB 46 to the terminal device 100 via the communication unit 60, the communication network 250, and the radio base station 200.

また、制御部20内の副関連キーワード生成部26は、抽出された投稿情報の解析(例えば形態素解析)を行い、所定数以上の投稿情報に含まれる語を、新たな副関連キーワードとして特定する。更に、副関連キーワード生成部26は、特定した新たな副関連キーワードと、対応するクローラ情報内のクローラIDとを含んだ新たな副関連キーワード情報を生成し、記憶部40内の副関連キーワードDB60に登録する。   Further, the sub-related keyword generation unit 26 in the control unit 20 analyzes the extracted post information (for example, morpheme analysis), and specifies words included in a predetermined number or more of post information as new sub-related keywords. . Further, the secondary related keyword generation unit 26 generates new secondary related keyword information including the identified new secondary related keyword and the crawler ID in the corresponding crawler information, and the secondary related keyword DB 60 in the storage unit 40. Register with.

その後は、上述した投稿情報抽出部28による投稿情報の抽出、投稿情報提供部30による投稿情報の送信、副関連キーワード生成部26による新たな副関連キーワード情報の生成及び登録(以下、適宜「投稿情報抽出・キーワード記憶処理」と称する。)が繰り返される。   Thereafter, the post information extraction unit 28 described above extracts the post information, the post information provision unit 30 transmits the post information, the sub related keyword generation unit 26 generates and registers new sub related keyword information (hereinafter referred to as “post” as appropriate). This is referred to as “information extraction / keyword storage processing”).

制御部20内の抽出終了制御部32は、投稿情報抽出・キーワード記憶処理が繰り返されている間に、投稿情報の抽出結果が、投稿情報の抽出を終了すべき所定の条件を満たした場合に、投稿情報抽出部28による投稿情報の抽出を終了させる制御を行う。投稿情報抽出・キーワード記憶処理と投稿情報抽出の終了制御の詳細については後述する。   When the post information extraction / keyword storage process is repeated, the extraction end control unit 32 in the control unit 20 performs a case where the post information extraction result satisfies a predetermined condition for finishing the post information extraction. The post information extraction unit 28 performs control to end the extraction of the post information. Details of post information extraction / keyword storage processing and post information extraction end control will be described later.

制御部20内のキーワード編集部34は、抽出された投稿情報の解析(例えば形態素解析)を行い、所定数以上の投稿情報に含まれる語を、候補関連キーワードとして特定する。更に、キーワード編集部34は、特定した候補関連キーワードを含む候補関連キーワード情報を生成し、記憶部40内の候補関連キーワードDB54に登録する。   The keyword editing unit 34 in the control unit 20 analyzes the extracted post information (for example, morphological analysis), and specifies words included in a predetermined number or more of post information as candidate related keywords. Further, the keyword editing unit 34 generates candidate related keyword information including the identified candidate related keyword and registers it in the candidate related keyword DB 54 in the storage unit 40.

図10は、候補関連キーワード情報の一例を示す図である。図10に示す候補関連キーワード情報は、イベントタイプ、位置情報及び候補関連キーワードを含んで構成される。イベントタイプ及び位置情報は、クローラ情報内のイベントタイプ及びイベント位置情報が設定される。候補関連キーワードは文字列である。   FIG. 10 is a diagram illustrating an example of candidate-related keyword information. The candidate related keyword information shown in FIG. 10 includes an event type, position information, and candidate related keywords. As the event type and position information, the event type and event position information in the crawler information are set. The candidate related keyword is a character string.

作業者は、候補関連キーワードDB54に登録された候補関連キーワード情報内の候補関連キーワードを選択して新たな主関連キーワードに格上げすべく、操作部70を操作することができる。この場合、キーワード編集部34は、作業者による操作部70の操作に応じて、候補関連キーワードDB54に登録された候補関連キーワード情報のうち、選択された候補関連キーワードを含む候補関連キーワード情報を主関連キーワード情報として、主関連キーワードDB48に登録する。   The operator can operate the operation unit 70 to select a candidate related keyword in the candidate related keyword information registered in the candidate related keyword DB 54 and upgrade it to a new main related keyword. In this case, the keyword editing unit 34 mainly selects candidate related keyword information including the selected candidate related keyword from the candidate related keyword information registered in the candidate related keyword DB 54 in accordance with the operation of the operation unit 70 by the operator. It is registered in the main related keyword DB 48 as related keyword information.

また、キーワード編集部34は、作業者による操作部70の操作に応じて、NGキーワードDB52に登録されたNGキーワードへの新たなNGキーワードの追加、NGキーワードDB52に登録されたNGキーワードの削除、NGキーワードDB52に登録されたNGキーワードの修正等、NGキーワードの編集を行う。     Further, the keyword editing unit 34 adds a new NG keyword to the NG keyword registered in the NG keyword DB 52 and deletes the NG keyword registered in the NG keyword DB 52 according to the operation of the operation unit 70 by the operator. The editing of the NG keyword such as correction of the NG keyword registered in the NG keyword DB 52 is performed.

(1−3)情報提供サーバの動作
次に、フローチャートを参照しつつ、第1実施形態における情報提供サーバ10の動作を説明する。図11乃至図13は、第1実施形態における情報提供サーバ10による投稿情報抽出・キーワード記憶処理時の動作を示すフローチャートである。図11乃至図13に示す動作は、例えば10分周期等の所定の間隔で繰り返して実行される。
(1-3) Operation of Information Providing Server Next, the operation of the information providing server 10 in the first embodiment will be described with reference to a flowchart. FIG. 11 to FIG. 13 are flowcharts showing the operation at the time of post information extraction / keyword storage processing by the information providing server 10 in the first embodiment. The operation shown in FIGS. 11 to 13 is repeatedly executed at a predetermined interval such as a 10-minute cycle.

図11に示すように、制御部20内の投稿情報抽出部28は、処理の開始日時(現在の日時)を取得する(ステップS201)。例えば、投稿情報抽出部28は、情報提供サーバ10に内蔵された時計から開始日時を取得することができる。   As illustrated in FIG. 11, the posting information extraction unit 28 in the control unit 20 acquires the start date and time (current date and time) of processing (step S201). For example, the posting information extraction unit 28 can acquire the start date and time from a clock built in the information providing server 10.

次に、投稿情報抽出部28は、クローラ情報DB44に登録されているクローラ情報のうち、実行フラグが「0」又は終了フラグが「0」のクローラ情報、換言すれば、そのクローラ情報を用いた投稿情報の抽出が開始されていないクローラ情報、又は、そのクローラ情報を用いた投稿情報の抽出が終了していないクローラ情報を取得する。更に、投稿情報抽出部28は、取得したクローラ情報からなるリストを生成する(ステップS202)。リストには、例えば、取得されたクローラ情報のクローラIDが含まれる。リストは記憶部40に記憶される。   Next, the posting information extraction unit 28 uses the crawler information registered in the crawler information DB 44 with the execution flag “0” or the end flag “0”, in other words, the crawler information. The crawler information for which the extraction of the posted information has not started, or the crawler information for which the extraction of the posted information using the crawler information has not been completed is acquired. Further, the posting information extraction unit 28 generates a list including the acquired crawler information (step S202). The list includes, for example, the crawler ID of the acquired crawler information. The list is stored in the storage unit 40.

次に、投稿情報抽出部28は、ステップS202におけるクローラ情報の取得件数が0であるか否かを判定する(ステップS203)。クローラ情報の取得件数が0である場合(ステップS203:YES)には、一連の動作が終了する。一方、クローラ情報の取得件数が0でない場合(ステップS203:NO)、投稿情報抽出部28は、リストから未選択の1件のクローラ情報を選択する(ステップS204)。   Next, the posting information extraction unit 28 determines whether or not the number of crawler information acquired in step S202 is 0 (step S203). When the number of acquired crawler information is 0 (step S203: YES), a series of operations ends. On the other hand, when the number of acquired crawler information is not 0 (step S203: NO), the posted information extracting unit 28 selects one unselected crawler information from the list (step S204).

次に、投稿情報抽出部28は、ステップS204において選択したクローラ情報内の不一致フラグが「1」であり、且つ、不一致フラグ更新日時が所定時間以上前(例えば、6時間以上前)であるか否かを判定する(ステップS205)。クローラ情報内の不一致フラグが「1」であり、且つ、不一致フラグ更新日時が所定時間以上前である場合(ステップS205:YES)、投稿情報抽出部28は、ステップS204において選択したクローラ情報内の終了フラグを「1」に設定し、終了フラグ更新日時を現在の日時に設定する(ステップS206)。次に、投稿情報抽出部28は、ステップS204において選択したクローラ情報をリストから削除する(ステップS207)。   Next, the posted information extraction unit 28 determines whether the mismatch flag in the crawler information selected in step S204 is “1” and the mismatch flag update date is a predetermined time or more before (for example, 6 hours or more before). It is determined whether or not (step S205). When the inconsistency flag in the crawler information is “1” and the inconsistency flag update date and time is more than a predetermined time (step S205: YES), the posted information extraction unit 28 includes the crawler information in the crawler information selected in step S204. The end flag is set to “1”, and the end flag update date / time is set to the current date / time (step S206). Next, the posting information extraction unit 28 deletes the crawler information selected in step S204 from the list (step S207).

ステップS207におけるクローラ情報の削除後、又は、ステップS205において、クローラ情報内の不一致フラグが「1」でない、及び、不一致フラグ更新日時が所定時間以上前でないことの何れかであると判定された場合(ステップS205:NO)、投稿情報抽出部28は、リストに未選択のクローラ情報があるか否かを判定する(ステップS208)。リストに未選択のクローラ情報がある場合(ステップS208:YES)には、ステップS204における未選択の1件のクローラ情報の選択以降の動作が繰り返される。   After deletion of the crawler information in step S207, or when it is determined in step S205 that the mismatch flag in the crawler information is not “1” and that the mismatch flag update date / time is not more than a predetermined time ago. (Step S205: NO), the posting information extraction unit 28 determines whether there is unselected crawler information in the list (Step S208). If there is unselected crawler information in the list (step S208: YES), the operations after selection of one unselected crawler information in step S204 are repeated.

一方、リストにステップS204において未選択のクローラ情報がない場合(ステップS208:NO)、図12の動作が行われる。投稿情報抽出部28は、リストから所定の優先度でクローラ情報を選択する(ステップS251)。例えば、投稿情報抽出部28は、リストに含まれる各クローラ情報内の生成日時を比較し、生成日時が新しい順に1件ずつクローラ情報を選択する。また、投稿情報抽出部28は、リストに含まれる各クローラ情報内の実行フラグ更新日時を比較し、その実行フラグ更新日時の新しい順に1件ずつクローラ情報を選択してもよい。また、投稿情報抽出部28は、リストに含まれる各クローラ情報のうち、イベントタイプが所定の種別、例えば「津波」、「避難勧告」であるものを優先して選択するようにしてもよい。   On the other hand, when there is no unselected crawler information in step S204 (step S208: NO), the operation in FIG. 12 is performed. The posted information extraction unit 28 selects crawler information with a predetermined priority from the list (step S251). For example, the posting information extraction unit 28 compares the generation date and time in each crawler information included in the list, and selects the crawler information one by one in the order of generation date and time. Further, the posted information extraction unit 28 may compare the execution flag update date and time in each crawler information included in the list and select the crawler information one by one in the order of the execution flag update date and time. Further, the posted information extraction unit 28 may preferentially select the crawler information included in the list with a predetermined event type, for example, “tsunami” or “evacuation recommendation”.

以下、ステップS252乃至図13のステップS307の動作は、ステップS251において選択されたクローラ情報毎に行われる。投稿情報抽出部28は、ステップS251で選択したクローラ情報内の実行フラグを「1」に設定し、実行フラグ更新日時を現在の日時に設定する(ステップS252)。   Hereinafter, the operation from step S252 to step S307 in FIG. 13 is performed for each crawler information selected in step S251. The posted information extraction unit 28 sets the execution flag in the crawler information selected in step S251 to “1”, and sets the execution flag update date and time to the current date and time (step S252).

次に、投稿情報抽出部28は、主関連キーワードDB48に登録された主関連キーワード情報のうち、ステップS251で選択したクローラ情報内のイベントタイプを含み、位置情報が示す領域がステップS251で選択したクローラ情報内のイベント位置情報が示す領域に含まれる主関連キーワード情報を特定する。例えば、主関連キーワード情報内の位置情報及びクローラ情報内のイベント位置情報が災害の発生領域の外縁の経度及び緯度の集合である場合、投稿情報抽出部28は、主関連キーワードDB48に登録された主関連キーワード情報のうち、ステップS251で選択したクローラ情報内のイベントタイプを含み、位置情報である外縁の経度及び緯度の集合からなる領域がクローラ情報内のイベント位置情報である外縁の経度及び緯度の集合からなる領域に含まれる、あるいは、一致する主関連キーワード情報を特定する。また、主関連キーワード情報内の位置情報及びクローラ情報内のイベント位置情報が災害の発生領域の識別情報(JISコード等)である場合、投稿情報抽出部28は、主関連キーワードDB48に登録された主関連キーワード情報のうち、ステップS251で選択したクローラ情報内のイベントタイプを含み、位置情報である識別情報がクローラ情報内のイベント位置情報である識別情報と一致する主関連キーワード情報を特定する。更に、投稿情報抽出部28は、その特定した主関連キーワード情報内の主関連キーワードを取得する(ステップS253)。取得される主関連キーワードは1つであっても複数であってもよい。   Next, the posting information extraction unit 28 includes the event type in the crawler information selected in step S251 out of the main related keyword information registered in the main related keyword DB 48, and the region indicated by the position information is selected in step S251. The main related keyword information included in the area indicated by the event position information in the crawler information is specified. For example, when the position information in the main related keyword information and the event position information in the crawler information are a set of the longitude and latitude of the outer edge of the disaster occurrence area, the posted information extraction unit 28 is registered in the main related keyword DB 48. Among the main related keyword information, the area including the event type in the crawler information selected in step S251, and the region composed of the outer edge longitude and latitude as the position information is the outer edge longitude and latitude as the event position information in the crawler information. The main related keyword information included in or coincident with the region consisting of Further, when the position information in the main related keyword information and the event position information in the crawler information are identification information (JIS code etc.) of the disaster occurrence area, the posted information extraction unit 28 is registered in the main related keyword DB 48. Among the main related keyword information, the main related keyword information that includes the event type in the crawler information selected in step S251 and whose identification information that is position information matches the identification information that is event position information in the crawler information is specified. Furthermore, the posting information extraction unit 28 acquires a main related keyword in the specified main related keyword information (step S253). One or more main related keywords may be acquired.

次に、投稿情報抽出部28は、副関連キーワードDB50に登録された副関連キーワード情報のうち、ステップS251で選択したクローラ情報内のクローラIDを含む副関連キーワード情報を特定し、その特定した副関連キーワード情報内の副関連キーワードを取得する(ステップS254)。取得される副関連キーワードは1つであっても複数であってもよい。   Next, the posting information extraction unit 28 specifies sub-related keyword information including the crawler ID in the crawler information selected in step S251 from the sub-related keyword information registered in the sub-related keyword DB 50, and the specified sub-keyword information. A secondary related keyword in the related keyword information is acquired (step S254). One or more sub-related keywords may be acquired.

次に、投稿情報抽出部28は、NGキーワードDB52に登録されたNGキーワード情報のうち、ステップS251で選択したクローラ情報内のイベントタイプを含むNGキーワード情報を特定し、その特定したNGキーワード情報内のNGキーワードを取得する(ステップS255)。取得されるNGキーワードは1つであっても複数であってもよい。   Next, the posting information extraction unit 28 specifies NG keyword information including the event type in the crawler information selected in step S251 from the NG keyword information registered in the NG keyword DB 52, and includes the specified NG keyword information. NG keyword is acquired (step S255). One or a plurality of NG keywords may be acquired.

次に、投稿情報抽出部28は、通信部60及び通信ネットワーク250を介して、投稿サーバ400にアクセスする。投稿情報抽出部28は、投稿サーバ400に記憶されている投稿情報のうち、過去の第1の所定期間内(例えば、現在の日時から24時間以内)に発生し、投稿位置情報が示す位置がステップS251で選択したクローラ情報内のイベント位置情報が示す領域に含まれ、ステップS253において取得した主関連キーワード及びステップS254において取得した副関連キーワードの少なくとも何れかを含み、且つ、ステップS255において取得したNGキーワードを含まない投稿情報を抽出する(ステップS256)。   Next, the posting information extraction unit 28 accesses the posting server 400 via the communication unit 60 and the communication network 250. The posted information extracting unit 28 occurs in the past first predetermined period (for example, within 24 hours from the current date and time) among the posted information stored in the posted server 400, and the position indicated by the posted position information is It is included in the area indicated by the event position information in the crawler information selected in step S251, includes at least one of the main related keyword acquired in step S253 and the sub related keyword acquired in step S254, and acquired in step S255. Posting information not including the NG keyword is extracted (step S256).

上述した投稿情報の抽出において、例えば、クローラ情報内のイベント位置情報が災害の発生領域の外縁の経度及び緯度の集合である場合、投稿情報抽出部28は、投稿位置情報が示す位置がクローラ情報内のイベント位置情報である外縁の経度及び緯度の集合からなる領域に含まれる投稿情報を抽出対象とする。また、クローラ情報内のイベント位置情報が災害の発生領域の識別情報(JISコード等)である場合、投稿情報抽出部28は、識別情報と当該識別情報に対応する領域の外縁の経度及び緯度の集合とを対応付けたテーブル(図示せず)等を参照し、投稿位置情報が示す位置が識別情報に対応付けられた外縁の経度及び緯度の集合からなる領域に含まれる投稿情報を抽出対象とする。ここで、投稿情報抽出部28は、投稿サーバ400に記憶されている全ての投稿情報を取得し、取得した投稿情報の中から、上述した抽出条件に合致する投稿情報を抽出してもよい。あるいは、投稿情報抽出部28が、抽出条件の情報として、過去の第1の所定期間の情報、イベント位置情報が示す領域の情報、主関連キーワード、副関連キーワード及びNGキーワードを投稿サーバ400へ送信してもよい。この場合には、投稿サーバ400は、記憶している投稿情報の中から、抽出条件に合致する投稿情報を抽出して情報提供サーバ10へ送信し、投稿情報抽出部28は、送信された投稿情報を受信する。   In the post information extraction described above, for example, when the event position information in the crawler information is a set of the longitude and latitude of the outer edge of the disaster occurrence area, the post information extraction unit 28 indicates that the position indicated by the post position information is the crawler information. Posting information included in an area consisting of a set of longitude and latitude of the outer edge, which is the event position information, is extracted. Further, when the event position information in the crawler information is identification information (JIS code or the like) of the disaster occurrence area, the posted information extraction unit 28 determines the longitude and latitude of the outer edge of the area corresponding to the identification information and the identification information. With reference to a table (not shown) in which the set is associated, the posting information included in the area composed of the set of the longitude and latitude of the outer edge in which the position indicated by the posting position information is associated with the identification information is extracted. To do. Here, the posting information extraction unit 28 may acquire all the posting information stored in the posting server 400 and extract the posting information that matches the above-described extraction condition from the acquired posting information. Alternatively, the posting information extraction unit 28 transmits information on the first predetermined period in the past, information on the area indicated by the event position information, main related keywords, sub related keywords, and NG keywords to the posting server 400 as extraction condition information. May be. In this case, the posting server 400 extracts the posting information that matches the extraction condition from the stored posting information and transmits it to the information providing server 10, and the posting information extraction unit 28 transmits the posted information. Receive information.

次に、投稿情報抽出部28は、ステップS256において抽出した投稿情報内の投稿情報文字列の解析(例えば形態素解析)を行い、ステップS253において取得した主関連キーワード及びステップS254において取得した副関連キーワード毎に、その主関連キーワード及び副関連キーワードを投稿情報文字列に含む投稿情報の件数(抽出件数)をカウントする。更に、投稿情報抽出部28は、主関連キーワードを投稿情報文字列に含む投稿情報の件数を、その主関連キーワードを含む主関連キーワード情報、及び、ステップS251で選択したクローラ情報内のクローラIDと対応づけて記憶部40に記憶させる。また、投稿情報抽出部28は、副関連キーワードを投稿情報文字列に含む投稿情報の件数を、その副関連キーワードを含む副関連キーワード情報、及び、ステップS251で選択したクローラ情報内のクローラIDと対応づけて記憶部40に記憶させる(ステップS257)。   Next, the posting information extraction unit 28 analyzes the posting information character string in the posting information extracted in step S256 (for example, morpheme analysis), and the main related keyword acquired in step S253 and the sub related keyword acquired in step S254. Every time, the number of post information (the number of extractions) including the main related keyword and the sub related keyword in the post information character string is counted. Further, the posting information extraction unit 28 determines the number of posting information including the main related keyword in the posting information character string, the main related keyword information including the main related keyword, and the crawler ID in the crawler information selected in step S251. The data are stored in the storage unit 40 in association with each other. Further, the posted information extraction unit 28 sets the number of posted information including the secondary related keyword in the post information character string, the secondary related keyword information including the secondary related keyword, and the crawler ID in the crawler information selected in step S251. The data are stored in the storage unit 40 in association with each other (step S257).

次に、投稿情報抽出部28は、ステップS256における投稿情報の抽出件数が0、又は、ステップS256において抽出した投稿情報ののうち、最新の投稿情報が過去の第2の所定期間以前(例えば、6時間以前)に発生したものであるか否かを判定する(ステップS258)。   Next, the posted information extraction unit 28 has the number of posted information extracted in step S256 as 0, or the latest posted information extracted from the posted information extracted in step S256 before the second predetermined period in the past (for example, It is determined whether or not the alarm occurred before 6 hours (step S258).

ステップS256における投稿情報の抽出件数が0、又は、ステップS256において抽出した投稿情報ののうち、最新の投稿情報が過去の第2の所定期間以前に発生したものであることの少なくとも何れかを満たす場合(ステップS258:YES)、投稿情報抽出部28は、ステップS251で選択したクローラ情報内の不一致フラグを「1」に設定し、不一致フラグ更新日時を現在の日時に設定する(ステップS259)。その後、一連の動作が終了する。   The number of post information extractions in step S256 satisfies 0 or at least one of the post information extracted in step S256 is the latest post information that occurred before the second predetermined period in the past. In the case (step S258: YES), the posted information extraction unit 28 sets the mismatch flag in the crawler information selected in step S251 to “1”, and sets the mismatch flag update date and time to the current date and time (step S259). Thereafter, a series of operations ends.

一方、ステップS256における投稿情報の抽出件数が0ではなく、且つ、ステップS256において抽出した投稿情報ののうち、最新の投稿情報が過去の第2の所定期間以前に発生したものでない場合(ステップS258:NO)、投稿情報抽出部28は、イベント情報DB42に登録されたイベント情報のうち、ステップS251において選択したクローラ情報内のクローラIDを含むイベント情報を抽出する。更に、投稿情報抽出部28は、抽出したイベント情報に、ステップS256において抽出した投稿情報を対応付けて抽出結果情報を生成する(ステップS260)。   On the other hand, when the number of pieces of post information extracted in step S256 is not 0, and the post information extracted in step S256 is not the latest post information generated before the second predetermined period in the past (step S258). : NO), the posting information extraction unit 28 extracts event information including the crawler ID in the crawler information selected in step S251 from the event information registered in the event information DB 42. Further, the posting information extraction unit 28 generates extraction result information by associating the extracted event information with the posting information extracted in step S256 (step S260).

ステップS260の後、図13の動作が行われる。投稿情報提供部30は、抽出結果情報を、通信部60、通信ネットワーク250及び無線基地局200を介して、端末装置100へ送信する(ステップS301)。例えば、端末装置100のユーザは、取得したい投稿情報を地域の観点から限定することが可能である。この場合、記憶部40には、ユーザ情報として、ユーザID等とともに、端末装置100のユーザが希望する地域の情報が含まれる。投稿情報提供部30は、この地域の情報に基づいて、抽出結果情報を送信する際に、当該抽出結果情報に含まれるイベント位置情報や投稿位置情報が示す領域が端末装置100のユーザが希望する地域であるか否かを判定する。更に、投稿情報提供部30は、抽出結果情報に含まれるイベント位置情報や投稿位置情報が示す領域が端末装置100のユーザが希望する地域である場合に、当該端末装置100に向けて抽出結果情報を送信する。   After step S260, the operation of FIG. 13 is performed. The posted information providing unit 30 transmits the extraction result information to the terminal device 100 via the communication unit 60, the communication network 250, and the radio base station 200 (step S301). For example, the user of the terminal device 100 can limit post information to be acquired from a regional viewpoint. In this case, the storage unit 40 includes, as user information, information on a region desired by the user of the terminal device 100 together with a user ID and the like. When the posting information providing unit 30 transmits the extraction result information based on the information on the area, the user of the terminal device 100 desires the area indicated by the event position information and the posting position information included in the extraction result information. Determine if it is a region. Furthermore, when the area indicated by the event position information or the posting position information included in the extraction result information is an area desired by the user of the terminal device 100, the posting information providing unit 30 extracts the extraction result information toward the terminal device 100. Send.

端末装置100内の制御部(図示せず)は、抽出結果情報を受信すると、当該抽出結果情報に基づいて、抽出結果画面を生成し、ディスプレイ(図示せず)に表示する。図14は、抽出結果画面の一例を示す図である。図14は、抽出結果情報に含まれる3件の投稿情報に対応する画像500、510及び520が含まれる。例えば、1件の投稿情報に対応する画像500は、投稿情報に基づいて形成されるアカウント名の画像501、投稿情報文字列の画像502、投稿位置情報の画像503、コンテンツデータに対応する画像504、投稿日時の画像505が含まれる。   Upon receiving the extraction result information, the control unit (not shown) in the terminal device 100 generates an extraction result screen based on the extraction result information and displays it on a display (not shown). FIG. 14 is a diagram illustrating an example of the extraction result screen. FIG. 14 includes images 500, 510, and 520 corresponding to three pieces of post information included in the extraction result information. For example, an image 500 corresponding to one piece of post information includes an account name image 501 formed based on the post information, a post information character string image 502, a post position information image 503, and an image 504 corresponding to content data. , An image 505 of the posting date is included.

再び、図13に戻って説明する。制御部20内の抽出終了制御部32は、図12のステップS257において主関連キーワード及び副関連キーワード毎に得られた、その主関連キーワード及び副関連キーワードを含む投稿情報の件数の合計数を算出する(ステップS302)。次に、抽出終了制御部32は、ステップS302において算出した合計数が第1の所定数未満であるか否かを判定する(ステップS303)。   Returning to FIG. 13, the description will be continued. The extraction end control unit 32 in the control unit 20 calculates the total number of post information including the main related keyword and the sub related keyword obtained for each of the main related keyword and the sub related keyword in step S257 of FIG. (Step S302). Next, the extraction end control unit 32 determines whether or not the total number calculated in step S302 is less than the first predetermined number (step S303).

ステップS302において算出した合計数が第1の所定数未満でない場合(ステップS303:NO)、制御部20内の副関連キーワード生成部26は、図12のステップS256において抽出された投稿情報の解析(例えば形態素解析)を行い、所定数以上の投稿情報に含まれる語を、新たな副関連キーワードとして特定する。更に、副関連キーワード生成部26は、特定した新たな副関連キーワードを含んだ新たな副関連キーワード情報を生成し、記憶部40内の副関連キーワードDB60に登録する(ステップS304)。その後、一連の動作が終了する。   When the total number calculated in step S302 is not less than the first predetermined number (step S303: NO), the sub-related keyword generation unit 26 in the control unit 20 analyzes the post information extracted in step S256 of FIG. For example, morphological analysis is performed, and words included in a predetermined number or more of post information are specified as new sub-related keywords. Further, the sub-related keyword generation unit 26 generates new sub-related keyword information including the specified new sub-related keyword, and registers it in the sub-related keyword DB 60 in the storage unit 40 (step S304). Thereafter, a series of operations ends.

一方、ステップS302において算出した合計数が第1の所定数未満である場合(ステップS303:YES)、抽出終了制御部32は、図12のステップS251において選択されたクローラ情報内のクローラIDを含む副関連キーワード情報を削除する(ステップS305)。次に、制御部20内の抽出終了制御部32は、ステップS251において選択されたクローラ情報内の終了フラグを「1」に設定し、終了フラグ更新日時を現在の日時に設定する(ステップS306)。その後、一連の動作が終了する。クローラ情報内の終了フラグを「1」に設定された場合には、既に実行フラグも「1」であるため、その後の投稿情報抽出・キーワード記憶処理の動作における、図11のステップS202において、クローラ情報は、リストに設定されない。従って、クローラ情報に対応する投稿情報抽出及びキーワード記憶処理は実行されない。   On the other hand, when the total number calculated in step S302 is less than the first predetermined number (step S303: YES), the extraction end control unit 32 includes the crawler ID in the crawler information selected in step S251 of FIG. The sub related keyword information is deleted (step S305). Next, the extraction end control unit 32 in the control unit 20 sets the end flag in the crawler information selected in step S251 to “1”, and sets the end flag update date and time to the current date and time (step S306). . Thereafter, a series of operations ends. When the end flag in the crawler information is set to “1”, the execution flag is already “1”, and therefore the crawler in step S202 of FIG. 11 in the subsequent post information extraction / keyword storage processing operation. Information is not set in the list. Accordingly, the post information extraction and keyword storage processing corresponding to the crawler information is not executed.

(1−4)作用・効果
上述したように、第1実施形態において、情報提供システム1内の情報提供サーバ10は、クローラ情報毎に、イベントとの関連性が高いと見なされる主関連キーワード及び副関連キーワードの少なくとも何れかを含み、イベントとの関連性が低いと見なされるNGキーワードを含まない投稿情報を抽出し、更にその抽出した投稿情報に含まれる新たな副関連キーワードを抽出するという処理を繰り返す。
(1-4) Actions / Effects As described above, in the first embodiment, the information providing server 10 in the information providing system 1 has a main related keyword that is considered highly relevant to an event for each crawler information, and A process of extracting post information that includes at least one of the sub-related keywords and does not include an NG keyword that is considered to be less relevant to the event, and further extracts a new sub-related keyword included in the extracted post information. repeat.

このように、副関連キーワードは随時追加されるため、主関連キーワード及び副関連キーワードの少なくとも何れかを含み、NGキーワードを含まない投稿情報は、徐々に増加することが想定される。一方、このような想定にもかかわらず、主関連キーワード及び副関連キーワード毎の抽出件数の合計数が第1の所定数未満である場合には、イベントが終息する等、イベントの状況が変化すること等によって、主関連キーワード及び副関連キーワードとイベントとの関連性が低くなっているとみなすことができる。この場合には、情報提供サーバ10は、投稿情報抽出及びキーワード記憶処理を終了することにより、イベントに関連する情報を適正な範囲で提供することができる。また、副関連キーワードは随時追加されて投稿情報の抽出に用いられるため、例えば、地震がきっかけとなって発生した電車の遅延情報、ゲリラ豪雨がきっかけとなって発生した川の氾濫等の二次災害に関する投稿情報の取得が可能となる。   As described above, since sub-related keywords are added as needed, it is assumed that post information including at least one of the main related keywords and the sub-related keywords and not including the NG keyword gradually increases. On the other hand, in spite of such an assumption, when the total number of extracted items for each of the main related keywords and the sub related keywords is less than the first predetermined number, the event status changes, for example, the event ends. Therefore, it can be considered that the relationship between the main related keyword and the sub related keyword and the event is low. In this case, the information providing server 10 can provide information related to the event within an appropriate range by terminating the posting information extraction and the keyword storage processing. In addition, secondary related keywords are added at any time and used to extract posted information.For example, secondary information such as train delay information caused by earthquakes, river flooding caused by guerrilla heavy rain, etc. Post information related to disasters can be obtained.

また、情報提供サーバ10は、NGキーワードを含む投稿情報については、主関連キーワード及び副関連キーワードを含んでいても抽出対象から除外する。このため、抽出される投稿情報を、よりイベントとの関連性の高いと見なされる投稿情報に限定することができる。   Further, the information providing server 10 excludes the posting information including the NG keyword from the extraction target even if it includes the main related keyword and the sub related keyword. For this reason, the extracted posting information can be limited to posting information that is considered to be more highly related to the event.

また、情報提供サーバ10は、クローラ情報内のイベント位置情報と投稿情報内の投稿位置情報とに基づいて、投稿位置情報が示す位置が、イベント位置情報が示す領域に含まれる投稿情報を抽出する。このため、抽出される投稿情報を、位置の観点からよりイベントとの関連性の高いと見なされる投稿情報に限定することができる。   Further, the information providing server 10 extracts post information in which the position indicated by the post position information is included in the area indicated by the event position information based on the event position information in the crawler information and the post position information in the post information. . For this reason, the extracted posting information can be limited to posting information that is considered more highly relevant to the event from the viewpoint of position.

また、情報提供サーバ10は、イベント通知サーバ300からのイベント発生情報を受信した場合に、投稿情報の抽出及びキーワード記憶処理を開始する。これにより、イベントが発生したことが確実である場合にのみ、投稿情報の抽出及びキーワード記憶処理が行われ、端末装置100のユーザにイベントとの関連性の高い投稿情報を提供することができる。   Further, when the event providing server 10 receives the event occurrence information from the event notification server 300, the information providing server 10 starts the posting information extraction and the keyword storing process. Thereby, only when it is certain that an event has occurred, the extraction of post information and the keyword storage process are performed, and post information highly related to the event can be provided to the user of the terminal device 100.

(2)第2実施形態
第1実施形態では、制御部20内の抽出終了制御部32は、主関連キーワード及び副関連キーワードを含む投稿情報の抽出件数の合計数が第1の所定数未満である場合に、クローラ情報内の終了フラグを「1」に設定することで、その後に、当該クローラ情報に対応する投稿情報抽出及びキーワード記憶処理が実行されないようにした。
(2) Second Embodiment In the first embodiment, the extraction end control unit 32 in the control unit 20 is such that the total number of extracted post information including the main related keyword and the sub related keyword is less than the first predetermined number. In some cases, by setting the end flag in the crawler information to “1”, the post information extraction and keyword storage processing corresponding to the crawler information is not executed thereafter.

これに対して、第2実施形態では、抽出終了制御部32は、クローラ情報に対応する副関連キーワード毎に、その副関連キーワードを含む投稿情報の抽出件数を取得し、その抽出件数が第2の所定数未満である場合に、副関連キーワードを含んだ副関連キーワード情報を削除して、その後に当該副関連キーワードを含む投稿情報の抽出が実行されないようにする。   On the other hand, in the second embodiment, the extraction end control unit 32 acquires the number of extracted post information including the sub-related keyword for each sub-related keyword corresponding to the crawler information, and the number of extracted cases is the second. If the number is less than the predetermined number, the sub-related keyword information including the sub-related keyword is deleted, and the post information including the sub-related keyword is not extracted thereafter.

フローチャートを参照しつつ、第2実施形態における情報提供サーバ10の動作を説明する。第2実施形態では、第1実施形態と同様、図11に示す動作が行われ、その後、図15及び図16に示す動作が行われる。図15のステップS351乃至ステップS356の動作は、図12のステップS251乃至ステップS256の動作と同様であるので、その説明は省略する。   The operation of the information providing server 10 in the second embodiment will be described with reference to the flowchart. In the second embodiment, similarly to the first embodiment, the operation shown in FIG. 11 is performed, and thereafter, the operations shown in FIGS. 15 and 16 are performed. The operations in steps S351 through S356 in FIG. 15 are the same as the operations in steps S251 through S256 in FIG.

制御部20内の投稿情報抽出部28は、ステップS356において抽出した投稿情報内の投稿情報文字列を解析し、ステップS354において取得した副関連キーワード毎に、その副関連キーワードを含む投稿情報の件数をカウントする。更に、投稿情報抽出部28は、副関連キーワードを投稿情報文字列に含む投稿情報の件数(抽出件数)を、その副関連キーワードを含む副関連キーワード情報、及び、ステップS351で選択したクローラ情報内のクローラIDと対応づけて記憶部40に記憶させる(ステップS357)。   The posting information extraction unit 28 in the control unit 20 analyzes the posting information character string in the posting information extracted in step S356, and the number of pieces of posting information including the sub related keyword for each sub related keyword acquired in step S354. Count. Furthermore, the posting information extraction unit 28 sets the number of pieces of posting information (extraction number) including the sub-related keyword in the post information character string, the sub-related keyword information including the sub-related keyword, and the crawler information selected in step S351. Are associated with the crawler ID and stored in the storage unit 40 (step S357).

ステップS358乃至図16のステップS401の動作は、図12のステップS258乃至図13のステップS301の動作と同様であるので、その説明は省略する。   The operation from step S358 to step S401 in FIG. 16 is the same as the operation from step S258 in FIG. 12 to step S301 in FIG.

制御部20内の抽出終了制御部32は、図16のステップS354において取得された副関連キーワード情報の中から、未選択の1件の副関連キーワード情報を選択する(ステップS402)。次に、抽出終了制御部32は、ステップS402において選択した副関連キーワード情報にステップS357において対応づけられた抽出件数が第2の所定数未満であるか否かを判定する(ステップS403)。 The extraction end control unit 32 in the control unit 20 selects one unselected sub-related keyword information from the sub-related keyword information acquired in step S354 of FIG. 16 (step S402). Next, the extraction end control unit 32 determines whether or not the number of extraction cases associated in step S357 with the sub-related keyword information selected in step S402 is less than a second predetermined number (step S403).

ステップS402において選択した副関連キーワード情報にステップS403において対応づけられた抽出件数が第2の所定数未満である場合(ステップS403:YES)、抽出終了制御部32は、ステップS402において選択した副関連キーワード情報を副関連キーワードDB50から削除する(ステップS404)。副関連キーワード情報が削除されることにより、その後に、削除された副関連キーワード情報に含まれていたクローラIDを有するクローラ情報に対応する投稿情報抽出及びキーワード記憶処理において、削除された副関連キーワード情報内の副関連キーワードは用いられない。   When the number of extracted items associated with the sub-related keyword information selected in step S402 is less than the second predetermined number (step S403: YES), the extraction end control unit 32 selects the sub-related item selected in step S402. The keyword information is deleted from the subsidiary related keyword DB 50 (step S404). After the sub-related keyword information is deleted, the sub-related keyword deleted in the post information extraction and keyword storage processing corresponding to the crawler information having the crawler ID included in the deleted sub-related keyword information. Secondary related keywords in the information are not used.

ステップS404において副関連キーワード情報が削除された後、又は、ステップS402において選択した副関連キーワード情報に対応する抽出件数が第2の所定数未満でないと判定された(ステップS403:NO)後、抽出終了制御部32は、ステップS402において未選択の副関連キーワード情報があるか否かを判定する(ステップS405)。ステップS402において未選択の副関連キーワード情報がある場合(ステップS405:YES)には、ステップS402における未選択の1件の副関連キーワード情報の選択以降の動作が繰り返される。   After sub-related keyword information is deleted in step S404, or after it is determined that the number of extractions corresponding to the sub-related keyword information selected in step S402 is not less than the second predetermined number (step S403: NO), extraction is performed The termination control unit 32 determines whether there is sub-related keyword information that has not been selected in step S402 (step S405). If there is unselected sub-related keyword information in step S402 (step S405: YES), the operation after the selection of one unselected sub-related keyword information in step S402 is repeated.

一方、ステップS402において未選択の副関連キーワード情報がない場合(ステップS405:NO)には、制御部20内の副関連キーワード生成部26は、図15のステップS356において抽出された投稿情報の解析(例えば形態素解析)を行い、第1の所定件数以上の投稿情報に含まれる語を、新たな副関連キーワードとして特定する。更に、副関連キーワード生成部26は、特定した新たな副関連キーワードを含んだ新たな副関連キーワード情報を生成し、記憶部40内の副関連キーワードDB60に登録する(ステップS406)。その後、一連の動作が終了する。   On the other hand, if there is no unselected sub-related keyword information in step S402 (step S405: NO), the sub-related keyword generation unit 26 in the control unit 20 analyzes the post information extracted in step S356 of FIG. (For example, morphological analysis) is performed, and words included in the posting information of the first predetermined number or more are specified as new sub-related keywords. Further, the sub-related keyword generation unit 26 generates new sub-related keyword information including the specified new sub-related keyword, and registers it in the sub-related keyword DB 60 in the storage unit 40 (step S406). Thereafter, a series of operations ends.

追加される副関連キーワードを用いて抽出される投稿情報の件数が第2の所定数未満になった場合には、イベントの状況が変化すること等によって、その副関連キーワードとイベントとの関連性が低くなっているとみなすことができる。この場合、第2実施形態では、情報提供システム1内の情報提供サーバ10は、その副関連キーワードを含んだ副関連キーワード情報を副関連キーワードDB50から削除して、その後に当該副関連キーワードを含む投稿情報の抽出が実行されないようにすることにより、イベントに関連する情報を適正な範囲で提供することができる。   When the number of post information extracted using the added sub-related keyword is less than the second predetermined number, the relevance between the sub-related keyword and the event is changed due to a change in the event status, etc. Can be considered low. In this case, in the second embodiment, the information providing server 10 in the information providing system 1 deletes the sub related keyword information including the sub related keyword from the sub related keyword DB 50, and thereafter includes the sub related keyword. By preventing the posting information from being extracted, information related to the event can be provided in an appropriate range.

(3)第3実施形態
第1実施形態では、制御部20内の抽出終了制御部32は、クローラ情報毎の主関連キーワード及び副関連キーワードを含む投稿情報の抽出件数の合計数が第1の所定数未満である場合に、そのクローラ情報内の終了フラグを「1」に設定することで、その後に、当該クローラ情報に対応する投稿情報抽出及びキーワード記憶処理が実行されないようにした。
(3) Third Embodiment In the first embodiment, the extraction end control unit 32 in the control unit 20 has the first total number of extracted post information including the main related keyword and the sub related keyword for each crawler information. When the number is less than the predetermined number, the end flag in the crawler information is set to “1” so that the post information extraction and keyword storage processing corresponding to the crawler information is not executed thereafter.

これに対して、第3実施形態では、抽出終了制御部32は、クローラ情報毎の投稿情報の抽出の都度、主関連キーワード及び当該クローラ情報に対応する副関連キーワードを含む投稿情報の抽出件数の合計数を記憶部40に記憶しておく。更に、抽出終了制御部32は、合計数の推移が所定の減少傾向を示す場合に、クローラ情報内の終了フラグを「1」に設定する。ここで、所定の減少傾向とは、合計数が増減することなく漸減する場合、合計数が所定数以下となることが所定回数以上継続する場合等である。   On the other hand, in the third embodiment, each time the extraction end control unit 32 extracts post information for each crawler information, the extraction end control unit 32 determines the number of post information extracted including the main related keyword and the sub related keyword corresponding to the crawler information. The total number is stored in the storage unit 40. Further, the extraction end control unit 32 sets the end flag in the crawler information to “1” when the transition of the total number shows a predetermined decreasing tendency. Here, the predetermined decreasing trend is a case where the total number gradually decreases without increasing or decreasing, or a case where the total number continues to be equal to or less than the predetermined number or more.

第1実施形態と同様、副関連キーワードは随時追加されるため、主関連キーワード及び副関連キーワードの少なくとも何れかを含み、NGキーワードを含まない投稿情報は、徐々に増加することが想定される。このような想定にもかかわらず、主関連キーワード及び副関連キーワード毎の抽出件数の合計数が所定の減少傾向を示す場合には、イベントの状況が変化すること等によって、主関連キーワード及び副関連キーワードとイベントとの関連性が低くなっているとみなすことができる。この場合、第3実施形態では、情報提供サーバ10は、クローラ情報内の終了フラグを「1」に設定することで、その後に、当該クローラ情報に対応する投稿情報抽出及びキーワード記憶処理が実行されないようにし、イベントに関連する情報を適正な範囲で提供することができる。   As in the first embodiment, since sub-related keywords are added at any time, it is assumed that post information including at least one of the main related keywords and the sub-related keywords and not including the NG keyword gradually increases. Despite this assumption, if the total number of extracted items for each of the main related keywords and sub related keywords shows a certain downward trend, the main related keywords and sub related It can be considered that the relevance between the keyword and the event is low. In this case, in the third embodiment, the information providing server 10 sets the end flag in the crawler information to “1”, and thereafter, the post information extraction and the keyword storage processing corresponding to the crawler information are not executed. Thus, information related to the event can be provided in an appropriate range.

(4)第4実施形態
第2実施形態では、制御部20内の抽出終了制御部32は、副関連キーワードを含む投稿情報の抽出件数が第2の所定数未満である場合に、その副関連キーワードを含んだ副関連キーワード情報を副関連キーワードDB50から削除して、その後に当該副関連キーワードを含む投稿情報の抽出が実行されないようにした。
(4) Fourth Embodiment In the second embodiment, the extraction end control unit 32 in the control unit 20 determines that the sub-relevance when the number of posts of post information including the sub-related keyword is less than the second predetermined number. The sub-related keyword information including the keyword is deleted from the sub-related keyword DB 50 so that the post information including the sub-related keyword is not extracted thereafter.

これに対して、第4実施形態では、抽出終了制御部32は、クローラ情報毎の投稿情報の抽出の都度、当該クローラ情報に対応する副関連キーワード毎に、その副関連キーワードを含む投稿情報の抽出件数の合計数を記憶部40に記憶しておく。更に、抽出終了制御部32は、合計数の推移が所定の減少傾向を示す場合に副関連キーワードを副関連キーワードDB50から削除する。ここで、所定の減少傾向とは、第3実施形態と同様、合計数が増減することなく漸減する場合、合計数が所定数以下となることが所定回数以上継続する場合等である。   On the other hand, in the fourth embodiment, the extraction end control unit 32 extracts post information including the sub-related keyword for each sub-related keyword corresponding to the crawler information every time the post information is extracted for each crawler information. The total number of extracted cases is stored in the storage unit 40. Further, the extraction end control unit 32 deletes the secondary related keyword from the secondary related keyword DB 50 when the transition of the total number shows a predetermined decreasing tendency. Here, as in the third embodiment, the predetermined decreasing trend is when the total number gradually decreases without increasing or decreasing, or when the total number continues to be equal to or less than the predetermined number.

追加される副関連キーワードを用いて抽出される投稿情報の件数が所定の減少傾向を示す場合には、イベントの状況が変化すること等によって、その副関連キーワードとイベントとの関連性が低くなっているとみなすことができる。この場合、第4実施形態では、情報提供システム1内の情報提供サーバ10は、その副関連キーワードを含んだ副関連キーワード情報を副関連キーワードDB50から削除して、その後に当該副関連キーワードを含む投稿情報の抽出が実行されないようにすることにより、イベントに関連する情報を適正な範囲で提供することができる。   When the number of post information extracted using the added sub-related keyword shows a predetermined decreasing trend, the relevance between the sub-related keyword and the event becomes low due to a change in the event status, etc. Can be considered. In this case, in the fourth embodiment, the information providing server 10 in the information providing system 1 deletes the sub related keyword information including the sub related keyword from the sub related keyword DB 50 and then includes the sub related keyword. By preventing the posting information from being extracted, information related to the event can be provided in an appropriate range.

(5)第5実施形態
第1実施形態では、情報提供サーバ10は、イベント通知サーバ300からのイベント発生情報を受信した場合に、投稿情報の抽出及びキーワード記憶処理を開始した。これに対し、第5実施形態では、情報提供サーバ10は、イベント発生情報を受信していなくても、イベントである災害の発生が推定される場合に、投稿情報の抽出及びキーワード記憶処理を開始する。
(5) Fifth Embodiment In the first embodiment, when the information providing server 10 receives event occurrence information from the event notification server 300, the information providing server 10 starts extracting post information and keyword storage processing. On the other hand, in the fifth embodiment, the information providing server 10 starts the extraction of posted information and the keyword storage process when the occurrence of a disaster as an event is estimated even if the event occurrence information is not received. To do.

具体的には、記憶部40には、予め、イベント発生推定用のキーワードが記憶される。イベント発生推定用のキーワードは、イベントとの関連が高いと見なされる文字列であり、第2の関連キーワードに対応する。イベント発生推定用のキーワードは、イベントの種別毎に用意されており、イベントタイプが付加されている。   Specifically, a keyword for event occurrence estimation is stored in the storage unit 40 in advance. The event occurrence estimation keyword is a character string that is considered highly related to the event, and corresponds to the second related keyword. An event occurrence estimation keyword is prepared for each event type, and an event type is added.

制御部20内のイベント登録部22は、イベント発生推定用のキーワードを1つずつ選択する。次に、イベント登録部22は、端末装置100によって送信され、投稿サーバ400に記憶された投稿情報のうち、選択したイベント発生推定用のキーワードを投稿情報文字列に含む投稿情報を抽出する。次に、イベント登録部22は、抽出された投稿情報の件数をカウントし、その件数が第3の所定数以上である場合に、選択したイベント発生推定用のキーワードに付加されているイベントタイプが示す種別のイベントが発生したと推定する。   The event registration unit 22 in the control unit 20 selects keywords for event occurrence estimation one by one. Next, the event registration unit 22 extracts post information including the selected event occurrence estimation keyword in the post information character string from the post information transmitted by the terminal device 100 and stored in the post server 400. Next, the event registration unit 22 counts the number of extracted pieces of posted information, and if the number is equal to or more than a third predetermined number, the event type added to the selected event occurrence estimation keyword is Presume that an event of the indicated type has occurred.

イベント発生が推定された後、イベント登録部22は、クローラIDを生成し、イベント情報を生成する。但し、第1実施形態と異なり、イベント登録部22は、抽出された投稿情報を解析し、その解析結果から得られる適切な情報を、イベント情報内のイベント日時、イベント位置情報及びイベント情報文字列に設定する。例えば、イベント登録部22は、イベント日時に現在の日時を設定する。また、イベント登録部22は、イベント位置情報に、抽出した投稿情報のうち、所定数以上の投稿情報に含まれる地名に対応する領域の情報を設定する。また、イベント登録部22は、イベント情報文字列にイベント発生推定用のキーワードの文字列、所定数以上の投稿情報内の投稿情報文字列に含まれる語の文字列等を設定する。   After the event occurrence is estimated, the event registration unit 22 generates a crawler ID and generates event information. However, unlike the first embodiment, the event registration unit 22 analyzes the extracted post information, and displays the appropriate information obtained from the analysis result as the event date and time, event position information, and event information character string in the event information. Set to. For example, the event registration unit 22 sets the current date and time as the event date and time. Moreover, the event registration part 22 sets the information of the area | region corresponding to the place name contained in the predetermined number or more of posting information among the extracted posting information to event position information. In addition, the event registration unit 22 sets a character string of a keyword for estimating the occurrence of an event, a character string of words included in a post information character string in a predetermined number or more of post information, and the like in the event information character string.

その後は、第1実施形態と同様、クローラ情報登録部24によるクローラ情報の生成、副関連キーワード生成部26による副関連キーワード情報の生成、登録が行われ、更に、図11乃至図13に示す、副関連キーワード生成部26、投稿情報抽出部28、投稿情報提供部30及び抽出終了制御部32による投稿情報抽出・キーワード記憶処理が行われる。   Thereafter, as in the first embodiment, the crawler information registration unit 24 generates crawler information, the sub-related keyword information generation unit 26 generates and registers sub-related keyword information, and further, as shown in FIGS. Post information extraction / keyword storage processing is performed by the sub-related keyword generation unit 26, the post information extraction unit 28, the post information provision unit 30, and the extraction end control unit 32.

このように、第5実施形態では、イベントとの関連性が高いと見なされるイベント発生推定用のキーワードを含む投稿情報の抽出件数が所定数以上である場合には、イベントの発生が推定され、投稿情報抽出・キーワード記憶処理が行われる。従って、イベント発生情報が受信されないためにイベントの発生が確実ではないものの、発生が推定される場合には、投稿情報抽出・キーワード記憶処理が行われることになり、利用者に対してイベントと関連性の高い情報を迅速に提供することが可能となる。   Thus, in the fifth embodiment, when the number of extracted post information including a keyword for event occurrence estimation that is considered highly relevant to the event is a predetermined number or more, the occurrence of the event is estimated, Posting information extraction / keyword storage processing is performed. Therefore, the event occurrence information is not received because the event occurrence information is not received, but when the occurrence is estimated, the post information extraction / keyword storage processing is performed, and the event is related to the user. It is possible to provide highly reliable information quickly.

(6)その他の実施形態
以上、本発明の実施形態について説明したが、本発明は実施形態によって限定されるものではない。本発明は、実施形態及び以下の変形例を適宜組み合わせたものも含み、また、それらと均等なものも含む。
(6) Other Embodiments Although the embodiment of the present invention has been described above, the present invention is not limited to the embodiment. The present invention includes a combination of the embodiments and the following modifications as appropriate, and includes equivalents thereof.

例えば、上述した実施形態では、投稿情報に、当該投稿情報を送信した端末装置100の位置を示す投稿位置情報が含まれるものとして説明したが、投稿位置情報が含まれていない場合には、図12のステップS256において、投稿情報抽出部28は、投稿サーバ400に記憶されている投稿情報内の投稿情報文字列について形態素解析等の解析を行って地域名等を特定し、その地域名等に対応する領域の識別情報(JISコード等)を投稿位置情報として投稿情報に設定するようにしてもよい。   For example, in the above-described embodiment, the post information has been described as including the post position information indicating the position of the terminal device 100 that transmitted the post information. In step S256, the posting information extraction unit 28 performs analysis such as morphological analysis on the posting information character string in the posting information stored in the posting server 400 to identify a region name, and the like. The identification information (JIS code or the like) of the corresponding area may be set in the posting information as posting position information.

また、例えば、上述した実施形態では、予め副関連キーワードが用意されており、1回目の投稿情報の抽出から副関連キーワードを用いたが、初期状態では、副関連キーワードがなく、1回目では副関連キーワードを用いない投稿情報の抽出が行われるようにしてもよい。更には、副関連キーワード生成部26が、その1回目の投稿情報の抽出で得られた投稿情報から副関連キーワードを生成して、2回目以降の投稿情報の抽出に用いられるようにしてもよい。   Further, for example, in the above-described embodiment, the sub-related keyword is prepared in advance, and the sub-related keyword is used from the first posting information extraction. However, in the initial state, there is no sub-related keyword, and the sub-related keyword is used in the first time. Posting information may be extracted without using related keywords. Further, the sub-related keyword generation unit 26 may generate a sub-related keyword from the post information obtained by the first post information extraction, and may be used for the second and subsequent post information extraction. .

また、例えば、上述した実施形態では、抽出される投稿情報の件数や減少傾向に応じて、投稿情報抽出及びキーワード記憶処理を終了したり、所定の副関連キーワードを用いた投稿情報抽出及びキーワード記憶処理を終了した。しかし、抽出される投稿情報の件数や減少傾向以外にも、投稿情報の抽出結果が投稿情報抽出及びキーワード記憶処理を終了すべき所定の条件を満たした場合に、投稿情報抽出及びキーワード記憶処理を終了するようにしてもよい。   Further, for example, in the above-described embodiment, the posting information extraction and the keyword storage processing are terminated or the posting information extraction and the keyword storage using a predetermined sub-related keyword are performed according to the number of pieces of the posting information to be extracted and the decreasing tendency. Finished processing. However, in addition to the number of posted information items to be extracted and a decreasing trend, when the post information extraction result satisfies a predetermined condition for terminating the post information extraction and keyword storage processing, the post information extraction and keyword storage processing is performed. You may make it complete | finish.

また、例えば、上述した実施形態では、所定のイベントが災害である場合について説明したが、災害以外のイベントに関する投稿情報を提供する場合にも、同様に本発明を適用することができる。   For example, in the above-described embodiment, the case where the predetermined event is a disaster has been described. However, the present invention can be similarly applied to the case where post information related to an event other than a disaster is provided.

また、情報提供システム1の構成は、図1に示すものに限定されない。例えば、情報提供サーバ10と投稿サーバ400とが1つのサーバによって構成されていてもよい。また、例えば、情報提供サーバ10の機能を実現するためのプログラムは、CD−ROM等の記憶媒体に記憶されてもよいし、通信ネットワーク250を介してダウンロードされてもよい。   Further, the configuration of the information providing system 1 is not limited to that shown in FIG. For example, the information providing server 10 and the posting server 400 may be configured by a single server. Further, for example, a program for realizing the function of the information providing server 10 may be stored in a storage medium such as a CD-ROM or downloaded via the communication network 250.

1 情報提供システム
10 情報提供サーバ
20 制御部
22 イベント登録部
24 クローラ情報登録部
26 副関連キーワード生成部
28 投稿情報抽出部
30 投稿情報提供部
32 抽出終了制御部
34 キーワード編集部
40 記憶部
60 通信部
70 操作部
100−1、100−2、100−3 端末装置
200−1、200−2 無線基地局
250 通信ネットワーク
300 イベントサーバ
400 投稿サーバ
DESCRIPTION OF SYMBOLS 1 Information provision system 10 Information provision server 20 Control part 22 Event registration part 24 Crawler information registration part 26 Secondary related keyword production | generation part 28 Posting information extraction part 30 Posting information provision part 32 Extraction completion control part 34 Keyword editing part 40 Storage part 60 Communication Unit 70 Operation unit 100-1, 100-2, 100-3 Terminal device 200-1, 200-2 Wireless base station 250 Communication network 300 Event server 400 Posting server

Claims (10)

状況が変化する所定のイベントに関連して発生する情報を提供する情報提供装置であって、
前記所定のイベントとの関連性が高いと見なされる主関連キーワード及び副関連キーワードを記憶する第1の記憶手段と、
所定のタイミング毎に、所定期間内に発生する情報のうち、前記第1の記憶手段に記憶された前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含む情報を抽出し、その抽出した情報のうち、第1の所定数以上の情報に含まれるキーワードを副関連キーワードとして前記第1の記憶手段に記憶させる抽出及び記憶処理を繰り返す抽出手段と、
前記所定期間内に発生する情報のうち、前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含む情報の抽出件数が第2の所定数未満となる条件を満たした場合に、前記副関連キーワードを前記抽出手段による情報の抽出の際の適用対象から除外する処理を行う抽出終了制御手段と、
を備えることを特徴とする情報提供装置。
An information providing apparatus that provides information that occurs in association with a predetermined event in which the situation changes,
First storage means for storing a main related keyword and a sub related keyword that are considered to be highly related to the predetermined event;
Information that includes at least one of the main related keyword and the sub related keyword stored in the first storage means is extracted from information generated within a predetermined period at each predetermined timing, and the extracted information An extraction unit that repeats the extraction and storage process of storing the keyword included in the information of the first predetermined number or more as a sub-related keyword in the first storage unit,
Of the information generated within the predetermined period, the sub-related keyword is satisfied when the number of extracted information including at least one of the main related keyword and the sub-related keyword is less than a second predetermined number. Extraction termination control means for performing processing to exclude the information from the application target when extracting information by the extraction means,
An information providing apparatus comprising:
前記抽出終了制御手段は、前記所定期間内に発生する情報のうち、前記副関連キーワードを含む情報の抽出件数が第3の所定数未満となる条件を満たした場合に、その条件を満たす前記副関連キーワードを前記抽出手段による情報の抽出の際の適用対象から除外する処理を行うことを特徴とする請求項1に記載の情報提供装置。 The extraction end control means, when the condition that the number of extracted information including the sub-related keyword is less than a third predetermined number among the information generated within the predetermined period is satisfied, satisfies the condition. The information providing apparatus according to claim 1, wherein a process of excluding a related keyword from an application target when information is extracted by the extraction unit is performed . 前記抽出終了制御手段は、前記所定のタイミング毎に抽出される前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含む情報の抽出件数が所定の減少傾向を示す場合に、前記副関連キーワードを情報の抽出の際の適用対象から除外することを特徴とする請求項1に記載の情報提供装置。 The extraction end control unit, when extracting the number of information including at least one of the main relevant keywords and the sub related keywords are extracted for each of the predetermined timing represents a predetermined downward trend, the secondary related keywords The information providing apparatus according to claim 1, wherein the information providing apparatus is excluded from an application target when extracting information. 前記抽出終了制御手段は、前記所定のタイミング毎に抽出される前記副関連キーワードを含む情報の抽出件数が所定の減少傾向を示す場合に、前記副関連キーワードを情報の抽出の際の適用対象から除外することを特徴とする請求項1に記載の情報提供装置。 The extraction end control means, when the number of extracted information including the sub-related keyword extracted at each predetermined timing shows a predetermined decreasing tendency, the sub-related keyword is applied from the application target at the time of information extraction The information providing apparatus according to claim 1, wherein the information providing apparatus is excluded. 前記所定のイベントとの関連性が低いと見なされる非関連キーワードを記憶する第2の記憶手段を備え、
前記抽出手段は、前記第1の記憶手段に記憶された前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含み、且つ、前記第2の記憶手段に記憶された前記非関連キーワードの何れも含まない前記情報を抽出することを特徴とする請求項1乃至4の何れかに記載の情報提供装置。
Second storage means for storing unrelated keywords that are considered to be less relevant to the predetermined event;
The extraction means includes at least one of the main related keyword and the sub related keyword stored in the first storage means, and any of the unrelated keywords stored in the second storage means 5. The information providing apparatus according to claim 1, wherein the information not included is extracted.
前記所定のイベントは、発生する地域が特定されるイベントであり、
前記抽出対象の情報は、その情報に関連する位置を示す位置情報を含み、
前記抽出手段は、前記第1の記憶手段に記憶された前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含み、且つ、前記位置情報によって示される位置が前記所定のイベントが発生する地域に含まれる前記情報を抽出することを特徴とする請求項1乃至5の何れかに記載の情報提供装置。
The predetermined event is an event in which a region where the event occurs is specified,
The information to be extracted includes position information indicating a position related to the information,
The extraction unit includes at least one of the main related keyword and the sub related keyword stored in the first storage unit, and the position indicated by the position information is in an area where the predetermined event occurs. The information providing apparatus according to claim 1, wherein the information included is extracted.
前記所定のイベントが発生したことを示すイベント発生情報を受信する通知受信手段を備え、
前記抽出手段は、前記通知受信手段により前記イベント発生情報が受信された場合に、前記抽出及び記憶処理を開始することを特徴とする請求項1乃至6の何れかに記載の情報提供装置。
Notification receiving means for receiving event occurrence information indicating that the predetermined event has occurred,
The information providing apparatus according to claim 1 , wherein the extraction unit starts the extraction and storage process when the event occurrence information is received by the notification reception unit.
前記所定のイベントとの関連性が高いと見なされるイベント発生推定用キーワードを記憶する第3の記憶手段を備え、
前記抽出手段は、抽出対象の情報のうち、前記第3の記憶手段に記憶された前記イベント発生推定用キーワードを含む情報を抽出し、その抽出した情報の件数が第4の所定数以上である場合に、前記抽出及び記憶処理を開始することを特徴とする請求項1乃至7の何れかに記載の情報提供装置。
Third storage means for storing an event occurrence estimation keyword that is considered to be highly related to the predetermined event;
The extraction means extracts information including the event occurrence estimation keyword stored in the third storage means from the information to be extracted, and the number of pieces of the extracted information is a fourth predetermined number or more. The information providing apparatus according to claim 1 , wherein the extraction and storage processing is started.
状況が変化する所定のイベントに関連して発生する情報を提供する情報提供装置における情報提供方法であって、
前記所定のイベントとの関連性が高いと見なされる主関連キーワード及び副関連キーワードを記憶手段に記憶する第1の記憶ステップと、
所定のタイミング毎に、所定期間内に発生する情報のうち、前記記憶手段に記憶された前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含む情報を抽出し、その抽出した情報のうち、第1の所定数以上の情報に含まれるキーワードを副関連キーワードとして前記記憶手段に記憶させる抽出及び記憶処理を繰り返す抽出ステップと、
前記所定期間内に発生する情報のうち、前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含む情報の抽出件数が第2の所定数未満となる条件を満たした場合に、前記副関連キーワードを前記抽出ステップにおける情報の抽出の際の適用対象から除外する処理を行う抽出終了制御ステップと、
を含むことを特徴とする情報提供方法。
An information providing method in an information providing apparatus for providing information that occurs in association with a predetermined event in which the situation changes,
A first storage step of storing in the storage means a main related keyword and a sub related keyword that are considered to be highly related to the predetermined event;
At every predetermined timing, among the information generated within a predetermined time period, the extract information including at least one of the stored in the storage unit main related keywords and the secondary related keywords, among the extracted information, An extraction step of repeating extraction and storage processing for storing the keywords included in the information of the first predetermined number or more as sub-related keywords in the storage means;
Of the information generated within the predetermined period, the sub-related keyword is satisfied when the number of extracted information including at least one of the main related keyword and the sub-related keyword is less than a second predetermined number. An extraction end control step for performing processing for excluding the information from the application target at the time of extraction of information in the extraction step;
An information providing method comprising:
コンピュータを、
状況が変化する所定のイベントとの関連性が高いと見なされる主関連キーワード及び副関連キーワードを記憶する記憶手段、
所定のタイミング毎に、所定期間内に発生する情報のうち、前記記憶手段に記憶された前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含む情報を抽出し、その抽出した情報のうち、第1の所定数以上の情報に含まれるキーワードを副関連キーワードとして前記記憶手段に記憶させる抽出及び記憶処理を繰り返す抽出手段、
前記所定期間内に発生する情報のうち、前記主関連キーワード及び前記副関連キーワードの少なくとも何れかを含む情報の抽出件数が第2の所定数未満となる条件を満たした場合に、前記副関連キーワードを前記抽出手段による情報の抽出の際の適用対象から除外する処理を行う抽出終了制御手段、
として機能させることを特徴とする情報提供プログラム。
Computer
Storage means for storing a main related keyword and a sub related keyword that are considered highly relevant to a predetermined event whose situation changes;
At each predetermined timing, out of information generated within a predetermined period, information including at least one of the main related keyword and the sub related keyword stored in the storage unit is extracted, and among the extracted information , Extraction means for repeating the extraction and storage processing for storing the keywords included in the information of the first predetermined number or more as sub-related keywords in the storage means;
Of the information generated within the predetermined period, the sub-related keyword is satisfied when the number of extracted information including at least one of the main related keyword and the sub-related keyword is less than a second predetermined number. Extraction end control means for performing processing for excluding information from the application target when extracting information by the extraction means,
An information providing program characterized by functioning as
JP2012142391A 2012-06-25 2012-06-25 Information providing apparatus, information providing method, and information providing program Active JP5739843B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012142391A JP5739843B2 (en) 2012-06-25 2012-06-25 Information providing apparatus, information providing method, and information providing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012142391A JP5739843B2 (en) 2012-06-25 2012-06-25 Information providing apparatus, information providing method, and information providing program

Publications (2)

Publication Number Publication Date
JP2014006735A JP2014006735A (en) 2014-01-16
JP5739843B2 true JP5739843B2 (en) 2015-06-24

Family

ID=50104390

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012142391A Active JP5739843B2 (en) 2012-06-25 2012-06-25 Information providing apparatus, information providing method, and information providing program

Country Status (1)

Country Link
JP (1) JP5739843B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6369108B2 (en) 2014-04-18 2018-08-08 富士通株式会社 Event occurrence location estimation method, event occurrence location estimation program, and event occurrence location estimation apparatus
JP7091700B2 (en) * 2018-02-21 2022-06-28 富士通株式会社 Information processing program, message analysis program, information processing device and information processing method

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4154118B2 (en) * 2000-10-31 2008-09-24 株式会社リコー Related Word Selection Device, Method and Recording Medium, and Document Retrieval Device, Method and Recording Medium

Also Published As

Publication number Publication date
JP2014006735A (en) 2014-01-16

Similar Documents

Publication Publication Date Title
US10179291B2 (en) Session speech-to-text conversion
JP5221369B2 (en) Learning device for resource constrained devices
JP5488474B2 (en) PAIRING SYSTEM, PAIRING DEVICE, PAIRING DEVICE PROCESSING METHOD AND PROGRAM
CN107852770A (en) For Network finding and synchronous system
CN108205560B (en) Data synchronization method and device
US9680719B2 (en) Communication system, client terminal, and server
EP3779756A1 (en) Information processing device, information processing method, and program
CN106412078B (en) Accurate information method for pushing, device and system
JPWO2018186235A1 (en) Location popularity estimation system
US20220369925A1 (en) System and method for identifying a disease affected area
JP5739843B2 (en) Information providing apparatus, information providing method, and information providing program
JP2023134825A (en) Registration information output system, registration information output method and program
JP2017199225A (en) Device and method for selecting disaster information
JP5649619B2 (en) Information providing apparatus, information providing method, and information providing program
US9369848B2 (en) Information distribution apparatus, information distribution method and program
JP2014228645A (en) Determination device, determination method, determination program and map display system
JP6252315B2 (en) Location detection device, location detection program, and location detection method
JP5784475B2 (en) Information system and program
KR102506242B1 (en) Method, computer device, and computer program to pick and display messages in messaging-based social network service
CN110297818B (en) Method and device for constructing data warehouse
WO2015021908A1 (en) Method, apparatus and system for security verification
JP2015156912A (en) Game server, program for game server, and game system
JP6262123B2 (en) Information processing apparatus, program, and information processing method
JP2005309524A (en) Application server, presence information provision method, and program
JP2019211821A (en) Information processing apparatus, information processing method and program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140602

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150331

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150424

R150 Certificate of patent or registration of utility model

Ref document number: 5739843

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250