JP7091700B2 - Information processing program, message analysis program, information processing device and information processing method - Google Patents
Information processing program, message analysis program, information processing device and information processing method Download PDFInfo
- Publication number
- JP7091700B2 JP7091700B2 JP2018029175A JP2018029175A JP7091700B2 JP 7091700 B2 JP7091700 B2 JP 7091700B2 JP 2018029175 A JP2018029175 A JP 2018029175A JP 2018029175 A JP2018029175 A JP 2018029175A JP 7091700 B2 JP7091700 B2 JP 7091700B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- occurrence
- words
- predetermined
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、情報処理プログラム、メッセージ解析プログラム、情報処理装置及び情報処理方法に関する。 The present invention relates to an information processing program, a message analysis program, an information processing apparatus, and an information processing method.
例えば、Twitter等に投稿された内容を解析することで、特定の事象に関する情報を推定する事象推定システムの技術が普及している。事象推定システムでは、投稿された内容を解析して、例えば、災害に関する情報を解析することで、災害発生地域を特定できる。 For example, the technique of an event estimation system that estimates information about a specific event by analyzing the content posted on Twitter or the like is widespread. In the event estimation system, the posted content can be analyzed, and for example, the disaster occurrence area can be specified by analyzing the information about the disaster.
事象推定システムでは、例えば、Twitter等に投稿された内容を解析する際に、キーワードに基づいて特定の事象に関する情報を抽出することになる。しかしながら、事象推定システムでは、精度良く特定の事象に関する情報を取得するためには、特定の事象を把握するための適切なキーワードを選定する必要がある。 In the event estimation system, for example, when analyzing the content posted on Twitter or the like, information on a specific event is extracted based on the keyword. However, in the event estimation system, in order to acquire information about a specific event with high accuracy, it is necessary to select an appropriate keyword for grasping the specific event.
一つの側面では、特定の事象に関する情報を取得するのに適切なキーワードを選定できる情報処理プログラム等を提供することにある。 One aspect is to provide an information processing program or the like that can select appropriate keywords for acquiring information on a specific event.
一つの態様では、コンピュータに、所定期間における複数の投稿に含まれる所定のワードの出現回数を特定する処理を実行させる。更に、コンピュータに、特定した前記所定のワードの出現回数が所定の回数以上である場合に、前記所定のワードを含む投稿から、前記所定のワードとは異なる1または複数のワードを抽出する処理を実行させる。コンピュータに、抽出した前記1または複数のワードそれぞれの出現回数が、前記所定期間と異なる期間における出現回数と比較して特定の閾値以上多いか否かに応じて、前記1または複数のワードを出力する処理を実行させる。 In one embodiment, the computer is made to execute a process of specifying the number of occurrences of a predetermined word included in a plurality of posts in a predetermined period. Further, when the number of appearances of the specified predetermined word is equal to or greater than the predetermined number of times, the computer is subjected to a process of extracting one or a plurality of words different from the predetermined word from the posts containing the predetermined word. Let it run. The one or more words are output to the computer depending on whether or not the number of appearances of each of the extracted one or more words is more than a specific threshold value as compared with the number of appearances in a period different from the predetermined period. To execute the processing to be performed.
一つの側面として、特定の事象に関する情報を取得するのに適切なキーワードを選定できる。 One aspect is the ability to select appropriate keywords to obtain information about a particular event.
以下、図面に基づいて、本願の開示する情報処理プログラム等の実施例を詳細に説明する。尚、本実施例により、開示技術が限定されるものではない。また、以下に示す各実施例は、矛盾を起こさない範囲で適宜組み合わせても良い。 Hereinafter, examples of the information processing program and the like disclosed in the present application will be described in detail with reference to the drawings. The disclosed technique is not limited by the present embodiment. In addition, the examples shown below may be appropriately combined as long as they do not cause a contradiction.
図1は、本実施例の事象推定システム1の一例を示す説明図である。図1に示す事象推定システム1は、複数の端末装置2と、情報処理装置3と、通信網4とを有する。事象推定システム1は、例えば、ツイートの内容をAI(Artificial Intelligence)技術で解析し、解析結果に基づき、例えば、災害が発生している事例を推定するSSS(Social Sensor System)である。尚、事象推定システム1では、災害が発生している箇所を推定して地図上で表示するようにしても良い。複数の端末装置2は、通信網4と接続し、通信網4を通じてSNS(Social Network Service)等のサービスを享受するスマートフォン、タブレット端末やパソコン等の情報端末である。情報処理装置3は、例えば、通信網4と接続し、SNS内のツイート内の使用キーワードから事象を推定するコンピュータである。尚、SNSは、不特定多数の利用者の投稿が読めるTwitter等の投稿サービスが望ましいが、これに限定されるものではなく、例えば、特定多数の利用者の投稿が読めるフェイスブック等の投稿サービスでも良く、適宜変更可能である。
FIG. 1 is an explanatory diagram showing an example of the
図2は、情報処理装置3のハードウェア構成の一例を示す説明図である。図2に示す情報処理装置3は、通信装置11と、HDD(Hard Disk Drive)12と、ROM(Read Only Memory)13と、RAM(Random Access Memory)14と、CPU(Central Processing Unit)15と、バス16とを有する。通信装置11は、通信網4と通信接続する装置である。HDD12は、各種情報を記憶する記憶領域である。ROM13は、各種プログラム等の情報を記憶する記憶領域である。RAM14は、各種情報を記憶する記憶領域である。CPU15は、情報処理装置3全体を制御する。バス16は、通信装置11、HDD12、ROM13、RAM14及びCPU15との間でデータを送受信する通信線及び制御線等である。
FIG. 2 is an explanatory diagram showing an example of the hardware configuration of the
図3は、情報処理装置3の機能構成の一例を示す説明図である。図3に示す情報処理装置3は、制御部3Aと、記憶部3Bとを有する。制御部3Aは、例えば、CPU15に対応する。制御部3Aは、例えば、ROM13に格納された情報処理プログラムをRAM上14に展開し、RAM14上に展開された情報処理プログラムを情報処理プロセスとして実行することで、例えば、特定部21、抽出部22、比較部23、出力部24及び推定部25を機能として実行する。記憶部3Bは、例えば、HDD12、ROM13及びRAM14等に対応する。記憶部3Bは、キーワード記憶部31と、候補単語記憶部32とを有する。キーワード記憶部31は、例えば、親キーワード及び子キーワード等のキーワードを記憶する領域である。尚、親キーワードは、特定の事象を表現するツイートを抽出するための単語である。子キーワードは、親キーワードに加えて、特定の事象を表現するツイートの抽出を補助する単語である。候補単語記憶部32は、例えば、候補単語を記憶する領域である。尚、候補単語は、子キーワード候補の単語である。
FIG. 3 is an explanatory diagram showing an example of the functional configuration of the
特定部21は、単位時間当たりの親キーワードを含むツイートのツイート数をカウントし、ツイート数が平常時のツイート数のt倍に到達した場合にバースト発生と判定する。抽出部22は、バースト期間中に親キーワードを含むツイート群の文書に対して形態素解析を実行し、そのツイート群を単語分割する。抽出部22は、単語分割後、ツイート群に頻繁に出現する単語を出現回数毎にランキング化する。更に、抽出部22は、出現回数が上位N位までの単語を候補単語として抽出し、抽出した候補単語を候補単語記憶部32に記憶する。抽出部22は、今回のバースト期間の候補単語である第1の候補単語と、過去X回分のバースト期間の候補単語である第2の候補単語とを候補単語記憶部32から抽出する。
The
比較部23は、第1の候補単語と第2の候補単語とを比較する。比較部23は、第1の候補単語及び第2の候補単語の内、同一単語の候補単語が所定数M以上あるか否かを判定する。比較部23は、同一単語の候補単語が所定数M以上ある場合、所定数M以上の候補単語を子キーワードとして選定する。
The
出力部24は、選定した子キーワードを親キーワードに対応付けてキーワード記憶部32に記憶する。推定部25は、キーワード記憶部32に記憶中の親キーワード及び、親キーワードに対応する子キーワードを使用してツイート群から事例の内容を推定する。
The
図4は、親キーワードを含むツイート群から子キーワードを出力する際の処理の一例を示す説明図である。情報処理装置3は、親キーワード「停電」を含むツイート群のバーストを検知した場合、親キーワード「停電」を含む今回のバースト期間中のツイート群と、親キーワード「停電」を含む過去のX回分のバースト期間中のツイート群とを比較する。情報処理装置3は、比較結果に基づき、第1の候補単語である「ブレーカ」及び第2の候補単語である「ブレーカ」が所定数M以上の候補単語と判断し、「ブレーカ」を子キーワードとして出力する。
FIG. 4 is an explanatory diagram showing an example of processing when a child keyword is output from a tweet group including a parent keyword. When the
図5は、候補単語記憶部32の一例を示す説明図である。図5に示す候補単語記憶部32は、親キーワードを含むツイート群のバースト期間毎に管理し、候補単語と、候補単語の出現回数とを出現回数の昇順順位に対応付けて管理している。尚、候補単語は、第1の候補単語と、第2の候補単語とを有し、第1の候補単語は、今回のバースト期間中の候補単語であって、第2の候補単語は、過去X回のバースト期間中の候補単語である。制御部3Aは、候補単語記憶部32を参照し、親キーワードを含むバースト期間中の候補単語及び候補単語の出現回数及び、親キーワードを含む過去のバースト期間中の候補単語及び候補単語の出現回数を認識できる。比較部23は、図5に示す候補単語記憶部32を参照し、例えば、「大丈夫」、「震度」及び「停電」を子キーワードとして選定する。
FIG. 5 is an explanatory diagram showing an example of the candidate
図6は、出力処理に関わる情報処理装置3内の制御部3Aの処理動作の一例を示すフロー図である。図6において制御部3A内の特定部21は、SNS内に投稿されたツイート群から親キーワードを含むツイートを一定時間毎に収集する(ステップS11)。
FIG. 6 is a flow chart showing an example of the processing operation of the control unit 3A in the
特定部21は、単位時間内に取得した親キーワードを含むツイート数をカウントする(ステップS12)。特定部21は、親キーワードを含むツイート数が所定回数を超えたか否かを判定する(ステップS13)。尚、所定回数は、例えば、平常時のツイート数のt倍とする。特定部21は、親キーワードを含むツイート数が所定回数を超えた場合(ステップS13肯定)、親キーワードを含むツイート群のバースト発生と判断する(ステップS14)。制御部3Aは、バースト発生と判断した後、後述する図7に示す子キーワード選定処理を実行する(ステップS15)。尚、子キーワードは、親キーワードの事象を適切に推定するためのキーワードである。制御部3A内の出力部24は、子キーワード選定処理で選定された子キーワードを出力し(ステップS16)、図6に示す処理動作を終了する。制御部3Aは、出力された子キーワードをキーワード記憶部31に記憶する。特定部21は、ツイート数が所定回数を超えたのでない場合(ステップS13否定)、親キーワードを含むツイートを取得すべく、ステップS11に移行する。
The
その結果、制御部3A内の推定部25は、キーワード記憶部31に記憶中の親キーワードと、親キーワードに対応した子キーワードとを用いてツイート群から高精度に事例の内容を推定できる。
As a result, the
図7は、子キーワード選定処理に関わる情報処理装置3内の制御部3Aの処理動作の一例を示すフロー図である。図7において制御部3A内の抽出部22は、バースト期間の親キーワードのツイート群を含む文書を形態素解析し(ステップS21)、形態素解析後の文書を単語分割する(ステップS22)。
FIG. 7 is a flow chart showing an example of the processing operation of the control unit 3A in the
抽出部22は、単語毎の出現回数をカウントし(ステップS23)、出現回数が上位N位までの単語を今回の候補単語として候補単語記憶部32内に記憶する(ステップS24)。尚、候補単語記憶部32には、今回のバースト期間の候補単語の他に、過去に記憶済みの、出現回数が上位N位までの候補単語を記憶している。抽出部22は、今回のバースト期間の候補単語を第1の候補単語として候補単語記憶部32から抽出する(ステップS25)。更に、抽出部22は、過去のX回分の候補単語を第2の候補単語として候補単語記憶部32から抽出する(ステップS26)。
The
制御部3A内の比較部23は、第1の候補単語と第2の候補単語とを比較する(ステップS27)。比較部23は、第1の候補単語及び第2の候補単語の内、同一単語の候補単語が所定数以上あるか否かを判定する(ステップS28)。比較部23は、同一単語の候補単語が所定数以上ある場合(ステップS28肯定)、所定数以上の候補単語を子キーワードとして選定し(ステップS29)、図7に示す処理動作を終了する。制御部3Aは、同一単語の候補単語が所定数以上ない場合(ステップS28否定)、図7に示す処理動作を終了する。
The
制御部3Aは、今回のバースト期間内の上位N位までの候補単語と、過去X回分のバースト期間内の上位N位までの候補単語とを比較するため、例えば、言葉の変化に対応可能なキーワード抽出を実現できる。尚、N、X及びMは、事象や運用に応じて調整可能である。 The control unit 3A compares the candidate words up to the top N in the burst period of this time with the candidate words up to the top N in the burst period of the past X times, so that it can respond to changes in words, for example. Keyword extraction can be realized. Note that N, X and M can be adjusted according to the event and operation.
実施例1の情報処理装置3は、事象を推定する上での適切な子キーワードを選定できる。更に、情報処理装置3は、出現回数が上位の候補単語は、その事象を表す単語である可能性が高いため、過去X回の事例比較で、より適切な子キーワードを選定できる。更に、情報処理装置3は、過去X回の事例比較で時代によっての変化、Twitter独特の言葉遣いへの対応が可能となる。しかも、適切なキーワードを使用して事象を推定するため、事象の推定精度の向上を図る。
The
実施例1の情報処理装置3では、親キーワードを含むツイート群のバースト発生と検知された場合、親キーワードを含むツイート群から候補単語を抽出する。情報処理装置3は、候補単語それぞれの出現回数が、過去X回分のバースト期間における候補単語の出現回数と比較して所定数M以上か否かに応じて、候補単語を子キーワードとして出力する。その結果、過去X回の事例比較で出現回数が上位の候補単語を、事象を推定する上での適切な子キーワードとして選定し、事象の推定性の向上を図る。
In the
尚、上記実施例1の比較部23は、過去X回分のバースト期間の候補単語の出現回数を比較事例としたが、過去X回分のバースト期間に限定されるものではなく、出現回数が所定数未満の過去X回分のバースト未検知の期間でも良く、適宜変更可能である。
The
上記実施例1の比較部23は、第1の候補単語の出現回数及び第2の候補単語の出現回数に応じて出現回数上位の同一候補単語を子キーワードとして選定した。しかしながら、比較部23は、過去X回分のツイート群の候補単語の出現回数に対する、今回バースト期間の候補単語の出現回数の第1の率が、過去X回分のツイート群の親キーワードの出現回数に対する今回バースト期間の親キーワードの出現回数の第2の率と一致又は類似するか否かを判定する。比較部23は、第1の率が第2の率と一致又は類似する場合、当該候補単語を子キーワードとして出力しても良く、適宜変更可能である。
The
上記実施例1の比較部23は、第1の候補単語の出現回数及び第2の候補単語の出現回数に応じて出現回数上位の同一候補単語を子キーワードとして選定した。しかしながら、第1の候補単語及び第2の候補単語の出現回数に応じて子キーワードを選定しても良い。
The
比較部23は、候補単語の出現回数に応じて候補単語を出力、若しくは、候補単語の出現回数の増加傾向に応じて候補単語を出力しても良く、適宜変更可能である。
The
尚、上記実施例1の特定部21は、親キーワードを含むツイート数が平常時のツイート数のt倍の所定回数を超えた場合に親キーワードを含むツイート群のバースト発生と判断した。しかしながら、親キーワードを含むツイート数に限定されるものではなく、親キーワードの出現回数としても良く、適宜変更可能である。
The
上記実施例1の事象推定システムでは、親キーワード及び子キーワードを用いてツイート群から特定の事象を推定した。しかしながら、親キーワード及び子キーワードを含むツイート群から重要単語及び共起単語を抽出、重要単語及び共起単語を用いて特定の事象を推定しても良く、その実施の形態につき、実施例2として以下に説明する。尚、実施例1の事象推定システム1と同一の構成には同一符号を付すことで、その重複する構成及び動作の説明については省略する。
In the event estimation system of the first embodiment, a specific event was estimated from the tweet group using the parent keyword and the child keyword. However, important words and co-occurrence words may be extracted from a group of tweets including a parent keyword and a child keyword, and a specific event may be estimated using the important words and co-occurrence words. This will be described below. The same configuration as that of the
図8は、実施例2の情報処理装置3の機能構成の一例を示す説明図である。図8に示す情報処理装置3は、制御部3Cと、記憶部3Dとを有する。制御部3Cは、例えば、CPU15に対応する。制御部3Cは、例えば、ROM13に格納された情報処理プログラムをRAM上14に展開し、RAM14上に展開された情報処理プログラムを情報処理プロセスとして実行することで、例えば、特定部41、抽出部42、重要単語特定部43、共起単語特定部44、出力部45及び推定部46を機能として実行する。記憶部3Dは、例えば、HDD12、ROM13及びRAM14等に対応する。
FIG. 8 is an explanatory diagram showing an example of the functional configuration of the
記憶部3Dは、キーワード記憶部51と、重要単語記憶部52と、共起単語記憶部53とを有する。キーワード記憶部51は、例えば、親キーワード及び子キーワード等のキーワードを記憶する領域である。重要単語記憶部52は、例えば、重要単語を記憶する領域である。共起単語記憶部53は、例えば、共起単語を記憶する領域である。
The storage unit 3D has a
特定部41は、キーワード等の一定の条件で一定時間毎にツイートを収集する。特定部41は、一定条件のツイート群のバースト発生を検知する。尚、一定条件のツイート群のバースト発生とは、例えば、所定のワードが含まれるメッセージ発信の一時的な増加である。抽出部42は、バースト期間中の現在ツイート群を含む第1の文書を取得する。更に、抽出部42は、過去の平常時のツイート群の内、対象条件に適合した比較対象ツイート群を含む第2の文書を取得する。尚、対象条件は、例えば、日単位、時間単位、曜日単位、時間帯単位やツイート数単位でツイート群から比較対象ツイート群を抽出するための条件である。また、対象条件は、バースト期間の内外の期間の比較対象ツイート群を抽出するための条件である。日単位の抽出条件は、バーストを検知した日のツイート群と比較する場合、過去D日分のツイート群を比較対象とし、例えば、コンサートイベント等の事象を日単位で区別する場合に適している。時間単位の抽出条件は、バーストを検知した時間Hの過去のツイート群と比較する場合、過去D×H時間分のツイート群を比較対象とし、例えば、渋滞等の事象が時間単位で区別する場合に適している。曜日単位の抽出条件は、バーストを検知した曜日の過去のツイート群を比較対象とし、例えば、列車遅延等の曜日特性の影響が大きい事象を区別する場合に適している。時間帯単位の抽出条件は、バーストを検知した時間帯の過去のツイート群を比較対象とし、例えば、台風時の通勤状況等の時間帯の影響が大きい事象を区別する場合に適している。ツイート数単位の抽出条件は、バーストを検知した間のツイート数と同数の過去のツイート群を比較対象とし、例えば、水道管破裂等の一般的な事象ではなく、平常時は頻繁に投稿されず、十分なツイート数が得られない事象を区別する場合に適している。
The
重要単語特定部43は、現在のツイート群を含む第1の文書及び比較対象ツイート群を含む第2の文書を形態素解析して単語分割する。重要単語特定部43は、(数1)、(数2)及び(数3)を使用して、単語毎にTF-IDF値を算出する。重要単語特定部43は、上位TF-IDF値の単語を重要単語として重要単語記憶部52に記憶する。
The important
尚、(数3)に使用する単語種別の補正値は、重要単語であるにも関わらず、IDF値が低い場合、例えば、普段から数が少ないものの、出現自体はしており、バースト時に多く出現する単語に適用する際の補正値である。補正値は、場所、固有名詞、動詞、形容詞(状態)等の知りたい情報に応じて調整しても良い。例えば、場所、固有名詞及び状態を知りたい場合は、補正値として「場所」を1、「固有名詞」を1、「動詞」を0、「形容詞」を0.5に設定する。つまり、補正値が大きくなるに連れてTF-IDF値が上位となる。 In addition, the correction value of the word type used in (Equation 3) is an important word, but when the IDF value is low, for example, although the number is small from usual, it appears itself and is large at the time of burst. This is a correction value when applied to the words that appear. The correction value may be adjusted according to the information to be known such as a place, a proper noun, a verb, and an adjective (state). For example, if you want to know the place, proper noun and state, set "place" to 1, "proper noun" to 1, "verb" to 0, and "adjective" to 0.5 as correction values. That is, as the correction value increases, the TF-IDF value becomes higher.
共起単語特定部44は、現在のツイート群を含む第1の文書では、TF-IDF値が高くなる単語ほど、その事象を表す重要な単語となる。共起単語特定部44は、第1の文書に対して1ツイート単位でTF-IDF値上位の単語、すなわち重要単語と共起する共起単語を特定し、重要単語の共起単語の共起回数をカウントする。共起単語特定部44は、重要単語の共起回数が上位の共起単語を共起単語記憶部53に記憶する。
In the first document including the current tweet group, the co-occurrence
出力部45は、重要単語記憶部52に記憶中の重要単語と、共起単語記憶部53に記憶中の重要単語に対応した共起単語との組合せを推定部46に出力する。推定部46は、重要単語及び共起単語の組合せに応じて事例を推定する。
The
図9は、鹿児島で地震が発生した際のキーワード「地震」を含むツイート群から事象に関わる単語組合せの一例を示す説明図である。重要単語特定部43は、「地震」を含むツイート群からTF-IDF上位の重要単語「鹿児島」を特定する。更に、共起単語特定部44は、「地震」を含む今回のツイート群及び、「地震」を含む過去のツイート群から重要単語「鹿児島」に共起する単語の内、出現回数上位の共起単語「震度5強」、「大きい」及び「震源地」を特定する。そして、推定部46は、重要単語「鹿児島」、共起単語「震度5強」、「大きい」及び「震源地」の組合せで「鹿児島で震度5強の地震が発生した」との事象を推定する。
FIG. 9 is an explanatory diagram showing an example of a word combination related to an event from a group of tweets including the keyword “earthquake” when an earthquake occurs in Kagoshima. The important
図10は、対象条件の一例を示す説明図である。制御部3C内の抽出部42は、過去のツイート群から時間帯単位の対象条件に適合した比較対象ツイート群を抽出する。図10に示す対象条件は、時間帯単位の抽出条件である。抽出部42は、今回のバースト期間のツイート群が8月3日の10時~18時の時間帯で対象条件が時間帯単位とした場合、例えば、過去の8月2日、8月1日、7月31日…の10時~18時の時間帯のツイート群を比較対象ツイート群として過去のツイート群から抽出する。
FIG. 10 is an explanatory diagram showing an example of the target condition. The
図11は、現在ツイート群(鹿児島で地震が発生した際のツイート群)及び比較対象ツイート群(過去の平常時の地震に関するツイート群)に関わる重要単語の一例を示す説明図である。現在ツイート群は、今回のバースト期間のツイート群であって、鹿児島で地震が発生した際のツイート群である。比較対象ツイート群は、抽出部42で抽出した過去の平常時の地震に関するツイート群である。制御部3C内の重要単語特定部43は、今回のツイート群の第1の文書及び比較対象ツイート群の第2の文書を形態素解析して単語分割する。更に、重要単語特定部43は、分割単語毎にTF-IDF値を算出し、上位TF-IDF値の単語を重要単語として抽出する。
FIG. 11 is an explanatory diagram showing an example of important words related to the current tweet group (tweet group when an earthquake occurred in Kagoshima) and the comparison target tweet group (tweet group related to past normal earthquakes). Currently, the tweet group is the tweet group during this burst period, and is the tweet group when the earthquake occurred in Kagoshima. The comparison target tweet group is a tweet group related to past normal earthquakes extracted by the
重要単語特定部43は、現在ツイート群及び比較対象ツイート群の上位TF-IDFの重要単語として、図11に示すように、第1位が「鹿児島」、第2位が「停電」、第3位が「土砂崩れ」とランキング化して重要単語記憶部52に記憶している。図11に示す重要単語は、地震発生時に共通して現れる単語よりも、場所やその地震発生時特有の単語がTF-IDF上位に出現しやすくなる傾向にある。
As shown in FIG. 11, the important
図12は、鹿児島で地震が発生した際のツイート群の重要単語に関わる共起単語毎の出現回数の一例を示す説明図である。制御部3C内の共起単語特定部44は、今回の現在ツイート群から重要単語の共起単語を特定する。そして、共起単語特定部44は、重要単語毎の共起単語の出現回数である共起回数をカウントする。共起単語特定部44は、図12に示すように、例えば、重要単語「鹿児島」の共起単語として、「震源地」の共起回数が2回、「土砂崩れ」の共起回数が2回、「停電」の共起回数が1回として共起単語記憶部53に記憶する。
FIG. 12 is an explanatory diagram showing an example of the number of occurrences of each co-occurrence word related to an important word in a tweet group when an earthquake occurs in Kagoshima. The co-occurrence
図13は、渋滞時のツイート群から事象推定の一例を示す説明図である。重要単語特定部43は、キーワードが「渋滞」で、重要単語「基山」、「亀山」及び「一宮」と特定したとする。また、共起単語特定部44は、重要単語「基山」の共起単語が「付近」、「上り」、「下り」及び「事故」、重要単語「亀山」の共起単語が「付近」、「IC」、「上り」及び「下り」、重要単語「一宮」の共起単語が「付近」、「IC」及び「上り」と特定したとする。推定部46は、これら重要単語及び共起単語の組合せから「基山、亀山で上り下り渋滞、一宮で上り渋滞、また、事故が発生」との事例を推定できる。
FIG. 13 is an explanatory diagram showing an example of event estimation from a group of tweets during a traffic jam. It is assumed that the important
図14は、渋滞時のツイート群から事象推定の一例を示す説明図である。重要単語特定部43は、キーワードが「渋滞」で、重要単語が「アクアライン」、「木更津」及び「帰宅」と特定したとする。更に、共起単語特定部44は、重要単語「アクアライン」の共起単語が「時間」、「上り」及び「帰り」、重要単語「木更津」の共起単語が「上り」、「IC」及び「付近」、重要単語「帰宅」の共起単語が「時間」と特定したとする。推定部46は、これら重要単語及び共起単語の組合せから「アクアライン上り、木更津付近で、帰宅時間に渋滞が発生」との事例を推定できる。
FIG. 14 is an explanatory diagram showing an example of event estimation from a group of tweets during a traffic jam. It is assumed that the important
図15は、鹿児島で地震が発生した際のツイート群から事象推定の一例を示す説明図である。重要単語特定部43は、キーワードが「地震」、重要単語が「鹿児島」、「停電」、「土砂崩れ」及び「雨」と特定したとする。更に、共起単語特定部44は、重要単語「鹿児島」の共起単語が「震度」、「九州」、「大丈夫」、「心配」、「停電」及び「震源」、重要単語「停電」の共起単語が「鹿児島」、「九州」及び「南」と特定したとする。更に、共起単語特定部44は、重要単語「土砂崩れ」の共起単語が「九州」、「鹿児島」及び「心配」、重要単語「雨」の共起単語が「九州」、「大丈夫」、「鹿児島」及び「 心配」と特定したとする。推定部46は、これら重要単語及び共起単語の組合せから「鹿児島を震源とした地震が発生、停電も発生、雨も重なり土砂崩れの心配」との事例を推定できる。
FIG. 15 is an explanatory diagram showing an example of event estimation from a group of tweets when an earthquake occurs in Kagoshima. It is assumed that the important
図16は、地震義援金を募集した際のツイート群から事象推定の一例を示す説明図である。重要単語特定部43は、キーワードが「地震」、重要単語が「スマ」、「支援」、「義援金」及び「応援」と特定したとする。更に、共起単語特定部44は、重要単語「スマ」の共起単語が「復興」、「地震」、「東日本」、「熊本」及び「大震災」、重要単語の「支援」が「復興」、「東日本」、「大震災」、「熊本」及び「地震」と仮定する。更に、重要単語「義援金」の共起単語が「復興」、「熊本」、「地震」、「東日本」及び「お願い」、重要単語「応援」の共起単語が「復興」、「 大震災」、「東日本」、「熊本」及び「地震」と特定したとする。推定部46は、これら重要単語及び共起単語の組合せから「地震が発生したわけではなく、熊本・東日本における震災に対する支援」との事例を推定できる。
FIG. 16 is an explanatory diagram showing an example of event estimation from a group of tweets when soliciting earthquake relief funds. It is assumed that the important
図17は、北海道北見市で停電を発生した際のツイート群から事象推定の一例を示す説明図である。重要単語特定部43は、キーワードが「停電」、重要単語が「雷」、「北見」、「一瞬」及び「信号」と特定したとする。更に、共起単語特定部44は、重要単語「雷」の共起単語が「笑」及び、「北見」、重要単語「北見」の共起単語が「市」、「情報」及び「笑」、重要単語「一瞬」の共起単語が「雷」、「 笑」及び「電気」、重要単語「信号」の共起単語が「電気」、「中」、「家」及び「復活」と特定したとする。推定部46は、これら重要単語及び共起単語の組合せから「北海道北見市で雷が原因の停電が発生し、瞬間的な停電で、信号等も影響を受けた」との事例を推定できる。
FIG. 17 is an explanatory diagram showing an example of event estimation from a group of tweets when a power failure occurs in Kitami City, Hokkaido. It is assumed that the important
図18は、神奈川県横浜市で停電を発生した際のツイート群から事象推定の一例を示す説明図である。重要単語特定部43は、キーワードが「停電」、重要単語が「中」、「横浜」及び「うち」と特定したとする。更に、共起単語特定部44は、重要単語「中」の共起単語が「市」、「区」及び「横浜」、重要単語「横浜」の共起単語が「中」、「市」及び「区」、重要単語「うち」の共起単語が「近所」及び「一帯」と特定したとする。推定部46は、重要単語及び共起単語の組合せから「横浜市中区で停電が発生」との事例を推定できる。
FIG. 18 is an explanatory diagram showing an example of event estimation from a group of tweets when a power failure occurs in Yokohama City, Kanagawa Prefecture. It is assumed that the important
図19は、第1の推定処理に関わる情報処理装置3内の制御部3Cの処理動作の一例を示すフロー図である。図19において制御部3C内の特定部41は、SNSに投稿されたツイートから一定条件のツイートを収集する(ステップS31)。特定部41は、単位時間内の一定条件のツイート数をカウントする(ステップS32)。特定部41は、一定条件のツイート数が所定回数を超えたか否かを判定する(ステップS33)。尚、所定回数は、例えば、平常時のツイート数のt倍とする。特定部41は、一定条件のツイート数が所定回数を超えた場合(ステップS33肯定)、メッセージ発信の一時的な増加、すなわち一定条件のツイート群のバートス発生と判断する(ステップS34)。制御部3Cは、図20に示す第1の出力処理を実行する(ステップS35)。
FIG. 19 is a flow chart showing an example of the processing operation of the
制御部3C内の推定部46は、第1の出力処理を実行した後、重要単語と共起単語との組み合わせに応じて事象を推定し(ステップS36)、図19に示す処理動作を終了する。推定部46は、一定条件のツイート数が所定回数を超えなかった場合(ステップS33否定)、一定条件のツイートを取得すべく、ステップS31に移行する。
After executing the first output process, the
図20は、第1の出力処理に関わる情報処理装置3内の制御部3Cの処理動作の一例を示すフロー図である。図20において制御部3C内の抽出部42は、バースト期間中の現在ツイート群を含む第1の文書を取得する(ステップS41)。抽出部42は、過去の平常時のツイート群の内、対象条件に適合した比較対象ツイート群を含む第2の文書を取得する(ステップS42)。
FIG. 20 is a flow chart showing an example of the processing operation of the
制御部3C内の重要単語特定部43は、第1の文書及び第2の文書の形態素解析で単語分割し(ステップS43)、単語毎にTF-IDF値を算出する(ステップS44)。重要単語特定部43は、単語毎のTF-IDF値が上位N位までの単語を重要単語として特定する(ステップS45)。尚、重要単語特定部43は、特定した重要単語を重要単語記憶部52に記憶する。
The important
制御部3C内の共起単語特定部44は、重要単語毎に共起する単語を共起単語として特定し、共起単語毎の共起回数をカウントする(ステップS46)。尚、共起単語は、例えば、重要単語に共起した名詞単語である。共起単語特定部44は、特定した共起単語を共起単語記憶部53に記憶する。
The co-occurrence
制御部3C内の出力部45は、重要単語の共起単語の内、共起回数が昇順で上位N位までの共起単語を重要単語と組み合わせて出力し(ステップS47)、図20に示す処理動作を終了する。
The
実施例2の情報処理装置3は、事象特有の重要単語を特定すると共に、他の同条件で取得した比較対象ツイート群と比較して、その事象発生時に特に顕著に現れた共起単語を特定する。情報処理装置3は、重要単語と同時に呟かれた回数が多い共起単語との組合せに応じて事象を推定する。その結果、事象特有の現象及び原因の要点を把握できる。
The
情報処理装置3は、重要単語が含まれるメッセージ発信の一時的な増加を検知すると、該一時的な増加に対応する期間に発信されたメッセージについて重要単語と共起する共起単語を抽出する。情報処理装置3は、重要単語及び共起単語の組合せを出力し、これら重要単語及び共起単語に応じて事象を推定する。その結果、事象特有の現象及び原因の要点を把握できる。
When the
尚、上記実施例2の情報処理装置3では、重要単語毎に共起する共起単語を名詞で例示したが、これに限定されるものではなく、例えば、共起単語が形容詞であっても良く、その実施の形態につき、実施例3として以下に説明する。
In the
図21は、実施例3の情報処理装置3の機能構成の一例を示す説明図である。尚、実施例2の情報処理装置3と同一の構成には同一符号を付すことで、その重複する構成及び動作の説明については省略する。
FIG. 21 is an explanatory diagram showing an example of the functional configuration of the
図21に示す情報処理装置3は、制御部3Eと、記憶部3Fとを有する。制御部3Eは、例えば、CPU15に対応する。制御部3Eは、例えば、ROM13に格納された情報処理プログラムをRAM上14に展開し、RAM14上に展開された情報処理プログラムを情報処理プロセスとして実行することで、例えば、特定部41、抽出部42、重要単語特定部43、共起単語特定部44A、出力部45及び推定部46を機能として実行する。記憶部3Fは、例えば、HDD12、ROM13及びRAM14等に対応する。
The
記憶部3Fは、キーワード記憶部51と、重要単語記憶部52と、共起単語記憶部53とを有する。キーワード記憶部51は、例えば、親キーワード及び子キーワード等のキーワードを記憶する領域である。重要単語記憶部52は、例えば、重要単語を記憶する領域である。共起単語記憶部53は、例えば、形容詞の共起単語を記憶する領域である。
The storage unit 3F has a
共起単語特定部44Aは、重要単語に共起する単語の内、形容詞の共起単語を特定する。共起単語特定部44は、形容詞の共起単語の内、共起回数が上位の共起単語を共起単語記憶部53に記憶する。
The co-occurrence word specifying unit 44A identifies a co-occurrence word of an adjective among the words co-occurring with an important word. The co-occurrence
図22は、鹿児島で地震が発生した際のツイート群の重要単語に関わる共起単語毎の出現回数の一例を示す説明図である。共起単語特定部44Aは、今回の現在ツイート群から重要単語の形容詞の共起単語を特定する。そして、共起単語特定部44Aは、重要単語毎の共起単語の共起回数をカウントする。共起単語特定部44Aは、図22に示すように、例えば、重要単語「鹿児島」の共起単語として、「大きい」の共起回数が2回、「怖い」の共起回数が2回、「多い」の共起回数が1回として共起単語記憶部53に記憶する。
FIG. 22 is an explanatory diagram showing an example of the number of occurrences of each co-occurrence word related to an important word in a tweet group when an earthquake occurs in Kagoshima. The co-occurrence word identification unit 44A identifies the co-occurrence word of the adjective of the important word from the current tweet group this time. Then, the co-occurrence word specifying unit 44A counts the number of co-occurrence words for each important word. As shown in FIG. 22, the co-occurrence word identification unit 44A has, for example, as a co-occurrence word of the important word "Kagoshima", the number of co-occurrence of "large" is 2 times and the number of co-occurrence of "scary" is 2 times. The number of co-occurrence of "many" is set to 1 and stored in the co-occurrence
図23は、鹿児島で地震が発生した際のツイート群から事象推定の一例を示す説明図である。重要単語特定部43は、キーワードが「地震」、重要単語が「鹿児島」、「最近」及び「停電」と特定したとする。更に、共起単語特定部44Aは、重要単語「鹿児島」の共起単語が「大きい」、「多い」、「強い」及び「怖い」、重要単語「最近」の共起単語が「多い」、「怖い」及び「大きい」、重要単語「停電」の共起単語が「暑い」と特定したとする。推定部46は、これらの重要単語及び共起単語の組合せから「鹿児島で大きい地震が最近多発して停電で暑くなっている」との事例を推定できる。
FIG. 23 is an explanatory diagram showing an example of event estimation from a group of tweets when an earthquake occurs in Kagoshima. It is assumed that the important
図24は、地震義援金を募集した際のツイート群から事象推定の一例を示す説明図である。重要単語特定部43は、キーワードが「地震」、重要単語が「復興」、「熊本」、「東日本」及び「支援」と特定したとする。更に、共起単語特定部44Aは、重要単語「復興」の共起単語が「宜しく」、「温かい」及び「深」、重要単語「熊本」の共起単語が「宜しく」、「温かい」及び「暖かい」、重要単語「東日本」の共起単語が「宜しく」、「温かい」及び「詳しく」、重要単語「支援」の共起単語が「宜しく」、「温かい」及び「暖かい」と特定したとする。推定部46は、重要単語及び共起単語の組合せから「地震が発生したわけではなく、熊本と東日本の地震に関しての温かい支援をお願いしている」との事例を推定できる。
FIG. 24 is an explanatory diagram showing an example of event estimation from a group of tweets when soliciting earthquake relief funds. It is assumed that the important
図25は、北海道北見市で停電を発生した際のツイート群から事象推定の一例を示す説明図である。重要単語特定部43は、キーワードが「停電」、重要単語が「雷」、「雨」及び「北見」と特定したとする。更に、共起単語特定部44Aは、重要単語「雷」の共起単語が「すごい」、「やばい」及び「怖い」、重要単語「雨」の共起単語が「すごい」、「やばい」及び「怖い」、重要単語「北見」の共起単語が「広い」、「危ない」及び「幅広い」と特定したとする。推定部46は、重要単語及び共起単語の組合せから「雷が原因で停電が発生し、雨も降っており、北見市の広い範囲で停電している」との事例を推定できる。
FIG. 25 is an explanatory diagram showing an example of event estimation from a group of tweets when a power failure occurs in Kitami City, Hokkaido. It is assumed that the important
図26は、神奈川県横浜市で停電を発生した際のツイート群から事象推定の一例を示す説明図である。重要単語特定部43は、キーワードが「停電」、重要単語が「横浜」及び「情報」と特定したとする。更に、共起単語特定部44Aは、重要単語「横浜」の共起単語が「珍しい」及び「恐ろし」、重要単語「情報」の共起単語が「なし」と特定したとする。推定部46は、重要単語及び共起単語の組合せから「横浜市で珍しく停電が発生し、情報が無い」との事例を推定する。
FIG. 26 is an explanatory diagram showing an example of event estimation from a group of tweets when a power failure occurs in Yokohama City, Kanagawa Prefecture. It is assumed that the important
図27は、第2の推定処理に関わる情報処理装置3内の制御部3Eの処理動作の一例を示すフロー図である。図27において制御部3Eは、ステップS34にて一定条件のツイート群のバートス発生と判断した後、図28に示す第2の出力処理を実行する(ステップS35A)。推定部46は、第2の出力処理を実行した後、重要単語と共起単語(形容詞)との組み合わせに応じて事象を推定し(ステップS36A)、図27に示す処理動作を終了する。尚、共起単語は、例えば、形容詞である。
FIG. 27 is a flow chart showing an example of the processing operation of the control unit 3E in the
図28は、第2の出力処理に関わる情報処理装置3内の制御部3Eの処理動作の一例を示すフロー図である。図28において制御部3E内の重要単語特定部43は、ステップS45にて単語毎のTF-IDFから上位TF-IDF値の単語を重要単語として抽出する。制御部3E内の共起単語特定部44Aは、重要単語毎に共起する形容詞の共起単語の共起回数をカウントする(ステップS46A)。尚、共起単語は、例えば、形容詞である。
FIG. 28 is a flow chart showing an example of the processing operation of the control unit 3E in the
出力部45は、重要単語の共起単語の内、共起回数が昇順で上位N位までの形容詞の共起単語を重要単語と組み合わせて出力し(ステップS47A)、図28に示す処理動作を終了する。
The
情報処理装置3は、事象特有の重要単語を特定すると共に、他の同条件で取得した比較対象ツイート群と比較して、その事象発生時に特に顕著に現れた形容詞の共起単語を特定する。情報処理装置3は、重要単語と同時に呟かれた回数が多い形容詞の共起単語との組合せに応じて事象を推定する。その結果、事象特有の現象及び原因の要点を把握できる。
The
情報処理装置3は、重要単語が含まれるツイート発信の一時的な増加を検知すると、該一時的な増加に対応する期間に発信されたツイートについて重要単語と共起する形容詞の共起単語を特定する。情報処理装置3は、特定された形容詞の共起単語を含む期間の内外におけるツイートの発信状況に基づいて期間を評価する。その結果、重要単語及び形容詞の共起単語に応じて今回のツイート群の期間を評価できる。事象毎に頻出する形容詞に応じて言葉の変化を登録できる。
When the
また、図示した各部の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。 Further, each component of each of the illustrated parts does not necessarily have to be physically configured as shown in the figure. That is, the specific form of distribution / integration of each part is not limited to the one shown in the figure, and all or part of them may be functionally or physically distributed / integrated in any unit according to various loads and usage conditions. Can be configured.
更に、各装置で行われる各種処理機能は、CPU(Central Processing Unit)(又はMPU(Micro Processing Unit)、MCU(Micro Controller Unit)等のマイクロ・コンピュータ)上で、その全部又は任意の一部を実行するようにしても良い。また、各種処理機能は、CPU(又はMPU、MCU等のマイクロ・コンピュータ)で解析実行するプログラム上、又はワイヤードロジックによるハードウェア上で、その全部又は任意の一部を実行するようにしても良いことは言うまでもない。 Further, various processing functions performed by each device are performed on a CPU (Central Processing Unit) (or a microcomputer such as an MPU (Micro Processing Unit) or an MCU (Micro Controller Unit)) in whole or in any part thereof. You may try to do it. Further, various processing functions may be executed in whole or in any part on a program analyzed and executed by a CPU (or a microcomputer such as an MPU or MCU) or on hardware by wired logic. Needless to say.
ところで、本実施例で説明した各種の処理は、予め用意されたプログラムを情報処理装置で実行することで実現できる。そこで、以下では、上記実施例と同様の機能を有するプログラムを実行する情報処理装置の一例を説明する。図29は、情報処理プログラムを実行する情報処理装置の一例を示す説明図である。 By the way, various processes described in this embodiment can be realized by executing a program prepared in advance in the information processing apparatus. Therefore, in the following, an example of an information processing apparatus that executes a program having the same function as that of the above embodiment will be described. FIG. 29 is an explanatory diagram showing an example of an information processing apparatus that executes an information processing program.
図29に示す情報処理プログラムを実行する情報処理装置100では、通信装置110と、表示装置120と、操作装置130と、HDD140と、ROM150と、RAM160と、CPU170と、バス180とを有する。通信装置110は、図示せぬ通信網と接続し、通信網内のSNSの投稿を収集する。
The
そして、ROM150には、上記実施例と同様の機能を発揮する情報処理プログラムが予め記憶されている。尚、情報処理プログラムは、必ずしも最初からROM150に記憶させておかなくても良く、図示せぬドライブで読取可能な記録媒体に情報処理プログラムが記録されていても良い。また、記録媒体としては、例えば、フレキシブルディスク(FD)、CD-ROM、DVDディスク、USBメモリ、SDカードやICカード等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ等でも良い。情報処理装置100が記録媒体に記憶中の情報処理プログラムを読み出して実行するようにしても良い。また、情報処理プログラムとしては、図29に示すように、特定プログラム150A、抽出プログラム150B、比較プログラム150C及び出力プログラム150Dが含まれる。尚、プログラム150A~150Dについては、適宜統合又は分散しても良い。
The ROM 150 stores in advance an information processing program that exhibits the same functions as those in the above embodiment. The information processing program does not necessarily have to be stored in the ROM 150 from the beginning, and the information processing program may be recorded on a recording medium that can be read by a drive (not shown). The recording medium may be, for example, a flexible disk (FD), a CD-ROM, a DVD disk, a USB memory, a portable recording medium such as an SD card or an IC card, a semiconductor memory such as a flash memory, or the like. The
そして、CPU170は、これらのプログラム150A~150DをROM150から読み出し、これら読み出された各プログラムをRAM160のワークエリア上に展開する。そして、RAM160は、展開した各プログラム150A~150Dを、特定プロセス160A、抽出プロセス160B、比較プロセス160C及び出力プロセス160Dとして機能する。
Then, the
CPU170は、所定期間における複数の投稿に含まれる所定のワードの出現回数を特定する。CPU170は、特定した所定のワードの出現回数が所定の回数以上である場合に、所定のワードを含む投稿から、所定のワードとは異なる1または複数のワードを抽出する。CPU170は、抽出した1または複数のワードそれぞれの出現回数が、所定期間と異なる期間における出現回数と比較して特定の閾値以上多いか否かに応じて、1または複数のワードを出力する。その結果、特定の事象に関する情報を取得するのに適切なキーワードを選定できる。
The
1 事象推定システム
3 情報処理装置
21 特定部
22 抽出部
23 比較部
24 出力部
41 特定部
42 抽出部
43 重要単語特定部
44 共起単語特定部
44A 共起単語特定部
45 出力部
1
Claims (10)
特定した前記所定のワードの出現回数が所定の回数以上である場合に、前記所定のワードを含む投稿から、前記所定のワードとは異なり、かつ、前記所定のワードを共起する、1または複数の共起ワードを抽出し、
抽出した前記1または複数の共起ワードそれぞれの出現回数が、前記所定期間と異なる期間における出現回数と比較して特定の閾値以上多いか否かに応じて、前記1または複数の共起ワードを出力し、
前記所定のワード及び、前記出力された前記1または複数の共起ワードを用いて前記特定の事象を推定する
処理をコンピュータに実行させることを特徴とする情報処理プログラム。 Identify the number of occurrences of a given word for a particular event in multiple posts over a given time period
When the number of appearances of the specified predetermined word is equal to or greater than the predetermined number of times, the post containing the predetermined word is different from the predetermined word and co-occurs the predetermined word, 1 or Extract multiple co -occurrence words and
Depending on whether or not the number of appearances of each of the extracted one or more co -occurrence words is greater than or equal to a specific threshold value as compared with the number of appearances in a period different from the predetermined period, the one or more co -occurrence words may be selected. Output and
The specific event is estimated using the predetermined word and the output one or more co-occurrence words.
An information processing program characterized by having a computer execute processing.
処理をコンピュータに実行させることを特徴とする請求項1又は2に記載の情報処理プログラム。 The information processing program according to claim 1 or 2 , wherein a computer executes a process of outputting the one or a plurality of co -occurrence words according to the number of occurrences.
処理をコンピュータに実行させることを特徴とする請求項1又は2に記載の情報処理プログラム。 The information processing program according to claim 1 or 2 , wherein a computer executes a process of outputting the one or a plurality of co -occurrence words according to an increasing tendency of the number of occurrences.
処理をコンピュータに実行させることを特徴とする請求項1乃至4のいずれか一項に記載の情報処理プログラム。 It is characterized in that a computer is made to execute a process of outputting the different words according to the number of occurrences of a word different from the one or a plurality of co - occurrence words included in a post containing each of the one or a plurality of co-occurrence words. The information processing program according to any one of claims 1 to 4 .
特定した前記所定のワードの出現回数が所定の回数以上である場合に、前記所定のワードを含む投稿から、前記所定のワードとは異なる1または複数のワードを抽出し、 When the number of appearances of the specified predetermined word is equal to or greater than the predetermined number of times, one or a plurality of words different from the predetermined word are extracted from the posts containing the predetermined word.
前記所定期間と異なる期間における前記1または複数のワードの出現回数に対する、前記所定期間における前記1または複数のワードそれぞれの出現回数の率が、前記所定期間と異なる期間における前記所定のワードの出現回数に対する前記所定期間における前記所定のワードの出現回数の率と一致又は類似する場合に、前記1または複数のワードを出力し、The ratio of the number of appearances of each of the one or more words in the predetermined period to the number of appearances of the one or more words in a period different from the predetermined period is the number of appearances of the predetermined word in a period different from the predetermined period. When the rate of the number of appearances of the predetermined word in the predetermined period is the same as or similar to that of the above, one or more words are output.
前記所定のワード及び、前記出力された前記1または複数のワードを用いて前記特定の事象を推定するThe specific event is estimated using the predetermined word and the output one or more words.
処理をコンピュータに実行させることを特徴とする情報処理プログラム。An information processing program characterized by having a computer execute processing.
前記所定のワードと、抽出した該共起ワードとを出力し、
前記所定のワード及び、前記出力された前記共起ワードを用いて前記特定の事象を推定する
処理をコンピュータに実行させることを特徴とするメッセージ解析プログラム。 When a temporary increase in message transmission including a predetermined word related to a specific event is detected, the predetermined word and the predetermined word are co-occurred for the message transmitted in the period corresponding to the temporary increase. Extract co -occurrence words,
The predetermined word and the extracted co- occurrence word are output .
The specific event is estimated using the predetermined word and the output co-occurrence word.
A message analysis program characterized by having a computer execute processing.
抽出した前記形容詞である共起ワードが含まれる前記期間の内外におけるメッセージの発信状況に基づいて前記期間を評価し、
前記所定のワード及び、前記共起ワードを用いて前記特定の事象を推定する
処理をコンピュータに実行させることを特徴とするメッセージ解析プログラム。 When a temporary increase in message transmission including a predetermined word related to a specific event is detected, the predetermined word and the predetermined word are co-occurred for the message transmitted in the period corresponding to the temporary increase. Extract the co -occurrence word, which is a co-occurrence word and is an adjective,
The period is evaluated based on the transmission status of the message inside and outside the period including the co-occurrence word which is the extracted adjective.
The specific event is estimated using the predetermined word and the co-occurrence word.
A message analysis program characterized by having a computer execute processing.
特定した前記所定のワードの出現回数が所定の回数以上である場合に、前記所定のワードを含む投稿から、前記所定のワードとは異なり、かつ、前記所定のワードを共起する、1または複数の共起ワードを抽出する抽出部と、
抽出した前記1または複数の共起ワードそれぞれの出現回数が、前記所定期間と異なる期間における出現回数と比較して特定の閾値以上多いか否かに応じて、前記1または複数の共起ワードを出力する出力部と、
前記所定のワード及び、前記出力された前記1または複数の共起ワードを用いて前記特定の事象を推定する推定部と、
を有することを特徴とする情報処理装置。 A specific part that specifies the number of occurrences of a predetermined word for a specific event included in multiple posts in a predetermined period,
When the number of appearances of the specified predetermined word is equal to or greater than the predetermined number of times, the post containing the predetermined word is different from the predetermined word and co-occurs the predetermined word. An extractor that extracts multiple co -occurrence words,
Depending on whether or not the number of appearances of each of the extracted one or more co -occurrence words is greater than or equal to a specific threshold value as compared with the number of appearances in a period different from the predetermined period, the one or more co -occurrence words may be selected. The output section to output and
An estimation unit that estimates the specific event using the predetermined word and the output one or more co-occurrence words.
An information processing device characterized by having.
所定期間における複数の投稿に含まれる、特定の事象に関する所定のワードの出現回数を特定し、
特定した前記所定のワードの出現回数が所定の回数以上である場合に、前記所定のワードを含む投稿から、前記所定のワードとは異なり、かつ、前記所定のワードを共起する1または複数の共起ワードを抽出し、
抽出した前記1または複数の共起ワードそれぞれの出現回数が、前記所定期間と異なる期間における出現回数と比較して特定の閾値以上多いか否かに応じて、前記1または複数の共起ワードを出力し、
前記所定のワード及び、前記出力された前記1または複数の共起ワードを用いて前記特定の事象を推定する
処理を実行することを特徴とする情報処理方法。 The computer
Identify the number of occurrences of a given word for a particular event in multiple posts over a given time period
When the number of appearances of the specified predetermined word is equal to or greater than the predetermined number of times, one or a plurality of posts containing the predetermined word, which are different from the predetermined word and co-occurrence the predetermined word. Extract the co -occurrence word of
Depending on whether or not the number of appearances of each of the extracted one or more co -occurrence words is greater than or equal to a specific threshold value as compared with the number of appearances in a period different from the predetermined period, the one or more co -occurrence words may be selected. Output and
The specific event is estimated using the predetermined word and the output one or more co-occurrence words.
An information processing method characterized by executing processing.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018029175A JP7091700B2 (en) | 2018-02-21 | 2018-02-21 | Information processing program, message analysis program, information processing device and information processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018029175A JP7091700B2 (en) | 2018-02-21 | 2018-02-21 | Information processing program, message analysis program, information processing device and information processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019144905A JP2019144905A (en) | 2019-08-29 |
JP7091700B2 true JP7091700B2 (en) | 2022-06-28 |
Family
ID=67772398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018029175A Active JP7091700B2 (en) | 2018-02-21 | 2018-02-21 | Information processing program, message analysis program, information processing device and information processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7091700B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023096385A (en) * | 2021-12-27 | 2023-07-07 | 本田技研工業株式会社 | Information processing device, information processing method, and program |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120079020A1 (en) | 2010-09-27 | 2012-03-29 | Korea Institute Of Science And Technology | Highlight providing system and method based on hot topic event detection |
JP2013168021A (en) | 2012-02-15 | 2013-08-29 | Nifty Corp | Event detection device |
JP2014182445A (en) | 2013-03-18 | 2014-09-29 | Mitsubishi Electric Corp | Information processing device and navigation device |
JP2015207106A (en) | 2014-04-18 | 2015-11-19 | 富士通株式会社 | Event occurrence place estimation method, event occurrence place estimation program and event occurrence place estimation apparatus |
JP2016212751A (en) | 2015-05-12 | 2016-12-15 | 富士通株式会社 | Disaster detection program, disaster detection apparatus, and disaster detection method |
CN106547875A (en) | 2016-11-02 | 2017-03-29 | 哈尔滨工程大学 | A kind of online incident detection method of the microblogging based on sentiment analysis and label |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5154132B2 (en) * | 2007-04-16 | 2013-02-27 | ヤフー株式会社 | Name conversion recognition device and method |
JP2009104296A (en) * | 2007-10-22 | 2009-05-14 | Nippon Telegr & Teleph Corp <Ntt> | Related keyword extraction method, device, program, and computer readable recording medium |
JP5739843B2 (en) * | 2012-06-25 | 2015-06-24 | ヤフー株式会社 | Information providing apparatus, information providing method, and information providing program |
JP6342678B2 (en) * | 2014-03-07 | 2018-06-13 | クラリオン株式会社 | Related data generation apparatus, related data generation method and program |
JP2016110213A (en) * | 2014-12-02 | 2016-06-20 | シャープ株式会社 | Information processing device, information processing system, terminal device, information processing method, and information processing program |
-
2018
- 2018-02-21 JP JP2018029175A patent/JP7091700B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120079020A1 (en) | 2010-09-27 | 2012-03-29 | Korea Institute Of Science And Technology | Highlight providing system and method based on hot topic event detection |
JP2013168021A (en) | 2012-02-15 | 2013-08-29 | Nifty Corp | Event detection device |
JP2014182445A (en) | 2013-03-18 | 2014-09-29 | Mitsubishi Electric Corp | Information processing device and navigation device |
JP2015207106A (en) | 2014-04-18 | 2015-11-19 | 富士通株式会社 | Event occurrence place estimation method, event occurrence place estimation program and event occurrence place estimation apparatus |
JP2016212751A (en) | 2015-05-12 | 2016-12-15 | 富士通株式会社 | Disaster detection program, disaster detection apparatus, and disaster detection method |
CN106547875A (en) | 2016-11-02 | 2017-03-29 | 哈尔滨工程大学 | A kind of online incident detection method of the microblogging based on sentiment analysis and label |
Also Published As
Publication number | Publication date |
---|---|
JP2019144905A (en) | 2019-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102342124B (en) | Method and apparatus for providing information related to broadcast programs | |
US10922346B2 (en) | Generating a summary based on readability | |
US10489447B2 (en) | Method and apparatus for using business-aware latent topics for image captioning in social media | |
CN105677742A (en) | Method and apparatus for storing files | |
CN102789454B (en) | The instant storage means of input frame content in a kind of browsing device net page and system | |
CN106371834B (en) | Bullet screen data display method and device | |
US20150379610A1 (en) | Recommendation information presentation device, recommendation information presentation method, and recommendation information presentation program | |
CN105610806A (en) | Method and device for generating verification code | |
JP7091700B2 (en) | Information processing program, message analysis program, information processing device and information processing method | |
CN103544150B (en) | For browser of mobile terminal provides the method and system of recommendation information | |
CN112149179B (en) | Risk identification method and device based on privacy protection | |
CN110032727A (en) | Risk Identification Method and device | |
CN102902686A (en) | Web page detection method and system | |
CN103853845A (en) | Dynamic analytic method of complex form | |
US20190034446A1 (en) | Automated search method, apparatus, and database | |
Takata et al. | Event sequence assessment of deep snow in sodium-cooled fast reactor based on continuous Markov chain Monte Carlo method with plant dynamics analysis | |
CN116362841A (en) | Recommendation method and device for financial products, computer equipment and readable storage medium | |
CN108804583A (en) | The system and method for Literature pushing is carried out based on user's reading interest | |
CN114363664A (en) | Method and device for generating video collection title | |
CN110704617B (en) | News text classification method, device, electronic equipment and storage medium | |
US20240163677A1 (en) | Method for collecting location information, method for providing location information, and device for executing same | |
CN106681524A (en) | Method and device for processing information | |
US20160162483A1 (en) | Content providing system and content providing method thereof | |
JP2017204169A (en) | Event determination device | |
CN102681974A (en) | Display method, display device and electronic device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210927 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220517 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220530 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7091700 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |