JP6154072B2 - 情報分析システム、情報分析方法及び情報分析プログラム - Google Patents
情報分析システム、情報分析方法及び情報分析プログラム Download PDFInfo
- Publication number
- JP6154072B2 JP6154072B2 JP2016523487A JP2016523487A JP6154072B2 JP 6154072 B2 JP6154072 B2 JP 6154072B2 JP 2016523487 A JP2016523487 A JP 2016523487A JP 2016523487 A JP2016523487 A JP 2016523487A JP 6154072 B2 JP6154072 B2 JP 6154072B2
- Authority
- JP
- Japan
- Prior art keywords
- thread
- utterance
- data
- importance
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims description 216
- 238000000034 method Methods 0.000 description 45
- 238000010801 machine learning Methods 0.000 description 31
- 239000013598 vector Substances 0.000 description 30
- 230000008569 process Effects 0.000 description 17
- 238000013500 data storage Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 238000000605 extraction Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 9
- 230000000877 morphologic effect Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明の実施形態は、情報分析システム、情報分析方法及び情報分析プログラムに関する。
近年、情報処理技術の高速化及び低コスト化や、インターネット技術等のネットワーク技術の普及等に伴って、ネットワーク上に膨大な量の情報(電子データ)が蓄積されている。例えば、インターネット上の掲示板(電子掲示板)には、利用者によって投稿された発言が時系列順にまとめられている。
ここで、利用者が所望の情報を得るために、各種情報を推薦する情報推薦技術が提案されている。例えば、掲示板から特徴ベクトルを生成して特徴を分析する技術がある。この技術では、例えば、利用者によってキーワードが入力されると、入力されたキーワードに対応する特徴を有する掲示板が利用者に提示される。
しかしながら、従来の技術では、ネットワーク上に投稿された情報から有益な発言を分析することが難しいという問題があった。例えば、掲示板から特徴ベクトルを生成して特徴を分析する技術では、掲示板に意味の無い発言が多く含まれる場合に、有益な発言が意味の無い発言に埋もれてしまっていた。
そこで、この発明は、ネットワーク上に投稿された情報から有益な発言を分析することを目的とする。
実施形態に係る情報分析システムは、発言分析部と、スレッド分析部と、格納部とを備える。発言分析部は、ネットワーク上に投稿された発言の集合であるスレッドについて、当該スレッドに含まれる発言の重要度を、当該発言に関するデータである発言データに基づいて、当該発言ごとに分析する。スレッド分析部は、前記スレッドが、予め設定された複数のカテゴリのいずれに属するかを、当該スレッドに関するデータであるスレッドデータに基づいて分析する。格納部は、前記発言ごとに、当該発言と、当該発言の重要度と、当該発言が含まれるスレッドのカテゴリとを対応づけて所定の記憶部に格納する。
本願の開示する技術の一つの態様によれば、ネットワーク上に投稿された情報から有益な発言を分析することができるという効果を奏する。
以下に添付図面を参照して、この発明に係る情報分析システム、情報分析方法及び情報分析プログラムの実施形態を詳細に説明する。なお、以下の実施形態により本発明が限定されるものではない。
[第1の実施形態]
以下の実施形態では、第1の実施形態に係る情報分析システムの構成、情報分析システムにおける処理の流れを順に説明し、最後に第1の実施形態による効果を説明する。
以下の実施形態では、第1の実施形態に係る情報分析システムの構成、情報分析システムにおける処理の流れを順に説明し、最後に第1の実施形態による効果を説明する。
[情報分析システムの構成]
図1は、第1の実施形態に係る情報分析システム100の構成の一例を示す図である。図1に示すように、情報分析システム100は、通信処理部110、記憶部120、機能部130、及び制御部140を有する。また、情報分析システム100は、インターネットに接続されている。
図1は、第1の実施形態に係る情報分析システム100の構成の一例を示す図である。図1に示すように、情報分析システム100は、通信処理部110、記憶部120、機能部130、及び制御部140を有する。また、情報分析システム100は、インターネットに接続されている。
通信処理部110は、ネットワーク上における装置との間でやり取りされ各種情報に関する通信を制御する。例えば、通信処理部110は、後述の収集部131の制御によりインターネット上の各種電子掲示板(BBS(Bulletin Board System))サイトにアクセスする。
記憶部120は、図1に示すように、スレッドデータ記憶部121及び分析結果記憶部122を有する。記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置などである。
スレッドデータ記憶部121は、インターネット上のBBSサイトから収集されたスレッドデータを記憶する。ここで、スレッドデータは、ネットワーク上に投稿された発言の集合であるスレッドに関するデータである。例えば、スレッドデータ記憶部121は、収集部131によって収集されたスレッドデータを記憶する。また、例えば、スレッドデータ記憶部121は、分析部132によって参照される。
図2は、第1の実施形態に係るスレッドデータ記憶部121に記憶されるスレッドデータの一例を示す図である。図2に示すように、例えば、スレッドデータ記憶部121に記憶されるスレッドデータ10は、タイトル11、発言12、及び発言13を含む。ここで、タイトル11は、スレッドのタイトルである。また、発言12,13は、BBSの利用者によって投稿された発言である。発言12,13は、発言順序、発言者名、発言日時、及び発言内容を含む。図2に示す例では、発言12の発言順序が「1」であり、発言者名が「A1」であり、発言日時が「A2」であり、発言内容が「A3」である場合を示す。
分析結果記憶部122は、分析結果を記憶する。例えば、分析結果記憶部122は、後述の分析部132によって分析された分析結果を記憶する。分析結果記憶部122に記憶される分析結果は、例えば、後述の格納部133によって格納される。また、分析結果記憶部122に記憶される分析結果は、利用者の要求に応じて出力される。
図1の説明に戻る。機能部130は、収集部131、分析部132、及び格納部133を有する。ここで、機能部130は、各処理を受け持つところであり、実際にはソフトウェア(の1コンポーネント)またはミドルウェアとして実現される。また、制御部140は、通信処理部110、記憶部120、及び機能部130の動作を制御し、情報分析システム100の動作を司るもので、実際にはCPU(Central Processing Unit)やMPU(Micro Processing Unit)等の集積回路等で実現される。
収集部131は、ネットワーク上に投稿された情報からスレッドデータを収集する。例えば、収集部131は、インターネット上のBBSサイトを巡回し、BBSサイトからスレッドデータを収集する。そして、収集部131は、収集したスレッドデータをスレッドデータ記憶部121に格納する。
なお、収集部131は、HTML(HyperText Markup Language)タグやスクリプト、広告等の文字情報以外の情報がスレッドに含まれる場合には、それらの情報を取り除いた上でスレッドデータ記憶部121に格納する。また、収集部131によって巡回される巡回対象のサイトは、予めURL(Uniform Resource Locator)等のリストとして指定されていても良いし、収集するごとに指定されても良い。
分析部132は、収集部131によって収集されたスレッドデータを分析する。図1に示すように、分析部132は、発言切り出し部132A、発言分析部132B、及びスレッド分析部132Cを有する。
発言切り出し部132Aは、スレッドデータに含まれる発言をスレッドデータから切り出し、発言に関するデータである発言データを生成する。ここで、発言データとは、例えば、「発言順序」、「発言者名」、「発言日時」、「発言内容」、及び「付加情報」が対応づけられたデータである。「発言順序」、「発言者名」、「発言日時」、及び「発言内容」は、スレッドデータから対応する箇所が抜き出されたデータである。また、「付加情報」は、「文字数」、「返信フラグ」、及び「返信数」が対応づけられたデータである。「文字数」は、発言内容の文字数に対応する。「返信フラグ」は、該当する発言が別の発言への返信であるか否かを表すフラグである。例えば、該当する発言の発言内容が「>(数字)」から始まる場合には、その発言が返信であることを示す返信フラグ「1」が付与される。一方、「>(数字)」から始まらない場合には、その発言が返信ではないことを示す返信フラグ「0」が付与される。なお、(数字)は、返信対象の発言順序を表す。「返信数」は、該当する発言への返信の数を表す。例えば、発言内容が「>(数字)」から始まる発言の数が、その数字の発言番号の返信数に対応する。
例えば、発言切り出し部132Aは、スレッドデータ記憶部121に記憶されたスレッドデータを取得する。そして、発言切り出し部132Aは、取得したスレッドデータに含まれる発言をそれぞれ切り出し、発言データをそれぞれ生成する。発言切り出し部132Aは、生成したそれぞれの発言データを発言分析部132Bに送る。また、発言切り出し部132Aは、取得したスレッドデータをスレッド分析部132Cに送る。
一例として、発言切り出し部132Aが図2に示すスレッドデータ10を取得した場合を説明する。発言切り出し部132Aは、スレッドデータ10から発言12の発言順序「1」、発言者名「A1」、発言日時「A2」、及び発言内容「A3」を切り出す。そして、発言切り出し部132Aは、発言内容「A3」の文字数「A4」を計数する。また、発言切り出し部132Aは、発言内容「A3」が「>(数字)」から始まるか否かに応じて、返信フラグ「A5(A5は1又は0)」を生成する。また、発言切り出し部132Aは、スレッドデータ10に含まれる発言のうち、「>1」から始まる発言の数「A6」を計数する。この結果、発言切り出し部132Aは、発言順序「1」、発言者名「A1」、発言日時「A2」、発言内容「A3」、文字数「A4」、返信フラグ「A5」、及び返信数「A6」が対応づけられたデータを、発言12の発言データとして生成する。このように、発言切り出し部132Aは、スレッドデータ10に含まれる全ての発言について、発言データを生成する。
発言分析部132Bは、スレッドに含まれる発言の重要度を、発言データに基づいて、発言ごとに分析する。例えば、発言分析部132Bは、発言データから発言の重要度(スコア)を算出するための機械学習エンジンを用いて、発言切り出し部132Aによって生成された発言データから発言の重要度を分析する。そして、発言分析部132Bは、分析結果として、発言の重要度を格納部133に送る。なお、この場合、機械学習エンジンには、重要な発言の特徴ベクトルと重要でない発言の特徴ベクトルとを予め学習させておく。学習させる方法としては、例えば、代表的なBBSサイトからいくつかのスレッドを選択し、スレッドに含まれる発言を重要な発言と重要でない発言とに人手で分類して学習させる方法が挙げられる。
具体的には、発言分析部132Bは、発言データを機械学習エンジンにかけるために、各発言データを特徴ベクトルにそれぞれ変換する。ここで、発言分析部132Bは、例えば、発言データのうち、数値データと文字列データとをそれぞれ個別に変換する。例えば、発言分析部132Bは、発言データのうち、発言順序、発言日時、文字数、返信フラグ、及び返信数等の数値データを、そのまま特徴ベクトルの値とする。なお、これに限らず、発言分析部132Bは、数値データに対して何らかの数値演算処理を施して、特徴ベクトルの値としても良い。
また、発言分析部132Bは、発言者名及び発言内容等の文字列データに対しては、形態素解析、n−gram、若しくは区切り文字を用いて、特徴ベクトルに変換する。例えば、発言分析部132Bは、形態素解析を用いた場合には、文字列データを品詞によって分割し、それらを特徴ベクトルへ変換する。このような形態素解析には、例えばオープンソースのMecab等のライブラリを利用することができる。例えば、発言分析部132Bは、文字列データが「Twitter(登録商標)の使い方が、まだ、よくわからん。」である場合には、形態素解析を用いて、「Twitter/の/使い方/が/、/まだ/、/よく/わから/ん/。」と分割する。
また、発言分析部132Bは、n−gramを用いた場合には、文字列データを先頭から1文字ずつずらしながらn文字の組を作り、それらを特徴ベクトルへ変換する。例えば、発言分析部132Bは、文字列データが「Twitterの使い方が、まだ、よくわからん。」である場合には、n−gram(n=3)を用いて、「Twi/wit/itt/tte/ter/erの/rの使/の使い/・・・」と分割する。
また、発言分析部132Bは、区切り文字を用いた場合には、文字列データを別途定めた区切り文字(空白やカンマ”,”など)によって分割し、それらを特徴ベクトルへ変換する。例えば、発言分析部132Bは、文字列データが「Twitterの使い方が、まだ、よくわからん。」であり、区切り文字が句読点“、”である場合には、区切り文字を用いて、「Twitterの使い方が/まだ/よくわからん。」と分割する。なお、一般に、形態素解析は日本語の文章に、空白区切りは英語に適用されることが多い。
そして、発言分析部132Bは、このようにして要素に分割された文字列データを特徴ベクトルに変換する。特徴ベクトルの変換手法としては、例えば、各要素の出現回数をそのまま特徴ベクトルとする方式、回数によらず出現するか否かを1又は0に対応させる方式等がある。これらは使用する機械学習エンジンのライブラリが対応する手法であれば、どのようなものを用いても構わない。
そして、発言分析部132Bは、各発言データから変換した各特徴ベクトルを、機械学習エンジンに与え、各発言の重要度を算出する。ここで使用する機械学習エンジンは種類を問わないが、例えば、オープンソースのJubatus(登録商標)等を用いることができる。そして、発言分析部132Bは、各発言データに対して、機械学習エンジンで算出された各発言の重要度を付与し、発言データと発言の重要度とをそれぞれ合わせて格納部133に送る。
なお、上述した発言分析部132Bの処理はあくまで一例に過ぎない。例えば、発言分析部132Bは、機械学習エンジンによる分析の精度を向上させるために、入力される各発言データに対して、不要文字の除去、文字種の統一、及び特定グループの単語の置き換え等の前処理を行っても良い。具体的には、発言分析部132Bは、不要文字の除去として、例えば、文字列データに対して、余計な空白や言語処理の障害となるURL等の削除を行う。また、例えば、発言分析部132Bは、文字種の統一として、文字列データに使用されている文字について、英大文字小文字やいわゆる半角全角の統一を行う。また、例えば、発言分析部132Bは、特定グループの単語の置き換えとして、ガラケー、スマホ、スマートフォン、及びケータイという単語を携帯電話という単語に置き換える。また、例えば、特徴ベクトルの基となる文字列データは、発言内容のみを用いても良いし、“発言者と発言内容”のように、いくつかの要素を連結した文字列データを用いても良い。
スレッド分析部132Cは、スレッドが、予め設定された複数のカテゴリのいずれに属するかを、スレッドデータに基づいて分析する。例えば、スレッド分析部132Cは、スレッドデータからスレッドのカテゴリを分析するための機械学習エンジンを用いて、発言切り出し部132Aから受け付けたスレッドデータからスレッドが属するカテゴリを分析する。そして、スレッド分析部132Cは、分析結果として、スレッドが属するカテゴリを格納部133に送る。なお、この場合、機械学習エンジンには、いくつかのスレッドとそのカテゴリを予め学習させておく。学習させる方法としては、例えば、代表的なBBSサイトからいくつかのスレッドを選択し、スレッドが属するカテゴリを人手で入力して学習させる方法が挙げられる。
具体的には、スレッド分析部132Cは、スレッドデータを機械学習エンジンにかけるために、スレッドデータを特徴ベクトルに変換する。ここで、スレッド分析部132Cは、例えば、スレッドデータに含まれる文字列データ、例えば、タイトルと、各発言の発言内容とを連結した文字列データに対して、形態素解析、n−gram、若しくは区切り文字を用いて、特徴ベクトルに変換する。なお、形態素解析、n−gram、及び区切り文字を用いて特徴ベクトルに変換する処理の説明は、上述した説明と同様であるので省略する。
そして、スレッド分析部132Cは、スレッドデータから変換した特徴ベクトルを機械学習エンジンに与え、スレッドが属するカテゴリを決定する。ここで使用する機械学習エンジンは種類を問わないが、例えば、オープンソースのJubatus等を用いることができる。そして、スレッド分析部132Cは、機械学習エンジンで決定されたスレッドのカテゴリを格納部133に送る。
なお、上述したスレッド分析部132Cの処理はあくまで一例に過ぎない。例えば、スレッド分析部132Cは、機械学習エンジンによる分析の精度を向上させるために、入力される各発言データに対して、不要文字の除去、文字種の統一、及び特定グループの単語の置き換え等の前処理を行っても良い。また、例えば、スレッド分析部132Cは、特徴ベクトルの基となる文字列データとして、タイトルと各発言の発言内容以外にも、発言者等の他の要素を組み合わせて用いても良い。また、スレッド分析部132Cは、文字列データに限らず、発言数等の数値データを用いて特徴ベクトルを求めても良い。
格納部133は、発言ごとに、当該発言と、発言の重要度と、発言が含まれるスレッドのカテゴリとを対応づけて分析結果記憶部122に格納する。例えば、格納部133は、発言ごとに、発言データ及びその重要度を発言分析部132Bから受け付ける。また、格納部133は、スレッドが属するカテゴリをスレッド分析部132Cから受け付ける。そして、格納部133は、発言分析部132Bから受け付けた発言データ及びその重要度の組に、スレッド分析部132Cから受け付けたスレッドのカテゴリを発言のカテゴリとして付与し、分析結果記憶部122に格納する。
なお、格納部133によって分析結果記憶部122に格納された情報は、例えば、「カテゴリ」をキーとして検索されて、「重要度」のスコア順にソートされて利用者に提示される。また、特定のスコア(重要度)以上のデータのみが提示されるようにしても良い。
[情報分析システムによる処理]
図3は、第1の実施形態に係る情報分析システムにおける処理の流れを示すフローチャートである。
図3は、第1の実施形態に係る情報分析システムにおける処理の流れを示すフローチャートである。
図3に示すように、情報分析システム100の収集部131は、インターネット上のBBSサイトからスレッドデータを収集する(ステップS101)。収集部131は、収集したスレッドデータをスレッドデータ記憶部121に格納する。
続いて、発言切り出し部132Aは、スレッドデータから発言を切り出し、発言データを生成する(ステップS102)。例えば、発言切り出し部132Aは、スレッドデータ記憶部121に記憶されたスレッドデータを取得して、取得したスレッドデータに含まれる発言をそれぞれ切り出し、発言データをそれぞれ生成する。
そして、発言分析部132Bは、スレッドに含まれる発言の重要度を発言ごとに分析する(ステップS103)。例えば、発言分析部132Bは、発言データから発言の重要度(スコア)を算出するための機械学習エンジンを用いて、発言切り出し部132Aによって生成された発言データから発言の重要度を分析する。
そして、スレッド分析部132Cは、スレッドのカテゴリを分析する(ステップS104)。例えば、スレッド分析部132Cは、スレッドデータからスレッドのカテゴリを分析するための機械学習エンジンを用いて、発言切り出し部132Aから受け付けたスレッドデータからスレッドが属するカテゴリを分析する。
そして、格納部133は、発言ごとに、発言データ、発言の重要度、及びスレッドのカテゴリを対応づけて分析結果記憶部122に格納する(ステップS105)。
なお、上述した処理手順は、必ずしも上述した順序で実行されなくても良い。例えば、ステップS103の処理とステップS104の処理は、上述した順序とは逆の順序で実行されても良いし、並行処理として実行されても良い。また、例えば、収集済みのスレッドデータが存在する場合には、ステップS101の処理は実行されなくても良い。
[第1の実施形態の効果]
上述してきたように、第1の実施形態に係る情報分析システム100は、ネットワーク上に投稿された発言の集合であるスレッドについて、スレッドに含まれる発言の重要度を、発言データに基づいて、発言ごとに分析する。そして、情報分析システム100は、スレッドが、予め設定された複数のカテゴリのいずれに属するかを、スレッドデータに基づいて分析する。そして、情報分析システム100は、発言ごとに、発言と、発言の重要度と、発言が含まれるスレッドのカテゴリとを対応づけて所定の記憶部に格納する。このため、情報分析システム100は、ネットワーク上に投稿された情報から有益な発言を分析することができる。
上述してきたように、第1の実施形態に係る情報分析システム100は、ネットワーク上に投稿された発言の集合であるスレッドについて、スレッドに含まれる発言の重要度を、発言データに基づいて、発言ごとに分析する。そして、情報分析システム100は、スレッドが、予め設定された複数のカテゴリのいずれに属するかを、スレッドデータに基づいて分析する。そして、情報分析システム100は、発言ごとに、発言と、発言の重要度と、発言が含まれるスレッドのカテゴリとを対応づけて所定の記憶部に格納する。このため、情報分析システム100は、ネットワーク上に投稿された情報から有益な発言を分析することができる。
図4は、第1の実施形態による効果を説明するための図である。図4に示すように、例えば、情報分析システム100において、収集部131は、インターネット上のBBSサイトからスレッドデータを収集し(S10)、収集したスレッドデータを発言切り出し部132Aへ送る(S11)。続いて、発言切り出し部132Aは、スレッドデータから発言を切り出して発言データを生成し、生成した発言データを発言分析部132Bへ送る(S12)。そして、発言分析部132Bは、発言の重要度を発言ごとに分析し、発言データと重要度の組を格納部133へ送る(S13)。続いて、発言切り出し部132Aは、スレッドデータをスレッド分析部132Cへ送る(S14)。そして、スレッド分析部132Cは、スレッドのカテゴリを分析し、分析したカテゴリを格納部133へ送る(S15)。そして、格納部133は、発言ごとに、発言データ、重要度、及びカテゴリを対応づけて分析結果記憶部122に格納する(S16)。このように、情報分析システム100は、収集したスレッドデータに含まれる発言ごとに、発言データと、重要度と、カテゴリとを対応づけて蓄積する。このため、情報分析システム100は、例えば、意味の無い発言が多く含まれる場合であっても、有益な発言が意味の無い発言に埋もれることなく検索可能な状態で、分析結果を蓄積することができる。また、情報分析システム100は、スレッド単位でカテゴリの分析を行うことにより、発言単位で分析する場合と比較して分析対象とする情報量を増加させるので、発言の属するカテゴリを精度良く分析することができる。この結果、情報推薦技術において、利用者は、スレッド単位で抽出・推薦される場合と比べて、無意味な発言が除かれた、真に有用な発言のみを得ることが可能となる。
[第2の実施形態]
第1の実施形態では、情報分析システム100が発言ごとに重要度を分析する場合を説明したが、実施形態はこれに限定されるものではない。例えば、情報分析システム100は、スレッドの重要度についても分析し、発言の重要度とスレッドの重要度とを統合する場合であっても良い。そこで、第2の実施形態では、情報分析システム100が、スレッドの重要度についても分析し、発言の重要度とスレッドの重要度とを統合する場合を説明する。なお、以下の説明では、第1の実施形態と共通する構成及び処理については、説明を省略する。
第1の実施形態では、情報分析システム100が発言ごとに重要度を分析する場合を説明したが、実施形態はこれに限定されるものではない。例えば、情報分析システム100は、スレッドの重要度についても分析し、発言の重要度とスレッドの重要度とを統合する場合であっても良い。そこで、第2の実施形態では、情報分析システム100が、スレッドの重要度についても分析し、発言の重要度とスレッドの重要度とを統合する場合を説明する。なお、以下の説明では、第1の実施形態と共通する構成及び処理については、説明を省略する。
図1を用いて、第2の実施形態に係る情報分析システム100の構成について説明する。第2の実施形態に係る情報分析システム100は、図1に示した情報分析システム100と同様の構成を備えるが、スレッド分析部132C及び格納部133における処理が一部相違する。
スレッド分析部132Cは、第1の実施形態において説明した処理に加えて、スレッドデータに基づいて、スレッドの重要度を分析する。例えば、スレッド分析部132Cは、スレッドデータからスレッドの重要度を算出するための機械学習エンジンを用いて、スレッドの重要度を分析する。そして、スレッド分析部132Cは、分析結果として、スレッドが属するカテゴリに加えて、スレッドの重要度を格納部133に送る。なお、この場合、機械学習エンジンには、重要なスレッドの特徴ベクトルと重要でないスレッドの特徴ベクトルとを予め学習させておく。学習させる方法としては、例えば、代表的なBBSサイトからいくつかのスレッドを選択し、重要なスレッドと重要でないスレッドとを人手で分類して学習させる方法が挙げられる。
具体的には、スレッド分析部132Cは、スレッドデータを機械学習エンジンにかけるために、スレッドデータを特徴ベクトルに変換する。ここで、スレッド分析部132Cは、例えば、スレッドデータに含まれる文字列データ、例えば、タイトルと、各発言の発言内容とを連結した文字列データに対して、形態素解析、n−gram、若しくは区切り文字を用いて、特徴ベクトルに変換する。なお、形態素解析、n−gram、及び区切り文字を用いて特徴ベクトルに変換する処理の説明は、上述した説明と同様であるので省略する。
そして、スレッド分析部132Cは、スレッドデータから変換した特徴ベクトルを機械学習エンジンに与え、スレッドの重要度を算出する。ここで使用する機械学習エンジンは種類を問わないが、例えば、オープンソースのJubatus等を用いることができる。そして、スレッド分析部132Cは、機械学習エンジンで算出されたスレッドの重要度を格納部133に送る。
なお、上述したスレッド分析部132Cの処理はあくまで一例に過ぎない。例えば、スレッド分析部132Cは、文字列データに限らず、スレッドにおける発言数等の数値データを用いて特徴ベクトルを求めても良い。
格納部133は、発言の重要度及びスレッドの重要度に基づいて、発言の総合重要度を算出する。そして、格納部133は、算出した総合重要度と、発言と、発言が含まれるスレッドのカテゴリとを発言ごとに対応づけて格納する。
例えば、格納部133は、発言ごとに、発言データ及び発言の重要度を発言分析部132Bから受け付ける。また、格納部133は、スレッドが属するカテゴリ及びスレッドの重要度をスレッド分析部132Cから受け付ける。そして、格納部133は、発言分析部132Bから受け付けた発言の重要度と、スレッド分析部132Cから受け付けたスレッドの重要度とに基づいて、総合重要度を発言ごとに算出する。ここで、総合重要度の算出方法は、例えば、発言の重要度及びスレッドの重要度の和であっても良いし、積、平均、その他の算術演算による値であっても良い。そして、格納部133は、発言データ、総合重要度、及びカテゴリを対応づけて、発言ごとに分析結果記憶部122に格納する。
図5は、第2の実施形態に係る情報分析システムにおける処理の流れを示すフローチャートである。なお、図5に示すステップS201〜S203の処理は、図3のステップS101〜S103の処理と同様であるので、説明を省略する。
図5に示すように、情報分析システム100のスレッド分析部132Cは、スレッドのカテゴリ及びスレッドの重要度を分析する(ステップS204)。例えば、スレッド分析部132Cは、第1の実施形態において説明した処理に加えて、スレッドデータからスレッドの重要度を算出するための機械学習エンジンを用いて、スレッドの重要度を分析する。そして、スレッド分析部132Cは、分析結果として、スレッドが属するカテゴリに加えて、スレッドの重要度を格納部133に送る。
そして、格納部133は、発言の重要度とスレッドの重要度とから、発言の総合重要度を算出する(ステップS205)。例えば、格納部133は、発言の重要度及びスレッドの重要度の和、積、平均、その他の算術演算による値等を総合重要度として算出する。そして、格納部133は、発言データ、発言の総合重要度、及びスレッドのカテゴリを対応づけて、発言ごとに分析結果記憶部122に格納する(ステップS206)。
なお、図5に示した処理手順は、必ずしも上記の順序で実行されなくても良い。例えば、ステップS203の処理とステップS204の処理は、上述した順序とは逆の順序で実行されても良いし、並行処理として実行されても良い。
このように、第2の実施形態に係る情報分析システム100は、スレッドの重要度についても分析し、発言の重要度とスレッドの重要度とを統合する。これにより、情報分析システム100は、スレッドの重要度を加味した上で発言ごとの重要度を算出することができるので、より有益な発言を分析することができる。
図6は、第2の実施形態による効果を説明するための図である。図6に示すように、例えば、情報分析システム100において、収集部131は、インターネット上のBBSサイトからスレッドデータを収集し(S20)、収集したスレッドデータを発言切り出し部132Aへ送る(S21)。続いて、発言切り出し部132Aは、スレッドデータから発言を切り出して発言データを生成し、生成した発言データを発言分析部132Bへ送る(S22)。そして、発言分析部132Bは、発言の重要度を発言ごとに分析し、発言データと重要度の組を格納部133へ送る(S23)。続いて、発言切り出し部132Aは、スレッドデータをスレッド分析部132Cへ送る(S24)。そして、スレッド分析部132Cは、スレッドのカテゴリ及びスレッドの重要度を分析し、分析したカテゴリ及びスレッドの重要度を格納部133へ送る(S25)。そして、格納部133は、発言の重要度とスレッドの重要度とから、発言の総合重要度を算出し、発言データ、発言の総合重要度、及びカテゴリを対応づけて、発言ごとに分析結果記憶部122に格納する(S26)。これにより、第2の実施形態に係る情報分析システム100は、より有益な発言を分析することができる。
[第3の実施形態]
第1及び第2の実施形態では、情報分析システム100がスレッドのカテゴリを分析する場合を説明したが、実施形態はこれに限定されるものではない。例えば、情報分析システム100は、発言の内容をカテゴリ分類した発言カテゴリについても分析し、それぞれの発言に付与する場合であっても良い。なお、発言カテゴリとは、例えば、「好意的」、「敵対的」、「賞賛」、「冒とく」といった発言者の感情を推測するものや、「引用」、「提案」、「質問」、「回答」といった発言の種類を推測するもの等が含まれる。すなわち、発言カテゴリは、発言の内容が、予め設定された複数のカテゴリのいずれに属するかを示す情報である。
第1及び第2の実施形態では、情報分析システム100がスレッドのカテゴリを分析する場合を説明したが、実施形態はこれに限定されるものではない。例えば、情報分析システム100は、発言の内容をカテゴリ分類した発言カテゴリについても分析し、それぞれの発言に付与する場合であっても良い。なお、発言カテゴリとは、例えば、「好意的」、「敵対的」、「賞賛」、「冒とく」といった発言者の感情を推測するものや、「引用」、「提案」、「質問」、「回答」といった発言の種類を推測するもの等が含まれる。すなわち、発言カテゴリは、発言の内容が、予め設定された複数のカテゴリのいずれに属するかを示す情報である。
そこで、第3の実施形態では、情報分析システム100が、発言カテゴリを分析し、それぞれの発言に付与する場合を説明する。なお、以下の説明では、第2の実施形態と共通する構成及び処理については、説明を省略する。
図1を用いて、第3の実施形態に係る情報分析システム100の構成について説明する。第3の実施形態に係る情報分析システム100は、第2の実施形態に係る情報分析システム100と同様の構成を備えるが、発言分析部132B及び格納部133における処理が一部相違する。
発言分析部132Bは、第1の実施形態において説明した処理に加えて、発言カテゴリを、発言データに基づいて、発言ごとに分析する。例えば、発言分析部132Bは、発言データから発言カテゴリを導出するための機械学習エンジンを用いて、発言カテゴリを分析する。そして、発言分析部132Bは、分析結果として、発言の重要度に加えて、発言カテゴリを格納部133に送る。なお、この場合、機械学習エンジンには、いくつかの発言と発言カテゴリとの組を予め学習させておく。学習させる方法としては、例えば、代表的なBBSサイトからいくつかのスレッドを選択し、スレッドに含まれる発言を「好意的」、「敵対的」、「賞賛」、「冒とく」、「引用」、「提案」、「質問」、「回答」といったカテゴリに人手で分類して学習させる方法が挙げられる。
具体的には、発言分析部132Bは、第1の実施形態に係る処理において変換された特徴ベクトルを機械学習エンジンに与え、発言ごとに発言カテゴリを算出する。ここで使用する機械学習エンジンは種類を問わないが、例えば、オープンソースのJubatus等を用いることができる。そして、発言分析部132Bは、機械学習エンジンで算出されたスレッドの重要度を格納部133に送る。
格納部133は、発言ごとの発言カテゴリを、当該発言ごとに対応づけて格納する。例えば、格納部133は、発言データ、総合重要度、スレッドのカテゴリ、及び発言カテゴリを対応づけて、発言ごとに分析結果記憶部122に格納する。
図7は、第3の実施形態に係る情報分析システムにおける処理の流れを示すフローチャートである。なお、図7に示すステップS301〜S302の処理は、図3のステップS101〜S102の処理と同様であるので、説明を省略する。
図7に示すように、情報分析システム100の発言分析部132Bは、発言の重要度及び発言カテゴリを分析する(ステップS303)。例えば、発言分析部132Bは、発言データから発言カテゴリを導出するための機械学習エンジンを用いて、発言カテゴリを分析する。そして、発言分析部132Bは、分析結果として、発言の重要度に加えて、発言カテゴリを格納部133に送る。
続いて、スレッド分析部132Cは、スレッドのカテゴリ及びスレッドの重要度を分析する(ステップS304)。例えば、発言分析部132Bは、第1の実施形態において説明した処理に加えて、スレッドデータからスレッドの重要度を算出するための機械学習エンジンを用いて、スレッドの重要度を分析する。そして、発言分析部132Bは、分析結果として、スレッドが属するカテゴリに加えて、スレッドの重要度を格納部133に送る。
そして、格納部133は、発言の重要度とスレッドの重要度とから、発言の総合重要度を算出する(ステップS305)。例えば、格納部133は、発言の重要度及びスレッドの重要度の和、積、平均、その他の算術演算による値等を総合重要度として算出する。そして、格納部133は、発言データ、発言の総合重要度、発言カテゴリ、及びスレッドのカテゴリを対応づけて、発言ごとに分析結果記憶部122に格納する(ステップS306)。
なお、図7に示した処理手順は、必ずしも上記の順序で実行されなくても良い。例えば、ステップS303の処理とステップS304の処理は、上述した順序とは逆の順序で実行されても良いし、並行処理として実行されても良い。
このように、第3の実施形態に係る情報分析システム100は、発言カテゴリを分析し、それぞれの発言に付与する。これにより、情報分析システム100は、スレッドのカテゴリに加え、発言ごとの発言カテゴリも踏まえて分析するので、より有益な発言を分析することができる。
図8は、第3の実施形態による効果を説明するための図である。図8に示すように、例えば、情報分析システム100において、収集部131は、インターネット上のBBSサイトからスレッドデータを収集し(S30)、収集したスレッドデータを発言切り出し部132Aへ送る(S31)。続いて、発言切り出し部132Aは、スレッドデータから発言を切り出して発言データを生成し、生成した発言データを発言分析部132Bへ送る(S32)。そして、発言分析部132Bは、発言の重要度及び発言カテゴリを発言ごとに分析し、発言データ、発言の重要度、及び発言カテゴリの組を格納部133へ送る(S33)。続いて、発言切り出し部132Aは、スレッドデータをスレッド分析部132Cへ送る(S34)。そして、スレッド分析部132Cは、スレッドのカテゴリ及びスレッドの重要度を分析し、分析したカテゴリ及びスレッドの重要度を格納部133へ送る(S35)。そして、格納部133は、発言の重要度とスレッドの重要度とから、発言の総合重要度を算出し、発言データ、発言の総合重要度、発言カテゴリ、及びスレッドのカテゴリを対応づけて、発言ごとに分析結果記憶部122に格納する(S36)。これにより、第3の実施形態に係る情報分析システム100は、より有益な発言を分析することができる。
なお、第3の実施形態では、第2の実施形態に係る情報分析システム100が、更に、発言カテゴリを分析し、それぞれの発言に付与する場合を説明したが、これに限定されるものではない。例えば、第1の実施形態に係る情報分析システム100が、発言カテゴリを分析し、それぞれの発言に付与する場合であっても良い。すなわち、第3の実施形態において、スレッドの重要度を算出する処理は実行されなくても良い。
[システム構成等]
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、格納部133は、分析部132と統合しても良いし、発言分析部132B若しくはスレッド分析部132Cと統合しても良い。更に、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、格納部133は、分析部132と統合しても良いし、発言分析部132B若しくはスレッド分析部132Cと統合しても良い。更に、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
[処理対象]
また、上述した第1〜第3の実施形態では、処理対象としてBBSのスレッドデータが分析される場合を説明したが、実施形態はこれに限定されるものではない。例えば、情報分析システム100は、電子メールがスレッド形式(所定の電子メールに対する返信が連なって表示される形式)で表示されたものや、SNS(Social Networking Service)等における所定の投稿に対して返信された一連の発言についても処理対象とすることができる。なお、電子メールを対象とする場合、返信の判定や返信数のカウントには、発言冒頭の「>(数字)」に着目する方法に代えて、電子メールの「In−Reply−To」ヘッダに着目して返信の判定や返信数のカウントを行うことができる。他の処理対象についても同様に、処理対象に応じた返信の判定法や返信数のカウント方法を規定することができる。
また、上述した第1〜第3の実施形態では、処理対象としてBBSのスレッドデータが分析される場合を説明したが、実施形態はこれに限定されるものではない。例えば、情報分析システム100は、電子メールがスレッド形式(所定の電子メールに対する返信が連なって表示される形式)で表示されたものや、SNS(Social Networking Service)等における所定の投稿に対して返信された一連の発言についても処理対象とすることができる。なお、電子メールを対象とする場合、返信の判定や返信数のカウントには、発言冒頭の「>(数字)」に着目する方法に代えて、電子メールの「In−Reply−To」ヘッダに着目して返信の判定や返信数のカウントを行うことができる。他の処理対象についても同様に、処理対象に応じた返信の判定法や返信数のカウント方法を規定することができる。
[プログラム]
また、上記実施形態において説明した情報分析システム100が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。例えば、第1の実施形態に係る情報分析システム100が実行する処理をコンピュータが実行可能な言語で記述した情報分析プログラムを作成することもできる。この場合、コンピュータが情報分析プログラムを実行することにより、上記実施形態と同様の効果を得ることができる。さらに、かかる情報分析プログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録された情報分析プログラムをコンピュータに読み込ませて実行することにより上記第1の実施形態と同様の処理を実現してもよい。以下に、図1に示した情報分析システム100と同様の機能を実現する情報分析プログラムを実行するコンピュータの一例を説明する。
また、上記実施形態において説明した情報分析システム100が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。例えば、第1の実施形態に係る情報分析システム100が実行する処理をコンピュータが実行可能な言語で記述した情報分析プログラムを作成することもできる。この場合、コンピュータが情報分析プログラムを実行することにより、上記実施形態と同様の効果を得ることができる。さらに、かかる情報分析プログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録された情報分析プログラムをコンピュータに読み込ませて実行することにより上記第1の実施形態と同様の処理を実現してもよい。以下に、図1に示した情報分析システム100と同様の機能を実現する情報分析プログラムを実行するコンピュータの一例を説明する。
図9は、情報分析プログラムを実行するコンピュータ1000を示す図である。図9に例示するように、コンピュータ1000は、例えば、メモリ1010と、CPU1020と、ハードディスクドライブインタフェース1030と、ディスクドライブインタフェース1040と、ネットワークインタフェース1070とを有し、これらの各部はバス1080によって接続される。
メモリ1010は、図9に例示するように、ROM(Read Only Memory)1011及びRAM(Random Access Memory)1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、図9に例示するように、ハードディスクドライブ1031に接続される。ディスクドライブインタフェース1040は、図9に例示するように、ディスクドライブ1041に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブに挿入される。
ここで、図9に例示するように、ハードディスクドライブ1031は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093、プログラムデータ1094を記憶する。すなわち、上記のいずれかのプログラムは、コンピュータ1000によって実行される指令が記述されたプログラムモジュールとして、例えばハードディスクドライブ1031に記憶される。
また、上記実施形態で説明した各種データは、プログラムデータとして、例えばメモリ1010やハードディスクドライブ1031に記憶される。そして、CPU1020が、メモリ1010やハードディスクドライブ1031に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出し、各手順を実行する。
なお、情報分析プログラムに係るプログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1031に記憶される場合に限られず、例えば着脱可能な記憶媒体にそれぞれ記憶され、ディスクドライブ等を介してCPU1020によって読み出されてもよい。あるいは、情報分析プログラムに係るプログラムモジュール1093やプログラムデータ1094は、ネットワーク(LAN(Local Area Network)、WAN(Wide Area Network)等)を介して接続された他のコンピュータにそれぞれ記憶され、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
これらの実施形態やその変形は、本願が開示する技術に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
100 情報分析システム
110 通信処理部
120 記憶部
121 スレッドデータ記憶部
122 分析結果記憶部
130 機能部
131 収集部
132 分析部
132A 発言切り出し部
132B 発言分析部
132C スレッド分析部
133 格納部
140 制御部
110 通信処理部
120 記憶部
121 スレッドデータ記憶部
122 分析結果記憶部
130 機能部
131 収集部
132 分析部
132A 発言切り出し部
132B 発言分析部
132C スレッド分析部
133 格納部
140 制御部
Claims (5)
- ネットワーク上に投稿された発言の集合であるスレッドについて、当該スレッドに含まれる発言の重要度を、当該発言に関するデータである発言データに基づいて、当該発言ごとに分析する発言分析部と、
前記スレッドが、予め設定された複数のカテゴリのいずれに属するかを、当該スレッドに関するデータであるスレッドデータに基づいて分析するスレッド分析部と、
前記発言ごとに、当該発言と、当該発言の重要度と、当該発言が含まれるスレッドのカテゴリとを対応づけて所定の記憶部に格納する格納部と
を備えることを特徴とする情報分析システム。 - 前記スレッド分析部は、更に、前記スレッドデータに基づいて、前記スレッドの重要度を分析し、
前記格納部は、前記発言の重要度及び前記スレッドの重要度に基づいて、当該発言の総合重要度を算出し、算出した総合重要度と、前記発言と、当該発言が含まれるスレッドのカテゴリとを前記発言ごとに対応づけて格納することを特徴とする請求項1に記載の情報分析システム。 - 前記発言分析部は、更に、前記発言の内容が予め設定された複数のカテゴリのいずれに属するかを示す発言カテゴリを、前記発言データに基づいて、前記発言ごとに分析し、
前記格納部は、更に、前記発言ごとの発言カテゴリを、当該発言ごとに対応づけて格納することを特徴とする請求項1又は2に記載の情報分析システム。 - 情報分析システムによって実行される情報分析方法であって、
ネットワーク上に投稿された発言の集合であるスレッドについて、当該スレッドに含まれる発言の重要度を、当該発言に関するデータである発言データに基づいて、当該発言ごとに分析する発言分析工程と、
前記スレッドが、予め設定された複数のカテゴリのいずれに属するかを、当該スレッドに関するデータであるスレッドデータに基づいて分析するスレッド分析工程と、
前記発言ごとに、当該発言の重要度と、当該発言が含まれるスレッドのカテゴリとを対応づけて所定の記憶部に格納する格納工程と
を含むことを特徴とする情報分析方法。 - ネットワーク上に投稿された発言の集合であるスレッドについて、当該スレッドに含まれる発言の重要度を、当該発言に関するデータである発言データに基づいて、当該発言ごとに分析する発言分析ステップと、
前記スレッドが、予め設定された複数のカテゴリのいずれに属するかを、当該スレッドに関するデータであるスレッドデータに基づいて分析するスレッド分析ステップと、
前記発言ごとに、当該発言の重要度と、当該発言が含まれるスレッドのカテゴリとを対応づけて所定の記憶部に格納する格納ステップと
をコンピュータに実行させることを特徴とする情報分析プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014111596 | 2014-05-29 | ||
JP2014111596 | 2014-05-29 | ||
PCT/JP2015/064939 WO2015182559A1 (ja) | 2014-05-29 | 2015-05-25 | 情報分析システム、情報分析方法及び情報分析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2015182559A1 JPWO2015182559A1 (ja) | 2017-04-20 |
JP6154072B2 true JP6154072B2 (ja) | 2017-06-28 |
Family
ID=54698886
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016523487A Active JP6154072B2 (ja) | 2014-05-29 | 2015-05-25 | 情報分析システム、情報分析方法及び情報分析プログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US9940319B2 (ja) |
EP (1) | EP3136260A4 (ja) |
JP (1) | JP6154072B2 (ja) |
CN (1) | CN106462614B (ja) |
WO (1) | WO2015182559A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10614418B2 (en) * | 2016-02-02 | 2020-04-07 | Ricoh Company, Ltd. | Conference support system, conference support method, and recording medium |
JP7098875B2 (ja) * | 2016-02-02 | 2022-07-12 | 株式会社リコー | 会議支援システム、会議支援装置、会議支援方法及びプログラム |
JP7372372B2 (ja) * | 2022-02-18 | 2023-10-31 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7185065B1 (en) * | 2000-10-11 | 2007-02-27 | Buzzmetrics Ltd | System and method for scoring electronic messages |
US20030101166A1 (en) | 2001-11-26 | 2003-05-29 | Fujitsu Limited | Information analyzing method and system |
US7814043B2 (en) | 2001-11-26 | 2010-10-12 | Fujitsu Limited | Content information analyzing method and apparatus |
US7203704B1 (en) * | 2002-06-03 | 2007-04-10 | General Electric Company | Method and apparatus of cross-pollinating a post to computerized bulletin boards |
KR100469900B1 (ko) | 2004-05-27 | 2005-02-03 | 엔에이치엔(주) | 네트워크를 통한 커뮤니티 검색 서비스 시스템 및 그 방법 |
JP2007058755A (ja) | 2005-08-26 | 2007-03-08 | Dainippon Screen Mfg Co Ltd | 電子掲示板システム、電子掲示板システムのサーバー、電子掲示板システムのクライアントにおけるスレッド表示処理方法、およびプログラム |
JP4322887B2 (ja) | 2006-06-01 | 2009-09-02 | 株式会社東芝 | スレッド順位付け装置及び方法 |
JP2007328610A (ja) * | 2006-06-08 | 2007-12-20 | Fuji Xerox Co Ltd | 情報管理装置及び情報管理方法、並びにコンピュータ・プログラム |
JP4464975B2 (ja) * | 2007-01-22 | 2010-05-19 | インターナショナル・ビジネス・マシーンズ・コーポレーション | コンピュータネットワーク上の電子文書の重要度を、当該電子文書に関係付けられた他の電子文書の当該電子文書に対する批評に基づいて、計算するためのコンピュータ装置、コンピュータプログラム及び方法 |
CN101193038B (zh) * | 2007-06-08 | 2010-12-22 | 腾讯科技(深圳)有限公司 | 回复主题帖、查看回复帖及交互主题帖的方法及系统 |
CN101520784B (zh) * | 2008-02-29 | 2011-09-28 | 富士通株式会社 | 信息发布系统和信息发布方法 |
US8117207B2 (en) | 2008-04-18 | 2012-02-14 | Biz360 Inc. | System and methods for evaluating feature opinions for products, services, and entities |
JP2010231471A (ja) | 2009-03-27 | 2010-10-14 | Nomura Research Institute Ltd | インターネット上の掲示板分析システム及び方法 |
CN101727487A (zh) * | 2009-12-04 | 2010-06-09 | 中国人民解放军信息工程大学 | 一种面向网络评论的观点主题识别方法和系统 |
US8510257B2 (en) * | 2010-10-19 | 2013-08-13 | Xerox Corporation | Collapsed gibbs sampler for sparse topic models and discrete matrix factorization |
WO2012171073A1 (en) | 2011-06-16 | 2012-12-20 | Commonwealth Scientific And Industrial Research Organisation | Social media monitoring |
WO2014047727A1 (en) * | 2012-09-28 | 2014-04-03 | Alkis Papadopoullos | A method and system for monitoring social media and analyzing text to automate classification of user posts using a facet based relevance assessment model |
CN103150333B (zh) * | 2013-01-26 | 2016-01-13 | 安徽博约信息科技有限责任公司 | 微博媒体中的意见领袖识别方法 |
-
2015
- 2015-05-25 CN CN201580027532.7A patent/CN106462614B/zh active Active
- 2015-05-25 US US15/313,749 patent/US9940319B2/en active Active
- 2015-05-25 WO PCT/JP2015/064939 patent/WO2015182559A1/ja active Application Filing
- 2015-05-25 EP EP15799967.3A patent/EP3136260A4/en not_active Ceased
- 2015-05-25 JP JP2016523487A patent/JP6154072B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2015182559A1 (ja) | 2015-12-03 |
US20170185578A1 (en) | 2017-06-29 |
US9940319B2 (en) | 2018-04-10 |
CN106462614A (zh) | 2017-02-22 |
EP3136260A1 (en) | 2017-03-01 |
CN106462614B (zh) | 2020-08-18 |
EP3136260A4 (en) | 2017-08-30 |
JPWO2015182559A1 (ja) | 2017-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106503192B (zh) | 基于人工智能的命名实体识别方法及装置 | |
US9923860B2 (en) | Annotating content with contextually relevant comments | |
US9910886B2 (en) | Visual representation of question quality | |
WO2016085409A1 (en) | A method and system for sentiment classification and emotion classification | |
TW202020691A (zh) | 特徵詞的確定方法、裝置和伺服器 | |
KR20200007969A (ko) | 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체 | |
US10108698B2 (en) | Common data repository for improving transactional efficiencies of user interactions with a computing device | |
US20200311114A1 (en) | System for topic discovery and sentiment analysis on a collection of documents | |
KR102285142B1 (ko) | 챗봇을 위한 학습 데이터 추천 장치 및 방법 | |
KR102334236B1 (ko) | 음성 변환 Text Data에서 의미있는 키워드 추출 방법과 활용 | |
CN111177462B (zh) | 视频分发时效的确定方法和装置 | |
JP6230725B2 (ja) | 因果関係分析装置、及び因果関係分析方法 | |
JP6154072B2 (ja) | 情報分析システム、情報分析方法及び情報分析プログラム | |
JP5462546B2 (ja) | コンテンツ検出支援装置、コンテンツ検出支援方法およびコンテンツ検出支援プログラム | |
US10013482B2 (en) | Context-dependent evidence detection | |
JP6522446B2 (ja) | ラベル付与装置、方法およびプログラム | |
CN110008807A (zh) | 一种合同内容识别模型的训练方法、装置及设备 | |
RU2631975C2 (ru) | Способ и система для обработки входных команд пользователя | |
JP2016162163A (ja) | 情報処理装置及び情報処理プログラム | |
JP2010026923A (ja) | 文書分類方法、文書分類装置、文書分類プログラム、および、コンピュータ読取り可能記録媒体 | |
JPWO2015016133A1 (ja) | 情報管理装置及び情報管理方法 | |
CN113255368A (zh) | 针对文本数据进行情感分析的方法、装置及相关设备 | |
US20190197172A1 (en) | System and method for data analysis and presentation of data | |
JP2014112306A (ja) | 要望文抽出装置、要望内容同定モデル学習装置、方法、及びプログラム | |
JP2014038392A (ja) | スパムアカウントスコア算出装置、スパムアカウントスコア算出方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170530 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170531 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6154072 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |