JP5724878B2 - 文書分析装置、文書分析方法、及びプログラム - Google Patents
文書分析装置、文書分析方法、及びプログラム Download PDFInfo
- Publication number
- JP5724878B2 JP5724878B2 JP2011543197A JP2011543197A JP5724878B2 JP 5724878 B2 JP5724878 B2 JP 5724878B2 JP 2011543197 A JP2011543197 A JP 2011543197A JP 2011543197 A JP2011543197 A JP 2011543197A JP 5724878 B2 JP5724878 B2 JP 5724878B2
- Authority
- JP
- Japan
- Prior art keywords
- reputation information
- event
- document
- analysis target
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims description 444
- 238000011156 evaluation Methods 0.000 claims description 168
- 238000000605 extraction Methods 0.000 claims description 90
- 230000014509 gene expression Effects 0.000 claims description 83
- 238000000034 method Methods 0.000 claims description 31
- 230000000694 effects Effects 0.000 claims description 17
- 238000010606 normalization Methods 0.000 claims description 15
- 239000000284 extract Substances 0.000 claims description 13
- 230000007717 exclusion Effects 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 15
- 238000004519 manufacturing process Methods 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 10
- 238000003860 storage Methods 0.000 description 10
- 230000007704 transition Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 7
- 239000012491 analyte Substances 0.000 description 6
- 230000037213 diet Effects 0.000 description 6
- 235000005911 diet Nutrition 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000007423 decrease Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000010432 diamond Substances 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 235000015277 pork Nutrition 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
分析対象に関する記述を含む分析対象文書に出現している第1の評判情報の中から、指定された前記イベントに関する記述を含むイベント関連文書に出現している第2の評判情報と一致する情報を特定し、特定した情報を共通評判情報として選別する共通評判情報選別部と、
前記共通評判情報が、前記イベントの発生前に作成された前記分析対象文書中に出現している回数と、前記共通評判情報が、前記イベントの発生後に作成された前記分析対象文書中に出現している回数とをそれぞれ計数し、前記計数の結果に基づいて、前記影響を表す指標を導出するイベント影響分析部と、を備えていることを特徴とする。
(a)分析対象に関する記述を含む分析対象文書に出現している第1の評判情報の中から、指定された前記イベントに関する記述を含むイベント関連文書に出現している第2の評判情報と一致する情報を特定し、特定した情報を共通評判情報として選別する、ステップと、
(b)前記共通評判情報が、前記イベントの発生前に作成された前記分析対象文書中に出現している回数と、前記共通評判情報が、前記イベントの発生後に作成された前記分析対象文書中に出現している回数とをそれぞれ計数し、前記計数の結果に基づいて、前記影響を表す指標を導出する、ステップと、
を有する、ことを特徴とする。
前記コンピュータに、
(a)分析対象に関する記述を含む分析対象文書に出現している第1の評判情報の中から、指定された前記イベントに関する記述を含むイベント関連文書に出現している第2の評判情報と一致する情報を特定し、特定した情報を共通評判情報として選別する、ステップと、
(b)前記共通評判情報が、前記イベントの発生前に作成された前記分析対象文書中に出現している回数と、前記共通評判情報が、前記イベントの発生後に作成された前記分析対象文書中に出現している回数とをそれぞれ計数し、前記計数の結果に基づいて、前記影響を表す指標を導出する、ステップと、
を実行させることを特徴とする。
以下、本発明の実施の形態における文書分析装置、文書分析方法、及びプログラムについて、図1〜図10を参照しながら説明する。最初に、図1を用いて、本実施の形態における文書分析装置1の構成を説明する。図1は、本発明の実施の形態における文書分析装置の構成を示すブロック図である。
特定のイベントが分析対象に与える影響を分析する文書分析装置であって、
分析対象に関する記述を含む分析対象文書に出現している第1の評判情報の中から、指定された前記イベントに関する記述を含むイベント関連文書に出現している第2の評判情報と一致する情報を特定し、特定した情報を共通評判情報として選別する共通評判情報選別部と、
前記共通評判情報が、前記イベントの発生前に作成された前記分析対象文書中に出現している回数と、前記共通評判情報が、前記イベントの発生後に作成された前記分析対象文書中に出現している回数とをそれぞれ計数し、前記計数の結果に基づいて、前記影響を表す指標を導出するイベント影響分析部と、を備えていることを特徴とする文書分析装置。
前記第1の評判情報が、前記分析対象文書中の作成者による評価を含み、前記第2の評判情報が、前記イベント関連文書中の作成者による評価を含む、付記1に記載の文書分析装置。
前記第1の評判情報及び前記第2の評判情報それぞれが、前記評価の対象と、前記評価の属性と、前記評価を表す表現とを少なくとも要素として含み、
前記共通評判情報選別部が、
前記第1の評判情報及び前記第2の評判情報それぞれにおける前記対象が一致する場合、
前記第1の評判情報及び前記第2の評判情報それぞれにおける前記属性が一致する場合、
前記第1の評判情報及び前記第2の評判情報それぞれにおける前記表現に対して、付属語の除外、及び活用を原形に戻した状態での正規化を行って得られた表現が一致する、又は一方が他方の反意表現となる場合、
のうち少なくとも一つに該当することを条件に、前記第1の評判情報が前記第2の評判情報と一致すると判定して、前記共通情報を選別する、付記2に記載の文書分析装置。
前記分析対象文書から、前記分析対象文書の作成者による評価が記述されている箇所を前記第1の評判情報として抽出する、分析対象評判情報抽出部と、
前記イベント関連文書から、前記イベント関連文書の作成者による評価が記述されている箇所を前記第2の評判情報として抽出する、イベント評判情報抽出部とを更に備え、
前記分析対象評判情報抽出部は、前記分析対象文書のうち、前記イベント関連文書にも該当する文書を除外して、前記第1の評判情報の抽出を行う、付記2または付記3に記載の文書分析装置。
前記イベント影響分析部が、前記分析対象文書中に出現する前記共通評判情報を、予め設定された分類基準に従ってグループ分けし、前記グループ毎に、当該グループに属する前記共通評判情報が、前記イベントの発生前に作成された前記分析対象文書中に出現している回数と、当該グループに属する前記共通評判情報が、前記イベントの発生後に作成された前記分析対象文書中に出現している回数とをそれぞれ計数する、付記2〜付記4のいずれかに記載の文書分析装置。
前記イベント影響分析部が、前記分析対象文書中に出現する前記共通評判情報を、前記分析対象文書中の作成者による評価が肯定的評価のグループと、前記分析対象文書中の作成者による評価が否定的評価のグループと、が含まれるようにグループ分けを行う、付記5に記載の文書分析装置。
前記イベント影響分析部が、前記計数によって得られた値を、前記影響を表す指標として導出する、付記1〜付記6のいずれかに記載の文書分析装置。
前記イベント影響分析部が、前記影響を表す指標として、前記計数の結果を用いて、前記共通評判情報の出現確率、又は前記共通評判情報の出現傾向を示す数値を導出する、付記1〜付記6のいずれかに記載の文書分析装置。
特定のイベントが分析対象に与える影響を分析するための方法であって、
(a)分析対象に関する記述を含む分析対象文書に出現している第1の評判情報の中から、指定された前記イベントに関する記述を含むイベント関連文書に出現している第2の評判情報と一致する情報を特定し、特定した情報を共通評判情報として選別する、ステップと、
(b)前記共通評判情報が、前記イベントの発生前に作成された前記分析対象文書中に出現している回数と、前記共通評判情報が、前記イベントの発生後に作成された前記分析対象文書中に出現している回数とをそれぞれ計数し、前記計数の結果に基づいて、前記影響を表す指標を導出する、ステップと、
を有する、ことを特徴とする文書分析方法。
前記第1の評判情報が、前記分析対象文書中の作成者による評価を含み、
前記第2の評判情報が、前記イベント関連文書中の作成者による評価及び価値判断を含む、付記9に記載の文書分析方法。
前記第1の評判情報及び前記第2の評判情報それぞれが、前記評価の対象と、前記評価の属性と、前記評価に用いられた表現とを少なくとも要素として含み、
前記(a)のステップにおいて、
前記第1の評判情報及び前記第2の評判情報それぞれにおける前記対象が一致する場合、
前記第1の評判情報及び前記第2の評判情報それぞれにおける前記属性が一致する場合、
前記第1の評判情報及び前記第2の評判情報それぞれにおける前記表現に対して、付属語の除外、及び活用を原形に戻した状態での正規化を行って得られた表現が一致する、又は一方が他方の反意表現となる場合、
のうち少なくとも一つに該当することを条件に、前記第1の評判情報が前記第2の評判情報と一致すると判定して、前記共通情報を選別する、付記10に記載の文書分析方法。
(c)前記分析対象文書から、前記分析対象文書の作成者による評価が記述されている箇所を前記第1の評判情報として抽出する、ステップと、
(d)前記イベント関連文書から、前記イベント関連文書の作成者による評価が記述されている箇所を前記第2の評判情報として抽出する、ステップとを、更に有し、
前記(c)及び(d)のステップは、前記(a)及び(b)のステップの実行前に、実行され、
前記(c)のステップにおいて、前記分析対象文書のうち、前記イベント関連文書にも該当する文書を除外して、前記第1の評判情報の抽出を行う、付記10または11に記載の文書分析方法。
前記(b)のステップにおいて、
前記分析対象文書中に出現する前記共通評判情報を、予め設定された分類基準に従ってグループ分けし、前記グループ毎に、当該グループに属する前記共通評判情報が、前記イベントの発生前に作成された前記分析対象文書中に出現している回数と、当該グループに属する前記共通評判情報が、前記イベントの発生後に作成された前記分析対象文書中に出現している回数とをそれぞれ計数する、付記10〜12のいずれかに記載の文書分析方法。
前記(b)のステップにおいて、
前記分析対象文書中に出現する前記共通評判情報を、前記分析対象文書中の作成者による評価が肯定的評価のグループと、前記分析対象文書中の作成者による評価が否定的評価のグループと、が含まれるようにグループ分けを行う、付記13に記載の文書分析方法。
前記(b)のステップにおいて、前記計数によって得られた値を、前記影響を表す指標として導出する、付記9〜14のいずれかに記載の文書分析方法。
前記(b)のステップにおいて、前記影響を表す指標として、前記計数の結果を用いて、前記共通評判情報の出現確率、又は前記共通評判情報の出現傾向を示す数値を導出する、付記9〜14のいずれかに記載の文書分析方法。
コンピュータによって、特定のイベントが分析対象に与える影響を分析するための、プログラムであって、
前記コンピュータに、
(a)分析対象に関する記述を含む分析対象文書に出現している第1の評判情報の中から、指定された前記イベントに関する記述を含むイベント関連文書に出現している第2の評判情報と一致する情報を特定し、特定した情報を共通評判情報として選別する、ステップと、
(b)前記共通評判情報が、前記イベントの発生前に作成された前記分析対象文書中に出現している回数と、前記共通評判情報が、前記イベントの発生後に作成された前記分析対象文書中に出現している回数とをそれぞれ計数し、前記計数の結果に基づいて、前記影響を表す指標を導出する、ステップと、
を実行させる、プログラム。
前記第1の評判情報が、前記分析対象文書中の作成者による評価を含み、
前記第2の評判情報が、前記イベント関連文書中の作成者による評価及び価値判断を含む、付記17に記載のプログラム。
前記第1の評判情報及び前記第2の評判情報それぞれが、前記評価の対象と、前記評価の属性と、前記評価に用いられた表現とを少なくとも要素として含み、
前記(a)のステップにおいて、
前記第1の評判情報及び前記第2の評判情報それぞれにおける前記対象が一致する場合、
前記第1の評判情報及び前記第2の評判情報それぞれにおける前記属性が一致する場合、
前記第1の評判情報及び前記第2の評判情報それぞれにおける前記表現に対して、付属語の除外、及び活用を原形に戻した状態での正規化を行って得られた表現が一致する、又は一方が他方の反意表現となる場合、
のうち少なくとも一つに該当することを条件に、前記第1の評判情報が前記第2の評判情報と一致すると判定して、前記共通情報を選別する、付記18に記載のプログラム。
(c)前記分析対象文書から、前記分析対象文書の作成者による評価が記述されている箇所を前記第1の評判情報として抽出する、ステップと、
(d)前記イベント関連文書から、前記イベント関連文書の作成者による評価が記述されている箇所を前記第2の評判情報として抽出する、ステップとを、前記(a)及び(b)のステップの実行前に、更に前記コンピュータに実行させ、
前記(c)のステップにおいて、前記分析対象文書のうち、前記イベント関連文書にも該当する文書を除外して、前記第1の評判情報の抽出を行う、付記18または19に記載のプログラム。
前記(b)のステップにおいて、
前記分析対象文書中に出現する前記共通評判情報を、予め設定された分類基準に従ってグループ分けし、前記グループ毎に、当該グループに属する前記共通評判情報が、前記イベントの発生前に作成された前記分析対象文書中に出現している回数と、当該グループに属する前記共通評判情報が、前記イベントの発生後に作成された前記分析対象文書中に出現している回数とをそれぞれ計数する、付記18〜20のいずれかに記載のプログラム。
前記(b)のステップにおいて、
前記分析対象文書中に出現する前記共通評判情報を、前記分析対象文書中の作成者による評価が肯定的評価のグループと、前記分析対象文書中の作成者による評価が否定的評価のグループと、が含まれるようにグループ分けを行う、付記21に記載のプログラム。
前記(b)のステップにおいて、前記計数によって得られた値を、前記影響を表す指標として導出する、付記17〜22のいずれかに記載のプログラム。
前記(b)のステップにおいて、前記影響を表す指標として、前記計数の結果を用いて、前記共通評判情報の出現確率、又は前記共通評判情報の出現傾向を示す数値を導出する、付記17〜22のいずれかに記載のプログラム。
10 分析対象入力部
20 分析対象文書取得部
30 文書データベース
40 分析対象評判情報抽出部
50 評価表現辞書
60 イベント入力部
70 イベント関連文書取得部
80 イベント評判情報抽出部
90 共通評判情報選別部
100 イベント影響分析部
110 影響出力部
120 コンピュータ
121 CPU
122 メインメモリ
123 記憶装置
124 入力インターフェイス
125 表示コントローラ
126 データリーダ/ライタ
127 通信インターフェイス
128 入力機器
129 ディスプレイ装置
130 記録媒体
131 バス
Claims (18)
- コンピュータによって、特定のイベントが分析対象に与える影響を分析するための、プログラムであって、
前記コンピュータに、
(a)分析対象に関する記述を含む分析対象文書に出現し、且つ前記分析対象文書中の作成者による評価を含む、第1の評判情報の中から、指定された前記イベントに関する記述を含むイベント関連文書に出現し、且つ、前記イベント関連文書中の作成者による評価及び価値判断を含む、第2の評判情報と一致する情報を特定し、特定した情報を共通評判情報として選別する、ステップと、
(b)前記共通評判情報が、前記イベントの発生前に作成された前記分析対象文書中に出現している回数と、前記共通評判情報が、前記イベントの発生後に作成された前記分析対象文書中に出現している回数とをそれぞれ計数し、前記計数の結果に基づいて、前記影響を表す指標を導出する、ステップと、
を実行させ、
更に、前記コンピュータに、前記(a)及び(b)のステップの実行前に、
(c)前記分析対象文書から、前記分析対象文書の作成者による評価が記述されている箇所を前記第1の評判情報として抽出する、ステップと、
(d)前記イベント関連文書から、前記イベント関連文書の作成者による評価が記述されている箇所を前記第2の評判情報として抽出する、ステップと、を実行させ、
前記(c)のステップにおいて、前記分析対象文書のうち、前記イベント関連文書にも該当する文書を除外して、前記第1の評判情報の抽出を行う、プログラム。 - 前記第1の評判情報及び前記第2の評判情報それぞれが、前記評価の対象と、前記評価の属性と、前記評価に用いられた表現とを少なくとも要素として含み、
前記(a)のステップにおいて、
前記第1の評判情報及び前記第2の評判情報それぞれにおける前記対象が一致する場合、
前記第1の評判情報及び前記第2の評判情報それぞれにおける前記属性が一致する場合、
前記第1の評判情報及び前記第2の評判情報それぞれにおける前記表現に対して、付属語の除外、及び活用を原形に戻した状態での正規化を行って得られた表現が一致する、又は一方が他方の反意表現となる場合、
のうち少なくとも一つに該当することを条件に、前記第1の評判情報が前記第2の評判情報と一致すると判定して、前記共通評判情報を選別する、請求項1に記載のプログラム。 - 前記(b)のステップにおいて、
前記分析対象文書中に出現する前記共通評判情報を、予め設定された分類基準に従ってグループ分けし、前記グループ毎に、当該グループに属する前記共通評判情報が、前記イベントの発生前に作成された前記分析対象文書中に出現している回数と、当該グループに属する前記共通評判情報が、前記イベントの発生後に作成された前記分析対象文書中に出現している回数とをそれぞれ計数する、請求項1または2に記載のプログラム。 - 前記(b)のステップにおいて、
前記分析対象文書中に出現する前記共通評判情報を、前記分析対象文書中の作成者による評価が肯定的評価のグループと、前記分析対象文書中の作成者による評価が否定的評価のグループと、が含まれるようにグループ分けを行う、請求項3に記載のプログラム。 - 前記(b)のステップにおいて、前記計数によって得られた値を、前記影響を表す指標として導出する、請求項1〜4のいずれかに記載のプログラム。
- 前記(b)のステップにおいて、前記影響を表す指標として、前記計数の結果を用いて、前記共通評判情報の出現確率、又は前記共通評判情報の出現傾向を示す数値を導出する、請求項1〜4のいずれかに記載のプログラム。
- 特定のイベントが分析対象に与える影響を分析する文書分析装置であって、
分析対象に関する記述を含む分析対象文書に出現し、且つ前記分析対象文書中の作成者による評価を含む、第1の評判情報の中から、指定された前記イベントに関する記述を含むイベント関連文書に出現し、且つ、前記イベント関連文書中の作成者による評価及び価値判断を含む、第2の評判情報と一致する情報を特定し、特定した情報を共通評判情報として選別する共通評判情報選別部と、
前記共通評判情報が、前記イベントの発生前に作成された前記分析対象文書中に出現している回数と、前記共通評判情報が、前記イベントの発生後に作成された前記分析対象文書中に出現している回数とをそれぞれ計数し、前記計数の結果に基づいて、前記影響を表す指標を導出するイベント影響分析部と、
前記分析対象文書から、前記分析対象文書の作成者による評価が記述されている箇所を前記第1の評判情報として抽出する、分析対象評判情報抽出部と、
前記イベント関連文書から、前記イベント関連文書の作成者による評価が記述されている箇所を前記第2の評判情報として抽出する、イベント評判情報抽出部と、
を備え、
前記分析対象評判情報抽出部は、前記分析対象文書のうち、前記イベント関連文書にも該当する文書を除外して、前記第1の評判情報の抽出を行う、
ことを特徴とする文書分析装置。 - 前記第1の評判情報及び前記第2の評判情報それぞれが、前記評価の対象と、前記評価の属性と、前記評価を表す表現とを少なくとも要素として含み、
前記共通評判情報選別部が、
前記第1の評判情報及び前記第2の評判情報それぞれにおける前記対象が一致する場合、前記第1の評判情報及び前記第2の評判情報それぞれにおける前記属性が一致する場合、前記第1の評判情報及び前記第2の評判情報それぞれにおける前記表現に対して、付属語の除外、及び活用を原形に戻した状態での正規化を行って得られた表現が一致する、又は一方が他方の反意表現となる場合、
のうち少なくとも一つに該当することを条件に、前記第1の評判情報が前記第2の評判情報と一致すると判定して、前記共通評判情報を選別する、請求項7に記載の文書分析装置。 - 前記イベント影響分析部が、前記分析対象文書中に出現する前記共通評判情報を、予め設定された分類基準に従ってグループ分けし、前記グループ毎に、当該グループに属する前記共通評判情報が、前記イベントの発生前に作成された前記分析対象文書中に出現している回数と、当該グループに属する前記共通評判情報が、前記イベントの発生後に作成された前記分析対象文書中に出現している回数とをそれぞれ計数する、請求項7または8に記載の文書分析装置。
- 前記イベント影響分析部が、前記分析対象文書中に出現する前記共通評判情報を、前記分析対象文書中の作成者による評価が肯定的評価のグループと、前記分析対象文書中の作成者による評価が否定的評価のグループと、が含まれるようにグループ分けを行う、請求項9に記載の文書分析装置。
- 前記イベント影響分析部が、前記計数によって得られた値を、前記影響を表す指標として導出する、請求項7〜10のいずれかに記載の文書分析装置。
- 前記イベント影響分析部が、前記影響を表す指標として、前記計数の結果を用いて、前記共通評判情報の出現確率、又は前記共通評判情報の出現傾向を示す数値を導出する、請求項7〜10のいずれかに記載の文書分析装置。
- 特定のイベントが分析対象に与える影響を分析するための方法であって、
(a)分析対象に関する記述を含む分析対象文書に出現し、且つ前記分析対象文書中の作成者による評価を含む、第1の評判情報の中から、指定された前記イベントに関する記述を含むイベント関連文書に出現し、且つ、前記イベント関連文書中の作成者による評価及び価値判断を含む、第2の評判情報と一致する情報を特定し、特定した情報を共通評判情報として選別する、ステップと、
(b)前記共通評判情報が、前記イベントの発生前に作成された前記分析対象文書中に出現している回数と、前記共通評判情報が、前記イベントの発生後に作成された前記分析対象文書中に出現している回数とをそれぞれ計数し、前記計数の結果に基づいて、前記影響を表す指標を導出する、ステップと、
(c)前記分析対象文書から、前記分析対象文書の作成者による評価が記述されている箇所を前記第1の評判情報として抽出する、ステップと、
(d)前記イベント関連文書から、前記イベント関連文書の作成者による評価が記述されている箇所を前記第2の評判情報として抽出する、ステップとを、
を有し、
前記(c)及び(d)のステップは、前記(a)及び(b)のステップの実行前に、実行され、
前記(c)のステップにおいて、前記分析対象文書のうち、前記イベント関連文書にも該当する文書を除外して、前記第1の評判情報の抽出を行う、
ことを特徴とする文書分析方法。 - 前記第1の評判情報及び前記第2の評判情報それぞれが、前記評価の対象と、前記評価の属性と、前記評価に用いられた表現とを少なくとも要素として含み、
前記(a)のステップにおいて、
前記第1の評判情報及び前記第2の評判情報それぞれにおける前記対象が一致する場合、
前記第1の評判情報及び前記第2の評判情報それぞれにおける前記属性が一致する場合、
前記第1の評判情報及び前記第2の評判情報それぞれにおける前記表現に対して、付属語の
除外、及び活用を原形に戻した状態での正規化を行って得られた表現が一致する、又は一方が他方の反意表現となる場合、
のうち少なくとも一つに該当することを条件に、前記第1の評判情報が前記第2の評判情報
と一致すると判定して、前記共通評判情報を選別する、請求項13に記載の文書分析方法。 - 前記(b)のステップにおいて、
前記分析対象文書中に出現する前記共通評判情報を、予め設定された分類基準に従ってグループ分けし、前記グループ毎に、当該グループに属する前記共通評判情報が、前記イベントの発生前に作成された前記分析対象文書中に出現している回数と、当該グループに属する前記共通評判情報が、前記イベントの発生後に作成された前記分析対象文書中に出現している回数とをそれぞれ計数する、請求項13または14に記載の文書分析方法。 - 前記(b)のステップにおいて、
前記分析対象文書中に出現する前記共通評判情報を、前記分析対象文書中の作成者による評価が肯定的評価のグループと、前記分析対象文書中の作成者による評価が否定的評価のグループと、が含まれるようにグループ分けを行う、請求項15に記載の文書分析方法。 - 前記(b)のステップにおいて、前記計数によって得られた値を、前記影響を表す指標として導出する、請求項13〜16のいずれかに記載の文書分析方法。
- 前記(b)のステップにおいて、前記影響を表す指標として、前記計数の結果を用いて、前記共通評判情報の出現確率、又は前記共通評判情報の出現傾向を示す数値を導出する、請求項13〜16のいずれかに記載の文書分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011543197A JP5724878B2 (ja) | 2009-11-25 | 2010-11-08 | 文書分析装置、文書分析方法、及びプログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009267266 | 2009-11-25 | ||
JP2009267266 | 2009-11-25 | ||
PCT/JP2010/069788 WO2011065211A1 (ja) | 2009-11-25 | 2010-11-08 | 文書分析装置、文書分析方法、及びコンピュータ読み取り可能な記録媒体 |
JP2011543197A JP5724878B2 (ja) | 2009-11-25 | 2010-11-08 | 文書分析装置、文書分析方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2011065211A1 JPWO2011065211A1 (ja) | 2013-04-11 |
JP5724878B2 true JP5724878B2 (ja) | 2015-05-27 |
Family
ID=44066314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011543197A Active JP5724878B2 (ja) | 2009-11-25 | 2010-11-08 | 文書分析装置、文書分析方法、及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9104761B2 (ja) |
JP (1) | JP5724878B2 (ja) |
WO (1) | WO2011065211A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013033375A (ja) * | 2011-08-02 | 2013-02-14 | Sony Corp | 情報処理装置、情報処理方法、および、プログラム |
JP5801252B2 (ja) * | 2012-05-17 | 2015-10-28 | 日本電信電話株式会社 | イベント抽出装置及び方法及びプログラム |
JP5929532B2 (ja) * | 2012-06-12 | 2016-06-08 | 日本電気株式会社 | イベント検出装置、イベント検出方法およびイベント検出プログラム |
US9785317B2 (en) | 2013-09-24 | 2017-10-10 | Palantir Technologies Inc. | Presentation and analysis of user interaction data |
US8812960B1 (en) | 2013-10-07 | 2014-08-19 | Palantir Technologies Inc. | Cohort-based presentation of user interaction data |
JP6525624B2 (ja) * | 2015-02-09 | 2019-06-05 | キヤノン株式会社 | 文書管理システム、文書登録装置、文書登録方法 |
WO2016147220A1 (ja) * | 2015-03-18 | 2016-09-22 | 日本電気株式会社 | テキスト可視化システム、テキスト可視化方法、及び、記録媒体 |
JP6342027B1 (ja) * | 2017-02-21 | 2018-06-13 | ヤフー株式会社 | 提供装置、提供方法および提供プログラム |
JP6664600B2 (ja) * | 2018-01-24 | 2020-03-13 | ヤフー株式会社 | 提供装置、提供方法および提供プログラム |
JP7001509B2 (ja) * | 2018-03-19 | 2022-01-19 | ヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8438469B1 (en) * | 2005-09-30 | 2013-05-07 | Google Inc. | Embedded review and rating information |
WO2008136421A1 (ja) * | 2007-04-27 | 2008-11-13 | Nec Corporation | 情報分析システム、情報分析方法及び情報分析用プログラム |
-
2010
- 2010-11-08 US US13/511,918 patent/US9104761B2/en active Active
- 2010-11-08 JP JP2011543197A patent/JP5724878B2/ja active Active
- 2010-11-08 WO PCT/JP2010/069788 patent/WO2011065211A1/ja active Application Filing
Non-Patent Citations (8)
Title |
---|
CSNG200300257010; 立石健二、外2名: 'インターネットからの評判情報検索' 電子情報通信学会技術研究報告[NLC2001-9〜21] 第101巻,第189号, 20010709, p.75-82, 社団法人電子情報通信学会 * |
CSNG200900092023; 大西貴士、外4名: '時系列分析によるWeb文書の情報信頼性判断支援:時系列変化からの重要トピックの抽出' 言語処理学会第15回年次大会発表論文集 , 20090302, p.104-107, 言語処理学会 * |
CSNH200800078002; 浅野久子、外3名: 'Web上の口コミを分析する 評判情報インデクシング技術' NTT技術ジャーナル 第20巻,第6号, 20080601, p.12-15, 社団法人電気通信協会 * |
JPN6010069194; 大西貴士、外4名: '時系列分析によるWeb文書の情報信頼性判断支援:時系列変化からの重要トピックの抽出' 言語処理学会第15回年次大会発表論文集 , 20090302, p.104-107, 言語処理学会 * |
JPN6010069198; 立石健二、外2名: 'インターネットからの評判情報検索' 電子情報通信学会技術研究報告[NLC2001-9〜21] 第101巻,第189号, 20010709, p.75-82, 社団法人電子情報通信学会 * |
JPN6010069202; 浅野久子、外3名: 'Web上の口コミを分析する 評判情報インデクシング技術' NTT技術ジャーナル 第20巻,第6号, 20080601, p.12-15, 社団法人電気通信協会 * |
JPN6010069206; Sadao Kurohashi、外6名: 'Information Credibility Analysis of Web Contents' 2008 Second International Symposium on Universal Communication (ISUC'08) [online] , 20081216, p.146-153, IEEE * |
JPN6010069208; NECビッグローブ株式会社: 'ブログクチコミ分析サービス「感°Report(かんどれぽーと)」の提供を開始' プレスリリース [online] , 20081031, NECビッグローブ * |
Also Published As
Publication number | Publication date |
---|---|
WO2011065211A1 (ja) | 2011-06-03 |
US20120278327A1 (en) | 2012-11-01 |
US9104761B2 (en) | 2015-08-11 |
JPWO2011065211A1 (ja) | 2013-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5724878B2 (ja) | 文書分析装置、文書分析方法、及びプログラム | |
Chen et al. | A survey on the use of topic models when mining software repositories | |
Elgendy et al. | Big data analytics in support of the decision making process | |
US20210158187A1 (en) | System and method for detecting friction in websites | |
Vincent et al. | Measuring the importance of user-generated content to search engines | |
CN101408885B (zh) | 利用统计分布对主题进行建模 | |
Qu et al. | Matchmaking in reward-based crowdfunding platforms: A hybrid machine learning approach | |
CN107077486A (zh) | 情感评价系统和方法 | |
Yang et al. | Large language models can rate news outlet credibility | |
KR20200048004A (ko) | 사용자 구매 기준 및 상품 리뷰 기반 상품 추천 시스템 및 방법 | |
CN102177514A (zh) | 用于利用现有的域定义来进行语义概念定义和语义概念关系综合的系统和方法 | |
Ismail et al. | Data mining in electronic commerce: benefits and challenges | |
CN107153656A (zh) | 一种信息搜索方法和装置 | |
CN114942971B (zh) | 一种结构化数据的抽取方法及装置 | |
JP4970919B2 (ja) | 閲覧対象情報の評価システム、方法、およびプログラム | |
CN109783638A (zh) | 一种基于半监督学习的用户评论聚类方法 | |
Stanik et al. | Unsupervised topic discovery in user comments | |
Tiwary | Learning apache mahout | |
CN110222180A (zh) | 一种文本数据分类与信息挖掘方法 | |
Bhattarai et al. | Open-source code repository attributes predict impact of computer science research | |
KR102299525B1 (ko) | 제품 평가 마이닝 방법 및 이를 수행하는 장치 | |
Girish et al. | Mining the web data for classifying and predicting users’ requests | |
van der Spek et al. | Applying a dynamic threshold to improve cluster detection of LSI | |
Zhang et al. | Data mining model for food safety incidents based on structural analysis and semantic similarity | |
Bevendorff et al. | The Impact Of Online Affiliate Marketing On Web Search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131010 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140916 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141113 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20150123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150303 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150316 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5724878 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |