JP5834883B2 - 因果関係要約方法、因果関係要約装置及び因果関係要約プログラム - Google Patents
因果関係要約方法、因果関係要約装置及び因果関係要約プログラム Download PDFInfo
- Publication number
- JP5834883B2 JP5834883B2 JP2011278431A JP2011278431A JP5834883B2 JP 5834883 B2 JP5834883 B2 JP 5834883B2 JP 2011278431 A JP2011278431 A JP 2011278431A JP 2011278431 A JP2011278431 A JP 2011278431A JP 5834883 B2 JP5834883 B2 JP 5834883B2
- Authority
- JP
- Japan
- Prior art keywords
- graph
- sentences
- causal
- nodes
- causal relation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
図1は、本発明による因果関係要約装置の実施形態の構成を示すブロック図である。本実施形態の因果関係要約装置は、統合グラフ作成部1、グラフカット処理部2、グラフ縮約部3及びラベル作成部4を有する。
Sim(x,y)=|W(x)∧W(y)|/|W(x)∨W(y)| ・・・式(1)
式(1)において、W(z)は文zに含まれる単語の集合を意味する。また、単語とは、文に対し、形態素解析処理やNグラムの切り出しなどにより得られる文内の部分文字列を意味する。よって|W(x)∧W(y)|は、文xと文yに共通して登場する単語の数を意味し、|W(x)∨W(y)|は文xまたは文yに登場する単語の数を意味する。なお、例えば同義語辞書を用いて、異なる単語であっても同義であれば同じ単語であるとみなし、上記の計算を行ってもよい。
Sim’(x,y)=(Sim(x,y)+|A(x)∧A(y)|/|A(x)∨A(y)|)/2 ・・・式(2)
式(2)において、A(z)は文z内に登場する単語の、概念辞書上の先祖(矢印方向に繰り返し辿ることで到達できる単語)の集合を意味する。
W(R1)={エアコン,売上げ,上昇}
W(R3)={扇風機,売上げ,上昇}
これより、
W(R1)∧W(R3)={売上げ,上昇}
W(R1)∨W(R3)={エアコン,扇風機,売上げ,上昇}
であるため、
Sim(R1,R3)=2/4=1/2
となる。
A(R1)=A(R3)={冷房機器,家電}
である。また、
|A(x)∧A(y)|/|A(x)∨A(y)|=1
となる。
以上より、
Sim’(R1,R3)=(1/2+1)/2=0.75(=約0.8)となる。
W(R4)={液晶TV,売上げ,上昇}
である。
これより、
W(R1)∧W(R4)={売上げ,上昇}
W(R1)∨W(R4)={エアコン,液晶TV,売上げ,上昇}
である。よって、
Sim(R1,R4)=2/4=1/2
となる。
A(R1)={冷房機器,家電}
A(R4)={AV機器,家電}
である。また、
A(R1)∧A(R4)={家電}
A(R1)∨A(R4)={冷房機器,AV機器,家電}
である。よって、
|A(x)∧A(y)|/|A(x)∨A(y)|=1/3となる。
以上より、
Sim’(R1,R4)=(1/2+1/3)/2=5/12(=約0.4)
となる。
Sim_synonym(x,y)=|S(x)∧S(y)|/|S(x)∨S(y)| ・・・式(3)
S(x)は、文xに含まれる単語について同義語辞書から得られる同義語の集合である。また、同義語辞書と上位語辞書とを併用してもよい。
次数行列Dとは対角行列であり、各i行i列目の要素D(i,i)が文iの次数(エッジの数)になっている行列である。D(i,i)は、行列データGのi行目の非ゼロ要素の数を数えることによって計算される。
Xは、次の式(4)によって計算される行列である。
X=I−D−1/2GD−1/2 ・・・式(4)
式(4)において、Iは単位行列を示す。因果関係データ内の全文数をnとした場合、Iは、n行n列の単位行列となる。
・C1−C2−C3:"平均気温、高い"
・C4:"ワールドカップ、開催"
・R1−R2−R3:"冷房機器、売上げ、上昇"
・R4:"液晶TV、売上げ、上昇"
以上の処理により、ラベル作成部4は、図9に示すグラフ要約結果を出力する。
2 グラフカット処理部
3 グラフ縮約部
4 ラベル作成部
5 因果関係データ
6 概念辞書
Claims (10)
- コンピュータが、記憶部に記憶されたプログラムをCPUに実行させることにより実現する因果関係要約方法であって、
コンピュータが、
文の集合を入力し、各文をノードとして、前記集合中の2つの文の間に因果関係または前記集合中の2つの文の間の類似度の高さに応じた重みが添えられたエッジを前記ノード間に生成し、
前記ノード及び前記エッジを有する前記グラフデータ中のノード集合を、切断される前記エッジの重みの和が最も小さくなるように、予め指定した数のクラスタに分解し、
各クラスタ内で因果関係を持たないようにノードを統合する縮約処理を実行する
ことを特徴とする因果関係要約方法。 - コンピュータが、
2つの文の間の類似度を記憶部に記憶されたシソーラスを用いて算出する
請求項1記載の因果関係要約方法。 - コンピュータが、
記憶部に記憶された上位語辞書または同義語辞書を用いて、一方の文の単語の上位語または同義語が他方の文に存在するかどうかを調べ、当該他方の文に存在する当該上位語または当該同義語の数に応じた類似度を算出する
請求項2記載の因果関係要約方法。 - コンピュータが、
縮約処理が施されたグラフデータを対象として、当該グラフデータのクラスタ内のノードに共通する単語、または、記憶部に記憶された辞書において当該クラスタ内の単語の共通の上位語のうち最も低い位置にある単語をラベルとして出力する
請求項1から請求項3のうちのいずれか1項に記載の因果関係要約方法。 - 文の集合を入力し、各文をノードとして、前記集合中の2つの文の間に因果関係または前記集合中の2つの文の間の類似度の高さに応じた重みが添えられたエッジを前記ノード間に生成するグラフ作成部と、
前記ノード及び前記エッジを有する前記グラフデータ中のノード集合を、切断される前記エッジの重みの和が最も小さくなるように、予め指定した数のクラスタに分解するグラフカット処理部と、
各クラスタ内で因果関係を持たないようにノードを統合する縮約処理を実行するグラフ縮約部とを備えた
ことを特徴とする因果関係要約装置。 - グラフ作成部は、2つの文の間の類似度をシソーラスを用いて算出する
請求項5記載の因果関係要約装置。 - 縮約処理が施されたグラフデータを対象として、当該グラフデータのクラスタ内のノードに共通する単語、または、当該クラスタ内の単語の共通の上位語のうち最も低い位置にある単語をラベルとして出力するラベル作成部を備えた
請求項5または請求項6記載の因果関係要約装置。 - 記憶部に記憶された因果関係要約プログラムであって、
コンピュータのCPUに、
文の集合を入力し、各文をノードとして、前記集合中の2つの文の間に因果関係または前記集合中の2つの文の間の類似度の高さに応じた重みが添えられたエッジを前記ノード間に生成する処理と、
前記ノード及び前記エッジを有する前記グラフデータ中のノード集合を、切断される前記エッジの重みの和が最も小さくなるように、予め指定した数のクラスタに分解する処理と、
各クラスタ内で因果関係を持たないようにノードを統合する縮約処理と
を実行させるための因果関係要約プログラム。 - コンピュータのCPUに、
2つの文の間の類似度を記憶部に記憶されたシソーラスを用いて算出させる
請求項8記載の因果関係要約プログラム。 - コンピュータのCPUに、
縮約処理が施されたグラフデータを対象として、当該グラフデータのクラスタ内のノードに共通する単語、または、記憶部に記憶された辞書において当該クラスタ内の単語の共通の上位語のうち最も低い位置にある単語をラベルとして出力させる
請求項8または請求項9記載の因果関係要約プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011278431A JP5834883B2 (ja) | 2011-12-20 | 2011-12-20 | 因果関係要約方法、因果関係要約装置及び因果関係要約プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011278431A JP5834883B2 (ja) | 2011-12-20 | 2011-12-20 | 因果関係要約方法、因果関係要約装置及び因果関係要約プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013130929A JP2013130929A (ja) | 2013-07-04 |
JP5834883B2 true JP5834883B2 (ja) | 2015-12-24 |
Family
ID=48908458
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011278431A Active JP5834883B2 (ja) | 2011-12-20 | 2011-12-20 | 因果関係要約方法、因果関係要約装置及び因果関係要約プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5834883B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5907393B2 (ja) | 2013-12-20 | 2016-04-26 | 国立研究開発法人情報通信研究機構 | 複雑述語テンプレート収集装置、及びそのためのコンピュータプログラム |
JP5904559B2 (ja) * | 2013-12-20 | 2016-04-13 | 国立研究開発法人情報通信研究機構 | シナリオ生成装置、及びそのためのコンピュータプログラム |
JP6403382B2 (ja) | 2013-12-20 | 2018-10-10 | 国立研究開発法人情報通信研究機構 | フレーズペア収集装置、及びそのためのコンピュータプログラム |
JP6143938B2 (ja) * | 2014-02-19 | 2017-06-07 | 株式会社日立製作所 | データ更新方法、及び、計算機システム |
JP6653499B2 (ja) * | 2015-08-12 | 2020-02-26 | 国立研究開発法人情報通信研究機構 | 未来シナリオ生成装置及び方法、並びにコンピュータプログラム |
JP6767042B2 (ja) * | 2016-09-26 | 2020-10-14 | 国立研究開発法人情報通信研究機構 | シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム |
JP6539818B1 (ja) * | 2018-05-30 | 2019-07-10 | 学校法人自治医科大学 | 診断支援装置、診断支援方法及び診断支援プログラム |
JP6467678B1 (ja) * | 2018-10-08 | 2019-02-13 | モンド・ラボ株式会社 | 質問応答システム、装置、方法、サーバ装置及びプログラム |
JP7120043B2 (ja) * | 2019-01-23 | 2022-08-17 | 日本電信電話株式会社 | グラフ要約装置、グラフ要約方法及びプログラム |
CN111488740B (zh) * | 2020-03-27 | 2023-12-22 | 北京百度网讯科技有限公司 | 一种因果关系的判别方法、装置、电子设备及存储介质 |
JP7413214B2 (ja) | 2020-09-09 | 2024-01-15 | 株式会社東芝 | 情報処理装置、情報処理方法及び情報処理プログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000288877A (ja) * | 1999-04-05 | 2000-10-17 | Toshiba Corp | データ間の因果関係導出システム及びデータベースに於ける因果関係導出方法 |
JP2006215717A (ja) * | 2005-02-02 | 2006-08-17 | Toshiba Corp | 情報検索装置、情報検索方法および情報検索プログラム |
CN101467154A (zh) * | 2006-06-13 | 2009-06-24 | 皇家飞利浦电子股份有限公司 | 将定性关系建模为因果关系图 |
JP4737435B2 (ja) * | 2006-09-28 | 2011-08-03 | 日本電気株式会社 | ラベル付与システム、ラベリングサービスシステム、ラベル付与方法およびラベル付与プログラム |
JP4935405B2 (ja) * | 2007-02-16 | 2012-05-23 | 日本電気株式会社 | 因果関係分析装置、因果関係分析方法及びプログラム |
US20090055684A1 (en) * | 2007-08-23 | 2009-02-26 | Jamjoom Hani T | Method and apparatus for efficient problem resolution via incrementally constructed causality model based on history data |
JP2011003156A (ja) * | 2009-06-22 | 2011-01-06 | Nec Corp | データ分類装置、データ分類方法及びデータ分類プログラム |
JP5388038B2 (ja) * | 2009-12-28 | 2014-01-15 | 独立行政法人情報通信研究機構 | 文書要約装置、文書処理装置、及びプログラム |
JP2011186780A (ja) * | 2010-03-09 | 2011-09-22 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
-
2011
- 2011-12-20 JP JP2011278431A patent/JP5834883B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013130929A (ja) | 2013-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5834883B2 (ja) | 因果関係要約方法、因果関係要約装置及び因果関係要約プログラム | |
Kadhim et al. | Text document preprocessing and dimension reduction techniques for text document clustering | |
JP4485524B2 (ja) | 分散潜在的意味インデキシングを使った情報検索およびテキストマイニングのための、方法、および、システム | |
Wang et al. | Kernel based discourse relation recognition with temporal ordering information | |
KR101790793B1 (ko) | 컴퓨터 분석을 위해 텍스트 문서를 표현하는 그래픽 모델 | |
US9275043B2 (en) | Relationship information expansion apparatus, relationship information expansion method, and program | |
JP5621773B2 (ja) | 分類階層再作成システム、分類階層再作成方法及び分類階層再作成プログラム | |
US10678769B2 (en) | Artificial intelligence system and method for auto-naming customer tree nodes in a data structure | |
WO2009123288A1 (ja) | 単語分類システム、方法およびプログラム | |
Jo | NTSO (neural text self organizer): a new neural network for text clustering | |
JP2007004233A (ja) | 文章分類装置、文章分類方法、およびプログラム | |
US11301639B2 (en) | Methods and systems for generating a reference data structure for anonymization of text data | |
EP3483747A1 (en) | Preserving and processing ambiguity in natural language | |
JP5235918B2 (ja) | テキスト要約装置、テキスト要約方法及びテキスト要約プログラム | |
WO2006038498A1 (ja) | 配列の生成方法、及び、配列生成プログラム | |
JP5373998B1 (ja) | 辞書生成装置、方法、及びプログラム | |
JP2007047974A (ja) | 情報抽出装置および情報抽出方法 | |
KR101375221B1 (ko) | 의료 프로세스 모델링 및 검증 방법 | |
CN113139599B (zh) | 一种融合词向量扩充和主题模型的服务分布式聚类方法 | |
Suzuki et al. | Mathematical document categorization with structure of mathematical expressions | |
Minkov et al. | Learning graph walk based similarity measures for parsed text | |
JP5921457B2 (ja) | 文書要約方法、装置、及びプログラム | |
CN109241281B (zh) | 软件失效原因生成方法、装置及设备 | |
Dianati et al. | Words stemming based on structural and semantic similarity | |
KR20210023453A (ko) | 리뷰 광고 매칭 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150717 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150804 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150914 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151006 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151019 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5834883 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |