JP6634001B2 - テキスト要約装置、方法、及びプログラム - Google Patents
テキスト要約装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6634001B2 JP6634001B2 JP2016222754A JP2016222754A JP6634001B2 JP 6634001 B2 JP6634001 B2 JP 6634001B2 JP 2016222754 A JP2016222754 A JP 2016222754A JP 2016222754 A JP2016222754 A JP 2016222754A JP 6634001 B2 JP6634001 B2 JP 6634001B2
- Authority
- JP
- Japan
- Prior art keywords
- zdd
- viewpoint
- viewpoints
- subtree
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
・・・(1)
・・・(2)
・・・(3)
・・・(4)
22 入力解析部
24 木構造解析部
26 部分木保持ZDD作成部
32 観点情報抽出部
34 観点長さ決定部
36 観点部分木保持ZDD生成部
38 最適部分木算出部
50 要約出力部
100 テキスト要約装置
Claims (6)
- 入力テキストに含まれる文字列単位を表すノードの各々から構成され、かつ、前記入力テキストを表現する木構造から、刈り込むことで得られる部分木を選択することにより、前記入力テキストを要約するテキスト要約装置であって、
前記木構造を刈り込むことで得られる部分木の集合を表し、かつ、2つの終端ノード、及び前記木構造の各ノードに対応する、根ノード又は中間ノードを含むゼロサプレス型二分決定グラフであるZDD(Zero-suppressed Binary Decision Diagrams)を構築する部分木保持ZDD作成部と、
予め求められた複数の観点の各々について、前記入力テキストに含まれる前記文字列単位毎に、前記観点との関連度を算出し、前記文字列単位毎に前記観点の各々について算出された前記関連度に基づいて、前記入力テキストにおける前記複数の観点の比率を算出する観点情報抽出部と、
前記複数の観点の各々について、前記観点の比率に応じた長さ上限と、前記ノードの各々に対応する前記文字列単位の前記観点との関連度と、前記ノードの各々に対応する前記文字列単位の長さとに基づいて、前記部分木保持ZDD作成部によって構築されたZDDが表す前記部分木の集合のうちの前記部分木の部分集合を表すZDDを、前記観点に対応する観点ZDDとして生成する観点部分木保持ZDD生成部と、
前記複数の観点の各々について生成された前記観点ZDDが表す前記部分木の部分集合に共通する前記部分木の各々を表す共通ZDDのパスのうち、要約の長さ上限を満たす最適なパスを探索し、前記探索されたパスが表す前記部分木を出力する最適部分木算出部と、
前記最適部分木算出部によって出力された前記部分木に基づいて、前記入力テキストの要約を出力する要約出力部と、
を含むテキスト要約装置。 - 前記複数の観点の各々について、前記要約の長さ上限と、前記算出された前記観点の比率とに基づいて、前記観点の比率に応じた長さ上限を決定する観点長さ決定部を更に含む請求項1記載のテキスト要約装置。
- 観点部分木保持ZDD生成部は、前記観点の各々について、前記ノードに対応する前記文字列単位の前記観点との関連度と、前記ノードに対応する前記文字列単位の長さとの積を、前記ノードの重みとして、前記観点の比率に応じた長さ上限を満たすように、前記ZDDの根ノードからのパスを再帰的に辿ることで、前記観点ZDDを作成する請求項1又は請求項2に記載のテキスト要約装置。
- 前記最適部分木算出部は、前記ノードに対応する前記文字列単位の重要度を、前記ノードの重みとし、前記複数の観点の各々について生成された前記観点ZDDが表す前記部分木の部分集合に共通する前記部分木の各々を表す共通ZDDのパスのうち、要約の長さ上限を満たし、かつ、前記重みが最大となる最適なパスを探索し、前記探索されたパスが表す前記部分木を出力する請求項1〜請求項3の何れか1項記載のテキスト要約装置。
- 入力テキストに含まれる文字列単位を表すノードの各々から構成され、かつ、前記入力テキストを表現する木構造から、刈り込むことで得られる部分木を選択することにより、前記入力テキストを要約するテキスト要約装置におけるテキスト要約方法であって、
部分木保持ZDD作成部が、前記木構造を刈り込むことで得られる部分木の集合を表し、かつ、2つの終端ノード、及び前記木構造の各ノードに対応する、根ノード又は中間ノードを含むゼロサプレス型二分決定グラフであるZDD(Zero-suppressed Binary Decision Diagrams)を構築するステップと、
観点情報抽出部が、予め求められた複数の観点の各々について、前記入力テキストに含まれる前記文字列単位毎に、前記観点との関連度を算出し、前記文字列単位毎に前記観点の各々について算出された前記関連度に基づいて、前記入力テキストにおける前記複数の観点の比率を算出するステップと、
観点部分木保持ZDD生成部が、前記複数の観点の各々について、前記観点の比率に応じた長さ上限と、前記ノードの各々に対応する前記文字列単位の前記観点との関連度と、前記ノードの各々に対応する前記文字列単位の長さとに基づいて、前記部分木保持ZDD作成部によって構築されたZDDが表す前記部分木の集合のうちの前記部分木の部分集合を表すZDDを、前記観点に対応する観点ZDDとして生成するステップと、
最適部分木算出部が、前記複数の観点の各々について生成された前記観点ZDDが表す前記部分木の部分集合に共通する前記部分木の各々を表す共通ZDDのパスのうち、要約の長さ上限を満たす最適なパスを探索し、前記探索されたパスが表す前記部分木を出力するステップと、
要約出力部が、前記最適部分木算出部によって出力された前記部分木に基づいて、前記入力テキストの要約を出力するステップと、
を含むテキスト要約方法。 - コンピュータを、請求項1〜請求項4のいずれか1項に記載のテキスト要約装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016222754A JP6634001B2 (ja) | 2016-11-15 | 2016-11-15 | テキスト要約装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016222754A JP6634001B2 (ja) | 2016-11-15 | 2016-11-15 | テキスト要約装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018081463A JP2018081463A (ja) | 2018-05-24 |
JP6634001B2 true JP6634001B2 (ja) | 2020-01-22 |
Family
ID=62197190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016222754A Active JP6634001B2 (ja) | 2016-11-15 | 2016-11-15 | テキスト要約装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6634001B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7142559B2 (ja) * | 2018-12-20 | 2022-09-27 | ヤフー株式会社 | 提供装置、提供方法、及び提供プログラム |
-
2016
- 2016-11-15 JP JP2016222754A patent/JP6634001B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018081463A (ja) | 2018-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8359191B2 (en) | Deriving ontology based on linguistics and community tag clouds | |
Thakkar et al. | Graph-based algorithms for text summarization | |
US10289717B2 (en) | Semantic search apparatus and method using mobile terminal | |
EP1154358A2 (en) | Automatic text classification system | |
JP5710581B2 (ja) | 質問応答装置、方法、及びプログラム | |
JP2009087339A (ja) | オントロジーデータのインポート/エクスポートのための方法および装置 | |
WO2019169858A1 (zh) | 一种基于搜索引擎技术的数据分析方法及系统 | |
CN109471889B (zh) | 报表加速方法、系统、计算机设备和存储介质 | |
US20150205860A1 (en) | Information retrieval device, information retrieval method, and information retrieval program | |
JP6543283B2 (ja) | パッセージ型質問応答装置、方法、及びプログラム | |
CN111159361A (zh) | 获取文章的方法和装置及电子设备 | |
KR20130108537A (ko) | 문자열 생성 방법, 프로그램 및 시스템 | |
JP2016164708A (ja) | 含意ペア拡張装置、そのためのコンピュータプログラム、及び質問応答システム | |
JP6634001B2 (ja) | テキスト要約装置、方法、及びプログラム | |
KR101602342B1 (ko) | 의미 태깅된 자연어 질의의 의도에 부합하는 정보 추출 및 제공 방법 및 시스템 | |
JP2010198278A (ja) | 評判情報分類装置、評判情報分類方法及びプログラム | |
JP2008152641A (ja) | 類似例文検索装置 | |
JP2012141681A (ja) | クエリセグメント位置決定装置 | |
JP2011090463A (ja) | 文書検索システム、情報処理装置およびプログラム | |
JP5184195B2 (ja) | 言語処理装置およびプログラム | |
Manuja et al. | Intelligent text classification system based on self-administered ontology | |
JP6173958B2 (ja) | 複数のハッシュテーブルを用いて検索するプログラム、装置及び方法 | |
CN113297854A (zh) | 文本到知识图谱实体的映射方法、装置、设备及存储介质 | |
CN110968668A (zh) | 一种基于超网络的网络舆情主题相似度计算方法及装置 | |
JP2001101184A (ja) | 構造化文書生成方法及び装置及び構造化文書生成プログラムを格納した記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6634001 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |