JP6461832B2 - オラクル要約探索装置、方法、及びプログラム - Google Patents
オラクル要約探索装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6461832B2 JP6461832B2 JP2016013437A JP2016013437A JP6461832B2 JP 6461832 B2 JP6461832 B2 JP 6461832B2 JP 2016013437 A JP2016013437 A JP 2016013437A JP 2016013437 A JP2016013437 A JP 2016013437A JP 6461832 B2 JP6461832 B2 JP 6461832B2
- Authority
- JP
- Japan
- Prior art keywords
- oracle
- input document
- constraint
- dependency structure
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
<本発明の第1の実施の形態に係るオラクル要約探索装置の構成>
本発明の第1の実施の形態に係るオラクル要約探索装置は、以下に説明する構成により、入力文書について人間が予め生成した参照要約と、入力文書とに基づいて、入力文書から少なくとも1つの単語を選択して生成される、予め定められた要約長以下であって、評価スコアが最高値となる要約候補であるオラクル要約を探索するオラクル要約探索装置である。
20、220 演算部
30 文分割部
32 単語分割部
34、234 Nグラム抽出部
36、236 依存構造解析部
38、238 解探索部
40、240 目的関数生成部
42、242 制約生成部
44、244 オラクル要約探索部
50 出力部
100、200 オラクル要約探索装置
232 文節分割部
Claims (8)
- 入力文書について予め生成された参照要約と、前記入力文書とに基づいて、前記入力文書から少なくとも1つの単語を選択して生成される、予め定められた要約長以下であって、評価スコアが最高値となる要約候補であるオラクル要約を探索するオラクル要約探索装置であって、
前記入力文書の単語間の依存構造を解析する依存構造解析部と、
前記入力文書及び前記参照要約に共通する、N個の連続する単語であるNグラムの集合に基づいて、前記要約候補の前記評価スコアを表す目的関数を生成する目的関数生成部と、
前記依存構造解析部によって解析された前記単語間の依存構造に基づいて、前記要約候補に含まれる単語間の制約を生成する制約生成部と、
前記制約生成部によって生成された制約を満たし、かつ、前記目的関数生成部によって生成された前記目的関数の値を最大化する、前記要約長以下である前記要約候補を、前記オラクル要約として探索するオラクル要約探索部と、
を含むオラクル要約探索装置。 - 入力文書について予め生成された参照要約と、前記入力文書とに基づいて、前記入力文書から少なくとも1つの文節を選択して生成される、予め定められた要約長以下であって、評価スコアが最高値となる要約候補であるオラクル要約を探索するオラクル要約探索装置であって、
前記入力文書の文節間の依存構造を解析する依存構造解析部と、
前記入力文書及び前記参照要約に共通する、N個の連続する文節であるNグラムの集合に基づいて、前記要約候補の前記評価スコアを表す目的関数を生成する目的関数生成部と、
前記依存構造解析部によって解析された前記文節間の依存構造に基づいて、前記要約候補に含まれる文節間の制約を生成する制約生成部と、
前記制約生成部によって生成された制約を満たし、かつ、前記目的関数生成部によって生成された前記目的関数の値を最大化する、前記要約長以下である前記要約候補を、前記オラクル要約として探索するオラクル要約探索部と、
を含むオラクル要約探索装置。 - 前記オラクル要約探索部は、前記制約生成部によって生成された制約を満たし、かつ、前記目的関数生成部によって生成された前記目的関数の値を最大化する、前記要約長以下である要約候補を探索する問題を、整数計画問題として解くことにより、前記オラクル要約を探索する請求項1又は2記載のオラクル要約探索装置。
- 前記制約生成部は、前記要約候補に含まれる単語間の制約として、前記要約候補に含まれる単語の、前記依存構造解析部によって解析された前記単語間の依存構造を表す依存構造木における親の単語が含まれる制約を生成し、
前記入力文書及び前記参照要約に共通するNグラムの集合に含まれるNグラムgj nの各々について、前記Nグラムgj nの前記要約候補における頻度が、前記入力文書における前記Nグラムgj nの頻度以下となる制約を生成し、
前記要約候補に含まれる前記入力文書のu番目のNグラムに対応する、前記入力文書の各単語を、前記要約候補に含める制約を生成し、
前記要約候補が、前記要約長以下となる制約を生成する請求項1に記載のオラクル要約探索装置。 - 前記制約生成部は、前記要約候補に含まれる文節間の制約として、前記要約候補に含まれる文節の、前記依存構造解析部によって解析された前記文節間の依存構造を表す依存構造木における親の文節が含まれる制約を生成し、
前記入力文書及び前記参照要約に共通するNグラムの集合に含まれるNグラムgj nの各々について、前記Nグラムgj nの前記要約候補における頻度が、前記入力文書における前記Nグラムgj nの頻度以下となる制約を生成し、
前記要約候補に含まれる前記入力文書のu番目のNグラムに対応する、前記入力文書の各文節を、前記要約候補に含める制約を生成し、
前記要約候補が、前記要約長以下となる制約を生成する請求項2に記載のオラクル要約探索装置。 - 入力文書について予め生成された参照要約と、前記入力文書とに基づいて、前記入力文書から少なくとも1つの単語を選択して生成される、予め定められた要約長以下であって、評価スコアが最高値となる要約候補であるオラクル要約を探索するオラクル要約探索装置におけるオラクル要約探索方法であって、
依存構造解析部が、前記入力文書の単語間の依存構造を解析するステップと、
目的関数生成部が、前記入力文書及び前記参照要約に共通する、N個の連続する単語であるNグラムの集合に基づいて、前記要約候補の前記評価スコアを表す目的関数を生成するステップと、
制約生成部が、前記依存構造解析部によって解析された前記単語間の依存構造に基づいて、前記要約候補に含まれる単語間の制約を生成するステップと、
オラクル要約探索部が、前記制約生成部によって生成された制約を満たし、かつ、前記目的関数生成部によって生成された前記目的関数の値を最大化する、前記要約長以下である前記要約候補を、前記オラクル要約として探索するステップと、
を含むオラクル要約探索方法。 - 入力文書について予め生成された参照要約と、前記入力文書とに基づいて、前記入力文書から少なくとも1つの文節を選択して生成される、予め定められた要約長以下であって、評価スコアが最高値となる要約候補であるオラクル要約を探索するオラクル要約探索装置におけるオラクル要約探索方法であって、
依存構造解析部が、前記入力文書の文節間の依存構造を解析するステップと、
目的関数生成部が、前記入力文書及び前記参照要約に共通する、N個の連続する文節であるNグラムの集合に基づいて、前記要約候補の前記評価スコアを表す目的関数を生成するステップと、
制約生成部が、前記依存構造解析部によって解析された前記文節間の依存構造に基づいて、前記要約候補に含まれる文節間の制約を生成するステップと、
オラクル要約探索部が、前記制約生成部によって生成された制約を満たし、かつ、前記目的関数生成部によって生成された前記目的関数の値を最大化する、前記要約長以下である前記要約候補を、前記オラクル要約として探索するステップと、
を含むオラクル要約探索方法。 - コンピュータを、請求項1〜請求項5のいずれか1項に記載のオラクル要約探索装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016013437A JP6461832B2 (ja) | 2016-01-27 | 2016-01-27 | オラクル要約探索装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016013437A JP6461832B2 (ja) | 2016-01-27 | 2016-01-27 | オラクル要約探索装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017134588A JP2017134588A (ja) | 2017-08-03 |
JP6461832B2 true JP6461832B2 (ja) | 2019-01-30 |
Family
ID=59504878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016013437A Active JP6461832B2 (ja) | 2016-01-27 | 2016-01-27 | オラクル要約探索装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6461832B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6958417B2 (ja) * | 2018-02-20 | 2021-11-02 | 日本電信電話株式会社 | 文書要約装置、方法、及びプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3682529B2 (ja) * | 2002-01-31 | 2005-08-10 | 独立行政法人情報通信研究機構 | 要約自動評価処理装置、要約自動評価処理プログラム、および要約自動評価処理方法 |
US7725442B2 (en) * | 2007-02-06 | 2010-05-25 | Microsoft Corporation | Automatic evaluation of summaries |
JP5964791B2 (ja) * | 2013-08-28 | 2016-08-03 | 日本電信電話株式会社 | オラクル要約探索装置、方法、及びプログラム |
JP6021079B2 (ja) * | 2014-03-07 | 2016-11-02 | 日本電信電話株式会社 | 文書要約装置、方法、及びプログラム |
-
2016
- 2016-01-27 JP JP2016013437A patent/JP6461832B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017134588A (ja) | 2017-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103646112B (zh) | 利用了网络搜索的依存句法的领域自适应方法 | |
Mori et al. | A machine learning approach to recipe text processing | |
JP2005352888A (ja) | 表記揺れ対応辞書作成システム | |
CN114495143B (zh) | 一种文本对象识别方法、装置、电子设备及存储介质 | |
JP2015088064A (ja) | テキスト要約装置、方法、及びプログラム | |
JP2006065387A (ja) | テキスト文検索装置、テキスト文検索方法、及びテキスト文検索プログラム | |
Pande et al. | Application of natural language processing tools in stemming | |
JP6108212B2 (ja) | 同義語抽出システム、方法およびプログラム | |
US11842152B2 (en) | Sentence structure vectorization device, sentence structure vectorization method, and storage medium storing sentence structure vectorization program | |
Indhuja et al. | Text based language identification system for indian languages following devanagiri script | |
JP2007219620A (ja) | テキスト検索装置、テキスト検索プログラム、及びテキスト検索方法 | |
JP5169456B2 (ja) | 文書検索システム、文書検索方法および文書検索プログラム | |
JP6461832B2 (ja) | オラクル要約探索装置、方法、及びプログラム | |
JP4005343B2 (ja) | 情報検索システム | |
JPH1196177A (ja) | 用語辞書生成方法および用語辞書生成プログラムを記録した記録媒体 | |
KR101092363B1 (ko) | 중한자동번역을 위한 한국어 연결어미 생성 방법 및 그 장치 | |
JP5447368B2 (ja) | 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム | |
Kaur et al. | A rule-based stemmer for Punjabi adjectives | |
JP5744150B2 (ja) | 発話生成装置、方法、及びプログラム | |
JP5800206B2 (ja) | 語順並べ替え装置、翻訳装置、翻訳モデル学習装置、方法、及びプログラム | |
WO2019163643A1 (ja) | 要約評価装置、方法、プログラム、及び記憶媒体 | |
JP3919720B2 (ja) | 換言装置及びコンピュータプログラム | |
JP4088171B2 (ja) | テキスト解析装置、方法、プログラム及びそのプログラムを記録した記録媒体 | |
Kasthuri et al. | An improved rule based iterative affix stripping stemmer for Tamil language using K-mean clustering | |
Abainia et al. | Topic Identification of Noisy Arabic Texts Using Graph Approaches |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6461832 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |