JP5604465B2 - テキスト要約装置、方法、及びプログラム - Google Patents
テキスト要約装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP5604465B2 JP5604465B2 JP2012033244A JP2012033244A JP5604465B2 JP 5604465 B2 JP5604465 B2 JP 5604465B2 JP 2012033244 A JP2012033244 A JP 2012033244A JP 2012033244 A JP2012033244 A JP 2012033244A JP 5604465 B2 JP5604465 B2 JP 5604465B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- sentences
- content
- score
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(1)式は目的関数であり、この目的関数を最大化するように、要約対象のテキストを構成する文集合から文の部分集合を選び出すことによって、要約を生成する。(1)式第1項はベクトルvとベクトルxとの内積であり、要約を構成する文の部分集合に対して与えられるスコアである。n次元のベクトルvの各要素は、要約対象のテキストを構成する各文のスコアを格納する。文のスコアとしては、例えば言語尤度などを利用することができ、パラメタデータベース12から取得される。
(6)式に含まれるラグランジュ乗数λは、m次元のベクトルであり、制約(8)が破られている際にペナルティを与える。例えば、内容語zjが制約(8)で定められたrより多く要約に含まれている場合、λjに正の値を与え、wjからλjを引くことによって、内容語zjに対してペナルティを与える。これにより、内容語zjが要約に含まれづらくなり、結果として制約(8)が満たされる可能性が高まる。
11 テキスト受付部
12 パラメタデータベース
13 要約生成部
14 要約出力部
Claims (5)
- 複数の文を含むテキストを受け付ける受付手段と、
前記受付手段で受け付けたテキストに含まれる複数の文から要約を構成する文として選択される文の部分集合に対するスコア、及び前記要約に含まれる内容語毎の数及び重みを示すスコアを用いた目的関数であって、前記要約に含まれる内容語の数に関する制約に対するペナルティを、前記要約に含まれる内容語毎の数及び重みを示すスコアに対して、ラグランジュ乗数として加えた目的関数を、動的計画法により最大化させるように、前記複数の文を含むテキストから前記文の部分集合を選択することにより、前記テキストの要約を生成する生成手段と、
を含むテキスト要約装置。 - 前記生成手段は、選択された前記文の部分集合に含まれる内容語の数が予め定めた上限値を超える場合には、前記ペナルティを付与する方向に前記ラグランジュ乗数を更新し、前記内容語の数が前記上限値以下の場合には、前記ペナルティを減少させる方向に前記ラグランジュ乗数を更新しながら、前記目的関数を最大化する処理を繰り返す請求項1記載のテキスト要約装置。
- 受付手段と、生成手段とを含むテキスト要約装置におけるテキスト要約方法であって、
前記受付手段は、複数の文を含むテキストを受け付け、
前記生成手段は、前記受付手段で受け付けたテキストに含まれる複数の文から要約を構成する文として選択される文の部分集合に対するスコア、及び前記要約に含まれる内容語毎の数及び重みを示すスコアを用いた目的関数であって、前記要約に含まれる内容語の数に関する制約に対するペナルティを、前記要約に含まれる内容語毎の数及び重みを示すスコアに対して、ラグランジュ乗数として加えた目的関数を、動的計画法により最大化させるように、前記複数の文を含むテキストから前記文の部分集合を選択することにより、前記テキストの要約を生成する
テキスト要約方法。 - 前記生成手段は、選択された前記文の部分集合に含まれる内容語の数が予め定めた上限値を超える場合には、前記ペナルティを付与する方向に前記ラグランジュ乗数を更新し、前記内容語の数が前記上限値以下の場合には、前記ペナルティを減少させる方向に前記ラグランジュ乗数を更新しながら、前記目的関数を最大化する処理を繰り返す請求項3記載のテキスト要約方法。
- コンピュータを、請求項1または請求項2記載のテキスト要約装置を構成する各手段として機能させるためのテキスト要約プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012033244A JP5604465B2 (ja) | 2012-02-17 | 2012-02-17 | テキスト要約装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012033244A JP5604465B2 (ja) | 2012-02-17 | 2012-02-17 | テキスト要約装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013171330A JP2013171330A (ja) | 2013-09-02 |
JP5604465B2 true JP5604465B2 (ja) | 2014-10-08 |
Family
ID=49265240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012033244A Expired - Fee Related JP5604465B2 (ja) | 2012-02-17 | 2012-02-17 | テキスト要約装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5604465B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7035893B2 (ja) * | 2018-08-06 | 2022-03-15 | 日本電信電話株式会社 | 要約文算出装置、要約文算出方法、及びプログラム |
CN109508371B (zh) * | 2018-11-07 | 2022-03-15 | 中山大学 | 一种结合集束搜索间隔最大化约束的文本摘要生成方法 |
CN115795025A (zh) * | 2022-11-29 | 2023-03-14 | 华为技术有限公司 | 一种摘要生成方法及其相关设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3310632B2 (ja) * | 1999-06-24 | 2002-08-05 | 建生 河村 | 非線形計画法による最適潮流計算システム |
JP2008242612A (ja) * | 2007-03-26 | 2008-10-09 | Kyushu Institute Of Technology | 文書要約装置、その方法及びプログラム |
JP5523929B2 (ja) * | 2010-05-21 | 2014-06-18 | 日本電信電話株式会社 | テキスト要約装置、テキスト要約方法及びテキスト要約プログラム |
-
2012
- 2012-02-17 JP JP2012033244A patent/JP5604465B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013171330A (ja) | 2013-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7155758B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP5235918B2 (ja) | テキスト要約装置、テキスト要約方法及びテキスト要約プログラム | |
Babii et al. | Modeling vocabulary for big code machine learning | |
JP6312467B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2017076281A (ja) | 単語埋込学習装置、テキスト評価装置、方法、及びプログラム | |
CN103608805B (zh) | 辞典产生装置及方法 | |
JP2019082931A (ja) | 検索装置、類似度算出方法、およびプログラム | |
Tomašic et al. | Implementation of a slogan generator | |
JP4266222B2 (ja) | 単語翻訳装置およびそのプログラム並びにコンピュータ読み取り可能な記録媒体 | |
JP5604465B2 (ja) | テキスト要約装置、方法、及びプログラム | |
JP5441937B2 (ja) | 言語モデル学習装置、言語モデル学習方法、言語解析装置、及びプログラム | |
Zhang et al. | Hash subgraph pairwise kernel for protein-protein interaction extraction | |
JP2020030753A (ja) | 単語符号化装置、解析装置、言語モデル学習装置、方法、及びプログラム | |
JP2016133956A (ja) | 形態素解析モデル生成装置、形態素解析モデル生成方法、及び、プログラム | |
JP5462819B2 (ja) | 基本木獲得装置、構文解析装置、方法、及びプログラム | |
JP2015084047A (ja) | 文集合作成装置、文集合作成方法および文集合作成プログラム | |
JP2015153261A (ja) | 対話文生成装置、対話文生成方法およびプログラム | |
JP5523929B2 (ja) | テキスト要約装置、テキスト要約方法及びテキスト要約プログラム | |
JP4405542B2 (ja) | 音素モデルをクラスタリングする装置、方法およびプログラム | |
JP2014225158A (ja) | 文書要約装置、方法、及びプログラム | |
JP4745417B2 (ja) | 情報検索装置およびプログラム | |
JP5990124B2 (ja) | 略語生成装置、略語生成方法、及びプログラム | |
JP4478042B2 (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 | |
Zeng et al. | Lexicon expansion for latent variable grammars | |
JP5575075B2 (ja) | 代表的文書選択装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140109 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140507 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140630 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140819 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140825 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5604465 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |