JP2010055236A - 文抽出および文短縮を組合せた文書要約方法、文書要約装置、文書要約プログラムおよびそのプログラムを記録した記録媒体 - Google Patents
文抽出および文短縮を組合せた文書要約方法、文書要約装置、文書要約プログラムおよびそのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP2010055236A JP2010055236A JP2008217600A JP2008217600A JP2010055236A JP 2010055236 A JP2010055236 A JP 2010055236A JP 2008217600 A JP2008217600 A JP 2008217600A JP 2008217600 A JP2008217600 A JP 2008217600A JP 2010055236 A JP2010055236 A JP 2010055236A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- shortening
- score
- document
- document summarization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】入力された文書中の文を、指定された複数の短縮率で短縮して原文および短縮文を出力する文短縮装置11と、前記文短縮装置11により出力された原文および短縮文に対して、文短縮率、文の出現位置情報および入力されたパラメタにより求められた位置情報スコアと、単語スコアデータベース2を参照して取得した、文を構成する単語の重みを示す尺度である単語スコアとに基づいて文スコアを決定する文スコア決定装置12と、入力された文字数制限のもと、前記文スコア決定装置12により決定された文スコアの和が最大となる文の組合せを要約として選択する文選択装置13とを備える。
【選択図】図1
Description
堀智織、古井貞熙、「単語抽出による音声要約文生成法とその評価」、電子情報通信学会論文誌、D−II VOl.J85−D−II No.2 pp.200−209 2002年2月 Zechner,K."Fast Generation of Abstracts from General Domain Text Corpora by Extracting Relevant Sentences",Proc.of the 16th International Conference on Computational Linguistics,pp.986−989(1996).
(2)請求項2、5に記載の発明によれば、文の出現位置情報を加味した文スコアを決定することができる。
(3)請求項3、6に記載の発明によれば、文スコアの和が最大となる文の組合せを効率的に求めることができる。
<文短縮装置11>
いま、N文からなる文書をD={S1,...,Si,...,SN}、文短縮率集合をR={r1,...,rj,...,rk}とする。文短縮装置11は、集合Dの要素である文Si(1≦i≦N)に対し、短縮率rj(1≦j≦k)で短縮する。なお、短縮率は単語数に基づき計算する。入力文が10単語、短縮率が0.7とすると、短縮文は7単語となる。
<文スコア決定装置12>
文短縮率、文の出現位置および単語スコアデータベース2を参照して取得した単語スコアに基づき、図3のようにして文のスコアを決定する。図3において、文スコア決定装置12の入力側の文集合は、図6の文S1〜S5を短縮率r=1.0,0.9,0.8,0.7,0.6で各々短縮した文集合を表し、文スコア決定装置12の出力側は、前記文集合の各文に付与されたスコアを示している。
ここで、ある文字数制限を満たし、なおかつ、式(4)を最大とする文の組合せ、つまり要約Aを求めることが本発明の目的となる。
Claims (8)
- 文短縮手段が、入力された文書中の文を、指定された複数の短縮率で短縮して原文および短縮文を出力する文短縮ステップと、
文スコア決定手段が、前記文短縮ステップにより出力された原文および短縮文に対して、要約文としての適正を示す尺度である文スコアを決定する文スコア決定ステップと、
文選択手段が、指定された文字数制限のもと、前記文スコア決定ステップにより決定された文スコアの和が最大となる文の組合せを要約として選択する文選択ステップとを備えたことを特徴とする文抽出および文短縮を組合せた文書要約方法。 - 前記文スコア決定ステップは、前記指定された短縮率、文の出現位置情報および指定されたパラメタにより求められた位置情報スコアと、文を構成する単語の重みを示す尺度である単語スコアとに基づいて前記文スコアを決定することを特徴とする請求項1に記載の文抽出および文短縮を組合せた文書要約方法。
- 前記文選択ステップは、前記文スコアの和が最大となる文の組合せを動的計画法によって求めることを特徴とする請求項1又は2に記載の文抽出および文短縮を組合せた文書要約方法。
- 入力された文書中の文を、指定された複数の短縮率で短縮して原文および短縮文を出力する文短縮手段と、
前記文短縮手段により出力された原文および短縮文に対して、要約文としての適正を示す尺度である文スコアを決定する文スコア決定手段と、
指定された文字数制限のもと、前記文スコア決定手段により決定された文スコアの和が最大となる文の組合せを要約として選択する文選択手段とを備えたことを特徴とする文抽出および文短縮を組合せた文書要約装置。 - 前記文スコア決定手段は、前記指定された短縮率、文の出現位置情報および指定されたパラメタにより求められた位置情報スコアと、文を構成する単語の重みを示す尺度である単語スコアとに基づいて前記文スコアを決定することを特徴とする請求項4に記載の文抽出および文短縮を組合せた文書要約装置。
- 前記文選択手段は、前記文スコアの和が最大となる文の組合せを動的計画法によって求めることを特徴とする請求項4又は5に記載の文抽出および文短縮を組合せた文書要約装置。
- コンピュータを請求項4ないし6のいずれか1項に記載の各手段として機能させる文抽出および文短縮を組合せた文書要約プログラム。
- 請求項7に記載の文抽出および文短縮を組合せた文書要約プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008217600A JP5111300B2 (ja) | 2008-08-27 | 2008-08-27 | 文抽出および文短縮を組合せた文書要約方法、文書要約装置、文書要約プログラムおよびそのプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008217600A JP5111300B2 (ja) | 2008-08-27 | 2008-08-27 | 文抽出および文短縮を組合せた文書要約方法、文書要約装置、文書要約プログラムおよびそのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010055236A true JP2010055236A (ja) | 2010-03-11 |
JP5111300B2 JP5111300B2 (ja) | 2013-01-09 |
Family
ID=42071107
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008217600A Expired - Fee Related JP5111300B2 (ja) | 2008-08-27 | 2008-08-27 | 文抽出および文短縮を組合せた文書要約方法、文書要約装置、文書要約プログラムおよびそのプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5111300B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011090129A1 (ja) | 2010-01-20 | 2011-07-28 | 株式会社日本触媒 | 吸水性樹脂の製造方法 |
JP2011243166A (ja) * | 2010-05-21 | 2011-12-01 | Nippon Telegr & Teleph Corp <Ntt> | テキスト要約装置、テキスト要約方法及びテキスト要約プログラム |
JP2014153766A (ja) * | 2013-02-05 | 2014-08-25 | Nippon Telegr & Teleph Corp <Ntt> | 文書要約方法、装置、及びプログラム |
JP2017151863A (ja) * | 2016-02-26 | 2017-08-31 | 国立大学法人東京工業大学 | 文書要約装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105068996B (zh) * | 2015-09-21 | 2017-11-17 | 哈尔滨工业大学 | 一种中文分词增量学习方法 |
-
2008
- 2008-08-27 JP JP2008217600A patent/JP5111300B2/ja not_active Expired - Fee Related
Non-Patent Citations (3)
Title |
---|
CSNG200800758113; 平尾 努: '軽量な文短縮手法' 言語処理学会第14回年次大会発表論文集 , 20080317, page484-487, 言語処理学会 * |
JPN6012039566; 平尾 努、鈴木 潤、磯崎 秀樹: '識別学習による組合せ最適化問題としての文短縮手法' 人工知能学会論文誌 22巻,6号A, 20070824, page574-584, 社団法人人工知能学会 * |
JPN6012039569; 平尾 努: '軽量な文短縮手法' 言語処理学会第14回年次大会発表論文集 , 20080317, page484-487, 言語処理学会 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011090129A1 (ja) | 2010-01-20 | 2011-07-28 | 株式会社日本触媒 | 吸水性樹脂の製造方法 |
JP2011243166A (ja) * | 2010-05-21 | 2011-12-01 | Nippon Telegr & Teleph Corp <Ntt> | テキスト要約装置、テキスト要約方法及びテキスト要約プログラム |
JP2014153766A (ja) * | 2013-02-05 | 2014-08-25 | Nippon Telegr & Teleph Corp <Ntt> | 文書要約方法、装置、及びプログラム |
JP2017151863A (ja) * | 2016-02-26 | 2017-08-31 | 国立大学法人東京工業大学 | 文書要約装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5111300B2 (ja) | 2013-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8352272B2 (en) | Systems and methods for text to speech synthesis | |
US8712776B2 (en) | Systems and methods for selective text to speech synthesis | |
US8396714B2 (en) | Systems and methods for concatenation of words in text to speech synthesis | |
EP2958105B1 (en) | Method and apparatus for speech synthesis based on large corpus | |
US20100082329A1 (en) | Systems and methods of detecting language and natural language strings for text to speech synthesis | |
US20100082328A1 (en) | Systems and methods for speech preprocessing in text to speech synthesis | |
CN104573099B (zh) | 题目的搜索方法及装置 | |
JP4931958B2 (ja) | テキスト要約方法、その装置およびプログラム | |
JP6524008B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP5111300B2 (ja) | 文抽出および文短縮を組合せた文書要約方法、文書要約装置、文書要約プログラムおよびそのプログラムを記録した記録媒体 | |
JP5625827B2 (ja) | 形態素解析装置、音声合成装置、形態素解析方法及び形態素解析プログラム | |
JP2009217802A (ja) | 文書処理装置、文書処理プログラムおよび記録媒体 | |
JP5317093B2 (ja) | 学習コンテンツ生成装置、学習コンテンツの生成方法、学習コンテンツ生成装置としてコンピュータを機能させるためのプログラム、および当該プログラムを格納したコンピュータ読み取り可能な記録媒体 | |
JP5466575B2 (ja) | 重要語抽出装置とその方法とプログラム | |
US20080243510A1 (en) | Overlapping screen reading of non-sequential text | |
JP2014002257A (ja) | 言語モデル生成装置、その方法及びプログラム | |
JP5784196B2 (ja) | 文書マークアップ支援装置、方法、及びプログラム | |
JP5976037B2 (ja) | モデル学習装置、ランキング装置、方法、及びプログラム | |
JP4940251B2 (ja) | 文書処理プログラム及び文書処理装置 | |
JP2008305291A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5020759B2 (ja) | 種々の音声合成装置のための素片データベース生成装置、方法及びプログラム | |
JP6451151B2 (ja) | 質問応答装置、質問応答方法、プログラム | |
JP2003173335A (ja) | 自然言語対話装置及び方法並びに記憶媒体 | |
JPH10228471A (ja) | 音声合成システム,音声用テキスト生成システム及び記録媒体 | |
US11935425B2 (en) | Electronic device, pronunciation learning method, server apparatus, pronunciation learning processing system, and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100608 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100723 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120731 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120907 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121002 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121009 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151019 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |