JP5810052B2 - 要約生成装置及び方法及びプログラム - Google Patents
要約生成装置及び方法及びプログラム Download PDFInfo
- Publication number
- JP5810052B2 JP5810052B2 JP2012186037A JP2012186037A JP5810052B2 JP 5810052 B2 JP5810052 B2 JP 5810052B2 JP 2012186037 A JP2012186037 A JP 2012186037A JP 2012186037 A JP2012186037 A JP 2012186037A JP 5810052 B2 JP5810052 B2 JP 5810052B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- clause
- shortening
- explanation
- necessity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
自立語及び自立語の組み合わせについて、どの程度説明を必要とするのかを示す尺度である説明必要度が該自立語及び該自立語の組合せに対応づけて格納された説明必要性記憶手段と、
入力された要約対象文書から短縮対象文を選択する短縮対象文選択手段と、
前記短縮対象文の文節をノードとし、文末を根とし、係り受け関係をエッジで表現する係り受け木を生成し、係り元に相当する枝を葉側から枝刈りして係り受け木の集合を生成し、各係り受け木の文節を根とする部分木に含まれる自立語に基づいて、前記説明必要性記憶手段を参照して得られた必要度に基づいて、根となる文節の期待伝達時間を算出し、該期待伝達時間が最小となる係り受け木を短縮文として出力する文短縮手段と、を有する。
前記係り受け木の文節bを根とする部分木の中に含まれる自立語の集合qに基づいて前記説明必要性記憶手段から取得した説明必要度n q 、該文節bの直下の文節のうち、現在対象としている部分木において存在しない文節の長さの和len d 、該文節bの長さlen b 、該文節bを根とする部分木から該文節bを除いた場合に根となる各文節cを根とする部分木の部分期待伝達時間S c を用いて、前記根となる文節の期待伝達時間を算出する手段を含む。
前記文短縮手段は、
前記短縮文内での各文節に係っている部分木を連結した文字列を修正要約記憶手段に格納する手段を含み、
前記要約出力手段は、
前記要約文について、ユーザより指示があった場合には、該ユーザが該要約文に対する修正と判断し、指示された文節位置に対応する修正内容で前記修正要約記憶手段を更新する、または、該ユーザに再出力する手段を含む。
20 短縮対象文選択部
30 文短縮部
40 要約出力部
50 修正要約記憶部
Claims (7)
- 提示した要約に対するユーザによる割り込み可能な対話を利用して入力された要約対象文書の要約を生成する要約生成装置であって、
自立語及び自立語の組み合わせについて、どの程度説明を必要とするのかを示す尺度である説明必要度が該自立語及び該自立語の組合せに対応づけて格納された説明必要性記憶手段と、
入力された要約対象文書から短縮対象文を選択する短縮対象文選択手段と、
前記短縮対象文の文節をノードとし、文末を根とし、係り受け関係をエッジで表現する係り受け木を生成し、係り元に相当する枝を葉側から枝刈りして係り受け木の集合を生成し、各係り受け木の文節を根とする部分木に含まれる自立語に基づいて、前記説明必要性記憶手段を参照して得られた必要度に基づいて、根となる文節の期待伝達時間を算出し、該期待伝達時間が最小となる係り受け木を短縮文として出力する文短縮手段と、
を有することを特徴とする要約生成装置。 - 前記文短縮手段は、
前記係り受け木の文節bを根とする部分木の中に含まれる自立語の集合qに基づいて前記説明必要性記憶手段から取得した説明必要度n q 、該文節bの直下の文節のうち、現在対象としている部分木において存在しない文節の長さの和len d 、該文節bの長さlen b 、該文節bを根とする部分木から該文節bを除いた場合に根となる各文節cを根とする部分木の部分期待伝達時間S c を用いて、前記根となる文節の期待伝達時間を算出する手段を含む
請求項1記載の要約生成装置。 - 前記文短縮手段によって得られた前記短縮文短縮での要約文を出力する要約出力手段を更に有し、
前記文短縮手段は、
前記短縮文内での各文節に係っている部分木を連結した文字列を修正要約記憶手段に格納する手段を含み、
前記要約出力手段は、
前記要約文について、ユーザより指示があった場合には、該ユーザが該要約文に対する修正と判断し、指示された文節位置に対応する修正内容で前記修正要約記憶手段を更新する、または、該ユーザに再出力する手段を含む
請求項1記載の要約生成装置。 - 提示した要約に対するユーザによる割り込み可能な対話を利用して入力された要約対象文書の要約を生成する要約生成方法であって、
自立語及び自立語の組み合わせについて、どの程度説明を必要とするのかを示す尺度である説明必要度が該自立語及び該自立語の組合せに対応づけて格納された説明必要性記憶手段と、短縮対象文選択手段と、文短縮手段と、を有する装置において、
前記短縮対象文選択手段が、入力された要約対象文書から短縮対象文を選択する短縮対象文選択ステップと、
前記文短縮手段が、前記短縮対象文の文節をノードとし、文末を根とし、係り受け関係をエッジで表現する係り受け木を生成し、係り元に相当する枝を葉側から枝刈りして係り受け木の集合を生成し、各係り受け木の文節を根とする部分木に含まれる自立語に基づいて、前記説明必要性記憶手段を参照して得られた必要度に基づいて、根となる文節の期待伝達時間を算出し、該期待伝達時間が最小となる係り受け木を短縮文として出力する文短縮ステップと、
を行うことを特徴とする要約生成方法。 - 前記文短縮ステップにおいて、
前記係り受け木の文節bを根とする部分木の中に含まれる自立語の集合qに基づいて前記説明必要性記憶手段から取得した説明必要度n q 、該文節bの直下の文節のうち、現在対象としている部分木において存在しない文節の長さの和len d 、該文節bの長さlen b 、該文節bを根とする部分木から該文節bを除いた場合に根となる各文節cを根とする部分木の部分期待伝達時間S c を用いて、前記根となる文節の期待伝達時間を算出する
請求項4記載の要約生成方法。 - 前記装置が、要約出力手段を更に有し、
前記文短縮ステップにおいて、
前記短縮文内での各文節に係っている部分木を連結した文字列を修正要約記憶手段に格納するステップを更に行い、
前記要約出力手段が、前記文短縮ステップによって得られた前記短縮文短縮での要約文を出力するステップと、
前記要約文について、ユーザより指示があった場合には、該ユーザが該要約文に対する修正と判断し、指示された文節位置に対応する修正内容で前記修正要約記憶手段を更新する、または、該ユーザに再出力するステップを更に行う
請求項4記載の要約生成方法。 - コンピュータを、
請求項1乃至3のいずれか1項に記載の要約生成装置の各手段として機能させるための要約生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012186037A JP5810052B2 (ja) | 2012-08-27 | 2012-08-27 | 要約生成装置及び方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012186037A JP5810052B2 (ja) | 2012-08-27 | 2012-08-27 | 要約生成装置及び方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014044538A JP2014044538A (ja) | 2014-03-13 |
JP5810052B2 true JP5810052B2 (ja) | 2015-11-11 |
Family
ID=50395764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012186037A Expired - Fee Related JP5810052B2 (ja) | 2012-08-27 | 2012-08-27 | 要約生成装置及び方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5810052B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3937118B2 (ja) * | 1999-03-02 | 2007-06-27 | 富士ゼロックス株式会社 | 要約作成装置及び要約作成方法 |
JP2003281164A (ja) * | 2002-03-20 | 2003-10-03 | Fuji Xerox Co Ltd | 文書要約装置、文書要約方法、及び文書要約プログラム |
JP5058221B2 (ja) * | 2008-11-12 | 2012-10-24 | 日本電信電話株式会社 | 文短縮装置、その方法およびプログラム |
JP4931958B2 (ja) * | 2009-05-08 | 2012-05-16 | 日本電信電話株式会社 | テキスト要約方法、その装置およびプログラム |
-
2012
- 2012-08-27 JP JP2012186037A patent/JP5810052B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014044538A (ja) | 2014-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4580885B2 (ja) | シーン情報抽出方法、シーン抽出方法および抽出装置 | |
CN106649783B (zh) | 一种同义词挖掘方法和装置 | |
US6345244B1 (en) | System, method, and product for dynamically aligning translations in a translation-memory system | |
US6345243B1 (en) | System, method, and product for dynamically propagating translations in a translation-memory system | |
US20080071803A1 (en) | Methods and systems for real-time citation generation | |
US20150026556A1 (en) | Systems and Methods for Extracting Table Information from Documents | |
Chowdhury et al. | A study on dependency tree kernels for automatic extraction of protein-protein interaction | |
JP5547254B2 (ja) | 対話的要約生成装置及び方法及びプログラム | |
CN109977370B (zh) | 一种基于文档结构树的问答对自动构建方法 | |
CN110309214B (zh) | 一种指令执行方法及其设备、存储介质、服务器 | |
JP2019021194A5 (ja) | ||
JP5810052B2 (ja) | 要約生成装置及び方法及びプログラム | |
JP5810053B2 (ja) | 要約生成装置及び方法及びプログラム | |
JP2004348552A (ja) | 音声文書検索装置および方法およびプログラム | |
JP6115487B2 (ja) | 情報収集方法、対話システム及び情報収集装置 | |
JPS61278970A (ja) | 自然言語処理装置における構文解析結果の表示及び校正のための制御方法 | |
JP6698006B2 (ja) | 要約生成装置、方法、及びプログラム | |
CN112905835A (zh) | 一种多模态乐曲标题生成方法、装置及存储介质 | |
KR100886688B1 (ko) | 한국어 수량사 생성 방법 및 장치 | |
JP6451414B2 (ja) | 情報処理装置、要約文編集方法、及びプログラム | |
JP2009282903A (ja) | 知識抽出・検索装置およびその方法 | |
Leplus et al. | Weather report translation using a translation memory | |
Galley | Automatic summarization of conversational multi-party speech | |
JP2008217529A (ja) | テキスト分析装置およびテキスト分析プログラム | |
JP6565262B2 (ja) | 短縮文生成装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141020 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150703 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150714 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150908 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150914 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5810052 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |