JP5547254B2 - 対話的要約生成装置及び方法及びプログラム - Google Patents
対話的要約生成装置及び方法及びプログラム Download PDFInfo
- Publication number
- JP5547254B2 JP5547254B2 JP2012201844A JP2012201844A JP5547254B2 JP 5547254 B2 JP5547254 B2 JP 5547254B2 JP 2012201844 A JP2012201844 A JP 2012201844A JP 2012201844 A JP2012201844 A JP 2012201844A JP 5547254 B2 JP5547254 B2 JP 5547254B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- clause
- transmission time
- shortening
- tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
前記ユーザに提示した情報を保持する提示情報記憶手段と、
自立語及び自立語の組み合わせについて、どの程度説明を必要とするのかを示す尺度である説明必要度が該自立語及び該自立語の組合せに対応づけて格納された説明必要性記憶手段と、
入力された要約対象文書から文短縮の対象となる少なくとも1つ以上の文を抽出する短縮対象文書選択手段と、
前記短縮対象文書選択手段で選択された各文について、それぞれ係り受け木を生成し、根となる文節の期待伝達時間を算出し、該期待伝達時間が最小となる係り受け木を短縮文として出力する文短縮手段と、
前記文短縮手段により得られた前記短縮文を出力する要約出力手段と、
を有し、
前記文短縮手段は、
前記係り受け木の葉に相当する文節と、該文節が係る先の文節とのペアが前記提示情報記憶手段に存在する場合は、該葉に相当する文節を該係り受け木から削除する手段と、
係り元に相当する各枝を葉側から順に刈ってできる木tからなる集合を作成する手段と、
前記係り受け木の文節bを根とする部分木の中に含まれる自立語の集合qに基づいて前記説明必要性記憶手段から取得した説明必要度nB qB、該文節bの直下の文節のうち、現在対象としている部分木において元の係り受け木からみて存在しない文節の長さの和lenBdB、該文節bの長さlenBbB、該文節bを根とする部分木から該文節bを除いた場合に根となる各文節cを根とする部分木の部分期待伝達時間SBcBを用いて、前記文節bを根とする部分木の期待伝達時間を、SBcBの総和と、lenBbBと、nB qBとlenBdBとの積、の加重和により算出する期待伝達時間算出手段と、
前記木tの根となる文節(文末に相当)の部分期待伝達時間を該木tの期待伝達時間とし、該期待伝達時間が最小となる木tに相当する短縮文を、前記提示情報記憶手段に格納する手段と、を含む。
前記要約出力手段は、
前記ユーザに該短縮文を提示した際に、修正を求められた場合には、該ユーザにより指示された文節位置に対応する修正内容で前記修正要約記憶手段の内容を書き換える手段を含む。
「新しくA社に設置されたエボリューション研究所に取引先と向かう途中で、今日の会議について先方と話しあった.」
という文に対応する係り受け木を示す。
20 文短縮部
30 要約出力部
40 提示情報記憶部
50 説明必要性データベース
60 修正要約記憶部
Claims (4)
- 提示した要約に対するユーザによる割り込み可能な対話を利用して入力された要約対象文書の要約を生成する対話的要約生成装置であって、
前記ユーザに提示した情報を保持する提示情報記憶手段と、
自立語及び自立語の組み合わせについて、どの程度説明を必要とするのかを示す尺度である説明必要度が該自立語及び該自立語の組合せに対応づけて格納された説明必要性記憶手段と、
入力された要約対象文書から文短縮の対象となる少なくとも1つ以上の文を抽出する短縮対象文書選択手段と、
前記短縮対象文書選択手段で選択された各文について、それぞれ係り受け木を生成し、根となる文節の期待伝達時間を算出し、該期待伝達時間が最小となる係り受け木を短縮文として出力する文短縮手段と、
前記文短縮手段により得られた前記短縮文を出力する要約出力手段と、
を有し、
前記文短縮手段は、
前記係り受け木の葉に相当する文節と、該文節が係る先の文節とのペアが前記提示情報記憶手段に存在する場合は、該葉に相当する文節を該係り受け木から削除する手段と、
係り元に相当する各枝を葉側から順に刈ってできる木tからなる集合を作成する手段と、
前記係り受け木の文節bを根とする部分木の中に含まれる自立語の集合qに基づいて前記説明必要性記憶手段から取得した説明必要度nB qB、該文節bの直下の文節のうち、現在対象としている部分木において元の係り受け木からみて存在しない文節の長さの和lenBdB、該文節bの長さlenBbB、該文節bを根とする部分木から該文節bを除いた場合に根となる各文節cを根とする部分木の部分期待伝達時間SBcBを用いて、前記文節bを根とする部分木の期待伝達時間を、SBcBの総和と、lenBbBと、nB qBとlenBdBとの積、の加重和により算出する期待伝達時間算出手段と、
前記木tの根となる文節(文末に相当)の部分期待伝達時間を該木tの期待伝達時間とし、該期待伝達時間が最小となる木tに相当する短縮文を、前記提示情報記憶手段に格納する手段と、
を含む対話的要約生成装置。 - 前記文短縮手段は、
前記短縮文内の文節の位置、文節の内容、元の係り受け木において当該文節に係っている部分木を連結した文字列を修正要約記憶手段に格納する手段を含み、
前記要約出力手段は、
前記ユーザに該短縮文を提示した際に、修正を求められた場合には、該ユーザにより指示された文節位置に対応する修正内容で前記修正要約記憶手段の内容を書き換える手段を含む
請求項1記載の対話的要約生成装置。 - 提示した要約に対するユーザによる割り込み可能な対話を利用して入力された要約対象文書の要約を生成する対話的要約生成方法であって、
前記ユーザに提示した情報を保持する提示情報記憶手段と、
自立語及び自立語の組み合わせについて、どの程度説明を必要とするのかを示す尺度である説明必要度が該自立語及び該自立語の組合せに対応づけて格納された説明必要性記憶手段と、
短縮対象文書選択手段と、文短縮手段と、要約出力手段と、を有する装置において、
前記短縮対象文書選択手段が、入力された要約対象文書から文短縮の対象となる少なくとも1つ以上の文を抽出する短縮対象文書選択ステップと、
前記文短縮手段が、前記短縮対象文書選択ステップで選択された各文について、それぞれ係り受け木を生成し、根となる文節の期待伝達時間を算出し、該期待伝達時間が最小となる係り受け木を短縮文として出力する文短縮ステップと、
前記要約出力手段が、前記文短縮ステップで得られた前記短縮文を出力する要約出力ステップと、
を行い、
前記文短縮ステップにおいて、
前記係り受け木の葉に相当する文節と、該文節が係る先の文節とのペアが前記提示情報記憶手段に存在する場合は、該葉に相当する文節を該係り受け木から削除するステップと、
係り元に相当する各枝を葉側から順に刈ってできる木tからなる集合を作成するステップと、
前記係り受け木の文節bを根とする部分木の中に含まれる自立語の集合qに基づいて前記説明必要性記憶手段から取得した説明必要度nB qB 、該文節bの直下の文節のうち、現在対象としている部分木において元の係り受け木からみて存在しない文節の長さの和lenB dB 、該文節bの長さlenB bB 、該文節bを根とする部分木から該文節bを除いた場合に根となる各文節cを根とする部分木の部分期待伝達時間SB cB を用いて、前記文節bを根とする部分木の期待伝達時間を、SBcBの総和と、lenBbBと、nB qBとlenBdBとの積、の加重和により算出する期待伝達時間算出ステップと、
前記木tの根となる文節(文末に相当)の部分期待伝達時間を該木tの期待伝達時間とし、該期待伝達時間が最小となる木tに相当する短縮文を、前記提示情報記憶手段に格納するステップと、
を含むことを特徴とする対話的要約生成方法。 - コンピュータを、
請求項1または2に記載の対話的要約生成装置の各手段として機能させるための対話的要約生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012201844A JP5547254B2 (ja) | 2012-09-13 | 2012-09-13 | 対話的要約生成装置及び方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012201844A JP5547254B2 (ja) | 2012-09-13 | 2012-09-13 | 対話的要約生成装置及び方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014056499A JP2014056499A (ja) | 2014-03-27 |
JP5547254B2 true JP5547254B2 (ja) | 2014-07-09 |
Family
ID=50613746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012201844A Expired - Fee Related JP5547254B2 (ja) | 2012-09-13 | 2012-09-13 | 対話的要約生成装置及び方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5547254B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6451414B2 (ja) * | 2015-03-06 | 2019-01-16 | 富士通株式会社 | 情報処理装置、要約文編集方法、及びプログラム |
JP2016180849A (ja) * | 2015-03-24 | 2016-10-13 | 日本電信電話株式会社 | 学習データ生成装置、言語モデル学習装置、学習データ生成方法、プログラム |
JP6698006B2 (ja) * | 2016-12-14 | 2020-05-27 | 日本電信電話株式会社 | 要約生成装置、方法、及びプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5075953B2 (ja) * | 2009-10-30 | 2012-11-21 | 株式会社東芝 | 代表文抽出装置およびプログラム |
-
2012
- 2012-09-13 JP JP2012201844A patent/JP5547254B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014056499A (ja) | 2014-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4580885B2 (ja) | シーン情報抽出方法、シーン抽出方法および抽出装置 | |
JP5043116B2 (ja) | 迷惑情報をフィルタリングするネットワークベースの方法および装置 | |
Chowdhury et al. | A study on dependency tree kernels for automatic extraction of protein-protein interaction | |
US10078634B2 (en) | Visualizing and exploring natural-language text | |
US20210011937A1 (en) | Context-aware sentence compression | |
CN111178076A (zh) | 命名实体识别与链接方法、装置、设备及可读存储介质 | |
JP5547254B2 (ja) | 対話的要約生成装置及び方法及びプログラム | |
JP2019021194A5 (ja) | ||
JP5810052B2 (ja) | 要約生成装置及び方法及びプログラム | |
CN112905835B (zh) | 一种多模态乐曲标题生成方法、装置及存储介质 | |
JP2004171220A (ja) | 文書管理装置および方法 | |
JP6115487B2 (ja) | 情報収集方法、対話システム及び情報収集装置 | |
JP5810053B2 (ja) | 要約生成装置及び方法及びプログラム | |
JP6698006B2 (ja) | 要約生成装置、方法、及びプログラム | |
JPH03105566A (ja) | 抄録作成方式 | |
JP2009282903A (ja) | 知識抽出・検索装置およびその方法 | |
JP2009140048A (ja) | 評判関係抽出装置、その方法およびプログラム | |
KR100886688B1 (ko) | 한국어 수량사 생성 방법 및 장치 | |
JP6451414B2 (ja) | 情報処理装置、要約文編集方法、及びプログラム | |
US11860914B1 (en) | Natural language database generation and query system | |
JP2000231561A (ja) | 検索方法ならびに装置及び同方法がプログラムされ記録された記録媒体 | |
Leplus et al. | Weather report translation using a translation memory | |
JPH11250063A (ja) | 検索装置及び検索方法 | |
JP2005071291A (ja) | 換言装置及びコンピュータプログラム、文の対を準備する方法、及びリンクされたサブツリーを準備する方法 | |
JP6569543B2 (ja) | 短縮文生成装置、方法およびプログラム。 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140514 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5547254 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |