JP2008234049A - 要約文生成装置及び要約文生成プログラム - Google Patents
要約文生成装置及び要約文生成プログラム Download PDFInfo
- Publication number
- JP2008234049A JP2008234049A JP2007069379A JP2007069379A JP2008234049A JP 2008234049 A JP2008234049 A JP 2008234049A JP 2007069379 A JP2007069379 A JP 2007069379A JP 2007069379 A JP2007069379 A JP 2007069379A JP 2008234049 A JP2008234049 A JP 2008234049A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- character string
- lead
- read
- edit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】要約文生成装置1は、リード文と複数の他の文とを形態素解析する形態素解析部11aと、この解析結果に基づいて各々の他の文のリード文に対する類似度を算出する文類似度算出手段12と、この類似度が閾値以上となる他の文を選定する編集文選定部13aと、選定された他の文に含まれる他文文字列と、リード文に含まれるリード文字列とで一致するものを対応させ、対応付けられた当該他文文字列の前もしくは後ろの文字列を、リード文において、対応付けられた当該リード文字列に対して、他文文字列に対する位置と同じ位置に挿入、あるいは、当該リード文字列の同じ位置の文字列と置換するリード文編集手段14とを備えることを特徴とする。
【選択図】図1
Description
[要約文生成装置の構成]
まず、図1を参照して、本発明における要約文生成装置1の構成について説明する。図1は、本発明における要約文生成装置の構成を模式的に示した構成図である。
次に、図5を参照して、要約文生成装置1の動作について説明する。図5は、本発明における要約文生成装置の動作を示したフローチャートである。
11 構文解析手段(構文解析手段)
11a 形態素解析部(形態素解析手段)
11b 構文解析部
12 文類似度算出手段
12a 頻度リスト生成部
12b 類似度算出部
13 文選定手段
13a 編集文選定部(編集文選定手段)
13b 補足文選定部
14 リード文編集手段
14a 編集候補生成部(編集候補生成手段)
14b 編集判定部(編集判定手段)
15 補足文出力判定手段
Claims (5)
- リード文と、複数の他の文とからなる文章から、当該文章の要約文を生成する要約文生成装置であって、
前記リード文と複数の前記他の文とのそれぞれについて形態素解析する形態素解析手段と、
この形態素解析手段によって解析された形態素ごと、あるいは、複数の前記形態素の組み合わせごとの頻度を前記リード文と複数の前記他の文とについて解析して、この頻度から複数の前記他の文の各々について、前記リード文に対する類似度を算出する文類似度算出手段と、
この文類似度算出手段によって算出された類似度が、予め設定された第1の閾値以上となる前記他の文を選定する編集文選定手段と、
前記リード文を、前記編集文選定手段によって選定された他の文に含まれる文字列である他文文字列に基づいて編集するリード文編集手段とを備え、
前記リード文編集手段が、前記リード文に含まれる文字列であるリード文字列と、前記他文文字列とについて一致するもの同士を対応させ、対応付けられた当該他文文字列の前もしくは後ろの文字列である隣接他文文字列を、前記リード文において、対応付けられた当該リード文字列に対して、前記他文文字列に対する前記隣接他文文字列の位置と同じ位置に挿入する操作、及び、当該リード文字列に対して前記同じ位置にある文字列である隣接リード文字列と置換する操作の少なくとも一方の操作を行うことを特徴とする要約文生成装置。 - 前記リード文編集手段が、
前記リード文字列と、前記他文文字列とについて一致するもの同士を対応させ、前記隣接他文文字列を、前記リード文において、対応付けられた当該リード文字列に対して、前記他文文字列に対する前記隣接他文文字列の位置と同じ位置に挿入する操作、及び、当該リード文字列に対して前記同じ位置にある文字列である隣接リード文字列と置換する操作の少なくとも一方の操作の編集候補を生成する編集候補生成手段と、
外部から入力された、前記リード文の編集後の長さの上限値の情報に基づいて、前記編集候補生成手段によって生成された編集候補の編集を前記リード文に対して行った際の前記リード文の編集後の長さが、前記上限値以下となる場合に当該編集を行う編集判定手段とを有することを特徴とする請求項1に記載の要約文生成装置。 - 前記文類似度算出手段によって算出された類似度が、前記第1の閾値以下の予め設定された第2の閾値以下となる前記他の文を選定し、前記リード文編集手段によって編集された文の後に出力する補足文選定出力手段を更に備えることを特徴とする請求項1又は請求項2に記載の要約文生成装置。
- 前記形態素解析手段による解析結果に基づいて、前記リード文と複数の前記他の文とのそれぞれについて構文解析する構文解析手段を更に備え、
前記文類似度算出手段が、前記構文解析手段によって解析された係り受けの関係にある文節の組み合わせごとの頻度を前記リード文と複数の前記他の文とについて解析して、この頻度から複数の前記他の文の各々の文ついて、前記リード文に対する類似度を算出することを特徴とする請求項1から請求項3のいずれか一項に記載の要約文生成装置。 - リード文と、複数の他の文とからなる文章から、当該文章の要約文を生成するためにコンピュータを、
前記リード文と複数の前記他の文とのそれぞれについて形態素解析する形態素解析手段、
この形態素解析手段によって解析された形態素ごと、あるいは、複数の前記形態素の組み合わせごとの頻度を前記リード文と複数の前記他の文とについて解析して、この頻度から複数の前記他の文の各々について、前記リード文に対する類似度を算出する文類似度算出手段、
この文類似度算出手段によって算出された類似度が、予め設定された第1の閾値以上となる前記他の文を選定する編集文選定手段、
前記リード文を、前記編集文選定手段によって選定された他の文に含まれる文字列である他文文字列に基づいて編集するリード文編集手段として機能させ、
前記リード文編集手段が、前記リード文に含まれる文字列であるリード文字列と、前記他文文字列とについて一致するもの同士を対応させ、対応付けられた当該他文文字列の前もしくは後ろの文字列である隣接他文文字列を、前記リード文において、対応付けられた当該リード文字列に対して、前記他文文字列に対する前記隣接他文文字列の位置と同じ位置に挿入する操作、及び、当該リード文字列に対して前記同じ位置にある文字列である隣接リード文字列と置換する操作の少なくとも一方の操作を行うことを特徴とする要約文生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007069379A JP4856573B2 (ja) | 2007-03-16 | 2007-03-16 | 要約文生成装置及び要約文生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007069379A JP4856573B2 (ja) | 2007-03-16 | 2007-03-16 | 要約文生成装置及び要約文生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008234049A true JP2008234049A (ja) | 2008-10-02 |
JP4856573B2 JP4856573B2 (ja) | 2012-01-18 |
Family
ID=39906788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007069379A Expired - Fee Related JP4856573B2 (ja) | 2007-03-16 | 2007-03-16 | 要約文生成装置及び要約文生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4856573B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009271826A (ja) * | 2008-05-09 | 2009-11-19 | Nippon Hoso Kyokai <Nhk> | 自然言語処理装置およびプログラム |
JP2010262511A (ja) * | 2009-05-08 | 2010-11-18 | Nippon Telegr & Teleph Corp <Ntt> | テキスト要約方法、その装置およびプログラム |
US9262394B2 (en) | 2010-03-26 | 2016-02-16 | Nec Corporation | Document content analysis and abridging apparatus |
JP2021051711A (ja) * | 2019-09-20 | 2021-04-01 | 株式会社Nttドコモ | テキスト処理装置、方法、デバイス及びコンピュータ読み取り可能な記録媒体 |
CN113874854A (zh) * | 2019-05-20 | 2021-12-31 | 三菱电机株式会社 | 本体生成系统、本体生成方法和本体生成程序 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001043220A (ja) * | 1999-07-27 | 2001-02-16 | Sony Corp | 文書処理方法及び装置並びに記録媒体 |
JP2001249948A (ja) * | 2000-03-03 | 2001-09-14 | Nippon Hoso Kyokai <Nhk> | 重要文抽出装置および記憶媒体 |
-
2007
- 2007-03-16 JP JP2007069379A patent/JP4856573B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001043220A (ja) * | 1999-07-27 | 2001-02-16 | Sony Corp | 文書処理方法及び装置並びに記録媒体 |
JP2001249948A (ja) * | 2000-03-03 | 2001-09-14 | Nippon Hoso Kyokai <Nhk> | 重要文抽出装置および記憶媒体 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009271826A (ja) * | 2008-05-09 | 2009-11-19 | Nippon Hoso Kyokai <Nhk> | 自然言語処理装置およびプログラム |
JP2010262511A (ja) * | 2009-05-08 | 2010-11-18 | Nippon Telegr & Teleph Corp <Ntt> | テキスト要約方法、その装置およびプログラム |
US9262394B2 (en) | 2010-03-26 | 2016-02-16 | Nec Corporation | Document content analysis and abridging apparatus |
CN113874854A (zh) * | 2019-05-20 | 2021-12-31 | 三菱电机株式会社 | 本体生成系统、本体生成方法和本体生成程序 |
JP2021051711A (ja) * | 2019-09-20 | 2021-04-01 | 株式会社Nttドコモ | テキスト処理装置、方法、デバイス及びコンピュータ読み取り可能な記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP4856573B2 (ja) | 2012-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3372532B2 (ja) | 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体 | |
JP4856573B2 (ja) | 要約文生成装置及び要約文生成プログラム | |
JPH09198409A (ja) | 酷似文書抽出方法 | |
JP5447368B2 (ja) | 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム | |
Sánchez-Marco et al. | Annotation and representation of a diachronic corpus of Spanish | |
JP6689466B1 (ja) | 文構造ベクトル化装置、文構造ベクトル化方法、及び文構造ベクトル化プログラム | |
JPH08129554A (ja) | 関係表現抽出装置および関係表現検索装置 | |
KR101835994B1 (ko) | 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치 | |
JP4476609B2 (ja) | 中国語解析装置、中国語解析方法および中国語解析プログラム | |
JP7131130B2 (ja) | 分類方法、装置、及びプログラム | |
JP2001101184A (ja) | 構造化文書生成方法及び装置及び構造化文書生成プログラムを格納した記憶媒体 | |
JP4341077B2 (ja) | 文書処理装置、文書処理方法、および、文書処理プログラム | |
JP2005063030A (ja) | 概念表現方法、概念表現生成方法及び概念表現生成装置並びに該方法を実現するプログラム及び該プログラムが記録された記録媒体 | |
Souter et al. | Using Parsed Corpora: A review of current practice | |
JP4049141B2 (ja) | 文書処理装置、文書処理方法、および、文書処理プログラム | |
Bhowmik et al. | Development of A Word Based Spell Checker for Bangla Language | |
JP2004206659A (ja) | 読み情報決定方法及び装置及びプログラム | |
JP3937909B2 (ja) | プログラム、文処理装置及び文処理方法 | |
KR100283100B1 (ko) | 대용량 말뭉치를 위한 통계학적 용례 추출 수단 및 그 방법 | |
JPH0561902A (ja) | 機械翻訳システム | |
JP4262529B2 (ja) | 全文検索装置、方法、プログラム及び記録媒体 | |
JP5032453B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP2018077548A (ja) | 考案文章の類似有無を対象文章群から自動判断する人工知能装置 | |
JPH0944522A (ja) | キーワード抽出装置 | |
JP2004054431A (ja) | 構造化文書生成装置及び構造化文書生成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090319 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110722 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110802 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110913 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111004 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111028 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141104 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4856573 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |