JP2004118545A - テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム - Google Patents

テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム Download PDF

Info

Publication number
JP2004118545A
JP2004118545A JP2002281212A JP2002281212A JP2004118545A JP 2004118545 A JP2004118545 A JP 2004118545A JP 2002281212 A JP2002281212 A JP 2002281212A JP 2002281212 A JP2002281212 A JP 2002281212A JP 2004118545 A JP2004118545 A JP 2004118545A
Authority
JP
Japan
Prior art keywords
constituent unit
unit
constituent
importance
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002281212A
Other languages
English (en)
Inventor
Hiraki Ishikawa
石川 開
Shinichi Ando
安藤 真一
Shinichi Doi
土井 伸一
Akitoshi Okumura
奥村 明俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2002281212A priority Critical patent/JP2004118545A/ja
Publication of JP2004118545A publication Critical patent/JP2004118545A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】短時間で、かつ、品質の良い要約を生成することができるテキスト要約の実現。
【解決手段】要約構成単位の認定手段101が、入力テキストの各文に対して要約構成単位認定用言語知識情報104を適用して述部を含む節を最小とする単位を要約構成単位として認定し、次に、要約構成単位の重要度計算手段102が要約構成単位に対して、テキスト中での要約構成単位の位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算し、最後に、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出し、要約結果出力手段103が抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する。
【選択図】   図1

Description

【0001】
【発明の属する技術分野】
本発明は、テキスト要約システム、テキスト要約方法、および、テキスト要約プログラムに関し、特に、要約構成単位の認定を実施するテキスト要約システム、テキスト要約方法、および、テキスト要約プログラムに関する。
【0002】
【従来の技術】
特許文献1記載の技術は、「関係解析手段において、入力された文書中のテキストに対して係り受け解析を行い、単語同士の2項関係を抽出し、指示入力手段で要約結果に対してユーザから詳細化する単語や情報の種類の指示を受け付け、その指示を優先すべき2項関係の条件を示す優先条件に指示解釈手段で変換し、この優先条件と、抽出しておいた2項関係から、重要な2項関係を関係選択手段で選択し、選択した重要な2項関係に補完すべき2項関係を関係補完手段で追加し、このようにして得られた2項関係から、句合成手段で句要約を合成する技術」である。
【0003】
また、特許文献2記載の技術は、「日本語文の入力を読み込む入力読み込み手段と、入力文に対する辞書引き機能と辞書引き後の辞書情報を用いて入力文を解析する形態素解析手段、構文解析手段、意味解析手段とメモリとを備えた日本語処理システムに用いる日本語文解析方式において、日本語における、係助詞「は」で示される主題、もしくは格助詞「が」で示される主格の複数の用言間での共有を規定する語彙に関する情報をあらかじめ収集して前記メモリ内に保持している主題・主格共有語彙情報保持手段と、前記主題・主格共有語彙情報保持手段に保持された語彙情報を用いて、主題・主格の共有が存在するか否かを推定する主題・主格共有推定手段を備え、構文解析・意味解析に先立って主題・主格の共有の存在を推定する技術」である。
【0004】
また、計算機によってテキスト要約を行う従来法としては、重要文抽出法がある。これは、テキスト中において、文を要約構成単位と認定し、その重要度を評価し、重要度の高い要約構成単位を抽出し、元テキストの出現順に並べることで要約文を構成する方法である(たとえば、非特許文献1)。
【0005】
この方式は多くの要約システムで用いられている基本方式であり、基本的には文の位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算し、重要度の高いものを元のテキストの出現順に並べることで要約を生成する(たとえば、非特許文献2、3)。
【0006】
また、これに関連する方式として、文節を要約構成単位として認定するテキスト要約方式がある(たとえば、非特許文献4)。
この方式では、文の構文構造における格要素などの主要な構造の構成素は保存しつつ、重要度の低い文節を削除することによって要約文を生成する方法である。
【0007】
また、文内文脈に関する解析をする手段に関する技術がある(たとえば、非特許文献5)。
【0008】
【特許文献1】
特開2000−250937号公報
【特許文献2】
特開平05−113994号公報
【非特許文献1】
H. P. Luhn,“The Automatic Creation of Literature Abstracts”,IBM Journal ,1958, p.159−165
【非特許文献2】
H. P. Edmundson,“New Methods in automatic extracting.”, Journal of the Association for Computing Machinery, 16(2), 1968, p.264−285
【非特許文献3】
奥村等,“テキスト自動要約に関する研究動向(巻頭言に代えて)”自然言語処理, Vol.6, No.6, 1999, p.1−26
【非特許文献4】
三上等, “ニュース番組における字幕生成のための文内短縮による要約”,自然言語処理 Vol.6, No.6, 1999, p.65−82
【非特許文献5】
亀井等, “Lexical Discourse Grammarの提案”, 電子情報通信学会 言語理解とコミュニケーション研究会, NLC86−7, ,1986, p.1−5
【0009】
【発明が解決しようとする課題】
重要文抽出法は文を要約の構成単位として抽出するために、簡易な処理によって可読性の高い要約を生成できるという利点がある。しかし一方で、短くて品質の良い要約を生成する上で、文を最小単位として要約を構成する方法には限界がある。短い要約を生成する場合には、要約を構成する単位の組み合わせが制限されるためである。またテキストに長文が含まれる場合、一部重要でない部分があっても除くことができず、このことも品質の良い要約を得る上での限界を生じる。
【0010】
一方、文節を要約構成単位とするテキスト要約方法では、重要文抽出法に比べてより小さい要約構成単位を用いるために要約生成の自由度が高く、短い要約の生成における限界や品質の低下が生じにくい。しかし、文節を要約構成単位に用いることが結果として要約文生成において構文構造の変更を伴うことになり、生成された要約文の構文的正しさや意味的な正しさの保証といった文生成の難しい課題を生じる。正確で詳細な構文構造の情報を得るには、精度良い本格的な構文解析手段が必要となるが、このような方法は要約生成の計算コストが大きい。
【0011】
本発明の目的は、適切な要約構成単位の利用による要約品質向上と要約生成処理の簡易化による処理の高速化を同時に実現することができるテキスト要約方法を提供することである。これにより、利用者が短い要約を要求する場合にも、従来の要約方法に比べて短時間でかつ品質の良い要約を生成することが可能となる。
【0012】
【課題を解決するための手段】
本発明の第1のテキスト要約システムは、文の述部を含む節を要約構成単位とする情報を含む要約構成単位認定用言語知識情報を記憶装置から読み出し、読み出した要約構成単位認定用言語知識情報を用いて要約構成単位を認定する要約構成単位の認定手段と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手段と、重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手段とを有することを特徴とする。
【0013】
本発明の第2のテキスト要約システムは、照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手段と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手段と、重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手段とを有することを特徴とする。
【0014】
本発明の第3のテキスト要約システムは、照合条件、文の述部を含む節を単位とする要約構成単位、適用コストを含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手段と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手段と、適用コストを考慮し重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手段とを有することを特徴とする。
【0015】
本発明の第4のテキスト要約システムは、前記第1、第2、または、第3のテキスト要約システムであって、照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、前記要約構成単位の認定手段により認定された要約構成単位に対し文の表現に基づいて補完・修正を実施し、補完・修正した要約構成単位を前記要約構成単位の重要度計算手段に出力する要約構成単位の補完修正手段を有することを特徴とする。
【0016】
本発明の第5のテキスト要約システムは、前記第1、第2、または、第3のテキスト要約システムであって、照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、前記要約構成単位の重要度計算手段により重要度が評価された要約構成単位に対し文の表現に基づいて補完・修正を実施し、補完・修正した要約構成単位を前記要約結果出力手段に出力する要約構成単位の補完修正手段を有することを特徴とする。
【0017】
本発明の第6のテキスト要約システムは、照合条件、文の述部を含む節を単位とする要約構成単位、抽出順序制約を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位間の接続関係、または、引用関係を考慮し要約構成単位を認定し、要約構成単位の認定手段と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手段と、重要度の評価された要約構成単位に対し抽出順序制約を用いて抽出順序を考慮する抽出順序に関する制約の設定手段と、重要度が高く抽出順序の考慮された要約構成単位を抽出して要約を作成する要約結果出力手段とを有することを特徴とする。
【0018】
本発明の第7のテキスト要約システムは、照合条件、文の述部を含む節を単位とする要約構成単位、適用コスト、抽出順序制約を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位間の接続関係、または、引用関係を考慮し要約構成単位を認定し、要約構成単位の認定手段と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手段と、重要度の評価された要約構成単位に対し抽出順序制約を用いて抽出順序を考慮する抽出順序に関する制約の設定手段と、適用コストを考慮し重要度が高く抽出順序の考慮された要約構成単位を抽出して要約を作成する要約結果出力手段とを有することを特徴とする。
【0019】
本発明の第8のテキスト要約システムは、照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手段と、照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、要約構成単位に対し文の表現に基づいて補完・修正を実施し出力する要約構成単位の補完修正手段と、前記要約構成単位の補完修正手段からの要約構成単位の重要度を評価する要約構成単位の重要度計算手段と、要約中において隣接する要約構成単位が元の文書の同一文中においても隣接する場合、要約構成単位に対し隣接する要約構成単位間での補完や修正については元の表現を適用する表現の還元手段と、前記還元手段からの要約構成単位に対し重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手段とを有することを特徴とする。
【0020】
本発明の第9のテキスト要約システムは、照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて述部を含む節を最小とする単位を要約構成単位として認定し、これから要約文候補を得る要約文候補の生成手段と、照合条件、補完修正情報、適用コストを含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、要約文候補に対し文の表現に基づいて補完・修正を実施し出力する要約構成単位の補完修正手段と、前記要約構成単位の補完修正手段からの要約文候補の重要度を評価する要約構成単位の重要度計算手段と、要約文候補に対する重要度に基づいて、各文での要約文候補を探索し、要約として最尤の要約文候補の組み合わせを決定する際、要約構成単位を認定するためのコストと要約構成単位を補完修正するためのコストも考慮して抽出を行う要約文候補の探索手段と、決定された最尤の要約文候補の組み合わせを、出現順に並べ、要約結果として出力する要約結果出力手段とを有することを特徴とする。
【0021】
本発明の第1のテキスト要約方法は、文の述部を含む節を要約構成単位とする情報を含む要約構成単位認定用言語知識情報を記憶装置から読み出し、読み出した要約構成単位認定用言語知識情報を用いて要約構成単位を認定する要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手順とを有することを特徴とする。
【0022】
本発明の第2のテキスト要約方法は、照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手順とを有することを特徴とする。
【0023】
本発明の第3のテキスト要約方法は、照合条件、文の述部を含む節を単位とする要約構成単位、適用コストを含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、適用コストを考慮し重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手順とを有することを特徴とする。
【0024】
本発明の第4のテキスト要約方法は、前記第1、第2、または、第3のテキスト要約方法であって、照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、前記要約構成単位の認定手順により認定された要約構成単位に対し文の表現に基づいて補完・修正を実施し、補完・修正した要約構成単位を前記要約構成単位の重要度計算手順に出力する要約構成単位の補完修正手順を有することを特徴とする。
【0025】
本発明の第5のテキスト要約方法は、前記第1、第2、または、第3のテキスト要約方法であって、照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、前記要約構成単位の重要度計算手順により重要度が評価された要約構成単位に対し文の表現に基づいて補完・修正を実施し、補完・修正した要約構成単位を前記要約結果出力手順に出力する要約構成単位の補完修正手順を有することを特徴とする。
【0026】
本発明の第6のテキスト要約方法は、照合条件、文の述部を含む節を単位とする要約構成単位、抽出順序制約を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位間の接続関係、または、引用関係を考慮し要約構成単位を認定し、要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、重要度の評価された要約構成単位に対し抽出順序制約を用いて抽出順序を考慮する抽出順序に関する制約の設定手順と、重要度が高く抽出順序の考慮された要約構成単位を抽出して要約を作成する要約結果出力手順とを有することを特徴とする。
【0027】
本発明の第7のテキスト要約方法は、照合条件、文の述部を含む節を単位とする要約構成単位、適用コスト、抽出順序制約を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位間の接続関係、または、引用関係を考慮し要約構成単位を認定し、要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、重要度の評価された要約構成単位に対し抽出順序制約を用いて抽出順序を考慮する抽出順序に関する制約の設定手順と、適用コストを考慮し重要度が高く抽出順序の考慮された要約構成単位を抽出して要約を作成する要約結果出力手順とを有することを特徴とする。
【0028】
本発明の第8のテキスト要約方法は、照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手順と、照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、要約構成単位に対し文の表現に基づいて補完・修正を実施し出力する要約構成単位の補完修正手順と、前記要約構成単位の補完修正手順からの要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、要約中において隣接する要約構成単位が元の文書の同一文中においても隣接する場合、要約構成単位に対し隣接する要約構成単位間での補完や修正については元の表現を適用する表現の還元手順と、前記還元手順からの要約構成単位に対し重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手順とを有することを特徴とする。
【0029】
本発明の第9のテキスト要約方法は、照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて述部を含む節を最小とする単位を要約構成単位として認定し、これから要約文候補を得る要約文候補の生成手順と、照合条件、補完修正情報、適用コストを含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、要約文候補に対し文の表現に基づいて補完・修正を実施し出力する要約構成単位の補完修正手順と、前記要約構成単位の補完修正手順からの要約文候補の重要度を評価する要約構成単位の重要度計算手順と、要約文候補に対する重要度に基づいて、各文での要約文候補を探索し、要約として最尤の要約文候補の組み合わせを決定する際、要約構成単位を認定するためのコストと要約構成単位を補完修正するためのコストも考慮して抽出を行う要約文候補の探索手順と、決定された最尤の要約文候補の組み合わせを、出現順に並べ、要約結果として出力する要約結果出力手順とを有することを特徴とする。
【0030】
本発明の第1のテキスト要約プログラムは、文の述部を含む節を要約構成単位とする情報を含む要約構成単位認定用言語知識情報を記憶装置から読み出し、読み出した要約構成単位認定用言語知識情報を用いて要約構成単位を認定する要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手順とをコンピュータに実行させることを特徴とする。
【0031】
本発明の第2のテキスト要約プログラムは、照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手順とをコンピュータに実行させることを特徴とする。
【0032】
本発明の第3のテキスト要約プログラムは、照合条件、文の述部を含む節を単位とする要約構成単位、適用コストを含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、適用コストを考慮し重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手順とをコンピュータに実行させることを特徴とする。
【0033】
本発明の第4のテキスト要約プログラムは、前記第1、第2、または、第3のテキスト要約プログラムであって、照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、前記要約構成単位の認定手順により認定された要約構成単位に対し文の表現に基づいて補完・修正を実施し、補完・修正した要約構成単位を前記要約構成単位の重要度計算手順に出力する要約構成単位の補完修正手順をコンピュータに実行させることを特徴とする。
【0034】
本発明の第5のテキスト要約プログラムは、前記第1、第2、または、第3のテキスト要約プログラムであって、照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、前記要約構成単位の重要度計算手順により重要度が評価された要約構成単位に対し文の表現に基づいて補完・修正を実施し、補完・修正した要約構成単位を前記要約結果出力手順に出力する要約構成単位の補完修正手順をコンピュータに実行させることを特徴とする。
【0035】
本発明の第6のテキスト要約プログラムは、照合条件、文の述部を含む節を単位とする要約構成単位、抽出順序制約を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位間の接続関係、または、引用関係を考慮し要約構成単位を認定し、要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、重要度の評価された要約構成単位に対し抽出順序制約を用いて抽出順序を考慮する抽出順序に関する制約の設定手順と、重要度が高く抽出順序の考慮された要約構成単位を抽出して要約を作成する要約結果出力手順とをコンピュータに実行させることを特徴とする。
【0036】
本発明の第7のテキスト要約プログラムは、照合条件、文の述部を含む節を単位とする要約構成単位、適用コスト、抽出順序制約を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位間の接続関係、または、引用関係を考慮し要約構成単位を認定し、要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、重要度の評価された要約構成単位に対し抽出順序制約を用いて抽出順序を考慮する抽出順序に関する制約の設定手順と、適用コストを考慮し重要度が高く抽出順序の考慮された要約構成単位を抽出して要約を作成する要約結果出力手順とをコンピュータに実行させることを特徴とする。
【0037】
本発明の第8のテキスト要約プログラムは、照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手順と、照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、要約構成単位に対し文の表現に基づいて補完・修正を実施し出力する要約構成単位の補完修正手順と、前記要約構成単位の補完修正手順からの要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、要約中において隣接する要約構成単位が元の文書の同一文中においても隣接する場合、要約構成単位に対し隣接する要約構成単位間での補完や修正については元の表現を適用する表現の還元手順と、前記還元手順からの要約構成単位に対し重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手順とをコンピュータに実行させることを特徴とする。
【0038】
本発明の第9のテキスト要約プログラムは、照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて述部を含む節を最小とする単位を要約構成単位として認定し、これから要約文候補を得る要約文候補の生成手順と、照合条件、補完修正情報、適用コストを含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、要約文候補に対し文の表現に基づいて補完・修正を実施し出力する要約構成単位の補完修正手順と、前記要約構成単位の補完修正手順からの要約文候補の重要度を評価する要約構成単位の重要度計算手順と、要約文候補に対する重要度に基づいて、各文での要約文候補を探索し、要約として最尤の要約文候補の組み合わせを決定する際、要約構成単位を認定するためのコストと要約構成単位を補完修正するためのコストも考慮して抽出を行う要約文候補の探索手順と、決定された最尤の要約文候補の組み合わせを、出現順に並べ、要約結果として出力する要約結果出力手順とをコンピュータに実行させることを特徴とする。
【0039】
【発明の実施の形態】
次に、本発明の第1の実施の形態について図面を参照して詳細に説明する。
【0040】
図1は、本発明の第1の実施の形態の構成を示すブロック図である。
【0041】
図1を参照すると、本発明の第1の実施の形態は、要約構成単位の認定手段101と、要約構成単位の重要度計算手段102と、要約結果出力手段103と、要約構成単位認定用言語知識情報104とから構成されている。
【0042】
要約構成単位認定用言語知識情報104は、メモリ、ハードディスク等の記憶装置に格納されており、読み出されて利用されるが、以下、いちいち記述しない。
【0043】
これらの手段はそれぞれ概略つぎのように機能する。
【0044】
要約構成単位の認定手段101は、テキストを入力し、入力したテキストの各文に対して要約構成単位認定用言語知識情報104を用いて述部を含む節を最小とする単位を要約構成単位として認定する。要約構成単位の重要度計算手段102は、要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算する。要約結果出力手段103は、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出し、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する。
【0045】
ここで、要約構成単位の認定手段101としては、たとえば、構文解析を実施する手段、あるいは、文内文脈に関する解析を実施する手段(たとえば、非特許文献5)を用いることが可能である。また、構文解析の結果から述部を含む節を抽出する規則を要約構成単位認定用言語知識情報104として用いることが可能である。
【0046】
次に、本発明の第1の実施の形態の動作について詳細に説明する。
【0047】
まず、入力テキストの各文に対して要約構成単位認定用言語知識情報104を用いて述部を含む節を最小とする単位を要約構成単位として認定し(要約構成単位の認定手段101)、次に、要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算し(要約構成単位の重要度計算手段102)、最後に、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出し、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する(要約結果出力手段103)。
【0048】
次に、本発明の第1の実施の形態の効果について説明する。
【0049】
本発明の第1の実施の形態では、要約構成単位の認定手段101によって、入力テキストの各文に対して述部を含む節を最小とする単位を要約構成単位として認定し、これを単位として要約を生成するので、要約生成の自由度が高く、短い要約の生成にいても品質の良い要約を生成することができる。
【0050】
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。
【0051】
図2は、本発明の第2の実施の形態の構成を示すブロック図である。
【0052】
図2を参照すると、本発明の第2の実施の形態は、要約構成単位の認定手段201と、要約構成単位の重要度計算手段202と、要約結果出力手段203と、要約構成単位認定パタン204とから構成されている。要約構成単位認定パタン204は、メモリ、ハードディスク等の記憶装置に格納されており、読み出されて利用されるが、以下、いちいち記述しない。
【0053】
これらの手段はそれぞれ概略つぎのように機能する。
【0054】
要約構成単位の認定手段201は、入力テキストの各文に対して要約構成単位を認定するための要約構成単位認定パタン204を用いて述部を含む節を最小とする単位を要約構成単位として認定する。要約構成単位の重要度計算手段202は、要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算する。要約結果出力手段203は、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出し、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する。
【0055】
次に、本発明の第2の実施の形態の動作について詳細に説明する。
【0056】
まず、入力テキストの各文に対して要約構成単位認定するための要約構成単位認定パタン204を用いて述部を含む節を最小とする単位を要約構成単位として認定し(要約構成単位の認定手段201)、次に、要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算し(要約構成単位の重要度計算手段202)、最後に、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出し、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する(要約結果出力手段203)。
【0057】
次に、本発明の第2の実施の形態の効果について説明する。
【0058】
本発明の第2の実施の形態では、要約構成単位の認定手段201によって、入力テキストの各文に対して述部を含む節を最小とする単位を要約構成単位として認定し、これを単位として要約を生成するので、要約生成の自由度が高く、短い要約の生成にいても品質の良い要約を生成することができ、また、文節を要約構成単位とする要約方法と比べて粗い構文解析で要約構成単位を認定できるために、より簡易な処理によって要約を生成することができる。
【0059】
次に、本発明の第3の実施の形態について図面を参照して詳細に説明する。
【0060】
図3は、本発明の第3の実施の形態の構成を示すブロック図である。
【0061】
図3を参照すると、本発明の第3の実施の形態は、要約構成単位の認定手段301と、要約構成単位の重要度計算手段302と、要約結果出力手段303と、要約構成単位認定パタン304とから構成されている。要約構成単位認定パタン304は、メモリ、ハードディスク等の記憶装置に格納されており、読み出されて利用されるが、以下、いちいち記述しない。
【0062】
これらの手段はそれぞれ概略つぎのように機能する。
【0063】
要約構成単位の認定手段301は、入力テキストの各文に対して要約構成単位を認定し、さらにそれぞれの要約構成単位を認定するためのコストが設定できる要約構成単位認定パタン304を用いて、述部を含む節を最小とする単位を要約構成単位として認定する。要約構成単位の重要度計算手段302は、これらの要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算する。要約結果出力手段303は、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出する際、要約構成単位を認定するためのコストも考慮して抽出を行い、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する。
【0064】
次に、本発明の第3の実施の形態の動作について詳細に説明する。
【0065】
まず、入力テキストの各文に対して要約構成単位を認定し、さらにそれぞれの要約構成単位認定パタン304のなかの要約構成単位を認定するためのコストが設定できる要約構成単位認定パタン304を用いて、述部を含む節を最小とする単位を要約構成単位として認定し(要約構成単位の認定手段301)、次に、これらの要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算し(要約構成単位の重要度計算手段302)、最後に、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出する際、要約構成単位を認定するためのコストも考慮して抽出を行い、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する(要約結果出力手段303)。
【0066】
次に、本発明の第3の実施の形態の効果について説明する。
【0067】
本発明の第3の実施の形態では、要約構成単位の認定手段201によって、入力テキストの各文に対して述部を含む節を最小とする単位を要約構成単位として認定し、これを単位として要約を生成するので、要約生成の自由度が高く、短い要約の生成にいても品質の良い要約を生成することができ、また、文節を要約構成単位とする要約方法と比べて粗い構文解析で要約構成単位を認定できるために、より簡易な処理によって要約を生成することができ、また、コストの高い単位認定パタンの適用を抑制することができるため、信頼度の低いパタンに大きなコストを与えることにより、信頼度の低い要約構成単位の要約文への抽出が抑制され、高品質な要約文が生成される効果が得られる。
【0068】
次に、本発明の第4の実施の形態について図面を参照して詳細に説明する。
【0069】
図4は、本発明の第4の実施の形態の構成を示すブロック図である。
【0070】
図4を参照すると、本発明の第4の実施の形態は、要約構成単位の認定手段401と、要約構成単位の補完修正手段402と、要約構成単位の重要度計算手段403と、要約結果出力手段404と、要約構成単位認定用言語知識情報405と、要約構成単位補完修正用言語知識情報406とから構成されている。ここで、要約構成単位の補完修正手段402としては、たとえば、主題・主格の共有の存在を推定する文解析方式を実施する手段(たとえば、特許文献2)を用いることが可能である。要約構成単位認定用言語知識情報405、要約構成単位補完修正用言語知識情報406は、メモリ、ハードディスク等の記憶装置に格納されており、読み出されて利用されるが、以下、いちいち記述しない。
【0071】
これらの手段はそれぞれ概略つぎのように動作する。
【0072】
要約構成単位の認定手段401は、入力テキストの各文に対して要約構成単位認定用言語知識情報405を用いて、述部を含む節を最小とする単位を要約構成単位として認定する。要約構成単位の補完修正手段402は、要約構成単位補完修正用言語知識情報406を適用することにより、要約構成単位の情報のみでテキスト中におけるその重要度が適切に判断されるように、元の文で共有されていた情報を要約構成単位に補完する、もしくは、要約構成単位の表現が要約文中の独立した文として適切な表現となるように元文書における文の表現に基づいて修正する。
【0073】
要約構成単位の重要度計算手段403は、これらの情報の補完もしくは表現の修正が適切に行われた要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算する。要約結果出力手段404は、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出し、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する。
【0074】
次に、本発明の第4の実施の形態の動作について詳細に説明する。
【0075】
まず、入力テキストの各文に対して要約構成単位認定用言語知識情報405を用いて、述部を含む節を最小とする単位を要約構成単位として認定し(要約構成単位の認定手段401)、次に、要約構成単位補完修正用言語知識情報406を適用することにより、要約構成単位の情報のみでテキスト中におけるその重要度が適切に判断されるように、元の文で共有されていた情報を要約構成単位に適切に補完し、もしくは、要約構成単位の表現が要約文中の独立した文として適切な表現となるように元文書における文の表現に基づいて適切に修正し(要約構成単位の補完修正手段402)、さらに、これらの情報の補完もしくは表現の修正が適切に行われた要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算し(要約構成単位の重要度計算手段403)、最後に、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出し、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する(要約結果出力手段404)。
【0076】
次に、本発明の第4の実施の形態の効果について説明する。
【0077】
本発明の第4の実施の形態では、要約構成単位の補完修正手段402によって、文中から抽出された要約構成単位を元文書における文の表現に基づいて適切に補完もしくは修正するため、要約構成単位が要約文中に抽出されても文として不完全な表現が生じず、また補完された要約構成単位の情報によってその重要度が適切に評価されるので、要約の品質を改善することができる。
【0078】
次に、本発明の第5の実施の形態について図面を参照して詳細に説明する。
【0079】
図5は、本発明の第5の実施の形態の構成を示すブロック図である。
【0080】
図5を参照すると、本発明の第5の実施の形態は、要約構成単位の認定手段501と、要約構成単位の重要度計算手段502と、要約構成単位の補完修正手段503と、要約結果出力手段504と、要約構成単位認定用言語知識情報505と、要約構成単位補完修正用言語知識情報506とから構成されている。要約構成単位認定用言語知識情報505、要約構成単位補完修正用言語知識情報506は、メモリ、ハードディスク等の記憶装置に格納されており、読み出されて利用されるが、以下、いちいち記述しない。
【0081】
これらの手段はそれぞれ概略つぎのように機能する。
【0082】
要約構成単位の認定手段501は、入力テキストの各文に対して要約構成単位認定用言語知識情報505を用いて、述部を含む節を最小とする単位を要約構成単位として認定する。要約構成単位の重要度計算手段502は、これらの要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算する。要約構成単位の補完修正手段503は、要約構成単位補完修正用言語知識情報506を適用することにより、要約構成単位の表現が要約文中の独立した文として適切な表現となるように元文書における文の表現に基づいて修正する。要約結果出力手段504は、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出し、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する。
【0083】
次に、本発明の第5の実施の形態の動作について詳細に説明する。
【0084】
まず、入力テキストの各文に対して要約構成単位認定用言語知識情報505を用いて、述部を含む節を最小とする単位を要約構成単位として認定し(要約構成単位の認定手段501)、次に、これらの要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算し(要約構成単位の重要度計算手段502)、さらに、要約構成単位補完修正用言語知識情報506を適用することにより、要約構成単位の表現が要約文中の独立した文として適切な表現となるように元文書における文の表現に基づいて適切に修正し(要約構成単位の補完修正手段503)、最後に、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出し、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する(要約結果出力手段504)。
【0085】
次に、本発明の第5の実施の形態の効果について説明する。
【0086】
本発明の第5の実施の形態では、要約構成単位の補完修正手段503によって、文中から抽出された要約構成単位を元文書における文の表現に基づいて適切に補完もしくは修正するため、要約構成単位が要約文中に抽出されても文として不完全な表現が生じず、要約の品質を改善することができる。
【0087】
次に、本発明の第6の実施の形態について図面を参照して詳細に説明する。
【0088】
図6は、本発明の第6の実施の形態の構成を示すブロック図である。
【0089】
図6を参照すると、本発明の第6の実施の形態は、要約構成単位の認定手段601と、要約構成単位の補完修正手段602と、要約構成単位の重要度計算手段603と、要約結果出力手段604と、要約構成単位認定パタン605と、要約構成単位補完修正パタン606とから構成されている。要約構成単位認定パタン605、要約構成単位補完修正パタン606は、メモリ、ハードディスク等の記憶装置に格納されており、読み出されて利用されるが、以下、いちいち記述しない。
【0090】
これらの手段はそれぞれ概略つぎのように機能する。
【0091】
要約構成単位の認定手段601は、入力テキストの各文に対して要約構成単位認定パタン605を用いて、述部を含む節を最小とする単位を要約構成単位として認定する。要約構成単位の補完修正手段602は、要約構成単位補完修正パタン606を適用することにより、要約構成単位の情報のみでテキスト中におけるその重要度が適切に判断されるように、元の文で共有されていた情報を要約構成単位に補完する、もしくは、要約構成単位の表現が要約文中の独立した文として適切な表現となるように元文書における文の表現に基づいて修正する。要約構成単位の重要度計算手段603は、これらの情報の補完もしくは表現の修正が適切に行われた要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算する。要約結果出力手段604は、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出し、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する。
【0092】
次に、本発明の第6の実施の形態の動作について詳細に説明する。
【0093】
まず、入力テキストの各文に対して要約構成単位認定パタン605を用いて、述部を含む節を最小とする単位を要約構成単位として認定し(要約構成単位の認定手段601)、次に、要約構成単位補完修正パタン606を適用することにより、要約構成単位の情報のみでテキスト中におけるその重要度が適切に判断されるように、元の文で共有されていた情報を要約構成単位に適切に補完し、もしくは、要約構成単位の表現が要約文中の独立した文として適切な表現となるように元文書における文の表現に基づいて適切に修正し(要約構成単位の補完修正手段602)、さらに、これらの情報の補完もしくは表現の修正が適切に行われた要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算し(要約構成単位の重要度計算手段603)、最後に、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出し、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する(要約結果出力手段604)。
【0094】
次に、本発明の第6の実施の形態の効果について説明する。
【0095】
本発明の第6の実施の形態では、要約構成単位の補完修正手段602によって、文中から抽出された要約構成単位を元文書における文の表現に基づいて適切に補完もしくは修正するため、要約構成単位が要約文中に抽出されても文として不完全な表現が生じず、また補完された要約構成単位の情報によってその重要度が適切に評価されるので、要約の品質を改善することができる。
【0096】
次に、本発明の第7の実施の形態について図面を参照して詳細に説明する。
【0097】
図7は、本発明の第7の実施の形態の構成を示すブロック図である。
【0098】
図7を参照すると、本発明の第7の実施の形態は、要約構成単位の認定手段701と、要約構成単位の補完修正手段702と、要約構成単位の重要度計算手段703と、要約結果出力手段704と、要約構成単位認定パタン705と、要約構成単位補完修正パタン706とから構成されている。要約構成単位認定パタン705、要約構成単位補完修正パタン706は、メモリ、ハードディスク等の記憶装置に格納されており、読み出されて利用されるが、以下、いちいち記述しない。
【0099】
これらの手段はそれぞれ概略つぎのように機能する。
【0100】
要約構成単位の認定手段701は、入力テキストの各文に対して要約構成単位認定パタン705を用いて、述部を含む節を最小とする単位を要約構成単位として認定する。要約構成単位の補完修正手段702は、要約構成単位補完修正パタン706を適用することにより、要約構成単位の情報のみでテキスト中におけるその重要度が適切に判断されるように、元の文で共有されていた情報を要約構成単位に適切に補完し、もしくは、要約構成単位の表現が要約文中の独立した文として適切な表現となるように元文書における文の表現に基づいて適切に修正し、さらにそれぞれの要約構成単位補完修正パタン706で要約構成単位を補完修正するためのコストを設定する。
【0101】
要約構成単位の重要度計算手段703は、これらの情報の補完もしくは表現の修正が適切に行われた要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算する。要約結果出力手段704は、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出する際、要約構成単位を補完修正するためのコストも考慮して抽出を行い、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する。
【0102】
次に、本発明の第7の実施の形態の動作について詳細に説明する。
【0103】
まず、入力テキストの各文に対して要約構成単位認定パタン705を用いて、述部を含む節を最小とする単位を要約構成単位として認定し(要約構成単位の認定手段701)、次に、要約構成単位補完修正パタン706を適用することにより、要約構成単位の情報のみでテキスト中におけるその重要度が適切に判断されるように、元の文で共有されていた情報を要約構成単位に適切に補完し、もしくは、要約構成単位の表現が要約文中の独立した文として適切な表現となるように元文書における文の表現に基づいて適切に修正し、さらにそれぞれの要約構成単位補完修正パタン706で要約構成単位を補完修正するためのコストを設定し(要約構成単位の補完修正手段702)、さらに、これらの情報の補完もしくは表現の修正が適切に行われた要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算し(要約構成単位の重要度計算手段703)、最後に、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出する際、要約構成単位を補完修正するためのコストも考慮して抽出を行い、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する(要約結果出力手段704)。
【0104】
次に、本発明の第7の実施の形態の効果について説明する。
【0105】
本発明の第7の実施の形態では、要約構成単位の補完修正手段702によって、文中から抽出された要約構成単位を元文書における文の表現に基づいて適切に補完もしくは修正するため、要約構成単位が要約文中に抽出されても文として不完全な表現が生じず、また補完された要約構成単位の情報によってその重要度が適切に評価されるので、要約の品質を改善することができる。また、それぞれの要約構成単位補完修正パタン706で要約構成単位を補完修正するためのコストを設定することができるので、信頼度の低いパタンに大きなコストを与えることにより、信頼度の低い補完修正の適用による要約文が抑制され、これにより、より高品質な要約文が生成できる。
【0106】
次に、本発明の第8の実施の形態について図面を参照して詳細に説明する。
【0107】
図8は、本発明の第8の実施の形態の構成を示すブロック図である。
【0108】
図8を参照すると、本発明の第8の実施の形態は、要約構成単位の認定手段801と、要約構成単位の重要度計算手段802と、要約構成単位の抽出順序に関する制約の設定手段803と、要約結果出力手段804と、要約構成単位認定パタン805とから構成されている。要約構成単位認定パタン805は、メモリ、ハードディスク等の記憶装置に格納されており、読み出されて利用されるが、以下、いちいち記述しない。
【0109】
これらの手段はそれぞれ概略つぎのように機能する。
【0110】
要約構成単位の認定手段801は、入力テキストの各文に対して要約構成単位を認定し、さらにそれぞれの要約構成単位認定パタン805で認定される要約構成単位の間における接続関係や引用関係を認定し、要約構成単位認定パタン805を用いて、述部を含む節を最小とする単位を要約構成単位として認定し、さらにそれぞれの要約構成単位を抽出する際にこれらの関係を考慮した抽出順序に関する制約が設定できる。要約構成単位の重要度計算手段802は、これらの要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算する。要約構成単位の抽出順序に関する制約の設定手段803は、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出する際、それぞれの要約構成単位間の関係を考慮した抽出順序に関する制約も考慮して抽出を行う。要約結果出力手段804は、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する。
【0111】
次に、本発明の第8の実施の形態の動作について詳細に説明する。
【0112】
まず、入力テキストの各文に対して要約構成単位を認定し、さらにそれぞれの要約構成単位認定パタン805で認定される要約構成単位の間における接続関係や引用関係を認定し、要約構成単位認定パタン805を用いて、述部を含む節を最小とする単位を要約構成単位として認定し、さらにそれぞれの要約構成単位を抽出する際にこれらの関係を考慮した抽出順序に関する制約を設定し(要約構成単位の認定手段801)、次に、これらの要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算し(要約構成単位の重要度計算手段802)、さらに、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出する際、それぞれの要約構成単位間の関係を考慮した抽出順序に関する制約も考慮して抽出し(要約構成単位の抽出順序に関する制約の設定手段803)、最後に、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する(要約結果出力手段804)。
【0113】
次に、本発明の第8の実施の形態の効果について説明する。
【0114】
本発明の第8の実施の形態では、要約構成単位の抽出順序に関する制約の設定手段803によって、要約構成単位の間に認定された関係をそれぞれの要約構成単位を抽出する際に考慮するので、たとえば引用関係や接続関係などにおいて従文のみが抽出されることによって生じる元の文と意味の異なる要約文の生成が抑制され、高品質な要約文が生成される効果が得られる。
【0115】
次に、本発明の第9の実施の形態について図面を参照して詳細に説明する。
【0116】
図9は、本発明の第9の実施の形態の構成を示すブロック図である。
【0117】
図9を参照すると、本発明の第9の実施の形態は、要約構成単位の認定手段901と、要約構成単位の補完修正手段902と、要約構成単位の重要度計算手段903と、隣接する要約構成単位における表現の還元手段904と、要約結果出力手段905と、要約構成単位認定パタン906と、要約構成単位補完修正パタン907とから構成されている。要約構成単位認定パタン906、要約構成単位補完修正パタン907は、メモリ、ハードディスク等の記憶装置に格納されており、読み出されて利用されるが、以下、いちいち記述しない。
【0118】
これらの手段はそれぞれ概略つぎのように動作する。
【0119】
要約構成単位の認定手段901は、入力テキストの各文に対して要約構成単位認定パタン906を用いて、述部を含む節を最小とする単位を要約構成単位として認定する。要約構成単位の補完修正手段902は、要約構成単位補完修正パタン907を適用することにより、要約構成単位の情報のみでテキスト中におけるその重要度が適切に判断されるように、元の文で共有されていた情報を要約構成単位に補完する、もしくは、要約構成単位の表現が要約文中の独立した文として適切な表現となるように元文書における文の表現に基づいて修正する。
【0120】
要約構成単位の重要度計算手段903は、これらの情報の補完もしくは表現の修正が適切に行われた要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算する。
【0121】
隣接する要約構成単位における表現の還元手段904は、要約中において隣接する要約構成単位が元の文書の同一文中においても隣接する場合、隣接する要約構成単位間での補完や修正については補完修正前の表現を用いる。要約結果出力手段905は、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出し、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する。
【0122】
次に、本発明の第9の実施の形態の動作について詳細に説明する。
【0123】
まず、入力テキストの各文に対して要約構成単位認定パタン906を用いて、述部を含む節を最小とする単位を要約構成単位として認定し(要約構成単位の認定手段901)、次に、要約構成単位補完修正パタン907を適用することにより、要約構成単位の情報のみでテキスト中におけるその重要度が適切に判断されるように、元の文で共有されていた情報を要約構成単位に適切に補完し、もしくは、要約構成単位の表現が要約文中の独立した文として適切な表現となるように元文書における文の表現に基づいて適切に修正する(要約構成単位の補完修正手段902)。
【0124】
そして、これらの情報の補完もしくは表現の修正が適切に行われた要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算し(要約構成単位の重要度計算手段903)、さらに、要約中において隣接する要約構成単位が元の文書の同一文中においても隣接する場合、隣接する要約構成単位間での補完や修正については補完修正前の表現を用い、最後に、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出し(隣接する要約構成単位における表現の還元手段904)、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する(要約結果出力手段905)。
【0125】
次に、本発明の第9の実施の形態の効果について説明する。
【0126】
本発明の第9の実施の形態では、隣接する要約構成単位における表現の還元手段904によって、要約中において隣接する要約構成単位が元の文書の同一文中においても隣接する場合、隣接する要約構成単位間での補完や修正については補完修正前の表現を用いるので、補完や修正によって文間の連続性が失われることを緩和する効果が得られ、要約の可読性を改善することができる。
【0127】
次に、本発明の第10の実施の形態について図面を参照して詳細に説明する。
【0128】
図10は、本発明の第10の実施の形態の構成を示すブロック図である。
【0129】
図10を参照すると、本発明の第10の実施の形態は、要約文候補の生成手段1001と、要約構成単位の補完修正手段1002と、要約構成単位の重要度計算手段1003と、要約文候補の探索手段1004と、要約結果出力手段1005と、要約構成単位認定パタン1006と、要約構成単位補完修正パタン1007とから構成されている。要約構成単位認定パタン1006、要約構成単位補完修正パタン1007は、メモリ、ハードディスク等の記憶装置に格納されており、読み出されて利用されるが、以下、いちいち記述しない。
【0130】
これらの手段はそれぞれ概略つぎのように動作する。
【0131】
要約文候補の生成手段1001は、入力テキストの各文に対して要約構成単位認定パタン1006の逐次的な照合によって、可能なすべての述部を含む節を最小とする単位を要約構成単位として認定し、これから要約文候補を得る。要約構成単位の補完修正手段1002は、要約構成単位補完修正パタン1007を適用することにより、要約構成単位の情報のみでテキスト中におけるその重要度が適切に判断されるように、元の文で共有されていた情報を要約構成単位に補完する、もしくは、要約構成単位の表現が要約文中の独立した文として適切な表現となるように元文書における文の表現に基づいて修正する。
【0132】
要約構成単位の重要度計算手段1003は、これらの情報の補完もしくは表現の修正が適切に行われた要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算する。要約文候補の探索手段1004は、これらの要約文候補に対する重要度に基づいて、テキスト中の各文での要約文候補を探索し、入力テキストに対する要約として最尤の要約文候補の組み合わせを決定する際、要約構成単位を認定するためのコストと要約構成単位を補完修正するためのコストも考慮して抽出を行う。要約結果出力手段1005は、決定された最尤の要約文候補の組み合わせを、元のテキストにおける出現順に並べ、要約結果として出力する。
【0133】
次に、本発明の第10の実施の形態の動作について詳細に説明する。
【0134】
まず、入力テキストの各文に対して要約構成単位認定パタン1006の逐次的な照合によって、可能なすべての述部を含む節を最小とする単位を要約構成単位として認定し、これから要約文候補を得る(要約文候補の生成手段1001)。この際、要約文候補中の要約構成単位に対して、要約構成単位補完修正パタン1007を適用することにより、要約構成単位の情報のみでテキスト中におけるその重要度が適切に判断されるように、元の文で共有されていた情報を要約構成単位に補完する、もしくは、要約構成単位の表現が要約文中の独立した文として適切な表現となるように元文書における文の表現に基づいて修正する(要約構成単位の補完修正手段1002)。
【0135】
次に、これらの情報の補完もしくは表現の修正が適切に行われた要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算し(要約構成単位の重要度計算手段1003)、これらの要約文候補に対する重要度に基づいて、テキスト中の各文での要約文候補を探索し、入力テキストに対する要約として最尤の要約文候補の組み合わせを決定する際、要約構成単位を認定するためのコストと要約構成単位を補完修正するためのコストも考慮して抽出し(要約文候補の探索手段1004)、決定された最尤の要約文候補の組み合わせを、元のテキストにおける出現順に並べ、要約結果として出力する(要約結果出力手段1005)。
【0136】
次に、本発明の第10の実施の形態の効果について説明する。
【0137】
本発明の第10の実施の形態では、要約文候補の生成手段1001と要約文候補の探索手段1004とによって、可能なすべての述部を含む節を最小とする単位を要約構成単位として認定し、これから複数の要約文候補を作成するので、より柔軟な要約構成単位からの要約文の選択を実現することができる。またこのとき、最尤の要約文候補のからの探索の際、要約構成単位を認定するためのコストと要約構成単位を補完修正するためのコストも考慮するので、要約中における読みにくい表現や意味の分からない表現の発生を同時に抑制することができ、柔軟な要約構成単位に基づくより高品質な要約を生成する効果が得られる。
【0138】
次に、本発明の第1〜第3の実施の形態の実施例について図面を参照して詳細に説明する。
【0139】
図11は、要約構成単位認定パタン204、要約構成単位認定パタン605、要約構成単位認定パタン705、要約構成単位認定パタン906の例を示す説明図である。
【0140】
図14は、要約構成単位認定パタン304、要約構成単位認定パタン1006の例を示す説明図である。
【0141】
第1の実施の形態における要約構成単位認定用言語知識情報104の具体的な実施の一例が第2の実施の形態における要約構成単位認定パタン204であるため、ここでは、第2の実施の形態について説明する。
【0142】
まず、要約構成単位の認定手段201が、要約構成単位認定パタン204において、入力テキストの各文に対して要約構成単位を認定するための要約構成単位認定パタン204を用いて述部を含む節を最小とする単位を要約構成単位として認定する。このとき、テキスト中に「従来、点数で機械的に生徒を切り捨てる傾向があったが、ここ数年で生徒の面倒をみていこうという機運が出てきた。」という文が存在し、また要約構成単位認定パタン204が、図11中に示すようなものであったとする。各パタンは文もしくは要約構成単位に対してパタンを適用するかどうかの条件を記述した「照合条件」と、適用によって得られる要約構成単位の形態を記述した「要約構成単位」とから構成されている。
【0143】
照合条件における「S」は、パタンを適用する対象を現し、「P1」や「P2」は、「P1=」または「P2=」で定義された式に照合するSの部分を表す。「用言」は動詞、形容詞、形容動詞のいずれかに照合し、「*」は長さ0以上の任意の文字列に照合する。その結果、パタン1は、たとえば、接続詞「が」によって二つの単文が接続されているような文に照合し、それぞれの単文を要約構成単位として認定するように機能する。したがって、テキスト中の文は、図11中のパタン1の照合条件に適合し、その結果として、要約構成単位S1とS2とに相当する「従来、点数で機械的に生徒を切り捨てる傾向があった。」と「ここ数年で生徒の面倒をみていこうという機運が出てきた。」とがそれぞれ要約構成単位として得られる。
【0144】
次に、要約構成単位の重要度計算手段202では、これら2つの単位を含めたすべての要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算し、最後に、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出し、要約結果出力手段203が、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する。
【0145】
また、第3の実施の形態では、第2の実施の形態と同様の構成であるが、それぞれの要約構成単位を認定するためのコストが設定できる要約構成単位認定パタン304を用いる点が異なる。これについては、第10の実施の形態の実施例において詳細に説明する。
【0146】
次に、本発明の第4〜第7、第9の実施の形態の実施例について図面を参照して詳細に説明する。
【0147】
図12は、要約構成単位補完修正パタン606、要約構成単位補完修正パタン907の例を示す説明図である。
【0148】
第4の実施の形態における要約構成単位認定用言語知識情報405、および、要約構成単位補完修正用言語知識情報406、あるいは、第5の実施の形態における要約構成単位認定用言語知識情報505、および要約構成単位補完修正用言語知識情報506、の具体的な実施の一例が第6の実施の形態における要約構成単位認定パタン605、および要約構成単位補完修正パタン606であるため、ここでは、第6の実施の形態について説明する。
【0149】
まず、要約構成単位の認定手段601が、入力テキストの各文に対して要約構成単位認定パタン605を用いて、述部を含む節を最小とする単位を要約構成単位として認定する。このとき、テキスト中に「映画ファンは映画館には足を運ばなくなり、レンタルビデオで済ませるようになった。」という文が存在し、また要約構成単位認定パタン605が、図11中に示すようなものであったとする。
【0150】
すると、テキスト中の文は、図11中のパタン2の照合条件に適合し、その結果として、要約構成単位S1とS2に相当する「映画ファンは映画館には足を運ばなくなる。」と「レンタルビデオで済ませるようになった。」がそれぞれ要約構成単位として得られる。
【0151】
次に、要約構成単位の補完修正手段602が、要約構成単位補完修正パタン606を適用することにより、要約構成単位の情報のみでテキスト中におけるその重要度が適切に判断されるように、元の文で共有されていた情報を要約構成単位に補完する、もしくは、要約構成単位の表現が要約文中の独立した文として適切な表現となるように元文書における文の表現に基づいて修正する。
【0152】
このとき、要約構成単位補完修正パタン606が、図12中に示すようなものであったとする。各パタンは文もしくは要約構成単位に対してパタンを適用するかどうかの条件を記述した「照合条件」と、適用によって補完修正が行われた結果として得られる要約構成単位の形態を記述した「補完修正」とから構成されている。照合条件における「S」は、パタンを適用する対象である、要約構成単位の列で表現された文の単位を現し、「S1」、「Sk」、「Sn」は、「S1=」、「Sk=」、「Sn=」で定義された式に照合するS中の要約構成単位を表す。ここでS1は、図12のパタン2の照合条件に適合するので補完修正を適用する。ここでは、S2の時制が過去であるため、S1の補完修正の結果として「映画ファンは映画館には足を運ばなくなった。」を得る。また、S2はパタン1の照合条件に適合するので同様に補完修正を適用する。
【0153】
ここで、PはS1の主語「映画ファン」に照合しているので、S2の補完修正の結果として「映画ファンはレンタルビデオで済ませるようになった。」を得る。さらに、要約構成単位の重要度計算手段603が、これらの情報の補完もしくは表現の修正が適切に行われた要約構成単位に対して要約構成単位のテキスト中での位置、手がかり語、タイトル、単語の重要度、キーワードなどの情報を手がかりとして、テキスト中における各要約構成単位の重要度を計算し、最後に、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出し、要約結果出力手段604が、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する。
【0154】
また、第5の実施の形態では、第6の実施の形態とほぼ同様の構成であるが、要約構成単位の補完修正手段602が、要約構成単位の重要度計算手段603よりも前に実施される点が異なる。このため、第4、第6の実施の形態においては補完修正の結果が重要度計算に影響を与えるが、第5の実施の形態では影響を与えない点が異なる。
【0155】
また、第7の実施の形態では、第6の実施の形態と同様の構成であるが、それぞれの要約構成単位を補完修正するためのコストが設定できる要約構成単位補完修正パタン706を用いる点が異なる。これについては、第10の実施の形態の実施例において詳細に説明する。
【0156】
また、第9の実施の形態では、第6の実施の形態とほぼ同様の構成であるが、隣接する要約構成単位における表現の還元手段904が加わっている点が異なっている。例文「映画ファンは映画館には足を運ばなくなり、レンタルビデオで済ませるようになった。」に対して、第6の実施の形態と第9の実施の形態では共に、「映画ファンは映画館には足を運ばなくなった。」、および、「映画ファンはレンタルビデオで済ませるようになった。」の二つの要約構成単位を得るが、両者とも要約中に抽出される場合、第9の実施の形態では、要約中において隣接する要約構成単位が元の文書の同一文中においても隣接する場合、隣接する要約構成単位間での補完や修正については元の表現を用いるため、「映画ファンは映画館には足を運ばなくなり、レンタルビデオで済ませるようになった。」が要約に出力される点が異なる。
【0157】
次に、本発明の第8の実施の形態の実施例について図面を参照して詳細に説明する。
【0158】
図13は、要約構成単位認定パタン805の例を示す説明図である。
【0159】
要約構成単位の認定手段801では、まず、入力テキストの各文に対して要約構成単位を認定し、さらに、それぞれ認定される要約構成単位の間における接続関係や引用関係を認定し、要約構成単位認定パタン805を用いて、述部を含む節を最小とする単位を要約構成単位として認定し、さらにそれぞれの要約構成単位を抽出する際にこれらの関係を考慮した抽出順序に関する制約を設定する。
【0160】
たとえば、テキスト中に「寿命に関わる遺伝子が解明されれば、不老長寿の薬は実現すると思う。」という文が存在し、また、要約構成単位認定パタン805が、図13に示すようなものであったとする。パタンは、「照合条件」、「要約構成単位」の他に、「抽出順序制約」が加わっている。例文に対してはパタン3が照合し、その結果として要約構成単位S1とS2に相当する「寿命に関わる遺伝子が解明され。」と「不老長寿の薬は実現すると思う。」がそれぞれ要約構成単位として得られる。パタン3における抽出順序制約における表現「S2>S1」は、要約構成単位として得られるS1とS2を要約に抽出する際、S1を抽出する場合は必ずS2を伴って抽出するという制約を表現している。
【0161】
要約構成単位の重要度計算手段802が、テキスト中における各要約構成単位の重要度を計算し、要約構成単位の抽出順序に関する制約の設定手段803が、各要約構成単位に対する重要度に基づいて、最も重要度の高い要約構成単位から順に、利用者が要求する要約長に達するまで順次抽出する際、それぞれの要約構成単位間の関係を考慮した抽出順序に関する制約も考慮して抽出し、最後に、要約結果出力手段804が、抽出された要約構成単位を元のテキストにおける出現順に並べ、要約結果として出力する。
【0162】
次に、本発明の第10の実施の形態の実施例について図面を参照して詳細に説明する。
【0163】
図15は、要約構成単位補完修正パタン706、要約構成単位補完修正パタン1007の例を示す説明図である。
【0164】
図16は、要約文候補の例を示す説明図である。
【0165】
たとえば、テキスト中に「消費税率引き上げについては、社会党などの理解を得るのは困難な状況であり、首相は「連立という状況の中でのかじ取りであるため、与党合意を得る交渉をしながらギリギリの努力をするしかない。」と釈明した。」という文が存在する。要約文候補の生成手段1001において、まず、要約構成単位認定パタン1006の逐次的な照合で可能なものすべての組み合わせを実施することで、すべての要約構成単位を作成し、これから要約文候補を得る。
【0166】
図14に示す要約構成単位認定パタン1006のうち、まず照合可能なのは、パタン2とパタン5である。パタン2によって得られる要約構成単位S1、S2から、それぞれ、図16に示す要約文の候補1、および、候補2を得る。図中の候補1は、要約構成単位の補完修正手段1002において、表現補完修正パタンのパタン2が適用されたものを示している。
【0167】
次に、パタン5の適用によって得られる要約文候補を作成する。パタン5には、抽出順序制約で、要約構成単位S1またはS2を単独で抽出できないため、これらは要約候補とならないがS2に対しては、さらにパタン4の適用が可能である。パタン5のS1は、S2にパタン4を適用して得られる2つのいずれかを伴えば、抽出順序制約を満たすので要約文候補となり得る。
【0168】
パタン5のS1とパタン4のS1の組み合わせによって図16に示す候補3を、パタン5のS1とパタン4のS2の組み合わせによって候補4をそれぞれ得る。残された独立な要約文候補は、候補3と候補4にパタン2を適用して得られる要約文候補であり、それぞれの候補にパタン2を適用して得られるS2から、候補5および候補6を得る。各要約文候補へ適用された単位認定パタンのコストの合計値、および各要約文候補へ適用された補完修正パタンのコストの合計値は、要約構成単位の重要度計算手段1003において各要約文候補の重要度と共に、要約文候補の探索手段1004における候補選択に用いる。
【0169】
要約文候補の探索手段1004は、文ごとに入力文を出力するか、何も出力しないか、もしくは、いずれかの要約文候補を要約中に抽出するかのうちから一つを選択して組み合わせ、利用者の要求する要約長にあった要約の候補を作成する。要約結果出力手段1005は、このようにして得られる要約の候補のうち、要約スコア(要約スコア=重要度の値の合計−α×単位認定コストの合計―β×補完修正コストの合計)の値が最大のものを要約結果として出力する。ここで、α、βはパラメータ(正の実数)をあらわす。
【0170】
αを大きくすると、文への単位認定パタンの適用が抑制されるので、元のテキスト中の文をそのまま要約文として用いる傾向が強くなり、βを大きくすると、コストの大きい補完修正パタンが適用された要約文候補の要約中での出現が抑制されるので、信頼度の低い補完修正に大きなコストを与えることによって、信頼度の低い補完修正を行った要約文候補が出現しない傾向が強くなる。ここで示した要約スコアの計算式は一例であり、これ以外のものを用いても良い。
【0171】
次に、本発明の第11の実施の形態について図面を参照して説明する。
【0172】
本発明の第11の実施の形態は、図1〜図10の各手段を各手順とする方法である。
【0173】
次に、本発明の第12の実施の形態について図面を参照して説明する。
【0174】
本発明の第12の実施の形態は、本発明の第11の実施の形態の各手順をコンピュータに実行させるプログラムである。
【0175】
【発明の効果】
第1の効果は、適切な要約構成単位の利用による要約品質向上と要約生成処理の簡易化による処理の高速化を同時に実現することができることである。
【0176】
その理由は、入力テキストの各文に対して述部を含む節を最小とする単位を要約構成単位として認定し、これを単位として要約を生成するので、要約生成の自由度が高く、従来の文を要約構成単位とする要約方法に比べて短い要約の生成における限界や品質の低下が生じにくいためであり、また、文節を要約構成単位とする要約方法と比べて荒い構文構造で要約構成単位を認定できるために、より簡易な処理によって要約を生成することができるためである。
【0177】
第2の効果は、要約中における読みにくい表現や意味の分からない表現の発生を抑制できることである。
【0178】
その理由は、文中から抽出された要約構成単位が要約文中の独立した文として不適切な表現であっても、元文書における文の表現に基づいて適切に補完もしくは修正するためであり、また、引用関係や接続関係などの関係にある抽出の順序によって誤解や読みにくさを生じる要約構成単位の抽出において、抽出の順序に関する抑制を設定するためであり、要約において不要な分割に基づく補完や修正箇所を元の表現に還元することで、文間の連続性が失われることを防ぐためである。
【0179】
第3の効果は、より柔軟な要約構成単位に基づくより高品質な要約文が生成されることである。
【0180】
その理由は、入力テキストの各文に対して要約構成単位認定パタンの逐次的な照合を、可能なものすべての組み合わせについて実施することで、各文に対して複数の要約文候補を作成し、その中から最尤の候補を選択するためであり、また同時に信頼度の低い単位認定パタンの適用および補完修正の適用に大きなコストを与えることにより、コストの高い単位認定パタンの適用や補完修正が抑制され、信頼度の低い要約公正単位や補完修正の適用による要約文の抑制が要約品質の向上をもたらすためである。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の構成を示すブロック図である。
【図2】本発明の第2の実施の形態の構成を示すブロック図である。
【図3】本発明の第3の実施の形態の構成を示すブロック図である。
【図4】本発明の第4の実施の形態の構成を示すブロック図である。
【図5】本発明の第5の実施の形態の構成を示すブロック図である。
【図6】本発明の第6の実施の形態の構成を示すブロック図である。
【図7】本発明の第7の実施の形態の構成を示すブロック図である。
【図8】本発明の第8の実施の形態の構成を示すブロック図である。
【図9】本発明の第9の実施の形態の構成を示すブロック図である。
【図10】本発明の第10の実施の形態の構成を示すブロック図である。
【図11】本発明の第2、第6、第7、第9の実施の形態の要約構成単位認定パタンの例を示す説明図である。
【図12】本発明の第6、第9の実施の形態の要約構成単位補完修正パタンの例を示す説明図である。
【図13】本発明の第8の実施の形態の要約構成単位認定パタンの例を示す説明図である。
【図14】本発明の第3、第10の実施の形態の要約構成単位認定パタンの例を示す説明図である。
【図15】本発明の第7、第10の実施の形態の要約構成単位補完修正パタンの例を示す説明図である。
【図16】本発明の第10の実施の形態において得られる要約文候補の一例を示す説明図である。
【符号の説明】
101  要約構成単位の認定手段
102  要約構成単位の重要度計算手段
103  要約結果出力手段
104  要約構成単位認定用言語知識情報
201  要約構成単位の認定手段
202  要約構成単位の重要度計算手段
203  要約結果出力手段
204  要約構成単位認定パタン
301  要約構成単位の認定手段
302  要約構成単位の重要度計算手段
303  要約結果出力手段
304  要約構成単位認定パタン
401  要約構成単位の認定手段
402  要約構成単位の補完修正手段
403  要約構成単位の重要度計算手段
404  要約結果出力手段
405  要約構成単位認定用言語知識情報
406  要約構成単位補完修正用言語知識情報
501  要約構成単位の認定手段
502  要約構成単位の重要度計算手段
503  要約構成単位の補完修正手段
504  要約結果出力手段
505  要約構成単位認定用言語知識情報
506  要約構成単位補完修正用言語知識情報
601  要約構成単位の認定手段
602  要約構成単位の補完修正手段
603  要約構成単位の重要度計算手段
604  要約結果出力手段
605  要約構成単位認定パタン
606  要約構成単位補完修正パタン
701  要約構成単位の認定手段
702  要約構成単位の補完修正手段
703  要約構成単位の重要度計算手段
704  要約結果出力手段
705  要約構成単位認定パタン
706  要約構成単位補完修正パタン
801  要約構成単位の認定手段
802  要約構成単位の重要度計算手段
803  要約構成単位の抽出順序に関する制約の設定手段
804  要約結果出力手段
805  要約構成単位認定パタン
901  要約構成単位の認定手段
902  要約構成単位の補完修正手段
903  要約構成単位の重要度計算手段
904  隣接する要約構成単位における表現の還元手段
905  要約結果出力手段
906  要約構成単位認定パタン
907  要約構成単位補完修正パタン
1001  要約文候補の生成手段
1002  要約構成単位の補完修正手段
1003  要約構成単位の重要度計算手段
1004  要約文候補の探索手段
1005  要約結果出力手段
1006  要約構成単位認定パタン
1007  要約構成単位補完修正パタン

Claims (27)

  1. 文の述部を含む節を要約構成単位とする情報を含む要約構成単位認定用言語知識情報を記憶装置から読み出し、読み出した要約構成単位認定用言語知識情報を用いて要約構成単位を認定する要約構成単位の認定手段と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手段と、重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手段とを有することを特徴とするテキスト要約システム。
  2. 照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手段と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手段と、重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手段とを有することを特徴とするテキスト要約システム。
  3. 照合条件、文の述部を含む節を単位とする要約構成単位、適用コストを含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手段と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手段と、適用コストを考慮し重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手段とを有することを特徴とするテキスト要約システム。
  4. 照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、前記要約構成単位の認定手段により認定された要約構成単位に対し文の表現に基づいて補完・修正を実施し、補完・修正した要約構成単位を前記要約構成単位の重要度計算手段に出力する要約構成単位の補完修正手段を有することを特徴とする請求項1、請求項2、または、請求項3記載のテキスト要約システム。
  5. 照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、前記要約構成単位の重要度計算手段により重要度が評価された要約構成単位に対し文の表現に基づいて補完・修正を実施し、補完・修正した要約構成単位を前記要約結果出力手段に出力する要約構成単位の補完修正手段を有することを特徴とする請求項1、請求項2、または、請求項3記載のテキスト要約システム。
  6. 照合条件、文の述部を含む節を単位とする要約構成単位、抽出順序制約を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位間の接続関係、または、引用関係を考慮し要約構成単位を認定し、要約構成単位の認定手段と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手段と、重要度の評価された要約構成単位に対し抽出順序制約を用いて抽出順序を考慮する抽出順序に関する制約の設定手段と、重要度が高く抽出順序の考慮された要約構成単位を抽出して要約を作成する要約結果出力手段とを有することを特徴とするテキスト要約システム。
  7. 照合条件、文の述部を含む節を単位とする要約構成単位、適用コスト、抽出順序制約を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位間の接続関係、または、引用関係を考慮し要約構成単位を認定し、要約構成単位の認定手段と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手段と、重要度の評価された要約構成単位に対し抽出順序制約を用いて抽出順序を考慮する抽出順序に関する制約の設定手段と、適用コストを考慮し重要度が高く抽出順序の考慮された要約構成単位を抽出して要約を作成する要約結果出力手段とを有することを特徴とするテキスト要約システム。
  8. 照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手段と、照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、要約構成単位に対し文の表現に基づいて補完・修正を実施し出力する要約構成単位の補完修正手段と、前記要約構成単位の補完修正手段からの要約構成単位の重要度を評価する要約構成単位の重要度計算手段と、要約中において隣接する要約構成単位が元の文書の同一文中においても隣接する場合、要約構成単位に対し隣接する要約構成単位間での補完や修正については元の表現を適用する表現の還元手段と、前記還元手段からの要約構成単位に対し重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手段とを有することを特徴とするテキスト要約システム。
  9. 照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて述部を含む節を最小とする単位を要約構成単位として認定し、これから要約文候補を得る要約文候補の生成手段と、照合条件、補完修正情報、適用コストを含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、要約文候補に対し文の表現に基づいて補完・修正を実施し出力する要約構成単位の補完修正手段と、前記要約構成単位の補完修正手段からの要約文候補の重要度を評価する要約構成単位の重要度計算手段と、要約文候補に対する重要度に基づいて、各文での要約文候補を探索し、要約として最尤の要約文候補の組み合わせを決定する際、要約構成単位を認定するためのコストと要約構成単位を補完修正するためのコストも考慮して抽出を行う要約文候補の探索手段と、決定された最尤の要約文候補の組み合わせを、出現順に並べ、要約結果として出力する要約結果出力手段とを有することを特徴とするテキスト要約システム。
  10. 文の述部を含む節を要約構成単位とする情報を含む要約構成単位認定用言語知識情報を記憶装置から読み出し、読み出した要約構成単位認定用言語知識情報を用いて要約構成単位を認定する要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手順とを有することを特徴とするテキスト要約方法。
  11. 照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手順とを有することを特徴とするテキスト要約方法。
  12. 照合条件、文の述部を含む節を単位とする要約構成単位、適用コストを含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、適用コストを考慮し重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手順とを有することを特徴とするテキスト要約方法。
  13. 照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、前記要約構成単位の認定手順により認定された要約構成単位に対し文の表現に基づいて補完・修正を実施し、補完・修正した要約構成単位を前記要約構成単位の重要度計算手順に出力する要約構成単位の補完修正手順を有することを特徴とする請求項10、請求項11、または、請求項12記載のテキスト要約方法。
  14. 照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、前記要約構成単位の重要度計算手順により重要度が評価された要約構成単位に対し文の表現に基づいて補完・修正を実施し、補完・修正した要約構成単位を前記要約結果出力手順に出力する要約構成単位の補完修正手順を有することを特徴とする請求項10、請求項11、または、請求項12記載のテキスト要約方法。
  15. 照合条件、文の述部を含む節を単位とする要約構成単位、抽出順序制約を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位間の接続関係、または、引用関係を考慮し要約構成単位を認定し、要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、重要度の評価された要約構成単位に対し抽出順序制約を用いて抽出順序を考慮する抽出順序に関する制約の設定手順と、重要度が高く抽出順序の考慮された要約構成単位を抽出して要約を作成する要約結果出力手順とを有することを特徴とするテキスト要約方法。
  16. 照合条件、文の述部を含む節を単位とする要約構成単位、適用コスト、抽出順序制約を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位間の接続関係、または、引用関係を考慮し要約構成単位を認定し、要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、重要度の評価された要約構成単位に対し抽出順序制約を用いて抽出順序を考慮する抽出順序に関する制約の設定手順と、適用コストを考慮し重要度が高く抽出順序の考慮された要約構成単位を抽出して要約を作成する要約結果出力手順とを有することを特徴とするテキスト要約方法。
  17. 照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手順と、照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、要約構成単位に対し文の表現に基づいて補完・修正を実施し出力する要約構成単位の補完修正手順と、前記要約構成単位の補完修正手順からの要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、要約中において隣接する要約構成単位が元の文書の同一文中においても隣接する場合、要約構成単位に対し隣接する要約構成単位間での補完や修正については元の表現を適用する表現の還元手順と、前記還元手順からの要約構成単位に対し重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手順とを有することを特徴とするテキスト要約方法。
  18. 照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて述部を含む節を最小とする単位を要約構成単位として認定し、これから要約文候補を得る要約文候補の生成手順と、照合条件、補完修正情報、適用コストを含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、要約文候補に対し文の表現に基づいて補完・修正を実施し出力する要約構成単位の補完修正手順と、前記要約構成単位の補完修正手順からの要約文候補の重要度を評価する要約構成単位の重要度計算手順と、要約文候補に対する重要度に基づいて、各文での要約文候補を探索し、要約として最尤の要約文候補の組み合わせを決定する際、要約構成単位を認定するためのコストと要約構成単位を補完修正するためのコストも考慮して抽出を行う要約文候補の探索手順と、決定された最尤の要約文候補の組み合わせを、出現順に並べ、要約結果として出力する要約結果出力手順とを有することを特徴とするテキスト要約方法。
  19. 文の述部を含む節を要約構成単位とする情報を含む要約構成単位認定用言語知識情報を記憶装置から読み出し、読み出した要約構成単位認定用言語知識情報を用いて要約構成単位を認定する要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手順とをコンピュータに実行させることを特徴とするテキスト要約プログラム。
  20. 照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手順とをコンピュータに実行させることを特徴とするテキスト要約プログラム。
  21. 照合条件、文の述部を含む節を単位とする要約構成単位、適用コストを含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、適用コストを考慮し重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手順とをコンピュータに実行させることを特徴とするテキスト要約プログラム。
  22. 照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、前記要約構成単位の認定手順により認定された要約構成単位に対し文の表現に基づいて補完・修正を実施し、補完・修正した要約構成単位を前記要約構成単位の重要度計算手順に出力する要約構成単位の補完修正手順をコンピュータに実行させることを特徴とする請求項19、請求項20、または、請求項21記載のテキスト要約プログラム。
  23. 照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、前記要約構成単位の重要度計算手順により重要度が評価された要約構成単位に対し文の表現に基づいて補完・修正を実施し、補完・修正した要約構成単位を前記要約結果出力手順に出力する要約構成単位の補完修正手順をコンピュータに実行させることを特徴とする請求項19、請求項20、または、請求項21記載のテキスト要約プログラム。
  24. 照合条件、文の述部を含む節を単位とする要約構成単位、抽出順序制約を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位間の接続関係、または、引用関係を考慮し要約構成単位を認定し、要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、重要度の評価された要約構成単位に対し抽出順序制約を用いて抽出順序を考慮する抽出順序に関する制約の設定手順と、重要度が高く抽出順序の考慮された要約構成単位を抽出して要約を作成する要約結果出力手順とをコンピュータに実行させることを特徴とするテキスト要約プログラム。
  25. 照合条件、文の述部を含む節を単位とする要約構成単位、適用コスト、抽出順序制約を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位間の接続関係、または、引用関係を考慮し要約構成単位を認定し、要約構成単位の認定手順と、認定した要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、重要度の評価された要約構成単位に対し抽出順序制約を用いて抽出順序を考慮する抽出順序に関する制約の設定手順と、適用コストを考慮し重要度が高く抽出順序の考慮された要約構成単位を抽出して要約を作成する要約結果出力手順とをコンピュータに実行させることを特徴とするテキスト要約プログラム。
  26. 照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて要約構成単位を認定する要約構成単位の認定手順と、照合条件、補完修正情報を含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、要約構成単位に対し文の表現に基づいて補完・修正を実施し出力する要約構成単位の補完修正手順と、前記要約構成単位の補完修正手順からの要約構成単位の重要度を評価する要約構成単位の重要度計算手順と、要約中において隣接する要約構成単位が元の文書の同一文中においても隣接する場合、要約構成単位に対し隣接する要約構成単位間での補完や修正については元の表現を適用する表現の還元手順と、前記還元手順からの要約構成単位に対し重要度の高い要約構成単位を抽出して要約を作成する要約結果出力手順とをコンピュータに実行させることを特徴とするテキスト要約プログラム。
  27. 照合条件、文の述部を含む節を単位とする要約構成単位を含む要約構成単位認定パタンを記憶装置から読み出し、読み出した要約構成単位認定パタンを用いて述部を含む節を最小とする単位を要約構成単位として認定し、これから要約文候補を得る要約文候補の生成手順と、照合条件、補完修正情報、適用コストを含む要約構成単位補完修正パタンを前記記憶装置から読み出し、読み出した要約構成単位補完修正パタンを用いて、要約文候補に対し文の表現に基づいて補完・修正を実施し出力する要約構成単位の補完修正手順と、前記要約構成単位の補完修正手順からの要約文候補の重要度を評価する要約構成単位の重要度計算手順と、要約文候補に対する重要度に基づいて、各文での要約文候補を探索し、要約として最尤の要約文候補の組み合わせを決定する際、要約構成単位を認定するためのコストと要約構成単位を補完修正するためのコストも考慮して抽出を行う要約文候補の探索手順と、決定された最尤の要約文候補の組み合わせを、出現順に並べ、要約結果として出力する要約結果出力手順とをコンピュータに実行させることを特徴とするテキスト要約プログラム。
JP2002281212A 2002-09-26 2002-09-26 テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム Pending JP2004118545A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002281212A JP2004118545A (ja) 2002-09-26 2002-09-26 テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002281212A JP2004118545A (ja) 2002-09-26 2002-09-26 テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2009069851A Division JP2009146446A (ja) 2009-03-23 2009-03-23 テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム
JP2009069852A Division JP2009146447A (ja) 2009-03-23 2009-03-23 テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム

Publications (1)

Publication Number Publication Date
JP2004118545A true JP2004118545A (ja) 2004-04-15

Family

ID=32275717

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002281212A Pending JP2004118545A (ja) 2002-09-26 2002-09-26 テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム

Country Status (1)

Country Link
JP (1) JP2004118545A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100785927B1 (ko) * 2006-06-02 2007-12-17 삼성전자주식회사 데이터 요약 생성 방법 및 장치
JP2020067987A (ja) * 2018-10-26 2020-04-30 楽天株式会社 要約作成装置、要約作成方法、及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0713967A (ja) * 1992-09-25 1995-01-17 Maruzen Kk 抄録文作成装置
JPH08212228A (ja) * 1995-02-02 1996-08-20 Sanyo Electric Co Ltd 要約文作成装置および要約音声作成装置
JPH08255172A (ja) * 1995-03-16 1996-10-01 Toshiba Corp 文書検索システム
JPH10207891A (ja) * 1997-01-17 1998-08-07 Fujitsu Ltd 文書要約装置およびその方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0713967A (ja) * 1992-09-25 1995-01-17 Maruzen Kk 抄録文作成装置
JPH08212228A (ja) * 1995-02-02 1996-08-20 Sanyo Electric Co Ltd 要約文作成装置および要約音声作成装置
JPH08255172A (ja) * 1995-03-16 1996-10-01 Toshiba Corp 文書検索システム
JPH10207891A (ja) * 1997-01-17 1998-08-07 Fujitsu Ltd 文書要約装置およびその方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100785927B1 (ko) * 2006-06-02 2007-12-17 삼성전자주식회사 데이터 요약 생성 방법 및 장치
US7747429B2 (en) 2006-06-02 2010-06-29 Samsung Electronics Co., Ltd. Data summarization method and apparatus
JP2020067987A (ja) * 2018-10-26 2020-04-30 楽天株式会社 要約作成装置、要約作成方法、及びプログラム
US11061950B2 (en) 2018-10-26 2021-07-13 Rakuten, Inc. Summary generating device, summary generating method, and information storage medium

Similar Documents

Publication Publication Date Title
KR102268875B1 (ko) 전자 장치에 텍스트를 입력하는 시스템 및 방법
JP5113750B2 (ja) 定義の抽出
CA2614416C (en) Processing collocation mistakes in documents
JP4173774B2 (ja) 重み付き編集距離に基づく例文の自動検索用システムおよび方法
JP3695191B2 (ja) 翻訳支援装置及びその方法並びにコンピュータ可読記録媒体
US7747429B2 (en) Data summarization method and apparatus
US20120239378A1 (en) Methods and Systems for Alignment of Parallel Text Corpora
RU2639655C1 (ru) Система для создания документов на основе анализа текста на естественном языке
Sauper et al. Incorporating content structure into text analysis applications
WO2007097208A1 (ja) 言語処理装置、言語処理方法および言語処理用プログラム
Sagae et al. HPSG parsing with shallow dependency constraints
Toutanova et al. The leaf path projection view of parse trees: Exploring string kernels for HPSG parse selection
Popowich et al. Machine translation of closed captions
Qasmi et al. SimplifyUR: unsupervised lexical text simplification for Urdu
US20050267735A1 (en) Critiquing clitic pronoun ordering in french
Huang et al. Using first-order logic to compress sentences
JP2004118545A (ja) テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム
JP2009146447A (ja) テキスト要約システム、テキスト要約方法、および、テキスト要約プログラム
JP5623380B2 (ja) 誤り文修正装置、誤り文修正方法およびプログラム
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Björkelund et al. How to train dependency parsers with inexact search for joint sentence boundary detection and parsing of entire documents
JP2006004366A (ja) 機械翻訳システム及びそのためのコンピュータプログラム
JP2008077512A (ja) 文書解析装置、および文書解析方法、並びにコンピュータ・プログラム
JP2004086307A (ja) 情報検索装置、情報登録装置、情報検索方法、及びコンピュータ読み取り可能なプログラム
JP5366849B2 (ja) 機能表現補完装置、方法及びプログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050308

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050822

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070115

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080606

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081028

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081217

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090120

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090323

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090401

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20090424

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20090508

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20110705