JPH11282881A - 文書要約装置および記録媒体 - Google Patents

文書要約装置および記録媒体

Info

Publication number
JPH11282881A
JPH11282881A JP10357296A JP35729698A JPH11282881A JP H11282881 A JPH11282881 A JP H11282881A JP 10357296 A JP10357296 A JP 10357296A JP 35729698 A JP35729698 A JP 35729698A JP H11282881 A JPH11282881 A JP H11282881A
Authority
JP
Japan
Prior art keywords
relation
sentence
document
binary
important
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10357296A
Other languages
English (en)
Other versions
JP3817943B2 (ja
Inventor
Yoshihiro Ueda
良寛 上田
Yasuhiro Ishitobi
康浩 石飛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP35729698A priority Critical patent/JP3817943B2/ja
Publication of JPH11282881A publication Critical patent/JPH11282881A/ja
Application granted granted Critical
Publication of JP3817943B2 publication Critical patent/JP3817943B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 文書の的確な要約を生成する。 【解決手段】 文書入力手段1からは、処理の対象とな
る文書が入力される。重要単語抽出手段2は、文書入力
手段1から入力された文書から、出現頻度などを参照し
て重要な単語を抽出する。関係表生成手段3は、重要単
語抽出手段2によって抽出された重要な単語を含む文の
構造を解析し、その文に含まれている単語同士の2項関
係を抽出して関係表を生成する。選択関係表生成手段4
は、関係表生成手段3によって生成された関係表から、
重要な単語を含む2項関係を所定の規則に従って抽出
し、選択関係表を生成する。補完関係付加手段5は、選
択関係表に含まれている2項関係を補完する新たな2項
関係を関係表から取得し、選択関係表に付加する。文合
成手段6は、補完関係付加手段5によって新たな2項関
係が付加された選択関係表に含まれている2項関係から
入力された文書の要約である文を合成して出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文書要約装置および
記録媒体に関し、特に、入力された文書の要約を作成し
て出力する文書要約装置およびそのような処理をコンピ
ュータに実行させるプログラムを記録した記録媒体に関
する。
【0002】
【従来の技術】文書検索を行った場合、検索結果の中か
ら適合文書を選択する必要がある。そのためには、検索
結果に含まれている各文書の内容を把握しなければなら
ない。ところが、検索結果として多量の文書が抽出され
ると、それぞれの文書の記載に目を通し、各文書の内容
を理解することは容易なことではない。
【0003】文書内容を短時間に読者に把握させる方法
としては大別して、(1)読む量を減らすものと、
(2)速読を支援するものの2種類がある。前者の文書
を短縮する方法としては以下のような方法を挙げること
ができる。 (A)キーワード列挙 (B)重要文ピックアップ (C)文短縮 先ず、「キーワード列挙」による方法は、頻出単語な
ど、その文書で重要な単語を列挙することにより、その
文書の内容を大まかに理解させようとするものである。
このような方法としては、例えば、「Cutting, et al.
, "Scatter/Gather: A Cluster-based Approach to Br
owsing Large Document Collections" SIGIR-92, 199
2」などがある。この方法では、文書を、頻出キーワー
ドの集合と、記事のタイトルの一部分を集めたものとし
て表現する。
【0004】このような方法によれば、表示された頻出
キーワードから大まかな内容を推測することが可能とな
る。次に、「重要文ピックアップ」による方法では、以
下のように、頻出単語や文のパターンにより重要文を判
断し、それらをピックアップしてつなげることにより要
約を生成する。例えば、特開平02−093866号公
報には、予め登録してある意味的に重要なキーワードを
含む文をピックアップする方法が開示されている。ま
た、特開平06−348696号公報には、文書中の各
単語をスコアリングし、スコア合計の高い文を一定数ピ
ックアップする方法が開示されている。このような方法
によれば、重要文が列挙された要約が出力されるので、
キーワードのみを表示した場合に比較して、更に具体的
な内容を得ることができる。
【0005】最後の「文短縮」による方法では、以下の
ような技術が提案されている。即ち、特開平5−101
120号公報には、省略するものとそうでないものの係
り受けのタイプを決めておき、省略すると定められた文
節を削除することにより文を短縮する文書抄録生成装置
が開示されている。例えば、「連用修飾語、が、を、
に、から」は残し、「副詞、連体修飾語、の」は削除す
る。
【0006】また、特開平6−035961号公報に
は、修飾語を削除して文を短くする文書要約装置が開示
されている。更に、特開平8−212228号公報に
は、重要度の高い要素の組み合わせによって要約文を作
る要約文作成装置が開示されている。この要約文作成装
置では、形態素解析により得られた品詞の情報を用い
て、次のように重要度を定める。即ち、名詞、動詞の重
要度は高く、副詞の重要度は低くする。また、構文解析
技術を用い、主格、目的格、述語の重要度は高く、その
他の格は低くする。さらに、主文の重要度は高く、従文
の重要度は低くする。そして、重要度が低いと判断され
た語句を削除することにより、要約文を作成する。
【0007】更にまた、特開平6−259423号公報
には、重要パラグラフの選択を行った後、その中から不
要部分を削除する要約文自動作成法式が開示されてい
る。この要約文自動作成法式では、不要部分をパターン
マッチングで選択する。そして、括弧内の語句、「すな
わち」などの言い換え語以降の文、および、「例えば」
などの実例を引く語以降の文をそれぞれ削除する。
【0008】このような方法によれば、重要度が低い部
分を削除した文書が表示されることになるので、文書の
概要を迅速に理解することが可能となる。次に、「速
読」を支援する方法としては、以下のような技術が開示
されている。
【0009】即ち、特開平05−158401号公報に
開示されている文書速読支援表示方式では、重要部分と
それ以外の部分を分け、重要部分以外を縮小表示または
縮小印刷する。このような方法によれば、重要部分(漢
字で書かれた部分、名詞・動詞部分、および、検索キー
ワード部分)を辿って読むことにより、通常の表示方式
に比較して、迅速に意味を理解することが可能となる。
【0010】
【発明が解決しようとする課題】しかしながら、キーワ
ード列挙による方法では、表示された頻出キーワード同
士の関係は示されないため、正確な内容を理解すること
が困難であるという問題点があった。
【0011】また、重要文ピックアップによる方法で
は、出現頻度の高い語を多く含む文がそのまま抽出され
るため、生成される抄録が長文になる傾向がある。その
ため、読むのに時間がかかる場合があるという問題点が
あった。
【0012】更に文短縮による方法では、いずれの方法
も係り受けの種類のみで削除すべきか否かの判断を行っ
ているため、重要な部分を過剰削除する可能性があると
いう問題点があった。即ち、その文の中で重要な情報を
表す単語であるか否かは、単に係り受け関係のみでは判
断できない場合が多々あるため、場合によっては重要な
情報が表示されない場合があるという問題点があった。
【0013】更にまた、速読を支援する方法では、文書
全体が表示されるため、例えば、複数の文書の中から特
定の文書を選択する用途に使用することが困難であると
いう問題点があった。
【0014】本発明はこのような点に鑑みてなされたも
のであり、必要な情報を削除することなく、文書を的確
に要約することが可能な文書要約装置を提供することで
ある。
【0015】また、本発明の他の目的は、複数の文書の
中から所望の文書を特定するために最適な文書要約装置
を提供することである。
【0016】
【課題を解決するための手段】本発明では上記課題を解
決するために、入力された文書の要約を作成して出力す
る文書要約装置において、処理の対象となる文書が入力
される文書入力手段と、前記文書入力手段から入力され
た文書から、重要な単語を抽出する重要単語抽出手段
と、前記重要単語抽出手段によって抽出された重要な単
語を含む文の構造を解析し、その文に含まれている単語
同士の2項関係を解析して関係表を生成する関係表生成
手段と、前記関係表生成手段によって生成された関係表
から、重要な単語を含む2項関係を所定の規則に従って
選択する関係選択手段と、前記関係選択手段によって選
択された2項関係から文を合成する文合成手段と、を有
することを特徴とする文書要約装置が提供される。
【0017】ここで、文書入力手段からは、処理の対象
となる文書が入力される。すると、重要単語抽出手段に
よって、文書入力手段から入力された文書から、重要な
単語抽出される。次に、関係表生成手段によって、重要
単語抽出手段により抽出された重要な単語を含む文の構
造が解析され、その文に含まれている単語同士の2項関
係が解析され、関係表が生成される。すると、関係選択
手段によって、関係表生成手段で生成された関係表か
ら、重要な単語を含む2項関係を所定の規則に従って選
択される。そして、文合成手段によって、関係選択手段
で選択された2項関係から文が合成される。
【0018】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。図1は本発明の文書要約装置の原
理を説明する原理図である。
【0019】この図において、文書入力手段1からは、
処理の対象となる文書が入力される。重要単語抽出手段
2は、文書入力手段1から入力された文書から、出現頻
度などを参照して重要な単語を抽出する。関係表生成手
段3は、重要単語抽出手段2によって抽出された重要な
単語を含む文の構造を解析し、その文に含まれている単
語同士の2項関係を抽出して関係表を生成する。選択関
係表生成手段4は、関係表生成手段3によって生成され
た関係表から、重要な単語を含む2項関係を所定の規則
に従って抽出し、選択関係表を生成する。補完関係付加
手段5は、選択関係表に含まれている2項関係を補完す
る新たな2項関係を関係表から取得し、選択関係表に付
加する。文合成手段6は、補完関係付加手段5によって
新たな2項関係が付加された選択関係表に含まれている
2項関係から入力された文書の要約である文を合成して
出力する。
【0020】次に、図2を参照して本発明の文要約装置
の実施の形態の構成例について説明する。この図におい
て、文書入力手段11からは、処理の対象となる文書が
入力される。重要単語抽出手段12は、文書入力手段1
1から入力された文書から、出現頻度などを参照して重
要な単語を抽出する。なお、重要な単語の抽出方法とし
ては、tf*IDF(tf:term frequency,IDF:invers
e document frequency)積(詳細については後述する)
などを用いる。
【0021】関係表生成手段13は、重要単語抽出手段
12によって抽出された重要な単語を含む文の構造を解
析して、その文に含まれている単語同士の2項関係を抽
出して関係表を生成する。解析方法としては、一般的に
知られている構文解析や、形態素解析に応じたパターン
マッチング等を用いることができる。
【0022】選択関係表生成手段14は、関係表生成手
段13によって生成された関係表から、重要な単語を含
む2項関係を所定の規則に従って抽出し、選択関係表を
生成する。選択方法としては、2項関係に含まれている
重要単語の数や、主要格を含むか否かや、重要な2項関
係と同一文中に存在しているか否かなどを基準にする。
【0023】補完関係付加手段15は、選択関係表に含
まれている2項関係を補完する新たな2項関係を関係表
から取得し、選択関係表に付加する。新たな2項関係の
選択方法としては、孤立関係や必須修飾句記録手段17
に記録されている必須格などを参照する。
【0024】文合成手段16は、補完関係付加手段15
によって新たな2項関係が付加された選択関係表に含ま
れている2項関係から、入力された文書の要約である文
を合成する。
【0025】必須修飾句記録手段17は、動詞とその動
詞に必須である必須格(主題、主体、対象、対格、名詞
連続など(「は」、「が」、「を」、「に」など)の対
応表を記録しており、補完関係付加手段15からの要求
に応じて、必要な情報を供給する。
【0026】次に、以上の実施の形態の動作について説
明する。文書入力手段11からは、例えば、図3に示す
ような文書が入力される。重要単語抽出手段12は、文
書入力手段11から入力された文書から、出現頻度を参
照して重要単語を抽出する。なお、単語の一般性が高
く、多くの文書で頻出する単語の影響を避ける方法とし
て、tf*IDF積によるスコアを用いる方法がある。
その詳細は、「G. Salton "Automatic Text Processin
g," Addison-Wesley(1989)」などに記載されている。
【0027】図3の文書から、重要単語抽出手段12が
抽出した重要単語の一覧を、図4に示す。この例では、
単語の出現頻度順にLevel1〜Level3に分類
されており、出現頻度が最も高いLevel1として
は、「富士山紡績」、「江山紡績」が挙げられており、
以下、図の通りである。
【0028】関係表生成手段13は、重要単語抽出手段
12によって抽出された重要単語を含む文の構文解析を
行い、対象となる文に含まれている単語の2項関係(係
り受けの関係)を解析する。そして、得られた解析結果
に応じて関係表を生成する。なお、構文解析の方法とし
ては、形態素解析結果に対してパターンマッチングを適
用する方法を用いてもよい。
【0029】構文解析結果の具体例を図5に示す。この
例において、実線によって囲繞されている単語は重要単
語である。また、破線によって囲繞されている単語は重
要単語以外の単語である。即ち、「富士山紡績」、「提
携」、「李白雲紡績廠」、「合弁会社」、「中国」、
「絹織物」は重要単語であり、その他は重要単語ではな
い。
【0030】以上のような解析結果をもとにして、関係
表生成手段13は、修飾関係の係り側と受け側に対応す
る2つの単語(2項関係)を抽出し、図6に示す関係表
を生成する。
【0031】図6に示す関係表では、係り側、受け側、
係り受けの関係が一覧表示されている。なお、この図に
示す文番号は、図7に示すように、各文毎に付与された
番号である。この文番号は、重文や複文に対しては異な
る文番号が付与される。例えば、第2行目の文「富士山
紡績は中国・・・合弁会社を設立する。」は、重文とな
っているので、文の前半部分には文番号「1−1」が付
与され、また、文の後半には文番号「1−2」が付与さ
れている。
【0032】なお、図6に示す表では、付属語は省略し
てある。実際には、活用、助動詞などが記載されるフィ
ールドが係り側、受け側のそれぞれに具備されている。
次に、図8に示すフローチャートを参照して、選択関係
表生成手段14、補完関係付加手段15、文合成手段1
6、および、必須修飾句記録手段17の動作について説
明する。
【0033】このフローチャートが開始されると、以下
の処理が実行されることになる。 [S1]選択関係表生成手段14は、重要単語を含む2
項関係の抽出処理を実行する。 [S2]補完関係付加手段15は、孤立関係(後述す
る)に対する関係解析処理を実行する。 [S3]補完関係付加手段15は、必須修飾句記録手段
17に記録されている情報を参照して、必須格の補足処
理を実行する。 [S4]文合成手段16は、選択関係表に含まれている
2項関係を適宜合成して、処理結果である要約文を生成
する。
【0034】なお、以上の処理はそれぞれサブルーチン
処理となっており、それぞれの処理については以下に詳
述する。ステップS1の処理が開始されると、図9に示
す以下の処理が実行されることになる。なお、以下の処
理では、関係表に記載されている2項関係の中から、係
り側または受け側の少なくとも一方が重要単語であるも
のを選択し、選択された2項関係の中から重要な2項関
係を抽出して、選択関係表に付加する処理を行う。 [S1−0]選択関係表生成手段14は、選択関係表の
内容を全て空(NULL)の状態にする。 [S1−1]選択関係表生成手段14は、直接関係の探
索処理を実行する。なお、この処理の詳細については、
図10を参照して後述する。 [S1−2]選択関係表生成手段14は、同じ文にある
2項関係の抽出処理を実行する。なお、この処理の詳細
については、図12を参照して後述する。 [S1−3]選択関係表生成手段14は、主要格の探索
処理を実行する。なお、この処理の詳細については、図
14を参照して後述する。
【0035】図9に示すステップS1−1の処理が開始
されると、図10に示すフローチャートが実行されるこ
とになる。この処理では、関係表に記載されている2項
関係のうち、係り側と受け側の双方に重要単語を含むも
のを選択して、選択関係表に付加する。 [S11]選択関係表生成手段14は、関係表から2項
関係を1つ取得する。例えば、図6に示す関係表から
「富士山紡績」と「提携」とからなる2項関係を取得す
る。 [S12]選択関係表生成手段14は、取得した2項関
係の係り側と受け側の双方が重要単語であるか否かを判
定する。その結果、双方が重要単語である場合にはステ
ップS13に進み、また、そうでない場合にはステップ
S15に進む。
【0036】図6の例では、「富士山紡績」と「提携」
とは双方とも重要単語であることからYESと判定さ
れ、ステップS13に進む。 [S13]選択関係表生成手段14は、取得した重要単
語を選択関係表に付加する。
【0037】図6の例では、「富士山紡績」と「提携」
とが選択関係表に付加される。 [S14]選択関係表生成手段14は、重要単語リスト
から係り側と受け側に対応する重要単語を削除する。
【0038】図6の例では、「富士山紡績」と「提供」
とが重要単語リストから削除されることになる。 [S15]選択関係表生成手段14は、関係表に未処理
の2項関係が残っているか否かを判定する。その結果、
未処理の2項関係が残っている場合にはステップS11
に戻り、残っていない場合には処理を終了する。
【0039】以上の処理を、図6の例に適用すると、図
11に示す選択関係表を得る。この例では、文番号1−
1に含まれている「富士山紡績」と「提携」との関係は
「主題」の関係であり、また、この項目はステップS1
−1の処理において取得されたことが示されている。同
様にして、「上海紡績廠B」と「提携」、および、「子
会社」と「江山紡績」との関係が示されている。
【0040】ここで、表の右端にある項目「得られたス
テップ」には、以上の2項関係がステップS1−1にお
いて得られたことが示されている。なお、この処理が実
行される前に、重要単語リストに記載されている重要単
語は、「富士山紡績」、「江山紡績」、「上海紡績廠
B」、「絹織物」、「合弁会社」、「社長」、「子会
社」、「提携」、「資本金」、「中国」である。ステッ
プS1−1の処理が実行されると、「富士山紡績」、
「提携」、「上海紡績廠B」、「子会社」、および、
「江山紡績」が選択され、その結果、これらの項目は重
要単語リストから削除されることになる。従って、ステ
ップS1−1の処理が実行された後は、重要単語リスト
には、「絹織物」、「合弁会社」、「社長」、「資本
金」、および、「中国」が残ることになる。
【0041】図9に示すステップS1−1の処理が終了
すると、ステップS1−2が続いて実行されることにな
る。図12は、ステップS1−2の処理の詳細を示すフ
ローチャートである。この処理が開始されると、以下の
処理が実行されることになる。なお、この処理では、係
り側と受け側の双方が重要単語である2項関係と同じ文
(同じ文番号を有する文)に存在し、かつ、係り側また
は受け側の一方が重要単語である2項関係が選択され
て、選択関係表に付加されることになる。 [S31]選択関係表生成手段14は、図9のステップ
S1−1の処理において取得された2項関係のうち、未
処理のものが存在するか否かを判定する。
【0042】いま、処理が開始されたばかりであり、図
11に示す選択関係表には、未処理の2項関係が3つ存
在していることからYESと判定されてステップS32
に進む。 [S32]選択関係表生成手段14は、ステップS1−
1において取得された2項関係を選択関係表から1つだ
け取得する。
【0043】いまの例では、図11に示す選択関係表か
ら、「富士山紡績」と「提携」とからなる2項関係が抽
出される。 [S33]選択関係表生成手段14は、取得された2項
関係と同一の文番号を有する2項関係Rが関係表に存在
しているか否かを判定する。その結果、存在する場合に
はステップS34に進み、そうでない場合にはステップ
S31に戻る。
【0044】いまの例では、「富士山紡績」と「提携」
からなる2項関係の文番号は“1−1”であり、同一の
文番号を有する2項関係(例えば、「絹織物」と「企
業」および「中国」と「企業」)は関係表中に存在する
ので、YESと判定され、ステップS34に進む。 [S34]選択関係表生成手段14は、2項関係Rの中
に重要単語を1つだけ含む2項関係Sが存在するか否か
を判定し、存在する場合にはステップS35に進み、ま
た、存在しない場合にはステップS31に戻る。
【0045】いまの例では、「絹織物」と「企業」およ
び「中国」と「企業」の2つの関係は、重要単語「絹織
物」と「中国」をそれぞれ含んでいることからYESと
判定されてステップS35に進む。 [S35]選択関係表生成手段14は、2項関係Sを選
択関係表に付加する。
【0046】いまの例では、「絹織物」と「企業」およ
び「中国」と「企業」の2つの2項関係が選択関係表に
付加されることになる。 [S36]選択関係表生成手段14は、2項関係Sに含
まれている重要単語を重要単語リストから削除する。
【0047】いまの例では、「絹織物」と「中国」とが
重要単語リストから削除されることになる。その結果、
重要単語リストには、「合弁会社」、「社長」、およ
び、「資本金」のみが存在することになる。
【0048】以上のような処理が繰り返されると、第3
回目の処理において、図11に示す選択関係表の第3番
目の「子会社」と「江山紡績」とからなる2項関係と同
一の文番号(=3)を有する「川崎竜之介」と「社長」
および「資本金」と「六億五千万円」からなる2つの2
項関係が選択関係表に付加される。そして、これらに含
まれている重要単語「社長」と「資本金」が重要単語リ
ストから削除されることになる。その結果、重要単語リ
ストには、「合弁会社」のみが残ることになる。
【0049】図13は、以上の処理によって生成された
選択関係表の一例を示す図である。図11との比較か
ら、以上の処理により第4番目〜第7番目の2項関係が
新たに付加されたことが分かる。
【0050】なお、表の右端にある項目「得られたステ
ップ」には、以上の2項関係がステップS1−2におい
て得られたことが示されている。次に、図14を参照し
て、図9に示す主要格の探索処理(ステップS1−3の
処理)の詳細について説明する。この処理は、関係表か
ら、係り側または受け側の一方が重要単語であり、か
つ、主要格に相当する2項関係を選択して選択関係表に
付加する。このフローチャートが開始されると、以下の
処理が実行されることになる。 [S51]選択関係表生成手段14は、重要単語リスト
を参照し、未処理の重要単語が残っているか否かを判定
する。その結果、未処理の重要単語が残っている場合に
はステップS52に進み、そうでない場合には処理を終
了する。
【0051】いまの例では、図12の処理の結果、「合
弁会社」が重要単語リストにまだ残っているので、これ
に対して処理が実行される。即ち、第1回目の処理で
は、前述した重要単語が残っていることからYESと判
定され、ステップS52に進む。 [S52]選択関係表生成手段14は、重要単語リスト
から重要単語Kを1つ取得する。
【0052】いまの例では、重要単語Kとして「合弁会
社」が選択される。 [S53]選択関係表生成手段14は、重要単語Kを含
む2項関係Rが関係表に存在するか否かを判定し、存在
する場合にはステップS54に進み、存在しない場合に
はステップS56に進む。
【0053】いまの例では、重要単語「合弁会社」に対
応する2項関係(「合弁会社」と「設立」からなる2項
関係)が存在することから、YESと判定されて、ステ
ップS54に進む。 [S54]選択関係表生成手段14は、図示せぬメモリ
等に格納されている主要格リスト(図15参照)に2項
関係Rの関係が記載されているか否かを判定する。その
結果、主要格リストに記載されている場合にはステップ
S55に進み、そうでない場合には、ステップS56に
進む。
【0054】いまの例では、「合弁会社」と「設立」か
らなる2項関係の関係は、「を格」であり、これは、図
15に示す主要格リストの第3番目に記載されているこ
とからYESと判定されて、ステップS55に進む。 [S55]選択関係表生成手段14は、2項関係Rを選
択関係表に付加する。
【0055】いまの例では、「合弁会社」と「設立」と
が選択関係表に追加されることになる。 [S56]選択関係表生成手段14は、重要単語リスト
から重要単語Kを削除する。
【0056】以上の処理の結果、図16に示すような選
択関係表が生成されることになる。この選択関係表で
は、最後の行に、以上に示したステップS1−3の処理
によって得られた2項関係として、「合弁会社」と「設
立」およびこれらの関係を示す「を(対象)」が記載さ
れている。
【0057】なお、以上の2項関係の選択を、主要格リ
ストの順、すなわち主要格の重要性に応じて実行するよ
うにしてもよい。その場合に選択される2項関係の有す
る関係は、以下のようになる。
【0058】が格(主体)→は格(主題)→を格(対
象)→に格(対格)→...なお、同格は、名詞連続から
パターンマッチを用いて解析する。例えば「人名“社
長" 」のパターンならば、この「人名」が“社長”を表
していると解釈する。一方、「子会社の江山紡績」にお
いて、「の」は同格を表すが、ここではそこまでの解釈
を行わない。「の」の解釈を曖昧なままにしておいて
も、要約においては特に害がないためである。
【0059】以上の処理が終了すると、図8のフローチ
ャートに戻り、ステップS2の処理が実行されることに
なる。この処理では、孤立した関係と他の2項関係とを
結ぶ2項関係が抽出される。ここで、孤立した関係と
は、図9のステップ1−2で得た2項関係を意味する。
これを同図のステップ1−1で得られた2項関係とつな
がりを持たせるための新たな2項関係を関係表から抽出
する。このような処理は、グラフ探索によって達成する
ことができる。
【0060】なお、関係表に表された解析結果は2つの
単語(ノード)が関係(アーク)によって連結されたも
の(グラフ)とみなすことができるので、上述した処理
はグラフ探索によって実行することができる。この孤立
した関係(孤立したアーク)は選択関係表に既に入って
いる2項関係(ステップS1−1で取得された2項関
係)と同じ文にあるという条件を満たすので、この探索
は必ず成功する。
【0061】例えば、図16に示す例では、まず「資本
金」と「六億五千万円」からなる2項関係が取得され
る。次に、六億五千万円を係り側に有する関係、即ち
「六億五千万円」と「出資する」から構成され、その関
係が「を格(対象)」である2項関係が選択される。
【0062】続いて、「出資する」に関係を有する2項
関係、即ち「江山紡績」と「出資する」とからなる関係
が選択される。そして、「六億五千万円」と「出資」、
および、「江山紡績」と「出資」の2組の2項関係は選
択関係表に付加されることになる。
【0063】以上の処理の結果、図18に示すように、
孤立関係である「資本金」と「六億五千万円」からなる
2項関係と、ステップS1−1の処理において抽出され
た「子会社」と「江山紡績」とからなる関係とを結合す
る2項関係(「六億五千万円」と「出資」、および、
「江山紡績」と「出資」)が抽出されて、選択関係表に
新たに付加されることになる。
【0064】同様の処理が繰り返されると、ステップS
1−2において取得された「絹織物」と「企業」と、ス
テップS1−1において取得された「上海紡績廠B」と
「提携」とを結ぶ、「企業」と「上海紡績廠B」から構
成される2項関係が取得され、選択関係表に付加され
る。
【0065】更に、ステップS1−2において取得され
た「川崎竜之介」と「社長」と、ステップS1−1にお
いて取得された「子会社」と「江山紡績」とを結ぶ、
「江山紡績」と「社長」から構成される2項関係が取得
され、選択関係表に新たに付加される。
【0066】以上の処理により生成された選択関係表の
一例を図17に示す。この例では、第9番目〜第12番
目に、上述の処理によって新たに付加された2項関係が
示されている。
【0067】以上の処理が終了すると、図8のステップ
S3の処理が実行されることになる。ステップS3にお
いて、補完関係付加手段15が、選択関係表に含まれて
いる動詞に必須な必須格を関係表より取得して選択関係
表に付加する。なお、必須格は、主題、主体、対象、対
格、名詞連続とする。
【0068】いま、選択関係表に記載されている動詞
は、「提携する」、「設立する」、「出資する」の3種
類である。補完関係付加手段15は、必須修飾句記録手
段17に記録されている、動詞とその必須格との対応関
係を示す対応表を参照し、これらの動詞の必須格を関係
表から探索する。
【0069】いま、これらの動詞に対応する必須格のう
ち、関係表に含まれているものは、以下の通りである。
「富士山紡績」、「設立する」(は(主題))「三十
%」、「出資する」(−(対象))ここで、“−”は格
助詞の省略を示す。
【0070】これらの必須格は、補完関係付加手段15
によって、選択関係表に付加される。図19は、以上の
処理により生成された選択関係表の一例を示す図であ
る。この図の例では、第13番目と第14番目に前述の
新たな2項関係が付加されている。
【0071】なお、名詞的概念( およびサ変名詞) に関
しても、それらがかかる先が選択関係表に存在しないな
らば、関係表から探して選択関係表に移してもよい。ま
た、名詞的概念に対しては、以上のような処理を行わな
いようにしてもよい。
【0072】なお、必須格は必須修飾句記録手段17に
記録されているものを使用するようにしたが、例えば、
ユーザが選択可能とすることもできる。また、動詞それ
ぞれについて設定するようにしてもよい。例えば、「提
携する」は、主体のほか、「と(共同)」、「で(領
域)」を持つとしてもよい。
【0073】更に、「こと」、「もの」、「とき」、
「方法」、「手段」など、それ自身では意味の特定能力
が低い( 広い意味を持つ) ものは、その修飾句( 「の」
またはその他の連体修飾) を加えるようにしてもよい(
図3の例では存在しない) 。
【0074】以上の処理が終了すると、図8のステップ
S4の処理が実行されることになる。図20は、図8の
ステップS4の処理の詳細を説明するフローチャートで
ある。この処理は、以上の処理によって生成された選択
関係表に含まれている2項関係を適宜接続し、処理結果
である文(要約文)を生成する。図20に示すフローチ
ャートが開始されると、以下の処理が実行されることに
なる。 [S71]文合成手段16は、選択関係表から2項関係
を1つ取得する。
【0075】いま、例えば、図19に示す選択関係表の
第1番目の2項関係である「富士山紡績」と「提携」か
ら構成される2項関係が取得される。 [S72]文合成手段16は、取得した項目を選択関係
表から削除する。
【0076】いま、「富士山紡績」と「提携」からなる
2項関係が選択関係表から削除されることになる。 [S73]文合成手段16は、取得した2項関係からグ
ラフインスタンスを生成する。
【0077】いま、重要単語「富士山紡績」と「提携」
を2つのノードとし、これらを結ぶアークに関係「は
(主題)」が付加されたグラフインスタンスが生成され
ることになる。なお、このとき、アークに対して出現文
番号(1から順にインクリメントされる数)を付与して
おき、生成されたグラフを出力する際に使用する(詳細
は後述する)。 [S74]文合成手段16は、グラフインスタンスにお
いて調査が終了したことを示す調査終了マークが付加さ
れていないアークを選択する。
【0078】いまの例では、調査終了マークがまだ付加
されていない「富士山紡績」と「提携」を結ぶアークが
選択される。 [S75]文合成手段16は、選択されたアークの係り
側のノードに対する探索処理を実行する。なお、この処
理はサブルーチンとなっており、その詳細は後述する。
【0079】いまの例では、係り側のノードである「富
士山紡績」が選択され、このノードに対する探索処理が
実行されることになる。 [S76]文合成手段16は、選択されたアークの受け
側のノードに対する探索処理を実行する。なお、この処
理はサブルーチンとなっており、その詳細は後述する。
【0080】いまの例では、受け側のノードである「提
携」が選択され、このノードに対する探索処理が実行さ
れることになる。 [S77]文合成手段16は、選択されたアークに対し
て調査終了マークを付加する。
【0081】いまの例では、「富士山紡績」と「提携」
を結ぶアークに調査終了マークが付加されることにな
る。 [S78]文合成手段16は、調査終了マークが全ての
アークに対して付加されたか否かを判定する。その結
果、全てのアークに対して調査終了マークが付加された
場合にはステップS79に進み、付加されていない場合
にはステップS74に戻る。
【0082】いまの例では、ステップS75またはステ
ップS76の探索処理により、「富士山紡績」と「提
携」とにより構成されるグラフに新たなアークが付加さ
れた場合には、そのアークには調査終了マークは付加さ
れていないことから、NOと判定されてステップS74
に戻る。 [S79]文合成手段16は、選択関係表に2項関係が
まだあるか否かを判定する。その結果、選択関係表に2
項関係がまだある場合にはステップS71に戻り、ま
た、ない場合には処理を終了する。
【0083】例えば、選択関係表の第1番目の2項関係
(「富士山紡績」と「提携」)に対する処理が終了した
とすると、これらを中心とする文が生成されたことにな
る(図23参照)、この場合、他の2項関係がまだ残っ
ていることから、ステップS79ではYESと判定さ
れ、ステップS71に戻り、前述の場合と同様の処理が
繰り返される。そして、選択関係表に記載されている全
ての2項関係に対する処理が終了した場合には、NOと
判定されて処理を終了する。
【0084】次に、図21と図23を参照して、図20
に示すステップS75およびステップS76の処理の詳
細について説明する。図21は、図20に示すステップ
S75の処理の詳細を示すフローチャートである。この
フローチャートが開始されると、以下の処理が実行され
ることになる。 [S91]文合成手段16は、取得された2項関係の係
り側のノードと同一の単語を受け側に持つ2項関係が選
択関係表に存在するか否かを判定する。その結果、係り
側のノードと同一の単語を受け側に持つ関係が存在する
場合にはステップS92に進み、存在しない場合には図
20の処理に復帰する。
【0085】いま、係り側のノードである「富士山紡
績」と同一の単語を受け側に持つ2項関係は存在しない
ので、NOと判定されて図20の処理に復帰する。 [S92]文合成手段16は、係り側のノードと同一の
単語を受け側のノードに有する2項関係を選択関係表か
ら抽出した後、選択関係表から削除する。 [S93]文合成手段16は、抽出した2項関係の関係
と、係り側のノードに以前に付加したノードの関係が同
一であるか否かを判定する。その結果、同一である場合
にはステップS91に戻り、そうでない場合にはステッ
プS94に進む。
【0086】例えば、以前の処理において、「富士山紡
績」に対して「山口県」(の(属性/部分))が付加さ
れている場合に、「中小企業」(の(属性/部分))が
抽出された場合には、「山口県の中小企業の富士山紡
績」は冗長となるため、後出の「中小企業」の付加を中
止する。 [S94]文合成手段16は、抽出した2項関係を係り
側のノードに付加する。
【0087】以上の処理により、選択されたアークの係
り側のノードと同一の単語を受け側に有する2項関係が
選択関係表から抽出された後、グラフインスタンスに順
次付加されていく。
【0088】図22は、図20に示すステップS76の
処理の詳細を示すフローチャートである。このフローチ
ャートが開始されると、以下の処理が実行されることに
なる。 [S111]文合成手段16は、取得された2項関係の
受け側のノードと同一の単語を係り側、または、受け側
に持つ2項関係が選択関係表に存在するか否かを判定す
る。その結果、受け側のノードと同一の単語を係り側、
または、受け側に持つ2項関係が存在する場合にはステ
ップS112に進み、存在しない場合には図20の処理
に復帰する。
【0089】いま、受け側のノードである「提携」と同
一の単語を受け側に持つ2項関係としては選択表の第2
番目に示されている「李白雲紡績廠」と「提携」がある
ので、ステップS111ではYESと判定されてステッ
プS112に進む。 [S112]文合成手段16は、受け側のノードと同一
の単語を係り側、または、受け側のノードに有する2項
関係を選択関係表から抽出した後、選択関係表から削除
する。
【0090】いまの例では、「李白雲紡績廠」と「提
携」とが選択関係表から抽出された後、削除されること
になる。 [S113]文合成手段16は、抽出した2項関係の関
係と、受け側のノードに以前に付加されたアークの関係
が同一であるか否かを判定する。その結果、同一である
場合にはステップS111に戻り、そうでない場合には
ステップS114に進む。
【0091】いまの例では、受け側のノードには、まだ
ノードは付加されていないので、NOと判定され、ステ
ップS114に進む。 [S114]文合成手段16は、抽出した2項関係を受
け側のノードに付加する。
【0092】いまの例では、図23に示すように、ノー
ド「提携」に対して「李白雲紡績廠」が付加されること
になる。図20に示すステップS74〜78の処理が繰
り返されると、第2回目の処理において、「李白雲紡績
廠」と「提携」とを結ぶアーク(第1回目の処理で付加
されたアーク)が処理の対象に選択される。そしてステ
ップS75の処理の結果、「企業」が「李白雲紡績廠」
に付加される(図23参照)。更に、第3回目の処理に
おいては、「企業」と「李白雲紡績廠」とを結ぶアーク
が処理の対象に選択される。そして同じくステップS7
5の処理の結果、「中国」と「絹織物」とが付加される
ことになる。そして、接続可能な2項関係が選択関係表
には存在しないことから、新たなノードは付加されず、
その結果、新たなアーク(調査終了マークが付加されて
いないアーク)も存在しなくなり、ステップS78では
YESと判定されて、ステップS79に進む。
【0093】ステップS79では、まだ、選択関係表に
は2項関係が残っていることから、YESと判定され、
ステップS71に戻る。そして、前述の場合と同様の処
理が繰り返され、図24および図25に示すようなグラ
フが生成されることになる。なお、図24の例では、
「富士山紡績」、「設立」、および、「合弁会社」とが
接続されたグラフが示されている。また、図25に示す
例では、「資本金」、「六億五千万円」、「子会社」、
「江山紡績」、「出資」、「川崎竜之介」、「社長」、
および、「三十%」とが接続されたグラフが示されてい
る。
【0094】以上の処理が終了すると、文合成手段16
は、生成された複数のグラフに対して、出力順序を規定
する。具体的には、ステップS73の処理により、グラ
フの個々のアークに付与された出現分番号の最も小さい
ものを、そのグラフの番号とし、その番号が小さい順に
グラフをソートする。
【0095】そして、文合成手段16は、重複した重要
単語を削除する処理を行う。即ち、各グラフのノードに
ある単語が重要単語リストに記載されている場合には、
その重要単語にマークを付与していく。そして、ノード
が有する重要単語の全てがマーク済みのグラフが存在し
ている場合には、そのグラフは冗長であるとして削除す
る。
【0096】このような処理を行う理由は、既に使用さ
れている重要単語のみによって構成されているグラフ
は、既出の文と内容が重複する場合が多いからである。
なお、このような処理を実行せずに全てのグラフを出力
の対象としてもよい。
【0097】次に、文合成手段16は、以上のグラフか
ら文を合成する処理を行う。即ち、グラフが動詞を含む
場合には、以下のような順序で各ノードの単語を配置し
ていく。
【0098】[主題][主体][対象][対格][その
他の格]*[付属語]但し、*は自分自身を表す また、名詞に対しては、以下のような順序で各ノードの
単語を配置していく。
【0099】[連体修飾][属性/部分][名詞連続]
[同格]*[付属語][“(”補足“)”]なお、それ
ぞれの格は、[係り側][表層関係名]とする。これら
は動詞、名詞の細分類によりさらに詳細にしても良い。
以上の処理により、例えば、図23のグラフからは、
「富士山紡績は中国の絹織物企業の李白雲紡績廠と提
携。」という文が生成されることになる。
【0100】また、図24のグラフからは、「富士山紡
績は合弁会社を設立。」更に、図25のグラフからは、
「資本金六億五千万円は子会社の江山紡績(川崎竜之介
社長)が三十%出資する。」という文が生成される。
【0101】そして、文合成手段16は、生成された3
つの文を、CRT(Cathode Ray Tube)ディスプレイや
プリンタなどの表示装置に対して出力する。その結果、
CRTや印字用紙上には、以下のような文が出力される
ことになる。
【0102】富士山紡績は絹織物企業の李白雲紡績廠と
提携。富士山紡績は合弁会社を設立。資本金六億五千万
円は、子会社の江山紡績(川崎竜之介社長)が三〇%出
資。
【0103】次に、他の文書を以上の実施の形態によっ
て処理した結果について説明する。処理する文書として
は、図26に示すものを使用する。図27は、重要単語
抽出手段12が図26に示す文書から抽出した重要単語
のリストである。この例では、「中村化学工業」、「山
田化学工業」、「ケミカル」、「中村ケミカル」、その
他が重要単語として抽出されている。
【0104】図28は、生成された要約文である。この
例では、以下のような要約文が出力されることになる。
山田化学工業は中村化学工業と折半出資会社を新設。
【0105】新会社は「中村ケミカル」の社名。将来は
山田グループの農薬会社と合併させる。農薬の研究開
発。
【0106】円高による輸出の減少。業界再編気運も高
まる。次に、更に他の文書を以上の実施の形態によって
処理した結果について説明する。処理する文書として
は、図29に示すものを使用する。
【0107】図30は、重要単語抽出手段12が図29
に示す文書から抽出した重要単語のリストである。この
例では、「ジューシーミート」、「山水藤雄」、「食
肉」、「駅ビル」その他が重要単語として抽出されてい
る。
【0108】図31は、生成された要約文である。この
例では、以下のような要約文が出力されることになる。
東京渋谷の駅ビル。
【0109】食肉ディスカウンター、ジューシーミート
が出店。社長の山水藤雄は胸を張る。牛肉で四割、鶏肉
で三−四割は安い。
【0110】首都圏のショッピングセンター(SC)や
駅ビル、百貨店を中心。食品売り場の集客力が高まっ
た。以上の実施の形態によれば、文書の要約を少ない文
字数で的確に生成することが可能となる。
【0111】例えば、キーワード列挙によるものと比較
した場合では、概要が把握しやすくなる。つまり、キー
ワード列挙では、キーワードが独立に表示されるため、
キーワード間の関係が把握できないが、本発明では、キ
ーワードとキーワードの関係が把握できるので、おおま
かにどのようなことが述べられているかを知ることがで
きる。
【0112】また、本発明では、重要文ピックアップ
(+削除)に比べて、一文の長さが短いため、迅速に内
容を把握することができる。即ち、重要文ピックアップ
では、一文の長さが長くなりがち(複数のサンプルの処
理結果は平均約50文字)で、概要を把握するのに時間
がかかる。不要要素を削除する場合でも、平均約35文
字である。一方、この発明による1文の平均文字数は約
17文字で、重要文ピックアップ(+削除)の約半分の
長さとなる。
【0113】更に、重要文ピックアップ(+削除)に比
べて、文章の切れがよいという特徴がある。即ち、重要
分ピックアップ(+削除)では、文の述部がそのまま残
る傾向があり、文書選択にとってはあまり意味のない情
報が残りがちである。例えば、図26の文書に対して重
要分ピックアップ処理を施すと、以下のような出力を得
る。
【0114】山田化学工業は中村化学工業と農薬事業の
折半出資会社を新設することで合意したと、発表した。
なお、本実施の形態の処理結果では、以下のような文を
得る。
【0115】山田化学工業は中村化学工業と折半出資会
社を新設。これらを比較して明らかなように、本実施の
形態による処理結果の方が要点が的確に抽出されている
ことが分かる。
【0116】更に、重要文ピックアップ(+削除)で
は、削除しすぎで意味が不明になる場合があるが、本実
施の形態によれば、そのような問題点を解消することが
できる。例えば、「最大の要因は急速な円高による輸出
採算の悪化。」という文に対して、従来の重要文ピック
アップ(+削除)処理を行った場合には、「要因は悪
化」という結果を得る。これは、明らかに削除のし過ぎ
である。一方、本実施の形態によれば、単語毎の主要格
の補完処理が実行されることから、「要因は円高による
輸出採算の悪化」という適切な要約を得ることができ
る。
【0117】更にまた、本実施の形態によれば、複数の
文から1つの句を構成することができるので、もともと
が短い文で構成されている場合に、意味の散在による焦
点のぼけを防ぐことが可能となる。
【0118】元々の文書が短い文の組み合せで意味を提
示する場合においては、従来技術のようにそこから重要
文をピックアップすると文脈が失われることになる。そ
のような場合においても、本実施の形態によれば、文脈
を補完することができる。
【0119】例えば、「食肉ディスカウンター、ジュー
シーミートの売り場だ。」と「ジューシーミートが出店
して以来、食品売り場の集客力が高まった。」の2文か
ら、本実施の形態では、「食肉ディスカウンター、ジュ
ーシーミートが出店。」という1文を合成して出力する
ことが可能となる。その結果、短い文の積み重ねによっ
て意味が形成されているような文書においても、的確な
要約を生成することが可能となる。
【0120】次に、図32を参照して、本発明の第2の
実施の形態について説明する。図32は、本発明の第2
の実施の形態の構成例を示す図である。この図におい
て、図2の場合と対応する部分には同一の符号を付して
あるのでその説明は省略する。この実施の形態において
は、重要単語数制限手段21と表示形式変更手段22、
および、表示装置23が新たに付加されている。その他
の構成は、図2の場合と同様である。
【0121】重要単語数制限手段21は、重要単語抽出
手段12が抽出する重要単語の個数を制御する。また、
表示形式変更手段22は、文合成手段16によって合成
された文を表示装置23に表示する際に、重要単語に相
当する部分の表示形式を変更する。
【0122】次に、以上の実施の形態の動作について簡
単に説明する。いま、文書入力手段11に対して、図3
に示す例文が入力されたとする。すると、重要単語抽出
手段12は、重要単語数制限手段21の制御に応じて重
要単語を抽出する。仮に、抽出する重要単語の個数を7
個に制限(設定)したとすると、重要単語抽出手段12
は、以下の重要単語を抽出することになる。
【0123】Level1 富士山紡績、江山紡績 Level2 李白雲紡績廠、絹織物、合弁会社、社
長、子会社 関係表生成手段13は、以上の重要単語を含む文の構文
解析を行うことにより、それらの文の2項関係を抽出
し、関係表を生成する。選択関係生成手段14は、第1
の実施例において説明したような処理を行うことによ
り、関係表から所定の規則に応じて、重要な2項関係を
抽出し、選択関係表を生成する。
【0124】補完関係付加手段15は、選択関係表に記
載されている2項関係同士の関係を補完する新たな関係
を関係表から選択して選択関係表に付加するとともに、
必須修飾句記録手段17に記録されている対応表を参照
して、必須格となる2項関係を関係表から選択し、選択
関係表に新たに付加する。
【0125】文合成手段16は、補完関係付加手段15
から供給された選択関係表に記載されている2項関係を
適宜接続することにより文を合成する。この結果得られ
る文を以下に示す。
【0126】富士山紡績は絹織物企業の李白雲紡績廠と
提携。富士山紡績は合弁会社を設立。子会社の江山紡績
(川崎竜之介社長)が三十%出資そして、表示形式変更
手段22は、以上の文に含まれている重要単語の表示形
式を変更して、表示装置23に出力する。
【0127】図33は、このとき表示装置23に表示さ
れる文の表示例である。この例では、重要単語に該当す
る部分には下線が付加されている。このように表示する
ことにより、文中で重要な部分を迅速に把握することが
可能となる。
【0128】図34は、他の表示形式の一例を示してい
る。この例では、重要単語のフォントのサイズが変更さ
れている。このようにすることにより、図33の場合に
比較して視覚的に重要な部分を更に把握しやすくするこ
とができる。
【0129】なお、図には示さないが、重要単語の表示
色を変更するようにすることも可能である。続いて、図
35を参照して本発明の第3の実施の形態について説明
する。
【0130】図35は、本発明の第3の実施の形態の構
成例を示す図である。この図において、図2の場合と対
応する部分には同一の符号を付してあるのでその説明は
省略する。なお、この実施の形態においては、図2の場
合と比較して、選択関係表生成手段25の動作が異なっ
ている。なお、その他の構成は、図2の場合と同様であ
る。
【0131】この実施の形態においては、選択関係表生
成手段25は、図9のステップS1−3に示す主要格の
探索処理において、ある重要単語に対応する2項関係を
選択する際に、その2項関係が有するスコア(後述す
る)を参照し、スコアが高いものを優先して選択する。
【0132】また、選択関係表生成手段25は、ステッ
プS1−2の処理において、係り側と受け側の双方が重
要単語である2項関係と同一の文に含まれている他の2
項関係を抽出する場合に、予め設定されている上限の個
数を超えない範囲で2項関係を抽出する。
【0133】次に、以上の実施の形態の動作について簡
単に説明する。所定の文書が文書入力手段11に入力さ
れると、重要単語抽出手段12は、重要単語を抽出す
る。
【0134】関係表生成手段13は、重要単語を含む文
の構文解析を行うことにより、それらの文の2項関係を
抽出し、関係表を生成する。選択関係表生成手段25
は、図12に示すステップS35において、2項関係S
を選択関係表に付加する場合に、Sが複数である場合に
は、所定の上限値を超えない範囲の2項関係を選択して
から付加する。
【0135】その場合は、ステップS3におけるグラフ
探索が、その探索深さ(所定の上限値)で中断されるこ
とになる。なお、探索を中断した関係は選択関係表には
付加しない。ここで付加されるはずだった重要単語はス
テップS1−3の処理で別途付加されることになる。
【0136】なお、探索を中断するのではなく、すべて
の接続候補に対して探索を行い、ホップ数(アークの接
続数)の最も小さいものを選択することも可能である。
以上のような処理によれば、合成結果の文が不要に長く
なることを防止することができる。即ち、第1および第
2の実施の形態の例では、ステップS2において、選択
関係表に記載されている重要単語(係り側と受け側が共
に重要単語である2項関係)に達するまでに、いくつも
の関係をつなぎ合わせなければならない場合が生じる。
これは結果として、長い句を生成してしまうことを意味
する。
【0137】しかしながら、本実施の形態では、ステッ
プS1−2において、既選択の重要単語に達するために
つなぐ2項関係の個数を制限するようにしたので、生成
される文が不要に長くなることを防止することができ
る。
【0138】また、選択関係表生成手段25は、図14
に示す主要格の探索処理の代わりに、以下の処理を実行
する。なお、この実施の形態においては、関係表の各単
語には、その文書におけるスコアが記載されているもの
とする。また、関係表には、関係全体のスコアを記入す
る欄があるとする。すなわち関係表は次の項目を含む。 1 文番号 2 係り側単語 3 係り側単語スコア (complement-score) 4 受け側単語 5 受け側単語スコア (head-score) 6 関係 (relation-type) 7 トータルスコア 選択関係表生成手段25は、以上のような項目を含む関
係表から、選択した重要単語を係り側または受け側にも
つ2項関係を抽出する。そして、各2項関係のトータル
スコアを計算する。なお、トータルスコアの計算式を以
下に示す。
【0139】
【数1】 ここで、Score(relation-type)は主要格リストの順序を
重みで置き換えたものである。即ち、Score(が格) >Sc
ore(連体修飾) の関係がある。
【0140】そして、選択関係表生成手段25は、トー
タルスコアの最も大きな2項関係を抽出して選択関係表
に付加する。なお、WcとWhの値を変えるのは、重要単語
が係り側にある2項関係を優先するか、受け側にある2
項関係を優先するかを決めるためである。重要単語とし
て選ばれたもののスコアは、もう一方の単語のスコアよ
り必ず高いので、重要単語が係り側にある2項関係を優
先させたければWcの値をWhより高くすればよい。
【0141】重要単語として選ばれたもののスコアは、
全ての2項関係で共通なので、重要単語ではない方の単
語のスコアを、それが係り側か受け側かで重みを変えれ
ばよい。また、Wc, WhとWlは、関係の重要さと、関係を
持つ単語の重要さの何れをより重視するかを決めるため
のものである。関係の重要さを全く考慮に入れないなら
ば、Wl = 0とすればよい。
【0142】以上のような処理を実行することにより、
ある重要単語に対して同一の主要格を有する複数の2項
関係が存在している場合には、設定に応じて重要度が高
い2項関係が選択され、選択関係表に付加されることに
なる。
【0143】第1および第2の実施の形態においては、
ある重要単語に対して同じ主要格を持つ2項関係が複数
ある場合に、関係表に出現する順序に応じてこれらの2
項関係が選択されることになる。その場合、重要でない
2項関係も選択され、要約文に付加されることになる。
【0144】しかしながら、以上のような処理によれ
ば、出現順序ではなく、重要度に応じて2項関係が選択
されるので、重要な2項関係のみを抽出することが可能
となる。
【0145】以上のようにして生成された選択関係表
は、補完関係付加手段15に供給される。補完関係付加
手段15は、選択関係表に記載されている2項関係同士
の関係を補完する新たな2項関係を関係表から選択して
選択関係表に付加するとともに、必須修飾句記録手段1
7に記録されている対応表を参照して、必須格となる2
項関係を関係表から選択して、選択関係表に新たに付加
する。
【0146】文合成手段16は、補完関係付加手段15
から供給された選択関係表に記載されている2項関係を
適宜接続することにより文を合成する。以上の実施の形
態によれば、不要に長い文が出力されることを防止する
ことが可能となるとともに、重要な単語を優先的に結合
した文を出力することが可能となる。
【0147】続いて、図36を参照して本発明の第4の
実施の形態について説明する。図36は、本発明の第4
の実施の形態の構成例を示す図である。この図におい
て、図2の場合と対応する部分には同一の符号を付して
あるのでその説明は省略する。なお、この実施の形態に
おいては、図2の場合と比較して、文書記録手段31、
キーワード入力手段32、および、文書検索手段33が
新たに付加されている。なお、その他の構成は、図2の
場合と同様である。
【0148】文書記録手段31は、文書入力手段11か
ら入力された文書を記録する。キーワード入力手段32
からは、文書記録手段31に記録されている文書を検索
するためのキーワードが入力される。文書検索手段33
は、キーワード入力手段32から入力されたキーワード
を含んでいる文書を文書記録手段31から検索して出力
する。
【0149】次に、以上の実施の形態の動作について説
明する。図3に示す文書を含む複数の文書が文書入力手
段11から入力されたとすると、これらの文書は文書記
録手段31に記録される。
【0150】いま、キーワード入力手段32からキーワ
ードとして「中国」と「合弁」の2つの単語が入力され
たとすると、文書検索手段33は、これら2つのキーワ
ードを双方とも含んでいる文書を文書記録手段31から
取得する。図3に示す文書は、「中国」と「合弁」とい
う2つのキーワードを双方とも含んでいることから、こ
の文書と、これらのキーワードを双方とも含む他の文書
とが検出結果として出力される。なお、以下の処理で
は、簡単のために、図3に示す文書に対する処理につい
てのみ説明する。
【0151】重要単語抽出手段12は、図2の実施の形
態の場合と同様の処理により、重要単語を抽出し、重要
単語リストを生成する。また、重要単語抽出手段12
は、キーワード入力手段32から入力されたキーワード
を、重要単語として重要単語リストに付加する。なお、
この実施の形態では、入力されたキーワードをLeve
l3の重要単語と置換する。従って、得られる重要単語
リストは以下のようになる。
【0152】Level1 富士山紡績、江山紡績 Level2 李白雲紡績廠、絹織物、合弁会社、社
長、子会社 Level3 中国、合弁 関係表生成手段13は、以上の重要単語を含む文の構文
解析を行うことにより、各文の2項関係を抽出し、関係
表を生成する。選択関係生成手段14は、第1の実施の
形態と同様の処理を行うことにより、関係表から所定の
規則に応じて重要な2項関係を抽出し、選択関係表を生
成する。
【0153】補完関係付加手段15は、選択関係表に記
載されている2項関係同士の関係を補完する新たな2項
関係を関係表から選択して選択関係表に付加するととも
に、必須修飾句記録手段17に記録されている対応表を
参照して、必須格となる2項関係を関係表から選択し
て、選択関係表に新たに付加する。
【0154】文合成手段16は、補完関係付加手段15
から供給された選択関係表に記載されている2項関係を
適宜接続することにより文を合成する。この結果得られ
る文を以下に示す。
【0155】富士山紡績は中国の絹織物企業の李白雲紡
績廠と提携。富士山紡績は合弁会社を設立。子会社の江
山紡績(川崎竜之介社長)が三十%出資。
【0156】このような合成文は、例えば、図示せぬ表
示装置に供給され、CRTや印刷用紙に対して表示出力
されることになる。なお、このような処理は、文書検索
手段33によって取得された全ての文書に対して実行さ
れ、検索結果である複数の文書の要約を得ることができ
る。
【0157】以上の実施の形態によれば、複数の文書か
ら、所定のキーワードによって所望の文書を選択しよう
とする場合において、検索結果の文書の要約を作成して
表示するようにしたので、目的となる文書を迅速に見つ
けることが可能となる。また、その場合に、合成される
文中にキーワードを配置するようにしたので、操作者が
うろ覚えの状態で目的となる文書を検索しているような
場合においても、記憶が最も明確な単語を含む文が要約
文として出力されることになるので、出力される文書が
所望のものであるか否かを迅速に判断することが可能と
なる。
【0158】なお、以上の実施の形態においては、入力
されたキーワードをLevel3の重要単語と置換する
ようにしたが、例えば、他のレベルの重要単語と置換し
たり、所定のレベルの重要単語に付加するようにしても
よい。
【0159】また、キーワードのみを重要単語として用
いることも可能である。即ち、重要単語抽出手段12に
よって重要単語を抽出せずに、キーワードとして入力さ
れた単語のみを重要単語とすることも可能である。
【0160】その場合に得られる合成文を以下に示す。
富士山紡績は中国の企業の李白雲紡績廠と提携。富士山
紡績は合弁会社を設立。
【0161】このような方法によっても、充分な要約文
(合成文)を得ることができる。また、第2の実施例と
同様に、重要単語とキーワードの表示形式を変更するよ
うにしてもよい。
【0162】図37は、重要単語には下線を、また、キ
ーワードには上線を付加して表示した表示例である。こ
のようにして表示することにより、合成された文中のど
こにキーワードが配置されているかを迅速に知ることが
可能となる。
【0163】更にまた、キーワード入力手段32から入
力されたキーワードをシーソラス(Thesaurus) 展開して
(入力されたキーワードに対応する類義語を新たなキー
ワードとして)検索処理を行い。取得された文書の要約
を生成する場合において、シーソラス展開によって得ら
れたキーワードを重要単語として追加したり、あるい
は、生成された要約文を表示する場合に、シーソラス展
開によって得られたキーワードの表示形式を変更するよ
うにしてもよい。
【0164】なお、上記の例では、関係表中の一定の条
件を満たした関係を抽出し、選択関係表を生成している
が、選択関係表を用いなくても同様の処理を行うことが
できる。例えば、関係表中の一定の条件を満たした関係
に対し、マークを付ければよい。このような例を第5の
実施の形態として以下に説明する。
【0165】図38は、本発明の第5の実施の形態の構
成例を示す図である。文書入力手段41は、処理の対象
となる文書を入力する機能を備える。この文書入力手段
41から入力された文書47は重要単語抽出手段42に
渡される。
【0166】重要単語抽出手段42は、文書内の各単語
に重要度スコアを与える。スコアの計算方法としてはtf
*IDF積などを用いる。この実施の形態では、全部の単語
を抽出し、抽出した各単語に対して重要度のスコアを与
える。
【0167】関係表生成手段43は、重要単語抽出手段
42によって得られた単語(全部または重要なもののみ
に限定してもよい)を含む文を解析し、単語間の2項関
係を抽出する。解析方法は、構文解析や形態素解析結果
に対するパターンマッチなどがある。解析結果に基づい
て、関係表48を生成する。
【0168】関係選択手段44は、関係表生成手段43
によって生成された関係表48から、重要な単語を含む
2項関係を所定の規則にしたがって抽出し、関係表48
中の関係に重要関係マークを与える。抽出規則として
は、関係を構成する単語の重要度のスコアの合計が一定
値以上のものをスコアの順に並べ、それらの上位から一
定個数までを選択する。また、重要単語の数や、他の重
要関係と同じ文中にあるか否かなどを抽出規則に含めて
もよい。
【0169】補完関係付加手段45は、関係表48中の
重要関係マークが付与された関係群に対して、それらを
補完する新たな関係に選択マークを与える。補完される
ものは、必須格、必須修飾句などである。
【0170】文合成手段46は、関係表のマークのつけ
られた2項関係から、入力された文書47の要約文49
を合成する。次に、第5の実施の形態における動作につ
いて説明する。
【0171】文書入力手段41によって入力された文書
47は、重要単語抽出手段42に渡される。重要単語抽
出手段42は、文書47中に存在する単語全てに重要度
スコアを付与する。ここでは、tf*IDF積を用いるものと
する。なお、全ての単語に対してスコアを付与せずに、
自立語のみに与えるようにしてもよい。また、自立語の
うち、連体詞、副詞、代名詞を除いたものにしてもよ
い。
【0172】全ての単語に対して重要度のスコアが付与
されたら、関係表生成手段43が単語間の2項関係を抽
出し、それらの2項関係にスコア付けする。この例で
は、係り側の単語と受け側の単語とのスコアの合計を、
2項関係に対するスコアとする。係り側あるいは受け側
の名詞が複合名詞の場合、構成要素である名詞のスコア
の合計を複合名詞のスコアとする。スコア付けに関して
は、関係の種別に対してもスコアを与え、係り側単語ス
コア、受け側単語スコア、関係スコアのそれぞれに重み
付けを行い、それらの総和を得る方法もある。計算方法
の例としては、前述の式(1)に示した通りである。そ
して、スコア付けされた2項関係によって、関係表48
を生成する。
【0173】次に、関係選択手段44が、関係表48の
中からスコアの高い順に一定数の重要関係を選択する。
この個数は予め与えるものとする。または、要約の全体
長などを考慮して、その都度計算するようにしてもよ
い。関係選択手段44は、関係表48中の選択された重
要関係に対してマークを付与する。
【0174】補完関係付加手段45と文合成手段46と
は、関係選択手段44で選択された2項関係から、その
時点で最もスコアの高い関係を順次ピックアップし、そ
れらに重要関係を付加し、要約文を合成するプロセスを
繰り返す。
【0175】図39は、第5の実施の形態における要約
文合成処理を示すフローチャートである。[S201]
補完関係付加手段45は、隣接する補完関係をまとめ
る。具体的には、マークの付けられた重要関係を1つピ
ックアップする。そして、以下の条件を満たす重要関係
を、ピックアップした重要関係に接続する。
【0176】(1)距離0:重要関係中のどちらかの要
素に対して、直接つながっている重要関係。 図40は、距離0の補完関係を示す図である。図中、
「A」の要素51と「B」の要素52との関係が、ピッ
クアップされた重要関係である。なお、この図では、係
り受け関係の係り側から受け側に向かって矢印が示され
ている(図41,42においても同様)。この例では、
「C1」の要素61は、「A」の要素51に直接つなが
っているため、距離0で隣接する補完関係である。ま
た、「C2」、「C3」の要素62,63は、「B」の
要素52に直接つながっているため、距離0で隣接する
補完関係である。
【0177】(2)距離1:重要関係中のどちらかの要
素に対して、1つの基本関係(重要関係としてリストア
ップされなかったもの)を介してつながる重要関係。 図41は、距離1の補完関係を示す図である。この図で
は、基本関係を太い矢印で示している(図42において
も同様)。この例では、「D1」の要素71と「E1」
の要素72とで構成される重要関係は、「E1」の要素
72と「A」の要素51とが基本関係を有しているた
め、距離1で隣接する補完関係である。「D2」の要素
73と「E2」の要素74とで構成される重要関係は、
「E2」の要素74と「B」の要素52とが基本関係を
有しているため、距離1で隣接する補完関係である。
「D3」の要素75と「E3」の要素76とで構成され
る重要関係は、「E3」の要素76と「B」の要素52
とが基本関係を有しているため、距離1で隣接する補完
関係である。「D4」の要素77と「E4」の要素78
とで構成される重要関係は、「D4」の要素77と
「B」の要素52とが基本関係を有しているため、距離
1で隣接する補完関係である。
【0178】(3)距離2:ひとつの要素E(ふたつの
基本関係)を介してつながる重要関係。 図42は、距離2の補完関係を示す図である。この例で
は、「G1」の要素81と「H1」の要素82とで構成
される重要関係は、受け側の要素82が「F」の要素8
0をはさんだ2つの基本関係を介して「B」の要素52
につながるため、距離2で隣接する補完関係である。
「G2」の要素83と「H2」の要素84とで構成され
る重要関係は、係り側の要素83が「F」の要素80を
はさんだ2つの基本関係を介して「B」の要素52につ
ながるため、距離2で隣接する補完関係である。「G
3」の要素85と「H3」の要素86とで構成される重
要関係は、受け側の要素86が「F」の要素80をはさ
んだ2つの基本関係を介して「B」の要素52につなが
るため、距離2で隣接する補完関係である。
【0179】なお、ここでは関係間の距離に応じて3種
類の隣接重要関係をあげたが、これは増減可能である。
一文を短くするためには短い距離のものしか選ばないよ
うにすればよい。一文が長くてもよい場合は距離の大き
いものまで含めるようにする。また、構成要素(単語)の
長さや、生成したときの文長によって、どこまで含める
かをダイナミックに変えてもよい。
【0180】図39に戻り、フローチャートの続きを説
明する。 [S202]補完関係付加手段45は、必須基本関係を
補足する。具体的には、各要素との間で必須格の2項関
係を有する基本関係を加える。必須格は、「は」、
「が」、「を」、「に」、名詞連続とする。そして、関
係表中の必須補足関係に対して、選択マークを付与す
る。 [S203]文合成手段46は、要約文の要素として確
定した関係を、関係表から除去する。すなわち、ステッ
プS201で選択した重要関係と、ステップS202で
使った基本関係を関係表から除去する。 [S204]文合成手段46は、文の合成を行う。具体
的には、もともとあった助動詞、補助動詞、副助詞をつ
なげて文を合成し、合成した文を要約文リストに追加す
る。 [S205]文合成手段46は、要約文リストの文長合
計が一定値を超えたか否かを判断する。要約文リストの
文長合計が一定値を超えたら場合には、ステップS20
1〜S204の繰り返し処理(ループ)を抜け、ステッ
プS206に進む。そうでなければステップS201へ
進み、再度繰り返し処理を行う。
【0181】なお、重要関係が尽きた場合にも繰り返し
処理を抜けステップS206に進むこととする。ただ
し、予め重要関係を多めに選ぶことにより、その終了条
件を避けるものとする。 [S206]文合成手段46は、ステップS204で得
られた要約文を元々の出現順に並べ替える。
【0182】このようにして、要約文が生成され、文合
成手段46が要約文を提示する。次に、具体的な要約文
生成例を示す。図43は、入力文書の例を示す図であ
る。これは、「酒ビスケット」の紹介文である。このよ
うな文書47が、文書入力手段41から重要単語抽出手
段42に渡される。
【0183】ここでは、上記のアルゴリズムを用いて、
実際のKR(キーリレーション関係)抽出データをもと
にして、アルゴリズムのシミュレーションを行う。ま
た、この例では、関係が理想通り抽出されていることを
仮定する。
【0184】まず、重要単語抽出手段42が5個〜10
個の重要関係を選択する。ここでの単語のスコア付けは
tf*IDF積を用いる。本来IDFは、その文書が属するある
文書集合から計算するべきだが、ここでは、毎日新聞1
994年の記事約10万件から1万件をピックアップし
たものを文書集合として計算したものを用いている。こ
れは、Web文書の集合を規定してDFを計算するのが困
難であることと、新聞記事に偏りが少なく、一般に用い
られる単語の頻度と大差ないと判断できるからである。
【0185】次に、関係表生成手段43が、各単語を含
む文を解析し、単語間の2項関係を抽出する。そして、
各2項関係に対するスコアを計算し、関係表が生成され
る。図44は、ピックアップされた関係から生成された
関係表を示す図である。この関係表48には、「関係
名」、「第1の単語群」、「第2の単語群」、「出現
数」、「第1の単語群スコア」、「第2の単語群スコ
ア」、「全体スコア」、及び「マーク」の項目が設けら
れている。
【0186】「関係名」には、2つの単語がどのような
関係にあるのかが示されている。関係名「動た名」は、
第1の単語群が動詞、第2の単語群が名詞であり、
「た」という言葉によって接続されていることを示す。
関係名「形動な名」は、第1の単語群が形容動詞、第2
の単語群が名詞であり、「な」という言葉によって接続
されていることを示す。関係名「に」は、第1の単語群
と第2の単語群とが「に」という言葉によって接続され
ていることを示す。関係名「形い名」は、第1の単語群
が形容詞、第2の単語群が名詞であり、「い」という言
葉によって接続されていることを示す。関係名「複合」
は、第1の単語群に設定されている単語が複合名詞であ
ることを示す。関係名「の名」は、第1の単語群と第2
に単語群とがともに名詞であり、「の」という言葉によ
って接続されていることを示す。関係名「NN」は、第
1の単語群に設定されている単語が、名詞連続であるこ
とを示す。
【0187】「第1の単語群」には、係り側の単語もし
くは単語群が登録される。単語群として登録されるの
は、係り側が複合名詞の場合や、名詞連続の場合であ
る。また、関係名が「複合名詞」や「NN(名詞連
続)」の単語群も、「第1の単語群」の項目に登録され
る。
【0188】「第2の単語群」には、受け側の単語もし
くは単語群が登録される。単語群として登録されるの
は、受け側が複合名詞の場合や、名詞連続の場合であ
る。「出現数」には、入力された文書中に何回出現した
のかが設定される。
【0189】「第1の単語群スコア」は、「第1の単語
群」に設定されている単語群のスコアである。複数の単
語が設定されている場合には、各単語のスコアの合計で
ある。
【0190】「第2の単語群スコア」は、「第2の単語
群」に設定されている単語群のスコアである。「全体ス
コア」は、2項関係全体に対するスコアである。「第1
の単語群スコア」の値と「第2の単語群スコア」の値と
を合計することによって求められる。
【0191】「マーク」は、関係選択手段44によって
選択された重要関係を示すフラグである。この項目に所
定のマークが登録されていれば、重要な関係として選択
されたことを示す。関係表生成手段43によって関係表
が生成された直後の段階では、重要関係の選択は行われ
ていない。
【0192】なお、この図では、「全体スコア」の高い
順に重要関係が並べられている。このような関係表が生
成されると、関係選択手段44によって全体スコアの高
い重要関係が一定数選択される。
【0193】図45は、重要関係選択後の関係表を示す
図である。このように、関係選択手段44によって選択
された2項関係に対して、「○」のマークが付与されて
いる。
【0194】次に、補完関係付加手段45と文合成手段
46とによって、図39に示した処理が行われる。ま
ず、1回目のループについて説明する。
【0195】ステップS201において、補完関係付加
手段45が、全体スコアがもっとも高い重要関係を選択
する。ここで選択する重要関係は、 ● こめ−た−酒,ビスケットである。そして、隣接す
る重要関係をまとめる。隣接する重要関係は、 ● 風雅な−酒,ビスケットである。この重要関係は、
「風雅」という単語が「酒,ビスケット」に直接接続さ
れているため、距離0の隣接関係である。
【0196】ステップS202において、必須格を持つ
基本関係を補足する。この例では「こめ」に対して、
「を格」の追加をする。その結果、 ●ロマン−を−こめの基本関係が追加される。関係表4
8中のこの基本関係に対して、選択マークを付与する。
【0197】ステップS203において、文合成手段4
6により、重要関係が除去される。ここで用いた3つの
関係がリストから除去される。ステップS204におい
て、文合成手段46により文が合成される。この1回目
のループで得られる表現は、「ロマンをこめた風雅な酒
ビスケット」となる。
【0198】以後、同様にループを進める。2回目のル
ープでは、 重要関係:「五合,升−に−納め」 隣接する重要関係:なし 必須格補足:なし(「納め−て−お納めします」) 表層表現:「五合升に納めて」 が得られる。
【0199】3回目のループでは 重要関係:「高(い)−特選,吟醸,酒」 隣接する重要関係:なし 必須格補足:「香り(が)高い」 表層表現:「香り高い特選吟醸酒」 関係を5つとった場合はここで終わりとなる。
【0200】4回目のループでは 重要関係:「神奈川−の−洋菓子,ウエダ」 隣接する重要関係:なし 必須格補足:「ウエダが−創作(した)」 表層表現:「神奈川の洋菓子ウエダが創作した」 5回目のループでは 重要関係:「ビスケット生地を−浸し」 隣接する重要関係:「銘酒−の−香り」 (「香り−に−浸し」(全体スコア、11位)を介して
つながっている) 必須格補足:なし 表層表現は「ビスケット生地を銘酒の香りに浸しまし
た」である。
【0201】以上でピックアップした関係は、次のよう
になる。 「ロマンをこめた風雅な酒ビスケット」 「五合升に納めて」 「香り高い特選吟醸酒」 「神奈川の洋菓子ウエダが創作した」 「ビスケット生地を銘酒の香りに浸しました」 抽出された文を、元の文書における出現順に並べ直すこ
とで、要約文が生成される。
【0202】図46は、生成された要約文を示す図であ
る。このような要約文が文合成手段46から出力され
る。以上のように、関係表に対して選択された旨のマー
クを付与しておけば、選択関係表を別途設けなくてもよ
くなる。
【0203】次に、第6の実施の形態について説明す
る。第6の実施の形態では、要約文として使用すること
が決定した関係を削除するのではなく、スコアを落とし
た状態で存続させておく。
【0204】図47は、第6の実施の形態の構成例を示
す図である。この図において、文書入力手段41と重要
単語抽出手段42については、第5の実施の形態の同名
の構成要素を同じ機能を有しているため、図39の同名
の構成要素と同じ符号を付して説明を省略する。
【0205】関係表生成手段43aは、基本的に第5の
実施の形態の関係表生成手段43(図39に示す)と同
じ機能を有しているとともに、さらに次の機能を有して
いる。すなわち、文合成手段46aより再スコアリング
要求を受けると、要約文として選択された単語のスコア
を下げ、関係表のスコアに関する値を再計算する。
【0206】関係選択手段44aは、関係表生成手段4
3aによって関係表が生成されたとき、及び関係表生成
手段43aによって再スコアリングが行われたときに、
その時点で最も全体スコアの高い重要関係を選択する。
【0207】補完関係付加手段45aは、関係選択手段
44aが選択した関係に対する必須関係を追加する。文
合成手段46aは、関係選択手段44aが選択した関係
と、補完関係付加手段45aによって付加された必須関
係とに基づいて、表層文を生成する。そして、表層文全
体の長さが閾値を超えていなければ、再スコアリング要
求を関係表生成手段43aに送る。再スコアリング要求
には、新たに追加された表層文を構成する単語の情報が
含まれる。表層文全体の長さが閾値を超えていれば、生
成されている表層文を、元の文書47への出現順に並
べ、要約文49aを生成する。
【0208】次に、第6の実施の形態による要約文の生
成手順を説明する。なお、関係表生成までのアルゴリズ
ムは第5の実施の形態と同様である。そこで、関係表生
成後の処理について以下に説明する。
【0209】図48は、第6の実施形態における要約文
合成処理を示すフローチャートである。 [S211]関係表が生成されたら、関係選択手段44
aが重要度スコアの最も高い2項関係を1つだけ選択す
る。 [S212]補完関係付加手段45aが、必須関係を追
加する。初期段階では、「が」、「は」、「を」、
「に」など固定的なものとする。なお、ここでは予め重
要関係を抜き出していないので、隣接重要関係を補完す
るステップはない。 [S213]補完関係付加手段45aが、関係の補充
(曖昧性の保存)を行う。「A→BのC」のような形態
の場合であって「A→B」または「A→C」のみが抽出
されている場合は、関係「BのC」を加える。 [S214]文合成手段46aは、枝数などをカウン
ト、または、表層文生成を仮適用して表層文全体の長さ
が、予め設定してある閾値を超えたか否かを判断する。
閾値を超えた場合にはステップS216に進み繰り返し
処理(ループ)を抜ける。そうでなければステップS2
15に進む。 [S215]関係表生成手段43aは、再スコアリング
を行う。すなわち、使った単語のスコアを落とす。ここ
では各単語のスコアを1/5にしている。その後、新し
い単語のスコアから新しい関係のスコアを再計算する。
その後ステップS211の重要関係の選択に戻り、新し
くスコアが最大になった関係を選択するところからこの
手順を繰り返す。 [S216]文合成手段46aは、要約表層文を生成
し、列挙する。この際に、出現順に並べ直すことにより
要約文を生成する。そして、処理を終了する。
【0210】次に、具体的な要約文の生成例について説
明する。1回目のループでの処理を、図43で示したサ
ンプルの文書47を通して説明する。
【0211】ステップS211では、関係選択手段44
aが、重要度スコアのもっとも高い2項関係を選択す
る。ここでは ● こめ(た)−酒,ビスケットが選択される。このと
き、関係選択手段44aは、関係表中の選択した重要関
係のマークを「1−C」とする。このマークは、第1回
目のループで得られるコアの関係(ステップS211で
選択された重要関係)であることを意味している。
【0212】ステップS212では、補完関係付加手段
45aにより、必須関係が付与される。ここでは、「こ
める」の「を」格 ● ロマン−を−こめたが付与される。そして、補完関
係付加手段45aは、関係表中の必須格を持つ基本関係
に対して、「1−A」のマークを付与する。このマーク
は、第1回目のループで得られる付加関係(ステップS
212で付加された基本関係)であることを意味してい
る。
【0213】ステップS213では、補完関係付加手段
45aにより、曖昧性の保存が行われる。「A→Bの
C」のような形態の場合で「A→B」または「A→C」
のみが抽出されている場合は、関係「BのC」を加え
る。ここでは、該当する例はない。
【0214】ステップS214では、文合成手段46a
によって、終了条件を満たしたか否かが判断される。こ
の段階では、枝数2、要約文字数は13(「ロマンをこ
めた酒ビスケット」)であり、まだ終了条件を満たして
いないものとする。
【0215】ステップS215では、関係表生成手段4
3aにより、再スコアリングが行われる。すなわち、使
った単語のスコアを落とし、新しい単語のスコアから新
しい関係のスコアを再計算する。
【0216】図49は、1回目のループ終了後の関係表
を示す図である。この関係表48aでは、1回目のルー
プで選択された重要関係である「こめ−た−酒−ビスケ
ット」には「1−C」のマークが付与されている。そし
て、この重要関係に含まれる単語「こめ」、「酒」、
「ビスケット」のスコアが1/5にされ、関係表のスコ
アが再計算されている。その結果、最初に1位だった
「こめ−た−酒−ビスケット」と、「風雅−な−酒−ビ
スケット」のスコアは、それぞれ「5.15/5+9.68/5=2.9
7」、「4+9.68/5=5.94」となっている。図中、下線が引
かれているのが、値の変更されたスコアである。このた
め、最初は3位のスコアだった「五合升−に−納め
(て)」(スコア13.44)が最大のスコアとなる。
【0217】2回目以降も同様な操作を続ける。ここで
は、あらかじめ終了条件を決めずに何回か繰り返してみ
る。2回目のループを行う。全体スコアが「13.4
4」である「五合升−に−納め(て)」が選択され、枝
数は3となり、要約文字数は7文字追加で22となる。
【0218】図50は、2回目のループ終了後の関係表
を示す図である。この関係表48aでは、新たに「五合
升−に−納め(て)」に対して「2−C」のマークが付
与されている。
【0219】3回目のループを行う。「高い−特選,吟
醸,酒」が選択され、「香り−高い」が追加される。表
層表現は「香り−高い−特選,吟醸,酒」である。枝数
は5となり、要約文字数は9文字追加で29となる。
【0220】図51は、3回目のループ終了後の関係表
を示す図である。この関係表48aでは、新たに「高い
−特選,吟醸,酒」に対して「3−C」のマークが付与
されている。また、図示されていないが、「香り−高
い」の基本関係に対して「3−A」のマークが付与され
ている。
【0221】4回目のループを行う。「神奈川−の−洋
菓子,ウエダ」が選択され、「ウエダが−創作(し
た)」が追加される。枝数は7となり、要約文字数は1
5文字追加で42となる。
【0222】最終的に得られる要約は、 「ロマンをこめた酒ビスケット」 「五合升−に−納めて」 「香り−高い−特選,吟醸,酒」 「神奈川−の−洋菓子,ウエダ ウエダが−創作した」 である。この表層文を、元文書での出現順に並べ替える
ことで、要約文が生成される。図52は、第6の実施の
形態によって生成された要約文49aを示す図である。
【0223】ところで、上記の例では、重要語の関係を
関係表によって管理していたが、関係表に替えて解析木
を用いることもできる。そして、解析木に対してマーク
を付けることができる。
【0224】図53は、マーク付けが行われた解析木を
示す図である。これは、第6の実施の形態において1回
目のループが終了した時点での解析木を示している。こ
の図において、太い線で結ばれた単語は、選択された2
項関係であることを示している。また、その線の近傍に
示された記号は、選択マークを示している。マークの意
味は、第6の実施の形態と同様である。太線の矩形で囲
まれた単語は、選択された単語を示している。
【0225】このように、解析木にマークを施すことに
よって、要約文を構成する関係を抽出していくことがで
きる。なお、上記の処理機能は、コンピュータによって
実現することができる。その場合、文書要約装置が有す
べき機能の処理内容は、コンピュータで読み取り可能な
記録媒体に記録されたプログラムに記述されており、こ
のプログラムをコンピュータで実行することにより、上
記処理がコンピュータで実現される。
【0226】コンピュータで読み取り可能な記録媒体と
しては、磁気記録装置や半導体メモリ等がある。市場に
流通させる場合には、CD−ROM(Compact Disk Read
Only Memory) やフロッピーディスク等の可搬型記録媒
体にプログラムを格納して流通させたり、ネットワーク
を介して接続されたコンピュータの記憶装置に格納して
おき、ネットワークを通じて他のコンピュータに転送す
ることもできる。
【0227】コンピュータで実行する際には、コンピュ
ータ内のハードディスク装置等にプログラムを格納して
おき、メインメモリにロードして実行する。
【0228】
【発明の効果】以上説明したように本発明では、文書入
力手段からは、処理の対象となる文書を入力し、重要単
語抽出手段は、文書入力手段から入力された文書から、
重要な単語を抽出し、関係表生成手段は、重要単語抽出
手段によって抽出された重要な単語を含む文の構造を解
析し、その文に含まれている単語同士の2項関係を解析
して関係表を生成し、関係選択手段は、関係表生成手段
によって生成された関係表から、重要な単語を含む2項
関係を所定の規則に従って選択し、文合成手段は、関係
選択手段によって選択された2項関係から文を合成する
ようにしたので、入力された文書から短くて的確な要約
を作成することが可能となる。
【図面の簡単な説明】
【図1】 本発明の文書要約装置の原理を説明する原理
図である。
【図2】 本発明の第1の実施の形態の構成例を示す図
である。
【図3】 図2に示す実施の形態において処理される文
書の一例である。
【図4】 図2に示す重要単語抽出手段によって、図3
に示す文書から抽出された重要単語リストの一例を示す
図である。
【図5】 図2に示す関係表生成手段によって、重要単
語が含まれている文に対して構文解析がなされた場合に
得られる結果の一例を示す図である。
【図6】 図5に示す構文解析の結果得られる関係表の
一例を示す図である。
【図7】 図3に示す文書に対して付与された文番号の
一例を示す図である。
【図8】 図2に示す実施の形態において実行される処
理の一例を説明するフローチャートである。
【図9】 図8に示す「重要単語を含む2項関係の抽出
処理」の一例を説明するフローチャートである。
【図10】 図8に示す「直接関係の探索処理」の一例
を説明するフローチャートである。
【図11】 図10に示す処理の結果生成される選択関
係表の一例を示す図である。
【図12】 図9に示す「同じ文にある関係の探索処
理」の一例を説明するフローチャートである。
【図13】 図12に示す処理の結果生成される選択関
係表の一例を示す図である。
【図14】 図9に示す「主要格の探索処理」の一例を
示すフローチャートである。
【図15】 主要格リストの一例である。
【図16】 生成される選択関係表の一例を示す図であ
る。
【図17】 生成される選択関係表の一例を示す図であ
る。
【図18】 追加される2項関係を示す図である。
【図19】 図8に示す「必須格の補足処理」の結果生
成される選択関係表の一例を示す図である。
【図20】 図8に示す「表層句の生成処理」の一例を
説明するフローチャートである。
【図21】 図20に示す「選択されたアークの係り側
のノードに対する探索処理」の一例を説明するフローチ
ャートである。
【図22】 図20に示す「選択されたアークの受け側
のノードに対する探索処理」の一例を説明するフローチ
ャートである。
【図23】 図20に示す処理によって、選択関係表に
記載されている2項関係が合成されて得られた文の一例
を示す図である。
【図24】 図20に示す処理によって、選択関係表に
記載されている2項関係が合成されることによって得ら
れた文の他の一例を示す図である。
【図25】 図20に示す処理によって、選択関係表に
記載されている2項関係が合成されることによって得ら
れた文の更に他の一例を示す図である。
【図26】 図2に示す実施の形態において処理される
文書の一例を示す図である。
【図27】 図26に示す文書から抽出された重要単語
の一例を示す図である。
【図28】 図26に示す文書から合成された文の一例
を示す図である。
【図29】 図2に示す実施の形態において処理される
文書の一例を示す図である。
【図30】 図29に示す文書から抽出された重要単語
の一例を示す図である。
【図31】 図29に示す文書から合成された文の一例
を示す図である。
【図32】 本発明の第2の実施の形態の構成例を示す
図である。
【図33】 図32に示す実施の形態において図3に示
す文書を処理した結果、表示装置に表示される文の表示
例を示す図である。
【図34】 図32に示す実施の形態において図3に示
す文書を処理した結果、表示装置に表示される文の他の
表示例を示す図である。
【図35】 本発明の第3の実施の形態の構成例を示す
図である。
【図36】 本発明の第4の実施の形態の構成例を示す
図である。
【図37】 図36に示す実施の形態において図3に示
す文書を処理した結果、表示装置に表示される文の表示
例を示す図である。
【図38】 本発明の第5の実施の形態の構成例を示す
図である。
【図39】 第5の実施の形態における要約文合成処理
を示すフローチャートである。
【図40】 距離0の補完関係を示す図である。
【図41】 距離1の補完関係を示す図である。
【図42】 距離2の補完関係を示す図である。
【図43】 入力文書の例を示す図である。
【図44】 ピックアップされた関係から生成された関
係表を示す図である。
【図45】 重要関係選択後の関係表を示す図である。
【図46】 生成された要約文を示す図である。
【図47】 本発明の第6の実施の形態の構成例を示す
図である。
【図48】 第6の実施の形態における要約文合成処理
を示すフローチャートである。
【図49】 1回目のループ終了後の関係表を示す図で
ある。
【図50】 2回目のループ終了後の関係表を示す図で
ある。
【図51】 3回目のループ終了後の関係表を示す図で
ある。
【図52】 第6の実施の形態によって生成された要約
文を示す図である。
【図53】 マーク付けが行われた解析木を示す図であ
る。
【符号の説明】
1 文書入力手段 2 重要単語抽出手段 3 関係表生成手段 4 選択関係生成手段 5 補完関係付加手段 6 文合成手段 11 文書入力手段 12 重要単語抽出手段 13 関係表生成手段 14 選択関係生成手段 15 補完関係付加手段 16 文合成手段 17 必須修飾句記録手段 21 重要単語数制限手段 22 表示形式変更手段 23 表示装置 25 選択関係表生成手段 31 文書記録手段 32 キーワード入力手段 33 文書検索手段

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 入力された文書の要約を作成して出力す
    る文書要約装置において、 処理の対象となる文書が入力される文書入力手段と、 前記文書入力手段から入力された文書から、重要な単語
    を抽出する重要単語抽出手段と、 前記重要単語抽出手段によって抽出された重要な単語を
    含む文の構造を解析し、その文に含まれている単語同士
    の2項関係を解析して関係表を生成する関係表生成手段
    と、 前記関係表生成手段によって生成された関係表から、重
    要な単語を含む2項関係を所定の規則に従って選択する
    関係選択手段と、 前記関係選択手段によって選択された2項関係から文を
    合成する文合成手段と、 を有することを特徴とする文書要約装置。
  2. 【請求項2】 前記関係選択手段は、選択した2項関係
    を抽出し、選択した2項関係から選択関係表を生成する
    ことにより、選択した2項関係を明示することを特徴と
    する請求項1記載の文書要約装置。
  3. 【請求項3】 前記関係選択手段は、前記関係表中の選
    択した2項関係に対して選択マークを付与することによ
    り、選択した2項関係を明示することを特徴とする請求
    項1記載の文書要約装置。
  4. 【請求項4】 前記関係選択手段は、前記関係表から、
    係り側と受け側の双方が重要な単語である2項関係と、 係り側または受け側の何れかが重要な単語であり、か
    つ、それらが共に1つの文中に含まれている2項関係
    と、 係り側または受け側の何れかが重要な単語であり、か
    つ、それらの一方が主要格である2項関係と、を選択す
    ることを特徴とする請求項1記載の文書要約装置。
  5. 【請求項5】 前記関係選択手段は、前記関係表に含ま
    れている2項関係のそれぞれのスコアを算出し、そのス
    コアに応じて選択すべき2項関係を決定することを特徴
    とする請求項1記載の文書要約装置。
  6. 【請求項6】 前記選択関係表に含まれている2項関係
    を補完する新たな2項関係を前記関係表から選択する補
    完関係付加手段をさらに有し、 前記文合成手段は、前記関係選択手段と前記補完関係付
    加手段とによって選択された2項関係から文を合成する
    ことを特徴とする請求項1記載の文書要約装置。
  7. 【請求項7】 前記補完関係付加手段は、文の孤立した
    2項関係と、文の主要な2項関係とを結ぶ新たな2項関
    係を前記関係表から選択することを特徴とする請求項6
    記載の文書要約装置。
  8. 【請求項8】 前記補完関係付加手段は、文の孤立した
    2項関係と、文の主要な2関係とを結ぶ新たな2項関係
    を前記関係表から選択し、選択した2項関係から所定の
    個数の2項関係のみを更に選択することを特徴とする請
    求項6記載の文書要約装置。
  9. 【請求項9】 各単語に必須な修飾句の種類を記録する
    必須修飾句記録手段を更に有し、 前記補完関係付加手段は、前記必須修飾句記録手段に記
    録されている情報を参照して、新たな2項関係を選択す
    ることを特徴とする請求項6記載の文書要約装置。
  10. 【請求項10】 前記文合成手段は、前記関係選択手段
    で選択された所定の2項関係の係り側または受け側と同
    一の単語を受け側または係り側に有する他の2項関係を
    相互に連結することにより文を合成することを特徴とす
    る請求項1記載の文書要約装置。
  11. 【請求項11】 前記重要単語抽出手段が抽出する重要
    な単語の数を制限する重要単語数制限手段を更に有する
    ことを特徴とする請求項1記載の文書要約装置。
  12. 【請求項12】 前記文合成手段によって合成された文
    に含まれている重要な単語を表示装置に表示させる際
    に、その表示形式を変更する表示形式変更手段を更に有
    することを特徴とする請求項1記載の文書要約装置。
  13. 【請求項13】 キーワードが入力されるキーワード入
    力手段を更に有し、前記関係表生成手段は、前記重要単
    語抽出手段によって抽出された重要な単語か、前記キー
    ワード入力手段から入力されたキーワードの何れかを含
    む文の構造を解析し、その文に含まれている単語同士の
    2項関係を解析して関係表を生成することを特徴とする
    請求項1記載の文書要約装置。
  14. 【請求項14】 前記文書入力手段から入力された処理
    の対象となる複数の文書を記録する文書記録手段と、 前記キーワード入力手段から入力されたキーワードを含
    む文書を前記文書記録手段から検索する文書検索手段と
    を更に有し、 前記関係表生成手段は、前記キーワード入力手段から入
    力されたキーワードを含む文の構造を解析し、その文に
    含まれている単語同士の2項関係を解析して各文書単位
    で関係表を生成することを特徴とする請求項1記載の文
    書要約装置。
  15. 【請求項15】 前記文書入力手段から入力された処理
    の対象となる複数の文書を記録する文書記録手段と、 前記キーワード入力手段から入力されたキーワードを含
    む文書を前記文書記録手段から検索する文書検索手段と
    を更に有し、 前記重要単語抽出手段は、前記文書検索手段によって検
    索された各文書に含まれている重要単語を抽出し、 前記関係表生成手段は、前記重要単語抽出手段によって
    抽出された重要な単語か、前記キーワード入力手段から
    入力されたキーワードの何れかを含む文の構造を解析
    し、その文に含まれている単語同士の2項関係を解析し
    て各文書単位で関係表を生成することを特徴とする請求
    項1記載の文書要約装置。
  16. 【請求項16】 入力された文書の要約を作成して出力
    する文書要約プログラムを記録したコンピュータ読み取
    り可能な記録媒体において、 処理の対象となる文書が入力される文書入力手段、 前記文書入力手段から入力された文書から、重要な単語
    を抽出する重要単語抽出手段、 前記重要単語抽出手段によって抽出された重要な単語を
    含む文の構造を解析し、その文に含まれている単語同士
    の2項関係を解析して関係表を生成する関係表生成手
    段、 前記関係表生成手段によって生成された関係表から、重
    要な単語を含む2項関係を所定の規則に従って選択する
    関係選択手段、 前記関係選択手段によって選択された2項関係から文を
    合成する文合成手段、 としてコンピュータを機能させる文書要約プログラムを
    記録したコンピュータ読み取り可能な記録媒体。
JP35729698A 1998-01-27 1998-12-16 文書要約装置、および記録媒体 Expired - Fee Related JP3817943B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP35729698A JP3817943B2 (ja) 1998-01-27 1998-12-16 文書要約装置、および記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP10-13961 1998-01-27
JP1396198 1998-01-27
JP35729698A JP3817943B2 (ja) 1998-01-27 1998-12-16 文書要約装置、および記録媒体

Publications (2)

Publication Number Publication Date
JPH11282881A true JPH11282881A (ja) 1999-10-15
JP3817943B2 JP3817943B2 (ja) 2006-09-06

Family

ID=26349821

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35729698A Expired - Fee Related JP3817943B2 (ja) 1998-01-27 1998-12-16 文書要約装置、および記録媒体

Country Status (1)

Country Link
JP (1) JP3817943B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006128238A1 (en) * 2005-06-02 2006-12-07 Newsouth Innovations Pty Limited A method for summarising knowledge from a text
JP2007188225A (ja) * 2006-01-12 2007-07-26 Yafoo Japan Corp 要約文抽出システム
JP2009193436A (ja) * 2008-02-15 2009-08-27 Dainippon Printing Co Ltd 着眼点抽出装置
CN111339754A (zh) * 2020-03-04 2020-06-26 昆明理工大学 基于案件要素句子关联图卷积的案件舆情摘要生成方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02112069A (ja) * 1988-10-21 1990-04-24 Hitachi Ltd 自動要約方式
JPH02112068A (ja) * 1988-10-21 1990-04-24 Hitachi Ltd テキスト簡略表示方式
JPH02257266A (ja) * 1989-02-06 1990-10-18 Teremateiiku Kokusai Kenkyusho:Kk 抄録文作成装置
JPH04156663A (ja) * 1990-10-20 1992-05-29 Fujitsu Ltd 文章圧縮装置
JPH05101120A (ja) * 1991-10-04 1993-04-23 Oki Electric Ind Co Ltd 文章抄録生成装置
JPH05233689A (ja) * 1992-02-18 1993-09-10 Nippon Telegr & Teleph Corp <Ntt> 文書自動要約方法
JPH06259424A (ja) * 1993-03-02 1994-09-16 Ricoh Co Ltd 文書表示装置及び文書要約装置並びにディジタル複写装置
JPH08129554A (ja) * 1994-05-25 1996-05-21 Fuji Xerox Co Ltd 関係表現抽出装置および関係表現検索装置
JPH08212228A (ja) * 1995-02-02 1996-08-20 Sanyo Electric Co Ltd 要約文作成装置および要約音声作成装置
JPH08255172A (ja) * 1995-03-16 1996-10-01 Toshiba Corp 文書検索システム

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02112069A (ja) * 1988-10-21 1990-04-24 Hitachi Ltd 自動要約方式
JPH02112068A (ja) * 1988-10-21 1990-04-24 Hitachi Ltd テキスト簡略表示方式
JPH02257266A (ja) * 1989-02-06 1990-10-18 Teremateiiku Kokusai Kenkyusho:Kk 抄録文作成装置
JPH04156663A (ja) * 1990-10-20 1992-05-29 Fujitsu Ltd 文章圧縮装置
JPH05101120A (ja) * 1991-10-04 1993-04-23 Oki Electric Ind Co Ltd 文章抄録生成装置
JPH05233689A (ja) * 1992-02-18 1993-09-10 Nippon Telegr & Teleph Corp <Ntt> 文書自動要約方法
JPH06259424A (ja) * 1993-03-02 1994-09-16 Ricoh Co Ltd 文書表示装置及び文書要約装置並びにディジタル複写装置
JPH08129554A (ja) * 1994-05-25 1996-05-21 Fuji Xerox Co Ltd 関係表現抽出装置および関係表現検索装置
JPH08212228A (ja) * 1995-02-02 1996-08-20 Sanyo Electric Co Ltd 要約文作成装置および要約音声作成装置
JPH08255172A (ja) * 1995-03-16 1996-10-01 Toshiba Corp 文書検索システム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006128238A1 (en) * 2005-06-02 2006-12-07 Newsouth Innovations Pty Limited A method for summarising knowledge from a text
JP2007188225A (ja) * 2006-01-12 2007-07-26 Yafoo Japan Corp 要約文抽出システム
JP2009193436A (ja) * 2008-02-15 2009-08-27 Dainippon Printing Co Ltd 着眼点抽出装置
CN111339754A (zh) * 2020-03-04 2020-06-26 昆明理工大学 基于案件要素句子关联图卷积的案件舆情摘要生成方法
CN111339754B (zh) * 2020-03-04 2022-06-21 昆明理工大学 基于案件要素句子关联图卷积的案件舆情摘要生成方法

Also Published As

Publication number Publication date
JP3817943B2 (ja) 2006-09-06

Similar Documents

Publication Publication Date Title
JP3879321B2 (ja) 文書要約装置、文書要約方法及び文書要約プログラムを記録した記録媒体
US20070033179A1 (en) Contextual searching
US5761666A (en) Document retrieval system
WO2009063925A1 (ja) 文書管理・検索システムおよび文書の管理・検索方法
Kallimani et al. Summarizing news paper articles: experiments with ontology-based, customized, extractive text summary and word scoring
Jung et al. A scalable hybrid approach for extracting head components from web tables
JP2572314B2 (ja) キーワード抽出装置
JP3594701B2 (ja) キーセンテンス抽出装置
Belkebir et al. TALAA-ATSF: a global operation-based arabic text summarization framework
JP3612769B2 (ja) 情報検索装置および情報検索方法
JPH11282881A (ja) 文書要約装置および記録媒体
JP4499179B1 (ja) 端末装置
JP5439028B2 (ja) 情報検索装置、情報検索方法、およびプログラム
JP4378106B2 (ja) 文書検索装置、文書検索方法及びプログラム
JP4389102B2 (ja) 技術文献検索システム
Kian et al. An efficient approach for keyword selection; improving accessibility of web contents by general search engines
Moulay Lakhdar et al. Building an extractive Arabic text summarization using a hybrid approach
JP3489326B2 (ja) テーブル生成方法
JPH1145252A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
Taghva et al. Farsi searching and display technologies
JP2004334382A (ja) 構造化文書要約装置、プログラムおよび記録媒体
Bas et al. Towards word sense disambiguation of Polish
JPH1173422A (ja) 類似文書検索システムおよびそれに用いる記憶媒体
JPH1145255A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2006053907A (ja) 情報抽出方法、情報抽出装置、情報抽出プログラム及び情報抽出プログラムが記載された記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050802

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051115

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060112

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060214

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060410

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060421

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060523

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060605

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100623

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110623

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110623

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120623

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130623

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130623

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140623

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees