JP3614648B2 - 文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP3614648B2
JP3614648B2 JP06324598A JP6324598A JP3614648B2 JP 3614648 B2 JP3614648 B2 JP 3614648B2 JP 06324598 A JP06324598 A JP 06324598A JP 6324598 A JP6324598 A JP 6324598A JP 3614648 B2 JP3614648 B2 JP 3614648B2
Authority
JP
Japan
Prior art keywords
document
sentence
paragraph
importance
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06324598A
Other languages
English (en)
Other versions
JPH11259521A (ja
Inventor
信一郎 西澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP06324598A priority Critical patent/JP3614648B2/ja
Priority to US09/256,190 priority patent/US6537325B1/en
Publication of JPH11259521A publication Critical patent/JPH11259521A/ja
Application granted granted Critical
Publication of JP3614648B2 publication Critical patent/JP3614648B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は文書理解支援装置、要約文生成方法、並びに文書理解支援プログムを記録したコンピュータ読み取り可能な記録媒体に係り、文書の内容を把握する手助けとなる要約文を生成し管理する文書理解支援装置、要約文生成方法、並びに文書理解支援プログムを記録したコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】
従来より、利用者が文書の内容を把握する手助けとなる情報を提供する機能として、その文書の内容を良く表している文章を抽出し、要約として表示したり保存するシステムが提案されている。
例えば特開平3−191475号公報には、文書を見出しの付いた段落単位に分割し、段落の種類に対応した重要文抽出規則群を段落毎に選択し、これと段落の種類に依存しない重要文抽出規則群の双方を参照して各段落における重要文を抽出し、各段落で抽出された重要文と各段落の見出しの対の集合を文書全体の重要部分と判定し要約として出力することが記載されている。
【0003】
また、特開平2−254566号公報には、文書の構文解析を行って得られる形式的な段落構造を最小単位とし、新出語率と用語類似度を用いて形式的な段落構造をまとめてできる範囲を意味段落としてとらえ、更に、使用度数の他7種類の統計量を用いて重要語及び重要文を抽出し、これらから文書の抄録を得ることが記載されている。
【0004】
また、特開昭63−298563号公報には、文章の形式、内容を参考にしてユーザが文章の要約範囲を指定し、各部分に対して要約処理方法を指定して、要約処理部で各分割部分の要約を行い、これを所定の順序でまとめ要約文章として出力することが記載されている。
【0005】
【発明が解決しようとする課題】
従来の特開平3−191475号公報に記載のものでは、文書を見出しで区切られた段落構造に分けて各段構造の見出しに書かれている内容から種類を判定し重要文抽出の規則を選択しており、各段落の種類に依存した意味で重要な文を抽出し段落の見出しと対応付けて表示するため、この表示内容は元の文書の流れに沿ったものとなる。このため、元の文書の流れとは違った視点から文書内容を確認するができないという問題があった。また、要約の文章から元の文書の内容を参照することはできず、使い勝手が悪いという問題があった。
【0006】
また、特開平2−254566号公報に記載のものは、文書の構文解析を行って得られる形式的な段落構造を最小単位とするため、規則群や解析システムを準備しなければならず、システム全体の規模が大きくなり、処理に長時間を要する。また、意味段落に分割するために新出語率と用語類似度を算出し、重要語及び重要文を抽出するために使用度数の他7種類の統計量を算出しており、このために多大の計算量及び計算時間が必要となるという問題があった。
【0007】
また、特開昭63−298563号公報に記載のものは、文章の要約範囲の指定及び各部分の要約処理方法の指定はユーザが行っており、全て自動で要約を作成することができないという問題があった。
本発明は、上記の点に鑑みなされたもので、システム規模が小さく処理時間が短くて済み、ガイド表示の抜粋文から元の文書の内容を参照することができ、文書を理解するための支援を効果的に行うことができる文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体を提供することを目的とする。
【0008】
【課題を解決するための手段】
請求項1に記載の発明は、記憶装置に格納されている文書ファイルから指定されたファイルの文書を、前記文書での出現頻度が高く集中して出現する度合いである重要度が高い重要語を抽出し、前記重要語が連続して出現する領域の先頭及び末尾の文章にポイントを与え、かつ、前記文書内の話題の転換を促す語で始まる文章にポイントを与え、かつ、前記文書内の話題のつながりを促す語で始まる文章のポイントを減じるポイント手段と、
前記ポイント手段で与えられたポイントの合計値が所定値を超えた位置を前記文書の内容を反映した段落構造である意味段落の区切りとして分割する意味段落解析手段と、
前記意味段落解析手段により文書を分割した意味段落毎に名詞の出現回数から名詞毎の重要度を決定して重要度の高い名詞を各意味段落の重要語と決定し、該各意味段落の重要語の集合をまとめて文書全体の重要語を作成し、重要度保存域に保存する手段と、
前記重要度保存域に保存されている名詞の重要度から前記意味段落毎に意味段落に含まれる各文章の重要度を算出して重要度の高い文章を抜粋文として抽出する抜粋文抽出手段とを有する。
【0009】
このように、文書での出現頻度が高く集中して出現する度合いである重要度が高い重要語を抽出し、重要語が連続して出現する領域の先頭及び末尾の文章にポイントを与え、かつ、文書内の話題の転換を促す語で始まる文章にポイントを与え、かつ、文書内の話題のつながりを促す語で始まる文章のポイントを減じ、ポイントの合計値が所定値を超えた位置を意味段落の区切りとすることにより、話題の範囲毎の意味段落を効率的に見つけることができ、文書をその内容を反映した段落構造である意味段落の区切りとして分割し、分割した意味段落毎に意味段落に含まれる各文章の重要度を算出して重要度の高い文章を抜粋文として抽出し、意味段落単位で表示するため、文書の構文解析を必要とせず、抜粋文を得るための統計量が少ないので、小さなシステム規模で、かつ、短い処理時間で文書理解を支援することができる。
請求項2に記載の発明は、請求項1記載の文書理解支援装置において、
前記ポイント手段は、さらに、
複数ファイルで前記文書が構成されているとき、各ファイルの区切りの直後の文章にポイントを与え、かつ、前記文書内の見出しの段落の直後の文章にポイントを与える。
このように、ファイルの区切りの直後の文章にポイントを与えることにより、複数ファイルで構成された文書での話題の範囲毎の意味段落を確実に見つけることができ、文書内の見出しの段落の直後の文章にポイントを与えることにより、話題の範囲毎の意味段落を確実に簡単に見つけることができる。
【0010】
請求項に記載の発明は、請求項1または2記載の文書理解支援装置において、
前記抜粋文を意味段落単位で表示する抜粋文表示手段を有する。
このように、抜粋文を意味段落単位で表示することにより、文書理解を支援する抜粋文を表示できる。
請求項に記載の発明は、請求項記載の文書理解支援装置において、
前記抜粋文表示手段で表示された抜粋文の意味段落に対応する部分の文書を文書表示部に表示させ、前記文書表示部に表示された意味段落に対応する抜粋文を前記抜粋文表示手段に表示させる対応表示手段を有する。
【0011】
このように、表示されている文書に対応する抜粋文を表示できると共に、表示されている抜粋文に対応する元の文書を表示でき、必要な情報を元の文書から早急に探し出すことができる。
請求項に記載の発明は、請求項3または4記載の文書理解支援装置において、
前記抜粋文表示手段は、
任意の意味段落の抜粋文と共に、その意味段落と類似する意味段落の抜粋文を表示する。
【0012】
このように、意味段落の抜粋文と共に、その意味段落と類似する意味段落の抜粋文を表示するため、類似する意味段落の抜粋文を用いて、文書内で類似した話題に関する部分をまとめて読むことができる。
【0019】
請求項に記載の発明は、コンピュータを、
記憶装置に格納されている文書ファイルから指定されたファイルの文書を、前記文書での出現頻度が高く集中して出現する度合いである重要度が高い重要語を抽出し、前記重要語が連続して出現する領域の先頭及び末尾の文章にポイントを与え、かつ、前記文書内の話題の転換を促す語で始まる文章にポイントを与え、かつ、前記文書内の話題のつながりを促す語で始まる文章のポイントを減じるポイント手段と、
前記ポイント手段で与えられたポイントの合計値が所定値を超えた位置を前記文書の内容を反映した段落構造である意味段落の区切りとして分割する意味段落解析手段と、
前記意味段落解析手段により文書を分割した意味段落毎に名詞の出現回数から名詞毎の重要度を決定して重要度の高い名詞を各意味段落の重要語と決定し、該各意味段落の重要語の集合をまとめて文書全体の重要語を作成し、重要度保存域に保存する手段と、
前記重要度保存域に保存されている名詞の重要度から前記意味段落毎に意味段落に含まれる各文章の重要度を算出して重要度の高い文章を抜粋文として抽出する抜粋文抽出手段と
して機能させるためのプログラムを記録している。
【0020】
この記録媒体を使用することにより、文書理解支援機能を持たせることができ、これにより請求項1記載の発明を実現できる。
請求項7に記載の発明は、請求項6記載のプログラムを記録したコンピュータ読み取り可能な記録媒体において、
前記ポイント手段は、さらに、
複数ファイルで前記文書が構成されているとき、各ファイルの区切りの直後の文章にポイントを与え、かつ、前記文書内の見出しの段落の直後の文章にポイントを与える。
この記録媒体を使用することにより、文書理解支援機能を持たせることができ、これにより請求項2記載の発明を実現できる。
請求項に記載の発明は、請求項6または7記載のプログラムを記録したコンピュータ読み取り可能な記録媒体において、
前記抜粋文を意味段落単位で表示する抜粋文表示手段と
して機能させるためのプログラムを記録している。
【0021】
この記録媒体を使用することにより、文書理解支援機能を持たせることができ、これにより請求項記載の発明を実現できる。
請求項に記載の発明は、請求項記載のプログラムを記録したコンピュータ読み取り可能な記録媒体において、
前記抜粋文表示手段で表示された抜粋文の意味段落に対応する部分の文書を文書表示部に表示させ、前記文書表示部に表示された意味段落に対応する抜粋文を前記抜粋文表示手段に表示させる対応表示手段と
して機能させるためのプログラムを記録している。
【0022】
この記録媒体を使用することにより、文書理解支援機能を持たせることができ、これにより請求項記載の発明を実現できる。
請求項10に記載の発明は、文書から文章を抜粋して要約文を生成する要約文生成方法であって、
記憶装置に格納されている文書ファイルから指定されたファイルの文書を、前記文書での出現頻度が高く集中して出現する度合いである重要度が高い重要語を抽出し、前記重要語が連続して出現する領域の先頭及び末尾の文章にポイントを与え、かつ、前記文書内の話題の転換を促す語で始まる文章にポイントを与え、かつ、前記文書内の話題のつながりを促す語で始まる文章のポイントを減じ
前記与えられたポイントの合計値が所定値を超えた位置を前記文書の内容を反映した段落構造である意味段落の区切りとして分割し、
前記文書を分割した意味段落毎に名詞の出現回数から名詞毎の重要度を決定して重要度の高い名詞を各意味段落の重要語と決定し、該各意味段落の重要語の集合をまとめて文書全体の重要語を作成し、重要度保存域に保存し、
前記重要度保存域に保存されている名詞の重要度から前記意味段落毎に意味段落に含まれる各文章の重要度を算出して重要度の高い文章を抽出する。
【0023】
このように、文書での出現頻度が高く集中して出現する度合いである重要度が高い重要語を抽出し、重要語が連続して出現する領域の先頭及び末尾の文章にポイントを与え、かつ、文書内の話題の転換を促す語で始まる文章にポイントを与え、かつ、文書内の話題のつながりを促す語で始まる文章のポイントを減じ、ポイントの合計値が所定値を超えた位置を意味段落の区切りとすることにより、話題の範囲毎の意味段落を効率的に見つけることができ、文書をその内容を反映した段落構造である意味段落に分割し、分割した意味段落毎に意味段落に含まれる各文章の重要度を算出して重要度の高い文章を抜粋文として抽出し、意味段落単位で表示するため、文書の構文解析を必要とせず、抜粋文を得るための統計量が少ないので、小さなシステム規模で、かつ、短い処理時間で文書理解を支援することができる。
【0026】
請求項11に記載の発明は、請求項10記載の要約文生成方法であって、
複数ファイルで前記文書が構成されているとき、各ファイルの区切りの直後の文章にポイントを与え、かつ、前記文書内の見出しの段落の直後の文章にポイントを与える
【0027】
このように、ファイルの区切りの直後の文章にポイントを与えることにより、複数ファイルで構成された文書での話題の範囲毎の意味段落を確実に見つけることができ、文書内の見出しの段落の直後の文章にポイントを与えることにより、話題の範囲毎の意味段落を確実に簡単に見つけることができる。
【0031】
【発明の実施の形態】
図1は本発明の文書理解支援装置の一実施例のブロック図を示す。同図中、中央処理装置(CPU)10には、バス15を介して入力装置20、記憶装置30、表示装置40、印刷装置50それぞれが接続されている。入力装置20としてはキーボード21,マウス22,スキャナ23等が設けられており、記憶装置30としてはRAM31、ROM32、ハードディスク装置33、フレキシブルディスク装置34等が設けられている。CPU10は記憶装置30に記憶されている後述の処理を行う各種処理プログラムを実行し、その結果を記憶装置30に記憶すると共に、表示装置40に表示し、印刷装置50で印刷して出力する。また、記憶装置30には各種処理プログラムの他に各種ライブラリも記憶されている。
【0032】
図2は本発明の文書理解支援装置が実行する文書理解支援処理の一実施例のフローチャートを示す。同図中、ステップS10では入力装置20を用いて記憶装置30に格納されている文書ファイルから処理の対象となる文書の文書ファイルを指定する。ここでは、1つの文書が複数の文書ファイルに分かれている場合には、該当する複数の文書ファイルを指定する。次に、ステップS12で指定した文書について話題範囲(意味段落)の解析を行う。次に、ステップS14でそれぞれの意味段落から抜粋文を作成し、ステップS16で作成した抜粋文をガイドとして表示する。
【0033】
図3はステップS12で実行する意味段落解析ルーチンの一実施例のフローチャートを示す。同図中、ステップS20で文書を一定の文章数毎に区切り、複数の重要語判定領域に分割する。次に、ステップS22で各重要語判定領域毎に名詞の重要度を決定し、この各重要語判定領域毎の名詞の重要度を集めて文書全体の重要語を決定する。
【0034】
ここでは、tf=(その重要語判定領域でのその名詞の出現回数)/(文書全体でのその名詞の出現回数),idf=(全体の重要語判定領域数)/(文書全体でその名詞が出現する重要語判定領域数)として、その名詞の重要度=tf・idfとする。この計算式は文書での出現頻度が高いということと、ある領域に集中して出現するということで重要度を評価している。次に、各重要語判定領域の内部で重要度が所定の閾値を超えるものを各重要語判定領域の重要語と決定し、各重要語判定領域の重要語の集合を作成する。そして、各重要語判定領域の重要語の集合を文書全体でまとめることにより文書全体の重要語の集合を作成する。
【0035】
次のステップS24で文書の1文章毎のループ処理で、文章毎に得点を与える。ここでは、ステップS26で、文書が複数の文書ファイルで構成されるときは各文書ファイルの区切りを意味段落の区切りとするため、その文章の直前で文書ファイルが始まっていると例えば2ポイント加点する。また、文書中の章、節等の見出しの段落が存在する位置を意味段落の区切りとするため、その文章の直前に章、節等の見出しの段落が存在すると例えば2ポイント加点する。また、「はじめに」、「さて」、「一方」、「ところで」等の話題の転換を促す語の始まる位置を意味段落の区切りとみなすため、話題の転換を促す語で始まる文章は例えば2ポイント加点する。また、「このように」、「そうなると」等の話題が続くことを示す語の始まる位置を意味段落の区切りではないとみなすため、話題が続くことを示す語で始まる文章は例えば2ポイント減点する。
【0036】
次のステップS28は文章中の各名詞についてのループ処理で、文章毎に得点を与える。ここでは、ステップS30で文書全体の重要語を含んだ文章が連続する範囲の先頭位置を意味段落の区切りとするため、全ての名詞について、その名詞が直前の文章に現れてないかどうかを判別し、その名詞が直前の文章に現れてない場合にのみステップS32に進む。ステップS32ではその名詞が文書全体の重要語かつ重要語判定領域の重要語であれば例えば1.5ポイント加点し、その名詞が文書全体の重要語だけであれば例えば1ポイント加点する。そして、ステップS34でステップS28のループ処理の終了が検出されると次のステップS36に進む。
【0037】
ステップS36は文章中に現れなかった文書全体の重要語に属する各名詞についてのループ処理で、文章毎に得点を与える。ここでは、ステップS38で文書全体の重要語を含んだ文章が連続する範囲の末尾位置を意味段落の区切りとするため、その文書全体の重要語に属する名詞が直前の文章に現れていたかどうかを判別し、その文書全体の重要語に属する名詞が直前の文章に現れていた場合にのみステップS40に進む。ステップS40ではその文書全体の重要語に属する名詞が更にその重要語判定領域の重要語であれば例えば1.5ポイント加点し、その名詞が文書全体の重要語だけであれば例えば1ポイント加点する。
【0038】
そして、ステップS42でステップS36のループ処理の終了が検出されると次のステップS44に進む。ここでステップS24のループ処理の終了が検出されるとステップS46に進む。ここでは、合計ポイントが所定値を超えた文章を意味段落の開始または末尾の区切りとみなし、各意味段落領域を決定して処理サイクルを終了する。なお、このステップS46で意味段落領域が決定されるのに応じて、重要語判定領域の重要語の集合から意味段落領域の重要語の集合が再編成される。
【0039】
これによって、図4に示すように、文書が複数の文書ファイル60〜62で構成されるときは各文書ファイル60〜62の区切りが意味段落の境界となる。また、図5に示すように、文書中の章、節等の見出しの段落が存在する位置が意味段落の境界となる可能性が高い。また、図6に示すように、「はじめに」、「さて」、「一方」、「ところで」等の話題の転換を促す語の始まる位置が意味段落となり、「このように」、「そうなると」等の話題が続くことを示す語の始まる位置は意味段落の境界となる可能性が低くなる。
【0040】
更に、図7に示すように、名詞Aが連続して出現する範囲65,67と名詞Aが出現しない範囲66とが隣接していると、少なくとも名詞Aは重要語判定領域の重要語となるため、上記の範囲65と範囲66との間、範囲65と範囲66との間が意味段落の境界となる可能性が高い。なお、図8に文章毎にポイントを加算した様子を示す。ここでは、丸印がその文章の合計ポイントを示し、白四角はその文章とが前の文章との間に意味段落の境界がないことを表し、黒四角はその文章とが前の文章との間に意味段落の境界があることを表している。
【0041】
図9及び図11はステップS14で実行する抜粋文作成ルーチンの一実施例のフローチャートを示す。図9のルーチンは意味段落領域毎に実行される。同図中、ステップS50で文書全体の重要語それぞれと意味段落領域の重要語それぞれの名詞の重要度を保存しておく。つまり、重要度が保存されている名詞は重要語である。次に、ステップS52で文書の1文章毎のループ処理を行い、次のステップS54で文章中の各名詞についてのループ処理を行って、文章毎に重要度を与える。
【0042】
ここでは、ステップS56でその名詞が重要語であるか、つまり、重要度が保存されている否かを判別する。そして、その名詞が重要語である場合にのみステップS60に進む。ステップS60ではその名詞の重要度をその文章の重要度に加算する。そして、ステップS62でステップS54のループ処理の終了が検出されると次のステップS64に進む。ここでステップS52のループ処理の終了が検出されると処理サイクルを終了する。
【0043】
図10では、テーブル70の第1欄に、文章単位でその中に含まれる名詞を示している。なお、重要語は大文字で、非重要語は小文字で示している。重要語についてはテーブル72の重要度を加算してテーブル70の第2欄に示す重要度の総和が求められる。3番目の文章では重要語の名詞D,B,D,Dがあるために、これらの重要度の総和は30となる。
【0044】
図11は図9に続いて実行する抜粋文作成ルーチンの一実施例のフローチャートを示す。同図中、ステップS70で1つの意味段落領域から抜粋文を何文ずつ選択してガイド表示するかについて、利用者が指定しておく。次に、ステップS72で文書全体に対して意味段落一つずつのループ処理を行い、次のステップS74で意味段落に含まれる1文章毎のループ処理で、抜粋文の抽出を行う。
【0045】
ここでは、ステップS76で指定された数だけの文章が既に抽出保存されているか否かを判別する。そして、指定された数だけの文章が既に抽出保存されている場合はステップS78に進み、指定された数だけの文章が抽出保存されていない場合はステップS80進む。ステップS80では現在処理中の文章を抽出して抜粋文保存領域に保存する。この抜粋文保存領域は記憶装置30に意味段落毎に設けられており、各抜粋文保存領域には対応する意味段落とのリンク情報(例えば文書ファイル名及び文書ファイル内アドレス)も格納されている。
【0046】
ステップS78では抜粋文保存領域に保存されている文章つまり抜粋文の中で重要度が最小の抜粋文と比べて現在処理中の文章の重要度が大きいか否かを判別する。そして、現在処理中の文章の重要度が大きい場合にのみステップS82に進む。ステップS82では抜粋文保存領域に保存されている文章つまり抜粋文の中で重要度が最小の抜粋文を削除して、現在処理中の文章を抽出して抜粋文保存領域に保存する。ステップS84でステップS74のループ処理の終了が検出されると次のステップS86に進む。ここでステップS72のループ処理の終了が検出されると処理サイクルを終了する。
【0047】
図12はステップS16で表示されるガイド表示の一実施例を示す。ここで、本文表示ウインドウ80には文書の本文が表示されている。ガイド表示ウインドウ82にガイド表示が行われる。また、ガイド表示ウインドウ82と共に、追跡メニュ84が表示される。このガイド表示ウインドウ82は文書理解支援処理のステップS16で表示される場合は第1の意味段落に対応する内容が表示され、この後、本文表示ウインドウ80のガイドボタン81をクリックすると本文表示ウインドウ80に表示されている意味段落に対応する内容のガイド表示ウインドウ82が表示される。また、追跡メニュ84はガイド表示ウインドウ82の追跡ボタン83をクリックすることで表示/消去の切り替えが可能とされている。
【0048】
図13はガイド表示ウインドウ82の拡大図を示す。同図中、表示部85に意味段落単位で指定された意味段落(指定意味段落)の抜粋文と、これに類似する意味段落の抜粋文の一部が表示される。ここで、類似する意味段落とは、指定意味段落の重要語の集合にある重要語と同一の重要語を所定数以上含む意味段落である。この類似する意味段落が複数ある場合には同一の重要語を最も多く含む意味段落が選択されて表示部85に表示される。表示部85に表示された抜粋文はボタン86a,86bをクリックすることにより上下にスクロールし、また、ボタン87a,87bをクリックすることにより左右にスクロールする。
【0049】
また、ガイド表示ウインドウ82には意味段落移動用のボタン88a,88bと元文書参照ボタン89が設けられている。意味段落移動用のボタン88aをクリックすることにより、図14(B)に示す現在表示中の指定意味段落に対するガイド表示から図14(A)に示す直前の意味段落が指定意味段落としてガイド表示ウインドウ82に表示される。また、意味段落移動用のボタン88bをクリックすることにより、図14(B)に示す現在表示中の指定意味段落に対するガイド表示から図14(C)に示す直後の意味段落が指定意味段落としてガイド表示ウインドウ82に表示される。
【0050】
元文書参照ボタン89をクリックすると、図15に示すように、ガイド表示ウインドウ82に現在表示されている指定意味段落に対応する部分の文書(元文書)が本文表示ウインドウ80に表示される。これによって、ガイド表示から元文書を参照することができる。
追跡メニュ84にはボタン90a、90bが設けられている。図16に示すように、本文表示ウインドウ80に表示されている部分に対応する指定意味段落がガイド表示ウインドウ82に表示されているとき、ボタン90aをクリックすると、このガイド表示ウインドウ82の指定意味段落に類似する意味段落のうち上記指定意味段落より前に存在する類似意味段落の部分を本文表示ウインドウ80に表示する。また、ボタン90bをクリックすると、このガイド表示ウインドウ82の指定意味段落に類似する意味段落のうち上記指定意味段落より後に存在する類似意味段落の部分を本文表示ウインドウ80に表示する。
【0051】
図17に上記のガイド表示を行うときの操作の意志決定のフローチャートを示す。ここではX番目の意味段落を指定意味段落とするガイド表示がガイド表示ウインドウ82に表示されているものとする。同図中、ステップS100でX−1番目の意味段落についてガイド表示したいか否かを判定し、そうであればステップS102でボタン88aをクリックする。そうでなければステップS104でX+1番目の意味段落についてガイド表示したいか否かを判定し、そうであればステップS106でボタン88bをクリックする。
【0052】
そうでなければステップS108でX番目の意味段落に対応する部分の文書(元文書)を参照したいか否かを判定し、そうであればステップS110で元文書参照ボタン89をクリックする。そうでなければステップS112でX番目の意味段落と内容が類似する意味段落に対応する部分の文書(元文書)を参照したいか否かを判定し、そうであればステップS114でボタン86a,86b,87a,87bをクリックしてスクロールを行い、所望の抜粋文を表示させて選択し、参照ボタン89をクリックする。
【0053】
そうでなければステップS116でX番目の意味段落と内容が類似する意味段落のうちX番目より前の意味段落に対応する部分の文書(元文書)を参照したいか否かを判定し、そうであればステップS118で追跡メニュ84を表示し、ボタン90aをクリックする。そうでなければステップS120でX番目の意味段落と内容が類似する意味段落のうちX番目より後の意味段落に対応する部分の文書(元文書)を参照したいか否かを判定し、そうであればステップS122で追跡メニュ84を表示し、ボタン90bをクリックする。
【0054】
このように、文書をその内容を反映した段落構造である意味段落に分割し、分割した意味段落毎に意味段落に含まれる各文章の重要度を算出して重要度の高い文章を抜粋文として保存し、意味段落単位で表示するため、文書の構文解析を必要とせず、抜粋文を得るための統計量が少ないので、小さなシステム規模で、かつ、短い処理時間で文書理解を支援する抜粋文を表示できる。また、表示されている文書に対応する抜粋文を表示できると共に、表示されている抜粋文に対応する元の文書を表示でき、必要な情報を元の文書から早急に探し出すことができる。
【0055】
また、文書での出現頻度が高く集中して出現する度合いである重要度が高い重要語を抽出し、重要語が連続して出現する領域の先頭及び末尾の文章にポイントを与え、ポイントの合計値が所定値を超えた位置を意味段落の区切りとすることにより、話題の範囲毎の意味段落を効率的に見つけることができ、ファイルの区切りの直後の文章にポイントを与えることにより、複数ファイルで構成された文書での話題の範囲毎の意味段落を確実に見つけることができ、文書内の見出しの段落の直後の文章にポイントを与えることにより、話題の範囲毎の意味段落を確実に簡単に見つけることができ、話題の転換を促す語で始まる文章にポイントを与えることにより、話題の範囲毎の意味段落を確実に簡単に見つけることができる。
【0056】
また、話題のつながりを促す語で始まる文章のポイントを減じることにより、意味段落ではない部分が誤って話題の範囲毎の意味段落となることを防止でき、意味段落の各文章に含まれる重要語についてその語の重要度を加算して文章の重要度を算出し、この重要度が大きいものから順に抜粋文として保存するため、話題の範囲毎の意味段落を見つけるために使った語の重要度を再度利用して、意味段落の話題の内容を良く表す抜粋文を効率的に保存でき、意味段落の抜粋文と共に、その意味段落と類似する意味段落の抜粋文を表示するため、類似する意味段落の抜粋文を用いて、文書内で類似した話題に関する部分をまとめて読むことができる。
【0057】
なお、ステップS12が意味段落解析手段に対応し、ステップS14が抜粋文抽出手段に対応し、ステップS16が抜粋文表示手段に対応する。また、本文表示ウインドウ80,ガイド表示ウインドウ82,ガイドボタン81,追跡ボタン83が対応表示手段に対応する。また、ステップS26が第1〜第5のポイント手段に対応する。
【0058】
【発明の効果】
上述の如く、請求項1に記載の発明によれば、文書での出現頻度が高く集中して出現する度合いである重要度が高い重要語を抽出し、重要語が連続して出現する領域の先頭及び末尾の文章にポイントを与え、かつ、文書内の話題の転換を促す語で始まる文章にポイントを与え、かつ、文書内の話題のつながりを促す語で始まる文章のポイントを減じ、ポイントの合計値が所定値を超えた位置を意味段落の区切りとすることにより、話題の範囲毎の意味段落を効率的に見つけることができ、文書をその内容を反映した段落構造である意味段落の区切りとして分割し、分割した意味段落毎に意味段落に含まれる各文章の重要度を算出して重要度の高い文章を抜粋文として抽出し、意味段落単位で表示するため、文書の構文解析を必要とせず、抜粋文を得るための統計量が少ないので、小さなシステム規模で、かつ、短い処理時間で文書理解を支援することができる。
また、請求項2に記載の発明によれば、ファイルの区切りの直後の文章にポイントを与えることにより、複数ファイルで構成された文書での話題の範囲毎の意味段落を確実に見つけることができ、文書内の見出しの段落の直後の文章にポイントを与えることにより、話題の範囲毎の意味段落を確実に簡単に見つけることができる。
【0060】
また、請求項に記載の発明によれば、抜粋文を意味段落単位で表示することにより、文書理解を支援する抜粋文を表示できる。
また、請求項に記載の発明によれば、表示されている文書に対応する抜粋文を表示できると共に、表示されている抜粋文に対応する元の文書を表示でき、必要な情報を元の文書から早急に探し出すことができる。
【0062】
また、請求項に記載の発明によれば、意味段落の抜粋文と共に、その意味段落と類似する意味段落の抜粋文を表示するため、類似する意味段落の抜粋文を用いて、文書内で類似した話題に関する部分をまとめて読むことができる。
【0070】
また、請求項に記載の記録媒体を使用することにより、文書理解支援機能を持たせることができ、これにより請求項1記載の発明を実現できる。
【0071】
また、請求項に記載の記録媒体を使用することにより、文書理解支援機能を持たせることができ、これにより請求項2記載の発明を実現できる。
【0072】
また、請求項に記載の記録媒体を使用することにより、文書理解支援機能を持たせることができ、これにより請求項3記載の発明を実現できる。
【0073】
また、請求項10に記載の発明によれば、文書での出現頻度が高く集中して出現する度合いである重要度が高い重要語を抽出し、重要語が連続して出現する領域の先頭及び末尾の文章にポイントを与え、かつ、文書内の話題の転換を促す語で始まる文章にポイントを与え、かつ、文書内の話題のつながりを促す語で始まる文章のポイントを減じ、ポイントの合計値が所定値を超えた位置を意味段落の区切りとすることにより、話題の範囲毎の意味段落を効率的に見つけることができ、文書をその内容を反映した段落構造である意味段落に分割し、分割した意味段落毎に意味段落に含まれる各文章の重要度を算出して重要度の高い文章を抜粋文として抽出し、意味段落単位で表示するため、文書の構文解析を必要とせず、抜粋文を得るための統計量が少ないので、小さなシステム規模で、かつ、短い処理時間で文書理解を支援することができる。
【0075】
また、請求項11に記載の発明によれば、ファイルの区切りの直後の文章にポイントを与えることにより、複数ファイルで構成された文書での話題の範囲毎の意味段落を確実に見つけることができ、文書内の見出しの段落の直後の文章にポイントを与えることにより、話題の範囲毎の意味段落を確実に簡単に見つけることができる。
【図面の簡単な説明】
【図1】本発明の文書理解支援装置の一実施例のブロック図である。
【図2】本発明の文書理解支援装置が実行する文書理解支援処理の一実施例のフローチャートである。
【図3】意味段落解析ルーチンの一実施例のフローチャートである。
【図4】意味段落の境界を説明するための図である。
【図5】意味段落の境界を説明するための図である。
【図6】意味段落の境界を説明するための図である。
【図7】意味段落の境界を説明するための図である。
【図8】文章毎にポイントを加算蓄積した様子を示す図である。
【図9】抜粋文作成ルーチンの一実施例のフローチャートである。
【図10】抜粋文作成ルーチンを説明するための図である。
【図11】抜粋文作成ルーチンの一実施例のフローチャートである。
【図12】ガイド表示の一実施例を示す図である。
【図13】ガイド表示ウインドウ82の拡大図である。
【図14】意味段落移動用のボタン88a,88bをクリックしたときのガイド表示を説明するための図である。
【図15】元文書参照ボタン89をクリックしたときのガイド表示を説明するための図である。
【図16】追跡メニュ84を説明するための図である。
【図17】ガイド表示を行うときの操作の意志決定のフローチャートである。
【符号の説明】
10 中央処理装置(CPU)
20 入力装置
21 キーボード
22 マウス
23 スキャナ
30 記憶装置
31 RAM
32 ROM
33 ハードディスク装置
34 フレキシブルディスク装置
40 表示装置
50 印刷装置
80 本文表示ウインドウ
81 ガイドボタン
82 ガイド表示ウインドウ
83 追跡ボタン
84 追跡メニュ
85 表示部
86a,86b,87a,87b,90a、90b ボタン
88a,88b 意味段落移動用のボタン
89 元文書参照ボタン

Claims (11)

  1. 記憶装置に格納されている文書ファイルから指定されたファイルの文書を、前記文書での出現頻度が高く集中して出現する度合いである重要度が高い重要語を抽出し、前記重要語が連続して出現する領域の先頭及び末尾の文章にポイントを与え、かつ、前記文書内の話題の転換を促す語で始まる文章にポイントを与え、かつ、前記文書内の話題のつながりを促す語で始まる文章のポイントを減じるポイント手段と、
    前記ポイント手段で与えられたポイントの合計値が所定値を超えた位置を前記文書の内容を反映した段落構造である意味段落の区切りとして分割する意味段落解析手段と、
    前記意味段落解析手段により文書を分割した意味段落毎に名詞の出現回数から名詞毎の重要度を決定して重要度の高い名詞を各意味段落の重要語と決定し、該各意味段落の重要語の集合をまとめて文書全体の重要語を作成し、重要度保存域に保存する手段と、
    前記重要度保存域に保存されている名詞の重要度から前記意味段落毎に意味段落に含まれる各文章の重要度を算出して重要度の高い文章を抜粋文として抽出する抜粋文抽出手段とを
    有することを特徴とする文書理解支援装置。
  2. 請求項1記載の文書理解支援装置において、
    前記ポイント手段は、さらに、
    複数ファイルで前記文書が構成されているとき、各ファイルの区切りの直後の文章にポイントを与え、かつ、前記文書内の見出しの段落の直後の文章にポイントを与えることを特徴とする文書理解支援装置。
  3. 請求項1または2記載の文書理解支援装置において、
    前記抜粋文を意味段落単位で表示する抜粋文表示手段を
    有することを特徴とする文書理解支援装置。
  4. 請求項記載の文書理解支援装置において、
    前記抜粋文表示手段で表示された抜粋文の意味段落に対応する部分の文書を文書表示部に表示させ、前記文書表示部に表示された意味段落に対応する抜粋文を前記抜粋文表示手段に表示させる対応表示手段を
    有することを特徴とする文書理解支援装置。
  5. 請求項3または4記載の文書理解支援装置において、
    前記抜粋文表示手段は、
    任意の意味段落の抜粋文と共に、その意味段落と類似する意味段落の抜粋文を表示することを特徴とする文書理解支援装置。
  6. コンピュータを、
    記憶装置に格納されている文書ファイルから指定されたファイルの文書を、前記文書での出現頻度が高く集中して出現する度合いである重要度が高い重要語を抽出し、前記重要語が連続して出現する領域の先頭及び末尾の文章にポイントを与え、かつ、前記文書内の話題の転換を促す語で始まる文章にポイントを与え、かつ、前記文書内の話題のつながりを促す語で始まる文章のポイントを減じるポイント手段と、
    前記ポイント手段で与えられたポイントの合計値が所定値を超えた位置を前記文書の内容を反映した段落構造である意味段落の区切りとして分割する意味段落解析手段と、
    前記意味段落解析手段により文書を分割した意味段落毎に名詞の出現回数から名詞毎の重要度を決定して重要度の高い名詞を各意味段落の重要語と決定し、該各意味段落の重要語の集合をまとめて文書全体の重要語を作成し、重要度保存域に保存する手段と、
    前記重要度保存域に保存されている名詞の重要度から前記意味段落毎に意味段落に含まれる各文章の重要度を算出して重要度の高い文章を抜粋文として抽出する抜粋文抽出手段と
    して機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  7. 請求項記載のプログラムを記録したコンピュータ読み取り可能な記録媒体において、
    前記ポイント手段は、さらに、
    複数ファイルで前記文書が構成されているとき、各ファイルの区切りの直後の文章にポイントを与え、かつ、前記文書内の見出しの段落の直後の文章にポイントを与えることを特徴とするプログラムを記録したコンピュータ読み取り可能な記録媒体。
  8. 請求項6または7記載のプログラムを記録したコンピュータ読み取り可能な記録媒体において、
    前記抜粋文を意味段落単位で表示する抜粋文表示手段と
    して機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  9. 請求項記載のプログラムを記録したコンピュータ読み取り可能な記録媒体において、
    前記抜粋文表示手段で表示された抜粋文の意味段落に対応する部分の文書を文書表示部に表示させ、前記文書表示部に表示された意味段落に対応する抜粋文を前記抜粋文表示手段に表示させる対応表示手段と
    して機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  10. 文書から文章を抜粋して要約文を生成する要約文生成方法であって、
    記憶装置に格納されている文書ファイルから指定されたファイルの文書を、前記文書での出現頻度が高く集中して出現する度合いである重要度が高い重要語を抽出し、前記重要語が連続して出現する領域の先頭及び末尾の文章にポイントを与え、かつ、前記文書内の話題の転換を促す語で始まる文章にポイントを与え、かつ、前記文書内の話題のつながりを促す語で始まる文章のポイントを減じ
    前記与えられたポイントの合計値が所定値を超えた位置を前記文書の内容を反映した段落構造である意味段落の区切りとして分割し、
    前記文書を分割した意味段落毎に名詞の出現回数から名詞毎の重要度を決定して重要度の高い名詞を各意味段落の重要語と決定し、該各意味段落の重要語の集合をまとめて文書全体の重要語を作成し、重要度保存域に保存し、
    前記重要度保存域に保存されている名詞の重要度から前記意味段落毎に意味段落に含まれる各文章の重要度を算出して重要度の高い文章を抽出する
    ことを特徴とする要約文生成方法。
  11. 請求項10記載の要約文生成方法であって、
    複数ファイルで前記文書が構成されているとき、各ファイルの区切りの直後の文章にポイントを与え、かつ、前記文書内の見出しの段落の直後の文章にポイントを与える
    ことを特徴とする要約文生成方法。
JP06324598A 1998-03-13 1998-03-13 文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP3614648B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP06324598A JP3614648B2 (ja) 1998-03-13 1998-03-13 文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体
US09/256,190 US6537325B1 (en) 1998-03-13 1999-02-24 Apparatus and method for generating a summarized text from an original text

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06324598A JP3614648B2 (ja) 1998-03-13 1998-03-13 文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JPH11259521A JPH11259521A (ja) 1999-09-24
JP3614648B2 true JP3614648B2 (ja) 2005-01-26

Family

ID=13223668

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06324598A Expired - Fee Related JP3614648B2 (ja) 1998-03-13 1998-03-13 文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (2)

Country Link
US (1) US6537325B1 (ja)
JP (1) JP3614648B2 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3703080B2 (ja) * 2000-07-27 2005-10-05 インターナショナル・ビジネス・マシーンズ・コーポレーション ウェブコンテンツを簡略化するための方法、システムおよび媒体
WO2002021324A1 (en) * 2000-09-07 2002-03-14 Intel Corporation Method and apparatus for summarizing multiple documents using a subsumption model
US7813915B2 (en) * 2000-09-25 2010-10-12 Fujitsu Limited Apparatus for reading a plurality of documents and a method thereof
US7607083B2 (en) * 2000-12-12 2009-10-20 Nec Corporation Test summarization using relevance measures and latent semantic analysis
US7283947B2 (en) * 2001-05-24 2007-10-16 International Business Machines Corporation Method and system for translation management of source language text phrases
US9009590B2 (en) * 2001-07-31 2015-04-14 Invention Machines Corporation Semantic processor for recognition of cause-effect relations in natural language documents
US7251781B2 (en) * 2001-07-31 2007-07-31 Invention Machine Corporation Computer based summarization of natural language documents
US8799776B2 (en) * 2001-07-31 2014-08-05 Invention Machine Corporation Semantic processor for recognition of whole-part relations in natural language documents
US6904564B1 (en) * 2002-01-14 2005-06-07 The United States Of America As Represented By The National Security Agency Method of summarizing text using just the text
JP2003248676A (ja) * 2002-02-22 2003-09-05 Communication Research Laboratory 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法
CN1643605B (zh) * 2002-03-18 2011-05-04 夏普株式会社 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
US20050222973A1 (en) * 2004-03-30 2005-10-06 Matthias Kaiser Methods and systems for summarizing information
WO2007127695A2 (en) * 2006-04-25 2007-11-08 Elmo Weber Frank Prefernce based automatic media summarization
US9031947B2 (en) * 2007-03-27 2015-05-12 Invention Machine Corporation System and method for model element identification
US7925496B1 (en) 2007-04-23 2011-04-12 The United States Of America As Represented By The Secretary Of The Navy Method for summarizing natural language text
JP5354981B2 (ja) * 2008-07-14 2013-11-27 キヤノン株式会社 文書管理装置、文書管理方法及びプログラム
US8818803B2 (en) * 2008-10-27 2014-08-26 Frank Elmo Weber Character-based automated text summarization
US8583422B2 (en) * 2009-03-13 2013-11-12 Invention Machine Corporation System and method for automatic semantic labeling of natural language texts
KR20110136843A (ko) * 2009-03-13 2011-12-21 인벤션 머신 코포레이션 지식 검색을 위한 시스템 및 방법
US8332763B2 (en) * 2009-06-09 2012-12-11 Microsoft Corporation Aggregating dynamic visual content
US9583095B2 (en) * 2009-07-17 2017-02-28 Nec Corporation Speech processing device, method, and storage medium
US20110015921A1 (en) * 2009-07-17 2011-01-20 Minerva Advisory Services, Llc System and method for using lingual hierarchy, connotation and weight of authority
US8788260B2 (en) * 2010-05-11 2014-07-22 Microsoft Corporation Generating snippets based on content features
US9020807B2 (en) * 2012-01-18 2015-04-28 Dw Associates, Llc Format for displaying text analytics results
US9390149B2 (en) 2013-01-16 2016-07-12 International Business Machines Corporation Converting text content to a set of graphical icons
US9916375B2 (en) 2014-08-15 2018-03-13 International Business Machines Corporation Extraction of concept-based summaries from documents
US20170300748A1 (en) * 2015-04-02 2017-10-19 Scripthop Llc Screenplay content analysis engine and method
US10402473B2 (en) * 2016-10-16 2019-09-03 Richard Salisbury Comparing, and generating revision markings with respect to, an arbitrary number of text segments
US11227117B2 (en) * 2018-08-03 2022-01-18 International Business Machines Corporation Conversation boundary determination
CN110110331B (zh) * 2019-04-30 2021-02-26 清华大学 文本生成方法、装置、介质和计算设备
CN111061860A (zh) * 2019-12-12 2020-04-24 北京百度网讯科技有限公司 摘要生成方法和装置
CN111241267B (zh) * 2020-01-10 2022-12-06 科大讯飞股份有限公司 摘要提取和摘要抽取模型训练方法及相关装置、存储介质
WO2021234798A1 (ja) * 2020-05-18 2021-11-25 日本電信電話株式会社 生成装置、生成方法および生成プログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61117658A (ja) * 1984-11-13 1986-06-05 Fujitsu Ltd 文章抄録装置
JP2766261B2 (ja) 1987-05-29 1998-06-18 株式会社東芝 文章要約システム
JPH02181261A (ja) * 1989-01-05 1990-07-16 Nippon Telegr & Teleph Corp <Ntt> 自動抄録生成装置
JPH0743717B2 (ja) * 1989-02-06 1995-05-15 株式会社テレマティーク国際研究所 抄録文作成装置
JPH0776971B2 (ja) * 1989-03-17 1995-08-16 工業技術院長 文書抄録作成装置
JPH02254566A (ja) * 1989-03-29 1990-10-15 Nippon Telegr & Teleph Corp <Ntt> 自動抄録生成装置
JPH03191475A (ja) 1989-12-20 1991-08-21 Nec Corp 文書要約方式
JP2944346B2 (ja) * 1993-01-20 1999-09-06 シャープ株式会社 文書要約装置
JPH06332893A (ja) * 1993-05-21 1994-12-02 Hitachi Ltd 文章加工装置
US5638543A (en) * 1993-06-03 1997-06-10 Xerox Corporation Method and apparatus for automatic document summarization
US5708825A (en) * 1995-05-26 1998-01-13 Iconovex Corporation Automatic summary page creation and hyperlink generation
JP3594701B2 (ja) * 1995-07-19 2004-12-02 株式会社リコー キーセンテンス抽出装置
US5838323A (en) * 1995-09-29 1998-11-17 Apple Computer, Inc. Document summary computer system user interface
US5924108A (en) * 1996-03-29 1999-07-13 Microsoft Corporation Document summarizer for word processors
US6353824B1 (en) * 1997-11-18 2002-03-05 Apple Computer, Inc. Method for dynamic presentation of the contents topically rich capsule overviews corresponding to the plurality of documents, resolving co-referentiality in document segments

Also Published As

Publication number Publication date
JPH11259521A (ja) 1999-09-24
US6537325B1 (en) 2003-03-25

Similar Documents

Publication Publication Date Title
JP3614648B2 (ja) 文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体
US7376893B2 (en) Systems and methods for sentence based interactive topic-based text summarization
US5257186A (en) Digital computing apparatus for preparing document text
EP0741364A1 (en) Automatic method of selecting multi-word key phrases from a document
US6976214B1 (en) Method, system, and program for enhancing text composition in a text editor program
JP3431836B2 (ja) ドキュメントデータベースの検索支援方法とそのプログラムを記憶した記憶媒体
US20050219219A1 (en) Text data editing apparatus and method
JP2006285656A (ja) 文書検索システム、記録媒体、プログラム、および文書検索方法
JP2806867B2 (ja) ドキュメントデータベースの構築方法、表示方法、及び表示装置
JP2007011973A (ja) 情報検索装置及び情報検索プログラム
JP3718044B2 (ja) 文書閲覧装置およびそのプログラムを格納した記憶媒体
JP3470975B2 (ja) 文書入力装置のかな漢字変換方法および装置
JPH10301929A (ja) 文書処理装置、文書処理方法及び記録媒体
JP2002169803A (ja) 複数の文書を閲覧するための装置および方法
US6178415B1 (en) Phrase retrieving/selecting method and a computer-readable recording medium with a program making a computer execute each step in the method recorded therein
JP3744136B2 (ja) 訳語選択装置と記憶媒体
JPH10340271A (ja) 文書抄録作成装置及び文書抄録作成プログラムを記録した記憶媒体
JP5326945B2 (ja) 文字入力支援装置、プログラム及び文字入力支援方法
JP4990023B2 (ja) 検索方法、検索プログラム、および検索装置
JP2001142897A (ja) 文書検索装置、文書検索方法、文書検索システム及び文書検索方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004272831A (ja) キーワード抽出装置、プログラム、及び記録媒体
JP4040233B2 (ja) 重要文抽出装置および記憶媒体
JP2004126986A (ja) 文書差分検出装置及びプログラム
JPH09153112A (ja) 文書作成装置、及び文書作成方法
JP2000148747A (ja) 変換候補表示方法,およびこの方法によるかな漢字変換用のプログラムの記録媒体ならびにかな漢字変換装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040302

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040430

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040601

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040921

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041006

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041026

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041027

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081112

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081112

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091112

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101112

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees