JPH0293866A - 要約生成方法および要約生成装置 - Google Patents

要約生成方法および要約生成装置

Info

Publication number
JPH0293866A
JPH0293866A JP63245967A JP24596788A JPH0293866A JP H0293866 A JPH0293866 A JP H0293866A JP 63245967 A JP63245967 A JP 63245967A JP 24596788 A JP24596788 A JP 24596788A JP H0293866 A JPH0293866 A JP H0293866A
Authority
JP
Japan
Prior art keywords
sentence
keyword
document data
section
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63245967A
Other languages
English (en)
Other versions
JP2783558B2 (ja
Inventor
Miwako Doi
美和子 土井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63245967A priority Critical patent/JP2783558B2/ja
Priority to DE68928775T priority patent/DE68928775T2/de
Priority to US07/413,605 priority patent/US5077668A/en
Priority to EP89117915A priority patent/EP0361464B1/en
Publication of JPH0293866A publication Critical patent/JPH0293866A/ja
Application granted granted Critical
Publication of JP2783558B2 publication Critical patent/JP2783558B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、入力された文書データからその要約文を生成
する要約生成装置に関する。
(従来の技術) 近年、大量の特許公報やその他の技術文献等を電子的に
ファイルしてデータベース化することがなされている。
これらのデータベースシステムでは、しばしば文書検索
の容易化を目的として各文書データに含まれるキーワー
ドを登録しておくことかなされるが、一般にキーワード
たけては、その文書の内容を理解することは不可能であ
る。
そこで、文書データごとにその文書の内容を簡潔に表現
した要約文を作成することが考えられるが、大量の文書
データのそれぞれについて要約文を作成することは困難
である。
そこで、計算機を用いた要約文の自動生成法が提案され
ている。その一つは、文書中の出現頻度の高い単語を含
む文を抽出する方式である(Luhn 11.P、 ;
 The Automatic Creation o
fLiterature Abstracts、IBM
 J、Res、Dev、 Vol 2.pp159−1
95 ’)。この方式では、重要な単語は高頻度に出現
するという仮定のもとて要約を作成しているが、高頻度
で出現される単語を含む文を抽出するので、抽出される
文が必然的に多くなりすぎるという欠点がある。しかも
、文書中に高頻度で出現する単語が必ずしもその文書の
主題を適確に表わしたものであるとは言えず、適切な要
約文が生成されないことが多いという問題があった。
これに対し、文書の内容を理解することにより意味的に
正しい要約文を生成しようとする試み(Pun、D、、
et、al; 5tep toword the ev
aluationoftext、in IJCAI85
)もなされているが、′まだ実用化の可能性を確認する
までには至っていないのが現状である。
(発明が解決しようとする課題) このように、従来の要約作成方法では、適切な要約文を
自動生成することが難しく、結局、人手による要約作成
作業によらざるを得なかった。
本発明は、このような問題に鑑みなされたもので、適切
な要約文を生成可能な要約生成装置を提供することを目
的とする。
[発明の構成コ (課題を解決するための手段) 本発明は、文書データや編集コマンドを入力するだめの
入力部と、この入力部を介して入力された文書データを
記憶する文書記憶部と、意味的に重要な単語をキーワー
ドとして記憶するキーワード記憶部と、このキーワード
記憶部に記憶されたキーワードを含む前記文書データ中
の文を抽出し、この抽出された文に基づいて要約文を生
成する要約部と、この要約部で生成された要約文を出力
する出力部とを具備したことを特徴としている。
(作用) 本発明によれば、キーワード記憶部に記憶された意味的
に重要な単語を含む文を文書データ中から抽出し要約文
を生成するので、出現頻度は少なくても意味のあるキー
ワードを含んだ重要な文が抽出できる。このため、ユー
ザは容易にかつ正しい要約文を得ることができる。
(実施例) 以下、図面を参照しながら本発明の実施例について説明
する。
第1図は本発明の一実施例に係る要約生成装置の概略構
成を示すブロック図である。この装置は、文書データや
編集コマンドを入力するためのマウス、キーボードなど
からなる人力部1と、この入力部1を介して入力された
文書データを記憶する文書記憶部2と、文書中の意味の
ある単語をキーワードとして記憶してなるキーワード辞
書3と、このキーワード辞書3に格納されたキーワード
を含む文を抽出し連結することにより要約文を生成する
要約部4と、入力された文書データや前記要約部4で生
成された要約文を表示するデイスプレィ装置、プリンタ
等からなる出力部5と、これら各部の動作を管理する文
書管理部6とを具備したものとなっている。
入力部1を介して入力された文書データは、文書管理部
6を介して文書記憶部2に一旦格納されるとともに出力
部5に例えば第2図に示すように表示される。なお、こ
の表示例では、−文単位に分離して表示をしているが、
これは−例であって、必ずしも一文単位で分れた表示を
行なう必要はない。
入力部1より要約生成の指示コマンドが入力されると、
文書管理部6は、要約部4を起動する。
要約部4は、文書管理部6によって起動されると、文書
記憶部2に格納されている文書データを文書管理部6を
介して読出し、要約生成を開始する。
以下、要約生成について説明する。
キーワード辞書3には予め第3図に示すようなキーワー
ドが格納されている。キーワードは、文書データが対象
としている分野に応じて例えばrdevelop J、
r 5tatusJ、r methodJ等の項目別に
大きく分けられている。キーワードが多品詞である場合
には、重要度の最も高い品詞基が品詞欄に記される。例
えば「開発Jというキーワードであれば、動詞(V)「
開発する」と名詞(n)「開発」の2品詞が考えられる
が、動詞は意味を決定する格であることから、前者の場
合がより重要なので、品詞の欄にはrvJが記されてい
る。
但しキーワード辞書3の記憶形式は、この第3図の形式
に限定されない。
要約部4は、文書管理部6を介して文書記憶部2から文
書データを読み出して、第3図に示したようなキーワー
ドが文書データに含まれているかをサーチする。そして
、そのようなキーワードが含まれている文があれば、そ
の文を文書データから抽出し、それらを結合して要約文
を生成する。
文書管理部6は生成された要約文を出力部2に送る。出
力部2は、生成された要約文を例えば第4図(a)に示
すように文書データに重ねて表示する。
ここで、要約の生成に使用された情報を表示するコマン
ドを入力部1を介して人力すると、例えば第4図(b)
に示すように、抽出された文が、キーワード部分を例え
ば網かけにして、その文番号とともに表示される。また
、23文目「2.認識方式」が要約としては不要である
とユーザが判断した場合、人力部1より文の削除が指示
されると、この文が削除される。また削除以外の編集も
公知の手段を用いて行なうことができる。なお、このよ
うにして作成された要約文は、文書データの一部として
或は別文書として保存するようにしても良い。
この装置によれば、ユーザが予め設定しておいたキーワ
ードに基づいて要約文を構成する文が抽出されるので、
キーワードとして意味的に重要なものを登録しておくこ
とによって、文書中の出現頻度にはよらない極めて適切
な要約を抽出することができる。なお、キーワードが不
足していて要約として抽出されるべき文が抽出されない
場合には、ユーザは人力部1を介して新しくいくつかの
キーワードをキーワード辞書3に登録すれば良い。
このようなキーワードは、ユーザによって多様であるた
め、標準的なキーワードとは別に、ユーザ毎に別れたユ
ーザ指定キーワードとして記憶するのか好ましい。
ところで、ユーザによって登録されるキーワドが増える
と、それに伴って文書データから抽出される文の数も増
えてしまい、本発明の効果が十分に得られなくなってし
まう。第5図はこのような問題を解決するための本発明
の別の実施例に係る要約作成装置の概略構成を示す図で
、第1図と同一部分には同一符号を付しである。したが
って、重複する部分の詳しい説明は省略する。
この装置には、論理構造記憶部7と言語解析部8と生成
部9が設けられている。論理構造記憶部7は、標題、概
要、章、節等の構造を記憶するもので、第2図の文書デ
ータに対して例えば第6図に示すような形式で記憶され
ている。この論理構造は、文書データの形態的特徴等の
公知の解析手法を用いて得られたものであっても、ユー
ザにより入力部1を介して直接指定されたものでも良い
第6図は、各文の属性を表しており、章や節の見出しに
関しては、その順序がオーダーとして表されている。ま
た、各文の階層もレベルとして表されている。なお、論
理構造の記憶形式は、必ずしもこの形式に限定されるも
のではない。
要約部4は、この論理構造に基づき、キーワード辞書3
のどの項目のキーワードを文書データのどこからサーチ
すべきかを制御する。つまり項目r develop 
Jや「5tatusJ等は概要的な文章、即ち概要や序
章(第1a)に述べられており、より詳細で具体的な項
目r methodJ等は、通常、第2章以後に述べら
れていることが多い。この前提に基づき、項目r de
velol) Jや「5tatusj等の概要的キーワ
ードは第1章のみ、例えば第6図の例では5文から22
文の範囲、に対してサーチを行なう。第4文は「章見出
し」なので、サーチする範囲から除かれる。同様に項目
I”methodJに含まれるキーワードは、第2章以
降、つまり24文以降を対象にサーチされる。その結果
、得られた要約文は、第4図(b)で示した要約文から
「26認識方式」なる章見出しを除いたものとなる。
要約部4は、キーワードを含む文を言語解析部8に送り
、公知の形態素解析、構文解析処理を行なう。例えば、
第8文の解析結果は第7図のようになる。要約部4は、
この解析結果に含まれる各キーワードの品詞と第3図の
キーワード辞書3の品詞欄の内容とを比較し、両者が一
致したものを検出する。ここでは、第7図の「開発した
」 (動詞)というキーワードの品詞情報が一致してい
るので、構文木の「開発した」に対応するノードにマー
クが付加される。そして、要約部4はキーワード及びそ
の品詞情報が一致した文だけを要約文として抽出する。
或は、一致したものには得点5、一致しないものには得
点1を与え、各文に与えられた得点の合計が一定以上の
ものだけを要約文として抽出するようにしても良い。な
お、このとき、第6図の論理構造に基づき、「標題」で
ある第1文、「著者」である第2文、「所属」である第
3文も要約文として抽出する。このような操作によれば
、登録されたキーワードの数が多い場合でも、抽出され
る文がある程度絞りこまねるので、第8図(a)に示す
ような簡潔な要約文が抽出されることになる。
次に、人力部1より要約文生成の指示がなされると、生
成部9は、構文木のノードにマークが付加されている語
(第7図では「開発して」)が動詞ならばそれを述部と
するような形に抽出された要約文を変形させ、最終的な
要約文を生成する。
第7図の例では、「開発した」を述部とするための主語
(S)が欠けているが、このような場合には論理構造を
もとに、「所属」を主語に代用する。
マークが付加されている語が名詞ならば、それを主語と
するよう生成を行なう。この結果、要約文は第8図(b
)のようになる。このような要約文の生成処理によって
理解し易い簡潔な要約文が生成されることになる。
以上2つの実施例について述べたが、本発明は上述した
実施例に限定されるものではない。例えば、上記第2の
実施例では、論理構造記憶部7、言語解析部8及び生成
部9を備えたが、例えばそれらのうちの1つのみを備え
た構成であっても基本的な効果は十分に奏し得る。
[発明の効果コ 以上述べたように、本発明によれば、キーワード記憶部
に格納された意味的に重要なキーワードに基づいて抽出
された文に基づいて要約文が生成されるので、簡潔で適
切な要約文を得ることかできる。
【図面の簡単な説明】
第1図〜第4図は本発明の第1の実施例に係る要約生成
装置を説明するための図で、第1図は装置の概略的な構
成を示すブロック図、第2図は文書データの出力例を示
す図、第3図はキーワード辞書の内容を示す図、第4図
(a)(b)は生成された要約の表示例をそれぞれ示す
図、第5図〜第8図は本発明の第2の実施例に係る要約
生成装置を説明するための図で、第5図は装置の概略構
成を示すブロック図、第6図は論理構造記憶部の内容を
示す図、第7図は言語解析部での解析結果を示す図、第
8図(a)は要約部で抽出された要約文の出力例を示す
図、同図(b、)は生成部で生成された要約文の出力例
を示す図である。 1・・・入力部、2・・・文書記憶部、3・・・キーワ
ード辞書、4・・・要約部、5・・・出力部、6・・・
文書管理部、7・・・論理構造記憶部、8・・・言語解
析部、9・・・生成部。 出願人代理人 弁理士 鈴江武彦 第1図 第 図 第 図 (a) 第 図 第 図 (b) 第 図 第 図

Claims (1)

  1. 【特許請求の範囲】 文書データや編集コマンドを入力するための入力部と、 この入力部を介して入力された文書データを記憶する文
    書記憶部と、 意味的に重要な単語をキーワードとして記憶するキーワ
    ード記憶部と、 このキーワード記憶部に記憶されたキーワードを含む前
    記文書データ中の文を抽出し、抽出された文に基づいて
    要約文を生成する要約部と、この要約部で生成された要
    約文を出力する出力部とを具備したことを特徴とする要
    約生成装置。
JP63245967A 1988-09-30 1988-09-30 要約生成方法および要約生成装置 Expired - Lifetime JP2783558B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP63245967A JP2783558B2 (ja) 1988-09-30 1988-09-30 要約生成方法および要約生成装置
DE68928775T DE68928775T2 (de) 1988-09-30 1989-09-28 Verfahren und Vorrichtung zur Herstellung einer Zusammenfassung eines Dokumentes
US07/413,605 US5077668A (en) 1988-09-30 1989-09-28 Method and apparatus for producing an abstract of a document
EP89117915A EP0361464B1 (en) 1988-09-30 1989-09-28 Method and apparatus for producing an abstract of a document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63245967A JP2783558B2 (ja) 1988-09-30 1988-09-30 要約生成方法および要約生成装置

Publications (2)

Publication Number Publication Date
JPH0293866A true JPH0293866A (ja) 1990-04-04
JP2783558B2 JP2783558B2 (ja) 1998-08-06

Family

ID=17141498

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63245967A Expired - Lifetime JP2783558B2 (ja) 1988-09-30 1988-09-30 要約生成方法および要約生成装置

Country Status (4)

Country Link
US (1) US5077668A (ja)
EP (1) EP0361464B1 (ja)
JP (1) JP2783558B2 (ja)
DE (1) DE68928775T2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0544432A2 (en) * 1991-11-19 1993-06-02 Xerox Corporation Method and apparatus for document processing
JPH05314173A (ja) * 1992-05-13 1993-11-26 Nippon Telegr & Teleph Corp <Ntt> 文章要約支援装置
JPH1115830A (ja) * 1997-06-20 1999-01-22 Fuji Xerox Co Ltd 文短縮装置及び文短縮プログラムを記録した媒体
US6338034B2 (en) 1997-04-17 2002-01-08 Nec Corporation Method, apparatus, and computer program product for generating a summary of a document based on common expressions appearing in the document
JP2017054509A (ja) * 2015-09-09 2017-03-16 ウバープル カンパニー リミテッド 文抽出方法及びシステム

Families Citing this family (94)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0418673A (ja) * 1990-05-11 1992-01-22 Hitachi Ltd テキスト情報抽出方法および装置
JP3691844B2 (ja) * 1990-05-21 2005-09-07 株式会社東芝 文書処理方法
JP2895184B2 (ja) * 1990-08-22 1999-05-24 株式会社日立製作所 文書処理システム及び文書処理方法
US5708829A (en) * 1991-02-01 1998-01-13 Wang Laboratories, Inc. Text indexing system
US5384863A (en) * 1991-11-19 1995-01-24 Xerox Corporation Methods and apparatus for automatic modification of semantically significant portions of a document without document image decoding
US5390259A (en) * 1991-11-19 1995-02-14 Xerox Corporation Methods and apparatus for selecting semantically significant images in a document image without decoding image content
CA2077604C (en) * 1991-11-19 1999-07-06 Todd A. Cass Method and apparatus for determining the frequency of words in a document without document image decoding
CA2078423C (en) * 1991-11-19 1997-01-14 Per-Kristian Halvorsen Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
US5537586A (en) * 1992-04-30 1996-07-16 Individual, Inc. Enhanced apparatus and methods for retrieving and selecting profiled textural information records from a database of defined category structures
JPH06215036A (ja) * 1992-12-10 1994-08-05 Xerox Corp ドキュメントコレクションの探索方法
EP0610760B1 (en) * 1993-01-28 2003-05-02 Kabushiki Kaisha Toshiba Document detection system with improved document detection efficiency
US5638543A (en) * 1993-06-03 1997-06-10 Xerox Corporation Method and apparatus for automatic document summarization
US5331556A (en) * 1993-06-28 1994-07-19 General Electric Company Method for natural language data processing using morphological and part-of-speech information
US5384703A (en) * 1993-07-02 1995-01-24 Xerox Corporation Method and apparatus for summarizing documents according to theme
US5826241A (en) 1994-09-16 1998-10-20 First Virtual Holdings Incorporated Computerized system for making payments and authenticating transactions over the internet
EP1691316A1 (en) * 1994-10-27 2006-08-16 Intarsia Software LLC Data copyright management system
JP2809341B2 (ja) 1994-11-18 1998-10-08 松下電器産業株式会社 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。
JPH10513587A (ja) * 1995-01-23 1998-12-22 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 情報にアクセスするための方法、システム
US5689716A (en) * 1995-04-14 1997-11-18 Xerox Corporation Automatic method of generating thematic summaries
US5745602A (en) * 1995-05-01 1998-04-28 Xerox Corporation Automatic method of selecting multi-word key phrases from a document
US5918240A (en) * 1995-06-28 1999-06-29 Xerox Corporation Automatic method of extracting summarization using feature probabilities
US5778397A (en) * 1995-06-28 1998-07-07 Xerox Corporation Automatic method of generating feature probabilities for automatic extracting summarization
US5691708A (en) * 1995-08-14 1997-11-25 Lotus Development Corporation Text abstraction method and apparatus
US6112201A (en) * 1995-08-29 2000-08-29 Oracle Corporation Virtual bookshelf
EP0870246B1 (en) * 1995-09-25 2007-06-06 Adobe Systems Incorporated Optimum access to electronic documents
US5892842A (en) * 1995-12-14 1999-04-06 Xerox Corporation Automatic method of identifying sentence boundaries in a document image
US5848191A (en) * 1995-12-14 1998-12-08 Xerox Corporation Automatic method of generating thematic summaries from a document image without performing character recognition
US5850476A (en) * 1995-12-14 1998-12-15 Xerox Corporation Automatic method of identifying drop words in a document image without performing character recognition
JP3254642B2 (ja) * 1996-01-11 2002-02-12 株式会社日立製作所 索引の表示方法
US5931907A (en) * 1996-01-23 1999-08-03 British Telecommunications Public Limited Company Software agent for comparing locally accessible keywords with meta-information and having pointers associated with distributed information
US6076109A (en) 1996-04-10 2000-06-13 Lextron, Systems, Inc. Simplified-file hyper text protocol
US6098034A (en) * 1996-03-18 2000-08-01 Expert Ease Development, Ltd. Method for standardizing phrasing in a document
JP3270351B2 (ja) 1997-01-31 2002-04-02 株式会社東芝 電子化文書処理装置
US5960383A (en) * 1997-02-25 1999-09-28 Digital Equipment Corporation Extraction of key sections from texts using automatic indexing techniques
JP2001515623A (ja) * 1997-03-18 2001-09-18 シーメンス アクチエンゲゼルシヤフト コンピュータによるテキストサマリ自動生成方法
US6374275B2 (en) * 1997-06-11 2002-04-16 Scientific-Atlanta, Inc. System, method, and media for intelligent selection of searching terms in a keyboardless entry environment
US6470307B1 (en) * 1997-06-23 2002-10-22 National Research Council Of Canada Method and apparatus for automatically identifying keywords within a document
US6353824B1 (en) 1997-11-18 2002-03-05 Apple Computer, Inc. Method for dynamic presentation of the contents topically rich capsule overviews corresponding to the plurality of documents, resolving co-referentiality in document segments
US6185592B1 (en) * 1997-11-18 2001-02-06 Apple Computer, Inc. Summarizing text documents by resolving co-referentiality among actors or objects around which a story unfolds
US6533822B2 (en) * 1998-01-30 2003-03-18 Xerox Corporation Creating summaries along with indicators, and automatically positioned tabs
GB9806085D0 (en) * 1998-03-23 1998-05-20 Xerox Corp Text summarisation using light syntactic parsing
JP4214598B2 (ja) 1998-04-02 2009-01-28 ソニー株式会社 文書処理方法および装置ならびに記録媒体
US7447626B2 (en) * 1998-09-28 2008-11-04 Udico Holdings Method and apparatus for generating a language independent document abstract
US6104990A (en) * 1998-09-28 2000-08-15 Prompt Software, Inc. Language independent phrase extraction
US6768996B1 (en) * 1998-10-08 2004-07-27 Hewlett-Packard Development Company, L.P. System and method for retrieving an abstracted portion of a file without regard to the operating system of the current host computer
US6363174B1 (en) * 1998-12-28 2002-03-26 Sony Corporation Method and apparatus for content identification and categorization of textual data
US6317708B1 (en) * 1999-01-07 2001-11-13 Justsystem Corporation Method for producing summaries of text document
AU2463699A (en) * 1999-01-22 2000-08-07 Dialect Corporation Method and apparatus for improved document searching
CA2363834A1 (en) * 1999-02-19 2001-01-25 The Trustees Of Columbia University In The City Of New York Cut and paste document summarization system and method
US7366711B1 (en) 1999-02-19 2008-04-29 The Trustees Of Columbia University In The City Of New York Multi-document summarization system and method
IL144951A0 (en) * 1999-02-19 2002-06-30 Univ Columbia Multi-document summarization system and method
US6523040B1 (en) 1999-06-24 2003-02-18 Ibm Corporation Method and apparatus for dynamic and flexible table summarization
JP2001014306A (ja) * 1999-06-30 2001-01-19 Sony Corp 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体
US7162413B1 (en) * 1999-07-09 2007-01-09 International Business Machines Corporation Rule induction for summarizing documents in a classified document collection
US6714967B1 (en) 1999-07-30 2004-03-30 Microsoft Corporation Integration of a computer-based message priority system with mobile electronic devices
US6622160B1 (en) * 1999-07-30 2003-09-16 Microsoft Corporation Methods for routing items for communications based on a measure of criticality
US7120865B1 (en) * 1999-07-30 2006-10-10 Microsoft Corporation Methods for display, notification, and interaction with prioritized messages
US7194681B1 (en) 1999-07-30 2007-03-20 Microsoft Corporation Method for automatically assigning priorities to documents and messages
JP2001043215A (ja) 1999-08-02 2001-02-16 Sony Corp 文書処理装置、文書処理方法、及び記録媒体
US7475334B1 (en) * 2000-01-19 2009-01-06 Alcatel-Lucent Usa Inc. Method and system for abstracting electronic documents
US8706618B2 (en) 2005-09-29 2014-04-22 Ebay Inc. Release of funds based on criteria
DE10195918T1 (de) 2000-03-17 2003-04-03 Ebay Inc Verfahren und Einrichtung zur Erleichterung von Zahlungstransaktionen in einem auf einer Netzwerk basierenden Transaktionseinrichtung unter Verwendung verschiedener Zahlungsinstrumente
US7499875B1 (en) 2000-03-17 2009-03-03 Ebay Inc. Method and apparatus for facilitating online payment transactions in a network-based transaction facility using multiple payment instruments
US6581057B1 (en) 2000-05-09 2003-06-17 Justsystem Corporation Method and apparatus for rapidly producing document summaries and document browsing aids
GB2362972A (en) * 2000-06-02 2001-12-05 Res Summary Com An internet based searchable database for up to date financial executive summaries with links to full documents
US6941513B2 (en) 2000-06-15 2005-09-06 Cognisphere, Inc. System and method for text structuring and text generation
WO2002021324A1 (en) * 2000-09-07 2002-03-14 Intel Corporation Method and apparatus for summarizing multiple documents using a subsumption model
US7139977B1 (en) * 2001-01-24 2006-11-21 Oracle International Corporation System and method for producing a virtual online book
JP4630480B2 (ja) * 2001-03-19 2011-02-09 株式会社東芝 要約抽出プログラム、文書分析支援プログラム、要約抽出方法、文書分析支援方法、文書分析支援システム
JP2002283301A (ja) * 2001-03-26 2002-10-03 Makita Corp 際切りマルノコ
US7092872B2 (en) * 2001-06-19 2006-08-15 Fuji Xerox Co., Ltd. Systems and methods for generating analytic summaries
US7117200B2 (en) * 2002-01-11 2006-10-03 International Business Machines Corporation Synthesizing information-bearing content from multiple channels
JP3682529B2 (ja) * 2002-01-31 2005-08-10 独立行政法人情報通信研究機構 要約自動評価処理装置、要約自動評価処理プログラム、および要約自動評価処理方法
US7650562B2 (en) * 2002-02-21 2010-01-19 Xerox Corporation Methods and systems for incrementally changing text representation
US8370761B2 (en) * 2002-02-21 2013-02-05 Xerox Corporation Methods and systems for interactive classification of objects
US7228507B2 (en) 2002-02-21 2007-06-05 Xerox Corporation Methods and systems for navigating a workspace
US7549114B2 (en) 2002-02-21 2009-06-16 Xerox Corporation Methods and systems for incrementally changing text representation
US7487462B2 (en) 2002-02-21 2009-02-03 Xerox Corporation Methods and systems for indicating invisible contents of workspace
JP2003248676A (ja) * 2002-02-22 2003-09-05 Communication Research Laboratory 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法
JP3624186B2 (ja) * 2002-03-15 2005-03-02 Tdk株式会社 スイッチング電源装置用の制御回路及びこれを用いたスイッチング電源装置
US8868670B2 (en) * 2004-04-27 2014-10-21 Avaya Inc. Method and apparatus for summarizing one or more text messages using indicative summaries
US20080281927A1 (en) * 2007-05-11 2008-11-13 Microsoft Corporation Summarization tool and method for a dialogue sequence
US8209617B2 (en) * 2007-05-11 2012-06-26 Microsoft Corporation Summarization of attached, linked or related materials
KR101254362B1 (ko) 2007-05-18 2013-04-12 엔에이치엔(주) 공통 접사를 이용한 키워드 순위를 제공하는 방법 및시스템
WO2008143407A1 (en) * 2007-05-18 2008-11-27 Nhn Corporation Method and system for providing keyword ranking using common affix
US8219397B2 (en) * 2008-06-10 2012-07-10 Nuance Communications, Inc. Data processing system for autonomously building speech identification and tagging data
US8874529B2 (en) * 2009-03-16 2014-10-28 Bert A. Silich User-determinable method and system for manipulating and displaying textual and graphical information
US9589254B2 (en) 2010-12-08 2017-03-07 Microsoft Technology Licensing, Llc Using e-mail message characteristics for prioritization
US9442930B2 (en) 2011-09-07 2016-09-13 Venio Inc. System, method and computer program product for automatic topic identification using a hypertext corpus
US9442928B2 (en) 2011-09-07 2016-09-13 Venio Inc. System, method and computer program product for automatic topic identification using a hypertext corpus
CN109145315B (zh) * 2018-09-05 2022-03-18 腾讯科技(深圳)有限公司 文本翻译方法、装置、存储介质和计算机设备
US11392753B2 (en) 2020-02-07 2022-07-19 International Business Machines Corporation Navigating unstructured documents using structured documents including information extracted from unstructured documents
US11423042B2 (en) 2020-02-07 2022-08-23 International Business Machines Corporation Extracting information from unstructured documents using natural language processing and conversion of unstructured documents into structured documents
KR102550753B1 (ko) * 2021-11-12 2023-07-04 주식회사 솔트룩스 개체명 교정 시스템 및 이를 훈련시키는 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61248160A (ja) * 1985-04-26 1986-11-05 Hitachi Ltd 文書情報登録方式

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4358824A (en) * 1979-12-28 1982-11-09 International Business Machines Corporation Office correspondence storage and retrieval system
JPH01273164A (ja) * 1988-04-25 1989-11-01 Nippon Telegr & Teleph Corp <Ntt> 日本語文書要約装置
JPH0743717B2 (ja) * 1989-02-06 1995-05-15 株式会社テレマティーク国際研究所 抄録文作成装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61248160A (ja) * 1985-04-26 1986-11-05 Hitachi Ltd 文書情報登録方式

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0544432A2 (en) * 1991-11-19 1993-06-02 Xerox Corporation Method and apparatus for document processing
EP0544432A3 (en) * 1991-11-19 1993-12-22 Xerox Corp Method and apparatus for document processing
US5491760A (en) * 1991-11-19 1996-02-13 Xerox Corporation Method and apparatus for summarizing a document without document image decoding
JPH05314173A (ja) * 1992-05-13 1993-11-26 Nippon Telegr & Teleph Corp <Ntt> 文章要約支援装置
US6338034B2 (en) 1997-04-17 2002-01-08 Nec Corporation Method, apparatus, and computer program product for generating a summary of a document based on common expressions appearing in the document
JPH1115830A (ja) * 1997-06-20 1999-01-22 Fuji Xerox Co Ltd 文短縮装置及び文短縮プログラムを記録した媒体
JP2017054509A (ja) * 2015-09-09 2017-03-16 ウバープル カンパニー リミテッド 文抽出方法及びシステム
JP2018081702A (ja) * 2015-09-09 2018-05-24 ウバープル カンパニー リミテッド 文抽出方法及びシステム

Also Published As

Publication number Publication date
EP0361464B1 (en) 1998-08-12
DE68928775T2 (de) 1999-01-21
DE68928775D1 (de) 1998-09-17
EP0361464A2 (en) 1990-04-04
JP2783558B2 (ja) 1998-08-06
US5077668A (en) 1991-12-31
EP0361464A3 (en) 1992-09-02

Similar Documents

Publication Publication Date Title
JP2783558B2 (ja) 要約生成方法および要約生成装置
US6115683A (en) Automatic essay scoring system using content-based techniques
JP3691844B2 (ja) 文書処理方法
JP3220560B2 (ja) 機械翻訳装置
JPS62163173A (ja) 機械翻訳方法
JP6466138B2 (ja) 外国語文作成支援装置、方法及びプログラム
JP2885487B2 (ja) 文書内情報検索装置
Sánchez-Marco et al. Annotation and representation of a diachronic corpus of Spanish
KR101835994B1 (ko) 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치
JPS60254367A (ja) 文章分析装置
Pantelia ‘Noûs, INTO CHAOS’: THE CREATION OF THE THESAURUS OF THE GREEK LANGUAGE
JP2885489B2 (ja) 文書内容検索装置
JPH01136270A (ja) ワードプロセッサ装置
JPH01214963A (ja) 辞書引き装置
JPH1145249A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0561902A (ja) 機械翻訳システム
Walker Computational linguistic techniques in an on-line system for textual analysis
JP2817497B2 (ja) 辞書編集装置
JP2819766B2 (ja) 外国語電子辞書検索方式
JP2786211B2 (ja) 機械翻訳装置における後編集装置
JPH05225232A (ja) テキスト自動前編集装置
JPS62282364A (ja) 文字列検索方式
JPS6366665A (ja) 文書解析整形装置
JPH04130577A (ja) 自然言語処理装置
JPH05135035A (ja) 文書作成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090522

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090522

Year of fee payment: 11