JP3001047B2 - 文書要約装置 - Google Patents

文書要約装置

Info

Publication number
JP3001047B2
JP3001047B2 JP9100432A JP10043297A JP3001047B2 JP 3001047 B2 JP3001047 B2 JP 3001047B2 JP 9100432 A JP9100432 A JP 9100432A JP 10043297 A JP10043297 A JP 10043297A JP 3001047 B2 JP3001047 B2 JP 3001047B2
Authority
JP
Japan
Prior art keywords
information
sentence
shared
sentence component
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP9100432A
Other languages
English (en)
Other versions
JPH10293762A (ja
Inventor
開 石川
明俊 奥村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP9100432A priority Critical patent/JP3001047B2/ja
Priority to US09/061,096 priority patent/US6338034B2/en
Publication of JPH10293762A publication Critical patent/JPH10293762A/ja
Application granted granted Critical
Publication of JP3001047B2 publication Critical patent/JP3001047B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/02Devices for withdrawing samples
    • G01N1/10Devices for withdrawing samples in the liquid or fluent state
    • G01N1/20Devices for withdrawing samples in the liquid or fluent state for flowing or falling materials

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Hydrology & Water Resources (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、主として文書中の
文同士における情報の共通性や概念の関係を用いて総合
的な表現として要約文を得る文書要約装置に関する。
【0002】
【従来の技術】従来、一般に計算機を用いた要約文の自
動生成においては、対象となる文書中から先ず重要文抽
出規則を用いて重要文を抽出し、更に重要文から要約文
生成規則を用いて要約文を生成するという手法が採用さ
れている。
【0003】このような重要文抽出規則に関する特色を
有する周知技術としては、例えば特開平2−93866
号公報や特開平2−112069号公報等が挙げられ
る。ここでは単語の出現頻度分布,キーワードデータベ
ース,ユーザーによる判断等の情報に基づいて重要なキ
ーワードを判定し、そのキーワードを含む重要文を抽出
するようになっている。又、特開平2−215049号
公報には、文脈ベクトルを用いた解析により文書中の重
要部分を抽出する技術が開示されている。更に、特開平
3−191475号公報には、段落毎に段落の性質を反
映した規則を適用して重要文を抽出する技術が開示され
ている。
【0004】
【発明が解決しようとする課題】上述した重要文の抽出
技術の場合、キーワードを含む文に基づいて要約文を自
動生成するものでは、キーワード判定にデータベースを
用いることが不可欠であるため、要約文がデータベース
に強く依存し、内容の偏りや柔軟性に欠けるという問題
がある。
【0005】又、文脈や段落等の文書構造に基づいて要
約文を生成するものでは、長文書の構造や全体の主題の
流れを抽出する趣旨での使用には適しているが、精度の
高いコンパクトな要約文を生成するのには不向きとなっ
ている。
【0006】更に、重要文の集合から要約文を生成する
ものに共通した問題として、重要文の集合に共通の情報
をまとめてコンパクトな表現を得る新しい効果的な手法
の必要性がある点を挙げられるが、現状ではこのための
合理的な手法が提案されていない。
【0007】本発明は、このような問題点を解決すべく
なされたもので、その技術的課題は、利用者の観点に立
って高精度にコンパクトな要約文を生成し得る文書要約
装置を提供することにある。
【0008】
【課題を解決するための手段】本発明によれば、入力さ
れた文書データから文を構成する文構成要素情報を属性
に従って抽出する文構成要素データベース生成部と、文
構成要素情報を属性値に従って保持する文構成要素デー
タベースと、文構成要素データベースにおける文構成要
素情報毎の属性値に応じた共有情報を抽出し、該共有情
報に基づいて最大限に共有可能な共有表現情報を得る要
約文構成要素生成部と、共有表現情報に基づいて要約文
を生成する要約文生成部とを備えた文書要約装置が得ら
れる。
【0009】又、本発明によれば、上記文書要約装置に
おいて、要約文構成要素生成部は、共有表現情報に関す
る概念の上下関係を示すシソーラス辞書を備えた文書要
約装置が得られる。
【0010】更に、本発明によれば、上記何れかの文書
要約装置において、要約文構成要素生成部は、共有情報
に関してユーザーの関心度の高い情報に重点をおくため
に属性値に優先順位を設定する文書要約装置が得られ
る。
【0011】
【発明の実施の形態】以下に幾つかの実施例を挙げ、本
発明の文書要約装置について、図面を参照して詳細に説
明する。
【0012】(実施例1) 図1は、本発明の実施例1に係る文書要約装置の基本構
成を示した簡易ブロック図である。
【0013】この文書要約装置は、文書データを入力し
て文書データから文を構成する文構成要素情報を属性に
従って抽出して出力する文構成要素データベース生成部
1と、文構成要素情報を属性値に従って蓄積保持する文
構成要素データベース2と、文構成要素情報を入力して
文構成要素データベース2における文構成要素情報毎の
属性値に応じた共有情報を抽出し、その共有情報に基づ
いて最大限に共有可能な共有表現情報を得る要約文構成
要素生成部3と、共有表現情報に基づいて要約文を生成
出力する要約文生成部4とを備えて成っている。
【0014】このうち、文構成要素データベース生成部
1は、文書データに対する形態素解析等の前処理を行っ
て前処理情報を出力する入力処理部5と、文書データに
対する解析用データを蓄えた解析用辞書7と、解析用デ
ータに基づいて前処理情報による文書を一文単位で解析
し、いつ(When),どこで(Where),だれが
(Who),なにを(What),なぜ(Why),ど
のように(How)といった5W1H情報や、どうした
(Done)といった文の構成に欠かせない文構成要素
情報を属性に従って抽出して保持する5W1H情報抽出
部6とから成っている。
【0015】文構成要素データベース2は、例えば5W
1H情報の5W1H項目を属性,抽出された文構成要素
を属性値,各文を1レコードとするデータベースによっ
て文書データに関する文構成要素情報を保持する。
【0016】要約文構成要素生成部3は、文構成要素情
報を入力して文構成要素データベース2における文構成
要素情報毎の属性値に応じた共有情報を抽出して共有表
現情報を出力する共有情報抽出部8と、抽出される共有
情報に対して最大限に共有可能な表現を与えるために、
文構成要素データベース2において属性毎に属性値が共
有する情報や概念に関する上下関係を示したシソーラス
辞書9とを備えている。即ち、共有情報抽出部8は、シ
ソーラス辞書9を用いて文構成要素情報に対して共有情
報を抽出し、これを要約文構成要素用の共有表現情報と
して要約文生成部4へ出力する。
【0017】要約文生成部4は、文生成用データを蓄え
た文生成用辞書11と、文生成用データに基づいて共有
表現情報から要約文を生成する文生成出力部10とを備
えている。即ち、文生成出力部10は文生成用辞書11
を用いて共有表現情報に対して文生成用データを抽出
し、これを要約文情報として出力する。
【0018】この文書要約装置では、文構成要素データ
ベース生成部1の入力処理部5に例えば図2に示すよう
な文書データが入力される。即ち、文書データは「A社
が95年9月に台湾にソフトウェア会社を設立」、「B
社が95年4月に香港にソフトベンチャー設立」、「C
社が95年12月に中国でカラーテレビ工場を設立」と
いう3文を含んでいる。文構成要素データベース生成部
1では、5W1H情報抽出部6が解析用辞書7の解析用
データを用いて文書データから1文を1レコードとし、
いつ,だれが,どこで,なにを,どうしたといった文構
成要素の項目に対する属性値を抽出し、図3に示すよう
に文構成要素情報を文構成要素データベース2に蓄積保
持する。
【0019】要約文構成要素生成部3では、共有情報抽
出部8が文構成要素データベース2において属性値が共
有する共有情報である文字列として、「いつ」の属性値
については文7,文23,文51の「95年」を、「ど
うした」の属性値については文3,文23,文51の
「設立」を抽出する。又、共有情報抽出部8では図4に
示されるようなシーソラスを用いることによって、属性
値が共有する概念として、「だれが」の属性値について
は文7,文23,文51に対して「電機会社3社」を、
文7,文23に対して「通信・コンピュータ会社2社」
を、「どこで」の属性値については文7,文23,文5
1に対して「東アジア」を、「なにを」の属性値につい
ては文7,文23,文51に対して「ソフト会社とカラ
ーテレビ工場」を、文7,文23に対して「ソフト会
社」を抽出して上下関係を付け、図5に示されるような
共有表現情報を生成する。
【0020】要約文生成部4では、この共有表現情報を
要約文の構成要素として、例えば「95年に通信・コン
ピュータ会社が東アジアにソフト会社を設立」,「95
年に電機会社3社が東アジアにソフト会社やカラーテレ
ビ工場を設立」のように、共有表現情報に基づいた要約
文情報を生成出力する。
【0021】(実施例2) 図6は、本発明の実施例2に係る文書要約装置の基本構
成を示した簡易ブロック図である。
【0022】この文書要約装置では、先の実施例1のも
のが文構成要素データベース2において属性値が共有す
る共有情報を抽出し、この共有情報に基づいて得た共有
表現情報により要約文の構成要素を得ているのに対し、
要約文構成要素生成部3において共有情報に関して共有
表現情報中の属性値に共起する情報を共有表現情報にリ
ンクした上で要約文の構成要素を拡張し得るようにして
いる。
【0023】即ち、この文書要約装置では、要約文構成
要素生成部3の構成として、共有情報抽出部8及びシソ
ーラス辞書9に加え、先に得られた共有表現情報中の属
性値に対して共起する共起情報を文構成要素データベー
ス2から抽出する共起情報抽出部12と、共起情報を蓄
積保持する共起データベース13と、共有情報抽出部8
からの共有表現情報に対してその属性値の単語に共起す
る共起情報を共起データベース13から取り込み、その
共起情報を共有表現情報にリンクする共起情報連結部1
4とが備えられている。
【0024】この文書要約装置では、文構成要素データ
ベース生成部1の入力処理部5に先の一実施例の場合と
同様に例えば図2に示すような文書データが入力された
とすると、この場合も同様に文構成要素データベース2
には図3に示したような文構成要素情報が保持され、要
約文構成要素生成部3の共有情報抽出部8からは図5に
示したような共有表現情報が抽出される。
【0025】そこで、ここでは文構成要素データベース
2中に図3に示すように、共有表現情報中の「だれが」
の属性値であるA社及びB社に関して共起するものがあ
る場合、共起情報抽出部12はこの共起情報を共起デー
タベース13へ伝送する。共起情報連結部14では、共
起データベース13からの共起情報を共有表現情報に連
結することによって、要約文構成要素として図7に示さ
れるような共起情報連結共有表現情報を生成して出力す
る。
【0026】要約文生成部4では例えば「95年に年間
売り上げ見通しを上方修正した通信・コンピュータ会社
2社が東アジアにソフト会社を設立」のように、共起情
報連結共有表現情報に基づいた要約文情報を生成出力す
る。
【0027】(実施例3) この文書要約装置は、先の実施例1及び実施例2のもの
が要約文構成要素生成部3の共有情報抽出部8におい
て、文構成要素データベース2から属性毎に属性値が共
有する情報や概念の抽出を行っていたのに対し、この抽
出に際して用いられるシソーラス辞書9を複数の分野毎
に用意し、分野に応じた様々な視点からの要約表現を得
るものである。
【0028】この文書要約装置では、文構成要素データ
ベース生成部1の入力処理部5に先の一実施例の場合と
同様に例えば図2に示すような文書データが入力された
とすると、この場合も同様に文構成要素データベース2
には図3に示したような文構成要素情報が保持される
が、ここでは分野毎のシソーラスとして、図4に示した
ような地理の分野におけるシソーラスの代わりに図8に
示すような経済の分野におけるシソーラスが用いられる
ものとする。
【0029】この場合、要約文構成要素生成部3の共有
情報抽出部8は、文構成要素データベース2において、
属性値が共有する共有情報である文字列として、「どこ
で」の属性値については文7,文23,文51に対して
「アジアNIES」を抽出し、共有表現情報を生成す
る。この共有表現情報を要約文の構成要素に用いて生成
される要約文は、「95年に通信・コンピュータ会社2
社がアジアNIESにソフト会社を設立」となる。この
ように、シソーラスを分野毎に複数用意すれば、分野に
応じた要約表現を選択することができ、様々な視点から
の要約文を得ることができる。
【0030】(実施例4) この文書要約装置は、先の実施例1及び実施例2のもの
が要約文構成要素生成部3の共有情報抽出部8におい
て、文構成要素データベース2から属性毎に属性値が共
有する情報や概念の抽出を行っていたのに対し、この抽
出に際して共有情報を抽出する各属性に対してユーザー
が優先順位を与える等の限定条件を設定し、ユーザーの
関心度の高い情報(例えば5W1H情報)に重点をおい
てフレキシブルな要約文を得るものである。
【0031】この文書要約装置では、文構成要素データ
ベース生成部1の入力処理部5に図9に示すような「A
社が93年1月に韓国に半導体工場を設立」,「A社が
95年9月に台湾にソフトウェア会社を設立」,「B社
が94年6月に台湾にパソコン工場を設立」という3文
を含む文書データが入力されたとする。
【0032】この場合、要約文構成要素生成部3の共有
情報抽出部8において、文構成要素データベース2から
属性毎に属性値が共有する情報や概念の抽出を行う際、
共有情報を優先的に抽出する属性として、「だれが」及
び「どうした」に限定したとすると、得られる要約文は
「93年と95年にA社が東アジアに半導体工場とソフ
トウェア会社を設立」となる。又、「どこで」及び「ど
うした」に限定したとすると、得られる要約文は「94
年と95年に通信・コンピュータ会社2社が台湾にソフ
トウェア会社とパソコン工場を設立」となる。
【0033】このようにして、ユーザーの関心度の高い
情報(5W1H情報)に重点をおいたフレキシブルな要
約文を得ることができる。
【0034】
【発明の効果】以上に述べた通り、本発明の文書要約装
置によれば、文書中の文同士における情報の共通性や概
念の関係を用いて高品質で総合的な表現を得ているた
め、利用者の興味の観点から複数の文の共通性を把握し
た上、一層柔軟で高精度にコンパクトな要約文を生成す
ることが可能となる。
【図面の簡単な説明】
【図1】本発明の実施例1に係る文書要約装置の基本構
成を示した簡易ブロック図である。
【図2】図1に示す文書要約装置に備えられる文構成要
素データベース生成部の入力処理部に入力される文書デ
ータを例示したものである。
【図3】図1に示す文書要約装置に備えられる文構成要
素データベースに保持される文構成要素情報を模試的に
例示したものである。
【図4】図1に示す文書要約装置に備えられる要約文構
成要素生成部のシソーラス辞書の内容を例示したもので
ある。
【図5】図1に示す文書要約装置に備えられる要約文構
成要素生成部の共有情報抽出部で抽出される共有表現情
報を例示したものである。
【図6】本発明の実施例2に係る文書要約装置の基本構
成を示した簡易ブロック図である。
【図7】図6に示す文書要約装置に備えられる要約文構
成要素生成部の共起情報連結部から出力される共起情報
連結共有表現情報を例示したものである。
【図8】実施例3の文書要約装置に備えられる要約文構
成要素生成部のシソーラス辞書の内容を例示したもので
ある。
【図9】実施例4の文書要約装置に備えられる文構成要
素データベース生成部の入力処理部に入力される文書デ
ータを例示したものである。
【符号の説明】
1 文構成要素データベース生成部 2 文構成要素データベース 3 要約文構成要素生成部 4 要約文生成部 5 入力処理部 6 5W1H情報抽出部 7 解析用辞書 8 共有情報抽出部 9 シソーラス辞書 10 文生成出力部 11 文生成辞書 12 共起情報抽出部 13 共起データベース 14 共起情報連結部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平1−290076(JP,A) 土井,西村「日本語テキスト要約」N EC技報,Vol.47,No.8, 1994,p48−52(平6−9−16) 安藤,土井,村木「新聞記事からの情 報抽出と多言語インデックス付与」情報 処理学会第48回(平成6年前期)全国大 会講演論文集(3),p.105−106(平 6−3−23) (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 G06F 17/28 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された文書データから文を構成する
    文構成要素情報を属性に従って抽出する文構成要素デー
    タベース生成部と、前記文構成要素情報を属性値に従っ
    て保持する文構成要素データベースと、前記文構成要素
    データベースにおける前記文構成要素情報毎の属性値に
    応じた共有情報を抽出し、該共有情報に基づいて最大限
    に共有可能な共有表現情報を得る要約文構成要素生成部
    と、前記共有表現情報に基づいて要約文を生成する要約
    文生成部とを備えたことを特徴とする文書要約装置。
  2. 【請求項2】 請求項1記載の文書要約装置において、
    前記要約文構成要素生成部は、前記共有表現情報に関す
    る概念の上下関係を示すシソーラス辞書を備えたことを
    特徴とする文書要約装置。
  3. 【請求項3】 請求項1又は2記載の文書要約装置にお
    いて、前記要約文構成要素生成部は、前記共有情報に関
    してユーザーの関心度の高い情報に重点をおくために前
    記属性値に優先順位を設定することを特徴とする文書要
    約装置。
JP9100432A 1997-04-17 1997-04-17 文書要約装置 Expired - Fee Related JP3001047B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP9100432A JP3001047B2 (ja) 1997-04-17 1997-04-17 文書要約装置
US09/061,096 US6338034B2 (en) 1997-04-17 1998-04-16 Method, apparatus, and computer program product for generating a summary of a document based on common expressions appearing in the document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9100432A JP3001047B2 (ja) 1997-04-17 1997-04-17 文書要約装置

Publications (2)

Publication Number Publication Date
JPH10293762A JPH10293762A (ja) 1998-11-04
JP3001047B2 true JP3001047B2 (ja) 2000-01-17

Family

ID=14273798

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9100432A Expired - Fee Related JP3001047B2 (ja) 1997-04-17 1997-04-17 文書要約装置

Country Status (2)

Country Link
US (1) US6338034B2 (ja)
JP (1) JP3001047B2 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6789230B2 (en) * 1998-10-09 2004-09-07 Microsoft Corporation Creating a summary having sentences with the highest weight, and lowest length
US6924828B1 (en) * 1999-04-27 2005-08-02 Surfnotes Method and apparatus for improved information representation
JP2000348041A (ja) 1999-06-03 2000-12-15 Nec Corp 文書検索方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体
JP2001101207A (ja) * 1999-09-30 2001-04-13 Oki Electric Ind Co Ltd 文書要約装置
US7475334B1 (en) * 2000-01-19 2009-01-06 Alcatel-Lucent Usa Inc. Method and system for abstracting electronic documents
GB2360609A (en) * 2000-03-22 2001-09-26 Ibm Dynamically generating expanded user messages in a computer system
US6763500B2 (en) 2000-12-01 2004-07-13 Microsoft Corporation Real-time-on-demand dynamic document generation
US8484177B2 (en) * 2001-03-21 2013-07-09 Eugene M. Lee Apparatus for and method of searching and organizing intellectual property information utilizing a field-of-search
US6990634B2 (en) * 2001-04-27 2006-01-24 The United States Of America As Represented By The National Security Agency Method of summarizing text by sentence extraction
US7925616B2 (en) 2001-06-19 2011-04-12 Microstrategy, Incorporated Report system and method using context-sensitive prompt objects
US7861161B1 (en) 2001-06-19 2010-12-28 Microstrategy, Inc. Report system and method using prompt objects
US7302639B1 (en) * 2001-06-19 2007-11-27 Microstrategy, Inc. Report system and method using prompt in prompt objects
US7356758B1 (en) 2001-06-19 2008-04-08 Microstrategy Incorporated System and method for run-time report resolution of reports that include prompt objects
US9009590B2 (en) * 2001-07-31 2015-04-14 Invention Machines Corporation Semantic processor for recognition of cause-effect relations in natural language documents
WO2003012661A1 (en) * 2001-07-31 2003-02-13 Invention Machine Corporation Computer based summarization of natural language documents
US8799776B2 (en) * 2001-07-31 2014-08-05 Invention Machine Corporation Semantic processor for recognition of whole-part relations in natural language documents
JP2003196270A (ja) * 2001-12-27 2003-07-11 Sharp Corp 文書情報処理方法、文書情報処理装置、通信システム、コンピュータプログラム、及び記録媒体
JP2003248676A (ja) * 2002-02-22 2003-09-05 Communication Research Laboratory 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法
JP3624186B2 (ja) * 2002-03-15 2005-03-02 Tdk株式会社 スイッチング電源装置用の制御回路及びこれを用いたスイッチング電源装置
JP2004030021A (ja) * 2002-06-24 2004-01-29 Oki Electric Ind Co Ltd 文書処理装置および方法
KR100463655B1 (ko) * 2002-11-15 2004-12-29 삼성전자주식회사 부가 정보 제공 기능이 있는 텍스트/음성 변환장치 및 방법
US7376552B2 (en) * 2003-08-12 2008-05-20 Wall Street On Demand Text generator with an automated decision tree for creating text based on changing input data
US8868670B2 (en) * 2004-04-27 2014-10-21 Avaya Inc. Method and apparatus for summarizing one or more text messages using indicative summaries
JP2006023878A (ja) * 2004-07-07 2006-01-26 Quin Land Co Ltd データ抽出システム
KR100785927B1 (ko) * 2006-06-02 2007-12-17 삼성전자주식회사 데이터 요약 생성 방법 및 장치
US9031947B2 (en) * 2007-03-27 2015-05-12 Invention Machine Corporation System and method for model element identification
US7925496B1 (en) 2007-04-23 2011-04-12 The United States Of America As Represented By The Secretary Of The Navy Method for summarizing natural language text
US20080270119A1 (en) * 2007-04-30 2008-10-30 Microsoft Corporation Generating sentence variations for automatic summarization
KR100895535B1 (ko) 2007-05-10 2009-04-30 (주) 지육공팔 컨설팅그룹 데이터 검색 장치 및 그 방법
US20090018819A1 (en) * 2007-07-11 2009-01-15 At&T Corp. Tracking changes in stratified data-streams
US8984398B2 (en) * 2008-08-28 2015-03-17 Yahoo! Inc. Generation of search result abstracts
EP2406739A2 (en) * 2009-03-13 2012-01-18 Invention Machine Corporation System and method for knowledge research
EP2406738A4 (en) * 2009-03-13 2012-08-15 Invention Machine Corp SYSTEM AND METHOD FOR RESPONSE TO QUESTIONS THAT INVOLVE THE APPOSITION OF SEMANTIC MARKS ON TEXT DOCUMENTS AND USER QUESTIONS
JP5388038B2 (ja) * 2009-12-28 2014-01-15 独立行政法人情報通信研究機構 文書要約装置、文書処理装置、及びプログラム
US9727556B2 (en) 2012-10-26 2017-08-08 Entit Software Llc Summarization of a document
JP6338842B2 (ja) * 2013-11-01 2018-06-06 キヤノンメディカルシステムズ株式会社 医用処理装置及び医用処理プログラム
US10387538B2 (en) 2016-06-24 2019-08-20 International Business Machines Corporation System, method, and recording medium for dynamically changing search result delivery format
US10482180B2 (en) * 2017-11-17 2019-11-19 International Business Machines Corporation Generating ground truth for questions based on data found in structured resources
JP2021114184A (ja) * 2020-01-20 2021-08-05 シャープ株式会社 要約生成装置、要約生成方法、及びプログラム

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4965763A (en) * 1987-03-03 1990-10-23 International Business Machines Corporation Computer method for automatic extraction of commonly specified information from business correspondence
JPH01290076A (ja) 1988-05-18 1989-11-21 Canon Inc 自然言語処理装置
JP2783558B2 (ja) * 1988-09-30 1998-08-06 株式会社東芝 要約生成方法および要約生成装置
JPH02112069A (ja) 1988-10-21 1990-04-24 Hitachi Ltd 自動要約方式
JPH03191475A (ja) 1989-12-20 1991-08-21 Nec Corp 文書要約方式
JPH0418673A (ja) * 1990-05-11 1992-01-22 Hitachi Ltd テキスト情報抽出方法および装置
JPH0748217B2 (ja) 1990-07-17 1995-05-24 工業技術院長 文書要約装置
JPH0743728B2 (ja) 1990-08-02 1995-05-15 工業技術院長 要約文生成方式
EP0523269A1 (de) * 1991-07-18 1993-01-20 International Business Machines Corporation Computersystem zur Datenverwaltung
JPH05233729A (ja) 1992-02-24 1993-09-10 Nippon Telegr & Teleph Corp <Ntt> 要約選択型情報提供装置
JP2944346B2 (ja) 1993-01-20 1999-09-06 シャープ株式会社 文書要約装置
JPH06259423A (ja) 1993-03-02 1994-09-16 N T T Data Tsushin Kk 要約自動作成方式
US5638543A (en) * 1993-06-03 1997-06-10 Xerox Corporation Method and apparatus for automatic document summarization
JP3300142B2 (ja) 1993-12-17 2002-07-08 シャープ株式会社 自然言語処理装置
US5689716A (en) * 1995-04-14 1997-11-18 Xerox Corporation Automatic method of generating thematic summaries
US5918240A (en) * 1995-06-28 1999-06-29 Xerox Corporation Automatic method of extracting summarization using feature probabilities
US5778397A (en) * 1995-06-28 1998-07-07 Xerox Corporation Automatic method of generating feature probabilities for automatic extracting summarization
US5838323A (en) * 1995-09-29 1998-11-17 Apple Computer, Inc. Document summary computer system user interface
US5848191A (en) * 1995-12-14 1998-12-08 Xerox Corporation Automatic method of generating thematic summaries from a document image without performing character recognition
US5924108A (en) * 1996-03-29 1999-07-13 Microsoft Corporation Document summarizer for word processors
US5857184A (en) * 1996-05-03 1999-01-05 Walden Media, Inc. Language and method for creating, organizing, and retrieving data from a database
US5963965A (en) * 1997-02-18 1999-10-05 Semio Corporation Text processing and retrieval system and method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
土井,西村「日本語テキスト要約」NEC技報,Vol.47,No.8,1994,p48−52(平6−9−16)
安藤,土井,村木「新聞記事からの情報抽出と多言語インデックス付与」情報処理学会第48回(平成6年前期)全国大会講演論文集(3),p.105−106(平6−3−23)

Also Published As

Publication number Publication date
US20010016809A1 (en) 2001-08-23
US6338034B2 (en) 2002-01-08
JPH10293762A (ja) 1998-11-04

Similar Documents

Publication Publication Date Title
JP3001047B2 (ja) 文書要約装置
US8484238B2 (en) Automatically generating regular expressions for relaxed matching of text patterns
JP3266586B2 (ja) データ分析システム
US20020122053A1 (en) Method and apparatus for presenting non-displayed text in Web pages
CN111597351A (zh) 可视化文档图谱构建方法
JP2007517338A (ja) サーチ品質の改善システムおよび改善方法
GB2401972A (en) Identifying special word usage in a document
KR101933953B1 (ko) 페이지랭크와 토픽 모델링을 이용한 소프트웨어 도메인 토픽 추출 시스템
US8533211B2 (en) Information extraction across multiple expertise-specific subject areas
CN112380337A (zh) 基于富文本的高亮方法及装置
JP2001084250A (ja) 膨大な文書データからの知識抽出方法、その装置及び媒体
Gupta et al. Text analysis and information retrieval of text data
JP2005148936A (ja) 社会的な関係を用いてユーザの評価コメントを要約する文書処理装置、その方法及びプログラム
JP2005316590A (ja) 情報検索装置
JP4384736B2 (ja) 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003099429A (ja) 用語集生成装置及び用語集生成プログラム並びに用語集検索装置
JPH1145254A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002297667A (ja) 文書閲覧装置
Sulaksono et al. Automatic Article Summary with the Term Frequency-Inverse Document Frequency Algorithm for Information on Elderly Health
US20220292126A1 (en) Information management system
ter Stal et al. Twenty-one: cross-language disclosure and retrieval of multimedia documents on sustainable development
JP2830097B2 (ja) 文章検索方式
JP2010165041A (ja) 正解判定装置、正解判定システム、正解判定方法および正解判定プログラム
JPH1145255A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2939348B2 (ja) 画像処理装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19991013

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071112

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081112

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081112

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091112

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091112

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101112

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees