JP2000099526A - 文書情報抽出装置 - Google Patents
文書情報抽出装置Info
- Publication number
- JP2000099526A JP2000099526A JP26610598A JP26610598A JP2000099526A JP 2000099526 A JP2000099526 A JP 2000099526A JP 26610598 A JP26610598 A JP 26610598A JP 26610598 A JP26610598 A JP 26610598A JP 2000099526 A JP2000099526 A JP 2000099526A
- Authority
- JP
- Japan
- Prior art keywords
- document
- information
- document data
- display
- extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
示領域に表示する際に、ユーザにとって読み取りやすい
スクロール速度となるように制御する文書情報抽出装置
を提供すること。 【解決手段】 抽出結果の表示中、スクロール速度の設
定の変更が行われた場合(ステップS21)には、基本
スクロール速度を変更する(ステップS22)。表示中
の抽出結果の重要度が変化した場合(ステップS23)
には、重要度をもとに基本スクロール速度に対するスク
ロール速度係数を計算し(ステップS24)、スクロー
ル速度を基本スクロール速度とスクロール速度係数の積
として送出する。抽出結果の表示がすべて完了した時
(ステップS25)には、スクロール速度の制御を終了
する。
Description
複数の文書データから特定の情報、例えば要約情報を抽
出してユーザに提示する文書情報抽出装置において、特
にユーザインタフェースに着目した文書情報抽出装置で
ある。
を抽出する技術として、最も単純な例の一つにKWIC
を挙げることができる。KWICとは key word in con
textの略で、ある特定の単語、あるいは単語に限らず任
意の文字列に関して、その文字列を含む前後の一定長の
文字列を抽出し、表示を行う技術である。図7はKWI
Cの実行結果例であるが、この図では文書データ中に出
現する指定単語「文書データ」を中心としてその前後の
文章の表示が行われている。KWICは特定の単語に関
して、その単語が使用される前後の文脈の把握が容易で
あるため、情報検索装置におけるキーワード検索機能な
どにおいて非常に頻繁に利用される技術である。
雑な例としては、文書中の重要文抽出技術や文書要約技
術を挙げることができる。重要文抽出技術とは文字どお
り、文書中で重要度が高いと思われる文を抽出し、表示
を行う技術である。この技術は文書データ、特にサイズ
の大きい文書データに対して、重要度が高いと判定され
た文のみを抜き出して表示を行うことにより、装置の使
用者がより少ない労力で文書データの概略把握を行える
ような手段を提供することを目的とするものである。文
の重要度の判定には、自然言語処理と呼ばれる技術に属
する構文解析技術や意味解析技術が使用されることが多
い。
出した情報をそのまま表示するのではなく、抽出した情
報をさらに加工し、再構成してから表示する点に特徴が
ある。例えば文書データから重要と思われる単語や文、
あるいは段落といった情報の抽出を行うのであるが、抽
出した情報をそのまま並べて表示するのではなく、人間
にとって読みやすい文となるような処理を加えてから表
示する。
の処理にも自然言語処理技術が頻繁に使用される。例え
ば抽出した文間への接続詞の挿入、文脈処理による主語
や目的語の補完、文の態の変換などである。このように
文書要約技術は、正確には情報抽出にとどまる技術では
なく、抽出した情報を更に加工、再構成する技術をも含
んでいるが、一般にはこの両者をあわせて情報抽出と呼
ぶことも多く、本発明においてもこのような意味で情報
抽出という言葉を用いることにする。
現手段としてはすでにいくつもの方法が提案されてお
り、例えば言語処理学会第4回年次大会ワークショップ
などにおいても効率的、高精度な方法の提案が行われて
いる。重要文抽出技術については、商用のシステムにお
いてもワードプロセッサの1機能等として使用されてい
る。またこれらの他にも、固有名詞を含む文の抽出や、
日付表現を含む文の抽出など、様々な形での情報抽出装
置が提案、実現されている。
プロセッサやパーソナルコンピュータ、あるいはインタ
ーネットの普及によって益々増大する傾向にある大量、
大容量の電子化文書データの中から、ユーザにとって必
要な情報をすばやく探し出すという情報検索の目的、あ
るいは文書の概略をユーザがすばやく理解できるような
手段を提供するという速読支援の目的で使用されるのが
これまで一般的である。
抽出装置においては、抽出結果をユーザに提示する際の
表示の形態として、抽出結果の一覧性に重点が置かれる
ことが多い。すなわち、大量の文書データの中から何ら
かの情報を取り出す必要に迫られているユーザを前提と
し、ユーザがその目的をより効率よく、より短時間で達
成できるような手段を提供するための表示形態である。
データを取り扱う際の労力を減少させ、作業の能率を向
上させたいという欲求から生まれた実利的な方法である
が、近年のインターネットの普及による電子メール、電
子掲示板、あるいはWWW(World Wide Web)と呼ばれる
ハイパーテキスト形式での文書データの流通は一方で、
大量、大容量の文書データの閲覧、編集、管理を好み、
それ自体に娯楽性を感じるユーザをも生み出している。
っては情報抽出技術自体が有用であり、インターネット
上の検索エンジンなどのように情報抽出技術が搭載され
た装置が頻繁に使用されることに変わりはないが、一覧
性を重視した従来の表示形態は必ずしもユーザの嗜好を
満たすものではなかった。
ルコンピュータにおいて主流となっているような、複数
のプログラムモジュールを同時に実行可能であるマルチ
タスクオペレーティングシステム上で実現された文書情
報抽出装置について考えてみると、ユーザは装置が備え
る情報抽出の機能を利用する一方で、装置が備える別の
機能、例えば文書作成のためのワードプロセッサ機能
や、あるいはゲームの機能などを同時に実行するといっ
た、いわゆる「ながら作業」となるような利用状況が頻
繁に発生する。
した従来の表示形態では、表示手段において相当部分の
表示領域を占有して結果の表示を行う必要があり、ユー
ザが別の作業のために使用できる表示領域が限られたも
のになってしまうという問題があった。本発明は、上記
問題点に鑑み、文書データから抽出された情報を限られ
た表示領域に表示する際に、ユーザにとって読み取りや
すいスクロール速度となるように制御する文書情報抽出
装置を提供することを目的とする。
置は、文書データから特定情報を抽出する文書情報抽出
手段と、該文書情報抽出手段によって抽出された特定情
報を表示する表示手段とを備えるものであって、前記表
示手段に前記抽出情報をスクロール表示させる表示制御
手段と、該スクロール速度を変化させるスクロール速度
制御手段とを備えるものである。
所定値よりも高い文を抽出するものであることで、文書
データ中の重要文を抽出する文書情報抽出装置におい
て、抽出結果を読みやすい速度でスクロール表示するこ
とができる。さらに、前記文書情報抽出手段は、固有名
詞を含む文を抽出するものであることで、文書データ中
の固有名詞を含む文を抽出する文書情報抽出装置におい
て、抽出結果を読みやすい速度でスクロール表示するこ
とができる。また、前記文書情報抽出手段は、日付表現
を含む文を抽出するものであることで、文書データ中の
日付表現を含む文を抽出する文書情報抽出装置におい
て、抽出結果を読みやすい速度でスクロール表示するこ
とができる。
スクロール速度ユーザ設定手段を備えることで、スクロ
ール表示の速度をユーザ設定可能とすることができる。
また、前記表示手段が表示している抽出情報に応じてス
クロール速度を制御するスクロール速度自動調節手段を
備えることで、スクロール速度を抽出内容に応じて自動
的に調節することができる。また、前記表示手段が表示
している抽出情報に応じて表示属性を制御する表示属性
自動調節手段を備えることで、文字色、文字サイズ、文
字フォントなどの表示属性を抽出内容に応じて自動的に
調節することができる。
の種類を判別する言語判別手段と、判別された言語が特
定の言語以外である場合にその特定の言語に翻訳する翻
訳処理手段とを備えることで、外国語で記述された文書
データに対しても母国語で抽出結果を表示することがで
きる。また、情報抽出の対象とする複数の文書データを
管理する情報抽出対象文書管理手段と、複数の抽出情報
を1つにまとめる抽出情報結合手段とを備えることで、
複数の文書データに対しても一度に情報抽出処理を行う
ことができる。また、前記複数の文書データの情報抽出
の順序を決定する処理順序決定手段を備えることで、複
数の文書データに対して情報抽出処理を行う際に、有用
な順番で各文書データの情報抽出処理を行うことができ
る。
表示順序を決定する表示順序決定手段を備えることで、
複数の文書データに対して情報抽出処理を行った際に、
有用な順番で各文書データからの情報抽出結果を表示す
ることができる。また、情報抽出対象である文書データ
とその抽出情報との対応を管理する抽出結果対応管理手
段と、ユーザからの入力指示を受けて、その時点で表示
手段が表示している抽出情報に対し、前記抽出結果対応
管理手段が管理している対応する元の文書データを表示
手段に表示させる元文書データ表示指示手段とを備える
ことで、ユーザが指示した時点で表示されている情報抽
出結果に対応する元の文書データを表示することが可能
となる。
ータを抽出対象から除外する文書データフィルタリング
手段を備えることで、特定の条件を満たす文書データの
みを情報抽出処理の対象とすることができる。また、通
信手段を介して文書データを取得するネットワーク文書
取得手段を備えることで、ネットワーク上に存在する文
書データに対しても情報抽出処理を行うことができる。
り取得した文書データがハイパーテキスト形式である場
合、その文書データのリンク情報を解析してリンク先の
文書データを取得するハイパーテキスト自動探索手段を
備えることで、ネットワーク上に存在するハイパーテキ
スト形式の文書データに関連する文書データについて一
括して情報抽出処理を行うことができる。また、本発明
はコンピュータを上記の文書情報抽出装置として機能さ
せるためのプログラムを記録したコンピュータ読み取り
可能な記録媒体である。
明の好適な実施の形態について詳細に説明する。図1は
本発明の一実施の形態による表示の一例であり、時間経
過にともなって徐々に表示がスクロールされる様子を表
している。表示領域に表示しきれない分量の情報を表示
するときに、先頭部分から徐々に表示を行って、表示領
域がいっぱいになった時点で先頭部分の情報の表示を消
去し、消去した部分を詰めるようにして現在の表示位置
を移動、再表示させ、それによって新しく利用可能とな
った表示領域に続きの情報を表示するという手順を繰り
返して順に全情報を出力する手法がスクロール表示であ
り、このようなスクロール表示は、表示領域の限られた
表示装置を持つおおかたの情報処理装置一般で非常に頻
繁に用いられる手法である。表示を書き換えて続きの情
報を表示するタイミングとしては、表示すべき情報が装
置によって生成・用意された時点、あるいはユーザが何
らかの指示手段によって指示を行った時点で行われるの
が通常である。
すブロック図である。記憶装置1は、磁気ディスク等の
磁気記憶装置、CD−ROM等の光記憶装置、RAM等
の半導体記憶装置など、一般の計算機において使用され
る記憶装置1でよく、文書データはこの記憶装置1のフ
ァイルシステム上に格納される。
らかの情報を抽出するための手段であり、例えば文書デ
ータから特定の情報を抽出するためのアルゴリズムを記
述したソフトウェア、およびそのソフトウェアを実行す
るCPUにより実現可能である。表示手段14にはCR
TやLCDなど、リアルタイムで表示の更新が可能な一
般の表示装置を使用することができる。表示制御手段1
3は、表示手段14に対して表示情報を送出するための
手段であり、例えば表示手段に対するドライバーソフト
ウェアとして実現可能である。このドライバーソフトウ
ェアは、表示手段における表示内容を一定期間毎に更新
できるように設計された通常のドラバーソフトウェアで
よい。
のスクロールが所定の速度となるよう表示制御手段13
に対してタイミング信号を送出するための手段であり、
例えば一定期間毎に割り込み信号を発生させるタイマー
装置と、その割り込み信号をもとにして表示装置14に
おける表示更新のタイミングを制御するソフトウェアと
して実現可能である。このソフトウェアは、割り込み信
号をカウントし、一定カウント毎に表示制御手段13に
対してタイミング信号を送るといったアルゴリズムのも
のでよい。
は様々なものが考えられるが、文書データ中から例えば
重要度の高い文を抽出するアルゴリズムによって実現す
ることができる。特開平6−215049号公報におい
て文書中の要約を抽出する手順が説明されており、例え
ばこのようなアルゴリズムを用いることで、実現するこ
とが可能である。文書情報抽出手段8を、文書データ中
から固有名詞を含む文を抽出するアルゴリズムにより実
現することもできる。
中の固有名詞をより高い精度で検出する手順が説明され
ており、例えばこのようなアルゴリズムを用いること
で、実現することが可能である。文書情報抽出手段8
を、文書データ中から日付表現を含む文を抽出するアル
ゴリズムにより実現することもできる。特開平5−15
8971号公報において、文書中の日付表現を柔軟に検
出するための手順が説明されており、例えばこのような
アルゴリズムを用いることで、実現することができる。
ーザの好みにスクロール速度を設定するための手段であ
り、これはキーボードなどユーザが設定を指示するため
の手段と、その設定内容を記憶するメモリーにより実現
可能である。メモリーの内容をスクロール速度制御手段
15が参照することにより、スクロール速度が調節され
る。
情報抽出手段8による情報抽出時の情報をもとにしてス
クロール速度を決定する。これは、例えば文書情報抽出
手段8について考えると、情報抽出時に計算される各文
の重要度をもとにし、重要度とスクロール速度を対応付
けるアルゴリズムによりスクロール速度を決定するソフ
トウェアとして実現が可能である。
度を各文の重要度の逆数に比例する値として計算すれ
ば、重要度の低い文については速い速度でスクロールが
行われるため表示が一瞬で過ぎ去り、また重要度の高い
文についてはゆっくりとした速度でスクロールが行われ
るためユーザはその情報をじっくりと読むことが可能と
なる。
出手段による情報抽出時の情報をもとにして表示色や表
示サイズ、表示フォントを変更したり、点滅表示させる
などの表示属性を決定し、その内容を表示制御手段13
に送出する。これは、情報抽出時に計算される各文の重
要度をもとにし、重要度の高い文のみ表示色を変更する
といったアルゴリズムのソフトウェアとして実現が可能
である。
ることで、情報抽出結果を常に日本語で表示することが
可能となる。言語判別手段9は、対象となる文または文
書の文字コードや出現単語を調べるソフトウェアにより
実現可能である。翻訳処理手段10は、構文解析処理
部、格解析処理部、生成処理部などを備えた通常の翻訳
処理ソフトウェアなどとして実現可能である。
は図2中に示されるように、文書情報抽出手段8と表示
順序決定手段11(後述)の間に挿入することで、文書
情報抽出結果に対して翻訳処理を行ってもよいし、ある
いは処理順序決定手段7と文書情報抽出手段8の間に挿
入することで、文書情報抽出処理を行う前に翻訳処理を
行っても構わない。あるいは抽出情報結合手段12と表
示制御手段13の間に挿入するといったことも可能であ
る。言語判別手段9、翻訳処理手段10の挿入位置は自
由度が高い。
の対象とする複数の文書データを管理するための手段で
あり、それぞれの文書データへのファイルアクセスを制
御するファイルポインタを管理するためのソフトウェア
として実現可能である。これにより、複数の文書に対し
て続けて情報抽出処理を行うことを可能とする。抽出情
報結合手段12は、複数の文書データからの情報抽出結
果を1つにまとめて表示制御手段13に送るための手段
であるが、これは各文書データからの情報抽出結果を順
番に続けてメモリーに書き込み、書き込まれたメモリー
の内容を表示制御手段13へと受け渡すアルゴリズムを
持ったソフトウェアとして実現可能である。これによ
り、一括して結果を表示することが可能になる。
管理手段6において管理されている文書データに対し
て、その処理順序を決定するための手段である。これ
は、例えば情報抽出対象文書管理手段6において管理さ
れている文書データについて、文書データ作成日時をも
とにソートを行うようなソフトウェアにより、作成日時
の新しい順番で文書情報抽出手段8に文書データの内容
を送出することで実現可能である。
タから文書情報抽出手段8によって抽出されたそれぞれ
の情報抽出結果に対して、その表示順序を決定する手段
であるが、これは例えば文書情報抽出手段8において情
報抽出時に中間的に作成される抽出結果の重要度などを
もとにして、重要度の高かった抽出結果から順に抽出情
報結合手段12へと送信する、といったソフトウェアに
より実現可能である。
ータ処理時に、それぞれの文書データからの情報抽出結
果と、その元文書データとの対応を保持するための手段
である。これは、各文書データからの情報抽出結果と、
その元文書のファイルポインタの対応関係をメモリー上
に記憶させることで実現可能である。元文書データ表示
指示手段19は、キーボードやマウスなど、一般の入力
装置により実現される。
からの指示を受けたときには、抽出結果対応管理手段2
0が管理する対応情報をもとにして現在表示装置に表示
中の情報抽出結果に対応する元文書データのファイルポ
インタを取得し、この文書データの内容を表示制御手段
13に対して送出することで元文書データを閲覧するこ
とが可能となる。これによりユーザは複数の文書データ
の抽出情報をスクロール表示で次々と眺めながら、必要
な情報が出現した時点で即座に元の文書データを閲覧す
ることが可能となる。
装置1中に格納されている文書データのうち特定条件に
従うものだけを情報抽出の対象とするための手段であ
る。これは、例えば記憶装置1中に格納されている各文
書データに対して文書データ作成日時を取得するソフト
ウェアにより、特定期間に作成された文書データのみを
情報抽出対象文書管理手段6での管理対象とすることで
実現可能である。あるいは、文書データの内容を検索し
て特定のキーワードを含む文書データを検出するソフト
ウェアにより、キーワードを含む文書データのみを情報
抽出の対象とすることも可能である。通信手段2は、ネ
ットワーク上に接続された他の計算機と通信を行う手段
であるが、これにはイーサネットなど通常のネットワー
ク環境において使用されるハードウェア、およびそのド
ライバソフトウェアでよい。
2によりアクセス可能となったネットワーク上の文書デ
ータに対して、その内容を読み出すソフトウェアとして
実現可能である。通信手段2、ネットワーク文書取得手
段3を備えることにより、他の計算機の記憶装置中に格
納されている文書データであってもネットワークを介し
て本発明の装置が備える記憶装置1中に存在する文書デ
ータと全く同様に情報抽出処理を行うことが可能とな
る。
トワーク文書取得手段3により取得された文書データが
ハイパーテキスト形式である文書データである場合に、
この文書内のリンク情報を解析することで、ネットワー
ク文書取得手段3で更に次々と文書データを取得するた
めの手段である。これは、例えばインターネットにおい
て頻繁に用いられるHTML形式のハイパーテキスト文
書であればHTMLタグを解析し、解析したリンク情報
をネットワーク文書取得手段3へと受け渡すソフトウェ
アとして実現可能である。これにより、ネットワーク上
の計算機の記憶装置中に散在する大量の文書データに対
して一括で情報抽出処理を行うことが可能となる。
図2の構成を持つ情報抽出装置全体において、例えば1
ヶ月以内に作成された文書データから情報抽出処理を行
い、重要度順に結果の表示を行うような場合の処理フロ
ー図である。ステップS1では本発明が備える記憶装置
1、あるいは本発明と接続されたネットワーク上の文書
データから1ヶ月以内に作成された文書データのみを選
択して取得する。これは図2においては記憶装置1、通
信手段2、ネットワーク文書取得手段3、ハイパーテキ
スト自動探索手段4、文書データフィルタリング手段
5、情報抽出対象文書管理手段6により行われる。
序を決定するために、文書データの作成日時順にソート
を行う。この処理は文書データを処理順序決定手段7に
より行われる。ステップS3では、各文書データから情
報抽出処理を行い。それぞれの抽出結果に対して重要度
を算出する。この処理は文書情報抽出手段8により行わ
れる。ステップS4では、ステップS3で処理が行われ
た抽出結果に対して、これが英文であるときには日本語
へと翻訳処理を行う。この処理は言語判別手段9、翻訳
処理手段10により行われる。
出結果をステップS3で計算された重要度をもとにして
ソートする。この処理は表示順序決定手段11により行
われる。ステップS6では抽出結果を順に出力する。こ
の処理は抽出情報結合手段12、表示制御手段13、表
示手段14により行われる。抽出結果の表示中にユーザ
によって元文書表示指示が行われた場合(ステップS1
1)には、抽出結果対応管理手段20によって表示中の
抽出結果に対応する元文書データが表示制御手段13へ
と送出される(ステップS12)。
ップS13)には、ユーザからの指示の検出を終了す
る。抽出結果の表示中、スクロール速度ユーザ設定手段
17によってスクロール速度の設定の変更が行われた場
合(ステップS21)には、基本スクロール速度を変更
し(ステップS22)、スクロール速度制御手段15で
その速度に応じたタイミング信号を表示制御手段13に
送出する。
(ステップS23)には、スクロール速度自動調節手段
16において重要度をもとに基本スクロール速度に対す
るスクロール速度係数を計算し(ステップS24)、ス
クロール速度を基本スクロール速度とスクロール速度係
数の積としてスクロール速度制御手段15はタイミング
信号を表示制御手段13に対して送出する。この際、例
えば、非重要文から重要文にスクロールしていくとき、
重要文が表示に占める割合に応じてスクロールを徐々に
遅くしたり、重要文が表示に占める割合が所定値に達し
たときにスクロールを遅くしたりすることができる。
ップS25)には、スクロール速度の制御を終了する。
また、表示中の抽出結果の重要度が変化した場合(ステ
ップS31)には、表示属性自動調節手段18において
重要度をもとに表示文字サイズ等の表示属性を変更する
(ステップS32)。変更された表示属性情報は、表示
制御手段に送出される。抽出結果の表示がすべて完了し
た時(ステップS33)には、表示属性の制御を終了す
る。なお、本発明は上記実施の形態に限定されるもので
はない。
出装置において、抽出結果を読みやすい速度でスクロー
ル表示し、動きのある結果表示によってユーザの注意を
引き付けやすい、魅力的な表示形態とすることが可能と
なる。また例えばある文書の要約結果を、限られた表示
領域の中でもユーザにとって読み取りやすい自然な速度
となるようスクロール速度を制御しながら表示を行うこ
とによって、マルチタスクオペレーティングシステム上
での「ながら」作業の中でも、別の作業を行いながら快
適に対象文書のすばやい内容把握が可能となるような文
書情報抽出装置を構成することも可能となる。
の重要文を抽出する文書情報抽出装置において、抽出結
果を読みやすい速度でスクロール表示する、新しい表示
形態を提供することができる。請求項3に係る発明によ
り、文書データ中の固有名詞を含む文を抽出する文書情
報抽出装置において、抽出結果を読みやすい速度でスク
ロール表示する、新しい表示形態を提供することができ
る。請求項4に係る発明により、文書データ中の日付表
現を含む文を抽出する文書情報抽出装置において、抽出
結果を読みやすい速度でスクロール表示する、新しい表
示形態を提供することができる。
示の速度をユーザ設定可能とすることができる。請求項
6に係る発明により、スクロール速度を抽出内容に応じ
て自動的に調節することができる。請求項7に係る発明
により、文字色、文字サイズ、文字フォントなどの表示
属性を抽出内容に応じて自動的に調節することができ
る。
された文書データに対しても母国語で抽出結果を表示す
ることができる。請求項9に係る発明により、複数の文
書データに対しても一度に情報抽出処理を行うことがで
きる。請求項10に係る発明により、複数の文書データ
に対して情報抽出処理を行う際に、有用な順番で各文書
データの情報抽出処理を行うことができる。
データに対して情報抽出処理を行った際に、有用な順番
で各文書データからの情報抽出結果を表示することがで
きる。請求項12に係る発明により、ユーザが指示した
時点で表示されている情報抽出結果に対応する元の文書
データを表示することが可能となる。請求項13に係る
発明により、特定の条件を満たす文書データのみを情報
抽出処理の対象とすることができる。
ク上に存在する文書データに対しても情報抽出処理を行
うことができる。請求項15に係る発明により、ネット
ワーク上に存在するハイパーテキスト形式の文書データ
に関連する文書データについて一括して情報抽出処理を
行うことができる。請求項16に係る発明により、上記
の文書情報抽出装置を記録媒体として実現することがで
きる。
図である。
である。
出する処理フロー図である。
元文書を表示する処理フロー図である。
理フロー図である。
ー図である。
一例を示す図である。
Claims (16)
- 【請求項1】 文書データから特定情報を抽出する文書
情報抽出手段と、該文書情報抽出手段によって抽出され
た特定情報(以下「抽出情報」という)を表示する表示
手段とを備える文書情報抽出装置において、前記表示手
段に前記抽出情報をスクロール表示させる表示制御手段
と、該スクロール速度を変化させるスクロール速度制御
手段とを備えることを特徴とする文書情報抽出装置。 - 【請求項2】 前記文書情報抽出手段は、重要度が所定
値よりも高い文を抽出するものであることを特徴とする
請求項1記載の文書情報抽出装置。 - 【請求項3】 前記文書情報抽出手段は、固有名詞を含
む文を抽出するものであることを特徴とする請求項1記
載の文書情報抽出装置。 - 【請求項4】 前記文書情報抽出手段は、日付表現を含
む文を抽出するものであることを特徴とする請求項1記
載の文書情報抽出装置。 - 【請求項5】 ユーザがスクロール速度を設定するスク
ロール速度ユーザ設定手段を備えることを特徴とする請
求項1記載の文書情報抽出装置。 - 【請求項6】 前記表示手段が表示している抽出情報に
応じてスクロール速度を制御するスクロール速度自動調
節手段を備えることを特徴とする請求項1記載の文書情
報抽出装置。 - 【請求項7】 前記表示手段が表示している抽出情報に
応じて表示属性を制御する表示属性自動調節手段を備え
ることを特徴とする請求項1記載の文書情報抽出装置。 - 【請求項8】 前記文書データ又は抽出情報の言語の種
類を判別する言語判別手段と、判別された言語が特定の
言語以外である場合にその特定の言語に翻訳する翻訳処
理手段とを備えることを特徴とする請求項1記載の文書
情報抽出装置。 - 【請求項9】 情報抽出の対象とする複数の文書データ
を管理する情報抽出対象文書管理手段と、複数の抽出情
報を1つにまとめる抽出情報結合手段とを備えることを
特徴とする請求項1記載の文書情報抽出装置。 - 【請求項10】 前記複数の文書データの情報抽出の順
序を決定する処理順序決定手段を備えることを特徴とす
る請求項9記載の文書情報抽出装置。 - 【請求項11】 前記複数の文書データの抽出情報の表
示順序を決定する表示順序決定手段を備えることを特徴
とする請求項9記載の文書情報抽出装置。 - 【請求項12】 情報抽出対象である文書データとその
抽出情報との対応を管理する抽出結果対応管理手段と、
ユーザからの入力指示を受けて、その時点で表示手段が
表示している抽出情報に対し、前記抽出結果対応管理手
段が管理している対応する元の文書データを表示手段に
表示させる元文書データ表示指示手段とを備えることを
特徴とする請求項1記載の文書情報抽出装置。 - 【請求項13】 所定の条件を満たしていない文書デー
タを抽出対象から除外する文書データフィルタリング手
段を備えることを特徴とする請求項1記載の文書情報抽
出装置。 - 【請求項14】 通信手段を介して文書データを取得す
るネットワーク文書取得手段を備えることを特徴とする
請求項1記載の文書情報抽出装置。 - 【請求項15】 前記ネットワーク文書取得手段により
取得した文書データがハイパーテキスト形式である場
合、その文書データのリンク情報を解析してリンク先の
文書データを取得するハイパーテキスト自動探索手段を
備えることを特徴とする請求項14記載の文書情報抽出
装置。 - 【請求項16】 コンピュータを請求項1乃至15いず
れかに記載の文書情報抽出装置として機能させるための
プログラムを記録したことを特徴とするコンピュータ読
み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26610598A JP3647283B2 (ja) | 1998-09-21 | 1998-09-21 | 文書情報抽出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26610598A JP3647283B2 (ja) | 1998-09-21 | 1998-09-21 | 文書情報抽出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000099526A true JP2000099526A (ja) | 2000-04-07 |
JP3647283B2 JP3647283B2 (ja) | 2005-05-11 |
Family
ID=17426394
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26610598A Expired - Fee Related JP3647283B2 (ja) | 1998-09-21 | 1998-09-21 | 文書情報抽出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3647283B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7254780B2 (en) | 2001-06-29 | 2007-08-07 | Seiko Epson Corporation | System, device and method for controlling display presentation order |
JP2008170544A (ja) * | 2007-01-09 | 2008-07-24 | Sharp Corp | テロップ表示制御装置およびテロップ表示制御方法 |
JP2009020159A (ja) * | 2007-07-10 | 2009-01-29 | Sharp Corp | 文字列表示装置および文字列表示方法 |
JP2011204001A (ja) * | 2010-03-25 | 2011-10-13 | Fujitsu Toshiba Mobile Communications Ltd | 情報処理装置 |
JP2013045320A (ja) * | 2011-08-25 | 2013-03-04 | National Institute Of Information & Communication Technology | コンテンツ提示装置、コンテンツ提示プログラムおよびコンテンツ提示方法 |
US8671359B2 (en) | 2003-03-07 | 2014-03-11 | Nec Corporation | Scroll display control |
WO2018061174A1 (ja) * | 2016-09-30 | 2018-04-05 | 株式会社オプティム | 電子書籍作成システム、電子書籍作成法及びプログラム |
US10705601B2 (en) | 2016-05-17 | 2020-07-07 | Fujitsu Limited | Information processing device, interest evaluation method, and non-transitory computer-readable storage medium |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02201566A (ja) * | 1989-01-30 | 1990-08-09 | Nippon Telegr & Teleph Corp <Ntt> | プログラム形情報出力制御方式 |
JPH02297274A (ja) * | 1989-04-10 | 1990-12-07 | Nippon Telegr & Teleph Corp <Ntt> | 文書出力制御方法 |
JPH03252860A (ja) * | 1990-03-02 | 1991-11-12 | Nippon Telegr & Teleph Corp <Ntt> | 情報表示制御方法 |
JPH05158971A (ja) * | 1991-05-30 | 1993-06-25 | Sharp Corp | 機械翻訳装置 |
JPH05158401A (ja) * | 1991-12-06 | 1993-06-25 | Ricoh Co Ltd | 文書速読支援表示方式並びに文書処理装置及び文書検索装置 |
JPH06187380A (ja) * | 1992-12-21 | 1994-07-08 | Nippon Telegr & Teleph Corp <Ntt> | 画像検索装置 |
JPH06215049A (ja) * | 1993-01-20 | 1994-08-05 | Sharp Corp | 文書要約装置 |
JPH06231187A (ja) * | 1993-02-08 | 1994-08-19 | Nec Corp | 自動ページめくり機能付き電子書籍装置 |
JPH077419B2 (ja) * | 1989-06-30 | 1995-01-30 | シャープ株式会社 | 機械翻訳装置における略称付き固有名詞処理方法 |
JPH07168852A (ja) * | 1993-12-15 | 1995-07-04 | Nec Corp | 電子ブック |
JPH0850471A (ja) * | 1994-08-05 | 1996-02-20 | Koito Ind Ltd | 情報表示装置およびこれを用いた表示方法 |
JPH09269923A (ja) * | 1995-06-12 | 1997-10-14 | Pointcast Inc | 情報及び広告分配システム及び方法 |
-
1998
- 1998-09-21 JP JP26610598A patent/JP3647283B2/ja not_active Expired - Fee Related
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02201566A (ja) * | 1989-01-30 | 1990-08-09 | Nippon Telegr & Teleph Corp <Ntt> | プログラム形情報出力制御方式 |
JPH02297274A (ja) * | 1989-04-10 | 1990-12-07 | Nippon Telegr & Teleph Corp <Ntt> | 文書出力制御方法 |
JPH077419B2 (ja) * | 1989-06-30 | 1995-01-30 | シャープ株式会社 | 機械翻訳装置における略称付き固有名詞処理方法 |
JPH03252860A (ja) * | 1990-03-02 | 1991-11-12 | Nippon Telegr & Teleph Corp <Ntt> | 情報表示制御方法 |
JPH05158971A (ja) * | 1991-05-30 | 1993-06-25 | Sharp Corp | 機械翻訳装置 |
JPH05158401A (ja) * | 1991-12-06 | 1993-06-25 | Ricoh Co Ltd | 文書速読支援表示方式並びに文書処理装置及び文書検索装置 |
JPH06187380A (ja) * | 1992-12-21 | 1994-07-08 | Nippon Telegr & Teleph Corp <Ntt> | 画像検索装置 |
JPH06215049A (ja) * | 1993-01-20 | 1994-08-05 | Sharp Corp | 文書要約装置 |
JPH06231187A (ja) * | 1993-02-08 | 1994-08-19 | Nec Corp | 自動ページめくり機能付き電子書籍装置 |
JPH07168852A (ja) * | 1993-12-15 | 1995-07-04 | Nec Corp | 電子ブック |
JPH0850471A (ja) * | 1994-08-05 | 1996-02-20 | Koito Ind Ltd | 情報表示装置およびこれを用いた表示方法 |
JPH09269923A (ja) * | 1995-06-12 | 1997-10-14 | Pointcast Inc | 情報及び広告分配システム及び方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7254780B2 (en) | 2001-06-29 | 2007-08-07 | Seiko Epson Corporation | System, device and method for controlling display presentation order |
US8671359B2 (en) | 2003-03-07 | 2014-03-11 | Nec Corporation | Scroll display control |
JP2008170544A (ja) * | 2007-01-09 | 2008-07-24 | Sharp Corp | テロップ表示制御装置およびテロップ表示制御方法 |
JP2009020159A (ja) * | 2007-07-10 | 2009-01-29 | Sharp Corp | 文字列表示装置および文字列表示方法 |
JP2011204001A (ja) * | 2010-03-25 | 2011-10-13 | Fujitsu Toshiba Mobile Communications Ltd | 情報処理装置 |
JP2013045320A (ja) * | 2011-08-25 | 2013-03-04 | National Institute Of Information & Communication Technology | コンテンツ提示装置、コンテンツ提示プログラムおよびコンテンツ提示方法 |
US10705601B2 (en) | 2016-05-17 | 2020-07-07 | Fujitsu Limited | Information processing device, interest evaluation method, and non-transitory computer-readable storage medium |
WO2018061174A1 (ja) * | 2016-09-30 | 2018-04-05 | 株式会社オプティム | 電子書籍作成システム、電子書籍作成法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP3647283B2 (ja) | 2005-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7747611B1 (en) | Systems and methods for enhancing search query results | |
US6968332B1 (en) | Facility for highlighting documents accessed through search or browsing | |
US7085999B2 (en) | Information processing system, proxy server, web page display method, storage medium, and program transmission apparatus | |
KR100452569B1 (ko) | 웹 브라우저 내에 그래픽 인쇄 기술의 통합 방법 및 시스템 | |
JPH10124413A (ja) | 埋め込みウェブオブジェクトの優先順位づけダウンローディングの方法と装置 | |
US20080028292A1 (en) | Techniques to facilitate reading of a document | |
US20080092032A1 (en) | Web page development environment that displays frequency of use information | |
KR980010743A (ko) | 음성 합성 방법, 음성 합성 장치, 하이퍼 텍스트의 제어 방법 및 제어 장치 | |
JPH04127370A (ja) | 情報収集システム | |
US7200808B1 (en) | Electronic document processor | |
KR100403947B1 (ko) | 개인용 전자문서를 생성하는 방법, 시스템 및 컴퓨터프로그램 제조물 | |
JP3647283B2 (ja) | 文書情報抽出装置 | |
JP2010211688A (ja) | 文書編集装置、データ処理方法及びプログラム | |
JP2806867B2 (ja) | ドキュメントデータベースの構築方法、表示方法、及び表示装置 | |
JP2001265774A (ja) | 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム | |
JP2009265770A (ja) | 重要文提示システム | |
JPH02121058A (ja) | データファイル装置とデータ連想記憶検索方法及び検索装置 | |
JP2002049644A (ja) | 情報処理装置、記憶媒体及びコンピュータプログラム | |
JPH11219361A (ja) | 文書閲覧装置およびそのプログラムを格納した記憶媒体 | |
JP2000105769A (ja) | 文書表示方法 | |
JP4186321B2 (ja) | 文書処理方法及び装置並びに記録媒体 | |
JP2001022788A (ja) | 情報検索装置および情報検索プログラムを記録した記録媒体 | |
JP2004054619A (ja) | 文書検索システム、文書検索方法、および、文書検索プログラム | |
JP4138048B2 (ja) | 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2001101207A (ja) | 文書要約装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040706 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040906 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050208 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080218 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090218 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100218 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100218 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110218 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120218 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120218 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130218 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |