JPH06162104A - 文書要素の検索装置及び検索方法 - Google Patents

文書要素の検索装置及び検索方法

Info

Publication number
JPH06162104A
JPH06162104A JP4308481A JP30848192A JPH06162104A JP H06162104 A JPH06162104 A JP H06162104A JP 4308481 A JP4308481 A JP 4308481A JP 30848192 A JP30848192 A JP 30848192A JP H06162104 A JPH06162104 A JP H06162104A
Authority
JP
Japan
Prior art keywords
image
document
search
images
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4308481A
Other languages
English (en)
Other versions
JP2601111B2 (ja
Inventor
Yoshihiro Shima
好博 嶋
Masashi Koga
昌史 古賀
Tatsuya Murakami
達也 村上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP4308481A priority Critical patent/JP2601111B2/ja
Publication of JPH06162104A publication Critical patent/JPH06162104A/ja
Application granted granted Critical
Publication of JP2601111B2 publication Critical patent/JP2601111B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 紙の文書中にある写真、図表等の文書要素を
検索する使い易いユーザインタフェース方式を提供する
ところにある。 【構成】 文書画像入力部(100)により文書画像を
入力する。文書要素の分離部(101)により入力され
た文書画像を文書要素に分離、識別する。属性登録部
(102)により分離された文書要素をマルチメディア
ファイル(103)に登録する。この文書要素を文字列
検索部(106)および拾い読み検索部(107)を用
いて検索する。 【効果】 要素画像を画面に次々に表示し、ユーザが所
望の要素を目視で見つけることができるという効果があ
る。また、要素画像を文書画像から切り出して登録する
操作、要素の関連性の付与、操作等が信頼性よく実行で
きるという効果がある。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、紙に印刷された文書を
ベースにして、テキスト、イメージなどの文書要素に分
解し、それら文書要素を光ディスク等のマルチメディア
ファイルに蓄積、検索する文書要素の検索装置及びその
検索方法に関する。
【0002】
【従来の技術】従来の検索装置については、アイ・イー
・イー・イー、コンピュータ(1987年9月)第17
頁から第41頁(J.Conklin,Hyperte
xt:An Introduction and Su
rvey,Computer,,pp.17−41,S
eptember 1987)において論じられている
ように、ノードとリンクを持ったシステムとして、ハイ
パーテキストシステムがある。しかし、これは、本発明
の対象であるような紙に印刷された文書を扱うシステム
ではない。また、本発明のように、紙の文書をもとに文
書要素を分離して登録するというユーザインタフェース
を有していない。このため、文書要素を登録するための
使い易いインタフェース方式がいかなるものか、明らか
でなかった。
【0003】また、従来の文献データベースシステム
は、イントロダクション、トウ、モダン、インフォメシ
ョンリトリーバル(1983年)第410頁から413
頁(G.Salton and M.J.McGil
l,Introductionto Modern I
nformation Retrieval,McGr
aw−Hill Book Company,pp.4
10−413,1983)に記載されているように、書
誌事項やキーワードを基にした文献単位の検索であり、
写真や図表など文書の内容を手掛かりにして所望の文書
を検索することは困難であった。また、本発明での対象
であるような紙に印刷された文書を扱うシステムではな
い。さらに、文書画像を保管するシステムとして電子フ
ァイリングシステムが、ヒタチレビュー,36,ナンバ
4(1987)第213頁から第220頁(S.Ito
h and N.Takahashi,HITFILE
650 Optical Disk Filing
System,Vol.36,No.4,1987,p
p.213−220)に記載されているが、これは文書
を一頁単位で画像として保管しており、文書の登録日、
文書番号等がインデックスとして検索に用いられてい
る。従って、学術文献等の図や写真を分離、整理して検
索するには十分ではない。このため、文書要素を検索す
るための使い易いユーザインタフェース方式がいかなる
ものか、従来明らかでなかった。
【0004】
【発明が解決しようとする課題】上記従来技術は、文書
画像中の写真や図表など文書要素の画像を分離、蓄積し
て検索する点について配慮されておらず、文書中の図や
写真を分離、整理して検索するには十分ではないという
問題があった。本発明の目的は、紙の文書中にある写
真、図表等の文書要素を検索する使い易いユーザインタ
フェース方式を考案するところにある。本発明では紙に
印刷した文書を要素に分解して文書情報を登録する。文
書は要素を示すノードと要素間の関係を示すリンクから
なるネットワークで表され、このネットワークは画面を
介してブラウジングすることや、新しく文書を登録する
操作ができる。このネットワークのノードには文書の要
素としてテキスト、イメージを対応付けている。また、
リンクとしては、文書論理構造および参照関係等を扱
う。
【0005】さらに、本発明の他の目的は、フルーカラ
ーの要素画像を高速に表示するところにある。要素画像
を拾い読みするために、ディスプレイ画面に順次フルカ
ラー画像を表示する。一枚の要素画像の表示に要する時
間が長いと、ユーザの待ち時間が多くなり、拾い読みの
効率が悪く、使い勝手がよくない。このような拾い読み
検索でユーザが画面表示のために待てる時間は、一枚の
要素画像当り、2〜3秒が限度と考えられる。それ以
上、表示に時間がかかるとユーザの待ち時間に対する我
慢の限度を越え、使い勝手が悪くなる。このため、要素
画像を高速に表示する。
【0006】本発明の他の目的は、要素画像のブラウジ
ングにおいて対話的な探索を行うところにある。ディス
プレイ画面を介して目標の要素画像を探索するため、対
話的な操作を行う。ユーザが要素画像を探索するために
行う対話的な操作としては、要素画像を画面に次々に表
示するため表示モードを切り換えることや、目視により
見付けた要素画像を指定する。この対話的な探索では、
目標の要素画像に至るまでの探索の方法により、検索の
効率が異なる。ユーザが本を読む際、早読と熟読を繰り
返し行い情報を得ているが、これと同じ様に、画面に対
しても一瞥と熟視ができるよう、要素画像の表示を高速
表示と低速表示ができるようにする。
【0007】本発明の他の目的は、文字列検索による要
素画像の絞り込みを行うところにある。多数の要素画像
の中から、拾い読みのみで所望の要素画像を探索するの
は効率的でない。このため、予め要素画像にキーワード
を付与しておき、文字列検索によって該当する要素画像
の集合を求める。文書中の要素画像には、例えば、図表
のキャプション等があり、これをキーワードとして利用
する。従って、要素画像とともにそのキャプションを抽
出し、この文字列を検索の手掛かりとなるキーワードと
して付与する。
【0008】従来の紙の文書の蓄積する電子ファイリン
グシステムでは、一次元に連続して文書要素が並んでお
り、ユーザに文書を一次元的に読むことを物理的に強制
しており、柔軟な検索が困難である。本発明の他の目的
は、文書情報を整理し概念化することにあり、ユーザは
テキストの並びの順に読むことができるだけでなく、
章、節の全体構造を木構造で表示し、重要個所の飛ばし
読み、例えば、緒言と結言を先に読むことができる。ま
た、参照関係をポインタをもとに辿ることができる。
【0009】本発明の他の目的は、紙に印刷された文書
から要素を分離しマルチメディアファイルに登録し、検
索を行なう検索システムにおいて、特に、登録機能に関
するユーザインタフェース方法を提供することにある。
登録機能として要素画像の登録、関連性の登録、登録結
果の表示、のそれぞれについて、ユーザインタフェース
方式を備えている。
【0010】
【課題を解決するための手段】上記目的を達成するた
め、要素画像を高速表示するフレームメモリを備え、当
該フレームメモリの再生ビデオ信号をディスプレイ用ビ
デオ信号と合成して表示したものである。
【0011】上記他の目的を達成するため、画面の表示
速度の切り換え機能を備えるようにしたものである。ま
た、要素画像を順次表示する際、順方向の表示および逆
方向の表示を可能とするよう、探索方向の切り換え機能
を有するようにしたものである。さらに、上記の要素画
像を順次、ウィンドゥに表示する送り表示、該当する要
素画像を注視するための静止表示を可能としており、送
り表示とこの静止表示の切り換え機能を備えるようにし
たものである。
【0012】上記他の目的を達成するため、文書情報を
整理し概念化することができように、文書の要素を登録
するユーザインタフェース備えるようにしたものであ
る。ここでは、ディスプレイ画面を介して対話的に登録
操作を行ない、要素画像を文書画像から切り出して登録
する操作機能、要素の関連性の付与操作機能、登録結果
の表示機能、を備えるようにしたものである。また、登
録画面および検索画面方式を明らかにした。
【0013】
【作用】紙面に印刷された文書に対して、その内容を手
掛かりにして検索を行なう検索システムは、登録、検
索、印刷、編集、通信の各機能部からなる。また、この
システムにおいて、マルチメディアファイルは、文書を
要素ごとにアクセスできるよう検索属性を付与して格納
される。これらの機能部のうち、登録部では、文書の表
面をスキャナ等の入力デバイスで撮像し、その表面画像
を文書画像として採取する。また、文書を構造化して登
録すること、関連性を付与すること、図表を分離して登
録することができる。ここでは、文書画像は要素に分解
しレイアウト構造等の文書構造を抽出され、マルチメデ
ィアファイルに登録する。さらに、登録部では、文書の
要素の間の関連性を付与するとともに、図表を検索でき
るように文書中の図表を分離し登録する。一方、検索部
は、マルチメディアファイルに格納されている文書の要
素を探索するものであり、関連検索、図表検索の機能を
有する。この内、関連検索は検索システムに備えている
ディスプレイ装置の画面を介して対話的に文書要素の関
連性を辿りながら、所望の情報を入手する。また、図表
検索は、図表の縦軸や横軸等の軸名を手掛かりに該当す
る図表を探索し、画面に表示する。また、要素画像を順
次、高速に画面に表示し拾い読みの検索を行う。
【0014】
【実施例】以下、本発明の実施例を図1により説明す
る。本図は、紙面に印刷された文書に対して、その文書
内容を手掛かりにして検索を行う検索システムの構成を
説明する図である。ここでは、特に写真やイラスト等の
図領域を要素画像として蓄積し、画面を介して、これら
要素画像の拾い読み(ブラウジング)を行う。この検索
システムでは、先ず、文書画像入力部100において、
紙の文書の表面画像をカラースキャナによって入力す
る。入力された文書画像に対して、文書要素の分離部1
01において、テキスト、図表等の文書要素を分離、識
別するとともに、属性登録部102において文書要素の
属性を登録する。そして、光ディスクや磁気ディスク等
の大容量記憶装置からなるマルチメディアファイル10
3内の要素画像ファイル104並びに検索属性ファイル
105に、これら要素画像および検索属性をそれぞれ登
録、蓄積する。要素画像に対する検索機能としては、通
常の文字列検索の機能と対話的な拾い読み検索の機能が
必要である。ここで、文字列検索部106は、カラーの
図表等の要素画像に付与された文字列を基に検索を行う
通常のキーワード検索機能を備えており、これによって
多数候補の文書要素画像の絞り込みを行う。また、拾い
読み検索部107では、該当する要素画像を順次画面に
表示し対話的に所望の図表を探索するブラウジング機能
が必要であり、フルカラーの要素画像を順次画面に表示
し、目的の要素画像を目視で見付け、ハードコピー等に
より保存する機能を備えている。なお、文書要素の分離
部101において、自動的に要素を分離し属性を登録す
る処理については、プロシーディング、セカンド、イン
ターナショナル、シンポジウム、オン、インタオペラブ
ルインフォメーションシステム(1988年)第213
頁から第238頁(H.Fujisawa,H.Yas
hiro,J.Higashino,Y.Shima,
Y.Nakano,T.Murakami,Docum
ent Analysis and Decompos
ition Method for Multimed
ia Contents Retrieval, Pr
oc. ofthe second Int. Sym
posium on Interoperable I
nformation Systems(ISIIS8
8),pp.231−238,1988.11.)に記
載されている。
【0015】図2は、検索システムの文書要素の登録部
の別の実施例である。この図は、文書要素の登録処理過
程を説明する図である。スキャナ211で入力した文書
画像210から200で示した文書構造化および属性登
録処理部において、要素を自動的に分離し、関連付けを
行ない、検索のための手掛かりとなる検索属性をマルチ
メディアファイル201に登録する。このとき、202
の編集処理部において、マルチメディアファイルへの登
録の誤りを修正することや検索属性を追加する。これに
より、データの信頼性を高めている。また検索システム
を使い易くするために、ユーザインタフェースとして、
画面203に表示された文書画像204からその構成要
素を画面を介して指定し、その検索属性を変更、追加ま
たは削除するとともに、登録した構成要素の内容や種類
等の検索属性を画面に表示する。登録すべき検索属性と
しては、要素の内容、要素の種類(図表、テキスト)、
要素のレイアウト、要素間の関連性、などがある。ま
た、ユーザインタフェースにおける登録機能として、検
索属性の変更、検索属性の追加、検索属性の削除、検索
属性の表示の各機能を備える。
【0016】図3は文書要素の関連性を説明する図であ
る。要素登録のユーザインタフェースでは、これらの要
素および関連性を登録する。文書画像300は、テキス
トや図表からなる要素301,302,303,30
4,305に分解されている。これらの要素は、文書画
像から切り出した部分画像311,312,316,3
13,314,315として矩形領域で表現されてお
り、「 is a part of 」の関係322,323,32
4,325,326,327で頁全体の画像300とリ
ンクされている。また、要素同士については、論理構造
の階層関係や参照関係の関連性を有しており、例えば、
図311とその図の説明文312とは参照関係を示すリ
ンク320でつながっている。検索システムのユーザイ
ンタフェースにおいては、このような文書画像の要素を
図2に示すディスプレイ装置203、マウス205、キ
ーボード206を用いて登録することになる。
【0017】要素登録のユーザインタフェースでは、登
録した要素の変更、削除並びに追加の操作を行なう。こ
の要素登録では、要素の内容すなわち部分画像を設定す
る機能、要素の種類を設定する機能、レイアウトや要素
間の関連性を設定する機能がユーザインタフェースに備
えている。この内、要素画像の設定機能では、要素を文
書画像内において矩形領域として指定し、その領域の部
分画像を切り出す。これにより、要素の変更や追加が可
能である。図4は、文書画像内の矩形設定インタフェー
スの説明図である。ディスプレイ画面400において、
頁全体の画像401を表示し切り出し矩形を設定するこ
とになり、ディスプレイ上のカーソル位置により矩形4
02を設定する方法と、キーボードにより座標設定ウィ
ンドウ410において、座標値411,412を入力す
る方法が併用できることとする。前者の方法では、頁全
体の画像を表示し、ディスプレイ上のカーソルを移動
し、その位置座標を入力する。このとき、要素画像は矩
形領域で表されているため、矩形の左上隅の頂点403
と右下隅の頂点404をカーソルで設定しその座標を入
力する。
【0018】また、登録済の要素の変更および削除を行
なう場合、複数の要素の中から対象となる要素を選択し
指定する必要がある。図5は文書要素の選択インタフェ
ースに用いる画面を示す。ディスプレイ画面500に表
示された文書501において、複数の要素510,51
1,512,513,514,515,516を矩形領
域で表示し、カーソル540を該当する矩形に移動さ
せ、マウスをクリックすることにより例えば、要素51
1を指定する。或いは、画面内の名称一覧ウィンドウ5
20において、要素に付けられた名称の一覧を表示し、
その名称の文字列530,531,532,533,5
34,535,536をカーソル541で指示すること
により該当する要素を指定する。要素が多数の場合は、
スクロールのための矢印521を指定することにより、
当該ウィンドウをスクロールする。図6は、要素画像の
縮小並びに拡大表示を説明する図である。上述のように
してマルチメディアファイルに登録した文書要素を表示
しユーザがファイルの内容を確認することは、ユーザイ
ンタフェースの実現において不可欠である。このため、
要素画像をディスプレイ上に表示する。ディスプレイの
解像度およびサイズの制約の点から、多数の要素画像を
ディスプレイ上に同時に表示することはできない。そこ
で、本図に示すように、デイスプレイ602において要
素画像603をそのまま表示する機能とともに、ディス
プレイ600に示すように要素画像601を縮小し表示
する機能を設けている。
【0019】文書要素の登録インタフェースとして、要
素の画像を文書画像から切り出して登録する操作、要素
間の関連性を付与する操作、登録結果の表示操作のそれ
ぞれの機能を具備している。文書画像の要素を登録する
操作は、ディスプレイ画面を介してカーソル及びマウ
ス、キーボードにより行なう。登録操作の種類として
は、要素の変更、追加、削除がある。図7は要素画像の
登録画面である。登録操作を対話的に行なうため、マル
チメディアファイルに既に登録されている要素は、本図
に示すように、部分画像としてディスプレイ画面700
に頁単位で表示する。ここでは、701に示すように文
書画像を画面に表示する。また、702に示すように要
素画像をテキスト710,712,713,715と図
表711,714にその種類を文字列等で区分して表示
するとともに、頁全体におけるそれぞれの要素の配置を
矩形領域で示す。さらに、図表の登録結果を確認するた
め、ディスプレイ720に示すように文書画像から図表
722、723分離して表示する。ここでは、文書画像
はその外枠のみが721に表示する機能を備えている。
画像登録のユーザインタフェースは文書一頁全体の原画
像を登録するモードと原画像の中から部分画像を登録す
るモードとからなる。文書一頁全体の原画像を登録する
画面においては、当該画面は例えば、左右のウィンドゥ
に分かれ、右のウィンドゥは属性ウィンドゥであり、原
画像の属性としてファイル名称、画像サイズ、画像の種
類を入力または表示する。この属性ウィンドゥの上部に
は、操作コマンドのメニューが表示されており、これら
の一つにカーソルをあわせ、マウスボタンをクリックす
ることにより操作コマンドが選択され実行する。操作コ
マンドとしては「登録」「表示」「一覧」「終了」「複
写」の各コマンドを備えている。この内、「登録」コマ
ンドは、原画像を新規にマルチメディアファイルに格納
するものである。また、「表示」コマンドは原画像を左
のウィンドゥに表示するものであり、ファイル名称を指
定することにより、原画像を表示する。「一覧」コマン
ドは既に登録している原画像のファイル名称のリストを
表示する。「複写」コマンドはディスプレイ画面のハー
ドコピーをとる。
【0020】文書全体の原画像から部分画像を登録する
ユーザインタフェースの画面においては、当該画面は例
えば、左右のウィンドゥに分かれ、左のウィンドゥには
登録した要素画像を赤線枠で表示する。また、右のウィ
ンドゥは属性ウィンドゥであり、部分画像のファイル名
称、間引き画像のファイル名称、間引き率等を入力、表
示する。この属性ウィンドゥの上部には、操作コマンド
のメニューが表示されており、操作コマンドとして、
「新規」「変更」「削除」「一覧」「終了」「複写」の
各コマンドを備えている。これらのコマンドの内、「新
規」コマンドは新たに部分画像をマルチメディアファイ
ルに登録する。また、「変更」コマンドは既に登録され
た部分画像の切り出し位置等を修正、変更する。「削
除」コマンドは登録されている部分画像を削除する。
「一覧」コマンドは登録されている部分画像のファイル
名称を表示する。要素画像の登録操作において、「変
更」コマンドの操作画面では、右上部にあるメニューか
ら「変更」コマンドを選択し、変更対象とする部分画像
にカーソルを移動させマウスをクリックすることにより
要素を選択指定する。画面の左のウィンドゥには指定し
た部分画像が赤色線枠で表示されており、その切り出し
位置をカーソルによって指定する。ここでは、変更した
切り出し位置を青色線枠で表示している。画面上部に
は、コマンドのメニューとして「確定」「複写」があ
り、変更した位置を目視で確認し「確定」コマンドを選
択することにより変更された要素画像がマルチメディア
ファイルに格納される。
【0021】図8は文字行並びに文字の表示画面であ
る。ディスプレイ800において、文書の枠801を表
示するとともに、要素がテキストであるものに対して、
その文字行802,803,804を表示する。さら
に、文字ごとに分離したテキスト領域に対しては、ディ
スプレイ810に示すように、文書の枠811内におい
て分離した文字を矩形812,813,814,815
で表示している。
【0022】図9は要素画像の登録のための操作を説明
する図である。要素画像の登録操作のうち、変更操作で
は、矩形で表示されている要素画像の切り出し位置を変
更する。このため、本図に示すように、先ず、ディスプ
レイ画面900に縮小表示された文書画像901におい
て、要素画像903,904のなかから注目している要
素画像904を選択する。要素画像は矩形で表示されて
いるため、ここでは、画面上の矩形内にカーソルを設定
することによって、注目する要素を指示する。そして、
新たに要素の切り出し位置として、矩形の左上隅と右下
隅の位置をカーソルで設定する。また、要素画像の名
称、レイアウトの名称、要素の種類等をキーボードから
修正入力する。また、追加操作では、新規にマルチメデ
ィアファイルに要素画像を登録することになる。従っ
て、ディスプレイ画面に表示されている文書の頁全体の
画像から、カーソルにより要素の切り出し位置を新たに
設定するとともに、要素画像の名称、レイアウトの名
称、要素の種類等をキーボードから新規に入力する。さ
らに、削除操作では、ディスプレイ画面に表示された要
素画像のなかから注目している要素画像をカーソルによ
って選択し、削除処理を実行する。なお、変更及び追加
操作では、要素画像が登録されると同時に、要素画像の
縮小画像を生成し、同じくマルチメディアファイルに登
録する。文書画像を拡大表示して、長方形領域の変更、
追加、削除を行うこともでき、ディスプレイ910、9
20において拡大した文書画像911、921を表示
し、文字行912、913、914、915あるいは、
文字921,922,923,924、930,931
に対して、同様に、登録操作を行う機能を備えている。
【0023】図10は要素のレイアウト名称を登録する
インタフェースを説明する図である。ディスプレイ10
00において、文書画像1001を表示し、この文書画
像内に矩形領域を設定するとともに、矩形に対して名称
をキー入力することができる。例えば、矩形領域100
2に名称としてタイトルを付与する。また、矩形領域1
005に対して名称として要約を付与する。
【0024】図11はレイアウトの表示画面の説明図で
ある。本図に示すように、ディスプレイ1100では、
文書一頁1101の要素のレイアウトを示しており、デ
ィスプレイ画面1100に全体が表示できるよう縮小し
て表示する。ここでは、テキスト領域1110におい
て、論理構造を矩形の入れ子形式で表示する機能を備え
ており、例えば、1章の領域1111に対して、章のタ
イトル矩形1120と節の矩形1121,1123が表
示される。そして、節の内部に節のタイトルの矩形11
22,1123等を表示するような入れ子形式である。
これらの縮小した要素画像は、当該要素を選択し指定す
ることにより、ディスプレイ1130に示すように、拡
大した文書画像の一部1131を表示するとともに、要
素画像1141を表示することもできる。
【0025】図12は、関連性の登録操作を説明する図
である。ディスプレイ1200において、文書画像12
01の内部にある複数の要素1202,1203或いは
1204,1205を選択し、関連性を付与してマルチ
メディアファイルに登録する。関連する要素として、テ
キストとテキストとの間のリンク、テキストと図表との
間のリンク、図表間のリンクがある。ここでは、図表の
要素1202とテキストの要素1203の間において関
連性を付与する操作を述べる。登録されている要素画像
は、ディスプレイ画面1200にレイアウトを保持した
形式で表示されるとともに、要素の種類も表示される。
要素の種類の表示としては、例えば、テキストの要素は
青色の矩形で囲まれ表示され、一方、図表の要素は赤色
の矩形で囲まれ表示される。関係付けは対となる二つの
要素を指定することにより実行される。対となる要素
は、カーソルを矩形内に設定することによって選択す
る。関係付けは要素1212と要素1213をつなぐ線
分1220で表示する。ディスプレイ1211では、こ
のようにして、関係付けられた二つの要素の間は線分1
220,1221で結ばれている。
【0026】本実施例では、登録結果の一覧表示の機能
を備えており、これにより、要素登録の誤りを少なく
し、データとしての信頼性を高めることができる。図1
3は要素の一覧表示画面の表示方法を説明する図であ
る。この一覧表示は、ディスプレイ画面1300に登録
した結果を表示し、登録内容の検査を画面を眺めながら
行なう。このため、登録のユーザインタフェースでは、
マルチメディアファイルに格納された要素画像をディス
プレイ画面に一覧表示し、登録した要素を目視により確
認できる。要素画像の数は多数になるため、ディスプレ
イ画面に同時に複数の要素画像を表示する。さらに、画
面をめくることにより、要素画像を順次表示する。ここ
では、一つのディスプレイ画面1300に要素画像を多
数配置して表示するため、図13に示すように、要素画
像の縮小画像1301,1302,1303,130
4,1305,1306,1307,1308,130
9,1310を表示する。このような縮小画像を表示す
ることにより要素の概略を確認することができるととも
に、多数の要素画像を一時に確認することができる。さ
らに、要素画像の内容を詳細に確認する場合には、画面
1300に配置された要素画像の一つを選択することに
より、その要素画像を拡大した画像1321が画面13
20に表示される。また、この拡大した画像1321を
表示するとともに、先に関連付けされた要素画像、例え
ば図の説明文1322も併せて表示する。
【0027】図14は、マルチメディアファイルの構成
の説明図である。マルチメディアファイルには、同図に
示すように、文書画像データ1401とこれらの画像デ
ータへのアクセスを制御する制御データ1400が格納
される。文書画像データ1401は、文書一頁全体の画
像データ(原画像データ)1402と、要素である部分
画像データ1403とからなる。さらに、これらの画像
データを登録時に縮小した縮小画像データ1404も備
えている。画像のデータ形式は、データ圧縮の有無によ
り非圧縮或いは圧縮データとして格納される。また、画
像は単色のスキャナで採取したモノクロデータ或いはカ
ラースキャナで採取した三原色成分を有するカラーデー
タを扱える。さらに、これらの画素値は、8ビットの濃
淡値または1ビットの2値データとして表現される。
【0028】図15は、画像データを制御する制御デー
タの形式を説明する図である。制御データ1400は、
原画像ファイルデータ1500、部分画像ファイルデー
タ1501、レイアウトデータ1502、関係データ1
503、文字行データ、文字データ等からなる。これら
のデータは2バイトのヘッダ部にデータの種類を示す番
号1510,1520,1530,1540を備えてお
り、この種類番号により制御データを識別している。原
画像ファイルデータ1500には、文書一頁の画像に関
する制御情報を備えており、原画像を指定するための原
画像番号1511、原画像が格納されているファイルの
名称1513、原画像の横および縦のサイズ1515,
1516がある。部分画像ファイルデータ1501は、
原画像から切り出した部分画像に関する制御情報を備え
ており、この制御データとしては元の原画像を示す原画
像番号1521、部分画像が格納されているファイルの
名称1526、部分画像の横および縦のサイズ152
7,1528がある。レイアウトデータ1502は、部
分画像ファイルデータ1501とリンクされて格納され
ており、文書一頁における部分画像を示す矩形の位置座
標1534,1535,1536,1537を有してい
る。また、レイアウトの種類1532は要素がテキスト
或いは図表のいづれであるかを示す。関係データ150
3は関連を有する要素を示しており、二つの要素のレイ
アウト番号1541,1542でこの関連性を表現して
いる。文字行データ及び文字データはレイアウトデータ
と同じく、文書一頁における文字行および文字を示す矩
形の位置座標を有している。
【0029】検索システムでは、文書画像を入力し、そ
の構成要素を光ディスク等のマルチメディアファイルに
登録する。登録操作はワークステーション上でマウス、
キーボードを用いて対話的に行なう。このため、このワ
ークステーションには文書画像を表示するためカラーC
RTを有するディスプレイ装置を備えている。また、ワ
ークステーションには、磁気ディスクと書替え型光ディ
スクが接続されており、マルチメディアファイルを構成
しており、文書の全体画像及び部分画像を格納してい
る。さらに、文書画像の入力用としてモノクロスキャナ
およびカラースキャナが使用できる。要素画像の登録を
行なうユーザインタフェースのソフトウェア構成は、全
体制御部はユーザインタフェースの全体の処理を制御す
る。その下にあるファイル入出力部、原画像登録部、要
素画像の変更・追加・削除部、要素の表示部から構成さ
れている。さらに、これらの処理部に共通なルーチンと
して、全体画像ならびに部分画像を表示する画像表示
部、原画像から部分画像を切出したり縮小した間引き画
像を生成する画像データ生成部、画面上に窓枠を生成し
たりキーボードからのコマンドを制御するウィンドゥ制
御部がある。
【0030】図16は要素画像に対する検索の説明図で
ある。検索は2段階の処理になっており、文字列検索と
拾い読み検索とからなる。この検索では、先ず、文書画
像から分離抽出した図表等の要素画像の集合1600に
対して、通常の文字列検索によって、所望の要素画像の
候補を絞り込む。要素画像1601,1602,160
3,1604,1605,1606には、それぞれキー
ワード1611,1612,1613,1614,16
15,1616が付与されている。絞り込まれた要素画
像の集合1620は、文字列検索に用いたキーワードに
よって、グループ1621,1622,1623に区分
される。ここでは、この文字列検索のために予めキーワ
ードが付与されている。このキーワードを基に文字列検
索を行い、候補である要素画像の集合を得る。要素画像
には図表のキャプションがありこれが文字列検索の手掛
かりになる。この要素画像の集合であるグループ、例え
ば1622に対して、次いで、ディスプレイ画面165
0を介して対話的に拾い読みを行い、所望の要素画像を
探索する。この時、フルカラーの要素画像に対するブラ
ウジングの待ち時間を短くするためには、フレームメモ
リ1641にフレーム画像1642,1643,164
4を格納しておく。フレーム画像は、当該要素画像16
32,1633から生成する。フレームメモリ1641
に格納されたフレーム画像を順次、ディスプレイ画面1
650のウィンドウ1651に表示する。
【0031】図17は、文書要素画像の高速ブラウジン
グのための構成図である。文書の要素画像1701を高
速にブラウジングするためのフレームメモリ1702を
備えているフレームメモリ1702はワークステーショ
ン1700とバスで接続されており、ワークステーショ
ン1700では、要素画像が文書画像から分離抽出さ
れ、フレームメモリ1702に送られ、フレーム画像と
して蓄積される。ワークステーション1700からはフ
レーム番号を指定することによりフレームメモリ170
2にアクセスしており、これによりフレーム画像をビデ
オ信号として出力することができる。また、スーパイン
ポーズ装置1703では、ワークステーション1700
のディスプレイ用のビデオ信号とフレーム画像のビデオ
信号とが合成され、この合成されたビデオ信号がディス
プレイ装置1704に表示される。ディスプレイ装置1
704には、要素画像を表示するためのウィンドゥ17
05と、検索の操作を行うウィンドゥ1706が用意さ
れている。この要素画像表示ウィンドゥ1704に、順
次、要素画像が高速に順方向または逆方向に送られて、
或いは、静止して表示される。一方、検索の操作を行う
ウィンドゥ1706では、文字列検索および拾い読み検
索を実行する。
【0032】図18は、文書要素画像に対する内容検索
の処理手順である。処理の手順は、先ず、ステップ18
00において要素画像をフレームメモリに入力するとと
もに、ステップ1801でそれぞれの要素画像に対する
検索属性を検索属性ファイルに格納する。ここでは、検
索属性として、図表等のキャプションの文字列を予め文
字認識技術によって分離抽出して利用する。次いで、検
索の処理過程に移り、先ず、通常の文字列検索を行う
が、この時、ステップ1802でユーザは検索用の文字
列をキーワードとして指定する。ステップ1803で文
字列検索を実行し、ステップ1804で該当する要素画
像の識別子を文字列検索の検索結果として格納し、一つ
のグループを形成する。このグループに属する要素画像
が、次のステップ1805で拾い読み検索の範囲として
設定される。多数の要素画像をすべて拾い読みするので
はなく、この文字列検索によって、拾い読みをする要素
画像の絞り込みを行うことになる。もちろん、文字列検
索を省略して、すべての要素画像を順次拾い読みするこ
ともできる。ステップ1806の拾い読み検索の実行
は、画面を介して対話的に行う。拾い読みは、高速表示
及び低速表示の両方を用いて目視で探索し、所望の要素
画像を見付ける。所望の要素画像を見付けた時点で、静
止表示のモードに切り換え、検索結果として保存するた
めに、ステップ1807でハードコピーを取る等の操作
を行う。
【0033】図19は、内容検索を行うためのワークス
テーションの表示画面の説明図である。画面1900の
内部には、要素画像を順次表示する要素画像表示ウィン
ドゥ1901と、検索の対話的な操作を行う検索操作ウ
ィンドゥ1902がある。表示画面1900のサイズ
は、横1280画素×縦1024画素である。また、要
素画像表示ウィンドゥ1901のサイズは、横640画
素×縦512画素の固定であるが、このサイズは、フレ
ーム画像のサイズに合致している。文書画像から分離抽
出した要素画像は、そのサイズが様々であり、従って、
要素画像表示ウィンドゥのサイズに合わせるため、画像
の拡大、縮小及び余白部の埋め込みの処理を行ってい
る。
【0034】カラー文書画像より図や写真等の要素画像
を分離し、検索のための手掛かりとなる属性と、要素画
像データを登録する。要素画像は、長方形領域として文
書画像から抽出される。要素画像は、画面を介して高速
に表示できるようにフレームメモリに格納される。様々
な大きさの図表が文書には掲載されているため、要素画
像をフレームメモリに格納する際に、横640画素×縦
512画素のフレーム画像のサイズに要素画像のサイズ
を合わせる。図20にフレーム画像の生成手順を示す。
この手順は、先ず、ステップ2000で文書画像を入力
し、ステップ2001で要素画像を分離する。分離した
要素画像のサイズを、フレーム画像のサイズに合わせる
ため、ステップ2002で要素画像の拡大、縮小を行
う。そして、ステップ2003でフレーム画像へ要素画
像を入力する。この時、要素画像の歪がないよう、拡大
率、縮小率を縦、横とも同じ値としており、フレーム画
像の縦、又は横のサイズのいずれかに合わせることにな
り、余白部が発生する。このため、ステップ2004で
余白部を例えば、白色の画素で埋め込みフレーム画像を
生成する。なお、簡単のため、拡大率、縮小率を整数及
びその逆数としてもよい。次いで、ステップ2005で
フレーム画像を出力する。
【0035】図21は、文書要素画像の処理過程の説明
図である。文書画像2100の内部の要素画像、例え
ば、図中の黒線枠で示す写真領域2101を先ず,分離
処理部2102で分離する。そして、その要素画像21
03から、拡大、縮小処理部2104で拡大、縮小画像
2105を生成する。なお、縮小処理では、画素の値を
平均化する方法で実現している。そして、埋め込み処理
部2107において、余白部2110を特定の値を有す
る画素データで埋め込み、横640画素×縦512画素
のフレーム画像2108を生成する。なお、登録する要
素画像を画面に表示させ、画面をみながらガンマ補正
(濃度の補正)ができ、ガンマ補正後の画像を要素画像
としてフレームメモリに格納する。
【0036】文書要素画像の登録は、文書画像を画面に
表示するとともに、自動的に分離した要素画像を長方形
領域で表示する。また、対話的に要素画像を分離抽出す
ることもでき、図表等の要素画像に対して、マウスで長
方形領域の左上点と右下点とを指定して切り出す。切り
出した画像を要素画像として、属性情報を付与して登録
する。この登録の操作は、編集可能とし、登録した要素
画像の削除、新規生成、位置の変更等ができる。図22
に文書要素画像の登録操作の手順を示す。ステップ22
00において、画面の表示されているメニューコマンド
を選択して、ステップ2220以下の登録操作を行う。
操作は、「新規」2201、「削除」2202、「変
更」2203、「一覧」2204、「複写」2205、
「終了」2206からなる。例えば、「新規」2201
のメニューコマンドを選択すると、ステップ2210の
座標入力の処理過程に移り、画面上の長方形領域の座標
を順次入力し、ステップ2211で、それらの値を登録
する。また、「削除」2202のメニューコマンドで
は、ステップ2212でカーソルで登録済の要素画像を
指定し、ステップ2213で当該要素画像の削除を実行
する。「複写」2205のコマンドでは、ステップ22
17で登録画面のフルカラーのハードコピーをとること
ができる。
【0037】要素画像に付与されている文字列を手掛か
りにして、通常のキーワード検索を行う。該当する要素
画像の集合をグループとして登録する。例えば、今、説
明のために要素画像をe1,e2,e3,e4,e5,
e6とする。キーワード検索によって、複数のグループ
を生成したとし、そのグループをG1,G2,G3とす
る。ここで、キーワードkey1によって求められた要
素画像はe1,e2,e4であり、これらをグループG
1としている。同じく、キーワードkey2によって求
められたグループG2の要素画像をe3,e5、グルー
プG3の要素画像をe6とする。要素画像のブラウジン
グでは、グループごとに要素画像を画面に順次表示し、
目的の要素画像を目視で見付ける。この時、画面に要素
画像を表示するその表示順序は、キーワード検索におい
て、合致の程度によって順位を決めることとし、例え
ば、グループG1は、要素画像の表示を、e2,e4,
e1の順で行うことができる。ここで、説明のため、キ
ーワード検索の合致の程度が要素画像e2が高位にあっ
たとしている。また、単純に、表示の順序は文字列検索
によって求められた順番とすることもできる。
【0038】このグループ情報の登録では、要素画像の
登録の画面とは別に、新規作成、変更、削除等の編集が
できる。この操作は、先ず、グループ番号を指定する
と、該当するグループに属する表示順序番号とフレーム
番号の一覧が表示される。変更では、フレーム番号を選
択また入力するとともに、表示順序番号を入力し、実行
すると変更個所が登録され、設定したグループにおける
表示順序番号とフレーム番号の一覧が再表示される。新
規作成では、フレーム番号を入力し、次いで、表示順序
番号を入力し、同じように、実行すると登録され、設定
したグループにおける表示順序番号とフレーム番号の一
覧が再表示される。削除では、フレーム番号を選択また
入力し、実行すると削除され、設定したグループにおけ
る表示順序番号とフレーム番号の一覧が再表示される。
なお、表示順序番号の整列のため、表示順序番号につい
ては、入力時、すでに登録されている同一の番号を設定
した場合、先に設定されている番号を優先とし、再表示
時に番号を付け直す。また、グループに属していない要
素画像の扱いについては、これらグループが設定されて
いない要素画像に対して、グループ番号0を指定するこ
とによってアクセスし、編集できる。さらに、登録した
要素画像を表示による確認するため、フレーム番号を入
力することにより、該当する要素画像が画面に表示され
る。
【0039】図23は、文書要素画像のブラウジングの
説明図である。要素画像を拡大、縮小したフレーム画像
2300,2301,2302,2303を単位にフレ
ームメモリにアクセスし、検索画面に表示する。表示
は、順方向にフレーム画像を続けて表示する順方向表示
2310と、逆方向に表示する逆方向表示2311があ
る。また、ある特定のフレーム画像を画面に静止させて
表示する停止表示2312がある。ブラウジングの操作
は、フレーム画像を順方向に表示し、順次目標のフレー
ム画像をユーザが目視で探す。そして、該当するフレー
ムメモリをユーザが見付けたとき、停止表示に切り換え
る。この切り換えは、ユーザがファンクションキーを押
すことによりおこない、停止表示の状態でフレーム画像
を詳細にユーザが観察できる。また、順方向の表示が行
き過ぎた場合、フレーム画像を元に戻ることができるよ
う逆方向表示の機能を設けている。ここでは、表示する
フレーム画像が尽きた場合、新ためて最初のフレーム画
像から表示し、表示を連続して行うようにしている。
【0040】図24は、文書要素画像の表示モードの切
り換え手順の説明図である。フレーム画像の表示の速度
は、1/30秒単位に、任意の速度に切り替えることが
できる。ここでは、要素画像のブラウジングのため、高
速表示モードと低速表示モードを備えている。要素画像
の表示モードの切り換えを行うため、ステップ2400
でユーザが押したファンクションキーを読み取り行う。
次いで、ステップ2401で表示モードを切り換える。
高速モード2402では、ステップ2410で高速表示
となり、1秒間に5枚のフレーム画像を表示する。低速
モード2403では、低速表示となり、1秒間に1枚の
速度で表示する。停止モード2404では、停止表示2
414となりフレーム画像を詳細にユーザが観察でき
る。
【0041】フレームメモリは、フレーム画像が多数枚
格納できる構成になっている。各フレーム画像にはフレ
ーム番号が付けられており、このフレームによってアク
セスする。フレームメモリへの入力は、2系統あり一つ
はVMEバスを介してワークステーションから要素画像
を転送できる。もう一つは、ビデオ信号入力であり、1
/30秒単位に画像データを入力することができる。ま
た、フレームメモリへの出力は、同じく2系統あり、V
MEバスの転送および1/30秒単位のビデオ信号出力
ができる。要素画像のブラウジングでは、フレームメモ
リへの入力はワークステーションからVMEバスを介し
て要素画像を格納する。また、出力は、フレームメモリ
からフレーム画像をビデオ出力し、ディスプレイ用ビデ
オ信号と合成して表示する。図25はフレームメモリの
アクセス方式の説明図である。フレームメモリ2520
へのアクセスは、フレーム番号2522によって行う。
要素画像のブラウジングを行うときには、先ず、グルー
プ番号2500によってグループテーブル2501にア
クセスする。グループテーブル2501には、グループ
番号2502、フレーム番号2503、表示順序番号2
504が格納されており、グループ番号2500を指定
することによって、該当するフレーム番号の集合を取り
出し、表示フレーム番号テーブル2510に表示順序に
従って格納する。この表示フレーム番号テーブル251
0から順次フレーム番号2511を読みだし、フレーム
メモリ2520にアクセスする。
【0042】要素画像の形式は2種類とし、1画素4バ
イト1面形式と1画素1バイト3面形式とする。フレー
ムメモリで使用できる形式は、1画素4バイト1面形式
であるが、これに限定されるものではない。フレーム画
像の大きさは、縦512画素、横640画素である。ま
た、画素データは、32ビット構成のフルカラーであ
り、下位バイトから青色、緑色、赤色各8ビットが並ん
でいる。最上位バイトはダミーのデータである。
【0043】図26は検索属性ファイルのデータ形式の
説明図である。検索属性ファイルは、原画像ファイルデ
ータ2600、要素画像ファイルデータ2601、グル
ープデータ2602、キーワードデータ2603からな
り、これらは、2バイトの種類を示す番号2610,2
620,2640,2650によって識別される。例え
ば、原画像ファイルデータ2600は、その種類番号2
610が1であり、続いて原画像の番号2611、原画
像の種類2612、原画像データのファイル名の長さ2
613とファイル名2614、画像のサイズ2615,
1616が格納されている。この原画像の番号2611
によって各文書画像を管理している。要素画像ファイル
データ2601は、その種類番号2621が2であり、
続いて原画像番号2621、要素番号2622、要素画
像データが格納されているファイル名称2625、その
原画像における位置座標2626、2627などが格納
されている。キーワードデータ2603は、その種類2
650が4であり、キーワードデータ番号2651で管
理している。ここでは、付与されている要素画像の番号
2652、キーワードの文字列データ2657等が格納
されている。
【0044】図27は内容検索システムの装置構成であ
る。カラー文書画像を入力し、その要素画像を分離、登
録する。そして、蓄積した要素画像に対して、ディスプ
レイ画面を介して対話的に検索を行う。文書画像入力ス
テーション2701では、カラー文書の表面画像をカラ
ースキャナ2702により採取し、要素画像を分離抽出
する。登録ステーション2703では、要素画像の登録
操作を画面2704を介して対話的に行う。検索ステー
ション2705では、フレームメモリ2707に格納し
ている要素画像のブラウジングを検索画面2706で行
い、所望の要素画像を探索し求める。フレーム画像の複
写のため、カラーハードコピー2708を備えており、
検索結果である要素画像のハードコピーをとることがで
きる。
【0045】図28は要素画像のブラウジングのための
装置構成の説明図である。検索ステーション2800に
は、フレームメモリユニット2801がVMEバスで接
続されている。フレームメモリユニット2801には半
導体イメージメモリ2809を備えており、多数のフレ
ーム画像(640×512画素のフルカラー画像)を格
納し、1/30秒単位でフレーム画像を入出力する。ま
た、フレーム画像の出力ビデオ信号2808は、スーパ
インポウザ2802によってワークステーション280
0のディスプレイ画面2803に合成することができ
る。フレームメモリユニットには、補助記憶装置とし
て、レーザビデオディスク2811、UマチックVTR
2812が接続されている。レーザビデオディスク28
11と半導体イメージメモリ2809によりメモリ階層
を構成している。要素画像を格納しているフレームメモ
リの内容を、画面に複数個表示することができ、順次、
フレーム番号に従って、スクロールすることができる。
なお、スクロールにはトラックボールを用いる。セレク
タ2805,2806によって、レーザビデオディスク
2811、UマチックVTR2812、半導体イメージ
メモリ2809を切り換えることができ、格納する要素
画像の容量によって当該メモリを階層的に使用する。
【0046】
【発明の効果】文書要素画像の検索において、フルカラ
ーの写真、図表など、文書画像から分離した要素画像に
対して画面を介して拾い読みを行うことができるので、
要素画像を画面に次々に表示し、ユーザが所望の要素を
目視で見つけることができるという効果がある。また、
ディスプレイへの要素画像の表示速度を切り換えるた
め、高速表示モード、低速表示モードを備えており、ま
た、探索の方向を順次方向と逆方向に切り換えることが
できるため、蓄積した多数の要素画像の中から、目的の
要素画像に効率的に到達することができるという効果が
ある。さらに、このシステムは、文書情報を整理し概念
化することができるため、文書情報の取扱いが容易とな
り戦略的な文書活用はできるという効果がある。また、
ディスプレイ画面を介して対話的に登録操作を行なうこ
とができるため、要素画像を文書画像から切り出して登
録する操作、要素の関連性の付与操作等が信頼性よく実
行できるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例である文書要素画像の検索シ
ステムの構成の説明図である。
【図2】文書要素の登録システムの説明図である
【図3】文書画像の要素と関連性の説明図である。
【図4】文書画像内の矩形設定インタフェースの説明図
である。
【図5】文書要素の選択インタフェースの説明図であ
る。
【図6】要素画像の縮小ならびに拡大表示の説明図であ
る。
【図7】要素画像の登録画面の説明図である。
【図8】文字行並びに文字の表示画面の説明図である。
【図9】要素画像の登録のための操作の説明図である。
【図10】レイアウトの登録インタフェースの説明図で
ある。
【図11】レイアウトの表示画面の説明図である。
【図12】関連性の登録インタフェースの説明図であ
る。
【図13】要素の一覧表示画面の説明図である。
【図14】マルチメディアファイルの構成を示す図であ
る。
【図15】要素のデータ形式を示す図である。
【図16】要素画像検索の説明図である。
【図17】文書要素画像の高速ブラウジングの説明図で
ある。
【図18】文書要素画像の内容検索の手順を示す図であ
る。
【図19】内容検索のための画面の説明図である。
【図20】フレーム画像の生成手順を示す図である。
【図21】文書要素画像の処理過程を示す図である。
【図22】文書要素画像の登録操作の手順を示す図であ
る。
【図23】文書要素画像のブラウジング方式の説明図で
ある。
【図24】文書要素画像の表示モードの切り換え手順の
説明図である。
【図25】フレームメモリのアクセス方式の説明図であ
る。
【図26】拾い読みのための検索属性ファイルのデータ
形式の説明図である。
【図27】内容検索システムの装置構成を示す図であ
る。
【図28】要素画像のブラウジングのための装置構成を
示す図である。
【符号の説明】
103 マルチメディアファイル、 107 拾い読み検索、 320 参照関係、 510 文書要素、 603 要素画像、 700 登録用のディスプレイ画面、 802 文字行、 812 文字、 1000 レイアウトの登録画面、 1401 文書画像データ、 1502 レイアウトデータ、 1702 フレームメモリ、 1806 拾い読み検索の実行ステップ、 2108 フレーム画像、 2310 順方向表示、 2311 逆方向表示、 2312 停止表示、 2501 グループテーブル、 2510 表示フレーム番号テーブル、 2601 要素画像ファイルデータ。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.5 識別記号 庁内整理番号 FI 技術表示箇所 G06F 15/62 330 A 8125−5L

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】文書要素を表示する表示画面を有する文書
    要素の検索装置において、文書画像を入力する第1の手
    段と、上記文書画像の文書要素および検索属性を登録す
    る第2の手段と、上記文書要素および上記検索属性を蓄
    積する第3の手段と、上記文書要素を検索する第4の手
    段とを有することを特徴とする文書要素の検索装置。
  2. 【請求項2】上記第2の手段は、上記文書要素の表示位
    置を上記表示画面を介して対話的に設定する手段と、上
    記文書要素に対して上記検索属性を変更、追加、削除す
    る手段とを有することを特徴とする請求項1記載の文書
    要素の検索装置。
  3. 【請求項3】上記第4の手段は、文書要素の集合から複
    数の文書要素を選択する手段と、上記選択した文書要素
    を上記表示画面に表示する手段と、一定時間間隔ごとに
    表示する文書要素を切り換える手段とを有することを特
    徴とする請求項1記載の文書要素の検索装置。
  4. 【請求項4】上記第3の手段は、文書画像を蓄積する手
    段と、上記文書画像を分離した文書要素を蓄積する手段
    と、上記文書画像のレイアウトデータを蓄積する手段
    と、上記文書要素間の関連情報を蓄積する手段とを有す
    ることを特徴とする請求項1記載の文書要素の検索装
    置。
  5. 【請求項5】画像を表示する表示画面と、要素画像を格
    納する半導体記憶装置を備えた電子装置において、要素
    画像を上記半導体記憶装置に格納する手段と、上記記憶
    装置から上記要素画像を一定時間間隔で連続して読みだ
    す手段と、上記要素画像の信号を検索装置の上記表示画
    面の信号と合成する手段と、上記表示画面に対話的な検
    索を行うウィンドゥを設定する手段とを有することを特
    徴とする電子装置。
  6. 【請求項6】上記記憶装置から読みだす手段は、グルー
    プを指定する手段と、上記指定されたグループ内の要素
    画像の表示順序を指定する手段と、上記要素画像のフレ
    ーム番号を設定する手段とを有することを特徴とする請
    求項5記載の電子装置。
  7. 【請求項7】文書の全体または一部分の画像を格納する
    半導体イメージメモリと、文書画像の縮小画像また一部
    分の画像を格納するレーザビデオディスク若しくはビデ
    オテープレコーダと、上記半導体イメージメモリとレー
    ザビデオディスク若しくはビデオテープレコーダを切り
    換える手段を有することを特徴とする電子装置。
  8. 【請求項8】文書画像データを格納する電子装置におい
    て、文書の要素画像データを大きさの正規化して蓄積す
    る手段と、上記要素画像を番号を指定することによりア
    クセスする手段と、上記要素画像のデータを一定時間間
    隔で連続して出力する手段とを有することを特徴とする
    電子装置。
  9. 【請求項9】文書情報を蓄積することと文書要素を表示
    する文書要素の検索方法において、要素画像にキーワー
    ドを付与し、上記キーワードを基に文字列検索を行い、
    上記文字列検索の結果により該当する要素画像をグルー
    プに分け、グループに属する要素画像を画面に順次表示
    し、表示された要素画像をキー入力により特定すること
    を特徴とする文書要素の検索方法。
  10. 【請求項10】文書画像から分離した要素画像を所定の
    比率で拡大もしくは縮小し、上記拡大もしくは縮小画像
    を一定の大きさのフレーム画像のなかに複写し、フレー
    ム画像の余白部を一定値の画素により埋め込むことを特
    徴とする請求項9記載の文書要素の検索方法。
  11. 【請求項11】複数の要素画像の縮小画像を画面に表示
    し、要素画像の一つを指定することにより拡大画像を画
    面に表示し、上記要素画像の関連情報を画面に同時に表
    示することを特徴とする請求項10記載の文書要素の検
    索方法。
JP4308481A 1992-11-18 1992-11-18 文書要素の検索装置 Expired - Fee Related JP2601111B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4308481A JP2601111B2 (ja) 1992-11-18 1992-11-18 文書要素の検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4308481A JP2601111B2 (ja) 1992-11-18 1992-11-18 文書要素の検索装置

Publications (2)

Publication Number Publication Date
JPH06162104A true JPH06162104A (ja) 1994-06-10
JP2601111B2 JP2601111B2 (ja) 1997-04-16

Family

ID=17981540

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4308481A Expired - Fee Related JP2601111B2 (ja) 1992-11-18 1992-11-18 文書要素の検索装置

Country Status (1)

Country Link
JP (1) JP2601111B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0916358A (ja) * 1995-07-04 1997-01-17 Nippon Telegr & Teleph Corp <Ntt> データ表示印刷装置
JPH09114846A (ja) * 1995-10-16 1997-05-02 Fujitsu Ltd ブラウジング表示方法および画像表示システム
JPH1186013A (ja) * 1997-09-05 1999-03-30 Nippon Saitetsukusu Kk 編集装置
JP2002132835A (ja) * 2000-10-24 2002-05-10 Toppan Forms Co Ltd ドキュメント提供システムおよび提供方法
JP2008305089A (ja) * 2007-06-06 2008-12-18 Konica Minolta Business Technologies Inc 文書処理方法、文書処理プログラム、および文書処理装置
JP2009043013A (ja) * 2007-08-08 2009-02-26 Canon Inc 画像形成装置、画像形成方法、およびコンピュータプログラム
JP2009223509A (ja) * 2008-03-14 2009-10-01 Canon Inc 画像処理装置、画像処理方法、コンピュータプログラム
JP2009301335A (ja) * 2008-06-13 2009-12-24 Ricoh Co Ltd 画像処理装置、画像処理方法及びコンピュータプログラム
US8001466B2 (en) 2005-06-17 2011-08-16 Ricoh Company, Ltd. Document processing apparatus and method
US9514127B2 (en) 2012-09-13 2016-12-06 International Business Machines Corporation Computer implemented method, program, and system for identifying non-text element suitable for communication in multi-language environment

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03273363A (ja) * 1990-03-22 1991-12-04 Nec Corp 動画像の内容一覧表示方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03273363A (ja) * 1990-03-22 1991-12-04 Nec Corp 動画像の内容一覧表示方式

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0916358A (ja) * 1995-07-04 1997-01-17 Nippon Telegr & Teleph Corp <Ntt> データ表示印刷装置
JPH09114846A (ja) * 1995-10-16 1997-05-02 Fujitsu Ltd ブラウジング表示方法および画像表示システム
JPH1186013A (ja) * 1997-09-05 1999-03-30 Nippon Saitetsukusu Kk 編集装置
JP2002132835A (ja) * 2000-10-24 2002-05-10 Toppan Forms Co Ltd ドキュメント提供システムおよび提供方法
JP4698012B2 (ja) * 2000-10-24 2011-06-08 トッパン・フォームズ株式会社 ドキュメント提供システムおよび提供方法
US8001466B2 (en) 2005-06-17 2011-08-16 Ricoh Company, Ltd. Document processing apparatus and method
JP2008305089A (ja) * 2007-06-06 2008-12-18 Konica Minolta Business Technologies Inc 文書処理方法、文書処理プログラム、および文書処理装置
JP2009043013A (ja) * 2007-08-08 2009-02-26 Canon Inc 画像形成装置、画像形成方法、およびコンピュータプログラム
JP2009223509A (ja) * 2008-03-14 2009-10-01 Canon Inc 画像処理装置、画像処理方法、コンピュータプログラム
US8412705B2 (en) 2008-03-14 2013-04-02 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer-readable storage medium
JP2009301335A (ja) * 2008-06-13 2009-12-24 Ricoh Co Ltd 画像処理装置、画像処理方法及びコンピュータプログラム
US9514127B2 (en) 2012-09-13 2016-12-06 International Business Machines Corporation Computer implemented method, program, and system for identifying non-text element suitable for communication in multi-language environment

Also Published As

Publication number Publication date
JP2601111B2 (ja) 1997-04-16

Similar Documents

Publication Publication Date Title
US5021989A (en) Document browsing apparatus with concurrent processing and retrievel
KR100345945B1 (ko) 텍스트및이미지문서를동기시켜표시하며조작하기위한방법및장치
US6335742B1 (en) Apparatus for file management and manipulation using graphical displays and textual descriptions
US5553277A (en) Image search method for searching and retrieving desired image from memory device
JPS59183458A (ja) 画像検索方式
JP2601111B2 (ja) 文書要素の検索装置
JP2001337994A (ja) サムネイル表示システムと方法およびその処理プログラムを記録した記録媒体
JP2000339327A (ja) サムネイル画像情報操作システム
US5588149A (en) Document classification and retrieval with title-based on-the-fly class merge
JPH0622039B2 (ja) 図書館情報の検索装置
JP2601092B2 (ja) 文書の操作方法
JPH06251078A (ja) 情報処理装置
JPH03276260A (ja) 文字コードのタイトル処理機能を備えた電子フアイリング装置
JPH0322014A (ja) メニュー選択方法
JPH0677261B2 (ja) 文書画像情報の検索方法
JPH05282375A (ja) 画像検索方法およびシステム
US5265076A (en) Image retrieval apparatus using combination retrieval items
JPS63191271A (ja) 画像情報記憶検索方法
JP3444620B2 (ja) ファイリングシステム装置
JP2845897B2 (ja) 文書検索・表示方法および装置
JP2940567B2 (ja) 画像データベースシステム
JPH09198392A (ja) データ管理・出力方法及び該方法を備える電子ファイリングシステム
JPS6371743A (ja) デ−タ・フアイリング・システム
JPS6210772A (ja) イメ−ジ情報の処理装置
AU712181B2 (en) Method and apparatus for synchronizing, displaying and manipulating text and image documents

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080129

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees